大模型的特点及其应用与发展态势展望—孙茂松(2024-5-22下午)

好文配好图

<p class="ql-block"><br></p><p class="ql-block">孙茂松—清华大学人工智能研究院常务副院长</p><p class="ql-block"> 欧洲人文和自然科学院外籍院士,国际计算语言学协会会士,中国人工智能学会会士,中国中文信息学会会士,清华大学计算机科学与技术系长聘教授、博士生导师,清华大学人工智能研究院常务副院长、清华大学计算机学位评定分委员会主席、清华大学大规模在线开放教育研究中心主任。</p> <p class="ql-block">生成式人工智能的三大特点:</p><p class="ql-block"> GPT :+较为准确的理解能力</p><p class="ql-block">世界最高的山是哪座山?</p><p class="ql-block">哪座山是世界最高的?</p><p class="ql-block">+十分强大的生成能力</p><p class="ql-block">与生俱来的"幻觉"问题(按概率随机游走)</p> <p class="ql-block" style="text-align:center;"><b>模型底层算法是一致的</b></p> <p class="ql-block">LLMS:比我们想象的更聪明(2024年1月)</p> <p class="ql-block">剑桥词典中,“幻觉”有一个额外的定义:</p><p class="ql-block">“当人工智能(=计算机系统具有人脑所具有的某些特性,例如以一种看似人类的方式产生语言的能力)幻觉,它产生虚假信息。”</p> <p class="ql-block">生成式人工智能开启人类全新的创造模式</p><p class="ql-block">人类创造的<span style="font-size:18px;">现实空间</span></p><p class="ql-block">机器创造的现实可能空间</p><p class="ql-block">创造的可能空间</p> <p class="ql-block" style="text-align:center;"><b>人与机器写诗的对比</b></p> <p class="ql-block">五律·旅夜书怀杜甫</p><p class="ql-block"><br></p><p class="ql-block">细草微风岸,危樯独夜舟。星垂平野阔,月涌大江流。名岂文章著,官因老病休。飘飘何所似,天地一沙鸥。</p><p class="ql-block">五律·旅夜书怀九歌</p><p class="ql-block">酒尽寒宵烛,凄清感旧游。乡心随水远,别恨逐年稠。生计愁中悟,归期梦里谋。何当脱尘鞅,一笑拂吴钩。</p><p class="ql-block">岁暮怜为客,飘蓬未有期。寒宵灯影瘦,独夜雨声悲。薄命随人老,孤踪似雁羁。愁来将酒慰,明日又题诗。</p><p class="ql-block">一身犹作客,况是素秋来。月不怜孤影,虫皆伴独哀。远游知未返,壮志感频摧。寂寞空床冷,长吟对酒杯。</p> <p class="ql-block">七律·旅夜书怀</p><p class="ql-block"> —九歌</p><p class="ql-block">一囊行李又匆匆,夜雨潇然客梦中。</p><p class="ql-block">万里乡心归雁外,半床秋色乱蛰中。</p><p class="ql-block">尘踪漂泊江湖远,孤棹萧条梦寐空。</p><p class="ql-block">遥望故园何处是,荒烟衰草夕阳红。</p> <p class="ql-block" style="text-align:center;">深度学习发现了数百万新材料</p> <p class="ql-block">一个白色拟人机器人阅读一本书的详细复杂几何矢量艺术,反射皮肤,正面近距拍摄,抽象背景,令人回味,高对比度,低饱和度,平坦的颜色。</p> <p class="ql-block" style="text-align:center;">从文本创建视频</p> <p class="ql-block">OpenAI GPT -4o( o : omni )2024.5</p> <p class="ql-block">+生成式人工智能的基本定位</p><p class="ql-block"> *启发、辅助人类,不会取代人类,但会取代相当部分低端智力劳动者</p><p class="ql-block"> *不可能发现牛顿定律</p><p class="ql-block">+对金字塔式就业结构的可能影响</p> <p class="ql-block">  国际货币基金组织总裁克里斯塔利娜·格奥尔基耶娃近日表示,未来两年,对于发达经济体而言,人工智能可能会影响60%的工作岗位;而对于全球所有国家而言,人工智能可能将冲击40%的工作岗位。</p> <p class="ql-block" style="text-align:center;"><b>对国家对单位是好事</b></p><p class="ql-block" style="text-align:center;"><b>对个人而言不能躺平</b></p> <p class="ql-block" style="text-align:center;"><b>大模型思维</b></p> <p class="ql-block" style="text-align:center;">大模型思维—数字人文(案例)</p><p class="ql-block">使用深度神经网络恢复和归因古代文本</p> <p class="ql-block" style="text-align:center;">语言掩蔽模型 BERT</p> <p class="ql-block">Combined -72%</p><p class="ql-block"> Ithaca -62%</p><p class="ql-block"> Historians -25%</p> <p class="ql-block" style="text-align:center;"><b>大模型思维:从 AlphaGo 到 AlphaFold (案例)</b></p><p class="ql-block">—蛋白质折叠问题:蛋白质的基因序列→确定蛋白质的三维形状</p><p class="ql-block">—枚举典型蛋白质所有可能构型所需时间要比宇宙年龄长</p> <p class="ql-block">—与前代相比, AlphaFold 3不仅可预测蛋白质的结构,还可预测生物生命中几乎所有元素( DNA 、 RNA 、配体等)的结构,并且可准确预测蛋白质与其他分子的相互作用。与现有的预测方法相比, AlphaFold 3发现蛋白质与其他分子类型的相互作用至少提高了50%,对于一些重要的相互作用类别,如蛋白质与配体的结合、以及抗体与其靶蛋白的结合等,预测准确率甚至提高了一倍。</p><p class="ql-block">—2023年9月,《 Science 》杂志的封面文章发表了 DeepMind 和</p><p class="ql-block"> lsomorphic 团队在 AlphaFold 的基础上改进衍生的错义变异致病性预测模型 AlphaMissense 。</p> <p class="ql-block" style="text-align:center;"><b>大模型思维:天气预报(案例)</b></p><p class="ql-block">谷歌 MetNet :神经网络天气模型</p><p class="ql-block">—主流气象预报方法都是基于大气层的物理模型</p><p class="ql-block">—系统输入自动从全美雷达站和卫星网络获取</p><p class="ql-block">—能以2分钟间隔和1平方公里分辨率预测全美未来8小时内降水概率,且预测耗时只需几秒(之前的模型需要1小时)</p><p class="ql-block">—优于 NOAA (美国国家海洋与大气管理局)当前使用的、基于物理定律的最先模型 HRRR</p> <p class="ql-block">华为利用—</p><p class="ql-block">3D神经网络实现全球中期天气预报</p> <p class="ql-block" style="text-align:center;"><b>人工智能推动技术创新变革</b></p><p class="ql-block">1、全民化的生成式 Al ( Democratized Generative Al )</p><p class="ql-block">到2026年,超过80%的企业将使用生成式 AI 的 API 或模型,或在生产环境中部署支持生成式 AI 的应用,而在2023年初这一比例不到5%。</p><p class="ql-block">2、 AI 信任、风险和安全管理( Al Trust , Risk and Security Management )</p><p class="ql-block">3、AI 增强开发( Al - Augmented Development )</p><p class="ql-block">4、智能应用( Intelligent Applications )</p><p class="ql-block">5、机器客户( Machine Customers )</p><p class="ql-block"> 一种可以自主协商并购买商品和服务以换取报酬的非人类经济行为体。到2028年,将有150亿台联网产品具备成为客户的潜力,这一数字还将在之后的几年增加数十亿。</p><p class="ql-block">6、可持续技术( Sustainable Technology )</p> <p class="ql-block" style="text-align:center;"><b>可交互(聊天)数字人</b></p><p class="ql-block">数字爱因斯坦经验OENGINEARTS1</p><p class="ql-block">+具身智能</p><p class="ql-block" style="text-align:center;"><b>赋能元宇宙的技术手段</b> </p><p class="ql-block" style="text-align:center;">Sora's Impact on Smart Glasses Content CreationO</p> <p class="ql-block">—麦肯锡分析调查了47个国家的850种职业、63个应用示例和2100多项详细的工作活动,基本涵盖全球80%的劳动力。</p><p class="ql-block">—生成式 AI 对生产力的影响,可以每年为全球经济增加2.6-4.4万亿美元的</p><p class="ql-block">齐收入。</p> <p class="ql-block">Bloomberg Intelligence (彭博资讯)2023.6</p><p class="ql-block">—生成式人工智能市场有望爆发式增长,未来10年将从2022年的400亿美元市场规模增长至1.3万亿美元。增长可能以42%的复合年增长率扩大。</p><p class="ql-block">—随着企业将更多工作负载转移到公共云,亚马逊网络服务、微软、谷歌和英伟达等公司可能成为最大的受益者。</p><p class="ql-block">—到2032年,生成式 AI 将从占 IT 硬件、软件服务、广告支出和游戏市场支出总额的不到1%扩大到10%。增量收入的最大驱动力将是用于培训 LLMs 的生成式 AI 基础设施服务(2032年将达到2470亿美元),其次是技术驱动的数字广告(1920亿美元)和专门的生成人工智能助理软件(890亿美元)。硬件方面,收入将由人工智能服务器(1320亿美元)、人工智能存储(930亿美元)、计算机视觉人工智能产品(610亿美元)和对话式人工智能设备(1080亿美元)驱动。</p> <p class="ql-block">Artificial Intelligence as a Service ( AlaaS )</p><p class="ql-block"><br></p><p class="ql-block">+2024年3月,微软和 NVIDIA 宣布开展合作,重点推动医疗保健和生命科学行业的人工智能发展,目标是通过临床研究和药物发现等领域的发展来加速创新并改善患者护理。</p><p class="ql-block">+2024年3月, NVIDIA 推出了新的生成式 AI 微服务,旨在推进医疗技术( MedTech )、药物发现和数字健康。</p><p class="ql-block">+2023年6月, AMD 推出了 AMD Instinct MI300系列加速器系列,专为大型语言模型训练和生成人工智能工作负载的推理而开发。</p><p class="ql-block">+2023年6月, IBM 宣布将在2023年温布尔登锦标赛上与全英草地网球俱乐部合作,利用 IBM Watsonx 的生成式 AI 技术为比赛期间的视频集锦提供评论。</p><p class="ql-block">来源:https://www.grandviewresearch.com/industry- analvsis / artifici elligence - ai - market</p> <p class="ql-block" style="text-align:center;"><b>83%的公司表示,在他们的商业战略是重中之重</b></p> <p class="ql-block">2035年应用增加值(GVA)</p><p class="ql-block">住宿和餐饮服务农业、林业和渔业艺术,娱乐,建筑业,教育,金融服务,医疗保健信息和通信生产制造,其他服务专业。</p> <p class="ql-block" style="text-align:center;"><b>人工智能促使人类文化形态可能发生重大变化</b></p><p class="ql-block">《人类简史》、《未来简史》和《今日简史》作者尤瓦尔·赫拉利(《三联生活周刊》采访):一种可能的情景是, ChatGPT 、 GPT -4和更先进的人工智能将开创新的时尚、意识形态甚至是宗教。人类文化基于语言。而因为人工智能已经破解了语言,它现在可以开始创造文化。如今世界各地的文化多样性令人惊叹,但它们都有一个共同点﹣﹣都是由人类创造的。在未来,由于人工智能的原因,这将发生改变。人类将开始适应由非人类实体创造的文化。而且,由于文化是人类的"操作系统",这意味着人工智能将能够改变人类思考、感受和行为的方式。</p> <p class="ql-block" style="text-align:center;">机器画</p> <p class="ql-block">2024年人工智能对时装业的影响Al的时尚革命:</p> <p class="ql-block">科技大学蔡新元教授之女装系列《木星》</p> <p class="ql-block" style="text-align:center;"><b>艺术与生成Al的科学</b></p> <p class="ql-block" style="text-align:center;"><b>艺术到社会科学……</b></p> <p class="ql-block" style="text-align:center;"><b>人类进行研究既昂贵又繁琐。</b></p> <p class="ql-block" style="text-align:center;"><b>新趋势:大模型开始走向具身智能</b></p> <p class="ql-block" style="text-align:center;"><b>新趋势:大模型更深介入虚拟空间</b></p> <p class="ql-block">ChatDev:在几分钟内创建POWERUL软件。</p> <p class="ql-block">不断拓展大模型各类垂直应用</p><p class="ql-block">— 2023年彭博社推出500亿参数BloombergGPT (3630亿词的金融文本</p><p class="ql-block">—3450亿词的通用文本)ChatGPT插件个人的未来金融与投资?</p><p class="ql-block">—Al正在通过ChatGPT插件彻底改变金融业,为更明智的财务决策提供数据驱动见解Sunil Ramlochan2023年5月24日</p> <p class="ql-block">不断拓展大模型各类垂直应用</p><p class="ql-block">—机遇和挑战是什么?</p> <p class="ql-block">清华相关工作一瞥</p><p class="ql-block">七绝#江南的春天</p><p class="ql-block">江南的春天如画境,绿草葱茏映碧波。细雨轻笼花落处,莺声婉转入人心。</p><p class="ql-block">江南二月好风光,杨柳青青草色长,一曲采莲歌未了,满船明月过横塘</p><p class="ql-block">嫩草生芽柳发丝,江南春色在南枝,无情最是东风雨,吹得花开一半迟</p><p class="ql-block">五律#探索天空</p><p class="ql-block">探索天空乘翱翔,星辰闪耀迎征程。云端自由逐风起,飞鸟羡慕我轻盈,流云陪伴我飘扬。高山脉络尽收眼,无限宇宙尽浩瀚。</p><p class="ql-block">尘世束缚化尘埃。</p><p class="ql-block">探索天空处,人间不可居,一身犹是客,万里欲何如,日月双轮转,乾坤一局虚,此心无所住,随处是吾庐</p><p class="ql-block">一问通天理,穷幽兴不孤,自怜多远梦,空复负良图,浪说三山近,无因一苇趋,神仙吾未学,难与问真符</p> <p class="ql-block">清华相关工作一瞥</p> <p class="ql-block">清华相关工作一瞥</p> <p class="ql-block">清华相关工作一瞥</p> <p class="ql-block">清华相关工作一瞥</p> <p class="ql-block" style="text-align:center;"><b>文生图</b></p> <p class="ql-block">通用人工智能开始登上历史舞台</p><p class="ql-block">—2023年4月28日,中共中央政治局召开会议,提出要重视通用人工智能发展,营造创新生态,重视防范风险。</p><p class="ql-block">—人工智能是发展新质生产力的重要引擎</p><p class="ql-block">—构建于大模型之上的 X </p><p class="ql-block">—前面还会发生什么?充满悬念</p> <p class="ql-block">2023年按地理区域划分的Al的投资</p> <p class="ql-block" style="text-align:center;"><b>2023年各国学习模型</b><b style="font-size:18px;">数量</b></p> <p class="ql-block" style="text-align:center;"><b>提问互动环节</b></p> <p class="ql-block">大模型的幻觉是矛与盾的关系;尽量少出幻觉;限制它的想象力;启发性;</p><p class="ql-block"><br></p><p class="ql-block">面对大模型大家不用太焦虑;现实是复杂的;核心任务机器不行;影响必定会消化;</p><p class="ql-block">大模型变现是全世界难点;烧钱;一年与十年;悄悄改变;人工智能风险限制变现;开放式难度比较大;情报分析应用很强;</p><p class="ql-block">大模型与大算力,华为等国产芯片应该能支撑,千亿级应该没问题;</p><p class="ql-block"><br></p><p class="ql-block"><br></p><p class="ql-block"><br></p><p class="ql-block"><br></p> <p class="ql-block">大模型自身与人脑应有不同,没有自我意思,表现出来,内在没有;</p><p class="ql-block">国家应该统一规划,但受限能力;没有必要每家都做;跟跑与领跑;人才成本太高;没人是不行的;</p>