近日,围绕ChatGPT在网络上的热门话题,联想集团CTO、高级副总裁芮勇博士接受《中国计算机学会通讯》(CCCF) 采访并分享了他对ChatGPT等大型模型的看法。
芮勇表示,联想新IT架构将继续在AI新范式加速智能化转型过程中发挥重要作用。
除了基础设施之外,联想也在考虑AIGC技术在产品和业务中的应用。
大型模型距离AGI还有多远? ChatGPT是OpenAI GPT系列中针对对话场景优化的语言模型。
它属于Foundation Models,即基本模型,简称“大模型”。
芮勇将其特点概括为“一大王牌”:一是参数规模大,千亿参数级别的超大型人工智能模型;三多提到使用多种来源、多种模式和多种任务。
利用互联网规模的海量数据进行训练。
芮勇认为,大模型首先在内容理解领域取得了巨大成功。
比如BERT一出来就打破了11项自然语言理解任务的记录,最近又在内容生成领域取得了令人瞩目的成就,即AIGC。
对于大模型是否催生了外界广泛关注的新的AI范式,芮勇的回答是,简单来说,AI范式的转变来自“针对特定任务更新预先训练的模型”(小模型+微调)切换到“根据上下文提示自动理解并执行各种任务,无需更新模型参数或架构”(大模型+上下文学习)。
ChatGPT的成功让业界看到了大型模型通向AGI(通用人工智能)的曙光。
但芮勇认为,大模型能走多远,前景如何,能否实现“多任务、多模态、多目的”的“化身大一统”,目前还颇有争议。
他进一步解释说,大型模型近年来取得了突破性进展,很多人都持乐观态度。
从Gartner技术成熟度曲线可以看出,大型模型目前正处于“期望膨胀的峰值”阶段。
人们对其寄予厚望,但也应该看到,大型模型还存在许多未解决的问题。
例如,谷歌版ChatGPT,名为Bard,首次公开展示时,答案结果不准确,导致该公司市值一日蒸发超过1亿美元。
此外,对话机器人生成的句子中包含的信息无法追溯到其来源,甚至可能包含偏见和攻击性言论。
可见,通向AGI的路还很长。
联想在大机型普及中扮演什么角色?大车型的崛起给正在进行智能化转型的企业带来了很多新的机遇。
芮勇以联想为例进行介绍。
联想借鉴大模型背后的基础算法,将小样本学习应用于基于计算机视觉的产品缺陷检测,提高质检系统快速迁移到新产品、新生产线的能力;此外,联想还将利用强化学习技术,将人机协作的理念应用于供应链优化,使供应链能够在剧烈变化的环境中不断提高弹性。
对于联想在人工智能新范式和大模型普及中扮演什么角色,芮勇表示,从长远来看,人工智能新范式(大模型+情境学习)很可能会与传统的人工智能新范式(大模型+情境学习)有所不同。
旧的范例(小模型+微调)。
彼此共存或结合,而不是单一范式一统天下。
联想将充分发挥“端-边-云-网-智能”的新型IT架构优势,支撑新旧范式的结合与变革。
联想提出的全新IT架构不仅致力于推动自身的智能化转型,还着力赋能各行各业的智能化转型。
AI模型对运行环境的要求越来越高,如云边端的高度协同、异构计算和负载均衡、设备之间的互联、数据安全和隐私保护、模型本身的可扩展性和扩展性等。
.联想在这些方面有着深厚的技术积累,新的IT架构将在AI新范式加速智能化转型的过程中继续发挥重要作用。
除了基础设施之外,联想也在考虑AIGC技术在产品和业务中的应用。
例如,在智能设备中优化定制跨模态生成模型,使其可以加载到手机或平板电脑上,实现个性化内容生成。
在智能解决方案方面,我们考虑利用AIGC进行新产品营销和新客户覆盖。
目前大模型还没有与知识有效结合。
我们正在研究一种结合数据驱动和知识驱动方法的方法,即混合学习(Hybrid Learning),以改善大型模型的缺点。
此外,在大模型的实施过程中,还需要彻底解决适应环境变化或新领域、新任务的问题,即自适应学习(Adaptive Learning)。
这些都是联想人工智能的探索方向。