当前位置: 首页 > 科技赋能

不仅为ChatGPT提供超强算力,联想还号称将该技术应用于PC等产品

时间:2024-05-19 16:51:18 科技赋能

近日,围绕ChatGPT在网络上的热门话题,联想集团CTO、高级副总裁芮勇博士接受《中国计算机学会通讯》(CCCF) 采访并分享了他对ChatGPT等大型模型的看法。

芮勇表示,联想新IT架构将继续在AI新范式加速智能化转型过程中发挥重要作用。

除了基础设施之外,联想也在考虑AIGC技术在产品和业务中的应用。

大型模型距离AGI还有多远? ChatGPT是OpenAI GPT系列中针对对话场景优化的语言模型。

它属于Foundation Models,即基本模型,简称“大模型”。

芮勇将其特点概括为“一大王牌”:一是参数规模大,千亿参数级别的超大型人工智能模型;三多提到使用多种来源、多种模式和多种任务。

利用互联网规模的海量数据进行训练。

芮勇认为,大模型首先在内容理解领域取得了巨大成功。

比如BERT一出来就打破了11项自然语言理解任务的记录,最近又在内容生成领域取得了令人瞩目的成就,即AIGC。

对于大模型是否催生了外界广泛关注的新的AI范式,芮勇的回答是,简单来说,AI范式的转变来自“针对特定任务更新预先训练的模型”(小模型+微调)切换到“根据上下文提示自动理解并执行各种任务,无需更新模型参数或架构”(大模型+上下文学习)。

ChatGPT的成功让业界看到了大型模型通向AGI(通用人工智能)的曙光。

但芮勇认为,大模型能走多远,前景如何,能否实现“多任务、多模态、多目的”的“化身大一统”,目前还颇有争议。

他进一步解释说,大型模型近年来取得了突破性进展,很多人都持乐观态度。

从Gartner技术成熟度曲线可以看出,大型模型目前正处于“期望膨胀的峰值”阶段。

人们对其寄予厚望,但也应该看到,大型模型还存在许多未解决的问题。

例如,谷歌版ChatGPT,名为Bard,首次公开展示时,答案结果不准确,导致该公司市值一日蒸发超过1亿美元。

此外,对话机器人生成的句子中包含的信息无法追溯到其来源,甚至可能包含偏见和攻击性言论。

可见,通向AGI的路还很长。

联想在大机型普及中扮演什么角色?大车型的崛起给正在进行智能化转型的企业带来了很多新的机遇。

芮勇以联想为例进行介绍。

联想借鉴大模型背后的基础算法,将小样本学习应用于基于计算机视觉的产品缺陷检测,提高质检系统快速迁移到新产品、新生产线的能力;此外,联想还将利用强化学习技术,将人机协作的理念应用于供应链优化,使供应链能够在剧烈变化的环境中不断提高弹性。

对于联想在人工智能新范式和大模型普及中扮演什么角色,芮勇表示,从长远来看,人工智能新范式(大模型+情境学习)很可能会与传统的人工智能新范式(大模型+情境学习)有所不同。

旧的范例(小模型+微调)。

彼此共存或结合,而不是单一范式一统天下。

联想将充分发挥“端-边-云-网-智能”的新型IT架构优势,支撑新旧范式的结合与变革。

联想提出的全新IT架构不仅致力于推动自身的智能化转型,还着力赋能各行各业的智能化转型。

AI模型对运行环境的要求越来越高,如云边端的高度协同、异构计算和负载均衡、设备之间的互联、数据安全和隐私保护、模型本身的可扩展性和扩展性等。

.联想在这些方面有着深厚的技术积累,新的IT架构将在AI新范式加速智能化转型的过程中继续发挥重要作用。

除了基础设施之外,联想也在考虑AIGC技术在产品和业务中的应用。

例如,在智能设备中优化定制跨模态生成模型,使其可以加载到手机或平板电脑上,实现个性化内容生成。

在智能解决方案方面,我们考虑利用AIGC进行新产品营销和新客户覆盖。

目前大模型还没有与知识有效结合。

我们正在研究一种结合数据驱动和知识驱动方法的方法,即混合学习(Hybrid Learning),以改善大型模型的缺点。

此外,在大模型的实施过程中,还需要彻底解决适应环境变化或新领域、新任务的问题,即自适应学习(Adaptive Learning)。

这些都是联想人工智能的探索方向。