当前位置: 首页 > 科技观察

2022年,人工智能为未来开启新密码

时间:2023-03-13 03:08:59 科技观察

大家在购买大件电器、汽车时,会问有没有智能语音功能?是的,人们已经不再将人工智能视为魔法,而是习以为常。AlphaGo四比一大胜国际象棋王李世石,让人们第一次意识到人工智能真的可以超越人类,也让人们对人工智能的未来前景充满期待。近年来,以深度学习为代表的人工智能技术发展迅速,新算法层出不穷。图像识别、自然语言、语音克隆等智能水平已经接近甚至超过人类。同时,人工智能技术的发展也促进了人类在数据和计算能力上的不断突破。人工智能技术的各种应用已经落地并渗透到我们生活的方方面面,成为我们不可或缺的一部分。1.2021回顾回顾跌宕起伏的2021年,新冠疫情仍在全球肆虐,丝毫没有结束的迹象。疫情带来的国际风云突变,深刻影响了全球半导体产业链和生态,也对人工智能产业产生了影响。国际上对算力的竞争异常激烈。算力不在一维,竞争力自然不在一维。2021年,我国芯片短缺将导致供应链断裂接二连三。因此,数字化、智能化转型被列入国家重点发展规划,已成为大势所趋。虽然疫情尚未结束,但并不影响2021年人工智能领域的蓬勃发展,振奋人心的消息频频传来。商汤科技成为国内“人工智能四小龙”中首家成功IPO的上市公司;AphaFold2成功预测了98%的蛋白质结构;在无人驾驶领域,技术和算法的不断突破,让L4场景日趋成熟,掌握了自动倒车、急行等诸多接近人类驾驶的行为。2021年10月,中国科学技术大学潘建伟、卢朝阳、刘乃乐组成的研究团队与中国科学院上海微系统与信息技术研究所、国家并行计算机研究所合作工程技术研究中心,构建了113光子144模量子计算机原型机“九丈二号”完成了用于论证“量子计算优越性”的高斯玻色采样任务的快速求解,求解速度为10比世界上最快的超级计算机(1亿次)快十亿倍)。我们正处于人类技术大爆发的时期,人工智能赛道被认为是龙头。Multimodal多模态学习旨在使计算机具备处理不同来源信息的能力,成为近年来人工智能领域的研究热点。整合不同的模态信息,学习不同模态信息之间的关联。2021年是OpenAI的图文匹配CLIP和根据输入文本生成对应图像的Dall·E开启多模态学习的重要一年。同时,DeepMind的PerceiverIO对文本、图像、视频和点云进行分类,斯坦福大学的ConVIRT为医学X光图像添加文本标签,这些都表明多模态学习正在兴起并向其他领域渗透。Facebook还表示,它在其仇恨言论检测器中使用多模态学习来删除社交网络上97%的辱骂性和有害内容。该系统可以根据包括文本、图像和视频在内的10种数据类型,将模因和其他图像文本对分类为良性或有害。同时,谷歌还表示在搜索引擎中加入了多模态(和多语言)功能,实现了多任务统一模型,可以返回文本、音频、图像和视频链接来响应查询75种语言中的任何一种。庞大的模型让机器能够理解人类的语言一直是人工智能的核心夙愿。只有赋予机器人类大脑特有的自然语言,机器才能真正“活”起来。随着去年OpenAI提出GPT-3模型,在各大平台引起热议,让我们仿佛触及了神的境界。GPT-3模型比世界上最大的深度学习模型TuringNLP大十倍,不仅可以更好地回答问题、翻译和写文章,还具备一定的数学计算能力。根据该论文,GPT-3是一个拥有1750亿个参数的自然语言深度学习模型。就在大家还沉浸在GPT-3模型庞大的参数量中时,GoogleSwitchTransformer在2021年开启了第一个超过1万亿参数的模型,参数规模高达1.6万亿。随后,北京致远人工智能研究院推出了更大的模型启蒙2.0,参数规模达到1.75万亿。资金雄厚的AI公司正在以疯狂的速度堆积参数,既是为了提高性能,也是为了展示自己的实力,尤其是在语言模型方面,互联网为无监督和半监督的预训练提供了大量未标记的数据。但是,模型从“大”到“巨大”的转变,确实能让效果越来越好,但同时也带来了更多的问题和挑战。(1)数据挑战:庞大的模型需要海量的数据,但缺乏来自网络和数字图书馆来源的高质量数据。例如,BookCorpus是一个包含11,000本电子书的数据集,研究人员通常使用它来训练30多种大型语言模型,它可能传播对某些宗教的偏见。人工智能界越来越意识到数据质量的重要性,但对于收集大规模、高质量数据集的有效方法还没有达成共识。对于庞大的模型,海量高质量的数据采集成为无法回避的障碍。(2)速度和效率:虽然目前人类的硬件水平在不断突破,但仍然跟不上庞大模型的需求。SwitchTransformer背后的谷歌团队开发了一种方法,通过让每个令牌处理模型层的选定子集来减少延迟。他们最好的模型比参数数量减少1/30的模型快66%。同时,微软开发了DeepSpeed库,可以并行处理数据、层和层组,并通过在CPU和GPU之间划分任务来减少冗余处理。然而,最好的解决方案仍然是提高硬件的效率,人类必须不断地在计算能力上取得突破。(3)巨大的能量消耗:训练如此巨大的模型会消耗大量的能量。2019年的一项研究发现,在八个NvidiaP100GPU上训练一个2亿参数的Transformer模型产生的碳排放量几乎相当于驾驶一辆普通汽车五年的碳排放量。如何降低训练庞大模型的功耗问题已经摆在大家面前。承诺加速人工智能的当前一代芯片,例如Cerebras的WSE-2和谷歌最新的TPU,可能有助于减少排放。同时,计算能力已经成为国家基础设施的一部分,计算能力带来的能源消耗也促使需要更多地使用风能、太阳能等清洁能源。计算机视觉计算机视觉是目前人工智能最先进、发展最快的领域,一直走在赛道的前沿。根据GrandViewResearch的数据,2020年全球计算机视觉市场规模为113.2亿美元,预计2021年至2028年将以7.3%的复合年增长率扩张。目前竞争激烈的计算机视觉子领域包括:场景重建、目标检测、事件检测、视频跟踪、对象识别、3D姿态估计、运动估计、视觉伺服、3D场景建模和图像恢复。作为上市公司,商汤科技提供的OpenMMLab是迄今为止最完整的计算机视觉算法体系和框架——“人工智能算法开放系统”,涉及10多个研究方向、100多个算法和600个预训练模型。如今,OpenMMLab正逐步从单点、单方向的开源、单一论文的开源,走向日渐生机勃勃的开源体系。成为底层训练框架、计算平台与科研、教学、算法生产之间的重要桥梁和纽带,极大地加速了人工智能的研发。工业化进程。强化学习强化学习可以说是最接近人类学习过程的AI。以另一种方式考虑它。我们从小到大不断学习,这是一个不断试错的过程。强化学习就像一个真正的孩子,自我成长,不需要大量的历史数据来指导,只有在没有监督的情况下学习才是人工智能的最佳形态。受人类行为主义心理学的启发,强化学习理论侧重于在线学习,并试图在探索和利用之间保持平衡。与监督学习和非监督学习不同,强化学习不需要预先给定任何数据,而是通过接收环境对动作的奖励(反馈)来获取学习信息并更新模型参数。在过去的几年里,无论是Facebook、谷歌、Deepmind、亚马逊还是微软,都投入了大量的时间、金钱和人力来推动强化学习的不断创新。2.国内主要人工智能云平台涌现。随着人工智能的日益普及,国内各大厂商纷纷布局AI领域。人工智能开放平台如同当初的云计算平台一样,如雨后春笋般涌现。AI开放平台已经成为企业重要的基础设施。列举目前国内有代表性的AI开放平台:百度飞智阿里云人工智能平台腾讯AI开放平台科大讯飞开放平台华为云ModelArtsMegviiFace++360人工智能研究院网易人工智能AI云平台依然延续经典租赁大数据时代的模型,仿佛把我们带回了几年前大数据风起云涌的时代。AI云平台的优势在于让越来越多的开发者对AI有了更简单、更直观的认识。它在提供众多顶级模型供大家学习的同时,也为开发者提供了一个上传和展示作品的平台。让AI离我们不再遥远,成为人人可用的东西。只有成熟的社区文化才能孕育出新的创造者,才能让越来越多的人工智能产品出现在市场上。这就是AI云平台的核心意义。3、2022Trend成立17年的Facebook于美国时间2021年10月28日正式宣布更名为“Meta”。扎克伯格用实际行动向大家宣布,元宇宙已经来临。接下来的2022年,人工智能将迎来新一轮的趋势风暴。真正意义上的元宇宙的转折如果说2021年人们认为元宇宙只是妄想者的一厢情愿,那么2022年将真正开始颠覆人类对“世界”这个词的理解。因此,笔者认为2022年可以成为真正意义上的元宇宙的转折点。从技术角度来看,元界的主要技术群包括:网络与算力技术、人工智能、游戏技术、显示技术(VR、AR、MR甚至XR,体验不断加深)、区块链技术。笔者认为,人工智能将是整个元宇宙的核心,甚至是元宇宙的矩阵或大脑。要演化出真正的社会形态,需要矩阵自身不断学习,而不是设定各种规则,不断修复社会形态。就像《失控玩家》电影一样,妈妈创造的NPC也会随着社会形态的进化而进化。据彭博资讯预测,未来几年元界的投资和价值只会持续增长,到2024年价值将高达8000亿美元。前面有这么大的宏利,市场只会继续催动人工智能产能继续突破。算力革命随着全球自动驾驶需求不断扩大,2022年围绕大算力芯片的竞争将异常激烈。因为今年英伟达的自动驾驶芯片Orin将量产,高通的SnapdragonRide也将量产,中国创业公司的大功率芯片也将量产。杨宇鑫给出了一组数据:2014年到2016年,特斯拉ModelS的算力为0.256TOPS;2017年蔚来ES8算力2.5TOPS;2019年,特斯拉Model3的算力为144TOPS;,2022款蔚来ET7为1016TOPS。这组数据进一步印证了一个事实,即智能驾驶每向前迈进一小步,都需要算力向前迈进一大步。计算能力的作用不仅存在于汽车行业。2021年11月和2021年8月,阿里巴巴达摩院公布了多模态大模型“M6”的最新进展,其参数从万亿级跃升至10万亿级,成为全球最大的AI预训练模型。10月,M6再次突破行业极限,用512个GPU在10天内训练出10万亿模型,具有可用级别。与2020年发布的大型号GPT-3相比,M6实现了相同的参数规模。能耗仅为1%。越来越强大的计算能力是更智能的人工智能模型的基础。随着人工智能产业的不断发展,不仅是技术的革命,更是算力的革命。兵马粮草前行,算力作为人工智能模型的主要消耗品,决定着人工智能进步的快慢。就在2021年11月,摩尔线程宣布完成20亿元A轮融资。本轮融资由上海国盛资本、五元资本、中银国际旗下渤海中盛基金联合领投,建银国际、前海母基金等9家机构共同跟投。在宣布本轮融资的同时,摩尔线程还宣布其首款全功能GPU芯片如期研发成功,并开始适配国内主流CPU和操作系统。本次募集资金将主要用于首款GPU芯片的量产制造、GPUSOC相关IP研发,以及国内GPU生态的拓展。随着算力革命的启动,各国都将投入大量的资金和人力。这场没有硝烟的战争,将把人工智能推向一个新的高度。人工智能门槛低,工业生产全面应用随着人工智能的不断发展和人类计算能力的不断提升,人工智能的使用门槛越来越低。智能语音系统和智能客户服务等商业实施比比皆是。另一方面,短、中、长视频业务在全球仍保持较高增速,视频内容创作者和内容消费者都非常活跃。其中,全球最受欢迎的手机应用程序“抖音”拥有大量的视频智能处理技术,可以帮助创作者创作出更好的作品。此外,在北京冬奥会上,AI虚拟天气主播、AI手语主播、场馆智能导游、智能语言翻译、鹰眼裁判、AI运动员训练系统等,都是人工智能综合应用的体现。预训练大模型,降低了AI应用的门槛,解决了AI应用的两大难题:数据和行业知识。不需要大量的标注数据,也保证了基础。因此,创业者面临的最大问题不再是如何突破技术,而是如何建立商业模式,如何实现商业闭环,以及技术转化为产品的效率。科学界的人工智能技术将被用作新的生产工具。根据阿里巴巴达摩院对2022年十大技术的预测,第一个趋势是:AIforScience。Quote:实验科学和理论科学是数百年来科学界的两大基本范式,而人工智能正在催生一种新的科学研究范式。机器学习可以处理多维度、多模态的海量数据,解决复杂场景下的科学问题,将科学探索引向以往无法触及的新领域。人工智能不仅会加快科学研究进程,还会有助于发现新的科学规律。预计未来三年,人工智能将广泛应用于应用科学领域,并开始成为一些基础科学领域科学家的生产工具。没错,只是DeepMind在2021年初开源了AlphaFold2,并且能够预测98.5%的蛋白质结构。2021年12月,DeepMind首次利用人工智能帮助数学家提出了两个全新的数学猜想,登上了Nature的封面。作者推测低维拓扑中存在未知的非线性关系,生成大量数据并使用神经网络拟合近似函数,发现其中三者在拟合过程中起着重要作用。反正通过拟合实验,产生新的数据,得到新的观测模型,数学家们终于用智慧猜出了一个不等式结构,并进一步给出了严格的证明。可见,人工智能成为科学家新的生产工具后,不仅可以加速科学发展的进程,还可以让人工智能创造新的思想,甚至为某些科学开辟新的方向。4、总结2022年必然成为人工智能技术大爆发的一年,我们可能会见证前所未见的成就。人工智能深入我们的生活,给我们带来了更多的便利,同时也带来了更多的挑战和机遇。