当前位置: 首页 > 科技观察

认知智能堪比魔法:回顾2021的重大突破

时间:2023-03-19 22:45:14 科技观察

认知智能堪比魔术:回顾2021年重大突破已无法满足大众对“真智能”的期待。认知智能被视为人工智能热潮能否进一步突破天花板,形成更大产业规模的关键技术。1.认知让AI更实用认知智能的目标是能够模拟人脑的思维过程,具备对数据和语言的理解、推理、解释、归纳、演绎的能力,使人工智能真正成为“聪明的”。这使得AI赋能更多更大规模的场景成为可能,比如智能机器人、无人驾驶、无人机、AR/VR、个性化推荐等智能服务。一方面,计算机视觉、语音识别等感知技术出现瓶颈,如图像识别的适应性和泛化能力不足、医学影像领域的3D重建、AR/VR之间的有效交互性能不足等。领域和环境。识别领域的语义多样性等问题驱动智能从感知到认知。另一方面,自然语言处理、智能对话、智能推荐等认知智能技术在多模态和预训练大模型方面呈现出研究热潮。此外,如何通过AI技术实现降本、增收、提效、安全智能升级,成为各行业的现实诉求。回顾过去的一年,预训练大模型蓬勃发展,智能推荐与搜索技术依旧火爆,脑机接口、虚拟主播成为新风向标,竹简智能、4Paradigm、兰州科技、致远研究院、明略科技一批科技公司带来了很多关于认知智能技术商业落地的思考。2.玩家陆续进入游戏。可以说,2021年是认知智能发展与工业数字化智能转型开始深度融合碰撞的一年。各大人工智能领域的玩家也在拥抱新一代认知智能技术。专注于电子商务领域的“乐言科技”推出第四代客服机器人系统“乐语主任”,具有自动响应、深度培训对话、拟人化客服接待等特点,提供自动接待买家询价的商家,智能推荐、智能营销、智能质检等一站式电商智能客服解决方案,已服务超过20000家电商客户。7月,中国人民大学与致远研究院联合发起启蒙“文澜”。它具有强大的视觉语言检索能力和一些常识理解能力。在“文澜”多模态模型的基础上,研发团队还开发了一款应用《AI 心情电台》,可以将图像与歌曲进行匹配,达到意境。9月,第四范式与人民日报正式签约,共同打造新媒体主流算法,在保证海量内容与用户个性化需求精准匹配的同时,实现优质内容在主流媒体的传播,推动媒体行业在人工智能时代的变革与创新。科大讯飞推出的飞鱼系统集成了科大讯飞核心的语音识别和语义理解技术,提供丰富的车联网应用场景,供用户根据场景需求定制开发。通过合理的场景交互逻辑设计,方便使用同时,通过声纹识别、多模式声源定位等技术,科大讯飞可以将声音锁定在特定的人或特定的发音方向上,从而保护使用安全。百分比科技在“符号主义”的指导下,提出认知智能产业落地的新范式。它首先构建该领域业务的本体框架,然后结合深度学习和样本数据提炼知识图谱的本体和事实数据,并根据知识图谱应用中的反馈信息不断调整和优化。3.图研究和大模型有望成为范式。在基础研究中,知识图谱被认为是最有希望将感知智能推向认知智能的关键。知识图谱可以帮助企业更好地完成知识的积累、传承和再利用,有效解决知识资产的开发利用问题。因其出色的普适性,可跨行业应用,助力企业不断创新突破,向智慧企业迈进。整体来看,知识图谱目前分为通用知识图谱和领域知识图谱。在语义搜索、推荐系统、问答系统等应用场景中发挥了巨大的作用。正在金融、能源、医疗、制造、零售等多个行业场景发挥影响力。由于知识表示的简单性和知识的大规模性,该方法在语义搜索中得到了很好的应用。因此,谷歌、阿里、腾讯、竹简智能、百度智能云、海知星图、百分点科技、明略科技等研究机构对知识图谱开展了大量的应用和研究工作。同时,图神经网络(GNN)将深度神经网络从处理传统的非结构化数据(如图像、语音和文本序列)推广到更高层次的结构化数据(如图结构)。大规模的图数据可以表达丰富的逻辑人类常识和专家规则。图节点定义了可理解的符号知识。不规则图拓扑表达了图节点之间的依赖、从属关系和逻辑规则等推理。关系。可以说,图神经网络是机器学习智能赋能最重要的落地路径。最后,多模态、大模型预训练网络有望成为AI领域的研发范式。例如,7月,中国人民大学与致远研究院从视觉与语言的关系出发,利用互联网生成的6.5亿对图文完成了一项自监督任务,完成了最大的中文通用——目的图形预训练模型启蒙?文澜,从中初步探索AI在多模态环境下学习语言的可能性。据官方介绍,文澜2.0实现了7种不同语言的生成和理解,刷新了多语言预训练模型的最高纪录,在图文检索、图像问答等任务上达到了世界领先水平。4、技术升级,谁胜谁负?2021年,有哪些值得关注的认知技术落地场景?自然语言处理、智能人机交互、智能搜索与推荐等成为今年各大AI企业的发力点。一、商用NLP技术NLP是人工智能皇冠上的明珠。微软、谷歌、腾讯等行业巨头纷纷发布前沿硬核成果。在ACL2021大会上,微软研究院公布了跨语言命名实体识别、代码搜索、音乐生成、Hi-Transformer、预训练模型、语义交互等六大研究成果。其中,Hi-Transformer可以处理Transformer由于速度和内存限制而无法处理的较长文档,其模型效应引起了研究人员的关注。来自腾讯看点和阿尔伯塔大学的研究人员提出了一种简单但高效的预训练方法:Lichee。是一个多模态内容理解算法框架项目,包括数据增强、预训练引擎、通用模型、推理加速等模块。利用各种粒度的输入信息来增强预训练语言模型的表示能力。Lichee已在腾讯看点、腾讯视频、内容管道、QQ等业务场景落地,平均减少标注样本数40%+。经过多次迭代实践,可以大大缩短信息流内容理解需求的研发周期,提高人的效率。腾讯人工智能实验室和香港中文大学开发了一种利用单语记忆实现高性能神经网络翻译的方法。本研究提出了一个使用单语记忆并以跨语言方式执行可学习记忆检索的新框架。由于能够利用单语数据,该研究还证明了所提出模型在低资源和领域适应场景中的有效性。爱奇艺深度学习云算法团队和慕尼黑工业大学的研究人员提出了一种名为I2UV-HandNet的高精度手部重建系统,可以通过“看”单目RGB人手图片实现高精度3D重建。该技术有望应用于爱奇艺下一代VR设备,从而减少对手柄的依赖,实现与虚拟世界的高质量对话,打造更轻、更快、更舒适的VR设备。同时,手势重构和交互技术目前也在爱奇艺的其他业务场景和硬件终端同步探索中。来自谷歌DeepMind的研究人员表明,机器学习可用于从混合整数规划(MIP)示例数据集自动构建高效的启发式算法。在实践中经常出现用例,其中应用程序需要解决具有不同问题参数的同一高级语义问题的大量实例。近两三年,预训练模型在自然语言领域受到广泛关注。各大公司和学校都开展了预训练模型的研究。趋势是预训练模型越大越好。但是也有一个问题,就是模型越大,训练成本越高。在提供服务的时候,客户的设备能力也很高,导致很多硬件能力不高的中小企业用不上这些重量级的预训练。模型。基于这个痛点,兰舟科技一直在考虑能否将模型做小,提高训练速度,降低使用成本,轻量级预训练模型Mencius应运而生。Mencius的轻量级预训练模型使用大规模语料库以无监督的方式训练大规模语言模型。这个语言模型输入一个句子或者一个片段,基本可以定义出每个词每个句子的意思。语义可以应用于机器翻译、问答搜索等场景。“在预训练的基础上,兰州科技研发了新一代机器翻译、文本生成和行业搜索引擎技术,并通过产业合作实现了技术落地。”基础设施需要较低的研发和部署成本。通过预训练和自训练平台,最终沉淀为标准化、低成本的复制模型,与行业更深度结合,挖掘出更多降低人力成本的新应用。观点。可以说现在的NLP正处于一个美好的时代。虽然还有很多问题没有解决,但是已经有很多成功的商业应用。随着NLP大规模语言模型的工程化,数字化转型的新阶段将开启。2、2021年,商用智能推荐技术,阿里技术团队在双十一的搜索和推荐场景中使用深度强化学习和自适应在线学习,用户点击率提升10-20%。通过持续的机器学习和模型优化建立决策引擎,对百亿商品的海量用户行为和特征进行实时分析,帮助每个用户快速发现宝藏,为商户带来有利买家,提高匹配度人和产品的效率。这样可以大大提高用户的购物体验。字节跳动技术团队结合云端能力,让火山引擎进一步丰富了资源生态的灵活性和算法效果的个性化。同时也解决了本地包大小的问题,实现了资源的动态拉取和使用;配合强大的运营平台,可以更紧密地为企业提供个性化定制服务。在分类信息业务背景下,58技术团队在构建搜索和推荐能力方面做出了建设性的关键实践,如业务联动综合排名框架、多渠道深度学习模型等。在当前的产业化升级浪潮中,针对不同需求的用户体验和点击转化率得到了极大的提升。QQ浏览器实验室自主研发预训练模型“神舟”。该模型具备百亿级参数的训练能力,可以为搜索、推荐、内容理解等各种业务场景带来直接帮助,完善各种自然语言理解算法。影响。通过该模型,不仅满足了QQ浏览器业务中的评论理解、搜索查询推荐等NLP需求,还减少了40%以上所需的标注数据量和相应的研发时间,节省了成本的标注,大大提高了研发效率。从点击率、转化率、匹配效率到业务联动、研发效率、用户体验,智能搜索和推荐的发展正在以一种无声而惊人的力量改变着社会的方方面面。3.商用智能对话对话机器人一直是业界最热门的认知智能技术应用。认知智能使机器能够像人类一样自然、流畅、有趣地进行交流。智能音箱、智能客服、数字人、智能陪护机器人等产品越来越多地出现在人们的生活和工作中。9月,百度发布全球最大对话生成模型PLATO-XL。在人机智能对话领域,PLATO-XL全面超越了Facebook、谷歌和微软发布的最新对话模型,中英文人机对话效果世界领先。11月,在腾讯数字生态大会云智能专场,腾讯云小微发布了基于新一代多模态人机交互技术的全新数字智能产品矩阵,拥有文旅攻略、金融客服、多语种主播、手语主播等不同职业身份和技能,可以提供定制化的角色服务。Sapient具备图像表达、识别和感知理解能力,可识别超过34种语言和方言,拥有超过46万条垂直行业场景热词。哈尔滨工业大学研究团队结合知识图谱和冬奥主题内容,打造了一款冬奥智能客服机器人,能够满足用户对体育赛事票务预订和交通路线规划等需求,并基于冬奥知识图谱实现多轮比赛。对话。OPPO推出的“小布”试图根据用户的请求文字,分析用户当前的情绪状态,给予用户人性化的回应。例如,当用户表达一些与孤独、悲伤相关的文字时,它可以及时了解用户当时的心情,并给予相应的安慰。12月,“新华社人工智能合成主播首次与虚拟人对话”受到特别关注。一位穿着西装打领带的人工智能合成男主播,普通话非常标准,手部动作也很生动。另一位同样身着正装的AI合成女主播连线。此外,脑机接口、智能网联汽车也是今年热门的认知智能应用场景。五、任重而道远,上下求索1.急需更多AI基础设施。正如清华知识智能联合实验室主任唐杰教授所说,认知智能要想取得关键突破,“基础设施还欠缺”。例如,通用知识图谱的构建是一项耗时耗力的基础工程。比如在NLP领域,形式化知识体系明显缺乏组合,实体间关系浅;其次,深度结构化语义分析存在明显的性能缺陷。总之,制度大而不强。专注于一个特定的领域,算法、行业数据、行业专家缺一不可。这对从业者提出务实的需求,摒弃“只做demo级演示”和“PPT式吹牛”的务实心态,以长远的价值心态来对待认知智能的构建与升级。仅仅在应用层创新是不够的。底层技术革新可以带来认知智能水平的颠覆性重塑。2.细分领域产品检测标准有待制定完善。近年来,认知智能的标准化越来越受到国内外各标准化组织、企业和学术界的关注。7月,中国信息通信研究院、筑鉴智能发布的《2021 认知智能发展研究报告》显示,目前已发布和正在制定的各类标准达30余项,涉及国际标准、国家标准、行业标准等多个类别.可见,通用标准已经起步,但细分到各个应用领域的产品测试标准仍未解决。例如,在智慧城市的实际建设中,还缺乏科学合理的城市治理规范和准确高效的模拟推演技术体系等。3、复杂环境中存在偏见和不确定性。在认知智能的实际应用场景中,还存在很多亟待解决的问题。例如,在当前复杂的城市环境中场景推演、智能推理和决策技术遇到的认知瓶颈(经验数据的错误归因会导致犯罪预测算法中的种族歧视);客观规律等知识认知的不完备,使得在开放、动态、真实的城市环境中解决推理和决策问题变得困难。4、认知智能是一套完整的理论、技术和应用体系。认知智能的实现离不开脑科学、心理学、逻辑学、语言学等学科的跨学科融合和共同进步。但在多学科融合进步方面存在一定差距。但如果只在少数学科中进行“烟囱”研究,认知智能水平也会有所不足。六、未来展望从基础研究到商业探索,未来几年认知智能可能有以下四大趋势。1、知识图谱逐渐走向自动化。首先,目前知识图谱构建技术的开发效率比较低。主要症结在于主要依赖人工构建,从数据采集、数据清洗到数据比对,最后到建图全过程。自动化程度低。其次,知识图谱的构建仍然高度依赖专家的知识输入。目前市场上的知识图谱产品普遍行业属性强,产品通用性差,阻碍了技术的大规模应用。为此,不少厂商开始探索平台化的解决方案。例如,筑鉴智能推出了知识工程平台产品Gemini。基于该平台,用户可以自行构建通用知识图谱和行业知识图谱,进行知识管理和知识搜索,大大缩短业务流程中人工文本处理所需的时间,解决企业数据应用问题;第四范式知识图谱(fourthparadigmKB)将大量专家知识模块化封装到4ParadigmNLP产品中,是普通业务人员简单培训即可使用的全流程知识图谱平台,提供知识驱动的复杂应用分析和决策支持不同的行业和领域。2、大小模型相互成就目前,人工智能的发展正在从感知智能向认知智能快速推进。超大规模预训练模型已成为全球人工智能技术研发的热点和竞争焦点。腾讯、搜狗、华为、阿里巴巴达摩院等巨头轮番称霸权威的中文语言识别评价基准(CLUE)榜单。值得注意的是,兰舟科技推出的轻量级预训练模型“孟子”以10亿参数完成了此前100亿、1000亿参数模型的记录,首次登顶CLUE榜单。当然,真正实现大模型还有很长的路要走。目前需要微调,将模型压缩成小模型才能发布。通常小模型只有几十兆,需要软硬件优化才能成功应用。随着企业数字化转型、智能化转型的强烈需求和预训练模型的技术发展,认知智能赛道必然迎来新的飞跃。3.多模态融合以对话机器人为例,目前情感识别多基于文本信息。后续基于声学或视觉特征分析,结合声学和文字信息,更好地了解用户。苹果发明了一种技术,可以根据用户语音请求的音量,实时调整回复用户的音量;谷歌正在根据用户眼睛的焦点来研究用户是否真的在与智能助手交谈。4、从单点算法创新到全栈创新随着行业应用的逐步深入,通过单点算法创新大幅提升应用效果的方式已经不复存在,而是全流程、全栈的方式是必须的。落地场景的复杂性和实际需求的多样性,将倒逼未来的智能应用通过产业协同和系统集成构建一个精密、庞大、统一的智能网络。因此,有必要在继续利用和继承计算智能和感知智能相关技术的基础上,促进脑科学、心理学、逻辑学、语言学等学科的共同进步,促进认知科学与交叉学科的发展。——边界一体化。结束。7.写在最后“任何发达的科技都与魔法无异”,正如著名小说家亚瑟克拉克所说。完全发展的人工智能最终将像变魔术一样赋予机器类人的意识。以认知智能为代表的新一代信息技术将深刻影响社会的方方面面。总体而言,认知智能仍处于起步阶段。在科技快速更新迭代的今天,如何持续开展协同创新,让人工智能释放能量,真正为行业赋能,值得拭目以待。【原创稿件,合作网站转载请注明原作者和出处为.com】