当前位置: 首页 > 科技观察

元启蒙:AI是通向元界的关键变量

时间:2023-03-14 16:26:14 科技观察

近日,新的活水涌入元界。在Meta举办的实验室讨论会上,MetaCEO肖查公布了他的Metaverse中的多项新技术。无论是资金还是技术,Meta都走在构建Metaverse世界的最前沿。从去年10月将Facebook改成Meta,再到旗帜鲜明地斥资百亿,一系列的赚钱收购,以小动作为导向的作风一头扎进了元宇宙的深海,并于近期取得一系列成果公开分享。MetaLab在元宇宙中的技术突破将给行业带来怎样的启示?作为行业的技术先驱,小扎评价自己的新技术是“勾勒虚拟宇宙的关键一步,解锁诸多进步的是AI”。AI与元界碰撞对元界世界有何影响?你的脑海里是不是也有很多问号?话不多说,进入正题,我们先从这些新技术的出现说起。AI引人遐想在这项新技术公布之前,关于Meta最火爆的新闻莫过于2月初的财报。整个2021年,MetaRealityLabs亏损101.9亿美元,2020年亏损66.2亿美元。投资真金白银跌落,雷声大雨点小。不少投资人和从业者已经从对元界的狂热中醒悟过来,但最近Meta在元界的技术突破似乎让很多人对Meta有了一点信心,也让元界的数字世界向前迈进了一步。步。Meta宣布的新技术包括语音生成的Metaverse场景BuilderBot和超级AI助手CAIRaoke。1.语音生成场景的BuilderBot。在录制的视频中,我们可以看到小扎和同伴在虚拟环境中,通过一系列的语音指令,在原本单调的虚拟背景中加入了云朵、树木、岛屿、桌椅等虚拟物体,与语音命令结束,一个比较丰富的虚拟场景就建立起来了。不过,目前的BuilderBot只是一个简单的演示展示,更复杂的3D环境的生成还需要时间和更深入的研究。2.超级AI小助手菜若可。底层是自监督的端到端神经网络模型,可以理解和学习用户的声音和肢体语言,让我们在虚拟数字世界中与语音助手进行更流畅自然的对话。在视频演示中,AI小助手可以在与人交流的同时关注烹饪过程中的盐量,及时提醒用户加盐量。目前,该技术已应用在其视频通话终端设备中,未来还将融入AR/VR产品中,增加与数字助理的交互。3.通用机器翻译工具。这是Meta正在开发的一项技术——一种通用语音翻译器,旨在提供所有语言(包括所有书面语言)的即时语音到语音翻译。这种通用的AI机器翻译工具可以打通我们与信息、人之间的壁垒,语言不再是限制我们获取信息的障碍。此外,Meta还公布了其他一些AI工具。Meta公布的最新AI技术,以及Meta此前公布的超级计算机,未来都将走向成熟和蜕变,对Metaverse的影响可想而知。元界作为下一个技术形态的入口,加上AI技术,我们可以明显感受到元界世界生态内容的丰富性。数字世界中的智能陪伴、智能交互、场景内容的生成与构建,都讲述了AI各种智能工具对元宇宙基础设施的智能化改造,而不仅仅是整合大量基础设施的工作和指导的接管,不仅减轻了从业者的负担,也为生态中的人机交流、用户体验提供了不同于人类现实社会的价值。我们看到,人工智能赋予的能力加速了元宇宙世界的模态运行。也就是说,元宇宙的世界构建也将深入到电影第一人称的“绿洲”中。对于元界世界来说,智能“人”和“境”最本质的核心就是交互,而让交互有沉浸感需要元界的沉浸式体验。元宇宙作为一个虚拟的平行世界,需要包含现实世界所有的元素。如果要讨论Meta的新技术给元宇宙带来了什么,需要回到元宇宙的基本要素中去寻找答案。业界对元宇宙基本要素的共识,基本上是基于Roblox给出的元宇宙八个要素,包括:身份、社交、沉浸、低延迟、多样性、随时、经济系统、文明。笔者认为,Meta的技术突破给Metaverse带来的变化,可以归功于交互和沉浸式体验的丰富。首先是沉浸式体验,语音生成场景的BuilderBot,说到底就是让元界向更智能的沉浸感方向发展。使用语音制作场景,这种探索性的方法展示了人工智能在Metaverse中创建复杂3D环境和新世界的潜力。在构建多元沉浸式社交元宇宙的道路上,如果耗尽参与者的生产能力来构建场景内容,那么内容的生产能力仍然有限。如果转化为AI技术的自动化构建,一些重复的素材和脚本设计等,简单耗时的工作都可以用AI工具来完成,更多的精力可以花在打磨虚拟世界的核心产品内容上.在交互方面,包括社交、低延迟、多样化的元素需求。超级人工智能助手菜乐客与通用机器翻译工具的未来形态,可以让元宇宙中人与人、人与数字人的交互更加顺畅。元宇宙中的“人”是基本单位,不仅包括进入元宇宙的探索者,还包括元宇宙中的虚拟数字人。超级AI助手CAIRaoke可以理解和学习用户的声音,让我们与生态中的各类数字人进行自然互动。同时,通用机器翻译工具可以即时翻译不同国籍的语言,让不同背景的用户进入元界无障碍交流。未来的超级人工智能助手菜乐客和通用机器翻译工具,可以扫清元界交互中的语言障碍,让数字世界的交互更简单、更常态化。BuilderBot、CAIRaoke、通用机器翻译工具等人工智能技术的研发方向和未来形态,让元界的基础组件智能化升级,也让元界更接近理想状态,吸引更多人们。进入元宇宙社交。当然,虚拟人工智能和真实人工智能技术的学习和进步会相互反馈。对于现实世界,也推动了创造性人工智能技术的进步。如此一来,元宇宙的生态就会变得更加立体。我们知道内容是吸引人的关键,但人们在数字世界中的感受是产生羁绊和长久存在的基础,而这种感受需要数字技术将我们的感官融入到虚拟世界中放大,真实的定性提升沉浸感。捕捉真实世界:步步为营的数字“通感”说到我们在数字世界中的感官,引入通感的概念可能更容易理解。联觉的本意是将视觉、嗅觉、触觉、听觉等不同感官进行交流和转化,从而使人的感受更加立体和丰富。那么,在元界的世界里,数字“通感”就是利用AI和机器,让肉体更加生动地体验和探索虚拟世界,表达和传达情感的温度。在数字联觉中,语言是交互的背景,听觉是语言交互的基础,数字视觉(VR)和触觉(传感设备)赋予我们的身体在虚拟世界中真实的质感和触感。听觉设备和技术的进步,加上数字视觉(VR)和传感器设备,推动虚拟世界一步步逼真。听觉AI技术主要基于智能语音识别和智能语音合成。在前面的描述中我们了解到,在虚拟世界中,结合语音技术融合的AI助手,无论是指令还是普通的语音交互,AI语音技术的引入将让用户体验到机器之间的陪伴和归属感。和人类。虚拟世界的温度也源于语音技术更加自然的拟人化。同时,机器在交流过程中的不断学习,也会让虚拟世界中的数字人更好地了解用户的特征。人工智能助手成长为虚拟密友只是时间问题。元界数字视觉的“通感”依赖于AR/VR技术。它与AI的结合也是AR/VR未来发展的重要一环。以Meta下的Oculus为例。Oculus是很多人选择耳机的首选。在地平线之家的虚拟空间中,Oculus可以用于社交聚会,手势识别、桌面、键盘、沙发等物品都离不开。开启AI科技加持。视觉数字通感让AR、VR从虚拟世界的入口升级到AI交互体验的智能化升级,从现实到虚拟,从虚拟到智能。数字触摸的通感来自于一些配备了人工智能技术的传感器设备。比如Meta发布的可穿戴手套和智能手腕设备,这些设备可以动态追踪手势和手腕,感知环境。通过分析手腕的肌电信号,系统可以理解微小的手指运动,然后将其转化为数字指令发送给设备,实现数字交互和控制。触觉手套通过气动装置和触觉渲染系统模拟真实触感。触觉渲染系统需要构建相应的软件和算法,根据手的位置对虚拟环境物品的重量、质地、硬度等进行建模、理解和分析,然后向手套的气动装置发送正确的指令进行呈现真实的物理世界。触碰。在AI技术的加持下,数字化的视觉、听觉、触觉打破了虚拟世界的维度壁垒。我们在元宇宙中的化身可以在数字空间中感受到虚拟世界的“真实感”,信息在虚拟世界中碰撞成长。元界基础设施的完善任重而道远。依托通用智能技术的不断进步,在构建元宇宙的道路上,人工智能的应用是让元宇宙更沉浸、更丰富的关键。这也是吸引无数用户入驻元界平台的有效方式。在传统互联网中,我们作为旁观者的体验归根结底是信息的传递和交互。在虚拟世界中,人工智能的运用不仅可以为虚拟世界创造广阔而丰富的环境和内容,人工智能赋能的数字通感让用户在虚拟空间中打开和放大自己的感官,扮演一个具有通感的虚拟人作为其中的参与者,我们可以抛开肉体的种种限制,进行互动、探索和分享。数字通感与元宇宙的结合,AI是连接的桥梁,不可或缺,为亿万用户构建人机共生融合的新未来。