当前位置: 首页 > 科技观察

移动计算的未来:是什么在推动变革?

时间:2023-03-22 01:44:07 科技观察

本文经AI新媒体量子比特(公众号ID:QbitAI)授权转载,转载请联系出处。智能手机之后的下一个屏幕是什么?AR隐形眼镜?图像计算可以随时随地在眼球上完成,图像处理芯片、显示控制和无线通信系统集成在直径不到2cm的镜片上。AR眼镜的无线设计参考也在这里。计算负载可以在智能手机和AR眼镜之间分配。两者的融合会更加顺畅,这也难免让人对消费级AR眼镜产生更多的期待。另一方面,ARMforPC也逐渐成为业界共识。ARM架构低功耗、低功耗的优势被移植到了PC端,从而打破了移动PC“长年饱受续航之苦”的局面。无论是现在火热的元宇宙领域,还是上一代的移动计算平台,似乎都在朝着一个趋势发展——高移动性、低功耗、长续航、高性能。而这些功能不正是智能手机所具备的吗?这也是它在十几年时间里成为主流移动计算平台的最重要原因。不知道什么时候开始,但在各种移动计算平台中,智能手机已经不再是唯一的主角——至少从技术底层的汹涌浪潮来看,这是显而易见的。新的移动计算平台在之前的维度增强和融合的基础上,我们确实已经到达了移动计算发展的一个新节点。从定义上看,移动计算的范围涵盖了各类数据在移动设备上生成、共享、展示的全链条过程。数据可能来自人机交互或设备感知。最流行的移动计算平台是手机。如今,随着5G和AI技术的普及,人机交互得到进一步创新,设备感知形态逐渐发生变化,进一步催生出XR硬件、传统PC更新换代等移动计算新形态。我们先来看5G。无论移动计算平台如何迭代,通信技术都是不可或缺的一部分,甚至会对网络连接提出更高的质量要求。回顾过去从2G、3G到4G的发展,都聚焦于手机作为载体的应用拓展。有了5G,这种趋势悄然改变。标准制定组织3GPP发布的最新5G功能并不局限于手机,而是更加多元化。底层AI能力是推动移动计算发展的另一主要因素,它可以保证移动设备在计算能力和供电受限的情况下有足够的数据处理能力,以应对多样化的场景,如游戏、娱乐、功能等。与我们的生活息息相关,比如拍照。在智能化、数字化时代,AI无疑成为各大平台厂商和芯片供应商争夺的对象。因此,随着5G和AI的自然扩展和迁移,移动计算催生出体验更新更好的新平台,成为水到渠成的事情。而如果把5G看做是基础能力,以AI能力来划分,移动计算的发展方向大致可以分为两类:一类是维度提升,一类是融合。先说升级,以基于XR设备的移动计算平台为例。人类几千年来用来传播信息的媒体无非是二维平面媒体;而元界的XR设备直接将二维升级为三维。我们所在的整个空间变得虚拟化和可计算。这对底层算法和计算能力提出了更高的要求。就拿我们最能感知到的视觉算法来说,手机主要针对二次元拍照场景,包括人脸检测、超分辨率降噪、画质提升、超清人像等。以低级玩家为例。骁龙平台的高通AI引擎在这方面屡创新高:目前第七代高通AI引擎将人脸特征识别点数提升至300个,人脸检测速度远高于上一代。提升了300%,还有多帧降噪、局部运动补偿等功能。来到XR设备端,一戴上就可以开始全场景的实时计算,包括位置追踪、3D物体追踪、平面检测、空间映射和网格化、场景理解等;不仅算法从2D升级到3D,而且对真实性和低时延也提出了更高的要求。另一类是融合,这是典型的基于PC的移动计算。随着移动办公、远程办公需求的兴起,PC终端市场在过去几年迎来了前所未有的增长。去年,全球个人电脑市场出货量创下近十年来的最高纪录,达到3.41亿台。值得注意的是,不说一些芯片玩家开始将ARM用于PC,更多的手机厂商和互联网厂商也在布局平板和笔记本产品,软件开发商也开始打破手机和PC的界限。种种原因,其实也不难理解,那就是综合生态的优势。手机发展如火如荼,PC的价值无法替代。不如将两者连接起来,无缝切换,实现全场景覆盖。这一点已经成为行业共识。例如,一些厂商为了更好地“融合”,原本在手机端使用的一些算法,比如视频会议中的人脸识别、语音识别和设备端AI加速等,逐渐迁移到PC端,以及多屏协同、通用控制等新兴功能正在成为生产力的必备。综上所述,不难看出,AI驱动的移动计算的发展演进,正在从基于手机的单一形态向基于手机、XR等终端或平台的多融合、多场景发展,以及新的移动PC,而且速度飞快。以XR设备为例,根据Counterpoint今年1月的数据,预计2025年XR耳机的出货量将达到1.05亿台,较2021年的1100万台增长10倍。但是怎么走,怎么走,以及一些尚未解决的技术问题,比如算力、算法、架构兼容性等,对企业来说都是不小的问题,也将影响未来移动计算的发展迭代。您如何看待未来移动计算的发展迭代?从外在形态来看,移动计算的现在和未来似乎落在了智能手机、XR设备、移动PC等各种硬件上。但无论用于移动计算的终端或平台如何变化,决定其基本属性的要素仍然是芯片、底层软件和算法。作为当前移动计算平台的代表,智能手机的技术路线已经成熟,其移动计算能力仍在迭代升级中。于是,“移动计算下一步如何走”的问题不再完全基于从0开始的技术创造,更多的是如何使能现有技术的跨界迁移。我应该怎么办?行业大佬高通给出了一条技术路线参考——以通用硬件架构和软件特性为核心,从智能手机开始,逐步扩展到XR、PC等新的移动计算平台。而这条路线的底层能力,也需要从5G和AI的角度来看。一方面,在两者的推动下,手机上的人机交互方式不再局限于触摸屏。如语音助手、手势交互等功能,基于NLP和CV技术,实现了更符合人类自然信息交换方式的人机交互,激发出许多前所未有的应用。例如,第七代高通人工智能引擎可以分析用户的声音,判断用户是抑郁还是健康。然而,这些海量的AI应用数据需要在移动计算平台上进行快速传输,这就要求平台同时具备强大的5G通信能力。而这些在智能手机上“锦上添花”的功能,在XR设备上可能是刚需,对5G能力的要求将进一步提升。另一方面,海量算法的加持,让手机性能屡屡突破极限。比如在相机方面,降噪、自动对焦、使用滤镜、8KHDR等功能都可以在算法的加持下实现,成为手机拍摄大片的关键。在游戏方面,利用深度学习超采样技术(DLSS),手机还可以提取渲染场景的多维度特征,智能结合多帧细节构建高品质画面,实现超越传统渲染的性能。比如看云渲染,它对5G和AI有更高维度的技术要求。还有信号传输稳定、续航等问题,也可以通过AI智能优化。这些方法思路也可以用在XR设备和移动PC上,以提高性能。事实上,将AI作为通用底层能力,为智能手机、XR设备、移动PC提供技术驱动,是业界公认的技术路线。比如基于“统一技术路线图”,高通的AI能力已经逐渐渗透到XR、PC等几乎所有类型的终端。在XR领域,MetaOculus、微软Hololens、BytePico、创维VR等几乎所有主流XR厂商的头显都采用了骁龙XR系列平台。其中,骁龙XR2是目前具有代表性的方案之一。高通声称这是第一款结合了5G和AI的XR芯片。引入了七路摄像头支持和定制的计算机视觉处理器,实现了对用户头部、嘴唇和眼球的实时跟踪,以及26点手部骨骼跟踪等功能。场景理解和3D重建可以更好地将虚拟信息与物理世界融合,带来更加身临其境的交互体验。但同时,该设备也会感知用户所在的外部环境,可以通过AI识别门铃、孩子哭声等声音,提醒人们处理突发事件。语音助手也将实时待命,在嘈杂环境下也能识别指令,并依托5G信号能力,及时向用户终端(移动计算平台)发送消息。近日,高通还发布了最新的第一代骁龙XR2+平台,不仅带来了续航和散热方面的显着提升,还引入了全新的图像处理管线,支持并行传感技术,包括头部、手势和手柄追踪,3D重建和低延迟视频视角;该平台的高像素密度可支持PC级虚拟风景,并可同时支持多个传感器和摄像头,为更逼真的虚拟角色赋予细致入微的面部表情。Meta发布了首款基于该平台的产品MetaQuestPro,结合同样搭载骁龙平台的手柄,可通过多个嵌入式定位摄像头进行自我追踪,实现与耳机的超低延迟;面部和眼动追踪可以为VR中的用户创建更自然的化身。这也是一种以次元提升为核心的融合。在移动PC领域,高通也在尝试利用5G和AI提升移动办公的生产力,保护终端隐私。例如,在召开远程会议时,该设备可以准确感知主体的面部,即使在拥挤的街头咖啡厅,也能实现精准对焦,周围的路人不会出现在会议中。在第三代骁龙8cx计算平台上,高通AI引擎可提供29+TOPS的加速能力,最大性能提升可达3倍。云端部署、本地运行的方式,也能让轻薄本在不占用太多资源的情况下挑战高性能任务。除了自身应用的实现,高通还将这些底层AI能力整合到一个统一的AI软件栈中,实现底层移动计算的“统一”。最上游是统一的AI框架和AI引擎Direct。然后通过不同的开发者服务、系统软件、操作系统分发到不同的移动计算平台,如智能手机、XR、ACPC(AlwaysConnectedPC,即始终连接的PC)等。其中,高通还为开发者准备了一系列工具包,包括AI模型增强工具包、神经网络架构搜索、模型分析器等,以此实现不同终端之间应用开发的互联互通,如手机到XR设备,实现不同终端之间的能力连接。从手机开始,拓展到XR、PC等新形态,最后融合到开发者手中,构建多元开放的生态,有点“一命二,二命三,三万物”的感觉”。而如果你观察高通对5G和AI前沿技术的探索,就会发现他们对移动计算的想象远不止于此。自然,高通在通信方面的领先优势不用多说。今年3月,高通发布了第五代5G基带和射频解决方案——“骁龙X70”。它不仅是全球唯一一家支持600MHz-41GHz所有5G商用频段的厂商,还是全球首款集成5GAI处理器,可在Sub-6GHz和毫米波频段利用AI优化5G链路,提高速度和网络覆盖范围、移动性、链路稳健性、能源效率和减少延迟。在AI的探索上,高通在今年4月发表了一篇论文,介绍了一种用于全景分割的全新神经网络架构。基于实例和语义关系的学习,它可以在像素级别标记图像并有效地识别事物。功能并做出预测,同时自动关注重要事项,在所有基准测试中实现SOTA。该研究可应用于自动驾驶、AR等场景,并已收录于CVPR2022。想象一下,这一成果的应用,那FreeGuy(科幻电影《失控玩家》)不就变成现实了吗?未来,移动计算也将承载人机交互的变革。不可否认,高通乃至更多玩家已经意识到,以XR、ACPC为代表的新型移动计算平台所产生的新兴场景,有着前所未有的市场和价值。XR设备开启的虚拟世界,可用于工业、娱乐、游戏、社交等所有虚拟化的现实生活场景。广泛应用后,足以撬动未来几年超过8000亿美元的市场规模。但是,随着以新型移动PC为代表的移动计算平台的通用性越来越强,与其他计算平台的协同性越来越强,更多的场景和价值需要被发掘……如果说,过去手机所延伸的场景只是数百个新计算时代,会带来数百个横向的行业扩展,进而带来数千、数万的开发者生态和商业机会。而这背后,是AI底层技术驱动的由点到线、面的动力集创新。包括前几期提到的汽车、物联网等场景,未来整个移动计算系统将承载更深远的人机交互变化。纵观整个机器革命,人机交互的每一次创新都给人们的生活方式带来了巨大的变化。以时间为轴心,移动计算平台的革新不就是现在正在发生的人机交互革命吗?以传统PC为主导的人机交互1.0,以及半导体技术的飞跃,推动了个人电脑时代的到来。鼠标、键盘和图形用户界面等发明让计算机飞入了寻常百姓家,即使那个家庭没有接受过专业培训。当前,以智能手机为首的人机交互2.0,移动计算平台开始占据主导地位。2007年前后,基于各品牌iPhone和Android终端的触屏交互逐渐成为移动时代的主流。人们用手指代替了键盘,更多与生活相关的应用只需要一部手机就可以完成。因为它的便携性,每个人都可以拥有自己的人机交互设备。在可预见的未来,在5G和AI技术的推动下,以XR硬件等新型移动计算平台为主导的人机交互3.0,将让随时随地的交互成为可能,就像AR隐形眼镜一样,打开它就可以接收用眼睛看信息,用嘴处理信息。秤一旦普及,将开启人机交互新时代。现在只剩最后100米了,一定要靠底层能力驱动。在人机交互3.0时代,一些旧有的移动计算形态也在AI和5G连接的驱动下,带来了新的价值创新,比如更智能、更便捷的移动PC新体验。然而,交互方式等体验的改变只是表面现象,技术的普及才是移动计算创新的根本和深远影响。从过去家家户户的PC,到人手一部智能手机,人机交互发生了翻天覆地的变化;而在不远的将来,每个人都可以随时随地开启各种新的人机交互方式。机交互体验。当AI、5G等技术更深入地影响我们每个人时,我们也可以像科幻电影中的主角一样,以更多样化的方式感知世界。这也在一定程度上印证了,任何颠覆性的变化,都不仅仅是像高通这样在AI、5G等基础技术上处于领先地位的赋能企业感受到的。其实,我们每个人都身处浪潮之中,都可以亲身体验和衡量新时代的机遇,成为动力组创新的一份子。