当前位置: 首页 > 科技赋能

全球第一份AR报告用两万字告诉你为什么比VR更酷(全文)

时间:2024-05-22 19:06:19 科技赋能

全球第一份AR报告第三章:布局 以下为AR报告第三章:布局扫描下方二维码或搜索微信关注“OFweek可穿戴设备网”关注并回复“AR”  获取:全球第一份AR报告全文PDF续:第一章:AR与VR第二章:AR的工作原理从目前来看看来,绝大多数巨头和初创公司更愿意选择在VR领域拓展疆土,但这并不意味着没有人关心AR。

  来自苹果的种种迹象表明,苹果可能会像微软一样瞄准AR领域,而且并不是时下最热门的VR。

苹果已经在 AR 领域进行了一些并购交易。

今年5月,苹果收购了德国AR公司Metaio。

公司主要开发基于智能手机的AR应用软件。

例如,它曾经开发过一种可视化家具的工具。

该公司被收购后,该实体被注销,人员并入苹果的开发团队。

去年年底,苹果收购了从事面部视觉识别的公司FaceShift。

该公司的技术可以使用摄像头实时捕捉用户面部图像,甚至生成虚拟头像。

据悉,电影《星球大战:原力觉醒》的特效团队曾使用上述公司的技术,让外星人的面孔更加逼真。

此外,苹果还收购了以色列硬件公司PrimeSense,该公司主要为微软Xbox游戏机生产Kinect动作捕捉摄像头。

公司拥有先进的手势和动作识别技术。

在AR领域,用户一般不使用手持控制器,因此识别手部动作非常重要。

该技术也可用于AR头盔。

除了各种并购之外,苹果还保留了一些与AR相关的技术专利。

这些专利并不意味着苹果一定会开发某种技术或硬件,但它们可能会为苹果未来的产品开发揭示一些想法。

今年2月,苹果获得了一项技术专利,该专利主要用于将智能手机连接到AR和VR耳机。

专利描述文字与谷歌、微软、三星电子和Facebook近年来推出的产品非常相似。

不过,迄今为止,苹果从未公布过开发AR硬件、软件等产品的计划。

苹果从来不喜欢成为新技术的第一个早期采用者。

相反,它善于在市场现有的产品品类中拿出用户体验优秀的产品,依靠苹果的品牌力大规模占领市场。

因此,在AR领域,苹果也会选择相对成熟的时机进入市场。

微软微软应该算得上是一家在AR布局上比较超前的巨头公司了。

其于2016年推出AR头盔HoloLens,开发者版本已开启预购,售价为美元。

我们之所以能够看到物体,是因为光线从这些物体上反射并最终到达我们的眼睛。

我们的大脑需要对这些光进行复杂的运算,最终重现你眼睛看到的物体的图像。

HoloLens 实际上会欺骗你的大脑,以全息图的形式向你的眼睛发射光,就好像该物体确实存在于现实世界中一样。

如下图所示,HoloLens可以将屏幕投影到墙上。

当用户四处移动时,屏幕保持在原位,就像一面真正的镜子一样。

HoloLens 以正确的角度将光线射入您的眼睛,让人感觉屏幕实际上出现在墙上。

HoloLens本身是一台独立的计算机,拥有自己的CPU和GPU,以及微软所谓的全息处理单元,负责支持创建全息图所需的所有必要计算。

在消费者方面,HoloLens有着巨大的潜力。

您可能不再需要购买 60 英寸的电视。

HoloLens允许用户将电视屏幕发射到墙上,并且可以随意调整屏幕尺寸。

如果未来版本的HoloLens足够紧凑,你可以想象有人在开车时接收导航,但驾驶员的实现不再局限于屏幕,而是可以看到前方道路的全息图。

当然,游戏可能是HoloLens的一个重要卖点。

在企业方面,HoloLens 最明显的应用是可视化 3D 模型或设计。

HoloLens还可以用于视频会议等场合。

此外,另一个用途可能是支持在线零售商店,允许 HoloLens 用户看到其产品的全息图。

在购买家具之前,您可以看到家具放置在房间中的虚拟图片。

由于HoloLens运行Windows 10操作系统,通用应用程序将在其上流畅运行。

这些应用程序将投影在用户面前并且可以轻松操作。

对于微软来说,吸引开发者很重要,因为该设备最引人注目的应用程序可能尚未推出。

虽然 HoloLens 的硬件令人印象深刻,但它仍然需要良好的应用程序才能最好地为消费者和企业服务。

微软可能拥有一款革命性的产品。

错失移动浪潮后,微软将复兴的希望寄托在 HoloLens 上。

尽管 HoloLens 可能需要多次迭代才能成为大众设备,但对于微软来说,这将是一个改变游戏规则的机会。

谷歌目前在VR领域表现活跃,比如推出硬件产品Cardboard头盔,在YouTube上推出全景视频功能,还提供Tilt Brush、Jump和Assembler等小型VR应用来帮助开发者创新新的VR体验。

不过,这并不意味着谷歌已经放弃了AR市场。

谷歌和联想合作推出Project Tango。

该项目旨在让智能手机能够绘制 3D 并创建 AR 体验。

Tango智能手机将于今年年底出货,相当于一款功能齐全的AR设备。

除了开发自己的AR项目外,谷歌还投资了AR初创公司Magic Leap。

Magic Leap专注于AR技术的研发,其最终产品很可能是一款头盔,将计算机生成的图像投射到人眼上,最终将虚拟图像叠加在真实图像上。

下面将详细解释Magic Leap 的情况。

Magic LeapMagic Leap 是一家知名的 AR 初创公司。

今年2月,Magic Leap在新一轮融资中获得7亿美元投资。

阿里巴巴和谷歌均参与了本轮融资。

据估计,Magic Leap 的估值至少为 45 亿美元,是 Facebook 两年前收购 Oculus 价格的两倍。

Magic Leap开发的技术目前仍处于半透明状态,尚未出现任何产品。

我们目前只知道其主要研发方向是将三维图像投射到人们的视野中。

Magic Leap首席执行官鲁尼·阿博维茨(Rooney Abovitz)公开表达了他公司的定位:“你可以把我们想象成科技生物学,我们认为它是计算机的未来。

”具体来说,Magic Leap 图像的制作方式与人眼的工作方式相同。

Magic Leap 使用弯曲的光场来创建图像,而不是像其他平台那样用立体图像来欺骗眼睛。

对于其他 3D 图像投影方法,如果用户闭上一只眼睛,3D 图像就会消失。

在现实生活中,用户即使闭上一只眼睛仍然可以看到 3D 图像。

Magic Leap采用了这种更实用的图像制作方法。

全球首份AR报告第四章:AR市场潜力。

以下为AR报告第四章:AR市场潜力。

尽管媒体在过去的一年里开始大量报道AR技术,但我们所知的大多数AR解决方案仍处于开发阶段。

只有少数硬件解决方案能够批量生产并投入商业使用。

2016年,全球AR收入仅为1.81亿美元,当时AR常常被视为一种营销噱头:一项仍在探索实际应用的技术。

很少有人意识到AR的潜力,大多数相关应用程序都是为了快速成名而开发的,或者这些应用程序的价值仅限于添加视频效果等引人注目的动作。

不过,最新预测指出,到2020年,AR市场规模将增长至52亿美元,年增长率接近%。

随着大量资本涌入AR项目和AR初创公司,特别是谷歌、佳能、高通、微软等大公司的进入,我们已经看到了第一批消费级AR产品的出现。

随着真正商业利益的显现,AR 将成为消费、医疗、移动、汽车和制造市场的“下一件大事”。

AR比VR具有更大的增长潜力。

市场研究公司Digi-Capital给出的一组数据值得研究:到2020年,AR的市场规模将达到1亿美元,远高于VR的1亿美元。

VR对于游戏和3D电影来说是一项伟大的技术,甚至可以说这项技术就是专门为此目的而设计的。

但这项技术的体验主要是在客厅、办公室或者座位上展开,因为如果你戴着全封闭的头戴式显示器走在路上,你随时可能会撞到路边的东西。

虽然AR技术在游戏中的应用也很有趣,但当需要真正的沉浸式体验时,它可能不会带来像VR技术那么多的乐趣。

这就像手机游戏和主机游戏之间的差距。

然而,AR技术在游戏玩家眼中的这个缺点,恰恰是让它能够像智能手机一样,在亿万用户的现实生活中发挥重要作用的优势。

人们可以穿着它四处走动并做任何事情。

AR 软件和服务的经济效益可与当今的移动市场相媲美,并且它们既可以利用其他产品的现有市场并扩展它们。

AR庞大的用户群将成为电视电影、广告、Facebook用户应用甚至《部落冲突》等游戏的主要收入来源。

换句话说,AR技术有潜力接触到更多人,因为它是对人们日常生活的无缝补充,而不是像VR那样在现实世界之外创建一个完全虚拟的世界。

《增强现实:指向增强现实的一种新技术》一书的作者 Greg Kipper 在书中写道:“增强现实将会有更多的实际应用,因为在现实中,人们正在与现实世界中的事物进行交互。

”在增强现实技术的帮助下,三-人们通过特殊头盔看到的立体全息图像可以为现实世界提供有用的补充。

当您走在杂货店的过道上时,您可能会在您面前的虚拟屏幕上看到配料和制作意大利调味饭的配料列表。

或者,当您正在阅读一本有关天文学的书时,太阳系的图像可能会出现在您周围。

但戴上虚拟现实头盔后,你与周围世界的联系就被人为地切断了。

你被投射到一个不同的世界,就像一只恐龙冲过丛林,或者就像站在摩天大楼的顶部俯瞰下面的街道。

这有点类似于参观主题公园的过程。

即使长时间佩戴虚拟现实头盔也会让你感到恶心或头晕,这与你长时间呆在主题公园时的感觉非常相似。

Meta 是一家位于硅谷的小公司,拥有大约 1,000 名员工。

该公司计划于今年夏天推出第二代 AR 耳机。

其耳机作为开发人员工具包的一部分出售。

整个套件售价1000美元,主要用于帮助开发者设计更多三维、互动的应用程序。

Meta 首席执行官梅隆·格里贝茨 (Mellon Gribetz) 预测,有一天,人们将不再需要一边盯着显示屏一边用笨拙的键盘打字。

人们可以随意切换浮在眼前的全息图像。

浏览时,只需轻轻一触即可完成各种操作。

当然还有虚拟键盘,人们可以用它来输入数据。

人们可以进入全息图屏幕,拿出人体解剖结构,然后挑选骨头进行研究。

人们还可以通过它来检查自己打算购买的鞋子的内部做工。

到那时,打电话将成为一种奇怪的行为,因为每个人都可以在全息图中进行对话。

Gribetz 表示:“VR 很酷,但它只是增强现实的垫脚石。

我们将开发一款比 Mac 电脑更容易使用一百倍、功能强大一百倍的产品。

”   全球首个AR报告第五章:AR面临的挑战 以下为AR报告第五章:AR面临的挑战 对于AR来说,解决注册任务是核心问题。

配准对精度有极其严格的要求:由于AR要实时、六自由度地融合虚拟信息和真实信息,即使轻微的配准误差也会导致组合视图难以忍受的扭曲。

因此,移动AR存在两大难点:注册必须极其准确,注册必须使用极其高效的计算能力和内存。

这个问题是向大众部署 AR 所面临的终极挑战。

我们断言,目前大多数已知的注册任务解决方案实际上并不适用于智能手机——尽管它们看起来有效。

因此,所有AR研究人员都应该针对智能手机AR的大空间应用问题开发专门的解决方案。

智能手机是最有前途的 AR 大众市场平台。

智能手机生态系统提供了向大众部署 AR 的纯软件解决方案的所有要素。

然而,不应忽视的是,尽管技术和逻辑取得了种种进步,但AR应用在智能手机上大规模部署仍然存在以下主要障碍: 1. 相机质量和图像处理。

智能手机通常配备的相机传感器在弱光条件下表现不佳:图像变得模糊并开始出现明显的色差。

相机传感器硬件通常禁止低级访问。

API 仅提供对相机传感器的高级访问,无法控制曝光、光圈和对焦。

小CCD传感器导致相机采样噪声增加,严重影响后续CV算法的性能。

图像采集过程中的质量损失很难通过后处理步骤来补偿。

2、功耗。

近年来,电池电量并没有显着改善。

相机传感器在以高帧速率连续运行时会消耗大量电量。

主要原因是手机的设计目的仍然是拍照,而不是摄影。

此外,传感器和网络接口也是功耗大户。

运行功能强大的 AR 应用程序会快速耗尽电池电量。

因此,AR应用程序必须设计为仅供短期使用,而不是“永远在线”的功能。

3.网络依赖。

对大量数据的远程访问受到多种因素的影响。

首先,网络延迟可能会导致令人不快的延迟,从而降低 AR 应用程序的瞬时性能。

其次,只有通过数据计划才能访问远程数据,这可能太昂贵或不可用。

最后,部分地区的网络覆盖可能不达标。

于是,完全独立的AR应用成为了唯一可行的选择,这意味着它们需要占用设备上大量的存储空间。

4. 可视化和交互的可能性。

智能手机的外形因素在购买决策中起着重要作用。

实际上,显示器的尺寸受到可接受的最大设备尺寸的严格限制。

交互式技术也有类似的局限性。

多点触控界面可能是最先进的交互机制,但它们在某些任务上表现不佳,例如像素级选择。

理论上,我们已经知道需要哪些方面来改进未来智能手机的 AR 功能。

在实践中,AR应用的开发者必须考虑硬件制造商和服务提供商的意见。

后者根据市场预测做出硬件开发决策,其中可能不包括 AR 的需求。

然而,硬件总体上正在朝着正确的方向发展,尤其是在移动游戏或移动导航系统的推动下——这两者都与 AR 有许多共同的技术要求。

此外,研究人员意识到目前相机控制存在局限性,更好的相机 API 将因此诞生,例如 Frankencamera 项目。

虽然平板电脑也逐渐成为流行的移动平台,但它们是智能手机平台的放大版本。

由于尺寸增大,对可视化和交互的限制有所放松,但这些设备的尺寸和重量也限制了它们在 AR 领域的应用,因为它们拿起起来比较累(例如,举起设备进行很长一段时间可能需要两只手,这反过来又限制了交互的可能性)。

除此之外,当前的平板电脑还面临与智能手机相同的问题。

对于不同的AR应用,智能手机和平板电脑可能更适合前者,也可能更适合后者。

计算机视觉挑战智能手机的一大优势是定位不必仅仅依赖相机传感器,还可以利用任何其他可用的传感器,例如GPS、指南针、加速计和陀螺仪。

尽管在核心 CV 社区中使用其他传感器通常被视为“作弊”,但这些传感器可以为实验室外快速、强大的定位功能的开发做出重大贡献。

即使有了传感器组合的帮助,基于 CV 的定位仍然非常困难,原因有以下一系列: 纹理结构。

大多数方法依赖于兴趣点形状上的自然特征,并要求环境的每个区域都有足够清晰的纹理。

主要的兴趣点是纹理的呈现方式至关重要。

尤其是在室内场景中,经常出现白墙,使得基于自然特征的定位方法很难发挥作用。

照明和天气条件。

尽管自然特征描述符通常被设计为不受光照影响,但这种假设仅在描述实际物理特征的观察研究中成立。

不幸的是,室外环境中的大量自然发生的特征与实际的物理特征并不相关。

场景中物体投射的阴影可能会导致出现斑点、角落和线条,并且会随着光照或天气条件的变化而动态移动。

因此存在大量的异常因素和失匹配因??素会对定位质量产生严重影响,这与匹配算法的选择无关。

数据库规模大且易于更改。

对于室外环境,在定位之前必须收集并处理大量数据以生成初始模型。

利用昂贵设备的实时方法能够解决这个问题:然而,不可访问的区域仍然可能导致最终模型中出现漏洞(即无法映射的区域)。

此外,生成的模型仅表示某个时间点的静态快照。

环境的任何变化,比如商店橱窗的改造、咖啡店雨伞的开合、停车场有车和没有车等,都会让数据采集生成的模型瞬间过时。

另一个重要方面是最终模型如何分布在通信渠道(可能是移动网络)中。

由于这些模型通常非常大,因此无论是作为整体传输还是分开传输都会造成技术困难。

传感信息不准确和丢失。

在户外定位中,GPS和指南针提供了有关设备大致位置和方向的极其有价值的绝对信息。

不幸的是,传感器并不坚固:感测信息的准确性可能因地点而异。

尤其是在狭窄的城市峡谷中,GPS信息可能会出现数米偏差甚至无法使用。

同样,电子罗盘读数可能会受到磁干扰的严重影响,这在人造环境中是不可避免的。

精准定位是AR迫切需要解决的首要任务。

但如上所述,仍然存在一些重大挑战,仍需要找到真正实用、有效的解决方案。

最近平板AR的SLAM实现已经证明,如果满足上述条件(即清晰的纹理结构),则可以完全实现小规模环境中的定位注3。

然而,大规模环境中的定位仅存在于proof-of-概念研究。

相关问题似乎很难攻克,只能等待技术的缓慢进展。

  其他挑战除了实现算法研究成果的准确性和可扩展性等学术目标外,还存在一系列严重影响AR体验实用性的实际问题。

这些因素仅与 AR 的实际应用相关,因此在科学文献中讨论较少。

这可能会导致人们错误地认为这些问题并不难解决或者与 AR 的成功无关。

以下是一些与智能手机相关的问题,也与 AR 的一般使用相关: 实际硬件开发与“AR 愿望清单”:目前智能手机中的摄像头和其他传感器的质量不足以满足 AR 的高要求。

硬件进步——例如立体摄像头、CPU/GPU 的统一随机寻址和 WiFi 三角测量——可以极大地有利于 AR 应用程序的开发人员。

不幸的是,在 AR 尚未成熟的情况下,期望手机针对 AR 进行优化纯粹是幻想。

硬件配置的任何变化都可能增加数百万美元的开发成本,如果后来无法满足市场预期,则成本会更高。

目前,消费者购买手机主要用于语音通讯、游戏和网页浏览。

这些市场将在中短期内推动手机功能的创新。

我们必须让设备制造商相信AR是手机应用的新兴市场,这样我们才能获得更先进的AR硬件。

幸运的是,现在AR的关注度已经达到了大规模,所以在不久的将来,针对AR优化的手机可能会成为现实。

动态场景与AR现实之间的矛盾。

当前的 AR 应用假设场景中的一切都是静态的。

然而,现实却恰恰相反。

尤其是在室外场景中,几乎一切都在变化:行人、照明和天气条件,甚至建筑物每隔几年就会被涂上新的颜色。

定位将受到严重影响。

在动态场景中,大多数算法的基本假设从一开始就是错误的。

例如,假设您正在增强建筑物的立面,而路过的行人遮挡了部分景观。

由于算法中缺乏分块推理,无论增强内容的视觉效果有多好,未来硬件平台的性能有多强大,仍然会出现引人注目的错误。

动态物体和虚拟内容之间缺乏交互肯定会损害AR应用的真实感。

因此,当前CV研究成果中加入物体动态检测与跟踪技术是未来实现高质量AR的关键。

内容创作与注册的矛盾:AR之所以令人兴奋,很大程度上源于参与内容创作的终端用户的发展前景。

个人内容创建是让用户主动参与而不是被动观察的关键。

然而,实施这一概念的基本机制仍然缺失。

尽管手机交互方式已经有了很大的改进,但在没有准确的全局环境模型的情况下,如何使用2D界面方便、准确地注册六自由度内容的问题仍然没有得到解答。

以增强建筑物窗户为例。

当前的方法甚至无法处理简单的标记任务。

没有任何机制可以在开放空间中输入任意 3D 位置,更不用说清楚地指示方向了。

当前确定标签的方法通常利用用户的(不精确的)GPS 位置而不是感兴趣的对象本身。

为了让最终用户创建真实、理想的内容,用户附近任何位置的准确注册必须简单且稳健——然而,这是超出 CV 基本范围的另一个研究问题。