关注梁丰台的朋友一定对AR眼镜很熟悉,但仔细想想,AR眼镜的操作系统和核心用户界面是不是有什么特别之处呢? ?印象?也许你对它们的印象都是碎片化的,一个界面,一个按钮。
摘下眼镜之后,似乎就完全没有了这种印象。
是的,没有真正意义上的规则、权衡和功能来定义这种即时用户体验。
梁丰泰认为,AR是下一代人机交互平台。
为了实现更自然的交互方式,AR操作系统将是重要的一环。
那么,为 AR 构建的操作系统会是什么样子呢?哪些基本概念和考虑因素会影响用户体验?对于开发商有哪些规则和限制?我们如何才能更接近下一个AR操作系统?我们对未来做一些假设:AR眼镜厂商想要的是一个可以扩展功能的操作系统。
HMD的AR操作系统应该是原生的,但与我们熟悉的移动系统不同,目前的操作系统无法让AR的价值得到充分的发挥。
下一代 AR 操作系统应该能够弥补从短期使用到全天佩戴的差距。
例如,微软的Holo UI似乎比其他UI前进了半步,但“以任务为中心的方法”似乎并不能完美解释“第一个AR用户体验”。
AR 眼镜具有运动、位置和物体感应功能。
AR眼镜应支持位置跟踪,并需要传感器来识别用户的环境和3D物体。
人工智能将提供环境信息和分类。
Web 服务将用于识别平面图像、3D 环境和大型数据库中的对象。
Google VPS 支持识别预先扫描的环境并确定精确位置。
AR 眼镜的用例将随着时间的推移而发展和扩展。
最初,AR眼镜仅用于单一任务,例如工厂中的培训或设备监控。
虽然由于舒适度、尺寸和电池的限制,佩戴时间较短,但随着软件和硬件的发展解决更多问题,使用时间将会增加。
2010 年到 2019 年的进展将参差不齐,依赖硬件的突破性应用程序和标签将出现。
AR操作系统上运行的软件可以分为两大类:应用程序和标签。
应用程序类似于熟悉的 PC 和移动应用程序,因为它们由用户启动,可以定位(尽管在 3D 空间中),支持多任务处理,并且将保持打开状态直至关闭。
示例:可以打开为工人提供工作参考的应用程序并将其放置在正在处理的对象旁边。
标签更像是自动化应用程序,不断寻找特定的环境或对象,它们可以注入增强的信息,甚至通过可视化改变世界。
示例:大楼管理员启用一个标志,在进入房间时突出显示任何报告错误的设备。
任务:应用程序 迄今为止,移动操作系统的基本概念是 90 年代 PC 和非智能手机操作系统的延续:专注于单个任务的应用程序从桌面或主屏幕启动并接受输入,直到关闭或关闭为止。
暂停。
不幸的是,这种以任务为中心的模型不适用于 AR 眼镜。
当您拿起手机时,您就已经决定要执行什么任务。
手机的操作系统只需要关心它自己的显示并让您尽快执行正确的任务。
然而,AR UI 始终可见,与用户正在执行的实际物理任务共享相同的空间:例如,如果在切菜时一排图标漂浮在您的眼前,那就是一种糟糕的体验。
AR操作系统的“主屏幕”是基于环境的,它需要主动与世界交互,而不是等待用户选择单个任务。
大多数设备上的体验并不是作为独立任务来完成整个显示,而是以应用程序或选项卡的形式出现在它们周围:墙上播放视频,厨房柜台上显示食谱的下一步准备,恒温器显示“在门边等待”。
我们与环境的关系会影响我们的思维方式,与设计 2D 界面相比,组织物理世界可能与 AR 更相关。
当然,我们目前熟悉的以任务为中心的应用程序也会出现,但它们不会是 AR 操作系统的默认状态。
相反,它们将是用户输入的特殊状态。
AR操作系统的默认模式就像在一个光线充足的客厅里,所有可能的任务都是可见的,但不需要注意。
以任务为中心的应用程序就像关灯去看电影一样,是一种减少干扰的临时情况。
全环境、以任务为中心的导航应用(The Division)环境:Tag AR 可以自然地捕获我们环境中的任务和信息。
但目前,该功能仅限于移动操作系统的限制。
移动 AR 面临的最大挑战是它需要特定的应用程序。
用户可能愿意下载应用程序来获得短暂的品牌体验,但作为日常生活的一部分,它根本无法扩展。
如何“发现”AR也是移动设备和AR操作系统中面向任务的AR应用的一大难题。
用户需要在现实世界中得到提示(“嘿,下载我们的应用程序并扫描这个!”),企业需要利用营销让用户意识到在某个地方或物体有 AR 体验。
标签会自动放置在环境中,而无需用户识别它们在特定位置有用并激活它们,例如植物名称标签、食物中的卡路里计数或历史兴趣点。
带有可能的交互或信息标记的视频游戏(杀出重围:人类分辨率) 有用的标签可能包括: 使用标签删除周围的广告 创建维护标签,显示所有已安装设备的使用期限和最后认证日期。
AR美妆、化妆、穿搭。
当商品几乎售完时,会出现“订购更多”标签。
这些标签在 AR OS 中默认启用,基于位置的标签可以自动显示位置所有者的内容。
例如我们之前提到的AR博物馆、gg、基于地理信息的AR导航等。
基于环境的增强,涉及到额外的信息层、交互层和美学层,这在架构和用户体验方面很大程度上是未知领域因为这只能通过 AR 实现。
管理资源:注意力和空间 移动屏幕的局限性迫使人们从基于窗口的多任务界面转向单任务界面。
虽然移动设备上的多任务处理是可能的,但到目前为止仍然很尴尬,因为这是由于硬件限制而做出的妥协。
尽管 AR 能够在任何地方显示信息,但仍然受到严重限制。
然而,这一次的让步主要是针对用户而不是硬件。
用户存在注意力和空间理解等感知/心理限制,过多的信息很容易淹没用户并导致用户沮丧和不适。
AR操作系统需要像管理设备本身的资源一样管理用户的资源,这需要一些非常仔细和善解人意的用户体验设计。
注意力需要作为有限的资源进行管理,并与现实世界的需求相平衡。
物理空间也需要精心管理,以确保 AR 操作系统始终易于理解。
注意 当前的移动操作系统假设,当用户查看屏幕时,他们的大部分注意力都集中在正在呈现的任务上。
如果用户希望转移注意力,他们只需将目光移开即可。
然而,在 AR 中,“显示”由用户可以看到的所有内容组成,因此不能做出相同的假设。
如果您用旋转信息填充用户空间,那么当他们尝试执行其他非 AR 任务时,他们会感到不安和沮丧。
用户对世界的注意力是有限的,因此 AR 操作系统必须将注意力作为一种资源进行管理。
其目标是只向用户提供他们需要的信息,尽可能减少精神负担。
那么,我们如何管理用户注意力呢?以下一些规则可能会引起您的兴趣。
A. 强度:快速或持续的运动可能会分散注意力,尤其是当它们朝向用户或位于视线边缘时。
一臂长度范围内有较大的物体。
明亮或饱和的颜色自然会吸引更多的注意力。
比例大的物体会吸引更多的注意力。
B. 复杂性:同一空间中重叠的物体需要更多的脑力才能理解。
复杂的形状需要更多的注意力来理解,例如高度详细的图标或界面。
此外,由于我们处理的是用户的视觉皮层而不仅仅是显示,因此 AR UI 比传统 UI 设计复杂得多。
例如,设计师需要避免惊吓他们的眼睛:附近余光的突然、微小的运动会吓到用户,因为我们已经进化到本能地认为有一种生物需要我们的注意。
注意判断是否有危险。
同样,任何突然的大规模移动也可能会吓到用户。
C. 注意力和标签 当用户专注于单个活动时,注意力很容易管理,并且由于用户已经启动了一项任务,我们可以假设用户已经在给予注意力,面向任务的软件的创建者可以设计这个基础。
对于 AR 操作系统,为了避免分心和烦恼,UI 的目标应该是吸引尽可能少的注意力,同时仍然提供所需的信息。
标签提供的信息应该是临时的,但以后可以恢复。
例如,当识别菜肴时,卡路里计数标签可能只能在一段时间内适应有限的空间来显示计数。
我们可能需要一个通知系统来管理这些事件并巧妙地提示用户。
D. 空间 由于 AR 的大部分内容都是特定于上下文的,因此许多用例依赖于在引用对象旁边显示的信息,因此活动需要能够请求特定的空间容量。
为了避免 AR 内容重叠,AR 操作系统需要具有管理访问的能力。
操作系统在分配空间时需要考虑活动类型、请求总量、请求锚点、任务优先级和当前环境等细节。
E. 信任用户希望在隐私问题上拥有自主权,并且需要知道第三方可以使用多少数据。
信任将是一个重要因素,因为设备中的摄像头、麦克风和其他传感器需要全天持续佩戴。
信任问题也延伸到用户周围的其他人。
虽然我们随身携带并经常使用的智能手机上有摄像头和麦克风,但 AR 眼镜与智能手机不同。
耳机的本质更加个人化,任何入侵都会非常令人不安,并且需要的不仅仅是智能手机。
更严格地限制传感器的使用以获得信任。
F. 环境操作系统应该有意识地感知用户正在做什么并适当地转换信息的显示。
例如,当您与某人进行真诚的交谈时,卡路里计数、歌曲标题和传入电子邮件提醒出现在您的视野中是一种糟糕的体验。
当今的移动设备已预先配置为更改通知、铃声音量和振动设置。
然而这些都需要手动设置,用户需要根据自己的位置和动作不断改变设置,这是非常不合理的。
操作系统应该感知用户的注意力。
假设用户的注意力集中在正在交谈的人身上,则需要关闭通知。
这个怎么做?幸运的是,机器学习可能是一个“足够好”的解决方案。
一系列人工智能模型,包括人脸识别、运动检测、位置标记和对象分类,可以用作上下文相关的模型输入来确定用户是否正在参与对话。
例如,面部识别模型报告用户面前有一张脸,动作模型报告用户很可能坐着,音频模型报告正在进行真实(非视频)对话,位置模型报告环境就像办公室,对象分类器识别笔、文件和会议桌。
根据这些提示,我们可以合理地假设用户正在开会,或者至少在工作场所进行讨论,并且不想被分散注意力,除非事情很重要。
例如,工作、吃饭、购物、在家放松、运动、睡觉、社交、洗澡、通勤等。
这些环境对用户有不同的期望: 专注和探索:用户对某项任务的专注程度以及欣赏程度额外信息并接受可能性。
隐私:在这种情况下对隐私的合理期望。
设备是否应设置自己的静音模式,或提示用户进行设置。
导航:操作系统是否应该对用户敏感并在传输过程中需要查看和导航?社交:用户是否与其他人交互以及这些交互是否不应被中断。
静音模式:当用户希望在环境系统出现故障时不受打扰时,可以启用静音模式。
这将完全禁用相机、位置传感器和显示器,直到用户恢复它们。
目前这似乎不是问题,因为用户将佩戴 AR 眼镜来完成他们喜欢的特定任务,但将来一旦用户全职佩戴 AR 眼镜,这些将变得很重要,因为需要对环境。
,传感器状态可以清楚地传达给用户和其他人。
综上所述,本文并不是对未来AR操作系统的展望,更多的是理性思考。
但这也预示着,从AR眼镜普及大众的那一天起,我们可能需要考虑的事情会比现在多得多。