早在今年1月,微软Kinect技术参与者Alex Kipman就介绍了微软新一代虚拟现实技术Holograms。
全息图利用头戴式设备,让用户以实际环境为载体,实时处理和获取虚拟信息。
例如,您可以在墙上获取消息和联系人、在地板上和家具之间玩游戏、进行 Skype 视频通话以及直接在客厅墙上观看足球比赛。
事实上,用户甚至不需要任何信息载体,所有数据都通过耳机直接呈现给用户。
与此同时,微软还发布了自己的全息技术设备HoloLens。
从外观上看,这款设备很可能采用了微软此前购买的ODG智能眼镜相关技术。
据介绍,HoloLens拥有透明镜片,内置高端CPU和GPU。
看完这个视频,绝对是一个又酷又酷的屌。
蛰伏多年的微软似乎终于崛起了。
那么如何评价HoloLens的黑科技呢?以下为正文: 引用宣传视频中的一句话:本来是科幻小说,微软把它变成了科学事实。
HoloLens所达到的效果并不是微软一家的创新。
它早已在各种科幻电影中流传。
HoloLens是一款集成了Oculus+Kinect+JetsonTK1并夹在鼻梁上的嵌入式怪物。
想象一下如果你头上有一个 Kinect 会是什么样子。
微软做到了!首先给还没看过宣传视频的小朋友们介绍一下HoloLens。
HoloLens是基于深度摄像头、高性能处理器和双屏显示器的Glass的高级版本。
看起来像这样。
详细信息请参见微软官方网站。
根据我目前看到的信息,HoloLens需要的技术支持包括三个部分:实时三维计算。
这在游戏行业中是一件很糟糕的事情。
可以说,《阿凡达》之后,拉开了一个时代的帷幕。
经过NVIDIA、Intel等公司的努力,实时双摄渲染已经非常成熟。
微软终于将这项技术推向更广泛的领域。
下图的效果是现在游戏级别的。
准确的姿态确定和位置确定。
根据网上流传的消息,可以肯定的是,微软采用了基于深度识别的SLAM(实时定位与地图)技术。
这里解释一下什么是SLAM,就是通过传感器获取环境的有限信息,如视觉信息、深度信息、自身的加速度和角速度等,以确定其相对或绝对位置并完成构建地图。
SLAM的精度对于最终的显示效果非常重要,确定姿态也不成问题。
几十块钱的电容陀螺仪或者几百块钱的MEMS只要抄几段代码就可以了,但如何确定位置就是微软的本事了。
当然,说到深度相机,微软常年殴打整个行业,Kinect几乎已经成为行业标准(它帮助发表了那么多论文)。
想想我们使用的激光雷达的价格。
我真的很想哭。
电影中,使用小型探测器扫描隧道全景并以全息方式呈现。
对应现实,这种东西用在《普罗米修斯》,相当于一辆低端奥迪A8的价格。
它可以同时发射数十束激光进行扫描。
谷歌自动驾驶汽车也使用这款激光雷达进行实时路况分析。
微软做到的就是三年前科幻电影的效果!微软暗示,进入房间之前需要进行扫描。
这里显然是使用DeepCamera生成PointCloud,然后对三角形进行SLAM。
(我实验室的一位学长在微软实习的时候,他的毕业设计也是这么做的,微软很擅长这方面的技术,积累很强)。
如果确定是类似于Kinect的红外摄像机,那么可以认为它会具有Kinect的所有问题,例如黑色物体和光滑表面的检测。
可以说,HoloLens的核心难点在于深度检测和相关手势识别。
这是微软的专长。
所以HoloLens就是戴在鼻梁上的Kinect。
为什么 SLAM 对 HoloLens 如此重要?因为只有实现可靠的SLAM,我们才能知道眼镜的空间坐标及其相对于各种室内障碍物的位置,同时识别各种室内陈设的形状。
这就是宣传视频中人机交互的基础。
视频中,主角不断移动,画面稳定性非常好。
图像识别技术在这里注意到了一个细节。
三维空间中显示的UI与Autodesk Fusion的UI非常相似。
难道自动表已经领先了?作为一名半工程师,我购买 Leap Motion 只是为了玩 Solidworks Fusion。
现在有了 HoloLens,体验比 Fusion 好得多。
让我想起了我参观EAST时的情景,在我的眼中看到了EAST的横截面。
不能更震惊了。
这三项技术近年来日趋成熟,推动了HoloLens的产品化。
之前Google Glass的想法与此类似,Hololens将其推向了现实。
事实上,Hololens 实现的效果并不新鲜。
早在冷战结束时,武装直升机飞行员就利用头盔中的信息来控制机枪瞄准的方向。
我军这两年也有装备了。
当年,Su35的“回航炮”是利用尾锥雷达和头盔瞄准镜向后发射导弹。
不过,根据技术分析,Hololens可能会遇到以下一系列困难:一是功耗。
计算视觉、SLAM和反向3D虚拟现实都是计算密集型任务。
Hololens是一个时代英雄的产品。
这样的计算量就是二十年前阿拉莫斯实验室用于核聚变模拟的计算量。
现在,只要功耗能跟上,NVIDIA的TegraK1和Intel的协处理器就可以增加嵌入式系统的计算量。
其次是开放环境和弱光环境下的识别问题。
我对此持保守态度,我会等到收到产品为止。
第三,定位精度问题。
这是个大问题。
如果我们修复的不是水管而是血管,看到的是利用B超技术实时扫描人体内部,未来的医院会是什么样子?如果展示的不是水管说明书,而是实时匹配的无人机分解图,工厂和DIY的未来会是什么样?令人不敢想象的是,这一切居然都实现了!微软研究院培养了这么多人,也不是没有原因的。
目前微软已经很好的解决了这些技术。
另外,我非常看好HoloLens+无人机的交互。
拿到货后第一件事就是移植我们的无人机系统。
这幅画真漂亮。
我就是不忍心去想它。
还有多系统的合作,就像iPhone一样可以推动21世纪的历史进程。
买买买!估计谷歌也坐不住了,将会有大动作。
大多数相关技术(包括廉价的深度相机)都是开源的。
估计很快就会有公司为类似设备提供开源硬件和软件。
市场将会蓬勃发展。
即使受到刺激,华强北也不会固步自封。
投资空间有多大。
各位手里有钱的朋友,请考虑一下。
iPhone引发的历史轨迹就证明了这一点。
看来全息技术不会成为主流发展方向。
不过,我最好奇的是,这款产品进入中国后,广电是否需要审批才能进入(显然会抢走电视机的饭碗)。