百度“可穿戴设备”BaiduEye的消息于明年3月传出。
当时有媒体透露,百度正在开发一款类似Google Glass的产品,并公布了一张谍照。
谍照显示,普通眼镜上粗略地捆绑着一颗芯片。
一年半后,当它在最近的百度世界大会上正式宣布时,它已经成为与谷歌眼镜完全不同的产品。
显然,BaiduEye并没有配备像Google Glass那样的显示屏(用户可以使用Google Glass投射到视网膜上,像大屏幕一样看到信息)。
它的主体是摄像头和入耳式耳机。
PingWest 之前的报道中曾提到过它的使用方式:用户佩戴后,可以通过语音命令来控制它。
它将使用垂直摄像头捕捉用户面前的物体,并通过 Wi-Fi 连接进行图像识别。
基于一系列信息搜索和交互。
在百度官方演示视频中,BaiduEye用于在购物等场景中通过互联网搜索眼前的物品信息,然后通过入耳式耳机将语音搜索结果返回给用户。
所以你可以看到BaiduEye和Google Glass的工作方式和使用场景有很多区别:你可以利用Google Glass的屏幕和语音交互做各种新奇酷炫的事情,甚至还可以使用Evernote,查看电子邮件和消息、第一人称摄像头只是其功能的一部分。
百度眼更像是跟随人眼睛的“第三只眼”。
当你需要的时候唤醒它。
它会捕捉人面前物品的图像或记录,然后上传到百度的搜索网络进行处理,并返回Serve。
从开发该项目的团队百度深度学习研究院(IDL)的角度来看,他们也将BaiduEye和Google Glass定义为两个不同类别的可穿戴设备。
不久前,PingWest品玩参与了百度深度学习研究院副院长余凯的内部分享演讲。
余凯详细讲解了百度为什么要开发BaiduEye、其产品外观和功能设计思路,以及未来的使用场景甚至商业化空间——以及BaiduEye在这些方面与Google Glass有何不同。
顾名思义,百度的初衷就是让BaiduEye成为一只“眼睛”。
于凯认为,手机越来越善于理解用户、他们的个人信息以及他们每天关心的内容和习惯。
在人们日常使用手机的过程中,摄像头在一定程度上取代了眼睛的功能:捕捉看到的有趣内容、搜索图片、与朋友分享照片……如果你想让你的手机懂用户更好的是,我们必须更多地了解用户每天看到的东西——于凯表示,大脑每天接收到的信息90%以上都是通过视觉获得的。
因此,百度开发BaiduEye的基本思路是让这个设备成为人眼的自然延伸。
请注意,他们不希望用户与BaiduEye之间进行视觉交互,即配备屏幕。
余凯认为,要让BaiduEye成为人眼的延伸,首先要做到拥有无障碍的视野。
用户看到的就是它“看到”的,两者通过语音进行交流。
余凯坦言,谷歌眼镜首先会影响用户的视力,这是一件非常糟糕的事情。
他认为谷歌眼镜的运作是一种“反人类”的设计。
让我们看看BaiduEye如何成为“人眼的延伸”。
它的主体是一个从头部右侧突出的摄像头。
用户可以使用语音命令控制它来捕捉他们面前的图像。
此前在百度世界大会上,百度主要演示了利用手势“取框”进行图像搜索的场景,即用户用手势围绕自己想要抓取的物体画圈,BaiduEye将利用算法识别该物体被用户圈出。
然后上传到互联网,利用百度大脑的图像识别技术在互联网上搜索该物体的相关信息,然后用语音反馈到用户的左耳机上。
事实上,这只是使用BaiduEye的一种方式。
用户还可以通过红外扫描捕捉图像:当你按下摄像头旁边的按钮时,BaiduEye就会投射出红外线,然后自动捕捉并搜索红外线落在的物体。
在百度深度学习研究院的现场演示中,BaiduEye主要有一个功能,就是搜索人们眼前物品的信息。
当BaiduEye捕获产品图像时,它会自动将图像发送到互联网上进行识别,然后将从百度百科等网站找到的产品信息“读取”给用户。
而且,BaiduEye会在用户手机上搭载专门的APP,搜索结果信息也会同时推送到这个APP上进行展示。
您可能会觉得这个操作方法和功能太简单了。
不过,在余凯看来,这就是BaiduEye与Google Glass不同的地方——他认为Google Glass的使用没有特定的垂直场景。
“从用户起床到睡觉,你会看到一整天的情况。
”我不知道应该使用谷歌眼镜捕捉哪个瞬间或非常清晰的场景。
”那么BaiduEye是为什么样的“瞬间”、“清晰场景”而设计的呢?余凯的答案是“O2O”。
余凯认为,Google Glass主要是to-C产品,而百度则将BaiduEye定义为to-B产品。
目前的使用场景主要集中在两个方面:商场和博物馆游览。
如果您是顾客,佩戴百度眼就可以随时在网上搜索商品上架信息和商品评价。
同时,它会记录你放弃并购买了哪些产品,向你推荐相关产品,甚至向你推荐你已经购买过的产品。
我和上衣一起购买的裤子在这个商城的另一家店里有卖……不过,这并不是百度最关心的。
百度希望线下商家能够利用BaiduEye捕捉顾客在购物过程中的行为,比如你拿起了哪些产品、你停留在哪些货架上、你最终决定购买哪些商品……根据这些信息,购物商场导购可以向顾客推荐相关折扣、促销和优惠信息。
“我们目前主要考虑的是to B环境。
BaiduEye的图像识别是通过百度大脑完成的,它可以在后台进行大量的数据分析,然后推送到BaiduEye。
例如,商店付款的地方通常有一个小货架,这个货架的目的是让你在排队结账的时候可以买东西,使用百度眼的商家可以根据你在整个店内的所有关注行为为你定制一个私人货架。
于凯表示,在百度世界大会上,百度与银泰商业共同宣布了一件事:银泰将引入BaiduEye来装备商场导购,帮助完成上述场景。
目前BaiduEye向商家推广的思路:暂时不会对外开放,而是选择一些线下商家作为合作伙伴,在使用过程中针对特定场景进行优化,同时进行产品迭代,而百度计划BaiduEye将免费提供给商家合作伙伴。
博物馆导游的另一个使用场景很容易理解:百度希望它取代导游和传统导游的角色。
此外,余凯还描述了另一个更有趣的使用场景——例如,工人在维修电缆时,出现的一个问题是有能力处理故障的专家不在现场。
百度眼也可以在这样的场景中提供帮助,让工作人员现场操作,专家通过百度眼的现场视频进行远程指导。
事实上,这种“远程同步”手术也开始以另一种方式实现——一位欧洲医生在手术过程中使用GoPro以第一人称视角拍摄整个手术过程,而手术室外的实习医生可以佩戴Oculus Rift以第一人称视角还原整个手术过程。
有了BaiduEye,这个过程甚至可以同时进行。
当然,谷歌眼镜也完全有能力胜任这项任务。
接下来,BaiduEye今年还会进行两次迭代,两次迭代都会以外观更新为主——毕竟它还是需要戴在人头上的东西,而且不能太难看。
到这里你应该对BaiduEye差不多了解了。
现在的问题是,当商场里的导购员戴着这样的设备,用向前突出的摄像头捕捉顾客的一举一动时,你有何感受?以下是余凯回答部分媒体有关BaiduEye问题的回答(PingWest品玩):BaiduEye接下来的两次迭代会是什么?它只是变得更轻、更时尚,还是会添加更多传感器和其他功能?余凯:主要是因为更好看、更时尚。
目前,设计中出现了一些故事,阻碍了我们进行改进。
在后续的迭代中,我们将会发生翻天覆地的变化,甚至可能取消头部后面的电池。
但是这个问题是可以解决的,一个人最重要的是什么?这是脸的样子。
百度眼不会遮挡您前方的任何物体,让您的视野畅通无阻。
当然,我们也认为后者的美感非常重要,所以我们会找知名的服装设计师来和我们合作设计。
商家是否关心顾客店内活动的信息?余凯:商家会利用数据来帮助提升服务质量。
事实上,现在商家已经在这么做了。
例如尼尔森就会提供这样的服务。
有些商家在上架的时候,会记录在你看不到的地方。
他们会记录大约一周的时间,记录数据,然后将这些数据提供给商家来优化他们的货架。
地方。
两个问题。
一种是当用户去商店时。
如果我从来没有使用过BaiduEye,商家如何为他提供服务?第二个问题是,如果他使用BaiduEye,他的哪些信息会被商家识别?以什么方式和在哪里存储?余凯:一是针对老客户。
百度眼在您的手机上会有相应的APP。
当你进入商店时,会有一个二维码。
商家会通过二维码为您匹配。
对于新用户,我们并不关心识别他们是谁。
我们更关心他们在店里的行为。
就像我们不关心你的名字,但我们更关心你喜欢吃什么菜一样,所以真正识别这个人并不重要。
您在购物过程中关心的就是我们关心的。
这听起来很酷,但并不是硬性要求,可能很难大规模推广。
余凯:对于用户来说,他们去商场的时候,可能想知道大家对这个产品的评价如何。
这对你来说不一定是刚需,但对某些人来说却是刚需。
例如,我们预测您确实需要这些产品并向您推荐它们,同时这些产品正在打折。
这对你来说不是刚需,但对某些人来说却是刚需。
或者也许给你推荐的产品没有在售,只是你之前没有想到,但是看到之后却非常喜欢。
以亚马逊为例,其产品销量的 30% 是顾客在访问该网站之前不想购买的商品。
再比如,前段时间去陕西博物馆,买了一台导游机。
听介绍之前还要输入号码信息,非常麻烦。
您是否与合作商家共享数据?余凯:这个还在沟通过程中,但是双方数据基本是共享的。
百度眼是你的测试吗?余凯:百度眼并不是在试水。
几年后某种设备肯定会成为主流。
它知道您在做什么并非常清楚地帮助您。
可能不是百度做的,可能是某家公司做的,但我们希望是百度做的。
百度自动驾驶汽车和无人机项目的核心也是百度大脑。
百度眼只是一个模块,它的重点是什么?余凯:百度大脑是一种智能能力,但这种能力必须通过物理实现来延伸。
传统上,所有的互联网服务都是完全在线的虚拟服务,但这是不完整的。
比如说我点了一份披萨,如果你在信息世界里完全颠倒过来,这个披萨就不会发生。
一定是这个人利用这些信息来做披萨,而且一定是真人骑自行车或者开汽车来送。
你的家,所以未来一定是一个虚拟世界融入物理世界的过程。
互联网的最后一公里实际上是物理世界,未来可能会得到优化。
比如,我有几千个参数,知道你需要什么,但披萨店的人不知道,无法做出个性化的披萨;但如果机器人做披萨,这些参数就起作用了:你需要放多少调味品等等。
最后,披萨送到你家的效率如何?它很可能是一辆送到你家的无人驾驶汽车。
会向开发者开放吗?余凯:向开发者开放可能是以后的计划,但我还没有考虑过。
一开始我们选择了有价值的垂直行业,重点优化百度眼的交互体验。
如果我们完全公开地做,我们认为这不是最好的推广方式。
还有,如果我们以后把这个东西开放给开发者的话,就会有一个价格的问题。
我们现在的2B模式不涉及价格,绝对是免费的。
如果说到价格的话,未来我们会和更广泛的应用场景合作,价格肯定会很便宜。
百度眼现在的交互方式有点傻。
余凯:我们刚开始设计的时候有一个原则,就是一定要轻交互。
它不是语音助手。
它必须给用户一个明确的期望,即他们将要发言。
Siri最大的失败在于它给了用户过高的期望。
它想象着它可以告诉你百度股票有多少,今天有没有上涨。
你可以用多种方法来询问一件事。
如今的人工智能,Siri还达不到这个水平。
我们只是给你一些指导性的东西,你可以打开并检查。
所以一定是轻交互。
接下来,如果语音反馈太长,我们会对其进行限制,并将长语音显示在手机上。
但我们还没有到那一步。