当前位置: 首页 > 科技赋能

可穿戴设备的痛点是语音交互

时间:2024-05-22 15:04:48 科技赋能

大型机——个人电脑,计算设备的第一次形态变革,导致以前国家/企业科研机构使用的计算机首次在消费电子市场迎来井喷式增长时间 。

个人电脑-智能手机,第二种形式的变化,计算设备再次出现令人难以置信的几何增长。

以此类推,第三种形态变革,智能手机-可穿戴计算设备,我们是否正处于第三次疫情爆发的前夜?每一次计算设备的爆发都不是没有预兆,而是有痕迹可循:(1)大型机-个人电脑-智能手机,机器尺寸由大变小。

由此,应用场景从少数增加到众多,计算设备的覆盖范围和使用频率也随之增加。

(2)键盘输入+纯代码编程语言——键盘+鼠标+图形界面Windows系统——触摸交互+更直观的移动操作系统,人机交互难度直线下降。

由此,计算设备从复杂、困难变为简单、友好,更多领域的更多人和公司/组织开始使用它。

计算设备的质变伴随着尺寸的缩小和人机交互难度的降低。

是不是可以说,只要满足必要条件(1)和(2),我们很快就会见证下一代计算设备——可穿戴计算的爆发。

体积小到可以直接佩戴的智能眼镜和智能手表可以更轻松地输入信息、完成计算和反馈结果,进一步增加了人们使用计算设备的场合和频率。

然而,计算形态的每一次改变,不仅仅是身体变小,更是交互门槛的降低、交互效率的提升。

而后者似乎才是决定其能否大规模进入消费市场的关键。

例如,在20世纪90年代末和20世纪初,平板电脑和手持PDA已经诞生。

但由于抄袭桌面Windows系统,采用物理按键/手写笔操作,人机交互体验较差,并未成为市场主流计算产品。

那么可穿戴计算设备应该采用什么样的交互技术呢?触摸交互应该继续吗?显然这是愚蠢的。

像Google Glass智能眼镜、Galaxy Gear智能手表这样的可穿戴计算设备,屏幕都比较小,触摸交互过于局促和别扭,体验太差。

我们现有的人机交互方式有打字、触摸、语音、体感等。

显然,语音和体感是最简单、最友好的。

谷歌眼镜向我们展示了眨眼操作和自然的语音命名。

智能手表也是如此。

未来,人们还可能加入体感操作。

不过,无论是语音交互还是体感操作,目前技术的发展现状都不太乐观。

图像体感需要两个以上的摄像头才能准确识别。

它对光线、软件算法、相机硬件配置都有要求,使用条件也比较苛刻。

语音识别非常适合可穿戴计算设备,但自然语言识别非常复杂且困难,涉及人工智能、深度神经网络和机器学习。

类似于这样一句简单的中国话“冬天:能穿多少就穿多少;夏天:能穿多少就穿多少”。

两个相同的句子可以有不同的解释。

其背后是字面信息理解、语境分析、词句分离、识别。

认知模型在大脑中建立了一系列高度并行的处理过程。

在科学研究领域,心理学中的意识、脑科学中的智能、物理学中的引力、数论中的素数。

我们习惯的更简单、更直观的事物背后,还有更复杂的集合,可能有几十个。

几年甚至上百年都很难取得重大突破。

iDoNews认为,当前“疯狂”的微软小冰在微信和微博上的闹剧,是当前人工智能发展现状的一个缩影。

可穿戴计算设备是未来,这是正确的。

然而,直到以语音识别为代表的人工智能真正变得“智能”之后,可穿戴计算设备才会改变世界。