当前位置: 首页 > 科技赋能

语音控制!企业计算的下一个重大突破

时间:2024-05-22 19:27:54 科技赋能

如果说2018年iPhone的发布开创了过去十年消费者信息传输以屏幕和视觉为主的时代,那么语音将成为企业下一个最大的颠覆智能手机之后的科技世界。

各种设备和语音助手的涌现,如苹果的 Siri、谷歌 Assistant、微软的 Cortana、三星的 Bixby 和亚马逊的 Alexa,反映了一种变化的趋势:越来越多的用户开始依赖屏幕视觉。

传达,转向使用语音来提供和接收信息。

Strategy Analytics分析师表示,智能音箱已成为近年来增长最快的新硬件市场。

到 2020 年,63% 的美国家庭至少拥有一台智能音箱,而 2017 年这一比例为 0.03%,2018 年为 16%。

语音技术在企业市场潜力巨大 过去几十年,计算机交互慢慢变得更加自然,技术已经成熟,慢慢地从打孔卡发展到键盘再到电脑鼠标。

如今,触摸界面已成为几乎所有带屏幕设备(从相机到汽车)的默认标准。

现在也是在科技领域迈出另一大步的时候了:与公司的设备对话。

至少在许多电影中,人类已经能够与计算机对话,从《钢铁侠》中的贾维斯到《星际迷航4:暗黑无界》中斯科特试图向 80 年代的计算机发出指令的著名场景。

尽管手机上的语音助手已经存在多年——苹果公司的 Siri 于 2011 年问世。

但到目前为止,它们对企业环境的影响还很有限。

现在,计算能力和机器学习的进步使计算机能够比人类更好地转录语音,然后准确地翻译它,而不需要繁琐的编码。

而且新系统可以更有效地自我更新并从错误中学习,而不需要人类的明确指导。

支持语音的设备数量也在持续猛增,预计今年销量将超过 10,000 台,预计到 2020 年全球语音技术产业将达到 1 亿美元。

对于工人来说,语音接口提供了许多实际好处,尤其是与笨重的移动键盘相比。

今年早些时候,美国斯坦福大学、华盛顿大学和百度大学进行的一项研究发现,移动设备上的语音输入速度几乎比打字速度快三倍,两种输入方式之间的错误率是没什么不同。

语音接口的最大好处之一是可以为企业业务系统提供“万能远程控制”。

谷歌已经证明,语音可以用来将计算机连接到基于人的系统,例如在美发沙龙进行预约。

这种联系在企业界更有意义。

由于每个大型组织都有许多不同的应用程序,因此在它们之间提供一致的工作流程通常需要编码,这可能很慢且昂贵。

但如果所有系统都支持语音,工作人员就可以轻松地从一个系统切换到另一个系统,而无需任何显式集成。

此外,企业系统可能会开始相互通信。

在计算领域实施通用标准非常困难,而使用语音(尽管其效率明显低下)可能是实现系统集成的非常实用的短期解决方案。

事实上,我们已经在消费市场看到了这一点,最近有消息称亚马逊的 Alexa 现在可以与微软的 Cortana 进行“对话”,反之亦然。

所有这些进步意味着为各种业务活动提供聊天和语音界面的企业数字助理正在成为主流。

语音也成为创新服务方式的一部分。

例如,Workheld 提供创新的现场管理系统,以提高施工和服务流程的生产力。

该公司使用机器学习和文本分析自动将客户工作与最合适的技术人员匹配,并提供免提语音界面来帮助员工完成维护步骤。

不容忽视的威胁 当然,当前的语音界面还存在一些问题,例如,在背景噪音很大的繁忙办公室中使用起来可能会很困难。

科技公司正在研究解决方案:例如,使用人工智能进行更先进的降噪、在人群中识别出你的声音、唇形识别,甚至直接通过你的下巴检测你的话语。

你不需要大声说出来。

然而,这也带来了一些潜在的危险。

例如,所有这些麦克风都为非法窃听和个人跟踪提供了充足的机会。

像乔治那样?正如奥威尔在《》中所写:“隐藏的麦克风总是存在危险,你的声音可能会被接收和识别”。

当算法可以创建极其准确的合成语音时,如何通过语音接口加强企业安全?如今,不少企业“语音诈骗”都凸显了一个问题:如果企业CEO独特的(但却是假的)声音接入系统,要求银行进行异常电汇,会发生什么?或者,更现实地说,如果您十几岁的女儿(假的,但声音相同)打电话给您并说她遇到了麻烦并且需要钱怎么办? !总体而言,今年企业中的语音应用程序应该会出现巨大的飞跃,主要是通过与聊天机器人界面的可选语音交互。