当前位置: 首页 > 科技赋能

更加“主动”、“乖巧”的Siri能否成为语音交互的最新引擎?

时间:2024-05-22 12:24:50 科技赋能

一直被诟病“不好用”的Siri,还一度因HomePod的发布而受到更差的评价。

作为一款“智能音箱”,HomePod的音质几乎得到了所有人的一致好评,但代表其“智能”部分的Siri却表现不佳。

近两年,当亚马逊和谷歌两大巨头将智能语音助手之战变成军备竞赛时,Siri 却始终没有存在感。

与 Alexa 和 Google Assistant 相比,Siri 经常被用户批评为“听不懂、做不到”,整体命令识别成功率较低。

同时,Siri的第三方开发生态系统并不像Alexa和Google那么丰富,用户很难通过向Siri发出指令来获取第三方服务。

但这一次,苹果不想让用户再等了。

就在各种批评尚未消散时,苹果在 WWDC18 上提交了 Siri 的答卷。

苹果为Siri系统带来了一个新的自动化工具:Shortcuts,这相当于给Siri配备了新的引擎。

快捷方式可以让用户根据自己的需求绑定指令和动作,也可以让Siri更详细地了解用户的需求并主动提出建议。

通过Shortcuts,苹果希望让Siri能够理解用户指令,访问尽可能多的服务,并最终融入丰富而广泛的iOS开发生态系统。

搭建 Siri 与第三方应用之间的桥梁 这并不是苹果第一次努力开放 Siri。

2016 年 WWDC 上,苹果发布了 SiriKit。

这是苹果首次向第三方开发者开放Siri,希望用户能够使用Siri访问更多第三方服务。

开发者可以根据自己的App功能定义命令,然后苹果会将这些命令集成到Siri中。

当用户的语音命令包含正确的触发词时,App中的功能将被触发。

但这个功能一直存在一个隐患。

自然语言中的关键词极其有限。

如果“打车”、“订餐”等几个重要关键词被少数开发商控制,这将比“域名争夺”更可怕。

因此,苹果公司在此事上一直保持着谨慎的态度。

对于 SiriKit,苹果最初只开放了包括短信和通话在内的六种服务,允许开发者访问。

虽然苹果随后开放了一些服务,但真正能够接入 SiriKit 的 App 却少得可怜。

另一方面,即使是连接到 SiriKit 的应用程序,用户也很难顺利使用它们,因为开发者定义的命令与大多数用户发出语音命令的方式并不广泛兼容。

不过苹果并没有放弃在这方面的努力,正在认真思考如何在开放Siri的过程中发挥自身的优势。

去年3月,苹果宣布收购Workflow。

基于通用URL系统(包括所有URL和URLscheme)。

iOS 上这个著名的自动化应用程序允许用户将不同的指令和操作连接在一起以编写自动化操作。

被苹果收购后,Workflow在iOS商店的价格由之前的18-45元变为免费,整个开发团队得以加入苹果。

当时,人们普遍认为苹果希望基于 Workflow 为 iOS 创建一款类似于 macOS 上的 Automator 的生产力工具。

但苹果显然正在思考更深层次的问题。

苹果收购Workflow后,将整个团队整合到Siri团队中。

一年多来,这个新整合的团队在Workflow的基础上开发了Shortcuts。

在智能钥匙扣应用程序中,制作钥匙扣环成为一种意图。

脱胎于Workflow的Shortcuts,在“第三方服务接入”上实现了质的飞跃。

任何开发者都可以在他或她的App中定义一些称为“Intention”的动作:例如,如果用户使用星巴克App点咖啡,星巴克开发团队可以将“点咖啡”的动作定义为Intention。

这些意图最终可以由用户手动添加到 Siri 中。

应用程序开发人员不再需要考虑“用户将使用哪些关键字来触发我的服务?”相反,他们只需要总结和细化用户在自己的应用程序上执行的操作并将其连接到快捷方式。

快捷方式使任何 iOS 开发人员都可以轻松地将他们的应用程序连接到 Siri 以满足用户需求。

它相当于一座桥梁,将丰富庞大的iOS应用生态系统与不完善的Siri连接起来。

当Alexa和Google Assistant都试图将自己的语音助手打造成一个独立的平台并吸引新的开发者时,苹果则试图利用iOS本身的优势来完成一次超越。

Siri 的主动推荐有更丰富的细节。

2016年,随着iOS9的出现,苹果推出了“ProactiveSiri”(Siri主动推荐)功能。

苹果希望Siri不仅仅是一个被动接受并执行指令的“语音助手”,更希望使其成为一个能够主动预测用户需求的智能个人助理。

通过Siri的主动推荐功能,用户会在特定的地点和时间在多任务界面上看到推荐的应用程序打开;连接汽车蓝牙后,iPhone会自动给出回家路线规划和行程预测; Siri 会自动识别它们。

常规日历项发生的地点可以提前预测交通状况,提醒您该出发了;插上耳机后,iPhone会自动推荐打开你常用的音乐或视频应用……但近两年,当Google Assistant和Alexa突飞猛进的时候,Siri的主动推荐功能并没有成为“杀手锏” “在iOS下,它甚至不为人所知。

这背后的一个重要原因是其对第三方应用程序的支持只能停留在“推荐用户打开应用程序”的非常浅层的水平。

它既无法从应用程序中获取更深层的信息,也无法深入下去。

应用程序内的特定行为。

其中,真正有意义的深度推荐都是基于苹果自己的应用程序,这极大地限制了Siri主动推荐的空间。

现在,苹果希望 Shortcuts 的出现能够彻底改变这一困境。

Siri 会自动分析您的需求并给出行动建议。

在 Shortcuts 中,开发者定义的“意图”将集成到 Siri 的主动推荐中。

开发者可以定义这个动作的关键参考元素,比如时间、地点……这样,当用户在后台执行这些动作时,iOS就会观察到关键参考元素。

例如,如果用户每天早上使用某个 App 点咖啡,那么 Siri 就会以通知的形式主动推荐用户在早上执行此操作。

用户只需点击锁屏界面,App就会收到指令并自动帮助点咖啡。

同时,这些快捷方式也会显示在 Apple Watch 的 Siri 表盘上,并且可以在智能手表上执行。

这种机制让 Siri 能够更细致地洞察用户需求,并提供更便捷的快捷方式。

更“贴心”的是,苹果在进行这一系列创新时,有意识地站在了用户一边。

它全面考虑了用户隐私问题:所有与用户需求相关的数据收集和处理均由iOS完成。

在本地执行时,开发者无法获取详细的用户行为数据。

让用户自己训练和教授 Siri。

除了自动推荐之外,苹果当然也没有忘记Siri最初的出发点——语音控制。

在iOS12之前,人们对Siri最大的不满并不是Siri听不懂他们在说什么——事实上,Siri大多数时候都能够相对准确地将声音转换成文字。

但将不同用户不同的自然语言习惯转化为正确的命令是Siri从未跨过的门槛。

在 Twitter 上,知名科技评论员 Mo 博士曾无情地抱怨 Siri 的命令理解能力:在控制音乐播放时,用户必须按照标准句型准确地说出歌曲名称、专辑名称和艺术家姓名。

只有Siri才能正确听懂你想听的话,否则很容易显得“人为弱智”。

自然语言处理几十年来一直是计算机领域的难题,也是智能语音助手想要真正进入更复杂的场景必须克服的巨大障碍。

现在,苹果在此事上做出了关键选择。

它不再完全让iOS团队或第三方应用开??发者决定Siri对自然语言的理解,而是赋予用户训练和教Siri“服从”的权利。

换句话说,用户现在可以将各种应用程序操作编入快捷方式,然后设置触发词来执行快捷方式。

一个典型的场景是,用户可以将三件事一起编程为一个快捷方式:“打开家里的空调”、“给家人发短信叫你晚上回来吃饭”、“打电话”优步之家”。

将 Siri 关键字设置为“下班回家”。

晚上离开办公室前,对 Siri 说“下班回家”,Siri 就会自动完成三个动作:打开空调、发短信、叫 Uber。

我们使用手机的方式非常复杂。

即使业界喊着语音优先,但语音交互真正能接管的场景也只是少数。

Shortcuts 要做的就是允许用户自定义设置并教授 Siri 复杂但可遵循的任务。

然后将一个非常复杂的过程变成只需语音命令即可完成的事情。

用户不再需要“不断尝试”Siri 能够理解的指令,而是可以将许多不同的操作变成像工作流程一样的“无触发”体验。

这种机制可以让 Shortcuts 在 Apple Watch 和 HomePod 上轻松触发,Apple Watch 和 HomePod 会向 iPhone 发送执行 Shortcuts 的指令。

它还使多语言 Siri 成为可能。

对于中国用户来说,需要使用多种语言是很常见的。

通过Shortcuts,可以通过自己设置Shortcuts来解决“中文Siri无法控制英文歌曲播放”等问题。

您可以使用中文命令控制英文播放列表和播客的播放,还可以使用英文命令触发中文应用中的订餐、打车和短信。

当我们都以为 Siri 作为“语音助手”被亚马逊和谷歌远远甩在身后时,苹果已经对 Siri 有了更深入的思考。

显然,苹果希望Siri超越语音助手的定位,成为能够听懂指令、主动了解用户需求的“全面AI助手”。

然而,实现这一目标是困难的,苹果过去几年的尝试并没有取得太大成功。

Shortcuts的出现,让开发者和用户都摆到了合适的位置,将一个雄心勃勃但有些虚幻的目标转变为更加实用的应用机制。

它让更多第三方服务有机会轻松访问 Siri,允许 Siri 在应用内调用更深层的操作,并允许用户主动控制这一点。

有了这样一个全新的引擎,Siri需要实现的目标不再“神奇”,而开始变得更加“实际”。

这可能是我们在 iOS 12 中看到的最令人兴奋的更新之一。