当前位置: 首页 > 数码发展

苹果为 Siri 引入机器学习技术,不再认错主人

时间:2024-02-21 16:33:33 数码发展

日前,苹果在自己的机器学习刊物《Apple Machine Learning Journal》上发表了最新文章,主要讲的是用户激活“Hey Siri”时的人性化iOS 设备上的函数进程。

这篇文章似乎还意味着未来的 iOS 系统将配备更先进的 Siri 智能个人助理,它至少可以利用机器学习功能非常准确地识别设备的所有者。

“Hey Siri”功能首先在搭载 iOS 8 的 iPhone 6 上推出,现在在所有 Apple 设备上,“Hey Siri”密码可激活设备上的智能个人助理。

当然,在6s之前,设备仍然需要插上电源才能使用。

不过,现在的新款iPhone和iPad,“Hey Siri”可以全天待机,不用打开屏幕、不用插电源就可以使用。

因此,在密码激活后,用户可以跟进查询或执行相关语音命令,例如询问“今天天气怎么样?”等问题。

在机器学习杂志的这篇新文章中,Apple Siri 团队描述了引入“说话人识别系统”的技术方法,声称为了为用户创造更加人性化的设备,Apple Siri 团队创建了一个“深度神经网络” ”,而此举将为 Siri 的迭代更新奠定基础。

简单来说,苹果基本确认的是,在未来版本的iOS中,机器学习技术将被引入到Siri智能个人助理中,以识别设备所有者的声音。

苹果的 Siri 团队表示,他们最初选择“Hey Siri”这个短语是因为这是一个非常“自然”的短语。

但也正因为如此,“Hey Siri”经常会在不经意间被激活,从而引发不少麻烦。

苹果列举了三种情况,包括:“当一个用户说类似的短语时”、“当另一个用户说‘嘿 Siri’时”和“当其用户说类似的短语时”。

根据 Siri 团队的说法,最后一种情况是“错误激活是最烦人的”。

为了降低 Siri 被误激活的风险,苹果引入了来自说话人识别研究领域的技术。

关键是,Siri 团队表示,他们关注的是“谁在说话”,而不是“正在说什么”。

苹果表示,说话人识别技术的目标是确定声音说话者的身份。

“我们感兴趣的是‘谁在说话’,而不是语音识别的问题。

最终目标是确定‘说了什么’。

”Siri 团队表示,目前说话人识别技术面临的其他挑战是如何获得更高的识别率在混响(例如大房间)和嘈杂环境中的质量性能。

未来,通过机器学习,Siri语音助手将被训练在各种环境中识别用户的声音,例如在汽车、厨房、咖啡店或类似的公共场所。

Siri还会学习识别用户在各种情况下的声音状态,包括正常的声音、高亢明亮的声音,或者早上起床感到昏昏沉沉时的声音等等,并且不限于前几次重复声音。

“嘿 Siri”。

近期,Siri隐私漏洞问题备受关注。

由于此漏洞,任何人都可以通过 Siri 读取设备所有者的通知。

只需按住 iPhone X 上的 HOME 按钮或侧边按钮几秒钟,呼出 Siri,并将其命名为“为我阅读通知”。

锁屏隐藏消息内容将直接读取。

无论是同事、家人,甚至是路人,都可以执行相同的操作,而这就是设备锁定时的情况。

显然,苹果在 Siri 中使用机器学习技术来帮助识别设备所有者将解决 Siri 面临的隐私问题。