在全球范围内,智能音箱正在成为越来越多消费者家庭的新宠。
得益于以小米小爱音箱和阿里巴巴天猫精灵为首的众多国内智能音箱厂商,幸运的中国用户不仅赶上了这一趋势,而且不必面对许多国外科技爱好者所面临的问题。
困境 - 非英语地区的许多用户仍在等待智能扬声器理解他们的语言。
这听起来可能令人难以置信。
智能音箱可以控制智能家居、回答问题、安排日程,却听不懂常用语言?但这确实是事实。
上周,Google Home 发布了西班牙语语言包。
仅仅发布一个新的语言包听起来可能并不算多,但在此之前,Google Home 花了近两年的时间来学习西班牙语。
至于市场份额最大的亚马逊Echo,目前还无法学习西班牙语。
它只懂三种语言:英语、德语和日语。
为什么教智能音箱通用语言需要这么长时间?其背后的原因之一是语言远比单词复杂和多样。
生活在不同地区的人们可能使用相同的书面语言,但他们的口音却可能有很大差异。
对于发音特征较为鲜明、使用者较少的方言,绝大多数厂商表示暂时无能为力。
因此,培养机器的语义理解能力对于所有智能音箱厂商来说都是一个巨大的挑战。
厂商需要在用户使用过程中积累大量的语音数据,优先排序,让说话者学习,然后慢慢理解以前听不懂的句子。
相比之下,直接键入的文本可以很容易地被机器转换成有意义的信息。
也正是因为如此,文本翻译软件才能游刃有余地处理小众的苏格兰高地语言,而 Google Home 则花了近两年的时间才学会了广泛使用的西班牙语。
火狐开发者 Mozilla 机器学习负责人凯利·戴维斯 (Kelly Davis) 认为,即使你理解句子中的每个单词,也不意味着机器理解该语言。
问候亲密的朋友和普通的熟人有什么区别?笑话在语言中是无害的吗?为了让智能音箱学习语言,还需要教会它深入理解语言背后的文化含义。
另一个原因是智能音箱厂商优先考虑商业因素。
不难理解,厂商优先在用户数量多、消费能力强的地区开发语言包,以抢占利润更高的市场。
但这样的选择也意味着失去许多母语是这些被低估的语言的潜在用户。
仍以西班牙语为例。
据维基百科统计,截至2008年,全球以西班牙语为母语的人数达到4.77亿,全球有23个国家和地区以西班牙语为官方语言。
在美国,西班牙语是第二广泛使用的语言,数百万人将其作为在家中的主要语言。
由于西班牙和拉丁美洲的足球水平很强,西班牙语是全世界球迷最流行的语言之一。
仅在美国就有20多个西班牙语体育频道或体育网站。
然而,在Home支持西班牙语之前,智能音箱甚至无法理解用西班牙语提出的最简单的足球问题,也无法连接到互联网上丰富的西班牙体育资源。
为了收复前期战略放弃的失地,厂商们正在奋起直追。
谷歌计划今年推出超过 30 种语言的 Google Home。
亚马逊在 Amazon Echo 中添加了 Cleo 功能,鼓励用户向语音助手 Alexa 教授更多语言。
添加更多语言包的意义不仅仅在于盈利。
戴维斯说,很大一部分少数民族语言使用者来自欠发达地区,受教育程度较低,甚至可能不会读写。
以前的电子产品都是文字化的,操作复杂,让这群人很难享受到科技发展的便利。
以语言作为交互方式且易于使用的智能音箱或许能够真正进入并改变他们的生活。
总而言之,智能音箱目前还不是语言音箱,但未来它能听懂更多语言,值得期待。