谷歌语音搜索于2008年推出,4年后实现了通过关联“知识图谱”来回答用户问题的功能,包括关于人的信息,地方和物体。回答简单的问题,例如“斯坦·李多大了?”然后被实施。之后,它学会了根据对同一个词的不同解释结合上下文来回答问题。当用户问“螺丝刀里有什么成分?”时,谷歌知道这里的“螺丝刀”不是螺丝刀而是饮料。搜索引擎在自然语言处理能力上的提升是一点一点积累起来的,一步登天难。最近,谷歌又取得了进展,已经可以通过文本或语音识别“高级”、“基于时间”的查询和一些复杂的组合问题。顶级:当你的问题包含“最高”和“最大”等顶级词时,谷歌可以给出具体的答案。例如:谁是小牛队最高的球员?(谁是小牛最大的球员?)德州最大的城市有哪些?(德克萨斯州最大的城市在哪里?)基于时间点的问题,例如:TaylorSwift在2014年录制了哪些歌曲?(TaylorSwift在2014年发行了哪些歌曲?)1965年新加坡的人口是多少?(新加坡1965年人口)更复杂的组合问题也可以回答,例如:天使队赢得世界大赛时美国总统是谁?不同的关键字,然后组合在一起。以上问题中,需要将问题拆解为“世界总统名单中的美国总统”、“Angels是一支棒球队”、“各职业棒球冠军名单”、“Angels是哪一年夺冠的”,从而得到最终的结果——小布什。在此之前,如果你问谷歌相关问题,你得到的结果只是一些关键词的搜索结果,你并不能真正理解你在问什么。最近的更新真正意味着它具有语义分析和搜索能力,这对人类来说可能看起来很简单,但在人工智能技术中实现起来并不容易。但是,这个功能还不完善,仍然会给出一些不是用户需要的答案。例如,当用户询问“谁是电影中达科塔约翰逊的母亲?”时,谷歌会显示她现实生活中的母亲,但用户实际上想找到在电影中扮演阿纳斯塔西娅母亲的詹妮弗艾莉♂。即便如此,谷歌在这项技术上仍然领先于竞争对手。要知道,其他竞品往往只有在你提出问题后才会弹出关键词搜索页面。然而,语音/文本搜索对谷歌来说不仅是学术上的挑战,还涉及其盈利的搜索业务。用户在移动端搜索的比例越来越高,谷歌的语音搜索必将成为核心竞争力。目前升级版的GoogleApp已经支持iOS、Android和Web,感兴趣的用户可以试用。
