文章|海中天 如果你命令 Siri 设置早上 5 点的闹钟,它就会设置早上 5 点。
如果你问她吃什么止痛药可以让你的胃不疼,她会无言以对,因为情况实在是太糟糕了。
复杂的。
Siri距离计算机科学家所描述的“自然语言理解”还很远,尽管苹果在电视广告中将她描绘得异常出色,但她实际上无法真正理解人类语音的“自然形式”。
我们根本不能称 Siri 为“她”。
Siri的个性只是一个营销噱头,是苹果自己炮制出来的,不太具有说服力。
虚拟助手永远无法模拟人类吗?不。
科技巨头、初创公司和大学的许多研究人员正在推动计算机实现真正理解自然语言的目标。
随着技术变得越来越先进,深度神经网络发挥着重要作用——该网络可以连接硬件和软件来模拟大脑的神经网络。
谷歌是深度神经网络研究领域的领导者。
它已将该技术应用于搜索引擎和Siri风格的Andorid语音助手。
今天,谷歌向业界发出了一个信号:深度神经网络将在未来发挥非常重要的作用。
谷歌正在开放构成自然语言研究基础的软件,并与世界分享。
在科技界,这一策略效果很好。
公司放弃一些重要成果来推动市场前进。
这个开放软件叫做SyntaxNet,它的语法解析器在神经语言学研究人员中相当有名。
SyntaxNet 使用神经网络来解析句子,试图理解每个单词的作用以及组合的含义。
系统试图确定潜在的语法逻辑——什么是名词,什么是动词,主语是什么,它与宾语如何相关——最终,系统使用这些信息来提取句子的主旨,但是它使用机器可读的方法来做到这一点。
形式来提取。
指导公司自然语言理解工作的谷歌研究总监费尔南多·佩雷拉(Fernando Pereira)表示:“与深度学习之前的时间相比,现在的准确性大大提高了。
”据他估计,该工具已经使公司的错误率降低了20%到40%。
谷歌以外的一些研究人员认为,与竞争对手相比,SyntaxNet 可能并不是一个巨大的飞跃,但它肯定是同类系统中最先进的。
谷歌发布了研究报告以告知其研究工作。
华盛顿大学计算机科学教授、自然语言理解专家诺亚·史密斯表示:“报告的结果非常好,它让我们的研究向前推进了一点。
很多人还在继续研究这个问题。
”最有吸引力的可能性是谷歌继续开放类似的工具。
通过共享SyntaxNet,谷歌的目标是加速自然语言研究的进展。
当时还开放了软件引擎TensorFlow,可以加速AI研究。
谷歌开放的目的大体是一样的。
毫无疑问,通过像SyntaxNet这样的技术,谷歌希望让计算机能够进行真正的对话。
在同一领域与谷歌竞争的是苹果的Siri,以及其他计算机系统,谷歌希望全世界都知道它的技术有多优秀。
让数字助理无处不在 谷歌并不是唯一一家开发个人虚拟助理的公司。
微软已经有了数字助理 Cortana,亚马逊也凭借其语音驱动的 Echo 取得了成功。
参与竞赛的初创公司也有很多,比如最近推出的 Viv,这是一家由 Siri 的设计师创立的公司。
Facebook 的野心更大,推出了 Facebook M。
虽然许多明星公司都在努力解决这个问题,但数字助理和聊天机器人还远未达到完美。
为什么?因为处理自然语言理解的底层程序还远非完美。
Facebook M 部分依赖人工智能,但更多依赖真人来协助完成复杂的任务。
谷歌研究主管佩雷拉表示:“我们距离这一目标还很遥远。
”事实上,佩雷拉将 SyntaxNet 描述为迈向更大目标的垫脚石。
Pereira认为,句法分析只是基础,还需要很多其他技术才能让SyntaxNet输出结果并真正理解含义。
谷歌开放该工具的部分原因是为了激励社区超越句法分析。
佩雷拉说:“我们希望鼓励研发社区以及每个致力于自然语言理解的人超越语法,转向更深入的语义推理,这是必要的。
” “我们只是想告诉他们:‘不要担心语法分析,你可以把它当作一份礼物,现在你可以探索更难的问题。
’”进入深度神经网络 使用深度神经网络,SyntaxNet 和类似的系统可以将语法分析提升到一个新的水平。
神经网络可以分析大量数据。
在 SyntaxNet 中,神经网络可以分析数百万个句子以理解句子的含义。
人类仔细地标记句子,仔细检查示例,并仔细确定每个单词所扮演的角色,通过分析所有标记的句子,系统可以识别其他句子中的相似特征。
虽然 SyntaxNet 是工程师和人工智能研究人员的工具,但谷歌还共享了预先构建的工具。
谷歌称其为 Parsey McParseface,是专门针对英语进行训练的自然语言处理服务。
谷歌表示,当使用 Parsey McParseface 识别单词与句子其他部分之间的关??系时,准确率高达 94%。
该公司认为这一准确率非常接近人类的准确率(96-97%)。
史密斯认为,由于《华尔街日报》说话的方式,类似的数据集是有限的。
“这是一种非常特殊的语言,”史密斯解释道。
“它与人们理解的大多数语言不一样。
”研究人员希望最终能够利用更广泛的数据(直接来自互联网)来训练系统。
但训练过程比较困难,因为人类在互联网上使用徐言的方式太多了。
当谷歌在此类数据集上训练自己的神经网络时,准确率下降至 90% 左右。
研究还有很长的路要走,训练数据也不好。
问题的难度增加了。
史密斯还表示,对英语以外语言的研究还没有走得太远。
换句话说,数字助理要像我们周围的真人一样行事尚不现实,但我们正在实现这一目标。
谷歌研究总监佩雷拉表示:“我们距离在系统中实现类人能力还很遥远,但我们正在开发更精确的技术。