MicrosoftWindows95语音识别零在未来五年内实现完美识别挑战之一是让系统识别用户实际说的话。这实际上一直是一个挑战,尤其是世界上有这么多语言和方言。而微软其实已经在这个市场上拼搏了20多年。 微软语音工程师、资深科学家黄学东在接受采访时表示,微软对这一市场的投入始于20年前的Windows95,但当时语音识别的错误率接近100%。也就是说,当时的系统几乎无法听懂你说的每一个字,所以当时几乎不可能用语音控制电脑。 但是后来,这项技术有了长足的发展,语音识别技术的准确率随之提高了20%。在黄学东看来,这意味着在不久的将来,0%的错误率是完全可以实现的。 他预测:“在未来的4-5年内,计算机将能够达到与人类相同的水平。”其实这方面最大的挑战不是计算机能不能听懂人说的每一个字,而是理解人说的是微软目前在Cortana上关注的核心。 也就是说,5年后,我们仍然可以用手机通话,但情况可能仍然不是特别好。黄学东表示,微软已经明确这是努力的方向,在ProjectOxford和MicrosoftAzure的帮助下,Cortana将在未来几年内成为语音识别系统的先行者。
