当前位置: 首页 > 数码发展

微软语音识别系统的准确率已达到人类水平

时间:2023-12-20 12:15:16 数码发展

微软今天宣布其语音识别系统的错误率为5.1%,是迄今为止的最低水平。   这超过了微软人工智能和研究团队去年实现的 5.9% 错误率,并且与专业人类转录员一样准确。   这两项研究都转录了 Switchboard Corpus 的录音,该语料库收集了自 20 世纪 90 年代初以来研究人员在测试语音识别系统时使用的约 2,400 条电话对话。    这项新研究是由微软人工智能和研究小组的研究人员进行的,他们的目标是达到与人类转录员相同水平的准确性。

   总体而言,最新研究中的研究人员通过改进微软语音识别系统的神经网络声学和语言模型,能够将错误率降低约12%。   值得注意的是,他们还赋予语音识别器使用整个对话的能力,使其能够根据上下文调整转录,并预测接下来可能出现的单词或短语以及与人类交谈时的声音。   Microsoft 的语音识别系统用于 Cortana、Presentation Translator 和 Microsoft Cognitive 服务等服务中。