计算机语音识别率首次媲美人类

科普小知识2022-01-30 04:47:12

...

中新网10月28日电(记者蒋敬)根据麻省理工学院网站上最近的一份报告，微软雷德蒙研究所开发了一种机器学习算法，这种算法可以将计算机对特定主题对话的语音识别率提高到94.1%，这是第一次与人类水平相比。亲友间日常对话的识别率达到88.9%，甚至略高于人类。

国家标准和技术研究所在2000年发布了一个数据库来帮助解决语音识别问题。该数据库包含个人之间关于既定话题的电话录音，而其他则是亲戚和朋友之间的随意对话。

结果表明，人类抄写语言的错误率约为4%，即每100个单词中，人类抄写4个单词是错误的。过去，机器的性能远非如此。今天，当计算机将个人之间某个话题的谈话内容转录成单词时，错误率为5.9%，而当计算机将亲戚和朋友之间任何话题的随意谈话转录成单词时，错误率为11.3%。“这比预期的要好。”微软研究员茨威格说。

然后，茨威格基于不同层次的卷积神经网络优化了自己的深度学习系统，使系统的每一层都能识别语音的不同方面。然后，他们使用训练数据作为标准来设置机器，以便识别普通语音，并使他们能够适应测试数据库。

总的来说，微软的语音识别系统与人类有相似的错误率，但是它引起的错误类型与人类有很大的不同。微软机器最常见的错误是混淆反馈声音。相比之下，人类很少犯这样的错误。对此，茨威格认为，原则上，机器没有理由不能通过训练识别反馈声音。该误差可能与噪声在训练数据集中的标记方式有关。

微软研究人员表示，计算机语音识别能力正在超越人类水平，“对计算机行业来说，这与图形用户界面一样重要”，包括Xbox等消费娱乐设备、即时语音到文本等辅助工具，以及“小娜”等个人数字助理。

上一篇：海平面上升致NASA放弃部分发射中心择址重建

下一篇：天文学家首次观测到神秘的“宇宙网状体”