计算机语音识别率首次媲美人类
科普小知识2022-01-30 04:47:12
...
中新网10月28日电(记者蒋敬)根据麻省理工学院网站上最近的一份报告,微软雷德蒙研究所开发了一种机器学习算法,这种算法可以将计算机对特定主题对话的语音识别率提高到94.1%,这是第一次与人类水平相比。亲友间日常对话的识别率达到88.9%,甚至略高于人类。
国家标准和技术研究所在2000年发布了一个数据库来帮助解决语音识别问题。该数据库包含个人之间关于既定话题的电话录音,而其他则是亲戚和朋友之间的随意对话。
结果表明,人类抄写语言的错误率约为4%,即每100个单词中,人类抄写4个单词是错误的。过去,机器的性能远非如此。今天,当计算机将个人之间某个话题的谈话内容转录成单词时,错误率为5.9%,而当计算机将亲戚和朋友之间任何话题的随意谈话转录成单词时,错误率为11.3%。“这比预期的要好。”微软研究员茨威格说。
然后,茨威格基于不同层次的卷积神经网络优化了自己的深度学习系统,使系统的每一层都能识别语音的不同方面。然后,他们使用训练数据作为标准来设置机器,以便识别普通语音,并使他们能够适应测试数据库。
总的来说,微软的语音识别系统与人类有相似的错误率,但是它引起的错误类型与人类有很大的不同。微软机器最常见的错误是混淆反馈声音。相比之下,人类很少犯这样的错误。对此,茨威格认为,原则上,机器没有理由不能通过训练识别反馈声音。该误差可能与噪声在训练数据集中的标记方式有关。
微软研究人员表示,计算机语音识别能力正在超越人类水平,“对计算机行业来说,这与图形用户界面一样重要”,包括Xbox等消费娱乐设备、即时语音到文本等辅助工具,以及“小娜”等个人数字助理。
推荐阅读