欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

语音识别技术

科普小知识2022-10-16 21:21:56
...
语音识别的研究工作始于20世纪50年代,当时AT&T贝尔实验室实现了第一个语音识别系统——AUDRY系统,它能识别10个英语数字。20世纪60年代,计算机的应用促进了语音识别的发展。这一时期的重要成果是引入了动态规划和线性预测分析,后者解决了语音信号生成模型的问题,对语音识别的发展产生了深远的影响。20世纪70年代,语音识别领域取得了突破。在理论上,线性规划技术得到了进一步发展,动态时间规整(DTW)技术基本成熟,特别是矢量量化(VQ)和隐马尔可夫模型(HMM)理论的提出。在实践中,实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。20世纪80年代,语音识别的研究更加深入,其突出特点是隐马尔可夫模型和人工神经网络在语音识别中的成功应用。HMM模型的广泛应用应归功于AT&T贝尔实验室的Rabiner等科学家的努力,他们设计了原本困难的HMM纯数学模型,以便让更多的研究人员了解和理解它。基于人工神经网络和隐马尔可夫模型的语音识别系统具有相同的性能。进入20世纪90年代,随着多媒体时代的到来,迫切需要语音识别系统从实验室走向应用。许多发达国家,如美国、日本、韩国、IBM、苹果、AT&T、NTT等著名公司都在语音识别系统的实际开发和研究上投入了巨额资金。中国的语音识别研究一直紧跟国际水平,国家也非常重视。鉴于中国未来的巨大市场,国外也非常重视汉语语音识别的研究。美国、新加坡等地聚集了一批来自*、*、香港等地的学者,他们的研究成果达到了相当高的水平。因此,除了加强理论研究,中国还应加快从实验室示范体系向商品转化。语音识别系统可以用不同的方式分类。(1)根据说话人说话风格的要求,可分为孤立词(词)语音识别系统、连词语音识别系统和连续语音识别系统。(2)根据对说话人的依赖程度,可分为特定人和非特定人语音识别系统。(3)根据词汇量的大小,可分为小词汇量、中词汇量、大词汇量和无限词汇量语音识别系统。不同的语音识别系统有不同的实现细节,但是使用的基本技术是相似的。语音识别技术主要包括特征提取技术、模式匹配准则和模型训练技术。此外,它还涉及到语音识别单元的选择等问题。