欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

同指纹一样,声纹识别准确率已超过99%

科普小知识2022-01-11 01:24:46
...

配音演员模仿别人的声音。虽然他们的听力相似,但他们不能模仿说话者最基本的特征。对声纹特征的分析仍然会有差异。

继“刷脸”之后,声纹识别也进入了我们的生活。最近,平安科技和金融一户通联合项目组与CGB签署了一项声纹验证项目,该项目将在防止欺诈和提供优质服务方面发挥作用。此前,市场监管总局和中国人民银行两部委发布文件,决定将支付技术产品认证扩展至金融科技产品认证,并确认了《金融科技产品认证目录(第一批)》,其中也包括声纹识别系统。

同指纹一样,声纹识别准确率已超过99%

那么,什么是声纹?会不会被模仿而导致识别装置的误判?

频谱、韵律和语言特征是不同的。声纹是独一无二的。

声纹是说话人说话时提取的一种生物特征。它可以用作说话者的表示和识别,可以与其他人区分的语音特征,以及基于这些特征或参数建立的语音模型的通用名称。声纹识别又称说话人识别,是一种从说话人发出的声谱图像中提取身份信息和声纹特征,将声音信号转换成电信号,并通过相关算法由计算机进行比较和识别的技术。

清华大学信息技术学院教授方正说,声音信号被描述为“简单而有意义”的原因是声音包含丰富的信息,如内容、身份、情感、年龄和健康状况。此外,人类语言的产生必须经历人类语言中心和发音器官之间复杂的生理和物理过程。从理论上讲,每个人在短期频谱、声源、时间动力学、节奏、语言特征等方面都有差异。说话的时候。因此,声纹像指纹一样是独一无二的。

与人脸识别、指纹识别和虹膜识别相比,声纹识别有许多优点。例如,声纹语料库是以自然的方式收集的,没有诸如眨眼、摆脸等特定动作。,并且不受光线或隐私等特定场景的限制,因此人们有较高的接受度。声纹识别可以随机改变阅读内容,即使语音信息被留在互联网或其他地方,也不容易被复制或盗用。“被识别的人不需要与识别设备密切接触,声纹可以通过电话、APP等渠道将语音传输到后台进行识别,在用户语音对话时自动完成识别,使用成本低、方便。”平安科技声纹领域的专家告诉《每日科学》记者。

同指纹一样,声纹识别准确率已超过99%

声音相似并不意味着声纹相似的识别准确率超过99%

登录手机银行应用程序并打开声纹验证。用户只要准确说出随机动态码,系统就会记录语音信息,验证声纹和随机动态码,就可以进行转账和支付等交易。目前,声纹识别已在一些银行使用。

然而,生活中有很多人有相似的声音,一些配音演员可以模仿别人的声音。使用声纹作为金融产品认证不安全吗?对此,平安科技的声纹专家解释说,一般来说,声纹是一种稳定的生物特征。除了生活中的某些年龄组,如少年变声期,声纹可能会发生变化,并且声纹特征在大多数情况下是稳定的。

由于每个人的发声器官的大小和形状不同,例如舌头、牙齿、口腔、声带、肺、鼻腔等。,以及年龄、性格、语言习惯等原因,发声器官在发音上各不相同,导致这些器官发出的声音必须各有特点。尤其是每个人的言语中包含的个人特征,如发音习惯,几乎是独一无二的。即使被模仿,他们也不能改变说话者最本质的特征。

因此,配音演员模仿别人的声音。虽然他们的听力相似,但他们不能模仿说话者最基本的特征。对声纹特征的分析仍然会有差异,这是可以区分的。”

根据计算结果,*部发布了《GA/T 1179-2014安全声纹确认应用算法技术要求及测试方法》标准,根据该标准,声纹技术产品进行数据采集。目前,如果用户根据指定的文本阅读内容,声纹识别准确率已经达到99.8%。如果不阅读指定的文本内容,随意说话,声纹识别准确率可以达到99.1%。“虽然准确率不低,但仍有误判的可能。在设计使用场景和过程时,需要考虑到声纹识别并非100%准确的现实。”平安科技的声纹专家表示,声纹作为一种金融产品认证,需要看具体场景。适用于辅助识别、列表识别、防欺诈、声波纹锁定登录等场景。然而,在大额支付的情况下,如果声纹被用作唯一的认证方法,则需要充分评估风险。

目前,除金融领域外,声纹正在进入公共安全、智能家居、智能教育、无线城市等行业,并根据不同应用场景的特点进行有针对性的开发。如果领取退休金的事件时有发生,要求老人在领取退休金前到现场核实他们的诚信是非常不方便的。声纹确认技术具有远程控制的特性。社保局可以通过预装的声波纹身份认证系统对养老金领取者进行远程身份认证,实现“信息更多,群众出行更少”。目前,相关试点项目正在贵州省黔东南州等地开展。

声纹识别技术发展的“三步曲”

声音作为身份认证手段的使用可以追溯到19世纪60年代英国对查理一世之死的审判。1966年,美国法院首次使用声纹来获取证据。随着研究方法和计算机技术的不断进步,声纹识别已经逐渐从简单的人耳识别转向基于计算机的自动识别。

声纹识别技术的发展大致可以分为三个阶段:第一阶段是基于模板匹配。像人脸一样,声纹需要先注册,然后验证。登记的内容应与核实的内容相同。例如,注册时使用“password”一词,验证时也必须使用“password”一词,这相当于验证时受到限制,只比较两种声音是否相似;第二阶段,基于概率模型的研究始于2000年。如果有些人说得快,有些人说得慢,而且声音有一个时间长度,可变长度向量应该变成一个物理度,这是基于高斯模型的概率统计。此时,声纹识别的准确性将受到噪声、干扰等的影响。第三阶段,从2012年前后开始,深度学习给人工智能的发展带来了巨大的影响,也迅速推动了声纹识别的发展。

原题:声音会被模仿,声纹还可靠吗?》