欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 生活科普

数据少也能认识“国际脸”

科普小知识2022-10-20 23:22:48
...

几天前,亚马逊的人脸识别工具错误地将28名美国国会*与罪犯配对,这一消息引起了关注。为什么人脸识别工具会犯这样的错误?事实上,机器和人类一样,只有在遇到陌生的外国人时才能认出“当地人”。对于来自其他国家/地区的“外国人”,识别准确率相对较低。如何解决这个问题?

引用公众个人信息对邓团队的图纸进行研究和验证。

研究小组正在讨论邓对地图的贡献

关键是让人脸识别工具尽可能多地了解世界各地居民的面孔,但这个过程并不容易实现。北京邮电大学教授邓在接受《中国科学日报》采访时表示,在人脸识别工具的研发过程中,使用的训练数据越多,准确率就越高。然而,由于不同国家/地区对公民个人信息的保护,收集此类信息越来越困难。训练数据的缺乏意味着人脸识别工具只知道“熟人”,而训练数据中对失踪人员的识别准确率较低。

最近,邓研究小组的一项研究取得了新的进展。该团队揭示了当前人脸识别算法中普遍存在的跨国家/地区识别偏差问题,构建了RFW人脸数据集来评估偏差程度,并提出了一种信息最大化自适应神经网络来减少识别偏差,以提高目标领域的识别能力。10月27日,相关研究成果在美国电气和电子工程师学会主办的国际计算机视觉会议(ICCV)上发表。

人脸识别工具的区域性困难

卷积神经网络是人工智能的代表算法之一,具有很强的图像表示学习能力。2012年,深度卷积神经网络出现在计算机视觉领域,极大地推动了人脸识别的发展,成为人脸识别领域的主流技术。

目前,大多数全球人脸识别工具都是基于深度卷积神经网络技术开发的,但该技术的人脸数据的源域是基于西方人的人脸特征,面向不同的目标域,即不同国家/地区居民的人脸信息识别需求往往“超出他们的能力”。

邓说,由于缺乏基准测试库,这一领域的研究长期以来进展缓慢。即使人脸识别工具在局部区域的识别率非常高,也很难准确到达全球人类。这使得人脸识别工具具有很强的地域性。

为了促进这项研究,邓的研究小组建立了一个新的测试库-rfw,以科学和客观地评估人脸识别的偏见。

在RFW数据库的基础上,研究人员验证了微软、亚马逊、百度、师旷的商业应用编程接口和学术界最先进的四种算法。

“这种识别偏差确实存在,在某些地区,错误率甚至是西方国家的两倍。”邓对说:

该论文的评价专家表示,与现有数据库相比,RFW在数据库中的数据分布更加均匀,这将成为更好的跨国识别的基准评价数据。

为了找出偏差是否是由训练数据的不均匀分布引起的,研究人员收集了一个覆盖世界各地人类信息的训练数据库,最终发现偏差的发生受到数据和算法的双重影响。

该论文的第一作者、北京邮电大学博士生王美解释说,数据库中的训练数据是平衡的,算法也是一样的,但是在一些国家/地区很难识别人脸信息,导致识别准确率低。

在数据少、人脸识别困难的情况下,如何提高识别率?研究人员没有放弃。他们决定进一步研究该算法,并使用该算法使人脸识别工具从其他例子中得出推论。

学习取决于“意识”

传统的机器学习数据库在构建过程中需要手工标注个人信息,面临隐私泄露的风险。用于对象识别的无监督领域自适应方法启发了研究人员。

该方法利用无监督学习将源域和目标域映射到一个域不变特征空间,提高了目标域的性能。研究人员希望通过算法解决这个问题,让机器自己学习。

"这相当于研究人员把试卷放好,然后用机器回答."邓对说:

实现并不简单。在具体操作层面,目标识别不同于人脸识别。目标识别的源域和目标域可以重叠,信息获取相对便宜。充足的源域数据使识别工具能够区分和区分目标域信息。

因此,研究人员提出了一种自适应网络来最大化信息。王美介绍说,这种方法一方面可以减少源域和目标域之间的全局分布差异,另一方面可以学习区分目标域的特征。

“换句话说,卷积神经网络可以在没有监督的情况下‘有意识地’学习目标区域的面部特征。”王美说。

为了解决两个域之间类别不重叠的问题,信息最大化自适应网络使用谱聚类算法生成“伪标签”,并使用伪标签在监督下对网络进行预适应,以初步提高目标域的性能。

这种聚类方案本质上不同于其他不适于人脸识别的领域自适应方法。王美解释说,新方法可以在新的目标领域自主学习,无需人工干预,从而避免了隐私泄露的风险。

为了进一步提高网络输出的区分度,研究者还提出了一种新的基于互信息的自适应方法,该方法以无监督的方式在目标域中产生更大的特征间距。

不同于一般的监督损失和监督互信息,该方法具有无监督的特点。它可以利用所有未标记的目标域数据,而不管这些数据是否被成功地分配了伪标签。

基于公共数据的验证

该方案能够提高人脸识别工具对不同国家/地区的居民在没有监督的情况下的人脸信息识别率吗?

研究人员使用来自世界各地名人的公共数据来验证结果。结果表明,信息最大化自适应网络能够成功地将源域的识别能力应用于其他国家/地区的目标域群体,识别性能优于其他域自适应方法。消融实验发现,互信息损失在减少识别偏差方面起着重要作用。

王美补充说,信息最大化自适应网络在交叉姿态和交叉场景应用中也具有良好的泛化性能。

鉴于更好的实验结果,研究小组发布了RFW数据集,以促进进一步的研究。

目前,包括哈佛大学、帝国理工学院、清华大学、思科、华为、NEC和IBM在内的20多个国家的科研机构和企业的研究团队已经申请RFW开展多人人脸识别研究。

值得一提的是,该方法在进行自适应学习时,仍然需要用从源区域收集的注释数据来训练模型。这意味着源域数据存在隐私泄露的风险。如何在不转移源域数据的情况下在目标域进行自适应学习将是一个值得研究的问题。

邓表示,下一步是在根本不收集目标领域数据的情况下,提出一种泛化能力更强的新算法,从而直接提高未知目标领域人脸识别工具的准确率。