计算机如何看清我们的脸?
人脸识别技术经历了近40年的发展,近年来逐渐出现了一些可以投入实际应用的成果。例如,谷歌眼镜的身份识别功能和智能手机的人脸解锁功能正在逐渐影响我们的生活,而指定人脸识别等应用早就进入了安全领域的前沿。那么,计算机是如何识别人脸的呢?
在这项技术的发展过程中,出现了许多识别算法。这些算法涵盖广泛的学科,包括模式识别、图像处理、计算机视觉、人工智能、统计学习、神经网络、小波分析、子空间理论和流形学习。但归根结底,许多算法都是基于“特征脸法”。
该方法主要利用主成分分析对人脸进行降维和特征提取。事实上,这相当于将所有人脸矢量化和数字化,然后从那些用作参考的人脸数据(称为训练集)中找到与要识别的当前人脸数据相对应的几个特征值,以形成一组特征向量基,从而达到表示原始数据的目的。由于通过主成分分析提取的特征向量在返回图像时仍然看起来像人脸,所以这些特征向量也被称为“特征脸”。
从上图中,我们可以看到,任何一幅减去平均人脸的人脸图像都可以被投影到子空间中,以获得一组权重向量。该方法实际上计算该向量与训练集中每个人的权重向量之间的欧氏距离,并将与最小距离对应的人脸图像的身份作为测试人脸图像的身份。例如,这就像警察局用来识别嫌疑人的“面部拼写”方法。它以基本的脸型为基础,加上合适的眼睛、眉毛和其他面部特征,最终形成最像嫌疑犯的面部图像。除了“眼睛”和“眉毛”更抽象之外,电脑做的事情大致相同。
在此基础上,提出了“弹性图匹配”的方法。它将所有的人脸图像视为具有相似的拓扑结构,不关注角度和长度等量化属性,而是关注变换后图像的不变性。所以它还有一个非常生动的名字,叫做“橡皮泥几何学”。在这种方法中,所有的人脸可以表示为相似的拓扑图,图中的节点是一些基准点(如眼睛、鼻尖等)。),图中的边是这些基准点之间的连接线。
为了识别新的人脸,需要从人脸中找到参考点并提取人脸图像,以使该图像和现有的人脸束图像之间的相似性最大化。在匹配弹性图之后,将提取新的面部束图并将其用作识别特征,并且将计算测试面部和现有面部束图之间的所有相似性。具有最大相似性的面部的身份是测试面部的身份。
在弹性匹配过程中,网格的形状会随着特征点的搜索而不断变化,因此对姿态的变化具有一定的适应性。然而,在搜索过程中用代价函数进行优化需要大量的计算,识别速度慢。
上面是静止图像。在视频监控、信息安全和访问控制等应用中,基于视频的人脸识别是一个非常重要的问题,也是人脸识别的热点和难点。典型的基于视频静止图像的人脸识别系统通常自动检测人脸区域,从视频中提取特征,并最终识别人脸的身份(如果存在的话)。
现在,在上述方法中增加了一种人脸跟踪方法。在这样的系统中,通过使用从视频估计的姿态和深度信息来合成虚拟正面。在这个阶段提高识别率的另一种方法是使用视频中丰富的帧图像来识别每一帧图像。这相当于堆叠大量静态识别结果,然后使用“投票”机制来选择最受支持的结果。
在过去的两年里,视频人脸识别技术得到了进一步的发展。这一阶段的特点是利用空间信息(每帧)和时间信息(如人脸特征的运动轨迹)做出更准确的判断。与前面提到的“投票”的不同之处在于,这种方法能够在时间和空间的联合空间中描述和识别人脸,因此它们更加准确。
可以想象,在不久的将来,人脸识别技术将悄悄地融入我们的生活。例如,当参加宴会时,我们需要它来帮助识别陌生人,以便更好地交流。在对数据进行分类时,它还可以帮助我们以最快的速度逐个归档图像文件。把这些小变化加在一起会让我们的生活更方便。
上一篇:头等什么意思 头等的反义词
下一篇:为什么猫在夜里能看清东西
推荐阅读