欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

基于面部表情的情绪识别,让计算机再感性一点

科普小知识2022-07-09 14:43:15
...

基于面部表情的情绪识别,让计算机再感性一点

当我们谈到情感识别时,我们必须提到一个在这个领域做出巨大贡献的人——埃及科学家拉纳·埃尔·卡里欧比。像许多成功的“程”一样,她不仅善于交际,而且善于处理人际关系。智商和情商同等重要。她和她的导师罗莎琳德·皮卡德一起创立了情感分析软件开发公司Affectiva。Affectiva也被一些商业媒体列为增长最快的初创公司。事实也证明,这个领域确实非常有利可图。

为了阐明工作原理,首先我们需要了解情绪识别的理论基础。保罗·艾克曼(一位心理学家)提出了六种不分性别和年龄的基本情绪:愤怒、厌恶、恐惧、快乐、悲伤和惊讶。后来,他开始解释这些情绪的表达,并开发了一套“面部动作组织系统”(FACS),将每个人的表情分解成许多动作单元。这些面部单元不能单独代表任何情感,但是我们可以通过使用它们的组合特征来进行一些面部表情识别。是的,就像“对我撒谎”中显示的那样。如果一个人对你微笑时只影响到颧骨的主要肌肉,那么这可能是一个真正的假笑,因为真诚的微笑除了影响到颧骨的主要肌肉之外,还会影响到眼轮匝肌。

基于面部表情的情绪识别,让计算机再感性一点

罗莎琳德·皮卡德很早就在麻省理工学院的媒体实验室做了一些关于图像压缩的技术开发,但很快她就遇到了瓶颈,因为她开发的方法(虽然后来很流行)完全独立于正在处理的对象:例如,同样的方法被用来压缩大运河和总统肖像的图像。她觉得如果电脑能知道它在处理什么,它就能改进这个过程。直到她读了一本关于联觉的书《品尝形状的人》,她才突然意识到情感和理性之间的联系。与我们传统的“无情而明智”的观点不同,太少的情感,事实上,就像太多的情感一样,会对我们的理性思维产生不良影响。事实上,一些影响情绪的脑损伤也会剥夺人们判断和做出决定的能力,而这正是我们想要电脑做的。

回到计算机情感识别,实际的方法是从面部提取一些关键点,固定那些相对恒定的“锚点”,例如鼻尖,作为最常引用的固定点,然后使用像嘴角这样的点来判断你做出的表情。但是在20世纪90年代,要创建一个能够精确生长这些离散面部运动单元的系统太难了。仅视频数字化就花了25秒。一位早期的研究人员说:不管怎么做,总会有一点偏差,而且随着结构的不断扩展,错误越来越多,每十秒钟就会重启一次。

就这样,研究陷入了瓶颈,所以卡利欧比遗憾地去了剑桥继续她的博士学位。巧合的是,在一次演讲后,一位观众告诉她,她在训练电脑阅读面孔时遇到的问题与他患有自闭症的哥哥非常相似。当时,剑桥自闭症研究中心正在进行一个大型面部表情目录项目。它不同于Ekman将表情分成小的动作单元并通过动作单元的组合来判断情绪的方法。他们对表达的分类更加自然、简单和容易理解。他们对表达进行了更详细的分类,然后从整体上了解了特定表达的特征。例如,在“思考”部分,有担忧、犹豫、幻想、判断等。他们邀请了六名演员在摄像机前展示这些表情,并在几乎所有人都通过后给他们贴上标签。这样,他们就有了足够的信息来开发MindReader,这是一个可以在几乎所有环境中检测复杂情绪的软件,也是Affdex的原型。提出FACS的心理学家埃克曼和其他人合作创建了情绪识别软件,这也是一个情绪识别软件。它还使用机器学习的方法,通过大量的数据学习建立一个精确的表情识别框架。

虽然有些人质疑这种只基于表情而脱离真实情况的判别方法的准确性,但实验表明,计算机不仅能捕捉到那些虚假的、人为的表情,还能捕捉到一些闪过的、人们无法识别的微小表情。加利福尼亚大学的研究员玛丽安·巴特利特发现,当她的女儿看到戏剧中的暴力场景时,她先是表现出一阵愤怒,然后伪装成惊讶,最后变成了笑声——但这一切都被电脑捕捉到了。通过“微表情”测试,研究人员可以捕捉到人们在拒绝经济援助前短暂的厌恶表情,这对于普通人来说肉眼是很难做到的。

自然,这些软件有着广阔的应用前景。在2012年总统选举时,卡利奥比的团队利用阿夫德克斯测试了200多人观看奥巴马和罗姆尼辩论的录像,并以73%的准确率预测了投票结果。目前,情感识别已经在商业领域得到了广泛的应用,并且在未来会有更加多样化的应用前景。