情感计算会让人类无所遁形吗
最近,一场人与机器之间的“读心术”战争在*电视台的《机智的人》中上演。结果似乎不太令人惊讶。是的,机器又赢了。
在节目中,名为“阿尔法鹰眼”的机器人很快认出了节目嘉宾撒贝宁和薛汉故意伪装的表情,并准确判断出牛蛙所在的盒子。在另一个更困难的测试中,它在一排顶尖的海豹突击队老兵中准确地识别出了狙击手,比工作多年的人类心理学家的速度还要快。
据报道,阿尔法鹰眼是一种人工智能设备,具有计算情绪的能力,并能看穿人们的情绪。即使是家人也可能不会注意到无法躲避机器的情感变化。人类真的没有藏身之处吗?
对自己的情绪进行分类
情感这个词充满了欢乐和悲伤。人类很难准确地定义它。机器如何理解它?这是看情感计算四个字最大的问题。
对此,国际关系学院信息技术系副教授李斌阳解释道:“情感计算的本质是一个分类问题,它允许机器判断一个人的情感是积极的、贬损的还是中性的。鉴于中立判断在实际应用中的有限范围,大多数情感计算试图区分积极和消极情感。”
据他介绍,传统的情感计算方法是利用人们可以提取的特征来表达情感,学习一套判断情感本质的模型,并在捕捉到新的表情或文本时进行匹配,从而做出情感倾向的判断。
这项研究始于本世纪初,并自近年来引入深度学习以来取得了显著进展——在此之前,情感特征需要由人类来提取,之后,机器可以根据标记数据提取特征,并保留更多人类的原始表达信息。当然,还有一个在深度学习中常见的“黑盒”问题。当机器做出判断时,研究人员无法确定提取了哪些特征,一些特征可能只针对某一批数据,从而形成一定的偏差。
李斌阳表示,对语言、文字、图像和视频的情感计算基本上需要“一句一算”或“一帧一算”。他以自己的文本情感计算为例来解释:同一个词“高”在“失业率”和“就业率”的语境中有不同的情感倾向。前者通常是贬义的,而后者通常是褒义的。有时,通过几个词,机器无法分析其背后的含义,需要注入更丰富的语义信息。
轻微的震颤无法逃脱鹰眼的捕捉
在节目中,阿尔法鹰眼的表现令人惊叹。据阿尔法鹰眼安全技术有限公司首席技术官南羽博士称,这是通过捕捉和判断肌肉的轻微颤动来实现的。“情绪本身是一种非常复杂的生理反应,伴随着外部颤抖、颤抖、内部荷尔蒙、心跳、异常血压和其他连锁反应。这些反应超出了人们的控制范围,计算机可以通过构造人们的情绪并量化这些反应来形成对情绪变化引起的身体反应的判断模式。这是情感计算中最简单的部分:用相机捕捉人体的微振动,通过快速检测和分析振动模式,它对应于某种情感。”南羽说。
谈到节目中阿尔法鹰眼准确判断谁触摸了牛蛙的部分,南羽解释道:“当人们把手伸进水里触摸或不触摸牛蛙时,他们无法掩饰反应的不同。恐惧和紧张会影响肌肉振动,人们无法控制自己。”根据余楠的解释,一方面,阿尔法鹰眼的工作很容易理解,但另一方面,这种判断方法类似于互联网上流传的“微表情”。微表情仍然侧重于图像内容的分析,要求受试者有更大的表情反应,如皱眉、眯起眼睛、微笑和其他“喜怒无常”的表情。同时,它需要更大的区域来显示人脸的正面图像,但是基本上不可能判断人脸是被遮盖的(例如戴着面具、帽子、太阳镜),还是人体的侧面和背面。我们的方法是建立一套微振动情感模型库。即使人们闭上眼睛没有反应,他们也会有同样的潜意识生理反应,无法逃脱机械眼的控制。这是该系统相对独特的地方。”
李宾阳解释了情绪计算和测谎仪的区别。比如测谎仪,我会问你十个问题,其中一些是非常基本的,比如你昨天吃得好还是睡得好。根据这些基本问题的答案,我们将确定每个人的基本心跳、脉搏、脑电波等水平。基于这些问题,我们将询问和回答测谎仪的问题,并将它们与正常情况进行比较,以确定它们是否说谎。然而,阿尔法鹰眼的识别需要高水平的机器捕捉。此外,它的情感识别是“非接触式”的,甚至不需要与被测者互动,这就要求机器具有更高的智能水平。
实际场景很难保证准确。
随着深度学习的成熟,现阶段情感计算的准确性有了很大提高,但仍存在一些特殊问题。“要进行情感计算,一个人必须理解文本,在此基础上,一个人需要依靠常识,甚至合理的推理。这些很难给机器。”李宾阳说:“例如,我读了一段话:今天是开学第一天,正好是教师节,学生们向老师们致以最美好的祝愿。这句话背后的意思是开幕日是9月10日,但机器无法理解这一步。"
情感背后是人类庞大的常识系统的支持,这是成熟的情感计算所无法企及的。据李宾阳介绍,这个已经实施多年的“知识工程”计划是以地图的形式整理人类知识。各个领域的研究机构可以围绕自己的知识点构建自己的知识地图,如体育和军事。这是一个非常大的项目,但它可以为深入的情感计算带来更大的可能性。
另一个困难是“主观性”。感觉是主观的。人们的描述非常不同。一个宽容的人和一个吝啬的人对同一件事肯定会有很大的不同。“当实验室使用它爬行的社交网络评论时,准确率可以达到90%左右,但一旦它落到实际场景中,效果就会不同。”李宾阳说道。例如,吃一碗牛肉面,如果顾客有否定的表情,虽然机器能准确捕捉到,但很难判断面条是难吃还是太热,即使房间太热也不舒服。
应该严格限制使用场景
李宾阳强调了“场景”的重要性,以回应情感识别将导致人类“零隐私”的担忧。情感计算的研究从一开始就离不开商业领域。亚马逊和其他公司希望通过分析商品评论来判断消费者的好恶,并对商品做出改进。在特定的问题上,比如某些化妆品的效果,情感计算应用得更早,也相对成熟。
至于对隐私的担忧,李斌阳认为这是不可避免的。如果你去任何地方,你真的需要担心,但是如果你能专业地把它应用到特定的场景,利大于弊。
据余楠说,阿尔法鹰的眼睛目前主要用于安全领域,“例如,机场安检,正常通过的人不需要紧张,但如果有些人有不寻常的反应,系统可以确定他们是重点关注的人。”南羽说。这种判断如果由安全检查员完成,需要长期的经验积累和仔细的捕捉,但机器只能通过生成情感和模式库的结构在毫秒时间内做出判断。
"最恰当的做法是评判没有个性的人."余楠说,“具有强烈特征的人可以通过面部识别来验证,比如在大量人群中搜索有犯罪记录的人。然而,没有特征的人没有犯罪记录,无法进行比较和分析。例如,一名建筑工人在与家人争吵后想要立即爬山,他可以在上班前通过情绪识别来决定是否需要情绪干预,以避免潜在的危险。”
南羽说,目前情感识别的应用与场景紧密相连。除了诸如安全保护和金融风险控制等严肃的应用之外,他们也不排除将情感识别应用于诸如“真实情感和表情包”等轻松娱乐的方向,以探索更多的着陆可能性。