欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

实现与逝者跨时空对话 AI光会模仿原声还不够

科普小知识2022-04-21 07:28:41
...

"如果有电梯通往天堂,我会不顾一切去看你。"几天前,这部神曲炽热而颤抖的曲调表达了许多人对故去亲人的怀念。如果有“黑色技术”可以与已故的亲属进行跨时间的对话,我相信这对活着的人来说将是一个巨大的安慰。然而,随着人工智能技术的发展,实现与死者的跨时间对话成为可能。百度董事长兼首席执行官李彦宏曾经说过,人工智能让每个人都能把他们说的和做的一切,甚至是记忆、情感和意识以数字形式存储在网络磁盘或其他云上。这种思维模式也可以通过机器学习,并通过技术来恢复,从而跨越时间和空间与后代进行对话。

国内外都试图模拟与死者的对话。

“这种过世的人和后代之间的对话在国内外都有过尝试。”天津大学智能与计算系博士生导师王龙标教授说,在2011年3月11日日本地震的那一刻,许多人的生命都被冻结了。由于灾难发生在意料之外,许多受害者一句话也没留下,这让他们的许多家庭深受打击,在情感上无法接受。日本已经找到了一些科学研究人员来收集死者的声音,模仿死者的声音写了一封遗书,并通过声音合成技术恢复了死者的声音,读给家人听。听到这些,家人非常感动,觉得他们实现了自己的一个愿望。许多人也放下悲伤和勇气,勇敢地面对未来的生活。

在中国,一个众所周知的尝试是在2016年,在张国荣诞生60周年之际,百度的语音技术团队发布了张国荣和他的粉丝对话的视频记录。作为时代的超级巨星,张国荣已经影响了数千万粉丝。当熟悉的声音响起时,许多歌迷当场哭了。张国荣的最后一句话,“永远站在一个明亮的角落,我只希望你能幸福快乐地生活”,也扫除了许多粉丝多年的烦恼。这段视频是一段“互动”视频,百度语音技术团队在张国荣死前通过机器和人力搜索了整个网络的原声和采访材料,合成了他的声音,并在录制视频前征求了粉丝的意见。这种“来自哥哥”而“不是哥哥”的声音回答,音质完全来自我自己,但内容在张国荣死前的任何声音记录中都找不到。这是一封根据死者生前和2016年的讲话风格写的“粉丝来信”。

"上述尝试只是为了模仿死者的声音和语言."王龙彪说,死者所说的基本上是科研人员事先编辑好的。虽然目前计算机在技术上可以自动生成文本和文字,但模仿的效果并不十分理想。例如,在日本,目标是鼓励人们过上更好的生活。如果内容编辑不当,会适得其反。因此,这些尝试并不是真正与后代的“对话”。

应该收集大量数据来再现原始声音。

为了再现死者的原声,该技术公司利用大数据、深度学习和声音合成技术,对张国荣在电影、电视台和各种渠道留下的原声进行建模,并通过合成带有一定情感的声音模型合成“粉丝来信”。通过语音合成技术,实现了大规模语料库的产生和自动数据标注,充分挖掘了深度学习技术对大数据的处理能力,从而大大扩展了语音合成系统可以使用的合成语料库的容量,使语音合成系统包含一定的情感,更接近张国荣的原声。

“无论是模拟死者的单边言语还是未来实现的跨时间对话,当前的技术都离不开死者生前大量的数据收集。”王龙彪说,为了向一个人学习,计算机必须首先收集关于这个人的大量信息。在这个人出生之前,他所写的文字、声音、图像和大脑信号必须以各种形式保存下来。例如,为了模仿写作风格,一个人必须收集他以前写过的信件和文章。要模仿一个人的语言,必须通过录音了解他的口音、发音习惯、习语和语言逻辑。收集的数据越完整,模拟的机器就越相似,就像丈夫和妻子一样。丈夫和妻子已经在一起很长一段时间了,在行为和语言习惯上会潜移默化地高度相似。百度相关负责人曾表示,张国荣“回复粉丝来信”的原始发音被转载。仍然有一些沮丧和一些单词的发音有点不自然的原因部分是由于缺乏相关的场景语料库。

在收集大量数据的基础上,一般来说,需要语音合成、机器学习、自然语言处理等技术来模拟死者的语言。如果你想制造更多的情感语言,你也需要情感计算。具体来说,就是通过计算机方法来识别和表达情感因素,比如人的语言、文字以及各种身体运动所代表的情感,然后让机器模仿和产生情感,写情感文章,产生情感语言,或者表达一些情感性的身体运动。

脑科学研究对实现空间对话至关重要

为了实现对话,语音对话技术也是必不可少的,它需要机器来判断和识别彼此的语言,并理解和自动生成文本。目前,智能扬声器的普遍应用是语音对话技术。然而,大多数时候,这些聪明的演讲者会回答似是而非的问题。只有在回答既定问题时,比如天气预报、打开电视、播放歌曲等。,这些聪明的演讲者能准确地完成对话和说明。王龙彪说,为了实现机器和人之间的良好互动,机器需要能够模仿人的思维和情感,从而使机器的答案更智能、更个性化,而不是相同的答案。

据报道,瑞典科学家目前正在进行研究,通过在大脑中植入微型设备,让用户能够上传和下载他们的想法。王龙彪说,目前大多数情感计算都是基于数据驱动的机器学习技术。如果你想实现模拟人类意识和情感的真正意义,它还涉及脑科学的范畴。然而,人脑非常复杂。目前,对人类意识、情感感知、理解和生理机制的研究还很肤浅。因此,获取人类的意识、情感和记录仍然是困难的。此外,人类的情感非常复杂。让机器知道情感并能产生情感,在对话中通过对方的话语进行判断,并相互进行情感交流。这在现阶段不可能很好地实现,这也是科研人员努力的方向。

让死者永生,否则将面临道德风险。

虽然保存一个人的信息似乎可以使他在精神上不朽,给活着的人带来极大的安慰,但这种做法也有一定的风险。王龙彪表示,不排除有人会恶意利用死者的信息来模仿死者的声音,以达到自己的一些目的,同时加入自己的意图来伪造死者的思想来操纵活人。

此外,通过人工智能实现的这种“精神永生”也可能涉及伦理问题。这有点像克隆技术。如果将来芯片技术可以用来模拟死者的思维,甚至克隆人的思维也可以通过基因编辑来保存,这些实践可能会赋予机器人自主意识。机器人可能有自己的思想,情感,比如欢乐和悲伤,那么,这种意识到他人的机器人会面临道德风险吗?当这些机器人被赋予“生命”时,当它们失去控制时应该如何处理?目前,机器人的伦理标准尚不明确,但当技术足够先进时,这一领域的伦理风险就会增加。如何处理是一个我们需要充分考虑的问题。