AI能忆起昨天的你了 但触景生情还有点难
为了形成长期记忆,人工智能还需要脑科学、神经科学、心理学和行为经济学的跨学科研究。
记住某件事并记住它是人类的一种固有能力。记忆让我们回忆起过去的事件,并根据它们做出未来的决定。人工智能代理也能这样做吗?最近,谷歌的人工智能公司DeepMind提出了一种方法,允许代理使用特定的记忆来信任过去的行为,并对未来做出正确的决定。研究结果发表在最新一期的《自然通讯》上。
那么,现在我们让人工智能产生记忆和人类记忆是一回事吗?人工智能如何产生记忆?与过去相比,新方法提出的“深层思考”有什么区别?我们应该做什么努力来赋予人工智能记忆?
让人工智能产生“记忆”的四种方法
记忆是我们编码、储存和回忆过去经历的能力。总的来说,它可以被看作是利用过去的经验来影响当前行为的能力。它使人类能够从以前的经验中学习,并与当前的实践建立联系。
我们生活中接触到的人或事经常会引发记忆,这就是我们通常所说的接触场景和感受。“人类的长期记忆实际上是多模态和面向场景的,即记忆事件在存储时包含多个维度,触发某个维度可以快速找到线索并回忆起来。”王源智库人工智能部主任、图灵机器人首席战略官谭明洲在接受《科技日报》记者采访时表示,人们经常高估内存容量。事实上,我们的记忆能力非常有限,所以人类的记忆本身是高度抽象的。在记忆中,我们通常选择提取事件的特征,其中许多是一般性的和模糊的。如果我们回忆一部电影,我们将不能准确地一帧一帧地回忆起整个图像,但是如果相似的场景被再现,我们将回忆起以前的场景。
在以前的研究中,什么方法可以用来使人工智能回忆?
谭明洲说,常用的方法有四种:第一种是长时和短时记忆网络。它由嵌入在网络中的一个显式存储单元组成,其功能是存储更长时间的信息。这项技术主要被谷歌、亚马逊和微软等公司用于语言识别、智能助理等。第二种方法是弹性加权合并算法。该算法主要用于许多游戏中的序列学习。“深度思考”使用与内存整合相关的算法,旨在使机器能够学习、记忆和提取信息。第三种方法是差分神经计算机,其特点是将神经网络与记忆系统连接起来,像传统计算机一样存储信息,并从实例中学习。第四种方法是连续神经网络,主要用于迷宫学习,解决复杂的连续任务和传递知识。
关键是解决长期信贷分配问题。
那么现在,人工智能产生的记忆和人类的记忆一样吗?谭明洲回答说:“目前,人工智能的记忆仍然停留在编码、存储和将学习中获得的信息转化为认知的过程中。以前,人工智能只允许存储发生的一切。然而,内存和存储是有区别的。记忆是为了有效的记忆。人们回忆的方式通常跨越不同的门槛,比如突然想起某个品牌。因此,为了让人工智能代理判断他们是否应该记住过去发生的事情,关键是要采取一些方法让他们评估并达到人类记忆的效果。”
为了让人工智能回忆起过去的事件,它涉及到长期信用分配:如何在长期行为序列中评估行为的有效性。然而,现有的人工智能可靠性分配方法不能解决行为和结果之间的长延迟问题。
据介绍,在人工智能的研究中,以长序列评估个体行为的效用问题称为信用分配问题。评估可以对过去的行动或计划的未来行动进行评分。
谭明洲解释说:“特别是在强化学习中,代理人获得指导的唯一途径是通过奖励,奖励通常是稀疏的和延迟的。当一个代理得到奖励时,很难知道哪些行为应该被信任,哪些应该被责备。这就是信用分配问题。”
另外,谭明洲说,为了让人工智能像人类一样产生记忆,人工智能必须首先学习情境记忆和自传体记忆。人工智能很难做到这一点,因为情境记忆和自传体记忆都有很强的个体经验特征。一旦情境记忆和自传体记忆从当事人中分离出来,它们就失去了活力,这对于机器来说是难以想象的。毕竟,对于机器来说,精神可以独立于物质存在,经验可以独立于主体存在。此外,有必要防止机器的灾难性遗忘。认知心理学研究表明,人类自然认知系统的遗忘并不需要完全抹去先前的信息。但是对于机器来说,遗忘是灾难性的,也就是说,抹去以前的信息。
与人类复杂的记忆相比,它仍然是初级阶段。
根据谭明洲的介绍,“深层次思考”提出要在深入精读的基础上构建模型,并引入长期信用分配原则。首先,代理需要编码和存储感知和事件记忆。然后,代理需要通过识别和访问过去事件的记忆来预测未来的回报。此外,代理需要根据他们对未来回报的贡献来重新评估这些过去的事件。这允许代理使用特定的记忆来信任过去的行为,并对未来做出正确的决定。
为了实现这一点,“深度思考”论文表明,它的首要任务是形式化任务结构,主要包括两类任务。具体来说,在第一个信息获取任务中:在第一个阶段,代理需要探索一个环境来获取信息,而没有立即的回报;在第二阶段,代理人长时间从事不相关的干扰任务,并获得许多附带报酬。在第三阶段,代理需要使用在第一阶段获得的信息来获得远程奖励。
在第二种因果任务中:在第一阶段,代理需要采取行动来触发一个只有长期因果关系的事件;第二阶段也是一项干扰任务。为了在这三个阶段取得成功,代理人需要利用第一阶段活动所引起的环境变化来取得成功。
然而,在研究这种结构的完整任务之前,研究人员考虑的任务是使智能体实现一个更简单的被动过程——“被动视觉匹配”,即智能体不需要采取任何主动措施来收集信息,就像一个人在街上行走,无意中观察到一些信息。
论文《深度思考》展示了游戏过程中的一个简单场景,并允许人工智能代理记住探索的路径和策略。当然,与人类复杂的记忆机制相比,它仍然是一个相当早期的阶段。
谭明洲强调,如论文所述,新方法的范式拓宽了人工智能研究的范围。这是一个有趣的话题,涉及到人脑科学的研究以及神经科学、心理学和行为经济学跨学科研究的尝试。还有很长的路要走,需要更多的开放探索。
目前,人工智能系统没有长期记忆
从功能的角度来看,人脑可以分为几个模块:寄存器、短时记忆、长时记忆和*控制模块。人脑通过五个传感器从外部接收信息,比如视觉和触觉,并且有寄存器。如果我们的注意力集中在信息上,大脑可以将信息转化为短期记忆的内容,这可以持续大约30秒。如果我们有意识地想记住内容,大脑会将短期记忆的内容转换成长期记忆。
长期记忆包括信息和知识。简而言之,信息代表世界的事实,知识代表人们对世界的理解。两者之间不一定有明确的界限。当人们将信息和知识储存在长期记忆中时,新的内容与现有的内容联系在一起,规模也在扩大。这是长期记忆的特点。长期记忆实际上存在于大脑皮层。在大脑皮层,记忆意味着改变脑细胞之间的联系,构建新的联系并形成新的网络模式。
我们可以认为当前的人工智能系统没有长期记忆。阿尔法狗和自动驾驶汽车都重复使用人工学习或定义的模型,并且不具备持续获取信息和知识以及向系统添加新信息和知识的机制。
一些学者认为,拥有长期记忆将使人工智能系统进化到一个更高的阶段。想象一下,5-10年后,建造这样一个智能系统是可能的。在这个系统中,有语言处理模块,包括短期记忆和长期记忆。该系统可以自己连续读取数据,并将数据中的知识压缩后放入长期记忆模块。构建一个具有长期记忆的智能问答系统正是我们当前的愿景。(记者华玲)