计算机开始像人类一样推理
一个新的神经网络可以推断复杂的关系,包括不同物体的位置。资料来源:v_alex/iStockphoto
你考虑买的新家附近有多少公园?餐馆里晚餐和葡萄酒的最佳组合是什么?回答这些日常问题需要关系推理,而这种高级思维的组成部分对于人工智能来说很难操作。现在,谷歌公司深度思考部门的研究人员已经设计了一个简单的公式来处理类似的逻辑推理——而且它已经在一次复杂的图像理解测试中击败了人类。
人类通常擅长关系推理——一种利用逻辑联系和对比位置、顺序和其他实体的思维。然而,人工智能的两个主要类型——统计和符号——已经缓慢地发展了类似的能力。统计人工智能或机器学习擅长模式识别,但不擅长逻辑。符号人工智能可以利用已确定的规则进行推理,但它不擅长动态学习。
新的研究提出了一种跨越这一鸿沟的方法:用于关系推理的人工智能神经网络。类似于神经在大脑中的连接方式,神经网络将微小的程序连接在一起,通过协作找到数据模式。它们可以有特殊的结构来处理图像、解析语言甚至学习游戏。在这种情况下,可以连接一个新的“关系网络”来比较每个场景中的每对对象。"我们肯定会让这个网络发现事物之间的关系."该论文的合著者、伦敦深度思考分部的计算机科学家Timothy Lillicrap说。
他和他的团队通过几项任务验证了他们的网络。第一个网络是回答单一图像中事物之间的关系,例如立方体、球体和圆柱体。例如:“蓝色物体前面有一个物体。它的形状和灰色金属球右侧的蓝绿色小物体一样吗?”对于这个任务,关系网络可以与另外两个神经网络结合:一个是识别图像中的对象,另一个是解释问题。在许多图像和问题上,其他机器学习公式的准确率为42%到77%。人类得分是92%。然而,新关系网络联盟的准确率为96%,超过了人类推理得分。研究人员在最近发表在预印服务器arXiv上的一篇文章中报告了这一结果。
深度思考小组还在一项基于语言的任务中测试了神经网络,在这项任务中,它接收诸如“桑德拉捡起足球”和“桑德拉去了办公室”这样的表达。然后它会收到一些问题,比如“足球在哪里?”(办公室)。在大多数类型的问题中,尤其是在所谓的推理问题中,它优于大多数人工智能公式。例如,“莉莉是一只天鹅。莉莉是白色的。格雷格是一只天鹅。格雷格是什么颜色?”(白色)。对于这样的问题,网络得分可以达到98%,而其竞争对手得分约为45%。最后,这个公式分析了10个球弹跳的动态模式,其中一些球通过看不见的弹簧或棍子连接在一起。关系网络可以使用这种动态模式来识别90%以上的连接。然后,它使用相同的训练方法来识别移动点和其他有代表性的人类形态。
"他们方法的一个优点是概念特别简单."纽约波士顿大学的计算科学家凯特·萨恩科没有参与这项研究,她说她也开发了一个公式,可以回答关于图像的复杂问题。Lillicrap说,这种简单性——大部分进展都包含在一个等式中——使得它能够与其他网络相结合,就像在对象比较任务中所做的那样。该论文称之为“一个简单的即插即用模块”,它允许系统的其余部分集中于它的优势。
"我对这些结果感到震惊。"加州斯坦福大学的计算机科学家贾斯廷·约翰逊说,他参与开发了物体比较任务。萨恩科补充说,神经网络有一天将有助于研究社交网络、分析监控视频或指导自动驾驶汽车。
为了获得和人类一样的灵活性,约翰逊说它需要学会回答更具挑战性的问题。这可能不仅需要比较一组事物,还需要有效地比较三个事物、两对事物或更大集合中的几对事物。"我对开发能够提出自己策略的模型非常感兴趣。"他说,“深度思考是建立一个特殊的推理模型,它不会进行更一般意义上的关系推理。但这仍然是朝着正确方向迈出的非常重要的一步。”(晋南编)