未来机器人:一起工作 互相学习
根据美国《连线》杂志网站上最近的一份报告,目前大多数关于人工智能的研究都集中在个体智能体(智能体,指能够自主移动的软件或硬件实体)上。人工智能系统也一直是作为个体运行的,但是这些个体不能组合成一个团队来学习和工作,也不能相互合作来完成相应的任务。麻省理工学院航空航天学教授乔纳森·豪认为,这种工作方式已经失去了一个巨大的机会。机器人将来应该一起工作,互相学习。
在分布式计算领域,人们通常称之为计算实体,它在分布式系统中不断地、自主地发挥作用,具有自治性、交互性、响应性和主动性。例如,一辆汽车独自在街上行驶,恒温器可以根据周围环境的变化不断调整。
郝的研究团队一直致力于研究和改变“移动设备和人工智能设备相互合作和学习的方式”,希望通过机器学习(人工智能的核心能力)来帮助智能对象,并使彼此更加智能。
豪认为机器人可以互相学习,并在未来一起工作,从而改变了诸如物流(机器人完成订单并送回家)和太空探索(机器人合作探索新领域)等行业。真正的挑战是让这些人工智能机器人为实验室之外的真实世界做好准备,这是人工智能应该涉足的领域。
单个机器人在团队中工作
现实世界远比人工智能机器人开发实验室环境复杂。在团队合作中,人类会思考别人在做什么。如何一起完成任务?这项任务将如何改变?等等。当机器人在团队中工作时,这些问题将被“考虑”。
为了让机器人分组工作,郝带领团队让这些代理在周围环境中反复实验,像人类一样学习。该团队优化了自己开发的新算法和机器人行业的经验,并使用了一种叫做强化学习的机器学习技术来使它们适应周围的环境。
该团队甚至进一步研究了当“多代理”参与时发生了什么。“多智能体”强化学习这一新兴学科存在许多困难,包括:独立智能体如何在其他方面建立共识并达成一致?如何确保他们之间的持续对话不会淹没整个网络?当一个拥有人工智能的机器人认为它知道做事情的正确方法,但它错了,会发生什么?
豪说:“如果我们对什么时候吃饭都有不同的看法,那么达成一致需要多少沟通?这似乎是一个相对简单的问题,但是在机器人系统中,我们有很多问题要处理。通常这些问题都有很多不确定性。”
只有当一个可行的深度学习平台出现时,它才能真正回答这些问题。豪和他的团队使用亚马逊的EC2图形处理器实例支持的AWS深度学习AMI环境,该环境可以在云上执行非常复杂的计算,而无需管理机架和服务器。他们的最终目标是训练和运行强化学习模型的速度和准确性,以确保机器人足以应对现实世界中行为的影响。例如,当机器人不同意时,它们不断的唠叨不会淹没整个网络。
复杂计算需要云平台
在智能机器人一起学习的理想生态系统中,整体大于部分的总和,这需要大量的技术努力来实现。
在亚马逊云服务(AWS)、波音(Boeing)和IBM的共同支持下,豪的团队进行了一段时间的深入研究,运行复杂的强化学习算法,这些算法具有足够的计算能力,能够使一组机器人在在线时保持持续通信并调整其行为。新的强化学习系统被称为分层多智能体教学。通过优化奖励功能和更有效的交流,它成功地提高了机器人在团队中的学习能力和通过协作集成解决问题的能力。有了基于云的服务,团队中的每个成员都可以根据自己的需要访问尽可能多的计算能力。
“在这种基于模拟的训练中,我们必须测试数百种设置,速度至关重要。”郝教授的硕士研究生金东基说:“机器学习直接转化为我们在更短的时间内运行更多迭代的能力。AWS提供了一个强大的GPU实例,大大缩短了培训时间,加快了我们的研究步伐。”
豪认为,这项研究的商业化将需要5-10年,但它可能是未来人工智能应用的基本推动者。他说,合作和灵活机器人的使用几乎是无限的。
(北京,8月19日,《科技日报》-实习记者于浩源)