比围棋还复杂的星际争霸,AI怎么玩?
围棋人工智能辉煌地结束了,巨人们转向了星际人工智能。游戏一直是衡量人工智能水平的重要指标。
最近,实时战略游戏人工智能竞赛中的一个轰动性竞赛——2018国际星际争霸人工智能竞赛的结果已经发布。世界上的27支队伍在12台电脑上战斗了两周。每个机器人参加了大约2600场比赛,并在两个机器人之间进行了100场比赛。经过总共3万多轮的轮换,前三名落到了韩国三星的SAIDA、美国脸谱网的樱桃皮和中国科学院自动化研究所的CSE。
去年,生产阿尔法围棋的公司谷歌深度思维宣布,下一步将把星际争霸作为一个研究平台。同年,脸谱人工智能实验室也开始开发星际人工智能。为什么这个巨人会爱上诞生于1998年的经典实时战略游戏《星际争霸》?
硬编码赢得冠军,但不如职业玩家。
星际迷航人工智能竞赛有着悠久的历史。自2010年起,该活动将每年举办一次,由纽芬兰纪念大学的大卫·丘吉尔赞助,并由许多著名的中外机构如谷歌深度思维和脸书赞助。人工智能机器人在《星际争霸:母巢之战》中相互战斗。最后的结果是根据整体的胜率来排列的。
排名第三的张俊阁教授介绍说,AIIDE规定参赛机器人可以通过BWAPI进入游戏,并且每个参赛机器人不得以任何方式作弊。这场比赛打开了战争的迷雾,并试图尽可能接近人们相互争斗的真实情况。参赛机器人的运行速度不得超过时间限制,否则将被判定为输了比赛。
"成为第一个赢得人类职业的机器人!"心怀远大梦想的韩国三星机器人赛伊达获得了冠军。该团队尝试了机器学习技术,但最终采用了非机器学习的硬编码技术。张俊阁表示,三星曾经拥有一个星际争霸专业团队,在获取专业知识方面具有优势。去年,它通过内部编程竞赛选出了最优秀的员工。今年1月,它开始建造赛达,目标是世界冠军。
去年,主宰比赛的独立业余选手占了参赛选手的一半,但今年他们很少。最初,樱桃皮背后的组织,脸谱人工智能实验室,从去年的竞赛中聘请了几个顶尖的作者加入他们的团队。
中国科学院自动化研究所智能系统与工程研究中心开发的CSE获得第三名。该中心是自动化研究所设立的独立科研部门。它致力于研究游戏对抗和自主进化智能,包括感知智能和认知决策智能。
"目前,人工智能游戏的主要研究方向是深度强化学习算法."张俊阁说,这种算法也可以用于机器人和自动驾驶领域,“从长远来看,它也是通向一般人工智能的重要基础”人工智能技术将在未来逐渐成熟,并将在制造、金融、物流等许多行业得到重要应用。
这比去难多了,我看不出谜底。
对于人工智能来说,玩星际争霸还有什么比去玩更复杂的呢?简而言之,即使谷歌深度思维的阿尔法狗在围棋中击败了世界冠军柯杰,它在《星际争霸》中仍未取得任何公开的成就。张俊阁说,衡量一个游戏的复杂性主要取决于观察空间、动作空间以及是否能观察到所有信息。"从这个角度来看,《星际争霸》比《围棋》要复杂得多."
在观察空间,星际争霸观察整个屏幕上显示游戏内容的区域和小地图上的区域。每个像素都是观察空间的一部分,每个像素都包含了很多信息,比如它是否在战争的迷雾中,在当前的时间点,哪些武器或建筑覆盖了哪些像素。围棋的观察空间只有棋盘上放置棋子的361个位置,每个位置只有太阳黑子、白子和无子。
在动作空间,星际争霸的鼠标可以点击屏幕上的任何地方,选择方块,并对方块执行复杂的操作。围棋只能把棋子放在没有棋子线穿过的点上。
“由于战争的迷雾,玩家无法看到超出一定范围或被自己单位的障碍物阻挡的场景信息。”张俊阁说《星际争霸》无法观察到所有的信息。玩家的视角只是主视角和迷你地图上有限的信息。要获取所有信息,请点击迷你地图,或者编辑或剪切屏幕。即使你学会了这些技能,你仍然无法在某个时刻获得战场上的所有信息。"信息的缺乏迫使玩家经常发现和猜测他们的对手采取了什么策略。"相比之下,围棋,整个棋盘对两个玩家都是可见的,并且是完全可见的。星际争霸是部分可观察的,属于不完全信息游戏。