AI风暴再次来袭:扑克人机大战在海南开战
人工智能风暴再次来袭。从6日开始,著名的卡耐基梅隆大学扑克机器人Libratus将化身为“冷摔跤大师”,在海南与中国“龙队”展开为期5天、45小时的扑克人机大战。组织者在5日的赛前新闻发布会上宣布,获胜方将获得200万元的表演奖。
“冷攻击大师”是由卡内基梅隆大学开发的一个无限的德州扑克人工智能系统。今年一月,它击败了顶尖的人类选手。在这场比赛中,每次这些玩家做出一个动作,它都会被传送到卡内基梅隆大学的计算机服务器上。
2016年世界扑克锦标赛金手镯获得者杜跃是中国“龙之队”的领军人物。杜跃估计,虽然“冷大师攻击”是目前扑克界最强的人工智能,但顶尖的人类玩家仍然有10%的胜率。
创新工场首席执行官、人工智能工程学院院长李开复之所以发起这场人机扑克比赛,与他在母校卡内基梅隆大学(Carnegie Mellon University)1988年开发奥赛罗的经历密切相关,奥赛罗是第一个击败黑白国际象棋世界冠军的人机游戏系统。
“德州扑克是创意圈最喜欢的活动,人工智能是近年来创意圈的焦点。这项活动将在促进和推广人工智能方面发挥重要作用。"活动联合组织者李春光的运营总监董东泽告诉《每日科学》. "我当然希望人类能赢,但毕竟,这位“大师级冷摔跤手”已经在美国击败了*德国摔跤手。”董对董说道。
人工智能专家一直将这些游戏作为开发和测试的工具。在此之前,计算机已经在国际象棋和西洋双陆棋中击败了人类。去年的AlphaGo更加出名。"扑克有点不同,因为你不知道对手拿的是什么."作为德州扑克的粉丝,董东分析道。
谈到围棋和阿尔法围棋的区别,李说德州扑克更接近人性,因为信息是隐藏的,玩家可以诚实或欺骗性地表达。所有这些考虑更像是人们之间的商业和外交游戏。“主冷攻击”技术与这些因素有关。
在德州扑克中,通过对手的动作和表情来判断对手牌的强弱是一项非常重要的游戏技巧。作为一个冰冷的人工智能系统,“冷大师”如何应对人类棋手复杂的心理战?
作为回应,李开复说,对于“冷攻击大师”,心理战实际上是一种基于最大化优化结果的计算。它计算如何做才能得到最多的分数。他说,扑克机器人的发展是基于博弈论,并结合了大量的数学和概率论。扑克程序在比赛前没有绘制历史牌谱,而是在比赛的同时直接动态优化获胜率最高的数学模型,并利用策略推理揭示玩家牌的隐藏信息,从而构建智能人工智能谈判策略例程。在技术发展的背后,计算机实际上并没有模拟或分析人类玩家的心理战术,而是用博弈论和大量数学击败了顶尖玩家。
卡内基梅隆大学计算机科学学院院长安德鲁·摩尔教授认为,“冷大师攻击”表面上是一种扑克游戏,但实际上背后是一种大型协商算法。扑克人工智能不使用神经网络和机器学习,而是使用更经典的线性规划。
李开复认为,当前人工智能扑克项目背后的模型将适用于需要战略推理和多方谈判的情况。从商务谈判、商务谈判、外交谈判,甚至生活中的房屋销售谈判,人工智能将在10年内部分或全部取代它们。
(北京,4月5日,《科技日报》)