终于......阿法狗被打败了
科普小知识2021-07-23 15:04:03
...
人工智能的新突破——根据英国杂志《自然》18日发表的一篇论文,新版本的“阿尔法戈”计算机程序可以在没有任何人类指导的情况下,从空白状态快速“自学”。这个名为“阿尔法零号”的新程序击败了旧版本的“阿尔法零号”100-0。
人工智能最大的挑战是开发一种算法,它可以从零开始学习复杂的概念,并且学习的水平超过人类。在2016年3月的一场世界闻名的比赛中,谷歌的深度思维公司的“阿法尔狗”软件击败了人类围棋世界冠军。然而,为了赢得比赛,科学家们在训练“阿法尔狗”时,使用了监督学习(基于数百万专业人类棋手的下棋步骤)和强化自学。训练过程持续了几个月,使用了几台机器和48个TPU(神经网络训练所需的专用芯片)。
在最新的一篇论文中,英国深度思考公司“阿法尔狗”项目的主要领导者大卫·西尔弗、戴密斯·哈萨比斯和他的同事报道了“阿法尔狗零”的新版本。不同于以前的版本,以前的版本在学习围棋时依赖人类知识,新软件从“零”开始,完全是基于自己玩。人工输入仅限于棋盘和棋子,没有其他数据。“阿法尔狗零”只使用一台机器和四个TPU,并依靠训练有素的神经网络来预测程序自己的动作和游戏的赢家,在每个自我游戏中取得快速进展。
经过几天的训练,包括近500万轮的自我游戏,“阿法尔-零”已经能够超越人类,并击败所有以前版本的“阿法尔”。在程序训练的过程中,它独立地发现了人类几千年来才总结出来的围棋规则,并建立了一种新的策略来给这个古老的游戏带来新的见解。
推荐阅读