终于......阿法狗被打败了

科普小知识2021-07-23 15:04:03

...

终于......阿法狗被打败了

人工智能的新突破——根据英国杂志《自然》18日发表的一篇论文，新版本的“阿尔法戈”计算机程序可以在没有任何人类指导的情况下，从空白状态快速“自学”。这个名为“阿尔法零号”的新程序击败了旧版本的“阿尔法零号”100-0。

人工智能最大的挑战是开发一种算法，它可以从零开始学习复杂的概念，并且学习的水平超过人类。在2016年3月的一场世界闻名的比赛中，谷歌的深度思维公司的“阿法尔狗”软件击败了人类围棋世界冠军。然而，为了赢得比赛，科学家们在训练“阿法尔狗”时，使用了监督学习(基于数百万专业人类棋手的下棋步骤)和强化自学。训练过程持续了几个月，使用了几台机器和48个TPU(神经网络训练所需的专用芯片)。

在最新的一篇论文中，英国深度思考公司“阿法尔狗”项目的主要领导者大卫·西尔弗、戴密斯·哈萨比斯和他的同事报道了“阿法尔狗零”的新版本。不同于以前的版本，以前的版本在学习围棋时依赖人类知识，新软件从“零”开始，完全是基于自己玩。人工输入仅限于棋盘和棋子，没有其他数据。“阿法尔狗零”只使用一台机器和四个TPU，并依靠训练有素的神经网络来预测程序自己的动作和游戏的赢家，在每个自我游戏中取得快速进展。

经过几天的训练，包括近500万轮的自我游戏，“阿法尔-零”已经能够超越人类，并击败所有以前版本的“阿法尔”。在程序训练的过程中，它独立地发现了人类几千年来才总结出来的围棋规则，并建立了一种新的策略来给这个古老的游戏带来新的见解。

上一篇：控制一群磁性微型机器人，打败你身体里的癌细胞

下一篇：人工甜味混合能打败“苦涩”