欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

科学视角解读人机大战:合法棋局数171位数

科普小知识2021-12-22 01:30:39
...

北京,3月12日(记者王慕清)——一场“人机战争”将人工智能的话题推向了公众。李世石已经连续输了两轮。科技的发展甚至让人们震惊。它甚至提醒他们星球大战是否真的会发生,人类是否会被机器统治。此时,我们不妨用科学的视角来理性、客观地看待人工智能的现状和未来。新华社(微信号:cns2012)记者采访了长期从事人工智能和智能科学研究的中国科学院计算技术研究所研究员石忠志,对“阿尔法围棋”和人工智能问题进行了解读。

你为什么在“人机大战”中选择围棋?171个数字“吓死你了”

“人机战争”的兴起早在1997年,当时IBM超级计算机“深蓝”击败了国际象棋大师加里·卡斯帕罗夫。科学界认为围棋的“人机大战”可以被视为人工智能的一个里程碑式的发展。“深蓝”的胜利曾经鼓舞了人工智能研究的士气,吸引了投资者对人工智能的兴趣。

至于围棋为何被选中,史中志教授解释道:“围棋之所以难以被人工智能攻破,也难以被人类专家击败,是因为它的可能组合非常大。至于这有多不寻常,2016年1月,普林斯顿大学的研究人员给出了最新的研究结果:对于一个19x19的围棋棋盘,有361个位置,每个位置可以分别填充黑色象棋、白色象棋或空白棋,理论上所有可能的组合都是3361。然而,根据围棋规则,并不是所有的位置都可以合法地取消。例如,在go术语中,没有气体就不能下降。”

“那么,在清除了这些非法象棋游戏之后,还剩下多少游戏呢?普林斯顿的研究人员给出了19x19游戏的合法游戏的确切数量:“2081681993819798499478633

3448627702865224538845305484256394568209274196127380153785

2564845169851964390725991601562812854608988831442712971531

9317557736620397247064840935 ."

" 171位数!"这个数字超过了地球上所有的沙粒!比已知宇宙中所有的行星都多!相比之下,谷歌已经学会了近10,000个人类游戏的5位数字,谷歌自己对战的3,000万个游戏的8位数字,以及所有可能的围棋游戏的171位数字。如果我们避免可能的重复变化,去掉大头,这也是一个70位数的象棋变化。

科学视角解读人机大战:合法棋局数171位数

“人机大战”表明人工智能已经达到了什么水平?

2013年10月29日,施中志在大数据创新驱动发展时代的人工智能高峰论坛上,提出了智能科学(人工智能)发展的“路线图”,其《心智计算》一书对此进行了详细阐述。

有人提到,人工智能将在2020年实现像计算一样的基本大脑,或基本大脑计算。在这个阶段,我们要达到的目标是计算机能够完成准确的听、说、读、写。到2035年,我们将进入类似计算的高级大脑阶段,即类似计算的高级大脑阶段。到那时,计算机不仅会有“智商”,还会有“情商”。到2050年,智能科学(人工智能)有望发展神经形态计算机来实现超脑计算。到那时,计算机的高性能将与人类的高智能完美结合。

史忠志认为:“按照这个标准,如果谷歌的人工智能程序‘阿尔法围棋’在围棋的这场‘人机大战’中最终击败世界冠军李石时,这将表明人工智能已经达到了像计算一样的初级大脑的水平。”

“AlphaGo”是如何工作的?

史忠志介绍,在演奏《阿尔法围棋》的过程中,作品主要分四个步骤完成,即:快速判断、深度模仿、自学和整体分析。

其中,快速判断是指用于快速观察围棋的面板,类似于人类观察面板所获得的第一反应。深度模仿是指“AlphaGo”学习近万名人类历史大师的象棋游戏来模仿和学习,并根据所获得的经验来判断。这种深度模仿可以根据盘面产生类似人类棋手的动作。

自学成长型是指“AlphaGo”不断与“自己”竞争,玩3000万盘棋,总结经验作为棋局评估的基础。全局分析是指利用第三步的学习结果来判断整个棋盘面的赢面,从而实现整个棋局的全局分析。

科学视角解读人机大战:合法棋局数171位数

现实中有人工智能吗?中国能建立类似的人工智能吗?

经过60年的风风雨雨,人工智能取得了巨大的进步,并已应用于各行各业。史中志在《人工智能》一书中将其分为八个方面:专家系统、数据挖掘、自然语言处理、智能机器人、模式识别、分布式人工智能、网络智能和游戏。

看到“阿尔法围棋”,人们自然会想到中国的类似技术,以及他们目前能否达到或超过这一水平。石中志说:“在国家自然科学基金、973、863等众多企业的支持下,在众多科研人员和应用单位的努力下,中国的人工智能已经与世界同步发展,尤其是在机器翻译、语音识别、人脸识别、农业专家系统、数据挖掘、深水机器人等领域。它还能够创造一个人工智能系统,战胜世界顶尖棋手。”

总有一天人工智能能打败所有人类棋手吗?如果是,需要多长时间?

李世石一个接一个地失去了,而柯杰甚至成了拯救人类围棋智慧“尊严”的最后一根稻草。史忠志认为,经过学习和积累,人工智能系统可以在未来3-5年内击败所有人类玩家。

为什么这种人工智能如此强大,我们不妨深入挖掘其内涵:“AlphaGo”的核心是两个不同的深层神经网络:“政策网络”和“价值网络”。他们的任务是合作“挑出”更有希望的动作,并丢弃明显的坏动作,从而将计算量控制在计算机能够完成的范围内。

其中,“价值网络”负责减少搜索的深度——人工智能在计算时会判断情况,当情况明显较差时,它会直接放弃一些路线,而不是把一条路线算成黑色;“战略网络”负责缩小搜索的宽度——面对当前的国际象棋游戏,有些棋步显然是不该走的,比如不该把孩子送给别人随便吃。

然后,通过将这些信息放入概率函数中,人工智能不需要对每一步都给予同等程度的关注,而是可以专注于分析那些有希望的动作。“AlphaGo”使用这两种工具来分析形势,判断每个子战略的优缺点,就像人类棋手可以判断当前形势和推断未来形势一样。以这种方式,“AlphaGo”分析例如接下来的20个步骤,并可以判断哪里获胜的概率高。

据媒体报道,Alpha Go使用机器学习方法,主要是深度卷积神经网络和强化学习。R&D队收集了大量围棋专业棋手的棋谱,用这些棋谱训练了3000万步的“深度卷积神经网络”,使得专业棋手判断下一步棋的正确率达到57%,而之前的记录是44%。(原标题:未来3-5年赢得所有人类棋手的人机战争的科学解释)