玩游戏比人厉害的AI是如何做出来的？

科普小知识2022-07-13 23:29:24

...

因此，当DeepMind的团队在2013年12月第一次展示他们最终成为通过不断尝试和错误学习打败人类职业玩家的人工智能玩家时，在场的许多人工智能专家都有些震惊。这些人工智能依靠对游戏视频的观察来找出模式，然后操作控制器并获得分数的反馈结果(高分奖励)。在反馈中，他不断调整自己的控制，最终人工智能学会了通过自学而不是编码来玩49种雅达利电子游戏，其中43种比以前的人工智能要好。在23场比赛中击败了职业人类选手。在这些游戏中，简单的弹球和拳击游戏人工智能玩得最好，但是经典的砖块突围游戏也可以玩得很好，甚至学会了打开一个通道让球跑到后面去移除砖块(请看下面的视频，注意人工智能如何在游戏中改进它的策略)。这项技能通常只被有经验的玩家使用。许多研究人员仍然对一年后他们是如何做到的感到困惑。但是现在他们不需要被混淆，因为深度思维团队现在已经在《自然:通过深度强化学习的人级控制》上发表了他们的研究成果——通过深度强化学习实现人级控制。

研究中包含的视频

总的来说，深度思维人工智能设计的核心是如何让计算机自己发现数据中的模式。解决方法是将深层神经网络和强化学习相结合。人工智能不知道游戏规则，但是使用深层神经网络来理解游戏状态，并找出哪种行为导致最高分。尽管几十年来模拟神经网络一直被用来教计算机玩游戏(如军事象棋游戏)，但没有人能像普朗克智能系统研究所的DeepMind团队Bernhard Sch&ouml那样以如此有用的方式将它们结合在一起。lkopf董事表示，他的计划显示出令人印象深刻的适应性。

一方面，由于现在计算能力的提高，人工智能可以处理更大的数据集。你知道，观看雅达利游戏相当于每秒处理200万像素的数据。另一方面，它是由于深度思维和强化学习的结合来训练人工智能的，是在高维感官输入中使用的端到端强化学习。与以前的电脑游戏如象棋相比，这款电脑游戏更接近现实世界的混沌。谷歌的智能设计师戴密斯·哈萨比斯说，这是第一个能够在一系列复杂任务中匹配人类表现的算法。

谷歌会使用这个人工智能来分析自己的大规模数据集吗？Hassabis没有给出任何明确的陈述，但表示该系统对于任何连续的决策任务都是有用的。如果我们将谷歌收集的用户数据与像素进行比较，将广告收入与分数进行比较，深度思维的人工智能系统也可以用于谷歌的核心广告业务。命中率越高，人工智能投放的广告得分越高，因此人工智能可以不断进化和优化广告投放算法。伦敦大学金斯敦学院的迈克尔·库克甚至给出了确切的数字，称谷歌已经在七种产品中采用了深度思维技术。它会包括谷歌开发的自动汽车吗？也许用不了多久，我们就能感受到DeepMind支持的产品的性能差异。

上一篇：科学家发现人类研究中最厉害的HIV病毒

下一篇：西游记十大高手排行