人工智能迷上了小霸王,而且玩的比你好
冒着暴露我年龄的危险,我还想说,我知道这件事对你意义重大:
红白相间的电视游戏是一代人的记忆,也许不愿让它们永远保持沉默。研究人工智能的专家们发现了一个让它们在第二个春天发光的机会——由人工智能来扮演。
谷歌在英国剑桥有一个子公司——深度思维。他们为人工智能玩雅达利(美国最大的电子游戏公司)游戏,希望他们能在玩游戏的同时学会如何与现实世界互动。这些人工智能软件非常喜欢电子游戏,如果他们坚持练习,他们会比人类玩得更好。
现在人工智能也在玩蜜蜂、砖块和弹球桌。
游戏世界似乎与现实世界无关,但事实上,学习过程和解决问题的逻辑是一样的:
观察→状态判断→行动→反馈→观察...
除了谷歌,还有一家叫奥萨罗的公司让人工智能玩游戏。奥萨罗开发的人工智能是基于神经网络和强化学习的设计。人工智能的神经网络与人脑的相似。理论上,如果人工智能有足够的照片,它可以通过这些已知信息识别照片中的一切。这种情况应用在游戏中,可以让人工智能知道当前游戏处于什么状态。此外,Osaro公司专门开发的递归神经网络可以使人工智能具有与人类相似的短时记忆:将过去的短时记忆与现在的短时记忆进行比较,可以更好地判断环境状态的变化和未来的发展趋势。
观察后,用强化学习来调整动作:如果动作结果是肯定的,下次再做,否则就放弃。游戏世界非常简单。分数奖励就像刺激人脑的多巴胺。如果一个动作可以增加分数,人工智能将更倾向于这样做,或者下次选择类似的方法。
将这种学习方法应用于真实场景是谷歌和奥萨罗的最终目标:例如,如果机器人成功地将杯子放在指定位置,它将得到奖励,如果它打破了杯子,它将受到惩罚。这样,它将理解人类想要什么,而不是机械地执行命令。
事实上,人工智能就像一个孩子。如果你试图在游戏中犯错,你最终会发现所有的通关技巧。虽然现实世界的复杂性是游戏无法比拟的,但对于人工智能来说,玩像“教鱼”这样的游戏更重要——学会如何学习比“学什么”更重要。
现在回想起来,你在玩游戏的时候有没有意识到一些模糊的事实?
原创文章,转载必须注明来自蝌蚪工作人员
上一篇:天文--木星的大红斑
下一篇:win7再见,win10你好