欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 教育教学

AlphaGo是怎么战胜李世石的?

科普小知识2022-05-10 16:04:52
...

北京时间2016年3月9日下午15: 00,经过三个多小时的激战,李石师九段向“阿尔法戈”投降。这是第一次顶尖的人类围棋手输给电脑。

AlphaGo是怎么战胜李世石的?

李世石在思考

消息传来,有一些欣喜,一些震惊,更多的人,大概是困惑,"他们兴奋什么?"

AlphaGo的胜利是深度学习和算法的胜利。鼠标的每一次点击,手机上的每一次购物,天空中的卫星飞行,水中的潜水艇,与你钱包相连的股票的涨跌——我们的世界是建立在算法之上的。

你对他们了解多少?

枚举法

一直以来,计算机科学给了人们一种深刻的感觉。许多人如此害怕,以至于他们自动打消了学习计算机知识的热情。

"我不擅长数学,所以我学不会。"

“我是女生,学什么电脑?!”

事实上,情况并非如此。计算机科学作为自然科学的一个新成员,自然有许多“高端大气、高端品位”的想法,不写5页是无法解释清楚的。同时,它也有一些你我已经知道的东西。

孙先生洪磊,大家一定都认识他。在电影《战国》中,孙膑(孙)与齐的军队作战,中途收留了数百名受害者。齐的情报系统告诉孙膑,受害者中有敌方间谍。如何匆忙判断谁是敌人?

孙军师心中有了一个计划,他命令手下人煮粥,并在粥里加很多辣椒。一般人肯定不会喝这种味道,但灾难受害者是不同的。每个人都快饿死了。谁敢选择食物?下属表扬了主谋的主谋,升职加薪指日可待...

还有更多的事情要做,所以由于空间的限制,我不会谈论它。有更好的方法吗?

是的。如果你决心一个接一个地杀人,你将永远杀死间谍。

这就是计算机有时处理问题的方式。五把钥匙中,一把是对的,一把试图打开锁。这是枚举方法。这听起来有点迟钝,但是计算机非常快,所以到目前为止,它仍然是有用的。

密码管理服务提供商SplashData发布了最流行的密码。如果黑客再次尝试这些密码,他们会获益良多。

AlphaGo是怎么战胜李世石的?

最流行的密码,照片来源:SplashData

此外,他们还可以窃取A公司的服务器内容,获取一堆账号和密码,然后一个一个放在B网站上进行测试。懒惰是所有人的通病,在公司a和网站b中必须有使用相同账号和密码的客户。这样,你的钱包就会丢失。

数据压缩

在过去的两年里,硬盘的价格大幅下降,但与此同时,游戏的数量也在增加,一些人仍然认为硬盘不够用。另一方面,随着3G、4G和移动设备能力的提升,许多人喜欢花钱成为会员,在线或下载,听无损耗的歌曲。我们怎样才能缩小游戏的规模?什么是无损音乐?

这从数据压缩开始。

考官,你后面有一个低年级同学。我低声问你多选题的答案。作弊当然是错误的,但是现场需要你去帮助他。

如果总共有20个选择题,每个问题的答案都是a,你会一个一个地读给他听,还是说“都是a”?正常人肯定会选择后者,这样不仅省时省力,而且不会丢失信息,这与“三好三好”的效果是一致的。

在这个过程中,您通过统计分析来总结规则,并使用较少的字段来描述所有信息,这就是无损压缩。计算机上的无损压缩当然要复杂得多,可能有“ABABAB……”和“AB10AAB”,但基本思想是一样的。

现在让我们改变现状。你爱一个女孩,她在北京,你在上海。少采多留,错过越来越多。你很自然地想知道对方每时每刻是什么样子。然而,你不能雇一个摄影师全天候跟着她,对吗?所以你同意每天选择一些特定的时刻,早上起床的时间,晚上睡觉的时间,白天工作的时间,周末休息的时间。

20小时的内容压缩到几分钟,数据量大大减少。这是第一个好处。有些情况你看不到,这是第一个缺点。当照片在你手里时,你可以根据你对她的理解大致恢复她的状态,这是第二个好处。

AlphaGo是怎么战胜李世石的?

有损压缩量和质量变化,图像来源:http://itindex.net/

“相互受益的权利是有分量的”,这不利于压缩,因此很受欢迎。

例如,当你使用微博时,你上传了一张自拍。新浪的服务器会将照片还原成明暗相间的小点,然后使用有损压缩。例如,您可以每隔几行剪切一部分数据,并用小点附近的阴影值填充它。新浪节省存储空间,你降低交通成本,和图片质量,差别不是很大,为什么不呢?

公钥加密

公钥加密是一种非常古老的做法——在计算机领域,超过十年的时间被认为是古董。

春天来了,天气晴朗。许多人喜欢去购物。这一天,你和你妈妈正在购物,这时你遇到了小明和小明的妈妈。你们两个以前讨论过郊游,但是你不想让你的父母跟着去。

现在你想把时间定在星期六。

你可能会突然想到,上周五,萧蔷受到了惩罚。所以你可以说,“你还记得杰克·鲍尔被惩罚的那一天吗?总有一天会把它推回来。”

在肖强被惩罚的那一天,他是一把钥匙,可以用来撬开你们俩的对话。同时,它也是一把私人钥匙,只有你和小明知道。

公钥加密有些不同。“公钥”,顾名思义,密钥是公开的。

慢慢地,你和小明长大了,成了栋梁,被聘为人类外星探索的先驱,降落在一个外星星球上。没想到,这个星球上还有土著。他们打算逮捕你们两个并监控你们的通讯渠道。

小明问:“你现在有几发子弹?”

如果你直接说出数字,外星人会马上知道。如果你说“N+5”,小明不知道N是什么。

这时,你发现外星人不知道组织。我们如何利用这种情况?

首先,你仍然加密信息,并告诉小明,“我的子弹数是N+5”。

然后,你说,“选择一个数字。”

外星人自然会听到,但没关系,数量是无穷无尽的,碰撞的概率很小。你选择了3,小明选择了2。

接下来,你发布一个数字,“9”,然后用3乘以9得到27。小明也是,2乘以9得到18。至于外星人,他们的数量和你的不同,结果自然也不同。

随即,你宣布“答案是27”,小明也宣布“答案是18”。

最后,见证奇迹的时刻到了:你把小明宣布的数字“18”乘以你的私人数字“3”,得到54;小明,他把“27”乘以“2”,结果是一样的。——(2X9)X3=(3X9)X2 .

当我们访问淘宝时,我们经历了这样一个场景。您发送的支付信息将通过多台服务器传输。如果不加密,你的支付信息将暴露给互联网傻瓜。如果你定制一套密码,安全性是安全的,但淘宝不知道你在说什么。你愿意总是“不付款”吗?因此,信息必须用公钥加密。

因此,不是“害群之马”让马云通过“买买”成为首富。技术进步是淘宝成功的关键之一。

AlphaGo是怎么战胜李世石的?

马云在第二届世界互联网大会闭幕式上发表主旨演讲

匹配和排名

谷歌刚成立时,它只是斯坦福大学的一个学生研究项目。在过去的20年里,谷歌深刻地影响了世界。世界也见证了谷歌的成长,从学校到车库,从最初的10万美元投资到超过1000亿美元的净资产,从一个小搜索框到覆盖手机通信和在线教育等多个领域的互联网巨头。

为什么谷歌在全世界都很受欢迎?

因为谷歌的搜索引擎特别有用。

为什么谷歌的搜索引擎如此有用?

因为谷歌的匹配和排名算法非常优秀。

例如,当我们发起搜索请求时,在谷歌上输入“川菜的特色是什么”。谷歌的服务器首先匹配找到我们想要的网页,然后排名来判断不同网页的优先级,即计算权重,并将最想要的排在前面。

匹配就像查字典。难点是如何教计算机查字典。“什么是”不管;“川菜特色菜”是正确的说法,“川菜”用来修饰“特色菜”。计算机不理解这些。因此,首先,计算机应该查看互联网上的所有网页,并从网页的文本中提取能够代表网页的关键词。然后,这些关键字被存储和标记,类似于字典的索引,“一个单词在一页上”;最后,服务器搜索包含“川菜”的所有网页和包含“特色菜”的所有网页,比较两者,并找出重复部分。这可能是用户需要的。

问题是,有许多,也许是数百万个这样的网页。你如何分类?我们能不能把第一页放在一起?否则,50英寸的显示器是不够的。

谷歌的崛起是由于它的排名。1998年,谷歌创始人拉里·佩奇和谢尔盖·布林发表了《大规模超文本网络搜索引擎剖析》。由于技术上的限制,计算机不可能直接模拟人脑,区分什么是重要的,什么不是。佩奇和布林发现了一个计算机可识别的指标:排名值。

PageRank值可以简单地理解为一个网页被引用的次数。例如,有100个网站同时包含“川菜”和“特色菜”,满足搜索要求。其中,99个网页通过超链接提到了最后一个网页,所以最后一个网页是最接近用户需求的网页。

AlphaGo是怎么战胜李世石的?

谷歌正在测试无人驾驶汽车

图像识别

PageRank值本质上是一个等价的概念,用一个可以被计算机使用的标准来代替人类标准。“高价值”意味着人们“最想要的”。这样,计算机就能完成我们交付的任务。

有时候,问题并不那么简单。例如,计算机应该如何识别图像?此外,计算机能识别人的面孔从而了解人类的喜怒哀乐吗?

喜欢看美国电视剧的人肯定对谢尔顿很熟悉。在剧中,谢尔顿不仅是一个物理学天才,而且在十几岁时就开始攻读博士学位,这令人钦佩。他在生活中也是一个智力迟钝的人。他甚至看不到他的朋友们是高兴还是生气,这让人笑。

如果谢尔登付钱让你教他如何识别面部表情,你该怎么办?

你的第一反应可能是找一台摄像机记录下他朋友的喜怒哀乐,然后一个接一个地分析给谢尔顿听,这样他就能记住关键点,他高兴的时候眉毛在哪里,嘴唇如何,生气的时候如何,区别在哪里。

思考没有大的错误,但只有两个缺点:第一,每个人每次笑起来都有点不同,有“激动得流泪”和“在长歌中哭泣”这样的场景;其次,即使他学会了,他也只能认出他朋友的面部表情。

因此,我们改进了计划。首先,我们选择最典型的表情,然后我们寻找最典型的表情,最后,我们为计算机建立一个决策树。

当计算机得到一张照片时,它会将测试数据与决策树上以前的样本数据进行比较。

AlphaGo是怎么战胜李世石的?

典型的决策树,图片来源:http://dataunion.org/

最后,计算机给出了它的结论,“这是一张人的照片;他在哭”。研究人员将对结果进行评判、奖励或修改。这样,计算机就可以逐步建立一个决策系统来准确识别人们的表情。

数学中有一些没有意义的点,比如y=1/x,我们都知道x不能是0,因为那个公式是没有意义的;物理学中也有一些东西,例如,宇宙诞生在一个奇点,它指的是一个体积无限小、密度无限大的点。所有的物理定律都不适用于它。遵循这些概念,一些人提出了一个技术奇点,认为在未来的某个时刻,技术将经历几乎无限的进步,使我们以前的预测和生活方式变得无效。

AlphaGo是怎么战胜李世石的?

(人类发展速度与时间的关系,图片来源:waitbutwhy.com)

许多名人,比尔·盖茨和斯蒂芬·霍金,警告说人工智能可能是奇点,超级计算机可能导致人类的毁灭。

现在,阿尔法戈赢得了第一场战斗。围棋还能称为“人类最后的骄傲”吗?我们的未来将走向何方?

罗伯特·海因莱因在他的最后一本书《爱情的时间够了》中写道,“人脑能够制造的最复杂的机器的能力也必须受到人脑的限制。”乍一看,这是为了鼓励人们想象在制造飞机之前,他们必须考虑“飞行”。然而,我从内心吸取了一点道德的味道。

我对比尔·盖茨和其他人没有不敬。然而,我们制造的机器肯定会继续我们对世界的理解,并服从于我们对真、善、美的定义。有什么好害怕的?