深度学习复兴:向人工智能迈进
这是未来的一部分,我们才刚刚开始。
照片来源:bruceloff
三年前,美国加州山景城神秘的谷歌x实验室的研究人员从YouTube视频中提取了1000万张静止图像,并将其输入到“谷歌大脑”——一个由1000台电脑组成的网络,试图像一个蹒跚学步的孩子一样吸收世界信息。经过三天对重复模式的搜索,谷歌的大脑可以根据自己的判断识别某些重复的类别:人脸和人体,甚至猫。
谷歌的大脑在互联网上随处可见猫的视频,这也引发了一系列笑话。然而,谷歌大脑是深度学习复兴的里程碑。深度学习是一项有30年历史的技术,在这项技术中,大量的数据和强大的处理能力帮助计算机解决人类几乎可以直观解决的难题——从识别人脸到理解语言。
深度学习本身是旧的神经网络思想的复兴。这些系统的灵感大多来自大脑中紧密相连的神经元,它们通过改变模拟神经连接的强度来模拟人脑的学习。谷歌的大脑有大约100万个模拟神经元和10亿个模拟连接,比以前任何深度的神经网络都强10倍。该项目的创始人吴恩达目前是加州斯坦福大学人工智能实验室的负责人。他的发展将深度学习系统的强度提高了10倍。
人工智能的这些令人兴奋的进展试图让计算机像人类一样思考。纽约大学数据科学中心主任、深度学习领域的先驱Yann LeCun说:“人工智能失败了无数次,只取得了一点点进展。现在它已经实现了突破。”
“在未来几年,我们将看到一个疯狂的局面:许多人将追随深度学习的趋势。”加州大学伯克利分校研究图像识别的吉坦德拉·马利克同意这一观点。然而,从长远来看,深度学习并不流行,一些研究人员正在寻找其他有前途的技术。“我是一个不可知论者。”马利克说,“随着时间的推移,人们将决定不同领域的最佳技术。”
刚离开家或学校工作。
马利克说,最初的深度学习计划没有比其他更简单的系统表现得更好。此外,它们仍然很难处理。"神经网络管理一直是一门微妙的艺术,带有一些黑魔法."网络需要从丰富的例子中学习,就像婴儿从世界上收集信息一样。在20世纪80年代和90年代,没有多少数字信息可用,计算机需要很长时间来消化现有的信息。当时,相关的应用很少。乐村开发的技术是为数不多的应用之一,现在被银行用来阅读手写支票。
然而,在21世纪,像乐村这样的倡导者和他的前任主管、加拿大多伦多大学的计算机科学家杰弗里·辛顿都相信,计算能力的提高和数字数据的爆炸意味着是时候再次推动这项技术向前发展了。“我们想向世界展示,这些深层神经网络真的很有用,可以提供真正的帮助,”韩丁的现任学生乔治·达尔说。
起初,辛顿、达尔等人解决了语音识别中一些对商业应用很重要的难题。2009年,研究人员报告称,他们的深度学习神经网络通过典型数据集的实践,打破了口语转换为文本的准确性记录。
*
当谷歌在其安卓智能手机操作系统中采用基于深度学习的语音识别技术时,其文本错误率下降了25%。"人们期望在10年内达到这一下降水平。"韩丁说,“这相当于10项突破。”
与此同时,吴说服谷歌使用其数据和计算机,谷歌的大脑就此诞生。识别猫的能力是无监督学习的有力证明。无监督学习是最困难的学习任务,因为它的输入不包含任何解释性信息,如名称,标题或类别。然而,吴很快就遇到了麻烦。除了谷歌,很少有研究人员拥有进行深入研究的设备。因此,吴回到斯坦福大学后,开始使用图像处理单元来开发一个更大、更便宜的深度学习网络。吴说:“有了价值约10万美元的硬件,我们可以用64个图形处理器构建一个110亿个连接的网络。”
胜利后
然而,需要更多的努力来说服计算机视觉领域的科学家:他们希望看到标准测试的结果。马利克相信,赢得国际知名的ImageNet竞赛将取得理想的结果。
在竞赛中,每个团队都开发了一个基于数据集的计算机项目,该数据集包含大约100万张属于同一类别的图像。2012年,辛顿的实验室成为第一个使用深度学习的竞争对手,错误率只有15%。这一次,韩丁在谷歌找到了一份兼职工作。2013年5月,谷歌使用该程序更新了其图像搜索软件。
马利克被说服了。他说:“在科学中,你必须接受经验证据,这是明确的证据。”后来,他利用这项技术在另一场视觉识别比赛中打破了记录。许多其他团队也跟随这一趋势。2013年,参与ImageNet竞赛的团队都使用了深度学习技术。
随着深度学习技术在图像和语音识别中的成功,人们越来越有兴趣将其应用于自然语言理解(例如,完全理解人类语音以解释或回答问题)或翻译语言。类似地,这些任务现在可以通过使用手动编码规则和已知文本的统计分析来实现,例如谷歌翻译。众包专家路易斯·冯·安说:“深度学习技术将有机会比目前使用的技术做得更好。”他的公司,位于宾夕法尼亚州匹兹堡的多林哥,依靠人而不是电脑进行文本翻译。“每个人都认为是时候尝试不同的东西了。”
同时,深入学习技术已被证明能够完成各种科学任务。2012年,默克制药公司为能够帮助预测有用候选药物的最佳项目提供奖金。达尔和他的同事使用深度学习系统赢得了22,000美元。
尽管深度学习技术已经取得了许多成功,但它仍处于初级阶段。“这是未来的一部分。”达尔说,“我们才刚刚开始。”(张冬冬)
中国科学新闻(2014-014第三版国际版)
阅读更多关于自然的内容
上一篇:垂枝藓
推荐阅读