欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

机器学习是“炼金术”?

科普小知识2022-07-10 19:38:34
...

梯度下降依赖于实验和误差来优化算法,目标是在三维景观中最小化它。

资料来源:ALEXANDER AMINI/SCIENCE

加州旧金山的谷歌人工智能研究员阿里·拉希米去年12月对他的研究领域发起了猛烈的攻击,赢得了40秒的掌声。在一次人工智能会议上,拉希米指责机器学习算法,即计算机通过反复试验学习已经成为某种形式的“炼金术”。他说,研究人员不知道为什么有些算法可以工作,而有些则不行,而且他们在选择一种人工智能架构时没有严格的标准。在最近于加拿大温哥华举行的一个关于学习的国际会议上,拉希米和他的合作者列出了他们所看到的“炼金术问题”,并写下了“处方”来改善人工智能的严格性。

"这个领域有一个难题。"拉希米说,“我们中的许多人觉得我们在使用一种完全不同的技术。”

这个问题与人工智能的再现性问题完全不同。由于实验和出版实践之间的不一致,研究人员无法复制彼此的结果。它也不同于机器学习中的“黑盒”或“可解释”问题:解释特定人工智能如何得出结论的难题。正如拉希米所说,“我正试图把机器学习系统的“黑箱”与已经变成黑箱的整个领域区分开来。”

他说,如果没有对构建和训练新算法所需的基本工具的透彻理解,创造人工智能的研究人员就会像中世纪的炼金术士一样求助于谣言。加州山景城的谷歌计算机科学家弗朗索瓦·乔勒特补充道:“人们被*的崇拜所吸引”,并依赖于“民间传说和魔法咒语”。例如,他说,他们使用pet方法来调整人工智能的“学习速度”(一个算法在多大程度上纠正了每个错误),而不是理解为什么一个算法比其他算法更好。在其他情况下,人工智能研究人员训练他们的算法只是为了在黑暗中绊倒。例如,他们执行所谓的“随机梯度下降”来优化算法的参数,以获得尽可能低的故障率。然而,尽管有数以千计的关于这一主题的学术论文和无数应用这一方法的方法,这一过程仍然依赖于反复试验和纠错。

拉希米的论文强调了浪费的努力和可能的次优表现。例如,它指出,当其他研究人员从最先进的语言翻译算法中去除大部分复杂性时,它实际上可以更好地将英语翻译成德语或法语,而且效率更高,这表明它的创造者没有完全理解这些额外部分的好处。相反,英国伦敦推特上的机器学习研究员费伦茨·胡萨尔(Ferenc Huszar)说,有时候算法附带的铃声和口哨声是唯一好的部分。他说,在某些情况下,算法的核心存在技术缺陷,这意味着它的良好结果“完全归功于上面应用的其他技术”。

Rahimi为理解哪种算法最有效提供了一些建议。他说,对于初学者来说,研究人员应该像翻译算法一样进行“删减研究”:一次删除一个算法的某些部分,以查看每个组件的功能。他呼吁“切片分析”。在这个过程中,需要对算法的性能进行详细的分析,以确定在某些地方的改进是否会在其他方面产生成本。他还说,研究人员应该在许多不同的条件和设置下测试他们的算法,并报告所有测试的性能。

加州大学伯克利分校的计算机科学家、拉希米炼金术主题论文的合著者本·雷希特(Ben Recht)表示,人工智能应该向物理学学习,该领域的研究人员通常会将问题缩小到更小的“玩具问题”他说:“物理学家很擅长设计简单的实验来寻找现象的解释。”一些人工智能研究人员已经开始使用这种方法。在处理大的彩色照片之前,他们首先在小的黑白手写字符上测试图像识别算法,以便更好地理解该算法的内部机制。

伦敦一位思维深刻的计算机科学家Csaba Szepesvari说,在这个领域仍然需要减少对竞争性测试的重视。他说,如果论文中报告的算法比一些基准更好,而不是阐明软件的内部工作原理,那么现在更有可能发表。这就是高级翻译算法如何通过同行评审的。“科学的目的是产生知识,”他说。"你需要生产一些别人可以使用并且可以作为基础的东西."

不是每个人都同意拉希米和雷希特的批评。纽约脸谱网首席人工智能科学家Yann LeCun担心,将过多的精力从尖端技术转移到核心理解上可能会减缓创新,阻碍人工智能的实际应用。"这不是炼金术,而是工程学."他说,“工程是混乱和复杂的。”

Recht找到了一个适合系统和冒险研究的地方。“我们都需要。”他说,“我们需要知道失败是从哪里来的,这样我们才能建立一个可靠的系统。我们必须推进边境建设,这样我们才能在这条路线上有一个更好的系统。”(晋南编)

阅读更多

科学相关报道