欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 自然科普

AI那厮:新理论该怎么为概念下定义?

科普小知识2022-05-12 14:45:47
...

好的工作定义的最终标准是基于它的理论能够达到的高度。

作者|王佩(美国坦普尔大学计算机与信息科学系)

人工智能的定义是一个已经被讨论过的没有吸引力的话题,但是经常不得不重新开始。1950年,图灵的文章《计算机与智能》提出“思维”和“智能”应该由行为来定义,这开启了人工智能的序幕。在接下来的几十年里,各种各样的人物轮流登台,但是到目前为止,对于这部戏剧的主题还没有达成共识。直到去年,一个德国研究中心还收集了数百个“智力”的定义。由于没有人能说服任何人,大多数人已经认为这样的讨论是浪费时间。然而,另一方面,这个领域中几乎所有的主要分歧最终都会归结为对“人工智能”的不同理解,因此这个问题不能被忽视。如果这以前基本上是一个理论问题,现在将成为一个社会问题。例如,世界各国*现在都在计划应对人工智能,但如果他们甚至不能说出目标是什么,就很难制定正确的政策。

在这种情况下,为什么不先澄清定义呢?这将从正在发生的事情的定义开始。这真的不像乍看起来那么容易。不服气的读者可以继续读下去。如果你对以下问题有好的想法,嘲笑我们的无能还不算太晚。

依靠“力量”抵制定义

从小学开始,我们就知道一个词的“定义”决定了它的含义,从而为它的使用提供了一个标准。这些定义列在字典和词典中。记住它们,然后跟着它们走。但是字典的定义从何而来呢?据说它是根据单词的当前使用习惯来组织的。这又不是“鸡生蛋还是蛋生鸡”的问题。

从认知科学的角度来看,词的主要功能是在交际中表达概念,所以词的意义仍然来源于概念的意义。我所说的“意义”是什么意思?“它介绍了几种意义理论,这里就不再重复了。简而言之,由于一个概念的意义取决于经验,同一单词(以及它所表达的概念)在不同的人心中有不同的意义是不可避免的,也是正常的。我们的思想和语言在不断发展,这种发展的一个重要方面就是意义的变化。目前,有些人有时用某个词的“古义”来贬损它的“现在义”,这是对语言本质的缺乏理解。即使同一个人使用同一个词,在不同的时间也会有有意义的变化,更不用说不同的人了。

但是这个问题还有另外一个方面。由于语言的主要功能是交流,所有有关各方必须对所用词语的含义有一个普遍的共识或一致意见,否则将是先有鸡还是先有鸭。定义和编纂字典都是建立这样一个协议的努力。在交际过程中,人们还会根据交际的对象来选择词语,并明确其含义,以达到预期的交际效果。一般来说,定义当然是一件好事,但这并不是说没有公认定义的词就没有意义,或者偏离字典定义是不合理的。

一个词的意思总是随着一个人的变化而变化,如果一个“新想法”被越来越多的人所接受,它就会逐渐传播并最终取代“原始想法”。在交流过程中,这些“发明”有引起误解或困惑的风险。因此,它们中的大部分不会被广泛传播从而成为普遍标准的一部分,而是成为一个小圈子的内部协议,尽管这种协议的实际力量往往比字典中的定义更强。鲁迅在《阿q正传》中提到这一现象:“阿q进城几次后,自然更自负。然而,他非常鄙视市民。例如,由三英尺三英寸宽的木板制成的凳子被魏庄人称为“板凳”。他也被称为“板凳”,而镇上的人被称为“板凳”。他认为:这是错误和荒谬的!”。不难想象,一些城市居民会在同一个问题上嘲笑魏庄人。

在人工智能的定义中也有这种“相互蔑视”。业外人士经常嘲笑人工智能专家吹牛甚至撒谎:“你就是这么做的吗?”;然而,业内人士认为外行正在暴露他们的无知:“我们指的是人工智能。除非你明白,否则什么也别说!”双方都是有道理的。刘易斯·卡罗尔在《爱丽丝镜中奇遇》中描述了一个粗壮的矮胖子。他曾夸口说,“当我使用一个词时,它总是准确地表达我想表达的东西,既不多也不少。”这种人在许多争论中都可以看到。他们总是觉得自己在使用某个词的“正确含义”,很少考虑对方为什么不这么认为。

事实上,在与定义相关的对抗中,“反叛”(对定义的违反或修改)和“镇压”(定义的建立和维护)都是合理的,最终的结果是“成为国王和打败敌人”。这样,不是简单地玩50个大棋盘来显示公平,而是说对一个具体“违规”的奖励和惩罚实际上是双方斗争的结果,没有一个是自然正确的。“尊重传统”和“与时俱进”是有限度的。

聊天机器不“聊天”

虽然上面的话看起来像是常识,但是如果我们考虑自然语言理解的工作,我们仍然可以看到许多问题。在早期的“基于规则”的方案中,尽管许多定义是隐含的,也就是说,它们通过系统对相关词的处理来体现,但大多数人希望通过定义来掌握每个词的含义。这种方案的问题在于,许多词极难定义。即使在字典里,他们也经常列出几个不同的意思,而没有说明在特定情况下如何消除歧义。近年来,这个领域已经转移到计算各种单词的具体用法,所以不需要预先定义。这样做更简单、更实用,但该词的“定义”仍然存在,只是在所用的训练数据集中显示了该词的统计特征。

从应用的角度来看,这种方法对于许多产品来说已经足够好了。以机器翻译为例,如果只问游客“附近有中国餐馆吗?”把这样的句子翻译成不同的语言,我们可以认为每个句子都有特定的含义,而翻译程序只需要用其他语言表达这个含义。然而,对于其他应用来说,单词的含义不再是固定的,而是随着时间和地点而变化。这超出了统计程序的能力(即使加上条件概率,也远远不够)。从根本上说,词语的意义应该被看作是可变的,“定义”(包括统计)只是相对稳定的基本成分。

与此相关的是对话的产生和理解。当前的“聊天机器人”都是基于统计学习的,它们的目标是“听起来像人”,所以生成每个句子时的设计目标是“大多数人在这种情况下会说什么”。我不否认我们都有“为了聊天而聊天”,但这毕竟不是交谈的主要功能。大多数时候,我们的对话服务于特定的目的。由于每一个特定的对话在原则上都是独一无二的,它通常需要创造性地使用语言,包括在一定程度上突破词语的定义。如果你知道你的对话者说的总是一样的话,那么你继续这个对话有多无聊?因此,即使聊天程序有真正的市场,它们也不代表典型的对话情况。

真人和聊天机器人之间的对话(绿色)(网络截图)

新理论应该如何命名这个概念

科学概念的定义比日常用语的定义有更多的要求。特别是,科学理论的核心概念需要严格界定,并为整个理论的发展提供基础和指导。一个新理论通常以几个新概念为标志。给一个新概念命名的方法只有两种,一种是创造一个新词,另一种是改造一个旧词。在这两种情况下,都需要一个定义来定义这个理论中单词的含义(及其命名概念)。这两种方法都有各自的问题:新词容易混淆,而旧词容易让人理解,因此为一个新概念选择正确的名称绝非易事。

许多科学概念来自日常词汇的转换。这时,一方面,有必要基本上忠实于这些词的原意,但另一方面,有必要使它们符合理论要求,因此不可能完全适应它们的日常用法。这个定义通常被称为“工作定义”,以区别于字典定义。哲学家卡尔纳普试图在归纳逻辑的研究中给出“概率”的工作定义。他没有简单地陈述自己的观点,而是首先仔细讨论了一个“元问题”:什么是好的定义?他提出了四个标准:

1.相似性:新的定义接近这个词的日常含义;

2.准确性:新定义可以避免模糊使用;

3.有效性:新的定义应该有助于基于它的理论成果;

4.简单:新的定义应该尽可能简单。

这四个标准经常互相冲突。例如,甲的定义比乙的简单,但不如乙准确。现在是全面平衡的时候了。然而,这套标准仍然具有相当普遍的指导意义。如果一个工作定义在一个方面有重大缺陷,那么如果它在其他方面是理想的,那么很难弥补它的“短板”所造成的后果。

定义人工智能是一个理论问题

让我们以“人工智能”的概念为例来分析工作定义中的常见问题。“人工”在这里不是大问题。人们普遍认为,它指的是计算机和机器人等人工工具,而“智能”并不容易说。这个概念自然是人类心理能力的概括,但概括的程度或角度可能大不相同。

首先,“智能”的工作定义仍然需要保留词汇词典定义中的一些核心元素,否则最好是替换单个单词。例如,如果“智力”被定义为“完美解决所有问题的能力”,那么即使是普通人也没有资格。这显然太类似于这个词的一般用法,因为智力一直被认为是人类的属性,而不是神圣的属性。

一个好的工作定义应该避免模棱两可的陈述,从而为这个概念划定一个相对清晰的界限。因此,用“认知”、“思维”和“意识”等概念来定义“智力”是不合适的,因为这些概念的界限并不比“智力”更清楚,尽管它们的含义和智力确实有相当多的重合。概念的正确描述不一定适合用作定义。

“智力”的工作定义与其字典定义不同,因为它不是描述这个词目前的常规用法,而是把它作为一个研究目标。也就是说,展示你想创造什么样的人工智能,不管别人怎么想。因此,一个好的工作定义的最终标准是基于它的理论能够达到的高度,尽管这个标准在开始时不能直接使用。然而,用这个标准来消除不好的定义还是足够的。例如,目前有一种“泛智能”观点,认为所有的事物(至少所有的计算机系统)都有智能,但水平不同。这种观点是有道理的,但结果,“人工智能”成了“计算机科学与技术”的同义词,却没有多少新的贡献。

最后,科学家都喜欢简单的概念,尽管原因不同。有些人认为简单更可能是正确的,有些人认为简单更漂亮,有些人认为简单无非是更容易使用。这次不讨论这个话题。应该提到的是,有些人断言智力不能有一个简单的定义,这就成了一个问题。与智力相关的现象看起来确实很复杂,但这本身并不意味着在它的背后找不到相对简单的核心概念。事实上,它在其他领域也是相似的,几乎每一个科学理论都为看似复杂的现象提供了简单而统一的解释。

关于人工智能的主要工作定义,当你谈论人工智能时,我在说什么?有一个简单的概述,我自己的观点是在“人工智能:什么是“智慧”?“也已经介绍过了。这次我想展示的是以下观点:

“定义”是描述词语和概念含义的重要方式,但它不是唯一的方式,也不总是最合适的方式。这不仅仅是关于人工智能。

人们经常用“人工智能”的“篮子”来装几种不同类型的“商品”。这样的“词典定义”确实说明了这个词的当前用法,但是在此基础上得出的结论通常只适用于某些作品,而根本不适用于其他作品。

“智能”这个概念没有独特的“自然而正确”的定义,因为它的含义随着历史时期、科学发展、应用领域、关注焦点等因素而变化。当然,仍然有相对稳定的组件。

“智力”的一般用法(字典定义)和研究项目中的用法(工作定义)不是一回事,尽管它们是相关的。后者在很大程度上决定了后续工作的研究方向和范围,因此它不仅仅是选择词语和句子的问题。

没有一个公认的工作定义并不意味着人工智能不能成为科学研究的对象,而只是说这个领域在“某些技能的专用”之前仍处于“百家争鸣”时期。

目前,“人工智能”的不同工作定义是对一个复杂现象的不同抽象概括,每个定义都有自己的价值。他们之间的关系是“不同意见”,而不是“谁是谁非”。因为它们之间的差异是根本性的,它们最终将演变成不同的研究领域。

说不同的工作定义“都有价值”并不意味着它们都有相同的价值。这就好比说,攀登象山、泰山、黄山和珠穆朗玛峰“都是有价值的”。这取决于你想要什么。

参考

1.汪裴,你说的“人工智能”是什么意思?第一届人工一般智能会议记录,第36373页,孟菲斯,2008年3月

2.鲁道夫·卡尔纳普,《概率的逻辑基础》,芝加哥大学出版社,芝加哥,1950年

本文从严肃的科普媒体fanpu2019开始。范普2019由世界级科学家和科普专家组成。在任何媒体上转载时,必须保留《重返公园》的名称、微信号和作者信息。未经允许,严禁进行任何更改,包括标题。如需重印、授权和合作,请联系fanpu2019@outlook.com。

上一篇:木桶理论

下一篇:测望术和重差理论