揭秘IBM AI辩手:AlphaGo之后新的里程碑?
2018年6月的一天,一场人机辩论比赛如期在IBM的旧金山办公室举行。
辩论比赛的主要角色被称为“项目辩手”,这是一个人工智能系统,由位于以色列的国际商用机器公司海法研究所领导的科学家开发,能够在六年后进行复杂的辩论。辩论的另一方是以色列全国辩论冠军努瓦·迪亚和以色列国际辩论协会主席丹·扎弗里。
辩论者与两位人类辩论者进行了两次辩论,即“我们应该资助空间探索”和“我们应该增加远程医疗的使用吗?”两次辩论分别有三个固定的部分:4分钟陈述自己的论点,4分钟反驳对方的论点,2分钟结束陈述。现场的观众投票支持所有党派的观点,并选出了获胜者。
预期的事情还是发生了。辩论者,一个机器辩论者,最终改变了更多现场观众的最初观点,赢得了主题为“我们应该增加远程医疗的使用吗?”的辩论
最近,通过采访辩手团队的几个主要开发者,我们对辩手的研发过程、主要技术能力和未来应用前景有了详细的了解。
1
计算辩论的兴起
事实上,这不是人类第一次被机器打败。
早在1997年,IBM的超级计算机深蓝在一场国际象棋比赛中击败了世界冠军加里·卡斯帕罗夫。
2011年,沃森,一个IBM人工智能系统,出现在益智游戏程序“危险”!)打败了两个最优秀的人类冠军。
2015年,由DeepMind开发的AlphaGo击败人类围棋冠军李世石,首次夺冠。然后在2016年,深智击败了更强的中国围棋冠军柯杰,再次证明了艾的实力。
在过去的两年里,人机大战一直很激烈,无论是人工智能“解放”(Libratus)在德州扑克战争中赚了很多钱,还是OpenAI开发的人工智能系统在Dota游戏锦标赛中击败了人类冠军。人工智能已经在游戏领域发挥到了极致。然而,这场辩论不是黑白之间的简单游戏。
IBM称项目辩手是人工智能的另一个里程碑。国际商用机器公司研究所海法研究所人工智能技术副总裁阿雅·索夫(Aya Soffer)表示,这场辩论是一场开放式挑战,不同于人工智能之前解决的挑战。在挑战之前,会有一些特定的测量工具,比如判断是赢还是输。传统技术可以直接帮助制定相应的测量工具,判断输赢。在辩论中,没有办法这样得分。在辩论中,就像在实际的商业决策中一样,没有一个简单明了的标准来衡量输赢。这需要机器理解语言和做出决策的能力。
为什么IBM要开发一台具有辩论功能的计算机?阿雅·索夫解释说,国际商用机器公司将继续寻找人工智能领域的主要挑战。“我们正在引领下一个计算机功能的选择,面临我们发现的主要挑战。”阿雅·索夫认为,在现实世界中,我们不需要回答很多琐碎的问题,而是要回答非常重要的问题,做出非常重要的决定。信息是巨大的,但是很难找到能帮助我们做出正确决定的信息。因此,决策的重要性决定了我们必须把辩论功能作为人工智能的下一个主要挑战来做相关的研究,并能使我们的人工智能发展到具有辩论的目的和功能。
在辩论现场,尽管机器不是很自然,在很多方面都不稳定,人工智能辩论者传递的信息比人类多。这一前所未有的事件也让业界关注计算机如何学习和应对非结构化的人类决策世界。
据报道,目前,50多个不同的研究小组正在进行计算机辅助辩论的研究。然而,自2014年以来,IBM组织了第五次辩论数据挖掘研讨会。辩手团队成员在各种高质量的科学会议上展示了他们的技术进步,现在已经在各种研究领域发表了30多部作品。计算论证迅速兴起。
2
言语,听力理解,模拟困境
辩论者首席研究员Noam Slonim博士在采访中回顾了辩论过程。
在获得辩论问题后,辩论者首先分析个体辩论问题,然后扫描庞大的语料库文档,通过算法找出最相关的观点,同时通过算法减少重复信息。在此基础上,辩手将选择最有说服力的、多样化的和完美的论据,并组织它们形成一个完整的和令人信服的叙述。
换句话说,尽管辩论是实时辩论,但机器辩论者和人类辩论者在获得主题后都有30分钟的准备时间。30分钟内,辩手将在自己的语料库中搜索自己的算法,形成有利于自己的论点。
由于辩论过程完全是即兴的,项目辩手如何处理完全是即兴和意外的情况?诺姆说,这依赖于知识地图来模拟人类的困境并形成辩论的能力。例如,它涉及是否禁止器官贩运、器官交易和酒精交易。类似于这种说法,我们自然可以预期,如果器官交易和酒精交易被禁止,黑市将有繁荣的风险。理论上,项目辩手的系统可以理解与这种观点相关的一些争论。然而,每当就这种观点进行辩论时,与黑市有关的问题就可能随之出现。因此,模拟地图可以用来等待黑市相关话题的出现。然而,争论并不总是这样。例如,美国最近更多地讨论了公共场所是否应该禁止母乳喂养。然而,这与黑市无关。因此,我们仍在不断地对这方面的语料库进行建模和扩展,包括丰富的人类语言中各种微妙的地方。通过这种方式,项目辩手将能够在已建模的知识地图中更准确地为自己导航,并找到与支持自己论点相关的观点诺姆说。
那么,辩手的论点是如何形成的呢?诺姆说,对于一个给定的主题,项目辩论者的系统将在一个巨大的知识库中搜索,以找到最相关的观点和证据,然后选择其中最有吸引力的,多样化的和支持性的论点,然后将它们构建成一个完整的观点来描述。与关键词搜索不同,辩手可以立即对主题产生更深的理解,并根据搜索结果构建自己的观点。
强大的语料库是辩论者辩论的基础。据报道,辩手培训语料库拥有超过3亿个可靠的信息来源,包括2011年以来全球商业、法律、学术和*机构领域的专业人士使用的主流报纸和杂志上的文章,以及*中的内容。
IBM研究小组给了辩手系统三个核心能力:
首先,驱动演讲写作和表达。辩手首次证实计算机可以理解大量的语料库。给一个有争议的话题一个简短的描述,它可以写出结构良好的演讲,清晰而尖锐地表达出来,甚至及时地表现出幽默和机智。
第二,实时听力理解。当对手的辩论者开始发言时,项目辩论者应该能够听内容长达4分钟。对手的人类辩手可能语速很快,情绪激昂。同时,会有一些道德和伦理问题。项目辩手应该能够识别人类辩手口述的长演讲中隐含的重要概念和观点,以及长连续演讲中隐含的重要概念和观点。
第三,模拟人类的困境。通过知识的独特表达来模拟人类的争端和困境,系统可以根据需要提出原则性的论点。R&D团队总结了人类专家辩手的一些共性,对它们进行了模拟和建模,并将其注入到系统中,形成一个知识地图供项目辩手使用。因此,一旦辩论开始,项目辩手可以在已经形成的地图上做他自己的指南和索引,并找到可以支持他的证据。
3
人工智能的商业价值和未来发展
辩手的全球经理拉尼特·阿哈洛诺夫解释了如何将项目辩手应用到商业中。
至于商业用途,辩论者只表示一个开始。目前,主要有两种用途。
第一类适用于研究和分析领域,例如帮助金融分析师发现金融事实,以支持或反对金融分析师考虑的金融投资选择。帮助律师找到相关的案例和索赔,或者使用项目辩手模拟法庭辩论来分析利弊;帮助记者或学生找到更多信息来改进报告和论文。
第二类是在决策领域的应用,如帮助高级管理人员分析优势和劣势,提供基于事实的、不带人类偏见的意见。或者通过辩论者拓宽你的思路,在关键决策中加入他们可能没有考虑到的新想法。“无论是信息收集、研究分析还是决策,总的来说,辩论者的最终目标是支持循证决策,而不是直觉决策。”
拉尼特还表示,与项目辩手相关的项目和技术仍在进一步开发中,其商业应用只是一个预设。"商业化还为时过早,也没有具体的计划."
诺姆说,虽然辩论者已经开发了六年,但它仍处于不断的再开发和再开发过程中,在工程和算法方面仍有许多挑战。例如,当前的辩论者只能参加一对一的辩论,不能与大规模的玩家辩论。。
辩手真的理解对手的辩手说的话吗?当网易智能抛出这个问题时,拉涅特笑着回答说,这是一个哲学问题,因为它涉及到我们如何理解人工智能的理解能力。“从结果来看,当我们就是否为太空探索提供资金进行辩论时,人工智能也可以听取、回应并形成自己的观点进行辩论。它显示了理解对方所说的能力。但是如果我们说理解是指人与人之间的理解,比如说,我理解你,你理解我的理解,内心的理解,意识到对方的理解和心理过程,人工智能目前还没有能力理解。”
在谈到以辩手为代表的人工智能的未来发展方向时,阿雅·索夫向网易智能表示,希望让人工智能更人性化。人们能够从小数据中学习的原因是,人们能够理解概念,并在概念的基础上将所学应用到新的领域。这个开放领域的应用能力非常强。开发的人工智能应该不仅能够应用大数据的概念,而且能够应用小数据的概念,甚至在将来也是如此。“我们希望人工智能能够进一步发展这种能力,从狭隘的具体例子中学习,然后扩展到更广泛的领域,应用到不同的领域,并能够从概念中学习。”阿雅说。