张钹院士谈第三代人工智能发展趋势
最近,清华大学公布了人工智能2000年全球最有影响力的2000名学者名单。中国学者数量居世界第二,但研究机构不足,高层次学者集中。人工智能领域的人才队伍亟待加强。
清华-中国工程院知识与智能联合研究中心和清华大学人工智能研究所发布了AI2000清单。人工智能领域世界上最有影响力的学者(200人)和被提名的学者(1800人)分布在世界各地不同的大学和学术机构,其中1128人在美国,171人在中国,307人在欧盟。
在新闻发布会上,清华大学人工智能研究所所长、中国科学院院士张博作了热情洋溢的报告和精彩的点评。
人工智能研究必须国际化
基础研究,尤其是人工智能领域的基础研究,必须国际化,因为只有团结和利用来自世界各地的研究人员,它才能引领基础研究的发展。人工智能领域目前主要由美国领导的原因是美国利用了世界上最好的人才。
中国要想在基础研究领域领先世界,就必须走国际化的道路。今天有许多外国学生在中国学习,这是一件好事,但我们也可以做一些平衡调整,以吸引更多国家和地区的优秀学生来中国学习。
结合数据驱动和知识驱动
人工智能的四个基础是:知识、数据、算法和计算能力。回顾历史,这四个因素一直在发挥作用。第一代人工智能也被称为符号人工智能,它强调知识对智能的影响,因为那时算法和计算力还没有跟上。
进入新世纪后,深度学习将每个人的目标浓缩到数据中。此时,大数据的出现,加上好的算法,形成了基于概念的深度学习。结合云计算等手段,基于数据的连接模型得到了极大的推广和应用。
数字主义喊了许多口号,这使我们今天遇到了一些困难。根据大数据构建的人工智能系统似乎不可信、不可靠、不安全,难以推广。这些都是当前人工智能研究深入研究带来的问题,也可以说是大数据面临的挑战。如何解决这个挑战?唯一的办法是重新引入知识,将数据驱动和知识驱动结合起来,实现可信和安全的第三代人工智能。
常识往往不在数据中。
自然语言理解是人工智能领域的核心问题。无论是机器翻译还是自然语言应用,他们都试图通过分析符号序列来理解相关内容,这是第一代人工智能中所谓的象征主义的核心方法。在第二代人工智能中,我们已经走上了深度学习的道路。这条路充满希望,但非常危险,因为它不能解决可靠的安全问题。
机器翻译现在只能翻译不重要的东西,因为翻译错误并不重要,真正重要的场合也需要人工同声翻译。机器最大的问题是他们缺乏常识,不知道他们不知道。这是一个大问题。知识包括两个方面,一个是我知道的,另一个是我不知道的。一个有学问的人不仅知道更多,而且知道更多他不知道的事情。那些傲慢的人都不学无术,不知道他们能吃多少碗饭。机器翻译也是一个问题。给机器的任何句子都可以被翻过来,而且它可以在完全不理解的情况下被翻过来。
因此,常识是必要的,简单的几个词的翻译也需要大量的努力和积累。“说你能做,或者你不能做。”没有常识,机器很难理解这些词。相反,人们认为这很简单。这是常识的重要性。然而,常识数据库的建立非常困难,现在不可能从数据中建立常识数据库,因为常识往往不是用数据来表达的。
建立常识需要努力工作。只有解决了这个问题,对自然语言的理解才能达到目的。自然语言理解是第三代人工智能的最终目标,这是一项艰巨的任务。如果这个问题得到解决,人工智能的其他问题也将得到解决。
下一篇:宇航员怎么从太空返航