徐宗本:人工智能的基石是数学
徐宗本院士正在做专题报告
“人工智能的基石是数学。没有基础数学科学的支持,人工智能几乎走不了多远。”中国科学院院士、Xi交通大学教授徐宗本认为,人工智能面临的一些基本问题的实质是来自数学的挑战。
最近,在由联合国教科文组织和中国工程院联合主办的以“大数据与知识服务”为主题的2019年联合国教科文组织国际工程科学与技术知识中心国际高端研讨会上,徐宗本在题为“人工智能与数学:融合与共进”的主题报告中表示。
数学家眼中的人工智能是什么?
徐宗本给出的答案简单明了:目前,它主要是指机器学习。
如果给这个术语一个解释,他认为这是人类或代理人通过与环境互动来改善他们的行为和解决问题的能力的一个智能操作。“机器学习是将这种智能形式化为数学公式,并将其转化为计算机可以操作的算法和软件。”
此外,人工智能实际上是一个数学、算法理论和工程实践紧密结合的领域。把它拆开来看,它是一种算法,即数学、概率论、统计学和各种数学理论的体现。
但是,徐宗本认为,数学作为人工智能的基石,还有五个核心问题需要解决,这也是制约人工智能进一步发展的“绊脚石”。
首先是大数据的统计基础
徐宗本认为人工智能和大数据是孪生姐妹。人工智能更多的是指应用模式,强调与领域知识的结合。大数据是最低级的信息技术,强调机器和机器之间以及机器和人之间的互动和理解。然而,目前分析大数据的统计基础正面临颠覆,应用于复杂大数据分析的极限理论、统计推断方法、真实性判断等数学基础尚未完全建立。
第二是大数据计算的基本算法
一般来说,对大数据的理解和分析是通过数据处理或数据分析来实现的,数据处理和数据分析最终都归结为求解一系列基本的数学问题,如求解线性方程组、图形计算、优化计算、高维积分等。然而,这些看似已经解决的问题已经成为大数据环境中的“障碍”。
为此,他以旅游业为例,做了一个生动的类比来解释这一挑战。“例如,我怎样才能从Xi到达北京?过去,地图的分辨率不高,基本路线可以从普通地图上获得。然而,在大数据的背景下,地图的分辨率越来越高。不可能一次给你涵盖Xi和北京之间所有城市和道路的数据。你一次只能提供一些城市之间的道路信息。你怎么知道在Xi到达北京需要多长时间,以及如何到达最近的地方?多少钱?今天的机器无法回答这些问题。这就是为什么下图的基本计算算法在分布式图形信息环境中没有得到解决的原因。"
第三是数学理论的深度学习
徐宗本认为,这个问题此时显得尤为关键。新一轮人工智能以深度学习为基本模式,但深度学习的设计基础是什么?什么样的结构决定了什么样的表现?会有像泰勒公式和傅立叶级数这样的数学表示理论吗?这些基本的理论问题还没有解决。正是因为这个原因,当前的人工智能不得不依靠“人工”来获得“智能”,这也是当前“人工智能=人工+智能”的原因。
第四是非常规约束下的最优运输
人工智能中的许多问题可以归结为两个领域的数据获取问题,即在满足一定不变量的条件下,将两个对象相互转换。"例如,中文和英文之间的翻译意味着在保持语义的同时将中文数据转换成英文数据."
如果应用到现实中,徐宗本设想将医院的CT和MRI图像相互传输,可以解决医疗诊断中信息不足的问题。“因为根据同一个人的说法,这里的人是不变量。为了解决这些问题,有必要建立一种数学理论和方法,说明如何在特定约束条件下实现最优传输。”
五是学习方法和学习理论在函数空间的建模
徐宗本说,在研究生阶段学习的机器学习理论应该上升到学习方法论的阶段。
“从数学上来说,无论函数空间中的学习理论是如何建立的,本质都是为了适应不同的任务。由于任务本身是一个函数和无限的,过去机器学习中对样本和数据的选择和泛化应该扩展到任务的选择和泛化。
如果我们辩证地看待数学和人工智能之间的关系,这可能是相辅相成的最好解释。徐宗本说,不仅数学可以为人工智能提供基础,人工智能也可以为数学研究提供新的方法论。
例如,过去人们可能使用计算机来解偏微分方程,但现在他们可以用人工智能做得更好他认为数学模型方法和人工智能数据方法的结合可以使机器的深入学习更加机敏。
面对今天蓬勃发展的人工智能产业,院士也给了从业者希望。
"人工智能想要做得好,它依赖于解决数学问题,尤其是算法."徐宗本再次强调,实践者应专注于基础研究,将中国的应用场景优势转化为技术优势和产业优势。
推荐阅读