当粒子物理拥抱人工智能
欧洲大型强子对撞机的粒子碰撞可以产生大量数据,这些数据可以通过算法进行处理。资料来源:欧洲粒子物理研究所
下一代粒子对撞机实验将使用世界上最先进的“思维机器”,在粒子物理学家和人工智能研究者之间建立合作关系。这种机器只需要很少的人力投入,但是这种前景让一些物理学家感到不舒服。
位于瑞士日内瓦的大型强子对撞机(LHC)的物理学家希望在未来10年内通过不可思议的海量数据做出重要发现并获得大量知识。受这个动机的驱使,他们正在招募人工智能专家来协助研究过程。
上个月,来自粒子物理学和人工智能的专家首次聚集在一起,讨论如何通过先进的人工智能技术加速LHC的科学发现。粒子物理学家“已经意识到他们不能独自战斗”法国巴黎大学的计算机科学家塞西尔·杰曼在欧洲粒子物理研究所粒子物理实验室研讨会上说。
计算机科学家们一个接一个地做出反应。去年,德国帮助组织了一场编程竞赛,旨在通过一系列模拟数据“发现”希格斯玻色子的踪迹。比赛吸引了1700多个团队的申请。
可以说,粒子物理和人工智能不再陌生。特别是,当希格斯玻色子在2012年被发现时,LHC-阿特拉斯(LHC实验装置)和CMS(紧凑型μ子螺旋磁谱仪)的两个大型探测器实验使用了机器学习能力,即“训练”算法以识别数据模式的人工智能。
但是在不久的将来,粒子物理实验需要在收集数据方面变得更加智能,而不仅仅是处理数据。目前,CMS和ATLAS每秒可以进行数亿次撞击。使用快速而粗略的标准会导致每1000次冲击中有一次冲击被忽略。然而,2025年的升级计划意味着每秒钟的相关撞击次数将增加20倍,这就要求这些探测器设备采用更精确的统计方法。美国帕萨迪纳加州理工学院的化学计量物理学家玛丽亚·斯皮普帮助组织了欧洲粒子物理研究所的研讨会,她说:“我们正在进入一个未知的领域。”
另一项LHC探索实验也可能带来灵感。大型强子对撞机的底部夸克实验项目旨在研究粒子和反物质之间的不对称性。为了准备今年4月开始的LHCb秒高能物理实验,LHCb团队利用机器学习能力对探测器进行编程,以确定哪些数据需要保留。
LHCb对细微的温度和压力变化非常敏感,因此在实验过程中随着时间的推移收集的数据也会非常有趣,因为机器学习可以适应实时变化。“以前没有人这样做过。”*工智能项目的大型强子对撞机物理学家弗拉基米尔·格利戈罗夫说。
格利戈罗夫说,升级设备后,粒子物理实验通常需要几个月来校准。但在能量升级后的两周内,探测器“重新发现”了一种叫做J/ψ介子的粒子,这种粒子是由两个美国实验小组分别于1974年发现的,后来被认为是诺贝尔奖级别的科学发现。
斯皮普卢和一些专家表示,未来几年,CMS和ATLAS可能会步大型强子对撞机的后尘,使探测器算法能够进行更多的实时探测和计算工作。"这将改变我们进行数据分析的方式."斯皮普卢说。
然而,越来越依赖人工智能进行决策也会带来新的挑战。与大型强子对撞机不同,这个实验的重点是发现已发现的粒子,因此可以详细研究收集粒子的过程。然而,ATLAS和CMS是为寻找新粒子而设计的。杰曼说,原则上,一些丢失的数据也可能包含重要的发现,而由算法产生的标准可能不透明,这让许多物理学家担心。她说,研究人员想了解这些算法是如何工作的,以确保它们基于物理原理。“否则对他们来说将是一场噩梦。”
支持这种方法的物理学家也需要他们在人工智能领域的同事放弃已经在实践中检验过的公式。格利戈罗夫说:“这些都是大规模的实验性合作项目,所以可能需要很长时间来证明一种新方法。”LHCb有1000多名成员参与,而ATLAS和CMS有3000多名科学家参与。
尽管面临这些挑战,研讨会上讨论的最热门话题之一是粒子物理学是否应该利用更复杂的人工智能,以及如何利用这种被称为深度学习的相关技术。机器本体学习主要使用图像等样本数据进行训练,然后“说出”每张图片上的内容,如房子或猫。然而,深入学习主要使用一些软件(如谷歌翻译和苹果的语音识别系统Siri)。计算机不能监督,只能找到识别这些物体的方法。
人工智能的深入学习能力将使科学家能够发现理论上没有预测到的新粒子。CMS团队成员、物理学家CREN参加了此次研讨会的组织工作,他说:“这可能是阻止做出正确理论预测的科学家出生的一种保险。”
(红枫)
《中国科学日报》(2015年12月10日,第三版国际版)
阅读更多
《自然》杂志的相关报道