清华团队蝉联世界大学生超级计算机竞赛总冠军
不久前,由清华大学计算机系七名本科生组成的超级计算团队第五次赢得了南昌大学举办的2018ASC世界超级计算机大赛。
ASC大学生世界超级计算机竞赛由中国于2012年发起。它被列为世界三大国际超级计算机竞赛,2007年全球超级计算机竞赛(超级计算机竞赛)起源于美国,2012年国际超级计算机竞赛(ISC超级计算机竞赛)起源于德国。清华大学编外团队已经连续九次获得这三大赛事的冠军,并在2015年赢得了这三大赛事的所有冠军,成为目前世界上唯一一个实现“大满贯”的团队。
那么,这样一个强大而有经验的团队是如何发展的呢?
超级计算竞赛不仅仅是计算速度的竞赛
清华大学的超级计算团队主要由10人以上的大四学生组成。在以往的比赛中,5-6名初、高年级学生通常是主力队员,二年级学生是替补队员,以确保团队建设的连续性。
过度计算竞争不仅仅是计算速度的竞争。有些竞争问题还要求在规定时间内完成计算的前提下尽可能降低功耗。因此,比赛期间设备计算速度不能太快,但计算资源和应用运行参数应尽可能平衡,以便在规定的时间内完成计算,并在运行过程中保持功耗值尽可能稳定和小。这条规则不仅考验玩家控制超级计算系统的能力,而且要求他们具有良好的团队合作和现场适应性。
ASC18清华大学队队长、44个队的队员李北辰表示,为了应对各种具体问题,在比赛中优化合作,他们一直保持多元化的团队构成。玩家在软件和硬件方面都很擅长,并且互相补充。在准备竞赛题目的过程中,成员们将多次咨询生物、化学、物理和其他相关领域的老师和学生。他们每周将花几个小时交流和讨论竞赛主题,并报告问题准备的进度。
除了平时重视训练,赛前做好充分准备外,超级计算团队讲师翟纪东认为,“清华大学计算机系提供了一套完整的高性能计算、并行系统和计算机系统的教学体系。高性能计算研究所在超级计算领域取得的许多科研成果帮助该团队赢得了许多冠军。”多元化的课程丰富了学生的知识维度,而良好的实验室氛围、广泛的研究成果和老队员不断的经验传承提高了队员的实战能力。这些都是清华大学超级计算团队能够脱颖而出的优势。
力量和适应性是比赛中的关键。
加强我们的实力和打好基础是非常重要的,但是为了最终赢得冠军,在场上的适应性也是非常重要的。
ASC竞赛要求所有参赛团队在总功耗为3000瓦的限制下,利用组委会统一提供的超级计算节点、高速网络、自行配置的加速器卡等设备,完成超级计算系统的建设。在2014年举行的ISC14超级计算竞赛中,首次出现了强调计算功耗优化的竞赛主题。
翟纪东对2014年的这场比赛仍记忆犹新。当时,竞赛组委会宣布了神秘的竞赛应用规则,要求参赛队伍现场重建各自的超级计算系统,在规定的时间内运行正确的结果,在运行过程中完成任务且功耗值最低的队伍可以得到满分。其余成功运行结果的团队根据功耗与第一个团队的比率获得分数,未完成任务的团队获得零分。
为了降低功耗,每个团队将尽可能减少运行中的CPU内核、节点和其他计算资源的数量,同时“缩小”计算平台,如移除平台上的GPU加速卡和冗余内存芯片,以及在散热条件允许时移除平台上的风扇。“我们要求竞赛参展商临时安装一个非常低功率的风扇,以确保机器在比赛30分钟内的低功耗,但这非常危险,因为我们可能无法在规定时间内完成数据。我们得到了数据,并在29分钟零几秒内提交了结果。超过30分钟,我们只能得零分。”回忆起当时的激动,翟纪东仍然心有余悸。
比赛的记忆不止于此。谈到与南非国家超级计算中心队的“角力”,李北辰也有着深刻的记忆:“他们的实力不可低估,与南非队的竞争每年都很激烈。”清华大学学生超级计算团队和南非国家超级计算中心团队多次参加超级计算竞赛。对于超级计算背后的年轻人来说,强强对话的激烈竞争既是压力也是动力。
阅读更多
ASC18世界超级计算总决赛结束