中国超算能否再夺“戈登贝尔奖”?
郑为民教授正在参加2019中国高性能计算大会。大会组委会照片
8月22日,“2019 CCF全国高性能计算学术会议”(HPC China 2019)在内蒙古呼和浩特召开,由中国计算机联合会(CCF)主办,中国计算机联合会高性能计算专业委员会、内蒙古海灵格新区管理委员会、清华大学、内蒙古大学协办,北京并行科技有限公司协办
《中国科学报》记者在年会上了解到,基于中国已经建成的超大型高性能计算机,中国的超级计算应用团队将继续冲击2019年戈登·贝尔奖,该奖项将在11月于美国举行的国际超级计算大会上宣布。
“戈登·贝尔奖”是世界高性能计算应用领域的最高学术奖,被称为“诺贝尔超级计算奖”。得益于中国最强大的超级计算“太湖神力”,中国的超级计算应用团队在2016年和2017年连续获得“戈登·贝尔奖”——在此之前,美国和日本垄断了该奖项近30年。
中国的超级计算应用团队能在2019年甚至未来再次赢得这一荣誉吗?戈登·贝尔奖引领的超级计算机的未来发展趋势是什么?
戈登·贝尔奖的两个基本条件
我如何赢得戈登·贝尔奖?在2019中国高性能计算大会上,清华大学计算机科学教授、会议联合主席郑为民总结了两个基本条件:第一,应用运行在500强机器上。第二,应用程序具有良好的性能。
这两个条件也解释了中国多年没有获得戈登·贝尔奖的原因——中国第一次超额计算排名世界第一,2010年11月是“天河一号”。在短时间内,中国的超级计算应用仍然需要培育。
换句话说,硬件水平只是基本要素之一。正如所谓的“硬件决定舞台,软件决定戏剧”,戈登·贝尔奖要求应用程序在*硬件的舞台上演唱精彩的戏剧。
“虽然戈登·贝尔奖是由于‘神奇的力量,太湖之光’,但这只是该奖项的硬件基础。如果没有高效、创新和解决问题的应用程序,它将无法获得戈登·贝尔奖。”一位要求匿名的2019中国高性能计算行业专家告诉《中国科学》。
2016年首次代表中国获得戈登·贝尔奖的团队负责人、中国科学院软件研究所研究员杨超也告诉记者,只有那些具有足够高水平、创新方法和对未来应用具有示范意义的软件才有很好的入围和获奖机会。
问题是,什么样的超级计算应用会对未来有示范意义?
在2019中国高性能计算大会主论坛上,郑为民分析了入围2018年戈登·贝尔奖的6个超级计算应用,试图回答上述问题。
2018年戈登·贝尔奖的“风向”
从郑为民提供的2018年ACM戈登·贝尔奖入围名单中可以看出,2018年只有一个中国超级计算应用团队的“独苗”入围“戈登·贝尔奖”最终名单。记者从调查数据中了解到,该团队由清华大学林恒博士和卡达计算学院、搜狗等7家机构的研究人员组成。开发的应用程序名为“神图”,是一个基于神威太湖之光的超大比例尺地图计算系统。
郑为民表示,“神圣地图”地图计算框架项目探索如何在超级计算系统上高效处理大规模地图数据,是运行在超级计算机器上的典型人工智能应用。不幸的是,“上帝地图”计算框架项目最终未能获得2018年戈登·贝尔中国奖。
2018年,戈登·贝尔奖授予了美国的两个团队,即橡树岭国家实验室,该实验室使用超级计算机来应对药物流行,并使用基因组分析来研究药物在人群中的使用。劳伦斯·伯克利国家实验室通过大规模的深度学习“利用电子级深度学习进行气候分析”来识别极端天气。
这两种超级计算应用都是在当今世界排名第一的Summit超级计算机上实现的。郑为民说,其中,“应用超级计算机应对药物流行”是一项传统的科学研究应用,属于基因组计算领域,由美国能源部橡树岭国家实验室的研究小组领导。“电子深度学习的气候分析”是一个运行在超级计算机上的人工智能应用程序,由劳伦斯·伯克利国家实验室和Avida的联合研究小组完成。
郑为民评论说,这两项研究,前者是高性能计算与生物信息学和医学相结合的模型,而后者是“第一个可以有效扩展到近30,000 (27,360)个GPU加速卡的深度学习应用”,成为其最大的亮点。
在入围戈登·贝尔奖的其他四个应用中,郑为民表示,“引入混合精度计算以充分发挥图形处理器计算资源效率的城市地震灾害模拟项目”和“探索如何在超级计算机上高效处理大规模图形数据的神图图形计算框架项目”是运行在超级计算机上的典型人工智能应用。
从以上六个入围戈登·贝尔奖的分析中不难看出,获奖的“气候分析与e级深度学习”项目和入围的“城市地震灾害模拟项目”和“上帝地图”图形计算框架项目”都是超级计算与人工智能相结合的例子——人工智能在超级计算上的应用已经占据了半个国家。
因此,郑为民还将“人工智能应用有望成为超级计算的主流应用之一”概括为未来超级计算机及其应用的两大发展趋势之一。
如何在未来走得更远
郑为民总结的另一个趋势是异构架构在超级计算系统建设中被广泛接受。他认为,目前,异构架构超级计算占世界十大超级计算系统的70%。尽管“加速器异构”和“异构多核”之争仍在继续,异构架构已经成为构建*超级计算系统的大趋势。
记者观察到,在世界十大超级计算中,以英伟达GPU为代表的异构超级计算占据了5席。考虑到人工智能在科学和工程计算中的应用越来越广泛,这也为人工智能应用与超级计算的集成奠定了硬件基础。
计算力一直被认为是人工智能重新起飞的重要基础之一。然而,随着深层神经网络规模的扩大,最新的网络生成和训练往往需要数万个GPU小时(如BERT、NASNet等)。)甚至更多。
对此,郑为民表示:“拥有*计算能力的超级计算系统应该为大规模人工智能应用提供帮助,并不断拓展后者的技术边界。”
回到2018年戈登·贝尔奖的入围名单。从奖项的选择来看,有三个人工智能应用入围,其中一个获得了奖项。
“2018年戈登·贝尔奖选择了大规模的深度学习应用,入围应用中与人工智能相关的项目也占据了前所未有的半个国家。所有这些都预示着人工智能和超级计算的结合将越来越紧密。”郑为民说。
中国能在2019年甚至未来再次赢得这一荣誉吗?我们将拭目以待。然而,不可忽视的是,以深度学习为代表的人工智能算法已经影响了硬件的发展方向,并将在未来进一步扩大其影响。
中国科学院计算研究所研究员、济南国家超级计算中心主任张云泉也表示,以科学计算为代表的传统高性能计算程序必须接受这一事实。只有积极接受这一事实并寻求两者的结合,它才能在未来走得更远。