从“最快”到“最忙”世界冠军天河一号成劳模
很难说世界上还有比这更快的。在眨眼的一秒钟,它已经完成数千万亿次计算。这是超级计算机的世界,速度永远在刷新。
如果说,超级计算机是“计算机界的珠穆朗玛”,那么,位于国家超级计算机天津中心的“天河一号”,是中国人在世界之巅插上的第一面红旗。
2010年,“天河一号”以持续速度每秒2570万亿次浮点运算、峰值速度4700万亿次的速度雄冠全球,并以这样的速度,持续运行到今天。
今天,它的速度虽被后来者不断超越,而这位昔日的冠军却“越来越忙”了。它每天要接1400多个任务,满负荷运行;它“跑”的路也越来越宽了,天上飞的、地上跑的、地下藏的,全都“装”在它心里,算得一清二楚。
曾是世界冠军更是一个开拓者
为了向更多人解释“天河一号”速度,技术人员用了一个通俗易懂的比喻:它运行1小时,相当于13亿人同时计算340年。
2010年“天河一号”面世时,人们对超级计算机还不了解,质疑声也随之传来:花这么多钱,造这么快的超级计算机究竟有什么用?是不是闲置在一边,是不是资源浪费?甚至还有网友调侃说,能不能让我用来打游戏?
“从‘天河一号’开始,中国超算不再受制于人。”国家超级计算天津中心主任刘光明清楚第一速度背后的深刻意义,这代表着一个国家的整体国力。
此前,中国没有属于自己的千万亿级超级计算机,缺乏强大的超算能力意味着,在气候、气象、海洋与能源等关系国计民生的重大基础领域,都将难以开展长效的预测、勘探等工作。
速度的提升带来的一个最直观变化,是外国同行的态度。此前,欧美等国对中国使用他们的超级计算机开出高昂的价格,不仅如此,为了*技术,他们还要求让计算机“住进单间”,中国人不得靠近。
而当“天河一号”在世界超级计算机Top500榜单登顶后,不少外国同行主动来到中国,请教“天河一号”首创的让CPU和GPU(图形处理器)高效协同的计算模式。
象征着最尖端计算能力的超级计算机,也被一些人比作是“高智商的玩具”,研发和操作它的科学家们,也在摸索如何“玩”出名堂,让它的强大脑力造福于人。
“在最初投入使用的一年多时间,我们也在逐渐摸索服务对象的种类和所能提供的服务。”国家超算天津中心应用研发部部长孟祥飞说,如何把强大的计算能力用在各个领域,需要一点点突破。
雾霾实时预警优化治理方案
在你看得见或看不见的各个领域,超级计算机在改变你的生活。
有时,它可以变成宇宙飞船的模样,模拟大型航天器在虚拟的外太空飞行的全部数据;有时,它会钻到地下数公里,算出石油和天然气到底藏身何处。当前的“全民公敌”——雾霾,也是它瞄准的方向。
精确预测雾霾其实并不容易。中国各个城市PM2.5到底都是从哪儿来的,有工业烟尘排放、汽车尾气、建筑工地和道路扬尘、生活取暖排放以及农村的秸秆燃烧等,但至今没有一份完整的清单。即使在同一个城市中,不同区域的雾霾浓度也有很大差别。
专家将雾霾预报形容成“天气预报+化学”,因为PM2.5其实包含着许多种不同的化合物,它们的大小也不尽相同。“温、湿、风、压”是天气预报主要关注的4个指标,而雾霾则涉及70个左右,每一个数值都不是固定不变的,任何一个指标的变化都会带来完全不同的结果,因此预报雾霾的计算量是预报天气的好几倍。
以计算机动车尾气对雾霾形成到底有多少具体的影响为例,专家们需要构建一套道路交通尾气排放的监测系统。在这套系统中,地图上标注出了城市中每个监测站点的位置,通过路面摄像头的监控,在汽车行驶的同时就把车的大小、型号统计起来,然后自动计算出它的排量。再加上环境中污染浓度和气象水平等数据,最终得出机动车实时排放的尾气污染物情况。这套系统每5分钟进行一次刷新,将搜集到的数据传送到“天河一号”上,提供给综合数据模型,最终算出汽车尾气排放对雾霾形成的具体影响。
就这样,“天河一号”可以把每一种污染源,都精确到“点”来计算,结合大量数据进行分析后,得出不同的污染源在雾霾形成过程中,扮演何种角色,从而大大提升雾霾预警的精度;而完成一次预报用时只需2~3小时。
“天河一号”掌握了大气化学反应、污染源监控等大数据信息后,通过建立计算模型进行模拟,已经形成了一个实时、高精度、大范围的雾霾监测预报系统。更重要的是,依据这些精准信息,可以有望找到一个对雾霾治理更优化的解决方案。
超算背后的年轻人平均年龄28岁
从任何一个角度来看,“天河一号”都是个不折不扣的“劳模”。它全年365天无休,7&TImes;24小时持续运行,能够始终保持稳定高效的运算;它每天提供1400多个在线服务,服务的用户数已近1300家,主要用户遍布全国30个省、自治区和直辖市。
支撑“天河一号”巨大的服务承载力的,是国家超级计算天津中心的60多名研发技术人员,他们是一群平均年龄28岁的年轻人。
冯景华算是其中的“老人”了。2010年从西安交通大学硕士毕业后,跟着导师研究过并行计算的冯景华加入了天河团队,如今担任国家超级计算天津中心系统管理部部长。
“当时国内高校很少有培养这个方向的人才,起初我们只有20多个人。”冯景化回忆,从“天河一号”的安装和调试,并测试出高效计算速度,夺得当年世界冠军,年轻人放弃了节假日,每天工作十几个小时,最忙的时候一周睡眠时间只有20个小时。最终只用了短短3个多月时间,完成了国外同行需要一年时间才能完成的任务。也正因为如此,他们被称为“铁杆子天河”。
“用户的需求,我们随时能够响应,即使是凌晨两三点。”冯景华说,“天河一号”的团队服务能力很强,大大提高了用户体验的满意度。
如今,“天河一号”已经是石油企业寻找油气资源不可或缺的“先锋”,也成为国内石油勘探地震数据处理能力最强、处理速度最快的平台。
几年前,“天河一号”的技术专家与某研究院历时数月研究开发,最终共同研制出具有自主知识产权的的石油地震勘探数据处理的核心软件和处理平台。“原本需要1个月甚至更长才能完成的任务,现在可能只需要几个小时。”这样一来,使得我国石油公司在国际勘探竞标上能够获得较大优势。
不仅如此,“天河一号”还参与了许多国家科技创新的重大项目。在脑科学和基因测序方面,它提速国内全脑三维成像150倍以上,将原本需要5~6天的鼠类全脑成像,缩短到1~2个小时;与天津大学和华大基因等科研机构开展基因测序等合作,试图破解人类基因密码;此外还与中科院上海药物研究所合作,从20多万个代表化合物中筛选出抗癫痫先导药物。每一个项目推进的背后,“天河一号”都不仅仅是一个计算工具,为了让计算跑得更快、更精准、更有效,它都会深度参与研发,不断寻求更完美的解决方案。
“天河三号”将亮相速度再快200倍
如今,“天河一号”已经7岁了,因为应用广泛,早已实现自负盈亏。而它每天满负荷运转,甚至有时会出现应用“排队”的情况,有更新换代的需求。
目前,由国家超算天津中心同国防科技大学联合开展的“天河三号”样机研制工作已经启动。原型样机的研制将为进一步研发自主芯片、自主操作系统、自主运行计算环境的全自主的新一代百亿亿次超级计算机,打下基础。而百亿亿次超级计算机提升的不仅仅是计算能力,更重要的是在计算密度、单块计算芯片计算能力、内部数据通信速率等技术上,全面得到极大提升。
今年“天河三号”验证系统将完成高性能芯片、互联网络等关键技术的突破,样机预计在今年底至2018年初完成部署。测试稳定后,2020年左右部署完成整机系统。
速度带来的是实实在在的经济效益。经过初步测算,“天河三号”每年产生的实际经济效益将超100亿元。