既能仰望星空又能融入产业
我们的记者宋祁,记者沈春雷
天文学界有句谚语:“建造天文望远镜是一场缩小梦想的游戏。”中国科学院自动化研究所的所有此类研究团队都参与了高带宽专用实时计算平台的开发,该平台已应用于500米球面射电望远镜FAST,目前正与FAST一起进行“问天”之旅。
几天前,自动化研究所国家专用集成电路设计工程技术研究中心(以下简称集成中心)的团队负责人和研究员郝杰告诉《中国科学报》:“我们可以说已经为FAST构建了一个专用的数据计算平台。”
构建快速专用计算平台
2016年9月25日,FAST在贵州省平塘县的一个岩溶洼地启动,并开始接收来自宇宙深处的电磁波。FAST搭载的高带宽专用实时计算平台是国际上首个3 GHz @ 12位以上高带宽数据采集、分析和直接存储的综合平台,在天文观测领域具有重要意义。
作为世界上最大的单孔径射电望远镜,FAST的主要工作是接收来自宇宙的大量信息。郝杰表示,高带宽专用实时计算平台肩负着两项任务:第一,如何快速有效地获取和存储这些信息;二是如何计算这些数据,及时从海量数据中获取有用的信息,并产生有用的科学结果。
据专家估计,前五年FAST的总数据存储需求为20PB,是天河二号超级计算机存储容量的1.6倍。郝杰指出:“不仅如此,FAST 3GHZ带宽的高频覆盖给科学研究带来了便利,也对后端计算平台的性能提出了极高的要求。”
他进一步解释说,以fast的重要任务之一FAST无线电突发检测为例,在大量数据中寻找持续时间不到1秒的无线电信号是对平台计算能力、高精度数据同步能力、高带宽数据处理和直接存储能力的巨大考验。
此外,该望远镜使用寿命长,有许多科学研究目标。不同的研究目标需要不同的配置。这要求后端计算平台具有灵活的可配置性和可扩展性。
为了应对FAST计算平台的这些“高”要求,郝杰带领研究团队提出了计算节点架构、低延迟和高可靠性交换网络、可配置IO平台、大规模系统整体互连和高效存储结构等关键创新架构。
该团队自主开发了高速数据交织采集模块、高带宽数据综合变频并行分割模块、可本地互联的异构实时加速模块、高带宽数据直接存储模块、管控模块及配套软件算法,实现了高实时计算、多源异构海量数据存储、差分传输下的交换和管理、智能开发和系统管理等。
目前,FAST高带宽专用实时计算平台已初具规模,并已建成具有高速数据直接存储功能的数据存储和处理集群。部署的数据平台包括谱线数据处理平台、脉冲星数据处理平台、远程数据处理和同步软件等。
该系统通过FAST系统的协同观测,获得了第一批科学数据,整体运行良好。当记者问及该平台将产生何种科学成果时,郝杰的回答是:“我希望在不久的将来,脉冲星数据处理平台能够为我国新一代脉冲星的导航做出贡献,并利用我们的谱线数据处理平台从星际空间中发现有机分子。”
天文无线电领域的识别
开发高性能数字信号处理器是自动化集成中心的传统优势。2011年,大规模信号和数据处理系统的设计开始与天文学和无线电领域相结合。集成中心承担了*国家天文台“天籁”阵列望远镜后端计算平台的设计,为暗能量无线电探测提供了强有力的支持。
郝杰表示:“作为这一领域的第一台国产设备,它已经摆脱了长期使用国外产品的国内大型干扰检测阵列的现状,在支持采样精度和系统计算功耗比方面甚至高于国外产品。”
在该项目中,郝杰团队创新性地提出了本地计算交换集成可配置处理单元的概念,解决了大规模全相关处理中的数据延迟问题。其中,平台架构设计充分考虑了系统的可扩展性和可配置性,仅通过调整系统子卡和尾板,就可以满足用户设计指标和方案的多种变化,而不增加任何开发成本
在接下来的几年里,该团队在国内天文学和无线电专用计算领域变得越来越专业。先后参加了*国家天文台21厘米宇宙第一缕曙光探测阵列、南山25米射电望远镜等项目。他们开发的处理平台已被美国选定,并被选入美国在南非建造的HERA大型无线电探测阵列的实时*信号处理单元。
国际知名的天文后端研发机构CASPER将郝杰团队的产品作为其下一代加工设备进行推广。作为中国*信号处理(CSP)工作包的领导者,郝杰团队还加入了国际科学工程(SKA)(平方公里阵列)来承担核心处理集群的开发。
郝杰新很高兴地发现,他的团队的工作得到了国际天文无线电研究领域的认可。
大数据处理不再是问题
经过六年多的不断积累,郝杰团队实现了天文信号采集和核心计算模块的自主知识产权本地化,为中国大型望远镜项目建设提供了核心技术支持。
成就的背后是团队的辛勤工作。大多数射电望远镜都建在自然条件恶劣、交通不便的地方。从*多雪的大红柳峡谷到南非高达50摄氏度的小镇,队员们长期驻扎在现场进行联合调试和联合测试,他们的身体正在经受着巨大的考验说到这些,阿尔特笑着说:"虽然条件很困难,但我们也收到了回报,这还是值得的。"
不仅可以仰望星空,还可以融入行业。郝杰所说的“回归”是一系列特殊领域的大数据处理技术。
通过在国家天文台实际建设科学仪器FAST的经验,郝杰团队在建设创新的科学数据中心方面积累了完整的经验。在高实时性、可配置的计算节点架构、差分传输下多源异构海量数据的高效存储、交换、智能开发和系统管理、大数据环境下的自闭环分析和设备配置等方面,形成了完整的技术体系,能够为有特殊领域数据处理需求的行业提供强有力的支持。
目前,郝杰团队已与电力科学研究院、南瑞集团、工程物理研究院等单位合作,推动产品在大规模电网安全计算、电力电子仿真、能源系统仿真等领域的应用。
在郝杰研究团队成员的心中,有一个共同的梦想:快速准确的大数据处理不再是问题。
《中国科学日报》(第六版,2017年7月3日)
上一篇:刘伟平到科大讯飞调研人工智能产业
下一篇:多管齐下发力生猪产业可持续发展
推荐阅读