来自宇宙的数据洪流
数字巡逻和实时望远镜观测正在引发前所未有的数据洪流。隐藏在这些数据中的可能是宇宙学中最大难题的答案。
对于在美国宇航局国家空间科学数据中心工作的科学家来说,自2000年以来,一场信息革命悄然兴起。在一次会议上,一位天文学家问中心是否能记录下光环家族大规模密集天体调查收集的1万亿字节数据,该调查致力于研究只发出少量光和其他辐射的神秘天体。尽管今天许多台式计算机的硬盘可以存储1万亿字节的数据,但当时的数据中心是不可能的,因为在那之前的45年里,美国宇航局只收集了1万亿字节的数据。
[图片说明:直径64厘米的大口径全天检查望远镜焦平面的实际尺寸模型。请注意,由于月球视野的大小比较(直径0.5度)。版权所有:LSST公司。
该算法对于大样本不仅能更容易地找到规则,而且能加速异常现象的识别。现在,百万分之一被认为是一个意想不到的发现。你只是在正确的时间把望远镜指向了正确的方向。这是在寻找高红移类星体时常见的现象,类星体是由超大质量黑洞驱动的非常遥远和明亮的物体。目前,寻找它们基本上是运气的问题。有了电脑来筛选数十亿个天体,天文学家可以更有条理地找到这些物体和其他不寻常的目标。这种方法不仅更快,而且更准确。
另一方面,信息学也是一个强大的统计工具,可以反映整个宇宙的图像。例如,天文学家传统上使用分光计来估计遥远星系的距离,分光计将天体发出的光分成不同的波长。然而,在SDSS每一个有光谱数据的天体中,大约有100个天体没有光谱,只有与之对应的图像。这就是天文信息学校派上用场的地方。天文学家已经开发出一种算法,允许天文学家仅通过分析图像来估计天体的距离,为研究宇宙的三维结构提供更大的数据集。这对LSST尤其重要,因为天文学家无法获得99%天体的光谱。
无国界望远镜为了尽可能多地了解遥远的天体,天文学家将在不同的波段上观察它们。不幸的是,结果数据通常存储在世界各地,这使得它们很难获得。此外,它们中的大多数是不兼容的,所以要把它们结合起来需要很大的努力。大约10年前,一群天文学家开始讨论建立一个全球统一的虚拟天文台。就像互联网一样,这个虚拟天文台是一个超越现实的框架。它连接了许多望远镜的数据,并为它们提供了研究工具。在美国,2002年启动了一个实验性虚拟观测站,即国家虚拟观测站,但由于缺乏良好的数据分析工具,很难使用。2010年5月,美国航天局和国家科学基金会决定在未来五年向虚拟天文台注入2,750万美元,并继续开发数据共享工具,这再次使虚拟天文学的前景具有吸引力。虚拟天文台本身不会取得突破,但它会使新的突破成为可能。这就像互联网改变了世界,是超文本传输协议(HTTP)改变了世界。
计算机科学和天文学之间的跨学科联姻并没有得到各自领域的充分支持,但形势正在发生变化。2010年5月首次亮相的虚拟天文台是一个分水岭。这个有10年历史的国际网络使天文学家能够通过互联网从几十个望远镜获得数据。此后,第一届国际天文信息学会议于2010年6月举行。
天文学家习惯于在人类想象力的极限行走,但即使是他们也会在从海量的新数据中提取新知识时遇到尴尬。道路已经修好,现在轮到法拉利了。
上一篇:脚趾头顶破袜子妙招