水下数字化软件改变海洋生态学研究
当人们不再局限于仅靠人力浏览和分析图片时,信息生产变得更大。
照片的一部分出现了蓝色的芽,而另一部分出现了一个灌木状的粉红色紫色孢子。即使未经训练的眼睛也能看到每个孢子明显不同,是珊瑚。曼努埃尔·冈萨雷斯-里韦罗然后指向第三个集群。这些球状生物看起来像珊瑚,但它们光滑的灰色表面看起来与珊瑚有些不同。"它的质地和颜色表明你可能没有在看珊瑚."他说,“可能是附着在岩石上的珊瑚藻。”
这张照片是XL Catlin海景调查项目拍摄的高清全景照片,该项目是2012年启动的一个科学项目,旨在收集世界各地的珊瑚礁。为了了解珊瑚礁如何应对过度捕捞、污染、全球变暖和海洋酸化,卡特林的团队,包括生态学家冈萨雷斯-里韦罗,正在利用数百万张水下照片记录珊瑚的数量、健康状况、结构和生物多样性。
手动浏览这些图片需要几十年的时间,即使是从冈萨雷斯-里韦罗的专业角度来看。但是Katrin的团队正在使用一种神经网络算法:一种深度学习系统,在这个系统中,计算机可以对他们看到的珊瑚礁照片进行分类。该项目由加州大学伯克利分校的计算科学家奥斯卡·拜伊邦领导。该软件可以在几个月内快速浏览卡特琳团队的大型照片库。目前,大约有100万张照片。
这个软件只是珊瑚礁研究人员利用计算机科学和软件开发加速全球水下珊瑚礁图像分析的一个例子。将这些工具与收集标准生物数据的高质量成像和传感器联系起来,将开启一个半自动数据收集和监测的新时代,让生态学家有更多的时间花在研究上,而不是处理数据。
“这是向前迈出的一大步。”马里兰州国家海洋与大气管理局(NOAA)的马克·埃金(Mark Eakin)管理着珊瑚礁监测项目,他说,“当人们不再局限于仅仅依靠人力资源来浏览和分析图像时,信息生产会变得更大。”
海洋数据
珊瑚研究人员进入大数据世界有点晚。长期以来,由于潜水鳍和氧气瓶容量的限制,海洋生物学家一直在竞争扩大他们对海洋温度上升和海洋酸化的长期影响的记录和理解。2015年至2016年热带太平洋地区伴随厄尔尼诺变暖事件的全球珊瑚衰退进一步加剧了科学家的担忧。
冈萨雷斯-里韦罗的目标是覆盖尽可能多的珊瑚礁区域,以便了解不同的珊瑚和珊瑚礁如何应对这些压力。他说,计算机永远不能取代人眼,也不能取代详细的水下观察和实验室研究,但它们可以加速基本观察。“我们正试图找到一个平衡点,这样我们就能获得足够的珊瑚礁信息,并以更快的速度和更低的成本完成这项工作。”
研究的质量不容小觑:根据Beijbom未公开的研究结果,深度学习系统对珊瑚照片的分析与人眼的一致性在81%以下。考虑到两个专家之间的一致性只有84%,这个准确度已经相当高了。
Beijbom计划在未来几个月向任何上传照片到其网站CoralNet的人开放该公式,该网站使用计算机辅助系统自动进行照片分析。多亏了美国国家海洋与大气管理局的支持,这项服务是免费的。包括美国国家海洋与大气管理局在内的各种组织的420名用户已经在网站上发布了近269,000张照片。Beijbom说,最好的结果似乎来自一个半自动项目,在这个项目中,计算机进行简单的分析,并提醒人类专家它的一些不确定性。
冈萨雷斯-里韦罗说,在许多方面,海洋科学正在赶上陆地科学项目,相关的科学研究项目开发了各种工具,用于收集和处理来自卫星和飞机的丰富数据。这些软件和硬件不能直接用于海洋分析。因为海洋会吞噬光,所以只能从上面研究浅水珊瑚礁,而其他珊瑚礁很难分析。
这使得珊瑚研究人员改变了这些工具。例如,在密歇根州立大学,生理学家大卫·克莱默和金泽明子修改了一个最初用于农业研究的手动传感器。当在陆地上使用时,这些传感器可以测量诸如植物荧光、土壤碳含量、空气温度和湿度等信息。全世界18个国家使用了大约300个传感器。每当研究人员或*官员阅读这些数据时,这些信息就会被上传到*处理器进行分析。
这种改进的系统被称为“珊瑚望远镜”,可以用不同的光线撞击珊瑚礁,并记录下从紫外线到红外线的256种波长的光谱信号。这些数据可用于测量珊瑚礁的光合作用活动,例如,通过测量共生藻类的叶绿素荧光,共生藻类可为其宿主珊瑚提供氧气和营养。克莱默说,了解光合作用发生的数量和地点有助于研究人员理解压力系统。
这种设备是用市场上可买到的传感器和3D打印机制成的。克雷默和金泽希望将水下设备的价格从目前的500美元降低到尽可能多的惠及每一位科学家。"我们需要一个能够进行高质量测试的团队。"克莱默说。
计算机辅助版本
海洋微生物学家阿尔琼·陈努开发了一种水下成像系统,可以在更宽的辐射范围内收集更详细的数据。珊瑚生态学家可以解释这些图像,信息被输入到基于开放资源机器学习软件的神经网络算法中,该软件类似于Beijbom开发的软件。德国马克斯·普朗克海洋微生物研究所的陈努说,这种装置的超光谱光谱意味着它可以获得比人眼更多的信息。这将更容易区分标准图像中看起来相似的珊瑚。“例如,我们将常用的‘其他珊瑚’分为更正常的类别,包括海绵、藻类和海藻。”他说。
其他人也修改了商业软件,通过将二维图像与三维模型叠加,用于绘制地理图片和分析山体滑坡。夏威夷大学马诺海洋生物研究所的博士生约翰·伯恩斯使用了一个名为Agisoft PhotoScan的系统,专业版售价549美元。伯恩斯说,也有免费软件,但精确度不够。
当模型使用质量更好的照相机时,它可以获得1毫米的分辨率,这可以被人或计算机用来区分珊瑚种类和计算覆盖的珊瑚礁的数量。然而,由于它们是三维的,它们也可以用来跟踪海洋高温引起的珊瑚褪色和珊瑚破坏(一种新的生态信息)的结构变化。
对伯恩斯来说,这种方法的魅力在于它的简单性:无需大量训练就能快速收集数据。“这种方法可以让你用相机拍摄成千上万的单透镜图像,然后你可以把它们拼接在一起。”他说。
标准存储
纽约野生动物保护协会的海洋生态学家艾米丽·达林说,精确的技术不是唯一的答案。因此,各种研究工作在收集越来越多的珊瑚礁数据、收集标准化数据集并将其存储在整个学术界都能获得的信息库中变得非常重要。
例如,为了收集关于最近全球珊瑚漂白事件的系统数据,达林和他的同事们发明了一种非常简单的技术——Excel电子表格,全球科学家可以用它来登记关于珊瑚礁状况的各种数据。其价值在于,当科学家上岸时,他们可以快速输入和分析数据。达林现在拥有来自13个国家的61000多个珊瑚礁栖息地的统一结果。大约58%的珊瑚礁变色了。
最后,达林说,珊瑚生态学家需要在一个*资料库中收集全世界的信息。“我们需要可以获取信息的地方,他们可以讲述故事的地方,以及人们可以去了解保护活动是否奏效的地方。”“我们需要能够更快地回答这些问题,”她说。(冯伟伟)
中国科学新闻(2016-09-08第三版国际版)
阅读更多
《自然》杂志的相关报道
推荐阅读