植保界的“码农”董莎萌:给马铃薯看病要依靠大数据
“太糟糕了。马铃薯的叶子和茎上布满了病斑。大约2000亩农田可能没有收成。罪魁祸首是晚疫病,也被称为马铃薯癌症。前不久,董莎萌非常担心贵州省贵阳市息烽县南切村的马铃薯地“遭遇战”。
为了缓解“疫情”,南京农业大学植保学院的教授、博士生导师和他的学生连夜对“发病”的马铃薯进行取样分析,破解了病原菌的基因组,筛选出了两个抗病性较好的马铃薯,推荐给当地农民。“明年,那里的农民将能够种植这些抗病品种。”董莎萌说。
这只是董莎萌接手的众多“案例”中的一个。38岁的董莎萌像植物保护领域的“外科医生”,在全国马铃薯晚疫病流行区“追逐”疫情。他也是植保领域的“代码农民”,开发了马铃薯晚疫病大数据监测系统,研究晚疫病在中国的发病率和流行规律。
几天前,董莎萌在世界上首次实现了海量农作物病原信息的三维提取、计算和分析,并对病原致病性进行了高精度预测和模拟。
陷入基因组图谱三年
打开南京农业大学马铃薯晚疫病菌生化培养箱,一个个菌丝覆盖的培养皿映入眼帘。在这个资源库中,有超过450个有代表性的晚疫病菌株,这些菌株是董莎萌的团队在12年中收集的。他们中的一些人来自英国、荷兰和法国,其他人来自中国的主要马铃薯产区,如黑龙江、福建、安徽和贵州。
“中国的马铃薯产量是世界上最高的,并且该国已经实施了一项主要的以谷物为基础的马铃薯战略。晚疫病是马铃薯的头号“杀手”。如果我们了解晚疫病在我国的发生率和流行程度,农民将能够使用更少的农药来指导他们准确育种和高产。”穿着白大褂的董莎萌在实验室里快步走着。
由于缺乏对晚疫病的原始认识和有限的研究工具,我国学者对晚疫病的发病机制和灾害机理仍不十分清楚。但是在2017年夏天的一个晚上,董莎萌度过了一个精彩的时刻。
当晚10点多,由董莎萌和学生绘制的第一张国际三维晚疫病表观基因组地图出版了。在此之前,他们已经研究了将近3年。
该图谱源于2014年在董莎萌开始的晚疫病基因组三维大数据监测系统的设计和集成。“过去,当国内外研究人员分析致病疫霉的脱氧核糖核酸(DNA)时,他们只能从二维角度监测基因序列。但是三维系统可以看到每个基因序列的空间和结构信息。”他说。
跨越生物学和计算科学的研究曾让董莎萌陷入黑暗时刻。“大约在2015年,我感到非常痛苦。该团队进行了生物学研究,需要知道算法来进行大数据分析。”董莎萌说。
为了弥补算法的不足,董莎萌启动了“学习欺负模式”,每天花10多个小时在实验室里自学编程和算法,给专家和同事写信寻求帮助,“但他被拒绝了很多帮助”即使在半夜12点,董莎萌办公室的灯也一直亮着。
最后,他将传统计算机只能在20多天内完成的晚疫病致病性数据分析压缩为2天。目前,已有70多个中国菌株的二维基因组图谱保存在实验室数据库中,晚疫病菌的三维表观基因组图谱已增加到15个。
他一听到疫情,就赶往疫区。
外出鞋、突击服、全球定位系统定位器、大量取样袋...这些东西堆满了董莎萌的办公室。一旦他听说晚疫病流行,他就拿走这些“文物”,并说他会离开。
"如果我们加快疾病的发展,我们可能会因为拖拖拉拉而错过最佳采样时间。"有一次,他在上午10点接到一个电话,下午4点出现在安徽省界首市。
在我国,马铃薯晚疫病的发病率接近40%,每年造成的损失超过70亿元。晚疫病已逐渐成为制约我国马铃薯产业发展的主要瓶颈。
近年来,为了收集尽可能多的品种,董莎萌先后来到黑龙江、内蒙古、福建、安徽、云南、贵州、重庆、陕西、甘肃、宁夏、浙江等马铃薯产区。
大部分晚疫病流行区分布在山谷中。有一次,董莎萌带着他的学生去宁夏固原市取样。他下了飞机去赶公共汽车,挤上了农业机械。他挤满了鸡和鸭子。他花了将近两天时间才到达晚疫病流行区。
更糟糕的是,收集的晚疫病菌株没有成功分离,收集的结果无效。今年5月,在湖南,该小组连续四天进行实地采样,但最终失败了。
"当事情出错时,你必须承担责任。"无奈之下,董莎萌说他会独自去操场散步以缓解压力。“最痛苦的时间是从下午4点到晚上9点,失败的原因一直在他的脑海中被分析。”
在脆弱的一面,董莎萌会小心翼翼地“隐藏”好。在同学们的眼里,“董老师总是充满热情。只要他正确认识事物,他就会坚持到底”。最让每个人津津乐道的是,他花了4年时间,走访了30多个机构,寻找导致2008年中国西南地区马铃薯晚疫病爆发的菌株样本。
-原标题:董莎萌:利用大数据“治疗”马铃薯癌症
上一篇:日本重新拥抱燃煤电厂
下一篇:《寄会稽仲休山人》