南京农大构建世界首个植物重复基因数据库
图片说明:植物体内不同类型重复基因的含量分布及其随时间的变化
2月21日,南京农业大学园艺学院张少玲教授的团队在国际著名学术期刊《基因组生物学》在线发表了一篇研究论文,系统地鉴定了梨等141个植物基因组中不同类型的重复基因,构建了世界上第一个植物重复基因数据库,揭示了重复基因进化的普遍规律。
在数千年的进化中,植物是如何变得越来越丰富多彩的?一个重要的因素是植物会复制它们的基因并丰富基因库的数量。一起,力量是巨大的。随着更多的“兄弟姐妹”和更多的“兄弟姐妹”,基因在生物体中“获得动力”。它们不仅能抵御外界复杂多变的环境,还能增加进化和变异的机会,实现物种的分化和多样性。
以前的研究发现,一些植物具有复制自己基因的功能,即通过不同类型的复制产生一个与原始基因序列相同的新基因。由基因复制产生的两个同源基因被称为复制基因或“姐妹基因”。近年来,越来越多的植物基因组被解码。目前,已有200多种植物被测序,但仍缺乏一种广泛适用的方法来鉴定不同植物物种的重复基因。
基于对梨基因组中重复基因的系统鉴定,该团队开发了一种生物信息学方法(命名为DupGen_finder),该方法具有普遍适用性,可用于鉴定植物界不同植物物种基因组中的重复基因。对141个植物基因组中重复基因含量随时间变化规律的深入分析表明,在植物漫长的进化过程中,基因串联复制和相邻复制始终保持较高的频率,为植物适应复杂多变的外部环境提供了连续的遗传变异材料来源。
同时,该研究揭示,在基因组复制发生后的短时间内,重复基因之间发生高频率的基因转换,并且随着时间的推移,重复基因之间发生广泛的时空表达分化。最后,利用141个植物基因组中包含的所有蛋白质序列构建了一个大规模的植物直向同源基因家族(86,831)。
此外,通过大规模收集和整合国内外植物基因组数据资源,建立了世界上第一个植物重复基因数据库(PlantDGD,http://pdgd.njau.edu.cn:8080)。目前,已有141种植物完成了基因组测序,包括大豆、水稻、小麦和玉米等主食作物,以及梨、桃、葡萄、蔬菜和花卉等园艺作物,并将扩展到所有与植物相关的类别。该数据库将为深入研究复制基因的进化机制提供有价值的数据资源。
研究结果以南京农业大学为第一整理单位,以园艺学院博士生乔欣为第一作者,以南京农业大学教授张少玲和美国佐治亚大学教授安德鲁·帕特森为合著者。它还获得了国家重点研发计划、国家自然科学基金重点项目、美国国家科学基金等项目的资助。
相关文件信息:DOI: 10.1186/S 13059-019-1650-2