攻克基因组测序难题 探究茶树生物学奥秘
■我们的记者沈春雷
神农尝了一百种草药,一天中遇到七十二种毒药。《本草经》记载:“他得茶解渴。”这显示了茶的神奇效果。茶树原产于中国的云南和四川。在从中国到世界其他地方的几千年的长期传播中,它与全球多元文化相遇并融合,发展成为今天地球上一种复杂而奇妙的茶文化。茶之所以如此受欢迎,不仅是因为它迷人的香气和宜人的口感,还因为茶含有许多有益于人体健康的特色成分,如多酚、茶氨酸、咖啡因、维生素、芳香油和矿物质。
长期以来,茶的香气、风味和品质之间的关系,以及为什么茶树能够在世界上传播和生长,一直被认为需要通过基因组学策略来研究。中国科学院昆明植物研究所研究员高带领的团队花了7年时间,于2017年首次成功破译了茶树基因组。
几天前,高在接受《中国科学报》采访时说:“如果化石能帮助我们找到山茶最早起源和进化的证据,那么基因组测序就能探索茶的生物秘密。”
决心破译茶树基因
今天,茶树生长在全世界380多万公顷的土地上。国际茶叶理事会的数据显示,2016年全球茶叶产量将达到546.3万吨,其中235万吨将在中国生产。高丽芝说:“茶不仅在中国,而且在全世界都具有巨大的经济、医学、科学和文化价值。”
然而,在世界三大饮料植物中,咖啡和可可的基因组已先后被欧美国家测序,但茶树的基因组尚未解码。
2006年,高从美国回到云南,加入中国科学院昆明植物研究所资助的中国西南野生动物种质资源库。回到中国后,他做的第一件事就是购买中国第一个第二代高通量测序索莱克斯遗传算法二。然后,他带领团队在世界上首次破译了五种稻属植物的全部基因组。
有了水稻基因组测序项目的经验,高带领植物种质资源、基因组学和生物信息学研究团队于2010年在世界上首次启动了茶树基因组计划。
为什么茶树基因难以检测
高团队与华南农业大学、云南农业大学、广东农业科学研究所、辽宁师范大学、云南茶业科学研究所、金*际山地茶园、华中农业大学、华盛顿大学等相关研究团队,率先在国际上对*茶树良种10号进行了核基因组测序和组装,获得了约30.2亿个碱基对的优质基因组参考序列,并注释了36951个蛋白质编码基因。
经过深入研究,该小组发现茶树基因组巨大的原因是长末端重复反转座子家族。在过去的5000万年中,茶树基因组中的长末端重复反转座子家族经历了多次爆发,尤其是在不久的将来。它们长期以来一直缓慢扩张,但缺乏有效的DNA缺失机制,导致茶树基因组庞大。
高丽芝指出:“现在的茶叶基因组和人类基因组的大小差不多。咖啡基因组只有它的四分之一大,而大米和可可基因组只有它的八分之一大。”
为什么茶树如此复杂以至于基因组测序非常困难?因为茶树是一种高度自交不亲和的异交植物。高举了一个形象的例子:“茶树的花粉落在自己的植株头上,很难成功授粉,这使得几乎每一棵茶树都是杂交的。当新的个体出生时,他们只知道谁是他们的母茶树,而不知道谁是他们的父亲。”
茶树基因组的高度杂合性显然给基因组测序带来了很大的麻烦。高丽芝的团队发现茶树基因组的杂合性高达2%。重复序列含量极高,占全基因组的80.9%。高简要介绍了测序工作如下步骤:首先,将长的DNA链切割成小段,然后用第二代高通量测序仪测序,最后,最重要的步骤是剪接和还原。具有高杂合性和高重复序列含量的基因组不仅难以组装和恢复,而且容易出错。
组装的最后一步极其困难,高的团队花了4-5年的时间才完成,最终克服了杂合子高、重复率高、基因组大的植物基因组测序难题。
为什么只有茶树适合泡茶
茶树有119种。一个重要但长期的问题是,为什么只有茶组植物的叶子适合泡茶,而不是茶组植物的叶子,例如众所周知的山茶花和山茶花,不能用作茶饮料。
为此,高带领团队对大多数茶组植物和非茶组代表植物的植物化学成分进行了对比分析,发现茶树和其他茶组植物富含茶多酚和咖啡因,从而将其与非茶组植物区分开来。
研究还发现,最近茶树发生了一次全基因组重复事件,大量特异基因家族扩增,导致茶树基因组中与茶叶香气、风味和品质密切相关的基因显著扩增。扩增的结果不仅促进茶树适应全球多样化的环境,而且通过适者生存的自然选择促进茶树抗病基因家族的生长,使其成为世界饮料植物。
高认为,获得山茶的第一个基因组不仅可以了解山茶基因组和基因的进化规律,而且促进了世界四大木本油料植物之一的山茶的遗传育种,山茶和金花茶,被称为“植物大熊猫”。
通过与不同团队的合作与交流,高成为了茶学专家,进一步证实了野生茶与栽培茶风味差异的遗传基础。由于其丰富和优秀的新基因,野生茶树相关物种有望开辟新的茶叶市场,使中国的茶文化在国家“一带一路”倡议下再次走向世界。
《中国科学报》(第五版《创新周刊》,2018年1月15日)
上一篇:玛丽亚·德热苏斯几岁
下一篇:汉朝分封制的社会背景是什么