基因组图谱全面揭秘鸟类演化“大爆炸”历程
新华社记者华玲综合外国通讯社
为什么鸟没有牙齿;多彩的羽毛是如何进化的;鳄鱼怎么能和鸟一起爬亲戚呢?为什么鹦鹉能“说”人类语言?
一项历时四年的雄心勃勃的国际合作研究,通过对现代鸟类基因组图谱的全面分析,揭示了大约6600万年前地球上一大群动物恐龙灭绝后鸟类进化的“大爆炸”过程,并深入回答了许多问题。领导这项研究的国际鸟类基因组研究联盟最近以特刊形式发表了28项第一阶段研究成果,其中8项发表在《科学》杂志的鸟类特刊上,其余20项相继发表在《基因组生物学》和《大数据科学》等期刊上,揭开了生物进化历史上的又一个重要篇章。
鸟类学的基因组和进化生物学
先前的研究表明,在白垩纪灭绝中幸存下来的鸟类经历了快速进化。然而,这种快速的进化过程至今仍是个谜,现代鸟类的进化关系几个世纪以来一直困扰着生物学家。此外,对于物种灭绝后新生的10,000多种鸟类进化背后的生物多样性的分子基础知之甚少。
为了回答这些问题,中国深圳华大基因研究所国家基因库副所长张研究员、美国杜克大学神经生物学家埃里希·贾维斯和霍华德·休斯医学研究所以及丹麦自然历史博物馆托马斯·吉尔伯特领导的国际鸟类基因组联盟完成了乌鸦、鸭子、猎鹰、鹦鹉、企鹅、朱鹮、啄木鸟、鹰等48种鸟类的全基因组测序、组装和比较分析。,包括现代鸟类的主要分支。
这些新发表的结果对许多鸟类进化相关的问题提出了新的观点。发表在《科学》杂志上的两篇综合文章称,研究人员基于全基因组数据构建了历史上最可靠的鸟类分子进化树,这解决了关于早期鸟类进化之间关系的历史争论,这是前所未有的。本文描述了鸟类基因组的进化过程,并从基因组的角度阐述了鸟类宏观进化的重要特征。
然而,发表在《科学》杂志《鸟类》特刊上的六篇文章分别描述了控制某些鸟类和人脑语言控制区域声音学习的分子通路的独立进化过程、鸟类性染色体的复杂进化过程、鸟类在早期进化过程中如何一步一步地失去牙齿、鸟类近亲鳄鱼的基因组是如何进化的、鸟类在大脑中歌唱行为的基因调控机制以及利用大规模基因组数据构建进化树的新方法。
鸟类亲缘关系树的清晰绘制
过去,生物学家无法利用一些DNA测序、解剖或行为特征来构建一个明确的鸟类家谱。研究人员解释说,由于现代鸟类早期的物种快速形成,繁殖时间很短,物种之间在个体基因水平上没有足够的序列差异,因此很难用少量的DNA序列提供足够的信号来确定物种之间的遗传关系。此外,由于许多物种可以进化出相似的形式或行为,这为利用解剖学和行为特征构建物种树制造了许多障碍。
为了解决现代鸟类的分化时间及其相互关系的问题,研究人员决定用全基因组的DNA序列来推断鸟类的种类树。从全基因组数据推断的鸟类物种树的系统发育与以前的结果大不相同。研究发现,仅仅使用编码蛋白质的基因来构建进化树和真正的物种树有很大的不同。因此,也应该使用非编码序列,包括基因间区域。该研究还发现,编码蛋白序列在一些具有相似生活史的物种中具有有趣的趋同性和进化性。
这种新的鸟类物种树完全解决了目前的颌首(新鸟)问题,即鸟类躯干的早期分支,并对一些长期存在争议的关系给出了明确的结论。例如,新的研究结果支持水鸟有三个独立的起源。主要的陆地鸟类,如鸣禽、鹦鹉、啄木鸟、猫头鹰、老鹰和猎鹰都来自同一个祖先,*捕食者。这种生物也是曾经在美国发现的一种巨大的恐怖鸟(也叫惊骇鸟)的祖先。
研究人员表示,基因组测序技术的日益成熟和成本的降低,以及构建进化树和比较基因组学的计算方法的发展,使他们能够比过去更好地解决这些科学研究问题。
由于每个物种都有大约14,000个同源基因,鉴于庞大的数据集和分析的复杂性,研究人员采用了几种新的方法来构建鸟类进化树。研究人员表示,一次计算一个CPU来构建一棵鸟类物种树需要大约300年的时间,因此这对大数据分析来说是一个前所未有的计算挑战。其中一些分析甚至需要内存太多的超级计算机。
更新许多关于鸟类进化的争论
全基因组分析的结果推翻了以前的一些研究结论。先前的研究推测,现代鸟类的爆发发生在6600万年前大规模灭绝之前的1000万到8000万年之间。然而,新的分析表明,现代鸟类的爆发应该发生在白垩纪灭绝后的1000-1500万年内。尽管这个时期几乎毁灭了地球上所有的恐龙,但一些鸟类幸存了下来。
基于新的基因组数据,研究人员认为只有少数鸟类在大规模灭绝中幸存下来。后来,他们突然进化出10,000多种新的鸟类。据估计,现存鸟类祖先的95%起源于这一时期。研究人员推测,鸟类占据了大规模灭绝后恐龙最初占据的生态位。新的生态环境为鸟类新品种的形成创造了有利条件,导致许多新品种在不到1500万年的时间里迅速产生。在很大程度上,这也解释了为什么现代鸟类有如此丰富的多样性。
令人惊讶的是,与其他脊椎动物相比,鸟类基因组具有极其特殊的特征。张和他的学生发现,与其他爬行动物相比,鸟类基因组中的重复序列含量相对较少,鸟类祖先与爬行动物分化后,数千个基因丢失。
张说:“鸟类丢失的许多基因对人类有非常重要的作用,在维持生殖系统、骨骼形成和肺系统等方面是不可缺少的。这些关键基因的缺失可能在鸟类许多独特表型的进化中发挥重要作用。这是一个非常有趣的发现。人们普遍认为,进化过程中产生的新性状和表达通常是新产生的遗传物质的产物。然而,鸟类独特的进化过程提供了一个非常特殊的例子,表明基因的缺失也能导致新的表型。”
研究人员还发现,从整个染色体水平到基因序列,鸟类基因组结构在过去1亿年里一直非常稳定。与哺乳动物相比,鸟类的基因进化速度也很慢。这是鸟类在很长一段时间内在基因组水平上独特的宏观进化特征。
然而,一些具有相似生活习性或表型的鸟类,如具有歌唱学习能力的鸣禽,在某些基因组区域表现出极快的进化速度。这种情况被称为趋同进化,这可能是一些遗传关系非常远的鸟类独立进化相同表型的潜在机制。
鸟类物种多样性的分子基础
为什么鸟会唱歌?研究表明,鸟类的歌唱学习已经独立进化了至少两次,并且与许多基因的趋同进化有关。发表在《科学》杂志上的一篇文章表明,具有歌唱学习能力的鸟类,包括黄鹂、鹦鹉和蜂鸟,在与人类大脑语言相关的领域中,在与歌唱学习相关的大脑基因调节回路中具有相似的表达和进化特征。研究发现,50多个相关基因在上述区域显示出相似的变化模式,其中许多基因与神经连接的形成有关。《科学》杂志上的另一篇文章认为,整个基因组中有10%的基因与鸟类歌唱有关。这些基因在大脑中与歌唱和学习相关的不同区域有不同的激活模式,它们的激活也受表观遗传的调节。此外,发表在《公共科学图书馆综合》杂志上的一项研究称,鹦鹉有一个独特的歌唱学习系统,其中会嵌套另一个歌唱学习系统,这可能是它们模仿人类语言能力强的原因。发表在BMC基因组学上的另一项研究揭示了与鸣禽大脑中的歌曲控制相关的物种特异性基因。
鸟类的性染色体有什么特别之处?正如人类的性别受X和Y染色体控制一样,鸟类的性别受Z和W染色体控制。发表在《科学》杂志上的一项研究表明,超过一半的鸟类W染色体仍然含有大量的功能基因。这极大地颠覆了传统观点,即鸟类的W染色体和人类的Y染色体都是“基因坟墓”。研究还发现,不同鸟类的性染色体处于完全不同的进化状态。例如,鸵鸟和鸸鹋,在鸟类中相对古老,它们的性染色体与祖先非常相似,而且大多数基因都是功能性的。一些现代鸟类的性染色体,如家鸡和斑马雀,只含有一些功能基因。
为什么鸟没有牙齿?生物学家早就发现鸟类有沙袋但没有牙齿。发表在《科学》杂志上的一篇文章指出,与其他有牙齿的脊椎动物不同,一些与珐琅质、牙质和牙齿构造有关的基因在现存的鸟类中经历了关键的基因突变。研究表明,大约1亿年前,鸟类的共同祖先在很短的时间内丧失了与牙齿相关的五种基因的功能,导致鸟类没有牙齿。
鸟类和恐龙之间有什么关系?与哺乳动物不同,鸟类有大量的小染色体,这被认为存在于它们的恐龙祖先中。在发表在《BMC基因组学》上的一项关于基因核型结构的研究中,研究人员分析了家鸡、火鸡、北京鸭、斑马雀和虎皮鹦鹉的全部基因组。结果表明,家鸡染色体结构变异相对较少。
谁是这只鸟的近亲?发表在《科学》杂志上的一项研究对鳄鱼进行了基因组研究,发现鳄鱼基因组是进化速度最慢的基因组之一。基于鸟类和鳄鱼的基因组,研究人员推断出了鸟类和鳄鱼共同祖先的基因组序列。这个“祖先”也是6600万年前灭绝的鸟类和恐龙的共同祖先。
基因树和物种树的区别重要吗?研究发现,没有一个由单一基因构建的进化树与物种树完全一致。部分原因是由于一个称为不完全谱系分类的过程,即由于物种分化时间极短,祖先基因的多态性随机固定在分化的物种中。这种现象也给系统进化树的构建带来了很大的障碍。为了解决这个问题,研究者们采用了一种新的计算方法,并提出基于溯因理论,在全基因组水平上使用综合基因树来推断物种树。
鸟类基因组携带的病毒序列比其他物种少吗?哺乳动物基因组含有大量的DNA“化石”,这些化石是在过去病毒感染后插入宿主基因组的,被称为“内源性病毒成分”。发表在《基因组生物学》杂志上的一项研究表明,鸟类体内内源性病毒成分的数量是哺乳动物的6-13倍。这也与鸟类基因组相对较小的事实相一致,并暗示了两种可能性:或者鸟类基因组对病毒入侵不太敏感,或者鸟类可以更好地去除入侵的病毒序列。
华丽的羽毛是如何进化的?精致明亮的羽毛在鸟类进化中具有重要意义。羽毛美丽的雄鸟在求爱时会比竞争对手更有优势。在上述发表在《科学》杂志上的综合文章中,研究人员表示,46个鸟类家族中有8个拥有与羽毛颜色相关的基因,比如角蛋白,这种基因比其他基因进化得更快。然而,发表在英国医学委员会进化生物学杂志上的一项研究称,水禽的β角蛋白基因最少,是陆生鸟类的两倍多,是家养宠物和农业鸟类的八倍多。
当鸟类面临灭绝或从灭绝中恢复时会发生什么?在发表在《基因生物学》杂志上的一项研究中,研究人员分析了几种濒危鸟类的基因组,包括亚洲的朱鹮和美国的秃鹰,发现在这些濒危鸟类中,降解环境毒素的基因突变率较高,而与免疫系统相关的基因多样性较低。在近年来逐渐恢复多态性的朱鹮种群中,与脑功能和代谢相关的基因进化速度更快。研究人员还发现,这一种群的遗传多样性比预期的要多,这给随后的朱鹮种群保护带来了更多希望。
承前启后谱写重要篇章
鸟类基因组绘图项目赢得了世界各地博物馆和其他机构研究人员的支持。在过去的30年里,他们收集的冷冻鸟类组织样本为获取DNA样本提供了极大的便利。同时,鸟类基因组联盟建立了各种数据库,供其他科学家对各种复杂鸟类特征的遗传基础进行深入研究。
建立一个大规模的基因组研究过程是一项艰巨的任务,包括收集和分类组织样本、提取DNA、分析样本质量、测序和管理大量新数据。研究人员相信,这些工作将为其他正在进行脊椎动物大规模测序的研究团队提供重要的参考。为了鼓励其他研究人员从这些“大数据”中挖掘出更多的信息,并找到过去难以用小规模数据观察到的数据特征,鸟类基因组联盟已经将从整个项目中获得的所有数据公布在GigaScience、NCBI、ENSEMBL和CoGe的数据库上,这些数据库向公众开放并允许下载。
事实上,为了更好地利用本项目产生的数据,研究团队已经在项目的早期阶段将未发布的数据开放给同行进行相关研究。2014年初,他们在GigaScience上公布了该主题的所有基因组数据,并通过推特进行推广,这在社交媒体上引起了巨大反响和热烈讨论,在短时间内数据库用户数量翻了一番。
“物种从哪里来,它们如何进化以及它们如何发展是生物进化研究中最基本的问题。基因组的应用使我们能够复制历史并回答这些基本的科学问题。这是迄今为止对同一组物种基因组进化过程的最大分析,也是利用比较基因组学揭示生物宏观进化历史的重要一步。”张对说道。
吉尔伯特说:“尽管许多脊椎动物的基因组已经被连续发表,但迄今为止还没有一项研究对一大类脊椎动物物种的生物多样性进行过如此详细和具体的分析。揭示生物多样性的分子基础正是组织这个联盟的初衷。只有当样本量足够大时,科学家才能充分开发包括整个脊椎动物种群在内的基因组多样性。”
埃里希·贾维斯说:“这是一个历史性的时刻。随着样本量和基因组数据的增加,越来越多的关键问题可以得到解答。我参加这个项目是因为我很长时间以来一直用鸟作为研究人类发声和语言学习的模型。这些鸟的起源为大脑进化的研究开辟了许多新的视角。”(原标题:多彩的翅膀,悠扬的歌声,盘旋,随时间迁移...基因组图谱全面揭示了鸟类进化的“大爆炸”过程)
上一篇:什么叫地球生物圈?