基因并不能决定我们的一切
近年来,我们已经看到太多故意制造噱头的新闻标题,如“财富和成功来自于你的DNA”、“儿童的成功可能由新的基因测试决定”、“基因决定我们未来的命运”等。
问题是,这些新闻报道中有许多根本没有讨论真正的基因,而是根据一个粗略的统计模型,包括几十个不太可能的假设。现在,可以肯定的是,基因的整个概念模型正在受到挑战,尽管这个过程仍然非常缓慢。
我们已经达到基因的顶峰,并且走得更远。
当然,这是一个迷人的故事。今天,大多数人都知道19世纪50年代孟德尔的豌豆育种实验。他注重简单的特征,有清晰和易于计数的特征:紫色或白色的花;长茎或短茎;光滑或起皱的种子等。交叉受精后,后代的性状组合表明这些变化与单一的“遗传单位”有关。
孟德尔提出的遗传因子,当时还不确定,后来被称为基因。在20世纪初,人们很容易将它们等同于后代充分的精神和身体发展所需的信息和指导。
通过计算基因的数量来理解生命是没有意义的,就像通过字母的数量来判断文学作品一样。
丹麦植物学家威廉·约翰森在1911年发表了一篇著名的论文,警告人们不要这样做。他说,我们不知道那些推断出来但看不见的因素是如何携带如此复杂的信息的。然而,约翰逊的意见被忽视了。事实证明,真正的原因与意识形态有关,而不是生物学。
20世纪20年代,受青睐的基因法则开始出现在不同的面孔上。1943年,著名物理学家埃尔温·薛定谔在都柏林的一次著名演讲中对基因做了恰当的总结。他告诉观众,染色体“以某种编码脚本的形式包含了个体未来发展的整个模式,并决定了成熟状态下的功能”。
围绕着“编码”的形象,一个有着清晰的等级和特权的世界迅速得到加强。我们被告知这些基因有不同的“优势”。在阶级社会中,不同的基因排列形成不同的等级,这些等级决定了不同的“种族”和具有不同价值观的阶级结构。整个智能测试运动都是基于这个先入为主的概念,然后建立相应的测试方法。
这一形象也鼓励了优生学和1930年代的纳粹运动,并带来了悲剧性的后果。根据英国教育委员会1938年的著名论断,一些*宣称“遗传不平等是我们无法避免的事情”和“不同的孩子”...在某些重要方面需要接受不同类型的教育”。
第二次世界大战后的基因研究集中在生物化学上,但也有类似的先入之见。
沃森和克里克在1953年发现了脱氧核糖核酸的结构,这似乎证实了强大的编码脚本的存在。他们揭示了由脱氧核糖核酸(DNA)中的核苷酸组成的序列如何可以用作蛋白质的模板——可以被视为一种代码,就像打字机将字母组合成单词一样。因此,被广泛接受的“中心法则”可以被认为是基因编码的单向信息流:
DNA模板→蛋白质→发育特征;这就像仅仅通过造词就能写出一整本复杂的“书”。
然后,优秀的全基因组测序技术出现了。我们被告知,尽管花费巨大,这项技术在人类基因组计划中的应用将揭示“是什么造就了人类”。我们听到过多的承诺,声称控制人类智力、社会行为和复杂疾病的基因将很快被发现。
现在在低成本、高度自动化的程序中更容易找到这些基因。每个人的DNA组成——就像单词中的字母——是不同的,这种现象被称为单核苷酸多态性。对人类定义的基因搜索总结为找到这些变化与智商、教育、疾病或其他方面的差异之间的相关统计数据。
多年来,令人失望的是,单核苷酸多态性和可观察到的人类特征之间只有很少的微弱联系。然后一个想象的想法出现了。你为什么不从这些弱关联中挑出最相关的,并把它们加在一起,直到你得到一个与个体差异有统计学意义的关联?正是这种“多基因评分”将数百或数千个单核苷酸多态性与不同人的智商或教育成就(尽管非常弱)等特征结合在一起,从而构成了我们在今天的新闻中看到的夸大其词的说法。
今天,20世纪30年代的政策暗示再次被提出。与此相关的建议包括出生时进行遗传测试以进行教育干预,选择具有所需特征的胚胎,确定哪个类别或“种族”比其他类别更健康,等等。在智能营销下,数以百万计的人惊慌失措,通过DNA自我检测工具得知了他们的“基因命运”。
因此,现在大众媒体的大肆宣传正在传播一种一直隐藏在科学中的东西,也就是说,有一个“基因神”作为一个几乎具有超自然力量的实体。借用英国圣公会的一首赞美诗,现在是基因“使我们区分高和低,并有一个有序的地位”。
科学哲学家苏珊·奥亚玛在他1984年的著作《信息的个体发生》中警告说,“正如传统思维将生物形式置于上帝的精神中,现代思维也找到了赋予基因最终形成能力的方法。”
在今天科学和流行的描述中,基因将“扮演”和显示“行为”,将“引导”,“控制”,“设计”和“影响”,将“扮演角色”,“负责”和“自私”,仅举几例。似乎基因也有自己的设计和意图。
但与此同时,相反的叙述正在建立,不是来自媒体,而是来自科学本身。
威廉·约翰逊的逻辑观点被压制了很长时间,在过去的几十年里帮助“基因之神”成长。现在,他的逻辑又回来了。科学家们现在明白了,DNA编码中的信息只能用作蛋白质的模板,而不能用于指导更复杂的任务——将蛋白质组合成一个功能完整的实体,就像打字机的字母不能形成自己的故事一样。
我们中的许多人都被教导在生物发展之前必须有一套基因指令的概念。如果这些指令没有编码在DNA中,它们会在哪里?到了20世纪80年代,研究成果逐渐彻底改变了这一概念。
首先,实验室研究表明,早在基因存在之前,生命形式可能以“分子汤”的形式繁荣。它们是自组织的合成聚合物(如核糖核酸和脱氧核糖核酸),通过数百种成分的相互作用不断适应和再生。这意味着它们根据当前条件遵循由组件之间的关系产生的“指令”,并且没有整体控制器。遗传学家多伦·柳叶刀称这一“指令”为“组成信息”。
从这个角度来看,后来进化的基因实际上是先前系统的产物,而不是它们最初的设计者和控制者。当需要时,基因更有可能成为组件的模板:一个在循环基础上“及时”供应部件的设施。
然后我们慢慢意识到,我们从父母那里继承了这个动态系统,而不仅仅是基因。卵子和精子包含许多因素:酶和其他蛋白质;氨基酸。维生素。矿物;脂肪;核糖核酸;数百种细胞信号因子;以及父母基因的其他产物,而不仅仅是基因本身。
分子生物学家一直在描述这些因素如何形成复杂的相互作用网络。他们根据周围不断变化的环境来组织自己。对不断变化的统计模式很敏感,他们预测未来的状态,并经常创造新的属性来满足需求。
因此,即使是单个细胞也会改变它们的代谢途径,并利用基因来适应这些模式。换句话说,他们在“学习”的同时创造指令。当然,基因被用作制作重要资源的模板。然而,系统的方向和结果不受基因控制。像蚂蚁或蜜蜂的巢一样,在形态和变异的发展中有更深层次的动力。
有些人把这个过程比作没有指挥的管弦乐队。生理学家丹尼斯·诺伯称之为“随着生活的节奏起舞”——这也是他新书的标题。在早期开发中,这个过程是最惊人的。几个小时后,受精卵变成了一个相同细胞的球——当然,它们都有相同的基因组。然而,这些细胞已经通过化学信号“风暴”说话了。通过化学信号风暴中的统计模式,指令被再次创建。所有具有相同基因的细胞增殖成数百种不同的类型,在正确的时间找到正确的位置,并开始按照指令“跳舞”。这个过程不能用固定的DNA序列来描述。
结果,我们开始明白没有预先的发展计划或蓝图:指令是在匆忙中实时产生的,比愚蠢的DNA聪明得多。这就是为什么今天的分子生物学家报告细胞中存在“认知资源”。“生物学——信息智能”、“细胞智能”、“代谢记忆”和“细胞知识”,所有这些术语都来自最近出版的文献。“细胞会思考吗?”这是2007年发表在《细胞和分子生命科学》杂志上的一篇论文的标题。另一方面,基因型中假定的发育“程序”代码从未被描述过。
正是这些发现彻底改变了我们对基因因果关系的概念。我们传统上认为细胞内容物只提供DNA指令。然而,正如英国生物学家丹尼斯·诺伯所坚持的,“现代合成方法已经表明,生物学中的因果关系是错误的...除非被系统的其他部分激活,否则DNA本身不能做任何事情...DNA不是一个积极的原因。我认为一个更好的描述是,DNA是一个被动的数据库,生物体用它来制造他们需要的蛋白质。”
当然,很容易理解为什么人们会有直接遗传指令的印象。在一定程度上,父母“传递”他们的身体特征:头发、眼睛颜色、身高、面部特征等。这些都是“流经家庭”的东西。数百种其他疾病在统计学上与单基因突变相关。几十年来,我们的认知一直是,这些肯定反映了基因编码决定发展和个体差异,对吗?
事情没那么简单。想想孟德尔的甜豌豆。有些花是紫色或白色的。如前所述,遗传模式似乎反映了单一“遗传单位”的变异。然而,遗传模式并不依赖于单一基因。统计相关性模糊了染料(花色素苷)的几种化学合成途径,它们是由细胞作为一个整体来控制和调节的,包括许多基因的产物。一种成分(转录因子)的微小变化会破坏这种排列,在这种情况下,花是白色的。
这是诺伯所说的“被动因果关系”的一个很好的例子。类似的观点适用于家庭中的许多“遗传病”和“流动”疾病。但是更多进化的功能——以及相关的疾病——依赖于上面提到的更大的调控系统,涉及数千个基因。基因远非一意孤行的执行者,在控制基因转录的DNA序列中,基因通常被十几个或更多的“调节”序列所包围(被更广泛的细胞信号及其动力学所使用)。
这就解释了为什么人类基因的数量只比苍蝇或老鼠多一点点(只有大约20,000),而胡萝卜基因的数量是45,000!生物体的复杂性和它们所拥有的基因数量之间没有关联,但却与调节网络不断发展的复杂性有关。通过计算基因的数量来理解生命是没有意义的,就像通过字母的数量来判断文学作品一样。
所有这些为现代基因关联研究提供了一个焦虑的背景。此外,支持这些研究的统计分析本身充满了陷阱。首先,在计算多基因分数的方法中,通过统计操作分析了数百万个变量,从而为假阳性提供了巨大的机会。巨大的数据库,即使是随机生成的,也包含大量无意义的关联;此外,由于假设无效,统计显著性值将被大大夸大。
例如,在多基因评分的估计中,假设单核苷酸多态性的关联可以简单地加在一起,就像袋子里的豆子一样,并且不会影响彼此或环境。然后,正如美国国家卫生研究院提醒我们的,绝大多数单核苷酸多态性在功能上是不相关的。
更重要的是,所有现代社会都是人们不断迁徙的结果,他们的遗传背景差异在功能上是不相关的。不同的迁移波往往随机进入不同层次的层次结构,导致所谓的遗传群体分层。然而,不同社会阶层之间的学习机会也有差异,智商测试和教育的设计反映了这些差异,而不管学习能力的差异。因此,一些欺骗性的关联是不可避免的。
正如杰里米·j·伯格(jeremy j. Berg)在2018年12月的在线杂志《Biorxiv》中警告的那样,多基因分数“受到分层偏见的严重影响,因为即使是祖先之间的微小差异也会无意中转化为预测表型的巨大差异。”
这些努力的另一个缺点是,研究人员发现基因产品在使用前通常会被重新排列。这意味着不同的蛋白质(可能有不同的功能)可以从同一个基因中产生,而不是像中心法则所说的“一对一”。同样,这些重排过程的指令不是来自基因本身。
更令人惊讶的是,基因组中不到5%的基因实际上用于制造蛋白质。大多数基因被用来产生大量不同的因子(核糖核酸),而其他基因的使用是通过调节网络来调节的。
我们越来越多地发现,在高度进化的特征(如人类思维)中,从DNA突变发展到个体差异几乎没有预测。当然,基因是至关重要的,但几乎所有形式的遗传变异都是通过构建替代途径形成的。“多种选择...《生物系统》杂志2017年的一篇论文写道。
众所周知,在同一环境中长大的一群基因完全相同的个体(如纯种实验动物)在成年后不会完全相同。相反,它们会表现出身体和功能的全面变化,就像在正常的基因突变群体中发生的一样。在2013年发表在《科学》杂志上的一份报告中,朱莉娅·费鲁恩德和她的同事观察到了大脑结构发育差异的这一效应。
同样,我们现在可以理解为什么相同的遗传资源可以在不同的器官和组织中以不同的方式发挥作用。现在用于我们手臂和腿发育的基因最初出现在没有这些器官的生物体中。果蝇的性腺发育基因现在被用于人类大脑的发育。此外,大多数基因将同时用于几种不同的组织,以达到不同的目的。
在2013年发表在《生命物理学评论》杂志上的一篇论文中,詹姆斯·夏皮罗描述了细胞和生物体如何进行“自然基因工程”。换句话说,他们在一生中经常改变自己的DNA序列,改写自己的基因组。这项研究最令人震惊的含义是,基因的一般知识——作为决定生物发展及其变异的DNA链的蓝图——实际上并不存在。
因此,在2017年《遗传学杂志》的一篇评论中,遗传学家彼得·波汀和亚当·威尔金斯质疑“基本‘遗传单位’概念的应用以及基因是自主媒介的长期盲目信念。”他们指出,基因的“经典分子定义”已经过时了。
基因概念的这些根本性变化需要尽快让公众知晓,这样我们才能避免重复以前的政策错误。
上一篇:中国未发掘的五大皇陵
下一篇:旷日引月