欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 自然科普

著名生物学家文特尔最新研究遭质疑

科普小知识2022-04-16 08:05:33
...

人类的外貌是否可以根据基因组来预测已经在行业专家中引起了激烈的争论。来源:自然网站

克雷格·文特尔是美国有影响力的生物学家。虽然他没有从一所所谓的名牌大学毕业,但他的每一个研究行动都会给这个行业带来飓风般的影响。例如,他曾经成立了一家公司,公开挑战30亿美元的人类基因组计划,声称他将使用3.3亿美元提前发布人类基因组地图,迫使人类基因组计划提前两年完成。他的研究小组在实验室创造了第一个人造生命。

最近,由文特尔创建的一家公司宣布,他们的新研究认为,DNA数据将通过匿名个人的外貌和身体特征揭示他们的真实身份,这再次引起了其他科学家的怀疑和批评。

根据《自然》杂志网站上最近的一篇报道,他创办的人类长寿公司(HLI)的科研团队在《美国科学院学报》上发表了一篇论文,建议立法机构、科学家和其他相关人员加强对人类基因组数据的监管,防止个人隐私因DNA数据泄露而暴露。

然而,来自宾夕法尼亚大学和哥伦比亚大学等机构的知名科学家质疑,温特团队的研究夸大了基因识别人的能力,并在社会上引发了关于基因隐私的不必要的恐慌。更多参与研究的内部人士表示,文特尔的举动有私人目的。他可能正在利用他的影响力来改变公众获取基因数据的现状,并利用他的基因数据库来寻求利益。

研究结论还是夸大了

文特尔的团队发表了一篇论文,称他们对1061名不同年龄和种族背景的志愿者进行了全基因组测序。他们开发的人工智能软件结合参与者面部的高清晰度3D照片,可以根据DNA序列的单核苷酸多态性(SNPs)识别面部特征,如颧骨高度,并发现一个人的SNPs隐含着个性化特征,如身高、体重、年龄、口音和肤色。结果表明,使用他们的方法和HLI的DNA数据库,从10个随机选择的个体中识别一个人的准确率高达74%。

在仔细研究了文特尔团队的论文后,许多遗传学家怀疑这项研究的结论是在夸大事实。宾夕法尼亚大学的人类学家马克·施赖弗认为,这篇论文并不能证明仅凭DNA数据就能准确识别一个人的隐私。因此,本文介绍的风险并不存在。此外,10个人可以*选择这样小尺寸的样品。这些人完全可以通过年龄、性别和种族数据来区分,而且根本不需要DNA数据。

为了进行有力的反驳,哥伦比亚大学计算机生物学家亚尼夫·埃里希对论文中再次提到的年龄、性别和种族数据进行了模拟研究,并将研究结果发布在预先打印的网站BioRxiv上。在不知道这些人的任何基因组信息的情况下,仅仅依靠这三个特征就足以区分一个人和10个人,准确率为75%。他还得出结论,HLI利用单核苷酸多态性数据重建的面部特征不能准确地指向某个人,但只能接近具有性别和种族等特征的某些类型的人。

科学杂志曾经拒绝发表论文

施赖弗说,在论文发表在《美国科学院学报》之前,文特尔的团队已经将论文提交给了《科学》,他正在参与论文的同行评审。当时,陪审团认为,尽管HLI的研究数据是真实可靠的,而且在研究中通过对染色体两端测序推断测试者年龄的新方法令人印象深刻,但该论文并没有像声称的那样通过DNA数据准确识别个人信息,研究结论往往被有意歪曲。

尽管该论文的作者包括重量级人物如文特尔,但《科学》最终拒绝发表该论文。根据规定,作为美国科学院的院士,文特尔有权选择三名科学家对他的论文进行同行评议,并在《美国科学院学报》上发表。《美国科学院杂志》承认,温特自己选择了两位信息隐私专家和一位生物伦理学家,这篇论文得到了审查和批准。

HLI拒绝对该论文的审查过程发表评论,但在一份声明中表示,尽管该研究的样本量太小,但研究方法没有问题。基于大约1000名参与者的基因组数据库,完全有可能准确地识别一个人,并且这种识别将更加准确。

强调基因组隐私或出于经济目的

该论文的作者之一、目前在苹果工作的计算机生物学家杰森·派珀(Jason Piper)承认,该论文歪曲了HLI和其他同事的研究结果,因为他与HLI签署了一份同意书,放弃了在论文发表前签署协议的权利,从而允许HLI根据公司的意愿提交实验数据。

派珀通过推特严厉批评了该报,认为HLI有兴趣这么做。由于现行制度规定,所有用于研究的基因数据必须公开,HLI作为一家盈利公司,希望建立世界上最大的人类基因信息数据库,并以保护个人隐私为借口,游说决策部门对基因数据库设置各种限制,并利用这些数据作为公司赚钱的工具。“保护基因隐私非常重要,但为了了解更多的基因组信息,人们必须共享所有相关数据。为这种分享设置障碍恰恰相反。”佩珀说。

尽管HLI一再声称保护基因组信息的目的是为了促进数据交换的安全性,但埃里希认为,以文特尔的立场,这篇论文肯定会吸引更多决策者的注意,在决策中参考这类研究论文,并制定一个全新的管理系统来防止人们在研究*享基因组数据。