凭基因测长相?
一篇文章说,基因可以用来预测一个人的外貌,招致专家的批评。资料来源:莎拉·岳翎/NGC
基因测序的先驱克雷格·文特尔(Craig Venter)的一篇论文遭到了一系列批评,该论文宣布,DNA可以用来预测人的生理特征。然而,评论者,甚至是这篇文章的共同作者之一,说它夸大了利用一个人的基因识别个体特征的能力,这可能导致对基因隐私的不必要的担心。
在9月5日发表在《美国国家科学院院刊》(PNAS)上的这篇文章中,文特尔和他在加州HLI的同事测量了1061名不同年龄和种族背景的受试者的整个基因组。他们利用参与者的基因数据和他们面部的高质量三维照片,并使用人工智能方法来发现被称为单核苷酸多态性的DNA序列的微小差异,这些差异与诸如颧骨高度等面部特征相关。该团队还寻找与人的身高、体重、年龄、声音特征和肤色相关的单核苷酸多态性。
在74%的情况下,该方法能够正确识别从HLI数据库中随机选择的10个人的个体特征。根据这篇文章,这些发现表明执法机构、科学家和其他应用人类基因组的人应该小心保护基因组数据,以防止个人仅仅通过他们的DNA被识别。“HLI研究人员的核心观点是,在公开的数据库中,没有什么能真正消除个人身份和完全的隐私。”HLI在一份声明中说。
但是其他分析这篇文章的遗传学家说,在他们看来,这个观点太夸张了。“我不认为这篇文章会引发这些风险,因为它们不能证明任何基于DNA识别人的能力。”宾夕法尼亚州立大学公园的人类学家Mark Shriver说。他说,在随机选择的10人小组中,尤其是在像HLI这样的小而多样的数据集中,仅仅知道年龄、性别和种族就能排除绝大多数人。
为了证明这一点,纽约哥伦比亚大学的计算生物学家亚尼夫·埃尔里奇研究了HLI文章中的年龄、性别和种族数据。在9月份发布在预先录制好的服务器bioRxiv上的一项研究中,他计算出,仅仅知道这三个特征就足以识别HLI数据集中75%的10个人中的一个。埃尔里奇说,没有必要知道关于这些人基因组的任何信息。此外,他说,HLI的SNPs面部结构重建并不十分具体,他们倾向于将一个人的个人特征视为与任何人的性别和种族相似。
在PNAS发表之前,这篇文章被提交给了《科学》,评论者施赖弗说,他在杂志上评论了这篇文章。他说,HLI的真实数据是合理的,他对团队通过测量染色体末端来确定年龄的新方法印象深刻(这将随着时间的推移而缩短)。然而,他说这篇文章并没有证明个人特征可以像声称的那样通过DNA来识别。"我认为这完全扭曲了他们的行为和发现."他说。
HLI说,文章指出,可以根据1000多个基因组来识别一个人的特征,只需使用多个参数和一个人的面部特征。"它预测这样的预测会更加准确."HLI发言人希瑟·科瓦尔斯基说。HLI表示,它坚持自己的方法,但同时也承认样本的确很少。该公司在9月11日回复了Erlich的文章。
施赖弗说,他和埃尔里奇在科学论文评论中向研究作者表达了他们的担忧。施赖弗和埃尔里奇都表示,该杂志最终拒绝了手稿。(科学杂志没有对未发表的研究发表评论)这篇文章随后被提交给PNAS,美国国家科学、工程和医学院的一名成员像文特尔一样被要求选择一名评论者。两位评论家是信息隐私专家,另一位是生物伦理学家。
PNAS证实,文特尔为这项研究选择了所有三名评审员。HLI拒绝评论PNAS对这篇文章的评论过程。
杰森·派珀(Jason Piper)是该论文的合著者,也是目前在新加坡苹果公司工作的计算生物学家,他同意这篇文章完全不恰当地代表了他和其他合著者的发现。派珀补充说,他与该公司的合同免除了他在文章初稿提交时批准它的权利,并要求HLI提供该公司认为合适的数据。对此,HLI确认“作者有机会评论文章”。
派珀后来在推特上痛斥了这篇文章,称在他看来,HLI在鼓励限制访问DNA数据库方面存在潜在的利益冲突。作为一家盈利公司,HLI正试图建立世界上最大的人类基因组信息数据库。
“我认为基因隐私非常重要,但这里的方法是错误的。”派珀说,“人们必须分享才能从基因组中获得更多信息。”他说,一个更有用的方法是找到一种公开基因组数据的方法,但不允许识别个人。
作为对该论文批评的回应,HLI在一份声明中表示:“HLI支持保护基因组数据和加强数据交换的现代解决方案。”它补充说,这篇文章的目的是引发关于如何在保护个人隐私的同时分享基因信息的讨论。
然而,埃尔里奇仍然担心,文特尔的身份仍然让这篇文章在政策制定者眼中更有分量,让他们过于关注DNA隐私。"目前的新规则和管理体系是基于类似的条款."他说,“当我们处理隐私风险时,获得正确的事实是非常重要的。”(晋南编)
《中国科学日报》(2017-09-25,第三版国际版)
阅读更多
《自然》杂志的相关报道
下一篇:护士简笔画画法