国家基因库:揭秘中国“诺亚方舟”
■我们的记者张文静·赵广利
在深圳东南部大鹏新区的观音山脚下,矗立着一座建在山上的白色建筑。这座大楼一步一步地往上爬。从建筑的高度看,对面是一座茂密的青山,远处可以看到大海。在这平静的外表下,大楼里巨大的高通量基因测序室、超级计算室和冷冻资源室日夜运转。他们负责存储和管理我国独特的遗传资源、生物信息和基因数据。这是上个月刚刚开始运作的国家基因库。
在《圣经》的《创世纪》中,诺亚建造了一艘方舟,搭载各种动物,以避免大洪水带来的灾难,并保存生命繁衍的希望。在现实世界中,美国、欧盟和日本已经拥有世界级的基因库来掌握生命经济时代的战略资源。国家基因库的正式启动意味着中国也有一个承载生命希望的“诺亚方舟”。
比银行金库更有价值
"基因银行是真正的国债,甚至比银行国债更有价值."国家基因库主任、华大农业集团董事长兼总裁梅永红表示,拥有自己的遗传资源对中国意义重大。
梅永红解释说,在农业经济时代,拥有更多的耕地意味着优势;在工业经济时代,拥有更多的能源,如石油、天然气和其他矿产,也意味着拥有相应的优势。然而,在生命经济时代,遗传资源是国家重要的战略资源。拥有更多的遗传资源将提高中国在全球生命科学研究、生物产业发展和对外开放合作中的竞争力。
“与此同时,我们对自身健康和疾病的理解和干预,我们对生态环境和生物多样性的保护,以及我们的合作发展都需要以遗传资源为基础。因此,拥有自己的遗传资源将对我国国民健康和生物多样性资源的开发和应用的可持续发展起到非常重要的作用和意义。”国家基因库执行主任、华大基因研究所所长许逊告诉《中国科学》。
2011年1月,国家发展和改革委员会批准深圳依托华大基因研究院建立深圳国家基因库。目前,国家基因库主体工程一期工程已经完成,占地面积47500平方米。“三库两平台”是梅永红在描述基因库内容时最常用的概念。
梅永红表示,与美国、欧盟和日本的其他三家世界级基因库不同,中国的国家基因库不仅仅是一个数据库,而是现有的各种国际生物样本数据库、数据库、生物多样性数据库和疾病数据库的综合升级版。除了指多组学生信息数据库(如基因、蛋白质、分子和图像)的“干库”和指各种生物样本和物种遗传资源的“湿库”,国家基因库还引入了指生物有机体(包括动物资源、植物资源、微生物资源和海洋资源)的“活库”。
国家基因库的设备也是“豪华的”。国家基因库数字化平台配备了150个BGI seq-500测序仪和1个RevolocityTM测序仪。目前,每年的总数据输出将达到5Pb,相当于每年5万个完整基因组或1000万个产前筛查的数据输出规模。升级后的系统预计每年产生10Pb的数据,并将成为世界上最大的数据输出平台。与此同时,国家基因库开放数据中心已经建立了20Pb的数据可访问性,并计划在第二阶段完成500Pb的可访问性,超过三个主要的国际基因数据中心。
它与普通人密切相关。
基因技术似乎非常“高科技”,实际上与我们的日常生活有着密切的关系。
目前,中国每年约有1700万新生儿,出生缺陷率为5.6%,已知的遗传病约有7000种,其中包括著名的唐氏综合症。为了处理出生缺陷,国家在婚前、产前和新生儿阶段建立了三级预防系统。近年来,基因测序技术在三级预防体系中发挥了越来越重要的作用。
“例如,在结婚前,基因测序技术可用于对普通人和高危人群进行遗传病筛查,尤其是那些有家族遗传病史的人群,尤其是那些死亡率和致残率高的人群。此外,在辅助生殖领域,可通过第二代基因测序技术检测到植入前常见染色体非整倍体大片段的缺失或复制,并可筛选健康胚胎进行植入。”华大基因副总裁兼首席营销官赵表示。
基因测序技术在一些罕见疾病的诊断中也发挥着重要作用。“2014年,河南一名女婴出生后,抽血呈奶状。最后,通过基因测序技术,这个孩子被证实LPL基因有突变,最终被诊断为高胆固醇血症。”赵对说道。
“过去,人们未能集中管理这些罕见疾病的信息和样本,并将其与科研机构和科研团队组织联系起来。大型制药公司很少注意到罕见疾病。今天,国家基因库中的罕见疾病数据库可能是世界上检测到最罕见疾病的数据库。目前,我们已经发现了近3000个家庭,发现了400种以前从未报道过的罕见疾病。”许逊表示:“此外,国家基因库还将开展一系列研究志愿者活动,包括涉及多种罕见疾病的活动,呼吁大家捐献样本,吸引世界各国科学家参与罕见疾病的研究,并为寻找罕见和未知疾病的治疗和诊断方法带来希望。”
此外,基因测序技术也能在人们普遍关注的肿瘤问题中发挥重要作用。“首先,在预防方面,包括遗传性肿瘤的早期预测和早期诊断;二是在目前应用较为广泛的诊疗领域,包括肿瘤个体化的应用指导;第三是监测转移和预后。例如,好莱坞明星安吉丽娜·朱莉几年前做了一次基因测试,发现她有患乳腺癌的潜在风险。她切除了乳房。手术后,她的乳腺癌风险从87%降至5%。还有其他家族性癌症风险,也可以通过基因测序技术早期发现。”赵对说道。
在许逊看来,在国家基因库建立的十多个数据库中,癌症数据库可能是未来访问频率最高的数据库。“目前,国际癌症组织的所有数据和信息都存储在这里。将来,这个数据库将为全世界提供癌症数据,包括成千上万种不同类型的癌症数据,这对未来疾病的诊断和治疗具有重要意义”。
此外,国家基因库还将为干细胞和免疫细胞的保存提供一个公共平台,可用于个人保存和科研应用转化,相当于捐献样本。“像国家基因库这样的国家机构比商业机构更有价值。对于普通人来说,每个人都可以保存自己的样本。年轻的样品,就像老照片一样,是生命的瞬间。从疾病的预防和诊断,甚至是未来的治疗,留下来可能是有用的。”许逊说。
赵还建议,人们可以在壮年时首先将血液和组织样本储存到国家基因库中。
分享,分享,一起行动
随着国家基因库的开放,一个名为“基因组合成与编辑平台和基因组合成2020计划”的项目也已正式启动。该计划将在2020年前完成10万种噬菌体的合成,并完成世界上第一个动物基因组、世界上第一个植物基因组和人类21号染色体的合成。
"这是与中国科学院深圳先进技术研究所的合作项目."许逊说,该项目的完成可能会在疾病治疗方面产生新的希望,并在理解人类和生命本质方面产生新的质的飞跃。
同时,国家基因库还将启动两大项目——数字瑞丽植物园和大规模母婴队列研究。瑞丽植物园数字化项目将完成整个植物园50万种不同植物、5万种不同动物和100万种不同微生物的全尺寸图像数字化,这是第一个全尺寸的植物园数字化项目。它不仅有利于生态保护,还将在促进科学研究和资源利用方面发挥巨大作用。
母亲和婴儿的大人口群组研究将与该国许多省、市和地区联合发起。从母亲怀孕到孩子4岁的关键时间点,将详细存储母亲和孩子的关键遗传信息、关键生物样本和一些生理特征,并建立母婴健康队列。与此同时,将提供数据库服务,对母婴健康进行准确的医疗。
“国家对建立国家基因库的投资实际上是希望我们的遗传资源能造福于人民,并能在我们的生活和经济产业中发挥辅助作用。我们也希望更多的人使用我们的平台和资源,我们也需要国家政策和战略来支持和引导他们。”许逊说:“此外,这些生物资源的收集、开发和利用不能也不可能仅通过国家基因库来完成。它需要汇集世界各国的优势,将它们整合在一起。”
梅永红还认为,“国家基因库是一个开放的平台,基因库中的资源总是有限的。我们希望通过更好的机制,自然赋予人类的遗传资源能够得到充分的承认和利用。”
关于未来发展,许逊表示,未来国家基因库将推出更多全球合作项目,如“基因组合成2020计划”、“数字植物园”和“数字动物园”,以促进产业发展。同时,国家基因库不仅是一个国家平台,也是一个国际标准,也是整个行业未来发展的一个非常重要的基础。“国家基因库将汇集全球的力量,共享、分享和共同贡献,为物种多样性提供新的保护,为精确医学提供大数据支持,并为生命时代带来健康的生活”。
《中国科学新闻》(第一版集锦,2016年10月21日)