探秘国家基因库:在这里读懂“生命天书”
新华社深圳7月13日电(记者陈宇轩)灭绝的猛犸象能复活吗?利用在永久冻土中发现的完整的猛犸象个体,通过基因技术和干细胞技术获得猛犸象胚胎细胞,然后为这些细胞找到合适的“*母亲”。也许有一天人们可以看到这个曾经生活在地球上的怪物。
过去,生物的遗传信息看起来像一本深奥的“生命之书”。现在,人们可以“读”甚至“写”它。2011年,国家发展和改革委员会、财政部、工业和信息化部以及国家卫生计生委批准深圳大鹏半岛华大基因研究所建立国家基因库。如今,生物储存、基因测序、基因合成和编辑已经成为这个世界级基因库的核心业务单元。
深圳华大基因研究所副所长刘欣表示,国家基因库有“三库两平台”。“三大数据库”是指以存储为主要功能的生物资源样本数据库、生物信息数据库和生物活体数据库。“两个平台”是分别从事“阅读”和“写作”基因的数字平台、合成和编辑平台。
“创造始于理解,首先是阅读,然后是写作。这要求我们有意识地储存大量生物信息,这是后续基因测序和编辑的基础。”刘欣欣。
记者在国家基因库现场看到,“三库”收集了地球上各种生物的信息。生物资源样本库中存储的样本包括血液、组织、血液采集卡、细胞、体液、脱氧核糖核酸、核糖核酸、动物、植物、真菌和微生物等。现在已经储存了2000万个可追踪的全类型样本。生物信息数据库是一个存储基因信息的高性能数据管理系统。已经建立了40多个数据库。在此基础上开发的搜索引擎已经收集了8000多个物种/品种、27个物种、1000万个基因、5亿个序列数据和3亿个突变信息。生物文库可储存60,000个种子样本资源。目前,云南瑞丽植物园、广东河源生活示范银行、青藏高原银行、青海高原生活示范银行等数字化项目正在建设中。
这些海量信息的影响是什么?刘欣说,在今后需要解释的时候,可以迅速找到尽可能多的各种类型的样品,如珍稀动植物和重要的疾病样品。同时,这些数据也为科学研究和产业发展提供了大数据的来源保障,有利于精准医学和精准农业的发展。
基因测序是国家基因库的另一个重要功能。记者在数字平台“阅读”平台上看到,研究人员首先准备好DNA,按照测序要求将提取的DNA上传到芯片上,然后将芯片放入测序仪中读取基因的原始数据。
国产设备实现了基因测序的高速低成本。来自数字平台的研究人员表示,用于基因测序的仪器是“国货”,其测序精度已达到行业领先水平。同时,它的突出优点是操作简单,24小时快速测序,超过16种使用模式,价格比同类测序仪低三分之一。
“这是一个集成自动化、标准化、高产率和高效率的公共测序平台。目前,每年的数据输出超过5 PB,这意味着它可以满足5万人的个体基因组测序或1000万例产前筛查的需要。”刘欣欣。
如果基因测序被视为“阅读”人类生活的密码,那么合成和编辑平台的工作就是“写作”。今年3月,国家基因库的研究人员参与了一个国际合作项目,成功合成了5条酵母染色体。研究结果发表在著名的学术期刊《科学》上,这是合成生命领域的一项重大科学进步。
据国家基因库综合与编辑平台核心研发高级经理顾瑛介绍,这个“写”平台是对“读”基因信息进行“重写”和“重写”,从而产生一些新功能,广泛应用于医学诊断和治疗、动植物育种等领域。
“未来,我们将进一步扩大规模,收集更多资源,将国家基因库建设成为全球有影响力的科研共享平台,更好地保护和利用生物资源。”刘欣欣。
上一篇:我国首个国家基因库启动运行
下一篇:孩子是如何学习说话的?