机器学习可预测基因组修复结果
科普小知识2021-09-04 11:57:37
...
英国杂志《自然》8日在网上发表了一项关于人工智能和生物技术的研究:科学家们报道了一种通过机器学习来实现致病基因变异的精确和可预测编辑的方法。这项成就为研究遗传疾病和开发潜在疗法提供了新的可能性。
尽管CRISPR-Cas9完全改变了用于研究的基因组编辑技术,但目前人们认为确保这项技术的准确性尤为重要。
CRISPR-Cas9基因组编辑通常使用DNA“模板”来确保DNA修复的准确性,或将特定的DNA序列引入基因组。因此,缺乏这些模板的DNA修复通常被认为是不准确的。
现在,美国布里格姆妇女医院和哈佛医学院的科学家理查德·舒尔·伍德和他的同事们发明了一种通过机器学习来预测基因组修复结果的方法,这种方法实现了精确的无模板Cas9编辑。该研究小组训练了一个名为inDelphi的机器学习模型,其数据库包含近2000对Cas9导向核糖核酸(gRNA)和人类脱氧核糖核酸目标。
根据模型鉴定,5%-11%的Cas9导向核糖核酸靶向人类基因组能产生单一的和可预测的修复结果,在50%以上(称为“精确度-50”)。InDelphi还可以使用无模板的Cas9编辑来识别和预测合适的致病基因突变目标,包括以前认为无法通过该方法找到的一些目标。
最后,研究小组通过实验证明,人类细胞中与三种疾病相关的近200种致病变异的编辑和修复准确性:赫尔曼斯基-普鲁士综合征(HPS,白化病综合征之一)、门克斯病(也称为头发灰质营养不良)和家族性高胆固醇血症可达到精确度-50的标准。
研究人员说,这一结果建立了一种方法,以实现准确和无模板的基因组编辑。