“刷脸”窥见遗传病:深度学习算法助疾病诊断
资料来源:FDNA
这是我们的记者冯唐
去年8月的某一天,特拉华州威尔明顿市内穆尔/阿尔法·雷多·杜邦儿童医院的医学遗传学家卡伦·格里普(Karen Gripp)接待了一名年仅4岁的病人。
虽然这个小女孩比同龄的孩子略矮,并且已经掉了大部分的乳牙和几颗成年牙,但是没有其他明显的罕见疾病的迹象。
Gripp阅读了描述威斯曼-斯坦纳综合征儿童过早牙齿生长的病例报告。这种疾病是由KMT2A基因突变引起的极其罕见的疾病。但是格里普不确定。
结果,Gripp把女孩的照片上传到了一个智能手机应用程序中,软件的提示中出现了威斯曼-斯坦纳综合症。
Gripp后来通过有针对性的DNA测试证实了女孩的状况。Gripp说人工智能方法帮助她缩小了疾病的潜在范围,并节省了昂贵的多基因小组测试的费用。
最近,研究人员在《自然医学》上写了一篇文章,描述了这种诊断辅助工具的技术特征,这是一款名为Face2基因的智能手机应用。
它依靠机器学习算法和神经网络对先天性和神经发育障碍患者照片中的面部特征进行分类。使用从图片中推断出的“经验”来定位可能的诊断,并提供可能选项的列表。
该研究的负责人、马萨诸塞州波士顿市FDNA的首席技术官亚龙·古罗维奇(Yaron Gurovich)告诉《中国科学杂志》,以标准化的方式描述表型的增强为未来的研究、应用和新遗传综合征的识别打开了大门。"它展示了高级算法,如深度学习,如何应用于一个具有挑战性的领域."
看“脸”来识别疾病
目前,人工智能正在蓬勃发展,甚至可以“达到或超过人类的表现”在医疗卫生领域,人工智能已经成为医生的“小助手”。
例如,各种遗传综合征会表现出独特的面部特征。然而,综合征的数量是巨大的,要正确识别它们并不容易。使用人工智能可能有助于诊断遗传综合症。
然而,早期人工智能研究中使用的训练数据集不够大,不足以仅识别少量的综合征。face 2基因是人工智能辅助诊断的又一步。
FDNA的研究人员首先训练了一个人工智能系统来区分迪林杰综合征和天使综合征,这两种情况具有不同的面部特征,以及其他类似的情况。他们还教该模型对努南综合征的不同遗传形式进行分类。
他们在算法中输入了超过17,000张确诊病例的图像,涵盖了216种不同的综合征。所有的病人都被诊断出患有数百种遗传综合症。
研究人员使用两个独立的测试数据集测试了人工智能的性能,每个数据集包含数百张之前由临床专家分析过的患者面部图像。对于每个测试图像,each基因按一定的顺序列出了各种潜在的综合征。
在两组测试中,大约90%的病例中,cases基因的前10条建议包括正确的综合征。当看到新的人脸图像时,应用程序的最佳诊断率约为65%。
"这是医学遗传学中期待已久的突破。"格里普说:“通过这项研究,我们已经证明了在临床工作中加入自动面部分析框架,如深层格式塔,可以帮助实现早期诊断和治疗,提高生活质量。”
此外,澳大利亚和巴西的一个联合研究小组最近开发了一种基于人工智能技术的图像处理算法。通过对眼底相机拍摄的视网膜图像进行分析,可以即时自动识别糖尿病视网膜病变的关键特征,即视网膜毛细血管破裂导致的液体漏出眼球,准确率达到98%。
“击败”专家
FDNA希望不断改进Face2基因,以帮助其他公司在DNA分析过程中筛选、优先排序和解释未知基因变异。但是为了训练它,FDNA需要大量的数据。
Face2Gene目前对医疗专业人士是免费的。此外,许多医生已经开始使用该系统作为诊断罕见遗传疾病的第二选择。它也可以为不知道如何判断病人症状的医生提供一个起点。“这就像谷歌搜索。”格里普说。
随着越来越多的医疗保健专业人员将患者照片上传到应用程序,应用程序的准确性略有提高。现在它的数据库有大约150,000张图片。
去年八月,Face2基因和临床医生在出生缺陷研讨会上举行了一场非正式的“竞赛”。结果表明,该应用程序的性能优于人类。
南卡罗来纳州格林伍德遗传学中心的遗传学家查尔斯·施瓦茨分发了10名具有“相当容易辨认”的综合征特征的儿童的面部照片,并要求参与者提供正确的诊断。
在参与这项研究的49名临床遗传学家中,只有一半正确选择了两个病例。Face2Gene在七张照片中做出了正确的选择。
"我们被打败了,费斯2号赢了。"马里兰州贝塞斯达国家人类基因组研究所的临床遗传学家保罗·克鲁斯卡说:“我认为每个儿科医生和遗传学家很快都会有这样的应用,并且会像听诊器一样使用它。”。
“当前的挑战仍然在于数据。如果有越来越多的多样化数据,我们可以提供更好的结果。”古罗维奇说。
有风险
然而,算法的质量取决于其训练数据集,并且存在风险,特别是当仅影响世界上少数人的罕见疾病开始受到关注时,公司和研究人员将存储数据集并将其商业化。
医生可以把这项技术作为辅助手段,尽管它不能提供明确的诊断。然而,研究人员表示,这也引发了一些伦理和法律问题,如训练数据集的种族偏见和数据库的碎片化。这两种情况都可能限制诊断工具的使用。
英国牛津大学的计算生物学家Christoffer Nellaker说:“这威胁到这项技术的主要潜在利益。”内拉克一直在推动这一领域的数据共享。
训练数据集中的种族偏见一直是个问题。
2017年一项对智力迟钝儿童的研究发现,rate基因在比利时白人儿童中对唐氏综合症的识别率为80%,在刚果黑人儿童中只有37%。
然而,随着训练数据集的多样化,非洲人脸识别算法的准确率得到了提高,这表明更公平地代表不同的群体是可行的。
“正因为如此,我们成功地开发和培训了一种可以被视为种族平等的人工智能解决方案。我们计划继续扩展和开发人工智能解决方案,以帮助减少医疗保健中的种族差异。”古罗维奇告诉《中国科学》,“随着我们的前进,技术偏见会越来越少。”
相关文件信息:DOI:10.1038/s 1159018-0279-0
《中国科学日报》(2019-021第三版国际版)