深度学习算法通过分析人脸照片,帮助医生和研究人员查明一系列罕见的遗传疾病。
在1月7日发表于《自然医学》上的论文1中,研究人员描述了诊断辅助工具背后的技术,即名为Face2Gene的智能手机应用程序。它依靠机器学习算法和类似于大脑的神经网络对先天性和神经发育障碍患者的照片中的独特面部特征进行分类。使用从图片中推断出的模式,模型可以进行可能的诊断并提供可能选项的列表。
尽管该技术并非旨在提供明确的诊断,但医生一直在使用该技术作为辅助工具。研究人员说,但这确实引起了许多道德和法律方面的关注。这些包括培训数据集中的种族偏见和数据库的商业分散,这两者都可能限制诊断工具的覆盖范围。
位于马萨诸塞州波士顿的数字健康公司FDNA的研究人员首先训练了人工智能(AI)系统,以将Cornelia de Lange综合征和Angelman综合征(具有明显面部特征的两种疾病)与其他类似疾病区分开。他们还教授了该模型,以对称为Noonan综合征的第三种疾病的不同遗传形式进行分类。
然后,由FDNA首席技术官Yaron Gurovich领导的研究人员为该算法提供了跨越216种不同综合症的诊断病例的17,000幅图像。当呈现人脸的新图像时,该应用程序的最佳诊断猜测在大约65%的情况下是正确的。而且,在考虑多个预测时,Face2Gene的前十名清单中大约90%的时间包含正确的诊断。
缩小领域
最终,FDNA希望开发这项技术,以帮助其他公司在DNA分析过程中过滤,区分优先级和解释意义不明的遗传变异。但是要训练其模型,FDNA需要数据。
研究合著者Nemours / Alfred I的医学遗传学家Karen Gripp说,因此Face2Gene应用程序目前可供医疗保健专业人员免费使用,其中许多人将系统用作诊断罕见的遗传疾病的第二种意见。特拉华州威尔明顿市杜邦儿童医院。在医生不知道如何处理患者症状时,它也可以提供一个起点。格里普说:“这就像Google搜索一样。”
也是FDNA首席医疗官的Gripp使用该算法帮助诊断去年8月接受治疗的年轻女孩的Wiedemann'teiner综合征。尽管这个年龄有点矮,但这个四岁的男孩并没有很多与众不同的综合症,除了她失去了大部分的乳牙并且已经有几颗成年的牙齿。
格里普(Gripp)阅读过一些病例报告,描述了Wiedemann'teiner综合征患儿的牙齿过早生长,这是一种极为罕见的疾病,由一种称为KMT2A的基因突变引起。为了增强对诊断的信心,Gripp将她年轻患者的照片上传到Face2Gene。Wiedemann'teiner综合征出现在该软件的热门歌曲中。
随后,格里普(Gripp)通过针对性的DNA测试证实了该女孩的诊断。但是她说,人工智能方法帮助她缩小了可能性,并节省了更昂贵的多基因面板测试的成本。
“装满”?/ h2>
Gurovich说,随着越来越多的医疗保健专业人员将患者照片上传到该应用程序,该程序的准确性有所提高。现在其数据库中大约有150,000张图像。
去年8月,在Face2Gene与临床医生之间关于先天缺陷的研讨会上进行的非正式比较中,该程序的表现优于人们。南卡罗来纳州格林伍德格林伍德遗传中心的遗传学家查尔斯·施瓦兹分发了10名患有“可识别的”综合征的儿童的面部照片,并要求与会人员做出正确的诊断。
在49位参与临床遗传学家中,只有两次超过50%的人选择了正确的综合症。Face2Gene正确调用了其中的七张图片。
马里兰州贝塞斯达市美国国家人类基因组研究所的临床遗传学家保罗·克鲁斯卡(Paul Kruszka)说:“惨败失败,而Face2Gene杀死了它。”他说,很快,“难道每个儿科医生和遗传学家都会有这样的应用程序,并且会像听诊器一样使用它吗?”
筒仓和偏见
但是该算法仅与其训练数据集一样好,并且存在风险,尤其是在仅影响全球少数人的罕见疾病方面,公司和研究人员将开始孤立和商品化他们的数据集。英国牛津大学的计算生物学家Christoffer Nell氓ker说,“威胁了这项技术的主要潜在优势。”他率先致力于促进这一领域的数据共享。
而且在训练数据集中主要包含白人面孔的种族偏见仍然令人担忧。一项2017年对智障儿童的研究2发现,尽管Face2Gene在比利时白人儿童中对唐氏综合症的识别率为80%,但在刚果黑人儿童中仅为37%。但是,通过使用更加多样化的训练数据集,非洲人脸的算法准确性得到了提高,这表明可以更公平地代表各种人群。
古罗维奇说:“我们知道这个问题需要解决。随着我们的前进,我们将有越来越少的偏见。”