首页 » 国外科研 >

当相关性确实意味着因果时,新的AI可以可靠地点击

2021-09-30 15:50:06来源:

这是一个说明性图,其展示了人工智能如何解决与相关性建立因果关系的示例。

AI可以合并重叠和不完整的医疗数据集,然后确定哪些变量是致命的,为旧数据提供新的可能性;巴比伦的科学家们展示了AI对来自肿瘤和蛋白质结构的数据的潜力。

一项新的人工智能(AI)首次允许AI研究人员展示在相关性意味着因果关系时筛选通过将数据的群众筛选到斑点的有用和可靠的方法。通过融合旧的,重叠和不完整的数据集这一新方法,由量子加密,铺平了研究人员,为研究人员收集了医学试验结果,否则将过于昂贵,困难或不道德的跑步。该研究在纽约的人工智能(AAAI)会议上的着名和同行评审协会。

巴比伦首席科学官Saurabh Johri博士说:“到目前为止,我们一直有限于从研究所需的研究中拼凑答案,该研究确切地捕获所有数据。但是,当我们在一项研究中看到肥胖和低维生素D之间的相关性,并且在另一个研究中的肥胖和心力衰竭之间,我们还没有说维生素D是否在心力衰竭中具有因果作用而不进行另一种,非常昂贵的临床审判。现在我们可以把拼图的碎片放在一起。“

巴比伦的高级研究科学家Ciarán·李博士和伦敦大学学院学院荣誉高级研究助理解释了“科学家们已经敲入了他们的相关性并不意味着因果关系;尽管夏天,冰淇淋销售不会导致晒伤率。找到晒伤的确切原因我们削弱或控制尽可能多的变量。然后,当我们的数据集显示太阳曝光的变化与晒伤的变化相匹配,我们可以自信太阳暴露是致病变量。问题是现实世界很少整齐,整洁,它真的很难控制所有变量和造成的变量。“

科学家们开始寻找其他方法来帮助现场致病变量。物理学出生的理论表明,随着时间的推移,一切都变得更加混乱和复杂,所以原因应该不那么无序,并且复杂于其效果。李博士说:如果你拍你的数据集并将每个变量给出复杂的评级,您可以向后和现场工作,其中一个是原因。但那只是帮助那个数据集 - 我们想看看是否有一种方法可以结合数据集,那些具有差距的方式,或者研究人员对现在对他们感兴趣的不同问题。这可能是一个游戏变换器。“

Lee博士的灵感来自量子密码学。量子物理学的奇怪规律意味着两个用户可以发送消息,然后使用数学公式来证明其他人是否窃听他们的谈话。李博士意识到数据集可以以类似的方式工作,但是思考来自另一个数据集的潜在致命变量作为窃听者。“如果一个数据集向我们展示肥胖导致心脏病,并且另一个显示维生素D导致肥胖,我们可以使用数学公式来证明维生素D是否导致肥胖。这就是我们的AI正在做的事情。“

“我们将多个相关变量与不完整的医疗数据集组合并显示出高度信心,相关性意味着因果关系”李博士。“我真的很兴奋,这个AI可以做到。这显然不是一个魔杖,它会给我们所有的答案,但有很多关于缺失数据的研究,研究人员希望他们已经测试了其他东西,并且可以将其与其他人所做的研究结合起来,或者已经想到了以不同的方式询问他们的问题。现在他们可以。无论是癌症药物的有效性,他汀类药物或抗抑郁药,杀虫剂或空气污染的影响,AI都应该能够应对这一切。“

研究人员在乳腺癌和蛋白质信号传导数据集上测试了AI,以及用于特别复杂的合成数据集。在每种情况下,AI发现了致病变量。在一种情况下,它评估了两种单独的乳腺肿瘤数据集,一个测量乳腺肿瘤的周长以及其它纹理,并正确报道既不引起其他肿瘤,而是肿瘤是否恶性或良性引起。类似地,AI还确定了两种蛋白质系列之间的信令结构,即使在每个数据集中的许多蛋白质中缺少关节数据。

该研究中使用的算法可在纸上和开放式接入站点Arxiv上提供,以便全球科学家可以使用它来重新评估重叠和不完整的数据集。测试的数据集是所有开放式访问,以便其他科学家可以验证该研究。