1812年,英国眼科医生James Ware向伦敦皇家学会的成员传达了一个奇怪的发现。在征募到英军团的数千名年轻人中,只有20人因视力不佳而在20年内被拒之门外。但是,多达四分之一的同龄学生去英国牛津大学时,都依赖于手提玻璃或眼镜1。
Ware没有得出因果关系的任何结论:例如,翻阅书籍可能会导致视力下降,或者带眼镜的人自然会受到学术追求的影响。而且一样。长期以来,流行病学家对将环境暴露与健康联系起来的观察感到沮丧。近视是一个典型的例子。数十年的研究表明,在学校花费最多时间的孩子的视力最差。但是这些数据不能揭示出学校教育是否使孩子近视或近视孩子是否在学校花费更多的时间。还是其他因素(例如社会经济地位)共同驱动两者。
厌倦了这个合乎逻辑的死胡同,到本世纪初,一些流行病学家开始建议,他们的领域应该称之为一天。他们说,遗传学的进步可以做得更好。
他们是正确的。二十年来,遗传学改变了人们摆脱因果关系的方式。但是它已经引起了流行病学的发展,而不是掩盖它。事实证明,遗传差异可以作为环境暴露的代理来帮助消除分析中的混杂变量。该技术称为孟德尔随机化。
科学家使用它来重新评估观测数据,并就长期存在的因果关系问题得出新的更坚定的结论。分析证实低胆固醇水平不会引起癌症2,例如,少量饮酒不能保护心脏3,“是”上学会使孩子近视4。
原则上,“ endelian随机化”是一个非常非常酷的想法。阿姆斯特丹自由大学的社会科学遗传学家菲利普·科林格(Philipp Koellinger)说,它试图解决流行病学中最艰巨的挑战之一。
聚集势头
英国布里斯托大学的临床流行病学家George Davey Smith说:“之所以出现,是因为我们正拼命地寻找流行病学中因果关系的更好推论。”但是,他说,这也有一个缺点。“他的问题是,这变得非常简单。” / p>
他一直在敦促同事不要对孟德尔随机化感到迷惑。它是一种功能强大的工具,但必须正确使用。随着遗传数据的积累,出现了一系列孟德尔随机研究,但并没有达到这一标准。一些依赖误导性数据,而另一些则未能充分检验孟德尔随机化所依赖的假设。实地许多人说,现在该收紧事情了。
戴维·史密斯(Davey Smith)是科学家之一,他认为流行病学可能已经发展。他和他的合著者在《国际流行病学杂志》的社论中写道,当在随机对照试验中对干预措施进行测试时,有关环境暴露的可能危害或益处的观察数据将反复失败5。
该文章发表后的几年,这一重大事实清晰地体现在一项价值1亿美元的名为SELECT的试验的引人注目的失败中,该试验发现吃硒补充剂并不能预防前列腺癌-尽管流行病学如此之多有证据表明这样做会6。
戴维·史密斯(Davey Smith)说:“一切都令人沮丧,流行病学的声誉正在受到审查。”早在1986年,研究人员曾提出7遗传学可以改善这种解释。但是,随着基因组范围关联研究(GWAS)的发展,这种方法将遗传变异与特定性状联系起来,从而获得了广泛的关注。去年,戴维·史密斯(Davey Smith)求助于孟德尔随机研究,以重新探讨硒与前列腺癌之间的联系。
利用成千上万男性的基因型数据,研究人员发现了将近十二种与血液中硒水平自然升高有关的遗传变异8。从出生开始,这些人就好像在服用硒补充剂一样生活。然后,科学家们可以将具有这些变异的人与没有这些变异的对照组的前列腺癌发生率进行比较。这使研究人员可以更加专注于硒水平,并避免生活方式因素(例如健康饮食)的影响,这些因素可能会同时影响硒水平和癌症风险。而且,由于DNA中硒水平高或低的趋势已被固定,因此反向因果关系的可能性减少了分析的麻烦:早期前列腺癌可能影响硒水平的可能性。
正如SELECT试验所做的那样,分析发现硒8没有任何益处6。
数据赏金
戴维·史密斯(Davey Smith)认为,这样的结果可以决定是否启动全面的临床试验。孟德尔随机化可以检验那些进行试验是不道德或不切实际的假设。
原则上,凡发现遗传变异自然模仿环境暴露影响的地方,均可进行孟德尔随机分析。每年都会发现更多此类病毒,尤其是世界各地成千上万的人报名参加他们的基因组分析和健康追踪时。这使遗传学家具有统计能力,可以识别与酒精摄入到胆固醇水平等各种因素之间的遗传关联。
现在,流行病学家和其他人正在将这些发现提供给更多孟德尔随机检验。来自Scopus和Web of Science的数据列出,到2010年,每年就该主题发表的论文不到100篇,到2015年将增长到200篇左右。截至2019年,迄今已有500多篇论文使用或讨论了该方法。研究人员已经使用这些测试来解决许多通常与生活中许多变量混淆的问题。研究有助于更明确地表明,饮酒会增加患癌的风险9。同时,尽管有一些相反的观察结果,但低胆固醇并没有2(见“烯作为代用品”)。
作为孟德尔随机化如何提供帮助的一个典型例子,许多研究人员指出近视是一个迅速发展的公共卫生问题。不可能通过随机对照试验来检验其与学校的联系,因为故意使一些儿童辍学是不道德的。
遗传学家于2016年发布了两个独立的GWAS的数据后,2016年出现了使用孟德尔随机化的机会:一个寻找与教育程度相关的遗传特征10。另一种寻找与近视有关的基因。这项研究对成千上万的人进行了研究,发现了数十种与近视和上学时间密切相关的遗传变异。
第二年,流行病学家使用这些变量研究了大约488,000名已签署UK Biobank项目的中老年人的最大人口数据集。对志愿者的基因组进行分析,并回答许多个人细节问题,包括他们的教育程度和视力。当英国卡迪夫大学和布里斯托大学的研究人员使用孟德尔随机分析法对数据进行分析时,他们发现遗传上容易发生近视对人们在学校度过的时间没有影响。但是,那些携带与受教育程度相关的基因的人,其近视的可能性要高得多。
领导该项目的布里斯托尔市眼科医生Denize Atan说,无论是通过阅读时间,较低的自然光强度还是其他因素,在学校花费的时间都会明显影响视力。她说,这种联系是如此紧密,以至于政策制定者和学校应该做更多的工作来解决这个问题。
公开的秘密
评论家认为,问题在于,并非所有孟德尔随机研究都健全。阿坦说:“在开始之前,你需要有一个强有力的假设和一些支持证据。”她说,越来越多的人没有。“恩格ou认为,“他们是从哪里得到这个想法的?”这似乎是出乎意料的。她补充说,这是一个大问题,因为孟德尔随机化允许研究人员寻找,寻找和发现在不熟悉相关领域的任何专业知识的情况下,发布不熟悉的数据集之间的关系。
正如荷兰鹿特丹伊拉斯姆斯大学医学中心的流行病学家Sonja Swanson所说:只需按一下按钮,并说“对我的问题提供数字答案”就不会花太多时间?? / p>
几位流行病学家说,许多已发表的孟德尔随机研究存在问题,这是一个公开的秘密。戴维·史密斯说:“渊源可以很容易地发表论文。”“一些非常差的论文来自不了解流行病学原理的研究人员。” 2016年,孟德尔随机研究声称发现血液中高水平的C反应蛋白(一种与炎症相关的肝酶)引起了精神分裂症。它表明能够降低血液中酶水平的药物可能有助于治疗患有这种疾病的人。Davey Smith组和另一组进行了类似的分析,发现实际上C反应蛋白对精神分裂症具有保护作用13。戴维·史密斯(Davey Smith)和他的合著者建议,最初的小组如何结合遗传数据集存在问题,最终2016年的论文被撤回。
流行病学家还批评了孟德尔的随机分析14,该分析声称已发现怀孕期间吸烟会导致婴儿出生体重急剧下降15,并大大增加后代发生口面部裂口的风险16。
他们说,问题在于,在所谓的候选基因研究中确定了用作吸烟行为代理的遗传变异,研究人员在研究中评估了他们怀疑与吸烟等行为有关的一些基因。这些研究的结果可能不可靠,因为它们倾向于在被检查的基因中发现某些影响。作者在孟德尔随机中使用的变体尚未出现在更大,更全面的GWAS中。
领导吸烟项目的爱荷华市爱荷华大学健康政策研究员乔治·韦比说,这项工作是在获得更好的数据之前完成的。他说,“泪水同意,这些将不是首选。”他说,“基于对来自大型GWAS的吸烟遗传学的最新知识。”
违反常识
对于经济学家来说,孟德尔随机化看起来很像工具变量分析,其中使用称为工具的变量来帮助消除其他两个观察值之间的隐藏关系。“当我们看到流行病学家正在使用基因作为工具变量时,我们都被吸引了,并说:“等一下!”科林格说。此类分析基于需要仔细检查的假设。
孟德尔随机化的一个主要假设是,遗传变异不得以任何其他方式影响结果。例如,存在编码破坏乙醇代谢的醛脱氢酶(ALDH2)的基因变异。当人们喝这种变态的饮料时,他们往往会感到恶心,因此与较低的酒精消费量有关。举例来说,饮酒是否会使血压升高,这似乎是一种可行的测试方法,因为携带该变体的人喝的酒通常比不饮酒的人少。
问题在于ALDH2还影响某人吸烟的可能性17,这独立地影响血压。这种称为遗传多效性的现象可能会使孟德尔随机化结果无效。这就产生了一个问题,因为对许多基因而言,多效性的程度是无法完全实现的。
另一个假设是给定的遗传变异具有很强的作用。随着更大更强大的GWAS疏通了与不同性状之间较弱的遗传联系,这一假设变得越来越难以检验。
2015年,荷兰的流行病学专家对178项孟德尔随机研究进行了审查,结果发现只有不足一半的人充分讨论了这些假设18。研究人员认为,“这些假设对于孟德尔随机研究的有效性至关重要,应始终在研究的特定背景下对它们进行讨论。”
孟德尔随机化还受制于一个独特的偏见来源-一个关于生与死的问题。人只能死一次。例如,此问题会使中风死亡的分析复杂化。这种死亡往往发生在老年人中,因此对中风的研究通常会招募那些已经幸存下来并影响年轻人的疾病(例如心脏病)的人。由于中风和心脏病是常见的原因,例如高胆固醇(因此也包括他汀类药物在内的常见疗法),因此这种幸存者偏见可能会产生一些误导性的结果。
为了证明这种偏见的影响,纽约城市大学的公共卫生流行病学家Mary Schooling进行了孟德尔随机测试,其中与降低胆固醇有关的基因变异可用于他汀类药物。具有这种有益遗传的人在生命早期很少心脏病发作,并且生活在中风风险增加的年龄。因此,研究得出结论,降胆固醇他汀类药物实际上会引起中风19。
学校说:“这没有任何意义。”适当的随机对照试验不会以这种方式混淆:它们显示他汀类药物可预防中风。但是孟德尔随机化显示必须识别和纠正的幸存者偏见。
应对偏见
戴维·史密斯(Davey Smith)说:“每一种方法都有偏见。”他说,孟德尔随机化并不是要取代随机对照试验,而是与其他来源(包括观察性研究)一起,可以增加可用的证据来帮助做出明智的决定。现在,研究人员正在寻找改善方法。
一种方法是识别和纠正某些偏差,并应用统计工具来测试假设的强度。戴维·史密斯(Davey Smith)指出可以帮助研究人员评估孟德尔随机研究质量的论文20。
更好地组织数据也可以提供帮助。无偏分析假设基因是随机分布的,但已知某些基因在地理区域内聚集21。基因型数据集已经可以通过大家庭进行分组,并且孟德尔对这些数据进行的随机研究正在确定,例如,身高和体重指数可能不会像以前的研究所建议的那样影响教育程度22。
通过比较家庭内部研究和基于人群的研究结果,遗传学家可以帮助区分自然和养育在给定性状中的作用。关节基因与局部环境的特定特征相关。而且,如果您想使用基因进行因果推论,则需要打破这种联系,科林格说。
如果研究人员想利用不断增长的遗传信息来获取公共卫生和政策建议,这种准确性非常重要。但是,即使这些工具也需要改进和补充。
用遗传学的角度解释了200年前对学生和士兵视力的商品观察,当时尚无人能想到。具有讽刺意味的是,英国军队又花了一个世纪才接纳需要戴眼镜的新兵,并改变其认为适当的视野标准。即使在第一次世界大战期间,一些当局也认为,只要英国士兵能够“朝着正确的方向射击”,他是否可以清楚地看到他在向他开枪射击是什么都没有关系23。
流行病学的统计工具正在改进。尽管孟德尔随机方法并不总是能提供完美的清晰度,但它至少可以为研究人员指明正确的方向。
大自然576,196-199(2019)