首页 » 医学前沿 >

席卷基因组研究的预测医学方法

2020-02-11 13:04:51来源:

塞卡·卡特里森(Sekar Kathiresan)看了660万个点,可以计算出一个人罹患冠心病的风险。Kathiresan发现,在这些特定地点,人与人之间的单个DNA字母差异的组合可以帮助预测某人是否会屈服于全球主要死亡原因之一。谁能猜到大多数As,C,Ts和Gs在做什么。尽管如此,凯西里森(Kathiresan)说,“基于您从出生起就已经确定的某些东西,“测ou可以将人们分为清晰的心脏病发作轨迹”?

波士顿马萨诸塞州总医院的遗传学家凯瑟里森(Kathiresan)独自一人统计出异常多的变种。他开发的多基因风险评分是寻找常见疾病遗传因素的前沿方法的一部分。在过去的二十年中,研究人员一直在努力解释心脏病,糖尿病和精神分裂症等疾病的遗传性。多基因评分将基因组上数十到数百万个斑点的“有时是微小的”微小贡献加在一起,从而创建了一些迄今为止最强大的遗传诊断方法。

由于大量资源丰富的队列研究和大数据存储库,例如UK Biobank(请参阅第194、203和210页),该方法取得了成功,该库收集了大量健康信息以及数十万个DNA的数据人。过去一年左右发表的一些研究通过结合来自此类来源的信息,能够分析超过一百万名参与者,从而提高了科学家发现微小影响的能力。

支持者说,多基因评分可能是基因组医学的下一个重大进步,但是这种方法引起了很大的争议。一些研究提出了关于如何使用分数的道德难题:例如,在预测学习成绩时。评论家还担心人们将如何解释测试中出现的复杂的,有时是模棱两可的信息。而且由于领先的生物库缺乏种族和地理多样性,因此当前的遗传筛选工具可能只对数据库中代表的人群具有预测能力。

英国牛津大学的遗传学家马克·麦卡锡(Mark McCarthy)说:“大多数人都希望对此进行一场体面的辩论,因为这引发了各种各样的后勤,社会和道德问题。”即便如此,多基因评分正赶上诊所,并且已经由至少一家美国公司提供给消费者。

澳大利亚昆士兰大学的遗传学家彼得·维舍尔(Peter Visscher)率先提出了成为趋势基础的方法,他对该方法大致持乐观态度,但仍对进展速度感到惊讶。他说:“绝对相信这将比我们想象的要早。”

风险计算

当研究人员在2000年代初完成人类基因组的初稿时,许多人期望这将标志着医学革命的开始。遗传学家开始寻找差异,这些差异可能解释了为什么一个人患上糖尿病或心脏病,而另一个人却没有。这个想法很简单:将一群有条件的人与没有这个条件的人进行比较,寻找他们的DNA差异。变异通常以DNA字母交换的形式出现,称为单核苷酸多态性,即SNP。如果患有某种疾病的人倾向于在某个位置患上T,而其他人则患有C,则表明SNP在某种程度上与疾病有关。

这些众所周知的全基因组关联研究或GWAS变得非常流行。但是经过多年的搜索,科学家仍然只能解释一小部分常见疾病的遗传风险。加利福尼亚州拉霍亚斯克里普斯研究所的遗传学家阿里·托卡玛尼说,事实证明,这些情况中的大多数与SNP的关联要比科学家最初预期的多得多。

更糟糕的是,大多数变体带来的风险很小-“只有在对庞大的人群进行调查时才能检测到。” Ewan说,样本量没有真正推动预测的能力,有些人还天真地认为。 Birney,英国欣克斯顿欧洲生物信息学研究所所长。到2007年,遗传学家开始为他们所谓的“ a href =“ https://www.nature.com/news/2008/081105/full/456018a.html” data-track =“ click” data-label =“ https://www.nature.com/news/2008/081105/full/456018a.html“ data-track-category =”正文文本链接“>缺少遗传性”?很明显,这些条件中的许多具有遗传成分,但是GWAS显然没有抓住其中的大部分。

今天,情况正在发生变化。Kathiresan说,通过访问海量数据集以及数据分析方法的进步,科学家在测量那些很小的风险方面变得越来越好。

一个典型的例子是Kathiresan用来产生他的660万SNP分数的技术,该技术于8月1日发布。他和他的团队从2015年的荟萃分析中收集了48个GWAS,包括61,000名患有冠状动脉疾病的人和120,000名对照者2。然后,他们在英国生物库中的290,000人身上测试了多基因预测因子,发现得分最高的几个百分数平均比其他人群高出几倍(参见“多基因预测”)。工具。例如,在获得最高分的23,000人中,有7%患有冠状动脉疾病,而其余人口则为2.7%。该小组对包括炎症性肠病和乳腺癌在内的其他四种疾病进行了类似的分析,每次都鉴定出得分最高的百分位数且处于特别高风险中的一组。

该论文在理论上可以在临床上使用多基因风险评分,从而引起了一些研究人员的赞誉。Kathiresan说,分数能够识别高风险人群的能力与现有的医学风险度量方法相似。“基本上,您拥有的是冠状动脉疾病的新危险因素。”

由于风险评分中包含大量变体,Kathiresan的工作成为头条新闻并引发了一些争议。马里兰州巴尔的摩市约翰霍普金斯大学彭博公共卫生学院的生物统计学家Nilanjan Chatterjee说,这660万个SNP中只有一小部分确实对预测做出了贡献。这是因为这些分数的计算方式:所有变体的数据都被塞进算法中,该算法根据与疾病的关联程度为每个变体分配权重,而实际上大多数构成很少或可忽略不计风险。

包括查特吉(Chatterjee)在内的许多研究人员说,包括许多影响最小的变体并不重要。但是其他人担心,包括数百万不做任何事情的变体会破坏公众对分数的信任。佐治亚州亚特兰大市埃默里大学的流行病学家塞西尔·简森斯说,她对这项研究没有印象。她担心的一个问题是,与仅74个与疾病联系最紧密的SNP所获得的分数相比,用于计算最终分数的数百万个变体并没有大大提高性能。她说,如果要在临床上使用这些评分,“评分的可信度也很重要。”

行动方针

Kathiresan的研究主要关注遗传风险,而其他研究则在研究多基因评分如何补充现有的风险度量。2013年,赫尔辛基大学的统计遗传学家Samuli Ripatti发现,将多基因风险评分与冠心病的常规危险因素(例如高体重指数和血压升高)相结合,可以更好地预测谁会患上疾病3。他还能够识别出一组具有较高遗传风险评分的人,否则这些人只会被视为处于中等风险,而里帕蒂说,这种挑选雷达下飞行人员的能力是多基因风险的最大好处。分数。

遗传风险评分还可以改善对乳腺癌等疾病的筛查方案。在美国,目前建议女性从50岁开始接受乳房X线照片,但是如果可以识别出年轻的高危女性,他们可能会从早期筛查中受益。2016年,Chatterjee开发了一种乳腺癌模型,该模型融合了常规危险因素和从约90个SNPs计算得出的多基因评分4。根据这些评分,他预测40岁的女性中有16%的风险与50岁的平均年龄相等,这表明她们可以从40岁开始的筛查中受益。该团队现在正在其他数据集中使用大量SNP测试其模型,以查看预测是否成立。

同时,位于犹他州盐湖城的个性化药物公司Myriad Genetics已经开始在向某些女性提供的结果中纳入乳腺癌多基因风险评分。只有大约10%的具有乳腺癌家族病史的女性患有与该疾病相关的有害单基因突变之一,因此该公司现在将得分返回到剩余的90%,以表明她们患乳腺癌的可能性多基因风险与历史和生活方式等因素的综合作用。Myriad首席科学官杰里·兰伯里(Jerry Lanchbury)说,这些成绩的优势之一就是可以为每个人提供结果。尽管当前的重点是确定高危女性,但将来他可能会看到这些分数被用于发现那些风险低于平均水平的女性,这些女性可能会从较少的乳房X线照片中受益。兰伯里说:“开始进入一个可以为每个人提供精确医学结果的世界。”

全部统计

关于多基因得分的一种抱怨是,他们抛弃了生物学而倾向于统计学。单靠多基因评分将为药物开发提供很多见识,但是这些研究可以为深入研究单个变体,确定它们影响哪些基因以及可能导致疾病的机制提供一个起点。

这种洞察力的一部分将来自于弄清哪些变体实际上会产生给定的性状或疾病,以及哪些会顺其自然。与疾病有关的SNP一定是其病因:可能仅仅是该变异体倾向于与直接参与的基因组另一部分一起遗传。例如,Kathiresan估计他的660万个SNP中只有大约6,000个与冠心病有因果关系。McCarthy说,随着样本数量的增加,将这些变体分开变得更加容易。

当前的研究仍可以解释遗传风险中的很大一部分。里帕蒂(Ripatti)估计,许多常见疾病的30%-0%是遗传性疾病-其余大部分是由环境因素决定的。但是遗留遗传力的问题仍然存在:根据经验,GWAS可以占遗传病风险的大约三分之一到三分之二。Torkamani说,随着样本量的增加,研究人员可能会发现更多导致风险的变异体,尽管收益有所减少。他说:“从某种意义上讲,您将只是停止从其他遗传风险因素中获得太多实用性。”Visscher补充说,全基因组测序也可能吸收更多的遗传风险。当前,GWAS研究主要是使用仅对基因组的一部分进行测序的阵列进行的,但是随着全基因组测序变得更便宜,更广泛,导致疾病的罕见变异也可能更容易找到。

从实验室到诊所

Kathiresan说,他希望明年在市场上获得冠状动脉疾病评分。但是大多数研究人员承认,要广泛使用这些分数,还需要克服一些障碍。麦卡锡说,第一大障碍是将其应用于不同的人群。风险评分是在主要由具有欧洲血统的人(例如英国生物银行)组成的数据集中生成和验证的,从而限制了其可应用于其他族裔人群的程度。例如,无数分数目前仅适用于具有欧洲背景的个人,尽管兰奇伯里(Lanchbury)表示该公司正在为非洲裔美国女性制定类似的分数。麦卡锡说,最终目的是产生针对种族的风险评分。

伯尼补充说,种族是唯一的复杂因素。研究中分析的人群来自特定的医疗保健系统,他们的经验不一定会在各个国家之间转化。例如,英国和美国之间心脏病发作的机会可能会有所不同,护理标准也会有所不同。因此分数可能无法翻译。

即使将这些分数传达给人们的简单行为也带来了许多问题。麦卡锡说,医生不一定要接受遗传学方面的培训,“地球上没有足够的遗传咨询师”来进行遗传风险评分将引起的细微讨论。一个普遍的误解是,因为我们的遗传学不会改变,“某种程度上将无法实现的命运”?伯尼说。詹森斯担心,如果人们认为患上疾病的机会与他们的DNA息息相关,那么他们将无动于衷。

对于非疾病性状的关注变得更加尖锐,这些分数可能预示着这些疾病。今年早些时候发表的一项针对超过100万人的研究得出了一个多基因评分,该评分与人们受教育的时间长短基本相关5。该研究的作者竭尽全力澄清他们没有建议对分数极低的人进行任何干预。他们写道,对此或类似研究的“任何实际反应”,无论是个人还是政策层面的,都为时过早。

盖辛格健康系统(Geisinger Health System)的生物伦理学家,该研究的合著者米歇尔·迈耶(Michelle Meyer)表示,该评分根本无法实施。如果不了解分数所代表的生物学差异(或必定要与这些差异相互作用的环境和社会因素),就不可能知道如何进行干预。

谈遗传学

对于研究人员而言,了解人们对多基因分数的反应是非常重要的。Ripatti和他的同事已根据多基因评分和传统的危险因素(例如高血压),向芬兰的7,000多个个体提供了有关患上心脏病的可能性的信息。Ripatti说,大多数受访者表示,获取这些信息会激励他们做出积极的改变。初步结果表明,具有高遗传风险的人最有可能采取减肥或戒烟等行动。

在附近的爱沙尼亚,研究人员正在对100,000个人进行基因分型,而该国已经取样了50,000。与许多其他生物库不同,爱沙尼亚项目的参与者可以注册以获得反馈。爱沙尼亚塔尔图大学爱沙尼亚基因组中心的遗传学家莉莉·米兰尼(Lili Milani)说,在返回给他们的结果中,包括2型糖尿病和心血管疾病的多基因风险评分。与芬兰的工作类似,向参与者展示了生活方式的改变如何减少或增加其风险的图表。Milani说,最初的迹象表明人们对这个建议感到高兴。

目前,人们正在接受遗传咨询师的评分。但是,Milani正在与爱沙尼亚政府合作,研究如何将基因组数据整合到医疗保健系统中,以便医生每天都可以使用它。米兰尼说,该国的最终目标是对任何感兴趣的人进行基因分型,直至其130万总人口。“他的目标是制造出如此出色的产品,以至于所有医生都希望推荐它,而所有人群都希望得到它。”

自然562,181-183(2018)