你忘了今年的母亲生日吗?振作起来:您的家谱现在可能包括1300万人的生日。
纽约市哥伦比亚大学的计算生物学家Yaniv Erlich和他的同事使用众包数据制作了一个可联系1300万人的家谱。今天在Science1中描述的血统图被认为是同类中最大的经过验证的资源-平均跨越11代。
Erlich小组分析了这棵树上人们的出生和死亡日期,并计算了如果亲缘关系密切的人是否更有可能在相似的年龄死亡。该小组的结论是,遗传仅解释了这些个体寿命的大约16%。大多数差异归结于其他因素,例如人们的住所和生活方式。
马里兰大学巴尔的摩分校的遗传流行病学家布拉克斯顿·米切尔(Braxton Mitchell)说:“他是真正的骑兵。”“这是使用大型可公开获得的数据集进行有趣研究的一个很好的例子。” / p>
健康长寿·繁荣昌盛
科学家已经怀疑,环境对人类寿命的影响大于基因。但是埃利希(Erlich)估计,基因的作用甚至比研究人员想象的要少。
一些研究(例如Mitchell小组在20012年发表的一项研究)估计,基因决定了人类寿命变化的大约四分之一。
盐湖城犹他大学医学院的遗传学家丽莎·坎农·奥尔布赖特(Lisa Cannon-Albright)说,埃里希的发现证明了超大家族树或家谱的力量。
她说:“各种资源将成为未来遗传学研究的有力力量。”
埃利希说,“有害”基因可以使一个人的寿命平均延长五年。一些环境因素对寿命的影响更大。例如,吸烟可以减少十年。
遗传学家长期以来一直使用家谱来研究遗传学如何影响许多特征,例如疾病风险。但是,组装包含大量人口的家庭记录数据库可能既昂贵又困难。Erlich研究是目前正在进行的将数字记录整合到非常大的家谱中的众多研究之一[3,4]。一些已经鉴定出与癌症和老年痴呆症等疾病相关的基因5。
数据泛滥
Erlich的研究使用了来自在线家谱工具Geni.com的数据。他是Geni母公司MyHeritage的首席科学官,该公司位于以色列Or Yehuda。
该分析利用了Geni用户上载记录的大约8600万人的数据。与最大的消费者基因测试数据库中包含的参与者相比,数量增加了一个数量级。
加州大学旧金山分校的计算机基因组学家Atul Butte说:“参与者的数量真是疯了。”“众人只能通过众包获得这样的数据集。真令人印象深刻。
Erlich团队使用这些数据来分析Geni上列出的人的迁移和婚姻模式。例如,研究人员发现,例如在1750年之前,数据库中的大多数美国人和欧洲人与某个居住在离出生地最多10公里的人结婚。到1950年,大多数美国人和欧洲人必须离开家乡至少100公里才能找到配偶。
换句话说,您的父母可能比他们的任何祖先走得更远,从而开始了您的家庭。您至少可以记住他们的生日。