维基百科上被引用次数最多的期刊文章包括有关月球坑的名称以及人类和小鼠基因的DNA序列的论文-并且,在线百科全书中引用的许多最流行著作比科学文献中的引用次数还多。
前100篇论文
纽约市的数据科学家兼图书馆员马特·米勒(Matt Miller)说:“令人难以置信的是,几乎所有被高引用的文章都是科学文章。”Miller分析了Wikimedia基金会在三月份发布的引文数据,该基金会是位于加利福尼亚州旧金山的非营利组织,该组织经营Wikipedia。包含大约1,570万条记录的数据集显示,在Wikipedia的所有近300种语言版本中,引用了带有正式标识符(例如ISBN(国际标准书号)和DOI(数字对象标识符))的来源的次数。维基媒体注意到,维基百科上的标识符所引用的大多数出版物都是书籍,但米勒着眼于英语版本的维基百科上带有DOI(即期刊文章最广泛使用的标识符)的出版物的编号。他的数据集包含使用DOI的120万引用,引用了835,000多篇独特的文章。
引用最多的论文是英语维基百科的4,702篇文献,它是2002年收集的15,000多个人类和小鼠基因序列的集合(请参阅“英语维基百科”)。引用该研究的Wikipedia页面几乎都是关于单个基因或蛋白质的条目。领导该项目的癌症研究人员罗伯特·斯特劳斯伯格(Robert Strausberg)说,“这真令人惊喜”,他现在是纽约市路德维希癌症研究所的副科学总监。
英语维基百科:十大学术文章
在英文维基百科上有关DOI的十种最受欢迎的出版物:
4,702次引用:超过15,000个全长人和小鼠cDNA序列的产生和初步分析(2002)
3387次引用:NIH全长cDNA项目的现状,质量和扩展:哺乳动物基因收藏(MGC)(2004)
2,895次引用:验证新的Hipparcos减量(2007)
2,212引文:对21,243个全长人cDNA的完整测序和表征(2004)
1,452次引用:国际天文学联合会第十七委员会工作组关于月球命名的报告(1971年)
1,297次引用:寡核苷酸封端:一种用寡核糖核苷酸取代真核mRNA帽结构的简单方法(1994年)
1,294次引用:迈向人类蛋白质-蛋白质相互作用网络的蛋白质组比例图(2005年)
1,251次引用:全长富集和5'端富集的cDNA文库的构建和表征(1997)
931引文:Pan-STARRS PS1初步结果观测到的25万颗小行星的绝对大小和坡度参数(2015年)
878 citations:锘?a href =“ https://doi.org/10.1088/0004-637X/741/2/90” data-track =“ click” data-label =“ https://doi.org/10.1088 / 0004-637X / 741/2/90“ data-track-category =” body text link“>通过分光光度法分类的小行星的NEOWISE研究:初步结果(2011年)
该基因集的扩展版本于2004年发布,是第二大被引用的文章,约有3,400篇参考文献(相比之下,根据Google学术搜索,它在科学文献中有487条被引用)。马里兰州贝塞斯达市美国国家癌症研究所的癌症遗传学家丹妮拉·格哈德(Daniela Gerhard)是该论文的合著者,他说这些出版物被引用的频率很高,因为它们提供了有关表达基因序列的可访问信息。
总体而言,前十名中有五篇文章是关于DNA目录的,其中一项研究详细介绍了生成此类馆藏的方法。2005年地图上还列出了将近3,000种人类蛋白质相互作用的图表,排名第七。(维基媒体原帖:“令人惊讶的是,维基百科爱好者喜欢参考书。”
天文学文章占列表的其余部分,其中有四个条目。引用次数排在第三位的论文是2007年的一项研究,被近3,000个英语Wikipedia页面引用,该研究帮助研究人员解释了Hipparcos的结果,这是首次测量恒星的位置,距离和亮度的太空任务。
名单上的其他太空科学论文涵盖了小行星的大小和亮度,以及月球陨石坑的名称(根据Google Scholar,在1971年出版的科学文献中只有16篇被引用)。撰写Hipparcos研究的英国剑桥大学的天文学家Floor van Leeuwen说,这些论文可能被高度引用,因为它们是拥有自己的Wikipedia页面的许多天体的可靠参考。
机器人工作
Wikipedia成立于2001年,每月接收大约160亿次页面访问,目前是世界上访问量排名第五的网站。任何人都可以创建文章或编辑现有文章,但是网站指南要求作家和编辑者必须将引用和信息归因于出版资源,例如书籍或学术论文。
罗斯·莫恩斯(Ross Mounce)对Wikimedia数据转储的另一份分析,他领导着位于伦敦的慈善基金会阿卡迪亚基金会(Arcadia Fund)的开放获取计划,揭示了所有语言版本中引用最多的十篇DOI文章(请参阅Wikipedia语言版本。其中六篇文章是相同的,但第一篇文章明显不同。最高引用的DOI文章是2007年发表的一篇论文,更新了一个具有百年历史的全球气候分类,该分类有280万次引用-但英语维基百科上只有169次(所有版本中第二被引用的来源刚刚超过21,000个参考)。
气候研究之所以被大量引用,是因为其数以百万计的引用来自自动计算机程序创建的页面。根据Wikipedia的说法,该机器人由瑞典法伦达拉纳大学的物理学家Sverker Johansson开发,截至2014年7月,该机器人已产生了近300万篇文章。文章的三分之一用瑞典语撰写,其余的用菲律宾语两种语言的Cebuano和Waray书写。约翰逊说,该机器人产生了数百万篇有关地理位置的文章,例如城镇和岛屿,并且其中大多数文章都包含有关当地气候类型的信息,这些信息参考了气候研究。他补充说,对于由机器人自动生成的气候文件引用,他没有确切的数字,“有280万人处于正确的位置”?
所有Wikipedia语言版本:十大学术文章
在所有Wikipedia语言版本中带有DOI的十种引用最多的出版物:
2,830,341引文:克彭彭·艾格尔气候分类的最新世界地图(2007年)
21,350次引用:使用片段方法预测有机小分子的疏水性(亲脂性):“ ALOGP和CLOGP方法的分析(1998年)”
20247次引用:NIH全长cDNA项目的现状,质量和扩展:哺乳动物基因收藏(MGC)(2004)
5,937引文:超过15,000个全长人和小鼠cDNA序列的产生和初步分析(2002)
5,854次引用:T锘县e Asiago超新星目录-十年后(1999年)
4,592次引用:验证新的Hipparcos减量(2007)
4,450次引用:小行星带的原始激发和清除(2001年)
3,062引文:国际天文学联合会第十七委员会工作组关于月球命名的报告(1971年)
2,587次引用:对21,243个全长人cDNA的完整测序和表征(2004)
2,525次引用:对固体行星体进行分类(2007年)
Mounce指出,其他文章可能在Wikipedia上被大量引用,但未由其DOI正式引用,而是由其他方式(例如,PubMed ID号)引用。
加州大学伯克利分校教育中心主任约翰·乔达奇(John Chodacki)说,要使人们信任信息,引文很重要。他说:“对于期刊文章和维基百科页面来说,这都是正确的。”但是从历史上讲,仅使用付费服务就可以分析和比较学术论文中的引用数据。“最有趣的事情是此信息完全可用。” / p>
自然557,291-292(2018)