艺术家对伽马射线暴的印象。
通过应用机器学习算法,哥本哈根大学尼尔斯波尔研究所的科学家们开发了一种方法,可以对所有伽马射线爆发(GRB),遥远星系中的快速高能爆炸进行分类,而无需寻找余辉。目前对哪些GRB进行了分类。这一突破是由学士学位第一年开始的。学生,可能会成为最终发现这些神秘爆发的根源的关键。结果现已发表在《天体物理学杂志快报》上。
自从70年代冷战卫星意外捕获伽玛射线爆发(GRB)以来,这些快速爆发的起源一直是一个重大难题。尽管许多天文学家都认为GRB可以短时(通常少于1秒)和长时(最多几分钟)爆发,但这两组是重叠的。人们认为,较长的爆发可能与大质量恒星的坍塌有关,而较短的爆发可能由中子星的合并引起。但是,如果没有能力将这两个组分开并查明它们的属性,就不可能检验这些想法。
到目前为止,只有大约1%的时间才能确定GRB的类型,这时望远镜才能足够快地指向爆炸位置,以拾取残留的光,称为余辉。这是至关重要的一步,以至于天文学家已经建立了遍布全球的网络,能够在发现新的爆发后的几分钟内中断其他工作并重新对准大型望远镜。LIGO天文台甚至利用引力波检测到一个GRB,该团队因此获得了2017年诺贝尔奖。
使用机器学习算法实现突破
现在,尼尔斯·波尔研究所(Niels Bohr Institute)的科学家们开发了一种无需对余辉进行分类就可以对所有GRB进行分类的方法。该小组由学士学位第一年领导。物理专业的学生约翰·博克·塞弗林(Johann Bock Severin),克里斯汀·克拉格·耶斯珀森(Christian Kragh Jespersen)和乔纳斯·文瑟(Jonas Vinther)应用了机器学习算法对GRB进行分类。他们确定了多头GRB和短GRB之间的明确分隔。他们在查尔斯·斯坦哈特(Charles Steinhardt)的监督下进行的工作,将使天文学家更进一步地了解GRB。
这一突破可能证明了最终发现这些神秘爆发的起源的关键。正如尼尔斯·波尔研究所宇宙黎明中心的副教授查尔斯·斯坦哈德(Charles Steinhardt)解释说:“现在,我们有两套完整的仪器,我们可以开始探索它们之间的差异。到目前为止,还没有一种工具可以做到这一点。”
从算法到视觉地图
学生们决定使用机器学习算法t-SNE对GRB上的所有可用信息进行编码,而不是像通常那样使用一组有限的摘要统计信息。 t分布随机邻域嵌入算法可获取复杂的高维数据,并生成简化的且在视觉上可访问的地图。这样做不会干扰数据集的结构。“这种方法的独特之处,” Christian Kragh Jespersen解释说,“ t-SNE不会强迫分成两组。您让数据说明一切,并告诉您应如何对其进行分类。”
照亮数据
Johann Bock Severin说,特征空间的准备(您为算法提供的输入)是项目中最具挑战性的部分。本质上,学生必须以使其最重要的特征脱颖而出的方式准备数据集。“我喜欢将它与将您的数据点悬挂在黑暗房间的天花板上进行比较,” Christian Kragh Jespersen解释说。“我们的主要问题是指出应该从哪个方向照亮数据以使分离可见。”
“了解GRB的第0步”
作为第一年项目的一部分,学生探索了t-SNE机器学习算法,这是物理学学士课程的第一年课程。他们的主管查尔斯·斯坦哈特(Charles Steinhardt)说:“到课程结束时,显然我们已经取得了显著成绩。”学生绘制t-SNE的图时,会将 Swift观测站的所有GRB清晰地分为两组。重要的是,它对以前难以分类的GRB进行了分类。“这本质上是理解GRB的第0步,” Steinhardt解释说。“我们第一次可以确认,越来越短的GRB确实是完全分开的东西。”
在没有任何天文学理论背景的情况下,学生们发现了GRB难题中的关键部分。从这里开始,天文学家可以开始开发模型来识别这两个独立类别的特征。
参考:克里斯蒂安·K·耶斯珀森,约翰·B·塞弗林,查尔斯·施泰因哈特,乔纳斯·文瑟,约翰·普·芬博,乔纳坦·塞尔辛和达拉奇·沃森,“将伽马射线爆炸明确地与单独的迅速发射分为两类”,2020年6月15日,天文期刊快报.DOI:
10.3847 / 2041-8213 / ab964darXiv:
2005.13554