数据要素产业
窥视宇宙黑匣子:解释系外行星大气检索的深度学习模型
你知道地球的大气是由什么组成的吗?你可能记得它是氧气,也可能是氮气。借助 Google 的一点帮助,您可以轻松得出更精确的答案:78% 的氮气、21% 的氧气和 1% 的氩气。
大气可以表明行星的性质,以及它们是否可以承载生命。然而,当谈到外大气层——太阳系外行星的大气层——的组成时,答案是未知的。
由于系外行星如此遥远,已证明探测它们的大气层极其困难。研究表明,人工智能 (AI) 可能是探索它们的最佳选择——但前提是能够证明这些算法以可靠、科学的方式思考,而不是欺骗系统。
来自伦敦大学的研究人员提出了一些通用评估方法,可以应用于任何训练有素的 AI 模型。特别是,他们训练了三种不同的流行深度神经网络(DNN)架构来从系外行星光谱中检索大气参数,并表明这三种架构都实现了良好的预测性能。
同时研究人员对 DNN 的预测进行了广泛的分析,这可以给定仪器和模型的大气参数的可信度限制。执行基于扰动的敏感性分析,以确定检索结果对频谱的哪些特征最敏感。
该团队得出结论,对于不同的分子,DNN 预测最敏感的波长范围确实与其特征吸收区域一致。该方法有助于改进 DNN 的评估并为其预测提供可解释性。
该研究以「Peeking inside the Black Box: Interpreting Deep-learning Models for Exoplanet Atmospheric Retrievals」为题,于 2021 年 10 月 13 日发布在《The Astronomical Journal》。
天文学家通常利用凌日方法来研究系外行星,这涉及测量当行星从恒星前面经过时恒星发出的光的倾角。如果行星表面存在大气,它可以吸收少量恒星的光。
通过在不同波长(光的颜色)下观察这一事件,可以在吸收的星光中看到分子的指纹,在光谱中形成可识别的图案。如果恒星与太阳相似,则木星大小行星的大气产生的典型信号只会使恒星光减少约 0.01%。地球大小的行星产生的信号要低 10-100 倍。这有点像从飞机上发现地面上猫咪的眼睛颜色。
未来,詹姆斯·韦伯太空望远镜(JWST)和 The Ariel Space Mission 这两个探测器都将从太空轨道上调查系外行星,它们可以获取数千个系外大气层的高质量光谱。但是,由于大气层的复杂性,对单个凌日行星的分析可能需要数天甚至数周才能完成。
科学家们试图训练人工智能来预测大气中各种化学物质的丰度。为了证明人工智能的可靠性,科学家研究了人工智能的思考模式。
窥视黑匣子内部
如果无法理解,就不能采用理论与工具。也许人工智能中的一个「小故障」,可能会得出在系外行星发现了生命的结论。人工智能在解释它们发现方面很糟糕。即使是人工智能专家也很难确定是什么原因导致网络提供给定的解释。这种劣势阻碍了人工智能技术在天文学领域的应用。
研究人员开发了一种方法,可以一瞥人工智能的决策过程。该方法非常直观。假设 AI 必须确认图像是否包含猫。它大概会通过发现某些特征来做到这一点,例如皮毛或脸型。为了了解它所引用的特征和顺序,可以模糊猫的图像的一部分,看看它是否仍然可以识别出它是一只猫。
这正是科学家通过「扰动」或改变光谱区域为系外行星探测 AI 所做的训练。通过观察人工智能对系外行星分子丰度的预测在每个区域被修改时是如何变化的(比如说大气中的水),研究人员开始构建人工智能如何思考的「图片」,比如它用来决定大气中的水含量的光谱区域。
结果发现训练有素的人工智能在很大程度上依赖于物理现象,例如独特的光谱指纹——就像天文学家一样。
事实上,在学习方面,AI 和高中生并没有太大的不同——它会尽量避开艰难的道路(一步步解析),寻找各种捷径(套用公式),获取答案。如果人工智能基于记住它遇到的每一个频谱来做出预测,那将是非常不可取的。
这一发现提供了第一种偷窥所谓「人工智能黑匣子」的方法,让研究人员能够评估人工智能所学到的东西。借助这些工具,研究人员现在不仅可以使用 AI 来加速对外部大气的分析,而且还可以验证他们的 AI 是否使用了众所周知的自然法则。
也就是说,现在说完全了解人工智能还为时过早。下一步是精确计算每个概念的重要性,以及如何将其处理为决策。
这个前景对人工智能专家来说是令人兴奋的。AI 令人难以置信的学习能力源于它从数据中学习「表示」或模式的能力——这种技术类似于物理学家如何发现自然定律。
论文链接:https://iopscience.iop.org/article/10.3847/1538-3881/ac1744/meta
相关报道:https://phys.org/news/2021-12-ai-reliably-molecules-exoplanets-day.html