新研究表明,迁移学习可以显着加速对新物理的探索,减少对昂贵模拟的需求。然而,根据发表在《宇宙学与天体粒子物理学杂志》(JCAP) 上的一项研究,对既定模式的依赖可能会导致人工智能忽视真正新颖的现象。
宇宙学的标准模型,称为ΛCDM,解释了许多宇宙特征,但并不全面。新的观测结果对大质量中微子、修正引力和演化暗能量等概念提出了疑问。研究这些需要大量的计算机模拟,这既昂贵又耗时。
研究团队旨在确定迁移学习是否可以提高模拟效率。迁移学习允许人工智能将知识从更简单的任务应用到更复杂的任务,从而降低成本。最初,人工智能接受了基本的 ΛCDM 模拟训练,然后过渡到包含潜在新物理的更复杂的模型。
来自熨斗研究所和普林斯顿大学的合著者阿德里安·拜尔 (Adrian Bayer) 将这种方法描述为传统人工智能训练的捷径。 “通常人们会直接在计算成本最高的模拟上训练人工智能。我们所做的是首先使用更简单且成本更低的 ΛCDM 模拟,让人工智能了解正在发生的事情,”拜尔说。
这种预训练策略帮助人工智能管理复杂性而不被淹没。研究发现,在某些情况下,迁移学习将所需的昂贵模拟数量减少了十倍以上。
研究人员还发现了一种称为负迁移的挑战,当人工智能根据其预先存在的知识误解新信息时就会发生这种情况。当新效应类似于与现有 ΛCDM 参数一致的模式时,人工智能常常难以辨别新效应。这在涉及大量中微子的模拟中很明显,其中人工智能面临着区分新特征和已经与已知参数相关的特征的困难。
该研究的主要作者 Veena Krishnaraj 解释说,负迁移是模型中潜在的物理退化造成的。 “不同的物理过程可以产生非常相似的可观察特征,”她指出,这表明在解释人工智能研究结果时需要谨慎。
该研究强调了物理领域迁移学习的潜在好处和局限性。虽然预训练可以加快数据分析速度,但它可能会阻碍人工智能识别突破性发现的能力。下一阶段将涉及将迁移学习技术应用于真实的天文观测。
研究人员预计,迁移学习对于即将进行的旨在收集高精度数据的宇宙学调查至关重要。由 Veena Krishnaraj 及其同事撰写的题为“超越标准模型的迁移学习”的论文现已发表在 JSTAT 上。
<小时/>





