Inferring Halo Mass and Scale Radius of Galaxy Clusters Using Convolutional Neural Networks and Uchuu-UniverseMachine Catalogs

Hirobumi Tominaga, Asuka Nakamura, Tomoaki Ishiyama, Mohamed H. Abdullah

View Original ↗
AI 導讀 technology AI 重要性 4/5

引入星系豐度至 CNN 模型,星系團質量預測標準差降至 0.111 dex。

  • 以 Uchuu 模擬星表訓練 CNN,星系團維里質量與尺度半徑的絕對中位數殘差皆小於 0.01 dex。
  • 擴充豐度參數至網路輸入,對推估維里質量效益顯著,標準差可由 0.133 降至 0.122 dex。
  • 排除未達力學弛豫狀態的星系團,是消除尺度半徑系統性低估與降低推斷誤差的最核心關鍵。

利用機器學習預測星系團質量迎來全新突破。天文學家運用 Uchuu-UniverseMachine 模擬星表建構帶有視線速度的二維影像,成功讓卷積神經網路(CNN)推斷出絕對中位數殘差小於 0.01 dex 的星系團質量。將星系豐度加入網路輸入特徵中,更能讓預測標準差從 0.133 dex 降至 0.122 dex,大幅提升未來宇宙學參數推演精準度。

結合 Uchuu 模擬與 48x48 像素 CNN 架構

推斷星系團的質量與內部質量分佈,是限制宇宙學參數與理解星系組裝歷史的關鍵步驟。宇宙學模擬預測星系暈的球平均密度輪廓符合 NFW(Navarro-Frenk-White)分佈,其中尺度半徑與濃度參數直接關聯星系的空間群聚現象(即組裝偏差,Assembly bias)。然而,觀測這類訊號常因視線方向上的干擾星系(Interlopers)而產生系統性誤差,導致傳統基於單一特徵推估質量或濃度時遭遇瓶頸。

為了克服觀測上的系統性誤差,研究團隊運用 Uchuu-UniverseMachine 模擬星表,並將 redshift 設為 z=0.093 來生成模擬觀測資料。Uchuu 宇宙學 N 體模擬包含 12800^3 個粒子,模擬體積達 2.0 h^-1 Gpc 的立方體空間,質量解析度極高,提供了比過往研究大八倍體積的極佳機器學習訓練環境。團隊針對質量大於 10^13.5 h^-1 M_⊙ 的星系團,提取半徑 1.6 h^-1 Mpc 且視線速度在 2200 km/s 內的成員星系。

每個星系團的二維聯合機率密度函數(包含投影距離與視線速度)被離散化為 48×48 的網格。考量到單張圖像中實際包含的成員星系數量往往少於總像素,影像會呈現高度稀疏狀態。為了消弭稀疏性引發的偏差,網路引入了核密度估計(Kernel density estimation, KDE)技術,將其平滑化處理成連續的密度場影像,作為後續卷積神經網路的標準輸入數據。

擴展豐度特徵的 CNN_richness 模型架構

在此次實驗中,團隊建構了兩種不同的卷積神經網路架構來評估推斷效能。第一種是建立在過往研究基礎上的 CNN_baseline 模型,該架構包含兩個卷積層、一個最大池化層(Max-pooling layer)、一個 Dropout 層,以及三層緊密連接的 Dense 層。其主要功能是將 48×48 的星系分佈特徵圖提取出核心資訊,轉換為長度 240 的一維向量,最終輸出預測的星系團質量與尺度半徑。

第二種架構則是本次研究的核心創新,被命名為 CNN_richness 模型。由於星系團的成員星系數量(豐度,Richness)在過去觀測中已被證實與星系團總質量具有高度正相關,團隊決定在此架構的扁平化向量尾端,增加了一個代表豐度的純量輸入。這種設計讓進入全連接層的輸入向量大小增加至 241,藉此測試額外的純量資訊是否能有效收斂網路預測的誤差。所有模型皆採用 10 折交叉驗證(10-fold cross-validation)進行訓練,並嚴格確保訓練與驗證集的星系團不重複。

豐度特徵使質量預測標準差降至 0.111 dex

在測試集涵蓋 10^13.7 至 10^15.3 h^-1 M_⊙ 的質量範圍內,所有的 CNN 模型皆展現出幾乎無偏差的預測能力。絕對中位數殘差(Absolute median residuals)在所有配置下皆落在極小的 0.01 dex 範圍以內。當分析焦點放在所有的星系團樣本時,CNN_baseline 的預測標準差為 0.133 dex;而加入了豐度特徵的 CNN_richness 模型,則成功將標準差縮小至 0.122 dex

當團隊進一步將樣本限縮在「動態力學上已達到弛豫狀態(Dynamically relaxed)」的穩定星系團時,預測精準度出現了更顯著的疊加提升。在這種理想的平衡樣本下,CNN_richness 的預測標準差進一步降至最佳的 0.111 dex。數據表明,整合豐度資訊能顯著收窄預測殘差的分佈,其對於質量推斷的改善幅度,甚至超越了單純過濾未達到力學平衡的星系團樣本。儘管如此,質量預測的殘差分佈仍呈現高度非高斯特性,帶有明顯的正偏度與高峰度,顯示極端誤差的長尾現象依然存在於極少數個案中。

力學平衡狀態使尺度半徑推測改善 0.02 dex

相較於總質量的精準預測,星系團內部尺度半徑(Scale radius)的推斷本質上更加困難,這也直接反映在其整體較大的標準差上。在囊括所有力學狀態的星系團樣本中,模型對於大於 300 h^-1 kpc 的尺度半徑會出現約 0.1 dex 的系統性低估。研究指出,在定義尺度半徑時,剛經歷重大合併(Major merger)的星系團在外圍通常擁有大質量次暈,其最大圓周速度會趨近於維里速度,導致依公式定義出的集中度偏低,進而干擾 CNN 的特徵擷取。

不同於質量預測高度依賴豐度,改善尺度半徑預測的最有效手段是從訓練端排除這些尚未穩定的動態系統。當將訓練與測試數據限縮在已達到力學弛豫的樣本時,上述的大尺度系統性低估現象不僅完全消失,CNN_baseline 的預測標準差更從 0.180 dex 大幅降至 0.154 dex。相反地,單獨添加豐度特徵的 CNN_richness 模型在尺度半徑上的改善幅度極其有限(僅降低約 0.005 dex),證實了「觀測對象的動態穩定度」才是決定內部質量分佈推斷能力的絕對核心。

針對高精準度宇宙學參數推演的觀測策略

這項基於大型模擬星表的 CNN 研究成果明確證明,機器學習不僅能精準推估星系團的整體維里質量,更能描繪出其內部的暗物質分佈輪廓。針對未來的大型觀測計畫,這套演算法提供了一條繞過傳統縮放關係(Scaling relations),並能有效處理視線方向干擾星系的全新路徑。

對於關注星系暈結構參數的天文學家而言,真實世界中的星系團通常無法單憑投影的相空間資訊判斷其力學平衡狀態。未達到弛豫的活躍系統將無可避免地降低尺度半徑的推斷品質。這意味著未來的觀測分析必須依賴 X 射線數據,或是最亮星系團星系(Brightest cluster galaxy)偏移量等更為獨立的指標,以此篩選出真正穩定的星系團,才能將演算法推論暗物質結構的潛力發揮到極致。

動態穩定度決定內部結構推演上限,而星系豐度則是收斂質量預測誤差的關鍵,機器學習演算法正實質拓寬宇宙學觀測的分析邊界。

補充數據視覺化

不同神經網路模型與樣本條件下之預測誤差標準差比較
預測目標與樣本條件CNN_baseline 標準差 (dex)CNN_richness 標準差 (dex)
維里質量 (所有樣本)0.1330.122
維里質量 (力學弛豫樣本)0.1240.111
尺度半徑 (所有樣本)0.1800.175
尺度半徑 (力學弛豫樣本)0.1540.148

Abstract

We investigate the ability of machine learning to infer the virial mass ($M_{\rm vir}$) and the scale radius ($r_{\rm s}$) of galaxy clusters from their observables. Using the Uchuu--UniverseMachine galaxy catalog at $z=0.093$, we generate mock cluster observations that include interlopers, and we encode each cluster as an image representing the two-dimensional joint probability distribution of member galaxies' projected position and line-of-sight velocity. We train two architectures: a baseline convolutional neural network (CNNb) following a previous approach, and an extended model (CNNr) that appends richness as an additional scalar input. We further compare the performance of networks trained on the all cluster sample and on a dynamically relaxed subsample. Across the test ranges $10^{13.7}\leq M_{\rm vir}\leq10^{15.3}$ Msun/h and $10^{1.7}\leq r_{\rm s}\leq10^{2.7}$ kpc/h, all configurations yield nearly unbiased absolute median residuals (within 0.01 dex). For the halo mass, adding richness narrows the residual distribution, reducing the standard deviation from 0.133 to 0.122 dex for the all sample, and from 0.124 to 0.111 dex for the relaxed sample. For the scale radius, restricting the training to relaxed clusters improves the performance more than adding richness. The standard deviation decreases from 0.180 to 0.154 dex for CNNb and from 0.175 to 0.148 dex for CNNr, while the inclusion of richness yields only a modest improvement of 0.005 dex. These results demonstrate that machine learning is a powerful tool to infer the mass and internal mass distribution of clusters, providing a new window for cosmological inferences and understanding galaxy formation processes.