ExoNet: Multimodal Deep Learning for TESS Exoplanet Candidate Identification via Phase-Folded Light Curves, Stellar Parameters, and Multi-Head Attention Fusion

Md. Rashadul Islam

View Original ↗
AI 導讀 technology AI 重要性 4/5

ExoNet 模型透過融合光變曲線與恆星參數,在兩小時內完成訓練,成功從 TESS 數據揪出高達 99.64% 信心度的類地行星目標。

  • 全新三模態架構融合全域/局部光變曲線與恆星參數,大幅減少偽陽性干擾。
  • 以 NVIDIA L4 GPU 進行混合精度訓練,不到兩小時達成測試集 AUC 0.8112。
  • 成功標記 35 個高潛力 TESS 候選行星,包含具備 99.64% 機率的類地球目標 TOI-7949.87。

NASA 的 TESS(凌日系外行星巡天衛星)至今已標記超過 7,800 個候選系外行星,卻僅有不到 720 個獲得正式確認。面對龐大的數據驗證瓶頸,全新開源的多模態深度學習框架 ExoNet,透過融合光變曲線與恆星參數,在兩小時內即可完成模型訓練,成功從未確認清單中揪出 35 個高信心度目標。

突破 7,000 個 TESS 未確認行星的人力驗證瓶頸

尋找系外行星本質上是一個極度仰賴運算的數據工程問題。自從 2018 年升空以來,TESS 衛星已經掃描了全球天空約 85% 的區域,所監控的恆星亮度是前一代 Kepler 任務目標的 10 到 100 倍。截至 2026 年初,雖然演算法自動標記了高達 7,821 個潛在的系外行星候選者,但實際被驗證的數量卻不到一成,留下超過 7,000 個未解決的目標。

傳統的驗證流程主要依賴專家手動檢查數據驗證報告,這種方式在面對 TESS 每個月產生的大量光譜資訊時,顯然無法擴展規模。過去在機器學習領域,雖然有 AstroNet 使用 CNN(卷積神經網路)處理光變曲線並發現新行星,以及後續的 ExoMiner 與 ExoMiner++ 驗證了數千個行星,但大多數系統仍將光譜的亮度變化與恆星本身的參數分開處理,缺乏一個真正能聯合學習的多模態架構。

為了解決分析上的斷層,研究人員提出了 ExoNet。這個模型旨在將單純的影像分類邏輯,提升到具備綜合評估能力的層級,同時處理恆星本身的大小、溫度,以及行星遮蔽恆星時所產生的光變細節。

結合 1D CNN 與多頭注意力機制的三模態架構

為了精準判讀行星凌日現象,ExoNet 採用了獨特的「三模態」網路架構,將輸入資料分為三個獨立的特徵流。第一個流是「全域視角」,包含 2001 個資料區間,負責捕捉行星繞行的完整軌道週期,藉此辨識出可能的二次食或是奇偶不對稱性;第二個流則是「局部視角」,同樣擷取 2001 個區間,但專注放大凌日事件發生的當下,保留行星切入與移出恆星表面的幾何形狀。

處理上述兩個視角的核心是五層殘差架構的 1D CNN,能將原始資料降維。接著,模型在時間軸的特徵圖上導入了 8 頭多頭注意力機制(Multi-Head Attention)。這個機制的運作原理類似於人類專家的視覺焦點,能自動學習該在哪個時間段給予更高的權重,從而凸顯微弱的凌日訊號並忽略背景噪音。

除了光變曲線,第三個特徵流則處理包含軌道週期、凌日深度、恆星有效溫度、表面重力等 8 項標量參數。這些數值經過標準化後送入多層感知機,最終將影像特徵與數值特徵連接成一個 640 維的向量,透過殘差融合層(Late-fusion)計算出最終的分類機率。

Kepler 數據訓練實測與 NVIDIA L4 效能數據

訓練資料的品質直接決定了分類器的極限。ExoNet 從 NASA 系統取得了帶有標籤的累積 Kepler 目標清單,將確認的行星標為 1,偽陽性標為 0。為了加速運算並確保可及性,所有光變曲線都直接透過開源的 Lightkurve 套件從 MAST 資料庫下載並進行本地快取。

在硬體配置上,開發團隊選用了一張 NVIDIA L4 GPU 進行訓練,並結合 PyTorch 的 FP16 混合精度技術。與傳統的 FP32 相比,這種設定帶來了約 2 倍的速度提升,使得包含 100 個週期(epochs)的訓練過程在不到 2 小時內即可完成。模型採用 70/15/15 的資料切分比例,並設定了基於驗證集的早停機制,在第 17 個週期便達到了最佳的收斂狀態。

消融實驗的數據清晰地展示了多模態架構的優勢。單純使用全域 CNN 時,模型在測試集的 AUC(曲線下面積,衡量分類模型表現的指標)僅有 0.749;擴增為雙 CNN 後上升至 0.793;而在補上恆星參數特徵後,完整的 ExoNet 模型測試集 AUC 達到了 0.8112,準確率為 72.86%。數據證明,每一次追加的資料模態都能實質且穩定地提升預測精準度。

挖掘出 19 個適居帶目標與 99.64% 類地行星 TOI-7949.87

模型完成驗證後,隨即被投入一場真實的尋星實戰。研究人員將 200 個目前歸類為「尚未確認」的 TESS 候選行星資料餵入 ExoNet,要求模型直接給出成為真實行星的機率預測。

測驗顯示,ExoNet 成功辨識出 35 個信心度超過 70% 的高潛力訊號,其中更有 27 個的機率高於 85%。從天文生物學的角度來看,這份清單當中有 19 個候選者的預估平衡溫度落在 200–400 K 之間,這個範圍正是液態水可能存在的適居帶。對於後續的望遠鏡觀測資源分配來說,這是一個極具價值的優先名單。

在所有候選者中,代號為 TOI-7949.87 的目標最引人矚目。模型對其給出了高達 99.64% 的真實行星機率,且該星球的半徑為地球的 0.97 倍,屬於罕見的岩石行星範圍。它的母恆星是一顆有效溫度約 5080 K 的類太陽恆星,軌道週期為 15.0 天,被認為是目前最適合立刻展開徑向速度後續觀測的極品目標。另一個值得注意的長週期候選者則是 TOI-5521.20,它是一顆具備 35 天週期的超級地球,極適合由高精度光譜儀進行後續追蹤。

ExoNet 多模態特徵的物理意義與開源生態

為什麼融合恆星參數能帶來顯著的成效?主要原因在於排除偽陽性干擾。宇宙中許多背景食雙星在互相遮蔽時,會產生類似行星凌日的測光訊號。然而,如果將這個光變深度套用在單一恆星的體積假設上,算出來的行星體積往往會產生不合理的矛盾。ExoNet 的神經網路在沒有人工寫入任何物理規則的情況下,自動學會了利用恆星分支數據來揪出這種不一致性。

雖然 ExoNet 無意取代如 ExoMiner++ 這類整合了更複雜偵測分支的企業級演算法,但其核心價值在於「完全可重現的開源路徑」。所有的輸入資料皆來自公開的 MAST 檔案館,不僅免除了專有數據管線的依賴,更讓全球的天文愛好者與研究團隊能用極低廉的硬體成本進行二次開發。

受限於現有資料庫的完整度,測試集內約有三分之一的候選者缺少標準光變曲線,模型目前只能將這部分填零處理。同時,單靠平衡溫度並不能完全確保星球的適居性,仍需等待如韋伯太空望遠鏡(JWST)進行大氣特徵分析。未來 ExoNet 團隊將會加入更多特徵工程,並把這批高潛力的清單提交至 NASA ExoFOP 社群平台,透過分散式力量加速天文驗證的進度。

多模態特徵融合正大幅降低巨量天文數據篩選的門檻,讓高精度的系外行星驗證從國家級超級電腦走向開源的 GPU 應用。

Abstract

NASA's Transiting Exoplanet Survey Satellite (TESS) has identified thousands of exoplanet candidates, yet many remain unconfirmed due to the limitations of manual vetting processes. This paper presents ExoNet, a multimodal deep learning framework that integrates phase-folded global and local light curve representations with stellar parameters using a late-fusion architecture combining 1D Convolutional Neural Networks and Multi-Head Attention. Trained on labeled Kepler data, ExoNet achieves strong classification performance and demonstrates effective generalization to TESS data. Applied to 200 unconfirmed TESS planet candidates, the model identifies multiple high-confidence candidates, including several within the habitable zone. The results highlight the effectiveness of multimodal fusion and attention mechanisms in automated exoplanet candidate validation.