Generative Modeling of Complex-Valued Brain MRI Data

Marco Schlimbach, Moritz Rempe, Jessica Mnischek, Lukas T. Rotkopf, Jens Weingarten, et al.

View Original ↗
AI 導讀 technology AI 重要性 4/5

結合相位的磁振造影生成模型,以純合成數據訓練的異常辨識率反超真實病例。

  • 常規磁振造影常捨棄相位數據,導致蘊藏腫瘤特徵的關鍵資訊流失。
  • 生成模型成功保留振幅與相位,合成特徵完美騙過鑑別網路。
  • 全合成訓練數據泛化力驚人,跨機構異常辨識率強勢反超真實病歷。

傳統磁振造影常丟棄相位,導致腦腫瘤初診與病理結果產生 30% 分歧。一項基於 6,970 筆掃描的新研究,打造首個能同時生成振幅與相位的流匹配模型。完全以合成數據訓練的分類器,準確率竟超越真實資料基準。

突破常規 MRI 侷限:找回被丟棄的腫瘤相位資訊

2022 年全球通報超過 320,000 起大腦與中樞神經系統癌症新病例。精準分類對於後續治療至關重要。診斷流程通常以磁振造影(MRI)起步。但僅依賴影像診斷常出現高達 30% 的誤差。為了彌補這項誤差,最終仍需仰賴具侵入性、帶有臨床併發症風險的腦部活體生檢(Biopsy)。

醫界過去常利用機器學習提升辨識率。但多數模型僅依賴重建後的振幅(Magnitude)影像。掃描儀在空間頻率域(k-space)擷取的原始訊號其實包含複數(Complex-valued)數據。這些數據經過逆傅立葉轉換後會產生振幅與相位(Phase)。由於常規序列的相位在肉眼觀察時價值有限,多數演算法在合併接收線圈數據時會將其丟棄。

事實上,相位對於局部磁化率變化極為敏感。它能反映去氧血紅素、鐵及鈣等物質的空間分布。腦腫瘤微血管出血與鐵質沉積會改變磁化特性。這意味著被丟棄的相位可能隱藏著極具價值的異常組織特徵。將這類資訊重新納入機器學習流程,成為提升無創診斷準確率的潛在突破口。

處理 6970 筆 fastMRI 掃描:流匹配生成模型

為了將相位資訊重新納入神經網路分析,德國多所研究機構團隊利用開源的 fastMRI 資料集展開生成式模型研究。該資料集涵蓋 6,970 筆不同掃描序列的核磁共振腦部影像。為了處理龐大體積並凸顯病理區域,團隊捨棄整張掃描讀取。他們從影像切片中擷取 96×96 大小的 2D 影像區塊,並分別編碼實部與虛部通道。

生成框架的第一階段部署了基於 ResNet 架構的條件變分自編碼器。CVAE(條件變分自編碼器)是一種透過潛在空間壓縮與重建資料的神經網路。它將原始雙通道影像大幅壓縮至 48×48 大小。這種作法不僅能降低後續的運算維度,更保留了實部與虛部之間的數學耦合關係。實驗測量顯示,自編碼器的相位一致性(Phase Coherence)維持在 0.997 以上,成功收錄了關鍵的相位細節。

取得精簡的壓縮特徵後,第二階段導入了流匹配(Flow Matching)技術。這是一種透過逐步在資料加入雜訊,再訓練神經網路預測去噪路徑的新一代生成架構。模型首先學習生成五種不同序列的健康腦部解剖結構。接著它再針對標註好的異常部位進行微調訓練。這套兩階段策略使神經網路在缺乏大量標註資料的條件下,依然具備生成正常與異常腦部組織的精準控制能力。

潛在空間真偽分類:ResNet 鑑別網路 AUROC 僅 0.5

必須確保神經網路不是單純死背訓練集,因此檢驗合成樣本與真實資料的分布吻合程度成為關鍵。研究團隊針對潛在空間(Latent Space)訓練了一組獨立的 ResNet 圖像分類器。這個分類器被指派了明確的單一任務。它必須試圖分辨哪些壓縮特徵是真實掃描得來,哪些是由流匹配模型憑空生成的。

實驗最終交出令人驚豔的成績。對於所有五種掃描序列,鑑別分類器的 AUROC 數值都落在 0.50 到 0.66 之間。在統計學上,這表示神經網路的判斷能力非常接近隨機猜測的 0.5 水平。其中,資料量較大的 AXT1POST 序列獲得 0.555 均值。這顯示生成樣本在該對比序列中極難被鑑別出破綻。

這項嚴格的量化評估證實,合成資料生成的特徵分布已經高度貼近真實情況。由於該真偽測試直接在壓縮過後的潛在空間中進行,排除了影像解碼過程可能引入的修飾與雜訊干擾。這份數據反映出流匹配模型已確實掌握了複雜值 MRI 數據的內在統計規律。它並不僅僅是產生視覺上逼真的像素排列,而是深刻理解了資料結構。

異常腦組織分類:全合成數據 AUROC 達 0.880

為確認合成資料是否保留可用於診斷的腫瘤特徵,團隊推動了下游的驗證實驗。他們將特徵解碼為完整影像,並執行區分正常與異常組織的二元分類任務。在資料替代實驗中,研究人員逐步減少真實訓練資料的比例。同時他們使用相對應數量的合成資料進行一比一填補。這種做法能驗證合成樣本是否具備與真實病歷同等的診斷資訊。

完全依賴全數真實數據訓練的基準分類器,其測試 AUROC 為 0.842。隨著訓練集中合成資料的比例不斷增加,分類表現呈現出人意料的軌跡。模型不但沒有因為失去真實數據而退步,反而呈現全面超越基準的趨勢。最驚人的結果在於,完全使用 100% 合成資料訓練的模型,取得了 0.880 的最高 AUROC 表現

至於在另一組資料疊加實驗中,系統保留所有的真實資料。工程師額外加入生成的合成影像進行強化訓練。當合成資料量達到與真實資料規模等量時,AUROC 數值進一步攀升至 0.894。這份結果證明,流匹配生成的樣本能無縫取代稀缺的標註影像。它還能提供真實數據中未涵蓋的互補特徵,大幅強化神經網路的判斷邏輯。

外部獨立驗證:成功辨識 96 筆切片確認的轉移瘤

雖然演算法在同源的切割資料集上表現優異,卻常面臨跨機構資料泛化能力不足的問題。為了檢視生成品質是否具備真正的穩健性,團隊引進了一組從未公開的外部資料。這批由另一家獨立臨床機構收集的測試集,包含 96 筆掃描影像。每一筆影像都附有切片生檢確認的健康或腦部轉移瘤最終標籤。

面對這項高難度的獨立測試環境,100% 全合成數據訓練的模型依然展現出最強的泛化能力。它順利交出 0.843 的 AUROC 亮眼成績。相較之下,完全使用原機構真實資料訓練的分類器,跨機構預測能力明顯衰退。純真實資料的 AUROC 僅達到 0.815。當兩種資料混合比例達到各 50% 時,表現才逐漸向單純使用真實資料的低基準線靠攏。

檢視模型生成的相位影像,可以發現腫瘤區域呈現明顯的暗色對比。這與振幅影像中的異常結構達成高度的空間吻合。這項成果不只驗證了將被遺棄的相位資訊重新整合至生成流程的可行性。它更建立起穩固的基礎。在未來,這套工具將能協助系統性研究振幅與相位如何共同編碼病理特徵,為無創精準診斷開創新的發展方向。

將長年被捨棄的相位資訊重新引入生成框架,不僅能突破醫療資料稀缺的困境,全合成訓練資料更展現出超越真實資料的異常特徵辨識能力。

補充數據視覺化

異常組織二元分類模型 AUROC 表現對比
測試場景100% 真實資料訓練 (基準)100% 合成資料訓練
測試場景100% 真實資料訓練 (基準)100% 合成資料訓練
測試場景100% 真實資料訓練 (基準)100% 合成資料訓練

Abstract

Objective. Standard Magnetic Resonance Imaging (MRI) reconstruction pipelines discard phase information captured during acquisition, despite evidence that it encodes tissue properties relevant to tumor diagnosis. Current machine learning approaches inherit this limitation by operating exclusively on reconstructed magnitude images. The aim of this study is to build a generative framework which is capable of jointly modeling magnitude and phase information of complex-valued MRI scans. Approach. The proposed generative framework combines a conditional variational autoencoder, which compresses complex-valued MRI scans into compact latent representations while preserving phase coherence, with a flow-matching-based generative model. Synthetic sample quality is assessed via a real-versus-synthetic classifier and by training downstream classifiers on synthetic data for abnormal tissue detection. Main results. The autoencoder preserves phase coherence above 0.997. Real-versus-synthetic classification yields low AUROC values between 0.50 and 0.66 across all acquisition sequences, indicating generated samples are nearly indistinguishable from real data. In downstream normal-versus-abnormal classification, classifiers trained entirely on synthetic data achieve an AUROC of 0.880, surpassing the real-data baseline of 0.842 on a publicly available dataset (fastMRI). This advantage persists on an independent external test set from a different institution with biopsy-confirmed labels. Significance. The proposed framework demonstrates the feasibility of jointly modeling magnitude and phase information for normal and abnormal complex-valued brain MRI data. Beyond synthetic data generation, it establishes a foundation for the usage of complete brain MRI information in future diagnostic applications and enables systematic investigation of how magnitude and phase jointly encode pathology-specific features.