Combination of quantitative MRI and laboratory markers for the detection and staging of metabolic dysfunction-associated steatotic liver disease

View Original ↗
AI 導讀 academic MR 重要性 4/5

四項 MRI 指標結合抽血竟無法打敗單一磁振彈性成像?解密 MASLD 最適分期策略。

  • 結合 cT1、MRE-G' 與肝指數預測 fibro-MASH 達 AUC 0.81,但無顯著勝過既有血清計分。
  • 病理特徵高度關聯:PDFF 最反映脂肪 (R=0.66);MRE-G' 最精準捕捉氣球變性與纖維化。
  • 對抗重度纖維化 (≥F3),單看 MRE-G' (AUC 0.78) 的統計效力足以媲美加入腰圍與抽血的複雜模型。

結合四項進階磁振造影與抽血指標,偵測重度纖維化雖能達到 AUC 0.84,但統計上卻無法擊敗單純的磁振彈性成像甚至傳統超音波彈性掃描。這項涵蓋 88 位脂肪肝病患的前瞻性研究點出一個現實:追求極致的多參數複合模型,在臨床實務上未必能帶來顯著的額外效益。

擺脫切片依賴的非侵入性 MASLD 分期

全球約有 30% 的成年人患有 MASLD(代謝功能異常相關脂肪性肝病),這使其成為導致慢性肝病併發症(如肝硬化與肝細胞癌)最快速增長的元兇。疾病譜從單純的脂肪肝,一路惡化至 MASH(代謝功能異常相關脂肪性肝炎),最終引發不可逆的纖維化。針對這類病患,肝臟切片長期被視為診斷與分期的黃金標準。然而,切片具有侵入性風險、潛在的取樣誤差,且病理科醫師之間的判讀往往存在極大差異。

為了尋找非侵入性的替代方案,放射科領域近年大幅推廣 qMRI(量化磁振造影),試圖直接在影像上量化組織代謝與結構的改變。先前的零星研究證實單一 qMRI 技術有效,例如用脂肪分率看脂肪、用 T1 映射看發炎。更有學者提出如 MAST 分數(結合 MRI 與抽血 AST)等複合模型。

然而,究竟是單純依賴一台高階 MRI 足夠,還是把實驗室數據、人體測量值與血液生物標記全部混在一起算一個「無敵分數」比較好?過去一直缺乏頭對頭的全面比較。本研究的主要目標,就是評估單一 qMRI 參數,以及將其與多項 NITs(非侵入性測試)結合後,在偵測 fibro-MASH(纖維化脂肪性肝炎)、大於等於 F2(顯著纖維化)與大於等於 F3(重度纖維化)時的精準度差異。

這對於每天被龐大掃描量淹沒的放射科醫師來說至關重要:我們需要知道,為了微小的準確率提升而讓病患去做全套抽血與複雜的高階掃描,是否真的符合成本效益。

荷蘭前瞻世代的四種量化磁振技術交鋒

從研究設計來看,這是源自荷蘭阿姆斯特丹 ANCHOR 世代的前瞻性隊列分析。在 2018 年 9 月至 2024 年 1 月期間,研究團隊共招募了 91 位在腹部超音波或 VCTE(超音波測量肝臟硬度與脂肪衰減)上顯示有肝臟脂肪變性的門診成人病患。病患需禁食至少 4 小時,並接受抽血、VCTE 檢查,以及最重要的單次 3T MRI 掃描。所有受試者均接受標準化的超音波導引經皮肝臟切片,由兩位病理學家盲視進行 SAF 評分(評估脂肪、發炎活動度與纖維化),其中 88 位最終確診為 MASLD 並納入預測模型。

放射科同行需特別留意他們採用的四項高階 qMRI 序列。首先是 PDFF(用質子密度精準換算脂肪分率),透過多回訊梯度回波取得。其次是 MRE(用聲波震動磁振測量組織彈性),操作時在病患劍突高度放置 50Hz 頻率的重力傳感器。第三是 IVIM-DWI(用多重 b 值擴散權重區分血流與水擴散),以自由呼吸方式擷取 18 個 b 值。最後則是導入商業軟體 LiverMultiScan 的 cT1(用軟體校正鐵質干擾的 T1 弛豫時間),用於捕捉發炎與游離水分。

影像後處理極度仰賴人工與半自動演算法的配合。擁有 4 年經驗的分析師手動避開大血管與膽管圈選 ROI。MRE 數據會剃除非線性大於 50% 的不可靠體素,計算出 MRE-Gabs(剛性)、MRE-G'(彈性模量)與相位角。IVIM 數據則丟進開源的深度學習網絡 IVIM-NET 算出擴散係數(D)與灌注分率(f)。若遇到數據缺失,團隊採用了 MICE 多重插補法進行補齊。

這 88 位病患並非早期的輕度脂肪肝,而是一個高度代謝異常的群體。數據顯示,高達 27.3% 的人處於 S3 重度脂肪變性,69.3% 符合 fibro-MASH 的嚴格標準,且有 39.8% 已經達到大於等於 F3 的重度纖維化。這種中重度偏倚的世代,恰好是臨床上最迫切需要精準攔截的高風險目標。

ANCHOR 世代研究流程與納入條件
收案與病理特徵數量與比例
初篩總人數91 位門診病患
最終納入分析88 位 (切片確診 MASLD)
重度脂肪變性 (S3)27.3%
纖維化脂肪性肝炎 (Fibro-MASH)69.3%
重度纖維化 (≥ F3)39.8%

本群體屬於高度代謝異常世代

Table 2 複合分數與單一指標的 AUC 擂台

把焦點轉向核心的預測表現,透過五折交叉驗證(5-fold cross-validation)運算,研究團隊測試了無數種排列組合。針對臨床最在意的 fibro-MASH 診斷,單一指標中表現最好的是血液計分 MAF5(AUC 0.76 $\pm$0.13),緊接著是影像學的 MRE-G'(AUC 0.73 $\pm$0.14)與 cT1(AUC 0.72 $\pm$0.04)。

團隊隨後利用邏輯斯迴歸打造了一個號稱最強的四重複合模型,公式包含了 cT1、MRE-G'、AST 與 ALT。這個組合乍看之下極具說服力,將發炎、組織彈性與肝功能損害一網打盡,其 AUC 確實提升到了 0.81。然而,若仔細檢視 Table 3 中與其他既有 NITs 的 DeLong 檢驗對比,這個費盡心機收集四項數據的模型,其 AUC 0.81 (95% CI: 0.71–0.91) 在統計學上並沒有顯著勝過 MAF5 的 0.76 (p=0.441),也沒有贏過同樣結合 cT1 的 cTAG 分數 (AUC 0.75, p=0.284),甚至與常規的 FAST 評分相比 (AUC 0.72) 亦無統計差異 (p=0.130)。

在區分大於等於 F2(顯著纖維化)的任務上,情況如出一轍。由 MRE-G'、ALT 與腰圍組成的複合模型達到了 AUC 0.90(單獨模型集)與 0.84(全世代)。但如果單純只讓病患去做超音波 VCTE-LSM,其 AUC 也有 0.82。經過統計比對,耗資做 MRI 再加量腰圍的複合分數,依然無法以顯著優勢 (p=0.792) 擊倒傳統的超音波彈性測量。

到了偵測大於等於 F3(重度纖維化)的關卡,由 MRE-G'、AST、ALT 與腰圍組成的模型獲得了 AUC 0.84 (95% CI: 0.75–0.93)。這一次,它成功地在統計上壓倒了 MAF5 (AUC 0.73, p=0.031) 與 FIB4 (AUC 0.73, p=0.025)。但令人意外的是,它仍然沒有贏過單純只看 MRE-G' 一項指標的表現 (AUC 0.78, p=0.168),也沒有勝過抽血的 NFS 分數 (AUC 0.79, p=0.210) 或 ELF 測試 (AUC 0.75, p=0.123)。

複合分數 vs 既有非侵入測試 (AUC 擂台)
偵測目標最佳複合模型 AUC對比之單一或既有指標 AUCp 值 (是否顯著勝出)
Fibro-MASH0.81 (cT1+MRE-G'+AST+ALT)MAF5: 0.760.441 (無顯著差異)
Fibro-MASH0.81 (cT1+MRE-G'+AST+ALT)FAST 評分: 0.720.130 (無顯著差異)
顯著纖維化 (≥F2)0.84 (MRE-G'+ALT+腰圍)VCTE-LSM (超音波): 0.820.792 (無顯著差異)
重度纖維化 (≥F3)0.84 (MRE-G'+AST+ALT+腰圍)MAF5: 0.730.031 (顯著勝出)

複合分數未能在 p 值檢驗中橫掃千軍

Figure S6 揭示病理特徵與影像數據的強關聯

為何辛辛苦苦打造的複合分數,在統計上難以橫掃千軍?如果我們深挖補充資料的 Figure S6 與 Spearman 相關係數,就能看懂背後的生理機制與數據重疊現象。這項分析展示了單一 qMRI 技術其實已經具備極高的病理特徵穿透力,不需要依靠別人。

在脂肪變性(Steatosis)的量化上,PDFF 展現了統治級的準確度,與病理切片呈現最高的正相關(R=0.66, p<0.001),緊追在後的是反映水分子環境改變的 cT1(R=0.62, p<0.001)。

針對臨床最棘手、難以用非侵入性方式捕捉的「肝細胞氣球變性」(Hepatocyte ballooning,反映急性肝損傷與 MASH 活性),影像彈性指標大放異彩。MRE-G' 呈現全場最高的相關係數 0.45 (p<0.001),MRE-Gabs 也有 0.42 (p<0.001)。更驚人的是,單看 cT1 就能以 p<0.001 的顯著水準,區分出病患究竟是沒有氣球變性(分數 0),還是已經出現氣球變性(分數大於等於 1)。

至於纖維化程度,MRE-G' 與抽血計算的 FIB4 雙雙並列第一,相關係數均高達 0.54 (p<0.001)。有趣的是,小葉內發炎(Lobular inflammation)這項病理特徵雖然與纖維化呈正相關,但在本世代中卻無法與任何一項非侵入性標記產生顯著連結。作者推測,這是因為該群體的小葉內發炎變異度太小,導致訊號被掩蓋。

從這些次群組關聯可以發現一個關鍵:當細胞因脂質毒性腫脹受損時,會同時導致組織剛性增加(MRE 數值上升)與游離水增加(cT1 數值上升)。因此,當你把 MRE 與 cT1 同時丟進多變量邏輯斯迴歸時,它們反映的是同一條生理路徑的變化,變數間產生了高度冗餘(Redundancy)。這解釋了為何 1+1 常常小於 2,複合模型的 AUC 雖然表面數字好看,卻難以在嚴格的 p 值檢驗中拉開與單一強勢指標的差距。

進階模型應用邊界與臨床常規流程的妥協

在 Discussion 階段,作者坦白了幾項影響臨床導入的限制條件。首先,這是一個只有 88 人的單中心研究,並且使用同一批數據來生成模型與驗證模型,這無可避免地會導致複合分數的診斷表現被高估。其次,研究並未深入探討這四種 qMRI 技術在不同機器、不同日期的重現性(Reproducibility),而這恰好是放射科建置臨床常規 protocol 時最在意的穩定度指標。

再者,現實中執行複雜的 MRI 協議必然會面臨失敗。本研究中有 8 位病患的 MRE 品質被判定為不合格,7 位的 cT1 遭遇假影或鐵質過載無法量化,另有少數 PDFF 與 IVIM 掃描缺漏。研究團隊動用了預測均值匹配(PMM)來插補這些遺失數據。雖然符合統計規範,但也暗示了在真實世界的急診或高通量門診中,強求病患做滿四套 qMRI 是不切實際的。

此外,目前的統計模型將疾病狀態強行二分法(例如小於 F3 對決大於等於 F3),這抹煞了肝臟纖維化作為一種連續光譜的本質。未來若能改用有序迴歸(Ordinal regression),或許能更細緻地呈現 qMRI 的價值。儘管如此,這篇論文仍奠定了一個重要基石:我們確知 qMRI 能看透疾病的連續變化,且不需要依賴危險的切片。

對於一線放射科醫師而言,這套研究結果提供了一個清晰的減法哲學。面對疑似 MASLD 需要分期的病患,我們大可不必陷入「一定要算出某個複雜縮寫分數」的迷思。現有的超音波 VCTE 作為第一線守備已十分稱職;當遇到嚴重肥胖導致超音波失真,或面臨啟動昂貴抗纖維化藥物的決策十字路口時,直接安排包含 MRE 與 PDFF 的 MRI 協議即可。

即便你不知道病患的腰圍,也沒有他的 AST/ALT 抽血報告,單憑 MRE 測得的肝臟彈性 G' 值,在統計意義上就已經具備了與複雜複合模型同等級的診斷火力。把有限的掃描時間與後處理精力,投資在確保單一 MRE 影像的波傳導品質與無假影 PDFF 擷取上,才是提昇看片效率與臨床貢獻度的最佳策略。

報告遇到脂肪肝排 MRI 分期時,確保 MRE 波傳導品質並單獨給出 G' 彈性數值,其臨床決策力已等同費時收集的四重綜合分數,不需硬等抽血結果出爐。

≥ F3 重度纖維化之模型表現比對

單純依靠影像仍保有強大競爭力

Abstract

Objectives Metabolic dysfunction-associated steatotic liver disease (MASLD) is increasing both in numbers and severity worldwide. Non-invasive alternatives to liver biopsy, particularly for the detection of metabolic dysfunction-associated steatohepatitis (MASH), have proven difficult to establish. We aimed to assess whether quantitative MRI (qMRI) alone and in combination with laboratory and anthropometric measurements and other non-invasive tests (NITs) can detect stages of MASLD. Materials and methods In this single-center prospective cohort study, 91 participants with hepatic steatosis on ultrasound or vibration-controlled transient elastography were enrolled in the outpatient clinics between September 2018 and January 2024. Patients underwent blood sampling, qMRI and liver biopsy. Non-invasive parameters were correlated with histopathology in all 91 participants, of whom 37 were reported previously. Prediction models for advanced steatosis (S3), MASH, fibro-MASH (S ≥ 1, lobular inflammation ≥ 1, hepatocyte ballooning ≥ 1 and F ≥ 2), significant (≥ F2) and advanced (≥ F3) fibrosis were designed based on 88 MASLD patients. Results MR elastography (MRE)-derived elasticity (MRE-G’), MRE-derived stiffness (MRE-Gabs) and LiverMultiScan® iron-corrected T1 (cT1) correlated with hepatocyte ballooning (Spearman’s R: 0.45 (p &lt; 0.001); 0.42 (p &lt; 0.001); 0.38 (p &lt; 0.001)). Prediction models for ≥ F3 outperformed MAF5 and FIB4, but did not outperform ELF or NFS. A model combining cT1, MRE-G’, aspartate aminotransferase and alanine aminotransferase yielded an AUC of 0.83 (95% CI: 0.74–0.93) for fibro-MASH, not outperforming FibroScan-AST-score (FAST) or cT1-AST-fasting glucose score (cTAG) (p = 0.130; p = 0.284). Conclusion qMRI parameters are able to differentiate degrees of MASLD severity. Generally, the addition of other available measurements did not significantly improve accuracy compared to individual qMRI parameters or established NITs. Key Points Question Refinement of non-invasive tools is needed to accurately stage metabolic-associated steatotic liver disease (MASLD), particularly progressive disease and significant and advanced fibrosis. Findings Quantitative MRI has good diagnostic accuracy to stage MASLD. The combination of MRI parameters with laboratory and anthropometric measurements has limited additional benefit. Clinical relevance This research provides valuable insights for clinicians seeking to reduce reliance on liver biopsy. The findings could be applied in clinical settings to guide earlier, less invasive diagnosis and disease monitoring, allowing for timely interventions and more personalized treatment strategies. Graphical Abstract