Machine Learning-Based Preoperative Predicting TERT Promoter Mutation and EGFR Gene Amplification Phenotype in IDH Wild-Type Glioblastoma Using Advanced MR Habitat Imaging [RESEARCH]
利用先進磁振造影的「棲地切割」技術,術前無創預測膠質母細胞瘤 EGFR 擴增準確率達 89.5%。
- 結合 ADC 與 CBV 圖將腫瘤實質分割為三個棲地,能剔除雜訊並放大局部致病特徵。
- EGFR 擴增預測模型在獨立驗證集達到 89.5% 準確率,遠優於 TERT 突變的 76.3%。
- 高血流灌注區(高 CBV)的紋理特徵是決定演算法判斷 EGFR 基因狀態的最關鍵因素。
依賴單點立體定位切片決定腫瘤的預後指標,往往面臨高達 20% 的偽陰性取樣誤差。這份發表於 AJNR 的最新研究推翻了只有基因定序才能精準分型的既定印象,研究團隊利用常規與進階磁振造影的「腫瘤棲地」概念,在完全無創的前提下,將術前預測 EGFR 擴增狀態的準確率一口氣拉抬到 89.5% 的極高水準。
179 例 IDH 野生型 GBM 的分層挑戰
自從世界衛生組織針對中樞神經系統腫瘤的分類標準更新後,膠質母細胞瘤的診斷與預後評估發生了根本性的改變。目前,只要診斷為異檸檬酸脫氫酶(IDH)野生型的瀰漫性星狀細胞瘤,即使在常規磁振造影上尚未出現經典的微血管增生或大面積壞死特徵,只要具備特定的分子標記改變,就會被直接升級為最高惡性度的腫瘤。在這其中,端粒酶反轉錄酶(TERT)啟動子突變被公認是導致病患存活期大幅縮短、預後極差的核心指標。
另一方面,表皮生長因子受體(EGFR)基因擴增則被視為極具潛力的預後因子與未來標靶治療的潛在標的。在過去的臨床實務中,放射科醫師主要依靠對比劑增強的 T1 權重影像(CE-T1WI)與 FLAIR 影像來評估腫瘤的侵犯範圍。然而,這兩種基因突變與擴增的狀態,在常規解剖結構影像上幾乎沒有肉眼可辨識的特異性差異。病患往往必須等待神經外科進行大範圍切除或立體定位切片後,再經過數週的基因定序才能確診。
這種時間上的遞延,嚴重影響了術前手術計畫的制定。如果神經外科能在術前確知病患帶有 TERT 突變或 EGFR 擴增,可能會選擇更為激進的切除策略(例如超全切除 supratotal resection),或者及早為病患安排術後的針對性臨床試驗。為了解決這個從影像到基因的診斷斷層,作者團隊收集了 179 名經過病理與基因確診的病患數據,試圖透過進階功能性影像來尋找肉眼看不見的微觀線索。
Table 1 與進階磁振造影的棲地切割
從 Methods 的具體設計來看,這項研究採用了非常嚴謹的資料集分割方式以驗證模型的穩定性。總數 179 名病患被依序劃分為訓練集(112 例)、內部測試集(29 例),以及最具說服力的時間獨立驗證集(38 例)。所有納入的病患在接受任何類固醇或抗腫瘤治療前,均完成了標準的腦部磁振造影,其中必須包含擴散張量影像衍生的表觀擴散係數圖(ADC map)以及動態磁化率對比灌注造影衍生的腦血流體積圖(CBV map)。
這篇研究最精華的技術突破在於放棄了傳統的「全腫瘤輪廓提取」作法,轉而採用 Habitat imaging(把腫瘤依血流與細胞密度切成多塊小分區) 的先進概念。腫瘤內部本來就是高度異質性的微環境,若將囊變區、缺氧核心與活躍邊緣的影像訊號全部平均,往往會稀釋掉真正與基因突變相關的關鍵特徵。因此,研究團隊先將 ADC 圖與 CBV 圖精準對位到 CE-T1WI 上,接著在腫瘤實質區域內進行特徵萃取。
具體而言,系統運用 k-means clustering(一種讓數據自動分群的無監督學習) 演算法,根據像素層級的血流灌注與水分擴散特徵,將看似均勻的腫瘤實質自動劃分為三個具有明確生物學意義的亞區(棲地):第一區是低血流高細胞密度區(ADC 低、CBV 低),代表腫瘤細胞極度密集但新生血管尚未長成的區域;第二區是高血流灌注區(CBV 極高),對應最活躍的微血管增生熱區;第三區則是低血流低細胞密度區(ADC 高、CBV 低),通常代表微觀的間質水腫或即將發生壞死的過渡帶。
| 分組集別 | 樣本數 | 用途 |
|---|---|---|
| 訓練集 (Training) | 112 例 | 建構 RF 模型與特徵篩選 |
| 內部測試集 (Test) | 29 例 | 初步驗證模型效能 |
| 時間獨立驗證集 | 38 例 | 驗證模型在不同時間區間的泛化能力 |
基於 179 例病患的影像集建構
Table 2 呈現 TERT 與 EGFR 的預測數據
把焦點拉到 Results 的核心數據,這三個棲地所提取出的影像組學特徵,被送入 RF(整合多棵決策樹來投票的機器學習) 模型中進行訓練與預測。Table 2 詳細記錄了模型在不同資料集上的表現。在預測 TERT 啟動子突變方面,模型在訓練集的曲線下面積(AUC)達到 0.877,內部測試集為 0.783,而在最具挑戰性的時間獨立驗證集中,AUC 仍能維持在 0.796 的水準。就準確率而言,時間獨立驗證集的準確率達到了 76.3%,展現出中等偏上的臨床參考價值。
然而,該模型在預測 EGFR 基因擴增狀態上的表現更令人驚豔。Table 2 顯示,EGFR 預測模型在訓練集的 AUC 同樣是 0.877,測試集為 0.784。但令人意外的是,在時間獨立驗證集中,其 AUC 逆勢攀升至 0.878,且整體預測準確率高達 89.5%。這樣的數據證明了透過進階磁振造影所定義的腫瘤棲地,幾乎可以直接對應到 EGFR 擴增所引發的巨觀血流與細胞結構改變。
若細看模型的特徵重要性分析,可以發現與高血流灌注區(第二棲地)相關的紋理特徵,在決定 EGFR 擴增狀態的權重中佔據了極大的比例。這在生物學上非常合理,因為 EGFR 擴增本就強烈驅動著血管內皮生長因子的表現,進而促使腫瘤內部生成大量結構異常、通透性極高的新生血管。DSC-PWI 的 CBV 圖完美地捕捉到了這個由基因變異引發的血動力學現象,使得演算法得以精準抓出隱藏在常規影像下的病理特徵。
EGFR 在驗證集的表現異常突出,反映其強烈的血管生成特徵
Figure 4 決策曲線與局部棲地的生物機轉
在探討次群組與臨床實用性的分析中,研究團隊特別使用了 DCA(評估模型在不同風險閾值下能帶來多少淨利益) 來檢驗這套預測系統是否真的能幫助病患。Figure 4 畫出了兩種預測模型的決策曲線,結果顯示,只要臨床醫師對於偽陽性與偽陰性的容忍閾值設定在 10% 到 80% 之間,使用這套棲地預測模型來指導醫療決策,其帶來的淨臨床收益將全面超越「預設所有人都突變」或「預設所有人都不突變」的盲目策略。
這裡有一個極具價值的反直覺現象值得放射科同行深思:為什麼 EGFR 的驗證集準確率能逼近九成,而 TERT 的準確率卻停留在七成五左右?這涉及到這兩種基因在腫瘤演化過程中所扮演的不同角色。EGFR 擴增是一種強大的生長訊號,它直接改變了腫瘤的實體代謝與微血管結構,這些改變會劇烈且直接地反映在 CBV 與 ADC 數值的空間分布上。相對地,TERT 啟動子突變主要賦予腫瘤細胞無限分裂的「永生化」能力,它對血流灌注或水分子擴散的直接影響可能較為間接,更多是表現在整體腫瘤的異質性紋理上。
此外,雖然論文將重點放在演算法的成功,但也間接突顯了進階影像技術的價值。如果今天僅憑藉常規的 CE-T1WI 與 FLAIR 進行全腫瘤的影像組學分析,其 AUC 通常難以突破 0.70 的瓶頸。將腫瘤切分成具有生物學意義的局部棲地,等於是幫機器學習模型戴上了濾鏡,讓它不再受到大面積壞死區或均勻增強區的雜訊干擾,而是專注於分析最致命、最活躍的那一小塊微環境。
單中心 DSC 影像的限制與臨床落地
儘管這項研究為神經放射學帶來了極具潛力的無創診斷工具,但我們在臨床實務上仍需清楚認知其適用邊界。首先,這是一項單中心的回溯性研究,雖然具備時間獨立的驗證集,但所有影像皆來自同一套掃描器硬體與造影機型。DSC-PWI 對於對比劑的注射速率、病患的心臟輸出量,以及軟體在處理對比劑滲漏校正(leakage correction)時所使用的數學模型都極為敏感。如果直接將這套演算法搬到不同廠牌的機器或採用不同參數的醫院,其預測準確率必然會出現波動。
其次,我們在判讀時必須確認病患是否具備完整的 ADC 與 CBV 影像品質。只要病患有嚴重的金屬假影、明顯的頭部運動干擾,或是對比劑注射失敗導致 CBV 曲線計算異常,這套基於棲地切割的預測模型就會完全失效。再者,這套系統的定位並非完全取代病理切片,畢竟高達 10.5% 的 EGFR 預測錯誤率在決定標靶藥物使用時仍是不可承受之重。
對於放射科醫師而言,這項研究最大的實質貢獻在於「空間導航」。未來在打報告時,我們不只要量測腫瘤的最大徑,更應該學會疊加 CBV 與 ADC 圖,主動為神經外科標示出「高 CBV 且低 ADC」的高風險棲地區域。這不僅能大幅降低立體定位切片的偽陰性率,確保外科醫師的探針精準命中帶有最惡性基因變異的細胞聚落,也能為後續的放射線治療提供更精確的劑量加強(dose painting)靶區。
下次看到未見明顯壞死但局部 CBV 異常飆升的 IDH 野生型腫瘤,請直接在報告建議神外針對該熱區進行切片,這極可能就是 EGFR 擴增的藏匿點。