Multiclass Radiomics-Based Prediction of BRAF Mutation Status in Pediatric Low-Grade Gliomas Using Multisequence MRI [PEDIATRIC NEUROIMAGING]
只需常規 FLAIR 影像,AI 就能以 0.82 的準確率預測兒童腦瘤 BRAF 突變型,免除高風險腦幹活檢。
- 預測 BRAF 突變時,常規 FLAIR 序列的 AUC 高達 0.82,表現超越打藥的 CE-T1WI (0.75)。
- 結合 FLAIR、T2、ADC 與 T1C 的 180 人集成模型達 AUC 0.79,能更平衡地辨識三種基因型 (p<0.001)。
- 無創影像體學可取代深層高風險腫瘤(如視神經、腦幹)的實體活檢,直接導引 MEK/BRAF 標靶用藥。
預測兒童低惡性度神經膠質瘤的基因型,常規 FLAIR 序列的預測力高達 AUC 0.82,竟然直接擊敗了打顯影劑的 T1 影像(AUC 0.75)。面對 BRAF 突變這個決定標靶藥物選擇的關鍵分水嶺,我們不需要依賴高階灌注影像或等待耗時的活體切片病理報告。只靠機器學習萃取常規多序列磁振造影的特徵,就能以高達 0.79 的集成模型準確率,在術前預先分辨出三種不同的分子亞型,直接改變臨床治療決策的路徑。
BRAF 突變的 pLGG 治療與標靶分水嶺
兒童神經腫瘤學的領域中,pLGG(兒童低惡性度神經膠質瘤)是最常見的腦部原發性腫瘤。過去我們在閱片時,往往只停留在區分腫瘤的解剖位置與形態學特徵,但在精準醫療時代,分子病理才是決定病童命運的真正樞紐。高達一半以上的 pLGG 帶有 BRAF 基因的變異,其中又以 KIAA1549-BRAF 融合(fusion)與 BRAF V600E 點突變這兩種亞型最為大宗。這兩者雖然都牽涉 BRAF 路徑,但對應的後續治療策略卻截然不同。
從臨床用藥的角度來看,帶有 BRAF 融合變異的腫瘤通常對 MEK 抑制劑反應良好;而帶有 BRAF V600E 突變的患者,則需要使用特定的 BRAF 抑制劑(如 dabrafenib)才能達到最佳療效。若是將藥物用反或用在 non-BRAF(野生型)的患者身上,不僅無效,還可能引發嚴重的反彈或副作用。這使得術前或術後確認 BRAF 狀態成為神經腫瘤科醫師最迫切的需求。
然而,這些低惡性度腫瘤經常長在視神經路徑、下視丘、視丘或腦幹等深層且致命的解剖位置。在這些區域進行開顱手術或立體定位活體切片,往往伴隨極高的神經功能損傷風險,有時甚至根本無法取得組織。這就衍生出一個明顯的醫療痛點:當病理科醫師無法拿到檢體時,我們該如何決定標靶藥物?
影像醫學在此刻接下了這個重擔。既然不同基因變異會導致微觀細胞密度、血管新生與基質排列的差異,這些微小的組織學特徵理應會反映在巨觀的 MRI 訊號紋理上。因此,研究團隊決定導入 radiomics(從影像自動抽上千個量化特徵)技術,試圖透過無創的機器學習模型,直接從例行掃描的 MRI 影像中解碼出 BRAF 的突變狀態,藉此免除高風險的切片手術。
511 例兒童腦瘤與 PyRadiomics 特徵萃取
為了建立具備統計說服力的模型,本研究採用了嚴格的雙機構回顧性設計,收集自 2009 年 1 月至 2023 年 1 月間,具備完整術前 MRI 且已知明確 BRAF 基因型病理報告的病童。經過篩選,最終納入了 511 位 pLGG 病患,平均年齡為 8.5 歲(標準差 5.1 歲),其中女性佔 45%。這個樣本量在兒童神經腫瘤的影像體學研究中,已屬於相當龐大的規模。
若檢視這 511 例的分子亞型分佈,完全符合真實世界的流行病學比例:最大宗為 BRAF fusion 佔 44.6%(223 例),其次是 non-BRAF 佔 34.4%(172 例),而 BRAF V600E 則佔 21.0%(105 例)。研究團隊的目標是建立一個能同時區分這三種類別的多類別分類器(multiclass classifier),而非單純的二元分類,這大幅增加了機器學習任務的複雜度與臨床實用價值。
在影像處理流程上,研究人員由放射科專家針對腫瘤邊界進行了耗時的逐層手動圈選(manual segmentation),建立精準的感興趣區域(ROI)。接著,他們利用 PyRadiomics 套件從四種常規序列中提取特徵。這些特徵包含了形狀學特徵、一階直方圖統計(反映訊號強度的分佈),以及高階紋理特徵如 GLCM 等(反映相鄰像素間的空間關聯性與異質性)。這些肉眼難以察覺的數字,成為後續餵給 AI 的關鍵原料。
模型建置階段,團隊選擇了 Random Forest(建立多棵決策樹並多數決的模型)作為主力演算法。為了防止模型在有限樣本下產生過度擬合(overfitting),他們採用了嚴謹的 LOOCV(每次留一筆測試其餘訓練的驗證法)。他們分別訓練了純臨床變數模型、單一序列影像模型、以及結合臨床與影像特徵的混合模型,藉此全面評估 MRI 究竟能為基因預測帶來多少額外的加值。
| 分子亞型 | 病患人數 | 佔比 | 常見臨床與影像特徵 |
|---|---|---|---|
| BRAF fusion | 223 例 | 44.6% | 毛狀星狀細胞瘤居多、對 MEK 抑制劑反應佳 |
| BRAF V600E | 105 例 | 21.0% | 局部細胞密度較高、需使用特定 BRAF 抑制劑 |
| non-BRAF (野生型) | 172 例 | 34.4% | 非典型表現、缺乏針對 BRAF 途徑之標靶標的 |
反映真實世界流行病學比例,為本研究的三類別預測基礎
Table 2 揭示單一 FLAIR 序列的 0.82 預測力
分析單一序列的表現時,研究團隊得到了一個令許多放射科醫師意外的結果。在影像學中,我們經常認為施打顯影劑的 T1 影像最能反映腫瘤的活躍程度與血腦屏障破壞情形;然而在預測 BRAF 突變的任務上,Table 2 顯示 FLAIR 序列以高達 AUC 0.82 的表現奪下冠軍。
緊追在 FLAIR 之後的是 T2WI(AUC 0.80),接著是反映水分子擴散受限程度的 ADC 參數圖(AUC 0.77),而大家最常依賴的 CE-T1WI(打藥 T1)反而墊底,AUC 僅有 0.75。這裡的 AUC 數值,指的是 macro-average(將各類別權重均等化計算的平均值)的一對其餘(one-vs-rest)表現,代表模型在不偏袒多數類別(fusion)的情況下,對三種基因型都有均衡的辨識能力。
探究其背後的生理機制,其實相當合理。兒童低惡性度膠質瘤的顯影狀態本就變化多端,有些 V600E 突變的腫瘤可能強烈顯影,但也有些完全不亮;因此 CE-T1WI 提供的訊號變異太大,缺乏穩定的基因特異性。相反地,FLAIR 序列不僅抑制了腦脊髓液的亮訊號,還極度敏銳地捕捉了腫瘤邊緣的非顯影浸潤區(non-enhancing infiltration)與瘤周水腫的微觀基質變化,這些恰好是區別 V600E 與 fusion 的絕佳紋理特徵。
此外,研究也發現,若單獨只用臨床資料(如年齡、性別、腫瘤位置)來預測,準確率相當有限。但當模型採取「臨床特徵 + 影像體學」的結合策略時,其表現穩定超越了任何單一來源的模型。這證實了放射科醫師常規判讀時將病人基本資料與影像紋理綜合考量的直覺,在演算法層面同樣成立。
資料來源:Table 2 (FLAIR 序列因能敏銳捕捉瘤周浸潤與水腫,表現最佳)
Figure 3 展現 180 例多序列集成模型的平衡優勢
雖然單一 FLAIR 序列在所有病患(495 人有 FLAIR)中拿下了 0.82 的高分,但我們在臨床上通常會掃描完整的 MRI 協議。為了探討多序列融合的效益,研究團隊特別篩選出一個 180 人的次群組,這些病童同時具備品質良好的 FLAIR、T2WI、ADC 與 CE-T1WI 全部四種影像。
在這個嚴格的 180 人多序列世代中,Figure 3 畫出了多序列特徵串聯(Feature concatenation)與集成模型(Ensemble modeling)的綜合表現,兩者的 macro-AUC 均為 0.79。你可能會疑惑,為什麼這裡的 0.79 反而低於前面提到的單一 FLAIR 0.82?作者解釋,這主要歸因於樣本數從將近 500 人大幅縮減到 180 人,且這 180 位同時具備四種影像的病患可能本身在疾病複雜度上就有系統性的差異。
然而,這個多序列模型的最大價值在於它的「類別平衡能力」。在僅依靠單一序列時,模型很容易因為訓練資料的不平衡,而過度傾向預測最大宗的 BRAF fusion。但當引入了多序列數據後,統計結果顯示多序列模型的預測力顯著優於該次群組內的任何單一序列(p < 0.001)。
細看特徵重要性的權重分佈,雖然 FLAIR 提取的紋理特徵依舊佔據主導地位,但 T2WI 補充了腫瘤囊變區的內部結構細節,ADC 則精準反映了 V600E 亞型中常見的局部細胞密度上升,而 CE-T1WI 則補足了血流灌注的邊緣資訊。這四者的結合,使得機器學習分類器在面對最難纏的少數類別(如非典型表現的 non-BRAF 野生型)時,大幅降低了誤判率,展現出更穩健的泛化潛力。
手動圈選的限制與神經放射科的實務應用
從 Discussion 中,作者坦承了這項研究的幾個適用邊界。首先,作為一項回顧性研究,不同年份、不同廠牌 MRI 機台以及不同掃描參數(如切片厚度、TR/TE 時間)的異質性,必然會對影像體學特徵的穩定性造成干擾。雖然這反映了真實世界的常態,但未來要將模型封裝成醫療軟體,仍需要更大型的前瞻性、多中心外部驗證。
其次,本研究依賴神經放射科醫師進行全人工的 3D 腫瘤圈選。在日常高壓的工作環境下,我們不可能要求醫師為每個病童花二十分鐘慢慢畫腫瘤邊界。未來若要落地應用,勢必需要結合如 nnU-Net(自動調架構的切割框架)等深度學習模型來進行前端的自動圈選,再接上後端的基因型預測分類器,才能打造出順暢的自動化工作流。
對於忙碌的放射科同行而言,這篇論文提供了非常具體的臨床指引。當我們在小兒神經門診看到位於視交叉、下視丘或是腦幹的 pLGG 復發或進展,且神經外科判定不適合進行切片時,我們不應只在報告上寫「腫瘤變大」。我們應該意識到,手邊現有的 FLAIR 影像中其實已經蘊含了 BRAF 突變的密碼。
未來,隨著這類影像體學工具的普及,我們不僅是診斷影像的解讀者,更是決定病童該不該直接啟動 MEK 或 BRAF 抑制劑治療的關鍵參謀。了解 FLAIR 在紋理特徵上的統治級表現,將改變我們在優化兒童腦瘤 MRI 掃描協議時的優先順序。
下次看到無法活檢的視神經路徑膠質瘤,請確保 FLAIR 序列沒有假影且切面夠薄,它的紋理訊號比打藥 T1 更能暗示 BRAF 基因型,是你決定標靶藥物方向的最佳底牌。