Can qualitative subfield analysis on high-resolution MR predict histopathology subtypes of hippocampal sclerosis? [ORIGINAL RESEARCH]
3T MRI 極難預測 ILAE 海馬迴分型,其準確度僅夠用來排除單純神經膠質增生。
- 肉眼判讀 3T 影像共識度極高(Kappa 0.77),但與病理結果的一致性慘跌至 0.32。
- 預測單純神經膠質增生特異度高達 97.9%,這是影像上少數能明確鑑別的型態。
- 預測最常見的 Type 1 敏感度僅 75.3%,發報告時避免過度推測次分型以免誤導。
用 3T MRI 評估海馬迴硬化分型,兩位醫師判讀一致性高達 Kappa 0.770,但對上病理金標準卻慘跌至 0.328。這項 106 例研究顯示,除了辨識神經膠質增生,常規影像完全無法預測 ILAE 次分型。
手術決策前:ILAE 海馬迴硬化分型的預測需求
面對難治型內側顳葉癲癇(Mesial Temporal Lobe Epilepsy, MTLE),手術切除病灶往往是控制癲癇發作的最後防線。而在這些病患的組織切片中,最常見的病理發現便是海馬迴硬化(Hippocampal Sclerosis, HS)。國際抗癲癇聯盟(ILAE)針對海馬迴內部神經元流失的不同型態,提出了一套奠基於顯微鏡病理學的標準化分類系統。這套系統將海馬迴硬化明確分為四大類:Type 1 影響的解剖範圍最廣泛,主要在 CA1(Cornu Ammonis 1)與 CA4 區域出現嚴重神經元流失;Type 2 則是局部損傷,僅局限於 CA1 出現嚴重凋亡;Type 3 則局限於 CA4 區域受損;最後還有一種是沒有明顯神經元流失、僅有神經膠質增生(Gliosis Only, 簡稱 GO 型)的特殊型態。
對神經內科與神經外科醫師而言,這套分型絕不只是一個學術上的標籤,它直接關乎病患術後的無癲癇發作(seizure-free)機率與長期認知功能預後。過往的大規模臨床研究已經明確指出,ILAE Type 1 的病患在接受前顳葉切除術後,癲癇獲得控制的成效遠優於 Type 2 或 Type 3 的病患。此外,不同次分區的神經元流失,伴隨的術後記憶衰退風險也有顯著的個體差異。因此,如果放射線科醫師能在病患進開刀房前,就先透過磁振造影準確預測出海馬迴硬化的次分型,這無疑將大幅改變手術計畫、切除範圍的拿捏,以及對病患與家屬術後期待的衛教工作。
然而,現實情況是,目前的放射科常規報告往往只停留在「有無」海馬迴硬化的二分法層次。我們會仔細觀察整體海馬迴的體積是否萎縮,以及 T2 訊號是否異常增高,卻鮮少在報告中提及 CA1 或 CA4 等次分區的具體受損狀態。要用肉眼在黑白灰階的二維影像上,準確區分厚度僅有幾公釐的次分區萎縮程度,是一項極具挑戰性的任務。這不僅需要高解析度的影像掃描硬體支援,更嚴格考驗著判讀者的閱片經驗。作者團隊正是看到了這個臨床需求與影像現況之間的差距,試圖探討在現代 3T 造影技術下,放射科醫師單憑肉眼(qualitative assessment)是否足以準確預測出病理學家在顯微鏡下才能確診的 ILAE 分型。
106 例高解析度 3T 影像與病理切片的正面對決
從研究的方法學來看,這是一項在單一第三級醫學中心進行的完整回顧性觀察研究。為了確保影像特徵與組織病理能達到完美的空間對應,研究團隊設定了極其嚴苛的收案條件。從 2018 年 1 月到 2023 年 6 月這五年半的期間內,共有 106 位患有單側內側顳葉硬化且擁有明確組織病理學確診的病患被納入這項分析。這些受試者的平均年齡落在 23.8 歲,其中包含 57 位男性。這樣的年輕發病年齡與性別分佈,高度吻合典型難治型內側顳葉癲癇準備接受手術評估的族群特徵。
在影像採集方面,所有被納入研究的病患都必須在術前接受同一台 3T 磁振造影儀器的掃描,並且確實執行高解析度的癲癇專用造影條件(high-resolution epilepsy protocol)。在這個造影方案中,最核心的序列是垂直於海馬迴長軸切面的高解析度二維冠狀面 T2 加權影像(2D coronal T2-weighted sequence)。這個序列的切面厚度被設定得極薄,目的就是要盡可能拉開海馬迴內部各個微小次分區(例如 CA1 到 CA3 區域、CA4 與齒狀回複合體、下海馬回 Subiculum,甚至是內嗅皮質 Entorhinal cortex)的組織對比度,讓肉眼評估微觀體積流失成為一種可能。
為了檢驗這種判讀方式在臨床實務上的可重複性,研究團隊特別安排了兩位神經放射科專家進行盲性判讀。他們在完全不知道患者臨床病史與病理結果的情況下,獨立評估高解析度影像上各個海馬迴次分區的體積流失嚴重度,並綜合這些視覺線索,推斷出該病患屬於 ILAE 1 到 3 型或是 GO 型。當這兩位醫師的判讀意見出現分歧時,會交由第三位資歷更深的神經放射科專家介入,進行最終的共識裁決。這樣的多重把關設計,有效排除了單一觀察者的主觀偏差,更能真實反映出整體放射科團隊在面對這類高難度影像時的平均判斷力。
相較於過往許多重度依賴自動化軟體(例如 FreeSurfer(自動化腦部體積測量軟體))進行體積量化的文獻,本篇研究刻意選擇了定性評估。這個研究角度非常接地氣,因為在每天面對海量待閱影像的放射科工作站前,醫師不可能對每一個疑似癲癇的個案都跑過耗時數小時的自動化運算。這項研究正是要直接測試放射科醫師最基礎的視覺看片功力,是否真的足以勝任次分型的精準預測。
Kappa 值 0.770 與海馬迴病理切片的對比
把焦點拉到結果數據,這 106 位病患的最終組織病理學金標準顯示,最嚴重的 ILAE Type 1 是壓倒性多數,共有 89 例。相較之下,Type 2 僅有 2 例,Type 3 有 4 例,而沒有明顯神經元流失的 GO 型則有 11 例。而在磁振造影的術前預測方面,放射科醫師團隊經過共識後,在報告中給出的預測分佈為:Type 1 共 71 例、GO 型 16 例。單從大群體的統計比例來看,影像預測似乎成功抓到了 Type 1 是最大宗的整體趨勢,但細看每一例診斷的精準對位,卻浮現了令人震撼的對比。
在呈現一致性的數據表(Table 2)中顯示,這是一個極具指標意義的正面數字:兩位神經放射科醫師之間的共識度(interobserver agreement)Cohen’s kappa 值高達 0.770(P < 0.01)。在統計學定義上,大於 0.75 通常被視為良好甚至極佳的一致性。這代表兩位受過嚴謹訓練的醫師,在看著同一張高解析度 3T T2 影像時,對於各區塊有沒有萎縮以及訊號有沒有增高的視覺標準是高度雷同的。我們的眼睛並沒有問題,都能精準地捕捉到儀器所呈現出來的型態變化。
然而,當這份由醫師高度共識產生的 MR 預測清單,對上由顯微鏡下神經元真實流失數量所定義的組織病理學結果時,卻遭遇了嚴峻的挑戰。研究的主結果數據表明,磁振造影預測與病理分型的整體一致性僅有 Cohen’s kappa 0.328(P < 0.01)。這個數字落在尚可的低谷區間,甚至遠遠不到 0.5 的及格線。這是一個相當發人深省的客觀數據:即使兩位醫師非常有默契地把某個病患歸類為局部損傷的 Type 2,病理科醫師在顯微鏡下看到的真相,卻有極大機率是細胞死傷慘重的 Type 1。
若細看各亞型的分析表(Table 3),會發現影像診斷在預測最常見的 Type 1 時,其敏感度(sensitivity)為 75.3%(95% CI,65.4%-83.1%),特異度(specificity)則為 76.5%(95% CI,52.7%-90.4%)。雖然敏感度與特異度帳面上都跨過了 75% 的門檻,但考量到 Type 1 在母群體中佔據了近 84%(89/106)的絕對多數優勢,這樣的預測能力顯然無法滿足精準醫療的要求。這也完美解釋了為何 MR 在單獨預測 Type 1 時的 kappa 值只有 0.362(P < 0.01),同樣落在尚可的慘澹區間。這強烈暗示著,影像上肉眼看到的局部萎縮,與顯微鏡下細胞層級的全面崩壞,兩者之間並不存在直接且完美的對應關係。
| 比較項目 | Cohen's Kappa 值 | 統計顯著性 | 一致性等級 |
|---|---|---|---|
| 放射科醫師間共識 (Interobserver) | 0.770 | P < 0.01 | 良好 (Good) |
| 整體 MRI 與病理一致性 | 0.328 | P < 0.01 | 尚可 (Fair) |
| MRI 預測 GO 型與病理一致性 | 0.736 | P < 0.01 | 良好 (Good) |
| MRI 預測 Type 1 與病理一致性 | 0.362 | P < 0.01 | 尚可 (Fair) |
醫師間高度共識,但與病理真實情況存在明顯歧異
分辨神經膠質增生的 97.9% 極高特異度優勢
雖然在區分 ILAE 1 到 3 型的這場硬仗中,常規 3T 磁振造影遭遇了極大的瓶頸,但若細看研究的次群組數據分析,影像診斷仍在另一個關鍵戰場展現了不可取代的獨特價值——也就是針對「無海馬迴硬化/單純神經膠質增生」的精準辨識。在這個子項目中,磁振造影與病理學的診斷一致性交出了一張極度亮眼的成績單,Cohen’s kappa 值達到了 0.736(P < 0.01),毫無懸念地進入了良好的一致性水準。
根據統計圖表中的具體效能指標,磁振造影預測 GO 型的敏感度為 72.7%(95% CI,43.4%-90.3%),而特異度更是飆升至驚人的 97.9%(95% CI,92.7%-99.4%)。這個高達 97.9% 的特異度具有決定性的臨床應用價值。它代表的意思非常直白:如果在病理上不是 GO 型(亦即確實有嚴重的神經元實質流失,屬於真正的海馬迴硬化 Type 1/2/3),那麼放射科醫師的眼睛極少會在影像上誤判為 GO。換句話說,當我們在影像上明確看到某個次分區的體積塌陷時,那個地方的神經細胞是真的大規模凋亡了;反之,當我們在影像上自信地判定為 GO 型時,病患的海馬迴組織真的就只有膠質細胞增生,而尚未出現不可逆的體積萎縮。
為什麼肉眼評估能精準抓得住 GO 型,卻完全抓不住 Type 1 到 3 型之間的細微差異?背後牽涉到三維空間的病理解剖機轉。GO 型的定義是單純神經膠質增生,這通常在 T2 影像上表現為異常高訊號,但細胞骨架與數量仍然完好。由於沒有大規模細胞死亡,海馬迴的巨觀結構通常能維持飽滿,不會出現劇烈的塌陷。人類肉眼對於整體輪廓是否維持原本形狀的敏感度,遠遠高於去分辨在一個已經萎縮變形的海馬迴中,到底是哪一個區塊萎縮得多一點。當高訊號存在但海馬迴依舊飽滿時,這就是最典型且最容易判讀的 GO 型。
相反地,Type 1、Type 2 單純 CA1 與 Type 3 單純 CA4 在病理上是嚴格依據神經元流失的微觀空間分佈來定義的。但在真實的三維器官中,這些次分區的單獨萎縮往往會導致相鄰健康結構的物理性牽扯與空間位移。一個嚴重的單純 CA1 萎縮,在 3T 影像有限的像素解析度下,很容易造成整體海馬迴體積縮水的錯覺,讓放射科醫師誤以為 CA4 也跟著陪葬了,進而錯誤地將其升級為最嚴重的 Type 1。這種因結構變形導致的視覺混淆,正是 3T 影像現階段無法跨越的物理障礙。
肉眼預測 GO 型特異度極高,但整體分辨 1 到 3 型的準確度不足
3T 臨床常規的極限與未來電腦輔助的展望
作者在論文的討論環節中坦承,基於目前的臨床 3T 磁振造影硬體極限與掃描方案,單憑放射科醫師的肉眼定性評估,雖然能以極高的同儕共識度評估次分區的體積改變,但這份共識並不足以在術前準確預測 ILAE 第 1 到 3 型之間的細微差異。這個結論為我們每天的臨床實務畫下了一道明確的紅線:放射科醫師不應該在沒有其他高階量化數據佐證的情況下,貿然在正式報告的 impression 中寫下高度懷疑為特定組織學次分型的結論,因為這樣的推測往往與病理真相不符,甚至可能誤導神經外科醫師對病患預後的判斷。
這份研究提醒我們,在神經影像學中,視覺的高度共識並不等於組織學的絕對真實。即使你和同事都一致認為影像上看起來只有 CA1 萎縮,顯微鏡下的真相卻仍有極大的機率是更具破壞性的 Type 1。因此,現階段神經放射科醫師在撰寫癲癇術前評估報告時,首要任務仍應回歸紮實的基本功:利用敏銳的對比觀察,找出微小的結構不對稱,並確實區分伴隨明顯體積流失的典型海馬迴硬化與僅有訊號變化的單純神經膠質增生。善用高達 97.9% 的特異度優勢,把 GO 型明確地獨立出來,這對臨床手術團隊來說就已經是價值連城的情報。
放眼未來的技術發展,如果我們要真正突破這層術前診斷的天花板,單純的看片技巧已經不夠,我們必須雙管齊下。在硬體端,或許必須仰賴 7T 超高場強磁振造影,藉由次毫米等級的極致解析度,來真正看穿 CA1 與 CA2 之間的組織交界。而在軟體端,則必須引入自動化的電腦視覺技術,例如基於 nnU-Net(自動調架構的切割框架)的人工智慧模型,或是高階的 radiomics(從影像自動抽上千個量化特徵)運算,透過精密的次體素定量分析,徹底排除人類視覺對於立體結構塌陷的錯覺。高解析度的 3T 癲癇掃描方案依然不可或缺,它是篩檢癲癇病灶的強大武器;但對於探究神經元凋亡的精確地圖,我們必須誠實面對肉眼的極限。
看到海馬迴高訊號別急著預測 ILAE 型態;用肉眼分辨「有沒有體積萎縮」的準確度極高,但要細分哪一區萎縮往往會被打臉。