Pfirrmann Grading and Features of Internal Derangement Identified in Discs Studied By Lumbar Discography in Patients with Chronic Low Back Pain [ORIGINAL RESEARCH]
高達 19% 在 MRI 看似正常的 Pfirrmann I/II 級椎間盤,已發生嚴重內部結構錯亂與撕裂。
- Pfirrmann I/II 級椎間盤中,有 19% 存在達 Dallas Grade 3 的嚴重內部錯亂。
- Grade III 椎間盤的內部破壞被嚴重低估,80% 結構已損壞,僅 18% 纖維環完整。
- 隨退化惡化(Grade IV-V),病理型態從單純放射狀撕裂轉向廣泛退化與碎片化。
T2WI 看起來飽滿明亮的正常椎間盤,其實有高達 19% 到 25% 已經發生嚴重的纖維環撕裂與內部結構崩壞。當我們每天在報告上快速打下「無明顯退化」時,這些隱藏在完整外表下的病理變化,正是許多下背痛病患遲遲找不到確切病因的關鍵。本篇研究直擊了 MRI 視覺分級對早期病變嚴重低估的危險死角。
MRI 評估退化的死角與 1296 節椎間盤對照
在日常的腰椎磁振造影判讀中,Pfirrmann Grade(根據 T2 影像訊號與椎間盤高度分類退化程度)是我們最常依賴的視覺分級系統。然而,這個系統主要反映的是髓核內部蛋白多醣流失導致的水分減少,而非外圍纖維環的實質力學破壞。對於患有嚴重慢性下背痛的病患而言,疼痛的真正來源往往是富含神經末梢的纖維環外層發生了撕裂,但這種撕裂如果不伴隨明顯的水分流失或椎間盤高度下降,在常規的非造影 T2WI 影像上極容易被判定為正常。
Bartynski 等人為了解決這個臨床判讀上的視覺誤差,將非侵入性的 MRI 影像分級與侵入性的 Provocation Lumbar Discography(誘發性腰椎椎間盤造影,透過注射顯影劑觀察破裂並誘發疼痛的標準)進行了大規模的頭對頭比對。這項研究的核心目標,就是要量化那些在 MRI 上看起來依然豐潤的椎間盤,內部結構究竟有多大的機率已經實質損壞,進而重新定義我們對早期退化的影像認知。
過去的研究鮮少將纖維環內部錯亂的具體特徵與 Pfirrmann 分級建立直接的對應關係。作者團隊藉由這項研究,試圖釐清各個退化階段中,纖維環從單純的放射狀撕裂進展到廣泛性退化與碎片化的動態過程。這對於骨科與神經外科醫師在評估病患是否適合進行微創介入治療或椎間盤成形術時,具有決定性的影像學參考價值。
Provocation Lumbar Discography 的 410 人世代設計
從研究設計來看,本試驗回溯性地納入了 410 位因嚴重慢性下背痛而接受造影的病患,總共針對 1296 節椎間盤進行了詳細的影像學交叉比對。這個龐大的世代被嚴謹地劃分為 1213 節未曾接受手術的椎間盤,以及 83 節曾經接受過椎間盤切除術的術後椎間盤。所有病患在進行造影檢查前,均已完成高品質的腰椎 MRI 掃描,並由獨立的放射科醫師給予 Pfirrmann Grade(I 到 V 級)的評分。
在介入性造影的評估標準上,研究團隊採用了著名的 Dallas Discogram Scale 來量化纖維環的破壞程度。作者在此定義了一個關鍵的複合性指標:「顯著內部結構錯亂」(Significant Internal Derangement, Sig-Int-Der)。只要造影顯示 Dallas 分級達到 Grade 3 的放射狀撕裂(代表顯影劑已延伸至纖維環最外側 1/3),或是出現 Grade 1 到 Grade 3 的廣泛性纖維環退化,即符合此項嚴重標準。較輕微的狀況則歸類為 Dallas Grade 1 或 2 的局部放射狀撕裂。
為了確保統計結果不會因為「同一位病患提供了多節椎間盤」而產生群聚效應偏差,作者在資料處理上採用了針對相關性二元資料的廣義線性模型。針對這類高度相關性的資料集,一般的卡方檢定會因為忽略了同一個體內的變異而高估統計顯著性。作者透過 SAS 軟體執行運算,如同現今許多 radiomics(從影像自動抽上千個量化特徵)研究中處理多重病灶的方法一樣,精準抽離出病患年齡與性別的干擾,確保最終算出的盛行率具有高度的統計效力。
| 分類群體 | 數量 / 條件 |
|---|---|
| 總受試者 | 410 位慢性下背痛病患 |
| 總椎間盤數 | 1296 節 |
| 未手術組 | 1213 節椎間盤 |
| 術後組 | 83 節椎間盤 (post-discectomy) |
多中心真實世界慢性下背痛造影數據
Table 1 呈現 Pfirrmann Grade I 與 II 的 19% 實質破裂
把焦點拉到未手術組的 1213 節椎間盤結果,Table 1 清楚列出了低級別退化的真實內部樣貌。在 483 節於 MRI 上被判定為訊號明亮、高度正常的 Grade I 與 II 椎間盤中,只有 75%(361/483) 在椎間盤造影下證實擁有完美的纖維環結構。另外有 6%(28/483,95% CI: 4-8%) 存在著低級別的 Dallas Grade 1 或是 Grade 2 局部放射狀撕裂。
最令人訝異的數據在於,有高達 19%(94/483,95% CI: 17-25%) 的 Grade I 與 II 椎間盤,實際上已經發生了「顯著內部結構錯亂」。這意味著每五個在 MRI 上看起來完美無瑕的椎間盤中,就有一個內部已經出現延伸至外層 1/3 的嚴重裂隙或是明顯的結構退化。這個具體的數字直接挑戰了常規的影像認知,因為這類病患如果僅僅依賴非造影 MRI 的報告,極有可能會被告知結構正常,而錯失了針對椎間盤源性疼痛進行阻斷治療的黃金介入期。
從病理生理學的角度來看,這種視覺與實質的不一致,主要源於纖維環的撕裂初期,髓核內部仍保有足夠的親水性蛋白多醣。當裂縫被髓核的液體成分填滿時,在 T2WI 影像上反而維持了原本的高訊號;除非撕裂處產生了明顯的血管肉芽組織增生,否則常規的常規自旋回音序列根本無從察覺這 19% 的實質性破壞。
Figure 2 顯示 Pfirrmann Grade III 至 V 的破裂型態轉移
若細看 Figure 2 針對中重度退化椎間盤的趨勢分析,Pfirrmann Grade 對內部破壞程度的低估效應在 Grade III 的椎間盤中達到了最高峰。在 205 節 Grade III 椎間盤中,有高達 80%(163/205) 出現了顯著內部結構錯亂,僅有 18%(37/205) 的纖維環是完整的。對於這類 T2 訊號開始呈現不均勻灰暗、但高度尚且正常的椎間盤,報告中描述為「輕度至中度退化」往往是不夠真實的,實際上其內部結構早已千瘡百孔。
當退化進展到 Pfirrmann Grade IV(高度開始下降)與 Grade V(高度嚴重塌陷且有真空現象)時,MRI 與造影結果的吻合度才大幅提升。在 423 節 Grade IV 椎間盤中,96%(405/423) 具有顯著內部結構錯亂;而在 102 節 Grade V 椎間盤中,這個比例達到了 100%(102/102)。統計模型顯示,隨著 Pfirrmann 分級從 I 爬升至 V,顯著內部結構錯亂的發生率呈現極其顯著的上升(p < 0.001)。
更重要的臨床細節是破裂型態的轉移。在 Grade I 到 III 的階段,主要的病理表現是單純的放射狀撕裂;但一旦進入 Grade IV 與 V,病灶便以 Dallas Grade 3 的廣泛退化為主,且在 Grade V 觀察到極其嚴重的內部碎片化。這種型態轉移對於微創手術選擇至關重要,針對單純的撕裂,醫師可能會考慮熱凝血成形術;但如果內部已經發生了廣泛退化與碎片化,這類微創修復的效果將大打折扣,直接進行融合手術才是更合理的策略。
視覺分級嚴重低估早期退化病變(p<0.001)
放射科判讀常規 MRI 的侷限與病患屬性對齊
從這份研究的數據中,我們必須誠實面對常規非造影 MRI 的侷限性。作者在 Discussion 階段明確指出,Pfirrmann Grading 雖然在評估整體退化軌跡上具有不可取代的方便性與普遍性,但它本質上是一個嚴重「低估」纖維環早期破壞程度的工具。尤其是高達 17-25% 的 Grade I, II 椎間盤存在顯著內部結構錯亂,這對於判斷慢性背痛來源有著龐大的影響力。
不過,本研究的受試者背景也劃定了這份數據的適用邊界。這 410 位病患都是因為難治型的慢性下背痛,才被轉介來接受侵入性的造影檢查。這意味著這是一個具有高度選擇偏差的群體。因此,這 19% 的假陰性率並不適用於一般無症狀的健康人群,而是專屬於那些「臨床痛得要命,但 MRI 卻看似正常」的特定病患。對於這類臨床表現與影像高度不對等的個案,我們不該在報告結語輕易下定論排除椎間盤源性疼痛的可能性。
身為放射科醫師,在實際工作場景中,我們依然會繼續使用 Pfirrmann Grade 作為溝通的共同語言,但必須要在腦中建立一個動態的修正係數。未來若能導入 nnU-Net(自動調架構的切割框架)結合多參數 MRI 定量分析,或許能在無創的情況下預測這些裂隙。但在當下,當臨床醫師疑惑為何病患依然劇痛時,我們應該主動提醒這五分之一的機率,並建議在疼痛科的協助下進行診斷性造影。
遇上嚴重下背痛卻只有 Pfirrmann I/II 級 MRI 的病患,報告裡預留纖維環撕裂的可能性,才是真正懂臨床的判讀。