Amyloid PET Z-score Quantification and correlation with visual semiquantitative grading [ORIGINAL RESEARCH]
視覺分級不再孤單!類澱粉 PET 的 Z-score 量化分析與肉眼判讀相關性高達 0.88,精準拆解局部與瀰漫性攝取的模糊地帶。
- 在 100 位患者與 400 個皮質區域的分析中,Z-score 與 RCTU 視覺分級展現 ρ = 0.78–0.88 的高度正相關。
- Z-score 能夠在統計上顯著區分 RCTU 2(局部)與 RCTU 3(瀰漫性)的攝取差異 (p<0.05),解決肉眼判讀痛點。
- 面對抗類澱粉蛋白藥物時代,常模比對的 Z-score 可作為提升診斷信心與減少觀察者間變異性的客觀工具。
即使是經驗豐富的判讀醫師,在面對類澱粉蛋白 PET 影像的局部與瀰漫性攝取交界時也常舉棋不定,而這篇最新研究證明,自動化量化的 Z-score 能以高達 ρ = 0.88 的相關係數完美對接視覺評分。當抗類澱粉蛋白標靶藥物全面叩關臨床,單憑肉眼看皮質變化已不足以應付龐大的治療評估需求,這套基於常模比對的量化系統正是放射科急需的客觀準則。
視覺判讀的主觀侷限與抗類澱粉藥物的量化需求
自從阿茲海默症(AD)的抗類澱粉蛋白單株抗體療法(如 Lecanemab 與 Donanemab)獲得核准後,證明腦內存在類澱粉蛋白沉積成為給藥的絕對前提。目前在常規臨床實務中,放射科與核醫科醫師主要依賴肉眼視覺判讀來決定患者是否符合資格。我們最常使用的工具是 RCTU(Regional Cortical Tracer Uptake,分1到3級的皮質攝取視覺指標),並以此推導出整體的 BAPL(Brain Amyloid Plaque Load,以最高RCTU決定的整體類澱粉負荷)分數。然而,這種純視覺的半定量分級系統存在明顯的妥協與侷限。
若細看視覺判讀的本質,大腦白質本身就會對追蹤劑產生非特異性的攝取,判讀醫師必須在大腦皮質與相鄰白質的灰白質對比中尋找微小的訊號變化。當皮質攝取與白質相當,甚至超越白質時,才能判定為陽性。這種依賴「看圖說故事」的方式,不可避免地會受到不同醫師經驗值、螢幕對比度設定,甚至當天精神狀態的影響。這導致了極高的觀察者間變異性(inter-reader variability),尤其在輕微沉積或局部沉積的早期個案中,不同醫師給出的 BAPL 分數可能截然不同。
針對這個長期困擾影像科的問題,導入客觀的數值化工具成為必然的趨勢。除了學界常用的 Centiloid scale(全球標準化的類澱粉量化百分尺)之外,利用既有健康受試者資料庫計算出的 Z-score(比較病患與健康常模的標準差倍數)也是一條極具潛力的路徑。本篇研究的作者團隊來自威爾康奈爾醫學院與墨菲特癌症中心,他們試圖驗證這套 Z-score 量化系統是否能在真實的失智症患者群體中,與我們行之有年的 RCTU 與 BAPL 視覺分級產生統計學上的高度共鳴。
100位失智患者與400個大腦分區的嚴密檢驗
從 Methods 來看,這是一項時效性極新的回溯性分析,收案期間落在 2024 年 8 月至 10 月。研究團隊納入了 100 位因認知功能障礙而接受 [F18]-Florbetaben PET 影像檢查的患者。這個群體的中位數年齡為 78 歲,屬於典型的阿茲海默症好發年齡層。[F18]-Florbetaben 是一種經過廣泛驗證的類澱粉蛋白追蹤劑,其標準化攝取值比率 SUVR(相對於小腦或白質的標準化攝取比值)能夠準確反映皮質內的斑塊密度。
在影像處理與評估流程上,每一位患者的 PET 影像都同時接受了傳統視覺判讀與自動化量化分析。視覺判讀部分,由經驗豐富的讀片醫師針對大腦四個核心皮質區域:額葉(frontal)、頂葉(parietal)、後扣帶迴與楔前葉(posterior cingulate/precuneus),以及外側顳葉(lateral temporal)進行 RCTU 評分。RCTU 分為 1 分(無皮質攝取)、2 分(局部皮質攝取)與 3 分(瀰漫性皮質攝取)。隨後,依據這四個區域中的最高分,決定該名患者整體的 BAPL 分數(BAPL 1 代表陰性,BAPL 2 與 3 代表陽性)。
將視角轉向量化分析,研究團隊使用了立體定位表面投影 SSP(大腦皮質三維立體表面投影技術)或類似的腦部正規化工具,將每位患者的掃描結果與內建的常態健康資料庫進行比對。系統自動提取上述四個解剖區域的追蹤劑攝取特徵,並計算出對應的 Z-score。Z-score 大於特定閾值即代表該區域的攝取量顯著高於健康常模。藉由這 100 位患者、每人 4 個區域,總計 400 個大腦皮質分區的龐大數據庫,作者得以進行極為細緻的區域級別統計分析。
若檢視這 100 位患者的整體視覺分類結果,共有 31 位被判定為類澱粉蛋白陰性(BAPL 1),而高達 69 位被判定為陽性。在這 69 位陽性患者中,有 11 位屬於局部沉積的 BAPL 2,58 位屬於廣泛沉積的 BAPL 3。這個分佈比例反映了記憶門診中轉診做 PET 的病患,多半已經有相當程度的臨床懷疑與實質病理改變。
| 評估維度 | 分類級別 | 患者數 / 區域數 |
|---|---|---|
| 患者整體負荷 (n=100) | BAPL 1 (陰性) | 31 位 |
| 患者整體負荷 (n=100) | BAPL 2 (陽性 - 局部) | 11 位 |
| 患者整體負荷 (n=100) | BAPL 3 (陽性 - 瀰漫性) | 58 位 |
| 皮質區域分佈 (n=400) | RCTU 1 (無明顯攝取) | 143 區 |
| 皮質區域分佈 (n=400) | RCTU 2 (局部攝取) | 46 區 |
| 皮質區域分佈 (n=400) | RCTU 3 (瀰漫性攝取) | 211 區 |
資料來源:Methods 與 Results 數據彙整
Table 1 與 400 個分區揭示的 ρ = 0.88 高度相關性
把焦點拉到 Results 的核心數據,這 400 個皮質區域的視覺分級呈現出不對稱但合理的分配:其中 143 個區域被評為 RCTU 1(無攝取),46 個區域為 RCTU 2(局部攝取),而佔最大宗的 211 個區域被評為 RCTU 3(瀰漫性攝取)。這種分佈說明了在 BAPL 3 的患者大腦中,多數區域都已淪陷,但也突顯了那 46 個 RCTU 2 區域是讀片時最容易產生猶豫的灰地帶。
研究團隊使用 Spearman 相關係數來檢驗這 400 個區域的 RCTU 視覺評分與自動計算出的 Z-score 之間的關聯。結果顯示了極為強烈的正相關,四個區域的相關係數 ρ 介於 0.78 到 0.88 之間,且所有的 p 值都小於 0.0001。這個具體數字具有重大的臨床意義,它從數學層面證實了:電腦算出來的標準差倍數,與放射科醫師肉眼判斷的灰白質對比與蔓延程度,走在完全相同的軌道上。
若進一步將四個區域的數據合併進行 Pooled regional analysis,不同 RCTU 組別之間的 Z-score 差異依然達到了 p < 0.0001 的極高統計顯著性。這代表 Z-score 並非只是粗略地把患者分為陰性與陽性,而是能夠敏銳地跟隨病理沉積的嚴重程度,呈現階梯式的上升。對於負責發出最終報告的醫師而言,這無疑是一劑強心針,表示這套量化工具的數值不僅可信,且與我們大腦中長期訓練出的視覺感知高度吻合。
基於 ρ = 0.78–0.88 區間之各解剖區域表現 (p < 0.0001)
RCTU 2 與 3 的統計邊界:突破局部與瀰漫性的判定泥沼
在所有統計結果中,最值得放射科同行關注的細節,在於 Z-score 如何處理不同 RCTU 級別之間的界線。作者使用了 Kruskal Wallis 與 Mann Whitney 檢定來比較各組間的差異。數據明確指出,在全部四個皮質區域(額葉、頂葉、後扣帶迴/楔前葉、外側顳葉)中,RCTU 1 與 RCTU 2 之間、RCTU 1 與 RCTU 3 之間,都存在統計學上的顯著差異(p < 0.05)。
更關鍵的是,即使是判讀上最棘手的 RCTU 2(局部)與 RCTU 3(瀰漫性)之間,Z-score 也能劃出顯著的統計分界(p < 0.05)。在日常閱片時,我們經常會猶豫某個額葉的皮質攝取到底算不算已經填滿了整個腦迴,或者只侷限在單一腦溝邊緣。RCTU 2 與 3 的差異直接影響到 BAPL 的最終給分。Z-score 能在此處展現顯著差異,意味著量化數值具備了超越肉眼主觀判斷的解析度,能夠在影像科醫師猶豫不決時,提供一個強而有力的客觀「第二意見」。
我們可以合理推論,在這四個區域中,後扣帶迴與楔前葉(PCP)的相關性極可能是最高的(接近 ρ = 0.88 的上限)。因為這裡是阿茲海默症類澱粉蛋白最早期開始堆積的位置,也是我們視覺判讀時最重要的錨點。相對地,外側顳葉因為體積較小且容易受到周邊組織溢出效應的干擾,相關性可能落在 ρ = 0.78 的區間。但無論如何,量化數值在這些解剖分區的穩定表現,已經證明了其在不同大腦皮質結構中的普遍適用性。
常模資料庫的先天限制與核醫報告的未來升級路徑
探討完亮眼數據後,我們必須正視這套方法在 Discussion 延伸出的適用邊界。首先,Z-score 的核心邏輯依賴於「健康常模資料庫」。如果一間醫院使用的 PET 掃描儀解析度、重建演算法或平滑化濾波器(smoothing filters)與建立常模時所用的機器不同,算出來的 Z-score 就會產生系統性的偏移。這點與目前學界推崇的 Centiloid scale 有所不同,Centiloid 透過標準化的校正公式,試圖抹平不同追蹤劑(如 PiB, Florbetaben, Flutemetamol)與不同硬體之間的差異,而 Z-score 則更依賴本地端或軟體內建常模的適配性。
其次,阿茲海默症患者常伴隨嚴重的腦萎縮,這會引發 PET 影像中常見的部分體積效應 PVE(因解析度不足導致皮質訊號被周遭腦脊髓液稀釋的現象)。雖然 Z-score 能夠反映相對的攝取異常,但若軟體沒有內建精確的 MRI 結構共準確(co-registration)與 PVE 校正,重度萎縮患者的皮質 Z-score 可能會被低估,導致量化數據與肉眼看到的明顯陽性產生背離。這項研究目前僅納入了 100 位患者,未來若要廣泛推廣,勢必需要更大規模、跨機型的驗證。
對於第一線的放射與核醫科醫師而言,這篇研究並不是要我們放棄視覺判讀,而是提供了一套完美的防護網。在明確的 BAPL 1 或 BAPL 3 個案中,視覺判讀的效率依然無可取代;但當我們在報告中打下 BAPL 2,或是準備為患者開啟昂貴的抗類澱粉蛋白療程時,附上額葉與後扣帶迴的 Z-score 數值,將能大幅提升報告的說服力與防禦性。更重要的是,在未來長期追蹤藥物療效(斑塊清除率)時,Z-score 的連續變化將比生硬的 1 到 3 分視覺分級,更能敏銳捕捉到病情的微小改善。
下次遇到額葉或後扣帶迴介於 RCTU 1 與 2 的模糊地帶時,別再憑肉眼感覺硬猜,直接把 Z-score 跑出來對比常模,讓 0.88 的客觀相關性替你的最終報告背書。