Comparative Analysis of Artificial Intelligence-Based Quantification versus Visual Rating of Enlarged Perivascular Spaces in the Multi-Ethnic Study of Atherosclerosis Cohort [ARTIFICIAL INTELLIGENCE]

Torres, M. F., Charisis, S., Rashid, T., Brandigampala, S. R., Hiatt, K. D., Ware, J. B., Whitlow, C. T., Nasrallah, I. M., Romero, J. R., Tanley, J. E., Seshadri, S., Hohman, T. J., Heckbert, S. R., Davatzikos, C., Hughes, T. M., Habes, M.

View Original ↗
AI 導讀 academic AI 重要性 4/5

AI 計量 PVS 比人眼評分多抓到收縮壓與糖尿病關聯,且揭示視覺評分看不見的認知退化訊號

  • 視覺評分漏掉收縮壓(β=0.20)與糖尿病兩項基底核 PVS 關聯,AI 計量在同一份影像全數偵測到
  • 基底核 PVS 計量值與記憶力、注意力顯著負相關(β=–0.005),視覺評分對三項認知域別全無顯著
  • 橫斷面設計無因果方向,AI 演算法依賴特定 MRI 協定,台灣本地導入前須先驗證移植效能

AI 深度學習計數腦部基底核血管周圍間隙(PVS)平均達 63.7 個,而同一批影像的人眼視覺評分只能分辨「11-20 個等級」——這個量化粒度差距,讓 AI 在 235 人腦部 MRI 裡多抓到兩個視覺評分完全遺漏的風險訊號:收縮壓(β=0.20)與糖尿病(β=11.51)。這篇刊於 AJNR 2026 年四月的研究,首次在同一批受試者影像上正面比較 AI 計量與神經放射科醫師視覺評分的臨床關聯偵測能力。

PVS 視覺評分的粒度瓶頸:大數據時代的研究死結

血管周圍間隙(perivascular spaces,PVS)是圍繞腦部細小血管的液體填充空間,在 T2 加權 MRI 上呈現為高訊號點狀結構,是腦小血管病變(small vessel disease,SVD)的重要影像標誌,近年反覆出現在認知退化的影像預測因子清單裡。現行視覺評分採半定量量表分等級(1-5 個、11-20 個、21-40 個等),存在三個根本侷限:評分者間可重複性有限連續性差異被截斷(把 63 個和 79 個歸入同一等級,細微血壓關聯就此消失)、以及無法擴充至大型資料庫。正因缺乏高效量化工具,許多 PVS 血管風險關聯可能被系統性漏報。來自德州大學、賓州大學和 Wake Forest 三機構的研究團隊,以 MESA 世代為基礎設計直接比較實驗,讓 AI 與人眼在同一份影像上競爭關聯偵測能力。

MESA 世代 235 人:72 歲、四解剖區的橫斷面設計

Multi-Ethnic Study of Atherosclerosis(MESA)是美國 NHLBI 資助的多族裔心血管長期世代,本研究從同時具備視覺評分與 AI 計量的 MESA 參與者中納入 235 人。平均年齡 72.1 歲(SD 6.8)95 人(40%)男性,126 人(54%)自報黑人,族裔多樣化程度在腦部影像研究中少見。視覺評分由神經放射科醫師 Kevin D. Hiatt 單獨執行;AI 計量採全自動深度學習演算法直接輸出連續性計數值,無需人工介入。兩套方法均在四個預先定義部位量化:基底核額頂葉大腦皮質中腦小腦。統計分析以有序邏輯斯迴歸處理視覺評分,線性回歸處理 AI 計量,控制人口學特徵後評估 PVS 與血管風險因子及三個認知域別(全域認知、延遲記憶、注意力/處理速度)的關聯。

MESA 世代受試者特徵與 AI PVS 計量摘要
特徵數值
樣本總數235 人
平均年齡72.1 歲(SD 6.8)
男性比例40%(95 人)
黑人比例54%(126 人)
基底核 AI 計量均值63.7(SD 24.6)個
額頂葉 AI 計量均值414.9(SD 167.5)個
中腦 AI 計量均值9.8(SD 4.4)個

資料來源:AJNR 2026 Torres et al.

基底核 AI 計量多發現收縮壓 β=0.20 與糖尿病關聯

AI 計量絕對值在不同解剖區差異懸殊:基底核平均 63.7(SD 24.6)個、額頂葉高達 414.9(SD 167.5)個、中腦僅 9.8(SD 4.4)個。視覺評分最常見等級:基底核 11-20 個(40%)、額頂葉 21-40 個(31%)、中腦 1-5 個(83%)。兩套方法量化規模不在同一尺度,但 AI 連續性計量在統計模型中提供了顯著更高的解析度。兩種方法共同偵測到的關聯:年齡較大與白人族裔,均達顯著。只有 AI 計量才發現的關聯:收縮壓升高(β = 0.20,95% CI 0.05–0.36)和糖尿病(β = 11.51,95% CI 3.48–19.55)。視覺評分對這兩項均未達顯著,說明依賴視覺評分做 PVS 血管風險研究,有相當大的機率系統性漏報重要關聯

AI 計量 vs 視覺評分:基底核 PVS 關聯偵測比較
關聯因子視覺評分達顯著AI 計量達顯著AI β 值(95% CI)
年齡較大未詳列
白人族裔未詳列
收縮壓升高0.20(0.05–0.36)
糖尿病11.51(3.48–19.55)
全域認知下降–0.012(–0.023 至 –0.0004)
延遲記憶下降–0.005(–0.010 至 –0.0005)
注意力/處理速度下降–0.005(–0.009 至 –0.001)

AI 獨有偵測到的關聯以 ✓ 標示,視覺評分未達顯著者以 ✗ 標示

三認知域別迴歸:基底核 PVS 計量與記憶、注意力同步下滑

控制人口學特徵後,基底核 AI 計量值與三個認知域別均達顯著負相關:全域認知(β = –0.012,95% CI –0.023 to –0.0004)、延遲記憶(β = –0.005,95% CI –0.010 to –0.0005)、注意力/處理速度(β = –0.005,95% CI –0.009 to –0.001)。三項 95% CI 下界均不含 0。相較之下,視覺評分的基底核等級與這三個認知域別均未達顯著。若完全依賴視覺評分,同樣 235 人的資料將得出「基底核 PVS 與認知功能無關」的負面結論,研究可能就此終止;AI 計量則清楚顯示關聯確實存在。認知關聯的解剖選擇性值得注意:顯著關聯只出現在基底核,額頂葉與中腦未見同等強度,可能反映基底核在皮質下認知網路的特殊解剖地位,也可能是 n=235 在其他區域的統計檢力不足。

橫斷面設計與演算法移植性的適用邊界

作者坦承幾個關鍵限制。設計層面:橫斷面研究只能建立相關性,無法確立因果方向——收縮壓升高究竟是 PVS 增加的上游原因,還是兩者共享同一血管病理機制,需縱向追蹤資料釐清。樣本量:n=235 對多變數迴歸合理,但族裔子群組差異分析統計檢力有限,額頂葉和中腦未見認知關聯,部分可能是檢力不足而非真實無效應。視覺評分:由單一評分者執行,未提供評分者間信度(inter-rater reliability)數據,視覺評分的表現上限難以確定。AI 演算法移植性:深度學習計量精準度高度依賴訓練資料的 MRI 協定(磁場強度、序列參數);台灣各院 MRI 協定未標準化,從 1.5T 到 3T 不等,直接套用前須以本機影像先行驗證。此工具目前最適合大型流行病學研究的批量影像分析,而非個別臨床病例的即時決策輔助。對研究型放射科醫師而言,最大的實務啟示是:過去得到陰性結論的 PVS 研究,若改用 AI 計量重跑,可能看到截然不同的結果。

下次讀到「PVS 與收縮壓/認知無關」的陰性文獻,先問作者用的是視覺評分還是 AI 計量——同樣 235 人,粒度不同,結論可以天差地遠。

Abstract

BACKGROUND AND PURPOSE:Enlarged perivascular spaces (PVS) are fluid-filled spaces surrounding small cerebral vessels. Current PVS research has been limited by the absence of efficient and scalable quantification tools. We compared visual ratings versus artificial intelligence (AI)–based quantification in identifying associations of PVS with vascular risk factors and cognitive performance.MATERIALS AND METHODS:This cross-sectional study included 235 participants from the Multi-Ethnic Study of Atherosclerosis who had undergone brain MRI and had available both visual ratings and AI-derived PVS quantification. Visual ratings were performed by an expert neuroradiologist (K.D.H.) using a semiquantitative scale. AI-derived counts were based on a fully automated deep learning algorithm. Visual and AI-derived counts were grouped into 4 a priori–defined anatomic locations: basal ganglia, frontoparietal cerebrum, midbrain, and cerebellum. The relationships of PVS counts with demographic characteristics, vascular risk factors, and global and domain-specific cognitive scores were examined using ordinal logistic regression (for ordinal categoric outcomes) and linear regression (for continuous outcomes) models.RESULTS:Mean age (SD) was 72.1 (6.8) years; 95 (40%) participants were men; and 126 (54%) self-reported as black. Means (SD) of AI-derived regional PVS counts were 63.7 (24.6) for basal ganglia, 414.9 (167.5) for frontoparietal cerebrum, and 9.8 (4.4) for midbrain. On visual ratings, the most prevalent count category for each region was 11–20 for basal ganglia (40%), 21–40 (31%) for frontoparietal cerebrum, and 1–5 (83%) for midbrain. For basal ganglia PVS, while both methods were associated with older age and white race/ethnicity, AI-derived counts exhibited additional associations with higher systolic blood pressure (β, 0.20; 95% CI, 0.05–0.36) and diabetes (unstandardized β coefficient [β], 11.51; 95% CI, 3.48–19.55), as well as poorer global cognition (β, –0.012; 95% CI, –0.023 to –0.0004), delayed memory (β, –0.005; 95% CI, –0.010 to –0.0005), and attention/processing speed (β, –0.005; 95% CI, –0.009 to –0.001) cognitive performance.CONCLUSIONS:In this cross-sectional study, AI-derived PVS quantification was more sensitive in detecting associations with vascular risk factors and cognitive outcomes than traditional visual ratings. AI-based quantification may aid in the analysis of large-scale epidemiologic data, advancing PVS research.