CTP-Free Method for Automated Lesion Water Uptake in Acute Ischemic Stroke [ARTIFICIAL INTELLIGENCE]

van Poppel, L. M., de Vries, L., Mojtahedi, M., van Voorst, H., Kappelhof, M., Olthuis, S. G. H., van Oostenbrugge, R. J., van Zwam, W. H., van Doormaal, P., Beenen, L. F. M., Roos, Y. B. W. E. M., Majoie, C. B. L. M., Marquering, H. A., Emmer, B. J.

View Original ↗
AI 導讀 academic AI 重要性 4/5

免做腦血流灌注掃描!AI 單靠常規 CT 與 CTA,預測中風 4.5 小時黃金治療期 AUC 高達 0.87,準確度媲美傳統 CTP。

  • 無需高階 CTP,AI 模型從平掃與血管攝影計算梗塞核心淨水吸收量,與傳統方法的 ICC 達 0.81。
  • 核心區水腫程度預測發病是否小於 4.5 小時的 AUC 為 0.87,與耗時的 CTP 流程無顯著差異(p=0.88)。
  • 低灌注區因細胞結構尚未崩解,水分吸收變化與時間相關性差(AUC 僅 0.63),不適合作為決策時鐘。

不依賴灌注造影,單靠常規電腦斷層與血管攝影,預測中風發作時間的 AUC 依然高達 0.87。評估急性缺血性中風的病灶發作時間,傳統上被認為非做高階灌注掃描不可,但這篇刊登於《AJNR》的最新 AI 研究證實,只要由演算法精準圈選核心與缺血區,免去額外掃描的自動化量測在臨床決策上的效力,與耗時的高階影像幾乎沒有差異。

突破造影限制的 4.5 小時中風治療窗評估

探究缺血性中風的組織時鐘,NWU(比較病灶與健側密度計算出的淨水吸收量)已經被證實與臨床預後及病灶發生時間高度相關。當腦組織缺血導致細胞內 ATP 耗盡,鈉鉀幫浦失去功能引發細胞毒性水腫,這些進入組織的水分會讓 X 光衰減係數下降,進而在影像上表現為 Hounsfield Unit 的微幅降低。透過精準量化這種密度的改變,放射科與神經內科醫師得以判斷患者是否仍處於發病 4.5 小時內的靜脈溶栓黃金期。這對於那些睡眠中發作或是無法確認發病時間的患者來說,是決定是否積極介入的重要關鍵。

然而,傳統量測 NWU 的工作流程面臨著硬體與時間的巨大考驗。要精準定義出梗塞核心(infarct core)與缺血半影區,現行標準高度依賴 CTP(打藥後連續掃描看腦血流灌注)。但 CTP 往往受限於患者躁動造成的移動假影、增加的輻射劑量,以及並非所有地區醫院都配備有即時的自動化運算軟體。這使得一個本該協助急診加速決策的影像指標,在實務推廣上困難重重。

為了解決這個臨床痛點,來自荷蘭阿姆斯特丹大學醫學中心的研究團隊提出了一套基於深度學習的自動化解決方案。他們試圖訓練演算法,僅憑藉所有中風患者入院必定會做的 NCCT(無顯影劑的常規腦部平掃)與 CTA(靜脈打藥後看動脈血管相),就能自動切割出梗塞區域並計算出水腫程度。如果這套免除灌注掃描的流程能夠達到與傳統方法一致的準確度,不僅能大幅縮短檢查時間(door-to-imaging time),更能讓資源有限的初級中風中心具備執行組織定時的進階能力。

MR CLEAN 註冊庫與 AI 影像切割的驗證流程

從收案條件來看,這項研究的資料擷取自荷蘭著名的 MR CLEAN(荷蘭多中心急性缺血性中風血管內治療隨機臨床試驗)註冊庫以及 MR CLEAN-LATE 試驗。團隊嚴格篩選了 90 位已知明確中風發作時間,且同時具備高品質 NCCT、CTA 以及 CTP 影像的缺血性中風患者。這種同時擁有三種影像模態的資料集非常珍貴,因為它允許研究人員將傳統依賴血流灌注建立的黃金標準,與僅使用平掃加血管攝影的實驗組進行一對一的嚴格對照。

在影像處理的管線設計上,作者部署了深度學習模型來自動執行分割任務。演算法會讀取 NCCT 上早期的缺血變化特徵,並結合 CTA 上的大血管阻塞位置與側支循環狀態,自動勾勒出梗塞核心以及周圍的 hypoperfused area(血流降低但尚未壞死的低灌注區)。接著,系統會鏡像對比對側健康大腦半球的解剖位置,計算兩個區域的相對密度差異,從而得出 NWU 的百分比數值。整個過程完全不需要人工介入畫 ROI(感興趣區域),排除了過去手動圈選常見的觀察者間變異(inter-rater variability)。

分析這兩種取向的統計方法也相當完備。為了確認新方法是否能取代舊方法,團隊不僅計算了測量絕對值之間的 ICC(評估兩種測量方法一致性的組內相關係數),更採用了 Bland-Altman 分析來尋找潛在的系統性偏差。此外,為了驗證這項技術的最終臨床價值,他們將患者依照發病是否超過 4.5 小時進行二元分類,並透過計算 AUC(接收者操作特徵曲線下的面積,評估分類準確度)與 DeLong 檢定,來比較這兩套影像決策支援系統在急診第一線的實戰表現。

研究流程與 MR CLEAN 註冊庫收案條件
階段與條件內容細節
患者來源荷蘭 MR CLEAN Registry 及 LATE 試驗
納入條件具備明確中風發作時間
必備影像高品質 NCCT、CTA 以及完整 CTP
最終人數90 位缺血性中風患者
黃金標準比較傳統 CTP-NCCT vs 演算法 CTA-NCCT

資料來源:Methods 段落

Table 2 呈現的核心與低灌注區具體量化數字

把焦點拉到主要測量結果,研究團隊在 Table 2 呈現了兩種方法量測出的實際吸收數值。在梗塞核心區域,傳統依賴 CTP-NCCT 的標準方法測得的中位數 NWU 為 4.1%(四分位距為 2.7–6.6%);而依靠深度學習自動化的 CTA-NCCT 新方法,測得的中位數為 3.2%(四分位距為 2.1–5.2%)。兩者在核心區域的數值呈現良好的相關性,ICC 達到 0.81(95% CI 為 0.73–0.87),平均誤差(mean difference)僅落在微小的 0.43%(Bland-Altman 區間從 -4.6%+5.5%),這在巨觀的影像密度判讀上已屬於高度吻合的範疇。

若細看低灌注區域(hypoperfused area)的表現,數據的穩定性甚至更上一層樓。傳統 CTP 方法測出的水分吸收量極低,僅有 2.3%(IQR 1.3–4.1%),而免 CTP 的新方法給出的數值是幾乎完全相同的 2.4%(IQR 0.9–3.9%)。在這個尚未完全梗塞的潛在可挽救組織中,兩種方法展現了極佳的一致性,ICC 高達 0.93(95% CI 0.90–0.96),平均誤差進一步縮小到 0.17%。這組數據強烈暗示,即使沒有即時的動態血流資訊,AI 從靜態的血管與平掃影像中,也能敏銳捕捉到細微的組織衰減變化。

進一步解讀核心區域數值略有差異的原因,這其實反映了兩種影像模態本質上的不同。CTP 定義的核心是基於血流量(例如 rCBF < 30%)的「生理性」界線,而 NCCT 與 CTA 則更多是反映「結構性」與早期的離子通道失能水腫。雖然 AI 方法算出的核心水吸收量比傳統方法稍微低了將近一個百分點,但考慮到它完全省去了造影劑過敏風險增加、輻射暴露翻倍以及動態掃描的時間成本,這種微小的數值偏移在爭分奪秒的急性期是完全可以接受的折衷方案。

兩種方法量測的中樞神經組織水吸收量中位數比較

核心區域具備高度一致性,ICC = 0.81

Figure 2 區分黃金治療期的 AUC 0.87 預測表現

這篇論文最精華的臨床價值,在於探討這些密度的改變是否能真正指導溶栓決策。在區分患者發病時間是否小於 4.5 小時的分析中,梗塞核心的 NWU 展現了極為鮮明的鑑別力。傳統 CTP 組在發病小於 4.5 小時的患者中,核心水吸收僅有 3.7%,而在超過 4.5 小時的患者中則飆升至 10%(P < .001)。令人振奮的是,免 CTP 的 AI 組也複製了完全一樣的趨勢:早期患者為 3.1%,晚期患者高達 11%(P < .001)。

根據 Figure 2 所畫出的 ROC 曲線比較,這兩條幾乎重疊的分類軌跡,給出了令臨床醫師安心的答案。自動化 CTA-NCCT 流程預測發病時間在 4.5 小時內的 AUC 達到 0.87,與耗費資源的傳統流程相比,統計學上沒有任何顯著差異(P = .88)。這意味著,如果在急診室面臨一位醒來中風(wake-up stroke)的病患,利用這套深度學習管線所做出的「是否給予靜脈溶栓」判斷,將有極大概率與參考高階灌注影像後做出的決定不謀而合。

然而,研究數據也同時指出了低灌注區的應用盲區。當團隊試圖用低灌注區(缺血半影區)的水吸收量來預測時間時,兩種方法雙雙失效。發病小於與大於 4.5 小時的差異,在 CTP 組為 2.3% 對比 4.4%(P = .31),在 CTA 組為 2.3% 對比 4.7%(P = 0.13),皆未達到統計顯著。這也直接導致低灌注區預測時間的 AUC 慘跌至 0.59(傳統方法)與 0.63(AI 方法)。從病理生理學來看這是極其合理的現象:低灌注區是瀕死但仍在苦撐的組織,其細胞膜結構尚未全面崩解,因此水分大量滯留的現象並不如核心區那樣隨著時間呈線性暴增,這也反向印證了用「核心區密度變化」來當作組織時鐘的科學正確性。

區分 4.5 小時發病時間之水分吸收與 AUC 表現

核心區展現極高鑑別力,低灌注區則無統計顯著差異

免去 CTP 流程的邊際效應與放射科臨床啟示

儘管免除了高階造影的依賴,作者在 Discussion 中也誠實地點出了這套方法的邊界與先天限制。首先,這是一項基於荷蘭單一國家、特定臨床試驗註冊庫的回顧性分析,樣本數 90 人雖然在影像深度學習領域足以得出具備統計意義的結論,但要將模型直接泛化至不同人種、不同廠牌 CT 掃描儀器(如 GE 或是 Siemens 不同的重建濾波器),絕對還需要更大規模的外部驗證。此外,這組病患經過嚴格篩選,必須同時具備三種高品質影像,這無形中排除了許多在急診因為躁動而導致一般平掃品質不佳的困難案例。

對放射科同行而言,這套基於常規影像的 AI 工具在實務上最大的優勢,在於它極大地拓寬了進階神經影像分析的普及率。未來在判讀急性缺血性中風時,即使患者因為腎功能疑慮、顯影劑過敏風險,或是機器排程問題而無法完成完整的腦血流灌注掃描,我們只要確保有合格的平掃與動脈相血管攝影,就能產出一份具備相當信賴度的梗塞時間預估報告。這尤其對於夜間值班或是非醫學中心層級的區域醫院,是一項極具吸引力的輔助診斷利器。

另外一個值得注意的細節是基準密度的問題。患者大腦若本身帶有陳舊性中風病灶、嚴重的白質病變(leukoaraiosis),或是大腦雙側原本就存在嚴重的結構不對稱,都會干擾這種依賴鏡像對比來計算水吸收量的演算法。因此,AI 雖然能代勞圈選與計算,但放射線專科醫師在發布報告前,快速檢視軟體圈出的基準點是否避開了陳舊性軟化囊灶,依然是確保這項數值可用性的必要動作。

下次在夜間急診遇到發作時間不明的梗塞患者,即便影像科當時無法執行完整的灌注掃描,只要確保常規平掃與血管攝影品質,結合精準的雙側對稱密度量測,你依然能為神經內科提供一份守護 4.5 小時溶栓決策的關鍵報告。

Abstract

BACKGROUND AND PURPOSE: Net water uptake (NWU) in the infarct core of patients with ischemic stroke has been correlated with clinical outcome and lesion age, which could aid in treatment selection. Traditional NWU measurement requires CTP, limiting its clinical applicability. We aimed to develop and evaluate an automated method to measure NWU using only NCCT and CTA. MATERIALS AND METHODS: We included 90 patients with ischemic stroke with known onset time and available NCCT, CTA, and CTP from the Multicenter Randomized Clinical Trial of Endovascular Treatment for Acute Ischemic Stroke in the Netherlands (MR CLEAN) Registry and MR CLEAN-LATE trial. Using deep learning, we automatically segmented the infarct core and hypoperfused area from NCCT and CTA images. NWU was calculated as the relative difference in density between these affected regions and their contralateral counterparts. We included the hypoperfused area because it represents potentially salvageable tissue, and additional NWU analyses in this region could provide insights into ischemic injury progression. We compared this automated CTA-NCCT&ndash;based approach with the traditional CTP-NCCT&ndash;based approach by assessing their agreement (intraclass correlation coefficient [ICC], Bland-Altman analysis) and accuracy in identifying patients within 4.5 hours of stroke onset (receiver operating characteristic analysis, DeLong test for areas under the curve [AUC] comparison). RESULTS: NWU measured in the core (CTP-NCCT&ndash;based: median 4.1%, interquartile range [2.7&ndash;6.6]; CTA-NCCT&ndash;based: 3.2%, [2.1&ndash;5.2]) showed good agreement between approaches (ICC 0.81, 95% CI, 0.73&ndash;0.87; mean difference 0.43% [&ndash;4.6% to +5.5%]). NWU in the hypoperfused area (CTP-NCCT&ndash;based: 2.3%, [1.3&ndash;4.1]; CTA-NCCT-based: 2.4%, [0.9&ndash;3.9]) showed excellent agreement (ICC 0.93, 95% CI, 0.90&ndash;0.96; mean difference 0.17%, &ndash;1.54% to +1.88%). For core-based NWU, both approaches detected significantly lower values in patients within versus beyond 4.5 hours (CTP-NCCT&ndash;based: 3.7% versus 10%; P &lt; .001; CTA-NCCT&ndash;based: 3.1% versus 11%; P &lt; .001) with similar accuracy (AUC, 0.87; P = .88). For hypoperfused area&ndash;based NWU, neither approach showed significant differences between patients within versus beyond 4.5 hours (CTP-NCCT&ndash;based: 2.3% versus 4.4%; P = .31; CTA-NCCT&ndash;based: 2.3% versus 4.7%; P = 0.13) and both had lower accuracy than core-based NWU classification (AUC,: CTP-NCCT&ndash;based 0.59, CTA-NCCT&ndash;based 0.63; P = 0.81). CONCLUSIONS: The automated CTA-NCCT&ndash;based approach shows good agreement with the traditional CTP-NCCT&ndash;based method for NWU measurement and achieves similar accuracy in identifying patients within 4.5 hours of onset. External validation is needed to confirm these findings.