Multi-modal CT Perfusion-based Deep Learning for Predicting Stroke Lesion Outcomes in Complete and No Recanalization Scenarios [ORIGINAL RESEARCH]

Yang, H., George, Y., Mehta, D., Lin, L., Chen, C., Yang, D., Sun, J., Lau, K. F., Bain, C., Yang, Q., Parsons, M. W., Ge, Z.

View Original ↗
AI 導讀 academic AI 重要性 4/5

CTP 單一閾值預測梗塞體積準確率僅 15%,多模態 3D nnU-Net 將成功取栓預測力翻倍。

  • 在血管完全打通情境下,傳統 CTP 單一閾值法預測最終梗塞範圍的 Dice 分數僅有 15.73%。
  • 導入多模態 CTP 參數的 3D nnU-Net 模型,將成功取栓後的預測準確度顯著提升至 35.36%。
  • 若血管未打通,AI 模型結合核心與半影區特徵,預測最終病灶的 Dice 分數可達 50.22%。

傳統 CTP 軟體畫出的紅黑圖,可能比你想像中更不準確——在血管完全打通的病患中,常規單一閾值法預測最終梗塞體積的 Dice 分數竟然只有慘烈的 15.73%。這意味著我們日常高度依賴的灌注影像自動化軟體,嚴重低估或錯位了真實的組織壞死範圍。透過導入多模態 CTP 參數的深度學習模型,研究團隊成功將預測準確度翻倍,為急性中風的取栓決策提供了全新視角。

急性缺血性中風預測與 15.73% 的閾值盲點

在急性缺血性中風(acute ischemic stroke, AIS)的臨床處置中,準確預測最終的梗塞位置與體積是決定病患能否接受血管內取栓治療(EVT)或靜脈血栓溶解治療(IVT)的關鍵。目前,放射科醫師與神經內科醫師高度依賴 CT 灌注掃描(CTP)來評估缺血核心(ischemic core)與缺血半影區(penumbra)。我們習慣於看著工作站或自動化軟體(如 RAPID)吐出的彩色視覺化圖表,根據 CBF < 30% 或 Tmax > 6s 這樣的硬性閾值來決定 mismatch lesion volume(MLV,核心與半影區的不匹配體積)。

然而,這種基於「單一模態參數」與「固定閾值」的傳統方法,在真實世界的臨床動態變化中顯得十分脆弱。大腦組織的缺血耐受度、側支循環(collateral circulation)的代償能力,以及從影像掃描到血管真正被打通之間的時間差,都會深刻影響最終的組織存活率。固定的數值切點無法捕捉這些複雜的生理學互動。當單一閾值法試圖預測最終的組織壞死範圍時,其空間重疊度往往極低,這不僅容易誤導臨床醫師對於治療效益的評估,也可能讓部分邊緣型病患喪失了接受積極介入治療的機會。

本篇發表於 AJNR 的原創研究,正是為了解決這個存在已久的預期落差。作者群認為,既然單一參數無法涵蓋中風病灶演進的複雜性,就應該將所有的 CTP 參數圖結合起來,利用深度學習的空間特徵擷取能力來重建預測模型。這項研究的核心價值,在於它並非單純地想要取代現有的量測工具,而是直指現行方法的痛點,試圖為臨床醫師提供一個「如果血管打通了」以及「如果血管沒打通」兩種極端情境下的真實病灶預測圖像。

收案 488 例的 CR 與 NR 雙軌預測架構設計

從 Methods 來看,這是一項極具臨床針對性的多中心影像研究。研究團隊並未將所有中風病患混為一談,而是非常聰明地根據病患接受治療後的血管再通狀態,將資料集一分為二:完全再灌注(Complete Recanalization, CR)組別共納入 350 例病患,代表治療成功、血流恢復的理想情境;而無再灌注(No Recanalization, NR)組別則納入 138 例病患,代表治療失敗或未接受介入治療、血流持續阻斷的惡劣情境。

針對這兩種截然不同的生理走向,研究團隊設計了兩個獨立的深度學習預測任務。對於 CR 組,由於血管已經打通,半影區的組織理應被挽救,因此模型的預測目標被設定為「最終的梗塞核心」(infarct core)。相對地,對於 NR 組,由於缺血狀態持續,原本處於危險中的半影區最終都會走向凋亡,因此該組模型的預測目標被擴大為「合併核心與半影區的整體低灌注組織」(combined core-penumbra region)。這種將臨床預後二分法的模型設計,完美契合了第一線醫師在解釋影像時的思維邏輯。

在影像特徵的輸入端,團隊捨棄了單一指標,而是提取了多模態 CTP 參數圖,這包含了腦血流量(CBF)、腦血容積(CBV)、平均穿流時間(MTT)、延遲時間(Delay Time, DT)等綜合數據。他們將這些參數矩陣餵入 3D nnU-Net(一種能根據資料集特性自動最佳化網路架構的醫學影像切割框架) 進行訓練。為了確保預測結果的黃金標準(ground truth),研究團隊嚴格採用了病患後續追蹤的擴散磁振造影 DWI(利用水分子擴散受限來精確標定細胞毒性水腫壞死區的影像技術) 作為最終梗塞範圍的對答案基準,並透過五折交叉驗證(5-fold cross-validation)來確保模型在未見過數據上的穩健性。

研究流程與預測任務設計
分組血管狀態AI 預測目標樣本數 (n)
CR 組完全再灌注 (血流恢復)最終梗塞核心350 例
NR 組無再灌注 (血流未通)核心與半影區合併範圍138 例
對答案標準後續追蹤DWI 上的實際壞死病灶共 488 例

根據血管是否再通進行雙軌建模

血管打通預測:AI 以 35.36% 擊敗閾值法

把焦點拉到 CR(完全再灌注)組別的預測結果,這是本篇研究最引人注目,也最能突顯傳統方法缺陷的部分。在血管成功打通的病患中,我們原本期望初始 CTP 估算的核心體積與最終的梗塞體積高度吻合。然而,數據顯示,現行常規使用的「單一模態閾值法」在預測最終梗塞範圍時,其平均 Dice 分數(一種衡量兩個立體空間重疊程度的指標,滿分為 100%)僅有低迷的 15.73%

這個極低的數字反映了一個殘酷的現實:傳統的 CBF < 30% 閾值在空間分佈上,與病患幾天後 DWI 上真正死掉的腦組織幾乎搭不上邊。這可能是因為血管再通後的再灌注損傷(reperfusion injury)、微血管的無復流現象(no-reflow phenomenon),或是梗塞核心在掃描到治療期間的動態擴張,導致了初始靜態影像與最終結果的巨大偏差。單純依靠一個切點,根本無法捕捉這種動態的病理過程。

相較之下,研究團隊提出的多模態 3D nnU-Net 模型展現了壓倒性的優勢。透過綜合分析 CTP 的多個血流動力學維度,AI 模型在 CR 組的預測中達到了 35.36% 的平均 Dice 分數。雖然在絕對數值上 35.36% 聽起來並非完美,但在醫學影像切割的領域中,要在如此散發、邊緣不規則且受多重時間變數影響的再灌注梗塞病灶中取得這樣的成績,已經是將臨床現有工具的準確度直接翻倍以上的重大突破。

最終梗塞範圍預測準確度對決

多模態 3D nnU-Net 完勝傳統單一閾值法

血管未通的挑戰:NR 群組達 50.22% 準確度

若細看 NR(無再灌注)組別的數據,則呈現了另一種截然不同的影像預測樣貌。當血管無法被打通時,病灶的演進遵循著相對單純的病理機制:所有被標定為半影區的缺血腦組織,最終都會因持續的能量耗竭而不可逆地轉化為壞死的核心。這意味著預測最終病灶的任務,本質上就是預估初期影像上整個低灌注區域(Tmax 延長區域)的空間範圍。

在這個相對連續且大範圍的預測任務中,傳統單一模態閾值法的表現稍微回升,取得了 39.71% 的 Dice 分數。這是因為當預測目標是一個大且連續的區塊時,空間重疊度指標(Dice)在數學計算上本來就比較容易得到較高的分數。然而,即便有這種先天優勢,單一閾值法仍然無法精確描繪出病灶的邊緣細節,也無法區分不同腦區對缺血的異質性耐受度。

多模態深度學習模型在 NR 組別再次證明了其價值,將預測準確度一舉推升至平均 Dice 分數 50.22%。這超過一成的顯著成長,證明了整合 CBF、CBV、MTT 等多重參數的 AI 模型,比單看 Tmax 延長能更細緻地勾勒出注定走向凋亡的組織邊界。對於臨床醫師而言,這個高達五成的重疊度意味著,若評估病患不適合取栓或取栓失敗機率極高,AI 給出的預測圖將能非常具體地展示病患即將面臨的腦損傷範圍,為家屬病情解釋與後續安寧或復健照護提供強而有力的客觀依據。

跨越 39.71% 閾值極限的多模態 AI 應用範圍

儘管深度學習在兩種情境下的表現都以翻倍或顯著超越的姿態擊敗了常規閾值法,但在 Discussion 裡作者也坦承了幾項不可忽視的限制。首先,急性期拍攝的 CTP 往往切面較厚且容易帶有病患躁動的假影,而後續追蹤的 DWI 則是高解析度的磁振造影。將這兩種不同模態、不同時間點的影像進行完美的空間對位(image registration)本身就是一項巨大的工程挑戰,些微的對位誤差都會直接拉低 Dice 分數。

其次,從 CTP 掃描到實際完成再灌注治療的時間間隔(time to reperfusion)在每位病患身上都不盡相同。這個時間差是中風病灶擴展的關鍵變數,但在目前的模型設計中,尚未能完美將這個動態的時間軸作為權重特徵納入考量。此外,對於那些體積極小的點狀梗塞,AI 模型的敏感度仍有待提升。

對於第一線的放射科與神經內科醫師而言,這篇論文提供了非常實用的觀念轉變。我們必須認知到,現有商業軟體畫出的紅綠色塊,充其量只是反映「當下」的血流動力學異常,絕非「未來」組織存活的保證書。在未來,這類多模態預測模型有望直接整合進 PACS 系統,當病患做完 CTP 後,系統不僅給出當下的 mismatch 數值,還能同步生成「若成功打通」與「若未打通」兩張模擬預後圖。這不僅能協助我們在面對大核心中風(large core stroke)的灰色地帶病患時做出更精準的決策,更能為個人化的高階腦血管治療開啟新的可能。

下次看中風 CTP 時別被單一閾值畫出的小範圍核心給騙了,多模態 AI 證實:即使血管順利打通,實際壞死的範圍往往遠超出那條死板的界線。

Abstract

BACKGROUND AND PURPOSE:Predicting the final location and volume of lesions in acute ischemic stroke (AIS) is crucial for clinical management. While CT perfusion (CTP) imaging is routinely used for estimating lesion outcomes, conventional threshold-based methods have limitations. We developed specialized outcome prediction deep learning models that predict infarct core in successful reperfusion cases and the combined core-penumbra region in unsuccessful reperfusion cases.MATERIALS AND METHODS:We developed single-modal and multi-modal deep learning models using CTP parameter maps to predict the final infarct lesion on follow-up diffusion-weighted imaging (DWI). Using a multi-center dataset from multiple sites, deep learning models were developed and evaluated separately for patients with complete recanalization (CR, successful reperfusion, n=350) and no recanalization (NR, unsuccessful reperfusion, n=138) after treatment. The CR model was designed to predict the infarct core region, while the NR model predicted the expanded hypoperfused tissue encompassing both core and penumbra regions. Five-fold cross-validation was performed for robust evaluation.RESULTS:The multi-modal 3D nnU-Net model demonstrated superior performance, achieving mean Dice scores of 35.36% in CR patients and 50.22% in NR patients. This significantly outperformed the current clinical used method, providing more accurate outcome estimates than the conventional single-modality threshold-based measures which yielded dice scores of 15.73% and 39.71% for CR and NR groups respectively.CONCLUSIONS:Our approach offered both successful reperfusion and unsuccessful reperfusion estimations for potential treatment outcomes, enabling clinicians to better evaluate treatment eligibility for reperfusion therapies and assess potential treatment benefits. This advancement facilitates more personalized treatment recommendations and has the potential to significantly enhance clinical decision-making in AIS management by providing more accurate tissue outcome predictions than conventional single-modality threshold-based approaches.ABBREVIATIONS: AIS=acute ischemic stroke; CR=complete recanalization; NR=no recanalization; DT=delay time; IQR=interquartile range; GT=ground truth; HD95=95% Hausdorff distance; ASSD=average symmetric surface distance; MLV=mismatch lesion volume.