Automated In-line Normalization Procedure for BOLD-CVR Using the Resting-State Temporal Shift with Machine Learning [NEUROVASCULAR/STROKE IMAGING]

Zhu, Y., Dogra, S., Wang, X., Polimeni, J. R., Dehkharghani, S.

View Original ↗
AI 導讀 academic MR 重要性 4/5

史丹佛團隊利用機器學習分析靜息態磁振造影的時間偏移,成功在不依賴小腦的前提下,將腦血管反應性的預測誤差壓低至 5.61%。

  • 傳統小腦常規化在評估大血管狹窄的 CVR 時,會產生高達 27.6% 的平均誤差。
  • 整合靜息態 BOLD 訊號延遲的機器學習模型,能將基準 CVR 預測誤差降至 5.61%。
  • 無需解剖學的健側對照,該演算法能獨立重劃雙側血管病變的真實異常缺血區域。

傳統用小腦當作雙側血管狹窄的血流基準會帶來高達 27.6% 的誤差。史丹佛團隊利用機器學習分析靜息態磁振造影的時間偏移,成功在不依賴小腦的前提下,將腦血管反應性的預測誤差壓低至 5.61%,讓雙側病變的評估不再無據可循。

雙側大血管阻塞的 27.6% 基準值誤差盲點

在探討腦血流動力學受損程度時,CVR(腦血管反應性,評估血管擴張代償能力的指標)是放射科醫師判斷病患是否需要介入治療的重要依據。我們通常會結合 ACZ(乙醯胺基酚類血管擴張劑,常作利尿或降眼壓用)與 BOLD-MRI(血氧濃度相依磁振造影,利用去氧血紅素具順磁性來反映局部血流)來進行誘發試驗。然而,BOLD 訊號本身是相對數值,沒有絕對單位的物理量,因此在計算 CVR 時,必須除以一個「健康基準區」的數值來完成常規化(normalization)。

若要理解這篇研究的價值,我們必須先看見現行臨床流程的局限。對於單側頸動脈或中大腦動脈狹窄的病患,我們理所當然地拿對側健康大腦半球當作對照組。但面對雙側頸動脈嚴重狹窄、煙霧病(Moyamoya disease)或多發性顱內動脈硬化等雙側病變(bilateral disease)時,對側大腦早已失去參考價值。此時,臨床上最常見的妥協方案是將小腦後循環視為基準。

然而,這篇來自史丹佛大學與紐約大學團隊的研究指出,小腦常規化是一個充滿瑕疵的妥協。前循環與後循環的血管床特性、交感神經分布以及對 pCO2 或擴張劑的原始血管張力本就不同。強行以小腦為基準,往往會掩蓋大腦半球真實的血流耗竭狀態,甚至因為交叉性小腦失聯休克(大腦皮質受損導致對側小腦代謝與血流隨之下降的現象)而產生嚴重的基準偏移。作者因此提出一個大膽的假設:我們能否完全拋棄解剖學上的對側或小腦,單憑病患自身的靜息態(resting-state)影像,利用機器學習找出隱藏的「健康體素」,並以此重建基準?

22 例單側狹窄與 32 個動脈分區的特徵萃取

進入收案細節,為了教導機器學習模型認得「什麼是健康的 BOLD 訊號動態」,研究團隊首先建立了一個嚴格控制的單側病變佇列。他們回溯了 22 位患有嚴格單側顱內動脈狹窄阻塞(SOD,顱內動脈狹窄阻塞,如動脈硬化斑塊導致的管腔縮小)的病患,這些病患總共進行了 28 次 ACZ-BOLD 誘發造影。在這些單側病患中,我們有完美的解答(ground truth):患側是病態的,而健側是相對正常的。

數據分析方面,團隊先將大腦分割為患側與健側的遮罩(masks)。接著,他們並不依賴施打 ACZ 後的影像來尋找健康特徵,而是提取施藥前的 rs-BOLD(靜息態 BOLD,不需給藥或做任務的純背景腦造影)基線資料。研究團隊計算了高達 32 種不同的時間延遲(temporal shifts),這是因為血液在狹窄血管中流動會產生低頻訊號的相位滯後;同時,他們將這 32 個最大相關係數數值,嚴格對應並限制在 32 個成對的動脈支配區域中。

為了進一步強化模型的泛化能力並提供絕對健康的基準參考,作者額外引入了來自 HCP(收集大量健康大腦影像的公開資料庫)的 20 位完全健康受試者影像。在 HCP 數據中,所有的體素(voxels)都被標記為正常。透過結合解剖位置、血管參數以及靜息態的時間偏移特徵,團隊訓練出一個 Ensemble model(集成模型,結合多個弱模型產生強預測並降低變異性的機器學習演算法),專門用來預測在沒有誘發劑的情況下,哪些體素具備「健康參考區」的潛力。

研究收案與模型訓練佇列設計
受試者群體數量 / 條件說明
單側狹窄病患 (SOD)22 例 (共執行 28 次 ACZ-BOLD),提供患側與真實健側基準
健康受試者 (HCP)20 例,提供絕對正常的體素特徵與基準數據補充
雙側病變病患9 例,作為概念驗證 (Proof of Concept) 評估重劃異常區效果
特徵萃取方法32 種靜息態時間延遲特徵,對應 32 個大腦動脈支配分區

結合真實狹窄病患與開源健康數據

Table 1 呈現的 5.61% 平均預測誤差與 AUC 0.81

將目光轉向這套自動化常規化流程的實際表現。根據論文中 Table 1 與結果段落的量化數據,這個集成模型在預測候選健康體素方面,達到了 0.81 的 AUC(接收者操作特徵曲線下面積,評估二元分類能力的指標),顯示其在區分正常與異常血液動力學動態上有著優異的辨識力。

進一步拆解核心預測誤差,這正是整篇論文最驚艷的數據所在。當我們將模型預測出來的 CVR 基準值,拿去與真實健側大腦的 CVR 參考值比對時,模型預測中位數參考 CVR 的 MAPE(中位數絕對百分比誤差,衡量預測值與真實值差距的穩定指標)僅為 7.28% [95% CI: 3.48–10.34];而預測平均參考 CVR 的誤差更是低至 5.61% [95% CI: 2.90–9.86]。

為了證明這個方法的優越性,作者將之與兩種現行做法進行了對比統計分析。如果採用最粗暴的「全腦平均常規化(naïve whole-brain voxel selection)」,集成模型的預測誤差顯著更低(預測中位數與平均數的 p 值分別為 p=0.005p=0.048)。更重要的是,當與我們放射科日常最愛用的「常規小腦常規化(conventional cerebellar normalization)」相比時,小腦基準帶來的誤差高得嚇人:中位數誤差達 26.4% [95% CI: 10.1–40.3],平均誤差達 27.6% [95% CI: 23.7–33.2]。這組懸殊的數據(5.61% 對比 27.6%)直接宣判了小腦在單側/雙側狹窄病患中作為 CVR 基準的不可靠性。

不同常規化方法之參考 CVR 預測誤差

機器學習法誤差顯著低於傳統全腦平均與小腦常規化

Figure 3 顯示 9 例雙側病變的異常區域重劃

針對最棘手且缺乏真實解答的雙側病變,作者特別挑選了 9 例雙側 SOD 病患進行概念驗證(proof of concept),這些結果生動地呈現在 Figure 3 的圖像比較中。在這些雙側嚴重狹窄的病患腦中,因為缺乏廣泛的健康組織,如果用傳統方法,整顆大腦的 CVR 數值會呈現災難性的全面低落,甚至出現偽影般的廣泛竊血現象(steal phenomenon,缺血區血管擴張到極限,導致給藥後血流反而被周邊相對正常區吸走的現象)。

若細看 Figure 3 的演算法介入結果,集成模型在這些雙側病變大腦中,找出的「候選健康體素」比例與總體積,確實顯著低於正常健康人的大腦,這完全符合雙側廣泛缺血的生理現實。然而,令人振奮的是,模型硬是從這些夾縫中(例如尚未受波及的局部皮質)辨識出了具備正常靜息態時間偏移特徵的微小體積,並以這些體積作為常規化的錨點。

經過這種內嵌式(in-line)的自動化常規化處理後,放射科醫師在視覺主觀判定上,能獲得顯著改善的異常區域描繪(delineation of putatively abnormal regions)。原本糊成一片的藍色(低反應區)與假性紅色(代償區),在重新校準基準線後,真正處於耗竭邊緣的分水嶺地帶(watershed areas)立刻凸顯出來。這種不仰賴大面積解剖對照,而是依賴「微觀訊號動態」的校準方式,極大地提升了雙側病患 BOLD-CVR 影像的診斷信心。

臨床應用邊界與 HCP 資料庫的掃描器差異

回歸臨床現實,作者在討論環節也坦承了這套方法的邊界與潛在限制。首先,引入 HCP 資料庫雖然豐富了健康體素的特徵庫,但 HCP 的掃描協議(如 3T 磁場、多頻段回波平面造影 multiband EPI)與我們臨床上針對中風病患可能使用的常規序列或 1.5T 掃描器,存在著難以完全忽視的領域偏移(domain shift)。如果各家醫院要將此模型導入 PACS 系統,可能需要針對自家的掃描參數進行微調。

從影像科的日常應用來看,單純依賴 rs-BOLD 的時間偏移特徵,仍然建立在一個生理假設上:即局部的神經血管耦合(neurovascular coupling)在給予血管擴張劑前後的基本動力學維持恆定。如果在極度嚴重的末期煙霧病患中,其微血管床已經發生了根本性的重塑(remodeling),靜息態的訊號延遲可能無法完美線性預測擴張後的反應。此外,靜息態 BOLD 容易受到患者頭部微小晃動與靜脈竇假影的干擾,這對前端的影像對位與去噪預處理提出了極高的要求。

然而,對於忙碌的放射科醫師來說,這篇論文提供了一個強而有力的實務武器。當你下次面對一份雙側頸動脈狹窄或多發顱內血管硬化的 ACZ-BOLD 報告,且發現小腦區域的訊號看起來不夠均勻,或者病患整體 CVR 呈現不合理的全局性下降時,請記住小腦常規化可能自帶將近三成的巨大誤差。未來,隨著這類自動化特徵提取軟體整合進掃描儀(in-line procedure),我們將能直接獲得經靜息態校準的 CVR 參數圖,大幅減少因選錯基準區(Reference Region of Interest)而導致的誤診機率。

面對雙側狹窄導致 CVR 圖像全盤皆墨時,別盲目信任小腦基準帶來的偽影;利用靜息態 BOLD 時間偏移找出的健康體素,才是揭示真實缺血熱區的最佳解。

Abstract

BACKGROUND AND PURPOSE:Cerebrovascular reactivity (CVR) is commonly used to estimate hemodynamic impairment. Conventional use is best suited to unilateral vascular disease, such that CVR can be normalized to reference values from the contralateral hemisphere or to posterior circulation territories; however, major confounds have been identified that leave implementation difficult in more common cases of bilateral disease, even despite common cerebellar normalization. Recently, we reported data-driven identification of candidate healthy voxel signatures learned from contemporaneous imaging data. Here, we introduce an entirely inline, automated approach exploiting the dynamics of resting-state BOLD (rs-BOLD) signal from the BOLD baseline, hypothesizing prediction to within ten percent error relative to ground truth healthy-voxel CVR values.MATERIALS AND METHODS:22 subjects with strictly unilateral intracranial steno-occlusive disease (SOD) underwent 28 CVR studies under pharmacologic provocation using acetazolamide with BOLD-MRI (ACZ-BOLD). Separate affected and unaffected hemispheric masks were segmented to train machine learning models to learn signatures of the unaffected hemisphere using the rs-BOLD baseline, as well as anatomic and vascular parameters. Twenty additional healthy subjects from the Human Connectome Project supplemented training, wherein all voxels were classified normals. 32 distinct time-delays were computed voxelwise, with 32 maximum correlation values constrained to each of 32 paired arterial territories. Performance in prediction of ground-truth reference CVR was computed and compared.RESULTS:The ensembled model achieved AUC of 0.81 in predicting candidate unaffected voxels, demonstrating strong performance in estimation of normal-hemisphere CVR (median absolute percent error [95%CIs] 7.28[3.48–10.34] and 5.61[2.90–9.86] to predict median and mean reference CVR), exhibiting significant improvements over naïve whole-brain voxel selection (P=0.005 and P=0.048, respectively) or conventional cerebellar normalization (26.4[10.1–40.3] median and 27.6[23.7–33.2] mean). In nine bilateral cases assessed to illustrate potential use, the proportion of candidate voxels and corresponding volumes predicted by the ensembled model was significantly lower than in most healthy hemispheres, but yielded subjectively improved delineation of putatively abnormal regions.CONCLUSIONS:We demonstrate feasibility of learning unaffected reference voxel CVR signatures for BOLD-CVR MRI. The approach facilitates extension of brain CVR beyond existing constraints in subjects with bilateral disease.