Deep Resolve Boost in 2D MRI for Neuroradiology: A Comparative Evaluation of Diagnostic Gains and Potential Risks [ARTIFICIAL INTELLIGENCE]

Hakim, A., Rohner, R., Winklehner, A., Rossel, J.-B., Lehmann, C., Wiest, R., Gralla, J., Piechowiak, E.

View Original ↗
AI 導讀 academic AI 重要性 4/5

西門子 Deep Resolve Boost 能在不掉病灶可見度的情況下大幅縮短 MRI 時間,但 84.8% 序列會產生新假影並抹平腦幹細節。

  • 高度加速的 DRB-ACC 能在 94.5% 的常規檢查中提供優良或尚可的影像畫質。
  • 整體病灶可見度高達 91.6% 等同標準影像,僅有 1.2% 出現退化,但特定區域存在風險。
  • 高達 84.8% 的加速影像會產生全新假影,海馬迴與腦幹解剖細節顯著模糊,不適合用於癲癇篩檢。

AI 重建雖然能大幅省下掃描時間,但高達 84.8% 的加速序列會無中生有產生全新假影。我們常以為深度學習重建能在不犧牲畫質的前提下縮短 MRI 時間,這篇前瞻性研究證實它確實能維持 91.6% 的病灶可見度,但代價是海馬迴與腦幹等關鍵區域的細微解剖特徵會被無情抹平。

T2與FLAIR加速極限與256組配對數據考驗

神經放射科的日常排程往往被冗長的 2D 序列塞滿,特別是高解析度的 T2 權重與 FLAIR 影像。為了在有限時間內增加檢查量,各家廠商紛紛推出基於深度學習的加速方案。本研究針對西門子的 DRB(利用深度神經網路在K空間與影像空間同步降噪的加速重建技術) 進行了嚴密的驗證。這項技術試圖打破傳統 GRAPPA(傳統平行影像加速技術,透過線圈空間分佈填補K空間) 所面臨的訊雜比(SNR)極限,宣稱能在極高的加速因子下維持影像品質。然而,對於閱片醫師而言,AI 是否會把微小病灶當作雜訊濾除,或者將雜訊重建成不存在的解剖結構,一直是揮之不去的疑慮。這篇來自瑞士伯恩大學醫院的研究,正是為了量化這些潛在風險而設計。

從 Methods 來看,研究團隊在 3T MRI 設備上執行了一項前瞻性的觀察型研究,總共收案 200 位接受常規神經放射科 MRI 檢查的病患。為了確保對比的公平性,團隊在同一次檢查中,為每一位病患擷取了標準版與 DRB 高度加速版(DRB-ACC)的配對影像。這 256 組配對的 2D 序列包含了 T2、TIRM(具有抑制特定脂肪或液體訊號特性的快速自旋回波序列) 以及 FLAIR。除了加速因子不同之外,所有的硬體條件與掃描參數,包含表面線圈、切面方向與切片厚度,皆完全一致。最後交由兩位獨立的放射科醫師進行標準化評分,評估層面涵蓋整體畫質、解剖結構清晰度、假影嚴重程度以及病灶的明顯程度。

研究流程與 2D MRI 加速考驗
條件與對象具體細節
受試病患200 位常規神經放射科患者
配對序列256 組 2D 序列 (T2/TIRM/FLAIR)
比較組別標準序列 vs DRB 高度加速版
控制變因相同線圈、切片厚度、切面方向
評分機制兩位獨立放射科醫師標準化盲測

配對前瞻性觀察數據

Table 1 的 94.5% 優良畫質與病灶可見度

把焦點轉向初步的評分結果,DRB-ACC 在整體主觀畫質上繳出了一張相當亮眼的成績單。Table 1 與臨床評分數據指出,高達 94.5% 的高度加速序列被兩位判讀醫師評定為「優良(Good)」或「尚可(Fair)」。這意味著在絕大多數的常規審閱情境下,放射科醫師並不會覺得這些經過 AI 重建的影像有明顯的視覺突兀感。當直接將 DRB-ACC 與傳統標準序列並排比較時,有 95.7% 的影像被認為畫質「改善」或「至少維持不變」,這給了臨床端極大的信心將其導入日常排程中,藉此換取可觀的掃描時間縮減。

針對放射科醫師最在意的病灶偵測能力,AI 重建同樣表現得相對穩定。統計結果顯示,在 91.6% 的案例中,DRB-ACC 對病灶的描繪能力與標準影像完全相等。更有甚者,在 7.2% 的特定案例中,得益於 AI 強大的降噪與邊緣銳化演算法,病灶的對比度與清晰度甚至超越了原本耗時極長的傳統標準影像。如果在閱片時只專注於大腦半球白質的明顯病灶(例如典型的多發性硬化症斑塊或是大範圍的缺血性中風),這套加速技術幾乎能完美替代傳統序列,同時減少病患在機台中因躁動而產生的移動假影。

DRB-ACC AI 重建在影像品質與病灶偵測的表現

絕大多數影像能維持或超越傳統品質,病灶可見度穩定

Figure 2 揭示 84.8% 全新假影與腦幹糊化

然而,當我們剝開高分畫質的表象,這項技術在特定區域的表現卻令人擔憂。若仔細審視 Figure 2 關於假影生成的統計,會發現這正是 AI 重建技術的一大隱憂。在所有的 DRB-ACC 加速序列中,有高達 84.8% 的影像出現了在傳統序列上從未見過的新型假影。此外,即使是原本就存在的輕微假影,也有 27.3% 在經過深度學習網路處理後變得更加明顯、更加惡化。這顛覆了許多人認為「AI 降噪等同於消除假影」的刻板印象。深度學習模型在面對高度降採樣的 K 空間數據時,若遇到其訓練資料庫中不常見的局部特徵,往往會以生成不自然的波紋或塊狀結構來填補資訊空缺。

這些假影並非隨機分佈,而是高度集中在特定的解剖區域,尤其是腦幹與深部灰質。由於腦幹周圍環繞著充滿腦脊髓液的基底池,腦脊髓液的搏動效應在高度加速採樣下本就容易產生相位偏移,當 AI 試圖介入修正這些偏移時,往往會產生過度平滑或是塑膠質感的條紋假影。更致命的是,判讀醫師在針對海馬迴、腦幹與小腦進行解剖結構的細部評估時,一致認為 DRB-ACC 的清晰度顯著劣於傳統序列。海馬迴內部的阿蒙角(Cornu Ammonis)分層結構,以及腦幹內部的神經束走線,在經過 AI 的強力降噪洗禮後,經常會變成均勻的灰階斑塊,失去了原有的紋理細節。

AI 加速重建帶來的解剖盲區與假影統計
負面效應指標影響比例 / 受害區域
無中生有新假影84.8%
既有假影惡化放大27.3%
解剖細節模糊區域海馬迴、腦幹、小腦
假影好發分佈區深部灰質與腦幹周邊

基於 256 組序列的假影分佈與受損區域

癲癇與後顱窩的 1.2% 劣化與常規排程適用性

這些解剖細節的喪失,直接牽動了特定臨床情境的診斷準確度。雖然整體病灶可見度極高,但在所有的配對判讀中,仍有 1.2% 的病灶在 DRB-ACC 序列中發生了明確的退化甚至難以辨識。這 1.2% 的比例看似微不足道,但如果落在關鍵區域,將可能導致嚴重的誤診。作者在討論區坦承,這種由深度學習演算法帶來的「選擇性模糊」,要求放射科醫師在套用這類高強度加速方案時,必須具備極強的防禦性思維。

在臨床適用性的界定上,這篇論文提供了非常明確的指引。如果今天的臨床適應症是癲癇篩檢(Epilepsy screening),放射科醫師必須能在 T2 與 FLAIR 上敏銳捕捉到海馬迴硬化(Hippocampal sclerosis)所帶來的極細微體積萎縮與皮質內訊號異常。在這種情境下,DRB-ACC 所造成的解剖結構模糊化是絕對不可接受的。同樣地,當臨床醫師懷疑病患有腦幹病變(例如延髓外側症候群、微小的腦幹橋腦去髓鞘斑塊,或是顱神經根部的微小腫瘤),AI 在後顱窩無中生有的假影與過度平滑效應,極有可能掩蓋掉這些致命的細微病灶。

針對放射科實戰的 AI 參數取捨與次群組建議

作為第一線的放射科醫師,我們不能因為 84.8% 的新假影率就全盤否定 AI 加速的價值,而是要學會當一個聰明的把關者。針對不同病房與門診送來的單子,我們應該在排程建立不同的 Protocol 策略。對於一般性的失智症篩檢、大範圍腦血管疾病追蹤、或是急診意識不清且極度容易躁動的病患,開啟最高強度的 DRB-ACC 絕對是利大於弊。它可以把原本需要三四分鐘的 FLAIR 縮減到一分鐘出頭,大幅降低移動假影的干擾,同時提供足夠診斷大病灶的優良畫質。

相對地,在面對特定的次專科研討會等級案例時,手動關閉或調低 AI 重建強度是必要的堅持。除了前述的癲癇與腦幹懷疑病灶外,針對那些需要精確評估大腦皮質發育不良(FCD)的年輕病患,保留傳統序列那雖然帶點雜訊、但真實反映組織紋理的影像,才能確保我們看見最真實的病理狀態。這篇研究提醒我們,AI 是一套極度強大的影像濾鏡,但放射科醫師的價值,在於判斷何時該把這層濾鏡拿掉。

下次在工作站看到完美無雜訊但海馬迴像塑膠模型一樣平滑的 FLAIR 時,別急著打 normal,先確認臨床是不是要抓初期癲癇,如果是,請放射師重掃傳統序列。

Abstract

Graphical Abstract