Clinical Evaluation of Scout Accelerated Motion Estimation and Reduction (SAMER) Motion-Corrected 2D T2-Weighted TSE 3T Brain MRI in the Neurologic Intensive Care Unit [ARTIFICIAL INTELLIGENCE]

Hajati, A., Chiang, C.-H., Buathong, S., Tabari, A., Yee, S., Polak, D., Splitthoff, D. N., Clifford, B., Lo, W.-C., Huang, Y., Cauley, S. F., Conklin, J. M., Huang, S. Y.

View Original ↗
AI 導讀 academic MR 重要性 4/5

針對加護病房病患,SAMER 演算法能顯著降低 2D T2 影像晃動假影,且原圖勝出率不到 2%,無須加裝硬體即可常駐開啟。

  • SAMER 使兩位閱片者的平均晃動分數從 0.79 與 0.68 顯著降至 0.62 與 0.52 (P < .001)。
  • 盲測顯示 SAMER 影像在 22-23% 案例中較受偏好,而原始影像勝出率低於 2%。
  • 演算法無法憑空補回嚴重位移流失的訊號,極端晃動仍會導致校正不均與整體品質下降。

標榜去假影的演算法往往在病人沒亂動時反而糊化影像,但在神經加護病房的實測中,SAMER 修正後的影像在 22%–23% 案例中勝出,而原圖勝出的比例竟不到 2%。這套無須額外硬體的技術,正悄悄改寫常規腦部 T2 序列的容錯率。

神經加護病房 2D T2 序列的晃動難題

為神經內外科加護病房(Neuro-ICU)的病患執行磁振造影,往往是一場與時間和病患躁動程度的搏鬥。這類病患常因意識不清、譫妄、疼痛或呼吸器牽引而無法維持絕對靜止。在所有常規序列中,2D T2-weighted TSE(利用連續回訊信號加速取像的常見序列) 是評估腦實質水腫、缺血性變化與佔位性病灶的基礎,但其對假影極度敏感。只要病患在相位編碼方向上出現輕微吞嚥或頭部偏轉,K 空間(k-space)的數據收集就會錯位,導致影像出現鬼影(ghosting)或模糊,進而影響診斷信心。

傳統解決方案多半依賴物理約束或深度鎮靜,這不僅增加醫療風險與照護成本,也大幅拖慢了排程效率。另一種方式是加裝光學攝影機或配戴標記物來進行硬體端的動態追蹤,但對於插滿管線的加護病房病患而言,架設這些硬體極度不切實際。麻省總醫院(MGH)與西門子醫療團隊攜手,將目光轉向了純軟體層面的解決方案:SAMER(利用導航掃描快速估算並扣除晃動軌跡的技術)

本研究的核心價值在於,它將這套回溯性動作校正(Retrospective Motion Correction)技術直接嵌入臨床常規的掃描流程中,不改變原本的參數設定,也不需要技師進行額外學習。更重要的是,作者透過嚴格的盲化與雙重評分機制,試圖回答一個放射科醫師最在意的問題:當我們打開這套演算法,它到底能挽救多少失敗的影像?又是否會在病患乖乖躺好時,反而引發不必要的運算假影而毀了原本清晰的畫面?

Table 1 收錄的 275 位 3T MRI 真實受試者

從 Methods 來看,這是一項前瞻性、單一醫學中心(麻省總醫院)的臨床評估研究。研究團隊在 2024 年 3 月至 9 月期間,針對神經內外科加護病房中接受腦部 3T MRI 掃描的病患進行收案。最終納入 275 位符合條件的受試者,這群病患的組成高度反映了重症醫療現場的真實樣貌,包含了各類急性腦損傷、中風、腫瘤術後及腦外傷等適應症。

所有的影像皆於配置在加護病房區的 3T 掃描儀上完成。每位病患均接受了內建 SAMER 動態校正框架的 2D T2-weighted TSE 序列。為了確保評估的客觀性與嚴謹度,研究設計了兩套完全獨立的盲化評估機制,並將原始影像與經過 SAMER 處理的影像進行隨機打亂,確保閱片醫師在評分時無法辨識影像的處理來源。

第一套評估機制採用絕對分數評級:由兩位具備豐富經驗的放射科醫師(Rater 1 與 Rater 2)針對個別影像系列進行獨立評分,給予一個量化的晃動假影分數。第二套機制則是直球對決的「頭對頭(Head-to-head)偏好度測試」:由另外兩位神經放射科醫師執行,將原始影像與校正後影像並排顯示,強制要求他們選出在整體診斷品質上較佳的一方,或者判定兩者無顯著差異。

統計分析方面,團隊採用了 Wilcoxon 符號秩檢定來比較修正前後的絕對分數差異。為了驗證評分者的穩定度,計算了 ICC(評估多位醫師評分一致性的統計指標)。此外,也運用了 Cohen kappa(排除隨機猜測後衡量觀察者一致性的指標) 來探討醫師們在主觀影像品質偏好上是否具有高度共識。這種雙軌並行的驗證設計,有效避免了單一評分量表可能帶來的定錨效應。

研究流程與評估設計
項目內容細節
收案來源與時間麻省總醫院 (MGH) / 2024年 3-9月
受試者與設備275 位神經加護病房病患 / 3T MRI
核心序列2D T2-weighted TSE 搭配 SAMER
評分機制一 (絕對分數)Rater 1 & Rater 2 獨立評估晃動嚴重度
評分機制二 (偏好測試)由另外兩位醫師進行頭對頭 A/B 盲測

雙重盲化評分機制確保結果客觀性

Figure 2 分數下降與 23% 偏好度勝出

把焦點拉到 Results 的核心數據,SAMER 展現了明確且具備統計意義的修正效果。在絕對分數評級方面,兩位閱片者的評分皆呈現顯著下降(分數越低代表晃動假影越少)。Rater 1 給出的平均晃動分數從原始的 0.79 降至 0.62;而 Rater 2 的平均分數則從 0.68 降至 0.52。這兩組數據的 P 值皆小於 .001,證實了 SAMER 在群體層次上確實能有效抑制假影。特別值得注意的是,對於那些初始就表現出「至少有輕微晃動」的次群組案例,分數改善的幅度更為巨大。

在評分可靠度方面,兩位評分者在原始影像上的 ICC 高達 0.92,在校正後影像上的 ICC 亦維持在 0.90 的極高水準。這表示該分數下降並非來自醫師個人的主觀寬容,而是影像品質確實出現了具備高度共識的客觀提升。而在由另外兩位神經放射科專家執行的頭對頭偏好測試中,數據帶來了極具臨床指導意義的發現。

測試結果顯示,在 22% 至 23% 的案例中,閱片醫師明確表示「偏好 SAMER 校正後的影像」。相對地,選擇「偏好原始影像」的比例被壓縮在極微不足道的不到 2% 空間裡。這意味著在將近四分之三(約 75%)的案例中,醫師認為兩者沒有顯著差異。這種「大量平手」的現象在臨床上其實是個極好的消息:它代表當病患完全靜止、原圖本來就很完美時,SAMER 並不會像某些早期 AI 濾鏡那樣過度平滑化或無端生出假結構。它具備了「該出手時能救回兩成病患,不該出手時幾乎不會幫倒忙」的優異穩定性。

Rater 1 與 Rater 2 絕對晃動分數變化

分數越低代表假影越少,P < .001

Table 3 揭示極端晃動下的局部修正不均勻

然而,任何影像處理演算法都有其物理極限,本研究的 Discussion 段落誠實記錄了 SAMER 在特定極端條件下遇到的挑戰。雖然絕大部分的影像獲得了改善,但仍有一小部分案例在經過 SAMER 處理後,反而出現了晃動分數微幅上升,或者在同一個視野內產生了「不均勻校正(inhomogeneous correction)」的現象。這類狀況特別容易發生在具有高頻率、非週期性劇烈抽搐的病患身上。

若細看醫師間的 Kappa 一致性分數,可以發現一個極具啟發性的現象:在「減少晃動假影」這個單一維度上,醫師間取得了中度一致性(moderate agreement, κ = 0.61)。但是,當評估標準放大到「整體影像品質(overall image quality)」時,一致性卻大幅滑落至僅有尚可程度(fair agreement, κ = 0.39)。為什麼會有這種落差?

理由在於,當病患產生極端晃動時,SAMER 雖然成功算出了空間位移並嘗試把 K 空間的訊號「拼回去」,去除了明顯的鬼影,但過度劇烈的位移會導致部分解剖層面的原始訊號根本沒有被線圈正確擷取到。這就使得校正後的影像雖然沒有假影,但整體的訊噪比(SNR)或灰白質對比度已經受損。此時,有些醫師會因為「至少沒有條紋干擾」而給予好評,但另一些醫師則會因為「解剖細節模糊、對比不均勻」而給出低分。這項數據精準點出了動作校正技術的極限:演算法可以修正錯位的像素,但無法無中生有地補回那些因為病人劇烈翻滾而完全流失的磁振訊號。

醫師評分一致性 (Kappa & ICC) 分析
評估指標數值表現臨床意義解讀
原始影像 ICC0.92極高:醫師對原始假影嚴重度具備高度共識
校正後影像 ICC0.90極高:評分改善並非出自單一醫師主觀放水
假影減少 Kappa0.61中度:多數認可演算法去除了鬼影與條紋
整體品質 Kappa0.39尚可:對極端晃動導致的對比流失容忍度不一

揭示極端狀況下醫師對整體品質的主觀分歧

放射科醫師導入 SAMER 的三個實務界線

從這份針對神經加護病房的完整實測報告中,第一線放射科醫師可以萃取出幾個明確的實務操作方針。首先,由於 SAMER 完全不需要額外的追蹤硬體,且被證實在靜止病患身上造成反效果的機率不到 2%,這賦予了我們在操作台端極大的彈性。對於排程緊湊的醫院,強烈建議將這套演算法設為加護病房病患的「預設開啟(Default On)」選項,這能穩定提升大約兩成病患的影像可用率,進而減少因重新掃描所浪費的寶貴時段。

其次,我們必須建立正確的期待值。SAMER 是一套極佳的「輕中度晃動救援工具」,而不是「萬能解藥」。當面對因嚴重譫妄而持續劇烈搖晃頭部的病患時,就算演算法在背景滿載運算,最終產出的影像仍可能存在不均勻校正的問題。因此,對於明顯無法配合的重度躁動個案,傳統的臨床處置——例如會診麻醉科進行適當深度的鎮靜——依然是保障影像診斷品質不可或缺的一環。不能因為有了軟體校正,就完全放棄前置的病患安撫與固定準備。

最後,目前這套框架在 3T 磁振造影的 2D T2-weighted TSE 序列上取得了極佳的臨床實證,但神經重症的完整評估通常還涵蓋了 FLAIR、DWI 以及 T2* 等不同對比權重的序列。未來的挑戰在於如何將這種基於導航掃描的動態估算技術,平滑地延伸到其他對位移同樣敏感的序列上。在此之前,當你在工作站上看到具有輕微殘留模糊、但整體結構清晰的 SAMER 處理影像時,請理解這已經是演算法在物理限制下為你爭取到的最佳診斷視野。

面對神經重症病患,與其反覆重做 T2 浪費時間,不如將 SAMER 設為預設常駐,它救不回來的影像通常你也只能依靠鎮靜劑了。

Abstract

BACKGROUND AND PURPOSE: Patient motion remains a major source of image degradation in clinical MRI, particularly in acute and inpatient settings. We evaluated the clinical effectiveness of the Scout Accelerated Motion Estimation and Reduction (SAMER) method for retrospective motion correction in axial 2D T2-weighted TSE brain MRI, particularly in emergency and inpatient neurologic settings, where patient motion commonly degrades image quality. MATERIALS AND METHODS: This prospective single-center study included 275 patients undergoing brain MRI on a 3T MRI scanner located in the neurologic intensive care unit between March and September 2024. Each patient received a T2-weighted TSE sequence embedded with the SAMER motion correction framework. Motion artifacts were assessed using 2 approaches in a blinded, randomized fashion: 1) a motion grading scale applied to individual image series before and after SAMER correction by 2 experienced radiologists, and 2) a head-to-head preference test comparing original and motion-corrected images, evaluated by 2 additional neuroradiologists. Statistical analysis included the Wilcoxon signed rank test, intraclass correlation coefficients (ICC), and Cohen kappa agreement scores. RESULTS: Motion scores improved significantly after SAMER correction, with average motion grades reduced from 0.79 to 0.62 (Rater 1) and 0.68 to 0.52 (Rater 2) (P &lt; .001 for both). For cases exhibiting at least minimal motion, the improvement was even more pronounced. ICCs were high for both original (0.92) and postcorrection (0.90) ratings, indicating excellent interrater reliability. In the head-to-head comparison, SAMER-corrected images were preferred in 22%&ndash;23% of cases, with the original images preferred in fewer than 2%. Cohen kappa showed moderate interrater agreement ( = 0.61) for motion artifact reduction and fair agreement ( = 0.39) for overall image quality. A small subset of cases exhibited unexpected results, such as increased motion scores or inhomogeneous correction, suggesting areas for further refinement. CONCLUSIONS: SAMER significantly reduces motion artifacts in 2D T2-weighted TSE brain MRI performed in the neurologic intensive care unit, improving diagnostic image quality. The method is reliable across multiple raters, integrates seamlessly into clinical workflows, and offers a promising motion correction solution without additional hardware requirements. Further research is warranted to optimize performance under extreme motion conditions and across additional MRI sequences.