When AI Meets Coronary CT: Overcoming Challenges and Enhancing Accuracy in CAD-RADS Reporting.

Dong Weikai, Fan Jiaming, Li Wei

View Original ↗
AI 導讀 academic AI 重要性 4/5

全自動化冠狀動脈鈣化評估系統不僅將單例運算縮短至 57 秒,更意外揪出 15.9% 人類漏看的微小病灶。

  • 在 2985 例驗證中,AI 測量整體 Agatston score 的 ICC 高達 0.99,但重度鈣化區間 (>400分) 出現較大偏差。
  • 假陽性僅 0.11/例,其中主動脈壁鈣化最常被誤判為 LM (75.3%),心包膜鈣化易誤判為 LCX (32.1%)。
  • 演算法的主要盲點集中在 RCA,佔了所有漏看假陰性病灶的 39.2%,閱片時需人工特別留意。

看似 AI 演算法誤判的 333 個假陽性鈣化點中,經過資深主治醫師覆核後,竟然有高達 15.9% 是人類放射科醫師當初漏看的真實病灶。

從 30 分鐘縮短到 57 秒的無對比劑冠狀動脈 AI 自動評估

自從 1990 年 Agatston score 被提出以來,評估冠狀動脈鈣化(CAC)始終高度依賴放射線人員的手動圈選,不僅耗時且容易受到觀察者主觀疲勞影響。過去雖然有學者嘗試開發多圖譜(multi-atlas)為基礎的自動化模型,但為了把病患的影像與圖譜對齊,需要進行極度耗算力的非剛性影像對位,單一病例的處理時間往往長達 30 分鐘,根本無法融入高週轉率的臨床常規作業。

近期的端到端(end-to-end)深度學習模型雖然速度較快,卻面臨另一個致命傷:演算法缺乏空間解剖概念,經常把心瓣膜或主動脈壁上的鈣化點誤認為冠狀動脈病灶。為了突破這個瓶頸,本研究團隊提出結合圖譜概念與語意分割技術的深度學習自動評估系統(CAC_auto)。這套系統能在完全無對比劑的低對比度 CT 影像中,自動辨識出主動脈根部、心室與冠狀動脈樹,將運算時間壓縮至平均 57 秒,並大幅降低心外鈣化造成的雜訊干擾。

跨越三種臨床情境的 2985 例驗證與 3D U-Net 訓練細節

在無對比劑的 CT 影像上直接標記冠狀動脈與周邊軟組織幾乎是不可能的任務。研究團隊巧妙地先拿 100 例含有對比劑的 CCTA(冠狀動脈電腦斷層血管攝影)影像進行人工精細標註,接著透過 affine registration(將影像平移縮放對齊的基礎對位法)與 B-spline registration(處理局部軟組織形變的進階非剛性對位),把 CCTA 的解剖標籤完美轉移到同一位病患的無對比劑 CAC 影像上,以此生成乾淨的黃金標準訓練集。隨後,他們投入這些 64×64×64 像素的三維區塊,訓練出專門辨識解剖構造的 3D U-Net(自動學習立體影像特徵的切割神經網絡)。

為了驗證演算法的強健性,團隊調取了高達 2985 位病患的龐大資料庫,這些影像由 GE 與 Siemens 兩大廠牌、四種不同型號的 CT 掃描儀取得。受試者被嚴格劃分為三種完全不同的臨床情境:最大宗的無症狀健檢篩檢組(2647 例)、確診需測量血流儲備分數的 FFR 有症狀組(220 例),以及合併二尖瓣脫垂的瓣膜疾病組(118 例)。所有的參考標準(CAC_hand)皆由閱片經驗超過 50,000 例的資深放射科醫師親自覆核確認。

跨越三種臨床情境的 2985 例驗證與 3D U-Net 訓練細節
次群組病患數量平均年齡無鈣化 (Agatston=0) 比例
Screening (無症狀健檢)2647 例54.1 歲62.5%
FFR (有症狀冠心病)220 例60.9 歲19.5%
Valve (瓣膜疾病)118 例52.7 歲54.2%

不同臨床情境的病患組成與 Agatston Score 盛行率

Table 2 揭示的極高 ICC 與 Figure 4 嚴重鈣化區的偏移

從整體病患層級來看,這套自動化系統的表現幾乎完美。Table 2 顯示,整體 Agatston score 的 ICC(組內相關係數,評估兩者測量一致性的指標)高達 0.99。若進一步拆解到個別血管,LAD(左前降支)與 RCA(右冠狀動脈)的 ICC 均為 0.99,LCX(左迴旋支)為 0.96,而解剖構造相對複雜的 LM(左主幹)也有 0.91 的高水準表現。在臨床最看重的心血管風險分級(0、1–10、11–100、101–400、> 400 分)上,AI 系統的線性加權 kappa 值達到 0.94,高達 93.9%(2804/2985)的病患被精準分派到完全正確的風險級距。

然而,如果細看 Figure 4 的 Bland-Altman 散佈圖,就會發現隱藏在完美 ICC 背後的偏移現象。在整體資料中,自動與手動圈選的 95% 一致性界限(limits of agreement)落在非常集中的 1.6 ± 52.2 區間。但是,當我們把鏡頭拉近到嚴重鈣化(Agatston score > 400)的次群組時,這個一致性界限瞬間擴大到了 37.7 ± 197.0。這個現象提醒我們,極高的 ICC 往往得益於樣本數據分布範圍極廣,但在面對大片嚴重鈣化的病灶時,AI 自動計算出的絕對數值依然可能產生不可忽視的實體偏差。

各冠狀動脈分支的 Agatston Score ICC

數值為組內相關係數 (ICC) 乘上 100;整體準確度極高,LM 區域稍微較弱

Table 4 剖析 333 個假陽性來源與 RCA 佔據 39% 的盲區

病灶層級的精細分析是這篇論文最具價值的部分。在全數 2985 位病患中,人工總共揪出了 6218 個鈣化點,AI 成功抓到了其中的 5800 個,病灶敏感度高達 93.3%,且每位病患平均只會產生 0.11 個假陽性病灶,遠低於過去文獻動輒 1.0 到 4.7 的高誤報率。根據 Table 4 的統計,333 個假陽性中,最大宗來自影像雜訊與假影(29.1%),其次是主動脈壁鈣化(25.5%)與心包膜鈣化(24.3%)。值得注意的是,高達 75.3% 的主動脈壁鈣化會被 AI 誤植到 LM 區域,而 32.1% 的心包膜鈣化則會被強行安插給 LCX。

最令人拍案叫絕的數據同樣藏在 Table 4 裡:在被系統列為「假陽性」的 333 個病灶中,竟然有 15.9%(53 個)經過重新審視後,確認是人類放射科技術員當初漏看、被影像雜訊掩蓋的微小真病灶。也就是說,如果扣除純粹的影像雜訊與這批「因人類失誤而背鍋」的假陽性,這套系統在真實解剖結構上的假陽性率其實低到只有 0.06 / 每次掃描。不過,在 418 個被 AI 漏看的假陰性病灶中,RCA 區域包辦了壓倒性的 39.2%(164/418),這無疑是未來演算法必須補強的最大弱點。

333 個假陽性病灶來源與誤判熱區
假陽性來源病灶數量佔比最常見誤判解剖位置
影像雜訊或假影9729.1%廣泛分佈
主動脈壁鈣化8525.5%75.3% 誤植為 LM
心包膜鈣化8124.3%32.1% 誤植為 LCX
實為真病灶 (人類漏看)5315.9%原即為冠狀動脈鈣化

高達 15.9% 的假陽性其實是人類漏看的真病灶

放射科實務應用邊界與超過 400 分 Agatston 的覆核建議

作者坦承,儘管動用了將近三千例的龐大資料庫,且涵蓋了不同的 CT 機型與臨床情境,本研究終究受限於單一醫學中心的過往回溯性資料。特別是在大於 400 分的重度鈣化群體中,僅有 116 名受試者,這個數量級對於驗證 AI 模型在極端病態下的穩定度而言仍然稍嫌薄弱。此外,在瓣膜疾病次群組中,AI 的風險分級 kappa 值(0.82)明顯低於無症狀健檢組(0.94),顯示當心臟結構因結構性心臟病而發生重塑時,AI 的解剖定位能力仍會受到一定程度的考驗。

站在臨床實務的角度,這套全自動化系統對於堆積如山的健檢篩檢件來說,絕對是釋放放射科醫師勞動力的利器。在一般情況下,你可以完全信任其產出的陰性結果與輕度風險分級。然而,演算法目前的盲區也非常明確:它容易被主動脈與心包膜的鄰近鈣化騙過,也容易漏看伴隨明顯心臟跳動假影的右冠狀動脈小病灶。只有當我們清楚知道 AI 在何處會犯錯,這項工具才能真正無縫融入現代醫學影像的快節奏工作流中。

面對 AI 產出的自動化報告,若分數大於 400 分務必調出原始切面,緊盯主動脈壁是否有鈣化蔓延至 LM,並親自沿著 RCA 掃視有無被假影掩蓋的漏網病灶。