Comments on "Impact of Deep Learning-Based Image Conversion on Fully Automated Coronary Artery Calcium Scoring Using Thin-Slice, Sharp-Kernel, Non-Gated, Low-Dose Chest CT Scans: A Multi-Center Study".
非閘控CT的AI鈣化評分極高精準,但需提防左前降支的解剖定位誤判。
- 針對 913 位癌症病患的非閘控胸部 CT,AI 總鈣化分數與人工圈選的 ICC 高達 0.992。
- 心血管風險分級的完全一致率達 95.2%,足以在例行癌症追蹤影像中自動篩出高危險群。
- 在極端誤差案例中,有 44.4% 是因假影漏看病灶,另有高達 38.9% 發生將 LAD 誤標為左主幹的情況。
就算沒有心電圖閘控,AI 算出的總體鈣化分數與人工圈選的 ICC 仍高達 0.992,但演算法有高達 38.9% 的極端誤差來自把 LAD 鈣化誤認為左主幹。這項針對 913 位胃癌與大腸癌病患的非顯影胸部 CT 分析證實,利用例行癌症追蹤影像來篩檢潛在心血管風險已具備高度臨床可行性。只是在極端值中,主動脈壁或瓣膜鈣化仍是干擾自動判讀的常見陷阱。
癌症追蹤非閘控CT揪出心血管風險的契機
從臨床實務的現況出發,冠狀動脈鈣化(CAC)分數早已是預測重大心血管事件的重要影像生物標記。隨著癌症治療技術進步,癌症存活者的數量大幅增加,而心血管疾病逐漸成為各類癌症病患發病與死亡的主要原因之一。多數癌症病患會定期接受非顯影胸部 CT 追蹤以評估肺部轉移,這其實提供了一個絕佳的機會,能順便篩檢出潛在的心血管高風險族群。
然而,放射科醫師在日常閱片時面臨著現實考量。由於尋找微小的肺部轉移灶或原發腫瘤佔據了大部分的注意力與時間,非心電圖閘控(non-ECG-gated)CT 上的冠狀動脈鈣化往往容易被忽略。傳統的 Agatston 評分需要依賴專門的心電圖閘控 CT,且人工圈選計算的過程極度耗時,根本無法負荷每天海量的癌症追蹤排程。
近年來文獻顯示,從非閘控 CT 取得的 CAC 分數與標準心電圖閘控 CT 的分數具有高度相關性,這為利用例行胸部 CT 進行心血管風險分層提供了有力的學理支持。如果能將自動化的演算軟體無縫接軌到這類非閘控的常規影像中,將能大幅改變病患的預後管理。
為了解決這個運算與時間的瓶頸,本研究團隊致力於驗證一套基於深度學習的全自動 CAC 評分軟體。作者企圖證明,即便在缺乏心電圖同步、且影像主要為了癌症分期而設計的條件下,這套工具依然能在真實世界的臨床環境中發揮極高的可靠度與分級準確率。
913位病患的Table 1與3D U-Net切割方法
從受試者篩選條件來看,研究團隊回溯性地收集了 2013 年至 2015 年間於單一醫學中心確診為大腸直腸癌或胃癌,並接受基準線非顯影胸部 CT 掃描的病患。最初辨識出 975 位病患,排除影像品質不佳、曾放置冠狀動脈支架、曾接受冠狀動脈繞道手術或植入心臟電子儀器者後,最終納入 913 位病患。男性佔 633 位,女性 280 位,中位年齡為 68.3 歲。
檢視 Table 1 呈現的 CT 擷取參數,所有影像皆採用常規軟組織濾波函數(soft tissue kernel)重建,沒有使用銳利濾波函數。管電壓部分,高達 98.7%(901/913)的掃描是在 120 kVp 下進行。在切片厚度方面,59.7%(545/913)為 3 mm,23.2%(212/913)為 2.5 mm,13.1%(120/913)為 3.75 mm。掃描儀器則涵蓋了 256 切(50.6%)、64 切(38.8%)與低於 64 切(10.6%)的設備,這反映了極具代表性的常規排程樣貌。
在參考標準的建立上,由兩位具備七年以上 CAC 評分經驗的放射線技術師,使用 Aquarius Workstation 軟體手動圈選超過 130 HU 的鈣化病灶,並依據解剖位置標註左主幹(LM)、左前降支(LAD)、左迴旋支(LCx)與右冠狀動脈(RCA)。若人工與 AI 的差異超出 95% 一致性界限,則由一位具備八年經驗的心血管放射科醫師進行病灶逐一比對。
針對自動化演算流程,本研究採用商用的 AVIEW CAC 軟體。該軟體首先利用影像對位技術,將冠狀動脈 CT 血管攝影上人工標註的空間資訊轉移到非顯影 CT 上。接著,透過 3D U-Net(一種擅長處理立體醫療影像切割的深度學習架構) 發展出的演算法,在掃描影像上自動分割出冠狀動脈與非冠狀動脈區域。只要潛在病灶接觸到冠狀動脈區域且不屬於其他結構,系統就會判定為鈣化並自動計算分數。
| 特徵與參數 | 數量與比例 |
|---|---|
| 總納入病患 | 913 位(男 633,女 280) |
| 癌症種類 | 胃癌 51.2%、大腸癌 48.8% |
| CT 設備等級 | 256切 (50.6%)、64切 (38.8%) |
| 管電壓 | 120 kVp (98.7%) |
| 切片厚度 | 3 mm (59.7%)、2.5 mm (23.2%) |
| 影像重建濾波 | 全數使用軟組織濾波 (100%) |
資料來源:Table 1
Table 2與Table 3的0.992高可靠度與風險分級
把焦點拉到主要結果,深度學習軟體在非閘控 CT 上的表現令人驚豔。Table 2 顯示,人工與全自動方法在病患層級的總 Agatston 分數組內相關係數(ICC)高達 0.992(95% CI: 0.991-0.993,p<0.001)。若細分到各條血管,右冠狀動脈(RCA)的 ICC 為 0.980,左前降支(LAD)為 0.964,左迴旋支(LCx)為 0.962,而左主幹(LM)的表現稍弱,但仍達到 0.863。
除了絕對分數的吻合度,臨床上更在乎的是心血管疾病(CVD)風險分層的準確性。作者將病患依據 Agatston 分數分為四組:0(無風險)、1-100(低風險)、101-400(中等風險)、大於 400(高風險)。Table 3 呈現了這項風險分層的極高一致性,線性加權 kappa 值達到 0.946(p<0.001)。高達 95.2%(869/913)的病患被自動軟體與人工評分歸類在完全相同的 CVD 風險層級。
值得注意的是,儘管總體一致性極佳,但不同風險區間的 ICC 仍有微妙差異。次群組分析指出,在分數小於等於 100 的群體中,ICC 為 0.912;在中等風險組(101-400)中,ICC 提升至 0.939;但在分數大於 400 的高風險組,ICC 卻下降至 0.856。這暗示了當鈣化斑塊極度厚重時,AI 判斷斑塊邊界與體積的標準可能與人類肉眼開始產生分歧,導致高分段的數值波動較大。
透過 Figure 2 的 Bland-Altman 分析圖可以直觀地看出,在總 Agatston 分數的比對中,913 個案例裡只有 31 例落在了 95% 一致性界限(LOA)之外。這意味著在絕大多數的常規癌症追蹤 CT 中,AI 給出的總分已經足夠可靠,完全具備在背景自動運作、輔助判定風險的實力。
總分吻合度極高,但左主幹表現稍弱
Table 4解析90處極端病灶的假陰性與解剖誤判
雖然整體數據極為優異,但探究演算法出錯的極端案例,才是本篇論文最引人入勝的精華。研究團隊針對落於 95% LOA 之外的 85 個案例進行了病灶層級(per-lesion)的比對,總共找出了 90 處不吻合的病灶。Table 4 將這些錯誤精準地分類,揭示了深度學習模型在非閘控影像上的視覺盲區。
在這 90 處錯誤中,有高達 40%(36/90)屬於冠狀動脈解剖名稱標註錯誤(mislabeling)。令人訝異的是,其中有 35 個案例是 AI 將左前降支(LAD)的鈣化誤認為左主幹(LM)鈣化。由於非心電圖閘控 CT 會受到心臟搏動的影響,LM 分岔處的解剖界線經常變得模糊,這使得依賴立體空間資訊進行切割的 3D U-Net 很容易在此處發生定位偏移。
另一大宗錯誤是未被 AI 偵測到的假陰性鈣化,佔了 44.4%(40/90)。這些被遺漏的病灶主要分布在右冠狀動脈(16 處)與左迴旋支(15 處),而在 LAD 與 LM 分別只有 7 處與 2 處。由於 RCA 與 LCx 在心動週期中的位移幅度最大,在沒有閘控的情況下,這些部位的鈣化容易因為移動假影而被平滑化,導致其 CT 值掉到 130 HU 的閾值以下,進而被軟體濾除。
最後一類則是假陽性或高估分數的狀況,佔了 15.6%(14/90)。這之中最常見的干擾來源是主動脈壁或主動脈瓣膜的鈣化(10 例)。Figure 3 畫出了典型的錯誤範例,顯示當瓣膜鈣化極度靠近冠狀動脈開口時,AI 會誤將其囊括進冠狀動脈的分數計算中,甚至連二尖瓣環鈣化與心臟跳動造成的條紋假影,偶爾也會被誤判為陽性病灶。
| 誤差類型 | 具體原因或部位 | 數量與佔比 |
|---|---|---|
| 假陰性 (漏看病灶) | 集中於 RCA 與 LCx | 40 例 (44.4%) |
| 解剖誤判 | LAD 誤標為左主幹 | 35 例 (38.9%) |
| 假陽性 (高估分數) | 主動脈壁或瓣膜鈣化 | 10 例 (11.1%) |
| 假陽性 (高估分數) | 移動假影或二尖瓣鈣化 | 4 例 (4.5%) |
資料來源:Table 4,針對落於 95% LOA 之外的案例
缺乏配對閘控CT的單一中心限制與臨床落地建議
Discussion 階段作者坦承了本研究的幾何限制。首先,這是一項單一醫學中心的回溯性研究,且病患全數為胃癌與大腸直腸癌患者,其心血管特徵是否能完全外推至其他癌症族群仍待商榷。其次,研究僅評估了傳統的 Agatston 分數,並未將質量分數或體積分數納入比較,可能限縮了多維度評估的空間。
再者,最大的學理限制在於本研究缺乏配對的「心電圖閘控 CAC CT」作為絕對的參考標準。研究中的 ground truth 是建立在人工圈選非閘控影像的結果之上。此外,由於沒有追蹤病患後續的心血管預後,目前尚無法證實自動計算出的分數能直接轉換為實際發生心血管事件的風險比例。
從放射科醫師的日常實務來看,這套工具的最佳使用場景是作為背景自動執行的風險篩檢機制。當你在判讀肺部結節與腫瘤轉移時,軟體可以默默算出 Agatston 分數並附註在報告中。若分數極低或處於中低風險區間,你可以完全信任其結果;若分數落在 >400 的高風險區間,系統能協助你及時向臨床醫師發出心臟科轉診的建議。
然而,當你看到報告顯示左主幹(LM)出現異常高分時,千萬別照單全收。你應該打開影像,確認該處鈣化是否其實屬於 LAD 的近端,或者只是主動脈瓣膜鈣化蔓延到了冠狀動脈開口附近。只要掌握了這些解剖定位的陷阱,這類 AI 工具就能替你省下可觀的打點時間,讓你在癌症追蹤的常規排程中,輕鬆扮演心血管風險守備的關鍵角色。
下次看到 AI 報告左主幹出現異常高分的鈣化時,先確認一下那是不是被誤認的左前降支鈣化或主動脈瓣膜沉積。