Brain CT for Diagnosis of Intracranial Disease in Ambulatory Patients with Cancer: Assessment of the Diagnostic Value of Scanning without Contrast prior to with Contrast [ARTIFICIAL INTELLIGENCE]

Wang, E., Darbandi, A., Tu, L., Ballester, L. Y., de Jesus Morales, C., Chen, M., Gule-Monroe, M. K., Johnson, J. M.

View Original ↗
AI 導讀 academic CT 重要性 4/5

門診腦 CT 免平掃,漏診率僅 0.96%,抓一例微小出血代價達 4122 美元

  • 針對門診癌症分期病患,僅 0.96% 的有意義病灶(全為出血)只能在平掃相被辨識出。
  • GPT-3 模型篩選 1980 份報告,成功將需人工盲閱的高風險個案限縮至 145 份,揪出 19 例。
  • 尋找這不到 1% 的無症狀微小出血,將產生 1855 至 4122 美元的極高增量成本效益比。

捨棄顯影前平掃腦部 CT,僅 0.96% 機率漏看具意義的病灶。這份橫跨八年、收錄 2717 例門診癌症報告的分析證實,常規雙相掃描效益極低,每額外揪出一個微小出血的代價最高達 4122 美元,徹底打破傳統排程對平掃的執迷。

放棄常規平掃腦部 CT:僅 0.96% 具備獨特診斷價值

回顧目前的影像排程常規,當面臨疑似顱內病變的門診癌症患者時,儘管磁振造影擁有無可取代的軟組織解析度,但電腦斷層仍因其極高的普及率、低廉的檢查成本以及極短的掃描時間,成為第一線的防護網。在多數醫院的標準作業流程中,為這類病患安排腦部 CT 時,往往會預設執行「平掃加上顯影劑對比」的雙相掃描。這種做法的立意在於期望透過平掃影像捕捉急性出血或微小鈣化,隨後再利用顯影相尋找血腦屏障遭破壞的轉移性腫瘤。

以傳統的游離輻射防護 ALARA(盡可能合理的抑低輻射劑量原則)來看,任何未帶來明確診斷益處的掃描皆屬多餘。然而,臨床實務中為了防範極低機率的漏診,往往選擇讓患者承受完整的兩組 X 光管球曝光。過去的醫學教育所灌輸的雙相掃描觀念,套用在純粹為了癌症分期而來的無症狀門診病患身上,是否真的具備實質意義?這個疑問成為了本研究團隊的出發點。

為了驗證常規平掃相的必要性,來自 MD Anderson 癌症中心的研究人員針對大批門診病患的影像報告進行了深度回顧,試圖量化那些「只有在平掃相看得到,打藥後反而被遮蔽」的關鍵病灶比例。最引人注目的結論在於,經過兩階段的大規模資料過濾與人工判讀,研究證實僅有 0.96%(95% CI: 0.63–1.40)的影像報告中,包含了僅能在無顯影平掃 CT 上被辨識出的具意義發現。

這個極微小的百分比強烈暗示,在絕大多數的門診癌症分期情境下,單純依賴注射顯影劑後的 CT 影像,已經足以涵蓋超過九成九的關鍵診斷資訊。換言之,對高達 99% 的無症狀門診患者而言,平掃步驟不僅未能提供任何額外的診斷價值,反而強迫他們承受了雙倍的輻射暴露。此外,雙相掃描無形中拉長了每位患者佔用檢查機台的時間,加重了放射師的工作負荷,也連帶拖延了後續病患的排程消化速度。

結合 GPT-3 模型篩選 2717 份門診癌症分期報告

為了建立具備強大統計說服力的證據基礎,研究團隊採取了跨越數年的雙階段資料回顧策略。在第一階段的基礎建立期(涵蓋 2014 年 10 月至 2016 年 3 月),由具備專科執照的神經放射醫師進行了密集且耗時的純人工審閱。在逐筆檢視 737 份門診癌症分期的腦部 CT 報告後,醫師僅找出了 7 例符合「僅在平掃相具備獨特診斷意義」的個案。

面對龐大的歷史資料庫,若要將這種純人工的檢索方式擴展到近十年的所有報告,勢必會遭遇難以克服的人力瓶頸。因此,在第二階段(涵蓋 2017 年 1 月至 2022 年 4 月)的擴大回顧中,研究團隊導入了 GPT-3(Generative Pretrained Transformers-3,一種能理解醫學語意的生成式預訓練語言模型)來輔助分析。這也是少見將大型自然語言模型直接投入大規模放射科報告探勘的實務應用。

相較於早期基於死板規則的關鍵字搜尋法,模型具備處理非結構化醫療文本的能力,能夠精準區分出文字敘述中的語法細微差異。經過特徵學習與微調後的語言模型展現了驚人的語意擷取能力。在面對額外擴增的 1980 份腦部 CT 報告時,迅速將潛在具有獨特平掃發現的報告限縮至 145 份。這種自動化的前置過濾機制,大幅排除了那些單純顯影相陽性報告,將後續的專家審閱負擔減輕了將近九成。

這 145 份被模型標記為高風險的報告,隨後交由兩位神經放射專科醫師進行嚴格的交叉盲閱;若遇有意見分歧的案例,則交由第三位資深醫師進行最終裁決。經過這套嚴密的篩選漏斗,最終在第二階段的 1980 份報告中,僅確認了 19 例真正具備獨特平掃發現的個案。

這套結合最新 AI 探勘技術與傳統專家判讀的雙軌驗證機制,不僅確保了資料篩選的極高精確度,也成功將研究的總收案量推升至 2717 份。模型有效率的降噪處理,證明了自然語言處理在回顧性臨床影像研究中的巨大潛力,也讓最終得出的 0.96% 綜合陽性率具備了堅實的資料庫背書。

雙階段回顧流程與獨特發現比例
收案階段報告總數篩選方式發現獨特病灶數
第一階段 (2014-2016)737 份神經放射醫師手動審閱7 例 (全為出血)
第二階段 (2017-2022)1980 份GPT-3 標記高風險報告19 例 (人工確認)
整體加總2717 份AI 輔助與人工複合26 例 (陽性率 0.96%)

結合人工與 GPT-3 模型的篩選結果

抓出單一被忽略腦出血:增量成本達 4122 美元

除了影像診斷上的超低附加效益,研究團隊更進一步將視角延伸至醫療經濟學的層次,透過精確的財務模型來評估這項常規流程的隱藏代價。他們採用了美國聯邦醫療保險的核銷標準作為計算基礎,藉此反映真實世界的財務運作現況。

團隊導入了 ICER(incremental cost-effectiveness ratio,增量成本效益比,多抓一個有意義病灶的額外花費)這項關鍵指標,用以衡量每多發現一個微小病灶所需要額外挹注的總體資金。這項指標精準地考量了無顯影掃描本身所對應的 RVU(relative-value unit,相對價值單位,用於計算醫療處置點值),並將其與微乎其微的陽性檢出率進行了數學上的連動分析。

依據統計模型所推算出的 0.96% 發生率及其 95% 信賴區間(0.63% 至 1.40%),研究計算出這項常規的增量成本效益比落在了驚人的區間。即使以最樂觀的 1.40% 陽性率來估算,多發現單一病灶的代價也高達 1855 美元;若以信賴區間下限的 0.63% 來看,這筆額外支出更會暴增至 4122 美元。

也就是說,為了在茫茫人海中精準捕捉到那唯一一位因平掃相而改變報告內容的患者,醫療機構必須先在數百位沒有任何額外發現的病患身上,浪費高達四千多美元的檢查耗材與機台折舊。這樣的成本結構,在現代強調精準醫療與資源優化的管理體系中,顯得極度不合理且難以維持。

從科室經營的巨觀視角來看,將寶貴的技術人力與排程空檔投資在一項產值極低的常規動作上,不僅排擠了其他急重症患者的檢查機會,更無端膨脹了整體的醫療健保支出。這項財務數字的曝光,為管理者提供了強而有力的量化依據,足以作為修改內部標準作業流程的關鍵支持。

發現單一微小出血的增量成本效益比

基於 95% 信賴區間推算的財務代價

Figure 1 與 0.96% 陽性率的次群組影像剖析

究竟是哪些病灶成了顯影劑下的漏網之魚?若細看這極少數的陽性個案特徵,會發現一個高度集中的趨勢。在研究統整的 26 個(第一階段 7 例加上第二階段 19 例)獨特發現中,百分之百皆為微小出血。這個結果點出了電腦斷層在對比劑動力學上的一個先天物理限制。

如果我們觀察影像對比的動態變化,可以清晰看見病灶被遮蔽的過程。在未打藥的平掃相上,微量或亞急性的滲血會因為高密度的血紅素而呈現出相對的高訊號亮點,其 CT 值大約落在 60 至 80 之間。然而,當富含碘元素的對比劑注入並隨血液循環灌注到腦部組織時,正常的腦實質與血流豐富的腫瘤組織其密度會大幅上升至接近這個數值區間。

這種密度的全面拉高,會使得原本在平掃相上顯而易見的高密度出血點,在顯影相的明亮背景下完全融入其中,失去了對比度,導致放射科醫師在快速閱片時極易將其忽略。這也是為何在沒有平掃相作為對照基準的情況下,單憑顯影相很難精確區分出輕微出血與單純的顯影增強結節。

然而,我們必須從臨床管理的角度反思一個更深層的問題:對於一位正在進行常規癌症分期的門診病患而言,漏看這個微小的出血點,真的會改變他的命運嗎?事實上,多數伴隨微出血的轉移性腫瘤,在顯影相上依然會呈現出明顯的異常強化,且周圍通常會伴隨著清晰可見的血管性腦水腫。

換句話說,即便出血的特徵被碘顯影劑所掩蓋,腫瘤本身的存在依然無所遁形。主治醫師依然會接收到此處存在顱內異常的明確診斷,並據此安排後續的放射線治療或標靶藥物介入。微量出血這個次要特徵的遺漏,在宏觀的癌症治療路徑中,幾乎不會引發任何實質的決策偏誤。

門診無症狀腦轉移篩檢專屬:神經學異常者除外

儘管這項研究提供了極具顛覆性的數據支持,但作者在討論章節仍非常謹慎地劃定了這項策略的適用範圍。取消平掃相的建議,絕對不是一體適用於所有進入 CT 室的病患。研究的收案標準被嚴格限制在為了常規癌症分期而來、且狀況穩定的門診病患這個特定群體。

這些病患通常沒有急性發作的頭痛,也沒有突發性的肢體無力或語言障礙。相對地,一旦患者在急診室或病房內出現任何急性神經學缺損的跡象,標準的神經影像學評估流程便會立刻啟動。在這種高度懷疑急性顱內出血或大血管阻塞的中風情境下,第一時間的平掃腦部 CT 絕對是不可妥協的強制步驟。

此外,某些特定原發癌症的病理特性也需要被納入考量。例如 SCLC(small cell lung cancer,小細胞肺癌)或是黑色素瘤,這類癌症發生出血性 BM(brain metastases,腦轉移)的機率遠高於其他癌種。雖然數據表明單獨使用顯影相已足夠應付多數情況,但針對這類高風險亞型,臨床若有疑慮,依然可以選擇保留完整的雙相掃描,或是直接轉介進行磁振造影檢查。

另一個潛在的限制在於微小鈣化點的偵測。平掃相的消失意味著極低密度的微小鈣化可能被忽略。由於本研究的焦點在於全身性癌症的顱內轉移篩檢,而非原發性腦神經膠質瘤的初次診斷,因此微量鈣化的遺漏對於整體的癌症分期判斷影響微乎其微。

針對每天面對海量排程與龐大閱片壓力的放射科團隊而言,這份研究無疑提供了一劑強心針。在面對無症狀的常規追蹤單時,醫師們現在擁有堅實的量化數據作為後盾,可以自信地將常規的雙相掃描精簡為單一顯影相。這不僅是降低輻射劑量的具體實踐,更是優化科室運營效率的關鍵一步。

下次看到無症狀癌症分期的單子,大膽把 non-contrast 刪除吧;不需要耗費四千美元去抓一個不會改變治療計畫的微小出血。

Abstract

BACKGROUND AND PURPOSE: Brain imaging with MRI or CT is standard in screening for intracranial disease among ambulatory patients with cancer. Though MRI offers greater sensitivity, CT is frequently employed because of its accessibility, affordability, and faster acquisition time. However, the necessity of routinely performing a noncontrast CT with the contrast-enhanced study is unknown. This study evaluates the clinical and economic utility of the noncontrast portion of the brain CT examination. MATERIALS AND METHODS: A board-certified neuroradiologist reviewed 737 brain CT reports from outpatients at The University of Texas MD Anderson Cancer Center who underwent contrast and noncontrast CT for cancer staging (October 2014 to March 2016) to assess if clinically meaningful findings were identified only on noncontrast CT. A Generative Pretrained Transformers-3 (GPT-3) model was then fine-tuned to extract reports with a high likelihood of unique and meaningful noncontrast findings from 1980 additional brain CT reports (January 2017 to April 2022). These reports were manually reviewed by 2 neuroradiologists, with adjudication by a third reviewer if needed. The incremental cost-effectiveness ratio of noncontrast CT inclusion was then calculated based on Medicare reimbursement and the 95% CI of the proportion of all reports in which noncontrast CT was necessary for identifying meaningful findings. RESULTS: Seven of 737 reports in the initial data set revealed meaningful findings unique to the noncontrast CT, all of which were hemorrhage. The GPT-3 model identified 145 additional reports with a high unique noncontrast CT finding likelihood for manual review from the second data set of 1980 reports. Nineteen of these reports were found to have unique and meaningful noncontrast CT findings. In total, 0.96% (95% CI: 0.63–1.40) of reports had meaningful findings identified only on noncontrast CT. The incremental cost-effectiveness ratio for the identification of a single meaningful finding on noncontrast CT missed on the contrast-enhanced study was $1855 to $4122. CONCLUSIONS: In brain CT for ambulatory screening for intracranial disease in patients with cancer, noncontrast CT offers limited additional diagnostic value compared with contrast-enhanced CT alone. Considering the associated financial cost, workload, and patient radiation exposure associated with performing a noncontrast CT, contrast-enhanced brain CT alone is sufficient for cancer staging in patients with asymptomatic cancer.