Current State of Artificial Intelligence Adoption and Implementation in Neuroradiology Departments: Insights from a U.S. National Survey [HEALTH POLICIES/QUALITY IMPROVEMENT/EVIDENCE-BASED NEUROIMAGING]
全美 81% 神經放射科已導入 AI,但頻繁的偽陽性與糟糕的 PACS 整合讓多數醫師覺得根本沒省到時間。
- 高達 81% 的神經放射科使用 AI,絕大多數集中在急診中風流程(如 LVO 與 ASPECTS),其他應用極少。
- 多數醫師回報 AI 對減輕工作量無感,主因是高敏感度帶來的偽陽性迫使醫師花更多時間覆核與駁回。
- 未來五年採購的關鍵將從演算法準確度,轉移到能否與現有 PACS 系統無縫整合以及證明財務上的投資報酬率。
高達 81% 的美國神經放射科已經導入 AI,但多數醫師卻回報它對減輕整體工作量的幫助幾乎為零。這項針對全美神經放射部門的 19 題問卷調查指出,儘管中風軟體已成標配,偽陽性過高與系統整合困難反而吃掉了預期省下的閱片時間,讓 AI 淪為昂貴的背景裝飾。
81% 導入率背後的美國神經放射科現況
人工智慧在醫學影像領域的發展日新月異,但在次專科的實際落地情況卻呈現極度不均的態勢。神經放射科作為處理急症與複雜解剖結構的第一線,對於能夠加速診斷或提升影像品質的工具抱有極高期待。作者團隊意識到,目前多數關於 AI 效能的研究多侷限於封閉資料集的回溯性測試,缺乏針對真實臨床環境中「使用者體驗」與「營運面影響」的全國性普查。為此,他們發起這項大規模調查,旨在描繪目前美國各級醫院神經放射部門採用 AI 的真實輪廓。
這不僅僅是一份關於市佔率的報告,更是對於現有醫療科技商業模式的一次體檢。當 FDA(美國食品藥物管理局)核准的放射科 AI 軟體超過數百款,臨床醫師卻面臨每天被海量影像淹沒、相對價值單位(RVU)要求不斷攀升的壓力。這項調查切中了放射科醫師最關心的核心問題:花大錢引進這些演算法,究竟是減輕了值班時的疲勞,還是帶來更多需要人工覆核的麻煩?透過分析這些第一線的回饋,研究團隊試圖找出臨床需求與廠商開發方向之間的落差,為未來的技術迭代提供指引。
19 題混合問卷與全美神經放射部門抽樣
從問卷設計來看,這項橫斷面研究採用了精心編制的 19 題調查表,融合了單選、多選以及開放式問答題型。這種混合式設計不僅能收集量化的採用比例,更能捕捉醫師對於系統操作不順暢或效能波動的質性抱怨。問卷的發放對象鎖定美國各地的神經放射學部門主管及核心主治醫師,涵蓋了學術醫學中心、大型都會教學醫院以及社區型私人執業機構,以確保樣本具備足夠的代表性。
受訪群體的結構設計使得研究能夠比較不同層級醫院在 AI 導入上的差異。學術中心通常擁有較充裕的研究經費與專屬的 IT 團隊,傾向於早期採用並測試多元化的 AI 工具;而私人執業群體則更看重工具能否直接提升閱片產能與財務回報。調查內容涵蓋了當前 AI 工具的使用狀態、具體的應用場景分類、臨床流程中的整合程度、對工作負載的實際影響,以及未來五年的採用預期。
在統計分析方面,研究團隊主要運用敘述性統計來呈現資料的分佈模式,並針對開放式問題進行主題編碼,萃取出醫師最常提及的痛點。儘管問卷屬於主觀的自我報告,缺乏系統後台的實際點擊率或工時追蹤數據,但這種「感知層面」的評估,往往才是決定一項新技術能否在科內存活、甚至被廣泛推廣的真正關鍵。
| 調查構面 | 核心關注點 |
|---|---|
| 採用現況 | AI 工具的引進比例、FDA 核准狀態 |
| 應用場景 | 急症分流、報告生成、影像品質提升 |
| 工作負載 | 對閱片時間與值班壓力的實際感受 |
| 導入障礙 | 財務成本、IT 系統整合、療效證據 |
涵蓋使用現況、阻礙與未來預期
Table 1 揭示的中風主導地位與次要應用
將焦點拉到具體的應用領域,Table 1 清楚呈現了不同 AI 工具的滲透率差異。在回報已採用 AI 的 81% 部門中,中風相關的影像分析毫無懸念地佔據了絕對的主導地位。這類工具主要針對非對比電腦斷層(NCCT)的 ASPECTS 自動評分、電腦斷層血管攝影(CTA)的大血管阻塞(LVO)偵測,以及灌注掃描(CTP)的缺血半影區計算。多數受訪者表示,這類工具多為已取得 FDA 許可的商用軟體,其主要價值在於能迅速將異常個案推播至中風小組的手機端,從而縮短到院至血管打通的時間(Door-to-needle time)。
然而,除了急症分流之外,其他應用的普及率則出現斷崖式的落差。調查指出,僅有少數部門常態性使用 AI 進行報告生成、病灶切割與影像品質提升。在報告生成方面,主要是利用 NLP(自然語言處理,讓電腦理解並統整文字)技術自動從病歷中提取關鍵字或預填結構化報告;在病灶切割上,多用於多發性硬化症(MS)斑塊的縱向追蹤或腦腫瘤體積的量化;至於影像品質提升,則依賴 DLR(深度學習影像重建,利用神經網路降低雜訊),主要目的是為了縮短磁振造影(MRI)的掃描時間或減少顯影劑的用量。
這組數據凸顯了一個重要現象:目前神經放射科的 AI 生態系呈現高度單一化。多數預算與 IT 資源都集中在具備明確給付代碼(如美國的 NTAP 附加支付)或能顯著改變急診處置流程的單一疾病上。對於那些旨在處理日常大量常規排檢(如失智症腦容積分析、腦脊髓液流動力學評估)的軟體,由於缺乏直接的財務誘因,部門採購的意願相對低落。
中風軟體佔據絕對多數,次要應用仍屬小眾
Figure 2 的效能波動現象與工作量悖論
本篇研究最引人深思的發現,在於 Figure 2 所呈現的工作量感知矩陣。照理說,導入高階自動化工具應能大幅提升效率,但絕大多數受訪醫師卻明確表示,AI 對減輕整體工作量的影響「微乎其微」。探究其背後原因,表現不穩定、準確度不如預期以及高比例的偽陽性,是摧毀醫師信任感的三大元兇。
當 AI 為了維持極高的敏感度以避免漏診時,不可避免地會產生大量偽陽性警報。在神經放射科的高壓環境中,如果系統頻繁將血管鈣化誤判為動脈瘤,或是將偽影標示為皮質梗塞,放射科醫師就必須花費額外的時間,在高解析度影像上反覆確認並在報告中手動駁回 AI 的發現。這種「狼來了」效應不僅打斷了原本流暢的閱片節奏,甚至增加了心理負擔,因為醫師深怕在忽略 AI 警示後發生真正的醫療糾紛。
此外,不同廠牌甚至同一廠牌在不同機型上的效能落差,也讓臨床醫師感到困擾。某個在 A 醫院急診 CT 表現優異的 LVO 偵測模型,到了病患群體較老、血管硬化嚴重的 B 醫院,可能就頻繁報錯。這種缺乏跨機構泛化能力(Generalizability)的現象,迫使各部門在引進新工具後,仍需投入大量隱形成本進行在地化的閾值微調與員工重新訓練,完全抵銷了軟體標榜的省時效益。
| 臨床痛點 | 對日常閱片流程的負面影響 |
|---|---|
| 高偽陽性 | 頻繁打斷閱片節奏,需手動駁回警報 |
| 效能波動 | 跨機型或跨病患群體準確度下降 |
| 介面不佳 | 無法直接在 PACS 疊加,需切換畫面 |
效能波動導致的信任危機
Table 3 點出的三大整合障礙與臨床邊界
在討論環節,作者根據 Table 3 的回饋統整出阻礙 AI 深化的三大路障:高昂的採購成本、系統整合的困難,以及缺乏強而有力的療效證據。多數受訪主管抱怨,目前的軟體授權費通常按掃描次數計價,對於掃描量極大的醫學中心而言是一筆沈重的經常性開銷。如果這筆支出無法透過提升健保申報點數或實質減少人事成本來回收,醫院管理層將很難同意持續展延合約。
更致命的是資訊系統的互操作性(Interoperability)問題。目前的閱片工作站(PACS)與各家 AI 廠商的伺服器往往難以無縫接軌。影像需要繞道傳輸至第三方節點運算後再送回,這段時間差在處理急性中風時尤其致命。此外,如果 AI 的運算結果只是以次級影像(Secondary capture)的圖片格式附加在序列最後,而不是直接以圖層(Overlay)的方式疊加在原始 DICOM 影像上供醫師隨時切換開關,這種蹩腳的介面設計將極大地降低臨床使用的意願。
儘管面臨上述種種限制,超過九成的受訪者依然對 AI 抱持樂觀態度,預期未來五年內科內的 AI 依賴度將會顯著上升。針對這個現狀,作者強烈建議產學界必須從「單純追求演算法準確率」轉向「優化臨床工作流程」。未來的開發者應該親自坐在放射科醫師旁邊,觀察他們如何切換螢幕、如何下診斷,打造出真正能融入背景、無聲協助的工具。對於正準備採購 AI 的科室,本文的啟示是:不要只看廠商提供的理想化 AUC 數據,務必要求使用自己醫院過去一個月的真實影像進行回溯測試,並將 IT 部門的串接評估列為最優先的考量項目。
下次醫院提議導入新的腦部 AI 軟體時,先別管廠商吹噓的敏感度有多高,直接問 IT 主管:「這套系統的結果能不能變成 PACS 裡一鍵開關的圖層?」如果不行,它只會成為你值班時多點滑鼠的負擔。