Clinical and MRI variables in decision support systems for prostate MRI: A systematic review of decision support tools, nomograms, and risk models.

Onwuharine E N, Clark A J, McIntyre A, Hill J, Dimmock M

View Original ↗
AI 導讀 academic MR 重要性 4/5

22項攝護腺MRI模型展現AUC>0.80的高鑑別力,具備優化放射師對比劑使用之潛力。

  • 系統性回顧22項攝護腺模型,無任何系統達完全臨床落地。
  • PI-RADS評分以82%採用率居首,模型AUC多大於0.80。
  • 整合預測變數可引導放射師決定是否施打對比劑及優化流程。

分析 22 項攝護腺磁振造影預測模型,多數工具鑑別力大於 0.80,但實際完全落地的決策支援系統數量竟是 0。如何將高準確率轉化為機房內優化對比劑與工作流程的實質依據,成為當前必須跨越的障礙。

攝護腺 MRI 需求激增與即時決策的困境

探究本篇研究的出發點,主要根源於全球醫療體系普遍面臨的放射線專科醫師人力短缺現象。在此同時,針對攝護腺疾病的磁振造影檢查需求卻呈現急遽上升的趨勢,這使得如何在有限人力下維持影像品質與流程標準化成為一大挑戰。根據攝護腺影像報告與資料系統(PI-RADS,攝護腺腫瘤風險評估標準)委員會的現行建議,理想的磁振造影工作流程應包含放射線專科醫師的即時參與,藉此引導整個造影路徑與後續處置。然而,受限於實際的勞動力限制,這種需要即時介入的理想狀態往往難以達成一致性與全面性的落實。為了解決這個瓶頸,臨床決策支援系統(CDSSs,整合數據以輔助醫療決策的系統)的發展逐漸受到重視。建構一套能夠標準化影像工作流程的支援系統,被視為緩解人力壓力並維持診斷品質的潛力方案。本篇系統性文獻回顧即是奠基於此動機,試圖釐清目前在攝護腺領域中,這類決策工具的發展現況與實際應用變數。

系統性回顧的文獻篩選邏輯與品質評估框架

審視本篇文獻的篩選設計,研究團隊於 2025 年六月針對多個主要醫學資料庫進行了系統性的檢索。涵蓋的資料庫包含了 Medline、Cochrane、CINAHL、Web of Science 以及 ProQuest,確保了文獻收集的廣泛性與代表性。在納入條件的設定上,主要鎖定自 2015 年一月起以英文發表的原創性研究。符合資格的研究必須描述了一套整合結構化臨床數據與磁振造影衍生變數的臨床決策支援系統,且其用途需涵蓋攝護腺癌的診斷、切片前的風險分層或是疾病的分期評估。為了確保分析標的的精準度,研究團隊嚴格制定了排除條件。單純探討放射影像組學的研究、非初級研究文獻、未包含任何造影衍生變數的模型,以及缺乏外部驗證的研究,全數被排除在本次回顧之外。在文獻資料的萃取與偏差風險評估方面,由兩位獨立的審閱者執行篩選作業。評估過程中導入了 PROBAST 框架來檢視預測模型的偏差風險,並進一步運用 GRADE 框架來評定整體證據的確定性。

核心預測變數的使用頻率與鑑別力數據

經過嚴格的篩選與排除程序,最終共有 22 篇研究符合納入標準並進入最終分析。細看這二十二項工具的組成型態,其中有 15 項研究評估了列線圖、5 項研究描述了風險計算器,另有 2 項則是報告了預測模型。分析這些決策工具所採用的核心預測變數,可以發現高度的集中趨勢。其中,PI-RADS 評分是最常被納入的參數,高達 82% 的工具使用了這項變數。其次,攝護腺特異性抗原密度(PSAD,為血液抗原數值除以攝護腺體積)與患者年齡同樣具備高度指標性,兩者皆有 64% 的採用率。此外,單純的攝護腺特異性抗原數值佔了 41%,而攝護腺體積則被 23% 的工具列為運算參數。從鑑別準確度來看,大多數的決策工具都展現了相當優異的表現,其接收者操作特徵曲線下面積(AUC,評估模型鑑別能力的指標)普遍大於 0.80,顯示出強大的區分能力。然而,儘管鑑別力數據亮眼,這些研究在模型校準以及決策曲線分析的報告上卻呈現不一致的狀況,這是評估其整體可靠性時必須納入考量的因素。

臨床決策支援系統之核心預測變數採用率
預測變數名稱變數類型系統採用比例 (%)
PI-RADS 評分MRI 衍生參數82%
攝護腺特異性抗原密度 (PSAD)綜合衍生參數64%
患者年齡 (Age)臨床變數64%
攝護腺特異性抗原 (PSA)臨床變數41%
攝護腺體積 (Prostate volume)MRI 衍生參數23%

臨床變數與 MRI 衍生參數的結構化對比

進一步拆解決策系統所採用的各項參數,可以清楚區分為臨床基礎變數與影像衍生參數兩大類別。在臨床變數方面,患者年齡與攝護腺特異性抗原構成了最基本的風險評估基線,分別佔據了 64%41% 的使用比例。然而,單純依賴血液生化指標往往容易受到發炎或其他非惡性因素的干擾。因此,必須結合造影所提供的解剖與功能性影像資訊,才能大幅提升預測模型的鑑別力。在衍生參數中,除了涵蓋多參數造影結果的 PI-RADS 評分以 82% 的絕對優勢成為核心指標外,透過影像計算而得的攝護腺體積也佔有 23% 的重要地位。更值得注意的是,將血清數值除以影像測量體積所獲得的攝護腺特異性抗原密度,其重要性甚至超越了單純的血液數據或體積,達到了 64% 的採用率。這種將臨床生化數據與影像幾何測量相互結合的衍生變數,正是現階段提升決策支援系統準確度的關鍵結構。透過這種跨維度的參數整合,系統得以更精確地執行切片前的風險分層任務。

高鑑別力與臨床實際導入之間的距離現象

將目光轉向這些高準確度模型的臨床實用性,研究結果揭露了一個值得深思的現象。儘管這 22 篇文獻詳細描述了工具的開發與驗證過程,但在所有納入的文獻中,沒有任何一項研究評估了完全實施落地的臨床決策支援系統。這意味著這些涵蓋列線圖與風險計算器的工具,目前多半仍停留在學術驗證與原型階段。作者坦承,經過驗證的臨床與影像預測變數確實為建立穩健的決策系統提供了堅實的基礎,但各研究間的異質性過高。缺乏實際導入臨床工作流程的實證數據,嚴重限制了這些工具當前可提供的證據等級。模型在封閉的驗證數據集中表現優異,並不等同於在充滿變數的日常排程與真實機房操作中也能發揮同等效益。基於上述限制,原文強烈建議未來需要展開前瞻性、多中心的驗證研究。只有透過跨院區的真實數據回饋,並將系統真正整合進醫療資訊系統中,才能客觀評估這些決策工具對整體醫療品質的實質影響。

面向放射技術端的對比劑與流程決策優化

回歸到本篇研究對放射線技術人員的實質意義,原文特別點出了決策支援系統在第一線操作面的發展潛力。雖然目前的工具多側重於醫師端的診斷輔助,但未來若能開發面向放射師的決策工具,將能為日常掃描流程帶來巨大的改變。這類工具若能有效整合前述提及的關鍵預測變數(如 PI-RADS、抗原密度、年齡與體積等),將可用於直接引導造影過程中的關鍵決策。具體而言,系統可協助技術人員判斷當下是否需要使用靜脈注射對比劑、確認適合的分期掃描範圍,以及優化整體的影像工作流程。這種基於客觀數據驅動的決策模式,不僅有助於提升整體檢查的診斷準確性,更能實質上減少不必要的對比劑施打。透過減少無謂的對比劑使用,不僅符合患者安全的考量,也能有效縮短單一病患的佔機時間,進而緩解因龐大需求量而造成的機房排程壓力。

將高準確度模型落實臨床,是引導放射師決定對比劑施打與優化MRI排程的關鍵下一步。

Abstract

Workforce shortages and rising demand for MRI have increased interest in clinical decision support systems (CDSSs) to standardise imaging workflows. The Prostate Imaging-Reporting and Data System (PI-RADS) committee recommends real-time radiologist input to guide MRI pathways, but workforce constraints may limit consistent implementation. This systematic review examined CDSSs used in prostate MRI, including decision tools, nomograms, and risk calculators, to identify the clinical and MRI-derived variables they incorporate and assess their relevance for future development. A systematic search of Medline, Cochrane, CINAHL, Web of Science, and ProQuest was conducted in June 2025. Eligible studies were original research published in English since January 2015 describing development, validation, or clinical use of a CDSS using structured clinical and MRI-derived variables for prostate cancer diagnosis, pre-biopsy risk stratification, or staging. Exclusion criteria included radiomics-only studies, non-primary research, studies without MRI variables, and those lacking external validation. Two reviewers independently screened studies, extracted data, and assessed risk of bias using PROBAST. Certainty of evidence was appraised using the GRADE framework. Twenty-two studies met inclusion criteria: fifteen evaluated nomograms, five described risk calculators, and two reported predictive models. None assessed a fully implemented CDSS. Common predictors included PI-RADS (82 %), prostate-specific antigen density (64 %), age (64 %), prostate-specific antigen (41 %), and prostate volume (23 %). Most tools showed strong discriminative accuracy (AUC >0.80), though calibration and decision curve analysis were inconsistently reported. Validated clinical and MRI predictors support robust CDSSs, but heterogeneity and lack of implementation limit evidence. Prospective multicentre validation is needed. Radiographer-facing tools integrating key predictors could guide contrast use, staging, and workflow decisions, improve diagnostic accuracy and reduce unnecessary contrast administration.