Australia's Three System Approach to Mammographic Image Quality Assessment.

Bentley-Spuur Kelly, Chau Minh T

View Original ↗
AI 導讀 industry policy 重要性 3/5

澳洲並行 3 套乳房攝影評估系統,因標準分歧且缺乏實證,亟需統一整合。

  • 澳洲並行 3 套乳房攝影評估系統,導致品質管理標準嚴重碎片化。
  • PGMI 系統因高度主觀性受質疑,且缺乏改善診斷結果的科學實證。
  • 自動化評估具客觀優勢,但尚未整合至現行的醫療品質認證框架中。

乳癌是澳洲女性最常被診斷出的癌症,而乳房攝影(Mammography)至今仍是早期發現的黃金標準。然而,決定篩檢成效的影像品質評估卻處於分裂狀態。根據發表於《JMRS》的最新文獻回顧,澳洲目前並存著 3 套截然不同的影像評估系統(IES),導致放射師的績效評估與整體品質保證面臨嚴峻挑戰。這種碎片化的現況不僅影響評估重現性,更缺乏與實際診斷結果相連的科學證據。

澳洲乳房攝影 RANZCR 計畫的二元化評估設計

乳房攝影的篩檢與診斷準確度,高度依賴於醫療機構能否持續、穩定地產出高品質的醫學影像。為了確保這一點,影像評估系統(IES)成為所有醫療設施進行品質保證(QA)與認證機制的核心支柱。該文獻回顧指出,澳洲現行的醫療環境中,針對乳房攝影的品質把關並未統一,而是根據不同的臨床情境與機構需求,演化出各自獨立的運作標準。

在一般診斷環境中,主要依賴由澳洲與紐西蘭皇家放射科醫學院(RANZCR)推動的乳房攝影品質保證計畫(MQAP)。該計畫在影像品質的判定上,採用的是相對簡化的「可接受/需重照(Acceptable/Repeatable)」二元評估系統。

這種系統設計的優勢在於決策迅速,幫助第一線的放射師與醫師快速判斷當下的影像是否具備足夠的臨床診斷價值,進而決定是否需要請患者重新進行拍攝。然而,由於只有合格與不合格兩種選項,它在分析影像品質細微差異與持續改進的細緻度上相對受限。

BSA 大規模採用 PGMI 分級系統與主觀性爭議

相對於診斷環境的二元化標準,在公共健康與大規模篩檢領域,澳洲乳房篩檢計畫(BreastScreen Australia, BSA)則採用了完全不同的評估邏輯。BSA 全面導入了更為細緻的 PGMI 分級系統,將拍攝出來的乳房攝影影像嚴格劃分為四個等級:完美(Perfect)、良好(Good)、中等(Moderate)與不合格(Inadequate)。

PGMI 系統的初衷是透過更精細的顆粒度,為影像品質建立具體的基準線,讓醫療機構與從業人員能清楚掌握整體拍攝品質的分布狀況,並針對未達「良好」以上的影像進行具體檢討。

然而,文獻強烈指出,這套被廣泛使用的系統在實際執行面上遭受了嚴厲的批評。最核心的致命傷在於其高度的「主觀性」。由於人為判定難以絕對標準化,不同評估者對於各等級的界定往往存在認知差異,導致評估結果的重現性極差。更值得關注的是,目前學術界與臨床文獻中,明顯缺乏以結果為導向的科學證據,無法證明 PGMI 系統中的特定影像評級能直接轉換為更好的診斷結果。

Volpara TruPGMI 自動化評估工具的整合挑戰

為了解決人工評分帶來的主觀性與效率瓶頸,醫療影像市場開始引入新興的自動化評估工具,其中最具代表性的便是 Volpara TruPGMI。這類基於演算法的自動化軟體,透過電腦視覺與數據分析模型,對乳房攝影的擺位、壓迫程度等技術指標進行運算,旨在提供完全客觀且具備高度重現性的影像品質分析報告。

自動化方法的優勢顯而易見:它消除了人類審查員的疲勞與主觀認知偏差,能夠以統一的標準快速處理海量影像,為大規模的品質監測提供穩固的數據後盾。

儘管這些軟體展現出克服傳統人工評估缺陷的潛力,但文獻強調,它們在澳洲醫療體系中的實際應用仍面臨顯著的瓶頸。目前,這些自動化工具並未被一致性地整合進現有的醫療認證框架與官方品質保證計畫中。此外,與 PGMI 系統面臨的困境類似,自動化工具所產出的客觀分數,目前依然缺乏足夠的臨床關聯性研究,無法確切證實這些數據能實質帶動診斷準確率的提升。

系統碎片化對放射師績效評估與品質管理的衝擊

3 套系統(RANZCR 的二元系統、BSA 的 PGMI 系統,以及新興的自動化工具)在澳洲醫療體系中的並存,導致了影像品質評估實務走向嚴重的碎片化。這種分歧並非單純的學術名詞差異,而是直接反映在不同醫療機構的實際運作中,帶來了管理與執行上的多重摩擦。

從第一線醫療人員的角度來看,標準的不一致對放射師的日常工作與績效評估造成了挑戰。一位在診斷環境與篩檢環境交替工作的放射師,必須適應兩套完全不同的品質要求與評分基準,這不僅增加了認知負擔,也使得專業技能的衡量標準變得模糊。

在系統與計畫層級,多重標準的存在也讓品質保證機制的效能大打折扣。當診斷端與篩檢端的數據無法有效互通與對比,整體國家級或州級的乳癌防治計畫便難以建立統一的基準線,進而削弱了整體醫療資源投入的效益。

統一診斷與篩檢標準以建立實證影像評估框架

面對上述種種挑戰,文獻回顧的結論強烈呼籲,澳洲的乳房攝影領域迫切需要進行系統性的架構重整。當前的首要任務,是建立一個統一、具備強大實證基礎,且能與現代自動化科技緊密對接的新型影像評估框架。

唯有打破現狀,將一般臨床診斷與公共篩檢環境的評估標準進行深度整合,才能從根本上解決各系統間應用、標準與基準線不一致的問題。這不僅是管理效率的提升,更是醫療專業發展的重要基石。

長遠而言,標準化與客觀化的影像品質評估,將能大幅提升檢驗流程的可靠性,為放射師的專業培訓提供明確且一致的指引。透過確保影像品質監控機制建立在結果導向的科學證據之上,才能真正讓這些評估工作發揮實質價值,並最大化其對乳癌準確診斷與患者照護的貢獻。

整合乳房攝影評估標準,導入實證與自動化框架,方能確保影像品質實質提升診斷準確度。

Abstract

Breast cancer is the most commonly diagnosed cancer among Australian women, and mammography remains the gold standard for early detection. The effectiveness of mammography relies on the consistent production of high-quality images, making image evaluation systems (IES) central to quality assurance and accreditation. This narrative review examines the three different IES currently used in Australia: the acceptable/repeatable IES used in diagnostic settings as a part of the Royal Australian and New Zealand College of Radiologists (RANZCR) Mammography Quality Assurance Program (MQAP), the BreastScreen Australia (BSA) Perfect (P), Good (G), Moderate (M), Inadequate (I) or PGMI IES, and emerging automated evaluation tools such as Volpara TruPGMI. Each IES has evolved from different clinical contexts, resulting in inconsistencies in application, criteria, and benchmarking across diagnostic and screening settings. The widely used PGMI IES has been heavily criticised for its subjectivity, poor reproducibility, and lack of a body of evidence linking image grades to diagnostic outcomes; indeed, there is a distinct lack of outcome-based evidence in the literature. Automated approaches offer objective and reproducible analysis but remain inconsistently integrated into accreditation frameworks and lack correlation to improvements in diagnostic outcomes. The coexistence of these three systems has led to fragmented image quality assessment practices that challenge both radiographer performance evaluation and program-level quality assurance. This narrative review highlights the need for a unified, evidence-based, and technologically aligned framework that reflects contemporary imaging practice. Standardising image evaluation across diagnostic and screening environments would enhance reliability, support professional development, and ensure that image quality monitoring meaningfully contributes to diagnostic accuracy and patient care.