Image quality standards in digital mammography: A consensus statement.

Vandendaele L, De Visschere P J, Hendrickx S, Wallaert S, Goossens M-M, et al.

View Original ↗
AI 導讀 technology QC 重要性 4/5

23 位專家透過 Delphi 調查,為數位乳攝 19 項品質指標建立三級切截值共識清單,11 個面向首度標準化

  • CC 位與 MLO 位各有體位專屬指標:乳頭-胸大肌距離、胸大肌深度是評估關鍵
  • 壓迫力品質分級描述仍未達共識,是清單中最需補強的灰色地帶
  • 11 個共識面向搭配三級切截值,讓退件判定從主觀感受走向可稽核標準

同一張乳攝片,不同放射師的品質評分可以大相徑庭,連同一人在不同時段覆閱也常有出入。23 位多專科專家透過修正式德爾菲(Delphi)調查,從文獻整理出的 19 項初步指標出發,建立數位乳房攝影品質評估共識清單,首度為每個評估面向訂出「好、次佳、不足」三級切截值,把退件判定從主觀印象推向可量化標準。

評分因人而異:乳攝品管一致性的結構性困境

乳房 X 光攝影篩檢計畫的有效性,與影像品質的穩定性密切相關。一張壓迫不足、乳腺後緣組織未完整納入、或對比度偏低的攝影片,可能讓微小鈣化灶或腫塊邊緣失去清晰輪廓,而這些細節正是早期乳癌偵測的關鍵訊息。

問題在於,判斷「這張片子合不合格」的標準,長期高度仰賴個別放射師的主觀判斷與經驗。研究者指出,乳攝品質評估存在顯著的觀察者間差異(inter-observer variability)——不同放射師對同一張片子的結論可以不一致;也存在觀察者內差異(intra-observer variability)——同一位放射師在不同時間評閱同一張片子,也可能給出不同評分。

這種不一致性的後果是多方面的:退件率的判定缺乏依據、不同機構之間的品質比較難以進行、新進放射師的品管培訓因缺乏統一框架而效果有限。研究的出發點,正是要為這個長期存在的灰色地帶立下可操作的標準。

19 項初步指標、23 位專家、兩輪修正式德爾菲流程

研究方法分兩階段推進。第一階段透過系統性文獻範圍回顧(scoping literature review),彙整出 19 項乳攝影像品質評估指標作為出發點,涵蓋從基礎的影像作業確認到進階的解剖結構顯影。

第二階段邀請 23 位多專科專家組成評審小組,採用修正式德爾菲(Modified Delphi)法進行評估。德爾菲法是以匿名多輪問卷為主的共識建立方法,設計上可避免強勢意見主導討論,適合整合不同專業背景的評估意見——這一點在多專科篩檢計畫中尤其重要。

每位專家就兩個維度對各指標打分:「影像品質重要性」及「措辭的清晰度與適切性」。對於首輪未達共識的指標,研究團隊另外安排焦點小組討論(focus group discussion)進行修訂,將修改後的措辭重新送交評審,確保最終清單的每一條標準都具備可操作性,且能獲得跨專科的認可。

達成共識的 11 個品質面向

最終共識確認了 11 個主要品質評估面向,可分為通用指標與體位特定指標兩類。

通用指標適用於所有體位,包括影像識別(image identification,確認病患資料、體位標記等基本資訊)、偽影(artefacts)、均勻度(uniformity)、對稱性(symmetry,雙側乳房的比對完整性)、對比度(contrast)、輻射劑量(radiation dose)、銳利度(sharpness),以及纖維腺體三角(fibroglandular triangle)的完整顯影。這八項指標構成品質評估的基本盤,與體位選擇無關。

體位特定指標方面,頭尾位(CC view,craniocaudal view)的評估重點在於:乳頭-胸大肌距離(nipple-pectoralis distance),用以確認乳腺後緣是否被納入;以及乳房後部(posterior)、內側(medial)、外側(lateral)三個區域的顯影完整性。

斜位(MLO view,mediolateral oblique view)則聚焦於:胸大肌(pectoralis muscle)的可見程度與延伸範圍(理想上應深達乳頭水平線)、乳房下褶(inframammary fold)的清晰呈現,以及上部乳房(superior breast region)的涵蓋範圍。每個面向均搭配三級切截值定義,讓評分從感覺轉向有據可查的判斷。

乳攝影像品質 Delphi 共識:11 個評估面向分類
分類品質評估面向(中文)原文英文術語
通用(所有體位)影像識別Image identification
通用(所有體位)偽影Artefacts
通用(所有體位)均勻度Uniformity
通用(所有體位)對稱性Symmetry
通用(所有體位)對比度Contrast
通用(所有體位)輻射劑量Radiation dose
通用(所有體位)銳利度Sharpness
通用(所有體位)纖維腺體三角顯影Fibroglandular triangle depiction
頭尾位 CC view乳頭-胸大肌距離Nipple-pectoralis distance
頭尾位 CC view後部/內側/外側乳房顯影Posterior, medial and lateral regions
斜位 MLO view胸大肌、乳房下褶、上部乳房顯影Pectoralis muscle, inframammary fold, superior breast

三個仍待補強的灰色地帶:壓迫力、追加攝影、皺摺退件門檻

儘管主體清單已建立共識,研究者誠實指出了三個評審小組建議優先補強的不足之處。

第一是壓迫力(compression force)的品質分級描述。壓迫不足會造成乳房組織重疊與影像銳利度下降;壓迫過度則引發疼痛,可能降低受檢者的篩檢參與意願。然而,如何以文字明確界定「好、次佳、不足」三個等級的壓迫程度,目前的共識措辭仍不夠精準,需要進一步細則補充。

第二是追加攝影(additional and alternative images)的判定準則。在篩檢流程中,何種情況下需要安排補充投照、應補哪個體位,現有建議缺乏系統化框架,共識小組建議制定更清楚的決策流程指引。

第三是皮膚皺摺與空氣投影(skin folds and air projections)的退件門檻。皺摺與空氣投影是乳攝中常見的影像不完美,但並非所有情況都需要重照——哪些程度值得退件、哪些程度可接受,目前缺乏能在培訓與日常品管中使用的具體操作標準。這三個灰色地帶的存在,也說明了即使在標準化共識框架內,部分判斷仍涉及情境考量,難以完全量化。

從共識到工具:三級切截值的實作意義與研究限制

這份共識聲明的核心產出是一份乳攝影像品質評估清單(checklist),每個項目均附有三級品質切截值定義,並說明各指標對於臨床影像判讀的相關性。

統一評估語言的意義不只是「有個表格可以填」。對篩檢計畫的品質保證(quality assurance, QA)體系而言,共識清單能直接強化跨機構品質稽核的可信度、讓新進放射師的培訓更有參照依據,也為未來自動化 AI 影像品質評估系統提供公認的標準基礎。在篩檢品管中,缺乏統一描述語言一直是各機構之間難以有效溝通與比較的障礙,而這份清單提供了一個共通起點。

研究者同時承認,這份清單的根基主要來自文獻回顧與專家共識,後續仍需要前瞻性多中心驗證——特別是在傳統 2D 平板偵測器(flat-panel detector)與數位乳房斷層攝影(digital breast tomosynthesis, DBT)之間,各切截值的適用性是否一致,以及壓迫力等尚未定案的灰色地帶,均有待進一步實證資料支持。

23 位專家德爾菲共識把乳攝品質評估從「各憑經驗」推向「好/次佳/不足三級可量化」,是篩檢品管標準化不可少的基礎工具。

Abstract

Evaluation of image quality in screening mammograms can suffer from significant inter- and intra-observer variability leading to inconsistent quality assessment. The purpose of this study is to establish a standardized framework for describing image quality, thereby reducing subjectivity and enhancing observer consistency. A scoping literature review was conducted to compile a preliminary list of 19 image quality criteria. This preliminary list was evaluated by a multidisciplinary panel of 23 experts through a modified Delphi survey. Experts ranked each criterion based on its "importance for image quality" and "agreement with the phrasing." Criteria for which consensus was not initially achieved were subsequently revised through a focus group discussion. The panel reached consensus on image quality criteria regarding image identification; artefacts; uniformity; symmetry; contrast; radiation dose; sharpness; fibroglandular triangle depiction; nipple-pectoralis distance; depiction of posterior, medial and lateral breast regions in craniocaudal views; and depiction of the pectoralis muscle, inframammary fold and superior breast regions in mediolateral views. However, additional attention was asked to provide clear guidelines on additional, alternative images in screening settings; defining a proper description of good, suboptimal and insufficient compression force; and providing detailed advice on which folds and air projections warrant a retake. This study resulted in a checklist for mammogram image quality assessment, along with cut-off values for good, suboptimal, and insufficient quality, with the clinical relevance of each quality criterion highlighted. A standardized image quality assessment tool is offered to improve the consistency of mammographic image quality interpretation in screening programmes.