Image quality standards in digital mammography: A consensus statement.
23 位專家透過 Delphi 調查,為數位乳攝 19 項品質指標建立三級切截值共識清單,11 個面向首度標準化
- CC 位與 MLO 位各有體位專屬指標:乳頭-胸大肌距離、胸大肌深度是評估關鍵
- 壓迫力品質分級描述仍未達共識,是清單中最需補強的灰色地帶
- 11 個共識面向搭配三級切截值,讓退件判定從主觀感受走向可稽核標準
同一張乳攝片,不同放射師的品質評分可以大相徑庭,連同一人在不同時段覆閱也常有出入。23 位多專科專家透過修正式德爾菲(Delphi)調查,從文獻整理出的 19 項初步指標出發,建立數位乳房攝影品質評估共識清單,首度為每個評估面向訂出「好、次佳、不足」三級切截值,把退件判定從主觀印象推向可量化標準。
評分因人而異:乳攝品管一致性的結構性困境
乳房 X 光攝影篩檢計畫的有效性,與影像品質的穩定性密切相關。一張壓迫不足、乳腺後緣組織未完整納入、或對比度偏低的攝影片,可能讓微小鈣化灶或腫塊邊緣失去清晰輪廓,而這些細節正是早期乳癌偵測的關鍵訊息。
問題在於,判斷「這張片子合不合格」的標準,長期高度仰賴個別放射師的主觀判斷與經驗。研究者指出,乳攝品質評估存在顯著的觀察者間差異(inter-observer variability)——不同放射師對同一張片子的結論可以不一致;也存在觀察者內差異(intra-observer variability)——同一位放射師在不同時間評閱同一張片子,也可能給出不同評分。
這種不一致性的後果是多方面的:退件率的判定缺乏依據、不同機構之間的品質比較難以進行、新進放射師的品管培訓因缺乏統一框架而效果有限。研究的出發點,正是要為這個長期存在的灰色地帶立下可操作的標準。
19 項初步指標、23 位專家、兩輪修正式德爾菲流程
研究方法分兩階段推進。第一階段透過系統性文獻範圍回顧(scoping literature review),彙整出 19 項乳攝影像品質評估指標作為出發點,涵蓋從基礎的影像作業確認到進階的解剖結構顯影。
第二階段邀請 23 位多專科專家組成評審小組,採用修正式德爾菲(Modified Delphi)法進行評估。德爾菲法是以匿名多輪問卷為主的共識建立方法,設計上可避免強勢意見主導討論,適合整合不同專業背景的評估意見——這一點在多專科篩檢計畫中尤其重要。
每位專家就兩個維度對各指標打分:「影像品質重要性」及「措辭的清晰度與適切性」。對於首輪未達共識的指標,研究團隊另外安排焦點小組討論(focus group discussion)進行修訂,將修改後的措辭重新送交評審,確保最終清單的每一條標準都具備可操作性,且能獲得跨專科的認可。
達成共識的 11 個品質面向
最終共識確認了 11 個主要品質評估面向,可分為通用指標與體位特定指標兩類。
通用指標適用於所有體位,包括影像識別(image identification,確認病患資料、體位標記等基本資訊)、偽影(artefacts)、均勻度(uniformity)、對稱性(symmetry,雙側乳房的比對完整性)、對比度(contrast)、輻射劑量(radiation dose)、銳利度(sharpness),以及纖維腺體三角(fibroglandular triangle)的完整顯影。這八項指標構成品質評估的基本盤,與體位選擇無關。
體位特定指標方面,頭尾位(CC view,craniocaudal view)的評估重點在於:乳頭-胸大肌距離(nipple-pectoralis distance),用以確認乳腺後緣是否被納入;以及乳房後部(posterior)、內側(medial)、外側(lateral)三個區域的顯影完整性。
斜位(MLO view,mediolateral oblique view)則聚焦於:胸大肌(pectoralis muscle)的可見程度與延伸範圍(理想上應深達乳頭水平線)、乳房下褶(inframammary fold)的清晰呈現,以及上部乳房(superior breast region)的涵蓋範圍。每個面向均搭配三級切截值定義,讓評分從感覺轉向有據可查的判斷。
| 分類 | 品質評估面向(中文) | 原文英文術語 |
|---|---|---|
| 通用(所有體位) | 影像識別 | Image identification |
| 通用(所有體位) | 偽影 | Artefacts |
| 通用(所有體位) | 均勻度 | Uniformity |
| 通用(所有體位) | 對稱性 | Symmetry |
| 通用(所有體位) | 對比度 | Contrast |
| 通用(所有體位) | 輻射劑量 | Radiation dose |
| 通用(所有體位) | 銳利度 | Sharpness |
| 通用(所有體位) | 纖維腺體三角顯影 | Fibroglandular triangle depiction |
| 頭尾位 CC view | 乳頭-胸大肌距離 | Nipple-pectoralis distance |
| 頭尾位 CC view | 後部/內側/外側乳房顯影 | Posterior, medial and lateral regions |
| 斜位 MLO view | 胸大肌、乳房下褶、上部乳房顯影 | Pectoralis muscle, inframammary fold, superior breast |
三個仍待補強的灰色地帶:壓迫力、追加攝影、皺摺退件門檻
儘管主體清單已建立共識,研究者誠實指出了三個評審小組建議優先補強的不足之處。
第一是壓迫力(compression force)的品質分級描述。壓迫不足會造成乳房組織重疊與影像銳利度下降;壓迫過度則引發疼痛,可能降低受檢者的篩檢參與意願。然而,如何以文字明確界定「好、次佳、不足」三個等級的壓迫程度,目前的共識措辭仍不夠精準,需要進一步細則補充。
第二是追加攝影(additional and alternative images)的判定準則。在篩檢流程中,何種情況下需要安排補充投照、應補哪個體位,現有建議缺乏系統化框架,共識小組建議制定更清楚的決策流程指引。
第三是皮膚皺摺與空氣投影(skin folds and air projections)的退件門檻。皺摺與空氣投影是乳攝中常見的影像不完美,但並非所有情況都需要重照——哪些程度值得退件、哪些程度可接受,目前缺乏能在培訓與日常品管中使用的具體操作標準。這三個灰色地帶的存在,也說明了即使在標準化共識框架內,部分判斷仍涉及情境考量,難以完全量化。
從共識到工具:三級切截值的實作意義與研究限制
這份共識聲明的核心產出是一份乳攝影像品質評估清單(checklist),每個項目均附有三級品質切截值定義,並說明各指標對於臨床影像判讀的相關性。
統一評估語言的意義不只是「有個表格可以填」。對篩檢計畫的品質保證(quality assurance, QA)體系而言,共識清單能直接強化跨機構品質稽核的可信度、讓新進放射師的培訓更有參照依據,也為未來自動化 AI 影像品質評估系統提供公認的標準基礎。在篩檢品管中,缺乏統一描述語言一直是各機構之間難以有效溝通與比較的障礙,而這份清單提供了一個共通起點。
研究者同時承認,這份清單的根基主要來自文獻回顧與專家共識,後續仍需要前瞻性多中心驗證——特別是在傳統 2D 平板偵測器(flat-panel detector)與數位乳房斷層攝影(digital breast tomosynthesis, DBT)之間,各切截值的適用性是否一致,以及壓迫力等尚未定案的灰色地帶,均有待進一步實證資料支持。
23 位專家德爾菲共識把乳攝品質評估從「各憑經驗」推向「好/次佳/不足三級可量化」,是篩檢品管標準化不可少的基礎工具。