Screening Outcomes of Supplemental Automated Breast Ultrasound in Women With Nondense Breasts Undergoing Mammography.

Kwon Mi-Ri, Lee Mi Yeon, Moon Suhyeon, Ko Eun Sook, Ko Eun Young, et al.

View Original ↗
AI 導讀 academic US 重要性 4/5

12 萬人統合分析證實,超音波 65% 的敏感度無法取代常規乳房攝影,僅適合做為高密度乳腺的附加工具。

  • 乳房攝影合併敏感度達 81%,顯著擊敗超音波的 65%,超音波不具單獨替代價值。
  • 納入文獻多採 30 至 35 歲極年輕起始年齡,連帶使得攝影整體敏感度略降至 81%。
  • 超音波 99% 的超高特異度可能來自於短至 1 年的追蹤期,導致間隔癌嚴重被低估。

超音波一直被視為亞洲女性緻密型乳房的理想解方,但真實數據給出了相反的答案——在涵蓋超過 12 萬名受試者的嚴格統合分析中,單獨依賴超音波篩檢的合併敏感度僅有 65%,顯著敗給傳統乳房攝影的 81%。若草率將攝影從第一線抽離,將有高達 35% 的潛在惡性腫瘤成為漏網之魚。

亞洲特有 40 歲發病高峰與篩檢工具的抉擇

東亞女性的乳腺結構與西方族群存在顯著的流行病學與生理差異,這也是公衛政策長期的爭論焦點。從 1988 年至 2009 年的數據顯示,包含中國、韓國與新加坡在內的地區,乳癌標準化發生率每年正以 2.0% 至 6.4% 的驚人速度攀升。更棘手的是,亞洲女性乳癌的平均發病年齡落在四十至五十歲之間,足足比歐美西方國家早了整整十年。這群相對年輕的病患,普遍具有體積較小且緻密程度極高的乳房組織。西方國家依賴常規乳房攝影(Mammography, MG),成功將 50 至 69 歲族群的乳癌死亡率降低了 20%,但這套西方劇本卻很難直接套用在亞洲。

傳統乳房攝影的敏感度與乳房密度呈絕對的負相關,面對年輕且緻密的腺體,病灶極易被重疊的正常組織遮蔽。再加上許多亞洲國家的醫療預算吃緊、高階攝影儀器分配不均,具備低成本、無游離輻射且機動性高的乳房超音波(Ultrasound, US),自然被推舉為極具潛力的替代方案。過去幾年,許多單一評估超音波表現的地區性文獻,皆宣稱其在緻密乳房中的尋癌能力優越。然而,如果單純從「人口級別的大規模普查」視角切入,超音波真的具備完全頂替傳統攝影的科學底氣嗎?為了解決這個臨床痛點,研究團隊決定透過嚴謹的文獻回顧,對這兩種影像模態進行一對一的直接比較。

涵蓋 12 萬人的嚴格並行設計與 QUADAS-2 檢驗

為了避免單獨檢驗某一種設備所造成的選擇性偏差,本篇研究在收案條件上設立了極高的門檻。作者依循 PRISMA(系統性文獻回顧與統合分析優先報告準則)框架,從 PubMed、Web of Science 以及中國知網(CNKI)三大資料庫中,海撈 2000 年至 2019 年間發表的上千篇論文。最為關鍵的篩選條件是「並行設計(concurrent design)」——受試者必須是居住在亞洲、無乳癌病史的女性,而且必須在同一次的群體篩檢計畫中,同一時間點接受了攝影與超音波雙重檢查。此外,最終的判定基準必須包含切片結果或長期追蹤報告。

經過層層剔除,起初的 4424 篇文獻僅剩 6 篇符合這項嚴格標準,包含兩項大型的多中心隨機對照試驗(RCT)與四項世代研究(Cohort studies)。這 6 份研究共計納入了 124,425 名無症狀女性,整體合併的盛行率來到千分之 3.7(各研究分佈於千分之 1.2 至 5.7 之間)。在品質檢驗階段,兩位獨立審閱者使用了 QUADAS-2(診斷準確度研究品質評估工具,專門用來抓出受試者挑選與流程瑕疵的查核清單)進行評分。多數文獻在病患挑選上展現低偏差,但在「流程與時間」這項指標上,有兩篇因受試者中途退出或追蹤不均勻而被評為高風險。

在數據統合方面,考慮到診斷型試驗先天存在的巨大異質性,作者選用了雙變量隨機模型(Bivariate random models,一種能同時考量敏感度與特異度關聯性並校正研究間誤差的進階統計手法)來估算整體的準確度。這個模型不僅能算出信賴區間,更產出了關鍵的診斷勝算比(Diagnostic Odds Ratios, DOR),以單一量化指標直觀呈現兩台儀器的辨識能力。

文獻篩選與參與研究概況
納入研究特徵數據細節
資料庫來源PubMed, Web of Science, CNKI
年代範圍2000 年至 2019 年
核心納入條件亞洲女性且同時接受攝影與超音波
最終入選6 篇 (2 篇 RCT, 4 篇 Cohort)
總病患數124,425 名

嚴格要求並行接受雙重檢查的收案標準

Figure 3 揭示的 65% 敏感度防線與勝算比

將焦點轉向最核心的效能對決,這份統合分析給出了毫無懸念的答案。依據 Figure 3 所繪製的森林圖,傳統乳房攝影在亞洲女性身上繳出的合併敏感度高達 0.81 [95% CI: 0.71–0.88];反觀備受期待的超音波,其合併敏感度僅落在 0.65 [95% CI: 0.58–0.72]。透過概似比檢定(Likelihood ratio tests)進一步驗證,攝影在敏感度上取得了統計學上的顯著性勝利(p = 0.03)。這串數字傳遞了一個強烈的警告:如果我們貿然廢除常規攝影,改用超音波擔當第一線普查任務,每一百顆惡性腫瘤中,我們將眼睜睜放過 35 顆。

在特異度的較量上,兩者的表現則呈現高度一致的優秀水準。同樣從 Figure 3 觀察,攝影的合併特異度為 0.98 [95% CI: 0.94–1.00],超音波為 0.99 [95% CI: 0.97–1.00],兩者並無顯著差異(p = 0.65)。然而,若我們引入能夠綜合考量偽陽與偽陰性代價的診斷勝算比(DOR),攝影的合併 DOR 高達 253 [95% CI: 42–1541],完全輾壓了超音波的 179 [95% CI: 58–552](數字越大代表將有病與無病群體分開的能力越強)。

若將視角縮放到 Table 2 內的個別 RCT 數據,更能體會這種落差。以 Shen 等人於 2015 年針對高風險族群的試驗為例,超音波共出現了 4 例偽陰性(錯放惡性),而攝影僅有 2 例偽陰性。而在日本的大規模 J-START 試驗(Ohuchi 發表)中,針對三萬多人的對照群組,單獨使用超音波的陽性預測值(PPV)為 5.9%,而攝影則為 4.1%。這再再證明,當面對微小鈣化或無腫塊的早期病變時,攝影所建構的防禦網依然遠比探頭掃描來得嚴密。

Figure 3 核心數據:攝影與超音波效能對決

攝影敏感度達 81%,具備統計學顯著優勢

Table 1 暴露的年齡閾值與追蹤期異常干擾

身為資深醫師,你可能會好奇:為什麼這份統合分析中,攝影的敏感度(81%)比美國族群常態的 87% 來得低?而超音波的特異度(99%)又似乎高得有些不切實際?解答隱藏在 Table 1 各項研究的設計參數裡。首先是極度前傾的「起始篩檢年齡」。這六篇收案文獻中,有四篇的起始年齡設定在超乎尋常的 30 至 35 歲之間。三十歲出頭的腺體極端緻密,這不可避免地稀釋了攝影的整體敏銳度,導致其數值從歐美水準的八成大關向下修正。

第二個統計陷阱在於「過短的追蹤期」。除了 Ohuchi 的 J-START 試驗有維持 24 個月的追蹤外,其餘五篇 cohort 都僅設定了 12 個月的極短追蹤期。追蹤期過短會引發連鎖效應——那些生長較慢的間隔癌(Interval cancers,在兩次表定篩檢期間浮現的惡性腫瘤)根本來不及在統計截止前爆發。未能確實捕捉到間隔癌,等同於大幅少算了偽陰性的數量,使得大量其實有病的患者被歸類在「真陰性」之中。這正是超音波特異度被異常膨脹至近乎完美 99% 的核心主因。

最後,多數納入的文獻僅記錄了「第一輪普查(first-round screening)」的數據。這會導致首輪篩檢效應被過度放大,因為群體中累積多年、體積龐大且容易被任何儀器看見的盛行癌(prevalent cancers)全在此時被撈出,從而製造出兩種儀器效能都很高的錯覺。另外,亞洲族群的緻密特性究竟是源自於人種基因,還是單純因為體型(BMI)較低且乳房體積較小?目前學界依舊沒有定論。種種干擾變數都提醒著我們,解讀這類東亞本土報告時,絕對不能只看表面的平均值。

Table 2 精選文獻之偽陽性與偽陰性對比
研究來源與模態真陽性 (TP)偽陰性 (FN)
Shen (2015) 攝影3 例2 例
Shen (2015) 超音波7 例4 例
Dong (2018) 攝影84 例15 例
Dong (2018) 超音波61 例38 例

超音波在各別試驗中容易錯放微小惡性病灶

偽陽性代價與放射科第一線的臨床定位

作者在 Discussion 階段非常坦率地承認了這項研究的侷限。首先,符合並行對照標準的文獻實在太少,其中又有四篇高度集中於中國地區,因此將結論直接外推至全亞洲的城鄉醫療網時,仍需保留解釋空間。其次,正如 QUADAS-2 所指出的,部分研究的流失率偏高,使得實際的敏銳度極可能存在些微高估。更重要的是,目前的數據無法針對高風險(如 BRCA 帶原)或特定的緻密等級(BI-RADS C/D)進行獨立的次群組量化分割。

從實務面來看,超音波具備找尋無鈣化腫塊的強大機動性。包含先前的 BCSC(乳癌監測聯盟)追溯數據皆指出,如果採用「攝影加上超音波」的雙管齊下策略,癌症發現率能維持在每千次檢查 5.4 至 5.5 例的高檔;但代價是偽陽性率會從原本的千分之 22 飆升到千分之 55,後續的切片焦慮與醫療浪費將呈現指數級增長。

綜合上述所有的量化證據,這篇文獻為放射科確立了極為清晰的防線指引。雖然超音波在年輕女性與高密度腺體中大受歡迎,但在當前的診斷技術下,它完全沒有單獨取代乳房攝影的資格。我們應該停止尋找「單一替代神兵」的不切實際幻想。在亞洲獨特的發病曲線上,超音波最完美的戰鬥位置是作為攝影的副手,為那些已照過相、卻被大片緻密腺體掩蓋視線的患者,進行精準的盲區填補。

下次若有三十多歲的高風險女性要求只做超音波來避開攝影擠壓,你可以更有底氣地拒絕她:光靠探頭我們可能會漏掉 35% 的早期病灶,常規攝影依然是無可撼動的第一道防線。

Abstract

To evaluate the performance of supplemental automated breast ultrasound (ABUS) added to mammography-based breast cancer screening for women with nondense breasts. A retrospective search of radiology databases at two tertiary institutions identified asymptomatic women with nondense breasts who underwent breast cancer screening using both digital mammography (DM) and supplemental ABUS between January 2020 and December 2023. We excluded women without sufficient follow-up data or those without an established final diagnosis, including histopathologic results. The performance measures of DM alone and ABUS combined with DM (ABUS plus DM) were compared. The primary outcome was the cancer detection rate (CDR), and the secondary outcomes were sensitivity and specificity. Subgroup analyses were performed for women with scattered fibroglandular density and almost entirely fatty breasts. A total of 2,904 pairs of screening examinations were performed in 1,683 women (59 ± 10 years), detecting 26 cancers. In comparison with DM alone, ABUS plus DM showed higher CDR (9.0 vs. 7.9 per 1,000 examinations, Supplemental ABUS improved cancer detection and sensitivity in women with nondense breasts, with the benefits primarily observed in those with scattered fibroglandular density.