An Analysis of Radiographers' False Preliminary Image Evaluation Comments in One New Zealand District.

Lewis Kim, Mdletshe Sibusiso, Doubleday Andrea, Pieterse Tracey

View Original ↗
AI 導讀 technology general 重要性 3/5

在844份影像評估中,2.5%因手腕細微結構漏判骨折,3.2%因足踝正常變異遭到過度診斷。

  • 手腕與手指區域的細微骨折及撕脫性骨折,佔據了高達 2.5% 的偽陰性漏診比例。
  • 足踝部位存在的先天正常變異,是引發 3.2% 偽陽性過度診斷的主要解剖學原因。
  • 建議為放射師配備高解析度專用螢幕,並在系統新增不確定選項以應對模糊用語。

在紐西蘭塔拉納基(Taranaki)地區為期六個月的醫療影像評估數據中,844 份由放射師提供的初步評論裡有 21 份漏判異常,另有 27 份出現過度診斷。這項針對急診室初步影像評估準確度的實證研究,具體指出了不同人體部位在 X 光判讀時的特定錯誤模式與後端硬體升級需求。

紐西蘭塔拉納基 844 份初步影像評估數據分析

初步影像評估(Preliminary image evaluation, PIE,指放射師正式報告前的異常初步註記)是一套專為減輕急診室(ED)負擔而設計的異常檢測機制。在常規流程中,正式的放射科醫師報告往往需要較長的等待時間,而透過 PIE 機制,第一線執行 X 光攝影的放射師能夠及時協助急診臨床醫師制定初步的治療決策。這種前置作業能有效將非專科醫師自行判讀影像的錯誤風險降至最低。然而,要讓這套臨床輔助系統發揮最大效用,完全建立在放射師必須對 X 光影像提供高度準確且具體的評論。

目前的醫療影像研究領域中,探討 PIE 準確度的主題雖多,但專門針對放射師給出錯誤評論進行分類與根本原因評估的文獻數量卻相對有限。這份來自紐西蘭(NZ)的研究,便將核心目標鎖定在填補這一空白,試圖找出特定單一醫療地區內,最常見的偽陰性(False Negative, FN,指實際有異常但未被標記)以及偽陽性(False Positive, FP,指影像正常卻被標記為異常)評論類型。

為取得真實世界的臨床數據,研究團隊從紐西蘭塔拉納基(Taranaki)地區的醫療機構影像歸檔與通訊系統中,完整收集了連續六個月的 PIE 評論紀錄。這些未經篩選的原始數據後續被專業人員嚴格劃分,並依據最終確診報告評分為四個標準類別:真陽性、真陰性、偽陽性與偽陰性。在完成基礎分類後,研究人員特別針對被歸類為 FN 和 FP 的錯判評論進行了深入的影像特徵評估,藉此確立高頻率發生的錯誤模式,並將結果與現存的國際放射科學研究文獻進行交叉比對。

手指與手腕骨折:佔據 2.5% 偽陰性的解剖盲點

在此次收集總計 844 份 PIE 評論樣本的量化數據中,多數的初步評估結果皆呈現了與最終報告一致的正確判斷。然而,數據統計明確顯示,有 21 份初步評論被評分系統判定為偽陰性,佔整體急診影像樣本比例的 2.5%。這些偽陰性數據在臨床上的意義,代表著急診外傷患者實際存在著骨骼系統損傷,但放射師在第一時間審視影像並留下評論時,未能及時發現並標記異常。這可能導致急診看診醫師在後續處置時遺漏關鍵的病灶。

對這 21 份造成漏診的偽陰性評論進行解剖部位與影像特點的交叉分析後,研究團隊找到了高度集中的常見錯誤主題。這些未能被放射師及時察覺的影像病灶,絕大多數屬於非常細微的未移位骨折,或者是體積極小的撕脫性骨折(Avulsion fractures,指韌帶拉扯下小塊骨頭的損傷)。這類骨折的共同視覺特徵是骨皮質的斷裂極為微小且不明顯。

進一步的解剖部位統計指出,這類容易被遺漏的細微損傷,最頻繁發生在患者的手指、手部整體結構以及手腕區域。由於手部與腕部空間內密集包含了大量細小且在 X 光投影上容易相互重疊的腕骨與指骨,複雜的三維解剖結構被壓縮在平面的 2D 影像上。加上急診環境通常伴隨著高壓與快速周轉的節奏,使得即便具備專業背景與經驗的放射師,也極容易在這些特定的細部區域產生初步判讀的視覺疏漏。

足踝正常變異:3.2% 偽陽性評論的常見混淆來源

在另一個極端的判讀錯誤數據上,研究團隊記錄到了 27 份被歸類為偽陽性的初步影像評論,佔總收集樣本數的 3.2%。偽陽性事件的發生,意味著放射師在實際上並無骨折或任何創傷病理異常的骨骼影像上,留下了疑似異常或骨折的初步標記。這種情況雖然不像偽陰性漏診那樣直接面臨延誤治療的醫療風險,但過度的防禦性標記可能導致急診醫師後續安排不必要的進階醫療檢查,或者對患者過度採取無意義的石膏固定處置。

數據的深入分析同樣揭露了這 27 份偽陽性評論背後的常見主題。與偽陰性高度集中於手腕部區域的趨勢截然不同,這類過度診斷的問題主要發生在就診患者的足部與腳踝區域。從骨骼學的角度來看,足踝區域正是人體在骨骼生長發育過程中,最容易保留各種不規則額外小骨頭的解剖部位。

研究明確指出,患者足踝內部原先就存在的正常變異(Normal variants,如先天發育留下的獨立微小骨塊),是造成這類放射師評估錯誤的最核心原因。這些邊緣通常呈現平滑圓潤且毫無臨床症狀的正常附屬解剖結構,在未經高階比對的初步影像評估中,經常被防禦心態較重的放射師誤認為是近期的急性骨折碎片,進而產生了相較於偽陰性略高的偽陽性回報率。

從高解析度螢幕到新增不確定評分選項的臨床建議

基於上述針對手部漏診與足踝過度診斷數據的詳盡分析,研究團隊針對如何從系統與設備層面提升放射師執行 PIE 的準確度,提出了多項具有實務價值的改進建議。首要建議落在 PIE 評論機制的後端評分系統設計上,研究認為應當打破非黑即白的分類,常規加入一個「不確定」或「模稜兩可」的獨立分類選項。

提出新增這個第三選項的主要原因在於,放射師在輸入初步評論時,為了因應影像品質或解剖結構的複雜度,常常會主動使用較為模糊或保守的臨床語言。例如在評論中寫下「疑似細微皮質不連續」或「建議結合臨床觸診評估」等字眼。如果後台評分系統只有絕對的陽性或陰性二分法,將無法準確捕捉並歸類這類帶有警示意味但不具絕對確定的註記。引入這個模稜兩可的選項,將能讓整個評估系統更具彈性,也更貼近急診臨床實務的真實運作狀況。

除了系統機制的調整,硬體設備的升級與後續教育資源投入同樣是改善的重點方向。研究強烈建議,醫療機構應為負責執行初步影像評估的第一線放射師,配備具有更高解析度與對比度的醫療專用螢幕。目前這規格的高階顯示設備通常僅配置給放射科專科醫師在安靜環境中撰寫正式診斷報告時使用,若能將硬體規格下放給急診第一線,將大幅度提升辨識前述微小撕脫性骨折的硬體條件。同時,機構的教學部門必須針對手腕細微骨折與足踝正常變異這兩大高頻率的錯誤模式,實施持續且具有針對性的影像判讀在職培訓。

提升初步影像評估的準確度,除了依賴放射師的持續培訓,將專科級的高解析度螢幕下放至第一線,更是降低細微骨折漏診率的關鍵硬體投資。

Abstract

Preliminary image evaluation (PIE) is an abnormality detection system that enables radiographers to assist emergency department (ED) clinicians in their treatment decisions by minimising radiographic interpretation errors. For a PIE to be successful, radiographers need to provide accurate comments on images. Given the limited number of studies that evaluate radiographers' false PIE comments, the aim of this study was to determine common false negative (FN) and false positive (FP) comments in one district in New Zealand (NZ). Six months of PIE comments performed in the Taranaki district in NZ were collected and scored into four categories: true positive, true negative, FP or FN. The FN and FP comments were then evaluated to determine common errors and compared with international research. A total of 844 PIE comments were collected, with 21 (2.5%) scored as FN, and 27 (3.2%) scored as FP. The common FN themes included subtle or avulsion fractures, predominantly in fingers, hands, and wrists. The common FP themes were normal variants in the foot and ankle that were mistaken for fractures. Several recommendations are made from this study to help improve radiographer PIE accuracy. These include the addition of an unsure or equivocal category when scoring PIE comments to account for PIE comments with ambiguous language. Other recommendations include ongoing targeted training of common errors and a higher resolution monitor (generally used for image reporting by radiologists) for radiographers when performing PIE.