Imaging-Detected Extranodal Extension in Head and Neck Cancer: Current Evidence, Standardized Grading, and Clinical Implications.

Lee Jeong Hyun, Lee Dongjun, Choi Young Jun

View Original ↗
AI 導讀 academic CT 重要性 5/5

AJCC 第九版正式將影像偵測的淋巴結外侵犯(iENE)列為分期標準,掌握最新 4 級評估原則避免病患喪失手術機會。

  • iENE 是 HPV 陽性口咽癌的強烈預後指標,其遠端轉移 HR 高達 3.83,威脅性甚至超越病理切片 (pENE)。
  • 最新 4 級影像標準中,邊界不清不算侵犯,必須有明確的「脂肪突刺」才能判定為 Grade 1 陽性。
  • Grade 2 結節融合極易誤判,必須同時滿足「隱窩消失、凸面喪失、銳角消失」三大條件才成立。

影像判讀出的淋巴結外侵犯(iENE)比病理切片更能預測存活率——在人類乳突病毒(HPV)陽性口咽癌中,iENE 陽性患者的遠端轉移風險高達 3.83 倍。過去放射科常把結節外蔓延視為次要的影像發現,但在 2025 年啟用的新版國際分期系統中,這項指標已正式成為判定腫瘤期別的關鍵要素,直接決定病患能否免於高毒性的輔助放化療。

AJCC 第九版與 iENE 預測口咽癌生存的優勢

傳統上,Extranodal extension(ENE,腫瘤細胞突破淋巴結莢膜向外擴散的病理現象)在頭頸部鱗狀細胞癌(HNSCC,源於黏膜上皮的惡性腫瘤)中,是預後不良的重要指標。AJCC 第八版分期系統嚴格區分了臨床與病理的 N(淋巴結)分期,並明確指出病理證實的 pENE(病理淋巴結外侵犯)會將非病毒型頭頸癌的 N 分期直接上調至 N2a 或 N3b。在手術切除後確認有 pENE 的患者,隨機對照試驗已證實需要在輔助放射治療中加入同步化療,才能有效降低復發率並提升整體存活率。

然而,pENE 在目前臨床實務中面臨一個重大阻礙:它完全依賴外科手術取得的病理檢體。對於一開始就接受主要化學放射治療(primary chemoradiotherapy)的病患而言,根本無從取得 pENE 數據。這在病毒相關的頭頸部癌症中尤其關鍵,例如人類乳突病毒陽性口咽癌(HPV+ OPC,一種與 HPV 感染高度相關且對放化療反應較佳的口咽部癌症)。在這類病患中,器官保留手術合併頸部淋巴結廓清的療效,往往與直接進行化放療不相上下。如果能透過影像精準預測 ENE,就能在治療前及早介入,避免病患在開刀後才因病理確診 pENE 而被迫追加化放療,承受雙重治療帶來的巨大毒性。

將焦點轉向預後分析,Table 1 的薈萃分析數據顯示了 iENE(影像偵測的淋巴結外侵犯)的強大預測力。在 HPV 陽性口咽癌中,iENE 陽性患者的整體存活率風險比(HR)達 2.64 [95% CI: 1.46–4.78],遠端轉移免存活率的 HR 更是高達 3.83 [95% CI: 1.88–7.80]。相較之下,傳統 pENE 的 HR 僅分別為 1.89 與 3.23。為什麼影像判讀的結果比病理切片更具威脅性?作者解釋,iENE 通常反映了更大範圍、肉眼可見的腫瘤蔓延或軟組織轉移,這類巨觀的侵犯本身就是極度惡性的象徵。

正是基於上述強而有力的證據,2025 年全面實施的 AJCC 第九版分期系統做出了重大變革。在鼻咽癌(NPC,好發於亞洲人種的咽喉上部癌症)的 N 分期中,正式將「進階放射學 ENE(advanced radiologic ENE)」納入 N3 期的判定標準。這意味著 iENE 已從過去輔助診斷的描述性文字,正式躍升為左右癌症分期的決定性指標。

Table 1 預後風險:iENE 與 pENE 比較
評估指標整體存活率 (HR)遠端轉移免存活率 (HR)
病理切片 (pENE+)1.89 [1.15-3.13]3.23 [1.25-8.33]
影像判讀 (iENE+)2.64 [1.46-4.78]3.83 [1.88-7.80]

在 HPV 陽性口咽癌患者中的預測風險比 (HR)

Table 2 數據:MRI 與 CT 偵測 iENE 的精準度

要評估 iENE,目前臨床上最依賴的主力工具依然是顯影劑強化的電腦斷層(CT)與磁振造影(MRI)。從影像學的角度來看,常見的診斷特徵包括莢膜邊緣不規則、淋巴結周邊脂肪浸潤、相鄰淋巴結間的脂肪隱窩消失,以及直接侵犯周遭的肌肉、皮膚或神經血管束等結構。

細看 Table 2 整理的多項國際薈萃分析數據,不同影像工具的表現存在一定程度的差異。2024 年 Mair 等人發表的最新薈萃分析顯示,MRI 在偵測 iENE 的敏感度上顯著優於 CT。具體而言,MRI 的合併敏感度高達 83% [95% CI: 71–90%],而 CT 僅有 63% [95% CI: 53–73%];不過兩者在特異度上的表現完全相同,均為 85% [95% CI: 74–91%]。這顯示 MRI 在軟組織對比度上的天生優勢,使其在揪出微小的周邊脂肪或肌肉侵犯時更為敏銳。

但如果檢視其他團隊的研究,結果卻出現不同的分布。例如 2021 年 Park 等人的分析指出,CT 的敏感度為 73% [95% CI: 62–82%]、特異度 83%;但 MRI 的敏感度卻只有 60% [95% CI: 49–70%],特異度則高達 96%。而同年 Abdel-Halim 等人的數據則顯示兩者表現相當(CT 敏感度 76%、MRI 72%)。綜合來看,CT 與 MRI 的整體診斷準確率大約落在中等水準(敏感度 60-85%,特異度 77-96%)。

作者特別指出,過去這些文獻中影像與病理關聯性偏低,並非全是放射科看片的問題,很大一部分要歸咎於病理學界對 pENE 的認定標準長期不一。在近期的國際共識出爐前,病理科醫師對於「突破莢膜多深才算 ENE」、切片採樣的密度、以及報告的用語都存在極大異質性。這種作為「黃金標準」的病理判定本身就不穩定,自然導致放射科在回顧性比對時,出現精準度不佳的假象。

Table 2 薈萃分析:CT vs MRI 診斷效能

Mair et al. (2024) 薈萃分析數據,MRI 對周邊侵犯具備較高敏感度

Table 3 學會提出的四大 iENE 影像分級標準

有鑑於上述的標準混亂,頭頸癌國際小組(HNCIG)在獲得 19 個國際學會背書後,透過多輪德菲法(Delphi process,透過專家反覆問卷收斂共識的研究方法)確立了 iENE 的標準術語。隨後,亞洲大洋洲神經放射與頭頸部放射醫學會(AOSNHNR)、美國頭頸部放射醫學會(ASHNR)與歐洲頭頸部放射醫學會(ESHNR)成立了聯合工作小組,共同發布了一套四級(Four-tier)影像分級系統(整理於 Table 3),這將是未來放射科發打報告的標準依據。

Grade 0 代表「無明確的 iENE(陰性)」。在 CT 或 T2 權重 MRI 影像上,淋巴結與周圍的胸鎖乳突肌、顎下腺及頸動脈鞘之間必須有清晰明確的邊界。工作小組特別提醒,如果是使用超音波評估,邊緣產生的聲影假影絕不能被誤認為是莢膜不規則。

Grade 1 定義為「淋巴結周圍脂肪侵犯」。在影像上,必須明確觀察到向周圍脂肪伸出的尖刺狀(spiky)或結節狀(nodular)突起。為了避免過度診斷,聯合工作小組刻意移除了原本 HNCIG 共識中的「邊界不清」字眼,強調單純的邊界模糊如果不伴隨實質的脂肪突刺,就不符合 Grade 1 的標準。

Grade 2 定義為「結節融合」。這不是單純的兩顆淋巴結靠在一起而已,必須展現出真正的組織融合。Grade 3 則是「器官侵犯」,指轉移的淋巴結腫塊實質取代了胸鎖乳突肌,或明顯侵入擴頸肌、皮下脂肪、腺體及神經血管束。

Table 3 聯合學會四級影像分級標準
分級定義名稱核心影像判讀標準
Grade 0無明確 iENE淋巴結與鄰近肌肉/血管之間具備清晰明確的邊界
Grade 1周邊脂肪侵犯周邊脂肪層出現明確的尖刺狀 (spiky) 或結節狀突起
Grade 2結節融合需同時滿足:脂肪隱窩消失、接觸點失去凸面、相鄰銳角消失
Grade 3器官侵犯腫塊實質取代肌肉、皮下脂肪,或侵入神經血管束與腺體

AOSNHNR、ASHNR 與 ESHNR 共同制定的標準

Figure 1 結節融合三大判定條件與觀察者變異

即便有了這套分級系統,要在臨床實務中達到高度的一致性仍是巨大的挑戰。Tran 等人近期測試了七種常見的 iENE 影像特徵,結果發現即便都是專科等級的頭頸部放射線醫師,對於「邊緣不規則」的判讀一致性極差,Fleiss' κ 值僅有 0.21;表現最好的是「中央壞死」與「結節融合」,κ 值分別落在較佳的 0.56 與 0.49。

為了解決主觀判斷的差異,聯合工作小組在 Figure 1 的影像圖集中,對 Grade 2(結節融合)設下了極其嚴格的「三大判定條件」。若要將病灶打上 Grade 2,必須同時滿足這三項特徵:第一,相鄰淋巴結之間的脂肪隱窩完全消失;第二,在接觸點失去淋巴結原有的凸面外觀;第三,至少在一個接觸點上,相鄰淋巴結之間的銳角消失。這三個條件缺一不可,藉此將真正的組織交融與單純的分葉狀外觀區分開來。

在 Figure 1 中,作者也展示了多重影像工具互相補足的案例。例如在 Figure 1 I 與 J 示範的 Grade 3 器官侵犯中,淋巴結雖然明顯吃掉了胸鎖乳突肌,但對於內頸靜脈內是否有腫瘤栓塞,在 MRI 上看起來依然模稜兩可。此時若搭配高頻超音波,就能明確看到靜脈內的實質侵犯。另一張 CT 影像(Figure 1 K)則捕捉到了右側舌骨下帶狀肌群的萎縮,這項間接徵象強烈暗示了位於內頸靜脈前方的頸神經襻已遭到淋巴結侵犯。

這套系統背後最核心的指導原則是:只有在特徵極度清晰且毫無疑義時,才能在報告上標註 iENE 陽性。一旦影像表現處於模稜兩可的灰色地帶,就必須保守判定為陰性。作者一再強調,寧可採取保守態度,也不能因為過度分期而剝奪病患接受根治性治癒手術的機會。

AI 的 0.92 AUC 表現與多中心驗證的限制

為了突破放射科醫師肉眼判讀的中等精準度與高度主觀變異,人工智慧(AI)已成為輔助 iENE 評估的最強大外掛。近年來,訓練於大量 CT 影像的深度學習模型在回顧性研究中,展現了超越個別專科醫師的診斷潛力。

Aulakh 等人進行的系統性回顧與薈萃分析,涵蓋了 6 篇研究、包含來自 1407 位病患的 2870 顆淋巴結。數據顯示,MLA(機器學習演算法,用大量數據訓練電腦自動尋找影像特徵規律的模型)在預測 CT 上的 ENE 表現極佳,合併曲線下面積(AUC)高達 0.91 至 0.92。作為對比,放射科醫師在相同條件下的 AUC 只有 0.65。這項懸殊的數據差異,充分展現了演算法在處理高維度特徵時的敏銳度。

更具臨床衝擊力的是 Dayan 等人針對 HPV 陽性口咽癌開發的新型 AI 模型。該團隊不僅用治療前的 CT 影像訓練模型,還將其與病患的遠期預後綁定。研究結果指出,AI 模型預測出來的 iENE,在評估整體存活率與遠端轉移風險的分別能力上,甚至擊敗了由資深放射科醫師親自標註的 iENE。這暗示了 AI 演算法可能抓到了某些肉眼無法察覺、但極具生物學意義的微觀影像特徵。

雖然前景看好,但作者在討論段落中也坦承了目前的嚴重限制。上述納入分析的 AI 模型,其架構、影像擷取參數以及用作黃金標準的 ENE 定義存在極高的異質性。多數研究都依賴單一醫學中心的小型資料集,且缺乏嚴格的外部驗證。Dayan 的模型雖然強大,但也受限於每個病患只分析一顆最大的淋巴結,並未綜觀整體的頸部淋巴結網絡。

因此,在這些多中心大型前瞻性驗證出爐前,放射科醫師不應將判讀責任完全外包給 AI。目前的最佳實務依然是將 iENE 視為一個正在演進的影像生物標記。臨床同儕應盡快熟悉 Table 3 的四大分級系統,並採用結構式報告來描述結節狀態,在多專科團隊會議中提供更精準、一致的預後資訊。

若你在 CT 看到淋巴結邊界模糊,但沒有明確的「脂肪突刺」或「三大結節融合特徵」,請務必保守打 Grade 0,千萬別因過度分期而讓病患錯失救命的開刀機會。

Abstract

Extranodal extension (ENE) of metastatic lymph nodes is a well-established adverse prognostic factor in head and neck cancer and has traditionally been confirmed pathologically. Imaging-detected ENE (iENE) enables pre-treatment assessment and provides prognostic information across different treatment settings. Recent studies and meta-analyses have demonstrated an independent association between iENE and adverse outcomes in both nasopharyngeal carcinoma (NPC) and human papillomavirus-positive oropharyngeal carcinoma, supporting its prognostic relevance, particularly in nonsurgical patient populations in whom pathological confirmation is unavailable. Growing evidence supporting the prognostic impact of iENE has influenced recent revisions to the American Joint Committee on Cancer 9th edition staging system, which now incorporates "advanced radiological ENE" as a criterion for the N3 category in NPC. However, the clinical interpretation of iENE remains constrained by substantial interobserver variability, heterogeneous imaging criteria, and an imperfect correlation with pathological ENE (pENE), underscoring the ongoing debate regarding its clinical validity. Recent international efforts have sought to standardize imaging definitions and grading systems for iENE, with the aim of reducing variability and facilitating more consistent application in clinical practice and research. This review summarizes the current evidence regarding the prognostic and diagnostic roles of iENE, outlines recent developments in its classification, and discusses future directions for its integration into risk-adapted treatment planning for head and neck cancer.