CT Radiomic Features are Associated with DNA Copy Number Alterations of Head and Neck Squamous Cell Carcinomas [ORIGINAL RESEARCH]

Haider, S. P., Schreier, A., Zeevi, T., Gross, M., Paul, B., Krenn, J., Canis, M., Baumeister, P., Reichel, C. A., Payabvash, S., Sharaf, K.

View Original ↗
AI 導讀 academic AI 重要性 4/5

透過萃取頭頸癌 CT 影像中肉眼難辨的紋理特徵,我們能以 71% 的準確率預測腫瘤深層的 DNA 拷貝數變異狀態。

  • 收案 114 例含顯影頸部 CT,從 1037 個特徵中篩選出 29 個具高度鑑別力的紋理與一階特徵。
  • 最佳預測模型採用 SVM 演算法,區分 CNA 陽性與陰性腫瘤的測試集 AUC 達到 0.71 [0.60-0.83]。
  • 形狀特徵在統計校正後全數遭淘汰,證實腫瘤內部的灰階異質性比巨觀外型更能反映基因體不穩定性。

頭頸部鱗狀細胞癌的預後不只取決於傳統的解剖分期,更取決於細胞核內的基因體不穩定性,但現在我們居然能直接從一張普通的打藥頸部 CT,以高達 71% 的準確率預測腫瘤的 DNA 拷貝數變異狀態。這意味著那些肉眼看不見的像素排列與灰階異質性,其實偷偷洩漏了癌細胞最深層的基因型態,為未來的非侵入性影像基因體學鋪平了道路。

腫瘤 DNA 拷貝數變異的臨床價值與影像表徵

在放射科的日常判讀中,我們習慣透過影像上的腫瘤大小、侵犯深度與淋巴結轉移情況來為頭頸部鱗狀細胞癌(HNSCC)進行 TNM 分期。然而,腫瘤內在的生物學行為卻往往讓同樣分期的病患走向截然不同的預後。近年來的基因體學研究指出,HNSCC 可以根據其基因變異的驅動模式分為兩大類。一類是由高度的 DNA CNA(大片段 DNA 的擴增或缺失變異)所驅動,這類腫瘤通常具有較高的基因體不穩定性,預後較差,且對某些標準療法的反應不如預期。另一類則是 CNA 呈現陰性,其腫瘤生成主要由特定的體細胞突變(somatic mutations)所驅動,這類病患的整體存活率與預後通常較為理想。

要在臨床上區分這兩種亞型,傳統上依賴對手術切除或活體穿刺取得的腫瘤組織進行次世代定序或晶片分析。然而,組織切片不僅具有侵入性,且因為腫瘤本身存在高度的空間異質性,單一部位的採樣往往無法反映整個腫瘤的基因全貌。這正是醫學影像能發揮獨特優勢的地方。由於電腦斷層掃描能完整捕捉整個原發腫瘤的三維結構,如果我們能將影像上的微觀特徵與基因體數據相對應,就能在病患接受治療前,提供一個非侵入性、具備全景視角且相對低成本的替代方案。本研究正是建立在這個基礎上,探討常規打藥 CT 影像特徵是否能準確反映 HNSCC 的 CNA 狀態。

收案 114 例 HNSCC 與 1037 個特徵的萃取流程

從 Methods 來看,研究團隊首先利用 SNP-array(用來偵測單核苷酸多型性與拷貝數的高通量微陣列晶片) 的數據作為參考標準。在總共 522 位具備基因拷貝數資料的病患中,透過階層式分群法(hierarchical clustering),客觀地將這些病患劃分為 CNA 陽性與 CNA 陰性兩大次群組。接著,研究人員回溯篩選這些病患的影像資料,最終納入 114 位在治療前有接受標準高品質含顯影劑頸部 CT 掃描的病患,構成主要的影像分析世代。

針對這 114 例影像,研究人員進行了嚴謹的 radiomics(將醫學影像轉化為上千個可量化數據的技術) 分析。他們在原發腫瘤的三維範圍內進行圈選,總共萃取出了高達 1037 個放射影像特徵。這龐大的特徵庫涵蓋了三大維度:第一是形狀特徵(Shape),用來描述腫瘤整體的幾何型態、球形度與表面積;第二是一階強度特徵(First-order intensity),也就是我們熟悉的 Hounsfield Unit (HU) 直方圖分布,包含平均值、偏態、峰度等;第三則是紋理特徵(Texture),這類特徵專門量化相鄰像素之間的灰階變化關係,藉此捕捉肉眼難以察覺的微觀結構混亂度。

有了這 1037 個特徵後,團隊進行了單變量關聯性分析。初步結果顯示,有 190 個特徵(橫跨形狀、一階強度與紋理三大類)在統計上與 CNA 狀態顯著相關。然而,在處理高維度數據時,假陽性是一個必須克服的挑戰。為了確保結果的穩健性,作者採用了嚴格的多重檢驗校正(multiple testing correction)。經過統計校正後,最終僅剩下 29 個特徵依然保持顯著性。值得注意的是,這 29 個堅不可摧的特徵,全數屬於紋理或一階強度特徵,形狀特徵則在校正後全軍覆沒。這項發現直接點出,影響基因體表現的關鍵不在於腫瘤長得多大或多不規則,而在於其內部的灰階組成。

研究流程與特徵降維漏斗
階段數量 / 狀態
具備拷貝數資料總人數522 位
具備高階影像符合條件者114 位
初始萃取影像特徵數1037 個
單變量分析具顯著性190 個
多重檢驗校正後保留29 個 (無形狀特徵)

從基因數據篩選至最終有效特徵的演變

Table 2 揭示的降維結果與 SVM 模型的 0.71 AUC

把焦點拉到 Results,研究團隊的核心任務是利用篩選出的特徵建立預測模型。他們將特徵選擇演算法與不同的機器學習分類器進行配對與優化,試圖找出預測 CNA 狀態的最佳組合。Table 2 詳列了各類模型的預測效能,其中表現最優異的模型是採用了 SVM(在高維度資料中尋找最佳分類界線的機器學習演算法) 分類器。這個最佳模型在預測 HNSCC 原發腫瘤為 CNA 陽性或陰性時,達到了 0.71 的 AUC(曲線下面積),其 95% 信賴區間落在 0.60 至 0.83 之間。

我們必須客觀看待這個數字。在機器學習領域,AUC 0.71 屬於中等程度的預測能力,它證明了 CT 影像特徵與腫瘤 DNA 拷貝數變異之間確實存在非隨機的生物學關聯,這在基礎科學層面上是極具價值的。模型能夠從 100 多例的樣本中學會辨識 CNA 陽性腫瘤特有的影像模式,說明這些影像特徵不僅僅是統計上的巧合,而是腫瘤微環境變化的真實反映。相比於完全依賴運氣的隨機猜測(AUC 0.50),這 21% 的提升代表了影像數據中蘊含著尚未被肉眼充分利用的基因型訊號。

然而,若細看模型的信賴區間下限,0.60 意味著在某些極端或邊界案例中,單純依賴現階段的 CT 模型進行預測仍有一定的誤差風險。這個結果提醒我們,目前的放射組學模型尚未達到可以直接取代實體組織切片的診斷標準(通常臨床應用的 AUC 門檻會期望大於 0.85 甚至 0.90)。但不可否認的是,這項結果為未來的多模態整合(例如結合臨床變數、HPV 狀態或 MRI 影像)打下了堅實的基礎。

SVM 模型預測 CNA 狀態效能

最佳機器學習分類器之 95% 信賴區間

Figure 3 的紋理特徵與腫瘤內部異質性的關聯

在探討這些數字背後的生物學意義時,Figure 3 畫出了這些具有高度鑑別力的紋理特徵與一階特徵。為什麼是紋理和一階特徵留下來,而形狀特徵被剔除?這其實非常符合病理學上的推演。CNA 陽性的腫瘤因為基因體極度不穩定,容易產生多個不同的腫瘤次細胞株(clonal expansion),同時也伴隨著更激烈的微血管新生反應、局部微小壞死以及細胞密度的劇烈變化。

當這些微觀層次的混亂反映在常規的打藥 CT 上時,並不會改變腫瘤的整體巨觀輪廓,因此形狀特徵無效。取而代之的是,腫瘤內部的顯影劑分布會變得極度不均勻。一階特徵中的直方圖變異度會增加,反映出同一顆腫瘤內高血流灌注區與低血流壞死區交錯分布的現象。而那些存活下來的紋理特徵(例如 GLCM 或 GLRLM 等矩陣計算出的同質性或熵值),更是精準量化了相鄰像素灰階值跳躍的頻率。簡單來說,CNA 陽性腫瘤在影像上顯得更加「斑駁」與「破碎」,這些肉眼可能只會主觀描述為「heterogeneous enhancement」的現象,被放射組學轉化為冷硬卻精確的數字。

這樣的發現對放射科醫師的閱片思維是一大衝擊。我們過去在打報告時,往往將注意力集中在腫瘤邊界的銳利度或是周邊筋膜的侵犯情形,卻相對輕忽了腫瘤實質內部那些看似隨機的灰階起伏。本研究的次群組特徵分析強烈暗示,這些以往被視為影像雜訊或單純壞死的紋理變化,其實正是破解腫瘤基因體密碼的重要線索。

跨越 0.71 AUC 門檻的挑戰與未來的臨床應用邊界

在 Discussion 階段,作者坦承了本研究目前面臨的幾個限制。首先是樣本數量的侷限性。雖然初始有 522 位病患具備完整的基因型資料,但最終符合嚴格影像納入條件的僅有 114 位。對於訓練一個包含上千特徵的機器學習模型而言,這個樣本數相對單薄,可能導致模型在面對跨機構、跨廠牌機器的外部數據時,產生過度擬合(overfitting)的風險。未來亟需更大規模、且來自多中心的回溯性或前瞻性數據來驗證並微調這個預測模型。

其次,頭頸癌的致病機轉中,人類乳突病毒(HPV)感染狀態是一個極度重要的干擾因子,特別是在口咽癌患者中。HPV 陽性的腫瘤往往本身就具備特定的基因變異特徵與較好的預後。未來的研究模型若能將病患的 HPV 狀態、抽菸史等臨床變數與 CT 放射組學特徵進行融合訓練,預期能將目前的 0.71 AUC 大幅向上推升。此外,不同醫院在執行頸部 CT 時,顯影劑的施打劑量與掃描延遲時間(delay time)不盡相同,這會直接影響腫瘤的一階強度與紋理特徵數值。未來的臨床落地應用,勢必要建立一套標準化的影像前處理或特徵標準化(harmonization)流程。

對實際在臨床第一線的放射科醫師而言,這項研究最大的啟發在於重新定義了「影像分型」的可能性。雖然我們明天還無法直接在工作站上跑出一個預測 CNA 狀態的機率值,但我們已經可以預見,未來的 HNSCC 治療將走向更細緻的個人化分層。當腫瘤科醫師在多專科團隊會議(MDT)上討論治療計畫時,我們不僅能提供 TNM 分期,更有機會透過 AI 輔助軟體,給出該腫瘤屬於高基因不穩定性(CNA-positive)的風險評估,進而協助臨床決定是否需要升級輔助化放療的強度,或是選擇特定的標靶藥物。這不僅提升了放射科在癌症團隊中的核心地位,更讓每一張例行掃描的 CT 影像發揮了超越解剖學的價值。

你下次判讀頭頸癌 CT 時,除了量測最大徑與淋巴結,不妨多看一眼腫瘤內部的灰階質地,因為越混亂的紋理往往暗示著越不穩定的基因體。

Abstract

BACKGROUND AND PURPOSE:While a larger fraction of head and neck squamous cell carcinoma (HNSCC) genomes is characterized by a high prevalence of copy number alterations (CNA-positive), a smaller subset with more favorable oncologic outcome is instead driven by somatic mutations (CNA-negative). We aimed to investigate the radiomic phenotypes of CNA-positive and -negative HNSCCs in contrast CT images.MATERIALS AND METHODS:Single nucleotide polymorphism (SNP)-array copy number data were utilized and CNA-based hierarchical clustering of patients was performed to define CNA subclasses. Radiomic features (n=1037) quantifying shape, first-order intensity, and texture were extracted from HNSCC primary tumors in pretherapeutic neck CTs. We performed univariate association analyses and trained, optimized and validated radiomics-based CNA prediction models by combining feature selection algorithms with machine learning classifiers.RESULTS:A total of 522 and 114 patients were included in the copy number and radiomic analyses, respectively. Univariate analysis revealed 190 features from all feature subtypes (shape, first-order, texture) were significantly associated with the CNA status; after multiple testing correction, 29 texture or first-order features remained significant. The best-performing CNA status prediction model utilized a support vector machine classifier, achieving an AUC of 0.71 (95% confidence interval: 0.60–0.83).CONCLUSIONS:CNA subgroups exhibit distinct radiomic phenotypes, primarily reflected in texture and intensity characteristics. These findings enhance our understanding of the biological significance of radiomic information in HNSCC. In the clinical setting, as CNA-positive and -negative HNSCCs may emerge as distinct subclasses with unique staging schemes and treatment implications, improved CT radiomics-based prediction models could offer a noninvasive, cost-effective method for CNA subtyping.