CT Radiomic Features Are Associated with DNA Copy Number Alterations of Head and Neck Squamous Cell Carcinomas [ARTIFICIAL INTELLIGENCE]

Haider, S. P., Schreier, A., Zeevi, T., Gross, M., Paul, B., Krenn, J., Canis, M., Baumeister, P., Reichel, C. A., Payabvash, S., Sharaf, K.

View Original ↗
AI 導讀 academic AI 重要性 4/5

CT 像素紋理取代基因定序?AI 模型從常規頸部 CT 揪出頭頸癌高惡性 CNA 基因型,達成 AUC 0.71。

  • DNA拷貝數變異預測:常規對比 CT 影像特徵能預測 HNSCC 的 CNA 狀態,SVM 模型達成 AUC 0.71。
  • 紋理特徵大勝形態學:在 1037 個特徵中,經過嚴格校正後存活的 29 個關鍵特徵全為紋理與一階強度,形狀特徵無法預測基因型。
  • 非侵入性輔助工具:影像特徵反映了腫瘤微血管混亂與細胞密度,可望成為低成本評估腫瘤侵略性並指導活檢靶向的新指標。

頭頸癌預後不只看淋巴結轉移,基因組差異才是核心。常規對比增強 CT 的像素紋理,竟能以 AUC 0.71 的準確度,直接預測決定腫瘤侵略性的 DNA 拷貝數變異狀態。這讓每天判讀的頸部 CT,直接升級為非侵入性的虛擬活檢工具。

破解頭頸癌 CNA 狀態與腫瘤預後的關聯

頭頸部鱗狀細胞癌(HNSCC)的預後評估與治療決策,正逐漸從單純的解剖學分期走向分子與基因組學分型。在 HNSCC 的基因突變圖譜中,存在兩種截然不同的致癌驅動機制:一部分腫瘤的基因組主要由高盛行率的 DNA 拷貝數變異(CNA,DNA拷貝數變異,染色體大片段擴增或缺失)所驅動,這類 CNA 陽性的腫瘤通常具有較高的侵略性,對傳統放化療的抗性較強,病患的整體存活率較低;而另一小部分腫瘤則是依靠體細胞點突變來驅動,這類 CNA 陰性的腫瘤往往與人類乳突病毒(HPV)感染高度相關,其臨床預後相對良好。

確認病患屬於 CNA 陽性還是陰性,對於制定個人化的治療強度至關重要。然而,目前的標準做法依賴對手術切除或活檢取得的腫瘤組織進行次世代基因定序(NGS)或微陣列分析。這不僅耗時、成本高昂,且活檢樣本往往只能反映腫瘤局部的基因狀態,無法捕捉整個腫瘤的空間異質性。對於許多晚期或無法手術的病患來說,重複獲取高品質的組織樣本更是一大挑戰。

為了解決這個臨床難題,研究團隊將目光轉向了放射科醫師每天都在判讀的常規對比增強頸部 CT。如果腫瘤的微觀基因組變異會導致巨觀的細胞密度、微血管增生與壞死模式改變,那麼這些改變理應會反映在 CT 影像的像素分佈上。透過提取高維度的影像特徵,我們或許能在病患接受任何侵入性檢查之前,就初步掌握其腫瘤的 CNA 狀態,進而為後續的活檢靶向與治療規劃提供關鍵指引。

522 例基因分群與 114 例影像特徵萃取

為了建立基因與影像之間的堅實連結,研究團隊採用了嚴密的兩階段設計。首先,在建立基因組標準答案(Ground Truth)的階段,團隊納入了 522 位 HNSCC 病患的單核苷酸多態性(SNP)陣列拷貝數數據。透過對這些龐大的基因數據進行 CNA 基礎的階層分群(Hierarchical clustering),研究人員得以將這 522 位病患客觀地劃分為 CNA 陽性與 CNA 陰性兩大次群組,確保後續訓練模型時有精確的標籤。

在影像分析階段,團隊從上述資料庫中篩選出 114 位具備高品質、治療前對比增強頸部 CT 影像的病患。放射科醫師在此階段扮演關鍵角色,精確勾勒出 HNSCC 原發腫瘤的感興趣區域(ROI)。接著,研究導入了 radiomics(從影像自動抽上千個量化特徵)技術,針對每個腫瘤立體體積提取了高達 1037 個量化特徵。這些特徵涵蓋了三大維度:第一是形狀特徵(Shape features),描述腫瘤的體積、表面積與球形度;第二是一階強度特徵(First-order features),分析像素灰階值的直方圖分佈,如平均值、偏度與峰度;第三是高階紋理特徵(Texture features),捕捉像素之間的空間排列關係。

為了強化病灶內部的微小結構差異,團隊還對影像應用了 LoG(凸顯邊緣與斑塊的影像濾波器)等數學轉換,藉此放大腫瘤內部血流灌注不均或微小壞死的訊號。這樣龐大且多維度的特徵矩陣,為後續的機器學習模型提供了豐富的燃料,但也同時帶來了維度災難的風險,必須透過嚴謹的統計與特徵篩選機制來萃取真正的訊號。

基因分群與影像特徵萃取流程
研究階段樣本數 / 變數說明與作用
基因組分群522 位病患利用 SNP 陣列定義 CNA 陽性與陰性群組
影像納入標準114 位病患具備高畫質治療前對比增強頸部 CT
特徵萃取1037 個特徵涵蓋形狀、一階強度與高階紋理特徵
影像轉換LoG 濾波器放大微小邊緣與內部斑塊之像素差異

從基因資料庫到醫學影像的配對與萃取

Figure 2 篩出的 29 個顯著紋理與強度特徵

從 1037 個特徵中找出能預測 CNA 狀態的關鍵指標,就像是在海量雜訊中淘金。根據論文中 Figure 2 的單變量關聯分析結果,初步篩選顯示共有 190 個特徵與 CNA 狀態呈現統計學上的顯著相關,這 190 個特徵廣泛分佈在形狀、一階強度與紋理三大類別中。這暗示著 CNA 陽性與陰性腫瘤在巨觀形態與微觀組織上確實存在系統性的差異。

然而,當我們同時對 114 位病患進行上千次統計檢定時,極易產生偽陽性(False positives)。為了確保結果的穩健性,研究團隊執行了嚴格的多重檢定校正(Multiple testing correction)。經過校正後,真正經得起考驗、維持顯著差異的特徵大幅縮減至 29 個。這 29 個核心特徵的組成分布給了我們非常重要的臨床啟示:它們全部屬於紋理特徵或一階強度特徵,形狀特徵全軍覆沒。

這個結果並不直觀。放射科醫師在日常打報告時,往往最先關注腫瘤的大小、邊緣是否不規則等形態學表現。但這份研究證明,決定腫瘤是 CNA 陽性還是陰性的關鍵,並不在於它長得多大或形狀多怪異,而在於腫瘤內部的「質地」。一階特徵的顯著,代表兩種腫瘤在對比劑吸收的均勻度與極端值分佈上有根本差異;而紋理特徵的保留,則說明了腫瘤內部像素之間的空間交錯複雜度(例如明暗相間的斑駁感),才是反映基因不穩定性最真實的影像學指紋。

單變量分析的影像特徵篩選漏斗

形狀特徵在多重檢定校正後被完全淘汰

Table 3 顯示 SVM 分類器達成 AUC 0.71

確立了具備預測潛力的特徵後,團隊將這些特徵送入機器學習流程中,嘗試建構一個能自動分類 CNA 狀態的模型。為了避免模型過度擬合(Overfitting),並在有限的 114 例樣本中搾出最大的泛化能力,研究採用了 MRMR(選出相關性高且彼此不重複的特徵)演算法來做最終的特徵降維,確保進入模型的特徵組合既有高預測力,又不會彼此提供重複的資訊。

研究測試了多種主流的機器學習分類器,包括 RF(多棵決策樹投票的隨機森林)、RIDGE(懲罰極端權重的羅吉斯迴歸)等。根據 Table 3 的性能指標,表現最優異的是 SVM(能在高維度切出分類邊界的演算法)模型。在經過嚴格的交叉驗證後,這個基於 CT 影像特徵的 SVM 模型達成了 0.71 的接收者操作特徵曲線下面積(AUC),其 95% 信賴區間落在 0.60 至 0.83 之間。

對於一個完全不依賴抽血或組織切片、純粹依靠常規 CT 影像像素來預測深層基因拷貝數變異的模型來說,AUC 0.71 是一個極具指標意義的里程碑。雖然這個數字距離完美的臨床診斷標準(通常要求 AUC > 0.85 甚至 0.9)還有一段路要走,但 95% CI 下限穩穩落在 0.60,證明了模型的預測能力遠優於隨機猜測。這個結果確認了 CT 影像中確實夾帶了足以反映腫瘤基因體狀態的生物學密碼,而且這些密碼可以被數學模型穩定地捕捉並轉化為臨床預測分數。

頸部 CT 像素異質性與基因不穩定性的連結

身為放射科醫師,我們必須理解這背後的生物物理學邏輯:為什麼 CT 上的紋理能反映 DNA 的狀態?CNA 陽性的頭頸癌通常伴隨著極高的基因體不穩定性(Genomic instability),這會導致腫瘤細胞快速且無序地增殖。這種失控的生長往往會超越局部微血管的供血極限,進而引發腫瘤內部的微觀缺氧與廣泛的小範圍壞死。

同時,為了維持生長,腫瘤會釋放大量血管新生因子,生成結構極度混亂、通透性異常的異常微血管網。當含有碘對比劑的血液流經這團充滿高密度細胞巢、微壞死區與異常血管的組織時,會在 CT 影像上形成極度不均勻的強化模式。這正是為什麼在單變量分析中脫穎而出的 29 個特徵全都是一階強度與高階紋理特徵。像素的偏度(Skewness)、峰度(Kurtosis)以及灰階共生矩陣(GLCM)所計算出的異質性指標,本質上就是這些微觀混亂現象的巨觀數學投影。

相比之下,CNA 陰性(通常與 HPV 相關)的腫瘤雖然也具備惡性特徵,但其細胞增殖與血管新生的過程相對較為「均勻」,因此在對比增強 CT 上往往呈現較為平滑或一致的強化質地。這種將「基因型(Genotype)」透過組織病理學橋接至「影像表型(Radiophenotype)」的觀念,正是影像基因體學(Radiogenomics)賦予放射科判讀的全新維度。

預測 AUC 0.71 的適用範圍與放射科實務挑戰

儘管這項研究為頭頸癌的非侵入性次分型開啟了新視野,但在實際應用於每天的閱片工作前,我們必須清楚界定其邊界條件與限制。首先,本研究的影像分析基於 114 位病患的回溯性資料,這個樣本量對於訓練高維度影像特徵的機器學習模型而言仍然偏小。小樣本加上單一機構或特定掃描儀器的數據,往往容易使模型捕捉到特定機器參數的偏差,而非純粹的生物學特徵。

其次,CT 的層厚、管電壓(kVp)、重建演算法(如反覆運算重建或濾波反投影)以及對比劑注射到掃描的延遲時間(相機相),都會深刻影響一階與紋理特徵的數值。未經跨中心、多廠牌的大規模外部驗證,AUC 0.71 的表現可能在其他醫院的掃描儀上打折扣。作者在討論中也坦承,未來的研究需要將這類 radiomics 模型整合到前瞻性的臨床試驗中,並針對不同掃描協議進行嚴格的特徵標準化。

對我們放射科實務而言,這項技術短期內不會取代病理切片或基因定序。然而,它的核心價值在於「導航」與「輔助分層」。當遇到腫瘤過大、內部異質性極高的病患時,我們可以利用這類影像特徵來指導耳鼻喉科或介入科醫師,將切片針準確引導至影像紋理最複雜、最可能代表 CNA 陽性高惡性區域,減少採樣誤差;在無法進行基因定序的醫療環境下,影像提供的 CNA 風險分數,也能為腫瘤科醫師在權衡放化療劑量時,提供多一層客觀的參考依據。

下次判讀頭頸癌 CT 看到腫瘤內部強化極度斑駁、紋理破碎時,別只寫下不均勻增強或壞死,這很可能正是 CNA 陽性高侵略性基因型的視覺化警報。

Abstract

BACKGROUND AND PURPOSE:While a larger fraction of head and neck squamous cell carcinoma (HNSCC) genomes is characterized by a high prevalence of copy number alterations (CNA-positive), a smaller subset with more favorable oncologic outcome is instead driven by somatic mutations (CNA-negative). We aimed to investigate the radiomic phenotypes of CNA-positive and -negative HNSCCs in contrast CT images.MATERIALS AND METHODS:Single nucleotide polymorphism-array copy number data were utilized and CNA-based hierarchical clustering of patients was performed to define CNA subclasses. Radiomic features (n=1037) quantifying shape, first-order intensity, and texture were extracted from HNSCC primary tumors in pretherapeutic neck CTs. We performed univariate association analyses and trained, optimized, and validated radiomics-based CNA prediction models by combining feature selection algorithms with machine learning classifiers.RESULTS:A total of 522 and 114 patients were included in the copy number and radiomic analyses, respectively. Univariate analysis revealed 190 features from all feature subtypes (shape, first-order, texture) were significantly associated with the CNA status; after multiple testing correction, 29 texture or first-order features remained significant. The best-performing CNA status prediction model utilized a support vector machine classifier, achieving an AUC of 0.71 (95% CI, 0.60–0.83).CONCLUSIONS:CNA subgroups exhibit distinct radiomic phenotypes, primarily reflected in texture and intensity characteristics. These findings enhance our understanding of the biologic significance of radiomic information in HNSCC. In the clinical setting, as CNA-positive and -negative HNSCCs may emerge as distinct subclasses with unique staging schemes and treatment implications, improved CT radiomics-based prediction models could offer a noninvasive, cost-effective method for CNA subtyping.