The Potency of DCLGAN for Reducing Scan time in PET/CT imaging with different radiotracers of clinical importance [ARTIFICIAL INTELLIGENCE]

Kim, D., Kim, G. Y., Seo, S., Choo, K., Lee, S., Han, H., Kim, D., Lim, H., Yun, Y., Kang, S., Yun, M.

View Original ↗
AI 導讀 academic NM 重要性 4/5

DCLGAN 將神經 PET 壓縮至 5 分鐘,三種示蹤劑 ICC 均達 0.995 以上不失量化效力

  • 5 分鐘 DCLGAN 重建 FBB、FDG、FP-CIT 三種神經 PET 的 ICC 均超 0.995,量化閾值判讀完全不受縮時影響
  • SSIM 達 0.963–0.986,讀者評分 4.48–4.55 分(κ=0.83–0.89),客觀與主觀指標雙雙達高水準
  • 3 分鐘採集品質顯著低於 5 分鐘(p<0.001),確立 5 分鐘為 DCLGAN 的實用下限,再壓縮即明顯失格

5 分鐘的腦 PET 採集,量化指標 ICC 高達 0.997——這個數字意味著把 20 分鐘的 FBB 澱粉樣蛋白掃描壓縮到四分之一時間,所得的 SUVR 數值仍與金標準幾近一致。韓國延世大學與翰林大學聯合研究團隊以 DCLGAN(雙對比學習生成對抗網路)驗證三種臨床神經 PET 示蹤劑,在客觀影像品質、臨床讀者評分和量化一致性三項指標上均達高水準,為核醫 PET 效率優化提供了目前最完整的多示蹤劑跨驗證數據。

神經 PET 掃描時間的效率困境

核醫 PET/CT 在阿茲海默症篩查(FBB 澱粉樣蛋白)、帕金森病確診(FP-CIT 多巴胺轉運體)以及腦代謝評估(FDG)等神經科疾病的工作流程中居於核心位置,但傳統採集方案對機台時間的需求相當大:18F-FBB 需要 20 分鐘,18F-FDG 與 18F-FP-CIT 各需 15 分鐘

對認知障礙或帕金森病患者而言,長時間靜止不動本身就是挑戰——肢體震顫、焦慮和疼痛都可能引入運動偽影,反而劣化影像品質。對科室而言,機台週轉率也是日常排程壓力的來源。若能在不降低影像品質的前提下縮短採集時間,對病患體驗與科室效率均有明顯助益。

深度學習影像增強技術試圖以「短時採集 + AI 補強」取代「長時採集」,但先前多數研究聚焦於單一示蹤劑或泛用全身 PET,尚無研究系統性地在同一框架下驗證多種神經 PET 示蹤劑的跨適應性,這正是本研究的核心出發點。

三種示蹤劑、兩個縮時版本與兩組對照

研究採用單中心回溯性設計,從已完成完整時長神經 PET/CT 的有症狀患者中,利用 list-mode 原始資料重建出 3 分鐘與 5 分鐘的縮時採集影像,以全時長採集作為金標準(FBB 20 分鐘,FDG 與 FP-CIT 各 15 分鐘)。

DCLGAN 的架構可用類比理解:傳統 GAN(生成對抗網路)靠「生成者 vs 鑑別者」的博弈學習影像風格,DCLGAN 在此基礎上加入對比學習(contrastive learning)——同時約束「重建結果接近金標準」與「遠離其他樣本的噪聲模式」,雙重損失函數迫使模型對解剖細節更加敏感。

比較組包含兩個基準:未經 AI 增強的原始短時採集影像,以及代表當前標準深度學習方案的 2.5D U-Net。評估指標分三層次:客觀品質(NRMSE 越低越好、PSNR 越高越好、SSIM 結構相似度 1=完美)、臨床評分(兩位蒙眼核醫科醫師五分量表 + Cohen's κ 一致性),以及量化層面的 ICC 與 Bland-Altman 偏差分析。

5 分鐘 DCLGAN 的影像品質:三種示蹤劑全數達標

5 分鐘 DCLGAN 重建影像的客觀品質指標令人印象深刻。SSIM 方面:FDG 0.986、FP-CIT 0.982、FBB 0.963——SSIM 0.9 以上代表影像在亮度、對比度、結構三個維度均高度保真。PSNR 方面,FP-CIT 達 41.889 dB、FDG 37.502 dB、FBB 34.721 dB;NRMSE 最小值見於 FP-CIT(0.008),顯示基底核紋狀體分布的示蹤劑重建效果最佳。

臨床讀者評分方面,兩位蒙眼核醫科醫師的平均分為:FP-CIT 4.55、FDG 4.50、FBB 4.48(滿分 5 分)。讀者間一致性均高於 0.8 的「幾乎完美一致」門檻:κ 值 FP-CIT 0.89、FBB 0.85、FDG 0.83

對照 3 分鐘版本,5 分鐘 DCLGAN 在 PSNR 與 SSIM 顯著更高、NRMSE 顯著更低(p<0.001),讀者評分也出現可觀差距,確認 5 分鐘是這個模型的實用甜蜜點;再壓縮到 3 分鐘,品質開始明顯犧牲。

5 分鐘 DCLGAN:三種神經 PET 示蹤劑 SSIM 比較

FDG 與 FP-CIT 超過 0.982,FBB 亦達 0.963,三種示蹤劑全數通過高保真門檻

量化一致性:ICC 全數 >0.995 的臨床意涵

量化一致性是本研究最有說服力的板塊。5 分鐘 DCLGAN 影像對比金標準的 ICC:FBB(SUVR)0.997、FDG(SUVR)0.995、FP-CIT(SBR)0.996,三項全數超過 0.99 的「幾近完美(excellent)」門檻。

Bland-Altman 偏差分析進一步強化結論:平均偏差極小,FBB 僅 −0.004、FDG +0.012、FP-CIT −0.029,一致性界限(limits of agreement)同樣狹窄,代表個案層級的誤差受到良好控制——不只是群體平均值表現好,個體預測的穩定性同樣具備。

這對臨床判讀的意義直接明確:FBB SUVR 決定「澱粉樣蛋白陽性 / 陰性」的閾值、FP-CIT SBR 判斷「多巴胺轉運體顯著下降」的截止值,在 5 分鐘重建影像上完全維持量化效力,臨床報告結論不因掃描時間縮短而改變。

5 分鐘 DCLGAN 量化一致性與讀者評分匯整
示蹤劑量化指標ICC(5 分鐘)Bland-Altman 平均偏差讀者評分(/5)κ 值
FBBSUVR0.997−0.0044.480.85
FDGSUVR0.995+0.0124.500.83
FP-CITSBR0.996−0.0294.550.89

ICC 三種示蹤劑均超 0.995;Bland-Altman 平均偏差趨近於零,一致性界限狹窄

單中心設計的邊界與臨床部署建議

研究者坦承數項重要限制。首先是單中心回溯性設計:訓練與測試資料均來自同一機構的同一掃描設備,模型能否泛化到其他廠牌 PET/CT、不同注射劑量方案或不同重建核(reconstruction kernel),目前尚無外部驗證。

其次,儘管三種神經示蹤劑均取得優異結果,其生物分布特性差異極大(澱粉樣蛋白的皮質廣泛沉積 vs 多巴胺轉運體集中於紋狀體),模型能否進一步泛化至 tau、VMAT2 或其他神經示蹤劑,仍待後續研究確認。研究亦僅涵蓋 3 分鐘與 5 分鐘兩個縮時條件,未探索 1-2 分鐘的極端短採集場景。

從實務部署角度,5 分鐘 DCLGAN 目前是多項指標同時達標的最低採集時長。對有帕金森病或阿茲海默症確診需求的核醫排程,若機台壓力已成常態,此類 AI 重建模型具備近期導入的可行性——但建議在多中心外部驗證完成前,作為輔助驗證工具而非直接替代既有採集規範。

掃描時間壓縮 75%,FBB/FDG/FP-CIT 三種示蹤劑的 ICC 仍超過 0.995——下次神經 PET 排程滿載,這個數字值得拿出來跟主任討論

Abstract

BACKGROUND AND PURPOSE:Shortening PET/CT acquisition without degrading diagnostic or quantitative performance would improve patient comfort and scanner throughput. We evaluated a Dual-Contrastive Learning GAN (DCLGAN) for reconstructing high-quality neuro-PET images from reduced-time acquisitions across three clinically used tracers (18F-florbetaben (FBB), 18F-FDG, and 18F-FP-CIT) benchmarking against representative state-of-the-art deep learning models.MATERIALS AND METHODS:In this single-center retrospective study of symptomatic patients undergoing neuro-PET/CT, list-mode data from full-time acquisitions (20 min for FBB; 15 min for FDG and FP-CIT) were reconstructed into 3- and 5-minute images. DCLGAN was trained to translate short-time to full-time appearance; raw images and standard 2.5D U-Net served as comparators. Image quality was quantified by normalized root-mean-square error (NRMSE), peak signal-to-noise ratio (PSNR), and structural similarity (SSIM). Two blinded nuclear medicine physicians graded clinical image quality on a five-point scale; inter-reader agreement used Cohen&rsquo;s kappa. Quantitative agreement of standardized uptake value ratio (SUVR) for FBB/FDG and specific binding ratio (SBR) for FP-CIT between predicted and full-time images was assessed with intraclass correlation coefficients (ICCs) and Bland&ndash;Altman analysis.RESULTS:With DCLGAN at 5 minutes, image-quality metrics approached full-time performance across tracers: for FBB, NRMSE 0.018, PSNR 34.721 dB, SSIM 0.963; for FP-CIT, NRMSE 0.008, PSNR 41.889 dB, SSIM 0.982; and for FDG, NRMSE 0.013, PSNR 37.502 dB, SSIM 0.986. Mean reader quality scores for 5-minute DCLGAN images were high&mdash;4.48 (FBB), 4.50 (FDG), and 4.55 (FP-CIT)&mdash;with strong inter-reader agreement (=0.85, 0.83, 0.89, respectively). Quantitative agreement with full-time scans was excellent: ICCs for 5-minute images were 0.997 (FBB), 0.995 (FDG), and 0.996 (FP-CIT). Bland&ndash;Altman analyses showed minimal bias (mean bias -0.004 for FBB, 0.012 for FDG, -0.029 for FP-CIT) with narrow limits of agreement. Compared with 3-minute reconstructions, 5-minute DCLGAN images demonstrated significantly higher PSNR/SSIM and lower NRMSE (p&lt;0.001), while maintaining or improving reader scores and quantitative agreement.CONCLUSIONS:Across FBB, FDG, and FP-CIT, DCLGAN enabled 5-minute neuro-PET acquisitions that appeared to maintain reader-rated quality and showed high agreement in SUVR/SBR values with full-time scans. These findings suggest that clinically practical scan-time reduction may be feasible while maintaining interpretability and quantitative integrity in this cohort.