Self-Supervised Angular Deblurring in Photoacoustic Reconstruction via Noisier2Inverse

Markus Haltmeier, Nadja Gruber, Gyeongha Hwang

View Original ↗
AI 導讀 technology AI 重要性 4/5

透過在極座標域注入額外雜訊的 Noisier2Inverse 框架,無需乾淨原圖即可修復高達 20 度實體探測器造成的造影模糊。

  • 將實體探測器的硬體失真降維成極座標域的循環卷積問題,大幅簡化去模糊重建的物理建模難度。
  • Noisier2Inverse 克服了極座標轉換造成的關聯性雜訊,免除收集完美配對資料的高昂訓練成本。
  • 首創基於推土機距離(EMD)的自動停止法則,從統計層面有效防堵深度學習中無解的過度擬合。

光聲斷層掃描受限於探測器物理體積,常產生高達 20 度的角度解析度模糊。最新研究提出 Noisier2Inverse 自監督框架,完全無需乾淨原圖,僅透過極座標域的加噪運算就能逼近監督學習的重建水準,突破影像還原的資料瓶頸。

實體探測器引發的 2D 角度模糊

光聲斷層掃描(PAT)巧妙結合了光學對比度與超音波的高解析度特性。當目標物體受到非游離雷射脈衝照射時,會吸收能量並產生熱彈性膨脹,進而發射出聲波。在理想的數學模型中,科學家通常假設接收聲波的探測器是完美的「點狀」(3D)或「線狀」(2D),藉由時間反轉(time reversal)或濾波反投影等反演算方法,便能極速且精準地重建影像。

然而,現實世界中的壓電探測器或光學感測器都具有實體面積與有限的角度孔徑。當這些具有物理尺寸的探測器收集數據時,量測到的信號實際上是探測器表面各點接收壓力的積分結果。在圓形掃描幾何(circular scanning geometry)結構中,數學模型證明這種硬體孔徑效應會造成系統性的失真。如果將觀測空間從傳統的笛卡爾座標(Cartesian coordinates)轉換到極座標(polar coordinates),這種實體探測器造成的模糊,正好等同於影像在角度維度上經歷了一次循環卷積(circular convolution)。

在極座標域運行的 Noisier2Inverse 架構

為了解決這種角度模糊,學界大量引入深度學習模型。但多數圖像重建模型屬於依賴成對資料的監督式學習,在實際場景中,我們根本無法取得那張「完美無瑕的清晰原圖」。為了打破高牆,研究團隊導入了在電腦斷層掃描領域嶄露頭角的 Noisier2Inverse 自監督學習方法。

該自監督框架的核心邏輯非常反直覺:既然只有充滿雜訊的觀測數據,不如在觀測數據上疊加一層分布相同的額外雜訊,創造出更吵雜的輸入值。接著,訓練一組具備跳接(skip connections)設計的 U-Net 神經網路,要求網路讀取加噪數據後,盡可能輸出扣除額外雜訊的結果。數學證明顯示,當網路成功學會這個映射,實質上就等同於學會了將含噪數據還原成原始訊號的能力。

特別的是,團隊並非直接在原始空間訓練模型。他們先用傳統演算法初步重建並轉換至 256x256 的極座標域。雖然這個前置處理會讓雜訊從獨立同分布轉為具備空間關聯性(correlated noise),導致傳統的 Sparse2Inverse 演算法失效,但 Noisier2Inverse 的架構天生能兼容關聯性雜訊。模型在極座標網格上運行四個解析度層級,並導入循環填充(circular padding)確保邊界的物理週期性,成為處理 PAT 角度去模糊的極佳方案。

引入推土機距離的自動提早停止機制

在自監督學習實務中,模型極易發生過度擬合(overfitting)。由於這類模型的損失函數建立在觀測數據空間上,繼承了反演算問題的病態(ill-posed)性質。在迭代早期,網路確實能產出清晰圖像;但若持續無限制訓練,神經網路就會開始放大奇異值,最終生成無法解釋的偽影(artifacts)。

要避免崩壞,必須具備精準的提早停止(early-stopping)機制。過去許多研究依賴測試集監控峰值信噪比(PSNR),這在無法預知標準答案的現實環境根本行不通。團隊對此設計了一套具備統計學基礎的全自動停止法則。

他們引入了推土機距離(Earth Mover's Distance, EMD,即 1-Wasserstein 距離) 作為評估標準。在每一次迭代中,系統計算「神經網路預測出的雜訊分布」與「已知基準雜訊分布」之間的 EMD。當驗證集上的 EMD 降到最低點時,代表模型對雜訊的拆解達到最佳平衡,自動觸發停止指令,徹底排除了對基準圖像的依賴。

FIVES 視網膜數據庫的 4 種卷積核實測

為驗證演算法極限,研究團隊選用 FIVES 視網膜眼底血管數據庫進行模擬實驗。他們模擬了四種不同的探測器模糊情境,包含 10 度與 20 度的方波指示函數(Indicator-10/20),以及標準差為 1 與 2 的高斯卷積核,並測試高達 0.10 的雜訊強度。

實驗對比了包含自監督全變差正則化(SSLTV)與深度圖像先驗(DIP)等多種前沿非監督算法。結果顯示,Noisier2Inverse 在所有測試組合中,皆穩定壓倒其他非監督模型。更驚人的是,即使對照組使用了能看見標準答案的「作弊級」最佳 PSNR 停止點,Noisier2Inverse 僅靠自動 EMD 停止機制,最終表現依然緊追需要大量乾淨配對資料的監督式學習基準。

從視覺結果來看,經過極座標角度去模糊處理後,原本因實體探測器孔徑而糊成一團的微小血管特徵,成功找回銳利邊緣且背景雜訊被大幅壓制。這證明硬體規格帶來的物理限制,完全能在軟體演算法層面被有效突破。

放棄追求完美的配對訓練資料,直接在極座標域的關聯性雜訊中挖掘還原線索,為高階影像重建開闢了實用且低成本的新路徑。

Abstract

Photoacoustic tomography (PAT) is an emerging imaging modality that combines the complementary strengths of optical contrast and ultrasonic resolution. A central task is image reconstruction, where measured acoustic signals are used to recover the initial pressure distribution. For ideal point-like or line-like detectors, several efficient and fast reconstruction algorithms exist, including Fourier methods, filtered backprojection, and time reversal. However, when applied to data acquired with finite-size detectors, these methods yield systematically blurred images. Although sharper images can be obtained by compensating for finite-detector effects, supervised learning approaches typically require ground-truth images that may not be available in practice. We propose a self-supervised reconstruction method based on Noisier2Inverse that addresses finite-size detector effects without requiring ground-truth data. Our approach operates directly on noisy measurements and learns to recover high-quality PAT images in a ground-truth-free manner. Its key components are: (i) PAT-specific modeling that recasts the problem as angular deblurring; (ii) a Noisier2Inverse formulation in the polar domain that leverages the known angular point-spread function; and (iii) a novel, statistically grounded early-stopping rule. In experiments, the proposed method consistently outperforms alternative approaches that do not use supervised data and achieves performance close to supervised benchmarks, while remaining practical for real acquisitions with finite-size detectors.