Failure of ambient closed-set large-deviation upper bounds in entropic optimal transport

Maja Gwozdz

View Original ↗
AI 導讀 technology general 重要性 3/5

EOT 中 BGN 緊集大偏差上界可在閉集上失效:e^{κn} 重數把有效指數從 b 壓至 b−κ,且不存在任何全局 LDP。

  • 熵最優傳輸(EOT)的 BGN 緊集大偏差上界在閉集上可以失效,反例使用連續成本與非原子邊緣分布。
  • 失敗機制:塊大小 mₙ ≈ e^{κn} 的指數重數把有效大偏差指數從 b 壓低到 b−κ,差值即成長率 κ。
  • 比閉集上界失敗更強:不存在任何下半連續速率函數使全局 LDP 在環境空間 X×X 上成立。

大偏差理論的標準邏輯是:緊集上界加指數緊性(exponential tightness,衡量分布在無窮遠處衰減速率的性質)等於閉集上界。本文在熵最優傳輸(Entropic Optimal Transport,EOT)框架中構造了一個精確的反例——連續成本函數、非原子邊緣分布——使 BGN 緊集上界在特定閉集上失效:有效大偏差指數從 b 降至 b−κ,且任何下半連續速率函數都無法在環境空間上構成全局大偏差原理(Large Deviation Principle,LDP)。

EOT 大偏差的出發點:BGN 緊集上界與開放問題

熵最優傳輸(EOT)把傳統最優傳輸問題加上正則化:最小化 ∫C dP + ε·KL(P||μ⊗ν),其中 KL 代表相對熵(Kullback-Leibler divergence,衡量兩個分布之間的資訊距離),ε > 0 是正則化強度。隨著 ε 趨近 0,熵最小化子 Pε 收斂到某個最優傳輸計畫 P*。大偏差理論關心的是這個收斂的指數速率:Pε 在某個集合上的質量以多快的速率指數衰減。

Bernton、Ghosal、Nutz(簡稱 BGN)證明了一個基礎緊集上界:對任意緊集 K,limsup_ε ε·log Pε(K) ≤ −inf_K I_Γ,其中 I_Γ 是以 P 的支撐集 Γ 為參數的 BGN 率函數。BGN 自己也提出:當 P 的支撐集不緊時,這個緊集上界能否推廣到任意閉集,是一個開放問題。本文給出否定的具體答案,並且反例落在最原始的設定:固定成本靜態 Schrödinger 問題。

閉集上界的精確判據:β(F) 的尾部指數條件

本文 Proposition 2.3 給出「緊集上界能否升級到固定閉集 F」的精確判據。定義 β(F) := inf_{K 緊} limsup_ε ε·log Q_ε(F ∩ K^c),它捕捉了 F 中「跑到任意緊集之外的尾部」所攜帶的指數衰減速率。主要結論是:閉集上界 limsup_ε ε·log Q_ε(F) ≤ −inf_F I 成立,當且僅當 β(F) ≤ −inf_F I。

通常,指數緊性讓所有閉集都滿足 β(F) = −∞,從而自動升級。但 Proposition 2.6 指出:只要邊緣分布 μ 或 ν 的支撐集不緊,指數緊性就必然失敗——P_ε(K^c) 的 lim sup ε·log 恒等於 0,無法指數衰減到 −∞。這意味著在固定邊緣分布的 EOT 設定下,必須逐個閉集判斷 β(F) 的大小,而無法依賴統一的指數緊性論述。

離散反例:e^{κn} 重數把有效指數從 b 壓低到 b−κ

固定參數 0 < 2a < κ < b。離散空間 X_d 由可數個塊 B_n 組成,每塊含一個「區分點」(n,0) 和 mₙ ≈ e^{κn} 個高重數點。成本設計為:塊內高重數點之間成本 b,高重數點到區分點成本 a,跨塊成本極大(抑制跨塊轉移)。邊緣分布 μ_d 在每塊均勻分布,塊 n 的總質量 wₙ 以多項式速率 1/n³ 衰減。

測試閉集 F_d 由所有塊內不同高重數點對組成。對角耦合是唯一的最優傳輸計畫,支撐集 Γ_d 就是對角線(可數無限離散,故不緊)。BGN 率函數分析:對 F_d 上任意點 (x,y),取參考點 (n,0),(n,0) ∈ Γ_d 計算兩點下界,得到 I_Γ_d(x,y) ≥ C(x,y) − a − a = b−2a,故 inf_{F_d} I_Γ_d ≥ b−2a > 0。

實際指數速率呢?在 ε_n = 1/n 序列下,每個塊內不同高重數點對的 P_ε 密度約為 d_n · e^{−bn},而塊 n 中這樣的點對共有 mₙ(mₙ−1) ≈ e^{2κn} 個。塊 n 對 F_d 的總貢獻約為 wₙ · e^{−(b−κ)n},取對數得 lim sup ε_n log Pεₙ(F_d) ≥ −(b−κ),嚴格大於 −(b−2a)。這就是閉集上界失敗的確切機制:e^{2κn} 個點對雖然各自以 e^{−bn} 衰減,但指數個數本身把有效指數從 b 壓低到 b−κ,多出的差量正是塊大小的成長率 κ。

非原子連續提升:ℝ 閉子集上的閉集上界失效

為達到定理 1.1 的條件(連續成本、非原子邊緣分布),作者把每個離散標籤替換為 ℝ 中一個緊開(clopen)緊區間:X ⊂ ℝ 是不連通的閉子集,μ 是非原子測度,成本 C 在每個標籤矩形上取常數值,整體連續。關鍵工具是熵鏈式法則(entropy chain rule):連續 Schrödinger 問題是離散版本的精確提升,熵最小化子與率函數一一對應。

因此,離散反例中的閉集上界失效在連續非原子設定中完整保留:存在閉集 F ⊂ X×X 滿足 inf_F I_Γ ≥ b−2a > 0,但 lim sup_ε ε·log Pε(F) ≥ −(b−κ) > −(b−2a)。這直接回答了 BGN 的開放問題,且反例幾何極為簡單:不連通閉集加分塊常數成本,刻意以「拓撲」而非「剛性幾何」的方式構造。

Theorem 1.2:不存在任何速率函數能構成全局 LDP

比閉集上界失效更強的是定理 1.2。在相同的構造下,不存在任何下半連續(lower semicontinuous)函數 I_amb,使得 (P_ε) 在整個環境空間 X×X 上以速率 1/ε 滿足全局 LDP——無論速率函數的形式如何。這比「指數緊性失敗」更強:Proposition 2.6 只排除了標準的從緊集到閉集的升級路徑,而定理 1.2 排除了所有可能的速率函數。

直觀原因是:若全局 LDP 存在,其速率函數在閉集上必須給出上界,在開集上必須給出下界。本文構造的塊結構使得「跑到無窮遠的塊」以錯誤的指數速率積累質量,任何試圖同時滿足上下界要求的下半連續函數都會自相矛盾。作者也指出,這個障礙不排除在更強的幾何條件(連通支撐集、更強強制性)下全局 LDP 仍可能成立——本文確立的是拓撲層面的障礙,而非全面的否定結論。

在熵最優傳輸(EOT)中,BGN 緊集上界無法推廣到閉集:e^{κn} 重數把有效大偏差指數從 b 壓低到 b−κ,且不存在任何全局 LDP。

Abstract

Large-deviation upper bounds on compact sets do not, in general, extend to arbitrary closed sets without additional tightness. We show that this obstruction already occurs in static entropic optimal transport. More precisely, we construct a fixed-cost model with continuous cost and nonatomic marginals for which the entropic minimisers converge in total variation to an optimal plan with noncompact support, the known compact-set upper bound remains valid, but the corresponding closed-set upper bound fails on a specific closed subset of the ambient space. For a fixed closed set, we identify the exact tail criterion for passing from compact to closed sets. We show that there does not exist a full large-deviation principle (LDP) on the ambient space at speed $1/\varepsilon$ with an arbitrary lower semicontinuous rate function.