Failure of ambient closed-set large-deviation upper bounds in entropic optimal transport
EOT 中 BGN 緊集大偏差上界可在閉集上失效:e^{κn} 重數把有效指數從 b 壓至 b−κ,且不存在任何全局 LDP。
- 熵最優傳輸(EOT)的 BGN 緊集大偏差上界在閉集上可以失效,反例使用連續成本與非原子邊緣分布。
- 失敗機制:塊大小 mₙ ≈ e^{κn} 的指數重數把有效大偏差指數從 b 壓低到 b−κ,差值即成長率 κ。
- 比閉集上界失敗更強:不存在任何下半連續速率函數使全局 LDP 在環境空間 X×X 上成立。
大偏差理論的標準邏輯是:緊集上界加指數緊性(exponential tightness,衡量分布在無窮遠處衰減速率的性質)等於閉集上界。本文在熵最優傳輸(Entropic Optimal Transport,EOT)框架中構造了一個精確的反例——連續成本函數、非原子邊緣分布——使 BGN 緊集上界在特定閉集上失效:有效大偏差指數從 b 降至 b−κ,且任何下半連續速率函數都無法在環境空間上構成全局大偏差原理(Large Deviation Principle,LDP)。
EOT 大偏差的出發點:BGN 緊集上界與開放問題
熵最優傳輸(EOT)把傳統最優傳輸問題加上正則化:最小化 ∫C dP + ε·KL(P||μ⊗ν),其中 KL 代表相對熵(Kullback-Leibler divergence,衡量兩個分布之間的資訊距離),ε > 0 是正則化強度。隨著 ε 趨近 0,熵最小化子 Pε 收斂到某個最優傳輸計畫 P*。大偏差理論關心的是這個收斂的指數速率:Pε 在某個集合上的質量以多快的速率指數衰減。
Bernton、Ghosal、Nutz(簡稱 BGN)證明了一個基礎緊集上界:對任意緊集 K,limsup_ε ε·log Pε(K) ≤ −inf_K I_Γ,其中 I_Γ 是以 P 的支撐集 Γ 為參數的 BGN 率函數。BGN 自己也提出:當 P 的支撐集不緊時,這個緊集上界能否推廣到任意閉集,是一個開放問題。本文給出否定的具體答案,並且反例落在最原始的設定:固定成本靜態 Schrödinger 問題。
閉集上界的精確判據:β(F) 的尾部指數條件
本文 Proposition 2.3 給出「緊集上界能否升級到固定閉集 F」的精確判據。定義 β(F) := inf_{K 緊} limsup_ε ε·log Q_ε(F ∩ K^c),它捕捉了 F 中「跑到任意緊集之外的尾部」所攜帶的指數衰減速率。主要結論是:閉集上界 limsup_ε ε·log Q_ε(F) ≤ −inf_F I 成立,當且僅當 β(F) ≤ −inf_F I。
通常,指數緊性讓所有閉集都滿足 β(F) = −∞,從而自動升級。但 Proposition 2.6 指出:只要邊緣分布 μ 或 ν 的支撐集不緊,指數緊性就必然失敗——P_ε(K^c) 的 lim sup ε·log 恒等於 0,無法指數衰減到 −∞。這意味著在固定邊緣分布的 EOT 設定下,必須逐個閉集判斷 β(F) 的大小,而無法依賴統一的指數緊性論述。
離散反例:e^{κn} 重數把有效指數從 b 壓低到 b−κ
固定參數 0 < 2a < κ < b。離散空間 X_d 由可數個塊 B_n 組成,每塊含一個「區分點」(n,0) 和 mₙ ≈ e^{κn} 個高重數點。成本設計為:塊內高重數點之間成本 b,高重數點到區分點成本 a,跨塊成本極大(抑制跨塊轉移)。邊緣分布 μ_d 在每塊均勻分布,塊 n 的總質量 wₙ 以多項式速率 1/n³ 衰減。
測試閉集 F_d 由所有塊內不同高重數點對組成。對角耦合是唯一的最優傳輸計畫,支撐集 Γ_d 就是對角線(可數無限離散,故不緊)。BGN 率函數分析:對 F_d 上任意點 (x,y),取參考點 (n,0),(n,0) ∈ Γ_d 計算兩點下界,得到 I_Γ_d(x,y) ≥ C(x,y) − a − a = b−2a,故 inf_{F_d} I_Γ_d ≥ b−2a > 0。
實際指數速率呢?在 ε_n = 1/n 序列下,每個塊內不同高重數點對的 P_ε 密度約為 d_n · e^{−bn},而塊 n 中這樣的點對共有 mₙ(mₙ−1) ≈ e^{2κn} 個。塊 n 對 F_d 的總貢獻約為 wₙ · e^{−(b−κ)n},取對數得 lim sup ε_n log Pεₙ(F_d) ≥ −(b−κ),嚴格大於 −(b−2a)。這就是閉集上界失敗的確切機制:e^{2κn} 個點對雖然各自以 e^{−bn} 衰減,但指數個數本身把有效指數從 b 壓低到 b−κ,多出的差量正是塊大小的成長率 κ。
非原子連續提升:ℝ 閉子集上的閉集上界失效
為達到定理 1.1 的條件(連續成本、非原子邊緣分布),作者把每個離散標籤替換為 ℝ 中一個緊開(clopen)緊區間:X ⊂ ℝ 是不連通的閉子集,μ 是非原子測度,成本 C 在每個標籤矩形上取常數值,整體連續。關鍵工具是熵鏈式法則(entropy chain rule):連續 Schrödinger 問題是離散版本的精確提升,熵最小化子與率函數一一對應。
因此,離散反例中的閉集上界失效在連續非原子設定中完整保留:存在閉集 F ⊂ X×X 滿足 inf_F I_Γ ≥ b−2a > 0,但 lim sup_ε ε·log Pε(F) ≥ −(b−κ) > −(b−2a)。這直接回答了 BGN 的開放問題,且反例幾何極為簡單:不連通閉集加分塊常數成本,刻意以「拓撲」而非「剛性幾何」的方式構造。
Theorem 1.2:不存在任何速率函數能構成全局 LDP
比閉集上界失效更強的是定理 1.2。在相同的構造下,不存在任何下半連續(lower semicontinuous)函數 I_amb,使得 (P_ε) 在整個環境空間 X×X 上以速率 1/ε 滿足全局 LDP——無論速率函數的形式如何。這比「指數緊性失敗」更強:Proposition 2.6 只排除了標準的從緊集到閉集的升級路徑,而定理 1.2 排除了所有可能的速率函數。
直觀原因是:若全局 LDP 存在,其速率函數在閉集上必須給出上界,在開集上必須給出下界。本文構造的塊結構使得「跑到無窮遠的塊」以錯誤的指數速率積累質量,任何試圖同時滿足上下界要求的下半連續函數都會自相矛盾。作者也指出,這個障礙不排除在更強的幾何條件(連通支撐集、更強強制性)下全局 LDP 仍可能成立——本文確立的是拓撲層面的障礙,而非全面的否定結論。
在熵最優傳輸(EOT)中,BGN 緊集上界無法推廣到閉集:e^{κn} 重數把有效大偏差指數從 b 壓低到 b−κ,且不存在任何全局 LDP。