Instability of the ray-monotone selector for $W_1$-optimal transport
W1 最優傳輸選擇器被證實不穩定,微觀震盪使極限二次成本卡在 1/2 而非 1/3。
- 針對 Wasserstein-1 距離構造的二次能量選擇器,在目標分佈發生弱收斂時不具備穩定性。
- 透過震盪層壓族構造,證實極限均質化映射的二次成本為 1/2,高於理論最佳解 1/3。
- 選擇器無法與橫向變量弱平均交換,導致附加二次微擾在極限操作上出現不可交換性。
在 Wasserstein-1 最優傳輸問題中,學界慣用二次能量來選出唯一映射。最新研究證實此機制具備根本的不穩定性:當目標分佈發生微觀震盪,極限收斂成本將卡在 1/2,而非預期的 1/3,推翻了過去的數學假設。
Wasserstein-1 最優傳輸與二次能量選擇器
在探討機率分佈匹配的最優傳輸(Optimal Transport)領域中,距離成本函數 $c(x,y) = |x-y|$(即 Wasserstein-1 或 $W_1$ 距離)因其特殊的幾何性質,常常無法產生唯一的最佳傳輸計畫(Optimal Plan)。當數據點在直線上移動時,將質量從 A 點移到 C 點的成本,等於先移到中間的 B 點再移到 C 點,這種線性特質導致滿足最小 $W_1$ 成本的映射路徑存在無限多種可能。為了在龐大的最佳解集合 $O(\mu,\nu)$ 中挑出最具代表性的單一映射,數學家引入了二次變分選擇(Secondary Variational Selection)機制。
具體而言,這個機制透過在第一階段的最佳解集合內,進一步最小化一個嚴格凸函數(例如二次能量 $C_2(\gamma) = \int |x-y|^2 d\gamma$)來強制作出唯一選擇。在歐幾里得空間且測度具備絕對連續性(Absolute continuity)的經典設定下,這種二次篩選會穩定產生一個被稱為「射線單調 $W_1$ 最佳計畫」(Ray-monotone $W_1$-optimal plan)的唯一解。只要採用嚴格凸的 $C^1$ 二次被積函數,最終都會導向同一個射線單調解,這使得該選擇器成為理論推導與演算法設計的標準工具。
然而,這個機制的穩定性一直是一個未解之謎。當我們觀察的目標分佈產生微小擾動或極限逼近時,這個選擇器能否保持連續性?這個基礎數學問題,決定了該選擇器在動態數據匹配與極限計算上的可靠度。
Santambrogio 穩定性難題與邊際分佈弱收斂
這個關於穩定性的疑問,最早由著名數學家 Filippo Santambrogio 在其著作中正式提出一個開放問題:假設有一組來源分佈 $\mu_n$ 弱收斂(Narrow convergence)至極限 $\mu$,且目標分佈 $\nu_n$ 弱收斂至極限 $\nu$,若 $\gamma_n$ 是配對 $(\mu_n, \nu_n)$ 之間的射線單調 $W_1$ 最佳計畫,那麼序列 $(\gamma_n)$ 的任何弱極限,是否必然等同於極限配對 $(\mu, \nu)$ 的射線單調 $W_1$ 最佳計畫?
這個問題之所以重要,是因為在許多數值逼近或擾動分析的場景中,我們必須保證離散化或擾動後的映射計畫,能夠平滑地過渡到連續狀態的理論解。如果穩定性不成立,意味著利用逼近法求得的傳輸路徑,在極限狀態下會發生斷裂或突變。蘇黎世聯邦理工學院(ETH Zürich)的研究員 Maja Gwóźdź 在本篇論文中,針對這個難題給出了明確的否定答案。
為了排除奇異點(Singularities)造成的干擾,該研究將環境設定在一個最單純的絕對連續空間中。研究構造了一個固定的絕對連續來源分佈 $\mu$(定義在 $[0,1]^2$ 的均勻分佈),以及一組同樣絕對連續且弱收斂至 $\nu$ 的目標分佈序列 $\nu_n$。即便在所有邊際分佈都具備完美平滑性質的條件下,選擇器依然發生了失效。這證明了不穩定性並非來自邊際分佈的瑕疵,而是射線單調選擇器機制本身的內在缺陷。
震盪層壓族構造:從 1/2 到 1/3 的成本突變
為了具體展現這個不穩定性,研究建構了一個極具巧思的「震盪層壓族」(Oscillatory laminate family)。作者將目標空間劃分為無數個交替出現的微小水平條帶(Strips),其中一組條帶集合 $A_n$ 的寬度會隨 $n$ 增加而變得無限緻密,另一組交替條帶 $B_n$ 亦然,兩者各佔據一半的面積測度。接著,定義映射函數 $T_n$:當數據點落在 $A_n$ 條帶時,保持在原地(Identity);當落在 $B_n$ 條帶時,則將其向左平移 1 個單位($x_1 - 1$)。
在這個震盪構造下,目標分佈 $\nu_n$ 會隨著 $n$ 趨近於無限大,弱收斂至一個均質化的極限分佈 $\nu$。這個極限分佈 $\nu$ 相當於把一半的質量留在原區塊,另一半質量均勻鋪展在向左偏移 1 個單位的區塊上。針對每一個特定的 $n$,研究證明 $\gamma_n$ 確實是該階段唯一的二次能量最佳選擇,且這個序列會弱收斂到一個均質化計畫 $\gamma^{\mathrm{hom}}$。經計算,這個均質化計畫的二次能量成本為 1/2。
最反直覺的轉折出現在極限狀態的直接計算。如果我們不透過序列逼近,而是直接針對那個已經均質化的極限分佈配對 $(\mu, \nu)$ 尋找射線單調選擇器,情況完全不同。在極限目標 $\nu$ 之下,尋找最佳的二次能量映射等同於求解單調重排(Monotone rearrangement),而最佳映射函數會變成 $T(x_1, x_2) = (2x_1 - 1, x_2)$,也就是一個將質量均勻延展的變換。透過這個極限專屬的選擇器所計算出的二次能量成本僅為 1/3。極限計畫成本 1/2 嚴格大於理論最佳解 1/3,證實了 $\gamma^{\mathrm{hom}}$ 根本不是極限配對的真正選擇器,兩者產生了顯著的斷層。
Kantorovich 對偶性與纖維化縮減分析
要精確證明上述的斷層,需要拆解最優傳輸映射的底層結構。作者運用 Kantorovich 對偶性(Kantorovich duality),找出了一個所有 $W_1$ 最佳計畫共用的最優 $1$-Lipschitz 對偶勢函數 $u(x) = x_1$。透過這個勢函數,可以界定出一個嚴格的接觸集(Contact set) $\Sigma = {(x,y) \in K \times K : x_2 = y_2, y_1 \leq x_1}$。這意味著所有符合資格的傳輸計畫,都必須在同一個水平高度($x_2 = y_2$)上發生,且只能單向移動。
有了這個接觸集,複雜的二維傳輸問題就被乾淨俐落地「纖維化縮減」(Fibrewise reduction)為無限多個獨立的一維問題。在每一條水平纖維上,二次選擇器面臨著截然不同的幾何約束。在震盪層壓族中,特定纖維上的二次選擇器別無選擇,只能採取「保持不動」或「平移 1 單位」的極端行為,這種行為具有高度的順序剛性(Order rigidity)。
這揭露了不穩定性的物理本質:纖維層面上的「二次選擇行為」與橫向變量上的「弱平均化行為」這兩種數學操作,是不可交換(Non-commutation)的。每一條微觀纖維都在執行二元對立的硬派平移,但整體分佈在巨觀視角下卻融合成了需要平滑延展的型態。巨觀所渴望的平滑映射(成本 1/3),被微觀層面死板的剛性選擇(成本 1/2)給徹底鎖死,導致逼近極限無法通往真正的最佳解。
Kuratowski 極限與 Γ-收斂的非交換本質
除了單點逼近的反例,這項研究進一步分析了整個最佳解集合空間的演化。透過計算 $O(\mu,\nu_n)$ 集合序列的 Kuratowski 上下極限,作者發現這些最佳計畫集合最終會精準收斂到一個特定的「可達類」(Attainable class)$\mathcal{A}$。這個類別包含所有滿足 $\eta(\Delta) = 1/2$ 的極限最佳計畫,也就是強制規定必須有精準一半的質量停留在對角線(不移動)上。極限分佈的真正最佳解(將所有質量均勻拉伸,沒有任何點停在原地,$\Delta = 0$)根本不在這個可達類之中。
基於這個集合收斂的結果,論文導出了針對連續被積函數 $\Phi(|x-y|)$ 的受限 $\Gamma$-收斂($\Gamma$-convergence)定理。這在應用數學上有一個極為重要的推論:當我們在絕對距離上加上一個附加的二次微擾 $c_\varepsilon(x,y) = |x-y| + \varepsilon|x-y|^2$ 時,極限的順序將決定生死。
如果先固定微擾常數 $\varepsilon$ 使 $n$ 逼近無限大,再讓微擾趨近於零,系統會被困在均質化計畫 $\gamma^{\mathrm{hom}}$ 中;反之,若先讓微擾趨近於零逼近最佳解,再處理目標分佈的極限,則會走向真正的射線單調選擇器 $\gamma^{\mathrm{sel}}$。這種附加二次微擾操作的非交換性,對未來所有依賴弱收斂與正則化(Regularization)的最優傳輸數值演算法,設定了一道必須跨越的理論邊界。
射線單調選擇器在應對分佈弱收斂時的失效,證明了微觀剛性約束無法直接過渡為巨觀最佳解,這將迫使學界重新審視正則化演算法中的極限交換順序。