Where Does MEV Really Come From? Revisiting CEXDEX Arbitrage on Ethereum

Bence Ladóczk, Miklós Rásonyi, János Tapolcai

View Original ↗
AI 導讀 technology infrastructure 重要性 4/5

最新研究打破幾何布朗運動假設,證明「價格跳躍」才是驅動 Ethereum 上 CEX-DEX 龐大套利與 MEV 收益的核心引擎。

  • 傳統 Black-Scholes 模型因假設價格連續,嚴重低估了自動化做市商(AMM)的實際套利空間與 MEV 規模。
  • 新離散時間模型結合擴散成分與隨機跳躍,成功在數學上證明錯誤定價過程具備遍歷馬可夫鏈特性。
  • C++ 實作並擬合 Ethereum 鏈上數據顯示,CEX-DEX 套利所需交易量等同主要流動性池總活動量。

以太坊生態系中,最大可提取價值(MEV)的來源與規模一直是個謎。長期以來,理論模型嚴重低估了中心化與去中心化交易所(CEX-DEX)之間的套利空間。近期一篇被 Financial Cryptography and Data Security 2026 接收的論文指出,CEX-DEX 套利所需的交易量相當於主要流動性池的總活動量,且其產生的利潤規模與整體 MEV 相當。這項研究打破了過去幾何布朗運動的連續定價假設,證明了「價格跳躍」才是驅動鉅額套利利潤的真正引擎。

Ethereum 鏈上 CEX-DEX 套利的真實規模

探討 Ethereum(以太坊)區塊鏈的發展時,最大可提取價值(Maximal Extractable Value, 簡稱 MEV)始終是個無法迴避的議題。生態系內最核心的疑問在於,這些龐大的 MEV 收益究竟從何而來?其中又有多少比例是建立在損害毫無防備的普通用戶之上?在各類 MEV 提取手法中,中心化交易所(CEX)與去中心化交易所(DEX)之間的套利行為,通常被視為對市場效率有益且可接受的 MEV 形式。

可是學界與業界對於這種套利規模的認知存在巨大分歧。過去的理論模型在計算 CEX-DEX 套利時,得出的數值往往遠低於真實世界的實際狀況。雖然實證研究不斷強調這類套利在整體 MEV 中的重要性,但這些實證數據大多受限於眾多具爭議性的啟發式(heuristic)假設,因此只能被視為極度保守的估計值。

為了解開這個謎團,研究團隊重新審視了底層的理論模型。他們發現,要達成 CEX-DEX 之間的有效套利,實際上需要投入的交易量,幾乎等同於市場上主要流動性池(Liquidity Pools)的總活動量。更重要的是,這類套利所能創造的利潤,其規模完全足以與我們目前觀測到的整體 MEV 總量相匹敵,這意味著套利行為本身就是構成區塊鏈經濟體系的基石。

傳統 Black-Scholes 模型對 AMM 定價的侷限

追溯過去多數自動化做市商(Automated Market Maker, 簡稱 AMM)的理論定價模型,可以發現它們高度依賴傳統金融領域的 Black-Scholes(BS)隨機微分方程。這些基於幾何布朗運動(geometric Brownian motion)的模型,建立在一個核心假設上:資產價格的軌跡是連續不斷的,且價格變化是以極小的增量逐步推進。

將連續定價模型套用於加密貨幣市場時,會遭遇嚴重的結構性不相容。傳統金融市場的報價機制相對連續,但區塊鏈上的交易受限於區塊生成的離散特性,加上加密資產本身的高波動率,價格往往會在瞬間發生劇烈變動。這些理論模型將價格變動平滑化,卻忽視了真實市場中極具爆發力的突發事件。

研究人員主張,正是因為忽略了這種「價格跳躍(price jumps)」現象,導致 BS 模型嚴重低估了實際的套利利潤。在真實世界的 AMM 運行中,那些瞬間出現的價格斷層與跳躍,恰好就是套利機會密集爆發的黃金時刻。當定價模型無法捕捉這些離散的跳躍點時,自然也無法準確估算潛藏其中的巨大 MEV 價值。

導入隨機跳躍的離散時間 AMM 模型

為彌補連續定價模型的理論空缺,該論文提出了一個經過擴充的離散時間(discrete-time)AMM 模型。在這個全新的數學框架下,資產的價格過程不再只是單一的平滑曲線,而是被重新定義為「擴散成分(diffusive component)」與「隨機跳躍(stochastic jumps)」兩者的總和。

這種設計賦予了模型極高的靈活性,因為隨機跳躍可以容納任意的雜訊分佈(noise distributions)。即使加密貨幣市場出現極端非理性的暴漲或暴跌,這個框架也能夠藉由調整雜訊分佈的參數來準確描述市場狀態,而非像過去一樣將極端值視為統計學上的離群誤差。

雖然在數學推導上,引入離散時間與隨機跳躍會大幅增加計算的複雜度,但研究團隊成功運用了一般化的離散時間隨機微分方程來克服這個難題。他們透過具有幾何收斂特性(geometric convergence)的函數迭代方法,精確計算出系統的平穩機率分佈(stationary probability distribution)。同時,團隊也在數學上嚴格證明了由此產生的錯誤定價過程(mispricing process)構成了一條具備遍歷性的馬可夫鏈(ergodic Markov chain)。

C++ 實測與 Ethereum 歷史數據的擬合

為確保理論模型能夠精準反映現實,研究團隊將這套複雜的離散時間 AMM 模型以 C++ 語言進行完整實作。他們直接從 Ethereum 區塊鏈上抓取龐大的即時現貨價格與各大 AMM 交易所的實際交易數據,將這些未經修飾的鏈上原始資料作為測試基底。

透過將模型參數與觀察到的鏈上歷史價格進行擬合(fitting),系統產生的估計數據展現出極高的精確度。實測結果顯示,新模型計算出的套利空間與利潤規模,與經驗法則下觀察到的實證數據高度吻合。這不僅證明了「擴散成分結合隨機跳躍」理論的正確性,也徹底解釋了為何過去的傳統金融模型會在加密貨幣市場中失效。

這套經過 Ethereum 實證檢驗的模型,為區塊鏈生態系中幾個懸而未決的基礎經濟學問題,提供了一個極其自然的理論解釋。它清楚地勾勒出 MEV 的本質並非全是零和博弈下的價值掠奪,其中有極大一部分是市場機制為了在離散時間內追平價格跳躍,所必須支付的流動性平衡成本。這對於未來設計新一代 AMM 演算法,或是優化去中心化金融(DeFi)協議的抗 MEV 機制,都將帶來根本性的影響。

MEV 的龐大價值並非僅是市場摩擦的副產物,而是區塊鏈離散出塊機制下,吸收價格跳躍並維持 CEX-DEX 定價平衡的必然經濟成本。

Abstract

A central question of the Ethereum ecosystem is where Maximal Extractable Value (MEV)revenue originates and to what extent it stems from harming unsuspecting users. It is acceptable if MEV arises from arbitrages between centralised and decentralised exchanges (CEX-DEX). Yet theoretical models have significantly underestimated the scale of these arbitrages, while empirical studies have highlighted their importance - though these remain conservative estimates, constrained by numerous debatable heuristic assumptions. Revisiting the theoretical model, we found that CEX-DEX arbitrages require trading volumes on the order of the total activity of major liquidity pools and yield profits comparable to MEV. Most prior AMM models utilised the Black-Scholes (BS) stochastic differential equation (SDE) - i.e., geometric Brownian motion - and assumed continuous price trajectories where asset prices move in small increments only.We argue that BS underestimates arbitrage profits by ignoring price jumps, which are precisely the points at which arbitrage opportunities tend to arise. To address this gap, we present an extended discrete-time AMM model in which the price process is the sum of a diffusive component and stochastic jumps that can have arbitrary noise distributions. Although mathematically more involved this framework allows us to employ a general discrete-time SDE and compute the stationary probability distribution via function iteration with geometric convergence. We further prove that the resulting mispricing process is an ergodic Markov chain. We implement our model in C++, collect spot prices and AMM exchange data from the Ethereum blockchain and fit the model parameters to the observed prices. The estimates derived from our model closely match empirical observations and provide a natural theoretical explanation for several fundamental questions in the blockchain ecosystem.