Equinox: Decentralized Scheduling for Hardware-Aware Orbital Intelligence

Ansel Kaplan Erol, Divya Mahajan

View Original ↗
AI 導讀 technology infrastructure 重要性 4/5

143 顆衛星模擬,Equinox 邊際成本排程比優先佇列多 20% 科學產出、2.2 倍電量儲備。

  • 電量×溫度×佇列乘積構成邊際成本,任何一項限制逼近臨界都自動升高執行門檻。
  • 任務按價值由低到高依序退出,最高價值任務最後失去機會,無需明確優先規則。
  • 16 任務極端爭用下仍維持靜態排程 5.2 倍執行率,靠主動丟棄低價值工作實現。

地球觀測衛星每繞一圈有 35% 的時間只靠電池撐過地影,貪心跑滿計算會在最關鍵時刻斷電。Equinox 把電量、溫度、佇列三種限制壓縮成單一邊際成本,任務只在自身價值超過成本時才執行,實測比優先佇列排程多出 20% 科學產出、31% 影像吞吐量。

衛星每軌 35% 在地影:分散排程的設計挑戰

地球低軌(LEO)衛星已開始在軌道上直接執行野火偵測、洪水製圖、船舶監視等 AI 推論,省去「先下傳、再分析」帶來的數小時延遲。然而這套算力完全受制於陽光:衛星每圈約有 35% 的時間在地影(eclipse)中,只靠 50–100 Wh 的鋰電池維持運作。現有排程策略只解決問題的一面——以價值為主的系統忽略硬體狀態,貪婪執行當下最高優先級任務,可能耗盡後續高價值偵測所需的電量;以資源為主的系統雖強制電量和溫度上限,卻把所有任務視為同等重要,爭用時無法優先保留高價值工作。

更根本的難點在於:衛星只在每圈軌道的少數幾分鐘內與地面站聯繫,其餘時間(包括大部分地影期)完全自主運作。這種「不可再生能源 + 時間耦合決策 + 強制自治」的組合,使衛星排程更接近物理資源限制下的即時控制,而非傳統的工作負載管理。因此,現有系統皆無法在分散設定中同時考量任務價值與時間變動的資源限制。

三元障壁函數:把電量、溫度、佇列壓成一個數

Equinox 的核心是一個狀態依賴的邊際執行成本 P,由三個獨立因子的乘積構成:

電量因子 採用障壁函數(barrier function):當電量(SoC)趨近臨界值(SoC_c = 0.15)時,P 趨向無限大,強制系統在電力耗盡前主動卸載低價值任務。能源短缺在地影中無法即時補救,這個因子設計為不可逆的硬性約束,確保系統在進入地影前保有足夠電量儲備。

溫度因子 是軟性障壁:在正常運作溫度(T₀ = 50°C)附近接近 1,隨溫度逼近節流閾值(T_max = 85°C)急速上升,防止表面可行、實則觸發熱節流的排程決策。在日照期外部加熱與計算負荷同時偏高時尤為重要。

佇列因子 提供線性回壓:佇列積壓越大,P 越高,系統自動偏向高價值任務,防止低價值工作長期佔用資源。三因子相乘確保任何單一資源的壓力都能主導整體成本,電量健康不會掩蓋溫度超標的風險。敏感度係數 β 是操作旋鈕,允許任務設計者在科學吞吐量與電量儲備之間調整取捨,無需修改控制架構。

Equinox 的四步迴圈與衛星間任務卸載

每顆衛星獨立執行四步迴圈:(1) 從本機感測器計算邊際成本 P;(2) 對進入任務估算預期科學價值(ESV = 事件概率 × 模型精確率 × 科學重要性權重);(3) 僅執行 ESV > P 的任務,其餘延後或丟棄;(4) 與相鄰衛星比較成本,若鄰星 P + 傳輸成本 < 本地 P,則將任務卸載過去執行。

衛星間卸載不需要路由協議、佇列交換或全域狀態,僅靠成本信號的差異就實現星群級負載均衡。處於日照的衛星電量充裕、P 較低,自然吸收地影衛星的工作負載——工作負載在未刻意設計的情況下自動跟著太陽循環移動。

系統具備可數學證明的優雅降級特性:當電量下降、P 上升,任務按價值從低到高依序退出,高價值任務最後才失去執行機會。這個順序並非明確程式設計,而是直接從成本函數結構中浮現,確保系統在嚴重資源限制下仍與科學優先序對齊。

143 顆衛星 72 小時模擬:科學產出提升 20% 的成因

研究以 143 顆 LEO 衛星72 小時的模擬驗證,軌道動力學結合 SGP4 軌道傳播與 NVIDIA Jetson Orin 實機的功耗剖析數據。每顆衛星每分鐘攝取 90 張影像,計算供給約 33% 過飽和。工作負載以 fMoW 資料集(1,047,691 張影像、62 種土地利用類別)建模,評估火災(科學權重 200)、洪水(100)、船舶(50)、環境監測(20)四種偵測任務。

相比靜態 FIFO、優先佇列、ESA(Lyapunov 線上最佳化器)、Phoenix(集中協調卸載)四種基準,Equinox 科學產出率高出優先佇列 20%(高出 FIFO 64%),影像吞吐量高 31%,同時維持 2.2 倍的平均電量儲備。提升並非來自「跑更多任務」,而是「戰略性丟棄低價值任務、保全電量等待高價值事件」——在貪心排程容易失敗的地影期效果最為顯著。

Equinox 對比各基準的核心性能提升
指標對比基準提升幅度
科學產出率vs Priority Queue+20%
科學產出率vs FIFO+64%
影像處理吞吐量vs Priority Queue+31%
平均電量儲備vs Priority Queue2.2×
執行率(16 任務爭用)vs 靜態排程5.2×

16 個並行任務爭用下 5.2 倍執行率

在極端爭用情境(16 個任務同時競爭算力)下,靜態 FIFO 因過載近乎崩潰,Equinox 仍維持 5.2 倍的執行率。這個數字反映了邊際成本升高後,系統主動丟棄低價值工作、集中算力於高優先任務的能力,而非靠節流換取的代價。研究者評估了禁用衛星間卸載(no-ISL)和使用均勻任務價值估計(no-context)的消融版本,結果顯示 ISL 卸載與情境感知的任務價值估計都對整體表現有貢獻。

研究亦檢驗了軌道異質性壓力測試(軌道相位抖動、不同高度層與兩者組合),Equinox 在上述條件下均保持穩健。整體評估表明:在算力與能源雙重受限的軌道邊緣計算環境中,一個簡單的標量信號確實足以驅動兼顧價值與安全的全星群排程決策。

把電量、溫度、佇列壓成一個邊際成本數字,讓貪婪執行有了真實代價——Equinox 用一個算式取代所有優先規則,在 143 顆衛星間無需中央協調地自動均衡負載。

Abstract

Earth-observation satellites are emerging as distributed edge platforms for time-critical tasks, yet orbital scheduling remains challenged by intermittent energy harvesting and temporal coupling where eager execution risks future battery depletion. Existing schedulers rely on static priorities and lack mechanisms to adaptively shed work. We present Equinox, a lightweight, decentralized runtime for resource-constrained orbital systems. Equinox enables adaptive scheduling by compressing time-varying constraints, including battery charge, thermal headroom, and queue backlog, into a single state-dependent marginal cost of execution. Derived from a barrier function that rises sharply near safety limits, this cost encodes both instantaneous pressure and future risk. This local signal serves as a constellation-wide coordination primitive. Tasks execute only when their value exceeds the current cost, enabling value-ordered load shedding without explicit policies. If local costs exceed a neighbor's, tasks are dynamically offloaded over inter-satellite links, achieving distributed load balancing without routing protocols or global state. We evaluate Equinox using a multi-day simulation of a 143-satellite constellation grounded in physical Jetson Orin Nano measurements. Equinox improves scientific goodput by 20% and image-processing throughput by 31% over priority-based scheduling while maintaining 2.2x higher mean battery reserves. Under high demand, Equinox achieves 5.2x the execution rate of static scheduling by gracefully shedding work rather than collapsing under contention.