Distributed Quantum Optimization for Large-Scale Higher-Order Problems with Dense Interactions
IBM量子團隊與Oak Ridge國家實驗室提出DQOF分散式量子優化框架,以Clustering策略將大型HUBO問題拆分並行,在IBM Heron r2真實量子硬體上實現500變數170秒求解,並於透明輻射冷卻器材料優化中達成28%冷卻能耗削減。
- DQOF的Clustering策略橫向拼接子電路,保持電路深度不變,突破NISQ硬體深度限制
- IBM Heron r2在28量子比特以上呈近常數執行時間,古典模擬器同期指數增長
- 500變數HUBO基準測試在170秒內完成,N=40實例37秒達到近似比>0.99
- 透明輻射冷卻器(TRC)材料優化實現28%冷卻能耗削減,40位元系統FOM=0.6437
- AL-DQOF主動學習迴圈在材料發現中收斂速度顯著優於純古典貝葉斯優化
500個優化變數在170秒內求解完畢,這不是模擬器的數字——IBM量子團隊與Oak Ridge國家實驗室聯手,首度在真實量子硬體上驗證大規模HUBO問題的分散式解法。
HUBO:三體交互讓 QUBO 束手無策
傳統量子優化聚焦 QUBO(二次無約束二元優化),僅處理變數兩兩配對的交互作用。但現實問題——從推薦系統到材料設計——往往存在三個甚至更多變數同時耦合的高階項。HUBO(高階無約束二元優化)能精確表達這類立方項,代價是問題規模以指數速度爆炸。將 HUBO 硬塞進 QUBO 需要大量輔助變數,電路深度隨之劇增,在當前含噪中等規模量子(NISQ)硬體上幾乎不可行。
DQOF Clustering 策略:電路寬增、深不增
DQOF(分散式量子優化框架)的核心突破在於 Clustering 策略:將大型 HUBO 拆分為 m 個子 HUBO,每個子問題各含 n 個變數,再將 m 個子電路橫向拼接為寬度 m×n 的單一電路,電路深度保持不變。這一設計繞過了 NISQ 硬體對電路深度的嚴格限制,同時利用 HPC 叢集的 CPU 資源並行協調量子電路執行。Oak Ridge 的 Frontier 超算在此擔任古典協調器,IBM 量子處理器負責電路採樣,兩者以 QAOA 框架迭代收斂。
IBM Heron r2:28 量子比特是量子加速的臨界點
實驗以 IBM Heron r2 處理器為硬體平台。基準測試顯示:電路寬度低於 28 量子比特時,古典模擬器仍具競爭力;超過 28 量子比特後,量子硬體呈近常數執行時間,古典模擬器耗時則以指數級攀升。對 N=40 的 HUBO 實例,DQOF 在 P=10 個並行實例下於 37 秒內達到近似比 >0.99,500 變數基準測試則在 170 秒內完成——這是量子優化首次在真實硬體上於工業規模問題展現可量測的速度優勢。
TRC 材料優化:28% 冷卻能耗削減來自量子求解
論文選擇透明輻射冷卻器(TRC)作為現實應用場景。TRC 是一種薄膜結構,能在日照下將熱量輻射至太空,降低建築冷卻能耗。優化目標是最小化品質因數 FOM(同時兼顧散熱效率與透明度)。研究將材料層厚度組合映射為 Factorization Machine(FM)的特徵交互,FM 的三階項直接對應 HUBO 的立方項,形成端到端的量子可解格式。AL-DQOF 在 40 位元 TRC 系統(FOM=0.6437)上,相較基準玻璃實現 28% 冷卻能耗削減。
AL-DQOF:主動學習讓量子優化自我進化
AL-DQOF 在 DQOF 外圍包裹一個主動學習迴圈:每輪量子優化後,以新候選材料更新訓練集,重新擬合 FM 代理模型,再進行下一輪量子求解。這種迭代架構在數據稀缺的材料發現場景中尤為有效——量子採樣提供探索效率,主動學習提供利用效率。實驗結果顯示,AL-DQOF 在固定 query budget 下的收斂速度顯著優於隨機基準與純古典貝葉斯優化,為量子計算在實際材料科學中的落地提供了可複製的方法論。
Take-home:DQOF 的 Clustering 策略解開了「電路深度 vs. 問題規模」的根本矛盾,首度讓 500 變數 HUBO 在真實量子硬體上 170 秒內可解。28 量子比特以上的量子加速臨界點,加上 TRC 材料優化 28% 能耗削減的具體成果,標誌著量子計算正從學術展示跨入工業驗證的新階段。