Bridge the Gap between Classical and Quantum Neural Networks with Residual Connections

Junxu Li

View Original ↗
AI 導讀 technology AI 重要性 4/5

HQRN 結合 10 層量子殘差塊,不僅可繼承經典權重,更成功突破對抗性量子糾纏分類。

  • HQRN 在對角密度矩陣輸入下完全等價於經典網路,能直接繼承預訓練權重。
  • 在手寫數字辨識任務中,百萬次抽樣讓量子模型與經典結果的分歧率降至 3%。
  • 透過深度殘差堆疊提取非對角關聯,HQRN 成功分類出經典模型無法解析的對抗態。

一項結合 10 層量子殘差塊的新型混合量子殘差網路 (HQRN),在抽樣達到 1,000,000 次時,能將量子與經典網路的分類分歧率降至 3%。該架構不僅可直接繼承經典模型的優化權重以避開訓練瓶頸,更成功辨識出模仿糾纏特徵的對抗性狀態,展現了超越經典演算法的量子特徵提取能力。

橋接經典與量子架構的混合量子殘差網路

在過去十年的發展中,量子機器學習 (QML) 雖然備受期待,但如何將經典神經網路架構系統化地延伸至量子領域,始終是一個懸而未決的挑戰。經典網路處理的是向量或機率分布,而量子數據原生地由密度算符 (density operators) 表示。這種根本性的差異,使得許多嘗試引入卷積層或遞迴架構的量子模型,往往缺乏與經典對應物的嚴格數學關聯,且容易遭遇「貧瘠高原現象」(barren plateaus,指梯度在廣大參數空間中消失,導致模型無法收斂)。

為了解決這項挑戰,研究人員提出了混合量子殘差網路 (HQRN)。在經典殘差網路 (ResNet) 中,每一層的輸出會疊加前一層的輸入,這項設計讓模型能夠訓練得極深。HQRN 將這個概念帶入量子領域,透過一個介於 01 之間的殘差權重參數來調節資訊流。當模型接收輸入的混合狀態後,會經過參數化的單一矩陣運算與測量,搭配如 ReLU 等非線性激勵函數,產生一組中間狀態。接著再將這組狀態與原輸入狀態進行混合,完成一次量子殘差連接。這種建構方式確保了經過每一層堆疊後,系統輸出的依然是物理上合法且歸一化的密度矩陣。

透過計算基底直接繼承經典模型優化權重

這項架構最引人注目的特點在於其完全的向下相容性。當 HQRN 的輸入被限制在計算基底 (computational basis) 時,也就是數據可以被表示為只有對角線元素有值的密度矩陣,這個量子架構在數學上會完全等價於一個具備殘差連接的經典神經網路。在這種情況下,量子測量機率的權重矩陣將簡化為標準的線性轉換,整個量子狀態的演化就如同經典網路中的離散動態過程。

這種等價性帶來了一個巨大的實際優勢。由於 HQRN 在處理經典任務時不需要從零開始在量子硬體上訓練,研究人員可以直接將已經在傳統電腦上優化好的經典網路權重,透過單一擴張 (unitary dilation) 與 Trotter-Suzuki 分解技術,無縫轉換為量子演算法中的參數。具體的轉換過程是先將權重矩陣拆解為正負兩部分,確保其數學特性符合量子力學的要求,再映射到可在量子處理器執行的邏輯閘上。這意味著 HQRN 可以直接繼承經典模型優異的最佳化收斂成果,徹底避開了在深層量子電路中尋找最佳解的龐大算力開銷。

於 MNIST 手寫數字辨識驗證經典等價性

為了驗證這套架構處理經典數據的能力與資源消耗,研究團隊採用了標準的 MNIST 手寫數字辨識資料集。在這個任務中,單通道、28x28 像素的灰階影像被扁平化,並投影到一個 64 維的機率向量空間中,以符合量子狀態空間的要求。模型的核心採用了 10 層串聯的量子殘差塊,第一層的演化會消耗原始輸入狀態的四個副本,一半用於更新係數,另一半則用於重構輸出,這種設計確保了計算資源的需求只隨著深度呈線性成長。

研究人員先在經典電腦上訓練模型 300 個週期,隨後將權重轉換到 HQRN 中。為了貼近真實量子硬體的限制,團隊使用有限的測量抽樣次數來模擬。數據顯示,當每個殘差塊的抽樣次數設定為 10,000 次時,量子模型與經典基準的分類分歧率約為 12%;而當抽樣次數提高到 1,000,000 次時,由量子測量隨機漲落引起的誤差被顯著抑制,分歧率大幅縮減至 3%。各數字類別的錯誤率分布也高度吻合,證實了 HQRN 能完美重現對應經典網路的運算結果。

破解對抗性可分離態的二分糾纏分類任務

HQRN 的真正價值不僅止於模擬經典網路,更在於處理純量子數據時的超越性表現。團隊特別設計了二分糾纏分類 (bipartite entanglement classification) 任務,並建立了包含 1,300 個訓練樣本與 5,000 個測試樣本的數據庫。資料庫中包含標記為糾纏態的樣本與可分離態的樣本,其中包括了特定參數下呈現糾纏的 Werner 狀態、隨機混合狀態,以及最具挑戰性的對抗性可分離態 (adversarial separable states)。

對抗性可分離態是一種特殊的偽糾纏狀態。當研究人員對這些狀態進行 Pauli-Z 測量時,它們會產生與真正 Bell 糾纏態完全相同的邊緣測量統計數據。這導致在機率單純形 (probability simplex) 空間中,對抗性狀態與糾纏態的分佈區域嚴重重疊。對於只能依賴這些初始對角測量結果的經典網路而言,這些數據如同被加密般難以區分,根本無法實現精準的分類。

遞迴提取非對角資訊以突破經典模型極限

面對經典網路無法跨越的數學障礙,HQRN 展現了處理高維量子狀態幾何的強大優勢。在 HQRN 的運算架構中,每一個量子殘差塊都會執行一種學習到的基底旋轉 (basis rotation)。這個運算過程能夠將初始狀態中不可見的非對角元素(即代表量子關聯的部分),旋轉並投影到後續網路層的對角子空間中,讓那些在單純測量中被忽略的量子資訊逐層顯現。

隨著網路深度的推展,這種能力會產生決定性的影響。數據顯示,當殘差塊堆疊到 1213 甚至 15 層時,HQRN 能夠匯集並整合來自多個不同測量分支的結果。原本在機率空間中交錯重疊的糾纏態與對抗性可分離態流形 (manifolds),被這些非線性且深度的轉換逐步推開。HQRN 最終不僅成功將這兩類狀態拉開距離,更展現了經典對應物無法觸及的特徵解析能力,為未來在近期量子硬體上建立大規模深度架構指出了具體方向。

混合量子殘差網路證明了量子演算法可以直接利用經典模型的優化成果,並透過層層提取非對角關聯,解決經典網路無法分辨的量子糾纏分類難題。

Abstract

We introduce a Hybrid Quantum Residual Network (HQRN) and establish an exact functional correspondence between its state evolution and the dynamics of classical networks with residual connections. When inputs are restricted to the computational basis, the HQRN reduces to its classical analog, enabling the direct translation of optimized classical weights into quantum unitary operations, effectively inheriting the landscape benefits of classical optimization. Conversely, when processing general mixed states, the HQRN leverages off-diagonal quantum correlations to resolve features inaccessible to its classical analog. We validate this framework through digit recognition and bipartite entanglement classification. Notably, HQRN achieves high classification accuracy even for adversarial separable states that mimic the marginal measurement statistics of entangled pairs. Our results bridge the gap between classical and quantum residual learning, paving a scalable pathway for deep quantum architectures.