ProtoAoA: Few-Shot Angle-of-Arrival Estimation using Prototypical Networks

Elsayed Mohammed, Omar Mashaal, Alec Digby, Pasquale Leone, Lorne Swersky, et al.

View Original ↗
AI 導讀 technology AI 重要性 4/5

ProtoAoA 首創利用原型網路架構,僅依賴 23% 訓練類別就能在 4 筆樣本下將未知訊號定位誤差縮小至 3 度。

  • ProtoAoA 模型首度將原型網路應用於訊號到達角估計,解決傳統深度學習過度依賴龐大標註資料的限制。
  • 測試顯示在最嚴苛的 Skip-3 條件下,模型僅依賴 57 個已知角度訓練,也能對未知角度達到 3 度的平均誤差。
  • 透過 1D 卷積萃取原始 IQ 訊號特徵並計算原型距離,系統無須重新訓練即可快速適應新角度,支援集擴充至 32 筆時誤差降至 2 度。

只需使用總資料集 23% 的類別訓練,模型就能在僅有 4 筆未知角度樣本的情況下,將到達角預測誤差縮減至 3 度。這份 ProtoAoA 研究展示了原型網路在極缺標註資料時的強大泛化能力。

突破深度模型依賴海量資料的到達角估計限制

無線通訊中的到達角(Angle-of-Arrival, AoA)估計技術,是決定波束成形、室內定位、雷達系統與干擾管理精準度的核心基礎。傳統上,業界廣泛採用 MUSIC 演算法來分析多天線通道狀態資訊(CSI)的相位差,藉此反推訊號來源角度。然而在複雜的多路徑傳輸條件下,當訊號與雜訊子空間不再保持相互正交的假設時,MUSIC 的估計準確率便會大幅下降。

針對傳統演算法的瓶頸,學界陸續提出了 AoA-net 與 DeepAoANet 等深度學習架構。這些基於資料驅動的 AI 模型展現出超越傳統演算法的超解析度能力,不僅降低了運算複雜度,還能抵禦天線相位與振幅的不一致干擾。然而,深度學習技術的致命傷在於需要極度龐大的資料蒐集與模型訓練成本;在實務的動態環境中,硬體異質性與環境變異往往讓預先訓練好的模型難以泛化。

面對資料稀缺與泛化挑戰,研究團隊提出了名為 ProtoAoA 的全新架構。這項研究首度將原型網路(Prototypical Networks, PN)技術應用於 AoA 估計領域。原型網路是一種擅長處理小樣本學習的元學習(meta-learning)方法,模型透過學習如何為每個類別建立特徵嵌入(embeddings),將相同類別的樣本聚集在一起;當面對未曾訓練過的新角度時,系統無須重新訓練整個模型,只需少數幾筆資料即可建立新類別的「原型」,進而完成精準預測。

採用 USRP X300 蒐集 225 種角度訊號

要驗證少樣本學習在真實無線環境中的可行性,必須仰賴扎實的硬體測量數據。研究團隊建置了一套基於軟體定義無線電(SDR,可程式化控制射頻訊號的通訊設備)的戶外測量平台。這套系統由一台 USRP X300 發射器與兩台同步的 USRP X300 接收器組成,並搭配 Ettus Octoclock CDA-2990 確保設備間的時間同步。

系統發射端與接收端皆配備 5.88 GHz 的貼片天線,其中接收端總共提供 4 個獨立的接收通道。為了涵蓋各種不同的到達角,研究人員利用伺服馬達精確調整接收天線的方位角(azimuth)與仰角(elevation),量測範圍涵蓋 -70 度至 70 度,並以 10 度為單位進行步進移動。

這套硬體矩陣最終收集了 225 種(15x15 網格)獨特的角度組合訊號。為了增加資料的多樣性與貼近真實場景,發射訊號中包含了 16-QAM、64-QAM 與 BPSK 等多種調變機制,並涵蓋多種不同的取樣率。這些具備振幅與相位資訊的四通道原始複數 IQ 樣本(IQ samples),將直接作為後續深度學習模型的輸入流。

採用 1D 卷積與 Skip-3 空間配置的特徵萃取

在模型架構方面,ProtoAoA 採用了相對輕量化的多層卷積網路作為特徵編碼器。輸入的資料陣列為 (4, n) 的四通道 IQ 樣本,編碼器首先透過三層 1D 卷積層,將初始輸入的特徵空間逐步擴展至八倍大小。這些卷積層配置了可學習的濾波器,負責捕捉對 AoA 分類至關重要的關鍵波形特徵。隨後,資料會通過最大池化層(max-pooling)進行降維,最後攤平並送入三個連續的全連接層,將特徵表示壓縮至最終的 10 維輸出空間。

模型訓練流程遵循傳統的 k-way 分類法。在每一次的訓練回合中,系統會隨機挑選 k 個類別,並從各類別中抽取 N 筆樣本組成「支援集(support set)」,同時抽取另外 N 筆樣本組成「查詢集(query set)」。支援集的樣本通過編碼器萃取出特徵向量後,系統會計算每個類別向量的平均值,將其定義為該類別的「原型」。

完成原型計算後,查詢集的樣本會被映射到同一個特徵空間中。系統會計算查詢樣本特徵與各個原型之間的歐幾里得距離,並透過 Softmax 函數將這些負距離轉換為分類機率。最後,透過計算預測機率與真實標籤之間的交叉熵(cross-entropy)損失,執行反向傳播梯度下降來更新編碼器權重。這種不依賴海量單一類別資料的迭代訓練,正是原型網路能快速適應新資料的關鍵。

僅需 4 筆樣本即可在 Skip-1 達成 90% 準確率

在檢驗 ProtoAoA 對未知角度的泛化能力時,研究團隊設計了不同的資料跳躍配置。在最嚴苛的 Skip-3 配置中,模型在訓練階段「跳過」了大量的周圍網格點,實際上只使用了 57 個角度進行訓練(僅佔總類別的 23%)。其餘被跳過的網格點皆被視為模型未曾見過的「新角度」,留待測試階段評估。

實驗數據顯示,在訓練涵蓋的已知角度上,模型能輕易達到 90% 以上的分類準確率;當支援集的樣本數增加到 16 或 32 筆時,準確率更飆升至 99%。而在面對未曾見過的新角度時,雖然受限於訓練與測試資料間的資訊差異,準確率有 10-20% 的微幅衰退,但整體表現依然令人驚艷。在跳躍幅度較小的 Skip-1 配置中,只需提供 4 筆新角度樣本,分類準確率即可達到 90%,對應的平均絕對誤差(MAE)甚至低於 2 度

當測試場景切換至難度最高的 Skip-3 配置時,僅用 4 筆樣本建立原型會讓 MAE 落在 3 度左右;但若將樣本數擴展至 32 筆,誤差將會縮減至 2 度。此外,深入分析前兩名(Top-2)的準確率曲線可以發現,即便模型在 Top-1 的預測中失誤,其 Top-2 的準確率在所有測試配置下皆超過 85%。這意味著即使系統將訊號誤判為相鄰的其他角度,其預測結果依然極度貼近真實的物理位置。

結合 IQFM 模型為資料受限通訊環境確立標準

這項研究確立了少樣本學習在資料匱乏的無線網路節點中,能夠快速部署並維持高精度的可行性。ProtoAoA 無需執行複雜的協方差矩陣運算,也捨棄了冗長的重新訓練流程,僅憑輕量的網路編碼器與基礎的原型距離計算,就在嚴苛的未見角度測試中展現出高度的穩健性與適應力。

團隊也指出,目前模型在辨識極度相近的鄰接角度時仍有些微誤差,未來將進一步強化模型對於相似原型的相對距離敏感度。長遠來看,將 ProtoAoA 的機制與新興的原始 IQ 基礎模型(如 IQFM)相結合將成為關鍵突破口。透過讓基礎模型預先提供強大的通用特徵表示,原型網路有望在正式進入少樣本微調階段前,就取得絕佳的適應力,進一步解放通訊領域中 AI 應用的數據限制。

原型網路以僅 23% 的訓練類別,成功在未知到達角預測上達成極低誤差,證明少樣本學習是解決無線通訊領域標註資料瓶頸的關鍵解方。

Abstract

Angle-of-arrival (AoA) estimation is a crucial function in wireless communications used for localization, beam-forming, interference management, and other applications. Deep learning (DL) solutions have been proposed for AoA to mitigate limitations of traditional AoA estimation techniques such as sensitivity to noise and the inability to generalize across different array characteristics. A challenge, however, of DL-based approaches is their reliance on large data collection campaigns and model training. This paper proposes the application of Prototypical Networks (PN) to address this challenge and utilizes a real-world dataset collected on a software defined radio (SDR) testbed to validate the effectiveness of the proposed solution. Prototypical Networks excel in extracting representative embeddings from unstructured input data, establishing class prototypes during training that can be few-shot trained on unseen classes. We demonstrate the efficacy of PNs for AoA classification using complex IQ samples, focusing on its ability to correctly classify new, unseen angles that the model was not trained on previously. Our results show that training our proposed ProtoAoA on only 23% of the AoA dataset classes can attain a mean absolute error (MAE) of 3 degrees with only 4-shots of training on the unseen angles - and an MAE of 2 degrees with 32-shots of training data. These results demonstrate that the developed prototypical network architecture requires remarkably few data samples to achieve reliable AoA estimation - and highlights its potential for other wireless applications where data availability is limited.