ECG-Lens: Benchmarking ML & DL Models on PTB-XL Dataset

Saloni Garg, Ukant Jadia, Amit Sagtani, Kamal Kant Hiran

View Original ↗
AI 導讀 technology AI 重要性 3/5

複雜 CNN 模型 ECG-Lens 以 80% 準確率與 90% ROC-AUC,擊敗傳統演算法。

  • 複雜 CNN 模型 ECG-Lens 達 80% 準確率與 90% ROC-AUC。
  • 模型直接讀取 12 導程原始訊號,免除傳統特徵工程的繁瑣步驟。
  • 導入 SWT 穩態小波轉換增強數據,有效提升樣本多樣性與泛化能力。

在自動化心電圖訊號分類的技術競賽中,深度學習正展現壓倒性優勢。最新研究《ECG-Lens》指出,在處理未經人工特徵工程處理的原始 12 導程心電圖時,複雜卷積神經網路模型 ECG-Lens 成功達到 80% 的準確率與高達 90% 的 ROC-AUC 分數,為自動化生理數據監測確立了全新的效能基準。

解析 PTB-XL:12 導程心電圖訊號挑戰

自動化心電圖訊號分類一直都是機器學習領域中極具挑戰性的任務。這不僅因為訊號本身容易受到雜訊干擾,更因為不同異常狀況在波形上的表現差異極其微小。為了訓練出具備高泛化能力的模型,本研究選用了極具權威性的 PTB-XL 作為測試平台。這是一個涵蓋大量常態數據與各類異常狀況的大型數據庫,其中包含了標準的 12 導程心電圖紀錄。

12 導程數據的本質是多通道的空間與時間序列,意味著每一次紀錄都包含龐大且具備複雜時間依賴性的資料點。過去,傳統的訊號處理往往依賴專家進行繁瑣的手動特徵工程,例如標記特定波峰或計算複合波的寬度。本研究的關鍵突破在於,測試的深度學習模型完全基於「原始訊號」進行端到端(End-to-End)訓練,直接讓模型從數萬筆陣列中自動捕捉具備鑑別度的特徵,真實反映了演算法在未處理數據上的解析極限。

六大演算法對決:ECG-Lens 獲八成準確率

為了全面評估不同演算法處理複雜訊號的能力,研究團隊設計了一場涵蓋六大架構的基準測試。在傳統機器學習陣營中,測試了決策樹分類器(Decision Tree Classifier)隨機森林分類器(Random Forest Classifier)以及羅吉斯迴歸(Logistic Regression)。這些演算法雖然在處理高度結構化數據時具備運算效率,但在面對需要考量多通道交互作用的原始時序訊號時,往往無法深入挖掘深層模式。

而在深度學習陣營,團隊則部署了三款網路:基礎卷積神經網路(Simple CNN)LSTM(長短期記憶網路,一種擅長處理時間序列的神經網路),以及本研究的核心——複雜卷積神經網路 ECG-Lens。實驗顯示,具備深層卷積架構的 ECG-Lens 能夠自動從龐大序列中,逐步提取出從局部波形到全局模式的關鍵資訊,最終在分類準確率上達到了 80% 的優異水準,徹底拉開與傳統演算法的效能差距。

導入穩態小波轉換技術:提升訓練樣本多樣性

在深度學習領域,數據的質與量往往直接決定了模型的極限。為了解決訓練過程中可能出現的過度擬合問題,研究團隊在數據前處理環節引入了 SWT(穩態小波轉換,一種訊號頻率分解與重建技術) 來進行數據增強。

有別於電腦視覺領域常用的隨機裁切或翻轉,時間序列訊號的數據增強面臨著極高門檻。任何不當的扭曲都可能破壞原本具有診斷價值的核心特徵。SWT 技術的優勢在於,它具備平移不變性,能夠將原始的時序訊號安全地分解為不同頻率的子頻帶。透過微調後再重建訊號,團隊得以生成大量具有細微變化卻又完全保留核心特徵的全新訓練樣本。這種高階的數據增強策略,是 ECG-Lens 能夠穩健收斂並提升泛化能力的重要推手。

突破九成 ROC-AUC:自動化訊號分類新基準

在模型效能的最終驗證階段,研究採用了多維度評估體系,包含準確率、精確率、召回率、F1-分數以及 ROC-AUC(接收者操作特徵曲線下面積,衡量模型區分正負樣本能力的核心指標)。在處理真實數據集時,ROC-AUC 往往比單純的準確率更能精準反映模型的綜合鑑別力。

測試數據清楚表明,ECG-Lens 取得了高達 90%ROC-AUC 分數。這代表無論是在篩選常態樣本,還是精準辨識多樣化的異常波形時,複雜 CNN 架構都具備極高的敏感度與特異度。這項研究結果不僅為工程團隊在挑選自動化訊號分類模型時提供了量化的基準參考,也為未來針對特定類別開發專精型預測模型,劃定了明確的技術演進路徑。

在原始時間序列數據的戰場上,複雜 CNN 架構結合高階小波轉換數據增強,已證明能比傳統演算法挖掘出更深層的波形特徵。

Abstract

Automated classification of electrocardiogram (ECG) signals is a useful tool for diagnosing and monitoring cardiovascular diseases. This study compares three traditional machine learning algorithms (Decision Tree Classifier, Random Forest Classifier, and Logistic Regression) and three deep learning models (Simple Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), and Complex CNN (ECGLens)) for the classification of ECG signals from the PTB-XL dataset, which contains 12-lead recordings from normal patients and patients with various cardiac conditions. The DL models were trained on raw ECG signals, allowing them to automatically extract discriminative features. Data augmentation using the Stationary Wavelet Transform (SWT) was applied to enhance model performance, increase the diversity of training samples, and preserve the essential characteristics of the ECG signals. The models were evaluated using multiple metrics, including accuracy, precision, recall, F1-score, and ROC-AUC. The ECG-Lens model achieved the highest performance, with 80% classification accuracy and a 90% ROC-AUC. These findings demonstrate that deep learning architectures, particularly complex CNNs substantially outperform traditional ML methods on raw 12-lead ECG data, and provide a practical benchmark for selecting automated ECG classification models and identifying directions for condition-specific model development.