AJNR Ahead Full Text 2026-03-20

Machine Learning-Driven Approach to Identify Freezing of Gait in Individuals with Parkinsons Disease Using Conventional Structural MRI and Clinical Measures [NEURODEGENERATIVE DISORDER IMAGING]

Rathi, G. N., Gardner, A. J., Longhurst, J. K., Mari, Z., Mishra, V. R.

AI 導讀 academic AI 重要性 3/5

透過機器學習分析常規 T1 影像中的 27 個腦區皮質面積，能以 75% 敏感度預測巴金森氏症患者的步態凍結風險。

常規 T1 影像蘊含預測價值：無須特殊功能性掃描，單靠高解析度 T1 的微觀形態學就能提供疾病線索。
皮質面積而非體積是關鍵：傳統認知的皮質厚度與體積皆無法預測，唯獨 27 個跨腦葉的皮質面積展現了預測力。
SVM-Linear 表現最佳：在小樣本測試中，線性模型達到 AUC 0.71，其挑出的影像特徵與臨床物理治療指標高度相關。

誰能想到，區分巴金森氏症步態凍結的關鍵，不是常規測量的大腦皮質萎縮體積或厚度，而是特定的皮質表面積？一項利用傳統 1mm³ T1 權重影像與機器學習的最新研究證實，單純萃取並計算特定腦區的皮質面積，即可在獨立測試中達到 75% 的預測敏感度與精準度，顛覆了過往單純依賴肉眼判讀萎縮的視覺極限。

巴金森氏症步態凍結與常規 T1 的隱藏潛力

步態凍結（Freezing of Gait, FOG）是巴金森氏症（Parkinson's Disease, PD）患者在病程中經常面臨的嚴重併發症，這種短暫且不可預測的步伐停滯，不僅大幅增加患者跌倒與骨折的風險，也是目前臨床藥物與深部腦刺激手術難以完全控制的挑戰。對於放射科醫師而言，當這類患者被轉介進行腦部磁振造影時，我們主要的目標通常是排除其他次發性原因，或是尋找非典型巴金森氏症候群的特徵，例如進行性核上神經必（PSP）的蜂鳥標誌，或是多系統萎縮症（MSA）的十字麵包標誌。然而，在單純的巴金森氏症患者中，常規影像往往看起來與同年齡層的健康大腦無異。

面對視覺判讀的極限，研究團隊試圖探問一個核心問題：常規的無顯影劑結構性影像中，是否已經潛藏了能夠預測步態凍結的微觀形態學變化？過去許多高階影像研究會仰賴功能性磁振造影（fMRI）或擴散張量影像（DTI）來探索大腦網路的異常，但這些序列在一般臨床常規檢查中並不普遍，且掃描時間較長、容易受到患者不自主運動的假影干擾。因此，如果能利用最普遍、各家醫院皆有建置的標準等體素（isotropic）1mm³ T1 權重影像，透過客觀的演算法來找出疾病特徵，將能極大地降低技術門檻，並讓這項預測工具更容易融入現有的影像存傳系統（PACS）與臨床工作流程。

這項研究的切入角度，正是放棄依賴單一腦區的肉眼觀察，轉而交由無偏差的機器學習模型，全面性地審視大腦皮質與皮質下結構的每一寸量化數據。藉由整合臨床評量指標與常規結構性影像，作者期望能為這群高風險患者建立一個早期的影像學預警標記，讓神經內科醫師在患者發生嚴重跌倒前，就能預先調整復健與治療策略。

37 例受試者的特徵萃取與 FreeSurfer 應用

從研究的收案與方法學設計來看，團隊共納入了 37 位確診為巴金森氏症的參與者。為了進行嚴謹的模型訓練與驗證，這群患者被進一步劃分為兩大組：包含 16 位具有步態凍結症狀的患者（PD-FOG），以及 21 位沒有步態凍結症狀的患者（PD-nFOG）。所有參與者皆接受了標準化的等體素 1mm³ T1 權重影像掃描，這種高解析度的 3D 影像能確保大腦皮質邊界的精準描繪，是進行後續形態學分析的黃金標準。

在影像後處理方面，研究採用了神經影像界廣泛認可的 FreeSurfer7（全自動化的大腦分區與皮質測量軟體） 進行特徵萃取。這套系統能夠自動剝除頭骨、區分灰白質交界，並將立體的大腦皮質展開，計算出極度細微的量化指標。作者從影像中提取了六大類核心大腦形態學測量值，包含：皮質下結構體積（subcortical volume）、皮質體積（cortical volume）、平均曲率（mean curvature）、皮質面積（area）、皮質厚度（thickness），以及 local gyrification index（量化大腦皮質皺褶程度的指標）。

為了確保機器學習模型具有真正的預測能力，而不僅僅是記住訓練資料，作者將這 37 位參與者嚴格切割為兩個獨立的資料集。發現集（discovery dataset）包含了 30 位參與者（13 位 PD-FOG 與 17 位 PD-nFOG），用於訓練與調校模型參數；而獨立測試集（independent testing dataset）則保留了 7 位參與者（3 位 PD-FOG 與 4 位 PD-nFOG），這 7 人的資料在模型訓練過程中完全被隱藏，專門用來評估演算法面對全新病患時的泛化能力。此外，團隊也收集了詳細的臨床與物理治療評估分數，準備與影像特徵進行交叉驗證。

37 例參與者分組與測試集資料

資料集	總人數	PD-FOG (步態凍結)	PD-nFOG (無步態凍結)
發現集 (Discovery)	30 例	13 例	17 例
獨立測試集 (Testing)	7 例	3 例	4 例
總計	37 例	16 例	21 例

利用嚴格切割的獨立測試集來驗證機器學習模型泛化能力

SVM-Linear 的獨立測試與 AUC 0.71 表現

進入模型建立階段，面對 FreeSurfer 產生的大量腦區特徵，如果直接將所有變數丟入演算法中，極易引發「維度災難」，導致模型過度擬合。因此，研究團隊首先使用了 LASSO（一種自動剔除不重要變數的降維演算法），將冗餘且無預測力的特徵係數壓縮至零，精煉出最關鍵的少數變數。接著，他們測試了三種主流的機器學習架構：隨機森林（Random Forest, RF）、線性支援向量機（SVM-Linear），以及非線性支援向量機（SVM-Non-Linear），藉此比較不同模型在處理這類高維度醫療資料時的穩定度。

將焦點拉到實際測試結果，當模型在從未見過的獨立測試集上進行驗證時，SVM-Linear 模型展現了最優異且最穩定的預測能力。具體而言，該模型在預測步態凍結上達到了 AUC 0.71 的表現，並具備 75% 的精準度（precision）、75% 的敏感度（sensitivity），以及 66.67% 的特異度（specificity）。相較之下，非線性的 SVM 以及經常被認為具有強大分類能力的隨機森林模型，在此次任務中的表現反而不如最單純的線性分類器。這在醫學影像 AI 中是一個非常經典的現象：當樣本數有限且特徵維度高時，簡單的線性邊界往往比複雜的非線性決策樹更能抵抗雜訊，提供更具泛化性的預測。

更令人驚訝的是，在所有的預測變數組合中，只有單獨使用「FreeSurfer 萃取之皮質面積（cortical area）」這一項特徵，才能成功驅動模型預測步態凍結。作者明確指出，其餘的形態學指標——包含放射科醫師最常聯想到的皮質體積、皮質厚度，或是複雜的皺褶指數，無論是單獨使用或是與臨床指標結合，皆無法預測 PD-FOG 的發生。這個發現極具啟發性，它暗示著步態凍結的病理機制，在巨觀結構上可能表現為大腦皮質表面的切線方向擴張或收縮異常，而非垂直方向的神經元流失（厚度變薄）。

SVM-Linear 模型獨立測試集表現

使用 27 個腦區皮質面積預測步態凍結

跨越四大腦葉的 27 個關鍵皮質面積特徵

若進一步細看模型所挑選出的關鍵特徵，這項研究確認了來自 27 個特定腦區的皮質面積是區分患者的最強預測因子。這些區域並非侷限於傳統認知的基底核或單一運動皮質，而是廣泛分布於大腦的額葉（frontal）、顳葉（temporal）、頂葉（parietal）與枕葉（occipital）。這種跨腦葉的特徵分布，強烈支持了近年來神經科學界的假說：步態凍結並非單一局部病灶所引起，而是一種涉及大腦多重網絡斷聯的廣泛性症狀。額葉與頂葉的參與可能對應了執行功能與空間視覺感知的障礙，而這些正是維持流暢步態不可或缺的高階認知元素。

為了解決「這些機器學習挑出的 27 個腦區會不會只是統計上的巧合」這個疑慮，研究團隊進行了深入的臨床對照驗證。他們利用單變量與多變量統計方法，將這 27 個腦區的皮質面積特徵，與患者實際的臨床表現以及物理治療評估指標進行相關性分析。結果顯示，模型挑選出的這些影像特徵，與患者的臨床嚴重程度具有顯著的相關性。

這種將「黑盒子」演算法的輸出結果與真實世界臨床指標重新連結的做法，極大地增強了所選特徵集的說服力。它證明了機器學習在 T1 影像上找到的微小面積差異，不僅僅是數學方程式的產物，而是確確實實反映了患者運動與步態控制能力的衰退。這也解釋了為何單純結合常規臨床評估無法有效預測步態凍結，因為 T1 影像所捕捉到的皮質網絡型態變異，提供了超越現有臨床量表所能捕捉的獨立病理資訊。

僅 7 例測試集的統計限制與未來驗證方向

儘管這項研究展示了常規影像結合機器學習的強大潛力，但身為第一線的影像學專家，我們在解讀這些數據時必須保持極度的客觀與謹慎。作者在討論章節中也非常坦誠地指出了本研究最致命的限制：樣本數極度受限。總收案量僅 37 人，而真正決定模型效能的獨立測試集，甚至只有 3 位 PD-FOG 與 4 位 PD-nFOG 患者。在如此微小的測試樣本下，雖然 AUC 達到了 0.71，但只要其中一位患者被錯誤分類，各項指標的百分比就會發生劇烈震盪。因此，現階段的結果必須被嚴格定位為「探索性（exploratory）」的先期概念驗證。

此外，本研究的所有影像資料皆來自單一來源且採用一致的掃描參數。在真實的放射科環境中，我們每天面對的是來自不同廠牌（GE、Siemens、Philips）、不同磁場強度（1.5T 與 3T 混用），甚至不同切線厚度重建的 T1 影像。FreeSurfer 的演算法對於影像對比度與解析度極度敏感，當這套 SVM-Linear 模型遭遇多中心、跨機台的異質性資料時，這 27 個腦區的面積測量是否還能保持穩定？預測準確率是否會大幅下降？這些都是未來必須透過大規模外部驗證才能解答的難題。

對於放射科醫師而言，我們明天並不需要急著在報告中丈量巴金森氏症患者的皮質面積，但這篇論文提供了一個極重要的臨床啟示：結構正常的 T1 影像並不代表大腦沒有退化。隨著 AI 自動化量測工具的成熟，未來這些耗時的皮質表面積計算將可望在背景伺服器中自動完成。這項研究勾勒出了一種可能的未來工作模式：放射科醫師負責確認影像無急性或次發性病灶，而背景運作的機器學習模型則提取出這 27 個腦區的面積特徵，自動生成一份步態凍結風險預測報告，協助神經內科醫師提早介入防範。

肉眼判讀 T1 影像沒有明顯萎縮早已不足以保證步態正常，未來巴金森氏症的跌倒風險預警，將交由背景運算的皮質面積模型來守護。

Abstract

BACKGROUND AND PURPOSE:Freezing of gait (FOG) presents a significant challenge in the management of Parkinson's disease (PD). Our study explored the potential to predict PD-FOG using an unbiased machine learning (ML) approach that leverages conventional T1-weighted MRI and clinical measures.MATERIALS AND METHODS:Thirty-seven participants (16 PD-FOG, 21 PD-nFOG) underwent standard isotropic 1mm3 T1-weighted MRI. Brain morphometric measures, including subcortical volume, cortical volume, mean curvature, area, local gyrification index, and thickness, were extracted using FreeSurfer7. Participants were divided into discovery (13 PD-FOG, 17 PD-nFOG) and independent testing (3 PD-FOG, 4 PD-nFOG) datasets. We tested the predictive ability of each FreeSurfer-derived measure, each clinical measure, and every combination of those measures using three ML models: Random Forest (RF), Support Vector Machine (SVM)-Linear, and SVM-Non-Linear. Feature reduction was performed using the least absolute shrinkage and selection operator before model development.RESULTS:The SVM-linear model outperformed SVM-Non-Linear and RF models when tested on the independent dataset (area under the curve [AUC]: 0.71, precision: 75%, sensitivity: 75%, specificity: 66.67%). FreeSurfer-derived cortical area from twenty-seven regions predicted PD-FOG, involving several cortical and subcortical regions. None of the other measures, either in combination or isolation, predicted PD-FOG. The identified features were significantly correlated with clinical and physical therapy measures of PD-FOG using univariate and multivariate statistics, bolstering confidence in the selected feature set.CONCLUSIONS:Our results demonstrate that FreeSurfer-derived cortical area measures from 27 key regions across the frontal, temporal, parietal, and occipital lobes can moderately predict FOG in PD (AUC = 0.71) using a linear SVM model. While preliminary, our work outlines an MRI-based analytical approach that may inform future external validation efforts and contribute to understanding the potential role of cortical morphology in PD-FOG risk. However, given the limited sample size and constrained independent testing cohort, these findings should be interpreted as exploratory and warrant replication in larger, multi-center studies.

Machine Learning-Driven Approach to Identify Freezing of Gait in Individuals with Parkinsons Disease Using Conventional Structural MRI and Clinical Measures [NEURODEGENERATIVE DISORDER IMAGING]

巴金森氏症步態凍結與常規 T1 的隱藏潛力

37 例受試者的特徵萃取與 FreeSurfer 應用

SVM-Linear 的獨立測試與 AUC 0.71 表現

跨越四大腦葉的 27 個關鍵皮質面積特徵

僅 7 例測試集的統計限制與未來驗證方向

Abstract

🔗 相關推薦

最新評測證明，Gemini 2.5 Pro 在加入影像後準確率激增至 70%，正式告別 AI 只會看文字通靈的時代。

打破 CTP 單一血流閾值迷思，3D nnU-Net 能針對「打通與否」雙情境，將最終梗塞預測準確率翻倍。

聽神經瘤切割有了新突破，U-Mamba 模型斬獲 0.927 分數擊潰 MedSAM 大模型。