Improved Multiscale Structural Mapping with Supervertex Vision Transformer for the Detection of Alzheimer's Disease Neurodegeneration

Geonwoo Baek, David H. Salat, Ikbeom Jang

View Original ↗
AI 導讀 technology AI 重要性 4/5

最新 SV-ViT 模型結合 MSSM+ 多尺度特徵,透過 1988 筆跨廠牌 MRI 數據達成 0.93 AUROC 的阿茲海默症精準預測。

  • MSSM+ 新增腦溝深度與皮質曲率,使分類精確度曲線下面積提升 3%。
  • SV-ViT 採超級頂點映射分割大腦,運算效率與準確率超越現有圖卷積網路。
  • 實測 1988 筆 Siemens、GE、Philips 影像,模型跨設備 AUROC 穩定維持 0.93。

目前阿茲海默症(AD)的確診高度仰賴昂貴且具侵入性的正子造影(PET)或腦脊髓液(CSF)分析。為了尋找更親民的非侵入性篩檢方案,最新研究透過分析 1,988 筆跨廠牌的 T1 加權磁振造影(MRI)影像,提出結合超級頂點視覺變壓器(SV-ViT)的升級版多尺度結構映射(MSSM+)技術。這項開源模型在區分 AD 與認知正常者的測試中,達到了 0.93 的接收者操作特徵曲線下面積(AUROC),並展現了極佳的跨設備一致性。

傳統 MRI 標記的極限與 MSSM 多尺度架構基礎

研究團隊指出,海馬迴體積與皮質厚度(CT)等傳統結構磁振造影生物標記,雖已被廣泛用於阿茲海默症篩檢,但單一指標往往難以捕捉早期微小的神經退化跡象。另一方面,近期興起的血漿生物標記(如 p-tau 217 比例)雖具備極高潛力,卻缺乏大腦解剖學上的特異性,且在 80 歲以上高齡族群中的診斷準確度會顯著下降,這促使科學家重新挖掘常規 MRI 的潛能。

先前針對此痛點開發的多尺度結構映射(MSSM)技術,首度將皮質厚度與灰白質對比度(GWCs,反映皮質邊界微結構完整性)進行結合。該技術透過採集不同深度的灰白質訊號(涵蓋皮質深度 20%、40% 到 80% 以及白質深層),證明了多維度特徵融合能顯著提升對年齡與疾病相關變化的敏感度。

然而,初代 MSSM 僅在特定廠牌的數據上進行了初步的概念驗證。為了確立技術的跨廠牌通用性,同時降低年齡造成的混雜效應,團隊在本次研究中導入了嚴格的年齡校正流程。他們利用 150 名獨立的認知正常受試者建立多項式迴歸模型,確保後續擷取的特徵變化純粹反映疾病造成的病理影響,而非大腦自然老化的結果。

MSSM+ 升級:評估 63 種皮質特徵組合的最終解

為了進一步推升準確度,研究人員系統性地評估了包含灰白質對比度、皮質厚度、腦溝深度(Sulc)、皮質曲率(Curv)、白質雅可比行列式(Jacob)與局部腦回化指數(LGI)等六種頂點層級特徵的 63 種可能組合。透過偏最小平方法判別分析(PLS-DA)降維後,最終篩選出包含前四項特徵的最佳精簡子集,並正式命名為 MSSM+

這項擴展具有明確的解剖學意義:腦溝深度能直接反映與腦組織流失相關的皮質摺疊和腦溝變寬現象;皮質曲率則量化了局部形狀的複雜度,與神經退化引起的腦回塌陷密切相關。實驗數據顯示,MSSM+ 在 AD 與認知正常(CN)的分類任務中,精確度與召回率曲線下面積(AUPRC)達到了 0.89,比原本的 MSSM 基準高出 3 個百分點

消融實驗(Ablation study)進一步證實,雖然 GWCs 依然是分類貢獻度最高的單一核心特徵,但加入腦溝深度與皮質曲率確實提供了超越組織對比度的互補幾何資訊。相較之下,雅可比行列式雖有助於捕捉局部擴張,但若強行與其他特徵全數疊加,反而會因模型過度複雜而導致效能微幅衰退;而主要受大腦早期神經發育影響的局部腦回化指數,則被證明不適合用於捕捉晚發型的神經退化特徵。

表面超級頂點映射與 SV-ViT 架構解析

為有效處理大腦皮質這類非歐幾里得幾何(Non-Euclidean)的 3D 表面數據,傳統的 2D 影像編碼器常會因為強制攤平而扭曲表面積與相鄰關係。為解決此問題,團隊開發了表面超級頂點映射(SSVM)技術。相比於先前的表面視覺變壓器(SiT)採用均勻二十面體切割而忽略解剖學邊界,SSVM 的機制更貼近真實大腦結構。

該機制的重大突破在於將大腦皮質精準分割為多個不重疊的「超級頂點」(Supervertices,即表面區塊)。透過受限於感興趣區域(ROI)的廣度優先搜尋(BFS)演算法,每一側大腦半球被固定劃分為 1,280 個超級頂點。在劃分過程中,系統會刻意排除約 2.9% 橫跨不同 ROI 的模糊邊界表面,確保每個運算區塊都嚴格歸屬於單一且明確的解剖區域。

以此為基礎運作的超級頂點視覺變壓器(SV-ViT),直接接收這些包含 MSSM+ 特徵的超級頂點作為輸入序列。模型內部的多頭注意力機制負責捕捉不同大腦區域之間的全域關聯依賴性,而位置嵌入則保留了區塊內部的局部皮質拓撲結構。這種設計兼顧了解剖學特徵與運算效率,讓 SV-ViT 的綜合表現全面超越了 SplineCNN、SpiralNet++ 與 HGNN+ 等當前主流的圖卷積神經網路模型。

1988 筆跨三大廠牌 MRI 掃描的穩健性實測

除了追求單一資料集的極致準確率,醫療影像 AI 的最大挑戰往往在於不同掃描儀器間的泛化能力。為此,團隊從 ADNI 與 OASIS 大型公開資料庫中,提取了總計 1,988 筆(包含 696 名 AD 患者與 1,292 名認知正常者)來自 Siemens、GE 與 Philips 三大廠牌的掃描影像進行交叉驗證,測試範圍涵蓋了加速取樣與完整取樣等多種影像協議。

統計分析結果揭示,MSSM+ 在應對不同廠牌硬體設備時,展現出極低的效能變異性。無論使用哪一家的掃描儀,MSSM+ 的 AUROC 均穩定維持在 0.93 至 0.94 的高水準區間。韋爾奇變異數分析(Welch’s ANOVA)進一步比較受試者的平均指標變化後發現,隨著特徵從單一皮質厚度演進至 MSSM,再到最終的 MSSM+,跨廠牌所造成的訊號浮動與誤差呈現顯著的逐步遞減趨勢。

在群體層級的顯著性地圖分析中,MSSM+ 成功識別出比單一特徵更廣泛的神經退化區域。特別是在前額葉、內側額葉皮質以及旁中央小葉(Paracentral cortex)等關鍵區塊,MSSM+ 標示出的統計顯著範圍遠高於初代 MSSM,證明其對於疾病造成的皮質細微改變具有極高的捕捉靈敏度。

契合 A/T/N 研究框架的未來發展與早期篩檢潛力

這項基於大規模多世代隊列的研究證實,結合解剖學邊界知識訓練的 SV-ViT 搭配多尺度特徵,能為阿茲海默症提供一套具備跨設備穩健性的非侵入性評估標準。這項技術突破與美國國家老化研究所(NIA-AA)所定義的 A/T/N(類澱粉蛋白/tau蛋白/神經退化)研究框架高度契合,有望讓常規 MRI 在臨床研究中扮演更精準的「N」(神經退化)量化指標。

展望技術演進的下一階段,開發團隊計畫將評估範圍延伸至輕度認知障礙(MCI)患者,以測試該模型預測其轉化為阿茲海默症風險的準確度。同時,團隊也將探索以機器學習的圖形分群(Graph clustering)技術取代現有的規則化搜尋,進一步優化超級頂點表面映射的覆蓋率。未來若能將此結構性 MRI 框架與腦脊髓液或 PET 取得的 Aβ 及 tau 生物標記進行多模態數據整合,將有助於醫界更全面地描繪出神經退化疾病在不同嚴重程度下的完整微觀輪廓。

透過整合腦溝深度與皮質曲率,並採用遵循解剖邊界的超級頂點架構,常規 MRI 影像也能發揮媲美高階侵入性檢測的早期神經退化篩檢潛力。

Abstract

Alzheimer's disease (AD) confirmation often relies on positron emission tomography (PET) or cerebrospinal fluid (CSF) analysis, which are costly and invasive. Consequently, structural MRI biomarkers such as cortical thickness (CT) are widely used for non-invasive AD screening. Multiscale structural mapping (MSSM) was recently proposed to integrate gray-white matter contrasts (GWCs) with CT from a single T1-weighted MRI (T1w) scan. Building on this framework, we propose MSSM+, together with surface supervertex mapping (SSVM) and a Supervertex Vision Transformer (SV-ViT). 3D T1w images from individuals with AD and cognitively normal (CN) controls were analyzed. MSSM+ extends MSSM by incorporating sulcal depth and cortical curvature at the vertex level. SSVM partitions the cortical surface into supervertices (surface patches) that effectively represent inter- and intra-regional spatial relationships. SV-ViT is a Vision Transformer architecture operating on these supervertices, enabling anatomically informed learning from surface mesh representations. Compared with MSSM, MSSM+ identified more spatially extensive and statistically significant group differences between AD and CN. In AD vs. CN classification, MSSM+ achieved a 3%p higher area under the precision-recall curve than MSSM. Vendor-specific analyses further demonstrated reduced signal variability and consistently improved classification performance across MR manufacturers relative to CT, GWCs, and MSSM. These findings suggest that MSSM+ combined with SV-ViT is a promising MRI-based imaging marker for AD detection prior to CSF/PET confirmation.