Reference Trajectories of Extra-Axial Cerebrospinal Fluid during Childhood and Adolescence Defined in a Clinically Acquired MRI Dataset.

Mandal Ayan S, Dorfschmidt Lena, Schabdach Jenna M, Gardner Margaret, Yerys Benjamin E, et al.

View Original ↗
AI 導讀 academic pediatrics 重要性 4/5

正常軌跡為何頻現假性異常?解密建立兒科影像常模必備的統計演進史。

  • 橫斷面圖表會壓平生長高峰,導致正常發育被誤判為異常跨界。
  • 建立可靠神經影像常模,必須依賴 GAMLSS 模型以精確校正偏態。
  • 動態斜率評估需以 Z-score 校正均值迴歸,才能避免極端值誤導。

正常青春期發育在橫斷面常模上,反而會頻繁跨越百分位呈現假性異常,主因是個體生長時程的標準差高達 1 年。追蹤兒科大腦腦脊髓液或身高時,若忽視均值迴歸效應,極易在判讀單次影像與數據時被誤導。

從 Galton 的 9337 筆量測到常模百分位建立

建立任何發育軌跡常模,首先必須收集龐大數據並降維處理。人體測量的初期多為了行政目的,例如評估奴隸勞動力或確保士兵體能。直到十九世紀末,在 Edwin Chadwick 等人推動下才轉向醫學應用。這段期間,比利時統計學家 Adolphe Quetelet 是第一個將常態分佈應用於生物特徵的人。他提出「平均人」概念,利用均值與誤差代表群體,但他的盲點在於將變異視為單純測量誤差,忽略真實生物多樣性。

為了解決此理論缺陷,Francis Galton 於 1884 年倫敦國際健康展覽會設立測量實驗室。他總共收集了 9337 位自願者數據(含 2954 位兒童),每人測量視力、聽力與身高體重等 17 項參數(Figure 3 為 Galton 自己填寫職業為「私人紳士」的測量卡)。Galton 注意到人體數據根本不符常態分佈,因此創新引入「百分位」概念。他在累積對數圖(Figure 4)上,將分佈切成 100 等分。若恰好呈常態分佈,中位數與四分位數距離即 0.6745 個標準差。這套理論演變成現代圖表骨幹,多採用約 0.67 SD 的間距來標示曲線,兼具標準差對稱與極端值反映。

統計常模建立方法的歷史演進
時代與代表人物核心統計概念優點與臨床貢獻技術侷限
19世紀初 (Quetelet)常態分佈與平均人將大量特徵濃縮為平均值與可能誤差忽略生物多樣性,將變異視為單純誤差
1884年 (Galton)百分位 (Percentiles)切割 100 等分,處理非常態分佈數據缺乏平滑化與年齡跨度的高階預測
20世紀中 (Cole)三分之二 SD 間距結合標準差對稱性與直觀的極端值標示僅針對靜態數據,未徹底處理偏態
現代 WHO 標準LMS 與 GAMLSS 模型校正偏態與峰度,提供連續年齡的精確 Z-score建構門檻極高,需龐大且無偏差的數據集

不同時代的模型特徵比較

GAMLSS 模型與 Figure 6 的橫斷面軌跡設計

1891 年,Henry Bowditch 分析麻州兒童數據時嘗試了三種圖表佈局。其中第三種佈局(原文 Figure 6)將身高繪於 Y 軸、年齡繪於 X 軸,並畫出各百分位曲線,使得醫師能同時觀察發育數值的絕對距離與動態速度。這套設計經受百年考驗,成為當代醫學圖表的標準格式。

然而建構神經影像常模(如腦室或皮質發育)時,單純依賴傳統百分位切割會有困難,因發育軌跡常具高度非線性與嚴重偏態。世界衛生組織(WHO)開發最新標準時,評估了 30 種統計法,最終強推 GAMLSS(廣義加法模型,能處理隨年齡變化的偏態與峰度)。GAMLSS 核心為 LMS 方法,利用 Box-Cox 轉換技巧(將非正規偏態數據轉換為常態分佈),以三個參數來捕捉特徵:L(偏態)、M(中位數)與 S(變異係數)。藉由這些隨年齡平滑變動的參數,不僅能重建百分位曲線,還能逆向把患者測量值轉為 Z-score,將概略對應升級為精確的量化分析。

Figure 8A 的青春期發育時程與斜率判讀陷阱

對於忙碌的臨床醫師而言,本篇回顧最令人訝異的現象在於「青春期發育時程的變異」。觀察 Figure 8A 的速度曲線可見,不同個體達到生長高峰的年齡落在 12 到 16 歲不等。若把這些不同時間點達到高峰的數據直接取橫斷面平均,得出的平均曲線會被嚴重壓平、變寬;反之,若像 Figure 8B 依據發育年齡重新對齊,平均曲線形狀即與真實個體斜率吻合。

這凸顯出一個事實:基於橫斷面資料建立的百分位曲線,其斜率遠小於兒童真實的生長斜率。細看 Figure 9,提早進入發育期的兒童生長曲線疊加傳統常模時,會頻繁往上跨越好幾條百分位線,再掉回原位。這極易讓醫師誤以為病患的發育或大腦體積異常加速,但實際上僅是常模設計未經時程校正的假象。這對於判讀神經影像的動態變化有極為關鍵的啟發,警告我們不能將單點影像直接套用靜態常模。

手腕骨 X 光輻射疑慮與 Tanner 縱向常模侷限

為了解決橫斷面常模的誤導,Tanner 與 Whitehouse 開發了調整過發育時程的縱向生長圖(Figure 10)。這種圖表同時具備單一時間點的實線與縱向連續的陰影百分位,甚至加入骨齡作為 X 軸,試圖藉由骨齡來校正每個人不同的發育時程,在 1960 年代曾大受歡迎。

然而,這套解法在現代醫學遇到了不可挽回的阻礙。生長速度圖只能在病人測量跨越高峰期後才能後見之明地確認,對即時診斷無助。更衝擊放射科的是,過去評估骨齡必須常規拍攝手腕骨 X 光片,但近年對於非必要輻射暴露的道德標準提升,這類單純為校正常模而拍 X 光的做法已全面式微。失去骨齡這個校正錨點,高度依賴骨骼成熟度來平滑化曲線的縱向常模,已難以在現代臨床執行。

Figure 11B 均值迴歸校正與 Z-score 應用

從統計學的角度來看,為了解決縱向常模無法實施的困境,學者發展了一套完全無需測量絕對速率,純基於「跨越百分位線統計機率」的嶄新策略——Thrive lines(茁壯線)。如果在不同時間點測量兩次 Z-score($Z_1$ 與 $Z_2$),相關係數為 $r_1$,便可算出校正均值迴歸的條件化生長速度。

均值迴歸是影像追蹤中最容易被忽略的干擾:體型或腦容積偏低的兒童,後續增長率自然會高於大體型兒童。若未予調整,單看數值增減極易導出錯誤結論。根據文中推導,條件化增量的 Z-score 計算公式為 $(Z_2 - r_1 Z_1) / \sqrt{1 - r_1^2}$。給定目標速度後,我們能反向推演連續數值,畫出輔助線 Thrive line。

若檢視原文 Figure 11A 的範例,一名男嬰在三個月內體重從中位數下滑到第 9 百分位,雖然明顯變慢,但肉眼難以判定嚴重性。一旦套用專供四週區間設計的第 5 百分位 Thrive lines(Figure 11B),醫師比較斜率後立刻能量化發現:該病患連續兩個月生長速度大幅跌破臨界值。這種將高階迴歸預先轉換為視覺輔助線的技術,免去醫師手算麻煩,如今更適合內建於放射科電子病歷軟體中隨時疊加參考。

橫斷面常模 vs Thrive lines 茁壯線比較
比較維度傳統橫斷面常模百分位Tanner 縱向速度圖Thrive lines 茁壯線 (Z-score)
核心指標絕對距離與位置絕對生長速率 (例如 cm/year)跨百分位線的斜率與統計機率
青春期高峰對齊無校正,圖表曲線被壓平依賴事後確認與骨齡 X 光對齊無須依賴骨齡,採均值迴歸校正
均值迴歸處理未考慮未考慮將起點 Z-score 與相關係數納入條件運算
臨床實用性易呈現假性異常交叉需拍攝具輻射疑慮的手腕骨 X 光可做成透明覆蓋圖或直接內建於軟體

處理縱向發育速度的不同策略

放射科應用的限制與數位常模啟示

回到這份長達兩百年歷史的回顧,作者坦承常模建立有其適用邊界。例如 WHO 2006 年的國際標準,建立樣本群在體重與頭圍上都相對偏小。在英國發布的 UK-WHO 圖表中(Figure 1),特地把出生後前兩週的百分位曲線刻意抽掉。因為英國本地 1990 年出生體重遠高於 WHO 標準,若硬套用會造成大量健康嬰兒被誤判體重過低。這種「參考樣本特性與實際臨床收案數據脫鉤」的現象,是引入國外數據集(如 AI 模型提取的皮質厚度)時必備的警覺。

面對自動化量測軟體普及的今天,這篇文章提供了實務指引:第一,判讀大腦 radiomics(從影像自動抽上千個量化特徵)報告時,務必確認軟體是否使用 GAMLSS 校正偏態,否則產出的百分位數恐有嚴重誤差。第二,看到追蹤影像容積數值跨越百分位線切勿急於下異常結論,因為正常衝刺本來就會跨越壓平的常模曲線。第三,藉由電腦螢幕動態呈現,我們能一鍵切換 Thrive lines,精準分辨數值變化是病理性異常還是生理性追趕發育。

下次當你看到兒科病患追蹤 MRI 上的大腦或腦室體積百分位發生跨越時,請先確認這是否為青春期未經校正的假象,而非急著寫下水腦或腦萎縮的 impression!

Abstract

Purpose To build extra-axial cerebrospinal fluid (eaCSF) growth charts that define key diagnostic criteria for benign enlargement of the subarachnoid space (BESS) by providing an age-related reference benchmark to aid in assessing atypical eaCSF development. Materials and Methods In this retrospective study, T1-weighted MRI scans from patients who underwent imaging at a pediatric health care system between January 2004 and December 2023 were accessed to form a clinical control group. Nine scans from patients diagnosed with BESS by a board-certified pediatric neuroradiologist were also reviewed. T1-weighted scans were segmented into various tissue types, including eaCSF. Growth charts of eaCSF were modeled using the clinical control group. The results of patients with confirmed BESS were then benchmarked against these charts to test the performance of the eaCSF growth charts. Generalized additive models of location, scale, and shape were used. Results The eaCSF measurements were obtained for 1205 patients (619 female; age range, 0.19-19.6 years). Measurements show that eaCSF evolved dynamically with age, steadily decreasing from birth to 2 years, then trending upward in childhood. Seven of the nine patients with a clinical diagnosis of BESS had eaCSF measurements above the 97.5th percentile for at least one measurement. Percentile scores distinguished patients with BESS from controls with areas under the receiver operating characteristic curve of greater than 0.95. Conclusion MRI-derived eaCSF measurements evolved dynamically throughout early life. Patients with atypical CSF development could be differentiated from clinical controls using computational measurements paired with normative modeling.