Concordance and Association of Kidokoro MRI Scores at 32 and 40 weeks post-menstrual age with Neurodevelopmental Outcomes in Very Preterm Infants [PEDIATRIC NEUROIMAGING]

Bonezzi, L., Biagioni, T., Fiori, S., Luke, C., George, J. M., Colditz, P. B., Fripp, J., Ware, R. S., Pannek, K., Boyd, R. N.

View Original ↗
AI 導讀 academic MR 重要性 4/5

32週 vs 40週早產兒MRI怎麼看?剔除「髓鞘化延遲」後,早期Kidokoro評分與足月同樣能準確預測兩歲神經發展。

  • 32週的Kidokoro總分系統性高出40週約1.9分,主因是「髓鞘化延遲」項目,剔除後差異降至0.32分。
  • 早期與足月的腦部異常分數皆與兩歲動作發展高度負相關(Beta值分別為 -1.04 與 -1.18)。
  • 從32週到40週的評分若有進步(分數下降),本身即可作為動作發展優良的獨立預測指標(Beta=1.02)。

極早產兒神經發育預測的時間窗之爭

隨著新生兒加護病房照護技術的進步,極早產兒(Very Preterm Infants, VPI)的存活率顯著提升,但伴隨而來的神經發育異常風險仍是臨床面臨的重大挑戰。傳統上,放射科醫師主要依賴在足月等效年齡(Term-Equivalent Age, TEA,約 40 週)進行腦部 MRI 掃描,並使用如 Kidokoro score 等半定量評分系統來評估腦部損傷與成熟度。然而,臨床端(如新生兒科與復健科)為了能及早啟動早期療育(Early Intervention),迫切需要將風險分層的時間點提前。如果在出生後數週(約 32 週 PMA)就能準確預測兩歲時的神經發育狀況,將能大幅改變臨床決策路徑。本篇由 Bonezzi 等人發表於 AJNR 的研究,精準切中了這個臨床痛點。作者群試圖解答兩個核心問題:同一批極早產兒在 32 週與 40 週的 Kidokoro 評分是否具備一致性?這兩個時間點的影像異常,又能否各自獨立預測 24 個月大時的認知、語言與動作發展?這項研究不僅挑戰了「必須等到足月再掃描」的傳統思維,更為早期神經影像判讀提供了具體的數據支撐。

縱向雙時間點 3T MRI 世代與多變數迴歸設計

這是一項設計嚴謹的縱向追蹤研究,Table 1 的人口學數據顯示,研究團隊收案了 187 位極早產兒,中位數妊娠年齡(Gestational Age, GA)僅 28+5 週,男性佔 55%。為了確保影像細節足以進行精細的半定量評分,所有受試者皆在 3T 磁振造影儀上完成兩次掃描:第一次為早期(Early timepoint),中位年齡落在 32+2 週 PMA;第二次為足月等效年齡(TEA),中位年齡落在 40+5 週 PMA。放射科醫師使用改良版的 Kidokoro 系統進行獨立盲性評分,評估涵蓋白質、皮質灰質、深部灰質與小腦等結構的整體大腦異常分數(Global Brain Abnormality Score, GBAS)。

作為參考標準(Reference standard),研究團隊在受試者矯正年齡滿 24 個月時,統一實施 Bayley-III(貝氏嬰幼兒發展測驗第三版)來量化認知、語言與動作三大領域的發展表現。在統計方法上,除了使用 Bland-Altman 分析來檢視兩時間點評分的一致性,本篇論文的一大亮點是採用了嚴謹的多變數線性迴歸模型(Multivariable linear regression models)。這些模型並非單純看影像分數與預後的絕對關聯,而是強制校正了性別、出生妊娠週數、出生體重百分位數(排除 SGA 效應),以及對神經發展影響極大的社經地位(Socioeconomic status, SES)。這種經校正後算出的 Beta 係數與局部 R 平方(Partial $R^2$),才是真正過濾掉環境與周產期干擾後,純粹由「影像可見的腦部結構異常」所貢獻的預測力。

研究世代與影像擷取參數
世代特徵 / 變數數據細節與臨床設定
收案人數與性別187位極早產兒(男性佔 55%)
中位妊娠年齡 (GA)28+5 週
早期掃描時間 (Early)中位數 32+2 週 PMA (3T 掃描儀)
足月掃描時間 (TEA)中位數 40+5 週 PMA (3T 掃描儀)
臨床預後參考標準矯齡 24 個月時進行 Bayley-III 量表測試
多變數迴歸校正因子性別、妊娠年齡、出生體重百分位、社經地位(SES)

187名極早產兒的雙時間點3T MRI縱向世代設計

Table 2 揭露的評分落差與白質髓鞘化延遲的陷阱

放射科醫師在日常閱片時最常遇到的困擾是:用足月兒的標準去評估 32 週的腦部,是否會造成過度診斷?Table 2 的 Bland-Altman 分析給出了非常清晰且反直覺的答案。數據顯示,早期的 Kidokoro 總分系統性地高於 TEA 時期的總分,兩者的平均差異(Mean difference)高達 1.9 分(95% CI: 1.6-2.2)。在探究這個分數落差的來源時,作者發現主要問題出在白質(White matter)子項目,其單一項目的平均差異就佔了 1.68 分(95% CI: 1.46-1.90)。

進一步拆解白質評分細項後,揪出了一個關鍵地雷:「髓鞘化延遲(Myelination delay)」。由於 32 週 PMA 本來就是髓鞘化(例如內囊後肢 PLIC 的 T1 高訊號)尚未完全顯現的階段,如果直接套用 Kidokoro 原始標準,會導致幾乎所有 32 週的嬰兒都在此項目被扣分(判定為異常)。當研究團隊在敏感度分析中將「髓鞘化延遲」這個單一項目從早期評分中剔除後,早期與 TEA 分數的平均差異瞬間縮小到幾乎無統計顯著性的 0.32(95% CI: -0.01 to 0.64)。這個數字對放射科同行有極大的實戰價值:當我們在判讀 32 週的早產兒 MRI 時,必須對「髓鞘化進度」保持寬容,否則將大幅高估整體的腦損傷嚴重度。

Table 2 核心數據:早期與足月等效年齡的 Kidokoro 評分差異

白質項目中的「髓鞘化延遲」是導致早期分數被高估的陷阱

Table 3 與神經發育結果的深度關聯:動作與認知指標的 Beta 係數

究竟早期掃描能不能預測兩年後的發展?Table 3 的多變數迴歸分析揭露了殘酷但重要的真相:早期(32週)與足月(40週)的 Kidokoro GBAS,皆與 24 個月的 Bayley-III 認知與動作分數呈現顯著的負相關,但對語言分數則毫無預測力。在認知分數方面,早期分數的 Beta 值為 -0.67(95% CI: -1.23 to -0.11; Partial $R^2=0.03$),TEA 分數的 Beta 值為 -0.60(95% CI: -1.15 to -0.06; Partial $R^2=0.03$)。這意味著無論在哪個時間點掃描,每增加 1 分的整體腦部異常分數,兩歲時的認知分數就會下降約 0.6 到 0.67 分。

更值得我們關注的是對「動作(Motor)」發展的預測力。模型顯示影像異常對動作指標的打擊更為明顯:早期掃描的 Beta 值高達 -1.04(95% CI: -1.67 to -0.41, Partial $R^2=0.06$),TEA 掃描的 Beta 值更來到 -1.18(95% CI: -1.78 to -0.58, Partial $R^2=0.08$)。這表示 Kidokoro 評分每惡化 1 分,兩歲時的動作分數會掉超過 1 分。此外,在次群組分析中,作者特別點出「白質異常(White matter abnormalities)」是驅動動作分數低落的最核心因素。無論是在 32 週還是 40 週,只要白質子項目得分較差,就能獨立預測較差的動作預後。至於為何語言分數預測失敗?這可能是因為 24 個月大時的語言表現仍高度依賴環境與社經刺激,且單純的白質/灰質容積與訊號改變,不足以反映主導語言的皮質微結構重塑。

Table 3 多變數迴歸分析:Kidokoro 分數與兩歲神經發育關聯
評估時間與發展指標Beta 係數 (每惡化1分的影響)95% 信賴區間局部 R 平方
早期 (32W) - 認知-0.67-1.23 to -0.110.03
足月 (40W) - 認知-0.60-1.15 to -0.060.03
早期 (32W) - 動作-1.04-1.67 to -0.410.06
足月 (40W) - 動作-1.18-1.78 to -0.580.08
動態變化 (分數進步) - 動作+1.020.03 to 2.020.02

影像異常對動作指標的打擊(Beta值)大於認知指標,對語言無顯著預測力

分數軌跡的動態變化與縱向評估的臨床啟示

這篇論文最引人入勝的發現之一,隱藏在針對「分數動態變化」的次分析中。傳統上我們多半依賴單一時間點的橫斷面評估,但作者計算了從早期(32 週)到足月(40 週)之間 GBAS 的變化量(Reduction in GBAS)。多變數模型指出,如果嬰兒從 32 週到 40 週期間,腦部異常分數有顯著的下降(意味著影像表現改善,可能是短暫的水腫消退或神經可塑性的代償),這種「進步」本身就能預測更高的動作分數(Beta=1.02, 95% CI: 0.03 to 2.02, Partial $R^2=0.02$)。

這個發現確立了「縱向追蹤」的價值。當 32 週的 MRI 顯示輕度至中度的異常時,臨床醫師不應立刻給出悲觀的預後判定;相反地,這正是安排 40 週 TEA MRI 的最佳適應症。透過比較兩次掃描的 Kidokoro 評分變化,我們能捕捉到大腦自行修復的動態過程,進而給予家屬更精確、更具個人化的預後諮詢。這也暗示了,對於那些在 32 週掃描無異常的嬰兒,或許可以安全地省下 40 週再次麻醉或鎮靜掃描的醫療資源。

臨床適用邊界與 Kidokoro 系統的早期優化建議

身為資深放射科醫師,在解讀這篇文獻時也必須看清其邊界。作者在 Discussion 中坦承,雖然這是一份中大型世代研究,但仍受限於單一地理區域(澳洲)與 24 個月這個相對早期的追蹤終點。許多輕微的執行功能障礙、特定學習障礙或高階語言問題,往往要到學齡期(5 到 7 歲)才會顯現,目前的結論不能無限上綱到學齡期表現。此外,Partial $R^2$ 值落在 0.03 到 0.08 之間,說明了雖然影像指標在統計上極度顯著(p < 0.05),但 MRI 異常只能解釋約 3% 到 8% 的發展變異,臨床決策仍需綜合考量非影像因素。

在日常讀片實務上,這篇論文提供了非常明確的操作指南:如果您所在的機構已經開始推行 32 週 PMA 的早產兒 MRI 掃描,請務必建立一份「剔除髓鞘化延遲」的 Modified Kidokoro 評分表,並將注意力高度集中在白質的實質損傷(如囊腫性 PVL 或大範圍的點狀白質病變),因為這是預測未來動作發展不良的最強訊號。未來如果能將 32 週與 40 週專屬的常模圖譜整合進 AI 輔助系統,將有望進一步降低主觀評分的觀察者間變異(Inter-observer variability)。

實戰重點:32 週與 40 週的 Kidokoro 分數皆能預測兩歲動作與認知發展,但判讀 32 週 MRI 時務必剔除「髓鞘化延遲」項目,且兩時間點的分數進步幅度是動作預後的重要獨立指標。

Abstract

BACKGROUND AND PURPOSE:Early identification of neurodevelopmental risk in very preterm infants is critical for timely intervention. The Kidokoro MRI scoring system offers a semi-quantitative approach to evaluating brain abnormalities. This study aimed to assess the agreement of Kidokoro scores obtained in the same infants at 32- and 40-weeks postmenstrual age, and their association to cognitive, language, and motor outcomes at 24 months corrected age.MATERIALS AND METHODS:A cohort of 187 very preterm infants (median 28+5weeks gestational age; 55% male) underwent structural MRI at two timepoints: Early (median 32+2weeks) and Term-Equivalent Age (median 40+5weeks), using 3 T scanners. Scans were scored independently using a modified version of the Kidokoro system. Bland&ndash;Altman analysis assessed agreement between Early and term equivalent age scores. Neurodevelopmental outcomes were assessed at 24 months using the Bayley-III. Multivariable linear regression models evaluated the predictive value of MRI scores, adjusting for sex, gestational age, birthweight centile, and socioeconomic status.RESULTS:Early MRI scores were consistently higher than term equivalent age scores (mean difference 1.9; 95%CI: 1.6-2.2), with white matter scores showing the largest discrepancy (mean difference 1.68; 95%CI: 1.46-1.90), primarily due to the "myelination delay" item. Excluding this item reduced the difference to 0.32 (95%CI: &ndash;0.01 to 0.64). Early and TEA Kidokoro global brain abnormality score (GBAS) were negatively associated with Bayley-III cognitive and motor, but not language scores. Higher GBAS were associated with lower cognitive (Early: &beta;= &ndash;0. 67, 95%CI: &ndash;1.23 to &ndash;0.11; Partial R2=0.03; TEA: &beta;= &ndash;0.60 95%CI: &ndash;1.15 to &ndash;0.06, Partial R2=0.03) and motor scores (Early: &beta;= &ndash;1.04, 95%CI: &ndash;1.67 to &ndash;0.41, Partial R2=0.06; TEA: &beta;= &ndash;1.18, 95%CI: &ndash;1.78 to &ndash;0.58, Partial R2=0.08). Reduction in GBAS from Early to TEA correlated with higher motor scores (&beta;=1.02, 95%CI: 0.03 to 2.02, Partial R2=0.02). White matter abnormalities were linked to poorer motor outcomes at both timepoints.CONCLUSIONS:Kidokoro scores at early and term-equivalent timepoints are associated with neurodevelopmental outcomes at 24 months. Global abnormalities and white matter scored at either timepoints, or their longitudinal changes are significantly linked to motor outcomes. Refinement of scoring system for the early assessment may enhance clinical utility. The authors declare no conflicts of interest related to the content of this article.