脊髓損傷作為一種罕見的神經(jīng)系統(tǒng)疾病,其低發(fā)病率和高度異質(zhì)性使得開展隨機(jī)對(duì)照試驗(yàn)面臨重重挑戰(zhàn)。當(dāng)前尚無有效藥物治療方案能夠修復(fù)受損脊髓,導(dǎo)致患者長(zhǎng)期生活質(zhì)量嚴(yán)重受損。
為解決臨床試驗(yàn)中患者招募困難和小樣本量的問題,研究者提出合成對(duì)照這一創(chuàng)新概念,即利用數(shù)據(jù)驅(qū)動(dòng)模型預(yù)測(cè)患者在標(biāo)準(zhǔn)治療下的神經(jīng)功能恢復(fù)情況。作為單臂試驗(yàn)中的虛擬對(duì)照,從而避免隨機(jī)分組并最大化接受實(shí)驗(yàn)性治療的患者比例。
歐洲藥品管理局近年已明確認(rèn)可單臂試驗(yàn)在罕見病中的適用性,但合成對(duì)照的實(shí)際效果仍需系統(tǒng)驗(yàn)證。本研究旨在通過脊髓損傷這一典型罕見病,全面評(píng)估合成對(duì)照在臨床試驗(yàn)中的可行性,重點(diǎn)探索不同機(jī)器學(xué)習(xí)模型在預(yù)測(cè)神經(jīng)恢復(fù)方面的性能,并通過模擬試驗(yàn)和真實(shí)世界案例驗(yàn)證其在減少隊(duì)列異質(zhì)性和降低樣本量方面的潛力。

排除標(biāo)準(zhǔn)包括神經(jīng)功能惡化、骶段以下?lián)p傷或 AIS E 級(jí)患者,以確保數(shù)據(jù)反映典型恢復(fù)軌跡。研究比較六種預(yù)測(cè)模型,包括線性回歸、隨機(jī)森林、極端梯度提升樹三種傳統(tǒng)方法,以及卷積神經(jīng)網(wǎng)絡(luò)、序列到序列變換器和圖神經(jīng)網(wǎng)絡(luò)三種深度學(xué)習(xí)架構(gòu),這些模型專注于預(yù)測(cè)所有節(jié)段運(yùn)動(dòng)評(píng)分的完整序列,而非傳統(tǒng)聚合指標(biāo),以更精細(xì)地捕捉恢復(fù)動(dòng)態(tài)。
模型訓(xùn)練采用五折交叉驗(yàn)證,性能通過低于初始神經(jīng)損傷水平的均方根誤差進(jìn)行量化,該指標(biāo)消除了損傷水平對(duì)誤差比較的影響,同時(shí)利用 SHapley 加性解釋方法分析特征重要性,以揭示各變量對(duì)特定肌節(jié)恢復(fù)預(yù)測(cè)的貢獻(xiàn)程度。
為驗(yàn)證合成對(duì)照的實(shí)用性,研究設(shè)計(jì)了一套試驗(yàn)?zāi)M框架,在無治療干預(yù)前提下隨機(jī)分配患者至對(duì)照組和零治療組,后者通過嚴(yán)格匹配年齡、性別、損傷水平和嚴(yán)重程度等基線特征模擬自然恢復(fù),合成對(duì)照通過將零治療組基線數(shù)據(jù)輸入最佳預(yù)測(cè)模型生成。
結(jié)局指標(biāo)為下肢運(yùn)動(dòng)評(píng)分從基線到隨訪的改善值,模擬重復(fù) 500 次以涵蓋隨機(jī)化過程的變異性。此外,研究還以近期完成的 Nogo 抑制在脊髓損傷試驗(yàn)為案例,比較合成對(duì)照與真實(shí)安慰劑組在上肢運(yùn)動(dòng)評(píng)分改善方面的差異,并進(jìn)行樣本量計(jì)算以評(píng)估單臂試驗(yàn)相對(duì)于隨機(jī)對(duì)照試驗(yàn)的效率優(yōu)勢(shì)。

模型基準(zhǔn)測(cè)試結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)節(jié)段運(yùn)動(dòng)評(píng)分序列方面表現(xiàn)最優(yōu),其在 EMSCI 數(shù)據(jù)集上的中位低于神經(jīng)損傷水平均方根誤差為 0.55,在 Sygen 外部驗(yàn)證集上同樣保持領(lǐng)先。其他模型中隨機(jī)森林和極端梯度提升樹的中位誤差分別為 0.61。
而圖神經(jīng)網(wǎng)絡(luò)和變換器表現(xiàn)稍遜,深度學(xué)習(xí)模型普遍優(yōu)于線性與樹模型,尤其在捕捉序列依賴性方面展現(xiàn)優(yōu)勢(shì)。代表性患者預(yù)測(cè)示例顯示,卷積神經(jīng)網(wǎng)絡(luò)能夠準(zhǔn)確反映不同嚴(yán)重程度患者的恢復(fù)曲線,且預(yù)測(cè)不確定性隨評(píng)估時(shí)間延后而降低。
特征重要性分析揭示初始評(píng)估時(shí)間、近端運(yùn)動(dòng)評(píng)分、年齡、美國(guó)脊髓損傷協(xié)會(huì)損害量表分級(jí)和神經(jīng)損傷水平是關(guān)鍵預(yù)測(cè)因子。另外,運(yùn)動(dòng)評(píng)分的重要性隨其與目標(biāo)肌節(jié)距離的減小而增加,尾側(cè)評(píng)分的影響顯著高于頭側(cè),而感覺評(píng)分重要性相對(duì)較低。
試驗(yàn)?zāi)M結(jié)果顯示,在 200 人隊(duì)列的典型示例中,隨機(jī)對(duì)照組與零治療組的下肢運(yùn)動(dòng)評(píng)分改善均值為 3.6 點(diǎn),反映出單純隨機(jī)化導(dǎo)致的組間差異。500 次重復(fù)模擬中,隨機(jī)對(duì)照的組間改善差異分布范圍較寬,95 百分位達(dá) 2.40,而基于卷積神經(jīng)網(wǎng)絡(luò)的合成對(duì)照分布更集中,中位差異為 0.16,95 百分位為 1.56,表明其能有效降低變異性。
在不同隊(duì)列規(guī)模、美國(guó)脊髓損傷協(xié)會(huì)損害量表分級(jí)組成和損傷類型下,合成對(duì)照的 95 百分位組間差異均低于隨機(jī)對(duì)照,證明其在不同臨床場(chǎng)景中的穩(wěn)定性。NISCI 案例研究中,合成對(duì)照與真實(shí)安慰劑組的上肢運(yùn)動(dòng)評(píng)分改善無顯著差異,合成對(duì)照組中位改善值為 13.42,安慰劑組為 12.67,樣本量計(jì)算顯示,為檢測(cè) 5 點(diǎn)治療效應(yīng),單臂試驗(yàn)僅需 44 名患者,而隨機(jī)對(duì)照試驗(yàn)需要 122 名患者,這一結(jié)果在不同參數(shù)估計(jì)下保持穩(wěn)健,突顯了合成對(duì)照在提升試驗(yàn)效率方面的巨大潛力。

本研究首次在脊髓損傷領(lǐng)域系統(tǒng)驗(yàn)證了合成對(duì)照的實(shí)用價(jià)值,通過全面比較六類預(yù)測(cè)模型,明確卷積神經(jīng)網(wǎng)絡(luò)在捕捉節(jié)段運(yùn)動(dòng)恢復(fù)序列方面的優(yōu)勢(shì),其特征重要性分析不僅深化了對(duì)恢復(fù)機(jī)制的理解,還為模型可解釋性提供支撐。
試驗(yàn)?zāi)M證實(shí)合成對(duì)照能有效控制組間變異,降低隨機(jī)化帶來的不確定性。案例研究進(jìn)一步表明合成對(duì)照可與真實(shí)安慰劑組等效,且能大幅減少所需樣本量。盡管合成對(duì)照未考慮安慰劑效應(yīng)、治療管理變化等混淆因素,但其在提高罕見病試驗(yàn)可行性方面展現(xiàn)顯著優(yōu)勢(shì)。未來通過混合設(shè)計(jì)結(jié)合小規(guī)模實(shí)時(shí)對(duì)照組,可進(jìn)一步驗(yàn)證合成對(duì)照的可靠性,同時(shí)整合影像學(xué)、組學(xué)等多模態(tài)數(shù)據(jù)將提升預(yù)測(cè)精度。總體而言,合成對(duì)照為罕見病臨床研究提供了創(chuàng)新工具,有望加速有效療法的開發(fā)與轉(zhuǎn)化。
參考資料:
[ 1 ] Lukas, L.P., H kansson, S., Tuci, M. et al. Exploring synthetic controls in rare diseases with a proof of concept in spinal cord injury. BMC Med 23, 581 ( 2025 ) . https://doi.org/10.1186/s12916-025-04405-3
撰文 | 梅斯醫(yī)學(xué)
編輯 | 木白
●
●
●
點(diǎn)擊下方「閱讀原文」立刻下載梅斯醫(yī)學(xué) APP!