先天性心臟?。–HD)是全球最常見的出生缺陷類型,由于CHD的高發(fā)病率和高死亡率,在妊娠早期及時發(fā)現(xiàn)CHD是預防和治療的當務之急。診斷越早,預后越好,因此,產(chǎn)前檢測胎兒CHD對于最大限度地降低CHD胎兒的死亡率和改善預后是必要的。
2023年12月,上海交通大學醫(yī)學院趙健元團隊、復旦大學丁琛團隊聯(lián)合婦產(chǎn)科醫(yī)院等研究機構在EMBO Molecular Medicine發(fā)表了題為“Proteome profiling of early gestational plasma reveals novel biomarkers of congenital heart disease”的文章,通過對有或沒有CHD后代的早期妊娠孕婦進行血漿蛋白質組學分析,深入討論并揭示了潛在的致病機制,確定了早期妊娠血漿中預測胎兒先心病的一組生物標志物。
文章題目:Proteome profiling of early gestational plasma reveals novel biomarkers of congenital heart disease
發(fā)表期刊:EMBO Molecular Medicine
影響因子:11.1
發(fā)表時間:2023年12月
樣本選擇:文章選用兩個獨立患者隊列作為樣本來源,其中包括從復旦大學婦產(chǎn)科醫(yī)院招募的138例(包含67例CHD組孕婦(嬰兒后來被診斷為CHD)和71例健康對照組孕婦(嬰兒健康),group1);從中國福利院國際和平婦幼保健院招募的69例(37例CHD組孕婦(嬰兒后來被診斷為CHD)和32例健康對照組孕婦(嬰兒健康),group2),共計104例CHD孕婦組和103例健康對照組孕婦。所有樣本是在懷孕10-12周時采集血漿樣本。
技術手段:DIA蛋白組學、機器學習
文章摘要:
選取兩個隊列分別進行蛋白組學檢測,并評估定量方法的穩(wěn)定性、結果一致性分析;
CHD蛋白共表達網(wǎng)絡的構建與驗證;
建立機器學習模型,挑選9種蛋白作為標志物并進行早篩模型的驗證。
圖1:本研究工作流
基于數(shù)據(jù)獨立獲取(DIA)方法對兩組的所有樣本進行LC–MS/MS分析,并分析所有血漿蛋白質組學數(shù)據(jù)。應用這種穩(wěn)健的工作流程,文章在group1和group2中共鑒定了8624種和7049種蛋白質(圖2C和D),平均量化的分別有2220個、1926個(圖2 B)。隨著樣本數(shù)量的增加,蛋白質數(shù)量逐漸趨于平穩(wěn),表明蛋白質檢測覆蓋范圍廣、穩(wěn)定性好。在所有樣本中,對照組和CHD組的定量蛋白質強度跨越8個數(shù)量級,前10個高豐度蛋白質分別占數(shù)據(jù)集中所有血漿蛋白質豐度的40%和39%(圖2F)。
圖2:血漿的研究概述和蛋白質組學特征
主成分分析(PCA)顯示,兩組病例和對照組之間存在明顯差異,表明在妊娠早期,患有CHD胎兒的孕婦表現(xiàn)出與患有健康胎兒的孕婦不同的血漿蛋白質組學特征(圖3A和C)。第1組顯示對照組和CHD組之間有397種差異表達蛋白(DEP),其中,在CHD組中檢測到184種顯著上調的蛋白質和213種下調的蛋白質(圖3B)。在第2組中,在對照組和CHD組之間鑒定出225個DEP,其中,CHD組有80種蛋白質顯著上調,145種蛋白質顯著下調(圖3D)。為了進一步分析母體血漿中蛋白質改變的情況,文章使用基因本體論(GO)術語分析對兩組中的重要DEP進行了注釋,并確定了受胎兒CHD影響的生物學過程。在兩組中,CHD組中264個顯著上調的蛋白質主要富集在氨基酸代謝、細胞外基質(ECM)受體、肌動蛋白骨架調節(jié)、Ras-MAPK信號通路和PI3K-Akt信號通路中;相反,358種顯著下調的蛋白質與碳水化合物代謝、心肌收縮和心肌病密切相關(圖3E)。此外,為了了解各種上調和下調蛋白質的分子途徑關系,揭示了每個途徑中的關鍵分子,對改變的蛋白質進行了PPI網(wǎng)絡分析(圖3F)。這些結果表明,患有CHD胎兒的孕婦的母體血漿中表達了大量與胚胎器官發(fā)育相關的蛋白質,這與健康胎兒的血漿中表達的蛋白質顯著不同,這些顯著改變的蛋白質可能成為疾病的生物標志物。
圖3:兩組中CHD與對照組血漿蛋白質組的差異
本研究發(fā)現(xiàn)兩個隊列樣本中有8種CHD相關蛋白變化都一致,其中CHD組HSP90AA1、MDH2、MYL9和ACLY的蛋白表達水平高于對照組;CHD組的NSF、TPM1、SERPINE1和CFHR2的蛋白表達水平低于對照組(圖4A)。這些結果表明,母體血漿表達的蛋白質與心臟發(fā)育有關。此外,CHD和對照血漿之間74種蛋白質水平的變化一致。在兩組中,總共有25種蛋白質顯著上調,49種蛋白質顯著下調(圖4B)。文章進一步分析了這74個DEP,發(fā)現(xiàn)25個上調的蛋白質主要參與代謝、先天免疫反應和細胞周期途徑,而49個下調的蛋白質主要涉及葡萄糖代謝、脂質代謝和血管相互作用等過程。這些途徑可能對胎兒心臟發(fā)育至關重要(圖4C和D)。
圖4:兩組患者的血漿蛋白質組改變
為了確定CHD病理的潛在驅動因素,文章使用加權基因共表達網(wǎng)絡分析(WGCNA),選擇了大約2280個蛋白質來生成蛋白質共表達網(wǎng)絡。共表達網(wǎng)絡由10個蛋白質模塊(M1-M10)組成(圖5A)。隨后,對12種臨床病理表型進行分層聚類及功能分析,分為以下三個表型簇:簇1,包括法洛四聯(lián)癥(TOF)、主動脈狹窄(AS)、持續(xù)性動脈干(PTA)、大動脈轉位(TGA)和右心室流出道梗阻(RVOTO),該簇與蛋白質模塊4和8顯著相關,并富含碳水化合物代謝、谷胱甘肽代謝和免疫反應;簇2,包括三尖瓣反流(TR)和房間隔缺損(ASD),該簇與蛋白質模塊9和10顯著相關,并富集ECM受體反應、蛋白質轉運和信號轉導;簇3,包括肺動脈狹窄(PS)、室間隔缺損(VSD)、持續(xù)性左上腔靜脈(PLSVC)、左心室流出道梗阻(LVOTO)和房室間隔缺損(AVSD),該簇與蛋白質模塊2和3顯著相關,主要富集于心肌生長、發(fā)育和肌動蛋白細胞骨架的調節(jié)(圖5B)。為了進一步研究不同集群中影響疾病發(fā)生的潛在因素,也做了PPI網(wǎng)絡的途徑,數(shù)據(jù)揭示了每種途徑中的關鍵分子,如淀粉酶α2A(AMY2A)、免疫球蛋白λ樣多肽5(IGLL5)、MYL9、整合素亞基α1(ITGA1)、RAB6A、RAS癌基因家族成員(RAB6A)和連環(huán)蛋白β1(CTNNB1)(圖5C)。這些關鍵基因可能將CHD與對照組區(qū)分開來。
此外,文章研究了10個蛋白質模塊和18個臨床指標之間的關系,只有三個模塊(M2、M3和M6)與CHD病理表現(xiàn)出強相關性。簇3(M2和M3)與血脂呈正相關,與甲狀腺激素呈正相關。這些結果進一步表明,血脂和甲狀腺激素水平的升高可能是CHD的危險因素(圖5D)。文章比較了對照組和不同CHD組妊娠早期婦女血漿中七種脂質的濃度,發(fā)現(xiàn)脂質也CHD病的主要危險因素,表明血脂波動可能與冠心病的發(fā)生有關。
接下來研究團隊采用xCell根據(jù)蛋白質組數(shù)據(jù)生成細胞型免疫富集評分,鑒定了與免疫(CD4 T細胞和NK細胞)或基質(脂肪細胞和內皮細胞)特征相關的21種不同細胞類型,發(fā)現(xiàn)CHD的發(fā)生伴隨著血脂、脂肪細胞和CD4T細胞的增加以及內皮細胞、肌細胞和周細胞的減少,這可能會進一步損害心臟發(fā)育。
圖5:CHD血漿蛋白質組與臨床表型及指標的關系
選取group1中的9種蛋白(鈣蛋白酶-5(CAPN5)、烯醇化酶磷酸酶E1(ENOPH1)、組蛋白H2A 1-C型(H2AC6)、HSP90AA1、導入蛋白亞基β-1(KPNB1)、MDH2、MYL9、radixin(RDX)和SAMHD1)的組合建立了機器學習模型,該模型在訓練集中AUC為0.964(圖6A)。用group1中的其余數(shù)據(jù)用于測試數(shù)據(jù)集,其AUC值達到0.989(圖6D);用group2的樣本進行驗證,AUC值為0.963(圖6G)。這些生物標志物組合的混淆矩陣和主成分分析的結果在對照組和冠心病組的分類中顯示出相對較高的準確性(圖6B,C,E,F(xiàn),H和I),進一步說明了該分類器的可靠性。
圖6:利用機器學習開發(fā)生物標志物組合來預測CHD
文章對妊娠期間的血漿樣本進行蛋白組學分析,通過機器學習算法,鑒定并驗證了一種包含九種蛋白質的生物標志物組合,這些蛋白質可以作為母體檢測胎兒CHD的新型非侵入性生物標志物。孕婦只需在妊娠早期提供2uL血漿進行檢查即可獲知后代發(fā)生CHD的風險,更有助于醫(yī)療資源的科學合理配制。此外,這項工作為更深入地了解CHD的病因,進而制定更好的治療策略提供了極具價值的蛋白質組學資源。
@2024北京青蓮百奧生物科技有限公司 京ICP備17052224號