亚洲五月天综合,heyzo无码综合国产精品,亚洲色偷偷色噜噜狠狠99网,国产欧美精品一区二区三区四区

您好,歡迎來到青蓮百奧!

青蓮干貨 | 一文詳解基于機(jī)器學(xué)習(xí)的蛋白質(zhì)預(yù)后生物標(biāo)志物篩選

臨床預(yù)后評估在醫(yī)學(xué)研究與臨床實(shí)踐中占據(jù)舉足輕重的地位。預(yù)后生物標(biāo)志物指在特定人群中表明未來臨床事件(如疾病發(fā)生、進(jìn)展等)發(fā)生的可能性的生化指標(biāo),對患者的治療方案選擇、疾病進(jìn)程管理、治療效果評估起到至關(guān)重要的作用。利用臨床隊(duì)列樣本數(shù)據(jù)與患者信息尋找有價值的預(yù)后生物標(biāo)志物,尤其是基于蛋白質(zhì)組數(shù)據(jù)進(jìn)行標(biāo)志物發(fā)現(xiàn),一直是疾病研究的一大熱點(diǎn)。

疾病生物標(biāo)志物還有哪些類型?為什么選擇蛋白質(zhì)組?樣本類型如何選擇?數(shù)據(jù)預(yù)處理包括哪些內(nèi)容?點(diǎn)擊這里帶您回顧~【>>>點(diǎn)擊回顧疾病生物標(biāo)志物干貨】

下面就讓我們一起來看看基于機(jī)器學(xué)習(xí)的預(yù)后生物標(biāo)志物篩選是如何實(shí)現(xiàn)的吧~

 c75fbf6a-5e26-407f-bc77-3991a1920af6_1726727455832788592_origin~tplv-a9rns2rl98-image_副本.png


報名——患者信息收集

預(yù)后生物標(biāo)志物的發(fā)現(xiàn)需要以患者樣本(不區(qū)分組別,一般為疾病組織或血液)及患者預(yù)后信息(生存時間、復(fù)發(fā)時間等)為基礎(chǔ),因此除了患者樣本的收集,還要密切關(guān)注對患者的隨訪,收集患者的預(yù)后信息,并確保入組患者的預(yù)后存在一定差異。

此外,影響患者預(yù)后的因素眾多,包括疾病分期、腫瘤大小等疾病因素,治療方案、治療時間等治療因素,性別、年齡、體重等生物學(xué)因素,以及抽煙、飲酒、職業(yè)暴露等環(huán)境因素。這些因素都將對預(yù)后標(biāo)志物的篩選產(chǎn)生干擾,因而應(yīng)盡量在患者信息收集時同步收集,并在預(yù)后標(biāo)志物篩選過程中考慮將臨床信息納入為區(qū)分患者預(yù)后的風(fēng)險因素。


賽程——預(yù)后生物標(biāo)志物篩選流程總覽

圖片8.png 

預(yù)選賽——Cox回歸初步篩選預(yù)后相關(guān)蛋白質(zhì)

Cox比例風(fēng)險模型是一種用于分析單個或多個因素(如蛋白質(zhì)表達(dá)水平、年齡、性別、疾病階段等)如何影響一個事件(如疾病的復(fù)發(fā)、患者的死亡等)發(fā)生的時間的半?yún)?shù)模型,又稱Cox回歸。由于該模型能夠同時考慮多個因素,尤其適用于醫(yī)學(xué)研究面臨的復(fù)雜場景。具體而言,Cox模型專注于分析事件發(fā)生時間的風(fēng)險比例,能夠衡量在任一特定時刻發(fā)生某事件的可能性與在其它時刻該事件的可能性相比是如何變化的。

預(yù)后生物標(biāo)志物篩選的第一步,便是使用經(jīng)過預(yù)處理的患者樣本蛋白質(zhì)組學(xué)數(shù)據(jù)與對應(yīng)的患者生存信息建立單因素Cox風(fēng)險比例模型,一般以P-value<0.01為條件篩選出表達(dá)水平與患者預(yù)后相關(guān)的蛋白質(zhì)。


淘汰賽——LASSO回歸篩選潛在預(yù)后生物標(biāo)志物

LASSO回歸模型是一種線性回歸的改進(jìn)算法,該算法在普通線性回歸的基礎(chǔ)上添加了一個懲罰項(xiàng)——L1懲罰,從而實(shí)現(xiàn)對模型有重要影響的變量的選擇。具體而言,L1懲罰能夠逐步縮小對結(jié)果影響較小的因素的權(quán)重,直至權(quán)重為零時即將該因素剔除,最終目標(biāo)是最小化損失函數(shù)和L1范數(shù)(參數(shù)向量中各個參數(shù)絕對值之和)的組合,從而減少不必要的復(fù)雜性,更清晰地識別出對預(yù)后預(yù)測真正重要的關(guān)鍵因素,簡化模型并提高預(yù)測準(zhǔn)確性。

 圖片9.png

LASSO回歸中Coef隨Log(λ)變化曲線圖

隨著收縮算子λ(橫坐標(biāo))的增大,各個協(xié)變量(風(fēng)險因素)的回歸系數(shù)coef(縱坐標(biāo))逐漸趨向于0。有的變量迅速到0,表明此變量對模型貢獻(xiàn)較??;有的變量直到最后才趨于0,表明此變量對模型貢獻(xiàn)較大。

預(yù)后生物標(biāo)志物篩選的第二步,便是使用Cox回歸篩選出的預(yù)后相關(guān)蛋白建立LASSO回歸模型,并采用十折交叉驗(yàn)證,即將患者樣本數(shù)據(jù)集分成十個部分,每次使用其中九部分訓(xùn)練模型,剩下的一部分測試模型,重復(fù)十次,從而評估模型在未知數(shù)據(jù)上的表現(xiàn)。通過反復(fù)的訓(xùn)練與淘汰,最終篩選出最優(yōu)的預(yù)后生物標(biāo)志物組合。

圖片10.png

十折交叉驗(yàn)證中MSE隨Log(λ)變化曲線圖

通過十折交叉驗(yàn)證計算出的均方誤差(MSE)選擇最佳的收縮算子λ(橫坐標(biāo))值。MSE越小代表模型性能越好,紅色虛線為均方誤差最小時對應(yīng)的λ值,該λ值對應(yīng)的LASSO回歸中回歸系數(shù)coef不為0的蛋白質(zhì)(參見上一張圖)即為最終預(yù)后生物標(biāo)志物組合蛋白。

預(yù)后生物標(biāo)志物組合中包含的蛋白質(zhì)一般不多于20個。如果組合中包含的蛋白質(zhì)數(shù)量高于預(yù)期,還可根據(jù)蛋白質(zhì)的生物學(xué)意義等背景知識對標(biāo)志物進(jìn)行進(jìn)一步篩選,但需注意手動篩選后的標(biāo)志物組合可能在預(yù)測性能上低于理論計算出的最優(yōu)組合。


頒獎——風(fēng)險預(yù)測模型構(gòu)建與性能展示

使用最終的預(yù)后生物標(biāo)志物組合建立風(fēng)險預(yù)測模型,對于每個患者,風(fēng)險評分(Risk score)的計算公式如下:

文字文稿4_01(1).png

公式中,coef對應(yīng)LASSO回歸中Coef列的值,Protein對應(yīng)蛋白質(zhì)的表達(dá)量。

以所有患者風(fēng)險評分的中位數(shù)作為閾值,將患者劃分為高風(fēng)險與低風(fēng)險兩組,通過Log-rank檢驗(yàn)驗(yàn)證潛在預(yù)后生物標(biāo)志物組合對樣本預(yù)后風(fēng)險的劃分能力,并繪制生存曲線。

圖片11.png

生存曲線:橫坐標(biāo)為生存時間,縱坐標(biāo)為生存率。

在最后的模型構(gòu)建中,也可納入有預(yù)后意義的臨床風(fēng)險因素(如疾病分期、性別、年齡等)與蛋白質(zhì)預(yù)后生物預(yù)后標(biāo)志物共同構(gòu)建模型,并進(jìn)行模型性能評估,實(shí)現(xiàn)與臨床信息的關(guān)聯(lián)。

22.png

通過以上流程,能夠?qū)崿F(xiàn)可靠的預(yù)后生物標(biāo)志物篩選。

此外,青蓮百奧針對隊(duì)列樣本研究瓶頸,還獨(dú)家推出疾病生物標(biāo)志物篩選、分子分型高級分析報告。步驟雖繁必不敢省人工,試劑雖貴必不敢減物力,疾病生物標(biāo)志物解決方案已于昨天與大家見面,之后的推送也將為大家詳細(xì)解讀分子分型解決方案,敬請期待~

 圖片13.png


@2024北京青蓮百奧生物科技有限公司 京ICP備17052224號

留言
您好,現(xiàn)在客服不在線,請留言。
如果沒有留下您的聯(lián)系方式,客服將無法和您聯(lián)系!
留下以下信息,方便與您及時聯(lián)系