異質(zhì)性是惡性腫瘤等疾病的重要特征,是精準(zhǔn)醫(yī)學(xué)需破解的難題。疾病異質(zhì)性可表現(xiàn)為不同的病理類型以及不同的基因突變譜、轉(zhuǎn)錄組表達(dá)譜和蛋白質(zhì)組表達(dá)譜等,是惡性腫瘤等疾病發(fā)生發(fā)展領(lǐng)域長期關(guān)注的科學(xué)問題。
異質(zhì)性的存在使得對疾病進(jìn)行分型成為精確醫(yī)學(xué)的關(guān)鍵步驟。疾病分型的傳統(tǒng)方法基于形態(tài)學(xué)特征,依賴對病理切片的觀察與分析。隨著分子檢測技術(shù)的不斷成熟,基于分子特征的疾病分型方法受到廣泛關(guān)注。二十世紀(jì)末美國國立癌癥研究所首次提出了腫瘤分子分型的概念。研究人員利用組學(xué)技術(shù)深入剖析疾病分子水平的異質(zhì)性,從而指導(dǎo)疾病的精準(zhǔn)診斷與治療。
目前基因分型已實現(xiàn)臨床轉(zhuǎn)化,然而尚無真正意義的基因治療藥物,且基于基因檢測的靶向治療藥物的受益人群占比極低。2021年發(fā)表于Cell 期刊的觀點文章[1]指出了在精準(zhǔn)腫瘤學(xué)領(lǐng)域基因組學(xué)的局限性與蛋白質(zhì)組學(xué)的重要作用。相較而言,蛋白質(zhì)組學(xué)更接近表型,且基于蛋白質(zhì)組學(xué)的靶向治療能夠?qū)崿F(xiàn)精準(zhǔn)施策。
利用蛋白質(zhì)組數(shù)據(jù)將疾病樣本劃分多個亞型,剖析不同亞型蛋白質(zhì)水平的異質(zhì)性,有助于理解疾病的發(fā)生機(jī)制,從而指導(dǎo)針對不同亞型的精準(zhǔn)治療。下面就讓我們一起來看看基于蛋白質(zhì)組學(xué)的疾病分子分型研究是如何實現(xiàn)的吧~
基于蛋白質(zhì)組學(xué)的疾病分子分型研究總覽[2]
收集合適的樣本對于基于蛋白質(zhì)組學(xué)的疾病分子分型研究的科學(xué)性至關(guān)重要,文章中常見的樣本為臨床組織樣本或體液樣本。
臨床組織樣本是疾病分子分型研究中樣本收集的經(jīng)典選擇。這種樣本選擇策略能夠更好地保證生物學(xué)意義,為相應(yīng)疾病提供寶貴的數(shù)據(jù)資源,獲得更準(zhǔn)確的分子分型結(jié)果。2024年發(fā)表于Cell 期刊的文章[2]以小細(xì)胞肺癌為研究對象,收集了來自臨床隊列的腫瘤組織和配對癌旁組織,基于組學(xué)數(shù)據(jù)將小細(xì)胞肺癌分為四個亞型,系統(tǒng)表征各亞型獨(dú)特的分子特征并提出潛在治療策略。
臨床體液樣本也可作為疾病分子分型研究中的樣本選擇。2023年發(fā)表于Arthritis Rheumatol期刊的文章[3]以白塞病為研究對象,收集了來自臨床隊列的血漿樣本,基于組學(xué)數(shù)據(jù)將白塞病分為三個亞型,推動了個體化治療策略建立。
作為國內(nèi)領(lǐng)先的蛋白質(zhì)組學(xué)平臺,青蓮百奧針對疾病分子分型研究開發(fā)了完整解決方案,下面就來看看基于蛋白質(zhì)組學(xué)數(shù)據(jù)的疾病分子分型解決方案是怎么實現(xiàn)的吧~
數(shù)據(jù)預(yù)處理
數(shù)據(jù)分析前需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,對數(shù)據(jù)依次進(jìn)行樣本剔除、蛋白剔以及缺失值填補(bǔ),處理方法和標(biāo)準(zhǔn)如下:
樣本剔除:剔除鑒定到的蛋白個數(shù)小于100個的樣本。
蛋白剔除:剔除在50%的樣本中存在缺失值的蛋白。
缺失值填補(bǔ):缺失值采用全局最小值進(jìn)行填補(bǔ)。
特征選擇
預(yù)處理后的蛋白表達(dá)矩陣,首先進(jìn)行分型分子特征篩選。常見的特征篩選指標(biāo)包括基于變異系數(shù)(CV)、絕對中位差(MAD)、標(biāo)準(zhǔn)差(SD),篩選在不同樣本間存在差異的特征。
分子分型
蛋白表達(dá)矩陣篩選分子特征后,采用非負(fù)矩陣分解(Non-Negative Matrix Factorization,NMF)算法進(jìn)行分子分型。NMF是一種無監(jiān)督學(xué)習(xí)技術(shù),相較于傳統(tǒng)層次聚類更準(zhǔn)確。通過NMF聚類,可以發(fā)現(xiàn)差異蛋白矩陣中存在的亞組結(jié)構(gòu),并了解不同亞組之間的差異。
Cophenetic值是一種衡量聚類質(zhì)量的指標(biāo),用于評估聚類算法產(chǎn)生的聚類結(jié)果與原始數(shù)據(jù)之間的相似程度,顯示了聚類的擬合優(yōu)度。
分子分型結(jié)果熱圖:根據(jù)Cophenetic值判斷最佳聚類個數(shù)K,選取Cophenetic值變化的最大變動的前點為最佳聚類個數(shù),繪制聚類熱圖,并計算輪廓(Silhouette)系數(shù)來評估聚類的好壞。
分子分型結(jié)果評估:Silhouette準(zhǔn)則是一種用于聚類分析中的評價方法。Silhouette系數(shù)的取值范圍在–1到1之間,其中負(fù)值表示數(shù)據(jù)點更容易被分類到錯誤的簇中,而正值則表示數(shù)據(jù)點更容易被正確分類。因此,Silhouette準(zhǔn)則的目標(biāo)是最大化Silhouette系數(shù)的平均值,從而找到最佳的聚類數(shù)量。
亞型分子特征
得到分子分型結(jié)果后,通過整合分型結(jié)果與臨床指標(biāo)的關(guān)聯(lián),實現(xiàn)對分子分型結(jié)果進(jìn)行臨床解釋。通過分析亞型特征和功能分析,可以實現(xiàn)針對不同亞型的精準(zhǔn)化治療方案制定。
亞型差異蛋白熱圖:根據(jù)分型結(jié)果篩選各亞型間具有顯著差異表達(dá)的蛋白(篩選條件:Mann Whitney U-test P-value<0.05且 |Log2(Fold-Change)| >1),聯(lián)合臨床指標(biāo)繪制熱圖。
亞型差異蛋白富集分析:對不同亞型間具有顯著差異表達(dá)的蛋白進(jìn)行KEGG富集分析,探究不同亞型的分子功能。
亞型預(yù)后分析:若有臨床預(yù)后信息,則可根據(jù)分子分型結(jié)果,進(jìn)行Log-rank檢驗,繪制生存曲線,比較組間生存差異。
臨床信息與亞型關(guān)聯(lián)的預(yù)后分析:根據(jù)分子分型結(jié)果以及臨床信息,進(jìn)行多因素Cox回歸分析,并以森林圖的形式進(jìn)行可視化。
通過以上流程,能夠?qū)崿F(xiàn)可靠的基于蛋白質(zhì)組學(xué)的疾病分子分型研究。此外,青蓮百奧針對隊列樣本研究瓶頸,還獨(dú)家推出疾病生物標(biāo)志物篩選、預(yù)后標(biāo)志物篩選高級分析報告。步驟雖繁必不敢省人工,試劑雖貴必不敢減物力,疾病生物標(biāo)志物篩選、預(yù)后標(biāo)志物篩選解決方案已在過去兩天與大家見面,之后的推送也將為大家?guī)砀嗟母韶浗庾x,敬請期待~
@2024北京青蓮百奧生物科技有限公司 京ICP備17052224號