ACTIVITIES学习

创新创业平台

11--肿瘤干细胞指数结合免疫发6分+SCI

大家好!今天给大家介绍一篇2022年1月发表在International Journal of Biological Sciences(IF:6.58)上的文章。作者对TCGA-LIHC数据集进行全面分析基于HCC患者的干细胞指数将患者分为两种干性亚型并使用机器学习算法构建干性亚型分类器,可以用于指导HCC患者的预后和免疫治疗反应。

Integrated Machine Learning and Bioinformatic Analyses Constructed a Novel Stemness-Related Classifier to Predict Prognosis and Immunotherapy Responses for Hepatocellular Carcinoma Patients

整合机器学习和生物信息分析构建干细胞分类器用于预测肝细胞癌患者的预后和免疫治疗反应

01

摘要

免疫治疗在治疗肝细胞癌(HCC)中取得了很大的进展,然而目前仍然缺乏预测肝细胞癌预后的标志物。肿瘤干细胞(CSCs)在HCC发生,转移和耐药等方面发挥作用。本研究旨在提出一种新的基于肝细胞癌的CSC相关的模型预测患者预后和免疫治疗反应。对TCGA和PCBC的转录组数据进行OCLR算法计算HCC患者的干细胞指数(mRNAsi)。根据无监督一致性聚类将患者分为两种干性亚型,并研究两种亚型的免疫微环境(TIME)状态,免疫基因组表达水平和对新辅助治疗的敏感性。最后,作者应用LASSO,RF,SVM-REF和XGBoost构建一个基于5个基因的分类器,可以预测患者的干性亚型。基于这个干性分类器可以预测患者的预后并指导临床免疫治疗。

02

流程图

03

结果

1.数据集的获取和下载

从TCGA,ICGC和PCBC数据库获取肝细胞癌患者的转录组数据。TCGA数据集包括365个样本,ICGC数据集包括231个样本。

2. HCC患者mRNAsi和临床病理特征的相关性

基于OCLR算法计算TCGA-LIHC数据集的mRNAsi,根据mRNAsi对患者进行排序并研究mRNAsi与临床病理特征的相关性(图1A)。生存状态为”Deceased”(图1D),发生血管侵袭(图1K)和AFP≥300ng/mL(图1J)的患者mRNAsi较高。临床分期为Ⅱ期的患者mRNAsi较高(图1F)。体细胞突变如图1B所示,TMB较高的患者mRNAsi较高(图1L),发生TP53突变(图1M),CTNNB1突变(图1N)和AXIN1突变(图1O)的患者mRNAsi较高。

图1 mRNAsi与临床病理特征的相关性

3. mRNAsi与TIME模式的相关性

对TCGA-LIHC数据集进行ssGSEA分析并进行非监督一致性聚类,共分为3个免疫亚型。高免疫组富集了29个免疫特征,占TCGA-LIHC数据集的15.9%,中等免疫亚型和低免疫亚型分别占23.8%和60.3%(图2A)。三个免疫亚型分别定义为”hot tumors”,”altered tumors”和”cold tumors”。随后作者进行ESTIMATE和CIBERSORT分析。mRNAsi与基质打分,免疫打分和ESTIMATE打分负相关(图2B)。三个亚型与mRNAsi的相关性如图2C所示。免疫细胞浸润水平如图2D所示,三个亚型的免疫细胞浸润水平具有显著差异(图2D)。

图2 mRNAsi与TIME的相关性

4.基于mRNAsi鉴定干性亚型

作者根据mRNAsi中位数将TCGA-LIHC分为miRNAsi -高和miRNAsi -低两组并进行KM分析。miRNAsi -高的患者OS较差(图3A)。作者对miRNAsi -高组和miRNA-si低组进行差异分析鉴定到100个DEGs(图3B)。GO和KEGG富集分析表明DEGs富集在TME相关通路(图3C)。突变分析表明有19个DEGs的突变频率大于1%(图3D)。使用非监督一致性聚类构建干性分类器。如图3E和3F所示,患者共分为2个亚型,分别为干性亚型1(57.26%)和干性亚型2(42.74%)。KM分析表明亚型2的预后较差(图3G)。

图3构建干性亚型

5.干性亚型的功能注释,临床病理特征和CNV /突变分析

GSVA分析表明亚型1和亚型2有28条通路差异富集,涉及到细胞循环,DNA修复,EMT,ECM和免疫相关通路(图4A)。两个亚型的临床病理特征分析表明亚型2的患者年龄较高,女性较多且OS状态大多为”Deceased”,miRNAsi较高。CNV和突变分析表明,2个亚型的拷贝数扩增或缺失频率没有显著差异(图4C)。体细胞突变分析表明亚型1的TMB较高,CTNNB1和TP53的突变频率具有显著差异(图4D)。不同亚型的突变频率瀑布图如图4E所示。

图4不同亚型的功能注释,临床病理特征和CNV和TMB分析

6.不同亚型的TIME状态,免疫基因组学特征和靶向治疗敏感性分析

作者对不同干性亚型进行ESTIMATE和CIBERSORT。亚型2的基质打分,免疫打分,ESTIMATE打分和肿瘤纯度较低(图5A),表明亚型2是免疫抑制微环境且基质细胞丰度较低。CIBERSORT结果表明亚型2的免疫细胞浸润水平受到抑制(图5B)。亚型1包含大部分高免疫HCC,亚型2包含大部分低免疫HCC(图5C)。如图5D-5I所示,PD1/PD-L1/PD-L2和CTLA-4/CD80/CD86在亚型1中的表达水平较高。

随后,作者分析不同干性亚型是否对靶向治疗敏感性有差异。图5J表明不同干性亚型的敏感性不同。使用CMap数据库鉴定新的潜在化合物靶点。19个DEGs富集在25条信号通路上(图5K)。

图5不同干性亚型的TIME状态,免疫基因组模式和对靶向治疗的敏感性

7.基于机器学习方法构建和验证干性亚型分类器

根据相关性大于0.75保留了56个DEGs,使用这56个DEGs构建HCC患者的干性亚型分类器。将TCGA-LIHC数据集分为训练集和测试集(7:3)。对训练集进行4个机器学习分析,LASSO,SVM-RFE,RF和XGBoost分别筛选到36,15,35和31个DEGs(图6A)。取交集共得到5个DEGs,分别为DPT,AFP,GPM6A,ITGBL1和SRPX(图6B)。使用多因素回归构建模型。干性亚型分类器为- 2.1731DPT+1.1469AFP-1.5054* GPM6A-0.9799ITGBL1-2.4713SRPX。根据阈值0.8322107将患者分为干性亚型1和干性亚型2(图6C)。ROC曲线如图6D所示。使用ICGC-LIHC数据集验证分类器,有126例样本为亚型1,105例样本为亚型2(图6E)。KM分析结果表明亚型2的OS较差。

图6构建和验证干性亚型分类器

04

结论

总的来说,本研究为CSCs在HCC患者肿瘤微环境中免疫浸润状态的调控和免疫治疗反应中发挥重要作用提供了有价值的信息。作者构建了HCC干性亚型分类器,可以用于指导CSCs和TME之间的研究机制和鉴定免疫治疗敏感型患者。本研究的亮点在于作者使用机器学习算法筛选干性相关特征并构建干性亚型分类器,然而还需要更多的数据集对本研究结果进行验证。

转载自公众号《生信发文助手》,如有侵权,请联系删除。



关注微信

获取电子资讯

版权所有©山西医科大学 2022

| 忘记密码
注册说明

您好!感谢您关注清华x-lab创意创新创业教育平台。

在填写之前,请确认您项目的核心团队至少有一名成员是清华的在校生、校友及教师