大家好!今天给大家介绍一篇2021年11月发表在Molecular Therapy Nucleic Acids(IF:8.886)上的文章。作者对肝细胞癌的免疫相关lncRNA进行分析,通过单因素Cox,LASSO和多因素Cox构建9-IR-lncRNA特征。此外,作者基于这9个IR-lncRNA构建ceRNA调控网络并鉴定到与肝细胞癌复发有关的关键基因。
Construction of an HCC recurrence model based on the investigation of immune-related lncRNAs and related mechanisms
构建基于免疫相关lncRNA及其相关机制的HCC复发模型
01
摘要
lncRNA作为基因表达的关键调控因子,在免疫调控中发挥着重要作用。越来越多的证据表明,免疫相关基因和lncRNA可以作为预测癌症预后的标志物,包括肝细胞癌(HCC)。本研究旨在对免疫相关lncRNA(IR-lncRNA)进行分析预测HCC的早期复发。本研究将319例HCC患者随机分为训练组和测试组。对训练组进行单因素,LASSO和多因素Cox回归分析鉴定与无病生存期密切相关的9-IR-lncRNA特征。使用KM,PCA,富集分析和列线图对风险模型进行评估并使用测试集进行验证。此外,作者构建一个ceRNA调控网络。本研究结果表明,该9-IR-lncRNA特征可以预测肝癌患者的结局并指导个体化治疗。这些IR-lncRNA和调控基因可能是与HCC预后有关的潜在生物标志物。
02
流程图

03
结果
1.数据集的获取和下载
从TCGA数据库获取HCC的RNA-seq数据和临床数据,包括374例HCC样本和50例正常样本,过滤后获取319例HCC样本。
2. TCGA-HCC队列的临床特征和IR-lncRNA鉴定
本研究整体流程图如图1所示,使用R包caret将319例HCC样本随机分为161例训练集和158例测试集。HCC患者的临床特征如表1所示,两组之间的年龄,性别,AFP水平,AJCC等级,复发状态和生存状态没有显著差异。TCGA-HCC队列包括344个IR-lncRNA。

图1流程图

表1 HCC临床特征
3.使用9-IR-lncRNA构建HCC DFS预后模型
在训练集中单因素Cox分析表明有100个IR-lncRNA与DFS有关,LASSO分析筛选到13个IR-lncRNA而多因素Cox回归分析进一步筛选到9个IR-lncRNA,这9个IR-lncRNAs的分析结果如表2所示。KM分析分析表明高表达AL031770, AC079328, AC011603, AL031985, AC087294和LINC02193与预后较差显著相关,而高表达WARS2-IT1和LINC002481与预后较好有关。

表2 9-IR-lncRNA构建预后模型
4. 9-IR-lncRNA模型预测HCC DFS的性能
训练集中随风险打分的增加,患者的复发和死亡率逐渐增加(图2A和2B),WARS2-IT1和LINC002481的表达水平降低,而AL008718, AL031770, AC079328, AC011603, AL031985, AC087294, LINC02193的表达水平逐渐升高(图2C)。PCA分析表明9-IR-lncRNA特征可以区分高风险组和低风险组(图2D)。测试集结果与之一致(图2E-2H)。

图2训练集和测试集中风险打分与9-IR-lncRNA的关系
根据风险打分的中位数将训练集分为高风险组和低风险组,高风险组的DFS较低(图3A)。高风险组DFS的时间中位数为0.8,低风险组为3.8。测试集同样分为高风险组和低风险组,高风险组的DFS较低(图3C)。高风险组DFS的时间中位数为1,低风险组为3。训练集的1年,2年,3年和5年的AUC分别为0.784,0.808,0.768和0.797(图3B)。验证集的1年,2年,3年和5年的AUC分别为0.773,0.748,0.678和0.679(图3D)。此外,作者将本研究构建的特征与其他模型进行比较(图3E-3H),结果表明9-IR-lncRNA的性能较好。接下来,作者研究9-IR-lncRNA在正常组织和癌症组织中的差异表达情况。结果表明,AL008718, LA031770, AC079328, AC011603, AL031985, AC087294, LINC02193和LINC002481在肿瘤组织中高表达而WARS2-IT1低表达。

图3 9-IR-lncRNA特征的KM分析和ROC曲线
5. 9-IR-lncRNA风险打分与临床打分的比较
对临床特征进行单因素和多因素Cox分析,对训练集来说单因素分析筛选到风险打分,血管侵袭和AJCC分期(图4A)。多因素分析表明风险打分是预测HCC复发的独立风险因子(图4B)。对测试集来说,单因素分析筛选到风险打分,血管侵袭和AJCC分期(图4C)。多因素分析表明风险打分和AJCC分期是独立风险因子(图4D)。ROC曲线分析表明训练集和验证集的风险打分的AUC最高(图4E-4H)。

图4单因素和多因素Cox分析临床特征和风险打分
6.构建HCC DFS预后列线图
使用单因素Cox回归分析筛选到的风险打分,AJCC分期和血管侵袭构建列线图(图5A)。校准曲线表明列线图的准确性较高(图5B-5D)。1年ROC曲线表明综合风险打分的AUC最高,其次为风险打分,AJCC分期和血管侵袭(图5E)。2年ROC曲线表明综合风险打分的AUC最高,其次为风险打分,AJCC分期和血管侵袭(图5F)。3年ROC曲线表明综合风险打分的AUC最高,其次为风险打分,AJCC分期和血管侵袭(图5G)。

图5基于IR-lncRNA和临床特征构建列线图
7.基因集富集分析和高风险组和低风险组免疫相关特征分析
对高风险组和低风险组进行GSEA分析。结果表明,高风险组主要富集于9条KEGG通路,包括DNA复杂,错配修复,同源重组,RNA降解和细胞循环。随后,作者比较了高风险组和低风险组的免疫检查点分子表达水平,ESTIMATE打分,T细胞验证特征(TIS)和mRNAsi。高风险组的7个基因的表达水平较低,其中PD-L2和TIGIT显著差异表达(图6A)。高风险组的基质打分,免疫打分和ESTIMATE打分较低(图6B),TIS较低(图6C)而mRNAsi较高(图6D)。使用CIBERSORT计算高风险组和低风险组中22种免疫细胞的浸润水平(图7A和7B)。

图6高风险组和低风险组免疫检查点表达水平,ESTIMATE打分,TIS和mRNAsi

图7高风险组和低风险组免疫细胞浸润水平
8.构建HCC的ceRNA调控网络
作者构建了一个lncRNA-miRNA-RNA相关的ceRNA网络。作者从miRcode数据库检索到WARS2-IT1和AC087294和67个miRNA的70条互作通路。使用TargetScan靶基因数据鉴定到27个miRNA靶向17781个mRNA的163558条通路。使用Cytoscape软件构建ceRNA调控网络(图8A),该网络包括2个lncRNA,27个miRNA和69个mRNA。作者使用miRTarBase,miRDB和TargetScan数据库鉴定到17个miRNA的566条通路,包括509个mRNA(图8B)。最后,使用Cytoscape构建更严格的ceRNA调控网络(图8C),包括WARS2-IT1,has-miR-24-3p,has-miR-27a-3p,hsa-miR-140-5p和靶基因SEMA7A,HDAC7和CD34。结果表明SEMA7A,HDAC7和CD34可能是影响肝癌复发的核心基因。作者在人正常肝细胞(MIHA)和两种HCC细胞株验证7个ceRNA调控网络基因的表达水平,HCC细胞株中SEMA7A,HDAC7和CD34的表达水平较高而has-miR-24-3p,has-miR-27a-3p和has-miR-140-5p的表达水平较低(图8D)。

图8构建HCC的ceRNA调控网络
04
结论
作者对HCC患者的免疫相关lncRNA进行分析鉴定到9个与肝癌复发有关的IR-lncRNA并构建9-IR-lncRNA特征。根据风险打分可以将患者分为高风险组和低风险组并且高风险组和低风险组的DFS,免疫检查点表达水平和免疫细胞浸润水平均具有显著差异。最后作者构建了ceRNA调控网络并鉴定到与HCC复发有关的关键基因。本研究的亮点在于作者对免疫相关lncRNA进行分析并构建ceRNA调控网络鉴定到与肝癌复发有关的关键基因,本研究的局限性在于本研究纳入的分析数据较少还需要额外的数据集进行验证。
转载自公众号《生信发文助手》,如有侵权,请联系删除。