ACTIVITIES学习

创新创业平台

20--单基因不好发,双基因来凑,干湿结合发5分+SCI

大家好!今天给大家介绍一篇2021年11月发表在Cancer Cell International(IF:5.722)上的文章。作者对多个GEO数据集进行分析鉴定到与PAAD患者预后显著相关的两个基因:IMUP和GPRC5A。

IMUP and GPRC5A: two newly identified risk score indicators in pancreatic ductal adenocarcinoma

IMUP和GPRC5A:胰腺癌的风险打分标记物

01

摘要

背景:胰腺癌是全世界范围内的一种恶性肿瘤且治疗手段较少,本研究旨在探索胰腺癌发生发展过程中的相关基因,确定有价值的基因标志物和药物靶点。

方法:对GEO数据集进行分析鉴定正常组织和肿瘤组织的差异表达基因并进行GO和KEGG分析,使用KM分析和Cox回归分析鉴定潜在的关键基因。随后研究关键基因与免疫细胞浸润和突变的相关性。使用IHC验证关键基因的表达水平。

结果:差异分析鉴定到22491个差异基因,KM分析和Cox回归分析鉴定到GPRC5A和IMUP两个关键基因。最后研究IMUP和GPRC5A的理化性质,表达水平和突变频率,其与免疫细胞浸润水平的相关性和参与的信号通路。最后,使用免疫组化验证这两个基因的表达水平。

02

流程图

03

结果

1.数据集的获取和下载

从GEO数据库获取GSE数据集,分别为GSE15471,GSE16515,GSE41368,GSE43795和GSE71989。

2. PAAD和正常组织鉴定到22491个差异基因

对5个GEO数据集进行差异分析,分别鉴定到17871,13660,6779,6003和17622个DEGs(图1A-1E),共包括22491个DEGs(图1F)。作者基于基因的差异程度将DEGs分为4组,GSE15471的DEGs中有13511个DEGs差异倍数少于2倍,1503个DEGs的差异倍数大于2倍,211个DEGs的差异倍数大于4倍,38个DEGs的差异倍数大于8倍(图1A)。GSE16515中4组的DEGs分别为9379,1414,601和187(图1B)。GSE41368中4组的DEGs分别为4350,1110,358和98(图1C)。GSE43795中4组的DEGs分别为3291,1996,524和275(图1D)。GSE71989中4组的DEGs分别为11631,3084,601和187(图1E)。

图1 PAAD和正常组织的差异表达基因

3.高度变异的基因主要位于细胞外区域

为鉴定每组DEGs的潜在生物学功能,对DEGs进行GO和KEGG分析。差异倍数少于2倍的DEGs主要位于细胞核,4-8倍的DEGs主要位于细胞质而大于8倍的DEGs主要位于细胞外区域(图2A-2E),表明差异倍数越大的基因其位置倾向于向细胞外靠拢。因此,接下来重点关注差异倍数大于8倍的DEGs。共有487个DEGs的差异倍数大于8,其中有55个DEGs至少存在于3个GEOs数据集中(图2F)。

图2 DEGs的细胞定位

对这些基因中的胶原相关调控因子进行研究,KM分析表明COL1A1, COL1A2, COL5A1, COL5A2, COL10A1和COL11A1与PAAD癌相关的成纤维细胞浸润水平有关并影响患者的无复发生存(图3A-3F)。

图3基因与成纤维浸润水平和PAAD患者生存期的相关性

4.风险打分评估

对这55个基因进行SurvExpress风险评估,其C-index为77.36,风险组的风险比率为3.91并对风险组这55个基因的表达水平进行分析(图4A-4C)。

图4 KM分析鉴定关键基因

5.生存分析表明GPRC5A和IMUP是PAAD的独立预后因子

这55个基因的KM分析表明有6个基因与PAAD生存有关,分别为GPRC5A, IMUP, KYNU, MSLN, S100P和SFN(图4D-4I)。多因素Cox回归分析表明肿瘤等级,GPRC5A和IMUP表达水平是PAAD的独立预后因子(表1)。

表1多因素Cox回归分析

6. GPRC5A和IMUP基因的理化性质

作者使用ProtParam,ProtScale和Protein Atlas分析GPRC5A和IMUP的理化性质。结果表明,GPRCGA蛋白有357个氨基酸组成,分子量为40.3KD,在哺乳动物中的半衰期为30h。GPRC5A的氨基酸包括39个带负电荷的氨基酸残基和32个带正电荷的氨基酸残基,蛋白质的等电点为8.39。GPRC5A的不稳定性指数为38.49,疏水值为0.31,是一个疏水蛋白(图5A),定位于质膜和胞泡中(图5B)。

IMUP蛋白包括106个氨基酸,其中包括13个带负电荷的氨基酸残基和21个带正电荷的氨基酸残基,等电点为9.73,蛋白分子量为10.9KD,在哺乳动物中的半衰期为30h,不稳定性指数为38.42,疏水值为- 1.372,是一个亲水蛋白(图5C),定位于细胞质和质膜中(图5D)。

图5 PAAD中GPRC5A和IMUP的表达水平异常增加

7. PAAD中GPRC5A和IMUP的异常表达

GPRC5A在不同肿瘤中的表达水平不同,例如GPRC5A在肾透明细胞癌和肺鳞癌中的表达水平较低,而在PAAD等肿瘤中的表达水平较高(图5E和5F)。IMUP的表达水平与GPRC5A类似(图5H和5I)。皮尔森分析表明两个基因正相关,表明这两个基因在PAAD发育过程中可能调控类似的信号通路(图5G)。KM分析表明,GPRC5A和IMUP阳性的患者生存期最差,而阴性的换生存期最好(图5J)。IHC和qRT-PCR结果表明PAAD中GPRC5A和IMUP的表达水平较高(图5K-5O)。

8.其他类型的遗传改变分析

随后,作者分析GPRC5A和IUMP突变频率,拷贝数变异和蛋白质结构变异。结果表明,GPRC5A在不同肿瘤中基因变异的类型不同,在PAAD中扩增为主要变异类型(图6A)。对于IMUP基因中,基因变异类型少于GPRC5A基因(图6B)。发生突变的患者的总生存率,无病生存率和无进展生存率均低于未发生突变的患者。

图6 GPRC5A和IMUP基因突变和免疫细胞浸润的相关性

9. GPRC5A和IMUP基因表达与PAAD免疫细胞浸润的相关性

免疫细胞浸润水平与GPRC5A和IMUP表达的相关性分析表明,GPRC5A与CD4+ T细胞,CD8+ T细胞,B细胞,NK细胞,单核细胞,巨噬细胞,树突状细胞或成纤维细胞浸润水平没有显著相关性(图6C-6J),IMUP结果与GPRC5A的结果类似(图6K-6L)。

10. GPRC5A和IMUP基因在PAAD发生中的临床意义

随后,作者研究GPRC5A和IMUP表达水平与PAAD临床病理特征的关系。肿瘤组织中GPRC5A和IMUP基因的表达水平较高(图7A-7J),且随肿瘤分期和等级的增加基因的表达水升高(图7D,7F,7M和7O)。此外,在发生淋巴结转移和酗酒的患者中GPRC5A的表达水平较高(图7I和7G),在男性和年老患者中IMUP的表达水平较高(图7L和7K)。GPRC5A和IMUP表达与患者胰腺炎状态没有显著关系(图7H和7Q)。在发生TP53突变基因的患者中GPRC5A和IMUP表达较高,表明GPRC5A和IMUP与TP53相关信号通路存在潜在关系(图7E和7N)。

图7 GPRC5A和IMUP表达水平与PAAD临床病理特征的相关性

多因素Cox分析表明GPRC5A和IMUP基因的表达水平随肿瘤等级升高而增加,此外表达水平与患者的种族,年龄,性别和转移没有显著相关性(表2和表3)。

表2 GPRC5A和PAAD临床病理特征的相关性

表3 IMUP与PAAD临床病理特征的相关性

04

结论

本研究基于多个GEO数据集和生物信息工具鉴定到了22491个在PAAD和正常组织中的差异基因,并鉴定到GPRC5A和IMUP基因可以作为癌症发生发展的独立预后指标。公共数据集和IHC结果表明这两个基因在PAAD中异常上调。KM和Cox回归分析均表明GPRC5A和IMUP高表达与OS较差有关。随后,作者研究这两个基因的理化性质,变异类型和与免疫细胞浸润的相关性。本研究结果可以更好的理解PAAD发生机制并为PAAD临床治疗提供有价值的信息。本研究的局限性在于还需要大量的额外数据对GPRC5A和IMUP进行验证。

转载自公众号《生信发文助手》,如有侵权,请联系删除。



关注微信

获取电子资讯

版权所有©山西医科大学 2022

| 忘记密码
注册说明

您好!感谢您关注清华x-lab创意创新创业教育平台。

在填写之前,请确认您项目的核心团队至少有一名成员是清华的在校生、校友及教师