ACTIVITIES学习

创新创业平台

4--4 个基因如何做 go 和 kegg 数据库注释

首先,我们假设这4个基因是'TP53','BRCA1','KRAS','NRAS',大家也可以修改为自己感兴趣的基因。代码如下所示:

library(ggplot2)library(clusterProfiler)your_genes=c('TP53','BRCA1','KRAS','NRAS');your_genesyour_genes = bitr(your_genes,'SYMBOL','ENTREZID','org.Hs.eg.db')[,2];your_genesyour_kk <- enrichKEGG(gene = your_genes, organism = 'hsa', pvalueCutoff = 0.9, qvalueCutoff =0.9)head(your_kk)[,1:6] dotplot(your_kk)kk=DOSE::setReadable(your_kk, OrgDb='org.Hs.eg.db',keyType='ENTREZID')tmp = kk@resultwrite.csv( tmp ,paste0(pro,'_kk.csv'))

确实是可以出结果:

kegg富集分析结果

其实你可以看到,我们选择的这4个基因是'TP53','BRCA1','KRAS','NRAS',就是肿瘤相关的,所以它的kegg注释结果肯定是肿瘤通路无疑,这样的注释都并不需要你做一下kegg的,但凡是你背诵了这些基因的功能,少于10个基因其实人工整理更可靠。

转载自《生信技能树》,如有侵权,请联系删除。



关注微信

获取电子资讯

版权所有©山西医科大学 2022

| 忘记密码
注册说明

您好!感谢您关注清华x-lab创意创新创业教育平台。

在填写之前,请确认您项目的核心团队至少有一名成员是清华的在校生、校友及教师