ACTIVITIES学习

创新创业平台

24--单细胞文献你不整理,过后甚至会忘记自己曾经读过

我们的《单细胞文献100》活动激起了大家对单细胞的兴趣,马上交流群有朋友咨询B细胞的细分亚群,希望给出参考文献,我恰好在看新冠病毒相关单细胞数据分析文章,就给出来了这个:《Single-cell landscape of immunological responses in patients with COVID-19》

该研究的实验设计很清晰,就是5个正常人加上13个患者的血液进行单细胞转录组:

• healthy donors (HDs) (n= 5),

• moderate (n= 7),

• severe (n= 4)

• convalescent (n= 6) samples

实验设计

第一层次降维聚类分群

总共是122,542 cells,第一层次降维聚类分群是14个:

• naive-state T (naive T) cells (CD3+CCR7+)

• activated-state T (activated T) cells (CD3+PRF1+)

• mucosal-associated invariant T (MAIT) cells (SLC4A10+TRAV1-2+)

• γδ T cells (TRGV9+TRDV2+)

• proliferative T (pro T) cells (CD3+MKI67+)

• natural killer (NK) cells (KLRF1+)

• B cells (MS4A1+)

• plasma B cells (MZB1+)

• CD14+ monocytes (CD14+ mono; LYZ+CD14+)

• CD16+ monocytes (CD16+ mono; LYZ+FCGR3A+)

• monocyte-derived dendritic cells (mono DCs; CD1C+)

• plasmacytoid dendritic cells (pDCs; LILRA4+)

• plate- lets (PPBP+)

• hemopoietic stem cells (HSCs; CYTL1+GATA2+).

其umap可视化如下所示:

第一层次降维聚类分群可视化umap

这个配色其实不容易区分,虽然色彩很饱满。每个细胞亚群各自标志性基因的表达量展示,文章也做的很好,这里就不赘述。以前我们做了一个投票:可视化单细胞亚群的标记基因的5个方法,下面的5个基础函数相信大家都是已经烂熟于心了:

• VlnPlot(pbmc, features = c("MS4A1", "CD79A"))

• FeaturePlot(pbmc, features = c("MS4A1", "CD79A"))

• RidgePlot(pbmc, features = c("MS4A1", "CD79A"), ncol = 1)

• DotPlot(pbmc, features = unique(features)) + RotatedAxis()

• DoHeatmap(subset(pbmc, downsample = 100), features = features, size = 3)

核心分析:细胞比例变化和差异分析

单细胞的多组对照设计(例如正常组与给药组)可以为细胞类型水平比较提供以往Bulk RNA-seq分析所不能达到的精度。对此一般有两种进阶分析思路:

• (1)DE(Differential expression)--两组样本的同一细胞类型的基因表达差异分析;

• (2)DA(Differential abundance)--两组样本的同一细胞类型的丰度差异分析

参考:http://bioconductor.org/books/release/OSCA/overview.html

这个文章《Single-cell landscape of immunological responses in patients with COVID-19》的figures2和figures3就分别对应细胞比例差异分析和基因表达量差异分析。

各个亚群细分

首先是NK,CD4和CD8细分

第二层次降维聚类分群是:

• 6 subtypes of CD4+ T cells (CD3E+CD4+),

• 3 subtypes of CD8+ T cells (CD3E+CD8A+)

• 3 subtypes of NKT cells (CD3E+CD4CD8ATYROBP+).

NK,CD4和CD8细分

如上图所示,出现了第三层次降维聚类分群:

• naive CD4+ (CD4+ naive) T cell (CCR7+SELL+)

• memory CD4+ (CD4+ memory) T cell (S100A4+GPR183+)

• effector memory CD4+ (CD4+ effector memory) T cell (S100A4+GPR183+GZMA+)

• regulatory T (Treg) cell (FOXP3+IL2RA+)

• naive CD8+ (CD8+ naive) T cell subset (CCR7+SELL+)

• effector CD8+ T cell subsets (CD8+ effector-GZMK and CD8+ effector-GNLY),

• naive NKT (NKT naive) cells (CCR7+SELL+),

• CD56+ NKT (NKT CD56) cells

• CD160+ NKT (NKT CD160) cells

有了这些细分的生物学功能亚群,然后又可以进行核心分析:细胞比例变化和差异分析

单细胞的多组对照设计(例如正常组与给药组)可以为细胞类型水平比较提供以往Bulk RNA-seq分析所不能达到的精度。对此一般有两种进阶分析思路:

• (1)DE(Differential expression)--两组样本的同一细胞类型的基因表达差异分析;

• (2)DA(Differential abundance)--两组样本的同一细胞类型的丰度差异分析

参考:http://bioconductor.org/books/release/OSCA/overview.html

划重点:B细胞的细分亚群

如下所示:

B细胞的细分亚群

主要是6大亚群:

• one naive B subset (MS4A1+IGHD+)

• one memory B subset (MS4A1+CD27+)

• one intermediate transi- tion memory B subset (intermediate memory B; IGHD+CD27+)

• one germinal center B subset (MS4A1+NEIL1+)

• two plasma subsets plasma B (MZB1+CD38+)

• dividing plasma B (MZB1+ CD38+MKI67+).

当然了,每个亚群各自特异性基因表达量也可视化成功。

更有意思的是,在群里跟大家交流后,提问的小伙伴居然恍然大悟,原来是他自己本来就是看过这个文献。但最开始仅仅是在朋友圈浏览了中文介绍,自己也是下载了原文pdf也是匆匆一瞥。

问题在于

没有记录笔记,其实这样的文献对我们的价值并不大,我们能用到的就是降维聚类分群和各个细分亚群标记基因啊!整理起来也非常容易,但是做过就是做过,比匆匆一瞥好太多了。


转载自公众号《生信技能树》,如有侵权,请联系删除。



关注微信

获取电子资讯

版权所有©山西医科大学 2022

| 忘记密码
注册说明

您好!感谢您关注清华x-lab创意创新创业教育平台。

在填写之前,请确认您项目的核心团队至少有一名成员是清华的在校生、校友及教师