jamesbang

V1

2022/10/06阅读:21主题:雁栖湖

🤩 scRNA-seq | 吐血整理的单细胞入门教程(基础可视化)(五)

1写在前面

本期我们介绍一下scRNA-seq基本信息的可视化方法。✌️

2用到的包

rm(list = ls())
library(tidyverse)
library(scater)
library(SingleCellExperiment)
library(ggsci)
library(scater)

3示例数据

这里我们用一下上期介绍的counts文件和annotation文件,然后通过SingleCellExperiment包创建SingleCellExperiment格式的文件。

3.1 读入数据

counts <- read.table("./molecules.txt", sep = "\t")
annotation <- read.table("./annotation.txt", sep = "\t", header = TRUE)
counts
counts
annotation
annotation

3.2 创建SingleCellExperiment对象

# 注意assays必须是matrix
tung <- SingleCellExperiment(
assays = list(counts = as.matrix(counts)),
colData = annotation
)
assay(tung, "logcounts") <- log2(counts(tung) + 1)
colData(tung)$total_counts <- colSums(counts(tung))
tung

4细胞信息可视化

这里我们对每个batch的总count的分布情况进行可视化。😘
大家可以在colData中找到相应信息。

4.1 提取信息

cell_info <- as.data.frame(colData(tung))
head(cell_info)

4.2 可视化

这里的可视化我们以ggplot为例。🌰

cell_info %>% 
ggplot(aes(x = batch, y = total_counts)) +
geom_violin(aes(fill= batch)) +
theme_bw() +
theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1))+
scale_fill_npg()

5特定gene及batch的可视化

如果我们想把每个batch中某个特定gene的表达分布可视化,这就相对比较复杂了,因为gene表达信息是在counts文件中,而batch信息是在colData中。🤯
如果要把这两部分信息放在一起,我们需要做大量的数据处理,然后整合在一个data.frame。😔

这里我们可以使用scater包的ggcells()函数进行可视化,非常简单。🤩

5.1 补充一下

上面我们介绍了使用ggplot细胞信息进行可视化,这里我们用scater包也可以实现,无需提取colData

tung %>% 
ggcells(aes(x = batch, y = total_counts)) +
geom_violin(aes(fill = batch)) +
theme_bw() +
theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1))+
scale_fill_lancet()

5.2 特定基因可视化

tung %>% 
ggcells(aes(x = batch, y = ENSG00000198938), exprs_values = "logcounts") +
geom_violin(aes(fill = batch)) +
theme_bw() +
theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1))+
scale_fill_aaas()

最后祝大家早日不卷!~

需要示例数据的小伙伴,在公众号回复scRNAseq获取吧!

点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

分类:

后端

标签:

后端

作者介绍

jamesbang
V1

wx🔍: Grassssss 卷起来了