
jamesbang
2023/04/01阅读:98主题:雁栖湖
🤩 Seurat V5 | 最火的单细胞测序分析工具重磅更新啦!~
1写在前面
现在最炙手可热的单细胞分析包,Seurat
重磅跟新啦!~🤩
Seurat
最初是由纽约大学的Rafael A. Irizarry
和Satija
等人于2015
年开发。😘
该工具基于R语言
编写,使用了许多先进的统计学和机器学习算法,可以对scRNA-seq
数据进行细胞聚类、细胞亚群鉴定、基因差异表达分析等。🥰
自推出以来,Seurat
不断更新和改进,增加了许多新功能,包括对空间转录组数据的分析和可视化,以及对多组学数据的整合。
每次发文都是顶刊,也是让人着实羡慕啊!~🤩(左右滑动哦,亲)
本次更新至V5
也是做了很多新的升级:👇
空间转录组分析和多组学分析;
分析流程进一步简化和集成;
处理超大数据;
数据结构优化;

2如何安装Seurat V5
Seurat V5
暂时还不能通过CRAN
安装,通过下面这段代码安装吧。🫶
remotes::install_github("satijalab/seurat", "seurat5", quiet = T)
library(Seurat)
还有一些包会在后面的教程中会用到。
remotes::install_github("satijalab/seurat-data", "seurat5", quiet = T)
remotes::install_github("satijalab/azimuth", "seurat5", quiet = T)
remotes::install_github("satijalab/seurat-wrappers", "seurat5", quiet = T)
remotes::install_github("stuart-lab/signac", "seurat5", quiet = T)
remotes::install_github("bnprks/BPCells", quiet = T)
3基于测序和成像的空间数据集分析
基于测序(即Visium
、SLIDE-seq
等)和基于成像(MERFISH/Vizgen
、Xenium
、CosMX
等)的空间数据集分析技术都具有独特的优势,需要根据实际情况选择分析方法。😜
本次更新,Seurat v5
支持空间数据格式,并支持scRNA-seq
整合、反卷积和生态位识别的分析技术。


4分析流程简化
Seurat v5
提供一行代码解决整合数据问题:👇
4.1 整合数据
obj <- IntegrateLayers(
object = obj, method = CCAIntegration,
orig.reduction = "pca", new.reduction = "integrated.cca",
verbose = FALSE
)
4.2 聚类
obj <- FindNeighbors(obj, reduction = "integrated.cca", dims = 1:30)
obj <- FindClusters(obj, resolution = 2, cluster.name = "cca_clusters")
4.3 可视化
obj <- RunUMAP(obj, reduction = "integrated.cca", dims = 1:30, reduction.name = "umap.cca")
p1 <- DimPlot(
obj,
reduction = "umap.cca",
group.by = c("Method", "predicted.celltype.l2", "cca_clusters"),
combine = FALSE
)
obj <- FindNeighbors(obj, reduction = "integrated.scvi", dims = 1:10)
obj <- FindClusters(obj, resolution = 2, cluster.name = "scvi_clusters")
obj <- RunUMAP(obj, reduction = "integrated.scvi", dims = 1:10, reduction.name = "umap.scvi")
p2 <- DimPlot(
obj,
reduction = "umap.scvi",
group.by = c("Method", "predicted.celltype.l2", "scvi_clusters"),
combine = FALSE
)
wrap_plots(c(p1, p2), ncol = 2)

5多组学整合
Seurat v5
提供了一个新的技术,叫bridge integration
,用于整合不同组学
的实验结果,例如单独的scRNA-seq
和scATAC-seq
数据集。🥰
这种方法利用了单独的多组学数据集作为分子“桥梁”,在低维空间中进行整合,并返回一个目标降维(例如integrated.rpca
),旨在将不同批次中的共享细胞类型共嵌入。🧐

整理一下目前提供的整合算法:👇
CCA:基于规范相关性分析的整合,适用于具有 相似
细胞类型组成的数据集。RPCA:基于稀疏主成分分析的整合,适用于具有 不同
细胞类型组成的数据集。MNN:基于互近邻的整合,适用于具有 相似
细胞类型组成的数据集。LIGER:基于因子分析的整合,适用于具有 不同
细胞类型组成的数据集。Bridge:基于字典学习的整合,适用于 不同组学
的数据集。
6更高的计算性能和更低的硬件要求
scRNA-seq
数据集的大小和规模正在迅速增加,甚至超过了摩尔定律。😷
Seurat v5
更新后,作者引入了新方法来分析、解释和探索跨越数百万个细胞的数据集,即使它们无法完全加载到内存中。😅
具体而言,可以理解为一种抽样
的分析方法,将大型数据集的代表性子样本存储在内存中以实现快速和迭代分析,而完整数据集仍可通过磁盘存储访问。😂
此外,基于Ben Parks
在Greenleaf
实验室开发的BPCells
包实现了更高性能的分析。😜
在原文中,作者对高达130 万个
脑细胞数据集和来自多项研究的150 万个
细胞数据集都进行了测试。🙂
看来以后我们就可以用笔记本电脑
分析数据了。😊


7兼容性问题
Seurat v5
更新比较大,有人可能会担心兼容该问题,怕与低版本的Seurat
不兼容,作者也在原文中解释了这个问题,不用担心,完美兼容。🤩


点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰
📍 🤩 WGCNA | 值得你深入学习的生信分析方法!~
📍 🤩 ComplexHeatmap | 颜狗写的高颜值热图代码!
📍 🤥 ComplexHeatmap | 你的热图注释还挤在一起看不清吗!?
📍 🤨 Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)
📍 🤩 scRNA-seq | 吐血整理的单细胞入门教程
📍 🤣 NetworkD3 | 让我们一起画个动态的桑基图吧~
📍 🤩 RColorBrewer | 再多的配色也能轻松搞定!~
📍 🧐 rms | 批量完成你的线性回归
📍 🤩 CMplot | 完美复刻Nature上的曼哈顿图
📍 🤠 Network | 高颜值动态网络可视化工具
📍 🤗 boxjitter | 完美复刻Nature上的高颜值统计图
📍 🤫 linkET | 完美解决ggcor安装失败方案(附教程)
📍 ......
作者介绍

jamesbang
wx🔍: Grassssss 卷起来了