生信探索

V1

2023/03/07阅读:15主题:姹紫

空间转录组实战03: 整合

<生信交流与合作请关注公众号@生信探索>

我把常用的函数写成了几个包,方便之后使用; bioquest 包括三个子包 tl、pl、st 分别是常用的工具包 DdatafFame 的处理、画图、字符串处理; genekit 包括基因名转换、格式转换、差异分析、提取 TCGA 数据等的函数; sckit 包括单细胞分析的一些函数; 可以在https://jihulab.com/BioQuest找到这些函数。

接着 02 中的 adata 继续处理,使用 harmony 整合两个数据,消除批次效应。

harmony

sk.harmony(adata,batch_key='library_id',output_dir=OUTPUT_DIR)

cluster

sc.tl.leiden(adata, key_added="Cluster")
sc.tl.tsne(adata, use_rep="X_harmony",n_jobs=24)
sc.pl.tsne(adata,color="Cluster",legend_loc="on data",show=False,legend_fontoutline=3);
sc.pl.umap(adata, color="Cluster",legend_loc="on data",show=False,legend_fontoutline=3);

空间可视化 cluster

fig, axes = plt.subplots(1, 2, figsize=(6, 3))
for x,y in zip(axes,sorted(adata.uns['spatial'].keys())):
    sc.pl.spatial(adata[adata.obs.library_id==y],
        frameon=False, color="Cluster",
        size=1.5,
        library_id=y,
        title=y,
        ax=x,
        show=False,
        legend_loc="right margin" if y=='P' else  None);
plt.subplots_adjust(wspace=0.1)
adata.write_h5ad(f"{OUTPUT_DIR}/adata_after_harmony.h5ad",compression='lzf')

分类:

后端

标签:

大数据

作者介绍

生信探索
V1

微信公众号:生信探索