
生信探索
V1
2023/03/07阅读:15主题:姹紫
空间转录组实战03: 整合
<生信交流与合作请关注公众号@生信探索>
我把常用的函数写成了几个包,方便之后使用; bioquest 包括三个子包 tl、pl、st 分别是常用的工具包 DdatafFame 的处理、画图、字符串处理; genekit 包括基因名转换、格式转换、差异分析、提取 TCGA 数据等的函数; sckit 包括单细胞分析的一些函数; 可以在https://jihulab.com/BioQuest找到这些函数。
接着 02 中的 adata 继续处理,使用 harmony 整合两个数据,消除批次效应。
harmony
sk.harmony(adata,batch_key='library_id',output_dir=OUTPUT_DIR)

cluster
sc.tl.leiden(adata, key_added="Cluster")
sc.tl.tsne(adata, use_rep="X_harmony",n_jobs=24)
sc.pl.tsne(adata,color="Cluster",legend_loc="on data",show=False,legend_fontoutline=3);
sc.pl.umap(adata, color="Cluster",legend_loc="on data",show=False,legend_fontoutline=3);


空间可视化 cluster
fig, axes = plt.subplots(1, 2, figsize=(6, 3))
for x,y in zip(axes,sorted(adata.uns['spatial'].keys())):
sc.pl.spatial(adata[adata.obs.library_id==y],
frameon=False, color="Cluster",
size=1.5,
library_id=y,
title=y,
ax=x,
show=False,
legend_loc="right margin" if y=='P' else None);
plt.subplots_adjust(wspace=0.1)

adata.write_h5ad(f"{OUTPUT_DIR}/adata_after_harmony.h5ad",compression='lzf')
作者介绍

生信探索
V1
微信公众号:生信探索