李拖沓

V1

2022/11/17阅读:24主题:嫩青

【生信】如何从NCBI-SRA下载数据

NCBI网页操作

首先根据文献里的链接点击进入NCBI SRA的界面

比如说我看的这篇文章

GSE开头的点出来是这个效果

而SRA点出来是这种

SRA开头效果
SRA开头效果

这两种都可以,只是下一步操作不同,第一种(GSE) 直接点击最下面的 SRA Run Selector

GSE开头下一步
GSE开头下一步

第二种(SRA) 的需要首先选择你想要下载的数据,然后点 send to -> Run Selector -> Go

SRA下一步
SRA下一步

这样都会进入到同一个格式的界面

GSE

GSE开头点击后
GSE开头点击后

SRA

SRA点击后
SRA点击后

然后点 Accession List 获取SRR码

下载Accession List
下载Accession List

浏览器会下载下面这种名字格式的文件

SRRtxt文件
SRRtxt文件

用aspera工具 从EBI直接下载fastq格式文件

参考

CellRanger走起(一)数据下载 - 简书 (jianshu.com)

Aspera下载SRR数据 - 简书 (jianshu.com)

按照操作下载aspera工具

  1. 安装Aspera
wget http://download.asperasoft.com/download/sw/connect/3.7.4/aspera-connect-3.7.4.147727-linux-64.tar.gz
tar zxvf aspera-connect-3.7.4.147727-linux-64.tar.gz
#安装
bash aspera-connect-3.7.4.147727-linux-64.sh
# 然后cd到根目录下看看是不是存在了.aspera文件夹,有的话表示安装成功
cd && ls -a
# 将aspera软件加入环境变量,并激活
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
# 最后检查ascp是不是能用了
ascp --help

作者:致知_5974 链接:https://www.jianshu.com/p/07b3bb0ee0cd 来源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

关于从EBI下载数据的脚本,这里是引用 致知_5974 的python脚本,然后修改了一下

InputFile=open("SRR_Acc_List.txt")
OutputFile=open("SRR_Acc_ascp.sh","w")
for line in InputFile:
    line=line.strip()
    print(line)
    print(line[3:6])
    print(line[-1])
    OutputFile.write('ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR' +line[3:6]+'/'+'00'+line[-1]+'/'+line +' ./ '+'\n')
InputFile.close()
OutputFile.close()

用这个脚本读取下载的 SRR_Acc_List.txt 文件,会生成一个叫 SRR_Acc_ascp.sh 的脚本,这个包含的就是ascp的下载指令和网址。

bash SRR_Acc_ascp.sh

bash运行一下,就开始下载了

ascp工具下载示意图
ascp工具下载示意图

分类:

后端

标签:

Python

作者介绍

李拖沓
V1