李
李拖沓
V1
2022/11/17阅读:38主题:嫩青
【生信】如何从NCBI-SRA下载数据
NCBI网页操作
首先根据文献里的链接点击进入NCBI SRA的界面

比如说我看的这篇文章
GSE开头的点出来是这个效果

而SRA点出来是这种

这两种都可以,只是下一步操作不同,第一种(GSE) 直接点击最下面的 SRA Run Selector

而 第二种(SRA) 的需要首先选择你想要下载的数据,然后点 send to -> Run Selector -> Go

这样都会进入到同一个格式的界面
GSE

SRA

然后点 Accession List 获取SRR码

浏览器会下载下面这种名字格式的文件

用aspera工具 从EBI直接下载fastq格式文件
参考
CellRanger走起(一)数据下载 - 简书 (jianshu.com)
Aspera下载SRR数据 - 简书 (jianshu.com)
按照操作下载aspera工具
“
安装Aspera
wget http://download.asperasoft.com/download/sw/connect/3.7.4/aspera-connect-3.7.4.147727-linux-64.tar.gz
tar zxvf aspera-connect-3.7.4.147727-linux-64.tar.gz
#安装
bash aspera-connect-3.7.4.147727-linux-64.sh
# 然后cd到根目录下看看是不是存在了.aspera文件夹,有的话表示安装成功
cd && ls -a
# 将aspera软件加入环境变量,并激活
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
# 最后检查ascp是不是能用了
ascp --help作者:致知_5974 链接:https://www.jianshu.com/p/07b3bb0ee0cd 来源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
关于从EBI下载数据的脚本,这里是引用 致知_5974 的python脚本,然后修改了一下
InputFile=open("SRR_Acc_List.txt")
OutputFile=open("SRR_Acc_ascp.sh","w")
for line in InputFile:
line=line.strip()
print(line)
print(line[3:6])
print(line[-1])
OutputFile.write('ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR' +line[3:6]+'/'+'00'+line[-1]+'/'+line +' ./ '+'\n')
InputFile.close()
OutputFile.close()
用这个脚本读取下载的 SRR_Acc_List.txt 文件,会生成一个叫 SRR_Acc_ascp.sh 的脚本,这个包含的就是ascp的下载指令和网址。
bash SRR_Acc_ascp.sh
bash运行一下,就开始下载了

作者介绍
李
李拖沓
V1