公共数据库下载原始单细胞测序数据提速方法 →
group
date
Nov 5, 2024
slug
data-to-download-highway
status
Published
tags
bioinformatics
scRNA-sequencing
10X genomics
summary
在下载原始的单细胞测序数据时,我们都苦恼一个样本几十个G怎么可以高速下载,抛弃原始的wget下载方式,让你的数据下载上高速🛣️👇🫡
type
Post
下载方式
- 可通过GEO的SRA数据下载,也可通过ebi数据库进行相应的测序数据的下载(前提是所选数据集上传了原始数据以及开放了下载权限)
- GEO数据库的下载界面,配套使用SRA Toolkit下载
- EBI数据库下载数据,通过查看2中的内容可以获取下载地址,此时推荐更高速的下载方式(百兆/s),用到的工具为ascp
- 利用ascp高速下载原始数据,修改/vol/***部分的地址
下载数据类型
- 从sra拆分的fastq文件只有一个:单端测序
- 从sra拆分的fastq文件有两个:双端测序
- 从sra拆分的fastq文件有三个:双端测序read+index
cellranger所需的数据命名方式
- 例如pbmc_1k_v3_S1_L001_I1_001.fastq.gz
- [Sample Name]S1_L00[Lane Number][Read Type]_001.fastq.gz
- 样本名称为pbmc_1k_v3
- I1: sample index read(optional)
- R1: Read 1
- R2: Read 2
- 更改下载数据的文件名