法医DNA测序|纳米孔测序质控分析:NanoPlot→
group
analysis
date
Jan 20, 2025
slug
forensic_nanopore_nanoplot
status
Published
tags
nanopore sequencing
bioinformatics
forensic
summary
在上一节中,我们了解了纳米孔测序的基本原理以及下机数据的格式和文件内容。下一步需要进行的就是对原始数据的数据表现进行初步的判定,以便我们后续的下游分析提供高质量的clean data。
下面将分篇介绍几个纳米孔下机数据可视化分析以及质控的分析工具
type
Post
NanoPlot
是一种专门用于分析和可视化长读长测序数据的工具,通常与 Oxford Nanopore Technologies (ONT) 数据配合使用。它提供了全面的质量控制(QC)评估,帮助研究者深入了解测序数据的质量和特性。
亮点
- 质量评估:
- 生成有关 reads 长度、质量分数(Q 值)和测序深度的统计信息以及可视化图表。
- 提供直方图、密度图等,用于深入分析测序数据的分布。
- 可视化图形类型:
- reads 长度分布图;
- reads 质量(Q 值)分布图;
- 测序深度覆盖图;
- 基于 reads 长度和质量的二维密度图;
- 每碱基质量的趋势图。
- 常见的数据输入格式类型:
- fastq 或 fasta 文件( bgzip, bzip2 或 gzip 解压文件);
- albacore, guppy 或 MinKNOW 产生的 fastq 文件(bgzip, bzip2 或 gzip 解压文件);
- 排序后的 bam 文件。
- 交互性:
- 生成静态和交互式图表,方便用户在本地浏览或嵌入到报告中。
安装
使用案例
更加详细全面的使用方法可参见
NanoPlot -h
Demo数据结果展示
命令
默认输出文件包含以下内容:
主要数据输出
- NanoStats:包含平均(中值)读长、平均(中值)read质量、测序通量、read N50长度等
- NanoPlot-report.html
可以利用浏览器打开,文件中包含了详细的测序数据统计结果以及默认生成的一系列数据特征图
部分图形结果展示
a. read长度加权直方图
b. Read长度非加权直方图
c. Read 长度与 read 平均碱基质量的双变量散点图
d. Read 长度与 read 平均碱基质量的双变量核密度估计图
以上是利用NanoPlot进行纳米孔测序原始下机数据表现可视化的相关内容,文中只对简要使用方法和主要结果文件进行了解读,如有具体问题交流请后台私。
参考
[1] Wouter De Coster, Rosa Rademakers, NanoPack2: population-scale evaluation of long-read sequencing data, Bioinformatics, Volume 39, Issue 5, May 2023, btad311, https://doi.org/10.1093/bioinformatics/btad311