法医测序实用集合篇|如何分析测序数据中识别的变异位点→
group
date
Apr 24, 2025
slug
forensic_tool_3
status
Published
tags
forensic
summary
之前我们讲到了如何利用分析工具进行纳米孔测序数据的变异检测,但是对于检测出的变异位点,我们要如何理解和分析,进一步确定可信且有用的位点呢?本文将进行简单的介绍,也会捎带上关于疾病有关的变异位点的解析,希望你可以从中有所收获。
type
Post
一、生信分析验证
1. 数据质量评估
- 测序深度(Depth):
- 目标区域覆盖深度需≥20x(临床诊断建议≥50x),深度过低可能导致假阳性。
- 使用工具:
samtools depth
、IGV
查看局部深度。
- 碱基质量(Base Quality):
- Qphred值≥30(错误率≤0.1%,主要针对于二代平台),排除低质量位点。
- 使用工具:
FastQC
、MultiQC
。
- 比对质量(Mapping Quality):
- 比对质量(MAPQ)≥20,排除比对模糊的reads(根据研究需求可以更高)。
- 使用工具:
samtools view -q 20
。
2. 交叉验证工具
- 不同变异检测工具对比:
- 同时使用 GATK HaplotypeCaller、FreeBayes、Samtools mpileup 等工具,若多个工具均检测到同一变异,可靠性更高。
3. 数据库过滤
- 已知变异数据库:
- dbSNP、gnomAD、千人基因组计划:观察是否为常见多态性位点。
- ClinVar、HGMD:检查是否已被报道为致病变异或良性变异。
- 使用工具:
Annovar
、VEP
、SnpEff
注释。
4. 功能预测
- 有害性预测:
- 错义变异:SIFT(预测有害)、PolyPhen-2(可能破坏蛋白结构)。
- 剪接变异:MaxEntScan、SpliceAI(预测剪接位点影响)。
- 使用工具:
CADD
(综合评分>20提示可能有害)。
5. 覆盖不均与链偏好性检查
- 链偏好性(Strand Bias):
- 变异reads在正负链的比例需接近(如Fisher精确检验p>0.05)。
- 使用工具:
IGV
可视化reads方向分布。
二、实验验证
1. Sanger测序
- 适用场景:验证少量候选变异(或<20个位点)。
- 步骤:
- 设计引物(Primer3、Primer-BLAST),确保扩增区域覆盖变异位点。
- PCR扩增目标区域并测序。
- 比对测序峰图,确认变异是否存在。
- 优点:金标准,准确率高(>99%)。
- 缺点:通量低,成本较高。
2. 数字PCR(dPCR)或定量PCR(qPCR)
- 适用场景:验证低频变异(如体细胞突变或嵌合体)。
- 优点:可检测低至0.1%的等位基因频率。
- 示例:
- 使用TaqMan探针区分野生型和突变型等位基因。
3. 长读长测序(PacBio或ONT)
- 适用场景:验证复杂结构变异或重复序列区域的变异。
- 优点:可跨越短读长无法覆盖的区域(如Alu元件、串联重复)。
4. 家系分析
- 分离验证(Segregation Analysis):
- 检查变异是否与表型共分离(如显性遗传病中患者携带,健康亲属不携带)。
- 示例:父母-子女三人组测序验证新发变异(de novo)。
三、可靠性验证的关键指标
指标 | 可靠标准 |
测序深度 | 目标位点深度≥20x(临床建议≥50x) |
变异频率 | 杂合变异:等位基因频率(VAF)≈50%(±10%);纯合变异:VAF≥90% |
工具一致性 | ≥2种变异检测工具支持 |
实验验证 | Sanger测序或dPCR确认 |
数据库支持 | 排除gnomAD等数据库中高频率(>1%)的良性多态性 |
四、常见问题与解决方案
- 假阳性变异:
- 原因:测序错误、比对错误(如重复区域)。
- 解决:提高测序深度、使用更严格的过滤参数(如GATK的VQSR)。
- 假阴性变异:
- 原因:低覆盖度或高GC含量区域。
- 解决:靶向捕获或长读长测序补洞。
- 嵌合变异:
- 验证方法:数字PCR或单分子测序(如HiFi reads)。
五、验证流程示例
- 初筛:
- 生信分析筛选出候选变异(如致病性预测为“可能致病”的变异)。
- 优先级排序:
- 根据ACMG标准、表型关联(如HPO术语匹配)排序。
- 实验验证:
- 对Top 10候选变异进行Sanger测序。
- 临床解读:
- 结合实验验证结果、家系数据和文献报道,最终分类为“致病”或“良性”。
六、工具与资源推荐
- 生信工具:
- 变异注释:
Annovar
、VEP
、Ensembl VEP
。 - 可视化:
IGV
、Integrative Genomics Viewer
。
- 实验设计:
- 引物设计:
Primer-BLAST
、Primer3
。 - Sanger分析:
SnapGene
、Chromas
。