法医测序实用集合篇|如何分析测序数据中识别的变异位点→

group
date
Apr 24, 2025
slug
forensic_tool_3
status
Published
tags
forensic
summary
之前我们讲到了如何利用分析工具进行纳米孔测序数据的变异检测,但是对于检测出的变异位点,我们要如何理解和分析,进一步确定可信且有用的位点呢?本文将进行简单的介绍,也会捎带上关于疾病有关的变异位点的解析,希望你可以从中有所收获。
type
Post

一、生信分析验证

1. 数据质量评估

  • 测序深度(Depth)
    • 目标区域覆盖深度需≥20x(临床诊断建议≥50x),深度过低可能导致假阳性。
    • 使用工具:samtools depthIGV查看局部深度。
  • 碱基质量(Base Quality)
    • Qphred值≥30(错误率≤0.1%,主要针对于二代平台),排除低质量位点。
    • 使用工具:FastQCMultiQC
  • 比对质量(Mapping Quality)
    • 比对质量(MAPQ)≥20,排除比对模糊的reads(根据研究需求可以更高)。
    • 使用工具:samtools view -q 20

2. 交叉验证工具

  • 不同变异检测工具对比
    • 同时使用 GATK HaplotypeCallerFreeBayesSamtools mpileup 等工具,若多个工具均检测到同一变异,可靠性更高。

3. 数据库过滤

  • 已知变异数据库
    • dbSNPgnomAD千人基因组计划:观察是否为常见多态性位点。
    • ClinVarHGMD:检查是否已被报道为致病变异或良性变异。
    • 使用工具:AnnovarVEPSnpEff注释。

4. 功能预测

  • 有害性预测
    • 错义变异:SIFT(预测有害)、PolyPhen-2(可能破坏蛋白结构)。
    • 剪接变异:MaxEntScan、SpliceAI(预测剪接位点影响)。
    • 使用工具:CADD(综合评分>20提示可能有害)。

5. 覆盖不均与链偏好性检查

  • 链偏好性(Strand Bias)
    • 变异reads在正负链的比例需接近(如Fisher精确检验p>0.05)。
    • 使用工具:IGV可视化reads方向分布。

二、实验验证

1. Sanger测序

  • 适用场景:验证少量候选变异(或<20个位点)。
  • 步骤
      1. 设计引物(Primer3、Primer-BLAST),确保扩增区域覆盖变异位点。
      1. PCR扩增目标区域并测序。
      1. 比对测序峰图,确认变异是否存在。
  • 优点:金标准,准确率高(>99%)。
  • 缺点:通量低,成本较高。

2. 数字PCR(dPCR)或定量PCR(qPCR)

  • 适用场景:验证低频变异(如体细胞突变或嵌合体)。
  • 优点:可检测低至0.1%的等位基因频率。
  • 示例
    • 使用TaqMan探针区分野生型和突变型等位基因。

3. 长读长测序(PacBio或ONT)

  • 适用场景:验证复杂结构变异或重复序列区域的变异。
  • 优点:可跨越短读长无法覆盖的区域(如Alu元件、串联重复)。

4. 家系分析

  • 分离验证(Segregation Analysis)
    • 检查变异是否与表型共分离(如显性遗传病中患者携带,健康亲属不携带)。
    • 示例:父母-子女三人组测序验证新发变异(de novo)。

三、可靠性验证的关键指标

指标
可靠标准
测序深度
目标位点深度≥20x(临床建议≥50x)
变异频率
杂合变异:等位基因频率(VAF)≈50%(±10%);纯合变异:VAF≥90%
工具一致性
≥2种变异检测工具支持
实验验证
Sanger测序或dPCR确认
数据库支持
排除gnomAD等数据库中高频率(>1%)的良性多态性

四、常见问题与解决方案

  1. 假阳性变异
      • 原因:测序错误、比对错误(如重复区域)。
      • 解决:提高测序深度、使用更严格的过滤参数(如GATK的VQSR)。
  1. 假阴性变异
      • 原因:低覆盖度或高GC含量区域。
      • 解决:靶向捕获或长读长测序补洞。
  1. 嵌合变异
      • 验证方法:数字PCR或单分子测序(如HiFi reads)。

五、验证流程示例

  1. 初筛
      • 生信分析筛选出候选变异(如致病性预测为“可能致病”的变异)。
  1. 优先级排序
      • 根据ACMG标准、表型关联(如HPO术语匹配)排序。
  1. 实验验证
      • 对Top 10候选变异进行Sanger测序。
  1. 临床解读
      • 结合实验验证结果、家系数据和文献报道,最终分类为“致病”或“良性”。

六、工具与资源推荐

  • 生信工具
    • 变异注释:AnnovarVEPEnsembl VEP
    • 可视化:IGVIntegrative Genomics Viewer
  • 实验设计
    • 引物设计:Primer-BLASTPrimer3
    • Sanger分析:SnapGeneChromas

© Willow 2022 - 2025