法医遗传学中的二代测序及其应用→
group
date
Dec 19, 2024
slug
forensic-ngs
status
Published
tags
forensic
bioinformatics
summary
新一代测序(NGS)或大规模平行测序(MPS)是一种突破性的高通量技术,能够在短时间内对DNA和RNA分子进行大规模、高精度的分析。与传统的Sanger测序相比,NGS技术具备显著的优势,包括更高的灵敏度、更强的可扩展性和更快的分析速度。NGS不仅能为科学研究提供更为丰富的数据支持,还逐步在法医学领域获得广泛应用。
type
Post
背景
- 法医生物学的主要领域为:系谱分析、DNA表型分析、miRNA分析、微生物以及表观遗传。
- 基于NGS的DNA测序主要方法:全基因组,全外显子以及靶向panel测序;全基因组测序被用于揭示物种的全基因组的序列信息;全外显子测序仅揭示蛋白编码区域(外显子)的序列信息;靶向测序包含目标序列的信息。
- 二代测序(NGS)的平台:通过杂交测序 (SBH)、合成测序 (SBS) 或焦磷酸测序进行短读长测序(产生约 75-400 个碱基对的 DNA 片段)。主要的平台有Roche 454 genome sequencer FLX system、ABi/SOLiD system、Illumina/Solexa、Ion torrent、GenapSys、Complete genomics technology/MGI/BGI。
- NGS测序的文库制备:文库制备是NGS测序的首要步骤,需要将DNA或是RNA打断为片段,并进行末端修复,后生成文库。接下来,将文库与接头连接,其中接头包含了平台接头以及用于区分样本的条形码接头。文库制备以及PCR过程是引入错误的主要步骤,需要对此进行严谨的质控。
NGS测序产生的数据以及主要的分析
NGS测序产生的数据格式为FASTQ格式,测序文件内容包含reads ID、序列信息,碱基质量以及正负链信息。分析人员可以根据具体的研究要求对原始下机数据进行质控,包括去接头,拆分样本(适用于连接barcode的混合文库)、对序列进行长度以及质量过滤等。
接下来最重要的部分为
- 序列比对:即sequence alignment,根据不同的研究需求分析人员可以选用不同的比对工具,对于二代测序最常用的比对工具为blast,而三代测序最常用的比对工具则为minimap2。那么对于转录组测序也会用对应的适配的比对工具。
- 比对结果的质控:分析人员根据比对结果按照分析需求,对比对数据进行覆盖度,测序深度,比对率,比对质量的质控。
- 基于比对结果的分析:常用的法医相关的分析主要为变异识别,包括了SNP、INDEL 和 CNV的识别、注释以及突变效应的预测,识别突变最常用的二代分析工具为GATK。同时对于一些涉及到表达水平的检测,这需要进行相应的表达量的定量及分析,常用的表达差异分析工具有Cuffdiff, DESeq2, 和 edgeR等。
与传统的基于 Sanger 的测序相比,基于 NGS 的技术具有更低的每测序核苷酸成本,接下来就一起看看基于测序的主要法医遗传学研究方向。
STR
STR 分析是法医生物学中最常用的分子分析。STR全称为短串联重复序列,而STR的等位基因则由序列中的重复单元的多少来区分,不同的个体之间的同一STR的个数或存在差异,则可通过这种差异来区分个体。传统的STR测序,则是通过毛细管电泳(CE)对DNA扩增片段进行基因型的分析。 NGS 则可以揭示 Y-STR 和常染色体 STR 变异的实际序列信息,而不仅仅是变异的长度。因此,与基于 CE 的分析方法相比,基于 NGS 的分析可以进一步区分长度一致的 STR 图谱。
线粒体(mtDNA)
线粒体可用于基于母系遗传的家系的推断。NGS可用于靶向线粒体以及全长线粒体序列的分析,而在发现线粒体异质性上,NGS也具有更高的灵敏度。同时对于全长线粒体序列的分析相较于控制区序列的分析可以具有更高的分辨率。
miRNA
microRNA (miRNA) 是一类包含 18-24 个核苷酸的非编码 RNA,参与人体内许多生化机制的调节。留在犯罪现场的体液通常在重建犯罪事件中起着至关重要的作用,体液(包括血液、唾液、精液和阴道分泌物)中存在 miRNA ,这使得法医对于其在混合斑上的检测产生了极大的兴趣,那么利用测序来获得对应的生物信息对于解锁混合班成分组成具有重要意义。
法医微生物学
法医微生物学涉及使用微生物痕迹来识别个人在犯罪事件期间所处的环境。法医微生物学最广泛地用于确定原因(疾病或创伤)和死亡方式(即凶杀、自杀、事故、自然)、死后间隔估计、死者(死者)的身份识别和犯罪地点的检测。
法医表观遗传学
表观遗传学是研究由于外部因素或行为引起的基因表达变化的学科。表观遗传学的法医应用包括分析来自犯罪现场的体液样本、区分同卵(相同)双胞胎和年龄估计等。法医表观遗传学涉及mRNA、microRNA 和 DNA 甲基化的分析。
法医DNA表型
FDP (法医DNA表型)或预测性 DNA 表型分析是对特定基因组区域的分析,以预测个体的外部可见特征 (EVC),特别是关于头发颜色、眼睛颜色和皮肤色素沉着。它可用于推断年龄、生物地理祖先 (BGA)、男性型秃发、生活习惯、医疗问题、行为特征等。
法医遗传系谱学
FGG (法医遗传系谱学)涉及使用家谱 DNA 数据库,通过重建祖先谱系和家谱来确定 DNA 样本来源的近亲或远亲。FGG 依赖于大量的SNP数据,SNP 是核苷酸的差异,提供有关外观、血统、健康等的遗传信息。法医系谱分析技术可在多种场景下应用:1)遗留于犯罪现场或无名尸的DNA在大型人群库中的亲缘关系搜寻, 如美国金州杀手案等; 2)犯罪现场DNA与受害者DNA进行比较, 用于排除或包括受害者家族人员; 3)无法获得某嫌疑人DNA时, 通过其家属的DNA判断该家族人员与犯罪现场DNA的相关性; 4)在灾难受害者身源鉴定(disaster victimidentification, DVI)中, 受害者之间、受害者与家属的亲缘关系鉴定; 5)犯罪现场出现多名嫌疑人的DNA时, 通过亲缘关系预测犯罪嫌疑人之间的亲缘关系等。
由于NGS技术的进步,人类基因组测序的价格大幅下降。法医学方面,NGS技术的进步使得可以同时分析新的遗传标记,并能够产生以前无法确定的信息。然而,NGS的应用尚未在法医生物学的常规案例工作中得到证实。要充分评估其利益和风险并制定相应使用的政策,还需要做大量工作。
参考
- Browne, T. N., & Freeman, M. (2024). Next generation sequencing: Forensic applications and policy considerations. WIREs Forensic Science, 6(6), e1531.
- Børsting C, Morling N. Next generation sequencing and its applications in forensic genetics. Forensic Sci Int Genet. 2015 Sep;18:78-89. doi: 10.1016/j.fsigen.2015.02.002. Epub 2015 Feb 14. PMID: 25704953.
- LIU Jing, JI Anquan, LI Caixia, WANG Guiqiang. Research Progress of Forensic Genealogy Analysis[J]. Forensic Science and Technology,2019,44(3): 189-194 .