一种基于二代测序技术检测人线粒体遗传突变位点算法的制作方法

文档序号:36492641发布日期:2023-12-27 01:45阅读:39来源:国知局
一种基于二代测序技术检测人线粒体遗传突变位点算法的制作方法

本发明涉及生物医学,具体为一种基于二代测序技术检测人线粒体遗传突变位点算法。


背景技术:

1、人线粒体是细胞内的能量工厂,负责氧化磷酸化和呼吸链的功能。人线粒体dna(mtdna)是一种双链环状分子,长度约为16.6kb,包含37个基因,编码13个呼吸链蛋白、22个trna和2个rrna。由于mtdna的复制和修复机制与核dna不同,mtdna的突变率比核dna高10-20倍,导致mtdna的多态性和异质性。mtdna的突变和异质性与多种线粒体相关疾病(如leber遗传性视神经病变、melas综合征、kearns-sayre综合征等)有关,也与老化、癌症、代谢病等常见疾病有关。因此,检测mtdna的突变和异质性对于研究线粒体功能、诊断线粒体疾病、评估疾病风险和预后、指导临床治疗等具有重要意义。

2、目前,检测mtdna的突变和异质性的常用方法有以下几种:

3、(1)一代测序法:即sanger测序法,是一种经典的dna测序方法,通过链终止法或化学法,将dna分子的序列信息转化为电泳图谱,然后进行分析。该方法具有高准确性、低假阳性率、成熟的分析软件等优点,但也存在测序通量低、成本高、无法检测低频率的异质性等缺点。

4、(2)二代测序法:即高通量测序法,是一种新兴的dna测序方法,通过平行地对大量的dna分子进行测序,生成海量的短读段(reads),然后通过比对、拼接、变异检测等步骤,重建dna的序列信息。该方法具有测序通量高、成本低、能够检测低频率的异质性等优点,但也存在数据量大、分析复杂、假阳性率高等缺点。

5、(3)线粒体捕获测序法:是一种基于二代测序法的改进方法,通过液相探针杂交捕获技术,将mtdna富集后进行高通量测序,提高mtdna的测序深度和覆盖度,从而提高变异检测的准确性和灵敏性。该方法具有捕获效率高、覆盖度高、异质性检测准确等优点,但也存在捕获试剂盒的定制成本高、捕获效率受探针设计和质量影响等缺点。

6、尽管上述方法各有优缺点,但都需要对测序数据进行有效的分析,才能准确地检测mtdna的突变和异质性。目前,常用的分析软件有以下几种:

7、(1)mitotool:是一种基于web的mtdna分析平台,可以对sanger测序或二代测序的数据进行比对、注释、变异检测、异质性检测、系统发育分析等功能。该平台具有操作简便、数据库完善、分析结果丰富等优点,但也存在无法处理大规模数据、无法检测结构变异、无法评估变异的致病性等缺点。

8、(2)mitoseek:是一种基于perl的mtdna分析软件,可以对二代测序的数据进行比对、变异检测、异质性检测、拷贝数估计等功能。该软件具有处理速度快、检测灵敏度高、支持多种测序平台等优点,但也存在无法注释变异、无法检测结构变异、无法评估变异的致病性等缺点。

9、(3)mtoolbox:是一种基于python的mtdna分析软件,可以对二代测序的数据进行比对、变异检测、异质性检测、拷贝数估计、系统发育分析等功能。该软件具有分析流程完整、检测准确度高、支持多种测序平台等优点,但也存在运行时间长、内存占用大、无法评估变异的致病性等缺点。

10、综上所述,现有的检测mtdna的突变和异质性的方法和软件,都存在一定的局限性和不足,需要进一步改进和优化,以提高检测的效率和准确性,为线粒体相关疾病的诊断和治疗提供更有价值的信息。


技术实现思路

1、(一)解决的技术问题

2、为解决上述技术问题,本发明提供了一种基于二代测序技术检测人线粒体遗传突变位点算法。

3、(二)技术方案

4、基于此,本发明提供如下技术方案:一种基于二代测序技术检测人线粒体遗传突变位点算法,包括以下步骤:

5、步骤s1:对二代测序的原始数据进行质量控制,去除低质量的读段和接头序列,得到高质量的读段;

6、步骤s2:将高质量的读段比对到人线粒体参考序列上,得到比对结果文件,对比对结果文件进行统计分析,得到测序深度、覆盖度、均一性等指标;

7、步骤s3:根据比对结果文件,检测mtdna的单核苷酸变异(snv)和插入缺失(indel),得到变异结果文件,对变异结果文件进行过滤和注释,得到过滤后的变异结果文件;

8、步骤s4:根据过滤后的变异结果文件,检测mtdna的异质性,得到异质性结果文件,对异质性结果文件进行过滤和注释,得到过滤后的异质性结果文件;

9、步骤s5:根据过滤后的变异结果文件,评估变异的致病性,得到致病性结果文件,对致病性结果文件进行过滤和注释,得到过滤后的致病性结果文件;

10、步骤s6:根据过滤后的致病性结果文件,对变异进行分类和解释,得到变异分类和解释结果文件,对变异分类和解释结果文件进行整理和格式化,得到最终的变异报告文件。

11、优选的,如上步骤s5所述的评估变异的致病性步骤包括以下内容:

12、步骤s51:根据变异的类型(snv或indel)、位置(编码区或剪切区)、功能(无义、错义、剪切或无效)和频率(人群数据库中的等位基因频率)等信息,使用sift、polyphen2和clinpred,对变异的有害性进行预测,得到预测分数或等级;

13、步骤s52:根据变异的保守性(多物种比对的保守性得分)、功能域(变异是否发生在已知的功能域或结构域中)、表达量(变异是否影响基因的表达水平或稳定性)等信息,对变异的功能影响进行评估,得到功能影响分数或等级;

14、步骤s53:根据变异的致病性证据(来自疾病数据库、文献报道、家系分析、新发性、等位基因、表型相关性等方面的证据),对变异的致病性进行评估,得到致病性证据分数或等级;

15、步骤s54:综合考虑预测分数或等级、功能影响分数或等级和致病性证据分数或等级,按照acmg标准和指南,对变异进行致病性评级,分为致病、可能致病、临床意义未明、可能良性和良性五个等级,得到致病性评级结果;

16、步骤s55:根据致病性评级结果,对变异进行分类,分为致病变异、疑似致病变异、可能相关变异、可能无关变异和良性变异五类,得到变异分类结果;

17、步骤s56:根据变异分类结果,对变异进行解释,说明变异的特征、影响、证据、评级和分类的依据和原因,得到变异解释结果。

18、(三)有益效果

19、与现有技术相比,本发明提供了一种基于二代测序技术检测人线粒体遗传突变位点算法,具备以下有益效果:

20、该一种基于二代测序技术检测人线粒体遗传突变位点算法,相比于传统的检测方法,如sanger测序、pcr-rflp、芯片杂交等,本发明的算法具有高通量、高准确度、低成本等优势,能够检测出mtdna的各种类型的突变,包括单核苷酸变异、插入缺失、拷贝数变异等,并能够评估突变的异质性和致病性;

21、相比于通用的二代测序数据分析算法,本发明的算法考虑了mtdna的特殊性,如高度多态性、异质性、拷贝数变异等,采用了贝叶斯统计模型,提高了变异检测的灵敏度和特异性;

22、本发明的算法能够根据人线粒体基因组数据库,注释变异位点的相关信息,为临床诊断和治疗提供参考;能够生成清晰的变异报告,方便用户查看和理解变异结果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1