潜在融合基因事件的检测方法及装置、存储介质与流程

文档序号:35272813发布日期:2023-08-30 19:31阅读:18来源:国知局
潜在融合基因事件的检测方法及装置、存储介质与流程

本申请涉及基因测序,尤其是涉及到一种潜在融合基因事件的检测方法及装置、存储介质、计算机设备。


背景技术:

1、融合基因是一种两个本来独立的基因发生了基因组层面上相连的现象。基因融合现象会导致染色体易位、大片段插入缺失或者染色体倒位,进而导致一些疾病的发生。因此在肿瘤或者其他特定疾病的临床诊断和治疗上,检测基因融合扮演了一个非常重要的角色。

2、rna测序是基于二代测序技术(ngs)研究转录组学的方法,可以快速获取给定时刻的一个基因组中rna的种类和数目。第二代测序技术的发展使检测整个基因组的融合基因成为可能。随着技术的发展,测序成本大幅降低,并且rna测序技术可以检测新的融合基因信号且比传统的以实验为基础的方法更加灵敏。因此,用rna测序技术检测融合基因事件已经成为首选方法。目前基于rna测序数据检测融合基因的算法中大多是通过将数据比对到参考基因组上,通过检测测序数据中的soft clip信号和read插入长度信号来检测潜在融合基因事件。

3、由于第二代测序技术的高灵敏度,检测结果报出大量融合基因事件。然而,经过湿实验验证之后发现大量报出的融合基因事件均为背景噪音信号。真实的融合基因断点位置往往和大量假阳性信号共存,这对解读融合基因报出结果而言十分不便。因此,如何有效过滤由ngs技术的高灵敏度带来的假阳性信号是当前急需解决的问题。


技术实现思路

1、有鉴于此,本申请提供了一种潜在融合基因事件的检测方法及装置、存储介质、计算机设备,

2、根据本申请的一个方面,提供了一种潜在融合基因事件的检测方法,所述方法包括:

3、将基因测序序列与参考基因组进行比对,获取支持潜在融合基因事件发生的序列,并将支持所述潜在融合基因事件发生的序列拼接组装成一段中间序列;

4、根据所述中间序列,获取所述潜在融合基因事件发生的断点位置。

5、可选地,所述获取所述潜在融合基因事件发生的断点位置之后,所述方法还包括:

6、将所述基因测序序列与所述参考基因组进行比对,获取未比对至参考基因组上的序列;

7、将支持所述潜在融合基因事件发生的序列和所述未比对至参考基因组上的序列与所述中间序列进行比对,去除所述潜在融合基因事件的背景噪音序列。

8、可选地,所述将基因测序序列与参考基因组进行比对,获取支持潜在融合基因事件发生的序列,具体包括:

9、通过基因测序获取正向基因测序序列和反向基因测序序列;

10、将所述正向基因测序序列和所述反向基因测序序列与所述参考基因组进行比对,获取所述正向基因测序序列和所述反向基因测序序列与所述参考基因组的比对结果,当比对结果出现所述正向基因测序序列的前段和后段能够分别比对到参考基因组上相距超过预设距离的不同位置,或,比对结果出现所述反向基因测序序列的前段和后段能够分别比对到参考基因组中相距超过预设距离的不同位置,或,所述正向基因测序序列和所述反向基因测序序列分别比对到参考基因组上相距超过预设距离的不同位置时,将所述正向基因测序序列以及所述反向基因测序序列定义为支持所述潜在融合基因事件发生的序列。

11、可选地,所述将支持所述潜在融合基因事件发生的序列拼接组装成一段中间序列,具体包括:

12、通过基因组组装算法将所有支持所述潜在融合基因事件发生的序列重组装为所述中间序列。

13、可选地,所述去除所述潜在融合基因事件的背景噪音序列之后,所述方法还包括:

14、对支持所述潜在融合基因事件发生的序列、所述未比对至参考基因组上的序列与所述中间序列进行再次比对,保留能与所述中间序列比对上的序列,确定支持所述潜在融合基因事件发生的序列的数目。

15、根据本申请的另一方面,提供了一种潜在融合基因事件的检测装置,所述装置包括:

16、中间序列获取模块,用于将基因测序序列与参考基因组进行比对,获取支持潜在融合基因事件发生的序列,并将支持所述潜在融合基因事件发生的序列拼接组装成一段中间序列;

17、断点位置获取模块,用于根据所述中间序列,获取所述潜在融合基因事件发生的断点位置。

18、可选地,所述装置还包括:

19、背景噪音序列去除模块,用于将基因测序序列与参考基因组进行比对,获取未比对至参考基因组上的序列;以及

20、将所述支持潜在融合基因事件发生的序列和所述未比对至参考基因组上的序列与所述中间序列进行比对,去除所述潜在融合基因事件的背景噪音序列。

21、可选地,所述装置还包括:

22、数目统计模块,用于对支持所述潜在融合基因事件发生的序列、所述未比对至参考基因组上的序列与所述中间序列进行再次比对,保留能与所述中间序列比对上的序列,确定支持所述潜在融合基因事件发生的序列的数目。

23、根据本申请的另一方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述潜在融合基因事件的检测方法。

24、依据本申请又一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述潜在融合基因事件的检测方法。

25、借由上述技术方案,本申请提供的一种潜在融合基因事件的检测方法及装置、存储介质、计算机设备,通过将支持潜在融合基因事件的所有支持潜在融合基因事件发生的序列重组装为一条包含断点两边序列的中间序列,并将这条中间序列比对回参考基因组的方案,可以检测断点的精确基因组位置,最后通过将基因测序序列比对到中间序列的方式去除背景噪音序列,可以获得准确支持潜在融合基因事件发生的序列的数目。本申请将重组装算法与比对算法结合,可以同时对潜在融合基因事件和支持潜在融合基因事件发生的序列进行过滤,滤掉大量假阳性融合基因事件,最大程度地提高了检测融合基因事件的断点位置的准确性。

26、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。



技术特征:

1.一种潜在融合基因事件的检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取所述潜在融合基因事件发生的断点位置之后,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述将基因测序序列与参考基因组进行比对,获取支持潜在融合基因事件发生的序列,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述将支持所述潜在融合基因事件发生的序列拼接组装成一段中间序列,具体包括:

5.根据权利要求4所述的方法,其特征在于,所述去除所述潜在融合基因事件的背景噪音序列之后,所述方法还包括:

6.一种潜在融合基因事件的检测装置,其特征在于,包括:

7.根据权利要求6所述的装置,其特征在于,所述装置还包括:

8.根据权利要求7所述的装置,其特征在于,所述装置还包括:

9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法。

10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法。


技术总结
本申请公开了一种潜在融合基因事件的检测方法及装置、存储介质、计算机设备,该方法包括:将基因测序序列与参考基因组进行比对,获取支持潜在融合基因事件发生的序列,并将支持所述潜在融合基因事件发生的序列拼接组装成一段中间序列;根据所述中间序列,获取支持所述潜在融合基因事件发生的相关信息,其中,所述相关信息包括所述潜在融合基因事件发生的断点位置以及支持所述潜在融合基因事件发生的序列数目。本申请有助于实现对融合基因事件的高准确识别。

技术研发人员:陈伟,郭维维,时晰
受保护的技术使用者:北京京安长德数据科技有限公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1