一种检测基因融合的方法及装置的制造方法

文档序号:9780854阅读:435来源:国知局
一种检测基因融合的方法及装置的制造方法
【技术领域】
[0001]本发明设及生物信息学领域,具体而言,设及一种检测基因融合的方法及装置。
【背景技术】
[000引基因突变是指基因组DNA分子发生的突然的、可遗传的变异现象(gene mu化tion)。从分子水平上看,基因突变是指基因在结构上发生碱基对组成或排列顺序的改 变。基因虽然十分稳定,能在细胞分裂时精确地复制自己,但运种稳定性是相对的。在一定 的条件下基因也可W从原来的存在形式突然改变成另一种新的存在形式,就是在一个位点 上,突然出现了一个新基因,代替了原有基因,运个基因叫做突变基因。于是后代的表现中 也就突然地出现祖先从未有的新性状。
[0003] 基因突变是生物进化的重要因素之一,所W研究基因突变除了本身的理论意义W 外还有广泛的生物学意义。基因突变为遗传学研究提供突变型,为育种工作提供素材,所W 它还有科学研究和生产上的实际意义。
[0004] 有的基因突变是由于染色体发生结构变异形成。在自然条件或人为因素的影响 下,染色体发生的结构变异主要有:缺失、重复、倒位和易位,其中,基因融合也是染色体发 生结构变异的一种。所谓融合基因,是指将两个或多个基因的编码区首尾相连,置于同一套 调控序列(包括启动子、增强子、核糖体结合序列、终止子等)控制之下,构成的嵌合基因。
[0005] 目前,在二代测序中,常用的基因融合检测方法是基于全基因组的DNA水平上的高 通量测序,同时使用融合基因两端信号,加上统计学检验,判断融合的发生。但是全基因组 测序不可能有高的测序深度,而目标区域捕获的方法一般只设计并捕获常见融合基因的一 端,而另一端不设计探针导致没有信号,运两个问题都会导致融合检测的灵敏度非常低。

【发明内容】

[0006] 本发明旨在提供一种检测基因融合的方法及装置,W从DNA水平通过高通量测序 技术寻找融合序列,解决基于目标区域捕获的二代测序对于融合检测灵敏度低的技术问 题。
[0007] 为了实现上述目的,根据本发明的一个方面,提供了一种检测基因融合的方法。该 方法包括W下步骤:S1,提取待检测样本的DNA,然后打断、连接接头;S2,使用根据目标基因 订制的安捷伦探针利用目标区域捕获的方法捕获目标基因的待检融合中的驱动基因进而 得到目标DNA片段;S3,通过高通量测序的方法对目标DNA片段进行测序,得到融合形式的序 列;S4,过滤掉低质量的序列后,检测融合形式的序列;S4具体包括:S41,利用比对软件将S3 得到的融合形式的序列与相应的融合形式的参考序列相比对,未比对上的序列形成软截断 序列,并根据比对的位置进行排序,然后建立比对结果的索引文件;S42,将融合形式的序列 的比对结果提取出来,去掉PCR产生的重复序列,找到含有软截断序列的序列,把同一点的 多条序列支持的软截断序列进行组装,得到一致性序列,根据一致性序列过滤掉低质量的 序列,将剩下的符合要求的序列继续比对;其中,要求包括1)含有非相同软截断序列至少4 条,且可W匹配一致性序列;2)含有的不可W匹配一致性序列的软截断序列的个数少于可 W匹配一致性序列的软截断序列的个数;和3) -致性序列大于30nt;S43,检测已知融合形 式:分析S42的比对结果,如果比对到参考序列上的区域在COSMIC数据库中有与第一个断点 发生融合的记录,那么无论比对序列是否有同源序列,都放在结果中,并标记;W及检测新 的融合形式:分析S42的比对结果,如果比对上的区域在COSMIC数据库中没有与第一个断点 发生融合的记录,那么看比对序列是否有同源序列,去除同源性低的比对序列,将剩下结果 输出。
[000引进一步地,S41中的比对软件采用的是BWA-mem比对软件,建立比对结果索引文件 采用的软件是samtools软件。
[0009] 进一步地,S42中的使用Picard软件去掉PCR产生的重复序列。
[0010] 进一步地,S42中的多条序列为4条序列。
[00川进一步地,S43中,同源性低的比对序列是指使用BWA-mem默认参数比对结果中比 对质量小于10的序列。
[0012]根据本发明的另一个方面,提供一种检测基因融合的装置。该装置包括:DNA处理 模块,用于提取待检测样本的DNA,然后打断、连接接头;基因捕获模块,用于使用根据目标 基因订制的安捷伦探针利用目标区域捕获的方法捕获目标基因的待检融合中的驱动基因 进而得到目标DNA片段;测序模块,用于通过高通量测序的方法对目标DNA片段进行测序,得 到融合形式的序列;检测模块,用于过滤掉低质量的序列后,检测融合形式的序列;检测模 块具体包括:序列比对子模块,用于利用比对软件将检测模块得到的融合形式的序列与相 应的融合形式的参考序列相比对,未比对上的序列形成软截断序列,并根据比对的位置进 行排序,然后建立比对结果的索引文件;序列筛选子模块,用于将融合形式的序列的比对结 果提取出来,去掉PCR产生的重复序列,找到含有软截断序列的序列,把同一点的多条序列 支持的软截断序列进行组装,得到一致性序列,根据一致性序列过滤掉低质量的序列,将剩 下的符合要求的序列继续比对;其中,要求包括1)含有非相同软截断序列至少4条,且可W 匹配一致性序列;2)含有的不可W匹配一致性序列的软截断序列的个数少于可W匹配一致 性序列的软截断序列的个数;和3) -致性序列大于30nt(碱基长度);检测已知融合形式子 模块:用于分析序列筛选子模块的比对结果,如果比对到参考序列上的区域在COSMIC数据 库中有与第一个断点发生融合的记录,那么无论比对序列是否有同源序列,都放在结果中, 并标记;W及检测新的融合形式子模块:用于分析序列筛选子模块的比对结果,如果比对上 的区域在COSMIC数据库中没有与第一个断点发生融合的记录,那么看比对序列是否有同源 序列,去除同源性低的比对序列,将剩下结果输出。
[001引进一步地,序列筛选子模块中的比对软件采用的是BWA-mem比对软件,建立比对结 果索引文件采用的软件是samtools软件。
[0014] 进一步地,序列筛选子模块中的使用Picard软件去掉PCR产生的重复序列。
[0015] 进一步地,序列筛选子模块中的多条序列为4条序列。
[0016] 进一步地,检测新的融合形式子模块中,同源性低的比对序列是指使用BWA-mem默 认参数比对结果中比对质量小于10的序列。
[0017] 应用本发明的技术方案,结合目标区域捕获技术、高通量测序技术及融合序列信 息分析,提供了一套高灵敏度的从DNA中检测融合的流程。其中,通过目标区域捕获技术的 捕获常发生融合的基因,仅对常发生融合的基因进行测序,极大的降低了测序成本;另外, 利用目标区域捕获下融合驱使基因的单端融合信号加上数据库可W对目标区域捕获的基 因数据的融合检出有非常高的灵敏度。
【附图说明】
[0018] 构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示 意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0019] 图1示出了根据本发明一实施例的检ii基因融合的方法的流程示意图;从及
[0020] 图2示出了根据本发明一实施例的组装软截断序列的步骤与判断可信度的示意 图。
【具体实施方式】
[0021] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可W相 互组合。下面将参考附图并结合实施例来详细说明本发明。
[0022] 目前,在二代测序中,常用的基因融合检测方法是基于全基因组的DNA水平上的高 通量测序,同时使用融合基因两端信号,加上统计学检验,判断融合的发生。但是全基因组 测序不可能有高的测序深度,而目标区域捕获的方法一般只设计并捕获常见融合基因的一 端,而另一端不设计探针导致没有信号,运两个问题都会导致融合检测的灵敏度非常低。针 对现有技术中的上述不足,本发明提供了 W下技术方案。
[0023] 根据本发明一种典型的实施方式,提供一种检测基因融合的方法。该方法包括W 下步骤:S1,提取待检测样本的DNA,然后打断、连接接头;S2,使用根据目标基因订制的安捷 伦探针利用目标区域捕获的方法捕获目标基因的待检融合中的驱动基因进而得到目标DNA 片段;S3,通过高通量测序的方法对目标DNA片段进行测序,得到融合形式的序列;S4,过滤 掉低质量的序列后,检测融合形式的序列;S4具体包括:S41,利用比对软件将S3得到的融合 形式的序列与相应的融合形式的参考序列相比对,未比对上的序列形成软截断序列,并根 据比对的位置进行排序,然后建立比对结果的索引文件;S42,将融合形式的序列的比对结 果提取出来,去掉PCR产生的重复序列,找到含有软截断序列的序列,把同一点的多条序列 支持的软截断序列进行组装,得到一致性序列,根据一致性序列过滤掉低质量的序列,将剩 下的符合要求的序列继续比对;其中,要求包括1)含有非相同软截断序列至少4条,且可W 匹配一致性序列;2)含有的不可W匹配一致性序列的软截断序列的个数少于可W匹配一致 性序列的软截断序列的个数;和3) -致性序列大于30碱基长度;S43,检测已知融合形式:分 析S42的比对结果,如果比对到参考序列上的区域在COSMIC数据库中有与第一个断点发生 融合的记录,那么无论比对序列是否有同源序列,都放在结果中,并标记;W及检测新的融 合形式:分析S4
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1