一种基于测序的杂交鱼类基因重组分析方法及装置与流程

文档序号:33022509发布日期:2023-01-20 18:53阅读:53来源:国知局
一种基于测序的杂交鱼类基因重组分析方法及装置与流程

1.本发明涉及生物杂交基因技术领域,尤其涉及一种基于测序的杂交鱼类基因重组分析方法及装置。


背景技术:

2.基因组重组是指整个基因组中发生的全部基因重组事件。狭义的基因重组是指dna分子发生断裂—复合,造成基因型变化的过程,主要分为同源重组、位点特异性重组和异常重组等。从参考基因组的角度观察,发生基因重组的基因组与参考基因组比较,即染色体序列发生较大变异,包括插入、缺失、易位、倒位和重排等,这些类型的变异被称为基因组的结构变异(structural variation,sv,结构变异还包含其他类型)。识别基因组重组的方法就是通过与参考基因组比较,找到整个基因组中发生的这些特定类型的结构变异。
3.如果基因组重组正好发生在两个基因之间,而且重组以后的基因能够在细胞中正常表达,这类基因被称为融合基因。可以通过测定表达的rna分子来确定融合基因,这也是一种用来识别基因组重组的方法。
4.目前主要的分析方法就是通过高通量测序得到大量序列片段,然后与参考基因组比对并识别对应的结构变异。根据采用的测序技术不同,可以分为以第二代测序技术为主的分析方法(如delly,manta和pindel等)和以第三代测序技术为主的分析方法(如cutesv,sniffles和svim等)。但是,目前在测序中,第二代测序的读长较短,依靠pair-end双端序列比对的信息,对于跨度比较大的结构变异检测效率和准确率比较低,而第三代测序的序列错误率较高,长序列的比对受到测序错误的影响,另外断点的检测也会受到测序错误的影响。


技术实现要素:

5.针对现有技术中存在的问题,本发明实施例提供一种基于测序的杂交鱼类基因重组分析方法及装置。
6.本发明实施例提供一种基于测序的杂交鱼类基因重组分析方法,包括:接收杂交鱼类基因样本,并对所述基因样本进行测序,得到对应的测序数据,并根据所述测序数据得到对应的第一统计数据及对应的第一统计图;根据所述测序数据的测序类型确定对应的比对软件及识别软件,并获取预设的鱼类基因组集合,通过所述比对软件,将所述测序数据比对到所述鱼类基因组集合,得到对应的比对结果,并统计所述比对结果得到对应的第二统计数据及对应的第二统计图;通过所述多种识别软件识别所述比对结果中的结构变异,得到对应的多种基因重组结果,并获取所述基因重组结果的交集,得到对应的重组基因集;根据所述重组基因集绘制对应的circos图,并绘制重组基因集中每个重组基因位点的示意图。
7.在其中一个实施例中,所述方法还包括:
当所述测序数据为dna数据时,所述通过所述识别软件识别所述比对结果中的结构变异,包括:通过所述识别软件识别所述比对结果在基因组的结构变异;当所述测序数据为rna数据时,所述通过所述识别软件识别所述比对结果中的融合基因,包括:通过所述识别软件识别所述比对结果在基因组的融合基因。
8.在其中一个实施例中,所述方法还包括:将所述第一统计图、第二统计图、circos图、示意图与所述杂交鱼类基因样本对应保存,并将保存的数据更新到基因样本数据库。
9.在其中一个实施例中,所述方法还包括:对所述基因样本进行预处理,所述预处理包括:去除基因样本中的接头序列、两端低质量序列及包含连续多个n碱基或者长度低于预设阈值的序列。
10.在其中一个实施例中,所述测序数据,包括:第二代测序数据、第三代测序数据。
11.在其中一个实施例中,所述第一统计数据、第二统计数据,包括:基因序列数量、基因序列参数、基因数据总量。
12.本发明实施例提供一种基于测序的杂交鱼类基因重组分析装置,包括:接收模块,用于接收杂交鱼类基因样本,并对所述基因样本进行测序,得到对应的测序数据,并根据所述测序数据得到对应的第一统计数据及对应的第一统计图;比对模块,用于根据所述测序数据的测序类型确定对应的比对软件及识别软件,并获取预设的鱼类基因组集合,通过所述比对软件,将所述测序数据比对到所述鱼类基因组集合,得到对应的比对结果,并统计所述比对结果得到对应的第二统计数据及对应的第二统计图;识别模块,用于通过多种所述识别软件识别所述比对结果中的结构变异,得到对应的基因重组结果,并获取所述基因重组结果的交集,得到对应的融合基因集;绘制模块,用于根据所述重组基因集绘制对应的circos图,并绘制重组基因集中每个重组基因位点的示意图。
13.在其中一个实施例中,所述装置还包括:第一识别模块,用于当所述测序数据为dna数据时,通过所述识别软件识别所述比对结果在基因组的结构变异;第二识别模块,用于当所述测序数据为rna数据时,通过所述识别软件识别所述比对结果在基因组的融合基因。
14.本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于测序的杂交鱼类基因重组分析方法的步骤。
15.本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述基于测序的杂交鱼类基因重组分析方法的步骤。
16.本发明实施例提供的一种基于测序的杂交鱼类基因重组分析方法及装置,接收杂交鱼类基因样本,并对基因样本进行测序,得到对应的测序数据,并根据测序数据得到对应
的第一统计数据及对应的第一统计图;根据测序数据的测序类型确定对应的比对软件及识别软件,并获取预设的鱼类基因组集合,通过比对软件,将所述测序数据比对到鱼类基因组集合,得到对应的比对结果,并统计比对结果得到对应的第二统计数据及对应的第二统计图;通过识别软件识别所述比对结果中的结构变异,得到对应的基因重组结果,并获取基因重组结果的交集,得到对应的重组基因集;根据重组基因集绘制对应的circos图,并绘制基因集中每个重组基因位点的示意图。这样能够准确的对杂交鱼类的基因组重组进行分析,识别鱼类杂交过程中产生的基因组重组位点,并提高了测序分析的自动化程度和计算效率,也更直观的让用户观测杂交鱼类基因的重组情况。
附图说明
17.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
18.图1为本发明实施例中一种基于测序的杂交鱼类基因重组分析方法的流程图;图2为本发明实施例中一种基于测序的杂交鱼类基因重组分析装置的结构图;图3为本发明实施例中电子设备结构示意图。
具体实施方式
19.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.图1为本发明实施例提供的一种基于测序的杂交鱼类基因重组分析方法的流程示意图,如图1所示,本发明实施例提供了一种基于测序的杂交鱼类基因重组分析方法,包括:步骤s101,接收杂交鱼类基因样本,并对所述基因样本进行测序,得到对应的测序数据,并根据所述测序数据得到对应的第一统计数据及对应的第一统计图。
21.具体地,接收需要检测的杂交鱼类基因样本,对基因样本进行测序,得到测序数据,其中,测序数据可以包括第二代测序数据、第三代测序数据,然后根据测序数据得到对应的第一统计数据及对应的第一统计图,其中,第一统计数据可以为基因序列数量、基因序列参数、基因数据总量。
22.另外,对基因样本还可以进行预处理,预处理包括:去除基因样本中的接头序列、两端低质量序列及包含连续多个n碱基或者长度低于预设阈值的序列,然后测序得到对应的测序数据,以及当测序数据为第二代测序数据时,还可以进行质量控制和数据过滤。
23.步骤s102,根据所述测序数据的测序类型确定对应的比对软件及识别软件,并获取预设的鱼类基因组集合,通过所述比对软件,将所述测序数据比对到所述鱼类基因组集合,得到对应的比对结果,并统计所述比对结果得到对应的第二统计数据及对应的第二统计图。
24.具体地,根据测序数据的测序类型确定对应的比对软件及识别软件,即根据测序
数据是第二代测序数据或者是第三代测序数据选择对应的比对软件及识别软件,然后获取预设的鱼类基因组集合,比如鲤鱼基因组、鲫鱼基因组、鲈鱼基因组等等一系列为杂交原样本的鱼类基因组集合,然后通过比对软件,将测序数据比对到鱼类基因组集合,得到对应的比对结果,其中,比对结果可以是测序数据中与鱼类基因组集合中序列相同的基因数据,比对软件可以包括用于第二代测序数据的短序列测序数据与参考基因组比对的软件,比如bwa,也可以包括用于第三代测序数据的长序列测序数据与参考基因组比对软件,比如minimap2、ngmlr,然后统计比对结果得到对应的第二统计数据及对应的第二统计图,得到测序数据对应的统计数据。
25.步骤s103,通过所述多种识别软件识别所述比对结果中的结构变异,得到对应的基因重组结果,并获取所述基因重组结果的交集,得到对应的重组基因集。
26.具体地,通过对应的识别软件识别比对结果中的结构变异,其中,当测序数据为dna数据时,通过识别软件识别比对结果在基因组的结构变异,包括,选择合适的sv软件(识别软件)识别基因组上的结构变异,然后筛选其中染色体重组的结果为基因集合,当测序数据为rna数据时,通过识别软件识别比对结果在基因的结构变异,包括,选择合适的软件识别重组基因为融合基因,然后获取融合基因的交集,即包含基因集合的数量大于1的集合,为对应的融合基因。
27.步骤s104,根据所述重组基因集绘制对应的circos图,并绘制重组基因集中每个融合基因位点的示意图。
28.具体地,根据重组基因集绘制对应的circos图,并绘制重组基因集中每个重组基因位点的示意图,从而方便用户更直观的观测杂交鱼类基因的重组情况。
29.另外, 还可以将第一统计图、第二统计图、circos图、示意图与杂交鱼类基因样本对应保存,并将保存的数据更新到基因样本数据库,方便用户后续得到更准确的基因融合数据。
30.本发明实施例提供的一种基于测序的杂交鱼类基因重组分析方法,接收杂交鱼类基因样本,并对基因样本进行测序,得到对应的测序数据,并根据测序数据得到对应的第一统计数据及对应的第一统计图;根据测序数据的测序类型确定对应的比对软件及识别软件,并获取预设的鱼类基因组集合,通过比对软件,将所述测序数据比对到鱼类基因组集合,得到对应的比对结果,并统计比对结果得到对应的第二统计数据及对应的第二统计图;通过识别软件识别所述比对结果中的结构变异,得到对应的基因重组结果,并获取基因重组结果的交集,得到对应的重组基因集;根据重组基因集绘制对应的circos图,并绘制基因集中每个重组基因位点的示意图。这样能够准确的对杂交鱼类的基因组重组进行分析,识别鱼类杂交过程中产生的基因组重组位点,并提高了测序分析的自动化程度和计算效率。
31.图2为本发明实施例提供的一种基于测序的杂交鱼类基因重组分析装置,包括:接收模块s201、比对模块s202、识别模块s203、绘制模块s204,其中:接收模块s201,用于接收杂交鱼类基因样本,并对所述基因样本进行测序,得到对应的测序数据,并根据所述测序数据得到对应的第一统计数据及对应的第一统计图。
32.比对模块s202,用于根据所述测序数据的测序类型确定对应的比对软件及识别软件,并获取预设的鱼类基因组集合,通过所述比对软件,将所述测序数据比对到所述鱼类基因组集合,得到对应的比对结果,并统计所述比对结果得到对应的第二统计数据及对应的
第二统计图。
33.识别模块s203,用于通过多种所述识别软件识别所述比对结果中的结构变异,得到对应的基因重组结果,并获取所述基因重组结果的交集,得到对应的重组基因集。
34.绘制模块s204,用于根据所述重组基因集绘制对应的circos图,并绘制重组基因集中每个重组基因位点的示意图。
35.在一个实施例中,装置还可以包括:第一识别模块,用于当所述测序数据为dna数据时,通过所述识别软件识别所述比对结果在基因组的结构变异。
36.第二识别模块,用于当所述测序数据为rna数据时,通过所述识别软件识别所述比对结果在基因的结构变异。
37.在一个实施例中,装置还可以包括:更新模块,用于将所述第一统计图、第二统计图、circos图、示意图与所述杂交鱼类基因样本对应保存,并将保存的数据更新到基因样本数据库。
38.关于基于测序的杂交鱼类基因重组分析装置的具体限定可以参见上文中对于基于测序的杂交鱼类基因重组分析方法的限定,在此不再赘述。上述基于测序的杂交鱼类基因重组分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
39.图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302、通信接口(communications interface)303和通信总线304,其中,处理器301,存储器302,通信接口303通过通信总线304完成相互间的通信。处理器301可以调用存储器302中的逻辑指令,以执行如下方法:接收杂交鱼类基因样本,并对基因样本进行测序,得到对应的测序数据,并根据测序数据得到对应的第一统计数据及对应的第一统计图;根据测序数据的测序类型确定对应的比对软件及识别软件,并获取预设的鱼类基因组集合,通过比对软件,将所述测序数据比对到鱼类基因组集合,得到对应的比对结果,并统计比对结果得到对应的第二统计数据及对应的第二统计图;通过识别软件识别所述比对结果中的结构变异,得到对应的基因重组结果,并获取基因重组结果的交集,得到对应的重组基因集;根据重组基因集绘制对应的circos图,并绘制基因集中每个重组基因位点的示意图。
40.此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
41.另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如
包括:接收杂交鱼类基因样本,并对基因样本进行测序,得到对应的测序数据,并根据测序数据得到对应的第一统计数据及对应的第一统计图;根据测序数据的测序类型确定对应的比对软件及识别软件,并获取预设的鱼类基因组集合,通过比对软件,将所述测序数据比对到鱼类基因组集合,得到对应的比对结果,并统计比对结果得到对应的第二统计数据及对应的第二统计图;通过识别软件识别所述比对结果中的结构变异,得到对应的基因重组结果,并获取基因重组结果的交集,得到对应的重组基因集;根据重组基因集绘制对应的circos图,并绘制基因集中每个重组基因位点的示意图。
42.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
43.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
44.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1