IGK基因重排的检测方法、装置、电子设备及存储介质与流程

文档序号:36241776发布日期:2023-12-02 04:20阅读:88来源:国知局
IGK的制作方法

本发明涉及基因检测,尤其涉及一种igk基因重排的检测方法、装置、电子设备及存储介质。


背景技术:

1、多能造血干细胞向淋巴细胞系定向分化时会发生基因重排,每一个淋巴细胞的基因重排序列均是独特的,也就是说正常淋巴细胞基因是多克隆性重排。但是淋巴瘤细胞及其子代细胞是同一个克隆,它们具有同样的基因编码,肿瘤细胞的dna扩增物电泳时会在特定的区域出现一条特异性条带。而淋巴结反应性增生患者及正常人的淋巴细胞的扩增物电泳时均为弥漫性条带。目前研究显示,基因重排均为后天获得的基因损伤,淋巴瘤细胞是由发生基因异常的细胞单克隆增殖形成,故出现单克隆性改变。这种单克隆的基因重排可作为检测细胞淋巴瘤的特异性分子标志物而用于b细胞淋巴瘤的诊断,并且此克隆性的检测有助于鉴别多克隆反应性增生和恶性增殖性疾病。

2、研究表明60%的b系儿童急性淋巴细胞白血病(b-all)病例中发现免疫球蛋白kappa(immunoglobulin kappa,简称igk)基因重排,而igk基因重排与kappa删除元件(简称kde基因)的缺失重排有关。kde基因的重组信号序列大致位于c基因片段的下游约24kb处,kde的重排类型具体有1)v-kde重排:kde的重组信号序列可重新排列为v基因片段,导致j基因、c基因缺失;2)j_c_intron-kde重排:j基因和c基因之间的内含子(intron)中的重组信号序列与kde基因的重组信号序列发生重排,导致c基因的缺失。

3、目前的基因重排检测工具包括migec、mixcr、igblast等,但均是对igh、igk、trb、trd等基因的v(d)j基因重排鉴定,缺乏对igk基因的vj基因重排、v-kde基因重排和j_c_intron-kde基因重排进行检测的方案。


技术实现思路

1、鉴于上述问题,本发明提出了一种igk基因重排的检测方法、装置、电子设备及存储介质,以解决或部分解决如何对igk基因重排中的vj基因重排、v-kde基因重排和j_c_intron-kde基因重排进行检测的技术问题。

2、第一方面,本发明通过一实施例提供一种igk基因重排的检测方法,包括:

3、获得测试样本的双端测序数据;所述双端测序数据包括第一端测序序列和第二端测序序列;

4、基于所述第一端测序序列和第二端测序序列进行组装,获得组装序列;

5、基于所述组装序列,从基因参考数据库中确定目标比对基因;其中,所述基因参考数据库包括生殖细胞系中的igkv基因库、igkj基因库、kde基因库和j_c_intron基因库,所述目标比对基因包括目标v基因、目标j基因、目标kde基因和目标j_c_intron基因中的至少一种;

6、基于所述目标比对基因,确定所述组装序列中的igk基因重排结果。

7、在一些可选的实施例中,所述第一端测序序列包括多个第一读长序列,所述第二端测序序列包括多个第二读长序列;

8、所述基于所述第一端测序序列和所述第二端测序序列进行组装,获得组装序列,包括:

9、遍历所述第一读长序列,确定与所述第一读长序列对应的第一相似读长序列;基于每一组所述第一读长序列和所述第一相似读长序列进行多数投票,获得第一端矫正序列;以及遍历所述第二读长序列,确定与所述第二读长序列对应的第二相似读长序列;基于每一组所述第二读长序列和所述第二相似读长序列进行多数投票,获得第二端矫正序列;

10、基于所述第一端矫正序列和所述第二端矫正序列进行组装,获得所述组装序列。

11、在一些可选的实施例中,所述基于每一组所述第一读长序列和所述第一相似读长序列进行多数投票,获得第一端矫正序列,包括:

12、基于每一组所述第一读长序列和所述第一相似读长序列,确定相似数量;在所述相似数量大于设定值时,对所述第一读长序列和所述第一相似读长序列中的每一位碱基进行多数投票,获得第一矫正读长序列;根据所有的所述第一矫正读长序列,获得所述第一端矫正序列;

13、所述基于每一组所述第二读长序列和所述第二相似读长序列进行多数投票,获得第二端矫正序列,包括:

14、基于每一组所述第二读长序列和所述第二相似读长序列,确定相似数量;在所述相似数量大于设定值时,对所述第二读长序列和所述第二相似读长序列中的每一位碱基进行多数投票,获得第二矫正读长序列;根据所有的所述第二矫正读长序列,获得所述第二端矫正序列。

15、在一些可选的实施例中,在获得所述第一端矫正序列和所述第二端矫正序列之后,所述检测方法还包括:

16、切除所述第一矫正读长序列中的接头序列,获得第一预处理读长序列,并根据所有的第一预处理读长序列获得第一端预处理序列;以及切除所述第二矫正读长序列中的接头序列,获得第二预处理读长序列,并根据所有的第二预处理读长序列获得第二端预处理序列;

17、所述基于所述第一端矫正序列和所述第二端矫正序列进行组装,获得所述组装序列,包括:

18、基于所述第一端预处理序列和所述第二端预处理序列进行组装,获得所述组装序列。

19、在一些可选的实施例中,在获得所述第一端预处理序列和所述第二端预处理序列之后,所述检测方法还包括:

20、删除长度低于第一设定长度的第一预处理读长序列,获得第一端待组装序列;以及删除长度低于所述第一设定长度的第二预处理读长序列,获得第二端待组装序列;

21、所述基于所述第一端预处理序列和所述第二端预处理序列进行组装,获得所述组装序列,包括:

22、基于所述第一端待组装序列和所述第二端待组装序列进行组装,获得所述组装序列。

23、在一些可选的实施例中,所述第一设定长度的取值范围为10bp至100bp。

24、在一些可选的实施例中,所述基于所述第一端待组装序列和所述第二端待组装序列进行组装,获得所述组装序列,包括:

25、获得所述第二预处理读长序列的反向互补读长序列;

26、根据所述第一预处理读长序列和所述反向互补读长序列,确定重叠序列;

27、在所述重叠序列的长度不低于第二设定长度时,删除所述反向互补读长序列中的重叠序列,获得待组装读长序列;

28、将所述第一预处理读长序列与所述待组装读长序列拼接,获得组装读长序列;

29、基于所有的所述组装读长序列,获得所述组装序列。

30、在一些可选的实施例中,所述基于所述组装序列,从目标基因参考数据库中确定目标比对基因,包括:

31、基于设定比对参数,从所述目标基因参考数据库中确定与每一条所述组装读长序列对应的目标比对基因;

32、所述设定比对参数包括:所述组装读长序列中的比对片段与所述目标比对基因的相似度不低于90%,所述比对片段的长度取值范围为4至11。

33、在一些可选的实施例中,在所述目标比对基因只包括所述目标v基因和所述目标j基因时,所述基于所述目标比对基因,确定所述组装序列中的igk基因重排结果,包括:

34、获得所述目标j基因中包括苯丙氨酸残基的核苷酸位置,基于所述核苷酸位置在所述组装序列中确定终止点;

35、在所述终止点之前的设定范围内检测所述组装序列中的半胱氨酸残基,将距所述终止点最近的半胱氨酸残基的位置点作为起始点;所述设定范围为所述终止点至所述终止点之前的60bp至90bp的组装序列片段;

36、根据所述起始点和所述终止点,确定所述组装序列中的cdr3区域。

37、在一些可选的实施例中,在所述目标比对基因只包括所述目标v基因和所述目标j基因时,所述基于所述目标比对基因,确定所述组装序列中的igk基因重排结果,包括:

38、基于所述目标v基因和所述目标j基因对所述组装序列进行聚类分析,获得所述组装序列中的克隆序列数以及克隆序列占比。

39、第二方面,本发明通过一实施例提供一种igk基因重排的检测装置,包括:

40、获取模块,用于获得测试样本的双端测序数据;所述双端测序数据包括第一端测序序列和第二端测序序列;

41、组装模块,用于基于所述第一端测序序列和第二端测序序列进行组装,获得组装序列;

42、比对模块,用于基于所述组装序列,从基因参考数据库中确定目标比对基因;其中,所述基因参考数据库包括生殖细胞系中的igkv基因库、igkj基因库、kde基因库和j_c_intron基因库,所述目标比对基因包括目标v基因、目标j基因、目标kde基因和目标j_c_intron基因中的至少一种;

43、确定模块,用于基于所述目标比对基因,确定所述组装序列中的igk基因重排结果。

44、第三方面,本发明通过一实施例提供一种电子设备,包括处理器和存储器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时使所述电子设备执行第一方面实施例中任一项所述检测方法的步骤。

45、第四方面,本发明通过一实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面实施例中任一项所述检测方法的步骤。

46、本发明提供的igk基因重排的检测方法,通过基于双端测序原始数据中的第一端测序序列和第二端测序序列组装得到组装序列,将所述组装序列与生殖细胞系的igkv基因库、igkj基因库、kde基因库和j_c_intron基因库中的基因参考序列进行对比,从所述基因库中确定出目标比对基因,包括目标v基因、目标j基因、目标kde基因和目标j_c_intron基因中的至少一种;基于目标比对基因确定所述组装序列中的igk基因重排结果。上述方法提供了一种对igk基因中的vj基因重排、v-kde基因重排和j_c_intron-kde基因重排进行自动化流程检测的方案,适用于对淋巴瘤的微小残留病变与复发监测、免疫组库测序等需求下游分析鉴定。

47、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1