一种检测生物样本中基因融合的引物组合、试剂盒及方法与流程

文档序号:33771922发布日期:2023-04-18 21:42阅读:32来源:国知局
一种检测生物样本中基因融合的引物组合、试剂盒及方法与流程

本发明属于基因组学,具体地,涉及一种检测生物样本中基因融合的引物组合、试剂盒及方法。


背景技术:

1、融合基因,是指将两个或多个基因的编码区首尾相连,置于同一套调控序列(包括启动子、增强子、核糖体结合序列、终止子等)控制之下,构成的嵌合基因。融合基因是肿瘤产生的重要原因,实体瘤中最常见融合基因是酪氨酸激酶(如alk、ros1和ret等),融合突变导致下游细胞信号通路激活,细胞无限增殖。融合基因检测,目前主要检测方法包括荧光原位杂交(fish)、聚合酶链反应(pcr)、免疫组化(ihc)和高通量测序(ngs)等几种方法,从dna、rna和蛋白质等水平进行检测。现阶段基于ngs检测的方法有两种:

2、1、基于dna层面,使用探针捕获方法获得融合基因序列,可以检测未知融合类型,但是存在以下技术难点:

3、1)融合基因检测要覆盖非常冗长且含有大量重复序列的内含子区域才能准确地找到融合断裂点;2)高gc含量不利于探针有效捕获目标区域片断;3)不同基因的内含子含有非常相似的重复序列,这一特征不利于序列准确对比,影响检测准确性;4)复杂的转录或转录后的剪接加工过程,可能会影响基因的融合。

4、2、基于rna层面,使用多重聚合酶链式反应(pcr)方法扩增靶向融合基因,但是无法检测未知融合基因,某些融合基因的伙伴基因较多,发生频率较为一致,多重pcr方法难以完全覆盖。


技术实现思路

1、为了解决上述技术问题中的至少一个,本发明采用的技术方案如下:

2、本发明第一方面提供一种检测生物样本中基因融合的引物组合,包括靶向至少一种目标基因的靶向引物组合,靶向引物包括基因靶向区域序列,所述基因靶向区域序列的设计原则为:

3、(1)基因靶向序列设计在融合基因断点30~100bp区域内;

4、(2)基因靶向区域长度为15-30nt,tm值为60-70之间,gc含量为35~65%;

5、(3)基因靶向区域不会与非靶向区域结合,不存在稳定的二级结构。

6、在本发明中,基因融合是指一个基因在某一点上异常断裂,与另一个基因融合,形成一个由两个原本相距遥远的基因组成的杂交基因。基因融合也被称为基因重排,即基因在染色体上的排列顺序发生变化。

7、在本发明的一些实施方案中,所述目标基因包括alk、ros1、ret、ntrk1、ntrk2和ntrk3。

8、alk是一种受体酪氨酸激酶,属于胰岛素受体超家族。人alk基因位于2号染色体p23.2-p23.1,编码1620个氨基酸,经过翻译后修饰生成200~220kda的成熟alk蛋白。alk在神经系统的发育和功能中扮演重要角色,在小肠、睾丸、前列腺及结肠中也有表达,但其在正常淋巴组织、肺及其他组织中不表达。alk基因融合是指alk发生断裂并与其他基因融合,翻译后alk融合蛋白构象改变,影响自身磷酸化,而导致肿瘤的发生。

9、任选地,靶向alk的基因靶向区域序列选自seq id no.6和seq id no.7所中的至少一种,优选地为两种,分别靶向alk的20和6号外显子。

10、ros1属于胰岛素受体家族的一种单体型受体酪氨酸激酶。其在人类中的生物学作用尚未明确,仍然是一个“孤儿”受体酪氨酸激酶,目前尚未找到已知的配体。ros1基因最初是于1986年在鸟肉瘤病毒(ur2)发现的具有独特致癌作用的基因序列。2007年科学家首次在非小细胞肺癌(nsclc)中发现ros1基因重排,并在卵巢癌、胃癌、大肠癌等恶性肿瘤中也同样观察到该靶点基因融合现象。

11、任选地,靶向ros1的基因靶向区域序列选自seq id no.8~seq id no.12中的至少一种,优选地,为5种,分别靶向ros1的32、34、35和36号外显子。

12、ret(rearranged during transfection)基因定位于第10号染色体长臂(10q11.21),其dna全长约为60kb,含有21个外显子,其编码的ret蛋白属于受体酪氨酸激酶(receptor tyrosine kinase,rtk)蛋白家族,是由1143个跨膜氨基酸残基构成的蛋白聚合体,具有rtk的经典结构:一个富含半胱氨酸的钙粘连素样细胞外区、一个跨膜区和一个具有催化酪氨酸激酶作用的细胞内区。ret融合均为体细胞融合,至今未发现胚系ret融合。不同的染色体间易位或染色体内倒位、串联重复或中间缺失可导致基因融合。ret原癌基因能与多种基因发生融合,常以本身断裂再与另一基因接合的方式,导致ret的激酶结构域编码区的3’端与多种异源上游伴侣基因的5’端发生融合,重组成一个新的基因(融合基因)。

13、任选地,靶向ret的基因靶向区域序列选自seq id no.13~seq id no.15中的至少一种;优选地,为3种,分别靶向ret的11、12和7号外显子。

14、trk(tropomyosin-related kinase,原肌球蛋白相关激酶)蛋白是一类神经生长因子受体,属于酪氨酸激酶,trk家族共包含3个高度同源的蛋白——trka、trkb、trkc,这三个蛋白分别由ntrk1、ntrk2和ntrk3基因编码。trk与细胞增殖、分化、代谢、凋亡等密切相关。

15、任选地,靶向ntrk1的基因靶向区域序列选自seq id no.16~seq id no.18中的至少一种;优选地,为3种,分别靶向ntrk1的9、10和4号外显子。

16、任选地,靶向ntrk2的基因靶向区域序列选自seq id no.19和seq id no.20中的至少一种;优选地,为2种,分别靶向ntrk2的13和16号外显子。

17、任选地,靶向ntrk3的基因靶向区域序列选自seq id no.21和seq id no.22中的至少一种;优选地,为2种,分别靶向ntrk3的4和6号外显子。

18、进一步地,所述目标基因还包括tbp和/或hmbs。tbp和hmbs为内参基因。

19、更进一步地,靶向tbp的基因靶向区域序列如seq id no.23所示;靶向hmbs的基因靶向区域序列如seq id no.24所示。

20、在本发明的一些实施方案中,所述靶向引物还包括通用区域序列,所述靶向引物由所述通用区域序列和所述基因靶向区域序列按5'-3'顺序连接,其中,所述通用区域序列如seq id no.5所示。

21、本发明第二方面提供一种检测生物样本中基因融合的试剂盒,包括本发明第一方面任一所述的引物组合。

22、在本发明的一些方案中,所述试剂盒还包括第一扩增引物、第二扩增引物、第一接头引物和第二接头引物,所述第一扩增引物、第二扩增引物、第一接头引物和第二接头引物的序列分别如seq id no.1~seq id no.4所示。

23、当试剂盒中包括第一扩增引物、第二扩增引物、第一接头引物和第二接头引物时,基因靶向区域在设计时还不能与第一扩增引物、第二扩增引物、第一接头引物或第二接头引物形成稳定的二级结构。

24、本发明第三方面提供一种基于高通量测序检测生物样本中基因融合的方法,包括以下步骤:

25、s1,获得所述生物样本的rna样本并进行片段化处理,然后进行反转录得到cdna;

26、s2,cdna产物进行二链合成,末端修复,利用第一接头引物和第二接头引物添加接头;

27、s3,利用本发明第一方面包括通用区域序列的引物组合和第一扩增引物对连接产物进行第一pcr扩增,得到第一pcr扩增产物;

28、s4,利用第一扩增引物和第二扩增引物对所述第一pcr扩增产物进行第二pcr扩增,纯化后得到第二pcr产物,即为测序文库;

29、s5,对步骤s4所述的测序文库进行高通量测序,根据测序结果判断是否存在基因融合,

30、所述第一扩增引物、第二扩增引物、第一接头引物和第二接头引物分别如seq idno.1~seq id no.4所示。

31、在本发明的一些实施方案中,步骤s2中,将第一接头引物和第二接头引物按1:1混合得到接头混合溶液,按下表体系进行反应配制:

32、 名称 体积(μl) 二链合成产物 60 连接缓冲液 30 连接酶 5 接头混合溶液 1 无核酸酶水 4

33、接头连接反应程序:20℃15分钟,4℃保持。

34、在本发明的一些实施方案中,步骤s3中,所述第一pcr扩增反应体系如下表:

35、

36、

37、第一pcr扩增反应程序为:98℃5分钟;98℃10秒,60℃4分钟,72℃30秒,15个循环;72℃5分钟,4℃保持。得到第一pcr扩增产物。

38、在本发明的一些实施方案中,步骤s4中,所述第二pcr扩增按下表进行反应体系配制:

39、 名称 体积(μl) 第一pcr扩增产物 27 第一扩增引物 1.5 第二扩增引物 1.5

40、第二pcr扩增的反应程序为:98℃2分钟;98℃10秒,60℃30秒,72℃30秒,15个循环;72℃5分钟,4℃保持。

41、在本发明的一些实施方案中,步骤s6中,利用比对软件对测序数据进行分析,得到比对基因位置、基因融合、支持数信息,根据支持数信息进行判定,若大于预设阈值,则判定为基因融合。

42、在本发明的一些实施方案中,所述方法为非诊断和治疗目的的。

43、本发明的有益效果

44、相对于现有技术,本发明的有益效果如下:

45、利用本发明的引物组合,解决了探针捕获法的精度不高,分析准确性较低的问题。

46、利用本发明的引物组合、试剂盒和方法,可以用于检测未知融合基因。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1