基因分型的方法

文档序号:393266阅读:457来源:国知局
专利名称:基因分型的方法
技术领域
本发明涉及基因分型的方法,特别涉及被分配给各基因型的ID序列,以及使用所述ID序列的多重基因分型方法。
背景技术
已开发的检测感染性生物体的方法包括传统的通过培养来鉴别病原体的物理和化学特征的方法,以及检测病原体的特定遗传特征的方法。遗传特征的检测方法包括 限制性片段长度多态性(RFLP)分析、扩增片段长度多态性(AFLP)分析、脉冲场凝胶电泳、任意引物聚合酶链反应(AP-PCR)技术,基于重复序列的PCR,核糖分型和比较核酸测序。这些方法用于大多数诊断设置通常显得过于缓慢、昂贵、不可重复,并且技术要求高。所有上述方法一般都需要使用繁琐的凝胶电泳步骤、病原体在培养过程中的生长、其基因组的DNA纯化,以及样本不包含多于一种类型的生物体。这些限制也存在于最近开发的采用高密度微阵列的检测方法(Salazar et al. , Nucleic Acids Res. 24 :5056-5057,1996 ;Troeschet al.,J. Clin. Microbiol. 37 :49-55,1999 ;Lashkari et al.,Proc. Natil. Acad. Sci.U. S. A. 94 :13057-13062,1997)。与此同时,焦磷酸测序是一种基于“通过DNA合成测序”原则的DNA测序方法,它不同于传统的Sanger测序方法,而是依赖于检测核苷酸插入过程中释放的焦磷酸。在焦磷酸测序法中,在聚合过程中顺序地逐一添加四种脱氧核苷酸三磷酸(dNTPs)。与通过酶促反应被聚合的dNTPs结合的PPi发出光,并且发出的光根据顺序地添加的dNTPs的反应顺序而显示出信号峰,峰显示出与反应的dNTPs的数目成比例的多或者少的模式,这样能够确定病原体的核苷酸序列。近年来,已经使用了对病原体特异序列的PCR产物进行焦磷酸测序,基于由此获得的热裂解谱图(pyrogram)对临床标本中的病原细菌或病毒进行检测的方法(Travasso, CM et al, J. Biosci. ,33 :73-80, 2008 ;Gharizadeh,Bet al. ,Molecular and Cellular Probes,20,230-238,2006 ;Hoffmann,C et al. ,NucleicAcid Research,1-8,2007)。然而,在上述焦磷酸测序技术中,核苷酸测序是根据dNTPs的分配顺序来进行,并且在模版中的不处于分配顺序中的核苷酸不会参加反应,因此不会形成信号峰。然而,当在所述分配顺序中相同的核苷酸持续出现时,根据所发射出的光的强度而确定信号峰的高度。因此,当多种病原体存在于同一样品中,不同病原体核苷酸的信号峰将出现重叠,因此,这使通过解释热裂解谱图来鉴定病原体变得困难。特别是随着重复序列数目增加时,前面序列的信号峰变得相对较低。因此,在多种病原体感染的情况下,根据每种病原体的感染程度来检测信号峰变得困难。因此,本发明付出大量的努力,使得能通过利用焦磷酸测序进行基因分型获得的独特且简单的热裂解谱图来获得所感兴趣的基因型。结果,本发明发明者发现,当ID序列含有ID标记、标记物和终止标记,同时所述ID序列独立存在于需要进行分型的特异性序列之外时,将所述ID序列与该特异性序列接连并用于进行焦磷酸测序,将获得针对于每种基因型的独特且简单的热裂解谱图,从而完成本发明。

发明内容
本发明的目的是提供一种ID序列,所述ID序列可用于进行焦磷酸测序,以便能通过独特、简单的热裂解谱图确定感兴趣的基因型。本发明的另一个目的是提供使用所述ID序列的基因分型方法。本发明又另一个目的是提供使用所述ID序列对HPV基因分型的方法。本发明再另一目的是提供使用所述ID序列检测KRAS基因突变的方法。本发明又一目的是提供使用所述ID序列检测呼吸道病毒的方法。
为了实现上述目的,本发明提供一种用于基因分型的ID序列,其由A (ID-S) n-E组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸^是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是从I到32的自然数。本发明还提供一种用于基因分型的ID序列,由ID-S组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸;并且S是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸。本发明也提供一种基因分型引物,包括与所述ID序列连接的用于基因分型的基因特异性序列。本发明也提供一种基因分型的方法,其包括使用所述基因分型引物。本发明也提供一种用于HPV基因分型的方法,该方法的步骤包括(a)根据每种HPV病毒的基因型设计用于基因分型的ID序列,该ID序列由(ID-S) n-E组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸4是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是从I到32的自然数;(b)构建基因分型引物,所述基因分型引物由焦磷酸测序引物序列、ID序列和对应于该ID序列的对病毒基因型特异的序列组成;(c)使用该基因分型引物,通过PCR扩增含有HPV病毒的样品;以及(d)以扩增的PCR产物进行焦磷酸测序来获得一序列用作ID序列,并根据该ID序列区分HPV的基因型。本发明也提供一种用于检测KRAS基因突变的方法,该方法的步骤包括(a)根据各KRAS基因突变来设计用于基因分型的ID序列,该ID序列由(ID-S) n-E组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸4是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是从I到32的自然数;(b)构建检测引物,该检测引物由焦磷酸测序引物序列、ID序列和对应于该ID序列的对KRAS基因突变特异的序列组成;(c)使用该检测引物,通过PCR扩增含有KRAS基因的样品;以及(d)以扩增的PCR产物进行焦磷酸测序来获得ID序列的热裂解谱图,并根据该ID序列检测KRAS基因突变。本发明也提供了一种用于检测呼吸道病毒的方法,该方法的步骤包括(a)根据流行性感冒A病毒、流行性感冒B病毒、RSV (呼吸道合胞病毒)B、鼻病毒和冠状病毒0C43的基因型各设计用于基因分型的ID序列,该ID序列由(ID-S)n-E组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸;S是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是从I到32的自然数;(b)构建检测引物,该检测引物由焦磷酸测序引物序列、ID序列和对应于该ID序列的对呼吸道病毒基因特异的序列组成;(c)使用检测引物,通过PCR扩增含有呼吸道病毒的样品,该呼吸道病毒选自由流行性感冒A病毒、流行性感冒B病毒、呼吸道合胞病毒B、鼻病毒和冠状病毒0C43的组成的组;以及(d)以扩增的PCR产物进行焦磷酸测序来获得ID序列的热裂解谱图,并根据该ID序列检测呼吸道病毒。


图I示出焦磷酸测序过程,该过程根据分配顺序进行,然后得到热裂解谱图。图2示出根据分析序列的热裂解谱图中的信号峰变化。图3示出根据分析序列的热裂解谱图中的信号峰变化。
图4示出由于标记物插入引起的热裂解谱图中的信号峰变化。图5示出从两个不同的分析序列的混合物获得的热裂解谱图。图6示出在分配顺序中标记物的存在或缺失获得的热裂解谱图。图7示出根据序列末端标记物的改变,热裂解谱图模式的变化。图8示出终止标记的缺失获得的热裂解谱图。图9示出终止标记的缺失获得的热裂解谱图。图10示出根据标记物顺序改变的分配顺序改变。图11示出根据分配顺序来设计ID序列的方法。图12示出设计分配顺序的方法。图13示出根据分配顺序通过ID序列获得的热裂解谱图。图14示出确定分配顺序后设计ID序列的方法。图15示出根据分配顺序通过ID序列获得的热裂解谱图。图16示出利用本发明ID序列进行HPV基因分型的方法。图17示出用于检测KRAS突变的总体系。图18示出使用本发明的ID序列检测KRAS突变的方法。图19示出通过使用本发明的ID序列对15种类型HPV进行基因分型获得的结果。图20示出对两种或更多种类型HPV进行基因分型获得的结果。图21示出使用本发明的ID序列检测KRAS突变的结果。图22示出使用本发明的ID序列检测多个KRAS突变的结果。图23示出使用本发明的ID序列检测结直肠癌组织中KRAS突变的结果。图24示出使用本发明的ID序列检测呼吸道病毒感染的方法。图25示出使用本发明的ID序列检测5种呼吸道病毒中的单个感染的结果。图26示出使用本发明的ID序列检测5种呼吸道病毒中的多个感染的结果。本发明的最佳实施方式通过下面的详细描述和所附权利要求书,本发明的其他特征和实施方式将更加显而易见。一方面,本发明涉及用于基因分型的ID序列,该ID序列由(ID-S)n-E组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸;S是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是从I到32的自然数。另一方面,本发明涉及用于基因分型的ID序列,该ID序列由ID-S组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸;并且S是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸。此处使用的术语“ID序列”不是在每个基因中保守的特定序列,而是指人工构造的核苷酸序列,在本发明的基因分型方法中,可以专门分配给各基因型。此处使用的术语“相邻的ID标记”是指位于标记物前面或后面的ID标记。本发明的ID序列是用于进行焦磷酸测序,使用标记物和终止标记根据确定的分配顺序,可通过一个核苷酸来区分热裂解谱图,这能使热裂解谱图信号峰在特异位点形成而不会被下一序列干扰。在本发明中,根据焦磷酸测序过程中分配顺序形成特定信号峰的核苷酸,被称作 “ ID标记”,且包括所述标记物和终止标记的序列被称作“ ID序列”,所述“ ID序列”是通过ID标记形成单一信号峰所必须的。可以有三种类型的ID标记,通过使用一个标记物和一个终止标记,使该ID标记不受与其临近的基因序列的影响,因此,可被基因分型的类型数是三种。为了进行多于三种类型以上的基因分型,需要另外的标记物和ID标记。在一般的焦磷酸测序中,核苷酸测序根据分配顺序(在DNA合成中核酸加入的顺序)进行,并且如果在分配顺序中模板有一个核苷酸缺失,将不会发生反应,因此没有信号峰形成,但是如果与包括在分配顺序中的序列完全相同的序列在模板中持续出现,则根据发出光的强度形成信号峰的高度(图I)。认为当一个核苷酸被用作分析序列,可以根据热裂解谱图中四种不同的信号峰来区分它。然而,事实上,与分析序列相邻的序列为A、T、G和C之一,因此在至少一种情况下,必定形成多重信号峰(如果相同的序列重复,一个大的信号峰形成)。结果是,通过单个核苷酸最多有三种方法可用于区分单个信号峰(图2)。另外,由于分析序列之后的序列,会形成不希望得到的信号峰,并且如果重复的核苷酸持续地出现在分析序列之后,那么聚合反应将立刻会发生,形成单一的信号峰。然而,因为在反应中产生的光强度增加,信号峰的高度也成比例增加,并且如果这种重复序列存在,则对于单个核苷酸的信号峰高度会相对减少(图3)。因为这种问题,使用单个核苷酸进行多重基因分型时存在制约。为了解决这种问题,在本发明的ID序列中,将使“分析序列”分离以便不会被下一个序列影响,并且允许额外的分析的序列被称作“标记物”(图4)。另外,多重焦磷酸测序的分配顺序的设计依赖于标记物序列改变。如果在由两个核苷酸组成的分析序列中的一个核苷酸被设定为标记物,三种核苷酸中的每一种都可以位于剩余的一个核苷酸的位点(如果相同序列被定位,该信号峰将会重叠,因此除了指定为标记物的核苷酸以外的三种核苷酸可以在剩余的一个核苷酸的位点定位),并且位于标记物前面的核苷酸可按照图4所示进行设置,以便可以使信号峰能被独立区分,而不会被位于分析序列之后的核苷酸影响。在分析序列中,被标记物分隔开的单个核苷酸序列称为“ID标记”,并且如图4所示,使用一个ID标记和一个标记物进行三种类型的多重基因型分析是可能的。因此,标记物在分配顺序中的位置位于ID标记之后(因为只有位于标记物之前的ID标记,才不会被位于分析序列之后的序列影响)。
本发明一方面,为了对由标记物和单核苷酸ID标记组成的二核苷酸分析序列进行基因分型,如图5所示,合成分析序列类型1(分析序列AC),类型2(分析序列TC)和类型3(分析序列GC)并进行焦磷酸测序。结果是,对应于类型1,A的信号峰出现在分配顺序1,而C的信号峰出现在分配顺序4。对应于类型2,T的信号峰出现在分配顺序2,而C的信号峰出现在分配顺序4。对应于类型3,G的信号峰出现在分配顺序3,而C的信号峰出现在分配顺序4。在此,A、T和G这些分析序列中的第一个核苷酸分别为ID标记,而C这个在每个分析序列中的第二个核苷酸为标记物。为了对3种类型的分析序列进行多重基因分型,如图5(a)所示,由类型I (分析序列AC)和类型2 (分析序列TC)组成的样品以分配顺序A — T — G — C进行焦磷酸测序。结果是,A的信号峰出现在分配顺序1,T的信号峰出现在分配顺序2,无信号峰出现在分配顺序3,而作为标记物的C的信号峰出现在分配顺序4。在此,标记物C的信号峰为A和T的信号峰的两倍高度,且在两类中都有出现,因此反应的量增大至两倍,并且信号峰的强度 也是A和T信号峰强度的两倍。类似地,如图5(b)所示,在样品由类型I (分析序列AC)和类型3(分析序列GC)组成的情况下,A的信号峰出现在分配顺序1,G的信号峰出现在分配顺序3,无信号峰出现在分配顺序2,而作为标记物的C的信号峰出现在分配顺序4。在此,标记物C的信号峰增高至两倍高度,且在两类中都有出现,因此反应的量增大至两倍,并且信号峰的强度也增强至两倍。另外,如图5(c)所示,在样品由类型2(分析序列TC)和类型3(分析序列GC)组成的情况下,T的信号峰出现在分配顺序2,G的信号峰出现在分配顺序3,无信号峰出现在分配顺序1,而作为标记物的C的信号峰出现在分配顺序4。在此,标记物C的信号峰增高至两倍高度,且在两类中都有出现,因此反应的量增大至两倍,并且信号峰的强度也增强至两倍。因此,能通过标记物将ID标记与后续的序列分离,并且该ID标记能独立于后续序列存在。因此,这一点可以有助于应用于多重基因分型。在使用由“ ID标记”和“标记物”组成的分析序列进行焦磷酸测序中,无论标记物序列是否插入到分配顺序中,基因分型的结果都不会受到影响。然而,如果标记物序列不插入到分配顺序中,将会产生不能判断机械误差的问题(图6)。为此,标记物序列更优选插入到分配序列中,使得无论焦磷酸测序是否正常进行都可能进行测定。另外,因为在焦磷酸测序中,多重基因分型的ID标记的信号峰不能高于标记物的信号峰,这也能用做判断焦磷酸测序误差的参考(图6)。终止标记标记物的功能为将单核苷酸ID标记与后续的序列分离,使之不被后续序列影响。然而,当后续序列与标记物完全相同,信号峰的高度按比例增加来增加发射光的强度。为此,这会发生ID标记信号峰高度改变的现象(图7)。为了解决这个现象,可以将不同于标记物的核酸序列插到标记物之后来避免ID标记和标记物被后续序列影响。在此,该插入的序列称为“终止标记”,而且终止标记不插入到分配顺序中。该终止标记的功能为避免ID标记和标记物被后续序列影响,使信号峰高度恒定。换句话说,在终止标记缺失的情况下,如图8所示,如果类型I (分析序列AC)在CA之后且焦磷酸测序以A — T — G — C的分配顺序进行,分配顺序3中C的信号峰将会大于分配顺序I中A的信号峰,原因是C紧挨着标记物C重复。类似地,如果类型3 (分析序列GC)在CC之后,分配顺序3中G的信号峰将会比分配顺序4中极其大的C的信号峰小许多,原因是紧挨着标记物C的C重复三次。在终止标记存在的情况下,如图9所示,如果类型I (分析序列AC)在CA之后且T作为终止标记插入到它们之间
权利要求
1.一种用于基因分型的ID序列,其由(ID-S)n-E组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸4是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是从I到32的自然数。
2.一种用于基因分型的ID序列,其由(ID-S)n-E组成,其中ID是ID标记,是选自Α、T、C和G的单核苷酸;S是标志物,其是与相邻的ID标记连接的核苷酸,且不同于相邻的IDT 己 O
3.一种基因分型引物,包括与如权利要求I或2所述的ID序列相连接的,用于基因分型的基因特异性序列。
4.如权利要求3所述的基因分型引物,其中用于基因分型的基因特异性序列是对选自由病毒基因、疾病基因、细菌基因和鉴定基因组成的组的基因特异的序列。
5.一种基因分型方法,其包括使用如权利要求3所述的基因分型引物。
6.如权利要求5所述的基因分型方法,其中基因分型采用焦磷酸测序法或半导体测序法。
7.如权利要求5所述的基因分型的方法,所述方法包括步骤 (a)根据基因分型的目的基因设计用于基因分型的ID序列,所述ID序列由(ID-S)n-E组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸;S是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是从I到32的自然数; (b)用基因分型引物,通过PCR扩增基因分型目的基因的模板,由此获得PCR产物,所述基因分型引物包括与设计的ID序列相连的用于基因分型的基因特异性序列;以及 (c)对PCR产物进行焦磷酸测序,获得所述ID序列的热裂解谱图。
8.—种HPV基因分型方法,所述方法包括步骤 (a)根据每种HPV病毒的基因型来设计用于基因分型的ID序列,所述ID序列由(ID-S)n-E组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸;S是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是从I到32的自然数; (b)构建基因分型引物,所述基因分型引物由焦磷酸测序引物序列、ID序列和与所述ID序列相应而对病毒基因型特异的序列组成; (c)用所述基因分型引物通过PCR扩增含有HPV病毒的样品,以及 (d)将扩增的PCR产物进行焦磷酸测序来获得所述ID序列的热裂解谱图,并根据所述ID序列区分HPV基因型。
9.如权利要求8所述的方法,其中,对病毒基因型特异的序列是选自SEQID NO I至15所示的核苷酸序列。
10.一种用于检测KRAS基因突变的方法,所述方法包括步骤 (a)根据每种KRAS的基因突变设计用于基因分型的ID序列,所述ID序列由(ID-S)n-E组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸;S是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是从I到32的自然数; (b)构建检测引物,所述检测引物由焦磷酸测序引物序列、ID序列和与所述ID序列相应的对所述KRAS的基因突变特异的序列组成; (c)用所述检测引物通过PCR扩增含有KRAS基因的样品,以及 (d)将扩增的PCR产物进行焦磷酸测序以获得所述ID序列的热裂解谱图,泵根据所述ID序列检测KRAS的基因突变。
11.如权利要求10所述的方法,其中对于KRAS基因突变特异的序列是选自SEQID NO:34至35所示的核苷酸序列。
12.一种用于检测呼吸道病毒的方法,所述方法包括步骤 a)根据流行性感冒A病毒、流行性感冒B病毒、呼吸道合胞病毒B、鼻病毒和冠状病毒OC43各者来设计用于基因分型的ID序列,所述ID序列由(ID-S) n-E组成,其中ID是ID标记,是选自A、T、C和G的单核苷酸;S是标志物,其是与相邻的ID标记连接,且不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是从I到32的自然数; (b)构建检测引物,所述检测引物由焦磷酸测序引物序列、ID序列和与该ID序列相应而对呼吸道病毒基因特异的序列组成; (c)用所述检测引物通过PCR扩增含有呼吸道病毒的样品,所述呼吸道病毒选自由流行性感冒A病毒、流行性感冒B病毒、呼吸道合胞病毒B、鼻病毒和冠状病毒OC43组成的组,以及 (d)将扩增的PCR产物进行焦磷酸测序来获得所述ID序列的热裂解谱图,并根据ID序列检测呼吸道病毒。
13.如权利要求12所述的方法,其中对于呼吸道病毒基因型特异的序列选自流行感冒病毒A的SEQ ID NO :41,流行性感冒B病毒的SEQ ID NO :42、呼吸道合胞病毒B的SEQ IDNO :43、鼻病毒的SEQ ID NO 44和冠状病毒OC43的SEQ ID NO 45所示的核苷酸序列。
全文摘要
本发明涉及基因分型的方法,特别涉及被分配到各基因型的ID序列,以及使用所述ID序列的多重基因分型方法。当使用所述ID序列进行焦磷酸测序时,对于每个基因型可以得到独特、简单的热裂解谱图。因此,使用所述的ID序列,使得通过简单而有效的方式对病毒基因、疾病基因、细菌基因进行基因分型及基因鉴定,成为可能。此外,本发明的基因分型引物,可用于在不同的使用分配顺序和测序方法进行的基因分型方法中。
文档编号C12N15/11GK102741428SQ201080061597
公开日2012年10月17日 申请日期2010年11月15日 优先权日2009年11月16日
发明者吴命锡, 安城皖 申请人:基因特力株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1