基因分型的方法_2

文档序号:8295103阅读:来源:国知局
于基因分型的ID序列,该ID序列由(ID-S)n-E组成,其中 ID是ID标记,是选自A、T、C和G的单核苷酸;S是标志物,其是与相邻的ID标记连接,且 不同于相邻的ID标记的核苷酸;E是终止标记,其是不同于所述标志物的核苷酸,并且η是 从1到32的自然数。
[0048] 另一方面,本发明涉及用于基因分型的ID序列,该ID序列由ID-S组成,其中ID 是ID标记,是选自A、T、C和G的单核苷酸;并且S是标志物,其是与相邻的ID标记连接, 且不同于相邻的ID标记的核苷酸。
[0049] 此处使用的术语"ID序列"不是在每个基因中保守的特定序列,而是指人工构造的 核苷酸序列,在本发明的基因分型方法中,可以专门分配给各基因型。
[0050] 此处使用的术语"相邻的ID标记"是指位于标记物前面或后面的ID标记。
[0051] 本发明的ID序列是用于进行焦磷酸测序,使用标记物和终止标记根据确定的分 配顺序,可通过一个核苷酸来区分热裂解谱图,这能使热裂解谱图信号峰在特异位点形成 而不会被下一序列干扰。
[0052] 在本发明中,根据焦磷酸测序过程中分配顺序形成特定信号峰的核苷酸,被称作 " ID标记",且包括所述标记物和终止标记的序列被称作" ID序列",所述" ID序列"是通过 ID标记形成单一信号峰所必须的。可以有三种类型的ID标记,通过使用一个标记物和一个 终止标记,使该ID标记不受与其临近的基因序列的影响,因此,可被基因分型的类型数是 三种。为了进行多于三种类型以上的基因分型,需要另外的标记物和ID标记。
[0053] 在一般的焦磷酸测序中,核苷酸测序根据分配顺序(在DNA合成中核酸加入的顺 序)进行,并且如果在分配顺序中模板有一个核苷酸缺失,将不会发生反应,因此没有信号 峰形成,但是如果与包括在分配顺序中的序列完全相同的序列在模板中持续出现,则根据 发出光的强度形成信号峰的高度(图1)。
[0054] 认为当一个核苷酸被用作分析序列,可以根据热裂解谱图中四种不同的信号峰来 区分它。然而,事实上,与分析序列相邻的序列为A、T、G和C之一,因此在至少一种情况下, 必定形成多重信号峰(如果相同的序列重复,一个大的信号峰形成)。结果是,通过单个核 苷酸最多有三种方法可用于区分单个信号峰(图2)。
[0055] 另外,由于分析序列之后的序列,会形成不希望得到的信号峰,并且如果重复的核 苷酸持续地出现在分析序列之后,那么聚合反应将立刻会发生,形成单一的信号峰。然而, 因为在反应中产生的光强度增加,信号峰的高度也成比例增加,并且如果这种重复序列存 在,则对于单个核苷酸的信号峰高度会相对减少(图3)。因为这种问题,使用单个核苷酸进 行多重基因分型时存在制约。为了解决这种问题,在本发明的ID序列中,将使"分析序列" 分离以便不会被下一个序列影响,并且允许额外的分析的序列被称作"标记物"(图4)。
[0056] 另外,多重焦磷酸测序的分配顺序的设计依赖于标记物序列改变。
[0057] 如果在由两个核苷酸组成的分析序列中的一个核苷酸被设定为标记物,三种核苷 酸中的每一种都可以位于剩余的一个核苷酸的位点(如果相同序列被定位,该信号峰将会 重叠,因此除了指定为标记物的核苷酸以外的三种核苷酸可以在剩余的一个核苷酸的位点 定位),并且位于标记物前面的核苷酸可按照图4所示进行设置,以便可以使信号峰能被独 立区分,而不会被位于分析序列之后的核苷酸影响。
[0058] 在分析序列中,被标记物分隔开的单个核苷酸序列称为" ID标记",并且如图4所 示,使用一个ID标记和一个标记物进行三种类型的多重基因型分析是可能的。因此,标记 物在分配顺序中的位置位于ID标记之后(因为只有位于标记物之前的ID标记,才不会被 位于分析序列之后的序列影响)。
[0059] 本发明一方面,为了对由标记物和单核苷酸ID标记组成的二核苷酸分析序列进 行基因分型,如图5所示,合成分析序列类型1 (分析序列:AC),类型2 (分析序列:TC)和类 型3(分析序列:GC)并进行焦磷酸测序。结果是,对应于类型1,A的信号峰出现在分配顺 序1,而C的信号峰出现在分配顺序4。对应于类型2, T的信号峰出现在分配顺序2,而C的 信号峰出现在分配顺序4。对应于类型3, G的信号峰出现在分配顺序3,而C的信号峰出现 在分配顺序4。在此,A、T和G这些分析序列中的第一个核苷酸分别为ID标记,而C这个在 每个分析序列中的第二个核苷酸为标记物。
[0060] 为了对3种类型的分析序列进行多重基因分型,如图5 (a)所示,由类型1 (分析序 列:AC)和类型2(分析序列:TC)组成的样品以分配顺序A - T - G -C进行焦磷酸测序。 结果是,A的信号峰出现在分配顺序1,T的信号峰出现在分配顺序2,无信号峰出现在分配 顺序3,而作为标记物的C的信号峰出现在分配顺序4。在此,标记物C的信号峰为A和T 的信号峰的两倍高度,且在两类中都有出现,因此反应的量增大至两倍,并且信号峰的强度 也是A和T信号峰强度的两倍。
[0061] 类似地,如图5(b)所示,在样品由类型1(分析序列:AC)和类型3(分析序列:GC) 组成的情况下,A的信号峰出现在分配顺序1,G的信号峰出现在分配顺序3,无信号峰出现 在分配顺序2,而作为标记物的C的信号峰出现在分配顺序4。在此,标记物C的信号峰增 高至两倍高度,且在两类中都有出现,因此反应的量增大至两倍,并且信号峰的强度也增强 至两倍。
[0062] 另外,如图5(c)所示,在样品由类型2(分析序列:TC)和类型3(分析序列:GC)组 成的情况下,T的信号峰出现在分配顺序2, G的信号峰出现在分配顺序3,无信号峰出现在 分配顺序1,而作为标记物的C的信号峰出现在分配顺序4。在此,标记物C的信号峰增高 至两倍高度,且在两类中都有出现,因此反应的量增大至两倍,并且信号峰的强度也增强至 两倍。
[0063] 因此,能通过标记物将ID标记与后续的序列分离,并且该ID标记能独立于后续序 列存在。因此,这一点可以有助于应用于多重基因分型。
[0064] 在使用由"ID标记"和"标记物"组成的分析序列进行焦磷酸测序中,无论标记物 序列是否插入到分配顺序中,基因分型的结果都不会受到影响。然而,如果标记物序列不插 入到分配顺序中,将会产生不能判断机械误差的问题(图6)。为此,标记物序列更优选插入 到分配序列中,使得无论焦磷酸测序是否正常进行都可能进行测定。另外,因为在焦磷酸测 序中,多重基因分型的ID标记的信号峰不能高于标记物的信号峰,这也能用做判断焦磷酸 测序误差的参考(图6)。
[0065] 终止标记
[0066] 标记物的功能为将单核苷酸ID标记与后续的序列分离,使之不被后续序列影响。 然而,当后续序列与标记物完全相同,信号峰的高度按比例增加来增加发射光的强度。为 此,这会发生ID标记信号峰高度改变的现象(图7)。为了解决这个现象,可以将不同于标 记物的核酸序列插到标记物之后来避免ID标记和标记物被后续序列影响。在此,该插入的 序列称为"终止标记",而且终止标记不插入到分配顺序中。该终止标记的功能为避免ID标 记和标记物被后续序列影响,使信号峰高度恒定。
[0067] 换句话说,在终止标记缺失的情况下,如图8所示,如果类型1 (分析序列:AC)在 CA之后且焦磷酸测序以A - T - G - C的分配顺序进行,分配顺序3中C的信号峰将会大 于分配顺序1中A的信号峰,原因是C紧挨着标记物C重复。类似地,如果类型3 (分析序 列:GC)在CC之后,分配顺序3中G的信号峰将会比分配顺序4中极其大的C的信号峰小 许多,原因是紧挨着标记物C的C重复三次。
[0068] 在终止标记存在的情况下,如图9所示,如果类型1 (分析序列:AC)在CA之后且 T作为终止标记插入到它们之间,而且焦磷酸测序在A - T - G - C的分配顺序下进行,由 于紧挨着标记物C的T的插入,C将不会重复,而且分配顺序1中A的信号峰的高度和分配 顺序3中C的信号峰高度将会恒定。类似地,如果类型3 (分析序列:GC)在CC之后,由于 紧挨着标记物C的T的插入,紧挨着标记物的C将不会重复,而且分配顺序3中G的信号峰 的高度将会等于分配顺序4中C的信号峰高度。在本发明中,标记物的数字N可以增加,最 好在2-32,并且如果N是32,基因分型有65种可能。
[0069] 当使用多个ID标记和多个标记物时,使进行3种或更多种基因分型成为可能。
[0070]
【主权项】
1. 一种对样品中的不同目的基因进行基因分型的方法,包括: i) 构建基因分型引物,其中所述引物包括与被分配给各基因型的ID序列相连的基因 特异性序列, 其中每个ID序列由ID标记、N个标志物和终止标记组成,其中ID标记选自A、T、C和 G的核苷酸,N个标志物是以相同顺序排列并与相邻的ID标记不同的核苷酸,终止标记是在 最后面的标志物之后并与最后面的标志物不同的核苷酸; 其中N是2-32的自然数,以及 其中ID标记可以位于标志物前面并且是由与位于其后的标志物不同的核苷酸组成的 三种不同核苷酸之一,或者ID标记可以位于两个标志物之间并且是由与位于其两侧的标 志物不同的核苷酸组成的三种不同核苷酸之一; ii) 使用i)的基因分型引物,通过PCR扩增目的基因的模板,由此获得PCR产物; iii) 根据步骤i)设计的ID序列的顺序分配dNTP,对步骤ii)的PCR产物测序,所述 ID序列的顺序不包括用于终止标记的dNTP ;和 iv) 根据ID标记的核苷酸和位置进行基因分型。
2. 如权利要求1所述的方法,其中所述目的基因选自由病毒基因、疾病基因、细菌基因 和鉴定基因组成的组。
3. 如权利要求1所述的方法,其中靶标是HPV并且其中基因特异性序列选自SEQ ID NO: 1至15的核苷酸序列。
4. 如权利要求1所述的方法,其中靶标是呼吸道病毒,并且其中基因特异性序列是流 行感冒病毒A的SEQ ID N0:41,流行性感冒B病毒的SEQ ID N0:42、呼吸道合胞病毒B的 SEQ ID N0:43、鼻病毒的 SEQ ID N0:44 和冠状病毒 0C43 的 SEQ ID N0:45。
【专利摘要】本发明涉及基因分型的方法,特别涉及被分配给各基因型的ID序列,以及使用所述ID序列的多重基因分型方法。当使用所述ID序列进行焦磷酸测序时,对于每个基因型可以得到独特、简单的热裂解谱图。因此,使用所述的ID序列,使得通过简单而有效的方式对病毒基因、疾病基因、细菌基因进行基因分型及基因鉴定,成为可能。此外,本发明的基因分型引物,可用于在不同的使用分配顺序和测序方法进行的基因分型方法中。
【IPC分类】C12Q1-70, C12N15-11, C12R1-93, C12Q1-68
【公开号】CN104611423
【申请号】CN201510016264
【发明人】安城皖, 吴命锡
【申请人】基因特力株式会社
【公开日】2015年5月13日
【申请日】2010年11月15日
【公告号】CN102741428A, EP2522741A2, EP2522741A4, EP2522741B1, US20120276524, WO2011059285A2, WO2011059285A3
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1