一种寡核苷酸探针的设计方法及其应用的制作方法

文档序号:1154120阅读:1046来源:国知局
专利名称:一种寡核苷酸探针的设计方法及其应用的制作方法
技术领域
本发明涉及一种寡核苷酸探针的设计方法,利用该方法设计的寡核苷酸探针可有 效区分单核苷酸多态性。本发明的寡核苷酸探针的设计方法可应用于包括基因芯片的制备 在内的所有探针设计的领域。
背景技术
单核苷酸多态性(single nucleotide polymorphism,SNP),主要是指在基因组水 平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一 种,占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500 1000个 碱基对中就有1个,估计其总数可达300万个甚至更多。预计今后SNP将在下列领域发挥重要作用(1)进行简单和复杂疾病的遗传连 锁分析(linkage analysis)及关联分析(association analysis) ; (2)在“药物基因组 学”(pharmacogenomics)研究中,可通过检测SNP的遗传多态性标记揭示人群中不同个体 对不同药物的敏感性差异的根本原因。⑶也可用于法医研究的罪犯身份的鉴别、亲子鉴定 等,此外在器官移植中供体和受体间的配对选择及物种进化的研究中都将具有重要意义。通过设计特异性的探针检测SNP能够达到比较高的灵敏度和特异性,但是单核苷 酸突变对探针设计要求极高,怎样快速有效的设计能正确区分单核苷酸突变的探针,一直 是学术界和企业研究者点关注的问题。Loakes D等人(Loakes D,et al. NucleicAcids Res. 1994,22(20) :4039-43)提出 5-Nitroindole 作为碱基类似物,随后 David Loakes 等人(David Loakes, et al. Nucleic Acids Res. 1995,23 (13) :2361-6)进一步提出用 3-Nitropyrrole和5_nitroindole作为测序和PCR类似物,在此基础上Guo Z等人报道 (Guo Z,et al. NatBiotechnol. 1997,15(4) :331-5)的研究结果是一个里程碑式的成就, 要点有如下几个(1)单核苷酸是最难区分的,而两个或两个以上的核苷酸则能够有效的 区分;( 单核苷酸突变检测存在位置依赖性,具体的说,突变位置在探针中间区分能力最 强,而越往探针两端区分能力越低;C3)在探针序列中设置碱基类似物形成人工错配,可 以有效的提高单核苷酸区分能力。随后,有多篇更进一步的研究报道。通过构建的模型 (Pozhitkov AE, et al. BMC Bioinform 2002 ;3 9 ;Held GA, et al. Proc Natl Acad Sci USA, 2003 ; 100 :7575-80)来选择设计探针的合理性得到广泛的关注,然而,其它的研究者 却发现,理论的模拟与实验结果仍存在大的差异(Naef F,et al. Phys Rev E Stat Nonlin Soft Matter Phys,2003 ;68 :011906 ;Mei R et al. Proc Natl Acad SciUSA,2003 ; 100 11237-42),也就是说,探针设计仍然神秘,理论研究还没有达到实际应用的深度。即便如 此,Held GA 等人(Held GA, et al. Proc Natl Acad Sci USA, 2003 ; 100 :7575-80)还是认 为探针设计需要遵循一定的原则,模式仍然是有效的,而探针突变位点处于探针中间位置 是必须遵循的。3-Nitropyrrole和5-nitroindole作为碱基类似物在一些实验中并没有被 证实广泛的有效'性,因此,BurgnerD 等人(Burgner D, et al. Nucleotides Nucleic
3Acids. 2004,23(5) =755-65)提出另一个解决的途径,具体的说,在探针中直接添加碱基类 似物以期达到能够通常于所有SNPs探针设计的方法。此后,关于探针设计及理论的研究仍 不断的出现在各种研究性期刊及专利数据库,从一个侧面证实Burgner D等人的方法并没 有取得一个通用的效果。2007年DF Qualley 博士的一个报道(http ://66. 102. 1. 104/ scholar ? q = cache :rGEh8ixkw60J :scholargoogle. com/+ % 22Synthesis+and+Surve y+of+Non-natural+Bases+in+Nucleic+Acids+% 22&hl = en)提出,将碱基的氢键形成部 位封闭,使该类似物不能与靶基因的任何碱基形成结合,这样就在探针与靶基因间形成一 个结合空洞从而与突变基因配合,相当于双碱基突变。这一方法的一个不足之处在于封 闭碱基需要特殊的反应增加了合成成本,而且在商业合成公司并不能完成相应的服务,因 此尚无法进行有效的推广。最近的另一篇报道(Hwang GT, Nucleic Acids Res. 2009Jun 10. [Epub ahead ofprint])则提供了另一个解决的思路对碱基的芳香环进行不同部位的 修饰及多个部分的修饰,最终发现掺入d34DMPy作为人工突变能够达到最佳的效果,然而 这一结论与DF Qualley博士的方法面临同样的问题,即仅能在实验室实现而无法进入商业 应用阶段。基因芯片是九十年代发展起来的一项前沿生物技术。它融合了生命科学、化学、微 电子技术、计算机科学、统计学和生命信息学等多种学科的最新技术。基因芯片又称寡核苷 酸芯片或DNA芯片,通过把大量的DNA片断以可寻址的方式,高密度地固定到尼龙膜,玻璃 片和硅片等载体上,利用核酸碱基之间的配对,用来进行样品DNA高通量、并行的分析信息 的工具。基因芯片的最大优势是高通量、并行分析。而正是这一优点,也成为基因芯片最大 的弱点,除了要区分单核苷酸突变外,大量的探针还要在同一条件下并行检测,这对探针设 计就提出了更高的要求。例如S Choi等人(S Choi,et al. US PatentApp. 11/335, 229)公 开了一种障碍DNA及人工错配探针(hurdle DNA and artificially mismatched probe)的 方法,该方法需要两条探针来实现一个位点的检测,由于通常只是一条探针即可检测一个 位点,这样探针的数量必须增加一倍,无疑对探针的点样和高密度芯片的制备增添了很大 的困难,尽可能实现一条探针就有效的检测一个位点,这仍然是实际应用过程的考虑因素。至此,探针设计似乎进入到一个永远止境的人工改造及寻找一种万能方法的迷 途。本发明正是基于这样一个技术瓶颈,提出一种新的探针设计方法,可以较快的设计出有 效区分单核苷酸突变的探针。

发明内容
本发明的目的是提供一种寡核苷酸探针的设计方法,利用该方法设计的寡核苷酸 探针可有效区分单核苷酸多态性。单核苷酸突变的区分效果取决于探针在同源性序列中的区分能力,这也直接决定 了基因芯片(微阵列)实验结果的准确性。从最初的Southern Blot探针到Microarray 探针,几十年间大量的研究者对探针的设计方法进行了大量的理论研究和实验证实,通 常认为有较高区分能力的探针具备以下特征(1)探针自身没有发夹结构;( 探针突变 位点设计在探针的中部;C3)GC含量在40-60% ;(4)探针与探针之间没有严重的互补配 对,以此为基本理论,衍生出了多种预测模型,其中,被广泛认同的是邻位杂交预测模型 (nearestneighbor hybridization potential),通常认为,探针的杂交温度比邻位杂交预测温度低3-25°C,有多个以此为模型的探针设计软件,如:melting(Le Novere,2001)或 mfold(Zuke r,2003),由于探针的区分能力低,理论预测不准确仍是主要的瓶颈。因此,探 针的设计方法通常是低于理论预测值5-20°C设计多条探针,然后通过实验进行筛选。最近 (Xu Q, et al. Proc Natl Acad Sci USA. 2009,106(7) :2289-94.)就报道了通过基因芯片 设计探针矩阵从而筛选探针的研究结果。本发明所提供的探针的设计方法如下1)根据待检测靶基因的特异性核酸序列合成探针。要求探针覆盖待检测的碱基, 长度为14 30个碱基,探针序列可以是靶基因序列的正义链或其反向互补序列;2)探针序列在模板内应当没有较高相似性,否则容易导致错配。探针序列避免出 现3个以上的连续的碱基。3)探针序列的GC含量一般为40 60%,过高或过低都不利于特异性检测。4)探针序列内避免形成3个以上的发夹结构。5)单碱基突变的探针,突变位点尽可能的处于探针中间,至少处于探针的倒数第 二个碱基以内。6)优选的位置为探针的倒数第二个至第四个碱基进行人工增加或减少,而突变的 碱基处于探针的另一端,但不处于末端,通常位置为第三到碱基数中间。7)本发明所提供的探针设计方法,优选的探针长度为14 30bp。依据本发明提供的方法所设计的探针具有较强的区分能力,从而大大减少了探针 的筛选工作量。本发明的探针设计方法,一个优选的实施方案是其中探针人工增加碱基,包括以 下步骤(1)根据增加碱基的两侧,若为T (A) *T (A),则添加的碱基(*)为G或C ;(2)根据增加碱基的两侧,若为G(C)*G(C),则添加的碱基(*)为A或T;(3)根据增加碱基的两侧,若为T㈧*G(C),则添加的碱基(*)为T或A;(4)根据增加碱基的两侧,若为G(C)*T(A),则添加的碱基(*)为T或A。本发明的探针设计方法,一个优选的实施方案是其中探针人工减少碱基,包括以 下步骤(1)根据减少碱基的两侧,若为T (A) *T (A),则减少的碱基(*)为G或C ;(2)根据减少碱基的两侧,若为G(C)*G(C),则减少的碱基(*)为A或T;(3)根据减少碱基的两侧,若为T(A)*G(C),则减少的碱基(*)为T或A;(4)根据减少碱基的两侧,若为G(C)*T(A),则减少的碱基(*)为T或A。本发明的探针设计方法的应用领域非常广泛,凡是用到探针设计的领域均可适 用,其中包括基于尼龙膜的基因芯片和基于玻片的基因芯片,但不仅局限于基因芯片领域 的应用。本发明与Burgner D等人的方法最大的创新之处在于没有使用碱基类似物,而是 使用A/T/G/C,而且碱基选择性的使用能够使区分效果达到最佳;同时利用人工增加或者 减少碱基,无需特殊的试剂,能够与普通的探针相同的程序合成,因而不需要增加额外的成 本。利用本方法设计的探针与传统的探针相比,灵敏度上无明显差异,而特异性优于传统探 针。基于以上原因,本发明的方法能够在实际应用中得以推广。本发明提出的缺失碱基的方法在已公开的资料中尚未见相关报道。


图1本发明的探针和传统探针检测MDRI基因C-4T和A61G位点结果对比。其中 A为C-4T正常,A61G正常;B为C-4T纯合子突变,A61G正常;C为C-4T正常,A61G纯合子突变。图2本发明的探针和传统探针检测β地中海贫血⑶沈和⑶43位点结果对比。其 中1为⑶沈正常,⑶43正常;2为⑶沈纯合子突变,⑶43正常;3为⑶沈正常,⑶43纯合
子突变。
具体实施例方式本发明实施方式的描述,旨在通过举例说明更好地理解本发明的本质,而不是限 制本发明。实施例1检测MDRI基因SNPs的基因芯片的探针设计多药耐药基因(multi-drug resistance gene,MDRI)位于人第 7 号染色体 q21. 1, 以C-4T为例说明探针的设计方法。下面为MDRIC-4T位点的序列(LOCUS :AY910577)1 CTCTGGCTTC GACGGGGGAC TAGAGGTTAG TCTCACCTCC AGCGCGCCTG AGGCTCATGC61 ATTTGGCTAA TGAGCTGCGG TTTCTCTTCA GGT ^GGGATG GATCTTGAAG GGGACCGCAA121 TGGAGGAGCA AAGAAGAAGA ACTTTTTTAA ACTGAACAAT AAAAGGTAAC TAGCTTGTTT181 CATTTTCATA GTTTACATAG TTGCGAGATT TGAGTAATTT ATTTCTAGCC TCCAGCTCTG241 AAATAAATGA CATGTTGTTG TTTTTAATTA TTTTTAAGAA ACGCAAGCTA GCCTTTGGAA301 TCAATATCCC TGCTTAGAGC AGAAGTTTGT TGGCTGAGTG GAGCACAGCA TATGCATTTT在上述的序列中,g为发生突变的位点,即野生型(Normal)为C,突变型 (Mutation)为Τ。探针设计时突变位点与人工插入位点分布于探针的两端,最佳的位点同 时考虑探针设计的一般原则,包括退火温度(Tm)、GC%含量、碱基数量及探针的二级结 构,使用本发明的方法,设计的野生型探针序列为5’-AGGTCGGGATGGATAC-3’ (SEQ IDNO 2)、 5‘-AGGTCGGGATGGATCT-3‘ (SEQ IDNO 3);突变型探针序列为 5,_AGGTTGGGATGGAGTC_3,(SEQ ID NO 5)、5,-AGGTTGGGATGGATCT3,(SEQ IDNO :6)。A61G位点的探针设计方法可参照 C-4T。实施例2玻片载体的基因芯片检测MDRI基因C_4T和A61G位点利用实施例1设计的探针制备玻片载体的基因芯片检测MDRI基因SNPs,并与文献 报道的探针制备的基因芯片进行对比。多药耐药基因(multi-drug resistance gene,MDRI)位于人第 7 号染色体 q21. 1, 它的蛋白产物P-GP是ABC运输系统的重要一员,属于ABCBl家族。MDRI基因表达水平可作 为预测化疗效果的一个参考指标,通过检测MDRI基因多态性来预测肿瘤患者的化疗疗效 成为一种可行的临床检测手段。使用的PCR引物序列分别为IF :5,TTGGCTAATGAGCTGCGGTTTCTC 3,(SEQ ID NO 25);IR :5,cy3-GATTCCAAAGGCAGCTTGCGTTTC 3,(SEQ ID NO :26)。上述序列的扩增片段为MObp,检测外显子2的两个SNPs位点C_4T、A61G。本发明与文献报道探针的一个区别在于使用人工错配探针,从而进一步提高探针的区分单核苷酸能力。使用的探针如下表所示
检测位点文献报道探针序列 (林莉,等.生物技术通讯,2006,17(3): 332-4)本发明方法设计探针序列
权利要求
1.一种寡核苷酸探针的设计方法,其特征在于该设计方法包括1)要求探针覆盖待检测的碱基,长度为14 30个碱基,探针序列为靶基因序列的正义 链或其反向互补序列;2)探针序列在模板内没有较高相似性,探针序列避免出现3个以上的连续的碱基;3)探针序列的GC含量为40 60%;4)探针序列内避免形成3个及以上的碱基形成的发夹结构;5)单碱基突变的探针,突变位点尽可能的处于探针中间,至少处于探针的倒数第二个 碱基以内;6)在探针的倒数第二个至第四个碱基进行人工增加或减少,而突变的碱基处于探针的 另一端,但不处于末端,通常位置为第三到碱基数中间。
2.根据权利要求1的寡核苷酸探针的设计方法,其特征还在于其中探针人工增加碱 基,包括以下步骤1)根据增加碱基的两侧,若为T(A) *T (A),则添加的碱基(*)为G或C ;2)根据增加碱基的两侧,若为G(C)*G(C),则添加的碱基(*)为A或T;3)根据增加碱基的两侧,若为T㈧*G(C),则添加的碱基⑷为T或A;4)根据增加碱基的两侧,若为G(C)*T(A),则添加的碱基(*)为T或A。
3.根据权利要求1的寡核苷酸探针的设计方法,其特征还在于其中探针人工减少碱 基,包括以下步骤1)根据减少碱基的两侧,若为τ(A) *T (A),则减少的碱基(*)为G或C ;2)根据减少碱基的两侧,若为G(C)*G(C),则减少的碱基(*)为A或T;3)根据减少碱基的两侧,若为T(A)*G(C),则减少的碱基(*)为T或A;4)根据减少碱基的两侧,若为G(C)*T(A),则减少的碱基(*)为T或A。
全文摘要
本发明涉及一种寡核苷酸探针的设计方法,利用该方法设计的寡核苷酸探针可有效区分单核苷酸多态性。本发明的寡核苷酸探针的设计方法可应用于包括基因芯片的制备在内的所有探针设计的领域。本方法没有使用碱基类似物,而是使用A/T/G/C,同时采取了人工添加或者减少碱基的方式。从检测效果来看,利用本发明方法设计的探针在特异性方面要优于传统探针,而灵敏度上两者无明显差异。
文档编号C12N15/10GK102102122SQ20091021407
公开日2011年6月22日 申请日期2009年12月22日 优先权日2009年12月22日
发明者张帆, 林炳生, 程钢, 陈华云 申请人:中山大学达安基因股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1