一种寡核苷酸探针的设计方法

文档序号:428146阅读:921来源:国知局
专利名称:一种寡核苷酸探针的设计方法
技术领域
本发明属于基因技术领域,涉及基因芯片技术,尤其涉及一种基因芯片的寡核苷酸探针的设计方法。
基因芯片是九十年代发展起来的一项前沿生物技术。它融合了生命科学、化学、微电子技术、计算机科学、统计学和生命信息学等多种学科的最新技术。2001年6月26日,人类基因组计划和塞莱拉公司合作公布了人类基因组工作草图,其中包含90%以上的碱基对位置信息,精确度达99.9%。此外,还测定了80万个cDNA片断(ESTs),相当于4-5万个基因,占7-10万个人类总基因的50%左右,共计30亿对碱基的序列测定。随着国际大规模的基因测序计划的爆炸性发展,人们已经把目光从单纯的测序转向进行基因功能研究的后基因组时代。面对浩如烟海的序列信息,DNA芯片以其并行、高通量的特点当之无愧的成为后基因组时代的首要研究工具。基因芯片又称寡核苷酸芯片或DNA芯片,通过把大量的DNA片断以可寻址的方式,高密度地固定到尼龙膜,玻璃片和硅片等载体上,利用核酸碱基之间的配对,用来进行样品DNA高通量、并行的分析信息的工具。
基因芯片的概念可追溯到SOUTHERN BLOT杂交技术,即DNA-DNA之间通过碱基配对机制形成互补链。基因芯片技术是SOUTHERN BLOT杂交技术的发展和优化。由于同时将大量探针固定于支持物上,所以可以一次性对样品大量序列进行检测和分析,从而解决了传统核酸印迹杂交(Southern Blotting和Northern Blotting等)技术操作繁杂、自动化程度低、操作序列数量少、检测效率低等不足。而且,通过设计不同的探针阵列、使用特定的分析方法可使该技术具有多种不同的应用价值,如基因表达谱测定、实变检测、多态性分析、基因组文库作图及杂交测序等。
美国AFFYMETRIX公司于二十世纪八十年代末90年代初,率先开展了这方面的研究(FODOR,S.P.A.et al.(1991)science 251,767-773)。1992年,该公司运用半导体照相平板技术,在玻片上原位合成寡聚核甘酸片段,诞生了世界上第一块基因芯片(Southern,E,Maskos,U.&Elder,R.(1992)Genomics 13,1008-1017),这标志着基因芯片技术的产生。
基因芯片的制备通常有两种方法在片合成法和点样法。在这里我们将具体介绍一下点样法,点样法就是按照常规分子生物学方法制备cDNA库(或寡核苷酸)探针库,然后通过特殊的针头或微喷头,分别把不同的探针溶液,分配在玻片,尼龙,以及其他固相基片表面的不同位点上,通过物理和化学的结合使之固定到相应位点上。这种方式比较灵活,探针片段可来自不同的途径,可使用寡聚核苷酸探针,也可使用较长的基因片段,(proudnikov etal,1988)以及核酸类似物探针(如PNA等)。我们设计的基因芯片采用的方法主要是点样法,主要是设计具有特异序列并用氨基修饰的探针并将其固定在连接有桥分子的玻片上。
基因芯片以其高度并行性,多样化,微型化,自动化等优点成为医学基因诊断的新宠,科学家致力于基因芯片的应用研究,特别是开发与人类重大疾病相关的基因芯片,研制一批有实际应用前景的测序及诊断芯片,应用于疾病(遗传病和肿瘤)的基因诊断,疾病(肿瘤,心血管病,老年神经系统疾病,传染病等)易感性预测,重大传染病原体和抗药性检测,以及个体药物敏感性检测等。并且随着HGP的接近完成,许多遗传病的相关基因相继被定位,这就为从基因水平上认识遗传病并进行早期诊断奠定了基础。如血友病,杜氏肌营养不良症,老年痴呆症,地中海贫血,肥胖病等的致病基因均已定位。因此可以根据常见突变位点设计寡核苷酸并点于DNA芯片上,通过一次杂交完成对待测样品多种突变可能性的筛查,实现对多种遗传病的高速诊断,有着广泛的应用前景和经济意义。AFFIRMETRIX公司用于筛查P53基因突变的DNA芯片已上市,用于筛选HIV-1药株蛋白酶及逆转录酶的DNA芯片也已经上市。基因芯片在遗传病检测中的应用研究也是相当广泛的,例如,FALUS等人将DNA芯片技术用于株蛋白基因的突变检测,该技术以高度准确性和高度自动化使其可能成为对地中海贫血进行诊断的常规技术,KURG等人也以寡核苷酸阵列为基础,对地中海贫血亦进行了高可信度的检测。CHEE等人用寡核苷酸序列对人类线粒体进行了分析。
利用基因芯片检测单核苷酸多态性或点突变的方法有多种杂交/延伸的方法。其中最常见的一种方法是合成两条只有末端一个碱基差异的寡核苷酸,其中一条完全互补与要分析的靶分子,由于对末端碱基辨别力弱,两种寡核苷酸将以同等效率进行杂交,但连接酶和聚合酶能辨别形成的杂合双链,只有完整的杂合双链,酶促延伸才能进行。具体方法陈述如下检测突变位点或SNP位点的每组探针包括两个不同探针,探针的5`端或3`端的碱基不同,首先将互补靶序列的寡核苷酸探针固定于固相支持物上,在检测过程中,再加入DNA聚合酶或连接酶以及互补于靶序列等位基因5`端第一个碱基的标记核苷三磷酸,酶促延伸就可以在和靶形成完全杂合双链的的阵列的寡核苷酸上进行,通过标记的寡核苷酸就能显示靶序列的突变位点或SNP位点,如果检测样品为纯合体则杂交/延伸信号在理论上会产生有信号和无信号两种结果的现象,若检测样品为杂合体,则杂交/延伸信号在理论上会产生都有信号的现象。具体方法可以参考《DNA芯片实验操作指南》(韩金祥等编译)。该种方法能同时进行杂交和酶促延伸,杂交条件可以不太严格,因为酶的存在增强了检测的选择性。
利用互补寡核苷酸的结合能力来区分靶序列的方法实验简单,容易操作是它的优点,但由于靶序列与阵列上互补寡核苷酸的结合能力差别由单碱基错配所引起,这就需要严格控制杂交条件,并且需要反复摸索每个检测位点实验条件,这也是一个重要的方法。现有的具体方法如下所示检测一个突变位点,需要在固相支持物上合成一组探针,每个探针除一个碱基外,其余的碱基都相同,该不同碱基分别为A,G,C,T,或缺失,然后与样品杂交,如果是野生型或突变型或缺失型探针,只有一个探针与其完全配对,产生杂交信号,其余的探针在理论上不会产生杂交信号,在实际上产生的杂交信号可能很弱或没有,如果是杂合型,就会两个探针与其完全配对,产生杂交信号,其余的探针在理论上不会产生杂交信号,在实际上产生的杂交信号可能很弱或没有。
总结这些方法,有以下共同特点(1)都是利用单碱基的错配产生杂交信号强度的不同。
(2)产生的信号强度有二级变化,有或无。
(3)对核苷酸探针的长度有严格的限制。
(4)杂交结果不稳定,特异性不高。
本发明的目的在于发明一种基因芯片的寡核苷酸探针的设计方法。在根据与阵列上互补寡核苷酸的结合能力来区分靶序列的杂交反应中,靶序列与阵列上互补寡核苷酸的结合能力差别由单碱基错配所引起,这就需要对杂交条件进行严格控制,以使具有不同的能量的各种寡核苷酸/靶相互作用后产生不同的杂交信号。为了解决这个问题,我们设计一组寡核苷酸探针,在每组寡核苷酸探针的每个探针上设计可变位点,”可变位点”是我们定义的一个新名词,现有的参考资料尚未出现这个名词,在本文中是指探针中的某个碱基在探针中的位置,该碱基可以在探针的任意位置,也就是说探针上的任意一个碱基所在的位置都可以设为可变位点,但通常被检测位点不会设为可变位点,该位点的碱基可以根据我们的需要在不同的探针中为不同的碱基。这样就可以使靶序列与阵列上互补寡核苷酸探针的结合能力差别主要由是否有碱基错配和碱基错配的个数所引起,而杂交信号强度的不同主要是由寡核苷酸探针是否与靶序列完全配对,错配碱基的种类以及错配碱基的个数所决定。以往的探针设计方法使靶序列与探针杂交信号强度的区分由单碱基的错配和靶序列与探针的完全配对导致的信号强度的有和无的不同;然而该探针的设计方法使靶序列与探针杂交信号强度的区分变为由单到多碱基的错配和靶序列与探针的完全配对导致的信号强度由强到弱到无的多级变化,大大提高了探针与靶序列杂交的特异性,同时也可以适当延伸探针长度,大大提高了杂交的稳定性。
本发明的构思是这样的根据靶序列的被检测位点,我们设计一组探针与靶序列杂交,该组探针的每一个探针上的非变异位点都设计一个或多个可变位点,该可变位点的碱基可根据杂交条件而改变,该可变位点可相邻与待检测的突变位点,或与待检测的突变位点相隔几个碱基,并且该可变位点可设计单到多个,每个探针的可变位点的碱基可以不同,这样,杂交信号可以由单个碱基的错配导致的不同变成单到多个碱基的错配引起的不同,增加了信号强度的梯度变化,使信号强度由理论上的有和无的差别变为信号强度的多级变化(即强,弱,无的变化),提高了杂交的特异性和可靠性,同时该可变位点可以通过错配碱基的个数和错配碱基的种类不同来调节实验条件,使一张芯片可以在同一个条件下更加准确和可靠的检测更多的待测位点,由于对靶序列是否发生突变的检测由是否发生单碱基错配引起的杂交结合力的不同变为单到多个碱基错配引起的杂交结合力的不同,为了提高杂交结果的稳定性,可以适当提高探针的长度,该探针的长度可在10到50bp之间选择。例如检测这样一段序列tcatagcgac agtgatcG(G由a突变而来)tc atcaccttgg,利用该方法设计的寡核苷酸探针cgctg tcactagCag tagtggaacc,可以设计其中除被检测位点(C)以外的任意碱基为可变位点,可变位点可以有一个,两个,三个等不同情况,探针的长度可以在10到50bp之间。
本发明亦是这样实现的某一基因的一段序列如下所示aaggtgttct ttgcagaaga tgtgggttca aacaaaggtg caatcattgg actcatggtggcggtgttg tcatagcgac agtgatcG(G由a突变而来)tc atcaccttgg tgatgctgaagaagaaacagtacacatcca ttcatcatgg tgtggtggag gtaggtaaac ttgactgcat gtttccaagt我们设计ac agtgatcgtc atcacct的突变位点G邻近的碱基C为可变位点,我们设计检测该突变位点邻近的碱基C为可变位点,则该组探针为(设N为除G外的任意的碱基)探针1 3’----tg tcactaGCag tagtgga-5’探针2 3’----tg tcactaGTag tagtgga---5’探针3 3’----tg tcactaNCag tagtgga---5’探针4 3’----tg tcactaNTag tagtgga----5’当样品扩增产物与该探针相杂交时,若该样品为野生型,则杂交结果如下所示探针1 3’----tg tcactaGCag tagtgga--5’扩增产物5’------ac agtgatCAtc atcacct---3’探针2 3’---- tg tcactaGTag tagtgga---5’扩增产物5’-----ac agtgatCAtc atcacct---3探针3 3’---- tg tcactaNCag tagtgga---5’扩增产物 5’-----ac agtgatCAtc atcacct---3探针4 3’-----tg tcactaNTag tagtgga----5’扩增产物 5’-----ac agtgatCAtc atcacct---3探针1与样品扩增产物有一个错配位点,产生的信号强度比较弱。探针2与样品扩增产物完全杂交,产生的信号强度最强。探针3与样品扩增产物有两个错配位点,产生的信号强度很弱,甚至没有。探针4与样品扩增产物有一个错配位点,产生的信号强度比较弱。当样品扩增产物与该探针相杂交时,若该样品为野生型,则杂交结果如下所示探针1 3’----tg tcactaGCag tagtgga--5’扩增产物5’------ac agtgatCGtc atcacct---3’探针2 3’---- tg tcactaGTag tagtgga---5’扩增产物5’-----ac agtgatCGtc atcacct---3探针3 3’---- tg tcactaNCag tagtgga---5’扩增产物5’-----ac agtgatCGtc atcacct---3探针4 3’-----tg tcactaNTag tagtgga----5’扩增产物5’-----ac agtgatCGtc atcacct---3探针1与样品扩增产物完全杂交,产生的信号强度最强。探针2与样品扩增产物有一个错配位点,产生的信号强度比较弱。探针3与样品扩增产物有一个错配位点,产生的信号强度很弱,甚至没有。探针4与样品扩增产物有两个错配位点,产生的信号强度比较弱。当样品扩增产物与该探针相杂交时,若该样品为杂合型,则杂交结果如下所示探针1 3’----tg tcactaGCag tagtgga--5’扩增产物5’------ac agtgatCGtc atcacct---3’探针2 3’---- tg tcactaGTag tagtgga---5’扩增产物5’-----ac agtgatCGtc atcacct---3探针3 3’---- tg tcactaNCag tagtgga---5’扩增产物5’-----ac agtgatCGtc atcacct---3探针4 3’-----tg tcactaNTag tagtgga----5’扩增产物5’-----ac agtgatCGtc atcacct---3
探针1与样品扩增产物完全杂交,产生的信号强度最强。
探针2与样品扩增产物完全杂交,产生的信号强度最强。
探针3与样品扩增产物有一个错配位点,产生的信号强度很弱,甚至没有。
探针4与样品扩增产物有一个错配位点,产生的信号强度很弱,甚至没有。或设计检测该突变位点非邻近的碱基T(aTcG中的T,其中g为突变位点)为可变位点,则该组探针为(设N为除T外的任意的碱基)探针1 3’---tg tcactAgCag tagtgga---5’探针2 3’---tg tcactAgTag tagtgga----5’探针3 3’---tg tcactNgCag tagtgga----5’探针4 3’---tg tcactNgTag tagtgga----5’或设计该突变位点周围的两个碱基(tcgt中的T,其中G为突变位点)为可变位点,则该组探针为(设N为除T外的任意的碱基)探针1 3’----tg tcactAgCAg tagtgga---5’探针2 3’----tg tcactAgTAg tagtgga----5’探针3 3’----tg tcactNgCAg tagtgga---5’探针4 3’----tg tcactNgTAg tagtgga----5’探针5 3’----tg tcactAgCNg tagtgga----5’探针6 3’----tg tcactAgTNg tagtgga----5’探针7 3’----tg tcactNgCNg tagtgga----5’探针8 3----tg tcactNgTNg tagtgga-----5’,以上来两种不同的探针的设计,也会跟样品扩增产物出现不同的杂交结果。在此,就不一一列出。
杂交信号强度的不同取决于错配碱基个数的不同,杂交原理可以参考《分子可隆实验指南》。
以此类推,可以根据不同的可变位点或单个到多个可变位点设计不同组的探针。以下将通过实施例对本发明的有关细节作进一步的阐述,但实施例不限制本发明的保护范围。实施例1为了检测PS1基因的第7外显子基因一段序列的突变位点,如下所示110521 catcttttaa aatctgtgta attttttttc agggaagtgt ttaaaaccta taacgttgctgtggactaca ttactgttgc actcctgatc tggaattttg gtgtggtggG(G会突变为T)aatgatttcc aT(T会突变为C)tcactgga aaggtccact tcgactccag caggcatatc tcattatgat tagtG(G会突变为A)C(C会突变为T)cctcatggccctgg我们合成以下序列,在5‘端用氨基修饰,以上合成将由专门生物代理公司负责合成。第一组探针设计如下3’----caccaccC Ttactcccgg-5’-----NH23’----caccaccA Ttactcccgg-5’-----NH23’----caccaccC Ntactcccgg-5’-----NH23’----caccaccA Ntactcccgg-5’-----NH2设N为除T外的任意的碱基。第二组探针设计如下3’----ttactaaagg TAagtgaccttt --5’-----NH23’----ttactaaagg TGagtgaccttt --5’-----NH23’----ttactaaagg NAagtgaccttt --5’-----NH23’----ttactaaagg NGagtgaccttt --5’-----NH2设N为除T外的任意的碱基第三组探针设计如下3’----tactaatcaCGGgagtaccg-5’-----NH23’----tactaatcaTGGgagtaccg-5’-----NH23’----tactaatcaCGNgagtaccg-5’-----NH23’----tactaatcaTGNgagtaccg-5’-----NH23’----tactaatcaCAGgagtaccg-5’-----NH23’----tactaatcaCGNgagtaccg-5’-----NH23’----tactaatcaCANgagtaccg-5’-----NH2设N为除G外的任意的碱基。我们将以第一组探针为例说明如何检测不同的样品,根据样品突变情况的不同,将会产生以下不同结果。假设序列ggtggG aat中的G突变为T,则杂交结果如下所示第一条探针3’---- caccaccC Ttactcccgg--5’-----NH2扩增产物5’-----gtggtggT Aatgagggcc---3第二条探针3’---- caccaccA Ttactcccgg---5’-----NH2扩增产物5’-----gtggtggT Aatgagggcc---3第三条探针3’---- caccaccC Ntactcccgg---5’-----NH2扩增产物5’-----gtggtggT Aatgagggcc---3第四条探针3’----caccaccA Ntactcccgg--5’-----NH扩增产物5’----- gtggtggT Aatgagggcc---3探针1与样品扩增产物有一个错配位点,产生的信号强度比较弱。
探针2与样品扩增产物完全杂交,产生的信号强度最强。
探针3与样品扩增产物有两个错配位点,产生的信号强度很弱,甚至没有。
探针4与样品扩增产物有一个错配位点,产生的信号强度比较弱。假设序列ggtggG aat中的未发生突变,则杂交结果如下所示第一条探针3’---- caccaccC Ttactcccgg---5’-----NH2扩增产物5’-----gtggtggG Aatgagggcc---3第二条探针3’---- caccaccA Ttactcccgg--5’-----NH2扩增产物5’-----gtggtggT Aatgagggcc---3第三条探针3’---- caccaccC Ntactcccgg--5’-----NH2扩增产物5’-----gtggtggG Aatgagggcc---3第四条探针3’----caccaccA Ntactcccgg-5’-----NH扩增产物5’----- gtggtggG Aatgagggcc---3探针1与样品扩增产物完全杂交,产生的信号强度最强。
探针2与样品扩增产物有一个错配位点,产生的信号强度比较弱。
探针3与样品扩增产物有一个错配位点,产生的信号强度很弱,甚至没有。
探针4与样品扩增产物有两个错配位点,产生的信号强度比较弱。
假设样品为杂合体,序列ggtggG aat中有的未发生突变,有的序列ggtggG aat G突变为A则杂交结果如下所示探针1与样品扩增产物完全杂交,产生的信号强度最强。
探针2与样品扩增产物完全杂交,产生的信号强度最强。
探针3与样品扩增产物有一个错配位点,产生的信号强度很弱,甚至没有。
探针4与样品扩增产物有一个错配位点,产生的信号强度很弱,甚至没有。
另外几个突变位点的检测结果与此类似。将以上探针通过氨基固定于玻片上,通过探针与样品的杂交,杂交信号强度分为强,弱,无等多种情况。根据杂交信号强度的不同,就能准确的检测出PS1基因的第7外显子的这段序列是否突变以及在何处发生突变。
权利要求
1一种寡核苷酸探针的设计方法,其特征在于根据每个检测位点设计一组探针,在每组探针的单个探针上设计单到多个可变位点,该可变位点就是位于探针上的某碱基,该方法设计不同的碱基在该位点,使每组探针上的探针与靶序列发生完全杂交、单个到多个错配位点杂交和无杂交几种不同情况,使靶序列与不同探针的杂交信号强度呈梯度变化。
2如权利要求1所述的寡核苷酸探针的设计方法,其特征在于根据每个突变位点设计寡核苷酸探针。
3如权利要求1所述的寡核苷酸探针的设计方法,其特征在于根据每个突变位点设计一组寡核苷酸探针。
4如权利要求1所述的寡核苷酸探针的设计方法,其特征在于检测每个突变位点的每组寡核苷酸探针与靶序列完全配对的杂交条件相近。
5如权利要求1所述的寡核苷酸探针的设计方法,其特征在于每组寡核苷酸探针包括多条寡核苷酸探针。
6如权利要求1所述的寡核苷酸探针的设计方法,其特征在于每组寡核苷酸探针包括四条寡核苷酸探针。
7如权利要求1所述的寡核苷酸探针的设计方法,其特征在于对每组探针中的每个寡核苷酸探针设计可变位点。
8如权利要求1所述的寡核苷酸探针的设计方法,其特征在于可以设寡核苷酸探针上的任意碱基为可变位点。
9如权利要求1所述的寡核苷酸探针的设计方法,其特征在于对每组探针中的每个寡核苷酸探针设计多个可变位点。
10如权利要求1所述的寡核苷酸探针的设计方法,其特征在于对每组探针中的每个寡核苷酸探针设计1个可变位点。
11如权利要求1所述的寡核苷酸探针的设计方法,其特征在于根据每个突变位点设计寡核苷酸序列,每条寡核苷酸探针包括10-50个碱基。
12如权利要求1所述的寡核苷酸探针的设计方法,其特征在于根据每个突变位点设计寡核苷酸序列,每组寡核苷酸探针中的探针长度相同。
13如权利要求1所述的寡核苷酸探针的设计方法,其特征在于根据每个突变位点设计寡核苷酸序列,每组寡核苷酸探针中的探针长度不同。
14如权利要求1所述的寡核苷酸探针的设计方法,其特征在于每组探针中的探针与野生型,突变型和杂合型的靶序列会产生完全杂交,单到多个位点错配杂交和无杂交结果几种不同杂交结果。
15如权利要求1所述的寡核苷酸探针的设计方法,其特征在于每组探针的探针分别与野生型,突变型杂交,产生不同的杂交结果,信号强度由强到弱到无有多级变化。
16如权利要求1所述的寡核苷酸探针的设计方法,其特征在于每组探针的探针分别与野生型,突变型的靶序列杂交,产生不同的杂交结果,信号强度由强到弱到无有三级变化。
17如权利要求1所述的寡核苷酸探针的设计方法,其特征在于每组探针的探针分别与杂合型的靶序列发生完全杂交和单到多个位点错配杂交。
18如权利要求1所述的寡核苷酸探针的设计方法,其特征在于每组探针的探针分别与杂合型的靶序列发生完全杂交和单个位点错配杂交。
19如权利要求1所述的寡核苷酸探针的设计方法,其特征在于每组探针的探针分别与杂合型的靶序列发生杂交,杂交结果的信号强度由强到弱到无有多级变化。
20如权利要求1所述的寡核苷酸探针的设计方法,其特征在于每组探针的探针分别与杂合型的靶序列杂交,杂交结果的信号强度由强到弱呈二级变化。
21如权利要求1所述的寡核苷酸探针的设计方法,其特征在于可变位置碱基的变化可用于调节探针与靶序列的杂交条件。
全文摘要
本发明公开了一种寡核苷酸探针的设计方法,该方法适用于基因芯片。该寡核苷酸探针的设计按照靶基因序列的变异位点设计不同的寡核苷酸探针,在每个探针同一个碱基上设定一个或多个可变位点,该可变位点的碱基可由不同种类的核苷酸组成,使探针与靶序列的杂交结果有完全杂交,单碱基错配到多碱基错配等几种不同情况,同时杂交信号强度呈梯度多级变化,结果大大提高了杂交结果的特异性和可信性,解决了诊断基因芯片杂交结果的特异性不高和可信性不强的缺点,使基因芯片可用于诊断疾病的易感性,特别适用于特定人群的疾病普查,具有深远的经济和社会意义。
文档编号C12Q1/68GK1461811SQ02111909
公开日2003年12月17日 申请日期2002年5月31日 优先权日2002年5月31日
发明者郭学敏, 王国强, 李帅 申请人:中科开瑞生物芯片科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1