用于核酸分析的高度正交的通用序列的制作方法

文档序号:431815阅读:334来源:国知局

专利名称::用于核酸分析的高度正交的通用序列的制作方法
技术领域
:—般而言,本发明涉及产生用于核酸分析的通用序列。更具体而言,本发明涉及产生用于带分支DNA("bDNA")和其它核酸分析时具有可忽略不计的交叉反应性的高度正交的通用序列(highlyorthogonaluniversalsequences)。麵支A由ChironDiagnostics开发、现归BayerDiagnostics所有的bDNA分析使用线性而非指数信号扩增来提高诊断测试中定量杂交的灵敏度和特异性。Collinsetal,NUCLEICACIDRESEARCH25(15):2979-2984(1997)。bDNA分析用来对多种来源的RNA和DNA靶标进行定量。该分析的灵敏度和特异性部分来源于对构成探针组的寡核苷酸探针的明智的选择。在一种bDNA分析中,将捕获探针("CP")附着于固体支持物上,捕获辅助("CE")探针附着于CP,以介导将DNA或RNA靶标捕捉至固体支持物上。使用大量(一般>30个)被称为标记辅助("LE")探针的把特异性寡核苷酸对DNA或RNA把标进行标记,这介导bDNA扩增分子与CE的杂交。靶标与固体支持物的杂交一般通过与bDNA的分支结合的碱性磷酸酶探针来检测。信号扩增是由于结合的LE探针、bDNA扩增分子上的分支数目以及bDNA分子的每个分支上碱性磷酸酶结令位点的数目所导致的。这类bDNA分析被称为"第一代"bDNA分析或"Quantiplex"bDNA分析,可对10,000和10,000,000个分子/mL进行定量,并已用于检测HIV、HBV和HCV。Collinsetal.,同上,2979页。在"第二代"bDNA分析(也称为"灵敏度增强,,或"ES"bDNA分析)中,LE探针与扩增前体(preamplifier)结合,这进而会结合大量bDNA扩增分子。第二代bDNA分析的产生使得扩增信号增强,同时降低了检测局限性。例如,第二代bDNA分析能对500个分子/mLHIVRNA进行定量。参见Kernetal.,JOURNALOFCLINICALMICROBIOLOGY34(12):3196-3202(1996)。第一代和笫二代bDNA分析的负面作用在于扩增序列与非靶标分子的非特异性杂交所引起的背景噪音。例如,下述任何非特异性杂交均会导致背景噪音升高bDNA与CE探针(而非LE探针)的杂交以及CE探针与LE探针(而非CE探针与耙标以及把标与LE探针)的非特异性杂交。为减少bDNA分析中的非特异性杂交,可将非天然碱基异鸟。票呤核苦("iso-G")和异胞嘧,定(isocytidine,"iso-C")(两者均不与4壬^f可天然DNA或RNA碱基发生可检测到的相互作用)掺入扩增序列。Iso-G和iso-C《皮此之间形成标准的Watson和Crick相互作用,^f旦是,由于iso-G和iso-C之间的氢键合模式不同于天然碱基之间的氢键合模式,因此iso-G和iso-C与天然碱基之间不发生相互作用。参见美国专利No.5,681,702。具有iso-G/iso-C碱基对的序列较其G/C同源物在低2°C时更稳定。将iso-G和iso-C碱基掺入第二代bDNA分析的分析被称为"第三代,,bDNA分析或"System8"bDNA分析法。参见Collinsetal.(同上)和美国专利No.5,681,702。在第三代bDNA分析中,优选地,捕获探针、扩增前体探针、扩增探针和/或标记探针中的每隔两个或三个核苷酸为iso-G或iso-C,两者4皮此之间进4亍i威基配对,而不与天然碱基配对。将iso-G和iso-C核苷酸掺入bDNA分析时,由于非特异性杂交所致的背景噪音得到降低,同时信号得到增强。由于信号可被增强,同时没有相当的噪音放大,因此对于iso-G和iso-C的非特异性杂交的控制允许使用较大的LE扩增前体探针、较大的bDNA扩增分子或多层扩增,以增加bDNA分析的灵敏度。例如,Collins等人记载用碱性磷酸酶探针检测5attomol寡核苷酸耙标的信噪("S/N")比为5.5,而两层扩增的S/N比为19.6,三层扩增的S/N比为154.3。使用第三代bDNA分析,Collins等人能对60个分子/mLHIVRNA进行定量。Collinsetal.,同上,1982页。第二代和第三代bDNA分析以多重形式使用。参见Collinsetal.,同上,2983页。多重分析中,同时对多个靶标进行分析。多重分析已被用来对单核苷酸多态性("SNP")即基因组DNA中的单点变异进行基因分型,并用来筛选样本中的多种细胞因子。参见Iannoneetal.,Cytometry39:131-140(2000);Collinsetal.,supraat2983;anddeJageretal.,ClinicalandDiagnosticLaboratoryImmunology10(1):133-139(2003)。SNP代表着形式最为丰富的遗传变异,在人类基因组中平均每1-2kb就出现一次。已经鉴定了四百万个以上的SNP(参见http:〃www.ncbi.nlm.nih.gov/SNP),并且这些SNP中有一百二十万个以上已在人类基因组中定位(参见http:〃s叩.cshl.org)。由于人类基因组中的丰富重复序列,数据库中含有的全部SNP并不一定真的是多态性,或者它们在所研究特性群体中并不是多态性。对SNP的鉴定除了可用于对人的诊断分析外,还有多种用途。例如,对SNP的鉴定可用于在包括植物、哺乳动物和微生物在内的多种物种中制作遗传图谱,进行遗传变异分析和标记辅助育种。因此,准确有效的基因分型是鉴定SNP的先决条件。参见See,Lind訓setal.,NucleicAcidResearch30(14):l画9(2002).细胞因子是由免疫系统的细胞分泌的可溶蛋白质。这些蛋白质可改变不同细胞类型的表现和性质。不同的细胞因子在生物学上具有重叠功能,因此具有调节其它细胞因子产生的能力。因此,对微环境即发炎位点内的一整套细胞因子的功能进行分析通常比对一种单独的细胞因子进行分析更有价值。可在不同水平对细胞因子进行定量。在信使RNA("mRNA")水平和细胞水平上检测细胞因子的多重分析有一定的局限性,如需要较大体积的样本或者检测前体蛋白质而非天然蛋白质。参见deJageretal.,同上。为了以多重(multiplex)形式使用bDNA分析,必须使用多个CP和CE序列,目的在于将多个靶标附着于固体支持物上。Collinseta1.,同上。以多重形式使用六碱基密码子的第二代和笫三代bDNA分析的问题在于,在多个靶标的天然碱基与捕获探针、扩增前体探针、扩增探针和标记探针的天然碱基之间可能出现3体交叉杂交。更具体而言,如上所述,笫二代和第三代bDNA分析均在捕获探针、扩增前体探针、扩增探针和/或标记探针的每隔三个核苦酸位置具有一个非天然碱基;因此,通过这种设计,每种探针中四个可能的天然碱基中有三个位于两个非天然碱基之间。由于每个天然碱基仅有一个成功配对,因此,天然碱基与其三个错配碱基中的任何一个杂交都会显著降低多重bDNA分析的有效性。另外,随着对复杂的多重分析的开发,分析物之间不想要的交叉反应难以克服和消除。因此,本领域需要设计和产生用于bDNA单重和多重分析、不会交叉杂交的多个高度特异的序列。本发明通过设计和产生高度正交的六密码子通用序列,满足本领域的这一需要,所述通用序列可将现有技术中已知的第二代和第三代bDNA分析中所固有的3体交叉杂交最小化或将其转录病毒、SNP、细胞因子以及基因扩增和缺失的精确度得到大大提高。
发明内容为满足本领域对用于bDNA单重和多重分析、不会交叉杂交的多个高度特异的序列的需要,本发明一方面提供了包含四个天然碱基和两个非天然碱基的高度正交的六碱基通用序列,其中以非特定顺序排列的一至四个所述天然碱基选自鸟苷(G)、胞嘧啶(C)、腺香(A)和胸苷(T)或尿。密啶(U),并由所述一个或两个非天然碱基所分隔,由此使得约50%的所述序列含有G/C碱基,并使得所述序列的解链温度(Tm)约为80-85°C。本发明的另一方面提供了一种制备用于杂交的高度正交的通用序列的方法,包括如下步骤(a)从六个核苷酸碱基制备5,至3,序列,所述六个核苷酸碱基包含两个非天然碱基和选自鸟苷(G)、胞嗜啶(C)、腺苷(A)和胸苷(T)或尿嘧啶(U)的四个天然碱基,其中所述序列含有以非特定顺序排列的一至四个所述天然碱基,并由一个或两个所述非天然碱基所分隔;(b)筛选所述序列,仅选择G/C浓度为50%或50%以上的那些序列;(c)测试所述序列的解链温度(Tm),仅选择Tm约为80-85。C的那些序列;(d)分别用相同序列和互补序列交叉杂交所述序列;(e)仅选择与所述相同序列最多3体相互作用的那些序列。在本发明的上述两个方面,均优选以下这样非天然碱基选自异鸟噪呤核苷和异胞嗜啶,序列长20至25个碱基,Tm约为85。C。本发明的高度正交的通用序列可用于单重或多重bDNA分析来对样本中的mRNA进行定量,检测样本中的病毒、反转录病毒和SNP并对其进行基因分型以及测量样本中的基因扩增或缺失情况。高度正交的通用序列通常还可用作核酸分析中的通用捕获探针,此时它可用来以有助于进一步分析的方式将分析组分选择性结合至基底。本发明其它方面的优点和特点的一部分将在随后的描述中进行阐述,一部分通过本领域的技术人员查阅下文后将会变得显而易见的,或者可通过实施本发明而获知。附图简述本专利的文件包含至少一幅彩图。在提出请求并支付必要的费用后,美国专利商标局可提供包含彩图的本专利或专利申请出版物的副本。图1A示出用作制备本发明的正交通用序列的起始点的方案。图IB示出本发明的正交通用序列的方案;所示序列长20至25个碱基,G/C浓度约为50%,解链温度介于80-85°C,并且交叉反应性最小。图2为示出在使用bDNA的九重细胞因子mRNA定量分析中使用请求保护的本发明的正交序列的图。图3A为对比图,示出本发明的正交序列与Zipcode序列对0.1pmol把标的交叉相互作用。图3B为对比图,示出本发明的正交序列与Zipcode序列对1pmol#巴标的交叉相互作用。实现发明的最佳方式定义和术语在对本发明的具体实施方案进行描述之前,对用来描述本发明的定义进行阐述是有用的。所述定义仅可应用于在本专利中所使用的术语,而不适用于其它地方如科学文献或包括这些发明人或转让给共有人的其它申请在内的其它专利或申请。下文对优选的实施方案和实施例的描述以说明和例证方式提供。因此,不应将它们看作对权利要求书所限定的本发明范围的限定。另外,给出实例时,这些实例旨在示例而非限定。例如,某个实例述及"包括"某一特定特征,这旨在表明该实例可具有该特征,而不是将这些实例限定为包含该特征的那些实例。必须注意的是,除非上下文明确指明相反,本说明书和所附权利要求书中所使用的单数形式"a"、"an"和"the"包括复数指代对象。同样,术语"任选的"或"任选地"的使用意味着随后描述的事件或情况出现与否均可,并且意味着说明书包括所述事件或情况出现的情形以及不出现的情形。在对本发明进行描述和要求保护中将使用具有如下定义的术语。术语"正交序列"指Watson-Crick相互作用匹配完美的序列。例如,双螺旋中的序列ATCG与序列TAGC正交。具有高度正交序列的核酸通常具有理想的二级结构。术语"通用序列,,或"通用探针"在本文中可互换使用,指的是可用来测试多个不同样本的序列或探针,换言之,通用序列或通用探针独立于被研究序列。因此,本发明的"高度正交的通用序列"指这样的序列,即该序列具有严格的Watson-Cnck相互作用,并不适合于鉴定特定样本,而可用于在例如多重分析中对多个样本进行筛选。正如本文所述,本发明的高度正交的通用探针是等温的(isothermal),动力学始终如一,并展现出极小的非特异性交叉杂交。术语"核酸分析物"指用于分析的核酸即DNA或RNA。术语"靶标"指分子、基因或基因组,其含有意欲通过鉴定、定量或扩增来进行表征的核酸序列或序列片段。本发明所述及的靶标可来源于任何生物,包括哺乳动物和除哺乳动物外的动物、细菌、病毒或真菌。反转录病毒是可在bDNA分析中使用本发明的高度正交的通用序列鉴定或定量的靶标的一个实例。应理解的是,如若需要,术语"核酸分析物"、"靶标"和"靶标核酸分析物,,可互换使用,以鉴定用于表征的生物内的核酸、核酸序列或核酸序列区段、细菌或病毒。本文所使用术语"样本"指的是获自生物例如人的流体或组织,其含有有待表征的核酸分析物。这类样本为本领域所知,包括但不限于血液、血浆、血清、脊髓液、淋巴液、细胞裂解物、眼泪、唾液、精液、奶以及皮肤、呼吸道、肠道或胃肠道的分泌物。所研究核酸分析物可为来自宿主或非宿主遗传物质的遗传物质。因此,例如获自人类个体的样本可含有人的遗传物质和/或感染病原体(如细菌、病毒或真菌等)的遗传物质。可通过使用常规技术,例如针吸活组织检查或擦拭等,自生物组织或流体样本获得本文所述的这些样本。本文所使用术语"病毒"通常用来指DNA病毒和RNA病毒,后者被称为"反转录病毒"。本领域的常规技术人员应当理解,DNA病毒通过将DNA整合至宿主基因组进行复制,而反转录病毒通过将RNA整合至宿主基因组进行复制。对DNA病毒进行筛选时,双链病毒DNA必须从蛋白外壳释放并变性,目的是将两条链分开。然后将单链病毒DNA与结合基底的捕获探针杂交,并用bDNA分子来扩增单链DNA。对RNA反转录病毒进行筛选时,病毒RNA自病毒蛋白外壳释放并与所结合的捕获探针杂交。由于病毒RNA并非双链,因此无需变性步骤。应当理解,在本发明的范围内,可用bDNA分析筛选DNA病毒和反转录病毒。术语"基因"指的是DNA分子内的特定核酸序列,其位于染色体上的精确的基因座上,并且能通过编码特定多肽链进行自我复制。术语"基因组"指的是特定生物体的每个细胞的染色体中的整套基因。术语"基因扩增"指的是生物体的基因组中特定基因的拷贝数的增加。本领域的普通技术人员应当理解,基因组内存在某个基因的多个拷贝可产生水平升高的相应蛋白质。应当理解,本文所使用术语"核苷酸"和"核苷"指的是这样的核苷和核苷酸它们不仅含有四个天然的DNA核苷酸;威基,即嘌呤石成基鸟噤呤(G)和腺。票呤(A)以及嘧啶碱基胞嘧啶(C)和胸腺嘧啶(T),还含有RNA噤呤碱基尿嘧啶(U)、非天然核苷酸碱基iso-G和iso-C、通用碱基、简并碱基(degeneratebase)以及其它经修饰的核香酸和核香。通用石威基为这样一类碱基,即所述碱基具有替换四个正常碱基中的任何一个碱基、并且不会显著影响双链体的解链行为或寡核苷酸的生化功用的能力。通用碱基的实例包括3-硝基吡咯和4-、5-和6-硝基吲哚以及2-脱氧肌苷(dl),后者被认为是唯一的"天然"通用碱基。尽管在理论上dl可结合所有的天然碱基,但是它主要作为G编码。简并碱基由嘧啶衍生物6H,8H-3,4-二氢嗜咬并[4,5-c][1,2]嗪-7-酮(P)(在其被引入具有G或A的寡核苷酸碱基对时)和嘌呤衍生物N6-曱氧基-2,6,-二氨基嘌呤(K)(在其被引入具有C或T的寡核苷酸碱基对时)组成。P和K碱基对的实例包括P-亚氨基、P-氨基、K-亚氨基和K-氨基。对核苷酸和核苷的修饰包括但不限于嘌呤或嘧啶部分的曱基化或酰化、不同杂环结构对嘧咬环或噤呤环系统中的一个或两个环的取代以及对一个或多个官能团的保护,例如使用保护基团如乙酰基、二氟乙酰基、三氟乙酰基、异丁酰基、苯曱酰基等。经修饰的核苷和核苷酸还包括对糖部分的修饰,例如,其中一个或多个羟基被卣素和/或烃基取代基(在后一种情况下,通常为脂肪族基团)取代,或者被官能化为醚、胺等。经修饰核苷酸和核苷的实例包括但不限于1-曱基腺嘌呤、2-甲基腺嘌呤、N6-曱基腺噤呤、N、异戊基-腺。票呤、2-曱硫基-N、异戊基腺噤呤、N,N-二甲基腺嘌呤、8-溴腺噪呤、2-硫胞嘧啶、3-曱基胞嘧啶、5-曱基胞嘧啶、5-乙基胞嘧啶、4-乙酰胞嘧啶、1-曱基鸟嘌呤、2-曱基鸟嘌呤、7-曱基鸟嘌呤、2,2-二曱基鸟嘌呤、8-溴-鸟。票呤、8-氯鸟。票呤、8-氨基鸟噤呤、8-曱基鸟噤呤、8-硫鸟嘌呤、5-氟-尿嘧咬、5-溴尿嘧啶、5-氯尿嘧啶、5-碘代尿嘧啶、5-乙基尿嘧啶、5-丙基尿嘧啶、5-曱氧基尿嘧啶、5-羟曱基尿嘧啶、5-(羧基羟基曱基)尿嘧啶、5-(曱基-氨曱基)尿嘧啶、5-(羧曱基氨曱基)-尿嘧啶、2-硫尿嘧啶、5-曱基-2-硫尿嘧啶、5-(2-溴乙烯基)尿嘧啶、尿嘧啶-5-氧乙酸(oxyaceticacid),尿口密口定-5隱氧乙酸甲酉旨(oxyaceticacidmethylester)、假尿嘧啶、1-甲基尿嘧啶、Q核苷(queosine)、肌肝、l-曱基肌肝、次黄噤呤、黄噤呤、2-氨基噪呤、6-幾基氨曱基噤呤、6-硫代嘌呤和2,6-二氨基噤呤。本文所使用的术语"寡核苷酸"包括多脱氧核糖核普酸(含有2-脱氧-D-核糖)、多核糖核香酸(含D-核糖),为噤呤或嘧啶碱基的N-糖苷的任何其它类型的多核苷酸以及含有非核苷酸骨架(如购自Anti-GeneDevelopmentGroup,Corvallis,Oregon的蛋白#亥酸和合成型序列特异'l"生^亥酸聚合物,为NeugeneTM聚合物形式)或非标准键的其它聚合物,前提是聚合物含有构象为可进行诸如DNA和RNA中的碱基配对和碱基堆集(stacking)的核酸碱基(necleobase)。因此,本文的"寡核苷酸"包括双链和单链DNA以及双链和单链RNA和DNA:RNA杂合体,并且还包括已知类型的经修饰寡核苷酸,例如其中一个或多个天然存在的核苷酸被类似物取代的寡核苷酸;含有核苷酸间修饰的寡核苷酸,所述核苷酸间修饰为例如具有不带电的键的核苷酸间修饰(如曱基膦酸酯、磷酸三酯、氨基磷酸酯、氨基曱酸酯等)、带负电的键的核普酸间修饰(如硫代磷酸酯、二硫代磷酸酯等)以及带正电的键的核苷酸间修饰(如氨烷基亚磷酰胺、氨烷基磷酸三酯);含有悬挂(pedant)部分的核苷酸间修饰,例如蛋白质(包括核酸酶、毒素、抗体、信号肽、聚L-赖氨酸等),具有插入物的核苷酸间修饰(如吖啶、补骨脂素等),含有螯合剂的核苷酸间修饰(如金属、放射性金属、硼、金属氧化物等)以及含有烷化剂(alkylator)的核苷酸间修饰。术语"多核苷酸"和"寡核苷酸"之间在长度上没有预定的差异,这些术语将互换使用。这些术语仅指分子的一级结构。本文所使用的核苷酸和多核苷酸的符号以IUPAC-IUBMB联合委员会生物化学命名为依据(参见http:〃www.chem.qmul.ac.uk/iupac/jcbn)。可通过已知方法合成寡核苷酸。通常与合成寡核苷酸的方法相关的背景参照物包括涉及基于使用P-氰乙基磷酸酯保护基从5,至3'合成的那些背景参照物。参见例如deNapohetal.,GAZZCHIMITAL114:65(1984);Rosenthaletal.,TETRAHEDRONLETT24:1691(1983);BelagajeandBmsh,NUCACIDSRES10:6295(1977);描述了5,至3,的液相合成的参考文献包括HayatsuandKhorana,JAMCHEMSOC89:3880(1957);GaitandSheppard,NUCACIDSRES4:1135(1977);CramerandKoster,ANGEWCHEMINTEDENGL7:473(1968)和Blackburnetal.,JCHEMSOCPARTC,at2438(1967)。另外,MatteucciandCaruthers,JAMCHEMSOC103:3185-91(1981)描述了使用亚裤酰氯(phosphochloridites)制备寡核香酸,BeaucageandCaruthers,TETRAHEDRONLETT22:1859-62(1981)以及授权给Caruthers等人的美国专利No.4,415,732描述了使用亚磷酰胺制备寡核香酸。Smith,AMBIOTECHLAB,pp.15-24(December1983)描述了自动固相寡脱氧核糖核苷酸合成,并且T.HornandM.S.Urdea,DNA5:421-25(1986)描述了使用双(氰基乙氧基)-N,N-二异丙基氨基膦(bis(cyanoethoxy)國N,N画diisopropylaminophosphine)对固相支持的DNA片)爻进4亍磷酸化。还参见Smith(同上)所引用的文献;Warneretal.,DNA3:401-11(1984);andT.HornandM.S.Urdea,TETRAHEDRONLETT27:4705-08(1986)。术语"互补"和"基本互补"指核苷酸或核酸之间的碱基配对,例如双链DNA分子的两条链之间或寡核苷酸引物和有待测序或扩展的单链核酸上的引物结合位点之间的碱基配对。通常互补核苷酸为A和T(或A和U)以及G和C。本文所使用的术语"探针"指包含多核香酸的结构,由于探针的至少一个序列与靶标序列之间的互补性,所述多核苷酸与进行分析的样本中的分子(即"靶标分子")中所含有的靶序列形成杂合体结构。任何具体探针的核苷酸可为脱氧核糖核苷酸、核糖核苷酸和/或合成型核苷酸类似物。术语"引物"指的是包含寡核苷酸、在纯化的限制性酶切消化补的引物延长产物的条件下,即在合适的緩冲系中,在合适的核苷酸和聚合剂(如DNA聚合酶)存在的情况下,以及适当的温度下,该分子能作为合成起点。术语"杂交条件"旨在表示那些足以使得至少一部分互补序列彼此退火的时间、温度和pH条件以及必要量和浓度的反应物和药剂。正如本领域所知,完成杂交所需时间、温度和pH条件取决于待杂交寡核苷酸探针的大小、寡核苷酸探针和靶标之间的互补程度以及杂交反应混合物中是否存在其它物质。本领域已知每步杂交所需的实际条件,即该条件无需过多实验即可确定。常规杂交条件包括使用pH被緩冲为约7至约8.5的溶液以及约30。C至约6CTC的温度(优选约37。C至55。C的温度)进行约一秒至约一天(优选地,约15分钟至约16小时,最优选地,约15分钟至约三小时)的一段时间。"杂交条件"还包括有效的緩冲系。可使用与探针和其它组分相容(即不起化学作用、但却可使互补碱基对之间进行杂交)的緩沖系。一种特别优选的緩冲系包含3XSSC、50%曱酰胺、10。/o硫酸葡聚糖(MW500,000)、0.2%酪蛋白、10貼/mLpolyA和100昭/mL变性鲑精DNA,其中IXSSC为0.15M氯化钠和0.015M柠檬酸钠。另一种特别优选的緩沖系包含5XSSC、0.1至0.3%十二烷基硫酸钠、10%硫酸葡聚糖、1mMZnCl2和10mMMgCl2,其中1XSSC如上所述。其它合适的緩沖系是本领域的普通技术人员所知的。本领域的普通技术人员应当理解,从样本分离DNA和RNA靶序列需要不同杂交条件。例如,若样本起初在碱性緩冲系中遭到破坏,那么就使得双链DNA变性并且破坏了RNA。相反,若在含SDS和蛋白酶K的中性緩沖系中收集样本,那么DNA依然为双链,不能与探针杂交,并且RNA受到保护,免于降解。术语"基底"指的是想要的寡核苷酸可锚定的任何固体或半固体表面。合适的基底包括可固定寡核苷酸的任何物质,包括例如玻璃,竭酸纤维素,塑料包括聚氯乙烯(如薄片或微量滴定孔形式)、聚苯乙烯乳胶(如小球或微量滴定板形式)、聚偏氟乙烯(如微量滴定板形式)、聚苯乙烯(如小球形式),金属、聚合物凝胶等等。术语"支持物"指的是探针、分析物分子或其它化学个体可锚定的任何固体表面(包括半固体表面)。合适的支持物材料包括但不限于通常用于固相化学合成的支持物,如聚合材料(如聚苯乙烯、据醋酸乙烯酯、聚氯乙烯、聚乙烯吡咯烷酮、聚丙烯腈、聚丙烯酰胺、聚曱基丙烯酸曱酯、聚四氟乙烯、聚乙烯、聚丙烯、聚偏乙烯、聚碳酸酯、基于苯二乙烯-苯乙烯的聚合物)、琼脂糖(如Sepharose)、葡聚糖(如Sephadex)、纤维素聚合物和其它多糖、二氧化硅和基于二氧化硅的材料、玻璃(可控多孔玻璃)和官能化玻璃和陶瓷。优选的支持物是小球或颗粒形式的固体基底,其包括^鼓粒和纳米颗^立。本文所使用术语"标记"指任何原子或分子,所述原子或分子可用来提供检测(优选定量)信号,并可通过共价键或非共价相互作用(如通过离子键或氢键,或通过固定、吸附等)连接核酸或蛋白质。标记通常可提供通过荧光法、化学发光法、放射法、比色法、质谱法、X-射线衍射或吸收法、磁学法、酶活性法等检测的信号。合适的标记包括具有特定结合配偶体的荧光团、发色团、放射性原子(尤其是"P和1251)、电子致密物(electron-densereagent)、酶和配体。酶通常通过其活性4企测。例如,通过其将3,3,,5,5,-四曱基联苯胺(TMB)转化为可用分光光度计定量的蓝色色素的能力来检测辣根过氧化物酶(HRP)。应理解的是,由于一种标记可使用两种或多种不同方法检测,所以上面的描述无意于将多种标记分成不同类别。例如,1251可作为放射性标记,也可作为电子致密物。HRP可作为酶或作为单克隆抗体(mAb)的抗原。另外,可就所需作用结合多种标记。例如,mAb和亲和素(avidin)在实施本发明中也需要标记;因此,可用生物素标记探针,并用1251标记的亲和素或HRP标记的抗生物素mAb或者缀合亲和素或链霉亲和素的HRP分子检测其是否存在。对于本领域的普通技术人员而言,其它排列和可能性是显而易见的,并且被认为是等价方案。术语"靶标扩增"指的是扩增基因或一部分基因的过程,例如PCR或线性扩增(参见PhillipsandEberwine,METHODS10(3):283-288(1996》。术语"PCR"指的是授权给Mullis等人的美国专利No.4,683,195和授权于Mullis的美国专利No.4,683,202中公开的多聚酶链反应("PCR")技术,两份专利均通过引用纳入本文。简而言之,在PCR技术中,将溶液的DNA样本与摩尔过量的每个均为10-30个石威基对的两个寡核苷酸引物(被制备成与DNA双螺旋的每条链的3,末端互补)、摩尔过量的未连接的核苷酸碱基(dNTP)和DNA聚合酶(优选热稳定的Taq聚合酶,它催化由寡核苷酸引物和dNTP形成DNA)混合。两个引物中,一个为沿5,-3,方向结合变性DNA分析物的一条链的3'端的正向引物,另一个为沿3'-5'方向结合变性DNA分析物的另一条链的3'端的反向引物。将溶液加热至94-96°C,以使双链DNA变性成为单链DNA。溶液冷却时,引物与分开的链结合,DNA聚合酶通过使dNTP与引物相连来催化合成分析物的一条新链。重复该过程,在由引物合成的延伸产物与其互补物分开时,每个延伸产物可作为由另一引物合成的互补延伸产物的模板。换言之,由正向引物合成的延伸产物一旦分开,即可作为由反向引物合成的互补延伸产物的模板。同样,由反向引物合成的延伸产物一旦分开,即可作为由正向引物合成的互补延伸产物的模板。通过这种方式,引物之间的DNA区域可通过该过程的每次重复选择性复制。由于被扩增的序列在每个循环之后倍增,因此理论上扩增十亿个拷贝可在重复该过程几小时后实现;因此,使用PCR可在相对4交短的时间里对极少量的DNA加以扩增。若用于PCR反应的起始材料为RNA,那么可通过反转录自RNA制备得到互补DNA("cDNA")。然后使用上述PCR方案对所得到的cDNA进行扩增。反转录酶作为在反转录病毒中发现的酶被本领域的普通技术人员所知,其可从作为模板的mRNA序列来合成DNA的互补单链。该酶可用于遗传工程中,以自纯化制备的mRNA产生特异的cDNA分子。用来扩增RNA产物的PCR被称为反转录酶PCR或者"RT-PCR,,。术语"单重"指的是并不同时进行其它分析的一个分析。单重分析包括连续进行的各个分析。通常该分析为杂交分析。术语"多重"指的是同时进行的多个分析,其中检测和分析步骤通常平行进行。本文所使用的多重分析还可根据分析旨在鉴定的靶分子的数目命名。例如,被设计来鉴定六种细胞因子的多重分析可被称为"六重"分析,被设计来鉴定十一种细胞因子的多重分析可被称为"十一重"分析。与单重分析一样,多重分析通常为杂交分析。若无相反指明,本文所使用术语"bDNA分析"指单重和多重bDNA分析。尽管任何相似或等价的方法和物质可用来实施或测试本发明,但是下面还是要对优选的方法和物质进行描述。正交序列本发明的一个实施方案中提供了含有四个天然碱基和两个非天然碱基的高度正交的六碱基通用序列,其中以非特定顺序排列的一至四个所述天然碱基选自鸟苷(G)、胞嘧啶(C)、腺苦(A)和胸普(T)或尿嘧啶(U),并由所述一个或两个非天然碱基所分隔,由此使得约50%的所述序列含有G/C碱基,并使得所述序列的解链温度(Tm)约为80-85。C。在本发明的一个优选实施方案中,所述两个非天然碱基为异鸟嘌呤或异胞嘧啶。如实施例2所示,还优选序列的Tm约为85°C。虽然本领域的普通技术人员应当理解,序列的长度根据其预定用途将有所变化,但是理想的是,序列长20至25个碱基。例如,在某些情况下,序列不到20体或长于25体可能是优选的。在这方面,长10-50个碱基的序列包括在本发明中,优选序列长15-30个碱基,最优选序列长20-25个碱基。如上所述,要求保护的正交通用序列的四个天然碱基选自下列核苷酸DNA被杂交的情况下,鸟苷(G)、胞嘧啶(C)、腺苷(A)和胸苷(T);和RNA被杂交的情况下,鸟苷(G)、胞嘧啶(C)、腺苷(A)和尿嘧啶(U)。鸟苷和腺苷为噤呤,由六元和五元含氮稠环组成,而胞嘧啶、胸苷和尿嘧咬为噤呤,由六元含氮环组成。天然碱基核苷酸形成了噤呤-嗜啶碱基对G/C和A7T(U)。G/C碱基对的结合能大于A/T碱基对的结合能,原因在于与后者中的两个石威基相比较,前者存在三个氬键合部位,如下所示<formula>formulaseeoriginaldocumentpage17</formula>由于G/C碱基对的较高的结合能,冨含G/C的序列的解链温度(Tm,即50%的序列与其互补序列退火的温度)较A/T含量丰富的序列的高。序列的Tm可通过任一如下方法提高增加序列的G/C含量;增加<formula>formulaseeoriginaldocumentpage17</formula>分子的长度,即较长的DNA比较短的DNATm更高;增加序列的离子强度(以增加阳离子,减少DNA骨架的排斥力);调节序列的pH(因为极端pH值会使碱基离子化并破坏H键,超过pH5-9,Tm会急剧下降);并仔细选择溶剂(已知有机溶剂可降低Tm)。确定适用于大约为中性pH的水溶液的Tm的公式为"。/oG/C-法"Tm(。C)=81.5。C+16.6(log[Na+〗)+0.41(%GC)-675/n,其中n为序列中核苷酸的数目。通过用该公式计算Tm,可确定序列的退火温度,无需使用物理方式用UV分光光度计测量序列。必须对序列的退火温度进行预测来设定PCR实验设计时,使用这个公式是有用的。广泛用来确定序列的退火温度的另一个公式为如下较短的公式。Td(。C)=2[A+T]+4[C+G]该公式可确定解离温度(Td)(即50%的序列与其膜结合互补序列退火的温度)而非Tm,已发现对于长14-20个碱基对的序列而言该公式是准确的。使用该公式时,用于PCR目的的序列的退火温度通常被计算为Td-5。因此,例如,若表1的寡核苷酸CP1或CE1用作PCR引物,那么引物的退火温度为69.7°C(Td)减去5即64.7°C。预测核苷酸序列的Tm的其它公式为本领域的普通技术人员所知,包括例如"最近毗邻"法,这种方法在http:〃micx>,nwfsc,noaa,goy/protocQls/methQds/DNA-PCRMethQdsDocs/10-2002/10.8.02.2167.html中解释—对预测核苷酸序列的Tm的可选公式的讨论示于Ahsenetal.,CLINICALCHEMISTRY47(11):1956醫1961(2001)中。在本发明的范围内,优选高度正交的序列的Tm约为80°C,更优选地,85°C。应当理解,Tm为80-85。C的范围是高度正交的通用序列的优选范围,但在某些情况下,低于80。C或高于85。C的Tm可能是优选的。因此,在某些情况下,约75。C或90°C的Tm可能是序列优选的Tm。如上所述,正交通用序列中的G/C含量会影响序列的Tm。因此,尽管最优选正交通用序列的G/C含量约为50%,但是应当理解,G/C浓度大于50%的序列也在本发明考虑范围内;因此,在某些情况下,优选G/C浓度大于50%的序列,例如G/C浓度范围为51%至75%或更高的序列。如上所述,iso-G和iso-C之间的氢键合模式不同于G和C之间的氢键合模式,因此,iso-G和iso-C与天然碱基不发生相互作用;iso-G和iso-C的键合模式如下所示尽管本发明的优选序列长为20至25个碱基,但是应理解的是,在某些情况下,少于20体或长于25体的序列可能是优选的。本发明的高度正交的通用序列可通过下述方法制备(a)从六个核苷酸碱基制备5,至3,序列,所述六个核苷酸碱基含有两个非天然碱基和选自鸟苷(G)、胞嘧啶(C)、腺苷(A)和胸苷(T)或尿嘧啶(U)的四个天然碱基,其中所述序列含有以非特定顺序排列的一至四个天然碱基,并由两个非天然碱基的一个或两个碱基分隔;(b)筛选所述序列,仅选择G/C浓度为50%或50%以上的那些序列;(c)测试所述序列的解链温度(Tm),仅选4奪Tm约为80-85。C的那些序列;(d)分别用相同序列和互补序列交叉杂交所述序列;并(e)仅选择与所述相同序列有最多3体相互作用的那些序列。图1A显示了要求保护的正交序列的普通结构。图1B显示了经重排使得具有约50%G/C组合物和解链温度约为80-85。C的正交序列。实施例2描述了图1B所示探针的产生,并且如实施例2所述,该探针来源于图1A的普通结构。如上所述,优选地,非天然碱基选自异鸟苦和异胞嘧啶,并且序列长约20至25个碱基,Tm约为85。C。信号检测如上所述,本发明高度正交的通用序列被用作bDNA分析的CP、CE、LE或扩增探针(参见例如实施例2-4),bDNA分析的信号扩增是由于结合LE探针、bDNA扩增分子上的分支数目以及bDNA扩增探针的每个分支上的碱性磷酸酶或其它酶标记的结合位点的数目所致。任何类型的标记均可用来检测本文所述信号扩增产物,并且对bDNA扩增探针进行标记可通过本领域已知的任何方法完成;这些方法通常取决于标记的性质。优选的标记包含通过光谱法、光化学法、生物化学法、免疫化学法或化学法可检测的那些部分。这类标记包括但不限于荧光剂、化学发光剂、染料、生物素、半抗原、酶、酶底物、酶辅因子、酶抑制剂、酶亚基、金属离子、电子致密物和放射性同位素(如32P)。标记部分可直接或间接连接扩增子。优选地,若标记直接连接引物,则应选择能经受住变性条件的标记。尽管并不必要,但标记还是优选为生物素,生物素可通过与偶联荧光剂的链霉亲和素(例如链霉亲和素-藻红蛋白缀合物)的结合来检测。对于焚光剂,可使用多种荧光计。对于化学发光剂,可使用发光计或薄膜。使用酶可提供荧光产物、化学发光产物或有色产物,可通过焚光法、化学发光法、分光光度测量法或通过观察(优选在显微镜的帮助下)来测定。例如,通过加入链霉亲和素-藻红蛋白缀合物,然后对藻红蛋白诱导的荧光进行检测可检测生物素化的标记。固体基底所提供的每种信号可通过任何常规方法检测。例如,信号可以基底形状为基础,其中第一检测信号和第二检测信号的不同之处在于相应固体基底的形状不同。但是,优选地,每组固体基底,例如,大部分的第一固体基质产生所述大部分固体基质特有的信号。因此,例如,每种第一固体基质具有笫一检测信号,每种第二固体基质具有第二检测信号。另外,第一和第二检测信号可由选自下列的部分所提供荧光剂、化学发光剂、染料、生物素、半抗原、酶、酶底物、酶辅因子、酶抑制剂、酶亚基、金属离子、电子致密物和放射性同位素。但是,最优选固体基底为小球,其中检测信号由一种或多种荧光染料提供。适合染色的基底的实例如小球描述于授权给Chandler等人的美国专利No.6,268,222。如上所述,固体基底包含荧光染料和有色染料的组合。优选的染料包括其特征在于发射波长为550nm至卯0nm的花青(cyamne)染料。一些花青染料具有蓝色至蓝绿色荧光,而另一些具有绿色至黄绿色荧光。另外,其它花青染料具有红色甚或红外荧光。花青染料或任何其它常规染料可通过共价键与基底连接或被吸附如"被染色"于其上。另外,基底可连接一群或多群经荧光染色的纳米颗粒,其中指定群体中的全部纳米颗粒具有相同的染料浓度。通过改变针对连接基底的不同群体的纳米颗粒的不同染料的数量和比率,能建立和辨别大量具有独特发射光谱的不同类别的基底。这类经独特标记的基底可特别用于序列的多重分析,并且可通过使用流式细胞术对其进行方便地检测和分析。这类小球还可自供应商例^口LuminexCorporation(Austin,Texas)购买。直径小于一毫米的基底可用于流式细胞仪,虽然也可使用其它大小的颗粒。但是,优选地,使用球形的基底,例如小球。这类小球的大小为约0.1至1,000pm,优选1至100pm,更优选2至50,进一步优选3至25pm,最优选直径为约3至10nm的小球。这个大小的小球适用于流式细胞仪,由此可提供对复合物进行检测和计数的简单方法。尽管并不必要,但是固体基质还是优选由聚合材料如聚苯乙烯制备。其它可用的聚合材料包括溴化聚苯乙烯、聚丙烯酸、聚丙烯腈、聚酰胺、聚丙烯酰胺、聚丙烯醛(polyacrolein)、聚丁二烯、聚己酸内酯、聚碳酸酯、聚酯、聚乙烯、聚对苯二曱酸乙酯、聚二曱基硅氧烷、聚异戊二烯、聚氨酯、聚乙烯乙酸酯、聚氯乙烯、聚乙烯吡啶、聚乙烯苄基氯、聚曱基苯乙烯、聚偏二氯乙烯、聚二乙烯苯、聚曱基丙烯酸曱酯、聚交酯、聚乙醇酸交酯、聚(丙交酯-共-乙交酯)、聚酐、聚原酸酯、聚磷腈(polyphosphazene)、polyphosophaze、聚讽及其组合。这些聚合物还可掺入选自下列物质的i兹性或》兹性应答(magneticallyresponsive)金属IU匕物超顺磁金属氧化物、顺磁金属氧化物、铁氧性金属氧化物(ferrimagnetic)、反铁磁性金属氧化物(antiferromagnetic)和铁磁性金属氧化物(ferromagneticmetaloxides)。实用性要求保护的发明的高度正交的通用序列在多种应用例如诊断分析和遗传分析等中具有实用性。具体而言,高度正交的通用序列可用于单重或多重bDNA分析,以定量和定性地确定样本中的mRNA水平;以筛选样本中少量存在的靶标(例如病毒等)并对其进行基因分型;以及,以筛选样本中的SNP并对其进行基因分型。高度正交的通用序列还可用作通用捕获探针,来固定PCR和用于进一步分析的其它基因扩增方法产生的扩增产物。在本发明的一个实施方案中,本发明的高度正交的通用序列可用于单重或多重bDNA分析,以对样本中的mRNA进行定量。实施例3描述了使用高度正交的通用序列对细胞因子mRNA进行定量,并在國2示出。在该实施例中,在多重bDNA分析中定量九种细胞因子的mRNA。实施例3的结果表明本发明的高度正交的通用探针可准确定量mRNA,并特别证实本发明的高度正交的通用序列用于多重bDNA分析来对靶mRNA进行定量时,靶标之间的交叉反应性的程度可忽略不计。显然应当理解,可在单重bDNA细胞因子分析中对唯——种细胞因子的mRNA进行筛选和定量。将高度正交的通用序列用于bDNA分析对mRNA进行定量并不局限于对细胞因子mRNA进行定量;高度正交的序列可用于bDNA分析来,以对任何样本的mRNA进行定量。例如,本文所述的bDNA分析可用于样本例如细胞、血液、组织等,目的在于对特定基因的转录水平进行定量。以这种方式使用高度正交的探针的bDNA分析的用途颇为广泛。例如,对mRNA的定量可用于临床诊断,以对肿瘤细胞中的抗药性标记的调控和表达进行定量,监控对化疗的反应性,测量基因编码疗法的生物分布和转录,提供肿瘤阶段的分子评估,检测癌症患者的循环肿瘤细胞以及检测细菌性和病毒性病原体。除了在bDNA分析中使用高度正交的序列来对mRNA水平进行定量外,高度正交的序列还可用作bDNA分析中的探针来测量例如在基因扩增或缺失时样本中基因的量的改变。在本发明的范围内,高度正交的通用序列可用于单重分析,以对样本中的一种基因的拷贝的扩增或缺失情况进行测量,或者可将其用于多重分析,以对样本中的多个基因的扩增或缺失情况进行测量。待测的一种或多种基因与任何疾病状况相关。作为示例,若疾病状况是癌症,那么可用高度正交的通用序列进行确定若肿瘤样本中存在额外拷贝的癌基因,则表明该肿瘤是恶性的,或者若之前的癌样本中存在极少拷贝的基因,则表明癌症得到减轻。致癌基因为本领域的普通技术人员所知,其包括但不限于诸如p53癌基因和Her-2/neu基因等测到是由于乳腺癌肿瘤的快速生长所致。致癌基因的数据库由美国国立癌症研究所的癌症基因组办公室公布于因4争网上,网址是http:〃www3.cancer.gov/ocg/—在本发明的另一实施方案中,本发明的高度正交的六碱基通用序列可用于bDNA分析,以检测具有低病毒载量的DNA病毒和反转录病毒。这类DNA基因包括但不限于牛和人乳头瘤病毒(分别为"BPV"和"HPV");多瘤病毒例如猿猴病毒40("SV40")和人多瘤病毒;腺病毒;疱渗病毒例如爱泼斯坦-巴尔病毒("EBV")、人巨细胞病毒和(CMV")、单纯疱渗病毒("HSV");和曱型、乙型、丙型和丁型肝炎病毒("HAV"、"HBV"、"HCV"和"HDV")。本领域的普通技术人员应当理解,尽管HBV为DNA病毒,但是其表现与反转录病毒更相似,原因在于它可进行反转录。因此,就HBV而言,病毒DNA被转录成为RNA,以制备病毒蛋白质并进行基因组复制,随后,基因组RNA被反转录为基因组DNA。通过使用本发明的高度正交的通用序列可在bDNA分析中鉴定的反转录病毒包括但不限于肿瘤病毒例如鼠白血病病毒("MLV")、牛白血病病毒("BLV,,)和人T-细胞亲淋巴病毒("HTLV)以及慢病毒,如人类免疫缺陷病毒("HIV")。作为一个实例,使用高度正交的序列的bDNA分析可检测HIVRNA的不到50个分子/mL的fflV病毒载量。如上所述,通过将现有分析中普遍存在的分析物交叉反应性最小化,本文所述高度正交的通用序列显著提高了病毒和反转录病毒定量分析的灵敏度(参见实施例4以及图3A和3B)。在本发明的又一实施方案中,本发明的高度正交的通用序列用于单重或多重形式的bDNA分析,来对样本中的SNP进行筛选,并对其进行基因分型。多重SNP基因分型的实例描述于Iannoneetal.,同上,132页。Iannone等人使用寡核苷酸连接分析法("OLA")来鉴定基因组样本中的SNP。在OLA中,将两个寡核苦酸探针与耙DNA杂交,由此使得一个寡核苷酸(探针)的3'端与第二个探针的5'端紧密相邻。若两个寡核苷酸探针与靶DNA完美地进行碱基配对,那么DNA连接酶就能以共价方式将两个探针连接起来。本发明的正交序列可用于对SNP进行基因分型,原因在于它们可用来设计捕获探针,所述捕获探针可用来与通过PCR扩增得到的基因组靶标杂交以及与偶联孩i球的互补DNA序列杂交。应当理解,本发明高度正交的通用序列可用于单重SNP基因分型分析以及多重SNP基因组分析。在本发明的再又一个实施方案中,本发明的高度正交序列若高度正交的通用序列在操作期间可以以有助于进一步分析的方式用来将分析组分选择性结合至基底,那么它通常还可用作核酸分析中的通用捕获探针。在使用PCR的靶标扩增的上下文中,所研究的核酸分析物分离自样本,并使用上述PCR方法对其进行扩增。高度正交的通用序列可用于选择性捕捉互补序列,并将扩增子固定至单独独特的固相结合表面。合成每个PCR引物对的一员,使得在其5'端含有正交捕获序列。可将由此产生的扩增子捕捉至不同的固相,每一种固相均由合适的互补序列衍生化得到。PCR扩增步骤之后,通过通用正交序列对的杂交,所产生的扩增子被捕捉至独特的固相;扩增子的捕获可出现在温度为37至55。C时。由于要求保护的通用序列的高度正交性,通用核苷酸序列和靶标扩增产物所固有的一级或二级结构之间的交叉反应性最小化。应该理解的是,尽管结合本文所阐述的优选具体实施方案对本发明进行了描述,但是上文的描述以及下列的实施例旨在示例,无意于限定本发明的范围。本领域的技术人员所理解的是,在不背离本发明的范围的情况下,可作很多改变并用等价方案替换,另外在其它方面,对于本领域的普通技术人员而言,与本发明相关的优点和改进是显而易见的。上文和下文提及或参考的所有专利、公开出版物和其它公开的文献可通过援引全文纳入本文。实施例1除非有相反指明,实施本发明可使用本领域已知的合成有机化学、生物化学、分子生物学等的常规技术。这些技术在文献中有充分说明,参见Sambrook,etal.,MOLECULARCLONING:ALABORATORYMANUAL,2ndedition(1989);OLIGONUCLEOTIDESYNTHESIS(M.J.Gait,ed.,1984);THEPRACTICEOFPEPTIDESYNTHESIS(M.BodanszkyandA.Bodanszky,2nded.,Springer陽Verlag,NewYork,NY,1994);NUCLEICACIDHYBRIDIZATION(B.D.Haines&S.J.Higgins,eds.,1984);和METHODSINENZYMOLOGY(AcademicPress,Inc.)。在下面的实施例中,应理解的是,尽管已努力确保实验参数(如量、温度等)的准确性,但是在重复下述实验时,应考虑到存在一些实验误差和偏差。除非有相反指明,温度数值表示为摄氏度,压力数值表示为大气压或接近大气压。另外,除非有相反指明,所有试剂均为商购,所有溶剂均为HPLC级,并且所有反应均在惰性氩气中进行。随后的实施例中所使用的寡核苷酸通过标准亚磷酰胺化学法合成。下列实施例中的解链温度是使用UV分光光度计中的恒温室确定的。对温度和吸光度进行作图,可观察到具有两个平台的S形曲线。平台中间的吸光度读数对应Tm。实施例1产生具有六碱基密码子和少于3体相互作用的正交通用序列下面的方法用来产生具有六碱基密码子、包括所有互补序列在内的正交序列之间具有少于3体相互作用的八个正交序列。由在笫四位具有iso-G和iso-C的128种四聚体的库产生一百个随机20-体System8序列。在这一百个序列中,基于65%至70%G/C含量(包括iso-G和iso-C)选出36个序列。通过除去具有偏好碱基(biasedbase)组合物(某些碱基4交多、另一些碱基较少的组合物)的序列,这36个序列被进一步减少到16个序列。然后将另一些异碱基(isobase)(具体序列中试图平衡两个碱基的iso-G或iso-C)添加至所述16个序列的每个序列的5,端("正交序列,,)。使用bDNAP程序的单探针比较(SingleProbeComparison)功能来就交叉杂交进行筛选前,将这十六个正交序列转变成为其天然形式(iso-G转化为G,iso-C转化为C)。参见S.Bushnelletal.,BIOINFORMATICS15(5):348-355(1999)。在这个程序中,G/C和A/T的加权因子设定为一,以指示X体相互作用的总数。通过比较下列序列,可人工计算出这16个正交序列的X体相互作用数(a)具有八个System8序列及其互补序列的16个正交序列;(b)16个正交序列自身以及(c)具有这16个正交序列的互补序列的16个正交序列。由于3体和4体短串联重复(tamdem)中大量的相互作用,选择5体相互作用来对这些序列进4亍人工才企查。对在16个正交序列和八个System8序列之间的总共六十八种5体相互作用进行人工比对。由于不能消除的强的相互作用,这16个正交序列中有四个从其中除去。通过分别用iso-G和iso-C交换G和C,对剩下的正交序列中的八个序列的原型进行了^f'爹饰,目的在于将(a)、(b)和(c)的相互作用减少至最多3体,而不形成超过五个天然石威基的一段序列。由于对天然Watson-Crick石威基配对的相互作用进行了预测,因此将异碱基重新放回序列计算得到的X体相互作用是没有意义的。随后几轮比对、消除和修饰对上述(b)和(c)相互作用进行了重复。用来获得不超过3体相互作用的其它序列修饰包括如下修饰(i)通过将一些G/C转化为iso-G和iso-C来提高异碱基含量以及(ii)通过使末端异碱基之一缺失将大小减少至20体。总共进行了五个重复,得到其间最多3体相互作用并且具有包含所有组分的System8序列的八个新的通用正交序列。实施例2最佳正交通用序列的产生由含有六碱基密码子的20体序列设计得到多个最佳CP,所述六碱基密码子由四个天然碱基和两个非天然碱基iso-G和iso-C组成。图1A示出本发明的起始20体序列的普通结构,该序列由被一个iso-G或iso-C碱基分隔的、以非特定顺序排列的四个天然碱基组成。为由起始20体序列产生探针,通过在实施例1所阐述的方法对起始序列进行筛选,目的在于产生具有约50%G/C组成且解链温度接近80°C的33个CP和33个CE。使用所得到的序列来设计六重细胞因子分析面板(panel)。由于探针显示出在细胞因子分析中有一些交叉反应性,因此通过将探针的解链温度限定到约85。C,可就最小的交叉反应性对探针进行进一步优化。筛选和测试得到的最佳组的探针由图IB的公式描述并在表1中示出。表1的序列加入十一重细胞因子bDNA分析面板时,该序列展现出高度正交的表现,即交叉反应性极少甚至没有。下列缩写用于随后的表中F=iso-C,J=iso陽G,Lgth=寡核苷酸的长度Tm=解链温度,为50%的寡核香酸探针与其互补序列退火的温度(°C);Td=解离温度,为50%的寡核苷酸探针与其膜结合互补序列退火的温度(°C),以及Bck-背景。表1<table>tableseeoriginaldocumentpage27</column></row><table>表1正交通用序列<table>tableseeoriginaldocumentpage28</column></row><table>表1<table>tableseeoriginaldocumentpage29</column></row><table><table>tableseeoriginaldocumentpage30</column></row><table>实施例3多重细胞因子mRNA分析的特异性将表1的通用正交序列CP1-CP9和CE1-CE9(SEQIDNO.1-22)用于多重细胞因子mRNA定量分析,其中采用了bDNA设计原理和用于读数的Luminex⑧悬浮阵列技术。表2示出了使用CPl-CP9和CE1-CE9针对九种细胞因子对约60,000,000个分子的靶标进行多重mRNA分一斤的性能。在该实验中,针对每种细胞因子进行完整的bDNA分析。如表2所示,在所预期的小球上观察到非常强的RFU信号,并且与分析小球的背景信号相比,所选择通用序列的交叉杂交可忽略不计。图2以三维柱状图示出了该分析的结果。表2<table>tableseeoriginaldocumentpage32</column></row><table>实施例4通用正交序列与ZipCode序列的交叉杂交将表1的前十一个正交通用序列即CP1-CP11和CE1-CE11(SEQIDNO.l-22)与由Iannone等人(同上)描述的ZipCode序列相比较;ZipCode序列为一组完全基于天然碱基的通用序列。设计该实验是为了确定含有非天然iso-C和iso-G碱基的通用正交序列在功能上是否明显胜于含有全部天然碱基的序列。在该对比分析中使用的ZipCode序列在表3中列出。表3<table>tableseeoriginaldocumentpage34</column></row><table>为检测含有iso-G和iso-C残基的通用序列相对于完全基于天然碱基的序列的优越性,用表3的十对ZipCode序列和从表1随机选出的正交通用序列来构建用于杂交的两个10xIO矩P车。用结合Luminex⑧小球的捕获探针和生物素化互补捕获辅助探针(captureextenderprobe)进行由两部分组成(two-piece)的杂交分4斤。反应4吏用约1000个Luminex⑧小球每种捕获序列类型,这相当于约1-2fentomole的DNA结合能力。杂交步骤之后用链霉亲和素藻红蛋白缀合物进行标记;通过这种方式观察到正交对(orthogonalpairs)之间仅有非特异性相互作用。如图3A和图3B所示,在ZipCode非互补序列之间观察到显著量的交叉相互作用,而本发明的正3A示出在0.1pmol靶标时的实验结果,图3B示出在1pmol靶标时的实验结果。靶标的量是溶液中游离探针的量,0.1pmol和1.0pmol表示相对于以共价方式固定在小球的捕获探针的量而言大大地摩尔过量。权利要求1.高度正交的六碱基通用序列,其包含四个天然碱基和两个非天然碱基,其中以非特定顺序排列的一至四个所述天然碱基选自鸟苷(G)、胞嘧啶(C)、腺苷(A)和胸苷(T)或尿嘧啶(U),并由所述一个或两个非天然碱基所分隔,由此使得约50%的所述序列含有G/C碱基,并使得所述序列的解链温度(Tm)约为80-85℃。2.权利要求1的高度正交的通用序列,其中所述两个非天然碱基为异鸟嘌呤或异力包嘧啶。3.权利要求1的高度正交的通用序列,其中所述序列的Tm约为85°C。4.权利要求1的高度正交的通用序列,其中所述序列长度为20-25个碱基。5.权利要求1的高度正交的通用序列,用作通用捕获探针,以将靶扩增产物固定至基底。6.权利要求5的高度正交的通用序列,其中所述靶扩增产物是由多聚酶链反应产生的扩增子。7.权利要求6的高度正交的通用序列,其中所述基底为经与所述捕获探针互补的序列衍生化的固相结合表面。8.使用权利要求1的高度正交的通用序列进行的bDNA分析。9.权利要求8的bDNA分析,用于检测DNA病毒。10.权利要求9的bDNA分析,其中所述DNA病毒选自牛或人乳头瘤病毒、多瘤病毒、腺病毒、疱渗病毒和肝炎病毒构成的组。11.权利要求10的bDNA分析,其中所述多瘤病毒选自猿猴病毒40和人多瘤病毒构成的组。12.权利要求10的bDNA分析,其中所述疱瘆病毒选自爱泼斯坦-巴尔病毒、人巨细胞病毒和单纯疱渗病毒构成的组。13.权利要求10的bDNA分析,其中所述肝炎病毒选自曱型肝炎、乙型肝炎、丙型肝炎和丁型肝炎构成的组。14.权利要求8的bDNA分析,用于检测反转录病毒。15.权利要求14的bDNA分析,其中所述反转录病毒选自肿瘤病毒和'f"曼病毒构成的组。16.权利要求15的bDNA分析,其中所述肿瘤病毒选自鼠白血病病毒、牛白血病病毒和人T-细月包亲'淋巴病毒构成的组。17.权利要求14的bDNA分析,其中所述慢病毒为人类免疫缺陷病毒(HIV)。18.权利要求17的bDNA分析,用于检测不到50个分子/mL的HIV。19.权利要求8的bDNA分析,用于在单重分析中对样本中的单核苷酸多态性进行基因分型。20.权利要求8的bDNA分析,用于在多重分析中对样本中的多种单核苷酸多态性进行基因分型。21.权利要求8的bDNA分析,用于在单重分析中对样本中的mRNA进行定量。22.权利要求8的bDNA分析,用于以多重形式对样本中的mRNA进行定量。23.权利要求21的bDNA分析,其中所述单重分析用于对样本的一种细胞因子mRNA进行定量。24.权利要求22的bDNA分析,其中所述多重分析用于对样本的多种细胞因子mRNA进行定量。25.权利要求8的bDNA分析,用于在单重分析中测量样本中单个基因的拷贝的扩增情况。26.权利要求8的bDNA分析,用于在单重分析中测量样本中单个基因的拷贝的缺失情况。27.权利要求8的bDNA分析,用于在多重分析中测量样本中多个基因的拷贝的扩增情况。28.权利要求8的bDNA分析,用于在多重分析中测量样本中多个基因的拷贝的缺失情况。29.—种制备用于杂交的高度正交的通用序列的方法,包括如下步骤(a)从六个核苷酸碱基制备5,至3'序列,所述六个核苦酸碱基包含两个非天然碱基和选自鸟苷(G)、胞嘧啶(C)、腺苷(A)和胸苷(T)或尿嘧啶(U)的四个天然碱基,其中所述序列含有以非特定顺序排列的一至四个所述天然碱基,并由一个或两个所述非天然碱基所分隔;(b)筛选所述序列,仅选择G/C浓度为50%或50%以上的那些序列;(c)测试所述序列的解链温度(Tm),仅选择Tm约为80-85°C的那些序列;(d)分别用相同序列和互补序列交叉杂交所述序列;(e)仅选择与所述相同序列最多3体相互作用的那些序列。30.权利要求29的方法,其中所述非天然碱基选自异鸟嘌呤核苷和异胞嘧啶。31.权利要求29的方法,其中所述序列的Tm约为85°C。32.权利要求29的方法,其中所述序列长度为20-25个碱基。全文摘要本发明提供了用于bDNA单重和多重核酸杂交分析的一组高度正交的六密码子通用序列。所述六密码子通用序列不会交叉杂交,因此可将第二代和第三代bDNA分析中所固有的3体交叉杂交最小化或将其消除。该高度正交的通用序列可用于单重或多重bDNA分析,以定性和定量地测定样本中的mRNA水平;筛选少量存在于样本中的靶标例如病毒,并对其进行基因分型;筛选SNP并对其进行基因分型;以及,测量例如在基因扩增或缺失时样本中基因的量的改变。该高度正交的通用序列还可用作通用捕获探针,通过有助于对其进行进一步分析的方式选择性结合分析组分。文档编号C12Q1/68GK101111607SQ200680003780公开日2008年1月23日申请日期2006年1月31日优先权日2005年2月1日发明者B·沃纳,C·-A·常,D·阿尔,M·吴,M·郑申请人:西门子医疗诊断解决方案公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1