鉴别和分析中度串联重复dna标记的物质和方法

文档序号:575160阅读:730来源:国知局
专利名称:鉴别和分析中度串联重复dna标记的物质和方法
技术领域
本发明一般涉及在基因组系统中鉴别和分析遗传标记。本发明特别涉及在DNA 中,尤其是在基因组DNA中鉴别这样的基因座,其含有由于中度(5 7个碱基)序列重复 数目变异而形成的长度多态性。本发明还涉及检测此多态基因座。本发明还涉及鉴别和区 分个体的方法,其主要基于在该基因座扩增基因组DNA的产物的大小不同,其中中度串联 重复序列数随个体不同而变化。
背景技术
DNA分型通常用于亲子鉴定,并用于确定马、狗及其它比赛动物的谱系。DNA分型 还通常用于鉴别血液、唾液、精液及其它在犯罪场所发现的其它组织。目前所用的DNA分型 法被设计为检测和分析已知在群体中以至少两种不同形式显现的DNA的一或多个区域的 长度和/或序列中的差异。DNA分型还用于临床测定骨髓移植的成功或失败及特殊癌组织 的存在与否。此变异长度和/或序列变异称为“多态性”。其中发生这种变异的DNA的任何 区域(即“基因座”)称为“多态基因座”。大多数DNA分型技术使用至少一个含至少一个 该多态基因座的“标记”。每个个体标记含有最终衍生自群体中单一个体基因组DNA的单一 等位基因。本发明的方法和物质均设计为用于检测以长度变异为主要特征的DNA多态性的 特定类别。就长度或序列而言充分多态的遗传标记,很久以来被试图用于鉴定应用中,如亲 权认定及鉴别收集的用于法医分析的组织样品。这种标记及分析该标记的方法的揭示与 开发,在以往许多年已进行了几个阶段的开发。近年来,作为遗传标记的多态短串联重复 (STRs)的揭示和开发已激发连锁图谱开发,致病基因的鉴别与鉴定及DNA分型的简化性和 精确性的进程。术语“短串联重复”或“STR”指2 7个核苷酸长,在任何生物体的基因组 DNA串联中完全或近乎完全串联重复的所有序列。例如见美国专利号5,364,759第4栏第 58行中人基因组DNA的“短串联重复”的定义。第一个鉴别的DNA变体标记是简单碱基取代,即简单序列多态性,其通常由 Southern杂交分析检测。设计用于用放射活性探针分析限制性内切酶消化的DNA的这种 标记的鉴别论述,参见 Southern,Ε. Μ. (1975),J. Mol. Biol. 98 (3) :503_507 ;Schumm, et al (1988), American Journal of Human Geneties 42 :143-159 ;及 Wyman, A. andWhite, R. (1980) Proc. Natl. Acad. Sci. U. S. A. 77 :6754_6758。
第二代标记是大小变体,即长度多态性,尤其“串联重复可变数”(VNTR)标记 (Nakamura Y. et al. (1987) · Science 235 1616-1622 ;及美国专利 4,963,663,授予 White 等(1990);美国专利5,411,859,4,963,663的继续,授予White等(1995))和“小卫星”标 记(Jeffreys et al. (1985a),Nature 314 67-73 Jeffreys et al, (1985b)Nature 316 76-79 ;美国专利5,175,082,发明人?时打巧8)。VNTR和小卫星标记均含有以串联方式重 复的几个相同序列的区域。核心重复序列长度为10-70个碱基,较短的核心重复序列称为 “小卫星”重复,较长重复称为VNTRs。人群中不同个体含有不同数量的这些重复。这些标 记比碱基取代多态性具有更高的多态性,有时在单一遗传基因座上呈现接近40或更多个 等位基因。但是,仍需要限制酶消化及随后的Southern杂交分析等繁琐方法检测及分析大 多数这种标记。
接下来的进展包括聚合酶链反应(PCR)(美国专利4,683,203,Mullis, K. B.) 技术与分析 VNTR 基因座(Kasai,K. et al. (1990) JournalForensic Science 35(5) 1196-1200)的联合。可扩增的VNTR基因座被发现,其可不需Southern转移而被检测。扩 增产物通过琼脂糖或聚丙烯酰胺凝胶分离,并通过在扩增期间掺入放射活性或通过用银或 溴化乙锭后染色而检测。但PCR只能用于可靠扩增相对小的DNA区段,即仅可靠扩增长度在 3000 个碱基之下的 DNA 区段。(Ponce,Μ. & Micol,L. (1992)NAR 20(3) 623 ;Decorte R., et al. (1990) DNA Cell Biol,9(6) :461_469)。结果,仅开发了非常少的可扩增 VNTRs,使 它们作为不能进行连锁作图的一类。对具有多态二核苷酸重复(Litt和 Luty (1989) Am J. Hum Genet3 (4) :599 605 ; Tautz, D. (1989)NAR 17 :6463_6471 ;Weber 和 May(1989)Am J Hum Genet 44 :388_396 ;德 国专利DE 38 34 636C2,发明人Tautz, D ;美国专利5,582,979,Weber, L.)及多态短串联 重复(STR) (Edwards, A.等,(1"1) Am. J. Hum. Genet,49 746-756 ;Hammond,H. A,等,(1"4) Am. J. Hum. Genet. 55 175-189 ;Fregeau C. J.禾口 Fourney, R. M. (1993) BioTechniques 15(1) 100-119 ;Schumm, J. W.等,(1994),第四届人类鉴定国际研讨会,1993,PP. 177-178 ; 美国专利5,364,759,Caskey等;德国专利DE 3834636C2,Tautz, D.)的多态标记的新近开 发,已克服了许多以前方法的缺陷。含有二核苷酸或STR重复(意为包括2-7bp重复)的 二类标记通常被称为“微卫星”标记。微卫星基因座通常被认为是最适用标记,其与可扩增 VNTRs相似之处在于其等位基因可以基于长度变化而区分。但是,与VNTRs不同,这些基因 座含有2,3,4或少见的5个碱基长的完全或不完全重复序列。它们展示出在单个基因座上 从仅几个等位基因至超过40个等位基因。扩增方案可以设计为产生通常60 400碱基对 长的小产物,且每个基因座的等位基因通常包含在少于50bp范围内。通过精心设计PCR引 物,使得来自一个个体系统的所有潜在扩增产物不重迭同一凝胶中其它系统的等位基因范 围,可在相同凝胶上同时电泳分析几个系统。有三种明显缺点与微卫星基因座的使用相关。首先,伪带(stutter)假象的存 在,即通常在扩增后可见除代表每个等位基因的主要片段之外的一或多个次要片段。此 缺陷在二核苷酸重复基因座比三或四核苷酸重复标记基因座更明显(Edwards等,1991, Am. J. Hum. Genet. 49 :746_756 ;Edwards 等,1992. Genomics 12 :241_253 ;Weber & May, 1989. Am. J. Hum. Genet. 44 =388-396)。这些假象的存在,推测得自称为重复滑动的DNA聚合 酶相关的现象(Levinson & Gutman, 1987, Mol. Biol. Evol. 4(3) :203_221 ;Schlotterer &Tautz, 1992. NAR20 :211_215),使解释基因座的等位基因含量变得复杂。在所有解释复杂化的同时,代表每个等位基因的主要和次要片段的存在尤其限制这些标记在法医分析中的效 力,法医分析通常要求测定是否存在一个以上DNA样品来源。在本研究中阐述的许多标记 代表一类新的与已知标记相比产生明显少的伪带假象的标记。当前的STR和微卫星标记系统的第二个缺点涉及在单一凝胶中分离多个基因座 的难度。此发生是由于在由本领域技术人员最常用于分离DNA片段的凝胶上部区域中,存 在不同大小片段的空间堆积。本研究中所述的基于较长重复单位的标记的开发,扩展了这 些凝胶的有用范围,使更多基因座可同时被分析。第三个缺点是在本发明之前,只有少数人类基因组DNA的DNA基因座已在文献 中阐述,每个这种基因座具有基于5 7个碱基重复变化的长度多态性。如见于Edward 等,(1991)核酸研究 19 4791 ;Chen 等(1993)基因组 15 (3) :621_5 ;Harada 等(1994) Am. J. Hum. Genet. 55 175-189 ;Comings 等(1995),Genomics 29(2) 390-6 ;及 UtahMarker Development Group (1995),Am. J. Genet. 57 :619_628。在 1995 年,Jurka 禾口 Pethiyagoda 发表的文章阐述了一项研究,其中他们用GenBank数据库测定在灵长类基因组中五聚和六 聚串联重复的相对丰度及可变性(Jurka 和 Pethiyagoda (1995) J. Mol. Evol. 40 120-126)。 但是,可变性只是间接估计的,且个体基因座多态水平未证实。我们已开发了鉴别和分析含 5 7个碱基重复的高多态重复的DNA基因座的物质和方法。本发明的物质和方法被设计为用于鉴别和分析各类DNA的特定多态基因座,包括 各种不同来源的单链和双链DNA。本发明阐述了对现有技术的明显改进,使用于连锁分析, 犯罪审判,亲权认定及其它法医和医学用途方面的DNA分布分析的能力及精确性增加。发明概述因此,本发明一个目的在于提供鉴别和分析具有中度串联重复序列的DNA基因座 的物质和方法,其中“中度串联重复序列”是DNA的一区域,其含有至少一个由串联重复至 少2次的5,6或7个碱基的序列组成的重复单位。本发明另一个目的在于提供鉴别中度串联重复DNA标记的物质和方法,当其用于 分析或检测含中度串联重复的DNA样品的-或多个基因座时,很少产生假象。本发明的方 法和物质优选用于鉴别和分析基因组DNA的基因座,每个基因座均含有多态中度串联重复 序列。本发明的物质包括针对人基因组DNA的这种基因座的寡核苷酸引物和DNA标记。用 本发明的方法检测的中度串联重复基因座,比用相似方法检测的许多已知基因座,包括短 STR (即2,3或4个碱基DNA序列的串联重复),呈现较少的假象。本发明一特别目的是提供一种分析个体多态遗传基因座的方法和物质,其主要基 于主要由于中度核苷酸串联重复的区域中,核酸重复单位数目的不同而引起的长度变化。 本发明另一目的在于提供一种检测和分析基因组DNA的多态性基因座的方法,试剂盒及引 物,该基因座含有中度串联重复多态性,包括五核苷酸串联重复多态性。本发明的一实施方案是分离含有来自基因组DNA的中度串联重复序列的DNA片段 的方法,包括(a)提供多个DNA片段,其中至少一个片段含有一中度串联重复序列(b)提 供一支持工具(means),如结合至少一个寡核苷酸的固定支持工具,该寡核苷酸含有互补 于中度串联重复序列的一部分的核苷酸序列;(c)在一定条件下组合该多个DNA片段和支 持工具,其中含中度重复序列的DNA片段和至少一个其它DNA片段与支持工具杂交。
本发明另一实施方案是一种检测基因组DNA中具有低伪带假象的多态中度串联 重复序列的方法,包括(a)提供一 DNA样品,其具有至少一个靶中度串联重复序列,(b)检 测DNA样品中靶中度串联重复序列,其中观测到不超过1. 的平均伪带假象。 检测具有低平均伪带假象百分率的靶中度串联重复DNA序列的方法,包括以下步 骤(a)提供具有至少一个靶中度串联重复序列的DNA样品,其中靶中度串联重复序列是含 有至少一个重复单位的DNA区域,该重复单位由至少串联重复2次的5、6或7碱基对的序 列组成;(b)将所述样品与一个寡核苷酸引物对接触,该引物对包含与所述含中度串联重 复序列的DNA区域的侧翼序列互补的序列,所述样品与所述寡核苷酸引物对在使得所述含 中度串联重复序列的DNA区域被扩增的条件下接触;以及(c)检测DNA样品中靶中度串联 重复序列,其中观测到平均伪带假象百分率不超过2. 4%。本发明另一实施方案是用至少一个寡核苷酸引物扩增DNA样品中感兴趣的中度 串联重复序列(后文中称为“靶”中度串联重复序列),以检测DNA样品中靶中度串联重复序 列的方法,其中寡核苷酸引物含有互补于并位于一 DNA标记的一个区域侧翼的序列,该DNA 标记在其序列中含有一中度串联重复序列(后文称为“模板中度串联重复序列”),其中,此 DNA标记具有选自SEQ ID NOS :1_43的序列。本发明的另一实施方案是一检测DNA样品中至少一个靶中度串联重复序列的试 剂盒,该试剂盒包括一容器,其具有至少一个寡核苷酸引物,用于扩增至少一个靶中度串联 重复序列,其中此寡核苷酸引物的核苷酸序列互补于并位于双链DNA标记一个区域的一部 分的侧翼,该双链DNA标记含有模板中度串联重复序列,其中该DNA标记具有选自SEQ ID NOS 1-43的序列。本发明的另一实施方案是一寡核苷酸引物,其包含互补于双链DNA标记的一条链 的位于模板中度串联重复序列侧翼的区域的序列,其中该DNA标记具有选自SEQ ID NOS 1-6 和 SEQ ID NOS :28_33 的序列。本发明的各个实施方案在人及其它生物体鉴别,法医分析,亲权认定,监测骨髓移 植,连锁作图及检测遗传病及癌症等领域均有特殊用处。准确辨别不同个体少量组织在法 医应用中是特别急需的,其中许多定罪(及宣判无罪)要依于DNA分型分析,包括STR基因 座的分析。本发明的其它目的,特点及优势通过以下实施本发明的最佳模式及附图将显而易 见。附图简要描述

图1是通过滤膜杂交富集中度串联重复方法的流程图。图2是S159五核苷酸重复的电泳图。图3是vWA四核苷酸重复的电泳图。图4是G210五核苷酸重复的电泳图。图5是D5S818四核苷酸重复的电泳图。图6是S159五核苷酸重复伪带百分率的散射图,横坐标为S159五核苷酸重复等 位基因(大小为bp)。图7是G210五核苷酸重复伪带百分率的散射图,横坐标为G210五核苷酸重复等 位基因(大小为bp)。
图8是D5S818四核苷酸重复伪带百分率的散射图,横坐标为D5S818四核苷酸重 复等位基因(大小为bp)。图9是vWA四核苷酸重复伪带百分率的散射图,横坐标为vWA四核苷酸重复等位 基因(大小为bp)。图10是在经凝胶电泳分离后,S159五核苷酸重复的荧光标记的扩增片段的荧光 成象扫描结果的激光打印图。图11是在经凝胶电泳分离后,G210五核苷酸重复的荧光标记的扩增片段的荧光 成象扫描结果的激光打印图。附图不是必需成比例的,且本发明的某些特征可按比例放大或为清楚及简洁目的 而以示意形式示出。发明详述本领域技术人员知晓在不偏离本文揭示的本发明范围及精神之下,对本发明可作 各种替代及修改。A.定义本文所用术语“中度串联重复”或“ITR”指含有串联至少两次的5 7个碱基序 列的DNA序列的一区域。术语ITR也包括这样的DNA区域,其中多于一个单一 5 7碱基 序列是串联重复的,或具有间插碱基,条件是至少一个该序列至少串联重复2次。在ITR内 至少重复一次的每个序列本文称为“重复单位”。“ITR多态性”指基因组DNA中的一个ITR,其主要由于每个染色体相同区域中重复 单位数的不同而使个体群中的染色体长度变化。根据本发明鉴别和分析的中度串联重复序列可被分为二类完全的和不完全的。 本文所用术语“完全的” ITR指含有至少串联重复二次的单一 5 7个碱基重复单位的双 链DNA区域,如(AAAAT)12。术语“不完全的” ITR指含有至少二个串联完全重复单位个至 少一个不完全重复单位的DNA区域,其中不完全重复单位由得自完全重复单位的序列中插 入,缺失或取代1,2或3个碱基的DNA序列组成,如(AAAAT) 12 (AAAAT) 5AAT (AAATT) 4。每个 不完全ITR序列含有至少一个完全ITR序列。特别地,每个ITR序列,不管是完全的还是不 完全的,均包括至少一个至少串联出现2次的重复单位序列,该重复单位序列可以公式(I) 代表(AwGxTyCz)n (I)其中A,G,T代表可以是任何顺序的核苷酸;w,x,y和z代表序列中每个核苷酸的 数目,并在0 7范围内,w+x+y+z的范围在5 7之间;n代表序列串联重复的次数,且至 少为2。“五核苷酸串联重复”指以上所定义的“中度串联重复”多态性的一亚类。除非特 殊提及,术语“五核苷酸串联重复”包括完全ITRs,其中重复单位是5个碱基的序列,及不完 全ITRs,其中至少一个重复单位是5个碱基重复。"DNA标记”指含有一 ITR序列的DNA片段,如含由扩增基因组DNA —区域产生的 ITR序列的DNA片段。每个标记含有一最终衍生自一群体中的一个单独个体基因组DNA的
一个单等位基因。术语“基因座“指DNA的特殊区域。当用于阐述基因组DNA的区域时,“基因座”指染色体上的特定位置。就群体中的任何个体而言,相同基因组基因座在每对同源染色体上 相同位点出现。每个这种染色体上相同基因座的DNA序列,或在源自相同的这种染色体的 DNA的相同基因座的DNA序列,称为“等位基因”。术语“多态性”指相同物种个体生物体组成的群体的基因组DNA中发现的在至少2 个染色体上见到的基因座的等位基因的变化。术语“多态性”包括得自克隆入其它载体如 DNA载体的染色体片段或另一种生物体的染色体DNA的相同基因座的DNA序列的变化。本文所用术语“ ITR侧翼序列”指相邻于含ITR的DNA序列一条链上的ITR的核苷 酸序列。包括ITR侧翼序列作为其全部序列一部分的序列本身是侧翼序列。术语“寡核苷酸引物”是一种分子,其含有3个以上脱氧核糖核苷酸或核糖核苷 酸。尽管每个引物序列不需反映模板的精确序列,序列反映与模板的互补性越接近,则与模 板结合越好。其精确长度和序列将依于许多因素,涉及寡核苷酸引物的最终功能及使用,包 括温度,引物序列,及使用方法。本发明的每个寡核苷酸引物包含一互补于位于ITR序列侧 翼的DNA标记序列的核酸序列。本发明的寡核苷酸引物当置于一定条件下时,能作为合成 起始点,该条件是诱导互补于一核酸链的引物延伸产物的合成的条件。该条件可包括存在 核苷酸和诱导剂如DNA聚合酶,合适温度及pH。在优选实施方案中,该引物是足够长的单链 寡脱氧核糖核苷酸,以在存在诱导剂下引导从特定序列合成延伸产物。寡核苷酸引物的敏 感性及特异性通过引物长度及所供DNA模板样品中序列的独特性确定。在本发明中,寡核 苷酸引物通常大约15个碱基以上,且优选大约20 40个碱基长。术语“寡核苷酸引物对”指一对引物,每个引物均含互补于位于相同ITR侧翼的双 链DNA相反链的脱氧核糖核苷酸或核糖核苷酸的序列。本发明的每对寡核苷酸引物优选地 选择用以检测单一 ITR。尽管每对引物序列不需反映模板的精确序列,序列反映与模板的互 补性越接近,与模板结合越好。术语“延伸产物”指从寡核苷酸引物3’末端合成的核苷酸序列,其互补于寡核苷 酸与之结合的链。术语“寡核苷酸探针”指单链DNA或RNA分子,其包括互补于靶序列的一部分的序 列,靶序列例如DNA样品的中度串联重复序列,其中互补性部分的长度足以使探针与靶序 列杂交。术语“伪带假象”指当检测靶DNA的一或多个分子时,观测到的特定类型的假象, 其中靶DNA含有相同重复单位序列的串联重复,包括根据本发明检测和分析的靶中度串联 重复序列。在通过长度如用凝胶电泳分离样品中所有DNA之后,检测到含任何该靶DNA样 品时,每个靶DNA分子产生一主要信号(如在凝胶上的主要条带);但在接近每个主要信号 处可检测到次要信号。次要信号通常产生自DNA片段的检测,其由于靶DNA序列的一或多 个重复单位的加入或缺失,而在长度上与靶DNA不同。伪带假象已归因于在DNA的体内和 体外复制期间滑动链的错配。如参见Levinson和Gutman(1987),Mol. Biol. Evol. ,4(3) 203-221 ;及 Schlotterer 和 Tautz (1992),NucleicAcids Research 20(2) :211_215。当含 有任何这种重复序列的DNA用如PCR扩增法体外扩增时,此假象尤为明显,这是由于样品存 在的或聚合期间产生的任何次要片段随主要片段一起扩增。术语“伪带假象百分率(% stutter artifact) ”指在得自单一来源如单菌落细菌 或基因组DNA的单一染色体的DNA样品中,观测的次要(即假象)信号幅度与主要(即靶)信号幅度的对比。伪带假象百分率可在未扩增的DNA上测定,但优选在至少一个靶中度串 联重复序列扩增后测定。术语“平均伪带假象百分率(averaged stutterartifact) ”指在 对一个群体至少20个等位基因的代表样品检测测定的伪带假象百分率平均而得。术语“基因组DNA”指最终衍生自基因组DNA的任何DNA。该术语例如包括异源生 物体中的克隆的DNA,整个基因组DNA,及部分基因组DNA (如单一分离的染色体的DNA)。根据本发明检测或分离的DNA可以是单链或双链的。例如适用于本发明的单链 DNA可得自噬菌体、细菌或基因组DNA的片段。适用于本发明的双链DNA可得自一些含有具 有中度串联重复序列的DNA的各种不同来源中的任一种,包括噬菌体文库,粘粒文库,和细 菌基因组DNA或质粒DNA,及分离自任何真核生物的DNA,包括人基因组DNA。DNA优选得自 人基因组DNA。可以使用任一不同来源的人基因组DNA,包括医学或法医样品如血液,精液, 阴道拭物,组织,头发,唾液,尿液及体液混合物。该样品可以是新鲜的,陈旧的,干燥的和/ 或部分降解的。此样品可收集自犯罪现场。B.分离含ITR的多态DNA标记的方法本发明的一实施方案是用杂交选择分离含ITR的DNA片段的方法。该方法包括以 下步骤(a)提供多个DNA片段,其中至少一个DNA片段含有ITR ; (b)提供结合有至少一 个寡核苷酸的支持工具,其中此寡核苷酸包括互补于中度串联重复序列一部分的核苷酸序 列;(c)将所述的多个DNA片段与支持工具在一定条件下组合,其中包括任何含ITR序列的 DNA片段的DNA片段与支持工具杂交。此方法(a)步提供的多个DNA片段可通过任何含ITR的DNA样品片段化而得,但 优选通过基因组DNA片段化而得,如见并入参考的《人类遗传学当前方案》(1994),第2章 从基因组DNA构建小插入片段文库,p. 2. 2. 1。制备(a)步所用的多个DNA片段的最优选方 法可根据以下步骤进行片段化DNA样品,从而产生DNA片段群,其中至少一个DNA片段含 有ITR ;将含有引导序列的接头与DNA片段群中每个DNA片段的至少一个末端连接;用含互 补于引导序列的序列的寡核苷酸引物扩增每个接头连接的片段。不同的接头可连于每个片 段的每个末端。但是,优选将单一接头连于每个末端,以使能用具有互补于接头引导序列的 序列的单一寡核苷酸引物扩增。接头连接优选在有连接酶的情况下进行,如T4DNA连接酶。可用任一工具产生本发明方法(a)步中提供的多个DNA片段,包括用超声处理或 用至少一种限制酶片段化,当然只有双链DNA可用限制酶片段化。当限制酶用于片段化双 链DNA样品时,其优选是具有4碱基对识别序列的限制酶,其留下单链的突出端,并且不切 割DNA样品内感兴趣的ITR区。用于片段化双链DNA样品的优选限制酶包括Mbol,Acil, Bfal, DpnII, Hhal, Hin PII, Hpall, Msel, Nla III,Sau 3AI,TaqI,Csp6I,和 Tail。如上述产生的接头连接的DNA片段随后用扩增反应扩增,如PCR(美国专利 4,683,202,Mullis, K. B.),基于核酸序列的扩增(NASBA) (Kievits 等(1991) J. Virol Merthods 35(3) :273_286),连接介导的扩增(Volloch 等(1994),Nucleic Acids Res 22(13) :2507-2511),链置换扩增(SDA) (Walker 等(1992)PNAC 89(1) :392_396),序列不依 赖的单引物扩增(SISPA) (Reyes (1991)Mo 1 CellProbes 5(6) :473_481)或连接酶链反应 (美国专利5,686,272,授予Narshall等)。在方法(b)步中提供的支持工具包括具有至少一个与其相结合的靶寡核苷酸的 固定支持物。此固定支持物优选包括一能与寡核苷酸直接或间接偶联的物质,能与寡核苷酸直接偶联的合适物质包括硝基纤维素,尼龙,玻璃,二氧化硅,及乳胶。用于本方法这一优 选实施方案的合适的固定支持物例如包括尼龙膜,用二氧化硅颗粒包埋的滤膜,玻璃珠,二 氧化硅磁性颗粒,或含二氧化硅的树脂。通过与寡核苷酸结合的第一个偶联剂和与固定支 持物表面结合的第二个偶联剂而能与寡核苷酸间接偶联的合适物质包括亲和素和链亲和 素,或抗原及其抗体。与固定支持物相结合的所述至少一个靶寡核苷酸包括互补于DNA片段中度串联 重复序列一部分的核苷酸序列。术语“部分”指足够长的DNA片段的ITR区域中的核苷酸 序列,当具有互补于该序列的序列的寡核苷酸与其接触时,发生杂交。“部分”优选至少20 个碱基,更优选至少40个碱基长。靶寡核苷酸更优选具有(AwGxTyCz)n公式特征的序列,其 中A,G,T和C代表可以是任何顺序的核苷酸;w,x, y,z代表序列中每个核苷酸数目,范围 在0 7,且w+x+y+z在5 7范围内;n代表序列串联重复的次数,且至少大约4次,更优 选至少大约8次,最优选至少大约15次。在本方法(c)步中,所述的多个DNA片段与支持工具在一定条件下组合,其中含 ITR的DNA片段与支持工具杂交。当该多个片段是多个双链DNA片段时,此DNA在与支持工 具杂交前变性。在与支持工具杂交前使双链DNA片段变性的合适方法包括将DNA暴露于足 够高的使双链DNA变性的温度,或将DNA悬浮于变性溶液中。此DNA优选用含变性剂如碱 (例如NaOH或K0H)的变性溶液变性。当用碱变性DNA片段时,所得混合物的pH优选调正 至大约中性PH,优选通过在混合物中加入pH4. 8的缓冲液而调正。一旦DNA片段已与支持工具杂交,优选洗涤此支持工具以除去未杂交的DNA片段 及任何存在于含有支持工具的溶液中,或在支持工具表面上的未杂交的其它物质。所用任 何洗涤液优选配制成除去如此物质而不释放与支持工具杂交的DNA片段。与支持工具杂交的DNA片段用加热或合适释放溶液,根据支持工具与DNA片段间 结合性质,可从支持工具中释放。例如水或低盐水溶液如TE缓冲液(如10mM Tris-HCl, pH7.5,lmM EDTA)可用于释放与由二氧化硅组成的支持工具杂交的DNA片段。一旦从支持 工具释放,此DNA片段可被处理以从存在于释放的DNA片段的所得混合物中的其它DNA片 段中分离含ITR序列的DNA。附加处理步骤可包括根据上述方法再杂交和筛选,或克隆入 DNA载体及筛选克隆的转化体。图1图示了分离含ITR的DNA片段的方法的优选实施方案,其中制备DNA片段群, 与支持工具杂交,扩增,克隆,并筛选含ITR的转化体。图1中图示的每个步骤均用罗马数 字标记。步骤I示出用限制酶(2)消化的双链DNA(l)的分子,产生不同大小的DNA片段群 (未示出),其中至少一个包括靶ITR。步骤I和II间的箭头图示将接头(3)加入DNA片段 群中以产生在两类不同DNA片段的末端具有接头(3)的接头连接的片段(8),所述的两类 不同DNA片段为具有靶ITR序列的片段(6)和没有靶序列的片段(4)。将具有互补于每个 接头⑶的引导序列的序列的寡核苷酸引物(7)在第III步中加入DNA片段⑶群中,并 通过PCR扩增该DNA片段⑶群,从而产生扩增的DNA片段(9)群。在第IV步中,将扩增 的DNA片段(9)群置入具有杂交溶液(12)和结合有至少一个寡核苷酸的滤膜(10)的容器 (15)中,该寡核苷酸具有互补于靶ITR序列的一部分的序列。杂交溶液促进含ITR序列的 DNA片段与滤膜的杂交。在第V步,将滤膜(10)从容器(15)中除去,并从中释放与其杂交 的DNA片段。在第VI步,再扩增所得富集的释放的片段群,使用第III步中扩增反应中使用的相同寡核苷酸引物。最后在第VII步将富集的扩增的DNA片段群的每个片段克隆入质 粒载体(18)中。第VII步示出用具有靶ITR序列的片段(6)克隆的载体及用没有ITR序 列的片段(4)克隆的载体。C.检测具有低伪带多态ITR的方法当根据本发明方法的这一具体实施方案检测具有靶ITR序列的DNA样品的该序列 时,观测到最小伪带假象。观测的平均伪带假象优选不超过1. 1%,更优选不超过0. 9%。靶 ITR序列可以是完全ITR或不完全ITR序列。检测的DNA样品优选是基因组DNA。优选在DNA样品中ITR序列扩增后观测平均伪带假象。D.引物、探针和标记本发明还包括以下序列表中SEQ ID N0S :1 43所示的DNA标记,引物,其中每个 引物的序列互补于位于由43个序列中的一个序列所示的DNA标记的ITR区侧翼的序列,及 探针,其具有互补于43个标记之一的ITR区内所含序列的序列。实施例中实验鉴别的特别 优选的引物列于下表1。表 1 以下实施例是通过举例说明,而非以任何方法限制本发明。在实施例中,所有百分 比如果针对固体则是重量百分比,如果针对液体则是体积百分比,除非特殊指出,所有温度 是摄氏度。
实施例1 构建全基因组PCR文库实施例1和以下实施例2中所用的特殊扩增及杂交选择技术,是对Armor,J.等, (1994)Hum Mol Genet 3(4) :599_605中所述选择方法的修改形式。人基因组DNA是用标准苯酚氯仿提取程序,从15个个体的集合全血中纯化的 (人类遗传学当前方案(1994),Gilber, J.编辑,附录)。将大约lOOii g基因组DNA用5单位Mbol限制酶/ P gDNA在37°C切割16小时,随后 用苯酚氯仿提取,乙醇沉淀进行纯化,在lOOiUTE缓冲液中(10mM Tris-HCl, ImM EDTA, pH8. 0)再悬浮,终浓度为大约1 P g/ P 1DNA。将在250-600bp 范围的 DNA 片段在 Seakem GTG (FMCBio Products, Rockland, Maine)制备琼脂糖凝胶上(15 X 29cm),通过在100v凝胶电泳1. 25小时而分离,并通过电 洗脱回收(参考),通过在A260测定吸收值对DNA定量,并在无菌超纯(nanopure)水中稀 释至500ng/ u 1并储存在-20°C。通过将等摩尔量的寡A(5’ -GCG GTA CCC GGG AAG CTTGG-3’)和5’磷酸化的 寡 B(5,-GAT CCC AAG CTT CCC GGGTAC CGC-3,)退火至终浓度为 1, OOOpmd/u 1 制备接 头。将IP g大小选择的插入DNA(3. 5pmol,平均大小为425bp)与13 y g (875pmols)的接 头(250 1接头插入物摩尔比率),用1 3单位的T4DNA连接酶在15°C连接16小时。 通过凝胶电泳(1% Seakem GTG琼脂糖,1. 5小时,100v)从原始片段中分离过量的接头和接 头二聚体。通过电洗脱从凝胶中回收接头连接的DNA片段,并在50 yl无菌水中再悬浮。
将具有连接接头的DNA (50ng),在含有10 y 1 10 X STR缓冲液(50mM KC1,100mM Tris-HCl, pH9. 0,15mM MgCl2,l% Trition X-100 和 2mM 每种 dNTP) 1 Taq 聚合酶(5U/ii 1), 和1 ii M寡A引物(10 ii 1 lOpmol/ u 1储存液)的100 u 1反应体积中用PCR进行扩增。在此 反应中用作引物的“寡A”与上述用于装配Mbol接头的“寡A”相同。循环条件是95°C 1分钟, 67°C 1分钟,70°C 2分钟,循环30次。通过用Centricon-100s微滤(向样品中加入2ml无菌水, 并加载Centricon-100s,在2,000RPM旋转2分钟,倒置Centricon滤膜并在2000RPM旋转2分 钟以回收DNA,在100 y 1无菌水中重悬浮)除去dNTPs,弓丨物和引物二聚体。将5 y 1等份的所 得PCR文库在琼脂糖凝胶上检验(1小时,100v),以证实大小在250 600bp范围之间。实施例2 通过杂交选择而富集五核苷酸重复将根据实施例1产生的含有各种不同重复的全基因组PCR文库中的DNA片段,用 不同的与固体支持物相结合的寡核苷酸混合物,通过杂交富集。将含有(AAAAX)nE核苷酸 重复的片段通过杂交选择而富集。此方法通过首先构建用于杂交选择的寡核苷酸而完成, 该寡核苷酸由大约1000bp长的(AAAAC)n,(AAAAG)n* (AAAAT)n串联组组成。将这些寡核 苷酸固定在膜上,并与全基因组PCR文库杂交,以选择那些含有(AAAAX)n重复的片段。如下构建一组寡核苷酸(a)合成5’磷酸化的30mer寡核苷酸(AAAAC)6,(AAAAG)6 和(AAAAT)6 及其互补寡核苷酸(GTTTT)6,(CTTTT)6^P (ATTTT)6,并以 lOOOpmol/iU 浓度 悬浮于超纯水中,(b)将等摩尔浓度(用10iU或lOnmol或198 y g)的具有互补序列的寡 核苷酸组合,加热至65°C,15分钟,并在4°C放置12小时以互相退火,(c)然后将退火的寡 核苷酸用每P gDNA lffeiss单位的T4DNA连接酶在15°C彼此连接过夜,(d)在Seakem GTG琼脂糖上,根据大小选择彡200bp的多联体,(e)将连接DNA进行无引物PCR以延长串 联组,(f)将表观大小超过1000bp的片段从琼脂糖中回收,并通过微滤纯化。测定在A260的吸光度,并在无菌超纯水中制备成1 P g/ Pi储液。然后将总计lug 的(AAAAC) 200, (AAAAG) 200 或(AAAAT) 200 寡核苷酸点在 4mmX 4mm 尼 龙HybondNfp滤膜上(Amersham LifeSciences, Inc.)用预杂交缓冲液振荡洗涤2次,每次 30分钟,以除去弱结合的寡核苷酸,在空气中干燥,在1200 u Joules进行UU交联结合DNA, 然后在-20°C贮存。全基因组PCR文库与上述获得的与尼龙滤膜结合的寡核苷酸的支持介质的杂交选择 如下进行(a)将滤膜在 1ml 预杂交缓冲液(1% BSA(SigmaB-4287),ImM EDTA,pH8. 0,7% (w/v) SDS,0. 中,对于含有(—0 和(AMAG)n序列的寡核苷酸的滤膜在40°C预杂交,对 于含有(AMAT)n序列的寡核苷酸在37°C预杂交。20分钟后,除去缓冲液,并加入100 u 1新鲜 预杂交缓冲液,(b)用碱(K0H,终浓度150mM)将全基因组PCR文库DNA (20 y g)变性,通过加入 0. 25体积的1M Tris-HCl pH4. 8中和,并加入含滤膜的缓冲液中。将所得反应混合物在37°C或 40°C预杂交温度培养过夜,(c)用1ml洗涤缓冲液#l(40mM Ne^HPCV pH7. 2,0. 1% SDS)在40°C 将(AMAC) 200和(AMAG) 200滤膜洗涤2次,及在室温振荡洗涤1次,每次15分钟。(AMAT) 200滤 膜用1ml洗涤缓冲液在37°C洗涤1次及在室温洗涤1次,(d)与每个滤膜结合的DNA,通过在 100 yl无菌纯水中加热至95°C 5分钟而释出。在95°C将样品除去,以防止再退火。将滤膜剥 离(stripped),并通过在0. 4M NaOH中在45°C保温30分钟,然后转移至0. 1X SSC,0. 1 % SDS, 0. 2M Tris pH7. 5中并再保温15分钟而再利用。将此膜印迹干燥并在_20°Cr存在密封管中。实施例3克隆DNA片段的五核苷酸重复富集文库将根据实施例2的富集五核苷酸重复的DNA片段群,通过PCR再扩增。然后将再 扩增的片段克隆入质粒载体pGEM-3Zf(+)中,如下述。此方法通过将选择的插入物与pGEM 载体连接,然后将环化的质粒转化入JM109E. Coli宿主中而进行。插入物与载体的连接如下进行(a)将5 ii 1杂交选择的DNA在100 y 1反应体积 中,用 1XSTR 缓冲液(50mM KC1, lOmM Tris-HCl, pH9. 0,1. 5mM MgC12,0. 1% Triton X-100,禾口 0. 2mM 每种 dNTP),1 u ITaq 聚合酶(5U/ P 1),及 1 P M 寡 A 引物(1 ii 1 lOOpmol/ u 1 储液)进 行再扩增。循环条件是95°C 1分钟,67°C 1分钟,70°C 2分钟;循环30次。(b)通过向100 u 1 PCR反应物中加入11 P 1 Promega限制酶10 X缓冲液C,禾口 2 y 1 (8U/ u l)MboI,在37°C将所 得反应混合物保温过夜而用Mbol消化再扩增的DNA,并通过在65°C将混合物保温20分钟加 热灭活限制酶。(c)通过用BamHI (5U/ y g)在37°C消化16小时,随后加入适量小牛小肠碱性 磷酸酶10 X缓冲液(Promega)和1 y lCIAP(U/u 1)并在37°C保温1小时,制备用于进行片段 插入的pGEM-3Zf (+)载体(约20 ii g或10. 6pmol)。通过加入0. 5M EDTA至终浓度为0. 02M 而终止此反应。乙醇沉淀及以lg/yl重悬浮于TE缓冲液中,然后用苯酚提取。(d)最后,在 室温将1 P 1用Mbol切割的DNA (见b步)与1 ii 1或200ng去磷酸化的pGEM 3Zf (+)(见c 步)和1 ii 1T4DNA连接酶(1 3U/ u 1)保温2小时,进行20 u 1插入物-载体连接。最后,用Technical Bui letin#095所述Promega转化法,将10 yl的插入物-载 体连接反应转化入100 ill JM109感受态细胞中。实施例4通过菌落杂交选择含有(AAAAX)n五核苷酸重复的小插入片段基因组文 库用Lightsmith II 试剂和方法(见 Promega Technical Bulletin#TM227)经菌落杂交 筛选选择含有(MMX)n五核苷酸重复的克隆,并通过与碱性磷酸酶辍合的探针杂交而显色。
将 MagnaGraph 尼龙膜(Micron Separations, Inc. ffestboro,MA)置于含有细菌菌落 的平板上,搁置3分钟,然后在干燥滤纸上印迹而将菌落DNA转移至膜上,接着将此膜转移到 一系列含10% SDS托盘中,放置3分钟,然后转移至含5ml Na0H+30ml 5M NaCl+65mldH20的 变性液中放置5分钟,然后转至由30ml 5M NaCl+25ml MTris_HCl,pH7. 4+45ml dH20组成的中 和溶液中放置5分钟,最后转至2XSSC中放置5分钟。然后将此膜在室温干燥30分钟,随后 用Statalinker (Stratagene,La Jolla,CA)用 1200ufoules UV 交联。借助于AP缀合的探针和化学发光物,检测含有具有(AAAAX)n重复的克隆的菌落。 将与AP缀合的探针杂交的滤膜在X线下曝光表明菌落含所需克隆。进行第二次杂交以证 实初始结果。检测程序利用Promega 的 Lightsmith II 试剂盒(见 PromegaBulletin#TM227 关 于程序的详述)。简而言之,所用检测程序由以下步骤组成(a)在Quantum Yield 封闭溶 液(Promega Cat No F1021)中,将滤膜在56°C强力振荡培养45分钟,(b)到出封闭溶液, 并每cm2含AP探针的膜加入0.05ml Quantum Yield 高严格性杂交溶液(Promega Cat No F1231),并在56°C强力振荡培养45分钟,(c)从滤膜中到出杂交/探针溶液,并用150 200ml在56°C预热15分钟的洗涤液#1(2XSSC,0. SDS)洗涤2次,(d)组合所有滤膜,并 用洗涤液#2(1XSSC)在室温下洗涤1次,10分钟,(e)在200ml 100mM二乙醇胺,ImM MgCl2 中平衡印迹5分钟,(f)加入足够的0. 25mM CDP-Star底物(Tropix Bedford, MA),以饱和 滤膜,然后在室温至少培养5分钟,(g)将底物饱和的滤膜置于杂交折叠器(folder)中的 聚苯乙烯塑料片防护器上,并关上折叠器,(h)将含滤膜的杂交折叠器放在底片盒中,并将 所含的滤膜曝光于X光胶片,(i)在曝光至少1小时之后,显色底片。实施例5DNA测序和分析一种简便的利用细胞裂解物制备测序模板的方法被开发出,以对实施例4中鉴别的可能 含有带有至少一个(MAAX)n序列的插入物的大量克隆进行测序。此方法包括将菌落杂交分析中 的阳性克隆转移至含200 u 1 LB/Arap (100 u 1/ml)的无菌96孔微滴定平板中(Falconcat. #3072),在 25Qrpm, 37°C培养过夜。接着,将过夜培养物分开,并用于三种不同方法,包括制备细■解物,从第 二次杂交中制备复制滤膜以证实初始发现,或制备甘油储液以长期C存克隆。取2ii 1过夜培养物并将其加入96孔反应平板(Perkin Elmer Cat#N801-0560)中 的100 u 1无菌超纯水中,在9600热循环仪中加热至100°C 4分钟,以产生细胞裂解物。然 后冷却,冰冻,并在-20°C贮存直至使用。经灼烧将96-针复制器灭菌,将此复制器蘸含过夜培养物的96孔平板中,印迹在 LB/Amp(100ug/ml)平板上的137mm圆形尼龙膜(MagnaGraph,MSI),在37°C将此膜培养过 夜,从而制备复制滤膜以进行第二次杂交。向每个孔中加入46 yl 80%甘油,并将平板放在振荡培养器中,以250rpm振荡几 分钟至混合,然后在-70°C贮存,以将剩余过夜培养物转变为甘油储液。选择在二个菌落杂交分析中是阳性的所有克隆,并将细胞裂解物平板的相应克隆 用于PCR扩增。用Qiagen QIAquick 96PCR纯化平板(cat#28180)纯化PCR反应产物,并用 模板进行测序。将2 ill细胞裂解物用于含有2 iiM M13-47正向引物(Promega cat,#Q560A) 禾口 2iiM M13 反向引物(Promega cat. #Q542A),1 X STR 缓冲液和 2. 5 单位 Ampli Taq (Perkin Elmer)的50 yl PCR反应中。在PE480热循环仪上使用以下循环曲线在96°C/2分钟循环1次;在94°C /I分钟,56°C /分钟,70°C /I. 5分钟循环10次;在90°C /I分钟,56°C /I 分钟,70°C/1.5分钟循环20次;在4°C保持。根据生产者之建议用Qiagen QIAquick 96PCR 纯化平板(cat. #28180)净化PCR反应产物,并回收入70 ill Tris-HCl 10mM pH8. 5,终浓度 大约35ng/iil,并在-20°C贮存。用ABI染料终止测序化学和ABI377测序仪进行DNA测序。用ABI染料终止试剂 盒和生产商方案(Protocol P/N 402078)制备测序模板。将2 yl或大约30 90ng纯化 的PCR产物(上述)用作DNA模板进行测序反应。此测序反应包括8 u 1染料终止剂混合 物,2iUDNA模板(35ng/iil),4iil 0. 8M M13-21 正向引物,和 6 yl 无菌超纯水,在GeneAmp PCR System 9600上循环测序循环曲线为在96°C /10秒,50°C /5秒,60°C /4分钟循环25 次,保持在4°C,在每个试管中加入50 ill 95%乙醇和2iU 3M乙酸钠,pH4.6,用涡流混合, 置于冰上10分钟,然后在最大速度离心30分钟,从而纯化延伸产物。将粒状沉淀用250 y 1 70%乙醇漂洗,真空离心约3分钟脱水,并在-20°C干燥C存直至使用。然后将干燥的粒状沉淀 再悬浮于6-9 u 1加样缓冲液中,然后在95°C变性2分钟,并在冰上C存直至加样于凝胶上。根据生产者之方案制备5%Long Ranger凝胶(FMC Bio Products,Rockland,ME), 并聚合2小时。将此凝胶在1000V预电泳45分钟。将加样缓冲液中的1. 5 yl模板加样于 凝胶上,并在2X或4X条件下分别电泳3. 5小时或7小时。将产生自ABI 377测序仪的DNA序列数据进行编辑,以除去任何pGEM载体序列, 然后置入局部数据库,该数据库是用遗传学计算机组Wisconsin软件包版本9. 0 (Madison WI)产生的,含有所有被评价克隆的序列信息。接着,测试克隆中是否存在五聚体重复, 及其长度和序列模式。然后将那些含有5或更多个重复的克隆,用BLAST序列对比程 序(Alargland et al ; 1990)比较,以鉴别复制的克隆和那些已存在于美国马里兰州 Besthesda的国立生物信息中心的GenBank数据库中的克隆。一旦鉴别出独特的克隆,借助 于寡聚物引物分析软件版本5. 0 (National Biosciences, Inc, Plymouth, MN)设计PCR引物。实施例6筛选多态水平的克隆及测定染色体位置在二个集合的DNA样品上进行初始多态性筛选,一个样品含有15个随机个体的人 基因组DNA,另一个含有取自NIGMS人类遗传突变细胞贮存处(CEPH Collection DNA pool, cat. #NA 13431, CoriellCell Repositories, Camden, NJ)的 54 个 CEPH 个体的基因组 DNA。 荧光标记的PCR引物用于基因组DNA靶基因座的PCR扩增,并将PCR产物在聚丙烯酰胺凝胶 上分离,并在荧光扫描仪上显色。将那些具有4个等位基因和50%杂合性的基因座随后用 16 个个体 CEPH DNAs (102-1,102-2,884-1,884-2,1331-1,1331-2,1332-1,1332-2,1347-1, 1347-2,1362-1,1362-2,1413-1,1413-2,1416-1,1416-2)测试,以测定初步杂合值。然后进 一步分析相同基因座的数据,以确定等位基因数,等位基因频率和杂合值。(见表2)将发现的含有五聚体重复序列并符合> 4个等位基因和> 50%杂合性的选择标 准的克隆作图,以测定精确染色体位置(见表2)。有三种不同方法用于作图(1)用代表单 个人染色体的NIGMS组26个体细胞杂种(Coriell Cell Repositories, camden, NJ)进行 体细胞杂种作图,以鉴别染色体起源,(2)利用GeneBridge 4RH组的93个RH克隆(Schuler et al ; 1996)进行辐射杂种作图的技术,和(3)标准减数连锁作图技术和8个取自CEPH同 源参考组的家族(K102, K884,K1347,1362,1331,1332,1413,1416)并用 CRI-MAP 多点连锁程序(Lander & Green, 1987)作图。在对含有100个以上来自4种主要种族包括非洲人,白人,亚洲人和西班牙人的较 大群体研究中,评价了 16个CEPH个体中杂合值超过70%的克隆的基因型和等位基因出现 频率。图10和11图示扩增自群体中24个不同个体基因组DNA样品中(DNA样品S02 S25)2个不同多态ITR基因座的等位基因迁移的广泛变化。用于此分析的引物对序列见上 表1。用荧光标记的引物扩增每个五核苷酸重复基因座,随后在聚丙烯酰胺凝胶上分离,并 经 FMBIO II 焚光扫描仪(Hitachi Software Engineering America,Ltd,San Francisco, CA)扫描显色,而产生凝胶图象。含有每个分析的基因座的大多数已知等位基因的等位梯包 含在电泳凝胶两头的泳道中,即S01和S26泳道中。用于扩增每个基因座的引物对具有互 补于分离自克隆S159或克隆G210的分离的DNA标记的序列至少一部分的序列,如以下实 施例所示。此引物对序列选自上表1列出的克隆S159和G210引物对。进行多态性筛选的PCR条件如下25 u 1含大约200ng集合的DNA模板或25ng个 体CEPH DNAs, 1 X STR缓冲液,1单位Taq聚合酶,和1 i M相应引物对的反应物。用于扩增 表2所列每个克隆的每个引物对序列见表1中所列。注意到每个引物以表1所列的SEQ ID N0@$。 Perkin—Elmer Gene Amp PCR System 9600 WM^iX (Perkin-Elmer Foster City,CA)的循环条件是96°C 1分钟,然后在94°C,30秒,68秒内缓升至60°C,保持30秒, 50秒内缓升至70°C,保持45秒,循环10次,随后90°C 30秒,60秒内缓升至60°C,保持30 秒,50秒内缓升至70°C,保持45秒,60°C,30分钟循环20次。将2. 5 yl每个样品与2. 5 yl 2X溴酚蓝加样液混合以制备PCR样品,在95°C加热2分钟以变性,冰冻,然后将3 yl每个 样品在4%聚丙烯酰胺凝胶上,在40W电泳50分钟。将此PCR产物通过Hitachi FMBIO荧 光扫描仪扫描显色,并用所附软件分析(FMBIO Analysis Version 6. 0,Hitachi Software Engineering, San Francisco CA)表2 实施例7通过GenBank搜索鉴别短串联重复鉴别串联重复序列的方法是搜索国立生物信息中心(NCBDGenBank中中度串联 重复的存在与否。使用的一些方法包括用DNASTAR的Lasergene软件包,在⑶-ROM上成批 搜索GenBank入口,用遗传学计算机组Wisconsin软件包版本9. 0 (Madison, WI)成批搜索 GenBank。有45 = 1024个不同的五字母单词可从4个字母(A,C,G,T)组成,以产生所有可 能的五聚体重复,且有46 = 40 96和47 = 16384个不同六字母和七字母单词产生6碱基重 复和7碱基重复。但是,由于二个互补链的等价(如AAAAT等价于ATTTT),及环状置换的等 价(如AATAA…等价于ATAAA-),独特的重复基序数相对较少。在5碱基重复的情况下,这 意味着如果除去单核苷酸重复^/%和C5/G5,有102类独特的五聚体重复。所有具有至少3个连续拷贝的5,6和7碱基重复的独特组合,用于搜索GenBank人 基因组数据库。所有含3个或更多重复拷贝或具有偶然碱基取代的拷贝的重复区被鉴别。 用现存的序列数据,设计位于重复区侧翼的引物,靶基因座经PCR扩增,并如实施例6所述 评价多态含量。然后将含有用GenBank数据库信息装配的引物鉴别的序列的每个克隆,如实施例 7中所述筛选重复序列含量。发现的含有ITR序列,即ITR标记的每个克隆的序列指定为 SEQ ID N0:28 43之一。含有位于每个这种标记的ITR区侧翼的序列的引物的序列见表 1。每个这种ITR标记序列特征分析结果见表2。实施例8评价中度串联重复基因座的PCR假象(即伪带百分率)本研究中所述的许多标记代表一类新的标记,其产生较少的已知为“伪带”的PCR 假象,(见以上本发明详述的解释章节)。这些假象的产生发生在PCR扩增期间,可能是称为 重复滑动的 DNA 聚合酶相的现象导致。(Levinson & Gutman,1987,Mol,Biol. Evol. 4 (3) 203-221 ;Schlotterer & Tautz,1992. NAR20 :211_215)。重复滑动的最终结果是含有与真正等位基因不同数目重复单位的PCR产物的产生。如果在PCR期间发生足够量的滑动,扩 增的产物将显示为主要和次要条带,主要条带相当于真正等位基因,而次要条带相当于含 有较多或较少重复单位的产物。为确定不同基因座伪带条带的数量,将6个ITR基因座(C221,G023,G025,G210, S159和本发明中未阐述的另外的ITR即S117),和17个四核苷酸串联重复基因座(F13A01, TH01, TPOX, F13B, FESFPS, D7S820, CSF1P0, D13S317, D8S1179, D16S539, LPL, FGA, D5S818, D3S1358, D18S51, vWA和D21S11)的PCR扩增产物在ABI 377测序仪上电泳,并用GenScan 软件(PE AppliedBiosystems,Foster City CA)分析。测定在25 40个研究的个体样品 中每个基因座观测到的所有主要峰和次要峰的峰高,以相对荧光单位(RFU)表示。计算次 要峰相对于主要真正等位基因峰中观测的RFU百分率,在五核苷酸重复中次要峰通常比真 正等位基因少5bp,在四核苷酸重复中比真正等位基因少4bp (见表3)。ITR基因座S159(图2)和G210(图3),和四核苷酸重复基因座vWA(图4)和 D5S818(图5)的ABI 377电泳图示出在ITR基因座伪带最小或无伪带,在四核苷酸重复基 因座可清楚观察到伪带。特别地,图3中再产生的vWA四核苷酸重复基因座的电泳图中箭头 14和15,和图5中再产生的D5S818四核苷酸重复基因座的电泳图中箭头16和17表示伪 带假象。将那些明显的假象峰与示于图2的分离自克隆S159的DNA标记(即具有SEQ ID NO 34的序列的标记)和示于图4的分离自克隆G210的DNA标记(即具有SEQ ID NO 19 的序列的标记)的五核苷酸重复的电泳图中渐消的小假象相对比。图2-5中再产生的特异 电泳图是每个基因座观测的伪带最高发生率。对所有基因座观测的伪带数量有一些可变性。通常的趋势是等位基因含有最高重 复数(以碱基对大小而表明)呈现最高量伪带。示出的25-40个每个测试个体伪带百分值 是散射图(图6,7,8和9)。简而言之,“伪带”条带与真正等位基因条带的百分比,在大多数评价的ITR基因 座中,与四核苷酸串联重复基因座相比明显较低。即使所用四核苷酸基因座代表当前已知 的最佳此类标记,此结果也是确实的。例如,13个这种四核苷酸标记,包括一些下表3中阐 述报道的具有高伪带百分率的四核苷酸标记,已被美国联邦调查局选择用于分析国立组合 DNA 指数系统(CODIS)的所有 DNA 样品,(Macivee,I. (1998)Profiles in DNA(3) :2)。表3 序列表(1) 一般信息⑴申请人Schumm,James ff.(ii)发明名称鉴别和分析中度串联重复DNA标记的物质和方法(iii)序列数147(iv)通讯地址(A)收信人普罗梅加公司(B)街道2800Woods Hollow Road(C)城市Madison(D)州:ffisconsin(E)国家:USA(F)ZIP 53711-5399(v)计算机可读形式(A)媒介类型3. 5英寸软盘,1. 44Mb
(B)计算机IBM PC兼容机(C)操作系统Windows NT4. 0(D)软件〖WordPerfect 7. 0 (DOS 文本格式)(viii)律师/代理人信息(A)姓名Grady J. Frenchick(B)注册号29,018(C)卷号8976. 80(ix)电讯信息(A)电话(608)257-22810160](B)传真(608) 257-76430161](C)E-MAIL :gfrechickimail. stroudlaw. com0162](2) SEQ ID NO 1 的信息0163](i)序列特征0164](A)长度445bp0165](B)类型核酸0166](C)链性双链0167](D)拓扑学环状0168](ii)分子类型基因组DNA0169](iii)假设否0170](vii)立即来源0171](A)文库质粒,pGem3Zf(+)0172](B)克隆:C0740173](viii)基因组中的位置0174](A)染色体/区段10175](xi)序列描述:SEQ ID NO 1 0176]GATCCTTTGC ACCCAGANAG AAGTAATTATTTCAACACAGTTGGAACAGT500177]TAAAAAGATT TAAAATTTTC AAAAAAACAATCATTTTCTCTTTTCTTTCT1000178]GGCTCAGACA CCTCATTGCT TTCTGACTGACCAAGGCGCAGCGCANTTTG1500179]CAGCAGCCAT GGGGGTTCCA GAGATTCCTGGANAAAAACTGGTGACAGAN2000180]AGAAACAAAA AGCGCCTGGA AAAAGATAAGCATGAAAAAGGTGCTCAGAA2500181]AACAGATTGT CAAAAGTAAG TCTTACCTGTGGCTCGCATTATTTGGGAGT3000182]TATTAAAATA TGAAAGTTTG GCAAATACCCGGTTATCTACAGTCCTTTNG3500183]TTTNGTTTTG GTTTTGTTTA GTTTGGTTTTGTTTNGTTTNGTTTGACACG4000184]GAATCTCTCT CTGTTGCCCA AACTGGGAATACAGTGGTGCCGATC4450185](2) SEQ ID NO 2 的信息0186](i)序列特征0187](A)长度:411bp0188](B)类型核酸0189](C)链性双链0190](D)拓扑学环状0191](ii)分子类型基因组DNA0192](iii)假设否0193](iv)立即来源0194](A)文库质粒,pGem3Zf(+)0195](B)克隆:C2210196](viii)基因组中的位置0197](A)染色体/区段9p0198](xi)序列描述:SEQ ID NO 2
GATCACTTGC CATCCCTGCCACACAGTTTCCTCCTCTGGAAACTGGGGGT50
GATGACCCCT GCCCTACCCACTTGTCATGGCATTGGGGACATGAACACAC100
TTTGCACCTG TCAGGCAAGGCTTAAACAGGGATATGCACTGGTAATAGAA150
AAGAGGGACT AAGTTTTGTTTTGTTTTGTTTTGTTTTGTTTTGTTTTGTT200
TTGTTTTGTT TTGTTTTGTTTTGTTTTTCTGAAGAAGTCCCTAGAAGCGC250
TCAGTGTTGG AATGCTCTCTTGTAGCAGTGGCGGCTGCTGCTGGTTCCGG300
GTCAGATGCC GGAATTGGGGGTGCGCTTGGGTGCAGCTGCATTTCATCTG350
GTCCTGGGCC TCGGTCCTGGCTTGGAGAGGTGCAGCTCACAGCCACTTCA400
TGGCTGGGAT C411
(2) SEQ ID NO 3 的信息
(i)序列特征
(A)长度:354bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆:C240
(xi)序列描述:SEQ ID NO 3
GATCANCATG GGTTCTATCTGCCTGGCCCTTCACCCCCTACTCAGGGCAG50
CTCTGAATTG TCTNCCCCGCTTCAAAGTTCCCAGTTCAACTTCTCCCTCT100
GCCCAATCCT GTTTCCTTCTCTTCCACAGGTATTAATTTGGCCAGNTGCA150
GTGGCTCATG CCTGTAATCTCAACTTTGGGAGGCCAAGGTGGGAGGATTG200
CTTGANCCCA GAATTTTGAAACCANCCTCTGAAACATANTGANACCCCTG250
TCTCAAAACA AAACAAAACAAAACAAAACAAAACAAAAACTANCCAGGCA300
TGATGGTGTG TGCCTGTGGTCCCANCTATTCAGGAGGCTGAAATGGGAGG350
ATC353
(2) SEQ ID NO 4 的信息
(i)序列特征
(A)长度317bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆:C331
(xi)序列描述:SEQ ID NO 4
GACCGTGGAA NCCAAAAGTC TGCCTACCGCATCTTAGTCCAGAGTTCCTG50
TTTTTACTTC TTTTTGAAGG TCTGTGGATTCTTTATTTTCATGGCACCTT100
AGCAATACAT TTTAAAAGCT TGTTTTATTTTATTCAGCATTTTGGTTATT150
TCCATTGGAA NANTCATTCA GGGCGTTTAGTCTGCCACAGTGCTGGAAAC200
TAAAGCTAGG ATTACATGTT TTGTTTTGTTTTGTTTTGTTTTGTTTTGTT250
TTGTTTTGTT TTGTTTTGTG ACAGGGTCTTGCTCTATTGCCTTAGGCTGG300
GGTGCAGTGT TGTGATC317
(2) SEQ ID NO 5 的信息
(i)序列特征
(A)长度:387bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆:C362
(viii)基因组中的位置
(A)染色体/区段4
(xi)序列描述:SEQ ID NO 5
ACAGACTAAC AGAAAGAANA TCAGGTCGACTTGCCTAAAAAGAGTGAGCT150
AGGGAAAAGC ATGGCGGAAG AAACAANGTTGCTGAAAGCAACTCTTATTT200
TCTTGGCTTA GAAACCANNA AAATGCNTTTGGGTTTTATCTTAGCATAAT250
GAAAAGACAT GTNANACTTC TGAACACGAAATCTGACATGTTTTACAGAC300
NTGTTTTACA TGGTTTTGTT TTGTTTNGTTTTGTTTTGGGATGGAGTCTC350
GCTCTGTTGC CANGCTGGGA GTGCAATGGTTGCGATC387
(2) SEQ ID NO 6 的信息
(i)序列特征
(A)长度471bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(D)拓扑学环状(ii)分子类型基因组DNA(iii)假设否(iv)立即来源(A)文库质粒,pGem3Zf(+)(B)克隆G023(viii)基因组中的位置(A)染色体/区段16q(xi)序列描述:SEQ ID NO 8GATCACAGCACTGCACTGCAGCCTGGGCAAGAGAGCAAGACCCTCTCTCT50
CAGGGAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAA100
AAGAAAAGAAAGGAAGGAAAGAGAGAGGAAGGAAGGAAGGAAGGTAAGAA150
GGAAGGAAGGAAAGAAAGAAGGAAGGAAGGTAGGGTGGTTTTGGGATGTG200
AAATGCTGTCAGTCAACAAAGAGCTATGACCACAGGTGTCACTGAGTAGC250
AGGGGCAGCCCATCCTGCTCCCTAGCTGCACTCACCCTGAAGATC295(2)SEQ ID NO :9 的信息(i)序列特征(A)长度36lbp(B)类型核酸(C)链性双链(D)拓扑学环状(ii)分子类型基因组DNA(iii)假设否(iv)立即来源(A)文库质粒,pGem3Zf(+)(B)克隆G025(viii)基因组中的位置(A)染色体/区段1(xi)序列描述:SEQ ID NO 9GATCTGATGGTTTCATAAGTGTCTGGCATTTCCCCTGCTTGTACTTCTCT50
CCCCGGCTACCGTGTGAAAAAGGTCCTTGCTTCCCCTTTGCCTTCCACCA100
TGATTGTGAGCTTCCTGAGGCCTCCACAGACATGTGGAACTGTGAGTCAA150
TTAAACTTCTTTCCTTTATAAATTACCCAGTCTCAGGAAGTTCTTTGTAG200
CAGTGTGAGAATGGAGGAAGAAAGAAAAAGAAAAAAAAGGAAAAGAAAAG250
AAAAGAAAAGAAAAGAAAAGAAAGGAAGA AAGAAAGAAAGAAAGAAAGAA300
AGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAGAGAGAAGTGGTTAG350
CAAATGTGATC361(2) SEQ ID NO 10 的信息(i)序列特征
(A)长度318bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆:G047
(viii)基因组中的位置
(A)染色体/区段2p
(xi)序列描述:SEQ ID NO 10
GATCACTTGA GGCCAGGGGT TCGAGGCCAGCCTGGGCAACATATCAAGAC50
CCCCATCTCT ACATAAAAAG AAGAAGAAACGAAAAGAAAAGAAAAGAAAA100
GAAAAGAAAA GAAAAGAAAA GAAAAGAGTGGAAGAGTGCAGGAGCCGAGA150
GGGAGAGAAA ATGTAGTGGT GAGGGGCAGCTTCTGGAAAGGCCCATACTA200
CAGAGGGAGG AATCCTAATT CCTCACTATCTCTCTAACATCAGGTAAGCA250
TCTCATGATG CAGTTAGAAA GCACATTTCCTTCTTCAGTTTCCCCTCTGG300
CTGTGTTGAC CCAGCCCA318
(2) SEQ ID NO 11 的信息
(i)序列特征
(A)长度:362bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆:G065
(viii)基因组中的位置
(A)染色体/区段lq
(xi)序列描述:SEQ ID NO 11
GATCACATTT GCTAACCACT TCTCTCTCTNTCTTTCTTTCTTTCTTTCTT50
TCTTTCTTTC TNTCTTNCTT TCTTTCTTTCTATCTTCCTTTCTTTACTTT100
NCTTTNCTNT TCTNTTCTAT TCCTTTANATTTCTTTTTCTTTCTTTCTCC150
ATTCTCACNC TGCTANAAAG AACTTCCTGAGACTGGGTAATTTATANAGG200
AAAGAAGTTT AATTGACTCA CAGTTCCACATGTTTGTGGAGGCCTCAGGA250
AACTTACAAT CNTGGTGGAA NGCAAAGGGGAANCAAGGACCTTTTTCACA300CGGTAGCCGG GGAAATAATT ACAANCAGGG GAAATGCCAN ACACTTATGA
AACCATCAGA TC
(2) SEQ ID NO 12 的信息
(i)序列特征 (A)长度:297bp ⑶类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆G085
(viii)基因组中的位置
(A)染色体/区段10q
(xi)序列描述:SEQ ID NO 12
(2) SEQ ID NO 13 的信息
(i)序列特征 (A)长度372bp ⑶类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆G132
(viii)基因组中的位置 (A)染色体/区段:4qter (xi)序列描述:SEQ ID NO 13 GATCTACCAT TCTTGGGTCT GGAGAACAGT TCTTTTCTTT TCTTTTCTTT TCTTTTCTTT
350 362GATCATGTCATTGCACTCCAGCCTGGGTGATACAGCAAGCCTCATCGAAA50
GAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAA100
GAAAGGAAGAAAAGAAAACAAANAGATAGAAAGCAANCNNGTGGCNTGAG150
AANTNAAATTCTTATAGGTAACCTGGAGGACTTTTATCTTTCCAGGAGTC200
TCTCTCAATGCATTTAGACTCAACAANGATTTCCTTTTCTCTTGTCTCTA250
NAAANAAATGCATTTCCTCAAAANANTGGAGGTCANATTATGTTANAGAT300
GGGAGAATGCACTGAGTTNCGCTGAANGA329
GGCCCTTGTT TCTTTTCTTT 50 TCTTTTCTTT CCTTTTCTTT 100
TCCTTTCCTT TCCTTTTCTT CTCTCTCTCC TTCTCTCTCT CTCTCTCTCT 150
CTCTCTCTCT CTCTCTCTCT CTCCCTCTCC CTTCCCTTCC CTTCCTTTCC 200
CTTCCTTTCC TTTCCTTTCA TTTTTTTTGA CATGGAGTTT CACTCTTGTC 250
ATCCAGGCTG GAGTACAGTA NTGTGATTTT GGCTCACTGC AACCTCTGCC 300
TCNTGGGTTC AAGAGATTCT CCTGCCTCAG CTTCCTGANT AGCTGGGATT 350
ACAGGTGCCT GCCACCATGC TT 372
(2) SEQ ID NO 14 的信息
(i)序列特征
(A)长度:350bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆G145. 1
(xi)序列描述:SEQ ID NO 14
GATCTCTTGA AGCCTCGCAN ATAAAGGCTC CAGTGGGGTA TGATTGCACC50
ANTGCACTCC ANCCTGNGAN ACGGNAGAGA GATTCTGTCT CAMAGAMA100
CAMATAMA GAMANAMA NAAMNAMA TAAMNAMA TANMGAMA150
GAMAGGATG CTTTAAAMT NTGGCMMT GTNCCCTTTA TTGACTACTG200
CCTTGTTTTA ATTTNCTCTA TTTNTCTATT TATTTTCTCA GTGTACTTTC250
CCATNTNNCT TTNTCTCTTC CTTCTTTGAA AGTMTTCTT GGCCAGGCAT300
GGTGGTTCAT GCCTATAATC TCANCACTTN AGGGGGCTNA AGCNGGMGA350
(2) SEQ ID NO 15 的信息
(i)序列特征
(A)长度372bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆:G152
(viii)基因组中的位置
(A)染色体/区段8qter
(xi)序列描述:SEQ ID NO 15
35
CAGAAAAAAA GAAAGAAAGAAAGAAAGAAAGAGAGAAAAGAAAACAGAAA100
AGAAAAGAAA AGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAC150
CCNNCAGAAA GCCAAGGCAATGGGAACAAGCTGGGGCAAGTGCCTGGAGG200
TGTTGCTGGA AAGGCAGATAGGGCAGAGAGCACCTGGACTCTTCCAAAAC250
ATATTAGCAT CATGGTAAAGCCCTCAGCCCAAGTCCCCCAGAACATAGCC300
GTAGTCAACC AAGTTGAGATTGATTACTAGCTTCCTGTNACAAGGGAGAT350
TATNCNCACA CAAGTGCCATCTGCCTCTCCCTTCACCCAGCTTGAGTTTC400
GCTTGTAGCA CT412
(2) SEQ ID NO 23 的信息
(i)序列特征
(A)长度:359bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆:G235
(viii)基因组中的位置
(A)染色体/区段2p
(xi)序列描述:SEQ ID NO 23
GATCACCAGG CCCCTGAGGAAGCAGCACAGAAAAACACAAATAATATCAA50
TATCAGGCAG CCACAGGGGAAACAATGGGGCATTTCTCCGTGCTACATGC100
ATGCTGCTAT TGTTTCAAGGGCTGGGGAATTAATTCCACTTATTTATTTA150
AGGCGTGTCA ACTCACTGCCTAAACCTGTTTCAGTGTCAAAATGGATAAA200
ACTTTTATGG CTCATAAAATANANCCATTCATCTCAATGTTCTTTGTGGT250
GGGTTTTCTT TTCTTTTCTTTTCTTTTCTTTTCTTTTTTCTTTTTTTTTC300
TGGCATACTG AGCTAAACCTCTGCTCTGAAACGGTTACATCTGAACCCAT350
TGCTGCTAT359
(2) SEQ ID NO 24 的信息
(i)序列特征
(A)长度:516bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源36/73页
0667](A)文库质粒,pGem3Zf(+)0668](B)克隆G3310669](xi)序列描述:SEQ ID NO 24 0670]GACTTTCCCACCTTCTGATGTGGGCATTTAGTGCTATAAATTTCCCTCTA500671]AACACTGCTTTAGCTGTGTCCCANAGATTCTGGTATGTTGTGTCTTTGTT1000672]CTCATTGGTTTCAAAGAACTTATTTATTTCTGCCTTAATTTTGTTATTTA1500673]CCCAGTAGTCATTCAGGAGAAGGTAGTTCAGTTTCCATGTAGTTGTGAAG2000674]TTTTGAGTGAGTTTCTTTCCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTC2500675]CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCT3000676]TTCTTTTGTTTGAGATGGAGTCTTACTCTGTCGCCAGTCTGGAGTGCAGT3500677]GGTGTCATCTCAGCTCGCTGCAACCTCCGCCTCCTGGGTTCAANAAATTC4000678]CTCTGCCTCAGCCTCCCAAGTAGCTGGGTTTACAGGCACACACCACCACG4500679]CCCAGCTAATTTTTTGTATTTTANTAAAGACAGGGTTTCACCATGTTGAC5000680]NAAAATGGTCTCGATC5160681](2)SEQ ID NO25的信息0682](i)序列特征0683](A)长度:556bp0684](B)类型核酸0685](C)链性双链0686](D)拓扑学环状0687](ii)分子类型基因组DNA0688](iii)假设否0689](iv)立即来源0690](A)文库质粒,pGem3Zf(+)0691](B)克隆:G4050692](xi)序列描述:SEQ ID NO 25 0693]GATCTCACATTCTTCCTCAGAATTCTTCTTGTTACCTCTGCAAAATTTCA500694]TCCTTCAAACTCAAAGCTCATTATCTTTGGACTCTGTGACACTCTTCTGA1000695]TTCTCATATCACTTCTTGATTTTCCTGCATTTCCTCACTAACTCTCAGCT1500696]CATAATCATATAAAATCACTAAGACTCTTTTTATATTGTCATGAAGCTCA2000697]GGTATTTTCACAGATTGAACCATTTCCCTGTAGACAGCAATGCTCAACAT2500698]GAACCATTCACATCCTTCTTCCAAAGCACAGACTCTTCTTGCCATCTGCG3000699]TCATGCCCATGCTCATGTGCATGGAGCCTGGTTCATTATCTTCCAAAATC3500700]AAGCTTCCCCCACTTGATTTCTCTTTTCTTTTCTTTCCTTTCCTTTCCTC4000701]TTTTCCTTTTCCCTTTCCCTTTCCTTACCTTTCCTTTCCTTTCCTTTCCT4500702]CTCCTCTTTTCTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCCTTTCCT5000703]TTCNTTTCTTTTATTTGCACCTCACTCTTGCCAAGGCTGGGATGGCAGTA5500704]ANCACG5560705](2)SEQ ID NO26的信息
GCAGGAMGCTAMATCTGCCCCAGTCCCATTGCTGATAGACTCACCATT300
TACTMCAGAGAMCCATTCCTCCTTTTAGATC333
(2)SEQ ID NO28的信息
(i)序列特征
(A)长度:1011bp
(B)类型核酸
(C)链性双链
(D)拓扑学环状
(ii)分子类型基因组DNA
(iii)假设否
(iv)立即来源
(A)文库质粒,pGem3Zf(+)
(B)克隆:S023
(xi)序列描述:SEQ ID NO 28
CTGTACTGAATTACAGCCCCAMTCTGGGTCAACTGGGGAGAGACGACGA50
GGATTAGGGTTCCAAGGTGAMCTGTGCCATTGCGCTCCAGCCTGGGCAA100
CAAGMTGAAACTCTCTTAAMTMMTAAMTMMTAAMTMAATAG150
CCTAAGGATGCATTTCTCAGAACTTATCCCTGTTGTTCAATGATGTGTGT200
CTATACAGTGGGGCCATMCTAAGACGTATGTTGCCCMGCTGGCMGAT250
AGCTCTGACCTTCTCTTGGGCCCCTCATTTCCCCCMACACAGGTTGTCT300
GCAGTCTTGACCMTGGCTGCCAGGGCATGGACTCCGCTGCAGGGGCCAG350
TGGGAGGCCCCAGCTCAGGCMAAGCACAGGCAGATATTTCAGGAGTCTG400
CTAGGGCTGGCACTGAGGGCAGAGACAGAGGGGTCTCCCTGTCCTTTGGA450
GAACCTCACGCTGCAGAMTTCCAGACTGAACCTTGATACCGAGTAGGGG500
AGGAGCTGTCTGCGGGTTTGAGCCTGCAGCAGGAGGAAGGACGTGMCAT550
TTTATCAGCTTCTGGTATGGCCTTGAGCTGGTAGTTATAATCTTGGCCCT600
GGTGGCCCAGGGCTACAGTCATCCTAGCAGTCCCCGCTGAAGTGGAGCAG650
GTACAGTCACAGCTGTGGGGACAGCAATGCTGGCCMGGGTCTTCCCCCA700
CGCTCAGTCCTGGTCMAGGCTGCCAGACCTTTCTGAGTGCCCCCAGGGA750
GGGGCTGGGGCGTCTCAGGGTGCCCACTGGCGAGGGAGCTGGCATCTCCA800
CCCGCAGTCCTCGCCCCTTCMTGAGATCCCCTCTCCTGGTGACAATGGC850
TGGCTAMCCTGTACCATTTCTGGAGGGAGACGGGCACACACAAAGTCCA900
CCTTCACCATGTCCAGAATTTCCAGMGTATGGCCCGATTTACAGGTMG950
CCTGGCAGAGGGTGGGAGCCGAAGGACAGGGAGGAGGAGGGGACTGGGTA100
0GCCCTGCTGT1011
(2)SEQ ID NO29的信息
(i)序列特征
(A)长度:1011bp
(B)类型核酸
43
(2)SEQ ID NO38的信息[1097](i)序列特征[1098](A)长度:1000bp[1099](B)类型核酸[1100](C)链性双链[1101](D)拓扑学环状[1102](ii)分子类型基因组DNA[1103](iii)假设否[1104](iv)立即来源[1105](B)克隆:S040[1106](xi)序列描述:SEQ ID NO38 [1107]GCTGCAATAAACACGGGAGTGTAGGTATCTTTAAAAGAAGGTGGTGATTT1900[1108]CATCTCTTCTGGGTATGTATCCAAAATAGGGTCACTGTTGGGTTATAAGG1950[1109]TGGTTAGGTTTTGAATTTCTTTAGGAACCTCCATACTGTTTTCCATAATG2000[1110]GGTGCACCAATCATCATTCCCACCAACAATGTACAAGTGTTTTATTTTCT2050[1111]TCACACCCTCATCAATATTTATCTCTTGTCTTTTTTATAATAGCCATCCT2100[1112]AAAGACTGTAAGGCGTTTTATTTCTAATCTCAGATTTCACTGTAGAAACA2150[1113]GTGATGACACAGTCTCCAGCTTCCCTGTCTTTGTCTCTGGAGAAAAAAGC2200[1114]CACCCTGACTTGCAGGGCCAGTCAGTGTTAGCAGCTACTAAGCCTGGTAC2250[1115]CAGAAGAAACCTGAGCGGGTTCCCAGGCTCCTCATCTATGGTACAGCCCT2300[1116]GATTTGTGATAGTGGGTCGGGGACAGGGCTTACTCTCACCATCGGCAGCC2350[1117]TGGAGCCTGGAGCCTGGAGATTTGCACTTCATCACTGTTATCAGCATAGT2400[1118]AGTTGGTGTCCCATACTGATTCGACATGCAACAAAAACCTCCAGGAGACC2450[1119]TAAGGTGTTTATTTGATTATACTACCTGCTTCCTTTTTAGTCATCTGATG2500[1120]TGGTGCTGCTCAGTTTTAGCATCTCTGCTTTGATTGGAAATTCTGAGGTT2550[1121]CTCAAAAGTAATTCCTTATAATATTTATAGTTTCACTCATGGATTTTTTT2600[1122]CTCAGACCCAAATGTACAGCCAGGTTCAGGCACAATTTCATGGTCAAGGC2650[1123]CATTGGATCAGACTCACATGAGTGGACGCCTCTAAAGGTCCTGGCCAGTG2700[1124]CGATAAAGTAGCAGCGACAATGATAAAGAAGAAGAATTAGAAAGGCAGAA2750[1125]TTAAAGGTATAACAATTCACTGATGAAAGGACTGTGTGGGGGAGAAATTT2800[1126]CTAATTGTCTACACAGAAATTATTAGAATTAATGAGATACATAGCAAATT2850[1127](2)SEQ ID NO39的信息[1128](i)序列特征[1129](A)长度:1050bp[1130](B)类型核酸[1131](C)链性双链[1132](D)拓扑学环状[1133](ii)分子类型基因组DNA[1134](iii)假设否52[1135(iv)立即来源[1136(B)克隆:S066[1137(xi)序列描述:SEQ ID NO39 [1138GGGGCCTAGCCCAGTTGGAGGGACAAGAGCTGGAAACTGGGTTCCTTAGG50[1139GTGGTGCCAGAGTGGGCAGAGACCTCTGGGCAGCCCACGTCCMGTCCAG100[1140AGCMGGGGAGGCTCATCCTAGAAMGAGGCCAGAGGAGCCATMCCACC150[1141ATTGTTCCTTGGGTTMGGAGTCCTTTTTTAAMCCATCAAMCTAAGM200[1142TCCAGTGCATTATGAATCCAAGGGGTGAGGCTCAGTGTGCCMTGCCCCA250[1143GMCAGTCTAAGAAAGCTCCTTTTCCCTTTCCAGGCAGCTCGAGCTTTAC300[1144CTTCCCAMTTCTCCATTGAGGGCTCCTATCAGCTGGAGAMGTCCTCCC350[1145CAGTCTGGGGATCAGTMCGTCTTCACCTCCCATGCTGATCTGTCCGGCA400[1146TCAGCAACCACTCAMTATCCAGGTGTCTGAGGTGGGTTCAGAAGCTCCT450[1147ATGCATCTGCTTCCCAAGATCTATTCTGTTCTATTCTTTCTATTCTACTC500[1148TACCCCATTTCATTCCATTCCATTCCACTCAACTCCACTCCACTCCACTC550[1149CACTCCAGTTCACTCTATTCMTTCCACTCCACTCCAGTTCACTCTATTC600[1150MTTCCACTCCACTCCACTCCAGTTCACTCTATTCAGTTCCACTCCACTC650[1151CACTCCACTCCACTCCAGTTCACTCTATTCCATTCCACTCCATTCCACTC700[1152CTCCACTCCTCTCATCCACTCCACTCTACTCCTCCACTCCACATCTCCAC750[1153TCCACTCCTCCACTCCACTCCTCCACTCCACTCATCCACTCCACTCCTCC800[1154ACTCCACTCCTCCACTCCACTCCTCCACTCCACTCCACTCATCCACTCCA850[1155CTCTTCCATTCCACTCCATTCCACTCCTCCACTCCACTCTTCCACTCCAC900[1156TCCATTCCACTCCTCCACTCCACTCCACTCTATTCTATTCTATTCCATTC950[1157CATTCTACTCTATTCTATTCCATTCCATTGCAGTCMCTCCACTCCACTC1000[1158TCTACTATTCTATTCCACTCCTCTCCCCTCCACTCCATTCCATTGCAGTC1050[1159(2)SEQ ID NO40的信息[1160(i)序列特征[1161(A)长度4580bp[1162(B)类型核酸[1163(C)链性双链[1164(D)拓扑学环状[1165(ii)分子类型基因组DNA[1166(iii)假设否[1167(iv)立即来源[1168(A)文库[1169(B)克隆:S077[1170(xi)序列描述:SEQ ID NO40 [1171GGATCCCAATTCATTCCGGGCTGACACGCTCACTGGCAGGCGTCGGGCAT50[1172CACCTAGCGGTCACTGTTACTCTGAAMCGGAGGCCTCACAGAGGAAGGG100[1173AGCACCAGGCCGCCTGCGCACAGCCTGGGGCMCTGTGTCTTCTCCACCG150[1174CCCCCGCCCCCACCTCCMGTTCCTCCCTCCCTTGTTGCCTAGGAMTCG200[1175CCACTTTGACGACCGGGTCTGATTGACCTTTGATCAGGCAAAMCGAACA250[1176AACAGATAMTAMTAAMTAACACAAMGTMCTMCTAMTAAMTM300[1177GTCMTACMCCCATTACMTACAATAAGATACGATACGATAGGATGCGA350[1178TAGGATACGATAGGATACMTACAATAGGATACGATACMTACAATACM400[1179TACAATACMTACAATACMTACAATACMTACAATACMTACAATACGC450[1180CGGGCGCGGTGGCTCATGCCTGTCATCCCGTCACTTTGGGATGCCGAGGT500[1181GGACGCATCACCTGMGTCGGGAGTTGGAGACMGCCCGACCMCATGGA550[1182GAMTCCCGTCTCMTTGMMTACAAAACTAGCCGGGCGCGGTGGCACA600[1183TGCCTATMTCCCAGCTGCTAGGAAGGCTGAGGCAGGAGAATCGCTTGM650[1184CCTGGGMGCGGAGGTTGCAGTGAGCCGAGATTGCGCCATCGCACTCCAG700[1185TCTGAGCAACMGAGCGAMCTCCGTCTCAAAMTAAATACATAMTAM750[1186TACATACATACATACATACATACATACATACATACATACATAMTTAAM800[1187TAMTAAATAAMTAAAATAMTAMTGGGCCCTGCGCGGTGGCTCMGC850[1188CTGTCATCCCCTCACTTTGGGAGGCCAAGGCCGGTGGATCMGAGGCGGT900[1189CAGACCAACAGGGCCAGTATGGTGAMCCCCGTCTCTACTCACAATACAC950[1190AACATTAGCCGGGCGCTGTGCTGTGCTGTACTGTCTGTMTCCCAGCTAC1000[1191(2)SEQ ID NO41的信息[1192(i)序列特征[1193(A)长度:1000bp[1194(B)类型核画[1195(C)链性双链[1196(D)拓扑学环状[1197(ii)分子类型基因组DNA[1198(iii)假设否[1199(iv)立即来源[1200(A)文库[1201(B)克隆:S097[1202(xi)序列描述:SEQ ID NO41 [1203GGACATGAGGCTTCCCAGCCAACTGCAGGTGCACAACATAAATGTATCTG50[1204CAMCAGACTGAGAGTAMGCTGGGGGCACAMCCTCAGCACTGCCAGGA100[1205CACACACCCTTCTCGTGGATTCTGACTTTATCTGACCCGGCCCACTGTCC150[1206AGATCTTGTTGTGGGATTGGGACAAGGGAGGTCATAMGCCTGTCCCCAG200[1207GGCACTCTGTGTGAGCACACGAGACCTCCCCACCCCCCCACCGTTAGGTC250[1208TCCACACATAGATCTGACCATTAGGCATTGTGAGGAGGACTCTAGCGCGG300[1209GCTCAGGGATCACACCAGAGMTCAGGTACAGAGAGGMGACGGGGCTCG350[1210AGGAGCTGATGGATGACACAGAGCAGGGTTCCTGCAGTCCACAGGTCCAG400[1211CTCACCCTGGTGTAGGTGCCCCATCCCCCTGATCCAGGCATCCCTGACAC450[1212AGCTCCCTCCCGGAGCCTCCTCCCAGGTGACACATCAGGGTCCCTCACTC500[1213MGCTGTCCAGAGAGGGCAGCACCTTGGACAGCGCCCACCCCACTTCACT550[1214CTTCCTCCCTCACAGGGCTCAGGGCTCAGGGCTCMGTCTCAGMCAMT600[1215GGCAGAGGCCAGTGAGCCCAGAGATGGTGACAGGGCAATGATCCAGGGGC650[1216AGCTGCCTGAMCGGGAGCAGGTGMGCCACAGATGGGAGMGATGGTTC700[1217AGGMGAAMATCCAGGMTGGGCAGGAGAGGAGAGGAGGACACAGGCTC750[1218TGTGGGGCTGCAGCCCAGGATGGGACTMGTGTGMGACATCTCAGCAGG800[1219TGAGGCCAGGTCCCATGAACAGAGAAGCAGCTCCCACCTCCCCTGATGCA850[1220CGGACACACAGAGTGTGTGGTGCTGTGCCCCCAGAGTCGGGCTCTCCTGT900[1221TCTGGTCCCCAGGGAGTGAGMGTGAGGTTGACTTGTCCCTGCTCCTCTC950[1222TGCTACCCCAACATTCACCTTCTCCTCATGCCCCTCTCTCTCAMTATGA1000[1223(2)SEQ ID NO42的信息[1224(i)序列特征[1225(A)长度:1144bp[1226(B)类型核画i[1227(C)链性双链[1228(D)拓扑学环状[1229(ii)分子类型基因组DNA[1230(iii)假设否[1231(iv)立即来源[1232(B)克隆:S103[1233(xi)序列描述:SEQ ID NO42 [1234CTCTGACTCTCCGCGGTGGTTGTTGGGGCTTCTTGGCTTTGTTTTGTTGT50[1235TTGTTTGTATTTTATTTTTTTCTCTCTGACACCTATTTTAGACAMTCTA100[1236AGGGAAAMGCCTTGACMTAGMCATTGATTGCTGTGTCCAACTCCAGT150[1237ACCTGGAGCTTCTCTTTAACTCAGGACTCCAGCCCATTGGTAGACGTGTG200[1238TTTCTAGAGCCTGCTGGATCTCCCAGGGCTACTCACTCMGTTCMGGAC250[1239CAACAAGGGCAGTGGAGGTGCTGCATTGCCTGCGGTCMGGCCAGCAAGG300[1240TGGAGTGGATGCCTCAGAACGGACGAGATAATGTGMCTAGCTGGMTTT350[1241TTTATTCTTGTGMTATGTACATAGGCAGCACTAGCGACATTGCAGTCTG400[1242CTTCTGCACCTTATCTTAMGCACTTACAGATAGGCCTTCTTGTGATCTT450[1243GCTCTATCTCACAGCACACTCAGCACCCCCTTCTCTGCCCATTCCCCAGC500[1244CTCTCTTCCTATCCCATCCCATCCCATCCCATCCCATCCCATCCCATCCC550[1245GCTCTTTTCCTACTTTTCCTTCCCTCAMGCTTCCATTCCACATCCGGAG600[1246GAGMGAAGGAMTGMTTTCTCTACAGATGTCCCATTTTCAGACTGCTT650[1247TAAAAAAMTCCTTCTMTCTGCTATGCTTGMTGCCACGCGGTACAMG700[1248GAAAAAGTATCATGGAAATATTATGCAMTTCCCAGATTTGMGACAAM750[1249ATACTCTMTTCTMCCAGAGCMGCTTTTTTATTTTTTATACAGGGGM800[1250TATTTTATTCMGGTAAMTTCTAMTAMATATAATTGTTTTTTATCTT850[1251TTCTACAGCAMTTTATMTTTTMGATTCCTTTTCTTGTTTATCAGCAG900
55[1252TTGTTATTACATCCTTGTGGCACATTTTTTTTTMTTTTGTAMGGTGM1000[1253AAMGCTTTTATGAGCTCATCTAGCMTCAGATTTTCCTGTGGA1144[1254(2)SEQ ID NO43的信息[1255(i)序列特征[1256(A)长度:1366bp[1257(B)类型:核_1[1258(C)链性双链[1259(D)拓扑学环状[1260(ii)分子类型基因组DNA[1261(iii)假设否[1262(iv)立即来源[1263(B)克隆S110[1264(xi)序列描述:SEQ ID NO43 [1265GGMTTCMTGGMTATMCGAMTGGATAGGATCAGAACGGMCAGAGC50[1266GGAGTGGAGTTGAGTGGAGTGGATCGGAGTGCAGTGGAMGGMTGGMT100[1267AGMTGGMTGGMTGCAGTGGAGTGGMTGGMTGMGTGGMTGGAGT150[1268TGAGTGGAGTGGATCGGAGTGCAGTGGAMGGMTGGMGAGMTGGMT200[1269GGMTGGMTGCAGTGGACTGGMTGGMTGGAGTGGAGTGGAGTGCAGT250[1270GGGMTCGAGTGGAGTGGAGTGGMTGGACTGGMTGGMTGGATTGGAG300[1271TGGAGTGCAGTGGMTCGAGTGGAGTGGAGTGGMTGGAGTAGMTGGM350[1272TGGAGTGGAGTGTAGTGGMTGGMTGGMTGGTGMTGAATGTCAGCTA400[1273AGATTGTGCAACTGCATTCCAGTCTGGGTGACAAAGTGAGATCCAGTCGA450[1274AGTAMGGMTGGMTGGMTAGAGTAAMTGGMTGGMTGGTGTGGAG500[1275TGGMTGGMTGGAGAGGMTGGAGTGGAGTGGAGTGGAGTGGAGTGGM550[1276TGGAGTGGAGTGGMTGGAGAGTGATGGAGAGGAATGGAATGGMTGGM600[1277TGGMTGGAGTGGMTGGMTGGMTGGAGTGGMTGGMTGGMTGTAG650[1278AGGAGTGGAGTGGATTGGAGTGGAGTGGMTGGAGTGGMTAGAGTGAM700[1279TTTAGTGGAGTGTMTGGAGTGGAGTGGAGTGGCAGTTGAGTGGCATGGA750[1280TCAGGTGCAGTGGMTGGMTGGMTGGAGTGGAGTGGAGAGGAGTGGAG800[1281TGGMTCGMTGGMTGGCATGGAGTGGAGTGGMTGGAGTGGATTGGM850[1282TTGMTGCAGTGGMTGGMTGCMTGGAGTGGAGTGGAGTGCAGTGGAG900[1283TGGAGTGGAGGGGMTGGMTGGAGTGGAGTAAMTGGTTTGGMTGGAG950[1284TGGGGTGGMTGGAGTGGGTTGGMTGGAGTGGAGTGGAGTAGMCGGAG1000[1285TGATTGGGGTGGMTGGMTAGAGTGGMTGGMTGGAGTGGAGTGGAGT1050[1286AGMCGGAGTGATTGGAGTGGAATGGAATACAGTAGAGTGGAATGCAGTG1100[1287GAGTGGAATGGMTGGAGTGGAGTGGCATGGAMGGMTGGAGAGGAATG1150[1288GAATGGAATGGAATGGAATGGAATGGAATGGAATGGAATGGAACGGTGM1200[1289ATAAMTGTGAGTTMGATTGTGCCACTGCATTGCAGTCTGGGGGACAGA1250[1290GTGAGATACAGTCGAMTMAGGAATGGAAGGGACTGGAGTAGMTGGM1300
56TGGMTTGAG TGGAGTGGM TGGMTGMG TGGAGAGGAA TGGMTGGAG
TGGAATGCAA TGGAGG
(2) SEQ ID NO 44 的信息
(1)序列特征 (A)长度19 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 44 TGGCTCAGAC ACCTCATTG19
(2)SEQ ID NO 45 的信息
(1)序列特征 (A)长度21 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 45 CACCACTGTA TTCCCAGTTT G21
(2)SEQ ID NO 46 的信息
(1)序列特征 (A)长度22 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 46 CACTTGCCAT CCCTGCCACA CA22
(2)SEQ ID NO 47 的信息
(1)序列特征 (A)长度23 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 47 AGCGCACCCC CAATTTCCGG TAT23
(2)SEQ ID NO 48 的信息 (i)序列特征
(A)长度22 ⑶类型核酸 (C)链性单链
1350 1366[1330](D)拓扑学线性(xi)序列描述:SEQ ID NO 48 TGGGGACATG AACACACTTT GC22(2) SEQ ID NO 49 的信息(i)序列特征(A)长度22(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 49 GAGGCCCAGG ACCAGATGAA AT22(2) SEQ ID NO 50 的信息(i)序列特征(A)长度23(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 50 CACCTGTCAG GCAAGGCTTA AAC 23(2)SEQ ID NO :51 的信息(i)序列特征(A)长度24(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 51 CAACACTGAG CGCTTTTAGG GACT 24(2) SEQ ID NO 52 的信息(i)序列特征(A)长度丨4(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 52 TCAGGCAAGG CTTAAACAGG GATA 24(2) SEQ ID NO 53 的信息(i)序列特征(A)长度24(B)类型核酸[1369](C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 53 ACACTGAGCG CTTCTAGGGA CTTC 24 (2) SEQ ID NO 54 的信息(1)序列特征 (A)长度24 ⑶类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 54 TGAGCGCTTC TAGGGACTTC TTCA 24(2)SEQ ID NO 55 的信息(1)序列特征 (A)长度18 ⑶类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 55 CCCTGCCCTA CCCACTTG18(2)SEQ ID NO 56 的信息(1)序列特征 (A)长度18 (⑶类型核酸C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 56 AGGCCCAGGA CCAGATGA18(2)SEQ ID NO 57 的信息(1)序列特征 (A)长度24 ⑶类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 57 [1399] GCACCTGTCA GGCAAGGCTT AAAC 24(2)SEQ ID NO 58 的信息 (i)序列特征
[1402](A)长度22[1408](B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 58 CCAGCCATGA AGTGGCTGTG AG 22(2)SEQ ID NO :59 的信息(i)序列特征(A)长度22(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 59 CCCGCTTCAA AGTTCCCAGT TC 22(2)SEQ ID NO :60 的信息(i)序列特征(A)长度21(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 60 CCTCCCATTT CAGCCTCCTG A 21(2)SEQ ID NO :61 的信息(i)序列特征(A)长度24(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 61 GTCTGCCACA GTGCTGGAAA CTAA 24(2) SEQ ID NO 62 的信息⑴序列特征(A)长度21(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 62 GCACCCCAGC CTAAGGCAAT A 21(2) SEQ IDN0 63 的信息(i)序列特征1447](A)长度181448](B)类型核酸1449](C)链性单链1450](D)拓扑学线性1451](xi)序列描述:SEQ ID NO631452]GCATGGCGGA AGAAACAA1453](2)SEQID NO 64 的信息1454](i)序列特征1455](A)长度191456](B)类型核酸1457](C)链性单链1458](D)拓扑学线性1459](xi)序列描述:SEQ ID NO641460]TGGCAACAGA GCGAGACTC1461](2) SEQ ID NO 65 的信息1462](i)序列特征1463](A)长度211464](B)类型核酸1465](C)链性单链1466](D)拓扑学线性1467](xi)序列描述:SEQ ID NO651468]CCTGGGTGAC AGCGAGAATC T1469](2) SEQ ID NO 66 的信息1470](i)序列特征1471](A)长度241472](B)类型核酸1473](C)链性单链1474](D)拓扑学线性1475](xi)序列描述:SEQ ID NO661476]TGTCCCTTGC CTTGTCTCAC TAAA1477](2) SEQ ID NO 67 的信息1478](i)序列特征1479](A)长度211480](B)类型核酸1481](C)链性单链1482](D)拓扑学线性1483](xi)序列描述:SEQ ID NO671484]CAGCCTTGGT GACAGAGCAA A1485](2) SEQ ID NO 68 的信息[1486 [1487 [1488 [1489 [1490 [1491 [1492 [1493 [1494 [1495 [1496 [1497 [1498 [1499 [1500 [1501 [1502 [1503 [1504 [1505 [1506 [1507 [1508 [1509 [1510 [1511 [1512 [1513 [1514 [1515 [1516 [1517 [1518 [1519 [1520 [1521 [1522 [1523 [1524
1)序列特征
A)长度21
B)类型核酸
C)链性单链
D)拓扑学线性
xi)序列描述:SEQ ID NO 68 TGTGTTGAGG GTGGGGTACA T 21
2)SEQID NO 69 的信息
1)序列特征
A)长度18
B)类型核酸
C)链性单链
D)拓扑学线性
xi)序列描述:SEQ ID NO 69 CCTGGGCAAG AGAGCAAG18
2)SEQID NO 70 的信息
1)序列特征
A)长度21
B)类型核酸
C)链性单链
D)拓扑学线性
xi)序列描述:SEQ ID NO 70 CACATCCCAA AACCACCCTA C21
2)SEQID NO 71 的信息
1)序列特征
A)长度20
B)类型核酸
C)链性单链
D)拓扑学线性
xi)序列描述:SEQ ID NO 71 GCATTTCCCC TGCTTGTACT20
2)SEQID NO 72 的信息 i)序列特征
A)长度24
B)类型核酸
C)链性单链
D)拓扑学线性
xi)序列描述:SEQ ID NO 72 GATCACATTT GCTAACCACT TCTC 24[1525](2) SEQ ID NO 73 的信息(i)序列特征(A)长度26(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 73 GGCAACATAT CAAGACCCCC ATCTCT 26(2) SEQ ID NO 74 的信息(i)序列特征(A)长度丨6(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 74 GAAGCTGCCC CTCACCACTA CATTTT 26(2) SEQ ID NO 75 的信息(i)序列特征(A)长度24(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 75 GATCACATTT GCTAACCACT TCTC 24(2) SEQ ID NO 76 的信息(i)序列特征(A)长度24(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 76 TATAAATTAC CCAGTCTCAG GAAG 24(2) SEQ ID NO 77 的信息(i)序列特征(A)长度20(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 77
63GTGATACAGC AAGCCTCATC20
(2) SEQ ID NO 78 的信息
(1)序列特征 (A)长度24 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 78 AGAGACTCCT GGAAAGATAA AAGT 24
(2)SEQ ID NO 79 的信息
(1)序列特征 (A)长度23 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 79 GTCTGGAGAA CAGTGGCCCT TGT 23
(2)SEQ ID NO 80 的信息23
(1)序列特征 (A)长度24 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 80 CAGGAAGCTG AGGCAGGAGA ATCT 24
(2)SEQ ID NO 81 的信息
(1)序列特征 (A)长度18 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 81 AAGGCTCCAG TGGGGTAT18
(2)SEQ ID NO 82 的信息 (i)序列特征
(A)长度24 ⑶类型核酸
(C)链性单链
(D)拓扑学线性[1603(xi)序列描述:SEQ ID NO82 [1604AAAACAAGGC AGTAGTCAAT AAAG[1605(2) SEQ ID NO 83 的信息[1606(i)序列特征[1607(A)长度23[1608(B)类型核酸[1609(C)链性单链[1610(D)拓扑学线性[1611(xi)序列描述:SEQ ID NO83 [1612GGCATGAGAA TCGCTTGAAC CTG[1613(2) SEQ ID NO 84 的信息[1614(i)序列特征[1615(A)长度24[1616(B)类型核酸[1617(C)链性单链[1618(D)拓扑学线性[1619(xi)序列描述:SEQ ID NO84 [1620GG CCTCCATG ATGTTTCCAATGAT[1621(2) SEQ ID NO 85 的信息[1622(i)序列特征[1623(A)长度24[1624(B)类型核酸[1625(C)链性单链[1626(D)拓扑学线性[1627(xi)序列描述:SEQ ID NO85 [1628TCAGGAGGCA TGAGAATCGC TTGA[1629(2) SEQ ID NO 86 的信息[1630(i)序列特征[1631(A)长度24[1632(B)类型核酸[1633(C)链性单链[1634(D)拓扑学线性[1635(xi)序列描述:SEQ ID NO86 [1636GGCCTCCATG ATGTTTCCCA ATGA[1637(2) SEQ ID NO 87 的信息[1638(i)序列特征[1639(A)长度24[1640(B)类型核酸[1641(C)链性单链(D)拓扑学线性 (xi)序列描述:SEQ ID NO 87 CTCGCCCTCT CCTATAAGCA GTTT 24 (2) SEQ ID NO 88 的信息
(1)序列特征 (A)长度24 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 88 GCAGAGATAA TTTGGAGTGG GATG 24
(2)SEQ ID NO 89 的信息
(1)序列特征 (A)长度18 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 89 CTTGGGTGCC TGTAATCC18
(2)SEQ ID NO 90 的信息
(1)序列特征 (A)长度18 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 90 GGTAGAGCTC CCCCATCT18
(2)SEQ ID NO 91 的信息
(1)序列特征 (A)长度22 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 91 GCAGAATATT GGGGCTCATC AC 22
(2)SEQ ID NO 92 的信息 (i)序列特征
(A)长度24 ⑶类型核酸
66[1681](C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 92 AAACAAGGAA AGGAGAGGAG AGGA 24(2)SEQID NO 93 的信息⑴序列特征(A)长度23(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 93 AAGGTTGTGG GATGACTACT ACA 23(2) SEQ ID NO 94 的信息⑴序列特征(A)长度21(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 94 TGGTCAACAC AGCAAGACAT T21(2) SEQ ID NO 95 的信息(i)序列特征(A)长度22(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 95 TCCTGCCACC TGCTTGCTTT CT 22(2) SEQ ID NO 96 的信息(i)序列特征(A)长度23(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 96 ATTGCACTCC AGCCTGGGTGA TAC 23(2)SEQ ID NO :97 的信息(i)序列特征(A)长度20[1720](B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 97 CGCTTGAGCC TTGGAGATTG20(2) SEQ ID NO 98 的信息⑴序列特征(A)长度24(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 98 GAGCAGTCAG AATTCAGGAG TTGT 24(2) SEQ ID NO 99 的信息(i)序列特征(A)长度丨4(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 99 TGGGCAACAA GAGCAAAACT CCAT 24(2) SEQ ID NO 100 的信息(i)序列特征(A)长度23(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 100 GGGACTTGGG CTGAGGGCTT TAC23(2) SEQ ID NO 101 的信息(i)序列特征(A)长度24(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 101 ATATCAATAT CAGGCAGCCA CAGG 24(2) SEQ ID NO: 102 的信息(i)序列特征1759](A)长度23
1760](B)类型核酸
1761](C)链性单链
1762](D)拓扑学线性
1763](xi)序列描述:SEQ ID NO 102
1764]CCGTTTCAGA GCAGAGGTTT AGC 23
1765](2) SEQ ID NO 103 的信息
1766]⑴序列特征
1767](A)长度23
1768](B)类型核酸
1769](C)链性单链
1770](D)拓扑学线性
1771](xi)序列描述:SEQ ID NO 103
1772]TCTCATTGGT TTCAAAGAAC TTA 23
1773](2) SEQ ID NO 104 的信息
1774](i)序列特征
1775](A)长度23
1776](B)类型核酸
1777](C)链性单链
1778](D)拓扑学线性
1779](xi)序列描述:SEQ ID NO 104
1780]AGACTCCATC TCAAACAAAA GA 23
1781](2) SEQ ID NO 105 的信息
1782](i)序列特征
1783](A)长度24
1784](B)类型核酸
1785](C)链性单链
1786](D)拓扑学线性
1787](xi)序列描述:SEQ ID NO 105
1788]TCATGTGCAT GGAGCCTGGT TCAT 24
1789](2) SEQ ID NO 106 的信息
1790](i)序列特征
1791](A)长度23
1792](B)类型核酸
1793](C)链性单链
1794](D)拓扑学线性
1795](xi)序列描述:SEQ ID NO 106
1796]CCCAGCCTTG GCAAGAGTGA GGT 23
1797](2) SEQ ID NO 107 的信息[1798 [1799 [1800 [1801 [1802 [1803 [1804 [1805 [1806 [1807 [1808 [1809 [1810 [1811 [1812 [1813 [1814 [1815 [1816 [1817 [1818 [1819 [1820 [1821 [1822 [1823 [1824 [1825 [1826 [1827 [1828 [1829 [1830 [1831 [1832 [1833 [1834 [1835 [1836
1)序列特征
A)长度18
B)类型核酸
C)链性单链
D)拓扑学线性
xi)序列描述:SEQ ID NO 107 GGCGACTGAG CAAGACTC
2)SEQID NO 108 的信息
1)序列特征
A)长度22
B)类型核酸
C)链性单链
D)拓扑学线性
xi)序列描述:SEQ ID NO 108 TTAAGCAAAG TAGCCTCAAA CA
2)SEQID NO 109 的信息 i)序列特征
A)长度19
B)类型核酸
C)链性单链
D)拓扑学线性
xi)序列描述:SEQ ID NO 109
18
22
19
GGGCGACTGA GCAAGACTC 2)SEQ ID NO : 110 的信息
1)序列特征
A)长度24
B)类型核酸
C)链性单链
D)拓扑学线性
xi)序列描述:SEQ ID NO 110 ACTCATTACC TTGCATGCAT GATA 24
2)SEQID NO 111 的信息 i)序列特征
A)长度21
B)类型核酸
C)链性单链
D)拓扑学线性
xi)序列描述:SEQ ID NO 111 CATTACCTTG CATGCATGAT A 21(2) SEQ ID NO 112 的信息
(1)序列特征 (A)长度21 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 112 TGGGCAACAG AGTAAGACTC A21
(2)SEQ ID NO 113 的信息
(1)序列特征 (A)长度23 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 113 GTTCAGTACC GTTCACCTCT TTA23
(2)SEQ ID NO 114 的信息
(1)序列特征 (A)长度30 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 114 GTAAGACTCA GTCTCCAAAA AAAAAAAAAG 30
(2)SEQ ID NO 115 的信息
(1)序列特征 (A)长度38 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 115 AGGAATGGTT TCTCTGTTAG TAAATGGT 38
(2)SEQ ID NO 116 的信息 (i)序列特征
(A)长度24 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 116 CAGCCTGGGC AACAAGAATG AAAC (2) SEQ ID NO 117 的信息
(1)序列特征 (A)长度19 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 117 TGGCCCCTGC AGCGGAGTC
(2)SEQ ID NO : 118 的信息
(1)序列特征 (A)长度21 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 118 GAATTCATTT GCGGAAAGAT T
(2)SEQ ID NO : 119 的信息
(1)序列特征 (A)长度21 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ IDN0 119 CTAGGGAGGC TGGAGTATTC A
(2)SEQ ID NO 120 的信息
(1)序列特征 (A)长度20 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 120 AGAGCAAGAC CCCGTCTCAT
(2)SEQ ID NO : 121 的信息 (i)序列特征
(A)长度20 ⑶类型核酸
(C)链性单链
(D)拓扑学线性(xi)序列描述:SEQ ID NO 121 ; AGTCCATGGG CCTTTTAACA (2) SEQ ID NO 122 的信息
(1)序列特征
(A)长度23 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(ii)分子类型寡核苷酸ssDNA
(iii)假设否
(iv)立即来源
(B)扩增的克隆S125
(xi)序列描述:SEQ ID NO 122 ; GAGAATCACT TGAACCCAGG AAG
(2)SEQ ID NO 123 的信息
(1)序列特征 (A)长度24 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 123 ; AGAACCAGCT GTTAGTTTCG TTGA
(2)SEQ ID NO 124 的信息
(1)序列特征 (A)长度25 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 124 ; GGTTGCAGTG AGCCGAGATA AGAGT
(2)SEQ ID NO 125 的信息
(1)序列特征 (A)长度25 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 125 ; TGTGCCAGGA ACCAGAAATT TACAG
(2)SEQ ID NO 126 的信息[1954 [1955 [1956 [1957 [1958 [1959 [1960 [1961 [1962 [1963 [1964 [1965 [1966 [1967 [1968 [1969 [1970 [1971 [1972 [1973 [1974 [1975 [1976 [1977 [1978 [1979 [1980 [1981 [1982 [1983 [1984 [1985 [1986 [1987 [1988 [1989 [1990 [1991 [1992
(1)序列特征 (A)长度20 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 126 GGCCCAAGGT TACTTTTCAC20
(2)SEQ ID NO 127 的信息
(1)序列特征 (A)长度16 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 127 GGGCCACTGC ACTCCT16
(2)SEQ ID NO 128 的信息
(1)序列特征 (A)长度22 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 128 CATGGTGAGG CTGAAGTAGG AT22
(2)SEQ ID NO 129 的信息
(1)序列特征 (A)长度25 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 129 GTGGCGTGTC TTTTTACTTT CTTTA 25
(2)SEQ ID NO 130 的信息 (i)序列特征
(A)长度18 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 130 AGGCAGCCCA GGAACAAT18(2) SEQ ID NO 131 的信息
(1)序列特征 (A)长度22 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 131 CCAAGATAGC GGCCAAGATA GT22
(2)SEQ ID NO 132 的信息
(1)序列特征 (A)长度24 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 132 GAGGGCAGCT GGGATGTTAC TCTT 24
(2)SEQ ID NO 133 的信息
(1)序列特征 (A)长度24 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 133 TGCCCTGTTT GGAGAACTGT AGGT 24
(2)SEQ ID NO 134 的信息
(1)序列特征 (A)长度19 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 134 CTCCCCAGAA ACAGATGTA19
(2)SEQ ID NO 135 的信息 (i)序列特征
(A)长度20 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 135
75GTGAGCCGAG ATTGTATCAT20
(2) SEQ ID NO 136 的信息
(1)序列特征 (A)长度19 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 136 TCGGGGACAG GGCTTACTC19
(2)SEQ ID NO 137 的信息
(1)序列特征 (A)长度24 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 137 ATCATTGTCG CTGCTACTTT ATCG 24
(2)SEQ ID NO 138 的信息
(1)序列特征 (A)长度21 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 138 CTACTCTACC CCATTTCATT C21
(2)SEQ ID NO 139 的信息
(1)序列特征 (A)长度19 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 139 GTAGAGTGGAG TGGATGAGA19
(2)SEQ ID NO 140 的信息 (i)序列特征
(A)长度21 ⑶类型核酸
(C)链性单链
(D)拓扑学线性NO 140 ATCAGGCAAA AACGAACAAA C21
(2) SEQ ID NO 141 的信息
(1)序列特征 (A)长度17 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 141 CGGCATCCCA AAGTGAC17
(2)SEQ ID NO 142 的信息
(1)序列特征 (A)长度23 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 142 CAGAGAGGGCA GCACCTTGGA CAG 23
(2)SEQ ID NO 143 的信息23
(1)序列特征 (A)长度23 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 143 GGCTTCACCT GCTCCCGTTT CAG 23
(2)SEQ ID NO 144 的信息
(1)序列特征 (A)长度22 ⑶类型核酸
(C)链性单链
(D)拓扑学线性
(xi)序列描述:SEQ ID NO 144 TCTGCCCATT CCCCAGCCTC TC 22
(2)SEQ ID NO 145 的信息 (i)序列特征
(A)长度24 ⑶类型核酸 (C)链性单链[2110](D)拓扑学线性(xi)序列描述:SEQ ID NO 145 TACCGCGTGG CATTCAAGCA TAGC 24(2) SEQ ID NO 146 的信息(i)序列特征:(A)长度18(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 146 TCCAGTCTGG GTGACAAA18(2) SEQ ID NO 147 的信息(i)序列特征(A)长度20(B)类型核酸(C)链性单链(D)拓扑学线性(xi)序列描述:SEQ ID NO 147 CAATCCACTC CACTCCTCTA20
78
权利要求
检测具有低伪带假象出现率的靶中度串联重复DNA序列的方法,包括以下步骤(a)提供具有至少一个靶中度串联重复序列的DNA样品,其中靶中度串联重复序列是含有至少一个重复单位的DNA区域,该重复单位由至少串联重复2次的5,6或7碱基对的序列组成;(b)检测DNA样品中靶中度串联重复序列,其中观测到平均伪带假象不超过2.4%。
2.权利要求1的方法,其中靶中度串联重复序列是完全中度串联重复序列。
3.权利要求1的方法,其中靶中度串联重复序列是不完全中度串联重复序列。
4.权利要求1的方法,其中步骤(a)提供的DNA样品是人基因组DNA。
5.权利要求1的方法,其中步骤(a)提供的DNA样品的靶中度串联重复序列在步骤(b) 之前扩增。
6.权利要求5的方法,其中靶中度串联重复序列用至少一个寡核苷酸引物扩增,该引 物包括互补于并位于双链DNA标记的含有模板中度串联重复序列的区域的侧翼的序列,其 中模板中度串联重复序列是含有至少串联重复2次的重复单位序列的DNA标记的区域,条 件是DNA标记具有选自如下一组的序列SEQ ID NO 1, SEQ IDN0 :2,SEQ ID NO :3,SEQ ID NO :4,SEQ ID N0:5,SEQ IDN0:6,SEQ ID N0:7,SEQ ID N0:8,SEQ ID N0:9,SEQ IDNO :10, SEQ ID NO :11, SEQ ID NO -.12, SEQ ID NO :13,SEQID NO :14,SEQ ID NO :15,SEQ ID NO 16,SEQ ID NO :17, SEQ ID NO :18,SEQ ID NO ; 19,SEQ ID NO -.20, SEQ ID NO -.21, SEQ ID NO :22, SEQ ID NO :23,SEQ ID NO -.24, SEQ ID NO :25,SEQ ID NO -.26, SEQ ID NO -.27, SEQ ID NO :28, SEQ ID NO -.29, SEQ ID NO :30,SEQ ID NO :31,SEQ ID NO :32,SEQ ID NO :33, SEQ ID NO :34, SEQ ID NO :35,SEQ ID NO :36,SEQ ID NO -.37, SEQ ID NO :38,SEQ ID NO 39,SEQ ID NO -.40, SEQ ID NO :41,SEQ ID NO 42 和 SEQ ID NO :43。
7.权利要求6的方法,其中用于扩增靶中度串联重复序列的寡核苷酸引物具有与其共 价附着的荧光标记。
8.权利要求1的方法,通过将检测的靶中度串联重复序列与DNA大小标记中已知长度 的片段相对比,在步骤(b)中观测到伪带假象。
9.权利要求8的方法,其中观测到不超过1.的平均伪带。
10.一种检测DNA样品中至少一个靶中度串联重复序列的方法,其中靶中度串联重复 序列是含至少一个重复单位的DNA样品的一区域,该重复单位由至少串联重复2次的5,6 或7碱基对的序列组成,此方法包括以下步骤(a)提供至少一个寡核苷酸引物,该引物包括互补于并位于DNA标记的含有模板中度 串联重复序列的区域的侧翼的核苷酸序列,其中DNA标记具有选自如下一组的序列SEQ ID NO 1, SEQ ID NO :2, SEQ ID NO :3,SEQ ID NO :4,SEQ ID NO -.5, SEQ ID NO :6,SEQ ID NO 7,SEQ ID NO :8, SEQ ID NO -.9, SEQ ID NO :10,SEQ ID NO :11,SEQ ID NO -.12, SEQ ID NO 13,SEQ ID NO :14, SEQ ID NO :15,SEQ ID NO :16,SEQ ID NO -.17, SEQ ID NO :18,SEQ ID NO ; 19,SEQ ID NO -.20, SEQ ID NO -.21, SEQ ID NO :22,SEQ ID NO :23,SEQ ID NO -.24, SEQ ID NO :25, SEQ ID NO -.26, SEQ ID NO -.27, SEQ ID NO :28,SEQ ID NO -.29, SEQ ID NO :30, SEQ ID NO :31, SEQ ID NO :32,SEQ ID NO :33,SEQ ID NO :34,SEQ ID NO :35,SEQ ID NO 36,SEQ ID NO -.37, SEQ ID NO :38,SEQ ID NO :39,SEQ ID NO -.40, SEQ ID NO :41,SEQ ID NO 42 禾口 SEQ ID NO 43 ;(b)提供一含有靶中度串联重复序列的DNA样品;(c)用所述的至少一个寡核苷酸引物扩增DNA样品的靶中度重复序列;和(d)检测扩增的靶中度串联重复序列中的多态性。
11.权利要求10的方法,其中步骤(b)中提供的DNA样品是人基因组DNA样品。
12.权利要求10的方法,其中靶中度串联重复序列是完全中度串联重复。
13.权利要求10的方法,其中靶中度串联重复序列是不完全中度串联重复。
14.权利要求10的方法,其中步骤(a)中提供的寡核苷酸引物包括选自如下一组的序列SEQ ID NO 44 和 SEQ ID NO :45,当 DNA 标记序列是 SEQ IDN0 :1 时; SEQ ID NO 46, SEQ ID NO :47,SEQ ID NO :48,SEQ ID NO :49,SEQ ID NO NO :51, SEQ ID NO :52,SEQ ID NO :53,SEQ ID NO :54,SEQ ID NO :55,SEQ ID ID NO :57, SEQ ID NO :58,当 DNA 标记序列是 SEQ ID NO :2 时;:50, SEQ ID NO :56, SEQSEQ ID NO :59, SEQIDNOSEQ ID NO :61,SEQIDNOSEQ ID NO:63, SEQIDNOSEQ ID NO :65,SEQIDNOSEQ ID NO:67, SEQIDNOSEQ ID NO :69, SEQIDNOSEQ ID NO :71, SEQIDNOSEQ ID NO :73, SEQIDNOSEQ ID NO :75, SEQIDNOSEQ ID NO :77, SEQIDNOSEQ ID NO :79, SEQIDNOSEQ ID NO :81,SEQIDNOSEQ ID NO:83, SEQIDNOSEQ ID NO :85,SEQIDNOSEQ ID NO:87, SEQIDNOSEQ ID NO :89, SEQIDNOSEQ ID NO :91, SEQIDNO ID NO : 19 时; SEQ ID NO SEQ ID NO SEQ ID NO SEQ ID NO SEQ ID NO SEQ ID NO SEQ ID NO:60,当DNA标记序列是SEQ IDN0 3时 :62,当DNA标记序列是SEQ IDN0 4时 :64,当DNA标记序列是SEQ IDN0 5时 :66,当DNA标记序列是SEQ IDN0 6时 :68,当DNA标记序列是SEQ IDN0 7时 :70,当DNA标记序列是SEQ IDN0 8时 :72,当DNA标记序列是SEQ IDN0 9时 :74,当DNA标记序列是SEQ IDN0 10时 :76,当DNA标记序列是SEQ IDN0 :11时 :78,当DNA标记序列是SEQ IDN0 :12时 :80,当DNA标记序列是SEQ IDN0 13时 :82,当DNA标记序列是SEQ IDN0 14时 :84,当DNA标记序列是SEQ IDN0 15时 :86,当DNA标记序列是SEQ IDN0 16时 :88,当DNA标记序列是SEQ IDN0 17时 :90,当DNA标记序列是SEQ IDN0 18时 :92,SEQ ID NO :93,SEQ ID NO :94,当 DNA 标记序列是 SEQ95, SEQ ID NO :96,当 DNA 标记序列是 SEQ IDN0 :20 时; :97, SEQ ID NO :98,当 DNA 标记序列是 SEQ IDN0 :21 时; :99, SEQ ID NO :100,当 DNA 标记序列是 SEQ IDN0 22 时; :101, SEQ ID NO :102,当 DNA 标记序列是 SEQ IDN0 23 时 :103, SEQ ID NO :104,当 DNA 标记序列是 SEQ IDN0 24 时 :105, SEQ ID NO :106,当 DNA 标记序列是 SEQ IDN0 25 时 :107, SEQ ID NO :108, SEQ ID NO :109,SEQ IDN0 :110,SEQ ID NO :111,当 DNA标记序列是SEQ ID NO : 26时;SEQ ID NO: 112,SEQ ID NO: 113,SEQ ID NO : 114,SEQ IDN0 :115,当 DNA 标记序列是SEQ ID NO 27 时;SEQIDNO:116,SEQIDNO■Ml,当DNA标记序列是SEQIDN028时SEQIDNO:118,SEQIDNO:119,当DNA标记序列是SEQIDNO29时SEQIDNO:120,SEQIDNO:121,当DNA标记序列是SEQIDNO30时SEQIDNO:122,SEQIDNO:123,当DNA标记序列是SEQIDNO31时SEQIDNO:124,SEQIDNO:125,当DNA标记序列是SEQIDNO32时SEQIDNO:126,SEQIDNO:127,当DNA标记序列是SEQIDNO33时SEQIDNO:128,SEQIDNO:129,当DNA标记序列是SEQIDNO34时SEQIDNO:130,SEQIDNO:131,当DNA标记序列是SEQIDNO35时SEQIDNO:132,SEQIDNO:133,当DNA标记序列是SEQIDNO36时SEQIDNO:134,SEQIDNO:135,当DNA标记序列是SEQIDNO37时SEQIDNO:136,SEQIDNO:137,当DNA标记序列是SEQIDNO38时SEQIDNO:138,SEQIDNO:139,当DNA标记序列是SEQIDNO39时SEQIDNO:140,SEQIDNO:141,当DNA标记序列是SEQIDNO40时SEQIDNO:142,SEQIDNO:143,当DNA标记序列是SEQIDNO41时SEQIDNO=144,SEQIDNO:145,当DNA标记序列是SEQIDNO42时SEQIDNO:146,SEQIDNO:147,当DNA标记序列是SEQIDNO43时。
15.一种检测DNA样品中至少一个靶中度串联重复序列的试剂盒,其中靶中度串联重 复序列是DNA样品的一区域,其含有至少一个由至少串联重复2次的5,6或7碱基对的序 列组成的重复单位,该试剂盒包括一种容器,其具有至少一个用于扩增所述至少一个靶中度串联重复序列的寡核苷酸引 物,其中寡核苷酸引物包括互补于并位于双链DNA标记的含有模板中度串联重复序列的区 域的侧翼的核苷酸序列,该模板中度串联重复序列包括至少串联重复2次的重复单位,其 中 DNA 标记具有选自如下一组的序列:SEQ ID NO :1,SEQ ID NO :2,SEQ ID NO :3,SEQ ID NO :4, SEQ ID NO -.5, SEQ ID NO :6,SEQ ID NO -.7, SEQ ID NO :8,SEQ ID NO -.9, SEQ ID NO 10,SEQ ID NO :11, SEQ ID NO -.12, SEQ ID NO :13,SEQ ID NO :14,SEQ ID NO :15,SEQ ID NO :16, SEQ ID NO -.17, SEQ ID NO :18,SEQ ID NO ; 19,SEQ ID NO -.20, SEQ ID NO -.21, SEQ ID NO :22, SEQ ID NO :23,SEQ ID NO -.24, SEQ ID NO :25,SEQ ID NO -.26, SEQ ID NO -.27, SEQ ID NO :28, SEQ ID NO -.29, SEQ ID NO :30,SEQ ID NO :31,SEQ ID NO :32,SEQ ID NO 33,SEQ ID NO :34,SEQ ID NO :35,SEQ ID NO :36,SEQ ID NO -.37, SEQ ID NO :38,SEQ ID NO :39, SEQ ID NO -.40, SEQ ID NO :41,SEQ ID NO 42 和 SEQ ID NO :43。
16.权利要求15的试剂盒,还包括一DNA标记。
17.一种寡核苷酸引物,其包括互补于双链DNA标记的一条链的位于模板中度串联重 复序列的侧翼的序列,其中该模板中度串联重复序列是双链DNA标记的含有至少一个由至 少串联重复2次的5、6或7碱基对序列组成的重复单位的区域,其中双链DNA标记序列选 自如下一组含有互补于双链DNA标记侧翼模板中度串联序列的链的序列的,SEQ ID NO 1,SEQ ID NO 2, SEQ ID NO :3,SEQID NO :4,SEQ ID NO -.5, SEQ ID NO :6,SEQ ID NO -.7, SEQ IDNO :8, SEQ ID NO -.9, SEQ ID NO :10,SEQ ID NO :11,SEQ IDNO -.12, SEQ ID NO :13, SEQ ID NO :14, SEQ ID NO :15,SEQID NO :16,SEQ ID NO -.17, SEQ ID NO :18,SEQ ID NO ;`19,SEQ ID NO :20, SEQ ID NO -.21, SEQ ID NO :22,SEQ ID NO :23,SEQ ID NO -.24, SEQ ID NO :25, SEQ ID NO 26 和 SEQ ID NO :27。
18.权利要求17的寡核苷酸引物,其中该寡核苷酸引物包括选自如下一组的序列 SEQ ID NO 44 和 SEQ ID NO 45,当 DNA 标记序列是 SEQ IDN0 :1 时; SEQ ID NO 46, SEQ ID NO -.47, SEQ ID NO :48,SEQ ID NO -.49, SEQ ID NO :50, SEQ ID NO :51, SEQ ID NO :52,SEQ ID NO :53,SEQ ID NO :54,SEQ ID NO :55,SEQ ID NO :56,SEQ ID NO :57, SEQ ID NO :58,当 DNA 标记序列是 SEQ ID NO :2 时;SEQIDNO:59,SEQIDNO:60,当DNA标记序列是SEQIDNO3时;SEQIDNO:61,SEQIDNO:62,当DNA标记序列是SEQIDNO4时;SEQIDNO:63,SEQIDNO:64,当DNA标记序列是SEQIDNO5时;SEQIDNO:65,SEQIDNO:66,当DNA标记序列是SEQIDNO6时;SEQIDNO:67,SEQIDNO:68,当DNA标记序列是SEQIDNO7时;SEQIDNO:69,SEQIDNO:70,当DNA标记序列是SEQIDNO8时;SEQIDNO=71,SEQIDNO:72,当DNA标记序列是SEQIDNO9时;SEQIDNO:73,SEQIDNO=74,当DNA标记序列是SEQIDNO10时;SEQIDNO:75,SEQIDNO:76,当DNA标记序列是SEQIDNO11时;SEQIDNO=77,SEQIDNO:78,当DNA标记序列是SEQIDNO12时;SEQIDNO:79,SEQIDNO:80,当DNA标记序列是SEQIDNO13时;SEQIDNO:81,SEQIDNO:82,当DNA标记序列是SEQIDNO14时;SEQIDNO:83,SEQIDNO:84,当DNA标记序列是SEQIDNO15时;SEQIDNO:85,SEQIDNO:86,当DNA标记序列是SEQIDNO16时;SEQIDNO:87,SEQIDNO:88,当DNA标记序列是SEQIDNO17时;SEQIDNO:89,SEQIDNO:90,当DNA标记序列是SEQIDNO18时;SEQIDNO:91,SEQIDNO:92,SEQ ID NO 93, SEQ IDNO : 94,当DNA标记序列是SEQJO :19 时;SEQIDNO:95,SEQIDNO:96,当DNA标记序列是SEQ IDNO20时;SEQIDNO:97,SEQIDNO:98,当DNA标记序列是SEQ IDNO21时;SEQIDNO:99,SEQIDNO=100,当DNA标记序列是SEQ IDNO22 时;SEQ ID NO :101, SEQ ID NO -.102,当 DNA 标记序列是 SEQ IDNO 23 时; SEQ ID NO :103, SEQ ID NO :104,当 DNA 标记序列是 SEQ IDNO 24 时; SEQ ID NO :105, SEQ ID NO :106,当 DNA 标记序列是 SEQ IDNO 25 时; SEQ ID NO :107, SEQ ID NO :108,SEQ ID NO :109,SEQ IDNO : 110,SEQ ID NO :111,当 DNA标记序列是SEQ ID NO : 26时;SEQ ID NO :112, SEQ ID NO :113, SEQ ID NO :114,SEQ IDNO : 115,当 DNA 标记序列是 SEQ ID NO 27 时。
全文摘要
本发明涉及鉴别和分析DNA中中度串联重复序列的物质和方法,其中中度串联重复(ITR)序列是DNA序列的一个区域,其含有至少一个串联出现至少两次的5-7个碱基重复单位。用本发明的物质和方法的特别优选的实施方案鉴别和分析了人类基因组中高多态ITR基因座的DNA标记。
文档编号C12N15/11GK101857895SQ200910164448
公开日2010年10月13日 申请日期1999年2月4日 优先权日1998年2月4日
发明者杰弗里·W·巴彻, 詹姆斯·W·舒姆 申请人:普罗梅加公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1