方法与流程

文档序号:11446231阅读:494来源:国知局
方法与流程
本发明涉及一种修饰模板双链多核苷酸的方法,特别是使用纳米孔测序进行表征的方法。该方法从模板产生多个经修饰的双链多核苷酸。然后可以表征这些经修饰的多核苷酸。
背景技术
:存在许多需要制备核酸库的商业情况。这通常使用转座酶来实现。根据用于制备所述库的转座酶,在能够使用所述库之前,例如在测序中,可能需要在体外修复转座事件。目前需要在广泛的应用中快速且便宜的多核苷酸(例如dna或rna)测序和鉴定技术。现有技术是缓慢且昂贵的,主要是因为它们依赖于扩增技术来生产大量的多核苷酸,并且需要大量专门的荧光化学品用于信号检测。跨膜孔(纳米孔)具有作为聚合物和各种小分子的直接电生物传感器的巨大潜力。特别是,最近已经重点将纳米孔作为潜在的dna测序技术。当跨纳米孔施加电位时,当诸如核苷酸等的分析物瞬间驻留在桶中达一段时间时,存在电流的变化。核苷酸的纳米孔检测给出了已知识别标识(signature)和持续时间的当前的变化。在链测序方法中,单个多核苷酸链通过孔,得到核苷酸的身份。链测序可涉及使用多核苷酸结合蛋白质来控制多核苷酸通过孔的运动。技术实现要素:发明人惊奇地证明可以修饰模板双链多核苷酸以产生多个更短的经修饰的双链多核苷酸。经修饰的双链多核苷酸可以包括例如发夹环或单链前导序列。这些修饰可以被设计成使得经修饰的双链多核苷酸各自比原始模板多核苷酸更容易表征,例如通过链测序。经修饰的多核苷酸的随后的表征允许更容易确定模板多核苷酸的特征。本发明的修饰方法使用mua转座酶、mua底物群和聚合酶,并总结在图1中。mua底物包含相对链上的突出端和发夹环。mua转座酶能够使模板多核苷酸片段化,并在两端产生具有突出端的片段。mua转座酶还能够将底物在双链片段的一端或两端连接到突出端。没有突出端的底物的链通常用突出端连接到片段的链上。这在所得双链构建体中留下单链间隙。双链构建体还具有在与间隙相对的链上的发夹环。该聚合酶能够使用包含发夹环的链作为模板并且移位含有单链间隙的链。所得的双链构建体含有包含模板多核苷酸的片段的两条互补链。该构建体中的两条链可以分离,并优选同时用作模板,以产生包含模板多核苷酸的片段的两个双链构建体,其中两条链通过发夹环连接。因此,本发明提供了一种修饰模板双链多核苷酸的方法,其包括:(a)使模板多核苷酸与mua转座酶和双链mua底物群接触,双链mua底物群中的每个包括(i)至少一个突出端和(ii)与包括至少一个突出端的链相对的链中的至少一个发夹环,使得转座酶将所述模板多核苷酸片段化并将底物连接到双链片段的一端或两端,并且从而产生多个片段/底物构建体;(b)使所述片段/底物构建体与聚合酶接触,使得所述聚合酶置换包括突出端的链,并用与包括发夹环的链互补的链替换它们,从而产生多个双链构建体,每个所述双链构建体包括模板多核苷酸的双链片段;和(c)分离双链构建体的两条链,并使用所述链作为模板以形成多个经修饰的双链多核苷酸,每个所述经修饰的双链多核苷酸包括由至少一个发夹环连接的两条互补链。本发明还提供:-使用本发明的方法制备的多个经修饰的双链多核苷酸;-一种用于修饰模板多核苷酸的双链多核苷酸mua底物群,其中所述底物如以上定义;-一种表征使用本发明的方法修饰的至少一种多核苷酸的方法,其包括:a)使经修饰的多核苷酸与跨膜孔接触,使得多核苷酸的至少一条链移动通过孔;和b)当至少一条链相对于孔移动时获取一个或多个测量值,其中所述测量值指示所述至少一条链的一个或多个特征,并从而表征所述经修饰的多核苷酸;-一种表征模板多核苷酸的方法,包括:a)使用本发明的方法修饰模板多核苷酸,以产生多个经修饰的多核苷酸;b)使每个经修饰的多核苷酸与跨膜孔接触,使得每个多核苷酸的至少一条链移动通过孔;和c)当每个多核苷酸相对于孔移动时获取一个或多个测量值,其中所述测量值指示每个多核苷酸的一个或多个特征,从而表征模板多核苷酸;以及-一种用于修饰模板双链多核苷酸的试剂盒,其包括(a)如以上定义的mua底物群,(b)mua转座酶和(c)聚合酶。附图说明图1示出了修饰模板双链多核苷酸(标记为a)的方法的卡通表示。步骤1涉及使模板双链多核苷酸与mua转座酶(标记为b)以及双链mua底物群(标记为c,双链mua底物均含有5′发夹环)接触,使得mua转座酶将模板双链多核苷酸片段化,并将mua底物在分裂点的每一侧插入。步骤2涉及用聚合酶(标记为e)和dntp处理模板链,dntp替换标记为d的dna片段并产生与dna5′发夹环互补的链。步骤3涉及对标记为f的双链dna构建体的热处理,使得所述链变性成单链dna(标记为g)。最后,步骤4涉及形成互补链的dna聚合酶。图2示出了修饰实施例1中概述的模板双链多核苷酸(标记为a)的方法的卡通表示。步骤1涉及使模板双链多核苷酸与mua转座酶(标记为b)以及双链mua底物群(标记为c,双链mua底物均含有5′发夹环)接触,使得mua转座酶将模板双链多核苷酸片段化,并将mua底物在分裂点的每一侧插入。步骤2涉及用聚合酶(标记为e)和dntp处理模板链,dntp替换标记为d的dna片段并产生对于dna5′发夹环的互补链。步骤3涉及标记为f的双链dna构建体的热处理,使得所述链变性成单链dna(标记为g)。步骤4涉及用形成互补链的dna聚合酶进行的第二次处理。最后,步骤5涉及步骤4中产生的双链dna构建体的da-拖尾(da-tailing)、具有酶(标记为h)预先结合的适配器的连接,以及含有胆固醇系链(标记为j)的dna链(标记为i)的杂交。这产生了在实施例1中描述的纳米孔系统中被测试的最终dna构建体。图3示出了当解旋酶(t4dda-e94c/c109a/c136a/a360c(seqidno:24具有突变e94c/c109a/c136a/a360c))控制dna样品6通过mspa纳米孔易位时的示例性电流迹线(y轴坐标=电流(pa),x轴坐标=时间(s))。图4示出了agilent12,000dna芯片迹线。标记为1的线是未处理的mua片段化dna输入材料,标记为2的线是具有68℃培育步骤(在实施例1的1.2中)的分析物,并且随后经历了实施例1的步骤1.3的全部,标记为3的线在实施例1的步骤1.2中没有68℃培育但是经历了实施例1的步骤1.3的全部。区域x对应于双链dna库,区域y对应于agilent12,000的上标记并且区域z对应于agilent12,000芯片的下标记。图5示出了修饰模板双链多核苷酸(标记为a)的优选方法的卡通表示。除了每个底物包含通过间隔基(spacer)(xxx;标记为h)与发夹环分离的前导序列(标记为i)之外,图5与图1相同。引导序列不用作模板,因为聚合酶(标记为e)不能移动通过间隔基。图6示出了当解旋酶(t4dda-e94c/c109a/c136a/a360c)控制dna样品7通过mspa纳米孔易位时的示例性电流迹线(y轴坐标=电流(pa),x轴坐标=时间(s))。图7示出了修饰模板双链多核苷酸(标记为a)的方法的卡通表示。步骤1涉及使模板双链多核苷酸与mua转座酶(标记为b)以及双链mua底物群(标记为c,其中双链mua底物均含有5′发夹环,其在替换g/c’s的发夹(标记为h并且显示为黑色圆圈)中含有i/z′s)接触,使得mua转座酶将模板双链多核苷酸片段化,并将mua底物在分裂点的每一侧插入。步骤2涉及用聚合酶(标记为e)和dntp处理模板链,dntp替换标记为d的dna片段并产生对于dna5′发夹环的互补链(产生的dsdna标记为f)。由聚合酶形成的双链区域(标记为1x)由均能够形成发夹环的两条链组成。由链f2形成的发夹环具有比双链区域1x的tm更高的tm,这是因为链f2的发夹环由c/t/a/g组成,并且双链区域1x是链f2杂交至链f1,其中链f1由z/t/a/i组成(并且z和i仅形成两个氢键,而c/g形成3个氢键)。因此,f2形成发夹环(标记为f2h),并且f1形成发夹环(标记为f1h),由链f1形成的发夹环具有比由链f2形成的发夹环更高的tm。然后dna聚合酶能够产生以虚线/点线显示的互补链(标记为i1和i2的整个dsdna构建体)。因此,聚合酶能够形成互补链(如虚线/点线所示),而不需要加热在步骤2中产生的dsdna(并且标记为f1,其与f2杂交)。图8示出了本发明的优选方法的卡通表示。步骤1至4与图1中相同。步骤5涉及向图1中形成的构建体添加发夹环。步骤6涉及修饰的双链多核苷酸的热处理,使得所述链变性成单链构建体。最后,步骤7涉及形成互补链的dna聚合酶。序列表说明seqidno:1示出了对ms-b1突变体mspa单体进行编码的密码子优化的多核苷酸序列。该突变体缺乏信号序列并且包括以下突变:d90n,d91n,d93n,d118r,d134r和e139k。seqidno:2示出了mspa单体的ms-b1突变体的成熟形式的氨基酸序列。该突变体缺乏信号序列并且包括以下突变:d90n,d91n,d93n,d118r,d134r和e139k。seqidno:3示出了对α-溶血素-e111n/k147n(α-hl-nn;stoddart等人,pnas,2009;106(19):7702-7707)的1种单体进行编码的多核苷酸序列。seqidno:4示出了α-hl-nn的1种单体的氨基酸序列。seqidno:5至7示出了mspb,c和d的氨基酸序列。seqidno:8示出了对phi29dna聚合酶进行编码的多核苷酸序列。seqidno:9示出了phi29dna聚合酶的氨基酸序列。seqidno:10示出了由来自大肠杆菌的sbcb基因得到的密码子优化的多核苷酸序列。它编码来自大肠杆菌的核酸外切酶i酶(ecoexoi)。seqidno:11示出了来自大肠杆菌的核酸外切酶i酶(ecoexoi)的氨基酸序列。seqidno:12示出了由来自大肠杆菌的xtha基因得到的密码子优化的多核苷酸序列。它编码来自大肠杆菌的核酸外切酶iii酶。seqidno:13示出了来自大肠杆菌的核酸外切酶iii酶的氨基酸序列。该酶在3′-5′方向上从双链dna(dsdna)的一条链进行5′单磷酸核苷的分布消化。链上的酶引发需要约4个核苷酸的5′突出端。seqidno:14示出了由来自嗜热栖热菌(t.thermophilus)的recj基因衍生的密码子优化的多核苷酸序列。它编码来自嗜热栖热菌的recj酶(tthrecj-cd)。seqidno:15示出了来自嗜热栖热菌的recj酶(tthreej-cd)的氨基酸序列。该酶在5′-3′方向上从ssdna进行5′单磷酸核苷的进行性消化(processivedigestion)。链上的酶引发需要至少4个核苷酸。seqidno:16示出了由噬菌体λexo(redx)基因衍生的密码子优化的多核苷酸序列。它编码细菌噬菌体λ核酸外切酶。seqidno:17示出了细菌噬菌体λ核酸外切酶的氨基酸序列。所述序列是组装成三聚体的三个相同的亚基之一。该酶在5′-3′方向从dsdna的一条链进行核苷酸的高度进行性消化(http://www.neb.com/nebecomm/products/productm0262.asp)。链上的酶引发优选需要约4个具有5′磷酸的核苷酸的5′突出端。seqidno:18示出了hel308mbu的氨基酸序列。seqidno:19示出了he1308csy的氨基酸序列。seqidno:20示出了he1308tga的氨基酸序列。seqidno:21示出了he1308mhu的氨基酸序列。seqidno:22示出了traieco的氨基酸序列。seqidno:23示出了xpdmbu的氨基酸序列。seqidno:24示出了dda1993的氨基酸序列。seqidno:25示出了trwccba的氨基酸序列。seqidno:26至28示出了本发明优选的mua底物的序列。seqidno:29示出了实施例1中使用的多核苷酸序列。seqidno:30示出了实施例1中使用的多核苷酸序列。该序列在其5′末端连接有下列多核苷酸序列——gatcu。seqidno:31示出了实施例1中使用的肠杆菌噬菌体λ的多核苷酸序列。该序列包含连接在模板链5′末端的另外的12碱基突出端。此处示出的序列仅为模板链的序列(模板互补体未示出)。seqidno:32示出了实施例1中使用的多核苷酸序列。seqidno:33示出了实施例1中使用的多核苷酸序列。seqidno:34示出了实施例1中使用的多核苷酸序列。seqidno:35示出了实施例1中使用的多核苷酸序列。seqidno:36示出了实施例2中使用的多核苷酸序列。seqidno:37示出了实施例2中使用的多核苷酸序列。具体实施方式应当理解,所公开的产品和方法的不同应用可以根据本领域的具体需要进行调整。还应当理解,本文使用的术语仅用于描述本发明的具体实施方案的目的,而不是限制性的。此外,除非另有明确规定,在本说明书和所附权利要求书中使用的单数形式“一个”,“一种”和“该”包括复数指示物。因此,例如,提及“一个多核苷酸”时包括“多个多核苷酸”,提及“一个底物”时包括两个或更多个这样的底物,提及“一个跨膜蛋白孔”时包括两个或更多个这样的孔,等。本文引用的所有出版物、专利和专利申请,无论是上文还是下文中,均通过整体引用并入本文。本发明的修饰方法本发明提供了修饰模板多核苷酸的方法。可以为任何目的修饰模板。该方法优选用于修饰用于表征例如用于链测序的模板多核苷酸。模板多核苷酸通常是根据本发明最终将被表征或测序的多核苷酸。这将在下面更详细地讨论。该方法涉及形成多个修饰的双链多核苷酸。这些修饰的双链多核苷酸通常比模板多核苷酸更容易表征,特别是使用链测序进行表征。所述多个修饰的双链多核苷酸自身可以被表征,以便于表征模板多核苷酸。例如,可以通过测序每个修饰的双链多核苷酸来确定模板多核苷酸的序列。修饰的双链多核苷酸通常比模板多核苷酸短,因此使用链测序来表征它们是更容易的。修饰的双链多核苷酸还包括如下所述的信息量的两倍。可以通过将标记包含在mua底物中来选择性地标记修饰的双链多核苷酸。合适的标记包括但不限于校准序列,偶联部分和适配器结合的酶。在一些实施方案中,该方法引入双链多核苷酸修饰中,这有助于使用链测序对其进行表征。众所周知,将多核苷酸偶联到含有纳米孔的膜中使得多核苷酸的量——允许其表征或测序所需的量——降低了几个数量级。这在申请号为pct/gb2012/051191(公开为wo2012/164270)的国际申请中进行了讨论。本发明的方法允许生产多个双链多核苷酸,每个双链多核苷酸包括将多核苷酸偶联到膜上的装置。这将在下面更详细地讨论。使用纳米孔表征双链多核苷酸通常需要存在设计成优先螺旋进入纳米孔的前导序列。本发明的方法允许生产多个双链多核苷酸,每个双链多核苷酸包括单链前导序列。这将在下面更详细地讨论。还已经确定的是,通过诸如发夹环的桥接部分连接双链多核苷酸的两条链使得所述多核苷酸的两条链通过纳米孔进行表征或测序。这是有利的,因为它使得从单个双链多核苷酸获得的信息量加倍。此外,由于模板互补链中的序列必然与模板链的序列正交,所以来自两条链的信息可以进行信息组合。因此,该机制提供了正交校验能力,提供更高置信度观察结果。这在申请号为pct/gb2012/051786(公开为wo2013/014451)的国际申请中进行了讨论。本发明的方法允许产生多个修饰的双链多核苷酸,其中每个多核苷酸的两条链使用发夹环连接。模板多核苷酸本发明的方法修饰模板双链多核苷酸,优选用于表征。模板多核苷酸通常是根据本发明最终将被表征或测序的多核苷酸。它也可以称为目标双链多核苷酸或感兴趣的双链多核苷酸。多核苷酸,例如核酸,是包含两个或多个核苷酸的大分子。多核苷酸或核酸可以包含任何核苷酸的任何组合。核苷酸可以是天然存在的或人造的。多核苷酸中的一个或多个核苷酸可被氧化或甲基化。多核苷酸中的一个或多个核苷酸可被损坏。例如,多核苷酸可以包含嘧啶二聚体。这种二聚体通常与紫外线的损伤相关,并且是皮肤黑色素瘤的主要原因。可以修饰多核苷酸中的一个或多个核苷酸,例如用标记或标签进行修饰。合适的标记如下所述。多核苷酸可以包含一个或多个间隔基。核苷酸通常含有核碱基、糖和至少一个磷酸基团。核碱基和糖形成核苷。核碱基通常是杂环的。核碱基包括但不限于嘌呤和嘧啶,并且更具体地包括腺嘌呤(a)、鸟嘌呤(g)、胸腺嘧啶(t)、尿嘧啶(u)和胞嘧啶(c)。糖通常是戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。糖优选为脱氧核糖。多核苷酸优选包含以下核苷:脱氧腺苷(da)、脱氧尿苷(du)和/或胸苷(dt),脱氧鸟苷(dg)和脱氧胞苷(dc)。核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有一磷酸盐、二磷酸盐或三磷酸盐。核苷酸可以包含多于三个的磷酸盐,例如4或5个磷酸盐。磷酸盐可以连接在核苷酸的5′或3′侧上。核苷酸包括但不限于腺苷单磷酸(amp)、鸟苷单磷酸(gmp)、胸苷单磷酸(tmp)、尿苷单磷酸(ump)、5-甲基胞苷单磷酸,5-羟甲基胞苷单磷酸、胞苷单磷酸(cmp)、环状腺苷单磷酸(camp)、环状鸟苷单磷酸(cgmp)、脱氧腺苷单磷酸(damp)、脱氧鸟苷单磷酸(dgmp)、脱氧胸苷单磷酸(dtmp)、脱氧尿苷单磷酸(dump)、脱氧胞苷单磷酸(dcmp)和脱氧甲基胞苷单磷酸。核苷酸优选地选自amp,tmp,gmp,cmp,ump,damp,dtmp,dgmp,dcmp和dump。核苷酸可以是脱碱基的(即缺少核碱基)。核苷酸也可以缺少核碱基和糖(即c3间隔基)。多核苷酸中的核苷酸可以以任何方式彼此连接。核苷酸通常通过其糖和磷酸酯基团连接,如核酸中一样。核苷酸可以通过其核碱基连接,如嘧啶二聚体中一样。多核苷酸是双链的。多核苷酸的至少一部分优选是双链的。多核苷酸可以是核酸,例如脱氧核糖核酸(dna)或核糖核酸(rna)。多核苷酸可以包含与dna的一条链杂交的一条rna链。多核苷酸可以是本领域已知的任何合成核酸,例如肽核酸(pna)、甘油核酸(gna)、苏糖核酸(tna)、锁定核酸(lna)或具有核苷酸侧链的其他合成聚合物。pna骨架由通过肽键连接的重复的n-(2-氨基乙基)-甘氨酸单元组成。gna骨架由通过磷酸二酯键连接的重复的二醇单元组成。tna骨架由通过磷酸二酯键连接在一起的重复的苏糖组成。lna由如上所述的核糖核苷酸形成,所述核糖核苷酸具有连接核糖部分中的2′氧和4′碳的额外的桥。多核苷酸最优选为核糖核酸(rna)或脱氧核糖核酸(dna)。多核苷酸可以是任何长度。例如,多核苷酸的长度可以是至少10个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个或至少500个核苷酸或核苷酸对。多核苷酸的长度可以是1000个或更多个核苷酸或核苷酸对、5000个或更多个核苷酸或核苷酸对或者100000个或更多个核苷酸或核苷酸对。可以使用本发明研究任何数目的多核苷酸。例如,本发明可能涉及表征2,3,4,5,6,7,8,9,10,20,30,51,100或更多个多核苷酸。如果两个或更多个多核苷酸被表征,它们可以是不同的多核苷酸或同一种多核苷酸的两个实例。多核苷酸可以是天然存在的或人造的。例如,该方法可以用于验证制造的寡核苷酸的序列。该方法通常在体外进行。模板多核苷酸通常存在于任何合适的样品中。本发明通常针对已知含有或怀疑含有模板多核苷酸的样品进行。或者,本发明可以针对样品进行,以确认一种或多种已知或预期在样品中存在的模板多核苷酸的身份。样品可以是生物样品。本发明可以针对从任何生物体或微生物获得或提取的样品在体外进行。生物体或微生物通常是古菌、原核或真核的,并且通常属于五界之一:植物界,动物界,真菌界,原核生物界和原生生物界。本发明可以对从任何病毒获得或从提取的样品在体外进行。样品优选为流体样品。样品通常包括患者的体液。样品可以是尿液、淋巴、唾液、粘液或羊水,但优选为血液、血浆或血清。通常,样品是来源于人的,但是也可以来自另一种哺乳动物,例如来自商业养殖的动物如马、牛、绵羊或猪,或者还可以是宠物如猫或狗。或者,植物来源的样品通常从商业作物获得,例如谷物、豆类、水果或蔬菜,如小麦、大麦、燕麦、油菜、玉米、大豆、稻、香蕉、苹果、西红柿、土豆、葡萄、烟草、菜豆、扁豆、甘蔗、可可、棉花。样品可以是非生物样品。非生物样品优选为流体样品。非生物样品的实例包括手术液,水如饮用水、海水或河水,以及实验室试验用试剂。样品通常在用于本发明之前进行处理,例如通过离心,或通过穿过膜过滤掉不需要的分子或细胞例如红细胞。取样后可以立即测量样品。样品通常也可以在测定之前储存,优选低于-70℃。mua和条件模板多核苷酸与mua转座酶接触。这种接触在允许转座酶起作用的条件下进行,所述起作用即,将模板多核苷酸片段化并将mua底物连接到片段的一端或两端。mua转座酶可从例如thermoscientific(目录号f-750c,20μl(1.1μg/μl))购得。mua转座酶将起作用的条件是本领域已知的。合适的条件在实施例中描述。底物群使模板多核苷酸与双链mua底物群接触。双链底物是多核苷酸底物,并且可以由上述任何核苷酸或核酸形成。底物通常由与模板多核苷酸相同的核苷酸形成。底物群通常是同源的(即通常含有多个相同的底物)。底物群可能是异源的(即可能包含多个不同的底物)。用于mua转座酶的合适底物是本领域已知的(saariaho和savilahti,nucleicacidsresearch,2006;34(10):3139-3149和lee和harshey,j.mol.biol.,2001;314:433-444)。每个底物通常包含提供其作为mua转座酶底物的活性的双链部分。双链部分在每个底物中通常是相同的。底物群可以包括不同的双链部分。每个底物中的双链部分通常长度为至少50个核苷酸对,例如至少55个,至少60个或至少65个核苷酸对。每个底物中的双链部分优选包含在每条链的3′端含有脱氧胞苷(dc)和脱氧腺苷(da)的二核苷酸。dc和da通常在双链部分的两条链中具有不同的取向,即在从5′到3′进行读取时,在3′端,一条链具有dc/da,而另一条链具有da/dc。双链部分的一条链优选包含seqidno:26中所示的序列,双链部分的另一条链优选包含seqidno:27中所示的序列。5′-gttttcgcatttatcgtgaaacgctttcgcgtttttcgtgcgccgcttca-3′(seq26)3′-caaaagcgtaaatagcactttgcgaaagcgcaaaaagcacgcggcgaagt-5′(seq27)每个底物包括至少一个突出端。突出端通常是核苷酸突出端。在每个底物的一端或两端可能有突出端。如果每个底物中的双链部分包含与seqidno:27所示的序列杂交的seqidno:26所示的序列,则至少一个突出端优选在seqidno:27所示的序列的5′端。每个底物可以包括两个突出端,即每个底物两端各一个。如果在底物的两端都存在突出端,则每个突出端通常在双链多核苷酸部分的不同链上。优选地,突出端位于双链部分的一条链的5′端。每个底物优选包括仅一个突出端。该仅一个突出优选在双链部分的一条链的5′端。突出端长度可以是至少3个、至少4个、至少5个、至少6个或至少7个核苷酸。突出端长度优选为5个核苷酸。在优选的实施例中,底物的一条链包含seqidno:26中所示的序列,底物的另一条链包含seqidno:28中所示的序列(见下文)。5′-gttttcgcatttatcgtgaaacgctttcgcgtttttcgtgcgccgcttca-3′(seq26)3′-caaaagcgtaaatagcactttgcgaaagcgcaaaaagcacgcggcgaagtctag-5′(seq28)所述底物群中的底物可以具有申请号为pct/gb2014/052505的国际申请中公开的任何结构。每个底物在与包含至少一个突出端的链相对的链中包含至少一个发夹环。发夹环通常不连接底物的两条链。发夹环可以是内部发夹环,即不在与包含至少一个突出端的链相对的链的末端。内部发夹环优选与间隔基相邻,在本发明的方法中使用的任何聚合酶不能移动经过该间隔基。间隔基可以位于发夹环的任一侧。可以使用以下讨论的任何间隔基,例如一个或多个ispc3基团(即缺少糖和碱基的核苷酸)、一个或多个间隔基9(isp9)基团或一个或多个间隔基18(isp18)基团。内部发夹环优选与诸如硝基吲哚等的非天然核苷酸相邻,本发明方法中使用的任何聚合酶不能移动经过该核苷酸。可以使用以下讨论的任何不同的核苷酸种类。发夹环优选位于与包含至少一个突出端的链的相对的链的端部处或该端部附近。如果距离与包含至少一个突出端的链相对的链的末端20个核苷酸或更少、15个核苷酸或更少、10个核苷酸或更少或5个核苷酸或更少,则发夹环在与含至少一个突出端的链相对的链的端部附近。如果在形成链末端的干部分(杂交部分)的最后核苷酸之间存在20个或更少的核苷酸,则发夹环距离该链末端20个核苷酸或更少。发夹环优选在与包含至少一个突出端的链相对的链的末端。在每个底物的一端或两端可能存在发夹环。发夹环优选位于与至少一个突出端相对的底物末端。发夹环通常是核苷酸发夹环。如果每个底物中的双链部分包含与seqidno:27中所示的序列杂交的seqidno:26中所示的序列,则至少一个发夹环优选在seqidno:26中所示序列的5′端。每个底物可以包含两个发夹环,即每个底物的两条链中各一个或在每个底物两端各一个。如果在底物的两端存在发夹环,则每个发夹环通常位于双链多核苷酸部分的不同链上。发夹环优选位于双链部分的链的5′端。每个底物优选包含仅一个发夹环。该仅一个发夹环优选在与包含至少一个突出端的链相对的链中。该仅一个发夹环优选位于与至少一个突出端相对的底物末端,并且在与包含至少一个突出端的链相对的链中。该仅一个发夹环优选在双链部分的一条链的5′端并且在与包含至少一个突出端的链相对的链中。在一个优选的实施例中,每个底物包含在双链部分的一条链的5′端处的一个突出端和在双链部分的另一条链的5′端处的发夹环。在最优选的实施例中,底物的一条链包含seqidno:26中所示的序列,底物的另一条链包含seqidno:28中所示的序列(见上文),并且发夹环位于seqidno:26中所示序列的5′端。可以使用本领域已知的方法设计合适的发夹环。发夹环可以是任何长度。发夹环的长度通常为110个或更少的核苷酸,例如100个或更少的核苷酸、90个或更少的核苷酸、80个或更少的核苷酸、70个或更少的核苷酸、60个或更少的核苷酸、50个或更少的核苷酸、40个或更少的核苷酸、30个或更少的核苷酸核苷酸、20个或更少的核苷酸或10个或更少的核苷酸。发夹环的长度优选为约1至110,2至100,5至80或6至50个核苷酸。发夹环可以由任何上述的核苷酸形成。发夹环可以由与双链部分相同的核苷酸形成。发夹环优选由导致发夹环具有比双链部分更低的熔化温度(tm)的核苷酸形成。可以使用常规技术测量熔化温度。如果双链部分包含rna,则发夹优选由含有腺苷(a)、尿苷(u)、肌苷(i)和zebularine(z)的核苷酸形成。如果双链部分包含dna,则发夹优选由含有脱氧腺苷(da)、胸苷(dt)、脱氧肌苷(di)和脱氧zebularine(dz)的核苷酸形成。用肌苷(i)/脱氧肌苷(di)代替鸟苷(g)/脱氧鸟苷(dg)以及用zebularine(z)/脱氧zebularine(dz)取代胞苷(c)/脱氧胞苷(dc))相比于双链部分降低了发夹的tm。i/di和z/dz仅形成两个氢键,而g/dg和c/dc形成三个氢键。在本发明的方法中,聚合物用与包含发夹环的链互补的新链取代突出链。具有较低tm的发夹环可用于形成具有较高tm的互补的发夹,即由具有较高tm的核苷酸形成的发夹。聚合酶可以用与包含发夹环的链互补的新链取代突出链,其中新链包含具有比模板链中发夹环更高的tm的发夹环。例如,由含有腺苷(a)/脱氧腺苷(da)、尿苷(u)/胸苷(dt)、肌苷(i)/脱氧肌苷(di)和zebularine(z)/脱氧zebularine(dz)的核苷酸形成的发夹环可以用于形成互补的rna或dna发夹环。两个发夹之间的tm差异意味着它们作为个体发夹比杂交在一起时更稳定。这意味着两个发夹环形成它们各自的环,而不是杂交在一起。这有助于所述方法的最后一步,其中双链构建体的两条链分离并用作模板以形成多个修饰的双链多核苷酸,每个修饰的双链多核苷酸包含由至少一个发夹环连接的两条互补链。例如,分离可以在室温下进行。每个底物可以包含可选择的结合部分。如果存在,可选择的结合部分优选在发夹环中。可选择的结合部分是可以基于其结合性质而选择的部分。因此,可选择的结合部分优选是特异性结合至表面的部分。如果可选择的结合部分以比在本发明中使用的任何其它部分以大得多的程度结合到表面,则可选择的结合部分特异性地结合到表面。在优选的实施方案中,该部分结合到没有其它本发明中使用的部分结合的表面。合适的选择性结合部分是本领域已知的。优选的选择性结合部分包括但不限于生物素、核酸序列、抗体、抗体片段,例如fab和scsv、抗原、核酸结合蛋白、多组氨酸尾部和gst标签。最优选的选择性结合部分是生物素和可选择的核酸序列。生物素特异性结合到包被有抗生物素蛋白的表面。可选择的核酸序列特异性结合(即杂交)到包被有同源序列的表面。或者,可选择的核酸序列特异性结合包被有核酸结合蛋白的表面。每个底物可以包含前导序列。前导序列通常与至少一个发夹环在同一条链上。前导序列通常位于与发夹环相同的底物末端。前导序列通常位于包含至少一个发夹环的链末端(即,发夹环位于末端前导序列和底物的其余部分之间)。前导序列通常通过间隔基与发夹环分离,在本发明的方法中使用的任何聚合酶不能移动通过该间隔基。可以使用以下任何间隔基,例如一个或多个ispc3基团(即缺少糖和碱基的核苷酸)、一个或多个间隔基9(isp9)基团或一个或多个间隔基18(isp18)基团。间隔基意味着前导序列在步骤(b)和(c)中不用作模板,因此在方法结束时保持单链。这允许前导序列执行其功能。这样的一个例子在图5中示出。前导序列优先旋入孔中。前导序列有助于本发明的表征方法。前导序列被设计成优先旋入孔中,从而有助于多核苷酸通过孔的运动。前导序列也可以用于将多核苷酸连接到一个或多个锚,如下所述。前导序列通常包含聚合物。聚合物优选是带负电荷的。聚合物优选为多核苷酸,例如dna或rna,经修饰的多核苷酸(例如脱碱基dna),pna,lna,聚乙二醇(peg)或多肽。前导序列优选包含多核苷酸,更优选包含单链多核苷酸。前导序列可以包含任何上述的多核苷酸。单链前导序列最优选包含单链dna,例如聚dt区段。前导序列优选包含一个或多个间隔基。前导序列可以是任何长度,但是长度通常为10至150个核苷酸,例如长度为20至150个核苷酸。前导序列的长度通常取决于方法中使用的跨膜孔。片段化转座酶将模板双链多核苷酸片段化,形成多个双链片段。转座酶还将底物连接到双链片段的一端或两端,从而产生多个片段/底物构建体。转座酶优选将底物连接到双链片段的两端,从而产生多个片段/底物构建体,其各自在两端具有发夹环。这样的一个例子可以在图1中看到。聚合酶由转座酶产生的片段/底物构建体与聚合酶接触。可以使用以下讨论的任何聚合酶。聚合酶优选为klenow或9°north。聚合酶更优选为taqdna聚合酶(可以从newenglandinc.购得),high-fidelitydna聚合酶(可以从newenglandbiolabsinc.购得)或kapahifi(可以从kapabiosystems购得)。在聚合酶可以置换突出的链并形成互补的多核苷酸的条件下,使构建体与聚合酶接触。这些条件是本领域已知的。例如,通常将这些构建体与可购得的聚合酶缓冲液(例如来自newenglandbiolabs或kapabiosystems的缓冲液)中的聚合酶接触。对于klenow,温度优选为20至37℃,对于9°north,taqdna聚合酶,high-fidelitydna聚合酶或kapahifi,温度优选为60至75℃。聚合酶置换包含来自片段/底物构建体的突出端的链。聚合酶用与包含发夹环的链互补的新链取代突出链。这产生多个双链构建体,每个双链构建体包含模板多核苷酸的双链片段。由聚合酶形成的部分新链通常与发夹环互补。这意味着发夹环通常在构建体中形成双链多核苷酸的一部分。这样的一个例子可以在图1中看到。聚合酶可以形成包含上文和下文所讨论的任何核苷酸的新链。聚合酶具有与包含发夹环的链中的核苷酸互补的游离核苷酸群。聚合酶可以使用游离核苷酸形成新的链。分离/复制分离双链构建体的两条链,并且将该链用作模板以形成多个修饰的双链多核苷酸,每个双链多核苷酸包含由至少一个发夹环连接的两条互补链。一个例子如图1所示。在将两条链用作模板之前,可以将所述两条链完全分离。两条链可以分离并在同一时间被用作模板(即同时)。换句话说,两条链不需要完全分离,或者两条链在用作模板之前可被部分分离。两条链可以以任何方式分离。该方法优选包括通过增加ph、温度和离子强度中的一种或多种来分离双链构建体的两条链。优选升高的温度。该方法优选包括将温度升高至95℃。该方法优选包括将温度升高至95℃,然后将温度降至55℃。该方法优选包括将温度升高至95℃,将温度降低至55℃,然后将温度升高至68℃。该方法最优选包括在95℃下培育双链构建体2分钟,在55℃下培育30秒,然后在68℃下培育30分钟。可以使用甲酰胺或氢氧化钠(naoh)来实现ph的增加。酶,例如解旋酶或消化模板链的酶(例如,如果该链具有du而不是dt,则为user)也可用于分离链。下面讨论的任何解旋酶都可以使用。如下面更详细讨论的,可以使用聚合酶分离两条链。聚合酶可以是上面或下面讨论的那些。可以使用任何方法来形成使用分离的链作为模板的新的多核苷酸。该方法优选包括使链与聚合酶接触,使得聚合酶使用链作为模板形成多个修饰的双链多核苷酸。可以使用上述或下面讨论的任何聚合酶。或者,该方法可以包括(i)使多个链与一群核苷酸寡聚体接触,核苷酸寡聚体包括在寡聚体能够杂交到链的条件下与链中所有核苷酸互补的核苷酸的每一种可能组合,和(ii)将那些与链杂交的寡聚体连接在一起以形成多个经修饰的双链多核苷酸。允许杂交的条件是本领域已知的(例如,sambrook等人,2001,molecularcloning:alaboratorymanual,第3版,coldspringharborlaboratorypress;和currentprotocolsinmolecularbiology,第2章,ausubeletal.,eds.,greenepublishingandwiley-interscience,newyork(1995))。杂交可以在低严格条件下进行,例如在37℃下在30-35%甲酰胺、1mnacl和1%sds(十二烷基硫酸钠)的缓冲溶液存在下进行,然后在50℃下在从1x(0.1650mna+)到2x(0.33mna+)的ssc(标准柠檬酸钠)中洗涤。杂交可以在中度严格条件下进行,例如在37℃下在40至45%甲酰胺、1mnacl和1%sds的缓冲溶液的存在下进行,然后在55℃下在从0.5x(0.0825mna+)到1x(0.1650mna+)的ssc中洗涤。杂交可以在高严格条件下进行,例如在37℃下在50%甲酰胺、1mnacl、1%sds的缓冲溶液存在下进行,然后在60℃下在0.1x(0.0165mna+)的ssc中洗涤。优选的条件优选为10mmtris-hcl,50mmnacl,ph7中的10um寡聚体,并加热至98℃,然后以2℃/分钟冷却至18℃。群中的寡聚体通常具有2至16个核苷酸。群中的所有寡聚体可具有2,3,4,5,6,7,8,9,10,11,12,13,14,15或16个核苷酸。群中的寡聚体可以具有不同的长度。群中的所有寡聚体优选具有相同的长度。寡聚体可以包含任何上述核苷酸。核苷酸与和寡聚体杂交的链中的核苷酸互补。对于本领域技术人员来说,识别与那些核苷酸互补的核苷酸是较容易的。如果核苷酸通过碱基配对(优选watson和crick碱基配对)与另一个核苷酸杂交,则所述核苷酸与所述另一个核苷酸互补。互补的核苷酸可以与不与其互补的其他核苷酸杂交,但是比其杂交到与其互补的核苷酸的程度小。n优选包含核碱基腺嘌呤(a)、尿嘧啶(u)、鸟嘌呤(g)或胞嘧啶(c)。或者,n优选包含核碱基a、胸腺嘧啶(t)、g或c。a与t或u互补,反之亦然。g与c互补,反之亦然。所述群包括与链中所有核苷酸互补的核苷酸的每种可能组合。这意味着寡聚体将与绝大多数(如果不是全部)的链杂交,无论其序列如何。例如,如果n包含核碱基腺嘌呤(a)、尿嘧啶(u)、鸟嘌呤(g)或胞嘧啶(c),则所述群包括a、u、g和c的每一种可能的组合。类似地,如果n包含核碱基a、胸腺嘧啶(t)、g或c,则所述群包含a、t、g和c的每一种可能的组合。设计和获得具有所需组合的寡聚体群是较为简单的。例如,如果群中所有的寡聚体都包含或由nn组成,并且n是a、t、g或c,则所述群包含at,ag,ac,ta,tg,tc,ga,gt,gc,ca,ct和cg。类似地,如果群中所有寡聚体包含或由nnn组成,并且n是a、t、g或c,则所述群包含atg,atc,agt,agc,act,acg,tag,tac,tga,tgc,tca,tcg,gat,gac,gta,gtc,gca,gct,cat,cag,cta,ctg,cga和cgt。一旦设计了通用公式,例如nn或nnn,则包含n的所有可能组合的群可购得,例如购自intergrateddnatechnologies(idt),sigma和invitrogen。寡聚体能够根据本发明连接在一起。群中的所有寡聚体优选在5′端具有磷酸基团或腺苷酸基团。杂交的寡聚体可以使用本领域已知的任何方法连接在一起。寡聚体优选使用连接酶连接,例如t4dna连接酶,大肠杆菌dna连接酶,taqdna连接酶,tmadna连接酶和9°ndna连接酶。如果反应性基团存在于寡聚体的末端,则寡聚体也可以化学连接。在这样的实施方案中,需要采取步骤以防止寡聚体在溶液中彼此结合。通常使用链上的发夹作为引物来引发连接反应。在优选的实施方案中,该方法优选包括使多个双链构建体与聚合酶接触,使得聚合酶同时分离双链构建体的两条链,并将该链用作模板以形成多个修饰的双链多核苷酸。可以使用上面或下面讨论的任何聚合酶。聚合酶可以形成包含上面或下面讨论的任何核苷酸的新链。聚合酶具有与模板链中的核苷酸互补的游离核苷酸群。聚合酶可以使用游离核苷酸形成新的链。经修饰的多核苷酸如果聚合酶使用链作为模板以形成多个修饰的双链多核苷酸,则该方法可以包括在聚合酶使用链作为模板以形成多个修饰的双链多核苷酸的条件下使链与聚合酶以及游离核苷酸群接触,其中当形成修饰的双链多核苷酸时,所述聚合酶用不同的核苷酸种类代替链中的一个或多个核苷酸种类。如上所述,聚合酶可以用于同时分离各链。在申请号为1403096.9的英国申请中描述了这种类型的修饰。可以使用上面或下面讨论的任何聚合酶。聚合酶优选为klenow或9°north。以上讨论了合适的条件。使用跨膜孔进行的多核苷酸的表征例如测序通常涉及分析由k个核苷酸组成的聚合物单元,其中k是正整数(即′k聚体′)。这在申请号为pct/gb2012/052343(公开为wo2013/041878)的国际申请中进行了讨论。尽管希望在不同k聚体的电流测量值之间有明确的分离,但是这些测量值中的一些通常是重叠的。特别是在k聚体中具有高数量的聚合物单元,即高的k值时,可能变得难以分辨由不同的k聚体产生的测量值,从而不利于得到关于多核苷酸的信息,例如对多核苷酸的潜在序列的估计。通过用修饰的双链多核苷酸的新链(即使用聚合酶产生的链)中的不同核苷酸种类替换链中的一个或多个核苷酸种类,新链含有不同于那些在模板链中的k聚体。新链中的不同的k聚体能够从模板链中的k聚体产生不同的电流测量值,因此新的链提供与模板链不同的信息。来自新链的额外信息可以使得更容易表征修饰的双链多核苷酸以及模板多核苷酸。在一些情况下,修饰的双链多核苷酸本身可能更易于表征。例如,修饰的双链多核苷酸可以被设计成包括具有在其电流测量值之间的增加的分离或清晰的分离的k聚体或具有降低的噪声的k聚体。当形成修饰的双链多核苷酸时,聚合酶优选用不同核苷酸种类取代模板链中的两个或更多个核苷酸种类。聚合酶可以用不同的核苷酸种类代替模板链中的两个或更多个核苷酸种类中的每一个。聚合酶可以用相同的核苷酸种类代替模板链中的两个或更多个核苷酸种类中的每一个。如果模板链是dna,则不同的核苷酸种类通常包含不同于腺嘌呤,鸟嘌呤,胸腺嘧啶,胞嘧啶或甲基胞嘧啶的核碱基和/或包含与脱氧腺苷,脱氧鸟苷,胸苷,脱氧胞苷或脱氧甲基胞苷不同的核苷。如果模板链是rna,则经修饰的多核苷酸中的不同核苷酸种类通常包含不同于腺嘌呤,鸟嘌呤,尿嘧啶,胞嘧啶或甲基胞嘧啶的核碱基和/或包含不同于腺苷,鸟苷,尿苷,胞苷或甲基胞苷的核苷。不同的核苷酸种类可以是通用核苷酸。通用核苷酸是在某种程度上与模板链中的所有核苷酸杂交或结合的核苷酸。通用核苷酸优选是一定程度上与包含核苷腺苷(a),胸腺嘧啶(t),尿嘧啶(u),鸟嘌呤(g)和胞嘧啶(c)的核苷酸杂交或结合的核苷酸。通用核苷酸可以比其他核苷酸更强地杂交或结合某些核苷酸。例如,包含核苷,2′-脱氧肌苷的通用核苷酸(i)将显示i-c>i-a>i-g约=i-t的配对的优先顺序。如果通用核苷酸替代了群中的核苷酸种类,则聚合酶将用通用核苷酸替代核苷酸种类。例如,如果与一群游离damp,dtmp,dcmp和通用核苷酸接触,聚合酶将以通用核苷酸取代dgmp。通用核苷酸优选包含以下核碱基之一:次黄嘌呤,4-硝基吲哚,5-硝基吲哚,6-硝基吲哚,甲酰基吲哚,3-硝基吡咯,硝基咪唑,4-硝基吡唑,4-硝基苯并咪唑,5-硝基吲唑,4-氨基苯并咪唑或苯基(c6-芳环)。通用核苷酸更优选包含以下核苷之一:2′-脱氧肌苷,肌苷,7-脱氮-2′-脱氧肌苷,7-脱氮肌苷,2-氮杂-脱氧肌苷,2-氮杂-肌苷,2-o′-甲基肌苷,4-硝基吲哚2′-脱氧核糖核苷,4-硝基吲哚核糖核苷,5-硝基吲哚2′-脱氧核糖核苷,5-硝基吲哚核糖核苷,6-硝基吲哚2′-脱氧核糖核苷,6-硝基吲哚核糖核苷,3-硝基吡咯2′-脱氧核糖核苷,3-硝基吡咯核糖核苷,次黄嘌呤的无环糖类似物,硝基咪唑2′-脱氧核糖核苷,硝基咪唑核糖核苷,4-硝基吡唑2′-脱氧核糖核苷,4-硝基吡唑核糖核苷,4-硝基苯并咪唑2′-脱氧核糖核苷,4-硝基苯并咪唑核糖核苷,5-硝基吲唑2′-脱氧核糖核苷,5-硝基吲唑核糖核苷,4-氨基苯并咪唑2′-脱氧核糖核苷,4-氨基苯并咪唑核糖核苷,苯基c-核糖核苷,苯基c-2′-脱氧核糖基核苷,2′-脱氧水粉蕈素,2′-脱氧异鸟苷,k-2′-脱氧核糖,p-2′-脱氧核糖和吡咯烷。通用核苷酸更优选包含2′-脱氧肌苷。通用核苷酸更优选为imp或dimp。通用核苷酸最优选为dpmp(2′-脱氧-p-核苷单磷酸)或dkmp(n6-甲氧基-2,6-二氨基嘌呤单磷酸酯)。不同的核苷酸种类优选包含其所取代的核苷酸种类中不存在的化学原子或基团。化学基团优选为丙炔基,硫基,氧代基,甲基,羟甲基,甲酰基,羧基,羰基,苄基,炔丙基或炔丙胺基。化学基团或原子可以是或可以包含荧光分子,生物素,地高辛,dnp(二硝基苯酚),光不稳定基团,炔烃,dbco,叠氮化物,游离氨基,氧化还原染料,汞原子或硒原子。包含不存在于天然存在的核苷中的化学基团的市售核苷包括但不限于6-硫代-2′-脱氧鸟苷,7-脱氮-2′-脱氧腺苷,7-脱氮-2′-脱氧鸟苷,7-脱氮-2′-脱氧腺苷,7-脱氮-8-氮杂-2′-脱氧腺苷,8-5′(5′s)-环-2′-脱氧腺苷,8-氨基-2′-脱氧腺苷,8-氨基-2′脱氧鸟苷,8-氘代-2′-脱氧鸟苷,8-氧-2′-脱氧腺苷,8-氧-2′-脱氧鸟苷,亚乙烯基-2′-脱氧腺苷,n6-甲基-2′-脱氧腺苷,o6-甲基-2′-脱氧鸟苷,o6-苯基-2′脱氧肌苷,2′-脱氧假尿苷,2-硫代胸苷,4-硫代-2′-脱氧尿苷,4-硫代胸苷,5′氨基胸苷,5-(1-芘基乙炔基)-2′-脱氧尿苷,5-(c2-edta)-2′-脱氧尿苷,5-(羧基)乙烯基-2′-脱氧尿苷,5,6-二氢-2′-脱氧尿苷,5.6-二氢胸苷,5-溴-2′-脱氧胞苷,5-溴-2′-脱氧尿苷,5-羧基-2′-脱氧胞苷,5-氟-2′-脱氧尿苷,5-甲酰基-2′-脱氧胞苷,5-羟基-2′-脱氧胞苷,5-羟基-2′-脱氧尿苷,5-羟甲基-2′-脱氧胞苷,5-羟甲基-2′-脱氧尿苷,5-碘-2′-脱氧胞苷,5-碘-2′-脱氧尿苷,5-甲基-2′-脱氧胞苷,5-甲基-2′-脱氧异胞苷,5-丙炔基-2′-脱氧胞苷,5-丙炔基-2′-脱氧尿苷,6-o-(tmp)-5-f-2′-脱氧尿苷,c4-(1,2,4-三唑-1-基)-2′-脱氧尿苷,c8-炔-胸苷,dt-二茂铁,n4-乙基-2′-脱氧胞苷,o4-甲基胸苷,吡咯-2′-脱氧胞苷,胸苷乙二醇,4-硫尿苷,5-甲基胞苷,5-甲基尿苷,吡咯基胞苷,3-脱氮-5-氮杂-2′-o-甲基胞苷,5-氟-2′-o-甲基尿苷,5-氟-4-o-tmp-2′-o-甲基尿苷,5-甲基-2′-o-甲基胞苷,5-甲基-2′-o-甲基胸苷,2′,3′-脱氧腺苷,2′,3′-二脱氧胞苷2′,3′-二脱氧鸟苷,2′,3′-二脱氧胸苷,3′-脱氧腺苷,3′-脱氧胞苷,3′-脱氧鸟苷,3′-脱氧胸苷和5′-o-甲基胸苷。不同的核苷酸种类可以包含任何这些核苷。或者,不同的核苷酸种类优选缺乏其所替代的核苷酸种类中存在的化学基团或原子。与被替换的一个或多个核苷酸相比,所述不同的核苷酸种类优选具有改变的电负性。具有改变的电负性的不同核苷酸种类优选包含卤素原子。卤素原子可以连接到不同核苷酸种类上的任何位置,例如核碱基和/或糖。卤素原子优选为氟(f),氯(cl),溴(br)或碘(i)。卤素原子最优选为f或i。包含卤素的市售核苷包括但不限于8-溴-2′-脱氧腺苷,8-溴-2′-脱氧鸟苷,5-溴尿苷,5-碘尿苷,5′-碘胸苷和5-溴-2′-o-甲基尿苷。不同的核苷酸种类可以包含任何这些核苷。该方法优选还包括选择性地从修饰的双链多核苷酸中的一个或多个不同核苷酸种类中去除核碱基。这导致修饰的双链多核苷酸中的脱碱基核苷酸。脱碱基核苷酸是缺乏核碱基的核苷酸。脱碱基核苷酸通常含有糖和至少一个磷酸基。糖通常是戊糖,如核糖和脱氧核糖。脱碱基核苷酸通常是脱碱基核糖核苷酸或脱碱基脱氧核糖核苷酸。脱碱基核苷酸通常含有一磷酸盐,二磷酸盐或三磷酸盐。磷酸盐可以连接在无碱基核苷酸的5′或3′侧。可以使用本领域已知的任何方法选择性地除去核碱基。例如,某些dna修复蛋白(例如人烷基腺嘌呤dna糖基化酶(haag))能够从核苷酸中选择性地除去3-甲基腺嘌呤,7-甲基鸟嘌呤,1,n6-乙烯基腺嘌呤和次黄嘌呤。此外,可以使用尿嘧啶dna糖基化酶选择性除去dump。附咖聚合酶步骤在另一个优选的实施方案中,将修饰的双链多核苷酸中的信息量加倍以利于模板多核苷酸的表征。该方法的一个示例在图8中示出。该方法优选包含(d)将修饰的双链多核苷酸的两条链分离并使用该链作为模板以形成多个适应的双链多核苷酸,每个双链多核苷酸包含由至少一个发夹环连接的两个互补链,其中每个互补链包含两个互补序列。每个互补链中的两个互补序列之一衍生自模板双链多核苷酸。步骤(d)通常包括,在分离之前将发夹环在修饰的双链多核苷酸的远离连接互补链的所述至少一个发夹环的另一端连接到修饰的双链多核苷酸。该发夹环优选不连接经修饰的双链多核苷酸的链。发夹可以形成聚合酶的成核点。当修饰的双链多核苷酸的分离的链用作模板时,连接的发夹环也用作模板并连接适应的双链多核苷酸的两个互补链,即,连接来自修饰的双链多核苷酸的模板链与由模板形成的新链。步骤(d)可以以上述任何方式进行。例如,步骤(d)可以包括通过增加ph,温度和离子强度中的一个或多个来分离修饰的双链多核苷酸的两条链。步骤(d)可以包括使分离的链与聚合酶接触,使得聚合酶使用链作为模板来形成多个适应的双链多核苷酸。步骤(d)可以包括(i)使多个分离的链与一群核苷酸寡聚体接触,所述一群核苷酸寡聚体包括在寡聚体能够杂交到链的条件下与链中所有核苷酸互补的核苷酸的每种可能组合,和(ii)将那些与所述链杂交的寡聚体连接在一起以形成多个适应的双链多核苷酸。步骤(d)可以包括使多个修饰的双链多核苷酸与聚合酶接触,使得聚合酶同时分离修饰的双链多核苷酸的两条链,并将该链用作多个适应的双链多核苷酸的模板。上述任何实施例可以应用于步骤(d)。例如,步骤(d)可以包括用新链中的不同核苷酸种类替换模板链中的一个或多个核苷酸种类。y适配器如果每个底物不包含前导序列,则该方法优选还包括在发夹环的相对端将y适配器连接到多个修饰的双链多核苷酸。y适配器通常是多核苷酸适配器。它们可以由任何上述的多核苷酸形成。y适配器通常包含(a)双链区域和(b)单链区域或在另一端不互补的区域。如果y适配器包括单链区域,则y适配器可以被描述为具有突出端。y适配器中非互补区域的存在使其具有y形状,因为与双链部分不同,这两条链通常不彼此杂交。y适配器可以包括一个或多个锚,如下面更详细地讨论的。y适配器可以连接到修饰的双链多核苷酸。可以使用本领域已知的任何方法进行连接。例如,可以使用连接酶例如t4dna连接酶,大肠杆菌dna连接酶,taqdna连接酶,tmadna连接酶和9°ndna连接酶连接y适配器。本发明的产品本发明还提供了用于修饰模板多核苷酸的双链mua底物群,其中每个底物包含通用核苷酸的至少一个突出端。本发明还提供了用于修饰模板多核苷酸的双链mua底物群,其中每个底物包含(i)至少一个突出端和(ii)在与包含所述至少一个突出端的链相对的链中的至少一个发夹环。底物可以是上述那些中的任一种。底物优选包含如上所定义的双链部分。双链部分优选包含如上所述的seqidno:26和27。双链部分更优选包含如上所述的seqidno:26和28。本发明的优选的群是其中每个底物包含在一端的突出端和在另一端的发夹环的那些群。本发明还提供了使用本发明的方法修饰的多个多核苷酸。所述多个多核苷酸可以是上述任何形式。修饰的双链多核苷酸包含两个互补链,其包含通过发夹环连接的模板多核苷酸的双链片段。群或多个多核苷酸可以是分离的,基本上分离的,纯化的或基本上纯化的。如果群或多个多核苷酸完全不含任何其它组分,例如模板多核苷酸,脂质或孔,则群或多个多核苷酸是分离的或纯化的。如果与不妨碍其预期用途的载体或稀释剂混合,则群或多个多核苷酸基本上是分离的。例如,如果群或多个多核苷酸以包含小于10%,小于5%,小于2%或小于1%的其它成分(例如脂质或孔)的形式存在,则群或多个多核苷酸基本上是分离的或基本上是纯化的。表征方法本发明还提供了表征使用本发明的方法修饰的至少一种多核苷酸的方法。经修饰的多核苷酸与跨膜孔接触,使得多核苷酸的至少一条链移动通过所述孔。随着至少一条链相对于孔移动,获取一个或多个测量值。所述测量值指示所述至少一条链的一个或多个特征,并且这允许表征经修饰的多核苷酸。本发明还提供了表征模板多核苷酸的方法。使用本发明修饰模板多核苷酸以产生多个经修饰的多核苷酸。每个经修饰的多核苷酸与跨膜孔接触,使得每个多核苷酸的至少一条链移动通过孔。随着每个多核苷酸相对于孔移动,获取一个或多个测量值。所述测量值指示每个多核苷酸的一个或多个特征,这允许对模板多核苷酸进行表征。在优选的实施方案中,经修饰的多核苷酸的两条链/每个经修饰的多核苷酸移动通过孔。如果两条链都移动穿过孔,则两条链通常是分离的。可以使用本领域已知的任何方法分离两条链。例如,它们可以被多核苷酸结合蛋白分离,或者使用有利于脱杂交的条件(有利于脱杂交的条件的实例包括但不限于高温、高ph和添加可以破坏氢键或碱基配对的试剂,如甲酰胺和脲)而分离。跨膜孔跨膜孔是在一定程度上穿过膜的结构。它允许由施加电势驱动的水合离子流过膜或在膜内流动。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流到膜的另一侧。然而,跨膜孔不必跨过膜。它可能在一端被封闭。例如,孔可以是水合离子可以沿其流动或流入其中的膜内的阱、间隙、通道、沟槽或狭缝。一个或多个选择性扩增探针或一个或多个扩增产物优选通过下述进行表征:(i)使探针或扩增产物与跨膜孔接触,使得探针或扩增产物移动通过孔,并且(ii)随着探针或扩增产物相对于孔移动获取一个或多个测量值,其中所述测量值指示探针或扩增产物的一个或多个特征,从而表征探针或扩增产物。任何跨膜孔可用于本发明。孔可以是生物的或人造的。合适的孔包括但不限于蛋白质孔,多核苷酸孔和固态孔。孔可以是dna折纸孔(langecker等人,science,2012;338:932-936)。跨膜孔优选为跨膜蛋白孔。根据本发明使用的跨膜蛋白孔可以衍生自β-桶状孔或α-螺旋束孔。β-桶状孔包括由β-链形成的桶状体或通道。合适的β-桶状孔包括但不限于,形成毒素的β孔,例如α-溶血素,炭疽毒素和杀白细胞素,和细菌的外膜蛋白/孔蛋白,例如耻垢分枝杆菌(mycobacteriumsmegmatis)孔蛋白(msp),如mspa,mspb,mspc或mspd,外膜孔蛋白f(ompf),外膜孔蛋白g(ompg),外膜磷脂酶a和奈瑟氏菌(neisseria)自体转运脂蛋白(nalp)以及其他孔,如lysenin。α-螺旋束孔包括由α-螺旋形成的桶状体或通道。合适的α-螺旋束孔包括但不限于内膜蛋白和α外膜蛋白,例如wza和clya毒素。跨膜孔可以衍生自lysenin。衍生自lysenin的合适的孔在申请号为pct/gb2013/050667(公开为wo2013/153359)的国际申请中公开。跨膜孔可以衍生自msp,如mspa,或衍生自α-溶血素(α-hl)。野生型α-hl孔由七个相同的单体或亚基形成(即其为七聚体)。α-溶血素-nn的一个单体或亚基的序列在seqidno:4中示出。跨膜蛋白孔优选衍生自msp,优选来自mspa。这样的孔将是低聚的,并且通常包含衍生自msp的7,8,9或10个单体。孔可以是衍生自包含相同单体的msp的同源寡聚孔。或者,孔可以是衍生自包含至少一种与其它单体不同的单体的msp的异源寡聚孔。优选地,孔衍生自mspa或其同源物或旁系同源物。衍生自msp的单体通常包含seqidno:2或其变体中所示的序列。seqidno:2是mspa单体的ms-(b1)8突变体。它包括以下突变:d90n,d91n,d93n,d118r,d134r和e139k。seqidno:2的变体是具有下述氨基酸序列的多肽:从seqidno:2的氨基酸序列变化而来并保留其形成孔的能力。合适的变体在申请号为pct/gb2012/050301(公开为wo2012/107778)的国际申请和申请号为1407809.1(ontip057)的英国申请中公开。seqidno:2的优选变体包含n93d。可以使用本领域已知的任何方法测定变体形成孔的能力。例如,可以将变体与其他合适的亚基一起插入两亲层,并且可以确定其低聚以形成孔的能力。本领域已知用于将亚基插入诸如两亲层的膜中的方法。例如,亚基可以在含有三嵌段共聚物膜的溶液中以纯化的形式悬浮,使得其扩散到膜并通过结合到膜上并组装成功能状态而插入。或者,亚基可以使用m.a.holden,h.bayley.j.am.chem.soc.2005,127,6502-6503和申请号为pct/gb2006/001057(公开为wo2006/100484)的国际申请中所述的“摘取和放置(pickandplace)”方法直接插入膜中。在seqidno:2的氨基酸序列的整个长度上,基于氨基酸同一性,变体将优选与该序列至少50%同源。更优选地,基于氨基酸同一性,变体可以与seqidno:2的氨基酸序列在整个长度上至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,和更优选地至少95%,97%或99%同源。在100个或更多个,例如125,150,175或200个或更多个连续氨基酸的片段上可以具有至少80%,例如至少85%,90%或95%的氨基酸同一性(“严格同源性(hardhomology)”)。本文所述的任何蛋白质,例如跨膜蛋白孔,可以通过合成而制备或通过重组方法制备。例如,孔可以通过体外翻译和转录(ivtt)合成。孔的氨基酸序列可以被修饰为包括非天然存在的氨基酸或增加蛋白质的稳定性。当通过合成方法产生蛋白质时,可以在生产过程中引入这些氨基酸。在合成或重组生产之后,孔也可以改变。表征该方法可以涉及测量经修饰多核苷酸或模板多核苷酸的两个,三个,四个或五个或更多个特征。一个或多个特征优选选自(i)多核苷酸的长度,(ii)多核苷酸的同一性,(iii)多核苷酸的序列,(iv)多核苷酸的二级结构,以及(v)多核苷酸是否被修饰。(i)至(v)的任何组合可以根据本发明进行测量,例如{i},{ii},{iii},{iv},{v},{i,ii},{i,iii},{i,iv},{i,v},{ii,iii},{ii,iv},{ii,v},{iii,iv},{iii,v},{iv,v},{i,ii,iii},{i,ii,iv},{i,ii,v},{i,iii,iv},{i,iii,v},{i,iv,v}ii,iii,iv},{ii,iii,v},{ii,iv,v},{iii,iv,v},{i,ii,iii,iv},{i,ii,iii,v},{i,ii,iv,v},{i,iii,iv,v},{ii,iii,iv,v}或{i,ii,iii,iv,v}。相比于第二多核苷酸,可以对第一多核苷酸测量(i)至(v)的不同组合,包括上述任何一种组合。对于(i),可以例如通过确定多核苷酸和孔之间的相互作用的次数或多核苷酸和孔之间的相互作用持续时间来测量多核苷酸的长度。对于(ii),可以以多种方式测量多核苷酸的同一性。多核苷酸的同一性可以结合多核苷酸序列的测量或不结合多核苷酸的序列的测量来测量。前者较简单;对多核苷酸进行测序并鉴定。后者可以通过几种方式完成。例如,可以测量多核苷酸中特定基序的存在(不测量多核苷酸的剩余序列)。或者,该方法中特定电和/或光信号的测量可以鉴定出来自特定来源的多核苷酸。对于(iii),可以如先前所述测定多核苷酸的序列。在stoddartd等人,procnatlacadsci,12;106(19):7702-7,liebermankr等人,jamchemsoc.2010;132(50):17961-72和申请号为wo2000/28312的国际申请中描述了合适的测序方法,特别是使用电测量的测序方法。对于(iv),二级结构可以以多种方式测量。例如,如果该方法涉及电测量,则可以使用驻留时间的变化或流过孔的电流的变化来测量二级结构。这允许区分单链和双链多核苷酸的区域。对于(v),可以测量是否存在任何修饰。该方法优选包括,确定多核苷酸是否通过甲基化,氧化,损伤、用一种或多种蛋白质或用一种或多种标记、标签或间隔基,进行了修饰。特定的修饰将导致与孔的特异性相互作用,其可以使用下述方法测量。例如,可基于在与每个核苷酸相互作用期间流过孔的电流,将甲基胞嘧啶与胞嘧啶进行区分。多核苷酸与跨膜孔接触。孔通常存在于膜中。下面讨论合适的膜。该方法可以使用任何适合于研究膜中存在孔的膜/孔系统的设备进行。该方法可以使用适用于跨膜孔感测的任何设备来进行。例如,该设备包括一个包含水性溶液的腔室和一个将腔室分成两个部分的屏障。屏障通常具有形成包含孔的膜的孔洞。或者,屏障形成其中存在孔的膜。该方法可以使用申请号为pct/gb08/000562(wo2008/102120)的国际申请中描述的设备进行。可以进行多种不同类型的测量。这包括但不限于:电测量和光测量。可能的电测量包括:电流测量,阻抗测量,隧道测量(tunnellingmeasurement)(ivanovap等人,nanolett.2011jan12;11(1):279-85)和fet测量(申请号为wo2005/124888的国际申请)。光测量可以与电测量结合(sonigv等人,revsciinstrum.2010jan;81(1):014301)。测量可以是跨膜电流测量,例如流过孔的离子电流的测量。可以使用stoddartd等人,procnatlacadsci,12;106(19):7702-7,liebermankr等人,jamchemsoc.2010;132(50):17961-72,和申请号为wo2000/28312的国际申请中描述的标准单通道记录装置进行电测量。或者,可以使用如国际申请wo2009/077734和国际申请wo201i/067559中所述的多通道系统进行电测量。该方法优选以跨膜施加的电势进行。所施加的电势可以是电压电势。或者,施加的电势可以是化学电势。其一个例子是使用跨膜的盐梯度,所述膜例如两亲层。在holden等人,jamchemsoc.2007jul11;129(27):8650-5中公开了盐梯度。在一些情况下,随着多核苷酸相对于孔的移动,使用通过孔的电流来估计或确定多核苷酸的序列。这就是链测序。该方法可以涉及测量随着多核苷酸相对于孔的移动通过孔的电流。因此,该方法中使用的设备还可以包括能够在膜和孔上施加电势并测量电信号的电路。该方法可以使用膜片钳或电压钳进行。所述方法优选地涉及使用电压钳。本发明的方法可以涉及测量随着多核苷酸相对于孔的移动通过孔的电流。测量通过跨膜蛋白孔的离子电流的合适条件是本领域已知的并且在实施例中公开。该方法通常通过施加在膜和孔上的电压进行。所使用的电压通常为+5v至-5v,例如从+4v至-4v,+3v至-3v或+2v至-2v。所使用的电压通常为-600mv至+600mv或-400mv至+400mv。所使用的电压优选在具有选自-400mv,-300mv,-200mv,-150mv,-100mv,-50mv,-20mv和0mv的下限和独立地选自+10mv,+20mv,+50mv,+100mv,+150mv,+200mv,+300mv和+400mv的上限的范围内。所使用的电压更优选在100mv至240mv的范围内,最优选在120mv至220mv的范围内。通过使用增加的施加电势,可以由孔增加不同核苷酸之间的区别。该方法通常在任何电荷载体存在下进行,例如金属盐,例如碱金属盐,卤化物盐,例如氯化物盐,如碱金属氯化物盐。电荷载体可以包括离子液体或有机盐,例如四甲基氯化铵,三甲基苯基氯化铵,苯基三甲基氯化铵或1-乙基-3-甲基咪唑鎓氯化物。在上述示例性设备中,盐存在于腔室中的水性溶液中。通常使用氯化钾(kcl),氯化钠(nacl),氯化铯(cscl)或亚铁氰化钾和铁氰化钾的混合物。kcl,nacl和亚铁氰化钾和铁氰化钾的混合物是优选的。电荷载体在膜上可能是不对称的。例如,电荷载体的类型和/或浓度在膜的每一侧可以是不同的。盐浓度可以是饱和的。盐浓度可以是3m或更低,通常为0.1至2.5m,0.3至1.9m,0.5至1.8m,0.7至1.7m,0.9至1.6m或1m至1.4m。盐浓度优选为150mm至1m。该方法优选使用至少为0.3m,例如至少0.4m,至少0.5m,至少0.6m,至少0.8m,在至少1.0m,至少1.5m,至少2.0m,至少2.5m或至少3.0m的盐浓度进行。高盐浓度提供高信噪比,并允许电流指示正常电流波动背景下待鉴定的核苷酸的存在。该方法通常在存在缓冲液的情况下进行。在上述示例性设备中,缓冲液存在于腔室中的水性溶液中。任何缓冲液可用于本发明的方法。通常,缓冲液是磷酸盐缓冲液。其他合适的缓冲液是hepes和三羟甲基氨基甲烷盐酸盐(tris-hcl)缓冲液。该方法通常在4.0至12.0,4.5至10.0,5.0至9.0,5.5至8.8,6.0至8.7或7.0至8.8或7.5至8.5的ph下进行。所用的ph优选为约7.5。该方法可以在0℃至100℃,15℃至95℃,16℃至90℃,17℃至85℃,18℃至80℃,19℃至70℃或在20℃至60℃进行。所述方法通常在室温下进行。所述方法任选地在支持酶功能的温度下进行,例如约37℃。多核苷酸结合蛋白该方法优选包括使所述/每个多核苷酸与多核苷酸结合蛋白接触,使得所述蛋白控制所述/每个多核苷酸的至少一条链通过孔的运动。更优选地,该方法包括(a)使所述/每个多核苷酸与孔以及多核苷酸结合蛋白接触,使得所述蛋白控制所述/每个多核苷酸的至少一条链通过孔的运动,和(b)随着所述/每个多核苷酸相对于孔移动,获取一个或多个测量值,其中测量值指示所述/每个多核苷酸的一个或多个特征,从而表征修饰的多核苷酸或模板多核苷酸。多核苷酸结合蛋白可以是能够结合到多核苷酸并控制其通过孔的运动的任何蛋白质。确定蛋白质是否与多核苷酸结合在本领域是较简单的。蛋白质通常与多核苷酸相互作用并修饰多核苷酸的至少一种特性。蛋白质可以通过将多核苷酸裂解以形成单个核苷酸或核苷酸短链,例如二核苷酸或三核苷酸,来修饰多核苷酸。蛋白质可以通过使其定向到特定位置或将其移动到特定位置,即控制其运动,来修饰多核苷酸。多核苷酸结合蛋白优选衍生自多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸相互作用并修饰多核苷酸的至少一种性质的多肽。酶可以通过将多核苷酸裂解以形成单个核苷酸或核苷酸短链,例如二核苷酸或三核苷酸,来修饰多核苷酸。酶可以通过使其定向到特定位置或将其移动到特定位置来修饰多核苷酸。多核苷酸处理酶不需要显示酶活性,只要其能够结合多核苷酸并控制其通过孔的移动即可。例如,酶可以被修饰以去除其酶活性,或者可以在防止其用作酶的条件下使用。以下更详细地讨论这些条件。多核苷酸处理酶优选衍生自溶核酶(nucleolyticenzyme)。酶的构建体中使用的多核苷酸处理酶更优选衍生自酶分类(ec)组3.1.11,3.1.13,3.1.14,3.1.15,3.1.16,3.1.21,3.1.22,3.1.25,3.1.26,3.1.27,3.1.30和3.1.31中任一成员。酶可以是申请号为pct/gb10/000133(公开为wo2010/086603)的国际申请中公开的那些酶中的任一种。优选的酶是聚合酶、核酸外切酶、解旋酶和拓扑异构酶,如促旋酶。合适的酶包括但不限于来自大肠杆菌的核酸外切酶i(seqidno:11),来自大肠杆菌的核酸外切酶iii(seqidno:13),来自嗜热栖热菌的recj(seqidno:15),以及细菌噬菌体λ核酸外切酶(seqidno:17),tatd核酸外切酶及其变体。包含seqidno:15或其变体中所示序列的三个亚基相互作用以形成三聚体核酸外切酶。聚合酶可以是3173dna聚合酶(可从corporation购得),sd聚合酶(可从购得)或其变体。酶优选为phi29dna聚合酶(seqidno:9)或其变体。拓扑异构酶优选为酶分类(ec)组5.99.1.2和5.99.1.3中的任何成员。该酶最优选衍生自解旋酶,例如he1308mbu(seqidno:18),he1308csy(seqidno:19),he1308tga(seqidno:20),he1308mhu(seqidno:21),traieco(seqidno:22),xpdmbu(seqidno:23)或其变体。在本发明中可以使用任何解旋酶。解旋酶可以是或来自he1308解旋酶,recd解旋酶,例如trai解旋酶或trwc解旋酶,xpd解旋酶或dda解旋酶。解旋酶可以是申请号为pct/gb2012/052579(公开为wo2013/057495),pct/gb2012/053274(公开为wo2013/098562),pct/gb2012/053273(公开为wo2013098561),pct/gb2013/051925(公开为wo2014/013260),pct/gb2013/051924(公开为wo2014/013259),pct/gb2013/051928(公开为wo2014/013262)和pct/gb2014/052736的国际申请中公开的任何解旋酶,修饰的解旋酶或解旋酶构建体。解旋酶优选包含seqidno:25(trwccba)或其变体中所示的序列,seqidno:18(he1308mbu)或其变体中所示的序列,或者seqidno:24(dda)或其变体中所示的序列。变体可不同于以下以任何方式讨论的跨膜孔的天然序列。seqidno:24的优选变体包括(a)e94c和a360c或(b)e94c,a360c,c109a和c136a,然后可选地(δm1)g1g2(即m1缺失,然后添加g1和g2)。在链测序中,多核苷酸顺着或逆着施加的电势被移位穿过孔。在双链多核苷酸上逐渐或进行性地起作用的核酸外切酶可以用在孔的顺式侧以使剩余的单链在施加电势下通过或在反式测在反向电势下使其通过。同样地,解开双链dna的解旋酶也可以以类似的方式使用。也可以使用聚合酶。对于测序应用还有可能需要逆着施加的电势的链移位,但dna必须首先在反向电势或无电势的条件下被酶“捕获”。然后随着电势在结合后切换回来,链将沿顺式到反式通过所述孔并通过电流保持为扩展的构象。单链dna核酸外切酶或单链dna依赖性聚合酶可以作为分子马达,以将最近移位的的单链逆着施加的电势按反式到顺式以受控的逐步方式穿过细孔拉回。任何解旋酶可用于该方法中。解旋酶可以相对于孔以两种模式工作。首先,该方法优选使用解旋酶进行,使得其利用由施加的电压产生的场使多核苷酸移动通过孔。在该模式下,首先将多核苷酸的5′端捕获在孔中,然后解旋酶将多核苷酸移动到孔中,使得其利用场通过孔,直到其最终移位到膜的反式侧。或者,优选进行该方法,使得解旋酶逆着由施加的电压产生的场将多核苷酸移动通过孔。在该模式中,首先将多核苷酸的3′端捕获在孔中,然后解旋酶将多核苷酸移动通过孔,使得其逆着施加的场被从孔中拉出,直到最终被驱逐回膜的顺式侧。(一种或多种)解旋酶和(一种或多种)分子制动器在优选的实施例中,该方法包括:(i)向所述/每个多核苷酸提供一个或多个解旋酶和连接到所述/每个多核苷酸的一个或多个分子制动器;(b)使所述/每个多核苷酸与跨膜孔接触并且跨孔施加电势,使得一个或多个解旋酶和一个或多个分子制动器被聚集在一起,并且两者都控制所述/每个多核苷酸的至少一条链通过孔的运动;(c)随着所述/每个多核苷酸相对于孔移动,获取一个或多个测量值,其中所述测量值指示多核苷酸的一个或多个特征,从而表征经修饰的多核苷酸或模板多核苷酸。这种类型的方法在国际申请pct/gb2014/052737中有详细讨论。间隔基如申请号为pct/gb2014/050175(公开为wo2014/135838)的国际申请中所述,一个或多个解旋酶可以停滞在一个或多个间隔基处。在本发明中可以使用该国际申请中公开的一个或多个解旋酶和一个或多个间隔基的任何构象。当多核苷酸的一部分进入孔并沿着由施加的电势产生的场移动通过孔时,随着多核苷酸移动通过孔,一个或多个解旋酶通过孔被移动通过间隔基。这是因为多核苷酸(包括一个或多个间隔基)移动通过孔并且一个或多个解旋酶保留在孔的顶部。一个或多个间隔基优选是多核苷酸的一部分,例如它们中断所述多核苷酸的序列。一个或多个间隔基优选不是与多核苷酸杂交的一个或多个阻断分子(例如减速带(speedbump))的一部分。多核苷酸中可以存在任何数目的间隔基,例如1,2,3,4,5,6,7,8,9,10或更多个间隔基。多核苷酸中优选有两个,四个或六个间隔基。一个或多个间隔基优选地在y适配器或前导序列中。多核苷酸的不同区域中可以有一个或多个间隔基,例如y适配器和/或发夹环适配器中的一个或多个间隔基。一个或多个间隔基各自提供一个或多个解旋器即使在活动模式下也不能克服的能量屏障。一个或多个间隔基可以通过减少解旋酶的牵引力(例如通过从多核苷酸中的核苷酸中去除碱基)或物理阻断一个或多个解旋酶的运动(例如使用庞大的化学基团)来使一个或多个解旋酶停滞。一个或多个间隔基可以包含使一个或多个解旋酶停滞的任何分子或分子的组合。一个或多个间隔基可以包含阻止一个或多个解旋酶沿多核苷酸移动的任何分子或分子的组合。在不存在跨膜孔和施加的电势的情况下,确定一个或多个解旋酶是否停滞在一个或多个间隔基处是较为容易的。例如,通过page可以测量解旋酶移动通过间隔基并置换dna的互补链的能力。一个或多个间隔基通常包含直链分子,例如聚合物。一个或多个间隔基通常具有与多核苷酸不同的结构。例如,如果多核苷酸是dna,则一个或多个间隔基通常不是dna。特别地,如果多核苷酸是脱氧核糖核酸(dna)或核糖核酸(rna),则一个或多个间隔基优选包含肽核酸(pna),甘油核酸(gna),苏糖核酸(tna),锁定核酸(lna)或具有核苷酸侧链的合成聚合物。一个或多个间隔基可以包含与多核苷酸方向相反的一个或多个核苷酸。例如,当多核苷酸处于5′至3′方向时,一个或多个间隔基可以包含3′至5′方向的一个或多个核苷酸。核苷酸可以是上面讨论的任何核苷酸。一个或多个解旋酶可被每个线性分子间隔基停滞(即停滞在间隔基前面)或被停滞在每个线性分子间隔基上。如果使用直链分子间隔基,则多核苷酸优选具有与每个间隔基的末端相邻的多核苷酸的双链区域,其中一个或多个解旋酶将被移动通过每个间隔基。如果使用线性分子间隔基,则多核苷酸优选在每个间隔基的与一个或多个解旋酶将被移动通过的末端相对末端设置有阻断分子。这可以帮助确保一个或多个解旋酶保持停滞在每个间隔基上。在它/它们在溶液中扩散开的情况下,还可以帮助将一个或多个解旋酶保持在多核苷酸上。阻断分子可以是物理上导致一个或多个解旋酶停滞的下述任何化学基团。阻断分子可以是多核苷酸的双链区域。阻断分子可以是bna。该方法可能涉及将两个或更多个解旋酶移动通过间隔基。在这种情况下,间隔基的长度通常被增加,以防止尾部解旋酶在没有孔和施加电势的情况下推动先导解旋酶经过间隔基。如果该方法涉及移动两个或更多个解旋酶经过一个或多个间隔基,则上述间隔基长度可以增加至少1.5倍,例如2倍,2.5倍或3倍。例如,如果该方法涉及移动两个或多个解旋酶经过一个或多个间隔基,则间隔基长度可以增加1.5倍,2倍,2.5倍或3倍。膜本发明中使用的孔可以存在于膜中。在本发明的方法中,多核苷酸通常与膜中的孔接触。根据本发明,可以使用任何膜。合适的膜是本领域公知的。膜优选为两亲层。两亲层是由具有亲水性和亲油性的两亲分子形成的层,例如磷脂。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物是本领域已知的,并且包含例如嵌段共聚物(gonzalez-perez等人,langmuir,2009,25,10447-10450)。嵌段共聚物是两个或更多个单体子单元聚合在一起形成单个聚合物链的聚合材料。嵌段共聚物通常具有由每个单体子单元贡献的性质。然而,嵌段共聚物可以具有从各个子单元形成的聚合物不具有的独特性质。嵌段共聚物可以被改造成使得单体子单元之一是疏水的(即亲油的),而其他(一个或多个)子单元在水性介质中是亲水的。在这种情况下,嵌段共聚物可以具有两亲性质并且可以形成能模拟生物膜的结构。嵌段共聚物可以是二嵌段(由两个单体子单元组成),但也可以由多于两个的单体子单元构成,以形成表现为两亲体的更为复杂的布置。共聚物可以是三嵌段,四嵌段或五嵌段共聚物。膜优选为三嵌段共聚物膜。膜最优选是国际申请pct/gb2013/052766或pct/gb2013/052767中公开的膜之一。两亲性分子可以被化学修饰或功能化以促进多核苷酸的偶联。偶联所述/每个经修饰的多核苷酸优选与包含孔的膜偶联。该方法可以包括将所述/每个多核苷酸偶联到包含孔的膜。优选使用一个或多个锚将多核苷酸与膜偶联。多核苷酸可以使用任何已知的方法与膜偶联。每个锚包含与多核苷酸偶联(或结合)的基团和与膜偶联(或结合)的基团。每个锚可以与多核苷酸和/或膜共价偶联(或结合)。优选使用y适配器或前导序列和/或发夹环将多核苷酸偶联到膜上。多核苷酸可以使用任何数量的锚,例如2,3,4或更多个锚偶联到膜上。例如,多核苷酸可以使用两个锚偶联到膜上,两个锚中的每个单独地既与多核苷酸偶联(或结合)也与膜偶联(或结合)。一个或多个锚可以包含一个或多个解旋酶和/或一个或多个分子制动器。如果膜是两亲层,例如共聚物膜或脂双层,则一个或多个锚优选包含存在于膜中的多肽锚和/或存在于膜中的疏水性锚。疏水性锚优选为脂质,脂肪酸,固醇,碳纳米管,多肽,蛋白质或氨基酸,例如胆固醇,棕榈酸酯或生育酚。在优选实施例中,一个或多个锚不是孔。膜的组分,例如两亲分子、共聚物或脂质,可以被化学修饰或功能化以形成一个或多个锚。以下将更详细地讨论合适的化学修饰和将膜的组分功能化的合适方式的示例。任何比例的膜组分可以被功能化,例如至少0.01%,至少0.1%,至少1%,至少10%,至少25%,至少50%或100%。多核苷酸可以被直接偶联到膜。用于将多核苷酸偶联到膜上的一个或多个锚优选包含连接体。一个或多个锚可以包括一个或多个,例如2,3,4或更多个连接体。一个连接体可用于将多于一个,例如2,3,4或更多个多核苷酸偶联到膜上。优选的连接体包括但不限于聚合物,例如多核苷酸,聚乙二醇(peg),多糖和多肽。这些连接体可以是直链,支链或环状的。例如,连接体可以是环状多核苷酸。多核苷酸可以与环状多核苷酸连接体上的互补序列杂交。在以下讨论的测序实施例中优选使用连接体。如果多核苷酸直接永久地偶联到膜上,在这种意义上,当与孔相互作用时不进行解偶联(即在步骤(b)或(e))中不进行解偶联),则某些序列数据将丢失,因为由于膜与孔之间的距离测序不能继续到多核苷酸的末端。如果使用连接体,则多多核苷酸可以进行到完成为止。偶联可以是永久的或稳定的。换句话说,偶联可以是这样的:当多核苷酸与孔相互作用时,多核苷酸保持与膜偶联。偶联可能是瞬态的。换句话说,偶联是这样的:当多核苷酸与孔相互作用时,多核苷酸可以与膜解偶联。在申请号为pct/gb12/051191(公开为wo2012/164270)的国际申请和申请号为1406155.0的英国申请中公开了合适的偶联方法。解偶联本发明的方法可以包括表征多个修饰的双链多核苷酸和解偶联至少第一修饰的双链多核苷酸。在优选的实施方案中,本发明涉及表征两个或更多个修饰的双链多核苷酸。该方法包括:(a)在第一样品中提供第一经修饰的双链多核苷酸;(b)在第二样品中提供第二经修饰的双链多核苷酸;(c)使用一个或更多锚将第一样品中的第一多核苷酸与膜偶联;(d)使第一多核苷酸与跨膜孔接触,使得第一多核苷酸的至少一条链移动穿过孔;(e)随着第一多核苷酸相对于孔移动获取一个或多个测量值,其中所述测量值指示第一多核苷酸的一个或多个特征,从而表征第一个多核苷酸;(f)将第一个多核苷酸从膜上解偶联;(g)使用一个或多个锚将第二样品中的第二多核苷酸偶联到膜上;(h)使第二多核苷酸与孔接触,使得第二多核苷酸的至少一条链移动穿过孔;和(i)随着第二多核苷酸相对于孔移动而获取一个或多个测量值,其中所述测量值指示第二多核苷酸的一个或多个特征,从而表征第二多核苷酸。这种类型的方法在申请号为1406155.0的英国申请中有详细讨论。其他表征方法在另一个实施例中,所述/每个经修饰的双链多核苷酸通过下述进行表征:检测当聚合酶将核苷酸并入多核苷酸中时释放的标记物种。聚合酶使用多核苷酸作为模板。每个标记物种对于每个核苷酸是特异性的。所述/每个多核苷酸与跨膜孔、聚合酶和标记的核苷酸接触,使得当通过聚合酶将核苷酸加入到多核苷酸时,磷酸盐标记的物种依次释放,其中磷酸盐物种含有对每个核苷酸特异的标记。聚合酶可以是上面讨论的任何聚合酶。使用孔检测磷酸盐标记的物种,从而表征多核苷酸。这种方法在申请号为13187149.3(公布为ep2682460)的欧洲申请中公开。以上讨论的任何实施例同样适用于该方法。试剂盒本发明还提供了用于修饰模板多核苷酸的试剂盒。试剂盒包含(a)本发明的mua底物群和(b)mua转座酶以及(c)聚合酶。上文参照本发明的方法和产品讨论的任何实施方案同样适用于试剂盒。试剂盒还可以包含膜的组分,例如两亲层或脂质双层的组分。试剂盒还可以包含跨膜孔或跨膜孔的组分。试剂盒还可以包含多核苷酸结合蛋白。上面讨论了合适的膜、孔和多核苷酸结合蛋白。本发明的试剂盒可以另外包含一种或多种使上述任何实施例能够进行的其它试剂或仪器。这样的试剂或仪器包括以下一种或多种:合适的缓冲液(一种或多种)(水性溶液),从受试者获得样品的设备(例如容器或包含针的仪器),用于扩增和/或表达多核苷酸的设备,如上所定义的膜,或者电压或膜片钳装置。试剂可能以干燥状态存在于试剂盒中,使得流体样品使该试剂重悬。试剂盒还可以任选地包括使试剂盒能够用于本发明方法或关于该方法可用于哪些患者的细节的说明。试剂盒可以任选地包含核苷酸。以下实施例说明了本发明。实施例1该实施例描述了用于修饰模板双链多核苷酸的方法,特别是使用纳米孔测序进行表征的方法。该实施例示出了mua转座酶能够含有发夹环的mua底物插入。然后使用聚合酶填充构建体中的间隙,然后加热双链构建体以熔化双链dna。这得到具有发夹的单链dna,聚合酶从该发夹产生互补体。然后将该构建体连接到具有预结合的酶的适配器,并最终与系链杂交。然后,该dna构建体显示出,解旋酶控制dna运动通过纳米孔。材料和方法1.1-使用mua转座酶将dna模板片段化在该实施例中使用的mua适配器x具有5′21bp发夹(在图2中适配器标记为c,上链=seqidno:29,下链=seqidno:30,下链的5′端连接到序列gatcu的3′端)。适配器的上链和下链在10um下,从95℃,以2℃min-1,在10mmtrisph7.5,50mmnacl中退火。mua片段化反应(10μl)如下表1中所述进行设置,并在30℃温育1小时。然后通过在75℃加热15分钟将mua酶进行热灭活。最后将得到的dna进行1.5×spri纯化并在无核酸酶的水(42ul,样品1)中洗脱。表11.2-用dna聚合酶培育dna模板在mua片段化过程之后,然后将纯化的dna用dna聚合酶培育以复制上链发夹。dna聚合酶反应(50ul)如下表2所述设置,并在68℃下培育10分钟。最后,将所得的dna进行1.5×spri纯化并在无核酸酶的水(42ul,样品2)中洗脱。表21.3-热变性和聚合酶填充在发夹复制阶段后,将样品2处理,以进行单一变性步骤和聚合酶填充。对于聚合酶填充反应,对聚合酶提供有dctp/dgtp/datp,但用不同的核苷酸种类5-丙炔基-du代替标准dttp。反应(50μ)如下表3所述进行设置,并在95℃培育2分钟,55℃培育30秒,68℃培育30分钟。最后,将所得dna进行1.5×spri纯化并在无核酸酶的水(45μl,样品3)中洗脱。表31.4-da拖尾反应然后将样品3如下表4所述进行da拖尾,并在37℃下培育30分钟。将所得dna进行1.5×spri纯化并在无核酸酶的水(20ul,样品4)中洗脱。试剂组分样品342μl10xnebda-拖尾缓冲液5μlklenowexo-3μl表41.5-用预加载的酶连接适配器然后将样品4用预加载的酶(t4dda-e94c/a360c/c109a/c136a(具有突变e94c/a360c/c114a/c171a/c421d以及(δm1)g1g2)的seqidno:24)连接到y适配器1(上链=在3′端连接到seqidno:32的20个ispc3间隔基,seqidno:32的3′端连接到4个isp18间隔基,isp18间隔基3′端连接到seqidno:33,底部链=连接有5’磷酸盐的seqidno:34),如下表5所述,并在室温下培育20分钟。将所得的dna进行0.4×spri纯化,并用缓冲液(200μl的750mmnacl,10%peg8000,50mmtris.hclph8)洗涤,并在缓冲液(20ul的40mmcapsph10,40mmkc1样品5)中洗脱。试剂组分样品420uly-适配器15μlnebblunttamm(2x)25μl表51.6-系链的退火然后将存在于样品5中的dna分析物退火至系链。将样品5用dna系链(aacaacct序列其5′端连接到三个isp18间隔基,两个胸腺嘧啶和5′胆固醇teg,并且序列aacaacct其3′端连接到三个3′端连接到seqidno:35的isp18间隔基),500nm,5μl)在室温下培育10分钟。所得样品称为样品6。1.7-电生理检测在设置实验之前,将dna样品6(样品6的总体积的四分之一)加入到缓冲液(25mm磷酸钾缓冲液(ph7.5),500mmkc1),mgcl2(1mm)和atp(2mm),所得总体积为150μl。在缓冲液(25mmk磷酸盐缓冲液,150mm亚铁氰化钾(ii))和150mm铁氰化钾(iii),ph8.0)中从插入嵌段共聚物中的单个mspa纳米孔获得电测量值。在实现单孔插入嵌段共聚物中之后,将缓冲液(2ml,25mmk磷酸盐缓冲液,150mm亚铁氰化钾(ii),150mm铁氰化钾(iii),ph8.0)流过系统以去除任何过量mspa纳米孔。然后将酶(t4dda-e94c/c109a/c136a/a360c,10nm最终浓度),dna样品6和燃料(mgcl22m最终浓度,atp2mm最终浓度)预混合物(总共150μl)流入单纳米孔实验系统中。实验在120mv下进行,并且监测解旋酶控制的dna运动6小时。结果观察到,样品制备过程(样品6)结束时产生的dna的解旋酶控制的dna运动。图3显示了解旋酶控制dna运动的示例。还使用agilent12,000dna芯片迹线分析样品制备过程。如果没有在68℃下的预培育,则在步骤1.2(其中5′发夹被转录)之前,随后在链离解(热变性步骤1.3)之后,没有制得合成的互补体(在图2的步骤4之后以虚线/点线示出),因为链缺少聚合酶引发所必需的3′发夹。这在图4所示的agilent12,000dna芯片迹线中被观察到,其中标记为1的线是未处理的mua片段化的dna输入材料,标记为2的线是具有68℃培育步骤(在以上的1.2中)且随后经历了所有1.3步骤的分析物,并且标记为3的线在步骤1.2中没有68℃培育,但经历了所有1.3步骤。因此,对于线3,没有制得dsdna,因此在agilent迹线上观察到平坦的线(区域标记为x),因为在95℃下链离解之前没有被复制的发夹。然而,对于线2,发夹被转录并且因此在链离解时,聚合酶从新的3′发夹引发填充。这意味着线2示出了在区域x中的峰,其对应于由复制的发夹制成的dsdna产物。然而,如上所述,在步骤1.3中重复上述过程,向聚合酶提供标准dnadntp′s-dctp/datp/dgtp/dttp,而不是产生dna样品7的5-丙炔基-du。图6示出了dna样品7(其在步骤1.3中使用标准dnadntp′s制备)的示例性的解旋酶控制的dna移动。该样品制备过程是成功的,并且观察到该样品的解旋酶控制的dna运动。实施例2该实施例描述了用于修饰模板双链多核苷酸的方法,特别是使用纳米孔测序进行表征的方法。图7示出了下面步骤2.1和2.2中描述的样品制备步骤的卡通表示。该实施例示出了mua转座酶能够将含有发夹环(该发夹环含有dg和dc的类似物)的mua底物插入mua适配器的发夹环(dg被脱氧肌苷取代并且dc被脱氧zebularine取代)。然后使用聚合酶填充构建体中的间隙,所述聚合酶用与包含发夹环的链互补的新链取代突出链。与包含发夹环的链互补的新链也能够形成发夹环。新链的发夹环具有比双链区更高的tm,该双链区在互补链和由a/t/z/i(在图7中标记为1x)制成的发夹环之间形成。因此,形成了新链中的发夹(图7中标记为f2h)并且也形成了由a/t/z/i制成的发夹环(在图7中标记为f1h)。然后聚合酶将发夹环用作引物以制备互补链。因此,不需要额外的加热步骤来分离在图7的步骤2之后产生的dsdna构建体。2.1-使用mua转座酶片段化dna模板在该实施例中使用的mua适配器具有5′7bp发夹,dg被替换为dinosine,dc被替换为dzebularine。适配器p的上链(经修饰的多核苷酸序列izitaz(其中i是脱氧肌苷,z是脱氧zebularrine)被连接到未经修饰的多核苷酸序列ttttta的5′端,ttttta的3′端与连接到seqidno:39的5′端的经修饰的多核苷酸序列itaziz(其中i是脱氧肌苷,z是脱氧zebularine)连接)和下链(seqidno:38)在10um,95℃,以2℃min-1,在10mmtrisph7.5,50mmnacl中退火。如上表1所述,mua片段化反应(10μl)使用适配器p而不是适配器x设置,并在30℃下培育1小时。然后通过在75℃加热15分钟将mua酶进行热灭活。最后,将所得的dna进行1.5×spri纯化并在无核酸酶的水(42μl)中洗脱。2.2-用dna聚合酶培育dna模板在mua片段化过程之后,将纯化的dna用dna聚合酶培育以复制上链发夹(其g/c用i/z替换)。在此步骤期间,与包含发夹环的链互补的新链形成发夹环。这是由于由新链形成的发夹环比在互补链和含有dz和di的类似物的发夹环之间形成的双链区具有更高的tm。因此,不需要加热双链dna,来将其分离成ssdna,因为具有较高tm的发夹环优先形成,然后聚合酶使用该发夹环作为引物来制得互补链。dna聚合酶反应(50ul)如下表所述设置,并在37℃培育30分钟。最后,将所得的dna进行1.5×spri纯化并在无核酸酶的水(42ul)中洗脱。表6该链可以通过da拖尾进一步修饰,将适配器与预加载的酶连接并与系链杂交(如实施例1.4-1.6中所述),从而产生可以使用纳米孔系统表征的链(如实施例1.7中所述)。序列表<110>牛津纳米孔技术公司<120>方法<130>n404112wo<140>gb1418159.8<141>2014-10-14<160>37<170>patentinversion3.5<210>1<211>558<212>dna<213>人工序列<220><223>耻垢分枝杆菌(mycobacteriumsmegmatis)孔蛋白a突变体(d90n/d91n/d93n/d118r/d134r/e193k)<400>1atgggtctggataatgaactgagcctggtggacggtcaagatcgtaccctgacggtgcaa60caatgggatacctttctgaatggcgtttttccgctggatcgtaatcgcctgacccgtgaa120tggtttcattccggtcgcgcaaaatatatcgtcgcaggcccgggtgctgacgaattcgaa180ggcacgctggaactgggttatcagattggctttccgtggtcactgggcgttggtatcaac240ttctcgtacaccacgccgaatattctgatcaacaatggtaacattaccgcaccgccgttt300ggcctgaacagcgtgattacgccgaacctgtttccgggtgttagcatctctgcccgtctg360ggcaatggtccgggcattcaagaagtggcaacctttagtgtgcgcgtttccggcgctaaa420ggcggtgtcgcggtgtctaacgcccacggtaccgttacgggcgcggccggcggtgtcctg480ctgcgtccgttcgcgcgcctgattgcctctaccggcgacagcgttacgacctatggcgaa540ccgtggaatatgaactaa558<210>2<211>184<212>prt<213>人工序列<220><223>耻垢分枝杆菌孔蛋白a突变体(d90n/d91n/d93n/d118r/d134r/e139k)<400>2glyleuaspasngluleuserleuvalaspglyglnaspargthrleu151015thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp202530argasnargleuthrargglutrpphehisserglyargalalystyr354045ilevalalaglyproglyalaaspgluphegluglythrleugluleu505560glytyrglnileglypheprotrpserleuglyvalglyileasnphe65707580sertyrthrthrproasnileleuileasnasnglyasnilethrala859095propropheglyleuasnservalilethrproasnleupheprogly100105110valserileseralaargleuglyasnglyproglyileglngluval115120125alathrpheservalargvalserglyalalysglyglyvalalaval130135140serasnalahisglythrvalthrglyalaalaglyglyvalleuleu145150155160argprophealaargleuilealaserthrglyaspservalthrthr165170175tyrglygluprotrpasnmetasn180<210>3<211>885<212>dna<213>人工序列<220><223>α-溶血素突变体(e111n/k147n)<400>3atggcagattctgatattaatattaaaaccggtactacagatattggaagcaatactaca60gtaaaaacaggtgatttagtcacttatgataaagaaaatggcatgcacaaaaaagtattt120tatagttttatcgatgataaaaatcacaataaaaaactgctagttattagaacaaaaggt180accattgctggtcaatatagagtttatagcgaagaaggtgctaacaaaagtggtttagcc240tggccttcagcctttaaggtacagttgcaactacctgataatgaagtagctcaaatatct300gattactatccaagaaattcgattgatacaaaaaactatatgagtactttaacttatgga360ttcaacggtaatgttactggtgatgatacaggaaaaattggcggccttattggtgcaaat420gtttcgattggtcatacactgaactatgttcaacctgatttcaaaacaattttagagagc480ccaactgataaaaaagtaggctggaaagtgatatttaacaatatggtgaatcaaaattgg540ggaccatacgatcgagattcttggaacccggtatatggcaatcaacttttcatgaaaact600agaaatggttctatgaaagcagcagataacttccttgatcctaacaaagcaagttctcta660ttatcttcagggttttcaccagacttcgctacagttattactatggatagaaaagcatcc720aaacaacaaacaaatatagatgtaatatacgaacgagttcgtgatgattaccaattgcat780tggacttcaacaaattggaaaggtaccaatactaaagataaatggacagatcgttcttca840gaaagatataaaatcgattgggaaaaagaagaaatgacaaattaa885<210>4<211>293<212>prt<213>人工序列<220><223>α-溶血素突变体(e111n/k147n)<400>4alaaspseraspileasnilelysthrglythrthraspileglyser151015asnthrthrvallysthrglyaspleuvalthrtyrasplysgluasn202530glymethislyslysvalphetyrserpheileaspasplysasnhis354045asnlyslysleuleuvalileargthrlysglythrilealaglygln505560tyrargvaltyrserglugluglyalaasnlysserglyleualatrp65707580proseralaphelysvalglnleuglnleuproaspasngluvalala859095glnileserasptyrtyrproargasnserileaspthrlysasntyr100105110metserthrleuthrtyrglypheasnglyasnvalthrglyaspasp115120125thrglylysileglyglyleuileglyalaasnvalserileglyhis130135140thrleuasntyrvalglnproaspphelysthrileleugluserpro145150155160thrasplyslysvalglytrplysvalilepheasnasnmetvalasn165170175glnasntrpglyprotyraspargaspsertrpasnprovaltyrgly180185190asnglnleuphemetlysthrargasnglysermetlysalaalaasp195200205asnpheleuaspproasnlysalaserserleuleuserserglyphe210215220serproaspphealathrvalilethrmetasparglysalaserlys225230235240glnglnthrasnileaspvaliletyrgluargvalargaspasptyr245250255glnleuhistrpthrserthrasntrplysglythrasnthrlysasp260265270lystrpthraspargsersergluargtyrlysileasptrpglulys275280285gluglumetthrasn290<210>5<211>184<212>prt<213>耻垢分枝杆菌<400>5glyleuaspasngluleuserleuvalaspglyglnaspargthrleu151015thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp202530argasnargleuthrargglutrpphehisserglyargalalystyr354045ilevalalaglyproglyalaaspgluphegluglythrleugluleu505560glytyrglnileglypheprotrpserleuglyvalglyileasnphe65707580sertyrthrthrproasnileleuileaspaspglyaspilethrala859095propropheglyleuasnservalilethrproasnleupheprogly100105110valserileseralaaspleuglyasnglyproglyileglngluval115120125alathrpheservalaspvalserglyproalaglyglyvalalaval130135140serasnalahisglythrvalthrglyalaalaglyglyvalleuleu145150155160argprophealaargleuilealaserthrglyaspservalthrthr165170175tyrglygluprotrpasnmetasn180<210>6<211>184<212>prt<213>耻垢分枝杆菌<400>6glyleuaspasngluleuserleuvalaspglyglnaspargthrleu151015thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp202530argasnargleuthrargglutrpphehisserglyargalalystyr354045ilevalalaglyproglyalaaspgluphegluglythrleugluleu505560glytyrglnileglypheprotrpserleuglyvalglyileasnphe65707580sertyrthrthrproasnileleuileaspaspglyaspilethrgly859095propropheglyleugluservalilethrproasnleupheprogly100105110valserileseralaaspleuglyasnglyproglyileglngluval115120125alathrpheservalaspvalserglyproalaglyglyvalalaval130135140serasnalahisglythrvalthrglyalaalaglyglyvalleuleu145150155160argprophealaargleuilealaserthrglyaspservalthrthr165170175tyrglygluprotrpasnmetasn180<210>7<211>183<212>prt<213>耻垢分枝杆菌<400>7valaspasnglnleuservalvalaspglyglnglyargthrleuthr151015valglnglnalagluthrpheleuasnglyvalpheproleuasparg202530asnargleuthrargglutrpphehisserglyargalathrtyrhis354045valalaglyproglyalaaspgluphegluglythrleugluleugly505560tyrglnvalglypheprotrpserleuglyvalglyileasnpheser65707580tyrthrthrproasnileleuileaspglyglyaspilethrglnpro859095propheglyleuaspthrileilethrproasnleupheproglyval100105110serileseralaaspleuglyasnglyproglyileglngluvalala115120125thrpheservalaspvallysglyalalysglyalavalalavalser130135140asnalahisglythrvalthrglyalaalaglyglyvalleuleuarg145150155160prophealaargleuilealaserthrglyaspservalthrthrtyr165170175glygluprotrpasnmetasn180<210>8<211>1830<212>dna<213>枯草芽孢杆菌噬菌体(bacillussubtilisphage)phi29<400>8atgaaacacatgccgcgtaaaatgtatagctgcgcgtttgaaaccacgaccaaagtggaa60gattgtcgcgtttgggcctatggctacatgaacatcgaagatcattctgaatacaaaatc120ggtaacagtctggatgaatttatggcatgggtgctgaaagttcaggcggatctgtacttc180cacaacctgaaatttgatggcgcattcattatcaactggctggaacgtaatggctttaaa240tggagcgcggatggtctgccgaacacgtataataccattatctctcgtatgggccagtgg300tatatgattgatatctgcctgggctacaaaggtaaacgcaaaattcataccgtgatctat360gatagcctgaaaaaactgccgtttccggtgaagaaaattgcgaaagatttcaaactgacg420gttctgaaaggcgatattgattatcacaaagaacgtccggttggttacaaaatcaccccg480gaagaatacgcatacatcaaaaacgatatccagatcatcgcagaagcgctgctgattcag540tttaaacagggcctggatcgcatgaccgcgggcagtgatagcctgaaaggtttcaaagat600atcatcacgaccaaaaaattcaaaaaagtgttcccgacgctgagcctgggtctggataaa660gaagttcgttatgcctaccgcggcggttttacctggctgaacgatcgtttcaaagaaaaa720gaaattggcgagggtatggtgtttgatgttaatagtctgtatccggcacagatgtacagc780cgcctgctgccgtatggcgaaccgatcgtgttcgagggtaaatatgtttgggatgaagat840tacccgctgcatattcagcacatccgttgtgaatttgaactgaaagaaggctatattccg900accattcagatcaaacgtagtcgcttctataagggtaacgaatacctgaaaagctctggc960ggtgaaatcgcggatctgtggctgagtaacgtggatctggaactgatgaaagaacactac1020gatctgtacaacgttgaatacatcagcggcctgaaatttaaagccacgaccggtctgttc1080aaagatttcatcgataaatggacctacatcaaaacgacctctgaaggcgcgattaaacag1140ctggccaaactgatgctgaacagcctgtatggcaaattcgcctctaatccggatgtgacc1200ggtaaagttccgtacctgaaagaaaatggcgcactgggttttcgcctgggcgaagaagaa1260acgaaagatccggtgtataccccgatgggtgttttcattacggcctgggcacgttacacg1320accatcaccgcggcccaggcatgctatgatcgcattatctactgtgataccgattctatt1380catctgacgggcaccgaaatcccggatgtgattaaagatatcgttgatccgaaaaaactg1440ggttattgggcccacgaaagtacgtttaaacgtgcaaaatacctgcgccagaaaacctac1500atccaggatatctacatgaaagaagtggatggcaaactggttgaaggttctccggatgat1560tacaccgatatcaaattcagtgtgaaatgcgccggcatgacggataaaatcaaaaaagaa1620gtgaccttcgaaaacttcaaagttggtttcagccgcaaaatgaaaccgaaaccggtgcag1680gttccgggcggtgtggttctggtggatgatacgtttaccattaaatctggcggtagtgcg1740tggagccatccgcagttcgaaaaaggcggtggctctggtggcggttctggcggtagtgcc1800tggagccacccgcagtttgaaaaataataa1830<210>9<211>608<212>prt<213>枯草芽孢杆菌噬菌体phi29<400>9metlyshismetproarglysmettyrsercysalaphegluthrthr151015thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile202530gluasphisserglutyrlysileglyasnserleuaspgluphemet354045alatrpvalleulysvalglnalaaspleutyrphehisasnleulys505560pheaspglyalapheileileasntrpleugluargasnglyphelys65707580trpseralaaspglyleuproasnthrtyrasnthrileileserarg859095metglyglntrptyrmetileaspilecysleuglytyrlysglylys100105110arglysilehisthrvaliletyraspserleulyslysleuprophe115120125provallyslysilealalysaspphelysleuthrvalleulysgly130135140aspileasptyrhislysgluargprovalglytyrlysilethrpro145150155160gluglutyralatyrilelysasnaspileglnileilealagluala165170175leuleuileglnphelysglnglyleuaspargmetthralaglyser180185190aspserleulysglyphelysaspileilethrthrlyslysphelys195200205lysvalpheprothrleuserleuglyleuasplysgluvalargtyr210215220alatyrargglyglyphethrtrpleuasnaspargphelysglulys225230235240gluileglygluglymetvalpheaspvalasnserleutyrproala245250255glnmettyrserargleuleuprotyrglygluproilevalpheglu260265270glylystyrvaltrpaspgluasptyrproleuhisileglnhisile275280285argcysgluphegluleulysgluglytyrileprothrileglnile290295300lysargserargphetyrlysglyasnglutyrleulyssersergly305310315320glygluilealaaspleutrpleuserasnvalaspleugluleumet325330335lysgluhistyraspleutyrasnvalglutyrileserglyleulys340345350phelysalathrthrglyleuphelysasppheileasplystrpthr355360365tyrilelysthrthrsergluglyalailelysglnleualalysleu370375380metleuasnserleutyrglylysphealaserasnproaspvalthr385390395400glylysvalprotyrleulysgluasnglyalaleuglypheargleu405410415glygluglugluthrlysaspprovaltyrthrprometglyvalphe420425430ilethralatrpalaargtyrthrthrilethralaalaglnalacys435440445tyraspargileiletyrcysaspthraspserilehisleuthrgly450455460thrgluileproaspvalilelysaspilevalaspprolyslysleu465470475480glytyrtrpalahisgluserthrphelysargalalystyrleuarg485490495glnlysthrtyrileglnaspiletyrmetlysgluvalaspglylys500505510leuvalgluglyserproaspasptyrthraspilelyspheserval515520525lyscysalaglymetthrasplysilelyslysgluvalthrpheglu530535540asnphelysvalglypheserarglysmetlysprolysprovalgln545550555560valproglyglyvalvalleuvalaspaspthrphethrilelysser565570575glyglyseralatrpserhisproglnpheglulysglyglyglyser580585590glyglyglyserglyglyseralatrpserhisproglnpheglulys595600605<210>10<211>1390<212>dna<213>大肠杆菌(escherichiacoli)<400>10atgatgaacgatggcaaacagcagagcaccttcctgtttcatgattatgaaaccttcggt60acccatccggccctggatcgtccggcgcagtttgcggccattcgcaccgatagcgaattc120aatgtgattggcgaaccggaagtgttttattgcaaaccggccgatgattatctgccgcag180ccgggtgcggtgctgattaccggtattaccccgcaggaagcgcgcgcgaaaggtgaaaac240gaagcggcgtttgccgcgcgcattcatagcctgtttaccgtgccgaaaacctgcattctg300ggctataacaatgtgcgcttcgatgatgaagttacccgtaatatcttttatcgtaacttt360tatgatccgtatgcgtggagctggcagcatgataacagccgttgggatctgctggatgtg420atgcgcgcgtgctatgcgctgcgcccggaaggcattaattggccggaaaacgatgatggc480ctgccgagctttcgtctggaacatctgaccaaagccaacggcattgaacatagcaatgcc540catgatgcgatggccgatgtttatgcgaccattgcgatggcgaaactggttaaaacccgt600cagccgcgcctgtttgattatctgtttacccaccgtaacaaacacaaactgatggcgctg660attgatgttccgcagatgaaaccgctggtgcatgtgagcggcatgtttggcgcctggcgc720ggcaacaccagctgggtggccccgctggcctggcacccggaaaatcgtaacgccgtgatt780atggttgatctggccggtgatattagcccgctgctggaactggatagcgataccctgcgt840gaacgcctgtataccgccaaaaccgatctgggcgataatgccgccgtgccggtgaaactg900gttcacattaacaaatgcccggtgctggcccaggcgaacaccctgcgcccggaagatgcg960gatcgtctgggtattaatcgccagcattgtctggataatctgaaaatcctgcgtgaaaac1020ccgcaggtgcgtgaaaaagtggtggcgatcttcgcggaagcggaaccgttcaccccgagc1080gataacgtggatgcgcagctgtataacggcttctttagcgatgccgatcgcgcggcgatg1140aaaatcgttctggaaaccgaaccgcgcaatctgccggcgctggatattacctttgttgat1200aaacgtattgaaaaactgctgtttaattatcgtgcgcgcaattttccgggtaccctggat1260tatgccgaacagcagcgttggctggaacatcgtcgtcaggttttcaccccggaatttctg1320cagggttatgcggatgaactgcagatgctggttcagcagtatgccgatgataaagaaaaa1380gtggcgctgc1390<210>11<211>485<212>prt<213>大肠杆菌<400>11metmetasnaspglylysglnglnserthrpheleuphehisasptyr151015gluthrpheglythrhisproalaleuaspargproalaglnpheala202530alaileargthraspserglupheasnvalileglygluprogluval354045phetyrcyslysproalaaspasptyrleuproglnproglyalaval505560leuilethrglyilethrproglnglualaargalalysglygluasn65707580glualaalaphealaalaargilehisserleuphethrvalprolys859095thrcysileleuglytyrasnasnvalargpheaspaspgluvalthr100105110argasnilephetyrargasnphetyraspprotyralatrpsertrp115120125glnhisaspasnserargtrpaspleuleuaspvalmetargalacys130135140tyralaleuargprogluglyileasntrpprogluasnaspaspgly145150155160leuproserpheargleugluhisleuthrlysalaasnglyileglu165170175hisserasnalahisaspalametalaaspvaltyralathrileala180185190metalalysleuvallysthrargglnproargleupheasptyrleu195200205phethrhisargasnlyshislysleumetalaleuileaspvalpro210215220glnmetlysproleuvalhisvalserglymetpheglyalatrparg225230235240glyasnthrsertrpvalalaproleualatrphisprogluasnarg245250255asnalavalilemetvalaspleualaglyaspileserproleuleu260265270gluleuaspseraspthrleuarggluargleutyrthralalysthr275280285aspleuglyaspasnalaalavalprovallysleuvalhisileasn290295300lyscysprovalleualaglnalaasnthrleuargprogluaspala305310315320aspargleuglyileasnargglnhiscysleuaspasnleulysile325330335leuarggluasnproglnvalargglulysvalvalalailepheala340345350glualagluprophethrproseraspasnvalaspalaglnleutyr355360365asnglyphepheseraspalaaspargalaalametlysilevalleu370375380gluthrgluproargasnleuproalaleuaspilethrphevalasp385390395400lysargileglulysleuleupheasntyrargalaargasnphepro405410415glythrleuasptyralagluglnglnargtrpleugluhisargarg420425430glnvalphethrproglupheleuglnglytyralaaspgluleugln435440445metleuvalglnglntyralaaspasplysglulysvalalaleuleu450455460lysalaleutrpglntyralaglugluilevalserglyserglyhis465470475480hishishishishis485<210>12<211>804<212>dna<213>大肠杆菌<400>12atgaaatttgtctcttttaatatcaacggcctgcgcgccagacctcaccagcttgaagcc60atcgtcgaaaagcaccaaccggatgtgattggcctgcaggagacaaaagttcatgacgat120atgtttccgctcgaagaggtggcgaagctcggctacaacgtgttttatcacgggcagaaa180ggccattatggcgtggcgctgctgaccaaagagacgccgattgccgtgcgtcgcggcttt240cccggtgacgacgaagaggcgcagcggcggattattatggcggaaatcccctcactgctg300ggtaatgtcaccgtgatcaacggttacttcccgcagggtgaaagccgcgaccatccgata360aaattcccggcaaaagcgcagttttatcagaatctgcaaaactacctggaaaccgaactc420aaacgtgataatccggtactgattatgggcgatatgaatatcagccctacagatctggat480atcggcattggcgaagaaaaccgtaagcgctggctgcgtaccggtaaatgctctttcctg540ccggaagagcgcgaatggatggacaggctgatgagctgggggttggtcgataccttccgc600catgcgaatccgcaaacagcagatcgtttctcatggtttgattaccgctcaaaaggtttt660gacgataaccgtggtctgcgcatcgacctgctgctcgccagccaaccgctggcagaatgt720tgcgtagaaaccggcatcgactatgaaatccgcagcatggaaaaaccgtccgatcacgcc780cccgtctgggcgaccttccgccgc804<210>13<211>268<212>prt<213>大肠杆菌<400>13metlysphevalserpheasnileasnglyleuargalaargprohis151015glnleuglualailevalglulyshisglnproaspvalileglyleu202530glngluthrlysvalhisaspaspmetpheproleuglugluvalala354045lysleuglytyrasnvalphetyrhisglyglnlysglyhistyrgly505560valalaleuleuthrlysgluthrproilealavalargargglyphe65707580proglyaspaspgluglualaglnargargileilemetalagluile859095proserleuleuglyasnvalthrvalileasnglytyrpheprogln100105110glygluserargasphisproilelyspheproalalysalaglnphe115120125tyrglnasnleuglnasntyrleugluthrgluleulysargaspasn130135140provalleuilemetglyaspmetasnileserprothraspleuasp145150155160ileglyileglyglugluasnarglysargtrpleuargthrglylys165170175cysserpheleuproglugluargglutrpmetaspargleumetser180185190trpglyleuvalaspthrphearghisalaasnproglnthralaasp195200205argphesertrppheasptyrargserlysglypheaspaspasnarg210215220glyleuargileaspleuleuleualaserglnproleualaglucys225230235240cysvalgluthrglyileasptyrgluileargsermetglulyspro245250255serasphisalaprovaltrpalathrpheargarg260265<210>14<211>1275<212>dna<213>嗜热栖热菌(thermusthermophilus)<400>14atgtttcgtcgtaaagaagatctggatccgccgctggcactgctgccgctgaaaggcctg60cgcgaagccgccgcactgctggaagaagcgctgcgtcaaggtaaacgcattcgtgttcac120ggcgactatgatgcggatggcctgaccggcaccgcgatcctggttcgtggtctggccgcc180ctgggtgcggatgttcatccgtttatcccgcaccgcctggaagaaggctatggtgtcctg240atggaacgcgtcccggaacatctggaagcctcggacctgtttctgaccgttgactgcggc300attaccaaccatgcggaactgcgcgaactgctggaaaatggcgtggaagtcattgttacc360gatcatcatacgccgggcaaaacgccgccgccgggtctggtcgtgcatccggcgctgacg420ccggatctgaaagaaaaaccgaccggcgcaggcgtggcgtttctgctgctgtgggcactg480catgaacgcctgggcctgccgccgccgctggaatacgcggacctggcagccgttggcacc540attgccgacgttgccccgctgtggggttggaatcgtgcactggtgaaagaaggtctggca600cgcatcccggcttcatcttgggtgggcctgcgtctgctggctgaagccgtgggctatacc660ggcaaagcggtcgaagtcgctttccgcatcgcgccgcgcatcaatgcggcttcccgcctg720ggcgaagcggaaaaagccctgcgcctgctgctgacggatgatgcggcagaagctcaggcg780ctggtcggcgaactgcaccgtctgaacgcccgtcgtcagaccctggaagaagcgatgctg840cgcaaactgctgccgcaggccgacccggaagcgaaagccatcgttctgctggacccggaa900ggccatccgggtgttatgggtattgtggcctctcgcatcctggaagcgaccctgcgcccg960gtctttctggtggcccagggcaaaggcaccgtgcgttcgctggctccgatttccgccgtc1020gaagcactgcgcagcgcggaagatctgctgctgcgttatggtggtcataaagaagcggcg1080ggtttcgcaatggatgaagcgctgtttccggcgttcaaagcacgcgttgaagcgtatgcc1140gcacgtttcccggatccggttcgtgaagtggcactgctggatctgctgccggaaccgggc1200ctgctgccgcaggtgttccgtgaactggcactgctggaaccgtatggtgaaggtaacccg1260gaaccgctgttcctg1275<210>15<211>425<212>prt<213>嗜热栖热菌<400>15metpheargarglysgluaspleuaspproproleualaleuleupro151015leulysglyleuargglualaalaalaleuleugluglualaleuarg202530glnglylysargileargvalhisglyasptyraspalaaspglyleu354045thrglythralaileleuvalargglyleualaalaleuglyalaasp505560valhispropheileprohisargleuglugluglytyrglyvalleu65707580metgluargvalprogluhisleuglualaseraspleupheleuthr859095valaspcysglyilethrasnhisalagluleuarggluleuleuglu100105110asnglyvalgluvalilevalthrasphishisthrproglylysthr115120125proproproglyleuvalvalhisproalaleuthrproaspleulys130135140glulysprothrglyalaglyvalalapheleuleuleutrpalaleu145150155160hisgluargleuglyleuproproproleuglutyralaaspleuala165170175alavalglythrilealaaspvalalaproleutrpglytrpasnarg180185190alaleuvallysgluglyleualaargileproalasersertrpval195200205glyleuargleuleualaglualavalglytyrthrglylysalaval210215220gluvalalapheargilealaproargileasnalaalaserargleu225230235240glyglualaglulysalaleuargleuleuleuthraspaspalaala245250255glualaglnalaleuvalglygluleuhisargleuasnalaargarg260265270glnthrleugluglualametleuarglysleuleuproglnalaasp275280285proglualalysalailevalleuleuaspprogluglyhisprogly290295300valmetglyilevalalaserargileleuglualathrleuargpro305310315320valpheleuvalalaglnglylysglythrvalargserleualapro325330335ileseralavalglualaleuargseralagluaspleuleuleuarg340345350tyrglyglyhislysglualaalaglyphealametaspglualaleu355360365pheproalaphelysalaargvalglualatyralaalaargphepro370375380aspprovalarggluvalalaleuleuaspleuleuprogluprogly385390395400leuleuproglnvalphearggluleualaleuleugluprotyrgly405410415gluglyasnprogluproleupheleu420425<210>16<211>738<212>dna<213>细菌噬菌体λ(bacteriophagelambda)<400>16tccggaagcggctctggtagtggttctggcatgacaccggacattatcctgcagcgtacc60gggatcgatgtgagagctgtcgaacagggggatgatgcgtggcacaaattacggctcggc120gtcatcaccgcttcagaagttcacaacgtgatagcaaaaccccgctccggaaagaagtgg180cctgacatgaaaatgtcctacttccacaccctgcttgctgaggtttgcaccggtgtggct240ccggaagttaacgctaaagcactggcctggggaaaacagtacgagaacgacgccagaacc300ctgtttgaattcacttccggcgtgaatgttactgaatccccgatcatctatcgcgacgaa360agtatgcgtaccgcctgctctcccgatggtttatgcagtgacggcaacggccttgaactg420aaatgcccgtttacctcccgggatttcatgaagttccggctcggtggtttcgaggccata480aagtcagcttacatggcccaggtgcagtacagcatgtgggtgacgcgaaaaaatgcctgg540tactttgccaactatgacccgcgtatgaagcgtgaaggcctgcattatgtcgtgattgag600cgggatgaaaagtacatggcgagttttgacgagatcgtgccggagttcatcgaaaaaatg660gacgaggcactggctgaaattggttttgtatttggggagcaatggcgatctggctctggt720tccggcagcggttccgga738<210>17<211>226<212>prt<213>细菌噬菌体λ<400>17metthrproaspileileleuglnargthrglyileaspvalargala151015valgluglnglyaspaspalatrphislysleuargleuglyvalile202530thralasergluvalhisasnvalilealalysproargserglylys354045lystrpproaspmetlysmetsertyrphehisthrleuleualaglu505560valcysthrglyvalalaprogluvalasnalalysalaleualatrp65707580glylysglntyrgluasnaspalaargthrleuphegluphethrser859095glyvalasnvalthrgluserproileiletyrargaspglusermet100105110argthralacysserproaspglyleucysseraspglyasnglyleu115120125gluleulyscysprophethrserargaspphemetlyspheargleu130135140glyglypheglualailelysseralatyrmetalaglnvalglntyr145150155160sermettrpvalthrarglysasnalatrptyrphealaasntyrasp165170175proargmetlysarggluglyleuhistyrvalvalilegluargasp180185190glulystyrmetalaserpheaspgluilevalproglupheileglu195200205lysmetaspglualaleualagluileglyphevalpheglyglugln210215220trparg225<210>18<211>760<212>prt<213>伯顿拟甲烷球菌(methanococcoidesburtonii)<400>18metmetilearggluleuaspileproargaspileileglyphetyr151015gluaspserglyilelysgluleutyrproproglnalaglualaile202530glumetglyleuleuglulyslysasnleuleualaalaileprothr354045alaserglylysthrleuleualagluleualametilelysalaile505560arggluglyglylysalaleutyrilevalproleuargalaleuala65707580serglulysphegluargphelysgluleualapropheglyilelys859095valglyileserthrglyaspleuaspserargalaasptrpleugly100105110valasnaspileilevalalathrserglulysthraspserleuleu115120125argasnglythrsertrpmetaspgluilethrthrvalvalvalasp130135140gluilehisleuleuaspserlysasnargglyprothrleugluval145150155160thrilethrlysleumetargleuasnproaspvalglnvalvalala165170175leuseralathrvalglyasnalaargglumetalaasptrpleugly180185190alaalaleuvalleuserglutrpargprothraspleuhisglugly195200205valleupheglyaspalaileasnpheproglyserglnlyslysile210215220aspargleuglulysaspaspalavalasnleuvalleuaspthrile225230235240lysalagluglyglncysleuvalphegluserserargargasncys245250255alaglyphealalysthralaserserlysvalalalysileleuasp260265270asnaspilemetilelysleualaglyilealaglugluvalgluser275280285thrglygluthraspthralailevalleualaasncysilearglys290295300glyvalalaphehishisalaglyleuasnserasnhisarglysleu305310315320valgluasnglypheargglnasnleuilelysvalileserserthr325330335prothrleualaalaglyleuasnleuproalaargargvalileile340345350argsertyrargargpheaspserasnpheglymetglnproilepro355360365valleuglutyrlysglnmetalaglyargalaglyargprohisleu370375380aspprotyrglygluservalleuleualalysthrtyraspgluphe385390395400alaglnleumetgluasntyrvalglualaaspalagluaspiletrp405410415serlysleuglythrgluasnalaleuargthrhisvalleuserthr420425430ilevalasnglyphealaserthrargglngluleupheaspphephe435440445glyalathrphephealatyrglnglnasplystrpmetleugluglu450455460valileasnaspcysleuglupheleuileasplysalametvalser465470475480gluthrgluaspilegluaspalaserlysleupheleuargglythr485490495argleuglyserleuvalsermetleutyrileaspproleusergly500505510serlysilevalaspglyphelysaspileglylysserthrglygly515520525asnmetglyserleugluaspasplysglyaspaspilethrvalthr530535540aspmetthrleuleuhisleuvalcysserthrproaspmetarggln545550555560leutyrleuargasnthrasptyrthrilevalasnglutyrileval565570575alahisseraspgluphehisgluileproasplysleulysgluthr580585590asptyrglutrpphemetglygluvallysthralametleuleuglu595600605glutrpvalthrgluvalseralagluaspilethrarghispheasn610615620valglygluglyaspilehisalaleualaaspthrserglutrpleu625630635640methisalaalaalalysleualagluleuleuglyvalglutyrser645650655serhisalatyrserleuglulysargileargtyrglyserglyleu660665670aspleumetgluleuvalglyileargglyvalglyargvalargala675680685arglysleutyrasnalaglyphevalservalalalysleulysgly690695700alaaspileservalleuserlysleuvalglyprolysvalalatyr705710715720asnileleuserglyileglyvalargvalasnasplyshispheasn725730735seralaproileserserasnthrleuaspthrleuleuasplysasn740745750glnlysthrpheasnaspphegln755760<210>19<211>707<212>prt<213>共生餐古菌(cenarchaeumsymbiosum)<400>19metargilesergluleuaspileproargproalaileglupheleu151015gluglygluglytyrlyslysleutyrproproglnalaalaalaala202530lysalaglyleuthraspglylysservalleuvalseralaprothr354045alaserglylysthrleuilealaalailealametileserhisleu505560serargasnargglylysalavaltyrleuserproleuargalaleu65707580alaalaglulysphealaglupheglylysileglyglyileproleu859095glyargprovalargvalglyvalserthrglyasppheglulysala100105110glyargserleuglyasnasnaspileleuvalleuthrasngluarg115120125metaspserleuileargargargproasptrpmetaspgluvalgly130135140leuvalilealaaspgluilehisleuileglyaspargserarggly145150155160prothrleuglumetvalleuthrlysleuargglyleuargserser165170175proglnvalvalalaleuseralathrileserasnalaaspgluile180185190alaglytrpleuaspcysthrleuvalhisserthrtrpargproval195200205proleusergluglyvaltyrglnaspglygluvalalametglyasp210215220glyserarghisgluvalalaalathrglyglyglyproalavalasp225230235240leualaalagluservalalagluglyglyglnserleuilepheala245250255aspthrargalaargseralaserleualaalalysalaseralaval260265270ileproglualalysglyalaaspalaalalysleualaalaalaala275280285lyslysileileserserglyglygluthrlysleualalysthrleu290295300alagluleuvalglulysglyalaalaphehishisalaglyleuasn305310315320glnaspcysargservalvalglugluglupheargserglyargile325330335argleuleualaserthrprothrleualaalaglyvalasnleupro340345350alaargargvalvalileserservalmetargtyrasnserserser355360365glymetsergluproileserileleuglutyrlysglnleucysgly370375380argalaglyargproglntyrasplysserglyglualailevalval385390395400glyglyvalasnalaaspgluilepheaspargtyrileglyglyglu405410415progluproileargseralametvalaspaspargalaleuargile420425430hisvalleuserleuvalthrthrserproglyilelysgluaspasp435440445valthrgluphepheleuglythrleuglyglyglnglnserglyglu450455460serthrvallyspheservalalavalalaleuargpheleuglnglu465470475480gluglymetleuglyargargglyglyargleualaalathrlysmet485490495glyargleuvalserargleutyrmetaspprometthralavalthr500505510leuargaspalavalglyglualaserproglyargmethisthrleu515520525glypheleuhisleuvalserglucyssergluphemetproargphe530535540alaleuargglnlysasphisgluvalalaglumetmetleugluala545550555560glyargglygluleuleuargprovaltyrsertyrglucysglyarg565570575glyleuleualaleuhisargtrpileglygluserproglualalys580585590leualagluaspleulysphegluserglyaspvalhisargmetval595600605gluserserglytrpleuleuargcysiletrpgluileserlyshis610615620glngluargproaspleuleuglygluleuaspvalleuargserarg625630635640valalatyrglyilelysalagluleuvalproleuvalserilelys645650655glyileglyargvalargserargargleupheargglyglyilelys660665670glyproglyaspleualaalavalprovalgluargleuserargval675680685gluglyileglyalathrleualaasnasnilelysserglnleuarg690695700lysglygly705<210>20<211>720<212>prt<213>抗辐射热球菌(thermococcusgammatolerans)<400>20metlysvalaspgluleuprovalaspgluargleulysalavalleu151015lysgluargglyileglugluleutyrproproglnalaglualaleu202530lysserglyalaleugluglyargasnleuvalleualaileprothr354045alaserglylysthrleuvalsergluilevalmetvalasnlysleu505560ileglngluglyglylysalavaltyrleuvalproleulysalaleu65707580alagluglulystyrarggluphelysglutrpglulysleuglyleu859095lysvalalaalathrthrglyasptyraspserthraspasptrpleu100105110glyargtyraspileilevalalathralaglulyspheaspserleu115120125leuarghisglyalaargtrpileasnaspvallysleuvalvalala130135140aspgluvalhisleuileglysertyraspargglyalathrleuglu145150155160metileleuthrhismetleuglyargalaglnileleualaleuser165170175alathrvalglyasnalaglugluleualaglutrpleuaspalaser180185190leuvalvalserasptrpargprovalglnleuargargglyvalphe195200205hisleuglythrleuiletrpgluaspglylysvalglusertyrpro210215220gluasntrptyrserleuvalvalaspalavallysargglylysgly225230235240alaleuvalphevalasnthrargargseralaglulysglualaleu245250255alaleuserlysleuvalserserhisleuthrlysproglulysarg260265270alaleugluserleualaserglnleugluaspasnprothrserglu275280285lysleulysargalaleuargglyglyvalalaphehishisalagly290295300leuserargvalgluargthrleuilegluaspalapheargglugly305310315320leuilelysvalilethralathrprothrleuseralaglyvalasn325330335leuproserpheargvalileileargaspthrlysargtyralagly340345350pheglytrpthraspileprovalleugluileglnglnmetmetgly355360365argalaglyargproargtyrasplystyrglyglualaileileval370375380alaargthraspgluproglylysleumetgluargtyrilearggly385390395400lysproglulysleuphesermetleualaasngluglnalaphearg405410415serglnvalleualaleuilethrasnpheglyileargserphepro420425430gluleuvalargpheleugluargthrphetyralahisglnarglys435440445aspleuserserleuglutyrlysalalysgluvalvaltyrpheleu450455460ilegluasnglupheileaspleuaspleugluaspargpheilepro465470475480leupropheglylysargthrserglnleutyrileaspproleuthr485490495alalyslysphelysaspalapheproalailegluargasnproasn500505510propheglyilepheglnleuilealaserthrproaspmetalathr515520525leuthralaargargargglumetgluasptyrleuaspleualatyr530535540gluleugluasplysleutyralaserileprotyrtyrgluaspser545550555560argpheglnglypheleuglyglnvallysthralalysvalleuleu565570575asptrpileasngluvalproglualaargiletyrgluthrtyrser580585590ileaspproglyaspleutyrargleuleugluleualaasptrpleu595600605mettyrserleuilegluleutyrlysleuphegluprolysgluglu610615620ileleuasntyrleuargaspleuhisleuargleuarghisglyval625630635640argglugluleuleugluleuvalargleuproasnileglyarglys645650655argalaargalaleutyrasnalaglypheargservalglualaile660665670alaasnalalysproalagluleuleualavalgluglyileglyala675680685lysileleuaspglyiletyrarghisleuglyileglulysargval690695700thrgluglulysprolysarglysglythrleugluasppheleuarg705710715720<210>21<211>799<212>prt<213>亨氏甲烷螺旋菌(methanospirillumhungatei)<400>21metgluilealaserleuproleuproaspserpheileargalacys151015hisalalysglyileargserleutyrproproglnalaglucysile202530glulysglyleuleugluglylysasnleuleuileserileprothr354045alaserglylysthrleuleualaglumetalamettrpserargile505560alaalaglyglylyscysleutyrilevalproleuargalaleuala65707580serglulystyraspglupheserlyslysglyvalileargvalgly859095ilealathrglyaspleuaspargthraspalatyrleuglygluasn100105110aspileilevalalathrserglulysthraspserleuleuargasn115120125argthrprotrpleuserglnilethrcysilevalleuaspgluval130135140hisleuileglysergluasnargglyalathrleuglumetvalile145150155160thrlysleuargtyrthrasnprovalmetglnileileglyleuser165170175alathrileglyasnproalaglnleualaglutrpleuaspalathr180185190leuilethrserthrtrpargprovalaspleuargglnglyvaltyr195200205tyrasnglylysileargpheseraspsergluargproileglngly210215220lysthrlyshisaspaspleuasnleucysleuaspthrilegluglu225230235240glyglyglncysleuvalphevalserserargargasnalaglugly245250255phealalyslysalaalaglyalaleulysalaglyserproaspser260265270lysalaleualaglngluleuargargleuargaspargaspglugly275280285asnvalleualaaspcysvalgluargglyalaalaphehishisala290295300glyleuileargglngluargthrileileglugluglypheargasn305310315320glytyrilegluvalilealaalathrprothrleualaalaglyleu325330335asnleuproalaargargvalileileargasptyrasnargpheala340345350serglyleuglymetvalproileprovalglyglutyrhisglnmet355360365alaglyargalaglyargprohisleuaspprotyrglyglualaval370375380leuleualalysaspalaproservalgluargleuphegluthrphe385390395400ileaspalaglualagluargvalaspserglncysvalaspaspala405410415serleucysalahisileleuserleuilealathrglyphealahis420425430aspglnglualaleuserserphemetgluargthrphetyrphephe435440445glnhisprolysthrargserleuproargleuvalalaaspalaile450455460argpheleuthrthralaglymetvalglugluarggluasnthrleu465470475480seralathrargleuglyserleuvalserargleutyrleuasnpro485490495cysthralaargleuileleuaspserleulyssercyslysthrpro500505510thrleuileglyleuleuhisvalilecysvalserproaspmetgln515520525argleutyrleulysalaalaaspthrglnleuleuargthrpheleu530535540phelyshislysaspaspleuileleuproleuprophegluglnglu545550555560gluglugluleutrpleuserglyleulysthralaleuvalleuthr565570575asptrpalaaspgluphesergluglymetileglugluargtyrgly580585590ileglyalaglyaspleutyrasnilevalaspserglylystrpleu595600605leuhisglythrgluargleuvalservalglumetproglumetser610615620glnvalvallysthrleuservalargvalhishisglyvallysser625630635640gluleuleuproleuvalalaleuargasnileglyargvalargala645650655argthrleutyrasnalaglytyrproaspproglualavalalaarg660665670alaglyleuserthrilealaargileileglygluglyilealaarg675680685glnvalileaspgluilethrglyvallysargserglyilehisser690695700seraspaspasptyrglnglnlysthrprogluleuleuthraspile705710715720proglyileglylyslysmetalaglulysleuglnasnalaglyile725730735ilethrvalseraspleuleuthralaaspgluvalleuleuserasp740745750valleuglyalaalaargalaarglysvalleualapheleuserasn755760765serglulysgluasnserserserasplysthrglugluileproasp770775780thrglnlysileargglyglnsersertrpgluasppheglycys785790795<210>22<211>1756<212>prt<213>大肠杆菌<400>22metmetserilealaglnvalargseralaglyseralaglyasntyr151015tyrthrasplysaspasntyrtyrvalleuglysermetglygluarg202530trpalaglylysglyalagluglnleuglyleuglnglyservalasp354045lysaspvalphethrargleuleugluglyargleuproaspglyala505560aspleuserargmetglnaspglyserasnlyshisargproglytyr65707580aspleuthrpheseralaprolysservalsermetmetalametleu859095glyglyasplysargleuileaspalahisasnglnalavalaspphe100105110alavalargglnvalglualaleualaserthrargvalmetthrasp115120125glyglnsergluthrvalleuthrglyasnleuvalmetalaleuphe130135140asnhisaspthrserargaspglngluproglnleuhisthrhisala145150155160valvalalaasnvalthrglnhisasnglyglutrplysthrleuser165170175serasplysvalglylysthrglypheilegluasnvaltyralaasn180185190glnilealapheglyargleutyrargglulysleulysgluglnval195200205glualaleuglytyrgluthrgluvalvalglylyshisglymettrp210215220glumetproglyvalprovalglualapheserglyargserglnala225230235240ileargglualavalglygluaspalaserleulysserargaspval245250255alaalaleuaspthrarglysserlysglnhisvalaspprogluile260265270argmetalaglutrpmetglnthrleulysgluthrglypheaspile275280285argalatyrargaspalaalaaspglnargthrgluileargthrgln290295300alaproglyproalaserglnaspglyproaspvalglnglnalaval305310315320thrglnalailealaglyleusergluarglysvalglnphethrtyr325330335thraspvalleualaargthrvalglyileleuproprogluasngly340345350valilegluargalaargalaglyileaspglualaileserargglu355360365glnleuileproleuaspargglulysglyleuphethrserglyile370375380hisvalleuaspgluleuservalargalaleuserargaspilemet385390395400lysglnasnargvalthrvalhisproglulysservalproargthr405410415alaglytyrseraspalavalservalleualaglnaspargproser420425430leualailevalserglyglnglyglyalaalaglyglnarggluarg435440445valalagluleuvalmetmetalaarggluglnglyarggluvalgln450455460ileilealaalaaspargargserglnmetasnleulysglnaspglu465470475480argleuserglygluleuilethrglyargargglnleuleuglugly485490495metalaphethrproglyserthrvalilevalaspglnglyglulys500505510leuserleulysgluthrleuthrleuleuaspglyalaalaarghis515520525asnvalglnvalleuilethraspserglyglnargthrglythrgly530535540seralaleumetalametlysaspalaglyvalasnthrtyrargtrp545550555560glnglyglygluglnargproalathrileilesergluproasparg565570575asnvalargtyralaargleualaglyaspphealaalaservallys580585590alaglyglugluservalalaglnvalserglyvalarggluglnala595600605ileleuthrglnalaileargsergluleulysthrglnglyvalleu610615620glyhisprogluvalthrmetthralaleuserprovaltrpleuasp625630635640serargserargtyrleuargaspmettyrargproglymetvalmet645650655gluglntrpasnprogluthrargserhisaspargtyrvalileasp660665670argvalthralaglnserhisserleuthrleuargaspalaglngly675680685gluthrglnvalvalargileserserleuaspsersertrpserleu690695700pheargproglulysmetprovalalaaspglygluargleuargval705710715720thrglylysileproglyleuargvalserglyglyaspargleugln725730735valalaservalsergluaspalametthrvalvalvalproglyarg740745750alagluproalaserleuprovalseraspserprophethralaleu755760765lysleugluasnglytrpvalgluthrproglyhisservalserasp770775780seralathrvalphealaservalthrglnmetalametaspasnala785790795800thrleuasnglyleualaargserglyargaspvalargleutyrser805810815serleuaspgluthrargthralaglulysleualaarghisproser820825830phethrvalvalsergluglnilelysalaargalaglygluthrleu835840845leugluthralaileserleuglnlysalaglyleuhisthrproala850855860glnglnalailehisleualaleuprovalleugluserlysasnleu865870875880alaphesermetvalaspleuleuthrglualalysserphealaala885890895gluglythrglyphethrgluleuglyglygluileasnalaglnile900905910lysargglyaspleuleutyrvalaspvalalalysglytyrglythr915920925glyleuleuvalserargalasertyrglualaglulysserileleu930935940arghisileleugluglylysglualavalthrproleumetgluarg945950955960valproglygluleumetgluthrleuthrserglyglnargalaala965970975thrargmetileleugluthrseraspargphethrvalvalglngly980985990tyralaglyvalglylysthrthrglnpheargalavalmetserala99510001005valasnmetleuproalasergluargproargvalvalglyleu101010151020glyprothrhisargalavalglyglumetargseralaglyval102510301035aspalaglnthrleualaserpheleuhisaspthrglnleugln104010451050glnargserglygluthrproasppheserasnthrleupheleu105510601065leuaspglusersermetvalglyasnthrglumetalaargala107010751080tyralaleuilealaalaglyglyglyargalavalalasergly108510901095aspthraspglnleuglnalailealaproglyglnserphearg110011051110leuglnglnthrargseralaalaaspvalvalilemetlysglu111511201125ilevalargglnthrprogluleuargglualavaltyrserleu113011351140ileasnargaspvalgluargalaleuserglyleugluserval114511501155lysproserglnvalproargleugluglyalatrpalaproglu116011651170hisservalthrglupheserhisserglnglualalysleuala117511801185glualaglnglnlysalametleulysglyglualapheproasp119011951200ileprometthrleutyrglualailevalargasptyrthrgly120512101215argthrproglualaarggluglnthrleuilevalthrhisleu122012251230asngluaspargargvalleuasnsermetilehisaspalaarg123512401245glulysalaglygluleuglylysgluglnvalmetvalproval125012551260leuasnthralaasnileargaspglygluleuargargleuser126512701275thrtrpglulysasnproaspalaleualaleuvalaspasnval128012851290tyrhisargilealaglyileserlysaspaspglyleuilethr129513001305leuglnaspalagluglyasnthrargleuileserproargglu131013151320alavalalagluglyvalthrleutyrthrproasplysilearg132513301335valglythrglyaspargmetargphethrlysseraspargglu134013451350argglytyrvalalaasnservaltrpthrvalthralavalser135513601365glyaspservalthrleuseraspglyglnglnthrargvalile137013751380argproglyglngluargalagluglnhisileaspleualatyr138513901395alailethralahisglyalaglnglyalasergluthrpheala140014051410ilealaleugluglythrgluglyasnarglysleumetalagly141514201425phegluseralatyrvalalaleuserargmetlysglnhisval143014351440glnvaltyrthraspasnargglnglytrpthraspalaileasn144514501455asnalavalglnlysglythralahisaspvalleugluprolys146014651470proasparggluvalmetasnalaglnargleupheserthrala147514801485arggluleuargaspvalalaalaglyargalavalleuarggln149014951500alaglyleualaglyglyaspserproalaargpheilealapro150515101515glyarglystyrproglnprotyrvalalaleuproalapheasp152015251530argasnglylysseralaglyiletrpleuasnproleuthrthr153515401545aspaspglyasnglyleuargglypheserglygluglyargval155015551560lysglyserglyaspalaglnphevalalaleuglnglyserarg156515701575asnglygluserleuleualaaspasnmetglnaspglyvalarg158015851590ilealaargaspasnproaspserglyvalvalvalargileala159516001605glygluglyargprotrpasnproglyalailethrglyglyarg161016151620valtrpglyaspileproaspasnservalglnproglyalagly162516301635asnglygluprovalthralagluvalleualaglnargglnala164016451650gluglualaileargarggluthrgluargargalaaspgluile165516601665valarglysmetalagluasnlysproaspleuproaspglylys167016751680thrgluleualavalargaspilealaglyglngluargasparg168516901695seralailesergluarggluthralaleuprogluservalleu170017051710arggluserglnarggluargglualavalarggluvalalaarg171517201725gluasnleuleuglngluargleuglnglnmetgluargaspmet173017351740valargaspleuglnlysglulysthrleuglyglyasp174517501755<210>23<211>726<212>prt<213>伯顿拟甲烷球菌<400>23metserasplysproalaphemetlystyrphethrglnsersercys151015tyrproasnglnglnglualametaspargilehisseralaleumet202530glnglnglnleuvalleuphegluglyalacysglythrglylysthr354045leuseralaleuvalproalaleuhisvalglylysmetleuglylys505560thrvalileilealathrasnvalhisglnglnmetvalglnpheile65707580asnglualaargaspilelyslysvalglnaspvallysvalalaval859095ilelysglylysthralametcysproglnglualaasptyrgluglu100105110cysservallysarggluasnthrphegluleumetgluthrgluarg115120125gluiletyrleulysargglngluleuasnseralaargaspsertyr130135140lyslysserhisaspproalaphevalthrleuargaspgluleuser145150155160lysgluileaspalavalgluglulysalaargglyleuargasparg165170175alacysasnaspleutyrgluvalleuargseraspserglulysphe180185190argglutrpleutyrlysgluvalargserproglugluileasnasp195200205hisalailelysaspglymetcysglytyrgluleuvallysargglu210215220leulyshisalaaspleuleuilecysasntyrhishisvalleuasn225230235240proaspilepheserthrvalleuglytrpileglulysgluprogln245250255gluthrilevalilepheaspglualahisasnleugluseralaala260265270argserhisserserleuserleuthrgluhisserileglulysala275280285ilethrgluleuglualaasnleuaspleuleualaaspaspasnile290295300hisasnleupheasnilepheleugluvalileseraspthrtyrasn305310315320serargphelyspheglygluarggluargvalarglysasntrptyr325330335aspileargileseraspprotyrgluargasnaspilevalarggly340345350lyspheleuargglnalalysglyasppheglyglulysaspaspile355360365glnileleuleuserglualasergluleuglyalalysleuaspglu370375380thrtyrargaspglntyrlyslysglyleuserservalmetlysarg385390395400serhisileargtyrvalalaaspphemetseralatyrilegluleu405410415serhisasnleuasntyrtyrproileleuasnvalargargaspmet420425430asnaspgluiletyrglyargvalgluleuphethrcysileprolys435440445asnvalthrgluproleupheasnserleupheservalileleumet450455460seralathrleuhispropheglumetvallyslysthrleuglyile465470475480thrargaspthrcysglumetsertyrglythrserpheprogluglu485490495lysargleuserilealavalserileproproleuphealalysasn500505510argaspasparghisvalthrgluleuleugluglnvalleuleuasp515520525serilegluasnserlysglyasnvalileleuphepheglnserala530535540pheglualalysargtyrtyrserlysilegluproleuvalasnval545550555560provalpheleuaspgluvalglyileserserglnaspvalargglu565570575gluphepheserileglyglugluasnglylysalavalleuleuser580585590tyrleutrpglythrleusergluglyileasptyrargaspglyarg595600605glyargthrvalileileileglyvalglytyrproalaleuasnasp610615620argmetasnalavalgluseralatyrasphisvalpheglytyrgly625630635640alaglytrpgluphealaileglnvalprothrilearglysilearg645650655glnalametglyargvalvalargserprothrasptyrglyalaarg660665670ileleuleuaspglyargpheleuthraspserlyslysargphegly675680685lyspheservalphegluvalpheproproalagluargsergluphe690695700valaspvalaspproglulysvallystyrserleumetasnphephe705710715720metaspasnaspglugln725<210>24<211>439<212>prt<213>肠杆菌噬菌体(enterobacteriaphage)t4<400>24metthrpheaspaspleuthrgluglyglnlysasnalapheasnile151015valmetlysalailelysglulyslyshishisvalthrileasngly202530proalaglythrglylysthrthrleuthrlyspheileilegluala354045leuileserthrglygluthrglyileileleualaalaprothrhis505560alaalalyslysileleuserlysleuserglylysglualaserthr65707580ilehisserileleulysileasnprovalthrtyrglugluasnval859095leuphegluglnlysgluvalproaspleualalyscysargvalleu100105110ilecysaspgluvalsermettyrasparglysleuphelysileleu115120125leuserthrileproprotrpcysthrileileglyileglyaspasn130135140lysglnileargprovalaspproglygluasnthralatyrileser145150155160prophephethrhislysaspphetyrglncysgluleuthrgluval165170175lysargserasnalaproileileaspvalalathraspvalargasn180185190glylystrpiletyrasplysvalvalaspglyhisglyvalarggly195200205phethrglyaspthralaleuargaspphemetvalasntyrpheser210215220ilevallysserleuaspaspleuphegluasnargvalmetalaphe225230235240thrasnlysservalasplysleuasnserileilearglyslysile245250255phegluthrasplysasppheilevalglygluileilevalmetgln260265270gluproleuphelysthrtyrlysileaspglylysprovalserglu275280285ileilepheasnasnglyglnleuvalargileileglualaglutyr290295300thrserthrphevallysalaargglyvalproglyglutyrleuile305310315320arghistrpaspleuthrvalgluthrtyrglyaspaspglutyrtyr325330335argglulysilelysileileserseraspglugluleutyrlysphe340345350asnleupheleuglylysthralagluthrtyrlysasntrpasnlys355360365glyglylysalaprotrpseraspphetrpaspalalysserglnphe370375380serlysvallysalaleuproalaserthrphehislysalaglngly385390395400metservalaspargalapheiletyrthrprocysilehistyrala405410415aspvalgluleualaglnglnleuleutyrvalglyvalthrarggly420425430argtyraspvalphetyrval435<210>25<211>970<212>prt<213>肉毒杆菌(clostridiumbotulinum)<400>25metleuservalalaasnvalargserproseralaalaalasertyr151015phealaseraspasntyrtyralaseralaaspalaaspargsergly202530glntrpileglyaspglyalalysargleuglyleugluglylysval354045glualaargalapheaspalaleuleuargglygluleuproaspgly505560serservalglyasnproglyglnalahisargproglythraspleu65707580thrpheservalprolyssertrpserleuleualaleuvalglylys859095aspgluargileilealaalatyrargglualavalvalglualaleu100105110histrpalaglulysasnalaalagluthrargvalvalglulysgly115120125metvalvalthrglnalathrglyasnleualaileglyleuphegln130135140hisaspthrasnargasnglngluproasnleuhisphehisalaval145150155160ilealaasnvalthrglnglylysaspglylystrpargthrleulys165170175asnaspargleutrpglnleuasnthrthrleuasnserilealamet180185190alaargpheargvalalavalglulysleuglytyrgluproglypro195200205valleulyshisglyasnpheglualaargglyileserargglugln210215220valmetalapheserthrargarglysgluvalleuglualaargarg225230235240glyproglyleuaspalaglyargilealaalaleuaspthrargala245250255serlysgluglyilegluaspargalathrleuserlysglntrpser260265270glualaalaglnserileglyleuaspleulysproleuvalasparg275280285alaargthrlysalaleuglyglnglymetglualathrargilegly290295300serleuvalgluargglyargalatrpleuserargphealaalahis305310315320valargglyaspproalaaspproleuvalproproservalleulys325330335glnaspargglnthrilealaalaalaglnalavalalaseralaval340345350arghisleuserglnargglualaalaphegluargthralaleutyr355360365lysalaalaleuasppheglyleuprothrthrilealaaspvalglu370375380lysargthrargalaleuvalargserglyaspleuilealaglylys385390395400glygluhislysglytrpleualaserargaspalavalvalthrglu405410415glnargileleusergluvalalaalaglylysglyaspserserpro420425430alailethrproglnlysalaalaalaservalglnalaalaalaleu435440445thrglyglnglypheargleuasngluglyglnleualaalaalaarg450455460leuileleuileserlysaspargthrilealavalglnglyileala465470475480glyalaglylysserservalleulysprovalalagluvalleuarg485490495aspgluglyhisprovalileglyleualaileglnasnthrleuval500505510glnmetleugluargaspthrglyileglyserglnthrleualaarg515520525pheleuglyglytrpasnlysleuleuaspaspproglyasnvalala530535540leuargalaglualaglnalaserleulysasphisvalleuvalleu545550555560aspglualasermetvalserasngluasplysglulysleuvalarg565570575leualaasnleualaglyvalhisargleuvalleuileglyasparg580585590lysglnleuglyalavalaspalaglylysprophealaleuleugln595600605argalaglyilealaargalaglumetalathrasnleuargalaarg610615620aspprovalvalargglualaglnalaalaalaglnalaglyaspval625630635640arglysalaleuarghisleulysserhisthrvalglualaarggly645650655aspglyalaglnvalalaalagluthrtrpleualaleuasplysglu660665670thrargalaargthrseriletyralaserglyargalaileargser675680685alavalasnalaalavalglnglnglyleuleualaserarggluile690695700glyproalalysmetlysleugluvalleuaspargvalasnthrthr705710715720argglugluleuarghisleuproalatyrargalaglyargvalleu725730735gluvalserarglysglnglnalaleuglyleupheileglyglutyr740745750argvalileglyglnasparglysglylysleuvalgluvalgluasp755760765lysargglylysargpheargpheaspproalaargileargalagly770775780lysglyaspaspasnleuthrleuleugluproarglysleugluile785790795800hisgluglyaspargileargtrpthrargasnasphisargarggly805810815leupheasnalaaspglnalaargvalvalgluilealaasnglylys820825830valthrphegluthrserlysglyaspleuvalgluleulyslysasp835840845aspprometleulysargileaspleualatyralaleuasnvalhis850855860metalaglnglyleuthrseraspargglyilealavalmetaspser865870875880arggluargasnleuserasnglnlysthrpheleuvalthrvalthr885890895argleuargasphisleuthrleuvalvalaspseralaasplysleu900905910glyalaalavalalaargasnlysglyglulysalaseralaileglu915920925valthrglyservallysprothralathrlysglyserglyvalasp930935940glnprolysservalglualaasnlysalaglulysgluleuthrarg945950955960serlysserlysthrleuasppheglyile965970<210>26<211>50<212>dna<213>人工序列<220><223>本发明的实施例mua底物。<400>26gttttcgcatttatcgtgaaacgctttcgcgtttttcgtgcgccgcttca50<210>27<211>50<212>dna<213>人工序列<220><223>本发明的实施例mua底物。<400>27caaaagcgtaaatagcactttgcgaaagcgcaaaaagcacgcggcgaagt50<210>28<211>54<212>dna<213>人工序列<220><223>本发明的实施例mua底物。<400>28caaaagcgtaaatagcactttgcgaaagcgcaaaaagcacgcggcgaagtctag54<210>29<211>100<212>dna<213>人工序列<220><223>实施例1中使用的序列。<400>29gcgttctgtttcggatgtatgttttcatacatccgaaacagaacgcttttgttttcgcat60ttatcgtgaaacgctttcgcgtttttcgtgcgccgcttca100<210>30<211>48<212>dna<213>人工序列<220><223>实施例1中使用的序列。<400>30gaagcggcgcacgaaaaacgcgaaagcgtttcacgataatgcgaaaac48<210>31<211>48502<212>dna<213>人工序列<220><223>实施例1中使用的序列。<400>31gggcggcgacctcgcgggttttcgctatttatgaaaattttccggtttaaggcgtttccg60ttcttcttcgtcataacttaatgtttttatttaaaataccctctgaaaagaaaggaaacg120acaggtgctgaaagcgaggctttttggcctctgtcgtttcctttctctgtttttgtccgt180ggaatgaacaatggaagtcaacaaaaagcagctggctgacattttcggtgcgagtatccg240taccattcagaactggcaggaacagggaatgcccgttctgcgaggcggtggcaagggtaa300tgaggtgctttatgactctgccgccgtcataaaatggtatgccgaaagggatgctgaaat360tgagaacgaaaagctgcgccgggaggttgaagaactgcggcaggccagcgaggcagatct420ccagccaggaactattgagtacgaacgccatcgacttacgcgtgcgcaggccgacgcaca480ggaactgaagaatgccagagactccgctgaagtggtggaaaccgcattctgtactttcgt540gctgtcgcggatcgcaggtgaaattgccagtattctcgacgggctccccctgtcggtgca600gcggcgttttccggaactggaaaaccgacatgttgatttcctgaaacgggatatcatcaa660agccatgaacaaagcagccgcgctggatgaactgataccggggttgctgagtgaatatat720cgaacagtcaggttaacaggctgcggcattttgtccgcgccgggcttcgctcactgttca780ggccggagccacagaccgccgttgaatgggcggatgctaattactatctcccgaaagaat840ccgcataccaggaagggcgctgggaaacactgccctttcagcgggccatcatgaatgcga900tgggcagcgactacatccgtgaggtgaatgtggtgaagtctgcccgtgtcggttattcca960aaatgctgctgggtgtttatgcctactttatagagcataagcagcgcaacacccttatct1020ggttgccgacggatggtgatgccgagaactttatgaaaacccacgttgagccgactattc1080gtgatattccgtcgctgctggcgctggccccgtggtatggcaaaaagcaccgggataaca1140cgctcaccatgaagcgtttcactaatgggcgtggcttctggtgcctgggcggtaaagcgg1200caaaaaactaccgtgaaaagtcggtggatgtggcgggttatgatgaacttgctgcttttg1260atgatgatattgaacaggaaggctctccgacgttcctgggtgacaagcgtattgaaggct1320cggtctggccaaagtccatccgtggctccacgccaaaagtgagaggcacctgtcagattg1380agcgtgcagccagtgaatccccgcattttatgcgttttcatgttgcctgcccgcattgcg1440gggaggagcagtatcttaaatttggcgacaaagagacgccgtttggcctcaaatggacgc1500cggatgacccctccagcgtgttttatctctgcgagcataatgcctgcgtcatccgccagc1560aggagctggactttactgatgcccgttatatctgcgaaaagaccgggatctggacccgtg1620atggcattctctggttttcgtcatccggtgaagagattgagccacctgacagtgtgacct1680ttcacatctggacagcgtacagcccgttcaccacctgggtgcagattgtcaaagactgga1740tgaaaacgaaaggggatacgggaaaacgtaaaaccttcgtaaacaccacgctcggtgaga1800cgtgggaggcgaaaattggcgaacgtccggatgctgaagtgatggcagagcggaaagagc1860attattcagcgcccgttcctgaccgtgtggcttacctgaccgccggtatcgactcccagc1920tggaccgctacgaaatgcgcgtatggggatgggggccgggtgaggaaagctggctgattg1980accggcagattattatgggccgccacgacgatgaacagacgctgctgcgtgtggatgagg2040ccatcaataaaacctatacccgccggaatggtgcagaaatgtcgatatcccgtatctgct2100gggatactggcgggattgacccgaccattgtgtatgaacgctcgaaaaaacatgggctgt2160tccgggtgatccccattaaaggggcatccgtctacggaaagccggtggccagcatgccac2220gtaagcgaaacaaaaacggggtttaccttaccgaaatcggtacggataccgcgaaagagc2280agatttataaccgcttcacactgacgccggaaggggatgaaccgcttcccggtgccgttc2340acttcccgaataacccggatatttttgatctgaccgaagcgcagcagctgactgctgaag2400agcaggtcgaaaaatgggtggatggcaggaaaaaaatactgtgggacagcaaaaagcgac2460gcaatgaggcactcgactgcttcgtttatgcgctggcggcgctgcgcatcagtatttccc2520gctggcagctggatctcagtgcgctgctggcgagcctgcaggaagaggatggtgcagcaa2580ccaacaagaaaacactggcagattacgcccgtgccttatccggagaggatgaatgacgcg2640acaggaagaacttgccgctgcccgtgcggcactgcatgacctgatgacaggtaaacgggt2700ggcaacagtacagaaagacggacgaagggtggagtttacggccacttccgtgtctgacct2760gaaaaaatatattgcagagctggaagtgcagaccggcatgacacagcgacgcaggggacc2820tgcaggattttatgtatgaaaacgcccaccattcccacccttctggggccggacggcatg2880acatcgctgcgcgaatatgccggttatcacggcggtggcagcggatttggagggcagttg2940cggtcgtggaacccaccgagtgaaagtgtggatgcagccctgttgcccaactttacccgt3000ggcaatgcccgcgcagacgatctggtacgcaataacggctatgccgccaacgccatccag3060ctgcatcaggatcatatcgtcgggtcttttttccggctcagtcatcgcccaagctggcgc3120tatctgggcatcggggaggaagaagcccgtgccttttcccgcgaggttgaagcggcatgg3180aaagagtttgccgaggatgactgctgctgcattgacgttgagcgaaaacgcacgtttacc3240atgatgattcgggaaggtgtggccatgcacgcctttaacggtgaactgttcgttcaggcc3300acctgggataccagttcgtcgcggcttttccggacacagttccggatggtcagcccgaag3360cgcatcagcaacccgaacaataccggcgacagccggaactgccgtgccggtgtgcagatt3420aatgacagcggtgcggcgctgggatattacgtcagcgaggacgggtatcctggctggatg3480ccgcagaaatggacatggataccccgtgagttacccggcgggcgcgcctcgttcattcac3540gtttttgaacccgtggaggacgggcagactcgcggtgcaaatgtgttttacagcgtgatg3600gagcagatgaagatgctcgacacgctgcagaacacgcagctgcagagcgccattgtgaag3660gcgatgtatgccgccaccattgagagtgagctggatacgcagtcagcgatggattttatt3720ctgggcgcgaacagtcaggagcagcgggaaaggctgaccggctggattggtgaaattgcc3780gcgtattacgccgcagcgccggtccggctgggaggcgcaaaagtaccgcacctgatgccg3840ggtgactcactgaacctgcagacggctcaggatacggataacggctactccgtgtttgag3900cagtcactgctgcggtatatcgctgccgggctgggtgtctcgtatgagcagctttcccgg3960aattacgcccagatgagctactccacggcacgggccagtgcgaacgagtcgtgggcgtac4020tttatggggcggcgaaaattcgtcgcatcccgtcaggcgagccagatgtttctgtgctgg4080ctggaagaggccatcgttcgccgcgtggtgacgttaccttcaaaagcgcgcttcagtttt4140caggaagcccgcagtgcctgggggaactgcgactggataggctccggtcgtatggccatc4200gatggtctgaaagaagttcaggaagcggtgatgctgatagaagccggactgagtacctac4260gagaaagagtgcgcaaaacgcggtgacgactatcaggaaatttttgcccagcaggtccgt4320gaaacgatggagcgccgtgcagccggtcttaaaccgcccgcctgggcggctgcagcattt4380gaatccgggctgcgacaatcaacagaggaggagaagagtgacagcagagctgcgtaatct4440cccgcatattgccagcatggcctttaatgagccgctgatgcttgaacccgcctatgcgcg4500ggttttcttttgtgcgcttgcaggccagcttgggatcagcagcctgacggatgcggtgtc4560cggcgacagcctgactgcccaggaggcactcgcgacgctggcattatccggtgatgatga4620cggaccacgacaggcccgcagttatcaggtcatgaacggcatcgccgtgctgccggtgtc4680cggcacgctggtcagccggacgcgggcgctgcagccgtactcggggatgaccggttacaa4740cggcattatcgcccgtctgcaacaggctgccagcgatccgatggtggacggcattctgct4800cgatatggacacgcccggcgggatggtggcgggggcatttgactgcgctgacatcatcgc4860ccgtgtgcgtgacataaaaccggtatgggcgcttgccaacgacatgaactgcagtgcagg4920tcagttgcttgccagtgccgcctcccggcgtctggtcacgcagaccgcccggacaggctc4980catcggcgtcatgatggctcacagtaattacggtgctgcgctggagaaacagggtgtgga5040aatcacgctgatttacagcggcagccataaggtggatggcaacccctacagccatcttcc5100ggatgacgtccgggagacactgcagtcccggatggacgcaacccgccagatgtttgcgca5160gaaggtgtcggcatataccggcctgtccgtgcaggttgtgctggataccgaggctgcagt5220gtacagcggtcaggaggccattgatgccggactggctgatgaacttgttaacagcaccga5280tgcgatcaccgtcatgcgtgatgcactggatgcacgtaaatcccgtctctcaggagggcg5340aatgaccaaagagactcaatcaacaactgtttcagccactgcttcgcaggctgacgttac5400tgacgtggtgccagcgacggagggcgagaacgccagcgcggcgcagccggacgtgaacgc5460gcagatcaccgcagcggttgcggcagaaaacagccgcattatggggatcctcaactgtga5520ggaggctcacggacgcgaagaacaggcacgcgtgctggcagaaacccccggtatgaccgt5580gaaaacggcccgccgcattctggccgcagcaccacagagtgcacaggcgcgcagtgacac5640tgcgctggatcgtctgatgcagggggcaccggcaccgctggctgcaggtaacccggcatc5700tgatgccgttaacgatttgctgaacacaccagtgtaagggatgtttatgacgagcaaaga5760aacctttacccattaccagccgcagggcaacagtgacccggctcataccgcaaccgcgcc5820cggcggattgagtgcgaaagcgcctgcaatgaccccgctgatgctggacacctccagccg5880taagctggttgcgtgggatggcaccaccgacggtgctgccgttggcattcttgcggttgc5940tgctgaccagaccagcaccacgctgacgttctacaagtccggcacgttccgttatgagga6000tgtgctctggccggaggctgccagcgacgagacgaaaaaacggaccgcgtttgccggaac6060ggcaatcagcatcgtttaactttacccttcatcactaaaggccgcctgtgcggctttttt6120tacgggatttttttatgtcgatgtacacaaccgcccaactgctggcggcaaatgagcaga6180aatttaagtttgatccgctgtttctgcgtctctttttccgtgagagctatcccttcacca6240cggagaaagtctatctctcacaaattccgggactggtaaacatggcgctgtacgtttcgc6300cgattgtttccggtgaggttatccgttcccgtggcggctccacctctgaatttacgccgg6360gatatgtcaagccgaagcatgaagtgaatccgcagatgaccctgcgtcgcctgccggatg6420aagatccgcagaatctggcggacccggcttaccgccgccgtcgcatcatcatgcagaaca6480tgcgtgacgaagagctggccattgctcaggtcgaagagatgcaggcagtttctgccgtgc6540ttaagggcaaatacaccatgaccggtgaagccttcgatccggttgaggtggatatgggcc6600gcagtgaggagaataacatcacgcagtccggcggcacggagtggagcaagcgtgacaagt6660ccacgtatgacccgaccgacgatatcgaagcctacgcgctgaacgccagcggtgtggtga6720atatcatcgtgttcgatccgaaaggctgggcgctgttccgttccttcaaagccgtcaagg6780agaagctggatacccgtcgtggctctaattccgagctggagacagcggtgaaagacctgg6840gcaaagcggtgtcctataaggggatgtatggcgatgtggccatcgtcgtgtattccggac6900agtacgtggaaaacggcgtcaaaaagaacttcctgccggacaacacgatggtgctgggga6960acactcaggcacgcggtctgcgcacctatggctgcattcaggatgcggacgcacagcgcg7020aaggcattaacgcctctgcccgttacccgaaaaactgggtgaccaccggcgatccggcgc7080gtgagttcaccatgattcagtcagcaccgctgatgctgctggctgaccctgatgagttcg7140tgtccgtacaactggcgtaatcatggcccttcggggccattgtttctctgtggaggagtc7200catgacgaaagatgaactgattgcccgtctccgctcgctgggtgaacaactgaaccgtga7260tgtcagcctgacggggacgaaagaagaactggcgctccgtgtggcagagctgaaagagga7320gcttgatgacacggatgaaactgccggtcaggacacccctctcagccgggaaaatgtgct7380gaccggacatgaaaatgaggtgggatcagcgcagccggataccgtgattctggatacgtc7440tgaactggtcacggtcgtggcactggtgaagctgcatactgatgcacttcacgccacgcg7500ggatgaacctgtggcatttgtgctgccgggaacggcgtttcgtgtctctgccggtgtggc7560agccgaaatgacagagcgcggcctggccagaatgcaataacgggaggcgctgtggctgat7620ttcgataacctgttcgatgctgccattgcccgcgccgatgaaacgatacgcgggtacatg7680ggaacgtcagccaccattacatccggtgagcagtcaggtgcggtgatacgtggtgttttt7740gatgaccctgaaaatatcagctatgccggacagggcgtgcgcgttgaaggctccagcccg7800tccctgtttgtccggactgatgaggtgcggcagctgcggcgtggagacacgctgaccatc7860ggtgaggaaaatttctgggtagatcgggtttcgccggatgatggcggaagttgtcatctc7920tggcttggacggggcgtaccgcctgccgttaaccgtcgccgctgaaagggggatgtatgg7980ccataaaaggtcttgagcaggccgttgaaaacctcagccgtatcagcaaaacggcggtgc8040ctggtgccgccgcaatggccattaaccgcgttgcttcatccgcgatatcgcagtcggcgt8100cacaggttgcccgtgagacaaaggtacgccggaaactggtaaaggaaagggccaggctga8160aaagggccacggtcaaaaatccgcaggccagaatcaaagttaaccggggggatttgcccg8220taatcaagctgggtaatgcgcgggttgtcctttcgcgccgcaggcgtcgtaaaaaggggc8280agcgttcatccctgaaaggtggcggcagcgtgcttgtggtgggtaaccgtcgtattcccg8340gcgcgtttattcagcaactgaaaaatggccggtggcatgtcatgcagcgtgtggctggga8400aaaaccgttaccccattgatgtggtgaaaatcccgatggcggtgccgctgaccacggcgt8460ttaaacaaaatattgagcggatacggcgtgaacgtcttccgaaagagctgggctatgcgc8520tgcagcatcaactgaggatggtaataaagcgatgaaacatactgaactccgtgcagccgt8580actggatgcactggagaagcatgacaccggggcgacgttttttgatggtcgccccgctgt8640ttttgatgaggcggattttccggcagttgccgtttatctcaccggcgctgaatacacggg8700cgaagagctggacagcgatacctggcaggcggagctgcatatcgaagttttcctgcctgc8760tcaggtgccggattcagagctggatgcgtggatggagtcccggatttatccggtgatgag8820cgatatcccggcactgtcagatttgatcaccagtatggtggccagcggctatgactaccg8880gcgcgacgatgatgcgggcttgtggagttcagccgatctgacttatgtcattacctatga8940aatgtgaggacgctatgcctgtaccaaatcctacaatgccggtgaaaggtgccgggacca9000ccctgtgggtttataaggggagcggtgacccttacgcgaatccgctttcagacgttgact9060ggtcgcgtctggcaaaagttaaagacctgacgcccggcgaactgaccgctgagtcctatg9120acgacagctatctcgatgatgaagatgcagactggactgcgaccgggcaggggcagaaat9180ctgccggagataccagcttcacgctggcgtggatgcccggagagcaggggcagcaggcgc9240tgctggcgtggtttaatgaaggcgatacccgtgcctataaaatccgcttcccgaacggca9300cggtcgatgtgttccgtggctgggtcagcagtatcggtaaggcggtgacggcgaaggaag9360tgatcacccgcacggtgaaagtcaccaatgtgggacgtccgtcgatggcagaagatcgca9420gcacggtaacagcggcaaccggcatgaccgtgacgcctgccagcacctcggtggtgaaag9480ggcagagcaccacgctgaccgtggccttccagccggagggcgtaaccgacaagagctttc9540gtgcggtgtctgcggataaaacaaaagccaccgtgtcggtcagtggtatgaccatcaccg9600tgaacggcgttgctgcaggcaaggtcaacattccggttgtatccggtaatggtgagtttg9660ctgcggttgcagaaattaccgtcaccgccagttaatccggagagtcagcgatgttcctga9720aaaccgaatcatttgaacataacggtgtgaccgtcacgctttctgaactgtcagccctgc9780agcgcattgagcatctcgccctgatgaaacggcaggcagaacaggcggagtcagacagca9840accggaagtttactgtggaagacgccatcagaaccggcgcgtttctggtggcgatgtccc9900tgtggcataaccatccgcagaagacgcagatgccgtccatgaatgaagccgttaaacaga9960ttgagcaggaagtgcttaccacctggcccacggaggcaatttctcatgctgaaaacgtgg10020tgtaccggctgtctggtatgtatgagtttgtggtgaataatgcccctgaacagacagagg10080acgccgggcccgcagagcctgtttctgcgggaaagtgttcgacggtgagctgagttttgc10140cctgaaactggcgcgtgagatggggcgacccgactggcgtgccatgcttgccgggatgtc10200atccacggagtatgccgactggcaccgcttttacagtacccattattttcatgatgttct10260gctggatatgcacttttccgggctgacgtacaccgtgctcagcctgtttttcagcgatcc10320ggatatgcatccgctggatttcagtctgctgaaccggcgcgaggctgacgaagagcctga10380agatgatgtgctgatgcagaaagcggcagggcttgccggaggtgtccgctttggcccgga10440cgggaatgaagttatccccgcttccccggatgtggcggacatgacggaggatgacgtaat10500gctgatgacagtatcagaagggatcgcaggaggagtccggtatggctgaaccggtaggcg10560atctggtcgttgatttgagtctggatgcggccagatttgacgagcagatggccagagtca10620ggcgtcatttttctggtacggaaagtgatgcgaaaaaaacagcggcagtcgttgaacagt10680cgctgagccgacaggcgctggctgcacagaaagcggggatttccgtcgggcagtataaag10740ccgccatgcgtatgctgcctgcacagttcaccgacgtggccacgcagcttgcaggcgggc10800aaagtccgtggctgatcctgctgcaacagggggggcaggtgaaggactccttcggcggga10860tgatccccatgttcagggggcttgccggtgcgatcaccctgccgatggtgggggccacct10920cgctggcggtggcgaccggtgcgctggcgtatgcctggtatcagggcaactcaaccctgt10980ccgatttcaacaaaacgctggtcctttccggcaatcaggcgggactgacggcagatcgta11040tgctggtcctgtccagagccgggcaggcggcagggctgacgtttaaccagaccagcgagt11100cactcagcgcactggttaaggcgggggtaagcggtgaggctcagattgcgtccatcagcc11160agagtgtggcgcgtttctcctctgcatccggcgtggaggtggacaaggtcgctgaagcct11220tcgggaagctgaccacagacccgacgtcggggctgacggcgatggctcgccagttccata11280acgtgtcggcggagcagattgcgtatgttgctcagttgcagcgttccggcgatgaagccg11340gggcattgcaggcggcgaacgaggccgcaacgaaagggtttgatgaccagacccgccgcc11400tgaaagagaacatgggcacgctggagacctgggcagacaggactgcgcgggcattcaaat11460ccatgtgggatgcggtgctggatattggtcgtcctgataccgcgcaggagatgctgatta11520aggcagaggctgcgtataagaaagcagacgacatctggaatctgcgcaaggatgattatt11580ttgttaacgatgaagcgcgggcgcgttactgggatgatcgtgaaaaggcccgtcttgcgc11640ttgaagccgcccgaaagaaggctgagcagcagactcaacaggacaaaaatgcgcagcagc11700agagcgataccgaagcgtcacggctgaaatataccgaagaggcgcagaaggcttacgaac11760ggctgcagacgccgctggagaaatataccgcccgtcaggaagaactgaacaaggcactga11820aagacgggaaaatcctgcaggcggattacaacacgctgatggcggcggcgaaaaaggatt11880atgaagcgacgctgaaaaagccgaaacagtccagcgtgaaggtgtctgcgggcgatcgtc11940aggaagacagtgctcatgctgccctgctgacgcttcaggcagaactccggacgctggaga12000agcatgccggagcaaatgagaaaatcagccagcagcgccgggatttgtggaaggcggaga12060gtcagttcgcggtactggaggaggcggcgcaacgtcgccagctgtctgcacaggagaaat12120ccctgctggcgcataaagatgagacgctggagtacaaacgccagctggctgcacttggcg12180acaaggttacgtatcaggagcgcctgaacgcgctggcgcagcaggcggataaattcgcac12240agcagcaacgggcaaaacgggccgccattgatgcgaaaagccgggggctgactgaccggc12300aggcagaacgggaagccacggaacagcgcctgaaggaacagtatggcgataatccgctgg12360cgctgaataacgtcatgtcagagcagaaaaagacctgggcggctgaagaccagcttcgcg12420ggaactggatggcaggcctgaagtccggctggagtgagtgggaagagagcgccacggaca12480gtatgtcgcaggtaaaaagtgcagccacgcagacctttgatggtattgcacagaatatgg12540cggcgatgctgaccggcagtgagcagaactggcgcagcttcacccgttccgtgctgtcca12600tgatgacagaaattctgcttaagcaggcaatggtggggattgtcgggagtatcggcagcg12660ccattggcggggctgttggtggcggcgcatccgcgtcaggcggtacagccattcaggccg12720ctgcggcgaaattccattttgcaaccggaggatttacgggaaccggcggcaaatatgagc12780cagcggggattgttcaccgtggtgagtttgtcttcacgaaggaggcaaccagccggattg12840gcgtggggaatctttaccggctgatgcgcggctatgccaccggcggttatgtcggtacac12900cgggcagcatggcagacagccggtcgcaggcgtccgggacgtttgagcagaataaccatg12960tggtgattaacaacgacggcacgaacgggcagataggtccggctgctctgaaggcggtgt13020atgacatggcccgcaagggtgcccgtgatgaaattcagacacagatgcgtgatggtggcc13080tgttctccggaggtggacgatgaagaccttccgctggaaagtgaaacccggtatggatgt13140ggcttcggtcccttctgtaagaaaggtgcgctttggtgatggctattctcagcgagcgcc13200tgccgggctgaatgccaacctgaaaacgtacagcgtgacgctttctgtcccccgtgagga13260ggccacggtactggagtcgtttctggaagagcacgggggctggaaatcctttctgtggac13320gccgccttatgagtggcggcagataaaggtgacctgcgcaaaatggtcgtcgcgggtcag13380tatgctgcgtgttgagttcagcgcagagtttgaacaggtggtgaactgatgcaggatatc13440cggcaggaaacactgaatgaatgcacccgtgcggagcagtcggccagcgtggtgctctgg13500gaaatcgacctgacagaggtcggtggagaacgttattttttctgtaatgagcagaacgaa13560aaaggtgagccggtcacctggcaggggcgacagtatcagccgtatcccattcaggggagc13620ggttttgaactgaatggcaaaggcaccagtacgcgccccacgctgacggtttctaacctg13680tacggtatggtcaccgggatggcggaagatatgcagagtctggtcggcggaacggtggtc13740cggcgtaaggtttacgcccgttttctggatgcggtgaacttcgtcaacggaaacagttac13800gccgatccggagcaggaggtgatcagccgctggcgcattgagcagtgcagcgaactgagc13860gcggtgagtgcctcctttgtactgtccacgccgacggaaacggatggcgctgtttttccg13920ggacgtatcatgctggccaacacctgcacctggacctatcgcggtgacgagtgcggttat13980agcggtccggctgtcgcggatgaatatgaccagccaacgtccgatatcacgaaggataaa14040tgcagcaaatgcctgagcggttgtaagttccgcaataacgtcggcaactttggcggcttc14100ctttccattaacaaactttcgcagtaaatcccatgacacagacagaatcagcgattctgg14160cgcacgcccggcgatgtgcgccagcggagtcgtgcggcttcgtggtaagcacgccggagg14220gggaaagatatttcccctgcgtgaatatctccggtgagccggaggctatttccgtatgtc14280gccggaagactggctgcaggcagaaatgcagggtgagattgtggcgctggtccacagcca14340ccccggtggtctgccctggctgagtgaggccgaccggcggctgcaggtgcagagtgattt14400gccgtggtggctggtctgccgggggacgattcataagttccgctgtgtgccgcatctcac14460cgggcggcgctttgagcacggtgtgacggactgttacacactgttccgggatgcttatca14520tctggcggggattgagatgccggactttcatcgtgaggatgactggtggcgtaacggcca14580gaatctctatctggataatctggaggcgacggggctgtatcaggtgccgttgtcagcggc14640acagccgggcgatgtgctgctgtgctgttttggttcatcagtgccgaatcacgccgcaat14700ttactgcggcgacggcgagctgctgcaccatattcctgaacaactgagcaaacgagagag14760gtacaccgacaaatggcagcgacgcacacactccctctggcgtcaccgggcatggcgcgc14820atctgcctttacggggatttacaacgatttggtcgccgcatcgaccttcgtgtgaaaacg14880ggggctgaagccatccgggcactggccacacagctcccggcgtttcgtcagaaactgagc14940gacggctggtatcaggtacggattgccgggcgggacgtcagcacgtccgggttaacggcg15000cagttacatgagactctgcctgatggcgctgtaattcatattgttcccagagtcgccggg15060gccaagtcaggtggcgtattccagattgtcctgggggctgccgccattgccggatcattc15120tttaccgccggagccacccttgcagcatggggggcagccattggggccggtggtatgacc15180ggcatcctgttttctctcggtgccagtatggtgctcggtggtgtggcgcagatgctggca15240ccgaaagccagaactccccgtatacagacaacggataacggtaagcagaacacctatttc15300tcctcactggataacatggttgcccagggcaatgttctgcctgttctgtacggggaaatg15360cgcgtggggtcacgcgtggtttctcaggagatcagcacggcagacgaaggggacggtggt15420caggttgtggtgattggtcgctgatgcaaaatgttttatgtgaaaccgcctgcgggcggt15480tttgtcatttatggagcgtgaggaatgggtaaaggaagcagtaaggggcataccccgcgc15540gaagcgaaggacaacctgaagtccacgcagttgctgagtgtgatcgatgccatcagcgaa15600gggccgattgaaggtccggtggatggcttaaaaagcgtgctgctgaacagtacgccggtg15660ctggacactgaggggaataccaacatatccggtgtcacggtggtgttccgggctggtgag15720caggagcagactccgccggagggatttgaatcctccggctccgagacggtgctgggtacg15780gaagtgaaatatgacacgccgatcacccgcaccattacgtctgcaaacatcgaccgtctg15840cgctttaccttcggtgtacaggcactggtggaaaccacctcaaagggtgacaggaatccg15900tcggaagtccgcctgctggttcagatacaacgtaacggtggctgggtgacggaaaaagac15960atcaccattaagggcaaaaccacctcgcagtatctggcctcggtggtgatgggtaacctg16020ccgccgcgcccgtttaatatccggatgcgcaggatgacgccggacagcaccacagaccag16080ctgcagaacaaaacgctctggtcgtcatacactgaaatcatcgatgtgaaacagtgctac16140ccgaacacggcactggtcggcgtgcaggtggactcggagcagttcggcagccagcaggtg16200agccgtaattatcatctgcgcgggcgtattctgcaggtgccgtcgaactataacccgcag16260acgcggcaatacagcggtatctgggacggaacgtttaaaccggcatacagcaacaacatg16320gcctggtgtctgtgggatatgctgacccatccgcgctacggcatggggaaacgtcttggt16380gcggcggatgtggataaatgggcgctgtatgtcatcggccagtactgcgaccagtcagtg16440ccggacggctttggcggcacggagccgcgcatcacctgtaatgcgtacctgaccacacag16500cgtaaggcgtgggatgtgctcagcgatttctgctcggcgatgcgctgtatgccggtatgg16560aacgggcagacgctgacgttcgtgcaggaccgaccgtcggataagacgtggacctataac16620cgcagtaatgtggtgatgccggatgatggcgcgccgttccgctacagcttcagcgccctg16680aaggaccgccataatgccgttgaggtgaactggattgacccgaacaacggctgggagacg16740gcgacagagcttgttgaagatacgcaggccattgcccgttacggtcgtaatgttacgaag16800atggatgcctttggctgtaccagccgggggcaggcacaccgcgccgggctgtggctgatt16860aaaacagaactgctggaaacgcagaccgtggatttcagcgtcggcgcagaagggcttcgc16920catgtaccgggcgatgttattgaaatctgcgatgatgactatgccggtatcagcaccggt16980ggtcgtgtgctggcggtgaacagccagacccggacgctgacgctcgaccgtgaaatcacg17040ctgccatcctccggtaccgcgctgataagcctggttgacggaagtggcaatccggtcagc17100gtggaggttcagtccgtcaccgacggcgtgaaggtaaaagtgagccgtgttcctgacggt17160gttgctgaatacagcgtatgggagctgaagctgccgacgctgcgccagcgactgttccgc17220tgcgtgagtatccgtgagaacgacgacggcacgtatgccatcaccgccgtgcagcatgtg17280ccggaaaaagaggccatcgtggataacggggcgcactttgacggcgaacagagtggcacg17340gtgaatggtgtcacgccgccagcggtgcagcacctgaccgcagaagtcactgcagacagc17400ggggaatatcaggtgctggcgcgatgggacacaccgaaggtggtgaagggcgtgagtttc17460ctgctccgtctgaccgtaacagcggacgacggcagtgagcggctggtcagcacggcccgg17520acgacggaaaccacataccgcttcacgcaactggcgctggggaactacaggctgacagtc17580cgggcggtaaatgcgtgggggcagcagggcgatccggcgtcggtatcgttccggattgcc17640gcaccggcagcaccgtcgaggattgagctgacgccgggctattttcagataaccgccacg17700ccgcatcttgccgtttatgacccgacggtacagtttgagttctggttctcggaaaagcag17760attgcggatatcagacaggttgaaaccagcacgcgttatcttggtacggcgctgtactgg17820atagccgccagtatcaatatcaaaccgggccatgattattacttttatatccgcagtgtg17880aacaccgttggcaaatcggcattcgtggaggccgtcggtcgggcgagcgatgatgcggaa17940ggttacctggattttttcaaaggcaagataaccgaatcccatctcggcaaggagctgctg18000gaaaaagtcgagctgacggaggataacgccagcagactggaggagttttcgaaagagtgg18060aaggatgccagtgataagtggaatgccatgtgggctgtcaaaattgagcagaccaaagac18120ggcaaacattatgtcgcgggtattggcctcagcatggaggacacggaggaaggcaaactg18180agccagtttctggttgccgccaatcgtatcgcatttattgacccggcaaacgggaatgaa18240acgccgatgtttgtggcgcagggcaaccagatattcatgaacgacgtgttcctgaagcgc18300ctgacggcccccaccattaccagcggcggcaatcctccggccttttccctgacaccggac18360ggaaagctgaccgctaaaaatgcggatatcagtggcagtgtgaatgcgaactccgggacg18420ctcagtaatgtgacgatagctgaaaactgtacgataaacggtacgctgagggcggaaaaa18480atcgtcggggacattgtaaaggcggcgagcgcggcttttccgcgccagcgtgaaagcagt18540gtggactggccgtcaggtacccgtactgtcaccgtgaccgatgaccatccttttgatcgc18600cagatagtggtgcttccgctgacgtttcgcggaagtaagcgtactgtcagcggcaggaca18660acgtattcgatgtgttatctgaaagtactgatgaacggtgcggtgatttatgatggcgcg18720gcgaacgaggcggtacaggtgttctcccgtattgttgacatgccagcgggtcggggaaac18780gtgatcctgacgttcacgcttacgtccacacggcattcggcagatattccgccgtatacg18840tttgccagcgatgtgcaggttatggtgattaagaaacaggcgctgggcatcagcgtggtc18900tgagtgtgttacagaggttcgtccgggaacgggcgttttattataaaacagtgagaggtg18960aacgatgcgtaatgtgtgtattgccgttgctgtctttgccgcacttgcggtgacagtcac19020tccggcccgtgcggaaggtggacatggtacgtttacggtgggctattttcaagtgaaacc19080gggtacattgccgtcgttgtcgggcggggataccggtgtgagtcatctgaaagggattaa19140cgtgaagtaccgttatgagctgacggacagtgtgggggtgatggcttccctggggttcgc19200cgcgtcgaaaaagagcagcacagtgatgaccggggaggatacgtttcactatgagagcct19260gcgtggacgttatgtgagcgtgatggccggaccggttttacaaatcagtaagcaggtcag19320tgcgtacgccatggccggagtggctcacagtcggtggtccggcagtacaatggattaccg19380taagacggaaatcactcccgggtatatgaaagagacgaccactgccagggacgaaagtgc19440aatgcggcatacctcagtggcgtggagtgcaggtatacagattaatccggcagcgtccgt19500cgttgttgatattgcttatgaaggctccggcagtggcgactggcgtactgacggattcat19560cgttggggtcggttataaattctgattagccaggtaacacagtgttatgacagcccgccg19620gaaccggtgggcttttttgtggggtgaatatggcagtaaagatttcaggagtcctgaaag19680acggcacaggaaaaccggtacagaactgcaccattcagctgaaagccagacgtaacagca19740ccacggtggtggtgaacacggtgggctcagagaatccggatgaagccgggcgttacagca19800tggatgtggagtacggtcagtacagtgtcatcctgcaggttgacggttttccaccatcgc19860acgccgggaccatcaccgtgtatgaagattcacaaccggggacgctgaatgattttctct19920gtgccatgacggaggatgatgcccggccggaggtgctgcgtcgtcttgaactgatggtgg19980aagaggtggcgcgtaacgcgtccgtggtggcacagagtacggcagacgcgaagaaatcag20040ccggcgatgccagtgcatcagctgctcaggtcgcggcccttgtgactgatgcaactgact20100cagcacgcgccgccagcacgtccgccggacaggctgcatcgtcagctcaggaagcgtcct20160ccggcgcagaagcggcatcagcaaaggccactgaagcggaaaaaagtgccgcagccgcag20220agtcctcaaaaaacgcggcggccaccagtgccggtgcggcgaaaacgtcagaaacgaatg20280ctgcagcgtcacaacaatcagccgccacgtctgcctccaccgcggccacgaaagcgtcag20340aggccgccacttcagcacgagatgcggtggcctcaaaagaggcagcaaaatcatcagaaa20400cgaacgcatcatcaagtgccggtcgtgcagcttcctcggcaacggcggcagaaaattctg20460ccagggcggcaaaaacgtccgagacgaatgccaggtcatctgaaacagcagcggaacgga20520gcgcctctgccgcggcagacgcaaaaacagcggcggcggggagtgcgtcaacggcatcca20580cgaaggcgacagaggctgcgggaagtgcggtatcagcatcgcagagcaaaagtgcggcag20640aagcggcggcaatacgtgcaaaaaattcggcaaaacgtgcagaagatatagcttcagctg20700tcgcgcttgaggatgcggacacaacgagaaaggggatagtgcagctcagcagtgcaacca20760acagcacgtctgaaacgcttgctgcaacgccaaaggcggttaaggtggtaatggatgaaa20820cgaacagaaaagcccactggacagtccggcactgaccggaacgccaacagcaccaaccgc20880gctcaggggaacaaacaatacccagattgcgaacaccgcttttgtactggccgcgattgc20940agatgttatcgacgcgtcacctgacgcactgaatacgctgaatgaactggccgcagcgct21000cgggaatgatccagattttgctaccaccatgactaacgcgcttgcgggtaaacaaccgaa21060gaatgcgacactgacggcgctggcagggctttccacggcgaaaaataaattaccgtattt21120tgcggaaaatgatgccgccagcctgactgaactgactcaggttggcagggatattctggc21180aaaaaattccgttgcagatgttcttgaataccttggggccggtgagaattcggcctttcc21240ggcaggtgcgccgatcccgtggccatcagatatcgttccgtctggctacgtcctgatgca21300ggggcaggcgtttgacaaatcagcctacccaaaacttgctgtcgcgtatccatcgggtgt21360gcttcctgatatgcgaggctggacaatcaaggggaaacccgccagcggtcgtgctgtatt21420gtctcaggaacaggatggaattaagtcgcacacccacagtgccagtgcatccggtacgga21480tttggggacgaaaaccacatcgtcgtttgattacgggacgaaaacaacaggcagtttcga21540ttacggcaccaaatcgacgaataacacgggggctcatgctcacagtctgagcggttcaac21600aggggccgcgggtgctcatgcccacacaagtggtttaaggatgaacagttctggctggag21660tcagtatggaacagcaaccattacaggaagtttatccacagttaaaggaaccagcacaca21720gggtattgcttatttatcgaaaacggacagtcagggcagccacagtcactcattgtccgg21780tacagccgtgagtgccggtgcacatgcgcatacagttggtattggtgcgcaccagcatcc21840ggttgttatcggtgctcatgcccattctttcagtattggttcacacggacacaccatcac21900cgttaacgctgcgggtaacgcggaaaacaccgtcaaaaacattgcatttaactatattgt21960gaggcttgcataatggcattcagaatgagtgaacaaccacggaccataaaaatttataat22020ctgctggccggaactaatgaatttattggtgaaggtgacgcatatattccgcctcatacc22080ggtctgcctgcaaacagtaccgatattgcaccgccagatattccggctggctttgtggct22140gttttcaacagtgatgaggcatcgtggcatctcgttgaagaccatcggggtaaaaccgtc22200tatgacgtggcttccggcgacgcgttatttatttctgaactcggtccgttaccggaaaat22260tttacctggttatcgccgggaggggaatatcagaagtggaacggcacagcctgggtgaag22320gatacggaagcagaaaaactgttccggatccgggaggcggaagaaacaaaaaaaagcctg22380atgcaggtagccagtgagcatattgcgccgcttcaggatgctgcagatctggaaattgca22440acgaaggaagaaacctcgttgctggaagcctggaagaagtatcgggtgttgctgaaccgt22500gttgatacatcaactgcacctgatattgagtggcctgctgtccctgttatggagtaatcg22560ttttgtgatatgccgcagaaacgttgtatgaaataacgttctgcggttagttagtatatt22620gtaaagctgagtattggtttatttggcgattattatcttcaggagaataatggaagttct22680atgactcaattgttcatagtgtttacatcaccgccaattgcttttaagactgaacgcatg22740aaatatggtttttcgtcatgttttgagtctgctgttgatatttctaaagtcggttttttt22800tcttcgttttctctaactattttccatgaaatacatttttgattattatttgaatcaatt22860ccaattacctgaagtctttcatctataattggcattgtatgtattggtttattggagtag22920atgcttgcttttctgagccatagctctgatatccaaatgaagccataggcatttgttatt22980ttggctctgtcagctgcataacgccaaaaaatatatttatctgcttgatcttcaaatgtt23040gtattgattaaatcaattggatggaattgtttatcataaaaaattaatgtttgaatgtga23100taaccgtcctttaaaaaagtcgtttctgcaagcttggctgtatagtcaactaactcttct23160gtcgaagtgatatttttaggcttatctaccagttttagacgctctttaatatcttcagga23220attattttattgtcatattgtatcatgctaaatgacaatttgcttatggagtaatctttt23280aattttaaataagttattctcctggcttcatcaaataaagagtcgaatgatgttggcgaa23340atcacatcgtcacccattggattgtttatttgtatgccaagagagttacagcagttatac23400attctgccatagattatagctaaggcatgtaataattcgtaatcttttagcgtattagcg23460acccatcgtctttctgatttaataatagatgattcagttaaatatgaaggtaatttcttt23520tgtgcaagtctgactaacttttttataccaatgtttaacatactttcatttgtaataaac23580tcaatgtcattttcttcaatgtaagatgaaataagagtagcctttgcctcgctatacatt23640tctaaatcgccttgtttttctatcgtattgcgagaatttttagcccaagccattaatgga23700tcatttttccatttttcaataacattattgttataccaaatgtcatatcctataatctgg23760tttttgtttttttgaataataaatgttactgttcttgcggtttggaggaattgattcaaa23820ttcaagcgaaataattcagggtcaaaatatgtatcaatgcagcatttgagcaagtgcgat23880aaatctttaagtcttctttcccatggttttttagtcataaaactctccattttgataggt23940tgcatgctagatgctgatatattttagaggtgataaaattaactgcttaactgtcaatgt24000aatacaagttgtttgatctttgcaatgattcttatcagaaaccatatagtaaattagtta24060cacaggaaatttttaatattattattatcattcattatgtattaaaattagagttgtggc24120ttggctctgctaacacgttgctcataggagatatggtagagccgcagacacgtcgtatgc24180aggaacgtgctgcggctggctggtgaacttccgatagtgcgggtgttgaatgatttccag24240ttgctaccgattttacatattttttgcatgagagaatttgtaccacctcccaccgaccat24300ctatgactgtacgccactgtccctaggactgctatgtgccggagcggacattacaaacgt24360ccttctcggtgcatgccactgttgccaatgacctgcctaggaattggttagcaagttact24420accggattttgtaaaaacagccctcctcatataaaaagtattcgttcacttccgataagc24480gtcgtaattttctatctttcatcatattctagatccctctgaaaaaatcttccgagtttg24540ctaggcactgatacataactcttttccaataattggggaagtcattcaaatctataatag24600gtttcagatttgcttcaataaattctgactgtagctgctgaaacgttgcggttgaactat24660atttccttataacttttacgaaagagtttctttgagtaatcacttcactcaagtgcttcc24720ctgcctccaaacgatacctgttagcaatatttaatagcttgaaatgatgaagagctctgt24780gtttgtcttcctgcctccagttcgccgggcattcaacataaaaactgatagcacccggag24840ttccggaaacgaaatttgcatatacccattgctcacgaaaaaaaatgtccttgtcgatat24900agggatgaatcgcttggtgtacctcatctactgcgaaaacttgacctttctctcccatat24960tgcagtcgcggcacgatggaactaaattaataggcatcaccgaaaattcaggataatgtg25020caataggaagaaaatgatctatattttttgtctgtcctatatcaccacaaaatggacatt25080tttcacctgatgaaacaagcatgtcatcgtaatatgttctagcgggtttgtttttatctc25140ggagattattttcataaagcttttctaatttaacctttgtcaggttaccaactactaagg25200ttgtaggctcaagagggtgtgtcctgtcgtaggtaaataactgacctgtcgagcttaata25260ttctatattgttgttctttctgcaaaaaagtggggaagtgagtaatgaaattatttctaa25320catttatctgcatcataccttccgagcatttattaagcatttcgctataagttctcgctg25380gaagaggtagttttttcattgtactttaccttcatctctgttcattatcatcgcttttaa25440aacggttcgaccttctaatcctatctgaccattataattttttagaatggtttcataaga25500aagctctgaatcaacggactgcgataataagtggtggtatccagaatttgtcacttcaag25560taaaaacacctcacgagttaaaacacctaagttctcaccgaatgtctcaatatccggacg25620gataatatttattgcttctcttgaccgtaggactttccacatgcaggattttggaacctc25680ttgcagtactactggggaatgagttgcaattattgctacaccattgcgtgcatcgagtaa25740gtcgcttaatgttcgtaaaaaagcagagagcaaaggtggatgcagatgaacctctggttc25800atcgaataaaactaatgacttttcgccaacgacatctactaatcttgtgatagtaaataa25860aacaattgcatgtccagagctcattcgaagcagatatttctggatattgtcataaaacaa25920tttagtgaatttatcatcgtccacttgaatctgtggttcattacgtcttaactcttcata25980tttagaaatgaggctgatgagttccatatttgaaaagttttcatcactacttagtttttt26040gatagcttcaagccagagttgtctttttctatctactctcatacaaccaataaatgctga26100aatgaattctaagcggagatcgcctagtgattttaaactattgctggcagcattcttgag26160tccaatataaaagtattgtgtaccttttgctgggtcaggttgttctttaggaggagtaaa26220aggatcaaatgcactaaacgaaactgaaacaagcgatcgaaaatatccctttgggattct26280tgactcgataagtctattattttcagagaaaaaatattcattgttttctgggttggtgat26340tgcaccaatcattccattcaaaattgttgttttaccacacccattccgcccgataaaagc26400atgaatgttcgtgctgggcatagaattaaccgtcacctcaaaaggtatagttaaatcact26460gaatccgggagcactttttctattaaatgaaaagtggaaatctgacaattctggcaaacc26520atttaacacacgtgcgaactgtccatgaatttctgaaagagttacccctctaagtaatga26580ggtgttaaggacgctttcattttcaatgtcggctaatcgatttggccatactactaaatc26640ctgaatagctttaagaaggttatgtttaaaaccatcgcttaatttgctgagattaacata26700gtagtcaatgctttcacctaaggaaaaaaacatttcagggagttgactgaattttttatc26760tattaatgaataagtgcttacttcttctttttgacctacaaaaccaattttaacatttcc26820gatatcgcatttttcaccatgctcatcaaagacagtaagataaaacattgtaacaaagga26880atagtcattccaaccatctgctcgtaggaatgccttatttttttctactgcaggaatata26940cccgcctctttcaataacactaaactccaacatatagtaacccttaattttattaaaata27000accgcaatttatttggcggcaacacaggatctctcttttaagttactctctattacatac27060gttttccatctaaaaattagtagtattgaacttaacggggcatcgtattgtagttttcca27120tatttagctttctgcttccttttggataacccactgttattcatgttgcatggtgcactg27180tttataccaacgatatagtctattaatgcatatatagtatcgccgaacgattagctcttc27240aggcttctgaagaagcgtttcaagtactaataagccgatagatagccacggacttcgtag27300ccatttttcataagtgttaacttccgctcctcgctcataacagacattcactacagttat27360ggcggaaaggtatgcatgctgggtgtggggaagtcgtgaaagaaaagaagtcagctgcgt27420cgtttgacatcactgctatcttcttactggttatgcaggtcgtagtgggtggcacacaaa27480gctttgcactggattgcgaggctttgtgcttctctggagtgcgacaggtttgatgacaaa27540aaattagcgcaagaagacaaaaatcaccttgcgctaatgctctgttacaggtcactaata27600ccatctaagtagttgattcatagtgactgcatatgttgtgttttacagtattatgtagtc27660tgttttttatgcaaaatctaatttaatatattgatatttatatcattttacgtttctcgt27720tcagcttttttatactaagttggcattataaaaaagcattgcttatcaatttgttgcaac27780gaacaggtcactatcagtcaaaataaaatcattatttgatttcaattttgtcccactccc27840tgcctctgtcatcacgatactgtgatgccatggtgtccgacttatgcccgagaagatgtt27900gagcaaacttatcgcttatctgcttctcatagagtcttgcagacaaactgcgcaactcgt27960gaaaggtaggcggatccccttcgaaggaaagacctgatgcttttcgtgcgcgcataaaat28020accttgatactgtgccggatgaaagcggttcgcgacgagtagatgcaattatggtttctc28080cgccaagaatctctttgcatttatcaagtgtttccttcattgatattccgagagcatcaa28140tatgcaatgctgttgggatggcaatttttacgcctgttttgctttgctcgacataaagat28200atccatctacgatatcagaccacttcatttcgcataaatcaccaactcgttgcccggtaa28260caacagccagttccattgcaagtctgagccaacatggtgatgattctgctgcttgataaa28320ttttcaggtattcgtcagccgtaagtcttgatctccttacctctgattttgctgcgcgag28380tggcagcgacatggtttgttgttatatggccttcagctattgcctctcggaatgcatcgc28440tcagtgttgatctgattaacttggctgacgccgccttgccctcgtctatgtatccattga28500gcattgccgcaatttcttttgtggtgatgtcttcaagtggagcatcaggcagacccctcc28560ttattgctttaattttgctcatgtaatttatgagtgtcttctgcttgattcctctgctgg28620ccaggattttttcgtagcgatcaagccatgaatgtaacgtaacggaattatcactgttga28680ttctcgctgtcagaggcttgtgtttgtgtcctgaaaataactcaatgttggcctgtatag28740cttcagtgattgcgattcgcctgtctctgcctaatccaaactctttacccgtccttgggt28800ccctgtagcagtaatatccattgtttcttatataaaggttagggggtaaatcccggcgct28860catgacttcgccttcttcccatttctgatcctcttcaaaaggccacctgttactggtcga28920tttaagtcaacctttaccgctgattcgtggaacagatactctcttccatccttaaccgga28980ggtgggaatatcctgcattcccgaacccatcgacgaactgtttcaaggcttcttggacgt29040cgctggcgtgcgttccactcctgaagtgtcaagtacatcgcaaagtctccgcaattacac29100gcaagaaaaaaccgccatcaggcggcttggtgttctttcagttcttcaattcgaatattg29160gttacgtctgcatgtgctatctgcgcccatatcatccagtggtcgtagcagtcgttgatg29220ttctccgcttcgataactctgttgaatggctctccattccattctcctgtgactcggaag29280tgcatttatcatctccataaaacaaaacccgccgtagcgagttcagataaaataaatccc29340cgcgagtgcgaggattgttatgtaatattgggtttaatcatctatatgttttgtacagag29400agggcaagtatcgtttccaccgtactcgtgataataattttgcacggtatcagtcatttc29460tcgcacattgcagaatggggatttgtcttcattagacttataaaccttcatggaatattt29520gtatgccgactctatatctataccttcatctacataaacaccttcgtgatgtctgcatgg29580agacaagacaccggatctgcacaacattgataacgcccaatctttttgctcagactctaa29640ctcattgatactcatttataaactccttgcaatgtatgtcgtttcagctaaacggtatca29700gcaatgtttatgtaaagaaacagtaagataatactcaacccgatgtttgagtacggtcat29760catctgacactacagactctggcatcgctgtgaagacgacgcgaaattcagcattttcac29820aagcgttatcttttacaaaaccgatctcactctcctttgatgcgaatgccagcgtcagac29880atcatatgcagatactcacctgcatcctgaacccattgacctccaaccccgtaatagcga29940tgcgtaatgatgtcgatagttactaacgggtcttgttcgattaactgccgcagaaactct30000tccaggtcaccagtgcagtgcttgataacaggagtcttcccaggatggcgaacaacaaga30060aactggtttccgtcttcacggacttcgttgctttccagtttagcaatacgcttactccca30120tccgagataacaccttcgtaatactcacgctgctcgttgagttttgattttgctgtttca30180agctcaacacgcagtttccctactgttagcgcaatatcctcgttctcctggtcgcggcgt30240ttgatgtattgctggtttctttcccgttcatccagcagttccagcacaatcgatggtgtt30300accaattcatggaaaaggtctgcgtcaaatccccagtcgtcatgcattgcctgctctgcc30360gcttcacgcagtgcctgagagttaatttcgctcacttcgaacctctctgtttactgataa30420gttccagatcctcctggcaacttgcacaagtccgacaaccctgaacgaccaggcgtcttc30480gttcatctatcggatcgccacactcacaacaatgagtggcagatatagcctggtggttca30540ggcggcgcatttttattgctgtgttgcgctgtaattcttctatttctgatgctgaatcaa30600tgatgtctgccatctttcattaatccctgaactgttggttaatacgcttgagggtgaatg30660cgaataataaaaaaggagcctgtagctccctgatgattttgcttttcatgttcatcgttc30720cttaaagacgccgtttaacatgccgattgccaggcttaaatgagtcggtgtgaatcccat30780cagcgttaccgtttcgcggtgcttcttcagtacgctacggcaaatgtcatcgacgttttt30840atccggaaactgctgtctggctttttttgatttcagaattagcctgacgggcaatgctgc30900gaagggcgttttcctgctgaggtgtcattgaacaagtcccatgtcggcaagcataagcac30960acagaatatgaagcccgctgccagaaaaatgcattccgtggttgtcatacctggtttctc31020tcatctgcttctgctttcgccaccatcatttccagcttttgtgaaagggatgcggctaac31080gtatgaaattcttcgtctgtttctactggtattggcacaaacctgattccaatttgagca31140aggctatgtgccatctcgatactcgttcttaactcaacagaagatgctttgtgcatacag31200cccctcgtttattatttatctcctcagccagccgctgtgctttcagtggatttcggataa31260cagaaaggccgggaaatacccagcctcgctttgtaacggagtagacgaaagtgattgcgc31320ctacccggatattatcgtgaggatgcgtcatcgccattgctccccaaatacaaaaccaat31380ttcagccagtgcctcgtccattttttcgatgaactccggcacgatctcgtcaaaactcgc31440catgtacttttcatcccgctcaatcacgacataatgcaggccttcacgcttcatacgcgg31500gtcatagttggcaaagtaccaggcattttttcgcgtcacccacatgctgtactgcacctg31560ggccatgtaagctgactttatggcctcgaaaccaccgagccggaacttcatgaaatcccg31620ggaggtaaacgggcatttcagttcaaggccgttgccgtcactgcataaaccatcgggaga31680gcaggcggtacgcatactttcgtcgcgatagatgatcggggattcagtaacattcacgcc31740ggaagtgaattcaaacagggttctggcgtcgttctcgtactgttttccccaggccagtgc31800tttagcgttaacttccggagccacaccggtgcaaacctcagcaagcagggtgtggaagta31860ggacattttcatgtcaggccacttctttccggagcggggttttgctatcacgttgtgaac31920ttctgaagcggtgatgacgccgagccgtaatttgtgccacgcatcatccccctgttcgac31980agctctcacatcgatcccggtacgctgcaggataatgtccggtgtcatgctgccaccttc32040tgctctgcggctttctgtttcaggaatccaagagcttttactgcttcggcctgtgtcagt32100tctgacgatgcacgaatgtcgcggcgaaatatctgggaacagagcggcaataagtcgtca32160tcccatgttttatccagggcgatcagcagagtgttaatctcctgcatggtttcatcgtta32220accggagtgatgtcgcgttccggctgacgttctgcagtgtatgcagtattttcgacaatg32280cgctcggcttcatccttgtcatagataccagcaaatccgaaggccagacgggcacactga32340atcatggctttatgacgtaacatccgtttgggatgcgactgccacggccccgtgatttct32400ctgccttcgcgagttttgaatggttcgcggcggcattcatccatccattcggtaacgcag32460atcggatgattacggtccttgcggtaaatccggcatgtacaggattcattgtcctgctca32520aagtccatgccatcaaactgctggttttcattgatgatgcgggaccagccatcaacgccc32580accaccggaacgatgccattctgcttatcaggaaaggcgtaaatttctttcgtccacgga32640ttaaggccgtactggttggcaacgatcagtaatgcgatgaactgcgcatcgctggcatca32700cctttaaatgccgtctggcgaagagtggtgatcagttcctgtgggtcgacagaatccatg32760ccgacacgttcagccagcttcccagccagcgttgcgagtgcagtactcattcgttttata32820cctctgaatcaatatcaacctggtggtgagcaatggtttcaaccatgtaccggatgtgtt32880ctgccatgcgctcctgaaactcaacatcgtcatcaaacgcacgggtaatggattttttgc32940tggccccgtggcgttgcaaatgatcgatgcatagcgattcaaacaggtgctggggcaggc33000ctttttccatgtcgtctgccagttctgcctctttctcttcacgggcgagctgctggtagt33060gacgcgcccagctctgagcctcaagacgatcctgaatgtaataagcgttcatggctgaac33120tcctgaaatagctgtgaaaatatcgcccgcgaaatgccgggctgattaggaaaacaggaa33180agggggttagtgaatgcttttgcttgatctcagtttcagtattaatatccattttttata33240agcgtcgacggcttcacgaaacatcttttcatcgccaataaaagtggcgatagtgaattt33300agtctggatagccataagtgtttgatccattctttgggactcctggctgattaagtatgt33360cgataaggcgtttccatccgtcacgtaatttacgggtgattcgttcaagtaaagattcgg33420aagggcagccagcaacaggccaccctgcaatggcatattgcatggtgtgctccttattta33480tacataacgaaaaacgcctcgagtgaagcgttattggtatgcggtaaaaccgcactcagg33540cggccttgatagtcatatcatctgaatcaaatattcctgatgtatcgatatcggtaattc33600ttattccttcgctaccatccattggaggccatccttcctgaccatttccatcattccagt33660cgaactcacacacaacaccatatgcatttaagtcgcttgaaattgctataagcagagcat33720gttgcgccagcatgattaatacagcatttaatacagagccgtgtttattgagtcggtatt33780cagagtctgaccagaaattattaatctggtgaagtttttcctctgtcattacgtcatggt33840cgatttcaatttctattgatgctttccagtcgtaatcaatgatgtattttttgatgtttg33900acatctgttcatatcctcacagataaaaaatcgccctcacactggagggcaaagaagatt33960tccaataatcagaacaagtcggctcctgtttagttacgagcgacattgctccgtgtattc34020actcgttggaatgaatacacagtgcagtgtttattctgttatttatgccaaaaataaagg34080ccactatcaggcagctttgttgttctgtttaccaagttctctggcaatcattgccgtcgt34140tcgtattgcccatttatcgacatatttcccatcttccattacaggaaacatttcttcagg34200cttaaccatgcattccgattgcagcttgcatccattgcatcgcttgaattgtccacacca34260ttgatttttatcaatagtcgtagtcatacggatagtcctggtattgttccatcacatcct34320gaggatgctcttcgaactcttcaaattcttcttccatatatcaccttaaatagtggattg34380cggtagtaaagattgtgcctgtcttttaaccacatcaggctcggtggttctcgtgtaccc34440ctacagcgagaaatcggataaactattacaacccctacagtttgatgagtatagaaatgg34500atccactcgttattctcggacgagtgttcagtaatgaacctctggagagaaccatgtata34560tgatcgttatctgggttggacttctgcttttaagcccagataactggcctgaatatgtta34620atgagagaatcggtattcctcatgtgtggcatgttttcgtctttgctcttgcattttcgc34680tagcaattaatgtgcatcgattatcagctattgccagcgccagatataagcgatttaagc34740taagaaaacgcattaagatgcaaaacgataaagtgcgatcagtaattcaaaaccttacag34800aagagcaatctatggttttgtgcgcagcccttaatgaaggcaggaagtatgtggttacat34860caaaacaattcccatacattagtgagttgattgagcttggtgtgttgaacaaaacttttt34920cccgatggaatggaaagcatatattattccctattgaggatatttactggactgaattag34980ttgccagctatgatccatataatattgagataaagccaaggccaatatctaagtaactag35040ataagaggaatcgattttcccttaattttctggcgtccactgcatgttatgccgcgttcg35100ccaggcttgctgtaccatgtgcgctgattcttgcgctcaatacgttgcaggttgctttca35160atctgtttgtggtattcagccagcactgtaaggtctatcggatttagtgcgctttctact35220cgtgatttcggtttgcgattcagcgagagaatagggcggttaactggttttgcgcttacc35280ccaaccaacaggggatttgctgctttccattgagcctgtttctctgcgcgacgttcgcgg35340cggcgtgtttgtgcatccatctggattctcctgtcagttagctttggtggtgtgtggcag35400ttgtagtcctgaacgaaaaccccccgcgattggcacattggcagctaatccggaatcgca35460cttacggccaatgcttcgtttcgtatcacacaccccaaagccttctgctttgaatgctgc35520ccttcttcagggcttaatttttaagagcgtcaccttcatggtggtcagtgcgtcctgctg35580atgtgctcagtatcaccgccagtggtatttatgtcaacaccgccagagataatttatcac35640cgcagatggttatctgtatgttttttatatgaatttattttttgcaggggggcattgttt35700ggtaggtgagagatctgaattgctatgtttagtgagttgtatctatttatttttcaataa35760atacaattggttatgtgttttgggggcgatcgtgaggcaaagaaaacccggcgctgaggc35820cgggttattcttgttctctggtcaaattatatagttggaaaacaaggatgcatatatgaa35880tgaacgatgcagaggcaatgccgatggcgatagtgggtatcatgtagccgcttatgctgg35940aaagaagcaataacccgcagaaaaacaaagctccaagctcaacaaaactaagggcataga36000caataactaccgatgtcatatacccatactctctaatcttggccagtcggcgcgttctgc36060ttccgattagaaacgtcaaggcagcaatcaggattgcaatcatggttcctgcatatgatg36120acaatgtcgccccaagaccatctctatgagctgaaaaagaaacaccaggaatgtagtggc36180ggaaaaggagatagcaaatgcttacgataacgtaaggaattattactatgtaaacaccag36240gcatgattctgttccgcataattactcctgataattaatccttaactttgcccacctgcc36300ttttaaaacattccagtatatcacttttcattcttgcgtagcaatatgccatctcttcag36360ctatctcagcattggtgaccttgttcagaggcgctgagagatggcctttttctgatagat36420aatgttctgttaaaatatctccggcctcatcttttgcccgcaggctaatgtctgaaaatt36480gaggtgacgggttaaaaataatatccttggcaaccttttttatatcccttttaaattttg36540gcttaatgactatatccaatgagtcaaaaagctccccttcaatatctgttgcccctaaga36600cctttaatatatcgccaaatacaggtagcttggcttctaccttcaccgttgttcggccga36660tgaaatgcatatgcataacatcgtctttggtggttcccctcatcagtggctctatctgaa36720cgcgctctccactgcttaatgacattcctttcccgattaaaaaatctgtcagatcggatg36780tggtcggcccgaaaacagttctggcaaaaccaatggtgtcgccttcaacaaacaaaaaag36840atgggaatcccaatgattcgtcatctgcgaggctgttcttaatatcttcaactgaagctt36900tagagcgatttatcttctgaaccagactcttgtcatttgttttggtaaagagaaaagttt36960ttccatcgattttatgaatatacaaataattggagccaacctgcaggtgatgattatcag37020ccagcagagaattaaggaaaacagacaggtttattgagcgcttatctttccctttatttt37080tgctgcggtaagtcgcataaaaaccattcttcataattcaatccatttactatgttatgt37140tctgaggggagtgaaaattcccctaattcgatgaagattcttgctcaattgttatcagct37200atgcgccgaccagaacaccttgccgatcagccaaacgtctcttcaggccactgactagcg37260ataactttccccacaacggaacaactctcattgcatgggatcattgggtactgtgggttt37320agtggttgtaaaaacacctgaccgctatccctgatcagtttcttgaaggtaaactcatca37380cccccaagtctggctatgcagaaatcacctggctcaacagcctgctcagggtcaacgaga37440attaacattccgtcaggaaagcttggcttggagcctgttggtgcggtcatggaattacct37500tcaacctcaagccagaatgcagaatcactggcttttttggttgtgcttacccatctctcc37560gcatcacctttggtaaaggttctaagcttaggtgagaacatccctgcctgaacatgagaa37620aaaacagggtactcatactcacttctaagtgacggctgcatactaaccgcttcatacatc37680tcgtagatttctctggcgattgaagggctaaattcttcaacgctaactttgagaattttt37740gtaagcaatgcggcgttataagcatttaatgcattgatgccattaaataaagcaccaacg37800cctgactgccccatccccatcttgtctgcgacagattcctgggataagccaagttcattt37860ttctttttttcataaattgctttaaggcgacgtgcgtcctcaagctgctcttgtgttaat37920ggtttcttttttgtgctcatacgttaaatctatcaccgcaagggataaatatctaacacc37980gtgcgtgttgactattttacctctggcggtgataatggttgcatgtactaaggaggttgt38040atggaacaacgcataaccctgaaagattatgcaatgcgctttgggcaaaccaagacagct38100aaagatctcggcgtatatcaaagcgcgatcaacaaggccattcatgcaggccgaaagatt38160tttttaactataaacgctgatggaagcgtttatgcggaagaggtaaagcccttcccgagt38220aacaaaaaaacaacagcataaataaccccgctcttacacattccagccctgaaaaagggc38280atcaaattaaaccacacctatggtgtatgcatttatttgcatacattcaatcaattgtta38340tctaaggaaatacttacatatggttcgtgcaaacaaacgcaacgaggctctacgaatcga38400gagtgcgttgcttaacaaaatcgcaatgcttggaactgagaagacagcggaagctgtggg38460cgttgataagtcgcagatcagcaggtggaagagggactggattccaaagttctcaatgct38520gcttgctgttcttgaatggggggtcgttgacgacgacatggctcgattggcgcgacaagt38580tgctgcgattctcaccaataaaaaacgcccggcggcaaccgagcgttctgaacaaatcca38640gatggagttctgaggtcattactggatctatcaacaggagtcattatgacaaatacagca38700aaaatactcaacttcggcagaggtaactttgccggacaggagcgtaatgtggcagatctc38760gatgatggttacgccagactatcaaatatgctgcttgaggcttattcgggcgcagatctg38820accaagcgacagtttaaagtgctgcttgccattctgcgtaaaacctatgggtggaataaa38880ccaatggacagaatcaccgattctcaacttagcgagattacaaagttacctgtcaaacgg38940tgcaatgaagccaagttagaactcgtcagaatgaatattatcaagcagcaaggcggcatg39000tttggaccaaataaaaacatctcagaatggtgcatccctcaaaacgagggaaaatcccct39060aaaacgagggataaaacatccctcaaattgggggattgctatccctcaaaacagggggac39120acaaaagacactattacaaaagaaaaaagaaaagattattcgtcagagaattctggcgaa39180tcctctgaccagccagaaaacgacctttctgtggtgaaaccggatgctgcaattcagagc39240ggcagcaagtgggggacagcagaagacctgaccgccgcagagtggatgtttgacatggtg39300aagactatcgcaccatcagccagaaaaccgaattttgctgggtgggctaacgatatccgc39360ctgatgcgtgaacgtgacggacgtaaccaccgcgacatgtgtgtgctgttccgctgggca39420tgccaggacaacttctggtccggtaacgtgctgagcccggccaaactccgcgataagtgg39480acccaactcgaaatcaaccgtaacaagcaacaggcaggcgtgacagccagcaaaccaaaa39540ctcgacctgacaaacacagactggatttacggggtggatctatgaaaaacatcgccgcac39600agatggttaactttgaccgtgagcagatgcgtcggatcgccaacaacatgccggaacagt39660acgacgaaaagccgcaggtacagcaggtagcgcagatcatcaacggtgtgttcagccagt39720tactggcaactttcccggcgagcctggctaaccgtgaccagaacgaagtgaacgaaatcc39780gtcgccagtgggttctggcttttcgggaaaacgggatcaccacgatggaacaggttaacg39840caggaatgcgcgtagcccgtcggcagaatcgaccatttctgccatcacccgggcagtttg39900ttgcatggtgccgggaagaagcatccgttaccgccggactgccaaacgtcagcgagctgg39960ttgatatggtttacgagtattgccggaagcgaggcctgtatccggatgcggagtcttatc40020cgtggaaatcaaacgcgcactactggctggttaccaacctgtatcagaacatgcgggcca40080atgcgcttactgatgcggaattacgccgtaaggccgcagatgagcttgtccatatgactg40140cgagaattaaccgtggtgaggcgatccctgaaccagtaaaacaacttcctgtcatgggcg40200gtagacctctaaatcgtgcacaggctctggcgaagatcgcagaaatcaaagctaagttcg40260gactgaaaggagcaagtgtatgacgggcaaagaggcaattattcattacctggggacgca40320taatagcttctgtgcgccggacgttgccgcgctaacaggcgcaacagtaaccagcataaa40380tcaggccgcggctaaaatggcacgggcaggtcttctggttatcgaaggtaaggtctggcg40440aacggtgtattaccggtttgctaccagggaagaacgggaaggaaagatgagcacgaacct40500ggtttttaaggagtgtcgccagagtgccgcgatgaaacgggtattggcggtatatggagt40560taaaagatgaccatctacattactgagctaataacaggcctgctggtaatcgcaggcctt40620tttatttgggggagagggaagtcatgaaaaaactaacctttgaaattcgatctccagcac40680atcagcaaaacgctattcacgcagtacagcaaatccttccagacccaaccaaaccaatcg40740tagtaaccattcaggaacgcaaccgcagcttagaccaaaacaggaagctatgggcctgct40800taggtgacgtctctcgtcaggttgaatggcatggtcgctggctggatgcagaaagctgga40860agtgtgtgtttaccgcagcattaaagcagcaggatgttgttcctaaccttgccgggaatg40920gctttgtggtaataggccagtcaaccagcaggatgcgtgtaggcgaatttgcggagctat40980tagagcttatacaggcattcggtacagagcgtggcgttaagtggtcagacgaagcgagac41040tggctctggagtggaaagcgagatggggagacagggctgcatgataaatgtcgttagttt41100ctccggtggcaggacgtcagcatatttgctctggctaatggagcaaaagcgacgggcagg41160taaagacgtgcattacgttttcatggatacaggttgtgaacatccaatgacatatcggtt41220tgtcagggaagttgtgaagttctgggatataccgctcaccgtattgcaggttgatatcaa41280cccggagcttggacagccaaatggttatacggtatgggaaccaaaggatattcagacgcg41340aatgcctgttctgaagccatttatcgatatggtaaagaaatatggcactccatacgtcgg41400cggcgcgttctgcactgacagattaaaactcgttcccttcaccaaatactgtgatgacca41460tttcgggcgagggaattacaccacgtggattggcatcagagctgatgaaccgaagcggct41520aaagccaaagcctggaatcagatatcttgctgaactgtcagactttgagaaggaagatat41580cctcgcatggtggaagcaacaaccattcgatttgcaaataccggaacatctcggtaactg41640catattctgcattaaaaaatcaacgcaaaaaatcggacttgcctgcaaagatgaggaggg41700attgcagcgtgtttttaatgaggtcatcacgggatcccatgtgcgtgacggacatcggga41760aacgccaaaggagattatgtaccgaggaagaatgtcgctggacggtatcgcgaaaatgta41820ttcagaaaatgattatcaagccctgtatcaggacatggtacgagctaaaagattcgatac41880cggctcttgttctgagtcatgcgaaatatttggagggcagcttgatttcgacttcgggag41940ggaagctgcatgatgcgatgttatcggtgcggtgaatgcaaagaagataaccgcttccga42000ccaaatcaaccttactggaatcgatggtgtctccggtgtgaaagaacaccaacaggggtg42060ttaccactaccgcaggaaaaggaggacgtgtggcgagacagcgacgaagtatcaccgaca42120taatctgcgaaaactgcaaataccttccaacgaaacgcaccagaaataaacccaagccaa42180tcccaaaagaatctgacgtaaaaaccttcaactacacggctcacctgtgggatatccggt42240ggctaagacgtcgtgcgaggaaaacaaggtgattgaccaaaatcgaagttacgaacaaga42300aagcgtcgagcgagctttaacgtgcgctaactgcggtcagaagctgcatgtgctggaagt42360tcacgtgtgtgagcactgctgcgcagaactgatgagcgatccgaatagctcgatgcacga42420ggaagaagatgatggctaaaccagcgcgaagacgatgtaaaaacgatgaatgccgggaat42480ggtttcaccctgcattcgctaatcagtggtggtgctctccagagtgtggaaccaagatag42540cactcgaacgacgaagtaaagaacgcgaaaaagcggaaaaagcagcagagaagaaacgac42600gacgagaggagcagaaacagaaagataaacttaagattcgaaaactcgccttaaagcccc42660gcagttactggattaaacaagcccaacaagccgtaaacgccttcatcagagaaagagacc42720gcgacttaccatgtatctcgtgcggaacgctcacgtctgctcagtgggatgccggacatt42780accggacaactgctgcggcacctcaactccgatttaatgaacgcaatattcacaagcaat42840gcgtggtgtgcaaccagcacaaaagcggaaatctcgttccgtatcgcgtcgaactgatta42900gccgcatcgggcaggaagcagtagacgaaatcgaatcaaaccataaccgccatcgctgga42960ctatcgaagagtgcaaggcgatcaaggcagagtaccaacagaaactcaaagacctgcgaa43020atagcagaagtgaggccgcatgacgttctcagtaaaaaccattccagacatgctcgttga43080aacatacggaaatcagacagaagtagcacgcagactgaaatgtagtcgcggtacggtcag43140aaaatacgttgatgataaagacgggaaaatgcacgccatcgtcaacgacgttctcatggt43200tcatcgcggatggagtgaaagagatgcgctattacgaaaaaattgatggcagcaaatacc43260gaaatatttgggtagttggcgatctgcacggatgctacacgaacctgatgaacaaactgg43320atacgattggattcgacaacaaaaaagacctgcttatctcggtgggcgatttggttgatc43380gtggtgcagagaacgttgaatgcctggaattaatcacattcccctggttcagagctgtac43440gtggaaaccatgagcaaatgatgattgatggcttatcagagcgtggaaacgttaatcact43500ggctgcttaatggcggtggctggttctttaatctcgattacgacaaagaaattctggcta43560aagctcttgcccataaagcagatgaacttccgttaatcatcgaactggtgagcaaagata43620aaaaatatgttatctgccacgccgattatccctttgacgaatacgagtttggaaagccag43680ttgatcatcagcaggtaatctggaaccgcgaacgaatcagcaactcacaaaacgggatcg43740tgaaagaaatcaaaggcgcggacacgttcatctttggtcatacgccagcagtgaaaccac43800tcaagtttgccaaccaaatgtatatcgataccggcgcagtgttctgcggaaacctaacat43860tgattcaggtacagggagaaggcgcatgagactcgaaagcgtagctaaatttcattcgcc43920aaaaagcccgatgatgagcgactcaccacgggccacggcttctgactctctttccggtac43980tgatgtgatggctgctatggggatggcgcaatcacaagccggattcggtatggctgcatt44040ctgcggtaagcacgaactcagccagaacgacaaacaaaaggctatcaactatctgatgca44100atttgcacacaaggtatcggggaaataccgtggtgtggcaaagcttgaaggaaatactaa44160ggcaaaggtactgcaagtgctcgcaacattcgcttatgcggattattgccgtagtgccgc44220gacgccgggggcaagatgcagagattgccatggtacaggccgtgcggttgatattgccaa44280aacagagctgtgggggagagttgtcgagaaagagtgcggaagatgcaaaggcgtcggcta44340ttcaaggatgccagcaagcgcagcatatcgcgctgtgacgatgctaatcccaaaccttac44400ccaacccacctggtcacgcactgttaagccgctgtatgacgctctggtggtgcaatgcca44460caaagaagagtcaatcgcagacaacattttgaatgcggtcacacgttagcagcatgattg44520ccacggatggcaacatattaacggcatgatattgacttattgaataaaattgggtaaatt44580tgactcaacgatgggttaattcgctcgttgtggtagtgagatgaaaagaggcggcgctta44640ctaccgattccgcctagttggtcacttcgacgtatcgtctggaactccaaccatcgcagg44700cagagaggtctgcaaaatgcaatcccgaaacagttcgcaggtaatagttagagcctgcat44760aacggtttcgggattttttatatctgcacaacaggtaagagcattgagtcgataatcgtg44820aagagtcggcgagcctggttagccagtgctctttccgttgtgctgaattaagcgaatacc44880ggaagcagaaccggatcaccaaatgcgtacaggcgtcatcgccgcccagcaacagcacaa44940cccaaactgagccgtagccactgtctgtcctgaattcattagtaatagttacgctgcggc45000cttttacacatgaccttcgtgaaagcgggtggcaggaggtcgcgctaacaacctcctgcc45060gttttgcccgtgcatatcggtcacgaacaaatctgattactaaacacagtagcctggatt45120tgttctatcagtaatcgaccttattcctaattaaatagagcaaatccccttattgggggt45180aagacatgaagatgccagaaaaacatgacctgttggccgccattctcgcggcaaaggaac45240aaggcatcggggcaatccttgcgtttgcaatggcgtaccttcgcggcagatataatggcg45300gtgcgtttacaaaaacagtaatcgacgcaacgatgtgcgccattatcgcctagttcattc45360gtgaccttctcgacttcgccggactaagtagcaatctcgcttatataacgagcgtgttta45420tcggctacatcggtactgactcgattggttcgcttatcaaacgcttcgctgctaaaaaag45480ccggagtagaagatggtagaaatcaataatcaacgtaaggcgttcctcgatatgctggcg45540tggtcggagggaactgataacggacgtcagaaaaccagaaatcatggttatgacgtcatt45600gtaggcggagagctatttactgattactccgatcaccctcgcaaacttgtcacgctaaac45660ccaaaactcaaatcaacaggcgccggacgctaccagcttctttcccgttggtgggatgcc45720taccgcaagcagcttggcctgaaagacttctctccgaaaagtcaggacgctgtggcattg45780cagcagattaaggagcgtggcgctttacctatgattgatcgtggtgatatccgtcaggca45840atcgaccgttgcagcaatatctgggcttcactgccgggcgctggttatggtcagttcgag45900cataaggctgacagcctgattgcaaaattcaaagaagcgggcggaacggtcagagagatt45960gatgtatgagcagagtcaccgcgattatctccgctctggttatctgcatcatcgtctgcc46020tgtcatgggctgttaatcattaccgtgataacgccattacctacaaagcccagcgcgaca46080aaaatgccagagaactgaagctggcgaacgcggcaattactgacatgcagatgcgtcagc46140gtgatgttgctgcgctcgatgcaaaatacacgaaggagttagctgatgctaaagctgaaa46200atgatgctctgcgtgatgatgttgccgctggtcgtcgtcggttgcacatcaaagcagtct46260gtcagtcagtgcgtgaagccaccaccgcctccggcgtggataatgcagcctccccccgac46320tggcagacaccgctgaacgggattatttcaccctcagagagaggctgatcactatgcaaa46380aacaactggaaggaacccagaagtatattaatgagcagtgcagatagagttgcccatatc46440gatgggcaactcatgcaattattgtgagcaatacacacgcgcttccagcggagtataaat46500gcctaaagtaataaaaccgagcaatccatttacgaatgtttgctgggtttctgttttaac46560aacattttctgcgccgccacaaattttggctgcatcgacagttttcttctgcccaattcc46620agaaacgaagaaatgatgggtgatggtttcctttggtgctactgctgccggtttgttttg46680aacagtaaacgtctgttgagcacatcctgtaataagcagggccagcgcagtagcgagtag46740catttttttcatggtgttattcccgatgctttttgaagttcgcagaatcgtatgtgtaga46800aaattaaacaaaccctaaacaatgagttgaaatttcatattgttaatatttattaatgta46860tgtcaggtgcgatgaatcgtcattgtattcccggattaactatgtccacagccctgacgg46920ggaacttctctgcgggagtgtccgggaataattaaaacgatgcacacagggtttagcgcg46980tacacgtattgcattatgccaacgccccggtgctgacacggaagaaaccggacgttatga47040tttagcgtggaaagatttgtgtagtgttctgaatgctctcagtaaatagtaatgaattat47100caaaggtatagtaatatcttttatgttcatggatatttgtaacccatcggaaaactcctg47160ctttagcaagattttccctgtattgctgaaatgtgatttctcttgatttcaacctatcat47220aggacgtttctataagatgcgtgtttcttgagaatttaacatttacaacctttttaagtc47280cttttattaacacggtgttatcgttttctaacacgatgtgaatattatctgtggctagat47340agtaaatataatgtgagacgttgtgacgttttagttcagaataaaacaattcacagtcta47400aatcttttcgcacttgatcgaatatttctttaaaaatggcaacctgagccattggtaaaa47460ccttccatgtgatacgagggcgcgtagtttgcattatcgtttttatcgtttcaatctggt47520ctgacctccttgtgttttgttgatgatttatgtcaaatattaggaatgttttcacttaat47580agtattggttgcgtaacaaagtgcggtcctgctggcattctggagggaaatacaaccgac47640agatgtatgtaaggccaacgtgctcaaatcttcatacagaaagatttgaagtaatatttt47700aaccgctagatgaagagcaagcgcatggagcgacaaaatgaataaagaacaatctgctga47760tgatccctccgtggatctgattcgtgtaaaaaatatgcttaatagcaccatttctatgag47820ttaccctgatgttgtaattgcatgtatagaacataaggtgtctctggaagcattcagagc47880aattgaggcagcgttggtgaagcacgataataatatgaaggattattccctggtggttga47940ctgatcaccataactgctaatcattcaaactatttagtctgtgacagagccaacacgcag48000tctgtcactgtcaggaaagtggtaaaactgcaactcaattactgcaatgccctcgtaatt48060aagtgaatttacaatatcgtcctgttcggagggaagaacgcgggatgttcattcttcatc48120acttttaattgatgtatatgctctcttttctgacgttagtctccgacggcaggcttcaat48180gacccaggctgagaaattcccggaccctttttgctcaagagcgatgttaatttgttcaat48240catttggttaggaaagcggatgttgcgggttgttgttctgcgggttctgttcttcgttga48300catgaggttgccccgtattcagtgtcgctgatttgtattgtctgaagttgtttttacgtt48360aagttgatgcagatcaattaatacgatacctgcgtcataattgattatttgacgtggttt48420gatggcctccacgcacgttgtgatatgtagatgataatcattatcactttacgggtcctt48480tccggtgatccgacaggttacg48502<210>32<211>12<212>dna<213>人工序列<220><223>实施例1中使用的序列。<400>32tttttttttttt12<210>33<211>51<212>dna<213>人工序列<220><223>实施例1中使用的序列。<400>33ggttgtttctgttggtgctgatattgcggcgtctgcttgggtgtttaacct51<210>34<211>68<212>dna<213>人工序列<220><223>实施例1中使用的序列。<400>34ggttaaacacccaagcagacgccgcaatatcagcaccaacagaaacaacctttgaggcga60gcggtcaa68<210>35<211>15<212>dna<213>人工序列<220><223>实施例1中使用的序列。<400>35ttgaccgctcgcctc15<210>36<211>53<212>dna<213>人工序列<220><223>实施例2中使用的序列。<400>36gatctgaagcggcgcacgaaaaacgcgaaagcgtttcacgataatgcgaaaac53<210>37<211>54<212>dna<213>人工序列<220><223>实施例2中使用的序列。<400>37ttttgttttcgcatttatcgtgaaacgctttcgcgtttttcgtgcgccgcttca54当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1