通过核酸内切酶保护的靶向富集的制作方法

文档序号:26003841发布日期:2021-07-23 21:21阅读:76来源:国知局
通过核酸内切酶保护的靶向富集的制作方法

本发明属于遗传学研究领域,更具体地,属于靶向核酸分离领域,如用于遗传学研究中进一步分析或加工的文库制备。公开了用于降低核酸样品复杂度或富集核酸样品内靶核酸的新方法和组合物。

发明背景

遗传研究的重要组成是所定义的dna基因座的序列分析。这可以是对已知变体基因分型,或鉴定序列变化或变体。这类分析通常需要以多重方式完成,如需要在大量样品中分析特定基因座组。用于此的理想试验在需要筛选的样品及基因座数目方面灵活,高精度且适合不同测序平台。尝试提供包括富集步骤的试验但理想的是没有扩增。例如,us2014/0134610描述了降低复杂性的方法,使用ii型限制酶以片段化样品中的核酸,然后连接保护性接头且随后用核酸外切酶降解所有非捕获核酸。在wo2016/028887中,此方法如下改善:使用可编程的核酸内切酶,即crispr-核酸内切酶,片段化样品中的核酸。

crispr(成簇的规律间隔的短回文重复序列)是含多个较短直接重复序列的基因座且在40%经测序的细菌和90%经测序的古生菌内发现。crispr重复序列形成获得性细菌免疫系统,抵御遗传学病原体如噬菌体和质粒。当细菌受到病原体攻击时,一小段病原体基因组通过crispr相关蛋白(cas)加工并纳入crispr重复序列之间的细菌基因组。crispr基因座接着转录并加工形成所谓的crrna,其包含约30bp与病原体基因组相同的序列。这些rna分子形成在后续感染之后识别病原体的基础并通过直接消化病原体基因组来导致病原体遗传因子沉默。cas蛋白cas9是来自酿脓链球菌(s.pyogenes)的ii型crispr-cas系统的主要成分,且在联合crrna和称为反式激活crrna(tracrrna)的第二rna时形成核酸内切酶,所述核酸内切酶靶向侵入的致病dna,以通过在crrna所定义基因组位置处引入dna双链断裂(dsb)而降解。此ii型crispr-cas9系统证明在生物化学中是方便有效的工具,通过靶向引入双链缺口和随后激活内源修复机制,能够在真核基因组感兴趣位点引入修饰。jinek等.(2012,science337:816-820)证明单链嵌合rna(单引导rna、srna、sgrna)能够联合cas9形成功能核酸内切酶,所述单链嵌合rna通过组合crrna和tracrrna基本序列到单一rna分子内生成。从不同细菌种群中鉴定了许多不同crispr-cas系统(zetsche等.2015cell163,759-771;kim等.2017,nat.commun.8,1-7;ran等.2015.nature520,186-191)。

除了rna指导用于引导核酸内切酶到核酸分子特定位置的crispr-cas系统,本领域已知使用dna或rna指导的其他核酸内切酶(doxzen等.2017,plosone12(5):e0177097;kaya等.2016,pnas卷113第15号,4057-4062)。

本领域仍然很需要灵活且精确的方法用于降低核酸复杂性。本领域尤其需要就一个或多个靶核酸片段富集样品的通用方法,例如用于遗传学研究的后续分析或加工。

本发明如下详述,允许高度简化的文库制备方法用于下游加工和/或分析。

发明概述

第一方面,本发明涉及从包含核酸分子的样品富集靶核酸片段的方法,其中靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:

a)提供包含核酸分子的样品,其中所述核酸分子包含感兴趣的序列;

b)用至少第一和第二rna或dna指导的核酸内切酶复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;

c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;和

d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。

优选地,所述rna或dna指导的核酸内切酶复合物是grna-cas复合物。因此,本发明优选涉及从包含核酸分子的样品富集靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:

a)提供包含核酸分子的样品,其中所述核酸分子包含感兴趣的序列;

b)用至少第一和第二grna-cas复合物切割核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;

c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;和

d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。

优选地,步骤b)如下进行:将第一和第二grna-cas复合物与核酸分子一起在约10-90℃,优选约37℃温育约1分钟-约18小时,优选约60分钟。

优选地,步骤c)如下进行:将经切割核酸分子与核酸外切酶在约10-90℃,优选约37℃温育约1分钟-约12小时,优选30分钟。

优选地,所述第一和第二grna-cas复合物至少之一包含cas9蛋白。

优选地,所述第一和第二grna-cas复合物至少之一包含sgrna。

优选地,所述第一和第二grna-cas复合物至少之一包含作为不同分子的crrna及tracrrna。

优选地,所述第一和第二grna-cas复合物至少之一能够诱导dsb。

优选地,所述第一和第二grna-cas复合物都能够诱导dsb。

优选地,在所述步骤b)中,第一和第二grna-cas复合物至少之一使核酸分子的一条链产生缺口,且其中核酸分子与至少第三grna-cas复合物接触,所述第三grna-cas复合物使互补链基本在所述第一或第二grna-cas复合物所形成的缺口的位置的互补位置产生缺口。

第二方面,本发明涉及从包含核酸分子的样品中制备接头连接的靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:

a)提供包含所述核酸分子的样品,其中所述核酸分子包含所述感兴趣的序列;

b)用至少第一和第二grna-cas复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;

c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;

d)任选地,从步骤c所得消化物纯化包含感兴趣的序列的靶核酸片段;和

e)使接头与靶核酸片段连接。

优选地,所述接头是序列接头。

第三方面,本发明涉及从包含核酸分子的样品测序靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:

a)提供包含所述核酸分子的样品,其中所述核酸分子包含所述感兴趣的序列;

b)用至少第一和第二grna-cas复合物切割所述核酸分子,从而产生包含所述感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;

c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;

d)任选地,从步骤c所得的消化物纯化包含所述感兴趣的序列的靶核酸片段;

e)任选地,使接头与靶核酸片段连接;和

f)测序所述至少一个靶核酸片段。

优选地,本文所定义的方法对多个核酸样品平行进行。

优选地,所述核酸分子是基因组dna。

优选地,所述核酸分子是可从植物、动物、人或微生物获得的核酸分子。

第四方面,本发明涉及从核酸分子富集靶核酸片段的的成套试剂盒(kitofparts),所述试剂盒包含:

-至少本文所定义的第一和第二grna-cas复合物以及

-核酸外切酶。

第五方面,本发明涉及本文所定义的第一和第二grna-cas复合物或本文所定义的成套试剂盒用于从核酸分子富集至少一个靶核酸片段的用途。

定义

本说明书和权利要求通篇使用了涉及方法、组合物、应用和本发明其他方面的各种术语。除非另有说明,这样的术语以本发明所属领域的通常意义给出。其他特别定义的术语以与本文所提供定义一致的方式解释。尽管与本文所述类似或等同的任何方法和材料能用于实施本发明测试,但是优选的方法和材料如本文所述。

实施本发明所用常规技术的方法对技术人员是明显的。分子生物学、生物化学、计算化学、细胞培养、重组dna、生物信息学、基因组学、测序和相关领域的常规技术实施为本领域技术人员熟知,且讨论于例如下列参考文献:sambrook等.《分子克隆.实验室手册》(molecularcloning.alaboratorymanual),第2版,冷泉港实验室出版社(coldspringharborlaboratorypress),纽约冷泉港,1989;ausubel等.《精编分子生物学实验指南》(currentprotocolsinmolecularbiology),约翰威利父子公司(johnwiley&sons),纽约,1987和定期更新;和《酶学方法》系列(theseriesmethodsinenzymology),学术出版社(academicpress),圣地亚哥。

除非上下文另有明确说明,“一(a、an)”和“所述”:这些单数形式术语包括复数指示物。因此,例如,提及“一个细胞”包括2个或更多细胞的组合等。

本文所用术语“约”用于描述并解释小变化。例如,该术语能指小于或等于±10%,如小于或等于±5%,小于或等于±4%,小于或等于±3%,小于或等于±2%,小于或等于±1%,小于或等于±0.5%,小于或等于±0.1%或者小于或等于±0.05%。另外,量、比例和其他数值有时在本文中以范围形式表示。应理解这种范围形式出于方便和简洁而使用,其应灵活理解包含明确指定为限值范围的数值,还包含该范围涵盖的所有单独数值或子区间,就如同各数值和子区间被明确指定。例如,约1-约200的范围内比例应理解为包含约1和约200的明确列举界限值,还包含单个比例如约2、约3和约4,以及子区间如约10-约50、约20-约100,等等。

本文所用术语“接头”是单链、双链、部分双链、y型或发夹核酸分子,其能附着优选连接其他核酸末端,例如双链dna分子的一条或两条链,且优选长度有限,如约10-约200、或约10-约100碱基、或约10-约80、或约10-约50、或约10-约30碱基对长度,并且优选是化学合成的。接头的双链结构可由彼此碱基配对的2个不同寡核苷酸分子形成,或由单一寡核苷酸链的发夹结构形成。显然,接头的可粘附末端能设计成与悬垂部分相容或任选地能与之连接,所述悬垂部分通过限制酶和/或可编程核酸酶切割来制备,可设计成与加入非模板延伸反应(如3’-a添加)后产生的悬垂部分相容,或可具有钝端。

“和/或”:术语“和/或”指其中所述的情况的一种或多种可能单独发生,或与所述的情况的至少一种,多至所述的情况的全部组合发生的情形。

用于核酸或核酸反应使用,“扩增”是指制备特定核酸如靶核酸或带标签核酸的拷贝的体外方法。多种扩增核酸方法为本领域已知,核酸反应包括聚合酶链式反应、连接酶链式反应、链置换扩增反应、滚环扩增反应、转录介导扩增法如nasba(例如美国专利号5,409,818)、环介导扩增法(例如使用成环序列的“lamp”扩增,例如美国专利号6,410,278所述)和等温扩增反应。扩增的核酸可以是dna,包括以下、由其组成或从其衍生:dna或rna或dna与rna的混合物,包括经修饰的dna和/或rna。,无论起始核酸是dna、rna或两者,获自一个或多个核酸分子的扩增的产物(即“扩增产物”)可以是dna或rna,或dna与rna核苷或核苷酸的混合物,或其能包括经修饰的dna或rna核苷或核苷酸。

“拷贝”可以是但不限于某一序列,其与特定序列有全序列互补性或全序列相同性。或者,拷贝不必定与此特定序列具有完美序列互补性或相同性,例如允许一定程序的序列变化。例如,拷贝能包括核苷酸类似物如脱氧肌苷或脱氧尿苷,内部序列变化(如通过引物引入的序列变化,该引物所包含的序列与特定序列可杂交但不互补),和/或扩增期间发生的序列错误。

术语“互补性”在本文中定义为序列与完全互补链(如第二或反链)的序列相同性。例如,100%互补(或全互补)的序列在本文理解为与互补链有100%序列相同性,且例如80%互补的序列在本文理解为与(全)互补链有80%序列相同性。

“包含”:此术语解释为包容性和开放性的,且不是排除性的。特别地,该术语和其变型指包含特定特征、步骤或组分。这些术语不应解释为排除其他特征、步骤或组分的存在。

“构建体”或“核酸构建体”或“载体”:这指人造核酸分子,产生自重组dna技术的使用且能用于向宿主细胞递送外源dna,通常目的是在宿主细胞中表达构建体上包含的dna区域。构建体的载体骨架可以是例如质粒,其中整合了(嵌合)基因,或如果适当转录调节序列(例如(诱导型)启动子)已存在,仅想要的核苷酸序列(如编码序列)整合在所述转录调节序列下游。载体可包含更多遗传因子以促进其在分子克隆中的应用,如选择性标记、多克隆位点等。

本文所用术语“双链”和“双链体”,描述碱基配对即杂交在一起的2条互补多核苷酸。互补核苷酸链在本领域也已知为反向互补。

本文所用术语“有效量”指足以引起想要的生物学效果的生物学活性剂的量。例如,在一些实施方案中,有效量核酸外切酶可指足以诱导未保护的核酸切割的核酸外切酶的量。本领域技术人员会理解,物质(agent)的有效量可根据多种因素变化,如所用的物质、使用所述物质的条件以及想要的生物学效果,例如待检测的核酸酶切割程度。

“示范性”:此术语指“用作示例、实例或说明”,且不应解释为排除本文公开的其他配置。

“表达”:这指其中可操作连接合适调控区尤其是启动子的dna区域转录成rna,其进而能翻译成蛋白或肽的过程。

“引导序列”在本文中应理解为指导rna或dna引导的核酸内切酶到rna或dna分子特定位点的序列。在grna-cas复合物的背景下,“引导序列”进一步在本文理解为sgrna或crrna的部分,其是使grna-cas复合物靶向双链dna特定位点所需的。

grna-cas复合物在本文中应理解为与引导rna复合或杂交cas蛋白,也称为crispr-核酸内切酶或crispr-核酸酶,其中引导rna可以是crrna和/或tracrrna或sgrna。

“相同性”和“相似性”能通过已知方法容易地计算。“序列相同性”和“序列相似性”能通过比对2个肽或2个核苷酸序列用总体或局部比对算法确定,取决于2个序列的长度。长度类似的序列优选用总体比对算法(如needlemanwunsch)比对,该算法优选在完整长度上比对序列,而长度显著不同的序列优选用局部比对算法(如smithwaterman)比对。当序列(优选通过例如程序gap或bestfit用默认参数比对时)共有至少某一最小百分比的序列相同性(如下所定义)时,序列可随后称为“大体相同”或“基本相似”。gap采用needleman和wunsch总体比对算法以在其完整长度(全长)上比对2个序列,使匹配数最大化且缺口数最小化。当2个序列具有相似长度时,总体比对适用于确定序列相同性。一般,采用gap默认参数,空位产生罚分=50(核苷酸)/8(蛋白)且空位延伸罚分=3(核苷酸)/2(蛋白)。对于核苷酸,所用默认打分矩阵是nwsgapdna,对于蛋白,默认打分矩阵是blosum62(henikoff&henikoff,1992,pnas89,915-919)。序列比对和序列相同性百分比的分数可用计算机程序测定,如gcgwisconsin包,10.3版,可获自accelrys公司(accelrysinc.),9685scranton路,圣地亚哥,ca92121-3752usa,或使用开源软件如程序“needle”(采用总体needlemanwunsch算法)或“water”(采用局部smithwaterman算法),embosswin2.10.0版,所用参数与上面gap相同,或使用默认设置(都用于“needle”和“water”且都用于蛋白及dna比对,默认空格罚分是10.0且默认空位延伸罚分0.5;默认打分矩阵是用于蛋白的blosum62和用于dna的dnafull)。当序列在长度方面显著不同时,优选局部算法如用smithwaterman算法的那些。

或者,相似性或相同性百分比可通过针对公开数据库搜索来确定,使用算法如fasta,blast等。因此,本发明的核酸和蛋白序列能进一步用作“查询序列”以针对公开数据库执行搜索,例如鉴定其他家族成员或相关序列。这类搜索能用altschul等.(1990)j.mol.biol.215:403—10的blastn和blastx程序(2.0版)实施。blast核苷酸搜索能用nblast程序,得分=100,字长=12执行,以获得本发明核酸分子的核苷酸序列同源物。blast蛋白搜索能用blastx程序,得分=50,字长=3执行,以获得本发明蛋白分子的氨基酸序列同源物。为获得空位比对用于比较目的,空位blast能如altschul等,(1997)nucleicacidsres.25(17):3389-3402所述使用。当使用blast和空位blast程序时,能采用各程序(如blastx和blastn)的默认参数。参见美国国家生物技术信息中心网页http://www.ncbi.nlm.nih.gov/。

术语“核苷酸”包括但不限于天然存在的核苷酸,包括鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶(分别是g、c、a和t)。术语“核苷酸”还意在包括以下这些部分:其不仅包含已知嘌呤与嘧啶碱基,还含有经修饰的其他杂环碱基。这类修饰包括甲基化嘌呤或嘧啶,酰化嘌呤或嘧啶,烷基化核糖或其他杂环。另外,术语“核苷酸”包含以下这些部分:其包含半抗原或荧光标记且可能不仅包含常规核糖及脱氧核糖,还含有其他糖。修饰核苷或核苷酸还包括糖部分的修饰,例如其中一个或多个羟基用卤素原子或脂族基取代,或作为醚、胺功能化,等等。

术语“核酸”、“多核苷酸”和“核酸分子”在本文中可互换使用以描述任何长度的聚合物,如大于约2个碱基,大于约10个碱基,大于约100个碱基,大于约500个碱基,大于1000个碱基,多至约10,000或更多个由核苷酸如脱氧核苷酸或核糖核苷酸构成的碱基,且可酶促或合成产生(例如pna,如美国专利号5,948,902和其中所引用参考文献所述)。所述核酸可与天然产生的核酸以序列特异性方式杂交,该方式与2个天然产生的核酸类似,如能参与watson-crick碱基配对相互作用。另外,核酸和多核苷酸可分离(且任选随后分段)自细胞、组织和/或体液。核酸可以是例如基因组dna(gdna)、线粒体、细胞游离dna(cfdna)、来自文库的dna和/或来自文库的rna。

本文所用术语“核酸样品”或“包含核酸的样品”指含核酸的任何样品,其中样品涉及材料或材料混合物,通常(尽管不必定)采用液体形式,包含一种或多种感兴趣的靶核苷酸序列。本发明方法中用作起始材料的核酸样品能来自任何来源,例如全基因组、染色体集合、单染色体、来自一个或多个染色体或转录的基因的一个或多个区域,且可直接纯化自生物来源或实验室来源如核酸库。核酸样品能获自同一个体,其可以是人或其他物种(如植物、细菌、真菌、藻类、古生菌等),或来自同一物种的不同个体,或不同物种的不同个体。例如,核酸样品可来自细胞、组织、活组织检查、体液、基因组dna文库、cdna文库和/或rna文库。

术语“感兴趣的序列”、“感兴趣的靶核苷酸序列”和“靶序列”在本文中可互换使用,且包括但不限于优选存在于细胞内的任何基因序列,例如基因、部分基因或者基因内或邻近基因的非编码序列。感兴趣的靶序列可存在于染色体、附加体、细胞器基因组如线粒体或叶绿体基因组或能独立于遗传物质主体而存在的遗传物质,例如感染性病毒基因组、质粒、附加体,如转座子。感兴趣的序列可在基因的编码序列之内,转录的非编码序列之内,例如前导序列、尾随序列或内含子。所述感兴趣的核酸序列可存在于双链核酸或单链核酸。

感兴趣的序列可以是但不限于具有或疑似具有多态性如snp的序列。

本文所用术语“寡核苷酸”指核苷酸的单链多聚体,长度优选约2-200个核苷酸,或多至500个核苷酸。寡核苷酸可合成或酶促制备,在一些实施方案中,长度为约10-50个核苷酸。寡核苷酸能包含核糖核苷酸单体(即可以是寡核糖核苷酸)或脱氧核糖核苷酸单体。例如,寡核苷酸可以是约10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-100、100-150、150-200或约200-250个核苷酸长度。

“植物”:这包括植物细胞、植物原生质体、能从其再生植物的植物细胞组织培养物、植物愈伤组织、植物丛以及在植物或植物部分中完整的植物细胞,所述植物部分如胚、花粉、胚珠、种子、叶、花、枝、果实、果仁、穗、穗轴、外壳、梗、根、根尖、花药、谷粒等。植物的非限制性示例包括作物和栽培植物如大麦、卷心菜、油菜(canola)、木薯、花椰菜、菊苣、棉花、黄瓜、茄子、葡萄、辣椒、莴苣、玉米、甜瓜、油菜(oilseedrape)、土豆、南瓜、稻、黑麦、高粱、倭瓜、甘蔗、甜菜、向日葵、甜辣椒、番茄、西瓜、小麦和意大利青瓜。

“前间隔序列”是识别或可与引导rna内引导序列杂交的序列,更特定是crrna或在sgrna情况中,是引导rna的crrna部分,且位于靶序列中、处或附近。

“核酸内切酶”是在结合其靶或识别位点后,水解双链dna中至少一条链或一条rna分子链的酶,核酸内切酶在本文中应理解为位点特异性核酸内切酶且术语“核酸内切酶”和“核酸酶”在本文中可互换使用。限制性核酸内切酶在本文中应理解为同时水解双链体两条链的核酸内切酶,以在dna中引入双重链缺口。“切口”核酸内切酶是仅水解双链体中一条链的核酸内切酶,以生成“有切口的”而不是经切割的dna分子。

“核酸外切酶”在本文中定义为从多核苷酸末端(exo)切割一个或多个核苷酸的任何酶。

“降低复杂性”或“复杂性降低”在本文中应理解为复杂核酸样品减少,如衍生自基因组dna的样品,衍生自液体活检的cfdna,分离的rna样品等。复杂性减少可导致复杂起始材料内所包含的一种或多种特定靶序列或靶核酸片段(本文也命名为靶片段)富集和/或产生样品子集,其中该子集包含复杂起始材料内所包含的一种或多种特定靶序列或片段或者由其组成,而非靶序列或片段的量相较于起始材料即在复杂性减少前非靶序列或片段的量,下降至少20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。降低复杂性一般在进一步分析或方法步骤前实施,如扩增、条形编码、测序、确定表观遗传变异等。复杂性减少优选是可重复的复杂性减少,意味着当同一样品用相同方法降低复杂性时,获得相同或至少相当的子集,这与随机复杂性减少相反。降低复杂性方法的示例包括例如(keygenen.v.、thenetherlands;参见例如ep0534858)、任意引物pcr扩增、捕获探针杂交、dong所述方法(参见例如wo03/012118、wo00/24939)和索引链接(unraup.和deugauk.v.(1994)gene145:163-169)、wo2006/137733;wo2007/037678;wo2007/073165;wo2007/073171、us2005/260628、wo03/010328、us2004/10153所述方法、基因组分配(参见例如wo2004/022758)、基因表达系列分析(sage;参见例如velculescu等,1995,见上和matsumura等,1999,theplantjournal,卷20(6):719-726)以及sage改良(参见例如powell,1998,nucleicacidsresearch,卷26(14):3445-3446;和kenzelmann及1999,nucleicacidsresearch,卷27(3):917-918),microsage(参见例如datson等,1999,nucleicacidsresearch,卷27(5):1300-1307)、大规模并行签名测序(mpss;参见例如brenner等,2000,naturebiotechnology,卷18:630-634和brenner等,2000,pnas,卷97(4):1665-1670)、自消减cdna文库(laveder等,2002,nucleicacidsresearch,卷30(9):e38)、实时多重连接依赖性探针扩增(rt-mlpa;参见例如eldering等,2003,卷31(23):el53)、高覆盖率表达谱(hicep;参见例如fukumura等,2003,nucleicacidsresearch,卷31(16):e94)、roth等公开的通用微阵列系统(roth等,2004,naturebiotechnology,卷22(4):418-426)、转录组消减法(参见例如li等,nucleicacidsresearch,卷33(16):el36)和片段展示(参见例如metsis等,2004,nucleicacidsresearch,vol.32(16):el27)。

“序列”或“核苷酸序列”:这指核酸的或核酸内的核苷酸的顺序。换言之,核酸中的任何核苷酸顺序可称为序列或核酸序列。例如,靶序列是dna双链体单链所包含的核苷酸的顺序。

本文所用术语“测序”指获得多核苷酸中至少10个连续核苷酸特性(如至少20、至少50、至少100或至少200或更多个连续核苷酸特性)的方法。术语“二代测序”指所谓的平行合成测序或连接平台测序,例如依诺米那(illumina)、美国生命技术公司(lifetechnologies)、pacbio和罗氏(roche)等目前所用。二代测序方法还可包括纳米孔测序法,如牛津纳米孔技术公司(oxfordnanoporetechnologies)商品化的那些,或基于电子检测的方法如美国生命技术公司商品化的离子激流技术。

“靶核酸片段”或“靶片段”可以是小或较长延伸片段或选定部分的核酸,单或双链,包含感兴趣的序列或由其组成,其优选是进一步分析或作用的目标,例如但不限于复制、扩增、测序和/或其他核酸检测过程。复杂性减少前,靶核酸片段优选包含在较大核酸分子内,如待分析样品中存在的较大的核酸分子内部。

感兴趣的序列可以是样品核酸内的任何序列,如基因、基因复合物、基因座、假基因、调节区、高重复区、多态性区域或其部分。感兴趣的序列也可以是含遗传或表观遗传变异的区域,所述变异指示表型或疾病。在一些方面,选择一组靶核酸片段进行富集,所述片段包含一种或多种感兴趣的序列,或由其组成。任选地,该组由结构或功能相关靶核酸片段组成。一个或多个靶片段能包含天然或非天然、人工、或非经典核苷酸,包括但不限于dna、rna、bna(桥连核酸)、lna(锁核酸)、pna(肽核酸)、吗啉代核酸、乙二醇核酸、苏糖核酸、表观遗传修饰的核苷酸如甲基化dna以及模拟物和其组合。优选地,这些感兴趣的序列是双链dna中单链dna链的小或较长连续核苷酸延伸片段(即多核苷酸),其中所述双链dna还包含与所述双链dna互补链中靶序列互补的序列。由感兴趣的序列和其互补链组成的双链dna在本文中也命名为靶核酸片段双链dna。优选地,所述双链dna是基因组dna(gdna)和/或细胞游离dna(cfdna)。

发明详述

发明人发现功能性grna-cas复合物对经切割的片段具有意外的保护效果。事实上,看来切割后,经切割的片段受到保护抵御核酸外切酶切割。不想受理论约束,此保护归因于在核酸外切酶处理期间仍结合切割片段末端的复合物。因此,本发明方法意外显示例如本文所公开的靶富集的无扩增方法不需要连接保护性接头。

第一方面,提供从包含核酸分子的样品中富集至少一个靶核酸片段的方法。优选地,靶核酸片段包含感兴趣的序列。优选地,所述核酸片段包含在如下文详述的富集步骤前样品中存在的核酸分子内。因此优选地,所述靶核酸片段是样品中核酸分子的片段。

优选地,本发明涉及从包含核酸分子的样品富集靶核酸片段的方法,其中靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:

a)提供包含所述核酸分子的样品,其中所述核酸分子包含感兴趣的序列;

b)用至少第一和第二grna-cas复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;

c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许核酸外切酶消化所述至少一个非靶核酸片段;和

d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。

优选地,步骤b)中的rna或dna指导的核酸内切酶复合物是grna-cas复合物、grna-argonaute复合物和gdna-argonaute复合物至少之一。优选地,步骤b)中的rna或dna指导的核酸内切酶复合物是grna-cas复合物。

优选地,步骤c)中,所述至少第一和第二grna-cas复合物结合靶核酸片段。

优选地,步骤c)中,所述至少第一和第二grna-cas复合物在步骤c)期间或至少部分步骤c)期间保持结合靶核酸片段。

优选地,步骤c)中,靶核酸片段不被核酸外切酶消化,即在步骤c)中,靶核酸片段受到保护抵御核酸外切酶消化。

优选地,步骤c)中,仅一个或多个非靶核酸片段被核酸外切酶消化。

在步骤b)中,用至少第一和第二grna-cas复合物切割所述核酸分子。任选地,步骤b)能在使所述核酸分子接触第一和第二grna-cas复合物的步骤以及允许所述复合物切割所述核酸分子的步骤中进一步说明。因此,在一个实施方案中,步骤b)能进一步如下说明:

b1)使所述核酸分子接触第一和第二grna-cas复合物,其中所述第一复合物的grna引导所述第一复合物到感兴趣的序列上游的序列,且其中所述第二复合物的grna引导所述第二复合物到感兴趣的序列下游的序列;和

b2)允许所述第一和第二grna-cas复合物切割核酸分子,其中至少一个经切割的核酸分子是靶核酸片段,且至少1个、优选2个经切割的核酸分子是非靶核酸片段。

发明人意外发现向步骤b的消化物加入核酸外切酶,而不采取更多措施以保护靶核酸片段,引起所述感兴趣片段富集。换言之,意外地,不需要通过例如连接惰性接头的进一步保护来保护靶核酸片段免于核酸外切酶降解。因此,本发明方法优选不包括以下进一步步骤:在核酸外切酶处理步骤前,保护靶核酸片段,或靶核酸片段末端。在一个优选实施方案中,本文所定义的方法在核酸外切酶处理前没有加入保护性接头。此背景下,保护性接头在本文中应理解为特别设计成针对核酸外切酶消化保护被接头捕获的靶核酸片段的接头。这种接头优选通过纳入化学部分或阻断基(如硫代磷酸)或缺乏末端核苷酸(发夹或茎环接头或可环化接头)针对核酸外切酶降解提供保护。

本发明的方法例如用于富集核酸样品,优选用于帮助下游加工或分析所述样品内的一个或多个靶核酸片段。富集引起本发明方法步骤a)中用作起始材料的核酸样品复杂性降低和/或本发明方法步骤a)中用作起始材料的核酸样品的一个或多个靶核酸片段子集产生。

因此,本发明第一方面还提供至少:

i)一种用于降低包含感兴趣的序列的核酸样品复杂性的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d);

ii)一种用于提供核酸样品子集的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d),其中所述子集包含一个或多个靶核酸片段;和

iii)一种用于分离或获得包含感兴趣的序列(来自包含所述感兴趣的序列的核酸分子)的片段即靶核酸片段的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d)。

降低核酸样品复杂性在核酸测序应用方面有特别的效用,尤其是在其中靶核酸片段是复杂样品(例如但不限于基因组)内的次要种类的样品中。富集或复杂性降低可显著降低所产生的测序数据的成本,因为复杂样品的大部分在测序前去除,而靶核酸片段被选择性保留,因而更高百分比的序列读取产生自感兴趣的序列。

在优选实施方案中,通过本文方法生成的富集的靶核酸片段用于单分子、实时测序反应,如来自太平洋生物科学公司(pacificbiosciences)、加利福尼亚州门洛帕克的测序。也考虑使用其他测序技术,例如纳米孔测序(如来自牛津纳米孔(oxfordnanopore))、测序(依诺米那)、tsmstm测序(helicos)、ion测序(美国生命技术公司)、焦磷酸测序(如来自罗氏/454)、测序(美国生命技术公司)、微阵列测序(如来自昂飞公司(affymetrix))、桑格测序等。优选地,所述测序方法能够测序长模板分子,如>1000-10,000碱基或更多。优选地,所述测序方法能够在反应期间检测测序碱基修饰,如通过监测测序反应的动力学检测。优选地,所述测序方法能分析单模板分子的序列,如实时分析。受益于本发明复杂性降低的方法的更多应用包括但不限于克隆、扩增、诊断、预测、治疗诊断、遗传筛查等,任选地,用于多态性检测,例如但不限于癌症诊断测试。任选地,本文的方法生成的经富集的核酸用于评价表观遗传变异如dna甲基化的试验。dna甲基化能用本领域已知的任何适当试验评价,如亚硫酸氢盐转化测定与测序的组合。亚硫酸氢盐转化也称为亚硫酸氢盐处理,用于使未甲基化胞嘧啶脱氨基以在dna中生成尿嘧啶,其用于下游应用以评估dna甲基化状态。甲基化胞嘧啶受到保护免于转化成尿嘧啶,允许使用直接测序来以单核苷酸分辨率测定未甲基化胞嘧啶和5-甲基胞嘧啶的位置。或者或另外,当分析未扩增的和任选地未修饰的dna时,dna修饰能从测序数据中直接检测,而无需额外特定试验。在未扩增的和未修饰的dna中检测dna修饰的示例是使用smrt测序技术,来自太平洋生物科学公司。该方法因而还可包括向人受试者报告检测到的突变或诊断的步骤。该方法因而还可包括生成报告的步骤,所述报告包含用本发明方法获得的发现。

所述至少第一和第二grna-cas复合物在本文中应理解为crispr相关(cas)蛋白或crispr核酸酶,各自与引导rna复合。crispr核酸酶包含核酸酶结构域和至少一个与引导rna相互作用的结构域。当与引导rna复合时,引导rna将crispr核酸酶指引到特定核酸序列。引导rna与crispr核酸酶以及特定靶核酸序列相互作用,从而一旦经引导序列指引到包含特定核酸序列的位点,crispr核酸酶能够在靶位点引入断裂。优选地,在核酸酶的1个或2个结构域都具有催化活性的情况中,crispr核酸酶分别能够在靶位点引入单或双链断裂。技术人员清楚了解如何设计引导rna,采用的方式是当联合crispr核酸酶时,实现在核酸分子预定的位点处引入单或双链断裂。

基于核心元件含量和序列,crispr核酸酶一般可以分成6个主要类型(i-vi型),其进一步细分成亚型(makarova等,2011,natrevmicrobiol9:467-77和wright等,2016,cell164(1-2):29-44)。一般而言,crispr-cas系统复合物的2个关键元件是crispr核酸酶和crrna。crrna由短重复序列组成,所述序列散布有衍生自入侵dna的间隔序列。cas蛋白具有多种活性如核酸酶活性。因此,grna-cas复合物提供靶向特定序列以及根据序列的某些酶活性的机制。

i型crispr-cas系统通常包含有分开的解旋酶和dnase活性的cas3蛋白。例如,在1-e型系统中,crrna纳入称为cascade(用于抗病毒防御的crispr相关复合物)的多亚基效应复合物内(brouns等,2008,science321:960-4),其特异性结合双螺旋dna并通过cas3蛋白激发降解(sinkunas等,2011,emsoj30:1335-1342;beloglazova等,2011,emboj30:616-627)。

ii型crispr-cas系统包含特征性cas9蛋白,这是一种单一蛋白(约160kda),能够产生crrna且特异性切割双螺旋dna。cas9蛋白通常包含2个核酸酶结构域,即氨基末端附近的ruvc样核酸酶结构域和蛋白中间附近的hnh(或mcra样)核酸酶结构域。cas9蛋白的各核酸酶结构域专门用于切割双螺旋的一条链(jinek等,2012,science337(6096):816-821)。cas9蛋白是ii型crispr/-cas系统的cas蛋白示例并形成核酸内切酶,当联合crrna和称为反式激活crrna(tracrrna)的第二rna时,其靶向入侵病原体dna,通过在crrna所定义的病原体基因组中的位置处引入dna双链断裂(dsb)进行降解。jinek等.(2012,science337:816-820)证明通过融合crrna和tracrrna必要部分而生成的单链嵌合引导rna(本文的“sgrna”)能够联合cas9蛋白形成功能性核酸内切酶。

iii型crispr-cas系统包含聚合酶和ramp组件。iii型系统能进一步分成亚型iii-a和iii-b。iii-a型crispr-cas系统显示靶向质粒,iii-a型系统的聚合酶样蛋白参与特异性切割dna(marraffini和sontheimer,2008,science322:1843-1845)。iii-b型crispr-cas系统还显示靶向rna(hale等,2009,cell139:945-956)。

iv型crispr-cas系统包含csf1,一种未表征的蛋白质,被提议形成部分cascade样复合物,不过这些系统通常作为分离cas基因发现,而没有相关crispr阵列。

最近描述了v型crispr-cas系统,来自普氏菌(prevotella)和弗朗西斯氏菌(francisella)的成簇的规律间隔短回文重复序列1,或crispr/cpf1。cpf1基因与crispr基因座相关且编码使用crrna来靶向dna的核酸内切酶。cpf1是比cas9更小且更简单的核酸内切酶,其可克服crispr-cas9系统的一些限制。cpf1是单rna指导的核酸内切酶,没有tracrrna,且其使用富含t的前间隔序列毗邻基序。cpf1经交错dna双链断裂来切割dna(zetsche等(2015)cell163(3):759–771)。v型crispr-cas系统优选包含cpf1、c2c1和c2c3的至少一种。

vi型crispr-cas系统可包含cas13a蛋白,其包含rnasea活性。在靶核酸片段是rna的情况中,本发明方法的至少第一和第二grna-cas复合物可包含cas13a,例如但不限于来自韦德纤毛菌(leptotreichiawadee,lwcas13a)或沙氏纤毛菌(leptotrichiashahii,lshcas13a)的cas13a,如描述于gootenberg等,science.2017年4月28日;356(6336):438-442。

本发明的方法的第一和第二grna-cas复合物可包含上文所定义的任何crispr核酸酶。优选地,本发明的方法的第一和第二grna-cas复合物至少之一包含ii型crispr核酸酶如cas9(例如seqidno:1的蛋白,其由seqidno:2编码,或seqidno:19的蛋白)或v型crispr核酸酶如cpf1(例如seqidno:3的蛋白,其由seqidno:4编码)或mad7(例如seqidno:20或21的蛋白)或其衍生蛋白,与所述蛋白在其全长上具有优选至少约70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性。

优选地,本发明方法的第一和第二grna-cas复合物至少之一包含ii型crispr核酸酶,优选cas9核酸酶。

技术人员了解如何制备crispr-cas系统的不同组分,包括crispr核酸酶。在现有技术中,在其设计和应用方面有许多报道。参见例如haeussler等(jgenetgenomics.(2016)43(5):239-50.doi:10.1016/j.jgg.2016.04.008.)关于设计引导rna和其与cas蛋白(初始获自酿脓链球菌(s.pyogenes))组合应用的近期的综述,或lee等的综述(plantbiotechnologyjournal(2016)14(2)448–462)。

一般地,crispr核酸酶如cas9包含2个催化活性核酸酶结构域。例如,cas9蛋白能包含ruvc样核酸酶结构域和hnh样核酸酶结构域。ruvc和hnh结构域一起合作,都切割单链以在dna中产生双链断裂(jinek等,science,337:816-821)。失活crispr核酸酶包含修饰,从而没有核酸酶结构域显示切割活性。用于本发明方法的第一和第二grna-cas复合物至少之一的crispr核酸酶可以是crispr核酸酶变体,其中一个核酸酶结构域突变,从而其不再具有功能(即缺少核酸酶活性),由此产生切口酶。一个示例是具有d10a或h840a突变的spcas9变体。优选地,第一和第二grna-cas复合物的核酸酶至少之一不是失活核酸酶。优选地,第一grna-cas复合物的crispr核酸酶是切口酶或(内切)核酸酶。优选地,第二grna-cas复合物的crispr核酸酶是切口酶或(内切)核酸酶。

本发明的方法的至少第一和第二grna-cas复合物可包含完整cas9蛋白或变体或由其组成,或可包含其片段。优选地,这类片段确实结合crrna和tracrrna或sgrna,但可缺乏核酸酶活性所需的一个或多个残基。

优选地,第一和第二grna-cas复合物至少之一包含cas9蛋白。任选地,本发明方法的第一和第二grna-cas复合物都包含cas9蛋白。cas9蛋白可衍生自酿脓链球菌(streptococcuspyogenes)(spcas9;ncbi参考序列nc_017053.1;uniprotkb-q99zw2),嗜热脱氮芽孢杆菌(geobacillusthermodenitrificans)(uniprotkb-a0a178tej9),溃疡性棒状杆菌(corynebacteriumulcerous)(ncbirefs:nc_015683.1,nc_017317.1);白喉棒状杆菌(corynebacteriumdiphtheria)(ncbirefs:nc_016782.1,nc_016786.1);螺原体(spiroplasmasyrphidicola)(ncbiref:nc_021284.1);中间普雷沃菌(prevotellaintermedia)(ncbiref:nc_017861.1);台湾螺原体(spiroplasmataiwanense)(ncbiref:nc_021846.1);海豚链球菌(streptococcusiniae)(ncbiref:nc_021314.1);罗的海贝尔氏菌(belliellabaltica)(ncbiref:nc_018010.1);扭曲冷弯曲菌(psychroflexustorquisl)(ncbiref:nc_018721.1);嗜热链球菌(streptococcusthermophilus)(ncbiref:yp_820832.1);listeriainnocua(ncbiref:np_472073.1);空肠弯曲菌(campylobacterjejuni)(ncbiref:yp_002344900.1);或脑膜炎奈瑟氏菌(neisseriameningitidis)(ncbiref:yp_002342100.1)。涵盖了来自这些的cas9变体,具有与spcas9同源的失活的hnh或ruvc结构域,如spcas9_d10a或spcas9_h840a,或者在spcas9蛋白中对应d10或h840的位置处有等价取代的cas9,产生切口酶。

根据一个优选实施方案,可编程核酸酶能衍生自cpf1,如来自氨基酸球菌属(acidaminococcussp)的cpf1;uniprotkb-u2umq6。该变体可以是有失活的ruvc或nuc结构域的cpf1-切口酶,其中ruvc或nuc结构域不再具有核酸酶活性。技术人员清楚了解本领域可获得的技术,如定点诱变、pcr介导的突变和全基因合成,其允许失活核酸酶如失活ruvc或nuc结构域。带有失活的nuc结构域的cpf1切口酶示例是cpf1r1226a(参见gao等.cellresearch(2016)26:901–913,yamano等.cell(2016)165(4):949–962)。此变体中,nuc结构域内有精氨酸到丙氨酸(r1226a)转换,这使得nuc结构域失活。

所述至少第一和第二grna-cas复合物还包含指导复合物到核酸样品中限定的位点的crispr核酸酶相关的引导rna,也称为前间隔序列。引导rna包含使grna-cas复合物靶向前间隔序列的引导序列,所述前间隔序列优选在核酸分子中感兴趣的序列附近、在核酸分子中感兴趣的序列处或在核酸分子中感兴趣的序列内部,且可以是sgrna或crrna与tracrrna的组合(如用于cas9)或仅crrna(如在cpf1情况中)。任选地,在同一实验中可以使用多于一种类型的引导rna,例如针对2种或更多不同的感兴趣的序列,或甚至针对相同感兴趣的序列。

本文中应理解在用至少第一和第二grna-cas复合物切割前,感兴趣的序列存在于核酸样品。切割核酸样品可产生至少2个或更多核酸片段,其中至少一个核酸片段是靶核酸片段且至少一个核酸片段是非靶核酸片段。靶核酸片段包含感兴趣的序列或由其组成。因此,在切割核酸样品前,技术人员很清楚核酸样品涵盖靶核酸片段且在切割后靶核酸片段从核酸样品释放。发明人发现grna-cas复合物切割的核酸片段受到保护免于消化,优选核酸外切酶消化。

本发明的方法需要第一grna-cas复合物的grna指导所述第一复合物到核酸样品中的序列,从而第一grna-cas复合物在感兴趣的序列上游切割核酸样品,且第二复合物的grna指导第二grna-cas复合物到核酸样品中的序列,从而第二grna-cas复合物在感兴趣的序列下游切割核酸样品。

优选地,grna-cas复合物包含切割前间隔序列内核酸的crispr核酸酶。优选的crispr核酸酶是cas9。

由第一grna-cas复合物结合的前间隔序列可以是靶核酸片段和/或非靶核酸片段中的序列。同样,由第二grna-cas复合物结合的前间隔序列可以是靶核酸片段和/或非靶核酸片段中的序列。优选地,前间隔序列是与靶核酸片段和非靶核酸片段重叠的序列,即grna-cas复合物的切割位点在前间隔序列内。

优选地,前间隔序列的位置取决于本发明方法所用的crispr核酸酶。作为非限制性示例,crispr核酸酶spcas9切割前间隔序列内的核酸。因此,当cas9用于本发明方法时,优选前间隔序列部分位于靶核酸片段且部分位于非靶片段,即前间隔序列在靶核酸片段与非靶核酸片段之间重叠。由此,优选地,第一和第二grna-cas复合物至少之一的grna引导序列能够与选自下组的前间隔序列杂交:

a)靶核酸片段中包含的前间隔序列杂交;

b)非靶核酸片段中包含的前间隔序列杂交;和

c)在靶核酸片段与非靶核酸片段之间重叠的前间隔序列。

a)在一个实施方案中,所述第一grna-cas复合物和第二grna-cas复合物至少之一的grna引导序列能够与一段序列杂交,所述序列是靶核酸片段的序列或是其部分,或与相反链中的其互补序列杂交,例如在核酸片段是双链的情况中。换言之,在此实施方案中,所述由第一和第二grna-cas复合物至少之一靶向的前间隔序列是靶核酸片段的序列或位于其中。优选地,由至少第一grna-cas复合物靶向的前间隔序列是靶核酸片段序列的5’-末端或位置与其毗邻,或其互补序列,且优选由至少第二grna-cas复合物靶向的前间隔序列是靶核酸片段序列的3’-末端或位置毗邻其,或其互补序列。毗邻可以是直接毗邻,或优选距离不大于约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、500或1000个连续核苷酸。核苷酸数目可以取决于本发明方法所用crispr核酸酶。

b)在一个实施方案中,所述第一grna-cas复合物和第二grna-cas复合物至少之一的grna引导序列能够与一段序列杂交,所述序列会形成或形成部分非靶核酸片段,或与相反链中的其互补序列杂交,在核酸样品是双链核酸的情况中。换言之,在此实施方案中,所述由第一和第二grna-cas复合物至少之一靶向的前间隔序列位置几乎毗邻或直接毗邻在切割后会形成靶核酸片段的序列。优选地,当片段存在于核酸样品或其互补序列时,由第一grna-cas复合物靶向的前间隔序列几乎在靶核酸片段5’-末端侧翼,优选直接在5’-末端侧翼。优选地,当片段存在于核酸样品或其互补序列时,由第二grna-cas复合物靶向的前间隔序列在靶核酸片段3’-末端侧翼,或直接在3’-末端侧翼。优选地,前间隔序列与核酸样品中靶核酸片段序列各5’末端或3’末端之间的距离不超过约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个连续核苷酸。核苷酸数目可能取决于本发明方法所用crispr核酸酶。

c)在一个优选实施方案中,所述第一grna-cas复合物和第二grna-cas复合物至少之一的引导序列能够与一段序列杂交,所述序列在非靶核酸片段和靶核酸片段之间重叠。优选地,所述至少第一或第二grna-cas复合物的引导序列能够与一段序列杂交,所述序列在非靶核酸片段3’末端和靶核酸片段5’末端之间重叠。优选地,所述至少第一或第二grna-cas复合物的引导序列能够与一段序列杂交,所述序列在非靶核酸片段5’末端和靶核酸片段3’末端之间重叠。换言之,在此实施方案中,优选的是,由至少所述第一或第二grna-cas复合物靶向的前间隔序列在非靶核酸片段3’末端和靶核酸片段5’末端之间重叠(当所述片段存在于核酸样品时,即在核酸样品切割前)。

作为非限制性示例,spcas9可在20nt前间隔序列内位置3与4之间切割。因此,在其3’-末端的靶核酸片段可包含前间隔序列的3nt且在其5’-末端的非靶核酸片段可包含前间隔序列的17nt。同样,如果前间隔序列在互补链上,在其3’-末端的靶核酸片段可包含前间隔序列的17nt且在其5’-末端的非靶核酸片段可包含前间隔序列的3nt。由此,在前间隔序列是20个连续核苷酸的示例中,前间隔序列的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15,16、17、18或19个核苷酸可存在于非靶核酸片段3’-末端,并且分别地,前间隔序列的19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸可存在于靶序列5’-末端,这取决于本发明方法所用crispr核酸酶类型。

优选地,由至少第一或第二grna-cas复合物靶向的前间隔序列在非靶核酸片段5’-末端与靶核酸片段3’-末端之间重叠(当所述片段存在于核酸样品时,即在核酸样品切割前)。作为前间隔序列是20个核苷酸的非限制性示例,前间隔序列的1、2、3、4、5、6、7、8、9、10、11、12,13,14、15,16、17、18或19个核苷酸可存在于非靶核酸片段5’-末端,前间隔序列的各19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸可存在于靶序列3-末端,这取决于本发明方法所用crispr核酸酶类型。

在一个优选实施方案中,所述第一和第二grna-cas复合物至少之一结合靶核酸片段内的序列。优选地,所述第一和第二grna-cas复合物都结合靶核酸片段内的序列。

或者或另外,所述第一和第二grna-cas复合物至少之一结合非靶核酸片段内的序列。优选地,所述第一和第二grna-cas复合物都结合非靶核酸片段内的序列。

或者或另外,所述第一和第二grna-cas复合物至少之一结合在靶核酸片段与非靶核酸片段之间重叠的序列。优选地,所述第一和第二grna-cas复合物都结合在靶核酸片段与非靶核酸片段之间重叠的序列。

在一个优选实施方案中,所述第一和第二grna-cas复合物至少之一在切割后仍分别结合靶核酸片段的5’-末端或3’-末端。优选地,在切割后,至少一种grna-cas复合物保持结合靶核酸片段的5’-末端且一种grna-cas复合物保持结合靶核酸片段的3’-末端。不同的是,grna-cas复合物优选在靶核酸片段两边的侧翼。

因为除了前间隔序列,grna-cas复合物还需要前间隔序列邻近基序(pam)序列用于识别,grna应设计成使得所靶向的前间隔序列毗邻这类pam序列,这取决于所用的grna-cas复合物。pam序列对crispr/cas核酸内切酶活性是必需的,相对较短,因而通常在一定长度的任意给定序列中多次存在。例如,酿脓链球菌cas9蛋白的pam基序是ngg,其确保就任何给定基因组序列而言,存在多种pam基序且能设计许多不同引导rna。另外,引导rna还能设计成靶向同一双链序列的相反链。直接毗邻pam的序列被纳入引导rna。根据所用crispr-cas复合物,其可能长度不同。例如,用于在cas9sgrna中靶向序列的最优长度是20nt。根据所用crispr/cas核酸内切酶,复合物随后在离pam的不同距离处诱导2条dna链的切口。例如,酿脓链球菌cas9蛋白在pam序列上游3bp处诱导2条dna链的切口,以产生钝性dnadsb。根据例如所用crispr-cas复合物,用于切割核酸样品的pam位点可存在于所产生核酸片段或所产生非靶核酸片段。

优选地,核酸样品中的感兴趣的序列侧翼是pam序列或包含优选在感兴趣的序列末端附近的pam序列,所述pam序列已知用于和本文所定义复合物的crispr-系统核酸酶相互作用(例如参见ran等2015,nature520:186-191)。另外或替代地,pam序列优选在由第一和第二grna-cas复合物至少之一靶向的前间隔序列侧翼。

例如,若所述crispr核酸酶是酿脓链球菌cas9,pam序列可具有序列5’-ngg-3’。例如,对于嗜热脱氮芽孢杆菌t12cas9(例如参见wo2016/198361),pam序列可具有序列5’-nnnncnna-3’。用于cas9核酸内切酶的更多已知pam序列是:iia型5'-nggnnnn-3'(酿脓链球菌)、5'-nngtnnn-3'(巴氏链球菌(streptococcuspasteurianus))、5'-nnggaan-3'(嗜热链球菌(streptococcusthermophilus))、5'-nngggnn-3'(金黄色葡萄球菌(staphylococcusaureus))以及iic型5'-nggnnnn-3'(白喉棒状杆菌(corynebacteriumdifteriae))、5'-nngggtn-3'(红嘴鸥弯曲杆菌(campylobacterlari))、5'-nnncatn-3'(细小棒菌(parvobaculumlavamentivorans))和5'-nnnngta-3'(灰色奈瑟球菌(neiseriacinerea))。本领域技术人员因而能够设计grna以使来自样品核酸的靶序列片段化。

适合作为crrna和tracrrna用作grna-cas复合物中grna的分子为本领域熟知(参见例如wo2013142578和jinek等,science(2012)337,816-821)。

在一个实施方案中,所述crrna至少之一包含能与感兴趣的序列,优选本文所定义感兴趣的序列,杂交或在其附近杂交的序列。因此优选地,所述crrna至少之一包含与感兴趣的序列中序列完全互补的序列,即感兴趣的序列包含前间隔序列。

在一个实施方案中,所述至少一种crrna包含能与感兴趣的序列,优选本文所定义感兴趣的序列,的互补序列杂交或在其附近杂交的序列。因此优选地,所述crrna至少之一包含与感兴趣的序列或部分感兴趣的序列有完全序列相同性的核苷酸序列。

优选地,一种或多种crrna还能够与tracrrna复合。用于本发明方法的crrna至少之一能包含未修饰或天然存在的核苷酸或者由其组成。或者或另外,至少一种crrna能包含修饰或非天然存在的核苷酸或者由其组成,优选这类化学修饰的核苷酸用于保护crrna免于降解。在一个实施方案中,所述用于本发明方法的至少2种或所有crrna能包含修饰或非天然产生核苷酸或者由其组成。

在本发明的一个实施方案中,所述至少一种crrna可以包含核糖核苷酸和非核糖核苷酸。所述至少一种crrna能包含一个或多个核糖核苷酸以及一个或多个脱氧核糖核苷酸。

所述至少一种crrna可包含一个或多个非天然存在的核苷酸或核苷酸类似物,如有硫代磷酸连接的核苷酸、在核糖环2'与4'碳之间包含亚甲桥的锁核酸(lna)核苷酸、桥接核酸(bna)、2’-o-甲基类似物、2'-脱氧类似物、2'-氟类似物或其组合。修饰的核苷酸可包含选自但不限于下组的修饰的碱基:2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷和7-甲基鸟苷。

所述至少一种crrna可如下化学修饰:在一个或多个末端核苷酸处并入2'-o-甲基(m)、2'-o-甲基3'硫代磷酸酯(ms)、2'-o-甲基3'thiopace(膦酰乙酸酯)(msp)或其组合。这种化学修饰crrna能包含相较未修饰crrna增加的稳定性和/或活性(hendel等,2015,natbiotechnol.33(9);985-989)。在某些实施方案中,所述至少一种crrna在与前间隔序列杂交的区域中包含核糖核苷酸。在本发明的一个实施方案中,所述脱氧核糖核苷酸和/或核苷酸类似物能并入经工程化的crrna结构,例如但不限于在与前间隔序列杂交的序列中,在与tracrrna相互作用的序列中或这些序列之间。

或者或另外,化学修饰核苷酸能位于与前间隔序列杂交的序列5’和/或3’。化学修饰的序列能进一步位于与tracrrna相互作用的序列的5’和/或3’。

在一个优选实施方案中,所述至少一种crrna的长度可以是至少约15、20、25、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、65、70、75、80、85、90、95、100或更多个核苷酸长度。在一些优选实施方案中,所述至少一种crrna的长度小于约75、50、45、40、35、30、25或约20个核苷酸。优选地,用于本发明方法的crrna长度是约20-100、25-80、30-60或约35-50个核苷酸长度。

与前间隔序列杂交的crrna序列部分设计成与前间隔序列有足够互补性,以与前间隔序列杂交并指导所复合的核酸酶的序列特异性结合。前间隔序列优选毗邻前间隔序列邻近基序(pam)序列,该pam序列可与本文所定义的rna指导的crispr系统核酸内切酶复合物中crispr核酸酶相互作用。例如,在crispr核酸酶是酿脓链球菌cas9的情况中,pam序列优选是5’-ngg-3’,其中n可以是t、g、a或c中的任何一种。技术人员能够改造crrna以靶向任何所需序列,优选通过改造序列成与任何所需前间隔序列至少部分互补,从而与其杂交。优选地,部分crrna序列与其对应的前间隔序列之间的互补性用适当比对算法最优比对时,是至少约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与前间隔序列互补的部分crrna序列可以是至少约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸长度。在一些优选实施方案中,与dna靶序列互补的序列小于约75、50、45、40、35、30、25、20个核苷酸长度。优选地,与dna序列互补的序列长度是至少17个核苷酸。优选地,互补crrna序列是约10-30个核苷酸长度,约17–25个核苷酸长度或约15-21个核苷酸长度。与前间隔序列互补的部分crrna优选是15、16、17、18、19、20、21、22、23、24或25个核苷酸长度,优选20或21个核苷酸,优选20个核苷酸。

与tracrrna相互作用的crrna的部分设计成与tracrrna有足够互补性,以与tracrrna杂交并指导所复合的核酸酶到前间隔序列。优选地,此部分crrna序列与其tracrrna对应部分之间的互补性用适当比对算法最优比对时,是至少约50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与tracrrna相互作用的部分crrna优选是至少约5、10、15、20、22、25、30、35、40、45或更多个核苷酸长度。在一些优选实施方案中,与tracrrna相互作用的部分crrna小于约60、55、50、45、40、35、30或35个核苷酸长度。优选地,与tracrrna相互作用的部分crrna是约5–40、10-35、15-30、20-28个核苷酸长度。与tracrrna相互作用的部分crrna长度优选是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。

在一个实施方案中,本发明方法所用的至少第一和第二grna-cas复合物分别包含第一和第二crrna。然而,第一和第二grna-cas复合物可包含相同的tracrrna。

tracrrna优选包含一个或多个结构基序,其能与本文所定义的复合物的crispr系统核酸酶相互作用。优选地,tracrrna还能与本文所定义的crrna相互作用。tracrrna和crrna可通过crrna与tracrrna之间碱基配对来杂交。tracrrna优选能够与crispr系统核酸酶和crrna形成复合物。crrna能够复合tracrrna并能与靶序列杂交,从而指导核酸酶到靶序列。

tracrrna可包含一个或多个茎环结构,如1、2、3或更多个茎环结构。

tracrrna能包含未修饰或天然存在的核苷酸,或由其组成。或者或另外,tracrrna能包含修饰或非天然存在的核苷酸,或由其组成,优选这类化学修饰核苷酸用于保护tracrrna免于降解。

在本发明的一个实施方案中,所述tracrrna包含核糖核苷酸和非核糖核苷酸。tracrrna能包含一个或多个核糖核苷酸以及一个或多个脱氧核糖核苷酸。

tracrrna可包含一个或多个非天然存在的核苷酸或核苷酸类似物,如有硫代磷酸连接的核苷酸、在核糖环2'与4'碳之间包含亚甲桥的锁核酸(lna)核苷酸、桥接核酸(bna)、2’-o-甲基类似物、2'-脱氧类似物、2'-氟类似物或其组合。修饰核苷酸可包含选自但不限于下组的修饰碱基:2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷和7-甲基鸟苷。

tracrrna可如下化学修饰:在一个或多个末端核苷酸处纳入2'-o-甲基(m)、2'-o-甲基3'硫代磷酸酯(ms)、2'-o-甲基3'thiopace(膦酰乙酸酯)(msp)或其组合。这种化学修饰tracrrna能包含相较未修饰tracrrna增加的稳定性和/或活性(hendel等,2015,natbiotechnol.33(9);985-989)。在某些实施方案中,所述tracrrna在与crrna相互作用的区域中包含核糖核苷酸。

在本发明的一个实施方案中,所述脱氧核糖核苷酸和/或核苷酸类似物能纳入改造的tracrrna结构,例如但不限于在与crrna相互作用的序列中,在与crispr系统核酸酶相互作用的序列中或这些序列之间。

或者或另外,化学修饰核苷酸能位于与crrna相互作用的序列的5’和/或3’。化学修饰核苷酸能进一步位于与crispr系统核酸酶相互作用的序列的5’和/或3’。

在一个优选实施方案中,所述tracrrna长度可以是约25、30、35、40、45、50、55、60、65、70、72、75、80、85、90、95、100、110、120、130、140、150或更多个核苷酸长度。在一些优选实施方案中,所述tracrrna小于约200、180、160、140、120、100、95、90、85、80或75个核苷酸长度。tracrrna长度优选是约30–120、40-100、50-90或约60-80个核苷酸长度。

与crispr系统核酸酶相互作用的tracrrna序列部分设计成足以指导复合核酸酶到靶序列。与crispr系统核酸酶相互作用的tracrrna序列的部分可以是约20、25、30、35、40、45、50、55、60、65、70、72、75、80、85、90、95、100或更多个核苷酸长度。在一些优选实施方案中,所述与crispr系统核酸酶相互作用的序列小于约120、100、80、72、70、60、55、50、45、40、30或20个核苷酸长度。优选地,与crispr系统核酸酶相互作用的tracrrna序列部分是约20-90、30-85、35-80、40–75或50-72个核苷酸长度。优选地,与crispr系统核酸酶相互作用的tracrrna部分是约40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74或76个核苷酸长度。

与crrna相互作用的tracrrna序列部分设计成与crrna有足够互补性,以与crrna杂交并指导所复合的核酸酶到靶序列。优选地,此部分tracrrna序列与其crrna对应部分之间的互补性用适当比对算法最优比对时,是至少约50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与crrna相互作用的tracrrna的部分优选是至少约5、10、15、20、22、25、30、35、40、45或更多个核苷酸长度。在一些优选实施方案中,所述与crrna相互作用的tracrrna的部分小于约60、55、50、45、40、35、30或35个核苷酸长度。在一个优选实施方案中,所述与crrna相互作用的tracrrna部分是约5–40、10-35、15-30、20-28个核苷酸长度。优选地,与crrna相互作用的部分长度是约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。

优选地,crrna和tracrrna连接在一起形成sgrna。crrna和tracrrna能连接,优选共价连接,使用本领域已知的任何常规方法。例如,crrna和tracrrna的常规连接描述于jinek等.(同上)和wo13/176772,其通过引用纳入本文。crrna和tracrrna能共价连接,使用例如接头核苷酸或通过crrna3'末端与tracrrna5'末端直接共价连接。优选地,所述至少第一和第二grna-cas复合物的grna设计成在核酸样品用至少第一和第二grna-cas复合物温育后,来自核酸样品的核酸内所含靶核酸片段从所述核酸中切下。另外,优选第一grna设计成第一grna-cas复合物在核酸样品切割后结合靶核酸片段。另外,优选第二grna设计成第二grna-cas复合物在核酸样品切割后结合靶核酸片段。优选地,靶核酸片段存在于核酸样品时,侧翼是至少一个非靶核酸片段。优选地,靶核酸片段存在于核酸样品时,2边侧翼都是非靶核酸片段,即一个非靶核酸片段直接存在于靶核酸片段5’且一个非靶核酸片段直接存在于靶核酸片段3’。

优选地,本发明方法的第一和第二grna-cas复合物至少之一包含sgrna用于使crispr核酸酶优选cas9,靶向靶核酸片段中的序列。任选地,本发明方法的第一和第二grna-cas复合物都包含sgrna以用于使各第一和第二grna-cas复合物靶向靶核酸片段中的序列。本发明方法的第一和第二grna-cas复合物至少之一优选包含sgrna以用于使crispr核酸酶优选cas9,靶向毗邻优选直接毗邻靶核酸片段的序列,此时该片段包含于核酸样品内。任选地,本发明方法的第一和第二grna-cas复合物都包含sgrna用于使各第一或第二grna-cas复合物,靶向毗邻优选直接毗邻靶核酸片段的序列,其中靶核酸包含于核酸样品内。

优选地,本发明方法的第一和第二grna-cas复合物至少之一包含sgrna以用于使crispr核酸酶优选cas9,靶向靶核酸片段与非靶核酸片段之间重叠的序列,此时该片段包含于核酸样品内。任选地,本发明方法的第一和第二grna-cas复合物都包含sgrna以用于使各第一或第二grna-cas复合物,靶向靶核酸片段与非靶核酸片段之间重叠的序列,其中靶核酸包含于核酸样品内。任选地,本发明方法的第一和第二grna-cas复合物都包含sgrna以用于使各第一或第二grna-cas复合物,分别靶向靶核酸片段5’-末端与非靶核酸片段3’-末端之间重叠的序列以及靶核酸片段3’-末端与非靶核酸片段5’-末端之间重叠的序列,此时靶核酸包含于核酸样品内。

或者,本发明方法的第一和第二grna-cas复合物至少之一包含二元引导rna以使crispr核酸酶优选cas9,靶向核酸样品中的序列,即靶核酸片段中存在的或非靶核酸片段中存在的前间隔序列。二元引导rna(dgrna)在本文中应理解为包含crrna和tracrrna作为单独但优选杂交的分子,或由其组成。任选地,本发明方法的第一和第二grna-cas复合物都包含dgrna用于使各第一或第二grna-cas复合物靶向前间隔序列。

优选地,第一和第二grna-cas复合物至少之一能够诱导双链断裂(dsb)。优选地,第一和第二grna-cas复合物都能够诱导核酸样品中的双链断裂(dsb)。

或者,第一和第二grna-cas复合物至少之一是切口酶,本文表示为第一或第二grna-cas-切口酶复合物,其能够在双螺旋dna的仅一条链上产生缺口。在本发明的这个实施方案中,步骤b)中,加入额外即第三grna-cas复合物,其能够在双螺旋dna的互补链上产生缺口,大致在第一或第二grna-cas-切口酶复合物产生缺口的互补位置。大致在互补位置产生缺口优选引起核酸样品中的双链(即钝的或交错的)断裂。

作为非限制性示例,例如第三grna-cas-切口酶的前间隔序列优选是互补链中的序列,该序列与第一grna-cas-切口酶复合物靶向的前间隔序列互补,或在互补链上游或下游方向移动约1、2、3、4、5、6、7、8、9、10、15、20、25或30个核苷酸内的序列。例如,在第一grna-cas复合物是grna-cas-切口酶复合物的情况中,第三grna-cas-切口酶复合物能在步骤b中加入,导致通过所述第一和第三grna-cas-切口酶复合物在感兴趣的序列一侧诱导的双链断裂,其可以是钝端,此时实际相反位置被所述第一和第三复合物形成切口,或可以是交错的,此时被所述第一和第三复合物形成缺口的位置不完全是相反的。同样,除了所述第一和第三grna-cas-切口酶复合物外,使用第二和更多如第四grna-cas-切口酶复合物可产生本发明方法步骤b)所得靶核酸片段的2个钝或交错末端。在一些情况中,例如在后续定向接头连接的情况中,可能需要在本发明方法步骤b所生成靶核酸片段的1个或2个末端处产生交错末端。

本发明的方法的步骤b)可如下进行:将所述至少第一和第二grna-cas复合物与核酸样品一起温育,所用条件和时间适合grna-cas复合物诱导至少一个单链断裂,任选地双链断裂,例如但不限于本文所提供实施例中详述的条件。任选地,所述温育在约10-90℃,优选约37℃进行约1分钟-约18小时,优选约60分钟。

发明人发现由grna-cas切割的靶核酸片段受到保护免于核酸外切酶处理。因此,从核酸切割靶核酸片段后,立即加入核酸外切酶以消化一种或多种非靶核酸。靶核酸片段受到保护免于降解,而未保护片段被降解,引起靶片段富集或复杂性减少。因而,本发明的方法采用去除不需要的(非靶)核酸样品部分的方法,而不是移出感兴趣部分,从而回避了复杂的亲和性选择方案。

核酸外切酶可以是核酸外切酶i、iii、v、vii、viii或相关酶,或其任何组合。核酸外切酶iii识别切口并延伸切口到空位,直至形成一段ssdna。核酸外切酶vii能降解此ssdna。核酸外切酶i也降解ssdna。exoiii和exovii是核酸外切酶的优选组合,用于本发明方法步骤c)。

核酸外切酶v能够以3’到5’和5’到3’方向降解ssdna及dsdna。因此,在一个优选实施方案中,本发明方法步骤c)的核酸外切酶是能够以3’到5’和5’到3’方向降解ssdna及dsdna的核酸外切酶,优选核酸外切酶v。

关于降解非靶序列的更多信息提供于美国专利公开号2014/0134610,其通过引用全文纳入本文以用于所有目的。

另外,核酸内切酶即限制性酶可用于降解未保护片段,与本发明方法步骤c)的核酸外切酶消化一起、之前、之后或其任何组合。本文应理解用于本发明方法的限制性酶优选根据一个或多个感兴趣靶序列选择,所述序列用本发明方法富集,因为一种或多种限制性酶优选不应具有一个或多个感兴趣靶序列内存在的识别位点,但优选应具有剩余核酸样品即一个或多个非靶核酸片段中一个或多个位置处存在的识别位点。在本发明方法步骤c)的核酸外切酶处理之前或甚至步骤b)的切割反应之前,限制性酶消化的益处是这种消化产生片段,如果该片段不受grna-cas复合物保护,则更易由步骤c)的核酸外切酶消化。

实施步骤c)和任选存在的核酸内切酶步骤,所用条件和时间足以使核酸外切酶(和任选存在的核酸内切酶)降解几乎所有未保护片段,例如但不限于本文所提供实施例详述的条件。优选地,以足以使核酸外切酶(和任选存在的核酸内切酶)降解所有未保护的片段的条件和时间实施步骤c)。步骤c)在约10-90℃,优选约37℃,优选进行约1分钟-约12小时,优选30分钟。

在步骤c)后,可以灭活核酸外切酶和任选存在的核酸内切酶,通过例如但不限于至少一种蛋白酶如蛋白酶k处理或者热灭活。这类技术是本领域标准且技术人员直接理解如何灭活核酸外切酶和任选存在的核酸内切酶。优选的灭活步骤是在约50-90℃,优选约75℃的温度加热样品,持续约1–120分钟,优选约10分钟。灭活步骤优选在本发明方法步骤c)与d)之间。

在本发明步骤c)后,富集了一个或多个靶核酸片段的样品可接受纯化步骤如基于ampure珠的纯化工艺,以去除复合物、酶、游离核苷酸、可能的游离接头和可能的小、非靶核酸片段。靶核酸片段可在纯化后回收,并接受进一步加工和/或分析如单分子测序。

本发明方法还可包含尺寸选择步骤。任选地,尺寸选择步骤在本发明方法步骤b)之前、步骤b)与c)之间或步骤c)之后进行。

靶核酸片段长度可变,但优选至少200、500、1000、3000、5000、7000、10,000、15,000或20,000(多至至少100,000)个碱基长度。长度主要取决于预期用途,在一些最优实施方案中,基于待使用特定测序技术的平均读数长度。

本文中应理解有效量的组分用于本发明方法。例如,步骤b)中加入的至少第一和第二grna-cas复合物以足以诱导样品内一个或多个核酸分子切割的量提供。另外,步骤c)所加入核酸外切酶施用的量足以降解样品或起始材料内至少约75%、80%、85%、90%、95%或100%的非靶核酸片段。

本发明方法可包含一个或多个纯化步骤,优选本文所定义步骤c)之后。任选存在的纯化步骤是蛋白酶k处理。或者或另外,所述纯化可包括下列步骤:

i.使步骤c)后所得的经消化的核酸样品暴露于一个或多个固体支持物,所述支持物特异且有效结合一个或多个靶核酸片段;和任选地,

ii.洗涤所述一个或多个固体支持物,并从所述一个或多个固体支持物洗脱靶核酸片段。

所述一个或多个固体支持物可以是但不限于ampure珠。由于纯化后获得至少一个分离靶核酸片段,本文所定义的方法也可视作从核酸样品分离一个或多个靶核酸片段的方法。

本发明的方法之后可以是测序一个或多个靶核酸片段的步骤。因此,本文所定义方法还可视作测序来自核酸样品的一个或多个靶核酸片段的方法。

任选地,本发明方法还包含扩增步骤。优选地,此扩增在核酸外切酶处理即本文所定义步骤c)后进行。扩增能通过pcr或本领域已知任何扩增方法完成。

本发明的方法也可包括连接一个或多个接头到靶核酸片段的步骤。优选地,这类接头连接在本文所定义步骤c)后进行。这些一个或多个接头可包含功能结构域,优选选自限制性位点结构域、捕获结构域、测序引物结合位点、扩增引物结合位点、检测结构域、条形码序列、转录启动子结构域和pam序列或其任何组合。条形码可以是但不限于样品条形码或独特的分子标识符(umi)。

在尤其优选的实施方案中,所述一个或多个接头是测序接头,例如包含的功能结构域允许罗氏454a和454b测序、illuminatmsolexatm测序、应用生物系统公司(appliedbiosystems)的solidtm测序、太平洋生物科学公司的smrttm测序、pollonatorpolony测序、牛津纳米孔技术或全基因组测序。

根据接头设计,接头可以是单链、双链、部分双链、y型、发夹或可环化接头。任选地,能使用一个或多个接头。任选地,能使用一组或多组的2个接头,其中一组的第一接头旨在靶核酸片段5’末端侧连接且组的第二接头旨在靶核酸片段3’末端侧连接。组内第一和第二接头优选各包含相容性引物结合序列,从而接头连接的片段易用相容性引物对扩增或测序。

在一个优选实施方案中,本发明方法没有扩增和/或克隆步骤。减少扩增步骤是有益的,因为表观遗传学信息(例如5-mc、6-ma等)会在扩增子中丧失。进一步扩增能在扩增子中引入变化(如通过扩增期间的错误),从而其核苷酸序列不反映初始样品。类似地,靶区域克隆到另一生物体内通常不维持初始样品核酸中存在的修饰,因此,在优选实施方案中,待富集用于进一步分析的靶序列通常不在本文方法中扩增和/或克隆。

茎环或发夹接头是单链的,但其末端互补,从而接头自身回折以产生双链部分和单链环。茎环接头能连接线性、双链核酸末端。例如,茎环接头连接双链靶核酸片段末端,从而没有末端核苷酸(例如任何空位被填充且连接,分别使用聚合酶和连接酶)时,所得分子缺乏末端核苷酸,而不是在各末端携带单链环。

靶核酸片段能连接可环化接头。此方面中,含靶序列的片段可如下环化:通过相容性结构在片段任一侧自身环化(其可由接头连接或经连接接头的限制性酶消化引起),或通过杂交与所需片段末端互补的选择探针。延伸和最终连接步骤形成了共价闭合的环状,任选地,双链多核苷酸。

本文中应理解核酸样品包含至少一个靶核酸片段。不同的是,核酸样品因而可包含1、2、3、4、5、6、7、8、9、10或更多个靶核酸片段,例如至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多个靶核酸片段,其中优选样品内的各靶核酸片段具有不同序列。本发明方法可提供来自核酸样品的这些靶核酸片段同步富集。因此任选地,本发明方法步骤b)中,加入多组的至少第一和第二grna-cas复合物以从核酸样品富集、分离或测序多个靶核酸片段。优选地,这些多组的第一和第二grna-cas复合物可包含相同crispr核酸酶,但其grna不同。例如,对于各靶核酸片段,可使用2个不同grna分子,如一个grna纳入第一grna-cas复合物,另一grna纳入第二grna-cas复合物。对于例如至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多个靶核酸片段,优选至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多组grna分子,优选至少约100、200、300、400、500、600、700、800、900、1000、1500、2000或更多个不同grna分子,可用于本发明方法。

任选地,本发明方法是多路的,即同时施用于多个核酸样品,例如用于至少约10、20、30、40、50、60、70、80、90、100、500、1000或更多个核酸样品。所述方法可就多个样品平行实施,其中“平行”在本文中应理解为几乎同时,但各样品在单独反应管或容器中处理。另外或替代地,本发明方法的一个或多个步骤可在合并样品上进行。为追溯富集、分离和/或测序片段到初始样品,片段可用标识符作标签,然后合并样品。这类标识符能是任何可检测实体,例如但不限于放射性或荧光标记,但优选是特定核苷酸序列或核苷酸序列组合,优选具有定义长度。另外或替代地,样品能用聪明的混同策略合并,例如但不限于2d和3d合并策略,从而合并后,各样品分别包含于至少2或3个池。特定靶片段能追溯到初始样品,使用含有特定富集、分离和/或测序靶片段的各池坐标。

本发明方法的核酸样品可来自任何来源,如人、动物、植物、微生物,且可以是任何种类,如细胞内源或外源,例如基因组dna、染色体dna、人工染色体、质粒dna或游离型dna、cdna、rna、线粒体、或人工文库如bac或yac等。dna可以是核或细胞器dna。dna优选是染色体dna,优选细胞内源。

另一方面,本发明提供用于上文所定义的方法的成套试剂盒。优选地,所述试剂盒包含至少以下之一:

-一个或多个小瓶,包含本文所定义的至少第一和第二grna-cas复合物;

-一个或多个小瓶,包含至少第一和第二grna,用于复合crispr-cas蛋白形成grna-cas复合物,以及包含所述crispr-cas蛋白的另一小瓶;

-另一小瓶,包含一种或多种核酸外切酶以降解非靶核酸;和

-任选存在的小瓶,包含一种或多种限制性酶以降解非靶核酸。

任选地,试剂盒还包含一个或多个本文所定义接头,有一个或多个上文所示小瓶或在单独小瓶中。试剂盒优选包含至少2、4、10、20、30或50个小瓶,含有本文所定义一种或多种grna。试剂盒内任何小瓶的体积优选不超过100ml、50ml、20ml、10ml、5ml、4ml、3ml、2ml或1ml。

试剂可以冻干形式存在,或溶于适当缓冲液。试剂盒还可包含完成本发明所需的任何其他组分,如缓冲液、吸量管、微量滴定板和书面说明。用于本发明的试剂盒的这类其他组分是技术人员已知的。

最后,提供本文所定义的至少第一和第二grna-cas复合物或成套试剂盒用于从核酸样品富集至少一个靶核酸片段的用途。更具体地,提供所述至少第一和第二grna-cas复合物用于保护靶核酸片段免于核酸外切酶降解的用途。

附图说明

图1:λdna中的pcii限制性核酸内切酶识别位点和cas9sgrna位置。指示片段尺寸以及用cas9靶向的片段。

图2:经消化的dna样品的电泳分析。a)pcii消化的λdna,没有cas9靶向和保护。b)pcii消化的λdna,有cas9靶向和保护。

图3:femto脉冲(advancedanalytical)分析经消化的甜瓜dna,使用靶向423个基因组基因座的cas9,每个基因座具有5.1-5.6kbp的尺寸,池为1406sgrna。在靶基因座侧翼序列中设计sgrna。实际靶向区域的总长是~5.5kbp。可见大小为~6.4kbp的清晰峰值。所量的(sized)长度的差异正常,这归因于量度(sizing)的不准确。左侧第一泳道是经消化的甜瓜dna,第二泳道是标记。

图4:femto脉冲(advancedanalytical)分析选定尺寸的dna。从图3所示样品可见,片段选择范围是2.5kbp–10kbp,使用sagesciencebluepippin。左侧第一泳道是经消化且选定尺寸的dna,第二泳道是标记。

图5:甜瓜(melonvedrantais)基因组区域的igv可视化,将在富集操作后获得的读取进行作图到所述区域。灰盒描述就2个靶基因座而言的相对读数覆盖范围(上部),下面显示作图的读数。靶向基因座指示为作图读数下的黑条。在这些黑条下方,用于这些基因座的所用sgrna位置以黑线指示。显示的是,富集的读取在选定sgrna位置开始且完全涵盖靶向基因座。

实施例

实施例1

材料与方法

共3μgλdna(seqidno:5、genbank登录号j02459.1)(10μl300ng/μl)用限制性核酸内切酶pcii(新英格兰生物实验室(newenglandbiolabs))消化,通过加入下列组分、2μl10xneb3.1缓冲液(新英格兰生物实验室)、3μlpcii核酸内切酶(10u/μl)和5μl无核酸酶水进行。所得20μl反应混合物在37℃温育1小时,之后酶通过80℃温育20分钟灭活。λdna中2个pcii识别位点的概览如图1所示。

pcii限制性酶切的λdna中的2个特定位点用cas9和2个为这些靶向位点设计的sgrna来靶向。第一sgrna(sgrna9)具有seqidno:13并靶向具有seqidno:14的前间隔序列。第二sgrna(sgrna13)具有seqidno:15并靶向具有seqidno:16的前间隔序列。反应条件是:20μlpcii限制性酶切的λdna(见上)、1μl10xneb3.1缓冲液、3μl0.3μmsgrna9、3μl0.3μmsgrna13、1.8μlcas9蛋白(新英格兰生物实验室)和1.2μl无核酸酶水。30μl反应混合物在37℃温育1小时。

未保护片段通过用核酸外切酶v温育来去除。为此,向12.5μlcas9反应物加入下列组分:1.75μl10xneb3.1缓冲液、3.0μl10mmatp(新英格兰生物实验室)、1.0μl10u/μlexov核酸外切酶(新英格兰生物实验室)和11.75μl无核酸酶水。所得30μl反应混合物在37℃温育30分钟。蛋白通过75℃温育10分钟灭活。

进行下列对照反应:

1.仅限制性酶切λdna。为此,仅实施上述pcii限制性反应。

2.将pcii限制性酶切的λdna与核酸外切酶v温育。为此,pcii限制性酶切λdna后,加入下列组分:1.0μl10xneb3.1缓冲液、3.0μl10mmatp、1.0μl10u/μlexov核酸外切酶和5.0μl无核酸酶水。30.0μl反应混合物在37℃温育30分钟。核酸外切酶通过75℃温育10分钟灭活。

所有样品用ampurexp溶液(贝克曼库尔特(beckmancoultier),美国加利福尼亚布州布雷亚)纯化,珠与样品之比为0.8x。结合后,珠用70%乙醇洗2次,结合的dna在10μl无核酸酶水洗脱。

洗脱的dna用femto脉冲(advancedanalytical)分析。

结果

femto脉冲分析结果如图2所示:简言之;

·用pcii限制性酶消化的λdna显示以下长度的预期片段:~600bp(seqidno:6)–~9,000bp(seqidno:8)–~40,000bp(seqidno:7)

·用pcii限制性酶消化且后续用exov核酸外切酶温育的lambdadna没有显示剩余片段,表明缺乏核酸外切酶保护

·用pcii限制性酶消化并用带sgrna9和13的cas9靶向的λdna显示以下长度的预期片段:~600bp(seqidno:6)–~9,000bp(2x)(seqidno:11和12)–~10,000bp(seqidno:10)–~20,000bp(seqidno:9)。seqidno:9的最后的(3’)~500bp如seqidno:17所示且seqidno:11的最初的(5’)~500bp如seqidno:18所示。seqidno:10在其5’末端包含seqidno:14的前间隔序列的部分且在其3’末端包含seqidno:16的前间隔序列的部分。

·用pcii限制性酶消化并用具有sgrna9和13的cas9靶向且后续用exov核酸外切酶温育的λdna意外显示长度~10,000bp的片段(seqidno:10)。

结论

crispr系统核酸酶复合物能够保护dna免于核酸外切酶降解。

实施例2

材料、方法与结果

为研究对作物dna的方法,sgrna设计成靶向甜瓜(melonvedrantais)基因组dna中的423个基因座,这些靶标各具有5.1-5.9kbp长度。对于各靶标,一对至少2个sgrna设计成靶向各靶标侧翼500bp的上游和下游区域,其中各sgrna包含20nt长的引导序列,其在基因组内独特。

总共48个反应,各包含9μl115.6ng/μl(=~1μg)甜瓜dna,总体积为25μl,由以下组成:2.5μl10xneb3.1缓冲液(新英格兰生物实验室公司(newenglandbiolabsinc.))、0.18μl16.58μmsgrna混合物、0.15μl20μm酿脓链球菌(s.pyrogenes)cas9核酸酶(新英格兰生物实验室公司)和13.17μl无核酸酶水。

反应混合物(16μl)在室温预温育10分钟,然后加入甜瓜dna(9μl)。25μl反应在37℃温育1小时。未保护片段通过用核酸外切酶v温育来移出。对此,平分25μlcas9反应,向各12.5μl加入下列组分、2μl10xneb3.1缓冲液、2.0μl50mmatp(新英格兰生物实验室公司)、2.5μl10u/μl核酸外切酶v核酸外切酶(新英格兰生物实验室公司)和1μl无核酸酶水。所得20μl反应混合物在37℃温育60分钟。蛋白通过70℃温育30分钟灭活。

为水解肽键,向20μl反应混合物加入1μl20mg/ml蛋白酶k(罗氏)并室温温育10分钟。

所有样品用ampurepb珠溶液(太平洋生物科学公司)纯化,珠与样品之比为0.45x。合并所有96个反应的反应混合物。结合磁体后,珠用70%乙醇洗2次。珠干燥1分钟且结合的dna在50μl无核酸酶水中洗脱。

洗脱的dna用femto脉冲(advancedanalytical)分析。结果如图3所示。

使用bluepippin(sagescience)对洗脱的dna进行尺寸选定(2.5kbp–10kbp)。作为分离基质,采用bluepippin无染料0.75%琼脂胶盒。特定大小的产物用qiaquickpcr纯化试剂盒(凯杰(qiagen))纯化。纯化的dna在10μl无核酸酶水中洗脱。洗脱的dna用femto脉冲(advancedanalytical)分析。结果如图4所示。

洗脱的dna用于测序文库制备,用于牛津纳米孔(oxfordnanopore)minion系统测序。文库制备和测序根据厂商说明书实施。

所得的序列读取用厂商设置进行质量过滤,通过的读数针对甜瓜全基因组参考序列作图。为将读取作图,使用标准设置的minimap2.11-r797。从作图的读取,仅有单一作图位置的那些用于进一步分析。所得的作图的读取用igv软件(博德研究所(broadinstitute))呈现。图5提供此图用于基因组内分开约47kbp的2个靶。在可视化呈现中,还描绘所靶向的基因座和用于靶向基因座的sgrna的位置。

结论

crispr系统核酸酶复合物能够保护dna免于核酸外切酶降解,导致所靶向的感兴趣的区域的dna富集。

序列表

<110>主基因有限公司

<120>通过核酸内切酶保护的靶向富集

<130>p6080445pct

<150>18208936.7

<151>2018-11-28

<160>21

<170>patentinversion3.5

<210>1

<211>1368

<212>prt

<213>artificialsequence

<220>

<223>cas9

<400>1

metasplyslystyrserileglyleuaspileglythrasnserval

151015

glytrpalavalilethraspglutyrlysvalproserlyslysphe

202530

lysvalleuglyasnthrasparghisserilelyslysasnleuile

354045

glyalaleuleupheaspserglygluthralaglualathrargleu

505560

lysargthralaargargargtyrthrargarglysasnargilecys

65707580

tyrleuglngluilepheserasnglumetalalysvalaspaspser

859095

phephehisargleuglugluserpheleuvalglugluasplyslys

100105110

hisgluarghisproilepheglyasnilevalaspgluvalalatyr

115120125

hisglulystyrprothriletyrhisleuarglyslysleuvalasp

130135140

serthrasplysalaaspleuargleuiletyrleualaleualahis

145150155160

metilelyspheargglyhispheleuilegluglyaspleuasnpro

165170175

aspasnseraspvalasplysleupheileglnleuvalglnthrtyr

180185190

asnglnleupheglugluasnproileasnalaserglyvalaspala

195200205

lysalaileleuseralaargleuserlysserargargleugluasn

210215220

leuilealaglnleuproglyglulyslysasnglyleupheglyasn

225230235240

leuilealaleuserleuglyleuthrproasnphelysserasnphe

245250255

aspleualagluaspalalysleuglnleuserlysaspthrtyrasp

260265270

aspaspleuaspasnleuleualaglnileglyaspglntyralaasp

275280285

leupheleualaalalysasnleuseraspalaileleuleuserasp

290295300

ileleuargvalasnthrgluilethrlysalaproleuseralaser

305310315320

metilelysargtyraspgluhishisglnaspleuthrleuleulys

325330335

alaleuvalargglnglnleuproglulystyrlysgluilephephe

340345350

aspglnserlysasnglytyralaglytyrileaspglyglyalaser

355360365

glnglugluphetyrlyspheilelysproileleuglulysmetasp

370375380

glythrglugluleuleuvallysleuasnarggluaspleuleuarg

385390395400

lysglnargthrpheaspasnglyserileprohisglnilehisleu

405410415

glygluleuhisalaileleuargargglngluaspphetyrprophe

420425430

leulysaspasnargglulysileglulysileleuthrpheargile

435440445

protyrtyrvalglyproleualaargglyasnserargphealatrp

450455460

metthrarglysserglugluthrilethrprotrpasnphegluglu

465470475480

valvalasplysglyalaseralaglnserpheilegluargmetthr

485490495

asnpheasplysasnleuproasnglulysvalleuprolyshisser

500505510

leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys

515520525

tyrvalthrgluglymetarglysproalapheleuserglyglugln

530535540

lyslysalailevalaspleuleuphelysthrasnarglysvalthr

545550555560

vallysglnleulysgluasptyrphelyslysileglucyspheasp

565570575

servalgluileserglyvalgluaspargpheasnalaserleugly

580585590

thrtyrhisaspleuleulysileilelysasplysasppheleuasp

595600605

asnglugluasngluaspileleugluaspilevalleuthrleuthr

610615620

leuphegluaspargglumetileglugluargleulysthrtyrala

625630635640

hisleupheaspasplysvalmetlysglnleulysargargargtyr

645650655

thrglytrpglyargleuserarglysleuileasnglyileargasp

660665670

lysglnserglylysthrileleuasppheleulysseraspglyphe

675680685

alaasnargasnphemetglnleuilehisaspaspserleuthrphe

690695700

lysgluaspileglnlysalaglnvalserglyglnglyaspserleu

705710715720

hisgluhisilealaasnleualaglyserproalailelyslysgly

725730735

ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly

740745750

arghislysprogluasnilevalileglumetalaarggluasngln

755760765

thrthrglnlysglyglnlysasnserarggluargmetlysargile

770775780

glugluglyilelysgluleuglyserglnileleulysgluhispro

785790795800

valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu

805810815

glnasnglyargaspmettyrvalaspglngluleuaspileasnarg

820825830

leuserasptyraspvalasphisilevalproglnserpheleulys

835840845

aspaspserileaspasnlysvalleuthrargserasplysasnarg

850855860

glylysseraspasnvalproserglugluvalvallyslysmetlys

865870875880

asntyrtrpargglnleuleuasnalalysleuilethrglnarglys

885890895

pheaspasnleuthrlysalagluargglyglyleusergluleuasp

900905910

lysalaglypheilelysargglnleuvalgluthrargglnilethr

915920925

lyshisvalalaglnileleuaspserargmetasnthrlystyrasp

930935940

gluasnasplysleuilearggluvallysvalilethrleulysser

945950955960

lysleuvalseraspphearglysasppheglnphetyrlysvalarg

965970975

gluileasnasntyrhishisalahisaspalatyrleuasnalaval

980985990

valglythralaleuilelyslystyrprolysleuglusergluphe

99510001005

valtyrglyasptyrlysvaltyraspvalarglysmetileala

101010151020

lyssergluglngluileglylysalathralalystyrphephe

102510301035

tyrserasnilemetasnphephelysthrgluilethrleuala

104010451050

asnglygluilearglysargproleuilegluthrasnglyglu

105510601065

thrglygluilevaltrpasplysglyargaspphealathrval

107010751080

arglysvalleusermetproglnvalasnilevallyslysthr

108510901095

gluvalglnthrglyglypheserlysgluserileleuprolys

110011051110

argasnserasplysleuilealaarglyslysasptrpasppro

111511201125

lyslystyrglyglypheaspserprothrvalalatyrserval

113011351140

leuvalvalalalysvalglulysglylysserlyslysleulys

114511501155

servallysgluleuleuglyilethrilemetgluargserser

116011651170

pheglulysasnproileasppheleuglualalysglytyrlys

117511801185

gluvallyslysaspleuileilelysleuprolystyrserleu

119011951200

phegluleugluasnglyarglysargmetleualaseralagly

120512101215

gluleuglnlysglyasngluleualaleuproserlystyrval

122012251230

asnpheleutyrleualaserhistyrglulysleulysglyser

123512401245

progluaspasngluglnlysglnleuphevalgluglnhislys

125012551260

histyrleuaspgluileilegluglnileserglupheserlys

126512701275

argvalileleualaaspalaasnleuasplysvalleuserala

128012851290

tyrasnlyshisargasplysproilearggluglnalagluasn

129513001305

ileilehisleuphethrleuthrasnleuglyalaproalaala

131013151320

phelystyrpheaspthrthrileasparglysargtyrthrser

132513301335

thrlysgluvalleuaspalathrleuilehisglnserilethr

134013451350

glyleutyrgluthrargileaspleuserglnleuglyglyasp

135513601365

<210>2

<211>4104

<212>dna

<213>artificialsequence

<220>

<223>sequenceencodingcas9

<400>2

atggataaaaaatatagcattggtctggatattggtaccaatagcgttggttgggcagtt60

attaccgatgaatataaagttccgagcaaaaaatttaaagttctgggtaataccgatcgt120

catagcattaaaaaaaatctgattggtgcactgctgtttgatagcggtgaaaccgcagaa180

gcaacccgtctgaaacgtaccgcacgtcgtcgttatacccgtcgtaaaaatcgtatttgt240

tatctgcaggaaatttttagcaatgaaatggcaaaagttgatgatagcttttttcatcgt300

ctggaagaaagctttctggttgaagaagataaaaaacatgaacgtcatccgatttttggt360

aatattgttgatgaagttgcatatcatgaaaaatatccgaccatttatcatctgcgtaaa420

aaactggttgatagcaccgataaagcagatctgcgtctgatttatctggcactggcacat480

atgattaaatttcgtggtcattttctgattgaaggtgatctgaatccggataatagcgat540

gttgataaactgtttattcagctggttcagacctataatcagctgtttgaagaaaatccg600

attaatgcaagcggtgttgatgcaaaagcaattctgagcgcacgtctgagcaaaagccgt660

cgtctggaaaatctgattgcacagctgccgggtgaaaaaaaaaatggtctgtttggtaat720

ctgattgcactgagcctgggtctgaccccgaattttaaaagcaattttgatctggcagaa780

gatgcaaaactgcagctgagcaaagatacctatgatgatgatctggataatctgctggca840

cagattggtgatcagtatgcagatctgtttctggcagcaaaaaatctgagcgatgcaatt900

ctgctgagcgatattctgcgtgttaataccgaaattaccaaagcaccgctgagcgcaagc960

atgattaaacgttatgatgaacatcatcaggatctgaccctgctgaaagcactggttcgt1020

cagcagctgccggaaaaatataaagaaattttttttgatcagagcaaaaatggttatgca1080

ggttatattgatggtggtgcaagccaggaagaattttataaatttattaaaccgattctg1140

gaaaaaatggatggtaccgaagaactgctggttaaactgaatcgtgaagatctgctgcgt1200

aaacagcgtacctttgataatggtagcattccgcatcagattcatctgggtgaactgcat1260

gcaattctgcgtcgtcaggaagatttttatccgtttctgaaagataatcgtgaaaaaatt1320

gaaaaaattctgacctttcgtattccgtattatgttggtccgctggcacgtggtaatagc1380

cgttttgcatggatgacccgtaaaagcgaagaaaccattaccccgtggaattttgaagaa1440

gttgttgataaaggtgcaagcgcacagagctttattgaacgtatgaccaattttgataaa1500

aatctgccgaatgaaaaagttctgccgaaacatagcctgctgtatgaatattttaccgtt1560

tataatgaactgaccaaagttaaatatgttaccgaaggtatgcgtaaaccggcatttctg1620

agcggtgaacagaaaaaagcaattgttgatctgctgtttaaaaccaatcgtaaagttacc1680

gttaaacagctgaaagaagattattttaaaaaaattgaatgttttgatagcgttgaaatt1740

agcggtgttgaagatcgttttaatgcaagcctgggtacctatcatgatctgctgaaaatt1800

attaaagataaagattttctggataatgaagaaaatgaagatattctggaagatattgtt1860

ctgaccctgaccctgtttgaagatcgtgaaatgattgaagaacgtctgaaaacctatgca1920

catctgtttgatgataaagttatgaaacagctgaaacgtcgtcgttataccggttggggt1980

cgtctgagccgtaaactgattaatggtattcgtgataaacagagcggtaaaaccattctg2040

gattttctgaaaagcgatggttttgcaaatcgtaattttatgcagctgattcatgatgat2100

agcctgacctttaaagaagatattcagaaagcacaggttagcggtcagggtgatagcctg2160

catgaacatattgcaaatctggcaggtagcccggcaattaaaaaaggtattctgcagacc2220

gttaaagttgttgatgaactggttaaagttatgggtcgtcataaaccggaaaatattgtt2280

attgaaatggcacgtgaaaatcagaccacccagaaaggtcagaaaaatagccgtgaacgt2340

atgaaacgtattgaagaaggtattaaagaactgggtagccagattctgaaagaacatccg2400

gttgaaaatacccagctgcagaatgaaaaactgtatctgtattatctgcagaatggtcgt2460

gatatgtatgttgatcaggaactggatattaatcgtctgagcgattatgatgttgatcat2520

attgttccgcagagctttctgaaagatgatagcattgataataaagttctgacccgtagc2580

gataaaaatcgtggtaaaagcgataatgttccgagcgaagaagttgttaaaaaaatgaaa2640

aattattggcgtcagctgctgaatgcaaaactgattacccagcgtaaatttgataatctg2700

accaaagcagaacgtggtggtctgagcgaactggataaagcaggttttattaaacgtcag2760

ctggttgaaacccgtcagattaccaaacatgttgcacagattctggatagccgtatgaat2820

accaaatatgatgaaaatgataaactgattcgtgaagttaaagttattaccctgaaaagc2880

aaactggttagcgattttcgtaaagattttcagttttataaagttcgtgaaattaataat2940

tatcatcatgcacatgatgcatatctgaatgcagttgttggtaccgcactgattaaaaaa3000

tatccgaaactggaaagcgaatttgtttatggtgattataaagtttatgatgttcgtaaa3060

atgattgcaaaaagcgaacaggaaattggtaaagcaaccgcaaaatattttttttatagc3120

aatattatgaatttttttaaaaccgaaattaccctggcaaatggtgaaattcgtaaacgt3180

ccgctgattgaaaccaatggtgaaaccggtgaaattgtttgggataaaggtcgtgatttt3240

gcaaccgttcgtaaagttctgagcatgccgcaggttaatattgttaaaaaaaccgaagtt3300

cagaccggtggttttagcaaagaaagcattctgccgaaacgtaatagcgataaactgatt3360

gcacgtaaaaaagattgggatccgaaaaaatatggtggttttgatagcccgaccgttgca3420

tatagcgttctggttgttgcaaaagttgaaaaaggtaaaagcaaaaaactgaaaagcgtt3480

aaagaactgctgggtattaccattatggaacgtagcagctttgaaaaaaatccgattgat3540

tttctggaagcaaaaggttataaagaagttaaaaaagatctgattattaaactgccgaaa3600

tatagcctgtttgaactggaaaatggtcgtaaacgtatgctggcaagcgcaggtgaactg3660

cagaaaggtaatgaactggcactgccgagcaaatatgttaattttctgtatctggcaagc3720

cattatgaaaaactgaaaggtagcccggaagataatgaacagaaacagctgtttgttgaa3780

cagcataaacattatctggatgaaattattgaacagattagcgaatttagcaaacgtgtt3840

attctggcagatgcaaatctggataaagttctgagcgcatataataaacatcgtgataaa3900

ccgattcgtgaacaggcagaaaatattattcatctgtttaccctgaccaatctgggtgca3960

ccggcagcatttaaatattttgataccaccattgatcgtaaacgttataccagcaccaaa4020

gaagttctggatgcaaccctgattcatcagagcattaccggtctgtatgaaacccgtatt4080

gatctgagccagctgggtggtgat4104

<210>3

<211>1300

<212>prt

<213>artificialsequence

<220>

<223>fncpfi

<400>3

metseriletyrglngluphevalasnlystyrserleuserlysthr

151015

leuargphegluleuileproglnglylysthrleugluasnilelys

202530

alaargglyleuileleuaspaspglulysargalalysasptyrlys

354045

lysalalysglnileileasplystyrhisglnphepheilegluglu

505560

ileleuserservalcysilesergluaspleuleuglnasntyrser

65707580

aspvaltyrphelysleulyslysseraspaspaspasnleuglnlys

859095

aspphelysseralalysaspthrilelyslysglnileserglutyr

100105110

ilelysaspserglulysphelysasnleupheasnglnasnleuile

115120125

aspalalyslysglyglngluseraspleuileleutrpleulysgln

130135140

serlysaspasnglyilegluleuphelysalaasnseraspilethr

145150155160

aspileaspglualaleugluileilelysserphelysglytrpthr

165170175

thrtyrphelysglyphehisgluasnarglysasnvaltyrserser

180185190

asnaspileprothrserileiletyrargilevalaspaspasnleu

195200205

prolyspheleugluasnlysalalystyrgluserleulysasplys

210215220

alaproglualaileasntyrgluglnilelyslysaspleualaglu

225230235240

gluleuthrpheaspileasptyrlysthrsergluvalasnglnarg

245250255

valpheserleuaspgluvalphegluilealaasnpheasnasntyr

260265270

leuasnglnserglyilethrlyspheasnthrileileglyglylys

275280285

phevalasnglygluasnthrlysarglysglyileasnglutyrile

290295300

asnleutyrserglnglnileasnasplysthrleulyslystyrlys

305310315320

metservalleuphelysglnileleuseraspthrgluserlysser

325330335

phevalileasplysleugluaspaspseraspvalvalthrthrmet

340345350

glnserphetyrgluglnilealaalaphelysthrvalgluglulys

355360365

serilelysgluthrleuserleuleupheaspaspleulysalagln

370375380

lysleuaspleuserlysiletyrphelysasnasplysserleuthr

385390395400

aspleuserglnglnvalpheaspasptyrservalileglythrala

405410415

valleuglutyrilethrglnglnilealaprolysasnleuaspasn

420425430

proserlyslysgluglngluleuilealalyslysthrglulysala

435440445

lystyrleuserleugluthrilelysleualaleugluglupheasn

450455460

lyshisargaspileasplysglncysargpheglugluileleuala

465470475480

asnphealaalaileprometilepheaspgluilealaglnasnlys

485490495

aspasnleualaglnileserilelystyrglnasnglnglylyslys

500505510

aspleuleuglnalaseralagluaspaspvallysalailelysasp

515520525

leuleuaspglnthrasnasnleuleuhislysleulysilephehis

530535540

ileserglnsergluasplysalaasnileleuasplysaspgluhis

545550555560

phetyrleuvalphegluglucystyrphegluleualaasnileval

565570575

proleutyrasnlysileargasntyrilethrglnlysprotyrser

580585590

aspglulysphelysleuasnphegluasnserthrleualaasngly

595600605

trpasplysasnlysgluproaspasnthralaileleupheilelys

610615620

aspasplystyrtyrleuglyvalmetasnlyslysasnasnlysile

625630635640

pheaspasplysalailelysgluasnlysglygluglytyrlyslys

645650655

ilevaltyrlysleuleuproglyalaasnlysmetleuprolysval

660665670

phepheseralalysserilelysphetyrasnprosergluaspile

675680685

leuargileargasnhisserthrhisthrlysasnglyserprogln

690695700

lysglytyrglulyspheglupheasnilegluaspcysarglysphe

705710715720

ileaspphetyrlysglnserileserlyshisproglutrplysasp

725730735

pheglypheargpheseraspthrglnargtyrasnserileaspglu

740745750

phetyrarggluvalgluasnglnglytyrlysleuthrphegluasn

755760765

ileserglusertyrileaspservalvalasnglnglylysleutyr

770775780

leupheglniletyrasnlysasppheseralatyrserlysglyarg

785790795800

proasnleuhisthrleutyrtrplysalaleupheaspgluargasn

805810815

leuglnaspvalvaltyrlysleuasnglyglualagluleuphetyr

820825830

arglysglnserileprolyslysilethrhisproalalysgluala

835840845

ilealaasnlysasnlysaspasnprolyslysgluservalpheglu

850855860

tyraspleuilelysasplysargphethrgluasplysphephephe

865870875880

hiscysproilethrileasnphelysserserglyalaasnlysphe

885890895

asnaspgluileasnleuleuleulysglulysalaasnaspvalhis

900905910

ileleuserileaspargglygluarghisleualatyrtyrthrleu

915920925

valaspglylysglyasnileilelysglnaspthrpheasnileile

930935940

glyasnaspargmetlysthrasntyrhisasplysleualaalaile

945950955960

glulysaspargaspseralaarglysasptrplyslysileasnasn

965970975

ilelysglumetlysgluglytyrleuserglnvalvalhisgluile

980985990

alalysleuvalileglutyrasnalailevalvalphegluaspleu

99510001005

asnpheglyphelysargglyargphelysvalglulysglnval

101010151020

tyrglnlysleuglulysmetleuileglulysleuasntyrleu

102510301035

valphelysaspasnglupheasplysthrglyglyvalleuarg

104010451050

alatyrglnleuthralaprophegluthrphelyslysmetgly

105510601065

lysglnthrglyileiletyrtyrvalproalaglyphethrser

107010751080

lysilecysprovalthrglyphevalasnglnleutyrprolys

108510901095

tyrgluservalserlysserglngluphepheserlyspheasp

110011051110

lysilecystyrasnleuasplysglytyrpheglupheserphe

111511201125

asptyrlysasnpheglyasplysalaalalysglylystrpthr

113011351140

ilealaserpheglyserargleuileasnpheargasnserasp

114511501155

lysasnhisasntrpaspthrarggluvaltyrprothrlysglu

116011651170

leuglulysleuleulysasptyrserileglutyrglyhisgly

117511801185

glucysilelysalaalailecysglygluserasplyslysphe

119011951200

phealalysleuthrservalleuasnthrileleuglnmetarg

120512101215

asnserlysthrglythrgluleuasptyrleuileserproval

122012251230

alaaspvalasnglyasnphepheaspserargglnalaprolys

123512401245

asnmetproglnaspalaaspalaasnglyalatyrhisilegly

125012551260

leulysglyleumetleuleuglyargilelysasnasnglnglu

126512701275

glylyslysleuasnleuvalilelysasngluglutyrpheglu

128012851290

phevalglnasnargasnasn

12951300

<210>4

<211>3900

<212>dna

<213>artificialsequence

<220>

<223>sequenceencodingfncpfi

<400>4

atgagcatttatcaggaatttgttaataaatatagcctgagcaaaaccctgcgttttgaa60

ctgattccgcagggtaaaaccctggaaaatattaaagcacgtggtctgattctggatgat120

gaaaaacgtgcaaaagattataaaaaagcaaaacagattattgataaatatcatcagttt180

tttattgaagaaattctgagcagcgtttgtattagcgaagatctgctgcagaattatagc240

gatgtttattttaaactgaaaaaaagcgatgatgataatctgcagaaagattttaaaagc300

gcaaaagataccattaaaaaacagattagcgaatatattaaagatagcgaaaaatttaaa360

aatctgtttaatcagaatctgattgatgcaaaaaaaggtcaggaaagcgatctgattctg420

tggctgaaacagagcaaagataatggtattgaactgtttaaagcaaatagcgatattacc480

gatattgatgaagcactggaaattattaaaagctttaaaggttggaccacctattttaaa540

ggttttcatgaaaatcgtaaaaatgtttatagcagcaatgatattccgaccagcattatt600

tatcgtattgttgatgataatctgccgaaatttctggaaaataaagcaaaatatgaaagc660

ctgaaagataaagcaccggaagcaattaattatgaacagattaaaaaagatctggcagaa720

gaactgacctttgatattgattataaaaccagcgaagttaatcagcgtgtttttagcctg780

gatgaagtttttgaaattgcaaattttaataattatctgaatcagagcggtattaccaaa840

tttaataccattattggtggtaaatttgttaatggtgaaaataccaaacgtaaaggtatt900

aatgaatatattaatctgtatagccagcagattaatgataaaaccctgaaaaaatataaa960

atgagcgttctgtttaaacagattctgagcgataccgaaagcaaaagctttgttattgat1020

aaactggaagatgatagcgatgttgttaccaccatgcagagcttttatgaacagattgca1080

gcatttaaaaccgttgaagaaaaaagcattaaagaaaccctgagcctgctgtttgatgat1140

ctgaaagcacagaaactggatctgagcaaaatttattttaaaaatgataaaagcctgacc1200

gatctgagccagcaggtttttgatgattatagcgttattggtaccgcagttctggaatat1260

attacccagcagattgcaccgaaaaatctggataatccgagcaaaaaagaacaggaactg1320

attgcaaaaaaaaccgaaaaagcaaaatatctgagcctggaaaccattaaactggcactg1380

gaagaatttaataaacatcgtgatattgataaacagtgtcgttttgaagaaattctggca1440

aattttgcagcaattccgatgatttttgatgaaattgcacagaataaagataatctggca1500

cagattagcattaaatatcagaatcagggtaaaaaagatctgctgcaggcaagcgcagaa1560

gatgatgttaaagcaattaaagatctgctggatcagaccaataatctgctgcataaactg1620

aaaatttttcatattagccagagcgaagataaagcaaatattctggataaagatgaacat1680

ttttatctggtttttgaagaatgttattttgaactggcaaatattgttccgctgtataat1740

aaaattcgtaattatattacccagaaaccgtatagcgatgaaaaatttaaactgaatttt1800

gaaaatagcaccctggcaaatggttgggataaaaataaagaaccggataataccgcaatt1860

ctgtttattaaagatgataaatattatctgggtgttatgaataaaaaaaataataaaatt1920

tttgatgataaagcaattaaagaaaataaaggtgaaggttataaaaaaattgtttataaa1980

ctgctgccgggtgcaaataaaatgctgccgaaagttttttttagcgcaaaaagcattaaa2040

ttttataatccgagcgaagatattctgcgtattcgtaatcatagcacccataccaaaaat2100

ggtagcccgcagaaaggttatgaaaaatttgaatttaatattgaagattgtcgtaaattt2160

attgatttttataaacagagcattagcaaacatccggaatggaaagattttggttttcgt2220

tttagcgatacccagcgttataatagcattgatgaattttatcgtgaagttgaaaatcag2280

ggttataaactgacctttgaaaatattagcgaaagctatattgatagcgttgttaatcag2340

ggtaaactgtatctgtttcagatttataataaagattttagcgcatatagcaaaggtcgt2400

ccgaatctgcataccctgtattggaaagcactgtttgatgaacgtaatctgcaggatgtt2460

gtttataaactgaatggtgaagcagaactgttttatcgtaaacagagcattccgaaaaaa2520

attacccatccggcaaaagaagcaattgcaaataaaaataaagataatccgaaaaaagaa2580

agcgtttttgaatatgatctgattaaagataaacgttttaccgaagataaattttttttt2640

cattgtccgattaccattaattttaaaagcagcggtgcaaataaatttaatgatgaaatt2700

aatctgctgctgaaagaaaaagcaaatgatgttcatattctgagcattgatcgtggtgaa2760

cgtcatctggcatattataccctggttgatggtaaaggtaatattattaaacaggatacc2820

tttaatattattggtaatgatcgtatgaaaaccaattatcatgataaactggcagcaatt2880

gaaaaagatcgtgatagcgcacgtaaagattggaaaaaaattaataatattaaagaaatg2940

aaagaaggttatctgagccaggttgttcatgaaattgcaaaactggttattgaatataat3000

gcaattgttgtttttgaagatctgaattttggttttaaacgtggtcgttttaaagttgaa3060

aaacaggtttatcagaaactggaaaaaatgctgattgaaaaactgaattatctggttttt3120

aaagataatgaatttgataaaaccggtggtgttctgcgtgcatatcagctgaccgcaccg3180

tttgaaacctttaaaaaaatgggtaaacagaccggtattatttattatgttccggcaggt3240

tttaccagcaaaatttgtccggttaccggttttgttaatcagctgtatccgaaatatgaa3300

agcgttagcaaaagccaggaattttttagcaaatttgataaaatttgttataatctggat3360

aaaggttattttgaatttagctttgattataaaaattttggtgataaagcagcaaaaggt3420

aaatggaccattgcaagctttggtagccgtctgattaattttcgtaatagcgataaaaat3480

cataattgggatacccgtgaagtttatccgaccaaagaactggaaaaactgctgaaagat3540

tatagcattgaatatggtcatggtgaatgtattaaagcagcaatttgtggtgaaagcgat3600

aaaaaattttttgcaaaactgaccagcgttctgaataccattctgcagatgcgtaatagc3660

aaaaccggtaccgaactggattatctgattagcccggttgcagatgttaatggtaatttt3720

tttgatagccgtcaggcaccgaaaaatatgccgcaggatgcagatgcaaatggtgcatat3780

catattggtctgaaaggtctgatgctgctgggtcgtattaaaaataatcaggaaggtaaa3840

aaactgaatctggttattaaaaatgaagaatattttgaatttgttcagaatcgtaataat3900

<210>5

<211>48502

<212>dna

<213>artificialsequence

<220>

<223>lambdadna

<400>5

gggcggcgacctcgcgggttttcgctatttatgaaaattttccggtttaaggcgtttccg60

ttcttcttcgtcataacttaatgtttttatttaaaataccctctgaaaagaaaggaaacg120

acaggtgctgaaagcgaggctttttggcctctgtcgtttcctttctctgtttttgtccgt180

ggaatgaacaatggaagtcaacaaaaagcagctggctgacattttcggtgcgagtatccg240

taccattcagaactggcaggaacagggaatgcccgttctgcgaggcggtggcaagggtaa300

tgaggtgctttatgactctgccgccgtcataaaatggtatgccgaaagggatgctgaaat360

tgagaacgaaaagctgcgccgggaggttgaagaactgcggcaggccagcgaggcagatct420

ccagccaggaactattgagtacgaacgccatcgacttacgcgtgcgcaggccgacgcaca480

ggaactgaagaatgccagagactccgctgaagtggtggaaaccgcattctgtactttcgt540

gctgtcgcggatcgcaggtgaaattgccagtattctcgacgggctccccctgtcggtgca600

gcggcgttttccggaactggaaaaccgacatgttgatttcctgaaacgggatatcatcaa660

agccatgaacaaagcagccgcgctggatgaactgataccggggttgctgagtgaatatat720

cgaacagtcaggttaacaggctgcggcattttgtccgcgccgggcttcgctcactgttca780

ggccggagccacagaccgccgttgaatgggcggatgctaattactatctcccgaaagaat840

ccgcataccaggaagggcgctgggaaacactgccctttcagcgggccatcatgaatgcga900

tgggcagcgactacatccgtgaggtgaatgtggtgaagtctgcccgtgtcggttattcca960

aaatgctgctgggtgtttatgcctactttatagagcataagcagcgcaacacccttatct1020

ggttgccgacggatggtgatgccgagaactttatgaaaacccacgttgagccgactattc1080

gtgatattccgtcgctgctggcgctggccccgtggtatggcaaaaagcaccgggataaca1140

cgctcaccatgaagcgtttcactaatgggcgtggcttctggtgcctgggcggtaaagcgg1200

caaaaaactaccgtgaaaagtcggtggatgtggcgggttatgatgaacttgctgcttttg1260

atgatgatattgaacaggaaggctctccgacgttcctgggtgacaagcgtattgaaggct1320

cggtctggccaaagtccatccgtggctccacgccaaaagtgagaggcacctgtcagattg1380

agcgtgcagccagtgaatccccgcattttatgcgttttcatgttgcctgcccgcattgcg1440

gggaggagcagtatcttaaatttggcgacaaagagacgccgtttggcctcaaatggacgc1500

cggatgacccctccagcgtgttttatctctgcgagcataatgcctgcgtcatccgccagc1560

aggagctggactttactgatgcccgttatatctgcgaaaagaccgggatctggacccgtg1620

atggcattctctggttttcgtcatccggtgaagagattgagccacctgacagtgtgacct1680

ttcacatctggacagcgtacagcccgttcaccacctgggtgcagattgtcaaagactgga1740

tgaaaacgaaaggggatacgggaaaacgtaaaaccttcgtaaacaccacgctcggtgaga1800

cgtgggaggcgaaaattggcgaacgtccggatgctgaagtgatggcagagcggaaagagc1860

attattcagcgcccgttcctgaccgtgtggcttacctgaccgccggtatcgactcccagc1920

tggaccgctacgaaatgcgcgtatggggatgggggccgggtgaggaaagctggctgattg1980

accggcagattattatgggccgccacgacgatgaacagacgctgctgcgtgtggatgagg2040

ccatcaataaaacctatacccgccggaatggtgcagaaatgtcgatatcccgtatctgct2100

gggatactggcgggattgacccgaccattgtgtatgaacgctcgaaaaaacatgggctgt2160

tccgggtgatccccattaaaggggcatccgtctacggaaagccggtggccagcatgccac2220

gtaagcgaaacaaaaacggggtttaccttaccgaaatcggtacggataccgcgaaagagc2280

agatttataaccgcttcacactgacgccggaaggggatgaaccgcttcccggtgccgttc2340

acttcccgaataacccggatatttttgatctgaccgaagcgcagcagctgactgctgaag2400

agcaggtcgaaaaatgggtggatggcaggaaaaaaatactgtgggacagcaaaaagcgac2460

gcaatgaggcactcgactgcttcgtttatgcgctggcggcgctgcgcatcagtatttccc2520

gctggcagctggatctcagtgcgctgctggcgagcctgcaggaagaggatggtgcagcaa2580

ccaacaagaaaacactggcagattacgcccgtgccttatccggagaggatgaatgacgcg2640

acaggaagaacttgccgctgcccgtgcggcactgcatgacctgatgacaggtaaacgggt2700

ggcaacagtacagaaagacggacgaagggtggagtttacggccacttccgtgtctgacct2760

gaaaaaatatattgcagagctggaagtgcagaccggcatgacacagcgacgcaggggacc2820

tgcaggattttatgtatgaaaacgcccaccattcccacccttctggggccggacggcatg2880

acatcgctgcgcgaatatgccggttatcacggcggtggcagcggatttggagggcagttg2940

cggtcgtggaacccaccgagtgaaagtgtggatgcagccctgttgcccaactttacccgt3000

ggcaatgcccgcgcagacgatctggtacgcaataacggctatgccgccaacgccatccag3060

ctgcatcaggatcatatcgtcgggtcttttttccggctcagtcatcgcccaagctggcgc3120

tatctgggcatcggggaggaagaagcccgtgccttttcccgcgaggttgaagcggcatgg3180

aaagagtttgccgaggatgactgctgctgcattgacgttgagcgaaaacgcacgtttacc3240

atgatgattcgggaaggtgtggccatgcacgcctttaacggtgaactgttcgttcaggcc3300

acctgggataccagttcgtcgcggcttttccggacacagttccggatggtcagcccgaag3360

cgcatcagcaacccgaacaataccggcgacagccggaactgccgtgccggtgtgcagatt3420

aatgacagcggtgcggcgctgggatattacgtcagcgaggacgggtatcctggctggatg3480

ccgcagaaatggacatggataccccgtgagttacccggcgggcgcgcctcgttcattcac3540

gtttttgaacccgtggaggacgggcagactcgcggtgcaaatgtgttttacagcgtgatg3600

gagcagatgaagatgctcgacacgctgcagaacacgcagctgcagagcgccattgtgaag3660

gcgatgtatgccgccaccattgagagtgagctggatacgcagtcagcgatggattttatt3720

ctgggcgcgaacagtcaggagcagcgggaaaggctgaccggctggattggtgaaattgcc3780

gcgtattacgccgcagcgccggtccggctgggaggcgcaaaagtaccgcacctgatgccg3840

ggtgactcactgaacctgcagacggctcaggatacggataacggctactccgtgtttgag3900

cagtcactgctgcggtatatcgctgccgggctgggtgtctcgtatgagcagctttcccgg3960

aattacgcccagatgagctactccacggcacgggccagtgcgaacgagtcgtgggcgtac4020

tttatggggcggcgaaaattcgtcgcatcccgtcaggcgagccagatgtttctgtgctgg4080

ctggaagaggccatcgttcgccgcgtggtgacgttaccttcaaaagcgcgcttcagtttt4140

caggaagcccgcagtgcctgggggaactgcgactggataggctccggtcgtatggccatc4200

gatggtctgaaagaagttcaggaagcggtgatgctgatagaagccggactgagtacctac4260

gagaaagagtgcgcaaaacgcggtgacgactatcaggaaatttttgcccagcaggtccgt4320

gaaacgatggagcgccgtgcagccggtcttaaaccgcccgcctgggcggctgcagcattt4380

gaatccgggctgcgacaatcaacagaggaggagaagagtgacagcagagctgcgtaatct4440

cccgcatattgccagcatggcctttaatgagccgctgatgcttgaacccgcctatgcgcg4500

ggttttcttttgtgcgcttgcaggccagcttgggatcagcagcctgacggatgcggtgtc4560

cggcgacagcctgactgcccaggaggcactcgcgacgctggcattatccggtgatgatga4620

cggaccacgacaggcccgcagttatcaggtcatgaacggcatcgccgtgctgccggtgtc4680

cggcacgctggtcagccggacgcgggcgctgcagccgtactcggggatgaccggttacaa4740

cggcattatcgcccgtctgcaacaggctgccagcgatccgatggtggacggcattctgct4800

cgatatggacacgcccggcgggatggtggcgggggcatttgactgcgctgacatcatcgc4860

ccgtgtgcgtgacataaaaccggtatgggcgcttgccaacgacatgaactgcagtgcagg4920

tcagttgcttgccagtgccgcctcccggcgtctggtcacgcagaccgcccggacaggctc4980

catcggcgtcatgatggctcacagtaattacggtgctgcgctggagaaacagggtgtgga5040

aatcacgctgatttacagcggcagccataaggtggatggcaacccctacagccatcttcc5100

ggatgacgtccgggagacactgcagtcccggatggacgcaacccgccagatgtttgcgca5160

gaaggtgtcggcatataccggcctgtccgtgcaggttgtgctggataccgaggctgcagt5220

gtacagcggtcaggaggccattgatgccggactggctgatgaacttgttaacagcaccga5280

tgcgatcaccgtcatgcgtgatgcactggatgcacgtaaatcccgtctctcaggagggcg5340

aatgaccaaagagactcaatcaacaactgtttcagccactgcttcgcaggctgacgttac5400

tgacgtggtgccagcgacggagggcgagaacgccagcgcggcgcagccggacgtgaacgc5460

gcagatcaccgcagcggttgcggcagaaaacagccgcattatggggatcctcaactgtga5520

ggaggctcacggacgcgaagaacaggcacgcgtgctggcagaaacccccggtatgaccgt5580

gaaaacggcccgccgcattctggccgcagcaccacagagtgcacaggcgcgcagtgacac5640

tgcgctggatcgtctgatgcagggggcaccggcaccgctggctgcaggtaacccggcatc5700

tgatgccgttaacgatttgctgaacacaccagtgtaagggatgtttatgacgagcaaaga5760

aacctttacccattaccagccgcagggcaacagtgacccggctcataccgcaaccgcgcc5820

cggcggattgagtgcgaaagcgcctgcaatgaccccgctgatgctggacacctccagccg5880

taagctggttgcgtgggatggcaccaccgacggtgctgccgttggcattcttgcggttgc5940

tgctgaccagaccagcaccacgctgacgttctacaagtccggcacgttccgttatgagga6000

tgtgctctggccggaggctgccagcgacgagacgaaaaaacggaccgcgtttgccggaac6060

ggcaatcagcatcgtttaactttacccttcatcactaaaggccgcctgtgcggctttttt6120

tacgggatttttttatgtcgatgtacacaaccgcccaactgctggcggcaaatgagcaga6180

aatttaagtttgatccgctgtttctgcgtctctttttccgtgagagctatcccttcacca6240

cggagaaagtctatctctcacaaattccgggactggtaaacatggcgctgtacgtttcgc6300

cgattgtttccggtgaggttatccgttcccgtggcggctccacctctgaatttacgccgg6360

gatatgtcaagccgaagcatgaagtgaatccgcagatgaccctgcgtcgcctgccggatg6420

aagatccgcagaatctggcggacccggcttaccgccgccgtcgcatcatcatgcagaaca6480

tgcgtgacgaagagctggccattgctcaggtcgaagagatgcaggcagtttctgccgtgc6540

ttaagggcaaatacaccatgaccggtgaagccttcgatccggttgaggtggatatgggcc6600

gcagtgaggagaataacatcacgcagtccggcggcacggagtggagcaagcgtgacaagt6660

ccacgtatgacccgaccgacgatatcgaagcctacgcgctgaacgccagcggtgtggtga6720

atatcatcgtgttcgatccgaaaggctgggcgctgttccgttccttcaaagccgtcaagg6780

agaagctggatacccgtcgtggctctaattccgagctggagacagcggtgaaagacctgg6840

gcaaagcggtgtcctataaggggatgtatggcgatgtggccatcgtcgtgtattccggac6900

agtacgtggaaaacggcgtcaaaaagaacttcctgccggacaacacgatggtgctgggga6960

acactcaggcacgcggtctgcgcacctatggctgcattcaggatgcggacgcacagcgcg7020

aaggcattaacgcctctgcccgttacccgaaaaactgggtgaccaccggcgatccggcgc7080

gtgagttcaccatgattcagtcagcaccgctgatgctgctggctgaccctgatgagttcg7140

tgtccgtacaactggcgtaatcatggcccttcggggccattgtttctctgtggaggagtc7200

catgacgaaagatgaactgattgcccgtctccgctcgctgggtgaacaactgaaccgtga7260

tgtcagcctgacggggacgaaagaagaactggcgctccgtgtggcagagctgaaagagga7320

gcttgatgacacggatgaaactgccggtcaggacacccctctcagccgggaaaatgtgct7380

gaccggacatgaaaatgaggtgggatcagcgcagccggataccgtgattctggatacgtc7440

tgaactggtcacggtcgtggcactggtgaagctgcatactgatgcacttcacgccacgcg7500

ggatgaacctgtggcatttgtgctgccgggaacggcgtttcgtgtctctgccggtgtggc7560

agccgaaatgacagagcgcggcctggccagaatgcaataacgggaggcgctgtggctgat7620

ttcgataacctgttcgatgctgccattgcccgcgccgatgaaacgatacgcgggtacatg7680

ggaacgtcagccaccattacatccggtgagcagtcaggtgcggtgatacgtggtgttttt7740

gatgaccctgaaaatatcagctatgccggacagggcgtgcgcgttgaaggctccagcccg7800

tccctgtttgtccggactgatgaggtgcggcagctgcggcgtggagacacgctgaccatc7860

ggtgaggaaaatttctgggtagatcgggtttcgccggatgatggcggaagttgtcatctc7920

tggcttggacggggcgtaccgcctgccgttaaccgtcgccgctgaaagggggatgtatgg7980

ccataaaaggtcttgagcaggccgttgaaaacctcagccgtatcagcaaaacggcggtgc8040

ctggtgccgccgcaatggccattaaccgcgttgcttcatccgcgatatcgcagtcggcgt8100

cacaggttgcccgtgagacaaaggtacgccggaaactggtaaaggaaagggccaggctga8160

aaagggccacggtcaaaaatccgcaggccagaatcaaagttaaccggggggatttgcccg8220

taatcaagctgggtaatgcgcgggttgtcctttcgcgccgcaggcgtcgtaaaaaggggc8280

agcgttcatccctgaaaggtggcggcagcgtgcttgtggtgggtaaccgtcgtattcccg8340

gcgcgtttattcagcaactgaaaaatggccggtggcatgtcatgcagcgtgtggctggga8400

aaaaccgttaccccattgatgtggtgaaaatcccgatggcggtgccgctgaccacggcgt8460

ttaaacaaaatattgagcggatacggcgtgaacgtcttccgaaagagctgggctatgcgc8520

tgcagcatcaactgaggatggtaataaagcgatgaaacatactgaactccgtgcagccgt8580

actggatgcactggagaagcatgacaccggggcgacgttttttgatggtcgccccgctgt8640

ttttgatgaggcggattttccggcagttgccgtttatctcaccggcgctgaatacacggg8700

cgaagagctggacagcgatacctggcaggcggagctgcatatcgaagttttcctgcctgc8760

tcaggtgccggattcagagctggatgcgtggatggagtcccggatttatccggtgatgag8820

cgatatcccggcactgtcagatttgatcaccagtatggtggccagcggctatgactaccg8880

gcgcgacgatgatgcgggcttgtggagttcagccgatctgacttatgtcattacctatga8940

aatgtgaggacgctatgcctgtaccaaatcctacaatgccggtgaaaggtgccgggacca9000

ccctgtgggtttataaggggagcggtgacccttacgcgaatccgctttcagacgttgact9060

ggtcgcgtctggcaaaagttaaagacctgacgcccggcgaactgaccgctgagtcctatg9120

acgacagctatctcgatgatgaagatgcagactggactgcgaccgggcaggggcagaaat9180

ctgccggagataccagcttcacgctggcgtggatgcccggagagcaggggcagcaggcgc9240

tgctggcgtggtttaatgaaggcgatacccgtgcctataaaatccgcttcccgaacggca9300

cggtcgatgtgttccgtggctgggtcagcagtatcggtaaggcggtgacggcgaaggaag9360

tgatcacccgcacggtgaaagtcaccaatgtgggacgtccgtcgatggcagaagatcgca9420

gcacggtaacagcggcaaccggcatgaccgtgacgcctgccagcacctcggtggtgaaag9480

ggcagagcaccacgctgaccgtggccttccagccggagggcgtaaccgacaagagctttc9540

gtgcggtgtctgcggataaaacaaaagccaccgtgtcggtcagtggtatgaccatcaccg9600

tgaacggcgttgctgcaggcaaggtcaacattccggttgtatccggtaatggtgagtttg9660

ctgcggttgcagaaattaccgtcaccgccagttaatccggagagtcagcgatgttcctga9720

aaaccgaatcatttgaacataacggtgtgaccgtcacgctttctgaactgtcagccctgc9780

agcgcattgagcatctcgccctgatgaaacggcaggcagaacaggcggagtcagacagca9840

accggaagtttactgtggaagacgccatcagaaccggcgcgtttctggtggcgatgtccc9900

tgtggcataaccatccgcagaagacgcagatgccgtccatgaatgaagccgttaaacaga9960

ttgagcaggaagtgcttaccacctggcccacggaggcaatttctcatgctgaaaacgtgg10020

tgtaccggctgtctggtatgtatgagtttgtggtgaataatgcccctgaacagacagagg10080

acgccgggcccgcagagcctgtttctgcgggaaagtgttcgacggtgagctgagttttgc10140

cctgaaactggcgcgtgagatggggcgacccgactggcgtgccatgcttgccgggatgtc10200

atccacggagtatgccgactggcaccgcttttacagtacccattattttcatgatgttct10260

gctggatatgcacttttccgggctgacgtacaccgtgctcagcctgtttttcagcgatcc10320

ggatatgcatccgctggatttcagtctgctgaaccggcgcgaggctgacgaagagcctga10380

agatgatgtgctgatgcagaaagcggcagggcttgccggaggtgtccgctttggcccgga10440

cgggaatgaagttatccccgcttccccggatgtggcggacatgacggaggatgacgtaat10500

gctgatgacagtatcagaagggatcgcaggaggagtccggtatggctgaaccggtaggcg10560

atctggtcgttgatttgagtctggatgcggccagatttgacgagcagatggccagagtca10620

ggcgtcatttttctggtacggaaagtgatgcgaaaaaaacagcggcagtcgttgaacagt10680

cgctgagccgacaggcgctggctgcacagaaagcggggatttccgtcgggcagtataaag10740

ccgccatgcgtatgctgcctgcacagttcaccgacgtggccacgcagcttgcaggcgggc10800

aaagtccgtggctgatcctgctgcaacagggggggcaggtgaaggactccttcggcggga10860

tgatccccatgttcagggggcttgccggtgcgatcaccctgccgatggtgggggccacct10920

cgctggcggtggcgaccggtgcgctggcgtatgcctggtatcagggcaactcaaccctgt10980

ccgatttcaacaaaacgctggtcctttccggcaatcaggcgggactgacggcagatcgta11040

tgctggtcctgtccagagccgggcaggcggcagggctgacgtttaaccagaccagcgagt11100

cactcagcgcactggttaaggcgggggtaagcggtgaggctcagattgcgtccatcagcc11160

agagtgtggcgcgtttctcctctgcatccggcgtggaggtggacaaggtcgctgaagcct11220

tcgggaagctgaccacagacccgacgtcggggctgacggcgatggctcgccagttccata11280

acgtgtcggcggagcagattgcgtatgttgctcagttgcagcgttccggcgatgaagccg11340

gggcattgcaggcggcgaacgaggccgcaacgaaagggtttgatgaccagacccgccgcc11400

tgaaagagaacatgggcacgctggagacctgggcagacaggactgcgcgggcattcaaat11460

ccatgtgggatgcggtgctggatattggtcgtcctgataccgcgcaggagatgctgatta11520

aggcagaggctgcgtataagaaagcagacgacatctggaatctgcgcaaggatgattatt11580

ttgttaacgatgaagcgcgggcgcgttactgggatgatcgtgaaaaggcccgtcttgcgc11640

ttgaagccgcccgaaagaaggctgagcagcagactcaacaggacaaaaatgcgcagcagc11700

agagcgataccgaagcgtcacggctgaaatataccgaagaggcgcagaaggcttacgaac11760

ggctgcagacgccgctggagaaatataccgcccgtcaggaagaactgaacaaggcactga11820

aagacgggaaaatcctgcaggcggattacaacacgctgatggcggcggcgaaaaaggatt11880

atgaagcgacgctgaaaaagccgaaacagtccagcgtgaaggtgtctgcgggcgatcgtc11940

aggaagacagtgctcatgctgccctgctgacgcttcaggcagaactccggacgctggaga12000

agcatgccggagcaaatgagaaaatcagccagcagcgccgggatttgtggaaggcggaga12060

gtcagttcgcggtactggaggaggcggcgcaacgtcgccagctgtctgcacaggagaaat12120

ccctgctggcgcataaagatgagacgctggagtacaaacgccagctggctgcacttggcg12180

acaaggttacgtatcaggagcgcctgaacgcgctggcgcagcaggcggataaattcgcac12240

agcagcaacgggcaaaacgggccgccattgatgcgaaaagccgggggctgactgaccggc12300

aggcagaacgggaagccacggaacagcgcctgaaggaacagtatggcgataatccgctgg12360

cgctgaataacgtcatgtcagagcagaaaaagacctgggcggctgaagaccagcttcgcg12420

ggaactggatggcaggcctgaagtccggctggagtgagtgggaagagagcgccacggaca12480

gtatgtcgcaggtaaaaagtgcagccacgcagacctttgatggtattgcacagaatatgg12540

cggcgatgctgaccggcagtgagcagaactggcgcagcttcacccgttccgtgctgtcca12600

tgatgacagaaattctgcttaagcaggcaatggtggggattgtcgggagtatcggcagcg12660

ccattggcggggctgttggtggcggcgcatccgcgtcaggcggtacagccattcaggccg12720

ctgcggcgaaattccattttgcaaccggaggatttacgggaaccggcggcaaatatgagc12780

cagcggggattgttcaccgtggtgagtttgtcttcacgaaggaggcaaccagccggattg12840

gcgtggggaatctttaccggctgatgcgcggctatgccaccggcggttatgtcggtacac12900

cgggcagcatggcagacagccggtcgcaggcgtccgggacgtttgagcagaataaccatg12960

tggtgattaacaacgacggcacgaacgggcagataggtccggctgctctgaaggcggtgt13020

atgacatggcccgcaagggtgcccgtgatgaaattcagacacagatgcgtgatggtggcc13080

tgttctccggaggtggacgatgaagaccttccgctggaaagtgaaacccggtatggatgt13140

ggcttcggtcccttctgtaagaaaggtgcgctttggtgatggctattctcagcgagcgcc13200

tgccgggctgaatgccaacctgaaaacgtacagcgtgacgctttctgtcccccgtgagga13260

ggccacggtactggagtcgtttctggaagagcacgggggctggaaatcctttctgtggac13320

gccgccttatgagtggcggcagataaaggtgacctgcgcaaaatggtcgtcgcgggtcag13380

tatgctgcgtgttgagttcagcgcagagtttgaacaggtggtgaactgatgcaggatatc13440

cggcaggaaacactgaatgaatgcacccgtgcggagcagtcggccagcgtggtgctctgg13500

gaaatcgacctgacagaggtcggtggagaacgttattttttctgtaatgagcagaacgaa13560

aaaggtgagccggtcacctggcaggggcgacagtatcagccgtatcccattcaggggagc13620

ggttttgaactgaatggcaaaggcaccagtacgcgccccacgctgacggtttctaacctg13680

tacggtatggtcaccgggatggcggaagatatgcagagtctggtcggcggaacggtggtc13740

cggcgtaaggtttacgcccgttttctggatgcggtgaacttcgtcaacggaaacagttac13800

gccgatccggagcaggaggtgatcagccgctggcgcattgagcagtgcagcgaactgagc13860

gcggtgagtgcctcctttgtactgtccacgccgacggaaacggatggcgctgtttttccg13920

ggacgtatcatgctggccaacacctgcacctggacctatcgcggtgacgagtgcggttat13980

agcggtccggctgtcgcggatgaatatgaccagccaacgtccgatatcacgaaggataaa14040

tgcagcaaatgcctgagcggttgtaagttccgcaataacgtcggcaactttggcggcttc14100

ctttccattaacaaactttcgcagtaaatcccatgacacagacagaatcagcgattctgg14160

cgcacgcccggcgatgtgcgccagcggagtcgtgcggcttcgtggtaagcacgccggagg14220

gggaaagatatttcccctgcgtgaatatctccggtgagccggaggctatttccgtatgtc14280

gccggaagactggctgcaggcagaaatgcagggtgagattgtggcgctggtccacagcca14340

ccccggtggtctgccctggctgagtgaggccgaccggcggctgcaggtgcagagtgattt14400

gccgtggtggctggtctgccgggggacgattcataagttccgctgtgtgccgcatctcac14460

cgggcggcgctttgagcacggtgtgacggactgttacacactgttccgggatgcttatca14520

tctggcggggattgagatgccggactttcatcgtgaggatgactggtggcgtaacggcca14580

gaatctctatctggataatctggaggcgacggggctgtatcaggtgccgttgtcagcggc14640

acagccgggcgatgtgctgctgtgctgttttggttcatcagtgccgaatcacgccgcaat14700

ttactgcggcgacggcgagctgctgcaccatattcctgaacaactgagcaaacgagagag14760

gtacaccgacaaatggcagcgacgcacacactccctctggcgtcaccgggcatggcgcgc14820

atctgcctttacggggatttacaacgatttggtcgccgcatcgaccttcgtgtgaaaacg14880

ggggctgaagccatccgggcactggccacacagctcccggcgtttcgtcagaaactgagc14940

gacggctggtatcaggtacggattgccgggcgggacgtcagcacgtccgggttaacggcg15000

cagttacatgagactctgcctgatggcgctgtaattcatattgttcccagagtcgccggg15060

gccaagtcaggtggcgtattccagattgtcctgggggctgccgccattgccggatcattc15120

tttaccgccggagccacccttgcagcatggggggcagccattggggccggtggtatgacc15180

ggcatcctgttttctctcggtgccagtatggtgctcggtggtgtggcgcagatgctggca15240

ccgaaagccagaactccccgtatacagacaacggataacggtaagcagaacacctatttc15300

tcctcactggataacatggttgcccagggcaatgttctgcctgttctgtacggggaaatg15360

cgcgtggggtcacgcgtggtttctcaggagatcagcacggcagacgaaggggacggtggt15420

caggttgtggtgattggtcgctgatgcaaaatgttttatgtgaaaccgcctgcgggcggt15480

tttgtcatttatggagcgtgaggaatgggtaaaggaagcagtaaggggcataccccgcgc15540

gaagcgaaggacaacctgaagtccacgcagttgctgagtgtgatcgatgccatcagcgaa15600

gggccgattgaaggtccggtggatggcttaaaaagcgtgctgctgaacagtacgccggtg15660

ctggacactgaggggaataccaacatatccggtgtcacggtggtgttccgggctggtgag15720

caggagcagactccgccggagggatttgaatcctccggctccgagacggtgctgggtacg15780

gaagtgaaatatgacacgccgatcacccgcaccattacgtctgcaaacatcgaccgtctg15840

cgctttaccttcggtgtacaggcactggtggaaaccacctcaaagggtgacaggaatccg15900

tcggaagtccgcctgctggttcagatacaacgtaacggtggctgggtgacggaaaaagac15960

atcaccattaagggcaaaaccacctcgcagtatctggcctcggtggtgatgggtaacctg16020

ccgccgcgcccgtttaatatccggatgcgcaggatgacgccggacagcaccacagaccag16080

ctgcagaacaaaacgctctggtcgtcatacactgaaatcatcgatgtgaaacagtgctac16140

ccgaacacggcactggtcggcgtgcaggtggactcggagcagttcggcagccagcaggtg16200

agccgtaattatcatctgcgcgggcgtattctgcaggtgccgtcgaactataacccgcag16260

acgcggcaatacagcggtatctgggacggaacgtttaaaccggcatacagcaacaacatg16320

gcctggtgtctgtgggatatgctgacccatccgcgctacggcatggggaaacgtcttggt16380

gcggcggatgtggataaatgggcgctgtatgtcatcggccagtactgcgaccagtcagtg16440

ccggacggctttggcggcacggagccgcgcatcacctgtaatgcgtacctgaccacacag16500

cgtaaggcgtgggatgtgctcagcgatttctgctcggcgatgcgctgtatgccggtatgg16560

aacgggcagacgctgacgttcgtgcaggaccgaccgtcggataagacgtggacctataac16620

cgcagtaatgtggtgatgccggatgatggcgcgccgttccgctacagcttcagcgccctg16680

aaggaccgccataatgccgttgaggtgaactggattgacccgaacaacggctgggagacg16740

gcgacagagcttgttgaagatacgcaggccattgcccgttacggtcgtaatgttacgaag16800

atggatgcctttggctgtaccagccgggggcaggcacaccgcgccgggctgtggctgatt16860

aaaacagaactgctggaaacgcagaccgtggatttcagcgtcggcgcagaagggcttcgc16920

catgtaccgggcgatgttattgaaatctgcgatgatgactatgccggtatcagcaccggt16980

ggtcgtgtgctggcggtgaacagccagacccggacgctgacgctcgaccgtgaaatcacg17040

ctgccatcctccggtaccgcgctgataagcctggttgacggaagtggcaatccggtcagc17100

gtggaggttcagtccgtcaccgacggcgtgaaggtaaaagtgagccgtgttcctgacggt17160

gttgctgaatacagcgtatgggagctgaagctgccgacgctgcgccagcgactgttccgc17220

tgcgtgagtatccgtgagaacgacgacggcacgtatgccatcaccgccgtgcagcatgtg17280

ccggaaaaagaggccatcgtggataacggggcgcactttgacggcgaacagagtggcacg17340

gtgaatggtgtcacgccgccagcggtgcagcacctgaccgcagaagtcactgcagacagc17400

ggggaatatcaggtgctggcgcgatgggacacaccgaaggtggtgaagggcgtgagtttc17460

ctgctccgtctgaccgtaacagcggacgacggcagtgagcggctggtcagcacggcccgg17520

acgacggaaaccacataccgcttcacgcaactggcgctggggaactacaggctgacagtc17580

cgggcggtaaatgcgtgggggcagcagggcgatccggcgtcggtatcgttccggattgcc17640

gcaccggcagcaccgtcgaggattgagctgacgccgggctattttcagataaccgccacg17700

ccgcatcttgccgtttatgacccgacggtacagtttgagttctggttctcggaaaagcag17760

attgcggatatcagacaggttgaaaccagcacgcgttatcttggtacggcgctgtactgg17820

atagccgccagtatcaatatcaaaccgggccatgattattacttttatatccgcagtgtg17880

aacaccgttggcaaatcggcattcgtggaggccgtcggtcgggcgagcgatgatgcggaa17940

ggttacctggattttttcaaaggcaagataaccgaatcccatctcggcaaggagctgctg18000

gaaaaagtcgagctgacggaggataacgccagcagactggaggagttttcgaaagagtgg18060

aaggatgccagtgataagtggaatgccatgtgggctgtcaaaattgagcagaccaaagac18120

ggcaaacattatgtcgcgggtattggcctcagcatggaggacacggaggaaggcaaactg18180

agccagtttctggttgccgccaatcgtatcgcatttattgacccggcaaacgggaatgaa18240

acgccgatgtttgtggcgcagggcaaccagatattcatgaacgacgtgttcctgaagcgc18300

ctgacggcccccaccattaccagcggcggcaatcctccggccttttccctgacaccggac18360

ggaaagctgaccgctaaaaatgcggatatcagtggcagtgtgaatgcgaactccgggacg18420

ctcagtaatgtgacgatagctgaaaactgtacgataaacggtacgctgagggcggaaaaa18480

atcgtcggggacattgtaaaggcggcgagcgcggcttttccgcgccagcgtgaaagcagt18540

gtggactggccgtcaggtacccgtactgtcaccgtgaccgatgaccatccttttgatcgc18600

cagatagtggtgcttccgctgacgtttcgcggaagtaagcgtactgtcagcggcaggaca18660

acgtattcgatgtgttatctgaaagtactgatgaacggtgcggtgatttatgatggcgcg18720

gcgaacgaggcggtacaggtgttctcccgtattgttgacatgccagcgggtcggggaaac18780

gtgatcctgacgttcacgcttacgtccacacggcattcggcagatattccgccgtatacg18840

tttgccagcgatgtgcaggttatggtgattaagaaacaggcgctgggcatcagcgtggtc18900

tgagtgtgttacagaggttcgtccgggaacgggcgttttattataaaacagtgagaggtg18960

aacgatgcgtaatgtgtgtattgccgttgctgtctttgccgcacttgcggtgacagtcac19020

tccggcccgtgcggaaggtggacatggtacgtttacggtgggctattttcaagtgaaacc19080

gggtacattgccgtcgttgtcgggcggggataccggtgtgagtcatctgaaagggattaa19140

cgtgaagtaccgttatgagctgacggacagtgtgggggtgatggcttccctggggttcgc19200

cgcgtcgaaaaagagcagcacagtgatgaccggggaggatacgtttcactatgagagcct19260

gcgtggacgttatgtgagcgtgatggccggaccggttttacaaatcagtaagcaggtcag19320

tgcgtacgccatggccggagtggctcacagtcggtggtccggcagtacaatggattaccg19380

taagacggaaatcactcccgggtatatgaaagagacgaccactgccagggacgaaagtgc19440

aatgcggcatacctcagtggcgtggagtgcaggtatacagattaatccggcagcgtccgt19500

cgttgttgatattgcttatgaaggctccggcagtggcgactggcgtactgacggattcat19560

cgttggggtcggttataaattctgattagccaggtaacacagtgttatgacagcccgccg19620

gaaccggtgggcttttttgtggggtgaatatggcagtaaagatttcaggagtcctgaaag19680

acggcacaggaaaaccggtacagaactgcaccattcagctgaaagccagacgtaacagca19740

ccacggtggtggtgaacacggtgggctcagagaatccggatgaagccgggcgttacagca19800

tggatgtggagtacggtcagtacagtgtcatcctgcaggttgacggttttccaccatcgc19860

acgccgggaccatcaccgtgtatgaagattcacaaccggggacgctgaatgattttctct19920

gtgccatgacggaggatgatgcccggccggaggtgctgcgtcgtcttgaactgatggtgg19980

aagaggtggcgcgtaacgcgtccgtggtggcacagagtacggcagacgcgaagaaatcag20040

ccggcgatgccagtgcatcagctgctcaggtcgcggcccttgtgactgatgcaactgact20100

cagcacgcgccgccagcacgtccgccggacaggctgcatcgtcagctcaggaagcgtcct20160

ccggcgcagaagcggcatcagcaaaggccactgaagcggaaaaaagtgccgcagccgcag20220

agtcctcaaaaaacgcggcggccaccagtgccggtgcggcgaaaacgtcagaaacgaatg20280

ctgcagcgtcacaacaatcagccgccacgtctgcctccaccgcggccacgaaagcgtcag20340

aggccgccacttcagcacgagatgcggtggcctcaaaagaggcagcaaaatcatcagaaa20400

cgaacgcatcatcaagtgccggtcgtgcagcttcctcggcaacggcggcagaaaattctg20460

ccagggcggcaaaaacgtccgagacgaatgccaggtcatctgaaacagcagcggaacgga20520

gcgcctctgccgcggcagacgcaaaaacagcggcggcggggagtgcgtcaacggcatcca20580

cgaaggcgacagaggctgcgggaagtgcggtatcagcatcgcagagcaaaagtgcggcag20640

aagcggcggcaatacgtgcaaaaaattcggcaaaacgtgcagaagatatagcttcagctg20700

tcgcgcttgaggatgcggacacaacgagaaaggggatagtgcagctcagcagtgcaacca20760

acagcacgtctgaaacgcttgctgcaacgccaaaggcggttaaggtggtaatggatgaaa20820

cgaacagaaaagcccactggacagtccggcactgaccggaacgccaacagcaccaaccgc20880

gctcaggggaacaaacaatacccagattgcgaacaccgcttttgtactggccgcgattgc20940

agatgttatcgacgcgtcacctgacgcactgaatacgctgaatgaactggccgcagcgct21000

cgggaatgatccagattttgctaccaccatgactaacgcgcttgcgggtaaacaaccgaa21060

gaatgcgacactgacggcgctggcagggctttccacggcgaaaaataaattaccgtattt21120

tgcggaaaatgatgccgccagcctgactgaactgactcaggttggcagggatattctggc21180

aaaaaattccgttgcagatgttcttgaataccttggggccggtgagaattcggcctttcc21240

ggcaggtgcgccgatcccgtggccatcagatatcgttccgtctggctacgtcctgatgca21300

ggggcaggcgtttgacaaatcagcctacccaaaacttgctgtcgcgtatccatcgggtgt21360

gcttcctgatatgcgaggctggacaatcaaggggaaacccgccagcggtcgtgctgtatt21420

gtctcaggaacaggatggaattaagtcgcacacccacagtgccagtgcatccggtacgga21480

tttggggacgaaaaccacatcgtcgtttgattacgggacgaaaacaacaggcagtttcga21540

ttacggcaccaaatcgacgaataacacgggggctcatgctcacagtctgagcggttcaac21600

aggggccgcgggtgctcatgcccacacaagtggtttaaggatgaacagttctggctggag21660

tcagtatggaacagcaaccattacaggaagtttatccacagttaaaggaaccagcacaca21720

gggtattgcttatttatcgaaaacggacagtcagggcagccacagtcactcattgtccgg21780

tacagccgtgagtgccggtgcacatgcgcatacagttggtattggtgcgcaccagcatcc21840

ggttgttatcggtgctcatgcccattctttcagtattggttcacacggacacaccatcac21900

cgttaacgctgcgggtaacgcggaaaacaccgtcaaaaacattgcatttaactatattgt21960

gaggcttgcataatggcattcagaatgagtgaacaaccacggaccataaaaatttataat22020

ctgctggccggaactaatgaatttattggtgaaggtgacgcatatattccgcctcatacc22080

ggtctgcctgcaaacagtaccgatattgcaccgccagatattccggctggctttgtggct22140

gttttcaacagtgatgaggcatcgtggcatctcgttgaagaccatcggggtaaaaccgtc22200

tatgacgtggcttccggcgacgcgttatttatttctgaactcggtccgttaccggaaaat22260

tttacctggttatcgccgggaggggaatatcagaagtggaacggcacagcctgggtgaag22320

gatacggaagcagaaaaactgttccggatccgggaggcggaagaaacaaaaaaaagcctg22380

atgcaggtagccagtgagcatattgcgccgcttcaggatgctgcagatctggaaattgca22440

acgaaggaagaaacctcgttgctggaagcctggaagaagtatcgggtgttgctgaaccgt22500

gttgatacatcaactgcacctgatattgagtggcctgctgtccctgttatggagtaatcg22560

ttttgtgatatgccgcagaaacgttgtatgaaataacgttctgcggttagttagtatatt22620

gtaaagctgagtattggtttatttggcgattattatcttcaggagaataatggaagttct22680

atgactcaattgttcatagtgtttacatcaccgccaattgcttttaagactgaacgcatg22740

aaatatggtttttcgtcatgttttgagtctgctgttgatatttctaaagtcggttttttt22800

tcttcgttttctctaactattttccatgaaatacatttttgattattatttgaatcaatt22860

ccaattacctgaagtctttcatctataattggcattgtatgtattggtttattggagtag22920

atgcttgcttttctgagccatagctctgatatccaaatgaagccataggcatttgttatt22980

ttggctctgtcagctgcataacgccaaaaaatatatttatctgcttgatcttcaaatgtt23040

gtattgattaaatcaattggatggaattgtttatcataaaaaattaatgtttgaatgtga23100

taaccgtcctttaaaaaagtcgtttctgcaagcttggctgtatagtcaactaactcttct23160

gtcgaagtgatatttttaggcttatctaccagttttagacgctctttaatatcttcagga23220

attattttattgtcatattgtatcatgctaaatgacaatttgcttatggagtaatctttt23280

aattttaaataagttattctcctggcttcatcaaataaagagtcgaatgatgttggcgaa23340

atcacatcgtcacccattggattgtttatttgtatgccaagagagttacagcagttatac23400

attctgccatagattatagctaaggcatgtaataattcgtaatcttttagcgtattagcg23460

acccatcgtctttctgatttaataatagatgattcagttaaatatgaaggtaatttcttt23520

tgtgcaagtctgactaacttttttataccaatgtttaacatactttcatttgtaataaac23580

tcaatgtcattttcttcaatgtaagatgaaataagagtagcctttgcctcgctatacatt23640

tctaaatcgccttgtttttctatcgtattgcgagaatttttagcccaagccattaatgga23700

tcatttttccatttttcaataacattattgttataccaaatgtcatatcctataatctgg23760

tttttgtttttttgaataataaatgttactgttcttgcggtttggaggaattgattcaaa23820

ttcaagcgaaataattcagggtcaaaatatgtatcaatgcagcatttgagcaagtgcgat23880

aaatctttaagtcttctttcccatggttttttagtcataaaactctccattttgataggt23940

tgcatgctagatgctgatatattttagaggtgataaaattaactgcttaactgtcaatgt24000

aatacaagttgtttgatctttgcaatgattcttatcagaaaccatatagtaaattagtta24060

cacaggaaatttttaatattattattatcattcattatgtattaaaattagagttgtggc24120

ttggctctgctaacacgttgctcataggagatatggtagagccgcagacacgtcgtatgc24180

aggaacgtgctgcggctggctggtgaacttccgatagtgcgggtgttgaatgatttccag24240

ttgctaccgattttacatattttttgcatgagagaatttgtaccacctcccaccgaccat24300

ctatgactgtacgccactgtccctaggactgctatgtgccggagcggacattacaaacgt24360

ccttctcggtgcatgccactgttgccaatgacctgcctaggaattggttagcaagttact24420

accggattttgtaaaaacagccctcctcatataaaaagtattcgttcacttccgataagc24480

gtcgtaattttctatctttcatcatattctagatccctctgaaaaaatcttccgagtttg24540

ctaggcactgatacataactcttttccaataattggggaagtcattcaaatctataatag24600

gtttcagatttgcttcaataaattctgactgtagctgctgaaacgttgcggttgaactat24660

atttccttataacttttacgaaagagtttctttgagtaatcacttcactcaagtgcttcc24720

ctgcctccaaacgatacctgttagcaatatttaatagcttgaaatgatgaagagctctgt24780

gtttgtcttcctgcctccagttcgccgggcattcaacataaaaactgatagcacccggag24840

ttccggaaacgaaatttgcatatacccattgctcacgaaaaaaaatgtccttgtcgatat24900

agggatgaatcgcttggtgtacctcatctactgcgaaaacttgacctttctctcccatat24960

tgcagtcgcggcacgatggaactaaattaataggcatcaccgaaaattcaggataatgtg25020

caataggaagaaaatgatctatattttttgtctgtcctatatcaccacaaaatggacatt25080

tttcacctgatgaaacaagcatgtcatcgtaatatgttctagcgggtttgtttttatctc25140

ggagattattttcataaagcttttctaatttaacctttgtcaggttaccaactactaagg25200

ttgtaggctcaagagggtgtgtcctgtcgtaggtaaataactgacctgtcgagcttaata25260

ttctatattgttgttctttctgcaaaaaagtggggaagtgagtaatgaaattatttctaa25320

catttatctgcatcataccttccgagcatttattaagcatttcgctataagttctcgctg25380

gaagaggtagttttttcattgtactttaccttcatctctgttcattatcatcgcttttaa25440

aacggttcgaccttctaatcctatctgaccattataattttttagaatggtttcataaga25500

aagctctgaatcaacggactgcgataataagtggtggtatccagaatttgtcacttcaag25560

taaaaacacctcacgagttaaaacacctaagttctcaccgaatgtctcaatatccggacg25620

gataatatttattgcttctcttgaccgtaggactttccacatgcaggattttggaacctc25680

ttgcagtactactggggaatgagttgcaattattgctacaccattgcgtgcatcgagtaa25740

gtcgcttaatgttcgtaaaaaagcagagagcaaaggtggatgcagatgaacctctggttc25800

atcgaataaaactaatgacttttcgccaacgacatctactaatcttgtgatagtaaataa25860

aacaattgcatgtccagagctcattcgaagcagatatttctggatattgtcataaaacaa25920

tttagtgaatttatcatcgtccacttgaatctgtggttcattacgtcttaactcttcata25980

tttagaaatgaggctgatgagttccatatttgaaaagttttcatcactacttagtttttt26040

gatagcttcaagccagagttgtctttttctatctactctcatacaaccaataaatgctga26100

aatgaattctaagcggagatcgcctagtgattttaaactattgctggcagcattcttgag26160

tccaatataaaagtattgtgtaccttttgctgggtcaggttgttctttaggaggagtaaa26220

aggatcaaatgcactaaacgaaactgaaacaagcgatcgaaaatatccctttgggattct26280

tgactcgataagtctattattttcagagaaaaaatattcattgttttctgggttggtgat26340

tgcaccaatcattccattcaaaattgttgttttaccacacccattccgcccgataaaagc26400

atgaatgttcgtgctgggcatagaattaaccgtcacctcaaaaggtatagttaaatcact26460

gaatccgggagcactttttctattaaatgaaaagtggaaatctgacaattctggcaaacc26520

atttaacacacgtgcgaactgtccatgaatttctgaaagagttacccctctaagtaatga26580

ggtgttaaggacgctttcattttcaatgtcggctaatcgatttggccatactactaaatc26640

ctgaatagctttaagaaggttatgtttaaaaccatcgcttaatttgctgagattaacata26700

gtagtcaatgctttcacctaaggaaaaaaacatttcagggagttgactgaattttttatc26760

tattaatgaataagtgcttacttcttctttttgacctacaaaaccaattttaacatttcc26820

gatatcgcatttttcaccatgctcatcaaagacagtaagataaaacattgtaacaaagga26880

atagtcattccaaccatctgctcgtaggaatgccttatttttttctactgcaggaatata26940

cccgcctctttcaataacactaaactccaacatatagtaacccttaattttattaaaata27000

accgcaatttatttggcggcaacacaggatctctcttttaagttactctctattacatac27060

gttttccatctaaaaattagtagtattgaacttaacggggcatcgtattgtagttttcca27120

tatttagctttctgcttccttttggataacccactgttattcatgttgcatggtgcactg27180

tttataccaacgatatagtctattaatgcatatatagtatcgccgaacgattagctcttc27240

aggcttctgaagaagcgtttcaagtactaataagccgatagatagccacggacttcgtag27300

ccatttttcataagtgttaacttccgctcctcgctcataacagacattcactacagttat27360

ggcggaaaggtatgcatgctgggtgtggggaagtcgtgaaagaaaagaagtcagctgcgt27420

cgtttgacatcactgctatcttcttactggttatgcaggtcgtagtgggtggcacacaaa27480

gctttgcactggattgcgaggctttgtgcttctctggagtgcgacaggtttgatgacaaa27540

aaattagcgcaagaagacaaaaatcaccttgcgctaatgctctgttacaggtcactaata27600

ccatctaagtagttgattcatagtgactgcatatgttgtgttttacagtattatgtagtc27660

tgttttttatgcaaaatctaatttaatatattgatatttatatcattttacgtttctcgt27720

tcagcttttttatactaagttggcattataaaaaagcattgcttatcaatttgttgcaac27780

gaacaggtcactatcagtcaaaataaaatcattatttgatttcaattttgtcccactccc27840

tgcctctgtcatcacgatactgtgatgccatggtgtccgacttatgcccgagaagatgtt27900

gagcaaacttatcgcttatctgcttctcatagagtcttgcagacaaactgcgcaactcgt27960

gaaaggtaggcggatccccttcgaaggaaagacctgatgcttttcgtgcgcgcataaaat28020

accttgatactgtgccggatgaaagcggttcgcgacgagtagatgcaattatggtttctc28080

cgccaagaatctctttgcatttatcaagtgtttccttcattgatattccgagagcatcaa28140

tatgcaatgctgttgggatggcaatttttacgcctgttttgctttgctcgacataaagat28200

atccatctacgatatcagaccacttcatttcgcataaatcaccaactcgttgcccggtaa28260

caacagccagttccattgcaagtctgagccaacatggtgatgattctgctgcttgataaa28320

ttttcaggtattcgtcagccgtaagtcttgatctccttacctctgattttgctgcgcgag28380

tggcagcgacatggtttgttgttatatggccttcagctattgcctctcggaatgcatcgc28440

tcagtgttgatctgattaacttggctgacgccgccttgccctcgtctatgtatccattga28500

gcattgccgcaatttcttttgtggtgatgtcttcaagtggagcatcaggcagacccctcc28560

ttattgctttaattttgctcatgtaatttatgagtgtcttctgcttgattcctctgctgg28620

ccaggattttttcgtagcgatcaagccatgaatgtaacgtaacggaattatcactgttga28680

ttctcgctgtcagaggcttgtgtttgtgtcctgaaaataactcaatgttggcctgtatag28740

cttcagtgattgcgattcgcctgtctctgcctaatccaaactctttacccgtccttgggt28800

ccctgtagcagtaatatccattgtttcttatataaaggttagggggtaaatcccggcgct28860

catgacttcgccttcttcccatttctgatcctcttcaaaaggccacctgttactggtcga28920

tttaagtcaacctttaccgctgattcgtggaacagatactctcttccatccttaaccgga28980

ggtgggaatatcctgcattcccgaacccatcgacgaactgtttcaaggcttcttggacgt29040

cgctggcgtgcgttccactcctgaagtgtcaagtacatcgcaaagtctccgcaattacac29100

gcaagaaaaaaccgccatcaggcggcttggtgttctttcagttcttcaattcgaatattg29160

gttacgtctgcatgtgctatctgcgcccatatcatccagtggtcgtagcagtcgttgatg29220

ttctccgcttcgataactctgttgaatggctctccattccattctcctgtgactcggaag29280

tgcatttatcatctccataaaacaaaacccgccgtagcgagttcagataaaataaatccc29340

cgcgagtgcgaggattgttatgtaatattgggtttaatcatctatatgttttgtacagag29400

agggcaagtatcgtttccaccgtactcgtgataataattttgcacggtatcagtcatttc29460

tcgcacattgcagaatggggatttgtcttcattagacttataaaccttcatggaatattt29520

gtatgccgactctatatctataccttcatctacataaacaccttcgtgatgtctgcatgg29580

agacaagacaccggatctgcacaacattgataacgcccaatctttttgctcagactctaa29640

ctcattgatactcatttataaactccttgcaatgtatgtcgtttcagctaaacggtatca29700

gcaatgtttatgtaaagaaacagtaagataatactcaacccgatgtttgagtacggtcat29760

catctgacactacagactctggcatcgctgtgaagacgacgcgaaattcagcattttcac29820

aagcgttatcttttacaaaaccgatctcactctcctttgatgcgaatgccagcgtcagac29880

atcatatgcagatactcacctgcatcctgaacccattgacctccaaccccgtaatagcga29940

tgcgtaatgatgtcgatagttactaacgggtcttgttcgattaactgccgcagaaactct30000

tccaggtcaccagtgcagtgcttgataacaggagtcttcccaggatggcgaacaacaaga30060

aactggtttccgtcttcacggacttcgttgctttccagtttagcaatacgcttactccca30120

tccgagataacaccttcgtaatactcacgctgctcgttgagttttgattttgctgtttca30180

agctcaacacgcagtttccctactgttagcgcaatatcctcgttctcctggtcgcggcgt30240

ttgatgtattgctggtttctttcccgttcatccagcagttccagcacaatcgatggtgtt30300

accaattcatggaaaaggtctgcgtcaaatccccagtcgtcatgcattgcctgctctgcc30360

gcttcacgcagtgcctgagagttaatttcgctcacttcgaacctctctgtttactgataa30420

gttccagatcctcctggcaacttgcacaagtccgacaaccctgaacgaccaggcgtcttc30480

gttcatctatcggatcgccacactcacaacaatgagtggcagatatagcctggtggttca30540

ggcggcgcatttttattgctgtgttgcgctgtaattcttctatttctgatgctgaatcaa30600

tgatgtctgccatctttcattaatccctgaactgttggttaatacgcttgagggtgaatg30660

cgaataataaaaaaggagcctgtagctccctgatgattttgcttttcatgttcatcgttc30720

cttaaagacgccgtttaacatgccgattgccaggcttaaatgagtcggtgtgaatcccat30780

cagcgttaccgtttcgcggtgcttcttcagtacgctacggcaaatgtcatcgacgttttt30840

atccggaaactgctgtctggctttttttgatttcagaattagcctgacgggcaatgctgc30900

gaagggcgttttcctgctgaggtgtcattgaacaagtcccatgtcggcaagcataagcac30960

acagaatatgaagcccgctgccagaaaaatgcattccgtggttgtcatacctggtttctc31020

tcatctgcttctgctttcgccaccatcatttccagcttttgtgaaagggatgcggctaac31080

gtatgaaattcttcgtctgtttctactggtattggcacaaacctgattccaatttgagca31140

aggctatgtgccatctcgatactcgttcttaactcaacagaagatgctttgtgcatacag31200

cccctcgtttattatttatctcctcagccagccgctgtgctttcagtggatttcggataa31260

cagaaaggccgggaaatacccagcctcgctttgtaacggagtagacgaaagtgattgcgc31320

ctacccggatattatcgtgaggatgcgtcatcgccattgctccccaaatacaaaaccaat31380

ttcagccagtgcctcgtccattttttcgatgaactccggcacgatctcgtcaaaactcgc31440

catgtacttttcatcccgctcaatcacgacataatgcaggccttcacgcttcatacgcgg31500

gtcatagttggcaaagtaccaggcattttttcgcgtcacccacatgctgtactgcacctg31560

ggccatgtaagctgactttatggcctcgaaaccaccgagccggaacttcatgaaatcccg31620

ggaggtaaacgggcatttcagttcaaggccgttgccgtcactgcataaaccatcgggaga31680

gcaggcggtacgcatactttcgtcgcgatagatgatcggggattcagtaacattcacgcc31740

ggaagtgaattcaaacagggttctggcgtcgttctcgtactgttttccccaggccagtgc31800

tttagcgttaacttccggagccacaccggtgcaaacctcagcaagcagggtgtggaagta31860

ggacattttcatgtcaggccacttctttccggagcggggttttgctatcacgttgtgaac31920

ttctgaagcggtgatgacgccgagccgtaatttgtgccacgcatcatccccctgttcgac31980

agctctcacatcgatcccggtacgctgcaggataatgtccggtgtcatgctgccaccttc32040

tgctctgcggctttctgtttcaggaatccaagagcttttactgcttcggcctgtgtcagt32100

tctgacgatgcacgaatgtcgcggcgaaatatctgggaacagagcggcaataagtcgtca32160

tcccatgttttatccagggcgatcagcagagtgttaatctcctgcatggtttcatcgtta32220

accggagtgatgtcgcgttccggctgacgttctgcagtgtatgcagtattttcgacaatg32280

cgctcggcttcatccttgtcatagataccagcaaatccgaaggccagacgggcacactga32340

atcatggctttatgacgtaacatccgtttgggatgcgactgccacggccccgtgatttct32400

ctgccttcgcgagttttgaatggttcgcggcggcattcatccatccattcggtaacgcag32460

atcggatgattacggtccttgcggtaaatccggcatgtacaggattcattgtcctgctca32520

aagtccatgccatcaaactgctggttttcattgatgatgcgggaccagccatcaacgccc32580

accaccggaacgatgccattctgcttatcaggaaaggcgtaaatttctttcgtccacgga32640

ttaaggccgtactggttggcaacgatcagtaatgcgatgaactgcgcatcgctggcatca32700

cctttaaatgccgtctggcgaagagtggtgatcagttcctgtgggtcgacagaatccatg32760

ccgacacgttcagccagcttcccagccagcgttgcgagtgcagtactcattcgttttata32820

cctctgaatcaatatcaacctggtggtgagcaatggtttcaaccatgtaccggatgtgtt32880

ctgccatgcgctcctgaaactcaacatcgtcatcaaacgcacgggtaatggattttttgc32940

tggccccgtggcgttgcaaatgatcgatgcatagcgattcaaacaggtgctggggcaggc33000

ctttttccatgtcgtctgccagttctgcctctttctcttcacgggcgagctgctggtagt33060

gacgcgcccagctctgagcctcaagacgatcctgaatgtaataagcgttcatggctgaac33120

tcctgaaatagctgtgaaaatatcgcccgcgaaatgccgggctgattaggaaaacaggaa33180

agggggttagtgaatgcttttgcttgatctcagtttcagtattaatatccattttttata33240

agcgtcgacggcttcacgaaacatcttttcatcgccaataaaagtggcgatagtgaattt33300

agtctggatagccataagtgtttgatccattctttgggactcctggctgattaagtatgt33360

cgataaggcgtttccatccgtcacgtaatttacgggtgattcgttcaagtaaagattcgg33420

aagggcagccagcaacaggccaccctgcaatggcatattgcatggtgtgctccttattta33480

tacataacgaaaaacgcctcgagtgaagcgttattggtatgcggtaaaaccgcactcagg33540

cggccttgatagtcatatcatctgaatcaaatattcctgatgtatcgatatcggtaattc33600

ttattccttcgctaccatccattggaggccatccttcctgaccatttccatcattccagt33660

cgaactcacacacaacaccatatgcatttaagtcgcttgaaattgctataagcagagcat33720

gttgcgccagcatgattaatacagcatttaatacagagccgtgtttattgagtcggtatt33780

cagagtctgaccagaaattattaatctggtgaagtttttcctctgtcattacgtcatggt33840

cgatttcaatttctattgatgctttccagtcgtaatcaatgatgtattttttgatgtttg33900

acatctgttcatatcctcacagataaaaaatcgccctcacactggagggcaaagaagatt33960

tccaataatcagaacaagtcggctcctgtttagttacgagcgacattgctccgtgtattc34020

actcgttggaatgaatacacagtgcagtgtttattctgttatttatgccaaaaataaagg34080

ccactatcaggcagctttgttgttctgtttaccaagttctctggcaatcattgccgtcgt34140

tcgtattgcccatttatcgacatatttcccatcttccattacaggaaacatttcttcagg34200

cttaaccatgcattccgattgcagcttgcatccattgcatcgcttgaattgtccacacca34260

ttgatttttatcaatagtcgtagtcatacggatagtcctggtattgttccatcacatcct34320

gaggatgctcttcgaactcttcaaattcttcttccatatatcaccttaaatagtggattg34380

cggtagtaaagattgtgcctgtcttttaaccacatcaggctcggtggttctcgtgtaccc34440

ctacagcgagaaatcggataaactattacaacccctacagtttgatgagtatagaaatgg34500

atccactcgttattctcggacgagtgttcagtaatgaacctctggagagaaccatgtata34560

tgatcgttatctgggttggacttctgcttttaagcccagataactggcctgaatatgtta34620

atgagagaatcggtattcctcatgtgtggcatgttttcgtctttgctcttgcattttcgc34680

tagcaattaatgtgcatcgattatcagctattgccagcgccagatataagcgatttaagc34740

taagaaaacgcattaagatgcaaaacgataaagtgcgatcagtaattcaaaaccttacag34800

aagagcaatctatggttttgtgcgcagcccttaatgaaggcaggaagtatgtggttacat34860

caaaacaattcccatacattagtgagttgattgagcttggtgtgttgaacaaaacttttt34920

cccgatggaatggaaagcatatattattccctattgaggatatttactggactgaattag34980

ttgccagctatgatccatataatattgagataaagccaaggccaatatctaagtaactag35040

ataagaggaatcgattttcccttaattttctggcgtccactgcatgttatgccgcgttcg35100

ccaggcttgctgtaccatgtgcgctgattcttgcgctcaatacgttgcaggttgctttca35160

atctgtttgtggtattcagccagcactgtaaggtctatcggatttagtgcgctttctact35220

cgtgatttcggtttgcgattcagcgagagaatagggcggttaactggttttgcgcttacc35280

ccaaccaacaggggatttgctgctttccattgagcctgtttctctgcgcgacgttcgcgg35340

cggcgtgtttgtgcatccatctggattctcctgtcagttagctttggtggtgtgtggcag35400

ttgtagtcctgaacgaaaaccccccgcgattggcacattggcagctaatccggaatcgca35460

cttacggccaatgcttcgtttcgtatcacacaccccaaagccttctgctttgaatgctgc35520

ccttcttcagggcttaatttttaagagcgtcaccttcatggtggtcagtgcgtcctgctg35580

atgtgctcagtatcaccgccagtggtatttatgtcaacaccgccagagataatttatcac35640

cgcagatggttatctgtatgttttttatatgaatttattttttgcaggggggcattgttt35700

ggtaggtgagagatctgaattgctatgtttagtgagttgtatctatttatttttcaataa35760

atacaattggttatgtgttttgggggcgatcgtgaggcaaagaaaacccggcgctgaggc35820

cgggttattcttgttctctggtcaaattatatagttggaaaacaaggatgcatatatgaa35880

tgaacgatgcagaggcaatgccgatggcgatagtgggtatcatgtagccgcttatgctgg35940

aaagaagcaataacccgcagaaaaacaaagctccaagctcaacaaaactaagggcataga36000

caataactaccgatgtcatatacccatactctctaatcttggccagtcggcgcgttctgc36060

ttccgattagaaacgtcaaggcagcaatcaggattgcaatcatggttcctgcatatgatg36120

acaatgtcgccccaagaccatctctatgagctgaaaaagaaacaccaggaatgtagtggc36180

ggaaaaggagatagcaaatgcttacgataacgtaaggaattattactatgtaaacaccag36240

gcatgattctgttccgcataattactcctgataattaatccttaactttgcccacctgcc36300

ttttaaaacattccagtatatcacttttcattcttgcgtagcaatatgccatctcttcag36360

ctatctcagcattggtgaccttgttcagaggcgctgagagatggcctttttctgatagat36420

aatgttctgttaaaatatctccggcctcatcttttgcccgcaggctaatgtctgaaaatt36480

gaggtgacgggttaaaaataatatccttggcaaccttttttatatcccttttaaattttg36540

gcttaatgactatatccaatgagtcaaaaagctccccttcaatatctgttgcccctaaga36600

cctttaatatatcgccaaatacaggtagcttggcttctaccttcaccgttgttcggccga36660

tgaaatgcatatgcataacatcgtctttggtggttcccctcatcagtggctctatctgaa36720

cgcgctctccactgcttaatgacattcctttcccgattaaaaaatctgtcagatcggatg36780

tggtcggcccgaaaacagttctggcaaaaccaatggtgtcgccttcaacaaacaaaaaag36840

atgggaatcccaatgattcgtcatctgcgaggctgttcttaatatcttcaactgaagctt36900

tagagcgatttatcttctgaaccagactcttgtcatttgttttggtaaagagaaaagttt36960

ttccatcgattttatgaatatacaaataattggagccaacctgcaggtgatgattatcag37020

ccagcagagaattaaggaaaacagacaggtttattgagcgcttatctttccctttatttt37080

tgctgcggtaagtcgcataaaaaccattcttcataattcaatccatttactatgttatgt37140

tctgaggggagtgaaaattcccctaattcgatgaagattcttgctcaattgttatcagct37200

atgcgccgaccagaacaccttgccgatcagccaaacgtctcttcaggccactgactagcg37260

ataactttccccacaacggaacaactctcattgcatgggatcattgggtactgtgggttt37320

agtggttgtaaaaacacctgaccgctatccctgatcagtttcttgaaggtaaactcatca37380

cccccaagtctggctatgcagaaatcacctggctcaacagcctgctcagggtcaacgaga37440

attaacattccgtcaggaaagcttggcttggagcctgttggtgcggtcatggaattacct37500

tcaacctcaagccagaatgcagaatcactggcttttttggttgtgcttacccatctctcc37560

gcatcacctttggtaaaggttctaagctcaggtgagaacatccctgcctgaacatgagaa37620

aaaacagggtactcatactcacttctaagtgacggctgcatactaaccgcttcatacatc37680

tcgtagatttctctggcgattgaagggctaaattcttcaacgctaactttgagaattttt37740

gcaagcaatgcggcgttataagcatttaatgcattgatgccattaaataaagcaccaacg37800

cctgactgccccatccccatcttgtctgcgacagattcctgggataagccaagttcattt37860

ttctttttttcataaattgctttaaggcgacgtgcgtcctcaagctgctcttgtgttaat37920

ggtttcttttttgtgctcatacgttaaatctatcaccgcaagggataaatatctaacacc37980

gtgcgtgttgactattttacctctggcggtgataatggttgcatgtactaaggaggttgt38040

atggaacaacgcataaccctgaaagattatgcaatgcgctttgggcaaaccaagacagct38100

aaagatctcggcgtatatcaaagcgcgatcaacaaggccattcatgcaggccgaaagatt38160

tttttaactataaacgctgatggaagcgtttatgcggaagaggtaaagcccttcccgagt38220

aacaaaaaaacaacagcataaataaccccgctcttacacattccagccctgaaaaagggc38280

atcaaattaaaccacacctatggtgtatgcatttatttgcatacattcaatcaattgtta38340

tctaaggaaatacttacatatggttcgtgcaaacaaacgcaacgaggctctacgaatcga38400

gagtgcgttgcttaacaaaatcgcaatgcttggaactgagaagacagcggaagctgtggg38460

cgttgataagtcgcagatcagcaggtggaagagggactggattccaaagttctcaatgct38520

gcttgctgttcttgaatggggggtcgttgacgacgacatggctcgattggcgcgacaagt38580

tgctgcgattctcaccaataaaaaacgcccggcggcaaccgagcgttctgaacaaatcca38640

gatggagttctgaggtcattactggatctatcaacaggagtcattatgacaaatacagca38700

aaaatactcaacttcggcagaggtaactttgccggacaggagcgtaatgtggcagatctc38760

gatgatggttacgccagactatcaaatatgctgcttgaggcttattcgggcgcagatctg38820

accaagcgacagtttaaagtgctgcttgccattctgcgtaaaacctatgggtggaataaa38880

ccaatggacagaatcaccgattctcaacttagcgagattacaaagttacctgtcaaacgg38940

tgcaatgaagccaagttagaactcgtcagaatgaatattatcaagcagcaaggcggcatg39000

tttggaccaaataaaaacatctcagaatggtgcatccctcaaaacgagggaaaatcccct39060

aaaacgagggataaaacatccctcaaattgggggattgctatccctcaaaacagggggac39120

acaaaagacactattacaaaagaaaaaagaaaagattattcgtcagagaattctggcgaa39180

tcctctgaccagccagaaaacgacctttctgtggtgaaaccggatgctgcaattcagagc39240

ggcagcaagtgggggacagcagaagacctgaccgccgcagagtggatgtttgacatggtg39300

aagactatcgcaccatcagccagaaaaccgaattttgctgggtgggctaacgatatccgc39360

ctgatgcgtgaacgtgacggacgtaaccaccgcgacatgtgtgtgctgttccgctgggca39420

tgccaggacaacttctggtccggtaacgtgctgagcccggccaaactccgcgataagtgg39480

acccaactcgaaatcaaccgtaacaagcaacaggcaggcgtgacagccagcaaaccaaaa39540

ctcgacctgacaaacacagactggatttacggggtggatctatgaaaaacatcgccgcac39600

agatggttaactttgaccgtgagcagatgcgtcggatcgccaacaacatgccggaacagt39660

acgacgaaaagccgcaggtacagcaggtagcgcagatcatcaacggtgtgttcagccagt39720

tactggcaactttcccggcgagcctggctaaccgtgaccagaacgaagtgaacgaaatcc39780

gtcgccagtgggttctggcttttcgggaaaacgggatcaccacgatggaacaggttaacg39840

caggaatgcgcgtagcccgtcggcagaatcgaccatttctgccatcacccgggcagtttg39900

ttgcatggtgccgggaagaagcatccgttaccgccggactgccaaacgtcagcgagctgg39960

ttgatatggtttacgagtattgccggaagcgaggcctgtatccggatgcggagtcttatc40020

cgtggaaatcaaacgcgcactactggctggttaccaacctgtatcagaacatgcgggcca40080

atgcgcttactgatgcggaattacgccgtaaggccgcagatgagcttgtccatatgactg40140

cgagaattaaccgtggtgaggcgatccctgaaccagtaaaacaacttcctgtcatgggcg40200

gtagacctctaaatcgtgcacaggctctggcgaagatcgcagaaatcaaagctaagttcg40260

gactgaaaggagcaagtgtatgacgggcaaagaggcaattattcattacctggggacgca40320

taatagcttctgtgcgccggacgttgccgcgctaacaggcgcaacagtaaccagcataaa40380

tcaggccgcggctaaaatggcacgggcaggtcttctggttatcgaaggtaaggtctggcg40440

aacggtgtattaccggtttgctaccagggaagaacgggaaggaaagatgagcacgaacct40500

ggtttttaaggagtgtcgccagagtgccgcgatgaaacgggtattggcggtatatggagt40560

taaaagatgaccatctacattactgagctaataacaggcctgctggtaatcgcaggcctt40620

tttatttgggggagagggaagtcatgaaaaaactaacctttgaaattcgatctccagcac40680

atcagcaaaacgctattcacgcagtacagcaaatccttccagacccaaccaaaccaatcg40740

tagtaaccattcaggaacgcaaccgcagcttagaccaaaacaggaagctatgggcctgct40800

taggtgacgtctctcgtcaggttgaatggcatggtcgctggctggatgcagaaagctgga40860

agtgtgtgtttaccgcagcattaaagcagcaggatgttgttcctaaccttgccgggaatg40920

gctttgtggtaataggccagtcaaccagcaggatgcgtgtaggcgaatttgcggagctat40980

tagagcttatacaggcattcggtacagagcgtggcgttaagtggtcagacgaagcgagac41040

tggctctggagtggaaagcgagatggggagacagggctgcatgataaatgtcgttagttt41100

ctccggtggcaggacgtcagcatatttgctctggctaatggagcaaaagcgacgggcagg41160

taaagacgtgcattacgttttcatggatacaggttgtgaacatccaatgacatatcggtt41220

tgtcagggaagttgtgaagttctgggatataccgctcaccgtattgcaggttgatatcaa41280

cccggagcttggacagccaaatggttatacggtatgggaaccaaaggatattcagacgcg41340

aatgcctgttctgaagccatttatcgatatggtaaagaaatatggcactccatacgtcgg41400

cggcgcgttctgcactgacagattaaaactcgttcccttcaccaaatactgtgatgacca41460

tttcgggcgagggaattacaccacgtggattggcatcagagctgatgaaccgaagcggct41520

aaagccaaagcctggaatcagatatcttgctgaactgtcagactttgagaaggaagatat41580

cctcgcatggtggaagcaacaaccattcgatttgcaaataccggaacatctcggtaactg41640

catattctgcattaaaaaatcaacgcaaaaaatcggacttgcctgcaaagatgaggaggg41700

attgcagcgtgtttttaatgaggtcatcacgggatcccatgtgcgtgacggacatcggga41760

aacgccaaaggagattatgtaccgaggaagaatgtcgctggacggtatcgcgaaaatgta41820

ttcagaaaatgattatcaagccctgtatcaggacatggtacgagctaaaagattcgatac41880

cggctcttgttctgagtcatgcgaaatatttggagggcagcttgatttcgacttcgggag41940

ggaagctgcatgatgcgatgttatcggtgcggtgaatgcaaagaagataaccgcttccga42000

ccaaatcaaccttactggaatcgatggtgtctccggtgtgaaagaacaccaacaggggtg42060

ttaccactaccgcaggaaaaggaggacgtgtggcgagacagcgacgaagtatcaccgaca42120

taatctgcgaaaactgcaaataccttccaacgaaacgcaccagaaataaacccaagccaa42180

tcccaaaagaatctgacgtaaaaaccttcaactacacggctcacctgtgggatatccggt42240

ggctaagacgtcgtgcgaggaaaacaaggtgattgaccaaaatcgaagttacgaacaaga42300

aagcgtcgagcgagctttaacgtgcgctaactgcggtcagaagctgcatgtgctggaagt42360

tcacgtgtgtgagcactgctgcgcagaactgatgagcgatccgaatagctcgatgcacga42420

ggaagaagatgatggctaaaccagcgcgaagacgatgtaaaaacgatgaatgccgggaat42480

ggtttcaccctgcattcgctaatcagtggtggtgctctccagagtgtggaaccaagatag42540

cactcgaacgacgaagtaaagaacgcgaaaaagcggaaaaagcagcagagaagaaacgac42600

gacgagaggagcagaaacagaaagataaacttaagattcgaaaactcgccttaaagcccc42660

gcagttactggattaaacaagcccaacaagccgtaaacgccttcatcagagaaagagacc42720

gcgacttaccatgtatctcgtgcggaacgctcacgtctgctcagtgggatgccggacatt42780

accggacaactgctgcggcacctcaactccgatttaatgaacgcaatattcacaagcaat42840

gcgtggtgtgcaaccagcacaaaagcggaaatctcgttccgtatcgcgtcgaactgatta42900

gccgcatcgggcaggaagcagtagacgaaatcgaatcaaaccataaccgccatcgctgga42960

ctatcgaagagtgcaaggcgatcaaggcagagtaccaacagaaactcaaagacctgcgaa43020

atagcagaagtgaggccgcatgacgttctcagtaaaaaccattccagacatgctcgttga43080

agcatacggaaatcagacagaagtagcacgcagactgaaatgtagtcgcggtacggtcag43140

aaaatacgttgatgataaagacgggaaaatgcacgccatcgtcaacgacgttctcatggt43200

tcatcgcggatggagtgaaagagatgcgctattacgaaaaaattgatggcagcaaatacc43260

gaaatatttgggtagttggcgatctgcacggatgctacacgaacctgatgaacaaactgg43320

atacgattggattcgacaacaaaaaagacctgcttatctcggtgggcgatttggttgatc43380

gtggtgcagagaacgttgaatgcctggaattaatcacattcccctggttcagagctgtac43440

gtggaaaccatgagcaaatgatgattgatggcttatcagagcgtggaaacgttaatcact43500

ggctgcttaatggcggtggctggttctttaatctcgattacgacaaagaaattctggcta43560

aagctcttgcccataaagcagatgaacttccgttaatcatcgaactggtgagcaaagata43620

aaaaatatgttatctgccacgccgattatccctttgacgaatacgagtttggaaagccag43680

ttgatcatcagcaggtaatctggaaccgcgaacgaatcagcaactcacaaaacgggatcg43740

tgaaagaaatcaaaggcgcggacacgttcatctttggtcatacgccagcagtgaaaccac43800

tcaagtttgccaaccaaatgtatatcgataccggcgcagtgttctgcggaaacctaacat43860

tgattcaggtacagggagaaggcgcatgagactcgaaagcgtagctaaatttcattcgcc43920

aaaaagcccgatgatgagcgactcaccacgggccacggcttctgactctctttccggtac43980

tgatgtgatggctgctatggggatggcgcaatcacaagccggattcggtatggctgcatt44040

ctgcggtaagcacgaactcagccagaacgacaaacaaaaggctatcaactatctgatgca44100

atttgcacacaaggtatcggggaaataccgtggtgtggcaaagcttgaaggaaatactaa44160

ggcaaaggtactgcaagtgctcgcaacattcgcttatgcggattattgccgtagtgccgc44220

gacgccgggggcaagatgcagagattgccatggtacaggccgtgcggttgatattgccaa44280

aacagagctgtgggggagagttgtcgagaaagagtgcggaagatgcaaaggcgtcggcta44340

ttcaaggatgccagcaagcgcagcatatcgcgctgtgacgatgctaatcccaaaccttac44400

ccaacccacctggtcacgcactgttaagccgctgtatgacgctctggtggtgcaatgcca44460

caaagaagagtcaatcgcagacaacattttgaatgcggtcacacgttagcagcatgattg44520

ccacggatggcaacatattaacggcatgatattgacttattgaataaaattgggtaaatt44580

tgactcaacgatgggttaattcgctcgttgtggtagtgagatgaaaagaggcggcgctta44640

ctaccgattccgcctagttggtcacttcgacgtatcgtctggaactccaaccatcgcagg44700

cagagaggtctgcaaaatgcaatcccgaaacagttcgcaggtaatagttagagcctgcat44760

aacggtttcgggattttttatatctgcacaacaggtaagagcattgagtcgataatcgtg44820

aagagtcggcgagcctggttagccagtgctctttccgttgtgctgaattaagcgaatacc44880

ggaagcagaaccggatcaccaaatgcgtacaggcgtcatcgccgcccagcaacagcacaa44940

cccaaactgagccgtagccactgtctgtcctgaattcattagtaatagttacgctgcggc45000

cttttacacatgaccttcgtgaaagcgggtggcaggaggtcgcgctaacaacctcctgcc45060

gttttgcccgtgcatatcggtcacgaacaaatctgattactaaacacagtagcctggatt45120

tgttctatcagtaatcgaccttattcctaattaaatagagcaaatccccttattgggggt45180

aagacatgaagatgccagaaaaacatgacctgttggccgccattctcgcggcaaaggaac45240

aaggcatcggggcaatccttgcgtttgcaatggcgtaccttcgcggcagatataatggcg45300

gtgcgtttacaaaaacagtaatcgacgcaacgatgtgcgccattatcgcctggttcattc45360

gtgaccttctcgacttcgccggactaagtagcaatctcgcttatataacgagcgtgttta45420

tcggctacatcggtactgactcgattggttcgcttatcaaacgcttcgctgctaaaaaag45480

ccggagtagaagatggtagaaatcaataatcaacgtaaggcgttcctcgatatgctggcg45540

tggtcggagggaactgataacggacgtcagaaaaccagaaatcatggttatgacgtcatt45600

gtaggcggagagctatttactgattactccgatcaccctcgcaaacttgtcacgctaaac45660

ccaaaactcaaatcaacaggcgccggacgctaccagcttctttcccgttggtgggatgcc45720

taccgcaagcagcttggcctgaaagacttctctccgaaaagtcaggacgctgtggcattg45780

cagcagattaaggagcgtggcgctttacctatgattgatcgtggtgatatccgtcaggca45840

atcgaccgttgcagcaatatctgggcttcactgccgggcgctggttatggtcagttcgag45900

cataaggctgacagcctgattgcaaaattcaaagaagcgggcggaacggtcagagagatt45960

gatgtatgagcagagtcaccgcgattatctccgctctggttatctgcatcatcgtctgcc46020

tgtcatgggctgttaatcattaccgtgataacgccattacctacaaagcccagcgcgaca46080

aaaatgccagagaactgaagctggcgaacgcggcaattactgacatgcagatgcgtcagc46140

gtgatgttgctgcgctcgatgcaaaatacacgaaggagttagctgatgctaaagctgaaa46200

atgatgctctgcgtgatgatgttgccgctggtcgtcgtcggttgcacatcaaagcagtct46260

gtcagtcagtgcgtgaagccaccaccgcctccggcgtggataatgcagcctccccccgac46320

tggcagacaccgctgaacgggattatttcaccctcagagagaggctgatcactatgcaaa46380

aacaactggaaggaacccagaagtatattaatgagcagtgcagatagagttgcccatatc46440

gatgggcaactcatgcaattattgtgagcaatacacacgcgcttccagcggagtataaat46500

gcctaaagtaataaaaccgagcaatccatttacgaatgtttgctgggtttctgttttaac46560

aacattttctgcgccgccacaaattttggctgcatcgacagttttcttctgcccaattcc46620

agaaacgaagaaatgatgggtgatggtttcctttggtgctactgctgccggtttgttttg46680

aacagtaaacgtctgttgagcacatcctgtaataagcagggccagcgcagtagcgagtag46740

catttttttcatggtgttattcccgatgctttttgaagttcgcagaatcgtatgtgtaga46800

aaattaaacaaaccctaaacaatgagttgaaatttcatattgttaatatttattaatgta46860

tgtcaggtgcgatgaatcgtcattgtattcccggattaactatgtccacagccctgacgg46920

ggaacttctctgcgggagtgtccgggaataattaaaacgatgcacacagggtttagcgcg46980

tacacgtattgcattatgccaacgccccggtgctgacacggaagaaaccggacgttatga47040

tttagcgtggaaagatttgtgtagtgttctgaatgctctcagtaaatagtaatgaattat47100

caaaggtatagtaatatcttttatgttcatggatatttgtaacccatcggaaaactcctg47160

ctttagcaagattttccctgtattgctgaaatgtgatttctcttgatttcaacctatcat47220

aggacgtttctataagatgcgtgtttcttgagaatttaacatttacaacctttttaagtc47280

cttttattaacacggtgttatcgttttctaacacgatgtgaatattatctgtggctagat47340

agtaaatataatgtgagacgttgtgacgttttagttcagaataaaacaattcacagtcta47400

aatcttttcgcacttgatcgaatatttctttaaaaatggcaacctgagccattggtaaaa47460

ccttccatgtgatacgagggcgcgtagtttgcattatcgtttttatcgtttcaatctggt47520

ctgacctccttgtgttttgttgatgatttatgtcaaatattaggaatgttttcacttaat47580

agtattggttgcgtaacaaagtgcggtcctgctggcattctggagggaaatacaaccgac47640

agatgtatgtaaggccaacgtgctcaaatcttcatacagaaagatttgaagtaatatttt47700

aaccgctagatgaagagcaagcgcatggagcgacaaaatgaataaagaacaatctgctga47760

tgatccctccgtggatctgattcgtgtaaaaaatatgcttaatagcaccatttctatgag47820

ttaccctgatgttgtaattgcatgtatagaacataaggtgtctctggaagcattcagagc47880

aattgaggcagcgttggtgaagcacgataataatatgaaggattattccctggtggttga47940

ctgatcaccataactgctaatcattcaaactatttagtctgtgacagagccaacacgcag48000

tctgtcactgtcaggaaagtggtaaaactgcaactcaattactgcaatgccctcgtaatt48060

aagtgaatttacaatatcgtcctgttcggagggaagaacgcgggatgttcattcttcatc48120

acttttaattgatgtatatgctctcttttctgacgttagtctccgacggcaggcttcaat48180

gacccaggctgagaaattcccggaccctttttgctcaagagcgatgttaatttgttcaat48240

catttggttaggaaagcggatgttgcgggttgttgttctgcgggttctgttcttcgttga48300

catgaggttgccccgtattcagtgtcgctgatttgtattgtctgaagttgtttttacgtt48360

aagttgatgcagatcaattaatacgatacctgcgtcataattgattatttgacgtggttt48420

gatggcctccacgcacgttgtgatatgtagatgataatcattatcactttacgggtcctt48480

tccggtgatccgacaggttacg48502

<210>6

<211>628

<212>dna

<213>artificialsequence

<220>

<223>lambdadna

<400>6

gggcggcgacctcgcgggttttcgctatttatgaaaattttccggtttaaggcgtttccg60

ttcttcttcgtcataacttaatgtttttatttaaaataccctctgaaaagaaaggaaacg120

acaggtgctgaaagcgaggctttttggcctctgtcgtttcctttctctgtttttgtccgt180

ggaatgaacaatggaagtcaacaaaaagcagctggctgacattttcggtgcgagtatccg240

taccattcagaactggcaggaacagggaatgcccgttctgcgaggcggtggcaagggtaa300

tgaggtgctttatgactctgccgccgtcataaaatggtatgccgaaagggatgctgaaat360

tgagaacgaaaagctgcgccgggaggttgaagaactgcggcaggccagcgaggcagatct420

ccagccaggaactattgagtacgaacgccatcgacttacgcgtgcgcaggccgacgcaca480

ggaactgaagaatgccagagactccgctgaagtggtggaaaccgcattctgtactttcgt540

gctgtcgcggatcgcaggtgaaattgccagtattctcgacgggctccccctgtcggtgca600

gcggcgttttccggaactggaaaaccga628

<210>7

<211>38767

<212>dna

<213>artificialsequence

<220>

<223>lambdadna

<400>7

catgttgatttcctgaaacgggatatcatcaaagccatgaacaaagcagccgcgctggat60

gaactgataccggggttgctgagtgaatatatcgaacagtcaggttaacaggctgcggca120

ttttgtccgcgccgggcttcgctcactgttcaggccggagccacagaccgccgttgaatg180

ggcggatgctaattactatctcccgaaagaatccgcataccaggaagggcgctgggaaac240

actgccctttcagcgggccatcatgaatgcgatgggcagcgactacatccgtgaggtgaa300

tgtggtgaagtctgcccgtgtcggttattccaaaatgctgctgggtgtttatgcctactt360

tatagagcataagcagcgcaacacccttatctggttgccgacggatggtgatgccgagaa420

ctttatgaaaacccacgttgagccgactattcgtgatattccgtcgctgctggcgctggc480

cccgtggtatggcaaaaagcaccgggataacacgctcaccatgaagcgtttcactaatgg540

gcgtggcttctggtgcctgggcggtaaagcggcaaaaaactaccgtgaaaagtcggtgga600

tgtggcgggttatgatgaacttgctgcttttgatgatgatattgaacaggaaggctctcc660

gacgttcctgggtgacaagcgtattgaaggctcggtctggccaaagtccatccgtggctc720

cacgccaaaagtgagaggcacctgtcagattgagcgtgcagccagtgaatccccgcattt780

tatgcgttttcatgttgcctgcccgcattgcggggaggagcagtatcttaaatttggcga840

caaagagacgccgtttggcctcaaatggacgccggatgacccctccagcgtgttttatct900

ctgcgagcataatgcctgcgtcatccgccagcaggagctggactttactgatgcccgtta960

tatctgcgaaaagaccgggatctggacccgtgatggcattctctggttttcgtcatccgg1020

tgaagagattgagccacctgacagtgtgacctttcacatctggacagcgtacagcccgtt1080

caccacctgggtgcagattgtcaaagactggatgaaaacgaaaggggatacgggaaaacg1140

taaaaccttcgtaaacaccacgctcggtgagacgtgggaggcgaaaattggcgaacgtcc1200

ggatgctgaagtgatggcagagcggaaagagcattattcagcgcccgttcctgaccgtgt1260

ggcttacctgaccgccggtatcgactcccagctggaccgctacgaaatgcgcgtatgggg1320

atgggggccgggtgaggaaagctggctgattgaccggcagattattatgggccgccacga1380

cgatgaacagacgctgctgcgtgtggatgaggccatcaataaaacctatacccgccggaa1440

tggtgcagaaatgtcgatatcccgtatctgctgggatactggcgggattgacccgaccat1500

tgtgtatgaacgctcgaaaaaacatgggctgttccgggtgatccccattaaaggggcatc1560

cgtctacggaaagccggtggccagcatgccacgtaagcgaaacaaaaacggggtttacct1620

taccgaaatcggtacggataccgcgaaagagcagatttataaccgcttcacactgacgcc1680

ggaaggggatgaaccgcttcccggtgccgttcacttcccgaataacccggatatttttga1740

tctgaccgaagcgcagcagctgactgctgaagagcaggtcgaaaaatgggtggatggcag1800

gaaaaaaatactgtgggacagcaaaaagcgacgcaatgaggcactcgactgcttcgttta1860

tgcgctggcggcgctgcgcatcagtatttcccgctggcagctggatctcagtgcgctgct1920

ggcgagcctgcaggaagaggatggtgcagcaaccaacaagaaaacactggcagattacgc1980

ccgtgccttatccggagaggatgaatgacgcgacaggaagaacttgccgctgcccgtgcg2040

gcactgcatgacctgatgacaggtaaacgggtggcaacagtacagaaagacggacgaagg2100

gtggagtttacggccacttccgtgtctgacctgaaaaaatatattgcagagctggaagtg2160

cagaccggcatgacacagcgacgcaggggacctgcaggattttatgtatgaaaacgccca2220

ccattcccacccttctggggccggacggcatgacatcgctgcgcgaatatgccggttatc2280

acggcggtggcagcggatttggagggcagttgcggtcgtggaacccaccgagtgaaagtg2340

tggatgcagccctgttgcccaactttacccgtggcaatgcccgcgcagacgatctggtac2400

gcaataacggctatgccgccaacgccatccagctgcatcaggatcatatcgtcgggtctt2460

ttttccggctcagtcatcgcccaagctggcgctatctgggcatcggggaggaagaagccc2520

gtgccttttcccgcgaggttgaagcggcatggaaagagtttgccgaggatgactgctgct2580

gcattgacgttgagcgaaaacgcacgtttaccatgatgattcgggaaggtgtggccatgc2640

acgcctttaacggtgaactgttcgttcaggccacctgggataccagttcgtcgcggcttt2700

tccggacacagttccggatggtcagcccgaagcgcatcagcaacccgaacaataccggcg2760

acagccggaactgccgtgccggtgtgcagattaatgacagcggtgcggcgctgggatatt2820

acgtcagcgaggacgggtatcctggctggatgccgcagaaatggacatggataccccgtg2880

agttacccggcgggcgcgcctcgttcattcacgtttttgaacccgtggaggacgggcaga2940

ctcgcggtgcaaatgtgttttacagcgtgatggagcagatgaagatgctcgacacgctgc3000

agaacacgcagctgcagagcgccattgtgaaggcgatgtatgccgccaccattgagagtg3060

agctggatacgcagtcagcgatggattttattctgggcgcgaacagtcaggagcagcggg3120

aaaggctgaccggctggattggtgaaattgccgcgtattacgccgcagcgccggtccggc3180

tgggaggcgcaaaagtaccgcacctgatgccgggtgactcactgaacctgcagacggctc3240

aggatacggataacggctactccgtgtttgagcagtcactgctgcggtatatcgctgccg3300

ggctgggtgtctcgtatgagcagctttcccggaattacgcccagatgagctactccacgg3360

cacgggccagtgcgaacgagtcgtgggcgtactttatggggcggcgaaaattcgtcgcat3420

cccgtcaggcgagccagatgtttctgtgctggctggaagaggccatcgttcgccgcgtgg3480

tgacgttaccttcaaaagcgcgcttcagttttcaggaagcccgcagtgcctgggggaact3540

gcgactggataggctccggtcgtatggccatcgatggtctgaaagaagttcaggaagcgg3600

tgatgctgatagaagccggactgagtacctacgagaaagagtgcgcaaaacgcggtgacg3660

actatcaggaaatttttgcccagcaggtccgtgaaacgatggagcgccgtgcagccggtc3720

ttaaaccgcccgcctgggcggctgcagcatttgaatccgggctgcgacaatcaacagagg3780

aggagaagagtgacagcagagctgcgtaatctcccgcatattgccagcatggcctttaat3840

gagccgctgatgcttgaacccgcctatgcgcgggttttcttttgtgcgcttgcaggccag3900

cttgggatcagcagcctgacggatgcggtgtccggcgacagcctgactgcccaggaggca3960

ctcgcgacgctggcattatccggtgatgatgacggaccacgacaggcccgcagttatcag4020

gtcatgaacggcatcgccgtgctgccggtgtccggcacgctggtcagccggacgcgggcg4080

ctgcagccgtactcggggatgaccggttacaacggcattatcgcccgtctgcaacaggct4140

gccagcgatccgatggtggacggcattctgctcgatatggacacgcccggcgggatggtg4200

gcgggggcatttgactgcgctgacatcatcgcccgtgtgcgtgacataaaaccggtatgg4260

gcgcttgccaacgacatgaactgcagtgcaggtcagttgcttgccagtgccgcctcccgg4320

cgtctggtcacgcagaccgcccggacaggctccatcggcgtcatgatggctcacagtaat4380

tacggtgctgcgctggagaaacagggtgtggaaatcacgctgatttacagcggcagccat4440

aaggtggatggcaacccctacagccatcttccggatgacgtccgggagacactgcagtcc4500

cggatggacgcaacccgccagatgtttgcgcagaaggtgtcggcatataccggcctgtcc4560

gtgcaggttgtgctggataccgaggctgcagtgtacagcggtcaggaggccattgatgcc4620

ggactggctgatgaacttgttaacagcaccgatgcgatcaccgtcatgcgtgatgcactg4680

gatgcacgtaaatcccgtctctcaggagggcgaatgaccaaagagactcaatcaacaact4740

gtttcagccactgcttcgcaggctgacgttactgacgtggtgccagcgacggagggcgag4800

aacgccagcgcggcgcagccggacgtgaacgcgcagatcaccgcagcggttgcggcagaa4860

aacagccgcattatggggatcctcaactgtgaggaggctcacggacgcgaagaacaggca4920

cgcgtgctggcagaaacccccggtatgaccgtgaaaacggcccgccgcattctggccgca4980

gcaccacagagtgcacaggcgcgcagtgacactgcgctggatcgtctgatgcagggggca5040

ccggcaccgctggctgcaggtaacccggcatctgatgccgttaacgatttgctgaacaca5100

ccagtgtaagggatgtttatgacgagcaaagaaacctttacccattaccagccgcagggc5160

aacagtgacccggctcataccgcaaccgcgcccggcggattgagtgcgaaagcgcctgca5220

atgaccccgctgatgctggacacctccagccgtaagctggttgcgtgggatggcaccacc5280

gacggtgctgccgttggcattcttgcggttgctgctgaccagaccagcaccacgctgacg5340

ttctacaagtccggcacgttccgttatgaggatgtgctctggccggaggctgccagcgac5400

gagacgaaaaaacggaccgcgtttgccggaacggcaatcagcatcgtttaactttaccct5460

tcatcactaaaggccgcctgtgcggctttttttacgggatttttttatgtcgatgtacac5520

aaccgcccaactgctggcggcaaatgagcagaaatttaagtttgatccgctgtttctgcg5580

tctctttttccgtgagagctatcccttcaccacggagaaagtctatctctcacaaattcc5640

gggactggtaaacatggcgctgtacgtttcgccgattgtttccggtgaggttatccgttc5700

ccgtggcggctccacctctgaatttacgccgggatatgtcaagccgaagcatgaagtgaa5760

tccgcagatgaccctgcgtcgcctgccggatgaagatccgcagaatctggcggacccggc5820

ttaccgccgccgtcgcatcatcatgcagaacatgcgtgacgaagagctggccattgctca5880

ggtcgaagagatgcaggcagtttctgccgtgcttaagggcaaatacaccatgaccggtga5940

agccttcgatccggttgaggtggatatgggccgcagtgaggagaataacatcacgcagtc6000

cggcggcacggagtggagcaagcgtgacaagtccacgtatgacccgaccgacgatatcga6060

agcctacgcgctgaacgccagcggtgtggtgaatatcatcgtgttcgatccgaaaggctg6120

ggcgctgttccgttccttcaaagccgtcaaggagaagctggatacccgtcgtggctctaa6180

ttccgagctggagacagcggtgaaagacctgggcaaagcggtgtcctataaggggatgta6240

tggcgatgtggccatcgtcgtgtattccggacagtacgtggaaaacggcgtcaaaaagaa6300

cttcctgccggacaacacgatggtgctggggaacactcaggcacgcggtctgcgcaccta6360

tggctgcattcaggatgcggacgcacagcgcgaaggcattaacgcctctgcccgttaccc6420

gaaaaactgggtgaccaccggcgatccggcgcgtgagttcaccatgattcagtcagcacc6480

gctgatgctgctggctgaccctgatgagttcgtgtccgtacaactggcgtaatcatggcc6540

cttcggggccattgtttctctgtggaggagtccatgacgaaagatgaactgattgcccgt6600

ctccgctcgctgggtgaacaactgaaccgtgatgtcagcctgacggggacgaaagaagaa6660

ctggcgctccgtgtggcagagctgaaagaggagcttgatgacacggatgaaactgccggt6720

caggacacccctctcagccgggaaaatgtgctgaccggacatgaaaatgaggtgggatca6780

gcgcagccggataccgtgattctggatacgtctgaactggtcacggtcgtggcactggtg6840

aagctgcatactgatgcacttcacgccacgcgggatgaacctgtggcatttgtgctgccg6900

ggaacggcgtttcgtgtctctgccggtgtggcagccgaaatgacagagcgcggcctggcc6960

agaatgcaataacgggaggcgctgtggctgatttcgataacctgttcgatgctgccattg7020

cccgcgccgatgaaacgatacgcgggtacatgggaacgtcagccaccattacatccggtg7080

agcagtcaggtgcggtgatacgtggtgtttttgatgaccctgaaaatatcagctatgccg7140

gacagggcgtgcgcgttgaaggctccagcccgtccctgtttgtccggactgatgaggtgc7200

ggcagctgcggcgtggagacacgctgaccatcggtgaggaaaatttctgggtagatcggg7260

tttcgccggatgatggcggaagttgtcatctctggcttggacggggcgtaccgcctgccg7320

ttaaccgtcgccgctgaaagggggatgtatggccataaaaggtcttgagcaggccgttga7380

aaacctcagccgtatcagcaaaacggcggtgcctggtgccgccgcaatggccattaaccg7440

cgttgcttcatccgcgatatcgcagtcggcgtcacaggttgcccgtgagacaaaggtacg7500

ccggaaactggtaaaggaaagggccaggctgaaaagggccacggtcaaaaatccgcaggc7560

cagaatcaaagttaaccggggggatttgcccgtaatcaagctgggtaatgcgcgggttgt7620

cctttcgcgccgcaggcgtcgtaaaaaggggcagcgttcatccctgaaaggtggcggcag7680

cgtgcttgtggtgggtaaccgtcgtattcccggcgcgtttattcagcaactgaaaaatgg7740

ccggtggcatgtcatgcagcgtgtggctgggaaaaaccgttaccccattgatgtggtgaa7800

aatcccgatggcggtgccgctgaccacggcgtttaaacaaaatattgagcggatacggcg7860

tgaacgtcttccgaaagagctgggctatgcgctgcagcatcaactgaggatggtaataaa7920

gcgatgaaacatactgaactccgtgcagccgtactggatgcactggagaagcatgacacc7980

ggggcgacgttttttgatggtcgccccgctgtttttgatgaggcggattttccggcagtt8040

gccgtttatctcaccggcgctgaatacacgggcgaagagctggacagcgatacctggcag8100

gcggagctgcatatcgaagttttcctgcctgctcaggtgccggattcagagctggatgcg8160

tggatggagtcccggatttatccggtgatgagcgatatcccggcactgtcagatttgatc8220

accagtatggtggccagcggctatgactaccggcgcgacgatgatgcgggcttgtggagt8280

tcagccgatctgacttatgtcattacctatgaaatgtgaggacgctatgcctgtaccaaa8340

tcctacaatgccggtgaaaggtgccgggaccaccctgtgggtttataaggggagcggtga8400

cccttacgcgaatccgctttcagacgttgactggtcgcgtctggcaaaagttaaagacct8460

gacgcccggcgaactgaccgctgagtcctatgacgacagctatctcgatgatgaagatgc8520

agactggactgcgaccgggcaggggcagaaatctgccggagataccagcttcacgctggc8580

gtggatgcccggagagcaggggcagcaggcgctgctggcgtggtttaatgaaggcgatac8640

ccgtgcctataaaatccgcttcccgaacggcacggtcgatgtgttccgtggctgggtcag8700

cagtatcggtaaggcggtgacggcgaaggaagtgatcacccgcacggtgaaagtcaccaa8760

tgtgggacgtccgtcgatggcagaagatcgcagcacggtaacagcggcaaccggcatgac8820

cgtgacgcctgccagcacctcggtggtgaaagggcagagcaccacgctgaccgtggcctt8880

ccagccggagggcgtaaccgacaagagctttcgtgcggtgtctgcggataaaacaaaagc8940

caccgtgtcggtcagtggtatgaccatcaccgtgaacggcgttgctgcaggcaaggtcaa9000

cattccggttgtatccggtaatggtgagtttgctgcggttgcagaaattaccgtcaccgc9060

cagttaatccggagagtcagcgatgttcctgaaaaccgaatcatttgaacataacggtgt9120

gaccgtcacgctttctgaactgtcagccctgcagcgcattgagcatctcgccctgatgaa9180

acggcaggcagaacaggcggagtcagacagcaaccggaagtttactgtggaagacgccat9240

cagaaccggcgcgtttctggtggcgatgtccctgtggcataaccatccgcagaagacgca9300

gatgccgtccatgaatgaagccgttaaacagattgagcaggaagtgcttaccacctggcc9360

cacggaggcaatttctcatgctgaaaacgtggtgtaccggctgtctggtatgtatgagtt9420

tgtggtgaataatgcccctgaacagacagaggacgccgggcccgcagagcctgtttctgc9480

gggaaagtgttcgacggtgagctgagttttgccctgaaactggcgcgtgagatggggcga9540

cccgactggcgtgccatgcttgccgggatgtcatccacggagtatgccgactggcaccgc9600

ttttacagtacccattattttcatgatgttctgctggatatgcacttttccgggctgacg9660

tacaccgtgctcagcctgtttttcagcgatccggatatgcatccgctggatttcagtctg9720

ctgaaccggcgcgaggctgacgaagagcctgaagatgatgtgctgatgcagaaagcggca9780

gggcttgccggaggtgtccgctttggcccggacgggaatgaagttatccccgcttccccg9840

gatgtggcggacatgacggaggatgacgtaatgctgatgacagtatcagaagggatcgca9900

ggaggagtccggtatggctgaaccggtaggcgatctggtcgttgatttgagtctggatgc9960

ggccagatttgacgagcagatggccagagtcaggcgtcatttttctggtacggaaagtga10020

tgcgaaaaaaacagcggcagtcgttgaacagtcgctgagccgacaggcgctggctgcaca10080

gaaagcggggatttccgtcgggcagtataaagccgccatgcgtatgctgcctgcacagtt10140

caccgacgtggccacgcagcttgcaggcgggcaaagtccgtggctgatcctgctgcaaca10200

gggggggcaggtgaaggactccttcggcgggatgatccccatgttcagggggcttgccgg10260

tgcgatcaccctgccgatggtgggggccacctcgctggcggtggcgaccggtgcgctggc10320

gtatgcctggtatcagggcaactcaaccctgtccgatttcaacaaaacgctggtcctttc10380

cggcaatcaggcgggactgacggcagatcgtatgctggtcctgtccagagccgggcaggc10440

ggcagggctgacgtttaaccagaccagcgagtcactcagcgcactggttaaggcgggggt10500

aagcggtgaggctcagattgcgtccatcagccagagtgtggcgcgtttctcctctgcatc10560

cggcgtggaggtggacaaggtcgctgaagccttcgggaagctgaccacagacccgacgtc10620

ggggctgacggcgatggctcgccagttccataacgtgtcggcggagcagattgcgtatgt10680

tgctcagttgcagcgttccggcgatgaagccggggcattgcaggcggcgaacgaggccgc10740

aacgaaagggtttgatgaccagacccgccgcctgaaagagaacatgggcacgctggagac10800

ctgggcagacaggactgcgcgggcattcaaatccatgtgggatgcggtgctggatattgg10860

tcgtcctgataccgcgcaggagatgctgattaaggcagaggctgcgtataagaaagcaga10920

cgacatctggaatctgcgcaaggatgattattttgttaacgatgaagcgcgggcgcgtta10980

ctgggatgatcgtgaaaaggcccgtcttgcgcttgaagccgcccgaaagaaggctgagca11040

gcagactcaacaggacaaaaatgcgcagcagcagagcgataccgaagcgtcacggctgaa11100

atataccgaagaggcgcagaaggcttacgaacggctgcagacgccgctggagaaatatac11160

cgcccgtcaggaagaactgaacaaggcactgaaagacgggaaaatcctgcaggcggatta11220

caacacgctgatggcggcggcgaaaaaggattatgaagcgacgctgaaaaagccgaaaca11280

gtccagcgtgaaggtgtctgcgggcgatcgtcaggaagacagtgctcatgctgccctgct11340

gacgcttcaggcagaactccggacgctggagaagcatgccggagcaaatgagaaaatcag11400

ccagcagcgccgggatttgtggaaggcggagagtcagttcgcggtactggaggaggcggc11460

gcaacgtcgccagctgtctgcacaggagaaatccctgctggcgcataaagatgagacgct11520

ggagtacaaacgccagctggctgcacttggcgacaaggttacgtatcaggagcgcctgaa11580

cgcgctggcgcagcaggcggataaattcgcacagcagcaacgggcaaaacgggccgccat11640

tgatgcgaaaagccgggggctgactgaccggcaggcagaacgggaagccacggaacagcg11700

cctgaaggaacagtatggcgataatccgctggcgctgaataacgtcatgtcagagcagaa11760

aaagacctgggcggctgaagaccagcttcgcgggaactggatggcaggcctgaagtccgg11820

ctggagtgagtgggaagagagcgccacggacagtatgtcgcaggtaaaaagtgcagccac11880

gcagacctttgatggtattgcacagaatatggcggcgatgctgaccggcagtgagcagaa11940

ctggcgcagcttcacccgttccgtgctgtccatgatgacagaaattctgcttaagcaggc12000

aatggtggggattgtcgggagtatcggcagcgccattggcggggctgttggtggcggcgc12060

atccgcgtcaggcggtacagccattcaggccgctgcggcgaaattccattttgcaaccgg12120

aggatttacgggaaccggcggcaaatatgagccagcggggattgttcaccgtggtgagtt12180

tgtcttcacgaaggaggcaaccagccggattggcgtggggaatctttaccggctgatgcg12240

cggctatgccaccggcggttatgtcggtacaccgggcagcatggcagacagccggtcgca12300

ggcgtccgggacgtttgagcagaataaccatgtggtgattaacaacgacggcacgaacgg12360

gcagataggtccggctgctctgaaggcggtgtatgacatggcccgcaagggtgcccgtga12420

tgaaattcagacacagatgcgtgatggtggcctgttctccggaggtggacgatgaagacc12480

ttccgctggaaagtgaaacccggtatggatgtggcttcggtcccttctgtaagaaaggtg12540

cgctttggtgatggctattctcagcgagcgcctgccgggctgaatgccaacctgaaaacg12600

tacagcgtgacgctttctgtcccccgtgaggaggccacggtactggagtcgtttctggaa12660

gagcacgggggctggaaatcctttctgtggacgccgccttatgagtggcggcagataaag12720

gtgacctgcgcaaaatggtcgtcgcgggtcagtatgctgcgtgttgagttcagcgcagag12780

tttgaacaggtggtgaactgatgcaggatatccggcaggaaacactgaatgaatgcaccc12840

gtgcggagcagtcggccagcgtggtgctctgggaaatcgacctgacagaggtcggtggag12900

aacgttattttttctgtaatgagcagaacgaaaaaggtgagccggtcacctggcaggggc12960

gacagtatcagccgtatcccattcaggggagcggttttgaactgaatggcaaaggcacca13020

gtacgcgccccacgctgacggtttctaacctgtacggtatggtcaccgggatggcggaag13080

atatgcagagtctggtcggcggaacggtggtccggcgtaaggtttacgcccgttttctgg13140

atgcggtgaacttcgtcaacggaaacagttacgccgatccggagcaggaggtgatcagcc13200

gctggcgcattgagcagtgcagcgaactgagcgcggtgagtgcctcctttgtactgtcca13260

cgccgacggaaacggatggcgctgtttttccgggacgtatcatgctggccaacacctgca13320

cctggacctatcgcggtgacgagtgcggttatagcggtccggctgtcgcggatgaatatg13380

accagccaacgtccgatatcacgaaggataaatgcagcaaatgcctgagcggttgtaagt13440

tccgcaataacgtcggcaactttggcggcttcctttccattaacaaactttcgcagtaaa13500

tcccatgacacagacagaatcagcgattctggcgcacgcccggcgatgtgcgccagcgga13560

gtcgtgcggcttcgtggtaagcacgccggagggggaaagatatttcccctgcgtgaatat13620

ctccggtgagccggaggctatttccgtatgtcgccggaagactggctgcaggcagaaatg13680

cagggtgagattgtggcgctggtccacagccaccccggtggtctgccctggctgagtgag13740

gccgaccggcggctgcaggtgcagagtgatttgccgtggtggctggtctgccgggggacg13800

attcataagttccgctgtgtgccgcatctcaccgggcggcgctttgagcacggtgtgacg13860

gactgttacacactgttccgggatgcttatcatctggcggggattgagatgccggacttt13920

catcgtgaggatgactggtggcgtaacggccagaatctctatctggataatctggaggcg13980

acggggctgtatcaggtgccgttgtcagcggcacagccgggcgatgtgctgctgtgctgt14040

tttggttcatcagtgccgaatcacgccgcaatttactgcggcgacggcgagctgctgcac14100

catattcctgaacaactgagcaaacgagagaggtacaccgacaaatggcagcgacgcaca14160

cactccctctggcgtcaccgggcatggcgcgcatctgcctttacggggatttacaacgat14220

ttggtcgccgcatcgaccttcgtgtgaaaacgggggctgaagccatccgggcactggcca14280

cacagctcccggcgtttcgtcagaaactgagcgacggctggtatcaggtacggattgccg14340

ggcgggacgtcagcacgtccgggttaacggcgcagttacatgagactctgcctgatggcg14400

ctgtaattcatattgttcccagagtcgccggggccaagtcaggtggcgtattccagattg14460

tcctgggggctgccgccattgccggatcattctttaccgccggagccacccttgcagcat14520

ggggggcagccattggggccggtggtatgaccggcatcctgttttctctcggtgccagta14580

tggtgctcggtggtgtggcgcagatgctggcaccgaaagccagaactccccgtatacaga14640

caacggataacggtaagcagaacacctatttctcctcactggataacatggttgcccagg14700

gcaatgttctgcctgttctgtacggggaaatgcgcgtggggtcacgcgtggtttctcagg14760

agatcagcacggcagacgaaggggacggtggtcaggttgtggtgattggtcgctgatgca14820

aaatgttttatgtgaaaccgcctgcgggcggttttgtcatttatggagcgtgaggaatgg14880

gtaaaggaagcagtaaggggcataccccgcgcgaagcgaaggacaacctgaagtccacgc14940

agttgctgagtgtgatcgatgccatcagcgaagggccgattgaaggtccggtggatggct15000

taaaaagcgtgctgctgaacagtacgccggtgctggacactgaggggaataccaacatat15060

ccggtgtcacggtggtgttccgggctggtgagcaggagcagactccgccggagggatttg15120

aatcctccggctccgagacggtgctgggtacggaagtgaaatatgacacgccgatcaccc15180

gcaccattacgtctgcaaacatcgaccgtctgcgctttaccttcggtgtacaggcactgg15240

tggaaaccacctcaaagggtgacaggaatccgtcggaagtccgcctgctggttcagatac15300

aacgtaacggtggctgggtgacggaaaaagacatcaccattaagggcaaaaccacctcgc15360

agtatctggcctcggtggtgatgggtaacctgccgccgcgcccgtttaatatccggatgc15420

gcaggatgacgccggacagcaccacagaccagctgcagaacaaaacgctctggtcgtcat15480

acactgaaatcatcgatgtgaaacagtgctacccgaacacggcactggtcggcgtgcagg15540

tggactcggagcagttcggcagccagcaggtgagccgtaattatcatctgcgcgggcgta15600

ttctgcaggtgccgtcgaactataacccgcagacgcggcaatacagcggtatctgggacg15660

gaacgtttaaaccggcatacagcaacaacatggcctggtgtctgtgggatatgctgaccc15720

atccgcgctacggcatggggaaacgtcttggtgcggcggatgtggataaatgggcgctgt15780

atgtcatcggccagtactgcgaccagtcagtgccggacggctttggcggcacggagccgc15840

gcatcacctgtaatgcgtacctgaccacacagcgtaaggcgtgggatgtgctcagcgatt15900

tctgctcggcgatgcgctgtatgccggtatggaacgggcagacgctgacgttcgtgcagg15960

accgaccgtcggataagacgtggacctataaccgcagtaatgtggtgatgccggatgatg16020

gcgcgccgttccgctacagcttcagcgccctgaaggaccgccataatgccgttgaggtga16080

actggattgacccgaacaacggctgggagacggcgacagagcttgttgaagatacgcagg16140

ccattgcccgttacggtcgtaatgttacgaagatggatgcctttggctgtaccagccggg16200

ggcaggcacaccgcgccgggctgtggctgattaaaacagaactgctggaaacgcagaccg16260

tggatttcagcgtcggcgcagaagggcttcgccatgtaccgggcgatgttattgaaatct16320

gcgatgatgactatgccggtatcagcaccggtggtcgtgtgctggcggtgaacagccaga16380

cccggacgctgacgctcgaccgtgaaatcacgctgccatcctccggtaccgcgctgataa16440

gcctggttgacggaagtggcaatccggtcagcgtggaggttcagtccgtcaccgacggcg16500

tgaaggtaaaagtgagccgtgttcctgacggtgttgctgaatacagcgtatgggagctga16560

agctgccgacgctgcgccagcgactgttccgctgcgtgagtatccgtgagaacgacgacg16620

gcacgtatgccatcaccgccgtgcagcatgtgccggaaaaagaggccatcgtggataacg16680

gggcgcactttgacggcgaacagagtggcacggtgaatggtgtcacgccgccagcggtgc16740

agcacctgaccgcagaagtcactgcagacagcggggaatatcaggtgctggcgcgatggg16800

acacaccgaaggtggtgaagggcgtgagtttcctgctccgtctgaccgtaacagcggacg16860

acggcagtgagcggctggtcagcacggcccggacgacggaaaccacataccgcttcacgc16920

aactggcgctggggaactacaggctgacagtccgggcggtaaatgcgtgggggcagcagg16980

gcgatccggcgtcggtatcgttccggattgccgcaccggcagcaccgtcgaggattgagc17040

tgacgccgggctattttcagataaccgccacgccgcatcttgccgtttatgacccgacgg17100

tacagtttgagttctggttctcggaaaagcagattgcggatatcagacaggttgaaacca17160

gcacgcgttatcttggtacggcgctgtactggatagccgccagtatcaatatcaaaccgg17220

gccatgattattacttttatatccgcagtgtgaacaccgttggcaaatcggcattcgtgg17280

aggccgtcggtcgggcgagcgatgatgcggaaggttacctggattttttcaaaggcaaga17340

taaccgaatcccatctcggcaaggagctgctggaaaaagtcgagctgacggaggataacg17400

ccagcagactggaggagttttcgaaagagtggaaggatgccagtgataagtggaatgcca17460

tgtgggctgtcaaaattgagcagaccaaagacggcaaacattatgtcgcgggtattggcc17520

tcagcatggaggacacggaggaaggcaaactgagccagtttctggttgccgccaatcgta17580

tcgcatttattgacccggcaaacgggaatgaaacgccgatgtttgtggcgcagggcaacc17640

agatattcatgaacgacgtgttcctgaagcgcctgacggcccccaccattaccagcggcg17700

gcaatcctccggccttttccctgacaccggacggaaagctgaccgctaaaaatgcggata17760

tcagtggcagtgtgaatgcgaactccgggacgctcagtaatgtgacgatagctgaaaact17820

gtacgataaacggtacgctgagggcggaaaaaatcgtcggggacattgtaaaggcggcga17880

gcgcggcttttccgcgccagcgtgaaagcagtgtggactggccgtcaggtacccgtactg17940

tcaccgtgaccgatgaccatccttttgatcgccagatagtggtgcttccgctgacgtttc18000

gcggaagtaagcgtactgtcagcggcaggacaacgtattcgatgtgttatctgaaagtac18060

tgatgaacggtgcggtgatttatgatggcgcggcgaacgaggcggtacaggtgttctccc18120

gtattgttgacatgccagcgggtcggggaaacgtgatcctgacgttcacgcttacgtcca18180

cacggcattcggcagatattccgccgtatacgtttgccagcgatgtgcaggttatggtga18240

ttaagaaacaggcgctgggcatcagcgtggtctgagtgtgttacagaggttcgtccggga18300

acgggcgttttattataaaacagtgagaggtgaacgatgcgtaatgtgtgtattgccgtt18360

gctgtctttgccgcacttgcggtgacagtcactccggcccgtgcggaaggtggacatggt18420

acgtttacggtgggctattttcaagtgaaaccgggtacattgccgtcgttgtcgggcggg18480

gataccggtgtgagtcatctgaaagggattaacgtgaagtaccgttatgagctgacggac18540

agtgtgggggtgatggcttccctggggttcgccgcgtcgaaaaagagcagcacagtgatg18600

accggggaggatacgtttcactatgagagcctgcgtggacgttatgtgagcgtgatggcc18660

ggaccggttttacaaatcagtaagcaggtcagtgcgtacgccatggccggagtggctcac18720

agtcggtggtccggcagtacaatggattaccgtaagacggaaatcactcccgggtatatg18780

aaagagacgaccactgccagggacgaaagtgcaatgcggcatacctcagtggcgtggagt18840

gcaggtatacagattaatccggcagcgtccgtcgttgttgatattgcttatgaaggctcc18900

ggcagtggcgactggcgtactgacggattcatcgttggggtcggttataaattctgatta18960

gccaggtaacacagtgttatgacagcccgccggaaccggtgggcttttttgtggggtgaa19020

tatggcagtaaagatttcaggagtcctgaaagacggcacaggaaaaccggtacagaactg19080

caccattcagctgaaagccagacgtaacagcaccacggtggtggtgaacacggtgggctc19140

agagaatccggatgaagccgggcgttacagcatggatgtggagtacggtcagtacagtgt19200

catcctgcaggttgacggttttccaccatcgcacgccgggaccatcaccgtgtatgaaga19260

ttcacaaccggggacgctgaatgattttctctgtgccatgacggaggatgatgcccggcc19320

ggaggtgctgcgtcgtcttgaactgatggtggaagaggtggcgcgtaacgcgtccgtggt19380

ggcacagagtacggcagacgcgaagaaatcagccggcgatgccagtgcatcagctgctca19440

ggtcgcggcccttgtgactgatgcaactgactcagcacgcgccgccagcacgtccgccgg19500

acaggctgcatcgtcagctcaggaagcgtcctccggcgcagaagcggcatcagcaaaggc19560

cactgaagcggaaaaaagtgccgcagccgcagagtcctcaaaaaacgcggcggccaccag19620

tgccggtgcggcgaaaacgtcagaaacgaatgctgcagcgtcacaacaatcagccgccac19680

gtctgcctccaccgcggccacgaaagcgtcagaggccgccacttcagcacgagatgcggt19740

ggcctcaaaagaggcagcaaaatcatcagaaacgaacgcatcatcaagtgccggtcgtgc19800

agcttcctcggcaacggcggcagaaaattctgccagggcggcaaaaacgtccgagacgaa19860

tgccaggtcatctgaaacagcagcggaacggagcgcctctgccgcggcagacgcaaaaac19920

agcggcggcggggagtgcgtcaacggcatccacgaaggcgacagaggctgcgggaagtgc19980

ggtatcagcatcgcagagcaaaagtgcggcagaagcggcggcaatacgtgcaaaaaattc20040

ggcaaaacgtgcagaagatatagcttcagctgtcgcgcttgaggatgcggacacaacgag20100

aaaggggatagtgcagctcagcagtgcaaccaacagcacgtctgaaacgcttgctgcaac20160

gccaaaggcggttaaggtggtaatggatgaaacgaacagaaaagcccactggacagtccg20220

gcactgaccggaacgccaacagcaccaaccgcgctcaggggaacaaacaatacccagatt20280

gcgaacaccgcttttgtactggccgcgattgcagatgttatcgacgcgtcacctgacgca20340

ctgaatacgctgaatgaactggccgcagcgctcgggaatgatccagattttgctaccacc20400

atgactaacgcgcttgcgggtaaacaaccgaagaatgcgacactgacggcgctggcaggg20460

ctttccacggcgaaaaataaattaccgtattttgcggaaaatgatgccgccagcctgact20520

gaactgactcaggttggcagggatattctggcaaaaaattccgttgcagatgttcttgaa20580

taccttggggccggtgagaattcggcctttccggcaggtgcgccgatcccgtggccatca20640

gatatcgttccgtctggctacgtcctgatgcaggggcaggcgtttgacaaatcagcctac20700

ccaaaacttgctgtcgcgtatccatcgggtgtgcttcctgatatgcgaggctggacaatc20760

aaggggaaacccgccagcggtcgtgctgtattgtctcaggaacaggatggaattaagtcg20820

cacacccacagtgccagtgcatccggtacggatttggggacgaaaaccacatcgtcgttt20880

gattacgggacgaaaacaacaggcagtttcgattacggcaccaaatcgacgaataacacg20940

ggggctcatgctcacagtctgagcggttcaacaggggccgcgggtgctcatgcccacaca21000

agtggtttaaggatgaacagttctggctggagtcagtatggaacagcaaccattacagga21060

agtttatccacagttaaaggaaccagcacacagggtattgcttatttatcgaaaacggac21120

agtcagggcagccacagtcactcattgtccggtacagccgtgagtgccggtgcacatgcg21180

catacagttggtattggtgcgcaccagcatccggttgttatcggtgctcatgcccattct21240

ttcagtattggttcacacggacacaccatcaccgttaacgctgcgggtaacgcggaaaac21300

accgtcaaaaacattgcatttaactatattgtgaggcttgcataatggcattcagaatga21360

gtgaacaaccacggaccataaaaatttataatctgctggccggaactaatgaatttattg21420

gtgaaggtgacgcatatattccgcctcataccggtctgcctgcaaacagtaccgatattg21480

caccgccagatattccggctggctttgtggctgttttcaacagtgatgaggcatcgtggc21540

atctcgttgaagaccatcggggtaaaaccgtctatgacgtggcttccggcgacgcgttat21600

ttatttctgaactcggtccgttaccggaaaattttacctggttatcgccgggaggggaat21660

atcagaagtggaacggcacagcctgggtgaaggatacggaagcagaaaaactgttccgga21720

tccgggaggcggaagaaacaaaaaaaagcctgatgcaggtagccagtgagcatattgcgc21780

cgcttcaggatgctgcagatctggaaattgcaacgaaggaagaaacctcgttgctggaag21840

cctggaagaagtatcgggtgttgctgaaccgtgttgatacatcaactgcacctgatattg21900

agtggcctgctgtccctgttatggagtaatcgttttgtgatatgccgcagaaacgttgta21960

tgaaataacgttctgcggttagttagtatattgtaaagctgagtattggtttatttggcg22020

attattatcttcaggagaataatggaagttctatgactcaattgttcatagtgtttacat22080

caccgccaattgcttttaagactgaacgcatgaaatatggtttttcgtcatgttttgagt22140

ctgctgttgatatttctaaagtcggttttttttcttcgttttctctaactattttccatg22200

aaatacatttttgattattatttgaatcaattccaattacctgaagtctttcatctataa22260

ttggcattgtatgtattggtttattggagtagatgcttgcttttctgagccatagctctg22320

atatccaaatgaagccataggcatttgttattttggctctgtcagctgcataacgccaaa22380

aaatatatttatctgcttgatcttcaaatgttgtattgattaaatcaattggatggaatt22440

gtttatcataaaaaattaatgtttgaatgtgataaccgtcctttaaaaaagtcgtttctg22500

caagcttggctgtatagtcaactaactcttctgtcgaagtgatatttttaggcttatcta22560

ccagttttagacgctctttaatatcttcaggaattattttattgtcatattgtatcatgc22620

taaatgacaatttgcttatggagtaatcttttaattttaaataagttattctcctggctt22680

catcaaataaagagtcgaatgatgttggcgaaatcacatcgtcacccattggattgttta22740

tttgtatgccaagagagttacagcagttatacattctgccatagattatagctaaggcat22800

gtaataattcgtaatcttttagcgtattagcgacccatcgtctttctgatttaataatag22860

atgattcagttaaatatgaaggtaatttcttttgtgcaagtctgactaacttttttatac22920

caatgtttaacatactttcatttgtaataaactcaatgtcattttcttcaatgtaagatg22980

aaataagagtagcctttgcctcgctatacatttctaaatcgccttgtttttctatcgtat23040

tgcgagaatttttagcccaagccattaatggatcatttttccatttttcaataacattat23100

tgttataccaaatgtcatatcctataatctggtttttgtttttttgaataataaatgtta23160

ctgttcttgcggtttggaggaattgattcaaattcaagcgaaataattcagggtcaaaat23220

atgtatcaatgcagcatttgagcaagtgcgataaatctttaagtcttctttcccatggtt23280

ttttagtcataaaactctccattttgataggttgcatgctagatgctgatatattttaga23340

ggtgataaaattaactgcttaactgtcaatgtaatacaagttgtttgatctttgcaatga23400

ttcttatcagaaaccatatagtaaattagttacacaggaaatttttaatattattattat23460

cattcattatgtattaaaattagagttgtggcttggctctgctaacacgttgctcatagg23520

agatatggtagagccgcagacacgtcgtatgcaggaacgtgctgcggctggctggtgaac23580

ttccgatagtgcgggtgttgaatgatttccagttgctaccgattttacatattttttgca23640

tgagagaatttgtaccacctcccaccgaccatctatgactgtacgccactgtccctagga23700

ctgctatgtgccggagcggacattacaaacgtccttctcggtgcatgccactgttgccaa23760

tgacctgcctaggaattggttagcaagttactaccggattttgtaaaaacagccctcctc23820

atataaaaagtattcgttcacttccgataagcgtcgtaattttctatctttcatcatatt23880

ctagatccctctgaaaaaatcttccgagtttgctaggcactgatacataactcttttcca23940

ataattggggaagtcattcaaatctataataggtttcagatttgcttcaataaattctga24000

ctgtagctgctgaaacgttgcggttgaactatatttccttataacttttacgaaagagtt24060

tctttgagtaatcacttcactcaagtgcttccctgcctccaaacgatacctgttagcaat24120

atttaatagcttgaaatgatgaagagctctgtgtttgtcttcctgcctccagttcgccgg24180

gcattcaacataaaaactgatagcacccggagttccggaaacgaaatttgcatataccca24240

ttgctcacgaaaaaaaatgtccttgtcgatatagggatgaatcgcttggtgtacctcatc24300

tactgcgaaaacttgacctttctctcccatattgcagtcgcggcacgatggaactaaatt24360

aataggcatcaccgaaaattcaggataatgtgcaataggaagaaaatgatctatattttt24420

tgtctgtcctatatcaccacaaaatggacatttttcacctgatgaaacaagcatgtcatc24480

gtaatatgttctagcgggtttgtttttatctcggagattattttcataaagcttttctaa24540

tttaacctttgtcaggttaccaactactaaggttgtaggctcaagagggtgtgtcctgtc24600

gtaggtaaataactgacctgtcgagcttaatattctatattgttgttctttctgcaaaaa24660

agtggggaagtgagtaatgaaattatttctaacatttatctgcatcataccttccgagca24720

tttattaagcatttcgctataagttctcgctggaagaggtagttttttcattgtacttta24780

ccttcatctctgttcattatcatcgcttttaaaacggttcgaccttctaatcctatctga24840

ccattataattttttagaatggtttcataagaaagctctgaatcaacggactgcgataat24900

aagtggtggtatccagaatttgtcacttcaagtaaaaacacctcacgagttaaaacacct24960

aagttctcaccgaatgtctcaatatccggacggataatatttattgcttctcttgaccgt25020

aggactttccacatgcaggattttggaacctcttgcagtactactggggaatgagttgca25080

attattgctacaccattgcgtgcatcgagtaagtcgcttaatgttcgtaaaaaagcagag25140

agcaaaggtggatgcagatgaacctctggttcatcgaataaaactaatgacttttcgcca25200

acgacatctactaatcttgtgatagtaaataaaacaattgcatgtccagagctcattcga25260

agcagatatttctggatattgtcataaaacaatttagtgaatttatcatcgtccacttga25320

atctgtggttcattacgtcttaactcttcatatttagaaatgaggctgatgagttccata25380

tttgaaaagttttcatcactacttagttttttgatagcttcaagccagagttgtcttttt25440

ctatctactctcatacaaccaataaatgctgaaatgaattctaagcggagatcgcctagt25500

gattttaaactattgctggcagcattcttgagtccaatataaaagtattgtgtacctttt25560

gctgggtcaggttgttctttaggaggagtaaaaggatcaaatgcactaaacgaaactgaa25620

acaagcgatcgaaaatatccctttgggattcttgactcgataagtctattattttcagag25680

aaaaaatattcattgttttctgggttggtgattgcaccaatcattccattcaaaattgtt25740

gttttaccacacccattccgcccgataaaagcatgaatgttcgtgctgggcatagaatta25800

accgtcacctcaaaaggtatagttaaatcactgaatccgggagcactttttctattaaat25860

gaaaagtggaaatctgacaattctggcaaaccatttaacacacgtgcgaactgtccatga25920

atttctgaaagagttacccctctaagtaatgaggtgttaaggacgctttcattttcaatg25980

tcggctaatcgatttggccatactactaaatcctgaatagctttaagaaggttatgttta26040

aaaccatcgcttaatttgctgagattaacatagtagtcaatgctttcacctaaggaaaaa26100

aacatttcagggagttgactgaattttttatctattaatgaataagtgcttacttcttct26160

ttttgacctacaaaaccaattttaacatttccgatatcgcatttttcaccatgctcatca26220

aagacagtaagataaaacattgtaacaaaggaatagtcattccaaccatctgctcgtagg26280

aatgccttatttttttctactgcaggaatatacccgcctctttcaataacactaaactcc26340

aacatatagtaacccttaattttattaaaataaccgcaatttatttggcggcaacacagg26400

atctctcttttaagttactctctattacatacgttttccatctaaaaattagtagtattg26460

aacttaacggggcatcgtattgtagttttccatatttagctttctgcttccttttggata26520

acccactgttattcatgttgcatggtgcactgtttataccaacgatatagtctattaatg26580

catatatagtatcgccgaacgattagctcttcaggcttctgaagaagcgtttcaagtact26640

aataagccgatagatagccacggacttcgtagccatttttcataagtgttaacttccgct26700

cctcgctcataacagacattcactacagttatggcggaaaggtatgcatgctgggtgtgg26760

ggaagtcgtgaaagaaaagaagtcagctgcgtcgtttgacatcactgctatcttcttact26820

ggttatgcaggtcgtagtgggtggcacacaaagctttgcactggattgcgaggctttgtg26880

cttctctggagtgcgacaggtttgatgacaaaaaattagcgcaagaagacaaaaatcacc26940

ttgcgctaatgctctgttacaggtcactaataccatctaagtagttgattcatagtgact27000

gcatatgttgtgttttacagtattatgtagtctgttttttatgcaaaatctaatttaata27060

tattgatatttatatcattttacgtttctcgttcagcttttttatactaagttggcatta27120

taaaaaagcattgcttatcaatttgttgcaacgaacaggtcactatcagtcaaaataaaa27180

tcattatttgatttcaattttgtcccactccctgcctctgtcatcacgatactgtgatgc27240

catggtgtccgacttatgcccgagaagatgttgagcaaacttatcgcttatctgcttctc27300

atagagtcttgcagacaaactgcgcaactcgtgaaaggtaggcggatccccttcgaagga27360

aagacctgatgcttttcgtgcgcgcataaaataccttgatactgtgccggatgaaagcgg27420

ttcgcgacgagtagatgcaattatggtttctccgccaagaatctctttgcatttatcaag27480

tgtttccttcattgatattccgagagcatcaatatgcaatgctgttgggatggcaatttt27540

tacgcctgttttgctttgctcgacataaagatatccatctacgatatcagaccacttcat27600

ttcgcataaatcaccaactcgttgcccggtaacaacagccagttccattgcaagtctgag27660

ccaacatggtgatgattctgctgcttgataaattttcaggtattcgtcagccgtaagtct27720

tgatctccttacctctgattttgctgcgcgagtggcagcgacatggtttgttgttatatg27780

gccttcagctattgcctctcggaatgcatcgctcagtgttgatctgattaacttggctga27840

cgccgccttgccctcgtctatgtatccattgagcattgccgcaatttcttttgtggtgat27900

gtcttcaagtggagcatcaggcagacccctccttattgctttaattttgctcatgtaatt27960

tatgagtgtcttctgcttgattcctctgctggccaggattttttcgtagcgatcaagcca28020

tgaatgtaacgtaacggaattatcactgttgattctcgctgtcagaggcttgtgtttgtg28080

tcctgaaaataactcaatgttggcctgtatagcttcagtgattgcgattcgcctgtctct28140

gcctaatccaaactctttacccgtccttgggtccctgtagcagtaatatccattgtttct28200

tatataaaggttagggggtaaatcccggcgctcatgacttcgccttcttcccatttctga28260

tcctcttcaaaaggccacctgttactggtcgatttaagtcaacctttaccgctgattcgt28320

ggaacagatactctcttccatccttaaccggaggtgggaatatcctgcattcccgaaccc28380

atcgacgaactgtttcaaggcttcttggacgtcgctggcgtgcgttccactcctgaagtg28440

tcaagtacatcgcaaagtctccgcaattacacgcaagaaaaaaccgccatcaggcggctt28500

ggtgttctttcagttcttcaattcgaatattggttacgtctgcatgtgctatctgcgccc28560

atatcatccagtggtcgtagcagtcgttgatgttctccgcttcgataactctgttgaatg28620

gctctccattccattctcctgtgactcggaagtgcatttatcatctccataaaacaaaac28680

ccgccgtagcgagttcagataaaataaatccccgcgagtgcgaggattgttatgtaatat28740

tgggtttaatcatctatatgttttgtacagagagggcaagtatcgtttccaccgtactcg28800

tgataataattttgcacggtatcagtcatttctcgcacattgcagaatggggatttgtct28860

tcattagacttataaaccttcatggaatatttgtatgccgactctatatctataccttca28920

tctacataaacaccttcgtgatgtctgcatggagacaagacaccggatctgcacaacatt28980

gataacgcccaatctttttgctcagactctaactcattgatactcatttataaactcctt29040

gcaatgtatgtcgtttcagctaaacggtatcagcaatgtttatgtaaagaaacagtaaga29100

taatactcaacccgatgtttgagtacggtcatcatctgacactacagactctggcatcgc29160

tgtgaagacgacgcgaaattcagcattttcacaagcgttatcttttacaaaaccgatctc29220

actctcctttgatgcgaatgccagcgtcagacatcatatgcagatactcacctgcatcct29280

gaacccattgacctccaaccccgtaatagcgatgcgtaatgatgtcgatagttactaacg29340

ggtcttgttcgattaactgccgcagaaactcttccaggtcaccagtgcagtgcttgataa29400

caggagtcttcccaggatggcgaacaacaagaaactggtttccgtcttcacggacttcgt29460

tgctttccagtttagcaatacgcttactcccatccgagataacaccttcgtaatactcac29520

gctgctcgttgagttttgattttgctgtttcaagctcaacacgcagtttccctactgtta29580

gcgcaatatcctcgttctcctggtcgcggcgtttgatgtattgctggtttctttcccgtt29640

catccagcagttccagcacaatcgatggtgttaccaattcatggaaaaggtctgcgtcaa29700

atccccagtcgtcatgcattgcctgctctgccgcttcacgcagtgcctgagagttaattt29760

cgctcacttcgaacctctctgtttactgataagttccagatcctcctggcaacttgcaca29820

agtccgacaaccctgaacgaccaggcgtcttcgttcatctatcggatcgccacactcaca29880

acaatgagtggcagatatagcctggtggttcaggcggcgcatttttattgctgtgttgcg29940

ctgtaattcttctatttctgatgctgaatcaatgatgtctgccatctttcattaatccct30000

gaactgttggttaatacgcttgagggtgaatgcgaataataaaaaaggagcctgtagctc30060

cctgatgattttgcttttcatgttcatcgttccttaaagacgccgtttaacatgccgatt30120

gccaggcttaaatgagtcggtgtgaatcccatcagcgttaccgtttcgcggtgcttcttc30180

agtacgctacggcaaatgtcatcgacgtttttatccggaaactgctgtctggcttttttt30240

gatttcagaattagcctgacgggcaatgctgcgaagggcgttttcctgctgaggtgtcat30300

tgaacaagtcccatgtcggcaagcataagcacacagaatatgaagcccgctgccagaaaa30360

atgcattccgtggttgtcatacctggtttctctcatctgcttctgctttcgccaccatca30420

tttccagcttttgtgaaagggatgcggctaacgtatgaaattcttcgtctgtttctactg30480

gtattggcacaaacctgattccaatttgagcaaggctatgtgccatctcgatactcgttc30540

ttaactcaacagaagatgctttgtgcatacagcccctcgtttattatttatctcctcagc30600

cagccgctgtgctttcagtggatttcggataacagaaaggccgggaaatacccagcctcg30660

ctttgtaacggagtagacgaaagtgattgcgcctacccggatattatcgtgaggatgcgt30720

catcgccattgctccccaaatacaaaaccaatttcagccagtgcctcgtccattttttcg30780

atgaactccggcacgatctcgtcaaaactcgccatgtacttttcatcccgctcaatcacg30840

acataatgcaggccttcacgcttcatacgcgggtcatagttggcaaagtaccaggcattt30900

tttcgcgtcacccacatgctgtactgcacctgggccatgtaagctgactttatggcctcg30960

aaaccaccgagccggaacttcatgaaatcccgggaggtaaacgggcatttcagttcaagg31020

ccgttgccgtcactgcataaaccatcgggagagcaggcggtacgcatactttcgtcgcga31080

tagatgatcggggattcagtaacattcacgccggaagtgaattcaaacagggttctggcg31140

tcgttctcgtactgttttccccaggccagtgctttagcgttaacttccggagccacaccg31200

gtgcaaacctcagcaagcagggtgtggaagtaggacattttcatgtcaggccacttcttt31260

ccggagcggggttttgctatcacgttgtgaacttctgaagcggtgatgacgccgagccgt31320

aatttgtgccacgcatcatccccctgttcgacagctctcacatcgatcccggtacgctgc31380

aggataatgtccggtgtcatgctgccaccttctgctctgcggctttctgtttcaggaatc31440

caagagcttttactgcttcggcctgtgtcagttctgacgatgcacgaatgtcgcggcgaa31500

atatctgggaacagagcggcaataagtcgtcatcccatgttttatccagggcgatcagca31560

gagtgttaatctcctgcatggtttcatcgttaaccggagtgatgtcgcgttccggctgac31620

gttctgcagtgtatgcagtattttcgacaatgcgctcggcttcatccttgtcatagatac31680

cagcaaatccgaaggccagacgggcacactgaatcatggctttatgacgtaacatccgtt31740

tgggatgcgactgccacggccccgtgatttctctgccttcgcgagttttgaatggttcgc31800

ggcggcattcatccatccattcggtaacgcagatcggatgattacggtccttgcggtaaa31860

tccggcatgtacaggattcattgtcctgctcaaagtccatgccatcaaactgctggtttt31920

cattgatgatgcgggaccagccatcaacgcccaccaccggaacgatgccattctgcttat31980

caggaaaggcgtaaatttctttcgtccacggattaaggccgtactggttggcaacgatca32040

gtaatgcgatgaactgcgcatcgctggcatcacctttaaatgccgtctggcgaagagtgg32100

tgatcagttcctgtgggtcgacagaatccatgccgacacgttcagccagcttcccagcca32160

gcgttgcgagtgcagtactcattcgttttatacctctgaatcaatatcaacctggtggtg32220

agcaatggtttcaaccatgtaccggatgtgttctgccatgcgctcctgaaactcaacatc32280

gtcatcaaacgcacgggtaatggattttttgctggccccgtggcgttgcaaatgatcgat32340

gcatagcgattcaaacaggtgctggggcaggcctttttccatgtcgtctgccagttctgc32400

ctctttctcttcacgggcgagctgctggtagtgacgcgcccagctctgagcctcaagacg32460

atcctgaatgtaataagcgttcatggctgaactcctgaaatagctgtgaaaatatcgccc32520

gcgaaatgccgggctgattaggaaaacaggaaagggggttagtgaatgcttttgcttgat32580

ctcagtttcagtattaatatccattttttataagcgtcgacggcttcacgaaacatcttt32640

tcatcgccaataaaagtggcgatagtgaatttagtctggatagccataagtgtttgatcc32700

attctttgggactcctggctgattaagtatgtcgataaggcgtttccatccgtcacgtaa32760

tttacgggtgattcgttcaagtaaagattcggaagggcagccagcaacaggccaccctgc32820

aatggcatattgcatggtgtgctccttatttatacataacgaaaaacgcctcgagtgaag32880

cgttattggtatgcggtaaaaccgcactcaggcggccttgatagtcatatcatctgaatc32940

aaatattcctgatgtatcgatatcggtaattcttattccttcgctaccatccattggagg33000

ccatccttcctgaccatttccatcattccagtcgaactcacacacaacaccatatgcatt33060

taagtcgcttgaaattgctataagcagagcatgttgcgccagcatgattaatacagcatt33120

taatacagagccgtgtttattgagtcggtattcagagtctgaccagaaattattaatctg33180

gtgaagtttttcctctgtcattacgtcatggtcgatttcaatttctattgatgctttcca33240

gtcgtaatcaatgatgtattttttgatgtttgacatctgttcatatcctcacagataaaa33300

aatcgccctcacactggagggcaaagaagatttccaataatcagaacaagtcggctcctg33360

tttagttacgagcgacattgctccgtgtattcactcgttggaatgaatacacagtgcagt33420

gtttattctgttatttatgccaaaaataaaggccactatcaggcagctttgttgttctgt33480

ttaccaagttctctggcaatcattgccgtcgttcgtattgcccatttatcgacatatttc33540

ccatcttccattacaggaaacatttcttcaggcttaaccatgcattccgattgcagcttg33600

catccattgcatcgcttgaattgtccacaccattgatttttatcaatagtcgtagtcata33660

cggatagtcctggtattgttccatcacatcctgaggatgctcttcgaactcttcaaattc33720

ttcttccatatatcaccttaaatagtggattgcggtagtaaagattgtgcctgtctttta33780

accacatcaggctcggtggttctcgtgtacccctacagcgagaaatcggataaactatta33840

caacccctacagtttgatgagtatagaaatggatccactcgttattctcggacgagtgtt33900

cagtaatgaacctctggagagaaccatgtatatgatcgttatctgggttggacttctgct33960

tttaagcccagataactggcctgaatatgttaatgagagaatcggtattcctcatgtgtg34020

gcatgttttcgtctttgctcttgcattttcgctagcaattaatgtgcatcgattatcagc34080

tattgccagcgccagatataagcgatttaagctaagaaaacgcattaagatgcaaaacga34140

taaagtgcgatcagtaattcaaaaccttacagaagagcaatctatggttttgtgcgcagc34200

ccttaatgaaggcaggaagtatgtggttacatcaaaacaattcccatacattagtgagtt34260

gattgagcttggtgtgttgaacaaaactttttcccgatggaatggaaagcatatattatt34320

ccctattgaggatatttactggactgaattagttgccagctatgatccatataatattga34380

gataaagccaaggccaatatctaagtaactagataagaggaatcgattttcccttaattt34440

tctggcgtccactgcatgttatgccgcgttcgccaggcttgctgtaccatgtgcgctgat34500

tcttgcgctcaatacgttgcaggttgctttcaatctgtttgtggtattcagccagcactg34560

taaggtctatcggatttagtgcgctttctactcgtgatttcggtttgcgattcagcgaga34620

gaatagggcggttaactggttttgcgcttaccccaaccaacaggggatttgctgctttcc34680

attgagcctgtttctctgcgcgacgttcgcggcggcgtgtttgtgcatccatctggattc34740

tcctgtcagttagctttggtggtgtgtggcagttgtagtcctgaacgaaaaccccccgcg34800

attggcacattggcagctaatccggaatcgcacttacggccaatgcttcgtttcgtatca34860

cacaccccaaagccttctgctttgaatgctgcccttcttcagggcttaatttttaagagc34920

gtcaccttcatggtggtcagtgcgtcctgctgatgtgctcagtatcaccgccagtggtat34980

ttatgtcaacaccgccagagataatttatcaccgcagatggttatctgtatgttttttat35040

atgaatttattttttgcaggggggcattgtttggtaggtgagagatctgaattgctatgt35100

ttagtgagttgtatctatttatttttcaataaatacaattggttatgtgttttgggggcg35160

atcgtgaggcaaagaaaacccggcgctgaggccgggttattcttgttctctggtcaaatt35220

atatagttggaaaacaaggatgcatatatgaatgaacgatgcagaggcaatgccgatggc35280

gatagtgggtatcatgtagccgcttatgctggaaagaagcaataacccgcagaaaaacaa35340

agctccaagctcaacaaaactaagggcatagacaataactaccgatgtcatatacccata35400

ctctctaatcttggccagtcggcgcgttctgcttccgattagaaacgtcaaggcagcaat35460

caggattgcaatcatggttcctgcatatgatgacaatgtcgccccaagaccatctctatg35520

agctgaaaaagaaacaccaggaatgtagtggcggaaaaggagatagcaaatgcttacgat35580

aacgtaaggaattattactatgtaaacaccaggcatgattctgttccgcataattactcc35640

tgataattaatccttaactttgcccacctgccttttaaaacattccagtatatcactttt35700

cattcttgcgtagcaatatgccatctcttcagctatctcagcattggtgaccttgttcag35760

aggcgctgagagatggcctttttctgatagataatgttctgttaaaatatctccggcctc35820

atcttttgcccgcaggctaatgtctgaaaattgaggtgacgggttaaaaataatatcctt35880

ggcaaccttttttatatcccttttaaattttggcttaatgactatatccaatgagtcaaa35940

aagctccccttcaatatctgttgcccctaagacctttaatatatcgccaaatacaggtag36000

cttggcttctaccttcaccgttgttcggccgatgaaatgcatatgcataacatcgtcttt36060

ggtggttcccctcatcagtggctctatctgaacgcgctctccactgcttaatgacattcc36120

tttcccgattaaaaaatctgtcagatcggatgtggtcggcccgaaaacagttctggcaaa36180

accaatggtgtcgccttcaacaaacaaaaaagatgggaatcccaatgattcgtcatctgc36240

gaggctgttcttaatatcttcaactgaagctttagagcgatttatcttctgaaccagact36300

cttgtcatttgttttggtaaagagaaaagtttttccatcgattttatgaatatacaaata36360

attggagccaacctgcaggtgatgattatcagccagcagagaattaaggaaaacagacag36420

gtttattgagcgcttatctttccctttatttttgctgcggtaagtcgcataaaaaccatt36480

cttcataattcaatccatttactatgttatgttctgaggggagtgaaaattcccctaatt36540

cgatgaagattcttgctcaattgttatcagctatgcgccgaccagaacaccttgccgatc36600

agccaaacgtctcttcaggccactgactagcgataactttccccacaacggaacaactct36660

cattgcatgggatcattgggtactgtgggtttagtggttgtaaaaacacctgaccgctat36720

ccctgatcagtttcttgaaggtaaactcatcacccccaagtctggctatgcagaaatcac36780

ctggctcaacagcctgctcagggtcaacgagaattaacattccgtcaggaaagcttggct36840

tggagcctgttggtgcggtcatggaattaccttcaacctcaagccagaatgcagaatcac36900

tggcttttttggttgtgcttacccatctctccgcatcacctttggtaaaggttctaagct36960

caggtgagaacatccctgcctgaacatgagaaaaaacagggtactcatactcacttctaa37020

gtgacggctgcatactaaccgcttcatacatctcgtagatttctctggcgattgaagggc37080

taaattcttcaacgctaactttgagaatttttgcaagcaatgcggcgttataagcattta37140

atgcattgatgccattaaataaagcaccaacgcctgactgccccatccccatcttgtctg37200

cgacagattcctgggataagccaagttcatttttctttttttcataaattgctttaaggc37260

gacgtgcgtcctcaagctgctcttgtgttaatggtttcttttttgtgctcatacgttaaa37320

tctatcaccgcaagggataaatatctaacaccgtgcgtgttgactattttacctctggcg37380

gtgataatggttgcatgtactaaggaggttgtatggaacaacgcataaccctgaaagatt37440

atgcaatgcgctttgggcaaaccaagacagctaaagatctcggcgtatatcaaagcgcga37500

tcaacaaggccattcatgcaggccgaaagatttttttaactataaacgctgatggaagcg37560

tttatgcggaagaggtaaagcccttcccgagtaacaaaaaaacaacagcataaataaccc37620

cgctcttacacattccagccctgaaaaagggcatcaaattaaaccacacctatggtgtat37680

gcatttatttgcatacattcaatcaattgttatctaaggaaatacttacatatggttcgt37740

gcaaacaaacgcaacgaggctctacgaatcgagagtgcgttgcttaacaaaatcgcaatg37800

cttggaactgagaagacagcggaagctgtgggcgttgataagtcgcagatcagcaggtgg37860

aagagggactggattccaaagttctcaatgctgcttgctgttcttgaatggggggtcgtt37920

gacgacgacatggctcgattggcgcgacaagttgctgcgattctcaccaataaaaaacgc37980

ccggcggcaaccgagcgttctgaacaaatccagatggagttctgaggtcattactggatc38040

tatcaacaggagtcattatgacaaatacagcaaaaatactcaacttcggcagaggtaact38100

ttgccggacaggagcgtaatgtggcagatctcgatgatggttacgccagactatcaaata38160

tgctgcttgaggcttattcgggcgcagatctgaccaagcgacagtttaaagtgctgcttg38220

ccattctgcgtaaaacctatgggtggaataaaccaatggacagaatcaccgattctcaac38280

ttagcgagattacaaagttacctgtcaaacggtgcaatgaagccaagttagaactcgtca38340

gaatgaatattatcaagcagcaaggcggcatgtttggaccaaataaaaacatctcagaat38400

ggtgcatccctcaaaacgagggaaaatcccctaaaacgagggataaaacatccctcaaat38460

tgggggattgctatccctcaaaacagggggacacaaaagacactattacaaaagaaaaaa38520

gaaaagattattcgtcagagaattctggcgaatcctctgaccagccagaaaacgaccttt38580

ctgtggtgaaaccggatgctgcaattcagagcggcagcaagtgggggacagcagaagacc38640

tgaccgccgcagagtggatgtttgacatggtgaagactatcgcaccatcagccagaaaac38700

cgaattttgctgggtgggctaacgatatccgcctgatgcgtgaacgtgacggacgtaacc38760

accgcga38767

<210>8

<211>9107

<212>dna

<213>artificialsequence

<220>

<223>lambdadna

<400>8

catgtgtgtgctgttccgctgggcatgccaggacaacttctggtccggtaacgtgctgag60

cccggccaaactccgcgataagtggacccaactcgaaatcaaccgtaacaagcaacaggc120

aggcgtgacagccagcaaaccaaaactcgacctgacaaacacagactggatttacggggt180

ggatctatgaaaaacatcgccgcacagatggttaactttgaccgtgagcagatgcgtcgg240

atcgccaacaacatgccggaacagtacgacgaaaagccgcaggtacagcaggtagcgcag300

atcatcaacggtgtgttcagccagttactggcaactttcccggcgagcctggctaaccgt360

gaccagaacgaagtgaacgaaatccgtcgccagtgggttctggcttttcgggaaaacggg420

atcaccacgatggaacaggttaacgcaggaatgcgcgtagcccgtcggcagaatcgacca480

tttctgccatcacccgggcagtttgttgcatggtgccgggaagaagcatccgttaccgcc540

ggactgccaaacgtcagcgagctggttgatatggtttacgagtattgccggaagcgaggc600

ctgtatccggatgcggagtcttatccgtggaaatcaaacgcgcactactggctggttacc660

aacctgtatcagaacatgcgggccaatgcgcttactgatgcggaattacgccgtaaggcc720

gcagatgagcttgtccatatgactgcgagaattaaccgtggtgaggcgatccctgaacca780

gtaaaacaacttcctgtcatgggcggtagacctctaaatcgtgcacaggctctggcgaag840

atcgcagaaatcaaagctaagttcggactgaaaggagcaagtgtatgacgggcaaagagg900

caattattcattacctggggacgcataatagcttctgtgcgccggacgttgccgcgctaa960

caggcgcaacagtaaccagcataaatcaggccgcggctaaaatggcacgggcaggtcttc1020

tggttatcgaaggtaaggtctggcgaacggtgtattaccggtttgctaccagggaagaac1080

gggaaggaaagatgagcacgaacctggtttttaaggagtgtcgccagagtgccgcgatga1140

aacgggtattggcggtatatggagttaaaagatgaccatctacattactgagctaataac1200

aggcctgctggtaatcgcaggcctttttatttgggggagagggaagtcatgaaaaaacta1260

acctttgaaattcgatctccagcacatcagcaaaacgctattcacgcagtacagcaaatc1320

cttccagacccaaccaaaccaatcgtagtaaccattcaggaacgcaaccgcagcttagac1380

caaaacaggaagctatgggcctgcttaggtgacgtctctcgtcaggttgaatggcatggt1440

cgctggctggatgcagaaagctggaagtgtgtgtttaccgcagcattaaagcagcaggat1500

gttgttcctaaccttgccgggaatggctttgtggtaataggccagtcaaccagcaggatg1560

cgtgtaggcgaatttgcggagctattagagcttatacaggcattcggtacagagcgtggc1620

gttaagtggtcagacgaagcgagactggctctggagtggaaagcgagatggggagacagg1680

gctgcatgataaatgtcgttagtttctccggtggcaggacgtcagcatatttgctctggc1740

taatggagcaaaagcgacgggcaggtaaagacgtgcattacgttttcatggatacaggtt1800

gtgaacatccaatgacatatcggtttgtcagggaagttgtgaagttctgggatataccgc1860

tcaccgtattgcaggttgatatcaacccggagcttggacagccaaatggttatacggtat1920

gggaaccaaaggatattcagacgcgaatgcctgttctgaagccatttatcgatatggtaa1980

agaaatatggcactccatacgtcggcggcgcgttctgcactgacagattaaaactcgttc2040

ccttcaccaaatactgtgatgaccatttcgggcgagggaattacaccacgtggattggca2100

tcagagctgatgaaccgaagcggctaaagccaaagcctggaatcagatatcttgctgaac2160

tgtcagactttgagaaggaagatatcctcgcatggtggaagcaacaaccattcgatttgc2220

aaataccggaacatctcggtaactgcatattctgcattaaaaaatcaacgcaaaaaatcg2280

gacttgcctgcaaagatgaggagggattgcagcgtgtttttaatgaggtcatcacgggat2340

cccatgtgcgtgacggacatcgggaaacgccaaaggagattatgtaccgaggaagaatgt2400

cgctggacggtatcgcgaaaatgtattcagaaaatgattatcaagccctgtatcaggaca2460

tggtacgagctaaaagattcgataccggctcttgttctgagtcatgcgaaatatttggag2520

ggcagcttgatttcgacttcgggagggaagctgcatgatgcgatgttatcggtgcggtga2580

atgcaaagaagataaccgcttccgaccaaatcaaccttactggaatcgatggtgtctccg2640

gtgtgaaagaacaccaacaggggtgttaccactaccgcaggaaaaggaggacgtgtggcg2700

agacagcgacgaagtatcaccgacataatctgcgaaaactgcaaataccttccaacgaaa2760

cgcaccagaaataaacccaagccaatcccaaaagaatctgacgtaaaaaccttcaactac2820

acggctcacctgtgggatatccggtggctaagacgtcgtgcgaggaaaacaaggtgattg2880

accaaaatcgaagttacgaacaagaaagcgtcgagcgagctttaacgtgcgctaactgcg2940

gtcagaagctgcatgtgctggaagttcacgtgtgtgagcactgctgcgcagaactgatga3000

gcgatccgaatagctcgatgcacgaggaagaagatgatggctaaaccagcgcgaagacga3060

tgtaaaaacgatgaatgccgggaatggtttcaccctgcattcgctaatcagtggtggtgc3120

tctccagagtgtggaaccaagatagcactcgaacgacgaagtaaagaacgcgaaaaagcg3180

gaaaaagcagcagagaagaaacgacgacgagaggagcagaaacagaaagataaacttaag3240

attcgaaaactcgccttaaagccccgcagttactggattaaacaagcccaacaagccgta3300

aacgccttcatcagagaaagagaccgcgacttaccatgtatctcgtgcggaacgctcacg3360

tctgctcagtgggatgccggacattaccggacaactgctgcggcacctcaactccgattt3420

aatgaacgcaatattcacaagcaatgcgtggtgtgcaaccagcacaaaagcggaaatctc3480

gttccgtatcgcgtcgaactgattagccgcatcgggcaggaagcagtagacgaaatcgaa3540

tcaaaccataaccgccatcgctggactatcgaagagtgcaaggcgatcaaggcagagtac3600

caacagaaactcaaagacctgcgaaatagcagaagtgaggccgcatgacgttctcagtaa3660

aaaccattccagacatgctcgttgaagcatacggaaatcagacagaagtagcacgcagac3720

tgaaatgtagtcgcggtacggtcagaaaatacgttgatgataaagacgggaaaatgcacg3780

ccatcgtcaacgacgttctcatggttcatcgcggatggagtgaaagagatgcgctattac3840

gaaaaaattgatggcagcaaataccgaaatatttgggtagttggcgatctgcacggatgc3900

tacacgaacctgatgaacaaactggatacgattggattcgacaacaaaaaagacctgctt3960

atctcggtgggcgatttggttgatcgtggtgcagagaacgttgaatgcctggaattaatc4020

acattcccctggttcagagctgtacgtggaaaccatgagcaaatgatgattgatggctta4080

tcagagcgtggaaacgttaatcactggctgcttaatggcggtggctggttctttaatctc4140

gattacgacaaagaaattctggctaaagctcttgcccataaagcagatgaacttccgtta4200

atcatcgaactggtgagcaaagataaaaaatatgttatctgccacgccgattatcccttt4260

gacgaatacgagtttggaaagccagttgatcatcagcaggtaatctggaaccgcgaacga4320

atcagcaactcacaaaacgggatcgtgaaagaaatcaaaggcgcggacacgttcatcttt4380

ggtcatacgccagcagtgaaaccactcaagtttgccaaccaaatgtatatcgataccggc4440

gcagtgttctgcggaaacctaacattgattcaggtacagggagaaggcgcatgagactcg4500

aaagcgtagctaaatttcattcgccaaaaagcccgatgatgagcgactcaccacgggcca4560

cggcttctgactctctttccggtactgatgtgatggctgctatggggatggcgcaatcac4620

aagccggattcggtatggctgcattctgcggtaagcacgaactcagccagaacgacaaac4680

aaaaggctatcaactatctgatgcaatttgcacacaaggtatcggggaaataccgtggtg4740

tggcaaagcttgaaggaaatactaaggcaaaggtactgcaagtgctcgcaacattcgctt4800

atgcggattattgccgtagtgccgcgacgccgggggcaagatgcagagattgccatggta4860

caggccgtgcggttgatattgccaaaacagagctgtgggggagagttgtcgagaaagagt4920

gcggaagatgcaaaggcgtcggctattcaaggatgccagcaagcgcagcatatcgcgctg4980

tgacgatgctaatcccaaaccttacccaacccacctggtcacgcactgttaagccgctgt5040

atgacgctctggtggtgcaatgccacaaagaagagtcaatcgcagacaacattttgaatg5100

cggtcacacgttagcagcatgattgccacggatggcaacatattaacggcatgatattga5160

cttattgaataaaattgggtaaatttgactcaacgatgggttaattcgctcgttgtggta5220

gtgagatgaaaagaggcggcgcttactaccgattccgcctagttggtcacttcgacgtat5280

cgtctggaactccaaccatcgcaggcagagaggtctgcaaaatgcaatcccgaaacagtt5340

cgcaggtaatagttagagcctgcataacggtttcgggattttttatatctgcacaacagg5400

taagagcattgagtcgataatcgtgaagagtcggcgagcctggttagccagtgctctttc5460

cgttgtgctgaattaagcgaataccggaagcagaaccggatcaccaaatgcgtacaggcg5520

tcatcgccgcccagcaacagcacaacccaaactgagccgtagccactgtctgtcctgaat5580

tcattagtaatagttacgctgcggccttttacacatgaccttcgtgaaagcgggtggcag5640

gaggtcgcgctaacaacctcctgccgttttgcccgtgcatatcggtcacgaacaaatctg5700

attactaaacacagtagcctggatttgttctatcagtaatcgaccttattcctaattaaa5760

tagagcaaatccccttattgggggtaagacatgaagatgccagaaaaacatgacctgttg5820

gccgccattctcgcggcaaaggaacaaggcatcggggcaatccttgcgtttgcaatggcg5880

taccttcgcggcagatataatggcggtgcgtttacaaaaacagtaatcgacgcaacgatg5940

tgcgccattatcgcctggttcattcgtgaccttctcgacttcgccggactaagtagcaat6000

ctcgcttatataacgagcgtgtttatcggctacatcggtactgactcgattggttcgctt6060

atcaaacgcttcgctgctaaaaaagccggagtagaagatggtagaaatcaataatcaacg6120

taaggcgttcctcgatatgctggcgtggtcggagggaactgataacggacgtcagaaaac6180

cagaaatcatggttatgacgtcattgtaggcggagagctatttactgattactccgatca6240

ccctcgcaaacttgtcacgctaaacccaaaactcaaatcaacaggcgccggacgctacca6300

gcttctttcccgttggtgggatgcctaccgcaagcagcttggcctgaaagacttctctcc6360

gaaaagtcaggacgctgtggcattgcagcagattaaggagcgtggcgctttacctatgat6420

tgatcgtggtgatatccgtcaggcaatcgaccgttgcagcaatatctgggcttcactgcc6480

gggcgctggttatggtcagttcgagcataaggctgacagcctgattgcaaaattcaaaga6540

agcgggcggaacggtcagagagattgatgtatgagcagagtcaccgcgattatctccgct6600

ctggttatctgcatcatcgtctgcctgtcatgggctgttaatcattaccgtgataacgcc6660

attacctacaaagcccagcgcgacaaaaatgccagagaactgaagctggcgaacgcggca6720

attactgacatgcagatgcgtcagcgtgatgttgctgcgctcgatgcaaaatacacgaag6780

gagttagctgatgctaaagctgaaaatgatgctctgcgtgatgatgttgccgctggtcgt6840

cgtcggttgcacatcaaagcagtctgtcagtcagtgcgtgaagccaccaccgcctccggc6900

gtggataatgcagcctccccccgactggcagacaccgctgaacgggattatttcaccctc6960

agagagaggctgatcactatgcaaaaacaactggaaggaacccagaagtatattaatgag7020

cagtgcagatagagttgcccatatcgatgggcaactcatgcaattattgtgagcaataca7080

cacgcgcttccagcggagtataaatgcctaaagtaataaaaccgagcaatccatttacga7140

atgtttgctgggtttctgttttaacaacattttctgcgccgccacaaattttggctgcat7200

cgacagttttcttctgcccaattccagaaacgaagaaatgatgggtgatggtttcctttg7260

gtgctactgctgccggtttgttttgaacagtaaacgtctgttgagcacatcctgtaataa7320

gcagggccagcgcagtagcgagtagcatttttttcatggtgttattcccgatgctttttg7380

aagttcgcagaatcgtatgtgtagaaaattaaacaaaccctaaacaatgagttgaaattt7440

catattgttaatatttattaatgtatgtcaggtgcgatgaatcgtcattgtattcccgga7500

ttaactatgtccacagccctgacggggaacttctctgcgggagtgtccgggaataattaa7560

aacgatgcacacagggtttagcgcgtacacgtattgcattatgccaacgccccggtgctg7620

acacggaagaaaccggacgttatgatttagcgtggaaagatttgtgtagtgttctgaatg7680

ctctcagtaaatagtaatgaattatcaaaggtatagtaatatcttttatgttcatggata7740

tttgtaacccatcggaaaactcctgctttagcaagattttccctgtattgctgaaatgtg7800

atttctcttgatttcaacctatcataggacgtttctataagatgcgtgtttcttgagaat7860

ttaacatttacaacctttttaagtccttttattaacacggtgttatcgttttctaacacg7920

atgtgaatattatctgtggctagatagtaaatataatgtgagacgttgtgacgttttagt7980

tcagaataaaacaattcacagtctaaatcttttcgcacttgatcgaatatttctttaaaa8040

atggcaacctgagccattggtaaaaccttccatgtgatacgagggcgcgtagtttgcatt8100

atcgtttttatcgtttcaatctggtctgacctccttgtgttttgttgatgatttatgtca8160

aatattaggaatgttttcacttaatagtattggttgcgtaacaaagtgcggtcctgctgg8220

cattctggagggaaatacaaccgacagatgtatgtaaggccaacgtgctcaaatcttcat8280

acagaaagatttgaagtaatattttaaccgctagatgaagagcaagcgcatggagcgaca8340

aaatgaataaagaacaatctgctgatgatccctccgtggatctgattcgtgtaaaaaata8400

tgcttaatagcaccatttctatgagttaccctgatgttgtaattgcatgtatagaacata8460

aggtgtctctggaagcattcagagcaattgaggcagcgttggtgaagcacgataataata8520

tgaaggattattccctggtggttgactgatcaccataactgctaatcattcaaactattt8580

agtctgtgacagagccaacacgcagtctgtcactgtcaggaaagtggtaaaactgcaact8640

caattactgcaatgccctcgtaattaagtgaatttacaatatcgtcctgttcggagggaa8700

gaacgcgggatgttcattcttcatcacttttaattgatgtatatgctctcttttctgacg8760

ttagtctccgacggcaggcttcaatgacccaggctgagaaattcccggaccctttttgct8820

caagagcgatgttaatttgttcaatcatttggttaggaaagcggatgttgcgggttgttg8880

ttctgcgggttctgttcttcgttgacatgaggttgccccgtattcagtgtcgctgatttg8940

tattgtctgaagttgtttttacgttaagttgatgcagatcaattaatacgatacctgcgt9000

cataattgattatttgacgtggtttgatggcctccacgcacgttgtgatatgtagatgat9060

aatcattatcactttacgggtcctttccggtgatccgacaggttacg9107

<210>9

<211>19604

<212>dna

<213>artificialsequence

<220>

<223>lambdadna

<400>9

catgttgatttcctgaaacgggatatcatcaaagccatgaacaaagcagccgcgctggat60

gaactgataccggggttgctgagtgaatatatcgaacagtcaggttaacaggctgcggca120

ttttgtccgcgccgggcttcgctcactgttcaggccggagccacagaccgccgttgaatg180

ggcggatgctaattactatctcccgaaagaatccgcataccaggaagggcgctgggaaac240

actgccctttcagcgggccatcatgaatgcgatgggcagcgactacatccgtgaggtgaa300

tgtggtgaagtctgcccgtgtcggttattccaaaatgctgctgggtgtttatgcctactt360

tatagagcataagcagcgcaacacccttatctggttgccgacggatggtgatgccgagaa420

ctttatgaaaacccacgttgagccgactattcgtgatattccgtcgctgctggcgctggc480

cccgtggtatggcaaaaagcaccgggataacacgctcaccatgaagcgtttcactaatgg540

gcgtggcttctggtgcctgggcggtaaagcggcaaaaaactaccgtgaaaagtcggtgga600

tgtggcgggttatgatgaacttgctgcttttgatgatgatattgaacaggaaggctctcc660

gacgttcctgggtgacaagcgtattgaaggctcggtctggccaaagtccatccgtggctc720

cacgccaaaagtgagaggcacctgtcagattgagcgtgcagccagtgaatccccgcattt780

tatgcgttttcatgttgcctgcccgcattgcggggaggagcagtatcttaaatttggcga840

caaagagacgccgtttggcctcaaatggacgccggatgacccctccagcgtgttttatct900

ctgcgagcataatgcctgcgtcatccgccagcaggagctggactttactgatgcccgtta960

tatctgcgaaaagaccgggatctggacccgtgatggcattctctggttttcgtcatccgg1020

tgaagagattgagccacctgacagtgtgacctttcacatctggacagcgtacagcccgtt1080

caccacctgggtgcagattgtcaaagactggatgaaaacgaaaggggatacgggaaaacg1140

taaaaccttcgtaaacaccacgctcggtgagacgtgggaggcgaaaattggcgaacgtcc1200

ggatgctgaagtgatggcagagcggaaagagcattattcagcgcccgttcctgaccgtgt1260

ggcttacctgaccgccggtatcgactcccagctggaccgctacgaaatgcgcgtatgggg1320

atgggggccgggtgaggaaagctggctgattgaccggcagattattatgggccgccacga1380

cgatgaacagacgctgctgcgtgtggatgaggccatcaataaaacctatacccgccggaa1440

tggtgcagaaatgtcgatatcccgtatctgctgggatactggcgggattgacccgaccat1500

tgtgtatgaacgctcgaaaaaacatgggctgttccgggtgatccccattaaaggggcatc1560

cgtctacggaaagccggtggccagcatgccacgtaagcgaaacaaaaacggggtttacct1620

taccgaaatcggtacggataccgcgaaagagcagatttataaccgcttcacactgacgcc1680

ggaaggggatgaaccgcttcccggtgccgttcacttcccgaataacccggatatttttga1740

tctgaccgaagcgcagcagctgactgctgaagagcaggtcgaaaaatgggtggatggcag1800

gaaaaaaatactgtgggacagcaaaaagcgacgcaatgaggcactcgactgcttcgttta1860

tgcgctggcggcgctgcgcatcagtatttcccgctggcagctggatctcagtgcgctgct1920

ggcgagcctgcaggaagaggatggtgcagcaaccaacaagaaaacactggcagattacgc1980

ccgtgccttatccggagaggatgaatgacgcgacaggaagaacttgccgctgcccgtgcg2040

gcactgcatgacctgatgacaggtaaacgggtggcaacagtacagaaagacggacgaagg2100

gtggagtttacggccacttccgtgtctgacctgaaaaaatatattgcagagctggaagtg2160

cagaccggcatgacacagcgacgcaggggacctgcaggattttatgtatgaaaacgccca2220

ccattcccacccttctggggccggacggcatgacatcgctgcgcgaatatgccggttatc2280

acggcggtggcagcggatttggagggcagttgcggtcgtggaacccaccgagtgaaagtg2340

tggatgcagccctgttgcccaactttacccgtggcaatgcccgcgcagacgatctggtac2400

gcaataacggctatgccgccaacgccatccagctgcatcaggatcatatcgtcgggtctt2460

ttttccggctcagtcatcgcccaagctggcgctatctgggcatcggggaggaagaagccc2520

gtgccttttcccgcgaggttgaagcggcatggaaagagtttgccgaggatgactgctgct2580

gcattgacgttgagcgaaaacgcacgtttaccatgatgattcgggaaggtgtggccatgc2640

acgcctttaacggtgaactgttcgttcaggccacctgggataccagttcgtcgcggcttt2700

tccggacacagttccggatggtcagcccgaagcgcatcagcaacccgaacaataccggcg2760

acagccggaactgccgtgccggtgtgcagattaatgacagcggtgcggcgctgggatatt2820

acgtcagcgaggacgggtatcctggctggatgccgcagaaatggacatggataccccgtg2880

agttacccggcgggcgcgcctcgttcattcacgtttttgaacccgtggaggacgggcaga2940

ctcgcggtgcaaatgtgttttacagcgtgatggagcagatgaagatgctcgacacgctgc3000

agaacacgcagctgcagagcgccattgtgaaggcgatgtatgccgccaccattgagagtg3060

agctggatacgcagtcagcgatggattttattctgggcgcgaacagtcaggagcagcggg3120

aaaggctgaccggctggattggtgaaattgccgcgtattacgccgcagcgccggtccggc3180

tgggaggcgcaaaagtaccgcacctgatgccgggtgactcactgaacctgcagacggctc3240

aggatacggataacggctactccgtgtttgagcagtcactgctgcggtatatcgctgccg3300

ggctgggtgtctcgtatgagcagctttcccggaattacgcccagatgagctactccacgg3360

cacgggccagtgcgaacgagtcgtgggcgtactttatggggcggcgaaaattcgtcgcat3420

cccgtcaggcgagccagatgtttctgtgctggctggaagaggccatcgttcgccgcgtgg3480

tgacgttaccttcaaaagcgcgcttcagttttcaggaagcccgcagtgcctgggggaact3540

gcgactggataggctccggtcgtatggccatcgatggtctgaaagaagttcaggaagcgg3600

tgatgctgatagaagccggactgagtacctacgagaaagagtgcgcaaaacgcggtgacg3660

actatcaggaaatttttgcccagcaggtccgtgaaacgatggagcgccgtgcagccggtc3720

ttaaaccgcccgcctgggcggctgcagcatttgaatccgggctgcgacaatcaacagagg3780

aggagaagagtgacagcagagctgcgtaatctcccgcatattgccagcatggcctttaat3840

gagccgctgatgcttgaacccgcctatgcgcgggttttcttttgtgcgcttgcaggccag3900

cttgggatcagcagcctgacggatgcggtgtccggcgacagcctgactgcccaggaggca3960

ctcgcgacgctggcattatccggtgatgatgacggaccacgacaggcccgcagttatcag4020

gtcatgaacggcatcgccgtgctgccggtgtccggcacgctggtcagccggacgcgggcg4080

ctgcagccgtactcggggatgaccggttacaacggcattatcgcccgtctgcaacaggct4140

gccagcgatccgatggtggacggcattctgctcgatatggacacgcccggcgggatggtg4200

gcgggggcatttgactgcgctgacatcatcgcccgtgtgcgtgacataaaaccggtatgg4260

gcgcttgccaacgacatgaactgcagtgcaggtcagttgcttgccagtgccgcctcccgg4320

cgtctggtcacgcagaccgcccggacaggctccatcggcgtcatgatggctcacagtaat4380

tacggtgctgcgctggagaaacagggtgtggaaatcacgctgatttacagcggcagccat4440

aaggtggatggcaacccctacagccatcttccggatgacgtccgggagacactgcagtcc4500

cggatggacgcaacccgccagatgtttgcgcagaaggtgtcggcatataccggcctgtcc4560

gtgcaggttgtgctggataccgaggctgcagtgtacagcggtcaggaggccattgatgcc4620

ggactggctgatgaacttgttaacagcaccgatgcgatcaccgtcatgcgtgatgcactg4680

gatgcacgtaaatcccgtctctcaggagggcgaatgaccaaagagactcaatcaacaact4740

gtttcagccactgcttcgcaggctgacgttactgacgtggtgccagcgacggagggcgag4800

aacgccagcgcggcgcagccggacgtgaacgcgcagatcaccgcagcggttgcggcagaa4860

aacagccgcattatggggatcctcaactgtgaggaggctcacggacgcgaagaacaggca4920

cgcgtgctggcagaaacccccggtatgaccgtgaaaacggcccgccgcattctggccgca4980

gcaccacagagtgcacaggcgcgcagtgacactgcgctggatcgtctgatgcagggggca5040

ccggcaccgctggctgcaggtaacccggcatctgatgccgttaacgatttgctgaacaca5100

ccagtgtaagggatgtttatgacgagcaaagaaacctttacccattaccagccgcagggc5160

aacagtgacccggctcataccgcaaccgcgcccggcggattgagtgcgaaagcgcctgca5220

atgaccccgctgatgctggacacctccagccgtaagctggttgcgtgggatggcaccacc5280

gacggtgctgccgttggcattcttgcggttgctgctgaccagaccagcaccacgctgacg5340

ttctacaagtccggcacgttccgttatgaggatgtgctctggccggaggctgccagcgac5400

gagacgaaaaaacggaccgcgtttgccggaacggcaatcagcatcgtttaactttaccct5460

tcatcactaaaggccgcctgtgcggctttttttacgggatttttttatgtcgatgtacac5520

aaccgcccaactgctggcggcaaatgagcagaaatttaagtttgatccgctgtttctgcg5580

tctctttttccgtgagagctatcccttcaccacggagaaagtctatctctcacaaattcc5640

gggactggtaaacatggcgctgtacgtttcgccgattgtttccggtgaggttatccgttc5700

ccgtggcggctccacctctgaatttacgccgggatatgtcaagccgaagcatgaagtgaa5760

tccgcagatgaccctgcgtcgcctgccggatgaagatccgcagaatctggcggacccggc5820

ttaccgccgccgtcgcatcatcatgcagaacatgcgtgacgaagagctggccattgctca5880

ggtcgaagagatgcaggcagtttctgccgtgcttaagggcaaatacaccatgaccggtga5940

agccttcgatccggttgaggtggatatgggccgcagtgaggagaataacatcacgcagtc6000

cggcggcacggagtggagcaagcgtgacaagtccacgtatgacccgaccgacgatatcga6060

agcctacgcgctgaacgccagcggtgtggtgaatatcatcgtgttcgatccgaaaggctg6120

ggcgctgttccgttccttcaaagccgtcaaggagaagctggatacccgtcgtggctctaa6180

ttccgagctggagacagcggtgaaagacctgggcaaagcggtgtcctataaggggatgta6240

tggcgatgtggccatcgtcgtgtattccggacagtacgtggaaaacggcgtcaaaaagaa6300

cttcctgccggacaacacgatggtgctggggaacactcaggcacgcggtctgcgcaccta6360

tggctgcattcaggatgcggacgcacagcgcgaaggcattaacgcctctgcccgttaccc6420

gaaaaactgggtgaccaccggcgatccggcgcgtgagttcaccatgattcagtcagcacc6480

gctgatgctgctggctgaccctgatgagttcgtgtccgtacaactggcgtaatcatggcc6540

cttcggggccattgtttctctgtggaggagtccatgacgaaagatgaactgattgcccgt6600

ctccgctcgctgggtgaacaactgaaccgtgatgtcagcctgacggggacgaaagaagaa6660

ctggcgctccgtgtggcagagctgaaagaggagcttgatgacacggatgaaactgccggt6720

caggacacccctctcagccgggaaaatgtgctgaccggacatgaaaatgaggtgggatca6780

gcgcagccggataccgtgattctggatacgtctgaactggtcacggtcgtggcactggtg6840

aagctgcatactgatgcacttcacgccacgcgggatgaacctgtggcatttgtgctgccg6900

ggaacggcgtttcgtgtctctgccggtgtggcagccgaaatgacagagcgcggcctggcc6960

agaatgcaataacgggaggcgctgtggctgatttcgataacctgttcgatgctgccattg7020

cccgcgccgatgaaacgatacgcgggtacatgggaacgtcagccaccattacatccggtg7080

agcagtcaggtgcggtgatacgtggtgtttttgatgaccctgaaaatatcagctatgccg7140

gacagggcgtgcgcgttgaaggctccagcccgtccctgtttgtccggactgatgaggtgc7200

ggcagctgcggcgtggagacacgctgaccatcggtgaggaaaatttctgggtagatcggg7260

tttcgccggatgatggcggaagttgtcatctctggcttggacggggcgtaccgcctgccg7320

ttaaccgtcgccgctgaaagggggatgtatggccataaaaggtcttgagcaggccgttga7380

aaacctcagccgtatcagcaaaacggcggtgcctggtgccgccgcaatggccattaaccg7440

cgttgcttcatccgcgatatcgcagtcggcgtcacaggttgcccgtgagacaaaggtacg7500

ccggaaactggtaaaggaaagggccaggctgaaaagggccacggtcaaaaatccgcaggc7560

cagaatcaaagttaaccggggggatttgcccgtaatcaagctgggtaatgcgcgggttgt7620

cctttcgcgccgcaggcgtcgtaaaaaggggcagcgttcatccctgaaaggtggcggcag7680

cgtgcttgtggtgggtaaccgtcgtattcccggcgcgtttattcagcaactgaaaaatgg7740

ccggtggcatgtcatgcagcgtgtggctgggaaaaaccgttaccccattgatgtggtgaa7800

aatcccgatggcggtgccgctgaccacggcgtttaaacaaaatattgagcggatacggcg7860

tgaacgtcttccgaaagagctgggctatgcgctgcagcatcaactgaggatggtaataaa7920

gcgatgaaacatactgaactccgtgcagccgtactggatgcactggagaagcatgacacc7980

ggggcgacgttttttgatggtcgccccgctgtttttgatgaggcggattttccggcagtt8040

gccgtttatctcaccggcgctgaatacacgggcgaagagctggacagcgatacctggcag8100

gcggagctgcatatcgaagttttcctgcctgctcaggtgccggattcagagctggatgcg8160

tggatggagtcccggatttatccggtgatgagcgatatcccggcactgtcagatttgatc8220

accagtatggtggccagcggctatgactaccggcgcgacgatgatgcgggcttgtggagt8280

tcagccgatctgacttatgtcattacctatgaaatgtgaggacgctatgcctgtaccaaa8340

tcctacaatgccggtgaaaggtgccgggaccaccctgtgggtttataaggggagcggtga8400

cccttacgcgaatccgctttcagacgttgactggtcgcgtctggcaaaagttaaagacct8460

gacgcccggcgaactgaccgctgagtcctatgacgacagctatctcgatgatgaagatgc8520

agactggactgcgaccgggcaggggcagaaatctgccggagataccagcttcacgctggc8580

gtggatgcccggagagcaggggcagcaggcgctgctggcgtggtttaatgaaggcgatac8640

ccgtgcctataaaatccgcttcccgaacggcacggtcgatgtgttccgtggctgggtcag8700

cagtatcggtaaggcggtgacggcgaaggaagtgatcacccgcacggtgaaagtcaccaa8760

tgtgggacgtccgtcgatggcagaagatcgcagcacggtaacagcggcaaccggcatgac8820

cgtgacgcctgccagcacctcggtggtgaaagggcagagcaccacgctgaccgtggcctt8880

ccagccggagggcgtaaccgacaagagctttcgtgcggtgtctgcggataaaacaaaagc8940

caccgtgtcggtcagtggtatgaccatcaccgtgaacggcgttgctgcaggcaaggtcaa9000

cattccggttgtatccggtaatggtgagtttgctgcggttgcagaaattaccgtcaccgc9060

cagttaatccggagagtcagcgatgttcctgaaaaccgaatcatttgaacataacggtgt9120

gaccgtcacgctttctgaactgtcagccctgcagcgcattgagcatctcgccctgatgaa9180

acggcaggcagaacaggcggagtcagacagcaaccggaagtttactgtggaagacgccat9240

cagaaccggcgcgtttctggtggcgatgtccctgtggcataaccatccgcagaagacgca9300

gatgccgtccatgaatgaagccgttaaacagattgagcaggaagtgcttaccacctggcc9360

cacggaggcaatttctcatgctgaaaacgtggtgtaccggctgtctggtatgtatgagtt9420

tgtggtgaataatgcccctgaacagacagaggacgccgggcccgcagagcctgtttctgc9480

gggaaagtgttcgacggtgagctgagttttgccctgaaactggcgcgtgagatggggcga9540

cccgactggcgtgccatgcttgccgggatgtcatccacggagtatgccgactggcaccgc9600

ttttacagtacccattattttcatgatgttctgctggatatgcacttttccgggctgacg9660

tacaccgtgctcagcctgtttttcagcgatccggatatgcatccgctggatttcagtctg9720

ctgaaccggcgcgaggctgacgaagagcctgaagatgatgtgctgatgcagaaagcggca9780

gggcttgccggaggtgtccgctttggcccggacgggaatgaagttatccccgcttccccg9840

gatgtggcggacatgacggaggatgacgtaatgctgatgacagtatcagaagggatcgca9900

ggaggagtccggtatggctgaaccggtaggcgatctggtcgttgatttgagtctggatgc9960

ggccagatttgacgagcagatggccagagtcaggcgtcatttttctggtacggaaagtga10020

tgcgaaaaaaacagcggcagtcgttgaacagtcgctgagccgacaggcgctggctgcaca10080

gaaagcggggatttccgtcgggcagtataaagccgccatgcgtatgctgcctgcacagtt10140

caccgacgtggccacgcagcttgcaggcgggcaaagtccgtggctgatcctgctgcaaca10200

gggggggcaggtgaaggactccttcggcgggatgatccccatgttcagggggcttgccgg10260

tgcgatcaccctgccgatggtgggggccacctcgctggcggtggcgaccggtgcgctggc10320

gtatgcctggtatcagggcaactcaaccctgtccgatttcaacaaaacgctggtcctttc10380

cggcaatcaggcgggactgacggcagatcgtatgctggtcctgtccagagccgggcaggc10440

ggcagggctgacgtttaaccagaccagcgagtcactcagcgcactggttaaggcgggggt10500

aagcggtgaggctcagattgcgtccatcagccagagtgtggcgcgtttctcctctgcatc10560

cggcgtggaggtggacaaggtcgctgaagccttcgggaagctgaccacagacccgacgtc10620

ggggctgacggcgatggctcgccagttccataacgtgtcggcggagcagattgcgtatgt10680

tgctcagttgcagcgttccggcgatgaagccggggcattgcaggcggcgaacgaggccgc10740

aacgaaagggtttgatgaccagacccgccgcctgaaagagaacatgggcacgctggagac10800

ctgggcagacaggactgcgcgggcattcaaatccatgtgggatgcggtgctggatattgg10860

tcgtcctgataccgcgcaggagatgctgattaaggcagaggctgcgtataagaaagcaga10920

cgacatctggaatctgcgcaaggatgattattttgttaacgatgaagcgcgggcgcgtta10980

ctgggatgatcgtgaaaaggcccgtcttgcgcttgaagccgcccgaaagaaggctgagca11040

gcagactcaacaggacaaaaatgcgcagcagcagagcgataccgaagcgtcacggctgaa11100

atataccgaagaggcgcagaaggcttacgaacggctgcagacgccgctggagaaatatac11160

cgcccgtcaggaagaactgaacaaggcactgaaagacgggaaaatcctgcaggcggatta11220

caacacgctgatggcggcggcgaaaaaggattatgaagcgacgctgaaaaagccgaaaca11280

gtccagcgtgaaggtgtctgcgggcgatcgtcaggaagacagtgctcatgctgccctgct11340

gacgcttcaggcagaactccggacgctggagaagcatgccggagcaaatgagaaaatcag11400

ccagcagcgccgggatttgtggaaggcggagagtcagttcgcggtactggaggaggcggc11460

gcaacgtcgccagctgtctgcacaggagaaatccctgctggcgcataaagatgagacgct11520

ggagtacaaacgccagctggctgcacttggcgacaaggttacgtatcaggagcgcctgaa11580

cgcgctggcgcagcaggcggataaattcgcacagcagcaacgggcaaaacgggccgccat11640

tgatgcgaaaagccgggggctgactgaccggcaggcagaacgggaagccacggaacagcg11700

cctgaaggaacagtatggcgataatccgctggcgctgaataacgtcatgtcagagcagaa11760

aaagacctgggcggctgaagaccagcttcgcgggaactggatggcaggcctgaagtccgg11820

ctggagtgagtgggaagagagcgccacggacagtatgtcgcaggtaaaaagtgcagccac11880

gcagacctttgatggtattgcacagaatatggcggcgatgctgaccggcagtgagcagaa11940

ctggcgcagcttcacccgttccgtgctgtccatgatgacagaaattctgcttaagcaggc12000

aatggtggggattgtcgggagtatcggcagcgccattggcggggctgttggtggcggcgc12060

atccgcgtcaggcggtacagccattcaggccgctgcggcgaaattccattttgcaaccgg12120

aggatttacgggaaccggcggcaaatatgagccagcggggattgttcaccgtggtgagtt12180

tgtcttcacgaaggaggcaaccagccggattggcgtggggaatctttaccggctgatgcg12240

cggctatgccaccggcggttatgtcggtacaccgggcagcatggcagacagccggtcgca12300

ggcgtccgggacgtttgagcagaataaccatgtggtgattaacaacgacggcacgaacgg12360

gcagataggtccggctgctctgaaggcggtgtatgacatggcccgcaagggtgcccgtga12420

tgaaattcagacacagatgcgtgatggtggcctgttctccggaggtggacgatgaagacc12480

ttccgctggaaagtgaaacccggtatggatgtggcttcggtcccttctgtaagaaaggtg12540

cgctttggtgatggctattctcagcgagcgcctgccgggctgaatgccaacctgaaaacg12600

tacagcgtgacgctttctgtcccccgtgaggaggccacggtactggagtcgtttctggaa12660

gagcacgggggctggaaatcctttctgtggacgccgccttatgagtggcggcagataaag12720

gtgacctgcgcaaaatggtcgtcgcgggtcagtatgctgcgtgttgagttcagcgcagag12780

tttgaacaggtggtgaactgatgcaggatatccggcaggaaacactgaatgaatgcaccc12840

gtgcggagcagtcggccagcgtggtgctctgggaaatcgacctgacagaggtcggtggag12900

aacgttattttttctgtaatgagcagaacgaaaaaggtgagccggtcacctggcaggggc12960

gacagtatcagccgtatcccattcaggggagcggttttgaactgaatggcaaaggcacca13020

gtacgcgccccacgctgacggtttctaacctgtacggtatggtcaccgggatggcggaag13080

atatgcagagtctggtcggcggaacggtggtccggcgtaaggtttacgcccgttttctgg13140

atgcggtgaacttcgtcaacggaaacagttacgccgatccggagcaggaggtgatcagcc13200

gctggcgcattgagcagtgcagcgaactgagcgcggtgagtgcctcctttgtactgtcca13260

cgccgacggaaacggatggcgctgtttttccgggacgtatcatgctggccaacacctgca13320

cctggacctatcgcggtgacgagtgcggttatagcggtccggctgtcgcggatgaatatg13380

accagccaacgtccgatatcacgaaggataaatgcagcaaatgcctgagcggttgtaagt13440

tccgcaataacgtcggcaactttggcggcttcctttccattaacaaactttcgcagtaaa13500

tcccatgacacagacagaatcagcgattctggcgcacgcccggcgatgtgcgccagcgga13560

gtcgtgcggcttcgtggtaagcacgccggagggggaaagatatttcccctgcgtgaatat13620

ctccggtgagccggaggctatttccgtatgtcgccggaagactggctgcaggcagaaatg13680

cagggtgagattgtggcgctggtccacagccaccccggtggtctgccctggctgagtgag13740

gccgaccggcggctgcaggtgcagagtgatttgccgtggtggctggtctgccgggggacg13800

attcataagttccgctgtgtgccgcatctcaccgggcggcgctttgagcacggtgtgacg13860

gactgttacacactgttccgggatgcttatcatctggcggggattgagatgccggacttt13920

catcgtgaggatgactggtggcgtaacggccagaatctctatctggataatctggaggcg13980

acggggctgtatcaggtgccgttgtcagcggcacagccgggcgatgtgctgctgtgctgt14040

tttggttcatcagtgccgaatcacgccgcaatttactgcggcgacggcgagctgctgcac14100

catattcctgaacaactgagcaaacgagagaggtacaccgacaaatggcagcgacgcaca14160

cactccctctggcgtcaccgggcatggcgcgcatctgcctttacggggatttacaacgat14220

ttggtcgccgcatcgaccttcgtgtgaaaacgggggctgaagccatccgggcactggcca14280

cacagctcccggcgtttcgtcagaaactgagcgacggctggtatcaggtacggattgccg14340

ggcgggacgtcagcacgtccgggttaacggcgcagttacatgagactctgcctgatggcg14400

ctgtaattcatattgttcccagagtcgccggggccaagtcaggtggcgtattccagattg14460

tcctgggggctgccgccattgccggatcattctttaccgccggagccacccttgcagcat14520

ggggggcagccattggggccggtggtatgaccggcatcctgttttctctcggtgccagta14580

tggtgctcggtggtgtggcgcagatgctggcaccgaaagccagaactccccgtatacaga14640

caacggataacggtaagcagaacacctatttctcctcactggataacatggttgcccagg14700

gcaatgttctgcctgttctgtacggggaaatgcgcgtggggtcacgcgtggtttctcagg14760

agatcagcacggcagacgaaggggacggtggtcaggttgtggtgattggtcgctgatgca14820

aaatgttttatgtgaaaccgcctgcgggcggttttgtcatttatggagcgtgaggaatgg14880

gtaaaggaagcagtaaggggcataccccgcgcgaagcgaaggacaacctgaagtccacgc14940

agttgctgagtgtgatcgatgccatcagcgaagggccgattgaaggtccggtggatggct15000

taaaaagcgtgctgctgaacagtacgccggtgctggacactgaggggaataccaacatat15060

ccggtgtcacggtggtgttccgggctggtgagcaggagcagactccgccggagggatttg15120

aatcctccggctccgagacggtgctgggtacggaagtgaaatatgacacgccgatcaccc15180

gcaccattacgtctgcaaacatcgaccgtctgcgctttaccttcggtgtacaggcactgg15240

tggaaaccacctcaaagggtgacaggaatccgtcggaagtccgcctgctggttcagatac15300

aacgtaacggtggctgggtgacggaaaaagacatcaccattaagggcaaaaccacctcgc15360

agtatctggcctcggtggtgatgggtaacctgccgccgcgcccgtttaatatccggatgc15420

gcaggatgacgccggacagcaccacagaccagctgcagaacaaaacgctctggtcgtcat15480

acactgaaatcatcgatgtgaaacagtgctacccgaacacggcactggtcggcgtgcagg15540

tggactcggagcagttcggcagccagcaggtgagccgtaattatcatctgcgcgggcgta15600

ttctgcaggtgccgtcgaactataacccgcagacgcggcaatacagcggtatctgggacg15660

gaacgtttaaaccggcatacagcaacaacatggcctggtgtctgtgggatatgctgaccc15720

atccgcgctacggcatggggaaacgtcttggtgcggcggatgtggataaatgggcgctgt15780

atgtcatcggccagtactgcgaccagtcagtgccggacggctttggcggcacggagccgc15840

gcatcacctgtaatgcgtacctgaccacacagcgtaaggcgtgggatgtgctcagcgatt15900

tctgctcggcgatgcgctgtatgccggtatggaacgggcagacgctgacgttcgtgcagg15960

accgaccgtcggataagacgtggacctataaccgcagtaatgtggtgatgccggatgatg16020

gcgcgccgttccgctacagcttcagcgccctgaaggaccgccataatgccgttgaggtga16080

actggattgacccgaacaacggctgggagacggcgacagagcttgttgaagatacgcagg16140

ccattgcccgttacggtcgtaatgttacgaagatggatgcctttggctgtaccagccggg16200

ggcaggcacaccgcgccgggctgtggctgattaaaacagaactgctggaaacgcagaccg16260

tggatttcagcgtcggcgcagaagggcttcgccatgtaccgggcgatgttattgaaatct16320

gcgatgatgactatgccggtatcagcaccggtggtcgtgtgctggcggtgaacagccaga16380

cccggacgctgacgctcgaccgtgaaatcacgctgccatcctccggtaccgcgctgataa16440

gcctggttgacggaagtggcaatccggtcagcgtggaggttcagtccgtcaccgacggcg16500

tgaaggtaaaagtgagccgtgttcctgacggtgttgctgaatacagcgtatgggagctga16560

agctgccgacgctgcgccagcgactgttccgctgcgtgagtatccgtgagaacgacgacg16620

gcacgtatgccatcaccgccgtgcagcatgtgccggaaaaagaggccatcgtggataacg16680

gggcgcactttgacggcgaacagagtggcacggtgaatggtgtcacgccgccagcggtgc16740

agcacctgaccgcagaagtcactgcagacagcggggaatatcaggtgctggcgcgatggg16800

acacaccgaaggtggtgaagggcgtgagtttcctgctccgtctgaccgtaacagcggacg16860

acggcagtgagcggctggtcagcacggcccggacgacggaaaccacataccgcttcacgc16920

aactggcgctggggaactacaggctgacagtccgggcggtaaatgcgtgggggcagcagg16980

gcgatccggcgtcggtatcgttccggattgccgcaccggcagcaccgtcgaggattgagc17040

tgacgccgggctattttcagataaccgccacgccgcatcttgccgtttatgacccgacgg17100

tacagtttgagttctggttctcggaaaagcagattgcggatatcagacaggttgaaacca17160

gcacgcgttatcttggtacggcgctgtactggatagccgccagtatcaatatcaaaccgg17220

gccatgattattacttttatatccgcagtgtgaacaccgttggcaaatcggcattcgtgg17280

aggccgtcggtcgggcgagcgatgatgcggaaggttacctggattttttcaaaggcaaga17340

taaccgaatcccatctcggcaaggagctgctggaaaaagtcgagctgacggaggataacg17400

ccagcagactggaggagttttcgaaagagtggaaggatgccagtgataagtggaatgcca17460

tgtgggctgtcaaaattgagcagaccaaagacggcaaacattatgtcgcgggtattggcc17520

tcagcatggaggacacggaggaaggcaaactgagccagtttctggttgccgccaatcgta17580

tcgcatttattgacccggcaaacgggaatgaaacgccgatgtttgtggcgcagggcaacc17640

agatattcatgaacgacgtgttcctgaagcgcctgacggcccccaccattaccagcggcg17700

gcaatcctccggccttttccctgacaccggacggaaagctgaccgctaaaaatgcggata17760

tcagtggcagtgtgaatgcgaactccgggacgctcagtaatgtgacgatagctgaaaact17820

gtacgataaacggtacgctgagggcggaaaaaatcgtcggggacattgtaaaggcggcga17880

gcgcggcttttccgcgccagcgtgaaagcagtgtggactggccgtcaggtacccgtactg17940

tcaccgtgaccgatgaccatccttttgatcgccagatagtggtgcttccgctgacgtttc18000

gcggaagtaagcgtactgtcagcggcaggacaacgtattcgatgtgttatctgaaagtac18060

tgatgaacggtgcggtgatttatgatggcgcggcgaacgaggcggtacaggtgttctccc18120

gtattgttgacatgccagcgggtcggggaaacgtgatcctgacgttcacgcttacgtcca18180

cacggcattcggcagatattccgccgtatacgtttgccagcgatgtgcaggttatggtga18240

ttaagaaacaggcgctgggcatcagcgtggtctgagtgtgttacagaggttcgtccggga18300

acgggcgttttattataaaacagtgagaggtgaacgatgcgtaatgtgtgtattgccgtt18360

gctgtctttgccgcacttgcggtgacagtcactccggcccgtgcggaaggtggacatggt18420

acgtttacggtgggctattttcaagtgaaaccgggtacattgccgtcgttgtcgggcggg18480

gataccggtgtgagtcatctgaaagggattaacgtgaagtaccgttatgagctgacggac18540

agtgtgggggtgatggcttccctggggttcgccgcgtcgaaaaagagcagcacagtgatg18600

accggggaggatacgtttcactatgagagcctgcgtggacgttatgtgagcgtgatggcc18660

ggaccggttttacaaatcagtaagcaggtcagtgcgtacgccatggccggagtggctcac18720

agtcggtggtccggcagtacaatggattaccgtaagacggaaatcactcccgggtatatg18780

aaagagacgaccactgccagggacgaaagtgcaatgcggcatacctcagtggcgtggagt18840

gcaggtatacagattaatccggcagcgtccgtcgttgttgatattgcttatgaaggctcc18900

ggcagtggcgactggcgtactgacggattcatcgttggggtcggttataaattctgatta18960

gccaggtaacacagtgttatgacagcccgccggaaccggtgggcttttttgtggggtgaa19020

tatggcagtaaagatttcaggagtcctgaaagacggcacaggaaaaccggtacagaactg19080

caccattcagctgaaagccagacgtaacagcaccacggtggtggtgaacacggtgggctc19140

agagaatccggatgaagccgggcgttacagcatggatgtggagtacggtcagtacagtgt19200

catcctgcaggttgacggttttccaccatcgcacgccgggaccatcaccgtgtatgaaga19260

ttcacaaccggggacgctgaatgattttctctgtgccatgacggaggatgatgcccggcc19320

ggaggtgctgcgtcgtcttgaactgatggtggaagaggtggcgcgtaacgcgtccgtggt19380

ggcacagagtacggcagacgcgaagaaatcagccggcgatgccagtgcatcagctgctca19440

ggtcgcggcccttgtgactgatgcaactgactcagcacgcgccgccagcacgtccgccgg19500

acaggctgcatcgtcagctcaggaagcgtcctccggcgcagaagcggcatcagcaaaggc19560

cactgaagcggaaaaaagtgccgcagccgcagagtcctcaaaaa19604

<210>10

<211>10058

<212>dna

<213>artificialsequence

<220>

<223>lambdadna

<400>10

acgcggcggccaccagtgccggtgcggcgaaaacgtcagaaacgaatgctgcagcgtcac60

aacaatcagccgccacgtctgcctccaccgcggccacgaaagcgtcagaggccgccactt120

cagcacgagatgcggtggcctcaaaagaggcagcaaaatcatcagaaacgaacgcatcat180

caagtgccggtcgtgcagcttcctcggcaacggcggcagaaaattctgccagggcggcaa240

aaacgtccgagacgaatgccaggtcatctgaaacagcagcggaacggagcgcctctgccg300

cggcagacgcaaaaacagcggcggcggggagtgcgtcaacggcatccacgaaggcgacag360

aggctgcgggaagtgcggtatcagcatcgcagagcaaaagtgcggcagaagcggcggcaa420

tacgtgcaaaaaattcggcaaaacgtgcagaagatatagcttcagctgtcgcgcttgagg480

atgcggacacaacgagaaaggggatagtgcagctcagcagtgcaaccaacagcacgtctg540

aaacgcttgctgcaacgccaaaggcggttaaggtggtaatggatgaaacgaacagaaaag600

cccactggacagtccggcactgaccggaacgccaacagcaccaaccgcgctcaggggaac660

aaacaatacccagattgcgaacaccgcttttgtactggccgcgattgcagatgttatcga720

cgcgtcacctgacgcactgaatacgctgaatgaactggccgcagcgctcgggaatgatcc780

agattttgctaccaccatgactaacgcgcttgcgggtaaacaaccgaagaatgcgacact840

gacggcgctggcagggctttccacggcgaaaaataaattaccgtattttgcggaaaatga900

tgccgccagcctgactgaactgactcaggttggcagggatattctggcaaaaaattccgt960

tgcagatgttcttgaataccttggggccggtgagaattcggcctttccggcaggtgcgcc1020

gatcccgtggccatcagatatcgttccgtctggctacgtcctgatgcaggggcaggcgtt1080

tgacaaatcagcctacccaaaacttgctgtcgcgtatccatcgggtgtgcttcctgatat1140

gcgaggctggacaatcaaggggaaacccgccagcggtcgtgctgtattgtctcaggaaca1200

ggatggaattaagtcgcacacccacagtgccagtgcatccggtacggatttggggacgaa1260

aaccacatcgtcgtttgattacgggacgaaaacaacaggcagtttcgattacggcaccaa1320

atcgacgaataacacgggggctcatgctcacagtctgagcggttcaacaggggccgcggg1380

tgctcatgcccacacaagtggtttaaggatgaacagttctggctggagtcagtatggaac1440

agcaaccattacaggaagtttatccacagttaaaggaaccagcacacagggtattgctta1500

tttatcgaaaacggacagtcagggcagccacagtcactcattgtccggtacagccgtgag1560

tgccggtgcacatgcgcatacagttggtattggtgcgcaccagcatccggttgttatcgg1620

tgctcatgcccattctttcagtattggttcacacggacacaccatcaccgttaacgctgc1680

gggtaacgcggaaaacaccgtcaaaaacattgcatttaactatattgtgaggcttgcata1740

atggcattcagaatgagtgaacaaccacggaccataaaaatttataatctgctggccgga1800

actaatgaatttattggtgaaggtgacgcatatattccgcctcataccggtctgcctgca1860

aacagtaccgatattgcaccgccagatattccggctggctttgtggctgttttcaacagt1920

gatgaggcatcgtggcatctcgttgaagaccatcggggtaaaaccgtctatgacgtggct1980

tccggcgacgcgttatttatttctgaactcggtccgttaccggaaaattttacctggtta2040

tcgccgggaggggaatatcagaagtggaacggcacagcctgggtgaaggatacggaagca2100

gaaaaactgttccggatccgggaggcggaagaaacaaaaaaaagcctgatgcaggtagcc2160

agtgagcatattgcgccgcttcaggatgctgcagatctggaaattgcaacgaaggaagaa2220

acctcgttgctggaagcctggaagaagtatcgggtgttgctgaaccgtgttgatacatca2280

actgcacctgatattgagtggcctgctgtccctgttatggagtaatcgttttgtgatatg2340

ccgcagaaacgttgtatgaaataacgttctgcggttagttagtatattgtaaagctgagt2400

attggtttatttggcgattattatcttcaggagaataatggaagttctatgactcaattg2460

ttcatagtgtttacatcaccgccaattgcttttaagactgaacgcatgaaatatggtttt2520

tcgtcatgttttgagtctgctgttgatatttctaaagtcggttttttttcttcgttttct2580

ctaactattttccatgaaatacatttttgattattatttgaatcaattccaattacctga2640

agtctttcatctataattggcattgtatgtattggtttattggagtagatgcttgctttt2700

ctgagccatagctctgatatccaaatgaagccataggcatttgttattttggctctgtca2760

gctgcataacgccaaaaaatatatttatctgcttgatcttcaaatgttgtattgattaaa2820

tcaattggatggaattgtttatcataaaaaattaatgtttgaatgtgataaccgtccttt2880

aaaaaagtcgtttctgcaagcttggctgtatagtcaactaactcttctgtcgaagtgata2940

tttttaggcttatctaccagttttagacgctctttaatatcttcaggaattattttattg3000

tcatattgtatcatgctaaatgacaatttgcttatggagtaatcttttaattttaaataa3060

gttattctcctggcttcatcaaataaagagtcgaatgatgttggcgaaatcacatcgtca3120

cccattggattgtttatttgtatgccaagagagttacagcagttatacattctgccatag3180

attatagctaaggcatgtaataattcgtaatcttttagcgtattagcgacccatcgtctt3240

tctgatttaataatagatgattcagttaaatatgaaggtaatttcttttgtgcaagtctg3300

actaacttttttataccaatgtttaacatactttcatttgtaataaactcaatgtcattt3360

tcttcaatgtaagatgaaataagagtagcctttgcctcgctatacatttctaaatcgcct3420

tgtttttctatcgtattgcgagaatttttagcccaagccattaatggatcatttttccat3480

ttttcaataacattattgttataccaaatgtcatatcctataatctggtttttgtttttt3540

tgaataataaatgttactgttcttgcggtttggaggaattgattcaaattcaagcgaaat3600

aattcagggtcaaaatatgtatcaatgcagcatttgagcaagtgcgataaatctttaagt3660

cttctttcccatggttttttagtcataaaactctccattttgataggttgcatgctagat3720

gctgatatattttagaggtgataaaattaactgcttaactgtcaatgtaatacaagttgt3780

ttgatctttgcaatgattcttatcagaaaccatatagtaaattagttacacaggaaattt3840

ttaatattattattatcattcattatgtattaaaattagagttgtggcttggctctgcta3900

acacgttgctcataggagatatggtagagccgcagacacgtcgtatgcaggaacgtgctg3960

cggctggctggtgaacttccgatagtgcgggtgttgaatgatttccagttgctaccgatt4020

ttacatattttttgcatgagagaatttgtaccacctcccaccgaccatctatgactgtac4080

gccactgtccctaggactgctatgtgccggagcggacattacaaacgtccttctcggtgc4140

atgccactgttgccaatgacctgcctaggaattggttagcaagttactaccggattttgt4200

aaaaacagccctcctcatataaaaagtattcgttcacttccgataagcgtcgtaattttc4260

tatctttcatcatattctagatccctctgaaaaaatcttccgagtttgctaggcactgat4320

acataactcttttccaataattggggaagtcattcaaatctataataggtttcagatttg4380

cttcaataaattctgactgtagctgctgaaacgttgcggttgaactatatttccttataa4440

cttttacgaaagagtttctttgagtaatcacttcactcaagtgcttccctgcctccaaac4500

gatacctgttagcaatatttaatagcttgaaatgatgaagagctctgtgtttgtcttcct4560

gcctccagttcgccgggcattcaacataaaaactgatagcacccggagttccggaaacga4620

aatttgcatatacccattgctcacgaaaaaaaatgtccttgtcgatatagggatgaatcg4680

cttggtgtacctcatctactgcgaaaacttgacctttctctcccatattgcagtcgcggc4740

acgatggaactaaattaataggcatcaccgaaaattcaggataatgtgcaataggaagaa4800

aatgatctatattttttgtctgtcctatatcaccacaaaatggacatttttcacctgatg4860

aaacaagcatgtcatcgtaatatgttctagcgggtttgtttttatctcggagattatttt4920

cataaagcttttctaatttaacctttgtcaggttaccaactactaaggttgtaggctcaa4980

gagggtgtgtcctgtcgtaggtaaataactgacctgtcgagcttaatattctatattgtt5040

gttctttctgcaaaaaagtggggaagtgagtaatgaaattatttctaacatttatctgca5100

tcataccttccgagcatttattaagcatttcgctataagttctcgctggaagaggtagtt5160

ttttcattgtactttaccttcatctctgttcattatcatcgcttttaaaacggttcgacc5220

ttctaatcctatctgaccattataattttttagaatggtttcataagaaagctctgaatc5280

aacggactgcgataataagtggtggtatccagaatttgtcacttcaagtaaaaacacctc5340

acgagttaaaacacctaagttctcaccgaatgtctcaatatccggacggataatatttat5400

tgcttctcttgaccgtaggactttccacatgcaggattttggaacctcttgcagtactac5460

tggggaatgagttgcaattattgctacaccattgcgtgcatcgagtaagtcgcttaatgt5520

tcgtaaaaaagcagagagcaaaggtggatgcagatgaacctctggttcatcgaataaaac5580

taatgacttttcgccaacgacatctactaatcttgtgatagtaaataaaacaattgcatg5640

tccagagctcattcgaagcagatatttctggatattgtcataaaacaatttagtgaattt5700

atcatcgtccacttgaatctgtggttcattacgtcttaactcttcatatttagaaatgag5760

gctgatgagttccatatttgaaaagttttcatcactacttagttttttgatagcttcaag5820

ccagagttgtctttttctatctactctcatacaaccaataaatgctgaaatgaattctaa5880

gcggagatcgcctagtgattttaaactattgctggcagcattcttgagtccaatataaaa5940

gtattgtgtaccttttgctgggtcaggttgttctttaggaggagtaaaaggatcaaatgc6000

actaaacgaaactgaaacaagcgatcgaaaatatccctttgggattcttgactcgataag6060

tctattattttcagagaaaaaatattcattgttttctgggttggtgattgcaccaatcat6120

tccattcaaaattgttgttttaccacacccattccgcccgataaaagcatgaatgttcgt6180

gctgggcatagaattaaccgtcacctcaaaaggtatagttaaatcactgaatccgggagc6240

actttttctattaaatgaaaagtggaaatctgacaattctggcaaaccatttaacacacg6300

tgcgaactgtccatgaatttctgaaagagttacccctctaagtaatgaggtgttaaggac6360

gctttcattttcaatgtcggctaatcgatttggccatactactaaatcctgaatagcttt6420

aagaaggttatgtttaaaaccatcgcttaatttgctgagattaacatagtagtcaatgct6480

ttcacctaaggaaaaaaacatttcagggagttgactgaattttttatctattaatgaata6540

agtgcttacttcttctttttgacctacaaaaccaattttaacatttccgatatcgcattt6600

ttcaccatgctcatcaaagacagtaagataaaacattgtaacaaaggaatagtcattcca6660

accatctgctcgtaggaatgccttatttttttctactgcaggaatatacccgcctctttc6720

aataacactaaactccaacatatagtaacccttaattttattaaaataaccgcaatttat6780

ttggcggcaacacaggatctctcttttaagttactctctattacatacgttttccatcta6840

aaaattagtagtattgaacttaacggggcatcgtattgtagttttccatatttagctttc6900

tgcttccttttggataacccactgttattcatgttgcatggtgcactgtttataccaacg6960

atatagtctattaatgcatatatagtatcgccgaacgattagctcttcaggcttctgaag7020

aagcgtttcaagtactaataagccgatagatagccacggacttcgtagccatttttcata7080

agtgttaacttccgctcctcgctcataacagacattcactacagttatggcggaaaggta7140

tgcatgctgggtgtggggaagtcgtgaaagaaaagaagtcagctgcgtcgtttgacatca7200

ctgctatcttcttactggttatgcaggtcgtagtgggtggcacacaaagctttgcactgg7260

attgcgaggctttgtgcttctctggagtgcgacaggtttgatgacaaaaaattagcgcaa7320

gaagacaaaaatcaccttgcgctaatgctctgttacaggtcactaataccatctaagtag7380

ttgattcatagtgactgcatatgttgtgttttacagtattatgtagtctgttttttatgc7440

aaaatctaatttaatatattgatatttatatcattttacgtttctcgttcagctttttta7500

tactaagttggcattataaaaaagcattgcttatcaatttgttgcaacgaacaggtcact7560

atcagtcaaaataaaatcattatttgatttcaattttgtcccactccctgcctctgtcat7620

cacgatactgtgatgccatggtgtccgacttatgcccgagaagatgttgagcaaacttat7680

cgcttatctgcttctcatagagtcttgcagacaaactgcgcaactcgtgaaaggtaggcg7740

gatccccttcgaaggaaagacctgatgcttttcgtgcgcgcataaaataccttgatactg7800

tgccggatgaaagcggttcgcgacgagtagatgcaattatggtttctccgccaagaatct7860

ctttgcatttatcaagtgtttccttcattgatattccgagagcatcaatatgcaatgctg7920

ttgggatggcaatttttacgcctgttttgctttgctcgacataaagatatccatctacga7980

tatcagaccacttcatttcgcataaatcaccaactcgttgcccggtaacaacagccagtt8040

ccattgcaagtctgagccaacatggtgatgattctgctgcttgataaattttcaggtatt8100

cgtcagccgtaagtcttgatctccttacctctgattttgctgcgcgagtggcagcgacat8160

ggtttgttgttatatggccttcagctattgcctctcggaatgcatcgctcagtgttgatc8220

tgattaacttggctgacgccgccttgccctcgtctatgtatccattgagcattgccgcaa8280

tttcttttgtggtgatgtcttcaagtggagcatcaggcagacccctccttattgctttaa8340

ttttgctcatgtaatttatgagtgtcttctgcttgattcctctgctggccaggatttttt8400

cgtagcgatcaagccatgaatgtaacgtaacggaattatcactgttgattctcgctgtca8460

gaggcttgtgtttgtgtcctgaaaataactcaatgttggcctgtatagcttcagtgattg8520

cgattcgcctgtctctgcctaatccaaactctttacccgtccttgggtccctgtagcagt8580

aatatccattgtttcttatataaaggttagggggtaaatcccggcgctcatgacttcgcc8640

ttcttcccatttctgatcctcttcaaaaggccacctgttactggtcgatttaagtcaacc8700

tttaccgctgattcgtggaacagatactctcttccatccttaaccggaggtgggaatatc8760

ctgcattcccgaacccatcgacgaactgtttcaaggcttcttggacgtcgctggcgtgcg8820

ttccactcctgaagtgtcaagtacatcgcaaagtctccgcaattacacgcaagaaaaaac8880

cgccatcaggcggcttggtgttctttcagttcttcaattcgaatattggttacgtctgca8940

tgtgctatctgcgcccatatcatccagtggtcgtagcagtcgttgatgttctccgcttcg9000

ataactctgttgaatggctctccattccattctcctgtgactcggaagtgcatttatcat9060

ctccataaaacaaaacccgccgtagcgagttcagataaaataaatccccgcgagtgcgag9120

gattgttatgtaatattgggtttaatcatctatatgttttgtacagagagggcaagtatc9180

gtttccaccgtactcgtgataataattttgcacggtatcagtcatttctcgcacattgca9240

gaatggggatttgtcttcattagacttataaaccttcatggaatatttgtatgccgactc9300

tatatctataccttcatctacataaacaccttcgtgatgtctgcatggagacaagacacc9360

ggatctgcacaacattgataacgcccaatctttttgctcagactctaactcattgatact9420

catttataaactccttgcaatgtatgtcgtttcagctaaacggtatcagcaatgtttatg9480

taaagaaacagtaagataatactcaacccgatgtttgagtacggtcatcatctgacacta9540

cagactctggcatcgctgtgaagacgacgcgaaattcagcattttcacaagcgttatctt9600

ttacaaaaccgatctcactctcctttgatgcgaatgccagcgtcagacatcatatgcaga9660

tactcacctgcatcctgaacccattgacctccaaccccgtaatagcgatgcgtaatgatg9720

tcgatagttactaacgggtcttgttcgattaactgccgcagaaactcttccaggtcacca9780

gtgcagtgcttgataacaggagtcttcccaggatggcgaacaacaagaaactggtttccg9840

tcttcacggacttcgttgctttccagtttagcaatacgcttactcccatccgagataaca9900

ccttcgtaatactcacgctgctcgttgagttttgattttgctgtttcaagctcaacacgc9960

agtttccctactgttagcgcaatatcctcgttctcctggtcgcggcgtttgatgtattgc10020

tggtttctttcccgttcatccagcagttccagcacaat10058

<210>11

<211>9105

<212>dna

<213>artificialsequence

<220>

<223>lambdadna

<400>11

cgatggtgttaccaattcatggaaaaggtctgcgtcaaatccccagtcgtcatgcattgc60

ctgctctgccgcttcacgcagtgcctgagagttaatttcgctcacttcgaacctctctgt120

ttactgataagttccagatcctcctggcaacttgcacaagtccgacaaccctgaacgacc180

aggcgtcttcgttcatctatcggatcgccacactcacaacaatgagtggcagatatagcc240

tggtggttcaggcggcgcatttttattgctgtgttgcgctgtaattcttctatttctgat300

gctgaatcaatgatgtctgccatctttcattaatccctgaactgttggttaatacgcttg360

agggtgaatgcgaataataaaaaaggagcctgtagctccctgatgattttgcttttcatg420

ttcatcgttccttaaagacgccgtttaacatgccgattgccaggcttaaatgagtcggtg480

tgaatcccatcagcgttaccgtttcgcggtgcttcttcagtacgctacggcaaatgtcat540

cgacgtttttatccggaaactgctgtctggctttttttgatttcagaattagcctgacgg600

gcaatgctgcgaagggcgttttcctgctgaggtgtcattgaacaagtcccatgtcggcaa660

gcataagcacacagaatatgaagcccgctgccagaaaaatgcattccgtggttgtcatac720

ctggtttctctcatctgcttctgctttcgccaccatcatttccagcttttgtgaaaggga780

tgcggctaacgtatgaaattcttcgtctgtttctactggtattggcacaaacctgattcc840

aatttgagcaaggctatgtgccatctcgatactcgttcttaactcaacagaagatgcttt900

gtgcatacagcccctcgtttattatttatctcctcagccagccgctgtgctttcagtgga960

tttcggataacagaaaggccgggaaatacccagcctcgctttgtaacggagtagacgaaa1020

gtgattgcgcctacccggatattatcgtgaggatgcgtcatcgccattgctccccaaata1080

caaaaccaatttcagccagtgcctcgtccattttttcgatgaactccggcacgatctcgt1140

caaaactcgccatgtacttttcatcccgctcaatcacgacataatgcaggccttcacgct1200

tcatacgcgggtcatagttggcaaagtaccaggcattttttcgcgtcacccacatgctgt1260

actgcacctgggccatgtaagctgactttatggcctcgaaaccaccgagccggaacttca1320

tgaaatcccgggaggtaaacgggcatttcagttcaaggccgttgccgtcactgcataaac1380

catcgggagagcaggcggtacgcatactttcgtcgcgatagatgatcggggattcagtaa1440

cattcacgccggaagtgaattcaaacagggttctggcgtcgttctcgtactgttttcccc1500

aggccagtgctttagcgttaacttccggagccacaccggtgcaaacctcagcaagcaggg1560

tgtggaagtaggacattttcatgtcaggccacttctttccggagcggggttttgctatca1620

cgttgtgaacttctgaagcggtgatgacgccgagccgtaatttgtgccacgcatcatccc1680

cctgttcgacagctctcacatcgatcccggtacgctgcaggataatgtccggtgtcatgc1740

tgccaccttctgctctgcggctttctgtttcaggaatccaagagcttttactgcttcggc1800

ctgtgtcagttctgacgatgcacgaatgtcgcggcgaaatatctgggaacagagcggcaa1860

taagtcgtcatcccatgttttatccagggcgatcagcagagtgttaatctcctgcatggt1920

ttcatcgttaaccggagtgatgtcgcgttccggctgacgttctgcagtgtatgcagtatt1980

ttcgacaatgcgctcggcttcatccttgtcatagataccagcaaatccgaaggccagacg2040

ggcacactgaatcatggctttatgacgtaacatccgtttgggatgcgactgccacggccc2100

cgtgatttctctgccttcgcgagttttgaatggttcgcggcggcattcatccatccattc2160

ggtaacgcagatcggatgattacggtccttgcggtaaatccggcatgtacaggattcatt2220

gtcctgctcaaagtccatgccatcaaactgctggttttcattgatgatgcgggaccagcc2280

atcaacgcccaccaccggaacgatgccattctgcttatcaggaaaggcgtaaatttcttt2340

cgtccacggattaaggccgtactggttggcaacgatcagtaatgcgatgaactgcgcatc2400

gctggcatcacctttaaatgccgtctggcgaagagtggtgatcagttcctgtgggtcgac2460

agaatccatgccgacacgttcagccagcttcccagccagcgttgcgagtgcagtactcat2520

tcgttttatacctctgaatcaatatcaacctggtggtgagcaatggtttcaaccatgtac2580

cggatgtgttctgccatgcgctcctgaaactcaacatcgtcatcaaacgcacgggtaatg2640

gattttttgctggccccgtggcgttgcaaatgatcgatgcatagcgattcaaacaggtgc2700

tggggcaggcctttttccatgtcgtctgccagttctgcctctttctcttcacgggcgagc2760

tgctggtagtgacgcgcccagctctgagcctcaagacgatcctgaatgtaataagcgttc2820

atggctgaactcctgaaatagctgtgaaaatatcgcccgcgaaatgccgggctgattagg2880

aaaacaggaaagggggttagtgaatgcttttgcttgatctcagtttcagtattaatatcc2940

attttttataagcgtcgacggcttcacgaaacatcttttcatcgccaataaaagtggcga3000

tagtgaatttagtctggatagccataagtgtttgatccattctttgggactcctggctga3060

ttaagtatgtcgataaggcgtttccatccgtcacgtaatttacgggtgattcgttcaagt3120

aaagattcggaagggcagccagcaacaggccaccctgcaatggcatattgcatggtgtgc3180

tccttatttatacataacgaaaaacgcctcgagtgaagcgttattggtatgcggtaaaac3240

cgcactcaggcggccttgatagtcatatcatctgaatcaaatattcctgatgtatcgata3300

tcggtaattcttattccttcgctaccatccattggaggccatccttcctgaccatttcca3360

tcattccagtcgaactcacacacaacaccatatgcatttaagtcgcttgaaattgctata3420

agcagagcatgttgcgccagcatgattaatacagcatttaatacagagccgtgtttattg3480

agtcggtattcagagtctgaccagaaattattaatctggtgaagtttttcctctgtcatt3540

acgtcatggtcgatttcaatttctattgatgctttccagtcgtaatcaatgatgtatttt3600

ttgatgtttgacatctgttcatatcctcacagataaaaaatcgccctcacactggagggc3660

aaagaagatttccaataatcagaacaagtcggctcctgtttagttacgagcgacattgct3720

ccgtgtattcactcgttggaatgaatacacagtgcagtgtttattctgttatttatgcca3780

aaaataaaggccactatcaggcagctttgttgttctgtttaccaagttctctggcaatca3840

ttgccgtcgttcgtattgcccatttatcgacatatttcccatcttccattacaggaaaca3900

tttcttcaggcttaaccatgcattccgattgcagcttgcatccattgcatcgcttgaatt3960

gtccacaccattgatttttatcaatagtcgtagtcatacggatagtcctggtattgttcc4020

atcacatcctgaggatgctcttcgaactcttcaaattcttcttccatatatcaccttaaa4080

tagtggattgcggtagtaaagattgtgcctgtcttttaaccacatcaggctcggtggttc4140

tcgtgtacccctacagcgagaaatcggataaactattacaacccctacagtttgatgagt4200

atagaaatggatccactcgttattctcggacgagtgttcagtaatgaacctctggagaga4260

accatgtatatgatcgttatctgggttggacttctgcttttaagcccagataactggcct4320

gaatatgttaatgagagaatcggtattcctcatgtgtggcatgttttcgtctttgctctt4380

gcattttcgctagcaattaatgtgcatcgattatcagctattgccagcgccagatataag4440

cgatttaagctaagaaaacgcattaagatgcaaaacgataaagtgcgatcagtaattcaa4500

aaccttacagaagagcaatctatggttttgtgcgcagcccttaatgaaggcaggaagtat4560

gtggttacatcaaaacaattcccatacattagtgagttgattgagcttggtgtgttgaac4620

aaaactttttcccgatggaatggaaagcatatattattccctattgaggatatttactgg4680

actgaattagttgccagctatgatccatataatattgagataaagccaaggccaatatct4740

aagtaactagataagaggaatcgattttcccttaattttctggcgtccactgcatgttat4800

gccgcgttcgccaggcttgctgtaccatgtgcgctgattcttgcgctcaatacgttgcag4860

gttgctttcaatctgtttgtggtattcagccagcactgtaaggtctatcggatttagtgc4920

gctttctactcgtgatttcggtttgcgattcagcgagagaatagggcggttaactggttt4980

tgcgcttaccccaaccaacaggggatttgctgctttccattgagcctgtttctctgcgcg5040

acgttcgcggcggcgtgtttgtgcatccatctggattctcctgtcagttagctttggtgg5100

tgtgtggcagttgtagtcctgaacgaaaaccccccgcgattggcacattggcagctaatc5160

cggaatcgcacttacggccaatgcttcgtttcgtatcacacaccccaaagccttctgctt5220

tgaatgctgcccttcttcagggcttaatttttaagagcgtcaccttcatggtggtcagtg5280

cgtcctgctgatgtgctcagtatcaccgccagtggtatttatgtcaacaccgccagagat5340

aatttatcaccgcagatggttatctgtatgttttttatatgaatttattttttgcagggg5400

ggcattgtttggtaggtgagagatctgaattgctatgtttagtgagttgtatctatttat5460

ttttcaataaatacaattggttatgtgttttgggggcgatcgtgaggcaaagaaaacccg5520

gcgctgaggccgggttattcttgttctctggtcaaattatatagttggaaaacaaggatg5580

catatatgaatgaacgatgcagaggcaatgccgatggcgatagtgggtatcatgtagccg5640

cttatgctggaaagaagcaataacccgcagaaaaacaaagctccaagctcaacaaaacta5700

agggcatagacaataactaccgatgtcatatacccatactctctaatcttggccagtcgg5760

cgcgttctgcttccgattagaaacgtcaaggcagcaatcaggattgcaatcatggttcct5820

gcatatgatgacaatgtcgccccaagaccatctctatgagctgaaaaagaaacaccagga5880

atgtagtggcggaaaaggagatagcaaatgcttacgataacgtaaggaattattactatg5940

taaacaccaggcatgattctgttccgcataattactcctgataattaatccttaactttg6000

cccacctgccttttaaaacattccagtatatcacttttcattcttgcgtagcaatatgcc6060

atctcttcagctatctcagcattggtgaccttgttcagaggcgctgagagatggcctttt6120

tctgatagataatgttctgttaaaatatctccggcctcatcttttgcccgcaggctaatg6180

tctgaaaattgaggtgacgggttaaaaataatatccttggcaaccttttttatatccctt6240

ttaaattttggcttaatgactatatccaatgagtcaaaaagctccccttcaatatctgtt6300

gcccctaagacctttaatatatcgccaaatacaggtagcttggcttctaccttcaccgtt6360

gttcggccgatgaaatgcatatgcataacatcgtctttggtggttcccctcatcagtggc6420

tctatctgaacgcgctctccactgcttaatgacattcctttcccgattaaaaaatctgtc6480

agatcggatgtggtcggcccgaaaacagttctggcaaaaccaatggtgtcgccttcaaca6540

aacaaaaaagatgggaatcccaatgattcgtcatctgcgaggctgttcttaatatcttca6600

actgaagctttagagcgatttatcttctgaaccagactcttgtcatttgttttggtaaag6660

agaaaagtttttccatcgattttatgaatatacaaataattggagccaacctgcaggtga6720

tgattatcagccagcagagaattaaggaaaacagacaggtttattgagcgcttatctttc6780

cctttatttttgctgcggtaagtcgcataaaaaccattcttcataattcaatccatttac6840

tatgttatgttctgaggggagtgaaaattcccctaattcgatgaagattcttgctcaatt6900

gttatcagctatgcgccgaccagaacaccttgccgatcagccaaacgtctcttcaggcca6960

ctgactagcgataactttccccacaacggaacaactctcattgcatgggatcattgggta7020

ctgtgggtttagtggttgtaaaaacacctgaccgctatccctgatcagtttcttgaaggt7080

aaactcatcacccccaagtctggctatgcagaaatcacctggctcaacagcctgctcagg7140

gtcaacgagaattaacattccgtcaggaaagcttggcttggagcctgttggtgcggtcat7200

ggaattaccttcaacctcaagccagaatgcagaatcactggcttttttggttgtgcttac7260

ccatctctccgcatcacctttggtaaaggttctaagctcaggtgagaacatccctgcctg7320

aacatgagaaaaaacagggtactcatactcacttctaagtgacggctgcatactaaccgc7380

ttcatacatctcgtagatttctctggcgattgaagggctaaattcttcaacgctaacttt7440

gagaatttttgcaagcaatgcggcgttataagcatttaatgcattgatgccattaaataa7500

agcaccaacgcctgactgccccatccccatcttgtctgcgacagattcctgggataagcc7560

aagttcatttttctttttttcataaattgctttaaggcgacgtgcgtcctcaagctgctc7620

ttgtgttaatggtttcttttttgtgctcatacgttaaatctatcaccgcaagggataaat7680

atctaacaccgtgcgtgttgactattttacctctggcggtgataatggttgcatgtacta7740

aggaggttgtatggaacaacgcataaccctgaaagattatgcaatgcgctttgggcaaac7800

caagacagctaaagatctcggcgtatatcaaagcgcgatcaacaaggccattcatgcagg7860

ccgaaagatttttttaactataaacgctgatggaagcgtttatgcggaagaggtaaagcc7920

cttcccgagtaacaaaaaaacaacagcataaataaccccgctcttacacattccagccct7980

gaaaaagggcatcaaattaaaccacacctatggtgtatgcatttatttgcatacattcaa8040

tcaattgttatctaaggaaatacttacatatggttcgtgcaaacaaacgcaacgaggctc8100

tacgaatcgagagtgcgttgcttaacaaaatcgcaatgcttggaactgagaagacagcgg8160

aagctgtgggcgttgataagtcgcagatcagcaggtggaagagggactggattccaaagt8220

tctcaatgctgcttgctgttcttgaatggggggtcgttgacgacgacatggctcgattgg8280

cgcgacaagttgctgcgattctcaccaataaaaaacgcccggcggcaaccgagcgttctg8340

aacaaatccagatggagttctgaggtcattactggatctatcaacaggagtcattatgac8400

aaatacagcaaaaatactcaacttcggcagaggtaactttgccggacaggagcgtaatgt8460

ggcagatctcgatgatggttacgccagactatcaaatatgctgcttgaggcttattcggg8520

cgcagatctgaccaagcgacagtttaaagtgctgcttgccattctgcgtaaaacctatgg8580

gtggaataaaccaatggacagaatcaccgattctcaacttagcgagattacaaagttacc8640

tgtcaaacggtgcaatgaagccaagttagaactcgtcagaatgaatattatcaagcagca8700

aggcggcatgtttggaccaaataaaaacatctcagaatggtgcatccctcaaaacgaggg8760

aaaatcccctaaaacgagggataaaacatccctcaaattgggggattgctatccctcaaa8820

acagggggacacaaaagacactattacaaaagaaaaaagaaaagattattcgtcagagaa8880

ttctggcgaatcctctgaccagccagaaaacgacctttctgtggtgaaaccggatgctgc8940

aattcagagcggcagcaagtgggggacagcagaagacctgaccgccgcagagtggatgtt9000

tgacatggtgaagactatcgcaccatcagccagaaaaccgaattttgctgggtgggctaa9060

cgatatccgcctgatgcgtgaacgtgacggacgtaaccaccgcga9105

<210>12

<211>9107

<212>dna

<213>artificialsequence

<220>

<223>lambdadna

<400>12

catgtgtgtgctgttccgctgggcatgccaggacaacttctggtccggtaacgtgctgag60

cccggccaaactccgcgataagtggacccaactcgaaatcaaccgtaacaagcaacaggc120

aggcgtgacagccagcaaaccaaaactcgacctgacaaacacagactggatttacggggt180

ggatctatgaaaaacatcgccgcacagatggttaactttgaccgtgagcagatgcgtcgg240

atcgccaacaacatgccggaacagtacgacgaaaagccgcaggtacagcaggtagcgcag300

atcatcaacggtgtgttcagccagttactggcaactttcccggcgagcctggctaaccgt360

gaccagaacgaagtgaacgaaatccgtcgccagtgggttctggcttttcgggaaaacggg420

atcaccacgatggaacaggttaacgcaggaatgcgcgtagcccgtcggcagaatcgacca480

tttctgccatcacccgggcagtttgttgcatggtgccgggaagaagcatccgttaccgcc540

ggactgccaaacgtcagcgagctggttgatatggtttacgagtattgccggaagcgaggc600

ctgtatccggatgcggagtcttatccgtggaaatcaaacgcgcactactggctggttacc660

aacctgtatcagaacatgcgggccaatgcgcttactgatgcggaattacgccgtaaggcc720

gcagatgagcttgtccatatgactgcgagaattaaccgtggtgaggcgatccctgaacca780

gtaaaacaacttcctgtcatgggcggtagacctctaaatcgtgcacaggctctggcgaag840

atcgcagaaatcaaagctaagttcggactgaaaggagcaagtgtatgacgggcaaagagg900

caattattcattacctggggacgcataatagcttctgtgcgccggacgttgccgcgctaa960

caggcgcaacagtaaccagcataaatcaggccgcggctaaaatggcacgggcaggtcttc1020

tggttatcgaaggtaaggtctggcgaacggtgtattaccggtttgctaccagggaagaac1080

gggaaggaaagatgagcacgaacctggtttttaaggagtgtcgccagagtgccgcgatga1140

aacgggtattggcggtatatggagttaaaagatgaccatctacattactgagctaataac1200

aggcctgctggtaatcgcaggcctttttatttgggggagagggaagtcatgaaaaaacta1260

acctttgaaattcgatctccagcacatcagcaaaacgctattcacgcagtacagcaaatc1320

cttccagacccaaccaaaccaatcgtagtaaccattcaggaacgcaaccgcagcttagac1380

caaaacaggaagctatgggcctgcttaggtgacgtctctcgtcaggttgaatggcatggt1440

cgctggctggatgcagaaagctggaagtgtgtgtttaccgcagcattaaagcagcaggat1500

gttgttcctaaccttgccgggaatggctttgtggtaataggccagtcaaccagcaggatg1560

cgtgtaggcgaatttgcggagctattagagcttatacaggcattcggtacagagcgtggc1620

gttaagtggtcagacgaagcgagactggctctggagtggaaagcgagatggggagacagg1680

gctgcatgataaatgtcgttagtttctccggtggcaggacgtcagcatatttgctctggc1740

taatggagcaaaagcgacgggcaggtaaagacgtgcattacgttttcatggatacaggtt1800

gtgaacatccaatgacatatcggtttgtcagggaagttgtgaagttctgggatataccgc1860

tcaccgtattgcaggttgatatcaacccggagcttggacagccaaatggttatacggtat1920

gggaaccaaaggatattcagacgcgaatgcctgttctgaagccatttatcgatatggtaa1980

agaaatatggcactccatacgtcggcggcgcgttctgcactgacagattaaaactcgttc2040

ccttcaccaaatactgtgatgaccatttcgggcgagggaattacaccacgtggattggca2100

tcagagctgatgaaccgaagcggctaaagccaaagcctggaatcagatatcttgctgaac2160

tgtcagactttgagaaggaagatatcctcgcatggtggaagcaacaaccattcgatttgc2220

aaataccggaacatctcggtaactgcatattctgcattaaaaaatcaacgcaaaaaatcg2280

gacttgcctgcaaagatgaggagggattgcagcgtgtttttaatgaggtcatcacgggat2340

cccatgtgcgtgacggacatcgggaaacgccaaaggagattatgtaccgaggaagaatgt2400

cgctggacggtatcgcgaaaatgtattcagaaaatgattatcaagccctgtatcaggaca2460

tggtacgagctaaaagattcgataccggctcttgttctgagtcatgcgaaatatttggag2520

ggcagcttgatttcgacttcgggagggaagctgcatgatgcgatgttatcggtgcggtga2580

atgcaaagaagataaccgcttccgaccaaatcaaccttactggaatcgatggtgtctccg2640

gtgtgaaagaacaccaacaggggtgttaccactaccgcaggaaaaggaggacgtgtggcg2700

agacagcgacgaagtatcaccgacataatctgcgaaaactgcaaataccttccaacgaaa2760

cgcaccagaaataaacccaagccaatcccaaaagaatctgacgtaaaaaccttcaactac2820

acggctcacctgtgggatatccggtggctaagacgtcgtgcgaggaaaacaaggtgattg2880

accaaaatcgaagttacgaacaagaaagcgtcgagcgagctttaacgtgcgctaactgcg2940

gtcagaagctgcatgtgctggaagttcacgtgtgtgagcactgctgcgcagaactgatga3000

gcgatccgaatagctcgatgcacgaggaagaagatgatggctaaaccagcgcgaagacga3060

tgtaaaaacgatgaatgccgggaatggtttcaccctgcattcgctaatcagtggtggtgc3120

tctccagagtgtggaaccaagatagcactcgaacgacgaagtaaagaacgcgaaaaagcg3180

gaaaaagcagcagagaagaaacgacgacgagaggagcagaaacagaaagataaacttaag3240

attcgaaaactcgccttaaagccccgcagttactggattaaacaagcccaacaagccgta3300

aacgccttcatcagagaaagagaccgcgacttaccatgtatctcgtgcggaacgctcacg3360

tctgctcagtgggatgccggacattaccggacaactgctgcggcacctcaactccgattt3420

aatgaacgcaatattcacaagcaatgcgtggtgtgcaaccagcacaaaagcggaaatctc3480

gttccgtatcgcgtcgaactgattagccgcatcgggcaggaagcagtagacgaaatcgaa3540

tcaaaccataaccgccatcgctggactatcgaagagtgcaaggcgatcaaggcagagtac3600

caacagaaactcaaagacctgcgaaatagcagaagtgaggccgcatgacgttctcagtaa3660

aaaccattccagacatgctcgttgaagcatacggaaatcagacagaagtagcacgcagac3720

tgaaatgtagtcgcggtacggtcagaaaatacgttgatgataaagacgggaaaatgcacg3780

ccatcgtcaacgacgttctcatggttcatcgcggatggagtgaaagagatgcgctattac3840

gaaaaaattgatggcagcaaataccgaaatatttgggtagttggcgatctgcacggatgc3900

tacacgaacctgatgaacaaactggatacgattggattcgacaacaaaaaagacctgctt3960

atctcggtgggcgatttggttgatcgtggtgcagagaacgttgaatgcctggaattaatc4020

acattcccctggttcagagctgtacgtggaaaccatgagcaaatgatgattgatggctta4080

tcagagcgtggaaacgttaatcactggctgcttaatggcggtggctggttctttaatctc4140

gattacgacaaagaaattctggctaaagctcttgcccataaagcagatgaacttccgtta4200

atcatcgaactggtgagcaaagataaaaaatatgttatctgccacgccgattatcccttt4260

gacgaatacgagtttggaaagccagttgatcatcagcaggtaatctggaaccgcgaacga4320

atcagcaactcacaaaacgggatcgtgaaagaaatcaaaggcgcggacacgttcatcttt4380

ggtcatacgccagcagtgaaaccactcaagtttgccaaccaaatgtatatcgataccggc4440

gcagtgttctgcggaaacctaacattgattcaggtacagggagaaggcgcatgagactcg4500

aaagcgtagctaaatttcattcgccaaaaagcccgatgatgagcgactcaccacgggcca4560

cggcttctgactctctttccggtactgatgtgatggctgctatggggatggcgcaatcac4620

aagccggattcggtatggctgcattctgcggtaagcacgaactcagccagaacgacaaac4680

aaaaggctatcaactatctgatgcaatttgcacacaaggtatcggggaaataccgtggtg4740

tggcaaagcttgaaggaaatactaaggcaaaggtactgcaagtgctcgcaacattcgctt4800

atgcggattattgccgtagtgccgcgacgccgggggcaagatgcagagattgccatggta4860

caggccgtgcggttgatattgccaaaacagagctgtgggggagagttgtcgagaaagagt4920

gcggaagatgcaaaggcgtcggctattcaaggatgccagcaagcgcagcatatcgcgctg4980

tgacgatgctaatcccaaaccttacccaacccacctggtcacgcactgttaagccgctgt5040

atgacgctctggtggtgcaatgccacaaagaagagtcaatcgcagacaacattttgaatg5100

cggtcacacgttagcagcatgattgccacggatggcaacatattaacggcatgatattga5160

cttattgaataaaattgggtaaatttgactcaacgatgggttaattcgctcgttgtggta5220

gtgagatgaaaagaggcggcgcttactaccgattccgcctagttggtcacttcgacgtat5280

cgtctggaactccaaccatcgcaggcagagaggtctgcaaaatgcaatcccgaaacagtt5340

cgcaggtaatagttagagcctgcataacggtttcgggattttttatatctgcacaacagg5400

taagagcattgagtcgataatcgtgaagagtcggcgagcctggttagccagtgctctttc5460

cgttgtgctgaattaagcgaataccggaagcagaaccggatcaccaaatgcgtacaggcg5520

tcatcgccgcccagcaacagcacaacccaaactgagccgtagccactgtctgtcctgaat5580

tcattagtaatagttacgctgcggccttttacacatgaccttcgtgaaagcgggtggcag5640

gaggtcgcgctaacaacctcctgccgttttgcccgtgcatatcggtcacgaacaaatctg5700

attactaaacacagtagcctggatttgttctatcagtaatcgaccttattcctaattaaa5760

tagagcaaatccccttattgggggtaagacatgaagatgccagaaaaacatgacctgttg5820

gccgccattctcgcggcaaaggaacaaggcatcggggcaatccttgcgtttgcaatggcg5880

taccttcgcggcagatataatggcggtgcgtttacaaaaacagtaatcgacgcaacgatg5940

tgcgccattatcgcctggttcattcgtgaccttctcgacttcgccggactaagtagcaat6000

ctcgcttatataacgagcgtgtttatcggctacatcggtactgactcgattggttcgctt6060

atcaaacgcttcgctgctaaaaaagccggagtagaagatggtagaaatcaataatcaacg6120

taaggcgttcctcgatatgctggcgtggtcggagggaactgataacggacgtcagaaaac6180

cagaaatcatggttatgacgtcattgtaggcggagagctatttactgattactccgatca6240

ccctcgcaaacttgtcacgctaaacccaaaactcaaatcaacaggcgccggacgctacca6300

gcttctttcccgttggtgggatgcctaccgcaagcagcttggcctgaaagacttctctcc6360

gaaaagtcaggacgctgtggcattgcagcagattaaggagcgtggcgctttacctatgat6420

tgatcgtggtgatatccgtcaggcaatcgaccgttgcagcaatatctgggcttcactgcc6480

gggcgctggttatggtcagttcgagcataaggctgacagcctgattgcaaaattcaaaga6540

agcgggcggaacggtcagagagattgatgtatgagcagagtcaccgcgattatctccgct6600

ctggttatctgcatcatcgtctgcctgtcatgggctgttaatcattaccgtgataacgcc6660

attacctacaaagcccagcgcgacaaaaatgccagagaactgaagctggcgaacgcggca6720

attactgacatgcagatgcgtcagcgtgatgttgctgcgctcgatgcaaaatacacgaag6780

gagttagctgatgctaaagctgaaaatgatgctctgcgtgatgatgttgccgctggtcgt6840

cgtcggttgcacatcaaagcagtctgtcagtcagtgcgtgaagccaccaccgcctccggc6900

gtggataatgcagcctccccccgactggcagacaccgctgaacgggattatttcaccctc6960

agagagaggctgatcactatgcaaaaacaactggaaggaacccagaagtatattaatgag7020

cagtgcagatagagttgcccatatcgatgggcaactcatgcaattattgtgagcaataca7080

cacgcgcttccagcggagtataaatgcctaaagtaataaaaccgagcaatccatttacga7140

atgtttgctgggtttctgttttaacaacattttctgcgccgccacaaattttggctgcat7200

cgacagttttcttctgcccaattccagaaacgaagaaatgatgggtgatggtttcctttg7260

gtgctactgctgccggtttgttttgaacagtaaacgtctgttgagcacatcctgtaataa7320

gcagggccagcgcagtagcgagtagcatttttttcatggtgttattcccgatgctttttg7380

aagttcgcagaatcgtatgtgtagaaaattaaacaaaccctaaacaatgagttgaaattt7440

catattgttaatatttattaatgtatgtcaggtgcgatgaatcgtcattgtattcccgga7500

ttaactatgtccacagccctgacggggaacttctctgcgggagtgtccgggaataattaa7560

aacgatgcacacagggtttagcgcgtacacgtattgcattatgccaacgccccggtgctg7620

acacggaagaaaccggacgttatgatttagcgtggaaagatttgtgtagtgttctgaatg7680

ctctcagtaaatagtaatgaattatcaaaggtatagtaatatcttttatgttcatggata7740

tttgtaacccatcggaaaactcctgctttagcaagattttccctgtattgctgaaatgtg7800

atttctcttgatttcaacctatcataggacgtttctataagatgcgtgtttcttgagaat7860

ttaacatttacaacctttttaagtccttttattaacacggtgttatcgttttctaacacg7920

atgtgaatattatctgtggctagatagtaaatataatgtgagacgttgtgacgttttagt7980

tcagaataaaacaattcacagtctaaatcttttcgcacttgatcgaatatttctttaaaa8040

atggcaacctgagccattggtaaaaccttccatgtgatacgagggcgcgtagtttgcatt8100

atcgtttttatcgtttcaatctggtctgacctccttgtgttttgttgatgatttatgtca8160

aatattaggaatgttttcacttaatagtattggttgcgtaacaaagtgcggtcctgctgg8220

cattctggagggaaatacaaccgacagatgtatgtaaggccaacgtgctcaaatcttcat8280

acagaaagatttgaagtaatattttaaccgctagatgaagagcaagcgcatggagcgaca8340

aaatgaataaagaacaatctgctgatgatccctccgtggatctgattcgtgtaaaaaata8400

tgcttaatagcaccatttctatgagttaccctgatgttgtaattgcatgtatagaacata8460

aggtgtctctggaagcattcagagcaattgaggcagcgttggtgaagcacgataataata8520

tgaaggattattccctggtggttgactgatcaccataactgctaatcattcaaactattt8580

agtctgtgacagagccaacacgcagtctgtcactgtcaggaaagtggtaaaactgcaact8640

caattactgcaatgccctcgtaattaagtgaatttacaatatcgtcctgttcggagggaa8700

gaacgcgggatgttcattcttcatcacttttaattgatgtatatgctctcttttctgacg8760

ttagtctccgacggcaggcttcaatgacccaggctgagaaattcccggaccctttttgct8820

caagagcgatgttaatttgttcaatcatttggttaggaaagcggatgttgcgggttgttg8880

ttctgcgggttctgttcttcgttgacatgaggttgccccgtattcagtgtcgctgatttg8940

tattgtctgaagttgtttttacgttaagttgatgcagatcaattaatacgatacctgcgt9000

cataattgattatttgacgtggtttgatggcctccacgcacgttgtgatatgtagatgat9060

aatcattatcactttacgggtcctttccggtgatccgacaggttacg9107

<210>13

<211>103

<212>rna

<213>artificialsequence

<220>

<223>sgrna

<400>13

cgcagaguccucaaaaaacgguuuuagagcuagaaauagcaaguuaaaauaaggcuaguc60

cguuaucaacuugaaaaaguggcaccgagucggugcuuuuuuu103

<210>14

<211>20

<212>dna

<213>artificialsequence

<220>

<223>protospacer

<400>14

cgcagagtcctcaaaaaacg20

<210>15

<211>103

<212>rna

<213>artificialsequence

<220>

<223>srrna

<400>15

agcaguuccagcacaaucgaguuuuagagcuagaaauagcaaguuaaaauaaggcuaguc60

cguuaucaacuugaaaaaguggcaccgagucggugcuuuuuuu103

<210>16

<211>20

<212>dna

<213>artificialsequence

<220>

<223>protospacer

<400>16

agcagttccagcacaatcga20

<210>17

<211>522

<212>dna

<213>artificialsequence

<220>

<223>lambdadna

<400>17

caccattcagctgaaagccagacgtaacagcaccacggtggtggtgaacacggtgggctc60

agagaatccggatgaagccgggcgttacagcatggatgtggagtacggtcagtacagtgt120

catcctgcaggttgacggttttccaccatcgcacgccgggaccatcaccgtgtatgaaga180

ttcacaaccggggacgctgaatgattttctctgtgccatgacggaggatgatgcccggcc240

ggaggtgctgcgtcgtcttgaactgatggtggaagaggtggcgcgtaacgcgtccgtggt300

ggcacagagtacggcagacgcgaagaaatcagccggcgatgccagtgcatcagctgctca360

ggtcgcggcccttgtgactgatgcaactgactcagcacgcgccgccagcacgtccgccgg420

acaggctgcatcgtcagctcaggaagcgtcctccggcgcagaagcggcatcagcaaaggc480

cactgaagcggaaaaaagtgccgcagccgcagagtcctcaaa522

<210>18

<211>520

<212>dna

<213>artificialsequence

<220>

<223>lambdadna

<400>18

atcgatggtgttaccaattcatggaaaaggtctgcgtcaaatccccagtcgtcatgcatt60

gcctgctctgccgcttcacgcagtgcctgagagttaatttcgctcacttcgaacctctct120

gtttactgataagttccagatcctcctggcaacttgcacaagtccgacaaccctgaacga180

ccaggcgtcttcgttcatctatcggatcgccacactcacaacaatgagtggcagatatag240

cctggtggttcaggcggcgcatttttattgctgtgttgcgctgtaattcttctatttctg300

atgctgaatcaatgatgtctgccatctttcattaatccctgaactgttggttaatacgct360

tgagggtgaatgcgaataataaaaaaggagcctgtagctccctgatgattttgcttttca420

tgttcatcgttccttaaagacgccgtttaacatgccgattgccaggcttaaatgagtcgg480

tgtgaatcccatcagcgttaccgtttcgcggtgcttcttc520

<210>19

<211>1082

<212>prt

<213>geobacillusthermodenitrificanst12

<400>19

metlystyrlysileglyleuaspileglyilethrserileglytrp

151015

alavalileasnleuaspileproargilegluaspleuglyvalarg

202530

ilepheaspargalagluasnprolysthrglygluserleualaleu

354045

proargargleualaargseralaargargargleuargargarglys

505560

hisargleugluargileargargleuphevalarggluglyileleu

65707580

thrlysglugluleuasnlysleupheglulyslyshisgluileasp

859095

valtrpglnleuargvalglualaleuasparglysleuasnasnasp

100105110

gluleualaargileleuleuhisleualalysargargglyphearg

115120125

serasnarglyssergluargthrasnlysgluasnserthrmetleu

130135140

lyshisileglugluasnglnserileleusersertyrargthrval

145150155160

alaglumetvalvallysaspprolyspheserleuhislysargasn

165170175

lysgluaspasntyrthrasnthrvalalaargaspaspleugluarg

180185190

gluilelysleuilephealalysglnargglutyrglyasnileval

195200205

cysthrglualaphegluhisglutyrileseriletrpalasergln

210215220

argprophealaserlysaspaspileglulyslysvalglyphecys

225230235240

thrphegluprolysglulysargalaprolysalathrtyrthrphe

245250255

glnserphethrvaltrpgluhisileasnlysleuargleuvalser

260265270

proglyglyileargalaleuthraspaspgluargargleuiletyr

275280285

lysglnalaphehislysasnlysilethrphehisaspvalargthr

290295300

leuleuasnleuproaspaspthrargphelysglyleuleutyrasp

305310315320

argasnthrthrleulysgluasnglulysvalargpheleugluleu

325330335

glyalatyrhislysilearglysalaileaspservaltyrglylys

340345350

glyalaalalysserpheargproileasppheaspthrpheglytyr

355360365

alaleuthrmetphelysaspaspthraspileargsertyrleuarg

370375380

asnglutyrgluglnasnglylysargmetgluasnleualaasplys

385390395400

valtyraspglugluleuileglugluleuleuasnleuserpheser

405410415

lyspheglyhisleuserleulysalaleuargasnileleuprotyr

420425430

metgluglnglygluvaltyrserthralacysgluargalaglytyr

435440445

thrphethrglyprolyslyslysglnlysthrvalleuleuproasn

450455460

ileproproilealaasnprovalvalmetargalaleuthrglnala

465470475480

arglysvalvalasnalaileilelyslystyrglyserprovalser

485490495

ilehisilegluleualaarggluleuserglnserpheaspgluarg

500505510

arglysmetglnlysgluglngluglyasnarglyslysasngluthr

515520525

alaileargglnleuvalglutyrglyleuthrleuasnprothrgly

530535540

leuaspilevallysphelysleutrpsergluglnasnglylyscys

545550555560

alatyrserleuglnproilegluilegluargleuleugluprogly

565570575

tyrthrgluvalasphisvalileprotyrserargserleuaspasp

580585590

sertyrthrasnlysvalleuvalleuthrlysgluasnargglulys

595600605

glyasnargthrproalaglutyrleuglyleuglysergluargtrp

610615620

glnglnphegluthrphevalleuthrasnlysglnpheserlyslys

625630635640

lysargaspargleuleuargleuhistyraspgluasnglugluasn

645650655

gluphelysasnargasnleuasnaspthrargtyrileserargphe

660665670

leualaasnpheilearggluhisleulysphealaaspseraspasp

675680685

lysglnlysvaltyrthrvalasnglyargilethralahisleuarg

690695700

serargtrpasnpheasnlysasnargglugluserasnleuhishis

705710715720

alavalaspalaalailevalalacysthrthrproseraspileala

725730735

argvalthralaphetyrglnargarggluglnasnlysgluleuser

740745750

lyslysthraspproglnpheproglnprotrpprohisphealaasp

755760765

gluleuglnalaargleuserlysasnprolysgluserilelysala

770775780

leuasnleuglyasntyraspasnglulysleugluserleuglnpro

785790795800

valphevalserargmetprolysargserilethrglyalaalahis

805810815

glngluthrleuargargtyrileglyileaspgluargserglylys

820825830

ileglnthrvalvallyslyslysleusergluileglnleuasplys

835840845

thrglyhisphepromettyrglylysgluseraspproargthrtyr

850855860

glualaileargglnargleuleugluhisasnasnaspprolyslys

865870875880

alapheglngluproleutyrlysprolyslysasnglygluleugly

885890895

proileileargthrilelysileileaspthrthrasnglnvalile

900905910

proleuasnaspglylysthrvalalatyrasnserasnilevalarg

915920925

valaspvalpheglulysaspglylystyrtyrcysvalproiletyr

930935940

thrileaspmetmetlysglyileleuproasnlysalaileglupro

945950955960

asnlysprotyrserglutrplysglumetthrgluasptyrthrphe

965970975

argpheserleutyrproasnaspleuileargileglupheproarg

980985990

glulysthrilelysthralavalglyglugluilelysilelysasp

99510001005

leuphealatyrtyrglnthrileaspserserasnglyglyleu

101010151020

serleuvalserhisaspasnasnpheserleuargserilegly

102510301035

serargthrleulysargpheglulystyrglnvalaspvalleu

104010451050

glyasniletyrlysvalargglyglulysargvalglyvalala

105510601065

serserserhisserlysalaglygluthrileargproleu

107010751080

<210>20

<211>1263

<212>prt

<213>eubacteriumrectale

<400>20

metasnasnglythrasnasnpheglnasnpheileglyileserser

151015

leuglnlysthrleuargasnalaleuileprothrgluthrthrgln

202530

glnpheilevallysasnglyileilelysgluaspgluleuarggly

354045

gluasnargglnileleulysaspilemetaspasptyrtyrarggly

505560

pheilesergluthrleuserserileaspaspileasptrpthrser

65707580

leupheglulysmetgluileglnleulysasnglyaspasnlysasp

859095

thrleuilelysgluglnthrglutyrarglysalailehislyslys

100105110

phealaasnaspaspargphelysasnmetpheseralalysleuile

115120125

seraspileleuprogluphevalilehisasnasnasntyrserala

130135140

serglulysgluglulysthrglnvalilelysleupheserargphe

145150155160

alathrserphelysasptyrphelysasnargalaasncyspheser

165170175

alaaspaspilesersersersercyshisargilevalasnaspasn

180185190

alagluilephepheserasnalaleuvaltyrargargilevallys

195200205

serleuserasnaspaspileasnlysileserglyaspmetlysasp

210215220

serleulysglumetserleuglugluiletyrsertyrglulystyr

225230235240

glyglupheilethrglngluglyileserphetyrasnaspilecys

245250255

glylysvalasnserphemetasnleutyrcysglnlysasnlysglu

260265270

asnlysasnleutyrlysleuglnlysleuhislysglnileleucys

275280285

ilealaaspthrsertyrgluvalprotyrlysphegluseraspglu

290295300

gluvaltyrglnservalasnglypheleuaspasnileserserlys

305310315320

hisilevalgluargleuarglysileglyaspasntyrasnglytyr

325330335

asnleuasplysiletyrilevalserlysphetyrgluservalser

340345350

glnlysthrtyrargasptrpgluthrileasnthralaleugluile

355360365

histyrasnasnileleuproglyasnglylysserlysalaasplys

370375380

vallyslysalavallysasnaspleuglnlysserilethrgluile

385390395400

asngluleuvalserasntyrlysleucysseraspaspasnilelys

405410415

alagluthrtyrilehisgluileserhisileleuasnasnpheglu

420425430

alaglngluleulystyrasnprogluilehisleuvalgluserglu

435440445

leulysalasergluleulysasnvalleuaspvalilemetasnala

450455460

phehistrpcysservalphemetthrglugluleuvalasplysasp

465470475480

asnasnphetyralagluleuglugluiletyraspgluiletyrpro

485490495

valileserleutyrasnleuvalargasntyrvalthrglnlyspro

500505510

tyrserthrlyslysilelysleuasnpheglyileprothrleuala

515520525

aspglytrpserlysserlysglutyrserasnasnalaileileleu

530535540

metargaspasnleutyrtyrleuglyilepheasnalalysasnlys

545550555560

proasplyslysileilegluglyasnthrsergluasnlysglyasp

565570575

tyrlyslysmetiletyrasnleuleuproglyproasnlysmetile

580585590

prolysvalpheleuserserlysthrglyvalgluthrtyrlyspro

595600605

seralatyrileleugluglytyrlysglnasnlyshisilelysser

610615620

serlysasppheaspilethrphecyshisaspleuileasptyrphe

625630635640

lysasncysilealailehisproglutrplysasnpheglypheasp

645650655

pheseraspthrserthrtyrgluaspileserglyphetyrargglu

660665670

valgluleuglnglytyrlysileasptrpthrtyrileserglulys

675680685

aspileaspleuleuglnglulysglyglnleutyrleupheglnile

690695700

tyrasnlysasppheserlyslysserthrglyasnaspasnleuhis

705710715720

thrmettyrleulysasnleupheserglugluasnleulysaspile

725730735

valleulysleuasnglyglualagluilephephearglysserser

740745750

ilelysasnproileilehislyslysglyserileleuvalasnarg

755760765

thrtyrglualagluglulysaspglnpheglyasnileglnileval

770775780

arglysasnileprogluasniletyrglngluleutyrlystyrphe

785790795800

asnasplysserasplysgluleuseraspglualaalalysleulys

805810815

asnvalvalglyhishisglualaalathrasnilevallysasptyr

820825830

argtyrthrtyrasplystyrpheleuhismetproilethrileasn

835840845

phelysalaasnlysthrglypheileasnaspargileleuglntyr

850855860

ilealalysglulysaspleuhisvalileglyileaspargglyglu

865870875880

argasnleuiletyrvalservalileaspthrcysglyasnileval

885890895

gluglnlysserpheasnilevalasnglytyrasptyrglnilelys

900905910

leulysglnglngluglyalaargglnilealaarglysglutrplys

915920925

gluileglylysilelysgluilelysgluglytyrleuserleuval

930935940

ilehisgluileserlysmetvalilelystyrasnalaileileala

945950955960

metgluaspleusertyrglyphelyslysglyargphelysvalglu

965970975

argglnvaltyrglnlysphegluthrmetleuileasnlysleuasn

980985990

tyrleuvalphelysaspileserilethrgluasnglyglyleuleu

99510001005

lysglytyrglnleuthrtyrileproasplysleulysasnval

101010151020

glyhisglncysglycysilephetyrvalproalaalatyrthr

102510301035

serlysileaspprothrthrglyphevalasnilephelysphe

104010451050

lysaspleuthrvalaspalalysargglupheilelyslysphe

105510601065

aspserileargtyraspserglulysasnleuphecysphethr

107010751080

pheasptyrasnasnpheilethrglnasnthrvalmetserlys

108510901095

sersertrpservaltyrthrtyrglyvalargilelysargarg

110011051110

phevalasnglyargpheserasngluseraspthrileaspile

111511201125

thrlysaspmetglulysthrleuglumetthraspileasntrp

113011351140

argaspglyhisaspleuargglnaspileileasptyrgluile

114511501155

valglnhisilephegluilepheargleuthrvalglnmetarg

116011651170

asnserleusergluleugluaspargasptyraspargleuile

117511801185

serprovalleuasngluasnasnilephetyraspseralalys

119011951200

alaglyaspalaleuprolysaspalaaspalaasnglyalatyr

120512101215

cysilealaleulysglyleutyrgluilelysglnilethrglu

122012251230

asntrplysgluaspglylyspheserargasplysleulysile

123512401245

serasnlysasptrppheasppheileglnasnlysargtyrleu

125012551260

<210>21

<211>1274

<212>prt

<213>artificialsequence

<220>

<223>mad7-nls

<400>21

metasnasnglythrasnasnpheglnasnpheileglyileserser

151015

leuglnlysthrleuargasnalaleuileprothrgluthrthrgln

202530

glnpheilevallysasnglyileilelysgluaspgluleuarggly

354045

gluasnargglnileleulysaspilemetaspasptyrtyrarggly

505560

pheilesergluthrleuserserileaspaspileasptrpthrser

65707580

leupheglulysmetgluileglnleulysasnglyaspasnlysasp

859095

thrleuilelysgluglnthrglutyrarglysalailehislyslys

100105110

phealaasnaspaspargphelysasnmetpheseralalysleuile

115120125

seraspileleuprogluphevalilehisasnasnasntyrserala

130135140

serglulysgluglulysthrglnvalilelysleupheserargphe

145150155160

alathrserphelysasptyrphelysasnargalaasncyspheser

165170175

alaaspaspilesersersersercyshisargilevalasnaspasn

180185190

alagluilephepheserasnalaleuvaltyrargargilevallys

195200205

serleuserasnaspaspileasnlysileserglyaspmetlysasp

210215220

serleulysglumetserleuglugluiletyrsertyrglulystyr

225230235240

glyglupheilethrglngluglyileserphetyrasnaspilecys

245250255

glylysvalasnserphemetasnleutyrcysglnlysasnlysglu

260265270

asnlysasnleutyrlysleuglnlysleuhislysglnileleucys

275280285

ilealaaspthrsertyrgluvalprotyrlysphegluseraspglu

290295300

gluvaltyrglnservalasnglypheleuaspasnileserserlys

305310315320

hisilevalgluargleuarglysileglyaspasntyrasnglytyr

325330335

asnleuasplysiletyrilevalserlysphetyrgluservalser

340345350

glnlysthrtyrargasptrpgluthrileasnthralaleugluile

355360365

histyrasnasnileleuproglyasnglylysserlysalaasplys

370375380

vallyslysalavallysasnaspleuglnlysserilethrgluile

385390395400

asngluleuvalserasntyrlysleucysseraspaspasnilelys

405410415

alagluthrtyrilehisgluileserhisileleuasnasnpheglu

420425430

alaglngluleulystyrasnprogluilehisleuvalgluserglu

435440445

leulysalasergluleulysasnvalleuaspvalilemetasnala

450455460

phehistrpcysservalphemetthrglugluleuvalasplysasp

465470475480

asnasnphetyralagluleuglugluiletyraspgluiletyrpro

485490495

valileserleutyrasnleuvalargasntyrvalthrglnlyspro

500505510

tyrserthrlyslysilelysleuasnpheglyileprothrleuala

515520525

aspglytrpserlysserlysglutyrserasnasnalaileileleu

530535540

metargaspasnleutyrtyrleuglyilepheasnalalysasnlys

545550555560

proasplyslysileilegluglyasnthrsergluasnlysglyasp

565570575

tyrlyslysmetiletyrasnleuleuproglyproasnlysmetile

580585590

prolysvalpheleuserserlysthrglyvalgluthrtyrlyspro

595600605

seralatyrileleugluglytyrlysglnasnlyshisilelysser

610615620

serlysasppheaspilethrphecyshisaspleuileasptyrphe

625630635640

lysasncysilealailehisproglutrplysasnpheglypheasp

645650655

pheseraspthrserthrtyrgluaspileserglyphetyrargglu

660665670

valgluleuglnglytyrlysileasptrpthrtyrileserglulys

675680685

aspileaspleuleuglnglulysglyglnleutyrleupheglnile

690695700

tyrasnlysasppheserlyslysserthrglyasnaspasnleuhis

705710715720

thrmettyrleulysasnleupheserglugluasnleulysaspile

725730735

valleulysleuasnglyglualagluilephephearglysserser

740745750

ilelysasnproileilehislyslysglyserileleuvalasnarg

755760765

thrtyrglualagluglulysaspglnpheglyasnileglnileval

770775780

arglysasnileprogluasniletyrglngluleutyrlystyrphe

785790795800

asnasplysserasplysgluleuseraspglualaalalysleulys

805810815

asnvalvalglyhishisglualaalathrasnilevallysasptyr

820825830

argtyrthrtyrasplystyrpheleuhismetproilethrileasn

835840845

phelysalaasnlysthrglypheileasnaspargileleuglntyr

850855860

ilealalysglulysaspleuhisvalileglyileaspargglyglu

865870875880

argasnleuiletyrvalservalileaspthrcysglyasnileval

885890895

gluglnlysserpheasnilevalasnglytyrasptyrglnilelys

900905910

leulysglnglngluglyalaargglnilealaarglysglutrplys

915920925

gluileglylysilelysgluilelysgluglytyrleuserleuval

930935940

ilehisgluileserlysmetvalilelystyrasnalaileileala

945950955960

metgluaspleusertyrglyphelyslysglyargphelysvalglu

965970975

argglnvaltyrglnlysphegluthrmetleuileasnlysleuasn

980985990

tyrleuvalphelysaspileserilethrgluasnglyglyleuleu

99510001005

lysglytyrglnleuthrtyrileproasplysleulysasnval

101010151020

glyhisglncysglycysilephetyrvalproalaalatyrthr

102510301035

serlysileaspprothrthrglyphevalasnilephelysphe

104010451050

lysaspleuthrvalaspalalysargglupheilelyslysphe

105510601065

aspserileargtyraspserglulysasnleuphecysphethr

107010751080

pheasptyrasnasnpheilethrglnasnthrvalmetserlys

108510901095

sersertrpservaltyrthrtyrglyvalargilelysargarg

110011051110

phevalasnglyargpheserasngluseraspthrileaspile

111511201125

thrlysaspmetglulysthrleuglumetthraspileasntrp

113011351140

argaspglyhisaspleuargglnaspileileasptyrgluile

114511501155

valglnhisilephegluilepheargleuthrvalglnmetarg

116011651170

asnserleusergluleugluaspargasptyraspargleuile

117511801185

serprovalleuasngluasnasnilephetyraspseralalys

119011951200

alaglyaspalaleuprolysaspalaaspalaasnglyalatyr

120512101215

cysilealaleulysglyleutyrgluilelysglnilethrglu

122012251230

asntrplysgluaspglylyspheserargasplysleulysile

123512401245

serasnlysasptrppheasppheileglnasnlysargtyrleu

125012551260

serglyglyserprolyslyslysarglysval

12651270

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1