本发明属于遗传学研究领域,更具体地,属于靶向核酸分离领域,如用于遗传学研究中进一步分析或加工的文库制备。公开了用于降低核酸样品复杂度或富集核酸样品内靶核酸的新方法和组合物。
发明背景
遗传研究的重要组成是所定义的dna基因座的序列分析。这可以是对已知变体基因分型,或鉴定序列变化或变体。这类分析通常需要以多重方式完成,如需要在大量样品中分析特定基因座组。用于此的理想试验在需要筛选的样品及基因座数目方面灵活,高精度且适合不同测序平台。尝试提供包括富集步骤的试验但理想的是没有扩增。例如,us2014/0134610描述了降低复杂性的方法,使用ii型限制酶以片段化样品中的核酸,然后连接保护性接头且随后用核酸外切酶降解所有非捕获核酸。在wo2016/028887中,此方法如下改善:使用可编程的核酸内切酶,即crispr-核酸内切酶,片段化样品中的核酸。
crispr(成簇的规律间隔的短回文重复序列)是含多个较短直接重复序列的基因座且在40%经测序的细菌和90%经测序的古生菌内发现。crispr重复序列形成获得性细菌免疫系统,抵御遗传学病原体如噬菌体和质粒。当细菌受到病原体攻击时,一小段病原体基因组通过crispr相关蛋白(cas)加工并纳入crispr重复序列之间的细菌基因组。crispr基因座接着转录并加工形成所谓的crrna,其包含约30bp与病原体基因组相同的序列。这些rna分子形成在后续感染之后识别病原体的基础并通过直接消化病原体基因组来导致病原体遗传因子沉默。cas蛋白cas9是来自酿脓链球菌(s.pyogenes)的ii型crispr-cas系统的主要成分,且在联合crrna和称为反式激活crrna(tracrrna)的第二rna时形成核酸内切酶,所述核酸内切酶靶向侵入的致病dna,以通过在crrna所定义基因组位置处引入dna双链断裂(dsb)而降解。此ii型crispr-cas9系统证明在生物化学中是方便有效的工具,通过靶向引入双链缺口和随后激活内源修复机制,能够在真核基因组感兴趣位点引入修饰。jinek等.(2012,science337:816-820)证明单链嵌合rna(单引导rna、srna、sgrna)能够联合cas9形成功能核酸内切酶,所述单链嵌合rna通过组合crrna和tracrrna基本序列到单一rna分子内生成。从不同细菌种群中鉴定了许多不同crispr-cas系统(zetsche等.2015cell163,759-771;kim等.2017,nat.commun.8,1-7;ran等.2015.nature520,186-191)。
除了rna指导用于引导核酸内切酶到核酸分子特定位置的crispr-cas系统,本领域已知使用dna或rna指导的其他核酸内切酶(doxzen等.2017,plosone12(5):e0177097;kaya等.2016,pnas卷113第15号,4057-4062)。
本领域仍然很需要灵活且精确的方法用于降低核酸复杂性。本领域尤其需要就一个或多个靶核酸片段富集样品的通用方法,例如用于遗传学研究的后续分析或加工。
本发明如下详述,允许高度简化的文库制备方法用于下游加工和/或分析。
发明概述
第一方面,本发明涉及从包含核酸分子的样品富集靶核酸片段的方法,其中靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:
a)提供包含核酸分子的样品,其中所述核酸分子包含感兴趣的序列;
b)用至少第一和第二rna或dna指导的核酸内切酶复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;
c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;和
d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。
优选地,所述rna或dna指导的核酸内切酶复合物是grna-cas复合物。因此,本发明优选涉及从包含核酸分子的样品富集靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:
a)提供包含核酸分子的样品,其中所述核酸分子包含感兴趣的序列;
b)用至少第一和第二grna-cas复合物切割核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;
c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;和
d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。
优选地,步骤b)如下进行:将第一和第二grna-cas复合物与核酸分子一起在约10-90℃,优选约37℃温育约1分钟-约18小时,优选约60分钟。
优选地,步骤c)如下进行:将经切割核酸分子与核酸外切酶在约10-90℃,优选约37℃温育约1分钟-约12小时,优选30分钟。
优选地,所述第一和第二grna-cas复合物至少之一包含cas9蛋白。
优选地,所述第一和第二grna-cas复合物至少之一包含sgrna。
优选地,所述第一和第二grna-cas复合物至少之一包含作为不同分子的crrna及tracrrna。
优选地,所述第一和第二grna-cas复合物至少之一能够诱导dsb。
优选地,所述第一和第二grna-cas复合物都能够诱导dsb。
优选地,在所述步骤b)中,第一和第二grna-cas复合物至少之一使核酸分子的一条链产生缺口,且其中核酸分子与至少第三grna-cas复合物接触,所述第三grna-cas复合物使互补链基本在所述第一或第二grna-cas复合物所形成的缺口的位置的互补位置产生缺口。
第二方面,本发明涉及从包含核酸分子的样品中制备接头连接的靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:
a)提供包含所述核酸分子的样品,其中所述核酸分子包含所述感兴趣的序列;
b)用至少第一和第二grna-cas复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;
c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;
d)任选地,从步骤c所得消化物纯化包含感兴趣的序列的靶核酸片段;和
e)使接头与靶核酸片段连接。
优选地,所述接头是序列接头。
第三方面,本发明涉及从包含核酸分子的样品测序靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:
a)提供包含所述核酸分子的样品,其中所述核酸分子包含所述感兴趣的序列;
b)用至少第一和第二grna-cas复合物切割所述核酸分子,从而产生包含所述感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;
c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;
d)任选地,从步骤c所得的消化物纯化包含所述感兴趣的序列的靶核酸片段;
e)任选地,使接头与靶核酸片段连接;和
f)测序所述至少一个靶核酸片段。
优选地,本文所定义的方法对多个核酸样品平行进行。
优选地,所述核酸分子是基因组dna。
优选地,所述核酸分子是可从植物、动物、人或微生物获得的核酸分子。
第四方面,本发明涉及从核酸分子富集靶核酸片段的的成套试剂盒(kitofparts),所述试剂盒包含:
-至少本文所定义的第一和第二grna-cas复合物以及
-核酸外切酶。
第五方面,本发明涉及本文所定义的第一和第二grna-cas复合物或本文所定义的成套试剂盒用于从核酸分子富集至少一个靶核酸片段的用途。
定义
本说明书和权利要求通篇使用了涉及方法、组合物、应用和本发明其他方面的各种术语。除非另有说明,这样的术语以本发明所属领域的通常意义给出。其他特别定义的术语以与本文所提供定义一致的方式解释。尽管与本文所述类似或等同的任何方法和材料能用于实施本发明测试,但是优选的方法和材料如本文所述。
实施本发明所用常规技术的方法对技术人员是明显的。分子生物学、生物化学、计算化学、细胞培养、重组dna、生物信息学、基因组学、测序和相关领域的常规技术实施为本领域技术人员熟知,且讨论于例如下列参考文献:sambrook等.《分子克隆.实验室手册》(molecularcloning.alaboratorymanual),第2版,冷泉港实验室出版社(coldspringharborlaboratorypress),纽约冷泉港,1989;ausubel等.《精编分子生物学实验指南》(currentprotocolsinmolecularbiology),约翰威利父子公司(johnwiley&sons),纽约,1987和定期更新;和《酶学方法》系列(theseriesmethodsinenzymology),学术出版社(academicpress),圣地亚哥。
除非上下文另有明确说明,“一(a、an)”和“所述”:这些单数形式术语包括复数指示物。因此,例如,提及“一个细胞”包括2个或更多细胞的组合等。
本文所用术语“约”用于描述并解释小变化。例如,该术语能指小于或等于±10%,如小于或等于±5%,小于或等于±4%,小于或等于±3%,小于或等于±2%,小于或等于±1%,小于或等于±0.5%,小于或等于±0.1%或者小于或等于±0.05%。另外,量、比例和其他数值有时在本文中以范围形式表示。应理解这种范围形式出于方便和简洁而使用,其应灵活理解包含明确指定为限值范围的数值,还包含该范围涵盖的所有单独数值或子区间,就如同各数值和子区间被明确指定。例如,约1-约200的范围内比例应理解为包含约1和约200的明确列举界限值,还包含单个比例如约2、约3和约4,以及子区间如约10-约50、约20-约100,等等。
本文所用术语“接头”是单链、双链、部分双链、y型或发夹核酸分子,其能附着优选连接其他核酸末端,例如双链dna分子的一条或两条链,且优选长度有限,如约10-约200、或约10-约100碱基、或约10-约80、或约10-约50、或约10-约30碱基对长度,并且优选是化学合成的。接头的双链结构可由彼此碱基配对的2个不同寡核苷酸分子形成,或由单一寡核苷酸链的发夹结构形成。显然,接头的可粘附末端能设计成与悬垂部分相容或任选地能与之连接,所述悬垂部分通过限制酶和/或可编程核酸酶切割来制备,可设计成与加入非模板延伸反应(如3’-a添加)后产生的悬垂部分相容,或可具有钝端。
“和/或”:术语“和/或”指其中所述的情况的一种或多种可能单独发生,或与所述的情况的至少一种,多至所述的情况的全部组合发生的情形。
用于核酸或核酸反应使用,“扩增”是指制备特定核酸如靶核酸或带标签核酸的拷贝的体外方法。多种扩增核酸方法为本领域已知,核酸反应包括聚合酶链式反应、连接酶链式反应、链置换扩增反应、滚环扩增反应、转录介导扩增法如nasba(例如美国专利号5,409,818)、环介导扩增法(例如使用成环序列的“lamp”扩增,例如美国专利号6,410,278所述)和等温扩增反应。扩增的核酸可以是dna,包括以下、由其组成或从其衍生:dna或rna或dna与rna的混合物,包括经修饰的dna和/或rna。,无论起始核酸是dna、rna或两者,获自一个或多个核酸分子的扩增的产物(即“扩增产物”)可以是dna或rna,或dna与rna核苷或核苷酸的混合物,或其能包括经修饰的dna或rna核苷或核苷酸。
“拷贝”可以是但不限于某一序列,其与特定序列有全序列互补性或全序列相同性。或者,拷贝不必定与此特定序列具有完美序列互补性或相同性,例如允许一定程序的序列变化。例如,拷贝能包括核苷酸类似物如脱氧肌苷或脱氧尿苷,内部序列变化(如通过引物引入的序列变化,该引物所包含的序列与特定序列可杂交但不互补),和/或扩增期间发生的序列错误。
术语“互补性”在本文中定义为序列与完全互补链(如第二或反链)的序列相同性。例如,100%互补(或全互补)的序列在本文理解为与互补链有100%序列相同性,且例如80%互补的序列在本文理解为与(全)互补链有80%序列相同性。
“包含”:此术语解释为包容性和开放性的,且不是排除性的。特别地,该术语和其变型指包含特定特征、步骤或组分。这些术语不应解释为排除其他特征、步骤或组分的存在。
“构建体”或“核酸构建体”或“载体”:这指人造核酸分子,产生自重组dna技术的使用且能用于向宿主细胞递送外源dna,通常目的是在宿主细胞中表达构建体上包含的dna区域。构建体的载体骨架可以是例如质粒,其中整合了(嵌合)基因,或如果适当转录调节序列(例如(诱导型)启动子)已存在,仅想要的核苷酸序列(如编码序列)整合在所述转录调节序列下游。载体可包含更多遗传因子以促进其在分子克隆中的应用,如选择性标记、多克隆位点等。
本文所用术语“双链”和“双链体”,描述碱基配对即杂交在一起的2条互补多核苷酸。互补核苷酸链在本领域也已知为反向互补。
本文所用术语“有效量”指足以引起想要的生物学效果的生物学活性剂的量。例如,在一些实施方案中,有效量核酸外切酶可指足以诱导未保护的核酸切割的核酸外切酶的量。本领域技术人员会理解,物质(agent)的有效量可根据多种因素变化,如所用的物质、使用所述物质的条件以及想要的生物学效果,例如待检测的核酸酶切割程度。
“示范性”:此术语指“用作示例、实例或说明”,且不应解释为排除本文公开的其他配置。
“表达”:这指其中可操作连接合适调控区尤其是启动子的dna区域转录成rna,其进而能翻译成蛋白或肽的过程。
“引导序列”在本文中应理解为指导rna或dna引导的核酸内切酶到rna或dna分子特定位点的序列。在grna-cas复合物的背景下,“引导序列”进一步在本文理解为sgrna或crrna的部分,其是使grna-cas复合物靶向双链dna特定位点所需的。
grna-cas复合物在本文中应理解为与引导rna复合或杂交cas蛋白,也称为crispr-核酸内切酶或crispr-核酸酶,其中引导rna可以是crrna和/或tracrrna或sgrna。
“相同性”和“相似性”能通过已知方法容易地计算。“序列相同性”和“序列相似性”能通过比对2个肽或2个核苷酸序列用总体或局部比对算法确定,取决于2个序列的长度。长度类似的序列优选用总体比对算法(如needlemanwunsch)比对,该算法优选在完整长度上比对序列,而长度显著不同的序列优选用局部比对算法(如smithwaterman)比对。当序列(优选通过例如程序gap或bestfit用默认参数比对时)共有至少某一最小百分比的序列相同性(如下所定义)时,序列可随后称为“大体相同”或“基本相似”。gap采用needleman和wunsch总体比对算法以在其完整长度(全长)上比对2个序列,使匹配数最大化且缺口数最小化。当2个序列具有相似长度时,总体比对适用于确定序列相同性。一般,采用gap默认参数,空位产生罚分=50(核苷酸)/8(蛋白)且空位延伸罚分=3(核苷酸)/2(蛋白)。对于核苷酸,所用默认打分矩阵是nwsgapdna,对于蛋白,默认打分矩阵是blosum62(henikoff&henikoff,1992,pnas89,915-919)。序列比对和序列相同性百分比的分数可用计算机程序测定,如gcgwisconsin包,10.3版,可获自accelrys公司(accelrysinc.),9685scranton路,圣地亚哥,ca92121-3752usa,或使用开源软件如程序“needle”(采用总体needlemanwunsch算法)或“water”(采用局部smithwaterman算法),embosswin2.10.0版,所用参数与上面gap相同,或使用默认设置(都用于“needle”和“water”且都用于蛋白及dna比对,默认空格罚分是10.0且默认空位延伸罚分0.5;默认打分矩阵是用于蛋白的blosum62和用于dna的dnafull)。当序列在长度方面显著不同时,优选局部算法如用smithwaterman算法的那些。
或者,相似性或相同性百分比可通过针对公开数据库搜索来确定,使用算法如fasta,blast等。因此,本发明的核酸和蛋白序列能进一步用作“查询序列”以针对公开数据库执行搜索,例如鉴定其他家族成员或相关序列。这类搜索能用altschul等.(1990)j.mol.biol.215:403—10的blastn和blastx程序(2.0版)实施。blast核苷酸搜索能用nblast程序,得分=100,字长=12执行,以获得本发明核酸分子的核苷酸序列同源物。blast蛋白搜索能用blastx程序,得分=50,字长=3执行,以获得本发明蛋白分子的氨基酸序列同源物。为获得空位比对用于比较目的,空位blast能如altschul等,(1997)nucleicacidsres.25(17):3389-3402所述使用。当使用blast和空位blast程序时,能采用各程序(如blastx和blastn)的默认参数。参见美国国家生物技术信息中心网页http://www.ncbi.nlm.nih.gov/。
术语“核苷酸”包括但不限于天然存在的核苷酸,包括鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶(分别是g、c、a和t)。术语“核苷酸”还意在包括以下这些部分:其不仅包含已知嘌呤与嘧啶碱基,还含有经修饰的其他杂环碱基。这类修饰包括甲基化嘌呤或嘧啶,酰化嘌呤或嘧啶,烷基化核糖或其他杂环。另外,术语“核苷酸”包含以下这些部分:其包含半抗原或荧光标记且可能不仅包含常规核糖及脱氧核糖,还含有其他糖。修饰核苷或核苷酸还包括糖部分的修饰,例如其中一个或多个羟基用卤素原子或脂族基取代,或作为醚、胺功能化,等等。
术语“核酸”、“多核苷酸”和“核酸分子”在本文中可互换使用以描述任何长度的聚合物,如大于约2个碱基,大于约10个碱基,大于约100个碱基,大于约500个碱基,大于1000个碱基,多至约10,000或更多个由核苷酸如脱氧核苷酸或核糖核苷酸构成的碱基,且可酶促或合成产生(例如pna,如美国专利号5,948,902和其中所引用参考文献所述)。所述核酸可与天然产生的核酸以序列特异性方式杂交,该方式与2个天然产生的核酸类似,如能参与watson-crick碱基配对相互作用。另外,核酸和多核苷酸可分离(且任选随后分段)自细胞、组织和/或体液。核酸可以是例如基因组dna(gdna)、线粒体、细胞游离dna(cfdna)、来自文库的dna和/或来自文库的rna。
本文所用术语“核酸样品”或“包含核酸的样品”指含核酸的任何样品,其中样品涉及材料或材料混合物,通常(尽管不必定)采用液体形式,包含一种或多种感兴趣的靶核苷酸序列。本发明方法中用作起始材料的核酸样品能来自任何来源,例如全基因组、染色体集合、单染色体、来自一个或多个染色体或转录的基因的一个或多个区域,且可直接纯化自生物来源或实验室来源如核酸库。核酸样品能获自同一个体,其可以是人或其他物种(如植物、细菌、真菌、藻类、古生菌等),或来自同一物种的不同个体,或不同物种的不同个体。例如,核酸样品可来自细胞、组织、活组织检查、体液、基因组dna文库、cdna文库和/或rna文库。
术语“感兴趣的序列”、“感兴趣的靶核苷酸序列”和“靶序列”在本文中可互换使用,且包括但不限于优选存在于细胞内的任何基因序列,例如基因、部分基因或者基因内或邻近基因的非编码序列。感兴趣的靶序列可存在于染色体、附加体、细胞器基因组如线粒体或叶绿体基因组或能独立于遗传物质主体而存在的遗传物质,例如感染性病毒基因组、质粒、附加体,如转座子。感兴趣的序列可在基因的编码序列之内,转录的非编码序列之内,例如前导序列、尾随序列或内含子。所述感兴趣的核酸序列可存在于双链核酸或单链核酸。
感兴趣的序列可以是但不限于具有或疑似具有多态性如snp的序列。
本文所用术语“寡核苷酸”指核苷酸的单链多聚体,长度优选约2-200个核苷酸,或多至500个核苷酸。寡核苷酸可合成或酶促制备,在一些实施方案中,长度为约10-50个核苷酸。寡核苷酸能包含核糖核苷酸单体(即可以是寡核糖核苷酸)或脱氧核糖核苷酸单体。例如,寡核苷酸可以是约10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-100、100-150、150-200或约200-250个核苷酸长度。
“植物”:这包括植物细胞、植物原生质体、能从其再生植物的植物细胞组织培养物、植物愈伤组织、植物丛以及在植物或植物部分中完整的植物细胞,所述植物部分如胚、花粉、胚珠、种子、叶、花、枝、果实、果仁、穗、穗轴、外壳、梗、根、根尖、花药、谷粒等。植物的非限制性示例包括作物和栽培植物如大麦、卷心菜、油菜(canola)、木薯、花椰菜、菊苣、棉花、黄瓜、茄子、葡萄、辣椒、莴苣、玉米、甜瓜、油菜(oilseedrape)、土豆、南瓜、稻、黑麦、高粱、倭瓜、甘蔗、甜菜、向日葵、甜辣椒、番茄、西瓜、小麦和意大利青瓜。
“前间隔序列”是识别或可与引导rna内引导序列杂交的序列,更特定是crrna或在sgrna情况中,是引导rna的crrna部分,且位于靶序列中、处或附近。
“核酸内切酶”是在结合其靶或识别位点后,水解双链dna中至少一条链或一条rna分子链的酶,核酸内切酶在本文中应理解为位点特异性核酸内切酶且术语“核酸内切酶”和“核酸酶”在本文中可互换使用。限制性核酸内切酶在本文中应理解为同时水解双链体两条链的核酸内切酶,以在dna中引入双重链缺口。“切口”核酸内切酶是仅水解双链体中一条链的核酸内切酶,以生成“有切口的”而不是经切割的dna分子。
“核酸外切酶”在本文中定义为从多核苷酸末端(exo)切割一个或多个核苷酸的任何酶。
“降低复杂性”或“复杂性降低”在本文中应理解为复杂核酸样品减少,如衍生自基因组dna的样品,衍生自液体活检的cfdna,分离的rna样品等。复杂性减少可导致复杂起始材料内所包含的一种或多种特定靶序列或靶核酸片段(本文也命名为靶片段)富集和/或产生样品子集,其中该子集包含复杂起始材料内所包含的一种或多种特定靶序列或片段或者由其组成,而非靶序列或片段的量相较于起始材料即在复杂性减少前非靶序列或片段的量,下降至少20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。降低复杂性一般在进一步分析或方法步骤前实施,如扩增、条形编码、测序、确定表观遗传变异等。复杂性减少优选是可重复的复杂性减少,意味着当同一样品用相同方法降低复杂性时,获得相同或至少相当的子集,这与随机复杂性减少相反。降低复杂性方法的示例包括例如
“序列”或“核苷酸序列”:这指核酸的或核酸内的核苷酸的顺序。换言之,核酸中的任何核苷酸顺序可称为序列或核酸序列。例如,靶序列是dna双链体单链所包含的核苷酸的顺序。
本文所用术语“测序”指获得多核苷酸中至少10个连续核苷酸特性(如至少20、至少50、至少100或至少200或更多个连续核苷酸特性)的方法。术语“二代测序”指所谓的平行合成测序或连接平台测序,例如依诺米那(illumina)、美国生命技术公司(lifetechnologies)、pacbio和罗氏(roche)等目前所用。二代测序方法还可包括纳米孔测序法,如牛津纳米孔技术公司(oxfordnanoporetechnologies)商品化的那些,或基于电子检测的方法如美国生命技术公司商品化的离子激流技术。
“靶核酸片段”或“靶片段”可以是小或较长延伸片段或选定部分的核酸,单或双链,包含感兴趣的序列或由其组成,其优选是进一步分析或作用的目标,例如但不限于复制、扩增、测序和/或其他核酸检测过程。复杂性减少前,靶核酸片段优选包含在较大核酸分子内,如待分析样品中存在的较大的核酸分子内部。
感兴趣的序列可以是样品核酸内的任何序列,如基因、基因复合物、基因座、假基因、调节区、高重复区、多态性区域或其部分。感兴趣的序列也可以是含遗传或表观遗传变异的区域,所述变异指示表型或疾病。在一些方面,选择一组靶核酸片段进行富集,所述片段包含一种或多种感兴趣的序列,或由其组成。任选地,该组由结构或功能相关靶核酸片段组成。一个或多个靶片段能包含天然或非天然、人工、或非经典核苷酸,包括但不限于dna、rna、bna(桥连核酸)、lna(锁核酸)、pna(肽核酸)、吗啉代核酸、乙二醇核酸、苏糖核酸、表观遗传修饰的核苷酸如甲基化dna以及模拟物和其组合。优选地,这些感兴趣的序列是双链dna中单链dna链的小或较长连续核苷酸延伸片段(即多核苷酸),其中所述双链dna还包含与所述双链dna互补链中靶序列互补的序列。由感兴趣的序列和其互补链组成的双链dna在本文中也命名为靶核酸片段双链dna。优选地,所述双链dna是基因组dna(gdna)和/或细胞游离dna(cfdna)。
发明详述
发明人发现功能性grna-cas复合物对经切割的片段具有意外的保护效果。事实上,看来切割后,经切割的片段受到保护抵御核酸外切酶切割。不想受理论约束,此保护归因于在核酸外切酶处理期间仍结合切割片段末端的复合物。因此,本发明方法意外显示例如本文所公开的靶富集的无扩增方法不需要连接保护性接头。
第一方面,提供从包含核酸分子的样品中富集至少一个靶核酸片段的方法。优选地,靶核酸片段包含感兴趣的序列。优选地,所述核酸片段包含在如下文详述的富集步骤前样品中存在的核酸分子内。因此优选地,所述靶核酸片段是样品中核酸分子的片段。
优选地,本发明涉及从包含核酸分子的样品富集靶核酸片段的方法,其中靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:
a)提供包含所述核酸分子的样品,其中所述核酸分子包含感兴趣的序列;
b)用至少第一和第二grna-cas复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;
c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许核酸外切酶消化所述至少一个非靶核酸片段;和
d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。
优选地,步骤b)中的rna或dna指导的核酸内切酶复合物是grna-cas复合物、grna-argonaute复合物和gdna-argonaute复合物至少之一。优选地,步骤b)中的rna或dna指导的核酸内切酶复合物是grna-cas复合物。
优选地,步骤c)中,所述至少第一和第二grna-cas复合物结合靶核酸片段。
优选地,步骤c)中,所述至少第一和第二grna-cas复合物在步骤c)期间或至少部分步骤c)期间保持结合靶核酸片段。
优选地,步骤c)中,靶核酸片段不被核酸外切酶消化,即在步骤c)中,靶核酸片段受到保护抵御核酸外切酶消化。
优选地,步骤c)中,仅一个或多个非靶核酸片段被核酸外切酶消化。
在步骤b)中,用至少第一和第二grna-cas复合物切割所述核酸分子。任选地,步骤b)能在使所述核酸分子接触第一和第二grna-cas复合物的步骤以及允许所述复合物切割所述核酸分子的步骤中进一步说明。因此,在一个实施方案中,步骤b)能进一步如下说明:
b1)使所述核酸分子接触第一和第二grna-cas复合物,其中所述第一复合物的grna引导所述第一复合物到感兴趣的序列上游的序列,且其中所述第二复合物的grna引导所述第二复合物到感兴趣的序列下游的序列;和
b2)允许所述第一和第二grna-cas复合物切割核酸分子,其中至少一个经切割的核酸分子是靶核酸片段,且至少1个、优选2个经切割的核酸分子是非靶核酸片段。
发明人意外发现向步骤b的消化物加入核酸外切酶,而不采取更多措施以保护靶核酸片段,引起所述感兴趣片段富集。换言之,意外地,不需要通过例如连接惰性接头的进一步保护来保护靶核酸片段免于核酸外切酶降解。因此,本发明方法优选不包括以下进一步步骤:在核酸外切酶处理步骤前,保护靶核酸片段,或靶核酸片段末端。在一个优选实施方案中,本文所定义的方法在核酸外切酶处理前没有加入保护性接头。此背景下,保护性接头在本文中应理解为特别设计成针对核酸外切酶消化保护被接头捕获的靶核酸片段的接头。这种接头优选通过纳入化学部分或阻断基(如硫代磷酸)或缺乏末端核苷酸(发夹或茎环接头或可环化接头)针对核酸外切酶降解提供保护。
本发明的方法例如用于富集核酸样品,优选用于帮助下游加工或分析所述样品内的一个或多个靶核酸片段。富集引起本发明方法步骤a)中用作起始材料的核酸样品复杂性降低和/或本发明方法步骤a)中用作起始材料的核酸样品的一个或多个靶核酸片段子集产生。
因此,本发明第一方面还提供至少:
i)一种用于降低包含感兴趣的序列的核酸样品复杂性的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d);
ii)一种用于提供核酸样品子集的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d),其中所述子集包含一个或多个靶核酸片段;和
iii)一种用于分离或获得包含感兴趣的序列(来自包含所述感兴趣的序列的核酸分子)的片段即靶核酸片段的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d)。
降低核酸样品复杂性在核酸测序应用方面有特别的效用,尤其是在其中靶核酸片段是复杂样品(例如但不限于基因组)内的次要种类的样品中。富集或复杂性降低可显著降低所产生的测序数据的成本,因为复杂样品的大部分在测序前去除,而靶核酸片段被选择性保留,因而更高百分比的序列读取产生自感兴趣的序列。
在优选实施方案中,通过本文方法生成的富集的靶核酸片段用于单分子、实时测序反应,如来自太平洋生物科学公司(pacificbiosciences)、加利福尼亚州门洛帕克的
所述至少第一和第二grna-cas复合物在本文中应理解为crispr相关(cas)蛋白或crispr核酸酶,各自与引导rna复合。crispr核酸酶包含核酸酶结构域和至少一个与引导rna相互作用的结构域。当与引导rna复合时,引导rna将crispr核酸酶指引到特定核酸序列。引导rna与crispr核酸酶以及特定靶核酸序列相互作用,从而一旦经引导序列指引到包含特定核酸序列的位点,crispr核酸酶能够在靶位点引入断裂。优选地,在核酸酶的1个或2个结构域都具有催化活性的情况中,crispr核酸酶分别能够在靶位点引入单或双链断裂。技术人员清楚了解如何设计引导rna,采用的方式是当联合crispr核酸酶时,实现在核酸分子预定的位点处引入单或双链断裂。
基于核心元件含量和序列,crispr核酸酶一般可以分成6个主要类型(i-vi型),其进一步细分成亚型(makarova等,2011,natrevmicrobiol9:467-77和wright等,2016,cell164(1-2):29-44)。一般而言,crispr-cas系统复合物的2个关键元件是crispr核酸酶和crrna。crrna由短重复序列组成,所述序列散布有衍生自入侵dna的间隔序列。cas蛋白具有多种活性如核酸酶活性。因此,grna-cas复合物提供靶向特定序列以及根据序列的某些酶活性的机制。
i型crispr-cas系统通常包含有分开的解旋酶和dnase活性的cas3蛋白。例如,在1-e型系统中,crrna纳入称为cascade(用于抗病毒防御的crispr相关复合物)的多亚基效应复合物内(brouns等,2008,science321:960-4),其特异性结合双螺旋dna并通过cas3蛋白激发降解(sinkunas等,2011,emsoj30:1335-1342;beloglazova等,2011,emboj30:616-627)。
ii型crispr-cas系统包含特征性cas9蛋白,这是一种单一蛋白(约160kda),能够产生crrna且特异性切割双螺旋dna。cas9蛋白通常包含2个核酸酶结构域,即氨基末端附近的ruvc样核酸酶结构域和蛋白中间附近的hnh(或mcra样)核酸酶结构域。cas9蛋白的各核酸酶结构域专门用于切割双螺旋的一条链(jinek等,2012,science337(6096):816-821)。cas9蛋白是ii型crispr/-cas系统的cas蛋白示例并形成核酸内切酶,当联合crrna和称为反式激活crrna(tracrrna)的第二rna时,其靶向入侵病原体dna,通过在crrna所定义的病原体基因组中的位置处引入dna双链断裂(dsb)进行降解。jinek等.(2012,science337:816-820)证明通过融合crrna和tracrrna必要部分而生成的单链嵌合引导rna(本文的“sgrna”)能够联合cas9蛋白形成功能性核酸内切酶。
iii型crispr-cas系统包含聚合酶和ramp组件。iii型系统能进一步分成亚型iii-a和iii-b。iii-a型crispr-cas系统显示靶向质粒,iii-a型系统的聚合酶样蛋白参与特异性切割dna(marraffini和sontheimer,2008,science322:1843-1845)。iii-b型crispr-cas系统还显示靶向rna(hale等,2009,cell139:945-956)。
iv型crispr-cas系统包含csf1,一种未表征的蛋白质,被提议形成部分cascade样复合物,不过这些系统通常作为分离cas基因发现,而没有相关crispr阵列。
最近描述了v型crispr-cas系统,来自普氏菌(prevotella)和弗朗西斯氏菌(francisella)的成簇的规律间隔短回文重复序列1,或crispr/cpf1。cpf1基因与crispr基因座相关且编码使用crrna来靶向dna的核酸内切酶。cpf1是比cas9更小且更简单的核酸内切酶,其可克服crispr-cas9系统的一些限制。cpf1是单rna指导的核酸内切酶,没有tracrrna,且其使用富含t的前间隔序列毗邻基序。cpf1经交错dna双链断裂来切割dna(zetsche等(2015)cell163(3):759–771)。v型crispr-cas系统优选包含cpf1、c2c1和c2c3的至少一种。
vi型crispr-cas系统可包含cas13a蛋白,其包含rnasea活性。在靶核酸片段是rna的情况中,本发明方法的至少第一和第二grna-cas复合物可包含cas13a,例如但不限于来自韦德纤毛菌(leptotreichiawadee,lwcas13a)或沙氏纤毛菌(leptotrichiashahii,lshcas13a)的cas13a,如描述于gootenberg等,science.2017年4月28日;356(6336):438-442。
本发明的方法的第一和第二grna-cas复合物可包含上文所定义的任何crispr核酸酶。优选地,本发明的方法的第一和第二grna-cas复合物至少之一包含ii型crispr核酸酶如cas9(例如seqidno:1的蛋白,其由seqidno:2编码,或seqidno:19的蛋白)或v型crispr核酸酶如cpf1(例如seqidno:3的蛋白,其由seqidno:4编码)或mad7(例如seqidno:20或21的蛋白)或其衍生蛋白,与所述蛋白在其全长上具有优选至少约70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性。
优选地,本发明方法的第一和第二grna-cas复合物至少之一包含ii型crispr核酸酶,优选cas9核酸酶。
技术人员了解如何制备crispr-cas系统的不同组分,包括crispr核酸酶。在现有技术中,在其设计和应用方面有许多报道。参见例如haeussler等(jgenetgenomics.(2016)43(5):239-50.doi:10.1016/j.jgg.2016.04.008.)关于设计引导rna和其与cas蛋白(初始获自酿脓链球菌(s.pyogenes))组合应用的近期的综述,或lee等的综述(plantbiotechnologyjournal(2016)14(2)448–462)。
一般地,crispr核酸酶如cas9包含2个催化活性核酸酶结构域。例如,cas9蛋白能包含ruvc样核酸酶结构域和hnh样核酸酶结构域。ruvc和hnh结构域一起合作,都切割单链以在dna中产生双链断裂(jinek等,science,337:816-821)。失活crispr核酸酶包含修饰,从而没有核酸酶结构域显示切割活性。用于本发明方法的第一和第二grna-cas复合物至少之一的crispr核酸酶可以是crispr核酸酶变体,其中一个核酸酶结构域突变,从而其不再具有功能(即缺少核酸酶活性),由此产生切口酶。一个示例是具有d10a或h840a突变的spcas9变体。优选地,第一和第二grna-cas复合物的核酸酶至少之一不是失活核酸酶。优选地,第一grna-cas复合物的crispr核酸酶是切口酶或(内切)核酸酶。优选地,第二grna-cas复合物的crispr核酸酶是切口酶或(内切)核酸酶。
本发明的方法的至少第一和第二grna-cas复合物可包含完整cas9蛋白或变体或由其组成,或可包含其片段。优选地,这类片段确实结合crrna和tracrrna或sgrna,但可缺乏核酸酶活性所需的一个或多个残基。
优选地,第一和第二grna-cas复合物至少之一包含cas9蛋白。任选地,本发明方法的第一和第二grna-cas复合物都包含cas9蛋白。cas9蛋白可衍生自酿脓链球菌(streptococcuspyogenes)(spcas9;ncbi参考序列nc_017053.1;uniprotkb-q99zw2),嗜热脱氮芽孢杆菌(geobacillusthermodenitrificans)(uniprotkb-a0a178tej9),溃疡性棒状杆菌(corynebacteriumulcerous)(ncbirefs:nc_015683.1,nc_017317.1);白喉棒状杆菌(corynebacteriumdiphtheria)(ncbirefs:nc_016782.1,nc_016786.1);螺原体(spiroplasmasyrphidicola)(ncbiref:nc_021284.1);中间普雷沃菌(prevotellaintermedia)(ncbiref:nc_017861.1);台湾螺原体(spiroplasmataiwanense)(ncbiref:nc_021846.1);海豚链球菌(streptococcusiniae)(ncbiref:nc_021314.1);罗的海贝尔氏菌(belliellabaltica)(ncbiref:nc_018010.1);扭曲冷弯曲菌(psychroflexustorquisl)(ncbiref:nc_018721.1);嗜热链球菌(streptococcusthermophilus)(ncbiref:yp_820832.1);listeriainnocua(ncbiref:np_472073.1);空肠弯曲菌(campylobacterjejuni)(ncbiref:yp_002344900.1);或脑膜炎奈瑟氏菌(neisseriameningitidis)(ncbiref:yp_002342100.1)。涵盖了来自这些的cas9变体,具有与spcas9同源的失活的hnh或ruvc结构域,如spcas9_d10a或spcas9_h840a,或者在spcas9蛋白中对应d10或h840的位置处有等价取代的cas9,产生切口酶。
根据一个优选实施方案,可编程核酸酶能衍生自cpf1,如来自氨基酸球菌属(acidaminococcussp)的cpf1;uniprotkb-u2umq6。该变体可以是有失活的ruvc或nuc结构域的cpf1-切口酶,其中ruvc或nuc结构域不再具有核酸酶活性。技术人员清楚了解本领域可获得的技术,如定点诱变、pcr介导的突变和全基因合成,其允许失活核酸酶如失活ruvc或nuc结构域。带有失活的nuc结构域的cpf1切口酶示例是cpf1r1226a(参见gao等.cellresearch(2016)26:901–913,yamano等.cell(2016)165(4):949–962)。此变体中,nuc结构域内有精氨酸到丙氨酸(r1226a)转换,这使得nuc结构域失活。
所述至少第一和第二grna-cas复合物还包含指导复合物到核酸样品中限定的位点的crispr核酸酶相关的引导rna,也称为前间隔序列。引导rna包含使grna-cas复合物靶向前间隔序列的引导序列,所述前间隔序列优选在核酸分子中感兴趣的序列附近、在核酸分子中感兴趣的序列处或在核酸分子中感兴趣的序列内部,且可以是sgrna或crrna与tracrrna的组合(如用于cas9)或仅crrna(如在cpf1情况中)。任选地,在同一实验中可以使用多于一种类型的引导rna,例如针对2种或更多不同的感兴趣的序列,或甚至针对相同感兴趣的序列。
本文中应理解在用至少第一和第二grna-cas复合物切割前,感兴趣的序列存在于核酸样品。切割核酸样品可产生至少2个或更多核酸片段,其中至少一个核酸片段是靶核酸片段且至少一个核酸片段是非靶核酸片段。靶核酸片段包含感兴趣的序列或由其组成。因此,在切割核酸样品前,技术人员很清楚核酸样品涵盖靶核酸片段且在切割后靶核酸片段从核酸样品释放。发明人发现grna-cas复合物切割的核酸片段受到保护免于消化,优选核酸外切酶消化。
本发明的方法需要第一grna-cas复合物的grna指导所述第一复合物到核酸样品中的序列,从而第一grna-cas复合物在感兴趣的序列上游切割核酸样品,且第二复合物的grna指导第二grna-cas复合物到核酸样品中的序列,从而第二grna-cas复合物在感兴趣的序列下游切割核酸样品。
优选地,grna-cas复合物包含切割前间隔序列内核酸的crispr核酸酶。优选的crispr核酸酶是cas9。
由第一grna-cas复合物结合的前间隔序列可以是靶核酸片段和/或非靶核酸片段中的序列。同样,由第二grna-cas复合物结合的前间隔序列可以是靶核酸片段和/或非靶核酸片段中的序列。优选地,前间隔序列是与靶核酸片段和非靶核酸片段重叠的序列,即grna-cas复合物的切割位点在前间隔序列内。
优选地,前间隔序列的位置取决于本发明方法所用的crispr核酸酶。作为非限制性示例,crispr核酸酶spcas9切割前间隔序列内的核酸。因此,当cas9用于本发明方法时,优选前间隔序列部分位于靶核酸片段且部分位于非靶片段,即前间隔序列在靶核酸片段与非靶核酸片段之间重叠。由此,优选地,第一和第二grna-cas复合物至少之一的grna引导序列能够与选自下组的前间隔序列杂交:
a)靶核酸片段中包含的前间隔序列杂交;
b)非靶核酸片段中包含的前间隔序列杂交;和
c)在靶核酸片段与非靶核酸片段之间重叠的前间隔序列。
a)在一个实施方案中,所述第一grna-cas复合物和第二grna-cas复合物至少之一的grna引导序列能够与一段序列杂交,所述序列是靶核酸片段的序列或是其部分,或与相反链中的其互补序列杂交,例如在核酸片段是双链的情况中。换言之,在此实施方案中,所述由第一和第二grna-cas复合物至少之一靶向的前间隔序列是靶核酸片段的序列或位于其中。优选地,由至少第一grna-cas复合物靶向的前间隔序列是靶核酸片段序列的5’-末端或位置与其毗邻,或其互补序列,且优选由至少第二grna-cas复合物靶向的前间隔序列是靶核酸片段序列的3’-末端或位置毗邻其,或其互补序列。毗邻可以是直接毗邻,或优选距离不大于约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、500或1000个连续核苷酸。核苷酸数目可以取决于本发明方法所用crispr核酸酶。
b)在一个实施方案中,所述第一grna-cas复合物和第二grna-cas复合物至少之一的grna引导序列能够与一段序列杂交,所述序列会形成或形成部分非靶核酸片段,或与相反链中的其互补序列杂交,在核酸样品是双链核酸的情况中。换言之,在此实施方案中,所述由第一和第二grna-cas复合物至少之一靶向的前间隔序列位置几乎毗邻或直接毗邻在切割后会形成靶核酸片段的序列。优选地,当片段存在于核酸样品或其互补序列时,由第一grna-cas复合物靶向的前间隔序列几乎在靶核酸片段5’-末端侧翼,优选直接在5’-末端侧翼。优选地,当片段存在于核酸样品或其互补序列时,由第二grna-cas复合物靶向的前间隔序列在靶核酸片段3’-末端侧翼,或直接在3’-末端侧翼。优选地,前间隔序列与核酸样品中靶核酸片段序列各5’末端或3’末端之间的距离不超过约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个连续核苷酸。核苷酸数目可能取决于本发明方法所用crispr核酸酶。
c)在一个优选实施方案中,所述第一grna-cas复合物和第二grna-cas复合物至少之一的引导序列能够与一段序列杂交,所述序列在非靶核酸片段和靶核酸片段之间重叠。优选地,所述至少第一或第二grna-cas复合物的引导序列能够与一段序列杂交,所述序列在非靶核酸片段3’末端和靶核酸片段5’末端之间重叠。优选地,所述至少第一或第二grna-cas复合物的引导序列能够与一段序列杂交,所述序列在非靶核酸片段5’末端和靶核酸片段3’末端之间重叠。换言之,在此实施方案中,优选的是,由至少所述第一或第二grna-cas复合物靶向的前间隔序列在非靶核酸片段3’末端和靶核酸片段5’末端之间重叠(当所述片段存在于核酸样品时,即在核酸样品切割前)。
作为非限制性示例,spcas9可在20nt前间隔序列内位置3与4之间切割。因此,在其3’-末端的靶核酸片段可包含前间隔序列的3nt且在其5’-末端的非靶核酸片段可包含前间隔序列的17nt。同样,如果前间隔序列在互补链上,在其3’-末端的靶核酸片段可包含前间隔序列的17nt且在其5’-末端的非靶核酸片段可包含前间隔序列的3nt。由此,在前间隔序列是20个连续核苷酸的示例中,前间隔序列的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15,16、17、18或19个核苷酸可存在于非靶核酸片段3’-末端,并且分别地,前间隔序列的19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸可存在于靶序列5’-末端,这取决于本发明方法所用crispr核酸酶类型。
优选地,由至少第一或第二grna-cas复合物靶向的前间隔序列在非靶核酸片段5’-末端与靶核酸片段3’-末端之间重叠(当所述片段存在于核酸样品时,即在核酸样品切割前)。作为前间隔序列是20个核苷酸的非限制性示例,前间隔序列的1、2、3、4、5、6、7、8、9、10、11、12,13,14、15,16、17、18或19个核苷酸可存在于非靶核酸片段5’-末端,前间隔序列的各19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸可存在于靶序列3-末端,这取决于本发明方法所用crispr核酸酶类型。
在一个优选实施方案中,所述第一和第二grna-cas复合物至少之一结合靶核酸片段内的序列。优选地,所述第一和第二grna-cas复合物都结合靶核酸片段内的序列。
或者或另外,所述第一和第二grna-cas复合物至少之一结合非靶核酸片段内的序列。优选地,所述第一和第二grna-cas复合物都结合非靶核酸片段内的序列。
或者或另外,所述第一和第二grna-cas复合物至少之一结合在靶核酸片段与非靶核酸片段之间重叠的序列。优选地,所述第一和第二grna-cas复合物都结合在靶核酸片段与非靶核酸片段之间重叠的序列。
在一个优选实施方案中,所述第一和第二grna-cas复合物至少之一在切割后仍分别结合靶核酸片段的5’-末端或3’-末端。优选地,在切割后,至少一种grna-cas复合物保持结合靶核酸片段的5’-末端且一种grna-cas复合物保持结合靶核酸片段的3’-末端。不同的是,grna-cas复合物优选在靶核酸片段两边的侧翼。
因为除了前间隔序列,grna-cas复合物还需要前间隔序列邻近基序(pam)序列用于识别,grna应设计成使得所靶向的前间隔序列毗邻这类pam序列,这取决于所用的grna-cas复合物。pam序列对crispr/cas核酸内切酶活性是必需的,相对较短,因而通常在一定长度的任意给定序列中多次存在。例如,酿脓链球菌cas9蛋白的pam基序是ngg,其确保就任何给定基因组序列而言,存在多种pam基序且能设计许多不同引导rna。另外,引导rna还能设计成靶向同一双链序列的相反链。直接毗邻pam的序列被纳入引导rna。根据所用crispr-cas复合物,其可能长度不同。例如,用于在cas9sgrna中靶向序列的最优长度是20nt。根据所用crispr/cas核酸内切酶,复合物随后在离pam的不同距离处诱导2条dna链的切口。例如,酿脓链球菌cas9蛋白在pam序列上游3bp处诱导2条dna链的切口,以产生钝性dnadsb。根据例如所用crispr-cas复合物,用于切割核酸样品的pam位点可存在于所产生核酸片段或所产生非靶核酸片段。
优选地,核酸样品中的感兴趣的序列侧翼是pam序列或包含优选在感兴趣的序列末端附近的pam序列,所述pam序列已知用于和本文所定义复合物的crispr-系统核酸酶相互作用(例如参见ran等2015,nature520:186-191)。另外或替代地,pam序列优选在由第一和第二grna-cas复合物至少之一靶向的前间隔序列侧翼。
例如,若所述crispr核酸酶是酿脓链球菌cas9,pam序列可具有序列5’-ngg-3’。例如,对于嗜热脱氮芽孢杆菌t12cas9(例如参见wo2016/198361),pam序列可具有序列5’-nnnncnna-3’。用于cas9核酸内切酶的更多已知pam序列是:iia型5'-nggnnnn-3'(酿脓链球菌)、5'-nngtnnn-3'(巴氏链球菌(streptococcuspasteurianus))、5'-nnggaan-3'(嗜热链球菌(streptococcusthermophilus))、5'-nngggnn-3'(金黄色葡萄球菌(staphylococcusaureus))以及iic型5'-nggnnnn-3'(白喉棒状杆菌(corynebacteriumdifteriae))、5'-nngggtn-3'(红嘴鸥弯曲杆菌(campylobacterlari))、5'-nnncatn-3'(细小棒菌(parvobaculumlavamentivorans))和5'-nnnngta-3'(灰色奈瑟球菌(neiseriacinerea))。本领域技术人员因而能够设计grna以使来自样品核酸的靶序列片段化。
适合作为crrna和tracrrna用作grna-cas复合物中grna的分子为本领域熟知(参见例如wo2013142578和jinek等,science(2012)337,816-821)。
在一个实施方案中,所述crrna至少之一包含能与感兴趣的序列,优选本文所定义感兴趣的序列,杂交或在其附近杂交的序列。因此优选地,所述crrna至少之一包含与感兴趣的序列中序列完全互补的序列,即感兴趣的序列包含前间隔序列。
在一个实施方案中,所述至少一种crrna包含能与感兴趣的序列,优选本文所定义感兴趣的序列,的互补序列杂交或在其附近杂交的序列。因此优选地,所述crrna至少之一包含与感兴趣的序列或部分感兴趣的序列有完全序列相同性的核苷酸序列。
优选地,一种或多种crrna还能够与tracrrna复合。用于本发明方法的crrna至少之一能包含未修饰或天然存在的核苷酸或者由其组成。或者或另外,至少一种crrna能包含修饰或非天然存在的核苷酸或者由其组成,优选这类化学修饰的核苷酸用于保护crrna免于降解。在一个实施方案中,所述用于本发明方法的至少2种或所有crrna能包含修饰或非天然产生核苷酸或者由其组成。
在本发明的一个实施方案中,所述至少一种crrna可以包含核糖核苷酸和非核糖核苷酸。所述至少一种crrna能包含一个或多个核糖核苷酸以及一个或多个脱氧核糖核苷酸。
所述至少一种crrna可包含一个或多个非天然存在的核苷酸或核苷酸类似物,如有硫代磷酸连接的核苷酸、在核糖环2'与4'碳之间包含亚甲桥的锁核酸(lna)核苷酸、桥接核酸(bna)、2’-o-甲基类似物、2'-脱氧类似物、2'-氟类似物或其组合。修饰的核苷酸可包含选自但不限于下组的修饰的碱基:2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷和7-甲基鸟苷。
所述至少一种crrna可如下化学修饰:在一个或多个末端核苷酸处并入2'-o-甲基(m)、2'-o-甲基3'硫代磷酸酯(ms)、2'-o-甲基3'thiopace(膦酰乙酸酯)(msp)或其组合。这种化学修饰crrna能包含相较未修饰crrna增加的稳定性和/或活性(hendel等,2015,natbiotechnol.33(9);985-989)。在某些实施方案中,所述至少一种crrna在与前间隔序列杂交的区域中包含核糖核苷酸。在本发明的一个实施方案中,所述脱氧核糖核苷酸和/或核苷酸类似物能并入经工程化的crrna结构,例如但不限于在与前间隔序列杂交的序列中,在与tracrrna相互作用的序列中或这些序列之间。
或者或另外,化学修饰核苷酸能位于与前间隔序列杂交的序列5’和/或3’。化学修饰的序列能进一步位于与tracrrna相互作用的序列的5’和/或3’。
在一个优选实施方案中,所述至少一种crrna的长度可以是至少约15、20、25、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、65、70、75、80、85、90、95、100或更多个核苷酸长度。在一些优选实施方案中,所述至少一种crrna的长度小于约75、50、45、40、35、30、25或约20个核苷酸。优选地,用于本发明方法的crrna长度是约20-100、25-80、30-60或约35-50个核苷酸长度。
与前间隔序列杂交的crrna序列部分设计成与前间隔序列有足够互补性,以与前间隔序列杂交并指导所复合的核酸酶的序列特异性结合。前间隔序列优选毗邻前间隔序列邻近基序(pam)序列,该pam序列可与本文所定义的rna指导的crispr系统核酸内切酶复合物中crispr核酸酶相互作用。例如,在crispr核酸酶是酿脓链球菌cas9的情况中,pam序列优选是5’-ngg-3’,其中n可以是t、g、a或c中的任何一种。技术人员能够改造crrna以靶向任何所需序列,优选通过改造序列成与任何所需前间隔序列至少部分互补,从而与其杂交。优选地,部分crrna序列与其对应的前间隔序列之间的互补性用适当比对算法最优比对时,是至少约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与前间隔序列互补的部分crrna序列可以是至少约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸长度。在一些优选实施方案中,与dna靶序列互补的序列小于约75、50、45、40、35、30、25、20个核苷酸长度。优选地,与dna序列互补的序列长度是至少17个核苷酸。优选地,互补crrna序列是约10-30个核苷酸长度,约17–25个核苷酸长度或约15-21个核苷酸长度。与前间隔序列互补的部分crrna优选是15、16、17、18、19、20、21、22、23、24或25个核苷酸长度,优选20或21个核苷酸,优选20个核苷酸。
与tracrrna相互作用的crrna的部分设计成与tracrrna有足够互补性,以与tracrrna杂交并指导所复合的核酸酶到前间隔序列。优选地,此部分crrna序列与其tracrrna对应部分之间的互补性用适当比对算法最优比对时,是至少约50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与tracrrna相互作用的部分crrna优选是至少约5、10、15、20、22、25、30、35、40、45或更多个核苷酸长度。在一些优选实施方案中,与tracrrna相互作用的部分crrna小于约60、55、50、45、40、35、30或35个核苷酸长度。优选地,与tracrrna相互作用的部分crrna是约5–40、10-35、15-30、20-28个核苷酸长度。与tracrrna相互作用的部分crrna长度优选是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。
在一个实施方案中,本发明方法所用的至少第一和第二grna-cas复合物分别包含第一和第二crrna。然而,第一和第二grna-cas复合物可包含相同的tracrrna。
tracrrna优选包含一个或多个结构基序,其能与本文所定义的复合物的crispr系统核酸酶相互作用。优选地,tracrrna还能与本文所定义的crrna相互作用。tracrrna和crrna可通过crrna与tracrrna之间碱基配对来杂交。tracrrna优选能够与crispr系统核酸酶和crrna形成复合物。crrna能够复合tracrrna并能与靶序列杂交,从而指导核酸酶到靶序列。
tracrrna可包含一个或多个茎环结构,如1、2、3或更多个茎环结构。
tracrrna能包含未修饰或天然存在的核苷酸,或由其组成。或者或另外,tracrrna能包含修饰或非天然存在的核苷酸,或由其组成,优选这类化学修饰核苷酸用于保护tracrrna免于降解。
在本发明的一个实施方案中,所述tracrrna包含核糖核苷酸和非核糖核苷酸。tracrrna能包含一个或多个核糖核苷酸以及一个或多个脱氧核糖核苷酸。
tracrrna可包含一个或多个非天然存在的核苷酸或核苷酸类似物,如有硫代磷酸连接的核苷酸、在核糖环2'与4'碳之间包含亚甲桥的锁核酸(lna)核苷酸、桥接核酸(bna)、2’-o-甲基类似物、2'-脱氧类似物、2'-氟类似物或其组合。修饰核苷酸可包含选自但不限于下组的修饰碱基:2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷和7-甲基鸟苷。
tracrrna可如下化学修饰:在一个或多个末端核苷酸处纳入2'-o-甲基(m)、2'-o-甲基3'硫代磷酸酯(ms)、2'-o-甲基3'thiopace(膦酰乙酸酯)(msp)或其组合。这种化学修饰tracrrna能包含相较未修饰tracrrna增加的稳定性和/或活性(hendel等,2015,natbiotechnol.33(9);985-989)。在某些实施方案中,所述tracrrna在与crrna相互作用的区域中包含核糖核苷酸。
在本发明的一个实施方案中,所述脱氧核糖核苷酸和/或核苷酸类似物能纳入改造的tracrrna结构,例如但不限于在与crrna相互作用的序列中,在与crispr系统核酸酶相互作用的序列中或这些序列之间。
或者或另外,化学修饰核苷酸能位于与crrna相互作用的序列的5’和/或3’。化学修饰核苷酸能进一步位于与crispr系统核酸酶相互作用的序列的5’和/或3’。
在一个优选实施方案中,所述tracrrna长度可以是约25、30、35、40、45、50、55、60、65、70、72、75、80、85、90、95、100、110、120、130、140、150或更多个核苷酸长度。在一些优选实施方案中,所述tracrrna小于约200、180、160、140、120、100、95、90、85、80或75个核苷酸长度。tracrrna长度优选是约30–120、40-100、50-90或约60-80个核苷酸长度。
与crispr系统核酸酶相互作用的tracrrna序列部分设计成足以指导复合核酸酶到靶序列。与crispr系统核酸酶相互作用的tracrrna序列的部分可以是约20、25、30、35、40、45、50、55、60、65、70、72、75、80、85、90、95、100或更多个核苷酸长度。在一些优选实施方案中,所述与crispr系统核酸酶相互作用的序列小于约120、100、80、72、70、60、55、50、45、40、30或20个核苷酸长度。优选地,与crispr系统核酸酶相互作用的tracrrna序列部分是约20-90、30-85、35-80、40–75或50-72个核苷酸长度。优选地,与crispr系统核酸酶相互作用的tracrrna部分是约40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74或76个核苷酸长度。
与crrna相互作用的tracrrna序列部分设计成与crrna有足够互补性,以与crrna杂交并指导所复合的核酸酶到靶序列。优选地,此部分tracrrna序列与其crrna对应部分之间的互补性用适当比对算法最优比对时,是至少约50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与crrna相互作用的tracrrna的部分优选是至少约5、10、15、20、22、25、30、35、40、45或更多个核苷酸长度。在一些优选实施方案中,所述与crrna相互作用的tracrrna的部分小于约60、55、50、45、40、35、30或35个核苷酸长度。在一个优选实施方案中,所述与crrna相互作用的tracrrna部分是约5–40、10-35、15-30、20-28个核苷酸长度。优选地,与crrna相互作用的部分长度是约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。
优选地,crrna和tracrrna连接在一起形成sgrna。crrna和tracrrna能连接,优选共价连接,使用本领域已知的任何常规方法。例如,crrna和tracrrna的常规连接描述于jinek等.(同上)和wo13/176772,其通过引用纳入本文。crrna和tracrrna能共价连接,使用例如接头核苷酸或通过crrna3'末端与tracrrna5'末端直接共价连接。优选地,所述至少第一和第二grna-cas复合物的grna设计成在核酸样品用至少第一和第二grna-cas复合物温育后,来自核酸样品的核酸内所含靶核酸片段从所述核酸中切下。另外,优选第一grna设计成第一grna-cas复合物在核酸样品切割后结合靶核酸片段。另外,优选第二grna设计成第二grna-cas复合物在核酸样品切割后结合靶核酸片段。优选地,靶核酸片段存在于核酸样品时,侧翼是至少一个非靶核酸片段。优选地,靶核酸片段存在于核酸样品时,2边侧翼都是非靶核酸片段,即一个非靶核酸片段直接存在于靶核酸片段5’且一个非靶核酸片段直接存在于靶核酸片段3’。
优选地,本发明方法的第一和第二grna-cas复合物至少之一包含sgrna用于使crispr核酸酶优选cas9,靶向靶核酸片段中的序列。任选地,本发明方法的第一和第二grna-cas复合物都包含sgrna以用于使各第一和第二grna-cas复合物靶向靶核酸片段中的序列。本发明方法的第一和第二grna-cas复合物至少之一优选包含sgrna以用于使crispr核酸酶优选cas9,靶向毗邻优选直接毗邻靶核酸片段的序列,此时该片段包含于核酸样品内。任选地,本发明方法的第一和第二grna-cas复合物都包含sgrna用于使各第一或第二grna-cas复合物,靶向毗邻优选直接毗邻靶核酸片段的序列,其中靶核酸包含于核酸样品内。
优选地,本发明方法的第一和第二grna-cas复合物至少之一包含sgrna以用于使crispr核酸酶优选cas9,靶向靶核酸片段与非靶核酸片段之间重叠的序列,此时该片段包含于核酸样品内。任选地,本发明方法的第一和第二grna-cas复合物都包含sgrna以用于使各第一或第二grna-cas复合物,靶向靶核酸片段与非靶核酸片段之间重叠的序列,其中靶核酸包含于核酸样品内。任选地,本发明方法的第一和第二grna-cas复合物都包含sgrna以用于使各第一或第二grna-cas复合物,分别靶向靶核酸片段5’-末端与非靶核酸片段3’-末端之间重叠的序列以及靶核酸片段3’-末端与非靶核酸片段5’-末端之间重叠的序列,此时靶核酸包含于核酸样品内。
或者,本发明方法的第一和第二grna-cas复合物至少之一包含二元引导rna以使crispr核酸酶优选cas9,靶向核酸样品中的序列,即靶核酸片段中存在的或非靶核酸片段中存在的前间隔序列。二元引导rna(dgrna)在本文中应理解为包含crrna和tracrrna作为单独但优选杂交的分子,或由其组成。任选地,本发明方法的第一和第二grna-cas复合物都包含dgrna用于使各第一或第二grna-cas复合物靶向前间隔序列。
优选地,第一和第二grna-cas复合物至少之一能够诱导双链断裂(dsb)。优选地,第一和第二grna-cas复合物都能够诱导核酸样品中的双链断裂(dsb)。
或者,第一和第二grna-cas复合物至少之一是切口酶,本文表示为第一或第二grna-cas-切口酶复合物,其能够在双螺旋dna的仅一条链上产生缺口。在本发明的这个实施方案中,步骤b)中,加入额外即第三grna-cas复合物,其能够在双螺旋dna的互补链上产生缺口,大致在第一或第二grna-cas-切口酶复合物产生缺口的互补位置。大致在互补位置产生缺口优选引起核酸样品中的双链(即钝的或交错的)断裂。
作为非限制性示例,例如第三grna-cas-切口酶的前间隔序列优选是互补链中的序列,该序列与第一grna-cas-切口酶复合物靶向的前间隔序列互补,或在互补链上游或下游方向移动约1、2、3、4、5、6、7、8、9、10、15、20、25或30个核苷酸内的序列。例如,在第一grna-cas复合物是grna-cas-切口酶复合物的情况中,第三grna-cas-切口酶复合物能在步骤b中加入,导致通过所述第一和第三grna-cas-切口酶复合物在感兴趣的序列一侧诱导的双链断裂,其可以是钝端,此时实际相反位置被所述第一和第三复合物形成切口,或可以是交错的,此时被所述第一和第三复合物形成缺口的位置不完全是相反的。同样,除了所述第一和第三grna-cas-切口酶复合物外,使用第二和更多如第四grna-cas-切口酶复合物可产生本发明方法步骤b)所得靶核酸片段的2个钝或交错末端。在一些情况中,例如在后续定向接头连接的情况中,可能需要在本发明方法步骤b所生成靶核酸片段的1个或2个末端处产生交错末端。
本发明的方法的步骤b)可如下进行:将所述至少第一和第二grna-cas复合物与核酸样品一起温育,所用条件和时间适合grna-cas复合物诱导至少一个单链断裂,任选地双链断裂,例如但不限于本文所提供实施例中详述的条件。任选地,所述温育在约10-90℃,优选约37℃进行约1分钟-约18小时,优选约60分钟。
发明人发现由grna-cas切割的靶核酸片段受到保护免于核酸外切酶处理。因此,从核酸切割靶核酸片段后,立即加入核酸外切酶以消化一种或多种非靶核酸。靶核酸片段受到保护免于降解,而未保护片段被降解,引起靶片段富集或复杂性减少。因而,本发明的方法采用去除不需要的(非靶)核酸样品部分的方法,而不是移出感兴趣部分,从而回避了复杂的亲和性选择方案。
核酸外切酶可以是核酸外切酶i、iii、v、vii、viii或相关酶,或其任何组合。核酸外切酶iii识别切口并延伸切口到空位,直至形成一段ssdna。核酸外切酶vii能降解此ssdna。核酸外切酶i也降解ssdna。exoiii和exovii是核酸外切酶的优选组合,用于本发明方法步骤c)。
核酸外切酶v能够以3’到5’和5’到3’方向降解ssdna及dsdna。因此,在一个优选实施方案中,本发明方法步骤c)的核酸外切酶是能够以3’到5’和5’到3’方向降解ssdna及dsdna的核酸外切酶,优选核酸外切酶v。
关于降解非靶序列的更多信息提供于美国专利公开号2014/0134610,其通过引用全文纳入本文以用于所有目的。
另外,核酸内切酶即限制性酶可用于降解未保护片段,与本发明方法步骤c)的核酸外切酶消化一起、之前、之后或其任何组合。本文应理解用于本发明方法的限制性酶优选根据一个或多个感兴趣靶序列选择,所述序列用本发明方法富集,因为一种或多种限制性酶优选不应具有一个或多个感兴趣靶序列内存在的识别位点,但优选应具有剩余核酸样品即一个或多个非靶核酸片段中一个或多个位置处存在的识别位点。在本发明方法步骤c)的核酸外切酶处理之前或甚至步骤b)的切割反应之前,限制性酶消化的益处是这种消化产生片段,如果该片段不受grna-cas复合物保护,则更易由步骤c)的核酸外切酶消化。
实施步骤c)和任选存在的核酸内切酶步骤,所用条件和时间足以使核酸外切酶(和任选存在的核酸内切酶)降解几乎所有未保护片段,例如但不限于本文所提供实施例详述的条件。优选地,以足以使核酸外切酶(和任选存在的核酸内切酶)降解所有未保护的片段的条件和时间实施步骤c)。步骤c)在约10-90℃,优选约37℃,优选进行约1分钟-约12小时,优选30分钟。
在步骤c)后,可以灭活核酸外切酶和任选存在的核酸内切酶,通过例如但不限于至少一种蛋白酶如蛋白酶k处理或者热灭活。这类技术是本领域标准且技术人员直接理解如何灭活核酸外切酶和任选存在的核酸内切酶。优选的灭活步骤是在约50-90℃,优选约75℃的温度加热样品,持续约1–120分钟,优选约10分钟。灭活步骤优选在本发明方法步骤c)与d)之间。
在本发明步骤c)后,富集了一个或多个靶核酸片段的样品可接受纯化步骤如基于ampure珠的纯化工艺,以去除复合物、酶、游离核苷酸、可能的游离接头和可能的小、非靶核酸片段。靶核酸片段可在纯化后回收,并接受进一步加工和/或分析如单分子测序。
本发明方法还可包含尺寸选择步骤。任选地,尺寸选择步骤在本发明方法步骤b)之前、步骤b)与c)之间或步骤c)之后进行。
靶核酸片段长度可变,但优选至少200、500、1000、3000、5000、7000、10,000、15,000或20,000(多至至少100,000)个碱基长度。长度主要取决于预期用途,在一些最优实施方案中,基于待使用特定测序技术的平均读数长度。
本文中应理解有效量的组分用于本发明方法。例如,步骤b)中加入的至少第一和第二grna-cas复合物以足以诱导样品内一个或多个核酸分子切割的量提供。另外,步骤c)所加入核酸外切酶施用的量足以降解样品或起始材料内至少约75%、80%、85%、90%、95%或100%的非靶核酸片段。
本发明方法可包含一个或多个纯化步骤,优选本文所定义步骤c)之后。任选存在的纯化步骤是蛋白酶k处理。或者或另外,所述纯化可包括下列步骤:
i.使步骤c)后所得的经消化的核酸样品暴露于一个或多个固体支持物,所述支持物特异且有效结合一个或多个靶核酸片段;和任选地,
ii.洗涤所述一个或多个固体支持物,并从所述一个或多个固体支持物洗脱靶核酸片段。
所述一个或多个固体支持物可以是但不限于ampure珠。由于纯化后获得至少一个分离靶核酸片段,本文所定义的方法也可视作从核酸样品分离一个或多个靶核酸片段的方法。
本发明的方法之后可以是测序一个或多个靶核酸片段的步骤。因此,本文所定义方法还可视作测序来自核酸样品的一个或多个靶核酸片段的方法。
任选地,本发明方法还包含扩增步骤。优选地,此扩增在核酸外切酶处理即本文所定义步骤c)后进行。扩增能通过pcr或本领域已知任何扩增方法完成。
本发明的方法也可包括连接一个或多个接头到靶核酸片段的步骤。优选地,这类接头连接在本文所定义步骤c)后进行。这些一个或多个接头可包含功能结构域,优选选自限制性位点结构域、捕获结构域、测序引物结合位点、扩增引物结合位点、检测结构域、条形码序列、转录启动子结构域和pam序列或其任何组合。条形码可以是但不限于样品条形码或独特的分子标识符(umi)。
在尤其优选的实施方案中,所述一个或多个接头是测序接头,例如包含的功能结构域允许罗氏454a和454b测序、illuminatmsolexatm测序、应用生物系统公司(appliedbiosystems)的solidtm测序、太平洋生物科学公司的smrttm测序、pollonatorpolony测序、牛津纳米孔技术或全基因组测序。
根据接头设计,接头可以是单链、双链、部分双链、y型、发夹或可环化接头。任选地,能使用一个或多个接头。任选地,能使用一组或多组的2个接头,其中一组的第一接头旨在靶核酸片段5’末端侧连接且组的第二接头旨在靶核酸片段3’末端侧连接。组内第一和第二接头优选各包含相容性引物结合序列,从而接头连接的片段易用相容性引物对扩增或测序。
在一个优选实施方案中,本发明方法没有扩增和/或克隆步骤。减少扩增步骤是有益的,因为表观遗传学信息(例如5-mc、6-ma等)会在扩增子中丧失。进一步扩增能在扩增子中引入变化(如通过扩增期间的错误),从而其核苷酸序列不反映初始样品。类似地,靶区域克隆到另一生物体内通常不维持初始样品核酸中存在的修饰,因此,在优选实施方案中,待富集用于进一步分析的靶序列通常不在本文方法中扩增和/或克隆。
茎环或发夹接头是单链的,但其末端互补,从而接头自身回折以产生双链部分和单链环。茎环接头能连接线性、双链核酸末端。例如,茎环接头连接双链靶核酸片段末端,从而没有末端核苷酸(例如任何空位被填充且连接,分别使用聚合酶和连接酶)时,所得分子缺乏末端核苷酸,而不是在各末端携带单链环。
靶核酸片段能连接可环化接头。此方面中,含靶序列的片段可如下环化:通过相容性结构在片段任一侧自身环化(其可由接头连接或经连接接头的限制性酶消化引起),或通过杂交与所需片段末端互补的选择探针。延伸和最终连接步骤形成了共价闭合的环状,任选地,双链多核苷酸。
本文中应理解核酸样品包含至少一个靶核酸片段。不同的是,核酸样品因而可包含1、2、3、4、5、6、7、8、9、10或更多个靶核酸片段,例如至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多个靶核酸片段,其中优选样品内的各靶核酸片段具有不同序列。本发明方法可提供来自核酸样品的这些靶核酸片段同步富集。因此任选地,本发明方法步骤b)中,加入多组的至少第一和第二grna-cas复合物以从核酸样品富集、分离或测序多个靶核酸片段。优选地,这些多组的第一和第二grna-cas复合物可包含相同crispr核酸酶,但其grna不同。例如,对于各靶核酸片段,可使用2个不同grna分子,如一个grna纳入第一grna-cas复合物,另一grna纳入第二grna-cas复合物。对于例如至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多个靶核酸片段,优选至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多组grna分子,优选至少约100、200、300、400、500、600、700、800、900、1000、1500、2000或更多个不同grna分子,可用于本发明方法。
任选地,本发明方法是多路的,即同时施用于多个核酸样品,例如用于至少约10、20、30、40、50、60、70、80、90、100、500、1000或更多个核酸样品。所述方法可就多个样品平行实施,其中“平行”在本文中应理解为几乎同时,但各样品在单独反应管或容器中处理。另外或替代地,本发明方法的一个或多个步骤可在合并样品上进行。为追溯富集、分离和/或测序片段到初始样品,片段可用标识符作标签,然后合并样品。这类标识符能是任何可检测实体,例如但不限于放射性或荧光标记,但优选是特定核苷酸序列或核苷酸序列组合,优选具有定义长度。另外或替代地,样品能用聪明的混同策略合并,例如但不限于2d和3d合并策略,从而合并后,各样品分别包含于至少2或3个池。特定靶片段能追溯到初始样品,使用含有特定富集、分离和/或测序靶片段的各池坐标。
本发明方法的核酸样品可来自任何来源,如人、动物、植物、微生物,且可以是任何种类,如细胞内源或外源,例如基因组dna、染色体dna、人工染色体、质粒dna或游离型dna、cdna、rna、线粒体、或人工文库如bac或yac等。dna可以是核或细胞器dna。dna优选是染色体dna,优选细胞内源。
另一方面,本发明提供用于上文所定义的方法的成套试剂盒。优选地,所述试剂盒包含至少以下之一:
-一个或多个小瓶,包含本文所定义的至少第一和第二grna-cas复合物;
-一个或多个小瓶,包含至少第一和第二grna,用于复合crispr-cas蛋白形成grna-cas复合物,以及包含所述crispr-cas蛋白的另一小瓶;
-另一小瓶,包含一种或多种核酸外切酶以降解非靶核酸;和
-任选存在的小瓶,包含一种或多种限制性酶以降解非靶核酸。
任选地,试剂盒还包含一个或多个本文所定义接头,有一个或多个上文所示小瓶或在单独小瓶中。试剂盒优选包含至少2、4、10、20、30或50个小瓶,含有本文所定义一种或多种grna。试剂盒内任何小瓶的体积优选不超过100ml、50ml、20ml、10ml、5ml、4ml、3ml、2ml或1ml。
试剂可以冻干形式存在,或溶于适当缓冲液。试剂盒还可包含完成本发明所需的任何其他组分,如缓冲液、吸量管、微量滴定板和书面说明。用于本发明的试剂盒的这类其他组分是技术人员已知的。
最后,提供本文所定义的至少第一和第二grna-cas复合物或成套试剂盒用于从核酸样品富集至少一个靶核酸片段的用途。更具体地,提供所述至少第一和第二grna-cas复合物用于保护靶核酸片段免于核酸外切酶降解的用途。
附图说明
图1:λdna中的pcii限制性核酸内切酶识别位点和cas9sgrna位置。指示片段尺寸以及用cas9靶向的片段。
图2:经消化的dna样品的电泳分析。a)pcii消化的λdna,没有cas9靶向和保护。b)pcii消化的λdna,有cas9靶向和保护。
图3:femto脉冲(advancedanalytical)分析经消化的甜瓜dna,使用靶向423个基因组基因座的cas9,每个基因座具有5.1-5.6kbp的尺寸,池为1406sgrna。在靶基因座侧翼序列中设计sgrna。实际靶向区域的总长是~5.5kbp。可见大小为~6.4kbp的清晰峰值。所量的(sized)长度的差异正常,这归因于量度(sizing)的不准确。左侧第一泳道是经消化的甜瓜dna,第二泳道是标记。
图4:femto脉冲(advancedanalytical)分析选定尺寸的dna。从图3所示样品可见,片段选择范围是2.5kbp–10kbp,使用sagesciencebluepippin。左侧第一泳道是经消化且选定尺寸的dna,第二泳道是标记。
图5:甜瓜(melonvedrantais)基因组区域的igv可视化,将在富集操作后获得的读取进行作图到所述区域。灰盒描述就2个靶基因座而言的相对读数覆盖范围(上部),下面显示作图的读数。靶向基因座指示为作图读数下的黑条。在这些黑条下方,用于这些基因座的所用sgrna位置以黑线指示。显示的是,富集的读取在选定sgrna位置开始且完全涵盖靶向基因座。
实施例
实施例1
材料与方法
共3μgλdna(seqidno:5、genbank登录号j02459.1)(10μl300ng/μl)用限制性核酸内切酶pcii(新英格兰生物实验室(newenglandbiolabs))消化,通过加入下列组分、2μl10xneb3.1缓冲液(新英格兰生物实验室)、3μlpcii核酸内切酶(10u/μl)和5μl无核酸酶水进行。所得20μl反应混合物在37℃温育1小时,之后酶通过80℃温育20分钟灭活。λdna中2个pcii识别位点的概览如图1所示。
pcii限制性酶切的λdna中的2个特定位点用cas9和2个为这些靶向位点设计的sgrna来靶向。第一sgrna(sgrna9)具有seqidno:13并靶向具有seqidno:14的前间隔序列。第二sgrna(sgrna13)具有seqidno:15并靶向具有seqidno:16的前间隔序列。反应条件是:20μlpcii限制性酶切的λdna(见上)、1μl10xneb3.1缓冲液、3μl0.3μmsgrna9、3μl0.3μmsgrna13、1.8μlcas9蛋白(新英格兰生物实验室)和1.2μl无核酸酶水。30μl反应混合物在37℃温育1小时。
未保护片段通过用核酸外切酶v温育来去除。为此,向12.5μlcas9反应物加入下列组分:1.75μl10xneb3.1缓冲液、3.0μl10mmatp(新英格兰生物实验室)、1.0μl10u/μlexov核酸外切酶(新英格兰生物实验室)和11.75μl无核酸酶水。所得30μl反应混合物在37℃温育30分钟。蛋白通过75℃温育10分钟灭活。
进行下列对照反应:
1.仅限制性酶切λdna。为此,仅实施上述pcii限制性反应。
2.将pcii限制性酶切的λdna与核酸外切酶v温育。为此,pcii限制性酶切λdna后,加入下列组分:1.0μl10xneb3.1缓冲液、3.0μl10mmatp、1.0μl10u/μlexov核酸外切酶和5.0μl无核酸酶水。30.0μl反应混合物在37℃温育30分钟。核酸外切酶通过75℃温育10分钟灭活。
所有样品用ampurexp溶液(贝克曼库尔特(beckmancoultier),美国加利福尼亚布州布雷亚)纯化,珠与样品之比为0.8x。结合后,珠用70%乙醇洗2次,结合的dna在10μl无核酸酶水洗脱。
洗脱的dna用femto脉冲(advancedanalytical)分析。
结果
femto脉冲分析结果如图2所示:简言之;
·用pcii限制性酶消化的λdna显示以下长度的预期片段:~600bp(seqidno:6)–~9,000bp(seqidno:8)–~40,000bp(seqidno:7)
·用pcii限制性酶消化且后续用exov核酸外切酶温育的lambdadna没有显示剩余片段,表明缺乏核酸外切酶保护
·用pcii限制性酶消化并用带sgrna9和13的cas9靶向的λdna显示以下长度的预期片段:~600bp(seqidno:6)–~9,000bp(2x)(seqidno:11和12)–~10,000bp(seqidno:10)–~20,000bp(seqidno:9)。seqidno:9的最后的(3’)~500bp如seqidno:17所示且seqidno:11的最初的(5’)~500bp如seqidno:18所示。seqidno:10在其5’末端包含seqidno:14的前间隔序列的部分且在其3’末端包含seqidno:16的前间隔序列的部分。
·用pcii限制性酶消化并用具有sgrna9和13的cas9靶向且后续用exov核酸外切酶温育的λdna意外显示长度~10,000bp的片段(seqidno:10)。
结论
crispr系统核酸酶复合物能够保护dna免于核酸外切酶降解。
实施例2
材料、方法与结果
为研究对作物dna的方法,sgrna设计成靶向甜瓜(melonvedrantais)基因组dna中的423个基因座,这些靶标各具有5.1-5.9kbp长度。对于各靶标,一对至少2个sgrna设计成靶向各靶标侧翼500bp的上游和下游区域,其中各sgrna包含20nt长的引导序列,其在基因组内独特。
总共48个反应,各包含9μl115.6ng/μl(=~1μg)甜瓜dna,总体积为25μl,由以下组成:2.5μl10xneb3.1缓冲液(新英格兰生物实验室公司(newenglandbiolabsinc.))、0.18μl16.58μmsgrna混合物、0.15μl20μm酿脓链球菌(s.pyrogenes)cas9核酸酶(新英格兰生物实验室公司)和13.17μl无核酸酶水。
反应混合物(16μl)在室温预温育10分钟,然后加入甜瓜dna(9μl)。25μl反应在37℃温育1小时。未保护片段通过用核酸外切酶v温育来移出。对此,平分25μlcas9反应,向各12.5μl加入下列组分、2μl10xneb3.1缓冲液、2.0μl50mmatp(新英格兰生物实验室公司)、2.5μl10u/μl核酸外切酶v核酸外切酶(新英格兰生物实验室公司)和1μl无核酸酶水。所得20μl反应混合物在37℃温育60分钟。蛋白通过70℃温育30分钟灭活。
为水解肽键,向20μl反应混合物加入1μl20mg/ml蛋白酶k(罗氏)并室温温育10分钟。
所有样品用ampurepb珠溶液(太平洋生物科学公司)纯化,珠与样品之比为0.45x。合并所有96个反应的反应混合物。结合磁体后,珠用70%乙醇洗2次。珠干燥1分钟且结合的dna在50μl无核酸酶水中洗脱。
洗脱的dna用femto脉冲(advancedanalytical)分析。结果如图3所示。
使用bluepippin(sagescience)对洗脱的dna进行尺寸选定(2.5kbp–10kbp)。作为分离基质,采用bluepippin无染料0.75%琼脂胶盒。特定大小的产物用qiaquickpcr纯化试剂盒(凯杰(qiagen))纯化。纯化的dna在10μl无核酸酶水中洗脱。洗脱的dna用femto脉冲(advancedanalytical)分析。结果如图4所示。
洗脱的dna用于测序文库制备,用于牛津纳米孔(oxfordnanopore)minion系统测序。文库制备和测序根据厂商说明书实施。
所得的序列读取用厂商设置进行质量过滤,通过的读数针对甜瓜全基因组参考序列作图。为将读取作图,使用标准设置的minimap2.11-r797。从作图的读取,仅有单一作图位置的那些用于进一步分析。所得的作图的读取用igv软件(博德研究所(broadinstitute))呈现。图5提供此图用于基因组内分开约47kbp的2个靶。在可视化呈现中,还描绘所靶向的基因座和用于靶向基因座的sgrna的位置。
结论
crispr系统核酸酶复合物能够保护dna免于核酸外切酶降解,导致所靶向的感兴趣的区域的dna富集。
序列表
<110>主基因有限公司
<120>通过核酸内切酶保护的靶向富集
<130>p6080445pct
<150>18208936.7
<151>2018-11-28
<160>21
<170>patentinversion3.5
<210>1
<211>1368
<212>prt
<213>artificialsequence
<220>
<223>cas9
<400>1
metasplyslystyrserileglyleuaspileglythrasnserval
151015
glytrpalavalilethraspglutyrlysvalproserlyslysphe
202530
lysvalleuglyasnthrasparghisserilelyslysasnleuile
354045
glyalaleuleupheaspserglygluthralaglualathrargleu
505560
lysargthralaargargargtyrthrargarglysasnargilecys
65707580
tyrleuglngluilepheserasnglumetalalysvalaspaspser
859095
phephehisargleuglugluserpheleuvalglugluasplyslys
100105110
hisgluarghisproilepheglyasnilevalaspgluvalalatyr
115120125
hisglulystyrprothriletyrhisleuarglyslysleuvalasp
130135140
serthrasplysalaaspleuargleuiletyrleualaleualahis
145150155160
metilelyspheargglyhispheleuilegluglyaspleuasnpro
165170175
aspasnseraspvalasplysleupheileglnleuvalglnthrtyr
180185190
asnglnleupheglugluasnproileasnalaserglyvalaspala
195200205
lysalaileleuseralaargleuserlysserargargleugluasn
210215220
leuilealaglnleuproglyglulyslysasnglyleupheglyasn
225230235240
leuilealaleuserleuglyleuthrproasnphelysserasnphe
245250255
aspleualagluaspalalysleuglnleuserlysaspthrtyrasp
260265270
aspaspleuaspasnleuleualaglnileglyaspglntyralaasp
275280285
leupheleualaalalysasnleuseraspalaileleuleuserasp
290295300
ileleuargvalasnthrgluilethrlysalaproleuseralaser
305310315320
metilelysargtyraspgluhishisglnaspleuthrleuleulys
325330335
alaleuvalargglnglnleuproglulystyrlysgluilephephe
340345350
aspglnserlysasnglytyralaglytyrileaspglyglyalaser
355360365
glnglugluphetyrlyspheilelysproileleuglulysmetasp
370375380
glythrglugluleuleuvallysleuasnarggluaspleuleuarg
385390395400
lysglnargthrpheaspasnglyserileprohisglnilehisleu
405410415
glygluleuhisalaileleuargargglngluaspphetyrprophe
420425430
leulysaspasnargglulysileglulysileleuthrpheargile
435440445
protyrtyrvalglyproleualaargglyasnserargphealatrp
450455460
metthrarglysserglugluthrilethrprotrpasnphegluglu
465470475480
valvalasplysglyalaseralaglnserpheilegluargmetthr
485490495
asnpheasplysasnleuproasnglulysvalleuprolyshisser
500505510
leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys
515520525
tyrvalthrgluglymetarglysproalapheleuserglyglugln
530535540
lyslysalailevalaspleuleuphelysthrasnarglysvalthr
545550555560
vallysglnleulysgluasptyrphelyslysileglucyspheasp
565570575
servalgluileserglyvalgluaspargpheasnalaserleugly
580585590
thrtyrhisaspleuleulysileilelysasplysasppheleuasp
595600605
asnglugluasngluaspileleugluaspilevalleuthrleuthr
610615620
leuphegluaspargglumetileglugluargleulysthrtyrala
625630635640
hisleupheaspasplysvalmetlysglnleulysargargargtyr
645650655
thrglytrpglyargleuserarglysleuileasnglyileargasp
660665670
lysglnserglylysthrileleuasppheleulysseraspglyphe
675680685
alaasnargasnphemetglnleuilehisaspaspserleuthrphe
690695700
lysgluaspileglnlysalaglnvalserglyglnglyaspserleu
705710715720
hisgluhisilealaasnleualaglyserproalailelyslysgly
725730735
ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly
740745750
arghislysprogluasnilevalileglumetalaarggluasngln
755760765
thrthrglnlysglyglnlysasnserarggluargmetlysargile
770775780
glugluglyilelysgluleuglyserglnileleulysgluhispro
785790795800
valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu
805810815
glnasnglyargaspmettyrvalaspglngluleuaspileasnarg
820825830
leuserasptyraspvalasphisilevalproglnserpheleulys
835840845
aspaspserileaspasnlysvalleuthrargserasplysasnarg
850855860
glylysseraspasnvalproserglugluvalvallyslysmetlys
865870875880
asntyrtrpargglnleuleuasnalalysleuilethrglnarglys
885890895
pheaspasnleuthrlysalagluargglyglyleusergluleuasp
900905910
lysalaglypheilelysargglnleuvalgluthrargglnilethr
915920925
lyshisvalalaglnileleuaspserargmetasnthrlystyrasp
930935940
gluasnasplysleuilearggluvallysvalilethrleulysser
945950955960
lysleuvalseraspphearglysasppheglnphetyrlysvalarg
965970975
gluileasnasntyrhishisalahisaspalatyrleuasnalaval
980985990
valglythralaleuilelyslystyrprolysleuglusergluphe
99510001005
valtyrglyasptyrlysvaltyraspvalarglysmetileala
101010151020
lyssergluglngluileglylysalathralalystyrphephe
102510301035
tyrserasnilemetasnphephelysthrgluilethrleuala
104010451050
asnglygluilearglysargproleuilegluthrasnglyglu
105510601065
thrglygluilevaltrpasplysglyargaspphealathrval
107010751080
arglysvalleusermetproglnvalasnilevallyslysthr
108510901095
gluvalglnthrglyglypheserlysgluserileleuprolys
110011051110
argasnserasplysleuilealaarglyslysasptrpasppro
111511201125
lyslystyrglyglypheaspserprothrvalalatyrserval
113011351140
leuvalvalalalysvalglulysglylysserlyslysleulys
114511501155
servallysgluleuleuglyilethrilemetgluargserser
116011651170
pheglulysasnproileasppheleuglualalysglytyrlys
117511801185
gluvallyslysaspleuileilelysleuprolystyrserleu
119011951200
phegluleugluasnglyarglysargmetleualaseralagly
120512101215
gluleuglnlysglyasngluleualaleuproserlystyrval
122012251230
asnpheleutyrleualaserhistyrglulysleulysglyser
123512401245
progluaspasngluglnlysglnleuphevalgluglnhislys
125012551260
histyrleuaspgluileilegluglnileserglupheserlys
126512701275
argvalileleualaaspalaasnleuasplysvalleuserala
128012851290
tyrasnlyshisargasplysproilearggluglnalagluasn
129513001305
ileilehisleuphethrleuthrasnleuglyalaproalaala
131013151320
phelystyrpheaspthrthrileasparglysargtyrthrser
132513301335
thrlysgluvalleuaspalathrleuilehisglnserilethr
134013451350
glyleutyrgluthrargileaspleuserglnleuglyglyasp
135513601365
<210>2
<211>4104
<212>dna
<213>artificialsequence
<220>
<223>sequenceencodingcas9
<400>2
atggataaaaaatatagcattggtctggatattggtaccaatagcgttggttgggcagtt60
attaccgatgaatataaagttccgagcaaaaaatttaaagttctgggtaataccgatcgt120
catagcattaaaaaaaatctgattggtgcactgctgtttgatagcggtgaaaccgcagaa180
gcaacccgtctgaaacgtaccgcacgtcgtcgttatacccgtcgtaaaaatcgtatttgt240
tatctgcaggaaatttttagcaatgaaatggcaaaagttgatgatagcttttttcatcgt300
ctggaagaaagctttctggttgaagaagataaaaaacatgaacgtcatccgatttttggt360
aatattgttgatgaagttgcatatcatgaaaaatatccgaccatttatcatctgcgtaaa420
aaactggttgatagcaccgataaagcagatctgcgtctgatttatctggcactggcacat480
atgattaaatttcgtggtcattttctgattgaaggtgatctgaatccggataatagcgat540
gttgataaactgtttattcagctggttcagacctataatcagctgtttgaagaaaatccg600
attaatgcaagcggtgttgatgcaaaagcaattctgagcgcacgtctgagcaaaagccgt660
cgtctggaaaatctgattgcacagctgccgggtgaaaaaaaaaatggtctgtttggtaat720
ctgattgcactgagcctgggtctgaccccgaattttaaaagcaattttgatctggcagaa780
gatgcaaaactgcagctgagcaaagatacctatgatgatgatctggataatctgctggca840
cagattggtgatcagtatgcagatctgtttctggcagcaaaaaatctgagcgatgcaatt900
ctgctgagcgatattctgcgtgttaataccgaaattaccaaagcaccgctgagcgcaagc960
atgattaaacgttatgatgaacatcatcaggatctgaccctgctgaaagcactggttcgt1020
cagcagctgccggaaaaatataaagaaattttttttgatcagagcaaaaatggttatgca1080
ggttatattgatggtggtgcaagccaggaagaattttataaatttattaaaccgattctg1140
gaaaaaatggatggtaccgaagaactgctggttaaactgaatcgtgaagatctgctgcgt1200
aaacagcgtacctttgataatggtagcattccgcatcagattcatctgggtgaactgcat1260
gcaattctgcgtcgtcaggaagatttttatccgtttctgaaagataatcgtgaaaaaatt1320
gaaaaaattctgacctttcgtattccgtattatgttggtccgctggcacgtggtaatagc1380
cgttttgcatggatgacccgtaaaagcgaagaaaccattaccccgtggaattttgaagaa1440
gttgttgataaaggtgcaagcgcacagagctttattgaacgtatgaccaattttgataaa1500
aatctgccgaatgaaaaagttctgccgaaacatagcctgctgtatgaatattttaccgtt1560
tataatgaactgaccaaagttaaatatgttaccgaaggtatgcgtaaaccggcatttctg1620
agcggtgaacagaaaaaagcaattgttgatctgctgtttaaaaccaatcgtaaagttacc1680
gttaaacagctgaaagaagattattttaaaaaaattgaatgttttgatagcgttgaaatt1740
agcggtgttgaagatcgttttaatgcaagcctgggtacctatcatgatctgctgaaaatt1800
attaaagataaagattttctggataatgaagaaaatgaagatattctggaagatattgtt1860
ctgaccctgaccctgtttgaagatcgtgaaatgattgaagaacgtctgaaaacctatgca1920
catctgtttgatgataaagttatgaaacagctgaaacgtcgtcgttataccggttggggt1980
cgtctgagccgtaaactgattaatggtattcgtgataaacagagcggtaaaaccattctg2040
gattttctgaaaagcgatggttttgcaaatcgtaattttatgcagctgattcatgatgat2100
agcctgacctttaaagaagatattcagaaagcacaggttagcggtcagggtgatagcctg2160
catgaacatattgcaaatctggcaggtagcccggcaattaaaaaaggtattctgcagacc2220
gttaaagttgttgatgaactggttaaagttatgggtcgtcataaaccggaaaatattgtt2280
attgaaatggcacgtgaaaatcagaccacccagaaaggtcagaaaaatagccgtgaacgt2340
atgaaacgtattgaagaaggtattaaagaactgggtagccagattctgaaagaacatccg2400
gttgaaaatacccagctgcagaatgaaaaactgtatctgtattatctgcagaatggtcgt2460
gatatgtatgttgatcaggaactggatattaatcgtctgagcgattatgatgttgatcat2520
attgttccgcagagctttctgaaagatgatagcattgataataaagttctgacccgtagc2580
gataaaaatcgtggtaaaagcgataatgttccgagcgaagaagttgttaaaaaaatgaaa2640
aattattggcgtcagctgctgaatgcaaaactgattacccagcgtaaatttgataatctg2700
accaaagcagaacgtggtggtctgagcgaactggataaagcaggttttattaaacgtcag2760
ctggttgaaacccgtcagattaccaaacatgttgcacagattctggatagccgtatgaat2820
accaaatatgatgaaaatgataaactgattcgtgaagttaaagttattaccctgaaaagc2880
aaactggttagcgattttcgtaaagattttcagttttataaagttcgtgaaattaataat2940
tatcatcatgcacatgatgcatatctgaatgcagttgttggtaccgcactgattaaaaaa3000
tatccgaaactggaaagcgaatttgtttatggtgattataaagtttatgatgttcgtaaa3060
atgattgcaaaaagcgaacaggaaattggtaaagcaaccgcaaaatattttttttatagc3120
aatattatgaatttttttaaaaccgaaattaccctggcaaatggtgaaattcgtaaacgt3180
ccgctgattgaaaccaatggtgaaaccggtgaaattgtttgggataaaggtcgtgatttt3240
gcaaccgttcgtaaagttctgagcatgccgcaggttaatattgttaaaaaaaccgaagtt3300
cagaccggtggttttagcaaagaaagcattctgccgaaacgtaatagcgataaactgatt3360
gcacgtaaaaaagattgggatccgaaaaaatatggtggttttgatagcccgaccgttgca3420
tatagcgttctggttgttgcaaaagttgaaaaaggtaaaagcaaaaaactgaaaagcgtt3480
aaagaactgctgggtattaccattatggaacgtagcagctttgaaaaaaatccgattgat3540
tttctggaagcaaaaggttataaagaagttaaaaaagatctgattattaaactgccgaaa3600
tatagcctgtttgaactggaaaatggtcgtaaacgtatgctggcaagcgcaggtgaactg3660
cagaaaggtaatgaactggcactgccgagcaaatatgttaattttctgtatctggcaagc3720
cattatgaaaaactgaaaggtagcccggaagataatgaacagaaacagctgtttgttgaa3780
cagcataaacattatctggatgaaattattgaacagattagcgaatttagcaaacgtgtt3840
attctggcagatgcaaatctggataaagttctgagcgcatataataaacatcgtgataaa3900
ccgattcgtgaacaggcagaaaatattattcatctgtttaccctgaccaatctgggtgca3960
ccggcagcatttaaatattttgataccaccattgatcgtaaacgttataccagcaccaaa4020
gaagttctggatgcaaccctgattcatcagagcattaccggtctgtatgaaacccgtatt4080
gatctgagccagctgggtggtgat4104
<210>3
<211>1300
<212>prt
<213>artificialsequence
<220>
<223>fncpfi
<400>3
metseriletyrglngluphevalasnlystyrserleuserlysthr
151015
leuargphegluleuileproglnglylysthrleugluasnilelys
202530
alaargglyleuileleuaspaspglulysargalalysasptyrlys
354045
lysalalysglnileileasplystyrhisglnphepheilegluglu
505560
ileleuserservalcysilesergluaspleuleuglnasntyrser
65707580
aspvaltyrphelysleulyslysseraspaspaspasnleuglnlys
859095
aspphelysseralalysaspthrilelyslysglnileserglutyr
100105110
ilelysaspserglulysphelysasnleupheasnglnasnleuile
115120125
aspalalyslysglyglngluseraspleuileleutrpleulysgln
130135140
serlysaspasnglyilegluleuphelysalaasnseraspilethr
145150155160
aspileaspglualaleugluileilelysserphelysglytrpthr
165170175
thrtyrphelysglyphehisgluasnarglysasnvaltyrserser
180185190
asnaspileprothrserileiletyrargilevalaspaspasnleu
195200205
prolyspheleugluasnlysalalystyrgluserleulysasplys
210215220
alaproglualaileasntyrgluglnilelyslysaspleualaglu
225230235240
gluleuthrpheaspileasptyrlysthrsergluvalasnglnarg
245250255
valpheserleuaspgluvalphegluilealaasnpheasnasntyr
260265270
leuasnglnserglyilethrlyspheasnthrileileglyglylys
275280285
phevalasnglygluasnthrlysarglysglyileasnglutyrile
290295300
asnleutyrserglnglnileasnasplysthrleulyslystyrlys
305310315320
metservalleuphelysglnileleuseraspthrgluserlysser
325330335
phevalileasplysleugluaspaspseraspvalvalthrthrmet
340345350
glnserphetyrgluglnilealaalaphelysthrvalgluglulys
355360365
serilelysgluthrleuserleuleupheaspaspleulysalagln
370375380
lysleuaspleuserlysiletyrphelysasnasplysserleuthr
385390395400
aspleuserglnglnvalpheaspasptyrservalileglythrala
405410415
valleuglutyrilethrglnglnilealaprolysasnleuaspasn
420425430
proserlyslysgluglngluleuilealalyslysthrglulysala
435440445
lystyrleuserleugluthrilelysleualaleugluglupheasn
450455460
lyshisargaspileasplysglncysargpheglugluileleuala
465470475480
asnphealaalaileprometilepheaspgluilealaglnasnlys
485490495
aspasnleualaglnileserilelystyrglnasnglnglylyslys
500505510
aspleuleuglnalaseralagluaspaspvallysalailelysasp
515520525
leuleuaspglnthrasnasnleuleuhislysleulysilephehis
530535540
ileserglnsergluasplysalaasnileleuasplysaspgluhis
545550555560
phetyrleuvalphegluglucystyrphegluleualaasnileval
565570575
proleutyrasnlysileargasntyrilethrglnlysprotyrser
580585590
aspglulysphelysleuasnphegluasnserthrleualaasngly
595600605
trpasplysasnlysgluproaspasnthralaileleupheilelys
610615620
aspasplystyrtyrleuglyvalmetasnlyslysasnasnlysile
625630635640
pheaspasplysalailelysgluasnlysglygluglytyrlyslys
645650655
ilevaltyrlysleuleuproglyalaasnlysmetleuprolysval
660665670
phepheseralalysserilelysphetyrasnprosergluaspile
675680685
leuargileargasnhisserthrhisthrlysasnglyserprogln
690695700
lysglytyrglulyspheglupheasnilegluaspcysarglysphe
705710715720
ileaspphetyrlysglnserileserlyshisproglutrplysasp
725730735
pheglypheargpheseraspthrglnargtyrasnserileaspglu
740745750
phetyrarggluvalgluasnglnglytyrlysleuthrphegluasn
755760765
ileserglusertyrileaspservalvalasnglnglylysleutyr
770775780
leupheglniletyrasnlysasppheseralatyrserlysglyarg
785790795800
proasnleuhisthrleutyrtrplysalaleupheaspgluargasn
805810815
leuglnaspvalvaltyrlysleuasnglyglualagluleuphetyr
820825830
arglysglnserileprolyslysilethrhisproalalysgluala
835840845
ilealaasnlysasnlysaspasnprolyslysgluservalpheglu
850855860
tyraspleuilelysasplysargphethrgluasplysphephephe
865870875880
hiscysproilethrileasnphelysserserglyalaasnlysphe
885890895
asnaspgluileasnleuleuleulysglulysalaasnaspvalhis
900905910
ileleuserileaspargglygluarghisleualatyrtyrthrleu
915920925
valaspglylysglyasnileilelysglnaspthrpheasnileile
930935940
glyasnaspargmetlysthrasntyrhisasplysleualaalaile
945950955960
glulysaspargaspseralaarglysasptrplyslysileasnasn
965970975
ilelysglumetlysgluglytyrleuserglnvalvalhisgluile
980985990
alalysleuvalileglutyrasnalailevalvalphegluaspleu
99510001005
asnpheglyphelysargglyargphelysvalglulysglnval
101010151020
tyrglnlysleuglulysmetleuileglulysleuasntyrleu
102510301035
valphelysaspasnglupheasplysthrglyglyvalleuarg
104010451050
alatyrglnleuthralaprophegluthrphelyslysmetgly
105510601065
lysglnthrglyileiletyrtyrvalproalaglyphethrser
107010751080
lysilecysprovalthrglyphevalasnglnleutyrprolys
108510901095
tyrgluservalserlysserglngluphepheserlyspheasp
110011051110
lysilecystyrasnleuasplysglytyrpheglupheserphe
111511201125
asptyrlysasnpheglyasplysalaalalysglylystrpthr
113011351140
ilealaserpheglyserargleuileasnpheargasnserasp
114511501155
lysasnhisasntrpaspthrarggluvaltyrprothrlysglu
116011651170
leuglulysleuleulysasptyrserileglutyrglyhisgly
117511801185
glucysilelysalaalailecysglygluserasplyslysphe
119011951200
phealalysleuthrservalleuasnthrileleuglnmetarg
120512101215
asnserlysthrglythrgluleuasptyrleuileserproval
122012251230
alaaspvalasnglyasnphepheaspserargglnalaprolys
123512401245
asnmetproglnaspalaaspalaasnglyalatyrhisilegly
125012551260
leulysglyleumetleuleuglyargilelysasnasnglnglu
126512701275
glylyslysleuasnleuvalilelysasngluglutyrpheglu
128012851290
phevalglnasnargasnasn
12951300
<210>4
<211>3900
<212>dna
<213>artificialsequence
<220>
<223>sequenceencodingfncpfi
<400>4
atgagcatttatcaggaatttgttaataaatatagcctgagcaaaaccctgcgttttgaa60
ctgattccgcagggtaaaaccctggaaaatattaaagcacgtggtctgattctggatgat120
gaaaaacgtgcaaaagattataaaaaagcaaaacagattattgataaatatcatcagttt180
tttattgaagaaattctgagcagcgtttgtattagcgaagatctgctgcagaattatagc240
gatgtttattttaaactgaaaaaaagcgatgatgataatctgcagaaagattttaaaagc300
gcaaaagataccattaaaaaacagattagcgaatatattaaagatagcgaaaaatttaaa360
aatctgtttaatcagaatctgattgatgcaaaaaaaggtcaggaaagcgatctgattctg420
tggctgaaacagagcaaagataatggtattgaactgtttaaagcaaatagcgatattacc480
gatattgatgaagcactggaaattattaaaagctttaaaggttggaccacctattttaaa540
ggttttcatgaaaatcgtaaaaatgtttatagcagcaatgatattccgaccagcattatt600
tatcgtattgttgatgataatctgccgaaatttctggaaaataaagcaaaatatgaaagc660
ctgaaagataaagcaccggaagcaattaattatgaacagattaaaaaagatctggcagaa720
gaactgacctttgatattgattataaaaccagcgaagttaatcagcgtgtttttagcctg780
gatgaagtttttgaaattgcaaattttaataattatctgaatcagagcggtattaccaaa840
tttaataccattattggtggtaaatttgttaatggtgaaaataccaaacgtaaaggtatt900
aatgaatatattaatctgtatagccagcagattaatgataaaaccctgaaaaaatataaa960
atgagcgttctgtttaaacagattctgagcgataccgaaagcaaaagctttgttattgat1020
aaactggaagatgatagcgatgttgttaccaccatgcagagcttttatgaacagattgca1080
gcatttaaaaccgttgaagaaaaaagcattaaagaaaccctgagcctgctgtttgatgat1140
ctgaaagcacagaaactggatctgagcaaaatttattttaaaaatgataaaagcctgacc1200
gatctgagccagcaggtttttgatgattatagcgttattggtaccgcagttctggaatat1260
attacccagcagattgcaccgaaaaatctggataatccgagcaaaaaagaacaggaactg1320
attgcaaaaaaaaccgaaaaagcaaaatatctgagcctggaaaccattaaactggcactg1380
gaagaatttaataaacatcgtgatattgataaacagtgtcgttttgaagaaattctggca1440
aattttgcagcaattccgatgatttttgatgaaattgcacagaataaagataatctggca1500
cagattagcattaaatatcagaatcagggtaaaaaagatctgctgcaggcaagcgcagaa1560
gatgatgttaaagcaattaaagatctgctggatcagaccaataatctgctgcataaactg1620
aaaatttttcatattagccagagcgaagataaagcaaatattctggataaagatgaacat1680
ttttatctggtttttgaagaatgttattttgaactggcaaatattgttccgctgtataat1740
aaaattcgtaattatattacccagaaaccgtatagcgatgaaaaatttaaactgaatttt1800
gaaaatagcaccctggcaaatggttgggataaaaataaagaaccggataataccgcaatt1860
ctgtttattaaagatgataaatattatctgggtgttatgaataaaaaaaataataaaatt1920
tttgatgataaagcaattaaagaaaataaaggtgaaggttataaaaaaattgtttataaa1980
ctgctgccgggtgcaaataaaatgctgccgaaagttttttttagcgcaaaaagcattaaa2040
ttttataatccgagcgaagatattctgcgtattcgtaatcatagcacccataccaaaaat2100
ggtagcccgcagaaaggttatgaaaaatttgaatttaatattgaagattgtcgtaaattt2160
attgatttttataaacagagcattagcaaacatccggaatggaaagattttggttttcgt2220
tttagcgatacccagcgttataatagcattgatgaattttatcgtgaagttgaaaatcag2280
ggttataaactgacctttgaaaatattagcgaaagctatattgatagcgttgttaatcag2340
ggtaaactgtatctgtttcagatttataataaagattttagcgcatatagcaaaggtcgt2400
ccgaatctgcataccctgtattggaaagcactgtttgatgaacgtaatctgcaggatgtt2460
gtttataaactgaatggtgaagcagaactgttttatcgtaaacagagcattccgaaaaaa2520
attacccatccggcaaaagaagcaattgcaaataaaaataaagataatccgaaaaaagaa2580
agcgtttttgaatatgatctgattaaagataaacgttttaccgaagataaattttttttt2640
cattgtccgattaccattaattttaaaagcagcggtgcaaataaatttaatgatgaaatt2700
aatctgctgctgaaagaaaaagcaaatgatgttcatattctgagcattgatcgtggtgaa2760
cgtcatctggcatattataccctggttgatggtaaaggtaatattattaaacaggatacc2820
tttaatattattggtaatgatcgtatgaaaaccaattatcatgataaactggcagcaatt2880
gaaaaagatcgtgatagcgcacgtaaagattggaaaaaaattaataatattaaagaaatg2940
aaagaaggttatctgagccaggttgttcatgaaattgcaaaactggttattgaatataat3000
gcaattgttgtttttgaagatctgaattttggttttaaacgtggtcgttttaaagttgaa3060
aaacaggtttatcagaaactggaaaaaatgctgattgaaaaactgaattatctggttttt3120
aaagataatgaatttgataaaaccggtggtgttctgcgtgcatatcagctgaccgcaccg3180
tttgaaacctttaaaaaaatgggtaaacagaccggtattatttattatgttccggcaggt3240
tttaccagcaaaatttgtccggttaccggttttgttaatcagctgtatccgaaatatgaa3300
agcgttagcaaaagccaggaattttttagcaaatttgataaaatttgttataatctggat3360
aaaggttattttgaatttagctttgattataaaaattttggtgataaagcagcaaaaggt3420
aaatggaccattgcaagctttggtagccgtctgattaattttcgtaatagcgataaaaat3480
cataattgggatacccgtgaagtttatccgaccaaagaactggaaaaactgctgaaagat3540
tatagcattgaatatggtcatggtgaatgtattaaagcagcaatttgtggtgaaagcgat3600
aaaaaattttttgcaaaactgaccagcgttctgaataccattctgcagatgcgtaatagc3660
aaaaccggtaccgaactggattatctgattagcccggttgcagatgttaatggtaatttt3720
tttgatagccgtcaggcaccgaaaaatatgccgcaggatgcagatgcaaatggtgcatat3780
catattggtctgaaaggtctgatgctgctgggtcgtattaaaaataatcaggaaggtaaa3840
aaactgaatctggttattaaaaatgaagaatattttgaatttgttcagaatcgtaataat3900
<210>5
<211>48502
<212>dna
<213>artificialsequence
<220>
<223>lambdadna
<400>5
gggcggcgacctcgcgggttttcgctatttatgaaaattttccggtttaaggcgtttccg60
ttcttcttcgtcataacttaatgtttttatttaaaataccctctgaaaagaaaggaaacg120
acaggtgctgaaagcgaggctttttggcctctgtcgtttcctttctctgtttttgtccgt180
ggaatgaacaatggaagtcaacaaaaagcagctggctgacattttcggtgcgagtatccg240
taccattcagaactggcaggaacagggaatgcccgttctgcgaggcggtggcaagggtaa300
tgaggtgctttatgactctgccgccgtcataaaatggtatgccgaaagggatgctgaaat360
tgagaacgaaaagctgcgccgggaggttgaagaactgcggcaggccagcgaggcagatct420
ccagccaggaactattgagtacgaacgccatcgacttacgcgtgcgcaggccgacgcaca480
ggaactgaagaatgccagagactccgctgaagtggtggaaaccgcattctgtactttcgt540
gctgtcgcggatcgcaggtgaaattgccagtattctcgacgggctccccctgtcggtgca600
gcggcgttttccggaactggaaaaccgacatgttgatttcctgaaacgggatatcatcaa660
agccatgaacaaagcagccgcgctggatgaactgataccggggttgctgagtgaatatat720
cgaacagtcaggttaacaggctgcggcattttgtccgcgccgggcttcgctcactgttca780
ggccggagccacagaccgccgttgaatgggcggatgctaattactatctcccgaaagaat840
ccgcataccaggaagggcgctgggaaacactgccctttcagcgggccatcatgaatgcga900
tgggcagcgactacatccgtgaggtgaatgtggtgaagtctgcccgtgtcggttattcca960
aaatgctgctgggtgtttatgcctactttatagagcataagcagcgcaacacccttatct1020
ggttgccgacggatggtgatgccgagaactttatgaaaacccacgttgagccgactattc1080
gtgatattccgtcgctgctggcgctggccccgtggtatggcaaaaagcaccgggataaca1140
cgctcaccatgaagcgtttcactaatgggcgtggcttctggtgcctgggcggtaaagcgg1200
caaaaaactaccgtgaaaagtcggtggatgtggcgggttatgatgaacttgctgcttttg1260
atgatgatattgaacaggaaggctctccgacgttcctgggtgacaagcgtattgaaggct1320
cggtctggccaaagtccatccgtggctccacgccaaaagtgagaggcacctgtcagattg1380
agcgtgcagccagtgaatccccgcattttatgcgttttcatgttgcctgcccgcattgcg1440
gggaggagcagtatcttaaatttggcgacaaagagacgccgtttggcctcaaatggacgc1500
cggatgacccctccagcgtgttttatctctgcgagcataatgcctgcgtcatccgccagc1560
aggagctggactttactgatgcccgttatatctgcgaaaagaccgggatctggacccgtg1620
atggcattctctggttttcgtcatccggtgaagagattgagccacctgacagtgtgacct1680
ttcacatctggacagcgtacagcccgttcaccacctgggtgcagattgtcaaagactgga1740
tgaaaacgaaaggggatacgggaaaacgtaaaaccttcgtaaacaccacgctcggtgaga1800
cgtgggaggcgaaaattggcgaacgtccggatgctgaagtgatggcagagcggaaagagc1860
attattcagcgcccgttcctgaccgtgtggcttacctgaccgccggtatcgactcccagc1920
tggaccgctacgaaatgcgcgtatggggatgggggccgggtgaggaaagctggctgattg1980
accggcagattattatgggccgccacgacgatgaacagacgctgctgcgtgtggatgagg2040
ccatcaataaaacctatacccgccggaatggtgcagaaatgtcgatatcccgtatctgct2100
gggatactggcgggattgacccgaccattgtgtatgaacgctcgaaaaaacatgggctgt2160
tccgggtgatccccattaaaggggcatccgtctacggaaagccggtggccagcatgccac2220
gtaagcgaaacaaaaacggggtttaccttaccgaaatcggtacggataccgcgaaagagc2280
agatttataaccgcttcacactgacgccggaaggggatgaaccgcttcccggtgccgttc2340
acttcccgaataacccggatatttttgatctgaccgaagcgcagcagctgactgctgaag2400
agcaggtcgaaaaatgggtggatggcaggaaaaaaatactgtgggacagcaaaaagcgac2460
gcaatgaggcactcgactgcttcgtttatgcgctggcggcgctgcgcatcagtatttccc2520
gctggcagctggatctcagtgcgctgctggcgagcctgcaggaagaggatggtgcagcaa2580
ccaacaagaaaacactggcagattacgcccgtgccttatccggagaggatgaatgacgcg2640
acaggaagaacttgccgctgcccgtgcggcactgcatgacctgatgacaggtaaacgggt2700
ggcaacagtacagaaagacggacgaagggtggagtttacggccacttccgtgtctgacct2760
gaaaaaatatattgcagagctggaagtgcagaccggcatgacacagcgacgcaggggacc2820
tgcaggattttatgtatgaaaacgcccaccattcccacccttctggggccggacggcatg2880
acatcgctgcgcgaatatgccggttatcacggcggtggcagcggatttggagggcagttg2940
cggtcgtggaacccaccgagtgaaagtgtggatgcagccctgttgcccaactttacccgt3000
ggcaatgcccgcgcagacgatctggtacgcaataacggctatgccgccaacgccatccag3060
ctgcatcaggatcatatcgtcgggtcttttttccggctcagtcatcgcccaagctggcgc3120
tatctgggcatcggggaggaagaagcccgtgccttttcccgcgaggttgaagcggcatgg3180
aaagagtttgccgaggatgactgctgctgcattgacgttgagcgaaaacgcacgtttacc3240
atgatgattcgggaaggtgtggccatgcacgcctttaacggtgaactgttcgttcaggcc3300
acctgggataccagttcgtcgcggcttttccggacacagttccggatggtcagcccgaag3360
cgcatcagcaacccgaacaataccggcgacagccggaactgccgtgccggtgtgcagatt3420
aatgacagcggtgcggcgctgggatattacgtcagcgaggacgggtatcctggctggatg3480
ccgcagaaatggacatggataccccgtgagttacccggcgggcgcgcctcgttcattcac3540
gtttttgaacccgtggaggacgggcagactcgcggtgcaaatgtgttttacagcgtgatg3600
gagcagatgaagatgctcgacacgctgcagaacacgcagctgcagagcgccattgtgaag3660
gcgatgtatgccgccaccattgagagtgagctggatacgcagtcagcgatggattttatt3720
ctgggcgcgaacagtcaggagcagcgggaaaggctgaccggctggattggtgaaattgcc3780
gcgtattacgccgcagcgccggtccggctgggaggcgcaaaagtaccgcacctgatgccg3840
ggtgactcactgaacctgcagacggctcaggatacggataacggctactccgtgtttgag3900
cagtcactgctgcggtatatcgctgccgggctgggtgtctcgtatgagcagctttcccgg3960
aattacgcccagatgagctactccacggcacgggccagtgcgaacgagtcgtgggcgtac4020
tttatggggcggcgaaaattcgtcgcatcccgtcaggcgagccagatgtttctgtgctgg4080
ctggaagaggccatcgttcgccgcgtggtgacgttaccttcaaaagcgcgcttcagtttt4140
caggaagcccgcagtgcctgggggaactgcgactggataggctccggtcgtatggccatc4200
gatggtctgaaagaagttcaggaagcggtgatgctgatagaagccggactgagtacctac4260
gagaaagagtgcgcaaaacgcggtgacgactatcaggaaatttttgcccagcaggtccgt4320
gaaacgatggagcgccgtgcagccggtcttaaaccgcccgcctgggcggctgcagcattt4380
gaatccgggctgcgacaatcaacagaggaggagaagagtgacagcagagctgcgtaatct4440
cccgcatattgccagcatggcctttaatgagccgctgatgcttgaacccgcctatgcgcg4500
ggttttcttttgtgcgcttgcaggccagcttgggatcagcagcctgacggatgcggtgtc4560
cggcgacagcctgactgcccaggaggcactcgcgacgctggcattatccggtgatgatga4620
cggaccacgacaggcccgcagttatcaggtcatgaacggcatcgccgtgctgccggtgtc4680
cggcacgctggtcagccggacgcgggcgctgcagccgtactcggggatgaccggttacaa4740
cggcattatcgcccgtctgcaacaggctgccagcgatccgatggtggacggcattctgct4800
cgatatggacacgcccggcgggatggtggcgggggcatttgactgcgctgacatcatcgc4860
ccgtgtgcgtgacataaaaccggtatgggcgcttgccaacgacatgaactgcagtgcagg4920
tcagttgcttgccagtgccgcctcccggcgtctggtcacgcagaccgcccggacaggctc4980
catcggcgtcatgatggctcacagtaattacggtgctgcgctggagaaacagggtgtgga5040
aatcacgctgatttacagcggcagccataaggtggatggcaacccctacagccatcttcc5100
ggatgacgtccgggagacactgcagtcccggatggacgcaacccgccagatgtttgcgca5160
gaaggtgtcggcatataccggcctgtccgtgcaggttgtgctggataccgaggctgcagt5220
gtacagcggtcaggaggccattgatgccggactggctgatgaacttgttaacagcaccga5280
tgcgatcaccgtcatgcgtgatgcactggatgcacgtaaatcccgtctctcaggagggcg5340
aatgaccaaagagactcaatcaacaactgtttcagccactgcttcgcaggctgacgttac5400
tgacgtggtgccagcgacggagggcgagaacgccagcgcggcgcagccggacgtgaacgc5460
gcagatcaccgcagcggttgcggcagaaaacagccgcattatggggatcctcaactgtga5520
ggaggctcacggacgcgaagaacaggcacgcgtgctggcagaaacccccggtatgaccgt5580
gaaaacggcccgccgcattctggccgcagcaccacagagtgcacaggcgcgcagtgacac5640
tgcgctggatcgtctgatgcagggggcaccggcaccgctggctgcaggtaacccggcatc5700
tgatgccgttaacgatttgctgaacacaccagtgtaagggatgtttatgacgagcaaaga5760
aacctttacccattaccagccgcagggcaacagtgacccggctcataccgcaaccgcgcc5820
cggcggattgagtgcgaaagcgcctgcaatgaccccgctgatgctggacacctccagccg5880
taagctggttgcgtgggatggcaccaccgacggtgctgccgttggcattcttgcggttgc5940
tgctgaccagaccagcaccacgctgacgttctacaagtccggcacgttccgttatgagga6000
tgtgctctggccggaggctgccagcgacgagacgaaaaaacggaccgcgtttgccggaac6060
ggcaatcagcatcgtttaactttacccttcatcactaaaggccgcctgtgcggctttttt6120
tacgggatttttttatgtcgatgtacacaaccgcccaactgctggcggcaaatgagcaga6180
aatttaagtttgatccgctgtttctgcgtctctttttccgtgagagctatcccttcacca6240
cggagaaagtctatctctcacaaattccgggactggtaaacatggcgctgtacgtttcgc6300
cgattgtttccggtgaggttatccgttcccgtggcggctccacctctgaatttacgccgg6360
gatatgtcaagccgaagcatgaagtgaatccgcagatgaccctgcgtcgcctgccggatg6420
aagatccgcagaatctggcggacccggcttaccgccgccgtcgcatcatcatgcagaaca6480
tgcgtgacgaagagctggccattgctcaggtcgaagagatgcaggcagtttctgccgtgc6540
ttaagggcaaatacaccatgaccggtgaagccttcgatccggttgaggtggatatgggcc6600
gcagtgaggagaataacatcacgcagtccggcggcacggagtggagcaagcgtgacaagt6660
ccacgtatgacccgaccgacgatatcgaagcctacgcgctgaacgccagcggtgtggtga6720
atatcatcgtgttcgatccgaaaggctgggcgctgttccgttccttcaaagccgtcaagg6780
agaagctggatacccgtcgtggctctaattccgagctggagacagcggtgaaagacctgg6840
gcaaagcggtgtcctataaggggatgtatggcgatgtggccatcgtcgtgtattccggac6900
agtacgtggaaaacggcgtcaaaaagaacttcctgccggacaacacgatggtgctgggga6960
acactcaggcacgcggtctgcgcacctatggctgcattcaggatgcggacgcacagcgcg7020
aaggcattaacgcctctgcccgttacccgaaaaactgggtgaccaccggcgatccggcgc7080
gtgagttcaccatgattcagtcagcaccgctgatgctgctggctgaccctgatgagttcg7140
tgtccgtacaactggcgtaatcatggcccttcggggccattgtttctctgtggaggagtc7200
catgacgaaagatgaactgattgcccgtctccgctcgctgggtgaacaactgaaccgtga7260
tgtcagcctgacggggacgaaagaagaactggcgctccgtgtggcagagctgaaagagga7320
gcttgatgacacggatgaaactgccggtcaggacacccctctcagccgggaaaatgtgct7380
gaccggacatgaaaatgaggtgggatcagcgcagccggataccgtgattctggatacgtc7440
tgaactggtcacggtcgtggcactggtgaagctgcatactgatgcacttcacgccacgcg7500
ggatgaacctgtggcatttgtgctgccgggaacggcgtttcgtgtctctgccggtgtggc7560
agccgaaatgacagagcgcggcctggccagaatgcaataacgggaggcgctgtggctgat7620
ttcgataacctgttcgatgctgccattgcccgcgccgatgaaacgatacgcgggtacatg7680
ggaacgtcagccaccattacatccggtgagcagtcaggtgcggtgatacgtggtgttttt7740
gatgaccctgaaaatatcagctatgccggacagggcgtgcgcgttgaaggctccagcccg7800
tccctgtttgtccggactgatgaggtgcggcagctgcggcgtggagacacgctgaccatc7860
ggtgaggaaaatttctgggtagatcgggtttcgccggatgatggcggaagttgtcatctc7920
tggcttggacggggcgtaccgcctgccgttaaccgtcgccgctgaaagggggatgtatgg7980
ccataaaaggtcttgagcaggccgttgaaaacctcagccgtatcagcaaaacggcggtgc8040
ctggtgccgccgcaatggccattaaccgcgttgcttcatccgcgatatcgcagtcggcgt8100
cacaggttgcccgtgagacaaaggtacgccggaaactggtaaaggaaagggccaggctga8160
aaagggccacggtcaaaaatccgcaggccagaatcaaagttaaccggggggatttgcccg8220
taatcaagctgggtaatgcgcgggttgtcctttcgcgccgcaggcgtcgtaaaaaggggc8280
agcgttcatccctgaaaggtggcggcagcgtgcttgtggtgggtaaccgtcgtattcccg8340
gcgcgtttattcagcaactgaaaaatggccggtggcatgtcatgcagcgtgtggctggga8400
aaaaccgttaccccattgatgtggtgaaaatcccgatggcggtgccgctgaccacggcgt8460
ttaaacaaaatattgagcggatacggcgtgaacgtcttccgaaagagctgggctatgcgc8520
tgcagcatcaactgaggatggtaataaagcgatgaaacatactgaactccgtgcagccgt8580
actggatgcactggagaagcatgacaccggggcgacgttttttgatggtcgccccgctgt8640
ttttgatgaggcggattttccggcagttgccgtttatctcaccggcgctgaatacacggg8700
cgaagagctggacagcgatacctggcaggcggagctgcatatcgaagttttcctgcctgc8760
tcaggtgccggattcagagctggatgcgtggatggagtcccggatttatccggtgatgag8820
cgatatcccggcactgtcagatttgatcaccagtatggtggccagcggctatgactaccg8880
gcgcgacgatgatgcgggcttgtggagttcagccgatctgacttatgtcattacctatga8940
aatgtgaggacgctatgcctgtaccaaatcctacaatgccggtgaaaggtgccgggacca9000
ccctgtgggtttataaggggagcggtgacccttacgcgaatccgctttcagacgttgact9060
ggtcgcgtctggcaaaagttaaagacctgacgcccggcgaactgaccgctgagtcctatg9120
acgacagctatctcgatgatgaagatgcagactggactgcgaccgggcaggggcagaaat9180
ctgccggagataccagcttcacgctggcgtggatgcccggagagcaggggcagcaggcgc9240
tgctggcgtggtttaatgaaggcgatacccgtgcctataaaatccgcttcccgaacggca9300
cggtcgatgtgttccgtggctgggtcagcagtatcggtaaggcggtgacggcgaaggaag9360
tgatcacccgcacggtgaaagtcaccaatgtgggacgtccgtcgatggcagaagatcgca9420
gcacggtaacagcggcaaccggcatgaccgtgacgcctgccagcacctcggtggtgaaag9480
ggcagagcaccacgctgaccgtggccttccagccggagggcgtaaccgacaagagctttc9540
gtgcggtgtctgcggataaaacaaaagccaccgtgtcggtcagtggtatgaccatcaccg9600
tgaacggcgttgctgcaggcaaggtcaacattccggttgtatccggtaatggtgagtttg9660
ctgcggttgcagaaattaccgtcaccgccagttaatccggagagtcagcgatgttcctga9720
aaaccgaatcatttgaacataacggtgtgaccgtcacgctttctgaactgtcagccctgc9780
agcgcattgagcatctcgccctgatgaaacggcaggcagaacaggcggagtcagacagca9840
accggaagtttactgtggaagacgccatcagaaccggcgcgtttctggtggcgatgtccc9900
tgtggcataaccatccgcagaagacgcagatgccgtccatgaatgaagccgttaaacaga9960
ttgagcaggaagtgcttaccacctggcccacggaggcaatttctcatgctgaaaacgtgg10020
tgtaccggctgtctggtatgtatgagtttgtggtgaataatgcccctgaacagacagagg10080
acgccgggcccgcagagcctgtttctgcgggaaagtgttcgacggtgagctgagttttgc10140
cctgaaactggcgcgtgagatggggcgacccgactggcgtgccatgcttgccgggatgtc10200
atccacggagtatgccgactggcaccgcttttacagtacccattattttcatgatgttct10260
gctggatatgcacttttccgggctgacgtacaccgtgctcagcctgtttttcagcgatcc10320
ggatatgcatccgctggatttcagtctgctgaaccggcgcgaggctgacgaagagcctga10380
agatgatgtgctgatgcagaaagcggcagggcttgccggaggtgtccgctttggcccgga10440
cgggaatgaagttatccccgcttccccggatgtggcggacatgacggaggatgacgtaat10500
gctgatgacagtatcagaagggatcgcaggaggagtccggtatggctgaaccggtaggcg10560
atctggtcgttgatttgagtctggatgcggccagatttgacgagcagatggccagagtca10620
ggcgtcatttttctggtacggaaagtgatgcgaaaaaaacagcggcagtcgttgaacagt10680
cgctgagccgacaggcgctggctgcacagaaagcggggatttccgtcgggcagtataaag10740
ccgccatgcgtatgctgcctgcacagttcaccgacgtggccacgcagcttgcaggcgggc10800
aaagtccgtggctgatcctgctgcaacagggggggcaggtgaaggactccttcggcggga10860
tgatccccatgttcagggggcttgccggtgcgatcaccctgccgatggtgggggccacct10920
cgctggcggtggcgaccggtgcgctggcgtatgcctggtatcagggcaactcaaccctgt10980
ccgatttcaacaaaacgctggtcctttccggcaatcaggcgggactgacggcagatcgta11040
tgctggtcctgtccagagccgggcaggcggcagggctgacgtttaaccagaccagcgagt11100
cactcagcgcactggttaaggcgggggtaagcggtgaggctcagattgcgtccatcagcc11160
agagtgtggcgcgtttctcctctgcatccggcgtggaggtggacaaggtcgctgaagcct11220
tcgggaagctgaccacagacccgacgtcggggctgacggcgatggctcgccagttccata11280
acgtgtcggcggagcagattgcgtatgttgctcagttgcagcgttccggcgatgaagccg11340
gggcattgcaggcggcgaacgaggccgcaacgaaagggtttgatgaccagacccgccgcc11400
tgaaagagaacatgggcacgctggagacctgggcagacaggactgcgcgggcattcaaat11460
ccatgtgggatgcggtgctggatattggtcgtcctgataccgcgcaggagatgctgatta11520
aggcagaggctgcgtataagaaagcagacgacatctggaatctgcgcaaggatgattatt11580
ttgttaacgatgaagcgcgggcgcgttactgggatgatcgtgaaaaggcccgtcttgcgc11640
ttgaagccgcccgaaagaaggctgagcagcagactcaacaggacaaaaatgcgcagcagc11700
agagcgataccgaagcgtcacggctgaaatataccgaagaggcgcagaaggcttacgaac11760
ggctgcagacgccgctggagaaatataccgcccgtcaggaagaactgaacaaggcactga11820
aagacgggaaaatcctgcaggcggattacaacacgctgatggcggcggcgaaaaaggatt11880
atgaagcgacgctgaaaaagccgaaacagtccagcgtgaaggtgtctgcgggcgatcgtc11940
aggaagacagtgctcatgctgccctgctgacgcttcaggcagaactccggacgctggaga12000
agcatgccggagcaaatgagaaaatcagccagcagcgccgggatttgtggaaggcggaga12060
gtcagttcgcggtactggaggaggcggcgcaacgtcgccagctgtctgcacaggagaaat12120
ccctgctggcgcataaagatgagacgctggagtacaaacgccagctggctgcacttggcg12180
acaaggttacgtatcaggagcgcctgaacgcgctggcgcagcaggcggataaattcgcac12240
agcagcaacgggcaaaacgggccgccattgatgcgaaaagccgggggctgactgaccggc12300
aggcagaacgggaagccacggaacagcgcctgaaggaacagtatggcgataatccgctgg12360
cgctgaataacgtcatgtcagagcagaaaaagacctgggcggctgaagaccagcttcgcg12420
ggaactggatggcaggcctgaagtccggctggagtgagtgggaagagagcgccacggaca12480
gtatgtcgcaggtaaaaagtgcagccacgcagacctttgatggtattgcacagaatatgg12540
cggcgatgctgaccggcagtgagcagaactggcgcagcttcacccgttccgtgctgtcca12600
tgatgacagaaattctgcttaagcaggcaatggtggggattgtcgggagtatcggcagcg12660
ccattggcggggctgttggtggcggcgcatccgcgtcaggcggtacagccattcaggccg12720
ctgcggcgaaattccattttgcaaccggaggatttacgggaaccggcggcaaatatgagc12780
cagcggggattgttcaccgtggtgagtttgtcttcacgaaggaggcaaccagccggattg12840
gcgtggggaatctttaccggctgatgcgcggctatgccaccggcggttatgtcggtacac12900
cgggcagcatggcagacagccggtcgcaggcgtccgggacgtttgagcagaataaccatg12960
tggtgattaacaacgacggcacgaacgggcagataggtccggctgctctgaaggcggtgt13020
atgacatggcccgcaagggtgcccgtgatgaaattcagacacagatgcgtgatggtggcc13080
tgttctccggaggtggacgatgaagaccttccgctggaaagtgaaacccggtatggatgt13140
ggcttcggtcccttctgtaagaaaggtgcgctttggtgatggctattctcagcgagcgcc13200
tgccgggctgaatgccaacctgaaaacgtacagcgtgacgctttctgtcccccgtgagga13260
ggccacggtactggagtcgtttctggaagagcacgggggctggaaatcctttctgtggac13320
gccgccttatgagtggcggcagataaaggtgacctgcgcaaaatggtcgtcgcgggtcag13380
tatgctgcgtgttgagttcagcgcagagtttgaacaggtggtgaactgatgcaggatatc13440
cggcaggaaacactgaatgaatgcacccgtgcggagcagtcggccagcgtggtgctctgg13500
gaaatcgacctgacagaggtcggtggagaacgttattttttctgtaatgagcagaacgaa13560
aaaggtgagccggtcacctggcaggggcgacagtatcagccgtatcccattcaggggagc13620
ggttttgaactgaatggcaaaggcaccagtacgcgccccacgctgacggtttctaacctg13680
tacggtatggtcaccgggatggcggaagatatgcagagtctggtcggcggaacggtggtc13740
cggcgtaaggtttacgcccgttttctggatgcggtgaacttcgtcaacggaaacagttac13800
gccgatccggagcaggaggtgatcagccgctggcgcattgagcagtgcagcgaactgagc13860
gcggtgagtgcctcctttgtactgtccacgccgacggaaacggatggcgctgtttttccg13920
ggacgtatcatgctggccaacacctgcacctggacctatcgcggtgacgagtgcggttat13980
agcggtccggctgtcgcggatgaatatgaccagccaacgtccgatatcacgaaggataaa14040
tgcagcaaatgcctgagcggttgtaagttccgcaataacgtcggcaactttggcggcttc14100
ctttccattaacaaactttcgcagtaaatcccatgacacagacagaatcagcgattctgg14160
cgcacgcccggcgatgtgcgccagcggagtcgtgcggcttcgtggtaagcacgccggagg14220
gggaaagatatttcccctgcgtgaatatctccggtgagccggaggctatttccgtatgtc14280
gccggaagactggctgcaggcagaaatgcagggtgagattgtggcgctggtccacagcca14340
ccccggtggtctgccctggctgagtgaggccgaccggcggctgcaggtgcagagtgattt14400
gccgtggtggctggtctgccgggggacgattcataagttccgctgtgtgccgcatctcac14460
cgggcggcgctttgagcacggtgtgacggactgttacacactgttccgggatgcttatca14520
tctggcggggattgagatgccggactttcatcgtgaggatgactggtggcgtaacggcca14580
gaatctctatctggataatctggaggcgacggggctgtatcaggtgccgttgtcagcggc14640
acagccgggcgatgtgctgctgtgctgttttggttcatcagtgccgaatcacgccgcaat14700
ttactgcggcgacggcgagctgctgcaccatattcctgaacaactgagcaaacgagagag14760
gtacaccgacaaatggcagcgacgcacacactccctctggcgtcaccgggcatggcgcgc14820
atctgcctttacggggatttacaacgatttggtcgccgcatcgaccttcgtgtgaaaacg14880
ggggctgaagccatccgggcactggccacacagctcccggcgtttcgtcagaaactgagc14940
gacggctggtatcaggtacggattgccgggcgggacgtcagcacgtccgggttaacggcg15000
cagttacatgagactctgcctgatggcgctgtaattcatattgttcccagagtcgccggg15060
gccaagtcaggtggcgtattccagattgtcctgggggctgccgccattgccggatcattc15120
tttaccgccggagccacccttgcagcatggggggcagccattggggccggtggtatgacc15180
ggcatcctgttttctctcggtgccagtatggtgctcggtggtgtggcgcagatgctggca15240
ccgaaagccagaactccccgtatacagacaacggataacggtaagcagaacacctatttc15300
tcctcactggataacatggttgcccagggcaatgttctgcctgttctgtacggggaaatg15360
cgcgtggggtcacgcgtggtttctcaggagatcagcacggcagacgaaggggacggtggt15420
caggttgtggtgattggtcgctgatgcaaaatgttttatgtgaaaccgcctgcgggcggt15480
tttgtcatttatggagcgtgaggaatgggtaaaggaagcagtaaggggcataccccgcgc15540
gaagcgaaggacaacctgaagtccacgcagttgctgagtgtgatcgatgccatcagcgaa15600
gggccgattgaaggtccggtggatggcttaaaaagcgtgctgctgaacagtacgccggtg15660
ctggacactgaggggaataccaacatatccggtgtcacggtggtgttccgggctggtgag15720
caggagcagactccgccggagggatttgaatcctccggctccgagacggtgctgggtacg15780
gaagtgaaatatgacacgccgatcacccgcaccattacgtctgcaaacatcgaccgtctg15840
cgctttaccttcggtgtacaggcactggtggaaaccacctcaaagggtgacaggaatccg15900
tcggaagtccgcctgctggttcagatacaacgtaacggtggctgggtgacggaaaaagac15960
atcaccattaagggcaaaaccacctcgcagtatctggcctcggtggtgatgggtaacctg16020
ccgccgcgcccgtttaatatccggatgcgcaggatgacgccggacagcaccacagaccag16080
ctgcagaacaaaacgctctggtcgtcatacactgaaatcatcgatgtgaaacagtgctac16140
ccgaacacggcactggtcggcgtgcaggtggactcggagcagttcggcagccagcaggtg16200
agccgtaattatcatctgcgcgggcgtattctgcaggtgccgtcgaactataacccgcag16260
acgcggcaatacagcggtatctgggacggaacgtttaaaccggcatacagcaacaacatg16320
gcctggtgtctgtgggatatgctgacccatccgcgctacggcatggggaaacgtcttggt16380
gcggcggatgtggataaatgggcgctgtatgtcatcggccagtactgcgaccagtcagtg16440
ccggacggctttggcggcacggagccgcgcatcacctgtaatgcgtacctgaccacacag16500
cgtaaggcgtgggatgtgctcagcgatttctgctcggcgatgcgctgtatgccggtatgg16560
aacgggcagacgctgacgttcgtgcaggaccgaccgtcggataagacgtggacctataac16620
cgcagtaatgtggtgatgccggatgatggcgcgccgttccgctacagcttcagcgccctg16680
aaggaccgccataatgccgttgaggtgaactggattgacccgaacaacggctgggagacg16740
gcgacagagcttgttgaagatacgcaggccattgcccgttacggtcgtaatgttacgaag16800
atggatgcctttggctgtaccagccgggggcaggcacaccgcgccgggctgtggctgatt16860
aaaacagaactgctggaaacgcagaccgtggatttcagcgtcggcgcagaagggcttcgc16920
catgtaccgggcgatgttattgaaatctgcgatgatgactatgccggtatcagcaccggt16980
ggtcgtgtgctggcggtgaacagccagacccggacgctgacgctcgaccgtgaaatcacg17040
ctgccatcctccggtaccgcgctgataagcctggttgacggaagtggcaatccggtcagc17100
gtggaggttcagtccgtcaccgacggcgtgaaggtaaaagtgagccgtgttcctgacggt17160
gttgctgaatacagcgtatgggagctgaagctgccgacgctgcgccagcgactgttccgc17220
tgcgtgagtatccgtgagaacgacgacggcacgtatgccatcaccgccgtgcagcatgtg17280
ccggaaaaagaggccatcgtggataacggggcgcactttgacggcgaacagagtggcacg17340
gtgaatggtgtcacgccgccagcggtgcagcacctgaccgcagaagtcactgcagacagc17400
ggggaatatcaggtgctggcgcgatgggacacaccgaaggtggtgaagggcgtgagtttc17460
ctgctccgtctgaccgtaacagcggacgacggcagtgagcggctggtcagcacggcccgg17520
acgacggaaaccacataccgcttcacgcaactggcgctggggaactacaggctgacagtc17580
cgggcggtaaatgcgtgggggcagcagggcgatccggcgtcggtatcgttccggattgcc17640
gcaccggcagcaccgtcgaggattgagctgacgccgggctattttcagataaccgccacg17700
ccgcatcttgccgtttatgacccgacggtacagtttgagttctggttctcggaaaagcag17760
attgcggatatcagacaggttgaaaccagcacgcgttatcttggtacggcgctgtactgg17820
atagccgccagtatcaatatcaaaccgggccatgattattacttttatatccgcagtgtg17880
aacaccgttggcaaatcggcattcgtggaggccgtcggtcgggcgagcgatgatgcggaa17940
ggttacctggattttttcaaaggcaagataaccgaatcccatctcggcaaggagctgctg18000
gaaaaagtcgagctgacggaggataacgccagcagactggaggagttttcgaaagagtgg18060
aaggatgccagtgataagtggaatgccatgtgggctgtcaaaattgagcagaccaaagac18120
ggcaaacattatgtcgcgggtattggcctcagcatggaggacacggaggaaggcaaactg18180
agccagtttctggttgccgccaatcgtatcgcatttattgacccggcaaacgggaatgaa18240
acgccgatgtttgtggcgcagggcaaccagatattcatgaacgacgtgttcctgaagcgc18300
ctgacggcccccaccattaccagcggcggcaatcctccggccttttccctgacaccggac18360
ggaaagctgaccgctaaaaatgcggatatcagtggcagtgtgaatgcgaactccgggacg18420
ctcagtaatgtgacgatagctgaaaactgtacgataaacggtacgctgagggcggaaaaa18480
atcgtcggggacattgtaaaggcggcgagcgcggcttttccgcgccagcgtgaaagcagt18540
gtggactggccgtcaggtacccgtactgtcaccgtgaccgatgaccatccttttgatcgc18600
cagatagtggtgcttccgctgacgtttcgcggaagtaagcgtactgtcagcggcaggaca18660
acgtattcgatgtgttatctgaaagtactgatgaacggtgcggtgatttatgatggcgcg18720
gcgaacgaggcggtacaggtgttctcccgtattgttgacatgccagcgggtcggggaaac18780
gtgatcctgacgttcacgcttacgtccacacggcattcggcagatattccgccgtatacg18840
tttgccagcgatgtgcaggttatggtgattaagaaacaggcgctgggcatcagcgtggtc18900
tgagtgtgttacagaggttcgtccgggaacgggcgttttattataaaacagtgagaggtg18960
aacgatgcgtaatgtgtgtattgccgttgctgtctttgccgcacttgcggtgacagtcac19020
tccggcccgtgcggaaggtggacatggtacgtttacggtgggctattttcaagtgaaacc19080
gggtacattgccgtcgttgtcgggcggggataccggtgtgagtcatctgaaagggattaa19140
cgtgaagtaccgttatgagctgacggacagtgtgggggtgatggcttccctggggttcgc19200
cgcgtcgaaaaagagcagcacagtgatgaccggggaggatacgtttcactatgagagcct19260
gcgtggacgttatgtgagcgtgatggccggaccggttttacaaatcagtaagcaggtcag19320
tgcgtacgccatggccggagtggctcacagtcggtggtccggcagtacaatggattaccg19380
taagacggaaatcactcccgggtatatgaaagagacgaccactgccagggacgaaagtgc19440
aatgcggcatacctcagtggcgtggagtgcaggtatacagattaatccggcagcgtccgt19500
cgttgttgatattgcttatgaaggctccggcagtggcgactggcgtactgacggattcat19560
cgttggggtcggttataaattctgattagccaggtaacacagtgttatgacagcccgccg19620
gaaccggtgggcttttttgtggggtgaatatggcagtaaagatttcaggagtcctgaaag19680
acggcacaggaaaaccggtacagaactgcaccattcagctgaaagccagacgtaacagca19740
ccacggtggtggtgaacacggtgggctcagagaatccggatgaagccgggcgttacagca19800
tggatgtggagtacggtcagtacagtgtcatcctgcaggttgacggttttccaccatcgc19860
acgccgggaccatcaccgtgtatgaagattcacaaccggggacgctgaatgattttctct19920
gtgccatgacggaggatgatgcccggccggaggtgctgcgtcgtcttgaactgatggtgg19980
aagaggtggcgcgtaacgcgtccgtggtggcacagagtacggcagacgcgaagaaatcag20040
ccggcgatgccagtgcatcagctgctcaggtcgcggcccttgtgactgatgcaactgact20100
cagcacgcgccgccagcacgtccgccggacaggctgcatcgtcagctcaggaagcgtcct20160
ccggcgcagaagcggcatcagcaaaggccactgaagcggaaaaaagtgccgcagccgcag20220
agtcctcaaaaaacgcggcggccaccagtgccggtgcggcgaaaacgtcagaaacgaatg20280
ctgcagcgtcacaacaatcagccgccacgtctgcctccaccgcggccacgaaagcgtcag20340
aggccgccacttcagcacgagatgcggtggcctcaaaagaggcagcaaaatcatcagaaa20400
cgaacgcatcatcaagtgccggtcgtgcagcttcctcggcaacggcggcagaaaattctg20460
ccagggcggcaaaaacgtccgagacgaatgccaggtcatctgaaacagcagcggaacgga20520
gcgcctctgccgcggcagacgcaaaaacagcggcggcggggagtgcgtcaacggcatcca20580
cgaaggcgacagaggctgcgggaagtgcggtatcagcatcgcagagcaaaagtgcggcag20640
aagcggcggcaatacgtgcaaaaaattcggcaaaacgtgcagaagatatagcttcagctg20700
tcgcgcttgaggatgcggacacaacgagaaaggggatagtgcagctcagcagtgcaacca20760
acagcacgtctgaaacgcttgctgcaacgccaaaggcggttaaggtggtaatggatgaaa20820
cgaacagaaaagcccactggacagtccggcactgaccggaacgccaacagcaccaaccgc20880
gctcaggggaacaaacaatacccagattgcgaacaccgcttttgtactggccgcgattgc20940
agatgttatcgacgcgtcacctgacgcactgaatacgctgaatgaactggccgcagcgct21000
cgggaatgatccagattttgctaccaccatgactaacgcgcttgcgggtaaacaaccgaa21060
gaatgcgacactgacggcgctggcagggctttccacggcgaaaaataaattaccgtattt21120
tgcggaaaatgatgccgccagcctgactgaactgactcaggttggcagggatattctggc21180
aaaaaattccgttgcagatgttcttgaataccttggggccggtgagaattcggcctttcc21240
ggcaggtgcgccgatcccgtggccatcagatatcgttccgtctggctacgtcctgatgca21300
ggggcaggcgtttgacaaatcagcctacccaaaacttgctgtcgcgtatccatcgggtgt21360
gcttcctgatatgcgaggctggacaatcaaggggaaacccgccagcggtcgtgctgtatt21420
gtctcaggaacaggatggaattaagtcgcacacccacagtgccagtgcatccggtacgga21480
tttggggacgaaaaccacatcgtcgtttgattacgggacgaaaacaacaggcagtttcga21540
ttacggcaccaaatcgacgaataacacgggggctcatgctcacagtctgagcggttcaac21600
aggggccgcgggtgctcatgcccacacaagtggtttaaggatgaacagttctggctggag21660
tcagtatggaacagcaaccattacaggaagtttatccacagttaaaggaaccagcacaca21720
gggtattgcttatttatcgaaaacggacagtcagggcagccacagtcactcattgtccgg21780
tacagccgtgagtgccggtgcacatgcgcatacagttggtattggtgcgcaccagcatcc21840
ggttgttatcggtgctcatgcccattctttcagtattggttcacacggacacaccatcac21900
cgttaacgctgcgggtaacgcggaaaacaccgtcaaaaacattgcatttaactatattgt21960
gaggcttgcataatggcattcagaatgagtgaacaaccacggaccataaaaatttataat22020
ctgctggccggaactaatgaatttattggtgaaggtgacgcatatattccgcctcatacc22080
ggtctgcctgcaaacagtaccgatattgcaccgccagatattccggctggctttgtggct22140
gttttcaacagtgatgaggcatcgtggcatctcgttgaagaccatcggggtaaaaccgtc22200
tatgacgtggcttccggcgacgcgttatttatttctgaactcggtccgttaccggaaaat22260
tttacctggttatcgccgggaggggaatatcagaagtggaacggcacagcctgggtgaag22320
gatacggaagcagaaaaactgttccggatccgggaggcggaagaaacaaaaaaaagcctg22380
atgcaggtagccagtgagcatattgcgccgcttcaggatgctgcagatctggaaattgca22440
acgaaggaagaaacctcgttgctggaagcctggaagaagtatcgggtgttgctgaaccgt22500
gttgatacatcaactgcacctgatattgagtggcctgctgtccctgttatggagtaatcg22560
ttttgtgatatgccgcagaaacgttgtatgaaataacgttctgcggttagttagtatatt22620
gtaaagctgagtattggtttatttggcgattattatcttcaggagaataatggaagttct22680
atgactcaattgttcatagtgtttacatcaccgccaattgcttttaagactgaacgcatg22740
aaatatggtttttcgtcatgttttgagtctgctgttgatatttctaaagtcggttttttt22800
tcttcgttttctctaactattttccatgaaatacatttttgattattatttgaatcaatt22860
ccaattacctgaagtctttcatctataattggcattgtatgtattggtttattggagtag22920
atgcttgcttttctgagccatagctctgatatccaaatgaagccataggcatttgttatt22980
ttggctctgtcagctgcataacgccaaaaaatatatttatctgcttgatcttcaaatgtt23040
gtattgattaaatcaattggatggaattgtttatcataaaaaattaatgtttgaatgtga23100
taaccgtcctttaaaaaagtcgtttctgcaagcttggctgtatagtcaactaactcttct23160
gtcgaagtgatatttttaggcttatctaccagttttagacgctctttaatatcttcagga23220
attattttattgtcatattgtatcatgctaaatgacaatttgcttatggagtaatctttt23280
aattttaaataagttattctcctggcttcatcaaataaagagtcgaatgatgttggcgaa23340
atcacatcgtcacccattggattgtttatttgtatgccaagagagttacagcagttatac23400
attctgccatagattatagctaaggcatgtaataattcgtaatcttttagcgtattagcg23460
acccatcgtctttctgatttaataatagatgattcagttaaatatgaaggtaatttcttt23520
tgtgcaagtctgactaacttttttataccaatgtttaacatactttcatttgtaataaac23580
tcaatgtcattttcttcaatgtaagatgaaataagagtagcctttgcctcgctatacatt23640
tctaaatcgccttgtttttctatcgtattgcgagaatttttagcccaagccattaatgga23700
tcatttttccatttttcaataacattattgttataccaaatgtcatatcctataatctgg23760
tttttgtttttttgaataataaatgttactgttcttgcggtttggaggaattgattcaaa23820
ttcaagcgaaataattcagggtcaaaatatgtatcaatgcagcatttgagcaagtgcgat23880
aaatctttaagtcttctttcccatggttttttagtcataaaactctccattttgataggt23940
tgcatgctagatgctgatatattttagaggtgataaaattaactgcttaactgtcaatgt24000
aatacaagttgtttgatctttgcaatgattcttatcagaaaccatatagtaaattagtta24060
cacaggaaatttttaatattattattatcattcattatgtattaaaattagagttgtggc24120
ttggctctgctaacacgttgctcataggagatatggtagagccgcagacacgtcgtatgc24180
aggaacgtgctgcggctggctggtgaacttccgatagtgcgggtgttgaatgatttccag24240
ttgctaccgattttacatattttttgcatgagagaatttgtaccacctcccaccgaccat24300
ctatgactgtacgccactgtccctaggactgctatgtgccggagcggacattacaaacgt24360
ccttctcggtgcatgccactgttgccaatgacctgcctaggaattggttagcaagttact24420
accggattttgtaaaaacagccctcctcatataaaaagtattcgttcacttccgataagc24480
gtcgtaattttctatctttcatcatattctagatccctctgaaaaaatcttccgagtttg24540
ctaggcactgatacataactcttttccaataattggggaagtcattcaaatctataatag24600
gtttcagatttgcttcaataaattctgactgtagctgctgaaacgttgcggttgaactat24660
atttccttataacttttacgaaagagtttctttgagtaatcacttcactcaagtgcttcc24720
ctgcctccaaacgatacctgttagcaatatttaatagcttgaaatgatgaagagctctgt24780
gtttgtcttcctgcctccagttcgccgggcattcaacataaaaactgatagcacccggag24840
ttccggaaacgaaatttgcatatacccattgctcacgaaaaaaaatgtccttgtcgatat24900
agggatgaatcgcttggtgtacctcatctactgcgaaaacttgacctttctctcccatat24960
tgcagtcgcggcacgatggaactaaattaataggcatcaccgaaaattcaggataatgtg25020
caataggaagaaaatgatctatattttttgtctgtcctatatcaccacaaaatggacatt25080
tttcacctgatgaaacaagcatgtcatcgtaatatgttctagcgggtttgtttttatctc25140
ggagattattttcataaagcttttctaatttaacctttgtcaggttaccaactactaagg25200
ttgtaggctcaagagggtgtgtcctgtcgtaggtaaataactgacctgtcgagcttaata25260
ttctatattgttgttctttctgcaaaaaagtggggaagtgagtaatgaaattatttctaa25320
catttatctgcatcataccttccgagcatttattaagcatttcgctataagttctcgctg25380
gaagaggtagttttttcattgtactttaccttcatctctgttcattatcatcgcttttaa25440
aacggttcgaccttctaatcctatctgaccattataattttttagaatggtttcataaga25500
aagctctgaatcaacggactgcgataataagtggtggtatccagaatttgtcacttcaag25560
taaaaacacctcacgagttaaaacacctaagttctcaccgaatgtctcaatatccggacg25620
gataatatttattgcttctcttgaccgtaggactttccacatgcaggattttggaacctc25680
ttgcagtactactggggaatgagttgcaattattgctacaccattgcgtgcatcgagtaa25740
gtcgcttaatgttcgtaaaaaagcagagagcaaaggtggatgcagatgaacctctggttc25800
atcgaataaaactaatgacttttcgccaacgacatctactaatcttgtgatagtaaataa25860
aacaattgcatgtccagagctcattcgaagcagatatttctggatattgtcataaaacaa25920
tttagtgaatttatcatcgtccacttgaatctgtggttcattacgtcttaactcttcata25980
tttagaaatgaggctgatgagttccatatttgaaaagttttcatcactacttagtttttt26040
gatagcttcaagccagagttgtctttttctatctactctcatacaaccaataaatgctga26100
aatgaattctaagcggagatcgcctagtgattttaaactattgctggcagcattcttgag26160
tccaatataaaagtattgtgtaccttttgctgggtcaggttgttctttaggaggagtaaa26220
aggatcaaatgcactaaacgaaactgaaacaagcgatcgaaaatatccctttgggattct26280
tgactcgataagtctattattttcagagaaaaaatattcattgttttctgggttggtgat26340
tgcaccaatcattccattcaaaattgttgttttaccacacccattccgcccgataaaagc26400
atgaatgttcgtgctgggcatagaattaaccgtcacctcaaaaggtatagttaaatcact26460
gaatccgggagcactttttctattaaatgaaaagtggaaatctgacaattctggcaaacc26520
atttaacacacgtgcgaactgtccatgaatttctgaaagagttacccctctaagtaatga26580
ggtgttaaggacgctttcattttcaatgtcggctaatcgatttggccatactactaaatc26640
ctgaatagctttaagaaggttatgtttaaaaccatcgcttaatttgctgagattaacata26700
gtagtcaatgctttcacctaaggaaaaaaacatttcagggagttgactgaattttttatc26760
tattaatgaataagtgcttacttcttctttttgacctacaaaaccaattttaacatttcc26820
gatatcgcatttttcaccatgctcatcaaagacagtaagataaaacattgtaacaaagga26880
atagtcattccaaccatctgctcgtaggaatgccttatttttttctactgcaggaatata26940
cccgcctctttcaataacactaaactccaacatatagtaacccttaattttattaaaata27000
accgcaatttatttggcggcaacacaggatctctcttttaagttactctctattacatac27060
gttttccatctaaaaattagtagtattgaacttaacggggcatcgtattgtagttttcca27120
tatttagctttctgcttccttttggataacccactgttattcatgttgcatggtgcactg27180
tttataccaacgatatagtctattaatgcatatatagtatcgccgaacgattagctcttc27240
aggcttctgaagaagcgtttcaagtactaataagccgatagatagccacggacttcgtag27300
ccatttttcataagtgttaacttccgctcctcgctcataacagacattcactacagttat27360
ggcggaaaggtatgcatgctgggtgtggggaagtcgtgaaagaaaagaagtcagctgcgt27420
cgtttgacatcactgctatcttcttactggttatgcaggtcgtagtgggtggcacacaaa27480
gctttgcactggattgcgaggctttgtgcttctctggagtgcgacaggtttgatgacaaa27540
aaattagcgcaagaagacaaaaatcaccttgcgctaatgctctgttacaggtcactaata27600
ccatctaagtagttgattcatagtgactgcatatgttgtgttttacagtattatgtagtc27660
tgttttttatgcaaaatctaatttaatatattgatatttatatcattttacgtttctcgt27720
tcagcttttttatactaagttggcattataaaaaagcattgcttatcaatttgttgcaac27780
gaacaggtcactatcagtcaaaataaaatcattatttgatttcaattttgtcccactccc27840
tgcctctgtcatcacgatactgtgatgccatggtgtccgacttatgcccgagaagatgtt27900
gagcaaacttatcgcttatctgcttctcatagagtcttgcagacaaactgcgcaactcgt27960
gaaaggtaggcggatccccttcgaaggaaagacctgatgcttttcgtgcgcgcataaaat28020
accttgatactgtgccggatgaaagcggttcgcgacgagtagatgcaattatggtttctc28080
cgccaagaatctctttgcatttatcaagtgtttccttcattgatattccgagagcatcaa28140
tatgcaatgctgttgggatggcaatttttacgcctgttttgctttgctcgacataaagat28200
atccatctacgatatcagaccacttcatttcgcataaatcaccaactcgttgcccggtaa28260
caacagccagttccattgcaagtctgagccaacatggtgatgattctgctgcttgataaa28320
ttttcaggtattcgtcagccgtaagtcttgatctccttacctctgattttgctgcgcgag28380
tggcagcgacatggtttgttgttatatggccttcagctattgcctctcggaatgcatcgc28440
tcagtgttgatctgattaacttggctgacgccgccttgccctcgtctatgtatccattga28500
gcattgccgcaatttcttttgtggtgatgtcttcaagtggagcatcaggcagacccctcc28560
ttattgctttaattttgctcatgtaatttatgagtgtcttctgcttgattcctctgctgg28620
ccaggattttttcgtagcgatcaagccatgaatgtaacgtaacggaattatcactgttga28680
ttctcgctgtcagaggcttgtgtttgtgtcctgaaaataactcaatgttggcctgtatag28740
cttcagtgattgcgattcgcctgtctctgcctaatccaaactctttacccgtccttgggt28800
ccctgtagcagtaatatccattgtttcttatataaaggttagggggtaaatcccggcgct28860
catgacttcgccttcttcccatttctgatcctcttcaaaaggccacctgttactggtcga28920
tttaagtcaacctttaccgctgattcgtggaacagatactctcttccatccttaaccgga28980
ggtgggaatatcctgcattcccgaacccatcgacgaactgtttcaaggcttcttggacgt29040
cgctggcgtgcgttccactcctgaagtgtcaagtacatcgcaaagtctccgcaattacac29100
gcaagaaaaaaccgccatcaggcggcttggtgttctttcagttcttcaattcgaatattg29160
gttacgtctgcatgtgctatctgcgcccatatcatccagtggtcgtagcagtcgttgatg29220
ttctccgcttcgataactctgttgaatggctctccattccattctcctgtgactcggaag29280
tgcatttatcatctccataaaacaaaacccgccgtagcgagttcagataaaataaatccc29340
cgcgagtgcgaggattgttatgtaatattgggtttaatcatctatatgttttgtacagag29400
agggcaagtatcgtttccaccgtactcgtgataataattttgcacggtatcagtcatttc29460
tcgcacattgcagaatggggatttgtcttcattagacttataaaccttcatggaatattt29520
gtatgccgactctatatctataccttcatctacataaacaccttcgtgatgtctgcatgg29580
agacaagacaccggatctgcacaacattgataacgcccaatctttttgctcagactctaa29640
ctcattgatactcatttataaactccttgcaatgtatgtcgtttcagctaaacggtatca29700
gcaatgtttatgtaaagaaacagtaagataatactcaacccgatgtttgagtacggtcat29760
catctgacactacagactctggcatcgctgtgaagacgacgcgaaattcagcattttcac29820
aagcgttatcttttacaaaaccgatctcactctcctttgatgcgaatgccagcgtcagac29880
atcatatgcagatactcacctgcatcctgaacccattgacctccaaccccgtaatagcga29940
tgcgtaatgatgtcgatagttactaacgggtcttgttcgattaactgccgcagaaactct30000
tccaggtcaccagtgcagtgcttgataacaggagtcttcccaggatggcgaacaacaaga30060
aactggtttccgtcttcacggacttcgttgctttccagtttagcaatacgcttactccca30120
tccgagataacaccttcgtaatactcacgctgctcgttgagttttgattttgctgtttca30180
agctcaacacgcagtttccctactgttagcgcaatatcctcgttctcctggtcgcggcgt30240
ttgatgtattgctggtttctttcccgttcatccagcagttccagcacaatcgatggtgtt30300
accaattcatggaaaaggtctgcgtcaaatccccagtcgtcatgcattgcctgctctgcc30360
gcttcacgcagtgcctgagagttaatttcgctcacttcgaacctctctgtttactgataa30420
gttccagatcctcctggcaacttgcacaagtccgacaaccctgaacgaccaggcgtcttc30480
gttcatctatcggatcgccacactcacaacaatgagtggcagatatagcctggtggttca30540
ggcggcgcatttttattgctgtgttgcgctgtaattcttctatttctgatgctgaatcaa30600
tgatgtctgccatctttcattaatccctgaactgttggttaatacgcttgagggtgaatg30660
cgaataataaaaaaggagcctgtagctccctgatgattttgcttttcatgttcatcgttc30720
cttaaagacgccgtttaacatgccgattgccaggcttaaatgagtcggtgtgaatcccat30780
cagcgttaccgtttcgcggtgcttcttcagtacgctacggcaaatgtcatcgacgttttt30840
atccggaaactgctgtctggctttttttgatttcagaattagcctgacgggcaatgctgc30900
gaagggcgttttcctgctgaggtgtcattgaacaagtcccatgtcggcaagcataagcac30960
acagaatatgaagcccgctgccagaaaaatgcattccgtggttgtcatacctggtttctc31020
tcatctgcttctgctttcgccaccatcatttccagcttttgtgaaagggatgcggctaac31080
gtatgaaattcttcgtctgtttctactggtattggcacaaacctgattccaatttgagca31140
aggctatgtgccatctcgatactcgttcttaactcaacagaagatgctttgtgcatacag31200
cccctcgtttattatttatctcctcagccagccgctgtgctttcagtggatttcggataa31260
cagaaaggccgggaaatacccagcctcgctttgtaacggagtagacgaaagtgattgcgc31320
ctacccggatattatcgtgaggatgcgtcatcgccattgctccccaaatacaaaaccaat31380
ttcagccagtgcctcgtccattttttcgatgaactccggcacgatctcgtcaaaactcgc31440
catgtacttttcatcccgctcaatcacgacataatgcaggccttcacgcttcatacgcgg31500
gtcatagttggcaaagtaccaggcattttttcgcgtcacccacatgctgtactgcacctg31560
ggccatgtaagctgactttatggcctcgaaaccaccgagccggaacttcatgaaatcccg31620
ggaggtaaacgggcatttcagttcaaggccgttgccgtcactgcataaaccatcgggaga31680
gcaggcggtacgcatactttcgtcgcgatagatgatcggggattcagtaacattcacgcc31740
ggaagtgaattcaaacagggttctggcgtcgttctcgtactgttttccccaggccagtgc31800
tttagcgttaacttccggagccacaccggtgcaaacctcagcaagcagggtgtggaagta31860
ggacattttcatgtcaggccacttctttccggagcggggttttgctatcacgttgtgaac31920
ttctgaagcggtgatgacgccgagccgtaatttgtgccacgcatcatccccctgttcgac31980
agctctcacatcgatcccggtacgctgcaggataatgtccggtgtcatgctgccaccttc32040
tgctctgcggctttctgtttcaggaatccaagagcttttactgcttcggcctgtgtcagt32100
tctgacgatgcacgaatgtcgcggcgaaatatctgggaacagagcggcaataagtcgtca32160
tcccatgttttatccagggcgatcagcagagtgttaatctcctgcatggtttcatcgtta32220
accggagtgatgtcgcgttccggctgacgttctgcagtgtatgcagtattttcgacaatg32280
cgctcggcttcatccttgtcatagataccagcaaatccgaaggccagacgggcacactga32340
atcatggctttatgacgtaacatccgtttgggatgcgactgccacggccccgtgatttct32400
ctgccttcgcgagttttgaatggttcgcggcggcattcatccatccattcggtaacgcag32460
atcggatgattacggtccttgcggtaaatccggcatgtacaggattcattgtcctgctca32520
aagtccatgccatcaaactgctggttttcattgatgatgcgggaccagccatcaacgccc32580
accaccggaacgatgccattctgcttatcaggaaaggcgtaaatttctttcgtccacgga32640
ttaaggccgtactggttggcaacgatcagtaatgcgatgaactgcgcatcgctggcatca32700
cctttaaatgccgtctggcgaagagtggtgatcagttcctgtgggtcgacagaatccatg32760
ccgacacgttcagccagcttcccagccagcgttgcgagtgcagtactcattcgttttata32820
cctctgaatcaatatcaacctggtggtgagcaatggtttcaaccatgtaccggatgtgtt32880
ctgccatgcgctcctgaaactcaacatcgtcatcaaacgcacgggtaatggattttttgc32940
tggccccgtggcgttgcaaatgatcgatgcatagcgattcaaacaggtgctggggcaggc33000
ctttttccatgtcgtctgccagttctgcctctttctcttcacgggcgagctgctggtagt33060
gacgcgcccagctctgagcctcaagacgatcctgaatgtaataagcgttcatggctgaac33120
tcctgaaatagctgtgaaaatatcgcccgcgaaatgccgggctgattaggaaaacaggaa33180
agggggttagtgaatgcttttgcttgatctcagtttcagtattaatatccattttttata33240
agcgtcgacggcttcacgaaacatcttttcatcgccaataaaagtggcgatagtgaattt33300
agtctggatagccataagtgtttgatccattctttgggactcctggctgattaagtatgt33360
cgataaggcgtttccatccgtcacgtaatttacgggtgattcgttcaagtaaagattcgg33420
aagggcagccagcaacaggccaccctgcaatggcatattgcatggtgtgctccttattta33480
tacataacgaaaaacgcctcgagtgaagcgttattggtatgcggtaaaaccgcactcagg33540
cggccttgatagtcatatcatctgaatcaaatattcctgatgtatcgatatcggtaattc33600
ttattccttcgctaccatccattggaggccatccttcctgaccatttccatcattccagt33660
cgaactcacacacaacaccatatgcatttaagtcgcttgaaattgctataagcagagcat33720
gttgcgccagcatgattaatacagcatttaatacagagccgtgtttattgagtcggtatt33780
cagagtctgaccagaaattattaatctggtgaagtttttcctctgtcattacgtcatggt33840
cgatttcaatttctattgatgctttccagtcgtaatcaatgatgtattttttgatgtttg33900
acatctgttcatatcctcacagataaaaaatcgccctcacactggagggcaaagaagatt33960
tccaataatcagaacaagtcggctcctgtttagttacgagcgacattgctccgtgtattc34020
actcgttggaatgaatacacagtgcagtgtttattctgttatttatgccaaaaataaagg34080
ccactatcaggcagctttgttgttctgtttaccaagttctctggcaatcattgccgtcgt34140
tcgtattgcccatttatcgacatatttcccatcttccattacaggaaacatttcttcagg34200
cttaaccatgcattccgattgcagcttgcatccattgcatcgcttgaattgtccacacca34260
ttgatttttatcaatagtcgtagtcatacggatagtcctggtattgttccatcacatcct34320
gaggatgctcttcgaactcttcaaattcttcttccatatatcaccttaaatagtggattg34380
cggtagtaaagattgtgcctgtcttttaaccacatcaggctcggtggttctcgtgtaccc34440
ctacagcgagaaatcggataaactattacaacccctacagtttgatgagtatagaaatgg34500
atccactcgttattctcggacgagtgttcagtaatgaacctctggagagaaccatgtata34560
tgatcgttatctgggttggacttctgcttttaagcccagataactggcctgaatatgtta34620
atgagagaatcggtattcctcatgtgtggcatgttttcgtctttgctcttgcattttcgc34680
tagcaattaatgtgcatcgattatcagctattgccagcgccagatataagcgatttaagc34740
taagaaaacgcattaagatgcaaaacgataaagtgcgatcagtaattcaaaaccttacag34800
aagagcaatctatggttttgtgcgcagcccttaatgaaggcaggaagtatgtggttacat34860
caaaacaattcccatacattagtgagttgattgagcttggtgtgttgaacaaaacttttt34920
cccgatggaatggaaagcatatattattccctattgaggatatttactggactgaattag34980
ttgccagctatgatccatataatattgagataaagccaaggccaatatctaagtaactag35040
ataagaggaatcgattttcccttaattttctggcgtccactgcatgttatgccgcgttcg35100
ccaggcttgctgtaccatgtgcgctgattcttgcgctcaatacgttgcaggttgctttca35160
atctgtttgtggtattcagccagcactgtaaggtctatcggatttagtgcgctttctact35220
cgtgatttcggtttgcgattcagcgagagaatagggcggttaactggttttgcgcttacc35280
ccaaccaacaggggatttgctgctttccattgagcctgtttctctgcgcgacgttcgcgg35340
cggcgtgtttgtgcatccatctggattctcctgtcagttagctttggtggtgtgtggcag35400
ttgtagtcctgaacgaaaaccccccgcgattggcacattggcagctaatccggaatcgca35460
cttacggccaatgcttcgtttcgtatcacacaccccaaagccttctgctttgaatgctgc35520
ccttcttcagggcttaatttttaagagcgtcaccttcatggtggtcagtgcgtcctgctg35580
atgtgctcagtatcaccgccagtggtatttatgtcaacaccgccagagataatttatcac35640
cgcagatggttatctgtatgttttttatatgaatttattttttgcaggggggcattgttt35700
ggtaggtgagagatctgaattgctatgtttagtgagttgtatctatttatttttcaataa35760
atacaattggttatgtgttttgggggcgatcgtgaggcaaagaaaacccggcgctgaggc35820
cgggttattcttgttctctggtcaaattatatagttggaaaacaaggatgcatatatgaa35880
tgaacgatgcagaggcaatgccgatggcgatagtgggtatcatgtagccgcttatgctgg35940
aaagaagcaataacccgcagaaaaacaaagctccaagctcaacaaaactaagggcataga36000
caataactaccgatgtcatatacccatactctctaatcttggccagtcggcgcgttctgc36060
ttccgattagaaacgtcaaggcagcaatcaggattgcaatcatggttcctgcatatgatg36120
acaatgtcgccccaagaccatctctatgagctgaaaaagaaacaccaggaatgtagtggc36180
ggaaaaggagatagcaaatgcttacgataacgtaaggaattattactatgtaaacaccag36240
gcatgattctgttccgcataattactcctgataattaatccttaactttgcccacctgcc36300
ttttaaaacattccagtatatcacttttcattcttgcgtagcaatatgccatctcttcag36360
ctatctcagcattggtgaccttgttcagaggcgctgagagatggcctttttctgatagat36420
aatgttctgttaaaatatctccggcctcatcttttgcccgcaggctaatgtctgaaaatt36480
gaggtgacgggttaaaaataatatccttggcaaccttttttatatcccttttaaattttg36540
gcttaatgactatatccaatgagtcaaaaagctccccttcaatatctgttgcccctaaga36600
cctttaatatatcgccaaatacaggtagcttggcttctaccttcaccgttgttcggccga36660
tgaaatgcatatgcataacatcgtctttggtggttcccctcatcagtggctctatctgaa36720
cgcgctctccactgcttaatgacattcctttcccgattaaaaaatctgtcagatcggatg36780
tggtcggcccgaaaacagttctggcaaaaccaatggtgtcgccttcaacaaacaaaaaag36840
atgggaatcccaatgattcgtcatctgcgaggctgttcttaatatcttcaactgaagctt36900
tagagcgatttatcttctgaaccagactcttgtcatttgttttggtaaagagaaaagttt36960
ttccatcgattttatgaatatacaaataattggagccaacctgcaggtgatgattatcag37020
ccagcagagaattaaggaaaacagacaggtttattgagcgcttatctttccctttatttt37080
tgctgcggtaagtcgcataaaaaccattcttcataattcaatccatttactatgttatgt37140
tctgaggggagtgaaaattcccctaattcgatgaagattcttgctcaattgttatcagct37200
atgcgccgaccagaacaccttgccgatcagccaaacgtctcttcaggccactgactagcg37260
ataactttccccacaacggaacaactctcattgcatgggatcattgggtactgtgggttt37320
agtggttgtaaaaacacctgaccgctatccctgatcagtttcttgaaggtaaactcatca37380
cccccaagtctggctatgcagaaatcacctggctcaacagcctgctcagggtcaacgaga37440
attaacattccgtcaggaaagcttggcttggagcctgttggtgcggtcatggaattacct37500
tcaacctcaagccagaatgcagaatcactggcttttttggttgtgcttacccatctctcc37560
gcatcacctttggtaaaggttctaagctcaggtgagaacatccctgcctgaacatgagaa37620
aaaacagggtactcatactcacttctaagtgacggctgcatactaaccgcttcatacatc37680
tcgtagatttctctggcgattgaagggctaaattcttcaacgctaactttgagaattttt37740
gcaagcaatgcggcgttataagcatttaatgcattgatgccattaaataaagcaccaacg37800
cctgactgccccatccccatcttgtctgcgacagattcctgggataagccaagttcattt37860
ttctttttttcataaattgctttaaggcgacgtgcgtcctcaagctgctcttgtgttaat37920
ggtttcttttttgtgctcatacgttaaatctatcaccgcaagggataaatatctaacacc37980
gtgcgtgttgactattttacctctggcggtgataatggttgcatgtactaaggaggttgt38040
atggaacaacgcataaccctgaaagattatgcaatgcgctttgggcaaaccaagacagct38100
aaagatctcggcgtatatcaaagcgcgatcaacaaggccattcatgcaggccgaaagatt38160
tttttaactataaacgctgatggaagcgtttatgcggaagaggtaaagcccttcccgagt38220
aacaaaaaaacaacagcataaataaccccgctcttacacattccagccctgaaaaagggc38280
atcaaattaaaccacacctatggtgtatgcatttatttgcatacattcaatcaattgtta38340
tctaaggaaatacttacatatggttcgtgcaaacaaacgcaacgaggctctacgaatcga38400
gagtgcgttgcttaacaaaatcgcaatgcttggaactgagaagacagcggaagctgtggg38460
cgttgataagtcgcagatcagcaggtggaagagggactggattccaaagttctcaatgct38520
gcttgctgttcttgaatggggggtcgttgacgacgacatggctcgattggcgcgacaagt38580
tgctgcgattctcaccaataaaaaacgcccggcggcaaccgagcgttctgaacaaatcca38640
gatggagttctgaggtcattactggatctatcaacaggagtcattatgacaaatacagca38700
aaaatactcaacttcggcagaggtaactttgccggacaggagcgtaatgtggcagatctc38760
gatgatggttacgccagactatcaaatatgctgcttgaggcttattcgggcgcagatctg38820
accaagcgacagtttaaagtgctgcttgccattctgcgtaaaacctatgggtggaataaa38880
ccaatggacagaatcaccgattctcaacttagcgagattacaaagttacctgtcaaacgg38940
tgcaatgaagccaagttagaactcgtcagaatgaatattatcaagcagcaaggcggcatg39000
tttggaccaaataaaaacatctcagaatggtgcatccctcaaaacgagggaaaatcccct39060
aaaacgagggataaaacatccctcaaattgggggattgctatccctcaaaacagggggac39120
acaaaagacactattacaaaagaaaaaagaaaagattattcgtcagagaattctggcgaa39180
tcctctgaccagccagaaaacgacctttctgtggtgaaaccggatgctgcaattcagagc39240
ggcagcaagtgggggacagcagaagacctgaccgccgcagagtggatgtttgacatggtg39300
aagactatcgcaccatcagccagaaaaccgaattttgctgggtgggctaacgatatccgc39360
ctgatgcgtgaacgtgacggacgtaaccaccgcgacatgtgtgtgctgttccgctgggca39420
tgccaggacaacttctggtccggtaacgtgctgagcccggccaaactccgcgataagtgg39480
acccaactcgaaatcaaccgtaacaagcaacaggcaggcgtgacagccagcaaaccaaaa39540
ctcgacctgacaaacacagactggatttacggggtggatctatgaaaaacatcgccgcac39600
agatggttaactttgaccgtgagcagatgcgtcggatcgccaacaacatgccggaacagt39660
acgacgaaaagccgcaggtacagcaggtagcgcagatcatcaacggtgtgttcagccagt39720
tactggcaactttcccggcgagcctggctaaccgtgaccagaacgaagtgaacgaaatcc39780
gtcgccagtgggttctggcttttcgggaaaacgggatcaccacgatggaacaggttaacg39840
caggaatgcgcgtagcccgtcggcagaatcgaccatttctgccatcacccgggcagtttg39900
ttgcatggtgccgggaagaagcatccgttaccgccggactgccaaacgtcagcgagctgg39960
ttgatatggtttacgagtattgccggaagcgaggcctgtatccggatgcggagtcttatc40020
cgtggaaatcaaacgcgcactactggctggttaccaacctgtatcagaacatgcgggcca40080
atgcgcttactgatgcggaattacgccgtaaggccgcagatgagcttgtccatatgactg40140
cgagaattaaccgtggtgaggcgatccctgaaccagtaaaacaacttcctgtcatgggcg40200
gtagacctctaaatcgtgcacaggctctggcgaagatcgcagaaatcaaagctaagttcg40260
gactgaaaggagcaagtgtatgacgggcaaagaggcaattattcattacctggggacgca40320
taatagcttctgtgcgccggacgttgccgcgctaacaggcgcaacagtaaccagcataaa40380
tcaggccgcggctaaaatggcacgggcaggtcttctggttatcgaaggtaaggtctggcg40440
aacggtgtattaccggtttgctaccagggaagaacgggaaggaaagatgagcacgaacct40500
ggtttttaaggagtgtcgccagagtgccgcgatgaaacgggtattggcggtatatggagt40560
taaaagatgaccatctacattactgagctaataacaggcctgctggtaatcgcaggcctt40620
tttatttgggggagagggaagtcatgaaaaaactaacctttgaaattcgatctccagcac40680
atcagcaaaacgctattcacgcagtacagcaaatccttccagacccaaccaaaccaatcg40740
tagtaaccattcaggaacgcaaccgcagcttagaccaaaacaggaagctatgggcctgct40800
taggtgacgtctctcgtcaggttgaatggcatggtcgctggctggatgcagaaagctgga40860
agtgtgtgtttaccgcagcattaaagcagcaggatgttgttcctaaccttgccgggaatg40920
gctttgtggtaataggccagtcaaccagcaggatgcgtgtaggcgaatttgcggagctat40980
tagagcttatacaggcattcggtacagagcgtggcgttaagtggtcagacgaagcgagac41040
tggctctggagtggaaagcgagatggggagacagggctgcatgataaatgtcgttagttt41100
ctccggtggcaggacgtcagcatatttgctctggctaatggagcaaaagcgacgggcagg41160
taaagacgtgcattacgttttcatggatacaggttgtgaacatccaatgacatatcggtt41220
tgtcagggaagttgtgaagttctgggatataccgctcaccgtattgcaggttgatatcaa41280
cccggagcttggacagccaaatggttatacggtatgggaaccaaaggatattcagacgcg41340
aatgcctgttctgaagccatttatcgatatggtaaagaaatatggcactccatacgtcgg41400
cggcgcgttctgcactgacagattaaaactcgttcccttcaccaaatactgtgatgacca41460
tttcgggcgagggaattacaccacgtggattggcatcagagctgatgaaccgaagcggct41520
aaagccaaagcctggaatcagatatcttgctgaactgtcagactttgagaaggaagatat41580
cctcgcatggtggaagcaacaaccattcgatttgcaaataccggaacatctcggtaactg41640
catattctgcattaaaaaatcaacgcaaaaaatcggacttgcctgcaaagatgaggaggg41700
attgcagcgtgtttttaatgaggtcatcacgggatcccatgtgcgtgacggacatcggga41760
aacgccaaaggagattatgtaccgaggaagaatgtcgctggacggtatcgcgaaaatgta41820
ttcagaaaatgattatcaagccctgtatcaggacatggtacgagctaaaagattcgatac41880
cggctcttgttctgagtcatgcgaaatatttggagggcagcttgatttcgacttcgggag41940
ggaagctgcatgatgcgatgttatcggtgcggtgaatgcaaagaagataaccgcttccga42000
ccaaatcaaccttactggaatcgatggtgtctccggtgtgaaagaacaccaacaggggtg42060
ttaccactaccgcaggaaaaggaggacgtgtggcgagacagcgacgaagtatcaccgaca42120
taatctgcgaaaactgcaaataccttccaacgaaacgcaccagaaataaacccaagccaa42180
tcccaaaagaatctgacgtaaaaaccttcaactacacggctcacctgtgggatatccggt42240
ggctaagacgtcgtgcgaggaaaacaaggtgattgaccaaaatcgaagttacgaacaaga42300
aagcgtcgagcgagctttaacgtgcgctaactgcggtcagaagctgcatgtgctggaagt42360
tcacgtgtgtgagcactgctgcgcagaactgatgagcgatccgaatagctcgatgcacga42420
ggaagaagatgatggctaaaccagcgcgaagacgatgtaaaaacgatgaatgccgggaat42480
ggtttcaccctgcattcgctaatcagtggtggtgctctccagagtgtggaaccaagatag42540
cactcgaacgacgaagtaaagaacgcgaaaaagcggaaaaagcagcagagaagaaacgac42600
gacgagaggagcagaaacagaaagataaacttaagattcgaaaactcgccttaaagcccc42660
gcagttactggattaaacaagcccaacaagccgtaaacgccttcatcagagaaagagacc42720
gcgacttaccatgtatctcgtgcggaacgctcacgtctgctcagtgggatgccggacatt42780
accggacaactgctgcggcacctcaactccgatttaatgaacgcaatattcacaagcaat42840
gcgtggtgtgcaaccagcacaaaagcggaaatctcgttccgtatcgcgtcgaactgatta42900
gccgcatcgggcaggaagcagtagacgaaatcgaatcaaaccataaccgccatcgctgga42960
ctatcgaagagtgcaaggcgatcaaggcagagtaccaacagaaactcaaagacctgcgaa43020
atagcagaagtgaggccgcatgacgttctcagtaaaaaccattccagacatgctcgttga43080
agcatacggaaatcagacagaagtagcacgcagactgaaatgtagtcgcggtacggtcag43140
aaaatacgttgatgataaagacgggaaaatgcacgccatcgtcaacgacgttctcatggt43200
tcatcgcggatggagtgaaagagatgcgctattacgaaaaaattgatggcagcaaatacc43260
gaaatatttgggtagttggcgatctgcacggatgctacacgaacctgatgaacaaactgg43320
atacgattggattcgacaacaaaaaagacctgcttatctcggtgggcgatttggttgatc43380
gtggtgcagagaacgttgaatgcctggaattaatcacattcccctggttcagagctgtac43440
gtggaaaccatgagcaaatgatgattgatggcttatcagagcgtggaaacgttaatcact43500
ggctgcttaatggcggtggctggttctttaatctcgattacgacaaagaaattctggcta43560
aagctcttgcccataaagcagatgaacttccgttaatcatcgaactggtgagcaaagata43620
aaaaatatgttatctgccacgccgattatccctttgacgaatacgagtttggaaagccag43680
ttgatcatcagcaggtaatctggaaccgcgaacgaatcagcaactcacaaaacgggatcg43740
tgaaagaaatcaaaggcgcggacacgttcatctttggtcatacgccagcagtgaaaccac43800
tcaagtttgccaaccaaatgtatatcgataccggcgcagtgttctgcggaaacctaacat43860
tgattcaggtacagggagaaggcgcatgagactcgaaagcgtagctaaatttcattcgcc43920
aaaaagcccgatgatgagcgactcaccacgggccacggcttctgactctctttccggtac43980
tgatgtgatggctgctatggggatggcgcaatcacaagccggattcggtatggctgcatt44040
ctgcggtaagcacgaactcagccagaacgacaaacaaaaggctatcaactatctgatgca44100
atttgcacacaaggtatcggggaaataccgtggtgtggcaaagcttgaaggaaatactaa44160
ggcaaaggtactgcaagtgctcgcaacattcgcttatgcggattattgccgtagtgccgc44220
gacgccgggggcaagatgcagagattgccatggtacaggccgtgcggttgatattgccaa44280
aacagagctgtgggggagagttgtcgagaaagagtgcggaagatgcaaaggcgtcggcta44340
ttcaaggatgccagcaagcgcagcatatcgcgctgtgacgatgctaatcccaaaccttac44400
ccaacccacctggtcacgcactgttaagccgctgtatgacgctctggtggtgcaatgcca44460
caaagaagagtcaatcgcagacaacattttgaatgcggtcacacgttagcagcatgattg44520
ccacggatggcaacatattaacggcatgatattgacttattgaataaaattgggtaaatt44580
tgactcaacgatgggttaattcgctcgttgtggtagtgagatgaaaagaggcggcgctta44640
ctaccgattccgcctagttggtcacttcgacgtatcgtctggaactccaaccatcgcagg44700
cagagaggtctgcaaaatgcaatcccgaaacagttcgcaggtaatagttagagcctgcat44760
aacggtttcgggattttttatatctgcacaacaggtaagagcattgagtcgataatcgtg44820
aagagtcggcgagcctggttagccagtgctctttccgttgtgctgaattaagcgaatacc44880
ggaagcagaaccggatcaccaaatgcgtacaggcgtcatcgccgcccagcaacagcacaa44940
cccaaactgagccgtagccactgtctgtcctgaattcattagtaatagttacgctgcggc45000
cttttacacatgaccttcgtgaaagcgggtggcaggaggtcgcgctaacaacctcctgcc45060
gttttgcccgtgcatatcggtcacgaacaaatctgattactaaacacagtagcctggatt45120
tgttctatcagtaatcgaccttattcctaattaaatagagcaaatccccttattgggggt45180
aagacatgaagatgccagaaaaacatgacctgttggccgccattctcgcggcaaaggaac45240
aaggcatcggggcaatccttgcgtttgcaatggcgtaccttcgcggcagatataatggcg45300
gtgcgtttacaaaaacagtaatcgacgcaacgatgtgcgccattatcgcctggttcattc45360
gtgaccttctcgacttcgccggactaagtagcaatctcgcttatataacgagcgtgttta45420
tcggctacatcggtactgactcgattggttcgcttatcaaacgcttcgctgctaaaaaag45480
ccggagtagaagatggtagaaatcaataatcaacgtaaggcgttcctcgatatgctggcg45540
tggtcggagggaactgataacggacgtcagaaaaccagaaatcatggttatgacgtcatt45600
gtaggcggagagctatttactgattactccgatcaccctcgcaaacttgtcacgctaaac45660
ccaaaactcaaatcaacaggcgccggacgctaccagcttctttcccgttggtgggatgcc45720
taccgcaagcagcttggcctgaaagacttctctccgaaaagtcaggacgctgtggcattg45780
cagcagattaaggagcgtggcgctttacctatgattgatcgtggtgatatccgtcaggca45840
atcgaccgttgcagcaatatctgggcttcactgccgggcgctggttatggtcagttcgag45900
cataaggctgacagcctgattgcaaaattcaaagaagcgggcggaacggtcagagagatt45960
gatgtatgagcagagtcaccgcgattatctccgctctggttatctgcatcatcgtctgcc46020
tgtcatgggctgttaatcattaccgtgataacgccattacctacaaagcccagcgcgaca46080
aaaatgccagagaactgaagctggcgaacgcggcaattactgacatgcagatgcgtcagc46140
gtgatgttgctgcgctcgatgcaaaatacacgaaggagttagctgatgctaaagctgaaa46200
atgatgctctgcgtgatgatgttgccgctggtcgtcgtcggttgcacatcaaagcagtct46260
gtcagtcagtgcgtgaagccaccaccgcctccggcgtggataatgcagcctccccccgac46320
tggcagacaccgctgaacgggattatttcaccctcagagagaggctgatcactatgcaaa46380
aacaactggaaggaacccagaagtatattaatgagcagtgcagatagagttgcccatatc46440
gatgggcaactcatgcaattattgtgagcaatacacacgcgcttccagcggagtataaat46500
gcctaaagtaataaaaccgagcaatccatttacgaatgtttgctgggtttctgttttaac46560
aacattttctgcgccgccacaaattttggctgcatcgacagttttcttctgcccaattcc46620
agaaacgaagaaatgatgggtgatggtttcctttggtgctactgctgccggtttgttttg46680
aacagtaaacgtctgttgagcacatcctgtaataagcagggccagcgcagtagcgagtag46740
catttttttcatggtgttattcccgatgctttttgaagttcgcagaatcgtatgtgtaga46800
aaattaaacaaaccctaaacaatgagttgaaatttcatattgttaatatttattaatgta46860
tgtcaggtgcgatgaatcgtcattgtattcccggattaactatgtccacagccctgacgg46920
ggaacttctctgcgggagtgtccgggaataattaaaacgatgcacacagggtttagcgcg46980
tacacgtattgcattatgccaacgccccggtgctgacacggaagaaaccggacgttatga47040
tttagcgtggaaagatttgtgtagtgttctgaatgctctcagtaaatagtaatgaattat47100
caaaggtatagtaatatcttttatgttcatggatatttgtaacccatcggaaaactcctg47160
ctttagcaagattttccctgtattgctgaaatgtgatttctcttgatttcaacctatcat47220
aggacgtttctataagatgcgtgtttcttgagaatttaacatttacaacctttttaagtc47280
cttttattaacacggtgttatcgttttctaacacgatgtgaatattatctgtggctagat47340
agtaaatataatgtgagacgttgtgacgttttagttcagaataaaacaattcacagtcta47400
aatcttttcgcacttgatcgaatatttctttaaaaatggcaacctgagccattggtaaaa47460
ccttccatgtgatacgagggcgcgtagtttgcattatcgtttttatcgtttcaatctggt47520
ctgacctccttgtgttttgttgatgatttatgtcaaatattaggaatgttttcacttaat47580
agtattggttgcgtaacaaagtgcggtcctgctggcattctggagggaaatacaaccgac47640
agatgtatgtaaggccaacgtgctcaaatcttcatacagaaagatttgaagtaatatttt47700
aaccgctagatgaagagcaagcgcatggagcgacaaaatgaataaagaacaatctgctga47760
tgatccctccgtggatctgattcgtgtaaaaaatatgcttaatagcaccatttctatgag47820
ttaccctgatgttgtaattgcatgtatagaacataaggtgtctctggaagcattcagagc47880
aattgaggcagcgttggtgaagcacgataataatatgaaggattattccctggtggttga47940
ctgatcaccataactgctaatcattcaaactatttagtctgtgacagagccaacacgcag48000
tctgtcactgtcaggaaagtggtaaaactgcaactcaattactgcaatgccctcgtaatt48060
aagtgaatttacaatatcgtcctgttcggagggaagaacgcgggatgttcattcttcatc48120
acttttaattgatgtatatgctctcttttctgacgttagtctccgacggcaggcttcaat48180
gacccaggctgagaaattcccggaccctttttgctcaagagcgatgttaatttgttcaat48240
catttggttaggaaagcggatgttgcgggttgttgttctgcgggttctgttcttcgttga48300
catgaggttgccccgtattcagtgtcgctgatttgtattgtctgaagttgtttttacgtt48360
aagttgatgcagatcaattaatacgatacctgcgtcataattgattatttgacgtggttt48420
gatggcctccacgcacgttgtgatatgtagatgataatcattatcactttacgggtcctt48480
tccggtgatccgacaggttacg48502
<210>6
<211>628
<212>dna
<213>artificialsequence
<220>
<223>lambdadna
<400>6
gggcggcgacctcgcgggttttcgctatttatgaaaattttccggtttaaggcgtttccg60
ttcttcttcgtcataacttaatgtttttatttaaaataccctctgaaaagaaaggaaacg120
acaggtgctgaaagcgaggctttttggcctctgtcgtttcctttctctgtttttgtccgt180
ggaatgaacaatggaagtcaacaaaaagcagctggctgacattttcggtgcgagtatccg240
taccattcagaactggcaggaacagggaatgcccgttctgcgaggcggtggcaagggtaa300
tgaggtgctttatgactctgccgccgtcataaaatggtatgccgaaagggatgctgaaat360
tgagaacgaaaagctgcgccgggaggttgaagaactgcggcaggccagcgaggcagatct420
ccagccaggaactattgagtacgaacgccatcgacttacgcgtgcgcaggccgacgcaca480
ggaactgaagaatgccagagactccgctgaagtggtggaaaccgcattctgtactttcgt540
gctgtcgcggatcgcaggtgaaattgccagtattctcgacgggctccccctgtcggtgca600
gcggcgttttccggaactggaaaaccga628
<210>7
<211>38767
<212>dna
<213>artificialsequence
<220>
<223>lambdadna
<400>7
catgttgatttcctgaaacgggatatcatcaaagccatgaacaaagcagccgcgctggat60
gaactgataccggggttgctgagtgaatatatcgaacagtcaggttaacaggctgcggca120
ttttgtccgcgccgggcttcgctcactgttcaggccggagccacagaccgccgttgaatg180
ggcggatgctaattactatctcccgaaagaatccgcataccaggaagggcgctgggaaac240
actgccctttcagcgggccatcatgaatgcgatgggcagcgactacatccgtgaggtgaa300
tgtggtgaagtctgcccgtgtcggttattccaaaatgctgctgggtgtttatgcctactt360
tatagagcataagcagcgcaacacccttatctggttgccgacggatggtgatgccgagaa420
ctttatgaaaacccacgttgagccgactattcgtgatattccgtcgctgctggcgctggc480
cccgtggtatggcaaaaagcaccgggataacacgctcaccatgaagcgtttcactaatgg540
gcgtggcttctggtgcctgggcggtaaagcggcaaaaaactaccgtgaaaagtcggtgga600
tgtggcgggttatgatgaacttgctgcttttgatgatgatattgaacaggaaggctctcc660
gacgttcctgggtgacaagcgtattgaaggctcggtctggccaaagtccatccgtggctc720
cacgccaaaagtgagaggcacctgtcagattgagcgtgcagccagtgaatccccgcattt780
tatgcgttttcatgttgcctgcccgcattgcggggaggagcagtatcttaaatttggcga840
caaagagacgccgtttggcctcaaatggacgccggatgacccctccagcgtgttttatct900
ctgcgagcataatgcctgcgtcatccgccagcaggagctggactttactgatgcccgtta960
tatctgcgaaaagaccgggatctggacccgtgatggcattctctggttttcgtcatccgg1020
tgaagagattgagccacctgacagtgtgacctttcacatctggacagcgtacagcccgtt1080
caccacctgggtgcagattgtcaaagactggatgaaaacgaaaggggatacgggaaaacg1140
taaaaccttcgtaaacaccacgctcggtgagacgtgggaggcgaaaattggcgaacgtcc1200
ggatgctgaagtgatggcagagcggaaagagcattattcagcgcccgttcctgaccgtgt1260
ggcttacctgaccgccggtatcgactcccagctggaccgctacgaaatgcgcgtatgggg1320
atgggggccgggtgaggaaagctggctgattgaccggcagattattatgggccgccacga1380
cgatgaacagacgctgctgcgtgtggatgaggccatcaataaaacctatacccgccggaa1440
tggtgcagaaatgtcgatatcccgtatctgctgggatactggcgggattgacccgaccat1500
tgtgtatgaacgctcgaaaaaacatgggctgttccgggtgatccccattaaaggggcatc1560
cgtctacggaaagccggtggccagcatgccacgtaagcgaaacaaaaacggggtttacct1620
taccgaaatcggtacggataccgcgaaagagcagatttataaccgcttcacactgacgcc1680
ggaaggggatgaaccgcttcccggtgccgttcacttcccgaataacccggatatttttga1740
tctgaccgaagcgcagcagctgactgctgaagagcaggtcgaaaaatgggtggatggcag1800
gaaaaaaatactgtgggacagcaaaaagcgacgcaatgaggcactcgactgcttcgttta1860
tgcgctggcggcgctgcgcatcagtatttcccgctggcagctggatctcagtgcgctgct1920
ggcgagcctgcaggaagaggatggtgcagcaaccaacaagaaaacactggcagattacgc1980
ccgtgccttatccggagaggatgaatgacgcgacaggaagaacttgccgctgcccgtgcg2040
gcactgcatgacctgatgacaggtaaacgggtggcaacagtacagaaagacggacgaagg2100
gtggagtttacggccacttccgtgtctgacctgaaaaaatatattgcagagctggaagtg2160
cagaccggcatgacacagcgacgcaggggacctgcaggattttatgtatgaaaacgccca2220
ccattcccacccttctggggccggacggcatgacatcgctgcgcgaatatgccggttatc2280
acggcggtggcagcggatttggagggcagttgcggtcgtggaacccaccgagtgaaagtg2340
tggatgcagccctgttgcccaactttacccgtggcaatgcccgcgcagacgatctggtac2400
gcaataacggctatgccgccaacgccatccagctgcatcaggatcatatcgtcgggtctt2460
ttttccggctcagtcatcgcccaagctggcgctatctgggcatcggggaggaagaagccc2520
gtgccttttcccgcgaggttgaagcggcatggaaagagtttgccgaggatgactgctgct2580
gcattgacgttgagcgaaaacgcacgtttaccatgatgattcgggaaggtgtggccatgc2640
acgcctttaacggtgaactgttcgttcaggccacctgggataccagttcgtcgcggcttt2700
tccggacacagttccggatggtcagcccgaagcgcatcagcaacccgaacaataccggcg2760
acagccggaactgccgtgccggtgtgcagattaatgacagcggtgcggcgctgggatatt2820
acgtcagcgaggacgggtatcctggctggatgccgcagaaatggacatggataccccgtg2880
agttacccggcgggcgcgcctcgttcattcacgtttttgaacccgtggaggacgggcaga2940
ctcgcggtgcaaatgtgttttacagcgtgatggagcagatgaagatgctcgacacgctgc3000
agaacacgcagctgcagagcgccattgtgaaggcgatgtatgccgccaccattgagagtg3060
agctggatacgcagtcagcgatggattttattctgggcgcgaacagtcaggagcagcggg3120
aaaggctgaccggctggattggtgaaattgccgcgtattacgccgcagcgccggtccggc3180
tgggaggcgcaaaagtaccgcacctgatgccgggtgactcactgaacctgcagacggctc3240
aggatacggataacggctactccgtgtttgagcagtcactgctgcggtatatcgctgccg3300
ggctgggtgtctcgtatgagcagctttcccggaattacgcccagatgagctactccacgg3360
cacgggccagtgcgaacgagtcgtgggcgtactttatggggcggcgaaaattcgtcgcat3420
cccgtcaggcgagccagatgtttctgtgctggctggaagaggccatcgttcgccgcgtgg3480
tgacgttaccttcaaaagcgcgcttcagttttcaggaagcccgcagtgcctgggggaact3540
gcgactggataggctccggtcgtatggccatcgatggtctgaaagaagttcaggaagcgg3600
tgatgctgatagaagccggactgagtacctacgagaaagagtgcgcaaaacgcggtgacg3660
actatcaggaaatttttgcccagcaggtccgtgaaacgatggagcgccgtgcagccggtc3720
ttaaaccgcccgcctgggcggctgcagcatttgaatccgggctgcgacaatcaacagagg3780
aggagaagagtgacagcagagctgcgtaatctcccgcatattgccagcatggcctttaat3840
gagccgctgatgcttgaacccgcctatgcgcgggttttcttttgtgcgcttgcaggccag3900
cttgggatcagcagcctgacggatgcggtgtccggcgacagcctgactgcccaggaggca3960
ctcgcgacgctggcattatccggtgatgatgacggaccacgacaggcccgcagttatcag4020
gtcatgaacggcatcgccgtgctgccggtgtccggcacgctggtcagccggacgcgggcg4080
ctgcagccgtactcggggatgaccggttacaacggcattatcgcccgtctgcaacaggct4140
gccagcgatccgatggtggacggcattctgctcgatatggacacgcccggcgggatggtg4200
gcgggggcatttgactgcgctgacatcatcgcccgtgtgcgtgacataaaaccggtatgg4260
gcgcttgccaacgacatgaactgcagtgcaggtcagttgcttgccagtgccgcctcccgg4320
cgtctggtcacgcagaccgcccggacaggctccatcggcgtcatgatggctcacagtaat4380
tacggtgctgcgctggagaaacagggtgtggaaatcacgctgatttacagcggcagccat4440
aaggtggatggcaacccctacagccatcttccggatgacgtccgggagacactgcagtcc4500
cggatggacgcaacccgccagatgtttgcgcagaaggtgtcggcatataccggcctgtcc4560
gtgcaggttgtgctggataccgaggctgcagtgtacagcggtcaggaggccattgatgcc4620
ggactggctgatgaacttgttaacagcaccgatgcgatcaccgtcatgcgtgatgcactg4680
gatgcacgtaaatcccgtctctcaggagggcgaatgaccaaagagactcaatcaacaact4740
gtttcagccactgcttcgcaggctgacgttactgacgtggtgccagcgacggagggcgag4800
aacgccagcgcggcgcagccggacgtgaacgcgcagatcaccgcagcggttgcggcagaa4860
aacagccgcattatggggatcctcaactgtgaggaggctcacggacgcgaagaacaggca4920
cgcgtgctggcagaaacccccggtatgaccgtgaaaacggcccgccgcattctggccgca4980
gcaccacagagtgcacaggcgcgcagtgacactgcgctggatcgtctgatgcagggggca5040
ccggcaccgctggctgcaggtaacccggcatctgatgccgttaacgatttgctgaacaca5100
ccagtgtaagggatgtttatgacgagcaaagaaacctttacccattaccagccgcagggc5160
aacagtgacccggctcataccgcaaccgcgcccggcggattgagtgcgaaagcgcctgca5220
atgaccccgctgatgctggacacctccagccgtaagctggttgcgtgggatggcaccacc5280
gacggtgctgccgttggcattcttgcggttgctgctgaccagaccagcaccacgctgacg5340
ttctacaagtccggcacgttccgttatgaggatgtgctctggccggaggctgccagcgac5400
gagacgaaaaaacggaccgcgtttgccggaacggcaatcagcatcgtttaactttaccct5460
tcatcactaaaggccgcctgtgcggctttttttacgggatttttttatgtcgatgtacac5520
aaccgcccaactgctggcggcaaatgagcagaaatttaagtttgatccgctgtttctgcg5580
tctctttttccgtgagagctatcccttcaccacggagaaagtctatctctcacaaattcc5640
gggactggtaaacatggcgctgtacgtttcgccgattgtttccggtgaggttatccgttc5700
ccgtggcggctccacctctgaatttacgccgggatatgtcaagccgaagcatgaagtgaa5760
tccgcagatgaccctgcgtcgcctgccggatgaagatccgcagaatctggcggacccggc5820
ttaccgccgccgtcgcatcatcatgcagaacatgcgtgacgaagagctggccattgctca5880
ggtcgaagagatgcaggcagtttctgccgtgcttaagggcaaatacaccatgaccggtga5940
agccttcgatccggttgaggtggatatgggccgcagtgaggagaataacatcacgcagtc6000
cggcggcacggagtggagcaagcgtgacaagtccacgtatgacccgaccgacgatatcga6060
agcctacgcgctgaacgccagcggtgtggtgaatatcatcgtgttcgatccgaaaggctg6120
ggcgctgttccgttccttcaaagccgtcaaggagaagctggatacccgtcgtggctctaa6180
ttccgagctggagacagcggtgaaagacctgggcaaagcggtgtcctataaggggatgta6240
tggcgatgtggccatcgtcgtgtattccggacagtacgtggaaaacggcgtcaaaaagaa6300
cttcctgccggacaacacgatggtgctggggaacactcaggcacgcggtctgcgcaccta6360
tggctgcattcaggatgcggacgcacagcgcgaaggcattaacgcctctgcccgttaccc6420
gaaaaactgggtgaccaccggcgatccggcgcgtgagttcaccatgattcagtcagcacc6480
gctgatgctgctggctgaccctgatgagttcgtgtccgtacaactggcgtaatcatggcc6540
cttcggggccattgtttctctgtggaggagtccatgacgaaagatgaactgattgcccgt6600
ctccgctcgctgggtgaacaactgaaccgtgatgtcagcctgacggggacgaaagaagaa6660
ctggcgctccgtgtggcagagctgaaagaggagcttgatgacacggatgaaactgccggt6720
caggacacccctctcagccgggaaaatgtgctgaccggacatgaaaatgaggtgggatca6780
gcgcagccggataccgtgattctggatacgtctgaactggtcacggtcgtggcactggtg6840
aagctgcatactgatgcacttcacgccacgcgggatgaacctgtggcatttgtgctgccg6900
ggaacggcgtttcgtgtctctgccggtgtggcagccgaaatgacagagcgcggcctggcc6960
agaatgcaataacgggaggcgctgtggctgatttcgataacctgttcgatgctgccattg7020
cccgcgccgatgaaacgatacgcgggtacatgggaacgtcagccaccattacatccggtg7080
agcagtcaggtgcggtgatacgtggtgtttttgatgaccctgaaaatatcagctatgccg7140
gacagggcgtgcgcgttgaaggctccagcccgtccctgtttgtccggactgatgaggtgc7200
ggcagctgcggcgtggagacacgctgaccatcggtgaggaaaatttctgggtagatcggg7260
tttcgccggatgatggcggaagttgtcatctctggcttggacggggcgtaccgcctgccg7320
ttaaccgtcgccgctgaaagggggatgtatggccataaaaggtcttgagcaggccgttga7380
aaacctcagccgtatcagcaaaacggcggtgcctggtgccgccgcaatggccattaaccg7440
cgttgcttcatccgcgatatcgcagtcggcgtcacaggttgcccgtgagacaaaggtacg7500
ccggaaactggtaaaggaaagggccaggctgaaaagggccacggtcaaaaatccgcaggc7560
cagaatcaaagttaaccggggggatttgcccgtaatcaagctgggtaatgcgcgggttgt7620
cctttcgcgccgcaggcgtcgtaaaaaggggcagcgttcatccctgaaaggtggcggcag7680
cgtgcttgtggtgggtaaccgtcgtattcccggcgcgtttattcagcaactgaaaaatgg7740
ccggtggcatgtcatgcagcgtgtggctgggaaaaaccgttaccccattgatgtggtgaa7800
aatcccgatggcggtgccgctgaccacggcgtttaaacaaaatattgagcggatacggcg7860
tgaacgtcttccgaaagagctgggctatgcgctgcagcatcaactgaggatggtaataaa7920
gcgatgaaacatactgaactccgtgcagccgtactggatgcactggagaagcatgacacc7980
ggggcgacgttttttgatggtcgccccgctgtttttgatgaggcggattttccggcagtt8040
gccgtttatctcaccggcgctgaatacacgggcgaagagctggacagcgatacctggcag8100
gcggagctgcatatcgaagttttcctgcctgctcaggtgccggattcagagctggatgcg8160
tggatggagtcccggatttatccggtgatgagcgatatcccggcactgtcagatttgatc8220
accagtatggtggccagcggctatgactaccggcgcgacgatgatgcgggcttgtggagt8280
tcagccgatctgacttatgtcattacctatgaaatgtgaggacgctatgcctgtaccaaa8340
tcctacaatgccggtgaaaggtgccgggaccaccctgtgggtttataaggggagcggtga8400
cccttacgcgaatccgctttcagacgttgactggtcgcgtctggcaaaagttaaagacct8460
gacgcccggcgaactgaccgctgagtcctatgacgacagctatctcgatgatgaagatgc8520
agactggactgcgaccgggcaggggcagaaatctgccggagataccagcttcacgctggc8580
gtggatgcccggagagcaggggcagcaggcgctgctggcgtggtttaatgaaggcgatac8640
ccgtgcctataaaatccgcttcccgaacggcacggtcgatgtgttccgtggctgggtcag8700
cagtatcggtaaggcggtgacggcgaaggaagtgatcacccgcacggtgaaagtcaccaa8760
tgtgggacgtccgtcgatggcagaagatcgcagcacggtaacagcggcaaccggcatgac8820
cgtgacgcctgccagcacctcggtggtgaaagggcagagcaccacgctgaccgtggcctt8880
ccagccggagggcgtaaccgacaagagctttcgtgcggtgtctgcggataaaacaaaagc8940
caccgtgtcggtcagtggtatgaccatcaccgtgaacggcgttgctgcaggcaaggtcaa9000
cattccggttgtatccggtaatggtgagtttgctgcggttgcagaaattaccgtcaccgc9060
cagttaatccggagagtcagcgatgttcctgaaaaccgaatcatttgaacataacggtgt9120
gaccgtcacgctttctgaactgtcagccctgcagcgcattgagcatctcgccctgatgaa9180
acggcaggcagaacaggcggagtcagacagcaaccggaagtttactgtggaagacgccat9240
cagaaccggcgcgtttctggtggcgatgtccctgtggcataaccatccgcagaagacgca9300
gatgccgtccatgaatgaagccgttaaacagattgagcaggaagtgcttaccacctggcc9360
cacggaggcaatttctcatgctgaaaacgtggtgtaccggctgtctggtatgtatgagtt9420
tgtggtgaataatgcccctgaacagacagaggacgccgggcccgcagagcctgtttctgc9480
gggaaagtgttcgacggtgagctgagttttgccctgaaactggcgcgtgagatggggcga9540
cccgactggcgtgccatgcttgccgggatgtcatccacggagtatgccgactggcaccgc9600
ttttacagtacccattattttcatgatgttctgctggatatgcacttttccgggctgacg9660
tacaccgtgctcagcctgtttttcagcgatccggatatgcatccgctggatttcagtctg9720
ctgaaccggcgcgaggctgacgaagagcctgaagatgatgtgctgatgcagaaagcggca9780
gggcttgccggaggtgtccgctttggcccggacgggaatgaagttatccccgcttccccg9840
gatgtggcggacatgacggaggatgacgtaatgctgatgacagtatcagaagggatcgca9900
ggaggagtccggtatggctgaaccggtaggcgatctggtcgttgatttgagtctggatgc9960
ggccagatttgacgagcagatggccagagtcaggcgtcatttttctggtacggaaagtga10020
tgcgaaaaaaacagcggcagtcgttgaacagtcgctgagccgacaggcgctggctgcaca10080
gaaagcggggatttccgtcgggcagtataaagccgccatgcgtatgctgcctgcacagtt10140
caccgacgtggccacgcagcttgcaggcgggcaaagtccgtggctgatcctgctgcaaca10200
gggggggcaggtgaaggactccttcggcgggatgatccccatgttcagggggcttgccgg10260
tgcgatcaccctgccgatggtgggggccacctcgctggcggtggcgaccggtgcgctggc10320
gtatgcctggtatcagggcaactcaaccctgtccgatttcaacaaaacgctggtcctttc10380
cggcaatcaggcgggactgacggcagatcgtatgctggtcctgtccagagccgggcaggc10440
ggcagggctgacgtttaaccagaccagcgagtcactcagcgcactggttaaggcgggggt10500
aagcggtgaggctcagattgcgtccatcagccagagtgtggcgcgtttctcctctgcatc10560
cggcgtggaggtggacaaggtcgctgaagccttcgggaagctgaccacagacccgacgtc10620
ggggctgacggcgatggctcgccagttccataacgtgtcggcggagcagattgcgtatgt10680
tgctcagttgcagcgttccggcgatgaagccggggcattgcaggcggcgaacgaggccgc10740
aacgaaagggtttgatgaccagacccgccgcctgaaagagaacatgggcacgctggagac10800
ctgggcagacaggactgcgcgggcattcaaatccatgtgggatgcggtgctggatattgg10860
tcgtcctgataccgcgcaggagatgctgattaaggcagaggctgcgtataagaaagcaga10920
cgacatctggaatctgcgcaaggatgattattttgttaacgatgaagcgcgggcgcgtta10980
ctgggatgatcgtgaaaaggcccgtcttgcgcttgaagccgcccgaaagaaggctgagca11040
gcagactcaacaggacaaaaatgcgcagcagcagagcgataccgaagcgtcacggctgaa11100
atataccgaagaggcgcagaaggcttacgaacggctgcagacgccgctggagaaatatac11160
cgcccgtcaggaagaactgaacaaggcactgaaagacgggaaaatcctgcaggcggatta11220
caacacgctgatggcggcggcgaaaaaggattatgaagcgacgctgaaaaagccgaaaca11280
gtccagcgtgaaggtgtctgcgggcgatcgtcaggaagacagtgctcatgctgccctgct11340
gacgcttcaggcagaactccggacgctggagaagcatgccggagcaaatgagaaaatcag11400
ccagcagcgccgggatttgtggaaggcggagagtcagttcgcggtactggaggaggcggc11460
gcaacgtcgccagctgtctgcacaggagaaatccctgctggcgcataaagatgagacgct11520
ggagtacaaacgccagctggctgcacttggcgacaaggttacgtatcaggagcgcctgaa11580
cgcgctggcgcagcaggcggataaattcgcacagcagcaacgggcaaaacgggccgccat11640
tgatgcgaaaagccgggggctgactgaccggcaggcagaacgggaagccacggaacagcg11700
cctgaaggaacagtatggcgataatccgctggcgctgaataacgtcatgtcagagcagaa11760
aaagacctgggcggctgaagaccagcttcgcgggaactggatggcaggcctgaagtccgg11820
ctggagtgagtgggaagagagcgccacggacagtatgtcgcaggtaaaaagtgcagccac11880
gcagacctttgatggtattgcacagaatatggcggcgatgctgaccggcagtgagcagaa11940
ctggcgcagcttcacccgttccgtgctgtccatgatgacagaaattctgcttaagcaggc12000
aatggtggggattgtcgggagtatcggcagcgccattggcggggctgttggtggcggcgc12060
atccgcgtcaggcggtacagccattcaggccgctgcggcgaaattccattttgcaaccgg12120
aggatttacgggaaccggcggcaaatatgagccagcggggattgttcaccgtggtgagtt12180
tgtcttcacgaaggaggcaaccagccggattggcgtggggaatctttaccggctgatgcg12240
cggctatgccaccggcggttatgtcggtacaccgggcagcatggcagacagccggtcgca12300
ggcgtccgggacgtttgagcagaataaccatgtggtgattaacaacgacggcacgaacgg12360
gcagataggtccggctgctctgaaggcggtgtatgacatggcccgcaagggtgcccgtga12420
tgaaattcagacacagatgcgtgatggtggcctgttctccggaggtggacgatgaagacc12480
ttccgctggaaagtgaaacccggtatggatgtggcttcggtcccttctgtaagaaaggtg12540
cgctttggtgatggctattctcagcgagcgcctgccgggctgaatgccaacctgaaaacg12600
tacagcgtgacgctttctgtcccccgtgaggaggccacggtactggagtcgtttctggaa12660
gagcacgggggctggaaatcctttctgtggacgccgccttatgagtggcggcagataaag12720
gtgacctgcgcaaaatggtcgtcgcgggtcagtatgctgcgtgttgagttcagcgcagag12780
tttgaacaggtggtgaactgatgcaggatatccggcaggaaacactgaatgaatgcaccc12840
gtgcggagcagtcggccagcgtggtgctctgggaaatcgacctgacagaggtcggtggag12900
aacgttattttttctgtaatgagcagaacgaaaaaggtgagccggtcacctggcaggggc12960
gacagtatcagccgtatcccattcaggggagcggttttgaactgaatggcaaaggcacca13020
gtacgcgccccacgctgacggtttctaacctgtacggtatggtcaccgggatggcggaag13080
atatgcagagtctggtcggcggaacggtggtccggcgtaaggtttacgcccgttttctgg13140
atgcggtgaacttcgtcaacggaaacagttacgccgatccggagcaggaggtgatcagcc13200
gctggcgcattgagcagtgcagcgaactgagcgcggtgagtgcctcctttgtactgtcca13260
cgccgacggaaacggatggcgctgtttttccgggacgtatcatgctggccaacacctgca13320
cctggacctatcgcggtgacgagtgcggttatagcggtccggctgtcgcggatgaatatg13380
accagccaacgtccgatatcacgaaggataaatgcagcaaatgcctgagcggttgtaagt13440
tccgcaataacgtcggcaactttggcggcttcctttccattaacaaactttcgcagtaaa13500
tcccatgacacagacagaatcagcgattctggcgcacgcccggcgatgtgcgccagcgga13560
gtcgtgcggcttcgtggtaagcacgccggagggggaaagatatttcccctgcgtgaatat13620
ctccggtgagccggaggctatttccgtatgtcgccggaagactggctgcaggcagaaatg13680
cagggtgagattgtggcgctggtccacagccaccccggtggtctgccctggctgagtgag13740
gccgaccggcggctgcaggtgcagagtgatttgccgtggtggctggtctgccgggggacg13800
attcataagttccgctgtgtgccgcatctcaccgggcggcgctttgagcacggtgtgacg13860
gactgttacacactgttccgggatgcttatcatctggcggggattgagatgccggacttt13920
catcgtgaggatgactggtggcgtaacggccagaatctctatctggataatctggaggcg13980
acggggctgtatcaggtgccgttgtcagcggcacagccgggcgatgtgctgctgtgctgt14040
tttggttcatcagtgccgaatcacgccgcaatttactgcggcgacggcgagctgctgcac14100
catattcctgaacaactgagcaaacgagagaggtacaccgacaaatggcagcgacgcaca14160
cactccctctggcgtcaccgggcatggcgcgcatctgcctttacggggatttacaacgat14220
ttggtcgccgcatcgaccttcgtgtgaaaacgggggctgaagccatccgggcactggcca14280
cacagctcccggcgtttcgtcagaaactgagcgacggctggtatcaggtacggattgccg14340
ggcgggacgtcagcacgtccgggttaacggcgcagttacatgagactctgcctgatggcg14400
ctgtaattcatattgttcccagagtcgccggggccaagtcaggtggcgtattccagattg14460
tcctgggggctgccgccattgccggatcattctttaccgccggagccacccttgcagcat14520
ggggggcagccattggggccggtggtatgaccggcatcctgttttctctcggtgccagta14580
tggtgctcggtggtgtggcgcagatgctggcaccgaaagccagaactccccgtatacaga14640
caacggataacggtaagcagaacacctatttctcctcactggataacatggttgcccagg14700
gcaatgttctgcctgttctgtacggggaaatgcgcgtggggtcacgcgtggtttctcagg14760
agatcagcacggcagacgaaggggacggtggtcaggttgtggtgattggtcgctgatgca14820
aaatgttttatgtgaaaccgcctgcgggcggttttgtcatttatggagcgtgaggaatgg14880
gtaaaggaagcagtaaggggcataccccgcgcgaagcgaaggacaacctgaagtccacgc14940
agttgctgagtgtgatcgatgccatcagcgaagggccgattgaaggtccggtggatggct15000
taaaaagcgtgctgctgaacagtacgccggtgctggacactgaggggaataccaacatat15060
ccggtgtcacggtggtgttccgggctggtgagcaggagcagactccgccggagggatttg15120
aatcctccggctccgagacggtgctgggtacggaagtgaaatatgacacgccgatcaccc15180
gcaccattacgtctgcaaacatcgaccgtctgcgctttaccttcggtgtacaggcactgg15240
tggaaaccacctcaaagggtgacaggaatccgtcggaagtccgcctgctggttcagatac15300
aacgtaacggtggctgggtgacggaaaaagacatcaccattaagggcaaaaccacctcgc15360
agtatctggcctcggtggtgatgggtaacctgccgccgcgcccgtttaatatccggatgc15420
gcaggatgacgccggacagcaccacagaccagctgcagaacaaaacgctctggtcgtcat15480
acactgaaatcatcgatgtgaaacagtgctacccgaacacggcactggtcggcgtgcagg15540
tggactcggagcagttcggcagccagcaggtgagccgtaattatcatctgcgcgggcgta15600
ttctgcaggtgccgtcgaactataacccgcagacgcggcaatacagcggtatctgggacg15660
gaacgtttaaaccggcatacagcaacaacatggcctggtgtctgtgggatatgctgaccc15720
atccgcgctacggcatggggaaacgtcttggtgcggcggatgtggataaatgggcgctgt15780
atgtcatcggccagtactgcgaccagtcagtgccggacggctttggcggcacggagccgc15840
gcatcacctgtaatgcgtacctgaccacacagcgtaaggcgtgggatgtgctcagcgatt15900
tctgctcggcgatgcgctgtatgccggtatggaacgggcagacgctgacgttcgtgcagg15960
accgaccgtcggataagacgtggacctataaccgcagtaatgtggtgatgccggatgatg16020
gcgcgccgttccgctacagcttcagcgccctgaaggaccgccataatgccgttgaggtga16080
actggattgacccgaacaacggctgggagacggcgacagagcttgttgaagatacgcagg16140
ccattgcccgttacggtcgtaatgttacgaagatggatgcctttggctgtaccagccggg16200
ggcaggcacaccgcgccgggctgtggctgattaaaacagaactgctggaaacgcagaccg16260
tggatttcagcgtcggcgcagaagggcttcgccatgtaccgggcgatgttattgaaatct16320
gcgatgatgactatgccggtatcagcaccggtggtcgtgtgctggcggtgaacagccaga16380
cccggacgctgacgctcgaccgtgaaatcacgctgccatcctccggtaccgcgctgataa16440
gcctggttgacggaagtggcaatccggtcagcgtggaggttcagtccgtcaccgacggcg16500
tgaaggtaaaagtgagccgtgttcctgacggtgttgctgaatacagcgtatgggagctga16560
agctgccgacgctgcgccagcgactgttccgctgcgtgagtatccgtgagaacgacgacg16620
gcacgtatgccatcaccgccgtgcagcatgtgccggaaaaagaggccatcgtggataacg16680
gggcgcactttgacggcgaacagagtggcacggtgaatggtgtcacgccgccagcggtgc16740
agcacctgaccgcagaagtcactgcagacagcggggaatatcaggtgctggcgcgatggg16800
acacaccgaaggtggtgaagggcgtgagtttcctgctccgtctgaccgtaacagcggacg16860
acggcagtgagcggctggtcagcacggcccggacgacggaaaccacataccgcttcacgc16920
aactggcgctggggaactacaggctgacagtccgggcggtaaatgcgtgggggcagcagg16980
gcgatccggcgtcggtatcgttccggattgccgcaccggcagcaccgtcgaggattgagc17040
tgacgccgggctattttcagataaccgccacgccgcatcttgccgtttatgacccgacgg17100
tacagtttgagttctggttctcggaaaagcagattgcggatatcagacaggttgaaacca17160
gcacgcgttatcttggtacggcgctgtactggatagccgccagtatcaatatcaaaccgg17220
gccatgattattacttttatatccgcagtgtgaacaccgttggcaaatcggcattcgtgg17280
aggccgtcggtcgggcgagcgatgatgcggaaggttacctggattttttcaaaggcaaga17340
taaccgaatcccatctcggcaaggagctgctggaaaaagtcgagctgacggaggataacg17400
ccagcagactggaggagttttcgaaagagtggaaggatgccagtgataagtggaatgcca17460
tgtgggctgtcaaaattgagcagaccaaagacggcaaacattatgtcgcgggtattggcc17520
tcagcatggaggacacggaggaaggcaaactgagccagtttctggttgccgccaatcgta17580
tcgcatttattgacccggcaaacgggaatgaaacgccgatgtttgtggcgcagggcaacc17640
agatattcatgaacgacgtgttcctgaagcgcctgacggcccccaccattaccagcggcg17700
gcaatcctccggccttttccctgacaccggacggaaagctgaccgctaaaaatgcggata17760
tcagtggcagtgtgaatgcgaactccgggacgctcagtaatgtgacgatagctgaaaact17820
gtacgataaacggtacgctgagggcggaaaaaatcgtcggggacattgtaaaggcggcga17880
gcgcggcttttccgcgccagcgtgaaagcagtgtggactggccgtcaggtacccgtactg17940
tcaccgtgaccgatgaccatccttttgatcgccagatagtggtgcttccgctgacgtttc18000
gcggaagtaagcgtactgtcagcggcaggacaacgtattcgatgtgttatctgaaagtac18060
tgatgaacggtgcggtgatttatgatggcgcggcgaacgaggcggtacaggtgttctccc18120
gtattgttgacatgccagcgggtcggggaaacgtgatcctgacgttcacgcttacgtcca18180
cacggcattcggcagatattccgccgtatacgtttgccagcgatgtgcaggttatggtga18240
ttaagaaacaggcgctgggcatcagcgtggtctgagtgtgttacagaggttcgtccggga18300
acgggcgttttattataaaacagtgagaggtgaacgatgcgtaatgtgtgtattgccgtt18360
gctgtctttgccgcacttgcggtgacagtcactccggcccgtgcggaaggtggacatggt18420
acgtttacggtgggctattttcaagtgaaaccgggtacattgccgtcgttgtcgggcggg18480
gataccggtgtgagtcatctgaaagggattaacgtgaagtaccgttatgagctgacggac18540
agtgtgggggtgatggcttccctggggttcgccgcgtcgaaaaagagcagcacagtgatg18600
accggggaggatacgtttcactatgagagcctgcgtggacgttatgtgagcgtgatggcc18660
ggaccggttttacaaatcagtaagcaggtcagtgcgtacgccatggccggagtggctcac18720
agtcggtggtccggcagtacaatggattaccgtaagacggaaatcactcccgggtatatg18780
aaagagacgaccactgccagggacgaaagtgcaatgcggcatacctcagtggcgtggagt18840
gcaggtatacagattaatccggcagcgtccgtcgttgttgatattgcttatgaaggctcc18900
ggcagtggcgactggcgtactgacggattcatcgttggggtcggttataaattctgatta18960
gccaggtaacacagtgttatgacagcccgccggaaccggtgggcttttttgtggggtgaa19020
tatggcagtaaagatttcaggagtcctgaaagacggcacaggaaaaccggtacagaactg19080
caccattcagctgaaagccagacgtaacagcaccacggtggtggtgaacacggtgggctc19140
agagaatccggatgaagccgggcgttacagcatggatgtggagtacggtcagtacagtgt19200
catcctgcaggttgacggttttccaccatcgcacgccgggaccatcaccgtgtatgaaga19260
ttcacaaccggggacgctgaatgattttctctgtgccatgacggaggatgatgcccggcc19320
ggaggtgctgcgtcgtcttgaactgatggtggaagaggtggcgcgtaacgcgtccgtggt19380
ggcacagagtacggcagacgcgaagaaatcagccggcgatgccagtgcatcagctgctca19440
ggtcgcggcccttgtgactgatgcaactgactcagcacgcgccgccagcacgtccgccgg19500
acaggctgcatcgtcagctcaggaagcgtcctccggcgcagaagcggcatcagcaaaggc19560
cactgaagcggaaaaaagtgccgcagccgcagagtcctcaaaaaacgcggcggccaccag19620
tgccggtgcggcgaaaacgtcagaaacgaatgctgcagcgtcacaacaatcagccgccac19680
gtctgcctccaccgcggccacgaaagcgtcagaggccgccacttcagcacgagatgcggt19740
ggcctcaaaagaggcagcaaaatcatcagaaacgaacgcatcatcaagtgccggtcgtgc19800
agcttcctcggcaacggcggcagaaaattctgccagggcggcaaaaacgtccgagacgaa19860
tgccaggtcatctgaaacagcagcggaacggagcgcctctgccgcggcagacgcaaaaac19920
agcggcggcggggagtgcgtcaacggcatccacgaaggcgacagaggctgcgggaagtgc19980
ggtatcagcatcgcagagcaaaagtgcggcagaagcggcggcaatacgtgcaaaaaattc20040
ggcaaaacgtgcagaagatatagcttcagctgtcgcgcttgaggatgcggacacaacgag20100
aaaggggatagtgcagctcagcagtgcaaccaacagcacgtctgaaacgcttgctgcaac20160
gccaaaggcggttaaggtggtaatggatgaaacgaacagaaaagcccactggacagtccg20220
gcactgaccggaacgccaacagcaccaaccgcgctcaggggaacaaacaatacccagatt20280
gcgaacaccgcttttgtactggccgcgattgcagatgttatcgacgcgtcacctgacgca20340
ctgaatacgctgaatgaactggccgcagcgctcgggaatgatccagattttgctaccacc20400
atgactaacgcgcttgcgggtaaacaaccgaagaatgcgacactgacggcgctggcaggg20460
ctttccacggcgaaaaataaattaccgtattttgcggaaaatgatgccgccagcctgact20520
gaactgactcaggttggcagggatattctggcaaaaaattccgttgcagatgttcttgaa20580
taccttggggccggtgagaattcggcctttccggcaggtgcgccgatcccgtggccatca20640
gatatcgttccgtctggctacgtcctgatgcaggggcaggcgtttgacaaatcagcctac20700
ccaaaacttgctgtcgcgtatccatcgggtgtgcttcctgatatgcgaggctggacaatc20760
aaggggaaacccgccagcggtcgtgctgtattgtctcaggaacaggatggaattaagtcg20820
cacacccacagtgccagtgcatccggtacggatttggggacgaaaaccacatcgtcgttt20880
gattacgggacgaaaacaacaggcagtttcgattacggcaccaaatcgacgaataacacg20940
ggggctcatgctcacagtctgagcggttcaacaggggccgcgggtgctcatgcccacaca21000
agtggtttaaggatgaacagttctggctggagtcagtatggaacagcaaccattacagga21060
agtttatccacagttaaaggaaccagcacacagggtattgcttatttatcgaaaacggac21120
agtcagggcagccacagtcactcattgtccggtacagccgtgagtgccggtgcacatgcg21180
catacagttggtattggtgcgcaccagcatccggttgttatcggtgctcatgcccattct21240
ttcagtattggttcacacggacacaccatcaccgttaacgctgcgggtaacgcggaaaac21300
accgtcaaaaacattgcatttaactatattgtgaggcttgcataatggcattcagaatga21360
gtgaacaaccacggaccataaaaatttataatctgctggccggaactaatgaatttattg21420
gtgaaggtgacgcatatattccgcctcataccggtctgcctgcaaacagtaccgatattg21480
caccgccagatattccggctggctttgtggctgttttcaacagtgatgaggcatcgtggc21540
atctcgttgaagaccatcggggtaaaaccgtctatgacgtggcttccggcgacgcgttat21600
ttatttctgaactcggtccgttaccggaaaattttacctggttatcgccgggaggggaat21660
atcagaagtggaacggcacagcctgggtgaaggatacggaagcagaaaaactgttccgga21720
tccgggaggcggaagaaacaaaaaaaagcctgatgcaggtagccagtgagcatattgcgc21780
cgcttcaggatgctgcagatctggaaattgcaacgaaggaagaaacctcgttgctggaag21840
cctggaagaagtatcgggtgttgctgaaccgtgttgatacatcaactgcacctgatattg21900
agtggcctgctgtccctgttatggagtaatcgttttgtgatatgccgcagaaacgttgta21960
tgaaataacgttctgcggttagttagtatattgtaaagctgagtattggtttatttggcg22020
attattatcttcaggagaataatggaagttctatgactcaattgttcatagtgtttacat22080
caccgccaattgcttttaagactgaacgcatgaaatatggtttttcgtcatgttttgagt22140
ctgctgttgatatttctaaagtcggttttttttcttcgttttctctaactattttccatg22200
aaatacatttttgattattatttgaatcaattccaattacctgaagtctttcatctataa22260
ttggcattgtatgtattggtttattggagtagatgcttgcttttctgagccatagctctg22320
atatccaaatgaagccataggcatttgttattttggctctgtcagctgcataacgccaaa22380
aaatatatttatctgcttgatcttcaaatgttgtattgattaaatcaattggatggaatt22440
gtttatcataaaaaattaatgtttgaatgtgataaccgtcctttaaaaaagtcgtttctg22500
caagcttggctgtatagtcaactaactcttctgtcgaagtgatatttttaggcttatcta22560
ccagttttagacgctctttaatatcttcaggaattattttattgtcatattgtatcatgc22620
taaatgacaatttgcttatggagtaatcttttaattttaaataagttattctcctggctt22680
catcaaataaagagtcgaatgatgttggcgaaatcacatcgtcacccattggattgttta22740
tttgtatgccaagagagttacagcagttatacattctgccatagattatagctaaggcat22800
gtaataattcgtaatcttttagcgtattagcgacccatcgtctttctgatttaataatag22860
atgattcagttaaatatgaaggtaatttcttttgtgcaagtctgactaacttttttatac22920
caatgtttaacatactttcatttgtaataaactcaatgtcattttcttcaatgtaagatg22980
aaataagagtagcctttgcctcgctatacatttctaaatcgccttgtttttctatcgtat23040
tgcgagaatttttagcccaagccattaatggatcatttttccatttttcaataacattat23100
tgttataccaaatgtcatatcctataatctggtttttgtttttttgaataataaatgtta23160
ctgttcttgcggtttggaggaattgattcaaattcaagcgaaataattcagggtcaaaat23220
atgtatcaatgcagcatttgagcaagtgcgataaatctttaagtcttctttcccatggtt23280
ttttagtcataaaactctccattttgataggttgcatgctagatgctgatatattttaga23340
ggtgataaaattaactgcttaactgtcaatgtaatacaagttgtttgatctttgcaatga23400
ttcttatcagaaaccatatagtaaattagttacacaggaaatttttaatattattattat23460
cattcattatgtattaaaattagagttgtggcttggctctgctaacacgttgctcatagg23520
agatatggtagagccgcagacacgtcgtatgcaggaacgtgctgcggctggctggtgaac23580
ttccgatagtgcgggtgttgaatgatttccagttgctaccgattttacatattttttgca23640
tgagagaatttgtaccacctcccaccgaccatctatgactgtacgccactgtccctagga23700
ctgctatgtgccggagcggacattacaaacgtccttctcggtgcatgccactgttgccaa23760
tgacctgcctaggaattggttagcaagttactaccggattttgtaaaaacagccctcctc23820
atataaaaagtattcgttcacttccgataagcgtcgtaattttctatctttcatcatatt23880
ctagatccctctgaaaaaatcttccgagtttgctaggcactgatacataactcttttcca23940
ataattggggaagtcattcaaatctataataggtttcagatttgcttcaataaattctga24000
ctgtagctgctgaaacgttgcggttgaactatatttccttataacttttacgaaagagtt24060
tctttgagtaatcacttcactcaagtgcttccctgcctccaaacgatacctgttagcaat24120
atttaatagcttgaaatgatgaagagctctgtgtttgtcttcctgcctccagttcgccgg24180
gcattcaacataaaaactgatagcacccggagttccggaaacgaaatttgcatataccca24240
ttgctcacgaaaaaaaatgtccttgtcgatatagggatgaatcgcttggtgtacctcatc24300
tactgcgaaaacttgacctttctctcccatattgcagtcgcggcacgatggaactaaatt24360
aataggcatcaccgaaaattcaggataatgtgcaataggaagaaaatgatctatattttt24420
tgtctgtcctatatcaccacaaaatggacatttttcacctgatgaaacaagcatgtcatc24480
gtaatatgttctagcgggtttgtttttatctcggagattattttcataaagcttttctaa24540
tttaacctttgtcaggttaccaactactaaggttgtaggctcaagagggtgtgtcctgtc24600
gtaggtaaataactgacctgtcgagcttaatattctatattgttgttctttctgcaaaaa24660
agtggggaagtgagtaatgaaattatttctaacatttatctgcatcataccttccgagca24720
tttattaagcatttcgctataagttctcgctggaagaggtagttttttcattgtacttta24780
ccttcatctctgttcattatcatcgcttttaaaacggttcgaccttctaatcctatctga24840
ccattataattttttagaatggtttcataagaaagctctgaatcaacggactgcgataat24900
aagtggtggtatccagaatttgtcacttcaagtaaaaacacctcacgagttaaaacacct24960
aagttctcaccgaatgtctcaatatccggacggataatatttattgcttctcttgaccgt25020
aggactttccacatgcaggattttggaacctcttgcagtactactggggaatgagttgca25080
attattgctacaccattgcgtgcatcgagtaagtcgcttaatgttcgtaaaaaagcagag25140
agcaaaggtggatgcagatgaacctctggttcatcgaataaaactaatgacttttcgcca25200
acgacatctactaatcttgtgatagtaaataaaacaattgcatgtccagagctcattcga25260
agcagatatttctggatattgtcataaaacaatttagtgaatttatcatcgtccacttga25320
atctgtggttcattacgtcttaactcttcatatttagaaatgaggctgatgagttccata25380
tttgaaaagttttcatcactacttagttttttgatagcttcaagccagagttgtcttttt25440
ctatctactctcatacaaccaataaatgctgaaatgaattctaagcggagatcgcctagt25500
gattttaaactattgctggcagcattcttgagtccaatataaaagtattgtgtacctttt25560
gctgggtcaggttgttctttaggaggagtaaaaggatcaaatgcactaaacgaaactgaa25620
acaagcgatcgaaaatatccctttgggattcttgactcgataagtctattattttcagag25680
aaaaaatattcattgttttctgggttggtgattgcaccaatcattccattcaaaattgtt25740
gttttaccacacccattccgcccgataaaagcatgaatgttcgtgctgggcatagaatta25800
accgtcacctcaaaaggtatagttaaatcactgaatccgggagcactttttctattaaat25860
gaaaagtggaaatctgacaattctggcaaaccatttaacacacgtgcgaactgtccatga25920
atttctgaaagagttacccctctaagtaatgaggtgttaaggacgctttcattttcaatg25980
tcggctaatcgatttggccatactactaaatcctgaatagctttaagaaggttatgttta26040
aaaccatcgcttaatttgctgagattaacatagtagtcaatgctttcacctaaggaaaaa26100
aacatttcagggagttgactgaattttttatctattaatgaataagtgcttacttcttct26160
ttttgacctacaaaaccaattttaacatttccgatatcgcatttttcaccatgctcatca26220
aagacagtaagataaaacattgtaacaaaggaatagtcattccaaccatctgctcgtagg26280
aatgccttatttttttctactgcaggaatatacccgcctctttcaataacactaaactcc26340
aacatatagtaacccttaattttattaaaataaccgcaatttatttggcggcaacacagg26400
atctctcttttaagttactctctattacatacgttttccatctaaaaattagtagtattg26460
aacttaacggggcatcgtattgtagttttccatatttagctttctgcttccttttggata26520
acccactgttattcatgttgcatggtgcactgtttataccaacgatatagtctattaatg26580
catatatagtatcgccgaacgattagctcttcaggcttctgaagaagcgtttcaagtact26640
aataagccgatagatagccacggacttcgtagccatttttcataagtgttaacttccgct26700
cctcgctcataacagacattcactacagttatggcggaaaggtatgcatgctgggtgtgg26760
ggaagtcgtgaaagaaaagaagtcagctgcgtcgtttgacatcactgctatcttcttact26820
ggttatgcaggtcgtagtgggtggcacacaaagctttgcactggattgcgaggctttgtg26880
cttctctggagtgcgacaggtttgatgacaaaaaattagcgcaagaagacaaaaatcacc26940
ttgcgctaatgctctgttacaggtcactaataccatctaagtagttgattcatagtgact27000
gcatatgttgtgttttacagtattatgtagtctgttttttatgcaaaatctaatttaata27060
tattgatatttatatcattttacgtttctcgttcagcttttttatactaagttggcatta27120
taaaaaagcattgcttatcaatttgttgcaacgaacaggtcactatcagtcaaaataaaa27180
tcattatttgatttcaattttgtcccactccctgcctctgtcatcacgatactgtgatgc27240
catggtgtccgacttatgcccgagaagatgttgagcaaacttatcgcttatctgcttctc27300
atagagtcttgcagacaaactgcgcaactcgtgaaaggtaggcggatccccttcgaagga27360
aagacctgatgcttttcgtgcgcgcataaaataccttgatactgtgccggatgaaagcgg27420
ttcgcgacgagtagatgcaattatggtttctccgccaagaatctctttgcatttatcaag27480
tgtttccttcattgatattccgagagcatcaatatgcaatgctgttgggatggcaatttt27540
tacgcctgttttgctttgctcgacataaagatatccatctacgatatcagaccacttcat27600
ttcgcataaatcaccaactcgttgcccggtaacaacagccagttccattgcaagtctgag27660
ccaacatggtgatgattctgctgcttgataaattttcaggtattcgtcagccgtaagtct27720
tgatctccttacctctgattttgctgcgcgagtggcagcgacatggtttgttgttatatg27780
gccttcagctattgcctctcggaatgcatcgctcagtgttgatctgattaacttggctga27840
cgccgccttgccctcgtctatgtatccattgagcattgccgcaatttcttttgtggtgat27900
gtcttcaagtggagcatcaggcagacccctccttattgctttaattttgctcatgtaatt27960
tatgagtgtcttctgcttgattcctctgctggccaggattttttcgtagcgatcaagcca28020
tgaatgtaacgtaacggaattatcactgttgattctcgctgtcagaggcttgtgtttgtg28080
tcctgaaaataactcaatgttggcctgtatagcttcagtgattgcgattcgcctgtctct28140
gcctaatccaaactctttacccgtccttgggtccctgtagcagtaatatccattgtttct28200
tatataaaggttagggggtaaatcccggcgctcatgacttcgccttcttcccatttctga28260
tcctcttcaaaaggccacctgttactggtcgatttaagtcaacctttaccgctgattcgt28320
ggaacagatactctcttccatccttaaccggaggtgggaatatcctgcattcccgaaccc28380
atcgacgaactgtttcaaggcttcttggacgtcgctggcgtgcgttccactcctgaagtg28440
tcaagtacatcgcaaagtctccgcaattacacgcaagaaaaaaccgccatcaggcggctt28500
ggtgttctttcagttcttcaattcgaatattggttacgtctgcatgtgctatctgcgccc28560
atatcatccagtggtcgtagcagtcgttgatgttctccgcttcgataactctgttgaatg28620
gctctccattccattctcctgtgactcggaagtgcatttatcatctccataaaacaaaac28680
ccgccgtagcgagttcagataaaataaatccccgcgagtgcgaggattgttatgtaatat28740
tgggtttaatcatctatatgttttgtacagagagggcaagtatcgtttccaccgtactcg28800
tgataataattttgcacggtatcagtcatttctcgcacattgcagaatggggatttgtct28860
tcattagacttataaaccttcatggaatatttgtatgccgactctatatctataccttca28920
tctacataaacaccttcgtgatgtctgcatggagacaagacaccggatctgcacaacatt28980
gataacgcccaatctttttgctcagactctaactcattgatactcatttataaactcctt29040
gcaatgtatgtcgtttcagctaaacggtatcagcaatgtttatgtaaagaaacagtaaga29100
taatactcaacccgatgtttgagtacggtcatcatctgacactacagactctggcatcgc29160
tgtgaagacgacgcgaaattcagcattttcacaagcgttatcttttacaaaaccgatctc29220
actctcctttgatgcgaatgccagcgtcagacatcatatgcagatactcacctgcatcct29280
gaacccattgacctccaaccccgtaatagcgatgcgtaatgatgtcgatagttactaacg29340
ggtcttgttcgattaactgccgcagaaactcttccaggtcaccagtgcagtgcttgataa29400
caggagtcttcccaggatggcgaacaacaagaaactggtttccgtcttcacggacttcgt29460
tgctttccagtttagcaatacgcttactcccatccgagataacaccttcgtaatactcac29520
gctgctcgttgagttttgattttgctgtttcaagctcaacacgcagtttccctactgtta29580
gcgcaatatcctcgttctcctggtcgcggcgtttgatgtattgctggtttctttcccgtt29640
catccagcagttccagcacaatcgatggtgttaccaattcatggaaaaggtctgcgtcaa29700
atccccagtcgtcatgcattgcctgctctgccgcttcacgcagtgcctgagagttaattt29760
cgctcacttcgaacctctctgtttactgataagttccagatcctcctggcaacttgcaca29820
agtccgacaaccctgaacgaccaggcgtcttcgttcatctatcggatcgccacactcaca29880
acaatgagtggcagatatagcctggtggttcaggcggcgcatttttattgctgtgttgcg29940
ctgtaattcttctatttctgatgctgaatcaatgatgtctgccatctttcattaatccct30000
gaactgttggttaatacgcttgagggtgaatgcgaataataaaaaaggagcctgtagctc30060
cctgatgattttgcttttcatgttcatcgttccttaaagacgccgtttaacatgccgatt30120
gccaggcttaaatgagtcggtgtgaatcccatcagcgttaccgtttcgcggtgcttcttc30180
agtacgctacggcaaatgtcatcgacgtttttatccggaaactgctgtctggcttttttt30240
gatttcagaattagcctgacgggcaatgctgcgaagggcgttttcctgctgaggtgtcat30300
tgaacaagtcccatgtcggcaagcataagcacacagaatatgaagcccgctgccagaaaa30360
atgcattccgtggttgtcatacctggtttctctcatctgcttctgctttcgccaccatca30420
tttccagcttttgtgaaagggatgcggctaacgtatgaaattcttcgtctgtttctactg30480
gtattggcacaaacctgattccaatttgagcaaggctatgtgccatctcgatactcgttc30540
ttaactcaacagaagatgctttgtgcatacagcccctcgtttattatttatctcctcagc30600
cagccgctgtgctttcagtggatttcggataacagaaaggccgggaaatacccagcctcg30660
ctttgtaacggagtagacgaaagtgattgcgcctacccggatattatcgtgaggatgcgt30720
catcgccattgctccccaaatacaaaaccaatttcagccagtgcctcgtccattttttcg30780
atgaactccggcacgatctcgtcaaaactcgccatgtacttttcatcccgctcaatcacg30840
acataatgcaggccttcacgcttcatacgcgggtcatagttggcaaagtaccaggcattt30900
tttcgcgtcacccacatgctgtactgcacctgggccatgtaagctgactttatggcctcg30960
aaaccaccgagccggaacttcatgaaatcccgggaggtaaacgggcatttcagttcaagg31020
ccgttgccgtcactgcataaaccatcgggagagcaggcggtacgcatactttcgtcgcga31080
tagatgatcggggattcagtaacattcacgccggaagtgaattcaaacagggttctggcg31140
tcgttctcgtactgttttccccaggccagtgctttagcgttaacttccggagccacaccg31200
gtgcaaacctcagcaagcagggtgtggaagtaggacattttcatgtcaggccacttcttt31260
ccggagcggggttttgctatcacgttgtgaacttctgaagcggtgatgacgccgagccgt31320
aatttgtgccacgcatcatccccctgttcgacagctctcacatcgatcccggtacgctgc31380
aggataatgtccggtgtcatgctgccaccttctgctctgcggctttctgtttcaggaatc31440
caagagcttttactgcttcggcctgtgtcagttctgacgatgcacgaatgtcgcggcgaa31500
atatctgggaacagagcggcaataagtcgtcatcccatgttttatccagggcgatcagca31560
gagtgttaatctcctgcatggtttcatcgttaaccggagtgatgtcgcgttccggctgac31620
gttctgcagtgtatgcagtattttcgacaatgcgctcggcttcatccttgtcatagatac31680
cagcaaatccgaaggccagacgggcacactgaatcatggctttatgacgtaacatccgtt31740
tgggatgcgactgccacggccccgtgatttctctgccttcgcgagttttgaatggttcgc31800
ggcggcattcatccatccattcggtaacgcagatcggatgattacggtccttgcggtaaa31860
tccggcatgtacaggattcattgtcctgctcaaagtccatgccatcaaactgctggtttt31920
cattgatgatgcgggaccagccatcaacgcccaccaccggaacgatgccattctgcttat31980
caggaaaggcgtaaatttctttcgtccacggattaaggccgtactggttggcaacgatca32040
gtaatgcgatgaactgcgcatcgctggcatcacctttaaatgccgtctggcgaagagtgg32100
tgatcagttcctgtgggtcgacagaatccatgccgacacgttcagccagcttcccagcca32160
gcgttgcgagtgcagtactcattcgttttatacctctgaatcaatatcaacctggtggtg32220
agcaatggtttcaaccatgtaccggatgtgttctgccatgcgctcctgaaactcaacatc32280
gtcatcaaacgcacgggtaatggattttttgctggccccgtggcgttgcaaatgatcgat32340
gcatagcgattcaaacaggtgctggggcaggcctttttccatgtcgtctgccagttctgc32400
ctctttctcttcacgggcgagctgctggtagtgacgcgcccagctctgagcctcaagacg32460
atcctgaatgtaataagcgttcatggctgaactcctgaaatagctgtgaaaatatcgccc32520
gcgaaatgccgggctgattaggaaaacaggaaagggggttagtgaatgcttttgcttgat32580
ctcagtttcagtattaatatccattttttataagcgtcgacggcttcacgaaacatcttt32640
tcatcgccaataaaagtggcgatagtgaatttagtctggatagccataagtgtttgatcc32700
attctttgggactcctggctgattaagtatgtcgataaggcgtttccatccgtcacgtaa32760
tttacgggtgattcgttcaagtaaagattcggaagggcagccagcaacaggccaccctgc32820
aatggcatattgcatggtgtgctccttatttatacataacgaaaaacgcctcgagtgaag32880
cgttattggtatgcggtaaaaccgcactcaggcggccttgatagtcatatcatctgaatc32940
aaatattcctgatgtatcgatatcggtaattcttattccttcgctaccatccattggagg33000
ccatccttcctgaccatttccatcattccagtcgaactcacacacaacaccatatgcatt33060
taagtcgcttgaaattgctataagcagagcatgttgcgccagcatgattaatacagcatt33120
taatacagagccgtgtttattgagtcggtattcagagtctgaccagaaattattaatctg33180
gtgaagtttttcctctgtcattacgtcatggtcgatttcaatttctattgatgctttcca33240
gtcgtaatcaatgatgtattttttgatgtttgacatctgttcatatcctcacagataaaa33300
aatcgccctcacactggagggcaaagaagatttccaataatcagaacaagtcggctcctg33360
tttagttacgagcgacattgctccgtgtattcactcgttggaatgaatacacagtgcagt33420
gtttattctgttatttatgccaaaaataaaggccactatcaggcagctttgttgttctgt33480
ttaccaagttctctggcaatcattgccgtcgttcgtattgcccatttatcgacatatttc33540
ccatcttccattacaggaaacatttcttcaggcttaaccatgcattccgattgcagcttg33600
catccattgcatcgcttgaattgtccacaccattgatttttatcaatagtcgtagtcata33660
cggatagtcctggtattgttccatcacatcctgaggatgctcttcgaactcttcaaattc33720
ttcttccatatatcaccttaaatagtggattgcggtagtaaagattgtgcctgtctttta33780
accacatcaggctcggtggttctcgtgtacccctacagcgagaaatcggataaactatta33840
caacccctacagtttgatgagtatagaaatggatccactcgttattctcggacgagtgtt33900
cagtaatgaacctctggagagaaccatgtatatgatcgttatctgggttggacttctgct33960
tttaagcccagataactggcctgaatatgttaatgagagaatcggtattcctcatgtgtg34020
gcatgttttcgtctttgctcttgcattttcgctagcaattaatgtgcatcgattatcagc34080
tattgccagcgccagatataagcgatttaagctaagaaaacgcattaagatgcaaaacga34140
taaagtgcgatcagtaattcaaaaccttacagaagagcaatctatggttttgtgcgcagc34200
ccttaatgaaggcaggaagtatgtggttacatcaaaacaattcccatacattagtgagtt34260
gattgagcttggtgtgttgaacaaaactttttcccgatggaatggaaagcatatattatt34320
ccctattgaggatatttactggactgaattagttgccagctatgatccatataatattga34380
gataaagccaaggccaatatctaagtaactagataagaggaatcgattttcccttaattt34440
tctggcgtccactgcatgttatgccgcgttcgccaggcttgctgtaccatgtgcgctgat34500
tcttgcgctcaatacgttgcaggttgctttcaatctgtttgtggtattcagccagcactg34560
taaggtctatcggatttagtgcgctttctactcgtgatttcggtttgcgattcagcgaga34620
gaatagggcggttaactggttttgcgcttaccccaaccaacaggggatttgctgctttcc34680
attgagcctgtttctctgcgcgacgttcgcggcggcgtgtttgtgcatccatctggattc34740
tcctgtcagttagctttggtggtgtgtggcagttgtagtcctgaacgaaaaccccccgcg34800
attggcacattggcagctaatccggaatcgcacttacggccaatgcttcgtttcgtatca34860
cacaccccaaagccttctgctttgaatgctgcccttcttcagggcttaatttttaagagc34920
gtcaccttcatggtggtcagtgcgtcctgctgatgtgctcagtatcaccgccagtggtat34980
ttatgtcaacaccgccagagataatttatcaccgcagatggttatctgtatgttttttat35040
atgaatttattttttgcaggggggcattgtttggtaggtgagagatctgaattgctatgt35100
ttagtgagttgtatctatttatttttcaataaatacaattggttatgtgttttgggggcg35160
atcgtgaggcaaagaaaacccggcgctgaggccgggttattcttgttctctggtcaaatt35220
atatagttggaaaacaaggatgcatatatgaatgaacgatgcagaggcaatgccgatggc35280
gatagtgggtatcatgtagccgcttatgctggaaagaagcaataacccgcagaaaaacaa35340
agctccaagctcaacaaaactaagggcatagacaataactaccgatgtcatatacccata35400
ctctctaatcttggccagtcggcgcgttctgcttccgattagaaacgtcaaggcagcaat35460
caggattgcaatcatggttcctgcatatgatgacaatgtcgccccaagaccatctctatg35520
agctgaaaaagaaacaccaggaatgtagtggcggaaaaggagatagcaaatgcttacgat35580
aacgtaaggaattattactatgtaaacaccaggcatgattctgttccgcataattactcc35640
tgataattaatccttaactttgcccacctgccttttaaaacattccagtatatcactttt35700
cattcttgcgtagcaatatgccatctcttcagctatctcagcattggtgaccttgttcag35760
aggcgctgagagatggcctttttctgatagataatgttctgttaaaatatctccggcctc35820
atcttttgcccgcaggctaatgtctgaaaattgaggtgacgggttaaaaataatatcctt35880
ggcaaccttttttatatcccttttaaattttggcttaatgactatatccaatgagtcaaa35940
aagctccccttcaatatctgttgcccctaagacctttaatatatcgccaaatacaggtag36000
cttggcttctaccttcaccgttgttcggccgatgaaatgcatatgcataacatcgtcttt36060
ggtggttcccctcatcagtggctctatctgaacgcgctctccactgcttaatgacattcc36120
tttcccgattaaaaaatctgtcagatcggatgtggtcggcccgaaaacagttctggcaaa36180
accaatggtgtcgccttcaacaaacaaaaaagatgggaatcccaatgattcgtcatctgc36240
gaggctgttcttaatatcttcaactgaagctttagagcgatttatcttctgaaccagact36300
cttgtcatttgttttggtaaagagaaaagtttttccatcgattttatgaatatacaaata36360
attggagccaacctgcaggtgatgattatcagccagcagagaattaaggaaaacagacag36420
gtttattgagcgcttatctttccctttatttttgctgcggtaagtcgcataaaaaccatt36480
cttcataattcaatccatttactatgttatgttctgaggggagtgaaaattcccctaatt36540
cgatgaagattcttgctcaattgttatcagctatgcgccgaccagaacaccttgccgatc36600
agccaaacgtctcttcaggccactgactagcgataactttccccacaacggaacaactct36660
cattgcatgggatcattgggtactgtgggtttagtggttgtaaaaacacctgaccgctat36720
ccctgatcagtttcttgaaggtaaactcatcacccccaagtctggctatgcagaaatcac36780
ctggctcaacagcctgctcagggtcaacgagaattaacattccgtcaggaaagcttggct36840
tggagcctgttggtgcggtcatggaattaccttcaacctcaagccagaatgcagaatcac36900
tggcttttttggttgtgcttacccatctctccgcatcacctttggtaaaggttctaagct36960
caggtgagaacatccctgcctgaacatgagaaaaaacagggtactcatactcacttctaa37020
gtgacggctgcatactaaccgcttcatacatctcgtagatttctctggcgattgaagggc37080
taaattcttcaacgctaactttgagaatttttgcaagcaatgcggcgttataagcattta37140
atgcattgatgccattaaataaagcaccaacgcctgactgccccatccccatcttgtctg37200
cgacagattcctgggataagccaagttcatttttctttttttcataaattgctttaaggc37260
gacgtgcgtcctcaagctgctcttgtgttaatggtttcttttttgtgctcatacgttaaa37320
tctatcaccgcaagggataaatatctaacaccgtgcgtgttgactattttacctctggcg37380
gtgataatggttgcatgtactaaggaggttgtatggaacaacgcataaccctgaaagatt37440
atgcaatgcgctttgggcaaaccaagacagctaaagatctcggcgtatatcaaagcgcga37500
tcaacaaggccattcatgcaggccgaaagatttttttaactataaacgctgatggaagcg37560
tttatgcggaagaggtaaagcccttcccgagtaacaaaaaaacaacagcataaataaccc37620
cgctcttacacattccagccctgaaaaagggcatcaaattaaaccacacctatggtgtat37680
gcatttatttgcatacattcaatcaattgttatctaaggaaatacttacatatggttcgt37740
gcaaacaaacgcaacgaggctctacgaatcgagagtgcgttgcttaacaaaatcgcaatg37800
cttggaactgagaagacagcggaagctgtgggcgttgataagtcgcagatcagcaggtgg37860
aagagggactggattccaaagttctcaatgctgcttgctgttcttgaatggggggtcgtt37920
gacgacgacatggctcgattggcgcgacaagttgctgcgattctcaccaataaaaaacgc37980
ccggcggcaaccgagcgttctgaacaaatccagatggagttctgaggtcattactggatc38040
tatcaacaggagtcattatgacaaatacagcaaaaatactcaacttcggcagaggtaact38100
ttgccggacaggagcgtaatgtggcagatctcgatgatggttacgccagactatcaaata38160
tgctgcttgaggcttattcgggcgcagatctgaccaagcgacagtttaaagtgctgcttg38220
ccattctgcgtaaaacctatgggtggaataaaccaatggacagaatcaccgattctcaac38280
ttagcgagattacaaagttacctgtcaaacggtgcaatgaagccaagttagaactcgtca38340
gaatgaatattatcaagcagcaaggcggcatgtttggaccaaataaaaacatctcagaat38400
ggtgcatccctcaaaacgagggaaaatcccctaaaacgagggataaaacatccctcaaat38460
tgggggattgctatccctcaaaacagggggacacaaaagacactattacaaaagaaaaaa38520
gaaaagattattcgtcagagaattctggcgaatcctctgaccagccagaaaacgaccttt38580
ctgtggtgaaaccggatgctgcaattcagagcggcagcaagtgggggacagcagaagacc38640
tgaccgccgcagagtggatgtttgacatggtgaagactatcgcaccatcagccagaaaac38700
cgaattttgctgggtgggctaacgatatccgcctgatgcgtgaacgtgacggacgtaacc38760
accgcga38767
<210>8
<211>9107
<212>dna
<213>artificialsequence
<220>
<223>lambdadna
<400>8
catgtgtgtgctgttccgctgggcatgccaggacaacttctggtccggtaacgtgctgag60
cccggccaaactccgcgataagtggacccaactcgaaatcaaccgtaacaagcaacaggc120
aggcgtgacagccagcaaaccaaaactcgacctgacaaacacagactggatttacggggt180
ggatctatgaaaaacatcgccgcacagatggttaactttgaccgtgagcagatgcgtcgg240
atcgccaacaacatgccggaacagtacgacgaaaagccgcaggtacagcaggtagcgcag300
atcatcaacggtgtgttcagccagttactggcaactttcccggcgagcctggctaaccgt360
gaccagaacgaagtgaacgaaatccgtcgccagtgggttctggcttttcgggaaaacggg420
atcaccacgatggaacaggttaacgcaggaatgcgcgtagcccgtcggcagaatcgacca480
tttctgccatcacccgggcagtttgttgcatggtgccgggaagaagcatccgttaccgcc540
ggactgccaaacgtcagcgagctggttgatatggtttacgagtattgccggaagcgaggc600
ctgtatccggatgcggagtcttatccgtggaaatcaaacgcgcactactggctggttacc660
aacctgtatcagaacatgcgggccaatgcgcttactgatgcggaattacgccgtaaggcc720
gcagatgagcttgtccatatgactgcgagaattaaccgtggtgaggcgatccctgaacca780
gtaaaacaacttcctgtcatgggcggtagacctctaaatcgtgcacaggctctggcgaag840
atcgcagaaatcaaagctaagttcggactgaaaggagcaagtgtatgacgggcaaagagg900
caattattcattacctggggacgcataatagcttctgtgcgccggacgttgccgcgctaa960
caggcgcaacagtaaccagcataaatcaggccgcggctaaaatggcacgggcaggtcttc1020
tggttatcgaaggtaaggtctggcgaacggtgtattaccggtttgctaccagggaagaac1080
gggaaggaaagatgagcacgaacctggtttttaaggagtgtcgccagagtgccgcgatga1140
aacgggtattggcggtatatggagttaaaagatgaccatctacattactgagctaataac1200
aggcctgctggtaatcgcaggcctttttatttgggggagagggaagtcatgaaaaaacta1260
acctttgaaattcgatctccagcacatcagcaaaacgctattcacgcagtacagcaaatc1320
cttccagacccaaccaaaccaatcgtagtaaccattcaggaacgcaaccgcagcttagac1380
caaaacaggaagctatgggcctgcttaggtgacgtctctcgtcaggttgaatggcatggt1440
cgctggctggatgcagaaagctggaagtgtgtgtttaccgcagcattaaagcagcaggat1500
gttgttcctaaccttgccgggaatggctttgtggtaataggccagtcaaccagcaggatg1560
cgtgtaggcgaatttgcggagctattagagcttatacaggcattcggtacagagcgtggc1620
gttaagtggtcagacgaagcgagactggctctggagtggaaagcgagatggggagacagg1680
gctgcatgataaatgtcgttagtttctccggtggcaggacgtcagcatatttgctctggc1740
taatggagcaaaagcgacgggcaggtaaagacgtgcattacgttttcatggatacaggtt1800
gtgaacatccaatgacatatcggtttgtcagggaagttgtgaagttctgggatataccgc1860
tcaccgtattgcaggttgatatcaacccggagcttggacagccaaatggttatacggtat1920
gggaaccaaaggatattcagacgcgaatgcctgttctgaagccatttatcgatatggtaa1980
agaaatatggcactccatacgtcggcggcgcgttctgcactgacagattaaaactcgttc2040
ccttcaccaaatactgtgatgaccatttcgggcgagggaattacaccacgtggattggca2100
tcagagctgatgaaccgaagcggctaaagccaaagcctggaatcagatatcttgctgaac2160
tgtcagactttgagaaggaagatatcctcgcatggtggaagcaacaaccattcgatttgc2220
aaataccggaacatctcggtaactgcatattctgcattaaaaaatcaacgcaaaaaatcg2280
gacttgcctgcaaagatgaggagggattgcagcgtgtttttaatgaggtcatcacgggat2340
cccatgtgcgtgacggacatcgggaaacgccaaaggagattatgtaccgaggaagaatgt2400
cgctggacggtatcgcgaaaatgtattcagaaaatgattatcaagccctgtatcaggaca2460
tggtacgagctaaaagattcgataccggctcttgttctgagtcatgcgaaatatttggag2520
ggcagcttgatttcgacttcgggagggaagctgcatgatgcgatgttatcggtgcggtga2580
atgcaaagaagataaccgcttccgaccaaatcaaccttactggaatcgatggtgtctccg2640
gtgtgaaagaacaccaacaggggtgttaccactaccgcaggaaaaggaggacgtgtggcg2700
agacagcgacgaagtatcaccgacataatctgcgaaaactgcaaataccttccaacgaaa2760
cgcaccagaaataaacccaagccaatcccaaaagaatctgacgtaaaaaccttcaactac2820
acggctcacctgtgggatatccggtggctaagacgtcgtgcgaggaaaacaaggtgattg2880
accaaaatcgaagttacgaacaagaaagcgtcgagcgagctttaacgtgcgctaactgcg2940
gtcagaagctgcatgtgctggaagttcacgtgtgtgagcactgctgcgcagaactgatga3000
gcgatccgaatagctcgatgcacgaggaagaagatgatggctaaaccagcgcgaagacga3060
tgtaaaaacgatgaatgccgggaatggtttcaccctgcattcgctaatcagtggtggtgc3120
tctccagagtgtggaaccaagatagcactcgaacgacgaagtaaagaacgcgaaaaagcg3180
gaaaaagcagcagagaagaaacgacgacgagaggagcagaaacagaaagataaacttaag3240
attcgaaaactcgccttaaagccccgcagttactggattaaacaagcccaacaagccgta3300
aacgccttcatcagagaaagagaccgcgacttaccatgtatctcgtgcggaacgctcacg3360
tctgctcagtgggatgccggacattaccggacaactgctgcggcacctcaactccgattt3420
aatgaacgcaatattcacaagcaatgcgtggtgtgcaaccagcacaaaagcggaaatctc3480
gttccgtatcgcgtcgaactgattagccgcatcgggcaggaagcagtagacgaaatcgaa3540
tcaaaccataaccgccatcgctggactatcgaagagtgcaaggcgatcaaggcagagtac3600
caacagaaactcaaagacctgcgaaatagcagaagtgaggccgcatgacgttctcagtaa3660
aaaccattccagacatgctcgttgaagcatacggaaatcagacagaagtagcacgcagac3720
tgaaatgtagtcgcggtacggtcagaaaatacgttgatgataaagacgggaaaatgcacg3780
ccatcgtcaacgacgttctcatggttcatcgcggatggagtgaaagagatgcgctattac3840
gaaaaaattgatggcagcaaataccgaaatatttgggtagttggcgatctgcacggatgc3900
tacacgaacctgatgaacaaactggatacgattggattcgacaacaaaaaagacctgctt3960
atctcggtgggcgatttggttgatcgtggtgcagagaacgttgaatgcctggaattaatc4020
acattcccctggttcagagctgtacgtggaaaccatgagcaaatgatgattgatggctta4080
tcagagcgtggaaacgttaatcactggctgcttaatggcggtggctggttctttaatctc4140
gattacgacaaagaaattctggctaaagctcttgcccataaagcagatgaacttccgtta4200
atcatcgaactggtgagcaaagataaaaaatatgttatctgccacgccgattatcccttt4260
gacgaatacgagtttggaaagccagttgatcatcagcaggtaatctggaaccgcgaacga4320
atcagcaactcacaaaacgggatcgtgaaagaaatcaaaggcgcggacacgttcatcttt4380
ggtcatacgccagcagtgaaaccactcaagtttgccaaccaaatgtatatcgataccggc4440
gcagtgttctgcggaaacctaacattgattcaggtacagggagaaggcgcatgagactcg4500
aaagcgtagctaaatttcattcgccaaaaagcccgatgatgagcgactcaccacgggcca4560
cggcttctgactctctttccggtactgatgtgatggctgctatggggatggcgcaatcac4620
aagccggattcggtatggctgcattctgcggtaagcacgaactcagccagaacgacaaac4680
aaaaggctatcaactatctgatgcaatttgcacacaaggtatcggggaaataccgtggtg4740
tggcaaagcttgaaggaaatactaaggcaaaggtactgcaagtgctcgcaacattcgctt4800
atgcggattattgccgtagtgccgcgacgccgggggcaagatgcagagattgccatggta4860
caggccgtgcggttgatattgccaaaacagagctgtgggggagagttgtcgagaaagagt4920
gcggaagatgcaaaggcgtcggctattcaaggatgccagcaagcgcagcatatcgcgctg4980
tgacgatgctaatcccaaaccttacccaacccacctggtcacgcactgttaagccgctgt5040
atgacgctctggtggtgcaatgccacaaagaagagtcaatcgcagacaacattttgaatg5100
cggtcacacgttagcagcatgattgccacggatggcaacatattaacggcatgatattga5160
cttattgaataaaattgggtaaatttgactcaacgatgggttaattcgctcgttgtggta5220
gtgagatgaaaagaggcggcgcttactaccgattccgcctagttggtcacttcgacgtat5280
cgtctggaactccaaccatcgcaggcagagaggtctgcaaaatgcaatcccgaaacagtt5340
cgcaggtaatagttagagcctgcataacggtttcgggattttttatatctgcacaacagg5400
taagagcattgagtcgataatcgtgaagagtcggcgagcctggttagccagtgctctttc5460
cgttgtgctgaattaagcgaataccggaagcagaaccggatcaccaaatgcgtacaggcg5520
tcatcgccgcccagcaacagcacaacccaaactgagccgtagccactgtctgtcctgaat5580
tcattagtaatagttacgctgcggccttttacacatgaccttcgtgaaagcgggtggcag5640
gaggtcgcgctaacaacctcctgccgttttgcccgtgcatatcggtcacgaacaaatctg5700
attactaaacacagtagcctggatttgttctatcagtaatcgaccttattcctaattaaa5760
tagagcaaatccccttattgggggtaagacatgaagatgccagaaaaacatgacctgttg5820
gccgccattctcgcggcaaaggaacaaggcatcggggcaatccttgcgtttgcaatggcg5880
taccttcgcggcagatataatggcggtgcgtttacaaaaacagtaatcgacgcaacgatg5940
tgcgccattatcgcctggttcattcgtgaccttctcgacttcgccggactaagtagcaat6000
ctcgcttatataacgagcgtgtttatcggctacatcggtactgactcgattggttcgctt6060
atcaaacgcttcgctgctaaaaaagccggagtagaagatggtagaaatcaataatcaacg6120
taaggcgttcctcgatatgctggcgtggtcggagggaactgataacggacgtcagaaaac6180
cagaaatcatggttatgacgtcattgtaggcggagagctatttactgattactccgatca6240
ccctcgcaaacttgtcacgctaaacccaaaactcaaatcaacaggcgccggacgctacca6300
gcttctttcccgttggtgggatgcctaccgcaagcagcttggcctgaaagacttctctcc6360
gaaaagtcaggacgctgtggcattgcagcagattaaggagcgtggcgctttacctatgat6420
tgatcgtggtgatatccgtcaggcaatcgaccgttgcagcaatatctgggcttcactgcc6480
gggcgctggttatggtcagttcgagcataaggctgacagcctgattgcaaaattcaaaga6540
agcgggcggaacggtcagagagattgatgtatgagcagagtcaccgcgattatctccgct6600
ctggttatctgcatcatcgtctgcctgtcatgggctgttaatcattaccgtgataacgcc6660
attacctacaaagcccagcgcgacaaaaatgccagagaactgaagctggcgaacgcggca6720
attactgacatgcagatgcgtcagcgtgatgttgctgcgctcgatgcaaaatacacgaag6780
gagttagctgatgctaaagctgaaaatgatgctctgcgtgatgatgttgccgctggtcgt6840
cgtcggttgcacatcaaagcagtctgtcagtcagtgcgtgaagccaccaccgcctccggc6900
gtggataatgcagcctccccccgactggcagacaccgctgaacgggattatttcaccctc6960
agagagaggctgatcactatgcaaaaacaactggaaggaacccagaagtatattaatgag7020
cagtgcagatagagttgcccatatcgatgggcaactcatgcaattattgtgagcaataca7080
cacgcgcttccagcggagtataaatgcctaaagtaataaaaccgagcaatccatttacga7140
atgtttgctgggtttctgttttaacaacattttctgcgccgccacaaattttggctgcat7200
cgacagttttcttctgcccaattccagaaacgaagaaatgatgggtgatggtttcctttg7260
gtgctactgctgccggtttgttttgaacagtaaacgtctgttgagcacatcctgtaataa7320
gcagggccagcgcagtagcgagtagcatttttttcatggtgttattcccgatgctttttg7380
aagttcgcagaatcgtatgtgtagaaaattaaacaaaccctaaacaatgagttgaaattt7440
catattgttaatatttattaatgtatgtcaggtgcgatgaatcgtcattgtattcccgga7500
ttaactatgtccacagccctgacggggaacttctctgcgggagtgtccgggaataattaa7560
aacgatgcacacagggtttagcgcgtacacgtattgcattatgccaacgccccggtgctg7620
acacggaagaaaccggacgttatgatttagcgtggaaagatttgtgtagtgttctgaatg7680
ctctcagtaaatagtaatgaattatcaaaggtatagtaatatcttttatgttcatggata7740
tttgtaacccatcggaaaactcctgctttagcaagattttccctgtattgctgaaatgtg7800
atttctcttgatttcaacctatcataggacgtttctataagatgcgtgtttcttgagaat7860
ttaacatttacaacctttttaagtccttttattaacacggtgttatcgttttctaacacg7920
atgtgaatattatctgtggctagatagtaaatataatgtgagacgttgtgacgttttagt7980
tcagaataaaacaattcacagtctaaatcttttcgcacttgatcgaatatttctttaaaa8040
atggcaacctgagccattggtaaaaccttccatgtgatacgagggcgcgtagtttgcatt8100
atcgtttttatcgtttcaatctggtctgacctccttgtgttttgttgatgatttatgtca8160
aatattaggaatgttttcacttaatagtattggttgcgtaacaaagtgcggtcctgctgg8220
cattctggagggaaatacaaccgacagatgtatgtaaggccaacgtgctcaaatcttcat8280
acagaaagatttgaagtaatattttaaccgctagatgaagagcaagcgcatggagcgaca8340
aaatgaataaagaacaatctgctgatgatccctccgtggatctgattcgtgtaaaaaata8400
tgcttaatagcaccatttctatgagttaccctgatgttgtaattgcatgtatagaacata8460
aggtgtctctggaagcattcagagcaattgaggcagcgttggtgaagcacgataataata8520
tgaaggattattccctggtggttgactgatcaccataactgctaatcattcaaactattt8580
agtctgtgacagagccaacacgcagtctgtcactgtcaggaaagtggtaaaactgcaact8640
caattactgcaatgccctcgtaattaagtgaatttacaatatcgtcctgttcggagggaa8700
gaacgcgggatgttcattcttcatcacttttaattgatgtatatgctctcttttctgacg8760
ttagtctccgacggcaggcttcaatgacccaggctgagaaattcccggaccctttttgct8820
caagagcgatgttaatttgttcaatcatttggttaggaaagcggatgttgcgggttgttg8880
ttctgcgggttctgttcttcgttgacatgaggttgccccgtattcagtgtcgctgatttg8940
tattgtctgaagttgtttttacgttaagttgatgcagatcaattaatacgatacctgcgt9000
cataattgattatttgacgtggtttgatggcctccacgcacgttgtgatatgtagatgat9060
aatcattatcactttacgggtcctttccggtgatccgacaggttacg9107
<210>9
<211>19604
<212>dna
<213>artificialsequence
<220>
<223>lambdadna
<400>9
catgttgatttcctgaaacgggatatcatcaaagccatgaacaaagcagccgcgctggat60
gaactgataccggggttgctgagtgaatatatcgaacagtcaggttaacaggctgcggca120
ttttgtccgcgccgggcttcgctcactgttcaggccggagccacagaccgccgttgaatg180
ggcggatgctaattactatctcccgaaagaatccgcataccaggaagggcgctgggaaac240
actgccctttcagcgggccatcatgaatgcgatgggcagcgactacatccgtgaggtgaa300
tgtggtgaagtctgcccgtgtcggttattccaaaatgctgctgggtgtttatgcctactt360
tatagagcataagcagcgcaacacccttatctggttgccgacggatggtgatgccgagaa420
ctttatgaaaacccacgttgagccgactattcgtgatattccgtcgctgctggcgctggc480
cccgtggtatggcaaaaagcaccgggataacacgctcaccatgaagcgtttcactaatgg540
gcgtggcttctggtgcctgggcggtaaagcggcaaaaaactaccgtgaaaagtcggtgga600
tgtggcgggttatgatgaacttgctgcttttgatgatgatattgaacaggaaggctctcc660
gacgttcctgggtgacaagcgtattgaaggctcggtctggccaaagtccatccgtggctc720
cacgccaaaagtgagaggcacctgtcagattgagcgtgcagccagtgaatccccgcattt780
tatgcgttttcatgttgcctgcccgcattgcggggaggagcagtatcttaaatttggcga840
caaagagacgccgtttggcctcaaatggacgccggatgacccctccagcgtgttttatct900
ctgcgagcataatgcctgcgtcatccgccagcaggagctggactttactgatgcccgtta960
tatctgcgaaaagaccgggatctggacccgtgatggcattctctggttttcgtcatccgg1020
tgaagagattgagccacctgacagtgtgacctttcacatctggacagcgtacagcccgtt1080
caccacctgggtgcagattgtcaaagactggatgaaaacgaaaggggatacgggaaaacg1140
taaaaccttcgtaaacaccacgctcggtgagacgtgggaggcgaaaattggcgaacgtcc1200
ggatgctgaagtgatggcagagcggaaagagcattattcagcgcccgttcctgaccgtgt1260
ggcttacctgaccgccggtatcgactcccagctggaccgctacgaaatgcgcgtatgggg1320
atgggggccgggtgaggaaagctggctgattgaccggcagattattatgggccgccacga1380
cgatgaacagacgctgctgcgtgtggatgaggccatcaataaaacctatacccgccggaa1440
tggtgcagaaatgtcgatatcccgtatctgctgggatactggcgggattgacccgaccat1500
tgtgtatgaacgctcgaaaaaacatgggctgttccgggtgatccccattaaaggggcatc1560
cgtctacggaaagccggtggccagcatgccacgtaagcgaaacaaaaacggggtttacct1620
taccgaaatcggtacggataccgcgaaagagcagatttataaccgcttcacactgacgcc1680
ggaaggggatgaaccgcttcccggtgccgttcacttcccgaataacccggatatttttga1740
tctgaccgaagcgcagcagctgactgctgaagagcaggtcgaaaaatgggtggatggcag1800
gaaaaaaatactgtgggacagcaaaaagcgacgcaatgaggcactcgactgcttcgttta1860
tgcgctggcggcgctgcgcatcagtatttcccgctggcagctggatctcagtgcgctgct1920
ggcgagcctgcaggaagaggatggtgcagcaaccaacaagaaaacactggcagattacgc1980
ccgtgccttatccggagaggatgaatgacgcgacaggaagaacttgccgctgcccgtgcg2040
gcactgcatgacctgatgacaggtaaacgggtggcaacagtacagaaagacggacgaagg2100
gtggagtttacggccacttccgtgtctgacctgaaaaaatatattgcagagctggaagtg2160
cagaccggcatgacacagcgacgcaggggacctgcaggattttatgtatgaaaacgccca2220
ccattcccacccttctggggccggacggcatgacatcgctgcgcgaatatgccggttatc2280
acggcggtggcagcggatttggagggcagttgcggtcgtggaacccaccgagtgaaagtg2340
tggatgcagccctgttgcccaactttacccgtggcaatgcccgcgcagacgatctggtac2400
gcaataacggctatgccgccaacgccatccagctgcatcaggatcatatcgtcgggtctt2460
ttttccggctcagtcatcgcccaagctggcgctatctgggcatcggggaggaagaagccc2520
gtgccttttcccgcgaggttgaagcggcatggaaagagtttgccgaggatgactgctgct2580
gcattgacgttgagcgaaaacgcacgtttaccatgatgattcgggaaggtgtggccatgc2640
acgcctttaacggtgaactgttcgttcaggccacctgggataccagttcgtcgcggcttt2700
tccggacacagttccggatggtcagcccgaagcgcatcagcaacccgaacaataccggcg2760
acagccggaactgccgtgccggtgtgcagattaatgacagcggtgcggcgctgggatatt2820
acgtcagcgaggacgggtatcctggctggatgccgcagaaatggacatggataccccgtg2880
agttacccggcgggcgcgcctcgttcattcacgtttttgaacccgtggaggacgggcaga2940
ctcgcggtgcaaatgtgttttacagcgtgatggagcagatgaagatgctcgacacgctgc3000
agaacacgcagctgcagagcgccattgtgaaggcgatgtatgccgccaccattgagagtg3060
agctggatacgcagtcagcgatggattttattctgggcgcgaacagtcaggagcagcggg3120
aaaggctgaccggctggattggtgaaattgccgcgtattacgccgcagcgccggtccggc3180
tgggaggcgcaaaagtaccgcacctgatgccgggtgactcactgaacctgcagacggctc3240
aggatacggataacggctactccgtgtttgagcagtcactgctgcggtatatcgctgccg3300
ggctgggtgtctcgtatgagcagctttcccggaattacgcccagatgagctactccacgg3360
cacgggccagtgcgaacgagtcgtgggcgtactttatggggcggcgaaaattcgtcgcat3420
cccgtcaggcgagccagatgtttctgtgctggctggaagaggccatcgttcgccgcgtgg3480
tgacgttaccttcaaaagcgcgcttcagttttcaggaagcccgcagtgcctgggggaact3540
gcgactggataggctccggtcgtatggccatcgatggtctgaaagaagttcaggaagcgg3600
tgatgctgatagaagccggactgagtacctacgagaaagagtgcgcaaaacgcggtgacg3660
actatcaggaaatttttgcccagcaggtccgtgaaacgatggagcgccgtgcagccggtc3720
ttaaaccgcccgcctgggcggctgcagcatttgaatccgggctgcgacaatcaacagagg3780
aggagaagagtgacagcagagctgcgtaatctcccgcatattgccagcatggcctttaat3840
gagccgctgatgcttgaacccgcctatgcgcgggttttcttttgtgcgcttgcaggccag3900
cttgggatcagcagcctgacggatgcggtgtccggcgacagcctgactgcccaggaggca3960
ctcgcgacgctggcattatccggtgatgatgacggaccacgacaggcccgcagttatcag4020
gtcatgaacggcatcgccgtgctgccggtgtccggcacgctggtcagccggacgcgggcg4080
ctgcagccgtactcggggatgaccggttacaacggcattatcgcccgtctgcaacaggct4140
gccagcgatccgatggtggacggcattctgctcgatatggacacgcccggcgggatggtg4200
gcgggggcatttgactgcgctgacatcatcgcccgtgtgcgtgacataaaaccggtatgg4260
gcgcttgccaacgacatgaactgcagtgcaggtcagttgcttgccagtgccgcctcccgg4320
cgtctggtcacgcagaccgcccggacaggctccatcggcgtcatgatggctcacagtaat4380
tacggtgctgcgctggagaaacagggtgtggaaatcacgctgatttacagcggcagccat4440
aaggtggatggcaacccctacagccatcttccggatgacgtccgggagacactgcagtcc4500
cggatggacgcaacccgccagatgtttgcgcagaaggtgtcggcatataccggcctgtcc4560
gtgcaggttgtgctggataccgaggctgcagtgtacagcggtcaggaggccattgatgcc4620
ggactggctgatgaacttgttaacagcaccgatgcgatcaccgtcatgcgtgatgcactg4680
gatgcacgtaaatcccgtctctcaggagggcgaatgaccaaagagactcaatcaacaact4740
gtttcagccactgcttcgcaggctgacgttactgacgtggtgccagcgacggagggcgag4800
aacgccagcgcggcgcagccggacgtgaacgcgcagatcaccgcagcggttgcggcagaa4860
aacagccgcattatggggatcctcaactgtgaggaggctcacggacgcgaagaacaggca4920
cgcgtgctggcagaaacccccggtatgaccgtgaaaacggcccgccgcattctggccgca4980
gcaccacagagtgcacaggcgcgcagtgacactgcgctggatcgtctgatgcagggggca5040
ccggcaccgctggctgcaggtaacccggcatctgatgccgttaacgatttgctgaacaca5100
ccagtgtaagggatgtttatgacgagcaaagaaacctttacccattaccagccgcagggc5160
aacagtgacccggctcataccgcaaccgcgcccggcggattgagtgcgaaagcgcctgca5220
atgaccccgctgatgctggacacctccagccgtaagctggttgcgtgggatggcaccacc5280
gacggtgctgccgttggcattcttgcggttgctgctgaccagaccagcaccacgctgacg5340
ttctacaagtccggcacgttccgttatgaggatgtgctctggccggaggctgccagcgac5400
gagacgaaaaaacggaccgcgtttgccggaacggcaatcagcatcgtttaactttaccct5460
tcatcactaaaggccgcctgtgcggctttttttacgggatttttttatgtcgatgtacac5520
aaccgcccaactgctggcggcaaatgagcagaaatttaagtttgatccgctgtttctgcg5580
tctctttttccgtgagagctatcccttcaccacggagaaagtctatctctcacaaattcc5640
gggactggtaaacatggcgctgtacgtttcgccgattgtttccggtgaggttatccgttc5700
ccgtggcggctccacctctgaatttacgccgggatatgtcaagccgaagcatgaagtgaa5760
tccgcagatgaccctgcgtcgcctgccggatgaagatccgcagaatctggcggacccggc5820
ttaccgccgccgtcgcatcatcatgcagaacatgcgtgacgaagagctggccattgctca5880
ggtcgaagagatgcaggcagtttctgccgtgcttaagggcaaatacaccatgaccggtga5940
agccttcgatccggttgaggtggatatgggccgcagtgaggagaataacatcacgcagtc6000
cggcggcacggagtggagcaagcgtgacaagtccacgtatgacccgaccgacgatatcga6060
agcctacgcgctgaacgccagcggtgtggtgaatatcatcgtgttcgatccgaaaggctg6120
ggcgctgttccgttccttcaaagccgtcaaggagaagctggatacccgtcgtggctctaa6180
ttccgagctggagacagcggtgaaagacctgggcaaagcggtgtcctataaggggatgta6240
tggcgatgtggccatcgtcgtgtattccggacagtacgtggaaaacggcgtcaaaaagaa6300
cttcctgccggacaacacgatggtgctggggaacactcaggcacgcggtctgcgcaccta6360
tggctgcattcaggatgcggacgcacagcgcgaaggcattaacgcctctgcccgttaccc6420
gaaaaactgggtgaccaccggcgatccggcgcgtgagttcaccatgattcagtcagcacc6480
gctgatgctgctggctgaccctgatgagttcgtgtccgtacaactggcgtaatcatggcc6540
cttcggggccattgtttctctgtggaggagtccatgacgaaagatgaactgattgcccgt6600
ctccgctcgctgggtgaacaactgaaccgtgatgtcagcctgacggggacgaaagaagaa6660
ctggcgctccgtgtggcagagctgaaagaggagcttgatgacacggatgaaactgccggt6720
caggacacccctctcagccgggaaaatgtgctgaccggacatgaaaatgaggtgggatca6780
gcgcagccggataccgtgattctggatacgtctgaactggtcacggtcgtggcactggtg6840
aagctgcatactgatgcacttcacgccacgcgggatgaacctgtggcatttgtgctgccg6900
ggaacggcgtttcgtgtctctgccggtgtggcagccgaaatgacagagcgcggcctggcc6960
agaatgcaataacgggaggcgctgtggctgatttcgataacctgttcgatgctgccattg7020
cccgcgccgatgaaacgatacgcgggtacatgggaacgtcagccaccattacatccggtg7080
agcagtcaggtgcggtgatacgtggtgtttttgatgaccctgaaaatatcagctatgccg7140
gacagggcgtgcgcgttgaaggctccagcccgtccctgtttgtccggactgatgaggtgc7200
ggcagctgcggcgtggagacacgctgaccatcggtgaggaaaatttctgggtagatcggg7260
tttcgccggatgatggcggaagttgtcatctctggcttggacggggcgtaccgcctgccg7320
ttaaccgtcgccgctgaaagggggatgtatggccataaaaggtcttgagcaggccgttga7380
aaacctcagccgtatcagcaaaacggcggtgcctggtgccgccgcaatggccattaaccg7440
cgttgcttcatccgcgatatcgcagtcggcgtcacaggttgcccgtgagacaaaggtacg7500
ccggaaactggtaaaggaaagggccaggctgaaaagggccacggtcaaaaatccgcaggc7560
cagaatcaaagttaaccggggggatttgcccgtaatcaagctgggtaatgcgcgggttgt7620
cctttcgcgccgcaggcgtcgtaaaaaggggcagcgttcatccctgaaaggtggcggcag7680
cgtgcttgtggtgggtaaccgtcgtattcccggcgcgtttattcagcaactgaaaaatgg7740
ccggtggcatgtcatgcagcgtgtggctgggaaaaaccgttaccccattgatgtggtgaa7800
aatcccgatggcggtgccgctgaccacggcgtttaaacaaaatattgagcggatacggcg7860
tgaacgtcttccgaaagagctgggctatgcgctgcagcatcaactgaggatggtaataaa7920
gcgatgaaacatactgaactccgtgcagccgtactggatgcactggagaagcatgacacc7980
ggggcgacgttttttgatggtcgccccgctgtttttgatgaggcggattttccggcagtt8040
gccgtttatctcaccggcgctgaatacacgggcgaagagctggacagcgatacctggcag8100
gcggagctgcatatcgaagttttcctgcctgctcaggtgccggattcagagctggatgcg8160
tggatggagtcccggatttatccggtgatgagcgatatcccggcactgtcagatttgatc8220
accagtatggtggccagcggctatgactaccggcgcgacgatgatgcgggcttgtggagt8280
tcagccgatctgacttatgtcattacctatgaaatgtgaggacgctatgcctgtaccaaa8340
tcctacaatgccggtgaaaggtgccgggaccaccctgtgggtttataaggggagcggtga8400
cccttacgcgaatccgctttcagacgttgactggtcgcgtctggcaaaagttaaagacct8460
gacgcccggcgaactgaccgctgagtcctatgacgacagctatctcgatgatgaagatgc8520
agactggactgcgaccgggcaggggcagaaatctgccggagataccagcttcacgctggc8580
gtggatgcccggagagcaggggcagcaggcgctgctggcgtggtttaatgaaggcgatac8640
ccgtgcctataaaatccgcttcccgaacggcacggtcgatgtgttccgtggctgggtcag8700
cagtatcggtaaggcggtgacggcgaaggaagtgatcacccgcacggtgaaagtcaccaa8760
tgtgggacgtccgtcgatggcagaagatcgcagcacggtaacagcggcaaccggcatgac8820
cgtgacgcctgccagcacctcggtggtgaaagggcagagcaccacgctgaccgtggcctt8880
ccagccggagggcgtaaccgacaagagctttcgtgcggtgtctgcggataaaacaaaagc8940
caccgtgtcggtcagtggtatgaccatcaccgtgaacggcgttgctgcaggcaaggtcaa9000
cattccggttgtatccggtaatggtgagtttgctgcggttgcagaaattaccgtcaccgc9060
cagttaatccggagagtcagcgatgttcctgaaaaccgaatcatttgaacataacggtgt9120
gaccgtcacgctttctgaactgtcagccctgcagcgcattgagcatctcgccctgatgaa9180
acggcaggcagaacaggcggagtcagacagcaaccggaagtttactgtggaagacgccat9240
cagaaccggcgcgtttctggtggcgatgtccctgtggcataaccatccgcagaagacgca9300
gatgccgtccatgaatgaagccgttaaacagattgagcaggaagtgcttaccacctggcc9360
cacggaggcaatttctcatgctgaaaacgtggtgtaccggctgtctggtatgtatgagtt9420
tgtggtgaataatgcccctgaacagacagaggacgccgggcccgcagagcctgtttctgc9480
gggaaagtgttcgacggtgagctgagttttgccctgaaactggcgcgtgagatggggcga9540
cccgactggcgtgccatgcttgccgggatgtcatccacggagtatgccgactggcaccgc9600
ttttacagtacccattattttcatgatgttctgctggatatgcacttttccgggctgacg9660
tacaccgtgctcagcctgtttttcagcgatccggatatgcatccgctggatttcagtctg9720
ctgaaccggcgcgaggctgacgaagagcctgaagatgatgtgctgatgcagaaagcggca9780
gggcttgccggaggtgtccgctttggcccggacgggaatgaagttatccccgcttccccg9840
gatgtggcggacatgacggaggatgacgtaatgctgatgacagtatcagaagggatcgca9900
ggaggagtccggtatggctgaaccggtaggcgatctggtcgttgatttgagtctggatgc9960
ggccagatttgacgagcagatggccagagtcaggcgtcatttttctggtacggaaagtga10020
tgcgaaaaaaacagcggcagtcgttgaacagtcgctgagccgacaggcgctggctgcaca10080
gaaagcggggatttccgtcgggcagtataaagccgccatgcgtatgctgcctgcacagtt10140
caccgacgtggccacgcagcttgcaggcgggcaaagtccgtggctgatcctgctgcaaca10200
gggggggcaggtgaaggactccttcggcgggatgatccccatgttcagggggcttgccgg10260
tgcgatcaccctgccgatggtgggggccacctcgctggcggtggcgaccggtgcgctggc10320
gtatgcctggtatcagggcaactcaaccctgtccgatttcaacaaaacgctggtcctttc10380
cggcaatcaggcgggactgacggcagatcgtatgctggtcctgtccagagccgggcaggc10440
ggcagggctgacgtttaaccagaccagcgagtcactcagcgcactggttaaggcgggggt10500
aagcggtgaggctcagattgcgtccatcagccagagtgtggcgcgtttctcctctgcatc10560
cggcgtggaggtggacaaggtcgctgaagccttcgggaagctgaccacagacccgacgtc10620
ggggctgacggcgatggctcgccagttccataacgtgtcggcggagcagattgcgtatgt10680
tgctcagttgcagcgttccggcgatgaagccggggcattgcaggcggcgaacgaggccgc10740
aacgaaagggtttgatgaccagacccgccgcctgaaagagaacatgggcacgctggagac10800
ctgggcagacaggactgcgcgggcattcaaatccatgtgggatgcggtgctggatattgg10860
tcgtcctgataccgcgcaggagatgctgattaaggcagaggctgcgtataagaaagcaga10920
cgacatctggaatctgcgcaaggatgattattttgttaacgatgaagcgcgggcgcgtta10980
ctgggatgatcgtgaaaaggcccgtcttgcgcttgaagccgcccgaaagaaggctgagca11040
gcagactcaacaggacaaaaatgcgcagcagcagagcgataccgaagcgtcacggctgaa11100
atataccgaagaggcgcagaaggcttacgaacggctgcagacgccgctggagaaatatac11160
cgcccgtcaggaagaactgaacaaggcactgaaagacgggaaaatcctgcaggcggatta11220
caacacgctgatggcggcggcgaaaaaggattatgaagcgacgctgaaaaagccgaaaca11280
gtccagcgtgaaggtgtctgcgggcgatcgtcaggaagacagtgctcatgctgccctgct11340
gacgcttcaggcagaactccggacgctggagaagcatgccggagcaaatgagaaaatcag11400
ccagcagcgccgggatttgtggaaggcggagagtcagttcgcggtactggaggaggcggc11460
gcaacgtcgccagctgtctgcacaggagaaatccctgctggcgcataaagatgagacgct11520
ggagtacaaacgccagctggctgcacttggcgacaaggttacgtatcaggagcgcctgaa11580
cgcgctggcgcagcaggcggataaattcgcacagcagcaacgggcaaaacgggccgccat11640
tgatgcgaaaagccgggggctgactgaccggcaggcagaacgggaagccacggaacagcg11700
cctgaaggaacagtatggcgataatccgctggcgctgaataacgtcatgtcagagcagaa11760
aaagacctgggcggctgaagaccagcttcgcgggaactggatggcaggcctgaagtccgg11820
ctggagtgagtgggaagagagcgccacggacagtatgtcgcaggtaaaaagtgcagccac11880
gcagacctttgatggtattgcacagaatatggcggcgatgctgaccggcagtgagcagaa11940
ctggcgcagcttcacccgttccgtgctgtccatgatgacagaaattctgcttaagcaggc12000
aatggtggggattgtcgggagtatcggcagcgccattggcggggctgttggtggcggcgc12060
atccgcgtcaggcggtacagccattcaggccgctgcggcgaaattccattttgcaaccgg12120
aggatttacgggaaccggcggcaaatatgagccagcggggattgttcaccgtggtgagtt12180
tgtcttcacgaaggaggcaaccagccggattggcgtggggaatctttaccggctgatgcg12240
cggctatgccaccggcggttatgtcggtacaccgggcagcatggcagacagccggtcgca12300
ggcgtccgggacgtttgagcagaataaccatgtggtgattaacaacgacggcacgaacgg12360
gcagataggtccggctgctctgaaggcggtgtatgacatggcccgcaagggtgcccgtga12420
tgaaattcagacacagatgcgtgatggtggcctgttctccggaggtggacgatgaagacc12480
ttccgctggaaagtgaaacccggtatggatgtggcttcggtcccttctgtaagaaaggtg12540
cgctttggtgatggctattctcagcgagcgcctgccgggctgaatgccaacctgaaaacg12600
tacagcgtgacgctttctgtcccccgtgaggaggccacggtactggagtcgtttctggaa12660
gagcacgggggctggaaatcctttctgtggacgccgccttatgagtggcggcagataaag12720
gtgacctgcgcaaaatggtcgtcgcgggtcagtatgctgcgtgttgagttcagcgcagag12780
tttgaacaggtggtgaactgatgcaggatatccggcaggaaacactgaatgaatgcaccc12840
gtgcggagcagtcggccagcgtggtgctctgggaaatcgacctgacagaggtcggtggag12900
aacgttattttttctgtaatgagcagaacgaaaaaggtgagccggtcacctggcaggggc12960
gacagtatcagccgtatcccattcaggggagcggttttgaactgaatggcaaaggcacca13020
gtacgcgccccacgctgacggtttctaacctgtacggtatggtcaccgggatggcggaag13080
atatgcagagtctggtcggcggaacggtggtccggcgtaaggtttacgcccgttttctgg13140
atgcggtgaacttcgtcaacggaaacagttacgccgatccggagcaggaggtgatcagcc13200
gctggcgcattgagcagtgcagcgaactgagcgcggtgagtgcctcctttgtactgtcca13260
cgccgacggaaacggatggcgctgtttttccgggacgtatcatgctggccaacacctgca13320
cctggacctatcgcggtgacgagtgcggttatagcggtccggctgtcgcggatgaatatg13380
accagccaacgtccgatatcacgaaggataaatgcagcaaatgcctgagcggttgtaagt13440
tccgcaataacgtcggcaactttggcggcttcctttccattaacaaactttcgcagtaaa13500
tcccatgacacagacagaatcagcgattctggcgcacgcccggcgatgtgcgccagcgga13560
gtcgtgcggcttcgtggtaagcacgccggagggggaaagatatttcccctgcgtgaatat13620
ctccggtgagccggaggctatttccgtatgtcgccggaagactggctgcaggcagaaatg13680
cagggtgagattgtggcgctggtccacagccaccccggtggtctgccctggctgagtgag13740
gccgaccggcggctgcaggtgcagagtgatttgccgtggtggctggtctgccgggggacg13800
attcataagttccgctgtgtgccgcatctcaccgggcggcgctttgagcacggtgtgacg13860
gactgttacacactgttccgggatgcttatcatctggcggggattgagatgccggacttt13920
catcgtgaggatgactggtggcgtaacggccagaatctctatctggataatctggaggcg13980
acggggctgtatcaggtgccgttgtcagcggcacagccgggcgatgtgctgctgtgctgt14040
tttggttcatcagtgccgaatcacgccgcaatttactgcggcgacggcgagctgctgcac14100
catattcctgaacaactgagcaaacgagagaggtacaccgacaaatggcagcgacgcaca14160
cactccctctggcgtcaccgggcatggcgcgcatctgcctttacggggatttacaacgat14220
ttggtcgccgcatcgaccttcgtgtgaaaacgggggctgaagccatccgggcactggcca14280
cacagctcccggcgtttcgtcagaaactgagcgacggctggtatcaggtacggattgccg14340
ggcgggacgtcagcacgtccgggttaacggcgcagttacatgagactctgcctgatggcg14400
ctgtaattcatattgttcccagagtcgccggggccaagtcaggtggcgtattccagattg14460
tcctgggggctgccgccattgccggatcattctttaccgccggagccacccttgcagcat14520
ggggggcagccattggggccggtggtatgaccggcatcctgttttctctcggtgccagta14580
tggtgctcggtggtgtggcgcagatgctggcaccgaaagccagaactccccgtatacaga14640
caacggataacggtaagcagaacacctatttctcctcactggataacatggttgcccagg14700
gcaatgttctgcctgttctgtacggggaaatgcgcgtggggtcacgcgtggtttctcagg14760
agatcagcacggcagacgaaggggacggtggtcaggttgtggtgattggtcgctgatgca14820
aaatgttttatgtgaaaccgcctgcgggcggttttgtcatttatggagcgtgaggaatgg14880
gtaaaggaagcagtaaggggcataccccgcgcgaagcgaaggacaacctgaagtccacgc14940
agttgctgagtgtgatcgatgccatcagcgaagggccgattgaaggtccggtggatggct15000
taaaaagcgtgctgctgaacagtacgccggtgctggacactgaggggaataccaacatat15060
ccggtgtcacggtggtgttccgggctggtgagcaggagcagactccgccggagggatttg15120
aatcctccggctccgagacggtgctgggtacggaagtgaaatatgacacgccgatcaccc15180
gcaccattacgtctgcaaacatcgaccgtctgcgctttaccttcggtgtacaggcactgg15240
tggaaaccacctcaaagggtgacaggaatccgtcggaagtccgcctgctggttcagatac15300
aacgtaacggtggctgggtgacggaaaaagacatcaccattaagggcaaaaccacctcgc15360
agtatctggcctcggtggtgatgggtaacctgccgccgcgcccgtttaatatccggatgc15420
gcaggatgacgccggacagcaccacagaccagctgcagaacaaaacgctctggtcgtcat15480
acactgaaatcatcgatgtgaaacagtgctacccgaacacggcactggtcggcgtgcagg15540
tggactcggagcagttcggcagccagcaggtgagccgtaattatcatctgcgcgggcgta15600
ttctgcaggtgccgtcgaactataacccgcagacgcggcaatacagcggtatctgggacg15660
gaacgtttaaaccggcatacagcaacaacatggcctggtgtctgtgggatatgctgaccc15720
atccgcgctacggcatggggaaacgtcttggtgcggcggatgtggataaatgggcgctgt15780
atgtcatcggccagtactgcgaccagtcagtgccggacggctttggcggcacggagccgc15840
gcatcacctgtaatgcgtacctgaccacacagcgtaaggcgtgggatgtgctcagcgatt15900
tctgctcggcgatgcgctgtatgccggtatggaacgggcagacgctgacgttcgtgcagg15960
accgaccgtcggataagacgtggacctataaccgcagtaatgtggtgatgccggatgatg16020
gcgcgccgttccgctacagcttcagcgccctgaaggaccgccataatgccgttgaggtga16080
actggattgacccgaacaacggctgggagacggcgacagagcttgttgaagatacgcagg16140
ccattgcccgttacggtcgtaatgttacgaagatggatgcctttggctgtaccagccggg16200
ggcaggcacaccgcgccgggctgtggctgattaaaacagaactgctggaaacgcagaccg16260
tggatttcagcgtcggcgcagaagggcttcgccatgtaccgggcgatgttattgaaatct16320
gcgatgatgactatgccggtatcagcaccggtggtcgtgtgctggcggtgaacagccaga16380
cccggacgctgacgctcgaccgtgaaatcacgctgccatcctccggtaccgcgctgataa16440
gcctggttgacggaagtggcaatccggtcagcgtggaggttcagtccgtcaccgacggcg16500
tgaaggtaaaagtgagccgtgttcctgacggtgttgctgaatacagcgtatgggagctga16560
agctgccgacgctgcgccagcgactgttccgctgcgtgagtatccgtgagaacgacgacg16620
gcacgtatgccatcaccgccgtgcagcatgtgccggaaaaagaggccatcgtggataacg16680
gggcgcactttgacggcgaacagagtggcacggtgaatggtgtcacgccgccagcggtgc16740
agcacctgaccgcagaagtcactgcagacagcggggaatatcaggtgctggcgcgatggg16800
acacaccgaaggtggtgaagggcgtgagtttcctgctccgtctgaccgtaacagcggacg16860
acggcagtgagcggctggtcagcacggcccggacgacggaaaccacataccgcttcacgc16920
aactggcgctggggaactacaggctgacagtccgggcggtaaatgcgtgggggcagcagg16980
gcgatccggcgtcggtatcgttccggattgccgcaccggcagcaccgtcgaggattgagc17040
tgacgccgggctattttcagataaccgccacgccgcatcttgccgtttatgacccgacgg17100
tacagtttgagttctggttctcggaaaagcagattgcggatatcagacaggttgaaacca17160
gcacgcgttatcttggtacggcgctgtactggatagccgccagtatcaatatcaaaccgg17220
gccatgattattacttttatatccgcagtgtgaacaccgttggcaaatcggcattcgtgg17280
aggccgtcggtcgggcgagcgatgatgcggaaggttacctggattttttcaaaggcaaga17340
taaccgaatcccatctcggcaaggagctgctggaaaaagtcgagctgacggaggataacg17400
ccagcagactggaggagttttcgaaagagtggaaggatgccagtgataagtggaatgcca17460
tgtgggctgtcaaaattgagcagaccaaagacggcaaacattatgtcgcgggtattggcc17520
tcagcatggaggacacggaggaaggcaaactgagccagtttctggttgccgccaatcgta17580
tcgcatttattgacccggcaaacgggaatgaaacgccgatgtttgtggcgcagggcaacc17640
agatattcatgaacgacgtgttcctgaagcgcctgacggcccccaccattaccagcggcg17700
gcaatcctccggccttttccctgacaccggacggaaagctgaccgctaaaaatgcggata17760
tcagtggcagtgtgaatgcgaactccgggacgctcagtaatgtgacgatagctgaaaact17820
gtacgataaacggtacgctgagggcggaaaaaatcgtcggggacattgtaaaggcggcga17880
gcgcggcttttccgcgccagcgtgaaagcagtgtggactggccgtcaggtacccgtactg17940
tcaccgtgaccgatgaccatccttttgatcgccagatagtggtgcttccgctgacgtttc18000
gcggaagtaagcgtactgtcagcggcaggacaacgtattcgatgtgttatctgaaagtac18060
tgatgaacggtgcggtgatttatgatggcgcggcgaacgaggcggtacaggtgttctccc18120
gtattgttgacatgccagcgggtcggggaaacgtgatcctgacgttcacgcttacgtcca18180
cacggcattcggcagatattccgccgtatacgtttgccagcgatgtgcaggttatggtga18240
ttaagaaacaggcgctgggcatcagcgtggtctgagtgtgttacagaggttcgtccggga18300
acgggcgttttattataaaacagtgagaggtgaacgatgcgtaatgtgtgtattgccgtt18360
gctgtctttgccgcacttgcggtgacagtcactccggcccgtgcggaaggtggacatggt18420
acgtttacggtgggctattttcaagtgaaaccgggtacattgccgtcgttgtcgggcggg18480
gataccggtgtgagtcatctgaaagggattaacgtgaagtaccgttatgagctgacggac18540
agtgtgggggtgatggcttccctggggttcgccgcgtcgaaaaagagcagcacagtgatg18600
accggggaggatacgtttcactatgagagcctgcgtggacgttatgtgagcgtgatggcc18660
ggaccggttttacaaatcagtaagcaggtcagtgcgtacgccatggccggagtggctcac18720
agtcggtggtccggcagtacaatggattaccgtaagacggaaatcactcccgggtatatg18780
aaagagacgaccactgccagggacgaaagtgcaatgcggcatacctcagtggcgtggagt18840
gcaggtatacagattaatccggcagcgtccgtcgttgttgatattgcttatgaaggctcc18900
ggcagtggcgactggcgtactgacggattcatcgttggggtcggttataaattctgatta18960
gccaggtaacacagtgttatgacagcccgccggaaccggtgggcttttttgtggggtgaa19020
tatggcagtaaagatttcaggagtcctgaaagacggcacaggaaaaccggtacagaactg19080
caccattcagctgaaagccagacgtaacagcaccacggtggtggtgaacacggtgggctc19140
agagaatccggatgaagccgggcgttacagcatggatgtggagtacggtcagtacagtgt19200
catcctgcaggttgacggttttccaccatcgcacgccgggaccatcaccgtgtatgaaga19260
ttcacaaccggggacgctgaatgattttctctgtgccatgacggaggatgatgcccggcc19320
ggaggtgctgcgtcgtcttgaactgatggtggaagaggtggcgcgtaacgcgtccgtggt19380
ggcacagagtacggcagacgcgaagaaatcagccggcgatgccagtgcatcagctgctca19440
ggtcgcggcccttgtgactgatgcaactgactcagcacgcgccgccagcacgtccgccgg19500
acaggctgcatcgtcagctcaggaagcgtcctccggcgcagaagcggcatcagcaaaggc19560
cactgaagcggaaaaaagtgccgcagccgcagagtcctcaaaaa19604
<210>10
<211>10058
<212>dna
<213>artificialsequence
<220>
<223>lambdadna
<400>10
acgcggcggccaccagtgccggtgcggcgaaaacgtcagaaacgaatgctgcagcgtcac60
aacaatcagccgccacgtctgcctccaccgcggccacgaaagcgtcagaggccgccactt120
cagcacgagatgcggtggcctcaaaagaggcagcaaaatcatcagaaacgaacgcatcat180
caagtgccggtcgtgcagcttcctcggcaacggcggcagaaaattctgccagggcggcaa240
aaacgtccgagacgaatgccaggtcatctgaaacagcagcggaacggagcgcctctgccg300
cggcagacgcaaaaacagcggcggcggggagtgcgtcaacggcatccacgaaggcgacag360
aggctgcgggaagtgcggtatcagcatcgcagagcaaaagtgcggcagaagcggcggcaa420
tacgtgcaaaaaattcggcaaaacgtgcagaagatatagcttcagctgtcgcgcttgagg480
atgcggacacaacgagaaaggggatagtgcagctcagcagtgcaaccaacagcacgtctg540
aaacgcttgctgcaacgccaaaggcggttaaggtggtaatggatgaaacgaacagaaaag600
cccactggacagtccggcactgaccggaacgccaacagcaccaaccgcgctcaggggaac660
aaacaatacccagattgcgaacaccgcttttgtactggccgcgattgcagatgttatcga720
cgcgtcacctgacgcactgaatacgctgaatgaactggccgcagcgctcgggaatgatcc780
agattttgctaccaccatgactaacgcgcttgcgggtaaacaaccgaagaatgcgacact840
gacggcgctggcagggctttccacggcgaaaaataaattaccgtattttgcggaaaatga900
tgccgccagcctgactgaactgactcaggttggcagggatattctggcaaaaaattccgt960
tgcagatgttcttgaataccttggggccggtgagaattcggcctttccggcaggtgcgcc1020
gatcccgtggccatcagatatcgttccgtctggctacgtcctgatgcaggggcaggcgtt1080
tgacaaatcagcctacccaaaacttgctgtcgcgtatccatcgggtgtgcttcctgatat1140
gcgaggctggacaatcaaggggaaacccgccagcggtcgtgctgtattgtctcaggaaca1200
ggatggaattaagtcgcacacccacagtgccagtgcatccggtacggatttggggacgaa1260
aaccacatcgtcgtttgattacgggacgaaaacaacaggcagtttcgattacggcaccaa1320
atcgacgaataacacgggggctcatgctcacagtctgagcggttcaacaggggccgcggg1380
tgctcatgcccacacaagtggtttaaggatgaacagttctggctggagtcagtatggaac1440
agcaaccattacaggaagtttatccacagttaaaggaaccagcacacagggtattgctta1500
tttatcgaaaacggacagtcagggcagccacagtcactcattgtccggtacagccgtgag1560
tgccggtgcacatgcgcatacagttggtattggtgcgcaccagcatccggttgttatcgg1620
tgctcatgcccattctttcagtattggttcacacggacacaccatcaccgttaacgctgc1680
gggtaacgcggaaaacaccgtcaaaaacattgcatttaactatattgtgaggcttgcata1740
atggcattcagaatgagtgaacaaccacggaccataaaaatttataatctgctggccgga1800
actaatgaatttattggtgaaggtgacgcatatattccgcctcataccggtctgcctgca1860
aacagtaccgatattgcaccgccagatattccggctggctttgtggctgttttcaacagt1920
gatgaggcatcgtggcatctcgttgaagaccatcggggtaaaaccgtctatgacgtggct1980
tccggcgacgcgttatttatttctgaactcggtccgttaccggaaaattttacctggtta2040
tcgccgggaggggaatatcagaagtggaacggcacagcctgggtgaaggatacggaagca2100
gaaaaactgttccggatccgggaggcggaagaaacaaaaaaaagcctgatgcaggtagcc2160
agtgagcatattgcgccgcttcaggatgctgcagatctggaaattgcaacgaaggaagaa2220
acctcgttgctggaagcctggaagaagtatcgggtgttgctgaaccgtgttgatacatca2280
actgcacctgatattgagtggcctgctgtccctgttatggagtaatcgttttgtgatatg2340
ccgcagaaacgttgtatgaaataacgttctgcggttagttagtatattgtaaagctgagt2400
attggtttatttggcgattattatcttcaggagaataatggaagttctatgactcaattg2460
ttcatagtgtttacatcaccgccaattgcttttaagactgaacgcatgaaatatggtttt2520
tcgtcatgttttgagtctgctgttgatatttctaaagtcggttttttttcttcgttttct2580
ctaactattttccatgaaatacatttttgattattatttgaatcaattccaattacctga2640
agtctttcatctataattggcattgtatgtattggtttattggagtagatgcttgctttt2700
ctgagccatagctctgatatccaaatgaagccataggcatttgttattttggctctgtca2760
gctgcataacgccaaaaaatatatttatctgcttgatcttcaaatgttgtattgattaaa2820
tcaattggatggaattgtttatcataaaaaattaatgtttgaatgtgataaccgtccttt2880
aaaaaagtcgtttctgcaagcttggctgtatagtcaactaactcttctgtcgaagtgata2940
tttttaggcttatctaccagttttagacgctctttaatatcttcaggaattattttattg3000
tcatattgtatcatgctaaatgacaatttgcttatggagtaatcttttaattttaaataa3060
gttattctcctggcttcatcaaataaagagtcgaatgatgttggcgaaatcacatcgtca3120
cccattggattgtttatttgtatgccaagagagttacagcagttatacattctgccatag3180
attatagctaaggcatgtaataattcgtaatcttttagcgtattagcgacccatcgtctt3240
tctgatttaataatagatgattcagttaaatatgaaggtaatttcttttgtgcaagtctg3300
actaacttttttataccaatgtttaacatactttcatttgtaataaactcaatgtcattt3360
tcttcaatgtaagatgaaataagagtagcctttgcctcgctatacatttctaaatcgcct3420
tgtttttctatcgtattgcgagaatttttagcccaagccattaatggatcatttttccat3480
ttttcaataacattattgttataccaaatgtcatatcctataatctggtttttgtttttt3540
tgaataataaatgttactgttcttgcggtttggaggaattgattcaaattcaagcgaaat3600
aattcagggtcaaaatatgtatcaatgcagcatttgagcaagtgcgataaatctttaagt3660
cttctttcccatggttttttagtcataaaactctccattttgataggttgcatgctagat3720
gctgatatattttagaggtgataaaattaactgcttaactgtcaatgtaatacaagttgt3780
ttgatctttgcaatgattcttatcagaaaccatatagtaaattagttacacaggaaattt3840
ttaatattattattatcattcattatgtattaaaattagagttgtggcttggctctgcta3900
acacgttgctcataggagatatggtagagccgcagacacgtcgtatgcaggaacgtgctg3960
cggctggctggtgaacttccgatagtgcgggtgttgaatgatttccagttgctaccgatt4020
ttacatattttttgcatgagagaatttgtaccacctcccaccgaccatctatgactgtac4080
gccactgtccctaggactgctatgtgccggagcggacattacaaacgtccttctcggtgc4140
atgccactgttgccaatgacctgcctaggaattggttagcaagttactaccggattttgt4200
aaaaacagccctcctcatataaaaagtattcgttcacttccgataagcgtcgtaattttc4260
tatctttcatcatattctagatccctctgaaaaaatcttccgagtttgctaggcactgat4320
acataactcttttccaataattggggaagtcattcaaatctataataggtttcagatttg4380
cttcaataaattctgactgtagctgctgaaacgttgcggttgaactatatttccttataa4440
cttttacgaaagagtttctttgagtaatcacttcactcaagtgcttccctgcctccaaac4500
gatacctgttagcaatatttaatagcttgaaatgatgaagagctctgtgtttgtcttcct4560
gcctccagttcgccgggcattcaacataaaaactgatagcacccggagttccggaaacga4620
aatttgcatatacccattgctcacgaaaaaaaatgtccttgtcgatatagggatgaatcg4680
cttggtgtacctcatctactgcgaaaacttgacctttctctcccatattgcagtcgcggc4740
acgatggaactaaattaataggcatcaccgaaaattcaggataatgtgcaataggaagaa4800
aatgatctatattttttgtctgtcctatatcaccacaaaatggacatttttcacctgatg4860
aaacaagcatgtcatcgtaatatgttctagcgggtttgtttttatctcggagattatttt4920
cataaagcttttctaatttaacctttgtcaggttaccaactactaaggttgtaggctcaa4980
gagggtgtgtcctgtcgtaggtaaataactgacctgtcgagcttaatattctatattgtt5040
gttctttctgcaaaaaagtggggaagtgagtaatgaaattatttctaacatttatctgca5100
tcataccttccgagcatttattaagcatttcgctataagttctcgctggaagaggtagtt5160
ttttcattgtactttaccttcatctctgttcattatcatcgcttttaaaacggttcgacc5220
ttctaatcctatctgaccattataattttttagaatggtttcataagaaagctctgaatc5280
aacggactgcgataataagtggtggtatccagaatttgtcacttcaagtaaaaacacctc5340
acgagttaaaacacctaagttctcaccgaatgtctcaatatccggacggataatatttat5400
tgcttctcttgaccgtaggactttccacatgcaggattttggaacctcttgcagtactac5460
tggggaatgagttgcaattattgctacaccattgcgtgcatcgagtaagtcgcttaatgt5520
tcgtaaaaaagcagagagcaaaggtggatgcagatgaacctctggttcatcgaataaaac5580
taatgacttttcgccaacgacatctactaatcttgtgatagtaaataaaacaattgcatg5640
tccagagctcattcgaagcagatatttctggatattgtcataaaacaatttagtgaattt5700
atcatcgtccacttgaatctgtggttcattacgtcttaactcttcatatttagaaatgag5760
gctgatgagttccatatttgaaaagttttcatcactacttagttttttgatagcttcaag5820
ccagagttgtctttttctatctactctcatacaaccaataaatgctgaaatgaattctaa5880
gcggagatcgcctagtgattttaaactattgctggcagcattcttgagtccaatataaaa5940
gtattgtgtaccttttgctgggtcaggttgttctttaggaggagtaaaaggatcaaatgc6000
actaaacgaaactgaaacaagcgatcgaaaatatccctttgggattcttgactcgataag6060
tctattattttcagagaaaaaatattcattgttttctgggttggtgattgcaccaatcat6120
tccattcaaaattgttgttttaccacacccattccgcccgataaaagcatgaatgttcgt6180
gctgggcatagaattaaccgtcacctcaaaaggtatagttaaatcactgaatccgggagc6240
actttttctattaaatgaaaagtggaaatctgacaattctggcaaaccatttaacacacg6300
tgcgaactgtccatgaatttctgaaagagttacccctctaagtaatgaggtgttaaggac6360
gctttcattttcaatgtcggctaatcgatttggccatactactaaatcctgaatagcttt6420
aagaaggttatgtttaaaaccatcgcttaatttgctgagattaacatagtagtcaatgct6480
ttcacctaaggaaaaaaacatttcagggagttgactgaattttttatctattaatgaata6540
agtgcttacttcttctttttgacctacaaaaccaattttaacatttccgatatcgcattt6600
ttcaccatgctcatcaaagacagtaagataaaacattgtaacaaaggaatagtcattcca6660
accatctgctcgtaggaatgccttatttttttctactgcaggaatatacccgcctctttc6720
aataacactaaactccaacatatagtaacccttaattttattaaaataaccgcaatttat6780
ttggcggcaacacaggatctctcttttaagttactctctattacatacgttttccatcta6840
aaaattagtagtattgaacttaacggggcatcgtattgtagttttccatatttagctttc6900
tgcttccttttggataacccactgttattcatgttgcatggtgcactgtttataccaacg6960
atatagtctattaatgcatatatagtatcgccgaacgattagctcttcaggcttctgaag7020
aagcgtttcaagtactaataagccgatagatagccacggacttcgtagccatttttcata7080
agtgttaacttccgctcctcgctcataacagacattcactacagttatggcggaaaggta7140
tgcatgctgggtgtggggaagtcgtgaaagaaaagaagtcagctgcgtcgtttgacatca7200
ctgctatcttcttactggttatgcaggtcgtagtgggtggcacacaaagctttgcactgg7260
attgcgaggctttgtgcttctctggagtgcgacaggtttgatgacaaaaaattagcgcaa7320
gaagacaaaaatcaccttgcgctaatgctctgttacaggtcactaataccatctaagtag7380
ttgattcatagtgactgcatatgttgtgttttacagtattatgtagtctgttttttatgc7440
aaaatctaatttaatatattgatatttatatcattttacgtttctcgttcagctttttta7500
tactaagttggcattataaaaaagcattgcttatcaatttgttgcaacgaacaggtcact7560
atcagtcaaaataaaatcattatttgatttcaattttgtcccactccctgcctctgtcat7620
cacgatactgtgatgccatggtgtccgacttatgcccgagaagatgttgagcaaacttat7680
cgcttatctgcttctcatagagtcttgcagacaaactgcgcaactcgtgaaaggtaggcg7740
gatccccttcgaaggaaagacctgatgcttttcgtgcgcgcataaaataccttgatactg7800
tgccggatgaaagcggttcgcgacgagtagatgcaattatggtttctccgccaagaatct7860
ctttgcatttatcaagtgtttccttcattgatattccgagagcatcaatatgcaatgctg7920
ttgggatggcaatttttacgcctgttttgctttgctcgacataaagatatccatctacga7980
tatcagaccacttcatttcgcataaatcaccaactcgttgcccggtaacaacagccagtt8040
ccattgcaagtctgagccaacatggtgatgattctgctgcttgataaattttcaggtatt8100
cgtcagccgtaagtcttgatctccttacctctgattttgctgcgcgagtggcagcgacat8160
ggtttgttgttatatggccttcagctattgcctctcggaatgcatcgctcagtgttgatc8220
tgattaacttggctgacgccgccttgccctcgtctatgtatccattgagcattgccgcaa8280
tttcttttgtggtgatgtcttcaagtggagcatcaggcagacccctccttattgctttaa8340
ttttgctcatgtaatttatgagtgtcttctgcttgattcctctgctggccaggatttttt8400
cgtagcgatcaagccatgaatgtaacgtaacggaattatcactgttgattctcgctgtca8460
gaggcttgtgtttgtgtcctgaaaataactcaatgttggcctgtatagcttcagtgattg8520
cgattcgcctgtctctgcctaatccaaactctttacccgtccttgggtccctgtagcagt8580
aatatccattgtttcttatataaaggttagggggtaaatcccggcgctcatgacttcgcc8640
ttcttcccatttctgatcctcttcaaaaggccacctgttactggtcgatttaagtcaacc8700
tttaccgctgattcgtggaacagatactctcttccatccttaaccggaggtgggaatatc8760
ctgcattcccgaacccatcgacgaactgtttcaaggcttcttggacgtcgctggcgtgcg8820
ttccactcctgaagtgtcaagtacatcgcaaagtctccgcaattacacgcaagaaaaaac8880
cgccatcaggcggcttggtgttctttcagttcttcaattcgaatattggttacgtctgca8940
tgtgctatctgcgcccatatcatccagtggtcgtagcagtcgttgatgttctccgcttcg9000
ataactctgttgaatggctctccattccattctcctgtgactcggaagtgcatttatcat9060
ctccataaaacaaaacccgccgtagcgagttcagataaaataaatccccgcgagtgcgag9120
gattgttatgtaatattgggtttaatcatctatatgttttgtacagagagggcaagtatc9180
gtttccaccgtactcgtgataataattttgcacggtatcagtcatttctcgcacattgca9240
gaatggggatttgtcttcattagacttataaaccttcatggaatatttgtatgccgactc9300
tatatctataccttcatctacataaacaccttcgtgatgtctgcatggagacaagacacc9360
ggatctgcacaacattgataacgcccaatctttttgctcagactctaactcattgatact9420
catttataaactccttgcaatgtatgtcgtttcagctaaacggtatcagcaatgtttatg9480
taaagaaacagtaagataatactcaacccgatgtttgagtacggtcatcatctgacacta9540
cagactctggcatcgctgtgaagacgacgcgaaattcagcattttcacaagcgttatctt9600
ttacaaaaccgatctcactctcctttgatgcgaatgccagcgtcagacatcatatgcaga9660
tactcacctgcatcctgaacccattgacctccaaccccgtaatagcgatgcgtaatgatg9720
tcgatagttactaacgggtcttgttcgattaactgccgcagaaactcttccaggtcacca9780
gtgcagtgcttgataacaggagtcttcccaggatggcgaacaacaagaaactggtttccg9840
tcttcacggacttcgttgctttccagtttagcaatacgcttactcccatccgagataaca9900
ccttcgtaatactcacgctgctcgttgagttttgattttgctgtttcaagctcaacacgc9960
agtttccctactgttagcgcaatatcctcgttctcctggtcgcggcgtttgatgtattgc10020
tggtttctttcccgttcatccagcagttccagcacaat10058
<210>11
<211>9105
<212>dna
<213>artificialsequence
<220>
<223>lambdadna
<400>11
cgatggtgttaccaattcatggaaaaggtctgcgtcaaatccccagtcgtcatgcattgc60
ctgctctgccgcttcacgcagtgcctgagagttaatttcgctcacttcgaacctctctgt120
ttactgataagttccagatcctcctggcaacttgcacaagtccgacaaccctgaacgacc180
aggcgtcttcgttcatctatcggatcgccacactcacaacaatgagtggcagatatagcc240
tggtggttcaggcggcgcatttttattgctgtgttgcgctgtaattcttctatttctgat300
gctgaatcaatgatgtctgccatctttcattaatccctgaactgttggttaatacgcttg360
agggtgaatgcgaataataaaaaaggagcctgtagctccctgatgattttgcttttcatg420
ttcatcgttccttaaagacgccgtttaacatgccgattgccaggcttaaatgagtcggtg480
tgaatcccatcagcgttaccgtttcgcggtgcttcttcagtacgctacggcaaatgtcat540
cgacgtttttatccggaaactgctgtctggctttttttgatttcagaattagcctgacgg600
gcaatgctgcgaagggcgttttcctgctgaggtgtcattgaacaagtcccatgtcggcaa660
gcataagcacacagaatatgaagcccgctgccagaaaaatgcattccgtggttgtcatac720
ctggtttctctcatctgcttctgctttcgccaccatcatttccagcttttgtgaaaggga780
tgcggctaacgtatgaaattcttcgtctgtttctactggtattggcacaaacctgattcc840
aatttgagcaaggctatgtgccatctcgatactcgttcttaactcaacagaagatgcttt900
gtgcatacagcccctcgtttattatttatctcctcagccagccgctgtgctttcagtgga960
tttcggataacagaaaggccgggaaatacccagcctcgctttgtaacggagtagacgaaa1020
gtgattgcgcctacccggatattatcgtgaggatgcgtcatcgccattgctccccaaata1080
caaaaccaatttcagccagtgcctcgtccattttttcgatgaactccggcacgatctcgt1140
caaaactcgccatgtacttttcatcccgctcaatcacgacataatgcaggccttcacgct1200
tcatacgcgggtcatagttggcaaagtaccaggcattttttcgcgtcacccacatgctgt1260
actgcacctgggccatgtaagctgactttatggcctcgaaaccaccgagccggaacttca1320
tgaaatcccgggaggtaaacgggcatttcagttcaaggccgttgccgtcactgcataaac1380
catcgggagagcaggcggtacgcatactttcgtcgcgatagatgatcggggattcagtaa1440
cattcacgccggaagtgaattcaaacagggttctggcgtcgttctcgtactgttttcccc1500
aggccagtgctttagcgttaacttccggagccacaccggtgcaaacctcagcaagcaggg1560
tgtggaagtaggacattttcatgtcaggccacttctttccggagcggggttttgctatca1620
cgttgtgaacttctgaagcggtgatgacgccgagccgtaatttgtgccacgcatcatccc1680
cctgttcgacagctctcacatcgatcccggtacgctgcaggataatgtccggtgtcatgc1740
tgccaccttctgctctgcggctttctgtttcaggaatccaagagcttttactgcttcggc1800
ctgtgtcagttctgacgatgcacgaatgtcgcggcgaaatatctgggaacagagcggcaa1860
taagtcgtcatcccatgttttatccagggcgatcagcagagtgttaatctcctgcatggt1920
ttcatcgttaaccggagtgatgtcgcgttccggctgacgttctgcagtgtatgcagtatt1980
ttcgacaatgcgctcggcttcatccttgtcatagataccagcaaatccgaaggccagacg2040
ggcacactgaatcatggctttatgacgtaacatccgtttgggatgcgactgccacggccc2100
cgtgatttctctgccttcgcgagttttgaatggttcgcggcggcattcatccatccattc2160
ggtaacgcagatcggatgattacggtccttgcggtaaatccggcatgtacaggattcatt2220
gtcctgctcaaagtccatgccatcaaactgctggttttcattgatgatgcgggaccagcc2280
atcaacgcccaccaccggaacgatgccattctgcttatcaggaaaggcgtaaatttcttt2340
cgtccacggattaaggccgtactggttggcaacgatcagtaatgcgatgaactgcgcatc2400
gctggcatcacctttaaatgccgtctggcgaagagtggtgatcagttcctgtgggtcgac2460
agaatccatgccgacacgttcagccagcttcccagccagcgttgcgagtgcagtactcat2520
tcgttttatacctctgaatcaatatcaacctggtggtgagcaatggtttcaaccatgtac2580
cggatgtgttctgccatgcgctcctgaaactcaacatcgtcatcaaacgcacgggtaatg2640
gattttttgctggccccgtggcgttgcaaatgatcgatgcatagcgattcaaacaggtgc2700
tggggcaggcctttttccatgtcgtctgccagttctgcctctttctcttcacgggcgagc2760
tgctggtagtgacgcgcccagctctgagcctcaagacgatcctgaatgtaataagcgttc2820
atggctgaactcctgaaatagctgtgaaaatatcgcccgcgaaatgccgggctgattagg2880
aaaacaggaaagggggttagtgaatgcttttgcttgatctcagtttcagtattaatatcc2940
attttttataagcgtcgacggcttcacgaaacatcttttcatcgccaataaaagtggcga3000
tagtgaatttagtctggatagccataagtgtttgatccattctttgggactcctggctga3060
ttaagtatgtcgataaggcgtttccatccgtcacgtaatttacgggtgattcgttcaagt3120
aaagattcggaagggcagccagcaacaggccaccctgcaatggcatattgcatggtgtgc3180
tccttatttatacataacgaaaaacgcctcgagtgaagcgttattggtatgcggtaaaac3240
cgcactcaggcggccttgatagtcatatcatctgaatcaaatattcctgatgtatcgata3300
tcggtaattcttattccttcgctaccatccattggaggccatccttcctgaccatttcca3360
tcattccagtcgaactcacacacaacaccatatgcatttaagtcgcttgaaattgctata3420
agcagagcatgttgcgccagcatgattaatacagcatttaatacagagccgtgtttattg3480
agtcggtattcagagtctgaccagaaattattaatctggtgaagtttttcctctgtcatt3540
acgtcatggtcgatttcaatttctattgatgctttccagtcgtaatcaatgatgtatttt3600
ttgatgtttgacatctgttcatatcctcacagataaaaaatcgccctcacactggagggc3660
aaagaagatttccaataatcagaacaagtcggctcctgtttagttacgagcgacattgct3720
ccgtgtattcactcgttggaatgaatacacagtgcagtgtttattctgttatttatgcca3780
aaaataaaggccactatcaggcagctttgttgttctgtttaccaagttctctggcaatca3840
ttgccgtcgttcgtattgcccatttatcgacatatttcccatcttccattacaggaaaca3900
tttcttcaggcttaaccatgcattccgattgcagcttgcatccattgcatcgcttgaatt3960
gtccacaccattgatttttatcaatagtcgtagtcatacggatagtcctggtattgttcc4020
atcacatcctgaggatgctcttcgaactcttcaaattcttcttccatatatcaccttaaa4080
tagtggattgcggtagtaaagattgtgcctgtcttttaaccacatcaggctcggtggttc4140
tcgtgtacccctacagcgagaaatcggataaactattacaacccctacagtttgatgagt4200
atagaaatggatccactcgttattctcggacgagtgttcagtaatgaacctctggagaga4260
accatgtatatgatcgttatctgggttggacttctgcttttaagcccagataactggcct4320
gaatatgttaatgagagaatcggtattcctcatgtgtggcatgttttcgtctttgctctt4380
gcattttcgctagcaattaatgtgcatcgattatcagctattgccagcgccagatataag4440
cgatttaagctaagaaaacgcattaagatgcaaaacgataaagtgcgatcagtaattcaa4500
aaccttacagaagagcaatctatggttttgtgcgcagcccttaatgaaggcaggaagtat4560
gtggttacatcaaaacaattcccatacattagtgagttgattgagcttggtgtgttgaac4620
aaaactttttcccgatggaatggaaagcatatattattccctattgaggatatttactgg4680
actgaattagttgccagctatgatccatataatattgagataaagccaaggccaatatct4740
aagtaactagataagaggaatcgattttcccttaattttctggcgtccactgcatgttat4800
gccgcgttcgccaggcttgctgtaccatgtgcgctgattcttgcgctcaatacgttgcag4860
gttgctttcaatctgtttgtggtattcagccagcactgtaaggtctatcggatttagtgc4920
gctttctactcgtgatttcggtttgcgattcagcgagagaatagggcggttaactggttt4980
tgcgcttaccccaaccaacaggggatttgctgctttccattgagcctgtttctctgcgcg5040
acgttcgcggcggcgtgtttgtgcatccatctggattctcctgtcagttagctttggtgg5100
tgtgtggcagttgtagtcctgaacgaaaaccccccgcgattggcacattggcagctaatc5160
cggaatcgcacttacggccaatgcttcgtttcgtatcacacaccccaaagccttctgctt5220
tgaatgctgcccttcttcagggcttaatttttaagagcgtcaccttcatggtggtcagtg5280
cgtcctgctgatgtgctcagtatcaccgccagtggtatttatgtcaacaccgccagagat5340
aatttatcaccgcagatggttatctgtatgttttttatatgaatttattttttgcagggg5400
ggcattgtttggtaggtgagagatctgaattgctatgtttagtgagttgtatctatttat5460
ttttcaataaatacaattggttatgtgttttgggggcgatcgtgaggcaaagaaaacccg5520
gcgctgaggccgggttattcttgttctctggtcaaattatatagttggaaaacaaggatg5580
catatatgaatgaacgatgcagaggcaatgccgatggcgatagtgggtatcatgtagccg5640
cttatgctggaaagaagcaataacccgcagaaaaacaaagctccaagctcaacaaaacta5700
agggcatagacaataactaccgatgtcatatacccatactctctaatcttggccagtcgg5760
cgcgttctgcttccgattagaaacgtcaaggcagcaatcaggattgcaatcatggttcct5820
gcatatgatgacaatgtcgccccaagaccatctctatgagctgaaaaagaaacaccagga5880
atgtagtggcggaaaaggagatagcaaatgcttacgataacgtaaggaattattactatg5940
taaacaccaggcatgattctgttccgcataattactcctgataattaatccttaactttg6000
cccacctgccttttaaaacattccagtatatcacttttcattcttgcgtagcaatatgcc6060
atctcttcagctatctcagcattggtgaccttgttcagaggcgctgagagatggcctttt6120
tctgatagataatgttctgttaaaatatctccggcctcatcttttgcccgcaggctaatg6180
tctgaaaattgaggtgacgggttaaaaataatatccttggcaaccttttttatatccctt6240
ttaaattttggcttaatgactatatccaatgagtcaaaaagctccccttcaatatctgtt6300
gcccctaagacctttaatatatcgccaaatacaggtagcttggcttctaccttcaccgtt6360
gttcggccgatgaaatgcatatgcataacatcgtctttggtggttcccctcatcagtggc6420
tctatctgaacgcgctctccactgcttaatgacattcctttcccgattaaaaaatctgtc6480
agatcggatgtggtcggcccgaaaacagttctggcaaaaccaatggtgtcgccttcaaca6540
aacaaaaaagatgggaatcccaatgattcgtcatctgcgaggctgttcttaatatcttca6600
actgaagctttagagcgatttatcttctgaaccagactcttgtcatttgttttggtaaag6660
agaaaagtttttccatcgattttatgaatatacaaataattggagccaacctgcaggtga6720
tgattatcagccagcagagaattaaggaaaacagacaggtttattgagcgcttatctttc6780
cctttatttttgctgcggtaagtcgcataaaaaccattcttcataattcaatccatttac6840
tatgttatgttctgaggggagtgaaaattcccctaattcgatgaagattcttgctcaatt6900
gttatcagctatgcgccgaccagaacaccttgccgatcagccaaacgtctcttcaggcca6960
ctgactagcgataactttccccacaacggaacaactctcattgcatgggatcattgggta7020
ctgtgggtttagtggttgtaaaaacacctgaccgctatccctgatcagtttcttgaaggt7080
aaactcatcacccccaagtctggctatgcagaaatcacctggctcaacagcctgctcagg7140
gtcaacgagaattaacattccgtcaggaaagcttggcttggagcctgttggtgcggtcat7200
ggaattaccttcaacctcaagccagaatgcagaatcactggcttttttggttgtgcttac7260
ccatctctccgcatcacctttggtaaaggttctaagctcaggtgagaacatccctgcctg7320
aacatgagaaaaaacagggtactcatactcacttctaagtgacggctgcatactaaccgc7380
ttcatacatctcgtagatttctctggcgattgaagggctaaattcttcaacgctaacttt7440
gagaatttttgcaagcaatgcggcgttataagcatttaatgcattgatgccattaaataa7500
agcaccaacgcctgactgccccatccccatcttgtctgcgacagattcctgggataagcc7560
aagttcatttttctttttttcataaattgctttaaggcgacgtgcgtcctcaagctgctc7620
ttgtgttaatggtttcttttttgtgctcatacgttaaatctatcaccgcaagggataaat7680
atctaacaccgtgcgtgttgactattttacctctggcggtgataatggttgcatgtacta7740
aggaggttgtatggaacaacgcataaccctgaaagattatgcaatgcgctttgggcaaac7800
caagacagctaaagatctcggcgtatatcaaagcgcgatcaacaaggccattcatgcagg7860
ccgaaagatttttttaactataaacgctgatggaagcgtttatgcggaagaggtaaagcc7920
cttcccgagtaacaaaaaaacaacagcataaataaccccgctcttacacattccagccct7980
gaaaaagggcatcaaattaaaccacacctatggtgtatgcatttatttgcatacattcaa8040
tcaattgttatctaaggaaatacttacatatggttcgtgcaaacaaacgcaacgaggctc8100
tacgaatcgagagtgcgttgcttaacaaaatcgcaatgcttggaactgagaagacagcgg8160
aagctgtgggcgttgataagtcgcagatcagcaggtggaagagggactggattccaaagt8220
tctcaatgctgcttgctgttcttgaatggggggtcgttgacgacgacatggctcgattgg8280
cgcgacaagttgctgcgattctcaccaataaaaaacgcccggcggcaaccgagcgttctg8340
aacaaatccagatggagttctgaggtcattactggatctatcaacaggagtcattatgac8400
aaatacagcaaaaatactcaacttcggcagaggtaactttgccggacaggagcgtaatgt8460
ggcagatctcgatgatggttacgccagactatcaaatatgctgcttgaggcttattcggg8520
cgcagatctgaccaagcgacagtttaaagtgctgcttgccattctgcgtaaaacctatgg8580
gtggaataaaccaatggacagaatcaccgattctcaacttagcgagattacaaagttacc8640
tgtcaaacggtgcaatgaagccaagttagaactcgtcagaatgaatattatcaagcagca8700
aggcggcatgtttggaccaaataaaaacatctcagaatggtgcatccctcaaaacgaggg8760
aaaatcccctaaaacgagggataaaacatccctcaaattgggggattgctatccctcaaa8820
acagggggacacaaaagacactattacaaaagaaaaaagaaaagattattcgtcagagaa8880
ttctggcgaatcctctgaccagccagaaaacgacctttctgtggtgaaaccggatgctgc8940
aattcagagcggcagcaagtgggggacagcagaagacctgaccgccgcagagtggatgtt9000
tgacatggtgaagactatcgcaccatcagccagaaaaccgaattttgctgggtgggctaa9060
cgatatccgcctgatgcgtgaacgtgacggacgtaaccaccgcga9105
<210>12
<211>9107
<212>dna
<213>artificialsequence
<220>
<223>lambdadna
<400>12
catgtgtgtgctgttccgctgggcatgccaggacaacttctggtccggtaacgtgctgag60
cccggccaaactccgcgataagtggacccaactcgaaatcaaccgtaacaagcaacaggc120
aggcgtgacagccagcaaaccaaaactcgacctgacaaacacagactggatttacggggt180
ggatctatgaaaaacatcgccgcacagatggttaactttgaccgtgagcagatgcgtcgg240
atcgccaacaacatgccggaacagtacgacgaaaagccgcaggtacagcaggtagcgcag300
atcatcaacggtgtgttcagccagttactggcaactttcccggcgagcctggctaaccgt360
gaccagaacgaagtgaacgaaatccgtcgccagtgggttctggcttttcgggaaaacggg420
atcaccacgatggaacaggttaacgcaggaatgcgcgtagcccgtcggcagaatcgacca480
tttctgccatcacccgggcagtttgttgcatggtgccgggaagaagcatccgttaccgcc540
ggactgccaaacgtcagcgagctggttgatatggtttacgagtattgccggaagcgaggc600
ctgtatccggatgcggagtcttatccgtggaaatcaaacgcgcactactggctggttacc660
aacctgtatcagaacatgcgggccaatgcgcttactgatgcggaattacgccgtaaggcc720
gcagatgagcttgtccatatgactgcgagaattaaccgtggtgaggcgatccctgaacca780
gtaaaacaacttcctgtcatgggcggtagacctctaaatcgtgcacaggctctggcgaag840
atcgcagaaatcaaagctaagttcggactgaaaggagcaagtgtatgacgggcaaagagg900
caattattcattacctggggacgcataatagcttctgtgcgccggacgttgccgcgctaa960
caggcgcaacagtaaccagcataaatcaggccgcggctaaaatggcacgggcaggtcttc1020
tggttatcgaaggtaaggtctggcgaacggtgtattaccggtttgctaccagggaagaac1080
gggaaggaaagatgagcacgaacctggtttttaaggagtgtcgccagagtgccgcgatga1140
aacgggtattggcggtatatggagttaaaagatgaccatctacattactgagctaataac1200
aggcctgctggtaatcgcaggcctttttatttgggggagagggaagtcatgaaaaaacta1260
acctttgaaattcgatctccagcacatcagcaaaacgctattcacgcagtacagcaaatc1320
cttccagacccaaccaaaccaatcgtagtaaccattcaggaacgcaaccgcagcttagac1380
caaaacaggaagctatgggcctgcttaggtgacgtctctcgtcaggttgaatggcatggt1440
cgctggctggatgcagaaagctggaagtgtgtgtttaccgcagcattaaagcagcaggat1500
gttgttcctaaccttgccgggaatggctttgtggtaataggccagtcaaccagcaggatg1560
cgtgtaggcgaatttgcggagctattagagcttatacaggcattcggtacagagcgtggc1620
gttaagtggtcagacgaagcgagactggctctggagtggaaagcgagatggggagacagg1680
gctgcatgataaatgtcgttagtttctccggtggcaggacgtcagcatatttgctctggc1740
taatggagcaaaagcgacgggcaggtaaagacgtgcattacgttttcatggatacaggtt1800
gtgaacatccaatgacatatcggtttgtcagggaagttgtgaagttctgggatataccgc1860
tcaccgtattgcaggttgatatcaacccggagcttggacagccaaatggttatacggtat1920
gggaaccaaaggatattcagacgcgaatgcctgttctgaagccatttatcgatatggtaa1980
agaaatatggcactccatacgtcggcggcgcgttctgcactgacagattaaaactcgttc2040
ccttcaccaaatactgtgatgaccatttcgggcgagggaattacaccacgtggattggca2100
tcagagctgatgaaccgaagcggctaaagccaaagcctggaatcagatatcttgctgaac2160
tgtcagactttgagaaggaagatatcctcgcatggtggaagcaacaaccattcgatttgc2220
aaataccggaacatctcggtaactgcatattctgcattaaaaaatcaacgcaaaaaatcg2280
gacttgcctgcaaagatgaggagggattgcagcgtgtttttaatgaggtcatcacgggat2340
cccatgtgcgtgacggacatcgggaaacgccaaaggagattatgtaccgaggaagaatgt2400
cgctggacggtatcgcgaaaatgtattcagaaaatgattatcaagccctgtatcaggaca2460
tggtacgagctaaaagattcgataccggctcttgttctgagtcatgcgaaatatttggag2520
ggcagcttgatttcgacttcgggagggaagctgcatgatgcgatgttatcggtgcggtga2580
atgcaaagaagataaccgcttccgaccaaatcaaccttactggaatcgatggtgtctccg2640
gtgtgaaagaacaccaacaggggtgttaccactaccgcaggaaaaggaggacgtgtggcg2700
agacagcgacgaagtatcaccgacataatctgcgaaaactgcaaataccttccaacgaaa2760
cgcaccagaaataaacccaagccaatcccaaaagaatctgacgtaaaaaccttcaactac2820
acggctcacctgtgggatatccggtggctaagacgtcgtgcgaggaaaacaaggtgattg2880
accaaaatcgaagttacgaacaagaaagcgtcgagcgagctttaacgtgcgctaactgcg2940
gtcagaagctgcatgtgctggaagttcacgtgtgtgagcactgctgcgcagaactgatga3000
gcgatccgaatagctcgatgcacgaggaagaagatgatggctaaaccagcgcgaagacga3060
tgtaaaaacgatgaatgccgggaatggtttcaccctgcattcgctaatcagtggtggtgc3120
tctccagagtgtggaaccaagatagcactcgaacgacgaagtaaagaacgcgaaaaagcg3180
gaaaaagcagcagagaagaaacgacgacgagaggagcagaaacagaaagataaacttaag3240
attcgaaaactcgccttaaagccccgcagttactggattaaacaagcccaacaagccgta3300
aacgccttcatcagagaaagagaccgcgacttaccatgtatctcgtgcggaacgctcacg3360
tctgctcagtgggatgccggacattaccggacaactgctgcggcacctcaactccgattt3420
aatgaacgcaatattcacaagcaatgcgtggtgtgcaaccagcacaaaagcggaaatctc3480
gttccgtatcgcgtcgaactgattagccgcatcgggcaggaagcagtagacgaaatcgaa3540
tcaaaccataaccgccatcgctggactatcgaagagtgcaaggcgatcaaggcagagtac3600
caacagaaactcaaagacctgcgaaatagcagaagtgaggccgcatgacgttctcagtaa3660
aaaccattccagacatgctcgttgaagcatacggaaatcagacagaagtagcacgcagac3720
tgaaatgtagtcgcggtacggtcagaaaatacgttgatgataaagacgggaaaatgcacg3780
ccatcgtcaacgacgttctcatggttcatcgcggatggagtgaaagagatgcgctattac3840
gaaaaaattgatggcagcaaataccgaaatatttgggtagttggcgatctgcacggatgc3900
tacacgaacctgatgaacaaactggatacgattggattcgacaacaaaaaagacctgctt3960
atctcggtgggcgatttggttgatcgtggtgcagagaacgttgaatgcctggaattaatc4020
acattcccctggttcagagctgtacgtggaaaccatgagcaaatgatgattgatggctta4080
tcagagcgtggaaacgttaatcactggctgcttaatggcggtggctggttctttaatctc4140
gattacgacaaagaaattctggctaaagctcttgcccataaagcagatgaacttccgtta4200
atcatcgaactggtgagcaaagataaaaaatatgttatctgccacgccgattatcccttt4260
gacgaatacgagtttggaaagccagttgatcatcagcaggtaatctggaaccgcgaacga4320
atcagcaactcacaaaacgggatcgtgaaagaaatcaaaggcgcggacacgttcatcttt4380
ggtcatacgccagcagtgaaaccactcaagtttgccaaccaaatgtatatcgataccggc4440
gcagtgttctgcggaaacctaacattgattcaggtacagggagaaggcgcatgagactcg4500
aaagcgtagctaaatttcattcgccaaaaagcccgatgatgagcgactcaccacgggcca4560
cggcttctgactctctttccggtactgatgtgatggctgctatggggatggcgcaatcac4620
aagccggattcggtatggctgcattctgcggtaagcacgaactcagccagaacgacaaac4680
aaaaggctatcaactatctgatgcaatttgcacacaaggtatcggggaaataccgtggtg4740
tggcaaagcttgaaggaaatactaaggcaaaggtactgcaagtgctcgcaacattcgctt4800
atgcggattattgccgtagtgccgcgacgccgggggcaagatgcagagattgccatggta4860
caggccgtgcggttgatattgccaaaacagagctgtgggggagagttgtcgagaaagagt4920
gcggaagatgcaaaggcgtcggctattcaaggatgccagcaagcgcagcatatcgcgctg4980
tgacgatgctaatcccaaaccttacccaacccacctggtcacgcactgttaagccgctgt5040
atgacgctctggtggtgcaatgccacaaagaagagtcaatcgcagacaacattttgaatg5100
cggtcacacgttagcagcatgattgccacggatggcaacatattaacggcatgatattga5160
cttattgaataaaattgggtaaatttgactcaacgatgggttaattcgctcgttgtggta5220
gtgagatgaaaagaggcggcgcttactaccgattccgcctagttggtcacttcgacgtat5280
cgtctggaactccaaccatcgcaggcagagaggtctgcaaaatgcaatcccgaaacagtt5340
cgcaggtaatagttagagcctgcataacggtttcgggattttttatatctgcacaacagg5400
taagagcattgagtcgataatcgtgaagagtcggcgagcctggttagccagtgctctttc5460
cgttgtgctgaattaagcgaataccggaagcagaaccggatcaccaaatgcgtacaggcg5520
tcatcgccgcccagcaacagcacaacccaaactgagccgtagccactgtctgtcctgaat5580
tcattagtaatagttacgctgcggccttttacacatgaccttcgtgaaagcgggtggcag5640
gaggtcgcgctaacaacctcctgccgttttgcccgtgcatatcggtcacgaacaaatctg5700
attactaaacacagtagcctggatttgttctatcagtaatcgaccttattcctaattaaa5760
tagagcaaatccccttattgggggtaagacatgaagatgccagaaaaacatgacctgttg5820
gccgccattctcgcggcaaaggaacaaggcatcggggcaatccttgcgtttgcaatggcg5880
taccttcgcggcagatataatggcggtgcgtttacaaaaacagtaatcgacgcaacgatg5940
tgcgccattatcgcctggttcattcgtgaccttctcgacttcgccggactaagtagcaat6000
ctcgcttatataacgagcgtgtttatcggctacatcggtactgactcgattggttcgctt6060
atcaaacgcttcgctgctaaaaaagccggagtagaagatggtagaaatcaataatcaacg6120
taaggcgttcctcgatatgctggcgtggtcggagggaactgataacggacgtcagaaaac6180
cagaaatcatggttatgacgtcattgtaggcggagagctatttactgattactccgatca6240
ccctcgcaaacttgtcacgctaaacccaaaactcaaatcaacaggcgccggacgctacca6300
gcttctttcccgttggtgggatgcctaccgcaagcagcttggcctgaaagacttctctcc6360
gaaaagtcaggacgctgtggcattgcagcagattaaggagcgtggcgctttacctatgat6420
tgatcgtggtgatatccgtcaggcaatcgaccgttgcagcaatatctgggcttcactgcc6480
gggcgctggttatggtcagttcgagcataaggctgacagcctgattgcaaaattcaaaga6540
agcgggcggaacggtcagagagattgatgtatgagcagagtcaccgcgattatctccgct6600
ctggttatctgcatcatcgtctgcctgtcatgggctgttaatcattaccgtgataacgcc6660
attacctacaaagcccagcgcgacaaaaatgccagagaactgaagctggcgaacgcggca6720
attactgacatgcagatgcgtcagcgtgatgttgctgcgctcgatgcaaaatacacgaag6780
gagttagctgatgctaaagctgaaaatgatgctctgcgtgatgatgttgccgctggtcgt6840
cgtcggttgcacatcaaagcagtctgtcagtcagtgcgtgaagccaccaccgcctccggc6900
gtggataatgcagcctccccccgactggcagacaccgctgaacgggattatttcaccctc6960
agagagaggctgatcactatgcaaaaacaactggaaggaacccagaagtatattaatgag7020
cagtgcagatagagttgcccatatcgatgggcaactcatgcaattattgtgagcaataca7080
cacgcgcttccagcggagtataaatgcctaaagtaataaaaccgagcaatccatttacga7140
atgtttgctgggtttctgttttaacaacattttctgcgccgccacaaattttggctgcat7200
cgacagttttcttctgcccaattccagaaacgaagaaatgatgggtgatggtttcctttg7260
gtgctactgctgccggtttgttttgaacagtaaacgtctgttgagcacatcctgtaataa7320
gcagggccagcgcagtagcgagtagcatttttttcatggtgttattcccgatgctttttg7380
aagttcgcagaatcgtatgtgtagaaaattaaacaaaccctaaacaatgagttgaaattt7440
catattgttaatatttattaatgtatgtcaggtgcgatgaatcgtcattgtattcccgga7500
ttaactatgtccacagccctgacggggaacttctctgcgggagtgtccgggaataattaa7560
aacgatgcacacagggtttagcgcgtacacgtattgcattatgccaacgccccggtgctg7620
acacggaagaaaccggacgttatgatttagcgtggaaagatttgtgtagtgttctgaatg7680
ctctcagtaaatagtaatgaattatcaaaggtatagtaatatcttttatgttcatggata7740
tttgtaacccatcggaaaactcctgctttagcaagattttccctgtattgctgaaatgtg7800
atttctcttgatttcaacctatcataggacgtttctataagatgcgtgtttcttgagaat7860
ttaacatttacaacctttttaagtccttttattaacacggtgttatcgttttctaacacg7920
atgtgaatattatctgtggctagatagtaaatataatgtgagacgttgtgacgttttagt7980
tcagaataaaacaattcacagtctaaatcttttcgcacttgatcgaatatttctttaaaa8040
atggcaacctgagccattggtaaaaccttccatgtgatacgagggcgcgtagtttgcatt8100
atcgtttttatcgtttcaatctggtctgacctccttgtgttttgttgatgatttatgtca8160
aatattaggaatgttttcacttaatagtattggttgcgtaacaaagtgcggtcctgctgg8220
cattctggagggaaatacaaccgacagatgtatgtaaggccaacgtgctcaaatcttcat8280
acagaaagatttgaagtaatattttaaccgctagatgaagagcaagcgcatggagcgaca8340
aaatgaataaagaacaatctgctgatgatccctccgtggatctgattcgtgtaaaaaata8400
tgcttaatagcaccatttctatgagttaccctgatgttgtaattgcatgtatagaacata8460
aggtgtctctggaagcattcagagcaattgaggcagcgttggtgaagcacgataataata8520
tgaaggattattccctggtggttgactgatcaccataactgctaatcattcaaactattt8580
agtctgtgacagagccaacacgcagtctgtcactgtcaggaaagtggtaaaactgcaact8640
caattactgcaatgccctcgtaattaagtgaatttacaatatcgtcctgttcggagggaa8700
gaacgcgggatgttcattcttcatcacttttaattgatgtatatgctctcttttctgacg8760
ttagtctccgacggcaggcttcaatgacccaggctgagaaattcccggaccctttttgct8820
caagagcgatgttaatttgttcaatcatttggttaggaaagcggatgttgcgggttgttg8880
ttctgcgggttctgttcttcgttgacatgaggttgccccgtattcagtgtcgctgatttg8940
tattgtctgaagttgtttttacgttaagttgatgcagatcaattaatacgatacctgcgt9000
cataattgattatttgacgtggtttgatggcctccacgcacgttgtgatatgtagatgat9060
aatcattatcactttacgggtcctttccggtgatccgacaggttacg9107
<210>13
<211>103
<212>rna
<213>artificialsequence
<220>
<223>sgrna
<400>13
cgcagaguccucaaaaaacgguuuuagagcuagaaauagcaaguuaaaauaaggcuaguc60
cguuaucaacuugaaaaaguggcaccgagucggugcuuuuuuu103
<210>14
<211>20
<212>dna
<213>artificialsequence
<220>
<223>protospacer
<400>14
cgcagagtcctcaaaaaacg20
<210>15
<211>103
<212>rna
<213>artificialsequence
<220>
<223>srrna
<400>15
agcaguuccagcacaaucgaguuuuagagcuagaaauagcaaguuaaaauaaggcuaguc60
cguuaucaacuugaaaaaguggcaccgagucggugcuuuuuuu103
<210>16
<211>20
<212>dna
<213>artificialsequence
<220>
<223>protospacer
<400>16
agcagttccagcacaatcga20
<210>17
<211>522
<212>dna
<213>artificialsequence
<220>
<223>lambdadna
<400>17
caccattcagctgaaagccagacgtaacagcaccacggtggtggtgaacacggtgggctc60
agagaatccggatgaagccgggcgttacagcatggatgtggagtacggtcagtacagtgt120
catcctgcaggttgacggttttccaccatcgcacgccgggaccatcaccgtgtatgaaga180
ttcacaaccggggacgctgaatgattttctctgtgccatgacggaggatgatgcccggcc240
ggaggtgctgcgtcgtcttgaactgatggtggaagaggtggcgcgtaacgcgtccgtggt300
ggcacagagtacggcagacgcgaagaaatcagccggcgatgccagtgcatcagctgctca360
ggtcgcggcccttgtgactgatgcaactgactcagcacgcgccgccagcacgtccgccgg420
acaggctgcatcgtcagctcaggaagcgtcctccggcgcagaagcggcatcagcaaaggc480
cactgaagcggaaaaaagtgccgcagccgcagagtcctcaaa522
<210>18
<211>520
<212>dna
<213>artificialsequence
<220>
<223>lambdadna
<400>18
atcgatggtgttaccaattcatggaaaaggtctgcgtcaaatccccagtcgtcatgcatt60
gcctgctctgccgcttcacgcagtgcctgagagttaatttcgctcacttcgaacctctct120
gtttactgataagttccagatcctcctggcaacttgcacaagtccgacaaccctgaacga180
ccaggcgtcttcgttcatctatcggatcgccacactcacaacaatgagtggcagatatag240
cctggtggttcaggcggcgcatttttattgctgtgttgcgctgtaattcttctatttctg300
atgctgaatcaatgatgtctgccatctttcattaatccctgaactgttggttaatacgct360
tgagggtgaatgcgaataataaaaaaggagcctgtagctccctgatgattttgcttttca420
tgttcatcgttccttaaagacgccgtttaacatgccgattgccaggcttaaatgagtcgg480
tgtgaatcccatcagcgttaccgtttcgcggtgcttcttc520
<210>19
<211>1082
<212>prt
<213>geobacillusthermodenitrificanst12
<400>19
metlystyrlysileglyleuaspileglyilethrserileglytrp
151015
alavalileasnleuaspileproargilegluaspleuglyvalarg
202530
ilepheaspargalagluasnprolysthrglygluserleualaleu
354045
proargargleualaargseralaargargargleuargargarglys
505560
hisargleugluargileargargleuphevalarggluglyileleu
65707580
thrlysglugluleuasnlysleupheglulyslyshisgluileasp
859095
valtrpglnleuargvalglualaleuasparglysleuasnasnasp
100105110
gluleualaargileleuleuhisleualalysargargglyphearg
115120125
serasnarglyssergluargthrasnlysgluasnserthrmetleu
130135140
lyshisileglugluasnglnserileleusersertyrargthrval
145150155160
alaglumetvalvallysaspprolyspheserleuhislysargasn
165170175
lysgluaspasntyrthrasnthrvalalaargaspaspleugluarg
180185190
gluilelysleuilephealalysglnargglutyrglyasnileval
195200205
cysthrglualaphegluhisglutyrileseriletrpalasergln
210215220
argprophealaserlysaspaspileglulyslysvalglyphecys
225230235240
thrphegluprolysglulysargalaprolysalathrtyrthrphe
245250255
glnserphethrvaltrpgluhisileasnlysleuargleuvalser
260265270
proglyglyileargalaleuthraspaspgluargargleuiletyr
275280285
lysglnalaphehislysasnlysilethrphehisaspvalargthr
290295300
leuleuasnleuproaspaspthrargphelysglyleuleutyrasp
305310315320
argasnthrthrleulysgluasnglulysvalargpheleugluleu
325330335
glyalatyrhislysilearglysalaileaspservaltyrglylys
340345350
glyalaalalysserpheargproileasppheaspthrpheglytyr
355360365
alaleuthrmetphelysaspaspthraspileargsertyrleuarg
370375380
asnglutyrgluglnasnglylysargmetgluasnleualaasplys
385390395400
valtyraspglugluleuileglugluleuleuasnleuserpheser
405410415
lyspheglyhisleuserleulysalaleuargasnileleuprotyr
420425430
metgluglnglygluvaltyrserthralacysgluargalaglytyr
435440445
thrphethrglyprolyslyslysglnlysthrvalleuleuproasn
450455460
ileproproilealaasnprovalvalmetargalaleuthrglnala
465470475480
arglysvalvalasnalaileilelyslystyrglyserprovalser
485490495
ilehisilegluleualaarggluleuserglnserpheaspgluarg
500505510
arglysmetglnlysgluglngluglyasnarglyslysasngluthr
515520525
alaileargglnleuvalglutyrglyleuthrleuasnprothrgly
530535540
leuaspilevallysphelysleutrpsergluglnasnglylyscys
545550555560
alatyrserleuglnproilegluilegluargleuleugluprogly
565570575
tyrthrgluvalasphisvalileprotyrserargserleuaspasp
580585590
sertyrthrasnlysvalleuvalleuthrlysgluasnargglulys
595600605
glyasnargthrproalaglutyrleuglyleuglysergluargtrp
610615620
glnglnphegluthrphevalleuthrasnlysglnpheserlyslys
625630635640
lysargaspargleuleuargleuhistyraspgluasnglugluasn
645650655
gluphelysasnargasnleuasnaspthrargtyrileserargphe
660665670
leualaasnpheilearggluhisleulysphealaaspseraspasp
675680685
lysglnlysvaltyrthrvalasnglyargilethralahisleuarg
690695700
serargtrpasnpheasnlysasnargglugluserasnleuhishis
705710715720
alavalaspalaalailevalalacysthrthrproseraspileala
725730735
argvalthralaphetyrglnargarggluglnasnlysgluleuser
740745750
lyslysthraspproglnpheproglnprotrpprohisphealaasp
755760765
gluleuglnalaargleuserlysasnprolysgluserilelysala
770775780
leuasnleuglyasntyraspasnglulysleugluserleuglnpro
785790795800
valphevalserargmetprolysargserilethrglyalaalahis
805810815
glngluthrleuargargtyrileglyileaspgluargserglylys
820825830
ileglnthrvalvallyslyslysleusergluileglnleuasplys
835840845
thrglyhisphepromettyrglylysgluseraspproargthrtyr
850855860
glualaileargglnargleuleugluhisasnasnaspprolyslys
865870875880
alapheglngluproleutyrlysprolyslysasnglygluleugly
885890895
proileileargthrilelysileileaspthrthrasnglnvalile
900905910
proleuasnaspglylysthrvalalatyrasnserasnilevalarg
915920925
valaspvalpheglulysaspglylystyrtyrcysvalproiletyr
930935940
thrileaspmetmetlysglyileleuproasnlysalaileglupro
945950955960
asnlysprotyrserglutrplysglumetthrgluasptyrthrphe
965970975
argpheserleutyrproasnaspleuileargileglupheproarg
980985990
glulysthrilelysthralavalglyglugluilelysilelysasp
99510001005
leuphealatyrtyrglnthrileaspserserasnglyglyleu
101010151020
serleuvalserhisaspasnasnpheserleuargserilegly
102510301035
serargthrleulysargpheglulystyrglnvalaspvalleu
104010451050
glyasniletyrlysvalargglyglulysargvalglyvalala
105510601065
serserserhisserlysalaglygluthrileargproleu
107010751080
<210>20
<211>1263
<212>prt
<213>eubacteriumrectale
<400>20
metasnasnglythrasnasnpheglnasnpheileglyileserser
151015
leuglnlysthrleuargasnalaleuileprothrgluthrthrgln
202530
glnpheilevallysasnglyileilelysgluaspgluleuarggly
354045
gluasnargglnileleulysaspilemetaspasptyrtyrarggly
505560
pheilesergluthrleuserserileaspaspileasptrpthrser
65707580
leupheglulysmetgluileglnleulysasnglyaspasnlysasp
859095
thrleuilelysgluglnthrglutyrarglysalailehislyslys
100105110
phealaasnaspaspargphelysasnmetpheseralalysleuile
115120125
seraspileleuprogluphevalilehisasnasnasntyrserala
130135140
serglulysgluglulysthrglnvalilelysleupheserargphe
145150155160
alathrserphelysasptyrphelysasnargalaasncyspheser
165170175
alaaspaspilesersersersercyshisargilevalasnaspasn
180185190
alagluilephepheserasnalaleuvaltyrargargilevallys
195200205
serleuserasnaspaspileasnlysileserglyaspmetlysasp
210215220
serleulysglumetserleuglugluiletyrsertyrglulystyr
225230235240
glyglupheilethrglngluglyileserphetyrasnaspilecys
245250255
glylysvalasnserphemetasnleutyrcysglnlysasnlysglu
260265270
asnlysasnleutyrlysleuglnlysleuhislysglnileleucys
275280285
ilealaaspthrsertyrgluvalprotyrlysphegluseraspglu
290295300
gluvaltyrglnservalasnglypheleuaspasnileserserlys
305310315320
hisilevalgluargleuarglysileglyaspasntyrasnglytyr
325330335
asnleuasplysiletyrilevalserlysphetyrgluservalser
340345350
glnlysthrtyrargasptrpgluthrileasnthralaleugluile
355360365
histyrasnasnileleuproglyasnglylysserlysalaasplys
370375380
vallyslysalavallysasnaspleuglnlysserilethrgluile
385390395400
asngluleuvalserasntyrlysleucysseraspaspasnilelys
405410415
alagluthrtyrilehisgluileserhisileleuasnasnpheglu
420425430
alaglngluleulystyrasnprogluilehisleuvalgluserglu
435440445
leulysalasergluleulysasnvalleuaspvalilemetasnala
450455460
phehistrpcysservalphemetthrglugluleuvalasplysasp
465470475480
asnasnphetyralagluleuglugluiletyraspgluiletyrpro
485490495
valileserleutyrasnleuvalargasntyrvalthrglnlyspro
500505510
tyrserthrlyslysilelysleuasnpheglyileprothrleuala
515520525
aspglytrpserlysserlysglutyrserasnasnalaileileleu
530535540
metargaspasnleutyrtyrleuglyilepheasnalalysasnlys
545550555560
proasplyslysileilegluglyasnthrsergluasnlysglyasp
565570575
tyrlyslysmetiletyrasnleuleuproglyproasnlysmetile
580585590
prolysvalpheleuserserlysthrglyvalgluthrtyrlyspro
595600605
seralatyrileleugluglytyrlysglnasnlyshisilelysser
610615620
serlysasppheaspilethrphecyshisaspleuileasptyrphe
625630635640
lysasncysilealailehisproglutrplysasnpheglypheasp
645650655
pheseraspthrserthrtyrgluaspileserglyphetyrargglu
660665670
valgluleuglnglytyrlysileasptrpthrtyrileserglulys
675680685
aspileaspleuleuglnglulysglyglnleutyrleupheglnile
690695700
tyrasnlysasppheserlyslysserthrglyasnaspasnleuhis
705710715720
thrmettyrleulysasnleupheserglugluasnleulysaspile
725730735
valleulysleuasnglyglualagluilephephearglysserser
740745750
ilelysasnproileilehislyslysglyserileleuvalasnarg
755760765
thrtyrglualagluglulysaspglnpheglyasnileglnileval
770775780
arglysasnileprogluasniletyrglngluleutyrlystyrphe
785790795800
asnasplysserasplysgluleuseraspglualaalalysleulys
805810815
asnvalvalglyhishisglualaalathrasnilevallysasptyr
820825830
argtyrthrtyrasplystyrpheleuhismetproilethrileasn
835840845
phelysalaasnlysthrglypheileasnaspargileleuglntyr
850855860
ilealalysglulysaspleuhisvalileglyileaspargglyglu
865870875880
argasnleuiletyrvalservalileaspthrcysglyasnileval
885890895
gluglnlysserpheasnilevalasnglytyrasptyrglnilelys
900905910
leulysglnglngluglyalaargglnilealaarglysglutrplys
915920925
gluileglylysilelysgluilelysgluglytyrleuserleuval
930935940
ilehisgluileserlysmetvalilelystyrasnalaileileala
945950955960
metgluaspleusertyrglyphelyslysglyargphelysvalglu
965970975
argglnvaltyrglnlysphegluthrmetleuileasnlysleuasn
980985990
tyrleuvalphelysaspileserilethrgluasnglyglyleuleu
99510001005
lysglytyrglnleuthrtyrileproasplysleulysasnval
101010151020
glyhisglncysglycysilephetyrvalproalaalatyrthr
102510301035
serlysileaspprothrthrglyphevalasnilephelysphe
104010451050
lysaspleuthrvalaspalalysargglupheilelyslysphe
105510601065
aspserileargtyraspserglulysasnleuphecysphethr
107010751080
pheasptyrasnasnpheilethrglnasnthrvalmetserlys
108510901095
sersertrpservaltyrthrtyrglyvalargilelysargarg
110011051110
phevalasnglyargpheserasngluseraspthrileaspile
111511201125
thrlysaspmetglulysthrleuglumetthraspileasntrp
113011351140
argaspglyhisaspleuargglnaspileileasptyrgluile
114511501155
valglnhisilephegluilepheargleuthrvalglnmetarg
116011651170
asnserleusergluleugluaspargasptyraspargleuile
117511801185
serprovalleuasngluasnasnilephetyraspseralalys
119011951200
alaglyaspalaleuprolysaspalaaspalaasnglyalatyr
120512101215
cysilealaleulysglyleutyrgluilelysglnilethrglu
122012251230
asntrplysgluaspglylyspheserargasplysleulysile
123512401245
serasnlysasptrppheasppheileglnasnlysargtyrleu
125012551260
<210>21
<211>1274
<212>prt
<213>artificialsequence
<220>
<223>mad7-nls
<400>21
metasnasnglythrasnasnpheglnasnpheileglyileserser
151015
leuglnlysthrleuargasnalaleuileprothrgluthrthrgln
202530
glnpheilevallysasnglyileilelysgluaspgluleuarggly
354045
gluasnargglnileleulysaspilemetaspasptyrtyrarggly
505560
pheilesergluthrleuserserileaspaspileasptrpthrser
65707580
leupheglulysmetgluileglnleulysasnglyaspasnlysasp
859095
thrleuilelysgluglnthrglutyrarglysalailehislyslys
100105110
phealaasnaspaspargphelysasnmetpheseralalysleuile
115120125
seraspileleuprogluphevalilehisasnasnasntyrserala
130135140
serglulysgluglulysthrglnvalilelysleupheserargphe
145150155160
alathrserphelysasptyrphelysasnargalaasncyspheser
165170175
alaaspaspilesersersersercyshisargilevalasnaspasn
180185190
alagluilephepheserasnalaleuvaltyrargargilevallys
195200205
serleuserasnaspaspileasnlysileserglyaspmetlysasp
210215220
serleulysglumetserleuglugluiletyrsertyrglulystyr
225230235240
glyglupheilethrglngluglyileserphetyrasnaspilecys
245250255
glylysvalasnserphemetasnleutyrcysglnlysasnlysglu
260265270
asnlysasnleutyrlysleuglnlysleuhislysglnileleucys
275280285
ilealaaspthrsertyrgluvalprotyrlysphegluseraspglu
290295300
gluvaltyrglnservalasnglypheleuaspasnileserserlys
305310315320
hisilevalgluargleuarglysileglyaspasntyrasnglytyr
325330335
asnleuasplysiletyrilevalserlysphetyrgluservalser
340345350
glnlysthrtyrargasptrpgluthrileasnthralaleugluile
355360365
histyrasnasnileleuproglyasnglylysserlysalaasplys
370375380
vallyslysalavallysasnaspleuglnlysserilethrgluile
385390395400
asngluleuvalserasntyrlysleucysseraspaspasnilelys
405410415
alagluthrtyrilehisgluileserhisileleuasnasnpheglu
420425430
alaglngluleulystyrasnprogluilehisleuvalgluserglu
435440445
leulysalasergluleulysasnvalleuaspvalilemetasnala
450455460
phehistrpcysservalphemetthrglugluleuvalasplysasp
465470475480
asnasnphetyralagluleuglugluiletyraspgluiletyrpro
485490495
valileserleutyrasnleuvalargasntyrvalthrglnlyspro
500505510
tyrserthrlyslysilelysleuasnpheglyileprothrleuala
515520525
aspglytrpserlysserlysglutyrserasnasnalaileileleu
530535540
metargaspasnleutyrtyrleuglyilepheasnalalysasnlys
545550555560
proasplyslysileilegluglyasnthrsergluasnlysglyasp
565570575
tyrlyslysmetiletyrasnleuleuproglyproasnlysmetile
580585590
prolysvalpheleuserserlysthrglyvalgluthrtyrlyspro
595600605
seralatyrileleugluglytyrlysglnasnlyshisilelysser
610615620
serlysasppheaspilethrphecyshisaspleuileasptyrphe
625630635640
lysasncysilealailehisproglutrplysasnpheglypheasp
645650655
pheseraspthrserthrtyrgluaspileserglyphetyrargglu
660665670
valgluleuglnglytyrlysileasptrpthrtyrileserglulys
675680685
aspileaspleuleuglnglulysglyglnleutyrleupheglnile
690695700
tyrasnlysasppheserlyslysserthrglyasnaspasnleuhis
705710715720
thrmettyrleulysasnleupheserglugluasnleulysaspile
725730735
valleulysleuasnglyglualagluilephephearglysserser
740745750
ilelysasnproileilehislyslysglyserileleuvalasnarg
755760765
thrtyrglualagluglulysaspglnpheglyasnileglnileval
770775780
arglysasnileprogluasniletyrglngluleutyrlystyrphe
785790795800
asnasplysserasplysgluleuseraspglualaalalysleulys
805810815
asnvalvalglyhishisglualaalathrasnilevallysasptyr
820825830
argtyrthrtyrasplystyrpheleuhismetproilethrileasn
835840845
phelysalaasnlysthrglypheileasnaspargileleuglntyr
850855860
ilealalysglulysaspleuhisvalileglyileaspargglyglu
865870875880
argasnleuiletyrvalservalileaspthrcysglyasnileval
885890895
gluglnlysserpheasnilevalasnglytyrasptyrglnilelys
900905910
leulysglnglngluglyalaargglnilealaarglysglutrplys
915920925
gluileglylysilelysgluilelysgluglytyrleuserleuval
930935940
ilehisgluileserlysmetvalilelystyrasnalaileileala
945950955960
metgluaspleusertyrglyphelyslysglyargphelysvalglu
965970975
argglnvaltyrglnlysphegluthrmetleuileasnlysleuasn
980985990
tyrleuvalphelysaspileserilethrgluasnglyglyleuleu
99510001005
lysglytyrglnleuthrtyrileproasplysleulysasnval
101010151020
glyhisglncysglycysilephetyrvalproalaalatyrthr
102510301035
serlysileaspprothrthrglyphevalasnilephelysphe
104010451050
lysaspleuthrvalaspalalysargglupheilelyslysphe
105510601065
aspserileargtyraspserglulysasnleuphecysphethr
107010751080
pheasptyrasnasnpheilethrglnasnthrvalmetserlys
108510901095
sersertrpservaltyrthrtyrglyvalargilelysargarg
110011051110
phevalasnglyargpheserasngluseraspthrileaspile
111511201125
thrlysaspmetglulysthrleuglumetthraspileasntrp
113011351140
argaspglyhisaspleuargglnaspileileasptyrgluile
114511501155
valglnhisilephegluilepheargleuthrvalglnmetarg
116011651170
asnserleusergluleugluaspargasptyraspargleuile
117511801185
serprovalleuasngluasnasnilephetyraspseralalys
119011951200
alaglyaspalaleuprolysaspalaaspalaasnglyalatyr
120512101215
cysilealaleulysglyleutyrgluilelysglnilethrglu
122012251230
asntrplysgluaspglylyspheserargasplysleulysile
123512401245
serasnlysasptrppheasppheileglnasnlysargtyrleu
125012551260
serglyglyserprolyslyslysarglysval
12651270