产生嵌合腺病毒的方法及这种嵌合腺病毒的用途的制作方法

文档序号:3555794阅读:676来源:国知局
专利名称:产生嵌合腺病毒的方法及这种嵌合腺病毒的用途的制作方法
背景技术
存在针对腺病毒衣壳蛋白的体液免疫(循环抗体)是腺病毒载体用于基因治疗的障碍。已开发用于基因治疗的原型腺病毒载体以亚群C腺病毒为基础,例如血清型5。由于频繁接触这些病原体,人群中通常流行高水平的抗亚群C腺病毒的中和抗体。该事实可能极大限制基于血清型(例如Ad5)的基因治疗载体的有效性。
抗腺病毒保护性抗体的性质分析表明最重要的靶位是主要的衣壳蛋白,六邻体[Wolfhart(1988)J.Virol 62,2321;Gall等.(1996)J.Virol.70,2116]。已进行了多次努力通过制造含有来自其它血清型的六邻体的嵌合腺病毒来工程改造六邻体从而避免抗六邻体抗体[Roy等.(1998)J.Virol.72,6875;美国专利号5,922,315;Gall等.(1998)J.Virol.72,10260;Youil等.(2002)Hum.Gene Ther.13,311;Wu等.(2002)J.Virol.76,12775]。然而,当试图在远缘血清型之间进行交换时,这基本上是不成功的。
此外,研究者提议使用很少导致人感染的腺病毒载体或使用非人来源的腺病毒。然而,证明缺乏实用的方式来生产大量的这种载体阻碍了这种载体的开发。
发明概述本发明提供修饰具有衣壳的腺病毒的方法,特别是含有来自不适合用于在生产腺病毒病毒粒子的细胞内生长的血清型的六邻体。该方法可用于生产大量的腺病毒。得到的嵌合腺病毒基因组可用于文中所述的各种目的。
本发明还提供新颖的、分离的腺病毒SA18核酸和氨基酸序列,含有这些物质的载体,含有这种SA18序列和/或载体的细胞系及其用途。
通过以下发明详述可容易地明白本发明的其它方面和优点。
附图简述

图1是通过以下实施例所述的鸟枪法克隆产生的猿腺病毒基因组的图谱。
图2命名为H5S25H5的重组Adhu5-SV25嵌合病毒的图谱。
发明详述本发明提供嵌合腺病毒基因组,所述基因组由可在所选宿主细胞中培养的腺病毒的左侧末端和右侧末端,以及至少编码另一种腺病毒血清型的衣壳蛋白的内部区域组成。本发明尤其于有利产生具有难以在所需细胞类型中培养的血清型的腺病毒。因此,本发明可产生不同血清型的嵌合腺病毒载体。
在文中所述的实施方案中,嵌合腺病毒构建为大多数结构蛋白,而非仅六邻体或尾丝(fiber)来源于不相关的血清型的腺病毒,藉此保留了参与衣壳装配的大部分蛋白-蛋白相互作用。大多数早期基因(例如由负责转录调节和调节宿主细胞循环的腺病毒E1和E4区域所编码)从不同的血清型保留下来,所述血清型已知可在常规使用的细胞类型中产生高滴度病毒,所述细胞类型是例如提供反式Ad5E1蛋白的HEK 293。
在另一实施方案中,本发明提供最初分离自黑长尾猴[ATCC VR-943]的AdSA18的新颖核酸与氨基酸序列。本发明还提供新颖的腺病毒载体和包装细胞系来生产用于体外生产重组蛋白或片段或其它试剂的那些载体。本发明还提供用于传递治疗或疫苗目的的异源分子的组合物。这种治疗或疫苗组合物含有携带插入的异源分子的腺病毒载体。此外,本发明的新颖序列用于提供生产重组腺相关病毒(AAV)载体所需的基本辅助功能物。所以,本发明提供辅助构建物、方法以及在这种生产方法中使用这些序列的细胞系。
当术语“基本同源性”或“基本相似性”指核酸或其片段时意味着将合适的核苷酸插入或缺失与另一条核酸(或其互补链)最佳对比时,对比序列中至少有约95%到99%的核苷酸序列同一性。
当术语“基本同源性”或“基本相似性”指氨基酸或其片段时意味着将合适的氨基酸插入或缺失与另一条氨基酸(或其互补链)最佳对比时,对比序列中至少有约95%到99%的氨基酸序列同一性。优选在全长序列,或其蛋白质,或其至少8个氨基酸,更希望至少15个氨基酸长度的片段上具有同源性。合适片段的例子描述于本文。
文中用于核酸序列的术语“序列同一性百分比”或“相同”指当对比最大一致性时,两条序列中相同的残基。序列同一性比较的长度需要是基因组全长(例如,约36kbp)、基因的开放读框的全长、蛋白、亚基、或酶[参见,例如提供腺病毒编码区域的表]、或至少约500到5000个核苷酸的片段。然而,较小片段中的同一性也是需要的,例如至少约9个核苷酸、通常至少约20到24个核苷酸、至少约28到32个核苷酸、至少约36或更多个核苷酸的片段。类似地,氨基酸序列、蛋白全长或其片段的“序列同一性百分比”可容易地确定。合适片段的长度至少约8个氨基酸,也可达到约700个氨基酸。合适片段的例子描述于文中。
同一性可使用文中所述用默认设置的算法和计算机程序来容易地确定。优选在蛋白质的全长、酶、亚基或至少约8个氨基酸长度的片段上具有这种同一性。然而,同一性也可基于适合于使用相同基因产物的较短区域。
如文中所述,可使用任何通过因特网的万维服务器的各种公用或市售可得的多序列对比程序(Multiple Sequence Alignment Programs),例如“Clustal W”进行对比。此外,也可使用Vector NTI应用软件。许多本领域已知的算法也可用于测量核苷酸序列同一性,包括包含在上述程序中的算法。使用GCG6.1版中的Fasta程序比较多核苷酸序列是另一个例子。Fasta提供在查询和检索序列之间最佳重叠区域的对比和序列同一性百分比。例如,核酸序列之间的序列同一性百分比可使用GCG6.1版提供的具有默认参数的Fasta(字长6与计分矩阵的NOPAM系数)确定,该程序纳入本文引作参考。进行氨基酸对比可用类似的程序。虽然本领域的技术人员可视需要改变这些设置,但通常这些程序按默认设置使用。此外,本领域的技术人员可利用另一种算法或计算机程序,该算法或程序提供的同一性或算法的水平至少同参考的算法和程序提供的一样。
本说明书和权利要求中使用的术语“含有”及其变体(包括“有”、“包含”)可包括其它成分、元件、整数、步骤等。术语“由…组成”则不包括其它成分、元件、整数、步骤等。
除非另有说明,术语“载体”包括将靶分子传递至细胞的本领域已知的任何遗传元件,所述靶分子包括裸DNA、质粒、噬菌体、转座子、粘粒、附加体、病毒等。
“小基因”指选择的异源基因与驱动基因产物在宿主细胞中翻译、转录和/或表达所需的其它调节元件的组合。
文中使用的术语“反补”(transcomplement)指一种腺病毒血清型的基因(基因产物)为来自另一种血清型的缺乏这种基因(基因产物)的腺病毒血清型提供缺失的功能。例如,已知人腺病毒血清型5E1a和E1b功能物反补E1-缺失的黑猩猩腺病毒Pan 9。类似地,本发明人发现人Ad5E1反补E1-缺失的黑猩猩腺病毒Pan5、Pan6、Pan7和猿腺病毒血清型SV1、SV25和SV39。反补血清型的其它例子包括人Ad5和人Ad2、Ad3、Ad4、Ad5、Ad7和Ad12。
术语“功能缺失的”或“功能缺失”指例如通过突变或修饰除去或破坏足够量的基因区域,使该基因区域不再能生产基因表达的功能产物。如果需要,可除去全部基因区域。其它合适的基因破坏或缺失的位点在本申请的其它部分。
术语“功能性”指虽然未必与天然产物的水平相同,但能执行其天然功能的产物(例如,蛋白或多肽)。术语“功能性”也指编码和表达所需产物的基因。
I.嵌合腺病毒载体本发明的组合物含有传递异源分子至细胞的嵌合腺病毒载体。为传递这种异源分子,载体可是质粒或优选嵌合腺病毒。本发明的嵌合腺病毒含有至少来自两种来源的血清型(文中详述的“供体血清型”和“亲代腺病毒”)的腺病毒DNA和小基因。
因为腺病毒基因组在两条链上均含有开放读框,本发明的许多例子中对各种区域的5’和3’端作了标记以避免混淆特定的开放读框和基因区域。因此,当文中对腺病毒基因组的“左”端和“右”端作标记时,该标记离本领域常规示意图形式所描述的腺病毒基因组的末端约36kb[参见,例如Horwitz,“腺病毒及其复制”(Adenoviridae and Their Replication),刊于《病毒学》(VIROLOGY),第二版,1679-1721页(1990)]。因此,文中使用的腺病毒基因组的“左末端”指以线形形式示意描述基因组时位于示意图的最左端的腺病毒基因组部分。左端通常指始于图单元0并向右延伸至少包括5’末端反向重复序列(ITR)的基因组部分,并且不包括编码结构基因的基因组的内部区域。文中使用的腺病毒基因组的“右末端”指以线形形式示意描述基因组时,位于示意图的最右端的腺病毒基因组部分。右端通常指终于图单元36并向左延伸至少包括3’ITR的基因组部分,并且不包括编码结构基因的基因组的内部区域。
A.腺病毒调节序列
1.血清型本领域的技术人员从可在所需细胞系中容易地培养血清型中容易地选择给予其左和右末端的腺病毒血清型。在选择供体血清型的血清型中可考虑的其它因素是与腺病毒血清型的相容性,所述腺病毒血清型在其序列杂交的位置提供内部区域。
合适的给予其左右末端的腺病毒获得自美国模式培养物保藏所(AmericanType Culture Collection,Manassas,Virginia,美国(ATCC)),各种学术和商业来源;或者供体腺病毒的所需区域可使用已知技术、参考公布于参考文献中的或获得自数据库(例如GenBank等)的序列来合成。合适的供体腺病毒的例子包括(不限于)人腺病毒血清型2、3、4、5、7和12,并还包括任何能在所需细胞中培养的现在已鉴定的人类型[参见。例如Horwitz,“腺病毒及其复制”(Adenoviridae and TheirReplication),刊于《病毒学》(VIROLOGY),第二版,1679-1721页(1990)]。已知感染非人灵长类(例如,黑猩猩、恒河猴、弥猴和其它猿类)或其它非人哺乳动物和可在所需细胞中生长的类似腺病毒可用于本发明的载体构建物中。这种血清型包括(不限于)描述于美国专利号6,083,716的黑猩猩腺病毒Pan 5[VR-591]、Pan6[VR-592]、Pan 7[VR-593]和C68(Pan9);猿腺病毒包括(不限于)SV1[VR-195]、SV25[SV-201]、SV35、SV15、SV-34、SV-36、SV-37;和狒狒腺病毒[VR-275]。Pan 5(也称为C5)、Pan 6(也称为C6)、Pan 7(也称为C7)、SV1、SV25和SV39的序列描述于[2003年6月5日公布的WO 03/046124和2003年12月19日提交的美国专利申请号10/739,096],这些文献纳入作为参考。在以下实施例中,为方便起见,使用人293细胞和腺病毒类型5(Ad5)、Pan9和Ad40。然而,本领域的技术人员应该理解的是可容易地选择其它细胞系和/或来源于其它腺病毒株的类似区域并用于本发明来取代(或组合)这些血清型。
2.序列必须由给予其左右末端的腺病毒提供的最小序列包括复制和包装所需的5’顺式元件和3’顺式元件。包装和复制所需的5’顺式元件通常包括5’末端反向重复(ITR)序列(其功能是作为复制的起点)和天然的5’包装增强子区域(含有用于包装线形Ad基因组所需的序列和E1启动子的增强元件)。腺病毒基因组的右端包括包装和衣壳化所需的3’顺式元件(包括ITR)。希望给予其左右末端的腺病毒血清型和/或反补供体腺病毒的血清型的腺病毒血清型还提供腺病毒早期基因,包括E1(E1a和E1b)、E2(E2a和E2b)和E4(至少包括ORF6区域)所需的功能。E3是非必需的并可视需要删除,例如用于在该区域插入转基因或为在另一区域插入的转基因提供空间(通常为包装它需要总的腺病毒基因组在36kb以下)。
在某些实施方案中,所需的腺病毒早期基因包含于本发明的嵌合构建物中。在其它实施方案中,一种或多种所需的腺病毒早期基因可由包装宿主细胞或以反式提供。
本发明的嵌合腺病毒一般含有来自供体腺病毒血清型的调节序列或反补血清型来提供具有相容调节蛋白的嵌合腺病毒。一种或多种所需腺病毒结构基因任选由给予其左右末端的腺病毒提供。
在某些实施方案中,嵌合腺病毒还含有一种或多种功能性腺病毒基因,包括来自给予其左右末端的腺病毒血清型的内切蛋白酶开放读框、DNA结合蛋白、100KDa支架蛋白、33KDa蛋白、蛋白VIII、pTP、52/55kDa蛋白、蛋白VII、Mu和/或蛋白VI。当所有这些基因均来源于给予5’和3’ITR的腺病毒血清型时,形成了“假型”病毒。在一个实施方案中,嵌合病毒含有来自供体腺病毒的腺病毒基因组的左端,从5’ITR到pol基因(或pTP)的末端。在另一个实施方案中,嵌合腺病毒含有供体腺病毒血清型的左端,从5’ITR到五邻体。在又一个实施方案中,嵌合腺病毒含有供体腺病毒血清型的左端,例如到pTP的末端,但含有来自对供体腺病毒血清型异源的腺病毒血清型的ITR。从本发明的内容中可容易地明白其它实施方案。
一种或多种基因可任选是从供体腺病毒血清型和提供衣壳蛋白(例如,不限于聚合酶、末端蛋白、IIIa蛋白)的亲代腺病毒血清型融合形成的杂交体。这些基因适当地表达可允许腺病毒基因包装入衣壳的功能蛋白。此外,这些蛋白的一种或多种(无论杂交体或非杂交体)可在嵌合腺病毒中功能性地删除。当需要时,在嵌合腺病毒中功能性地删除的任何所需蛋白可在包装细胞中以反式表达。
B.亲代腺病毒结构蛋白1.血清型本发明特别适用于产生衣壳蛋白是来自亲代腺病毒的嵌合腺病毒,该亲代腺病毒在所需宿主细胞中不能有效地生长。本领域的技术人员基于文中提供的内容可容易地选择提供内部区域的亲代腺病毒血清型。
各种合适的腺病毒可用作提供编码结构蛋白(即,衣壳蛋白)的区域的亲代腺病毒。许多这种腺病毒可获得自和上述用于供体腺病毒血清型相同的来源。合适的亲代腺病毒血清型的例子包括(不限于)人腺病毒血清型40[参见,例如Horwitz,“腺病毒及其复制”(Adenoviridae and Their Replication),刊于《病毒学》(VIROLOGY),第二版,1679-1721页(1990)]和已知感染非人灵长类(例如,黑猩猩、恒河猴、弥猴和其它猿类)或其它非人哺乳动物的腺病毒,包括(不限于)描述于美国专利号6,083,716的黑猩猩腺病毒C1,该内容纳入本文作为参考;猿腺病毒和狒狒腺病毒。此外,提供内部区域的亲代腺病毒可来自非天然存在的腺病毒血清型,例如可使用各种本领域技术人员已知的技术产生。
在文中所述的一个实施方案中,在黑猩猩腺病毒Pan-5和C1之间构建的嵌合病毒在人293细胞中显示高于野生型亲代病毒的滴度。然而,本发明不限于使用这些黑猩猩腺病毒或猿-猿、人-人组合,或猿-人嵌合腺病毒。例如,希望利用牛或犬腺病毒或在人细胞中天然不感染和/或复制的其它非人哺乳动物腺病毒。
在以下实施例中,使用人腺病毒类型40(Ad40)和黑猩猩腺病毒C1、猿Pan5和Ad40以及Pan5和猿腺病毒SA18。然而,本领域的技术人员应该理解的是可容易地选择其它腺病毒血清型并用于本发明以取代(或组合)这些血清型。
2.序列亲代腺病毒将其内部区域提供给本发明的嵌合构建物,该内部区域包括产生具有所需亲代腺病毒特征的衣壳所需的结构蛋白。这些所需的特征包括(但不限于)感染靶细胞和传递异源转基因的能力,避免定向另一种腺病毒血清型的中和抗体(即,避免由于交叉反应的清除)的能力,和/或在没有对嵌合腺病毒的免疫应答的情况下感染细胞的能力。这种特征的优点在涉及腺病毒载体的重复传递的方案中最显而易见。亲代腺病毒的左右末端,至少包括5’ITR、E1区域、E4区域和3’ITR是非功能性的,并且优选全部缺失。来自该全部腺病毒的所有腺病毒调节蛋白任选是非功能性的并且保留结构蛋白(或选择的结构蛋白)。
亲代腺病毒至少提供编码五邻体蛋白的腺病毒后期区域。亲代腺病毒还适当地提供编码五邻体和尾丝的后期区域。在某些实施方案中,所有功能性腺病毒后期区域,包括L1(编码52/55Da,IIIa蛋白)、L2(编码五邻体,VII、V、Mu蛋白)、L3(编码VI、五邻体、内切蛋白酶)、L4(编码100kD、33kD、VIII蛋白酶)和L5(编码尾丝蛋白)由亲代腺病毒提供。除了编码六邻体、五邻体和尾丝蛋白的之外,一种或多种这些后期基因功能物可任选被功能性地删除。任何需要的结构蛋白可以反式提供。
因此,在某些实施方案中,嵌合腺病毒还含有一种或多种功能性腺病毒基因,包括来自给予其末端区域的亲代腺病毒的内切蛋白酶开放读框,DNA结合蛋白,100KDa支架蛋白、33KDa的蛋白、蛋白VIII、pTP、52/55kDa蛋白、蛋白VII、Mu和/或蛋白VI。一种或多种基因可任选是从供体腺病毒血清型和上述提供衣壳蛋白的亲代腺病毒血清型融合形成的杂交体。
C.“小基因”本发明的腺病毒载体通常设计为含有可插入部分缺失、完全缺失(不存在)或破坏的腺病毒基因的位点的小基因。例如,小基因可位于这种功能性E1缺失或功能性E3缺失的位点或另一合适的位点。
按照文中提供的指导,用于转基因选择、小基因克隆和构建及其插入病毒载体的方法属于本领域的技术范围内。
1.转基因转基因是编码感兴趣的多肽、蛋白或其它产物、对于转基因两翼的载体序列异源的核酸序列。核酸编码序列以允许转基因在宿主细胞中转录、翻译和/或表达的方式操作性连接于调节成分。
转基因序列的组成取决于腺病毒载体的用途。例如,腺病毒载体可在生产重组腺相关病毒或生产缺失由腺病毒载体提供的基本腺病毒基因功能物的重组腺病毒或各种生产用途中用作辅助病毒。此外,腺病毒载体可用于诊断目的。
转基因序列的一个类型含有报道序列,该序列在表达时产生可检测的信号。这种报道序列包括(不限于)编码以下物质的DNA序列β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸腺嘧啶激酶、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、荧光素酶、高亲和力抗体定向存在的或可通过常规方法生产的膜结合蛋白(包括,例如CD2、CD4、CD8、流感血凝集素蛋白和其它本领域熟知的)、含有适当地与来自血凝集素或Myc的抗原标记结构域融合的膜结合蛋白的融合蛋白。当这些编码序列与驱动其表达的调节元件相连时可提供由常规方法检测的信号,所述方法包括酶法、放射显影法、比色法、荧光或其它光谱测定、荧光激活细胞分选测定和免疫测定,包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学。例如,当标记序列是LacZ基因时,通过测定β-半乳糖苷酶活性来检测携带信号的载体的存在。当转基因是GFP或荧光素酶时,可通过发光计中产生的颜色或光来测量携带信号的载体。
然而,希望转基因是编码产物的非标记序列,所述产物在生物和医药中有用,例如蛋白、肽、RNA、酶或催化性RNA。所期望的RNA分子包括tRNA、dsRNA、核糖体RNA、siRNA、小发夹RNA、反式剪接RNA、催化性RNA、和反义RNA。有用的RNA序列的一个例子是在处理的动物中消除靶核酸序列的表达。
转基因可用作癌症治疗或疫苗、诱导免疫应答和/或预防性疫苗目的的治疗,例如遗传缺陷。如文中所用,诱导免疫应答指分子(例如,基因产物)诱导对该分子的T细胞和/或体液免疫应答的能力。本发明还包括使用多种转基因,例如校正或缓解多亚基蛋白引起的疾病。在某些情况中,不同的转基因可用于编码蛋白的每个亚基或编码不同的肽或蛋白。当编码蛋白亚基的DNA的体积大时这是期望的,例如就免疫球蛋白、血小板衍生生长因子或抗肌萎缩蛋白而言。用含有每个不同亚基的重组病毒感染细胞来生产多亚基蛋白。此外,蛋白的不同亚基可由相同的转基因编码。既然这样,单个转基因含有编码每个亚基的DNA,由内部核酶进入位点(IRES)分离的、每个亚基的DNA。当编码每个亚基的DNA的体积小时这是期望的,例如,编码亚基和IRES的DNA的总体积小于5千碱基。作为IRES的替代物,DNA可被编码2A肽的序列分离,该肽在翻译后情况中自我切割。参见,例如M.L.Donnelly等,J.Gen.Virol.,78(节第1部分)13-21(1997年1月);Furler,S等,Gene Ther.,8(11)864-873(2001年6月);Klump H.等.,Gene Ther.,8(10)811-817(2001年5月)。该2A肽显著小于IRES,这使得它很好地适合当空间是限制因素时使用。然而,选择的转基因可编码任何生物活性产物或其它产物,例如希望用于研究的产物。
本领域的技术人员可容易地选择合适的转基因。转基因的选择不被认为是本发明的限制。
2.载体与转基因调节元件除了以上鉴定的小基因的主要元件,腺病毒载体也包括操作性连接于转基因的常规控制元件,所述连接以允许转基因在用质粒载体转染或用本发明生产的病毒感染的细胞中转录、翻译和/或表达的方式进行。文中使用的“操作性连接”序列包括与感兴趣基因毗连的表达控制序列和以反式或离开一段距离起作用来控制感兴趣基因的表达控制序列。
表达控制序列包括合适的转录起始、终止、启动子和增强子序列;足够的RNA处理信号,如剪接信号和聚腺苷酸化(polyA)信号;稳定细胞质mRNA的序列;增强翻译效率的序列(即Kozak共有序列);增强蛋白稳定性的序列和需要时可增强所编码产物分泌的序列。大量表达控制序列是本领域已知并可使用的,所述序列包括天然的、组成型的、可诱导的和/或组织特异性的启动子。
组成型启动子的例子包括(不限于)逆转录Rous肉瘤病毒(RSV)LTR启动子(任选具有RSV增强子)、巨细胞病毒(CMV)启动子(任选具有CMV增强子)[参见,例如Boshart等,Cell,41521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子[Invitrogen]。
可诱导启动子允许调节基因表达并且可由外源性提供的化合物、环境因素(例如温度)、或特异性生理状态(例如细胞的急性阶段、具体的分化状态、或仅在复制细胞中)的存在所调节。可诱导启动子和可诱导系统获得自各种市售来源,包括(不限于)Invitrogen、Clontech和Ariad。许多其它的系统已见描述并可由本领域的技术人员容易地选择。例如,可诱导的启动子包括锌诱导的绵羊金属硫蛋白(MT)启动子和地塞米松(Dex)诱导的小鼠乳腺瘤病毒(MMTV)启动子。其它可诱导的系统包括T7聚合酶启动子系统[WO 98/10088]、蜕皮素昆虫启动子[No等,Proc.Natl.Acad.Sci.美国,933346-3351(1996)]、四环素可阻抑系统[Gossen等,Proc.Natl.Acad.Sci.美国,895547-5551(1992)]、四环素可诱导系统[Gossen等,Science,2681766-1769(1995),也可参见Harvey等,Curr.Opin.Chem.Biol.,2512-518(1998)]。其它系统包括FK506二聚体、使用去雄二醇(castradiol)、diphenol murislerone的VP16或p65、RU486可诱导系统[Wang等,Nat,Biotech.,15239-243(1997)和Wang等,Gene Ther.,4432-441(1997)]和雷帕霉素可诱导系统[Magari等,J.Clin.Invest.,1002865-2872(1997)]。一些可诱导启动子的效力随时间而增加。在一些情况中,可通过串联插入多个阻遏物(例如,TetR通过IRES相连于TetR)来增强这种系统的效力。此外,在筛选所需功能之前可等至少3天。可通过已知的方法提高所需蛋白的表达来增强该系统的效力。例如,使用Woodchuck肝炎病毒转录后调节元件(WPRE)。
另一个实施方案将天然启动子用于转基因。当希望转基因的表达可模拟天然表达时,优选天然启动子。当转基因的表达必须暂时性或实验性调节,或以组织特异性方式调节或响应于特异性转录刺激调节时,可使用天然启动子。在其它实施方案中,也可使用其它天然表达控制元件(例如,增强元件、聚腺苷酸化位点或Kozak共有序列)来模拟天然表达。
转基因的另一个实施方案包括操作性连接于组织特异性启动子的转基因。例如,如果需要在骨骼肌中表达,应该使用肌肉中有活性的启动子。这些启动子包括来自编码骨骼β-肌动蛋白、肌球蛋白轻链2A、抗肌萎缩蛋白、肌肉肌酸激酶以及活性高于天然存在的启动子的合成肌肉启动子(参见Li等,Nat.Biotech.,17241-245(1999))。组织特异性启动子的例子已知是用于肝脏的(白蛋白,Miyatake等,J.Virol.,715124-32(1997);乙型肝炎病毒核心启动子,Sandig等,Gene Ther.,31002-9(1996);甲胎蛋白(AFP),Arbuthnot等,Hum.Gene Ther.,71503-14(1996));骨钙蛋白(Stein等,Mol.Biol.Rep.,24185-96(1997));骨唾液蛋白(Chen等,J.Bone Miner.Res.,11654-64(1996));淋巴细胞(CD2,Hansal等,J.Immunol.,1611063-8(1998);免疫球蛋白重链;T细胞受体链;神经元启动子,例如神经元特异性烯醇化酶(NSE)启动子(Andersen等.,Cell.Mol.Neurobiol.,13503-15(1993));神经丝轻链基因(Piccioli等,Proc.Natl.Acad.Sci.美国,885611-5(1991))和神经元特异性vgf基因(Piccioli等,Neuron,15373-84(1995))。
携带编码治疗有用或免疫原性产物的转基因的载体也任选含有选择性标记或含有编码遗传霉素、潮霉素或嘌呤霉素(purimycin)抗性的序列的报道基因。这种选择性报道基因或标记基因(优选位于病毒基因组之外包装进病毒颗粒)可用于在细菌细胞中发出质粒存在的信号,例如氨苄青霉素抗性。载体的其它成分可含有复制起点。选择这种和其它启动子及载体元件是惯常的并且许多这种序列是可用的[参见,例如Sambrook等和文中引用的参考文献]。
这些载体可使用文中提供的技术和序列结合本领域技术人员已知的技术来产生。这种技术包括常规的cDNA克隆技术,例如教材中所述的[Sambrook等,《分子克隆实验室手册》(Molecular CloningA Laboratory Manual),冷泉港出版社,冷泉港,纽约],使用腺病毒基因组的重叠寡核苷酸序列,聚合酶链式反应和提供所需核苷酸序列的任何合适方法。
II.重组病毒颗粒的生产在一个实施方案中,本发明提供产生重组嵌合腺病毒颗粒的方法,其中嵌合腺病毒的衣壳是不能在选择的宿主细胞中充分生长的血清型。适合于生产重组嵌合腺病毒颗粒的载体可通过直接克隆来产生。或者这种颗粒可通过在含有嵌合腺病毒基因组左端的第一载体和含有嵌合腺病毒基因组右端的第二载体之间的同源重组来产生。然而,本领域的技术人员已知的任何合适方法均可容易地用来产生合适于产生一种生产载体的载体,所述生产载体优选含有完整的嵌合腺病毒基因组,包括小基因。然后将该生产载体引入在其中装配腺病毒衣壳蛋白的宿主细胞并且按上述装配嵌合腺病毒颗粒。
本发明的嵌合腺病毒包括缺少一种或多种腺病毒基因,或者被赋予非功能性的那些病毒。在生产嵌合颗粒期间,如果缺失的任何基因功能物对腺病毒颗粒的复制和感染是必需的,这些功能物由互补(或反补)细胞系或表达这些功能物的辅助载体提供。
含有这种缺失腺病毒基因功能物的嵌合腺病毒包括部分或全部缺失E1a和/或E1b基因的那些病毒。在这种情况中,E1基因功能物可由包装宿主细胞、使得嵌合构建物缺失E1基因功能物并且如果需要可在该区域插入转基因来提供。为进一步降低重组的可能性并且提高安全性,E1基因可任选是反补提供其它腺病毒序列血清型的血清型。在其它实施方案中,最好在重组腺病毒中保留完整的E1a和/或E1b区域。这种完整的E1区域可位于腺病毒基因组中其天然的位置或位于天然腺病毒基因组中的缺失位置(例如,在E3区域)。
在另一个实施例中,所有或部分的腺病毒延迟早期基因E3可从嵌合腺病毒中去除。据信腺病毒E3的功能与重组病毒颗粒的功能和生产无关。嵌合腺病毒载体也可构建具有至少缺失E4基因的ORF6区域,并且由于该区域功能物中的冗余,更希望缺失整个E4区域。本发明的另一个载体在延迟早期基因E2a中含有缺失。类似地,在中间基因IX和IVa2中的缺失可用于一些目的。如上所述,在后期基因L1到L5的选择部分也可任选产生缺失。
在其它结构或非结构腺病毒基因中可产生其它缺失。以上讨论的缺失可单独使用,即用于本发明的腺病毒序列可仅在单一区域含有缺失。此外,有效地破坏其生物活性的整个基因或其一部分的缺失可以任何组合使用。例如,在一示范性载体中,腺病毒序列可具有E1基因和E4基因,或E1、E2a和E3基因,或E1和E3基因,或E1、E2a和E4基因(具有或不具有E3缺失)等的缺失。如上所述,这种缺失可与其它突变(例如,温度敏感型突变)组合使用以实现所需的结果。
以上提供合适的反补血清型的例子。当本发明载体的Ad序列和目前可用的包装细胞中发现的人AdE1序列之间有差异时,使用反补血清型特别有利。在这种情况中,使用目前含有E1的人细胞阻止在复制和生产期间产生可复制腺病毒。然而,在某些情况中,最好使用表达E1基因产物的细胞系来生产E1-缺失的猿腺病毒。这种细胞系已见描述。参见,例如美国专利6,083,716。
A.包装宿主细胞包装宿主细胞可从给予嵌合基因组的左右末端的腺病毒血清型能在其中有效生长的细胞中合适地选择。宿主细胞优选是哺乳动物来源,最优选是非人灵长类或人来源。
尤其期望的宿主细胞选自任何哺乳动物种类,包括(不限于)以下细胞例如A549[ATCC登录号CCL 185];911细胞;WEHI;3T3;10T1/2;HEK 293细胞或PERC6(二者均表达功能性腺病毒E1)[Fallaux,FJ等,(1998),Hum GeneTher,91909-1917];Saos;C2C12;L细胞;HT1080;HepG2;HeLa[ATCC登录号CCL 2];KB[CCL 17];Detroit[例如,Detroit 510,CCL 72]和WI-38[CCL75]细胞和来源于哺乳动物的初级成纤维细胞、肝细胞和成肌细胞,所述哺乳动物包括人、猴、小鼠、大鼠、兔和仓鼠。这些细胞系均得自美国模式培养物保藏所(American Type Culture Collection),10801University Boulevard,Manassas,Virginia 20110-2209。其它合适的细胞系可得自其它来源。选择提供细胞的哺乳动物种类或哺乳动物细胞的类型(即成纤维细胞、肝细胞、肿瘤细胞等)并不限制本发明。
如上所述,本发明的嵌合腺病毒缺乏一种或多种功能性腺病毒调节和/或结构基因,这些基因可由宿主细胞提供或以反式影响嵌合腺病毒包装进病毒衣壳来产生病毒颗粒。因此,选择所需宿主细胞时要考虑其提供反补腺病毒序列的能力。
在一个实施例中,细胞来自表达腺病毒E1a和E1b功能物的稳定的细胞系,所述功能物来自反补给予本发明嵌合体的左右末端并使嵌合体为E1缺失的腺病毒血清型的细胞系。此外,当细胞系未反补给予末端的腺病毒时,E1功能物可由嵌合体提供或以反式提供。
如果需要,可利用文中提供的序列来产生在选择的亲代细胞系中至少表达腺病毒E1基因的包装细胞或细胞系,所述基因来自在表达启动子的转录控制下给予5’ITR的腺病毒血清型或反补血清型。可诱导的或组成型启动子可用于此目的。这种启动子的例子详细描述于本说明书的其它地方。选择亲代细胞来产生表达任何所需腺病毒或腺病毒基因的新颖细胞系,所述基因包括,例如人Ad5、AdPan5、Pan6、Pan7、SV1、SV25或SV39基因。这种亲代细胞系可是(不限于)HeLa[ATCC登录号CCL 2]、A549[ATCC登录号CCL 185]、HEK 293、KB[CCL 17]、Detroit[例如,Detroit 510、CCL 72]和WI-38[CCL 75]细胞。许多这些细胞系均得自ATCC。其它合适的亲代细胞系可得自其它来源。
这种E1表达细胞系可用于产生嵌合腺病毒E1缺失载体。另外,本发明还提供表达一种或多种猿腺病毒基因产物(例如E1a、E1b、E2a和/或E4ORF6)的细胞系,并且可用产生嵌合表达载体使用的相同方法来构建。这种细胞系可用来反补缺失编码那些产物的必需基因的腺病毒载体,或提供包装依赖辅助病毒的病毒(例如,腺相关病毒)所需的辅助功能物。制备本发明的宿主细胞涉及诸如装配所选DNA序列的技术。这种装配也可使用常规技术。这种技术包括熟知并描述于上文引用的Sambrook等的cDNA和基因组克隆,使用腺病毒基因组的重叠寡核苷酸序列,结合聚合酶链式反应,合成方法以及任何提供所需核苷酸序列的其它合适方法。
在又一个可供选择的方法中,必需腺病毒基因产物可由腺病毒载体和/或辅助病毒以反式提供。在这种例子中,合适的宿主细胞可选自任何生物体,包括原核细胞(例如,细菌)和真核细胞,包括昆虫细胞、酵母细胞和哺乳动物细胞。尤其希望宿主细胞选自任何哺乳动物种类,所述细胞包括(不限于)例如A549;WEHI;3T3;10T1/2;HEK 293细胞或PERC6(二者均表达功能性腺病毒E1)[Fallaux,FJ等,(1998),Hum Gene Ther,91909-1917];Saos;C2C12;L细胞;HT1080;HepG2;和来源于哺乳动物的初级成纤维细胞、肝细胞和成肌细胞,所述哺乳动物包括人、猴、小鼠、大鼠、兔和仓鼠。选择提供细胞的哺乳动物种类或哺乳动物细胞的类型(即成纤维细胞、肝细胞、肿瘤细胞等)并不限制本发明。
B.辅助载体因此,取决于腺病毒载体的腺病毒基因含量和任何表达自宿主细胞的腺病毒基因功能物,辅助载体对于提供生产含有小基因的感染性重组病毒颗粒所需的充足腺病毒基因序列可能是必需的。参见,例如描述于1996年5月9日公布的国际专利申请WO96/13597的制备“最小”人Ad载体的技术,该文献引为参考。这些辅助载体可适当地为非复制遗传元件、质粒或病毒。
有用的辅助载体含有选择的腺病毒基因序列,该序列不存在于腺病毒载体构建物中和/或不由载体所转染的包装细胞系表达。在一个实施方案中,辅助病毒是复制缺陷型并含有除上述序列以外的各种腺病毒基因。这种辅助载体最好与E1表达细胞系联合使用。
辅助载体可制备成如Wu等,J.Biol.Chem.,26416985-16987(1989);K.J.Fisher和J.M.Wilson,Biochem.J.,29949(1994年4月1日)所述的聚阳离子偶联物。辅助载体可任选含有第二报道小基因。许多这种报道基因是本领域已知的。辅助载体上存在不同于腺病毒载体上的转基因的报道基因使得Ad载体和辅助载体可独立地检测。这种第二报道基因用于在纯化后将得到的重组病毒与辅助病毒分开。
C.装配病毒颗粒和转染细胞系总体上,当通过转染传递含有小基因的载体时,该载体传递的量是约5μg到约100μgDNA,优选约10μg到约50μgDNA,约1×104个细胞到约1×1013个细胞,优选约105个细胞。然而,考虑到诸如所选择的载体、传递方法和所选择的宿主细胞等因素,载体DNA对宿主细胞的相对量可调整。
将载体引入宿主细胞可通过本领域已知或上述的任何方法实现,包括转染和感染。一种或多种腺病毒基因可稳定地整合入宿主细胞的基因组,稳定地表达为附加体或瞬时表达。基因产物均可瞬时表达在附加体上或稳定地整合,或者一些基因产物可稳定地表达而另一些可瞬时表达。
此外,每个腺病毒基因的启动子可独立选自组成型启动子、可诱导启动子或天然的腺病毒启动子。启动子可例如为生物体或细胞的特定生理状态(即,通过分化状态或在复制或静息细胞中)或外源性添加的因子所调节。
也可使用技术人员已知以及说明书中讨论的技术将分子(如质粒或病毒)引入宿主细胞。在优选的实施方案中,使用标准转染技术,例如CaPO4转染或电穿孔。
将所选的腺病毒的DNA序列(以及转基因和其它载体元件)装配进各种中间质粒,使用质粒和载体来生产重组病毒颗粒均可使用常规技术实现。这种技术包括[G.Gao等,Gene Ther.2003年10月;10(22)1926-1930;2003年5月15日公布的美国专利公布号2003-0092161-A;国际专利申请号PCT/US03/12405]所述的直接克隆。其它可使用的cDNA克隆技术包括教材中所述的[Sambrook等,上文引用的],使用腺病毒基因组的重叠寡核苷酸序列,聚合酶链式反应以及任何提供所需核苷酸序列的合适方法。可使用标准转染和共转染技术,例如CaPO4沉淀技术。其它使用的常规技术包括病毒基因组的同源重组、在琼脂覆盖中的病毒蚀斑、测量信号产生的方法等。
例如,所需含有小基因的病毒载体的构建和装配之后,载体在有任选的辅助载体的条件下体外转染进包装细胞系。如果有表达自质粒、包装细胞系和辅助病毒的功能物,使载体中的腺病毒转基因序列被复制并包装进病毒衣壳,产生嵌合病毒颗粒。目前生产这种病毒颗粒的方法以转染为基础。然而,本发明不受这些方法的限制。得到的嵌合腺病毒用于将所选的转基因转移至所选择的细胞。
III.嵌合腺病毒载体的用途本发明的嵌合腺病毒载体用于体外、先体外后体内和体内将基因转移至人或兽医受试对象(包括,非人灵长类、非猿灵长类和其它哺乳动物)。
文中所述的重组腺病毒载体可用作在体外生产由异源基因编码的产物的表达载体。例如,含有插入E1缺失位置的基因的重组腺病毒可转染进上述E1表达细胞系。此外,可复制的腺病毒可用在另一种选择的细胞系中。然后以常规方式培养转染的细胞,使得重组腺病毒从启动子表达基因产物。然后通过已知的从培养物中分离和回收蛋白质的常规方法从培养基中回收基因产物。
当生物体具有针对一种或多种AAV血清型的中和抗体时,本发明的嵌合腺病毒载体提供将所选转基因在体内或先体外后体内地传递至所选宿主细胞的足够的基因转移载体。在一个实施方案中,rAd和细胞先体外后体内地混合;使用常规方法培养感染的细胞;再将转导细胞重注入患者。这些组合物尤其适用于治疗目的和用于免疫(包括诱导保护性免疫)的基因传递。
更常见的是,本发明的嵌合腺病毒载体可用于传递下述的治疗性或免疫原性分子。容易理解的是,本发明的重组腺病毒载体的两种应用尤其适用于涉及重组腺病毒载体的重复传递的方案。这种方案通常涉及传递一系列其中病毒衣壳被替换的病毒载体。其后的各步施用可更换病毒衣壳,或在预先选择的特定血清型衣壳的施用次数(例如,一次、两次、三次、四次或更多次)后更换。因此,方案可涉及传递具有第一衣壳的rAd、传递具有第二衣壳的rAd和传递具有第三衣壳的rAd。单独使用本发明的Ad衣壳、与另一种组合使用或与其它Ad血清型组合使用的各种其它方案对本领域的技术人员是显而易见的。这种方案可任选涉及施用具有非人灵长类腺病毒、人腺病毒或如文中所述的人工(例如,嵌合的)血清型衣壳的rAd。方案的每个阶段涉及施用具有单一Ad血清型衣壳的一系列注射(或其它传递途径),然后施用具有另一种Ad血清型衣壳的一系列注射。此外,本发明的重组Ad载体可用于涉及其它非腺病毒介导的传递系统的方案,所述传递系统包括其它病毒系统、非病毒传递系统、蛋白、肽和其它生物活性分子。
以下部分将着重于可通过本发明腺病毒载体传递的示范性分子。
A.Ad介导的治疗性分子传递在一个实施方案中,文中所述的Ad载体按照公布的基因治疗方法施用至人。携带所选转基因的本发明病毒载体可施用至患者,该载体优选悬浮于生物相容的溶液或药学上可接受的传递载体中。合适的载体包括无菌盐水。出于此目的,可使用已知为药学上可接受的运载体并且为本领域的技术人员所熟知的其它水性和非水性等渗无菌注射溶液与水性和非水性无菌悬浮液。
施用足够量的腺病毒载体来转导靶细胞并提供足够水平的基因转移和表达以提供治疗性益处,而没有不合适的副作用或具有医学上可接受的生理作用,该作用可由医学领域的技术人员测定。常规且药学上可接受的施用途径包括(但不限于)直接传递至视网膜和其它眼内传递方法,直接传递至肝脏、吸入、鼻内、静脉内、肌肉内、气管内、皮下、皮内、直肠、口服和其它胃肠外施用途径。如果需要,施用途径可结合或依赖转基因或疾病进行调整。施用途径主要取决于有待治疗的疾病的性质。
病毒载体的剂量基本取决于以下因素有待治疗的疾病、患者的年龄、体重和健康状况,并且在患者之间可以不同。例如,病毒载体的治疗有效的成年人或兽医剂量通常为含有浓度约为1×106到约1×1015个颗粒,约1×1011到1×1013个颗粒,或约1×109到1×1012个颗粒的约100μl到约100ml的病毒载体。剂量取决于动物的体积和施用途径。例如,肌肉内注射的合适的人或兽医剂量(就约80kg的动物而言)是单一位点约1×109到约5×1012个颗粒每ml。可任选进行多位点施用来传递。在另一实施例中,就口服制剂而言,合适的人或兽医剂量可是约1×1011到约1×1015个颗粒。本领域的技术人员可依赖施用途径、使用重组载体的治疗或疫苗应用来调整这些剂量。可检测转基因表达的水平,或就免疫原而言,可监测循环抗体的水平来确定剂量施用的频率。确定施用频率的定时的其它方法对本领域的技术人员而言是显而易见的。
任选的方法涉及向患者共同施用合适量的短效免疫调制剂,所述共同施用既可在病毒载体施用的同时、或之前或之后进行。选择的免疫调制剂在文中定义为能抑制直接抗本发明的重组载体的中和抗体形成或能抑制溶细胞性T淋巴细胞(CTL)消除载体的试剂。该免疫调制剂可干扰T辅助亚类(TH1或TH2)和B细胞之间的相互作用来抑制中和抗体的形成。此外,免疫调制剂可抑制TH1细胞和CTL之间的相互作用来降低载体的CTL消除的发生。各种有用的免疫调制剂及其用量披露于,例如Yang等,J.Virol.,70(9)(1996年9月);1996年5月2日公布的国际专利申请号WO96/12406和国际专利申请号PCT/US96/03035,这文献均引为参考。当转基因是需要反复传递的治疗剂时,通常要选择这种免疫调制剂。
1.治疗性转基因转基因编码的有用的治疗性产物包括激素和生长与分化因子,包括(不限于)胰岛素、高血糖素、生长激素(GH)、甲状旁激素(PTH)、生长激素释放因子(GRF)、促卵泡激素(FSH)、促黄体素(LH)、人绒毛膜促性腺激素(hCG)、血管内皮生长因子(VEGF)、促血管生成素、血管抑制素、粒细胞集落刺激因子(GCSF)、促红细胞生成素(EPO)、结缔组织生长因子(CTGF)、碱性成纤维细胞生长因子(bFGF)、酸性成纤维细胞生长因子(aFGF)、表皮生长因子(EGF)、转化生长因子α(TGFα)、血小板衍生生长因子(PDGF)、胰岛素生长因子I和II(IGF-I和IGF-II)、转化生长因子超家族中的任一种,包括TGF、活化素、抑制素或骨形态发生蛋白(BMP)BMP1-15中的任一种,生长因子的调蛋白/神经调节蛋白/ARIA/neu分化因子(NDF)家族中的任一种、脑衍生神经营养因子(BDNF)、神经营养蛋白NT-3和NT-4/5、睫状神经营养因子(CNTF)、胶质细胞系衍生神经营养因子(GDNF)、neurturin、集蛋白、脑信号蛋白/脑衰蛋白家族的任一种、导蛋白-1和导蛋白-2、肝细胞生长因子(HGF)、肝配蛋白、头蛋白、sonic hedgehog和酪氨酸羟化酶。
其它有用的转基因产物包括调节免疫系统的蛋白,包括(不限于)细胞因子和淋巴因子,例如血小板生成素(TPO)、白介素(IL)IL-1到IL-25(包括,例如IL-2、IL-4、IL-12和IL-18)、单核细胞化学引诱物蛋白、白血病抑制因子、粒细胞-巨噬细胞集落刺激因子、Fas配体、肿瘤坏死因子、干扰素和干细胞因子、flk-2/flt3配体。免疫系统产生的基因产物也可用于本发明。这些产物包括(不限于)免疫球蛋白IgG、IgM、IgA、IgD和IgE,嵌合免疫球蛋白,人源化抗体,单链抗体,T细胞受体,嵌合T细胞受体,单链T细胞受体,I类和II类MHC分子,以及工程改造的免疫球蛋白和MHC分子。有用的基因产物也包括补体调节蛋白,例如补体调节蛋白、膜辅因子蛋白(MCP)、衰变加速因子(DAF)、CR1、CF2和CD59。
其它有用的基因产物包括激素、生长因子、细胞因子、淋巴因子、调节蛋白和免疫系统蛋白的任一种。本发明包括胆固醇调节的受体,包括低密度脂蛋白(LDL)受体、高密度脂蛋白(HDL)受体、极低密度脂蛋白(VLDL)受体,用于调节脂质的蛋白,包括,例如载脂蛋白(apo)A及其同种型(例如,ApoAI)、apoE及其同种型(包括E2、E3和E4)、SRB1、ABC1和清除剂受体。本发明也包括例如甾体激素受体超家族的成员,包括糖皮质激素受体和雌激素受体、维生素D受体和其它核受体的基因产物。此外,有用的基因产物包括转录因子,例如jun、fos、max、mad、血清应答因子(SRF)、AP-1、AP2、myb、MyoD和肌细胞生成素、含有ETS-盒的蛋白、TFE3、E2F、ATF1、ATF2、ATF3、ATF4、ZF5、NFAT、CREB、HNF-4、C/EBP、SP1、CCAAT-盒结合蛋白、干扰素调节因子(IRF-1)、Wilms肿瘤蛋白、ETS-结合蛋白、STAT、GATA-盒结合蛋白,例如GATA-3,和翼状螺旋蛋白的叉头家族。
其它有用的基因产物包括氨甲酰合成酶I、鸟氨酸转氨甲酰酶、精氨琥珀酸合成酶、精氨琥珀酸裂解酶、精氨酸酶、富马酰乙酰乙酸盐水解酶、苯丙氨酸羟化酶、α-1抗胰蛋白酶、葡萄糖-6-磷酸酶、胆色素原脱氨酶、胱硫醚β-合酶、支链酮酸脱羧酶、白蛋白、异戊酰-coA脱氢酶、丙酰CoA羧化酶、甲基丙二酰CoA变位酶、戊二酰CoA脱氢酶、胰岛素、β-葡糖苷酶、丙酮酸羧酸盐、肝磷酸化酶、磷酸化酶激酶、甘氨酸脱羧酶、H-蛋白、T-蛋白、囊性纤维化跨膜传导调节蛋白(CFTR)序列和抗肌萎缩蛋白cDNA序列。其它有用的基因产物包括用于治疗A型血友病(例如,因子VIII及其变体,包括异二聚体的轻链和重链,任选通过接头操作性连接);和B-结构域缺失因子VIII,参见US6,200,560和6,221,349和用于治疗B型血友病(例如,因子IX)。
其它有用的基因产物包括非天然存在的多肽,例如具有非天然存在的氨基酸序列的嵌合或杂交多肽,所述序列中含有插入、缺失或氨基酸取代。例如,在某些免疫削弱患者中可使用工程改造的单链免疫球蛋白。非天然存在的基因序列的其它类型包括可用于降低靶超表达的反义分子和催化性核酸,例如核酶。
降低和/或调制基因的表达在治疗以过度增殖的细胞为特征的过度增殖疾病中(例如癌症和银屑病)尤其需要。靶多肽含有排他性产生或在过度增殖细胞中以高于正常细胞的水平产生的那些多肽。靶抗原含有致癌基因(例如,myb、myc、fyn和易位基因bcr/abl、ras、src、P53、neu、trk和EGRF)编码的多肽。除作为靶抗原的致癌基因产物之外,用于抗癌治疗和保护性治疗方案的靶多肽含有B细胞淋巴瘤产生的抗体的可变区域和T细胞淋巴瘤的T细胞受体的可变区域,在一些实施方案中,这些区域也用作自身免疫疾病的靶抗原。其它肿瘤相关多肽可用作靶多肽,例如在肿瘤细胞中以高水平发现的多肽,包括可为单克隆抗体17-1A识别的多肽和叶酸结合多肽。
其它合适的治疗性多肽和蛋白包括用于治疗患自身免疫疾病和障碍的个体的那些多肽和蛋白,所述治疗通过赋予抗靶的广泛基础的保护性免疫应答,而这些靶与自身免疫,包括细胞受体和产生自我定向抗体的细胞有关。T细胞介导的自身免疫疾病包括类风湿性关节炎(RA)、多发性硬化症(MS)、斯耶格伦综合症、结节病、胰岛素依赖型糖尿病(IDDM)、自身免疫甲状腺炎、反应性关节炎、强直性脊柱炎、硬皮病、多肌炎、皮肌炎、银屑病、血管炎、瓦格纳肉芽肿病、克罗恩病和溃疡性结肠炎。这些疾病中的每一种的特征在于和外源抗原结合并启动与自身免疫疾病相关的炎性级联反应的T细胞受体(TCR)。
本发明的嵌合腺病毒载体尤其适用于需要多次腺病毒介导传递转基因的治疗方案,例如在涉及传递相同的转基因的治疗方案中或在涉及传递其它转基因的组合治疗方案中。这种治疗方案可涉及施用嵌合腺病毒载体,然后再施用来自相同血清型腺病毒的载体。特别期望的治疗方案涉及施用本发明的嵌合腺病毒载体,其中首次施用中传递的病毒载体的血清型不同于后来一次或多次施用中使用的病毒载体的血清型。例如,治疗方案涉及施用嵌合载体和重复施用相同或不同血清型的一种或多种腺病毒载体。在另一个实施例中,治疗方案涉及施用腺病毒载体,然后重复施用血清型不同于首次传递的腺病毒载体的本发明嵌合载体,并且还任选施用另一种相同的载体,或优选不同于以前施用步骤中的载体的血清型。这些治疗方案不限于传递使用本发明的嵌合血清型构建的腺病毒载体。反而这些治疗方案可容易地利用和本发明的一种或多种嵌合载体结合的其它腺病毒血清型的嵌合或非嵌合载体,这些载体可是人工、人或非人灵长类、或其它哺乳动物来源。这种血清型的例子在本文别的地方讨论。此外,这些治疗方案可涉及同时或依次传递与非腺病毒载体、非病毒载体和/或各种其它治疗有用的化合物或分子结合的本发明嵌合腺病毒载体。本发明不受这些治疗方案的限制,各种治疗方案对本领域的技术人员是显而易见的。
B.Ad介导的免疫原性转基因传递本发明的腺病毒也可用作免疫原性组合物。文中使用的免疫原性组合物是增加针对转基因产物的体液(例如,抗体)或细胞(例如,细胞毒性T细胞)应答的组合物,其中转基因产物是在免疫原性组合物传递至哺乳动物,优选是灵长类后传递的。本发明提供含有其任一腺病毒序列缺失和编码所需免疫原的基因的Ad。基于猿或其它非人哺乳动物灵长类血清型的嵌合腺病毒可能比人源腺病毒更适合于在不同动物种类中用作活重组病毒疫苗,但其用途不限于此。重组腺病毒可用作抗任何病原体的预防性或治疗性疫苗,其中所述抗原对诱导免疫应答重要并能限制已鉴定的病原体扩散并且可用cDNA。
这种疫苗(或其它免疫原性)组合物配制于上述合适的传递载体中。免疫原性组合物的剂量通常在上述治疗性组合物所定义的范围内。可检测所选基因的免疫水平来确定是否需要加强免疫。评价血清中的抗体滴度后,可能需要任选的加强免疫。
本发明的疫苗组合物可任选配制成含有其它成分,包括,例如佐剂、稳定剂、pH调节剂、防腐剂等。这种成分是疫苗领域的技术人员熟知的。合适的佐剂的例子包括(不限于)脂质体、明矾、单磷酰脂质A和任何生物活性因子,例如细胞因子、白介素、趋化因子、配体并且最优选其组合。确信这些生物活性因子可在体内表达,例如通过质粒或病毒载体。例如,与仅用编码抗原的DNA引发后产生的免疫应答相比,这种佐剂可与编码抗原的引发DNA疫苗一起施用来增强抗原特异性免疫应答。
腺病毒以“免疫原性量”施用,即在转染所需细胞并提供所选基因的足够表达水平来诱导免疫应答的施用途径中有效的腺病毒量。当重组腺病毒提供保护性免疫时,可认为是在防止感染和/或疾病复发中有用的疫苗组合物。
此外,本发明的载体可含有编码诱导对所选免疫原的免疫应答的肽、多肽或蛋白的转基因。本发明的重组腺病毒预计在诱导溶细胞性T细胞和针对载体表达的插入的异源抗原蛋白的抗体中高度有效。
例如,免疫原可选自各种病毒科。合乎需要的抗免疫应答的病毒科的例子可能包括含有鼻病毒属的小RNA病毒科,所述鼻病毒导致约50%病例的普通感冒;肠病毒属,包括脊髓灰质炎病毒、柯萨奇病毒、艾可病毒和人肠病毒,例如甲型肝炎病毒;口疮病毒属,该病毒主要在非人动物中导致口蹄疫。在小RNA病毒科中,靶抗原包括VP1、VP2、VP3、VP4和VPG。另一个病毒科包括杯状病毒科,该科包括病毒的诺瓦克群,这是流行性肠胃炎的重要病因。另一种希望用于靶抗原在人或非人动物中诱导免疫应答的病毒科是披膜病毒科,该科包括甲型病毒属,该病毒属包括亲德毕斯病毒、罗斯河病毒、和委内瑞拉、东部和西部马脑炎病毒和风疹病毒属,包括风疹病毒。黄病毒科包括等革热、黄热、日本脑炎、圣路易斯脑炎和蜱传性脑炎病毒。其它靶抗原可从丙型肝炎或冠状病毒科产生,其中包括许多非人病毒,例如感染性支气管炎病毒(家禽)、猪传染性胃肠病毒(猪)、猪凝血性脑脊髓炎病毒(猪)、猫感染性腹膜炎病毒(猫)、猫肠冠状病毒(猫)、犬冠状病毒(犬)和可导致普通感冒和/或非-甲型、乙型或丙型肝炎的人呼吸冠状病毒。此外,人冠状病毒包括严重急性呼吸道综合症(SARS)的假定病因。在冠状病毒科中,靶抗原包括E1(也称为M或基质蛋白)、E2(也称为S或Spike蛋白)、E3(也称为HE或血凝素-依尔替糖)、糖蛋白(不存在于所有的冠状病毒中)或N(核衣壳)。其它抗原可靶向抗弹状病毒科,该科包括水疱性病毒属(例如,水疱性口炎病毒)和狂犬病病毒属(例如,狂犬病)。在弹状病毒科中,合适的抗原来源于G蛋白或N蛋白。包括出血热病毒,例如马尔堡和埃博拉病毒的丝状病毒科可是合适的抗原来源。副黏病毒科包括1型副流感病毒、3型副流感病毒、3型牛副流感病毒、腮腺炎病毒(流行性腮腺炎病毒)、2型副流感病毒、4型副流感病毒、新城疫病毒(小鸡)、牛瘟病毒、麻疹病毒,包括麻疹和犬瘟热,和肺病毒,包括呼吸道合胞病毒。流感病毒分类在正黏病毒科内并且是抗原(例如,HA蛋白、N1蛋白)的合适来源。布尼亚病毒科包括布尼亚病毒属(加利福尼亚脑炎,拉克罗斯脑炎)、白蛉热病毒属(裂谷热)、汉坦病毒属(普马拉是hemahagin热病毒)、内罗毕病毒属(内罗毕绵羊病)和各种未命名的银环蛇病毒(bungaviruses)。沙粒病毒科提供抗LCM和拉沙热病毒的抗原来源。呼肠孤病毒科包括呼肠孤病毒属、轮状病毒属(导致儿童急性肠胃炎)、环状病毒属和科罗拉多蜱热病毒属(科罗拉多蜱热)、Lebombo病毒属(人)、马变性脑病病毒属、蓝舌病病毒属。
逆转录病毒科包括RNA肿瘤病毒亚科,该亚科包括人和兽医疾病,例如猫白血病病毒、HTLVI和HTLVII、慢病毒亚科(包括人免疫缺陷病毒(HIV)、猿免疫缺陷病毒(SIV)、猫免疫缺陷病毒(FIV)、犬感染性贫血病毒和泡沫病毒亚科)。慢病毒中,许多合适的抗原已见描述并可容易地选择。合适的HIV和SIV抗原的例子包括(不限于)gag、pol、Vif、Vpx、VPR、Env、Tat、Nef和Rev蛋白及其各种片段。例如,合适的Env蛋白片段可含有其任何亚基,例如gp120、gp160、gp41或其更小的片段,例如至少约8个氨基酸长。类似地,可选择tat蛋白的片段。[参见,美国专利5,891,994和美国专利6,193,981],也可参见描述于D.H.Barouch等,J.Virol.,75(5)2462-2467(2001年3月)和R.R.Amara等,Science,29269-74(2001年4月6日)的HIV和SIV蛋白。在另一个实施例中,HIV和/或SIV免疫原性蛋白或肽可用于形成融合蛋白或其它免疫原性分子。参见,例如描述于2001年8月2日公布的WO 01/54719和1999年4月8日公布的WO 99/16884中的HIV-1 Tat和/或Nef融合蛋白和免疫方案。本发明不受文中所述的HIV和/或SIV免疫原性蛋白或肽的限制。此外,对这些蛋白的各种修饰已见描述或可为本领域的技术人员容易地选择。参见,例如描述于美国专利5,972,596的修饰的gag蛋白。另外,任何所需的HIV和/或SIV免疫原可单独传递或者组合传递。这种组合可包括从单个载体或多个载体表达。另一个实施方案可任选包括传递一种或多种表达的免疫原和传递一种或多种蛋白形式的免疫原。这种组合详细讨论于下文。
乳多空病毒科包括多瘤病毒亚科(BKU和JCU病毒)和乳头瘤病毒亚科(与癌症或乳头瘤的恶性进展有关)。腺病毒科包括导致呼吸疾病和/或肠炎的病毒(EX、AD7、ARD、O.B.)。细小病毒包括猫细小病毒(猫肠炎)、猫全白细胞减少病毒、犬细小病毒和猪细小病毒科。疱疹病毒科包括α疱疹病毒亚科,该亚科包括单纯疱疹病毒属(HSVI、HSVII)、水痘病毒属(假狂犬病、水痘-带状疱疹);β疱疹病毒亚科,该亚科包括巨细胞病毒属(HCMV,鼠巨细胞病毒属);和γ疱疹病毒亚科,该亚科包括淋巴潜隐病毒属、EBV(伯基特淋巴瘤)、传染性鼻气管炎病毒属、马雷克病病毒属和细长病毒属。痘病毒科包括脊椎动物痘病毒亚科亚科和昆虫痘病毒科亚科,前者包括正痘病毒属(天花(天花)和牛痘(牛痘))、副痘病毒属、禽痘病毒属、山羊痘病毒属、野兔痘病毒属、猪痘病毒属。嗜肝DNA病毒科包括乙型肝炎病毒。抗原的合适来源的一种未分类病毒是肝炎δ病毒。其它的病毒来源包括鸟类感染性粘液囊病病毒和猪呼吸和生殖综合症病毒。甲型病毒科包括马动脉炎病毒和各种脑炎病毒。
本发明的病毒也可携带用于免疫人或非人动物来抵抗其它病原体的免疫原,所述病原体包括细菌、真菌、寄生微生物或感染人和非人脊椎动物的多细胞寄生虫、或来自癌症细胞或肿瘤细胞的病原体。细菌病原体的例子包括致病性革兰氏阳性球菌,该球菌包括肺炎球菌、葡萄球菌和链球菌。致病性革兰氏阴性球菌包括脑膜炎球菌、淋球菌。致病性肠革兰氏阴性杆菌包括肠杆菌属;假单胞菌属、不动杆菌属和埃肯菌属;类鼻疽假单孢菌属;沙门氏菌属;志贺氏菌属;嗜血杆菌属;莫拉氏菌属;杜克雷嗜血杆菌(H.ducreyi)(导致软下疳);布鲁氏菌属;野兔热弗朗西丝氏菌(Franisella tularensis)(导致兔热病);耶尔森菌属(巴斯德菌属);念珠状链杆菌和螺菌属;革兰氏阳性杆菌,包括单核细胞增多李斯特菌;红斑丹毒丝菌;白喉棒状杆菌(Corynebacterium diphtheria)(白喉);霍乱;炭疽杆菌(B.anthracis)(炭疽);多诺万病(腹股沟肉芽肿)和巴尔通体病。致病性厌氧细菌导致的疾病包括破伤风、肉毒中毒、其它梭菌病、结核病、麻风和其它分枝杆菌病。致病性螺旋体疾病包括梅毒;密螺旋体病雅司疹、品他病和地方性梅毒;以及钩端螺旋体病。较高致病性细菌和致病性真菌导致的其它感染包括放线菌病;诺卡氏病;隐球菌病、芽生菌病、组织胞浆菌病和球孢子菌病;念珠菌病、曲霉病和毛霉病;孢子丝菌病;副球孢子菌病、石样真菌病、球拟酵母病、足分枝菌病和着色真菌病;和皮真菌病。立克次体感染包括斑疹伤寒热、落矶山斑疹热、Q热和立克次氏体痘。支原体和衣原体感染的例子包括支原体肺炎、性病性淋巴肉芽肿、鹦鹉热和产期衣原体感染。致病性真核细胞包括致病性原生动物和蠕虫并且由其产生的感染包括阿米巴病、疟疾、利什曼病、锥虫病、弓形体病、卡氏肺囊虫(Pneumocystis carinii)、Trichans、鼠弓形体(Toxoplasma gondii)、巴贝虫病、贾第虫病、旋毛虫病、丝虫病、血吸虫病、线虫、吸虫(trematodes)或吸虫(flukes)感染和绦虫(绦虫)感染。
许多这些生物体和/或其产生的毒素作为具有用于生物攻击的潜力的制剂由美国健康与人类服务部疾病控制中心鉴定。例如,一些生物制剂,包括现在分类为A类制剂的炭疽杆菌(Bacillus anthracis)(炭疽)、肉毒杆菌(Clostridiumbotulinum)及其毒素(肉毒中毒)、鼠疫耶尔森氏菌(Yersinia pestis)(鼠疫)、大天花(天花)、野兔热弗朗西丝氏菌(Franisella tularensis)(兔热病)和病毒性出血热[丝状病毒(例如,埃博拉病毒、马尔堡病毒)和沙粒病毒[例如,拉沙病毒、马丘博病毒]];现在分类为B类制剂的伯内特科克斯立克次体(Coxiella burnetti)(Q热)、布鲁杆菌(布鲁杆菌病)、鼻疽伯克霍尔德氏菌(Burkholderia mallei)(鼻疽)、假鼻疽伯克霍尔德氏菌(Burkholderia pseudomallei)(类鼻疽)、蓖麻(Ricinus communis)及其毒素(蓖麻蛋白毒素)、产气荚膜梭菌(Clostridium perfringens)及其毒素(ε毒素)、葡萄球菌及其毒素(肠毒素B)、鹦鹉热衣原体(Chlamydia psittaci)(鹦鹉热)、水上安全恐吓(water safety threats)(例如,霍乱弧菌(Vibrio cholerae)、小隐孢子虫(Cryptosporidium parvum)、斑疹伤寒热(普氏立克次体(Richettsia powazekii))和病毒性脑炎(甲型病毒,例如委内瑞拉马脑炎、东部马脑炎、西部马脑炎);和现在分类为C类制剂的Nipan病毒和汉坦病毒。此外,其它如此分类或不同地分类的生物体在将来可鉴定和/或用于这种目的。容易理解的是,文中所述的病毒载体和其它构建物可用于传递来自这些生物体的抗原、病毒、其毒素或其它副产物,这些物质可防止和/或治疗感染或使用这些生物制剂产生的其它不利反应。
施用本发明的载体来传递抗T细胞可变区的免疫原引发包括消除那些T细胞的CTL的免疫应答。在RA中已鉴定了参与疾病的TCR的几种特定可变区。这些TCR包括V-3、V-14、V-17和Vα-17。因此,传递至少编码这些多肽的一种的核酸序列引发靶向参与RA的T细胞的免疫应答。在MS中已鉴定了参与疾病的TCR的几种特定可变区。这些TCR包括V-7和Vα-10。因此,传递至少编码这些多肽的一种的核酸序列引发靶向参与MS的T细胞的免疫应答。在硬皮病中已鉴定了参与疾病的TCR的几种特定可变区。这些TCR包括V-6、V-8、V-14和Vα-16、Vα-3C、Vα-7、Vα-14、Vα-15、Vα-16、Vα-28和Vα-12。因此,传递至少编码这些多肽的一种的嵌合腺病毒引发靶向参与硬皮病的T细胞的免疫应答。
C.Ad-介导的传递方法可检测所选基因的治疗水平或免疫水平来确定是否需要加强免疫。在对血清中CD8+T细胞应答或任选抗体滴度进行评价后,可希望任选的加强免疫。本发明的腺病毒载体可任选单一施用或以各种组合方案传递,例如,与涉及其它活性成分的方案或过程或引发-加强(prime-boost)方案组合。各种这样的方案在本领域已见描述并可容易地选择。
例如,引发-加强方案可涉及施用基于载体的DNA(例如质粒)来引发免疫系统到施用常规抗原进行第二或进一步加强免疫,所述常规抗原是例如蛋白或携带编码这种抗原的序列的重组病毒。参见,例如2000年3月2日公布的WO00/11140,该文献引为参考。此外,免疫方案可涉及施用本发明的嵌合腺病毒载体来激发针对携带抗原的载体(病毒或以DNA为基础)或蛋白的免疫应答。此外,免疫方案涉及施用一种蛋白,然后用编码抗原的载体加强免疫。
在一个实施方案中,本发明提供通过传递携带所述抗原的质粒DNA载体,然后用本发明的腺病毒载体加强来引发和加强针对所选抗原的免疫应答的方法。在一个实施方案中,引发-加强方案涉及来自引发和/或加强载体的多蛋白的表达。参见,例如R.R.Amara,Science,29269-74(2001年4月6日),该文献描述了表达用于产生抗HIV和SIV免疫应答的蛋白亚基的多蛋白方案。例如,DNA引发可传递来自单一转录的Gag、Pol、Vif、VPX和Vpr和Env、Tat和Rev。此外,SIV Gag、Pol和HIV-1Env在本发明的重组腺病毒构建物中传递。其它的方案描述于WO 99/16884和WO 01/54719。
然而,引发-加强方案不限于HIV免疫或传递这些抗原。例如,引发可涉及传递本发明的第一载体,然后用第二载体或含有蛋白形式的抗原自身的组合物来加强。在一个实施例中,引发-加强方案可提供针对从中获得抗原的病毒、细菌或其它生物体的保护性免疫应答。在另一个所需的实施方案中,引发-加强方案提供的治疗作用可使用检测所要施用的治疗疾病存在的常规试验来测定。
引发组合物可以剂量依赖方式施用于身体的不同位点,所述方式取决于希望的免疫应答所靶向的抗原。本发明不受注射的量或位置或药物载体的限制。反而,治疗方案可涉及引发和/或加强步骤,每个步骤可包括单一剂量或每小时、每天、每周或每月、或每年施用的剂量。例如,哺乳动物可接受含有载体配制的约10μg到约50μg的质粒的一次剂量或两次剂量。期望的DNA组合物的量是约在1μg到约10,000μg的DNA载体之间。剂量可从约1μg到1000μgDNA每kg受试对象体重不等。传递的量或位点最好可基于哺乳动物的个性或疾病选择。文中描述了适合于将抗原传递至哺乳动物的载体的剂量单位。通过悬浮或溶解于药学或生理上可接受的载体制备用于施用的载体,所述载体是例如精通这种施用的人员明白的等渗盐水、等渗盐溶液或其它制剂。合适的载体对本领域的技术人员是显而易见的并且很大程度上取决于施用的途径。本发明的组合物可按照上述途径,以使用生物可降解的生物相容聚合物的缓释制剂或使用胶束、凝胶和脂质体通过装置内传递施用至哺乳动物。本发明的引发步骤也任选包括用引发组合物、合适量的佐剂(例如,文中所定义的)施用。
加强组合物优选在向哺乳动物对象施用引发组合物后约2到27周施用。加强组合物的施用可通过使用有效量的加强组合物来实现,所述组合物含有或能传递相同于引发DNA疫苗所施用的抗原。加强组合物可由得自相同病毒来源(例如,本发明的腺病毒序列)或另一种来源的重组病毒载体组成。此外,“加强组合物”可是含有相同于引发DNA疫苗中编码的抗原的组合物,但以蛋白或肽的形式,该组合物在宿主中诱导免疫应答。在另一个实施方案中,加强组合物含有在调节序列控制之下编码抗原的DNA序列,所述调节序列在哺乳动物细胞中指导其表达,例如,载体(如熟知的细菌或病毒载体)。加强组合物的基本要求是组合物的抗原与引发组合物编码的抗原相同或是交叉反应抗原。
在另一个实施方案中,本发明的腺病毒载体也很适用于各种其它免疫或治疗方案。这种治疗方案可涉及与不同血清型衣壳的Ad载体同时或依次传递本发明的腺病毒载体;与非Ad载体同时或依次传递本发明的腺病毒载体的方案;与蛋白、肽和/或其它生物有用的治疗性或免疫原性化合物同时或依次传递本发明的腺病毒载体的方案。这种用途对于本领域的技术人员是显而易见的。
IV.猿腺病毒18序列本发明提供Ad SA18的核酸序列和氨基酸序列,所述序列从与其天然相关的其它病毒材料分离。这些序列用于制备含有文中所述的核酸序列和氨基酸序列及其区域或片段的异源分子,制备用于各种目的的病毒载体(包括构建物和组合物),并且如文中所述用于嵌合腺病毒的方法(包括,例如在宿主细胞中生产需要腺病毒辅助功能物的病毒),以及用作如文中所述异源分子的传递载体。这些序列也用于产生本发明的嵌合腺病毒。
A.核酸序列本发明的SA18核酸序列含有SEQ ID NO12,核苷酸1到31967所示的核苷酸。参见引为参考的序列表。本发明的核酸序列还含有与SEQ ID NO12的序列互补的链,以及对应于这些序列图及其互补链的RNA和cDNA序列。本发明还包括与序列表具有大于95到98%,更优选约99到99.9%的同源或相同的核酸序列。本发明的核酸序列中也含有SEQ ID NO12及其互补链所示序列的天然变体和工程改造的修饰物。这种修饰物包括,例如本领域已知的标记、甲基化和用简并核苷酸取代一种或多种天然存在的核苷酸。
本发明还包括SA18序列、其互补链、与其互补的cDNA和RNA的片段。合适的片段是至少15个核苷酸长,并含有功能性片段,即生物学感兴趣的片段。例如,功能性片段可表达所需的腺病毒产物或可用于生产重组病毒载体。这种片段含有下表所列的基因序列和片段。
下表提供本发明的猿腺病毒序列的转录区域和开放读框。某些基因的转录物和开放读框(ORF)位于和SEQ ID NO12所示序列互补的链上。参见,例如E2b、E4和E2a。表中也显示了编码的蛋白的计算分子量。
SA18腺病毒核酸序列用作治疗性和免疫原性药物并且用于构建各种载体系统和宿主细胞。出于上文所述的任何目的,这种载体可用于嵌合腺病毒。此外,这些SA18序列和产物可单独使用,或与其它腺病毒序列或片段联合使用,或与来自其它腺病毒或非腺病毒序列的元件联合使用。本发明的腺病毒序列也可用作反义传递载体、基因治疗载体、或疫苗载体,并可用于使用这些物质的方法中。因此,本发明还提供核酸分子、基因传递载体和含有本发明的Ad序列的宿主细胞。
例如,本发明包括含有本发明的猿Ad ITR序列的核酸分子。在另一个实施例中,本发明提供编码所需Ad基因产物的含有本发明的猿Ad序列的核酸分子。鉴于文中提供的信息,使用本发明的序列构建的其它核酸分子对本领域的技术人员是显而易见的。
在一个实施方案中,文中鉴定的猿Ad基因区域可用在将异源分子传递至细胞的各种载体中。文中的第三部分提供了这种分子和传递方法的例子。例如,为了在包装宿主细胞中产生病毒载体,产生表达腺病毒衣壳蛋白(或其片段)的载体。这种载体可设计为以反式表达。此外,这种载体设计为提供稳定含有表达所需腺病毒功能物的序列的细胞,所述功能物是例如E1a、E1b、末端重复序列、E2a、E2b、E4、E4ORF6区域中的一种或多种。
此外,腺病毒基因序列及其片段用于提供生产依赖辅助病毒的病毒(例如,基本功能物缺失的腺病毒载体或腺相关病毒(AAV))所需的辅助功能物。就这种生产方法而言,本发明的猿腺病毒序列以类似于人Ad所述的方式用于该方法。然而,由于本发明的猿腺病毒序列与人Ad序列之间的差异,使用本发明的序列基本上消除了在携带人Ad E1功能物的宿主细胞(例如,293细胞)中与辅助功能物发生同源重组的可能性,这种功能物在rAAV生产期间可能产生感染性腺病毒污染物。
使用腺病毒辅助功能物生产rAAV的方法详细地描述于使用人腺病毒血清型的参考文献中。参见,例如美国专利6,258,595及其引用的参考文献。也可参见美国专利5,871,982;WO 99/14354;WO 99/15685;WO 99/47691。这些方法也可用于生产非人血清型AAV,包括非人灵长类AAV血清型。提供所需辅助功能物(例如,E1a、E1b、E2a和/或E4ORF6)的本发明的猿腺病毒基因序列尤其可用于提供所需腺病毒功能物同时使与存在于rAAV包装细胞中的任何其它腺病毒重组的可能性最小或消除这种可能性,所述细胞通常是人源的。因此,本发明的腺病毒序列的所选基因或开放读框可用在这些rAAV生产方法中。
此外,本发明的重组腺病毒猿载体可用在这些方法中。这种重组腺病毒猿载体可含有,例如杂交猿Ad/AAV,其中猿Ad序列的两翼是由,例如AAV 3’和/或5’ITR组成的rAAV表达盒与在控制其表达的调节序列控制之下的转基因。本领域的技术人员可认识到本发明的其它猿腺病毒载体和/或基因序列用于生产rAAV和其它依赖于腺病毒辅助病毒的病毒。
在又一个实施方案中,核酸分子设计为在宿主细胞中传递和表达所选腺病毒基因产物来实现所需的生理作用。例如,含有编码腺病毒E1a蛋白的序列的本发明核酸分子可传递至受试对象用作癌症疗剂。这种分子可任选配制在基于脂质的载体中并且优选靶向癌细胞。这种制剂可与其它癌症疗剂(例如,顺氯氨铂、紫杉醇等)组合。本发明提供的腺病毒序列的其它用途对本领域的技术人员是显而易见的。
此外,本领域的技术人员可容易地理解本发明的Ad序列可容易地适用于各种在体外、先体外后体内或体内传递治疗性和免疫原性分子的病毒和非病毒载体系统中,所述分子包括那些已鉴定为可通过本发明的嵌合腺病毒传递的分子。例如,本发明的猿Ad基因组可用在各种rAd和非rAd载体系统中。其中这种载体系统可包括,例如质粒、慢病毒、逆转录病毒、痘病毒、疫苗病毒和腺相关病毒系统。这些载体系统的选择不限制本发明。
本发明还提供用于生产本发明的猿和猿衍生蛋白的分子。这种携带含有本发明的猿Ad DNA序列的多核苷酸的分子可以是载体形式。
B.本发明的猿腺病毒蛋白本发明还提供上述腺病毒的基因产物,例如由本发明的腺病毒核酸编码的蛋白、酶及其片段。本发明还包括具有这些核酸序列编码的氨基酸序列的SA18蛋白、酶及其片段,而所述核酸序列通过其它方法产生。这种蛋白包括那些由上表中鉴定的开放读框编码的蛋白及其片段。
因此,在一方面,本发明提供基本上纯的(即,无其它病毒和似蛋白质的蛋白质)独特的猿腺病毒蛋白,这些蛋白优选至少10%同源、更优选60%同源、最优选至少95%同源。
在一个实施方案中,本发明提供独特的猿衍生的衣壳蛋白。文中使用的猿衍生的衣壳蛋白包括任何含有SA18衣壳蛋白或其片段的如上所定义的腺病毒衣壳蛋白,包括(不限于)嵌合衣壳蛋白、融合蛋白、人工衣壳蛋白、合成衣壳蛋白和重组衣壳蛋白,不限于产生这些蛋白的方法。
这些猿衍生的衣壳蛋白可适当地含有一个或多个SA18区域或其片段(例如,六邻体、五邻体、尾丝或其片段)与如文中所述的不同腺病毒血清型的衣壳区域或其片段,或修饰的猿衣壳蛋白或片段组合。文中使用的“改变的趋性相关的衣壳蛋白的修饰”包括改变的衣壳蛋白(即五邻体、六邻体或尾丝蛋白区域或其片段),例如尾丝区域的结结构域或编码相同物质的多核苷酸,以致改变了特异性。猿衍生的衣壳可用一种或多种本发明的猿Ad或另一种人或非人来源的Ad血清型构建。这种Ad可得自各种来源,包括ATCC,学术和商业来源,或得自GenBank或其它合适来源的Ad序列。
文中提供了本发明的猿腺病毒五邻体蛋白的氨基酸序列。Ad SA18五邻体蛋白示于SEQ ID NO13。任何这些五邻体蛋白或其独特的片段可合适地用于各种目的。基于以上提供的氨基酸编号,合适片段的例子包括具有约50、100、150或200个氨基酸的N末端和/或C末端截短的五邻体。其它合适的片段包括较短的内部、C末端或N末端片段。另外,可修饰五邻体蛋白用于本领域技术人员已知的各种目的。
本发明还提供了SEQ ID NO14所示的SA18的六邻体蛋白的氨基酸序列。该六邻体蛋白或其独特的片段可合适地用于各种目的。基于以上和SEQ ID NO14中提供的氨基酸编号,合适片段的例子包括具有约50、100、150、200、300、400或500个氨基酸的N末端和/或C末端截短的六邻体。其它合适的片段包括较短的内部、C末端或N末端片段。例如,合适的片段是命名为DE1和FG1的六邻体蛋白的环区域(结构域),或其超变区域。参考SEQ ID NO14,这种片段包括猿六邻体蛋白的区域,所述区域跨越氨基酸残基约125到443、约138到441;或较小的片段,例如跨越氨基酸残基约138到残基163、约170到约176、约195到约203、约233到约246、约253到约264、约287到约297、约404到约430、约430到550、约545到650。本领域的技术人员可容易地鉴定其它合适的片段。此外,可修饰六邻体蛋白用于本领域技术人员已知的各种目的。因为六邻体蛋白是腺病毒的血清型的决定子,这种人工六邻体蛋白会导致具有人工血清型的腺病毒。也可使用黑猩猩Ad五邻体序列和/或本发明的尾丝序列和/或其片段来构建其它人工衣壳蛋白。
在一个实施例中,最好使用本发明的六邻体蛋白的序列来产生具有改变的六邻体蛋白的腺病毒。改变六邻体蛋白的一种合适的方法描述于美国专利5,922,315,该文献引为参考。在该方法中,腺病毒六邻体的至少一个环区域随另一种腺病毒血清型的至少一个环区域而变。因此,这种改变的腺病毒六邻体蛋白的至少一个环区域是本发明的猿Ad六邻体环区域。在一个实施方案中,SA18六邻体蛋白的环区域被另一种腺病毒血清型的环区域所取代。在另一个实施方案中,SA18六邻体的环区域用于取代另一种腺病毒血清型的环区域。合适的腺病毒血清型可容易地从文中所述的人和非人血清型中选择。选择SA18仅是出于说明性目的;本发明的其它猿Ad六邻体蛋白也可类似地改变,或用于改变另一种Ad六邻体。选择合适的血清型不限制本发明。本发明的六邻体蛋白序列的其它用途对本领域的技术人员是显而易见的。
本发明还包括本发明的猿腺病毒的尾丝蛋白。Ad SA18的尾丝蛋白具有SEQID NO1所示的氨基酸序列。该尾丝蛋白或其独特的片段可合适地用于各种目的。一种合适的片段是跨越SEQ ID NO15所示约氨基酸247到425的尾丝结。基于以上和SEQ ID NO15中所提供的氨基酸编号,其它合适片段的例子包括具有约50、100、150或200个氨基酸的N末端和/或C末端截短的尾丝。其它合适的片段包括内部片段。此外,可使用本领域的技术人员已知的各种技术来修饰尾丝蛋白。
本发明还包括长度至少为8个氨基酸的本发明蛋白的独特片段。然而,其它所需长度的片段可容易地使用。此外,本发明包括可引入来增强SA18基因产物的产量和/或表达的这种修饰,例如,构建融合分子,其中SA18基因产物的全部或其片段与融合配偶体融合(直接或通过接头)来增强。其它合适的修饰包括(不限于)截短编码区域(例如,蛋白或酶)以消除常规切割的前蛋白或原蛋白并且提供成熟的蛋白或酶和/或编码区域的突变来提供可分泌的基因产物。其它修饰对本领域的技术人员是显而易见的。本发明还包括与文中提供的SA18蛋白具有至少约95%到99%同一性的蛋白。
如文中所述,含有本发明的腺病毒衣壳蛋白的本发明载体尤其适用于中和抗体减少了其它基于Ad血清型的载体以及其它病毒载体效力的应用领域。本发明的rAd载体在重复基因治疗或加强免疫应答(疫苗滴度)的再施用中尤其有利。文中提供了这种治疗方案的例子。
在某些情况中,需要使用一种或多种SA18基因产物(例如,衣壳蛋白或其片段)来产生抗体。文中使用的术语“一种抗体”指一种能特异性地与表位结合的免疫球蛋白分子。因此,本发明的抗体优选特异性地与SA18表位结合并且无交叉反应。本发明的抗体存在各种形式,例如包括高亲和力多克隆抗体、单克隆抗体、合成抗体、嵌合抗体、重组抗体和人源化抗体。这种抗体起源于免疫球蛋白IgG、IgM、IgA、IgD和IgE类。
这种抗体可使用本领域已知的许多方法产生。合适的抗体可通过本领域熟知的常规技术产生,例如Kohler和Milstein和许多已知的改进形式。类似地,可通过将已知的重组技术应用于针对这些抗原而开发的单克隆或多克隆抗体来产生所需的高滴度抗体[参见,例如PCT专利申请号PCT/GB85/00392;英国专利申请公布号GB2188638A;Amit等,1986Science,233747-753;Queen等,1989 Proc.Nat′l.Acad.Sci.美国,8610029-10033;PCT专利申请号PCT/WO9007861和Riechmann等,Nature,332323-327(1988);Huse等,1988aScience,2461275-1281]。此外,通过操作针对本发明抗原的动物或人抗体的互补决定区域来生产抗体。参见,例如E.Mark和Padlin,“单克隆抗体的人源化”(Humanization of Monoclonal Antibodies),第四章,《实验药理学手册》(The Handbook of Experimental Pharmacology),113卷,《单克隆抗体的药理学》(The Pharmacology of Monoclonal Antibodies),Springer-Verlag(1994年6月);Harlow等,1999,《抗体使用实验室手册》(Using AntibodiesA LaboratoryManual),冷泉港实验室出版社,纽约;Harlow等,1989,《抗体实验室手册》(AntibodiesA Laboratory Manual),冷泉港,纽约;Houston等,1988,Proc.Natl.Acad.Sci.美国855879-5883和Bird等,1988,Science 242423-426。本发明还提供抗独特型抗体(Ab2)和抗抗独特型抗体(Ab3)。参见,例如M.Wettendorff等,“通过抗独特型抗体进行的抗肿瘤免疫调制”(Modulation ofanti-tumor immunity by anti-idiotypic antibodies),刊于《独特型网络与疾病》(Idiotypic Network and Diseases),J.Cerny和J.Hiernaux编,1990 J.Am.Soc.Microbiol.,华盛顿特区203-229页。这些抗独特型和抗抗独特型抗体可使用本领域技术人员熟知的技术生产。这些抗体可用于各种目的,包括诊断和临床方法与试剂盒。
在某些情况中,最好在本发明的SA18基因产物、抗体或其它构建物上引入可检测的标记或标签。文中使用的可检测标记是能单独或与另一种分子相互作用时能提供可检测信号的分子。最希望所述标记易用于免疫组织化学分析或免疫荧光显微术中进行目测,例如通过荧光。例如,合适的标记包括异硫氰酸荧光素(FITC)、藻红蛋白(PE)、别藻蓝素(APC)、柯里膦-O(CPO)或串联染料、PE-花青苷-5(PC5)和PE-德克萨斯红(PE-Texas Red)(ECD)。所有这些荧光染料均市售可得并且其用途为本领域已知。其它有用的标记包括胶体金标记。还有其它有用的标记包括放射性化合物或元素。此外,标记包括在测定中控制比色信号展示的各种酶系统,例如葡萄糖氧化酶(使用葡萄糖作为底物)释放过氧化物作为产物,该产物在有过氧化物酶和氢供体(例如四甲基联苯胺(TMB))的情况下生产可见蓝色的氧化TMB。其它例子包括辣根过氧化物酶(HRP)或碱性磷酸酶(AP),及与葡萄糖-6-磷酸脱氢酶偶联的己糖激酶,其与ATP、葡萄糖和NAD+反应产生NADPH,而NADPH在340nm波长处检测为吸光度增加。
其它用于本发明方法的标记系统可通过其它方法检测,例如使用包埋有染料的有色乳胶微粒[Bangs Laboratories,Indiana]取代酶来形成具有靶序列的偶联物以提供指示应用测定中存在所得复合物的可见信号。
将标记与所需分子偶联或结合的方法是类似的常规方法并是本领域技术人员已知的。标记连接的已知方法描述于[参见,例如《荧光探针和研究化学品手册》(Handbook of Fluorescent probes and Research Chemicals),第六版,R.P.M.Haugland,Molecular Probes,Inc.,Eugene,OR,1996;《皮尔斯目录与手册》(Pierce Catalog and Handbook),“生命科学与分析研究产物”(Life Scienceand Analytical Research Products),Pierce Chemical Company,Rockford,IL,1994/1995]。因此,标记与偶联方法的选择不限制本发明。
本发明的序列、蛋白和片段可通过任何合适的方法生产,包括重组生产、化学合成或其它合成方法。合适的生产技术是本领域的技术人员熟知的。参见。例如Sambrook等,《分子克隆实验室手册》(Molecular CloningA LaboratoryManual),冷泉港出版社(冷泉港,纽约)。此外,也可通过熟知的固相肽合成方法合成肽(Merrifield,J.Am.Chem.Soc.,852149(1962);Stewart和Young,“固相肽合成”(Solid Phase Peptide Synthesis)(Freeman,旧金山,1969)27-62页)。这些和其它合适的生产方法在本领域技术人员的知识范围内并不限制本发明。
此外,本领域的技术人员容易理解,本发明的Ad序列可容易地适用于各种病毒或非病毒载体系统体外、先体外后体内或体内传递治疗性和免疫原性分子。例如,在一个实施方案中,文中所述的猿Ad衣壳蛋白和其它猿腺病毒蛋白用于以非病毒、蛋白为基础传递基因、蛋白和其它所需的诊断、治疗性和免疫原性分子。在这种实施方案中,本发明的蛋白直接或间接地连接于靶向具有腺病毒受体的细胞的分子。优选选择这种靶向的衣壳蛋白,例如具有细胞表面受体的配体的六邻体、五邻体、尾丝或其片段。适合于传递的分子选自文中所述治疗性分子及其基因产物。各种接头,包括脂质、聚赖氨酸等可用作接头。例如,猿五邻体蛋白可通过使用猿五邻体序列生产融合蛋白来容易地用于这种目的,所述生产以类似于Medina-Kauwe LK等,Gene Ther.2001年5月;8(10)795-803和Medina-Kauwe LK等,Gene Ther.2001年12月;8(23)1753-1761所述的方式进行。此外,如美国专利申请20010047081所述,猿Ad蛋白IX的氨基酸序列可用于靶向载体至细胞表面受体。合适的配体包括CD40抗原,含有RGD或聚赖氨酸的序列等。还有其它猿Ad蛋白(例如,包括六邻体蛋白和/或尾丝蛋白)可用于这些或类似的目的。
出于本领域的技术人员容易明白的目的,其它本发明的腺病毒蛋白可单独使用或与其它腺病毒蛋白联合使用。此外,本发明的腺病毒蛋白的其它用途对于本领域的技术人员是显而易见的。
出于治疗或疫苗目的,本发明的组合物含有将异源分子传递至细胞的载体。含有SA18的猿腺病毒DNA和小基因的这种载体可使用文中所述用于嵌合腺病毒的技术和本领域已知的技术构建。此外,SA19可是文中所述嵌合腺病毒序列的来源。
以下实施例说明了几种嵌合病毒的构建和用途,包括Pan5/C1、hu5/Pan7、hu5/SV25和Pan6/Pan7。然而,这些嵌合体仅是说明性的而非要将本发明限制于那些说明的实施方案中。
实施例1-Pan5/C1嵌合猿病毒的构建最初分离自黑猩猩的5种不同的腺病毒,AdC68[美国专利6,083,716]、AdPan5、AdPan7、AdPan6和AdC1[美国专利6,083,716]得到测序。参见,2002年11月提交的Pan5[SEQ ID NO1]、Pan7[SEQ ID NO3]和Pan6[SEQ ID NO2]的序列的国际申请号PCT/US02/33645。该申请也提供了SV1、SV25和SV39[分别是SEQ ID No.4、5、6]的序列。与其它4种黑猩猩衍生的腺病毒相比,衣壳蛋白序列的序列比较预计AdC 1明显属于不同的血清学亚组。
然而,在HEK293细胞中培养AdC1的努力表明其生长特征严苛(数据未显示),因此可能不适合于用作使用当前可用的E1互补细胞系的载体。但是由于AdC1衣壳蛋白序列与其它黑猩猩衍生的腺病毒(以及huAd5)具有明显的序列不相似性,生产了具有AdC1的衣壳特征的嵌合腺病毒载体。鉴于上述与仅制备六邻体改变相关的缺陷,在文中所述的嵌合体中进行更广泛的取代(即,构建取代超出了六邻体的嵌合体)来实现两个目标。第一个目标是确定制造广泛的取代是否能获取否则不易获取的含有不相关血清型的六邻体的病毒。第二个目标是测试在我们实验室中发现的能为生产目的生长至高滴度的腺病毒载体(例如AdPan5)的生长特征是否也存在于嵌合病毒中,特别是当六邻体(和其它衣壳蛋白)衍生自难以在诸如HEK293的细胞系中生长至高产量的病毒(例如AdC1)。附加包括尾丝蛋白在内的广泛取代的优点在于进一步增加抗原不相似性超过仅用六邻体改变提供的抗原不相似性。
我们使用得自感染细胞(“Hirt prep”)的病毒DNA的克隆限制性片段作为获得腺病毒DNA测序来源的纯化抗体的替代物。我们以这种方法测序的第一种腺病毒是猿腺病毒。猿腺病毒的EcoRI消化产生了7个片段。鸟枪法克隆得到被克隆和测序的5个内部片段的克隆。通过朝基因组的每个末端步查完成测序。基因组图示于图1。
A.构建两个Pan5/C1嵌合质粒所有构建嵌合病毒的方法均是首先要将完全E1删除病毒DNA装配入单一质粒,其两翼是限制性内切酶SwaI的识别位点,然后用SwaI消化质粒DNA来释放病毒DNA末端,并将DNA转染进HEK293细胞来确定是否可获取可存活的嵌合腺病毒。构建了两种嵌合病毒质粒,p5C1短和p5C1长。
质粒p5C1短含有E1删除的Pan5病毒,其内部15226bp片段(18332-33557)被来自AdC1的功能性类似物14127bp(18531-32657)取代。这导致Pan5蛋白六邻体、内切蛋白酶、DNA结合蛋白、100kD支架蛋白、33kD蛋白、蛋白VIII和尾丝以及整个E3区域被来自AdC 1的类似片段取代。AdC1片段的左端的ClaI位点在六邻体基因的起始位置并且得到的蛋白相同于C1六邻体。构成AdC1片段的右端的EcoRI位点在AdC1的E4orf 7部分内。右端连接于PCR产生的来自AdPan5的右端片段,以致产生的orf 7-翻译产物嵌合在AdPan5和AdC1之间。
p5C1长含有E1删除的Pan5病毒,其内部25603bp片段(7955-33557)被来自AdC1的功能性类似物24712bp(7946-32657)取代。这导致除了在p5C1短中取代的那些以外,Pan5前末端蛋白、52/55kD蛋白、五邻体基础蛋白、蛋白VII、Mu和蛋白VI被来自AdC1的类似物取代。AdC1片段的左端的AscI位点在DNA聚合酶基因的起始位置并且得到AdPan5 DNA聚合酶的最初165个氨基酸被来自AdC1 DNA聚合酶的167个氨基酸片段取代的嵌合蛋白。在该N末端区域,AdPan5和AdC1 DNA聚合酶之间的同源性是81%(72%同一性)。
含有AdPan5的左端的质粒pDVP5Mlu用作嵌合载体构建的起始质粒。
质粒pDVP5Mlu按以下步骤制备。含有限制性内切酶SmaI、MluI、EcoRI和EcoRV各自的识别位点的合成DNA片段连接进用EcoRI和NdeI消化的pBR322以保留复制起点和β-内酰胺酶基因。延伸至MluI位点的Pan5左端(15135bp)克隆进该质粒的SmaI和MluI位点之间。E1基因被功能性删除并且被含有极端罕见的切割限制性内切酶位点(I-CeuI和PI-SceI)的识别位点的DNA片段取代。Pan-5的右端的2904个碱基对使用引物P5L[GCG CAC GCG TCTCTA TCG ATG AAT TCC ATT GGT GAT GGA CAT GC,SEQ ID NO7]和P5ITR[GCG CAT TTA AAT CAT CAT CAA TAA TAT ACC TCA AAC,SEQ IDNO8]和Tgo聚合酶(Roche)进行PCR扩增。用MluI和SwaI切割PCR产物并在pDVP5Mlu的MluI和EcoRV之间克隆来产生pPan5Mlu+RE。然后将从MluI位点(15135)延伸至Pan5的ClaI(18328)位点的3193bp片段插入pPan5Mlu+RE的相同位点之间来产生pPan5Cla+RE。腺病毒C1的3671bp的ClaI(18531)到EcoRI(22202)片段克隆进ClaI(16111)和EcoRI(16116)之间的pPan5Cla+RE来产生pPan5C1delRI。腺病毒C1(22202-32653)的10452bp内部片段克隆进pPan5C1delRI的EcoRI位点来产生p5C1短。为了构建p5C1长,通过用AdC1AscI-ClaI 10591bp片段取代p5C1短中的AdPan5的AscI-ClaI 10379bp片段以进一步扩大AdC1的取代。最后,绿色荧光蛋白(GFP)表达盒插入I-CeuI和PI-SceI位点之间的p5C1短和p5C1长来分别产生p5C1短GFP和p5C1长GFP。
B.拯救嵌合Pan5/C1重组载体腺病毒用限制性内切酶SwaI消化质粒p5C1短GFP和p5C1长GFP并转染进HEK293细胞。观察到典型的腺病毒诱导的细胞病变作用。通过从转染物和发现由GFP表达确定被转导的再次感染的新鲜细胞中收集上清液来确认从p5C1长GFP转染物中拯救重组嵌合腺病毒。制备自嵌合重组病毒的病毒DNA用几种限制性内切酶消化并发现具有预计的电泳模式(数据未显示)。
具有更短取代的p5C1短的嵌合腺病毒构建物编码C1蛋白六邻体和尾丝以及内切蛋白酶、DNA结合蛋白、100kDa支架蛋白、33kDa蛋白和蛋白VIII的间插开放读框。(E3区域也包括在该区域内,但不可能影响嵌合病毒的存活)。当取代扩大为包括额外的AdC1蛋白pTP(前-末端蛋白)、52/55kDa蛋白、五邻体基底(penton base)、蛋白VII、Mu和蛋白VI时,不难拯救可存活的嵌合病毒。在该实验中,嵌合腺病毒构建策略利用分别存在于AdPan5和AdC1上的DNA聚合酶和六邻体基因上的AscI和ClaI限制性内切酶位点的存在。
嵌合病毒比野生型AdC1病毒的产量高的原因尚不清楚。5C1嵌合病毒在293细胞内的生长期间,E1和E4的腺病毒早期区域基因产物分别来源于Ad5和AdPan5。E1和E4基因产物结合、调节和去抑制几种细胞转录复合物并协调它们的病毒增殖活性。因此,来自293细胞的以反式提供的E1基因产物和来自AdPan5的E4基因产物在人293细胞背景中可能优于等价的AdC1基因产物。这也可应用于主要后期启动子的活性,其活性引起衣壳蛋白基因的转录。在嵌合病毒中,主要的后期启动子和反式激活它的蛋白Iva2来源于AdPan5。然而,腺病毒DNA复制所需的E2基因产物与pTP和单链DNA结合蛋白来源于AdC1。与pTP复合的腺病毒DNA聚合酶嵌合在Ad5C1中,但大多数是AdPan5衍生的。
实施例2-构建Ad5嵌合猿病毒使用来源于黑猩猩腺病毒Pan7的结构蛋白和来源于人Ad5(通常使用的载体株)的两侧的序列来构建质粒。拯救Adhu5-Pan7嵌合腺病毒,这说明用于衍生嵌合病毒的嵌合病毒构建方法可广泛应用。
A.Ad5-Pan 7嵌合腺病毒的构建构建含有完全(E1缺失)嵌合基因组的质粒以确定嵌合腺病毒是可存活的,然后将该质粒转染进E1互补细胞系HEK293。发现可拯救重组病毒。构建的嵌合腺病毒基因组由来源于给予ITR的Ad5的左端片段、含有转基因表达盒的E1缺失区域、pIX和IVa2基因以及聚合酶基因的954个C末端氨基酸(以从右至左的方向从底链转录)组成。Ad5也给予含有E4基因和右侧ITR的嵌合基因组的右端。存在于嵌合构建物中心部分的所有其它基因来源于黑猩猩腺病毒Pan7,包括嵌合DNA聚合酶的N末端235个氨基酸。
为构建含有完全(E1缺失)嵌合基因组的质粒,起始质粒是由以下3部分组成的pBRAd5lere来源于质粒pBR322的细菌复制起点和氨苄青霉素抗性基因;Ad5衍生的E1缺失载体的左端,即从左侧ITR延伸至位于野生型Ad5基因组的碱基对编号5782的StuI位点(E1缺失从野生型Ad5基因组的碱基对342延伸至3533);Ad5的右端从位于野生型Ad5基因组的碱基对编号31954的StuI位点延伸至右侧ITR的右端。毗连于两个ITR的PacI位点用于从细菌质粒骨架中释放Ad5基因组。位于代替E1缺失的含有I-CeuI和PI-SceI位点的片段用于插入转基因盒。
合成的DNA寡聚物插入于含有AscI、XbaI和EcoRI位点的StuI位点,从而通过使用PCR产生质粒pAd5endsAscRI。Ad5聚合酶基因延伸至野生型Ad5基因组的碱基对#8068,并通过下述聚合酶基因(从底链翻译)的沉默诱变在此位置掺入新生成的AscI位点。
原始序列GCG ACG GGC CGA[SEQ ID NO16]CGC TGC CCG GCTArg Arg Ala Ser[SEQ ID NO17]突变序列(带下划线的是AscI识别位点)GCG GCG CGC CGA[SEQ ID NO18]CGC TGC CCG GCTArg Arg Ala Ser[SEQ ID NO17]含有Pan7尾丝的区域通过PCR(使尾丝终止密码子从TGA突变至TAA来提供类似于Ad5中的聚腺苷酸化信号)扩增并插入EcoRI位点来产生pAd5endsP7fib。几种克隆步骤构建了pH5C7H5,藉此装配完整的嵌合腺病毒基因组。表达GFP(绿色荧光蛋白)的转基因盒插入pH5C7H5的I-CeuI和PI-SceI位点之间。用PacI消化最终的构建物将腺病毒基因组从质粒骨架中分离出并转染进HEK293细胞。两周后收集细胞裂解物,并通过标准方法扩增和纯化嵌合腺病毒。
B.Ad5-猿病毒25(SV-25)嵌合腺病毒的构建[N.B.猿病毒25(ATCC目录号VR-201)不同于黑猩猩腺病毒猿腺病毒25(ATCC目录号VR-594)]左右端片段来源于Ad5并且中心部分来源于猴腺病毒SV-25的基于Ad5的嵌合腺病毒的构建方式完全类似于上述用于嵌合在Ad5和黑猩猩腺病毒Pan7之间的上述嵌合腺病毒的方式。因此,构建的嵌合腺病毒基因组由来源于给予ITR的Ad5的左端片段、含有转基因表达盒的E1缺失区域、pIX和IVa2基因以及聚合酶基因的956个C末端氨基酸组成。Ad5也给予了含有E4基因和右侧ITR的嵌合基因组的右端。[此外,Ad5基因组的左端延伸超出在pH5C7H5中存在的,以致存在Ad5左端的454个碱基对。虽然不是绝对必需的,这样做是为提高包装效率。存在于嵌合构建物中部的所有基因均来源于猴腺病毒SV-25,包括嵌合DNA聚合酶的N末端230个氨基酸。构建嵌合基因组的起始质粒是pAd5endsAscRI,该质粒含有Ad5的左右端以及在聚合酶基因中产生(通过沉默诱变)的AscI位点,藉此制备了Ad5-SV25嵌合融合体(如同为Ad5-Pan 7嵌合腺病毒所做的)。在最终构建物pH5S25H5中,SV25基因组片段通过顺序克隆步骤掺入,包括在聚合酶编码序列内的连接接头处产生AscI位点。表达GFP(绿色荧光蛋白)的转基因盒插入pH5S25H5的I-CeuI和PI-SceI位点之间。用PacI消化最终的构建物将腺病毒基因组从质粒骨架中分离出并转染进HEK 293细胞。两周后收集细胞裂解物,并通过标准方法扩增与纯化嵌合腺病毒。
图2提供了重组Adhu5-SV25嵌合病毒的图谱。显示了被来自Pan7的DNA取代的基因组部分。
实施例3-作为免疫原性组合物的传递载体的本发明的Pan5-C1嵌合载体为测试载体C5C1C5-CMVGP作为疫苗的效力,构建表达埃博拉病毒(扎伊尔)糖蛋白(C5C1C5-CMVGP)的Pan5(猿腺病毒22,E亚群腺病毒,也称为C5)-C1(猿腺病毒21,B亚群腺病毒)嵌合体作为模型抗原;该载体与基于Adhu5的载体(H5-CMVGP)进行比较。与H5-CMVGP相比,C5C1-CMVGP载体在转导的A549细胞中产生的GP表达水平仅有微弱降低。
此后,比较了用5×1010H5-CMVGP或C5C1-CMVGP载体肌肉内接种疫苗在B10BR小鼠中引发的GP-特异性T细胞和B细胞应答。
相比于H5-CMVGP载体,通过使用H-2k限制性GP-特异性肽作为刺激物的胞内细胞因子染色确定C5C1C5-CMVGP载体似乎诱导动力学较慢的较低频率的产生γ干扰素的CD8+T细胞。在用C5C1C5-CMVGP或H5-CMVGP载体接种疫苗的小鼠的血清中,通过ELISA测定对GP的总IgG应答相等。然而,C5C1C5-CMVGP载体诱导更强的Th1型应答而H5-CMVGP载体刺激更平衡的Th1/Th2型应答。在存活研究中,小鼠按上述接种疫苗并于28天后用200LD/50小鼠适用的埃博拉扎伊尔病毒侵袭。两组中均观察到100%存活。
实施例4-产生嵌合Pan6/Pan7载体制备一组GFP表达载体。该组包括嵌合在Pan6和Pan7之间的载体,其中(a)Pan7的六邻体蛋白被Pan6的所取代(称为C767),(b)Pan7的尾丝蛋白被Pan6的所取代(称为C776),(c)Pan7载体的六邻体和尾丝蛋白被Pan6的所取代(称为C766)。
称为C767的嵌合病毒基本上如实施例1中所述用于C5C1C5病毒的方式构建。然而,由于Pan6和Pan7序列的5’到六邻体序列之间的同源性,无需取代五邻体与pol基因之间的基因组的5’端。
嵌合载体C767与每种表达GFP的C776、C766、亲代C6和亲代C7比较。
Balb/C小鼠(每组25只)肌肉内免疫接种Pan6或Pan7(1010个颗粒)。3周后使用5种GEP表达载体(C6-GFP、C7-GFP和3种嵌合载体)中的每种进行再施用(通过尾部静脉注射1011个颗粒i.v.)。3天后,通过检测肝脏切片中GFP表达的存在定性地估计肝脏转导的水平和通过Taqman分析估计GFP DNA的拷贝来定量。施用两种黑猩猩腺病毒载体中的任一种不影响另一种载体的转导效率,但严重影响了相同载体的再施用。数据显示对六邻体和尾丝的抗体在防止腺病毒载体的再施用中是重要的。
与优先权文件,2004年3月28日提交的美国专利申请60/575,429;2004年4月28日提交的美国专利申请号60/566,212和2003年6月20日提交的美国专利申请号10/465,302一样,所有本说明书中引用的出版物均引为参考。尽管参考具体优选的实施方案描述了本发明,应该理解的是可对本发明做出改进而不脱离其精神。这种改进属于附加的权利要求的范围内。
序列表<110>宾夕法尼亚州立大学托管会(The Trustees of the University of Pennsylvania)S.罗伊(Roy,Soumitra)J.M.威尔森(Wilson,James M.)<120>产生嵌合腺病毒的方法及这种嵌合腺病毒的用途<130>UPN-P3067PCT<150>US 10/465,302<151>2003-06-20<150>US 60/566,212<151>2004-04-28<150>US 60/575,429<151>2004-05-28<160>18<170>PatentIn version 3.2<210>1<211>36462<212>DNA<213>黑猩猩腺病毒血清型Pan5<400>1catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg aggtatttga 60atttggggat gcggggcggt gattggctgc gggagcggcg accgttaggg gcggggcggg120tgacgttttg atgacgtggc cgtgaggcgg agccggtttg caagttctcg tgggaaaagt180gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca240ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg300aatgaggaag tgaaaatctg agtaattccg cgtttatggc agggaggagt atttgccgag360ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat420ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggt gtcagctgat cgccagggta480tttaaacctg cgctctctag tcaagaggcc actcttgagt gccagcgagt agagttttct540cctccgcgcc gcgagtcaga tctacacttt gaaagatgag gcacctgaga gacctgcccg600gtaatgtttt cctggctact gggaacgaga ttctggaact ggtggtggac gccatgatgg660gtgacgaccc tccggagccc cctaccccat ttgaagcgcc ttcgctgtac gatttgtatg720atctggaggt ggatgtgccc gagaacgacc ccaacgagga ggcggtgaat gatttgttta780gcgatgccgc gctgctggct gccgagcagg ctaatacgga ctctggctca gacagcgatt840cctctctcca taccccgaga cccggcagag gtgagaaaaa gatccccgag cttaaagggg900aagagctcga cctgcgctgc tatgaggaat gcttgcctcc gagcgatgat gaggaggacg960aggaggcgat tcgagctgca gcgaaccagg gagtgaaaac agcgagcgag ggctttagcc 1020tggactgtcc tactctgccc ggacacggct gtaagtcttg tgaatttcat cgcatgaata 1080
ctggagataa gaatgtgatg tgtgccctgt gctatatgag agcttacaac cattgtgttt1140acagtaagtg tgattaactt tagctgggga ggcagagggt gactgggtgc tgactggttt1200atttatgtat atgtttttta tgtgtaggtc ccgtctctga cgtagatgag acccccacta1260cagagtgcat ttcatcaccc ccagaaattg gcgaggaacc gcccgaagat attattcata1320gaccagttgc agtgagagtc accgggcgta gagcagctgt ggagagtttg gatgacttgc1380tacagggtgg ggatgaacct ttggacttgt gtacccggaa acgccccagg cactaagtgc1440cacacatgtg tgtttactta aggtgatgtc agtatttata gggtgtggag tgcaataaaa1500tccgtgttga ctttaagtgc gtggtttatg actcaggggt ggggactgtg ggtatataag1560caggtgcaga cctgtgtggt cagttcagag caggactcat ggagatctgg acagtcttgg1620aagactttca ccagactaga cagctgctag agaactcatc ggagggagtc tcttacctgt1680ggagattctg cttcggtggg cctctagcta agctagtcta tagggccaag caggattata1740aggatcaatt tgaggatatt ttgagagagt gtcctggtat ttttgactct ctcaacttgg1800gccatcagtc tcactttaac cagagtattc tgagagccct tgacttttct actcctggca1860gaactaccgc cgcggtagcc ttttttgcct ttatccttga caaatggagt caagaaaccc1920atttcagcag ggattaccgt ctggactgct tagcagtagc tttgtggaga acatggaggt1980gccagcgcct gaatgcaatc tccggctact tgccagtaca gccggtagac acgctgagga2040tcctgagtct ccagtcaccc caggaacacc aacgccgcca gcagccgcag caggagcagc2100agcaagagga ggaccgagaa gagaacctga gagccggtct ggaccctccg gtggcggagg2160aggaggagta gctgacttgt ttcccgagct gcgccgggtg ctgactaggt cttccagtgg2220acgggagagg gggattaagc gggagaggca tgaggagact agccacagaa ctgaactgac2280tgtcagtctg atgagtcgca ggcgcccaga atcggtgtgg tggcatgagg tgcagtcgca2340ggggatagat gaggtctcag tgatgcatga gaaatattcc ctagaacaag tcaagacttg2400ttggttggag cccgaggatg attgggaggt agccatcagg aattatgcca agctggctct2460gaggccagac aagaagtaca agattaccaa actgattaat atcagaaatt cctgctacat2520ttcagggaat ggggccgagg tggagatcag tacccaggag agggtggcct tcagatgctg2580catgatgaat atgtacccgg gggtggtggg catggaggga gtcaccttta tgaacgcgag2640gttcaggggt gatgggtata atggggtggt ctttatggcc aacaccaagc tgacagtgca2700cggatgctcc ttctttggct tcaataacat gtgcattgag gcctggggca gtgtttcagt2760gaggggatgc agtttttcag ccaactggat gggggtcgtg ggcagaacca agagcatggt2820gtcagtgaag aaatgcctgt tcgagaggtg ccacctgggg gtgatgagcg agggcgaagc2880caaagtcaaa cactgcgcct ctaccgagac gggctgcttt gtactgatca agggcaatgc2940caaagtcaag cataatatga tctgtggggc ctcggatgag cgcggctacc agatgctgac3000ctgcgccggt gggaacagcc atatgctagc caccgtgcat gtggcctcgc acccccgcaa3060gacatggccc gagttcgagc acaacgtcat gacccgctgc aatgtgcacc tggggtcccg3120ccgaggcatg ttcatgccct accagtgcaa catgcaattt gtgaaggtgc tgctggagcc3180cgatgccatg tccagagtga gcctgacggg ggtgtttgac atgaatgtgg agctgtggaa3240aattctgaga tatgatgaat ccaagaccag gtgccgggcc tgcgaatgcg gaggcaagca3300cgccaggctt cagcccgtgt gtgtggaggt gacggaggac ctgcgacccg atcatttggt3360gttgtcctgc aacgggacgg agttcggctc cagcggggaa gaatctgact agagtgagta3420gtgtttggga ctgggtggga gcctgcatga tgggcagaat gactaaaatc tgtgtttttc3480tgcgcagcag catgagcgga agcgcctcct ttgagggagg ggtattcagc ccttatctga3540cggggcgtct cccctcctgg gcgggagtgc gtcagaatgt gatgggatcc acggtggacg3600gccggcccgt gcagcccgcg aactcttcaa ccctgaccta cgcgaccctg agctcctcgt3660ccgtggacgc agctgccgcc gcagctgctg cttccgccgc cagcgccgtg cgcggaatgg3720ccctgggcgc cggctactac agctctctgg tggccaactc gagttccacc aataatcccg3780ccagcctgaa cgaggagaag ctgctgctgc tgatggccca gctcgaggcc ctgacccagc3840
gcctgggcga gctgacccag caggtggctc agctgcaggc ggagacgcgg gccgcggttg3900ccacggtgaa aaccaaataa aaaatgaatc aataaataaa cggagacggt tgttgatttt3960aacacagagt cttgaatctt tatttgattt ttcgcgcgcg gtaggccctg gaccaccggt4020ctcgatcatt gagcacccgg tggatctttt ccaggacccg gtagaggtgg gcttggatgt4080tgaggtacat gggcatgagc ccgtcccggg ggtggaggta gctccattgc agggcctcgt4140gctcgggggt ggtgttgtaa atcacccagt catagcaggg gcgcagggcg tggtgctgca4200cgatgtcctt gaggaggaga ctgatggcca cgggcagccc cttggtgtag gtgttgacga4260acctgttgag ctgggaggga tgcatgcggg gggagatgag atgcatcttg gcctggatct4320tgagattggc gatgttcccg cccagatccc gccgggggtt catgttgtgc aggaccacca4380gcacggtgta tccggtgcac ttggggaatt tgtcatgcaa cttggaaggg aaggcgtgaa4440agaatttgga gacgcccttg tgaccgccca ggttttccat gcactcatcc atgatgatgg4500cgatgggccc gtgggcggcg gcttgggcaa agacgtttcg ggggtcggac acatcgtagt4560tgtggtcctg ggtgagctcg tcataggcca ttttaatgaa tttggggcgg agggtgcccg4620actgggggac gaaggtgccc tcgatcccgg gggcgtagtt gccctcgcag atctgcatct4680cccaggcctt gagctcggag ggggggatca tgtccacctg cggggcgatg aaaaaaacgg4740tttccggggc gggggagatg agctgggccg aaagcaggtt ccggagcagc tgggacttgc4800cgcagccggt ggggccgtag atgaccccga tgaccggctg caggtggtag ttgagggaga4860gacagctgcc gtcctcgcgg aggagggggg ccacctcgtt catcatctcg cgcacatgca4920tgttctcgcg cacgagttcc gccaggaggc gctcgccccc aagcgagagg agctcttgca4980gcgaggcgaa gtttttcagc ggcttgagcc cgtcggccat gggcattttg gagagggtct5040gttgcaagag ttccagacgg tcccagagct cggtgatgtg ctctagggca tctcgatcca5100gcagacctcc tcgtttcgcg ggttggggcg actgcgggag tagggcacca ggcgatgggc5160gtccagcgag gccagggtcc ggtccttcca ggggcgcagg gtccgcgtca gcgtggtctc5220cgtcacggtg aaggggtgcg cgccgggctg ggcgcttgcg agggtgcgct tcaggctcat5280ccggctggtc gagaaccgct cccggtcggc gccctgcgcg tcggccaggt agcaattgag5340catgagttcg tagttgagcg cctcggccgc gtggcccttg gcgcggagct tacctttgga5400agtgtgtccg cagacgggac agaggaggga cttgagggcg tagagcttgg gggcgaggaa5460gacggactcg ggggcgtagg cgtccgcgcc gcagctggcg cagacggtct cgcactccac5520gagccaggtg aggtctggcc ggtcggggtc aaaaacgagg tttcctccgt gctttttgat5580gcgtttctta cctctggtct ccatgagctc gtgtccccgc tgggtgacaa agaggctgtc5640cgtgtccccg tagaccgact ttatgggccg gtcctcgagc ggggtgccgc ggtcctcgtc5700gtagaggaac cccgcccact ccgagacgaa ggcccgggtc caggccagca cgaaggaggc5760cacgtgggag gggtagcggt cgttgtccac cagcgggtcc accttctcca gggtatgcaa5820gcacatgtcc ccctcgtcca catccaggaa ggtgattggc ttgtaagtgt aggccacgtg5880accgggggtc ccggccgggg gggtataaaa gggggcgggc ccctgctcgt cctcactgtc5940ttccggatcg ctgtccagga gcgccagctg ttggggtagg tattccctct cgaaggcggg6000catgacctcg gcactcaggt tgtcagtttc tagaaacgag gaggatttga tattgacggt6060gccgttggag acgcctttca tgagcccctc gtccatctgg tcagaaaaga cgatcttttt6120gttgtcgagc ttggtggcga aggagccgta gagggcgttg gagagcagct tggcgatgga6180gcgcatggtc tggttctttt ccttgtcggc gcgctccttg gcggcgatgt tgagctgcac6240gtactcgcgc gccacgcact tccattcggg gaagacggtg gtgagcttgt cgggcacgat6300tctgacccgc cagccgcggt tgtgcagggt gatgaggtcc acgctggtgg ccacctcgcc6360gcgcaggggc tcgttggtcc agcagaggcg cccgcccttg cgcgagcaga aggggggcag6420cgggtccagc atgagctcgt cgggggggtc ggcgtccacg gtgaagatgc cgggcaggag6480ctcggggtcg aagtagctga tgcaggtgcc cagatcgtcc agcgccgctt gccagtcgcg6540cacggccagc gcgcgctcgt aggggctgag gggcgtgccc cagggcatgg ggtgcgtgag6600
cgcggaggcg tacatgccgc agatgtcgta gacgtagagg ggctcctcga ggacgccgat6660gtaggtgggg tagcagcgcc ccccgcggat gctggcgcgc acgtagtcgt acagctcgtg6720cgagggcgcg aggagcccgg tgccgaggtt ggagcgctgc ggcttttcgg cgcggtagac6780gatctggcgg aagatggcgt gggagttgga ggagatggtg ggcctctgga agatgttgaa6840gtgggcgtgg ggcagtccga ccgagtccct gatgaagtgg gcgtaggagt cctgcagctt6900ggcgacgagc tcggcggtga cgaggacgtc cagggcgcag tagtcgaggg tctcttggat6960gatgtcgtac ttgagctggc ccttctgctt ccacagctcg cggttgagaa ggaactcttc7020gcggtccttc cagtactctt cgagggggaa cccgtcctga tcggcacggt aagagcccac7080catgtagaac tggttgacgg ccttgtaggc gcagcagccc ttctccacgg ggagggcgta7140agcttgcgcg gccttgcgca gggaggtgtg ggtgagggcg aaggtgtcgc gcaccatgac7200cttgaggaac tggtgcttga agtcgaggtc gtcgcagccg ccctgctccc agagctggaa7260gtccgtgcgc ttcttgtagg cggggttggg caaagcgaaa gtaacatcgt tgaagaggat7320cttgcccgcg cggggcatga agttgcgagt gatgcggaaa ggctggggca cctcggcccg7380gttgttgatg acctgggcgg cgaggacgat ctcgtcgaag ccgttgatgt tgtgcccgac7440gatgtagagt tccacgaatc gcgggcggcc cttgacgtgg ggcagcttct tgagctcgtc7500gtaggtgagc tcggcggggt cgctgaggcc gtgctgctcg agggcccagt cggcgaggtg7560ggggttggcg ccgaggaagg aagtccagag atccacggcc agggcggtct gcaagcggtc7620ccggtactga cggaactgct ggcccacggc cattttttcg ggggtgacgc agtagaaggt7680gcgggggtcg ccgtgccagc ggtcccactt gagctggagg gcgaggtcgt gggcgagctc7740gacgagcggc gggtccccgg agagtttcat gaccagcatg aaggggacga gctgcttgcc7800gaaggacccc atccaggtgt aggtttccac gtcgtaggtg aggaagagcc tttcggtgcg7860aggatgcgag ccgatgggga agaactggat ctcctgccac cagttggagg aatggctgtt7920gatgtgatgg aagtagaaat gccgacggcg cgccgagcac tcgtgcttgt gtttatacaa7980gcgtccgcag tgctcgcaac gctgcacggg atgcacgtgc tgcacgagct gtacctgggt8040tcctttgacg aggaatttca gtgggcagtg gagcgctggc ggctgcatct ggtgctgtac8100tacgtcctgg ccatcggcgt ggccatcgtc tgcctcgatg gtggtcatgc tgacgaggcc8160gcgcgggagg caggtccaga cctcggctcg gacgggtcgg agagcgagga cgagggcgcg8220caggccggag ctgtccaggg tcctgagacg ctgcggagtc aggtcagtgg gcagcggcgg8280cgcgcggttg acttgcagga gcttttccag ggcgcgcggg aggtccagat ggtacttgat8340ctccacggcg ccgttggtgg cgacgtccac ggcttgcagg gtcccgtgcc cctggggcgc8400caccaccgtg ccccgtttct tcttgggtgc tggcggcggc ggctccatgc ttagaagcgg8460cggcgaggac gcgcgccggg cggcaggggc ggctcggggc ccggaggcag gggcggcagg8520ggcacgtcgg cgccgcgcgc gggcaggttc tggtactgcg cccggagaag actggcgtga8580gcgacgacgc gacggttgac gtcctggatc tgacgcctct gggtgaaggc cacgggaccc8640gtgagtttga acctgaaaga gagttcgaca gaatcaatct cggtatcgtt gacggcggcc8700tgccgcagga tctcttgcac gtcgcccgag ttgtcctggt aggcgatctc ggtcatgaac8760tgctcgatct cctcctcctg aaggtctccg cgaccggcgc gctcgacggt ggccgcgagg8820tcgttggaga tgcggcccat gagctgcgag aaggcgttca tgccggcctc gttccagacg8880cggctgtaga ccacggctcc gtcggggtcg cgcgcgcgca tgaccacctg ggcgaggttg8940agctcgacgt ggcgcgtgaa gaccgcgtag ttgcagaggc gctggtagag gtagttgagc9000gtggtggcga tgtgctcggt gacgaagaag tacatgatcc agcggcggag cggcatctcg9060ctgacgtcgc ccagggcttc caagcgctcc atggcctcgt agaagtccac ggcgaagttg9120aaaaactggg agttgcgcgc cgagacggtc aactcctcct ccagaagacg gatgagctcg9180gcgatggtgg cgcgcacctc gcgctcgaag gccccggggg gctcctcttc ttccatctcc9240tcctcctctt ccatctcctc cactaacatc tcttctactt cctcctcagg aggcggcggc9300gggggagggg ccctgcgtcg ccggcggcgc acgggcagac ggtcgatgaa gcgctcgatg9360
gtctccccgc gccggcgacg catggtctcg gtgacggcgc gcccgtcctc gcggggccgc 9420agcgtgaaga cgccgccgcg catctccagg tggccgccgg gggggtctcc gttgggcagg 9480gagagggcgc tgacgatgca tcttatcaat tggcccgtag ggactccgcg caaggacctg 9540agcgtctcga gatccacggg atccgaaaac cgctgaacga aggcttcgag ccagtcgcag 9600tcgcaaggta ggctgagccc ggtttcttgt tcttcgggta tttggtcggg aggcgggcgg 9660gcgatgctgc tggtgatgaa gttgaagtag gcggtcctga gacggcggat ggtggcgagg 9720agcaccaggt ccttgggccc ggcttgctgg atgcgcagac ggtcggccat gccccaggcg 9780tggtcctgac acctggcgag gtccttgtag tagtcctgca tgagccgctc cacgggcacc 9840tcctcctcgc ccgcgcggcc gtgcatgcgc gtgagcccga acccgcgctg cggctggacg 9900agcgccaggt cggcgacgac gcgctcggcg aggatggcct gctggatctg ggtgagggtg 9960gtctggaagt cgtcgaagtc gacgaagcgg tggtaggctc cggtgttgat ggtgtaggag10020cagttggcca tgacggacca gttgacggtc tggtggccgg ggcgcacgag ctcgtggtac10080ttgaggcgcg agtaggcgcg cgtgtcgaag atgtagtcgt tgcaggtgcg cacgaggtac10140tggtatccga cgaggaagtg cggcggcggc tggcggtaga gcggccatcg ctcggtggcg10200ggggcgccgg gcgcgaggtc ctcgagcatg aggcggtggt agccgtagat gtacctggac10260atccaggtga tgccggcggc ggtggtggag gcgcgcggga actcgcggac gcggttccag10320atgttgcgca gcggcaggaa gtagttcatg gtggccgcgg tctggcccgt gaggcgcgcg10380cagtcgtgga tgctctagac atacgggcaa aaacgaaagc ggtcagcggc tcgactccgt10440ggcctggagg ctaagcgaac gggttgggct gcgcgtgtac cccggttcga gtccctgctc10500gaatcaggct ggagccgcag ctaacgtggt actggcactc ccgtctcgac ccaagcctgc10560taacgaaacc tccaggatac ggaggcgggt cgttttggcc attttcgtca ggccggaaat10620gaaactagta agcgcggaaa gcggccgtcc gcgatggctc gctgccgtag tctggagaaa10680gaatcgccag ggttgcgttg cggtgtgccc cggttcgagc ctcagcgctc ggcgccggcc10740ggattccgcg gctaacgtgg gcgtggctgc cccgtcgttt ccaagacccc ttagccagcc10800gacttctcca gttacggagc gagcccctct ttttcttgtg tttttgccag atgcatcccg10860tactgcggca gatgcgcccc caccctccac cacaaccgcc cctaccgcag cagcagcaac10920agccggcgct tctgcccccg ccccagcagc agcagccagc cactaccgcg gcggccgccg10980tgagcggagc cggcgttcag tatgacctgg ccttggaaga gggcgagggg ctggcgcggc11040tgggggcgtc gtcgccggag cggcacccgc gcgtgcagat gaaaagggac gctcgcgagg11100cctacgtgcc caagcagaac ctgttcagag acaggagcgg cgaggagccc gaggagatgc11160gcgcctcccg cttccacgcg gggcgggagc tgcggcgcgg cctggaccga aagcgggtgc11220tgagggacga ggatttcgag gcggacgagc tgacggggat cagccccgcg cgcgcgcacg11280tggccgcggc caacctggtc acggcgtacg agcagaccgt gaaggaggag agcaacttcc11340aaaaatcctt caacaaccac gtgcgcacgc tgatcgcgcg cgaggaggtg accctgggcc11400tgatgcacct gtgggacctg ctggaggcca tcgtgcagaa ccccacgagc aagccgctga11460cggcgcagct gtttctggtg gtgcagcaca gtcgggacaa cgagacgttc agggaggcgc11520tgctgaatat caccgagccc gagggccgct ggctcctgga cctggtgaac attctgcaga11580gcatcgtggt gcaggagcgc gggctgccgc tgtccgagaa gctggcggcc atcaacttct11640cggtgctgag cctgggcaag tactacgcta ggaagatcta caagaccccg tacgtgccca11700tagacaagga ggtgaagatc gacgggtttt acatgcgcat gaccctgaaa gtgctgaccc11760tgagcgacga tctgggggtg taccgcaacg acaggatgca ccgcgcggtg agcgccagcc11820gccggcgcga gctgagcgac caggagctga tgcacagcct gcagcgggcc ctgaccgggg11880ccgggaccga gggggagagc tactttgaca tgggcgcgga cctgcgctgg cagcctagcc11940gccgggcctt ggaagctgcc ggcggttccc cctacgtgga ggaggtggac gatgaggagg12000aggagggcga gtacctggaa gactgatggc gcgaccgtat ttttgctaga tgcagcaaca12060gccaccgccg cctcctgatc ccgcgatgcg ggcggcgctg cagagccagc cgtccggcat12120
taactcctcg gacgattgga cccaggccat gcaacgcatc atggcgctga cgacccgcaa12180tcccgaagcc tttagacagc agcctcaggc caaccgactc tcggccatcc tggaggccgt12240ggtgccctcg cgctcgaacc ccacgcacga gaaggtgctg gccatcgtga acgcgctggt12300ggagaacaag gccatccgcg gcgacgaggc cgggctggtg tacaacgcgc tgctggagcg12360cgtggcccgc tacaacagca ccaacgtgca gacgaacctg gaccgcatgg tgaccgacgt12420gcgcgaggcg gtgtcgcagc gcgagcggtt ccaccgcgag tcgaacctgg gctccatggt12480ggcgctgaac gccttcctga gcacgcagcc cgccaacgtg ccccggggcc aggaggacta12540caccaacttc atcagcgcgc tgcggctgat ggtggccgag gtgccccaga gcgaggtgta12600ccagtcgggg ccggactact tcttccagac cagtcgccag ggcttgcaga ccgtgaacct12660gagccaggct ttcaagaact tgcagggact gtggggcgtg caggccccgg tcggggaccg12720cgcgacggtg tcgagcctgc tgacgccgaa ctcgcgcctg ctgctgctgc tggtggcgcc12780cttcacggac agcggcagcg tgagccgcga ctcgtacctg ggctacctgc ttaacctgta12840ccgcgaggcc atcgggcagg cgcacgtgga cgagcagacc taccaggaga tcacccacgt12900gagccgcgcg ctgggccagg aggacccggg caacctggag gccaccctga acttcctgct12960gaccaaccgg tcgcagaaga tcccgcccca gtacgcgctg agcaccgagg aggagcgcat13020cctgcgctac gtgcagcaga gcgtggggct gttcctgatg caggaggggg ccacgcccag13080cgccgcgctc gacatgaccg cgcgcaacat ggagcccagc atgtacgccc gcaaccgccc13140gttcatcaat aagctgatgg actacttgca tcgggcggcc gccatgaact cggactactt13200taccaacgcc atcttgaacc cgcactggct cccgccgccc gggttctaca cgggcgagta13260cgacatgccc gaccccaacg acgggttcct gtgggacgac gtggacagca gcgtgttctc13320gccgcgcccc accaccacca ccgtgtggaa gaaagagggc ggggaccggc ggccgtcctc13380ggcgctgtcc ggtcgcgcgg gtgctgccgc ggcggtgccc gaggccgcca gccccttccc13440gagcctgccc ttttcgctga acagcgtgcg cagcagcgag ctgggtcggc tgacgcggcc13500gcgcctgctg ggcgaggagg agtacctgaa cgactccttg cttcggcccg agcgcgagaa13560gaacttcccc aataacggga tagagagcct ggtggacaag atgagccgct ggaagacgta13620cgcgcacgag cacagggacg agccccgagc tagcagcagc accggcgcca cccgtagacg13680ccagcggcac gacaggcagc ggggtctggt gtgggacgat gaggattccg ccgacgacag13740cagcgtgttg gacttgggtg ggagtggtgg tggtaacccg ttcgctcacc tgcgcccccg13800tatcgggcgc ctgatgtaag aatctgaaaa aataaaagac ggtactcacc aaggccatgg13860cgaccagcgt gcgttcttct ctgttgtttg tagtagtatg atgaggcgcg tgtacccgga13920gggtcctcct ccctcgtacg agagcgtgat gcagcaggcg gtggcggcgg cgatgcagcc13980cccgctggag gcgccttacg tgcccccgcg gtacctggcg cctacggagg ggcggaacag14040cattcgttac tcggagctgg cacccttgta cgataccacc cggttgtacc tggtggacaa14100caagtcggcg gacatcgcct cgctgaacta ccagaacgac cacagcaact tcctgaccac14160cgtggtgcag aacaacgatt tcacccccac ggaggccagc acccagacca tcaactttga14220cgagcgctcg cggtggggcg gccagctgaa aaccatcatg cacaccaaca tgcccaacgt14280gaacgagttc atgtacagca acaagttcaa ggcgcgggtg atggtctcgc gcaagacccc14340caacggggtc acagtaacag atggtagtca ggacgagctg acctacgagt gggtggagtt14400tgagctgccc gagggcaact tctcggtgac catgaccatc gatctgatga acaacgccat14460catcgacaac tacttggcgg tggggcggca gaacggggtg ctggagagcg acatcggcgt14520gaagttcgac acgcgcaact tccggctggg ctgggacccc gtgaccgagc tggtgatgcc14580gggcgtgtac accaacgagg ccttccaccc cgacatcgtc ctgctgcccg gctgcggcgt14640ggacttcacc gagagccgcc tcagcaacct gctgggcatc cgcaagcggc agcccttcca14700ggagggcttc cagatcctgt acgaggacct ggaggggggc aacatccccg cgctgctgga14760cgtggacgcc tacgagaaaa gcaaggagga tagcgccgcc gcggcgaccg cagccgtggc14820caccgcctct accgaggtgc ggggcgataa ttttgctagc gccgcgacac tggcagcggc14880
cgaggcggct gaaaccgaaa gtaagatagt gatccagccg gtggagaagg acagcaagga14940gaggagctac aacgtgctcg cggacaagaa aaacaccgcc taccgcagct ggtacctggc15000ctacaactac ggcgaccccg agaagggcgt gcgctcctgg acgctgctca ccacctcgga15060cgtcacctgc ggcgtggagc aagtctactg gtcgctgccc gacatgatgc aagacccggt15120caccttccgc tccacgcgtc aagttagcaa ctacccggtg gtgggcgccg agctcctgcc15180cgtctactcc aagagcttct tcaacgagca ggccgtctac tcgcagcagc tgcgcgcctt15240cacctcgctc acgcacgtct tcaaccgctt ccccgagaac cagatcctcg ttcgcccgcc15300cgcgcccacc attaccaccg tcagtgaaaa cgttcctgct ctcacagatc acgggaccct15360gccgctgcgc agcagtatcc ggggagtcca gcgcgtgacc gtcactgacg ccagacgccg15420cacctgcccc tacgtctaca aggccctggg cgtagtcgcg ccgcgcgtcc tctcgagccg15480caccttctaa aaaatgtcca ttctcatctc gcccagtaat aacaccggtt ggggcctgcg15540cgcgcccagc aagatgtacg gaggcgctcg ccaacgctcc acgcaacacc ccgtgcgcgt15600gcgcgggcac ttccgcgctc cctggggcgc cctcaagggc cgcgtgcgct cgcgcaccac15660cgtcgacgac gtgatcgacc aggtggtggc cgacgcgcgc aactacacgc ccgccgccgc15720gcccgtctcc accgtggacg ccgtcatcga cagcgtggtg gccgacgcgc gccggtacgc15780ccgcgccaag agccggcggc ggcgcatcgc ccggcggcac cggagcaccc ccgccatgcg15840cgcggcgcga gccttgctgc gcagggccag gcgcacggga cgcagggcca tgctcagggc15900ggccagacgc gcggcctccg gcagcagcag cgccggcagg acccgcagac gcgcggccac15960ggcggcggcg gcggccatcg ccagcatgtc ccgcccgcgg cgcggcaacg tgtactgggt16020gcgcgacgcc gccaccggtg tgcgcgtgcc cgtgcgcacc cgcccccctc gcacttgaag16080atgctgactt cgcgatgttg atgtgtccca gcggcgagga ggatgtccaa gcgcaaattc16140aaggaagaga tgctccaggt catcgcgcct gagatctacg gcccggcggc ggtgaaggag16200gaaagaaagc cccgcaaact gaagcgggtc aaaaaggaca aaaaggagga ggaagatgtg16260gacggactgg tggagtttgt gcgcgagttc gccccccggc ggcgcgtgca gtggcgcggg16320cggaaagtga aaccggtgct gcgacccggc accacggtgg tcttcacgcc cggcgagcgt16380tccggctccg cctccaagcg ctcctacgac gaggtgtacg gggacgagga catcctcgag16440caggcggccg aacgtctggg cgagtttgct tacggcaagc gcagccgccc cgcgcccttg16500aaagaggagg cggtgtccat cccgctggac cacggcaacc ccacgccgag cctgaagccg16560gtgaccctgc agcaggtgct gcctggtgcg gcgccgcgcc ggggcttcaa gcgcgagggc16620ggcgaggatc tgtacccgac catgcagctg atggtgccca agcgccagaa gctggaggac16680gtgctggagc acatgaaggt ggaccccgag gtgcagcccg aggtcaaggt gcggcccatc16740aagcaggtgg ccccgggcct gggcgtgcag accgtggaca tcaagatccc cacggagccc16800atggaaacgc agaccgagcc cgtgaagccc agcaccagca ccatggaggt gcagacggat16860ccctggatgc cggcaccggc ttccaccacc cgccgaagac gcaagtacgg cgcggccagc16920ctgctgatgc ccaactacgc gctgcatcct tccatcatcc ccacgccggg ctaccgcggc16980acgcgcttct accgcggcta caccagcagc cgccgccgca agaccaccac ccgccgccgc17040cgtcgtcgca cccgccgcag cagcaccgcg acttccgccg ccgccctggt gcggagagtg17100taccgcagcg ggcgcgagcc tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc17160atttaactac cgcctcctac ttgcagatat ggccctcaca tgccgcctcc gcgtccccat17220tacgggctac cgaggaagaa agccgcgccg tagaaggctg acggggaacg ggctgcgtcg17280ccatcaccac cggcggcggc gcgccatcag caagcggttg gggggaggct tcctgcccgc17340gctgatgccc atcatcgccg cggcgatcgg ggcgatcccc ggcatagctt ccgtggcggt17400gcaggcctct cagcgccact gagacacagc ttggaaaatt tgtaataaaa aatggactga17460cgctcctggt cctgtgatgt gtgtttttag atggaagaca tcaatttttc gtccctggca17520ccgcgacacg gcacgcggcc gtttatgggc acctggagcg acatcggcaa cagccaactg17580aacgggggcg ccttcaattg gagcagtctc tggagcgggc ttaagaattt cgggtccacg17640
ctcaaaacct atggcaacaa ggcgtggaac agcagcacag ggcaggcgct gagggaaaag17700ctgaaagagc agaacttcca gcagaaggtg gtcgatggcc tggcctcggg catcaacggg17760gtggtggacc tggccaacca ggccgtgcag aaacagatca acagccgcct ggacgcggtc17820ccgcccgcgg ggtccgtgga gatgccccag gtggaggagg agctgcctcc cctggacaag17880cgcggcgaca agcgaccgcg tcccgacgcg gaggagacgc tgctgacgca cacggacgag17940ccgcccccgt acgaggaggc ggtgaaactg ggtctgccca ccacgcggcc cgtggcgcct18000ctggccaccg gggtgctgaa acccagcagc agcagcagcc agcccgcgac cctggacttg18060cctccgcctg cttcccgccc ctccacagtg gctaagcccc tgccgccggt ggccgtcgcg18120tcgcgcgccc cccgaggccg cccccaggcg aactggcaga gcactctgaa cagcatcgtg18180ggtctgggag tgcagagtgt gaagcgccgc cgctgctatt aaaagacact gtagcgctta18240acttgcttgt ctgtgtgtat atgtatgtcc gccgaccaga aggaggagga agaggcgcgt18300cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg18360ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagttcgcc cgcgccacag18420acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg18480tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca18540acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca18600tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct18660actccggcac cgcttacaac agcctggctc ccaagggagc gcccaacact tgccagtgga18720catataaagc tgatggtgat actggtacag aaaaaaccta tacatatgga aatgcgcctg18780tgcaaggcat tagtattaca aaagatggta ttcaacttgg aactgacact gatgatcagc18840ccatttatgc agataaaact tatcaaccag agcctcaagt gggtgatgct gaatggcatg18900acatcactgg tactgatgaa aaatatggag gcagagctct caagcctgac accaaaatga18960agccctgcta tggttctttt gccaagccta ccaataaaga aggaggtcag gcaaatgtga19020aaaccgaaac aggcggtacc aaagaatatg acattgacat ggcattcttc gataatcgaa19080gtgcagctgc ggctggcctg gccccagaaa ttgttttgta tactgagaat gtggatctgg19140aaactccaga tactcatatt gtatacaagg cgggcacaga tgacagcagc tcttctatca19200atttgggtca gcagtccatg cccaacagac ccaactacat tggctttaga gacaacttta19260tcgggctcat gtactacaac agcactggca acatgggcgt gctggctggt caggcctccc19320agctgaatgc tgtggtggac ttgcaggaca gaaacactga actgtcctac cagctcttgc19380ttgactctct gggcgacaga accaggtatt tcagtatgtg gaatcaggcg gtggacagct19440atgaccccga tgtgcgcatt attgaaaatc acggtgtgga ggatgaactc cctaactatt19500gcttccccct ggatgctgtg ggtagaactg atacttacca gggaattaag gccaatggtg19560ctgatcaaac cacctggacc aaagatgata ctgttaatga tgctaatgaa ttgggcaagg19620gcaatccttt cgccatggag atcaacatcc aggccaacct gtggcggaac ttcctctacg19680cgaacgtggc gctgtacctg cccgactcct acaagtacac gccggccaac atcacgctgc19740cgaccaacac caacacctac gattacatga acggccgcgt ggtggcgccc tcgctggtgg19800acgcctacat caacatcggg gcgcgctggt cgctggaccc catggacaac gtcaacccct19860tcaaccacca ccgcaacgcg ggcctgcgct accgctccat gctcctgggc aacgggcgct19920acgtgccctt ccacatccag gtgccccaaa agttcttcgc catcaagagc ctcctgctcc19980tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga20040gctccctcgg caacgacctg cgcacggacg gggcctccat cgccttcacc agcatcaacc20100tctacgccac cttcttcccc atggcgcaca acaccgcctc cacgctcgag gccatgctgc20160gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc20220ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct20280tccgcggatg gtccttcacg cgcctcaaga cccgcgagac gccctcgctc ggctccgggt20340tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca20400
accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg20460accgcctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacgga gaggggtaca20520acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca20580acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct20640tccgcaactt ccagcccatg agccgccagg tcgtggacga ggtcaactac aaggactacc20700aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca20760ccatgcgcca gggacagccc taccccgcca actaccccta cccgctcatc ggcaagagcg20820ccgtcgccag cgtcacccag aaaaagttcc tctgcgaccg ggtcatgtgg cgcatcccct20880tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctacg20940ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc21000ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg21060tcatcgaggc cgtctacctg cgcacgccct tctcggccgg caacgccacc acctaagccc21120cgctcttgct tcttgcaaga tgacggcctg tgcgggctcc ggcgagcagg agctcagggc21180catcctccgc gacctgggct gcgggccctg cttcctgggc accttcgaca agcgcttccc21240gggattcatg gccccgcaca agctggcctg cgccatcgtc aacacggccg gccgcgagac21300cgggggcgag cactggctgg ccttcgcctg gaacccgcgc tcccacacct gctacctctt21360cgaccccttc gggttctcgg acgagcgcct caagcagatc taccagttcg agtacgaggg21420cctgctgcgc cgcagcgccc tggccaccga ggaccgctgc gtcaccctgg aaaagtccac21480ccagaccgtg cagggtccgc gctcggccgc ctgcgggctc ttctgctgca tgttcctgca21540cgccttcgtg cactggcccg accgccccat ggacaagaac cccaccatga acttgctgac21600gggggtgccc aacggcatgc tccagtcgcc ccaggtggaa cccaccctgc gccgcaacca21660ggaggcgctc taccgcttcc tcaacgccca ctccgcctac tttcgctccc accgcgcgcg21720catcgagaag gccaccgcct tcgaccgcat gaatcaagac atgtaaaccg tgtgtgtatg21780tgaatgcttt attcataata aacagcacat gtttatgcca ccttttctga ggctctgact21840ttatttagaa atcgaagggg ttctgccggc tctcggcgtg ccccgcgggc agggatacgt21900tgcggaactg gtacttgggc agccacttga actcggggat cagcagcttc ggcacgggga21960ggtcggggaa cgagtcgctc cacagcttgc gcgtgagttg cagggcgccc agcaggtcgg22020gcgcggagat cttgaaatcg cagttgggac ccgcgttctg cgcgcgggag ttgcggtaca22080cggggttgca gcactggaac accatcaggg ccgggtgctt cacgctcgcc agcaccgtcg22140cgtcggtgat gccctccacg tccagatcct cggcgttggc catcccgaag ggggtcatct22200tgcaggtctg ccgccccatg ctgggcacgc agccgggctt gtggttgcaa tcgcagtgca22260gggggatcag catcatctgg gcctgctcgg agctcatgcc cgggtacatg gccttcatga22320aagcctccag ctggcggaag gcctgctgcg ccttgccgcc ctcggtgaag aagaccccgc22380aggacttgct agagaactgg ttggtggcgc agccggcgtc gtgcacgcag cagcgcgcgt22440cgttgttggc cagctgcacc acgctgcgcc cccagcggtt ctgggtgatc ttggcccggt22500cggggttctc cttcagcgcg cgctgcccgt tctcgctcgc cacatccatc tcgatcgtgt22560gctccttctg gatcatcacg gtcccgtgca ggcatcgcag cttgccctcg gcctcggtgc22620acccgtgcag ccacagcgcg cagccggtgc actcccagtt cttgtgggcg atctgggagt22680gcgagtgcac gaagccctgc aggaagcggc ccatcatcgt ggtcagggtc ttgttgctgg22740tgaaggtcag cgggatgccg cggtgctcct cgttcacata caggtggcag atgcggcggt22800acacctcgcc ctgctcgggc atcagctgga aggcggactt caggtcgctc tccacgcggt22860accggtccat cagcagcgtc atgacttcca tgcccttctc ccaggccgag acgatcggca22920ggctcagggg gttcttcacc gccgttgtca tcttagtcgc cgccgctgag gtcagggggt22980cgttctcgtc cagggtctca aacactcgct tgccgtcctt ctcggtgatg cgcacggggg23040gaaagctgaa gcccacggcc gccagctcct cctcggcctg cctttcgtcc tcgctgtcct23100ggctgatgtc ttgcaaaggc acatgcttgg tcttgcgggg tttctttttg ggcggcagag23160
gcggcggcgg agacgtgctg ggcgagcgcg agttctcgct caccacgact atttcttctt23220cttggccgtc gtccgagacc acgcggcggt aggcatgcct cttctggggc agaggcggag23280gcgacgggct ctcgcggttc ggcgggcggc tggcagagcc ccttccgcgt tcgggggtgc23340gctcctggcg gcgctgctct gactgacttc ctccgcggcc ggccattgtg ttctcctagg23400gagcaacaag catggagact cagccatcgt cgccaacatc gccatctgcc cccgccgccg23460ccgacgagaa ccagcagcag aatgaaagct taaccgcccc gccgcccagc cccacctccg23520acgccgccgc ggccccagac atgcaagaga tggaggaatc catcgagatt gacctgggct23580acgtgacgcc cgcggagcac gaggaggagc tggcagcgcg cttttcagcc ccggaagaga23640accaccaaga gcagccagag caggaagcag agagcgagca gcagcaggct gggctcgagc23700atggcgacta cctgagcggg gcagaggacg tgctcatcaa gcatctggcc cgccaatgca23760tcatcgtcaa ggacgcgctg ctcgaccgcg ccgaggtgcc cctcagcgtg gcggagctca23820gccgcgccta cgagcgcaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaacg23880gcacctgcga gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc23940tggccaccta ccacctcttt ttcaagaacc aaaggatccc cgtctcctgc cgcgccaacc24000gcacccgcgc cgacgccctg ctcaacctgg gtcccggcgc ccgcctacct gatatcgcct24060ccttggaaga ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga24120acgctctgca aggaagcgga gaggagcatg agcaccacag cgccctggtg gagttggaag24180gcgacaacgc gcgcctggcg gtgctcaagc gcacggtcga gctgacccac ttcgcctacc24240cggcgctcaa cctgcccccc aaggtcatga gcgccgtcat ggaccaggtg ctcatcaagc24300gcgcctcgcc cctctcggat gaggacatgc aggaccccga gagctcggac gagggcaagc24360ccgtggtcag cgacgagcag ctggcgcgct ggctgggagc gagtagcacc ccccagagct24420tggaagagcg gcgcaagctc atgatggccg tggtcctggt gaccgtggag ctggagtgtc24480tgcgccgctt cttcgccgac gcagagaccc tgcgcaaggt cgaggagaac ctgcactacc24540tcttcaggca cgggtttgtg cgccaggcct gcaagatctc caacgtggag ctgaccaacc24600tggtctccta catgggcatc ctgcacgaga accgcctggg gcagaacgtg ctgcacacca24660ccctgcgcgg ggaggcccgc cgcgactaca tccgcgactg cgtctacctg tacctctgcc24720acacctggca gacgggcatg ggcgtgtggc agcagtgcct ggaggagcag aacctgaaag24780agctctgcaa gctcctgcag aagaacctga aggccctgtg gaccgggttc gacgagcgca24840ccaccgcctc ggacctggcc gacctcatct tccccgagcg cctgcggctg acgctgcgca24900acggactgcc cgactttatg agtcaaagca tgttgcaaaa ctttcgctct ttcatcctcg24960aacgctccgg gatcctgccc gccacctgct ccgcgctgcc ctcggacttc gtgccgctga25020ccttccgcga gtgccccccg ccgctctgga gccactgcta cctgctgcgc ctggccaact25080acctggccta ccactcggac gtgatcgagg acgtcagcgg cgagggtctg ctcgagtgcc25140actgccgctg caacctctgc acgccgcacc gctccctggc ctgcaacccc cagctgctga25200gcgagaccca gatcatcggc accttcgagt tgcaaggccc cggcgagggc aaggggggtc25260tgaaactcac cccggggctg tggacctcgg cctacttgcg caagttcgtg cccgaggact25320accatccctt cgagatcagg ttctacgagg accaatccca gccgcccaag gccgaactgt25380cggcctgcgt catcacccag ggggccatcc tggcccaatt gcaagccatc cagaaatccc25440gccaagaatt tctgctgaaa aagggccacg gggtctacct ggacccccag accggagagg25500agctcaaccc cagcttcccc caggatgccc cgaggaagca gcaagaagct gaaagtggag25560ctgccgccgc cggaggattt ggaggaagac tgggagagca gtcaggcaga ggaggaggag25620atggaagact gggacagcac tcaggcagag gaggacagcc tgcaagacag tctggaagac25680gaggtggagg aggaggcaga ggaagaagca gccgccgcca gaccgtcgtc ctcggcggag25740aaagcaagca gcacggatac catctccgct ccgggtcggg gtcgcggcga ccgggcccac25800agtaggtggg acgagaccgg gcgcttcccg aaccccacca cccagaccgg taagaaggag25860cggcagggat acaagtcctg gcgggggcac aaaaacgcca tcgtctcctg cttgcaagcc25920
tgcgggggca acatctcctt cacccgccgc tacctgctct tccaccgcgg ggtgaacttc25980ccccgcaaca tcttgcatta ctaccgtcac ctccacagcc cctactactg tttccaagaa26040gaggcagaaa cccagcagca gcagaaaacc agcggcagca gcagctagaa aatccacagc26100ggcggcaggt ggactgagga tcgcagcgaa cgagccggcg cagacccggg agctgaggaa26160ccggatcttt cccaccctct atgccatctt ccagcagagt cgggggcagg agcaggaact26220gaaagtcaag aaccgttctc tgcgctcgct cacccgcagt tgtctgtatc acaagagcga26280agaccaactt cagcgcactc tcgaggacgc cgaggctctc ttcaacaagt actgcgcgct26340cactcttaaa gagtagcccg cgcccgccca cacacggaaa aaggcgggaa ttacgtcacc26400acctgcgccc ttcgcccgac catcatcatg agcaaagaga ttcccacgcc ttacatgtgg26460agctaccagc cccagatggg cctggccgcc ggcgccgccc aggactactc cacccgcatg26520aactggctca gcgccgggcc cgcgatgatc tcacgggtga atgacatccg cgcccgccga26580aaccagatac tcctagaaca gtcagcgatc accgccacgc cccgccatca ccttaatccg26640cgtaattggc ccgccgccct ggtgtaccag gaaattcccc agcccacgac cgtactactt26700ccgcgagacg cccaggccga agtccagctg actaactcag gtgtccagct ggccggcggc26760gccgccctgt gtcgtcaccg ccccgctcag ggtataaagc ggctggtgat ccgaggcaga26820ggcacacagc tcaacgacga ggtggtgagc tcttcgctgg gtctgcgacc tgacggagtc26880ttccaactcg ccggatcggg gagatcttcc ttcacgcctc gtcaggccgt cctgactttg26940gagagttcgt cctcgcagcc ccgctcgggt ggcatcggca ctctccagtt cgtggaggag27000ttcactccct cggtctactt caaccccttc tccggctccc ccggccacta cccggacgag27060ttcatcccga acttcgacgc catcagcgag tcggtggacg gctacgattg aatgtcccat27120ggtggcgcag ctgacctagc tcggcttcga cacctggacc actgccgccg cttccgctgc27180ttcgctcggg atctcgccga gtttgcctac tttgagctgc ccgaggagca ccctcagggc27240ccggcccacg gagtgcggat catcgtcgaa gggggcctcg actcccacct gcttcggatc27300ttcagccagc gaccgatcct ggtcgagcgc gagcaaggac agacccttct gaccctgtac27360tgcatctgca accaccccgg cctgcatgaa agtctttgtt gtctgctgtg tactgagtat27420aataaaagct gagatcagcg actactccgg actcgattgt ggtgttcctg ctatcaaccg27480gtccctgttc ttcaccggga acgagaccga gctccagctt cagtgtaagc cccacaagaa27540gtacctcacc tggctgttcc agggctcccc gatcgccgtt gtcaaccact gcgacaacga27600cggagtcctg ctgagcggcc ccgccaacct tactttttcc acccgcagaa gcaagctcca27660gctcttccaa cccttcctcc ccgggaccta tcagtgcgtc tcgggaccct gccatcacac27720cttccacctg atcccgaata ccacagcgcc gctccccgct actaacaacc aaactaccca27780ccatcgccac cgtcgcgacc tttctgaatc taacactacc acccacaccg gaggtgagct27840ccgaggtcga ccaacctctg ggatttacta cggcccctgg gaggtggtgg ggttaatagc27900gctaggccta gttgtgggtg ggcttttggc tctctgctac ctatacctcc cttgctgttc27960gtacttagtg gtgctgtgtt gctggtttaa gaaatgggga agatcaccct agtgagctgc28020ggtgcgctgg tggcggtggt ggtgttttcg attgtgggac tgggcggcgc ggctgtagtg28080aaggagaagg ccgatccctg cttgcatttc aatcccgaca attgccagct gagttttcag28140cccgatggca atcggtgcgc ggtgctgatc aagtgcggat gggaatgcga gaacgtgaga28200atcgagtaca ataacaagac tcggaacaat actctcgcgt ccgtgtggca gcccggggac28260cccgagtggt acaccgtctc tgtccccggt gctgacggct ccccgcgcac cgtgaacaat28320actttcattt ttgcgcacat gtgcgacacg gtcatgtgga tgagcaagca gtacgatatg28380tggcccccca cgaaggagaa catcgtggtc ttctccatcg cttacagcgc gtgcacggcg28440ctaatcaccg ctatcgtgtg cctgagcatt cacatgctca tcgctattcg ccccagaaat28500aatgccgaaa aagagaaaca gccataacac gttttttcac acaccttttt cagaccatgg28560cctctgttaa atttttgctt ttatttgcca gtctcattac tgttataagt aatgagaaac28620tcactattta cattggcact aaccacactt tagacggaat tccaaaatcc tcatggtatt28680
gctattttga tcaagatcca gacttaacta tagaactgtg tggtaacaag ggaaaaaata28740caagcattca tttaattaac tttaattgcg gagacaattt gaaattaatt aatatcacta28800aagagtatgg aggtatgtat tactatgttg cagaaaataa caacatgcag ttttatgaag28860ttactgtaac taatcccacc acacctagaa caacaacaac caccaccaca aaaactacac28920ctgttaccac tatgcagctc actaccaata acatttttgc catgcgtcaa atggtcaaca28980atagcactca acccacccca cccagtgagg aaattcccaa atccatgatt ggcattattg29040ttgctgtagt ggtgtgcatg ttgatcatcg ccttgtgcat ggtgtactat gccttctgct29100acagaaagca cagactgaac gacaagctgg aacacttact aagtgttgaa ttttaatttt29160ttagaaccat gaagatccta ggccttttaa ttttttctat cattacctct gctctatgca29220attctgacaa tgaggacgtt actgtcgttg tcggaaccaa ttatacactg aaaggtccag29280cgaagggtat gctttcgtgg tattgctggt ttggaactga cgagcaacag acagagctct29340gcaatgctca aaaaggcaaa acctcaaatt ctaaaatctc taattatcaa tgcaatggca29400ctgacttagt actgctcaat gtcacgaaag catatgctgg cagctacacc tgccctggag29460atgatactga gaacatgatt ttttacaaag tggaagtggt tgatcccact actccacctc29520cacccaccac aactactcac accacacaca cagaacaaac cacagcagag gaggcagcaa29580agttagcctt gcaggtccaa gacagttcat ttgttggcat tacccctaca cctgatcagc29640ggtgtccggg gctgctcgtc agcggcattg tcggtgtgct ttcgggatta gcagtcataa29700tcatctgcat gttcattttt gcttgctgct atagaaggct ttaccgacaa aaatcagacc29760cactgctgaa cctctatgtt taattttttc cagagccatg aaggcagtta gcactctagt29820tttttgttct ttgattggca ctgtttttag tgttagcttt ttgaaacaaa tcaatgttac29880tgagggggaa aatgtgacac tggtaggcgt agagggtgct caaaatacca cctggacaaa29940attccatcta gatgggtgga aagaaatttg cacctggaat gtcagtactt atacatgtga30000aggagttaat cttaccattg tcaatgtcag ccaaattcaa aagggttgga ttaaagggca30060atctgttagt gttagcaata gtgggtacta tacccagcat actcttatct atgacattat30120agttatacca ctgcctacac ctagcccacc tagcactacc acacagacaa cccacactac30180acaaacaacc acatacagta catcaaatca gcctaccacc actacaacag cagaggttgc30240cagctcgtct ggggtccgag tggcattttt gatgttggcc ccatctagca gtcccactgc30300tagtaccaat gagcagacta ctgaattttt gtccactgtc gagagccaca ccacagctac30360ctcgagtgcc ttctctagca ccgccaatct atcctcgctt tcctctacac caatcagtcc30420cgctactact cctacccccg ctattctccc cactcccctg aagcaaacag acggcgacat30480gcaatggcag atcaccctgc tcattgtgat cgggttggtc atcctggccg tgttgctcta30540ctacatcttc tgccgccgca ttcccaacgc gcaccgcaag ccggcctaca agcccatcgt30600tgtcgggcag ccggagccgc ttcaggtgga agggggtcta aggaatcttc tcttctcttt30660tacagtatgg tgattgaatt atgattccta gacaaatctt gatcactatt cttatctgcc30720tcctccaagt ctgtgccacc ctcgctctgg tggccaacgc cagtccagac tgtattgggc30780ccttcgcctc ctacgtgctc tttgccttca tcacctgcat ctgctgctgt agcatagtct30840gcctgcttat caccttcttc cagttcattg actggatctt tgtgcgcatc gcctacctgc30900gccaccaccc ccagtaccgc gaccagcgag tggcgcggct gctcaggatc ctctgataag30960catgcgggct ctgctacttc tcgcgcttct gctgttagtg ctcccccgtc ccgtcgaccc31020ccggaccccc acccagtccc ccgaggaggt ccgcaaatgc aaattccaag aaccctggaa31080attcctcaaa tgctaccgcc aaaaatcaga catgcatccc agctggatca tgatcattgg31140gatcgtgaac attctggcct gcaccctcat ctcctttgtg atttacccct gctttgactt31200tggttggaac tcgccagagg cgctctatct cccgcctgaa cctgacacac caccacagca31260acctcaggca cacgcactac caccaccacc acagcctagg ccacaataca tgcccatatt31320agactatgag gccgagccac agcgacccat gctccccgct attagttact tcaatctaac31380cggcggagat gactgaccca ctggccaaca acaacgtcaa cgaccttctc ctggacatgg31440
acggccgcgc ctcggagcag cgactcgccc aacttcgcat tcgccagcag caggagagag31500ccgtcaagga gctgcaggac ggcatagcca tccaccagtg caagaaaggc atcttctgcc31560tggtgaaaca ggccaagatc tcctacgagg tcacccagac cgaccatcgc ctctcctacg31620agctcctgca gcagcgccag aagttcacct gcctggtcgg agtcaacccc atcgtcatca31680cccagcagtc gggcgatacc aaggggtgca tccactgctc ctgcgactcc cccgactgcg31740tccacactct gatcaagacc ctctgcggcc tccgcgacct cctccccatg aactaatcac31800ccccttatcc agtgaaataa agatcatatt gatgatttga gtttaataaa aataaagaat31860cacttacttg aaatctgata ccaggtctct gtccatgttt tctgccaaca ccacttcact31920cccctcttcc cagctctggt actgcaggcc ccggcgggct gcaaacttcc tccacaccct31980gaaggggatg tcaaattcct cctgtccctc aatcttcatt ttatcttcta tcagatgtcc32040aaaaagcgcg tccgggtgga tgatgacttc gaccccgtct acccctacga tgcagacaac32100gcaccgaccg tgcccttcat caaccccccc ttcgtctctt cagatggatt ccaagagaag32160cccctggggg tgctgtccct gcgtctggcc gatcccgtca ccaccaagaa cggggaaatc32220accctcaagc tgggagatgg ggtggacctc gactcctcgg gaaaactcat ctccaacacg32280gccaccaagg ccgccgcccc tctcagtttt tccaacaaca ccatttccct taacatggat32340accccttttt acaacaacaa tggaaagtta ggcatgaaag tcactgctcc actgaagata32400ctagacacag acttgctaaa aacacttgtt gtagcttatg gacaaggttt aggaacaaac32460accactggtg cccttgttgc ccaactagca tccccacttg cttttgatag caatagcaaa32520attgccctta atttaggcaa tggaccattg aaagtggatg caaatagact gaacatcaat32580tgcaatagag gactctatgt tactaccaca aaagatgcac tggaagccaa tataagttgg32640gctaatgcta tgacatttat aggaaatgcc atgggtgtca atattgatac acaaaaaggc32700ttgcaatttg gcaccactag taccgtcgca gatgttaaaa acgcttaccc catacaaatc32760aaacttggag ctggtctcac atttgacagc acaggtgcaa ttgttgcatg gaacaaagat32820gatgacaagc ttacactatg gaccacagcc gacccctctc caaattgtca catatattct32880gaaaaggatg ctaagcttac actttgcttg acaaagtgtg gcagtcagat tctgggcact32940gtttccctca tagctgttga tactggcagt ttaaatccca taacaggaac agtaaccact33000gctcttgtct cacttaaatt cgatgcaaat ggagttttgc aaagcagctc aacactagac33060tcagactatt ggaatttcag acagggagat gttacacctg ctgaagccta tactaatgct33120ataggtttca tgcccaatct aaaagcatac cctaaaaaca caagtggagc tgcaaaaagt33180cacattgttg ggaaagtgta cctacatggg gatacaggca aaccactgga cctcattatt33240actttcaatg aaacaagtga tgaatcttgc acttactgta ttaactttca atggcagtgg33300ggggctgatc aatataaaaa tgaaacactt gccgtcagtt cattcacctt ttcctatatt33360gctaaagaat aaaccccact ctgtacccca tctctgtcta tggaaaaaac tctgaaacac33420aaaataaaat aaagttcaag tgttttattg attcaacagt tttacaggat tcgagcagtt33480atttttcctc caccctccca ggacatggaa tacaccaccc tctccccccg cacagccttg33540aacatctgaa tgccattggt gatggacatg cttttggtct ccacgttcca cacagtttca33600gagcgagcca gtctcgggtc ggtcagggag atgaaaccct ccgggcactc ccgcatctgc33660acctcacagc tcaacagctg aggattgtcc tcggtggtcg ggatcacggt tatctggaag33720aagcagaaga gcggcggtgg gaatcatagt ccgcgaacgg gatcggccgg tggtgtcgca33780tcaggccccg cagcagtcgc tgtcgccgcc gctccgtcaa gctgctgctc agggggtccg33840ggtccaggga ctccctcagc atgatgccca cggccctcag catcagtcgt ctggtgcggc33900gggcgcagca gcgcatgcgg atctcgctca ggtcgctgca gtacgtgcaa cacaggacca33960ccaggttgtt caacagtcca tagttcaaca cgctccagcc gaaactcatc gcgggaagga34020tgctacccac gtggccgtcg taccagatcc tcaggtaaat caagtggcgc cccctccaga34080acacgctgcc catgtacatg atctccttgg gcatgtggcg gttcaccacc tcccggtacc34140acatcaccct ctggttgaac atgcagcccc ggatgatcct gcggaaccac agggccagca34200
ccgccccgcc cgccatgcag cgaagagacc ccgggtcccg acaatggcaa tggaggaccc34260accgctcgta cccgtggatc atctgggagc tgaacaagtc tatgttggca cagcacaggc34320atatgctcat gcatctcttc agcactctca gctcctcggg ggtcaaaacc atatcccagg34380gcacggggaa ctcttgcagg acagcgaacc ccgcagaaca gggcaatcct cgcacataac34440ttacattgtg catggacagg gtatcgcaat caggcagcac cgggtgatcc tccaccagag34500aagcgcgggt ctcggtctcc tcacagcgtg gtaagggggc cggccgatac gggtgatggc34560gggacgcggc tgatcgtgtt cgcgaccgtg ttatgatgca gttgctttcg gacattttcg34620tacttgctgt agcagaacct ggtccgggcg ctgcacaccg atcgccggcg gcggtcccgg34680cgcttggaac gctcggtgtt gaagttgtaa aacagccact ctctcagacc gtgcagcaga34740tctagggcct caggagtgat gaagatccca tcatgcctga tggctctaat cacatcgacc34800accgtggaat gggccagacc cagccagatg atgcaatttt gttgggtttc ggtgacggcg34860ggggagggaa gaacaggaag aaccatgatt aacttttaat ccaaacggtc tcggagcact34920tcaaaatgaa gatcgcggag atggcacctc tcgcccccgc tgtgttggtg gaaaataaca34980gccaggtcaa aggtgatacg gttctcgaga tgttccacgg tggcttccag caaagcctcc35040acgcgcacat ccagaaacaa gacaatagcg aaagcgggag ggttctctaa ttcctcaatc35100atcatgttac actcctgcac catccccaga taattttcat ttttccagcc ttgaatgatt35160cgaactagtt cctgaggtaa atccaagcca gccatgataa agagctcgcg cagagcgccc35220tccaccggca ttcttaagca caccctcata attccaagat attctgctcc tggttcacct35280gcagcagatt gacaagcgga atatcaaaat ctctgccgcg atccctaagc tcctccctca35340gcaataactg taagtactct ttcatatcct ctccgaaatt tttagccata ggaccaccag35400gaataagatt agggcaagcc acagtacaga taaaccgaag tcctccccag tgagcattgc35460caaatgcaag actgctataa gcatgctggc tagacccggt gatatcttcc agataactgg35520acagaaaatc gcccaggcaa tttttaagaa aatcaacaaa agaaaaatcc tccaggtgca35580cgtttagagc ctcgggaaca acgatggagt aaatgcaagc ggtgcgttcc agcatggtta35640gttagctgat ctgtagaaaa aaacaaaaat gaacattaaa ccatgctagc ctggcgaaca35700ggtgggtaaa tcgttctctc cagcaccagg caggccacgg ggtctccggc acgaccctcg35760taaaaattgt cgctatgatt gaaaaccatc acagagagac gttcccggtg gccggcgtga35820atgattcgac aagatgaata cacccccgga acattggcgt ccgcgagtga aaaaaagcgc35880ccaaggaagc aataaggcac tacaatgctc agtctcaagt ccagcaaagc gatgccatgc35940ggatgaagca caaaattctc aggtgcgtac aaaatgtaat tactcccctc ctgcacaggc36000agcaaagccc ccgatccctc caggtacaca tacaaagcct cagcgtccat agcttaccga36060gcagcagcac acaacaggcg caagagtcag agaaaggctg agctctaacc tgtccacccg36120ctctctgctc aatatatagc ccagatctac actgacgtaa aggccaaagt ctaaaaatac36180ccgccaaata atcacacacg cccagcacac gcccagaaac cggtgacaca ctcaaaaaaa36240tacgcgcact tcctcaaacg cccaaactgc cgtcatttcc gggttcccac gctacgtcat36300caaaattcga ctttcaaatt ccgtcgaccg ttaaaaacgt cgcccgcccc gcccctaacg36360gtcgccgctc ccgcagccaa tcaccgcccc gcatccccaa attcaaatac ctcatttgca36420tattaacgcg caccaaaagt ttgaggtata ttattgatga tg 36462<210>2<211>36604<212>DNA<213>黑猩猩腺病毒血清型Pan6<400>2catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg agctgtttga 60
atttggggag ggaggaaggt gattggctgc gggagcggcg accgttaggg gcggggcggg 120tgacgttttg atgacgtggc tatgaggcgg agccggtttg caagttctcg tgggaaaagt 180gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca 240ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg 300aatgaggaag tgaaaatctg agtaatttcg cgtttatggc agggaggagt atttgccgag 360ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat 420ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggc gtcagctgat cgccagggta 480tttaaacctg cgctctctag tcaagaggcc actcttgagt gccagcgagt agagttttct 540cctccgcgcc gcgagtcaga tctacacttt gaaagatgag gcacctgaga gacctgcccg 600gtaatgtttt cctggctact gggaacgaga ttctggaatt ggtggtggac gccatgatgg 660gtgacgaccc tccagagccc cctaccccat ttgaggcgcc ttcgctgtac gatttgtatg 720atctggaggt ggatgtgccc gagagcgacc ctaacgagga ggcggtgaat gatttgttta 780gcgatgccgc gctgctggct gccgagcagg ctaatacgga ctctggctca gacagcgatt 840cctctctcca taccccgaga cccggcagag gtgagaaaaa gatccccgag cttaaagggg 900aagagctcga cctgcgctgc tatgaggaat gcttgcctcc gagcgatgat gaggaggacg 960aggaggcgat tcgagctgcg gtgaaccagg gagtgaaaac tgcgggcgag agctttagcc1020tggactgtcc tactctgccc ggacacggct gtaagtcttg tgaatttcat cgcatgaata1080ctggagataa gaatgtgatg tgtgccctgt gctatatgag agcttacaac cattgtgttt1140acagtaagtg tgattaactt tagttgggaa ggcagagggt gactgggtgc tgactggttt1200atttatgtat atgttttttt atgtgtaggt cccgtctctg acgtagatga gacccccact1260tcagagtgca tttcatcacc cccagaaatt ggcgaggaac cgcccgaaga tattattcat1320agaccagttg cagtgagagt caccgggcgg agagcagctg tggagagttt ggatgacttg1380ctacagggtg gggatgaacc tttggacttg tgtacccgga aacgccccag gcactaagtg1440ccacacatgt gtgtttactt aaggtgatgt cagtatttat agggtgtgga gtgcaataaa1500atccgtgttg actttaagtg cgtgttttat gactcagggg tggggactgt gggtatataa1560gcaggtgcag acctgtgtgg tcagttcaga gcaggactca tggagatctg gactgtcttg1620gaagactttc accagactag acagttgcta gagaactcat cggagggagt ctcttacctg1680tggagattct gcttcggtgg gcctctagct aagctagtct atagggccaa acaggattat1740aaggaacaat ttgaggatat tttgagagag tgtcctggta tttttgactc tctcaacttg1800ggccatcagt ctcactttaa ccagagtatt ctgagagccc ttgacttttc tactcctggc1860agaactaccg ccgcggtagc cttttttgcc tttattcttg acaaatggag tcaagaaacc1920catttcagca gggattaccg tctggactgc ttagcagtag ctttgtggag aacatggagg1980tgccagcgcc tgaatgcaat ctccggctac ttgccagtac agccggtaga cacgctgagg2040atcctgagtc tccagtcacc ccaggaacac caacgccgcc agcagccgca gcaggagcag2100cagcaagagg aggaccgaga agagaacccg agagccggtc tggaccctcc ggtggcggag2160gaggaggagt agctgacttg tttcccgagc tgcgccgggt gctgactagg tcttccagtg2220gacgggagag ggggattaag cgggagaggc atgaggagac tagccacaga actgaactga2280ctgtcagtct gatgagccgc aggcgcccag aatcggtgtg gtggcatgag gtgcagtcgc2340aggggataga tgaggtctcg gtgatgcatg agaaatattc cctagaacaa gtcaagactt2400gttggttgga gcccgaggat gattgggagg tagccatcag gaattatgcc aagctggctc2460tgaagccaga caagaagtac aagattacca aactgattaa tatcagaaat tcctgctaca2520tttcagggaa tggggccgag gtggagatca gtacccagga gagggtggcc ttcagatgtt2580gtatgatgaa tatgtacccg ggggtggtgg gcatggaggg agtcaccttt atgaacacga2640ggttcagggg tgatgggtat aatggggtgg tctttatggc caacaccaag ctgacagtgc2700acggatgctc cttctttggc ttcaataaca tgtgcatcga ggcctggggc agtgtttcag2760tgaggggatg cagcttttca gccaactgga tgggggtcgt gggcagaacc aagagcaagg2820
tgtcagtgaa gaaatgcctg ttcgagaggt gccacctggg ggtgatgagc gagggcgaag2880ccaaagtcaa acactgcgcc tctaccgaga cgggctgctt tgtgctgatc aagggcaatg2940cccaagtcaa gcataacatg atctgtgggg cctcggatga gcgcggctac cagatgctga3000cctgcgccgg tgggaacagc catatgctgg ccaccgtgca tgtggcctcg cacccccgca3060agacatggcc cgagttcgag cacaacgtca tgacccgctg caatgtgcac ctgggctccc3120gccgaggcat gttcatgccc taccagtgca acatgcaatt tgtgaaggtg ctgctggagc3180ccgatgccat gtccagagtg agcctgacgg gggtgtttga catgaatgtg gagctgtgga3240aaattctgag atatgatgaa tccaagacca ggtgccgggc ctgcgaatgc ggaggcaagc3300acgccaggct tcagcccgtg tgtgtggagg tgacggagga cctgcgaccc gatcatttgg3360tgttgtcctg caacgggacg gagttcggct ccagcgggga agaatctgac tagagtgagt3420agtgtttggg gctgggtgtg agcctgcatg aggggcagaa tgactaaaat ctgtggtttt3480ctgtgtgttg cagcagcatg agcggaagcg cctcctttga gggaggggta ttcagccctt3540atctgacggg gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg3600tggacggccg gcccgtgcag cccgcgaact cttcaaccct gacctacgcg accctgagct3660cctcgtccgt ggacgcagct gccgccgcag ctgctgcttc cgccgccagc gccgtgcgcg3720gaatggccct gggcgccggc tactacagct ctctggtggc caactcgagt tccaccaata3780atcccgccag cctgaacgag gagaagctgc tgctgctgat ggcccagctc gaggccctga3840cccagcgcct gggcgagctg acccagcagg tggctcagct gcaggcggag acgcgggccg3900cggttgccac ggtgaaaacc aaataaaaaa tgaatcaata aataaacgga gacggttgtt3960gattttaaca cagagtcttg aatctttatt tgatttttcg cgcgcggtag gccctggacc4020accggtctcg atcattgagc acccggtgga tcttttccag gacccggtag aggtgggctt4080ggatgttgag gtacatgggc atgagcccgt cccgggggtg gaggtagctc cattgcaggg4140cctcgtgctc ggggatggtg ttgtaaatca cccagtcata gcaggggcgc agggcgtggt4200gctgcacgat gtccttgagg aggagactga tggccacggg cagccccttg gtgtaggtgt4260tgacgaacct gttgagctgg gagggatgca tgcgggggga gatgagatgc atcttggcct4320ggatcttgag attggcgatg ttcccgccca gatcccgccg ggggttcatg ttgtgcagga4380ccaccagcac ggtgtatccg gtgcacttgg ggaatttgtc atgcaacttg gaagggaagg4440cgtgaaagaa tttggagacg cccttgtgac cgcccaggtt ttccatgcac tcatccatga4500tgatggcgat gggcccgtgg gcggcggcct gggcaaagac gtttcggggg tcggacacat4560cgtagttgtg gtcctgggtg agctcgtcat aggccatttt aatgaatttg gggcggaggg4620tgcccgactg ggggacgaag gtgccctcga tcccgggggc gtagttgccc tcgcagatct4680gcatctccca ggccttgagc tcggaggggg ggatcatgtc cacctgcggg gcgatgaaaa4740aaacggtttc cggggcgggg gagatgagct gggccgaaag caggttccgg agcagctggg4800acttgccgca accggtgggg ccgtagatga ccccgatgac cggctgcagg tggtagttga4860gggagagaca gctgccgtcc tcgcggagga ggggggccac ctcgttcatc atctcgcgca4920catgcatgtt ctcgcgcacg agttccgcca ggaggcgctc gccccccagc gagaggagct4980cttgcagcga ggcgaagttt ttcagcggct tgagtccgtc ggccatgggc attttggaga5040gggtctgttg caagagttcc agacggtccc agagctcggt gatgtgctct agggcatctc5100gatccagcag acctcctcgt ttcgcgggtt ggggcgactg cgggagtagg gcaccaggcg5160atgggcgtcc agcgaggcca gggtccggtc cttccagggc cgcagggtcc gcgtcagcgt5220ggtctccgtc acggtgaagg ggtgcgcgcc gggctgggcg cttgcgaggg tgcgcttcag5280gctcatccgg ctggtcgaga accgctcccg gtcggcgccc tgcgcgtcgg ccaggtagca5340attgagcatg agttcgtagt tgagcgcctc ggccgcgtgg cccttggcgc ggagcttacc5400tttggaagtg tgtccgcaga cgggacagag gagggacttg agggcgtaga gcttgggggc5460gaggaagacg gactcggggg cgtaggcgtc cgcgccgcag ctggcgcaga cggtctcgca5520ctccacgagc caggtgaggt cggggcggtt ggggtcaaaa acgaggtttc ctccgtgctt5580
tttgatgcgt ttcttacctc tggtctccat gagctcgtgt ccccgctggg tgacaaagag5640gctgtccgtg tccccgtaga ccgactttat gggccggtcc tcgagcgggg tgccgcggtc5700ctcgtcgtag aggaaccccg cccactccga gacgaaggcc cgggtccagg ccagcacgaa5760ggaggccacg tgggaggggt agcggtcgtt gtccaccagc gggtccacct tctccagggt5820atgcaagcac atgtccccct cgtccacatc caggaaggtg attggcttgt aagtgtaggc5880cacgtgaccg ggggtcccgg ccgggggggt ataaaagggg gcgggcccct gctcgtcctc5940actgtcttcc ggatcgctgt ccaggagcgc cagctgttgg ggtaggtatt ccctctcgaa6000ggcgggcatg acctcggcac tcaggttgtc agtttctaga aacgaggagg atttgatatt6060gacggtgccg ttggagacgc ctttcatgag cccctcgtcc atttggtcag aaaagacgat6120ctttttgttg tcgagcttgg tggcgaagga gccgtagagg gcgttggaga gcagcttggc6180gatggagcgc atggtctggt tcttttcctt gtcggcgcgc tccttggcgg cgatgttgag6240ctgcacgtac tcgcgcgcca cgcacttcca ttcggggaag acggtggtga gctcgtcggg6300cacgattctg acccgccagc cgcggttgtg cagggtgatg aggtccacgc tggtggccac6360ctcgccgcgc aggggctcgt tggtccagca gaggcgcccg cccttgcgcg agcagaaggg6420gggcagcggg tccagcatga gctcgtcggg ggggtcggcg tccacggtga agatgccggg6480caggagctcg gggtcgaagt agctgatgca ggtgcccaga ttgtccagcg ccgcttgcca6540gtcgcgcacg gccagcgcgc gctcgtaggg gctgaggggc gtgccccagg gcatggggtg6600cgtgagcgcg gaggcgtaca tgccgcagat gtcgtagacg tagaggggct cctcgaggac6660gccgatgtag gtggggtagc agcgcccccc gcggatgctg gcgcgcacgt agtcgtacag6720ctcgtgcgag ggcgcgagga gccccgtgcc gaggttggag cgttgcggct tttcggcgcg6780gtagacgatc tggcggaaga tggcgtggga gttggaggag atggtgggcc tttggaagat6840gttgaagtgg gcgtggggca ggccgaccga gtccctgatg aagtgggcgt aggagtcctg6900cagcttggcg acgagctcgg cggtgacgag gacgtccagg gcgcagtagt cgagggtctc6960ttggatgatg tcatacttga gctggccctt ctgcttccac agctcgcggt tgagaaggaa7020ctcttcgcgg tccttccagt actcttcgag ggggaacccg tcctgatcgg cacggtaaga7080gcccaccatg tagaactggt tgacggcctt gtaggcgcag cagcccttct ccacggggag7140ggcgtaagct tgcgcggcct tgcgcaggga ggtgtgggtg agggcgaagg tgtcgcgcac7200catgaccttg aggaactggt gcttgaagtc gaggtcgtcg cagccgccct gctcccagag7260ttggaagtcc gtgcgcttct tgtaggcggg gttaggcaaa gcgaaagtaa catcgttgaa7320gaggatcttg cccgcgcggg gcatgaagtt gcgagtgatg cggaaaggct ggggcacctc7380ggcccggttg ttgatgacct gggcggcgag gacgatctcg tcgaagccgt tgatgttgtg7440cccgacgatg tagagttcca cgaatcgcgg gcggcccttg acgtggggca gcttcttgag7500ctcgtcgtag gtgagctcgg cggggtcgct gagcccgtgc tgctcgaggg cccagtcggc7560gacgtggggg ttggcgctga ggaaggaagt ccagagatcc acggccaggg cggtctgcaa7620gcggtcccgg tactgacgga actgttggcc cacggccatt ttttcggggg tgacgcagta7680gaaggtgcgg gggtcgccgt gccagcggtc ccacttgagc tggagggcga ggtcgtgggc7740gagctcgacg agcggcgggt ccccggagag tttcatgacc agcatgaagg ggacgagctg7800cttgccgaag gaccccatcc aggtgtaggt ttccacatcg taggtgagga agagcctttc7860ggtgcgagga tgcgagccga tggggaagaa ctggatctcc tgccaccagt tggaggaatg7920gctgttgatg tgatggaagt agaaatgccg acggcgcgcc gagcactcgt gcttgtgttt7980atacaagcgt ccgcagtgct cgcaacgctg cacgggatgc acgtgctgca cgagctgtac8040ctgggttcct ttggcgagga atttcagtgg gcagtggagc gctggcggct gcatctcgtg8100ctgtactacg tcttggccat cggcgtggcc atcgtctgcc tcgatggtgg tcatgctgac8160gagcccgcgc gggaggcagg tccagacctc ggctcggacg ggtcggagag cgaggacgag8220ggcgcgcagg ccggagctgt ccagggtcct gagacgctgc ggagtcaggt cagtgggcag8280cggcggcgcg cggttgactt gcaggagctt ttccagggcg cgcgggaggt ccagatggta8340
cttgatctcc acggcgccgt tggtggctac gtccacggct tgcagggtgc cgtgcccctg 8400gggcgccacc accgtgcccc gtttcttctt gggcgctgct tccatgtcgg tcagaagcgg 8460cggcgaggac gcgcgccggg cggcaggggc ggctcggggc ccggaggcag gggcggcagg 8520ggcacgtcgg cgccgcgcgc gggcaggttc tggtactgcg cccggagaag actggcgtga 8580gcgacgacgc gacggttgac gtcctggatc tgacgcctct gggtgaaggc cacgggaccc 8640gtgagtttga acctgaaaga gagttcgaca gaatcaatct cggtatcgtt gacggcggcc 8700tgccgcagga tctcttgcac gtcgcccgag ttgtcctggt aggcgatctc ggtcatgaac 8760tgctcgatct cctcctcctg aaggtctccg cggccggcgc gctcgacggt ggccgcgagg 8820tcgttggaga tgcggcccat gagctgcgag aaggcgttca tgccggcctc gttccagacg 8880cggctgtaga ccacggctcc gtcggggtcg cgcgcgcgca tgaccacctg ggcgaggttg 8940agctcgacgt ggcgcgtgaa gaccgcgtag ttgcagaggc gctggtagag gtagttgagc 9000gtggtggcga tgtgctcggt gacgaagaag tacatgatcc agcggcggag cggcatctcg 9060ctgacgtcgc ccagggcttc caagcgttcc atggcctcgt agaagtccac ggcgaagttg 9120aaaaactggg agttgcgcgc cgagacggtc aactcctcct ccagaagacg gatgagctcg 9180gcgatggtgg cgcgcacctc gcgctcgaag gccccggggg gctcctcttc catctcctcc 9240tcttcctcct ccactaacat ctcttctact tcctcctcag gaggcggtgg cgggggaggg 9300gccctgcgtc gccggcggcg cacgggcaga cggtcgatga agcgctcgat ggtctccccg 9360cgccggcgac gcatggtctc ggtgacggcg cgcccgtcct cgcggggccg cagcatgaag 9420acgccgccgc gcatctccag gtggccgccg ggggggtctc cgttgggcag ggagagggcg 9480ctgacgatgc atcttatcaa ttgacccgta gggactccgc gcaaggacct gagcgtctcg 9540agatccacgg gatccgaaaa ccgctgaacg aaggcttcga gccagtcgca gtcgcaaggt 9600aggctgagcc cggtttcttg ttcttcgggt atttggtcgg gaggcgggcg ggcgatgctg 9660ctggtgatga agttgaagta ggcggtcctg agacggcgga tggtggcgag gagcaccagg 9720tccttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc gtggtcctga 9780cacctggcga ggtccttgta gtagtcctgc atgagccgct ccacgggcac ctcctcctcg 9840cccgcgcggc cgtgcatgcg cgtgagcccg aacccgcgct gcggctggac gagcgccagg 9900tcggcgacga cgcgctcggt gaggatggcc tgctggatct gggtgagggt ggtctggaag 9960tcgtcgaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga gcagttggcc10020atgacggacc agttgacggt ctggtggccg ggtcgcacga gctcgtggta cttgaggcgc10080gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggcgc gcacgaggta ctggtatccg10140acgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc gggggcgccg10200ggcgcgaggt cctcgagcat gaggcggtgg tagccgtaga tgtacctgga catccaggtg10260atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca gatgttgcgc10320agcggcagga agtagttcat ggtggccgcg gtctggcccg tgaggcgcgc gcagtcgtgg10380atgctctaga catacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag10440gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag10500ccgcagctaa cgtggtactg gcactcccgt ctcgacccaa gcctgctaac gaaacctcca10560ggatacggag gcgggtcgtt ttttggcctt ggtcgctggt catgaaaaac tagtaagcgc10620ggaaagcggc cgcccgcgat ggctcgctgc cgtagtctgg agaaagaatc gccagggttg10680cgttgcggtg tgccccggtt cgagcctcag cgctcggcgc cggccggatt ccgcggctaa10740cgtgggcgtg gctgccccgt cgtttccaag accccttagc cagccgactt ctccagttac10800ggagcgagcc cctctttttt tttcttgtgt ttttgccaga tgcatcccgt actgcggcag10860atgcgccccc accctccacc acaaccgccc ctaccgcagc agcagcaaca gccggcgctt10920ctgcccccgc cccagcagca gccagccact accgcggcgg ccgccgtgag cggagccggc10980gttcagtatg acctggcctt ggaagagggc gaggggctgg cgcggctggg ggcgtcgtcg11040ccggagcggc acccgcgcgt gcagatgaaa agggacgctc gcgaggccta cgtgcccaag11100
cagaacctgt tcagagacag gagcggcgag gagcccgagg agatgcgcgc ctcccgcttc11160cacgcggggc gggagctgcg gcgcggcctg gaccgaaagc gggtgctgag ggacgaggat11220ttcgaggcgg acgagctgac ggggatcagc cccgcgcgcg cgcacgtggc cgcggccaac11280ctggtcacgg cgtacgagca gaccgtgaag gaggagagca acttccaaaa atccttcaac11340aaccacgtgc gcacgctgat cgcgcgcgag gaggtgaccc tgggcctgat gcacctgtgg11400gacctgctgg aggccatcgt gcagaacccc acgagcaagc cgctgacggc gcagctgttt11460ctggtggtgc agcacagtcg ggacaacgag acgttcaggg aggcgctgct gaatatcacc11520gagcccgagg gccgctggct cctggacctg gtgaacattt tgcagagcat cgtggtgcag11580gagcgcgggc tgccgctgtc cgagaagctg gcggccatca acttctcggt gctgagtctg11640ggcaagtact acgctaggaa gatctacaag accccgtacg tgcccataga caaggaggtg11700aagatcgacg ggttttacat gcgcatgacc ctgaaagtgc tgaccctgag cgacgatctg11760ggggtgtacc gcaacgacag gatgcaccgc gcggtgagcg ccagccgccg gcgcgagctg11820agcgaccagg agctgatgca cagcctgcag cgggccctga ccggggccgg gaccgagggg11880gagagctact ttgacatggg cgcggacctg cgctggcagc ccagccgccg ggccttggaa11940gctgccggcg gttcccccta cgtggaggag gtggacgatg aggaggagga gggcgagtac12000ctggaagact gatggcgcga ccgtattttt gctagatgca gcaacagcca ccgccgccgc12060ctcctgatcc cgcgatgcgg gcggcgctgc agagccagcc gtccggcatt aactcctcgg12120acgattggac ccaggccatg caacgcatca tggcgctgac gacccgcaat cccgaagcct12180ttagacagca gcctcaggcc aaccggctct cggccatcct ggaggccgtg gtgccctcgc12240gctcgaaccc cacgcacgag aaggtgctgg ccatcgtgaa cgcgctggtg gagaacaagg12300ccatccgcgg tgacgaggcc gggctggtgt acaacgcgct gctggagcgc gtggcccgct12360acaacagcac caacgtgcag acgaacctgg accgcatggt gaccgacgtg cgcgaggcgg12420tgtcgcagcg cgagcggttc caccgcgagt cgaacctggg ctccatggtg gcgctgaacg12480ccttcctgag cacgcagccc gccaacgtgc cccggggcca ggaggactac accaacttca12540tcagcgcgct gcggctgatg gtggccgagg tgccccagag cgaggtgtac cagtcggggc12600cggactactt cttccagacc agtcgccagg gcttgcagac cgtgaacctg agccaggctt12660tcaagaactt gcagggactg tggggcgtgc aggccccggt cggggaccgc gcgacggtgt12720cgagcctgct gacgccgaac tcgcgcctgc tgctgctgct ggtggcgccc ttcacggaca12780gcggcagcgt gagccgcgac tcgtacctgg gctacctgct taacctgtac cgcgaggcca12840tcggacaggc gcacgtggac gagcagacct accaggagat cacccacgtg agccgcgcgc12900tgggccagga ggacccgggc aacctggagg ccaccctgaa cttcctgctg accaaccggt12960cgcagaagat cccgccccag tacgcgctga gcaccgagga ggagcgcatc ctgcgctacg13020tgcagcagag cgtggggctg ttcctgatgc aggagggggc cacgcccagc gcggcgctcg13080acatgaccgc gcgcaacatg gagcccagca tgtacgcccg caaccgcccg ttcatcaata13140agctgatgga ctacttgcat cgggcggccg ccatgaactc ggactacttt accaacgcca13200tcttgaaccc gcactggctc ccgccgcccg ggttctacac gggcgagtac gacatgcccg13260accccaacga cgggttcctg tgggacgacg tggacagcag cgtgttctcg ccgcgtccag13320gaaccaatgc cgtgtggaag aaagagggcg gggaccggcg gccgtcctcg gcgctgtccg13380gtcgcgcggg tgctgccgcg gcggtgcccg aggccgccag ccccttcccg agcctgccct13440tttcgctgaa cagcgtgcgc agcagcgagc tgggtcggct gacgcgaccg cgcctgctgg13500gcgaggagga gtacctgaac gactccttgt tgaggcccga gcgcgagaag aacttcccca13560ataacgggat agagagcctg gtggacaaga tgagccgctg gaagacgtac gcgcacgagc13620acagggacga gccccgagct agcagcgcag gcacccgtag acgccagcgg cacgacaggc13680agcggggact ggtgtgggac gatgaggatt ccgccgacga cagcagcgtgt tggacttgg13740gtgggagtgg tggtaacccg ttcgctcacc tgcgcccccg tatcgggcgc ctgatgtaag13800aatctgaaaa aataaaagac ggtactcacc aaggccatgg cgaccagcgt gcgttcttct13860
ctgttgtttg tagtagtatg atgaggcgcg tgtacccgga gggtcctcct ccctcgtacg13920agagcgtgat gcagcaggcg gtggcggcgg cgatgcagcc cccgctggag gcgccttacg13980tgcccccgcg gtacctggcg cctacggagg ggcggaacag cattcgttac tcggagctgg14040cacccttgta cgataccacc cggttgtacc tggtggacaa caagtcggca gacatcgcct14100cgctgaacta ccagaacgac cacagcaact tcctgaccac cgtggtgcag aacaacgatt14160tcacccccac ggaggccagc acccagacca tcaactttga cgagcgctcg cggtggggcg14220gccagctgaa aaccatcatg cacaccaaca tgcccaacgt gaacgagttc atgtacagca14280acaagttcaa ggcgcgggtg atggtctcgc gcaagacccc caacggggtg gatgatgatt14340atgatggtag tcaggacgag ctgacctacg agtgggtgga gtttgagctg cccgagggca14400acttctcggt gaccatgacc atcgatctga tgaacaacgc catcatcgac aactacttgg14460cggtggggcg gcagaacggg gtgctggaga gcgacatcgg cgtgaagttc gacacgcgca14520acttccggct gggctgggac cccgtgaccg agctggtgat gccgggcgtg tacaccaacg14580aggccttcca ccccgacatc gtcctgctgc ccggctgcgg cgtggacttc accgagagcc14640gcctcagcaa cctgctgggc atccgcaagc ggcagccctt ccaggagggc ttccagatcc14700tgtacgagga cctggagggg ggcaacatcc ccgcgctctt ggatgtcgaa gcctacgaga14760aaagcaagga ggatagcacc gccgcggcga ccgcagccgt ggccaccgcc tctaccgagg14820tgcggggcga taattttgct agcgctgcgg cagcggccga ggcggctgaa accgaaagta14880agatagtcat ccagccggtg gagaaggaca gcaaggacag gagctacaac gtgctcgcgg14940acaagaaaaa caccgcctac cgcagctggt acctggccta caactacggc gaccccgaga15000agggcgtgcg ctcctggacg ctgctcacca cctcggacgt cacctgcggc gtggagcaag15060tctactggtc gctgcccgac atgatgcaag acccggtcac cttccgctcc acgcgtcaag15120ttagcaacta cccggtggtg ggcgccgagc tcctgcccgt ctactccaag agcttcttca15180acgagcaggc cgtctactcg cagcagctgc gcgccttcac ctcgctcacg cacgtcttca15240accgcttccc cgagaaccag atcctcgtcc gcccgcccgc gcccaccatt accaccgtca15300gtgaaaacgt tcctgctctc acagatcacg ggaccctgcc gctgcgcagc agtatccggg15360gagtccagcg cgtgaccgtc actgacgcca gacgccgcac ctgcccctac gtctacaagg15420ccctgggcgt agtcgcgccg cgcgtcctct cgagccgcac cttctaaaaa atgtccattc15480tcatctcgcc cagtaataac accggttggg gcctgcgcgc gcccagcaag atgtacggag15540gcgctcgcca acgctccacg caacaccccg tgcgcgtgcg cgggcacttc cgcgctccct15600ggggcgccct caagggccgc gtgcgctcgc gcaccaccgt cgacgacgtg atcgaccagg15660tggtggccga cgcgcgcaac tacacgcccg ccgccgcgcc cgtctccacc gtggacgccg15720tcatcgacag cgtggtggcc gacgcgcgcc ggtacgcccg caccaagagc cggcggcggc15780gcatcgcccg gcggcaccgg agcacccccg ccatgcgcgc ggcgcgagcc ttgctgcgca15840gggccaggcg cacgggacgc agggccatgc tcagggcggc cagacgcgcg gcctccggca15900gcagcagcgc cggcaggacc cgcagacgcg cggccacggc ggcggcggcg gccatcgcca15960gcatgtcccg cccgcggcgc ggcaacgtgt actgggtgcg cgacgccgcc accggtgtgc16020gcgtgcccgt gcgcacccgc ccccctcgca cttgaagatg ctgacttcgc gatgttgatg16080tgtcccagcg gcgaggagga tgtccaagcg caaatacaag gaagagatgc tccaggtcat16140cgcgcctgag atctacggcc ccgcggcggc ggtgaaggag gaaagaaagc cccgcaaact16200gaagcgggtc aaaaaggaca aaaaggagga ggaagatgac ggactggtgg agtttgtgcg16260cgagttcgcc ccccggcggc gcgtgcagtg gcgcgggcgg aaagtgaaac cggtgctgcg16320gcccggcacc acggtggtct tcacgcccgg cgagcgttcc ggctccgcct ccaagcgctc16380ctacgacgag gtgtacgggg acgaggacat cctcgagcag gcggtcgagc gtctgggcga16440gtttgcgtac ggcaagcgca gccgccccgc gcccttgaaa gaggaggcgg tgtccatccc16500gctggaccac ggcaacccca cgccgagcct gaagccggtg accctgcagc aggtgctacc16560gagcgcggcg ccgcgccggg gcttcaagcg cgagggcggc gaggatctgt acccgaccat16620
gcagctgatg gtgcccaagc gccagaagct ggaggacgtg ctggagcaca tgaaggtgga16680ccccgaggtg cagcccgagg tcaaggtgcg gcccatcaag caggtggccc cgggcctggg16740cgtgcagacc gtggacatca agatccccac ggagcccatg gaaacgcaga ccgagcccgt16800gaagcccagc accagcacca tggaggtgca gacggatccc tggatgccag caccagcttc16860caccagcact cgccgaagac gcaagtacgg cgcggccagc ctgctgatgc ccaactacgc16920gctgcatcct tccatcatcc ccacgccggg ctaccgcggc acgcgcttct accgcggcta16980caccagcagc cgccgccgca agaccaccac ccgccgccgt cgtcgcagcc gccgcagcag17040caccgcgact tccgccttgg tgcggagagt gtatcgcagc gggcgcgagc ctctgaccct17100gccgcgcgcg cgctaccacc cgagcatcgc catttaacta ccgcctccta cttgcagata17160tggccctcac atgccgcctc cgcgtcccca ttacgggcta ccgaggaaga aagccgcgcc17220gtagaaggct gacggggaac gggctgcgtc gccatcacca ccggcggcgg cgcgccatca17280gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc gcggcgatcg17340gggcgatccc cggcatagct tccgtggcgg tgcaggcctc tcagcgccac tgagacacaa17400aaaagcatgg atttgtaata aaaaaaaaaa tggactgacg ctcctggtcc tgtgatgtgt17460gtttttagat ggaagacatc aatttttcgt ccctggcacc gcgacacggc acgcggccgt17520ttatgggcac ctggagcgac atcggcaaca gccaactgaa cgggggcgcc ttcaattgga17580gcagtctctg gagcgggctt aagaatttcg ggtccacgct caaaacctat ggcaacaagg17640cgtggaacag cagcacaggg caggcgctga gggaaaagct gaaagaacag aacttccagc17700agaaggtggt tgatggcctg gcctcaggca tcaacggggt ggttgacctg gccaaccagg17760ccgtgcagaa acagatcaac agccgcctgg acgcggtccc gcccgcgggg tccgtggaga17820tgccccaggt ggaggaggag ctgcctcccc tggacaagcg cggcgacaag cgaccgcgtc17880ccgacgcgga ggagacgctg ctgacgcaca cggacgagcc gcccccgtac gaggaggcgg17940tgaaactggg cctgcccacc acgcggcccg tggcgcctct ggccaccgga gtgctgaaac18000ccagcagcag ccagcccgcg accctggact tgcctccgcc tcgcccctcc acagtggcta18060agcccctgcc gccggtggcc gtcgcgtcgc gcgccccccg aggccgcccc caggcgaact18120ggcagagcac tctgaacagc atcgtgggtc tgggagtgca gagtgtgaag cgccgccgct18180gctattaaaa gacactgtag cgcttaactt gcttgtctgt gtgtatatgt atgtccgccg18240accagaagga ggagtgtgaa gaggcgcgtc gccgagttgc aagatggcca ccccatcgat18300gctgccccag tgggcgtaca tgcacatcgc cggacaggac gcttcggagt acctgagtcc18360gggtctggtg cagttcgccc gcgccacaga cacctacttc agtctgggga acaagtttag18420gaaccccacg gtggcgccca cgcacgatgt gaccaccgac cgcagccagc ggctgacgct18480gcgcttcgtg cccgtggacc gcgaggacaa cacctactcg tacaaagtgc gctacacgct18540ggccgtgggc gacaaccgcg tgctggacat ggccagcacc tactttgaca tccgcggcgt18600gctggaccgg ggccctagct tcaaacccta ctctggcacc gcctacaaca gcctagctcc18660caagggagct cccaattcca gccagtggga gcaagcaaaa acaggcaatg ggggaactat18720ggaaacacac acatatggtg tggccccaat gggcggagag aatattacaa aagatggtct18780tcaaattgga actgacgtta cagcgaatca gaataaacca atttatgccg acaaaacatt18840tcaaccagaa ccgcaagtag gagaagaaaa ttggcaagaa actgaaaact tttatggcgg18900tagagctctt aaaaaagaca caaacatgaa accttgctat ggctcctatg ctagacccac18960caatgaaaaa ggaggtcaag ctaaacttaa agttggagat gatggagttc caaccaaaga19020attcgacata gacctggctt tctttgatac tcccggtggc accgtgaacg gtcaagacga19080gtataaagca gacattgtca tgtataccga aaacacgtat ttggaaactc cagacacgca19140tgtggtatac aaaccaggca aggatgatgc aagttctgaa attaacctgg ttcagcagtc19200tatgcccaac agacccaact acattgggtt cagggacaac tttatcggtc ttatgtacta19260caacagcact ggcaatatgg gtgtgcttgc tggtcaggcc tcccagctga atgctgtggt19320tgatttgcaa gacagaaaca ccgagctgtc ctaccagctc ttgcttgact ctttgggtga19380
cagaacccgg tatttcagta tgtggaacca ggcggtggac agttatgacc ccgatgtgcg19440catcatcgaa aaccatggtg tggaggatga attgccaaac tattgcttcc ccttggacgg19500ctctggcact aacgccgcat accaaggtgt gaaagtaaaa gatggtcaag atggtgatgt19560tgagagtgaa tgggaaaatg acgatactgt tgcagctcga aatcaattat gtaaaggtaa19620cattttcgcc atggagatta atctccaggc taacctgtgg agaagtttcc tctactcgaa19680cgtggccctg tacctgcccg actcctacaa gtacacgccg accaacgtca cgctgccgac19740caacaccaac acctacgatt acatgaatgg cagagtgaca cctccctcgc tggtagacgc19800ctacctcaac atcggggcgc gctggtcgct ggaccccatg gacaacgtca accccttcaa19860ccaccaccgc aacgcgggcc tgcgctaccg ctccatgctc ctgggcaacg ggcgctacgt19920gcccttccac atccaggtgc cccaaaagtt tttcgccatc aagagcctcc tgctcctgcc19980cgggtcctac acctacgagt ggaacttccg caaggacgtc aacatgatcc tgcagagctc20040cctaggcaac gacctgcgca cggacggggc ctccatcgcc ttcaccagca tcaacctcta20100cgccaccttc ttccccatgg cgcacaacac cgcctccacg ctcgaggcca tgctgcgcaa20160cgacaccaac gaccagtcct tcaacgacta cctctcggcg gccaacatgc tctaccccat20220cccggccaac gccaccaacg tgcccatctc catcccctcg cgcaactggg ccgccttccg20280cggatggtcc ttcacgcgcc tgaagacccg cgagacgccc tcgctcggct ccgggttcga20340cccctacttc gtctactcgg gctccatccc ctacctagac ggcaccttct acctcaacca20400caccttcaag aaggtctcca tcaccttcga ctcctccgtc agctggcccg gcaacgaccg20460cctcctgacg cccaacgagt tcgaaatcaa gcgcaccgtc gacggagagg gatacaacgt20520ggcccagtgc aacatgacca aggactggtt cctggtccag atgctggccc actacaacat20580cggctaccag ggcttctacg tgcccgaggg ctacaaggac cgcatgtact ccttcttccg20640caacttccag cccatgagcc gccaggtcgt ggacgaggtc aactacaagg actaccaggc20700cgtcaccctg gcctaccagc acaacaactc gggcttcgtc ggctacctcg cgcccaccat20760gcgccagggc cagccctacc ccgccaacta cccctacccg ctcatcggca agagcgccgt20820cgccagcgtc acccagaaaa agttcctctg cgaccgggtc atgtggcgca tccccttctc20880cagcaacttc atgtccatgg gcgcgctcac cgacctcggc cagaacatgc tctacgccaa20940ctccgcccac gcgctagaca tgaatttcga agtcgacccc atggatgagt ccacccttct21000ctatgttgtc ttcgaagtct tcgacgtcgt ccgagtgcac cagccccacc gcggcgtcat21060cgaagccgtc tacctgcgca cgcccttctc ggccggcaac gccaccacct aagccgctct21120tgcttcttgc aagatgacgg cgggctccgg cgagcaggag ctcagggcca tcctccgcga21180cctgggctgc gggccctgct tcctgggcac cttcgacaag cgcttccctg gattcatggc21240cccgcacaag ctggcctgcg ccatcgtgaa cacggccggc cgcgagaccg ggggcgagca21300ctggctggcc ttcgcctgga acccgcgctc ccacacatgc tacctcttcg accccttcgg21360gttctcggac gagcgcctca agcagatcta ccagttcgag tacgagggcc tgctgcgtcg21420cagcgccctg gccaccgagg accgctgcgt caccctggaa aagtccaccc agaccgtgca21480gggtccgcgc tcggccgcct gcgggctctt ctgctgcatg ttcctgcacg ccttcgtgca21540ctggcccgac cgccccatgg acaagaaccc caccatgaac ttactgacgg gggtgcccaa21600cggcatgctc cagtcgcccc aggtggaacc caccctgcgc cgcaaccagg aagcgctcta21660ccgcttcctc aatgcccact ccgcctactt tcgctcccac cgcgcgcgca tcgagaaggc21720caccgccttc gaccgcatga atcaagacat gtaaaaaacc ggtgtgtgta tgtgaatgct21780ttattcataa taaacagcac atgtttatgc caccttctct gaggctctga ctttatttag21840aaatcgaagg ggttctgccg gctctcggca tggcccgcgg gcagggatac gttgcggaac21900tggtacttgg gcagccactt gaactcgggg atcagcagct tgggcacggg gaggtcgggg21960aacgagtcgc tccacagctt gcgcgtgagt tgcagggcgc ccagcaggtc gggcgcggag22020atcttgaaat cgcagttggg acccgcgttc tgcgcgcgag agttgcggta cacggggttg22080cagcactgga acaccatcag ggccgggtgc ttcacgcttg ccagcaccgt cgcgtcggtg22140
atgccctcca cgtccagatc ctcggcgttg gccatcccga agggggtcat cttgcaggtc22200tgccgcccca tgctgggcac gcagccgggc ttgtggttgc aatcgcagtg cagggggatc22260agcatcatct gggcctgctc ggagctcatg cccgggtaca tggccttcat gaaagcctcc22320agctggcgga aggcctgctg cgccttgccg ccctcggtga agaagacccc gcaggacttg22380ctagagaact ggttggtggc gcagccggcg tcgtgcacgc agcagcgcgc gtcgttgttg22440gccagctgca ccacgctgcg cccccagcgg ttctgggtga tcttggcccg gttggggttc22500tccttcagcg cgcgctgccc gttctcgctc gccacatcca tctcgatagt gtgctccttc22560tggatcatca cggtcccgtg caggcaccgc agcttgccct cggcttcggt gcagccgtgc22620agccacagcg cgcagccggt gcactcccag ttcttgtggg cgatctggga gtgcgagtgc22680acgaagccct gcaggaagcg gcccatcatc gcggtcaggg tcttgttgct ggtgaaggtc22740agcgggatgc cgcggtgctc ctcgttcaca tacaggtggc agatgcggcg gtacacctcg22800ccctgctcgg gcatcagctg gaaggcggac ttcaggtcgc tctccacgcg gtaccggtcc22860atcagcagcg tcatcacttc catgcccttc tcccaggccg aaacgatcgg caggctcagg22920gggttcttca ccgccattgt catcttagtc gccgccgccg aggtcagggg gtcgttctcg22980tccagggtct caaacactcg cttgccgtcc ttctcgatga tgcgcacggg gggaaagctg23040aagcccacgg ccgccagctc ctcctcggcc tgcctttcgt cctcgctgtc ctggctgatg23100tcttgcaaag gcacatgctt ggtcttgcgg ggtttctttt tgggcggcag aggcggcggc23160gatgtgctgg gagagcgcga gttctcgttc accacgacta tttcttcttc ttggccgtcg23220tccgagacca cgcggcggta ggcatgcctc ttctggggca gaggcggagg cgacgggctc23280tcgcggttcg gcgggcggct ggcagagccc cttccgcgtt cgggggtgcg ctcctggcgg23340cgctgctctg actgacttcc tccgcggccg gccattgtgt tctcctaggg agcaacaaca23400agcatggaga ctcagccatc gtcgccaaca tcgccatctg cccccgccgc caccgccgac23460gagaaccagc agcagaatga aagcttaacc gccccgccgc ccagccccac ctccgacgcc23520gcggccccag acatgcaaga gatggaggaa tccatcgaga ttgacctggg ctacgtgacg23580cccgcggagc acgaggagga gctggcagcg cgcttttcag ccccggaaga gaaccaccaa23640gagcagccag agcaggaagc agagaacgag cagaaccagg ctgggcacga gcatggcgac23700tacctgagcg gggcagagga cgtgctcatc aagcatctgg cccgccaatg catcatcgtc23760aaggacgcgc tgctcgaccg cgccgaggtg cccctcagcg tggcggagct cagccgcgcc23820tacgagcgca acctcttctc gccgcgcgtg ccccccaagc gccagcccaa cggcacctgt23880gagcccaacc cgcgcctcaa cttctacccg gtcttcgcgg tgcccgaggc cctggccacc23940taccacctct ttttcaagaa ccaaaggatc cccgtctcct gccgcgccaa ccgcacccgc24000gccgacgccc tgctcaacct gggccccggc gcccgcctac ctgatatcac ctccttggaa24060gaggttccca agatcttcga gggtctgggc agcgacgaga ctcgggccgc gaacgctctg24120caaggaagcg gagaggagca tgagcaccac agcgccctgg tggagttgga aggcgacaac24180gcgcgcctgg cggtcctcaa gcgcacggtc gagctgaccc acttcgccta cccggcgctc24240aacctgcccc ccaaggtcat gagcgccgtc atggaccagg tgctcatcaa gcgcgcctcg24300cccctctcgg aggaggagat gcaggacccc gagagttcgg acgagggcaa gcccgtggtc24360agcgacgagc agctggcgcg ctggctggga gcgagtagca ccccccagag cctggaagag24420cggcgcaagc tcatgatggc cgtggtcctg gtgaccgtgg agctggagtg tctgcgccgc24480ttctttgccg acgcggagac cctgcgcaag gtcgaggaga acctgcacta cctcttcagg24540cacgggttcg tgcgccaggc ctgcaagatc tccaacgtgg agctgaccaa cctggtctcc24600tacatgggca tcctgcacga gaaccgcctg gggcaaaacg tgctgcacac caccctgcgc24660ggggaggccc gccgcgacta catccgcgac tgcgtctacc tgtacctctg ccacacctgg24720cagacgggca tgggcgtgtg gcagcagtgc ctggaggagc agaacctgaa agagctctgc24780aagctcctgc agaagaacct caaggccctg tggaccgggt tcgacgagcg taccaccgcc24840tcggacctgg ccgacctcat cttccccgag cgcctgcggc tgacgctgcg caacgggctg24900
cccgacttta tgagccaaag catgttgcaa aactttcgct ctttcatcct cgaacgctcc24960gggatcctgc ccgccacctg ctccgcgctg ccctcggact tcgtgccgct gaccttccgc25020gagtgccccc cgccgctctg gagccactgc tacttgctgc gcctggccaa ctacctggcc25080taccactcgg acgtgatcga ggacgtcagc ggcgagggtc tgctggagtg ccactgccgc25140tgcaacctct gcacgccgca ccgctccctg gcctgcaacc cccagctgct gagcgagacc25200cagatcatcg gcaccttcga gttgcaaggc cccggcgacg gcgagggcaa ggggggtctg25260aaactcaccc cggggctgtg gacctcggcc tacttgcgca agttcgtgcc cgaggactac25320catcccttcg agatcaggtt ctacgaggac caatcccagc cgcccaaggc cgagctgtcg25380gcctgcgtca tcacccaggg ggccatcctg gcccaattgc aagccatcca gaaatcccgc25440caagaatttc tgctgaaaaa gggccacggg gtctacttgg acccccagac cggagaggag25500ctcaacccca gcttccccca ggatgccccg aggaagcagc aagaagctga aagtggagct25560gccgccgccg gaggatttgg aggaagactg ggagagcagt caggcagagg aggaggagat25620ggaagactgg gacagcactc aggcagagga ggacagcctg caagacagtc tggaggagga25680agacgaggtg gaggaggcag aggaagaagc agccgccgcc agaccgtcgt cctcggcgga25740gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcgcggcg gccgggccca25800cagtaggtgg gacgagaccg ggcgcttccc gaaccccacc acccagaccg gtaagaagga25860gcggcaggga tacaagtcct ggcgggggca caaaaacgcc atcgtctcct gcttgcaagc25920ctgcgggggc aacatctcct tcacccggcg ctacctgctc ttccaccgcg gggtgaactt25980cccccgcaac atcttgcatt actaccgtca cctccacagc ccctactact gtttccaaga26040agaggcagaa acccagcagc agcagaaaac cagcggcagc agcagctaga aaatccacag26100cggcggcagg tggactgagg atcgcggcga acgagccggc gcagacccgg gagctgagga26160accggatctt tcccaccctc tatgccatct tccagcagag tcgggggcag gagcaggaac26220tgaaagtcaa gaaccgttct ctgcgctcgc tcacccgcag ttgtctgtat cacaagagcg26280aagaccaact tcagcgcact ctcgaggacg ccgaggctct cttcaacaag tactgcgcgc26340tcactcttaa agagtagccc gcgcccgccc acacacggaa aaaggcggga attacgtcac26400cacctgcgcc cttcgcccga ccatcatgag caaagagatt cccacgcctt acatgtggag26460ctaccagccc cagatgggcc tggccgccgg cgccgcccag gactactcca cccgcatgaa26520ctggctcagt gccgggcccg cgatgatctc acgggtgaat gacatccgcg cccaccgaaa26580ccagatactc ctagaacagt cagcgatcac cgccacgccc cgccatcacc ttaatccgcg26640taattggccc gccgccctgg tgtaccagga aattccccag cccacgaccg tactacttcc26700gcgagacgcc caggccgaag tccagctgac taactcaggt gtccagctgg ccggcggcgc26760cgccctgtgt cgtcaccgcc ccgctcaggg tataaagcgg ctggtgatcc gaggcagagg26820cacacagctc aacgacgagg tggtgagctc ttcgctgggt ctgcgacctg acggagtctt26880ccaactcgcc ggatcgggga gatcttcctt cacgcctcgt caggccgtcc tgactttgga26940gagttcgtcc tcgcagcccc gctcgggcgg catcggcact ctccagttcg tggaggagtt27000cactccctcg gtctacttca accccttctc cggctccccc ggccactacc cggacgagtt27060catcccgaac ttcgacgcca tcagcgagtc ggtggacggc tacgattgaa tgtcccatgg27120tggcgcagct gacctagctc ggcttcgaca cctggaccac tgccgccgct tccgctgctt27180cgctcgggat ctcgccgagt ttgcctactt tgagctgccc gaggagcacc ctcagggccc27240agcccacgga gtgcggatca tcgtcgaagg gggcctcgac tcccacctgc ttcggatctt27300cagccagcga ccgatcctgg tcgagcgcga acaaggacag acccttctta ctttgtactg27360catctgcaac caccccggcc tgcatgaaag tctttgttgt ctgctgtgta ctgagtataa27420taaaagctga gatcagcgac tactccggac tcgattgtgg tgttcctgct atcaaccggt27480ccctgttctt caccgggaac gagaccgagc tccagctcca gtgtaagccc cacaagaagt27540acctcacctg gctgttccag ggctccccga tcgccgttgt caaccactgc gacaacgacg27600gagtcctgct gagcggccct gccaacctta ctttttccac ccgcagaagc aagctccagc27660
tcttccaacc cttcctcccc gggacctatc agtgcgtctc aggaccctgc catcacacct27720tccacctgat cccgaatacc acagcgccgc tccccgctac taacaaccaa actacccacc27780aacgccaccg tcgcgacctt tcctctgaat ctaataccac taccggaggt gagctccgag27840gtcgaccaac ctctgggatt tactacggcc cctgggaggt ggtggggtta atagcgctag27900gcctagttgc gggtgggctt ttggttctct gctacctata cctcccttgc tgttcgtact27960tagtggtgct gtgttgctgg tttaagaaat ggggaagatc accctagtga gctgcggtgc28020gctggtggcg gtgttgcttt cgattgtggg actgggcggc gcggctgtag tgaaggagaa28080ggccgatccc tgcttgcatt tcaatcccaa caaatgccag ctgagttttc agcccgatgg28140caatcggtgc gcggtactga tcaagtgcgg atgggaatgc gagaacgtga gaatcgagta28200caataacaag actcggaaca atactctcgc gtccgtgtgg cagcccgggg accccgagtg28260gtacaccgtc tctgtccccg gtgctgacgg ctccccgcgc accgtgaata atactttcat28320ttttgcgcac atgtgcaaca cggtcatgtg gatgagcaag cagtacgata tgtggccccc28380cacgaaggag aacatcgtgg tcttctccat cgcttacagc ctgtgcacgg cgctaatcac28440cgctatcgtg tgcctgagca ttcacatgct catcgctatt cgccccagaa ataatgccga28500gaaagagaaa cagccataac acgttttttc acacaccttg tttttacaga caatgcgtct28560gttaaatttt ttaaacattg tgctcagtat tgcttatgcc tctggttatg caaacataca28620gaaaaccctt tatgtaggat ctgatggtac actagagggt acccaatcac aagccaaggt28680tgcatggtat ttttatagaa ccaacactga tccagttaaa ctttgtaagg gtgaattgcc28740gcgtacacat aaaactccac ttacatttag ttgcagcaat aataatctta cacttttttc28800aattacaaaa caatatactg gtacttatta cagtacaaac tttcatacag gacaagataa28860atattatact gttaaggtag aaaatcctac cactcctaga actaccacca ccaccactac28920tgcaaagccc actgtgaaaa ctacaactag gaccaccaca actacagaaa ccaccaccag28980cacaacactt gctgcaacta cacacacaca cactaagcta accttacaga ccactaatga29040tttgatcgcc ctgctgcaaa agggggataa cagcaccact tccaatgagg agatacccaa29100atccatgatt ggcattattg ttgctgtagt ggtgtgcatg ttgatcatcg ccttgtgcat29160ggtgtactat gccttctgct acagaaagca cagactgaac gacaagctgg aacacttact29220aagtgttgaa ttttaatttt ttagaaccat gaagatccta ggccttttta gtttttctat29280cattacctct gctctttgtg aatcagtgga tagagatgtt actattacca ctggttctaa29340ttatacactg aaagggccac cctcaggtat gctttcgtgg tattgctatt ttggaactga29400cactgatcaa actgaattat gcaattttca aaaaggcaaa acctcaaact ctaaaatctc29460taattatcaa tgcaatggca ctgatctgat actactcaat gtcacgaaag catatggtgg29520cagttattat tgccctggac aaaacactga agaaatgatt ttttacaaag tggaagtggt29580tgatcccact acaccaccca ccaccacaac tattcatacc acacacacag aacaaacacc29640agaggcaaca gaagcagagt tggccttcca ggttcacgga gattcctttg ctgtcaatac29700ccctacaccc gatcagcggt gtccggggcc gctagtcagc ggcattgtcg gtgtgctttc29760gggattagca gtcataatca tctgcatgtt catttttgct tgctgctata gaaggcttta29820ccgacaaaaa tcagacccac tgctgaacct ctatgtttaa ttttttccag agccatgaag29880gcagttagcg ctctagtttt ttgttctttg attggcattg tttttaatag taaaattacc29940agagttagct ttattaaaca tgttaatgta actgaaggag ataacatcac actagcaggt30000gtagaaggtg ctcaaaacac cacctggaca aaataccatc taggatggag agatatttgc30060acctggaatg taacttatta ttgcatagga gttaatctta ccattgttaa cgctaaccaa30120tctcagaatg ggttaattaa aggacagagt gttagtgtga ccagtgatgg gtactatacc30180cagcatagtt ttaactacaa cattactgtc ataccactgc ctacgcctag cccacctagc30240actaccacac agacaaccac atacagtaca tcaaatcagc ctaccaccac tacagcagca30300gaggttgcca gctcgtctgg ggtccgagtg gcatttttga tgttggcccc atctagcagt30360cccactgcta gtaccaatga gcagactact gaatttttgt ccactgtcga gagccacacc30420
acagctacct ccagtgcctt ctctagcacc gccaatctct cctcgctttc ctctacacca30480atcagccccg ctactactcc tagccccgct cctcttccca ctcccctgaa gcaaacagac30540ggcggcatgc aatggcagat caccctgctc attgtgatcg ggttggtcat cctggccgtg30600ttgctctact acatcttctg ccgccgcatt cccaacgcgc accgcaagcc ggcctacaag30660cccatcgtta tcgggcagcc ggagccgctt caggtggaag ggggtctaag gaatcttctc30720ttctctttta cagtatggtg attgaactat gattcctaga caattcttga tcactattct30780tatctgcctc ctccaagtct gtgccaccct cgctctggtg gccaacgcca gtccagactg30840tattgggccc ttcgcctcct acgtgctctt tgccttcgtc acctgcatct gctgctgtag30900catagtctgc ctgcttatca ccttcttcca gttcattgac tggatctttg tgcgcatcgc30960ctacctgcgc caccaccccc agtaccgcga ccagcgagtg gcgcagctgc tcaggctcct31020ctgataagca tgcgggctct gctacttctc gcgcttctgc tgttagtgct cccccgtccc31080gtcgaccccc ggtcccccac tcagtccccc gaggaggttc gcaaatgcaa attccaagaa31140ccctggaaat tcctcaaatg ctaccgccaa aaatcagaca tgcatcccag ctggatcatg31200atcattggga tcgtgaacat tctggcctgc accctcatct cctttgtgat ttacccctgc31260tttgactttg gttggaactc gccagaggcg ctctatctcc cgcctgaacc tgacacacca31320ccacagcagc aacctcaggc acacgcacta ccaccaccac agcctaggcc acaatacatg31380cccatattag actatgaggc cgagccacag cgacccatgc tccccgctat tagttacttc31440aatctaaccg gcggagatga ctgacccact ggccaataac aacgtcaacg accttctcct31500ggacatggac ggccgcgcct cggagcagcg actcgcccaa cttcgcattc gtcagcagca31560ggagagagcc gtcaaggagc tgcaggacgg catagccatc caccagtgca agagaggcat31620cttctgcctg gtgaaacagg ccaagatctc ctacgaggtc acccagaccg accatcgcct31680ctcctacgag ctcctgcagc agcgccagaa gttcacctgc ctggtcggag tcaaccccat31740cgtcatcacc cagcagtcgg gcgataccaa ggggtgcatc cactgctcct gcgactcccc31800cgactgcgtc cacactctga tcaagaccct ctgcggcctc cgcgacctcc tccccatgaa31860ctaatcaccc ccttatccag tgaaataaag atcatattga tgatgattta aataaaaaaa31920ataatcattt gatttgaaat aaagatacaa tcatattgat gatttgagtt taacaaaaat31980aaagaatcac ttacttgaaa tctgatacca ggtctctgtc catgttttct gccaacacca32040cctcactccc ctcttcccag ctctggtact gcaggccccg gcgggctgca aacttcctcc32100acacgctgaa ggggatgtca aattcctcct gtccctcaat cttcatttta tcttctatca32160gatgtccaaa aagcgcgtcc gggtggatga tgacttcgac cccgtctacc cctacgatgc32220agacaacgca ccgaccgtgc ccttcatcaa cccccccttc gtctcttcag atggattcca32280agagaagccc ctgggggtgt tgtccctgcg actggctgac cccgtcacca ccaagaacgg32340ggaaatcacc ctcaagctgg gagagggggt ggacctcgac tcgtcgggaa aactcatctc32400caacacggcc accaaggccg ccgcccctct cagtatttca aacaacacca tttcccttaa32460aactgctgcc cctttctaca acaacaatgg aactttaagc ctcaatgtct ccacaccatt32520agcagtattt cccacattta acactttagg cataagtctt ggaaacggtc ttcagacttc32580aaataagttg ttgactgtac aactaactca tcctcttaca ttcagctcaa atagcatcac32640agtaaaaaca gacaaagggc tatatattaa ctccagtgga aacagaggac ttgaggctaa32700tataagccta aaaagaggac tagtttttga cggtaatgct attgcaacat atattggaaa32760tggcttagac tatggatctt atgatagtga tggaaaaaca agacccgtaa ttaccaaaat32820tggagcagga ttaaattttg atgctaacaa agcaatagct gtcaaactag gcacaggttt32880aagttttgac tccgctggtg ccttgacagc tggaaacaaa caggatgaca agctaacact32940ttggactacc cctgacccaa gccctaattg tcaattactt tcagacagag atgccaaatt33000tactctctgt cttacaaaat gcggtagtca aatactaggc actgtggcag tggcggctgt33060tactgtagga tcagcactaa atccaattaa tgacacagtc aaaagcgcca tagttttcct33120tagatttgat tccgatggtg tactcatgtc aaactcatca atggtaggtg attactggaa33180
ctttagggag ggacagacca ctcaaagtgt agcctataca aatgctgtgg gattcatgcc33240aaatataggt gcatatccaa aaacccaaag taaaacacct aaaaatagca tagtcagtca33300ggtatattta actggagaaa ctactatgcc aatgacacta accataactt tcaatggcac33360tgatgaaaaa gacacaaccc cagttagcac ctactctatg acttttacat ggcagtggac33420tggagactat aaggacaaaa atattacctt tgctaccaac tcattctctt tttcctacat33480cgcccaggaa taatcccacc cagcaagcca accccttttc ccaccacctt tgtctatatg33540gaaactctga aacagaaaaa taaagttcaa gtgttttatt gaatcaacag ttttacagga33600ctcgagcagt tatttttcct ccaccctccc aggacatgga atacaccacc ctctcccccc33660gcacagcctt gaacatctga atgccattgg tgatggacat gcttttggtc tccacgttcc33720acacagtttc agagcgagcc agtctcggat cggtcaggga gatgaaaccc tccgggcact33780cccgcatctg cacctcacag ctcaacagct gaggattgtc ctcggtggtc gggatcacgg33840ttatctggaa gaagcagaag agcggcggtg ggaatcatag tccgcgaacg ggatcggccg33900gtggtgtcgc atcaggcccc gcagcagtcg ctgccgccgc cgctccgtca agctgctgct33960cagggggttc gggtccaggg actccctcag catgatgccc acggccctca gcatcagtcg34020tctggtgcgg cgggcgcagc agcgcatgcg aatctcgctc aggtcactgc agtacgtgca34080acacaggacc accaggttgt tcaacagtcc atagttcaac acgctccagc cgaaactcat34140cgcgggaagg atgctaccca cgtggccgtc gtaccagatc ctcaggtaaa tcaagtggcg34200ctccctccag aagacgctgc ccatgtacat gatctccttg ggcatgtggc ggttcaccac34260ctcccggtac cacatcaccc tctggttgaa catgcagccc cggatgatcc tgcggaacca34320cagggccagc accgccccgc ccgccatgca gcgaagagac cccggatccc ggcaatgaca34380atggaggacc caccgctcgt acccgtggat catctgggag ctgaacaagt ctatgttggc34440acagcacagg catatgctca tgcatctctt cagcactctc agctcctcgg gggtcaaaac34500catatcccag ggcacgggga actcttgcag gacagcgaac cccgcagaac agggcaatcc34560tcgcacataa cttacattgt gcatggacag ggtatcgcaa tcaggcagca ccgggtgatc34620ctccaccaga gaagcgcggg tctcggtctc ctcacagcgt ggtaaggggg ccggccgata34680cgggtgatgg cgggacgcgg ctgatcgtgt tctcgaccgt gtcatgatgc agttgctttc34740ggacattttc gtacttgctg tagcagaacc tggtccgggc gctgcacacc gatcgccggc34800ggcggtctcg gcgcttggaa cgctcggtgt taaagttgta aaacagccac tctctcagac34860cgtgcagcag atctagggcc tcaggagtga tgaagatccc atcatgcctg atagctctga34920tcacatcgac caccgtggaa tgggccaggc ccagccagat gatgcaattt tgttgggttt34980cggtgacggc gggggaggga agaacaggaa gaaccatgat taacttttaa tccaaacggt35040ctcggagcac ttcaaaatga aggtcacgga gatggcacct ctcgcccccg ctgtgttggt35100ggaaaataac agccaggtca aaggtgatac ggttctcgag atgttccacg gtggcttcca35160gcaaagcctc cacgcgcaca tccagaaaca agacaatagc gaaagcggga gggttctcta35220attcctcaac catcatgtta cactcctgca ccatccccag ataattttca tttttccagc35280cttgaatgat tcgaactagt tcctgaggta aatccaagcc agccatgata aaaagctcgc35340gcagagcacc ctccaccggc attcttaagc acaccctcat aattccaaga tattctgctc35400ctggttcacc tgcagcagat tgacaagcgg aatatcaaaa tctctgccgc gatccctgag35460ctcctccctc agcaataact gtaagtactc tttcatatcg tctccgaaat ttttagccat35520aggaccccca ggaataagag aagggcaagc cacattacag ataaaccgaa gtccccccca35580gtgagcattg ccaaatgtaa gattgaaata agcatgctgg ctagacccgg tgatatcttc35640cagataactg gacagaaaat cgggtaagca atttttaaga aaatcaacaa aagaaaaatc35700ttccaggtgc acgtttaggg cctcgggaac aacgatggag taagtgcaag gggtgcgttc35760cagcatggtt agttagctga tctgtaaaaa aacaaaaaat aaaacattaa accatgctag35820cctggcgaac aggtgggtaa atcgttctct ccagcaccag gcaggccacg gggtctccgg35880cgcgaccctc gtaaaaattg tcgctatgat tgaaaaccat cacagagaga cgttcccggt35940
ggccggcgtg aatgattcga gaagaagcat acacccccgg aacattggag tccgtgagtg36000aaaaaaagcg gccgaggaag caatgaggca ctacaacgct cactctcaag tccagcaaag36060cgatgccatg cggatgaagc acaaaatttt caggtgcgta aaaaatgtaa ttactcccct36120cctgcacagg cagcgaagct cccgatccct ccagatacac atacaaagcc tcagcgtcca36180tagcttaccg agcggcagca gcagcggcac acaacaggcg caagagtcag agaaaagact36240gagctctaac ctgtccgccc gctctctgct caatatatag ccccagatct acactgacgt36300aaaggccaaa gtctaaaaat acccgccaaa taatcacaca cgcccagcac acgcccagaa36360accggtgaca cactcagaaa aatacgcgca cttcctcaaa cggccaaact gccgtcattt36420ccgggttccc acgctacgtc atcaaaacac gactttcaaa ttccgtcgac cgttaaaaac36480atcacccgcc ccgcccctaa cggtcgccgc tcccgcagcc aatcaccttc ctccctcccc36540aaattcaaac agctcatttg catattaacg cgcaccaaaa gtttgaggta tattattgat36600gatg 36604<210>3<211>36535<212>DNA<213>黑猩猩腺病毒血清型Pan7<400>3catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg agctgtttga 60atttggggag ggaggaaggt gattggccga gagacgggcg accgttaggg gcggggcggg 120tgacgttttt aatacgtggc cgtgaggcgg agccggtttg caagttctcg tgggaaaagt 180gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca 240ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg 300aatgaggaag tgaaaatctg agtaatttcg cgtttatggc agggaggagt atttgccgag 360ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat 420ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggc gtcagctgat cgccagggta 480tttaaacctg cgctctctag tcaagaggcc actcttgagt gccagcgagt agagttttct 540cctccgcgcc gcgagtcaga tctacacttt gaaagatgag gcacctgaga gacctgcccg 600gtaatgtttt cctggctact gggaacgaga ttctggaatt ggtggtggac gccatgatgg 660gtggcgaccc tcctgagccc cctaccccat ttgaggcgcc ttcgctgtac gatttgtatg 720atctggaggt ggatgtgccc gagaacgacc ccaacgagga ggcggtgaat gatttgttta 780gcgatgccgc gctgctggct gccgagcagg ctaatacgga ctctggctca gacagcgatt 840cctctctcca taccccgaga cccggcagag gtgagaaaaa gatccccgag cttaaagggg 900aagagctcga cctgcgctgc tatgaggaat gcttgcctcc gagcgatgat gaggaggacg 960aggaggcgat tcgagctgca tcgaaccagg gagtgaaagc tgcgggcgaa agctttagcc 1020tggactgtcc tactctgccc ggacacggct gtaagtcttg tgaatttcat cgcatgaata 1080ctggagataa gaatgtgatg tgtgccctgt gctatatgag agcttacaac cattgtgttt 1140acagtaagtg tgattaactt tagttgggaa ggcagagggt gactgggtgc tgactggttt 1200atttatgtat atgttttttt atgtgtaggt cccgtctctg acgtagatga gacccccact 1260tcagagtgca tttcatcacc cccagaaatt ggcgaggaac cgcccgaaga tattattcat 1320agaccagttg cagtgagagt caccgggcgg agagcagctg tggagagttt ggatgacttg 1380ctacagggtg gggatgaacc tttggacttg tgtacccgga aacgccccag gcactaagtg 1440ccacacatgt gtgtttactt aaggtgatgt cagtatttat agggtgtgga gtgcaataaa 1500atccgtgttg actttaagtg cgtggtttat gactcagggg tggggactgt gggtatataa 1560gcaggtgcag acctgtgtgg tcagttcaga gcaggactca tggagatctg gacggtcttg 1620
gaagactttc accagactag acagctgcta gagaactcat cggagggggt ctcttacctg1680tggagattct gcttcggtgg gcctctagct aagctagtct atagggccaa acaggattat1740aaggatcaat ttgaggatat tttgagagag tgtcctggta tttttgactc tctcaacttg1800ggccatcagt ctcactttaa ccagagtatt ctgagagccc ttgacttttc tactcctggc1860agaactaccg ccgcggtagc cttttttgcc tttatccttg acaaatggag tcaagaaacc1920catttcagca gggattaccg tctggactgc ttagcagtag ctttgtggag aacatggagg1980tgccagcgcc tgaatgcaat ctccggctac ttgccagtac agccggtaga cacgctgagg2040atcctgagtc tccagtcacc ccaggaacac caacgccgcc agcagccgca gcaggagcag2100cagcaagagg aggaggagga tcgagaagag aacccgagag ccggtctgga ccctccggtg2160gcggaggagg aggagtagct gacttgtttc ccgagctgcg ccgggtgctg actaggtctt2220ccagtggacg ggagaggggg attaagcggg agaggcatga ggagactagc cacagaactg2280aactgactgt cagtctgatg agccgcaggc gcccagaatc ggtgtggtgg catgaggttc2340agtcgcaggg gatagatgag gtctcggtga tgcatgagaa atattccctg gaacaagtca2400agacttgttg gttggagcct gaggatgatt gggaggtagc catcaggaat tatgccaagc2460tggctctgaa gccagacaag aagtacaaga ttaccaaact gattaatatc agaaattcct2520gctacatttc agggaatggg gccgaggtgg agatcagtac ccaggagagg gtggccttca2580gatgttgtat gatgaatatg tacccggggg tggtgggcat ggagggagtc acctttatga2640acgcgaggtt caggggtgat gggtataatg gggtggtctt tatggccaac accaagctga2700cagtgcacgg atgctccttc tttgggttca ataacatgtg catcgaggcc tggggcagtg2760tttcagtgag gggatgcagc ttttcagcca actggatggg ggtcgtgggc agaaccaaga2820gcaaggtgtc agtgaagaaa tgcctgttcg agaggtgcca cctgggggtg atgagcgagg2880gcgaagccaa agtcaaacac tgcgcctcta ctgagacggg ctgctttgtg ctgatcaagg2940gcaatgccca agtcaagcat aacatgatct gtggggcctc ggatgagcgc ggctaccaga3000tgctgacctg cgccggtggg aacagccata tgctggccac cgtgcatgtg acctcgcacc3060cccgcaagac atggcccgag ttcgagcaca acgtcatgac ccgatgcaat gtgcacctgg3120ggtcccgccg aggcatgttc atgccctacc agtgcaacat gcaatttgtg aaggtgctgc3180tggagcccga tgccatgtcc agagtgagcc tgacgggggt gtttgacatg aatgtggagc3240tgtggaaaat tctgagatat gatgaatcca agaccaggtg ccgggcctgc gaatgcggag3300gcaagcacgc caggcttcag cccgtgtgtg tggaggtgac ggaggacctg cgacccgatc3360atttggtgtt gtcctgcaac gggacggagt tcggctccag cggggaagaa tctgactaga3420gtgagtagtg tttgggggag gtggagggct tgtatgaggg gcagaatgac taaaatctgt3480gtttttctgt gtgttgcagc agcatgagcg gaagcgcctc ctttgaggga ggggtattca3540gcccttatct gacggggcgt ctcccctcct gggcgggagt gcgtcagaat gtgatgggat3600ccacggtgga cggccggccc gtgcagcccg cgaactcttc aaccctgacc tacgcgaccc3660tgagctcctc gtccgtggac gcagctgccg ccgcagctgc tgcttccgcc gccagcgccg3720tgcgcggaat ggccctgggc gccggctact acagctctct ggtggccaac tcgacttcca3780ccaataatcc cgccagcctg aacgaggaga agctgctgct gctgatggcc cagctcgagg3840ccctgaccca gcgcctgggc gagctgaccc agcaggtggc tcagctgcag gcggagacgc3900gggccgcggt tgccacggtg aaaaccaaat aaaaaatgaa tcaataaata aacggagacg3960gttgttgatt ttaacacaga gtcttgaatc tttatttgat ttttcgcgcg cggtaggccc4020tggaccaccg gtctcgatca ttgagcaccc ggtggatttt ttccaggacc cggtagaggt4080gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg tagctccatt4140gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag gggcgcaggg4200cgtggtgctg cacgatgtcc ttgaggagga gactgatggc cacgggcagc cccttggtgt4260aggtgttgac gaacctgttg agctgggagg gatgcatgcg gggggagatg agatgcatct4320tggcctggat cttgagattg gcgatgttcc cgcccagatc ccgccggggg ttcatgttgt4380
gcaggaccac cagcacggtg tatccggtgc acttggggaa tttgtcatgc aacttggaag4440ggaaggcgtg aaagaatttg gagacgccct tgtgaccgcc caggttttcc atgcactcat4500ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt cgggggtcgg4560acacatcgta gttgtggtcc tgggtgagct cgtcataggc cattttaatg aatttggggc4620ggagggtgcc cgactggggg acgaaggtgc cctcgatccc gggggcgtag ttgccctcgc4680agatctgcat ctcccaggcc ttgagctcgg agggggggat catgtccacc tgcggggcga4740tgaaaaaaac ggtttccggg gcgggggaga tgagctgggc cgaaagcagg ttccggagca4800gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc tgcaggtggt4860agttgaggga gagacagctg ccgtcctcgc ggaggagggg ggccacctcg ttcatcatct4920cgcgcacatg catgttctcg cgcacgagtt ccgccaggag gcgctcgccc cccagcgaga4980ggagctcttg cagcgaggcg aagtttttca gcggcttgag yccgtcggcc atgggcattt5040tggagagggt ctgttgcaag agttccagac ggtcccagag ctcggtgatg tgctctaggg5100catctcgatc cagcagacct cctcgtttcg cgggttgggg cgactgcggg agtagggcac5160caggcgatgg gcgtccagcg aggccagggt ccggtccttc cagggtcgca gggtccgcgt5220cagcgtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg cgagggtgcg5280cttcaggctc atccggctgg tcgagaaccg ctcccggtcg gcgccctgcg cgtcggccag5340gtagcaattg agcatgagtt cgtagttgag cgcctcggcc gcgtggccct tggcgcggag5400cttacctttg gaagtgtgtc cgcagacggg acagaggagg gacttgaggg cgtagagctt5460gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagctgg cgcagacggt5520ctcgcactcc acgagccagg tgaggtcggg ccggttgggg tcaaaaacga ggtttcctcc5580gtgctttttg atgcgtttct tacctctggt ctccatgagc tcgtgtcccc gctgggtgac5640aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga gcggggtgcc5700gcggtcctcg tcgtagagga accccgccca ctccgagacg aaggcccggg tccaggccag5760cacgaaggag gccacgtggg aggggtagcg gtcgttgtcc accagcgggt ccaccttctc5820cagggtatgc aagcacatgt ccccctcgtc cacatccagg aaggtgattg gcttgtaagt5880gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggggcgg gcccctgctc5940gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta ggtattccct6000ctcgaaggct ggcataacct cggcactcag gttgtcagtt tctagaaacg aggaggattt6060gatattgacg gtgccgttgg agacgccttt catgagcccc tcgtccatct ggtcagaaaa6120gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt tggagaggag6180cttggcgatg gagcgcatgg tctggttctt ttccttgtcg gcgcgctcct tggcggcgat6240gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg tggtgagctc6300gtcgggcacg attctgaccc gccagccgcg gttgtgcagg gtgatgaggt ccacgctggt6360ggccacctcg ccgcgcaggg gctcgttggt ccagcagagg cgcccgccct tgcgcgagca6420gaaggggggc agcgggtcca gcatgagctc gtcggggggg tcggcgtcca cggtgaagat6480gccgggcaga agctcggggt cgaagtagct gatgcaggtg tccagatcgt ccagcgccgc6540ttgccagtcg cgcacggcca gcgcgcgctc gtaggggctg aggggcgtgc cccagggcat6600ggggtgcgtg agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga ggggctcctc6660gaggacgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc gcacgtagtc6720gtacagctcg tgcgagggcg cgaggagccc cgtgccgagg ttggagcgtt gcggcttttc6780ggcgcggtag acgatctggc ggaagatggc gtgggagttg gaggagatgg tgggcctctg6840gaagatgttg aagtgggcgt ggggcaggcc gaccgagtcc ctgatgaagt gggcgtagga6900gtcctgcagc ttggcgacga gctcggcggt gacgaggacg tccagggcgc agtagtcgag6960ggtctcttgg atgatgtcgt acttgagctg gcccttctgc ttccacagct cgcggttgag7020aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct gatcggcacg7080gtaagagccc accatgtaga actggttgac ggccttgtag gcgcagcagc ccttctccac7140
ggggagggcg taagcttgtg cggccttgcg cagggaggtg tgggtgaggg cgaaggtgtc7200gcgcaccatg accttgagga actggtgctt gaagtcgagg tcgtcgcagc cgccctgctc7260ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga aagtaacatc7320gttgaagagg atcttgcccg cgcggggcat gaagttgcga gtgatgcgga aaggctgggg7380cacctcggcc cggttgttga tgacctgggc ggcgaggacg atctcgtcga agccgttgat7440gttgtgcccg acgatgtaga gttccacgaa tcgcgggcgg cccttaacgt ggggcagctt7500cttgagctcg tcgtaggtga gctcggcggg gtcgctgagc ccgtgctgct cgagggccca7560gtcggcgacg tgggggttgg cgctgaggaa ggaagtccag agatccacgg ccagggcggt7620ctgcaagcgg tcccggtact gacggaactg ctggcccacg gccatttttt cgggggtgac7680gcagtagaag gtgcgggggt cgccgtgcca gcggtcccac ttgagctgga gggcgaggtc7740gtgggcgagc tcgacgagcg gcgggtcccc ggagagtttc atgaccagca tgaaggggac7800gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg tgaggaagag7860cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc accagttgga7920ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgagc actcgtgctt7980gtgtttatac aagcgtccgc agtgctcgca acgctgcacg ggatgcacgt gctgcacgag8040ctgtacctgg gttcctttga cgaggaattt cagtgggcag tggagcgctg gcggctgcat8100ctggtgctgt actacgtcct ggccatcggc gtggccatcg tctgcctcga tggtggtcat8160gctgacgagc ccgcgcggga ggcaggtcca gacttcggct cggacgggtc ggagagcgag8220gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag tcaggtcagt8280gggcagcggc ggcgcgcggt tgacttgcag gagcttttcc agggcgcgcg ggaggtccag8340atggtacttg atctccacgg cgccgttggt ggcgacgtcc acggcttgca gggtcccgtg8400cccctggggc gccaccaccg tgccccgttt cttcttgggc gctgcttcca tgccggtcag8460aagcggcggc gaggacgcgc gccgggcggc aggggcggct cgggacccgg aggcaggggc8520ggcaggggca cgtcggcgcc gcgcgcgggc aggttctggt actgcgcccg gagaagactg8580gcgtgagcga cgacgcgacg gttgacgtcc tggatctgac gcctctgggt gaaggccacg8640ggacccgtga gtttgaacct gaaagagagt tcgacagaat caatctcggt atcgttgacg8700gcggcctgcc gcaggatctc ttgcacgtcg cccgagttgt cctggtaggc gatctcggtc8760atgaactgct cgatctcctc ctcctgaagg tctccgcggc cggcgcgctc gacggtggcc8820gcgaggtcgt tggagatgcg gcccatgagc tgcgagaagg cgttcatgcc ggcctcgttc8880cagacgcggc tgtagaccac ggctccgtcg gggtcgcgcg cgcgcatgac cacctgggcg8940aggttgagct cgacgtggcg cgtgaagacc gcgtagttgc agaggcgctg gtagaggtag9000ttgagcgtgg tggcgatgtg ctcggtgacg aagaagtaca tgatccagcg gcggagcggc9060atctcgctga cgtcgcccag ggcttccaag cgctccatgg cctcgtagaa gtccacggcg9120aagttgaaaa actgggagtt gcgcgccgag acggtcaact cctcctccag aagacggatg9180agctcagcga tggtggcgcg cacctcgcgc tcgaaggccc cggggggctc ctcttcttcc9240atctcttcct cctccactaa catctcttct acttcctcct caggaggcgg cggcggggga9300ggggccctgc gtcgccggcg gcgcacgggc agacggtcga tgaagcgctc gatggtctcc9360ccgcgccggc gacgcatggt ctcggtgacg gcgcgcccgt cctcgcgggg ccgcagcgtg9420aagacgccgc cgcgcatctc caggtggccg ccgggggggt ctccgttggg cagggagagg9480gcgctgacga tgcatcttat caattggccc gtagggactc cgcgcaagga cctgagcgtc9540tcgagatcca cgggatccga aaaccgctga acgaaggctt cgagccagtc gcagtcgcaa9600ggtaggctga gcccggtttc ttgttcttcg gggatttcgg gaggcgggcg ggcgatgctg9660ctggtgatga agttgaagta ggcggtcctg agacggcgga tggtggcgag gagcaccagg9720tccttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc gtggtcctga9780cacctggcga ggtccttgta gtagtcctgc atgagccgct ccacgggcac ctcctcctcg9840cccgcgcggc cgtgcatgcg cgtgagcccg aacccgcgct ggggctggac gagcgccagg9900
tcggcgacga cgcgctcggc gaggatggcc tgctgtatct gggtgagggt ggtctggaag 9960tcgtcgaagt cgacgaagcg gtggtaggct ccggtgttga tggtatagga gcagttggcc10020atgacggacc agttgacggt ctggtggccg ggtcgcacga gctcgtggta cttgaggcgc10080gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcacgaggta ctggtatccg10140acgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc gggggcgccg10200ggcgcgaggt cctcgagcat gaggcggtgg tagccgtaga tgtacctgga catccaggtg10260atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca gatgttgcgc10320agcggcagga agtagttcat ggtggccgcg gtctggcccg tgaggcgcgc gcagtcgtgg10380atgctctaga catacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag10440gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag10500ccgcagctaa cgtggtactg gcactcccgt ctcgacccaa gcctgctaac gaaacctcca10560ggatacggag gcgggtcgtt ttttggcctt ggtcgctggt catgaaaaac tagtaagcgc10620ggaaagcgac cgcccgcgat ggctcgctgc cgtagtctgg agaaagaatc gccagggttg10680cgttgcggtg tgccccggtt cgagcctcag cgctcggcgc cggccggatt ccgcggctaa10740cgtgggcgtg gctgccccgt cgtttccaag accccttagc cagccgactt ctccagttac10800ggagcgagcc cctctttttc ttgtgttttt gccagatgca tcccgtactg cggcagatgc10860gcccccaccc tccacctcaa ccgcccctac cgccgcagca gcagcaacag ccggcgcttc10920tgcccccgcc ccagcagcag ccagccacta ccgcggcggc cgccgtgagc ggagccggcg10980ttcagtatga cctggccttg gaagagggcg aggggctggc gcggctgggg gcgtcgtcgc11040cggagcggca cccgcgcgtg cagatgaaaa gggacgctcg cgaggcctac gtgcccaagc11100agaacctgtt cagagacagg agcggcgagg agcccgagga gatgcgcgcc tcccgcttcc11160acgcggggcg ggagctgcgg cgcggcctgg accgaaagcg ggtgctgagg gacgaggatt11220tcgaggcgga cgagctgacg gggatcagcc ccgcgcgcgc gcacgtggcc gcggccaacc11280tggtcacggc gtacgagcag accgtgaagg aggagagcaa cttccaaaaa tccttcaaca11340accacgtgcg cacgctgatc gcgcgcgagg aggtgaccct gggcctgatg cacctgtggg11400acctgctgga ggccatcgtg cagaacccca cgagcaagcc gctgacggcg cagctgtttc11460tggtggtgca gcacagtcgg gacaacgaga cgttcaggga ggcgctgctg aatatcaccg11520agcccgaggg ccgctggctc ctggacctgg tgaacattct gcagagcatc gtggtgcagg11580agcgcgggct gccgctgtcc gagaagctgg cggctatcaa cttctcggtg ctgagcctgg11640gcaagtacta cgctaggaag atctacaaga ccccgtacgt gcccatagac aaggaggtga11700agatcgacgg gttttacatg cgcatgaccc tgaaagtgct gaccctgagc gacgatctgg11760gggtgtaccg caacgacagg atgcaccgcg cggtgagcgc cagccgccgg cgcgagctga11820gcgaccagga gctgatgcac agcctgcagc gggccctgac cggggccggg accgaggggg11880agagctactt tgacatgggc gcggacctgc gctggcagcc cagccgccgg gccttggaag11940ctgccggcgg ttccccctac gtggaggagg tggacgatga ggaggaggag ggcgagtacc12000tggaagactg atggcgcgac cgtatttttg ctagatgcag caacagccac cgcctcctga12060tcccgcgatg cgggcggcgc tgcagagcca gccgtccggc attaactcct cggacgattg12120gacccaggcc atgcaacgca tcatggcgct gacgacccgc aatcccgaag cctttagaca12180gcagcctcag gccaaccggc tctcggccat cctggaggcc gtggtgccct cgcgctcgaa12240ccccacgcac gagaaggtgc tggccatcgt gaacgcgctg gtggagaaca aggccatccg12300cggcgacgag gccgggctgg tgtacaacgc gctgctggag cgcgtggccc gctacaacag12360caccaacgtg cagacgaacc tggaccgcat ggtgaccgac gtgcgcgagg cggtgtcgca12420gcgcgagcgg ttccaccgcg agtcgaacct gggctccatg gtggcgctga acgccttcct12480gagcacgcag cccgccaacg tgccccgggg ccaggaggac tacaccaact tcatcagcgc12540gctgcggctg atggtggccg aggtgcccca gagcgaggtg taccagtcgg ggccggacta12600cttcttccag accagtcgcc agggcttgca gaccgtgaac ctgagccagg ctttcaagaa12660
cttgcaggga ctgtggggcg tgcaggcccc ggtcggggac cgcgcgacgg tgtcgagcct12720gctgacgccg aactcgcgcc tgctgctgct gctggtggcg cccttcacgg acagcggcag12780cgtgagccgc gactcgtacc tgggctacct gcttaacctg taccgcgagg ccatcgggca12840ggcgcacgtg gacgagcaga cctaccagga gatcacccac gtgagccgcg cgctgggcca12900ggaggacccg ggcaacctgg aggccaccct gaacttcctg ctgaccaacc ggtcgcagaa12960gatcccgccc cagtacgcgc tgagcaccga ggaggagcgc atcctgcgct acgtgcagca13020gagcgtgggg ctgttcctga tgcaggaggg ggccacgccc agcgccgcgc tcgacatgac13080cgcgcgcaac atggagccca gcatgtacgc tcgcaaccgc ccgttcatca ataagctgat13140ggactacttg catcgggcgg ccgccatgaa ctcggactac tttaccaacg ccatcttgaa13200cccgcactgg ctcccgccgc ccgggttcta cacgggcgag tacgacatgc ccgaccccaa13260cgacgggttc ctgtgggacg acgtggacag cagcgtgttc tcgccgcgcc ccgccaccac13320cgtgtggaag aaagagggcg gggaccggcg gccgtcctcg gcgctgtccg gtcgcgcggg13380tgctgccgcg gcggtgcctg aggccgccag ccccttcccg agcctgccct tttcgctgaa13440cagcgtgcgc agcagcgagc tgggtcggct gacgcggccg cgcctgctgg gcgaggagga13500gtacctgaac gactccttgt tgaggcccga gcgcgagaag aacttcccca ataacgggat13560agagagcctg gtggacaaga tgagccgctg gaagacgtac gcgcacgagc acagggacga13620gccccgagct agcagcagcg caggcacccg tagacgccag cgacacgaca ggcagcgggg13680tctggtgtgg gacgatgagg attccgccga cgacagcagc gtgttggact tgggtgggag13740tggtggtggt aacccgttcg ctcacttgcg cccccgtatc gggcgcctga tgtaagaatc13800tgaaaaaata aaaaacggta ctcaccaagg ccatggcgac cagcgtgcgt tcttctctgt13860tgtttgtagt agtatgatga ggcgcgtgta cccggagggt cctcctccct cgtacgagag13920cgtgatgcag caggcggtgg cggcggcgat gcagcccccg ctggaggcgc cttacgtgcc13980cccgcggtac ctggcgccta cggaggggcg gaacagcatt cgttactcgg agctggcacc14040cttgtacgat accacccggt tgtacctggt ggacaacaag tcggcggaca tcgcctcgct14100gaactaccag aacgaccaca gcaacttcct gaccaccgtg gtgcagaaca acgatttcac14160ccccacggag gccagcaccc agaccatcaa ctttgacgag cgctcgcggt ggggcggcca14220gctgaaaacc atcatgcaca ccaacatgcc caacgtgaac gagttcatgt acagcaacaa14280gttcaaggcg cgggtgatgg tctcgcgcaa gacccccaat ggggtcgcgg tggatgagaa14340ttatgatggt agtcaggacg agctgactta cgagtgggtg gagtttgagc tgcccgaggg14400caacttctcg gtgaccatga ccatcgatct gatgaacaac gccatcatcg acaactactt14460ggcggtgggg cgtcagaacg gggtgctgga gagcgacatc ggcgtgaagt tcgacacgcg14520caacttccgg ctgggctggg accccgtgac cgagctggtg atgccgggcg tgtacaccaa14580cgaggccttc caccccgaca tcgtcctgct gcccggctgc ggcgtggact tcaccgagag14640ccgcctcagc aacctgctgg gcatccgcaa gcggcagccc ttccaggagg gcttccagat14700cctgtacgag gacctggagg ggggcaacat ccccgcgctc ttggatgtcg aagcctatga14760gaaaagcaag gaggaggccg ccgcagcggc gaccgcagcc gtggccaccg cctctaccga14820ggtgcggggc gataattttg ctagcgccgc ggcagtggcc gaggcggctg aaaccgaaag14880taagatagtc atccagccgg tggagaagga cagcaaggac aggagctaca acgtgctcgc14940ggacaagaaa aacaccgcct accgcagctg gtacctggcc tacaactacg gcgaccccga15000gaagggcgtg cgctcctgga cgctgctcac cacctcggac gtcacctgcg gcgtggagca15060agtctactgg tcgctgcccg acatgatgca agacccggtc accttccgct ccacgcgtca15120agttagcaac tacccggtgg tgggcgccga gctcctgccc gtctactcca agagcttctt15180caacgagcag gccgtctact cgcagcagct gcgcgccttc acctcgctca cgcacgtctt15240caaccgcttc cccgagaacc agatcctcgt ccgcccgccc gcgcccacca ttaccaccgt15300cagtgaaaac gttcctgctc tcacagatca cgggaccctg ccgctgcgca gcagtatccg15360gggagtccag cgcgtgaccg tcactgacgc cagacgccgc acctgcccct acgtctacaa15420
ggccctgggc gtagtcgcgc cgcgcgtcct ctcgagccgc accttctaaa aaatgtccat15480tctcatctcg cccagtaata acaccggttg gggcctgcgc gcgcccagca agatgtacgg15540aggcgctcgc caacgctcca cgcaacaccc cgtgcgcgtg cgcgggcact tccgcgctcc15600ctggggcgcc ctcaagggcc gcgtgcgctc gcgcaccacc gtcgacgacg tgatcgacca15660ggtggtggcc gacgcgcgca actacacgcc cgccgccgcg cccgcctcca ccgtggacgc15720cgtcatcgac agcgtggtgg ccgatgcgcg ccggtacgcc cgcgccaaga gccggcggcg15780gcgcatcgcc cggcggcacc ggagcacccc cgccatgcgc gcggcgcgag ccttgctgcg15840cagggccagg cgcacgggac gcagggccat gctcagggcg gccagacgcg cggcctccgg15900cagcagcagc gccggcagga cccgcagacg cgcggccacg gcggcggcgg cggccatcgc15960cagcatgtcc cgcccgcggc gcggcaacgt gtactgggtg cgcgacgccg ccaccggtgt16020gcgcgtgccc gtgcgcaccc gcccccctcg cacttgaaga tgctgacttc gcgatgttga16080tgtgtcccag cggcgaggag gatgtccaag cgcaaataca aggaagagat gctccaggtc16140atcgcgcctg agatctacgg ccccgcggtg aaggaggaaa gaaagccccg caaactgaag16200cgggtcaaaa aggacaaaaa ggaggaggaa gatgtggacg gactggtgga gtttgtgcgc16260gagttcgccc cccggcggcg cgtgcagtgg cgcgggcgga aagtgaaacc ggtgctgcgg16320cccggcacca cggtggtctt cacgcccggc gagcgttccg gctccgcctc caagcgctcc16380tacgacgagg tgtacgggga cgaggacatc ctcgagcagg cggtcgagcg tctgggcgag16440tttgcttacg gcaagcgcag ccgccccgcg cccttgaaag aggaggcggt gtccatcccg16500ctggaccacg gcaaccccac gccgagcctg aagccggtga ccctgcagca ggtgctgccg16560agcgcggcgc cgcgccgggg cttcaagcgc gagggcggcg aggatctgta cccgaccatg16620cagctgatgg tgcccaagcg ccagaagctg gaggacgtgc tggagcacat gaaggtggac16680cccgaggtgc agcccgaggt caaggtgcgg cccatcaagc aggtggcccc gggcctgggc16740gtgcagaccg tggacatcaa gatccccacg gagcccatgg aaacgcagac cgagcccgtg16800aagcccagca ccagcaccat ggaggtgcag acggatccct ggatgccggc gccggcttcc16860accactcgcc gaagacgcaa gtacggcgcg gccagcctgc tgatgcccaa ctacgcgctg16920catccttcca tcatccccac gccgggctac cgcggcacgc gcttctaccg cggctacacc16980agcagccgcc gcaagaccac cacccgccgc cgccgtcgtc gcacccgccg cagcagcacc17040gcgacttccg ccgccgccct ggtgcggaga gtgtaccgca gcgggcgcga gcctctgacc17100ctgccgcgcg cgcgctacca cccgagcatc gccatttaac tctgccgtcg cctcctactt17160gcagatatgg ccctcacatg ccgcctccgc gtccccatta cgggctaccg aggaagaaag17220ccgcgccgta gaaggctgac ggggaacggg ctgcgtcgcc atcaccaccg gcggcggcgc17280gccatcagca agcggttggg gggaggcttc ctgcccgcgc tgatccccat catcgccgcg17340gcgatcgggg cgatccccgg catagcttcc gtggcggtgc aggcctctca gcgccactga17400gacacagctt ggaaaatttg taataaaaaa atggactgac gctcctggtc ctgtgatgtg17460tgtttttaga tggaagacat caatttttcg tccctggcac cgcgacacgg cacgcggccg17520tttatgggca cctggagcga catcggcaac agccaactga acgggggcgc cttcaattgg17580agcagtctct ggagcgggct taagaatttc gggtccacgc tcaaaaccta tggcaacaag17640gcgtggaaca gcagcacagg gcaggcgctg agggaaaagc tgaaagagca gaacttccag17700cagaaggtgg tcgatggcct ggcctcgggc atcaacgggg tggtggacct ggccaaccag17760gccgtgcaga aacagatcaa cagccgcctg gacgcggtcc cgcccgcggg gtccgtggag17820atgccccagg tggaggagga gctgcctccc ctggacaagc gcggcgacaa gcgaccgcgt17880cccgacgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta cgaggaggcg17940gtgaaactgg gtctgcccac cacgcggccc gtggcgcctc tggccaccgg ggtgctgaaa18000cccagcagca gcagccagcc cgcgaccctg gacttgcctc cgcctgcttc ccgcccctcc18060acagtggcta agcccctgcc gccggtggcc gtcgcgtcgc gcgccccccg aggccgcccc18120caggcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca gagtgtgaag18180
cgccgccgct gctattaaaa gacactgtag cgcttaactt gcttgtctgt gtgtatatgt18240atgtccgccg accagaagga ggaagaggcg cgtcgccgag ttgcaagatg gccaccccat18300cgatgctgcc ccagtgggcg tacatgcaca tcgccggaca ggacgcttcg gagtacctga18360gtccgggtct ggtgcagttc gcccgcgcca cagacaccta cttcagtctg gggaacaagt18420ttaggaaccc cacggtggcg cccacgcacg atgtgaccac cgaccgcagc cagcggctga18480cgctgcgctt cgtgcccgtg gaccgcgagg acaacaccta ctcgtacaaa gtgcgctaca18540cgctggccgt gggcgacaac cgcgtgctgg acatggccag cacctacttt gacatccgcg18600gcgtgctgga tcgggggccc agcttcaaac cctactccgg caccgcctac aacagcctgg18660ctcccaaggg agcgcccaac acttgccagt ggacatataa agctggtgat actgatacag18720aaaaaaccta tacatatgga aatgcacctg tgcaaggcat tagcattaca aaggatggta18780ttcaacttgg aactgacagc gatggtcagg caatctatgc agacgaaact tatcaaccag18840agcctcaagt gggtgatgct gaatggcatg acatcactgg tactgatgaa aaatatggag18900gcagagctct taagcctgac accaaaatga agccttgcta tggttctttt gccaagccta18960ccaataaaga aggaggccag gcaaatgtga aaaccgaaac aggcggtacc aaagaatatg19020acattgacat ggcattcttc gataatcgaa gtgcagctgc cgccggccta gccccagaaa19080ttgttttgta tactgagaat gtggatctgg aaactccaga tacccatatt gtatacaagg19140caggtacaga tgacagtagc tcttctatca atttgggtca gcagtccatg cccaacagac19200ccaactacat tggcttcaga gacaacttta tcggtctgat gtactacaac agcactggca19260atatgggtgt actggctgga caggcctccc agctgaatgc tgtggtggac ttgcaggaca19320gaaacaccga actgtcctac cagctcttgc ttgactctct gggtgacaga accaggtatt19380tcagtatgtg gaatcaggcg gtggacagtt atgaccccga tgtgcgcatt attgaaaatc19440acggtgtgga ggatgaactt cctaactatt gcttccccct ggatgctgtg ggtagaactg19500atacttacca gggaattaag gccaatggtg ataatcaaac cacctggacc aaagatgata19560ctgttaatga tgctaatgaa ttgggcaagg gcaatccttt cgccatggag atcaacatcc19620aggccaacct gtggcggaac ttcctctacg cgaacgtggc gctgtacctg cccgactcct19680acaagtacac gccggccaac atcacgctgc ccaccaacac caacacctac gattacatga19740acggccgcgt ggtggcgccc tcgctggtgg acgcctacat caacatcggg gcgcgctggt19800cgctggaccc catggacaac gtcaacccct tcaaccacca ccgcaacgcg ggcctgcgat19860accgctccat gctcctgggc aacgggcgct acgtgccctt ccacatccag gtgccccaaa19920agtttttcgc catcaagagc ctcctgctcc tgcccgggtc ctacacctac gagtggaact19980tccgcaagga cgtcaacatg atcctgcaga gctccctcgg caacgacctg cgcacggacg20040gggcctccat cgccttcacc agcatcaacc tctacgccac cttcttcccc atggcgcaca20100acaccgcctc cacgctcgag gccatgctgc gcaacgacac caacgaccag tccttcaacg20160actacctctc ggcggccaac atgctctacc ccatcccggc caacgccacc aacgtgccca20220tctccatccc ctcgcgcaac tgggccgcct tccgcggctg gtccttcacg cgcctcaaga20280cccgcgagac gccctcgctc ggctccgggt tcgaccccta cttcgtctac tcgggctcca20340tcccctacct cgacggcacc ttctacctca accacacctt caagaaggtc tccatcacct20400tcgactcctc cgtcagctgg cccggcaacg accgcctcct gacgcccaac gagttcgaaa20460tcaagcgcac cgtcgacgga gaggggtaca acgtggccca gtgcaacatg accaaggact20520ggttcctggt ccagatgctg gcccactaca acatcggcta ccagggcttc tacgtgcccg20580agggctacaa ggaccgcatg tactccttct tccgcaactt ccagcccatg agccgccagg20640tcgtggacga ggtcaactac aaggactacc aggccgtcac cctggcctac cagcacaaca20700actcgggctt cgtcggctac ctcgcgccca ccatgcgcca gggccagccc taccccgcca20760actaccccta cccgctcatc ggcaagagcg ccgtcgccag cgtcacccag aaaaagttcc20820tctgcgaccg ggtcatgtgg cgcatcccct tctccagcaa cttcatgtcc atgggcgcgc20880tcaccgacct cggccagaac atgctctacg ccaactccgc ccacgcgcta gacatgaatt20940
tcgaagtcga ccccatggat gagtccaccc ttctctatgt tgtcttcgaa gtcttcgacg21000tcgtccgagt gcaccagccc caccgcggcg tcatcgaggc cgtctacctg cgcacgccct21060tctcggccgg caacgccacc acctaagcct cttgcttctt gcaagatgac ggcctgcgcg21120ggctccggcg agcaggagct cagggccatc ctccgcgacc tgggctgcgg gccctgcttc21180ctgggcacct tcgacaagcg cttcccggga ttcatggccc cgcacaagct ggcctgcgcc21240atcgtcaaca cggccggccg cgagaccggg ggcgagcact ggctggcctt cgcctggaac21300ccgcgctccc acacctgcta cctcttcgac cccttcgggt tctcggacga gcgcctcaag21360cagatctacc agttcgagta cgagggcctg ctgcgtcgca gcgccctggc caccgaggac21420cgctgcgtca ccctggaaaa gtccacccag accgtgcagg gtccgcgctc ggccgcctgc21480gggctcttct gctgcatgtt cctgcacgcc ttcgtgcact ggcccgaccg ccccatggac21540aagaacccca ccatgaactt gctgacgggg gtgcccaacg gcatgctcca gtcgccccag21600gtggaaccca ccctgcgccg caaccaggag gcgctctacc gcttcctcaa cgcccactcc21660gcctactttc gctcccaccg cgcgcgcatc gagaaggcca ccgccttcga ccgcatgaat21720caagacatgt aatccggtgt gtgtatgtga atgctttatt catcataata aacagcacat21780gtttatgcca ccttctctga ggctctgact ttatttagaa atcgaagggg ttctgccggc21840tctcggcatg gcccgcgggc agggatacgt tgcggaactg gtacttgggc agccacttga21900actcggggat cagcagcttc ggcacgggga ggtcggggaa cgagtcgctc cacagcttgc21960gcgtgagttg cagggcgccc agcaggtcgg gcgcggagat cttgaaatcg cagttgggac22020ccgcgttctg cgcgcgagag ttacggtaca cggggttgca gcactggaac accatcaggg22080ccgggtgctt cacgctcgcc agcaccgtcg cgtcggtgat gccctccacg tccagatcct22140cggcgttggc catcccgaag ggggtcatct tgcaggtctg ccgccccatg ctgggcacgc22200agccgggctt gtggttgcaa tcgcagtgca gggggatcag catcatctgg gcctgctcgg22260agctcatgcc cgggtacatg gccttcatga aagcctccag ctggcggaag gcctgctgcg22320ccttgccgcc ctcggtgaag aagaccccgc aggacttgct agagaactgg ttggtggcgc22380agccagcgtc gtgcacgcag cagcgcgcgt cgttgttggc cagctgcacc acgctgcgcc22440cccagcggtt ctgggtgatc ttggcccggt cggggttctc cttcagcgcg cgctgcccgt22500tctcgctcgc cacatccatc tcgatcgtgt gctccttctg gatcatcacg gtcccgtgca22560ggcaccgcag cttgccctcg gcctcggtgc acccgtgcag ccacagcgcg cagccggtgc22620tctcccagtt cttgtgggcg atctgggagt gcgagtgcac gaagccctgc aggaagcggc22680ccatcatcgt ggtcagggtc ttgttgctgg tgaaggtcag cggaatgccg cggtgctcct22740cgttcacata caggtggcag atacggcggt acacctcgcc ctgctcgggc atcagctgga22800aggcggactt caggtcgctc tccacgcggt accggtccat cagcagcgtc atcacttcca22860tgcccttctc ccaggccgaa acgatcggca ggctcagggg gttcttcacc gttgtcatct22920tagtcgccgc cgccgaagtc agggggtcgt tctcgtccag ggtctcaaac actcgcttgc22980cgtccttctc ggtgatgcgc acggggggaa agctgaagcc cacggccgcc agctcctcct23040cggcctgcct ttcgtcctcg ctgtcctggc tgatgtcttg caaaggcaca tgcttggtct23100tgcggggttt ctttttgggc ggcagaggcg gcggcggaga cgtgctgggc gagcgcgagt23160tctcgctcac cacgactatt tcttctcctt ggccgtcgtc cgagaccacg cggcggtagg23220catgcctctt ctggggcaga ggcggaggcg acgggctctc gcggttcggc gggcggctgg23280cagagcccct tccgcgttcg ggggtgcgct cctggcggcg ctgctctgac tgacttcctc23340cgcggccggc cattgtgttc tcctagggag caagcatgga gactcagcca tcgtcgccaa23400catcgccatc tgcccccgcc gccgccgacg agaaccagca gcagcagaat gaaagcttaa23460ccgccccgcc gcccagcccc acctccgacg ccgcagcccc agacatgcaa gagatggagg23520aatccatcga gattgacctg ggctacgtga cgcccgcgga gcacgaggag gagctggcag23580cgcgcttttc agccccggaa gagaaccacc aagagcagcc agagcaggaa gcagagagcg23640agcagaacca ggctgggctc gagcatggcg actacctgag cggggcagag gacgtgctca23700
tcaagcatct ggcccgccaa tgcatcatcg tcaaggacgc gctgctcgac cgcgccgagg23760tgcccctcag cgtggcggag ctcagccgcg cctacgagcg caacctcttc tcgccgcgcg23820tgccccccaa gcgccagccc aacggcacct gcgagcccaa cccgcgcctc aacttctacc23880cggtcttcgc ggtgcccgag gccctggcca cctaccacct ctttttcaag aaccaaagga23940tccccgtctc ctgccgcgcc aaccgcaccc gcgccgacgc cctgctcaac ctgggccccg24000gcgcccgcct acctgatatc gcctccttgg aagaggttcc caagatcttc gagggtctgg24060gcagcgacga gactcgggcc gcgaacgctc tgcaaggaag cggagaggag catgagcacc24120acagcgccct ggtggagttg gaaggcgaca acgcgcgcct ggcggtcctc aagcgcacgg24180tcgagctgac ccacttcgcc tacccggcgc tcaacctgcc ccccaaggtc atgagcgccg24240tcatggacca ggtgctcatc aagcgcgcct cgcccctctc ggaggaggag atgcaggacc24300ccgagagctc ggacgagggc aagcccgtgg tcagcgacga gcagctggcg cgctggctgg24360gagcgagtag caccccccag agcctggaag agcggcgcaa gctcatgatg gccgtggtcc24420tggtgaccgt ggagctggag tgtctgcgcc gcttcttcgc cgacgcggag accctgcgca24480aggtcgagga gaacctgcac tacctcttca gacacgggtt cgtgcgccag gcctgcaaga24540tctccaacgt ggagctgacc aacctggtct cctacatggg catcctgcac gagaaccgcc24600tggggcagaa cgtgctgcac accaccctgc gcggggaggc ccgccgcgac tacatccgcg24660actgcgtcta cctgtacctc tgccacacct ggcagacggg catgggcgtg tggcagcagt24720gcctggagga gcagaacctg aaagagctct gcaagctcct gcagaagaac ctcaaggccc24780tgtggaccgg gttcgacgag cgcaccaccg ccgcggacct ggccgacctc atcttccccg24840agcgcctgcg gctgacgctg cgcaacgggc tgcccgactt tatgagccaa agcatgttgc24900aaaactttcg ctctttcatc ctcgaacgct ccgggatcct gcccgccacc tgctccgcgc24960tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc cccgccgctc tggagccact25020gctacctgct gcgcctggcc aactacctgg cctaccactc ggacgtgatc gaggacgtca25080gcggcgaggg cctgctcgag tgccactgcc gctgcaacct ctgcacgccg caccgctccc25140tggcctgcaa cccccagctg ctgagcgaga cccagatcat cggcaccttc gagttgcaag25200gccccggcga gggcaagggg ggtctgaaac tcaccccggg gctgtggacc tcggcctact25260tgcgcaagtt cgtgcccgag gactaccatc ccttcgagat caggttctac gaggaccaat25320cccagccgcc caaggccgag ctgtcggcct gcgtcatcac ccagggggcc atcctggccc25380aattgcaagc catccagaaa tcccgccaag aatttctgct gaaaaagggc cacggggtct25440acttggaccc ccagaccgga gaggagctca accccagctt cccccaggat gccccgagga25500agcagcaaga agctgaaagt ggagctgccg ccgccgccgg aggatttgga ggaagactgg25560gagagcagtc aggcagagga ggaggagatg gaagactggg acagcactca ggcagaggag25620gacagcctgc aagacagtct ggaggaggaa gacgaggtgg aggaggcaga ggaagaagca25680gccgccgcca gaccgtcgtc ctcggcggag gaggagaaag caagcagcac ggataccatc25740tccgctccgg gtcggggtcg cggcggccgg gcccacagta gatgggacga gaccgggcgc25800ttcccgaacc ccaccaccca gaccggtaag aaggagcggc agggatacaa gtcctggcgg25860gggcacaaaa acgccatcgt ctcctgcttg caagcctgcg ggggcaacat ctccttcacc25920cggcgctacc tgctcttcca ccgcggggtg aacttccccc gcaacatctt gcattactac25980cgtcacctcc acagccccta ctactgtttc caagaagagg cagaaaccca gcagcagcag26040cagcagcaga aaaccagcgg cagcagctag aaaatccaca gcggcggcag gtggactgag26100gatcgcggcg aacgagccgg cgcagacccg ggagctgagg aaccggatct ttcccaccct26160ctatgccatc ttccagcaga gtcgggggca agagcaggaa ctgaaagtca agaaccgttc26220tctgcgctcg ctcacccgca gttgtctgta tcacaagagc gaagaccaac ttcagcgcac26280tctcgaggac gccgaggctc tcttcaacaa gtactgcgcg ctcactctta aagagtagcc26340cgcgcccgcc cacacacgga aaaaggcggg aattacgtca ccacctgcgc ccttcgcccg26400accatcatca tgagcaaaga gattcccacg ccttacatgt ggagctacca gccccagatg26460
ggcctggccg ccggcgccgc ccaggactac tccacccgca tgaactggct cagtgccggg26520cccgcgatga tctcacgggt gaatgacatc cgcgcccacc gaaaccagat actcctagaa26580cagtcagcga tcaccgccac gccccgccat caccttaatc cgcgtaattg gcccgccgcc26640ctggtgtacc aggaaattcc ccagcccacg accgtactac ttccgcgaga cgcccaggcc26700gaagtccagc tgactaactc aggtgtccag ctggccggcg gcgccgccct gtgtcgtcac26760cgccccgctc agggtataaa gcggctggtg atccgaggca gaggcacaca gctcaacgac26820gaggtggtga gctcttcgct gggtctgcga cctgacggag tcttccaact cgccggatcg26880gggagatctt ccttcacgcc tcgtcaggcc gtcctgactt tggagagttc gtcctcgcag26940ccccgctcgg gtggcatcgg cactctccag ttcgtggagg agttcactcc ctcggtctac27000ttcaacccct tctccggctc ccccggccac tacccggacg agttcatccc gaacttcgac27060gccatcagcg agtcggtgga cggctacgat tgaatgtccc atggtggcgc ggctgaccta27120gctcggcttc gacacctgga ccactgccgc cgcttccgct gcttcgctcg ggatctcgcc27180gagtttgcct actttgagct gcccgaggag caccctcagg gcccggccca cggagtgcgg27240atcgtcgtcg aagggggtct cgactcccac ctgcttcgga tcttcagcca gcgtccgatc27300ctggccgagc gcgagcaagg acagaccctt ctgaccctgt actgcatctg caaccacccc27360ggcctgcatg aaagtctttg ttgtctgctg tgtactgagt ataataaaag ctgagatcag27420cgactactcc ggacttccgt gtgttcctgc tatcaaccag tccctgttct tcaccgggaa27480cgagaccgag ctccagctcc agtgtaagcc ccacaagaag tacctcacct ggctgttcca27540gggctctccg atcgccgttg tcaaccactg cgacaacgac ggagtcctgc tgagcggccc27600tgccaacctt actttttcca cccgcagaag caagctccag ctcttccaac ccttcctccc27660cgggacctat cagtgcgtct cgggaccctg ccatcacacc ttccacctga tcccgaatac27720cacagcgtcg ctccccgcta ctaacaacca aactacccac caacgccacc gtcgcgacct27780ttcctctggg tctaatacca ctaccggagg tgagctccga ggtcgaccaa cctctgggat27840ttactacggc ccctgggagg tggtagggtt aatagcgcta ggcctagttg cgggtgggct27900tttggctctc tgctacctat acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg27960gtttaagaaa tggggaagat caccctagtg agctgcggtg tgctggtggc ggtggtgctt28020tcgattgtgg gactgggcgg cgcggctgta gtgaaggaga aggccgatcc ctgcttgcat28080ttcaatcccg acaaatgcca gctgagtttt cagcccgatg gcaatcggtg cgcggtgctg28140atcaagtgcg gatgggaatg cgagaacgtg agaatcgagt acaataacaa gactcggaac28200aatactctcg cgtccgtgtg gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc28260ggtgctgacg gctccccgcg caccgtgaat aatactttca tttttgcgca catgtgcgac28320acggtcatgt ggatgagcaa gcagtacgat atgtggcccc ccacgaagga gaacatcgtg28380gtcttctcca tcgcttacag cgtgtgcacg gcgctaatca ccgctatcgt gtgcctgagc28440attcacatgc tcatcgctat tcgccccaga aataatgccg aaaaagaaaa acagccataa28500cacgtttttt cacacacctt tttcagacca tggcctctgt taaatttttg cttttatttg28560ccagtctcat tgccgtcatt catggaatga gtaatgagaa aattactatt tacactggca28620ctaatcacac attgaaaggt ccagaaaaag ccacagaagt ttcatggtat tgttatttta28680atgaatcaga tgtatctact gaactctgtg gaaacaataa caaaaaaaat gagagcatta28740ctctcatcaa gtttcaatgt ggatctgact taaccctaat taacatcact agagactatg28800taggtatgta ttatggaact acagcaggca tttcggacat ggaattttat caagtttctg28860tgtctgaacc caccacgcct agaatgacca caaccacaaa aactacacct gttaccacta28920tacagctcac taccaatggc tttcttgcca tgcttcaagt ggctgaaaat agcaccagca28980ttcaacccac cccacccagt gaggaaattc ccagatccat gattggcatt attgttgctg29040tagtggtgtg catgttgatc atcgccttgt gcatggtgta ctatgccttc tgctacagaa29100agcacagact gaacgacaag ctggaacact tactaagtgt tgaattttaa ttttttagaa29160ccatgaagat cctaggcctt ttagtttttt ctatcattac ctctgctcta tgcaattctg29220
acaatgagga cgttactgtc gttgtcggat caaattatac actaaaaggt ccagcaaaag29280gtatgctttc gtggtattgt tggttcggaa ctgacgagca acagacagaa ctttgcaatg29340ctcaaaaagg caaaacctca aattctaaaa tctctaatta tcaatgcaat ggcactgact29400tagtattgct caatgtcacg aaagcatatg ctggcagtta cacctgccct ggagatgatg29460ccgacaatat gattttttac aaagtggaag tggttgatcc cactactcca ccgcccacca29520ccacaactac tcataccaca cacacagaac aaacaccaga ggcagcagaa gcagagttgg29580ccttccaggt tcacggagat tcctttgctg tcaatacccc tacacccgat cagcggtgtc29640cggggctgct cgtcagcggc attgtcggtg tgctttcggg attagcagtc ataatcatct29700gcatgttcat ttttgcttgc tgctatagaa ggctttaccg acaaaaatca gacccactgc29760tgaacctcta tgtttaattt tttccagagc catgaaggca gttagcgctc tagttttttg29820ttctttgatt ggcattgttt ttagtgctgg gtttttgaaa aatcttacca tttatgaagg29880tgagaatgcc actctagtgg gcatcagtgg tcaaaatgtc agctggctaa aataccatct29940agatgggtgg aaagacattt gcgattggaa tgtcactgtg tatacatgta atggagttaa30000cctcaccatt actaatgcca cccaagatca gaatggtagg tttaagggcc agagtttcac30060tagaaataat gggtatgaat cccataacat gtttatctat gacgtcactg tcatcagaaa30120tgagactgcc accaccacac agatgcccac tacacacagt tctaccacta ctaccatgca30180aaccacacag acaaccacta catcaactca gcatatgacc accactacag cagcaaagcc30240aagtagtgca gcgcctcagc cccaggcttt ggctttgaaa gctgcacaac ctagtacaac30300tactaggacc aatgagcaga ctactgaatt tttgtccact gtcgagagcc acaccacagc30360tacctccagt gccttctcta gcaccgccaa tctctcctcg ctttcctcta caccaatcag30420tcccgctact actcccaccc cagctcttct ccccactccc ctgaagcaaa ctgaggacag30480cggcatgcaa tggcagatca ccctgctcat tgtgatcggg ttggtcatcc tggccgtgtt30540gctctactac atcttctgcc gccgcattcc caacgcgcac cgcaaaccgg cctacaagcc30600catcgttatc gggcagccgg agccgcttca ggtggaaggg ggtctaagga atcttctctt30660ctcttttaca gtatggtgat tgaactatga ttcctagaca attcttgatc actattctta30720tctgcctcct ccaagtctgt gccaccctcg ctctggtggc caacgccagt ccagactgta30780ttgggccctt cgcctcctac gtgctctttg ccttcatcac ctgcatctgc tgctgtagca30840tagtctgcct gcttatcacc ttcttccagt tcattgactg gatctttgtg cgcatcgcct30900acctgcgcca ccacccccag taccgcgacc agcgagtggc gcggctgctc aggctcctct30960gataagcatg cgggctctgc tacttctcgc gcttctgctg ttagtgctcc cccgccccgt31020cgacccccgg tcccccactc agtcccccga agaggtccgc aaatgcaaat tccaagaacc31080ctggaaattc ctcaaatgct accgccaaaa atcagacatg cttcccagct ggatcatgat31140cattgggatc gtgaacattc tggcctgcac cctcatctcc tttgtgattt acccctgctt31200tgactttggt tggaactcgc cagaggcgct ctatctcccg cctgaacctg acacaccacc31260acagcaacct caggcacacg cactaccacc accacagcct aggccacaat acatgcccat31320attagactat gaggccgagc cacagcgacc catgctcccc gctattagtt acttcaatct31380aaccggcgga gatgactgac ccactggcca acaacaacgt caacgacctt ctcctggaca31440tggacggccg cgcctcggag cagcgactcg cccaacttcg cattcgccag cagcaggaga31500gagccgtcaa ggagctgcag gacggcatag ccatccacca gtgcaagaaa ggcatcttct31560gcctggtgaa acaggccaag atctcctacg aggtcacccc gaccgaccat cgcctctcct31620acgagctcct gcagcagcgc cagaagttca cctgcctggt cggagtcaac cccatcgtca31680tcacccagca gtcgggcgat accaaggggt gcatccactg ctcctgcgac tcccccgact31740gcgtccacac tctgatcaag accctctgcg gcctccgcga cctcctcccc atgaactaat31800caccccctta tccagtgaaa taaatatcat attgatgatg atttaaataa aaaataatca31860tttgatttga aataaagata caatcatatt gatgatttga gttttaaaaa ataaagaatc31920acttacttga aatctgatac caggtctctg tccatgtttt ctgccaacac cacctcactc31980
ccctcttccc agctctggta ctgcagaccc cggcgggctg caaacttcct ccacacgctg32040aaggggatgt caaattcctc ctgtccctca atcttcattt tatcttctat cagatgtcca32100aaaagcgcgt ccgggtggat gatgacttcg accccgtcta cccctacgat gcagacaacg32160caccgaccgt gcccttcatc aaccccccct tcgtctcttc agatggattc caagagaagc32220ccctgggggt gctgtccctg cgactggctg accccgtcac caccaagaac ggggaaatca32280ccctcaagct gggagagggg gtggacctcg actcctcggg aaaactcatc tccaacacgg32340ccaccaaggc cgccgcccct ctcagttttt ccaacaacac catttccctt aacatggata32400cccctcttta taccaaagat ggaaaattat ccttacaagt ttctccaccg ttaaacatat32460taaaatcaac cattctgaac acattagctg tagcttatgg atcaggttta ggactgagtg32520gtggcactgc tcttgcagta cagttggcct ctccactcac ttttgatgaa aaaggaaata32580ttaaaattaa cctagccagt ggtccattaa cagttgatgc aagtcgactt agtatcaact32640gcaaaagagg ggtcactgtc actacctcag gagatgcaat tgaaagcaac ataagctggc32700ctaaaggtat aagatttgaa ggtaatggca tagctgcaaa cattggcaga ggattggaat32760ttggaaccac tagtacagag actgatgtca cagatgcata cccaattcaa gttaaattgg32820gtactggcct tacctttgac agtacaggcg ccattgttgc ttggaacaaa gaggatgata32880aacttacatt atggaccaca gccgacccct cgccaaattg caaaatatac tctgaaaaag32940atgccaaact cacactttgc ttgacaaagt gtggaagtca aattctgggt actgtgactg33000tattggcagt gaataatgga agtctcaacc caatcacaaa cacagtaagc actgcactcg33060tctccctcaa gtttgatgca agtggagttt tgctaagcag ctccacatta gacaaagaat33120attggaactt cagaaaggga gatgttacac ctgctgagcc ctatactaat gctataggtt33180ttatgcctaa cataaaggcc tatcctaaaa acacatctgc agcttcaaaa agccatattg33240tcagtcaagt ttatctcaat ggggatgagg ccaaaccact gatgctgatt attactttta33300atgaaactga ggatgcaact tgcacctaca gtatcacttt tcaatggaaa tgggatagta33360ctaagtacac aggtgaaaca cttgctacca gctccttcac cttctcctac atcgcccaag33420aatgaacact gtatcccacc ctgcatgcca acccttccca ccccactctg tctatggaaa33480aaactctgaa gcacaaaata aaataaagtt caagtgtttt attgattcaa cagttttaca33540ggattcgagc agttattttt cctccaccct cccaggacat ggaatacacc accctctccc33600cccgcacagc cttgaacatc tgaatgccat tggtgatgga catgcttttg gtctccacgt33660tccacacagt ttcagagcga gccagtctcg ggtcggtcag ggagatgaaa ccctccgggc33720actcccgcat ctgcacctca cagctcaaca gctgaggatt gtcctcggtg gtcgggatca33780cggttatctg gaagaagcag aagagcggcg gtgggaatca tagtccgcga acgggatcgg33840ccggtggtgt cgcatcaggc cccgcagcag tcgctgccgc cgccgctccg tcaagctgct33900gctcaggggg tccgggtcca gggactccct cagcatgatg cccacggccc tcagcatcag33960tcgtctggtg cggcgggcgc agcagcgcat gcggatctcg ctcaggtcgc tgcagtacgt34020gcaacacagg accaccaggt tgttcaacag tccatagttc aacacgctcc agccgaaact34080catcgcggga aggatgctac ccacgtggcc gtcgtaccag atcctcaggt aaatcaagtg34140gcgctccctc cagaacacgc tgcccacgta catgatctcc ttgggcatgt ggcggttcac34200cacctcccgg taccacatca ccctctggtt gaacatgcag ccccggatga tcctgcggaa34260ccacagggcc agcaccgccc cgcccgccat gcagcgaaga gaccccgggt cccggcaatg34320gcaatggagg acccaccgct cgtacccgtg gatcatctgg gagctgaaca agtctatgtt34380ggcacagcac aggcatatgc tcatgcatct cttcagcact ctcagctcct cgggggtcaa34440aaccatatcc cagggcacgg ggaactcttg caggacagcg aaccccgcag aacagggcaa34500tcctcgcaca taacttacat tgtgcatgga cagggtatcg caatcaggca gcaccgggtg34560atcctccacc agagaagcgc gggtctcggt ctcctcacag cgtggtaagg gggccggccg34620atacgggtga tggcgggacg cggctgatcg tgttcgcgac cgtgtcatga tgcagttgct34680ttcggacatt ttcgtacttg ctgtagcaga acctggtccg ggcgctgcac accgatcgcc34740
ggcggcggtc ccggcgcttg gaacgctcgg tgttgaaatt gtaaaacagc cactctctca34800gaccgtgcag cagatctagg gcctcaggag tgatgaagat cccatcatgc ctgatagctc34860tgatcacatc gaccaccgtg gaatgggcca gacccagcca gatgatgcaa ttttgttggg34920tttcggtgac ggcgggggag ggaagaacag gaagaaccat gattaacttt taatccaaac34980ggtctcggag cacttcaaaa tgaaggtcgc ggagatggca cctctcgccc ccgctgtgtt35040ggtggaaaat aacagccagg tcaaaggtga tacggttctc gagatgttcc acggtggctt35100ccagcaaagc ctccacgcgc acatccagaa acaagacaat agcgaaagcg ggagggttct35160ctaattcctc aatcatcatg ttacactcct gcaccatccc cagataattt tcatttttcc35220agccttgaat gattcgaact agttcctgag gtaaatccaa gccagccatg ataaagagct35280cgcgcagagc gccctccacc ggcattctta agcacaccct cataattcca agatattctg35340ctcctggttc acctgcagca gattgacaag cggaatatca aaatctctgc cgcgatccct35400aagctcctcc ctcagcaata actgtaagta ctctttcata tcctctccga aatttttagc35460cataggacca ccaggaataa gattagggca agccacagta cagataaacc gaagtcctcc35520ccagtgagca ttgccaaatg caagactgct ataagcatgc tggctagacc cggtgatatc35580ttccagataa ctggacagaa aatcacccag gcaattttta agaaaatcaa caaaagaaaa35640atcctccagg tgcacgttta gagcctcggg aacaacgatg aagtaaatgc aagcggtgcg35700ttccagcatg gttagttagc tgatctgtaa aaaacaaaaa ataaaacatt aaaccatgct35760agcctggcga acaggtgggt aaatcgttct ctccagcacc aggcaggcca cggggtctcc35820ggcgcgaccc tcgtaaaaat tgtcgctatg attgaaaacc atcacagaga gacgttcccg35880gtggccggcg tgaatgattc gacaagatga atacaccccc ggaacattgg cgtccgcgag35940tgaaaaaaag cgcccgagga agcaataagg cactacaatg ctcagtctca agtccagcaa36000agcgatgcca tgcggatgaa gcacaaaatc ctcaggtgcg tacaaaatgt aattactccc36060ctcctgcaca ggcagcgaag cccccgatcc ctccagatac acatacaaag cctcagcgtc36120catagcttac cgagcagcag cacacaacag gcgcaagagt cagagaaagg ctgagctcta36180acctgtccac ccgctctctg ctcaatatat agcccagatc tacactgacg taaaggccaa36240agtctaaaaa tacccgccaa ataatcacac acgcccagca cacgcccaga aaccggtgac36300acactcaaaa aaatacgcgc acttcctcaa acgcccaaac tgccgtcatt tccgggttcc36360cacgctacgt catcggaatt cgactttcaa attccgtcga ccgttaaaaa cgtcacccgc36420cccgccccta acggtcgccc gtctctcggc caatcacctt cctccctccc caaattcaaa36480cagctcattt gcatattaac gcgcaccaaa agtttgaggt atattattga tgatg 36535<210>4<211>34264<212>DNA<213>猿腺病毒SV-1<400>4tccttattct ggaaacgtgc caatatgata atgagcgggg aggagcgagg cggggccggg 60gtgacgtgcg gtgacgtggg gtgacgcggg gtggcgcgag ggcggggcgg gagtggggag 120gcgcttagtt tttacgtatg cggaaggagg ttttataccg gaagttgggt aatttgggcg 180tatacttgta agttttgtgt aatttggcgc gaaaaccggg taatgaggaa gttgaggtta 240atatgtactt tttatgactg ggcggaattt ctgctgatca gcagtgaact ttgggcgctg 300acggggaggt ttcgctacgt ggcagtacca cgagaaggct caaaggtccc atttattgta 360ctcctcagcg ttttcgctgg gtatttaaac gctgtcagat catcaagagg ccactcttga 420gtgccggcga gtagagtttt ctcctccgcg ctgccgcgat gaggctggtt cccgagatgt 480acggtgtttt ctgcagcgag acggcccgga actcagatga gctgcttaat acagatctgc 540
tggatgttcc caactcgcct gtggcttcgc ctccgtcgct tcatgatctt ttcgatgtgg 600aagtggatcc accgcaagat cccaacgagg acgcggtaaa cagtatgttc cctgaatgtc 660tgtttgaggc ggctgaggag ggttctcaca gcagtgaaga gagcagacgg ggagaggaac 720tggacttgaa atgctacgag gaatgtctgc cttctagcga ttctgaaacg gaacagacag 780ggggagacgg ctgtgagtcg gcaatgaaaa atgaacttgt attagactgt ccagaacatc 840ctggtcatgg ctgccgtgcc tgtgcttttc atagaaatgc cagcggaaat cctgagactc 900tatgtgctct gtgttatctg cgccttacca gcgattttgt atacagtaag taaagtgttt 960tcattggcgt acggtagggg attcgttgaa gtgctttgtg acttattatg tgtcattatt1020tctaggtgac gtgtccgacg tggaagggga aggagataga tcaggggctg ctaattctcc1080ttgcactttg ggggctgtgg ttccagttgg catttttaaa ccgagtggtg gaggagaacg1140agccggagga gaccgagaat ctgagagccg gcctggaccc tccagtggaa gactaggtgc1200tgaggatgat cctgaagagg ggactagtgg gggtgctagg aaaaagcaaa aaactgagcc1260tgaacctaga aactttttga atgagttgac tgtaagccta atgaatcggc agcgtcctga1320gacggtgttt tggactgagt tggaggatga gttcaagaag ggggaattaa acctcttgta1380caagtatggg tttgagcagt tgaaaactca ctggttggag ccgtgggagg atatggaaat1440ggctctagac acctttgcta aagtggctct gcggccggat aaagtttaca ctattcgccg1500cactgttaat ataaaaaaga gtgtttatgt tatcggccat ggagctctgg tgcaggtgca1560gaccccagac cgggtggctt tcaattgcgg catgcagagt ttgggccccg gggtgatagg1620tttgaatgga gttacatttc aaaatgtcag gtttactggt gatgatttta atggctctgt1680gtttgtgact agcacccagc taaccctcca cggtgtttac ttttttaact ttaacaatac1740atgtgtggag tcatggggta gggtgtctct gaggggctgc agttttcatg gttgctggaa1800ggcggtggtg ggaagaatta aaagtgtcat gtctgtgaag aaatgcatat ttgaacgctg1860tgtgatagct ctagcagtag aggggtacgg acggatcagg aataacgccg catctgagaa1920tggatgtttt cttttgctga aaggtacggc cagcgttaag cataatatga tttgcggcag1980cggcctgtgc ccctcgcagc tcttaacttg cgcagatgga aactgtcaca ccttgcgcac2040cgtgcacata gtgtcccact cgcgccgcac ctggccaaca tttgagcaca atatgctcat2100gcgttgcgcc gttcacctag gtgctagacg cggcgtgttt atgccttatc aatgtaactt2160tagtcatact aagattttgc tggaaactga ttccttccct cgagtatgtt tcaatggggt2220gtttgacatg tcaatggaac tttttaaagt gataagatat gatgaaacca agtctcgttg2280tcgctcatgt gaatgcggag ctaatcattt gaggttgtat cctgtaaccc tgaacgttac2340cgaggagctg aggacggacc accacatgct gtcttgcctg cgtaccgact atgaatccag2400cgatgaggag tgaggtgagg ggcggagcca caaagggtat aaaggggcat gaggggtggg2460cgcggtgttt caaaatgagc gggacgacgg acggcaatgc gtttgagggg ggagtgttca2520gcccatatct gacatctcgt cttccttcct gggcaggagt tcgtcagaat gtagtgggct2580ccaccgtgga cggacggccg gtcgcccctg caaattccgc caccctcacc tatgccaccg2640tgggatcatc gttggacact gccgcggcag ctgccgcttc tgctgccgct tctactgctc2700gcggcatggc ggctgatttt ggactatata accaactggc cactgcagct gtggcgtctc2760ggtctctggt tcaagaagat gccctgaatg tgatcttgac tcgcctggag atcatgtcac2820gtcgcctgga cgaactggct gcgcagatat cccaagctaa ccccgatacc gcttcagaat2880cttaaaataa agacaaacaa atttgttgaa aagtaaaatg gctttatttg ttttttttgg2940ctcggtaggc tcgggtccac ctgtctcggt cgttaaggac tttgtgtatg ttttccaaaa3000cacggtacag atgggcttgg atgttcaagt acatgggcat gaggccatct ttggggtgga3060gataggacca ctgaagagcg tcatgttccg gggtggtatt gtaaatcacc cagtcgtagc3120agggtttttg agcgtggaac tggaatatgt ccttcaggag caggctaatg gccaagggta3180gacccttagt gtaggtgttt acaaagcggt tgagctggga gggatgcatg cggggggaga3240tgatatgcat cttggcttgg attttgaggt tagctatgtt accacccagg tctctgcggg3300
ggttcatgtt atgaaggacc accagcacgg tatagccagt gcatttgggg aacttgtcat3360gcagtttgga ggggaaggcg tggaagaatt tagatacccc cttgtgcccc cctaggtttt3420ccatgcactc atccataata atggcaatgg gacccctggc ggccgcttta gcaaacacgt3480tttgggggtt ggaaacatca tagttttgct ctagagtgag ctcatcatag gccatcttta3540caaagcgggg taggagggtg cccgactggg ggatgatagt tccatctggg cctggagcgt3600agttgccctc acagatctgc atctcccagg ccttaatttc cgaggggggg atcatgtcca3660cctggggggc gataaaaaac acggtttctg gcggggggtt aatgagctgg gtggaaagca3720agttacgcaa cagctgggat ttgccgcaac cggtgggacc gtagatgacc ccgatgacgg3780gttgcagctg gtagttcaga gaggaacagc tgccgtcggg gcgcaggagg ggagctacct3840cattcatcat gcttctgaca tgtttatttt cactcactaa gttttgcaag agcctctccc3900cacccaggga taagagttct tccaggctgt tgaagtgttt cagcggtttc aggccgtcgg3960ccatgggcat cttttcaagc gactgacgaa gcaagtacag tcggtcccag agctcggtga4020cgtgctctat ggaatctcga tccagcagac ttcttggttt cgggggttgg gccgactttc4080gctgtagggc accagccggt gggcgtccag ggccgcgagg gttctgtcct tccagggtct4140cagcgttcgg gtgagggtgg tctcggtgac ggtgaaggga tgagccccgg gctgggcgct4200tgcgagggtg cgcttcaggc tcatcctgct ggtgctgaag cgggcgtcgt ctccctgtga4260gtcggccaga tagcaacgaa gcatgaggtc gtagctgagg gactcggccg cgtgtccctt4320ggcgcgcagc tttcccttgg aaacgtgctg acatttggtg cagtgcagac acttgagggc4380gtagagtttt ggggccagga agaccgactc gggcgagtag gcgtcggctc cgcactgagc4440gcagacggtc tcgcactcca ccagccacgt gagctcgggt ttagcgggat caaaaaccaa4500gttgcctcca ttttttttga tgcgtttctt accttgcgtc tccatgagtc tgtgtcccgc4560ttccgtgaca aaaaggctgt cggtatcccc gtagaccgac ttgagggggc gatcttccaa4620aggtgttccg aggtcttccg cgtacaggaa ctgggaccac tccgagacaa aggctcgggt4680ccaggctaac acgaaggagg cgatctgcga ggggtatctg tcgttttcaa tgagggggtc4740caccttttcc agggtgtgca gacacaggtc gtcctcctcc gcgtccacga aggtgattgg4800cttgtaagtg taggtcacgt gacccgcacc cccccaaggg gtataaaagg gggcgtgccc4860actctccccg tcactttctt ccgcatcgct gtggaccaga gccagctgtt cgggtgagta4920ggccctctca aaagccggca tgatttcggc gctcaagttg tcagtttcta caaacgaggt4980ggatttgata ttcacgtgcc ccgcggcgat gcttttgatg gtggaggggt ccatctgatc5040agaaaacacg atctttttat tgtcaagttt ggtggcgaaa gacccgtaga gggcgttgga5100aagcaacttg gcgatggagc gcagggtctg atttttctcc cgatcggccc tctccttggc5160ggcgatgttg agttgcacgt actcgcgggc cacgcaccgc cactcgggga acacggcggt5220gcgctcgtcg ggcaggatgc gcacgcgcca gccgcggttg tgcagggtga tgaggtccac5280gctggtggcc acctccccgc ggaggggctc gttggtccaa cacaatcgcc ccccttttct5340ggagcagaac ggaggcaggg gatctagcaa gttggcgggc ggggggtcgg cgtcgatggt5400aaatatgccg ggtagcagaa ttttattaaa ataatcgatt tcggtgtccg tgtcttgcaa5460cgcgtcttcc cacttcttca ccgccagggc cctttcgtag ggattcaggg gcggtcccca5520gggcatgggg tgggtcaggg ccgaggcgta catgccgcag atgtcgtaca cgtacagggg5580ctccctcaac accccgatgt aagtggggta acagcgcccc ccgcggatgc tggctcgcac5640gtagtcgtac atctcgtgag agggagccat gagcccgtct cccaagtggg tcttgtgggg5700tttttcggcc cggtagagga tctgcctgaa gatggcgtgg gagttggaag agatagtggg5760gcgttggaag acgttaaagt tggctccggg cagtcccacg gagtcttgga tgaactgggc5820gtaggattcc cggagcttgt ccaccagggc tgcggttacc agcacgtcga gagcgcagta5880gtccaacgtc tcgcggacca ggttgtaggc cgtctcttgt tttttctccc acagttcgcg5940attgaggagg tattcctcgc ggtctttcca gtactcttcg gcgggaaatc ctttttcgtc6000cgctcggtaa gaacctaaca tgtaaaattc gttcacggct ttgtatggac aacagccttt6060
ttctaccggc agggcgtacg cttgagcggc ctttctgaga gaggtgtggg tgagggcgaa6120ggtgtcccgc accatcactt tcaggtactg atgtttgaag tccgtgtcgt cgcaggcgcc6180ctgttcccac agcgtgaagt cggtgcgctt tttctgcctg ggattgggga gggcgaatgt6240gacgtcgtta aagaggattt tcccggcgcg gggcatgaag ttgcgagaga tcctgaaggg6300tccgggcacg tccgagcggt tgttgatgac ttgcgccgcc aggacgatct cgtcgaagcc6360gttgatgttg tggcccacga tgtaaagttc gataaagcgc ggctgtccct tgagggccgg6420cgcttttttc aactcctcgt aggtgagaca gtccggcgag gagagaccca gctccgcccg6480ggcccagtcg gagagctgag ggttagccgc gaggaaagag ctccacaggt caagggctag6540cagagtttgc aagcggtcgc ggaactcgcg aaactttttc cccacggcca ttttctccgg6600cgtcaccacg tagaaagtgc aggggcggtc gttccagacg tcccatcgga gctctagggc6660cagctcgcag gcttgacgaa cgagggtctc ctcgcccgag acgtgcatga ccagcatgaa6720gggtaccaac tgtttcccga acgagcccat ccatgtgtag gtttctacgt cgtaggtgac6780aaagagccgc tgggtgcgcg cgtgggagcc gatcgggaag aagctgatct cctgccacca6840gttggaggaa tgggtgttga tgtggtgaaa gtagaagtcc cgccggcgca cagagcattc6900gtgctgatgt ttgtaaaagc gaccgcagta gtcgcagcgc tgcacgctct gtatctcctg6960aatgagatgc gcttttcgcc cgcgcaccag aaaccggagg gggaagttga gacgggggct7020tggtggggcg gcatcccctt cgccttggcg gtgggagtct gcgtctgcgc cctccttctc7080tgggtggacg acggtgggga cgacgacgcc ccgggtgccg caagtccaga tctccgccac7140ggaggggcgc aggcgttgca ggaggggacg cagctgcccg ctgtccaggg agtcgagggc7200ggccgcgctg aggtcggcgg gaagcgtttg caagttcact ttcagaagac cggtaagagc7260gtgagccagg tgcacatggt acttgatttc caggggggtg ttggaagagg cgtccacggc7320gtagaggagg ccgtgtccgc gcggggccac caccgtgccc cgaggaggtt ttatctcact7380cgtcgagggc gagcgccggg gggtagaggc ggctctgcgc cggggggcag cggaggcagt7440ggcacgtttt cgtgaggatt cggcagcggt tgatgacgag cccggagact gctggcgtgg7500gcgacgacgc ggcggttgag gtcctggatg tgccgtctct gcgtgaagac caccggcccc7560cgggtcctga acctgaaaga gagttccaca gaatcaatgt ctgcatcgtt aacggcggcc7620tgcctgagga tctcctgtac gtcgcccgag ttgtcttgat aggcgatctc ggccatgaac7680tgctccactt cttcctcgcg gaggtcgccg tggcccgctc gctccacggt ggcggccagg7740tcgttggaga tgcgacgcat gagttgagag aaggcgttga ggccgttctc gttccacacg7800cggctgtaca ccacgtttcc gaaggagtcg cgcgctcgca tgaccacctg ggccacgttg7860agttccacgt ggcgggcgaa gacggcgtag tttctgaggc gctggaagag gtagttgagc7920gtggtggcga tgtgctcgca gacgaagaag tacatgatcc agcgccgcag ggtcatctcg7980ttgatgtctc cgatggcttc gagacgctcc atggcctcgt agaagtcgac ggcgaagttg8040aaaaattggg agttgcgggc ggccaccgtg agttcttctt gcaggaggcg gatgagatcg8100gcgaccgtgt cgcgcacctc ctgctcgaaa gcgccccgag gcgcctctgc ttcttcctcc8160ggctcctcct cttccagggg cacgggttcc tccggcagct ctgcgacggg gacggggcgg8220cgacgtcgtc gtctgaccgg caggcggtcc acgaagcgct cgatcatttc gccgcgccgg8280cgacgcatgg tctcggtgac ggcgcgtccg ttttcgcgag gtcgcagttc gaagacgccg8340ccgcgcagag cgcccccgtg cagggagggt aagtggttag ggccgtcggg cagggacacg8400gcgctgacga tgcattttat caattgctgc gtaggcactc cgtgcaggga tctgagaacg8460tcgaggtcga cgggatccga gaacttctct aggaaagcgt ctatccaatc gcagtcgcaa8520ggtaagctga ggacggtggg ccgctggggg gcgtccgcgg gcagttggga ggtgatgctg8580ctgatgatgt aattaaagta ggcggtcttc aggcggcgga tggtggcgag gaggaccacg8640tctttgggcc cggcctgttg aatgcgcagg cgctcggcca tgccccaggc ctcgctctga8700cagcgacgca ggtctttgta gtagtcttgc atcagtctct ccaccggaac ctctgcttct8760cccctgtctg ccatgcgagt cgagccgaac ccccgcaggg gctgcagcaa cgctaggtcg8820
gccacgaccc tctcggccag cacggcctgt tggatctgcg tgagggtggt ctggaagtcg 8880tccaggtcca cgaagcggtg ataggccccc gtgttgatgg tgtaggtgca gttggccatg 8940acggaccagt tgacgacttg catgccgggt tgggtgatct ccgtgtactt gaggcgcgag 9000taggcgcggg actcgaacac gtagtcgttg catgtgcgta ccagatactg gtagccaacc 9060aggaagtggg gaggcggttc tcggtacagg ggccagccga ctgtggcggg ggcgccgggg 9120gacaggtcgt ccagcatgag gcgatggtag tggtagatgt agcgggagag ccaggtgatg 9180ccggccgagg tggtcgcggc cctggtgaat tcgcggacgc ggttccagat gttgcgcagg 9240gggcgaaagc gctccatggt gggcacgctc tgccccgtga ggcgggcgca atcttgtacg 9300ctctagatgg aaaaaagaca gggcggtcat cgactccctt ccgtagctcg gggggtaaag 9360tcgcaagggt gcggcggcgg ggaaccccgg ttcgagaccg gccggatccg ccgctcccga 9420tgcgcctggc cccgcatcca cgacgtccgc gtcgagaccc agccgcgacg ctccgcccca 9480atacggaggg gagtcttttg gtgttttttc gtagatgcat ccggtgctgc ggcagatgcg 9540acctcagacg cccaccacca ccgccgcggc ggcagtaaac ctgagcggag gcggtgacag 9600ggaggaggag gagctggctt tagacctgga agagggagag gggctggccc ggctgggagc 9660gccgtcccca gagagacacc ctagggttca gctcgtgagg gacgccaggc aggcttttgt 9720gccgaagcag aacctgttta gggaccgcag cggtcaggag gcggaggaga tgcgcgattg 9780caggtttcgg gcgggtagag agctgagggc gggcttcgat cgggagcggc tcctgagggc 9840ggaggatttc gagcccgacg agcgttctgg ggtgagcccg gcccgcgctc acgtctcggc 9900ggccaacctg gtgagcgcgt acgagcagac ggtgaacgag gagcgcaact tccaaaagag 9960ctttaacaat cacgtgagga ccctgatcgc gagggaggag gtgaccatcg ggctgatgca10020tctgtgggac ttcgtggagg cctacgtgca gaacccggcc agcaaacctc tgacggccca10080gctgttcctg atcgtgcagc acagccgcga caacgagacg ttccgcgacg ccatgttgaa10140catcgcggag cccgagggtc gctggctctt ggatctgatt aacatcctgc agagcatcgt10200ggtgcaggag aggggcctca gcttagcgga caaggtggcg gccattaact attcgatgca10260gagcctgggg aagttctacg ctcgcaagat ctacaagagc ccttacgtgc ccatagacaa10320ggaggtgaag atagacagct tttacatgcg catggcgctg aaggtgctga cgctgagcga10380cgacctcggc gtgtaccgta acgacaagat ccacaaggcg gtgagcgcca gccgccggcg10440ggagctgagc gacagggagc tgatgcacag cctgcagagg gcgctggcgg gcgccgggga10500cgaggagcgc gaggcttact tcgacatggg agccgatctg cagtggcgtc ccagcgcgcg10560cgccttggag gcggcgggct accccgacga ggaggatcgg gacgatttgg aggaggcagg10620cgagtacgag gacgaagcct gaccgggcag gtgttgtttt agatgcagcg gccggcggac10680ggggccaccg cggatcccgc acttttggca tccatgcaga gtcaaccttc gggcgtgacc10740gcctccgatg actgggcggc ggccatggac cgcattatgg cgctgactac ccgcaacccc10800gaggctttta gacagcaacc ccaggccaac cgtttttcgg ccatcttgga agcggtggtg10860ccctcccgca ccaaccccac acacgagaaa gtcctgacta tcgtgaacgc cctggtagac10920agcaaggcca tccgccgcga cgaggcgggc ttgatttaca acgctctgct ggaacgggtg10980gcgcgctaca acagcactaa cgttcagacc aatctggatc gcctcaccac cgacgtgaag11040gaggcgctgg ctcagaagga gcggtttctg agggacagca atctgggctc tctggtggca11100ctcaacgcct tcctgagcac gcagccggcc aacgtgcccc gcgggcagga ggactacgtg11160agcttcatca gcgctctgag gctgctggtg tccgaggtgc cccagagcga ggtgtatcag11220tctgggccgg attacttctt ccagacgtcc cgacagggct tgcaaacggt gaacctgact11280caggccttta aaaacttgca aggcatgtgg ggcgttaagg ccccggtggg cgatcgagcc11340accatctcca gtctgctgac ccccaacact cgcctgctgc tgctcttgat cgcgccgttc11400accaacagta gcactatcag ccgtgactcg tacctgggtc atctcatcac tttgtaccgc11460gaggccatcg gtcaggctca gatcgacgag cacacatatc aggagatcac taacgtgagc11520cgggccctgg gtcaggaaga taccggcagc ctggaagcca cgttgaactt tttgctaacc11580
aaccggaggc aaaaaatacc ctcccagttt acgttaagcg ccgaggagga gaggattctg11640cgatacgtgc agcagtccgt gagtctgtac ttgatgcggg agggcgccac cgcttccacg11700gctttagaca tgacggctcg gaacatggaa ccgtcctttt actccgccca ccggccgttc11760attaaccgtc tgatggacta cttccatcgc gcggccgcca tgaacgggga gtacttcacc11820aatgccatcc tgaatccgca ttggatgccc ccgtccggct tctacaccgg cgagtttgac11880ctgcccgaag ccgacgacgg ctttctttgg gacgacgtgt ccgacagcat tttcacgccg11940ggcaatcgcc gattccagaa gaaggagggc ggagacgagc tccccctctc cagcgtggag12000gcggcctcta ggggagagag tccctttccc agtctgtctt ccgccagcag tggtcgggta12060acgcgcccgc ggttgccggg ggagagcgac tacctgaacg accccttgct gcggccggct12120aggaagaaaa atttccccaa caacggggtg gaaagcttgg tggataaaat gaatcgttgg12180aagacctacg cccaggagca gcgggagtgg gaggacagtc agccgcgacc gctggttccg12240ccgcactggc gtcgtcagag agaagacccg gacgactccg cagacgatag tagcgtgttg12300gacctgggag ggagcggagc caaccccttt gctcacttgc aacccaaggg gcgttccagt12360cgcctctact aataaaaaag acgcggaaac ttaccagagc catggccaca gcgtgtgtcc12420tttcttcctc tctttcttcc tcggcgcggc agaatgagaa gagcggtgag agtcacgccg12480gcggcgtatg agggtccgcc cccttcttac gaaagcgtga tgggatcagc gaacgtgccg12540gccacgctgg aggcgcctta cgttcctccc agatacctgg gacctacgga gggcagaaac12600agcatccgtt actccgagct ggcacccctg tacgatacca ccaaggtgta cctggtggac12660aacaagtcgg cggacatcgc ctccctgaat tatcaaaacg atcacagcaa ttttctgact12720accgtggtgc agaacaatga cttcaccccg acggaggcgg gcacgcagac cattaacttt12780gacgagcgtt cccgctgggg cggtcagctg aaaaccatcc tgcacaccaa catgcccaac12840atcaacgagt tcatgtccac caacaagttc agggccaggc tgatggttaa aaaggctgaa12900aaccagcctc ccgagtacga atggtttgag ttcaccattc ccgagggcaa ctattccgag12960accatgacta tcgatctgat gaacaatgcg atcgtggaca attacctgca agtggggagg13020cagaacgggg tattggaaag cgatatcggc gtaaaatttg ataccagaaa cttccgactg13080gggtgggatc ccgtgaccaa gctggtgatg ccaggcgtgt acaccaacga ggcttttcac13140cccgacatcg tgctgctgcc ggggtgcggt gtggacttca ctcagagccg tttgagtaac13200ctgttaggga tcagaaagcg ccgccccttc caagagggct ttcagatcat gtatgaggac13260ctggaaggag gtaacattcc aggtttgcta gacgtgccgg cgtatgaaga gagtgttaaa13320caggcggagg cgcagggacg agagattcga ggcgacacct ttgccacgga acctcacgaa13380ctggtaataa aacctctgga acaagacagt aaaaaacgga gttacaacat tatatccggc13440actatgaata ccttgtaccg gagctggttt ctggcttaca actacgggga tcccgaaaag13500ggagtgagat catggaccat actcaccacc acggacgtga cctgcggctc gcagcaagtg13560tactggtccc tgccggatat gatgcaagac ccggtcacct tccgcccctc cacccaagtc13620agcaacttcc cggtggtggg caccgagctg ctgcccgtcc atgccaagag cttctacaac13680gaacaggccg tctactcgca actcattcgc cagtccaccg cgcttaccca cgtgttcaat13740cgctttcccg agaaccagat tctggtgcgc cctcccgctc ctaccattac caccgtcagt13800gaaaacgttc ccgccctcac agatcacgga accctgccgc tgcgcagcag tatcagtgga13860gttcagcgcg tgaccatcac cgacgccaga cgtcgaacct gtccctacgt ttacaaagct13920cttggcgtag tggctcctaa agtgctctct agtcgcacct tctaaacatg tccatcctca13980tctctcccga taacaacacc ggctggggac tgggctccgg caagatgtac ggcggagcca14040aaaggcgctc cagtcagcac ccagttcgag ttcggggcca cttccgtgct ccctggggag14100cttacaagcg aggactctcg ggccgaacgg cggtagacga taccatagat gccgtgattg14160ccgacgcccg ccggtacaac cccggaccgg tcgctagcgc cgcctccacc gtggattccg14220tgatcgacag cgtggtagct ggcgctcggg cctatgctcg ccgcaagagg cggctgcatc14280ggagacgtcg ccccaccgcc gccatgctgg cagccagggc cgtgctgagg cgggcccgga14340
gggtaggcag aagggctatg cgccgcgctg ccgccaacgc cgccgccggg agggcccgcc14400gacaggctgc ccgccaggct gctgccgcca tcgctagcat ggccagaccc aggagaggga14460acgtgtactg ggtgcgcgat tctgtgacgg gagtccgagt gccggtgcgc agccgacctc14520cccgaagtta gaagatccaa gctgcgaaga cggcggtact gagtctccct gttgttatca14580gcccaacatg agcaagcgca agtttaaaga agaactgctg cagacgctgg tgcctgagat14640ctatggccct ccggacgtga agcctgacat taagccccgc gatatcaagc gtgttaaaaa14700gcgggaaaag aaagaggaac tcgcggtggt agacgatggc ggagtggaat ttattaggag14760tttcgccccg cgacgcaggg ttcaatggaa agggcggcgg gtacaacgcg ttttgaggcc14820gggcaccgcg gtagttttta ccccgggaga gcggtcggcc gttaggggtt tcaaaaggca14880gtacgacgag gtgtacggcg acgaggacat attggaacag gcggctcaac agatcggaga14940atttgcctac ggaaagcgtt cgcgtcgcga agacctggcc atcgctttag acagcggcaa15000ccccacgccc agcctcaaac ctgtgacgct gcagcaggtg ctccccgtga gcgccagcac15060ggacagcaag aggggaataa aaagagaaat ggaagatctg cagcccacca tccagctcat15120ggtccctaaa cggcagaggc tggaagaggt cctggagaaa atgaaagtgg acccaagcat15180agagccggac gtcaaagtca ggccgatcaa agaagtggcc cctggtctcg gggtgcagac15240ggtggatatc cagatccccg tcacgtcagc ttcgaccgcc gtggaagcca tggaaacgca15300aacggaaacc cctgccgcga tcggtaccag ggaagtggcg ttgcaaaccg acccctggta15360cgaatacgcc gcccctcggc gtcagaggcg acccgctcgt tacggccccg ccaacgccat15420catgccagaa tatgcgctgc atccgtctat cctgcccacc cccggctacc ggggagtgac15480gtatcgcccg tcaggaaccc gccgccgaac ccgtcgccgc cgccgctccc gtcgtgctct15540ggcccccgtg tcggtgcgcc gcgtaacacg ccggggaaag acagttacca ttcccaaccc15600gcgctaccac cctagcatcc tttaatgact ctgccgtttt gcagatggct ctgacttgcc15660gcgtgcgcct tcccgttccg cactatcgag gaagatctcg tcgtaggaga ggcatggcgg15720gtagtggtcg ccggcgggct ttgcgcaggc gcatgaaagg cggaatttta cccgctctga15780tacccataat cgccgccgcc atcggtgcca tacccggcgt cgcttcagtg gccttgcaag15840cagctcgtaa taaataaacg aaggcttttg cacttatgtc ctggtcctga ctattttatg15900cagaaagagc atggaagaca tcaattttac gtcgctggct ccgcggcacg gctcgcggcc15960gctcatgggc acctggaacg acatcggcac cagtcagctc aacgggggcg ctttcaattg16020ggggagcctt tggagcggca ttaaaaactt tggctccacg attaaatcct acggcagcaa16080agcctggaac agtagtgctg gtcagatgct ccgagataaa ctgaaggaca ccaacttcca16140agaaaaagtg gtcaatgggg tggtgaccgg catccacggc gcggtagatc tcgccaacca16200agcggtgcag aaagagattg acaggcgttt ggaaagctcg cgggtgccgc cgcagagagg16260ggatgaggtg gaggtcgagg aagtagaagt agaggaaaag ctgcccccgc tggagaaagt16320tcccggtgcg cctccgagac cgcagaagcg acccaggcca gaactagaag aaactctggt16380gacggagagc aaggagcctc cctcgtacga gcaagccttg aaagagggcg cctctccacc16440ctacccaatg acaaaaccga tcgcgcctat ggctcggccg gtgtacggga aggactacaa16500gcctgtcacg ctagagctcc ccccgccgcc accgccgccc cccacgcgcc cgaccgttcc16560cccccccctg ccggctccgt cggcgggacc cgtgtccgca cccgtcgccg tgcctctgcc16620agccgcccgc ccagtggccg tggccactgc cagaaacccc agaggccaga gaggagccaa16680ctggcaaagc acgctgaaca gcatcgtggg cctgggagtg aaaagcctga aacgccgccg16740ttgctattat taaaagtgta gctaaaaaat ttcccgttgt atacgcctcc tatgttaccg16800ccagagacgc gtgactgtcg ccgcgagcgc cgctttcaag atggccaccc catcgatgat16860gccgcagtgg tcttacatgc acatcgccgg gcaggacgcc tcggagtacc tgagccccgg16920tctcgtgcag ttcgcccgcg ccaccgacac ctacttcagc ttgggaaaca agtttagaaa16980ccccaccgtg gcccccaccc acgatgtaac cacggaccgc tcgcaaaggc tgaccctgcg17040ttttgtgccc gtagaccggg aggacaccgc gtactcttac aaagtgcgct acacgctggc17100
cgtaggggac aaccgagtgc tggacatggc cagcacctac tttgacatcc ggggagtgct17160ggatcgcggt cccagtttta agccctactc gggtaccgcg tacaattccc tggctcccaa17220gggcgctccc aaccctgcag aatggacgaa ttcagacagc aaagttaaag tgagggcaca17280ggcgcctttt gttagctcgt atggtgctac agcgattaca aaagagggta ttcaggtggg17340agtaacctta acagactccg gatcaacacc acagtatgca gataaaacgt atcagcctga17400gccgcaaatt ggagaactac agtggaacag cgatgttgga accgatgaca aaatagcagg17460aagagtgcta aagaaaacaa cgcccatgtt cccttgttac ggctcatatg ccaggcccac17520taatgaaaaa ggaggacagg caacaccgtc cgctagtcaa gacgtgcaaa atcccgaatt17580acaatttttt gcctctacta atgtcgccaa tacaccaaaa gcagttctat atgcggagga17640cgtgtcaatt gaagcgccag acactcactt ggtgttcaaa ccaacagtca ctgaaggcat17700tacaagttca gaggctctac tgacccaaca agctgctccc aaccgtccaa actacatagc17760ctttagagat aattttattg gtctcatgta ctacaatagc acaggtaaca tgggagtact17820ggcaggccag gcttctcagc taaatgcagt tgttgacctg caagacagaa atactgagct17880gtcctaccaa ctcatgttgg acgccctcgg agaccgcagt cggtactttt ctatgtggaa17940ccaagctgtg gatagttacg atcctgatgt aagaatcata gaaaaccatg gcgtagaaga18000tgaattgcct aattattgct ttcctttggg aggcatggca gtaaccgaca cctactcgcc18060tataaaggtt aatggaggag gcaatggatg ggaagccaat aacggcgttt tcaccgaaag18120aggagtggaa ataggttcag ggaacatgtt tgccatggag attaacctgc aagccaacct18180atggcgtagc tttctgtact ccaatattgg gctgtacctg ccagactctc tcaaaatcac18240tcctgacaac atcacactcc cagagaacaa aaacacctat cagtatatga acggtcgcgt18300gacgccaccc gggctggttg acacctacgt taacgtgggc gcgcgctggt cccccgatgt18360catggacagt attaaccctt ttaatcacca ccgcaacgcc ggactccgct accgttccat18420gctcctggga aacggacgct acgtgccctt ccacatccag gtgccccaga aattctttgc18480aattaaaaac ctgctgctgc tccccggttc ctacacctac gagtggaact tccgcaagga18540cgtgaacatg atcttgcaga gctcgctggg caatgacctg cgagtggacg gggccagcat18600ccgcttcgac agcatcaacc tgtacgccaa ctttttcccc atggcccaca acacggcctc18660caccctggaa gccatgctgc gcaacgacac caacgaccaa tctttcaacg actacctgtg18720cgcggccaac atgctgtacc ccatccccgc caacgccacc agcgtgccca tctccattcc18780ctctcgcaac tgggcagcct tcaggggctg gagtttcacc cgcctcaaaa ccaaggagac18840cccctcgctg ggctccgggt tcgaccccta cttcgtctac tccggctcca tcccctacct18900ggacggcacc ttctacctca accatacttt caaaaaggtg tcaatcatgt tcgactcctc18960cgtcagctgg cccggcaacg accgtctgct gacgcccaac gagttcgaaa tcaagcgttc19020ggtggacggt gaagggtaca acgtggctca gagcaacatg accaaggact ggttcctgat19080tcagatgctc agccactaca acatcggcta ccagggcttc tacgtgcccg aaaattacaa19140ggaccgcatg tactctttct tcagaaactt ccaacccatg agccgccaaa ttgtagattc19200aacggcttac actaattatc aggatgtgaa actgccatac cagcataaca actcagggtt19260cgtgggctac atgggaccca ccatgcgaga ggggcaggcc tacccggcca actatcccta19320tcccctgatt ggggccaccg ccgtgcccag cctcacgcag aaaaagttcc tctgcgaccg19380ggtgatgtgg aggatcccct tctctagcaa cttcatgtct atgggctccc tcaccgacct19440ggggcagaac atgctgtacg ccaactccgc tcacgccttg gatatgacct ttgaggtgga19500tcccatggat gagcccacgc ttctctatgt tctgtttgaa gtcttcgacg tggtgcgcat19560ccaccagccg caccgcggcg tcatcgaggc cgtctacctg cgcacacctt tctctgccgg19620taacgccacc acctaaagaa gccgatgggc tccagcgaac aggagctgca ggccattgtt19680cgcgacctgg gctgcgggcc ctactttttg ggcaccttcg acaagcgttt tcccggcttc19740atgtcccccc acaagccggc ctgtgccatc gttaacacgg ccggacggga gaccgggggg19800gtccactggc tcgccttcgc ctggaacccg cgtaaccgca cctgctacct gttcgaccct19860
tttggtttct ccgacgaaag gctgaagcag atctaccagt tcgagtacga ggggctcctc19920aagcgcagcg ctctggcctc cacgcccgac cactgcgtca ccctggaaaa gtccacccaa19980acggtccagg ggcccctctc ggccgcctgc gggctcttct gttgcatgtt tttgcacgcc20040ttcgtgcact ggcctcacac ccccatggat cacaacccca ccatggatct gctcaccgga20100gtgcccaaca gcatgcttca cagcccccag gtcgccccca ccctgcgccg taaccaggaa20160cacctgtatc gctttctggg gaaacactct gcctattttc gccgccaccg gcagcgcatc20220gaacgggcca cggccttcga aagcatgagc caaagagtgt aatcaataaa aaacattttt20280atttgacatg atacgcgctt ctggcgtttt attaaaaatc gaagggttcg agggaggggt20340cctcgtgccc gctggggagg gacacgttgc gatactggaa acgggcgctc caacgaaact20400cggggatcac cagccgcggc aggggcacgt cttctaggtt ctgcttccaa aactgccgca20460ccagctgcag ggctcccatg acgtcgggcg ccgatatctt gaagtcgcag ttagggccgg20520agctcccgcg gctgttgcgg aacacggggt tggcacactg gaacaccagc acgccggggt20580tgtggatact ggccagggcc gtcgggtcgg tcacctccga cgcatccaga tcctcggcgt20640tgctcagggc aaacggggtc agcttgcaca tctgccgccc aatctggggt actaggtcgc20700gcttgttgag gcagtcgcag cgcagaggga tcaggatgcg tcgctgcccg cgttgcatga20760tagggtaact cgccgccagg aactcctcca tttgacggaa ggccatctgg gctttgccgc20820cctcggtgta gaatagcccg caggacttgc tagagaatac gttatgaccg cagttgacgt20880cctccgcgca gcagcgggcg tcttcgttct tcagctgaac cacgttgcgg ccccaacggt20940tctggaccac cttggctcta gtggggtgct ccttcagcgc ccgctgtccg ttctcgctgg21000ttacatccat ttccaacacg tgctccttgc agaccatctc cactccgtgg aagcaaaaca21060ggacgccctc ctgctgggta ctgcgatgct cccatacggc gcatccggtg ggctcccagc21120tcttgtgttt tacccccgcg taggcttcca tgtaagccat aaggaatctg cccatcagct21180cggtgaaggt cttctggttg gtgaaggtta gcggcaggcc gcggtgctcc tcgttcaacc21240aagtttgaca gatcttgcgg tacaccgctc cctggtcggg cagaaactta aaagccgctc21300tgctgtcgtt gtctacgtgg aacttctcca ttaacatcat catggtttcc atacccttct21360cccacgctgt caccagtggt ttgctgtcgg ggttcttcac caacacggcg gtagaggggc21420cctcgccggc cccgacgtcc ttcatggtca ttctttgaaa ctccacggag ccgtccgcgc21480gacgtactct gcgcaccgga gggtagctga agcccacctc caccacggtg ccttcgccct21540cgctgtcgga gacaatctcc ggggatggcg gcggcgcggg tgtcgccttg cgagccttct21600tcttgggagg gagctgaggc gcctcctgct cgcgctcggg gctcatctcc cgcaagtagg21660gggtaatgga gctgcctgct tggttctgac ggttggccat tgtatcctag gcagaaagac21720atggagctta tgcgcgagga aactttaacc gccccgtccc ccgtcagcga cgaagatgtc21780atcgtcgaac aggacccggg ctacgttacg ccgcccgagg atctggaggg gcctgaccgg21840cgcgacgcta gtgagcggca ggaaaatgag aaagaggagg cctgctacct cctggaaggc21900gacgttttgc taaagcattt cgccaggcag agcaccatag ttaaggaggc cttgcaagac21960cgctccgagg tgcccttgga cgtcgccgcg ctctcccagg cctacgaggc gaaccttttc22020tcgcctcgag tgcctccgaa gagacagccc aacggcacct gcgagcccaa cccgcgactc22080aacttctacc ccgtgttcgc cgtaccagag gcgctggcca cctatcacat ttttttcaaa22140aaccaacgca tccccctatc gtgccgggcc aaccgcaccg cggccgatag gaatctcagg22200cttaaaaacg gagccaacat acctgatatc acgtcgctgg aggaagtgcc caagattttc22260gagggtctgg gtcgagatga gaagcgggcg gcgaacgctc tgcagaaaga acagaaagag22320agtcagaacg tgctggtgga gctggagggg gacaacgcgc gtctggccgt cctcaaacgc22380tgcatagaag tctcccactt cgcctacccc gccctcaact tgccacccaa agttatgaaa22440tcggtcatgg atcagctgct catcaagaga gctgagcccc tggatcccga ccaccccgag22500gcggaaaact cagaggacgg aaagcccgtc gtcagcgacg aggagctcga gcggtggctg22560gaaaccaggg acccccaaca gttgcaagag aggcgcaaga tgatgatggc ggccgtgctg22620
gtcaccgtgg agctggaatg cctgcaacgg tttttcagcg acgtggagac gctacgcaaa22680atcggggaat ccctgcacta caccttccgc cagggctacg tccgccaggc ctgcaagatc22740tccaacgtgg agctcagcaa cctggtctcc tacatgggca tcctccacga gaaccggctg22800gggcagagcg tgctgcactg caccttgcaa ggcgaggcgc ggcgggacta cgtgcgagac22860tgcatctacc tcttcctcac cctcacctgg cagaccgcca tgggcgtctg gcagcagtgc22920ttggaagaga gaaacctcaa agagctagac aaactcctct gccgccagcg gcgcgccctg22980tggtccggtt tcagcgagcg cacggtcgcc agcgctctgg cggacatcat cttcccggag23040cgcctgatga aaaccttgca aaacggcctg ccggatttca tcagtcaaag cattttgcaa23100aacttccgct cttttgtcct ggaacgctcc gggatcttgc ccgccatgag ctgcgcgcta23160ccttctgact ttgtccccct ctcctaccgc gagtgccctc ccccactgtg gagccactgc23220tacctcttcc aactggccaa ctttctggcc taccactccg acctcatgga agacgtaagc23280ggagagggtt tactggagtg ccactgccgc tgcaacctgt gcacccccca cagatcgctg23340gcctgcaaca ccgagctact cagcgaaacc caggtcatag gtaccttcga gatccagggg23400ccccagcagc aagagggtgc ttccggcttg aagctcactc cggcgctgtg gacctcggct23460tacttacgca aatttgtagc cgaggactac cacgcccaca aaattcagtt ttacgaagac23520caatctcgac caccgaaagc ccccctcacg gcctgcgtca tcacccagag caagatcctg23580gcccaattgc aatccatcaa ccaagcgcgc cgcgatttcc ttttgaaaaa gggtcggggg23640gtgtacctgg acccccagac cggcgaggaa ctcaacccgt ccacactctc cgtcgaagca23700gcccccccga gacatgccgc ccaagggaac cgccaagcag ctgatcgctc ggcagagagc23760gaagaagcaa gagctgctcc agcagcaggt ggaggacgag gaagagatgt gggacagcca23820ggcagaggag gtgtcagagg acgaggagga gatggaaagc tgggacagcc tagacgagga23880ggaggacgag ctttcagagg aagaggcgac cgaagaaaaa ccacctgcat ccagcgcgcc23940ttctctgagc cgacagccga agccccggcc cccgacgccc ccggccggct cactcaaagc24000cagccgtagg tgggacgcca ccgaatctcc agcggcagcg gcaacggcag cgggtaaggc24060caaacgcgag cggcgggggt attgctcctg gcgggcccac aaaagcagta ttgtgaactg24120cttgcaacac tgcgggggaa acatctcctt tgcccgacgc tacctcctct tccatcacgg24180tgtggccttc cctcgcaacg ttctctatta ttaccgtcat ctctacagcc cctacgaaac24240gctcggagaa aaaagctaag gcctcctccg ccgcgaggaa aaactccgcc gccgctgccg24300ccgccaagga tccaccggcc accgaagagc tgagaaagcg catctttccc actctgtatg24360ctatctttca gcaaagccgc gggcagcacc ctcagcgcga actgaaaata aaaaaccgct24420ccttccgctc gctcacccgc agctgtctgt accacaagag agaagaccag ctgcagcgca24480ccctggacga cgccgaagca ctgttcagca aatactgctc agcgtctctt aaagactaaa24540agacccgcgc tttttccccc tcggccgcca aaacccacgt catcgccagc atgagcaagg24600agattcccac cccctacatg tggagctatc agccccagat gggcctggcc gcgggggccg24660cccaggacta ctccagcaag atgaactggc tcagcgccgg cccccacatg atctcacgag24720ttaacggcat ccgagcccac cgaaaccaga ttctcttaga acaggcggca atcaccgcca24780caccccggcg ccaactcaac ccgcctagtt ggcccgccgc ccaggtgtat caggaaaatc24840cccgcccgac cacagtcctc ctgccacgcg acgcggaggc cgaagtcctc atgactaact24900ctggggtaca attagcgggc gggtccaggt acgccaggta cagaggtcgg gccgctcctt24960actctcccgg gagtataaag agggtgatca ttcgaggccg aggtatccag ctcaacgacg25020agacggtgag ctcctcaacc ggtctcagac ctgacggagt cttccagctc ggaggagcgg25080gccgctcttc cttcaccact cgccaggcct acctgaccct gcagagctct tcctcgcagc25140cgcgctccgg gggaatcggc actctccagt tcgtggaaga gttcgttccc tccgtctact25200tcaacccctt ctccggctcg cctggacgct acccggacgc cttcattccc aactttgacg25260cagtgagtga atccgtggac ggctacgact gatgacagat ggtgcggccg tgagagctcg25320gctgcgacat ctgcatcact gccgtcagcc tcgctgctac gctcgggagg cgatcgtctt25380
cagctacttt gagctgccgg acgagcaccc tcagggtccg gctcacgggt tgaaactcga25440gatcgagaac gcgctcgagt ctcgcctcat cgacaccttc accgcccgac ctctcctggt25500agaaatccaa cgggggatca ctaccatcac cctgttctgc atctgcccca cgcccggatt25560acatgaagat ctgtgttgtc atctttgcgc tcagtttaat aaaaactgaa ctttttgccg25620caccttcaac gccatctgtg atttctacaa caaaaagttc ttctggcaaa ggtacacaaa25680ctgtatttta ttctaattct acctcatcta tcgtgctgaa ctgcgcctgc actaacgaac25740ttatccagtg gattgcaaac ggtagtgtgt gcaagtactt ttgggggaac gatatagtta25800gtagaaataa cagcctttgc gagcactgca actcctccac actaatcctt tatcccccat25860ttgttactgg atggtatatg tgcgttggct ccggtttaaa tcctagttgc tttcataagt25920ggtttctaca aaaagagacc cttcccaaca attctgtttc ttttttcgcc ctatcctact25980gctgttctcc ctctggttac tctttcaaac ctctaattgg tattttagct ttgatactca26040taatctttat taactttata ataattaaca acttacagta aacatgcttg ttctactgct26100cgccacatct ttcgctctct ctcacgccag aacaagtatt gttggcgcag gttacaatgc26160aactcttcaa tctgcttaca tgccagattc cgaccagata ccccatatta cgtggtactt26220acaaacctcc aaacctaatt cttcatttta tgaaggaaac aaactctgcg atgactccga26280caacagaacg cacacatttc cccacccttc actacaattc gaatgcgtaa acaaaagctt26340gaagctttac aacttaaagc cttcagattc tggcttgtac catgctgtag ttgaaaaaag26400taatttagaa gtccacagtg attacattga attgacggtt gtggacctgc cacctccaaa26460atgtgaggtt tcctcctctt accttgaagt tcaaggcgtg gatgcctact gcctcataca26520cattaactgc agcaactcta aatatccagc tagaatttac tataatggac aggaaagtaa26580tcttttttat tatttaacaa caagcgctgg taacggtaaa cagttacctg actattttac26640tgctgttgtt gaattttcca cctacagaga aacgtatgcc aagcggcctt acaatttctc26700atacccgttt aacgaccttt gcaatgaaat acaagcgctc gaaactggaa ctgattttac26760tccaattttc attgctgcca ttgttgtaag cttaattacc attattgtca gcctagcatt26820ttactgcttt tacaagccca aaaaccctaa gtttgaaaaa cttaaactaa aacctgtcat26880tcaacaagtg tgattttgtt ttccagcatg gtagctgcat ttctacttct cctctgtcta26940cccatcattt tcgtctcttc aactttcgcc gcagtttccc acctggaacc agagtgccta27000ccgccttttg acgtgtatct gattctcacc tttgtttgtt gtatatccat ttgcagtata27060gcctgctttt ttataacaat ctttcaagcc gccgactatt tttacgtgcg aattgcttac27120tttagacacc atcctgaata cagaaatcaa aacgttgcct ccttactttg tttggcatga27180ttaagttatt gctgatactt aattatttac ccctaatcaa ctgtaattgt ccattcacca27240aaccctggtc attctacacc tgttatgata aaatccccga cactcctgtt gcttggcttt27300acgcagccac cgccgctttg gtatttatat ctacttgcct tggagtaaaa ttgtatttta27360ttttacacac tgggtggcta catcccagag aagatttacc tagatatcct cttgtaaacg27420cttttcaatt acagcctctg cctcctcctg atcttcttcc tcgagctccc tctattgtga27480gctactttca actcaccggt ggagatgact gactctcagg acattaatat tagtgtggaa27540agaatagctg ctcagcgtca gcgagaaacg cgagtgttgg aatacctgga actacagcaa27600cttaaagagt cccactggtg tgagaaagga gtgctgtgcc atgttaagca ggcagccctt27660tcctacgatg tcagcgttca gggacatgaa ctgtcttaca ctttgccttt gcagaaacaa27720accttctgca ccatgatggg ctctacctcc atcacaatca cccaacaagc cgggcctgta27780gagggggcta tcctctgtca ctgtcacgca cctgattgca tgtccaaact aatcaaaact27840ctctgtgctt taggtgatat ttttaaggtg taaatcaata ataaacttac cttaaatttg27900acaacaaatt tctggtgaca tcattcagca gcaccacttt accctcttcc cagctctcgt27960atgggatgcg atagtgggtg gcaaacttcc tccaaaccct aaaagaaata ttggtatcca28020cttccttgtc ctcacccaca attttcatct tttcatagat gaaaagaacc agagttgatg28080aagacttcaa ccccgtctac ccctatgaca ccacaaccac tcctgcagtt ccctttatat28140
cacccccctt tgtaaacagc gatggtcttc aggaaaaccc cccaggtgtt ttaagtctgc28200gaatagctaa acccctatat ttcgacatgg agagaaaact agccctttca cttggaagag28260ggttgacaat taccgccgcc ggacaattag aaagtacgca gagcgtacaa accaacccac28320cgttgataat taccaacaac aacacactga ccctacgtca ttctcccccc ttaaacctaa28380ctgacaatag cttagtgcta ggctactcga gtcctctccg cgtcacagac aacaaactta28440catttaactt cacatcacca ctccgttatg aaaatgaaaa ccttactttt aactatacag28500agcctcttaa acttataaat aacagccttg ccattgacat caattcctca aaaggcctta28560gtagcgtcgg aggctcacta gctgtaaacc tgagttcaga cttaaagttt gacagcaacg28620gatccatagc ttttggcata caaaccctgt ggaccgctcc gacctcgact ggcaactgca28680ccgtctacag cgagggcgat tccctactta gtctctgttt aaccaaatgc ggagctcacg28740tcttaggaag tgtaagttta accggtttaa caggaaccat aacccaaatg actgatattt28800ctgtcaccat tcaatttaca tttgacaaca atggtaagct actaagctct ccacttataa28860acaacgcctt tagtattcga cagaatgaca gtacggcctc aaaccctacc tacaacgccc28920tggcgtttat gcctaacagt accatatatg caagaggggg aggtggtgaa ccacgaaaca28980actactacgt ccaaacgtat cttaggggaa atgttcaaaa accaatcatt cttactgtaa29040cctacaactc agtcgccaca ggatattcct tatcttttaa gtggactgct cttgcacgtg29100aaaagtttgc aaccccaaca acctcgtttt gctacattac agaacaataa aaccgtgtac29160cccaccgttt cgtttttttc agatgaaacg ggcgagagtt gatgaagact tcaacccagt29220gtacccttat gaccccccac atgctcctgt tatgcccttc attactccac cttttacctc29280ctcggatggg ttgcaggaaa aaccacttgg agtgttaagt ttaaactaca gagatcccat29340tactacgcaa aatgagtctc ttacaattaa actaggaaac ggcctcactc tagacaacca29400gggacaacta acatcaaccg ctggcgaagt agaacctcca ctcactaacg ctaacaacaa29460acttgcactg gtctatagcg atcctttagc agtaaagcgc aacagcctaa ccttatcgca29520caccgctccc cttgttattg ctgataactc tttagcattg caagtttcag agcctatttt29580tataaatgac aaggacaaac tagccctgca aacagccgcg ccccttgtaa ctaacgctgg29640cacccttcgc ttacaaagcg ccgccccttt aggcattgca gaccaaaccc taaaactcct29700gtttaccaac cctttgtact tgcagaataa ctttctcacg ttagccattg aacgacccct29760tgccattacc aatactggaa agctggctct acagctctcc ccaccgctac aaacagcaga29820cacaggcttg actttgcaaa ccaacgtgcc attaactgta agcaacggga ccctaggctt29880agccataaag cgcccactta ttattcagga caacaacttg tttttggact tcagagctcc29940cctgcgtctt ttcaacagcg acccagtact agggcttaac ttttacaccc ctcttgcggt30000acgcgatgag gcgctcactg ttaacacagg ccgcggcctc acagtgagtt acgatggttt30060aattttaaat cttggtaagg atcttcgctt tgacaacaac accgtttctg tcgctcttag30120tgctgctttg cctttacaat acactgatca gcttcgcctt aacgtgggcg ctgggctgcg30180ttacaatcca gtgagtaaga aattggacgt gaaccccaat caaaacaagg gtttaacctg30240ggaaaatgac tacctcattg taaagctagg aaatggatta ggttttgatg gcgatggaaa30300catagctgtt tctcctcaag ttacatcgcc tgacacctta tggaccactg ccgacccatc30360ccccaattgt tccatctaca ctgatttaga tgccaaaatg tggctctcgt tggtaaaaca30420agggggtgtg gttcacggtt ctgttgcttt aaaagcattg aaaggaaccc tattgagtcc30480tacggaaagc gccattgtta ttatactaca ttttgacaat tatggagtgc gaattctcaa30540ttatcccact ttgggcactc aaggcacgtt gggaaataat gcaacttggg gttataggca30600gggagaatct gcagacacta atgtactcaa tgcactagca tttatgccca gttcaaaaag30660gtacccaaga gggcgtggaa gcgaagttca gaatcaaact gtgggctaca cttgtataca30720gggtgacttt tctatgcccg taccgtacca aatacagtac aactatggac caactggcta30780ctcctttaaa tttatttgga gaactgtttc aagacaacca tttgacatcc catgctgttt30840tttctcttac attacggaag aataaaacaa ctttttcttt ttattttctt tttattttac30900
acgcacagta aggcttcctc cacccttcca tctcacagca tacaccagcc tctccccctt30960catggcagta aactgttgtg agtcagtccg gtatttggga gttaagatcc aaacagtctc31020tttggtgatg aaacatggat ccgtgatgga cacaaatccc tgggacaggt tctccaacgt31080ttcggtaaaa aactgcatgc cgccctacaa aacaaacagg ttcaggctct ccacgggtta31140tctccccgat caaactcaga cagagtaaag gtgcgatgat gttccactaa accacgcagg31200tggcgctgtc tgaacctctc ggtgcgactc ctgtgaggct ggtaagaagt tagattgtcc31260agcagcctca cagcatggat catcagtcta cgagtgcgtc tggcgcagca gcgcatctga31320atctcactga gattccggca agaatcgcac accatcacaa tcaggttgtt catgatccca31380tagctgaaca cgctccagcc aaagctcatt cgctccaaca gcgccaccgc gtgtccgtcc31440aaccttactt taacataaat caggtgtctg ccgcgtacaa acatgctacc cgcatacaga31500acctcccggg gcaaacccct gttcaccacc tgcctgtacc agggaaacct cacatttatc31560agggagccat agatagccat tttaaaccaa ttagctaaca ccgccccacc agctctacac31620tgaagagaac cgggagagtt acaatgacag tgaataatcc atctctcata acccctaatg31680gtctgatgga aatccagatc taacgtggca cagcagatac acactttcat atacattttc31740atcacatgtt tttcccaggc cgttaaaata caatcccaat acacgggcca ctcctgcagt31800acaataaagc taatacaaga tggtatactc ctcacctcac taacattgtg catgttcata31860ttttcacatt ctaagtaccg agagttctcc tctacaacag cactgccgcg gtcctcacaa31920ggtggtagct ggtgacgatt gtaaggagcc agtctgcagc gataccgtct gtcgcgttgc31980atcgtagacc agggaccgac gcacttcctc gtacttgtag tagcagaacc acgtccgctg32040ccagcacgtc tccaagtaac gccggtccct gcgtcgctca cgctccctcc tcaacgcaaa32100gtgcaaccac tcttgtaatc cacacagatc cctctcggcc tccggggcga tgcacacctc32160aaacctacag atgtctcggt acagttccaa acacgtagtg agggcgagtt ccaaccaaga32220cagacagcct gatctatccc gacacactgg aggtggagga agacacggaa gaggcatgtt32280attccaagcg attcaccaac gggtcgaaat gaagatcccg aagatgacaa cggtcgcctc32340cggagccctg atggaattta acagccagat caaacattat gcgattttcc aggctatcaa32400tcgcggcctc caaaagagcc tggacccgca cttccacaaa caccagcaaa gcaaaagcgt32460tattatcaaa ctcttcgatc atcaagctgc aggactgtac aatgcccaag taattttcat32520ttctccactc gcgaatgatg tcgcggcaaa tagtctgaag gttcatgccg tgcatattaa32580aaagctccga aagggcgccc tctatagcca tgcgtagaca caccatcatg actgcaagat32640atcgggctcc tgagacacct gcagcagatt taacagaccc aggtcaggtt gctctccgcg32700atcgcgaatc tccatccgca aagtcatttg caaataatta aatagatctg cgccgactaa32760atctgttaac tccgcgctag gaactaaatc aggtgtggct acgcagcaca aaagttccag32820ggatggcgcc aaactcacta gaaccgctcc cgagtagcaa aactgatgaa tgggagtaac32880acagtgtaaa atgttcagcc aaaaatcact aagctgctcc tttaaaaagt ccagtacttc32940tatattcagt tcgtgcaagt actgaagcaa ctgtgcggga atatgcacag caaaaaaaat33000agggcggctc agatacatgt tgacctaaaa taaaaagaat cattaaacta aagaagcctg33060gcgaacggtg ggatatatga cacgctccag cagcaggcaa gcaaccggct gtccccggga33120accgcggtaa aattcatccg aatgattaaa aagaacaaca gagacttccc accatgtact33180cggttggatc tcctgagcac agagcaatac ccccctcaca ttcatatccg ctacagaaaa33240aaaacgtccc agatacccag cgggaatatc caacgacagc tgcaaagaca gcaaaacaat33300ccctctggga gcaatcacaa aatcctccgg tgaaaaaagc acatacatat tagaataacc33360ctgttgctgg ggcaaaaagg cccgtcgtcc cagcaaatgc acataaatat gttcatcagc33420cattgccccg tcttaccgcg taaacagcca cgaaaaaatc gagctaaaat ccacccaaca33480gcctatagct atatatacac tccacccaat gacgctaata ccgcaccacc cacgaccaaa33540gttcacccac acccacaaaa cccgcgaaaa tccagcgccg tcagcacttc cgcaatttca33600gtctcacaac gtcacttccg cgcgcctttt cactttccca cacacgccct tcgcccgccc33660
gccctcgcgc caccccgcgt caccccacgt caccgcacgt caccccggcc ccgcctcgct33720cctccccgct cattatcata ttggcacgtt tccagaataa ggtatattat tgatgcagca33780aaacaatccc tctgggagca atcacaaaat cctccggtga aaaaagcaca tacatattag33840aataaccctg ttgctggggc aaaaaggccc gtcgtcccag caaatgcaca taaatatgtt33900catcagccat tgccccgtct taccgcgtaa acagccacga aaaaatcgag ctaaaatcca33960cccaacagcc tatagctata tatacactcc acccaatgac gctaataccg caccacccac34020gaccaaagtt cacccacacc cacaaaaccc gcgaaaatcc agcgccgtca gcacttccgc34080aatttcagtc tcacaacgtc acttccgcgc gccttttcac tttcccacac acgcccttcg34140cccgcccgcc ctcgcgccac cccgcgtcac cccacgtcac cgcacgtcac cccggccccg34200cctcgctcct ccccgctcat tatcatattg gcacgtttcc agaataaggt atattattga34260tgca 34264<210>5<211>31044<212>DNA<213>猿腺病毒SV-25<400>5catcatcaat aatatacctt attctggaaa cgtgccaata tgataatgag cggggaggag 60cgaggcgggg ccggggtgac gtgcggtgac gcggggtggc gcgagggcgg ggcgaagggc 120gcgggtgtgt gtgtgggagg cgcttagttt ttacgtatgc ggaaggaggt tttataccgg 180aagatgggta atttgggcgt atacttgtaa gttttgtgta atttggcgcg aaaactgggt 240aatgaggaag ttgaggttaa tatgtacttt ttatgactgg gcggaatttc tgctgatcag 300cagtgaactt tgggcgctga cggggaggtt tcgctacgtg acagtaccac gagaaggctc 360aaaggtccca tttattgtac tcttcagcgt tttcgctggg tatttaaacg ctgtcagatc 420atcaagaggc cactcttgag tgctggcgag aagagttttc tcctccgtgc tgccacgatg 480aggctggtcc ccgagatgta cggtgttttt agcgacgaga cggtgcgtaa ctcagatgac 540ctgctgaatt cagacgcgct ggaaatttcc aattcgcctg tgctttcgcc gccgtcactt 600cacgacctgt ttgtgttttg gctcaacgct tagcaacgtg ttatataggg tcaagaagga 660gcaggagacg cagtttgcta ggctgttggc cgatactcct ggagtttttg tggctctgga 720tctaggccat cactctcttt tccaagagaa aattatcaaa aacttaactt ttacgtctcc 780tggtcgcacg gttgcttccg ctgcctttat tacctatatt ttggatcaat ggagcaacag 840cgacagccac ctgtcgtggg agtacatgct ggattacatg tcgatggcgc tgtggagggc 900catgctgcgg aggagggttt gcatttactt gcgggcgcag cctccgcggc tggaccgagt 960ggaggaggag gacgagccgg gggagaccga gaacctgagg gccgggctgg accctccaac 1020ggaggactag gtgctgagga tgatcccgaa gaggggacta gtggggctag gaagaagcaa 1080aagactgagt ctgaacctcg aaactttttg aatgagttga ctgtgagttt gatgaatcgt 1140cagcgtccgg agacaatttt ctggtctgaa ttggaggagg aattcaggag gggggaactg 1200aacctgctat acaagtatgg gtttgaacag ttaaaaactc actggttgga gccgtgggag 1260gattttgaaa ccgccttgga cacttttgct aaagtggctc tgcggccgga taaggtttac 1320actatccgcc gcactgttaa cataaagaag agtgtttatg ttataggcca tggagctctg 1380gtgcaggtgc aaaccgtcga ccgggtggcc tttagttgcg gtatgcaaaa tctgggcccc 1440ggggtgatag gcttaaatgg tgtaacattt cacaatgtaa ggtttactgg tgaaagtttt 1500aacggctctg tgtttgcaaa taacacacag ctgacgctcc acggcgttta cttttttaac 1560tttaataaca catgtgtgga gtcgtggggc agggtgtctt tgaggggctg ctgttttcac 1620ggctgctgga aggcggtggt gggaagactt aaaagtgtaa catctgtaaa aaaatgcgtg 1680
tttgagcggt gtgtgttggc tttaactgtg gagggctgtg gacgcattag gaataatgcg1740gcgtctgaga atggatgttt tcttttgcta aaaggcacgg ctagtattaa gcataacatg1800atatgcggca gcggtctgta cccttcacag ctgttaactt gcgcggatgg aaactgtcag1860accttgcgca ccgtgcacat agcgtcccac cagcgccgcg cctggccaac attcgagcac1920aatatgctta tgcgttgtgc cgtccacttg ggccctaggc gaggcgtgtt tgtgccttac1980cagtgtaact ttagccatac caagatttta ctagaacctg ataccttctc tcgagtgtgt2040ttcaatgggg tgtttgacat gtcaatggaa ctgtttaaag tgataagata tgatgaatcc2100aagtctcgtt gtcgcccatg tgaatgcgga gctaatcatc tgaggttgta tcctgtaacc2160ctaaacgtta ccgaggagct gaggacggat caccacatgt tgtcctgcct gcgcaccgac2220tatgaatcca gcgacgagga gtgaggtgag gggcggagcc acaaagggta taaaggggcg2280tgaggggtgg gtgtgatgat tcaaaatgag cgggacgacg gacggcaacg cgtttgaggg2340tggagtgttc agcccttatc tgacatctcg tcttccttcc tgggcaggag tgcgtcagaa2400tgtagtgggc tccaccgtgg acggacgacc ggtcgcccct gcaaattccg ccaccctcac2460ctatgccacc gtgggatcat cgttggacac tgccgcggca gctgccgctt ctgctgccgc2520ttctactgct cgcggcatgg cggctgattt tggactgtat aaccaactgg ccactgcagc2580tgtggcgtct cggtctctgg ttcaagaaga tgccctgaat gtgatcctga ctcgcctgga2640gatcatgtca cgtcgcttgg acgaactggc tgcgcagata tcccaagcta accccgatac2700cacttcagaa tcctaaaata aagacaaaca aatatgttga aaagtaaaat ggctttattt2760gttttttttg gctcggtagg ctcgggtcca cctgtctcgg tcgttaagaa ctttgtgtat2820gttttccaaa acacggtaca gatgggcttg gatgttcaag tacatgggca tgaggccatc2880tttggggtga agataggacc attgaagagc gtcatgctcc ggggtggtgt tgtaaattac2940ccagtcgtag cagggtttct gggcgtggaa ctggaagatg tcctttagga gtaggctgat3000ggccaagggc aggcccttag tgtaggtgtt tacaaagcgg ttaagctggg agggatgcat3060gcggggggag atgatatgca tcttggcttg gatcttgagg ttagctatgt taccacccag3120gtctctgcgg gggttcatgt tatgaaggac caccagcacg gtgtagccgg tgcatttggg3180gaacttgtca tgcagtttgg aggggaaggc gtggaagaat ttagagaccc ccttgtggcc3240ccctaggttt tccatgcact catccataat gatggcaatg ggacccctgg cggccgcttt3300ggcaaacacg ttttgggggt tggaaacatc atagttttgc tctagagtga gctcatcata3360ggccatctta acaaagcggg gtaggagggt gcccgactgg gggatgatag ttccatctgg3420gcctggggcg tagttaccct cacagatctg catctcccag gccttaattt ccgagggggg3480tatcatgtcc acctgggggg caataaagaa cacggtttct ggcgggggat tgatgagctg3540ggtggaaagc aagttacgca gcagttgaga tttgccacag ccggtggggc cgtagatgac3600cccgatgacg ggttgcagct ggtagttgag agaggaacag ctgccgtcgg ggcgcaggag3660gggggctacc tcattcatca tgcttctaac atgtttattt tcactcacta agttttgcaa3720gagcctctcc ccacccaggg ataagagttc ttccaggctg ttgaagtgtt tcagcggttt3780taggccgtcg gccatgggca tcttttcgag cgactgacga agcaagtaca gtcggtccca3840gagctcggtg acgtgctcta tggaatctcg atccagcaga cttcttggtt gcgggggttg3900ggtcgacttt cgctgtaggg caccagccgg tgggcgtcca gggccgcgag ggttctgtcc3960ttccagggtc tcagcgtccg ggtgagggtg gtctcggtga cggtgaaggg atgagccccg4020ggctgggcgc ttgcgagggt gcgcttcagg ctcatcctgc tggtgctgaa gcggacgtcg4080tctccctgtg agtcggccag atagcaacga agcatgaggt cgtagctgag ggactcggcc4140gcgtgtccct tggcgcgcag ctttcccttg gaaacgtgct gacatttggt gcagtgcaga4200cattggaggg cgtagagttt gggggccagg aagaccgact cgggcgagta ggcgtcggct4260ccgcactgag cgcagacggt ctcgcactcc actagccacg tgagctcggg tttagcggga4320tcaaaaacca agttgcctcc attttttttg atgcgtttct taccttgcgt ttccatgagt4380ttgtggcccg cttccgtgac aaaaaggctg tcggtgtctc cgtagacaga cttgaggggg4440
cgatcttcca aaggtgttcc gaggtcttcc gcgtacagga actgggacca ctccgagacg4500aaggctctgg tccaggctaa cacgaaggag gcaatctgcg aggggtatct gtcgttttca4560atgagggggt ccaccttttc cagggtgtgc agacacaggt cgtcctcctc cgcgtccacg4620aaggtgattg gcttgtaagt gtaggtcacg tgatctgcac cccccaaagg ggtataaaag4680ggggcgtgcc caccctctcc gtcactttct tccgcatcgc tgtggaccag agccagctgt4740tcgggtgagt aggccctctc aaaagccggc atgatctcgg cgctcaagtt gtcagtttct4800acaaacgagg tggatttgat attcacgtgc cccgcggcga tgcttttgat ggtggagggg4860tccatctgat cagaaaacac gatctttttg ttgtcaagtt tggtggcgaa agacccgtag4920agggcgttgg aaagcaactt ggcgatggag cgcagggtct gatttttctc ccgatcggcc4980ctctccttgg cggcgatgtt gagttgcacg tactcccggg ccgcgcaccg ccactcgggg5040aacacggcgg tgcgctcgtc gggcaggatg cgcacgcgcc agccgcgatt gtgcagggtg5100atgaggtcca cgctggtagc cacctccccg cggaggggct cgttggtcca acacaatcgc5160cccccttttc tggagcagaa cggaggcagg ggatctagca agttggcggg cggggggtcg5220gcgtcgatgg tgaagatacc gggtagcagg atcttattaa aataatcgat ttcggtgtcc5280gtgtcttgca acgcgtcttc ccacttcttc accgccaggg ccctttcgta gggattcagg5340ggcggtcccc agggcatggg gtgggtcagg gccgaggcgt acatgccgca gatgtcatac5400acgtacaggg gttccctcaa caccccgatg taagtggggt aacagcgccc cccgcggatg5460ctggctcgca cgtagtcgta catctcgcgc gagggagcca tgaggccgtc tcccaagtgg5520gtcttgtggg gtttttcggc ccggtagagg atctgtctga agatggcgtg ggagttggaa5580gagatggtgg ggcgttggaa gacgttaaag ttggccccgg gtagtcccac ggagtcttgg5640atgaactggg cgtaggattc ccggagtttg tccaccaggg cggcggtcac cagcacgtcg5700agagcgcagt agtccaacgt ctcgcggacc aggttgtagg ccgtctcttg ttttttctcc5760cacagttcgc ggttgaggag gtattcctcg cggtctttcc agtactcttc ggcgggaaat5820cctttttcgt ccgctcggta agaacctaac atgtaaaatt cgttcaccgc tttgtatgga5880caacagcctt tttctaccgg cagggcgtac gcttgagcgg cctttctgag agaggtgtgg5940gtgagggcga aggtgtcccg caccatcact ttcaggtact gatgtttgaa gtccgtgtcg6000tcgcaggcgc cctgttccca cagcgtgaag tcggtgcgct ttttctgcct gggattgggg6060agggcgaagg tgacatcgtt aaagagtatt ttcccggcgc ggggcatgaa gttgcgagag6120atcctgaagg gcccgggcac gtccgagcgg ttgttgatga cctgcgccgc caggacgatc6180tcgtcgaagc cgttgatgtt gtgacccacg atgtaaagtt cgatgaagcg cggctgtccc6240ttgagggccg gcgctttttt caactcctcg taggtgagac agtccggcga ggagagaccc6300agctcagccc gggcccagtc ggagagttga ggattagccg caaggaagga gctccataga6360tccaaggcca ggagagtttg caagcggtcg cggaactcgc ggaacttttt ccccacggcc6420attttctccg gtgtcactac gtaaaaggtg ttggggcggt tgttccacac gtcccatcgg6480agctctaggg ccagctcgca ggcttggcga acgagggtct cctcgccaga gacgtgcatg6540accagcataa agggtaccaa ctgtttcccg aacgagccca tccatgtgta ggtttctacg6600tcgtaggtga caaagagccg ctgggtgcgc gcgtgggagc cgatcggaaa gaagctgatc6660tcctgccacc agctggagga atgggtgtta atgtggtgga agtagaagtc ccgccggcgc6720acagagcatt cgtgctgatg tttgtaaaag cgaccgcagt agtcgcagcg ctgcacgctc6780tgtatctcct gaacgagatg cgcttttcgc ccgcgcacca gaaaccggag ggggaagttg6840agacgggggg ctggtggggc gacatcccct tcgccttggc ggtgggagtc tgcgtctgcg6900tcctccttct ctgggtggac gacggtgggg acgacgacgc cccgggtgcc gcaagtccag6960atctccgcca cggaggggtg caggcgctgc aggaggggac gcagctgccc gctgtccagg7020gagtcgaggg aagtcgcgct gaggtcggcg ggaagcgttt gcaagttcac tttcagaaga7080ccggtaagag cgtgagccag gtgcagatgg tacttgattt ccaggggggt gttggatgaa7140gcgtccacgg cgtagaggag tccgtgtccg cgcggggcca ccaccgtgcc ccgaggaggt7200
tttatctcac tcgtcgaggg cgagcgccgg ggggtagagg cggctctgcg ccggggggca7260gcggaggcag aggcacgttt tcgtgaggat tcggcagcgg ttgatgacga gcccggagac7320tgctggcgtg ggcgacgacg cggcggttga ggtcctggat gtgccgtctc tgcgtgaaga7380ccaccggccc ccgggtcctg aacctaaaga gagttccaca gaatcaatgt ctgcatcgtt7440aacggcggcc tgcctgagga tctcctgcac gtcgcccgag ttgtcctgat aggcgatctc7500ggccatgaac tgttccactt cttcctcgcg gaggtcaccg tggcccgctc gctccacggt7560ggcggccagg tcgttggaga tgcggcgcat gagttgagag aaggcgttga ggccgttctc7620gttccacacg cggctgtaca ccacgtttcc gaaggagtcg cgcgctcgca tgaccacctg7680ggccacgttg agttccacgt ggcgggcgaa gacggcgtag tttctgaggc gctggaagag7740gtagttgagc gtggtggcga tgtgctcgca gacgaagaag tacataatcc agcgccgcag7800ggtcatctcg ttgatgtctc cgatggcttc gagacgctcc atggcctcgt agaagtcgac7860ggcgaagttg aaaaattggg agttgcgggc ggccaccgtg agttcttctt gcaggaggcg7920gatgagatcg gcgaccgtgt cgcgcacctc ctgttcgaaa gcgccccgag gcgcctctgc7980ttcttcctcc ggctcctcct cttccagggg ctcgggttcc tccggcagct ctgcgacggg8040gacggggcgg cgacgtcgtc gtctgaccgg caggcggtcc acgaagcgct cgatcatttc8100gccgcgccgg cgacgcatgg tctcggtgac ggcgcgtccg ttttcgcgag gtcgcagttc8160gaagacgccg ccgcgcagag cgcccccgtg cagggagggt aagtggttag ggccgtcggg8220cagggacacg gcgctgacga tgcattttat caattgctgc gtaggcactc cgtgcaggga8280tctgagaacg tcgaggtcga cgggatccga gaacttctct aggaaagcgt ctatccaatc8340gcaatcgcaa ggtaagctga gaacggtggg tcgctggggg gcgttcgcgg gcagttggga8400ggtgatgctg ctgatgatgt aattaaagta ggcggtcttc aggcggcgga tggtggcgag8460gaggaccacg tctttgggcc cggcctgttg aatgcgcagg cgctcggcca tgccccaggc8520ctcgctctga cagcgacgca ggtctttgta gaagtcttgc atcagtctct ccaccggaac8580ctctgcttct cccctgtctg ccatgcgagt cgagccgaac ccccgcaggg gctgcagcaa8640cgctaggtcg gccacgaccc tttcggccag cacggcctgt tgaatctgcg tgagggtggc8700ctggaagtcg tccaggtcca cgaagcggtg ataggccccc gtgttgatgg tgtaggtgca8760gttggccatg acggaccagt tgacgacttg catgccgggt tgggtgatct ccgtgtactt8820gaggcgcgag taggccctgg actcgaacac gtagtcgttg catgtgcgca ccagatactg8880gtagccgacc aggaagtgag gaggcggctc tcggtacagg ggccagccaa cggtggcggg8940ggcgccgggg gacaggtcgt ccagcatgag gcggtggtag tggtagatgt agcgggagag9000ccaggtgatg ccggccgagg tggttgcggc cctggtgaat tcgcggacgc ggttccagat9060gttgcgcagg ggaccaaagc gctccatggt gggcacgctc tgccccgtga ggcgggcgca9120atcttgtacg ctctagatgg aaaaaagaca gggcggtcat cgactccttt ccgtagcttg9180gggggtaaag tcgcaagggt gcggcggcgg ggaaccccgg ttcgagaccg gccggatccg9240ccgctcccga tgcgcctggc cccgcatcca cgacgtccgc gccgagaccc agccgcgacg9300ctccgcccca atacggaggg gagtcttttg gtgttttttc gtagatgcat ccggtgctgc9360ggcagatgcg accccagacg cccactacca ccgccgtggc ggcagtaaac ctgagcggag9420gcggtgacag ggaggaggaa gagctggctt tagacctgga agagggagag gggctggccc9480ggctgggagc gccatcccca gagagacacc ctagggttca gctcgtgagg gacgccaggc9540aggcttttgt gccgaagcag aacctgttta gggaccgcag cggtcaggag gcggaggaga9600tgcgcgattg caggtttcgg gcgggcagag agctcagggc gggcttcgat cgggagcggc9660tcctgagggc ggaggatttc gagcccgacg agcgttctgg ggtgagcccg gcccgcgctc9720acgtatcggc ggccaacctg gtgagcgcgt acgagcagac ggtgaacgag gagcgcaact9780tccaaaagag ctttaacaat cacgtgagga ccctgatcgc gagggaggag gtgaccatcg9840ggctgatgca tctgtgggac ttcgtggagg cctacgtgca gaacccggct agcaaacccc9900tgacggccca gctgttcctg atcgtgcagc acagccgcga caacgagacg ttccgcgacg9960
ccatgttgaa catcgcggag cccgagggtc gctggctctt ggatctgatt aacatcctgc10020agagcatcgt ggtgcaggag aggggcctga gtttagcgga caaggtggcg gccattaact10080attcgatgca gagcctgggg aagttctacg ctcgcaagat ctacaagagc ccttacgtgc10140ccatagacaa ggaggtgaag atagacagct tttacatgcg catggcgctg aaggtgctga10200cgctgagcga cgacctcggc gtgtaccgta acgacaagat ccacaaggcg gtgagcgcca10260gccgccggcg ggagctgagc gacagggagc tgatgcacag cctgcagagg gcgctggcgg10320gcgccgggga cgaggagcgc gaggcttact tcgacatggg agccgatctg cagtggcgtc10380ccagcgcgcg cgccttggag gcggcgggtt atcccgacga ggaggatcgg gacgatttgg10440aggaggcagg cgagtacgag gacgaagcct gaccgggcag gtgttgtttt agatgcagcg10500gccggcggac gggaccaccg cggatcccgc acttttggca tccatgcaga gtcaaccttc10560gggcgtgacc gcctccgatg actgggcggc ggccatggac cgcatcatgg cgctgaccac10620ccgcaacccc gaggctttta ggcagcaacc ccaggccaac cgtttttcgg ccatcttgga10680agcggtggtg ccgtcgcgca ccaacccgac gcacgagaaa gtcctgacta tcgtgaacgc10740cctggtagac agcaaggcca tccgccgtga cgaggcgggc ttgatttaca acgctctttt10800ggaacgcgtg gcgcgctaca acagcactaa cgtgcagacc aatctggacc gcctcaccac10860cgacgtgaag gaggcgctgg cgcagaagga gcggtttctg agggacagta atctgggctc10920tctggtggca ctgaacgcct tcctgagctc acagccggcc aacgtgcccc gcgggcagga10980ggattacgtg agcttcatca gcgctctgag actgctggtg tccgaggtgc cccagagcga11040ggtgtaccag tctgggccgg attacttttt ccagacgtcc cgacagggct tgcaaacggt11100gaacctgact caggccttta aaaacttgca aggcatgtgg ggggtcaagg ccccggtggg11160cgatcgcgcc actatctcca gtctgctgac ccccaacact cgcctgctgc tgctcttgat11220cgcaccgttt accaacagta gcactatcag ccgtgactcg tacctgggtc atctcatcac11280tctgtaccgc gaggccatcg gccaggctca gatcgacgag catacgtatc aggagattac11340taacgtgagc cgtgccctgg gtcaggaaga taccggcagc ctggaagcca cgttgaactt11400tttgctaacc aaccggaggc aaaaaatacc ctcccagttc acgttaagcg ccgaggagga11460gaggattctg cgatacgtgc agcagtccgt gagcctgtac ttgatgcgcg agggcgccac11520cgcttccacg gctttagaca tgacggctcg gaacatggaa ccgtcctttt actccgccca11580ccggccgttc attaaccgtc tgatggacta cttccatcgc gcggccgcca tgaacgggga11640gtacttcacc aatgccatcc tgaatccgca ttggatgccc ccgtccggct tctacaccgg11700ggagtttgac ctgcccgaag ccgacgacgg ctttctgtgg gacgacgtgt ccgatagcat11760tttcacgccg gctaatcgcc gattccagaa gaaggagggc ggagacgagc tccccctctc11820cagcgtggaa gcggcctcaa ggggagagag tccctttcca agtctgtctt ccgccagtag11880cggtcgggta acgcgtccac ggttgccggg ggagagcgac tacctgaacg accccttgct11940gcgaccggct agaaagaaaa attttcccaa taacggggtg gaaagcttgg tggataaaat12000gaatcgttgg aagacgtacg cccaggagca gcgggagtgg gaggacagtc agccgcggcc12060gctggtaccg ccgcattggc gtcgccagag agaagacccg gacgactccg cagacgatag12120tagcgtgttg gacctgggag ggagcggagc caaccccttt gctcacttgc aacccaaggg12180gcgctcgagt cgcctgtatt aataaaaaag acgcggaaac ttaccagagc catggccaca12240gcgtgtgtgc tttcttcctc tctttcttcc tcggcgcggc agaatgagaa gagcggtgag12300agtcacgccg gcggcgtatg agggcccgcc cccttcttac gaaagcgtga tgggatcagc12360gaacgtgccg gccacgctgg aggcgcctta cgttcctccc agatacctgg gacctacgga12420gggcagaaac agcatccgtt actccgagct ggcgcccctg tacgatacca ccaaggtgta12480cctggtggac aacaagtcgg cggacatcgc ctccctgaat taccaaaacg atcacagtaa12540ctttctgact accgtggtgc agaacaatga cttcaccccg acggaggcgg gcacgcagac12600cattaacttt gacgagcgtt cccgctgggg cggtcagctg aaaaccatcc tgcacaccaa12660catgcccaac atcaacgagt tcatgtccac caacaagttc agggctaagc tgatggtaga12720
aaaaagtaat gcggaaactc ggcagccccg atacgagtgg ttcgagttta ccattccaga12780gggcaactat tccgaaacta tgactatcga tctcatgaat aacgcgatcg tggacaatta12840cctgcaagtg gggagacaga acggggtgct ggaaagcgat atcggcgtga aattcgatac12900cagaaacttc cgactggggt gggatcccgt gaccaagctg gtgatgccag gcgtgtacac12960caacgaggct tttcacccgg acatcgtgct gctgccgggg tgcggtgtgg acttcactca13020gagccgtttg agtaacctgt taggaattag aaagcgccgc cccttccaag agggctttca13080aatcatgtat gaggacctgg agggaggtaa tatacccgcc ttactggacg tgtcgaagta13140cgaagctagc atacaacgcg ccaaagcgga gggtagagag attcggggag acacctttgc13200ggtagctccc caggacctgg aaatagtgcc tttaactaaa gacagcaaag acagaagcta13260caatattata aacaacacga cggacaccct gtatcggagc tggtttctgg cttacaacta13320cggagacccc gagaaaggag tgagatcatg gaccatactc accaccacgg acgtgacctg13380tggctcgcag caagtgtact ggtccctgcc ggatatgatg caagacccgg tcaccttccg13440cccctccacc caagtcagca acttcccggt ggtgggcacc gagctgctgc ccgtccatgc13500caagagcttc tacaacgagc aggccgtcta ctcgcaactt attcgccagt ccaccgcgct13560tacccacgtg ttcaatcgct ttcccgagaa ccagattctg gtgcgccctc ccgctcctac13620cattaccacc gtcagtgaaa acgttcccgc cctcacagat cacggaaccc tgccgctgcg13680cagcagtatc agtggagttc agcgcgtgac catcaccgac gccagacgtc gaacctgccc13740ctacgtttac aaagcgcttg gcgtggtggc tcctaaagtt ctttctagtc gcaccttcta13800aaaacatgtc catcctcatc tctcccgata acaacaccgg ctggggactg ggctccggca13860agatgtacgg cggagccaaa aggcgctcca gtcagcaccc agttcgagtt cggggccact13920tccgcgctcc ttggggagct tacaagcgag gactctcggg tcgaacggct gtagacgata13980ccatagatgc cgtgattgcc gacgcccgcc ggtacaaccc cggaccggtc gctagcgccg14040cctccaccgt ggattccgtg atcgacagcg tggtagccgg cgctcgggcc tatgctcgcc14100gcaagaggcg gctgcatcgg agacgtcgcc ccaccgccgc catgctggca gccagggccg14160tgctgaggcg ggcccggagg gcaggcagaa gggctatgcg ccgcgctgcc gccaacgccg14220ccgccgggag ggcccgccga caggctgccc gccaggctgc cgctgccatc gctagcatgg14280ccagacccag gagagggaac gtgtactggg tgcgtgattc tgtgacggga gtccgagtgc14340cggtgcgcag ccgacctccc cgaagttaga agatccaagc tgcgaagacg gcggtactga14400gtctccctgt tgttatcagc ccaacatgag caagcgcaag tttaaagaag aactgctgca14460gacgctggtg cctgagatct atggccctcc ggacgtgaag ccagacatta agccccgcga14520tatcaagcgt gttaaaaagc gggaaaagaa agaggaactc gcggtggtag acgatggcgg14580agtggaattt attaggagtt tcgccccgcg acgcagggtt caatggaaag ggcggcgggt14640acaacgcgtt ttgaggccgg gcaccgcggt agtttttacc ccgggagagc ggtcggccgt14700taggggtttc aaaaggcagt acgacgaggt gtacggcgac gaggacatat tggaacaggc14760ggctcaacag atcggagaat ttgcctacgg aaagcgttcg cgtcgcgaag acctggccat14820cgccttagac agcggcaacc ccacgcccag cctcaaaccc gtgacgctgc agcaggtgct14880tcccgtgagc gccagcacgg acagcaagag ggggattaag agagaaatgg aagatctgca14940tcccaccatc caactcatgg tccctaaacg gcagaggctg gaagaggtcc tggagaagat15000gaaagtggac cccagcatag agccggatgt aaaagtcaga cctattaagg aagtggcccc15060cggtcttggg gtgcaaacgg tggacattca aatccccgtc accaccgctt caaccgccgt15120ggaagctatg gaaacgcaaa cggagacccc tgccgcgatc ggtaccaggg aagtggcgtt15180gcaaacggag ccttggtacg aatacgcagc ccctcggcgt cagaggcgtt ccgctcgtta15240cggccccgcc aacgccatca tgccagaata tgcgctgcat ccgtctattc tgcccactcc15300cggataccgg ggtgtgacgt atcgcccgtc tggaacccgc cgccgaaccc gtcgccgccg15360ccgctcccgt cgcgctctgg cccccgtgtc ggtgcggcgt gtgacccgcc ggggaaagac15420agtcgtcatt cccaacccgc gttaccaccc tagcatcctt taataactct gccgttttgc15480
agatggctct gacttgccgc gtgcgccttc ccgttccgca ctatcgagga agatctcgtc15540gtaggagagg catgacgggc agtggtcgcc ggcgggcttt gcgcaggcgc atgaaaggcg15600gaattttacc cgccctgata cccataattg ccgccgccat cggtgccata cccggcgttg15660cttcagtggc gttgcaagca gctcgtaata aataaacaaa ggcttttgca cttatgacct15720ggtcctgact attttatgca gaaagagcat ggaagacatc aattttacgt cgctggctcc15780gcggcacggc tcgcggccgc tcatgggcac ctggaacgac atcggcacca gtcagctcaa15840cgggggcgct ttcaattggg ggagcctttg gagcggcatt aaaaactttg gctccacgat15900taaatcctac ggcagcaaag cctggaacag tagtgctggt cagatgctcc gagataaact15960gaaggacacc aacttccaag aaaaagtggt caatggggtg gtgaccggca tccacggcgc16020ggtagatctc gccaaccaag cggtgcagaa agagattgac aggcgtttgg aaagctcgcg16080ggtgccgccg cagagagggg atgaggtgga ggtcgaggaa gtagaagtag aggaaaagct16140gcccccgctg gagaaagttc ccggtgcgcc tccgagaccg cagaagcggc ccaggccaga16200actagaagag actctggtga cggagagcaa ggagcctccc tcgtacgagc aagccttgaa16260agagggcgcc tctccaccct cctacccgat gactaagccg atcgcaccca tggctcgacc16320ggtgtacggc aaggattaca agcccgtcac gctagagctg cccccaccgc cccccacgcg16380cccgaccgtc ccccccctgc cgactccgtc ggcggccgcg gcgggacccg tgtccgcacc16440atccgctgtg cctctgccag ccgcccgtcc agtggccgtg gccactgcca gaaaccccag16500aggccagaga ggagccaact ggcaaagcac gctgaacagc atcgtgggcc tgggagtgaa16560aagcctgaaa cgccgccgtt gctattatta aaaaagtgta gctaaaaagt ctcccgttgt16620atacgcctcc tatgttaccg ccagagacga gtgactgtcg ccgcgagcgc cgctttcaag16680atggccaccc catcgatgat gccgcagtgg tcttacatgc acatcgccgg ccaggacgcc16740tcggagtacc tgagtcccgg cctcgtgcag tttgcccgcg ccaccgacac ctacttcagc16800ttgggaaaca agtttagaaa ccccaccgtg gcccccaccc acgatgtgac cacggaccgc16860tcgcagaggc tgaccctgcg ctttgtgccc gtagaccggg aggacaccgc gtactcttac16920aaagtgcgct acacgttggc cgtaggggac aaccgagtgc tggacatggc cagcacctac16980tttgacatcc ggggggtgct ggatcggggt cccagcttca agccctattc cggcaccgct17040tacaactccc tggcccccaa gggagctccc aacccctcgg aatggacgga cacttccgac17100aacaaactta aagcatatgc tcaggctccc taccagagtc aaggacttac aaaggatggt17160attcaggttg ggctagttgt gacagagtca ggacaaacac cccaatatgc aaacaaagtg17220taccaacccg agccacaaat tggggaaaac caatggaatt tagaacaaga agataaagcg17280gcgggaagag tcctaaagaa agatacccct atgtttccct gctatgggtc atatgccagg17340cccacaaacg aacaaggagg gcaggcaaaa aaccaagaag tagatttaca gttttttgcc17400actccgggcg acacccagaa cacggctaaa gtggtacttt atgctgaaaa tgtcaacctg17460gaaactccag atactcactt agtgtttaaa cccgatgacg acagcaccag ttcaaaactt17520cttcttgggc agcaggctgc acctaacaga cccaactaca taggttttag agataatttt17580attggtttaa tgtactacaa tagcactgga aacatgggcg tgctggccgg acaggcttct17640caattgaatg ccgtagtcga cttgcaggac agaaacaccg agttgtccta ccagctgatg17700ctggacgcac tgggggatcg cagccgatat ttttcaatgt ggaatcaggc agtagacagc17760tatgacccag acgttagaat tatagaaaac cacggagtgg aagacgaact gccaaactat17820tgttttcctc tgggaggaat ggtggtgact gacaattaca actctgtgac gcctcaaaat17880ggaggcagtg gaaatacatg gcaggcagac aatactacat ttagtcaaag aggagcgcag17940attggctccg gaaacatgtt tgccctggaa attaacctac aggccaacct ctggcgcggc18000ttcttgtatt ccaatattgg gttgtatctt ccagactctc tgaaaatcac ccccgacaac18060atcacgctgc cagaaaacaa aaacacttat cagtacatga acggtcgcgt aacgccaccc18120gggctcatag acacctatgt aaacgtgggc gcgcgctggt cccccgatgt catggacagc18180attaacccct tcaaccacca ccgtaacgcg ggcttgcgct accgctccat gctcttgggc18240
aacggccgtt atgtgccttt tcacattcag gtgccccaaa aattctttgc cattaaaaac18300ctgctgcttc tccccggttc ctatacctat gagtggaact tccgcaagga tgtcaacatg18360atcctgcaga gctcgctggg taatgacctg cgagtggacg gggccagcat acgctttgac18420agcattaacc tgtatgccaa cttttttccc atggcccaca acacggcctc taccctggaa18480gccatgctgc gcaacgacac caatgaccag tccttcaacg actacctgtg cgcggctaac18540atgctgtacc ccatccccgc caacgccacc agcgtgccca tttctattcc ttctcggaac18600tgggctgcct tcaggggctg gagttttact cgcctcaaaa ccaaggagac tccctcgctg18660ggctccggtt ttgaccccta ctttgtttac tccggctcca ttccctacct agatggcacc18720ttttacctca accacacttt caaaaaggtg tctattatgt ttgactcctc ggttagctgg18780cccggcaacg accgcctgct aacgcccaac gagttcgaaa ttaagcgttc cgtggacggt18840gaagggtaca acgtggccca gagcaacatg accaaggact ggtttctaat tcaaatgctc18900agtcactata atataggtta ccagggcttc tatgtgcccg agaactacaa ggaccgcatg18960tactccttct tccgcaactt ccaaccaatg agccggcagg tggtagatac cgtgacttat19020acagactaca aagatgtcaa gctcccctac caacacaaca actcagggtt cgtgggctac19080atgggaccca ccatgcgaga gggacaggcc tacccggcca actatcccta ccccctgatc19140ggagagactg ccgtacccag cctcacgcag aaaaagttcc tctgcgaccg ggtgatgtgg19200aggataccct tctctagcaa ctttatgtcg atgggctccc tcaccgacct ggggcagaac19260atgctgtacg ccaactccgc tcacgccttg gacatgactt ttgaggtgga tcccatggat19320gagcccacgc ttctctatgt tctgtttgaa gtcttcgacg tggtgcgcat ccaccagccg19380caccgcggcg tcatcgaggc cgtctacctg cgcacacctt tctctgccgg taacgccacc19440acctaaagaa gctgatgggt tccagcgaac aggagttgca ggccattgtt cgcgacctgg19500gctgcgggcc ctgctttttg ggcaccttcg acaagcgttt tcccggattc atgtcccccc19560acaagccggc ctgcgccatc gttaacacgg ccggacggga gacagggggg gtgcactggc19620tcgccttcgc ctggaacccg cgcaaccgca cctgctacct gttcgaccct tttggtttct19680ccgacgaaag gctgaagcag atctaccaat tcgagtacga ggggctcctc aagcgcagcg19740ctctggcctc cacgcccgac cactgcgtca ccctggaaaa gtccacccag acggtccagg19800ggcccctctc ggccgcctgc gggcttttct gttgcatgtt tttgcacgcc ttcgtgcact19860ggcctcacac ccccatggag cgcaacccca ccatggatct gctcaccgga gtgcccaaca19920gcatgcttca cagtccccag gtcgccccca ccctgcgtcg caatcaggac cacctgtatc19980gctttctggg gaaacactct gcctatttcc gccgccaccg gcagcgcatc gaacaggcca20040cggccttcga aagcatgagc caaagagtgt aatcaataaa aaccgttttt atttgacatg20100atacgcgctt ctggcgtttt tattaaaaat cgaagggttc gagggagggg tcctcgtgcc20160cgctggggag ggacacgttg cggtactgga atcgggcgct ccaacgaaac tcggggatca20220ccagccgcgg cagggccacg tcttccatgt tctgcttcca aaactgtcgc accagctgca20280gggctcccat cacgtcgggc gctgagatct tgaagtcgca gttagggccg gagcccccgc20340ggctgttgcg gaacacgggg ttggcacact ggaacaccaa cacgctgggg ttgtggatac20400tagccagggc cgtcgggtcg gtcacctccg atgcatccag atcctcggca ttgctcaggg20460cgaacggggt cagcttgcac atctgccgcc cgatctgggg taccaggtcg cgcttgttga20520ggcagtcgca gcgcagaggg atgaggatgc gacgctgccc gcgttgcatg atggggtaac20580tcgccgccag gaactcctct atctgacgga aggccatctg ggccttgacg ccctcggtga20640aaaatagccc acaggacttg ctggaaaaca cgttattgcc acagttgatg tcttccgcgc20700agcagcgcgc atcttcgttc ttcagctgaa ccacgttgcg accccagcgg ttctgaacca20760ccttggcttt cgtgggatgc tccttcagcg cccgctgtcc gttctcgctg gtcacatcca20820tttccaccac gtgctccttg cagaccatct ccactccgtg gaaacagaac agaatgccct20880cctgttgggt attgcgatgc tcccacacgg cgcacccggt ggactcccag ctcttgtgtt20940tcacccccgc gtaggcttcc atgtaagcca ttagaaatct gcccatcagc tcagtgaagg21000
tcttctggtt ggtgaaggtt agcggcaggc cgcggtgttc ctcgttcaac caagtttgac21060agatcttgcg gtacacggct ccctggtcgg gcagaaactt aaaagtcgtt ctgctctcgt21120tgtccacgtg gaacttctcc atcaacatcg tcatgacttc catgcccttc tcccaggcag21180tcaccagcgg cgcgctctcg gggttcttca ccaacacggc ggtggagggg ccctcgccgg21240ccccgacgtc cttcatggac attttttgaa actccacggt gccgtccgcg cggcgtactc21300tgcgcatcgg agggtagctg aagcccacct ccatgacggt gctttcgccc tcgctgtcgg21360agacgatctc cggggagggc ggcggaacgg gggcagactt gcgagccttc ttcttgggag21420ggagcggagg cacctcctgc tcgcgctcgg gactcatctc ccgcaagtag ggggtgatgg21480agcttcctgg ttggttctga cggttggcca ttgtatccta ggcagaaaga catggagctt21540atgcgcgagg aaactttaac cgccccgtcc cccgtcagcg acgaagaggt catcgtcgaa21600caggacccgg gctacgttac gccgcccgag gatctggagg ggcccttaga cgaccggcgc21660gacgctagtg agcggcagga aaatgagaaa gaggaggagg agggctgcta cctcctggaa21720ggcgacgttt tgctaaagca tttcgccagg cagagcacca tactcaagga ggccttgcaa21780gaccgctccg aggtgccctt ggacgtcgcc gcgctctccc aggcctacga ggcgaacctt21840ttctcgcccc gagtgcctcc gaagagacag cccaacggca cctgcgagcc caacccgcga21900ctcaacttct accccgtgtt cgccgtgccc gaggcgctgg ccacctacca catctttttc21960aaaaaccagc gcattcccct ttcctgccgg gccaaccgca ccgcggccga taggaagcta22020acactcagaa acggagtcag catacctgat atcacgtcac tggaggaagt gcctaagatc22080ttcgagggtc tgggtcgaga tgagaagcgg gcggcgaacg ctctgcagaa agaacagaaa22140gagagtcaga acgtgctggt ggagctggag ggggacaacg cgcgtctgac cgtcctcaaa22200cgttgcatag aagtttccca cttcgcctac ccggccctca acctgccgcc caaagttatg22260aaatcggtca tggaccagct actcatcaag agagctgagc ccctgaatcc cgaccaccct22320gaggcggaaa actcagagga cggaaagccc gtcgtcagcg acgaggagct cgagcggtgg22380ctggaaacca gggaccccca gcagttgcaa gagaggcgca agatgatgat ggcggccgtg22440ctggtcacgg tggagctaga atgcctgcaa cggtttttca gcgacgtgga gacgctacgc22500aaaatcgggg agtccctgca ctacaccttc cgccagggct acgttcgcca ggcctgcaaa22560atctccaacg tagagctcag caacctggtt tcctacatgg gcatcctcca cgagaaccgg22620ctggggcaga gcgtgctgca ctgcaccttg caaggcgagg cgcgaaggga ctacgtccga22680gactgcgtct acctcttcct caccctcacc tggcagaccg ccatgggcgt gtggcagcag22740tgcttggaag agagaaacct caaagagctg gacaaactcc tctgccgcca gcggcgggcc22800ctctggaccg gcttcagcga gcgcacggtc gcctgcgccc tggcagacat cattttccca22860gaacgcctga tgaaaacctt gcagaacggc ctgccggatt tcatcagtca gagcatcttg22920caaaacttcc gctccttcgt cctggagcgc tccgggatct tgcccgccat gagctgcgcg22980ctgccttctg actttgtccc cctttcctac cgcgagtgcc ctcccccact gtggagccac23040tgctacctct tccaactggc caactttctg gcctaccact ccgacctcat ggaagacgtg23100agcggagagg ggctgctcga gtgccactgc cgctgcaacc tctgcacccc ccacagatcg23160ctggcctgca acaccgagct gctcagcgaa acccaggtca taggtacctt cgagatccag23220gggccccagc agcaagaggg tgcttccggc ttgaagctca ctccggcgct gtggacctcg23280gcttacttac gcaaatttgt agccgaggac taccacgccc acaaaattca gttttacgaa23340gaccaatctc gaccaccgaa agcccccctc acggcctgcg tcatcaccca gagcaaaatc23400ctggcccaat tgcaatccat caaccaagcg cgccgagatt tccttttgaa aaagggtcgg23460ggggtgtacc tggaccccca gaccggcgag gaactcaacc cgtccacact ttccgtcgaa23520gcagcccccc cgagacatgc cacccaaggg aaccgccaag cagctgatcg ctcggcagag23580agcgaagaag caagagctgc tccagcagca ggtggaggac gaggaagagc tgtgggacag23640ccaggcagag gaggtgtcag aggacgagga ggagatggaa agctgggaca gcctagacga23700ggaggacgag ctttcagagg aagaggcgac cgaagaaaaa ccacctgcat ccagcgcgcc23760
ttctctgagc cgacagccga agccccggcc cccgacgccc ccggccggct cactcaaagc23820cagccgtagg tgggacgcca ccggatctcc agcggcagcg gcaacggcag cgggtaaggc23880caaacgcgag cggcgggggt attgctcctg gcggacccac aaaagcagta tcgtgaactg23940cttgcaacac tgcgggggaa acatctcctt tgcccgacgc tacctcctct tccatcacgg24000tgtggccttc cctcgcaacg ttctctatta ttaccgtcat ctctacagcc cctacgaaac24060gctcggagaa aaaagctaag gcctcctctg ccgcgaggaa aaactccgcc gccgctgccg24120ccaaggatcc gccggccacc gaggagctga gaaagcgcat ctttcccact ctgtatgcta24180tctttcagca aagccgcggg cagcaccctc agcgcgaact gaaaataaaa aaccgctcct24240tccgctcact cacccgcagc tgtctgtacc acaagagaga agaccagctg cagcgcaccc24300tggacgacgc cgaagcactg ttcagcaaat actgctcagc gtctcttaaa gactaaaaga24360cccgcgcttt ttccccctcg ggcgccaaaa cccacgtcat cgccagcatg agcaaggaga24420ttcccacccc ttacatgtgg agctatcagc cccagatggg cctggccgcg ggggccgccc24480aggactactc cagcaaaatg aactggctca gcgccggccc ccacatgatc tcacgagtta24540acggcatccg agcccaccga aaccagatcc tcttagaaca ggcggcaatc accgccacac24600cccggcgcca actcaacccg cccagttggc ccgccgccca ggtgtatcag gaaactcccc24660gcccgaccac agtcctcctg ccacgcgacg cggaggccga agtcctcatg actaactctg24720gggtacaatt agcgggcggg tccaggtacg ccaggtacag aggtcgggcc gctccttact24780ctcccgggag tataaagagg gtgatcattc gaggccgagg tatccagctc aacgacgagg24840cggtgagctc ctcaaccggt ctcagacctg acggagtctt ccagctcgga ggagcgggcc24900gctcttcctt caccactcgc caggcctacc tgaccctgca gagctcttcc tcgcagccgc24960gctccggggg aatcggcact ctccagttcg tggaagagtt cgtcccctcc gtctacttca25020acccgttttc cggctcacct ggacgctacc cggacgcctt cattcccaac tttgacgcag25080tgagtgaatc cgtggacggc tacgactgat gacagatggt gcggccgtga gagctcggct25140gcgacatctg catcactgcc gccagcctcg ctgctacgct cgggaggcga tcgtgttcag25200ctactttgag ctgccggacg agcaccctca gggaccggct cacgggttga aactcgagat25260tgagaacgcg cttgagtctc acctcatcga cgccttcacc gcccggcctc tcctggtaga25320aaccgaacgc gggatcacta ccatcaccct gttctgcatc tgccccacgc ccggattaca25380tgaagatctg tgttgtcatc tttgcgctca gtttaataaa aactgaactt tttgccgtac25440cttcaacgcc acgcgttgtt tctccttgtg aaaaaacccc aggagtcctt aacttacaca25500tagcaaaacc cttgtatttt accatagaaa aacaactagc cctttcaatt ggaaaagggt25560taacaatttc tgctacagga cagttggaaa gcacagcaag cgtacaggac agcgctacac25620cacccctacg tggtatttcc cctttaaagc tgacagacaa cggtttaaca ttaagctatt25680cagatcccct gcgtgtggta ggtgaccaac ttacgtttaa ttttacttct ccactacgtt25740acgaaaatgg cagtcttaca ttcaactaca cttctcccat gacactaata aacaacagtc25800ttgctattaa cgtcaatacc tccaaaggcc tcagtagtga caacggcaca ctcgctgtaa25860atgttactcc agattttaga tttaacagct ctggtgcctt aacttttggc atacaaagtc25920tatggacttt tccaaccaaa actcctaact gtaccgtgtt taccgaaagt gactccctgc25980tgagtctttg cttgactaaa tgcggagctc acgtacttgg aagcgtgagt ttaagcggag26040tggcaggaac catgctaaaa atgacccaca cttctgttac cgttcagttt tcgtttgatg26100acagtggtaa actaatattc tctccacttg cgaacaacac ttggggtgtt cgacaaagcg26160agagtccgtt gcccaaccca tccttcaacg ctctcacgtt tatgccaaac agtaccattt26220attctagagg agcaagtaac gaacctcaaa acaattatta tgtccagacg tatcttagag26280gcaacgtgcg aaagccaatt ctactaactg ttacctacaa ctcagttaat tcaggatatt26340ccttaacttt taaatgggat gctgtcgcca atgaaaaatt tgccactcct acatcttcgt26400tttgctatgt tgcagagcaa taaaaccctg ttaccccacc gtctcgtttt tttcagatga26460aacgagcgag agttgatgaa gacttcaacc cagtgtaccc ttatgacccc ccatacgctc26520
ccgtcatgcc cttcattact ccgcctttta cctcctcgga tgggttgcag gaaaaaccac26580ttggagtgtt aagtttaaac tacagggatc ccattactac acaaaatggg tctctcacgt26640taaaactagg aaacggcctc actctaaaca accagggaca gttaacatca actgctggcg26700aagtggagcc tccgctcact aatgctaaca acaaacttgc actagcctat agcgaaccat26760tagcagtaaa aagcaaccgc ctaactctat cacacaccgc tccccttgtc atcgctaata26820attctttagc gttgcaagtt tcagagccta tttttgtaaa tgacgatgac aagctagccc26880tgcagacagc cgcccccctt gtaaccaacg ctggcaccct tcgcttacag agcgctgccc26940ctttaggatt ggttgaaaat actcttaaac tgctgttttc taaacccttg tatttgcaaa27000atgattttct tgcattagcc attgaacgcc ccctggctgt agcagccgca ggtactctga27060ccctacaact tactcctcca ttaaagacta acgatgacgg gctaacacta tccacagtcg27120agccattaac tgtaaaaaac ggaaacctag gcttgcaaat atcgcgccct ttagttgttc27180aaaacaacgg cctttcgctt gctattaccc ccccgctgcg tttgtttaac agcgaccccg27240ttcttggttt gggcttcact tttcccctag ctgtcacaaa caacctcctc tccttaaaca27300tgggagacgg agttaaactt acctataata aactaacagc caatttgggt agggatttac27360aatttgaaaa cggtgcgatt gccgtaacgc ttactgccga attacctttg caatacacta27420acaaacttca actgaatatt ggagctggcc ttcgttacaa tggagccagc agaaaactag27480atgtaaacat taaccaaaat aaaggcttaa cttgggacaa cgatgcagtt attcccaaac27540taggatcggg cttacaattt gaccctaatg gcaacatcgc tgttatccct gaaaccgtga27600agccgcaaac gttatggacg actgcagatc cctcgcctaa ctgctcagtg taccaggact27660tggatgccag gctgtggctc gctcttgtta aaagtggcga catggtgcat ggaagcattg27720ccctaaaagc cctaaaaggg acgttgctaa atcctacagc cagctacatt tccattgtga27780tatattttta cagcaacgga gtcaggcgta ccaactatcc aacgtttgac aacgaaggca27840ccttagctaa cagcgccact tggggatacc gacaggggca atctgctaac actaatgtga27900ccaatgccac tgaatttatg cccagctcaa gcaggtaccc cgtgaataaa ggagacaaca27960ttcaaaatca atctttttca tacacctgta ttaaaggaga ttttgctatg cctgtcccgt28020tccgtgtaac atataatcac gccctggaag ggtattccct taagttcacc tggcgcgttg28080tagccaatca ggcctttgat attccttgct gttcattttc atacatcaca gaataaaaaa28140ccactttttc attttaattt ctttttattt tacacgaaca gtgagacttc ctccaccctt28200ccatttgaca gcatacacca gcctctcccc cttcatagca gtaaactgtt gtgaatcagt28260ccggtatttg ggagttaaaa tccaaacagt ctctttggtg atgaaacgtc gatcagtaat28320ggacacaaat ccctgggaca ggttttccaa cgtttcggtg aaaaactgca caccgcccta28380caaaacaaac aggttcaggc tctccacggg ttatctcccc gatcaaactc agacagggta28440aaggtgcggt ggtgttccac taaaccacgc aggtggcgct gtctgaacct ctcggtgcga28500ctcctgtgag gctggtaaga agttagattg tccagtagcc tcacagcatg tatcatcagt28560ctacgagtgc gtctggcgca gcagcgcatc tgaatctcac tgagattccg gcaagaatcg28620cacaccatca caatcaggtt gttcatgatc ccatagctga acacgctcca gccaaagctc28680attcgctcca acagcgccac cgcgtgtccg tccaacctta ctttaacata aatcaggtgt28740ctgccgcgta caaacatgct acccacatac agaacttccc ggggcaggcc cctgttcacc28800acctgtctgt accagggaaa cctcacattt atcagggagc catagatggc cattttaaac28860caattagcta ataccgcccc accagctcta cactgaagag aaccgggaga gttacaatga28920cagtgaataa tccatctctc ataacccctg atggtctgat gaaaatctag atctaacgtg28980gcacaacaaa tacacacttt catatacatt ttcataacat gtttttccca ggccgttaaa29040atacaatccc aatacacggg ccactcctgc agtacaataa agctaataca agatggtata29100ctcctcacct cactgacact gtgcatgttc atattttcac attctaagta ccgagagttc29160tcctctacag cagcactgct gcggtcctca caaggtggta gctggtgatg attgtagggg29220gccagtctgc agcgataccg tctgtcgcgt tgcatcgtag accaggaacc gacgcacctc29280
ctcgtacttg tggtagcaga accacgtccg ctgccagcac gtctccacgt aacgccggtc29340cctgcgtcgc tcacgctccc tcctcaatgc aaagtgcaac cactcttgta atccacacag29400atccctctcg gcctccgggg tgatgcacac ctcaaaccta cagatgtctc ggtacagttc29460caaacacgta gtgagggcga gttccaacca agacagacag cctgatctat cccgacacac29520tggaggtgga ggaagacacg gaagaggcat gttattccaa gcgattcacc aacgggtcga29580aatgaagatc ccgaagatga caacggtcgc ctccggagcc ctgatggaat ttaacagcca29640gatcaaacgt tatgcgattc tccaagctat cgatcgccgc ttccaaaaga gcctggaccc29700gcacttccac aaacaccagc aaagcaaaag cactattatc aaactcttca atcatcaagc29760tgcaggactg tacaatgcct aagtaatttt cgtttctcca ctcgcgaatg atgtcgcggc29820agatagtctg aaggttcatc ccgtgcaggg taaaaagctc cgaaagggcg ccctctacag29880ccatgcgtag acacaccatc atgactgcaa gatatcgggc tcctgagaca cctgcagcag29940atttaacaga tcaaggtcag gttgctctcc gcgatcacga atctccatcc gcaaggtcat30000ttgcaaaaaa ttaaataaat ctatgccgac tagatctgtc aactccgcat taggaaccaa30060atcaggtgtg gctacgcagc acaaaagttc cagggatggt gccaaactca ctagaaccgc30120tcccgagtaa caaaactgat gaatgggagt aacacagtgt aaaatgtgca accaaaaatc30180actaaggtgc tcctttaaaa agtccagtac ttctatattc agtccgtgca agtactgaag30240caactgtgcg ggaatatgca caacaaaaaa aatagggcgg ctcagataca tgttgaccta30300aaataaaaag aatcattaaa ctaaagaagc ttggcgaacg gtgggataaa tgacacgctc30360cagcagcaga caggcaaccg gctgtccccg ggaaccgcgg taaaattcat ccgaatgatt30420aaaaagaaca acagaaactt cccaccatgt actcggttgg atctcctgag cacacagcaa30480tacccccctc acattcatgt ccgccacaga aaaaaaacgt cccagatacc cagcggggat30540atccaacgac agctgcaaag acagcaaaac aatccctctg ggagcgatca caaaatcctc30600cggtgaaaaa agcacataca tattagaata accctgttgc tggggcaaaa aggcccggcg30660tcccagcaaa tgcacataaa tatgttcatc agccattgcc ccgtcttacc gcgtaatcag30720ccacgaaaaa atcgagctaa aattcaccca acagcctata gctatatata cactccgccc30780aatgacgcta ataccgcacc acccacgacc aaagttcacc cacacccaca aaacccgcga30840aaatccagcg ccgtcagcac ttccgcaatt tcagtctcac aacgtcactt ccgcgcgcct30900tttcacattc ccacacacac ccgcgccctt cgccccgccc tcgcgccacc ccgcgtcacc30960gcacgtcacc ccggccccgc ctcgctcctc cccgctcatt atcatattgg cacgtttcca31020gaataaggta tattattgat gatg 31044<210>6<211>34115<212>DNA<213>猿腺病毒SV-39<400>6catcatcaat ataacaccgc aagatggcga ccgagttaac atgcaaatga ggtgggcgga 60gttacgcgac ctttgtcttg ggaacgcgga agtgggcgcg gcgggtttcg gggaggagcg 120cggggcgggg cgggcgtgtc gcgcggcggt gacgcgccgg ggacccggaa attgagtagt 180ttttattcat tttgcaagtt tttctgtaca ttttggcgcg aaaactgaaa cgaggaagtg 240aaaagtgaaa aatgccgagg tagtcaccgg gtggagatct gacctttgcc gtgtggagtt 300tacccgctga cgtgtgggtt tcggtctcta ttttttcact gtggttttcc gggtacggtc 360aaaggtcccc attttatgac tccacgtcag ctgatcgcta gggtatttaa tgcgcctcag 420accgtcaaga ggccactctt gagtgccggc gagaagagtt ttctcctccg cgttccgcca 480actgtgaaaa aatgaggaac ttcttgctat ctccggggct gccagcgacc gtagccgccg 540
agctgttgga ggacattgtt accggagctc tgggagacga tcctcaggtg atttctcact 600tttgtgaaga ttttagtctt catgatctct atgatattga tccgggtgtt gaggggcaag 660aggatgaatg gctggagtct gtggatgggt tttttccgga cgctatgctg ctagaggctg 720atttgccacc acctcacaac tctcacactg agcccgagtc agctgctatt cctgaattgt 780catcaggtga acttgacttg gcttgttacg agactatgcc tccggagtcg gatgaggagg 840acagcgggat cagcgatccc acggctttta tggtctctaa ggcgattgct atactaaaag 900aagatgatga tggcgatgat ggatttcgac tggacgctcc ggcggtgccg gggagagact 960gtaagtcctg tgaataccac cgggatcgta ccggagaccc gtctatgttg tgttctctgt1020gttatctccg tcttaacgct gcttttgtct acagtaagtg ttttgtgctt ttttaccctg1080tggctttgtt gagtttattt ttttctgtgt ctcatagggt gttgtttatt ataggtcctg1140tttcagatgt ggaggaacct gatagtacta ctggaaatga ggaggaaaag ccctccccgc1200cgaaactaac tcagcgctgc agacctaata ttttgagacc ctcggcccag cgtgtgtcat1260cccggaaacg tgctgctgtt aattgcatag aagatttatt ggaagagccc actgaacctt1320tggacttgtc cttaaagcga ccccgcccgc agtagggcgc ggtgccagtt ttttctctct1380agcttccggg tgactcagtg caataaaaat tttcttggca acaggtgtat gtgtttactt1440tacgggcggg aagggattag gggagtataa agctggaggg gaaaaatctg aggctgtcag1500atcgagtgag aagttccatg gacttgtacg agagcctaga gaatctaagt tctttgcgac1560gtttgctgga ggaggcctcc gacagaacct cttacatttg gaggtttctg ttcggttccc1620ctctgagtcg ctttttgcac cgggtgaagc gagagcacct gacggaattt gatgggcttt1680tagagcagct gcctggactg tttgattctt tgaatctcgg ccaccggacg ctgctagagg1740agaggctttt tccacaattg gacttttcct ctccaggccg tctgtgttca gcgcttgctt1800ttgctgtaca tctgttggac agatggaacg agcagacgca gctcagcccg ggttacactc1860tggacttcct gacgctatgc ctatggaagt tcggaatcag gagggggagg aagctgtacg1920ggcgcttggt ggagaggcat ccgtctctgc gccagcagcg tctgcaagct caagtgctgc1980tgaggcggga ggatctggaa gccatttcgg aggaggagag cggcatggaa gagaagaatc2040cgagagcggg gctggaccct ccggcggagg agtagggggg ataccggacc cttttcctga2100gttggctttg ggggcggtgg ggggcgcttc tgtggtacgt gaggatgaag aggggcgcca2160acgcggtcag aagagggagc attttgagtc ctcgactttc ttggctgatg taaccgtggc2220cctgatggcg aaaaacaggc tggaggtggt gtggtacccg gaagtatggg aggactttga2280gaagggggac ttgcacctgc tggaaaaata taactttgag caggtgaaaa catactggat2340gaacccggat gaggactggg aggtggtttt gaaccgatac ggcaaggtag ctctgcgtcc2400cgactgtcgc taccaggttc gcgacaaggt ggtcctgcga cgcaacgtgt acctgttggg2460caacggcgcc accgtggaga tggtggaccc cagaaggggt ggttttgtgg ccaatatgca2520agaaatgtgc cctggggtgg tgggcttgtc tggggtgact tttcatagtg tgaggtttag2580cggtagcaat tttgggggtg tggttattac cgcgaacact cctgtggtcc tgcataattg2640ctactttttt ggcttcagca acacctgtgt ggaaatgagg gtgggaggca aagtgcgcgg2700gtgttccttt tacgcttgct ggaagggggt ggtgagccag ggtaaggcta aagtgtctgt2760tcacaagtgt atgttggaga gatgcacctt gggcatttcc agtgagggct tcctccacgc2820cagcgacaac gtggcttctg acaacggctg cgcctttctt atcaagggag ggggtcgcat2880ctgtcacaac atgatatgcg gccctgggga tgtcccccca aagccttacc agatggttac2940ctgcacagat ggcaaggtgc gcatgctcaa gcctgtgcac attgtgggcc accggcgcca3000ccgctggcca gagtttgaac acaatgtgat gacccgctgt agcttgtacc tgggaggcag3060gcgaggagtt ttcttgccca gacagtgtaa cctggcccac tgcaacgtga tcatggaaca3120atccgccgct acccaggttt gctttggagg aatatttgat ataagcatgg tggtgtataa3180gatcctgcgc tacgacgact gtcgggctcg tactcgaacc tgcgactgcg gagcctctca3240cctgtgtaac ctgactgtga tggggatggt gactgaggag gtgcgactgg accactgtca3300
gcactcttgc ctgcgggagg agttttcttc ctcggacgag gaggactagg taggtggttg3360gggcgtggcc agcgagaggg tgggctataa aggggaggtg tcggctgacg ctgtcttctg3420tttttcaggt accatgagcg gatcaagcag ccagaccgcg ctgagcttcg acggggccgt3480gtacagcccc tttctgacgg ggcgcttgcc tgcctgggcc ggagtgcgtc agaatgttac3540cggttcgacc gtggacggac gtcccgtgga tccatctaac gctgcttcta tgcgctacgc3600tactatcagc acatctactc tggacagcgc cgctgccgcc gcagccgcca cctcagccgc3660tctctccgcc gccaagatca tggctattaa cccaagcctt tacagccctg tatccgtgga3720cacctcagcc ctggagcttt accggcgaga tctagctcaa gtggtggacc aactcgcagc3780cgtgagccaa cagttgcagc tggtgtcgac ccgagtggag caactttccc gccctcccca3840gtaaccgcaa aaattcaata aacagaattt aataaacagc acttgagaaa agtttaaact3900tgtggttgac tttattcctg gatagctggg gggagggaac ggcgggaacg gtaagacctg3960gtccatcgtt cccggtcgtt gagaacacgg tggatttttt ccaagacccg atagaggtgg4020gtctgaacgt tgagatacat gggcatgagc ccgtctcggg ggtggaggta ggcccactgc4080agggcctcgt tttcaggggt ggtgttgtaa atgatccagt cgtaggcccc ccgctgggcg4140tggtgctgga agatgtcctt cagcagcaag ctgatggcaa cgggaagacc cttggtgtag4200gtgttgacaa agcggttgag ttgggagggg tgcatgcggg gactgatgag gtgcattttg4260gcctggatct tgaggttggc tatgttgccg cccagatcgc gcctgggatt catgttatgc4320aagaccacca gcaccgagta accggtgcag cgggggaatt tgtcgtgcag cttggaaggg4380aaagcgtgga agaatttgga gacccctcgg tgcccgccta ggttttccat gcactcatcc4440atgatgatgg cgatgggccc ccgggaggca gcctgggcaa aaacgttgcg ggggtccgtg4500acatcgtagt tgtggtcctg ggtgagttca tcataggaca ttttgacaaa gcgcgggcag4560agggtcccag actggggaat gatggttcca tccggtccgg gggcgtagtt gccctcgcag4620atttgcattt cccaggcttt gatttcagag ggagggatca tgtcaacctg gggggcgatg4680aaaaaaatgg tctctggggc gggggtgatg agctgggtgg aaagcaggtt gcgcaagagc4740tgtgacttgc cgcagccggt gggcccgtag atgacagcta tgacgggttg cagggtgtag4800tttagagagc tacaactgcc atcatccttc aaaagcgggg ccacactgtt taaaagttct4860ctaacatgta agttttcccg cactaagtcc tgcaggagac gtgaccctcc tagggagaga4920agttcaggaa gcgaagcaaa gtttttaagt ggcttgaggc catcggccaa gggcaagttc4980ctgagagttt gactgagcag ttccagccgg tcccagagct cggttacgtg ctctacggca5040tctcgatcca gcagacctcc tcgtttcggg ggttggggcg gctctggctg tagggaatga5100ggcggtgggc gtccagctgg gccatggtgc ggtccctcca tgggcgcagg gttctcttca5160gggtggtctc ggtcacggtg aatgggtggg ccccgggctg ggcgctggcc agggtgcgct5220tgaggctgag gcggctggtg gcgaaccgtt gcttttcgtc tccctgcaag tcagccaaat5280agcaacggac catgagctca tagtccaggc tctctgcggc atgtcctttg gcgcgaagct5340tgcctttgga aacgtgcccg cagtttgagc agagcaagca ttttagcgcg tagagttttg5400gcgccaagaa cacggattcc ggggaataag catccccacc gcagttggag caaacggttt5460cgcattccac cagccaggtc agctgaggat cttttgggtc aaaaaccaag cgcccgccgt5520tttttttgat gcgcttccta cctcgggtct ccatgaggcg gtgcccgcgt tcggtgacga5580agaggctgtc ggtgtctccg tagacggagg tcagggcgcg ctcctccagg ggggtcccgc5640ggtcctcggc gtagagaaac tcgcaccact ctgacataaa cgcccgggtc caggctagga5700cgaatgaggc gatgtgggaa gggtaccggt cgttatcgat gagggggtcg gttttttcca5760aggtgtgcag gcacatgtcc ccctcgtccg cttccaaaaa tgtgattggc ttgtaggtgt5820aagtcacgtg atcctgtcct tccgcggggg tataaaaggg ggcgtttccc ccctcctcgt5880cactctcttc cggttcgctg tcgccaaagg ccagctgttg gggtacgtaa acgcgggtga5940aggcgggcat gacctgtgcg ctgaggttgt cagtttctat atacgaggaa gatttgatgg6000cgagcgcccc cgtggagatg cccttgaggt gctcggggcc catttggtca gaaaacacaa6060
tctgtcggtt atcaagcttg gtggcaaaag acccgtagag ggcgttggag agcaacttgg6120cgatggagcg ctgggtttgg tttttttccc ggtcggcttt ttccttggcc gcgatgttga6180gctggacgta ctccctggcc acgcacttcc agccgggaaa aacggccgtg cgctcgtccg6240gcaccagcct cacgctccat ccgcggttgt gcagggtgat gacgtcgatg ctggtggcca6300cctctccgcg caggggctcg ttggtccagc agaggcgacc gcccttgcga gagcagaagg6360ggggcagggg gtcaagcagg cgctcgtccg gggggtcggc gtcgatggta aagatggcgg6420gcagcaggtg tttgtcaaag taatcgatct gatgcccggg gcaacgcagg gcggtttccc6480agtcccgcac cgccaaggcg cgctcgtatg gactgagggg ggcgccccag ggcatgggat6540gcgtcagggc cgaggcgtac atgccgcaga tgtcatagac gtaaaggggc tcctccagga6600cgccgaggta ggtggggtag cagcgccccc cgcggatgct ggcccgtacg tagtcgtaga6660gctcgtgcga gggggccaga aggtggcggc tgaggtgagc gcgctggggc ttttcatctc6720ggaagaggat ctgcctgaag atggcgtggg agttggagga gatggtgggc cgctgaaaaa6780tgttgaagcg ggcgtcgggc agacccacgg cctcgccgat aaagtgggcg taggactctt6840gcagcttttc caccagggag gcggtgacca gcacgtccag agcgcagtag tccagggttt6900cccgcacgat gtcataatgc tcttcctttt tttccttcca gaggtctcgg ttgaagagat6960actcttcgcg gtctttccag tactcttgga gaggaaaccc gttttcgtct ccacggtaag7020agcccaacat gtaaaactgg ttgacggcct gatagggaca gcatcccttc tccacgggca7080gcgagtaggc cagggcggcc ttgcgcaggg aggtgtgagt cagggcaaag gtgtcgcgga7140ccataacttt tacaaactgg tacttaaagt cccggtcgtc gcacatgcct cgctcccagt7200ctgagtagtc tgtgcgcttt ttgtgcttgg ggttaggcag ggagtaggtg acgtcgttaa7260agaggatttt gccacatctg ggcataaagt tgcgagagat tctgaagggg ccgggcacct7320ccgagcggtt gttgatgact tgggcagcca ggagaatttc gtcgaagccg ttgatgttgt7380gccccacgac gtagaactct atgaaacgcg gagcgccgcg cagcaggggg cacttttcaa7440gttgctggaa agtaagttcc cgcggctcga cgccgtgttc cgtgcggctc cagtcctcca7500ccgggtttcg ctccacaaaa tcctgccaga tgtggtcgac tagcaagagc tgcagtcggt7560cgcgaaattc gcggaatttt ctgccgatgg cttgcttctg ggggttcaag caaaaaaagg7620tgtctgcgtg gtcgcgccag gcgtcccagc cgagctcgcg agccagattc agggccagca7680gcaccagagc cggctcaccg gtgattttca tgacgaggag aaagggcacc agctgttttc7740cgaacgcgcc catccaggtg taggtctcca cgtcgtaggt gagaaacaga cgttcggtcc7800gcgggtgcga tcccaggggg aaaaacttga tgggctgcca ccattgggag ctctgggcgt7860ggatgtgatg gaagtaaaag tcccggcggc gcgtggaaca ttcgtgctgg tttttgtaaa7920agcggccgca gtggtcgcag cgcgagacgg agtgaaggct gtgaatcagg tgaatcttgc7980gtcgctgagg gggccccaga gccaaaaagc ggagcgggaa cgaccgcgcg gccacttcgg8040cgtccgcagg caagatggat gagggttcca ccgttccccg cccgcggacc gaccagactt8100ccgccagctg cggcttcagt tcttgcacca gctctcgcag cgtttcgtcg ctgggcgaat8160cgtgaatacg gaagttgtcg ggtagaggcg ggaggcggtg gacttccagg aggtgtgtga8220gggccggcag gagatgcagg tggtacttga tttcccacgg atgacggtcg cgggcgtcca8280aggcgaagag atgaccgtgg ggccgcggcg ccaccagcgt tccgcggggg gtctttatcg8340gcggcgggga cgggctcccg gcggcagcgg cggctcggga cccgcgggca agtcgggcag8400cggcacgtcg gcgtggagct cgggcagggg ctggtgctgc gcgcggagct gactggcaaa8460ggctatcacc cggcgattga cgtcctggat ccggcggcgc tgcgtgaaga ccaccggacc8520cgtggtcttg aacctgaaag agagttcgac agaatcaatc tcggcatcgt taaccgcggc8580ctggcgcagg atttcggcca cgtccccgga gttgtcttga tacgcgattt ctgccatgaa8640ctggtcgatt tcctcttcct gcaagtctcc gtgaccggcg cgttcgacgg tggccgcgag8700atcgttggag atgcggccca tgagctggga aaaggcattg atgccgacct cgttccacac8760tcggctgtac accacctctc cgtgaacgtc gcgggcgcgc atcaccacct gggcgagatt8820
gagttccacg tggcgggcga aaaccggata gtttcggagg cgctgataca gatagttgag 8880ggtggtggcg gcgtgctcgg ccacaaaaaa atacatgatc cagcggcgga gggtcagctc 8940gttgatgtcg cccagcgcct ccaggcgttc catggcctcg taaaagtcca cggcaaagtt 9000gaaaaattgg ctgttcctgg ccgagaccgt gagctcttct tccaagagcc gaatgagatc 9060cgccacggtg gccctgactt cgcgttcgaa agccccgggt gcctcctcca cctcttcctc 9120ctcgacttct tcgaccgctt cgggcacctc ctcttcctcg accaccacct caggcggggc 9180tcggcggcgc cggcggcgga cgggcaggcg gtcgacgaaa cgctcgatca tttcccccct 9240ccgtcgacgc atggtctcgg tgacggcgcg accctgttcg cgaggacgca gggtgaaggc 9300gccgccgccg agcggaggta acagggagat cggggggcgg tcgtggggga gactgacggc 9360gctaactatg catctgatca atgtttgcgt agtgacctcg ggtcggagcg agctcagcgc 9420ttgaaaatcc acgggatcgg aaaaccgttc caggaacgcg tctagccaat cacagtcgca 9480aggtaagctg aggaccgtct cgggggcttg tctgttctgt cttcccgcgg tggtgctgct 9540gatgaggtag ttgaagtagg cgctcttgag gcggcggatg gtggacagga gaaccacgtc 9600tttgcgccca gcttgctgta tccgcaggcg gtcggccatg ccccacactt ctccttgaca 9660gcggcggagg tccttgtagt attcttgcat cagcctttcc acgggcacct cgtcttcttc 9720ttccgctcgg ccggacgaga gccgcgtcag gccgtacccg cgctgcccct gtggttggag 9780cagggccagg tcggccacga cgcgctcggc cagcacggcc tgctggatgc gggtgagggt 9840gtcctgaaag tcgtcgagat ccacaaagcg gtggtacgcg ccagtgttga tggtgtaggt 9900gcagttgctc atgacggacc agtttacggt ctgggtgcca tggcccacgg tttccaggta 9960gcggagacgc gagtaggccc gcgtctcgaa gatgtagtcg ttgcaggtcc gcagcaggta10020ctggtagccc accagcagat gcggcggcgg ctggcggtag aggggccacc gctgggtggc10080gggggcgttg ggggcgagat cttccaacat gaggcggtga tagccgtaga tgtagcgcga10140catccaagtg atgccgctgg ccgtggtgct ggcgcgggcg tagtcgcgaa cgcggttcca10200gatgtttcgc agcggctgga agtactcgat ggtggggcga ctctgccccg tgaggcgggc10260gcagtcggcg atgctctacg gggaaaaaga agggccagtg aacaaccgcc ttccgtagcc10320ggaggagaac gcaagggggt caaagaccac cgaggctcgg gttcgaaacc cgggtggcgg10380cccgaatacg gagggcggtt ttttgctttt ttctcagatg catcccgtgc tgcggcagat10440gcgtccgaac gcggggtccc agtccccggc ggtgcctgcg gccgtgacgg cggcttctac10500ggccacgtcg cgctccaccc cgcctaccac ggcccaggcg gcggtggctc tgcgcggcgc10560aggggaaccc gaagcagagg cggtgttgga cgtggaggag ggccaggggt tggctcggct10620gggggccctg agtcccgagc ggcacccgcg cgtggctctg aagcgcgacg cggcggaggc10680gtacgtgccg cggagcaatc tgtttcgcga ccgcagcggc gaggaggccg aggagatgcg10740agacttgcgt tttcgggcgg ggagggagtt gcgtcacggg ctggaccggc agagggttct10800gagagaggag gactttgagg cggacgagcg cacgggggtg agtcccgcgc gggctcacgt10860ggcggccgcc aacctggtga gcgcgtacga gcagacggtc aaggaggaga tgaacttcca10920gaagagcttc aatcatcacg tgcgcacgct gattgcgcgc gaagaggtgg ccatcggcct10980catgcatctg tgggattttg tggaggcgta cgttcagaac cccagcagca agccgctgac11040ggctcagctg ttcctcatcg tgcaacatag tcgagacaac gaaacgttca gggaggccat11100gctgaacatt gcagagcctg aggggcgctg gctcttggat ctcattaaca tcttgcagag11160tatcgtagtg caggagcgct cgctgagcct ggccgacaag gtggctgcca tcaactacag11220catgctgtcg ctgggcaaat tttacgcccg caagatctac aagtctccgt tcgtccccat11280agacaaggag gtgaagatag acagctttta catgcgcatg gcgctcaagg tgctgactct11340aagcgacgac ctgggggtgt accgcaacga ccgcatacac aaggcggtga gcgccagccg11400ccggcgcgag ctgagcgacc gcgagctttt gcacagcctg catcgggcgt tgactggtgc11460cggcagcgcc gaggcggccg agtactttga cgccggagcg gacttgcgct ggcagccatc11520ccgacgcgcg ctggaggcgg ctggcgtcgg ggagtacggg gtcgaggacg acgatgaagc11580
ggacgacgag ttgggcattg acttgtagcc gtttttcgtt agatatgtcg gcgaacgagc11640cgtctgcggc cgccatggtg acggcggcgg gcgcgcccca ggacccggcc acgcgcgcgg11700cgctgcagag tcagccttcc ggagtgacgc ccgcggacga ctggtccgag gccatgcgtc11760gcatcctggc gctgacggcg cgcaaccccg aggcttttcg gcagcagccg caggcaaacc11820ggtttgcggc cattttggaa gcggtggtgc cctccagacc caaccccacc cacgaaaagg11880tgctggccat cgtcaacgcc ctggcggaga ccaaggccat ccgcccagac gaggccgggc11940aggtttacaa cgcgctgcta gaaagggtgg gacgctacaa cagctccaac gtgcagacca12000atctggaccg cttggtgacg gacgtgaagg aggccgtagc ccagcgagag cggtttttca12060aggaagccaa tctgggctcg ctggtggccc tcaacgcctt cctgagcacg ctgccggcga12120acgtgccccg cggtcaggag gactacgtga actttctgag cgccctccgc ctgatggtgg12180ccgaggtgcc gcagagcgag gtgtaccagt ctggccccaa ctactacttc cagacctccc12240ggcagggcct gcagacggta aacctgacgc aggcctttca gaacctgcag ggcctttggg12300gggtgcgcgc tccgctgggc gaccgcagca cggtgtccag cctgctgacc cccaatgccc12360ggctgctctt gcttctcatt gctccgttca ccgacagcgg ttccatcagc cgcgactctt12420acctgggaca cctgctcacc ctgtaccggg aggccatcgg gcaggcgcgg gtggacgagc12480agacgtacca ggaaatcacc agcgtgagcc gcgcgctggg gcaggaggac acgggcagct12540tggaggcgac tctgaacttc ctgctgacca accggcggca gcgcctacct ccccagtacg12600cgctgaacgc ggaggaggag cgcatcctgc gtttcgtgca gcagagcacc gcgctgtact12660tgatgcggga aggcgcctct cccagcgctt cgctggacat gacggcggcc aacatggagc12720catcgttcta cgccgccaac cgtcccttcg tcaaccggct aatggactat ttgcatcggg12780cggcggccct gaacccggaa tactttacta acgtcatcct gaacgaccgt tggctgccac12840ctcccggctt ctacacgggg gagttcgacc tcccggaggc caacgacggt ttcatgtggg12900acgacgtgga cagcgtgttc ctgcccggca agaaggaggc gggtgactct cagagccacc12960gcgcgagcct cgcagacctg ggggcgaccg ggcccgcgtc tccgctgcct cgcctgccga13020gcgccagcag cgccagcgtg gggcgggtga gccgtccgcg cctcagcggt gaggaggact13080ggtggaacga tccgctgctc cgtccggccc gcaacaaaaa cttccccaac aacgggatag13140aggatttggt agacaaaatg aaccgttgga agacgtatgc ccaggagcat cgggagtggc13200aggcgaggca acccatgggc cctgttctgc cgccctctcg gcgcccgcgc agggacgaag13260acgccgacga ttcagccgat gacagcagcg tgttggatct gggcgggagc gggaacccct13320ttgcccacct gcaacctcgc ggcgtgggtc ggcggtggcg ctaggaaaaa aaattattaa13380aagcacttac cagagccatg gtaagaagag caacaaaggt gtgtcctgct ttcttcccgg13440tagcaaaatg cgtcgggcgg tggcagttcc ctccgcggca atggcgttag gcccgccccc13500ttcttacgaa agcgtgatgg cagcggccac cctgcaagcg ccgttggaga atccttacgt13560gccgccgcga tacctggagc ctacgggcgg gagaaacagc attcgttact cggagctgac13620gcccctgtac gacaccaccc gcctgtacct ggtggacaac aagtcagcag atatcgccac13680cttgaactac cagaacgacc acagcaactt tctcacgtcc gtggtgcaga acagcgacta13740cacgcccgcc gaagcgagca cgcagaccat taacttggac gaccgctcgc gctggggcgg13800ggacttgaaa accattctgc acactaacat gcccaacgtg aacgagttca tgtttaccaa13860ctcgttcagg gctaaactta tggtggcgca cgaggccgac aaggacccgg tttatgagtg13920ggtgcagctg acgctgccgg aggggaactt ttcagagatt atgaccatag acctgatgaa13980caacgccatt atcgaccact acctggcggt agccagacag cagggggtga aagaaagcga14040gatcggcgtc aagtttgaca cgcgcaactt tcgtctgggc tgggacccgg agacggggct14100tgtgatgccg ggggtgtaca cgaacgaagc tttccatccc gacgtggtcc tcttgccggg14160ctgcggggtg gactttacct acagccggtt aaacaacctg ctaggcatac gcaagagaat14220gccctttcag gaagggtttc agatcctgta cgaggacctg gagggcggta acatcccggc14280cctgctggac gtgccggcgt acgaggagag catcgccaac gcaagggagg cggcgatcag14340
gggcgataat ttcgcggcgc agccccaggc ggctccaacc ataaaacccg ttttggaaga14400ctccaaaggg cggagctaca acgtaatagc caacaccaac aacacggctt acaggagctg14460gtatctggct tataactacg gcgacccgga gaagggggtt agggcctgga ccctgctcac14520cactccggac gtgacgtgcg gttcagagca ggtctactgg tcgctgcctg acatgtacgt14580ggaccctgtg acgtttcgct ccacgcagca agttagcaac tacccagtgg tgggagcgga14640gcttatgccg attcacagca agagctttta caacgagcag gccgtctact cacagctcat14700tcgtcagacc accgccctaa cgcacgtttt caaccgcttc cccgagaacc aaatcctagt14760gcgacctcca gcgcccacca tcaccaccgt cagcgagaac gtgcccgctc taaccgatca14820cgggacgctg cctttgcaga acagcatccg cggagttcag cgagttacca tcacggacgc14880ccgtcgtcgg acctgtccct acgtctacaa agccttggga atcgtggccc cgcgcgtcct14940gtcgagtcgc actttctaga tgtccatcct catctctccc agcaacaata ccggttgggg15000tctgggcgtg accaaaatgt acggaggcgc caaacgacgg tccccacaac atcccgtgcg15060agtgcgcggg cactttagag ccccatgggg gtcgcacacg cgcgggcgca ccggccgaac15120caccgtcgac gacgtgatcg atagcgtggt ggccgacgcc cgcaactacc agcccgctcg15180atccacggtg gacgaagtca tcgacggcgt ggtggccgac gccagggcct acgcccgcag15240aaagtctcgt ctgcgccgcc gccgttcgct aaagcgcccc acggccgcca tgaaagccgc15300tcgctctctg ctgcgtcgcg cacgtatcgt gggtcgccgc gccgccagac gcgcagccgc15360caacgccgcc gccggccgag tgcgccgccg ggccgcccag caggccgccg ccgccatctc15420cagtctatcc gccccccgac gcgggaatgt gtactgggtc agggactcgg ccaccggcgt15480gcgagttccc gtgagaaccc gtcctcctcg tccctgaata aaaagttcta agcccaatcg15540gtgttccgtt gtgtgttcag ctcgtcatga ccaaacgcaa gtttaaagag gagctgctgc15600aagcgctggt ccccgaaatc tatgcgccgg cgccggacgt gaaaccgcgt cgcgtgaaac15660gcgtgaagaa gcaggaaaag ctagagacaa aagaggaggc ggtggcgttg ggagacgggg15720aggtggagtt tgtgcgctcg ttcgcgccgc gtcggcgagt gaattggaag gggcgcaagg15780tgcaacgggt gctgcgtccc ggcacggtgg tgtctttcac cccgggtgaa aaatccgcct15840ggaagggcat aaagcgcgtg tacgatgagg tgtacgggga cgaagacatt ctggagcagg15900cgctggatag aagcggggag tttgcttacg gcaagagggc gaggacgggc gagatcgcca15960tcccgctgga cacttccaac cccaccccca gtctgaaacc cgtgacgctg caacaggtgt16020tgccggtgag cgccccctcg cgacgcggca taaaacgcga gggcggcgag ctgcagccca16080ccatgcagct cctggttccc aagaggcaga aactagagga cgtactggac atgataaaaa16140tggagcccga cgtgcagccc gatattaaaa tccgtcccat caaagaagtg gcgccgggaa16200tgggcgtgca gaccgtggac atccagattc ccatgaccag cgccgcacag gcggtagagg16260ccatgcagac cgacgtgggg atgatgacgg acctgcccgc agctgctgcc gccgtggcca16320gcgccgcgac gcaaacggaa gccggcatgc agaccgaccc gtggacggag gcgcccgtgc16380agccggccag aagacgcgtc agacggacgt acggccccgt ttctggcata atgccggagt16440acgcgctgca tccttccatc atccccaccc ccggctaccg ggggcgcacc taccgtccgc16500gacgcagcac cactcgccgc cgtcgccgca cggcacgagt cgccaccgcc agagtgagac16560gcgtaacgac acgtcgcggc cgccgcttga ccctgcccgt ggtgcgctac catcccagca16620ttctttaaaa aaccgctcct acgttgcaga tgggcaagct tacttgtcga ctccgtatgg16680ccgtgcccgg ctaccgagga agatcccgcc gacgacggac tttgggaggc agcggtttgc16740gccgccgtcg ggcggttcac cggcgcctca agggaggcat tctgccggcc ctgatcccca16800taatcgccgc agccatcggg gccattcccg gaatcgccag cgtagcggtg caggctagcc16860agcgccactg attttactaa ccctgtcggt cgcgccgtct ctttcggcag actcaacgcc16920cagcatggaa gacatcaatt tctcctctct ggccccgcgg cacggcacgc ggccgtatat16980ggggacgtgg agcgagatcg gcacgaacca gatgaacggg ggcgctttca attggagcgg17040tgtgtggagc ggcttgaaaa atttcggttc cactctgaaa acttacggca accgggtgtg17100
gaactccagc acggggcaga tgctgaggga caagctaaag gacacgcagt ttcagcaaaa17160ggtggtggac ggcatcgctt cgggcctcaa cggcgccgtc gacctggcca accaggccat17220tcaaaaggaa attaacagcc gcctggagcc gcggccgcag gtggaggaga acctgccccc17280tctggaggcg ctgcccccca agggagagaa gcgcccgcgg cccgacatgg aggagacgct17340agttactaag agcgaggagc cgccatcata cgaggaggcg gtgggtagct cgcagctgcc17400gtccctcacg ctgaagccca ccacctatcc catgaccaag cccatcgcct ccatggcgcg17460ccccgtggga gtcgacccgc ccatcgacgc ggtggccact ttggacctgc cgcgccccga17520acccggcaac cgcgtgcctc ccgtccccat cgctccgccg gtttctcgcc ccgccatccg17580ccccgtcgcc gtggccactc cccgctatcc gagccgcaac gccaactggc agaccaccct17640caacagtatt gtcggactgg gggtgaagtc tctgaagcgc cgtcgctgtt tttaaagcac17700aatttattaa acgagtagcc ctgtcttaat ccatcgttgt atgtgtgcct atatcacgcg17760ttcagagcct gaccgtccgt caagatggcc actccgtcga tgatgccgca gtggtcgtac17820atgcacatcg ccgggcagga cgcctcggag tacctgagcc cgggtctggt gcagtttgcc17880cgtgcgacgg aaacctactt ctcactgggc aacaagttca ggaaccccac cgtggcgccc17940acccacgacg tcaccaccga tcggtcccag cgactgacaa tccgcttcgt ccccgtggac18000aaggaagaca ccgcttactc ctacaaaacc cgcttcacgc tggccgtggg cgacaaccgg18060gtgctagaca tggccagtac ctactttgac atccgcggcg tgatcgaccg cggacctagc18120ttcaagcctt actccggcac ggcttacaac tcactggctc ccaaaggggc gcccaacaac18180agccaatgga acgccacaga taacgggaac aagccagtgt gttttgctca ggcagctttt18240ataggtcaaa gcattacaaa agacggagtg caaatacaga actcagaaaa tcaacaggct18300gctgccgaca aaacttacca accagagcct caaattggag tttccacctg ggataccaac18360gttaccagta acgctgccgg acgagtgtta aaagccacca ctcccatgct gccatgttac18420ggttcatatg ccaatcccac taatccaaac gggggtcagg caaaaacaga aggagacatt18480tcgctaaact ttttcacaac aactgcggca gcagacaata atcccaaagt ggttctttac18540agcgaagatg taaaccttca agcccccgat actcacttag tatataagcc aacggtggga18600gaaaacgtta tcgccgcaga agccctgcta acgcagcagg cgtgtcccaa cagagcaaac18660tacataggtt tccgagataa ctttatcggt ttaatgtatt ataacagcac agggaacatg18720ggagttctgg caggtcaggc ctcgcagtta aacgcagttg tagacctgca agatcgaaac18780acggaactgt cctatcagct aatgctagat gctctgggtg acagaactcg atatttctca18840atgtggaatc aggccgtgga cagctacgat ccagacgtta ggattatcga gaaccatggg18900gtggaagacg agctgcccaa ttactgtttt ccactcccag gcatgggtat ttttaactcc18960tacaaggggg taaaaccaca aaatggcggt aatggtaact gggaagcaaa cggggaccta19020tcaaatgcca atgagatcgc tttaggaaac atttttgcca tggaaattaa cctccacgca19080aacctgtggc gcagcttctt gtacagcaat gtggcgctgt acctgccaga cagctataaa19140ttcactcccg ctaacatcac tctgcccgcc aaccaaaaca cctacgagta tatcaacggg19200cgcgtcactt ctccaaccct ggtggacacc tttgttaaca ttggagcccg atggtcgccg19260gatcccatgg acaacgtcaa cccctttaac catcaccgga acgcgggcct ccgttaccgc19320tccatgctgc tgggaaatgg acgcgtggtg cctttccaca tacaagtgcc gcaaaaattt19380ttcgcgatta agaacctcct gcttttgccc ggctcctaca cttacgagtg gagcttcaga19440aaagacgtga acatgattct gcagagcacc ctgggcaatg atcttcgagt ggacggggcc19500agcgtccgca ttgacagcgt caacttgtac gccaactttt tccccatggc gcacaacacc19560gcttctacct tggaagccat gctgcgaaac gacaccaacg accagtcgtt taacgactac19620ctcagcgcgg ccaacatgct ttatcccatt ccggccaacg ccaccaacgt tcccatttcc19680attccctccc gcaactgggc ggccttccgg ggatggagct tcacccgcct taaagccaag19740gaaacgcctt ccttgggctc cggctttgac ccctactttg tgtactcagg caccattcct19800tacctggacg gcagctttta cctcaaccac actttcaaac gtctgtccat catgttcgat19860
tcttccgtaa gttggccggg caacgaccgc ctcctgacgc cgaacgagtt cgaaattaag19920cgcattgtgg acggggaagg ctacaacgtg gctcaaagta acatgaccaa agactggttt19980ttaattcaaa tgctcagcca ctacaacatc ggctaccaag gcttctatgt tcccgagggc20040tacaaggatc ggatgtattc tttcttccga aactttcagc ccatgagccg ccaggtgccg20100gatcccaccg ctgccggcta tcaagccgtt cccctgccca gacaacacaa caactcgggc20160tttgtggggt acatgggccc gaccatgcgc gaaggacagc catacccggc caactacccc20220tatcccctga tcggcgctac cgccgtcccc gccattaccc agaaaaagtt tttgtgcgac20280cgcgtcatgt ggcgcatacc tttttccagc aactttatgt caatgggggc cctgaccgac20340ctcggacaga acatgcttta cgctaactcc gcccatgccc tggatatgac ttttgaggtg20400gaccccatga acgagcccac gttgctgtac atgctttttg aggtgttcga cgtggtcaga20460gtgcaccagc cgcaccgcgg tattatcgag gccgtgtacc tgcgcacccc cttctctgcg20520ggcaatgcca ccacataagc cgctgaacta gctggttttt accccagatc ccatgggctc20580cacggaagac gaactgcggg ccattgtgcg agacctgggc tgcggaccct acttcctggg20640cacctttgac aagcggtttc ccgggttcgt gtctcctcgc aaactcgcgt gcgcgatcgt20700gaataccgcc ggccgagaga ccggaggaga gcattggcta gctctgggct ggaacccccg20760ctcgtccacg tttttcctgt tcgacccctt tggcttttca gaccaacgct tgaagcagat20820ctatgcattt gaatatgagg gtctactcaa gcgaagcgcg ctggcctcct ccgccgatca20880ctgtctaacc ctggtaaaga gcactcagac ggttcagggc cctcacagcg ccgcctgtgg20940ccttttttgt tgcatgtttt tgcacgcctt tgtgaactgg ccggacaccc ccatggaaaa21000caaccccacc atggacctcc tgactggcgt tcccaactcc atgctccaaa gccccagcgt21060gcagaccacc ctcctccaaa accagaaaaa tctgtacgcc tttctgcaca agcactctcc21120ctactttcgc cgccatcggg aacaaataga aaatgcaacc gcgtttaaca aaactctgta21180acgtttaata aatgaacttt ttattgaact ggaaaacggg tttgtgattt ttaaaaatca21240aaggggttga gctggacatc catgtgggag gccggaaggg tggtgttctt gtactggtac21300ttgggcagcc acttaaactc tggaatcaca aacttgggca gcggtatttc tgggaagttg21360tcgtgccaca gctggcgggt cagctgaagt gcctgcagaa catcgggggc ggagatcttg21420aagtcgcagt ttatctggtt cacggcacgc gcgttgcggt acatgggatt ggcacactga21480aacaccagca ggctgggatt cttgatgcta gccagggcca cggcgtcggt cacgtcaccg21540gtgtcttcta tgttggacag cgaaaaaggc gtgactttgc aaagctggcg tcccgcgcga21600ggcacgcaat ctcccaggta gttgcactca cagcggatgg gcagaagaag atgcttgtgg21660ccgcgggtca tgtagggata ggccgctgcc ataaaagctt cgatctgcct gaaagcctgc21720ttggccttgt gcccttcggt ataaaaaaca ccgcaggact tgttggaaaa ggtattactg21780gcgcaagcgg catcgtgaaa gcaagcgcgt gcgtcttcgt ttcgtaactg caccacgctg21840cggccccacc ggttctgaat caccttggcc ctgccggggt tttccttgag agcgcgctgg21900ccggcttcgc tgcccacatc catttccacg acatgctcct tgttaatcat ggccagaccg21960tggaggcagc gcagctcctc gtcatcgtcg gtgcagtgat gctcccacac gacgcagcca22020gtgggctccc acttgggctt ggaggcctcg gcaatgccag aatacaggag aacgtagtgg22080tgcagaaaac gtcccatcat ggtgccaaag gttttctggc tgctgaaggt catcgggcag22140tacctccagt cctcgttaag ccaagtgttg cagatcttcc tgaagaccgt gtactgatcg22200ggcataaagt ggaactcatt gcgctcggtc ttgtcgatct tatacttttc catcagacta22260tgcataatct ccatgccctt ttcccaggcg caaacaatct tggtgctaca cgggttaggt22320atggccaaag tggttggcct ctgaggcggc gcttgttctt cctcttgagc cctctcccga22380ctgacggggg ttgaaagagg gtgccccttg gggaacggct tgaacacggt ctggcccgag22440gcgtcccgaa gaatctgcat cgggggattg ctggccgtca tggcgatgat ctgaccccgg22500ggctcctcca cttcgtcctc ctcgggactt tcctcgtgct tttcggggga cggtacggga22560gtagggggaa gagcgcggcg cgccttcttc ttgggcggca gttccggagc ctgctcttga22620
cgactggcca ttgtcttctc ctaggcaaga aaaacaagat ggaagactct ttctcctcct22680cctcgtcaac gtcagaaagc gagtcttcca ccttaagcgc cgagaactcc cagcgcatag22740aatccgatgt gggctacgag actccccccg cgaacttttc gccgcccccc ataaacacta22800acgggtggac ggactacctg gccctaggag acgtactgct gaagcacatc aggcggcaga22860gcgttatcgt gcaagatgct ctcaccgagc gactcgcggt tccgctggaa gtggcggaac22920ttagcgccgc ctacgagcga accctcttct ccccaaagac tccccccaag aggcaggcta22980acggcacctg cgagcctaac cctcgactca acttctaccc tgcctttgcc gtgccagagg23040tactggctac gtaccacatt tttttccaaa accacaaaat ccctctctcg tgccgcgcca23100accgcaccaa agccgatcgc gtgctgcgac tggaggaagg ggctcgcata cctgagattg23160cgtgtctgga ggaagtccca aaaatctttg aaggtctggg ccgcgacgaa aagcgagcag23220caaacgctct ggaagagaac gcagagagtc acaacagcgc cttggtagaa ctcgagggcg23280acaacgccag actggccgtc ctcaaacggt ccatagaagt cacgcacttc gcctaccccg23340ccgttaacct ccctccaaaa gttatgacag cggtcatgga ctcgctgctc ataaagcgcg23400ctcagccctt agacccagag cacgaaaaca acagtgacga aggaaaaccg gtggtttctg23460atgaggagtt gagcaagtgg ctgtcctcca acgaccccgc cacgttggag gaacgaagaa23520aaaccatgat ggccgtggtg ctagttaccg tgcaattaga atgtctgcag aggttctttt23580cccacccaga gaccctgaga aaagtggagg aaacgctgca ctacacattt aggcacggct23640acgtgaagca agcctgcaag atttccaacg tagaacttag caacctcatc tcctacctgg23700ggatcttgca cgaaaaccgc ctcggacaaa acgtgctgca cagcacactg aaaggagaag23760cccgccgaga ctatgtgcga gactgcgtgt tcctagcgct agtgtacacc tggcagagcg23820gaatgggagt ctggcagcag tgcctggagg acgaaaacct caaagagctt gaaaagctgc23880tggtgcgctc cagaagggca ctgtggacca gttttgacga gcgcaccgcc gcgcgagacc23940tagctgatat tatttttcct cccaagctgg tgcagactct ccgggaagga ctgccagatt24000ttatgagtca aagcatcttg caaaacttcc gctctttcat cttggaacgc tcgggaatct24060tgcccgccac tagctgcgcc ctacccacag attttgtgcc tctccactac cgcgaatgcc24120caccgccgct gtggccgtac acttacttgc ttaaactggc caactttcta atgttccact24180ctgacctggc agaagacgtt agcggcgagg ggctgctaga atgccactgc cgctgcaacc24240tgtgcacccc ccaccgctct ctagtatgca acactcccct gctcaatgag acccagatca24300tcggtacctt tgaaatccag ggaccctccg acgcggaaaa cggcaagcag gggtctgggc24360taaaactcac agccggactg tggacctccg cctacttgcg caaatttgta ccagaagact24420atcacgccca ccaaattaaa ttttacgaaa accaatcaaa accacccaaa agcgagttaa24480cggcttgcgt cattacgcag agcagcatag ttgggcagtt gcaagccatt aacaaagcgc24540ggcaagagtt tctcctaaaa aaaggaaaag gggtctactt ggacccccag accggcgagg24600aactcaacgg accctcctca gtcgcaggtt gtgtgcccca tgccgcccaa aaagaacacc24660tcgcagtgga acatgccaga gacggaggaa gaggagtgga gcagtgtgag caacagcgaa24720acggaggaag agccgtggcc cgaggggtgc aacggggaag aggacacgga gggacggcga24780agtcttcgcc gaagaactct cgccgctgcc cccgaagtcc cagccggccg cctcggccca24840agatcccgca cacacccgta gatgggatag caagaccaaa aagccgggta agagaaacgc24900tcgcccccgc cagggctacc gctcgtggag aaagcacaaa aactgcatct tatcgtgctt24960gctccagtgc ggcggagacg tttcgttcac ccgtagatac ttgcttttta acaaaggggt25020ggccgtcccc cgtaacgtcc tccactacta ccgtcactct tacagctccg aagcggacgg25080ctaagaaaac gcagcagttg ccggcgggag gactgcgtct cagcgcccga gaacccccag25140ccaccaggga gctccgaaac cgcatatttc ccaccctcta cgctatcttt cagcaaagcc25200gggggcagca gcaagaactg aaaataaaaa accgcacgct gaggtcgctt acccgaagct25260gcctctatca caagagcgaa gagcagctgc agcgaaccct ggaggacgca gaagcgctgt25320tccagaagta ctgcgcgacc accctaaata actaaaaaag cccgcgcgcg ggacttcaaa25380
ccgtctgacg tcaccagccg cgcgccaaaa tgagcaaaga gattcccacg ccttacatgt25440ggagttacca gccgcagatg ggattagccg ccggcgccgc ccaggattac tccacgaaaa25500tgaactggct cagcgccggg ccccacatga tttcccgcgt aaacgacatt cgcgcccacc25560gcaatcagct attgttagaa caggctgctc tgaccgccac gccccgtaat aacctgaacc25620ctcccagctg gccagctgcc ctggtgtacc aggaaacgcc tccacccacc agcgtacttt25680tgccccgtga cgcccaggcg gaagtccaga tgactaacgc gggcgcgcaa ttagcgggcg25740gatcccggtt tcggtacaga gttcacggcg ccgcacccta tagcccaggt ataaagaggc25800tgatcattcg aggcagaggt gtccagctca acgacgagac agtgagctct tcgcttggtc25860tacgaccaga cggagtgttc cagctcgcgg gctcgggccg ctcttcgttc acgcctcgcc25920aggcatacct gactctgcag agctctgcct ctcagcctcg ctcgggagga atcggacccc25980ttcagtttgt ggaggagttt gtgccctcgg tctactttca gcctttctcc ggatcgcccg26040gccagtaccc ggacgagttc atccccaact tcgacgcggt gagtgactct gtggacggtt26100atgactgatg tcgagcccgc ttcagtgcta gtggaacaag cgcggctcaa tcacctggtt26160cgttgccgcc gccgctgctg cgtggctcgc gacttgagct tagctctcaa gtttgtaaaa26220aacccgtccg aaaccgggag cgctgtgcac gggttggagc tagtgggtcc tgagaaggcc26280accatccacg ttctcagaaa ctttgtggaa aaacccattt tggttaaacg agatcagggg26340ccttttgtaa tcagcttact ctgcacctgt aaccatgttg accttcacga ctattttatg26400gatcatttgt gcgctgaatt caataagtaa agcgaattct taccaagatt atgatgtcca26460tgactgttcc tcgccactat acgatgttgt gccagtaaac tctcttgtcg acatctatct26520gaactgttcc ttttggtccg cacagcttac ttggtactac ggtgacaccg tcctttctgg26580ctcactgggc agctcacacg gaataacact tcacctcttt tcgccgtttc gatacggaaa26640ctacagctgt cgtgccggta cctgcctcca cgttttcaat cttcagccct gtccaccgac26700caaacttgta tttgtcgact ctaagcactt acagctcaac tgcagcattc taggccccag26760tatcttgtgg acatacaata aaatcaggtt ggtggaattt gtctactacc cacccagcgc26820ccgcggtttt ggggaaattc ctttccagat ctactacaac tatcttgcca cacattatgc26880aagtcaacag caactaaact tgcaagcacc cttcacgcca ggagagtact cctgtcacgt26940aggctcctgc acagaaactt ttattctctt caacagatct tctgccattg aacgcttcac27000tactaactac tttagaaacc aagttgtgct tttcactgac gaaaccccta acgtcaccct27060ggactgtgca tgtttttctc atgacaccgt aacttggact cttaacaata ctctctggct27120cgcgttcgat aaccaaagct tgattgttaa aaattttgat ttaaccttta ctaaaccctc27180tcctcgcgaa atagttatct ttgctccttt taatccaaaa actaccttag cctgtcaggt27240tttgtttaag ccttgccaaa caaactttaa gtttgtttat ttgcctccgc aatctgtcaa27300actcatagaa aaatacaaca aagcgcccgt cttggctcct aaaaccttct accactggct27360aacctacacg gggctgtttg cactaattgt ttttttccta attaacattt ttatatgttt27420cttgccttcc tccttctttt cgcgaacacc gttgccgcag aaagacctct ccttattact27480gtagcgcttg ctatacaaaa ccaagagtgg tcaaccgtgc tctcaatcta ttttcaattt27540ttcattttgt ccttaatact ttctcttatt gtcgttaaca atgatctgga gcattggtct27600cgcctttttt tggctgctta gtgcaaaagc cactattttt cacaggtatg tggaagaagg27660aactagcacc ctctttacga tacctgaaac aattaaggcg gctgatgaag tttcttggta27720caaaggctcg ctctcagacg gcaaccactc attctcagga cagacccttt gcatccaaga27780aacttatttt aaatcagaac tacaatacag ctgcataaaa aactttttcc atctctacaa27840catctcaaaa ccctatgagg gtatttacaa tgccaaggtt tcagacaact ccagcacacg27900gaacttttac tttaatctga cagttattaa agcaatttcc attcctatct gtgagtttag27960ctcccagttt ctttctgaaa cctactgttt aattactata aactgcacta aaaatcgcct28020tcacaccacc ataatctaca atcacacaca atcaccttgg gttttaaacc taaaattttc28080tccacacatg ccttcgcaat ttctcacgca agttaccgtc tctaacataa gcaagcagtt28140
tggcttttac tatcctttcc acgaactgtg cgaaataatt gaagccgaat atgaaccaga28200ctactttact tacattgcca ttggtgtaat cgttgtttgc ctttgctttg ttattggggg28260gtgtgtttat ttgtacattc agagaaaaat attgctctcg ctgtgctcct gcggttacaa28320agcagaagaa agaattaaaa tctctacact ttattaatgt tttccagaaa tggcaaaact28380aacgctccta cttttgcttc tcacgccggt gacgcttttt accatcactt tttctgccgc28440cgccacactc gaacctcaat gtttgccacc ggttgaagtc tactttgtct acgtgttgct28500gtgctgcgtt agcgtttgca gtataacatg ttttaccttt gtttttcttc agtgcattga28560ctacttctgg gtcagactct actaccgcag acacgcgcct cagtatcaaa atcaacaaat28620tgccagacta ctcggtctgc catgattgtc ttgtatttta ccctgatttt ttttcacctt28680acttgcgctt gtgattttca cttcactcaa ttttggaaaa cgcaatgctt cgacccgcgc28740ctctccaacg actggatgat ggctcttgca attgccacgc ttggggcgtt tggacttttt28800agtggttttg ctttgcatta caaatttaag actccatgga cacatggctt tctttcagat28860tttccagtta cacctactcc gccgcctccc ccggccatcg acgtgcctca ggttccctca28920ccttctccat ctgtctgcag ctactttcat ctgtaatggc cgacctagaa tttgacggag28980tgcaatctga gcaaagggct atacacttcc aacgccagtc ggaccgcgaa cgcaaaaaca29040gagagctgca aaccatacaa aacacccacc aatgtaaacg cgggatattt tgtattgtaa29100aacaagctaa gctccactac gagcttctat ctggcaacga ccacgagctc caatacgtgg29160tcgatcagca gcgtcaaacc tgtgtattct taattggagt ttcccccatt aaagttactc29220aaaccaaggg tgaaaccaag ggaaccataa ggtgctcatg tcacctgtca gaatgccttt29280acactctagt taaaacccta tgtggcttac atgattctat cccctttaat taaataaact29340tactttaaat ctgcaatcac ttcttcgtcc ttgtttttgt cgccatccag cagcaccacc29400ttcccctctt cccaactttc atagcatatt ttccgaaaag aggcgtactt tcgccacacc29460ttaaagggaa cgtttacttc gctttcaagc tctcccacga ttttcattgc agatatgaaa29520cgcgccaaag tggaagaagg atttaacccc gtttatccct atggatattc tactccgact29580gacgtggctc ctccctttgt agcctctgac ggtcttcaag aaaacccacc tggggtcttg29640tccctaaaaa tatccaaacc tttaactttt aatgcctcca aggctctaag cctggctatt29700ggtccaggat taaaaattca agatggtaaa ctagtggggg agggacaagc aattcttgca29760aacctgccgc ttcaaatcac caacaacaca atttcactac gttttgggaa cacacttgcc29820ttgaatgaca ataatgaact ccaaaccaca ctaaaatctt catcgcccct taaaatcaca29880gaccagactc tgtcccttaa cataggggac agccttgcaa ttaaagatga caaactagaa29940agcgctcttc aagcgaccct cccactctcc attagcaaca acaccatcag cctcaacgtg30000ggcaccggac tcaccataaa tggaaacgtt ttacaagctg ttcccttaaa tgctctaagt30060cccctaacta tttccaacaa taacatcagc ctgcgctatg gcagttccct gacggtgctt30120aacaatgaac tgcaaagcaa cctcacagtt cactcccctt taaaactcaa ctccaacaac30180tcaatttctc tcaacactct atctccgttt agaatcgaga atggtttcct cacgctctat30240ttgggaacaa aatctggctt gctagttcaa aacagtggct taaaagttca agcgggctac30300ggcctgcaag taacagacac caatgctctc acattaagat atctcgctcc actgaccatt30360ccagactcgg gctcagaaca aggcattctt aaagtaaaca ctggacaggg cctaagtgtg30420aaccaagctg gagcgcttga aacatcccta ggaggtggat taaaatatgc tgataacaaa30480ataacctttg atacaggaaa cggactgaca ttatctgaaa ataaacttgc agtagctgca30540ggtagtggtc taacttttag agatggtgcc ttggtagcca cgggaaccgc atttacgcaa30600acactgtgga ctacggctga tccgtctccc aactgcacaa ttatacagga ccgcgacaca30660aaatttactt tggcgcttac cattagtggg agccaagtgc tggggacggt ttccattatt30720ggagtaaaag gccccctttc aagtagcata ccgtcagcta ccgttacagt acaacttaac30780tttgattcca acggagccct attgagctcc tcttcactta aaggttactg ggggtatcgc30840caaggtccct caattgaccc ttaccccata attaatgcct taaactttat gccaaactca30900
ctggcttatc ccccgggaca agaaatccaa gcaaaatgta acatgtacgt ttctactttt30960ttacgaggaa atccacaaag accaatagtt ttaaacatca cttttaataa tcaaaccagc31020gggttttcca ttagatttac atggacaaat ttaaccacag gagaagcatt tgcaatgccc31080ccatgcactt tttcctacat tgctgaacaa caataaacta tgtaaccctc accgttaacc31140cgcctccgcc cttccatttt attttataaa ccacccgatc caccttttca gcagtaaaca31200attgcatgtc agtaggggca gtaaaacttt tgggagttaa aatccacaca ggttcttcac31260aagctaagcg aaaatcagtt acacttataa aaccatcgct aacatcggac aaagacaagc31320atgagtccaa agcttccggt tctggatcag atttttgttc attaacagcg ggagaaacag31380cttctggagg attttccatc tccatctcct tcatcagttc caccatgtcc accgtggtca31440tctgggacga gaacgacagt tgtcatacac ctcataagtc accggtcgat gacgaacgta31500cagatctcga agaatgtcct gtcgccgcct ttcggcagca ctgggccgaa ggcgaaagcg31560cccatgttta acaatggcca gcaccgcccg cttcatcagg cgcctagttc ttttagcgca31620acagcgcatg cgcagctcgc taagactggc gcaagaaaca cagcacagaa ccaccagatt31680gttcatgatc ccataagcgt gctgacacca gcccatacta acaaattgtt tcactattct31740agcatgaatg tcatatctga tgttcaagta aattaaatgg cgccccctta tgtaaacact31800tcccacgtac aacacctcct ttggcatctg ataattaacc acctcccgat accaaataca31860tctctgatta atagtcgccc cgtacactac ccgattaaac caagttgcca acataatccc31920ccctgccata cactgcaaag aacctggacg gctacaatga cagtgcaaag tccacacctc31980gttgccatgg ataactgagg aacgccttaa gtcaatagtg gcacaactaa tacaaacatg32040taaatagtgt ttcaacaagt gccactcgta tgaggtgagt atcatgtccc agggaacggg32100ccactccata aacactgcaa aaccaacaca tcctaccatc ccccgcacgg cactcacatc32160gtgcatggtg ttcatatcac agtccggaag ctgaggacaa ggaaaagtct cgggagcatt32220ttcatagggc ggtagtgggt actccttgta ggggttcagt cggcaccggt atctcctcac32280cttctgggcc ataacacaca agttgagatc tgatttcaag gtactttctg aatgaaaacc32340aagtgctttc ccaacaatgt atccgatgtc ttcggtcccc gcgtcggtag cgctccttgc32400agtacacacg gaacaaccac tcacgcaggc ccagaagaca gttttccgcg gacggtgaca32460agttaatccc cctcagtctc agagccaata tagtttcttc cacagtagca taggccaaac32520ccaaccagga aacacaagct ggcacgtccc gttcaacggg aggacaagga agcagaggca32580gaggcatagg caaagcaaca gaatttttat tccaactggt cacgtagcac ttcaaacacc32640aggtcacgta aatggcagcg atcttgggtt tcctgatgga acataacagc aagatcaaac32700atgagacgat tctcaaggtg attaaccaca gctggaatta aatcctccac gcgcacattt32760agaaacacca gcaatacaaa agcccggttt tctccgggat ctatcatagc agcacagtca32820tcaattagtc ccaagtaatt ttcccgtttc caatctgtta taatttgcag aataatgccc32880tgtaaatcca agccggccat ggcgaaaagc tcagataatg cactttccac gtgcattcgt32940aaacacaccc tcatcttgtc aatccaaaaa gtcttcttct tgagaaacct gtagtaaatt33000aagaatcgcc aggttaggct cgatgcctac atcccggagc ttcattctca gcatgcactg33060caaatgatcc agcagatcag aacagcaatt agcagccagc tcatccccgg tttccagttc33120cggagttccc acggcaatta tcactcgaaa cgtgggacaa atcgaaataa catgagctcc33180cacgtgagca aaagccgtag ggccagtgca ataatcacag aaccagcgga aaaaagattg33240cagctcatgt ttcaaaaagc tctgcagatc aaaattcagc tcatgcaaat aacacagtaa33300agtttgcggt atagtaaccg aaaaccacac gggtcgacgt tcaaacatct cggcttacct33360aaaaaagaag cacattttta aaccacagtc gcttcctgaa caggaggaaa tatggtgcgg33420cgtaaaacca gacgcgccac cggatctccg gcagagccct gataatacag ccagctgtgg33480ttaaacagca aaacctttaa ttcggcaacg gttgaggtct ccacataatc agcgcccaca33540aaaatcccat ctcgaacttg ctcgcgtagg gagctaaaat ggccagtata gccccatggc33600acccgaacgc taatctgcaa gtatatgaga gccaccccat tcggcgggat cacaaaatca33660
gtcggagaaa acaacgtata caccccggac tgcaaaagct gttcaggcaa acgcccctgc33720ggtccctctc ggtacaccag caaagcctcg ggtaaagcag ccatgccaag cgcttaccgt33780gccaagagcg actcagacga aaaagtgtac tgaggcgctc agagcagcgg ctatatactc33840tacctgtgac gtcaagaacc gaaagtcaaa agttcacccg gcgcgcccga aaaaacccgc33900gaaaatccac ccaaaaagcc cgcgaaaaac acttccgtat aaaatttccg ggttaccggc33960gcgtcaccgc cgcgcgacac gcccgccccg ccccgcgctc ctccccgaaa cccgccgcgc34020ccacttccgc gttcccaaga caaaggtcgc gtaactccgc ccacctcatt tgcatgttaa34080ctcggtcgcc atcttgcggt gttatattga tgatg 34115<210>7<211>44<212>DNA<213>人工的<220>
<223>引物P5L<400>7gcgcacgcgt ctctatcgat gaattccatt ggtgatggac atgc44<210>8<211>36<212>DNA<213>人工的<220>
<223>引物P5ITR<400>8gcgcatttaa atcatcatca ataatatacc tcaaac 36<210>9<211>31<212>DNA<213>人工的<220>
<223>引物P5XTOP<400>9gatacctagg aacgaggagg atttgatatt g 31<210>10<211>20<212>DNA<213>人工的
<220>
<223>引物P5XBOT<400>10atgtacgcct ccgcgctcac 20<210>11<211>31<212>DNA<213>人工的<220>
<223>引物P5E4<400>11gatcgaattc ccactctgta ccccatctct g31<210>12<211>31967<212>DNA<213>猿腺病毒<220>
<221>CDS<222>(13796)..(15322)<220>
<221>CDS<222>(18257)..(21010)<220>
<221>CDS<222>(27192)..(29015)<400>12catcatcata atatacctta tttgggaacg gtgccaatat gataatgagg aggcggggtt 60aggggtggag tgagggtggg gtgcggatga cgcgggcgcg gggcggggtg ggagtctgac120gtggggcgcg gggtggagcg cgagggtgag ggcggggcga gggcggcggg cgcggcggaa180ttgacgtaca cggtagtaag tttgagcgga aattaagtga attgggcgtg ttttttgtaa240ctttttgacg tacacggtag taagtttgag cggaaattaa gtgaattggg cgtgtttttt300gtaacttttt gacgtacacg gtagtaagtt tgagcggaaa ttaagtgaat tgggcgtgtt360ttttgtaact ttttgacgta cacggtagta agtttgagcg gaaattaagt gaattgggcg420tgttttttgt aactttttga cgtacacggt agtaagtttg agcggaaatt aagtgaattg480ggcgtgtttt ttgtaacttt ttgacgtaca cggtagtaag tttgagcgga aattaagtga540
attgggcgtg ttttttgtaa ctttttgacg tacacggtag taagtttgag cggaaattaa 600gtgaattggg cgtgtttttt gtaacttttt ggtcattttg gcgcgaaaac tgagtaatga 660ggaagtgaga cggactctgc ccttttttac ggttgggagg gaaaactgct gatcagcgct 720gaactttggg ctctgacgcg gtggtttccc tacgtggcag tgccacgaga aggctcaaag 780tcctcgtttt attgtgtgct cagccttttt gagggtattt aaacaccgtc agaccgtcaa 840gaggccactc ttgagtgcga gcgagtagag ttttctcctc cgtcgctgcc gcggctgctc 900agtcttaccg ccaggatgcg aatgctgccg gagatcttca ccgggtcctg ggaagatgtt 960ttccagggac ttttagaatc tgaagacaac tttccccaac ctcctgagcc ggaggagcta1020cctgaggttt cgcttcacga tctgtttgac gtggaggtgg agagccccga cggagatccg1080aacgaggaag ctgttgatgg tatgttcccc gactggatga tatctcagag cgagagtgct1140gaaggcagtg cggactcggg cgtttctggg gttggaaacc tggtggaggt ggatctggac1200ttgaagtgtt acgaggaagg ttttcctcct agcgactcag agactgatga agcctcagaa1260gcggaaggtc aagaggagtc tgtgtgtggt tatgtgaaga ttaatgaggg ggagaacctg1320ctggtgttgg actgtccgga ccaacctgga catggctgtc gagcctgtga ctttcaccgg1380gggaccagcg gaaacccgga agctatctgt gctttgtgct acatgcgtct gaacgagcac1440tgcatataca gtgagtgtta ttcatgggtt atttatgggg aaagttgggg gaaagtcttg1500agaaggggaa aagtttaaca tgtcattttt gtacttgata ggtccagttt cggacgctga1560gggggattct gagtcccctg ctggtccttc ccagccctca ccctgctctt tgaccgccac1620gcccgcacct gacctagtta gaccaacgcc ctgccgagtg tcctgtagac gacgtgcagc1680tgttaattgc atagaagatt tattggcccc tgatgacgag aacgcacctt tgaacctgtg1740cctgaaacgc cctaagacat cttgagtgtt tatgctgtta ataaaagtgt tgacccttag1800atcctgtgtt tattccttgg gcgtgtgcgc gggtatataa agcagctgcg ggctggagtg1860ttagtttatt ctgatggagt actggagtga gctgcagaat taccagagcc tccggcgcct1920gctggagttg gcctctgcca gaacatccac ctgctggagg ttctgttttg gctcgactct1980cagtaacgtg gtgtatcggg tgaagcaaga gtacagctcg cgcttttctg agctgttggc2040ccgctacccg gctgtttttg tttctctgga tctaggccat cacgtttatt tccaagaagc2100tgtagtcaga tatttggatt tttctactcc cgggcgtgcg gtttctgcga ttgccttcat2160ctgctttgtg ctagatcgat ggagcgccca aacccgcctg agcccggggt acaccctgga2220ctacctgacc atgtccctgt ggagggccat gctgcggaag aggagggtct caggcttctc2280gccggcgcgg cctccgcacg gactggatcc ggtgctggag gagtcggagc tggaggagga2340ggagaacccg agggccggcc tggaccctcc ggcggaatag tgacggaacc ggaggatccc2400caagagggta ctagtcaggg gggagggggg ccgaagagaa agcgggatga agaggaggcg2460atggaccccg acaggtttct aaaagaactg actttaagct taatgtctaa gagaagaccc2520gagacggtgt ggtggtctga tttggagaag gagttccacc agggggagat gaatctgttg2580tacaagtatg ggtttgagca ggtgaagact cactggctgg aagcctggga ggactgggag2640atggctttta acatgtttgc caaggtggcg ctgcgcccgg acactattta caccgtgact2700aagacggtgg aaatccgcaa gcctgtgtat gtgattggca acggggccgt ggttcggttc2760cagaccaccg accgggtggc ctttaattgc tgtatgcaga acctgggccc gggggtgatt2820aatcttaatg gagtgacctt ttgcaatgtc agattcgcgg gggatggatt caacgggacg2880gtgtttgccg ccaccaccca gataacccta cacggggtgt tcttccagca tgtaggcggg2940gcttgtgtag atacctgggc gagggcctct gtgaggggct gcacctttgt gggctgttgg3000aaagcggtgg tgggtcgacc caagagtgtg ctgtctgtga agaaatgtgt gtttgagaga3060tgtctgatgg ccatggtggt ggagggccag ggtaggatcc gccataacgc gggctccgag3120aatacctgtt ttgccctgct gaagggtacg gcgaccgtga agcataacat gatctgcggg3180gtgggtcact cgcagctgct gacctgtgcg gatggcaact gccaggccct gcgcacggtg3240catgtggtgt cccaccggcg ccgcccctgg ccggtgtttg aacataacat gctgatgcgc3300
tgtaccatgc acctgggcta ccgccgcggc gtgtttgtgc cccatcagtg taacctgacc3360cacaccaagg tgttgctgga gacggatgct ttttcgcgag tgaatctgaa tggggtgttc3420gatctgacta tggagatgta caagatagtg agatttgatg aatcaaagac ccgttgtcgc3480ccctgcgagt gcggtgccaa tcacctgagg atgtatcccg tgaccctgaa cgtgacggag3540gagctgcgcc cggaccacca gatgctgtcc tgtctgcgca ccgattacga aagcagcgat3600gaggattaag aggtgagggg cggggcttgc atggggtata aaggtggggg aggaggtggg3660gagggggaaa acccaaaatg agcggatcga tggaagggag cgctgtgagt tttgagggcg3720gggtgttcag cccatatctg acaacccgtc tccccgcctg ggcaggagtg cgtcagaatg3780tggtgggctc caacgtggac ggacgtccgg tggcccctgc caactccgcc actctcacct3840acgccaccgt cggatcgtcg ctggacaccg ccgctgccgc cgccgcttca gccgccgctt3900ctactgctcg cggtatggca gctgatttcg gactgtatca gcaactggct gcgcctcgct3960cgtcgctgag agaagatgat gccctgtccg tggtgctgac ccgcctggag gagctgtccc4020agcagctgca agagctgtct gccaaagtgg atgcacagaa cgtccccgct acccaatgaa4080taaataaacg agacaccgag tgtgtttgga aatcaaaatg tgtttttatt tgttttttct4140ggcgcggtag gcccttgacc acctgtcgcg gtcgttaagg accttgtgga tgttttccag4200cacccggtag aggtgggctt ggatgttgag gtacatgggc atgagcccgt ctcgggggtg4260gaggtagcac cactggaggg cgtcgtgctc gggggtggtg ttgtagataa tccagtcgta4320gcagggtttt tgggcatgga agcggaagat gtctttgaga agcaggctga tggccagggg4380gaggcccttg gtgtaggtgt tcacaaagcg gttgagctgg gagggatgca tgcgggggga4440gatgagatgc atcttggcct gaatcttgag gttggcgatg ttgccgccca gatcccgccg4500ggggctcatg ttgtgcagga ccaccaggac ggtgtagccg gtgcacttgg ggaatttgtc4560atgcaacttg gaagggaagg cgtggaagaa cttggagacc cccttgtggc cgccgaggtt4620ctccatgcat tcgtccatga tgatggcgat gggacccctg gcggccgccc tggcgaagac4680gttgtcgggg tgggagacgt cgtagttctg ttccagggtg agctcgtcgt aggccatttt4740gacgaagcgg gggagcaggg tgcccgactg ggggacgatg gtaccttcgg gacccggggc4800gtagttgccc tcgcagattt gcatctccca ggccttgatc tccgaggggg ggatcatgtc4860cacctggggc gcgatgaaga agacggtctc cggggcgggg ttgatgagct gggaggagag4920gaggttgcgg agcagctgcg acttgccgca cccggtgggc ccgtagatga ccccgatgac4980gggttgcagc tggtagttta aggagctgca gctgccgtcc tcgcgcagga acggggcgac5040ctcgttcatc atgcttctga cgtgatggtt ttccctgacg aggtcttgca agagccgctc5100gccgcccagg gagagaagct cttccaggct gcggaaatgc ttgaggggtt tgaggccgtc5160ggccatggtc atcttttcca gggactggcg gagcaggtac aggcggtccc agagctcggt5220gacgtgttct acggcatctc gatccagcag acttcttggt tgcgggggtt ggggcggctt5280tggctgtagg ggaccagccg gtgcgcgtcc agggaggcga gggtgacgtc tttccagggc5340cgcagcgttc gcgtgagggt ggtctcggtg acggtgaagg gatgcgctcc cggttgggcg5400ctggccaggg tcctcttgag actcatcctg ctggtgtgga agcgggcgtc ttctccctgg5460gagtcggcca ggtagcattt gagcatgagg tcgtagctga gggcctcggc cgcgtggccc5520ttggcgcgca gcttgccttt ggagacgtgt ccgcaggcgg gacagtgcag gcacttgagg5580gcgtagagct tgggggccag gaagacggac tcgggggagt aggcgtcggc gccgcactga5640gcgcacgtgg tctcgcactc gacgagccag gtgagctccg ggtgttgggg atcaaaaacc5700agctggcccc cgtgtttttt gatgcgcttc ttacctcggg tctccatgag gcggcgtccg5760gcttcggtga cgaagaggct gtcggtgtcg ccgtagacgg atttgagcgc gcgctgctcc5820aggggaatcc cgcgatcctc cgcgtgcagg aactcggacc actctgagac gaaggcccgg5880gtccacgcga ggacaaagga ggcgatctgg gacgggtagc ggtcgttctc caccagggga5940tccaccttct ccagggtgtg caggcagagg tcgtcctcct ccgcgtccat gaaggtgatt6000ggcttgtaag tgtatgtcac gtgaccgtcg gggtcgcgcg tgggcttata aaagggggcg6060
tgcccggcct ccccgtcact ttcttccgca tcgctgtgga cgagatccag ctgctcgggt6120gagtaggcgc gctggaaggc gggcatgacc tcggcgctga gggtgtcagt ttccacgaac6180gaggtggatt tgatattgac ctgtccggcg gcgatgcttt tgacggtggc ggggtccatc6240tggtcagaaa agacgatctt tttgttgtcc agcttggtgg cgaacgaccc gtagagggcg6300ttggagagca gcttggcgat ggagcgcagg gtctggttct tctcgcggtc ggcgcgctcc6360ttggcggcga tgttgagctg gacgtactcg cgggccacgc agcgccattc ggggaagacg6420gtggcgcgct cgtccggcag gaggcgcacg cgccagccgc ggttgtgcag ggtgatgagg6480tccacgctgg tggccacctc gccgcgcagt ggctcgttgg tccagcagag gcgcccgccc6540ttgcgcgagc agaagggggg caggacgtcg agctggtcct ccgcgggggg gtcggcgtcg6600atggtgaaga tgcccggtag caggtggcgg tcgaagtagt cgatggcgac cgcggggtcg6660gcgagggcgc gttcccagtc cctgaccgcc agggcgcgct cgtaggggtt gaggggcgcc6720ccccagggca tgggatgggt gagggccgag gcgtacatgc cgcagatgtc gtagacgtag6780aggggctcgc ggagcacgcc gaggtaggtg ggatagcagc gtccgccgcg gatgctggcg6840cgcacgtagt cgtacatctc gtgcgagggg gcgaggaggc cgcctccgag gtcgccgcgc6900tgcggtctga cggcccggta ggtgacctgg cggaagatgg cgtgcgagtt ggaggagatg6960gtgggccgct ggaagatgtt gaagctggcc tcggggagtc cgacggcgtc gtggacgaac7020tgggcgtagg agtcgcgcag cttctgcacg agcgcggcgg tgacgagcac gtccagggcg7080cagtagtcga gggtctcgcg gacgaggtcg taacggggct cttgcttctt ttcccagagt7140tcgcggttga ggaggtactc ctcgcgatcc ttccagtact cttcggccgg aaagccgcgt7200tcgtccgcca ggtaagaacc cagcatgtag aagcggttga cggctcggta gggacagcag7260cccttctcga cgggcaggga gtaggcctgc gcggccttcc tgagcgaggt gtgggtgagg7320gcgaaggtgt cgcgcaccat gaccttgagg aactggaacc tgaagtcggt gtcgtcgcag7380gcgccccgct cccagagccc gtagtcggtg cgtttctggc tgcgggggtt gggcagggcg7440aaggtgacgt cgttgaagag gatcttgccg gcgcgcggca tgaagttgcg ggtgatcctg7500aagggccccg gcacgtccga gcggttgtta atgacctggg ccgcgaggac gatctcgtcg7560aagccgttga tgttgtggcc gacgatgtag agctcgacga agcgcgggcg cccctgcagc7620ttgggggcct tcttgagctc ctcgtaggtg aggcagtcgg gcgagtagag gcccagctcc7680tgtcgggccc attcggccac ctgggggttg gcttgcaaga agccccgcca gagctgcagg7740gcgagctggg tctggaggcg gtcgcggtag tcgcggaact ttttgcccac cgccatcttc7800tcgggggtga ccacgtagaa ggtgcggccg tcctggcccc aggcgtccca gttctgctcg7860cgggcgagac ggcaggcctc ctcgacgagg gcctcctccc cggagagatg catgactagc7920atgaagggga cgagttgctt gccgaaggca cccatccacg tgtaggtctc tacgtcgtag7980gtgacgaaga gacgttcggt gcgaggatgc gagccgagag gaaagaagtt gatctcctgc8040caccagccgg aggagtgggc gttgacgtgg tggaagtaga agtcacgccg gcggaccgtg8100cattcgtgct gatatttgta aaagcgggcg cagtactcgc agcgctgcac gctctgcact8160tcctgaacga gatgcacccg gcgcccgcgc accaggaggc ggagggggca gtccagtgga8220gcttcggcgc gctgtccttc agcctcgtca tgctcttctg cacctgcacg ctcctgctgt8280gggtggagga cggagggagt gacgacgccg cgcgagccgc aggtccagat gtcgacgcgc8340ggcggcctga ggctcagcgc cagggtgcgg atctgagcgg cgtccaggga gtcgaggaag8400gcctcgctga ggtcgacggg cagcgtccgc cggtggactt gcaggagacg ggtaagggcc8460ggcgccaggc gctgatggta cttgatctcg agcggttcgt tggtggaggt gtcgatggcg8520tagagcaggg cctgaccgcg ggcggcgacg atggtgccgc ggtgccggcg gtaggtggcg8580tattcggggg ggctcgttac atcacccgcc tgggcctggc gccgggcggc agcgggggtt8640ctggtcccgc cggcatgggc ggcagcggca cgtcggcgcg gggctccggc agcggctggt8700gctgagctcg cagctgactg gcgtgcgcga cgacgcggcg gttgaggtcc tggatgtgcc8760tccgctgcgt gaagaccacc ggtccccgga ctcggaacct gaaagagagt tcgacagaat8820
caatctcggc atcgttgacg gccgcctgac gcaggatctc ctgcacgtcg cccgagttgt 8880cctggtaggc gatctcggac atgaactggt cgatctcttc ctcctggagt tcgccgcgtc 8940cggcgcgttc gacggtggcc gcgaggtcgt tggagatgcg agccatgagc tgggagaagg 9000cgttgaggcc gttctcgttc cacacgcgac tgtagacgac gttgccgacg gcgtcccggg 9060cgcgcatgac cacctgcgcg acgttgagct ccacgtgtcg cgcgaagacg gcgtagttgc 9120gcaggcgctg gaagaggtag ttgagggtgg tggcgatgtg ctcgcagacg aagaagtaca 9180tgacccagcg gcgcagcgtc atctcgttga tgtctccgag ggcttccaag cgctccatgg 9240cctcgtagaa gtcgacggcg aagttgaaga actgggagtt gcgcgccgcg accgtcagct 9300cgtcttgcaa gagccggatc agctgggcca cggtctcccg cacctcgcgt tcgaaggccc 9360ccggcgcttc ttcctcctct ggttcctcgg cggcctcttc ttccatgacg gcttcctctt 9420cctccggttc ctcgggcacg ggcctccggc ggcgacggcg cctgatgggc aggcggtcca 9480cgaagcgttc gatgatctct ccgcggcggc ggcgcatggt ttcggtgacg gcgcggccgt 9540tctctcgggg ccgcagttcg aagacgcccc cgcgcaggcc gccggcgccg ccgagagggg 9600gcaggaggtg ggggccttcg ggcagcgaga gggcgctgac gatgcaccgt atcatctgtt 9660gcgtaggtac agctctccag gagtcgttga gcgagtccag ttggacggga tccgagaact 9720tttcgaggaa agcttcgatc caatcgcagt cgcaaggtaa gctgaggacg gtgggatgag 9780gggcttggcg ggaggcggag gcggcagaag aggaggagga gggcaggctg gaggtgatgc 9840tgctgatgat gtaattgaag taggcggttt tcaaacggcg gatggtggcg aggaggacga 9900cgtctttggg cccggcctgc tggatgcgca ggcggtcggc catgccccag gcgtggctct 9960ggcatcggcg caggtccttg tagtagtctt gcatgagtct ctcgacgggg acgtcgtctt10020cgtcggcccg gtcggccatg cgggtggagc cgaacccgcg caggggctgc agcagggcca10080ggtcggcgac cacgcgttcg gccagcacgg cctgctggat ctgggtgagc gtggtctgga10140agtcgtccag gtccacgaag cggtggtagg agcccgtgtt gatggtgtag gtgcagttgg10200ccatgacgga ccagttgacg acttgcatgc cgggctgggt gatctcggtg tagcggaggc10260gcgagtaggc ccgcgactcg aagacgtagt cgttgcaggt gcgcacgagg tactggtagc10320cgacgaggaa gtgcggcggc ggctcgcggt agaggggcca gcgcacggtg gcgggggcgc10380cgggggccag gtcctccagc atgaggcggt ggtagtggta gacgtagcgc gagagccagg10440tgatgccggc ggcggaggtg gcggcgcggg cgaagtcgcg gacgcggttc cagatgttgc10500gcaagggggc gaagcgctcc atggtgggca cgctctggcc ggtgaggcgg gcgcagtcct10560gcacgctcta gacgggacag agagcgggag gttagcggct ccgctccgtg gcctggggga10620cagaccgcca gggtgcgacg gcggggaacc ccggttcgag accggctgga tccgtccgtc10680cccgacgcgc cggccccgcg tccacgaccc caccagaggc cgagacccag ccgcggtgcc10740cggaccccag atacggaggg gagccttttt gtggtttttt cccgtagatg catccggtgt10800tgcgacagat gcgtccgtcg ccagcgccgc cgacgcagcc gccgctcccg ccccccacta10860gcgccgcgga ggctctgtcc ggcggccgcg gcgacccgga ggaggaggcc atcctcgact10920tggaagaagg cgagggcctg gcccggctgg gagcgccctc ccccgagcgc catccccgcg10980tgcagctggc gagagactcg cgccaggcct acgtgccgcc gcagaatctg ttcagggacc11040gcagcggcca ggagcccgag gagatgaggg accgcaggtt tcacgcgggg cgggagctgc11100gcgcgggctt cgaccgtcgg cgggtgttgc gcgccgaaga cttcgagccc gacgagcgca11160gcggagtaag tccggcacgg gcgcacgtgt cggcggccaa cctggtgacc gcgtacgagc11220agacggtgaa cgaggagcgg agctttcaga aaagcttcaa caaccacgtg cgcaccctga11280tcgcgcgcga ggaggtggcc atcggcctga tgcatctgtg ggactttgtg gaggcgtacg11340tgcagaaccc gtcgagcaag ccgctgacgg cgcagttgtt cctgatcgtg cagcacagtc11400gggacaacga gacgttccgc gaggcgatgc tgaacatcgc ggagcccgag ggccgctggc11460tcttggacct gattaacatc ctgcagagca tcgtggtgca ggagcgcagc ctgagcctgg11520ccgacaaggt ggcggccatc aactacagca tgttgagcct gggcaagttt tacgcccgca11580
agatctacaa gagcccctac gtgcccatag acaaggaggt gaagatcgac agcttttaca11640tgcggatggc gctgaaagtg ctgacgctga gcgacgatct gggggtgtac cgcaacgacc11700gcatccacaa ggccgtgagc gccagccgcc ggcgcgagct gagcgaccgc gagctgatgc11760acagcctgcg gagggcgctg gcgggcgccg gcggcggcga ggaggccgag tcctacttcg11820acatgggggc ggacttgcag tggcagccca gcgcgcgggc cctggaggcg gcgggctacc11880gcggcggcgg cggcgtggtc gaggcggagg acgaggacga ggtggagtac gaggaggagg11940actgatcggc gaggtgtttt cgtagatgca gcgcgcgacg gcggcggcga gcgggccgca12000gggggacccc gccgtgctgg cggccctgca gagccaacct tcgggcgtga acgcctccga12060tgactgggcg gcggccatgg accgcatttt ggccttgacc acccgcaacc ccgaggcctt12120tagacagcag ccgcaggcca accgcttttc ggccatcttg gaagccgtgg tgccctcgcg12180caccaacccc acgcacgaga aggtcctggc ggtggtgaac gcgctgctgg agagcaaggc12240gatccgcaag gacgaggcgg ggctgattta caacgccctg ctggagcggg tggcgcgcta12300caacagcacc aacgtgcagg ccaacctgga ccgtctgacg acggacgtgc gggaggcggt12360ggcgcagcgg gagcgcttca tgcgcgacac gaacctgggc tcgcaggtgg ccctgaacgc12420cttcctgagc acgcagccgg ccaacgtgcc gcgcgggcag gaggactacg tcagtttcat12480cagcgcgctg cgcctcctgg tggccgaggt gccgcagagc gaggtgtacc agtcgggtcc12540ggactacttc ttccagacct cgcggcaggg cctgcagacg gtgaacctga cgcaggcctt12600caagaacctg gaaggcatgt ggggcgtgcg ggcccccgtg ggcgaccggg cgacgatctc12660cagcttgctg acgccgaaca cgcggctgct gctgctgctg atcgcgccct tcaccaatag12720cagtaccatc agccgcgact cgtacctggg ccacctgatc acgctgtacc gcgaggccat12780cgggcaggcg caggtggacg agcagacctt ccaggagatt acgagcgtga gccgggccct12840ggggcagcag gacacgggta gcctggaggc gacgctgaat tttctgctga ccaaccggcg12900gcagaagatc ccctcccagt acacgctgag cacggaggag gagcgcatct tgcgctacgt12960gcagcagtcc gtgagcctgt atctgatgcg cgagggggcg agcccctcgt cggcgctgga13020catgacggcc cgtaacatgg agccgtcgct gtacgcggcc caccggccgt tcgtgaaccg13080cctgatggac tacctgcacc gcgccgccgc catgaacggc gagtacttta cgaacgccat13140cctgaacccg cactggatgc cgccgtccgg tttctacacg ggggactttg acatgcccga13200gggcgacgac gggttcctgt gggacgacgt gtcggacagc gtgttcgcgc cggtgcgtcc13260gggcaagaag gagggcggcg acgagctgcc gctgtccgtg gtggaggcgg cgtcgcgcgg13320ccagagcccg ttccccagcc tcccgtcgtt gtcggcgagc agcagcagcg gccgggtctc13380gcgcccgcgg ctggagggcg actacctgaa cgacccgctg ctgcgccccg cccggcccaa13440gaactttccc aacaacgggg tggagagcct agtggataag atgaatcgct ggaagaccta13500cgcccaggag cagcgggagt gggaggagag tcagccccgc cccctgcctc cgccgcgctc13560caggtggcgc cggcgggaag aagacccgga agactcggcg gacgatagca gcgtgttgga13620cttggggggg accggtgccg cctcgacaaa cccgttcgcc cacctgcgcc cgcagggccg13680gctgggtcgg ctgtattgag gaaagaaact aataaaagaa aaaagagctt gcttaccaga13740gccatggtcg cagcgtcggt ccctttgtgt gtgttttctc ctccccggta gcgaa atg 13798Met1agg cgc gcg gtg gga gtg ccg ccg gtg atg gcg tac gcc gag ggt cct 13846Arg Arg Ala Val Gly Val Pro Pro Val Met Ala Tyr Ala Glu Gly Pro5 10 15cct cct tct tac gaa acg gtg atg ggc gcc gcg gat tcg ccg gcc acg 13894Pro Pro Ser Tyr Glu Thr Val Met Gly Ala Ala Asp Ser Pro Ala Thr20 25 30ctg gag gcg ctc tac gtc cct ccc cgc tac ctg ggg cct acg gag ggg 13942
Leu Glu Ala Leu Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Gly35 40 45agg aac agc atc cgt tac tca gag ctg gcg ccg ctg tac gac acc acc 13990Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr50 55 60 65cgc gtg tac ctg gtg gat aac aag tcg gcg gac atc gcg tcg ctg aac 14038Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn70 75 80tac cag aac gac cat agc aac ttt ctg acc acg gtg gtg cag aac aat 14086Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn85 90 95gac ttt acc ccg gtg gag gcg ggc acg cag acc ata aat ttc gac gag 14134Asp Phe Thr Pro Val Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Glu100 105 110cgc tcg cgg tgg ggc ggc gac ctg aaa acc atc ctg cgc acc aac atg 14182Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Ile Leu Arg Thr Asn Met115 120 125ccc aac atc aac gag ttc atg tcc acc aac aag ttc agg gcc cgg ttg 14230Pro Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Arg Leu130 135 140 145atg gta gag aaa gtg aac aag gaa acc aat gcc cct cga tac gag tgg 14278Met Val Glu Lys Val Asn Lys Glu Thr Asn Ala Pro Arg Tyr Glu Trp150 155 160ttt gag ttc acc ctg ccc gag ggc aac tac tcg gag acc atg acc ata 14326Phe Glu Phe Thr Leu Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile165 170 175gac ctg atg aat aac gcg atc gtg gac aac tac ttg gaa gtg ggg cgg 14374Asp Leu Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Glu Val Gly Arg180 185 190cag aac ggg gtg ctg gag agc gac atc ggg gtg aag ttt gac acg cgc 14422Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg195 200 205aac ttc cgg ctg ggc tgg gac ccg gtc acc aag ctg gtc atg ccc ggc 14470Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly210 215 220 225gtg tac acc aac gag gcc ttc cac ccc gac atc gtc ctg ctg ccc ggc 14518Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly230 235 240tgc ggc gtg gac ttc acg cag agc cgg ctg agc aac ctg ctg ggg atc 14566Cys Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Ile245 250 255cgc aag cgg atg ccc ttc cag gcg ggt ttt cag atc atg tac gag gac 14614Arg Lys Arg Met Pro Phe Gln Ala Gly Phe Gln Ile Met Tyr Glu Asp260 265 270ctg gag ggc ggc aac atc ccc gcc ttg cta gac gtg gcg aaa tac gag 14662Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Ala Lys Tyr Glu
275 280 285gcc agc att cag aag gcg cgg gag cag ggc cag gag atc cgc ggc gac 14710Ala Ser Ile Gln Lys Ala Arg Glu Gln Gly Gln Glu Ile Arg Gly Asp290 295 300 305aac ttt acc gtc atc ccc cgg gac gtg gag atc gtg ccc gtg gag aag 14758Asn Phe Thr Val Ile Pro Arg Asp Val Glu Ile Val Pro Val Glu Lys310 315 320gat agc aag gac cgc agt tac aac cta ctc ccc ggc gac cag acc aac 14806Asp Ser Lys Asp Arg Ser Tyr Asn Leu Leu Pro Gly Asp Gln Thr Asn325 330 335acg gcc tac cgc agc tgg ttc ctg gcc tac aac tac ggc gac ccc gag 14854Thr Ala Tyr Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Glu340 345 350aag ggc gtc agg tcc tgg acg ctg ctg acc acc acg gac gtc acc tgc 14902Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Thr Asp Val Thr Cys355 360 365ggc tcg cag cag gtg tac tgg tcg ctc ccg gac atg atg caa gac ccc 14950Gly Ser Gln Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro370 375 380 385gtg acc ttc cgg ccc tcc agc caa gtc agc aac tac ccc gtg gtg gga 14998Val Thr Phe Arg Pro Ser Ser Gln Val Ser Asn Tyr Pro Val Val Gly390 395 400gtc gag ctc ctg ccg gtg cac gcc aag agc ttt tac aac gag cag gcc 15046Val Glu Leu Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Ala405 410 415gtc tac tcg cag ctc atc cgc cag tcc acc gcg ctc acg cac gtc ttc 15094Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Phe420 425 430aac cgc ttc ccc gag aac cag atc ctg gtg cgc ccg ccc gct ccg acc 15142Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr435 440 445att acc acc gtc agt gaa aac gtt ccc gcc ctc aca gat cac gga acc 15190Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr450 455 460 465ctg ccg ctg cgc agc agt atc agt gga gtc cag cgc gtg acc atc act 15238Leu Pro Leu Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr470 475 480gac gcc cgg cga agg acc tgc ccc tac gtg cac aag gcc ctg ggc ata 15286Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val His Lys Ala Leu Gly Ile485 490 495gtc gct ccc aaa gtg ctc tct agc cgc acc ttt taa caagcatgtc 15332Val Ala Pro Lys Val Leu Ser Ser Arg Thr Phe500 505cattctcatc tcgcccgaca acaacaccgg ctggggcctg cgctcggccg gcatgtacgg15392cggcgccaag cggcgctcca gcgagcaccc cgtccgcgtc cgcggccact accgggcccc15452ctggggcgcc cacaagcgcg gcgtctccac gcgcaccacc gtcgacgacg ccatcgacgc15512
cgtcgtggcc caggccagac gctaccgccg gcccaagtcg acggtggacg ccgtcatcga15572cagcgtggtg gccgacgcgc ggcgatacgc tcgacgcaag cggcgtctgc accgccgtcg15632ccgtcccacc gccgccatgc tggccgccag agcggtcctg agacgcgcgc gccgcgtggg15692ccgccgagcc atgcgccgag ccgcggccaa cgccagcgcg ggtcgcgccc gtcgtcaggc15752cgcccggcag gccgccgccg ccatcgccaa cctggcccaa ccccgccggg gaaacgtgta15812ctgggtgcga gacgcgtcgg gcgtgcgcgt gccggtgcgc acccgccccc ctcggagtta15872gaagacaaaa agacggacga agactgagtt tccctgtcgt tgccagcatg agcaagcgca15932agttcaaaga agagctgctg gaggccctcg tgcccgagat ctacggcccg gccgccgctg15992ccgccgcggt ggcggacgtc aagcccgaag ttaagccccg cgcgctgaag cgggttaaaa16052agcgggaaaa gaaagaggag aagcaggaag cagggttgct agacgtcgac gacggcgtgg16112agttcgtgcg gtccttcgcg ccccgtcgcc gggtgcagtg gcggggtcgc cgcgtcaagc16172tcgtcccgcg gccgggcacc gtggtgtctt tcacccccgg cctgcgttcg gccacgcgcg16232gcctgaagcg cgagtacgac gaggtctatg gcgacgaaga catcctggag caggccgccc16292agcagctcgg ggagtttgct tacggcaagc gcggccgcta cggggaggtg gcgctggcgc16352tggaccaggg caatcccacg cccagcctca agcccgtcac gctgcagcag gtgctgcccg16412tgagcgcgtc gaccgagagc aagcggggca tcaagaggga gatgggcgac ctgcagccca16472ccatgcaact catggtgccc aaacggcaga agctggagga cgtgctggag aacatgaaag16532tggatcccag catcgagccc gaagtgaaag tgcgacccat caaggaagtg ggcccgggcc16592taggcgtgca gacggtggac attcagatcc ccgtgcgcgc ctcccccgtt tctgccacca16652ctacgacggc cgtggaggcc atggaaacgc agacggagct gcccgcggcc ttggcggcag16712ccgccaccgc cgccgcggct acccgagaga tgggcatgca gaccgacccc tggtacgagt16772tcgccggccc cgcccgtcgt ccacgagccc gtcggtacgc ggcgaccacc tcccggctcc16832ctgactacgt cttgcatcct tccatcacgc cgacgcccgg ctaccgcgga acgaccttcc16892gccccggtcg cgcgcgcacc accacccgcc gtcgtcgcac cacccgccgc cgtcgcagcc16952gtcgcgcact ggctcccatc gcggttcgcc gcgtcgtccg ccggggtcgc acgctgaccc17012tgcccaccgc gcgttaccac cccagcatcg tcatttaacc tgcgctgccg ttttgcagat17072ggctctgacg tgccgctttc gcttccccgt tcggcactac cgaggaagat ctcgccgtag17132gactggtcta gcgggcagcg gtctccgacg ccgccgccgc gcggtgcacc ggcgcatgaa17192gggcggcatt ctgcccgcgc tgatccccat tatcgccgcc gccatcgggg cgatccccgg17252cgtggcctcg gtggccttgc aagcagctcg caaaaattaa ataaagaagg cttgacactc17312actgcctggt cctgactgtt tcatgcagac aagacatgga agacatcaat tttgcgtcgt17372tggccccgcg gcacggctcg cggccgttca tgggcacctg gaacgagatc ggcaccagcc17432agctcaacgg gggcgctttc agttggagca gcctgtggag cggcattaaa aactttgggt17492ccacgattaa gacctatggc aacaaggcgt ggaacagtag cactggtcag atgctccgcg17552ataagctgaa ggaccagaac ttccagcaga aagtggtaga cggtctggcc tcgggcatca17612acggggtggt ggacctggcc aaccaggcgg tgcagaacca gatcaaccag cgtctggaga17672acagccgcca gccgcccgcg gccctgcagc agcgtccgca ggtggaggag gtggaagtgg17732aggagaagct gccgcccctg gagacggtgt cgccggtggg cgtgcctagc aagggggaga17792agcggccgcg gcccgagctc gaggagaccc tagtgaccga gaccctggag ccgccctcgt17852acgagcaggc cttgaaagag ggggccacgc ccctgcccat gacccggccc atcggaccca17912tggcccgacc ggtctacggc aaggaacaca aagccgtgac gctagagctg cctccgccgg17972cgcccaccgt acccccgatg cccggtccca ccctgggcac cgccgtgcct cgtcccgccg18032ccccgccggt cgccgtggcc acgcccgcgc gcccgagtcg cggagccaac tggcagagca18092ctctgaacag catcgtgggc ctgggagtga aaagcctgaa acgccgccgg tgttactatt18152aaagccagct aaatacccat gtgttgtatg cgcctcctgt gtcacgccag aaaaagccag18212ccgagtgacg ggtcaccgcc gccgccaaga gcgccgcttt caag atg gcc acc ccc18268
Met Ala Thr Pro510tcg atg atg ccg cag tgg tct tac atg cac atc gcc ggg cag gac gcc 18316Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ala Gly Gln Asp Ala515 520525tcg gag tac ctg agc ccg ggc ctg gtg cag ttc gcc cgc gcc acc gac 18364Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala Arg Ala Thr Asp530 535 540acg tac ttc agc ctg ggc aac aag ttt agg aac ccc acg gtg gcc ccc 18412Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro Thr Val Ala Pro545 550 555 560acc cac gac gtg acg acg gac cgg tcc cag cgg ctg acg ctg cgg ttc 18460Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu Thr Leu Arg Phe565 570 575gtg ccc gtc gac cgc gag gac acc gcg tac tcg tac aaa gtg cgc ttc 18508Val Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr Lys Val Arg Phe580 585 590acg ctg gcc gtg ggc gac aac cgc gtg ctg gac atg gcc agc acg tac 18556Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met Ala Ser Thr Tyr595 600 605ttt gac atc cgc ggc gtg ttg gac cgc ggt ccc agc ttc aaa ccc tac 18604Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser Phe Lys Pro Tyr610 615 620tcc ggc acc gcc tac aac tcc ctg gcc ccc aag ggc gcc ccc aac ccg 18652Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly Ala Pro Asn Pro625 630 635 640tca gaa tgg aag ggc tca gac aac aaa att agt gta aga ggt cag gct 18700Ser Glu Trp Lys Gly Ser Asp Asn Lys Ile Ser Val Arg Gly Gln Ala645 650 655ccg ttt ttt agt aca tcc att aca aag gat ggt att caa gtg gcc act 18748Pro Phe Phe Ser Thr Ser Ile Thr Lys Asp Gly Ile Gln Val Ala Thr660 665670gat act tct agc gga gct gtg tat gct aaa aag gaa tat cag cct gaa 18796Asp Thr Ser Ser Gly Ala Val Tyr Ala Lys Lys Glu Tyr Gln Pro Glu675 680 685cca caa gta ggg caa gaa caa tgg aac agc gaa gcc agt gat agt gat 18844Pro Gln Val Gly Gln Glu Gln Trp Asn Ser Glu Ala Ser Asp Ser Asp690 695 700aaa gta gct ggt agg att cta aaa gac aca aca ccc atg ttc cct tgt 18892Lys Val Ala Gly Arg Ile Leu Lys Asp Thr Thr Pro Met Phe Pro Cys705 710 715 720tac ggt tcc tac gcc aag ccc aca aat gaa cag ggg ggg caa ggc act 18940Tyr Gly Ser Tyr Ala Lys Pro Thr Asn Glu Gln Gly Gly Gln Gly Thr725 730 735aat act gta gat ctg cag ttc ttt gcc tct tca tcg gct acc tct acg 18988Asn Thr Val Asp Leu Gln Phe Phe Ala Ser Ser Ser Ala Thr Ser Thr
740 745 750cct aaa gcc gta ctc tat gcc gag gac gtg gca ata gaa gca cca gac 19036Pro Lys Ala Val Leu Tyr Ala Glu Asp Val Ala Ile Glu Ala Pro Asp755 760 765acc cat ttg gtg tac aaa ccg gca gtt aca acc acg acc act agt tcc 19084Thr His Leu Val Tyr Lys Pro Ala Val Thr Thr Thr Thr Thr Ser Ser770 775 780caa gac ctg cta act cag cag gct gct ccc aac cga ccc aac tac att 19132Gln Asp Leu Leu Thr Gln Gln Ala Ala Pro Asn Arg Pro Asn Tyr Ile785 790 795 800ggc ttc agg gat aat ttt atc ggt ctc atg tat tac aac tcc act ggc 19180Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly805 810 815aat atg ggt gtt ttg gca ggg caa gct tct cag cta aac gcg gtg gtt 19228Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val820 825 830gac ttg caa gac aga aac acc gag ctg tcc tac cag ctc atg ctt gat 19276Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Met Leu Asp835 840 845gct ttg ggc gac cgc agt cgt tac ttc tcc atg tgg aac cag gcc gta 19324Ala Leu Gly Asp Arg Ser Arg Tyr Phe Ser Met Trp Asn Gln Ala Val850 855 860gac agc tat gac cct gat gtc aga att att gaa aat cat ggt gtg gag 19372Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Val Glu865 870 875 880gat gag ctg cca aac tac tgt ttc ccg cta gga ggg tcg cta gta act 19420Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly Ser Leu Val Thr885 890 895gaa act tat aca ggc cta tca ccc caa aac gga agt aac acg tgg aca 19468Glu Thr Tyr Thr Gly Leu Ser Pro Gln Asn Gly Ser Asn Thr Trp Thr900 905 910acc gac agc acc acc tat gca act aga ggg gtg gaa atc ggc tct ggc 19516Thr Asp Ser Thr Thr Tyr Ala Thr Arg Gly Val Glu Ile Gly Ser Gly915 920 925aac atg ttc gcc atg gaa att aat ttg gcg gcc aat cta tgg agg agt 19564Asn Met Phe Ala Met Glu Ile Asn Leu Ala Ala Asn Leu Trp Arg Ser930 935 940ttc ctg tac tcc aac gtg gcc ctg tac ctg ccc gac gag tac aag ctc 19612Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Glu Tyr Lys Leu945 950 955 960acc ccc gac aac atc acc ctc ccc gac aac aaa aac act tac gac tac 19660Thr Pro Asp Asn Ile Thr Leu Pro Asp Asn Lys Asn Thr Tyr Asp Tyr965 970 975atg aac ggc cgc gtg gcc gcc ccc agc tcc ctc gac acc tac gtc aac 19708Met Asn Gly Arg Val Ala Ala Pro Ser Ser Leu Asp Thr Tyr Val Asn980 985 990
atc ggg gcg cgc tgg tcc ccc gac ccc atg gac aac gtc aac ccc ttc19756Ile Gly Ala Arg Trp Ser Pro Asp Pro Met Asp Asn Val Asn Pro Phe995 1000 1005aac cac cac cgc aac gcg gga ctg cgc tac cgc tcc atg ctg ctg 19801Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu1010 1015 1020ggc aac ggc cgc tac gta ccc ttc cac atc caa gtg ccc cag aaa 19846Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys1025 1030 1035ttc ttc gcc atc aaa aac ctc ctg ctc ctc ccc ggg tcc tac acc 19891Phe Phe Ala Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr1040 1045 1050tac gag tgg aac ttc cgc aag gac gtc aac atg atc ctc cag agc 19936Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Ile Leu Gln Ser1055 1060 1065agc ctg ggt aac gac ctc cgc gtc gac ggg gcc agc gtc agg ttc 19981Ser Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Val Arg Phe1070 1075 1080gac agc atc aac ctg tac gcc aac ttc ttc ccc atg gcc cac aac 20026Asp Ser Ile Asn Leu Tyr Ala Asn Phe Phe Pro Met Ala His Asn1085 1090 1095acc gcc tcc acg ctc gag gcc atg ctg cgc aac gac acc aac gac 20071Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp1100 1105 1110cag tcg ttc aac gac tac ctc tgc gct gcc aac atg ctc tac ccc 20116Gln Ser Phe Asn Asp Tyr Leu Cys Ala Ala Asn Met Leu Tyr Pro1115 1120 1125atc ccc gcc aac gcc acc agc gtg ccc atc tcc att ccc tcg cgg 20161Ile Pro Ala Asn Ala Thr Ser Val Pro Ile Ser Ile Pro Ser Arg1130 1135 1140aac tgg gcc gcc ttc cgg ggc tgg agc ttc acc cgg ctc aag acc 20206Asn Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr1145 1150 1155aag gag acc ccc tct ctg ggc tcc ggc ttc gat ccc tac ttc acc 20251Lys Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe Thr1160 1165 1170tac tcg ggc tcc atc ccc tac ctg gac ggc acc ttc tac ctc aac 20296Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn1175 1180 1185cac act ttc aag aag gtc tcc atc atg ttc gac tcc tcc gtc agc 2034lHis Thr Phe Lys Lys Val Ser Ile Met Phe Asp Ser Ser Val Ser1190 1195 1200tgg ccc ggc aac gac cgc ctg ctg acc ccc aac gag ttc gag atc 20386Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile1205 1210 1215aag cgc acc gtg gac ggg gaa ggg tac aac gtg gcc cag tgc aac 20431
Lys Arg Thr Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn1220 1225 1230atg acc aag gac tgg ttc ctc atc cag atg ctc agc cac tac aac 20476Met Thr Lys Asp Trp Phe Leu Ile Gln Met Leu Ser His Tyr Asn1235 1240 1245atc ggc tac cag ggc ttc tac gtg ccc gag ggc tac aag gac agg 20521Ile Gly Tyr Gln Gly Phe Tyr Val Pro Glu Gly Tyr Lys Asp Arg1250 1255 1260atg tac tct ttc ttc cgc aac ttc caa ccc atg agc cgc cag gtg 20566Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Val1265 1270 1275gtc gac acc acc acc tac acc gac tac aaa aac gtc acc ctc ccc 20611Val Asp Thr Thr Thr Tyr Thr Asp Tyr Lys Asn Val Thr Leu Pro1280 1285 1290ttc cag cac aac aac tcg ggg ttc gtg gga tac atg ggc ccc acc 20656Phe Gln His Asn Asn Ser Gly Phe Val Gly Tyr Met Gly Pro Thr1295 1300 1305atg cgc gag ggg cag gcc tac ccc gcc aac tac ccc tac ccc ctg 20701Met Arg Glu Gly Gln Ala Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu1310 1315 1320atc ggc aag acc gcc gtg ccc agc ctc acg cag aaa aag ttc ctc 20746Ile Gly Lys Thr Ala Val Pro Ser Leu Thr Gln Lys Lys Phe Leu1325 1330 1335tgc gac cgc acc atg tgg cgc atc ccc ttc tcc agt aac ttc atg 20791Cys Asp Arg Thr Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met1340 1345 1350tcc atg ggg gcg ctc acc gac ctg ggg cag aac atg ctg tac gcc 20836Ser Met Gly Ala Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala1355 1360 1365aac tcc gcc cac gcc ctc gac atg acc ttc gag gtg gac ccc atg 20881Asn Ser Ala His Ala Leu Asp Met Thr Phe Glu Val Asp Pro Met1370 1375 1380gat gag ccc acg ctt ctc tat gtt ctg ttc gaa gtg ttc gac gtc 20926Asp Glu Pro Thr Leu Leu Tyr Val Leu Phe Glu Val Phe Asp Val1385 1390 1395gtg cgc atc cac cag ccg cac cgc ggc gtc atc gag gcc gtc tac 20971Val Arg Ile His Gln Pro His Arg Gly Val Ile Glu Ala Val Tyr1400 1405 1410ctg cgc acg ccg ttc tcg gcc ggt aac gcc acc acc taa ggagggggcc21020Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr1415 1420 1425gccgacggat gggctccagc gagccggagc tggtcgccat cgcgcgcgac ctgggctgcg21080ggccctactt cctgggcacc tttgacaaac gcttcccggg cttcgtggcg ccgcacaagc21140tggcctgcgc catcgtcaac accgccggac gcgagaccgg cggcgtccac tggctggccc21200tggcctggaa cccccgcagc cgaacctgct acctcttcga ccccttcggc ttctcggacg21260acaggctcag gcagatctac cagttcgagt acgaaggcct gctccggcgc agcgccctcg21320
cctccacccc cgaccactgc gtcaccctcg tcaagtccac ccagaccgtc caggggcccc21380gctcggccgc ctgcggcctc ttctgctgca tgttcctgca cgccttcgtg cgctggcccg21440cctcccccat ggacggcaac cccaccatgg acctccttac gggcgttccc aacagcatgc21500ttcagagtcc ccaggtcgag cccaccctcc accgcaacca ggaggaactc tacgccttcc21560tggctcggca ctccccctac tttcgccgcc accgcgagcg catagaaaag gccaccgcgt21620ttgacaaaat gaacgactag attttctgtg aaaaacactc aataaagcct ttattggttc21680accacacgtg cacgcatgca gactttttat ttaaaagggc tccgcctcct cgtcgccgtg21740gctggtgggg agggagacgt tgcgatactg caggcgggag ctccatctga actcgggaat21800cagcagcttg ggcagggggc cctcgacgtt ctcgctccac agcttgcgca ccagctgcag21860ggcgcccagc aggtcgggcg cggagatctt gaagtcgcag ttggggccct ggttgccgcg21920ggagttgcgg tacaccgggt tggcgcactg gaacaccagc acgctggggt gctcgatgct21980ggccagcgcc gtcttgtcgg tcacctcgtc gccgcgcagg gactccgcgt tgctcagcgc22040gaaggcggtc agcttgcaca gctgccgacc cagcacgggc accccgctcg gctggttcag22100gcagtcgcag cgcatagcca tcagcagccg cttctgcccg tgctgcatct tcggatagtc22160ggctcgcatg aaggcctcca tctgccggaa ggccgtctgc gccttgctgc cctccgagaa22220gaacagcccg caggacttgc cggagaacac gttgttgccg cagctcacgt cttccacgca22280gcagcgcgcg tcgtcgttct tcagctgcac cacgctgcgg ccccagcggt tctgcaccac22340cttggtcttg ccgggatgtt ccttcagggc ccgctggccg ttctcgctgg tcacgtccat22400ctccaccacc tgctccttct ggatcatctc cagcccgtgg tagcagcgca gcacgccctc22460ctgctcggtg cacccgtgca gccagacggc gcagccggtc ggctccagct gttgaggttt22520caccccggcg taggtctcca cgtacgcccg caggaagcgg cccatcatct ccacaaaggt22580cttctgaccg gtgaaggtca gctgcagccc gcgatgctcc tcgttgagcc acgtctgaca22640gatcttgcgg tacaccttgc cctgctcggg cagaaacttg aaagcggcct tctcctcggg22700ctccacgtgg tacttctcca tcagcgccga catcagctcc atgcccttct cccaggccga22760caccagcggc tccgcgcggg ggttcaccac cgccatgcct cgggaagtgc cggggcgctc22820atcttcctcc tcctcctcgt cttcttcttg aggcggcggt ggcggcagtt gtctcacgaa22880tctcttgccg ttggccttct ggacgatctc cacgccgggg tgggtgaacc cgtgggccac22940caccacttcg tcctcttcct cttcgctgtc gggcacgact tcgggagagg gaggcggcgg23000aggaaccggt gcggccactg cggccatcgc ggcgttcttg cgcgccttct tggggggcag23060aggcggcgtc tcgcgctccg ggctggtctc ttgcaggtag ggcgtgatgg tgtgggaggt23120ggggcgctct ggctgacggc cggccatgct gatgcttgac tcctaggcga aaagatggag23180gaggatctta gacagccgca gcccgtctcc gaaaccttaa ccacccccgc ctctgaggtc23240ggcgccggcg agctagacat gcaacgggag gaggaggagg acgtgcgagt ggagcaagac23300ccgggctacg tgacgccgcc cgaggacggc gaggagccgc aggcaccggc gccaacgctc23360agcgaagccg actacctggg aggggaggac gacgtgctgc tgaagcacct ggcgcggcag23420agcaccatcg tgcaggaggc cctcaaggag cgcgaggagg tcccgctgac ggtggaggag23480ctcagccggg cctacgaagc caacctcttc tcgccgcggg tgccccccaa gaagcaggcc23540aacggcacct gcgagcccaa cccccgcctc aacttctacc ccgtctttgc ggtgcccgag23600gcgctggcca cctatcacat cttcttcaag aaccagcgca tccccctctc gtgccgcgcc23660aaccgcaccc gcgccgaccg cctcctgcat ctccgagccg gcgccgccat acctgagatc23720gcctccctgg aggaagtccc caagatcttc gaaggtctcg gcaaggacga gaagcgcgcg23780gcaaacgctc tggaaaagaa cgagagcgag ggtcagaacg tgctggtcga gctggaaggc23840gacaacgcgc gtctggccgt gctcaaacgc accatcgaag tctcccactt cgcctacccc23900gcgctcaacc ttccccccaa ggtcatgcgc tcggtcatgg atcagctgct catcaagcgc23960gccgagcccc tcgagaacga ctccgaggtg gattccgagg acggaaaacc cgtggtctcg24020gacgaggagc tcgcgcgctg gctgggcacg caggaccccg ccgagttgca agagcggcgc24080
aagatgatga tggcggccgt gctggtcacc gccgagctcg agtgcctgca gcgcttcttc24140gccgaccccc agaccctgcg caaggtcgag gagtccctgc actacgcctt ccgccacggc24200tacgtgcgcc aggcctgcaa gatctccaac gtggagctta gcaacctggt ctcctacatg24260ggcatcctgc acgagaaccg cctcgggcag aacgtcctcc actgcaccct gaccggggag24320gcccgccgcg actacgtccg cgactgcatc tacctctttc tcaccctcac ctggcagacc24380gccatggggg tctggcagca gtgtctggag gagcgcaacc ttcgcgagct cgacaagcta24440ctgagccgcg agcgccgcga gctctggacg gctttcagcg agcgcaccgc cgcctgccgt24500ctggccgacc tcatcttccc cgagcgactc aggcaaaccc tccagaacgg cctgcccgac24560tttgtcagcc agagcatgct gcaaaacttt cgctccttca tcctggagcg atccggcatc24620ttgcccgcca tgagctgcgc cctgccctcc gatttcgtcc ccctctatta tcgcgagtgc24680cccccgccgc tctggagcca ctgctacctg ctgcgtctgg ccaactacct cgcccaccac24740tccgacctca tggaagactc cagcggcgag gggctgctgg agtgccactg ccgctgcaac24800ctctgcaccc cccaccgctc gctggtctgc aacaccgagc tgctcagcga gacgcaagtg24860atcggtacct ttgagatcca gggaccagag gggccggagg gtgcttccaa cctcaagctc24920agcccggcgc tctggacttc cgcctacctg cgcaaattta tccccgagga ctatcacgcc24980caccagatcc aattctacga agaccaatcg cgacccccca aagcccccct cacggcctgt25040gtcatcaccc agagccagat tctggcccaa ttgcaagcca tccagcaggc ccgccaagag25100ttcctcctga aaaagggtca cggggtctat ctggaccccc agaccggcga ggaactcaac25160accccgtcac cctccgccgc cgcttcgtgc cgcccgcaga accatgccgc ccaaagggaa25220caagcaggcc atcgcccagc ggcgggccaa gaagcagcaa gagctccagg agcagtggga25280cgaggagtcc tgggacagcc aggcggagga agtctcagac gaggaggagg acatggagag25340ctgggacagc ctagacgagg aggaggaggc cgaggagcta gaggacgagc ctctcgagga25400ggaagagccc agcagcgccg cggcaccatc ggcttccaaa gaagcggctc ggagccggcc25460ggccccgaag cagcagaagc agcaacagcc gccaccgtcg cccccgacgc caccaccagg25520ctcactcaaa gccagccgta ggtgggacgc ggtgtccatc gcgggatcgc ccaaagcccc25580agtcggtaag ccacccgggc ggtcgcggcg ggggtactgt tcctggcgcc cccacaagag25640caagatcgtc gcctgcctcc agcactgccg gggcaacatc tccttcgcgc ggcgctactt25700gctcttccac gacggggtgg cggtgccgcg caacgtcctc tactattacc gtcatctcta25760cagcccctac gagacagaag gcccggcctc cgcgtaagac cagccgccag acggtctcct25820ccgccatcgc gacccgccag gactcggccg ccacgcagga gctcagaaaa cgcatctttc25880ccaccctgta tgctatcttc cagcagagcc gcggccagca gctggaactg aaagtaaaaa25940accgctccct gcgttcgctc acccgcagct gtctgtacca caggagggaa gaccaactgc26000agcgcacgct cgaggacgcc gaggcactgt tcaataaata ctgctcggtg tctcttaagg26060actgaaagcc cgcgcttttt cagaggctca ttacgtcatc atcatcatga gcaaggacat26120tcccacgcct tacatgtgga gctaccagcc gcagatggga ctggcggccg gcgcctccca26180ggattactcc agtcgcatga actggctgag tgccggcccc cacatgatcg ggcgggtcaa26240tgggattcgt gccacccgca atcagatact gctggaacag gccgccctca cctccacccc26300gcgacgtcag ctgaacccgc ccgcttggcc cgccgcccag gtgtaccagg aaaaccccgc26360cccgaccaca gtcctcctgc cacgcgacgc ggaggccgaa gtccagatga ctaactccgg26420ggcgcaatta gcgggcggcg cccgccacgt cgtcgctccc gggtacagag gtcggcccgc26480accctacccc tccggcccta taaagaggct gatcattcga ggccgaggta tccagctcaa26540cgacgaggtg gtgagctcct cgaccggtct tcggcccgac ggagtcttcc agcttggagg26600cgccggccgc tcttccttca ccactcgcca ggcctacctg acgctccaga gctcttcctc26660ccagcctcgc tccggcggca tcggcaccct ccagttcgtg gaggagttcg tgccctcggt26720ctacttcaac ccgttctccg gctctcccgg ccgctacccg gacagcttca tccccaacta26780cgacgcggtg agcgaatccg tggacggcta cgattgatga ccgatggtgc ggccgtaact26840
gcgcggcggc aacatctgca tcactgccat cgtcctcggt gcttcgcccg ggaggcctgt26900gagttcatct acttccagct cgccccggac cagcttcagg gcccttcgca cggcgttaag26960ctcgtgatag aggaagagct cgagagtagc tgcctgcgct gttttacctc gcgccccatc27020ctagtcgaga gggaacgcgg taggaccacc ctcaccctct actgcatctg tgactccccg27080gaattacatg aagatctgtg ttgccttcta tgtgccgaac aataacccct cttgtaacta27140cctacatcca caataaacca gaatttggaa actcctttcg tttgtttgca g atg aaa 27197Met Lyscgc gcc cgc ctc gac gac gac ttc aac ccc gtc tac ccc tat gac 27242Arg Ala Arg Leu Asp Asp Asp Phe Asn Pro Val Tyr Pro Tyr Asp1430 1435 1440act ccc aac gct ccc tct gtt ccc ttc atc act cct ccc ttc gtc 27287Thr Pro Asn Ala Pro Ser Val Pro Phe Ile Thr Pro Pro Phe Val1445 1450 1455tcc tcg gac ggc ttg caa gaa aaa cca ccc gga atg ctc agt ctc 27332Ser Ser Asp Gly Leu Gln Glu Lys Pro Pro Gly Met Leu Ser Leu1460 1465 1470aac tac caa gat cct att acc acc caa aac ggg gca tta act cta 27377Asn Tyr Gln Asp Pro Ile Thr Thr Gln Asn Gly Ala Leu Thr Leu1475 1480 1485aag ctt ggc agc gga ctg aac ata aac caa gat ggg gaa ctt acc 27422Lys Leu Gly Ser Gly Leu Asn Ile Asn Gln Asp Gly Glu Leu Thr1490 1495 1500tca gac gcc agc gtt ctc gtc act ccc ccc att aca aaa gcc aac 27467Ser Asp Ala Ser Val Leu Val Thr Pro Pro Ile Thr Lys Ala Asn1505 1510 1515aac aca ata ggc cta gcc ttc aat gca cct ctt acc ttg caa agc 27512Asn Thr Ile Gly Leu Ala Phe Asn Ala Pro Leu Thr Leu Gln Ser1520 1525 1530gat act tta aat ctt gct tgt aac gcc cca ctt acc gtg caa gac 27557Asp Thr Leu Asn Leu Ala Cys Asn Ala Pro Leu Thr Val Gln Asp1535 1540 1545aat agg ttg gga ata aca tac aac tct ccc ctc acc ttg caa aac 27602Asn Arg Leu Gly Ile Thr Tyr Asn Ser Pro Leu Thr Leu Gln Asn1550 1555 1560agc gaa ctt gcc cta gcg gtc acc ccg cct ctt gac act gcc aat 27647Ser Glu Leu Ala Leu Ala Val Thr Pro Pro Leu Asp Thr Ala Asn1565 1570 1575aac aca ctt gcg ctt aaa acc gcc cgg cct ata att aca aac tct 27692Asn Thr Leu Ala Leu Lys Thr Ala Arg Pro Ile Ile Thr Asn Ser1580 1585 1590aat aac gag ctt aca ctc tcc gct gat gct ccc cta aac acc agc 27737Asn Asn Glu Leu Thr Leu Ser Ala Asp Ala Pro Leu Asn Thr Ser1595 1600 1605acg ggt acc ctc cgc cta caa agc gca gca cca ctg ggg cta gtt 27782Thr Gly Thr Leu Arg Leu Gln Ser Ala Ala Pro Leu Gly Leu Val
1610 1615 1620gac caa acc ctg cga gtg ctt ttt tct aac cca ctc tac ttg caa 27827Asp Gln Thr Leu Arg Val Leu Phe Ser Asn Pro Leu Tyr Leu Gln1625 1630 1635aac aac ttt ctc tca cta gcc att gaa cgc cca ttg gct tta act 27872Asn Asn Phe Leu Ser Leu Ala Ile Glu Arg Pro Leu Ala Leu Thr1640 1645 1650acc act ggt tct atg gct atg cag att tcc caa cca tta aaa gtg 27917Thr Thr Gly Ser Met Ala Met Gln Ile Ser Gln Pro Leu Lys Val1655 1660 1665gaa gac gga agc tta agc ttg agc att gaa agc cct cta aat cta 27962Glu Asp Gly Ser Leu Ser Leu Ser Ile Glu Ser Pro Leu Asn Leu1670 1675 1680aaa aac gga aat ctt act tta gga acc caa agt ccc cta act gtc 28007Lys Asn Gly Asn Leu Thr Leu Gly Thr Gln Ser Pro Leu Thr Val1685 1690 1695act ggt aac aac ctc agc ctt aca aca aca gcc cca tta acg gtt 28052Thr Gly Asn Asn Leu Ser Leu Thr Thr Thr Ala Pro Leu Thr Val1700 1705 1710cag aac aac gct cta gcc ctc tca gtg tta ctg ccg ctt aga cta 28097Gln Asn Asn Ala Leu Ala Leu Ser Val Leu Leu Pro Leu Arg Leu1715 1720 1725ttt aat aac acc tca ctg gga gtg gca ttc aac cca ccc att tct 28142Phe Asn Asn Thr Ser Leu Gly Val Ala Phe Asn Pro Pro Ile Ser1730 1735 1740tca gca aac aac ggg ctg tct ctt gac att gga aat ggc ctt aca 28187Ser Ala Asn Asn Gly Leu Ser Leu Asp Ile Gly Asn Gly Leu Thr1745 1750 1755ctg caa tac aac agg ctc gta gtg aac att ggc ggc ggg cta cag 28232Leu Gln Tyr Asn Arg Leu Val Val Asn Ile Gly Gly Gly Leu Gln1760 1765 1770ttt aac aac ggt gct att acc gct tcc ata aat gca gct ctg ccg 28277Phe Asn Asn Gly Ala Ile Thr Ala Ser Ile Asn Ala Ala Leu Pro1775 1780 1785ttg cag tat tcc aat aac cag ctt tct ctt aat att gga ggc ggg 28322Leu Gln Tyr Ser Asn Asn Gln Leu Ser Leu Asn Ile Gly Gly Gly1790 1795 1800ctg cga tac aac ggc act tac aaa aat tta gcc gtc aaa acc gac 28367Leu Arg Tyr Asn Gly Thr Tyr Lys Asn Leu Ala Val Lys Thr Asp1805 1810 1815tct ttt agg ggt ctt gaa att gac agt aat cag ttc ctg gtg cca 28412Ser Phe Arg Gly Leu Glu Ile Asp Ser Asn Gln Phe Leu Val Pro1820 1825 1830aga ctg ggt tct ggt cta aag ttt gat caa tat ggg tac att agc 28457Arg Leu Gly Ser Gly Leu Lys Phe Asp Gln Tyr Gly Tyr Ile Ser1835 1840 1845
gtc ata cct cca act gtt acg cca aca aca ctt tgg act aca gca 28502Val Ile Pro Pro Thr Val Thr Pro Thr Thr Leu Trp Thr Thr Ala1850 1855 1860gac cct tct ccc aac gct act ttt tac gac agc tta gat gct aag 28547Asp Pro Ser Pro Asn Ala Thr Phe Tyr Asp Ser Leu Asp Ala Lys1865 1870 1875gta tgg ctg gcc tta gta aaa tgc aac ggc atg gtt aat gga acc 28592Val Trp Leu Ala Leu Val Lys Cys Asn Gly Met Val Asn Gly Thr1880 1885 1890ata gcc ata aag gct tta aaa ggt act ctg ctc caa cct acg gct 28637Ile Ala Ile Lys Ala Leu Lys Gly Thr Leu Leu Gln Pro Thr Ala1895 1900 1905agt ttt att tct ttt gtt atg tat ttt tac agc aat ggc acc aga 28682Ser Phe Ile Ser Phe Val Met Tyr Phe Tyr Ser Asn Gly Thr Arg1910 1915 1920aga act aac tac ccc acg ttt gaa aat gaa ggc ata cta gct agt 28727Arg Thr Asn Tyr Pro Thr Phe Glu Asn Glu Gly Ile Leu Ala Ser1925 1930 1935agt gct aca tgg ggt tat cgt caa gga aac tcg gca aac acc aac 28772Ser Ala Thr Trp Gly Tyr Arg Gln Gly Asn Ser Ala Asn Thr Asn1940 1945 1950gtc acc agt gcc gtt gaa ttt atg cct agc tcc aca aga tat cct 28817Val Thr Ser Ala Val Glu Phe Met Pro Ser Ser Thr Arg Tyr Pro1955 1960 1965gtt aac aag ggt act gag gtt cag aac atg gaa ctc acc tac act 28862Val Asn Lys Gly Thr Glu Val Gln Asn Met Glu Leu Thr Tyr Thr1970 1975 1980ttc ttg cag gga gac ccc act atg gcc ata tca ttt caa gct att 28907Phe Leu Gln Gly Asp Pro Thr Met Ala Ile Ser Phe Gln Ala Ile1985 1990 1995tat aac cat gct ttg gaa ggt tac tct tta aaa ttt acc tgg cga 28952Tyr Asn His Ala Leu Glu Gly Tyr Ser Leu Lys Phe Thr Trp Arg2000 2005 2010gtt cgc aac agg gaa cgc ttt gat atc ccc tgc tgt tct ttt tct 28997Val Arg Asn Arg Glu Arg Phe Asp Ile Pro Cys Cys Ser Phe Ser2015 2020 2025tac ata acg gaa gaa taa acactgtttt tcttttcaat gtttttattc29045Tyr Ile Thr Glu Glu2030tgctttttta cacagttcga accgtcagac tccctccccc cttccacttc acccggtaca29105cctcccgctc cccctggatc gctgcgtaca actgcagttt ggtgttcaga cacgggttct29165taggtgacag tatccacacg gcctctttgc cggccaggcg ctggtccgta atgctcacaa29225atccctccga cacgtcctcc agacacacgg tggaatccaa ggcgcccgtc tacaaaacaa29285acacagtcat gctctccacg ggttctctcc tcggtcgtac tgcgccagcg tgaacgggcg29345atggtgctcc atcagggctc gcagcaaccg ctgtcggcgc ggctcaccca ggctccggcg29405aaaagcgccc cgtctgggag tgctattcaa aaaacgcacc gcctttatca acagtctcct29465
cgtgcggcgg gcgcagcagc gcacctggat ctctgtcagg tctttacaat aggtacagcc29525catcaccacc atgttgttta aaatcccaaa gctaaacacg ctccacccaa atgacatgaa29585ttccagcacc gccgcggcgt ggccatcata caatatgcgg aggtaaatca ggtgccgccc29645cctaatacaa acgctcccca tatacatcac ctccttaggc agttgataat taaccacctc29705ccggtaccag ggaaacctca cgtttactaa agccccaaac accaacattt taaaccagtt29765agccagcacc acccctcccg ccttacactg cagcgacccc ggctgtttac aatgacagtg29825aatcacccac ctctcatacc ccctaatgac ctggcgtggc tccacatcta tagtagcaca29885gcacacgcac accctcatgt aatgcttcat cacaaatctt tcccaagggg ttagtatcat29945gtcccagggt acgggccact cctgcagcac ggtgaaaggt acgcaggcgg gaacagtcct30005cacctcggac acataatgca tattcagatg ttcacactct aaaaccccgg ggcttccctc30065caacgcagcc actggcaagt tctcagaggg tggtgtaagg cggtggtgct gatagggact30125caatctgtgt cgacaccgtc tgtcgcgttg catcgtagac caacgcttgg cgcaccgcct30185cgtacttcgc ccaaagaaaa cgggtgcgac gccaacacac ttccgcgtac cgtgggttcc30245gcactcgagc tcgctcagtt ctcaacgcat aatgcagcca ttcctgtaat ccacacaaca30305gtcgctcggc ttccaaagag atgtgcacct cgtatcttat aacgtcccga tatatatcca30365agcaggcagt cagggccact tgcaaccagt gcacgcaggc ggactgatcg cgacacactg30425gaggtggagg gagagacgga agaggcatgt tactccagac ggtcgaaaag cggatcaaag30485tgcagatcgc gaagatggca gcgatccccg ccgctacgct ggtgatagat cacagccagg30545tcaaacataa tgcggttttc caaatgacct attaccgcct ccaccagagc cgccacgcgc30605acttccagaa acaccagcac ggctacggca ttctcctcaa aatcttcaaa cattaagctg30665catgattgaa tcacccccaa ataattctcc tccttccatt ctcgcaaaat ttgagtaaaa30725acctctcgca gattagctcc gtggcgttca aaaaggtcac ttagagcgcc ctccaccgcc30785atgcgcaagc acaccctcat gattgaaaaa tgccagtctc ctgaaccacc tgcagttgat30845ttaaaagacc tatattagga tcaattccac tctcccgcag ctccacgcgt agcattagct30905gcaaaaagtc atttaaatct tcgcaaacta gcgcggtaag ctcgccgccg ggaattaggt30965ctgaagcagt caccacacac ataatttcca gtgaaggagt cagtctaagc agcaaaaagc31025cgcatgagca gtgttgaaaa ggaggggtca cgcaatgtaa catatgcagc caaaaatctc31085caaggtgtct gtgcataaac tccaccactg aaaagtccaa atcatgtaaa tatgccatca31145ccgcctcagg aaccaccacg gacacaaaaa cgggccgtag caaatacatg gtgtcctgca31205aagcaaaaac acatttatac catagaggcg cgaattactt ggggaaaaat cactcgctcc31265aaaactaaac aggccaccgt ctgaccgcgc cagccataaa aaaagcggtt cgaatgatta31325aaaagaataa tagacacctc ccaccaggta ctcggctgca actcgtgcgc ccctatcaaa31385accccgcgga cgttcatgtc ggccatagaa aaaatgcggc ccaaatatcc caccggaatc31445tccacggcca gctgcagtga tagcaaaaga acgccatgag gagcaatcac aaaattttca31505ggcgataaaa gcacataaag gttagaatag ccctgctgca caggtaataa agcccgcgag31565ctcagcaaat gcacataaac cgcttcagcc atcccgtctt accgcgaaca aaaggctcac31625agtacacagt tactcaaccc acacgccaca cagtatttat acactcctca atcgccacgt31685cacccgcccc gaacaaactc caaaagtcca aaaagtccaa aacgcccgcg taaaagcccg31745ccaaaacagc acttcctcat ttactctccc acagtacgtc acttccgccg cgcccgccgc31805cctcgccccg ccctcaccct cgcgctccac cccgcgcccc acgtcagact cccaccccgc31865cccgcgcccg cgtcatccgc accccaccct cactccaccc ctaaccccgc ctcctcatta31925tcatattggc accgttccca aataaggtat attatgatga tg 31967<210>13<211>508<212>PRT
<213>猿腺病毒<400>13Met Arg Arg Ala Val Gly Val Pro Pro Val Met Ala Tyr Ala Glu Gly1 5 10 15Pro Pro Pro Ser Tyr Glu Thr Val Met Gly Ala Ala Asp Ser Pro Ala20 25 30Thr Leu Glu Ala Leu Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu35 40 45Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr50 55 60Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu65 70 75 80Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn85 90 95Asn Asp Phe Thr Pro Val Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp100 105 110Glu Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Ile Leu Arg Thr Asn115 120 125Met Pro Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Arg130 135 140Leu Met Val Glu Lys Val Asn Lys Glu Thr Asn Ala Pro Arg Tyr Glu145 150 155 160Trp Phe Glu Phe Thr Leu Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr165 170 175Ile Asp Leu Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Glu Val Gly180 185 190Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr195 200 205Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro210 215 220Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro
225 230 235 240Gly Cys Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly245 250 255Ile Arg Lys Arg Met Pro Phe Gln Ala Gly Phe Gln Ile Met Tyr Glu260 265 270Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Ala Lys Tyr275 280 285Glu Ala Ser Ile Gln Lys Ala Arg Glu Gln Gly Gln Glu Ile Arg Gly290 295 300Asp Asn Phe Thr Val Ile Pro Arg Asp Val Glu Ile Val Pro Val Glu305 310 315 320Lys Asp Ser Lys Asp Arg Ser Tyr Asn Leu Leu Pro Gly Asp Gln Thr325 330 335Asn Thr Ala Tyr Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro340 345 350Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Thr Asp Val Thr355 360 365Cys Gly Ser Gln Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp370 375 380Pro Val Thr Phe Arg Pro Ser Ser Gln Val Ser Asn Tyr Pro Val Val385 390 395 400Gly Val Glu Leu Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln405 410 415Ala Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val420 425 430Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro435 440 445Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly450 455 460Thr Leu Pro Leu Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile465 470 475 480
Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val His Lys Ala Leu Gly485 490 495Ile Val Ala Pro Lys Val Leu Ser Ser Arg Thr Phe500 505<210>14<211>917<212>PRT<213>猿腺病毒<400>14Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ala1 5 10 15Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala20 25 30Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro35 40 45Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu50 55 60Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr65 70 75 80Lys Val Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met85 90 95Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser100 105 110Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly115 120 125Ala Pro Asn Pro Ser Glu Trp Lys Gly Ser Asp Asn Lys Ile Ser Val130 135 140Arg Gly Gln Ala Pro Phe Phe Ser Thr Ser Ile Thr Lys Asp Gly Ile145 150 155 160Gln Val Ala Thr Asp Thr Ser Ser Gly Ala Val Tyr Ala Lys Lys Glu165 170 175
Tyr Gln Pro Glu Pro Gln Val Gly Gln Glu Gln Trp Asn Ser Glu Ala180 185 190Ser Asp Ser Asp Lys Val Ala Gly Arg Ile Leu Lys Asp Thr Thr Pro195 200 205Met Phe Pro Cys Tyr Gly Ser Tyr Ala Lys Pro Thr Asn Glu Gln Gly210 215 220Gly Gln Gly Thr Asn Thr Val Asp Leu Gln Phe Phe Ala Ser Ser Ser225 230 235 240Ala Thr Ser Thr Pro Lys Ala Val Leu Tyr Ala Glu Asp Val Ala Ile245 250 255Glu Ala Pro Asp Thr His Leu Val Tyr Lys Pro Ala Val Thr Thr Thr260 265 270Thr Thr Ser Ser Gln Asp Leu Leu Thr Gln Gln Ala Ala Pro Asn Arg275 280 285Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr290 295 300Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu305 310 315 320Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln325 330 335Leu Met Leu Asp Ala Leu Gly Asp Arg Ser Arg Tyr Phe Ser Met Trp340 345 350Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn355 360 365His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly370 375 380Ser Leu Val Thr Glu Thr Tyr Thr Gly Leu Ser Pro Gln Asn Gly Ser385 390 395 400Asn Thr Trp Thr Thr Asp Ser Thr Thr Tyr Ala Thr Arg Gly Val Glu405 410 415Ile Gly Ser Gly Asn Met Phe Ala Met Glu Ile Asn Leu Ala Ala Asn
420 425 430Leu Trp Arg Ser Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp435 440 445Glu Tyr Lys Leu Thr Pro Asp Asn Ile Thr Leu Pro Asp Asn Lys Asn450 455 460Thr Tyr Asp Tyr Met Asn Gly Arg Val Ala Ala Pro Ser Ser Leu Asp465 470 475 480Thr Tyr Val Asn Ile Gly Ala Arg Trp Ser Pro Asp Pro Met Asp Asn485 490 495Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser500 505 510Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro515 520 525Gln Lys Phe Phe Ala Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr530 535 540Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Ile Leu Gln Ser545 550 555 560Ser Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Val Arg Phe Asp565 570 575Ser Ile Asn Leu Tyr Ala Asn Phe Phe Pro Met Ala His Asn Thr Ala580 585 590Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe595 600 605Asn Asp Tyr Leu Cys Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn610 615 620Ala Thr Ser Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe625 630 635 640Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu645 650 655Gly Ser Gly Phe Asp Pro Tyr Phe Thr Tyr Ser Gly Ser Ile Pro Tyr660 665 670
Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Ile675 680 685Met Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr690 695 700Pro Asn Glu Phe G1u Ile Lys Arg Thr Val Asp Gly Glu G1y Tyr Asn705 710 715 720Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Ile Gln Met Leu725 730 735Ser His Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val Pro Glu Gly Tyr740 745 750Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg755 760 765Gln Val Val Asp Thr Thr Thr Tyr Thr Asp Tyr Lys Asn Val Thr Leu770 775 780Pro Phe Gln His Asn Asn Ser Gly Phe Val Gly Tyr Met Gly Pro Thr785 790 795 800Met Arg Glu Gly Gln Ala Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu Ile805 8l0 815Gly Lys Thr Ala Val Pro Ser Leu Thr Gln Lys Lys Phe Leu Cys Asp820 825 830Arg Thr Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly835 840 845Ala Leu Thr Asp Leu G1y Gln Asn Met Leu Tyr Ala Asn Ser Ala His850 855 860Ala Leu Asp Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu865 870 875 880Leu Tyr Val Leu Phe Glu Val Phe Asp Val Val Arg Ile His Gln Pro885 890 895His Arg G1y Val Ile Glu A1a Val Tyr Leu Arg Thr Pro Phe Ser Ala900 905 910
Gly Asn Ala Thr Thr915<210>15<211>607<212>PRT<213>猿腺病毒<400>15Met Lys Arg Ala Arg Leu Asp Asp Asp Phe Asn Pro Val Tyr Pro Tyr1 5 10 15Asp Thr Pro Asn Ala Pro Ser Val Pro Phe Ile Thr Pro Pro Phe Val20 25 30Ser Ser Asp Gly Leu Gln Glu Lys Pro Pro Gly Met Leu Ser Leu Asn35 40 45Tyr Gln Asp Pro Ile Thr Thr Gln Asn Gly Ala Leu Thr Leu Lys Leu50 55 60Gly Ser Gly Leu Asn Ile Asn Gln Asp Gly Glu Leu Thr Ser Asp Ala65 70 75 80Ser Val Leu Val Thr Pro Pro Ile Thr Lys Ala Asn Asn Thr Ile Gly85 90 95Leu Ala Phe Asn Ala Pro Leu Thr Leu Gln Ser Asp Thr Leu Asn Leu100 105 110Ala Cys Asn Ala Pro Leu Thr Val Gln Asp Asn Arg Leu Gly Ile Thr115 120 125Tyr Asn Ser Pro Leu Thr Leu Gln Asn Ser Glu Leu Ala Leu Ala Val130 135 140Thr Pro Pro Leu Asp Thr Ala Asn Asn Thr Leu Ala Leu Lys Thr Ala145 150 155 160Arg Pro Ile Ile Thr Asn Ser Asn Asn Glu Leu Thr Leu Ser Ala Asp165 170 175Ala Pro Leu Asn Thr Ser Thr Gly Thr Leu Arg Leu Gln Ser Ala Ala180 185 190Pro Leu Gly Leu Val Asp Gln Thr Leu Arg Val Leu Phe Ser Asn Pro
195 200 205Leu Tyr Leu Gln Asn Asn Phe Leu Ser Leu Ala Ile Glu Arg Pro Leu210 215 220Ala Leu Thr Thr Thr Gly Ser Met Ala Met Gln Ile Ser Gln Pro Leu225 230 235 240Lys Val Glu Asp Gly Ser Leu Ser Leu Ser Ile Glu Ser Pro Leu Asn245 250 255Leu Lys Asn Gly Asn Leu Thr Leu Gly Thr Gln Ser Pro Leu Thr Val260 265 270Thr Gly Asn Asn Leu Ser Leu Thr Thr Thr Ala Pro Leu Thr Val Gln275 280 285Asn Asn Ala Leu Ala Leu Ser Val Leu Leu Pro Leu Arg Leu Phe Asn290 295 300Asn Thr Ser Leu Gly Val Ala Phe Asn Pro Pro Ile Ser Ser Ala Asn305 310 315 320Asn Gly Leu Ser Leu Asp Ile Gly Asn Gly Leu Thr Leu Gln Tyr Asn325 330 335Arg Leu Val Val Asn Ile Gly Gly Gly Leu Gln Phe Asn Asn Gly Ala340 345 350Ile Thr Ala Ser Ile Asn Ala Ala Leu Pro Leu Gln Tyr Ser Asn Asn355 360 365Gln Leu Ser Leu Asn Ile Gly Gly Gly Leu Arg Tyr Asn Gly Thr Tyr370 375 380Lys Asn Leu Ala Val Lys Thr Asp Ser Phe Arg Gly Leu Glu Ile Asp385 390 395 400Ser Asn Gln Phe Leu Val Pro Arg Leu Gly Ser Gly Leu Lys Phe Asp405 410 415Gln Tyr Gly Tyr Ile Ser Val Ile Pro Pro Thr Val Thr Pro Thr Thr420 425 430Leu Trp Thr Thr Ala Asp Pro Ser Pro Asn Ala Thr Phe Tyr Asp Ser435 440 445
Leu Asp Ala Lys Val Trp Leu Ala Leu Val Lys Cys Asn Gly Met Val450 455 460Asn Gly Thr Ile Ala Ile Lys Ala Leu Lys Gly Thr Leu Leu Gln Pro465 470 475 480Thr Ala Ser Phe Ile Ser Phe Val Met Tyr Phe Tyr Ser Asn Gly Thr485 490 495Arg Arg Thr Asn Tyr Pro Thr Phe Glu Asn Glu Gly Ile Leu Ala Ser500 505 510Ser Ala Thr Trp Gly Tyr Arg Gln Gly Asn Ser Ala Asn Thr Asn Val515 520 525Thr Ser Ala Val Glu Phe Met Pro Ser Ser Thr Arg Tyr Pro Val Asn530 535 540Lys Gly Thr Glu Val Gln Asn Met Glu Leu Thr Tyr Thr Phe Leu Gln545 550 555 560G1y Asp Pro Thr Met Ala Ile Ser Phe Gln Ala Ile Tyr Asn His Ala565 570 575Leu Glu Gly Tyr Ser Leu Lys Phe Thr Trp Arg Val Arg Asn Arg Glu580 585 590Arg Phe Asp Ile Pro Cys Cys Ser Phe Ser Tyr Ile Thr Glu Glu595 600 605<210>16<211>24<212>DNA<213>人工的<220>
<223>合成的寡聚物<400>16gcgacgggcc gacgctgccc ggct 24<210>17<211>4<212>PRT<213>人工的
<220>
<223>人工的<400>17Arg Arg Ala Ser1<210>18<211>24<212>DNA<213>人工的<220>
<223>合成的寡聚物<400>18gcggcgcgcc gacgctgccc ggct2权利要求
1.一种在选择的宿主细胞中有效培养嵌合腺病毒的方法,所述嵌合腺病毒来自不能在所述宿主细胞中有效生长的亲代腺病毒株,所述方法包括以下步骤(a)产生含有以下物质的嵌合腺病毒(i)生长在选择的宿主细胞类型中的第一腺病毒的左末端和右末端的腺病毒序列,所述左末端区域含有5’末端反向重复(ITR),所述右末端区域含有3’末端反向重复(ITR);和(ii)来自缺少其天然5’和3’末端区域的亲代腺病毒的内部区域,所述内部区域含有编码五邻体、六邻体和尾丝的后期基因;其中得到的嵌合腺病毒从5’到3’含有第一腺病毒的左末端区域、亲代腺病毒的内部区域和第一腺病毒的右末端区域;和b)在存在来自第一腺病毒或来自反补第一腺病毒的腺病毒血清型的功能性腺病毒E1a、E1b和E4 ORF6基因以及存在来自腺病毒左末端的必需腺病毒结构基因的情况下培养所述嵌合腺病毒。
2.如权利要求1所述的方法,其特征在于,所述亲代腺病毒的内部区域还含有一种或多种选自下组的功能性腺病毒基因内切蛋白酶开放读框,DNA结合蛋白,100kDa支架蛋白、33kDa蛋白、蛋白VIII、pTP、52/55kDa蛋白、蛋白VII、Mu和蛋白VI。
3.如权利要求1所述的方法,其特征在于,所述聚合酶、末端蛋白和52/55kDa蛋白功能物以反式提供。
4.如权利要求1所述的方法,其特征在于,所述第一腺病毒还含有聚合酶、末端蛋白和52/55kDa蛋白功能物。
5.如权利要求1所述的方法,其特征在于,所述嵌合腺病毒含有亲代腺病毒的腺病毒后期基因1、2、3、4和5。
6.如权利要求1所述的方法,其特征在于,所述选择的宿主细胞稳定地含有一种或多种腺病毒E1a、E1b或E4 ORF6功能物。
7.如权利要求1所述的方法,其特征在于,所述嵌合腺病毒含有一种或多种第一腺病毒的腺病毒E1a、E1b或E4 ORF6。
8.如权利要求1所述的方法,其特征在于,所述第一腺病毒是人来源的。
9.如权利要求1所述的方法,其特征在于,所述第一腺病毒是猿来源的。
10.如权利要求1所述的方法,还包括分离嵌合腺病毒的步骤。
11.一种产生生长在选择的宿主细胞中的嵌合腺病毒的方法,所述嵌合腺病毒来源于不能在所述宿主细胞中有效生长的亲代腺病毒株,所述方法包括产生含有以下物质的嵌合腺病毒的步骤生长在选择的宿主细胞类型中的第一腺病毒的5’和3’末端区域,所述5’末端区域含有5’末端反向重复(ITR)和所需的E1基因功能物,所述3’末端区域含有末端反向重复(ITR)和所需的E4基因功能物;和来自缺少其天然5’和3’末端区域的亲代腺病毒的内部区域,所述内部区域含有六邻体、五邻体基底和尾丝;其中得到的嵌合腺病毒从5’到3’含有第一腺病毒5’末端区域、亲代腺病毒的内部区域和第一腺病毒的3’末端区域。
12.一种用权利要求1所述方法生产的嵌合腺病毒。
13.一种含有不能在选择的宿主细胞中有效生长的选择的腺病毒血清型的六邻体蛋白的嵌合腺病毒,所述修饰的腺病毒含有(a)生长在选择的宿主细胞类型中的第一腺病毒的左末端的腺病毒序列,所述左末端区域含有E1a、E1b和5’末端反向重复(ITR);(b)不能在选择的宿主细胞中有效生长的选择的腺病毒血清型的内部区域的腺病毒序列,所述内部区域含有编码选择的腺病毒的五邻体、六邻体和尾丝的基因;(c)第一腺病毒的右末端的腺病毒序列,所述右末端区域含有所需的E4基因功能物和3’末端反向重复(ITR),其中得到的嵌合腺病毒含有感染和复制所需的腺病毒结构和调节蛋白。
14.如权利要求13所述的嵌合腺病毒,其特征在于,所述嵌合腺病毒还含有选择的腺病毒血清型的IIIa蛋白、52/55kDa蛋白和末端蛋白(pTP)。
15.如权利要求13所述的嵌合腺病毒,其特征在于,所述嵌合腺病毒含有第一腺病毒的聚合酶。
16.如权利要求13所述的嵌合腺病毒,其特征在于,所述嵌合腺病毒表达从第一腺病毒和选择的腺病毒形成的功能性嵌合蛋白,所述嵌合蛋白选自聚合酶、末端蛋白、52/55kDa蛋白和IIIa。
17.如权利要求13所述的嵌合腺病毒,其特征在于,所述嵌合腺病毒含有所选腺病毒的末端蛋白、52/55kDa蛋白和/或IIIa。
18.含有权利要求12所述嵌合腺病毒的宿主细胞。
19.如权利要求18所述的宿主细胞,其特征在于,所述宿主细胞是人细胞。
20.选自下组的分离的猿腺病毒核酸序列(a)具有SEQ ID NO12的核酸1到31967的序列的SA18和(b)与(a)到(f)中任一条序列互补的核酸序列。
21.选自以下一种或多种的分离的猿腺病毒血清型核酸序列SA18 SEQ IDNO12的(a)5’末端反向重复(ITR)序列;(b)腺病毒E1a区域,或其选自13S、12S和9S区域的片段;(c)腺病毒E1b区域,或其选自小T、大T、IX和IVa2区域的片段;(d)E2b区域;(e)L1区域,或其选自28.1kD蛋白、聚合酶、羔蛋白、52/55kD蛋白和IIIa蛋白的片段;(f)L2区域,或其选自五邻体、VII、VI和Mu的片段;(g)L3区域,或其选自VI、六邻体或内切蛋白酶的片段;(h)2a蛋白;(i)L4区域,或其选自100kD蛋白、33kD同系物和VIII的片段;(j)E3区域,或其选自E3 ORF1、E3 ORF2、E3 ORF3、E3 ORF4、E3 ORF5、E3 ORF6、E3 ORF7、E3 ORF8和E3 ORF9的片段;(k)L5区域,或其选自尾丝蛋白的片段;(1)E4区域,或其选自E4 ORF7、E4 ORF6、E4 ORF4、E4 ORF3、E4 ORF2、和E4 ORF1的片段;和(m)3’ITR,或与(a)到(m)中任一条互补的序列。
22.由权利要求21所述核酸序列编码的猿腺病毒蛋白。
23.一种用于传递至选择的宿主细胞、含有连接于异源分子的如权利要求22所述的猿腺病毒衣壳蛋白的组合物。
24.一种靶向具有腺病毒受体的细胞的方法,所述方法包括传递如权利要求23所述的组合物至受试对象。
25.一种含有如权利要求21所述的异源猿腺病毒序列的核酸分子。
26.如权利要求25所述的核酸分子,其特征在于,所述猿腺病毒序列在宿主细胞中编码腺病毒基因产物并且操作性连接于指导腺病毒基因产物表达的调节控制序列。
27.如权利要求25所述的核酸分子,其特征在于,所述猿腺病毒序列含有SA18 SEQ ID NO12所示E1a区域。
28.一种含有如权利要求27所述的核酸分子与生理相容的载体的药物组合物。
29.一种具有衣壳的重组腺病毒,其含有选自下组的蛋白(a)SEQ ID NO 13所示的SA18的六邻体蛋白,或其独特的片段;(b)SEQ ID NO 14所示的SA18的五邻体蛋白,或其独特的片段;(c)SEQ ID NO 15所示的SA18的尾丝蛋白,或其独特的片段;
30.如权利要求29所述的重组腺病毒,其特征在于,所述衣壳是人工血清型。
31.如权利要求29所述的重组腺病毒,其特征在于,所述病毒还含有操作性连接于指导所述基因在宿主细胞中表达的序列的异源基因。
32.如权利要求29所述的重组腺病毒,其特征在于,所述腺病毒还含有复制和衣壳化所需的5’和3’腺病毒顺式元件。
33.如权利要求29所述的重组腺病毒,其特征在于,所述载体缺乏所有或部分E1基因。
34.一种含有异源核酸分子的宿主细胞,所述分子含有如权利要求21所述的核酸序列。
35.如权利要求34所述的宿主细胞,其特征在于,所述宿主细胞用核酸分子稳定地转化。
36.如权利要求34所述的宿主细胞,其特征在于,所述宿主细胞表达一种或多种来自所述核酸分子的腺病毒基因产物,所述腺病毒基因产物选自E1a、E1b、E2a和E4 ORF6,
37.如权利要求34所述的宿主细胞,其特征在于,所述宿主细胞用核酸分子稳定地转化,所述核酸分子含有猿腺病毒末端反向重复。
38.一种含有用药学上可接受的载体配制的如权利要求29所述重组病毒的组合物。
39.一种将异源基因传递至哺乳动物细胞的方法,所述方法包括将有效量的如权利要求29所述的重组病毒引入所述细胞。
40.一种将异源基因重复施用至哺乳动物的方法,所述方法包括以下步骤(a)将含有异源基因的第一载体引入所述哺乳动物,和(b)将含有异源基因的第二载体引入所述哺乳动物;其中至少第一病毒或第二载体是如权利要求29所述的病毒并且其中第一和第二重组载体是不同的。
41.一种生产选择的基因产物的方法,所述方法包括用如权利要求29所述的重组病毒感染哺乳动物细胞,在合适条件下培养所述细胞并从所述细胞培养物中回收表达的基因产物。
42.一种在哺乳动物宿主中引发抗传染媒介物的免疫应答的方法,所述方法包括向所述宿主施用有效量的如权利要求29所述的重组腺病毒,其中所述异源基因编码传染媒介物的抗原。
43.如权利要求43所述的方法,其特征在于,所述方法包括在施用重组腺病毒之前用含有异源基因的DNA疫苗引发宿主的步骤。
全文摘要
一种提供来自血清型的腺病毒的方法,所述血清型不能在所需细胞系中有效生长,而所述腺病毒具有在所需细胞系中生长的能力。该方法涉及用来自能在所需细胞系中有效生长的腺病毒的对应末端取代腺病毒的左右末端。左末端至少跨越5’末端反向重复,左末端至少跨越E4区域和3’末端反向重复。得到的嵌合腺病毒含有跨越编码五邻体、六邻体和尾丝的基因的内部区域,所述基因来自不能在所需细胞中有效生长的血清型。也提供了构建自新颖的猿腺病毒序列和蛋白的载体、含有相同物质的宿主细胞及其用途。
文档编号C07K14/075GK1833027SQ200480022234
公开日2006年9月13日 申请日期2004年6月15日 优先权日2003年6月20日
发明者S·罗伊, J·M·威尔森 申请人:宾夕法尼亚州立大学托管会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1