用于体外病毒基因组工程的组合物和方法与流程

文档序号:11779633阅读:167来源:国知局
用于体外病毒基因组工程的组合物和方法与流程
相关申请的交叉引用本申请根据usc§119(e)要求2014年12月16日提交的美国临时专利申请第62/092,707号,2015年1月12日提交的美国临时专利申请第62/102,362号,以及2015年10月16日提交的美国临时专利申请第62/242,811号,所述美国临时专利申请的每一个的全部内容通过引用并入本文。序列表本申请包含对已作为序列表文本文件“sgi1840_3wo_sequence_listing_st25.txt”(文件大小千字节(139kb),创建于2015年12月15日,其依据37c.f.r.1.52(e)(iii)(5)通过引用整体并入本文)与本申请同时提交的核酸序列的引用。本公开的领域本公开总体上涉及基因组的快速工程,更具体地涉及在体外工程化病毒基因组。背景资料病毒被用于许多科学应用,尤其是用于预防剂、治疗剂和诊断剂的开发。为了这些目的,往往将病毒进行遗传工程。体内工程需要易控的宿主生物体,并且往往需要数周至数月的时间才能产生经修饰的病毒和病毒载体(levin和bull,natrevmicrobiol.,2004年2月;2(2):166-73,通过引用并入本文)。另外,在细胞中存在与许多病毒基因组的操作内在地相关的毒性问题。迄今为止,开发用于大型病毒基因组的体外遗传工程的方法的努力受到独特的限制性内切酶靶序列的可用性以及获得的进行基因组消化和随后的重组组装的低效率限制。此外,许多遗传工程的努力被错误预测的病毒基因组末端阻碍。例如,公共可得的pb1-样病毒基因组不正确地将末端序列置于基因组的中间,这是使用当前测序和计算机基因组组装法经常发生的错误(ceyssens等,environmibrobiol.2009年11月;11(11):2874-83)。仍然需要病毒基因组的快速遗传工程,尤其是对于感染非遗传上易控的宿主的病毒。本公开利用体外cas9介导的消化和组装来位点特异性地工程化整个病毒基因组。该方法极大增加了可对病毒基因组进行基因修饰的精确度、简便性和速度。另外,该技术克服了在天然和异源宿主细胞内操作常常有毒的强毒病毒基因组的良好确立的困难。利用所公开的体外工程法还还得能够鉴定正确的病毒基因组末端,这有助于通过本公开的随后的工程。体外差错校正是用于在克隆或组装技术之后生成所需序列的无价技术。标准差错校正方法是基于pcr的,其具有两个固有的问题:1)pcr可在核酸中引入额外的不想要的突变;2)pcr,在本说明书,在其变得越来越易出错之前,具有约5kb的大小限制(quickchangesite-directedmutagenesiskitmanual,newenglandbiolabs,usa)。因此,由于pcr生成额外的突变或不能扩增完整模板,因此不能可靠地对大于5kb的质粒进行标准的基于pcr的差错校正法。本公开的概述在本公开的各个方面中,存在用于使用rna引导的核酸酶在体外工程化核酸序列的组合物和方法。在一个方面,本公开涉及通过病毒核酸序列的体外遗传工程对特定病毒性质的改良和改良的病毒组合物或颗粒。在另一个方面,本公开涉及使用rna引导的内切核酸酶(例如,cas9)体外消化病毒核酸序列,随后通过将dna或rna片段插入已消化的病毒核酸中来组装重组核酸序列。在一些实施方案中,本公开提供了包含工程化的病毒核酸的工程化的病毒,所述工程化的病毒核酸在引入宿主细胞时,相较于通过将非工程化的病毒核酸引入宿主细胞而产生的病毒颗粒,能够产生具有两种或更多种改良的病毒性质的非天然存在的病毒颗粒。在一些方面,所产生的病毒颗粒具有至少3种改良的病毒性质。在一些方面,每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些方面,所述工程化的病毒核酸是工程化的病毒基因组。在一些方面,所述工程化的病毒基因组是工程化的噬菌体基因组。在一些方面,改良的病毒性质中的至少一种是宿主范围。在一些方面,每种改良的病毒性质是工程化的病毒核酸中的至少一个修饰的结果。在一些方面,至少一种改良的病毒性质是工程化的病毒核酸中的至少两个修饰的结果。在一些方面,所述工程化的病毒核酸中的至少一个修饰是单个工程化步骤的结果。在一些方面,所述工程化的病毒核酸中的至少一个修饰是迭代工程化步骤的结果。在一些方面,至少一个修饰在与seqidno:1、seqidno:2、seqidno:3、seqidno:4、seqidno:50或seqidno:25具有至少85%同一性的核酸序列内。在一些方面,至少一个修饰在编码与seqidno:34、seqidno:35、seqidno:36、seqidno:5、seqidno:48或seqidno:49具有至少85%同一性的氨基酸序列的核酸序列内。在一些方面,所述工程化的病毒基因组包含与luz19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还包含异源gp18基因的全部或部分。在一些方面,所述异源gp18基因与seqidno:26具有至少85%同一性。在一些方面,所述异源gp18基因编码与seqidno:38具有至少85%同一性的氨基酸序列。在一些方面,所述工程化的病毒基因组包含与luz19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还包含工程化的gp34基因的全部或部分。在一些方面,所述工程化的gp34基因编码在对应于seqidno:5的氨基酸位置55的位置处包含突变的氨基酸序列。在一些方面,工程化的病毒基因组包含与luz19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还在与选自由seqidno:1、seqidno:2、seqidno:3和seqidno:50组成的组的序列具有至少85%同一性的一个或多个序列中包含修饰。在一些方面,所述工程化的病毒基因组还在以下序列中的每一个中包含修饰:与seqidno:1具有至少85%同一性的序列、与seqidno:2具有至少85%同一性的序列、与seqidno:3具有至少85%同一性的序列以及与seqidno:50具有至少85%同一性的序列。在一些方面,所述修饰包括对应于seqidno:1的核酸位置50的位置处的g至a的替换、对应于seqidno:50的核酸位置160的位置处的g至t的替换、对应于seqidno:2的核酸位置245的位置处的a至g的替换、对应于seqidno:2的核酸位置247-248的位置处的at至tc的替换以及对应于seqidno:3的核酸位置757的位置处的a至g的替换。在一些方面,所述工程化的病毒基因组包含与luz19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还在编码与选自由seqidno:34、seqidno:35、seqidno:36和seqidno:48组成的组的序列具有至少85%同一性的氨基酸序列的一个或多个核酸序列中包含修饰。在一些方面,所述工程化的病毒基因组在编码以下氨基酸序列中的每一个的核酸序列中包含修饰:与seqidno:34具有至少85%同一性的氨基酸序列、与seqidno:35具有至少85%同一性的氨基酸序列,与seqidno:36具有至少85%同一性的氨基酸序列和与seqidno:48具有至少85%同一性的氨基酸序列。在一些方面,所述修饰包括对应于seqidno:34的氨基酸位置17的位置处的c至y的替换、对应于seqidno:48的氨基酸位置36的位置处的d至y的替换、对应于seqidno:35的氨基酸位置82的位置处的d至g的替换、对应于seqidno:35的氨基酸位置83的位置处的i至s的替换,以及对应于seqidno:36的氨基酸位置253的位置处的n至d的替换。在一些方面,所述工程化的病毒基因组包含与luz19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还在与seqidno:25具有至少85%同一性的序列内包含修饰。在一些方面,所述修饰是将异源核酸分子插入与seqidno:25具有至少85%同一性的序列中,或者用异源核酸分子置换包含在与seqidno:25具有至少85%同一性的序列内的序列。在一些方面,所述异源核酸分子包含与选自由seqidno:6、seqidno:12、seqidno:13、seqidno:14、seqidno:16、seqidno:17、seqidno:18、seqidno:19和seqidno:20组成的组的序列具有至少85%同一性的异源核酸序列。在一些方面,所述工程化的病毒基因组包含与luz19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还在编码与seqidno:49具有至少85%同一性的氨基酸序列的核酸序列内包含修饰。在一些方面,所述修饰是将异源核酸分子插入编码与seqidno:49具有至少85%同一性的氨基酸序列的核酸序列中,或者用异源核酸分子替换包含在编码与seqidno:49具有至少85%同一性的氨基酸序列的核酸序列内的核酸序列。在一些方面,所述异源核酸分子包含编码与选自由seqidno:37、seqidno:39、seqidno:40、seqidno:41、seqidno:43、seqidno:44、seqidno:45、seqidno:46和seqidno:47组成的组的序列具有至少85%同一性的氨基酸序列的异源核酸序列。在一些方面,所述工程化的病毒核酸包含可操作地连接至启动子的异源核酸序列,所述启动子含有包含在seqidno:21或其部分内的核酸序列。在一些方面,所述工程化的病毒核酸包含可操作地连接至终止子的异源核酸序列,所述终止子包含seqidno:22或其部分的核酸序列。在一些实施方案中,本公开提供了用于生成具有两种或更多种所需病毒性质的工程化的目标病毒的方法,其包括:(a)提供第一病毒基因组;和(b)通过将第一病毒基因组的至少一个片段与至少一种修复核酸分子组合以生成工程化的第二病毒基因组来生成工程化的病毒基因组,所述第二病毒基因组相较于所述第一病毒基因组包含至少一个修饰;其中,所述第二病毒基因组在引入宿主细胞中时能够产生具有两种或更多种改良的病毒性质的病毒颗粒。在一些方面,所述方法还包括(c)在一次或多次迭代中重复步骤(a)-(b)。在一些方面,每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些方面,可互换使用一种或多种改良的性质和一种或多种改良的病毒性质。在一些方面,在步骤(b)中生成工程化的病毒基因组包括:(1)使用内切核酸酶体外消化第一病毒基因组的区域;和(2)将经消化的第一病毒基因组的至少一个片段与至少一个修复核酸分子组装。在一些方面,从病毒颗粒分离第一病毒基因组。在一些方面,从头合成所述第一病毒基因组或所述至少一种修复核酸分子。在一些方面,从头合成包括组合化学合成的核酸分子、pcr扩增的核酸序列、分离的核酸分子的消化片段或其任何组合。在一些方面,在体外消化之前扩增所述第一病毒基因组或所述至少一种修复核酸分子。在一些方面,所述第一病毒基因组为至少3kb、至少10kb、至少18kb、至少25kb或至少30kb。在一些方面,在体外或体内进行组装。在一些方面,在对于将片段插入经消化的病毒核酸中以形成包含工程化的病毒基因组的重组核酸是有效的条件下,利用混合物在体外进行组装,所述混合物包含:(a)缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶;(b)具有3'外切核酸酶活性的分离的非链置换dna聚合酶,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物;(c)分离的连接酶;和(d)dntp的混合物。在一些方面,所述内切核酸酶是rna引导的核酸酶。在一些方面,所述方法还包括至少一种引导rna。在一些方面,所述rna引导的核酸酶是cas9或cas9衍生的酶,并且其中所述至少一种引导rna包括1)嵌合grna或2)crrna和tracrrna。在一些方面,将所述内切核酸酶在组装之前热灭活或去除。在一些方面,体外消化还包括亚精胺。在一些方面,所述方法还包括将工程化的病毒基因组转化到宿主细胞中。在一些方面,所述方法还包括使用用于将工程化的病毒基因组包装到病毒颗粒中的体外包装试剂盒。在一些实施方案中,本公开提供了通过本文公开的任何方法产生的工程化的病毒。在一些方面,所述工程化的病毒是本文中公开的任何工程化的病毒。在一些实施方案中,本公开提供了用于工程化病毒核酸分子的试剂盒,其包含:(a)纯化的重组rna引导的核酸酶;(b)缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶;(c)具有3'外切核酸酶活性的分离的非链置换dna聚合酶,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物;和(d)分离的热稳定的连接酶。在一些方面,试剂盒还包含以下的一种或多种:(1)拥挤试剂;(2)dntp的混合物;和(3)合适的缓冲液。在一些方面,试剂盒还包括定制设计的引导rna。在一些方面,试剂盒还包含定制设计的合成核酸分子,以在组装反应中用作插入的dna片段。在一些方面,试剂盒还包含用于转化的感受态宿主细胞。在一些方面,试剂盒还包含分离的病毒基因组核酸。在一些实施方案中,本公开提供了体外工程化的病毒核酸系统,其包含:分离的病毒核酸、重组rna引导的核酸酶、至少一种引导rna和待插入分离的核酸消化位点的核酸片段。在一些方面,所述系统使得重组rna引导的核酸酶和至少一种靶向rna形成能够消化分离的病毒核酸的复合物。在一些方面,所述系统还包含亚精胺。在一些方面,所述系统还包含:缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶;具有3'外切核酸酶活性的分离的非链置换dna聚合酶,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物;分离的连接酶;和dntp的混合物,其中所述系统处于对在rna引导的核酸酶消化位点将核酸片段插入分离的病毒核酸中以形成重组病毒核酸是有效的条件下。在一些方面,本文所述的系统使得重组病毒核酸与由非工程化的病毒核酸导致的病毒颗粒相比,能够产生具有至少两种改良的病毒性质的非天然存在的病毒颗粒。在一些实例中,改良的一种或多种病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些方面,在本文所述的系统中,rna引导的核酸酶是cas9或cas9衍生的酶。在一些方面,将rna引导的核酸酶在组装之前灭活或去除。在一些实施方案中,本公开提供了工程化核酸序列的方法,所述方法包括:(a)提供核酸;(b)使用rna引导的核酸酶体外消化核酸区域;和(c)通过将dna片段插入消化的核酸中来组装重组核酸,其中在对于将片段插入消化的核酸中以形成重组核酸是有效的条件下,利用组分的混合物在单个容器中在体外进行所述组装,所述混合物包含:(i)缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶;(ii)具有3'外切核酸酶活性的分离的非链置换dna聚合酶,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物;(iii)分离的连接酶;和(iv)dntp的混合物。在一些方面,所述rna引导的核酸酶是cas9或cas9衍生的酶。在一些实例中,在组装之前通过暴露于热使rna引导的核酸酶失活或去除所述核酸酶。在一些方面,所述方法还包括:(d)将重组核酸转化到宿主细胞中。在一些方面,本公开提供了工程化核酸的方法,其中所述核酸是从宿主细胞分离的质粒。在一些方面,质粒为至少5kb。在一些方面,质粒为至少6kb。在一些方面,质粒为至少10kb。在一些方面,质粒为至少15kb。在一些方面,质粒为至少20kb。附图简述图1a-1f显示了直接工程化病毒基因组的体外方法的示意图。a)利用本领域技术人员已知的方法从纯化的病毒颗粒提取基因组。灰线表示示例性dsdna病毒基因组。基因组末端的浅灰色线条表示通常在许多病毒基因组中发现的正向末端重复序列。b)然后使用与纯化的靶向rna(诸如嵌合grna、crrna和tracrrna或单独的crrna)偶联的rna引导的核酸酶(诸如cas9)在一个或多个位置位点上消化病毒基因组。图示描绘了靶向确定的病毒基因组位置(如由给定的rna所指定的)的rna引导的核酸酶。c)使用本领域已知的方法使rna引导的核酸酶失活,所述方法包括但不限于暴露于热或使用经典的苯酚-氯仿提取去除。d)使用本领域已知的方法获得dna或rna插入物,所述方法包括但不限于体外合成、扩增(pcr)或酶介导的从质粒、病毒或细菌基因组dna(gdna)的释放。图描绘了具有对应于与侧连rna引导的核酸酶消化位点的病毒序列的同源区(灰色末端区域)的新生成的插入物(深灰色线)。e)在体外使用本领域已知的方法组装经消化的病毒基因组和纯化的插入物,所述方法包括但不限于gibson组装、slic和/或goldengate组装。图示描绘了组装的重组基因组,现在在所需位置具有新的插入序列(深灰色线)。f)使用本领域已知的方法将重组病毒基因组直接转化到宿主细胞中,所述方法包括但不限于电穿孔或化学转化。卡通图显示了在将感染性病毒基因组转化到易感宿主细胞后功能性病毒颗粒的回收。图2a-2f显示病毒基因组的体外工程。a)直接从病毒颗粒纯化~43kbdsdnaluz19病毒基因组。b)使用rna依赖性核酸酶cas9和体外转录的grna在两个独立位置对纯化的病毒基因组进行位点特异性消化,以去除gp7基因片段。c)将pcr用于从病毒φkf77扩增gp7基因。d)将体外gibson组装用于将pcr扩增的φkf77gp7基因片段序列特异性地无缝地整合到经消化的luz19基因组中。e)将感染的体外组装的基因组直接转化到宿主细胞中以回收功能性病毒颗粒,通过噬斑形成来证明。f)使用内部和外部引物来pcr验证:病毒在正确的基因组位点含有新的dna片段。所有测试的病毒克隆对于新的插入φkf77gp7片段(右侧7条泳道)为pcr阳性。图3a-3b显示了在体外病毒基因组工程后具有改善的病毒性质的病毒的生成。a)描绘天然luz19病毒的基因组和含有替换天然luz19gp18序列的lkd16病毒gp18基因的工程化的衍生物的图。黑色箭头表示天然luz19开放阅读框架,而灰色箭头表示新整合的lkd16gp18基因。b)左图,维恩图显示luz19和lkd16病毒感染的共享的和独立的宿主细菌。测试了282个铜绿假单胞菌(p.aeruginosa)临床分离株的多样化集合体。右图,维恩图显示含有lkd16gp18基因的工程化的luz19病毒具有扩大的宿主范围,包括先前只被lkd16感染的6个菌株中的3个。图4a-4c是显示用于鉴定和选择宿主范围扩大和工程化能够感染病毒属的完全宿主范围的广宿主范围病毒所需的遗传元件和点突变的方法的示意图。a)用于鉴定负责宿主范围特异性的突变的方法的示意图。b)描绘生成广宿主范围luz19(whrluz19)病毒所需的基因组修饰的意示;星号(*)标识与宿主范围相关的每个点突变的位置。标记gp13c17y、gp18d36y、gp38d82g和i83s,以及gp40n253d描述了与luz19宿主扩大相关的基因产物和氨基酸点突变。pa7245、pa7255、pa7410、pa7427、pa7503和pa7686是仅对lkd16和whrluz19易感的铜绿假单胞菌临床分离株;pa7649是仅对φkmv和whrluz19敏感的铜绿假单胞菌临床分离物。在给定的突变上方描述在添加给定突变后感染的临床分离株。c)左图,维恩图显示被luz19、lkd16和φkmv病毒感染的共享和独立的宿主细菌。右图,维恩图显示了含有上述点突变的工程化的whrluz19病毒能够感染所有67个对病毒φkmv属易感的菌株。图5a-5e显示luz19gp34蛋白的突变提高了裂解活性。a)luz19gp34蛋白是病毒尾管复合物的成员(见嵌入图像)。b)用于表达野生型luz19gp34或gp34δ亮氨酸55(l55δ)突变的两个相关噬菌体(噬菌体*)的软琼脂噬斑测定。在两天的时期中获取图像,图像表明表达gp34l55δ突变的噬菌体具有增加的裂解区。c)结晶紫生物膜测定外推生物膜生物质为包含结晶紫的量度。与野生型luz19相比,表达gp34l55δ的luz19*噬菌体更能够破坏铜绿假单胞菌生物膜(进行8小时)。将庆大霉素以最小抑制浓度(mic)的10倍用于完全去除生物膜。d)显示gp34突变相较于野生型luz19基因组的位置的图示。e)显示luz19与表达gp34l55δ的luz19之间的吸收和裂解量的差异的表。图6a-6f是显示具有对两种独立性质的改良的病毒的迭代工程的示意图。a)luz19lkd16gp18病毒gdna的示意图,其中用lkd16同源物替换野生型luz19gp18基因。以黑色表示野生型luz19基因组序列;以灰色表示来自lkd16的gp18。b)实验室和mdr临床分离株对纯化的亲本(lkd16和luz19)和luz19lkd16gp18工程化的病毒的易感性,证明了宿主范围的整合。c)luz19*lkd16gp18病毒gdna的示意图,其中gp34的位置55处编码的亮氨酸被删除,并且luz19gp18被来自病毒lkd16的gp18替换。以黑色表示野生型luz19基因组序列;以灰色表示来自lkd16的gp18;灰色星号表示gp34δleu55。d)实验室和mdr临床分离物对纯化的亲本(lkd16、luz19和含有来自病毒lkd16的gp18的luz19lkd16gp18)和工程化的病毒(含有gp34的位置55处编码的亮氨酸的缺失的luz19*和luz19*lkd16gp18)的易感性,证明了uz19lkd16gp18和luz19*lkd16gp18病毒宿主范围的整合。e)野生型和工程化的噬菌体针对附着至角质形成细胞单层的细菌的裂解活性的评估。附着至细胞的pa01k和pa7245细菌的数量报告为用角质形成细胞单层孵育的总细菌的百分比。数据显示luz19*和luz19*lkd16gp18病毒的提高的裂解活性。f)相较于亲代病毒由工程化的噬菌体产生的改良的pao1k和pa7245的8小时早期生物膜破裂。将庆大霉素以10倍的最小抑制浓度用于完全去除生物膜。显示的数据表示以一式三份重复进行的3个单独的实验。条块表示平均值±sem;*p<0.01;**p<0.001;***p<0.0001。图7a-7f是显示对具有两种独立性质的改良的病毒进行迭代工程化的第二实例的示意图。a)经工程化以从改良的gp49基因座表达各种遗传编码的有效载荷的luz19的示意图。用含有侧接主要衣壳(gp32)启动子和终止子(pgp32和tgp32)的目的基因(goi)的盒替换gp49基因。生物膜分散性goi使用:eps解聚酶(pp15gp44-来自恶臭假单胞菌(pseudomonaspudita)15的尾部突起gp44;ntugp34-来自肺炎克雷伯菌(klebsiellapneumoniae)噬菌体ntuh-k2044-k1-1(ntu)的尾部突起gp34;lka1gp49-来自铜绿假单胞菌噬菌体lka1的尾部突起gp49)、来自表皮葡萄球菌(staphylococcusepidermidis)(psma)和金黄色葡萄球菌(staphylococcusaureus)(psma3和psmb2)的表面活性剂酚溶性吗啉和来自伴放线菌聚集菌(aggregatibacteractinomycetemcomitans)的dspb表面活性素。b)生物膜分散测定显示针对用100个噬菌体处理3小时的24小时的铜绿假单胞菌pao1k生物膜的工程化的luz19噬菌体活性。以10倍的最小抑制浓度(mic)使用庆大霉素。c)进一步经工程化以从经修饰的gp49基因座表达goi的先前工程化的whrluz19噬菌体的示意图。d)生物膜分散测定显示经进一步修饰以表达具有针对用100个噬菌体处理3小时的24小时的铜绿假单胞菌pao1k生物膜的活性的酶和表面活性素的工程化的whrluz19。工程化的有效载荷:eps解聚酶pp15gp44和sepsma。以10倍的mic使用庆大霉素。e)实验室和临床分离物对纯化的亲本(lkd16和luz19)和luz19衍生物的易感性,证实了在进一步工程化以表达生物膜分散部分后宿主范围的整合和维持。f)维恩图显示在添加生物膜分散有效载荷pp15gp44和sepsma后whrluz19宿主范围的保持。图8a-8c是显示当与抗生素的亚抑制浓度组合时能够阻止宿主细胞获得病毒抗性的病毒的产生的示意图。a)经工程化以从ms2或prr1噬菌体表达溶素的野生型luz19的图示。b)和c)时间杀灭测定显示铜绿假单胞菌pao1k对亚抑制浓度(cb-1/5xmic)的由表达ssrna噬菌体的溶素的luz19产生的羧苄青霉素的敏化。这些数据表明,与亚抑制抗生素浓度组合的表达非天然溶素的工程化的噬菌体可防止细菌迅速获得对单一病毒的抗性。图9a-9d是显示能够阻止宿主细胞获得病毒抗性的第二病毒的产生的示意图。a)经工程化以从经修饰的gp49基因座表达细菌素蛋白pyos5的野生型luz19的示意图。b)时间杀灭测定显示,xdrpa菌株pa7416的生长最初被野生型luz19抑制,然而,细菌迅速逃避病毒,从而导致细菌再生长。每孔添加约1x107cfu。在0小时时添加高moi=10pfu/cfu和低moi=.01pfu/cfu的指定的病毒或媒介物。c)时间杀灭测定显示,编码pyos5的luz19能够相对于野生型病毒抑制xdrpa菌株pa7416的生长和再生长。每孔添加约1x107cfu。在0小时时添加高moi=10pfu/cfu和低moi=.01pfu/cfu的指定的病毒或媒介物。d)在野生型luz19或luz19+pyos5存在的情况下在24小时后pa7416生长的比较。图表描绘了低moi实验的数据。图10是整合靶向病毒基因组编辑与噬菌体表型筛选以产生在两个或更多个特征上具有改良的经遗传修饰的噬菌体的系统的示意图。所述系统依赖于对具有所需表型性状的突变型或天然病毒的迭代轮次的筛选和测序,以及在单个或多个工程步骤中将那些性状整合到一个或多个病毒底盘(viralchassis)中。该方法提供了快速鉴定特定噬菌体表型性状背后的遗传元件,将多个独立的突变基因或等位基因整合到单个噬菌体基因组中,以及产生组合两种或更多种改良的性状的工程化的病毒的直接和合理的方法。图11a-11g显示大肠杆菌(e.coli)噬菌体m13基因组的体外工程。a)大肠杆菌温和噬菌体m13mp18和m13paprika的示意图。b)在利用rna引导的内切核酸酶cas9的独立反应中使用grna1和2体外消化的环状m13基因组dna的凝胶电泳。凝胶下的图分别描绘了未消化和双重消化的m13基因组的环状和线性特征。这些数据表明,两种grna均在正确的位置上准确且完全地消化了m13dsdna。c)在相同反应中使用grna和rna引导的内切核酸酶cas9(双重消化)体外消化的环状m13基因组dna的凝胶电泳。凝胶下的图分别描绘了未消化和双重消化的m13基因组的环状和线性特征。d)显示pcr产生的插入物含有paprika荧光报道分子的凝胶电泳。e)将体外消化的和组装的工程化的m13paprikagdna转化到大肠杆菌细胞中以回收功能性病毒颗粒。病毒噬斑是暗淡的和遮掩的,因为m13是不裂解宿主细胞,从而导致噬斑形成不良的温和噬菌体。未消化的m13gdna用作阳性对照。用cas9消化的,但在插入物不存在(无插入物)的情况下组装的m13gdna证明了消化的完整性和本底的低水平。f)m13paprika工程化的噬斑pcr验证。正向和反向引物被设计在插入物同源区的外部。非工程化的m13gdna产生0.9kb的产物,并用作pcr反应的阴性对照。g)噬斑形成过程中亲本和工程化的m13paprika的荧光(底部)和明视野(顶部)图像。图12a-12e显示第二大肠杆菌噬菌体基因组的体外工程。a)大肠杆菌噬菌体λδcii的示意图。线性噬菌体基因组大小为48.5kb。b)在利用rna引导的内切核酸酶的独立反应中使用grna1和2体外消化的λ基因组dna的凝胶电泳。凝胶下方的图描绘了线性未消化的产物和预期的消化产物。这些数据表明,grna在正确的位置上准确且完全地消化λdsdna。c)在相同反应中使用grna和rna引导的内切核酸酶体外双重消化的λ基因组dna的凝胶电泳。凝胶下方的图描绘了线性消化的产物和预期的双重消化产物。d)示意图描述噬菌体λ包装缓冲液用于体外包装野生型和重组噬菌体基因组的用途。按照制造商的方案体外包装cas9双消化和组装的噬菌体λ基因组,并将其铺在大肠杆菌上以回收新工程化的λδcii噬菌体。e)λδcii基因的pcr验证。正向引物位于工程化的区域外部。缺失阳性克隆具有300bp的预期大小。图13a-13d显示来自人巨细胞病毒病毒(hcmv)的序列的体外工程。a)235kb全长hcmv病毒基因组的示意图。顶部雪茄形基因组代表全长基因组,而黑色部分表示操纵区域。小的白色部分表示使用本文所述的体外工程方法添加的235bp插入物。b)使用两种grna和rna引导的内切核酸酶cas9体外双重消化的含有hcmv基因组的17.8kb区域的质粒的凝胶电泳。凝胶下方的图描绘了环状未消化的产物和线性双重消化产物。这些数据表明,两种grna均在正确的位置上准确且完全地消化hcmvdsdna序列。c)显示含有新的rl13插入序列的pcr产生的插入物的凝胶电泳。d)经修饰的hcmv序列的pcr验证。正向引物位于工程化区域的外部。插入阳性克隆具有500bp的预期大小。图14a-14f显示噬菌体末端的快速鉴定。a)从纯化的病毒颗粒分离基因组dna。b)gdna(miseq或pacbio)的下一代测序和高质量dna的自动合并读取到更长的组装物中以重建原始序列。以浅灰色表示dtr-正向终端重复。自动组装软件将终末重复基因组的dtr错误地放置在病毒序列的内部区域。通过预测序列的靶向cas9消化来证实基因组物理末端。c)基于双重覆盖测序区域的鉴定和匹配紧密相关的末端重复基因组的blast搜索的物理基因组末端的计算机预测。通过预测的物理末端的cas9内切核酸酶切割来确认物理末端。d)在cas9失活后,对对应于基因组物理末端的dna片段进行纯化和测序。e)基于物理末端测序的准确基因组组装。f)使用在通过计算机基因组重排预测的特定位置处的cas9靶向消化对lbl3和14-1噬菌体(末端重复基因组)进行基因组物理末端作图的实例。浅灰色箭头指向经纯化和测序的dna片段。图15a-15c是嵌合sgrna设计和合成策略的示意图。a)显示侧接目标基因(goi)的nggpam基序(加以下划线的深灰色序列)和sgrna靶位点(浅灰色序列)的位置的图示。黑色序列表示剩余的病毒基因组序列。b)用作用于sgrna的体外转录的模板的寡核苷酸的设计。构成t7启动子、sgrna靶向序列和保守嵌合sgrna区域的序列分别以加下划线的深灰色、浅灰色和黑色文本表示。c)体外转录的嵌合sgrna的图。浅灰色和黑色序列分别表示构成每一个功能性sgrna的靶向和保守嵌合区。所有n表示用于改变每个sgrna的靶特异性的可变序列。说明性实施方案的详述本公开提供了用于体外工程化的组合物和方法,并且还涉及病毒性质的改良。本公开还提供了用于核酸的体外工程方法。在描述本发明的组合物和方法之前,应当理解,本公开不限于所描述的特定组合物、方法和实验条件,因为此类组合物、方法和条件可变化。还应当理解,本文中使用的术语仅用于描述特定实施方案的目的,并不旨在限制,因为本公开的范围将仅在所附权利要求中予以限制。除非另有定义,否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。虽然,与本文中描述的那些方法和材料相似或等同的任何方法和材料可用于本公开的实施或测试,但现在描述优选方法和材料。下面所示的定义是为了理解本公开内容,但绝对不应被认为取代对本领域普通技术人员所持的术语的理解。如本说明书和所附权利要求中所用,除非上下文另有明确规定,否则单数形式“一个/种(a)”、“一个/种(an)”和“该(the)”包括多个所指物。因此,例如,对“所述方法”的引用包括一个或多个本文所述的类型的方法和/或步骤,这对在阅读本公开等后的本领域技术人员来说将是显而易见的。如本文中所用,当提及任何数值时,术语“约”或“大致”旨在意指加上或减去所述值的正或负10%的值。例如,“约50℃”(或“大致50℃”)包括从45℃至55℃的温度范围(包括45℃和55℃)。类似地,“约100mm”(或“大致100mm”)包括从90mm至110mm的浓度范围(包括90mm和110mm)。或者,“约”或“大致”可意指在所述值的5%内,或在一些情况下在所述值的2.5%内,或者“约”可意指四舍五入至最接近的有效数字。申请内提供的所有范围都包括该范围的上端和下端的值。如本文中所用,术语“细胞”、“细胞培养物”、“细胞系”、“重组宿主细胞”、“受体细胞”和“宿主细胞”包括原代受试者细胞及其任何后代,而不与考虑到转移次数。应当理解,并非所有后代与亲本细胞完全相同(由于有意或无意的突变或环境差异);然而,此类改变的后代被包括在这些术语中,只要后代保持与原始转化的细胞相同的功能。如本文中所用,术语“组装(assembly)”或“组装(assemble)”是指dna或rna分子的联接。如本文中所用,术语“修复核酸分子”是指能够与一个或多个dna片段或消化的或切割的dna质粒或dna核酸分子组装以生成连续核酸序列分子或封闭的质粒dna的核酸分子。术语“从头合成”、“从头组装”、“化学合成”和“dna合成”是指无需预先存在的前体模板来产生核酸序列的方法。在“体外”进行的本发明的那些方法中,所有蛋白质组分都是分离的和/或基本纯化的。不在活细胞中进行体外组装反应,或不用粗制细胞提取物进行所述反应;在无细胞环境中进行反应。“功能性rna分子”是可与一种或多种蛋白质或核酸分子相互作用,以进行或参与影响除产生除所述功能性rna的基因外的基因或基因产物的表达或活性的结构、催化或调节功能的rna分子。功能性rna可以是例如转运rna(trna)、核糖体rna(rrna)、反义rna(asrna)、微rna(mirna)、短发夹rna(shrna)、小干扰rna(sirna)、crispr系统的引导rna(grna)、crisprrna(crrna)或反式激活rna(tracrrna)、小核仁rna(snorna)、piwi相互作用rna(pirna)或核酶。术语“基因”被广泛地用于指编码多肽或表达的rna的核酸分子(通常是dna,但任选的rna)的任何区段。因此,基因包括编码表达的rna的序列(其可包括多肽编码序列或例如功能性rna,诸如核糖体rna、trna、反义rna、微rna、短发夹rna、grna、crrna、tracrrna、核酶等)。基因还可包含对于其表达是所需的或影响其表达的调控序列,以及以其天然状态与蛋白质或编码rna的序列缔合的序列,诸如,例如内含子序列,5'或3'非翻译序列等。在一些实例中,基因可以仅指dna或rna分子的蛋白质编码部分,其可以包含或可以不包含内含子。基因的长度优选大于50个核苷酸,更优选长度大于100个核苷酸,并且基因的长度可为例如50个核苷酸至500,000个核苷酸,诸如长度为100个核苷酸至100,000个核苷酸,或长度为约200个核苷酸至50,000个核苷酸,或长度为约200个核苷酸至约20,000个核苷酸。基因可获自各种来源,包括从目标来源克隆或从已知或预测的序列信息合成。术语“核酸”或“核酸分子”是指dna或rna(例如,mrna)的区段,并且还包括具有经修饰的骨架(例如,肽核酸、锁核酸)或经修饰的或非天然存在的核碱基的核酸。核酸分子可以是双链的或单链的;包含基因或其部分的单链核酸可以是编码(有义)链或非编码(反义)链。如本文中所用,术语“编码序列”或“编码区”是指可被转录以产生功能性rna或rna转录物(所述rna转录物,当被置于适当的表达控制序列下并在适当的细胞机器或酶存在时,可被翻译成多肽)的核酸序列的区域。术语“非编码序列”或“非编码区”是指不被转录并翻译成氨基酸(例如,内含子、非翻译区等)或不被转录或不形成成熟的功能性rna序列的至少部分的核酸序列的区域。如本文中所用,术语“蛋白质”或“多肽”旨在包括单个“多肽”以及多个“多肽”,并且是指由通过酰胺键(也是称为肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指两个或更多个氨基酸的任何一条或多条链,并不指特定长度的产物。因此,在“多肽”的定义中包括肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指两个或更多个氨基酸的一条链或多条链的任何其它术语,术语“多肽”可用来替代这些术语中的任何术语或与所述术语互换使用。核酸分子可“衍生自”指定的来源,其包括核酸区段从指定来源的分离(完整或部分地)。核酸分子还可通过例如从指定的多核苷酸源直接克隆、pcr扩增或人工合成来从所指定的来源衍生,或基于与所指定的多核苷酸源相关的序列。衍生自特定来源或物种的基因或核酸分子还包括相对于所述来源核酸分子具有序列修饰的基因或核酸分子。例如,衍生自来源(例如,特定参考基因)的基因或核酸分子相对于所述来源基因或核酸分子包含非有意或有意引入的一个或多个突变,并且如果有意地引入一个或多个突变(包括取代、缺失或插入),则可通过细胞或核酸的随机或靶向突变(通过扩增或其它分子生物学技术,或通过化学合成或其任何组合)引入序列改变。衍生自编码功能性rna或多肽的参考基因或核酸分子的基因或核酸分子可编码与所述参考或来源功能性rna或多肽或与其功能性片段具有至少75%、至少80%、至少85%、至少90%或至少95%序列同一性的功能性rna或多肽。例如,衍生自编码功能性rna或多肽的参考基因或核酸分子的基因或核酸分子可编码与所述参考或来源功能性rna或多肽或与其功能性片段具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的功能性rna或多肽。如本文中所用,将“分离的”核酸或蛋白质从其中天然存在所述核酸或蛋白质的其天然环境或背景中取出。例如,将分离的蛋白质或核酸分子从在其天然或自然环境中与其相关的细胞或生物体中取出。在一些情况下,分离的核酸或蛋白质可被部分或基本上纯化,但是不需要特定的纯化水平用于分离。因此,例如,分离的核酸分子可以是已从其被天然地整合到其中的染色体、基因组或附加体中切除的核酸序列。“纯化的”核酸分子或核苷酸序列或蛋白质或多肽序列基本上不含细胞材料和细胞组分。例如,纯化的核酸分子或蛋白质可以不含除缓冲液或溶剂之外的化学物质。“基本上不含”并不旨在意指除新型核酸分子以外的其它组分是不可检测的。术语“天然存在的”和“野生型”是指在自然界中发现的形式。例如,天然存在的或野生型核酸分子、核苷酸序列或蛋白质可以存在于天然来源中并从天然来源中分离出来,并且不通过人操作来有意地修饰。如本文中所用,“表达”包括基因至少以rna产生的水平进行的表达,“表达产物”包括所得产物,例如多肽或功能性rna(例如,核糖体rna、trna、反义rna、微rna、shrna、核酶等)。术语“增加的表达”包括促进增加的mrna产生和/或增加的多肽表达的基因表达的改变。“增加的产量”,当指由基因表达、蛋白质周转率、蛋白质活化状态等导致的蛋白质的丰度或活性蛋白质的丰度时,包括相较于多肽的天然产量或酶促活性,多肽表达的量的增加、多肽的酶促活性的水平的升高或两者的组合。“外源核酸分子”或“外源基因”是指已被引入(“转化”)至细胞或病毒中的核酸分子或基因。转化的生物体可被称为重组细胞或病毒,可向其中引入另外的外源基因。如果用核酸分子转化的细胞或病毒的后代已经遗传了外源核酸分子,则其也被称为“转化的”或“重组的”。相对于正在转化的生物体,外源基因可来自不同的物种(因而是“异源的”),或者来自相同的物种(因而是“同源的”))。“内源性”核酸分子、基因或蛋白质是天然核酸分子、基因或蛋白质,因为其存在于生物体内或由其天然产生。另外,如本文中所用,术语“外源的”在基因或蛋白质上下文中是指不衍生自宿主生物体物种的基因或蛋白质。如本文中所用,术语“转基因”是指外源基因,即通过人干预引入微生物或祖先的基因。如本文中所用,基因或蛋白质的术语“直向同源物”是指其在另一物种中的功能等同物。通常在基因或物种名称后面的括号中提供的基因和蛋白质登录号,是可在由美国国立卫生研究院维护的国家生物技术信息中心(ncbi)网站(ncbi.nlm.nih.gov)上公开获得的序列记录的唯一标识符。“geninfo标识符”(gi)序列标识号对核苷酸或氨基酸序列是特定的。如果序列以任何方式改变,则分配新的gi号码。序列修订历史工具可用于跟踪出现在特定genbank记录中的序列的各种gi号、版本号和更新日期。基于登录号和gi号搜索和获得核酸或基因序列或蛋白质序列在例如细胞生物学、生物化学、分子生物学和分子遗传学的领域中是众所周知的。如本文中所用,关于核酸或多肽序列的术语“百分比同一性”或“同源性”被定义为在比对序列以获得最大百分比同一性和引入缺口(必要时)以达到最大百分比同源性后,候选序列中与已知多肽相同的核苷酸或氨基酸残基的百分比。n-末端或c-末端插入或缺失不应被解释为影响同源性,并且少于约30个、小于约20个或小于约10个氨基酸残基的至多肽序列中的内部缺失和/或插入不应被解释为影响同源性。核苷酸或氨基酸序列水平上的同源性或同一性可使用由被定制用于序列相似性搜索的程序blastp、blastn、blastx、tblastn和tblastx(altschul(1997),nucleicacidsres.25,3389-3402,和karlin(1990),proc.natl.acad.sci.usa87,2264-2268)所使用的算法,通过blast(基本局部比对检索工具)分析来测定。blast程序所使用的方法是首先考虑查询序列与数据库序列之间的相似区段(具有和不具有缺口),然后评估所鉴定的所有匹配的统计显著性,最后只总结满足预先选择的显著性阈值的那些匹配。关于序列数据库的相似性搜索中的基本问题的讨论,参见altschul(1994),naturegenetics6,119-129。用于直方图、描述、比对、期望(即,用于报告针对数据库序列的匹配的统计显著性阈值)、截止值、矩阵和过滤器(低复杂度)的搜索参数可采用默认设置。blastp、blastx、tblastn和tblastx所使用的默认评分矩阵是blosum62矩阵(henikoff(1992),proc.natl.acad.sci.usa89,10915-10919),其被推荐用于长度超过85的查询序列(核苷酸碱基或氨基酸)。对于设计用于比较核苷酸序列的blastn,评分矩阵由m(即,一对匹配残基的奖分)对n的比率(即,错配残基的罚分)来设定,其中m和n的默认值分别为+5和-4。可如下调整4个blastn参数:q=10(缺口产生罚分);r=10(缺口延伸罚分);wink=1(沿着查询序列在每个winkth位置产生词命中);且gapw=16(设定窗口宽度,其中产生含缺口比对)。用于氨基酸序列的比较的同等的blastp参数设置为:q=9;r=2;wink=1和gapw=32。可在gcg软件包10.0版中获得的序列间最佳拟合比较可使用dna参数为gap=50(缺口产生罚分)和len=3(缺口延伸罚分),而蛋白质比较中的同等设置为gap=8和len=2。因此,当提及本公开的多肽或核酸序列时,包括与全长多肽或核酸序列,或与包含完整蛋白质的至少100个、至少125个、至少150个或更多个氨基酸残基的连续序列的其片段具有至少40%、至少45%、至少50%、至少55%、至少70%、至少65%、至少70%、至少75%、至少80%或至少85%,例如至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%序列同一性的序列同一性;此类序列的变体,例如,其中至少一个氨基酸残基已被插入含有插入和取代的公开序列的n和/或c末端,和/或其内。设想的变体可另外或可选地包括通过例如同源重组或定点或pcr诱变而包含预定突变的那些变体,以及其它物种的相应多肽或核酸,包括但不限于本文所述的那些,等位基因或含有插入和取代的多肽或核酸家族的其它天然存在的变体;和/或衍生物,其中所述多肽已通过取代、化学、酶促或其它合适的方式利用除天然存在的氨基酸外的部分进行了共价修饰,所述部分含有插入和取代(例如,可检测部分诸如酶)。术语“天然的”在本文中用于指当它们天然存在于宿主、生物体或病毒中时的核酸序列或氨基酸序列。术语“非天然的”在本文中用于指不天然存在于宿主、生物体或病毒中的核酸序列或氨基酸序列。已从细胞或病毒中取出,经历实验室操作,和被引入或再引入宿主细胞或病毒中的核酸序列或氨基酸序列被认为是“非天然的”。引入宿主细胞或病毒的合成或部分合成的基因是“非天然的”。非天然基因还包括可操作地连接至已被重组至宿主基因组中的一个或多个异源调控序列的对于病毒是内源的基因。“重组”或“工程化的”核酸分子是通过人操作而改变的核酸分子。作为非限制性实例,重组核酸分子包括以下任何核酸分子:1)已在体外例如使用化学或酶促技术(例如,通过使用化学核酸合成,或通过使用用于核酸分子的复制、聚合、消化(核酸外切的或核酸内切的)、连接、逆转录、转录、碱基修饰(包括,例如,甲基化)、整合或重组(包括同源和位点特异性重组)的酶部分或完全合成或修饰的核酸分子);2)包括在自然界中并非联接的联接的核苷酸序列的核酸分子,3)已使用分子克隆技术进行工程化,使得其相对于天然存在的核酸分子序列缺少一个或多个核苷酸的核酸分子,和/或4)已使用分子克隆技术进行操作,使得其相对于天然存在的核酸序列具有一个或多个序列变化或重排的核酸分子。作为非限制性实例,cdna是重组dna分子,对于已通过体外聚合酶反应产生的,或已将接头附接至其的,或已被整合到载体诸如克隆性载体或表达载体中的任何核酸分子亦如此。如本文中所用,术语“重组蛋白质”是指通过基因工程产生的蛋白质。当应用于生物体或病毒时,术语重组、工程化的或遗传工程化的是指已通过将异源或外源(例如,非天然的)重组核酸序列引入生物体或病毒而对其进行了操作的生物体或病毒,包括但不限于基因敲除、靶向突变和基因替换、启动子替换、缺失或插入或核酸分子例如转基因、合成基因、启动子或其它序列至生物体或病毒中的转移。重组或遗传工程化的生物体或病毒也可以是其中已引入了用于基因“敲除”的构建体的生物体或病毒。此类构建体包括但不限于一种或多种引导rna、rnai、微rna、shrna、sirna、反义和核酶构建体。还包括其基因组已被cas核酸酶、大范围核酸酶或锌指核酸酶的活性改变的生物体或病毒。外源或重组核酸分子可被整合到重组/遗传工程化的病毒或生物体的基因组中,或在其它情况下不被整合到重组/遗传工程化的病毒或生物体的基因组中。如本文中所用,“重组病毒”或“重组宿主细胞”包括本公开的重组病毒的后代或衍生物。因为某些修饰可由于突变或环境影响而存在于连续世代中,所以此类后代或衍生物实际上可能与亲本细胞不完全相同,但仍包括在本文所用术语的范围内。如本文中所用,术语“工程化步骤”是指本文公开的或本领域已知的任何工程化方法的执行。例如,“工程化步骤”可以是一轮目标工程化方法,诸如,例如单轮本文中公开的外工程化方法、单次pcr介导的诱变或将两片dna连在一起的单次连接反应。同样,“迭代工程化步骤”是指连续两次或更多次执行工程化方法。当用于指多核苷酸、基因、核酸、多肽或酶时,术语“异源的”是指不从宿主物种来源的多核苷酸、基因、核酸、多肽或酶。例如,如本文中所用,“异源基因”或“异源核酸序列”是指来自与其所被引入的宿主生物或病毒的物种不同的物种的基因或核酸序列。当提及基因调控序列或用于操纵基因序列表达的辅助核酸序列(例如5'非翻译区、3'非翻译区、polya添加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源区、重组位点等)或编码蛋白质结构域或蛋白质定位序列的核酸序列时,“异源的”意指调控或辅助序列或编码蛋白质结构域或定位序列的序列来自与在基因组、染色体或附加体中与调控或辅助核酸序列或编码蛋白质结构域或定位序列的核酸序列并置的基因不同的来源。因此,与其在其天然状态(例如,在非遗传工程化的生物体或病毒的基因组中)不与其可操作地连接的基因可操作地连接的启动子在本文中被称为“异源启动子”,即使所述启动子可来源于与其所连接至的基因相同的物种(或在一些情况下,相同的生物体或病毒)。类似地,当提及工程化的蛋白质的蛋白质定位序列或蛋白质结构域时,“异源的”意指所述定位序列或蛋白质结构域来源于与通过基因工程将其整合到其中的蛋白质不同的蛋白质。“调控序列”、“调控元件”或“调控元件序列”是指位于编码序列上游(5')、内部或下游(3')的核苷酸序列。编码序列的转录和/或由编码序列的转录产生的rna分子的翻译通常受调控序列的存在或不存在影响。这些调控元件序列可包含启动子、顺式元件、增强子、终止子或内含子。调控元件可从特定多核苷酸序列的非翻译区(utr)分离或鉴定。本文所述的任何调控元件可存在于嵌合或杂交调控表达元件中。本文所述的任何调控元件可以存在于本发明的重组构建体中。术语“启动子”、“启动子区”或“启动子序列”是指能够结合rna聚合酶以引发基因按5'至3'(“下游”)方向转录的核酸序列。当rna聚合酶与启动子的结合是所述基因转录的近因时,基因“处于启动子的控制之下”或“受启动子调控”。启动子或启动子区通常为rna聚合酶和适当的转录启动所必需的其它因子提供识别位点。启动子可从基因的基因组组拷贝的5'非翻译区(5'utr)分离。或者,可通过改变已知dna元件来合成产生或设计启动子。还考虑了将一个启动子的序列与另一个启动子的序列组合的嵌合启动子。启动子可通过它们基于例如代谢、环境或发育条件的表达模式来定义。启动子可用作用于调节可操作地连接的可转录的多核苷酸分子(例如,编码序列)的表达的调控元件。除了被rna聚合酶(和优选其它转录因子)识别的序列以外,启动子还可包含影响可操作地连接的基因的转录的调控元件,诸如顺式元件或增强子结构域。“病毒启动子”是启动位于病毒基因组内的一个或多个基因的转录的天然或非天然启动子。如本文中所用,术语“组成型”启动子是指在大多数环境和发育条件下具有活性的启动子。无论外部环境诸如光和培养基组成如何,组成型启动子都是具有活性的。在一些实例中,组成型启动子在营养物存在和不存在的情况下是有活性的。例如,组成型启动子可以是在氮耗尽的条件下以及在其中氮不是限制(氮充足条件)的条件下具有活性的(介导与其可操作地连接的基因的转录)的启动子。相反地,“诱导型”启动子是响应于特定环境条件(诸如营养物或调节剂的存在或不存在、光的存在等)的启动子。如本文中所用,术语“可操作地连接的”表示这样的构型,这样的构型中,将控制序列相对于多核苷酸序列的编码序列置于适当的位置,以使得所述控制序列指导或调控多肽和/或功能性rna的编码序列的表达。因此,如果启动子可介导核酸序列的转录,则启动子与核酸序列可操作地连接。当被引入宿主细胞时,表达盒可在合适的条件下导致编码的rna或多肽的转录和/或翻译。不被翻译或不能被翻译的反义或有义构建体不被该定义排除。在转基因的表达和内源基因的抑制(例如,通过反义或rnai)的情况下,普通技术人员将认识到插入的多核苷酸序列不必相同,但可以仅与它所源自的基因的序列基本上相同的。如本文所解释的,这些基本上相同的变体通过参考特定的核酸序列而被具体涵盖。如本文中所用,术语“选择标记”或“选择标记基因”包括赋予细胞表型的任何基因,在所述细胞中所述基因被表达以有利于选择用本发明的核酸构建体转染或转化的细胞。该术语还可用于指实现所述表型的基因产物。选择标记的非限制性实例包括:1)赋予抗生素抗性的基因诸如阿米卡星(apha6)、氨苄青霉素(ampr)、杀稻瘟菌素(bls、bsr、bsd)、博来霉素或腐草霉素(zeocintm)(ble)、氯霉素(cat)、依米丁(rbs14p或cry1-1)、红霉素(erme)、g418(geneticintm)(neo)、庆大霉素(aac3或aacc4)、潮霉素b(aphiv、hph、hpt)、卡那霉素(nptii)、甲氨蝶呤(dhfrmtxr)、青霉素和其它β-内酰胺酶(多种β-内酰胺酶)、链霉素或壮观霉素(aada、spec/strep)和四环素(teta、tetm、tetq)基因;2)赋予对除草剂的抗性的基因,所述除草剂是诸如氨基三唑、杀草强、andrimid、芳氧基苯氧基丙酸酯、莠去津、联吡啶鎓、溴苯腈、环己二酮肟、茅草枯、麦草畏、氯甲草(diclfop)、二氯苯基二甲基脲(dcmu)、difunone、二酮腈、敌草隆、氟草酮、草铵膦、草甘膦、卤代羟苄腈、吡氟氯禾灵(haloxyfop)、4-羟基吡啶、咪唑啉酮、异噁氟草(isoxasflutole)、异噁唑、异噁唑烷酮、miroamideb、对-硝基二苯基醚、达草灭、噁二唑、间-苯氧基苯甲酰胺、n-苯基酰亚胺、唑啉草酯(pinoxadin)、原卟啉原(protoporphyrionogen)氧化酶抑制剂、哒嗪酮、吡唑啉酯、磺酰脲、1,2,4-三唑嘧啶、三酮或尿素;乙酰辅酶a羧化酶(accase);乙酰羟酸合酶(ahas);乙酰乳酸合酶(als、csr1-1、csr1-2、imr1、imr2)、氨基糖苷磷酸转移酶(apt)、邻氨基苯甲酸合酶、溴苯腈腈水解酶(bxn)、细胞色素p450-nadh-细胞色素p450氧化还原酶、茅草枯脱卤素酶(dehal)、二氢蝶酸合酶(sul)、i类5-烯醇丙酮酸莽草酸-3-磷酸合酶(epsps)、ii类epsps(aroa)、非i/ii类epsps、谷胱甘肽还原酶、草甘膦乙酰转移酶(gat)、草甘膦氧化还原酶(gox)、羟基苯基丙酮酸脱氢酶、羟基苯基丙酮酸双加氧酶(hppd)、异戊二烯基焦磷酸酯异构酶、番茄红素环化酶、膦丝菌素乙酰基转移酶(pat、bar)、八氢番茄红素去饱和酶(crti)、异戊二烯基转移酶、原卟啉氧化酶、psba光系统ii多肽(psba)和smm酯酶(sule)、超氧化物歧化酶(sod);3)可用于营养缺陷型菌株或赋予其它代谢作用的基因,诸如arg7、his3、hisd、hisg、lysa、mana、mete、nit1、trpb、ura3、xyla、二氢叶酸还原酶基因、甘露糖-6-磷酸异构酶基因、硝酸还原酶基因或鸟氨酸脱羧酶基因;阴性选择因子诸如胸苷激酶;或毒素抗性因子诸如2-脱氧葡萄糖抗性基因。“报道基因”是编码可检测的或具有产生可检测产物的活性的蛋白质的基因。报道基因可编码产生可检测信号的视觉标记物或酶,诸如cat、lacz、uida、xyle、碱性磷酸酶基因、α-淀粉酶基因、α-半乳糖苷酶基因、β-葡糖苷酸酶基因、β-内酰胺酶基因、辣根过氧化物酶基因、荧光素/荧光素酶基因、r-基因座基因、酪氨酸酶基因或编码荧光蛋白的基因,所述荧光蛋白包括但不限于蓝色、青色、绿色、红色、paprika或黄色荧光蛋白、可光转换的、可光开关的或光学高亮标识的荧光蛋白或其变体的任一种,包括但不限于密码子优化的、快速折叠的、单体的、具有增加的稳定性的和具有增强的荧光的变体。本文中所用,术语“rna引导的核酸酶”或“rna引导的内切核酸酶”是指被一种或多种引导性rna引导至切割靶位点的核酸切割酶。rna引导的核酸酶的非限制性实例包括cas9、cpf1、c2c1、c2c2和c2c3。如本文中所用,术语“终止子”或“终止子序列”或“转录终止子”是指引起rna聚合酶停止转录的遗传序列的调控区。如本文中所用,术语“引入宿主细胞”和“转化”是指通过使用一种或多种物理、化学或生物学方法将一个或多个外源核酸序列或多核苷酸引入宿主细胞或生物体。物理和化学转化方法(即,“转染”)包括(以非限制性实例的方式)电穿孔、微粒轰击、化学诱导的感受态和脂质体递送。转化的生物学方法(即,“转导”)包括使用病毒或微生物(例如,土壤杆菌属(agrobacterium))转移dna。如本文中所用,“设计”基因组是指确定最终目标基因组的所需核酸序列。所述设计可通过基础知识、文献来源、实验数据或其任何组合来告知。如本文中所用,当指核酸分子、蛋白质、病毒颗粒或其组合时,“重组”或“工程化的”意指通过人操作生成的非天然存在的核酸分子、蛋白质、病毒颗粒或其组合。作为非限制性实例,重组或工程化的核酸分子可包括以下的任何核酸分子:1)已在体外例如使用化学或酶促技术(例如,通过使用化学核酸合成,或通过使用用于核酸分子的复制、聚合、消化(外切核酸的或内切核酸的)、连接、逆转录、转录、碱基修饰(包括,例如,甲基化)、整合或重组(包括同源和位点特异性重组)的酶部分或完全合成或修饰的核酸分子);2)包括在自然界中并非联接的联接的核苷酸序列的核酸分子,3)已使用分子克隆技术进行工程化,使得其相对于天然存在的核酸分子序列缺少一个或多个核苷酸的核酸分子,和/或4)已使用分子克隆技术进行操作,使得其相对于天然存在的核酸序列具有一个或多个序列变化或重排的核酸分子。作为非限制性实例,cdna是重组dna分子,对于已通过体外聚合酶反应产生的,或已将接头附接至其的,或已被整合到载体诸如克隆性载体或表达载体中的任何核酸分子亦如此。重组或工程化的rna或蛋白质是分别从重组或工程化的核酸分子转录或翻译的rna或蛋白质。重组或工程化的病毒颗粒或病毒是从工程化病毒序列或病毒基因组产生的病毒颗粒或病毒。术语“病毒基因组”是指包含在病毒颗粒中的一种或多种dna或rna分子中的完整遗传互补序列,包括基因和非编码序列。术语“工程化的病毒基因组”是指非天然存在的病毒基因组,其是人操作的结果,并且能够在被引入相容的宿主细胞中时产生非天然存在的病毒颗粒。术语“病毒核酸”是指包含衍生自病毒基因组的序列的核酸。“病毒核酸”可包含整个病毒基因组或病毒基因组的部分。病毒核酸可编码包含病毒蛋白质的氨基酸序列。在一些情况下,由给定的病毒开放阅读框架编码的完整的、成熟的蛋白质或多肽序列可以不被定义或表征。本文提供的由病毒核酸序列编码的氨基酸序列(其可包括适合于突变(诸如改变、缺失或替换)或异源序列的插入的位点)在本文中可被公开为编码氨基酸序列,编码氨基酸序列可包含病毒多肽或蛋白质的全部或部分。术语“病毒颗粒”和“病毒体”是指当不在感染的细胞内部或不在感染细胞的过程中时病毒存在的独立形式。这些病毒颗粒(病毒体)由被称为衣壳的蛋白质外壳包围的dna或rna基因组组成。一些病毒体还可在衣壳蛋白质外壳内或外部具有额外的脂质包膜。术语“病毒颗粒”、“病毒体”和“病毒”可以互换使用。如本文中所用,术语“病毒性质”是指病毒复制或生命周期的任何方面或由病毒复制或生命周期产生的方面。如本文中所用,“病毒性质”通常是指可通过人干预来改变或工程化以实现期望结果的性质。病毒性质的非限制性实例包括宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些方面,改良的性质或改良的多种性质和改良的病毒性质或改良的多种病毒性质可互换使用。术语“细菌噬菌体”和“噬菌体”可互换使用,并且是指感染细菌的病毒。crispr系统crispr(成簇规律间隔短回文重复)是含有短的碱基序列重复的dna基因座。每个重复之后是来自先前对可移动遗传元件的暴露的“间隔子dna”的短区段。在约40%的已测序的细菌基因组和90%的已测序的古细菌中发现了crispr。crispr通常与编码与crispr功能相关的蛋白质的crispr相关(cas)基因相关。crispr-cas系统是原核生物免疫系统,其赋予对外来遗传元件诸如质粒和噬菌体的抗性,并提供获得性免疫的形式。crispr间隔区编码小的crrna,该序列特异性引导cas内切核酸酶至靶向序列,并在真核生物中以类似于rnai的方式切割这些外源遗传元件。ii型crispr-cas系统已在许多物种被用于基因编辑和基因调控。这些系统特别有用,因为它们仅需要单个cas内切核酸酶(cas9)和靶向crrna。在天然系统中,内切核酸酶cas9需要两个独立转录的rna用于活性,然而,这两种rna也可共价连接以形成单个嵌合grna。通过将cas9蛋白和适当的grna递送至细胞中,可在任何所需的位置处切割生物体的基因组。crispr-cas系统构成了rna引导的防御系统,其针对病毒、质粒和其它可移动遗传元件进行保护。该个防御途径具有3个步骤。首先,将入侵核酸的拷贝整合到crispr阵列中。然后,将crispr阵列转录成大的crispr转录物,随后加工成成熟的crrna。然后将crrna并入效应子复合物中,其中所述crrna将复合体引导至入侵核酸,cas蛋白降解该核酸。如上所述,天然ii型crispr-cas系统需要反式激活crrna(tracrrna)和前-crrna以使得能够cas9活化。该tracrrna与前crrna互补和与其碱基配对,从而形成rna双链体。所述rna双链体被rna酶iii(一种rna特异性核糖核酸酶)切割以形成crrna/tracrrna杂交体。该杂交体用作cas9内切核酸酶的引导者,所述cas9内切核酸酶切割侵入性核酸,从而在侵入性dna中生成双链断裂以保护宿主细胞。cas9介导的切割严格依赖于原型间隔区邻近基序(pam)在靶核酸中的存在。对cas9进行编程以在由引导rna界定的特异性位点切割的能力已导致其被采用作用于基因组工程化和基因调控的通用平台。已在2014年3月6日发布的美国专利申请公开第2014/0068797号、2014年6月19日发布的2014/0170753以及2014/0273037以及2014/0273226(其两者均于2014年9月18日公布)中描述了该基因组工程方法,所有所述的美国专利申请公开均通过引用并入。已描述了可用于基因组工程的其它可编程crispr-cas系统,包括cpf1、c2c1、c2c2和c2c3系统。该cpfl1系统是v型crispr系统,并通过单靶向引导rna介导粘性dna切割(zetsche等,cell(2015)163,1-13)(通过引用并入)。c2c1和c2c3均为v型crispr系统,而c2c2被认为是vi型crispr系统(shmakov等,molecularcell(2015)60,1-13)(通过引用并入)。dna组装存在本领域已知的用于在遗传工程中组装dna的各种方法。使用两步基于热循环仪的方法来组装生殖支原体(m.genitalium)基因组的部分,如gibson,d.g.等,“completechemicalsynthesis,assembly,andcloningofamycoplasmagenitaliumgenome.”science(2008)319:1215-1220(通过引用并入)和pct公开wo2009/103027(通过引用并入)中描述的。另一种方法由li,m.z.等,naturemeth.(2007)4:251-256(通过引用并入)描述。在pct公开wo2006/021944(通过引用并入)中公开了使用t75'外切核酸酶和单链dna结合蛋白的单步组装法。用于组装化化合物以用于高通量筛选的组合技术目前已被良好确立。另外,其中对编码序列随机分段和再退火的基因改组技术已经实践了多年。例如,在meyer,m.等“combinatorialrecombinationofgenefragmentstoconstructalibraryofchimeras”currentprotocolsinproteinscience(2006)26.2.1-26.2.17;mckee,a.e.等,jbei摘要中描述了产生嵌合基因片段的文库的方案。已建立了用于将各种组分组装成完整或最小基因组的技术。例如,2007年11月15日公布的美国专利公开2000/0264688(通过引用并入)描述了用于通过生成和组装包含基因组的部分的盒构建合成基因组的方法。在2007年1月4日公布的美国专利公开第2007/004041号(通过引用并入)中描述了用于组装核酸的逐步分层方法。另外,分别在2010年2月11日和2012年3月1日公布的美国专利申请公开第2010/0035768号和第2012/0053087号(两者均通过引用并入)中描述了用于组装dna的单容器法。该方法被称为吉布森组装法,并且允许多个dna片段的成功组装,而不管片段长度或末端相容性。在等温条件下在单管中使用三种酶活性(5'外切核酸酶生成长悬突,聚合酶填充退火的单链区域的间隙,以及dna连接酶封闭退火和填充间隙的切口)进行吉布森组装反应。该方法已被广泛采用,是世界范围内合成生物学项目的主要工作骨干。通过应用该方法,从600个重叠的60聚集体组装了16.3kb的小鼠线粒体基因组。与在酵母中的体内组装组合,吉布森组装用于合成1.1mbp蕈状支原体(mycoplasmamycoides)基因组。将合成的基因组移植到山羊支原体(m.capricolum)受体细胞,产生新的自我复制的蕈状支原体细胞。5'外切核酸酶活性往回咀嚼(chewback)5'末端序列并暴露出互补序列以用于退火。然后,聚合酶活性填充退火区域上的间隙。然后dna连接酶封闭切口并将dna片段共价地连接在一起。毗邻片段的重叠序列比在goldengate组装中使用的重叠序列长得多,因此导致更高百分比的正确组装。病毒病毒是仅在活宿主细胞内复制的超微观和代谢惰性的感染因子。病毒可感染所有类型的生命形式,包括动物、植物、真菌、藻类、细菌和古细菌。当不在感染细胞内或感染细胞的过程中时,病毒以独立颗粒的形式存在。这些病毒颗粒(病毒体)由被称为衣壳的蛋白质外壳包围的dna或rna基因组成。一些病毒体还可在衣壳蛋白质外壳内或外部具有额外的脂质包膜。存在两个病毒复制周期,然而,在原核生物与真核生物病毒领域之间术语是不同的。潜伏或溶源性病毒将病毒遗传物质整合到宿主细胞的基因组中或形成附加型复制子。当宿主细胞复制时,病毒遗传物质也被复制并继续与宿主基因组分离,直至病毒的产生开始。病毒产生和细胞死亡的开始是裂解或毒性周期的标志物。在裂解周期期间,病毒基因组与宿主基因组分开复制,并劫持细胞的复制和翻译机器,以产生更多的病毒。一旦有足够的病毒累积,专门的病毒蛋白会溶解宿主细胞壁和/或膜。宿主细胞因高内部渗透压而爆裂(称为裂解的过程)。这将子代病毒释放至其中它们可感染其它细胞并重复该过程的环境中。毒性病毒是不进入潜伏或溶源性状态,而是仅通过劫持宿主细胞机制进行复制(与进入潜伏状态的温和病毒相反)的病毒。病毒突变研究如本文中所用,病毒突变研究是指快速进化、适应和/或随机或定向诱变研究,并且所述术语可以互换使用。整合和/或适应研究包括针对特定性状或在特定条件下选择病毒。这些方法因病毒复制中固有的天然高突变率而对于病毒是特别有用的,所述高突变率导致大量的病毒多样性。例如,可在高温条件下使株进化,以观察在这些条件下促进存活和繁殖的分子变化。作为非限制性实例,可使用病毒或噬菌体实验进化或适应来选择在以下方面具有变化的变体:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节或靶向宿主基因组消化或编辑。病毒进化或适应性实验的非限制性实例包括共感染、协同进化或共转化实验。共感染是指多于一种病毒同时感染相同宿主,这通常导致两种或多种病毒之间的基因交换。协同进化是指其中两种或更多种病毒或细菌噬菌体之间的重组在在受纳或非受纳宿主内发生的研究,所述重组导致具有不同病毒性质(诸如,例如,更广的宿主范围)的新病毒或细菌噬菌体的组装。共转化是指当将两种裸露的基因组一起转化到受纳或非受纳菌株中时。这些进化或适应研究中的任何一种可在受纳(易感的)或非受纳(抗性)宿主中进行。这些类型的实验通常包括将病毒在一种或多种其它选择的病毒不存在或存在的情况下在所选定的宿主中传代多次。病毒将获得导致多种变体的突变。在整个传代过程中,某些变体将会基于传代和选择条件而被富集。诱变可通过任何方法,例如插入诱变、化学诱变、利用γ或紫外线辐射的照射或pcr介导的诱变。用于生成基因组序列的突变体或变体的方法是公知的。例如,γ照射、uv照射和利用许多可能的化学诱变剂(例如,5-溴脱氧尿苷、甲基磺酸乙酯(ems)、甲基磺酸甲酯(mms)、硫酸二乙酯(des)、亚硝基胍(ntg)、icr化合物等)的任一种的处理或利用引起染色体断裂的化合物诸如烯二炔类抗生素(例如,博来霉素、阿霉素、新制癌菌素)的处理是已被用于藻类、真菌和壶菌类(chytrids)诱变的方法(参见,例如,美国专利8,232,090;美国专利申请20120088831;美国专利申请20100285557;美国专利申请20120258498)。本领域已知的许多化学诱变剂包括但不限于嵌入剂、烷化剂、脱氨剂、碱基类似物。作为非限制性实例,嵌入剂包括吖啶衍生物或菲啶衍生物,诸如溴化乙锭(也称为2,7-二氨基-10-乙基-6-苯基菲啶鎓溴化物或3,8-二氨基-5-乙基-6-苯基菲啶鎓溴化物)。烷化剂的非限制性实例包括亚硝基胍衍生物(例如,n-甲基-n'-硝基-亚硝基胍)、甲磺酸乙酯(ems)、乙磺酸乙酯、硫酸二乙酯(des)、甲磺酸甲酯(mms)、亚硝酸或hno2以及氮芥或icr化合物。可用作诱变剂的碱基类似物的非限制性实例包括化合物5-溴-尿嘧啶(也称为脱氧核苷5-溴脱氧尿苷)、5-溴脱氧尿苷和2-氨基嘌呤。基于pcr的诱变方法在本领域中是公知的,并且通常包括在整个pcr扩增中增加差错率的反应条件和/或dna聚合酶。诱变可以另外地或可选地包括将外源核酸分子直接引入病毒基因组或宿主细胞中,以便随后重新组合至目标病毒基因组中。例如,引入宿主细胞的外源核酸分子可通过随机或靶向整合而整合到病毒遗传基因座中,从而影响外源dna插入其中的基因或靠近插入基因组中的外源dna的基因的表达(例如,美国专利7,019,122;美国专利8,216,844)。通常,引入的核酸分子包括用于选择已经整合了外源核酸分子构建体的转化体的选择标记基因。在一些实施方案中,外源核酸分子可包括可转座元件或其组分,诸如,例如可被转座酶识别的反向重复序列和/或编码转座酶的基因,或外源核酸分子可以至少部分地基于病毒,诸如整合病毒。对于随机插入诱变,构建体优选包括选择标记,其可用于选择具有整合的构建体的转化体,并且任选地还可用作分离标志物和分子标记,以用于分离和鉴定被整合的选择标记基因中断的基因。选择标志物不限于抗生素抗性基因,而且还包括可为病毒提供生长有利方面的任何基因(两种基因具有已建立的和假设的功能)。或者,可靶向特定的遗传基因座。用于基因破坏的构建体可包括例如侧接来自目标遗传基因座的序列(例如,编码调控元件的基因的至少部分,和任选地,围绕所述基因的另外的基因组序列)的选择标记基因。此类侧翼序列可包含例如至少50个核苷酸、至少100个核苷酸、至少500个核苷酸或基因组序列的至少1千碱基。病毒变体的集合可以由上述任何方法、本领域公知的其它方法或其任何组合生成。然后可筛选变体的集合的所需表型。可将具有所需表型的分离的病毒进行额外轮的突变研究。可额外地或可选地对展现所需性质或表型的分离的病毒进行测序,以鉴定负责所需性质或表型的遗传突变。这些鉴定的遗传损伤可通过概括干净的参考背景中的突变并测试所需性质或表型来确认。病毒有效载荷裂解酶“裂解酶”包括任何细菌细胞壁裂解酶,其在合适的条件下和在相关时间期间杀死一种或多种细菌。裂解酶的实例包括但不限于各种细胞壁酰胺酶。裂解酶可以是细菌噬菌体裂解酶,其是指从细菌噬菌体提取或分离的裂解酶或具有维持裂解酶功能性的相似蛋白质结构的合成的裂解酶。裂解酶能够特异性切割存在于细菌细胞的肽聚糖中的键,以破坏细菌细胞壁。目前还推测,细菌细胞壁肽聚糖在大多数细菌中是高度保守的,只有少数键的切割可破坏细菌细胞壁。切割这些键的裂解酶的实例是胞壁质酶、氨基葡糖苷酶、内肽酶或n-乙酰基-胞壁酰基-l-丙氨酸酰胺酶。fischetti等(1974)报道了c1链球菌属噬菌体溶素酶是酰胺酶。garcia等(1987,1990)报道了来自cp-1噬菌体的肺炎链球菌(s.pneumoniae)的cpl溶素是溶菌酶。caldentey和bamford(1992)报道,来自假单胞菌属噬菌体φ6的裂解酶是内肽酶,分裂由内消旋二氨基庚二酸和d-丙氨酸形成的肽桥。大肠杆菌噬菌体t1和t6裂解酶是酰胺酶,来自利斯特菌属(listeria)噬菌体(ply)的裂解酶也是酰胺酶(loessner等,1996)。还存在本领域已知的能够切割细菌细胞壁的其它裂解酶。由细菌噬菌体遗传编码的裂解酶包括能够杀死宿主细菌的多肽,例如通过具有至少一些针对宿主细菌的细胞壁降解或细胞壁合成抑制活性。多肽可具有包含天然裂解酶和其变体的序列。多肽可从各种来源分离,诸如来自细菌噬菌体(“噬菌体”),或通过重组或合成方法制备。例如,多肽在羧基末端侧包含胆碱结合部分,并且特征可能在于能够在氨基末端侧切割细胞壁肽聚糖的酶活性(诸如作用于肽聚糖中的酰胺键的酰氨酶活性)。已经描述了包括多种酶活性例如两个酶结构域的酶,诸如plygbs溶素。另外,还描述了仅含有催化结构域并且没有细胞壁结合结构域的其它裂解酶。群体淬灭多肽自诱导剂是由参与群体感应的细菌产生和使用的小的化学信号分子。群体感应使细菌能够通过自诱导剂的存在来彼此感应,并调节多种群体级别的行为。此类行为包括共生、毒力、运动、抗生素产生和生物膜形成。自诱导剂根据物种具有许多不同的化学形式,但在许多情况下它们具有的作用相似,这使得遗传工程化的细菌噬菌体能够利用类似的自诱导剂影响多种细菌。一般地,革兰阴性细菌使用ahl作为自诱导剂,革兰阳性细菌使用经加工的寡肽进行通信,而自诱导剂2(ai-2)对于革兰阴性和革兰阳性细菌是通用的。由革兰阴性细菌的不同物种产生的ahl在酰基侧链的长度和组成方面可变化,所述侧链通常含有4-20个碳原子。ahl能够通过被动运输和主动运输机制扩散进出细胞。用于感测ahl的受体包括许多转录调控因子诸如luxr,其用作能够激活调控细菌群体行为的多种基因表达的dna结合转录因子。自诱导剂可被群体淬灭多肽抑制。群体淬灭多肽可修饰或降解自诱导剂,使其活性降低或失活。某些群体淬灭多肽是使自诱导剂失活(例如,通过修饰或降解)的酶,诸如本文所述的aiia内酯酶,其从具有广范围底物特异性的ahl的酰基部分切割内酯环,以使来自各种细菌的ahl失活(wang等2004)j.biol.chem.279(14):136.45-51)。本文公开的体外工程方法可用于生成经工程化以编码例如衍生自铜绿假单胞菌的群体淬灭多肽的合成细菌噬菌体。群体淬灭多肽可表达为释放至噬菌体和/或细菌的周围区域中的游离蛋白质,例如在噬菌体感染和宿主细菌裂解时。同样可能的是,还可使用本领域已知的方法从细菌宿主细胞中表达并活跃地分泌群体淬灭多肽。类似地,可通过翻译将群体淬灭多肽与细菌噬菌体蛋白(例如衣壳、尾部或颈部蛋白质)融合。尾丝在一些实施方案中,本公开涉及通过工程化重组细菌噬菌体来调整细菌噬菌体宿范围。在一些实施方案中,调整病毒宿主区包括工程化病毒以具有异源的、天然的、非天然的尾丝及其任何组合。细菌噬菌体的宿主细胞特异性可受病毒颗粒尾丝影响。通过改变(例如,交换和/或突变)宿主细菌噬菌体的尾丝或尾丝的部分,可改变(例如,扩大)宿主范围。尾丝蛋白通常含有抗原决定簇和宿主范围决定簇。异源尾丝可由从一种类型的细菌噬菌体的基因组分离的或基于所述基因组合成的一组基因组片段编码。尾丝基因片段的组可包含从几种细菌噬菌体的基因组分离的或基于其生成的基因组片段的亚组。例如,尾丝的保守区可由从底盘细菌噬菌体的基因组分离的基因组片段编码,而宿主范围决定簇区域可由从不同类型的细菌噬菌体的基因组分离的基因组片段编码。抗-微生物肽本公开设想了(作为非限制性实例)经工程化以表达抗微生物肽(其任选地由宿主细胞分泌)的细菌噬菌体。例如,工程化的细菌噬菌体可表达抗微生物剂,诸如抗微生物肽(amp)或抗微生物多肽,包括但不限于天然存在的肽,以防止宿主细菌对噬菌体的抗性的发展和/或扩大,并且允许在细菌感染(诸如包含多于一种不同的细菌物种的细菌感染)中更快更有效地杀死细菌。因它们的扩增和捕食者-宿主机制,细菌噬菌体提供有吸引力的抗微生物剂以用于消除细菌感染,例如通过在宿主细菌中繁殖,然后随着裂解发生以释放繁殖的细菌噬菌体(其随后通过相同的机制感染和杀死周围的细菌),然后杀死细菌。细菌噬菌体在消除细菌感染中的实际用途受到显著局限性的限制,诸如(i)非常狭窄的种内和种间细菌宿主范围,和(ii)细菌宿主群体针对噬菌体的抗性的快速发展。因此,在许多科学领域似乎是常见的,但理论上的结果在现实生活状态中难以实现。因此,虽然细菌噬菌体似乎在理论上用作抗微生物剂,但实际上它们具有受限制的抗微生物性质,并且由于宿主对细菌噬菌体的抗性的快速发展,因此它们用于消除细菌感染的用途难以实现。因此,噬菌体在宿主细菌的长期消除方面一直是无效的。因此,本公开设想了抗微生物剂工程化的噬菌体,其中将细菌噬菌体进行修饰或工程化以表达任选地被宿主怕抗微生物肽(amp)。至少一种抗微生物剂工程化的噬菌体或不同的所述工程化的噬菌体的任何组合可以单独或以任何组合用于消除或杀死细菌感染。在一些实施方案中,抗微生物剂工程化的细菌噬菌体可以与另外的试剂(诸如其它抗微生物剂工程化的细菌噬菌体、纯化的抗微生物肽或小分子抗生素)一起使用。抗微生物肽工程化的细菌噬菌体(或amp-工程化的细菌噬菌体)可编码本领域普通技术人员已知的任何抗微生物剂。在本发明的方面的一些实施方案中,抗微生物剂工程化的细菌噬菌体可表达和分泌作为核酸的抗微生物剂,例如通过“基因沉默”本领域普通技术人员已知的公知的细菌基因来起作用的抗微生物剂。基于核酸的抗微生物剂包括例如但不限于rna干扰-诱导(rnai)分子,例如但不限于sirna、dsrna、strna、shrna、mirna及其修饰形式,其中rna干扰分子基因沉默表达的并且对于细菌的活力(即存活)重要的基因的表达。基于核酸的抗微生物剂可以是反义寡核酸或核酸类似物,例如但不限于dna、rna、肽核酸(pna)、假-互补pna(pc-pna)或锁定核酸(lna)等。或者,基于核酸的抗微生物剂可以是dna或rna,以及核酸类似物,例如pna、pcpna和lna。核酸可以是单链或双链的,并且可选自包含编码目标蛋白质的核酸、寡核苷酸、pna等的组。此类核酸抑制剂包括例如但不限于编码为转录阻遏物的蛋白质的核酸序列,或反义分子或核酶,或小的抑制性核酸序列诸如rnai、shrnai、sirna、微rnai(mirna)、反义寡核苷酸等。抗微生物肽可另外地或可选地是抗菌酶。示例性抗菌活性可包括但不限于裂解酶、酰基酶、氨基肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤代过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、rna酶、dna酶、溶葡萄球菌素或孔形成肽。抗微生物肽或抗微生物多肽可通过结合带负电荷的微生物膜,并通过形成水通道破坏膜,使脂质双层自身反折或妨碍膜形成胶束来直接破坏细菌膜。除了它们的直接杀菌作用以外,任何微生物肽和多肽还可激活tlr信号传导和额外的免疫应答,用作白细胞化学趋化剂,通过侵入吞噬细胞增加杀菌调理作用,清除细菌生长所需的重要营养物和抑制细菌蛋白酶,或其任何组合。生物表面活性剂细菌生物膜形成可导致局部感染以及难以治疗,并且有时致命的全身性感染,诸如菌血症(细菌存在于血液)和细菌性脓毒症(由细菌或其产物通过血流扩散引起的多器官衰竭)。包含生物膜基质的细胞外物质可用作屏障,保护存在于生物膜内的细菌,并将所述细菌与正常的免疫防御机制(诸如抗体和吞噬细胞)以及抗菌药物(包括抗菌酶和抗生素)分离。生物膜还有助于存在于生物膜中的细菌生长和增殖。本公开提供了生成工程化的病毒的方法和工程化的病毒的组合物,所述工程化的病毒表达用于促进去除或松散沉积在表面上的生物膜的另外试剂。例如,组合物可包括生物表面活性剂。示例性生物表面活性剂包括但不限于糖脂、脂肽、缩肽、磷脂、取代的脂肪酸、脂多糖、乳糖素(surlactin)、表面活性素、visconsin和鼠李糖脂。病毒工程由于缺少广泛适用和可靶向的体外工程方法,因此遗传工程化病毒颗粒的方法费力且冗长。目前的体内方法可能需要几周或数月以产生修饰的病毒和病毒载体(levin和bull,natrevmicrobiol.,2004年2月;2(2):166-73,通过引用并入本文)。另外,存在与在细胞中操作病毒基因组固有地相关的毒性。在本公开之前,开发用于病毒的精确体外遗传工程的广泛适用性方法的努力在很大程度上不成功。本文中描述了在体外完全快速地工程化病毒基因组的广泛适用性方法。本文公开的体外遗传工程系统和方法具有优于病毒遗传工程的现有方法有几个有利方面:1)其允许在体外完全进行毒性基因/产物的简单操作;2)其是快速的,即相较于用于体内方法的数周或数月,可在一天内进行;3)其允许在大多数病毒基因组中保留基因组修饰;4)其不需要宿主重组途径;5)其比以前的方法更直接,更不容易出错;6)其适用于多个病毒,无需更改方案。本公开提供了用于rna引导的核酸酶介导的消化和体外组装以位点特异性地工程化整个基因组的方法。本公开显著提高了病毒基因组可被遗传修饰的精确度、简便性和速度。另外,该技术克服了在宿主细胞内操作常常有毒的毒性病毒基因组的充分确定的困难。该完全体外方法还消除了对遗传上可跟踪的宿主菌株用于工程的要求,一种防止对古菌、原核生物和真核生物的许多重要且吸引人的病毒的操纵的要求。该方法没有扩增被操纵的病毒基因组,因此允许保留大多数病毒基因组修饰诸如甲基化。众所周知,基因组修饰可对病毒的适应性具有深远的影响,因此这些基因组修饰的保留提供了优于其它工程技术的显著有利方面。另外,该技术不同于与体内rna引导的核酸酶基因组相关的其它方法,因为它不关注rna引导的核酸酶,诸如cas9和用于真核生物基因组编辑的grna的用途,而是与体外完全克服已知的病毒工程问题相关。在一些方面,本文提供的新颖方法可包括例如使用如本文所公开的rna引导的核酸酶和组装进行的病毒核酸或病毒基因组的修饰,并将工程化的病毒核酸或工程化的病毒基因组直接引入将产生包含工程化的病毒核酸或工程化的病毒基因组的工程化的病毒颗粒或工程化的病毒的宿主。例如,在一些方面,所述方法包括工程化病毒核酸或病毒基因组,而无需将工程化的病毒核酸或工程化的病毒基因组引入克隆性宿主,为了例如通过在载体中的复制扩增工程化的病毒核酸或工程病毒基因组的目的。例如,在一些方法中,在将工程化的病毒核酸或工程化的病毒核酸基因组引入将产生工程化的病毒颗粒或工程化的病毒的宿主细胞之前,不将工程化的病毒核酸或工程化的病毒核酸基因组引入酵母、大肠杆菌或其它已知的克隆性宿主诸如但不限于芽孢杆菌属(bacillus)或弧菌属(vibrio)物种。本文提供的新颖方法允许对病毒基因组中的2、3、4、5或更多个位点进行靶向工程化。可在体外完全进行所述方法,从而允许产生在多个位点被改变的病毒基因组,这是使用常规工程方法不能实现的成就。本文提供了包含相对于非工程化的病毒核酸或非工程化的病毒基因组具有2、3、4、5或更多个修饰的工程化的病毒核酸和/或工程化的病毒基因组的工程化的病毒。两个或更多个修饰可以是插入、缺失、替换或其任何组合。两种或更多种修饰可导致1种、2种或更多种改良的病毒性质,诸如本文公开的任何性质。可完全通过本文公开的体外工程方法产生工程化的病毒。本文公开的体外工程方法导致与经典或随机诱变相对的靶向修饰。与通过经典或随机诱变产生的修改不同,可方便地在任何表型测定之前使用标准分子遗传实验室方法诸如pcr和/或测序常规地筛选靶向修饰。本文还公开了用于生成具有改良的病毒性质的合成病毒的系统(例如,参见图10)。所述系统包括鉴定负责赋予所需性质的核酸序列,然后将那些序列变化整合到所选择的病毒基因组中以生成具有改良的病毒性质的病毒颗粒。可通过基础科学知识、文献检索、经验测试、突变研究或其任何组合来鉴定能够赋予所需病毒性质的核酸序列。突变研究可包括进化研究、适应研究、诱变研究和/或本领域公知的其它实验方法。诱变研究可以包括紫外线(uv)、化学和/或插入诱变。插入突变可包括转座子和/或选择标记插入诱变。用于鉴定目标核酸序列的突变实验可使用将作为体外工程起点的病毒或病毒基因组来进行。另外或可选地,可将相关或异源病毒或病毒基因组而非所选择的病毒或病毒基因组用于突变研究,以鉴定重组核酸序列,以掺入最初选择的病毒或病毒基因组中,以赋予所选择的病毒额外性质。所需性质可包括宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑、本领域技术人员容易知道的其它期望的性质,或其任何组合中的一种或多种。可使用本文公开的体外工程方法将赋予所需性质的经鉴定的核酸序列整合到所选择的病毒基因组中,以通过一轮或多轮迭代工程将一个或多个变化整合到单个病毒基因组中并进行测试直至所需组的一种或多种改良的病毒性质已被确认。最终的目标病毒基因组可以是天然衍生的和合成的核酸分子的组合,或者可使用本文所述的方法和/或本领域已知的方法完全从头完全。生成具有改良的病毒性质的病毒或病毒颗粒可包括将工程化的目标病毒基因组引入相容性细胞,其中基因组被激活从而生成病毒颗粒或病毒。为了制备用于整合到所选择的病毒基因组的经鉴定赋予所需性质的核酸分子,可从通过消化、pcr扩增、合成、本领域公知的其它方法或其任何组合从其鉴定目标序列的病毒基因组分离或扩增目标序列。合成的核酸序列可化学合成或从化学合成的重叠寡核苷酸组装。另外或可选地,待被整合到所选择的病毒基因组中以赋予所需表型的核酸分子可以是天然衍生的与合成的核酸序列的组合。取决于待整合到所选择的病毒基因组中的核酸分子的设计,所得的工程化的病毒基因组可具有添加、删除、被可选序列替换的核酸序列或其任何组合,以赋予所需的病毒性质。设计核酸分子以除去、删除、替换序列或其任何组合的方式来改变序列的方法是本领域技术人员所公知的。通过本文所述的系统和方法生成的工程化的病毒基因组可用于生成具有改良的病毒性质的病毒或病毒颗粒。生成具有改良的病毒性质的病毒或病毒颗粒可包括将工程化的病毒基因组引入相容性细胞,其中所述基因组被激活从而产生病毒颗粒或病毒。将工程化的基因组引入细胞可通过电穿孔、转化、缀合、细胞与预先包装的病毒基因组的接触等,或本领域公知的其它方法来进行。本公开另外涉及使用rna引导的内切核酸酶体外工程化核酸的方法的发现。本公开还涉及通过病毒核酸的体外遗传工程改良病毒性质。具体地,本公开涉及使用内切核酸酶(诸如rna引导的内切核酸酶,例如cas9)体外消化病毒序列,随后通过将dna或rna片段插入已消化的病毒基因组中来组装重组核酸。在一些方面,本公开提供了工程化病毒核酸的体外方法,包括分离病毒核酸;使用rna引导的核酸酶体外消化病毒核酸的区域;以及通过将dna或rna片段插入消化的病毒核酸中来组装重组核酸。在一些实例中,体外消化是rna引导的酶促消化。在一些实例中,由rna引导的核酸酶进行酶消化。在一些实例中,rna引导的核酸酶是cas9、cas9衍生的酶、cas9相关酶或任何纯化的可编程的rna引导的核酸酶。在一些实例中,消化还包括靶向rna。在一些实例中,消化还包括亚精胺。在一些实例中,靶向rna是grna、crrna和/或tracrrna。在一些实例中,在消化后,通过标准方法(例如暴露于热)灭活rna引导的核酸酶,和/或通过标准方法(诸如,例如苯酚-氯仿提取)除去所述酶。在一些实例中,通过将包含蛋白质的溶液暴露于热(诸如,例如至少80℃)来实现热灭活。任何可编程的rna引导的核酸酶可用于本文中的方法和组合物,例如cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(也称为csn1和csx12)、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4,cpf1、c2c1、c2c2、c2c3或其同源物,或其修饰形式。任何可编程的crispr系统可用于本文的方法和组合,包括i型、ii型、iii型、iv型、v型、vi型或其任何组合。rnai引导的核酸酶可以是cas9蛋白,例如作为非限制性实例的酿脓葡萄球菌(staphylococcuspyogenes)、嗜热链球菌(s.thermophilus)、肺炎链球菌(s.pneumonia)、金黄色葡萄球菌(s.aureus)、脑膜炎奈瑟球菌(neisseriameningitidis)的cas9蛋白。还考虑了在美国专利申请公开第us2014/0068797号(通过引用整体并入本文)中作为seqidno:1-256和795-1346提供的cas9蛋白,和可组合来自多于一种cas9蛋白的结构域的嵌合cas9蛋白,以及已鉴定的cas9蛋白的变体和突变体。除了cas9以外,本领域技术人员还将容易地认识到,任何已知的功能等同物将是充足的替代实例。病毒颗粒可以是古细菌、原核或真核特异性病毒。例如,病毒可以是可感染铜绿假单胞菌、大肠杆菌或者智人的病毒。在一些实例中,病毒可以是感染不动杆菌属(acinetobacter)、梭菌属(clostridium)、肠杆菌属(enterobacter)、肠球菌属(enterococcus)、埃希氏杆菌属(escherichia)、克雷伯杆菌属(klebsiella)、分枝杆菌属(mycobacterium)、奈瑟球菌属(neisseria)、假单胞菌属(pseudomonas)、沙门菌属(salmonella)、葡萄球菌属(staphylococcus)或链球菌属(streptococcus)中的病原体物种的病毒。在一些实例中,病毒可以感染古菌属物种,诸如酸菌属(acidianus)、气火菌属(aeropyrum)、盐盒菌属(haloarcula)、富盐菌属(haloferax)、盐红菌属(halorulbum)、甲烷杆菌属(methanobacterium)、热棒菌属(pyrobaculum)、焦球菌属(pyrococcus)、憎叶菌属(stygiolobus)、硫化叶菌属(sulfolobus)或热变形菌属(thermoproteus)。在一些实例中,病毒可感染真核宿主诸如人、哺乳动物、动物、植物、藻类或真菌的真核宿主。病毒核酸可以是dna或rna。在一些实例中,病毒核酸由整个病毒基因组、病毒基因组的部分或单个或多个病毒基因组成。在一些实例中,在工程化之前,将病毒基因组的部分亚克隆至质粒中。病毒核酸可在体外被与靶向rna偶联的rna引导的核酸酶诸如cas9单消化或双重(或更多重)消化,以除去一个或多个核苷酸、单个基因、多个基因或任何大小的基因组区域或打开dna以用于插入新序列。除了cas9以外,本领域技术人员应理解,任何可编程的rna引导的核酸酶或其它可靶向的dna切割机制都足够并且在功能上是等效的。多重消化可以同时进行;然而,已发现依序的rna引导的cas9消化可提高效率。另外,可将亚精胺添加至反应混合物中以增加cas9与dna的解离,从而允许cas9以更大的可用度用于酶促活性。通过cas9切割除去的病毒序列不会重组回基因组中,因为cas9是钝切割酶,并且片段不含有与插入位点的同源性。另外,cas9的热灭活允许从消化直接移入组装反应,从而简化了方案。如本文中所用,术语“靶向rna”或“引导rna”是指crisprrna(crrna)、反式激活性crrna(tracrrna)、整合crrna和tracrrna的工程化的嵌合引导rna(grna)或与选择的crispr系统相容的单一grna。从crispr基因座转录crisprrna(crrna),并将其整合到效应子复合物中并引导复合体入侵核酸序列,从而导致rna引导的核酸酶介导的核酸消化。tracrrna与前crrna互补并与其碱基配对,形成cas9介导的切割所需的rna双链体。杂交grna是连接靶向crrna与tracrrna,从而允许使用单个rna进行cas9介导的消化的嵌合rna。cas9介导的消化可用体外转录的crrna-tracrrna混合物或嵌合grna进行。dna或rna插入物可通过本领域已知的任何方式,具体地通过体外合成、化学合成、从头合成、从头组装、扩增(pcr)、酶介导的从质粒、病毒、古细菌的释放或其任何组合获得。在一个方面,dna或rna插入物通过寡核苷酸的组装或利用含有针对整合位点的重叠序列的引物的pcr来生成。dna或rna插入物可以是天然衍生的和合成的核酸的组合,或可以是完全天然的或合成衍生的。dna或rna插入物和消化的病毒核酸的组装可使用本领域已知的任何方法(诸如体外克隆反应或先前讨论的任何方法)进行。在一个方面,使用吉布森组装法将dna或rna插入物组装至消化的病毒基因组中。在一个方面,使用宿主细胞重组机制在体内进行将dna或rna插入物组装至消化的病毒基因组中。dna或rna插入物的组装可导致核酸序列的添加、缺失、替换或其任何组合。设计dna或rna序列以使得组装至消化的病毒核酸中的方法导致目标核酸的添加、缺失、替换或其任何组合是本领域公知的。在一些方面,本公开提供了工程化病毒序列的体外方法,其包括分离病毒核酸;使用rna引导的核酸酶体外消化病毒核酸的区域;以及通过将dna或rna片段插入消化的病毒核酸来组装重组核酸。在一些实例中,在对于将片段插入消化的病毒核酸以形成重组核酸是有效的条件下,利用组分的混合物在单个容器中在体外进行所述组装,所述混合物包含(a)缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶,(b)拥挤剂,(c)具有3'外切核酸酶活性的分离的热稳定的非链置换dna聚合酶,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物,(d)分离的热稳定的连接酶,(e)dntp的混合物和(f)合适的缓冲液。在一些方面,外切核酸酶是t5外切核酸酶,并且接触是在等温条件下,和/或拥挤剂是peg,和/或非链置换dna聚合酶是phusiontmdna聚合酶或dna聚合酶,和/或连接酶是taq连接酶。在一些实例中,体外组装通过一步或等温吉布森组装进行。在一些实例中,体外组装通过两步吉布森组装进行。在一些实例中,可使用连接酶通过平头连接体外组装消化的核酸和dna或rna片段。在一些方面,本公开提供了包括组装步骤的工程化病毒序列的体外方法。在一些实例中,使用宿主细胞重组机器在相容性宿主细胞中在体内进行组装。尽管重组核酸可使用本文所公开的纯化的酶在体外完全组装,但也可使用易感宿主菌株内的天然或工程化的重组途径来完成该过程。在一些情况下,相容性宿主细胞可以是酿酒酵母(s.cerevisiae)、大肠杆菌、铜绿假单胞菌、枯草芽孢杆菌(b.subtilis)、需钠弧菌(v.natrigens)或本领域可获得的其它生物体。纯化的和体外消化的病毒基因组与具有末端同源区的插入修复片段一起的转化对于一些宿主细胞在体内组装重组病毒基因组是足够的。插入修复片段可通过本领域已知的标准技术合成或扩增,或者可存在于在所选择的宿主细胞内稳定复制的质粒内。由于宿主细胞具有同源和非同源dna修复途径,将充足量的插入物和消化的基因组共递送至宿主细胞中的挑战以及大多数宿主同源重组途径的较低效率,因此该方法可能具有比体外组装低的效率。由于单独的消化的基因组不会形成功能性病毒颗粒和没有宿主介导的重组的后续噬斑,因此可通过针对给定的插入物的pcr筛选转化和铺板后获得的噬斑,以确认所需工程化的病毒核酸的正确组装。在一些方面,本公开提供了工程化包含rna引导的核酸酶的病毒序列的体外方法。在一些实例中,rna引导的核酸酶是ii型cas9。在一些实例中,rna引导的核酸酶是ca9或cas9衍生的酶。在一些实例中,rna引导的核酸酶是分离的重组cas9或cas9衍生的酶。在一些实例中,存在至少一种靶向rna。在一些实例中,存在两种靶向rna。在一些实例中,靶向rna是嵌合引导rna(grna)或一组crrna和tracrrna。在一些实例中,体外消化反应使用两种grna。在一些实例中,体外消化反应使用两组crrna和tracrrna,以便例如同时靶两个序列。在一些方面,本公开提供了包括体外消化步骤的工程化病毒序列的体外方法。在一些实例中,在消化后,通过标准方法(诸如暴露于热诸如至少80℃)灭活rna引导的核酸酶。在一些实例中,在消化后,通过苯酚-氯仿提取除去rna引导的核酸酶。在一些实例中,在消化后,rna引导的核酸酶通过本领域公知的其它提取方法除去。在一些方面,本公开内容提供了工程化病毒序列的体外方法,所述方法导致工程化的病毒核酸。在一些实例中,随后将工程化的病毒核酸转化到宿主细胞中。在一些实例中,宿主细胞是大肠杆菌、铜绿假单胞菌、酿酒酵母、需钠弧菌、枯草芽孢杆菌或本领域公知的其它生物体。在一些实例中,通过热休克、电穿孔、基因枪、微粒轰击、缀合、转导、脂转染或本领域公知的其它已建立的方法进行转化。在一些实例中,将工程化的病毒核酸转化到宿主细胞中,然后在复制后再次分离。在一些实例中,分离的工程化的病毒核酸用作起始病毒核酸,以用于另外一轮的体外工程,这一过程在本文中被称为迭代体外工程。在一些实例中,存在一轮迭代体外工程。在其它实例中,存在至少一轮迭代体外工程。在其它实例中,存在两轮或更多轮的迭代体外工程。在一些方面,本公开提供了工程化病毒序列的体外方法,所述方法导致工程化的病毒核酸。在一些实例中,使用可以商购获得的体内包装试剂盒将工程化的病毒核酸包装到病毒颗粒中。在一些实例中,体外包装试剂盒是maxplaxλ包装提取物。在一些方面,本公开提供了工程化病毒序列的体外方法,所述方法导致重组工程化的病毒核酸。在一些实例中,工程化的病毒核酸相较于参考和/或非工程化的病毒改良或改变病毒的性质。在一些实例中,改良的或改变的病毒性质是诸如宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节、靶向宿主基因组消化或编辑或其任何组合的性质。在一些实例中,性质的改良可以是性质的增加、减少或改变。例如,改良的病毒性质可以是扩大或减少的宿主范围、改变的病毒裂解周期、增加的或减少的对宿主细胞的吸附、增加或减少的对宿主细胞的附着、增加或减少的注射、增加或减少或改变的复制和组装、增加或减少的裂解、增加或减少的裂解量、增加或减少或改变的免疫逃避、增加或减少或改变的免疫刺激,增加或减少或改变的免疫失活、增加或减少或改变的生物膜分散、增加或减少或改变的细菌噬菌体抗性、增加或减少或改变的细菌抗生素敏化、增加或减少或改变的毒力因子的调节、增加或减少或改变的靶向宿主基因组消化或编辑,或其任何组合。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如增加的宿主范围。宿主范围是病毒能够感染的细胞类型、菌株或宿主物种的数量。宿主范围的增加是病毒相较于参考和/或非工程化的病毒扩大病毒能够感染的不同细胞类型、菌株或物种的绝对数量。在一些实例中,增加的宿主范围是病毒能够感染的细菌物种中的细菌菌株或变体的数量的增加。宿主范围的增加可以是至少一种或多于一种菌株、细胞类型或物种的增加。可以例如通过本领域公知的标准噬斑测定来测定宿主范围。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如病毒裂解周期。病毒裂解周期是病毒复制的两个周期之一,另一个是溶菌周期。裂解周期导致感染的细胞和感染的细胞膜的破坏。裂解周期包括6个步骤,所述步骤各自可单独地设计。病毒裂解周期中的6个步骤是吸附、附着、注射、复制和组装、裂解和裂解量。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如吸附。吸附是病毒与宿主细胞接触的行为。病毒吸附被表征为病毒对于给定的宿主细胞的亲和力,并且可通过标准吸附测定诸如由hyman和abedon(methodsinmolecularbiology,2009)概述的那些测定法来测定。另外或可选地,病毒吸附可通过在生物化学中被广泛用于分析受体-配体相互作用的其它标准亲和力测定法来测定。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如附着。病毒附着是当病毒强烈地附着于宿主细胞时。病毒附着是病毒与宿主细胞受体之间的不可逆相互作用。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如注射。注射是指病毒基因组注射,并且是当病毒将其遗传物质插入宿主细胞时。可以例如通过测量钾离子流出来测量病毒基因组注射(cady等,j.bacteriol2012年11月;194(21):5728-38;leavitt等,plosone,20138(8):e70936.,所述两篇文献均通过引用整体并入本文)。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如复制和组装。病毒复制和组装是指宿主细胞构建新的病毒。在病毒基因组注射后,宿主细胞机器被劫持,并且病毒基因被转录,病毒蛋白质被翻译,且病毒颗粒是包含复制的病毒基因组的组装体。病毒复制和组装最终将导致宿主细胞裂解,因此,可通过标准噬斑测定或双琼脂斑块测定来测定复制和组装,从而监测病毒生长速率。病毒复制速率可通过在标准噬斑测定、一步曲线中测量裂解量或通过本领域中公知的其它标准病毒适合度测定来测定。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如裂解。裂解是指宿主细胞裂解。在复制和组装新的病毒颗粒后,产生从内部分解宿主细胞壁和/或细胞膜并允许流体进入的酶,其最终导致宿主细胞裂解。增加或抑制病毒的毒力复制的能力可以增加或减少给定的病毒通过裂解杀死宿主细胞所花费的时间。可通过分析感染与宿主细胞裂解之间的时间(通过用标准噬斑测定法或双琼脂噬斑测定法监测病毒生长速率)来测定病毒毒力。另外或可选地,可通过测定后菌落形成单位(cfu)、噬斑测定后噬斑形成单位(pfu)的数目或直径,从生物膜测定法或本领域公知的其它标准测定法来测定相较于参考和/或非工程化的病毒的工程化的病毒的增加的细菌裂解。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如裂解量。裂解量是指感染的细胞产生的病毒数量。裂解量可通过标准裂解量测定法,诸如由ellis和delbriick(jgenphysiol.1939年1月20日;22(3):365-384,通过引用并入本文)和delbriick(delbriick,j.gen.physiol,1940,23;643,通过引用并入本文)概述的那些测定法来测定。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如免疫逃避。免疫逃避是病毒逃避被先天或适应性免疫系统清除的能力。可通过观察中和抗体产生的水平或速度来测定免疫逃逸。另外或者可选地,可通过分析动物中给定的病毒的半衰期或驻留时间来测量免疫逃避。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述导致改良的病毒性质,诸如,例如免疫刺激。免疫刺激是病毒诱导通常与野生型或非工程化的病毒不相关的免疫反应的能力。这可以通过使用标准elisa试剂盒、流式细胞术、组织学或本领域技术人员公知的其它常用免疫学测定法分析在病毒存在的情况下产生的免疫因子来测定。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如免疫失活。免疫失活是病毒降低通常与野生型或非工程化的病毒相关的免疫反应的能力。这可通过使用标准elisa试剂盒、流式细胞术、组织学或本领域技术人员已知的其它常用免疫学测定法分析在病毒存在的情况下产生的免疫因子来测定。在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如生物膜分散。生物膜分散是降解、松动或增加生物膜的渗透性的能力。可导致生物膜分散的活性包括但不限于胞外多糖(eps)降解、群体感应分子的调节以及生物膜或细菌感染部位内的细胞外dna或rna的降解。“胞外多糖降解”是指病毒产生能够使由微生物分泌至其环境中以形成生物膜的结构完整性的高分子量化合物降解或解离的蛋白质或酶的能力。eps降解活性可包括但不限于表面活性剂、糖苷酶和蛋白酶。可使用本领域技术人员已知的标准生物化学测定法来测量它们的活性。群体感应分子的调节也可导致生物膜分散。已知群体感应分子是许多人类病原菌中高度保守的毒力调节剂。已鉴定了具有能够降解群体感应分子的酶促活性的蛋白质,并且通过各种微生物报道基因测定法、生物化学报道基因测定法或通过使用tlc分析裂解产物(rajesh和rai,microbiologicalresearch,2014年7月-8月,第169卷,第7-8期,第561-569页,通过引用并入本文)来测量它们活性。生物膜或细菌感染部位内的细胞外dna或rna的降解还可导致生物膜分散。病毒编码的dna酶或rna酶活性可通过本领域技术人员已知的商购可得的试剂盒(诸如,作为非限制性实例,可获自jenabioscience或thermofisher的那些试剂盒)来测量。还可通过定量处理后存在的生物膜并将其与对照条件相比较来评估生物膜的阻挡、渗透、破坏或分散。生物测量是本领域公知的,并且作为非限制性实例包括用染料诸如结晶紫对生物膜进行染色,并在分光光度计上定量吸光度。在一些实例中,本公开提供了工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如细菌噬菌体抗性。噬菌体或细菌噬菌体是可互换使用的术语,并且是指感染细菌的病毒。细菌噬菌体抗性是指抗细菌噬菌体的细菌从用特定病毒处理或暴露于特定病毒的群体中的出现。这可通过细菌内的随机突变发生,或因为群体内的某些细菌不能被病毒感染而发生。当这些抗性细菌扩增时,新的群体对其最初所暴露的病毒或细菌噬菌体具有抗性。评估细菌抗性的非限制性实例是在病毒处理后跟踪细菌生长的速率,因为抗性细菌的数量直接影响群体再生长的速度。可通过至少3种方法工程化细菌噬菌体以防止细菌获得病毒抗性,所述方法包括1)抑制已知的病毒抗性系统,2)编码第二毒素,和/或3)通过增强裂解能力来增强毒力。作为一个实例,细菌噬菌体可以通过表达已知或合成的抑制性蛋白来逃避或抑制已知的病毒抗性系统。这些抑制性蛋白的活性可通过经典双层噬斑滴定法和/或铺板效率的分析来监测。病毒抗性系统可包括但不限于crispr-cas和限制性修饰系统。病毒抗性的预防还可通过第二毒素的表达诸如杀菌有效载荷来实现。这些第二毒素的活性与给定的病毒的天然裂解活性无关,并且可通过生长/杀伤曲线分析来测量。另外或可选地,可使用通常用于表征蛋白质毒素和本领域技术人员公知的已建立的生物化学和/或表型测定法来纯化和表征遗传编码的毒性蛋白质。在一些实例中,本公开内容提供了工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如细菌抗生素敏化。“细菌抗生素敏化”是指病毒表达遗传编码的有效载荷以使感染的或相邻的细胞对抗微生物剂更敏感的能力。有效载荷可在病毒或细菌噬菌体上遗传编码,然后在宿主细胞内表达。表达的有效载荷可任选地由宿主细胞分泌或在宿主细胞裂解时释放。抗生素敏化活性可通过使用例如公知的棋盘微量稀释测定法的协同测试来观察。在一些实例中,本公开提供了工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如毒力因子的调节。“毒力因子的调节”是指病毒遗传编码能够调节已知毒力因子的表达或活性的蛋白质或化合物。毒力因子调节剂的非限制性实例是转录因子、抗体和免疫蛋白。可以例如在动物模型、生物化学测试或报道基因测定中观察毒力因子和毒力因子调节剂的表达或活性。在一些实例中,本公开提供了工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如靶向宿主基因组消化或编辑。“靶向宿主基因组消化或编辑”是指病毒遗传编码能够在给定的遗传基因座上进行靶向基因组消化,以及任选地通过例如修复dna分子的插入进行编辑的序列特异性核酸酶的能力。靶向消化活性可以通过测序、活菌计数、新序列整合的确认和/或本领域技术人员已知的其它标准技术来观察。在一些方面,本公开提供了包括体外消化步骤的工程化病毒核酸的体外方法。在一些实例中,分离消化的病毒核酸并对其进行测序,而不用于体外或体内组装反应。在一些实例中,来自病毒核酸片段的测序结果用于确定病毒基因组末端。在一些实例中,经校正的病毒基因组序列用于进一步计划和设计体外工程方法和步骤。在一些方面,本公开提供了包括病毒核酸分离的工程化病毒序列的体外方法。在一些实例中,病毒核酸是完整的病毒基因组。在一些实例中,从病毒颗粒中分离完整的病毒基因组。在一些实例中,病毒核酸是病毒基因组的子部分。在一些实例中,病毒核酸是包含在质粒中的病毒基因组的子部分。在一些实例中,从宿主细胞分离包含病毒基因组子部分的质粒。在一些实例中,已将病毒基因组子部分克隆到质粒中,转化到宿主细胞中,并在体外工程化之前进行分离。在一些实例中,从头合成病毒核酸。从头合成可包括使用本领域已知的标准方法在体外或体内合成寡核苷酸并组装它们。在一些实例中,在消化之前扩增(诸如,例如pcr扩增)病毒核酸。在一些方面,本公开提供了用于工程化病毒序列的试剂盒,其包含(a)缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶,(b)拥挤剂,(c)具有3'外切核酸酶活性的分离的热稳定的非链置换dna聚合酶,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物,(d)分离的热稳定的连接酶,(e)dntp的混合物,(f)合适的缓冲液,和(g)纯化的重组rna引导的核酸酶。在一些实例中,rna引导的核酸酶是cas9或cas9衍生的酶。在一些实例中,试剂盒还包含定制设计的靶向rna。在一些实例中,靶向rna是嵌合grna或crrna和tracrrna。在一些实例中,试剂盒还包含定制设计的合成核酸分子,以在组装反应中用作插入的dna片段。在一些实例中,试剂盒还包含感受态宿主细胞。在一些实例中,该试剂盒还包含分离的病毒核酸。在一些方面,本公开提供了用于体外工程化病毒核酸的系统,其包含分离的病毒核酸、重组rna引导的核酸酶、至少一种靶向rna以及将在消化位点处组装成分离的病毒核酸的dna或rna片段。在一些实例中,分离的病毒核酸是从病毒颗粒分离的完整基因组。在一些实例中,分离的病毒核酸是被亚克隆到质粒中并从宿主细胞分离的病毒基因组子部分。在一些实例中,rna引导的核酸酶是cas9或cas9衍生的酶。在一些实例中,靶向rna是crrna和tracrrna。在一些实例中,靶向rna是嵌合引导rna(grna)。在一些实例中,存在两种靶向rna或grna。在一些实例中,存在两组crrna和tracrrna。在一些方面,本公开提供了体外工程化的病毒核酸系统,其包含:分离的病毒核酸、重组rna引导的核酸酶、至少一种靶向rna和待插入分离的核酸消化位点的核酸片段。在一些实例中,所述系统使得重组rna引导的核酸酶和至少一种靶向rna形成能够消化分离的病毒核酸的复合物。在一些实例中,所述系统还包含亚精胺。在一些实例中,所述系统还包含:缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶;拥挤剂;具有3'外切核酸酶活性的分离的热稳定的非链置换dna聚合酶或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物;分离的热稳定的连接酶;dntp的混合物;以及合适的缓冲液,其中所述系统处于对于将核酸片段在rna引导的核酸酶消化的位点上插入分离的病毒核酸中以形成重组病毒核酸是有效的条件下。在一些方面,本文所述的系统使得重组病毒核酸相较于参考和/或非工程化的病毒核酸能够产生具有至少一种改良的病毒性质的非天然存在的病毒颗粒。在一些实例中,改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些方面,在本文所述的系统中,rna引导的核酸酶是cas9或cas9衍生的酶。在一些实例中,在消化后将rna引导的核酸酶灭活或去除。本文公开的方法可用于多种其它病毒基因组和病毒载体构建体,用于通过直接编辑rna基因组或dna模板(其随后将被体外转录入成病毒rna)来修饰rna基因组,用于工程化并直接修饰原核和真核病毒,以及用于直接修饰用于噬菌体展示、噬菌体疗法、病毒诊断或疫苗开发/生产的病毒基因组。在一些方面,本公开提供了通过本文所述的任何方法生成的重组病毒核酸。在一些实例中,相较于非工程化的病毒核酸,重组病毒核酸能够产生具有至少一种改良的病毒性质的非天然存在的病毒颗粒。在一些实例中,改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些方面,本公开提供了工程化的病毒组合物,所述组合物包含相较于非工程化的病毒核酸能够产生具有至少一种改良的病毒性质的非天然存在的病毒颗粒的重组核酸物。在一些实例中,改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些实例中,根据本公开的工程化的病毒核酸通过本文所述方法中的任何步骤生成。所述方法可用于改变核苷酸、基因或整个基因组区域。例如,如下面实施例中所述,已显示所述方法将lkd16gp18基因替换至luz19中,从而导致改良的病毒宿主范围。另外,所述方法可用于在病毒管状复合物中插入单个突变以改善病毒复制。所述方法还可用于将以下物质工程化至细菌噬菌体中,以提高细菌噬菌体在细菌噬菌体疗法或相关用途中的活性:抗微生物肽;脓菌素;eps解聚酶;crispr/cas抑制蛋白;来自细菌噬菌体的尾丝;报道基因(即lux、gfp);群体淬灭基因;核酸酶;talen核酸酶;i型、ii型、iii型、iv型、v型和vi型crispr系统蛋白(即cas9);crisprrna、转录因子和人免疫调节因子。这些元件可以可操作地连接至天然或异源调控元件,诸如天然启动子、异源启动子、诱导型启动子或其任何组合。在一些实施方案中,本公开提供了包含工程化的病毒核酸的工程化的病毒,所述病毒核酸在引入宿主细胞时,相较于非工程化的病毒核酸,能够产生具有两种或更多种改良的病毒性质的非天然存在的病毒颗粒。在一些方面,所产生的病毒颗粒具有至少三种改良的病毒性质。在一些方面,每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些实施方案中,本公开提供了包含工程化的病毒核酸的工程化的病毒。在一些方面,工程化的病毒核酸是工程化的病毒基因组。在一些方面,工程化的病毒基因组是工程化的细菌噬菌体基因组。在工程化的细菌噬菌体的一些方面,至少一种改良的病毒性质是宿主范围。在一些实施方案中,本公开提供了具有两种或更多种改良的病毒性质的工程化的病毒,其包含工程化的病毒核酸。在一些方面,每种改良的病毒性质是工程化的病毒核酸中的至少一个修饰的结果。在一些方面,至少一种改良的病毒性质是工程化的病毒核酸中的至少两个修饰的结果。在一些方面,包含在工程化的病毒核酸中的修饰是单个工程步骤的结果。在一些方面,包含在工程化的病毒核酸中的修饰是迭代工程步骤的结果。在一些实施方案中,本公开提供了具有两种或更多种改良的病毒性质的工程化的病毒,其包含工程化的病毒核酸。在一些方面,所述修饰中的至少一个在核酸序列中,所述核酸序列与seqidno:1、seqidno:2、seqidno:3、seqidno:4、seqidno:50或seqidno:25内的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,所述修饰中的至少一个在编码氨基酸序列的核酸序列中,所述氨基酸序列与seqidno:34、seqidno:35、seqidno:36、seqidno:5、seqidno:48或seqidno:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,工程化的病毒基因组包含与luz19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还包含异源gp18基因的全部或部分。在一些方面,异源gp18基因与seqidno:26具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,异源gp18基因编码与seqidno:38具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列。在一些方面,工程病的毒基因组包含与luz19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还包含工程化的gp34基因的全部或部分。在一些方面,工程化的gp34基因编码在对应于seqidno:5的氨基酸位置55的位置处包含突变的氨基酸序列。在一些方面,异源gp34基因与seqidno:4具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,工程化的病毒基因组包含与luz19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还在一个或多个序列中包含修饰,所述序列与选自由seqidno:1、seqidno:2、seqidno:3和seqidno:50组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,工程化的病毒基因组还在以下序列的每个序列中包含修饰:与seqidno:1具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,与seqidno:2具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,与seqidno:3具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,与seqidno:50具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列。在一些方面,修饰包括对应于seqidno:1的核酸位置50的位置处的g至a的替换,对应于seqidno:50的核酸位置160的位置处的g至t的替换,对应于seqidno:2的核酸位置245的位置处的a至g的替换,对应于seqidno:2的核酸位置247-248的位置处的at至tc的替换,以及对应于seqidno:3的核酸位置757的位置处的a至g的替换。在一些方面,工程化的病毒基因组包含与luz19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还在编码氨基酸序列的一个或多个核酸序列中包含修饰,所述氨基酸序列与选自由seqidno:34、seqidno:35、seqidno:36和seqidno:48组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,工程化的病毒基因组在编码以下氨基酸序列中的每一个的核酸序列中包含修饰:与seqidno:34具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,与seqidno:35具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,与seqidno:36具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,和与seqidno:48具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列。在一些方面,所述修饰包括对应于seqidno:34的氨基酸位置17的位置处的c至y的替换,对应于seqidno:48的氨基酸位置36的位置处的d至y的替换,对应于seqidno:35的氨基酸位置82的位置处的d至g的替换,对应于seqidno:35的氨基酸位置83的位置处的i至s的替换,以及对应于seqidno:36的氨基酸位置253的位置处的n至d的替换。在一些方面,工程化的病毒基因组包含与luz19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还在与seqidno:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列中包含修饰。在一些方面,所述修饰是将异源核酸分子插入与seqidno:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,或者用异源核酸分子替换包含在与seqidno:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列中的序列。在一些方面,异源核酸分子包含异源核酸序列,所述序列与选自由seqidno:6、seqidno:12、seqidno:13、seqidno:14、seqidno:16、seqidno:17、seqidno:18、seqidno:19和seqidno:20组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,工程化的病毒基因组包含与luz19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还在编码氨基酸序列的核酸序列中包含修饰,所述氨基酸序列与seqidno:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,所述修饰是将异源核酸分子插入编码氨基酸序列的核酸序列,所述氨基酸序列与seqidno:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,或用异源核酸分子替换编码氨基酸序列的核酸序列中的核酸序列,所述氨基酸序列与seqidno:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,所述异源核酸分子包含编码与选自由seqidno:37、seqidno:39、seqidno:40、seqidno:41、seqidno:43、seqidno:44、seqidno:45、seqidno:46和seqidno:47组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列的异源核酸序列。在一些方面,工程化的病毒核酸包含可操作地连接至启动子的异源核酸序列,所述启动子含有包含在seqidno:21或其部分内的核酸序列。在一些方面,工程化的病毒核酸包含可操作地连接至终止子的异源核酸序列,所述终止子含有包含在seqidno:22或其部分内的核酸序列。在一些实施方案中,本公开提供了用于生成具有两种或更多种所需病毒性质的工程化的目标病毒的方法,其包括:(a)提供第一病毒基因组;和(b)通过将第一病毒基因组的至少一个片段与至少一个修复核酸分子组合来工程化第二病毒基因组,使得所得的第二病毒基因组相较于第一病毒基因组包含至少一个修饰,并且其中,在被引入宿主细胞时,所述第二病毒基因组能够产生具有两种或更多种改良的病毒性质的病毒颗粒。在一些方面,本文公开的方法还包括(c)在一次或多次迭代中重复步骤(a)-(b)。在一些方面,每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,在步骤(b)中工程化第二病毒基因组还包括:(1)使用内切核酸酶体外消化第一病毒基因组的区域;和(2)将消化的第一病毒基因组的至少一个片段与至少一种修复核酸分子组装。在一些方面,从病毒颗粒分离所述第一病毒基因组。在一些方面,从头合成第一病毒基因组或至少一种修复核酸分子。在一些方面,从头合成包括组合化学合成的核酸分子、pcr扩增的核酸序列、分离的核酸分子的消化片段或其任何组合。在一些方面,在体外消化之前扩增第一病毒基因组或至少一种修复核酸分子。在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的期望的病毒性质的工程化的目标病毒的方法。在一些方面,第一病毒基因组为至少18kb。在一些方面,第一病毒基因组为至少2kb至至少4mb。在一些方面,第一病毒基因组为至少18kb至至少4mb。在一些方面,第一病毒基因组为至少5kb、至少10kb、至少15kb、至少18kb、至少20kb、至少25kb、至少30kb、至少35kb、至少40kb、至少45kb、至少50kb、至少55kb、至少60kb、至少65kb、至少70kb、至少75kb、至少80kb、至少85kb、至少90kb、至少100kb、至少125kb、至少150kb、至少175kb、至少200kb、至少250kb、至少300kb、至少400kb、至少500kb、至少600kb、至少700kb、至少800kb、至少900kb、至少1mb、至少1.5mb、至少2mb、至少2.5mb、至少3mb或至少3.5mb。在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,在体外或体内进行组装。在一些方面,在对于将片段插入消化的病毒核酸中以形成包含工程化的病毒基因组的重组核酸是有效的条件下,利用混合物在体外进行组装,所述混合物包含:(a)缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶;(b)拥挤剂;(c)具有3'外切核酸酶活性的分离的热稳定的非链置换dna聚合酶,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物;(d)分离的热稳定的连接酶;(e)dntp的混合物;和(f)合适的缓冲液。在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,在体外或体内进行组装。在一些方面,在宿主细胞中在体内进行组装。在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,所述内切核酸酶是rna引导的核酸酶。在一些方面,所述方法还包括一种或多种引导rna。在一些方面,rna引导的核酸酶是cas9或cas9衍生的酶。在一些方面,所述引导rna包括1)嵌合grna或2)crrna和tracrrna。在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,所述内切核酸酶被热灭活或去除。在一些方面,体外消化还包括亚精胺。在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,所述方法还包括将工程化的病毒基因组转化到宿主细胞中。在一些方面,所述方法还包括使用用于将工程化的病毒基因组包装到病毒颗粒中的体外包装试剂盒。在一些实施方案中,本公开提供了通过本文公开的任何方法生成的工程化的病毒。在一些实施方案中,本公开提供了通过本文公开的任何工程方法生成的本文公开的工程化的病毒中的任一种的组合物。在一些实施方案中,本公开提供了用于工程化病毒核酸分子的试剂盒,其包含:纯化的重组rna引导的核酸酶;缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶;拥挤剂;具有3'外切核酸酶活性的分离的热稳定的非链置换dna聚合酶,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物;分离的热稳定的连接酶;dntp的混合物;以及合适的缓冲液。在一些方面,所述试剂盒还包含定制设计的引导rna。在一些情况下,所述试剂盒还包含定制设计的合成核酸分子以在组装反应中用作插入的dna片段。在一些方面,所述试剂盒还包含用于转化的感受态宿主细胞。在一些方面,所述试剂盒还包含分离的病毒基因组核酸。在一些方面,本公开提供了体外工程化的病毒核酸系统,其包含:分离的病毒核酸、重组rna引导的核酸酶、至少一种靶向rna和待插入所述分离的核酸消化位点的核酸片段。在一些实例中,所述系统使得重组rna引导的核酸酶和至少一种靶向rna形成能够消化所述分离的病毒核酸的复合物。在一些实例中,所述系统还包含亚精胺。在一些实例中,所述系统还包含:缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶;拥挤剂;具有3'外切核酸酶活性的分离的热稳定的非链置换dna聚合酶或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物;分离的热稳定的连接酶;dntp的混合物;以及合适的缓冲液,其中所述系统处于对于将核酸片段在rna引导的核酸酶消化的位点上插入所述分离的病毒核酸中以形成重组病毒核酸是有效的条件下。在一些方面,本文所述的系统使得重组病毒核酸相较于非工程化的病毒核酸能够产生具有至少一种改良的病毒性质的非天然存在的病毒颗粒。在一些实例中,改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些方面,在本文所述的系统中,rna引导的核酸酶是cas9或cas9衍生的酶。在一些实例中,在消化后将rna引导的核酸酶灭活或去除。在一些方面,本文所述的方法用作校正分离的核酸中的序列的差错校正方法。标准差错校正方法是基于pcr的,其具有两个固有的问题:1)pcr可向核酸中引入额外的不想要的突变;和2)在上下文中pcr具有约5kb的大小限制。因此,作为pcr生成的突变或不能扩增的结果,不能可靠地对大于5kb的质粒进行基于pcr的标准差错校正方法。本文所述的体外工程化核酸序列的方法避免了对pcr扩增的需要,其消除了大小限制并消除了pcr生成的突变的可能性。在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包括分离核酸;使用rna引导的核酸酶体外消化所述核酸的区域;以及通过将dna或rna片段插入消化的核酸中来组装重组核酸。在一个方面,体外消化是rna引导的酶促消化。另一方面,酶促消化使用cas9或cas9衍生的酶来进行。在另外的方面,消化还包括靶向rna。在另一个方面,消化还包括亚精胺。在特定方面,靶向rna是grna、crrna和/或tracrrna。在另一个方面,在消化后,通过标准方法诸如暴露于热(例如,诸如至少80℃)灭活rna引导的核酸酶。另外或可选地,通过标准方法(诸如,例如苯酚-氯仿提取)除去rna引导的核酸酶。在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包括分离核酸;使用rna引导的核酸酶体外消化所述核酸的区域;以及通过将dna或rna片段插入消化的核酸中来组装重组核酸。在一些实例中,在对于将片段插入消化的病毒核酸中以形成重组核酸是有效的条件下,利用组分的混合物在单个容器中在体外进行组装,所述混合物包含:(a)缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶,(b)拥挤剂,(c)具有3'外切核酸酶活性的分离的热稳定的非链置换dna聚合酶,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物,(d)分离的热稳定的连接酶,(e)dntp的混合物,和(f)合适的缓冲液。在一些方面,外切核酸酶是t5外切核酸酶,并且接触处于等温条件下,和/或拥挤剂是peg,和/或非链置换dna聚合酶是phusiontmdna聚合酶或dna聚合酶,和/或连接酶是taq连接酶。在一些实例中,通过一步或等温吉布森组装进行体外组装。在一些实例中,通过两步吉布森组装进行体外组装。在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包含rna引导的核酸酶。在一些实例中,rna引导的核酸酶是ii型cas9。在一些实例中,rna引导的核酸酶是cas9或cas9衍生的酶。在一些实例中,rna引导的核酸酶是分离的重组cas9或cas9衍生的酶。在一些实例中,存在至少一种分离的靶向rna。在一些实例中,存在两种靶向rna。在一些实例中,靶向rna是嵌合指导rna(grna)或一组crrna和tracrrna。在一些实例中,体外消化反应使用两种grna。在一些实例中,体外消化反应使用两组crrna和tracrrna。在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包括体外消化步骤。在一些实例中,在消化后,通过标准方法诸如暴露于热(例如,诸如至少80℃)灭活rna引导的核酸酶。在一些实例中,在消化后,通过苯酚-氯仿提取除去rna引导的核酸酶。在一些实例中,在消化后,通过本领域公知的其它提取方法除去rna引导的核酸酶。在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法产生工程化的核酸。在一些实例中,然后将工程化的核酸转化到宿主细胞中。在一些实例中,宿主细胞是大肠杆菌、铜绿假单胞菌、酿酒酵母、需钠弧菌、枯草芽孢杆菌或本领域公知的其它微生物。在一些实例中,通过热休克、电穿孔、基因枪、微粒轰击、缀合、转导、脂转染或本领域公知的其它已建立的方法进行转化。在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包括分离的核酸。在一些实例中,核酸是从宿主细胞分离的完整基因组。在一些实例中,宿主细胞是大肠杆菌、酿酒酵母、枯草芽孢杆菌、需钠弧菌、铜绿假单胞菌或其它公知的微生物。在一些实例中,核酸是质粒。在一些实例中,从宿主细胞分离质粒。在一些实例中,已将目标核酸克隆到质粒中,转化到宿主细胞中,并且在体外工程之前通过本文所述的方法分离。在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包括分离核酸。在一些实例中,分离的核酸是基因组或质粒。在一些实例中,分离的基因组或质粒为至少6kb、至少7kb、至少8kb、至少9kb、至少10kb、至少12kb、至少15kb、至少20kb、至少25kb或至少28kb。在一些实例中,分离的基因组或质粒为6kb至1mb。在一些实例中,分离的基因组或质粒为6kb至10kb、8kb至15kb、12kb至20kb、15kb至22kb、20kb至25kb、22kb至28kb、25kb至30kb、25kb至50kb或40kb至100kb。另外或可选地,对于任何上述公开的实施方案,本公开包括以下实施方案:实施方案1是包含工程化的病毒核酸的工程化的病毒,所述工程化的病毒核酸在引入宿主细胞时,相较于通过将非工程化的病毒核酸引入宿主细胞而产生的病毒颗粒,能够产生具有两种或更多种,或任选地三种或更多种改良的病毒性质的非天然存在的病毒颗粒。实施方案2是实施方案1的工程化的病毒,其中每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。实施方案3是实施方案1或2的工程化的病毒,其中所述病毒核酸是以下病毒核酸中的一种或多种:病毒基因组、病毒基因组片段、细菌噬菌体基因组、细菌噬菌体基因组片段、裂解性细菌噬菌体基因组、裂解性细菌噬菌体基因组片段或其任何组合。实施方案4是实施方案1-3中任一项的工程化的病毒,其中所述工程化的病毒核酸是细菌噬菌体基因组,并且任选地,其中所述改良的病毒性质中的至少一种是宿主范围。实施方案5是实施方案1-4中任一项的工程化的病毒,其中满足以下方面中的至少一个:1)每种改良的病毒性质是工程化的病毒核酸中的至少一个修饰的结果,2)至少一种改良的病毒性质是工程化的病毒核酸中的至少两个修饰的结果,3)包含在工程化的病毒核酸中的修饰是单个工程步骤的结果,4)包含在工程化的病毒核酸中的修饰是迭代工程步骤的结果,或5)其任何组合。实施方案6是实施方案1-5中任一项的工程化的病毒,其中至少一个修饰在以下序列中:1)与包含在seqidno:1、seqidno:2、seqidno:3、seqidno:4、seqidno:50或seqidno:25内的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的核酸序列,或2)编码氨基酸序列的核酸序列,所述氨基酸序列与seqidno:34、seqidno:35、seqidno:36、seqidno:5、seqidno:48或seqidno:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,或3)其任何组合。实施方案7是实施方案1-6中任一项的工程化的病毒,其中所述工程化的病毒核酸包含工程化的病毒基因组,所述工程化的病毒基因组包含与luz19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。实施方案8是实施方案1-7中任一项的工程化的病毒,其中所述工程化的病毒基因组还包含以下序列的至少一种:1)异源gp18基因的全部或部分,以及任选地,其中所述异源gp18基因与seqidno:26具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性;2)异源gp18基因的全部或部分,以及任选地,其中所述异源gp18基因编码与seqidno:38具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列;3)工程化的gp34基因的全部或部分,以及任选地,其中所述异源gp34基因编码氨基酸序列,所述氨基酸序列在对应于seqidno:5的氨基酸位置55的位置处包含突变,或任选地其中所述异源gp34基因与seqidno:4具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性;4)一个或多个序列中的修饰,所述序列与选自由seqidno:1、seqidno:2、seqidno:3和seqidno:50组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,并且任选地以下序列中的每一个中的修饰:与seqidno:1具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,与seqidno:2具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,与seqidno:3具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,以及与seqidno:50具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,并且任选地,其中所述修饰包括对应于seqidno:1的核酸位置50的位置处的g至a的替换、对应于seqidno:50的核酸位置160的位置处的g至t的替换、对应于seqidno:2的核酸位置245的位置处的a至g的替换、对应于seqidno:2的核酸位置247-248的位置处的at至tc的替换和对应于seqidno:3的核酸位置757的位置处的a至g的替换;5)一个或多个编码氨基酸序列的核酸序列中的修饰,所述氨基酸序列与选自由seqidno:34、seqidno:35、seqidno:36和seqidno:48组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,并且任选地编码以下氨基酸序列中的每一个的核酸序列中的修饰:与seqidno:34具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,与seqidno:35具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,与seqidno:36具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,与seqidno:48具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,并且任选地,其中所述修饰包括对应于seqidno:34的氨基酸位置17的位置处的c至y的替换,对应于seqidno:48的氨基酸位置36的位置处的d至y的替换,对应于seqidno:35的氨基酸位置82的位置处的d至g的替换,对应于seqidno:35的氨基酸位置83的位置处的i至s的替换,以及对应于seqidno:36的氨基酸位置253的位置处的n至d的替换;6)与seqidno:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列中的修饰,并且任选地,其中所述修饰是将异源核酸分子插入与seqidno:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列中,或用异源核酸分子替换包含在与seqidno:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列中的序列,并且任选地,其中所述异源核酸分子包含异源核酸序列,所述异源核酸序列与选自由seqidno:6、seqidno:12、seqidno:13、seqidno:14、seqidno:16、seqidno:17、seqidno:18、seqidno:19和seqidno:20组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性;7)编码氨基酸序列的核酸序列中的修饰,所述氨基酸序列与seqidno:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,并且任选地其中所述修饰是将异源核酸分子插入编码氨基酸序列的核酸序列中,所述氨基酸序列与seqidno:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,或用异源核酸分子替换包含在编码氨基酸序列的核酸序列中的核酸序列,所述氨基酸序列与seqidno:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,并且任选地其中所述异源核酸分子包含编码与选自由seqidno:37、seqidno:39、seqidno:40、seqidno:41、seqidno:43、seqidno:44、seqidno:45、seqidno:46和seqidno:47组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列的异源核酸序列,8)其任何组合。实施方案9是实施方案1-8中任一项的工程化的病毒,其中所述工程化的病毒核酸包含可操作地连接至以下序列的异源核酸序列:1)含有包含在seqidno:21或其部分内的核酸序列的启动子,2)含有包含在seqidno:22或其部分内的核酸序列的终止子,或3)其任何组合。实施方案10是用于生成具有两种或更多种所需病毒性质的工程化的目标病毒的方法,其包括:(a)提供第一病毒基因组;和(b)通过将第一病毒基因组的至少一个片段与至少一个修复核酸分子组合以生成第二病毒基因组来生成工程化的病毒基因组,所述第二病毒基因组相较于所述第一病毒基因组包含至少一个修饰;其中,所述第二病毒基因组在被引入宿主细胞时能够产生具有两种或更多种改良的病毒性质的病毒颗粒,以及(c)在一次或多次迭代中重复步骤(a)-(b)。实施方案11是实施方案10的方法,其中每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。实施方案12是实施方案10或11的方法,其中在步骤(b)中生成工程化的病毒基因组包括:(1)使用内切核酸酶体外消化第一病毒基因组的区域;和(2)将消化的第一病毒基因组的至少一个片段与至少一个修复核酸分子组装。实施方案13是实施方案10-12中任一项的方法,其中满足以下要素中的至少一个:1)从病毒颗粒分离第一病毒基因组,2)从头合成第一病毒和/或至少一种修复核酸分子并且任选地,其中从头合成包括组合化学合成的核酸分子、pcr扩增的核酸序列、分离的核酸分子的消化的片段或其任何组合,3)在体外消化之前扩增第一病毒基因组和/或至少一种修复核酸酸分子,或4)其任何组合。实施方案14是实施方案10-13中任一项的方法,其中所述第一病毒基因组是以下的至少一种:1)至少3kb、至少10kb、至少18kb、至少25kb或至少30kb;2)至少18kb;3)至少2kb至至少4mb;4)至少18kb至至少4mb;或5)至少5kb、至少10kb、至少15kb、至少18kb、至少20kb、至少25kb、至少30kb、至少35kb、至少40kb、至少45kb、至少50kb、至少55kb、至少60kb、至少65kb、至少70kb、至少75kb、至少80kb、至少85kb、至少90kb、至少100kb、至少125kb、至少150kb、至少175kb、至少200kb、至少250kb、至少300kb、至少400kb、至少500kb、至少600kb、至少700kb、至少800kb、至少900kb、至少1mb、至少1.5mb、至少2mb、至少2.5mb、至少3mb或至少3.5mb。实施方案15是实施方案10-14中任一项的方法,其中体外进行所述组装,并且任选地其中在对于将片段插入消化的病毒核酸中以形成包含所述工程化的病毒基因组的重组核酸是有效的条件下,利用混合物在体外进行所述组装,所述混合物包含:(a)缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶,其任选地是非热稳定的;(b)任选的拥挤剂;(c)具有3'外切核酸酶活性的分离的非链置换dna聚合酶,其任选地是热稳定的,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物;(d)任选地为热稳定的分离的连接酶;(e)dntp的混合物;和(f)任选合适的缓冲液。实施方案16是实施方案10-14中任一项的方法,其中体内进行所述组装,并且任选地其中在宿主细胞中进行体内组装。实施方案17是实施方案10-16中任一项的方法,其中满足以下要素中的至少一个:1)内切核酸酶是rna引导的核酸酶,2)所述方法还包括至少一种引导rna,3)所述rna引导的核酸酶是cas9或cas9衍生的酶,并且其中所述至少一个引导rna包括(a)嵌合grna或(b)crrna和tracrrna,4)在组装之前将所述内切核酸酶热灭活或去除;5)体外消化还包括亚精胺,6)所述方法还包括将工程化的病毒基因组转化到宿主细胞中,7)所述方法还包括使用用于将式程化的病毒基因组包装到病毒颗粒中的体外包装试剂盒,或8)其任何组合。实施方案18是通过实施方案10-17中任一项的方法生成的工程化的病毒,并且任选地,其中所述工程化的病毒是来自实施方案1-9的任一项的工程化的病毒。实施方案19是用于工程化核酸分子的试剂盒,所述核酸分子任选地是病毒核酸分子,所述试剂盒包含:(a)纯化的重组rna引导的核酸酶;(b)缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶,其任选地是非热稳定的;(c)具有3'外切核酸酶活性的分离的非链置换dna聚合酶,其任选地是热稳定的,或所述dna聚合酶与缺少3'外切核酸酶活性的第二dna聚合酶的混合物;(d)分离的连接酶,其任选地是热稳定的;并且任选地还包含以下任何一种:1)拥挤剂,2)dntp的混合物,3)合适的缓冲液,4)定制设计的引导rna,5)定制设计的合成核酸分子,以在组装反应中用作插入的dna片段,6)用于转化的感受态宿主细胞,7)分离的病毒基因组核酸,或8)其任何组合。实施方案20是工程化核酸序列的方法,其包括:(a)提供核酸;(b)使用rna引导的核酸酶体外消化所述核酸的区域;和(c)通过将dna片段插入消化的核酸中组装重组核酸,其中在对于将片段插入消化的核酸中以形成重组核酸是有效的条件下,利用组分的混合物在单个容器中在体外进行所述组装,所述混合物包含:(i)缺少3'外切核酸酶活性的分离的5'至3'外切核核酸酶,其任选地是非热稳定的;(ii)具有3'外切核酸酶活性的分离的非链置换dna聚合酶,其任选地是热稳定的,或所述dna聚合酶与缺乏3'外切核酸酶活性的第二dna聚合酶的混合物;(iii)分离的连接酶,其任选地是热稳定的;(iv)dntp的混合物,并且任选地其中所述体外组装混合物还包含(v)拥挤剂,或(vi)合适的缓冲液。实施方案21是实施方案20的方法,其中满足以下要素中的至少一个:1)所述rna引导的核酸酶是cas9或cas9衍生的酶,2)在组装之前将所述rna引导的核酸酶热灭活或去除,3)所述方法还包括将重组核酸转化到宿主中细胞中,4)所述核酸是从宿主细胞分离的质粒,并且任选地其中所述质粒为至少6kb、至少10kb、至少15kb或至少20kb,或5)其任何组合。在以下实施例中进一步举例说明了本公开的所有方面。然而,实施例不限制由所附权利要求限定的本公开的范围。本文给出的一般方法的论述旨在仅用于说明目的。在审阅本公开内容之后,其它替代方法和实施方案对于本领域的技术人员来说将是显而易见的,并且将被包括在本申请的精神和范围内。实施例实施例i体外病毒基因组基工程例如使用norgenbiotek噬菌体dna分离试剂盒或本领域已知的任何其它方法,从病毒颗粒分离43kbdsdnaluz19病毒基因组(登录号nc_010326.1)(图2a)。使用rna引导的核酸酶cas9和体外转录的grna在两个独立位置进行位点特异性消化。未消化的43kb基因组dna比最大的dna梯带(10kb)迁移明显更少。线性基因组的消化产生三个尺寸的片段:~39kb、~4.3kb和~200bp。过量使用靶向grna并阻碍200bp片段(图2b)。使用具有5'尾(其与紧接luz19消化位点的上游和下游的区域具有100bp同源性)的引物从φkf77pcr扩增gp7的片段(图2c)。使用吉布森组装法将pcr扩增的φkf77gp7片段(seqidno:8)无缝整合到消化的luz19基因组中以替换天然gp7区域(seqidno:23)(图2d)。几乎未观察到本底,因为cas9切割导致缺少体外吉布森组装所需的同源性的平端双链断裂。将体外编辑的基因组直接转化到宿主细胞中以产生功能性病毒颗粒(图2e)。利用在工程区域内部和外部的引物,使用pcr验证了φkf77基因片段至回收病毒中的整合。未编辑的luz19gdna用作阴性对照,而所有实验病毒包含新的φkf77基因片段(最后7个泳道)。这些数据呈现实施体外病毒工程以编辑铜绿假单胞菌裂解性噬菌体基因组的实例。由于在异源细菌宿主诸如大肠杆菌中的毒性作用,缺少适于毒性病毒的选择标记以及在luz19基因组内缺少独特的标准限制性内切酶位点,因此不能通过标准方法工程化噬菌体诸如luz19。因此,这些数据证明了本文所述的体外工程方法是如何使得能够直接和快速地工程化其它非遗传易控的病毒基因组。对于至铜绿假单胞菌中的转化,如irani和rowe((irani,v.r.&rowe,j.j.biotechniques1997,22,54-56)中所述制备化学感受态铜绿假单胞菌细胞。基本上,将3ml铜绿假单胞菌细胞的起子培养物稀释在400ml新鲜lb中。除非另外提及,否则将培养物在37℃振荡(220rpm)下生长至od600=0.6。将细胞在冰上冷冻10分钟,转移到500ml离心瓶中,并在冷冻离心机(4℃)中以5,000g沉淀20分钟。将细菌沉淀用100ml冰冷的150mmmgcl2洗涤,然后分入两个50ml锥形管中,并在冷冻离心机(4℃)中以5,000g沉淀。将细胞用30ml150mmmgcl2再次洗涤一次,然后离心,并悬浮于15ml冷的150mmmgcl2中。将细胞悬浮液在冰上孵育1小时,然后在4℃下离心并重新悬浮于4ml冷的150mmmgcl2中。将200μl等分样品置于单个1.5ml微量离心管中,并保持在冰上达2天。将纯化的dna添加至细胞的每个等分试样中,短暂涡旋,并在冰上孵育1小时。将细胞在50℃下热休克3分钟,然后直接放置回冰上5分钟,然后铺板。将每个转化添加4ml的50℃的lb顶层琼脂中,并铺板在预温热的lb板上。将板倒置并在37℃on下孵育以允许噬斑形成。实施例ii具有扩大的宿主范围的工程化的病毒使用双琼脂噬斑测定法筛选大型临床文库(282个铜绿假单胞菌分离株)对噬菌体luz19和lkd16的易感性。66个菌株能够被两种病毒中的至少一种感染,其中18个和6个菌株分别被luz19和lkd16唯一地感染。因此,luz19被选为用于测试负责宿主范围扩大的lkd16遗传元件的底盘。两种病毒之间的比较基因组学表明lkd16基因产物18(gp18)与luz19gp18同源物具有不同的序列,表明其可能负责宿主范围的决定。如上所述从luz19病毒颗粒分离病毒基因组。使用rna-依赖性核酸酶和体外转录的grna进行位点特异性消化以切除luz19gp18基因。用luz19同源末端pcr扩增来自lkd16的gp18以用于整合。使用吉布森组装法将pcr扩增的lkd16gp18(seqidno:7)无缝地整合到消化的luz19基因组中,以替换天然gp18序列(seqidno:50)。将体外工程化的基因组直接转化到宿主细胞中以产生功能性病毒颗粒。具有lkd16基因gpl8的工程化luz19病毒能够感染通常被luz19噬菌体感染的所有菌株以及先前仅被lkd16感染的3个菌株,从而证明宿主范围扩大(图3b和6b)。这表明gpl8是负责差异性lkd16宿主范围的遗传元件,以及具有该基因的工程化的luz19病毒更好地能够在更多宿主菌株中复制。这些数据表明对其它非遗传易控的病毒基因组实施本文所公开的体外工程方法,这导致扩大的宿主范围的改良的病毒性质。当开发杀死细菌的病毒时,合理工程化具有扩大的宿主范围的细菌噬菌体的能力是具有重要价值的性质。实施例iii具有病毒属的宿主范围的工程化的病毒将luz19和/或luz19衍生物用作用于进化或共感染实验的起始材料,以鉴定用于将φkmv病毒属的宿主范围压缩成单个代表性病毒的靶标。在受纳(pao1k)或非受纳(抗性)宿主(pa7410或pa7649)中进行共转化或共感染实验(图4a)。分别在lkd16或φkmv存在的情况下进行共感染和共转化。针对指定细菌菌株使用双琼脂噬斑平板测定法测试宿主范围。在目标菌株中筛选扩大的宿主范围后,将进化的噬菌体可选地通过受纳和选择性菌株(仅被luz19-pa7632感染的菌株)传代3-5次。在pao1k中扩增出进化的噬菌体,纯化gdna并对其进行测序。将luz19与能够感染先前仅对lkd16或φkmv敏感的菌株的进化的luz19之间的比较基因组学用于鉴定负责宿主范围扩大的点突变(图4b)。使用双琼脂噬斑测定法筛选大型临床文库(282个铜绿假单胞菌分离株)对φkmv病毒属的易感性。3种噬菌体(luz19、lkd16和φkmv)显示不同的宿主范围,并能够感染67个菌株,其中luz19感染大多数临床分离株(图4c)。6个临床分离株(pa7245、pa7255、pa7427、pa7503、pa7686和pa7410)仅对lkd16易感,1个临床分离株仅对φkmv(pa7649)易感。因此,luz19被选为进化/共感染/共转化实验的底盘,以获得能够感染所有对φkmv属敏感的临床分离株的变体。比较基因组学揭示了几个点突变是luz19感染仅对lkd16或φkmv易感的菌株所必需的:(i)gp13c17y(seqidno:1的位置50)是pa7427的感染所必需的;(ii)gp18d36y(seqidno:50的位置106)是pa7245、pa7503和pa7686的感染所需要的;gp38d82g和i83s(分别为seqidno:2的位置245和247-248)使得能够感染pa7410和pa7649;(iv)gp40n253d(seqidno:3的位置757)允许感染pa7255(图4b)。使用本文所述的体外工程法将上述突变迭代工程化至luz19底盘中导致能够感染对φkmv属噬菌体易感的所有临床分离株的广范围宿主范围luz19(whrluz19)(图4c)。这些数据提供了通过以下步骤使用本文公开的体外工程方法将病毒属的宿主范围压缩成单个病毒基因组的实例:首先在进化实验后鉴定负责宿主范围差异的遗传突变、筛选、测序、比较基因组学和其任何组合。实施例iv改良的病毒复制增强早期生物膜破坏在另一个实例中,病毒进化和比较基因组学表明,由于增加的裂解量,在尾部管蛋白b(gp34)内具有l55δ突变的luz19进化的噬菌体以更大的速率复制(图5b)。为了验证gp34l55δ突变具有改良的病毒性质,从病毒颗粒分离出luz19病毒基因组。使用rna-依赖性核酸酶和体外转录的grna进行位点特异性消化以除去gp34基因(seqidno:4)。从luz19进化的噬菌体pcr扩增在氨基酸位置55处含有亮氨酸密码子的缺失(gp34l55δ,seqidno:4的位置163-165)的gp34l55δ基因。使用吉布森组装法将pcr扩增的gp34l55δ基因无缝地整合到经消化的luz19基因组中。将体外转化的基因组直接转化到宿主细胞中以产生功能性病毒颗粒。具有gp34l55δ的工程化luz19病毒能够扩散和裂解细菌。使用双琼脂噬斑测定法显示具有gp34l55δ突变(噬菌体*)的luz19噬菌体具有比野生型luz19更大的清除区域。拍摄照片并在两天的时间内测量清除区域(图5b)。裂解宽度的扩大区域表明具有gp34l55δ突变的病毒更好地能够扩散和裂解细菌。结晶紫生物膜测定将生物膜积累测量为结晶紫掺入的量度(图5c)。相较于具有野生型gp34基因的病毒,用具有gp34l55δ突变的病毒处理的样品具有生物膜的显着减少。显示相较于野生型luz19基因组的gp34突变的位置(星号)的图示(图5d)。本领域已知的标准测定法用于测量野生型和gp34l55δ突变体的病毒吸附、潜伏期和裂解量。这些数据表明,具有gp34l55δ突变的病毒具有极大增加的裂解量(图5e)。这些数据提供了使用本文公开的体外工程方法产生具有增加的细菌裂解、裂解量、复制和早期生物膜破坏的改良的病毒性质的病毒的实例。实施例v具有早期生物膜破坏和扩大的宿主范围的迭代工程化的病毒从病毒颗粒分离在实施例ii中产生的宿主范围扩大的luz19lkd16gp18重组病毒基因组。使用rna依赖性核酸酶和体外转录的grna进行位点特异性消化以去除gp34(seqidno:4)。然后将实施例iv中表征的裂解活性增加的gp34δleu55突变(seqidno:4的位置163-165)进行pcr扩增,并使用吉布森组装将其组装至消化的luz19lkd16gp18病毒基因组中。将迭代地体外工程化的基因组直接转化到宿主细胞中以产生功能性病毒颗粒,即具有lkd16基因gp18和gp34δleu55突变(luz19*lkd16gp18)的工程化的luz19病毒。使用双琼脂噬斑、生物膜和体外人角质形成细胞附着测定法分析luz19*lkd16gp18病毒的改良的病毒性质。图6d显示luz19*lkd16gp18具有改良的宿主范围。比较luz19*lkd16gp18与天然luz19的破坏预先形成的mdr铜绿假单胞菌生物膜的能力。具体地,将luz19*lkd16gp18和野生型luz19与铜绿假单胞菌生物膜一起孵育并使用结晶紫测定破坏。图6e显示与野生型luz19相比,luz19*lkd16gp18具有增强的破坏预先形成的mdr铜绿假单胞菌生物膜的能力。分析luz19*lkd16gp18病毒针对附着至人角质形成细胞的细菌的噬菌体治疗的功效。具体地,将铜绿假单胞菌附着至单层hacat细胞。然后将细胞与luz19*lkd16gp18或野生型luz19一起孵育。结果表明,luz19*lkd16gp18噬菌体更好地能够杀死附着至人角质形成细胞的多药耐药性(mdr)铜绿假单胞菌(参见图6f)。这些数据提供了本文所述的体外工程方法如何用于系统以迭代工程化具有多种独立改良的病毒性质(诸如扩大的宿主范围和增加的裂解量)的细菌噬菌体的实例。重要的是,这些工程步骤将不能使用标准方法直接进行或根本不能进行。另外,这些数据表明,本文公开的体外工程方法依序用于迭代轮的工程,一种用于合成生物学应用的重要性质。实施例vi迭代工程化具有生物膜分散有效载荷和覆盖全病毒属的扩大的宿主范围的病毒通过使用本文所公开的体外工程方法替换gp49(seqidno:25),将胞外多糖(eps)解聚酶或苯酚可溶性吗啉(psm))克隆到luz19中,以测定它们分散成熟生物膜的能力(图7)。为了工程化luz19和whrluz19以表达细胞外基质解聚酶或表面活性剂多肽,通过使用rna依赖性核酸酶(在该情况下为cas9)和体外转录的grna消化,随后使用吉布森组装用侧接主要衣壳启动子pgp32(seqidno:21)和终止子tgp32(seqidno:22)的目标基因(goi)进行替换来去除luz19或whrluz19的gp49(seqidno:25)(图7a和7c)。在野生型luz19的情况下,goi是eps解聚酶(pp15gp44-来自恶臭假单胞菌φ15的尾部突起gp44(seqidno:no:14);ntugp34-来自肺炎克雷伯菌噬菌体ntu的尾部突起gp34(seqidno:no:13);lka1gp49-来自绿脓假单胞菌噬菌体lka1的尾部突起gp49(seqidno:12))、来自表皮葡萄球菌(psma,seqidno:18)和金黄色葡萄球菌(psma3(seqidno:16)和psmb2(seqidno:17))的表面活性剂酚可溶性吗啉和来自伴放线菌聚集菌的dspb表面活性素(seqidno:15)(图7b)。在whrluz19的情况下,goi是eps解聚酶pp15gp44(seqidno:14)和表面活化素sepsma(seqidno:18)(图7d)。在其合适的宿主细胞内扩增工程化的噬菌体,分离所述噬菌体并通过测序验证。针对在mbec装置中生长的24小时生物膜,使用每孔100个噬菌体测试工程化的噬菌体分散成熟生物膜的能力,进行3小时。简言之,在补充有硫酸镁(1mm)、葡萄糖(0.2%)和酪蛋白氨基酸(0.5%)的m63基本培养基中稀释(1:100)铜绿假单胞菌的过夜培养物,然后将其添加至无菌微量滴定板(150μl/孔)。将带销子的盖子插入微量滴定板。在37℃孵育24小时后,将带销子的盖移至含有160μl含有100个噬菌体/孔的完全mg63的微量滴定板。在37℃孵育3小时后,将带销子的盖子在水中洗涤3次,干燥后用200μl0.5%结晶紫染色。随后,用水漂洗板以除去未结合的结晶紫并干燥。将染料溶解在200μl30%乙酸中,并在od=550nm下测量吸光度。将dspb(针对大肠杆菌生物膜为表面活性的)用作阴性对照,因为其不具有针对铜绿假单胞菌的活性。两种有效载荷(pp15gp44和sepsma)显示明显的抗生物膜活性(图7b)。值得注意的是,psm(为在革兰阳性细菌中具有已知的抗生物膜活性的表面活性素)先前从未显示出分散铜绿假单胞菌生物膜。将这些有效载荷工程化至whrluz19中,以确定具有广泛宿主范围的噬菌体是否可被进一步工程化来展现生物膜分散活性。结果表明,编码pp15gp44或sepsma的whrluz19维持其生物膜分散活性(图7d)和感染所有对φ-kmv病毒属易感的临床分离株的能力(图7e,7f)。这些数据提供了本文所述的体外工程方法可如何用于系统以迭代工程化具有多种独立改良的病毒性质(诸如生物膜分散和宿主范围的非限制性性质)的细菌噬菌体。实施例vii表达抗生素敏化有效载荷的工程化的病毒使用本文公开的体外工程方法,将luz19工程化以表达来自ssrna病毒prr1和ms2的溶素。将来自prr1(seqidno:20)或ms2(seqidno:19)ssrna噬菌体的溶素工程化至侧接主要衣壳启动子pgp32(seqidno:21)和终止子tgp32(seqidno:22)的luz19gp49基因座(seqidno:25)中,以测定其抑制噬菌体抗性的细菌出现的能力(图8a)。这些溶素通过结合并激活对细胞壁合成是非常重要的酶来抑制新的细胞壁形成,并推测细菌对其它抗微生物剂,尤其是细胞壁靶向抗生素诸如羧苄青霉素敏化。如上所述使用本文公开的体外工程方法制备构建体。工程化的噬菌体在其适当的宿主细胞内扩增,分离所述噬菌体,并通过测序验证。在标准时间杀灭测定中测试了工程化的噬菌体在1/5xmic的羧苄青霉素存在的情况下抑制抗噬菌体处理的细菌出现的能力(图8b,8c)。结果表明,与亚抑制浓度(1/5xmic)的羧苄青霉素组合的表达ssrna噬菌体的溶素的工程化的luz19预防了噬菌体处理后的细菌再生长。这些数据提供了使用本文公开的体外工程方法生成具有改良的病毒性质(具体地在该情况下为预防细菌中的噬菌体抗性发展)的病毒的实例。实施例viii表达物种特异性抗微生物蛋白有效载荷的工程化的病毒使用本文公开的体外工程方法,将luz19工程化以表达铜绿假单胞菌来源的抗微生物蛋白pyos5。细菌素pyos5是由铜绿假单胞菌的一个菌株产生的阻碍竞争性铜绿假单胞菌菌株生长的物种特异性抗微生物蛋白。将铜绿假单胞菌菌株pa01gdna用作模板来pcr扩增pyos5(seqidno:6),然后将其克隆到侧接主要衣壳启动子pgp32(seqidno:21)和终止子tgp32(seqidno:22)的luz19gp49基因座(seqidno:25)(图9a)。pyos5结合广泛分散的绿脓杆菌螯铁蛋白受体fpta,然后经历构象变化以在铜绿假单胞菌膜中产生孔。如上所述使用本文公开的体外工程方法产生luz19+pyos5。在易感宿主pa01中扩增工程化的噬菌体,将所述噬菌体分离,并通过测序验证。选择细菌菌株pa7416以用于分析,因为已知实验室菌株pa01对pyos5具有抗性,然而,计算机分析表明,mdr铜绿假单胞菌菌株pa7416对噬菌体luz19易感并且编码pyos5受体fpta。在标准时间杀灭测定中测试了工程化的噬菌体抑制抗噬菌体处理的pa7416细菌出现的能力。结果表明,野生型luz19最初始抑制pa7416生长,8-12小时后细菌迅速变得具有抗性并且再生长发生(图9b)。然而,工程化的luz19+pyos5在噬菌体处理后抑制pa7416细菌再生长超过24小时(图9c,9d)。这些数据提供了使用本文公开的体外工程方法来生成具有改良的病毒性质(具体地在该情况下为防细菌中的噬菌体抗性发展)的病毒的实例。实施例ix用于迭代工程化细菌噬菌体以产生抗微生物产物的系统使用本文公开的体外工程方法,可对细菌噬菌体基因组进行快速工程化而无需对宿主菌株进行广泛的遗传操作。将本领域技术人员公知的病毒突变研究和选择技术与全基因组测序、比较基因组学和所述公开的体外工程方法结合创建了用于开发新型和改良的抗微生物剂的新的和改良的系统。所述系统基于在单个病毒底盘中迭代地改良1种、2种或多于2种不同的性质以产生基于病毒的抗微生物剂。公开了改良不同的病毒性质的luz19基因组的连续纯化和编辑(图6、7和10),然而,该技术可被扩展至多个其它铜绿假单胞菌细菌噬菌体或感染细菌的任何其它菌株或物种的其它细菌噬菌体。此外,该技术可用于改良感染相同细菌物种的多个个别细菌噬菌体的性质,以产生预防或治疗细菌感染、污染或改变微生物群的更优的细菌噬菌体混合物。这些数据显示可如何依序进行与基因组测序、比较基因组学和病毒突变/选择研究结合的体外工程以完成逐步改良或工程化的变化,以合并改良的目标病毒性质(图10)。实施例x方法使用商购可得的体外转录试剂盒诸如megashortscriptt7试剂盒(thermofisher)合成并纯化引导rna(grna)。使用本领域公知的方法设计引导rna(图15)。将体外转录的grna稀释至500ng/μl的工作原液。无纯化的rna引导的核酸酶诸如cas9的组装反应。通过表达包含编码his-标记的cas9的基因序列(seqidno:27)的质粒并将所述序列通过公知的镍-亲和纯化方法纯化来获得纯化的cas9(seqidno:31)。任选地,首先使用在基因组的最内部切割的grna用于迭代消化。全反应混合物:*全反应混合物可在单个步骤中用于一次切割多个位点(共消化),然而,这可导致病毒gdna的低效率切割。在冰上组装共消化反应,然后添加至cas9,并在37℃下孵育30分钟。还可以进行改良的2步骤(或更多)反应,从而允许更完全的消化(下面概述的)。**10xcas9缓冲液含有-200mmhepesph7.4、1.5mkcl、5mmdtt和1mmedtaph8。组装反应步骤1并在室温下孵育5分钟。步骤1反应混合物:在冰上孵育10分钟。在37℃下孵育2分钟。加入4μlcas9酶(0.45mg/ml)。在37℃下孵育30分钟。步骤2反应,加入第二grna和另外的cas9酶。步骤2反应混合物:50μl的总体积在37℃孵育步骤2反应物30分钟。可添加其它步骤用于在超过2个的位置上消化基因组。通过在80℃下孵育10分钟使cas9酶失活。使用苯酚-氯仿提取(在吉布森组装中增加片段组装效率)或本领域公知的其它灭活、失活或纯化方法的任选的纯化。在琼脂糖凝胶上运行5μl样品以验证正确的切割。对于使用吉布森组装的体外组装,根据nebgibson组装方案使用适当浓度的消化物和体外生成的插入dna。体外组装后,任选地转化到宿主细胞中以扩增工程化的基因组、基因组部分或回收工程化的病毒。实施例xi大肠杆菌噬菌体m13的工程化使用本文公开的体外工程方法,将感染大肠杆菌的病毒工程化以表达荧光报道基因paprika(seqidno:5)。图11a显示用于将paprika荧光蛋白基因整合到大肠杆菌m13噬菌体基因组中的体外工程方法的示意图。该工程方法被设计来生成表达荧光报道基因的溶源性噬菌体,其可构成改良的病毒性质,因为类似的病毒已被用作诊断剂。从病毒颗粒分离m13病毒基因组(登录号x02513)。由于实验设计包括使用两种grna,因此首先在单独的体外cas9消化反应中证实每种单独的grna的功能(图11b)。知道每种grna是有功能的,因此使用rna依赖性核酸酶和体外转录的grna进行位点特异性消化(图11c)。使用引物对荧光报道基因paprika(seqidno:29)进行pcr扩增(图11d),所述引物添加有侧接lacza基因序列同源的5'和3'序列,其使用rna依赖性核酸酶消化(例如,cas9)从m13基因组释放。将吉布森组装法用于将pcr扩增的paprika基因无缝地整合到消化的m13基因组中,替换lacza基因(seqidno:28)。将工程化的基因组直接转化到宿主大肠杆菌细胞中以产生编码paprika基因的功能性病毒颗粒。通过它们在大肠杆菌中形成噬斑的能力评估工程化的噬菌体(图11e)。从噬斑分离出病毒dna并进行pcr扩增,以确认插入的paprika基因的存在(图11f)。通过荧光成像确认重组paprika蛋白的存在和功能(图11g)。这些数据证明了本文所述的体外工程方法将报道基因工程化至大肠杆菌噬菌体基因组中的成功用途。证明所公开的方法可扩展至另一病毒属,包括感染另一细菌属的那些病毒。实施例xii大肠杆菌噬菌体λ的工程化使用本文公开的体外工程方法,编辑感染大肠杆菌的第二病毒。图12a显示从分离的λ噬菌体基因组(登录号nc_001416.1)删除cll基因(seqidno:30)的体外工程方法的示意图。该工程方法被设计来生成组成型裂解性病毒,这可构成改良的病毒性质。从病毒颗粒中分离出λ病毒基因组。由于实验设计包括使用两种grna,因此首先在单独的体外cas9消化反应中确认了每种单独的grna的功能(图12b)。已知每种grna是有功能的,因此使用rna依赖性核酸酶和两种体外转录的grna进行位点特异性消化(图12c)。将两个合成的单链dna分子在体外退火以生成双链dna修复模板(seqidno:9),所述双链dna修复模板包含与分离的λ病毒基因组中的cas9靶向切割位点侧翼序列同源的5'和3'序列。使用吉布森组装法将pcr扩增的修复模板无缝地整合到消化的λ基因组中。然后按照制造商的方法使用来自epicentre的maxplaxλ包装提取试剂盒体外包装工程化的基因组(图12d)。体外包装后,使用制造商建议的大肠杆菌宿主细胞从双琼脂噬斑测定中回收工程化的λ基因组。基于工程化的噬菌体在大肠杆菌中形成噬斑的能力,确定它们是有功能的。从形成的噬斑分离病毒dna,并进行pcr扩增以确认不存在cll基因(图12e)。这些数据证明了本文所述的体外工程方法从大肠杆菌噬菌体基因组除去不想要的基因的成功用途。这些数据还提供了体外包装工程化的病毒基因组的实例,其提高病毒回收效率并且提供替代方法以直接转化到宿主细胞中。另外,这些数据提供了利用退火的体外合成的寡核苷酸作为用于工程的插入物的实例。此外,这些数据提供了利用该方法工程化噬菌体基因组以产生改良的病毒性质(即组成型裂解表型)的另一个实例。最后,这些数据表明可使用所述的体外工程方法来工程化感染大肠杆菌的第二病毒属。实施例xiii人cmv的差错校正使用本文公开的体外工程方法,编辑部分人病毒。图13a显示用于差错校正的体外工程方法的示意图。~230kbhcmv病毒基因组的18kb子部分包含在大肠杆菌复制质粒中。hcmv基因组的该子部分(seqidno:10)含有病毒基因组的起始点,并含有突变体rl13等位基因(seqidno:33)含有病毒基因组的起始部分并具有突变型rl13等位基因(seqidno:33)。hcmv片段和大肠杆菌质粒一起的大小约为28kb,超过了大多数当前的差错校正技术的规格。对于差错校正,从大肠杆菌分离28kb质粒,并使用rna依赖性核酸酶和两种体外转录的grna进行位点特异性消化(图13b)。cas9介导的消化切除紧接突变位点的上游和下游的rl13基因的区域。合成rl13基因的校正区域(seqidno:32),并用与每个rna指定的cas9消化位点相邻的区域同源的另外的5'和3'侧翼序列进行pcr扩增(图13c)。使用吉布森组装法将合成的修复模板无缝地整合到消化的质粒中。然后将包含在质粒内的含有hcmv片段(seqidno:11)的经校正的rl13转化到大肠杆菌细胞中并在含抗菌素的培养基上回收。通过pcr筛选大肠杆菌菌落,以确认存在校正的rl13基因,所述rl13基因与包含差错的rl13基因相比含有另外的序列,从而允许其与含有差错的rl13基因区别(图13d)。然后使用标准技术在大肠杆菌中扩增差错校正的基因组片段,以待以后用于下游应用。这些数据证明了本文所述的体外工程方法工程化来自人特异性病毒基因组的基因,并另外提供了用于在体外组装反应中使用合成的dna作为修复模板的方法的成功用途。这些数据还证明了该体外工程方法用于对于标准差错校正技术来说太大的dna或质粒的差错校正的用途。标准差错校正技术具有约5kb的大小限制,并且是基于pcr的,其固有地可产生更多不想要的差错。本文所示的体外工程方法不依赖于整个或甚至大部分质粒或病毒基因组的pcr扩增,因此适用于大小超过5kb的序列的差错校正应用。实施例xiv末端冗余的病毒末端的快速鉴定本文公开的体外消化方法还可适于鉴定末端冗余病毒基因组的确切末端。图14显示了用于确定lbl3和14-1噬菌体基因组的末端的体外消化方法的示意图。从病毒颗粒纯化lbl3和14-1(登录号nc_011703.1)噬菌体基因组dna(图14a)。使用miseq或pacbio平台进行下一代测序,然后将高质量dna读数自动合并到较长的组装体中以重建原始序列(图14b)。通常,自动化组装软件将病毒或细菌噬菌体基因组错误地组装至环状重叠群中,并将末端重复基因组的dtr置于病毒序列的内部区域。基于双重覆盖测序区域的鉴定和与紧密相关的末端重复基因组匹配的blast搜索结果进行物理基因组末端的计算机预测(图14c)。这些预测的末端通过cas9内切核酸酶切割来确认。在cas9失活后,对对应于基因组物理末端的dna片段进行纯化和测序(图14d)。这些测序结果导致基于真实物理末端序列的准确基因组组装(图14e)。与噬菌体基因组测序相关的最大技术挑战之一是由于其重复性质而导致的对基因组物理末端的准确定位。这些区段可跨越循环排列的基因组(例如大多数分枝杆菌属(mycobacterium)和痤疮丙酸杆菌(propionibacteriumacnes)噬菌体)中的4-14bp至终末重复基因组中的数百个碱基对(例如,铜绿假单胞菌的φkmv-样、pb1-样和n4-样噬菌体属)和甚至至数千个碱基对(例如大肠杆菌t5和dtr)。目前,通过深度序列分析(以鉴定双重覆盖dna片段)、引物步行(sanger测序)、主要dna切口的鉴定和限制性内切核酸酶分析的组合来进行重复末端(或dtr-正向末端重复)的定位。然而,这些方法中的每一种在使用中往往受到限制或不确定:(i)难以确定的ngs数据中的双重测序覆盖边界;(ii)通过dtr多联体提供不确定结果的引物步行阅读;(iii)接近噬菌体末端的限制性位点的低发生率或由于dna修饰诸如甲基化而导致的限制性位点的阻断。在特定位置处对噬菌体dna使用靶向cas9切割消除了对不可靠或繁琐的分析或程序的需要,并极大简化了噬菌体基因组物理末端的鉴定。该方法有可能准确地定位已经测序的噬菌体基因组的末端(如通过lbl3和14-1dtr的定位所例证的)以及快速鉴定新鉴定的病毒的dtr。在本文公开的体外工程方法中使用靶向cas9消化来定位末端重复噬菌体基因组的物理末端代表优于当前方法的显著有利方面,因为它不依赖于测序覆盖的微妙变化,并且可独立于多联体形成而进行。另外,与许多限制内切酶相比,cas9活性对dna修饰不太敏感。这些数据显示了rna引导的体外cas9切割使得能够鉴定真实噬菌体基因组序列排列的成功应用。该信息可用于设计工程化这些噬菌体的下游体外工程方法,这是先前由于缺乏真实基因组边界而不可能实现的成就。实施例xv利用体内组装的工程方法本公开提供了使用rna引导的核酸酶位点特异性消化纯化的病毒核酸,并通过将dna或rna片段插入消化的病毒核酸中来组装工程化的核酸的体外方法。尽管重组核酸可使用本文公开的纯化酶在体外完全组装,但也可利用易感宿主菌株内的天然或工程化的重组途径来实现该过程。纯化的和体外消化的病毒基因组连同具有末端同源区的插入片段修复片段的转化对于一些宿主细胞在体内组装重组病毒基因组是足够的。插入修复片段可通过本领域已知的标准技术合成或扩增,或可位于在所选宿主细胞内稳定复制的质粒内。由于宿主细胞具有同源和非同源dna修复途径,将足够量的插入物和消化的基因组共递送至宿主细胞中的挑战以及大多数宿主同源重组途径的较低效率,因此该方法可能具有比体外组装低的效率。由于在无宿主介导的重组的情况下消化的基因组单独不会形成功能性病毒颗粒和随后的噬斑,所以可通过针对给定的插入物的pcr筛选在转化和铺板后获得的噬斑,以确认所需工程化的病毒核酸的正确组装。实施例xvi本文公开的工程化的病毒表1概括了通过本文公开的体外工程方法生成的工程化的病毒。表2概括了本文公开的工程化的病毒以及相应的实例和图。表3列出了本文公开的野生型病毒及其完整基因组序列的登录号。表4列出了本文公开的一些野生型核酸序列和相应的氨基酸序列。表1.本文公开的工程化的病毒pm-点突变,替换(replace)-替换(replacement),缺失(delete)-缺失(deletion),插入(insert)-插入(insertion)表2.本文中公开的工程化的病毒poc-概念验证表3.本文中公开的野生型病毒野生型病毒名称基因组序列铜绿假单胞菌噬菌体luz19登录号nc010326.1大肠杆菌噬菌体λcll857sam7登录号nc001416.1大肠杆菌噬菌体m13登录号x02513铜绿假单胞菌噬菌体14-1登录号nc_011703.1表4.本文中公开的野生型序列从先前的描述中,本领域技术人员可以容易地确定本公开的基本特征,并且在不脱离本发明的精神和范围的情况下,可对本公开进行改变和修改以使其适应各种使用和条件以及最大程度地利用本公开。前述具体实施方案将被解释为仅仅是说明性的,而不是以任何方式限制本公开的范围。上文和附图中引用的所有申请、专利和出版物(包括参考手册)的全部公开内容通过引用整体并入本文。序列表seqidno:1dna属/种-phikmv样病毒luz19描述性标题-野生型luz19gpl3gtgctggccctcggtgccttcgacctgtccggcctgatggtaggttcctgcctcgtagtaggtggtgagctgaaggccctgtgcgttgatgacccgcacagcaggcagggtatcggcgctgagctggtacgggccgctgagctggctggtgccgagtatctgacctgcttcgagttcctggagccgttctacgccgacttgggctggagcaccacccaccgcgaggcgaactggacagcaggagagccggacgtgctgcacatgagggcacccggtcatgacgtatgaseqidno:2dna属/种-phikmv样病毒luz19描述性标题-野生型luz19gp38gtggctcggttcaagaatcccgagaccatccacgttgcagatggggtcgaggctgtcttcagtctcgacttcccgttcctgcggcgtgaggacgtattcgtccaggtcgataagatactcgtcaccgactatacgtgggtagacgacaccaacatccaattggccgtggtgccgaagaaggaccaagaggtccgcatcttccgcgacacgcccgcccaggtcccggacacacagttcagccaggacatcccgttcctgcctcgatacatcgacgcgaacaacaagcagctcctgtacgctgtgcaggaaggcatcaacaccgcgaacctcgctctcgatggcgtactcgacgcgatccgtatcgccgaggaggctcgtcgcctggcgcaggaagcactcgacgccgccaatgaggcgcttcgccgtgccctgggcttcgctgagattcgcaccgtgaccgaggactcggacatcgatccgagctggcgcggttactggaaccgttgcatcaccgccgataaacctctgaccctgaccatgcagatggaagacccggatgcaccgtgggtcgagttcagcgaggttcacttcgagcaggccggtgtgcgtgacctaaacatcgtagccggtcctggcgttaccatcaaccgtttgcagaacaccaccatgcagctctacggcgagaatggcgtgtgtactctcaagcggctgggcgctaaccactggatcgtgttcggggccatggaggacgaataaseqidno:3dna属/种-phikmv样病毒luz19描述性标题-野生型luz19gp40atgtttaagaccgaagtaaagggacgttacaccctgattcgccgcaaggcggacggcactccggtggagactctggagttcgacaacatcattacgaatgcgggcctggattggatcgccgctatggataccgacctcatgggcgaacccgtagcggtcagcacttctacagccgatcccaacccgagcgcacccgccatcccggaggttgtgcaacgcacgtccgcatctgcccctggtggaggtactacgtcgggcctggatggcgagtggctgttctggcggaggcgttggagattcccgcagggcaccctagctggtcaagtcctggccaccgtgggcctcatctgcaactcggatcgtcgcttcgagagtaacacgggtgagctgatcccgaaggataccccgctgtcgtacactcgcatcaaggacgccgccgggcagcctactactctggtggtggccgctgacgagattctggatgtccagtacgagttccgcagccggcccgtaggaacggctgaggccaagttcgtgatctccggcgtggaacgcaccttccggctgatcccaaagccttttgcgaaccgtgctaatctctccggggaacgctacatcttctacaacaccaacccctacatcaacggcaaggacgcctccggcggcaatgtccgagacggtcagtggcagaagaaatatcccaagtacgtgcgcggctcctacaaggcgcagatcacgctgctggcccaggtccagaacggcaatatggctggcggcatcaccggcaccgaggaactccagatttacaatggacgtaactatgtgctcgatatcaacccgcctgttgtgaagaacaatacccaggagttcaccgtgaccctggagtttacggtggcgagggcataaseqidno:4dna属/种-phikmv样病毒luz19描述性标题-野生型luz19gp34atgagctacaagcaatccgcgtatcccaatctgctgatgggtgtgagccagcaggtgcccttcgagcgcctgccgggccagctcagcgagcagatcaacatggtatccgatcccgtgtcaggacttcggcggcgcagcggtatcgagctgatggcccacctgctgcataccgaccagccctggccgaggccgttcctctaccacacgaacctcggtggccgcagcattgcgatgctggtggcgcagcaccgtggcgagctgtacctgttcgacgagcgggacggtcgcctgctgatgggtcagcccctggtgcatgactacctcaaggccaacgattacaggcagctacgggccgccacggtggccgatgacctgttcatcgccaacctgagtgtaaagcccgaggccgaccgcaccgacatcaagggcgtagaccccaacaaggccggctggctgtacatcaaggcaggccagtattcgaaggcattctccatgaccatcaaggtcaaggacaacgccaccggcaccacctacagccacacggccacctacgtgacgccggacaacgccagcacgaaccccaacctcgctgaggcgccattccaaacgagcgtaggctacatcgcgtggcagctctacggcaagttcttcggtgcgccggagtacactctgcccaactcgacgaagaagtacccgaaggtagacccggacgccaacgcggcaaccatagccggttacctcaaccaacggggcgtgcaggacgggtacatcgcgttccgtggcgacgccgatatccacgttgaagtgtccacggacatgggcaacaactacggcatagcctccggcggtatgagcctcaacgccacggcagacctgccggccttactgccgggcgcgggtgctcctggcgtgggtgtgcagttcatggacggcgctgtcatggccaccggctccaccaaggccccggtatacttcgagtgggattccgctaaccgccgctgggcagagcgggccgcctacggcaccgattgggtcctgaagaagatgccactggccctgcgctgggatgaggctaccgacacctacagcttgaacgagctggagtatgatcgacgtggctccggcgacgaggatacgaaccccacgttcaacttcgtcacccgaggcatcaccggcatgacgaccttccagggtcgcctcgtcctcctgtcgcaggagtacgtctgcatgtcggccagtaacaatccacaccgctggttcaagaagtcggcagccgcgctgaacgacgatgatcctatcgagatcgcagcccaggggagcctgactgaaccgtacgagcacgcggtcaccttcaacaaggacttgatcgtcttcgccaagaagtatcaggccgtggtccccggtggcggcattgtaactccccggacggcggttatcagcatcaccacgcagtacgacctcgataccagggcggcacctgccgtgactggccgcagtgtgtacttcgctgcggagcgtgccctgggtttcatgggcctgcatgagatggccccgtctccgtccacggacagccactacgtcgccgaagacgttaccagccacatcccgagctacatgccggggcctgctgagtacatccaggcggcggcctccagcggctacctggtgttcggcaccagcacggcggacgagatgatctgccaccagtacctctggcagggcaacgagaaagtgcagaacgcgtttcatcgctggacgttgcggcatcagatcatcggcgcctacttcactggtgacaacctgatggttctgattcagaagggccaggagatcgccctgggacggatgcacctgaacagcctgccagcccgtgagggtctgcaataccctaaatacgactactggcggcgtatcgaggcgaccgtcgatggtgagctggaactgaccaagcagcattgggacctgatcaaggatgcctctgccgtgtaccagctacagcctgtggccggcgcctacatggagcgtacccatctcggcgtgaagcgcgagacgaatacgaaggtgttcctcgacgtgcccgaggccgtggtcggggcggtgtatgtggtcggctgcgagttctggtcgaaggtggagttcactccgccggttctccgggaccacaatggcctgcccatgacctcgacccgtgcagtgcttcatcggtacaacgtaaacttcggctggaccggcgagttcctgtggcgcatcagcgacacggctcgacccaaccagccgtggtacgacacgacgcccctccggttgttcagccggcaactcaatgccggggagcctctggtggatagcgctgtggtgccgctgccggcacgggtcgatatggccacgtccaagttcgagctgagctgtcacagtccgtacgacatgaacgttcgggctgtcgagtacaacttcaagtccaaccaaacctacaggagggtgtgaseqidno:5蛋白质属/种-phikmv样病毒luz19描述性标题-野生型luz19gp34蛋白msykqsaypnllmgvsqqvpferlpgqlseqinmvsdpvsglrrrsgielmahllhtdqpwprpflyhtnlggrslamlvaqhrgelylfderdgrllmgqplvhdylkandyrqlraatvaddlfianlsvkpeadrtdikgvdpnkagwlyikagqyskafsmtikvkdnatgttyshtatyvtpdnastnpnlaeapfqtsvgyiawqlygkffgapeytlpnstkkypkvdpdanaatiagylnqrgvqdgyiafrgdadihvevstdmgnnygiasggmslnatadlpallpgagapgvgvqfmdgavmatgstkapvyfewdsanrrwaeraaygtdwvlkkmplalrwdeatdtyslneleydrrgsgdedtnptfnfvtrgitgmttfqgrlvllsqeyvcmsasnnphrwfkksaaalndddpielaaqgsltepyehavtfnkdlivfakkyqavvpgggivtprtavisittqydldtraapavtgrsvyfaaeralgfmglhemapspstdshyvaedvtshipsympgpaeyiqaaassgylvfgtstademichqylwqgnekvqnafhrwtlrhqiigayftgdnlmvliqkgqeialgrmhlnslpareglqypkydywrrieatvdgeleltkqhwdlikdasavyqlqpvagaymerthlgvkretntkvfldvpeavvgavyvvgcefwskveftppvlrdhnglpmtstravlhrynvnfgwtgeflwrisdtarpnqpwydttplrlfsrqlnageplvdsavvplparvdmatskfelschspydmnvraveynfksnqtyrrvseqidno:6dna属/种-铜绿假单胞菌描述性标题-pyos5序列atgtccaatgacaacgaagtacctggttccatggttattgtcgcacaaggtccagacgatcaatacgcatacgaggttccccctatcgatagcgcggccgttgccgggaatatgtttggcgacttaattcaaagagaaatatatctacagaaaaacatttattatccagtccgatctatttttgaacaaggaacaaaagaaaagaaggagatcaacaagaaagtatctgatcaagtcgatggcttgctaaagcagatcactcaaggaaaaagggaggccacaaggcaagagcgagtcgatgtcatgtcggcagtcctgcacaagatggaatctgatcttgaaggatacaaaaagacctttaccaaaggcccattcattgactacgaaaagcagtcaagcctctccatctatgaggcctgggtcaagatctgggagaagaactcttgggaagaaagaaagaagtacccttttcagcagcttgttagagatgaactggagcgggcggttgcctactacaaacaagattcactctctgaagcggtaaaagtgctaagacaggagctcaacaagcaaaaagcgctaaaggaaaaagaggacctctctcaactggagcgggactacagaacccgaaaggcgaatctcgagatgaaagtacaatccgagcttgatcaagcgggaagtgctttgcctccattggtcagtccaacgccagagcaatggcttgaacgtgccacaagactggttacgcaagcaattgctgataaaaagcagctgcagaccacaaacaatactcttatcaagaattccccaacccctctagaaaagcagaaagccatctacaatggtgagctacttgtggatgagatagccagtctacaggcccgcttagttaagctgaacgccgaaacgacacgacgcaggacagaagcagaacgcaaggcggccgaggaacaagcgttgcaagatgctattaaatttactgccgacttttataaggaagtaactgagaaatttggcgcacgaacatcggagatggcgcgccaactggccgaaggcgccagggggaaaaatatcaggagttcggcggaagcaatcaagtcgtttgaaaagcacaaggatgcgttaaataaaaaacttagccttaaagataggcaagccattgccaaagcctttgattctctagacaagcagatgatggcgaagagccttgagaaatttagcaaaggctttggagttgtaggcaaagctattgacgccgccagcctgtaccaagagttcaagatatctacggaaaccggggactggaaaccattctttgtaaaaattgaaacactagctgctggtgcggccgccagttggcttgtgggtattgcatttgccacggcaacagccactcctataggcattctggggttcgcactggtaatggcagttaccggggcgatgattgacgaagaccttctagaaaaagcaaacaatcttgtaatatccatttaaseqidno:7dna属/种-phikmv样病毒lkd16描述性标题-添加的lkd16gpl8序列gagtaccaactgaacacgagcgcaccctgcgctgcctgctccaagacatccacgggccgctgaatctgctgttcccaggtatccgggtgaaggtggaggaggcgtgcctcggatacttgggctacagggagcggggctattgggagctgcgcctccaggtggactacgaccacccgaagcttgggcacctccgctacagtcaggccgtgccggagtacgtgctgatcaacgaccgcgacagcatcatcaagtacctgatggaagcagtccctcggcaggtactagagggcatgctcaataaggcccaggaattcgtaaccaagaactggtattccctatgacgacseqidno:8dna属/种-phikmv样病毒phi-kf77描述性标题-添加的фkf77gp7序列tacaaggtggtgacgcctagctcggcagagggcgccgttgtgctggcgaccaagcagacgcctgccctcgctcaggcagtcatcgtactgcacagcatgaaccccgcgcagtacgcggtgggcacggccatactaaacacagactggcggtgccgccgcctgggtgccggcgagtacatcaagctcgttcaaggggaggccgacseqidno:9dna属/种-λ样λ描述性标题-大肠杆菌噬菌体λciiatggttcgtgcaaacaaacgcaacgaggctcgttctgaacaaatccagatggagttctgaseqidno:10dna属/种-巨细胞病毒hcmv描述性标题-编辑前hcmv片段acgacggccagtgaattgtaatacgactcactatagggcgaattcgagctcggtacccgattaccctgttatccctaccattccgggccgtgtgctgggtccccgaggggcgggggggtgtttttagcgggggggtgaaatttggagtcttggagccgcgtgtgctgtggaggacggtgacggtggtaagagtgtgctgcggtgcggttgggacggcggcggcgaataaaagcggcgtgcggcgcgcacggcgaaaagcagacgcgcgtctgtgttgtgtgtctttgaccgcggcggaacacacgcggaaaagcgagtcccaggggacacacgacgagcgagtcccagggggggacgacgacggccagggacgcggaaacgacgcggaaaagaggaagtccccagggggacgggcggaaaagaggaagcgcctaggggaccgcgggggcaggaacagacgaagtacgccgcaacccgcgtcgaggacacacgcagaagcggccgcccaggggagggggggggggggactcgcgggccccggggcacacttgttgttccctccggccgccgacacgcaccccgaagccgcgcacaccgccgacacacccctgacacacccgcgacacacccgccacacgcccgacacacgcccgcgacacacccgaccgacacaccctgacacaccccgccaacacacccagccgcacccgccccgccaacacacccccgacacacccgacacacgcccgcgacacacccggcacacacccacccacccagccgcgcccccgacacaccccgaacggcgccggtgcgggacagggctcacggaggtttgcgggccgtgagcacgcctccctttgtacacactaccggtgcgtggcgtcccacgctatttgttcgcgagaccggactaagggaggtttgcggtgcgtcagcgcggggcggcgtttgcggcgtgtttcgaccagcgctttgtgcgcgctgcctgtgcgtgtcgtcccatggtctttgtcagcggcacggcgctggggacggggtttcaccgcgctgagggatctttctgcgggtgtgagggacggagcttttttcgcacgctgggcaccgggctgggggacggggggtgtgcgggacggcggtggggccggggcgttgcgggtacggggattacgctgggaacggggactcgcggacccgggctgagggacgggggtggcgggggtgtttgcggcgaggacgggggccttttgcggcggggacggggactcaccctcgcctatttaacctccacccacttcaacacacacatgccgcacaatcatgccagccacagacacaaacagcacccacaccacgccgcttcacccagagtaccaacacacgttacccttacaccacagcaacacacaaccgcctatccaaacctcggacaaacacgccaacgaagaacaccgcacgcagatggagctcgacgccgcggattacgctgcttgcgcgcaggcccgccaacacctctacgctcaaacacaaccccaactacacgcataccccaacgccaaccctcaggaaagcgctcatttttccacagaaaatcaacatcaactcacgcatctacttcacaacattggcgaaggcgcagcgctcggctaccccgtcccccgcgcggaaatccgccgcggcggtggcgactgggccgacagcgcgagcgacttcgacgccgactgctggtgcatgtggggacgcttcggaaccatgggccgccaacctatcgtgaccttactgttggcgcgccaacgcgacggcctcgctgactggaacgtcgtacgctgccgcggcacaggctttcgcgcacacgattccgaggacggcgtctctgtctggcgtcagcacttggtttttttactcggaggccacggccgccgtgtacagttagaacgtccatccgcgggagaagcccaagctcgaggcctattgccacgcatccggatcacccccatctccacatctccacgcccaaaaccaccccagcccaccatatccaccgcatcgcacccacatgctacgactcgcccacatcacacgctctttcctatcccttctacaccctcagccacggttcacaatccccgaaactacgccgtccaacttcacgccgaaacgacccgcacatggcgctgggcacgacgcggtgaacgtggcgcgtggatgccggccgagacatttacatgtcccaaggataaacgtccctggtagacggggtagggggatctaccagcccagggatcgcgtatttcgccgccacgctgcttcaccgatatccaataaacccatcccctcgccacgacgtctccgcgtatctttgtagcctcaggaatccgtccccacgtccatccatcccgagcactccacacgctataacagaccacggacacggcaaatgcatgcaaacttctcatttattgtgtctactactctgtgttgctacagggagtgaagggggtgaaggcaaagaaaaaaaaaaggaacaaaataatagattagcagaaggaataatccgtgcgaccgagcttgtgcttcttttcttataaggaggcaaatatactagggaaaacttaagaataggaagaaaccgaggtttgggagaaaagctgagataaaatagcgcattttccatacagaggttgttgtttttgtggatcctaagaggtttcaagtgcgaatctcaaagttctcacgagaatattgtcttcaagaatcgacaactgtggtccaagatttttttttggtctttttaggttctgcgagggacatcacgatggatcgttgcgatgaagtcacgcgtacgcctctggtgtggcgcggtgtcgtgacaggagagtgtgttttcagtgcagagctgtcttgattcctatatccgagtatctgttttctcgtaaggacggtaatcttctttggtgtaagtacatctaaaagctgcaaactatattttaagggctgtctctaggtgtactttgatgctggagtttttcgctgtgttgatgtgaataaatctactactactattatatgcagaaagagtgattatgccgagacaagattgcattggctgaactgtttcaaaaacgcctacactctacttatccgtaaacctaaggtaatactatgtgtaagttgtttttttttctttttgtagtaaaatggtgatacgtgcaattaaaactgtattccatgtttccatcctttcatttcaactttaaaggcggctttgagagcgaagaagtgcgaggataaaaatggatgactccttcgtgtccagggagtcgactactgcaacgctgattgattaaaagatggtctccgatgatgatgttgttattgatcgaatcatggtgcagaacggcgacggagaggagcgtgtccgccgccgggaaggtggtctctttctcttttcttttttcaagaaatcttccatgtgtttatcgtagtgatcgaaatcgactgatctcgggttctttttgttggtttcttttcggttaatcatgtattgttttctttttttacagaaagatacttttttcatgagcaattcctcgcccggcgccggcatgccgaggtggggccactgcgatcagcggcatgccgacgccgacccggggatcttggattcaccgttttctctcttctctctctacatacagaccgggtggcaggagcggtaaggaatcatcgtcgtctttcattcttcgatgattatggtaatactaaatcttatctaggagcatatacatctaagattggagtactagtagtcgtttgtggtttctattttttttatatttatctatgacagtttttctgtttttcgttttgataataatataataaaaactcatggacgtgaaatctggcttggttgtggtgatttcattctcattattgttgttttctttccgtcttgcggatgaagatgttgcgatgcggttgttgttggtgttgctatacaccgagagagatgatctttttgttcttctggttcatttcctatgattgtttggctgctgaccgacgcgtcaggatgtgcagggcatgcggggaatcaggaccggacacgggataatttcatctacctatacggagatcgcggtcctcgccatgaggatcgcgacaggcgcgtcgagggggcaggaacacccttgcggattgacattcttggtggtgtttcgttgttgtcggtagttgttgttgacgatgaggataaataaaaatgaccttgtttttgttctgttttctcttgttgggaatcgtcgactttgaattcttcgagttatcggaaagctgaggtacccaaatgtctgtagcttttttctttttaccctcttgtttatcatctgcgattcgtggtaggtaggagagggaaatgataatccgagattaaggaaaggagaagataaaaaataaaaaaaaaataataaaacagaagccgaccggccgccgacccgttccccaggaccagcctacgaggaatggataacgcggtggcgacggcagcggtggtggcgctgggggtggcggcagtggtactgctgatggtagtcgggacggaggagaggcgatgcatacatacacgcgtgcatgctgcatgggtggatggtacggccgggagacgcggaagagaaactcacataaaaaggtgacaaaaagagcggttgaaaaaagaaaacgagattcgaccagacagaagagaaggaccggggcttggcgacccttccacgactgctgttgtcatctcggctcccccgtcttctcccggccacgggcggctaagtcaccgccgttctccccatccgtccgagcgccgaccgaccagccggccgattcgcccgccggggcttctggagaacgccggggcagcagcgatctggggaagccgctaaacccctgcgtttttatatggtagctctgccgagcgcgggctgacgcgttgagtaagcggaaagacgtgtgtgacgaaaaggggtcccatggtatttcacgtgacgatgaggagatgcggtttggagcacatacggtttagaaaaagggagttgtcgtgacaagggctgagggacctctgtctccatgtgtgtataaaaagcaaggcacgttcataatgtaaaaaagaacacgttgtaaacaagctattgctgtatcattcggctgactatgcttcattcggactgattttcttttcctaacggcgtaacttaaagtgattaacgtatgatatttgttccccagagttatactatagtcatcatcctaaaattcagatataaatgaacacatgtcgtatgggattattaagaaaccgaaactctccacagttcaccatcttcttcgtcattcaaccgatgacccactccgtacaacgaatcagtctgctgtgtcacactgcaaactactagcgacgtatgcaaacaacttgaaacacgggctgttgtattgacgaccgttgtaccattactagtcacattgcatagagaccatccaccgtcatcccatctttcccacccgatggaaaaccgtcttctatcatcaactatggtaagatttcgaccctgcgaggtattcagtttccccatatccataacctggattttatcattaaaccccaatattaaacacttttttagtacccccccacccaccaaaaaatgtgactggaccggttcctagcagctctgggagccatgttcaggttgaaccacagctacagcgaaaccgagtccagtgaccggtaaccacgtccagcccctgcgtatgtaccagtccaagcacgtccggtcattgttctacacaggaaatctaactaggtcaacgcaattttattccaccgttacgcagaatactaacaaacaaacacacaaatttaacgaattacacgtagtttattacatgaaaactgtaagaacaccaattcactaagcgatacaacatttagctgacttccaagtgccacacatcaccactgtattcatccatgttttcaccgaaccaacgagacagatcgaagaagccagaatctcccgactttaaattacataaatccaacgtattatgaccacagctcgacacacaaatagttgcgttactattcacagtagcattacctatacccgtaacgttgcacaaccactgatcaccattgttaccaaaaacggttttccacttagttgtcaacggatctttcccatgcgtaatggtcaaattactaccagtcgtcgcttttagctcattacgagtattatccgcatccacatatatcaacgtcatagctaggcacgctataagtaccccccccccacaatggaatgttgccaaaccggttctttcccgttatagccatagcgttcccaggcaaaagcaaacgccaaacctaatgcagtgaaaagcgcttgcagccagaaccagcttatgtaccagccacaatcacatccggttattgtttccacaggaaatcctaccaggcaaagccccgcttgttttgttcctgaccatcttgtttagcaattcgtaaactgtcagcctagcgacgtccgtttagatcaaaagtcacgtatatagcgacgctgtttccacccgtttccccgtcccgccgtttccgaacaacccacccgggttcagacaaccgaccaccaacagaaatatacacacagaccaccgggagttcagttaaagatttcatcaggtttattttggctgctgctagtcttttgcttcttagaaaaaaaatacccatatagagaaataatgatagtttgacaacacatatggcagggatttcttcttcatcaataagatatgcaattcccccagggagagactttcaacaattgaatttacaaaaacaaaattacatcaggagaaagagaggatacattaataaatatattatatctggtgtatatactgaatgctgctggttcataaggtaacgatgctactttttttaattccaagatggtttttctttgttagtcttttgttgacttgctggttcctaaaagttcgcaaaaacgattgtgtgaagattatgacgttggttgactagttcatgagattctgctgtacgtgtgatggttattcgctggttcgttctaagatgagtatcgtactgtgtctgcgatggtcgtctcttactggcattctctcggctgcctcttgttttcatgattgaaaaggaaaaaaggactccgagggcgcggtcatcttttacttttcggttttctcgttggcgggtcagaggtagtcagatcatgagactgtcgtggtcgatgaaactgtgtctgctcaagtgacgtccatttcttgtacggagaaaaaagtcatcgggataaataaggctatacaaggcgttgtcaagcgtgcggctctaaacaaattaagcgatacaaaattacagtgatacgaataataaattaccccctccccctgtggtccccccgaggcgagagccacccatcgtgtactctcgcaccacccacgaccacagggggagacgggacgaagagacgacgcagagcgccatctcctcctggaggccggcggcgttaactgctacagctgcggcggcgacgacagctgcgatttgtcggccgacatgccgatggtatgggcggcggcggcggtggccgcggcagcggggaggagaggagagagaagaggagcggggcgtccgaaggcgaggatggcatggtctcgccggagcgcccggcttttatggaacactcgcgtccggttgggtatcacccacaggaagatgaatcacaacttccaaaccatcttgagacccgagtaacggtttacaggtcgcacgccagtctcagctaaaaacagcggacagtcccacgctgtttctgttgtggctctctccagtttcctcatcgccgtcttggtctccgtcatcatcggaagaataccacccgctctcatgcggcagtcgatcagcctcgatgaacgagacgcggcgacgcctttctacggccgactggttgtggtggtgaaagaagagcaccagcaatcccaggaggagcaacaagccctcacatgtccaggaggtcggggagagggcctgtcggagatgaccgtgaggcatcacgtacggcagctgaggagaaacggagaagaaaggaaaattaccgtcaggggccggggttcttattagagaaacagcacgtaggtcaggatccagatgctaatggcaatcatgatgacgatgatcatgcaggccaagacgcggcgcaccaatgcagaatccaatagccgccgtgcctccggttggtggccggcggcatctagagacatgatttgggggggggaccggcggcgcaaaaagacagggagatggacagtgccacggtgttttgttatgattaggacatggggaccggaagccgagacagagtactacagggtgttgaagggtaacgtgagggagatcatgtcatgggcgggctgaagaccgtgcggggaggatcgacgtgtgcggtgcttgtggaacacggtgttttaatatgtatccgcgtgtaatgcacgcggtgtgctttttagcactcggcttgataagctacgtgaccgtctgcgctgaaaccatggtcgccaccaactgtctcgtgaaaacagaaaatacccacctagcatgtaagtgcaatccgaatagtacatctaccaatggcagcaagtgccacgcgatgtgcaaatgccgggtcacagaacccattaccatgctaggcgcatactcggcctggggcgcgggctcgttcgtggccacgctgatagtcctgctggtggtcttcttcgtaatttacgcgcgcgaggaggagaaaaacaacacgggcaccgaggtagatcaatgtctggcctatcggagcctgacacgcaaaaagctggaacaacacgcggctaaaaagcagaacatctacgaacggattccataccgaccctccagacagaaagataactccccgttgatcgaaccgacgggcacagacgacgaagaggacgaggacgacgacgtttaacgaggaagacgagaacgtgttttgcaccatgcagacctacagcaactccctcacgcttgtcatagtcacgtcgctgtttttattcacagctcagggaagtttatcgaatgccgtcgaaccaatcaaaaaacccctaaagctcgccaactaccgcgccacttgcgaaaaccgtacacgcacgctggttaccaggcttaacactagccatcacagcgtagtctggcaacgttatgatatctacagcagatacatgcgtcgtatgccgccactttgcatcattacagacgcctataaagaaaccacgcgtcagggtggcgcaactttcacgtgcacgcgccaaaatctcacgctgtacaatcttacggttaaagatacgggagtctaccttctacaggatcagtataccggcgatgtcgaagctttctacctcatcatccacccacgcagcttctgccgagccttggaaacgcgtcgatgcttttatccgggaccaggcagagtcggtgtggtcacggattcccaagaggcagaccgagcaattatctcggatttaaaacgccagtggtccggcctctcactccattgcgcctgggtttcgggactgatgatctttgttggcgcactggtcatctgctttctgcgatcgcaacgaatcggagaacaggacgttgaacatctgcggacggacctggatacggaacctttgttgttgacggtggacgggaatttggaataaaagatgcgtaacacctgtcgaagatgcgataactttacatacaggcaaacagtgtatacaattatagtattttgtatgttgcataaagttacatgcaacagtactgctaacagtactgcatccattacgctatccaacactgcctctaccacttttgtaaccaacatatattcaactccgaataacaacacatcaacgacgccacacacatctgtcacctcacaagcgtcaaccattggcaacatcaccaacgttacctccgacttgagtactttcacaaccgtatattctacattcaatacatcatttgccaatatatctaatacggctgtcactacagaattgatttcaacaaataccaacactatctcatcttttaccaacgtaacagcaaacgctacatcatcttataacacaacaatcaccgtaactgtcacgtcagatgaaacttcgcacaacgtatccactaataatgcacttataagcacaccatggcctacaaattgcagcgccacaacatacaccacgtacaaccttactaactcttccaacgcttgtcacacagagacaacaatcatacgtttcaaggaaaccaatacaacaggaatagaagggagtaatgtcaccataaagggtaattctacgtgggactgtctttcagtcgcctggatacgacattacaatagatccacacacggacatcatctaggttatcgtaagaacgcacatacccaatcttggtattggctacgcatccttacctctcacactgtatgtcattctcaacatgaaagaccttcactgtaccatgacttatgtcgttcgtgcaacaacacagaattacatctgtacgatctaaatatcaccaattccggcaggtacagcagacgttgttttaaagaaaattacttcacaggacatcacgaagatgaaaatttctacctattagtaacaccaaaaaatcatactgaagctattaatgctactttcgtttgccctagatacaacaccgatatcgaaaatgaagatagagagaaaggaagtcaacatactaacaatacacatcaccacaaacgtaatctctatcatagctcgcaaagaagccgcaccgtatggaccatcgtgttggtttgtatggcctgcatagttctgttttttgcacgacgagcctttaacaaaaagtatcatatgttacaagacaccgtcagtgaatcagaattcattgttcgatatcacccagaacatgaagattgagctacgtttccgggcagacatcttatgaagctgaacaataaactaaaacattctgtaagactcagcgttcaaaggaatattaatgcccattgagcgaaaactaatattgcaatggactggcgatttacggttacgtggaccgttacttgtgatggtttcaattatacagtccataaaagatgcgatcgcagttacgaggtaatcaacgtaacaggatacgttggtagcaacataactctaaaaaaatgcaatcagactgagaaatggcacaatgtagactggattcattatgagtaccccacgcataaaatgtgcgaattaggcaactatcaccaaaccacaccacggcacgacatatgttttgactgcaacgacacctccctaactatctacaacttaaccacaaaaaacgctggaaaatataccaggcgtcaccgtgataacggtcaagaagaaaattactacgtaacggtgttaattggagacacaacgttattcactcttggcacatgccctgtaagatataaagaatctacgaacactgaaaacaccattggaagtagcatcatagaaaccattgagaaagctaacattcccctgggaattcatgctgtatgggcaggcgtagtggtatcagtggcgcttatagcgttgtacatgggtagccatcgcattcccaaaaagccgcattacaccaaacttcccaaatatgatccagatgaattttggactaaggcttaacatgctgatcaataaactttttttaaccaataacatgtctccgtttttttttgttaacaacctatgatataaagcgttatattcagtcgttactaaacaaaaaaacatgggcatgcaatgcaacactaaattgttattgccagtcgcactaataccggttgcaatcatcctaattggtactctagtgccgatacttttacatgaacaaaaaaaggcgttttactggcgactttttctgcaaagtcaacatgtagaagcacccattacagtaacgcagggagacacagtctacctagacgctagcaataatccctgtaattattccagcttttggtaccacggtaattgcgaactttgtggatggaacggatatctacgcaatgttacacattactacacaaacacatcgtgttccccgcaattcatctgcataaacgaaactaaaggtctgcagttatataatgtaacattaaacgattcaggcgcttatactgaacacgtttacgaatgtgacctttcgtgtaacattactactaataacgaatatgaaatactcaattattttgataactgtaactacaccataaatagcaccaagcatattatcaccgtggtgtcttcacgtcattctaaacaaacaaattcccacgtatccactcacgctggttgggcagtcgccgtggtgacggtaattatgatctacgttctgatccactttaacgtcccggcaactctgagacacaaactacgaactagaaacaacgtaaatcgcatagcgtgattataaagtatcgacgctaatttctccaagataaaatttgattactccgtgcagttctcaaaaactgtaaggccccgcttttccactccgtcatgaaggatcgcaatagaatactgctatgtatcatctttatttgcattatgtgcctcatttgtatttactttaaacgtcgttgtgtttttactccgtctccagacaaagcagatctgcgagtggaatttccctcgttacccccgtgtattggcatacagtgcgctgcatgagaacacgcgtgacacatagcgtacccctggacggtacagtttatgataacgtaattcagggaaagtatacattcataccaacatgttatcacataacacacagattttctgcgtgttttataaaagagcgtctcgaagcagcttgagccacactacggtccagatgacgagcgtaattaaaaatatgccgcgcagtattcgaaagccgtactgagcgtgcgaggcgggtagggtgccgaacgacggatatgcgtcgttgtcatcttcgactataaggatcgcgaccgagtcttcgcccatggtaaacgtcaccctgtgtggctggtatgtagcgtatccggtttggaattgttctgctccagctcgggggatagtgaggaattctcaagggatacgggacccaatgactggataagagaagggtttttccccgtaagatgatcctcgtatcacatgaggtctggatatgtataaatgaagagtgaaataggcacagggaatcagatgccagcctcgtgatgcagccgctggttctctcggcgaagaaactgtcgtctttgctgacttgcaaatacatcccgccttaagcgatgagtctataaagcaccgttgcccgagtacggtaaaagtgacccggattgtagaacgtcctttttttttgtttttgcatcgtttatcgtcactactagtgcaatattttgattgtaaggctgaaagagtatcgttatgatgcttagaacgtggagattattacagatggtactgcttgccgcgtactgttattatgtttttgcgacttgttcaatcagcacgacgactgctcctgtggaatggaagtcttccgaccgtcagattcccaagaatattacctgcgctaattactcagggaccgtcaacggcaacgttacatttcgaggtcttcagaacaaaacggaagactttttgtactggttgttaggatggggtcataagtccatttgttcgttcttcccgaaactccagggtaactatgacgaacaacattacagatatgaagtagcgaacctgacgtataactgcacctataaccgcttgacgttgctgaatctgacgacggaaaacagcggaaagtactatttcaaaagggaagatgcgaatttcaccttctattactcttgttacaacttgaccgtgtcctaaagatcgcacgtgaagtttccacagagccgcgtggctgtagctattgtgtttacgttgcttttgaaatgttaagcgtccctacggcgctaacatgtttctaggctactctgactgtgtagatcccggccttgctgtgtatcgtgtatctagatcacgcttaaagctcatgttgtcttttgtgtggttggtcggtttgcgtttctatgattgtgccgcgttcgagtcctgctgttacgacatcaccgaggcggagagtaacaaggctatatcaagggacgaagcagcattcacctccagcgtgagcacccgtacaccgtccctggcgatcgcgcctcctcctgaccgatcgatgctgttgtcgcgagaggaagaactcgttccgtggagtcgtctcatcatcactaagcagttctacggaggcctgattttccacaccacctgggtcaccggcttcgtcctgctaggactcttgacgcttttcgccagcctgtttcgcgtaccgcaatccatctgtcgtttctgcatagaccgtctccgggacatcgcccgtcctctgaaataccgctatcaacgtcttgtcgctaccgtgtagctagttagccagctgtgtgtagtgttttgcttttgcatatttgttttcagtcagagagtctgaaacggggtgggagggacttttgcgggtagtgcatgctaagatgaacgggtgggctggggtgtgcttgataactcactgtttgaatacgcgctcacgcacatatgtagcactcaacatgttagcttttgcccgcacgccccggggcgtgccgagctgcctttttaataaagtctgggtttccagatacgcgctggttctgattttgatggtttgtgcctctgaaagctctacgagctgggccgtgacatccaatggactgcctaactgtagcacggtaactagaacagcgggtcaagacgctgaattgcacggtccggcaccgttaagctgtaatgtgacccagtggggacgttacgagaatggaagcacacccgtgttatggtgcactttacggggatcaagcatgcgagtctcattaggacaccgtgtagcgtttggctgttcttggaaaacattttttatttataacgtttctgaaagtagcggtggcacttactatcaaaaaggttacaactgcaccgacaaacatataacactatcttgtttcaacttaacggtggttcctcgagcggttcaaagcacaaccaccgtaatgacacccacgctggttacaaactccacattcagtgtgtcacttgttccgttgagactgacgacaaattccagcgcgtttggacacgctatttatcaacgacaacagcgtgttgaaaacgggacgttatccaagaacataactaacttggcattcacctatggcagctggggcgttgcgatgctgctgtttgccgccgtgatggtgctcgttgatttgggtttgcctcaatcggcttggcgacgctggcgaagccacgtggacgatgaagaacgtggtttgttaatgtaggaaataaaaggcagtttgagcatgactgtttccaaaccgtaacgtggtaaataaatcatggcttccgacgtgggttctcatcctctgacggttacacgatttcgctgcagagtgcattatgtgtacaataaactgttgattttaactttgtttgcccccgtgattctggaatccgtcatctacgtgtccgggccacagggagggaacgttaccctggtatccaacttcacttcaaacatcagcgcacggtggttccgctgggacggcaacgatagccatctcatttgcttttacaaacgtggagagggtctttctacgccctatgtgggtttaagcctaagttgtgcggctaaccaaatcaccatcttcaacctcacgttgaacgactccggtcgttacggagcagaaggttttacgagaagcggcgaaaatgaaacgttcctgtggtataatttgaccgtgaaacccaaacctttggaaactactccagctagtaacgtaacaaccatcgtcacgacgacatcgacgatgatcgacgcgaaaagtaacgttacagggaacgccagtttagcaccacaattacgtgccgtcgctggattctccaatcagacgcctttggaaaacaacacgcacctggccttggtaggtgttgttgtgtttttagttctgatagttgtttgcattatggggtggtggaaattgttgtgtggtaaaccagagttatagtaatgtgctttttatcagggagaaggttttgtgccaacaatgactagcccgggactatctgcgtcagaaaattatgacggaaattatgaattcacggaaaccgccaatacaacgcgtacaaatagaagtgactggacaacgttagaaaccagtgcattgctattgaaaaacacggagactgcagtgaacctcagcaacgcgactacggtcatcccacaacctgtagaatacccggctggggaagtacaatatcaaagaacggcaacgcattattcttggatgctaatcattgtcatcattctcatcatttttattatcatctgtctacgagcacctcgaaaaatctaccatcactggaaagacagtaaacagtacggacaagtgtttatgacagacacggaactgtgacagtgatgtctaagcgtttgcaggtatttccatggataacaattttattttacacatcaaaatcccagtattggaactatatggcaataccatgtacccctacagttggatacggcagtcataatattagcttgcatccgcttaataactcattatttcaagacgatgtttttgaatggtacatagacaaaccaatggttacaagttatgtctttatcaaagtaatgaacgcacaaaatccaatctagactctccaaatattgtgtggcaatgcacagataatcgtacactaattctcatgaacttaaccacaacatacagtagaaactattattttcaatcctttaaatatctcggacgaggagtaccaaaaccgaataacttgtgttataacgttagtgtacactttacccaccaaacacattgccatacaactacatcatccctgtatccacctacatctgtacacgattcattagaaatatcacagtcattcacctcaaccaacttcacacataccgcggtccactacgccaccggtaacgttgaagcacaacacgacactaccactccacatacaatgtggatcatacccctagttatcgttataacaatcatcgttttaacttgtttcaaattcccccagaaagcttggaataaattcacacaatacagatacagcggtatgctcgccgccgcttaaagaatcaacgccaaggaaaccaaaacgtaaaaagaatagatatgtacgtttatttttcagctcactgtttgaataccgtaaacataatgacgtacatatacgtggttatacaacaggtgtttgtgttatgcggcgactgattaaccatatcgtgaaccatgatcttttccgatggtccgtcgtgaccgcaatgatattttacagatattccgaaacctgtatggaggtcactgtcagagtaggtgatccagttaccctcggtagtggacatggttatcatccaggtagggataacagggtaatgatcctctagagtcgacctgcaggcatgcaagcttgagtattctatagtctcacctaaatagcttggseqidno:11dna属/种-巨细胞病毒hcmv描述性标题-编辑后hcmvacgacggccagtgaattgtaatacgactcactatagggcgaattcgagctcggtacccgattaccctgttatccctaccattccgggccgtgtgctgggtccccgaggggcgggggggtgtttttagcgggggggtgaaatttggagtcttggagccgcgtgtgctgtggaggacggtgacggtggtaagagtgtgctgcggtgcggttgggacggcggcggcgaataaaagcggcgtgcggcgcgcacggcgaaaagcagacgcgcgtctgtgttgtgtgtctttgaccgcggcggaacacacgcggaaaagcgagtcccaggggacacacgacgagcgagtcccagggggggacgacgacggccagggacgcggaaacgacgcggaaaagaggaagtccccagggggacgggcggaaaagaggaagcgcctaggggaccgcgggggcaggaacagacgaagtacgccgcaacccgcgtcgaggacacacgcagaagcggccgcccaggggagggggggggggggactcgcgggccccggggcacacttgttgttccctccggccgccgacacgcaccccgaagccgcgcacaccgccgacacacccctgacacacccgcgacacacccgccacacgcccgacacacgcccgcgacacacccgaccgacacaccctgacacaccccgccaacacacccagccgcacccgccccgccaacacacccccgacacacccgacacacgcccgcgacacacccggcacacacccacccacccagccgcgcccccgacacaccccgaacggcgccggtgcgggacagggctcacggaggtttgcgggccgtgagcacgcctccctttgtacacactaccggtgcgtggcgtcccacgctatttgttcgcgagaccggactaagggaggtttgcggtgcgtcagcgcggggcggcgtttgcggcgtgtttcgaccagcgctttgtgcgcgctgcctgtgcgtgtcgtcccatggtctttgtcagcggcacggcgctggggacggggtttcaccgcgctgagggatctttctgcgggtgtgagggacggagcttttttcgcacgctgggcaccgggctgggggacggggggtgtgcgggacggcggtggggccggggcgttgcgggtacggggattacgctgggaacggggactcgcggacccgggctgagggacgggggtggcgggggtgtttgcggcgaggacgggggccttttgcggcggggacggggactcaccctcgcctatttaacctccacccacttcaacacacacatgccgcacaatcatgccagccacagacacaaacagcacccacaccacgccgcttcacccagagtaccaacacacgttacccttacaccacagcaacacacaaccgcctatccaaacctcggacaaacacgccaacgaagaacaccgcacgcagatggagctcgacgccgcggattacgctgcttgcgcgcaggcccgccaacacctctacgctcaaacacaaccccaactacacgcataccccaacgccaaccctcaggaaagcgctcatttttccacagaaaatcaacatcaactcacgcatctacttcacaacattggcgaaggcgcagcgctcggctaccccgtcccccgcgcggaaatccgccgcggcggtggcgactgggccgacagcgcgagcgacttcgacgccgactgctggtgcatgtggggacgcttcggaaccatgggccgccaacctatcgtgaccttactgttggcgcgccaacgcgacggcctcgctgactggaacgtcgtacgctgccgcggcacaggctttcgcgcacacgattccgaggacggcgtctctgtctggcgtcagcacttggtttttttactcggaggccacggccgccgtgtacagttagaacgtccatccgcgggagaagcccaagctcgaggcctattgccacgcatccggatcacccccatctccacatctccacgcccaaaaccaccccagcccaccatatccaccgcatcgcacccacatgctacgactcgcccacatcacacgctctttcctatcccttctacaccctcagccacggttcacaatccccgaaactacgccgtccaacttcacgccgaaacgacccgcacatggcgctgggcacgacgcggtgaacgtggcgcgtggatgccggccgagacatttacatgtcccaaggataaacgtccctggtagacggggtagggggatctaccagcccagggatcgcgtatttcgccgccacgctgcttcaccgatatccaataaacccatcccctcgccacgacgtctccgcgtatctttgtagcctcaggaatccgtccccacgtccatccatcccgagcactccacacgctataacagaccacggacacggcaaatgcatgcaaacttctcatttattgtgtctactactctgtgttgctacagggagtgaagggggtgaaggcaaagaaaaaaaaaaggaacaaaataatagattagcagaaggaataatccgtgcgaccgagcttgtgcttcttttcttataaggaggcaaatatactagggaaaacttaagaataggaagaaaccgaggtttgggagaaaagctgagataaaatagcgcattttccatacagaggttgttgtttttgtggatcctaagaggtttcaagtgcgaatctcaaagttctcacgagaatattgtcttcaagaatcgacaactgtggtccaagatttttttttggtctttttaggttctgcgagggacatcacgatggatcgttgcgatgaagtcacgcgtacgcctctggtgtggcgcggtgtcgtgacaggagagtgtgttttcagtgcagagctgtcttgattcctatatccgagtatctgttttctcgtaaggacggtaatcttctttggtgtaagtacatctaaaagctgcaaactatattttaagggctgtctctaggtgtactttgatgctggagtttttcgctgtgttgatgtgaataaatctactactactattatatgcagaaagagtgattatgccgagacaagattgcattggctgaactgtttcaaaaacgcctacactctacttatccgtaaacctaaggtaatactatgtgtaagttgtttttttttctttttgtagtaaaatggtgatacgtgcaattaaaactgtattccatgtttccatcctttcatttcaactttaaaggcggctttgagagcgaagaagtgcgaggataaaaatggatgactccttcgtgtccagggagtcgactactgcaacgctgattgattaaaagatggtctccgatgatgatgttgttattgatcgaatcatggtgcagaacggcgacggagaggagcgtgtccgccgccgggaaggtggtctctttctcttttcttttttcaagaaatcttccatgtgtttatcgtagtgatcgaaatcgactgatctcgggttctttttgttggtttcttttcggttaatcatgtattgttttctttttttacagaaagatacttttttcatgagcaattcctcgcccggcgccggcatgccgaggtggggccactgcgatcagcggcatgccgacgccgacccggggatcttggattcaccgttttctctcttctctctctacatacagaccgggtggcaggagcggtaaggaatcatcgtcgtctttcattcttcgatgattatggtaatactaaatcttatctaggagcatatacatctaagattggagtactagtagtcgtttgtggtttctattttttttatatttatctatgacagtttttctgtttttcgttttgataataatataataaaaactcatggacgtgaaatctggcttggttgtggtgatttcattctcattattgttgttttctttccgtcttgcggatgaagatgttgcgatgcggttgttgttggtgttgctatacaccgagagagatgatctttttgttcttctggttcatttcctatgattgtttggctgctgaccgacgcgtcaggatgtgcagggcatccggggaatcaggaccggacacgggataatttcatctacctatacggagatcgcggtcctcgccatgaggatcgcgacaggcgcgtcgagggggcaggaacacccttgcggattgacattcttggtggtgtttcgttgttgtcggtagttgttgttgacgatgaggataaataaaaatgaccttgtttttgttctgttttctcttgttgggaatcgtcgactttgaattcttcgagttatcggaaagctgaggtacccaaatgtctgtagcttttttctttttaccctcttgtttatcatctgcgattcgtggtaggtaggagagggaaatgataatccgagattaaggaaaggagaagataaaaaataaaaaaaaaataataaaacagaagccgaccggccgccgacccgttccccaggaccagcctacgaggaatggataacgcggtggcgacggcagcggtggtggcgctgggggtggcggcagtggtactgctgatggtagtcgggacggaggagaggcgatgcatacatacacgcgtgcatgctgcatgggtggatggtacggccgggagacgcggaagagaaactcacataaaaaggtgacaaaaagagcggttgaaaaaagaaaacgagattcgaccagacagaagagaaggaccggggcttggcgacccttccacgactgctgttgtcatctcggctcccccgtcttctcccggccacgggcggctaagtcaccgccgttctccccatccgtccgagcgccgaccgaccagccggccgattcgcccgccggggcttctggagaacgccggggcagcagcgatctggggaagccgctaaacccctgcgtttttatatggtagctctgccgagcgcgggctgacgcgttgagtaagcggaaagacgtgtgtgacgaaaaggggtcccatggtatttcacgtgacgatgaggagatgcggtttggagcacatacggtttagaaaaagggagttgtcgtgacaagggctgagggacctctgtctccatgtgtgtataaaaagcaaggcacgttcataatgtaaaaaagaacacgttgtaaacaagctattgctgtatcattcggctgactatgcttcattcggactgattttcttttcctaacggcgtaacttaaagtgattaacgtatgatatttgttccccagagttatactatagtcatcatcctaaaattcagatataaatgaacacatgtcgtatgggattattaagaaaccgaaactctccacagttcaccatcttcttcgtcattcaaccgatgacccactccgtacaacgaatcagtctgctgtgtcacactgcaaactactagcgacgtatgcaaacaacttgaaacacgggctgttgtattgacgaccgttgtaccattactagtcacattgcatagagaccatccaccgtcatcccatctttcccacccgatggaaaaccgtcttctatcatcaactatggtaagatttcgaccctgcgaggtattcagtttccccatatccataacctggattttatcattaaaccccaatattaaacacttttttagtacccccccacccaccaaaaaatgtgactggaccggttcctagcagctctgggagccatgttcaggttgaaccacagctacagcgaaaccgagtccagtgaccggtaaccacgtccagcccctgcgtatgtaccagtccaagcacgtccggtcattgttctacacaggaaatctaactaggtcaacgcaattttattccaccgttacgcagaatactaacaaacaaacacacaaatttaacgaattacacgtagtttattacatgaaaactgtaagaacaccaattcactaagcgatacaacatttagctgacttccaagtgccacacatcaccactgtattcatccatgttttcaccgaaccaacgagacagatcgaagaagccagaatctcccgactttaaattacataaatccaacgtattatgaccacagctcgacacacaaatagttgcgttactattcacagtagcattacctatacccgtaacgttgcacaaccactgatcaccattgttaccaaaaacggttttccacttagttgtcaacggatctttcccatgcgtaatggtcaaattactaccagtcgtcgcttttagctcattacgagtattatccgcatccacatatatcaacgtcatagctaggcacgctataagtaccccccccccacaatggaatgttgccaaaccggttctttcccgttatagccatagcgttcccaggcaaaagcaaacgccaaacctaatgcagtgaaaagcgcttgcagccagaaccagcttatgtaccagccacaatcacatccggttattgtttccacaggaaatcctaccaggcaaagccccgcttgttttgttcctgaccatcttgtttagcaattcgtaaactgtcagcctagcgacgtccgtttagatcaaaagtcacgtatatagcgacgctgtttccacccgtttccccgtcccgccgtttccgaacaacccacccgggttcagacaaccgaccaccaacagaaatatacacacagaccaccgggagttcagttaaagatttcatcaggtttattttggctgctgctagtcttttgcttcttagaaaaaaaatacccatatagagaaataatgatagtttgacaacacatatggcagggatttcttcttcatcaataagatatgcaattcccccagggagagactttcaacaattgaatttacaaaaacaaaattacatcaggagaaagagaggatacattaataaatatattatatctggtgtatatactgaatgctgctggttcataaggtaacgatgctactttttttaattccaagatggtttttctttgttagtcttttgttgacttgctggttcctaaaagttcgcaaaaacgattgtgtgaagattatgacgttggttgactagttcatgagattctgctgtacgtgtgatggttattcgctggttcgttctaagatgagtatcgtactgtgtctgcgatggtcgtctcttactggcattctctcggctgcctcttgttttcatgattgaaaaggaaaaaaggactccgagggcgcggtcatcttttacttttcggttttctcgttggcgggtcagaggtagtcagatcatgagactgtcgtggtcgatgaaactgtgtctgctcaagtgacgtccatttcttgtacggagaaaaaagtcatcgggataaataaggctatacaaggcgttgtcaagcgtgcggctctaaacaaattaagcgatacaaaattacagtgatacgaataataaattaccccctccccctgtggtccccccgaggcgagagccacccatcgtgtactctcgcaccacccacgaccacagggggagacgggacgaagagacgacgcagagcgccatctcctcctggaggccggcggcgttaactgctacagctgcggcggcgacgacagctgcgatttgtcggccgacatgccgatggtatgggcggcggcggcggtggccgcggcagcggggaggagaggagagagaagaggagcggggcgtccgaaggcgaggatggcatggtctcgccggagcgcccggcttttatggaacactcgcgtccggttgggtatcacccacaggaagatgaatcacaacttccaaaccatcttgagacccgagtaacggtttacaggtcgcacgccagtctcagctaaaaacagcggacagtcccacgctgtttctgttgtggctctctccagtttcctcatcgccgtcttggtctccgtcatcatcggaagaataccacccgctctcatgcggcagtcgatcagcctcgatgaacgagacgcggcgacgcctttctacggccgactggttgtggtggtgaaagaagagcaccagcaatcccaggaggagcaacaagccctcacatgtccaggaggtcggggagagggcctgtcggagatgaccgtgaggcatcacgtacggcagctgaggagaaacggagaagaaaggaaaattaccgtcaggggccggggttcttattagagaaacagcacgtaggtcaggatccagatgctaatggcaatcatgatgacgatgatcatgcaggccaagacgcggcgcaccaatgcagaatccaatagccgccgtgcctccggttggtggccggcggcatctagagacatgatttgggggggggaccggcggcgcaaaaagacagggagatggacagtgccacggtgttttgttatgattaggacatggggaccggaagccgagacagagtactacagggtgttgaagggtaacgtgagggagatcatgtcatgggcgggctgaagaccgtgcggggaggatcgacgtgtgcggtgcttgtggaacacggtgttttaatatgtatccgcgtgtaatgcacgcggtgtgctttttagcactcggcttgataagctacgtgaccgtctgcgctgaaaccatggtcgccaccaactgtctcgtgaaaacagaaaatacccacctagcatgtaagtgcaatccgaatagtacatctaccaatggcagcaagtgccacgcgatgtgcaaatgccgggtcacagaacccattaccatgctaggcgcatactcggcctggggcgcgggctcgttcgtggccacgctgatagtcctgctggtggtcttcttcgtaatttacgcgcgcgaggaggagaaaaacaacacgggcaccgaggtagatcaatgtctggcctatcggagcctgacacgcaaaaagctggaacaacacgcggctaaaaagcagaacatctacgaacggattccataccgaccctccagacagaaagataactccccgttgatcgaaccgacgggcacagacgacgaagaggacgaggacgacgacgtttaacgaggaagacgagaacgtgttttgcaccatgcagacctacagcaactccctcacgcttgtcatagtcacgtcgctgtttttattcacagctcagggaagtttatcgaatgccgtcgaaccaatcaaaaaacccctaaagctcgccaactaccgcgccacttgcgaaaaccgtacacgcacgctggttaccaggcttaacactagccatcacagcgtagtctggcaacgttatgatatctacagcagatacatgcgtcgtatgccgccactttgcatcattacagacgcctataaagaaaccacgcgtcagggtggcgcaactttcacgtgcacgcgccaaaatctcacgctgtacaatcttacggttaaagatacgggagtctaccttctacaggatcagtataccggcgatgtcgaagctttctacctcatcatccacccacgcagcttctgccgagccttggaaacgcgtcgatgcttttatccgggaccaggcagagtcggtgtggtcacggattcccaagaggcagaccgagcaattatctcggatttaaaacgccagtggtccggcctctcactccattgcgcctgggtttcgggactgatgatctttgttggcgcactggtcatctgctttctgcgatcgcaacgaatcggagaacaggacgttgaacatctgcggacggacctggatacggaacctttgttgttgacggtggacgggaatttggaataaaagatgcgtaacacctgtcgaagatgcgataactttacatacaggcaaacagtgtatacaattatagtattttgtatgttgcataaagttacatgcaacagtactgctaacagtactgcatccattacgctatccaacactgcctctaccacttttgtaaccaacatatattcaactccgaataacaacacatcaacgacgccacacacatctgtcacctcacaagcgtcaaccattggcaacatcaccaacgttacctccgacttgagtactttcacaaccgtatattctacattcaatacatcatttgccaatatatctaatacggctgtcactacagaattgatttcaacaaataccaacactatctcatcttttaccaacgtaacagcaaacgctacatcatcttataacacaacaatcaccgtaactgtcacgtcagatgaaacttcgcacaacgtatccactaataatgcacttataagcacaccatggcctacaaattgcagcgccacaacatacaccacgtacaaccttactaactcttccaacgcttgtcacacagagacaacaatcatacgtttcaaggaaaccaatacaacaggaatagaagggagtaatgtcaccataaagggtaattctacgtgggactgtctttcagtcgcctggatacgacattacaatagatccacacacggacatcatctaggttatcgtaagaacgcacatacccaatcttggtattggctacgcatccttacctctcacactgtatgtcattctcaacatgaaagaccttcactgtaccatgacttatgtcgttcgtgcaacaacacagaattacatctgtacgatctaaatatcaccaattccggcaggtacagcagacgttgttttaaagaaaattacttcacaggacatcacgaagatgaaaatttctacctattagtaacaccaaaaaatcatactgaagctattaatgctactttcgtttgccctagatacaacaccgatatcgaaaatgaagatagagagaaaggaagtcaacatactaacaatacacatcaccacaaacgtaatctctatcatagctcgcaaagaagccgcaccgtatggaccatcgtgttggtttgtatggcctgcatagttctgttttttgcacgacgagcctttaacaaaaagtatcatatgttacaagacaccgtcagtgaatcagaattcattgttcgatatcacccagaacatgaagattgagctacgtttccgggcagacatcttatgaagctgaacaataaactaaaacattctgtaagactcagcgttcaaaggaatattaatgcccattgagcgaaaactaatattgcaatggactggcgatttacggttacgtggacgatactaatgtccgcgttgtcagaaagctgcaatcaaacctgttcttgtcaatgtccctgtagtactaccgttaactattcaactagtactgagacagccacatcaacatacagtacaacagttatcagcaataaaagcacttcagaatctataaattgctctactgcaactacaccagcaaacaccgtttctacaaaaccgtcggaaacaaccacacagatatccacaacgacgaacacaaacgttgagactaccacatgtaccaacaccaccacgaccgttacttgtgatggtttcaattatacagtccataaaagatgcgatcgcagttacgaggtaatcaacgtaacaggatacgttggtagcaacataactctaaaaaaatgcaatcagactgagaaatggcacaatgtagactggattcattatgagtaccccacgcataaaatgtgcgaattaggcaactatcaccaaaccacaccacggcacgacatatgttttgactgcaacgacacctccctaactatctacaacttaaccacaaaaaacgctggaaaatataccaggcgtcaccgtgataacggtcaagaagaaaattactacgtaacggtgttaattggagacacaacgttattcactcttggcacatgccctgtaagatataaagaatctacgaacactgaaaacaccattggaagtagcatcatagaaaccattgagaaagctaacattcccctgggaattcatgctgtatgggcaggcgtagtggtatcagtggcgcttatagcgttgtacatgggtagccatcgcattcccaaaaagccgcattacaccaaacttcccaaatatgatccagatgaattttggactaaggcttaacatgctgatcaataaactttttttaaccaataacatgtctccgtttttttttgttaacaacctatgatataaagcgttatattcagtcgttactaaacaaaaaaacatgggcatgcaatgcaacactaaattgttattgccagtcgcactaataccggttgcaatcatcctaattggtactctagtgccgatacttttacatgaacaaaaaaaggcgttttactggcgactttttctgcaaagtcaacatgtagaagcacccattacagtaacgcagggagacacagtctacctagacgctagcaataatccctgtaattattccagcttttggtaccacggtaattgcgaactttgtggatggaacggatatctacgcaatgttacacattactacacaaacacatcgtgttccccgcaattcatctgcataaacgaaactaaaggtctgcagttatataatgtaacattaaacgattcaggcgcttatactgaacacgtttacgaatgtgacctttcgtgtaacattactactaataacgaatatgaaatactcaattattttgataactgtaactacaccataaatagcaccaagcatattatcaccgtggtgtcttcacgtcattctaaacaaacaaattcccacgtatccactcacgctggttgggcagtcgccgtggtgacggtaattatgatctacgttctgatccactttaacgtcccggcaactctgagacacaaactacgaactagaaacaacgtaaatcgcatagcgtgattataaagtatcgacgctaatttctccaagataaaatttgattactccgtgcagttctcaaaaactgtaaggccccgcttttccactccgtcatgaaggatcgcaatagaatactgctatgtatcatctttatttgcattatgtgcctcatttgtatttactttaaacgtcgttgtgtttttactccgtctccagacaaagcagatctgcgagtggaatttccctcgttacccccgtgtattggcatacagtgcgctgcatgagaacacgcgtgacacatagcgtacccctggacggtacagtttatgataacgtaattcagggaaagtatacattcataccaacatgttatcacataacacacagattttctgcgtgttttataaaagagcgtctcgaagcagcttgagccacactacggtccagatgacgagcgtaattaaaaatatgccgcgcagtattcgaaagccgtactgagcgtgcgaggcgggtagggtgccgaacgacggatatgcgtcgttgtcatcttcgactataaggatcgcgaccgagtcttcggccatggtaaacgtcaccctgtgtggctggtatgtagcgtatccggtttggaattgttctgctccagctcgggggatagtgaggaattctcaagggatacgggacccaatgactggataagagaagggtttttccccgtaagatgatcctcgtatcacatgaggtctggatatgtataaatgaagagtgaaataggcacagggaatcagatgccagcctcgtgatgcagccgctggttctctcggcgaagaaactgtcgtctttgctgacttgcaaatacatcccgccttaagcgatgagtctataaagcaccgttgcccgagtacggtaaaagtgacccggattgtagaacgtcctttttttttgtttttgcatcgtttatcgtcactactagtgcaatattttgattgtaaggctgaaagagtatcgttatgatgcttagaacgtggagattattacagatggtactgcttgccgcgtactgttattatgtttttgcgacttgttcaatcagcacgacgactgctcctgtggaatggaagtctcccgaccgtcagattcccaagaatattacctgcgctaattactcagggaccgtcaacggcaacgttacatttcgaggtcttcagaacaaaacggaagactttttgtactggttgttaggatggggtcataagtccatttgttcgttcttcccgaaactccagggtaactatgacgaacaacattacagatatgaagtagcgaacctgacgtataactgcacctataaccgcttgacgttgctgaatctgacgacggaaaacagcggaaagtactatttcaaaagggaagatgcgaatttcaccttctattactcttgttacaacttgaccgtgtcctaaagatcgcacgtgaagtttcacagagccgcgtggctgtagctattgtgtttacgttgcttttgaaatgttaagcgtccctacggcgctaacatgtttctaggctactctgactgtgtagatcccggccttgctgtgtatcgtgtatctagatcacgcttaaagctcatgttgtcttttgtgtggttggtcggtttgcgtttctatgattgtgccgcgttcgagtcctgctgttacgacatcaccgaggcggagagtaacaaggctatatcaagggacgaagcagcattcacctccagcgtgagcacccgtacaccgtccctggcgatcgcgcctcctcctgaccgatcgatgctgttgtcgcgagaggaagaactcgttccgtggagtcgtctcatcatcactaagcagttctacggaggcctgattttccacaccacctgggtcaccggcttcgtcctgctaggactcttgacgcttttcgccagcctgtttcgcgtaccgcaatccatctgtcgtttctgcatagaccgtctccgggacatcgcccgtcctctgaaataccgctatcaacgtcttgtcgctaccgtgtagctagttagccagctgtgtgtagtgttttgcttttgcatatttgttttcagtcagagagtctgaaacggggtgggagggacttttgcgggtagtgcatgctaagatgaacgggtgggctggggtgtgcttgataactcactgtttgaatacgcgctcacgcacatatgtagcactcaacatgttagcttttgcccgcacgccccggggcgtgccgagctgcctttttaataaagtctgggtttccagatacgcgctggttctgattttgatggtttgtgcctctgaaagctctacgagctgggccgtgacatccaatggactgcctaactgtagcacggtaactagaacagcgggtcaagacgctgaattgcacggtccggcaccgttaagctgtaatgtgacccagtggggacgttacgagaatggaagcacacccgtgttatggtgcactttacggggatcaagcatgcgagtctcattaggacaccgtgtagcgtttggctgttcttggaaaacattttttatttataacgtttctgaaagtagcggtggcacttactatcaaaaaggttacaactgcaccgacaaacatataacactatcttgtttcaacttaacggtggttcctcgagcggttcaaagcacaaccaccgtaatgacacccacgctggttacaaactccacattcagtgtgtcacttgttccgttgagactgacgacaaattccagcgcgtttggacacgctatttatcaacgacaacagcgtgttgaaaacgggacgttatccaagaacataactaacttggcattcacctatggcagctggggcgttgcgatgctgctgtttgccgccgtgatggtgctcgttgatttgggtttgcctcaatcggcttggcgacgctggcgaagccacgtggacgatgaagaacgtggtttgttaatgtaggaaataaaaggcagtttgagcatgactgtttccaaaccgtaacgtggtaaataaatcatggcttccgacgtgggttctcatcctctgacggttacacgatttcgctgcagagtgcattatgtgtacaataaactgttgattttaactttgtttgcccccgtgattctggaatccgtcatctacgtgtccgggccacagggagggaacgttaccctggtatccaacttcacttcaaacatcagcgcacggtggttccgctgggacggcaacgatagccatctcatttgcttttacaaacgtggagagggtctttctacgccctatgtgggtttaagcctaagttgtgcggctaaccaaatcaccatcttcaacctcacgttgaacgactccggtcgttacggagcagaaggttttacgagaagcggcgaaaatgaaacgttcctgtggtataatttgaccgtgaaacccaaacctttggaaactactccagctagtaacgtaacaaccatcgtcacgacgacatcgacgatgatcgacgcgaaaagtaacgttacagggaacgccagtttagcaccacaattacgtgccgtcgctggattctccaatcagacgcctttggaaaacaacacgcacctggccttggtaggtgttgttgtgtttttagttctgatagttgtttgcattatggggtggtggaaattgttgtgtggtaaaccagagttatagtaatgtgctttttatcagggagaaggttttgtgccaacaatgactagcccgggactatctgcgtcagaaaattatgacggaaattatgaattcacggaaaccgccaatacaacgcgtacaaatagaagtgactggacaacgttagaaaccagtgcattgctattgaaaaacacggagactgcagtgaacctcagcaacgcgactacggtcatcccacaacctgtagaatacccggctggggaagtacaatatcaaagaacggcaacgcattattcttggatgctaatcattgtcatcattctcatcatttttattatcatctgtctacgagcacctcgaaaaatctaccatcactggaaagacagtaaacagtacggacaagtgtttatgacagacacggaactgtgacagtgatgtctaagcgtttgcaggtatttccatggataacaattttattttacacatcaaaatcccagtattggaactatatggcaataccatgtacccctacagttggatacggcagtcataatattagcttgcatccgcttaataactcattatttcaagacgatgtttttgaatggtacatagacaaaccaatggttacaagttatgtctttatcaaagtaatgaacgcacaaaatccaatcctagactctccaaatattgtgtggcaatgcacagataatcgtacactaattctcatgaacttaaccacaacatacagtagaaactattattttcaatcctttaaatatctcggacgaggagtaccaaaaccgaataacttgtgttataacgttagtgtacactttacccaccaaacacattgccatacaactacatcatccctgtatccacctacatctgtacacgattcattagaaatatcacagtcattcacctcaaccaacttcacacataccgcggtccactacgccaccggtaacgttgaagcacaacacgacactaccactccacatacaatgtggatcatacccctagttatcgttataacaatcatcgttttaacttgtttcaaattcccccagaaagcttggaataaattcacacaatacagatacagcggtatgctcgccgccgcttaaagaatcaacgccaaggaaaccaaaacgtaaaaagaatagatatgtacgtttatttttcagctcactgtttgaataccgtaaacataatgacgtacatatacgtggttatacaacaggtgtttgtgttatgcggcgactgattaaccatatcgtgaaccatgatcttttccgatggtccgtcgtgaccgcaatgatattttacagatattccgaaacctgtatggaggtcactgtcagagtaggtgatccagttaccctcggtagtggacatggttatcatccaggtagggataacagggtaatgatcctctagagtcgacctgcaggcatgcaagcttgagtattctatagtctcacctaaatagcttggseqidno:12dna属/种-phikmv样病毒lka1描述性标题-lka1gp49序列atggcgcaaacacccagtacatgggccgactacgtaggcgacggcgtagaggatacgttccaagtcacattcccgtaccagaagcagcaagaggtgtttgtgactgtgggcggcgatccggcagctttcacattcatctcggcaggttggattcaactggcagcggtcccggtaaatggggccgcaatccgtgtacggcgcagcactgaggcattcgagcctcggcacgagttcgccaacggcgtgccattactgccgcgattcatagacgagaataatacccagttcttgtacactgtacaagaggcagtgaatgagacacatggcattgcttccgaagcgctgagtgtcgcagaggaggccagaggcattgcgcaggcggcatcggataaagtggatgctgccaccattgactccgcacaccagttgcgtctagacctcgccgacccggcgaaggggcctgggctgctaggctacgaccgagacgtaagttatccggtcgggtcggtcggtcaaagcctacagtttctggaaatgggtcgggtcacaccagcgcaatttggcgccgttggtgatggcgccagccaccccctctctgagcgatacgcaactctagcggaagctcagactgtctatccgcatgcagtcgcactctccgacgaaatagactgggccgcattgcaagctgccgtggattcaggggcacctgtacacataccgtctggggactatcagataaatagggggattagcagtacgggctctctacagattgcgggtgatggcgctacatctattatacgcccgactgctgcgttcactggtacatcggtcctcagttgtgtggggagcttagttgccttgccgaatatatcctccgtgtcggctgggtccctaaccattgactttgccagcacccctaatcttgtagcgggggatgtattcatcatctacaacccgactgatagcagcttctcgggatttcggacgagctatcgcgcaggagagttctgtgaggtcagggcggtttctgggaacaccgtgacaatccgttccgcactctatgccgcatacgacggggctactgttgctatttacaaagtagtctctggtgtagttgatatagctagcatccaaatcgttggcgggacagtcccaatgaatggactgttagtggaggctgtcgtttcaccgcgcgtcgatgacgtgacggtcacccttgcaaacaacgccggtgtgtattttgcccgctgctatgacgctaagatcacaaacagtaatatatcgaacatcggcgacggtggcgatgactatggaatcatctttgggaactgtcacgacggtggggcagacaactgtaaagtctacgctaggcgacatgccatcgccacgggcggcgatgcagaagtaggctgcgttccggtccgtaatgtgcgtatgcgtaactgcacacttaggaatgatattacctctggtacacactgcgcagacttccacggtaacgccgaggattgcagctacgaaaactgcacaatctacggtggtgcaacttggcaggggaaggatatcagctacagacactgtacaatcactaacgcgtcgggtggttggattgttatatccgctgagattcttggtggtacattccttctcgaccaatgcacattgtacacaaccggcgatccgcagcctggtaaccgtggggttatagatgtaggtgggaactccgcagtcctcactacaaatacaacgcaaccctgtaacttccttatacaaggcggcagtctgcgagcgcccagcttaagtacgtctagttacctactgcgcgcacgtcttgagggtagtacagttccagtaaacatacagtacagcggacaggctattgatgtaggctctctgggcaaggtactacaactcgatattacctcgggcagtacctctcctgagtatttgatcgtggagaatttagcggggttgccatctggcatcacgctggcgtctgctgctggtggtttcgcaagtgccccgatgcgtatgcctgtgctgggtggtagggttcaagtaactacggcaaccaacgcgagtagcgttactgctccagtaacgttcaggtacatttatcctaaggccccaaccgtccaggtcacaaagacggacaggagctacgccggtaacagggtcggcgttgctatcgccaatccgacctctgcgtctggggcgacgttgggtctgttcacggacgacgggacaaactttagctcagccgttactaaccagttgaactggcaggcaggtatttatgaggtgtaaseqidno:13dna属/种-phikmv样病毒ntuh-k2044-k1-1描述性标题-ntuh-k2044-k1-1gp34atggccctgatccggctcgtggcgcccgagcgcgtgttcagcgacctggccagcatggtcgcctatccgaacttccaggtgcaggacaagatcaccctgctgggctcggccggcggcgacttcaccttcaccaccaccgcgtcggtggtggacaacggcaccgtgttcgccgtgcccggcggctatctcctgcggaagttcgtcggcccggcgtatagctcgtggttcagcaactggaccgggatcgtcacgttcatgagcgcgccgaaccggcacctggtggtggacaccgtgctgcaggccacgagcgtgctgaacatcaagagcaacagcacgctggaattcacggacacgggccgcatcctgcccgacgccgccgtggcccgccaggtgctgaacatcaccggctccgcgccctcggtgttcgtgcccctcgccgccgacgccgccgcggggtcgaaggtgatcaccgtggccgccggcgcgctgtccgcggtgaaaggcacctacctctatctgcgctccaacaagctgtgcgacggcgggccgaacacctatggcgtcaagatcagccaaatccgtaaggtggtcggcgtgagcaccagcgggggcgtgacgtccatccgcctcgacaaagccctgcactataactactacctctcggatgccgccgaagtgggcatcccgaccatggtggagaacgtcaccctggtgagcccgtacatcaacgagttcggctacgacgacctgaaccgcttcttcaccagcggcatctccgcgaacttcgcggccgacctgcacatccaggacggcgtcatcatcggcaacaagcgtccgggcgcctccgacatcgagggccgcagcgccatcaagttcaacaactgcgtggatagcaccgtgaagggcacctgcttctataatatcggctggtacggcgtggaggtcctcggctgctcggaggacaccgaggtgcacgacatccacgccatggacgtgcgccatgccatctccctgaactggcaaagcaccgccgacggcgataagtggggcgaaccgatcgagttcctgggcgtgaactgtgaggcgtacagcaccacccaggccggcttcgacacccacgacatcgggaagcgtgtcaaattcgtccgctgcgtgtcctacgacagcgcggatgacggcttccaggcccgcaccaacggcgtggagtacctcaactgccgcgcctaccgcgccgccatggacggcttcgcctcgaacacgggcgtcgccttcccgatctaccgcgaatgcctggcctacgacaacgtgcgcagcgggttcaactgcagctacggcggcgggtatgtgtacgactgcgaggcgcacggcagccagaacggcgtccgcatcaacggcggccgggtcaaaggcgggcgctacacccgcaactcgtcgagccacatcttcgtgacgaaagatgtggcggaaaccgcccaaaccagcctcgagatcgacggcgtctccatgcggtacgacggcaccggccgcgccgtgtacttccacggcaccgtgggcatcgatccgacgctcgtgagcatgtccaacaacgacatgaccggccacggcctgttctgggccctgctgtccggctataccgtgcagccgaccccgccgcgcatgtcgcgcaacctgctcgacgataccggcatccgcggcgtcgcgaccctggtcgcgggcgaagcgaccgtcaatgcccgcgtccgcgggaacttcggcagcgtggccaacagcttcaagtgggtgtcggaggtgaagctgacgcgcctcacgttcccgtcgtcggccggcgccctcacggtcaccagcgtcgcccaaaaccaggacgtgccgacccccaacccggacctgaacagcttcgtcatccgcagcagcaacgccgccgacgtgtcccaagtcgcctgggaggtctacctgtgaseqidno:14dna属/种-t7-样pp15描述性标题-添加的pp15gp44序列atggcacgaactatcgtccagaacgccctaacaggcggacaacaggacttcgaggtacctttcgactacatcttgcagcgcttcgttaagcttaccctgatcggtgacggtaaccgacaagagctggtcctcggtaccgacttccggttcatcggtcctcgcaccgttcgcactaacgtcttctggggaccagcgcaggggtatacctccatcgagatccgacgagttaccagcgcttctgatcgtcgcgtagagttctcggacgggtccatcctgaccgcaggtgatctgaacatcgcccagcttcaggccatccacattgccgaagaagcgcgagactctgccactgagaacctgagcccagatgctgatggcaactacgatgcacgtggtgcgcgcatttacaacctcggtgacgctgttcagccgaaggatgcggtcaaccggtacactcttgacctcgctatcgcagccgctctggccatgaataccggcaacccgaacaacgcccagaacatctcgtacacccctaacgggcctggtcagtcgatccgaagtgttgaaggccgtctgcgggatgctgtgttcgtctcggactacatgaccactccacgtgatggagttaccagtaaccagcaggacctcgaaaaggcactcgctgcggcgaacgctaaaggtgccgacctattctggcctgacgacatcccgttcttctccacgtccccgctggcactgatccacgcggtctaccatgttggacgtggtgtcatcaacgcgaacggtacgctgttctacgtgaacccgaagaacggccaacacaacaggctacacgtgtctcccgggggcaccggggatggtctggcagctggccgcccactggggaccatctggagtgcactcgcggcccttaacatgcgagccccactgaccacgcgctggtccttggagatgaccgctggcgcctataatgaagccgttacacttccgaactacctgaccagctgtaacgactacttggcgtttaactggccgaacaccggtcaggaacgtatggagcccactgcgtacccatcagctctcgacggcacaggccagaccggcctcacaggtttccacactggcatcggcaaccgcattaccatcaacaacgtgtgcatgtccaactggtacgacactgcgctgactcctacccaacaggtgcgaagagcgttcgttgtaggtgcgtattcgactgcctacgtggtcaactgcgcgttcatttacaacggcatcgcgagcgtgtctgtgctgcccggtggcactgctatcgtaaccggtggcatcgtcgatggtgggcggttcggcctcgacaacactggcggtcgcctgtccctgacggcaaccaagagcaattatacgcaggtccggaactgcctcgaatatggactgtactcgaagcatgacgcatcgaccgtaatggacaacaccgagttccgcaactgcggtaatcaccctgcggctgttgcgtatggtgctgcaatcttcgcgtacaagttcaactgttctgttgacactcgtggggtcaagttctacggcaacaacatcgcccagcactgccgtggcggtatcacctcggacaatccgggcgatccggacatctacggtaccggcgcagatgctaataagcgtctattcctgtgcaccggtggtggctctgacgacatccagttctacgaagctcggcgcgtcatggacatcacgaagcgcactggtggcggctcaactactgccagcgtatcgtcgctgctactggctgccgttgcgtctgtccgtaagggctactttgcgcacaacgatcaggtgatccggatgaccctgatgttccgcgctacaggctcggctggcatcttcacgccgaccttgcgcacacctctggggactatccctctgggtagcttcagggtcgcatcgggacagtacggcgagatcaagttgaccattcgacctactctgacatctgatggtctcatagtcgggttctcctgcatcaacgccgtgcagaatcttgggtcctctgttggtcaaatcatcgtcagcggcaccgtagacctccgcaccgtcgaccagctggtcgagatgtggggctattcggaagctggtggcaccgcttcgtacattcaaggcctgatcgagctggtcgggtgaseqidno:15dna属/种-伴放线菌聚集菌描述性标题-添加的dspb序列atgaactgttgcgtcaagggcaattccatctacccccagaagacctccaccaagcagaccggcctgatgctcgatatcgcccggcatttctacagccccgaggtgatcaagagcttcatcgatacgatcagcctgagcggcggcaacttcctccacctgcacttctcggaccatgaaaactatgccatcgagtcgcacctgctcaaccagcgggcggagaacgccgtccaggggaaggatggcatctacatcaatccgtacaccgggaaaccgttcctgagctaccgccagctggacgacatcaaggcctacgccaaggccaagggcatcgaactgatcccggagctggacagcccgaaccatatgacggccatcttcaaactggtccagaaggaccgcggcgtcaagtacctgcagggggtgaaatcccgccaggtggacgacgagatcgacatcaccaacgccgatagcatcaccttcatgcagagcctgatgagcgaggtcatcgatatcttcggcgacacgagccagcacttccacatcggcggcgacgaattcggctactccgtcgagagcaaccacgagttcatcacctacgccaacaagctgtcgtacttcctggagaagaaggggctcaagacccgcatgtggaacgacggcctcatcaagaacaccttcgagcagatcaatcccaacatcgaaatcacgtactggtcgtacgacggcgacacccaggataagaacgaagcggccgagcgccgcgacatgcgcgtgagcctgccggagctgctggcgaagggcttcaccgtgctgaactacaacagctactacctctacatcgtgccgaaggcgagcccgacgttctcgcaggacgccgccttcgccgccaaagacgtgatcaagaactgggatctgggcgtctgggatggccggaacaccaagaaccgcgtgcagaacacccatgagatcgccggggcggcgctgtcgatctggggcgaggatgcgaaggcgctcaaggacgagacgatccagaagaacaccaaaagcctgctcgaggccgtcatccacaagaccaacggcgacgagtgaseqidno:16dna属/种-金黄色葡萄球菌描述性标题-添加的sapsma3序列atggagttcgtggcgaagctcttcaagttcttcaaggacctgctcgggaagttcctggggaataactgaseqidno:17dna属/种-金黄色葡萄球菌描述性标题-添加的sapamb2序列atgaccggcctggccgaggcgatcgcgaataccgtccaggcggcccagcagcacgacagcgtcaagctgggcacctcgatcgtggacatcgtcgccaacggcgtgggcctgctgggcaaactcttcggcttctgaseqidno:18dna属/种-表皮葡萄球菌描述性标题-添加的sepsma序列atggcggacgtcatcgccaagatcgtcgagatcgtgaagggcctgatcgaccagttcacccagaagtgaseqidno:19dna属/种-轻小病毒ms2描述性标题-添加的ms2l序列atggagacccggttcccgcagcagtcccagcaaaccccggccagcaccaaccgccgccgccccttcaagcacgaggactacccgtgccgccggcagcagcgcagctccaccctgtacgtgctgatcttcctggcgatcttcctgagcaagttcaccaaccagctgctgctgtccctgctggaggcggtcatccggaccgtcaccaccctgcagcagctgctgacctgaseqidno:20dna属/种-轻小病毒prr1描述性标题-添加的prr1l序列atgtgcaaggtgtctactaaggtagactctaaactgactgagtcagttggacaactcaccataaggagctacctatggctacggaatatcctagcattagcaggacttcttttcgtaatccttcttgcgaccaatcatttatccatcgctatctacagtccgtaaseqidno:21dna属/种-phikmv样病毒luz19描述性标题-luz19gp32启动子(p32)cgaccctgccctactccggccttaaacccacatccaaaagagagagaatcccseqidno:22dna属/种-phikmv样病毒luz19描述性标题-luz19gp32终止子(t32)tgccacgaaaccccgcacttcggtgtggggtttcttcaaagcctaacgacccgcgcagattccctgcgtgggtttttgcgctttaggagaaaccctseqidno:23dna属/种-phikmv样病毒luz19描述性标题-野生型luz19gp7区tacaaggtggtggcacccagctcggcggaaggtatcattgtgctggcgaccaagcagacgccggcgctagcccaagcagccgtcgtactgcacagcatgaaccctgcgcagtatcccgcaggttcggctatcctcaacacggcctggaagtgccgccgcctgggagtgggcgagtacgtcaagctcgtccaaggggaggaggacseqidno:24dna属/种-phikmv样病毒luz19描述性标题-野生型luz19gp18区gaatgccaaccgaagaagaacgcatgatccgctgtttactggcggatatccacgagccactggacctgctgttccccggcctccgtaccaaggcccatatggacccgcaagcagaggaactgtcgattcgaattgactacgaccatgcgaagctgggccgtatgggattctgccacgcggtatccctatatcaactgtccatatatggccgcgaggggatggtccgctacctgatgcaggagattccccgccgcgtgctggaaggtctgctggtcaaggcgcagcagtacagccaaagcaactggtacagcaaatgacgacseqidno:25dna属/种-phikmv样病毒luz19描述性标题-野生型luz19gp49和gp48-gp49基因间区域ggggacaccatgagcaaagccaaactacgagtcatcgccgacaccccggagctggagtcagtgctaaaagcattgctgaccgccacctacgctatcgaggacctgctcaacgaggccgtggctagcaaggtgctaaactcccgcctgggctggtccgcagtcggcgagtatgtcgaactgttcaaccgcacgcaatcccgcgtggccgggttgattcccgagtagseqidno:26dna属/种-phikmv样病毒lkd16描述性标题-野生型lkd16gp18基因gtgcgagtaccaactgaacacgagcgcaccctgcgctgcctgctccaagacatccacgggccgctgaatctgctgttcccaggtatccgggtgaaggtggaggaggcgtgcctcggatacttgggctacagggagcggggctattgggagctgcgcctccaggtggactacgaccacccgaagcttgggcacctccgctacagtcaggccgtgccggagtacgtgctgatcaacgaccgcgacagcatcatcaagtacctgatggaagcagtccctcggcaggtactagagggcatgctcaataaggcccaggaattcgtaaccaagaactggtattccctatgaseqidno:27dna合成(人工的/未知的)描述性标题-编码nls-flag-cas9-his的基因atgcccaagaaaaagcggaaggtcggcgactacaaggatgacgatgacaagttggagcctggagagaagccctacaaatgccctgagtgcggaaagagcttcagccaatctggagccttgacccggcatcaacgaacgcatacacgagacaagaagtactccatcgggctggacatcgggacgaactccgtgggatgggccgtgatcacagacgaatacaaggtgccttccaagaagttcaaggtgctggggaacacggacagacactccatcaagaagaacctcatcggggccttgctcttcgactccggagaaaccgccgaagcaacgcgattgaaaagaaccgccagaagacgatacacacgacggaagaaccgcatctgctacctccaggagatcttcagcaacgagatggccaaggtggacgactcgttctttcatcgcctggaggagagcttcctggtggaggaagacaagaaacatgagcgccacccgatcttcgggaacatcgtggacgaagtggcctaccacgagaaataccccacgatctaccacttgcgcaagaaactcgtggactccacggacaaagcggacttgcggttgatctacttggccttggcccacatgatcaaatttcggggccacttcctgatcgagggcgacttgaatcccgacaattccgacgtggacaagctcttcatccagctggtgcagacctacaaccagctcttcgaggagaaccccatcaatgcctccggagtggacgccaaagccatcttgtccgcccgattgtccaaatccagacgcttggagaacttgatcgcacaacttcctggcgagaagaagaacggcctcttcggcaacttgatcgcgctgtcgctgggattgacgcctaacttcaagtccaacttcgacttggccgaggacgccaagttgcaactgtccaaggacacctacgacgacgacctcgacaacctgctggcccaaattggcgaccaatacgcggacttgtttttggcggccaagaacttgagcgacgccatcttgttgagcgacatcttgcgcgtgaatacggagatcaccaaagcccctttgtccgcctctatgatcaagcggtacgacgagcaccaccaagacttgaccctgttgaaagccctcgtgcggcaacaattgcccgagaagtacaaggagatcttcttcgaccagtccaagaacgggtacgccggctacatcgacggaggagcctcccaagaagagttctacaagttcatcaagcccatcctggagaagatggacggcaccgaggagttgctcgtgaagctgaaccgcgaagacttgttgcgaaaacagcggacgttcgacaatggcagcatcccccaccaaatccatttgggagagttgcacgccatcttgcgacggcaagaggacttctacccgttcctgaaggacaaccgcgagaaaatcgagaagatcctgacgttcagaatcccctactacgtgggacccttggcccgaggcaattcccggtttgcatggatgacgcgcaaaagcgaagagacgatcaccccctggaacttcgaagaagtggtcgacaaaggagcatccgcacagagcttcatcgagcgaatgacgaacttcgacaagaacctgcccaacgagaaggtgttgcccaagcattcgctgctgtacgagtacttcacggtgtacaacgagctgaccaaggtgaagtacgtgaccgagggcatgcgcaaacccgcgttcctgtcgggagagcaaaagaaggccattgtggacctgctgttcaagaccaaccggaaggtgaccgtgaaacagctgaaagaggactacttcaagaagatcgagtgcttcgactccgtggagatctccggcgtggaggaccgattcaatgcctccttgggaacctaccatgacctcctgaagatcatcaaggacaaggacttcctggacaacgaggagaacgaggacatcctggaggacatcgtgctgaccctgaccctgttcgaggaccgagagatgatcgaggaacggttgaaaacgtacgcccacttgttcgacgacaaggtgatgaagcagctgaaacgccgccgctacaccggatggggacgattgagccgcaaactgattaatggaattcgcgacaagcaatccggaaagaccatcctggacttcctgaagtccgacgggttcgccaaccgcaacttcatgcagctcatccacgacgactccttgaccttcaaggaggacatccagaaggcccaagtgtccggacaaggagactccttgcacgagcacatcgccaatttggccggatcccccgcaatcaaaaaaggcatcttgcaaaccgtgaaagtggtcgacgaactggtgaaggtgatgggacggcacaagcccgagaacatcgtgatcgaaatggcccgcgagaaccaaaccacccaaaaaggacagaagaactcccgagagcgcatgaagcggatcgaagagggcatcaaggagttgggctcccagatcctgaaggagcatcccgtggagaatacccaattgcaaaacgagaagctctacctctactacctccagaacgggcgggacatgtacgtcgaccaagagctggacatcaaccgcctctccgactacgatgtggatcatattgtgccccagagcttcctcaaggacgacagcatcgacaacaaggtcctgacgcgcagcgacaagaaccggggcaagtctgacaatgtgccttccgaagaagtcgtgaagaagatgaagaactactggcggcagctgctcaacgccaagctcatcacccaacggaagttcgacaacctgaccaaggccgagagaggaggattgtccgagttggacaaagccggcttcattaaacgccaactcgtggagacccgccagatcacgaagcacgtggcccaaatcttggactcccggatgaacacgaaatacgacgagaatgacaagctgatccgcgaggtgaaggtgatcacgctgaagtccaagctggtgagcgacttccggaaggacttccagttctacaaggtgcgggagatcaacaactaccatcacgcccatgacgcctacctgaacgccgtggtcggaaccgccctgatcaagaaataccccaagctggagtccgaattcgtgtacggagattacaaggtctacgacgtgcggaagatgatcgcgaagtccgagcaggagatcggcaaagccaccgccaagtacttcttttactccaacatcatgaacttcttcaagaccgagatcacgctcgccaacggcgagatccgcaagcgccccctgatcgagaccaacggcgagacgggagagattgtgtgggacaaaggaagagattttgccacagtgcgcaaggtgctgtccatgcctcaggtgaacatcgtgaagaagaccgaggtgcaaacaggagggttttccaaagagtccattttgcctaagaggaattccgacaagctcatcgcccgcaagaaggactgggaccccaagaagtacgggggcttcgactcccccacggtggcctactccgtgttggtggtggccaaagtggagaaagggaagagcaagaagctgaaatccgtgaaggagttgctcggaatcacgatcatggaacgatcgtcgttcgagaaaaaccccatcgacttcctcgaagccaaagggtacaaagaggtgaagaaggacctgatcatcaagctgcccaagtactccctgttcgagctggagaacggccgcaagcggatgctggcctccgccggggaactgcagaaagggaacgaattggccttgccctccaaatacgtgaacttcctctacttggcctcccattacgaaaagctcaaaggatcccctgaggacaatgagcagaagcaactcttcgtggaacaacacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagcgcgtgatcctcgccgacgccaacctggacaaggtgctctccgcctacaacaagcaccgcgacaagcctatccgcgagcaagccgagaatatcattcacctgtttaccctgacgaatttgggagcccctgccgcctttaaatactttgacaccaccatcgaccgcaaaagatacacctccaccaaggaagtcttggacgccaccctcatccaccagtccatcacgggcctctacgagacgcgcatcgacctctcccaattgggcggcgaccatcatcaccaccaccactaaseqidno:28dna属/种-丝状病毒(inovirus)m13mp18描述性标题-被替代的野生型m13mp18区atgaccatgattacgaattcgagctcggtacccggggatcctctagagtcgacctgcaggcatgcaagcttggcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgctttgcctggtttccggcaccagaagcggtgccggaaagctggctggagtgcgatcttcctgaggccgatacggtcgtcgtcccctcaaactggcagatgcacggttacgatgcgcccatctacaccaacgtaacctatcccattacggtcaatccgccgtttgttcccacggagaatccgacgggttgttactcgctcacatttaatgttgatgaaagctggctacaggaaggccagacgcgaattatttttgatggcgttcctattggttaaseqidno:29dna未知的/人工的-可从dna2.0商购获得的描述性标题-paprika序列atggtgtcaaagggagaagaactgatcaaagagaatatgaggatgaaactctacatggaaggaactgtgaacaaccaccatttcaagtgcacgagcgagggtgaagggaaaccttacgaaggtacccagaccatgcggattaaggtcgtcgaaggaggaccactccccttcgcattcgacatcctggccacttccttcatgtacgggtcgcgcactttcatcaagtacccaaaagggatccccgacttcttcaagcagtcctttccggagggattcacttgggaacgcgtcactagatacgaggatggcggagtggtcaccgtgatgcaagacacctctttggaagatggatgcctggtgtaccacgtgcaagtcagaggagtgaactttccgagcaatgggccggtgatgcagaagaaaaccaagggctgggaaccgaacaccgaaatgctgtatccagcagacggaggcttggagggccggtccgacatggctctgaagcttgttggaggaggacatctgtcctgctcgttcgtgacgacctaccggagcaagaagccggcgaaaaaccttaagatgccggggatccacgcggtggatcatcgcctggaaaggctcgaggagtcagacaacgagatgtttgtcgtgcaacgcgagcacgccgtggcccgctactgtgatctcccttcaaagctgggccacaagctgaattccggcctccggtcgagagcccaggcttcgaattcagccgtggacggaactgcgggccctggttcgaccggaagccgatgaseqidno:30dna属/种-λ样λ描述性标题-野生型大肠杆菌噬菌体λcii序列atggttcgtgcaaacaaacgcaacgaggctctacgaatcgagagtgcgttgcttaacaaaatcgcaatgcttggaactgagaagacagcggaagctgtgggcgttgataagtcgcagatcagcaggtggaagagggactggattccaaagttctcaatgctgcttgctgttcttgaatggggggtcgttgacgacgacatggctcgattggcgcgacaagttgctgcgattctcaccaataaaaaacgcccggcggcaaccgagcgttctgaacaaatccagatggagttctgaseqidno:31蛋白质合成(人工的/未知的)描述性标题-从seqidno:27翻译的nls-flag-cas9-his蛋白质mpkkkrkvgdykddddklepgekpykcpecgksfsqsgaltrhqrthtrdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehlanlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmlakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhirdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdhhhhhhseqidno:32dna属/种-巨细胞病毒hcmv描述性标题-编辑后hcmvrl13片段atggactggcgatttacggttacgtggacgatactaatgtccgcgttgtcagaaagctgcaatcaaacctgttcttgtcaatgtccctgtagtactaccgttaactattcaactagtactgagacagccacatcaacatacagtacaacagttatcagcaataaaagcacttcagaatctataaattgctctactgcaactacaccagcaaacaccgtttctacaaaaccgtcggaaacaaccacacagatatccacaacgacgaacacaaacgttgagactaccacatgtaccaacaccaccacgaccgttacttgtgatggtttcaattatacagtccataaaagatgcgatcgcagttacgaggtaatcaacgtaacaggatacgttggtagcaacataactctaaaaaaatgcaatcagactgagaaatggcacaatgtagactggattcattatgagtaccccacgcataaaatgtgcgaattaggcaactatcaccaaaccacaccacggcacgacatatgttttgactgcaacgacacctccctaactatctacaacttaaccacaaaaaacgctggaaaatataccaggcgtcaccgtgataacggtcaagaagaaaattactacgtaacggtgttaattggagacacaacgttattcactcttggcacatgccctgtaagatataaagaatctacgaacactgaaaacaccattggaagtagcatcatagaaaccattgagaaagctaacattcccctgggaattcatgctgtatgggcaggcgtagtggtatcagtggcgcttatagcgttgtacatgggtagccatcgcattcccaaaaagccgcattacaccaaacttcccaaatatgatccagatgaattttggactaaggcttaaseqidno:33dna属/种-巨细胞病毒hcmv描述性标题-编辑前hcmvrl13片段atggactggcgatttacggttacgtggaccgttacttgtgatggtttcaattatacagtccataaaagatgcgatcgcagttacgaggtaatcaacgtaacaggatacgttggtagcaacataactctaaaaaaatgcaatcagactgagaaatggcacaatgtagactggattcattatgagtaccccacgcataaaatgtgcgaattaggcaactatcaccaaaccacaccacggcacgacatatgttttgactgcaacgacacctccctaactatctacaacttaaccacaaaaaacgctggaaaatataccaggcgtcaccgtgataacggtcaagaagaaaattactacgtaacggtgttaattggagacacaacgttattcactcttggcacatgccctgtaagatataaagaatctacgaacactgaaaacaccattggaagtagcatcatagaaaccattgagaaagctaacattcccctgggaattcatgctgtatgggcaggcgtagtggtatcagtggcgcttatagcgttgtacatgggtagccatcgcattcccaaaaagccgcattacaccaaacttcccaaatatgatccagatgaattttggactaaggcttaaseqidno:34蛋白质属/种-phikmv样病毒luz19描述性标题-野生型luz19gp13蛋白质序列mlalgafdlsglmvgsclvvggelkalcvddrhsrqgigaelvraaelagaeyltcfeflepfyadlgwstthreanwtagepdvlhmrapghdvseqidno:35蛋白质属/种-phikmv样病毒luz19描述性标题-野生型luz19gp38蛋白质序列marfknpetihvadgveavfsldfpflrredvfvqvdkilvtdytwvddtniqlavvpkkdqevrifrdtpaqvpdtqfsqdipflpryidannkqllyavqegintanlaldgvldairiaeearrlaqealdaanealrralgfaeirtvtedsdidpswrgywnrcitadkpltltmqmedpdapwvefsevhfeqagvrdlnivagpgvtinrlqnttmqlygengvctlkrlganhwivfgamedeseqidno:36蛋白质属/种-phikmv样病毒luz19描述性标题-野生型luz19gp40蛋白质序列mfktevkgrytlirrkadgtpvetlefdniitnagldwiaamdtdlmgepvavststadpnpsapaipevvqrtsasapgggttsgldgewlfwrrrwrfpqgtlagqvlatvglicnsdrrfesntgelipkdtplsytrikdaagqpttlvvaadeildvqyefrsrpvgtaeakfvisgvertfrlipkpfanranlsgeryifyntnpyingkdasggnvrdgqwqkkypkyvrgsykaqitllaqvqngnmaggitgteelqiyngrnyvldinppvvknntqeftvtleftvaraseqidno:37蛋白质属/种-铜绿假单胞菌描述性标题-pyos5蛋白质序列msndnevpgsmvivaqgpddqyayevppidsaavagnmfgdliqreiylqkniyypvrsifeqgtkekkeinkkvsdqvdgllkqitqgkreatrqervdvmsavlhkmesdlegykktftkgpfidyekqsslsiyeawvkiweknsweerkkypfqqlvrdeleravayykqdslseavkvlrqelnkqkalkekedlsqlerdyrtrkanlemkvqseldqagsalpplvsptpeqwleratrlvtqaiadkkqlqttnntliknsptplekqkaiyngellvdeiaslqarlvklnaettrrrteaerkaaeeqalqdaikftadfykevtekfgartsemarqlaegargknirssaeaiksfekhkdalnkklslkdrqaiakafdsldkqmmakslekfskgfgvvgkaidaaslyqefkistetgdwkpffvkietlaagaaaswlvgiafatatatpigilgfalvmavtgamidedllekannlvisiseqidno:38蛋白质属/种-phikmv样病毒lkd16描述性标题-lkd16gp18蛋白质序列mrvptehertlrcllqdihgplnllfpgirvkveeaclgylgyrergywelrlqvdydhpklghlrysqavpeyvlindrdsilkylmeavprqvlegmlnkaqefvtknwyslseqidno:39蛋白质属/种-phikmv样病毒lka1描述性标题-lka1gp49蛋白质序列maqtpstwadyvgdgvedtfqvtfpyqkqqevfvtvggdpaafifisagwiqlaavpvngaairvrrsteafeprhefangvpllprfidenntqflytvqeavnethgiasealsvaeeargiaqaasdkvdaatidsahqlrldladpakgpgllgydrdvsypvgsvgqslqflemgrvtpaqfgavgdgashplseryatlaeaqtvyphavalsdeidwaalqaavdsgapvhipsgdyqinrgisstgslqiagdgatsiirptaaftgtsvlscvgslvalpnissvsagsltidfastpnlvagdvfiiynptdssfsgfrtsyragefcevravsgntvtirsalyaaydgatvaiykvvsgvvdiasiqivggtvpmngllveavvsprvddvtvtlannagvyfarcydakitnsnisnigdggddygiifgnchdggadnckvyarrhaiatggdaevgcvpvrnvrmrnctlrnditsgthcadfhgnaedcsyenctiyggatwqgkdisyrhctitnasggwivisaeilggtflldqctlyttgdpqpgnrgvidvggnsavlttnttqpcnfliqggslrapslstssyllrarlegstvpvniqysgqaidvgslgkvlqlditsgstspeylivenlaglpsgitlasaaggfasapmrmpvlggrvqvttatnassvtapvtfryiypkaptvqvtktdrsyagnrvgvaianptsasgatlglftddgtnfssavtnqlnwqagiyevseqidno:40蛋白质属/种-phikmv样病毒ntuh-k2044-k1-1描述性标题-ntuh-k2044-k1-1gp34蛋白质序列malirlvapervfsdlasmvaypnfqvqdkitllgsaggdftftttasvvdngtvfavpggyllrkfvgpaysswfsnwtgivtfmsapnrhlvvdtvlqatsvlniksnstleftdtgrilpdaavarqvlnitgsapsvfvplaadaaagskvitvaagalsavkgtylylrsnklcdggpntygvkisqirkvvgvstsggvtsirldkalhynyylsdaaevgiptmvenvtlvspyinefgyddlnrfftsgisanfaadlhiqdgviignkrpgasdiegrsaikfnncvdstvkgtcfynigwygvevlgcsedtevhdihamdvrhaislnwqstadgdkwgepieflgvnceaysttqagfdthdigkrvkfvrcvsydsaddgfqartngveylncrayraamdgfasntgvafpiyreclaydnvrsgfncsygggyvydceahgsqngvringgrvkggrytrnssshifvtkdvaetaqtsleidgvsmrydgtgravyfhgtvgidptlvsmsnndmtghglfwallsgytvqptpprmsrnllddtgirgvatlvageatvnarvrgnfgsvansfkwvsevkltrltfpssagaltvtsvaqnqdvptpnpdlnsfvirssnaadvsqvawevylseqidno:41蛋白质属/种-t7-样pp15描述性标题-pp15gp44蛋白质序列martivqnaltggqqdfevpfdyilqrfvkltligdgnrqelvlgtdfrfigprtvrtnvfwgpaqgytsieirrvtsasdrrvefsdgsiltagdlniaqlqaihiaeeardsatenlspdadgnydargariynlgdavqpkdavnrytldlaiaaalamntgnpnnaqnisytpngpgqsirsvegrlrdavfvsdymttprdgvtsnqqdlekalaaanakgadlfwpddipffstsplalihavyhvgrgvinangtlfyvnpkngqhnrlhvspggtgdglaagrplgtiwsalaalnmraplttrwslemtagayneavtlpnyltscndylafnwpntgqermeptaypsaldgtgqtgltgfhtgignritinnvcmsnwydtalttqqvrrafvvgaystayvvncafiyngiasvsvlpggtaivtggivdggrfgldntggrlsltatksnytqvrncleyglyskhdastvmdntefrncgnhpaavaygaaifaykfncsvdtrgvkfygnniaqhcrggitsdnpgdpdiygtgadankrlflctgggsddiqfyearrvmditkrtgggsttasvsslllaavasvrkgyfahndqvirmtlmfratgsagiftptlrtplgtiplgsfrvasgqygeikltirptltsdglivgfscinavqnlgssvgqiivsgtvdlrtvdqlvemwgyseaggtasyiqglielvgseqidno:42蛋白质属/种-伴放线菌聚集菌描述性标题-dspb蛋白质序列mnccvkgnsiypqktstkqtglmldiarhfyspeviksfidtislsggnflhlhfsdhenyaieshllnqraenavqgkdgiyinpytgkpflsyrqlddikayakakgielipeldspnhmtaifklvqkdrgvkylqglksrqvddeiditnadsitfmqslmsevidifgdtsqhfhiggdefgysvesnhefityanklsyflekkglktrmwndglikntfeqinpnieitywsydgdtqdkneaaerrdmrvslpellakgftvlnynsyylyivpkasptfsqdaafaakdviknwdlgvwdgrntknrvqntheiagaalsiwgedakalkdetiqkntkslleavihktngdeseqidno:43蛋白质属/种-金黄色葡萄球菌描述性标题-sapsma3蛋白质序列mefvaklfkffkdllgkflgnnseqidno:44蛋白质属/种-金黄色葡萄球菌描述性标题-sapamb2蛋白质序列mtglaeaiantvqaaqqhdsvklgtsivdivangvgllgklfgfseqidno:45蛋白质属/种-表皮葡萄球菌描述性标题-sepsma蛋白质序列madviakiveivkglidqftqkseqidno:46蛋白质属/种-轻小病毒ms2描述性标题-ms2l蛋白质序列metrfpqqsqqtpastnrrrpfkhedypcrrqqrsstlyvliflaiflskftnqlllslleavirtvttlqqlltseqidno:47蛋白质属/种-轻小病毒prr1描述性标题-prr1l蛋白质序列mckvstkvdskltesvgqltirsylwlrnilalagllfvillatnhlsiaiyspseqidno:48蛋白质属/种-phikmv样病毒luz19描述性标题-luz19gp18蛋白质序列mrmpteeermirclladihepldllfpglrtkahmdpqaeelsiridydhaklgrmgfchavslyqlsiygregmvrylmqeiprrvlegllvkaqqysqsnwyskseqidno:49蛋白质属/种-phikmv样病毒luz19描述性标题-luz19gp49蛋白质序列mskaklrviadtpelesvlkalltatyaiedllneavaskvlnsrlgwsavgeyvelfnrtqsrvaglipeseqidno:50dna属/种-phikmv样病毒luz19描述性标题-luz19gp18基因序列atgagaatgccaaccgaagaagaacgcatgatccgctgtttactggcggatatccacgagccactggacctgctgttccccggcctccgtaccaaggcccatatggacccgcaagcagaggaactgtcgattcgaattgactacgaccatgcgaagctgggccgtatgggattctgccacgcggtatccctatatcaactgtccatatatggccgcgaggggatggtccgctacctgatgcaggagattccccgccgcgtgctggaaggtctgctggtcaaggcgcagcagtacagccaaagcaactggtacagcaaatgaseqidno:51dna属/种-phikmv样病毒luz19描述性标题-luz19gp49蛋白质序列atgagcaaagccaaactacgagtcatcgccgacaccccggagctggagtcagtgctaaaagcattgctgaccgccacctacgctatcgaggacctgctcaacgaggccgtggctagcaaggtgctaaactcccgcctgggctggtccgcagtcggcgagtatgtcgaactgttcaaccgcacgcaatcccgcgtggccgggttgattcccgagtag序列表<110>合成基因组股份有限公司c•g•迪皮特里洛k•c•凯蒂m•e•巴尔布<120>用于体外病毒基因组工程的组合物和方法<130>sgi1840-3wo<150>us62/092,707<151>2014-12-16<150>us62/102,362<151>2015-01-15<150>us62/242,811<151>2015-10-16<160>51<170>patentin3.5版<210>1<211>288<212>dna<213>phikmv样病毒luz19<220><221>misc_feature<223>野生型luz19gp13<400>1gtgctggccctcggtgccttcgacctgtccggcctgatggtaggttcctgcctcgtagta60ggtggtgagctgaaggccctgtgcgttgatgaccggcacagcaggcagggtatcggcgct120gagctggtacgggccgctgagctggctggtgccgagtatctgacctgcttcgagttcctg180gagccgttctacgccgacttgggctggagcaccacccaccgcgaggcgaactggacagca240ggagagccggacgtgctgcacatgagggcacccggtcatgacgtatga288<210>2<211>756<212>dna<213>phikmv样病毒luz19<220><221>misc_feature<223>野生型luz19gp38<400>2gtggctcggttcaagaatcccgagaccatccacgttgcagatggggtcgaggctgtcttc60agtctcgacttcccgttcctgcggcgtgaggacgtattcgtccaggtcgataagatactc120gtcaccgactatacgtgggtagacgacaccaacatccaattggccgtggtgccgaagaag180gaccaagaggtccgcatcttccgcgacacgcccgcccaggtcccggacacacagttcagc240caggacatcccgttcctgcctcgatacatcgacgcgaacaacaagcagctcctgtacgct300gtgcaggaaggcatcaacaccgcgaacctcgctctcgatggcgtactcgacgcgatccgt360atcgccgaggaggctcgtcgcctggcgcaggaagcactcgacgccgccaatgaggcgctt420cgccgtgccctgggcttcgctgagattcgcaccgtgaccgaggactcggacatcgatccg480agctggcgcggttactggaaccgttgcatcaccgccgataaacctctgaccctgaccatg540cagatggaagacccggatgcaccgtgggtcgagttcagcgaggttcacttcgagcaggcc600ggtgtgcgtgacctaaacatcgtagccggtcctggcgttaccatcaaccgtttgcagaac660accaccatgcagctctacggcgagaatggcgtgtgtactctcaagcggctgggcgctaac720cactggatcgtgttcggggccatggaggacgaataa756<210>3<211>906<212>dna<213>phikmv样病毒luz19<220><221>misc_feature<223>野生型luz19gp40<400>3atgtttaagaccgaagtaaagggacgttacaccctgattcgccgcaaggcggacggcact60ccggtggagactctggagttcgacaacatcattacgaatgcgggcctggattggatcgcc120gctatggataccgacctcatgggcgaacccgtagcggtcagcacttctacagccgatccc180aacccgagcgcacccgccatcccggaggttgtgcaacgcacgtccgcatctgcccctggt240ggaggtactacgtcgggcctggatggcgagtggctgttctggcggaggcgttggagattc300ccgcagggcaccctagctggtcaagtcctggccaccgtgggcctcatctgcaactcggat360cgtcgcttcgagagtaacacgggtgagctgatcccgaaggataccccgctgtcgtacact420cgcatcaaggacgccgccgggcagcctactactctggtggtggccgctgacgagattctg480gatgtccagtacgagttccgcagccggcccgtaggaacggctgaggccaagttcgtgatc540tccggcgtggaacgcaccttccggctgatcccaaagccttttgcgaaccgtgctaatctc600tccggggaacgctacatcttctacaacaccaacccctacatcaacggcaaggacgcctcc660ggcggcaatgtccgagacggtcagtggcagaagaaatatcccaagtacgtgcgcggctcc720tacaaggcgcagatcacgctgctggcccaggtccagaacggcaatatggctggcggcatc780accggcaccgaggaactccagatttacaatggacgtaactatgtgctcgatatcaacccg840cctgttgtgaagaacaatacccaggagttcaccgtgaccctggagtttacggtggcgagg900gcataa906<210>4<211>2481<212>dna<213>phikmv样病毒luz19<220><221>misc_feature<223>野生型luz19gp34<400>4atgagctacaagcaatccgcgtatcccaatctgctgatgggtgtgagccagcaggtgccc60ttcgagcgcctgccgggccagctcagcgagcagatcaacatggtatccgatcccgtgtca120ggacttcggcggcgcagcggtatcgagctgatggcccacctgctgcataccgaccagccc180tggccgaggccgttcctctaccacacgaacctcggtggccgcagcattgcgatgctggtg240gcgcagcaccgtggcgagctgtacctgttcgacgagcgggacggtcgcctgctgatgggt300cagcccctggtgcatgactacctcaaggccaacgattacaggcagctacgggccgccacg360gtggccgatgacctgttcatcgccaacctgagtgtaaagcccgaggccgaccgcaccgac420atcaagggcgtagaccccaacaaggccggctggctgtacatcaaggcaggccagtattcg480aaggcattctccatgaccatcaaggtcaaggacaacgccaccggcaccacctacagccac540acggccacctacgtgacgccggacaacgccagcacgaaccccaacctcgctgaggcgcca600ttccaaacgagcgtaggctacatcgcgtggcagctctacggcaagttcttcggtgcgccg660gagtacactctgcccaactcgacgaagaagtacccgaaggtagacccggacgccaacgcg720gcaaccatagccggttacctcaaccaacggggcgtgcaggacgggtacatcgcgttccgt780ggcgacgccgatatccacgttgaagtgtccacggacatgggcaacaactacggcatagcc840tccggcggtatgagcctcaacgccacggcagacctgccggccttactgccgggcgcgggt900gctcctggcgtgggtgtgcagttcatggacggcgctgtcatggccaccggctccaccaag960gccccggtatacttcgagtgggattccgctaaccgccgctgggcagagcgggccgcctac1020ggcaccgattgggtcctgaagaagatgccactggccctgcgctgggatgaggctaccgac1080acctacagcttgaacgagctggagtatgatcgacgtggctccggcgacgaggatacgaac1140cccacgttcaacttcgtcacccgaggcatcaccggcatgacgaccttccagggtcgcctc1200gtcctcctgtcgcaggagtacgtctgcatgtcggccagtaacaatccacaccgctggttc1260aagaagtcggcagccgcgctgaacgacgatgatcctatcgagatcgcagcccaggggagc1320ctgactgaaccgtacgagcacgcggtcaccttcaacaaggacttgatcgtcttcgccaag1380aagtatcaggccgtggtccccggtggcggcattgtaactccccggacggcggttatcagc1440atcaccacgcagtacgacctcgataccagggcggcacctgccgtgactggccgcagtgtg1500tacttcgctgcggagcgtgccctgggtttcatgggcctgcatgagatggccccgtctccg1560tccacggacagccactacgtcgccgaagacgttaccagccacatcccgagctacatgccg1620gggcctgctgagtacatccaggcggcggcctccagcggctacctggtgttcggcaccagc1680acggcggacgagatgatctgccaccagtacctctggcagggcaacgagaaagtgcagaac1740gcgtttcatcgctggacgttgcggcatcagatcatcggcgcctacttcactggtgacaac1800ctgatggttctgattcagaagggccaggagatcgccctgggacggatgcacctgaacagc1860ctgccagcccgtgagggtctgcaataccctaaatacgactactggcggcgtatcgaggcg1920accgtcgatggtgagctggaactgaccaagcagcattgggacctgatcaaggatgcctct1980gccgtgtaccagctacagcctgtggccggcgcctacatggagcgtacccatctcggcgtg2040aagcgcgagacgaatacgaaggtgttcctcgacgtgcccgaggccgtggtcggggcggtg2100tatgtggtcggctgcgagttctggtcgaaggtggagttcactccgccggttctccgggac2160cacaatggcctgcccatgacctcgacccgtgcagtgcttcatcggtacaacgtaaacttc2220ggctggaccggcgagttcctgtggcgcatcagcgacacggctcgacccaaccagccgtgg2280tacgacacgacgcccctccggttgttcagccggcaactcaatgccggggagcctctggtg2340gatagcgctgtggtgccgctgccggcacgggtcgatatggccacgtccaagttcgagctg2400agctgtcacagtccgtacgacatgaacgttcgggctgtcgagtacaacttcaagtccaac2460caaacctacaggagggtgtga2481<210>5<211>826<212>prt<213>phikmv样病毒luz19<220><221>misc_feature<223>野生型luz19gp34蛋白<400>5metsertyrlysglnseralatyrproasnleuleumetglyvalser151015glnglnvalprophegluargleuproglyglnleusergluglnile202530asnmetvalseraspprovalserglyleuargargargserglyile354045gluleumetalahisleuleuhisthraspglnprotrpproargpro505560pheleutyrhisthrasnleuglyglyargserilealametleuval65707580alaglnhisargglygluleutyrleupheaspgluargaspglyarg859095leuleumetglyglnproleuvalhisasptyrleulysalaasnasp100105110tyrargglnleuargalaalathrvalalaaspaspleupheileala115120125asnleuservallysproglualaaspargthraspilelysglyval130135140aspproasnlysalaglytrpleutyrilelysalaglyglntyrser145150155160lysalaphesermetthrilelysvallysaspasnalathrglythr165170175thrtyrserhisthralathrtyrvalthrproaspasnalaserthr180185190asnproasnleualaglualapropheglnthrservalglytyrile195200205alatrpglnleutyrglylysphepheglyalaproglutyrthrleu210215220proasnserthrlyslystyrprolysvalaspproaspalaasnala225230235240alathrilealaglytyrleuasnglnargglyvalglnaspglytyr245250255ilealapheargglyaspalaaspilehisvalgluvalserthrasp260265270metglyasnasntyrglyilealaserglyglymetserleuasnala275280285thralaaspleuproalaleuleuproglyalaglyalaproglyval290295300glyvalglnphemetaspglyalavalmetalathrglyserthrlys305310315320alaprovaltyrpheglutrpaspseralaasnargargtrpalaglu325330335argalaalatyrglythrasptrpvalleulyslysmetproleuala340345350leuargtrpaspglualathraspthrtyrserleuasngluleuglu355360365tyraspargargglyserglyaspgluaspthrasnprothrpheasn370375380phevalthrargglyilethrglymetthrthrpheglnglyargleu385390395400valleuleuserglnglutyrvalcysmetseralaserasnasnpro405410415hisargtrpphelyslysseralaalaalaleuasnaspaspasppro420425430ilegluilealaalaglnglyserleuthrgluprotyrgluhisala435440445valthrpheasnlysaspleuilevalphealalyslystyrglnala450455460valvalproglyglyglyilevalthrproargthralavalileser465470475480ilethrthrglntyraspleuaspthrargalaalaproalavalthr485490495glyargservaltyrphealaalagluargalaleuglyphemetgly500505510leuhisglumetalaproserproserthraspserhistyrvalala515520525gluaspvalthrserhisileprosertyrmetproglyproalaglu530535540tyrileglnalaalaalaserserglytyrleuvalpheglythrser545550555560thralaaspglumetilecyshisglntyrleutrpglnglyasnglu565570575lysvalglnasnalaphehisargtrpthrleuarghisglnileile580585590glyalatyrphethrglyaspasnleumetvalleuileglnlysgly595600605glngluilealaleuglyargmethisleuasnserleuproalaarg610615620gluglyleuglntyrprolystyrasptyrtrpargargilegluala625630635640thrvalaspglygluleugluleuthrlysglnhistrpaspleuile645650655lysaspalaseralavaltyrglnleuglnprovalalaglyalatyr660665670metgluargthrhisleuglyvallysarggluthrasnthrlysval675680685pheleuaspvalproglualavalvalglyalavaltyrvalvalgly690695700cysgluphetrpserlysvalgluphethrproprovalleuargasp705710715720hisasnglyleuprometthrserthrargalavalleuhisargtyr725730735asnvalasnpheglytrpthrglyglupheleutrpargileserasp740745750thralaargproasnglnprotrptyraspthrthrproleuargleu755760765pheserargglnleuasnalaglygluproleuvalaspseralaval770775780valproleuproalaargvalaspmetalathrserlysphegluleu785790795800sercyshisserprotyraspmetasnvalargalavalglutyrasn805810815phelysserasnglnthrtyrargargval820825<210>6<211>1497<212>dna<213>铜绿假单胞菌<400>6atgtccaatgacaacgaagtacctggttccatggttattgtcgcacaaggtccagacgat60caatacgcatacgaggttccccctatcgatagcgcggccgttgccgggaatatgtttggc120gacttaattcaaagagaaatatatctacagaaaaacatttattatccagtccgatctatt180tttgaacaaggaacaaaagaaaagaaggagatcaacaagaaagtatctgatcaagtcgat240ggcttgctaaagcagatcactcaaggaaaaagggaggccacaaggcaagagcgagtcgat300gtcatgtcggcagtcctgcacaagatggaatctgatcttgaaggatacaaaaagaccttt360accaaaggcccattcattgactacgaaaagcagtcaagcctctccatctatgaggcctgg420gtcaagatctgggagaagaactcttgggaagaaagaaagaagtacccttttcagcagctt480gttagagatgaactggagcgggcggttgcctactacaaacaagattcactctctgaagcg540gtaaaagtgctaagacaggagctcaacaagcaaaaagcgctaaaggaaaaagaggacctc600tctcaactggagcgggactacagaacccgaaaggcgaatctcgagatgaaagtacaatcc660gagcttgatcaagcgggaagtgctttgcctccattggtcagtccaacgccagagcaatgg720cttgaacgtgccacaagactggttacgcaagcaattgctgataaaaagcagctgcagacc780acaaacaatactcttatcaagaattccccaacccctctagaaaagcagaaagccatctac840aatggtgagctacttgtggatgagatagccagtctacaggcccgcttagttaagctgaac900gccgaaacgacacgacgcaggacagaagcagaacgcaaggcggccgaggaacaagcgttg960caagatgctattaaatttactgccgacttttataaggaagtaactgagaaatttggcgca1020cgaacatcggagatggcgcgccaactggccgaaggcgccagggggaaaaatatcaggagt1080tcggcggaagcaatcaagtcgtttgaaaagcacaaggatgcgttaaataaaaaacttagc1140cttaaagataggcaagccattgccaaagcctttgattctctagacaagcagatgatggcg1200aagagccttgagaaatttagcaaaggctttggagttgtaggcaaagctattgacgccgcc1260agcctgtaccaagagttcaagatatctacggaaaccggggactggaaaccattctttgta1320aaaattgaaacactagctgctggtgcggccgccagttggcttgtgggtattgcatttgcc1380acggcaacagccactcctataggcattctggggttcgcactggtaatggcagttaccggg1440gcgatgattgacgaagaccttctagaaaaagcaaacaatcttgtaatatccatttaa1497<210>7<211>345<212>dna<213>phikmv样病毒lkd16<400>7gagtaccaactgaacacgagcgcaccctgcgctgcctgctccaagacatccacgggccgc60tgaatctgctgttcccaggtatccgggtgaaggtggaggaggcgtgcctcggatacttgg120gctacagggagcggggctattgggagctgcgcctccaggtggactacgaccacccgaagc180ttgggcacctccgctacagtcaggccgtgccggagtacgtgctgatcaacgaccgcgaca240gcatcatcaagtacctgatggaagcagtccctcggcaggtactagagggcatgctcaata300aggcccaggaattcgtaaccaagaactggtattccctatgacgac345<210>8<211>204<212>dna<213>phikmv样病毒phi-kf77<220><221>misc_feature<223>添加的phikf77gp7序列<400>8tacaaggtggtgacgcctagctcggcagagggcgccgttgtgctggcgaccaagcagacg60cctgccctcgctcaggcagtcatcgtactgcacagcatgaaccccgcgcagtacgcggtg120ggcacggccatactaaacacagactggcggtgccgccgcctgggtgccggcgagtacatc180aagctcgttcaaggggaggccgac204<210>9<211>60<212>dna<213>λ样λ<220><221>misc_feature<223>大肠杆菌噬菌体<400>9atggttcgtgcaaacaaacgcaacgaggctcgttctgaacaaatccagatggagttctga60<210>10<211>17757<212>dna<213>巨细胞病毒hcmv<220><221>misc_feature<223>编辑前hcmv片段<400>10acgacggccagtgaattgtaatacgactcactatagggcgaattcgagctcggtacccga60ttaccctgttatccctaccattccgggccgtgtgctgggtccccgaggggcgggggggtg120tttttagcgggggggtgaaatttggagtcttggagccgcgtgtgctgtggaggacggtga180cggtggtaagagtgtgctgcggtgcggttgggacggcggcggcgaataaaagcggcgtgc240ggcgcgcacggcgaaaagcagacgcgcgtctgtgttgtgtgtctttgaccgcggcggaac300acacgcggaaaagcgagtcccaggggacacacgacgagcgagtcccagggggggacgacg360acggccagggacgcggaaacgacgcggaaaagaggaagtccccagggggacgggcggaaa420agaggaagcgcctaggggaccgcgggggcaggaacagacgaagtacgccgcaacccgcgt480cgaggacacacgcagaagcggccgcccaggggagggggggggggggactcgcgggccccg540gggcacacttgttgttccctccggccgccgacacgcaccccgaagccgcgcacaccgccg600acacacccctgacacacccgcgacacacccgccacacgcccgacacacgcccgcgacaca660cccgaccgacacaccctgacacaccccgccaacacacccagccgcacccgccccgccaac720acacccccgacacacccgacacacgcccgcgacacacccggcacacacccacccacccag780ccgcgcccccgacacaccccgaacggcgccggtgcgggacagggctcacggaggtttgcg840ggccgtgagcacgcctccctttgtacacactaccggtgcgtggcgtcccacgctatttgt900tcgcgagaccggactaagggaggtttgcggtgcgtcagcgcggggcggcgtttgcggcgt960gtttcgaccagcgctttgtgcgcgctgcctgtgcgtgtcgtcccatggtctttgtcagcg1020gcacggcgctggggacggggtttcaccgcgctgagggatctttctgcgggtgtgagggac1080ggagcttttttcgcacgctgggcaccgggctgggggacggggggtgtgcgggacggcggt1140ggggccggggcgttgcgggtacggggattacgctgggaacggggactcgcggacccgggc1200tgagggacgggggtggcgggggtgtttgcggcgaggacgggggccttttgcggcggggac1260ggggactcaccctcgcctatttaacctccacccacttcaacacacacatgccgcacaatc1320atgccagccacagacacaaacagcacccacaccacgccgcttcacccagagtaccaacac1380acgttacccttacaccacagcaacacacaaccgcctatccaaacctcggacaaacacgcc1440aacgaagaacaccgcacgcagatggagctcgacgccgcggattacgctgcttgcgcgcag1500gcccgccaacacctctacgctcaaacacaaccccaactacacgcataccccaacgccaac1560cctcaggaaagcgctcatttttccacagaaaatcaacatcaactcacgcatctacttcac1620aacattggcgaaggcgcagcgctcggctaccccgtcccccgcgcggaaatccgccgcggc1680ggtggcgactgggccgacagcgcgagcgacttcgacgccgactgctggtgcatgtgggga1740cgcttcggaaccatgggccgccaacctatcgtgaccttactgttggcgcgccaacgcgac1800ggcctcgctgactggaacgtcgtacgctgccgcggcacaggctttcgcgcacacgattcc1860gaggacggcgtctctgtctggcgtcagcacttggtttttttactcggaggccacggccgc1920cgtgtacagttagaacgtccatccgcgggagaagcccaagctcgaggcctattgccacgc1980atccggatcacccccatctccacatctccacgcccaaaaccaccccagcccaccatatcc2040accgcatcgcacccacatgctacgactcgcccacatcacacgctctttcctatcccttct2100acaccctcagccacggttcacaatccccgaaactacgccgtccaacttcacgccgaaacg2160acccgcacatggcgctgggcacgacgcggtgaacgtggcgcgtggatgccggccgagaca2220tttacatgtcccaaggataaacgtccctggtagacggggtagggggatctaccagcccag2280ggatcgcgtatttcgccgccacgctgcttcaccgatatccaataaacccatcccctcgcc2340acgacgtctccgcgtatctttgtagcctcaggaatccgtccccacgtccatccatcccga2400gcactccacacgctataacagaccacggacacggcaaatgcatgcaaacttctcatttat2460tgtgtctactactctgtgttgctacagggagtgaagggggtgaaggcaaagaaaaaaaaa2520aggaacaaaataatagattagcagaaggaataatccgtgcgaccgagcttgtgcttcttt2580tcttataaggaggcaaatatactagggaaaacttaagaataggaagaaaccgaggtttgg2640gagaaaagctgagataaaatagcgcattttccatacagaggttgttgtttttgtggatcc2700taagaggtttcaagtgcgaatctcaaagttctcacgagaatattgtcttcaagaatcgac2760aactgtggtccaagatttttttttggtctttttaggttctgcgagggacatcacgatgga2820tcgttgcgatgaagtcacgcgtacgcctctggtgtggcgcggtgtcgtgacaggagagtg2880tgttttcagtgcagagctgtcttgattcctatatccgagtatctgttttctcgtaaggac2940ggtaatcttctttggtgtaagtacatctaaaagctgcaaactatattttaagggctgtct3000ctaggtgtactttgatgctggagtttttcgctgtgttgatgtgaataaatctactactac3060tattatatgcagaaagagtgattatgccgagacaagattgcattggctgaactgtttcaa3120aaacgcctacactctacttatccgtaaacctaaggtaatactatgtgtaagttgtttttt3180tttctttttgtagtaaaatggtgatacgtgcaattaaaactgtattccatgtttccatcc3240tttcatttcaactttaaaggcggctttgagagcgaagaagtgcgaggataaaaatggatg3300actccttcgtgtccagggagtcgactactgcaacgctgattgattaaaagatggtctccg3360atgatgatgttgttattgatcgaatcatggtgcagaacggcgacggagaggagcgtgtcc3420gccgccgggaaggtggtctctttctcttttcttttttcaagaaatcttccatgtgtttat3480cgtagtgatcgaaatcgactgatctcgggttctttttgttggtttcttttcggttaatca3540tgtattgttttctttttttacagaaagatacttttttcatgagcaattcctcgcccggcg3600ccggcatgccgaggtggggccactgcgatcagcggcatgccgacgccgacccggggatct3660tggattcaccgttttctctcttctctctctacatacagaccgggtggcaggagcggtaag3720gaatcatcgtcgtctttcattcttcgatgattatggtaatactaaatcttatctaggagc3780atatacatctaagattggagtactagtagtcgtttgtggtttctattttttttatattta3840tctatgacagtttttctgtttttcgttttgataataatataataaaaactcatggacgtg3900aaatctggcttggttgtggtgatttcattctcattattgttgttttctttccgtcttgcg3960gatgaagatgttgcgatgcggttgttgttggtgttgctatacaccgagagagatgatctt4020tttgttcttctggttcatttcctatgattgtttggctgctgaccgacgcgtcaggatgtg4080cagggcatgcggggaatcaggaccggacacgggataatttcatctacctatacggagatc4140gcggtcctcgccatgaggatcgcgacaggcgcgtcgagggggcaggaacacccttgcgga4200ttgacattcttggtggtgtttcgttgttgtcggtagttgttgttgacgatgaggataaat4260aaaaatgaccttgtttttgttctgttttctcttgttgggaatcgtcgactttgaattctt4320cgagttatcggaaagctgaggtacccaaatgtctgtagcttttttctttttaccctcttg4380tttatcatctgcgattcgtggtaggtaggagagggaaatgataatccgagattaaggaaa4440ggagaagataaaaaataaaaaaaaaataataaaacagaagccgaccggccgccgacccgt4500tccccaggaccagcctacgaggaatggataacgcggtggcgacggcagcggtggtggcgc4560tgggggtggcggcagtggtactgctgatggtagtcgggacggaggagaggcgatgcatac4620atacacgcgtgcatgctgcatgggtggatggtacggccgggagacgcggaagagaaactc4680acataaaaaggtgacaaaaagagcggttgaaaaaagaaaacgagattcgaccagacagaa4740gagaaggaccggggcttggcgacccttccacgactgctgttgtcatctcggctcccccgt4800cttctcccggccacgggcggctaagtcaccgccgttctccccatccgtccgagcgccgac4860cgaccagccggccgattcgcccgccggggcttctggagaacgccggggcagcagcgatct4920ggggaagccgctaaacccctgcgtttttatatggtagctctgccgagcgcgggctgacgc4980gttgagtaagcggaaagacgtgtgtgacgaaaaggggtcccatggtatttcacgtgacga5040tgaggagatgcggtttggagcacatacggtttagaaaaagggagttgtcgtgacaagggc5100tgagggacctctgtctccatgtgtgtataaaaagcaaggcacgttcataatgtaaaaaag5160aacacgttgtaaacaagctattgctgtatcattcggctgactatgcttcattcggactga5220ttttcttttcctaacggcgtaacttaaagtgattaacgtatgatatttgttccccagagt5280tatactatagtcatcatcctaaaattcagatataaatgaacacatgtcgtatgggattat5340taagaaaccgaaactctccacagttcaccatcttcttcgtcattcaaccgatgacccact5400ccgtacaacgaatcagtctgctgtgtcacactgcaaactactagcgacgtatgcaaacaa5460cttgaaacacgggctgttgtattgacgaccgttgtaccattactagtcacattgcataga5520gaccatccaccgtcatcccatctttcccacccgatggaaaaccgtcttctatcatcaact5580atggtaagatttcgaccctgcgaggtattcagtttccccatatccataacctggatttta5640tcattaaaccccaatattaaacacttttttagtacccccccacccaccaaaaaatgtgac5700tggaccggttcctagcagctctgggagccatgttcaggttgaaccacagctacagcgaaa5760ccgagtccagtgaccggtaaccacgtccagcccctgcgtatgtaccagtccaagcacgtc5820cggtcattgttctacacaggaaatctaactaggtcaacgcaattttattccaccgttacg5880cagaatactaacaaacaaacacacaaatttaacgaattacacgtagtttattacatgaaa5940actgtaagaacaccaattcactaagcgatacaacatttagctgacttccaagtgccacac6000atcaccactgtattcatccatgttttcaccgaaccaacgagacagatcgaagaagccaga6060atctcccgactttaaattacataaatccaacgtattatgaccacagctcgacacacaaat6120agttgcgttactattcacagtagcattacctatacccgtaacgttgcacaaccactgatc6180accattgttaccaaaaacggttttccacttagttgtcaacggatctttcccatgcgtaat6240ggtcaaattactaccagtcgtcgcttttagctcattacgagtattatccgcatccacata6300tatcaacgtcatagctaggcacgctataagtaccccccccccacaatggaatgttgccaa6360accggttctttcccgttatagccatagcgttcccaggcaaaagcaaacgccaaacctaat6420gcagtgaaaagcgcttgcagccagaaccagcttatgtaccagccacaatcacatccggtt6480attgtttccacaggaaatcctaccaggcaaagccccgcttgttttgttcctgaccatctt6540gtttagcaattcgtaaactgtcagcctagcgacgtccgtttagatcaaaagtcacgtata6600tagcgacgctgtttccacccgtttccccgtcccgccgtttccgaacaacccacccgggtt6660cagacaaccgaccaccaacagaaatatacacacagaccaccgggagttcagttaaagatt6720tcatcaggtttattttggctgctgctagtcttttgcttcttagaaaaaaaatacccatat6780agagaaataatgatagtttgacaacacatatggcagggatttcttcttcatcaataagat6840atgcaattcccccagggagagactttcaacaattgaatttacaaaaacaaaattacatca6900ggagaaagagaggatacattaataaatatattatatctggtgtatatactgaatgctgct6960ggttcataaggtaacgatgctactttttttaattccaagatggtttttctttgttagtct7020tttgttgacttgctggttcctaaaagttcgcaaaaacgattgtgtgaagattatgacgtt7080ggttgactagttcatgagattctgctgtacgtgtgatggttattcgctggttcgttctaa7140gatgagtatcgtactgtgtctgcgatggtcgtctcttactggcattctctcggctgcctc7200ttgttttcatgattgaaaaggaaaaaaggactccgagggcgcggtcatcttttacttttc7260ggttttctcgttggcgggtcagaggtagtcagatcatgagactgtcgtggtcgatgaaac7320tgtgtctgctcaagtgacgtccatttcttgtacggagaaaaaagtcatcgggataaataa7380ggctatacaaggcgttgtcaagcgtgcggctctaaacaaattaagcgatacaaaattaca7440gtgatacgaataataaattaccccctccccctgtggtccccccgaggcgagagccaccca7500tcgtgtactctcgcaccacccacgaccacagggggagacgggacgaagagacgacgcaga7560gcgccatctcctcctggaggccggcggcgttaactgctacagctgcggcggcgacgacag7620ctgcgatttgtcggccgacatgccgatggtatgggcggcggcggcggtggccgcggcagc7680ggggaggagaggagagagaagaggagcggggcgtccgaaggcgaggatggcatggtctcg7740ccggagcgcccggcttttatggaacactcgcgtccggttgggtatcacccacaggaagat7800gaatcacaacttccaaaccatcttgagacccgagtaacggtttacaggtcgcacgccagt7860ctcagctaaaaacagcggacagtcccacgctgtttctgttgtggctctctccagtttcct7920catcgccgtcttggtctccgtcatcatcggaagaataccacccgctctcatgcggcagtc7980gatcagcctcgatgaacgagacgcggcgacgcctttctacggccgactggttgtggtggt8040gaaagaagagcaccagcaatcccaggaggagcaacaagccctcacatgtccaggaggtcg8100gggagagggcctgtcggagatgaccgtgaggcatcacgtacggcagctgaggagaaacgg8160agaagaaaggaaaattaccgtcaggggccggggttcttattagagaaacagcacgtaggt8220caggatccagatgctaatggcaatcatgatgacgatgatcatgcaggccaagacgcggcg8280caccaatgcagaatccaatagccgccgtgcctccggttggtggccggcggcatctagaga8340catgatttgggggggggaccggcggcgcaaaaagacagggagatggacagtgccacggtg8400ttttgttatgattaggacatggggaccggaagccgagacagagtactacagggtgttgaa8460gggtaacgtgagggagatcatgtcatgggcgggctgaagaccgtgcggggaggatcgacg8520tgtgcggtgcttgtggaacacggtgttttaatatgtatccgcgtgtaatgcacgcggtgt8580gctttttagcactcggcttgataagctacgtgaccgtctgcgctgaaaccatggtcgcca8640ccaactgtctcgtgaaaacagaaaatacccacctagcatgtaagtgcaatccgaatagta8700catctaccaatggcagcaagtgccacgcgatgtgcaaatgccgggtcacagaacccatta8760ccatgctaggcgcatactcggcctggggcgcgggctcgttcgtggccacgctgatagtcc8820tgctggtggtcttcttcgtaatttacgcgcgcgaggaggagaaaaacaacacgggcaccg8880aggtagatcaatgtctggcctatcggagcctgacacgcaaaaagctggaacaacacgcgg8940ctaaaaagcagaacatctacgaacggattccataccgaccctccagacagaaagataact9000ccccgttgatcgaaccgacgggcacagacgacgaagaggacgaggacgacgacgtttaac9060gaggaagacgagaacgtgttttgcaccatgcagacctacagcaactccctcacgcttgtc9120atagtcacgtcgctgtttttattcacagctcagggaagtttatcgaatgccgtcgaacca9180atcaaaaaacccctaaagctcgccaactaccgcgccacttgcgaaaaccgtacacgcacg9240ctggttaccaggcttaacactagccatcacagcgtagtctggcaacgttatgatatctac9300agcagatacatgcgtcgtatgccgccactttgcatcattacagacgcctataaagaaacc9360acgcgtcagggtggcgcaactttcacgtgcacgcgccaaaatctcacgctgtacaatctt9420acggttaaagatacgggagtctaccttctacaggatcagtataccggcgatgtcgaagct9480ttctacctcatcatccacccacgcagcttctgccgagccttggaaacgcgtcgatgcttt9540tatccgggaccaggcagagtcggtgtggtcacggattcccaagaggcagaccgagcaatt9600atctcggatttaaaacgccagtggtccggcctctcactccattgcgcctgggtttcggga9660ctgatgatctttgttggcgcactggtcatctgctttctgcgatcgcaacgaatcggagaa9720caggacgttgaacatctgcggacggacctggatacggaacctttgttgttgacggtggac9780gggaatttggaataaaagatgcgtaacacctgtcgaagatgcgataactttacatacagg9840caaacagtgtatacaattatagtattttgtatgttgcataaagttacatgcaacagtact9900gctaacagtactgcatccattacgctatccaacactgcctctaccacttttgtaaccaac9960atatattcaactccgaataacaacacatcaacgacgccacacacatctgtcacctcacaa10020gcgtcaaccattggcaacatcaccaacgttacctccgacttgagtactttcacaaccgta10080tattctacattcaatacatcatttgccaatatatctaatacggctgtcactacagaattg10140atttcaacaaataccaacactatctcatcttttaccaacgtaacagcaaacgctacatca10200tcttataacacaacaatcaccgtaactgtcacgtcagatgaaacttcgcacaacgtatcc10260actaataatgcacttataagcacaccatggcctacaaattgcagcgccacaacatacacc10320acgtacaaccttactaactcttccaacgcttgtcacacagagacaacaatcatacgtttc10380aaggaaaccaatacaacaggaatagaagggagtaatgtcaccataaagggtaattctacg10440tgggactgtctttcagtcgcctggatacgacattacaatagatccacacacggacatcat10500ctaggttatcgtaagaacgcacatacccaatcttggtattggctacgcatccttacctct10560cacactgtatgtcattctcaacatgaaagaccttcactgtaccatgacttatgtcgttcg10620tgcaacaacacagaattacatctgtacgatctaaatatcaccaattccggcaggtacagc10680agacgttgttttaaagaaaattacttcacaggacatcacgaagatgaaaatttctaccta10740ttagtaacaccaaaaaatcatactgaagctattaatgctactttcgtttgccctagatac10800aacaccgatatcgaaaatgaagatagagagaaaggaagtcaacatactaacaatacacat10860caccacaaacgtaatctctatcatagctcgcaaagaagccgcaccgtatggaccatcgtg10920ttggtttgtatggcctgcatagttctgttttttgcacgacgagcctttaacaaaaagtat10980catatgttacaagacaccgtcagtgaatcagaattcattgttcgatatcacccagaacat11040gaagattgagctacgtttccgggcagacatcttatgaagctgaacaataaactaaaacat11100tctgtaagactcagcgttcaaaggaatattaatgcccattgagcgaaaactaatattgca11160atggactggcgatttacggttacgtggaccgttacttgtgatggtttcaattatacagtc11220cataaaagatgcgatcgcagttacgaggtaatcaacgtaacaggatacgttggtagcaac11280ataactctaaaaaaatgcaatcagactgagaaatggcacaatgtagactggattcattat11340gagtaccccacgcataaaatgtgcgaattaggcaactatcaccaaaccacaccacggcac11400gacatatgttttgactgcaacgacacctccctaactatctacaacttaaccacaaaaaac11460gctggaaaatataccaggcgtcaccgtgataacggtcaagaagaaaattactacgtaacg11520gtgttaattggagacacaacgttattcactcttggcacatgccctgtaagatataaagaa11580tctacgaacactgaaaacaccattggaagtagcatcatagaaaccattgagaaagctaac11640attcccctgggaattcatgctgtatgggcaggcgtagtggtatcagtggcgcttatagcg11700ttgtacatgggtagccatcgcattcccaaaaagccgcattacaccaaacttcccaaatat11760gatccagatgaattttggactaaggcttaacatgctgatcaataaactttttttaaccaa11820taacatgtctccgtttttttttgttaacaacctatgatataaagcgttatattcagtcgt11880tactaaacaaaaaaacatgggcatgcaatgcaacactaaattgttattgccagtcgcact11940aataccggttgcaatcatcctaattggtactctagtgccgatacttttacatgaacaaaa12000aaaggcgttttactggcgactttttctgcaaagtcaacatgtagaagcacccattacagt12060aacgcagggagacacagtctacctagacgctagcaataatccctgtaattattccagctt12120ttggtaccacggtaattgcgaactttgtggatggaacggatatctacgcaatgttacaca12180ttactacacaaacacatcgtgttccccgcaattcatctgcataaacgaaactaaaggtct12240gcagttatataatgtaacattaaacgattcaggcgcttatactgaacacgtttacgaatg12300tgacctttcgtgtaacattactactaataacgaatatgaaatactcaattattttgataa12360ctgtaactacaccataaatagcaccaagcatattatcaccgtggtgtcttcacgtcattc12420taaacaaacaaattcccacgtatccactcacgctggttgggcagtcgccgtggtgacggt12480aattatgatctacgttctgatccactttaacgtcccggcaactctgagacacaaactacg12540aactagaaacaacgtaaatcgcatagcgtgattataaagtatcgacgctaatttctccaa12600gataaaatttgattactccgtgcagttctcaaaaactgtaaggccccgcttttccactcc12660gtcatgaaggatcgcaatagaatactgctatgtatcatctttatttgcattatgtgcctc12720atttgtatttactttaaacgtcgttgtgtttttactccgtctccagacaaagcagatctg12780cgagtggaatttccctcgttacccccgtgtattggcatacagtgcgctgcatgagaacac12840gcgtgacacatagcgtacccctggacggtacagtttatgataacgtaattcagggaaagt12900atacattcataccaacatgttatcacataacacacagattttctgcgtgttttataaaag12960agcgtctcgaagcagcttgagccacactacggtccagatgacgagcgtaattaaaaatat13020gccgcgcagtattcgaaagccgtactgagcgtgcgaggcgggtagggtgccgaacgacgg13080atatgcgtcgttgtcatcttcgactataaggatcgcgaccgagtcttcggccatggtaaa13140cgtcaccctgtgtggctggtatgtagcgtatccggtttggaattgttctgctccagctcg13200ggggatagtgaggaattctcaagggatacgggacccaatgactggataagagaagggttt13260ttccccgtaagatgatcctcgtatcacatgaggtctggatatgtataaatgaagagtgaa13320ataggcacagggaatcagatgccagcctcgtgatgcagccgctggttctctcggcgaaga13380aactgtcgtctttgctgacttgcaaatacatcccgccttaagcgatgagtctataaagca13440ccgttgcccgagtacggtaaaagtgacccggattgtagaacgtcctttttttttgttttt13500gcatcgtttatcgtcactactagtgcaatattttgattgtaaggctgaaagagtatcgtt13560atgatgcttagaacgtggagattattacagatggtactgcttgccgcgtactgttattat13620gtttttgcgacttgttcaatcagcacgacgactgctcctgtggaatggaagtctcccgac13680cgtcagattcccaagaatattacctgcgctaattactcagggaccgtcaacggcaacgtt13740acatttcgaggtcttcagaacaaaacggaagactttttgtactggttgttaggatggggt13800cataagtccatttgttcgttcttcccgaaactccagggtaactatgacgaacaacattac13860agatatgaagtagcgaacctgacgtataactgcacctataaccgcttgacgttgctgaat13920ctgacgacggaaaacagcggaaagtactatttcaaaagggaagatgcgaatttcaccttc13980tattactcttgttacaacttgaccgtgtcctaaagatcgcacgtgaagtttcacagagcc14040gcgtggctgtagctattgtgtttacgttgcttttgaaatgttaagcgtccctacggcgct14100aacatgtttctaggctactctgactgtgtagatcccggccttgctgtgtatcgtgtatct14160agatcacgcttaaagctcatgttgtcttttgtgtggttggtcggtttgcgtttctatgat14220tgtgccgcgttcgagtcctgctgttacgacatcaccgaggcggagagtaacaaggctata14280tcaagggacgaagcagcattcacctccagcgtgagcacccgtacaccgtccctggcgatc14340gcgcctcctcctgaccgatcgatgctgttgtcgcgagaggaagaactcgttccgtggagt14400cgtctcatcatcactaagcagttctacggaggcctgattttccacaccacctgggtcacc14460ggcttcgtcctgctaggactcttgacgcttttcgccagcctgtttcgcgtaccgcaatcc14520atctgtcgtttctgcatagaccgtctccgggacatcgcccgtcctctgaaataccgctat14580caacgtcttgtcgctaccgtgtagctagttagccagctgtgtgtagtgttttgcttttgc14640atatttgttttcagtcagagagtctgaaacggggtgggagggacttttgcgggtagtgca14700tgctaagatgaacgggtgggctggggtgtgcttgataactcactgtttgaatacgcgctc14760acgcacatatgtagcactcaacatgttagcttttgcccgcacgccccggggcgtgccgag14820ctgcctttttaataaagtctgggtttccagatacgcgctggttctgattttgatggtttg14880tgcctctgaaagctctacgagctgggccgtgacatccaatggactgcctaactgtagcac14940ggtaactagaacagcgggtcaagacgctgaattgcacggtccggcaccgttaagctgtaa15000tgtgacccagtggggacgttacgagaatggaagcacacccgtgttatggtgcactttacg15060gggatcaagcatgcgagtctcattaggacaccgtgtagcgtttggctgttcttggaaaac15120attttttatttataacgtttctgaaagtagcggtggcacttactatcaaaaaggttacaa15180ctgcaccgacaaacatataacactatcttgtttcaacttaacggtggttcctcgagcggt15240tcaaagcacaaccaccgtaatgacacccacgctggttacaaactccacattcagtgtgtc15300acttgttccgttgagactgacgacaaattccagcgcgtttggacacgctatttatcaacg15360acaacagcgtgttgaaaacgggacgttatccaagaacataactaacttggcattcaccta15420tggcagctggggcgttgcgatgctgctgtttgccgccgtgatggtgctcgttgatttggg15480tttgcctcaatcggcttggcgacgctggcgaagccacgtggacgatgaagaacgtggttt15540gttaatgtaggaaataaaaggcagtttgagcatgactgtttccaaaccgtaacgtggtaa15600ataaatcatggcttccgacgtgggttctcatcctctgacggttacacgatttcgctgcag15660agtgcattatgtgtacaataaactgttgattttaactttgtttgcccccgtgattctgga15720atccgtcatctacgtgtccgggccacagggagggaacgttaccctggtatccaacttcac15780ttcaaacatcagcgcacggtggttccgctgggacggcaacgatagccatctcatttgctt15840ttacaaacgtggagagggtctttctacgccctatgtgggtttaagcctaagttgtgcggc15900taaccaaatcaccatcttcaacctcacgttgaacgactccggtcgttacggagcagaagg15960ttttacgagaagcggcgaaaatgaaacgttcctgtggtataatttgaccgtgaaacccaa16020acctttggaaactactccagctagtaacgtaacaaccatcgtcacgacgacatcgacgat16080gatcgacgcgaaaagtaacgttacagggaacgccagtttagcaccacaattacgtgccgt16140cgctggattctccaatcagacgcctttggaaaacaacacgcacctggccttggtaggtgt16200tgttgtgtttttagttctgatagttgtttgcattatggggtggtggaaattgttgtgtgg16260taaaccagagttatagtaatgtgctttttatcagggagaaggttttgtgccaacaatgac16320tagcccgggactatctgcgtcagaaaattatgacggaaattatgaattcacggaaaccgc16380caatacaacgcgtacaaatagaagtgactggacaacgttagaaaccagtgcattgctatt16440gaaaaacacggagactgcagtgaacctcagcaacgcgactacggtcatcccacaacctgt16500agaatacccggctggggaagtacaatatcaaagaacggcaacgcattattcttggatgct16560aatcattgtcatcattctcatcatttttattatcatctgtctacgagcacctcgaaaaat16620ctaccatcactggaaagacagtaaacagtacggacaagtgtttatgacagacacggaact16680gtgacagtgatgtctaagcgtttgcaggtatttccatggataacaattttattttacaca16740tcaaaatcccagtattggaactatatggcaataccatgtacccctacagttggatacggc16800agtcataatattagcttgcatccgcttaataactcattatttcaagacgatgtttttgaa16860tggtacatagacaaaccaatggttacaagttatgtctttatcaaagtaatgaacgcacaa16920aatccaatctagactctccaaatattgtgtggcaatgcacagataatcgtacactaattc16980tcatgaacttaaccacaacatacagtagaaactattattttcaatcctttaaatatctcg17040gacgaggagtaccaaaaccgaataacttgtgttataacgttagtgtacactttacccacc17100aaacacattgccatacaactacatcatccctgtatccacctacatctgtacacgattcat17160tagaaatatcacagtcattcacctcaaccaacttcacacataccgcggtccactacgcca17220ccggtaacgttgaagcacaacacgacactaccactccacatacaatgtggatcatacccc17280tagttatcgttataacaatcatcgttttaacttgtttcaaattcccccagaaagcttgga17340ataaattcacacaatacagatacagcggtatgctcgccgccgcttaaagaatcaacgcca17400aggaaaccaaaacgtaaaaagaatagatatgtacgtttatttttcagctcactgtttgaa17460taccgtaaacataatgacgtacatatacgtggttatacaacaggtgtttgtgttatgcgg17520cgactgattaaccatatcgtgaaccatgatcttttccgatggtccgtcgtgaccgcaatg17580atattttacagatattccgaaacctgtatggaggtcactgtcagagtaggtgatccagtt17640accctcggtagtggacatggttatcatccaggtagggataacagggtaatgatcctctag17700agtcgacctgcaggcatgcaagcttgagtattctatagtctcacctaaatagcttgg17757<210>11<211>18036<212>dna<213>巨细胞病毒hcmv<220><221>misc_feature<223>编辑后hcmv片段<400>11acgacggccagtgaattgtaatacgactcactatagggcgaattcgagctcggtacccga60ttaccctgttatccctaccattccgggccgtgtgctgggtccccgaggggcgggggggtg120tttttagcgggggggtgaaatttggagtcttggagccgcgtgtgctgtggaggacggtga180cggtggtaagagtgtgctgcggtgcggttgggacggcggcggcgaataaaagcggcgtgc240ggcgcgcacggcgaaaagcagacgcgcgtctgtgttgtgtgtctttgaccgcggcggaac300acacgcggaaaagcgagtcccaggggacacacgacgagcgagtcccagggggggacgacg360acggccagggacgcggaaacgacgcggaaaagaggaagtccccagggggacgggcggaaa420agaggaagcgcctaggggaccgcgggggcaggaacagacgaagtacgccgcaacccgcgt480cgaggacacacgcagaagcggccgcccaggggagggggggggggggactcgcgggccccg540gggcacacttgttgttccctccggccgccgacacgcaccccgaagccgcgcacaccgccg600acacacccctgacacacccgcgacacacccgccacacgcccgacacacgcccgcgacaca660cccgaccgacacaccctgacacaccccgccaacacacccagccgcacccgccccgccaac720acacccccgacacacccgacacacgcccgcgacacacccggcacacacccacccacccag780ccgcgcccccgacacaccccgaacggcgccggtgcgggacagggctcacggaggtttgcg840ggccgtgagcacgcctccctttgtacacactaccggtgcgtggcgtcccacgctatttgt900tcgcgagaccggactaagggaggtttgcggtgcgtcagcgcggggcggcgtttgcggcgt960gtttcgaccagcgctttgtgcgcgctgcctgtgcgtgtcgtcccatggtctttgtcagcg1020gcacggcgctggggacggggtttcaccgcgctgagggatctttctgcgggtgtgagggac1080ggagcttttttcgcacgctgggcaccgggctgggggacggggggtgtgcgggacggcggt1140ggggccggggcgttgcgggtacggggattacgctgggaacggggactcgcggacccgggc1200tgagggacgggggtggcgggggtgtttgcggcgaggacgggggccttttgcggcggggac1260ggggactcaccctcgcctatttaacctccacccacttcaacacacacatgccgcacaatc1320atgccagccacagacacaaacagcacccacaccacgccgcttcacccagagtaccaacac1380acgttacccttacaccacagcaacacacaaccgcctatccaaacctcggacaaacacgcc1440aacgaagaacaccgcacgcagatggagctcgacgccgcggattacgctgcttgcgcgcag1500gcccgccaacacctctacgctcaaacacaaccccaactacacgcataccccaacgccaac1560cctcaggaaagcgctcatttttccacagaaaatcaacatcaactcacgcatctacttcac1620aacattggcgaaggcgcagcgctcggctaccccgtcccccgcgcggaaatccgccgcggc1680ggtggcgactgggccgacagcgcgagcgacttcgacgccgactgctggtgcatgtgggga1740cgcttcggaaccatgggccgccaacctatcgtgaccttactgttggcgcgccaacgcgac1800ggcctcgctgactggaacgtcgtacgctgccgcggcacaggctttcgcgcacacgattcc1860gaggacggcgtctctgtctggcgtcagcacttggtttttttactcggaggccacggccgc1920cgtgtacagttagaacgtccatccgcgggagaagcccaagctcgaggcctattgccacgc1980atccggatcacccccatctccacatctccacgcccaaaaccaccccagcccaccatatcc2040accgcatcgcacccacatgctacgactcgcccacatcacacgctctttcctatcccttct2100acaccctcagccacggttcacaatccccgaaactacgccgtccaacttcacgccgaaacg2160acccgcacatggcgctgggcacgacgcggtgaacgtggcgcgtggatgccggccgagaca2220tttacatgtcccaaggataaacgtccctggtagacggggtagggggatctaccagcccag2280ggatcgcgtatttcgccgccacgctgcttcaccgatatccaataaacccatcccctcgcc2340acgacgtctccgcgtatctttgtagcctcaggaatccgtccccacgtccatccatcccga2400gcactccacacgctataacagaccacggacacggcaaatgcatgcaaacttctcatttat2460tgtgtctactactctgtgttgctacagggagtgaagggggtgaaggcaaagaaaaaaaaa2520aggaacaaaataatagattagcagaaggaataatccgtgcgaccgagcttgtgcttcttt2580tcttataaggaggcaaatatactagggaaaacttaagaataggaagaaaccgaggtttgg2640gagaaaagctgagataaaatagcgcattttccatacagaggttgttgtttttgtggatcc2700taagaggtttcaagtgcgaatctcaaagttctcacgagaatattgtcttcaagaatcgac2760aactgtggtccaagatttttttttggtctttttaggttctgcgagggacatcacgatgga2820tcgttgcgatgaagtcacgcgtacgcctctggtgtggcgcggtgtcgtgacaggagagtg2880tgttttcagtgcagagctgtcttgattcctatatccgagtatctgttttctcgtaaggac2940ggtaatcttctttggtgtaagtacatctaaaagctgcaaactatattttaagggctgtct3000ctaggtgtactttgatgctggagtttttcgctgtgttgatgtgaataaatctactactac3060tattatatgcagaaagagtgattatgccgagacaagattgcattggctgaactgtttcaa3120aaacgcctacactctacttatccgtaaacctaaggtaatactatgtgtaagttgtttttt3180tttctttttgtagtaaaatggtgatacgtgcaattaaaactgtattccatgtttccatcc3240tttcatttcaactttaaaggcggctttgagagcgaagaagtgcgaggataaaaatggatg3300actccttcgtgtccagggagtcgactactgcaacgctgattgattaaaagatggtctccg3360atgatgatgttgttattgatcgaatcatggtgcagaacggcgacggagaggagcgtgtcc3420gccgccgggaaggtggtctctttctcttttcttttttcaagaaatcttccatgtgtttat3480cgtagtgatcgaaatcgactgatctcgggttctttttgttggtttcttttcggttaatca3540tgtattgttttctttttttacagaaagatacttttttcatgagcaattcctcgcccggcg3600ccggcatgccgaggtggggccactgcgatcagcggcatgccgacgccgacccggggatct3660tggattcaccgttttctctcttctctctctacatacagaccgggtggcaggagcggtaag3720gaatcatcgtcgtctttcattcttcgatgattatggtaatactaaatcttatctaggagc3780atatacatctaagattggagtactagtagtcgtttgtggtttctattttttttatattta3840tctatgacagtttttctgtttttcgttttgataataatataataaaaactcatggacgtg3900aaatctggcttggttgtggtgatttcattctcattattgttgttttctttccgtcttgcg3960gatgaagatgttgcgatgcggttgttgttggtgttgctatacaccgagagagatgatctt4020tttgttcttctggttcatttcctatgattgtttggctgctgaccgacgcgtcaggatgtg4080cagggcatgcggggaatcaggaccggacacgggataatttcatctacctatacggagatc4140gcggtcctcgccatgaggatcgcgacaggcgcgtcgagggggcaggaacacccttgcgga4200ttgacattcttggtggtgtttcgttgttgtcggtagttgttgttgacgatgaggataaat4260aaaaatgaccttgtttttgttctgttttctcttgttgggaatcgtcgactttgaattctt4320cgagttatcggaaagctgaggtacccaaatgtctgtagcttttttctttttaccctcttg4380tttatcatctgcgattcgtggtaggtaggagagggaaatgataatccgagattaaggaaa4440ggagaagataaaaaataaaaaaaaaataataaaacagaagccgaccggccgccgacccgt4500tccccaggaccagcctacgaggaatggataacgcggtggcgacggcagcggtggtggcgc4560tgggggtggcggcagtggtactgctgatggtagtcgggacggaggagaggcgatgcatac4620atacacgcgtgcatgctgcatgggtggatggtacggccgggagacgcggaagagaaactc4680acataaaaaggtgacaaaaagagcggttgaaaaaagaaaacgagattcgaccagacagaa4740gagaaggaccggggcttggcgacccttccacgactgctgttgtcatctcggctcccccgt4800cttctcccggccacgggcggctaagtcaccgccgttctccccatccgtccgagcgccgac4860cgaccagccggccgattcgcccgccggggcttctggagaacgccggggcagcagcgatct4920ggggaagccgctaaacccctgcgtttttatatggtagctctgccgagcgcgggctgacgc4980gttgagtaagcggaaagacgtgtgtgacgaaaaggggtcccatggtatttcacgtgacga5040tgaggagatgcggtttggagcacatacggtttagaaaaagggagttgtcgtgacaagggc5100tgagggacctctgtctccatgtgtgtataaaaagcaaggcacgttcataatgtaaaaaag5160aacacgttgtaaacaagctattgctgtatcattcggctgactatgcttcattcggactga5220ttttcttttcctaacggcgtaacttaaagtgattaacgtatgatatttgttccccagagt5280tatactatagtcatcatcctaaaattcagatataaatgaacacatgtcgtatgggattat5340taagaaaccgaaactctccacagttcaccatcttcttcgtcattcaaccgatgacccact5400ccgtacaacgaatcagtctgctgtgtcacactgcaaactactagcgacgtatgcaaacaa5460cttgaaacacgggctgttgtattgacgaccgttgtaccattactagtcacattgcataga5520gaccatccaccgtcatcccatctttcccacccgatggaaaaccgtcttctatcatcaact5580atggtaagatttcgaccctgcgaggtattcagtttccccatatccataacctggatttta5640tcattaaaccccaatattaaacacttttttagtacccccccacccaccaaaaaatgtgac5700tggaccggttcctagcagctctgggagccatgttcaggttgaaccacagctacagcgaaa5760ccgagtccagtgaccggtaaccacgtccagcccctgcgtatgtaccagtccaagcacgtc5820cggtcattgttctacacaggaaatctaactaggtcaacgcaattttattccaccgttacg5880cagaatactaacaaacaaacacacaaatttaacgaattacacgtagtttattacatgaaa5940actgtaagaacaccaattcactaagcgatacaacatttagctgacttccaagtgccacac6000atcaccactgtattcatccatgttttcaccgaaccaacgagacagatcgaagaagccaga6060atctcccgactttaaattacataaatccaacgtattatgaccacagctcgacacacaaat6120agttgcgttactattcacagtagcattacctatacccgtaacgttgcacaaccactgatc6180accattgttaccaaaaacggttttccacttagttgtcaacggatctttcccatgcgtaat6240ggtcaaattactaccagtcgtcgcttttagctcattacgagtattatccgcatccacata6300tatcaacgtcatagctaggcacgctataagtaccccccccccacaatggaatgttgccaa6360accggttctttcccgttatagccatagcgttcccaggcaaaagcaaacgccaaacctaat6420gcagtgaaaagcgcttgcagccagaaccagcttatgtaccagccacaatcacatccggtt6480attgtttccacaggaaatcctaccaggcaaagccccgcttgttttgttcctgaccatctt6540gtttagcaattcgtaaactgtcagcctagcgacgtccgtttagatcaaaagtcacgtata6600tagcgacgctgtttccacccgtttccccgtcccgccgtttccgaacaacccacccgggtt6660cagacaaccgaccaccaacagaaatatacacacagaccaccgggagttcagttaaagatt6720tcatcaggtttattttggctgctgctagtcttttgcttcttagaaaaaaaatacccatat6780agagaaataatgatagtttgacaacacatatggcagggatttcttcttcatcaataagat6840atgcaattcccccagggagagactttcaacaattgaatttacaaaaacaaaattacatca6900ggagaaagagaggatacattaataaatatattatatctggtgtatatactgaatgctgct6960ggttcataaggtaacgatgctactttttttaattccaagatggtttttctttgttagtct7020tttgttgacttgctggttcctaaaagttcgcaaaaacgattgtgtgaagattatgacgtt7080ggttgactagttcatgagattctgctgtacgtgtgatggttattcgctggttcgttctaa7140gatgagtatcgtactgtgtctgcgatggtcgtctcttactggcattctctcggctgcctc7200ttgttttcatgattgaaaaggaaaaaaggactccgagggcgcggtcatcttttacttttc7260ggttttctcgttggcgggtcagaggtagtcagatcatgagactgtcgtggtcgatgaaac7320tgtgtctgctcaagtgacgtccatttcttgtacggagaaaaaagtcatcgggataaataa7380ggctatacaaggcgttgtcaagcgtgcggctctaaacaaattaagcgatacaaaattaca7440gtgatacgaataataaattaccccctccccctgtggtccccccgaggcgagagccaccca7500tcgtgtactctcgcaccacccacgaccacagggggagacgggacgaagagacgacgcaga7560gcgccatctcctcctggaggccggcggcgttaactgctacagctgcggcggcgacgacag7620ctgcgatttgtcggccgacatgccgatggtatgggcggcggcggcggtggccgcggcagc7680ggggaggagaggagagagaagaggagcggggcgtccgaaggcgaggatggcatggtctcg7740ccggagcgcccggcttttatggaacactcgcgtccggttgggtatcacccacaggaagat7800gaatcacaacttccaaaccatcttgagacccgagtaacggtttacaggtcgcacgccagt7860ctcagctaaaaacagcggacagtcccacgctgtttctgttgtggctctctccagtttcct7920catcgccgtcttggtctccgtcatcatcggaagaataccacccgctctcatgcggcagtc7980gatcagcctcgatgaacgagacgcggcgacgcctttctacggccgactggttgtggtggt8040gaaagaagagcaccagcaatcccaggaggagcaacaagccctcacatgtccaggaggtcg8100gggagagggcctgtcggagatgaccgtgaggcatcacgtacggcagctgaggagaaacgg8160agaagaaaggaaaattaccgtcaggggccggggttcttattagagaaacagcacgtaggt8220caggatccagatgctaatggcaatcatgatgacgatgatcatgcaggccaagacgcggcg8280caccaatgcagaatccaatagccgccgtgcctccggttggtggccggcggcatctagaga8340catgatttgggggggggaccggcggcgcaaaaagacagggagatggacagtgccacggtg8400ttttgttatgattaggacatggggaccggaagccgagacagagtactacagggtgttgaa8460gggtaacgtgagggagatcatgtcatgggcgggctgaagaccgtgcggggaggatcgacg8520tgtgcggtgcttgtggaacacggtgttttaatatgtatccgcgtgtaatgcacgcggtgt8580gctttttagcactcggcttgataagctacgtgaccgtctgcgctgaaaccatggtcgcca8640ccaactgtctcgtgaaaacagaaaatacccacctagcatgtaagtgcaatccgaatagta8700catctaccaatggcagcaagtgccacgcgatgtgcaaatgccgggtcacagaacccatta8760ccatgctaggcgcatactcggcctggggcgcgggctcgttcgtggccacgctgatagtcc8820tgctggtggtcttcttcgtaatttacgcgcgcgaggaggagaaaaacaacacgggcaccg8880aggtagatcaatgtctggcctatcggagcctgacacgcaaaaagctggaacaacacgcgg8940ctaaaaagcagaacatctacgaacggattccataccgaccctccagacagaaagataact9000ccccgttgatcgaaccgacgggcacagacgacgaagaggacgaggacgacgacgtttaac9060gaggaagacgagaacgtgttttgcaccatgcagacctacagcaactccctcacgcttgtc9120atagtcacgtcgctgtttttattcacagctcagggaagtttatcgaatgccgtcgaacca9180atcaaaaaacccctaaagctcgccaactaccgcgccacttgcgaaaaccgtacacgcacg9240ctggttaccaggcttaacactagccatcacagcgtagtctggcaacgttatgatatctac9300agcagatacatgcgtcgtatgccgccactttgcatcattacagacgcctataaagaaacc9360acgcgtcagggtggcgcaactttcacgtgcacgcgccaaaatctcacgctgtacaatctt9420acggttaaagatacgggagtctaccttctacaggatcagtataccggcgatgtcgaagct9480ttctacctcatcatccacccacgcagcttctgccgagccttggaaacgcgtcgatgcttt9540tatccgggaccaggcagagtcggtgtggtcacggattcccaagaggcagaccgagcaatt9600atctcggatttaaaacgccagtggtccggcctctcactccattgcgcctgggtttcggga9660ctgatgatctttgttggcgcactggtcatctgctttctgcgatcgcaacgaatcggagaa9720caggacgttgaacatctgcggacggacctggatacggaacctttgttgttgacggtggac9780gggaatttggaataaaagatgcgtaacacctgtcgaagatgcgataactttacatacagg9840caaacagtgtatacaattatagtattttgtatgttgcataaagttacatgcaacagtact9900gctaacagtactgcatccattacgctatccaacactgcctctaccacttttgtaaccaac9960atatattcaactccgaataacaacacatcaacgacgccacacacatctgtcacctcacaa10020gcgtcaaccattggcaacatcaccaacgttacctccgacttgagtactttcacaaccgta10080tattctacattcaatacatcatttgccaatatatctaatacggctgtcactacagaattg10140atttcaacaaataccaacactatctcatcttttaccaacgtaacagcaaacgctacatca10200tcttataacacaacaatcaccgtaactgtcacgtcagatgaaacttcgcacaacgtatcc10260actaataatgcacttataagcacaccatggcctacaaattgcagcgccacaacatacacc10320acgtacaaccttactaactcttccaacgcttgtcacacagagacaacaatcatacgtttc10380aaggaaaccaatacaacaggaatagaagggagtaatgtcaccataaagggtaattctacg10440tgggactgtctttcagtcgcctggatacgacattacaatagatccacacacggacatcat10500ctaggttatcgtaagaacgcacatacccaatcttggtattggctacgcatccttacctct10560cacactgtatgtcattctcaacatgaaagaccttcactgtaccatgacttatgtcgttcg10620tgcaacaacacagaattacatctgtacgatctaaatatcaccaattccggcaggtacagc10680agacgttgttttaaagaaaattacttcacaggacatcacgaagatgaaaatttctaccta10740ttagtaacaccaaaaaatcatactgaagctattaatgctactttcgtttgccctagatac10800aacaccgatatcgaaaatgaagatagagagaaaggaagtcaacatactaacaatacacat10860caccacaaacgtaatctctatcatagctcgcaaagaagccgcaccgtatggaccatcgtg10920ttggtttgtatggcctgcatagttctgttttttgcacgacgagcctttaacaaaaagtat10980catatgttacaagacaccgtcagtgaatcagaattcattgttcgatatcacccagaacat11040gaagattgagctacgtttccgggcagacatcttatgaagctgaacaataaactaaaacat11100tctgtaagactcagcgttcaaaggaatattaatgcccattgagcgaaaactaatattgca11160atggactggcgatttacggttacgtggacgatactaatgtccgcgttgtcagaaagctgc11220aatcaaacctgttcttgtcaatgtccctgtagtactaccgttaactattcaactagtact11280gagacagccacatcaacatacagtacaacagttatcagcaataaaagcacttcagaatct11340ataaattgctctactgcaactacaccagcaaacaccgtttctacaaaaccgtcggaaaca11400accacacagatatccacaacgacgaacacaaacgttgagactaccacatgtaccaacacc11460accacgaccgttacttgtgatggtttcaattatacagtccataaaagatgcgatcgcagt11520tacgaggtaatcaacgtaacaggatacgttggtagcaacataactctaaaaaaatgcaat11580cagactgagaaatggcacaatgtagactggattcattatgagtaccccacgcataaaatg11640tgcgaattaggcaactatcaccaaaccacaccacggcacgacatatgttttgactgcaac11700gacacctccctaactatctacaacttaaccacaaaaaacgctggaaaatataccaggcgt11760caccgtgataacggtcaagaagaaaattactacgtaacggtgttaattggagacacaacg11820ttattcactcttggcacatgccctgtaagatataaagaatctacgaacactgaaaacacc11880attggaagtagcatcatagaaaccattgagaaagctaacattcccctgggaattcatgct11940gtatgggcaggcgtagtggtatcagtggcgcttatagcgttgtacatgggtagccatcgc12000attcccaaaaagccgcattacaccaaacttcccaaatatgatccagatgaattttggact12060aaggcttaacatgctgatcaataaactttttttaaccaataacatgtctccgtttttttt12120tgttaacaacctatgatataaagcgttatattcagtcgttactaaacaaaaaaacatggg12180catgcaatgcaacactaaattgttattgccagtcgcactaataccggttgcaatcatcct12240aattggtactctagtgccgatacttttacatgaacaaaaaaaggcgttttactggcgact12300ttttctgcaaagtcaacatgtagaagcacccattacagtaacgcagggagacacagtcta12360cctagacgctagcaataatccctgtaattattccagcttttggtaccacggtaattgcga12420actttgtggatggaacggatatctacgcaatgttacacattactacacaaacacatcgtg12480ttccccgcaattcatctgcataaacgaaactaaaggtctgcagttatataatgtaacatt12540aaacgattcaggcgcttatactgaacacgtttacgaatgtgacctttcgtgtaacattac12600tactaataacgaatatgaaatactcaattattttgataactgtaactacaccataaatag12660caccaagcatattatcaccgtggtgtcttcacgtcattctaaacaaacaaattcccacgt12720atccactcacgctggttgggcagtcgccgtggtgacggtaattatgatctacgttctgat12780ccactttaacgtcccggcaactctgagacacaaactacgaactagaaacaacgtaaatcg12840catagcgtgattataaagtatcgacgctaatttctccaagataaaatttgattactccgt12900gcagttctcaaaaactgtaaggccccgcttttccactccgtcatgaaggatcgcaataga12960atactgctatgtatcatctttatttgcattatgtgcctcatttgtatttactttaaacgt13020cgttgtgtttttactccgtctccagacaaagcagatctgcgagtggaatttccctcgtta13080cccccgtgtattggcatacagtgcgctgcatgagaacacgcgtgacacatagcgtacccc13140tggacggtacagtttatgataacgtaattcagggaaagtatacattcataccaacatgtt13200atcacataacacacagattttctgcgtgttttataaaagagcgtctcgaagcagcttgag13260ccacactacggtccagatgacgagcgtaattaaaaatatgccgcgcagtattcgaaagcc13320gtactgagcgtgcgaggcgggtagggtgccgaacgacggatatgcgtcgttgtcatcttc13380gactataaggatcgcgaccgagtcttcggccatggtaaacgtcaccctgtgtggctggta13440tgtagcgtatccggtttggaattgttctgctccagctcgggggatagtgaggaattctca13500agggatacgggacccaatgactggataagagaagggtttttccccgtaagatgatcctcg13560tatcacatgaggtctggatatgtataaatgaagagtgaaataggcacagggaatcagatg13620ccagcctcgtgatgcagccgctggttctctcggcgaagaaactgtcgtctttgctgactt13680gcaaatacatcccgccttaagcgatgagtctataaagcaccgttgcccgagtacggtaaa13740agtgacccggattgtagaacgtcctttttttttgtttttgcatcgtttatcgtcactact13800agtgcaatattttgattgtaaggctgaaagagtatcgttatgatgcttagaacgtggaga13860ttattacagatggtactgcttgccgcgtactgttattatgtttttgcgacttgttcaatc13920agcacgacgactgctcctgtggaatggaagtctcccgaccgtcagattcccaagaatatt13980acctgcgctaattactcagggaccgtcaacggcaacgttacatttcgaggtcttcagaac14040aaaacggaagactttttgtactggttgttaggatggggtcataagtccatttgttcgttc14100ttcccgaaactccagggtaactatgacgaacaacattacagatatgaagtagcgaacctg14160acgtataactgcacctataaccgcttgacgttgctgaatctgacgacggaaaacagcgga14220aagtactatttcaaaagggaagatgcgaatttcaccttctattactcttgttacaacttg14280accgtgtcctaaagatcgcacgtgaagtttcacagagccgcgtggctgtagctattgtgt14340ttacgttgcttttgaaatgttaagcgtccctacggcgctaacatgtttctaggctactct14400gactgtgtagatcccggccttgctgtgtatcgtgtatctagatcacgcttaaagctcatg14460ttgtcttttgtgtggttggtcggtttgcgtttctatgattgtgccgcgttcgagtcctgc14520tgttacgacatcaccgaggcggagagtaacaaggctatatcaagggacgaagcagcattc14580acctccagcgtgagcacccgtacaccgtccctggcgatcgcgcctcctcctgaccgatcg14640atgctgttgtcgcgagaggaagaactcgttccgtggagtcgtctcatcatcactaagcag14700ttctacggaggcctgattttccacaccacctgggtcaccggcttcgtcctgctaggactc14760ttgacgcttttcgccagcctgtttcgcgtaccgcaatccatctgtcgtttctgcatagac14820cgtctccgggacatcgcccgtcctctgaaataccgctatcaacgtcttgtcgctaccgtg14880tagctagttagccagctgtgtgtagtgttttgcttttgcatatttgttttcagtcagaga14940gtctgaaacggggtgggagggacttttgcgggtagtgcatgctaagatgaacgggtgggc15000tggggtgtgcttgataactcactgtttgaatacgcgctcacgcacatatgtagcactcaa15060catgttagcttttgcccgcacgccccggggcgtgccgagctgcctttttaataaagtctg15120ggtttccagatacgcgctggttctgattttgatggtttgtgcctctgaaagctctacgag15180ctgggccgtgacatccaatggactgcctaactgtagcacggtaactagaacagcgggtca15240agacgctgaattgcacggtccggcaccgttaagctgtaatgtgacccagtggggacgtta15300cgagaatggaagcacacccgtgttatggtgcactttacggggatcaagcatgcgagtctc15360attaggacaccgtgtagcgtttggctgttcttggaaaacattttttatttataacgtttc15420tgaaagtagcggtggcacttactatcaaaaaggttacaactgcaccgacaaacatataac15480actatcttgtttcaacttaacggtggttcctcgagcggttcaaagcacaaccaccgtaat15540gacacccacgctggttacaaactccacattcagtgtgtcacttgttccgttgagactgac15600gacaaattccagcgcgtttggacacgctatttatcaacgacaacagcgtgttgaaaacgg15660gacgttatccaagaacataactaacttggcattcacctatggcagctggggcgttgcgat15720gctgctgtttgccgccgtgatggtgctcgttgatttgggtttgcctcaatcggcttggcg15780acgctggcgaagccacgtggacgatgaagaacgtggtttgttaatgtaggaaataaaagg15840cagtttgagcatgactgtttccaaaccgtaacgtggtaaataaatcatggcttccgacgt15900gggttctcatcctctgacggttacacgatttcgctgcagagtgcattatgtgtacaataa15960actgttgattttaactttgtttgcccccgtgattctggaatccgtcatctacgtgtccgg16020gccacagggagggaacgttaccctggtatccaacttcacttcaaacatcagcgcacggtg16080gttccgctgggacggcaacgatagccatctcatttgcttttacaaacgtggagagggtct16140ttctacgccctatgtgggtttaagcctaagttgtgcggctaaccaaatcaccatcttcaa16200cctcacgttgaacgactccggtcgttacggagcagaaggttttacgagaagcggcgaaaa16260tgaaacgttcctgtggtataatttgaccgtgaaacccaaacctttggaaactactccagc16320tagtaacgtaacaaccatcgtcacgacgacatcgacgatgatcgacgcgaaaagtaacgt16380tacagggaacgccagtttagcaccacaattacgtgccgtcgctggattctccaatcagac16440gcctttggaaaacaacacgcacctggccttggtaggtgttgttgtgtttttagttctgat16500agttgtttgcattatggggtggtggaaattgttgtgtggtaaaccagagttatagtaatg16560tgctttttatcagggagaaggttttgtgccaacaatgactagcccgggactatctgcgtc16620agaaaattatgacggaaattatgaattcacggaaaccgccaatacaacgcgtacaaatag16680aagtgactggacaacgttagaaaccagtgcattgctattgaaaaacacggagactgcagt16740gaacctcagcaacgcgactacggtcatcccacaacctgtagaatacccggctggggaagt16800acaatatcaaagaacggcaacgcattattcttggatgctaatcattgtcatcattctcat16860catttttattatcatctgtctacgagcacctcgaaaaatctaccatcactggaaagacag16920taaacagtacggacaagtgtttatgacagacacggaactgtgacagtgatgtctaagcgt16980ttgcaggtatttccatggataacaattttattttacacatcaaaatcccagtattggaac17040tatatggcaataccatgtacccctacagttggatacggcagtcataatattagcttgcat17100ccgcttaataactcattatttcaagacgatgtttttgaatggtacatagacaaaccaatg17160gttacaagttatgtctttatcaaagtaatgaacgcacaaaatccaatctagactctccaa17220atattgtgtggcaatgcacagataatcgtacactaattctcatgaacttaaccacaacat17280acagtagaaactattattttcaatcctttaaatatctcggacgaggagtaccaaaaccga17340ataacttgtgttataacgttagtgtacactttacccaccaaacacattgccatacaacta17400catcatccctgtatccacctacatctgtacacgattcattagaaatatcacagtcattca17460cctcaaccaacttcacacataccgcggtccactacgccaccggtaacgttgaagcacaac17520acgacactaccactccacatacaatgtggatcatacccctagttatcgttataacaatca17580tcgttttaacttgtttcaaattcccccagaaagcttggaataaattcacacaatacagat17640acagcggtatgctcgccgccgcttaaagaatcaacgccaaggaaaccaaaacgtaaaaag17700aatagatatgtacgtttatttttcagctcactgtttgaataccgtaaacataatgacgta17760catatacgtggttatacaacaggtgtttgtgttatgcggcgactgattaaccatatcgtg17820aaccatgatcttttccgatggtccgtcgtgaccgcaatgatattttacagatattccgaa17880acctgtatggaggtcactgtcagagtaggtgatccagttaccctcggtagtggacatggt17940tatcatccaggtagggataacagggtaatgatcctctagagtcgacctgcaggcatgcaa18000gcttgagtattctatagtctcacctaaatagcttgg18036<210>12<211>2310<212>dna<213>lka1gp49序列<400>12atggcgcaaacacccagtacatgggccgactacgtaggcgacggcgtagaggatacgttc60caagtcacattcccgtaccagaagcagcaagaggtgtttgtgactgtgggcggcgatccg120gcagctttcacattcatctcggcaggttggattcaactggcagcggtcccggtaaatggg180gccgcaatccgtgtacggcgcagcactgaggcattcgagcctcggcacgagttcgccaac240ggcgtgccattactgccgcgattcatagacgagaataatacccagttcttgtacactgta300caagaggcagtgaatgagacacatggcattgcttccgaagcgctgagtgtcgcagaggag360gccagaggcattgcgcaggcggcatcggataaagtggatgctgccaccattgactccgca420caccagttgcgtctagacctcgccgacccggcgaaggggcctgggctgctaggctacgac480cgagacgtaagttatccggtcgggtcggtcggtcaaagcctacagtttctggaaatgggt540cgggtcacaccagcgcaatttggcgccgttggtgatggcgccagccaccccctctctgag600cgatacgcaactctagcggaagctcagactgtctatccgcatgcagtcgcactctccgac660gaaatagactgggccgcattgcaagctgccgtggattcaggggcacctgtacacataccg720tctggggactatcagataaatagggggattagcagtacgggctctctacagattgcgggt780gatggcgctacatctattatacgcccgactgctgcgttcactggtacatcggtcctcagt840tgtgtggggagcttagttgccttgccgaatatatcctccgtgtcggctgggtccctaacc900attgactttgccagcacccctaatcttgtagcgggggatgtattcatcatctacaacccg960actgatagcagcttctcgggatttcggacgagctatcgcgcaggagagttctgtgaggtc1020agggcggtttctgggaacaccgtgacaatccgttccgcactctatgccgcatacgacggg1080gctactgttgctatttacaaagtagtctctggtgtagttgatatagctagcatccaaatc1140gttggcgggacagtcccaatgaatggactgttagtggaggctgtcgtttcaccgcgcgtc1200gatgacgtgacggtcacccttgcaaacaacgccggtgtgtattttgcccgctgctatgac1260gctaagatcacaaacagtaatatatcgaacatcggcgacggtggcgatgactatggaatc1320atctttgggaactgtcacgacggtggggcagacaactgtaaagtctacgctaggcgacat1380gccatcgccacgggcggcgatgcagaagtaggctgcgttccggtccgtaatgtgcgtatg1440cgtaactgcacacttaggaatgatattacctctggtacacactgcgcagacttccacggt1500aacgccgaggattgcagctacgaaaactgcacaatctacggtggtgcaacttggcagggg1560aaggatatcagctacagacactgtacaatcactaacgcgtcgggtggttggattgttata1620tccgctgagattcttggtggtacattccttctcgaccaatgcacattgtacacaaccggc1680gatccgcagcctggtaaccgtggggttatagatgtaggtgggaactccgcagtcctcact1740acaaatacaacgcaaccctgtaacttccttatacaaggcggcagtctgcgagcgcccagc1800ttaagtacgtctagttacctactgcgcgcacgtcttgagggtagtacagttccagtaaac1860atacagtacagcggacaggctattgatgtaggctctctgggcaaggtactacaactcgat1920attacctcgggcagtacctctcctgagtatttgatcgtggagaatttagcggggttgcca1980tctggcatcacgctggcgtctgctgctggtggtttcgcaagtgccccgatgcgtatgcct2040gtgctgggtggtagggttcaagtaactacggcaaccaacgcgagtagcgttactgctcca2100gtaacgttcaggtacatttatcctaaggccccaaccgtccaggtcacaaagacggacagg2160agctacgccggtaacagggtcggcgttgctatcgccaatccgacctctgcgtctggggcg2220acgttgggtctgttcacggacgacgggacaaactttagctcagccgttactaaccagttg2280aactggcaggcaggtatttatgaggtgtaa2310<210>13<211>1956<212>dna<213>phikmv样病毒ntuh-k2044-k1-1<220><221>misc_feature<223>ntuh-k2044-k1-1gp34<400>13atggccctgatccggctcgtggcgcccgagcgcgtgttcagcgacctggccagcatggtc60gcctatccgaacttccaggtgcaggacaagatcaccctgctgggctcggccggcggcgac120ttcaccttcaccaccaccgcgtcggtggtggacaacggcaccgtgttcgccgtgcccggc180ggctatctcctgcggaagttcgtcggcccggcgtatagctcgtggttcagcaactggacc240gggatcgtcacgttcatgagcgcgccgaaccggcacctggtggtggacaccgtgctgcag300gccacgagcgtgctgaacatcaagagcaacagcacgctggaattcacggacacgggccgc360atcctgcccgacgccgccgtggcccgccaggtgctgaacatcaccggctccgcgccctcg420gtgttcgtgcccctcgccgccgacgccgccgcggggtcgaaggtgatcaccgtggccgcc480ggcgcgctgtccgcggtgaaaggcacctacctctatctgcgctccaacaagctgtgcgac540ggcgggccgaacacctatggcgtcaagatcagccaaatccgtaaggtggtcggcgtgagc600accagcgggggcgtgacgtccatccgcctcgacaaagccctgcactataactactacctc660tcggatgccgccgaagtgggcatcccgaccatggtggagaacgtcaccctggtgagcccg720tacatcaacgagttcggctacgacgacctgaaccgcttcttcaccagcggcatctccgcg780aacttcgcggccgacctgcacatccaggacggcgtcatcatcggcaacaagcgtccgggc840gcctccgacatcgagggccgcagcgccatcaagttcaacaactgcgtggatagcaccgtg900aagggcacctgcttctataatatcggctggtacggcgtggaggtcctcggctgctcggag960gacaccgaggtgcacgacatccacgccatggacgtgcgccatgccatctccctgaactgg1020caaagcaccgccgacggcgataagtggggcgaaccgatcgagttcctgggcgtgaactgt1080gaggcgtacagcaccacccaggccggcttcgacacccacgacatcgggaagcgtgtcaaa1140ttcgtccgctgcgtgtcctacgacagcgcggatgacggcttccaggcccgcaccaacggc1200gtggagtacctcaactgccgcgcctaccgcgccgccatggacggcttcgcctcgaacacg1260ggcgtcgccttcccgatctaccgcgaatgcctggcctacgacaacgtgcgcagcgggttc1320aactgcagctacggcggcgggtatgtgtacgactgcgaggcgcacggcagccagaacggc1380gtccgcatcaacggcggccgggtcaaaggcgggcgctacacccgcaactcgtcgagccac1440atcttcgtgacgaaagatgtggcggaaaccgcccaaaccagcctcgagatcgacggcgtc1500tccatgcggtacgacggcaccggccgcgccgtgtacttccacggcaccgtgggcatcgat1560ccgacgctcgtgagcatgtccaacaacgacatgaccggccacggcctgttctgggccctg1620ctgtccggctataccgtgcagccgaccccgccgcgcatgtcgcgcaacctgctcgacgat1680accggcatccgcggcgtcgcgaccctggtcgcgggcgaagcgaccgtcaatgcccgcgtc1740cgcgggaacttcggcagcgtggccaacagcttcaagtgggtgtcggaggtgaagctgacg1800cgcctcacgttcccgtcgtcggccggcgccctcacggtcaccagcgtcgcccaaaaccag1860gacgtgccgacccccaacccggacctgaacagcttcgtcatccgcagcagcaacgccgcc1920gacgtgtcccaagtcgcctgggaggtctacctgtga1956<210>14<211>2184<212>dna<213>t7-样pp15<220><221>misc_feature<223>添加的pp15gp44序列<400>14atggcacgaactatcgtccagaacgccctaacaggcggacaacaggacttcgaggtacct60ttcgactacatcttgcagcgcttcgttaagcttaccctgatcggtgacggtaaccgacaa120gagctggtcctcggtaccgacttccggttcatcggtcctcgcaccgttcgcactaacgtc180ttctggggaccagcgcaggggtatacctccatcgagatccgacgagttaccagcgcttct240gatcgtcgcgtagagttctcggacgggtccatcctgaccgcaggtgatctgaacatcgcc300cagcttcaggccatccacattgccgaagaagcgcgagactctgccactgagaacctgagc360ccagatgctgatggcaactacgatgcacgtggtgcgcgcatttacaacctcggtgacgct420gttcagccgaaggatgcggtcaaccggtacactcttgacctcgctatcgcagccgctctg480gccatgaataccggcaacccgaacaacgcccagaacatctcgtacacccctaacgggcct540ggtcagtcgatccgaagtgttgaaggccgtctgcgggatgctgtgttcgtctcggactac600atgaccactccacgtgatggagttaccagtaaccagcaggacctcgaaaaggcactcgct660gcggcgaacgctaaaggtgccgacctattctggcctgacgacatcccgttcttctccacg720tccccgctggcactgatccacgcggtctaccatgttggacgtggtgtcatcaacgcgaac780ggtacgctgttctacgtgaacccgaagaacggccaacacaacaggctacacgtgtctccc840gggggcaccggggatggtctggcagctggccgcccactggggaccatctggagtgcactc900gcggcccttaacatgcgagccccactgaccacgcgctggtccttggagatgaccgctggc960gcctataatgaagccgttacacttccgaactacctgaccagctgtaacgactacttggcg1020tttaactggccgaacaccggtcaggaacgtatggagcccactgcgtacccatcagctctc1080gacggcacaggccagaccggcctcacaggtttccacactggcatcggcaaccgcattacc1140atcaacaacgtgtgcatgtccaactggtacgacactgcgctgactcctacccaacaggtg1200cgaagagcgttcgttgtaggtgcgtattcgactgcctacgtggtcaactgcgcgttcatt1260tacaacggcatcgcgagcgtgtctgtgctgcccggtggcactgctatcgtaaccggtggc1320atcgtcgatggtgggcggttcggcctcgacaacactggcggtcgcctgtccctgacggca1380accaagagcaattatacgcaggtccggaactgcctcgaatatggactgtactcgaagcat1440gacgcatcgaccgtaatggacaacaccgagttccgcaactgcggtaatcaccctgcggct1500gttgcgtatggtgctgcaatcttcgcgtacaagttcaactgttctgttgacactcgtggg1560gtcaagttctacggcaacaacatcgcccagcactgccgtggcggtatcacctcggacaat1620ccgggcgatccggacatctacggtaccggcgcagatgctaataagcgtctattcctgtgc1680accggtggtggctctgacgacatccagttctacgaagctcggcgcgtcatggacatcacg1740aagcgcactggtggcggctcaactactgccagcgtatcgtcgctgctactggctgccgtt1800gcgtctgtccgtaagggctactttgcgcacaacgatcaggtgatccggatgaccctgatg1860ttccgcgctacaggctcggctggcatcttcacgccgaccttgcgcacacctctggggact1920atccctctgggtagcttcagggtcgcatcgggacagtacggcgagatcaagttgaccatt1980cgacctactctgacatctgatggtctcatagtcgggttctcctgcatcaacgccgtgcag2040aatcttgggtcctctgttggtcaaatcatcgtcagcggcaccgtagacctccgcaccgtc2100gaccagctggtcgagatgtggggctattcggaagctggtggcaccgcttcgtacattcaa2160ggcctgatcgagctggtcgggtga2184<210>15<211>1089<212>dna<213>伴放线菌聚集菌<220><221>misc_feature<223>添加的dspb序列<400>15atgaactgttgcgtcaagggcaattccatctacccccagaagacctccaccaagcagacc60ggcctgatgctcgatatcgcccggcatttctacagccccgaggtgatcaagagcttcatc120gatacgatcagcctgagcggcggcaacttcctccacctgcacttctcggaccatgaaaac180tatgccatcgagtcgcacctgctcaaccagcgggcggagaacgccgtccaggggaaggat240ggcatctacatcaatccgtacaccgggaaaccgttcctgagctaccgccagctggacgac300atcaaggcctacgccaaggccaagggcatcgaactgatcccggagctggacagcccgaac360catatgacggccatcttcaaactggtccagaaggaccgcggcgtcaagtacctgcagggg420ctgaaatcccgccaggtggacgacgagatcgacatcaccaacgccgatagcatcaccttc480atgcagagcctgatgagcgaggtcatcgatatcttcggcgacacgagccagcacttccac540atcggcggcgacgaattcggctactccgtcgagagcaaccacgagttcatcacctacgcc600aacaagctgtcgtacttcctggagaagaaggggctcaagacccgcatgtggaacgacggc660ctcatcaagaacaccttcgagcagatcaatcccaacatcgaaatcacgtactggtcgtac720gacggcgacacccaggataagaacgaagcggccgagcgccgcgacatgcgcgtgagcctg780ccggagctgctggcgaagggcttcaccgtgctgaactacaacagctactacctctacatc840gtgccgaaggcgagcccgacgttctcgcaggacgccgccttcgccgccaaagacgtgatc900aagaactgggatctgggcgtctgggatggccggaacaccaagaaccgcgtgcagaacacc960catgagatcgccggggcggcgctgtcgatctggggcgaggatgcgaaggcgctcaaggac1020gagacgatccagaagaacaccaaaagcctgctcgaggccgtcatccacaagaccaacggc1080gacgagtga1089<210>16<211>69<212>dna<213>金黄色葡萄球菌<220><221>misc_feature<223>添加的sapsma3序列<400>16atggagttcgtggcgaagctcttcaagttcttcaaggacctgctcgggaagttcctgggg60aataactga69<210>17<211>135<212>dna<213>金黄色葡萄球菌<220><221>misc_feature<223>添加的sapamb2序列<400>17atgaccggcctggccgaggcgatcgcgaataccgtccaggcggcccagcagcacgacagc60gtcaagctgggcacctcgatcgtggacatcgtcgccaacggcgtgggcctgctgggcaaa120ctcttcggcttctga135<210>18<211>69<212>dna<213>表皮葡萄球菌<220><221>misc_feature<223>添加的sepsma序列<400>18atggcggacgtcatcgccaagatcgtcgagatcgtgaagggcctgatcgaccagttcacc60cagaagtga69<210>19<211>228<212>dna<213>轻小病毒ms2<220><221>misc_feature<223>添加的ms2l序列<400>19atggagacccggttcccgcagcagtcccagcaaaccccggccagcaccaaccgccgccgc60cccttcaagcacgaggactacccgtgccgccggcagcagcgcagctccaccctgtacgtg120ctgatcttcctggcgatcttcctgagcaagttcaccaaccagctgctgctgtccctgctg180gaggcggtcatccggaccgtcaccaccctgcagcagctgctgacctga228<210>20<211>165<212>dna<213>轻小病毒prr1<220><221>misc_feature<223>添加的prr1l序列<400>20atgtgcaaggtgtctactaaggtagactctaaactgactgagtcagttggacaactcacc60ataaggagctacctatggctacggaatatcctagcattagcaggacttcttttcgtaatc120cttcttgcgaccaatcatttatccatcgctatctacagtccgtaa165<210>21<211>52<212>dna<213>phikmv样病毒luz19<220><221>misc_feature<223>luz19gp32启动子(p32)<400>21cgaccctgccctactccggccttaaacccacatccaaaagagagagaatcgc52<210>22<211>96<212>dna<213>phikmv样病毒luz19<220><221>misc_feature<223>luz19gp32终止子(t32)<400>22tgccacgaaaccccgcacttcggtgtggggtttcttcaaagcctaacgacccgcgcagat60tccctgcgtgggtttttgcgctttaggagaaaccct96<210>23<211>204<212>dna<213>phikmv样病毒luz19<220><221>misc_feature<223>野生型luz19gp7区域<400>23tacaaggtggtggcacccagctcggcggaaggtatcattgtgctggcgaccaagcagacg60ccggcgctagcccaagcagccgtcgtactgcacagcatgaaccctgcgcagtatcccgca120ggttcggctatcctcaacacggcctggaagtgccgccgcctgggagtgggcgagtacgtc180aagctcgtccaaggggaggaggac204<210>24<211>321<212>dna<213>phikmv样病毒luz19<220><221>misc_feature<223>野生型luz19gp18区域<400>24gaatgccaaccgaagaagaacgcatgatccgctgtttactggcggatatccacgagccac60tggacctgctgttccccggcctccgtaccaaggcccatatggacccgcaagcagaggaac120tgtcgattcgaattgactacgaccatgcgaagctgggccgtatgggattctgccacgcgg180tatccctatatcaactgtccatatatggccgcgaggggatggtccgctacctgatgcagg240agattccccgccgcgtgctggaaggtctgctggtcaaggcgcagcagtacagccaaagca300actggtacagcaaatgacgac321<210>25<211>225<212>dna<213>phikmv样病毒lkd16<220><221>misc_feature<223>野生型luz19gp49和gp48-gp49基因间区域<400>25ggggacaccatgagcaaagccaaactacgagtcatcgccgacaccccggagctggagtca60gtgctaaaagcattgctgaccgccacctacgctatcgaggacctgctcaacgaggccgtg120gctagcaaggtgctaaactcccgcctgggctggtccgcagtcggcgagtatgtcgaactg180ttcaaccgcacgcaatcccgcgtggccgggttgattcccgagtag225<210>26<211>345<212>dna<213>phikmv样病毒lkd16<220><221>misc_feature<223>野生型lkd16gp18基因<400>26gtgcgagtaccaactgaacacgagcgcaccctgcgctgcctgctccaagacatccacggg60ccgctgaatctgctgttcccaggtatccgggtgaaggtggaggaggcgtgcctcggatac120ttgggctacagggagcggggctattgggagctgcgcctccaggtggactacgaccacccg180aagcttgggcacctccgctacagtcaggccgtgccggagtacgtgctgatcaacgaccgc240gacagcatcatcaagtacctgatggaagcagtccctcggcaggtactagagggcatgctc300aataaggcccaggaattcgtaaccaagaactggtattccctatga345<210>27<211>4269<212>dna<213>人工序列<220><223>编码nls-flag-cas9-his的基因<400>27atgcccaagaaaaagcggaaggtcggcgactacaaggatgacgatgacaagttggagcct60ggagagaagccctacaaatgccctgagtgcggaaagagcttcagccaatctggagccttg120acccggcatcaacgaacgcatacacgagacaagaagtactccatcgggctggacatcggg180acgaactccgtgggatgggccgtgatcacagacgaatacaaggtgccttccaagaagttc240aaggtgctggggaacacggacagacactccatcaagaagaacctcatcggggccttgctc300ttcgactccggagaaaccgccgaagcaacgcgattgaaaagaaccgccagaagacgatac360acacgacggaagaaccgcatctgctacctccaggagatcttcagcaacgagatggccaag420gtggacgactcgttctttcatcgcctggaggagagcttcctggtggaggaagacaagaaa480catgagcgccacccgatcttcgggaacatcgtggacgaagtggcctaccacgagaaatac540cccacgatctaccacttgcgcaagaaactcgtggactccacggacaaagcggacttgcgg600ttgatctacttggccttggcccacatgatcaaatttcggggccacttcctgatcgagggc660gacttgaatcccgacaattccgacgtggacaagctcttcatccagctggtgcagacctac720aaccagctcttcgaggagaaccccatcaatgcctccggagtggacgccaaagccatcttg780tccgcccgattgtccaaatccagacgcttggagaacttgatcgcacaacttcctggcgag840aagaagaacggcctcttcggcaacttgatcgcgctgtcgctgggattgacgcctaacttc900aagtccaacttcgacttggccgaggacgccaagttgcaactgtccaaggacacctacgac960gacgacctcgacaacctgctggcccaaattggcgaccaatacgcggacttgtttttggcg1020gccaagaacttgagcgacgccatcttgttgagcgacatcttgcgcgtgaatacggagatc1080accaaagcccctttgtccgcctctatgatcaagcggtacgacgagcaccaccaagacttg1140accctgttgaaagccctcgtgcggcaacaattgcccgagaagtacaaggagatcttcttc1200gaccagtccaagaacgggtacgccggctacatcgacggaggagcctcccaagaagagttc1260tacaagttcatcaagcccatcctggagaagatggacggcaccgaggagttgctcgtgaag1320ctgaaccgcgaagacttgttgcgaaaacagcggacgttcgacaatggcagcatcccccac1380caaatccatttgggagagttgcacgccatcttgcgacggcaagaggacttctacccgttc1440ctgaaggacaaccgcgagaaaatcgagaagatcctgacgttcagaatcccctactacgtg1500ggacccttggcccgaggcaattcccggtttgcatggatgacgcgcaaaagcgaagagacg1560atcaccccctggaacttcgaagaagtggtcgacaaaggagcatccgcacagagcttcatc1620gagcgaatgacgaacttcgacaagaacctgcccaacgagaaggtgttgcccaagcattcg1680ctgctgtacgagtacttcacggtgtacaacgagctgaccaaggtgaagtacgtgaccgag1740ggcatgcgcaaacccgcgttcctgtcgggagagcaaaagaaggccattgtggacctgctg1800ttcaagaccaaccggaaggtgaccgtgaaacagctgaaagaggactacttcaagaagatc1860gagtgcttcgactccgtggagatctccggcgtggaggaccgattcaatgcctccttggga1920acctaccatgacctcctgaagatcatcaaggacaaggacttcctggacaacgaggagaac1980gaggacatcctggaggacatcgtgctgaccctgaccctgttcgaggaccgagagatgatc2040gaggaacggttgaaaacgtacgcccacttgttcgacgacaaggtgatgaagcagctgaaa2100cgccgccgctacaccggatggggacgattgagccgcaaactgattaatggaattcgcgac2160aagcaatccggaaagaccatcctggacttcctgaagtccgacgggttcgccaaccgcaac2220ttcatgcagctcatccacgacgactccttgaccttcaaggaggacatccagaaggcccaa2280gtgtccggacaaggagactccttgcacgagcacatcgccaatttggccggatcccccgca2340atcaaaaaaggcatcttgcaaaccgtgaaagtggtcgacgaactggtgaaggtgatggga2400cggcacaagcccgagaacatcgtgatcgaaatggcccgcgagaaccaaaccacccaaaaa2460ggacagaagaactcccgagagcgcatgaagcggatcgaagagggcatcaaggagttgggc2520tcccagatcctgaaggagcatcccgtggagaatacccaattgcaaaacgagaagctctac2580ctctactacctccagaacgggcgggacatgtacgtcgaccaagagctggacatcaaccgc2640ctctccgactacgatgtggatcatattgtgccccagagcttcctcaaggacgacagcatc2700gacaacaaggtcctgacgcgcagcgacaagaaccggggcaagtctgacaatgtgccttcc2760gaagaagtcgtgaagaagatgaagaactactggcggcagctgctcaacgccaagctcatc2820acccaacggaagttcgacaacctgaccaaggccgagagaggaggattgtccgagttggac2880aaagccggcttcattaaacgccaactcgtggagacccgccagatcacgaagcacgtggcc2940caaatcttggactcccggatgaacacgaaatacgacgagaatgacaagctgatccgcgag3000gtgaaggtgatcacgctgaagtccaagctggtgagcgacttccggaaggacttccagttc3060tacaaggtgcgggagatcaacaactaccatcacgcccatgacgcctacctgaacgccgtg3120gtcggaaccgccctgatcaagaaataccccaagctggagtccgaattcgtgtacggagat3180tacaaggtctacgacgtgcggaagatgatcgcgaagtccgagcaggagatcggcaaagcc3240accgccaagtacttcttttactccaacatcatgaacttcttcaagaccgagatcacgctc3300gccaacggcgagatccgcaagcgccccctgatcgagaccaacggcgagacgggagagatt3360gtgtgggacaaaggaagagattttgccacagtgcgcaaggtgctgtccatgcctcaggtg3420aacatcgtgaagaagaccgaggtgcaaacaggagggttttccaaagagtccattttgcct3480aagaggaattccgacaagctcatcgcccgcaagaaggactgggaccccaagaagtacggg3540ggcttcgactcccccacggtggcctactccgtgttggtggtggccaaagtggagaaaggg3600aagagcaagaagctgaaatccgtgaaggagttgctcggaatcacgatcatggaacgatcg3660tcgttcgagaaaaaccccatcgacttcctcgaagccaaagggtacaaagaggtgaagaag3720gacctgatcatcaagctgcccaagtactccctgttcgagctggagaacggccgcaagcgg3780atgctggcctccgccggggaactgcagaaagggaacgaattggccttgccctccaaatac3840gtgaacttcctctacttggcctcccattacgaaaagctcaaaggatcccctgaggacaat3900gagcagaagcaactcttcgtggaacaacacaagcactacctggacgagatcatcgagcag3960atcagcgagttctccaagcgcgtgatcctcgccgacgccaacctggacaaggtgctctcc4020gcctacaacaagcaccgcgacaagcctatccgcgagcaagccgagaatatcattcacctg4080tttaccctgacgaatttgggagcccctgccgcctttaaatactttgacaccaccatcgac4140cgcaaaagatacacctccaccaaggaagtcttggacgccaccctcatccaccagtccatc4200acgggcctctacgagacgcgcatcgacctctcccaattgggcggcgaccatcatcaccac4260caccactaa4269<210>28<211>507<212>dna<213>丝状病毒m13mp18<220><221>misc_feature<223>替换的野生型m13mp18区域<400>28atgaccatgattacgaattcgagctcggtacccggggatcctctagagtcgacctgcagg60catgcaagcttggcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgtt120acccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagag180gcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgctttgcc240tggtttccggcaccagaagcggtgccggaaagctggctggagtgcgatcttcctgaggcc300gatacggtcgtcgtcccctcaaactggcagatgcacggttacgatgcgcccatctacacc360aacgtaacctatcccattacggtcaatccgccgtttgttcccacggagaatccgacgggt420tgttactcgctcacatttaatgttgatgaaagctggctacaggaaggccagacgcgaatt480atttttgatggcgttcctattggttaa507<210>29<211>792<212>dna<213>人工序列<220><223>未知的<220><221>misc_feature<223>paprika序列<220><221>misc_feature<223>从dna2.0商购可得的<400>29atggtgtcaaagggagaagaactgatcaaagagaatatgaggatgaaactctacatggaa60ggaactgtgaacaaccaccatttcaagtgcacgagcgagggtgaagggaaaccttacgaa120ggtacccagaccatgcggattaaggtcgtcgaaggaggaccactccccttcgcattcgac180atcctggccacttccttcatgtacgggtcgcgcactttcatcaagtacccaaaagggatc240cccgacttcttcaagcagtcctttccggagggattcacttgggaacgcgtcactagatac300gaggatggcggagtggtcaccgtgatgcaagacacctctttggaagatggatgcctggtg360taccacgtgcaagtcagaggagtgaactttccgagcaatgggccggtgatgcagaagaaa420accaagggctgggaaccgaacaccgaaatgctgtatccagcagacggaggcttggagggc480cggtccgacatggctctgaagcttgttggaggaggacatctgtcctgctcgttcgtgacg540acctaccggagcaagaagccggcgaaaaaccttaagatgccggggatccacgcggtggat600catcgcctggaaaggctcgaggagtcagacaacgagatgtttgtcgtgcaacgcgagcac660gccgtggcccgctactgtgatctcccttcaaagctgggccacaagctgaattccggcctc720cggtcgagagcccaggcttcgaattcagccgtggacggaactgcgggccctggttcgacc780ggaagccgatga792<210>30<211>294<212>dna<213>λ样λ<220><221>misc_feature<223>野生型大肠杆菌噬菌体<400>30atggttcgtgcaaacaaacgcaacgaggctctacgaatcgagagtgcgttgcttaacaaa60atcgcaatgcttggaactgagaagacagcggaagctgtgggcgttgataagtcgcagatc120agcaggtggaagagggactggattccaaagttctcaatgctgcttgctgttcttgaatgg180ggggtcgttgacgacgacatggctcgattggcgcgacaagttgctgcgattctcaccaat240aaaaaacgcccggcggcaaccgagcgttctgaacaaatccagatggagttctga294<210>31<211>1422<212>prt<213>人工序列<220><223>未知的<220><221>misc_feature<223>从seqidno:27翻译的nls-flag-cas9-his蛋白<400>31metprolyslyslysarglysvalglyasptyrlysaspaspaspasp151015lysleugluproglyglulysprotyrlyscysproglucysglylys202530serpheserglnserglyalaleuthrarghisglnargthrhisthr354045argasplyslystyrserileglyleuaspileglythrasnserval505560glytrpalavalilethraspglutyrlysvalproserlyslysphe65707580lysvalleuglyasnthrasparghisserilelyslysasnleuile859095glyalaleuleupheaspserglygluthralaglualathrargleu100105110lysargthralaargargargtyrthrargarglysasnargilecys115120125tyrleuglngluilepheserasnglumetalalysvalaspaspser130135140phephehisargleuglugluserpheleuvalglugluasplyslys145150155160hisgluarghisproilepheglyasnilevalaspgluvalalatyr165170175hisglulystyrprothriletyrhisleuarglyslysleuvalasp180185190serthrasplysalaaspleuargleuiletyrleualaleualahis195200205metilelyspheargglyhispheleuilegluglyaspleuasnpro210215220aspasnseraspvalasplysleupheileglnleuvalglnthrtyr225230235240asnglnleupheglugluasnproileasnalaserglyvalaspala245250255lysalaileleuseralaargleuserlysserargargleugluasn260265270leuilealaglnleuproglyglulyslysasnglyleupheglyasn275280285leuilealaleuserleuglyleuthrproasnphelysserasnphe290295300aspleualagluaspalalysleuglnleuserlysaspthrtyrasp305310315320aspaspleuaspasnleuleualaglnileglyaspglntyralaasp325330335leupheleualaalalysasnleuseraspalaileleuleuserasp340345350ileleuargvalasnthrgluilethrlysalaproleuseralaser355360365metilelysargtyraspgluhishisglnaspleuthrleuleulys370375380alaleuvalargglnglnleuproglulystyrlysgluilephephe385390395400aspglnserlysasnglytyralaglytyrileaspglyglyalaser405410415glnglugluphetyrlyspheilelysproileleuglulysmetasp420425430glythrglugluleuleuvallysleuasnarggluaspleuleuarg435440445lysglnargthrpheaspasnglyserileprohisglnilehisleu450455460glygluleuhisalaileleuargargglngluaspphetyrprophe465470475480leulysaspasnargglulysileglulysileleuthrpheargile485490495protyrtyrvalglyproleualaargglyasnserargphealatrp500505510metthrarglysserglugluthrilethrprotrpasnphegluglu515520525valvalasplysglyalaseralaglnserpheilegluargmetthr530535540asnpheasplysasnleuproasnglulysvalleuprolyshisser545550555560leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys565570575tyrvalthrgluglymetarglysproalapheleuserglyglugln580585590lyslysalailevalaspleuleuphelysthrasnarglysvalthr595600605vallysglnleulysgluasptyrphelyslysileglucyspheasp610615620servalgluileserglyvalgluaspargpheasnalaserleugly625630635640thrtyrhisaspleuleulysileilelysasplysasppheleuasp645650655asnglugluasngluaspileleugluaspilevalleuthrleuthr660665670leuphegluaspargglumetileglugluargleulysthrtyrala675680685hisleupheaspasplysvalmetlysglnleulysargargargtyr690695700thrglytrpglyargleuserarglysleuileasnglyileargasp705710715720lysglnserglylysthrileleuasppheleulysseraspglyphe725730735alaasnargasnphemetglnleuilehisaspaspserleuthrphe740745750lysgluaspileglnlysalaglnvalserglyglnglyaspserleu755760765hisgluhisilealaasnleualaglyserproalailelyslysgly770775780ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly785790795800arghislysprogluasnilevalileglumetalaarggluasngln805810815thrthrglnlysglyglnlysasnserarggluargmetlysargile820825830glugluglyilelysgluleuglyserglnileleulysgluhispro835840845valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu850855860glnasnglyargaspmettyrvalaspglngluleuaspileasnarg865870875880leuserasptyraspvalasphisilevalproglnserpheleulys885890895aspaspserileaspasnlysvalleuthrargserasplysasnarg900905910glylysseraspasnvalproserglugluvalvallyslysmetlys915920925asntyrtrpargglnleuleuasnalalysleuilethrglnarglys930935940pheaspasnleuthrlysalagluargglyglyleusergluleuasp945950955960lysalaglypheilelysargglnleuvalgluthrargglnilethr965970975lyshisvalalaglnileleuaspserargmetasnthrlystyrasp980985990gluasnasplysleuilearggluvallysvalilethrleulysser99510001005lysleuvalseraspphearglysasppheglnphetyrlysval101010151020arggluileasnasntyrhishisalahisaspalatyrleuasn102510301035alavalvalglythralaleuilelyslystyrprolysleuglu104010451050sergluphevaltyrglyasptyrlysvaltyraspvalarglys105510601065metilealalyssergluglngluileglylysalathralalys107010751080tyrphephetyrserasnilemetasnphephelysthrgluile108510901095thrleualaasnglygluilearglysargproleuilegluthr110011051110asnglygluthrglygluilevaltrpasplysglyargaspphe111511201125alathrvalarglysvalleusermetproglnvalasnileval113011351140lyslysthrgluvalglnthrglyglypheserlysgluserile114511501155leuprolysargasnserasplysleuilealaarglyslysasp116011651170trpaspprolyslystyrglyglypheaspserprothrvalala117511801185tyrservalleuvalvalalalysvalglulysglylysserlys119011951200lysleulysservallysgluleuleuglyilethrilemetglu120512101215argserserpheglulysasnproileasppheleuglualalys122012251230glytyrlysgluvallyslysaspleuileilelysleuprolys123512401245tyrserleuphegluleugluasnglyarglysargmetleuala125012551260seralaglygluleuglnlysglyasngluleualaleuproser126512701275lystyrvalasnpheleutyrleualaserhistyrglulysleu128012851290lysglyserprogluaspasngluglnlysglnleuphevalglu129513001305glnhislyshistyrleuaspgluileilegluglnileserglu131013151320pheserlysargvalileleualaaspalaasnleuasplysval132513301335leuseralatyrasnlyshisargasplysproileargglugln134013451350alagluasnileilehisleuphethrleuthrasnleuglyala135513601365proalaalaphelystyrpheaspthrthrileasparglysarg137013751380tyrthrserthrlysgluvalleuaspalathrleuilehisgln138513901395serilethrglyleutyrgluthrargileaspleuserglnleu140014051410glyglyasphishishishishishis14151420<210>32<211>909<212>dna<213>巨细胞病毒hcmv<220><221>misc_feature<223>编辑后hcmvrl13片段<400>32atggactggcgatttacggttacgtggacgatactaatgtccgcgttgtcagaaagctgc60aatcaaacctgttcttgtcaatgtccctgtagtactaccgttaactattcaactagtact120gagacagccacatcaacatacagtacaacagttatcagcaataaaagcacttcagaatct180ataaattgctctactgcaactacaccagcaaacaccgtttctacaaaaccgtcggaaaca240accacacagatatccacaacgacgaacacaaacgttgagactaccacatgtaccaacacc300accacgaccgttacttgtgatggtttcaattatacagtccataaaagatgcgatcgcagt360tacgaggtaatcaacgtaacaggatacgttggtagcaacataactctaaaaaaatgcaat420cagactgagaaatggcacaatgtagactggattcattatgagtaccccacgcataaaatg480tgcgaattaggcaactatcaccaaaccacaccacggcacgacatatgttttgactgcaac540gacacctccctaactatctacaacttaaccacaaaaaacgctggaaaatataccaggcgt600caccgtgataacggtcaagaagaaaattactacgtaacggtgttaattggagacacaacg660ttattcactcttggcacatgccctgtaagatataaagaatctacgaacactgaaaacacc720attggaagtagcatcatagaaaccattgagaaagctaacattcccctgggaattcatgct780gtatgggcaggcgtagtggtatcagtggcgcttatagcgttgtacatgggtagccatcgc840attcccaaaaagccgcattacaccaaacttcccaaatatgatccagatgaattttggact900aaggcttaa909<210>33<211>630<212>dna<213>巨细胞病毒hcmv<220><221>misc_feature<223>编辑前hcmvrl13片段<400>33atggactggcgatttacggttacgtggaccgttacttgtgatggtttcaattatacagtc60cataaaagatgcgatcgcagttacgaggtaatcaacgtaacaggatacgttggtagcaac120ataactctaaaaaaatgcaatcagactgagaaatggcacaatgtagactggattcattat180gagtaccccacgcataaaatgtgcgaattaggcaactatcaccaaaccacaccacggcac240gacatatgttttgactgcaacgacacctccctaactatctacaacttaaccacaaaaaac300gctggaaaatataccaggcgtcaccgtgataacggtcaagaagaaaattactacgtaacg360gtgttaattggagacacaacgttattcactcttggcacatgccctgtaagatataaagaa420tctacgaacactgaaaacaccattggaagtagcatcatagaaaccattgagaaagctaac480attcccctgggaattcatgctgtatgggcaggcgtagtggtatcagtggcgcttatagcg540ttgtacatgggtagccatcgcattcccaaaaagccgcattacaccaaacttcccaaatat600gatccagatgaattttggactaaggcttaa630<210>34<211>95<212>prt<213>phikmv样病毒luz19<220><221>misc_feature<223>野生型luz19gp13蛋白质序列<400>34metleualaleuglyalapheaspleuserglyleumetvalglyser151015cysleuvalvalglyglygluleulysalaleucysvalaspasparg202530hisserargglnglyileglyalagluleuvalargalaalagluleu354045alaglyalaglutyrleuthrcyspheglupheleugluprophetyr505560alaaspleuglytrpserthrthrhisargglualaasntrpthrala65707580glygluproaspvalleuhismetargalaproglyhisaspval859095<210>35<211>251<212>prt<213>phikmv样病毒luz19<220><221>misc_feature<223>野生型luz19gp38蛋白质序列<400>35metalaargphelysasnprogluthrilehisvalalaaspglyval151015glualavalpheserleuaspphepropheleuargarggluaspval202530phevalglnvalasplysileleuvalthrasptyrthrtrpvalasp354045aspthrasnileglnleualavalvalprolyslysaspglngluval505560argilepheargaspthrproalaglnvalproaspthrglnpheser65707580glnaspilepropheleuproargtyrileaspalaasnasnlysgln859095leuleutyralavalglngluglyileasnthralaasnleualaleu100105110aspglyvalleuaspalaileargilealagluglualaargargleu115120125alaglnglualaleuaspalaalaasnglualaleuargargalaleu130135140glyphealagluileargthrvalthrgluaspseraspileasppro145150155160sertrpargglytyrtrpasnargcysilethralaasplysproleu165170175thrleuthrmetglnmetgluaspproaspalaprotrpvalgluphe180185190sergluvalhisphegluglnalaglyvalargaspleuasnileval195200205alaglyproglyvalthrileasnargleuglnasnthrthrmetgln210215220leutyrglygluasnglyvalcysthrleulysargleuglyalaasn225230235240histrpilevalpheglyalametgluaspglu245250<210>36<211>301<212>prt<213>phikmv样病毒luz19<220><221>misc_feature<223>野生型luz19gp40蛋白质序列<400>36metphelysthrgluvallysglyargtyrthrleuileargarglys151015alaaspglythrprovalgluthrleuglupheaspasnileilethr202530asnalaglyleuasptrpilealaalametaspthraspleumetgly354045gluprovalalavalserthrserthralaaspproasnproserala505560proalaileprogluvalvalglnargthrseralaseralaprogly65707580glyglythrthrserglyleuaspglyglutrpleuphetrpargarg859095argtrpargpheproglnglythrleualaglyglnvalleualathr100105110valglyleuilecysasnseraspargargphegluserasnthrgly115120125gluleuileprolysaspthrproleusertyrthrargilelysasp130135140alaalaglyglnprothrthrleuvalvalalaalaaspgluileleu145150155160aspvalglntyrglupheargserargprovalglythralagluala165170175lysphevalileserglyvalgluargthrpheargleuileprolys180185190prophealaasnargalaasnleuserglygluargtyrilephetyr195200205asnthrasnprotyrileasnglylysaspalaserglyglyasnval210215220argaspglyglntrpglnlyslystyrprolystyrvalargglyser225230235240tyrlysalaglnilethrleuleualaglnvalglnasnglyasnmet245250255alaglyglyilethrglythrglugluleuglniletyrasnglyarg260265270asntyrvalleuaspileasnproprovalvallysasnasnthrgln275280285gluphethrvalthrleugluphethrvalalaargala290295300<210>37<211>498<212>prt<213>铜绿假单胞菌<220><221>misc_feature<223>pyos5蛋白质序列<400>37metserasnaspasngluvalproglysermetvalilevalalagln151015glyproaspaspglntyralatyrgluvalproproileaspserala202530alavalalaglyasnmetpheglyaspleuileglnarggluiletyr354045leuglnlysasniletyrtyrprovalargserilephegluglngly505560thrlysglulyslysgluileasnlyslysvalseraspglnvalasp65707580glyleuleulysglnilethrglnglylysargglualathrarggln859095gluargvalaspvalmetseralavalleuhislysmetgluserasp100105110leugluglytyrlyslysthrphethrlysglypropheileasptyr115120125glulysglnserserleuseriletyrglualatrpvallysiletrp130135140glulysasnsertrpglugluarglyslystyrpropheglnglnleu145150155160valargaspgluleugluargalavalalatyrtyrlysglnaspser165170175leuserglualavallysvalleuargglngluleuasnlysglnlys180185190alaleulysglulysgluaspleuserglnleugluargasptyrarg195200205thrarglysalaasnleuglumetlysvalglnsergluleuaspgln210215220alaglyseralaleuproproleuvalserprothrprogluglntrp225230235240leugluargalathrargleuvalthrglnalailealaasplyslys245250255glnleuglnthrthrasnasnthrleuilelysasnserprothrpro260265270leuglulysglnlysalailetyrasnglygluleuleuvalaspglu275280285ilealaserleuglnalaargleuvallysleuasnalagluthrthr290295300argargargthrglualagluarglysalaalaglugluglnalaleu305310315320glnaspalailelysphethralaaspphetyrlysgluvalthrglu325330335lyspheglyalaargthrserglumetalaargglnleualaglugly340345350alaargglylysasnileargserseralaglualailelysserphe355360365glulyshislysaspalaleuasnlyslysleuserleulysasparg370375380glnalailealalysalapheaspserleuasplysglnmetmetala385390395400lysserleuglulyspheserlysglypheglyvalvalglylysala405410415ileaspalaalaserleutyrglngluphelysileserthrgluthr420425430glyasptrplysprophephevallysilegluthrleualaalagly435440445alaalaalasertrpleuvalglyilealaphealathralathrala450455460thrproileglyileleuglyphealaleuvalmetalavalthrgly465470475480alametileaspgluaspleuleuglulysalaasnasnleuvalile485490495serile<210>38<211>114<212>prt<213>phikmv样病毒lkd16<220><221>misc_feature<223>lkd16gp18蛋白质序列<400>38metargvalprothrgluhisgluargthrleuargcysleuleugln151015aspilehisglyproleuasnleuleupheproglyileargvallys202530valgluglualacysleuglytyrleuglytyrarggluargglytyr354045trpgluleuargleuglnvalasptyrasphisprolysleuglyhis505560leuargtyrserglnalavalproglutyrvalleuileasnasparg65707580aspserileilelystyrleumetglualavalproargglnvalleu859095gluglymetleuasnlysalaglngluphevalthrlysasntrptyr100105110serleu<210>39<211>769<212>prt<213>phikmv样病毒lka1<220><221>misc_feature<223>lka1gp49蛋白质序列<400>39metalaglnthrproserthrtrpalaasptyrvalglyaspglyval151015gluaspthrpheglnvalthrpheprotyrglnlysglnglngluval202530phevalthrvalglyglyaspproalaalaphethrpheileserala354045glytrpileglnleualaalavalprovalasnglyalaalailearg505560valargargserthrglualaphegluproarghisgluphealaasn65707580glyvalproleuleuproargpheileaspgluasnasnthrglnphe859095leutyrthrvalglnglualavalasngluthrhisglyilealaser100105110glualaleuservalalagluglualaargglyilealaglnalaala115120125serasplysvalaspalaalathrileaspseralahisglnleuarg130135140leuaspleualaaspproalalysglyproglyleuleuglytyrasp145150155160argaspvalsertyrprovalglyservalglyglnserleuglnphe165170175leuglumetglyargvalthrproalaglnpheglyalavalglyasp180185190glyalaserhisproleusergluargtyralathrleualagluala195200205glnthrvaltyrprohisalavalalaleuseraspgluileasptrp210215220alaalaleuglnalaalavalaspserglyalaprovalhisilepro225230235240serglyasptyrglnileasnargglyileserserthrglyserleu245250255glnilealaglyaspglyalathrserileileargprothralaala260265270phethrglythrservalleusercysvalglyserleuvalalaleu275280285proasnileserservalseralaglyserleuthrileasppheala290295300serthrproasnleuvalalaglyaspvalpheileiletyrasnpro305310315320thraspserserpheserglypheargthrsertyrargalaglyglu325330335phecysgluvalargalavalserglyasnthrvalthrileargser340345350alaleutyralaalatyraspglyalathrvalalailetyrlysval355360365valserglyvalvalaspilealaserileglnilevalglyglythr370375380valprometasnglyleuleuvalglualavalvalserproargval385390395400aspaspvalthrvalthrleualaasnasnalaglyvaltyrpheala405410415argcystyraspalalysilethrasnserasnileserasnilegly420425430aspglyglyaspasptyrglyileilepheglyasncyshisaspgly435440445glyalaaspasncyslysvaltyralaargarghisalailealathr450455460glyglyaspalagluvalglycysvalprovalargasnvalargmet465470475480argasncysthrleuargasnaspilethrserglythrhiscysala485490495aspphehisglyasnalagluaspcyssertyrgluasncysthrile500505510tyrglyglyalathrtrpglnglylysaspilesertyrarghiscys515520525thrilethrasnalaserglyglytrpilevalileseralagluile530535540leuglyglythrpheleuleuaspglncysthrleutyrthrthrgly545550555560aspproglnproglyasnargglyvalileaspvalglyglyasnser565570575alavalleuthrthrasnthrthrglnprocysasnpheleuilegln580585590glyglyserleuargalaproserleuserthrsersertyrleuleu595600605argalaargleugluglyserthrvalprovalasnileglntyrser610615620glyglnalaileaspvalglyserleuglylysvalleuglnleuasp625630635640ilethrserglyserthrserproglutyrleuilevalgluasnleu645650655alaglyleuproserglyilethrleualaseralaalaglyglyphe660665670alaseralaprometargmetprovalleuglyglyargvalglnval675680685thrthralathrasnalaserservalthralaprovalthrphearg690695700tyriletyrprolysalaprothrvalglnvalthrlysthrasparg705710715720sertyralaglyasnargvalglyvalalailealaasnprothrser725730735alaserglyalathrleuglyleuphethraspaspglythrasnphe740745750serseralavalthrasnglnleuasntrpglnalaglyiletyrglu755760765val<210>40<211>651<212>prt<213>phikmv样病毒ntuh-k2044-k1-1<220><221>misc_feature<223>ntuh-k2044-k1-1gp34蛋白质序列<400>40metalaleuileargleuvalalaprogluargvalpheseraspleu151015alasermetvalalatyrproasnpheglnvalglnasplysilethr202530leuleuglyseralaglyglyaspphethrphethrthrthralaser354045valvalaspasnglythrvalphealavalproglyglytyrleuleu505560arglysphevalglyproalatyrsersertrppheserasntrpthr65707580glyilevalthrphemetseralaproasnarghisleuvalvalasp859095thrvalleuglnalathrservalleuasnilelysserasnserthr100105110leugluphethraspthrglyargileleuproaspalaalavalala115120125argglnvalleuasnilethrglyseralaproservalphevalpro130135140leualaalaaspalaalaalaglyserlysvalilethrvalalaala145150155160glyalaleuseralavallysglythrtyrleutyrleuargserasn165170175lysleucysaspglyglyproasnthrtyrglyvallysilesergln180185190ilearglysvalvalglyvalserthrserglyglyvalthrserile195200205argleuasplysalaleuhistyrasntyrtyrleuseraspalaala210215220gluvalglyileprothrmetvalgluasnvalthrleuvalserpro225230235240tyrileasnglupheglytyraspaspleuasnargphephethrser245250255glyileseralaasnphealaalaaspleuhisileglnaspglyval260265270ileileglyasnlysargproglyalaseraspilegluglyargser275280285alailelyspheasnasncysvalaspserthrvallysglythrcys290295300phetyrasnileglytrptyrglyvalgluvalleuglycysserglu305310315320aspthrgluvalhisaspilehisalametaspvalarghisalaile325330335serleuasntrpglnserthralaaspglyasplystrpglyglupro340345350ileglupheleuglyvalasncysglualatyrserthrthrglnala355360365glypheaspthrhisaspileglylysargvallysphevalargcys370375380valsertyraspseralaaspaspglypheglnalaargthrasngly385390395400valglutyrleuasncysargalatyrargalaalametaspglyphe405410415alaserasnthrglyvalalapheproiletyrargglucysleuala420425430tyraspasnvalargserglypheasncyssertyrglyglyglytyr435440445valtyraspcysglualahisglyserglnasnglyvalargileasn450455460glyglyargvallysglyglyargtyrthrargasnserserserhis465470475480ilephevalthrlysaspvalalagluthralaglnthrserleuglu485490495ileaspglyvalsermetargtyraspglythrglyargalavaltyr500505510phehisglythrvalglyileaspprothrleuvalsermetserasn515520525asnaspmetthrglyhisglyleuphetrpalaleuleuserglytyr530535540thrvalglnprothrproproargmetserargasnleuleuaspasp545550555560thrglyileargglyvalalathrleuvalalaglyglualathrval565570575asnalaargvalargglyasnpheglyservalalaasnserphelys580585590trpvalsergluvallysleuthrargleuthrpheproserserala595600605glyalaleuthrvalthrservalalaglnasnglnaspvalprothr610615620proasnproaspleuasnserphevalileargserserasnalaala625630635640aspvalserglnvalalatrpgluvaltyrleu645650<210>41<211>727<212>prt<213>t7-样pp15<220><221>misc_feature<223>pp15gp44蛋白质序列<400>41metalaargthrilevalglnasnalaleuthrglyglyglnglnasp151015phegluvalpropheasptyrileleuglnargphevallysleuthr202530leuileglyaspglyasnargglngluleuvalleuglythraspphe354045argpheileglyproargthrvalargthrasnvalphetrpglypro505560alaglnglytyrthrserilegluileargargvalthrseralaser65707580aspargargvalglupheseraspglyserileleuthralaglyasp859095leuasnilealaglnleuglnalailehisilealagluglualaarg100105110aspseralathrgluasnleuserproaspalaaspglyasntyrasp115120125alaargglyalaargiletyrasnleuglyaspalavalglnprolys130135140aspalavalasnargtyrthrleuaspleualailealaalaalaleu145150155160alametasnthrglyasnproasnasnalaglnasnilesertyrthr165170175proasnglyproglyglnserileargservalgluglyargleuarg180185190aspalavalphevalserasptyrmetthrthrproargaspglyval195200205thrserasnglnglnaspleuglulysalaleualaalaalaasnala210215220lysglyalaaspleuphetrpproaspaspileprophepheserthr225230235240serproleualaleuilehisalavaltyrhisvalglyargglyval245250255ileasnalaasnglythrleuphetyrvalasnprolysasnglygln260265270hisasnargleuhisvalserproglyglythrglyaspglyleuala275280285alaglyargproleuglythriletrpseralaleualaalaleuasn290295300metargalaproleuthrthrargtrpserleuglumetthralagly305310315320alatyrasnglualavalthrleuproasntyrleuthrsercysasn325330335asptyrleualapheasntrpproasnthrglyglngluargmetglu340345350prothralatyrproseralaleuaspglythrglyglnthrglyleu355360365thrglyphehisthrglyileglyasnargilethrileasnasnval370375380cysmetserasntrptyraspthralaleuthrprothrglnglnval385390395400argargalaphevalvalglyalatyrserthralatyrvalvalasn405410415cysalapheiletyrasnglyilealaservalservalleuprogly420425430glythralailevalthrglyglyilevalaspglyglyargphegly435440445leuaspasnthrglyglyargleuserleuthralathrlysserasn450455460tyrthrglnvalargasncysleuglutyrglyleutyrserlyshis465470475480aspalaserthrvalmetaspasnthrglupheargasncysglyasn485490495hisproalaalavalalatyrglyalaalailephealatyrlysphe500505510asncysservalaspthrargglyvallysphetyrglyasnasnile515520525alaglnhiscysargglyglyilethrseraspasnproglyasppro530535540aspiletyrglythrglyalaaspalaasnlysargleupheleucys545550555560thrglyglyglyseraspaspileglnphetyrglualaargargval565570575metaspilethrlysargthrglyglyglyserthrthralaserval580585590serserleuleuleualaalavalalaservalarglysglytyrphe595600605alahisasnaspglnvalileargmetthrleumetpheargalathr610615620glyseralaglyilephethrprothrleuargthrproleuglythr625630635640ileproleuglyserpheargvalalaserglyglntyrglygluile645650655lysleuthrileargprothrleuthrseraspglyleuilevalgly660665670phesercysileasnalavalglnasnleuglyserservalglygln675680685ileilevalserglythrvalaspleuargthrvalaspglnleuval690695700glumettrpglytyrserglualaglyglythralasertyrilegln705710715720glyleuilegluleuvalgly725<210>42<211>362<212>prt<213>伴放线菌聚集菌<220><221>misc_feature<223>dspb蛋白质序列<400>42metasncyscysvallysglyasnseriletyrproglnlysthrser151015thrlysglnthrglyleumetleuaspilealaarghisphetyrser202530progluvalilelysserpheileaspthrileserleuserglygly354045asnpheleuhisleuhispheserasphisgluasntyralaileglu505560serhisleuleuasnglnargalagluasnalavalglnglylysasp65707580glyiletyrileasnprotyrthrglylyspropheleusertyrarg859095glnleuaspaspilelysalatyralalysalalysglyilegluleu100105110ileprogluleuaspserproasnhismetthralailephelysleu115120125valglnlysaspargglyvallystyrleuglnglyleulysserarg130135140glnvalaspaspgluileaspilethrasnalaaspserilethrphe145150155160metglnserleumetsergluvalileaspilepheglyaspthrser165170175glnhisphehisileglyglyaspglupheglytyrservalgluser180185190asnhisglupheilethrtyralaasnlysleusertyrpheleuglu195200205lyslysglyleulysthrargmettrpasnaspglyleuilelysasn210215220thrphegluglnileasnproasnilegluilethrtyrtrpsertyr225230235240aspglyaspthrglnasplysasnglualaalagluargargaspmet245250255argvalserleuprogluleuleualalysglyphethrvalleuasn260265270tyrasnsertyrtyrleutyrilevalprolysalaserprothrphe275280285serglnaspalaalaphealaalalysaspvalilelysasntrpasp290295300leuglyvaltrpaspglyargasnthrlysasnargvalglnasnthr305310315320hisgluilealaglyalaalaleuseriletrpglygluaspalalys325330335alaleulysaspgluthrileglnlysasnthrlysserleuleuglu340345350alavalilehislysthrasnglyaspglu355360<210>43<211>22<212>prt<213>金黄色葡萄球菌<220><221>misc_feature<223>sapsma3蛋白质序列<400>43metgluphevalalalysleuphelysphephelysaspleuleugly151015lyspheleuglyasnasn20<210>44<211>44<212>prt<213>金黄色葡萄球菌<220><221>misc_feature<223>sapamb2蛋白质序列<400>44metthrglyleualaglualailealaasnthrvalglnalaalagln151015glnhisaspservallysleuglythrserilevalaspilevalala202530asnglyvalglyleuleuglylysleupheglyphe3540<210>45<211>22<212>prt<213>表皮葡萄球菌<220><221>misc_feature<223>sepsma蛋白质序列<400>45metalaaspvalilealalysilevalgluilevallysglyleuile151015aspglnphethrglnlys20<210>46<211>75<212>prt<213>轻小病毒ms2<220><221>misc_feature<223>ms2l蛋白质序列<400>46metgluthrargpheproglnglnserglnglnthrproalaserthr151015asnargargargprophelyshisgluasptyrprocysargarggln202530glnargserserthrleutyrvalleuilepheleualailepheleu354045serlysphethrasnglnleuleuleuserleuleuglualavalile505560argthrvalthrthrleuglnglnleuleuthr657075<210>47<211>54<212>prt<213>轻小病毒prr1<220><221>misc_feature<223>prr1l蛋白质序列<400>47metcyslysvalserthrlysvalaspserlysleuthrgluserval151015glyglnleuthrileargsertyrleutrpleuargasnileleuala202530leualaglyleuleuphevalileleuleualathrasnhisleuser354045ilealailetyrserpro50<210>48<211>106<212>prt<213>phikmv样病毒luz19<220><221>misc_feature<223>luz19gp18蛋白质序列<400>48metargmetprothrgluglugluargmetileargcysleuleuala151015aspilehisgluproleuaspleuleupheproglyleuargthrlys202530alahismetaspproglnalaglugluleuserileargileasptyr354045asphisalalysleuglyargmetglyphecyshisalavalserleu505560tyrglnleuseriletyrglyarggluglymetvalargtyrleumet65707580glngluileproargargvalleugluglyleuleuvallysalagln859095glntyrserglnserasntrptyrserlys100105<210>49<211>71<212>prt<213>phikmv样病毒luz19<220><221>misc_feature<223>luz19gp49蛋白质序列<400>49metserlysalalysleuargvalilealaaspthrprogluleuglu151015servalleulysalaleuleuthralathrtyralailegluaspleu202530leuasnglualavalalaserlysvalleuasnserargleuglytrp354045seralavalglyglutyrvalgluleupheasnargthrglnserarg505560valalaglyleuileproglu6570<210>50<211>321<212>dna<213>phikmv样病毒luz19<220><221>misc_feature<223>luz19gp18基因序列<400>50atgagaatgccaaccgaagaagaacgcatgatccgctgtttactggcggatatccacgag60ccactggacctgctgttccccggcctccgtaccaaggcccatatggacccgcaagcagag120gaactgtcgattcgaattgactacgaccatgcgaagctgggccgtatgggattctgccac180gcggtatccctatatcaactgtccatatatggccgcgaggggatggtccgctacctgatg240caggagattccccgccgcgtgctggaaggtctgctggtcaaggcgcagcagtacagccaa300agcaactggtacagcaaatga321<210>51<211>216<212>dna<213>phikmv样病毒luz19<220><221>misc_feature<223>luz19gp49蛋白质序列<400>51atgagcaaagccaaactacgagtcatcgccgacaccccggagctggagtcagtgctaaaa60gcattgctgaccgccacctacgctatcgaggacctgctcaacgaggccgtggctagcaag120gtgctaaactcccgcctgggctggtccgcagtcggcgagtatgtcgaactgttcaaccgc180acgcaatcccgcgtggccgggttgattcccgagtag216当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1