VI-B型CRISPR酶和系统的制作方法

文档序号:16514548发布日期:2019-01-05 09:32阅读:570来源:国知局
本申请要求2015年10月22日提交的美国临时专利62/245,270、2016年2月17日提交的美国临时专利62/296,548、2016年8月17日提交的美国临时专利62/376,382和2016年8月17日提交的美国临时专利62/376,367的优先权。在本文引用的文献中引用或参考的所有文献,连同针对在本文中提及或通过引用结合在本文中的任何文献中的任何产品的任何制造商的说明书、说明、产品规格、以及产品表,特此通过引用结合在此,并且可以在本发明的实践中采用。更具体地说,所有参考的文献均通过引用并入本文,其程度如同每个单独的文献被确切地并单独地指明通过引用而并入本文。关于联邦资助研究的声明本发明是根据由美国国立卫生研究院(nationalinstitutesofhealth)授予的授权号mh100706、dk097768和mh110049在美国政府支持下完成的。政府享有本发明的某些权利。本发明总体上涉及用于控制涉及序列靶向的基因表达的系统、方法、和组合物,该序列靶向如可使用涉及规律间隔成簇短回文重复(crispr)及其组分的载体系统的基因转录物干扰或核酸编辑。
背景技术
::在基因组测序技术和分析方法中的最新进展显著加速了对与范围广泛的生物功能和疾病相关联的遗传因子进行编目和映射的能力。精确的基因组靶向技术是通过允许个体遗传元件的选择性干扰而使得因果性遗传变异的系统性逆向工程化成为可能、以及推进合成生物学、生物技术应用、和医学应用所需要的。虽然基因组编辑技术,如设计师锌指、转录激活子样效应因子(tale)、或归巢大范围核酸酶(homingmeganuclease)对于产生靶向的基因组干扰是可得的,但是仍然需要采用新颖的策略和分子机制且是负担得起的、易于建立的、可扩展的、并且便于靶向真核基因组内的多个位置的新的基因组工程化技术。这将为基因组工程化和生物技术的新应用提供主要资源。细菌和古细菌适应性免疫的crispr-crispr相关(cas)系统是显示蛋白质组成和基因组基因座结构的极端多样性的一些此类系统。crispr-cas系统基因座具有超过50个基因家族,并且不存在指示基因座结构的快速进化和极端多样性的严格通用基因。到目前为止,采用多管齐下的方法,对于93种cas蛋白,存在约395种概况的全面cas基因鉴定。分类包括标签基因概况加基因座结构的标签。提出了crispr-cas系统的新分类,其中这些系统大致分为两类,1类具有多亚基效应复合物,并且2类具有由cas9蛋白例示的单亚基效应物模块(图1a和图1b)。与2类crispr-cas系统相关的新颖效应蛋白可以被开发为强大的基因组工程化工具,并且假定的新颖效应蛋白及其工程化和优化的预测是重要的。然而,没有研究人员采用cas蛋白不可知的方法来鉴定新颖的单一效应物系统。这样做需要对所有原核基因组进行无偏且全面的生物信息学分析以及相应的复杂注释方法学,并且将潜在穷尽一切可能为rna可编程crispr单效应物提供空间。本申请采用这种方法并利用日益增多数量的可公开访问的细菌基因组且改变crispr规则来鉴定已扩展基因组工程化能力的新颖效应蛋白。本申请中引用或指定任意文献并非承认该文献可以作为本发明的现有技术获得。技术实现要素:对于具有一系列广泛应用的靶向核酸或多核苷酸(例如dna或rna或其任何杂合体或衍生物)的替代性且稳健的系统和技术存在着迫切需要。本发明着手解决这种需要并且提供了相关优点。将本申请的新颖dna或rna靶向系统添加到基因组和表观基因组(epigenomic)靶向技术的组库中可以通过直接检测、分析和操纵来改变特定靶位点的研究和干扰或编辑。为了有效地利用本申请的dna或rna靶向系统进行基因组或表观基因组靶向而无有害作用,了解这些dna或rna靶向工具的工程化和优化的方面是至关重要的。本发明提供了用于鉴定和分类可用于编辑和调节核酸、表达产物或基因组的新的单效应蛋白系统的计算方法。在本发明的优选实施例中,单效应蛋白在其相应基因座中不具有近端cas蛋白(例如cas1或cas2)。在本发明的一个实施例中,该单效应蛋白包含2类vi-b型效应蛋白。2类vi-b型效应蛋白包括两个亚组,即vi-b1型和vi-b2型(也称为组29蛋白和组30蛋白),并且包括为rna可编程核酸酶、rna干扰的成员且可以参与针对rna噬菌体的细菌过继性免疫。组29系统和组30系统在crispr阵列附近包含大型单效应物(长度大约1100个氨基酸)(称为cas13b)以及两种小假定辅助蛋白(长度大约200个氨基酸)中的一个或不含其。基于附近小蛋白,该系统分叉成两个基因座a和b。在该阵列上游或下游的25个千碱基对中没有额外的蛋白质跨物种对于每个基因座是保守的。除少数例外,该crispr阵列包含长度为36个核苷酸的同向重复序列和长度为30个核苷酸的间隔子序列。同向重复通常是高度保守的,特别是在末端,其中在5'末端的gttg/guug与在3'末端的caac反向互补。这种保守性表明rna环结构的强碱基配对可能与基因座中的一种或多种蛋白质相互作用。与同向重复序列互补的基序搜索揭示了在阵列附近没有候选tracrrna,可能指示如在cpf1基因座中发现的单个crrna。在本发明的实施例中,vi-b型系统(例如,组29或组30系统)包含cas13b效应蛋白和任选的编码cas13b效应蛋白上游或下游的小辅助蛋白。在某些实施例中,该小辅助蛋白增强cas13b效应物靶向rna的能力。在本发明的实施例中,组29或组30系统包含cas13b效应蛋白和任选的编码cas13b效应蛋白上游或下游的小辅助蛋白。在某些实施例中,该小辅助蛋白阻遏cas13b效应物靶向rna的能力。本发明提供了非天然存在的或工程化的组合物,其包含i)vi-b型crispr-cas效应蛋白,以及ii)vi-b型crispr-cascrrna,其中该crrna包含a)能够杂交到靶rna序列上的指导序列,和b)同向重复序列。该vi-b型crispr-cas效应蛋白与该crrna形成复合物,并且该指导序列引导该复合物与该靶rna序列的序列特异性结合,由此形成crispr复合物,该复合物包含与该指导序列复合的该vi-b型crispr-cas效应蛋白,该指导序列杂交到该靶rna序列上。当该指导序列杂交到该靶rna序列上时形成的复合物包含原型间隔子侧翼序列(pfs)的相互作用(识别)。在一些实施例中,本发明的非天然存在的或工程化的组合物可以包含vi-b型crispr-cas辅助蛋白,该辅助蛋白增强vi-b型crispr-cas效应蛋白活性。在某些此类实施例中,该增强vi-b型crispr-cas效应蛋白活性的辅助蛋白是csx28蛋白。在此类实施例中,该vi-b型crispr-cas效应蛋白和vi-b型crispr-cas辅助蛋白可以来自同一来源或来自不同的来源。在一些实施例中,本发明的非天然存在的或工程化的组合物包含vi-b型crispr-cas辅助蛋白,该辅助蛋白阻遏vi-b型crispr-cas效应蛋白活性。在某些此类实施例中,该阻遏vi-b型crispr-cas效应蛋白活性的辅助蛋白是csx27蛋白。在此类实施例中,该vi-b型crispr-cas效应蛋白和vi-b型crispr-cas辅助蛋白可以来自同一来源或来自不同的来源。在本发明的某些实施例中,该vi-b型crispr-cas效应蛋白是来自表1。在某些实施例中,该vi-b型crispr-cas辅助蛋白是来自表1。在一些实施例中,本发明的非天然存在的或工程化的组合物包含两种或更多种vi-b型crispr-cascrrna。在一些实施例中,本发明的非天然存在的或工程化的组合物包含指导序列,该指导序列杂交到原核细胞中的靶rna序列上。在一些实施例中,本发明的非天然存在的或工程化的组合物包含指导序列,该指导序列杂交到真核细胞中的靶rna序列上。在一些实施例中,该vi-b型crispr-cas效应蛋白包含一个或多个核定位信号(nls)。在本发明的非天然存在的或工程化的组合物的一些实施例中,该vi-b型crispr-cas效应蛋白与一个或多个功能结构域相关联。该关联可以通过效应蛋白与功能结构域的直接连接,或通过与crrna缔合实现。在非限制性实例中,该crrna包含添加或插入的序列,所述序列可以与感兴趣的功能结构域相关联,包括例如与核酸结合衔接蛋白结合的适体或核苷酸。在某些非限制性实施例中,本发明的非天然存在的或工程化的组合物包含功能结构域,该功能结构域切割该靶rna序列。在某些非限制性实施例中,本发明的非天然存在的或工程化的组合物包含功能结构域,该功能结构域修饰该靶rna序列的转录或翻译。在本发明组合物的一些实施例中,该vi-b型crispr-cas效应蛋白与一个或多个功能结构域相关联;并且该效应蛋白在hepn结构域内含有一个或多个突变,由此该复合物可以递送表观遗传修饰因子或转录或翻译激活或阻遏信号。本发明还提供了一种vi-b型crispr-cas载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含第一调控元件以及第二调控元件,该第一调控元件与编码该vi-b型crispr-cas效应蛋白的核苷酸序列可操作地连接,该第二调控元件与编码该vi-b型crispr-cascrrna的核苷酸序列可操作地连接。在某些实施例中,本发明的载体系统进一步包含与vi-b型crispr-cas辅助蛋白的核苷酸序列可操作地连接的调控元件。在适当时,对编码vi-b型crispr-cas效应蛋白的核苷酸序列和/或编码vi-b型crispr-cas辅助蛋白的核苷酸序列进行密码子优化以在宿主细胞(例如像真核细胞)中表达。在一些实施例中,本发明的载体系统包含单一载体。在其他实施例中,该载体系统包含两种或更多种载体。在某些实施例中,该单一载体或两种或更多种载体包含一种或多种病毒载体。病毒载体的非限制性实例包括逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体或单纯疱疹病毒载体。还提供了一种递送系统,该递送系统被配置成递送vi-b型crispr-cas效应蛋白和非天然存在的或工程化的组合物的一种或多种核酸组分,该组合物包含i)vi-b型crispr-cas效应蛋白,以及ii)vi-b型crispr-cascrrna,其中该crrna包含a)杂交到细胞中的靶rna序列上的指导序列,和b)同向重复序列,其中该vi-b型crispr-cas系统效应蛋白与该crrna形成复合物,并且其中该指导序列引导与该靶rna序列的序列特异性结合以形成crispr复合物,该复合物包含与该指导序列复合的该vi-b型crispr-cas效应蛋白,该指导序列杂交到该靶rna序列上。任选地,该递送系统递送vi-b型crispr-cas辅助蛋白。该系统可以被设计成例如在不同的时间或在不同的条件下分开地递送这些组分或将这些组分一起递送。在各种实施例中,该递送系统包含一种或多种载体或一种或多种多核苷酸分子,或一种或多种载体和多核苷酸分子的组合,或一种或多种载体、一种或多种多核苷酸分子、vi-b型crispr-cas效应蛋白和vi-b型crispr-cas辅助蛋白的组合。在某些实施例中,本发明的递送系统包含递送媒介,该递送媒介包含脂质体、粒子、外来体、微泡、基因枪或一种或多种病毒载体。在一些实施例中,本发明的非天然存在的或工程化的组合物用于在治疗性处理方法中使用。在一些实施例中,本发明的非天然存在的或工程化的载体系统用于在治疗性处理方法中使用。在一些实施例中,本发明的非天然存在的或工程化的递送系统用于在治疗性处理方法中使用。本发明提供了一种修饰感兴趣的靶基因的表达的方法,该方法包括使靶rna与一种或多种非天然存在的或工程化的组合物接触,这些组合物包含i)vi-b型crispr-cas效应蛋白,和ii)vi-b型crispr-cascrrna,其中该crrna包含a)杂交到细胞中的靶rna序列的指导序列,和b)同向重复序列,其中该vi-b型crispr-cas系统效应蛋白与该crrna形成复合物,其中该指导序列引导与细胞中的该靶rna序列的序列特异性结合,由此形成crispr复合物,该复合物包含与该指导序列复合的该vi-b型crispr-cas效应蛋白,该指导序列杂交到该靶rna序列上,由此修饰该感兴趣的靶基因座的表达。在某些实施例中,该修饰感兴趣的靶基因的表达的方法进一步包括使该靶rna与增强vi-b型crispr-cas效应蛋白活性的vi-b型crispr-cas辅助蛋白(如csx28蛋白)接触,提供了该辅助蛋白的非限制性实例。在某些实施例中,该修饰感兴趣的靶基因的表达的方法进一步包括使该靶rna与阻遏vi-b型crispr-cas效应蛋白活性的vi-b型crispr-cas辅助蛋白(如csx27蛋白)接触,提供了该辅助蛋白的非限制性实例。在一些实施例中,修饰感兴趣的靶基因的表达包括切割该靶rna。在一些实施例中,修饰感兴趣的靶基因的表达包括增加或降低该靶rna的表达。在某些实施例中,修饰靶基因的表达引起细胞的非靶标组分的表达增加或降低。在某些实施例中,该细胞是原核细胞。在其他实施例中,该靶细胞是真核细胞,其非限制性实例包括植物细胞和组织、动物细胞和组织、以及人细胞和组织。本发明提供了一种包含修饰的感兴趣的靶标的细胞、组织或生物,其中该感兴趣的靶标已经根据在此披露的任何方法进行修饰。在一些实施例中,细胞中的感兴趣的靶标的修饰使得:细胞包含至少一种基因产物的改变的表达;细胞包含至少一种基因产物的改变的表达,其中该至少一种基因产物的表达增加;或细胞包含至少一种基因产物的改变的表达,其中该至少一种基因产物的表达降低。非限制性实例包括哺乳动物细胞、人细胞和植物细胞。本发明还提供了一种在此披露的细胞的细胞系或一种通过在此披露的任何方法修饰的细胞或其子代。本发明提供了一种多细胞生物,该多细胞生物包含在此披露的一种或多种细胞或根据在此披露的任何方法修饰的一种或多种细胞。本发明提供了一种植物或动物模型,该植物或动物模型包含在此披露的一种或多种细胞或根据在此披露的任何方法修饰的一种或多种细胞。本发明提供了一种来自在此披露的细胞或细胞系或生物或植物或动物模型的基因产物。在一些实施例中,所表达的基因产物的量大于或小于来自不具有改变的表达的细胞的基因产物的量。本发明提供了一种分离的vi-b型crispr-cas效应蛋白。在非限制性实施例中,该分离的vi-b型crispr-cas效应蛋白是来自微生物,该微生物选自动物溃疡伯格菌或颊普雷沃菌。本发明提供了一种分离的vi-b型crispr-cas辅助蛋白。在非限制性实施例中,该分离的vi-b型crispr-cas辅助蛋白是来自微生物,该微生物选自动物溃疡伯格菌或颊普雷沃菌。本发明提供了一种分离的核酸,该分离的核酸编码该vi-b型crispr-cas效应蛋白;以及一种分离的核酸,该分离的核酸编码该vi-b型crispr-cas辅助蛋白。在非限制性实例中,该分离的核酸编码vi-b型crispr-cas效应蛋白,该效应蛋白来自微生物,该微生物选自动物溃疡伯格菌或颊普雷沃菌。该分离的核酸可以是dna或rna。还提供了一种分离的细胞,该分离的细胞包含编码该vi-b型crispr-cas效应蛋白或辅助蛋白的核酸。本发明提供了一种鉴定rna靶向蛋白的合适指导序列的要求的方法,所述方法包括:(a)选择生物内的一组必需基因(b)设计能够杂交到这些基因的编码区以及这些基因的5'和3'utr上的靶向指导序列的文库(c)产生不会杂交到所述生物的基因组内的任何区域上的随机化指导序列作为对照指导物(d)制备包含rna靶向蛋白和第一抗性基因的质粒以及包含所述靶向指导物文库和所述对照指导物和第二抗性基因的指导质粒文库,(e)将所述质粒共同引入宿主细胞中(f)在所述第一抗性基因和第二抗性基因的选择性培养基上引入所述宿主细胞(g)对生长中宿主细胞的必需基因进行测序(h)通过比较具有对照指导物的细胞的耗竭来确定用靶向指导物转化的细胞的耗竭的显著性;并且(i)基于这些耗竭的指导序列确定适合的指导序列的要求。在这种方法的一个方面,通过比较耗竭细胞中的指导物所靶向的序列来确定rna靶向蛋白的适合指导序列的pfs序列。在这种方法的一个方面,该方法进一步包括比较不同重复实验中不同条件的指导序列丰度。在这种方法的一个方面,选择对照指导物,因为它们被确定为在重复实验中显示指导物耗竭的有限偏差。在这种方法的一个方面,耗竭的显著性被确定为:(a)大于最多耗竭的对照指导序列的耗竭;或(b)大于平均耗竭加对照指导物的标准偏差的两倍的耗竭。在这种方法的一个方面,该宿主细胞是细菌宿主细胞。在这种方法的一个方面,共同引入这些质粒的步骤是通过电穿孔并且该宿主细胞是电感受态宿主细胞。本发明提供了一种修饰与感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列的方法,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含组29或组30效应蛋白和一种或多种核酸组分,其中该效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与该感兴趣的基因座结合时,该效应蛋白诱导与该感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列的修饰。在一个优选的实施例中,该修饰是引入链断裂。在一个优选的实施例中,与该感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列包含rna或由rna组成。本发明提供了一种修饰与感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列的方法,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含cas13b效应蛋白、任选的小辅助蛋白和一种或多种核酸组分,其中该效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与该感兴趣的基因座结合时,该效应蛋白诱导与该感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列的修饰。在一个优选的实施例中,该修饰是引入链断裂。在一个优选的实施例中,与该感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列包含rna或由rna组成。应当理解的是,术语cas酶、crispr酶、crispr蛋白、cas蛋白和crisprcas通常可互换地使用,并且在此参考的各方面同样是指本申请中进一步描述的新颖的crispr效应蛋白,除非另外显而易见的,如通过具体参考cas9。在此所描述的crispr效应蛋白优选地是组29和组30效应蛋白。本发明提供了一种修饰与感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列的方法,该方法包括向所述与该基因座相关联或该基因座处的序列递送非天然存在的或工程化的组合物,该组合物包含组29基因座效应蛋白和一种或多种核酸组分,其中该组29效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与该感兴趣的基因座结合时,该效应蛋白诱导与该感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列的修饰。在一个优选的实施例中,该修饰是引入链断裂。在一个优选的实施例中,该组29或组30效应蛋白与一种核酸组分形成复合物;该核酸组分有利地是工程化的或非天然存在的核酸组分。诱导与该感兴趣的靶基因座相关联或在该靶基因座处的序列的修饰可以是组29或组30效应蛋白-核酸指导的。在一个优选的实施例中,该种核酸组分是crisprrna(crrna)。在一个优选的实施例中,该种核酸组分是成熟crrna或指导rna,其中该成熟crrna或指导rna包含间隔子序列(或指导序列)和同向重复(dr)序列或其衍生物。在一个优选的实施例中,该间隔子序列或其衍生物包含种子序列,其中该种子序列对于在该靶基因座处的序列的识别和/或与该序列的杂交是至关重要的。在本发明的一个优选的实施例中,该crrna是可以与短dr序列相关联的短crrna。在本发明的另一个实施例中,该crrna是可以与长dr序列(或双dr)相关联的长crrna。本发明的方面涉及具有一种或多种非天然存在的或工程化的或修饰的或优化的核酸组分的组29或组30效应蛋白复合物。在一个优选的实施例中,该核酸组分包含rna。在一个优选的实施例中,该复合物的核酸组分可以包含与同向重复序列连接的指导序列,其中该同向重复序列包含一个或多个茎环或优化的二级结构。在本发明的优选实施例中,该同向重复可以是短dr或长dr(双dr)。在优选的实施例中,可以对同向重复进行修饰以包含一种或多种蛋白质结合rna适体。在一个优选的实施例中,可以包括一种或多种适体,如优化的二级结构的一部分。此类适体可能能够结合噬菌体外壳蛋白。该噬菌体外壳蛋白可以选自下组,该组由以下各项组成:qβ、f2、ga、fr、jp501、ms2、m12、r17、bz13、jp34、jp500、ku1、m11、mx1、tw18、vk、sp、fi、id2、nl95、tw19、ap205、φcb5、φcb8r、φcb12r、φcb23r、7s以及prr1。在一个优选的实施例中,该噬菌体外壳蛋白是ms2。本发明还提供了该复合物的核酸组分,该核酸组分是长度为30个或更多个、40个或更多个、或50个或更多个核苷酸。本发明提供了对与感兴趣的靶基因座相关联或在感兴趣的靶基因座处的序列进行基因组编辑或修饰的方法,其中该方法包括将组29或组30效应蛋白或组29或组30效应蛋白复合物引入任何所希望的细胞类型、原核或真核细胞中,其中该组29或组30效应蛋白或组29或组30效应蛋白复合物有效地发挥作用以干扰该真核或原核细胞中的rna。在优选的实施例中,该细胞是真核细胞并且该rna是从哺乳动物基因组转录或存在于哺乳动物细胞中。在人细胞进行rna编辑或基因组编辑的优选方法中,组29或组30效应蛋白可包括但不限于本文公开的组29或组30效应蛋白的特定种类。本发明还提供了一种修饰感兴趣的靶基因座的方法,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含组29或组30效应蛋白、和一种或多种核酸组分,其中该组29或组30效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与感兴趣的基因座结合时,该效应蛋白诱导该感兴趣的靶基因座的修饰。在一个优选实施例中,该修饰是引入链断裂。在这种方法中,该感兴趣的靶基因座可以被包含在rna分子内。在这种方法中,该感兴趣的靶基因座可以被包含在体外的rna分子中。在这种方法中,该感兴趣的靶基因座可以被包含在细胞内的rna分子中。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代被改变以便改进生物制品(如抗体、淀粉、醇或其他所希望的细胞产出)的生产。通过本发明引入到细胞中的修饰可以使得细胞和细胞的子代包括改变所生产的生物制品的变化。哺乳动物细胞可以是非人类哺乳动物的,例如灵长动物的、牛的、绵羊的、猪的、犬的、啮齿动物的、兔科的,如猴、牛、绵羊、猪、狗、兔、大鼠或小鼠细胞。该细胞可以是非哺乳动物真核细胞,如禽鸟(例如,鸡)、脊椎鱼类(例如,鲑鱼)或贝类(例如,牡蛎、蛤蜊、龙虾、虾)细胞。该细胞还可以是植物细胞。该植物细胞可以属于单子叶植物或双子叶植物或者属于作物或谷物植物,如木薯、玉米、高粱、大豆、小麦、燕麦或水稻。该植物细胞还可以属于藻类、树木或生产植物、水果或蔬菜(例如,树木,如柑橘树,例如橙树、葡萄柚树或柠檬树;桃树或油桃树;苹果树或梨树;坚果树,如杏仁树或胡桃树或阿月浑子树;茄属植物;芸薹属的植物;莴苣属的植物;菠菜属的植物;辣椒属的植物;棉花、烟草、芦笋、胡萝卜、卷心菜、西兰花、花椰菜、番茄、茄子、胡椒、莴苣、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等)。本发明提供了一种修饰感兴趣的靶基因座的方法,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含组29或组30效应蛋白、和一种或多种核酸组分,其中该效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与感兴趣的基因座结合时,该效应蛋白诱导该感兴趣的靶基因座的修饰。在一个优选实施例中,该修饰是引入链断裂。在这种方法中,该感兴趣的靶基因座可以被包含在rna分子内。在一个优选实施例中,该感兴趣的靶基因座包含rna或由rna组成。本发明还提供了一种修饰感兴趣的靶基因座的方法,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含组29或组30效应蛋白、和一种或多种核酸组分,其中该组29或组30效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与感兴趣的基因座结合时,该效应蛋白诱导该感兴趣的靶基因座的修饰。在一个优选实施例中,该修饰是引入链断裂。优选地,在这种方法中,该感兴趣的靶基因座可以被包含在体外的rna分子中。还优选地,在这种方法中,该感兴趣的靶基因座可以被包含在细胞内的rna分子中。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。该细胞可以是啮齿动物细胞。该细胞可以是小鼠细胞。在此描述的任何方法中,该感兴趣的靶基因座可以是感兴趣的基因组或表观基因组基因座。在此描述的任何方法中,该复合物可以与多个指导物一起递送用于多重用途。在此描述的任何方法中,可以使用多于一种的蛋白。在本发明的又一个方面,核酸组分可以包含crisprrna(crrna)序列和/或反式激活crrna(tracrrna)序列。在某些实施例中,切割(例如生物化学或体外切割或在细胞中切割)可以导致没有反式激活crrna(tracrrna)序列。在其他实施例中,切割(例如生物化学或体外切割或在细胞中切割)可以导致具有反式激活crrna(tracrrna)序列。在本发明的又一个方面,核酸组分可以包含crisprrna(crrna)序列并且不包含任何反式激活crrna(tracrrna)序列。没有限制,申请人假设在这种情况下,前crrna可以包含足够用于加工以产生成熟crrna以及使crrna加载到效应蛋白上的二级结构。通过示例而非限制,这种二级结构可以包含前crrna内的,更具体地说在同向重复内的一个或多个茎环、基本上由其组成、或由其组成。在某些实施例中,当效应蛋白是组29或组30效应蛋白时,核酸组分可以包含crisprrna(crrna)序列并且可以不包含任何反式激活crrna(tracrrna)序列。在此描述的任何方法中,效应蛋白和核酸组分可以经由编码蛋白和/或一个或多个核酸组分的一个或多个多核苷酸分子提供,并且其中该一个或多个多核苷酸分子可操作地配置成表达该蛋白和/或该一个或多个核酸组分。该一个或多个多核苷酸分子可以包含一个或多个可操作地配置成表达该蛋白和/或该一个或多个核酸组分的调控元件。该一个或多个多核苷酸分子可以被包含在一个或多个载体内。在此描述的任何方法中,该感兴趣的靶基因座可以是感兴趣的基因组、表观基因组或转录组基因座。在此描述的任何方法中,该复合物可以与多个指导物一起递送用于多重用途。在此描述的任何方法中,可以使用多于一种的蛋白质。在此描述的任何方法中,链断裂可以是单链断裂或双链断裂。在优选实施例中,双链断裂可以指两段rna的断裂,例如当单链rna分子已经折叠到自身上时或当与含有自我互补序列的rna分子形成的假定双螺旋允许部分rna折叠并与其自身配对时形成的两段rna。调控元件可以包含诱导型启动子。多核苷酸和/或载体系统可以包含诱导型系统。在此描述的任何方法中,该一个或多个多核苷酸分子可以被包含在递送系统中,或该一个或多个载体可以被包含在递送系统中。在此描述的任何方法中,非天然存在的或工程化的组合物可以经由脂质体、粒子(包括粒子)、外来体、微泡、基因枪或一种或多种病毒载体递送。本发明还提供了一种非天然存在的或工程化的组合物,该组合物是具有如在此讨论的或在此描述的任何方法中定义的特征的组合物。因此,在某些实施例中,本发明提供了一种非天然存在的或工程化的组合物,例如具体是能够或被配置成修饰感兴趣的靶基因座的组合物,所述组合物包含组29或组30效应蛋白和一种或多种核酸组分,其中该效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与该感兴趣的基因座结合时,该效应蛋白诱导与该感兴趣的靶基因座相关或该感兴趣的靶基因座处的序列的修饰。在某些实施例中,效应蛋白可以是组29效应蛋白。本发明在又一个方面还提供了非天然存在的或工程化的组合物,例如特别是能够配置成或被配置成修饰感兴趣的靶基因座的组合物,所述组合物包含:(a)指导rna分子(或指导rna分子,例如第一指导rna分子和第二指导rna分子的组合)或编码该指导rna分子的核酸(或编码该指导rna分子的组合的一种或多种核酸);(b)组29或组30效应蛋白。在某些实施例中,效应蛋白可以是组29效应蛋白。本发明在又一个方面还提供了非天然存在的或工程化的组合物,该组合物包含:(i.)一种或多种crispr-cas系统多核苷酸序列,该序列包含(a)能够与多核苷酸基因座中的靶序列杂交的指导序列,(b)tracr配对序列,和(c)tracrrna序列,以及(ii.)编码组29或组30效应蛋白的第二多核苷酸序列,其中当转录时,tracr配对序列与tracrrna序列杂交,并且指导序列引导crispr复合物与靶序列的序列特异性结合,并且其中crispr复合物包含与以下序列复合的组29或组30效应蛋白:(1)与靶序列杂交的指导序列,和(2)与tracrrna序列杂交的tracr配对序列。在某些实施例中,效应蛋白可以是组29效应蛋白。在某些实施例中,可能不需要tracrrna。因此,本发明还在某些实施例中提供了非天然存在的或工程化的组合物,该组合物包含:(i.)一种或多种crispr-cas系统多核苷酸序列,该序列包含(a)能够与多核苷酸基因座中的靶序列杂交的指导序列,和(b)同向重复序列,以及(ii.)编码组29或组30效应蛋白的第二多核苷酸序列,其中当转录时,该指导序列引导crispr复合物与靶序列的序列特异性结合,并且其中该crispr复合物包含与以下序列复合的组29或组30效应蛋白:(1)与靶序列杂交的指导序列,和(2)同向重复序列。优选地,效应蛋白可以是组29效应蛋白。没有限制,申请人假设在这种情况下,同向重复序列可以包含足以使crrna加载到效应蛋白上的二级结构。通过示例而非限制,这种二级结构可以包括同向重复内的茎环(例如一个或多个茎环)、基本上由其组成、或由其组成。本发明还提供了包含一种或多种载体的载体系统,该一种或多种载体包含编码非天然存在的或工程化的组合物的组分的一种或多种多核苷酸分子,该组合物是具有如在此描述的方法中任一项所定义的特征的组合物。本发明还提供了包含一种或多种载体或一种或多种多核苷酸分子的递送系统,该一种或多种载体或多核苷酸分子包含编码非天然存在的或工程化的组合物的组分的一种或多种多核苷酸分子,该组合物是具有在此讨论的或如在此描述的方法中任一项所定义的特征的组合物。本发明还提供了用于在治疗性处理方法中使用的非天然存在的或工程化的组合物、或编码所述组合物的组分的一种或多种多核苷酸、或包含编码所述组合物的组分的一种或多种多核苷酸的载体或递送系统。该治疗性处理方法可以包括基因或基因组编辑、或基因治疗。本发明还涵盖用于预测新的cas蛋白不可知的单效应蛋白cripsr系统并鉴定其中的组分的计算方法和算法。本发明还提供了其中效应蛋白的一个或多个氨基酸残基可以被修饰的方法和组合物,例如工程化或非天然存在的组20或组30效应蛋白。在一个实施例中,修饰可以包括效应蛋白的一个或多个氨基酸残基的突变。该一个或多个突变可以位于效应蛋白的一个或多个催化活性结构域中。与缺乏所述一个或多个突变的效应蛋白相比,该效应蛋白可以具有降低或消除的核酸酶活性。该效应蛋白可以不指导感兴趣的靶基因座处的一条rna链的切割。在一个优选实施例中,该一个或多个突变可以包含两个突变。在一个优选实施例中,该一个或多个氨基酸残基在组29或组30效应蛋白(例如工程化或非天然存在的组29或组30效应蛋白)中被修饰。在本发明的一些实施例中,该效应蛋白包含一个或多个hepn结构域。在一个优选实施例中,该效应蛋白包含两个hepn结构域。在另一个优选实施例中,该效应蛋白在c-末端包含一个hepn结构域并且在该蛋白的n-末端包含另一个hepn结构域。在某些实施例中,该一个或多个突变或该两个或更多个突变可以位于效应蛋白的催化活性结构域中,该效应蛋白包含hepn结构域或与hepn结构域同源的催化活性结构域。在某些实施例中,该效应蛋白包含一个或多个以下突变:r116a、h121a、r1177a、h1182a(其中氨基酸位置对应于源自动物溃疡伯格菌atcc43767的组29蛋白的氨基酸位置),例如r116a、h121a、r1177a和h1182a;r116a、h121a和r1177a;r116a、h121a和h1182a;r116a、r1177a和h1182a;h121a、r1177a和h1182a;r116a和h121a;r116a和r1177a;r116a和h1182a;h121a和r1177a;h121a和h1182a;r1177a和h1182a;r116a;h121a;r1177a;h1182a。本领域技术人员将理解,不同的组29或组30蛋白中相应的氨基酸位置可以被突变为相同的效果。在某些实施例中,突变r116a、h121a、r1177a、h1182a中的一个或多个完全或部分地消除了蛋白的催化活性(例如改变的切割速率、改变的特异性等),例如r116a、h121a、r1177a和h1182a;r116a、h121a和r1177a;r116a、h121a和h1182a;r116a、r1177a和h1182a;h121a、r1177a和h1182a;r116a和h121a;r116a和r1177a;r116a和h1182a;h121a和r1177a;h121a和h1182a;r1177a和h1182a;r116a;h121a;r1177a;h1182a。在某些实施例中,如在此描述的效应蛋白是“死亡”效应蛋白,例如死亡组29或死亡组30效应蛋白(即dgroup29或dgroup30)。在某些实施例中,该效应蛋白在hepn结构域1中具有一个或多个突变。在某些实施例中,该效应蛋白在hepn结构域2中具有一个或多个突变。在某些实施例中,该效应蛋白在hepn结构域1和hepn结构域2中具有一个或多个突变。该效应蛋白可以包含一个或多个异源功能域。该一个或多个异源功能域可以包括一个或多个核定位信号(nls)结构域。该一个或多个异源功能域可以包括至少两个或更多个nls结构域。该一个或多个nls结构域可以位于效应蛋白(例如,组29或组30效应蛋白)的末端、或其附近或与其邻近,并且如果是两个或更多个nls,两个中的每一个可以被定位为处于效应蛋白(例如,组29或组30效应蛋白)的末端、或其附近或与其邻近。一个或多个异源功能域可以包含一个或多个转录激活结构域。在一个优选实施例中,该转录激活结构域可以包含vp64。该一个或多个异源功能域可以包含一个或多个转录阻遏结构域。在一个优选实施例中,转录阻遏结构域包含krab结构域或sid结构域(例如sid4x)。该一个或多个异源功能域可以包含一个或多个核酸酶结构域。在一个优选实施例中,该核酸酶结构域包含fok1。本发明还提供了该一个或多个异源功能域以具有一种或多种以下活性:甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、单链rna切割活性、双链rna切割活性、单链dna切割活性、双链dna切割活性以及核酸结合活性。至少一个或多个异源功能域可位于效应蛋白的氨基末端处或其附近,和/或其中至少一个或多个异源功能域位于效应蛋白的羧基末端处或其附近。一个或多个异源功能域可以与效应蛋白融合。一个或多个异源功能域可以连接至效应蛋白。一个或多个异源功能域可以通过接头部分连接至效应蛋白。本发明还提供了效应蛋白,该效应蛋白包括来自以下属的生物的效应蛋白:伯格菌属、普雷沃菌属、卟啉单胞菌属、拟杆菌属、alistipes、里氏杆菌属、类香菌属、黄杆菌属、二氧化碳嗜纤维菌属、金黄杆菌属、棕指藻属杆属、沼杆菌属、或冷弯菌属。在一个优选实施例中,组29或组30效应蛋白可以来自下组,该组包括但不限于以下生物:动物溃疡伯格菌、中间普雷沃菌、颊普雷沃菌、牙龈卟啉单胞菌、酿脓拟杆菌、alistipes属物种、普雷沃菌属物种ma2016、鸭疫里氏杆菌、桔红色普雷沃菌、糖解普雷沃菌、拟香味类香味菌、柱状黄杆菌、嗜鳃黄杆菌、酿脓拟杆菌、bacteroidescoprosuis、狗咬二氧化碳嗜纤维菌、犬咬二氧化碳嗜纤维菌、金黄杆菌属物种、产丙酸沼杆菌、三角棕指藻、牙龈卟啉单胞菌、咽喉卟啉单胞菌、prevotellafalsenii、中间普雷沃菌、灰白普雷沃菌、胸膜炎普雷沃菌、糖解普雷沃菌、普雷沃菌属物种p5-119和扭曲冷弯菌。效应蛋白可以包含嵌合效应蛋白,该嵌合效应蛋白包含来自第一效应蛋白直向同源物的第一片段和来自第二效应蛋白直向同源物的第二片段,并且其中第一和第二效应蛋白直向同源物不同。第一和第二效应蛋白直向同源物中的至少一个可以包括来自以下生物的效应蛋白:包括伯格菌属、普雷沃菌属、卟啉单胞菌属、拟杆菌属、alistipes、里氏杆菌属、类香菌属、黄杆菌属、二氧化碳嗜纤维菌属、金黄杆菌属、沼杆菌属、棕指藻属杆属或冷弯菌属生物。在某些实施例中,效应蛋白,特别是组29或组30效应蛋白效应蛋白可以是至少700个氨基酸长。在优选实施例中,效应蛋白可以是约1100至约1500个氨基酸长,例如约1100至约1200个氨基酸长,或约1200至约1300个氨基酸长,或约1300至约1400个氨基酸长,或约1400至约1500个氨基酸长,例如约900个、约1000个、约1100个、约1200个、约1300个、约1400个、约1500个、约1600个、约1700个或约1800个氨基酸长。在某些实施例中,如在此希望的组29或组30效应蛋白可以与基因座相关,该基因座包含在30和40bp长之间,更典型地在34和38bp长之间,甚至更典型地在36和37bp长之间,例如30、31、32、33、34、35、36、37、38、39或40bp长的短crispr重复。在某些实施例中,crispr重复较长或是在80和350bp长之间,例如在80和200bp长之间,甚至更典型地在86和88bp长之间,例如80、81、82、83、84、85、86、87、88、89或90bp长的二元重复序列。在某些实施例中,原型间隔邻近基序(pam)或pam样基序指导如在此公开的效应蛋白(例如组29或组30效应蛋白)复合物与感兴趣的靶基因座的结合。在一些实施例中,pam可以是5'pam(即,位于原型间隔的5'末端的上游)。在其他实施例中,pam可以是3'pam(即,位于原型间隔的5'末端的下游)。在其他实施例中,需要5'pam和3'pam两者。在本发明的某些实施例中,可能不需要pam或pam样基序来指导效应蛋白(例如组29或组30效应蛋白)的结合。在某些实施例中,5'pam是d(即a、g或u)。在某些实施例中,对于组29效应物,5'pam是d。在某些实施例中,5'pam对于源自动物溃疡伯格菌(如动物溃疡伯格菌atcc43767)的组29效应物是d。在本发明的某些实施例中,重复序列处的切割可以产生包含完整间隔子序列的crrna(例如短crrna或长crrna),该完整间隔子序列在5'末端侧接有短核苷酸重复序列(例如5、6、7、8、9或10nt或如果是二元重复序列则更长)(这可以被称为crrna“标签”)且在3'末端侧接有重复的剩余部分。在某些实施例中,在此描述的效应蛋白的靶向可能需要crrna标签与5’侧翼融合序列靶之间缺乏同源性。这个要求可能与进一步描述于以下的要求相似:samai等人“co-transcriptionaldnaandrnacleavageduringtypeiiicrispr-casimmunity[iii型crispr-cas免疫期间的共转录dna和rna切割]”cell[细胞]161,1164-1174,2015年5月21日,其中该要求被认为区分侵入核酸的真实靶标和crispr阵列本身,并且其中重复序列的存在将导致与crrna标签完全同源并防止自身免疫。在某些实施例中,组29或组30效应蛋白被工程化并且可以包含一个或多个降低或消除核酸酶活性的突变,从而降低或消除rna干扰活性。也可以在邻近残基处进行突变,例如在参与核酸酶活性的那些氨基酸附近进行突变。在一些实施例中,一个或多个假定催化核酸酶结构域失活并且效应蛋白复合物缺乏切割活性并且起到rna结合复合物的作用。在一个优选实施例中,所得rna结合复合物可以与在此描述的一个或多个功能域连接。在某些实施例中,该一个或多个功能域是可控的,即可诱导的。在本发明的某些实施例中,该指导rna或成熟crrna包括同向重复序列和指导序列或间隔子序列、基本上由其组成、或由其组成。在某些实施例中,该指导rna或成熟crrna包括连接至指导序列或间隔子序列的同向重复序列、基本上由其组成、或由其组成。在本发明的优选实施例中,成熟crrna包含茎环或优化的茎环结构或优化的二级结构。在优选实施例中,成熟crrna在同向重复序列中包含茎环或优化的茎环结构,其中该茎环或优化的茎环结构对于切割活性是重要的。在某些实施例中,成熟crrna优选包含单茎环。在某些实施例中,同向重复序列优选包含单茎环。在某些实施例中,通过引入影响茎环rna双链体结构的突变来修饰效应蛋白复合物的切割活性。在优选实施例中,可以引入维持茎环的rna双链体的突变,由此维持效应蛋白复合物的切割活性。在其他优选实施例中,可以引入破坏茎环的rna双链体结构的突变,由此完全消除效应蛋白复合物的切割活性。本发明还提供了编码效应蛋白的核苷酸序列,在本文描述的任何方法或组合物中,该效应蛋白被密码子优化用于在真核生物或真核生物细胞中表达。在本发明的一个实施例中,密码子优化的效应蛋白是在此讨论的任何组29或组30效应蛋白,并且该组29或组30效应蛋白针对真核细胞或生物(例如在本文其他地方提及的细胞或生物,例如但不限于酵母细胞或哺乳动物细胞或生物(包括小鼠细胞、大鼠细胞和人细胞或非人类真核生物(例如植物)))中的可操作性进行了密码子优化。在本发明的某些实施例中,至少一个核定位信号(nls)被附接到编码组29或组30或组29或组30效应蛋白的核酸序列。在优选实施例中,至少一个或多个c-末端或n-末端nls被附接(并且因此编码组29或组30效应蛋白的一个或多个核酸分子可以包括对一个或多个nls的编码,这样使得表达产物的一个或多个nls被附接或连接)。在优选实施例中,c-末端nls被附接,用于在真核细胞(优选人细胞)中进行最佳表达和核靶向。本发明还涵盖用于递送多个核酸组分的方法,其中每个核酸组分对不同的感兴趣的靶基因座具有特异性,从而修饰多个感兴趣的靶基因座。复合物的核酸组分可以包含一种或多种蛋白结合rna适体。一种或多种适体可以能够结合噬菌体外壳蛋白。该噬菌体外壳蛋白可以选自下组,该组由以下组成:qβ、f2、ga、fr、jp501、ms2、m12、r17、bz13、jp34、jp500、ku1、m11、mx1、tw18、vk、sp、fi、id2、nl95、tw19、ap205、φcb5、φcb8r、φcb12r、φcb23r、7s以及prr1。在一个优选实施例中,该噬菌体外壳蛋白是ms2。本发明还提供了该复合物的核酸组分,该核酸组分是长度为30个或更多个、40个或更多个、或50个或更多个核苷酸。在又一个方面,本发明提供了包含修饰的感兴趣的基因座的真核细胞,其中该感兴趣的基因座已根据在此描述的任何方法进行了修饰。在又一个方面,提供了所述细胞的细胞系。另一方面提供了包含一种或多种所述细胞的多细胞生物。在某些实施例中,感兴趣的靶基因座的修饰可导致:真核细胞包含至少一种基因产物的改变的表达;真核细胞包含至少一种基因产物的改变的表达,其中该至少一种基因产物的表达增加;真核细胞包含至少一种基因产物的改变的表达,其中该至少一种基因产物的表达降低;或真核细胞包含经编辑的基因组。在某些实施例中,真核细胞可以是哺乳动物细胞或人细胞。在另外的实施例中,如本说明书中描述的非天然存在的或工程化的组合物、载体系统或递送系统可用于:位点特异性基因敲除;位点特异性基因组编辑;rna序列特异性干扰;或多元基因组工程化。还提供了来自如在此描述的细胞、细胞系或生物的基因产物。在某些实施例中,所表达的基因产物的量可以大于或小于来自不具有改变的表达或经编辑的基因组的细胞的基因产物的量。在某些实施例中,与来自不具有改变的表达或经编辑的基因组的细胞的基因产物相比,该基因产物可以改变。在另一个方面,本发明提供了用于鉴定新颖核酸修饰效应物的方法,该方法包括:从编码假定核酸修饰酶基因座的核酸序列集合中鉴定假定核酸修饰基因座,这些基因座位于距基因座的保守基因组元件的定义的距离内,包含至少一种高于定义的尺寸限制的蛋白,或两者兼具;将经鉴定的假定核酸修饰基因座分组成包含同源蛋白的子集;通过从基于以下一项或多项的一个或多个子集中选择核酸修饰基因座来鉴定候选核酸修饰基因座的最终集合;包含具有低结构域同源性的假定效应蛋白的基因座(与相对于其他子集中基因座的已知蛋白域匹配)的子集,包含相对于其他子集中的基因座与保守基因组元件距离最小的假定蛋白的子集,具有包含大型效应蛋白(相对于其他子集中的大型效应蛋白,该大型效应蛋白与假定邻近辅助蛋白具有相同的取向)的基因座的子集,包含相对于其他基因座具有较少现有核酸修饰分类的假定效应蛋白的子集,包含相对于其他子集与已知核酸修饰基因座较不邻近的基因座的子集,以及每个子集中候选基因座的总数。在一个实施例中,该组核酸序列获得自基因组或宏基因组数据库,例如包含原核基因组或宏基因组序列的基因组或宏基因组数据库。在一个实施例中,距保守基因组元件的定义的距离在1kb和25kb之间。在一个实施例中,保守基因组元件包含重复元素,例如crispr阵列。在一个特定的实施例中,距保守基因组元件的定义的距离在crispr阵列的10kb内。在一个实施例中,包含在假定核酸修饰基因座内的蛋白的定义的尺寸限制为大于200个氨基酸,或更具体地说,定义的尺寸限制为大于700个氨基酸。在一个实施例中,使用核酸集合(例如piler-cr)的重复或模式发现分析来鉴定保守基因组元件。在一个实施例中,在此描述的方法的分组步骤基于(至少部分地基于)结构域同源性搜索或hhpred蛋白域同源性搜索。在一个实施例中,定义的阈值是0到1e-7的blast最邻近截断值。在一个实施例中,在此描述的方法进一步包括过滤步骤,该过滤步骤仅包括具有在900和1800个氨基酸之间的假定蛋白的基因座。在一个实施例中,在此描述的方法进一步包括候选核酸修饰效应物的核酸修饰功能的实验验证,该实验验证包括产生一组编码核酸修饰效应物的核酸构建体,并进行一种或多种生化验证测定,如通过在细菌菌落中使用pam验证、体外切割测定、surveyor方法、在哺乳动物细胞中的实验、pfs验证或其组合。在一个实施例中,在此描述的方法进一步包括制备包含来自经鉴定的核酸修饰基因座的一种或多种蛋白的非天然存在的或工程化的组合物。在一个实施例中,经鉴定的基因座包含2类crispr效应物、或经鉴定的基因座缺乏cas1或cas2、或经鉴定的基因座包含单效应物。在一个实施例中,单个大型效应蛋白的长度大于900个氨基酸或大于1100个氨基酸,或包含至少一个hepn结构域。在一个实施例中,该至少一个hepn结构域在效应蛋白的n-末端或c-末端附近,或位于效应蛋白的内部位置。在一个实施例中,单个大型效应蛋白在n-末端和c-末端包含hepn结构域和在蛋白内部包含两个hepn结构域。在一个实施例中,经鉴定的基因座还包含在crispr阵列的2kb至10kb内的一个或两个小假定辅助蛋白。在一个实施例中,小辅助蛋白包含多个预测跨膜结构域、或包含四个预测跨膜结构域、或包含至少一个hepn结构域。在一个实施例中,小辅助蛋白包含至少一个hepn结构域和至少一个跨膜结构域。在一个实施例中,这个基因座不包含来自crispr阵列25kb以外的另外的蛋白。在一个实施例中,crispr阵列包含长度约36个核苷酸的同向重复序列。在一个特定的实施例中,同向重复序列在5'末端包含反向互补于3'末端的caac的gttg/guug。在一个实施例中,crispr阵列包含长度约30个核苷酸的间隔子序列。在一个实施例中,经鉴定的基因座缺乏小辅助蛋白。因此,本发明的目的在于,在本发明中不涵盖任何先前已知的产品、制造该产品的过程、或使用该产品的方法,使得申请人保留和特此披露放弃任何先前已知的产品、过程、或方法的权利。进一步指出的是,在本发明的范围之内,本发明并不旨在涵盖任何产品、过程、或该产品的制造或使用该产品的方法,其不符合uspto(35u.s.c.§112,第一段)或epo(epc的第83条)的书面说明和可实施性要求,使得申请人保留和特此公开放弃任何先前描述的产品、制造该产品的过程、或使用该产品的方法的权利。可以有利的是,在本发明的实践中符合条款53(c)epc以及条例28(b)和(c)epc。在此没有内容应解读为承诺。应注意,在本披露并且特别是在权利要求书和/或段落中,术语如“包括(comprises)”、“包括的(comprised)”、“包括了(comprising)”等等可具有在美国专利法中属于它的含义;例如,它们可以表示“包含(includes)”、“包含的(included)”、“包含了(including)”等等;并且这些术语如“基本上由……组成(consistingessentiallyof)”和“基本上由……组成(consistsessentiallyof)”具有在美国专利法中归于它们的含义,例如,它们允许未被明确叙述的要素,但是排除在现有技术中发现或者影响本发明的基本或新颖特征的要素。这些和其他实施例披露于以下详细说明中,或者据其显而易见并且由其涵盖。附图说明本发明的新颖特征在所附权利要求书中具体提出。通过参考提出说明性实施例的以下详细说明,将获得对本发明的特征和优点的更好理解,在这些实施例中利用了本发明的原理,并且在这些附图中:图1显示了用于新crispr单效应蛋白发现的生物信息学流程。图2提供了发现阵列(所有阵列和具有单一大型效应物>700aa的阵列)和大型蛋白(900-1800aa)阵列的初步计数。图3提供了以cas9为例的蛋白发现可视化工具。(左上图)选择蛋白质登录号、长度和名称(前10个hhpred同源性命中物和它们各自的概率)。(右上图)基于现有文献的试验性crispr分类。(中间图)包含处于红色的crispr阵列和处于蓝色(选择的蛋白)、品红色(带注释的cas1、cas2)、橙色(其他带注释的crispr相关蛋白)、和白色(所有其他蛋白)的蛋白的基因组基因座的基因组登录号、长度、范围和名称,其中蛋白取向已描绘出。图下方的箭头指示预测的转录方向(5'至3')。图上方的数字表示选择的蛋白的千碱基距离,负数表示“下游”,正数表示“上游”。(左下图),沿选择蛋白的距离(如果是蛋白下游则为负)的基因组中的crispr阵列、重复序列数目、重复序列长度、间隔子长度和共有重复序列。(右下图)邻近选择蛋白(具有索引)的关键基因、登录号、氨基酸长度和名称。图4a-4mmmmm显示了发现组29蛋白的生物信息学流程的输出(参考图3的文件解释说明)。通过ncbiblast进一步发现蛋白,然后在所有蛋白中以1e-7的最邻近e值最小截断值根据同源性进行分组。大多数蛋白都具有一个小辅助蛋白。图5a-5e通过蛋白质登录号、基因组登录号、物种、和细菌菌株列表显示了所有目前已知的组29蛋白。图6a-6b显示来自图5a-e的组29蛋白的系统发育树。图7显示了针对独特性而选择的组29的选择子集,其来源于图5中的列表。图8显示了独特的组29蛋白的选择子集的系统发育树。图9显示了用以选择独特的组29蛋白的子集的辅助小蛋白的系统发育树。图10显示了小蛋白的系统树,表明嗜鳃黄杆菌(fb)与其他与具有二元同向重复的基因座相关的小蛋白相似。图11描绘了fb和产丙酸沼杆菌(pp)基因座。图12显示了基因座的比较,表明小s1a蛋白与具有二元重复序列的crispr基因座相关。图13a-13ff显示了针对独特性而选择的组29蛋白的子集的同向重复的预测的rna折叠。包括蛋白1、11和14的假定二元同向重复,对应于具有辅助小蛋白s1a的组29蛋白。图14a-14e显示了选择独特组29同向重复序列。图15显示了选择独特组29二元同向重复序列。图16a-16c显示了选择独特组29提取的基因组基因座,描绘了组29蛋白、具有crispr阵列的重复区域,并且有时描绘了辅助小蛋白。图17a-17d显示了所有组29蛋白的氨基酸比对。图18a-18b显示了所有组29蛋白的n末端和c末端所示的hepn结构域。图19显示了在选择独特组29蛋白(参考编号在图7中)的n末端和c末端所示的hepn结构域。图20显示了辅助小蛋白与独特29组蛋白选择子集的氨基酸比对。图21显示了动物溃疡伯格菌的rna-seq数据分析,其转录方向从左至右。图22显示了rna转录物的短dr和长dr的比较,从中我们发现了短crrna和长crrna(具有二元同向重复)。图23显示了fb短蛋白同源性。图24显示了fb短蛋白树。图25显示了组30蛋白中的hepn结构域。图26显示了组30蛋白的基因座组构。图27显示了组30蛋白的蛋白比对。图28显示了组30蛋白树。图29显示了fb长dr的折叠结构。图30显示了fb长dr。图31显示了fb短dr的折叠结构。图32显示了fb短dr。图33显示了pp短dr的折叠结构。图34显示了pp短dr。图35a-35b显示了组29效应物(来自动物溃疡伯格菌atcc43767)在指定时间点对egfprna靶标的切割测定的结果。a:用e1-n2-01指导物测定;b:用e1-t2指导物测定。图36a-36d。图36a显示了组29效应物(来自动物溃疡伯格菌atcc43767)通过emsa以指定效应蛋白浓度与egfp靶标的结合测定的结果。左小图:野生型组29效应蛋白。右小图:突变的组29效应蛋白(r116a;h121a;r1177a;h1182a)。图36b显示了组29效应物(来自动物溃疡伯格菌atcc43767)对egfprna靶标的切割测定的结果。用指定crrna评估野生型(“wt”)和死亡(“d”)组29酶。图36c显示了突变的组29效应物(来自动物溃疡伯格菌atcc43767)经由emsa以指定效应蛋白/rna比率与egfp靶标的结合测定的结果。(突变:r1177a;h1182a)。egfp1靶标,孵育60min,50mmnacl,1mmdtt,tris-hclph7.5,.1%bsa。图36d显示了突变的组29效应物(来自动物溃疡伯格菌atcc43767)对egfprna靶标的切割测定的结果。突变:r1177a,h1182a。egfp1靶标,孵育60min,50mmnacl,1mmdtt,tris-hclph7.5,.1%bsa。图37显示了组29效应蛋白(来自动物溃疡伯格菌atcc43767)的单链dnalpam文库(左小图)和单链dnarpam文库(右小图)的切割测定结果。bz=靶crrna。ns=非特异性crrna。bzl=具有长dr的靶向crrna。nsl=具有长dr的非特异性crrna。图38a-38b显示了组29效应蛋白加工它们自己的crrna。a:组29基因座(来自动物溃疡伯格菌atcc43767)和使用的靶标的示意图。b:指示的靶标的切割测定结果。图39显示了具有针对指示的靶标的不同指导物的组29效应物(来自动物溃疡伯格菌atcc43767)对指示的egfprna靶标的切割测定结果。图40a-40b显示了具有针对指示的靶标的不同指导物的组29效应物(来自动物溃疡伯格菌atcc43767)对egfprna靶标的切割测定结果。图41egfp靶序列。图42a-42b描绘了egfp靶标的计算机模拟的二级结构,以确定二级结构对切割的影响。图43a-43b描绘了3种已知的组30效应蛋白的基因座;b描绘了三种类型的组30效应蛋白。图44使用pymol(结构软件)提供了动物溃疡伯格菌组29蛋白结构。蓝色是n-末端,红色是c-末端。紫色的点是hepn结构域。显示c-末端是游离的并且适合连接功能性结构域。图45a-45b提供了crrna。短crrna和长crrna由bzgrp29天然处理。vcp环crrna可以通过将病毒外壳蛋白(vcp,例如ms2、pp7)环插入到同向重复中来工程化。最简单的方法是使用vcp替换长crrna中的长dr插入物。也可以将支架缩短或延伸至vcp环,并添加另外的vcp环以向dgrp29募集更多的结构域。图45b提供了grp29sam系统。grp29sam系统由与一个或多个效应物结构域(例如在c-末端)融合的dgrp29、与另外的一个或多个效应物结构域融合的vcp、和vcp环crrna组成。这三种组分协同作用以影响底物rna。图46a-46b显示了发现一种新颖的2类crispr-cas系统,vi-b型。a)生物信息学流程发现不含cas1或cas2的新颖假定2类crispr基因座。b)vi-b型基因座的简化系统树。具有cas13b(蓝色)和csx27(棕色)的基因座包含vi-b1型;具有cas13b(蓝色)和csx28(金色)的基因座包含vi-b2。c)来自多重序列比对的cas13b和csx28中的hepn结构域。顶图,经由假定非冗余cas13b蛋白的多重序列比对(blosum62)鉴定的两个hepn序列。底图,经由假定非冗余csx28(也称为cas13b-s2)蛋白的多重序列比对(blosum62)鉴定的趋异hepn序列。图47显示了vi-bcrispr基因座的rna测序。a)来自动物溃疡伯格菌atcc43767的天然vi-b1基因座的rna测序。b)对来自大肠杆菌中的颊普雷沃菌atcc33574的异源表达的vi-b2基因座的rna测序。图48描绘了通过靶向ms2的动物溃疡伯格菌或颊普雷沃菌对ms2噬斑发育的抑制。图49描绘了cas13bcrrna的结构,并且显示了左侧原型间隔子侧翼序列(lpfs)和右侧原型间隔子侧翼序列(rpfs)的侧接原型间隔子的布置。图50描绘了用于产生和鉴定间隔子文库的grp29效应物依赖性耗竭的实验设计。图51描绘了在不存在bz效应蛋白的间隔子文库之间(顶图)、相同实验之间(中间图)、以及实验和对照(底图)之间的bz的指导物丰度互相关。图52描绘了在不存在pb效应蛋白的间隔子文库之间(顶图)、相同实验之间(中间图)、以及实验和对照(底图)之间的pb的指导物丰度互相关。图53描绘了根据基因交替着色的bz的靶向指导物耗竭,非靶向为黑色。红色的水平线表示安全耗竭线。图54描绘了根据基因交替着色的pb的靶向指导物耗竭,非靶向为黑色。红色的水平线表示安全耗竭线。图55描绘了bz和pb两者共有的交叉指导物的耗竭水平。图56描绘了跨bz的每个基因的归一化的聚集体耗竭。图57描绘了跨pb的每个基因的归一化的聚集体耗竭。图58描绘了bz(顶图)和pb(底图)的左侧原型间隔子侧翼序列(lpfs)和右侧原型间隔子侧翼序列(rpfs)的序列标志。图59显示了说明bz的l1、r2和r3的核苷酸频率的原型间隔子侧翼序列(pfs)轮。图60显示了说明pb的l1、r2和r3的核苷酸频率的原型间隔子侧翼序列(pfs)轮。图61描绘了在l1、r2和r3处核苷酸的不同组合的平均耗竭。在每个小图中,l1是固定的。左侧小图显示了bz的平均耗竭。右侧小图显示了pb的耗竭。图62显示了氨苄青霉素和卡那霉素抗性基因的pb靶向。图63显示了氨苄青霉素和卡那霉素抗性基因的bz靶向。图64a-64g显示了动物溃疡伯格菌vi-b基因座的异源表达介导敲低大肠杆菌必需基因。a)用于确定核酸干扰的靶向规则的大肠杆菌必需基因筛选的设计。b)平均间隔子耗竭的曼哈顿图映射超过45个基因,并且跨完整动物溃疡伯格菌vi-b1基因座(左图)和cas13b(右图)的归一化的基因距离聚集,其中非靶向间隔子处于灰色,高于蓝线是安全耗竭间隔子(>5σ以上意指非靶向间隔子的耗竭)且高于红线是强耗竭间隔子(前1%耗竭)。我们对筛选的每个条件进行了三次独立的生物复制,且在1/3n(其中n=55,700)的对照筛选中,通过最大变异系数0.2和最小丰度两者质量控制过滤间隔子的平均耗竭。这一步骤将分析中包含的间隔子的总数减少到n’=约35,000-40,000(取决于筛选)。c)强耗竭的动物溃疡伯格菌间隔子的序列基序的weblogo。d)归一化的pfs评分矩阵,其中每个评分是安全耗竭的动物溃疡伯格菌间隔子数量与给定pfs的间隔子总数量之比,按比例缩放以使最大pfs评分为1。e)靶向卡那霉素的间隔子以验证5'pfs(d)和3'pfs(n随后是an或na)的pfs靶向规则。f)大肠杆菌中动物溃疡伯格菌cas13b的卡那霉素验证筛选的结果。g)间隔子丰度对比对照的单个动物溃疡伯格菌间隔子,其中根据间隔子类型着色丰度。图65a-65d描绘了通过hepn结构域,cas13b干扰rna,但不干扰dna。a)用于测试rna干扰的ms2噬菌体噬斑滴定测定(dropassay)的原型间隔子设计。b)完整动物溃疡伯格菌vi-b1基因座(左图)和bzcas13b(右图)的噬斑滴定测定。c)dna干扰测定示意图和结果。将靶序列放置在赋予氨苄青霉素抗性的转录的bla基因起始处或相同靶质粒的非转录区域中。靶质粒与bzcas13b质粒或赋予氯霉素抗性的空载体共转化并涂布在双选抗生素平板上。d)用动物溃疡伯格菌cas13bhepn突变体的ms2噬菌体噬斑滴定测定的定量。图66a-66d显示了与局部rna可及性相关的通过cas13b进行的有效rna靶向。a)用viennarnaplfold检测大肠杆菌必需基因筛选数据的二级结构介导的间隔效率分析的方法。b)使用rnaplfold在随机选择的动物溃疡伯格菌培养数据集中对前1准确度(计算预测的最佳间隔子匹配实验最高耗竭的间隔子)和前3准确度(计算预测的顶部间隔子落入前3耗竭的耗竭间隔子中)的优化,首先用u起始和u终止,然后用w和l。c)针对106蒙特卡洛模拟,随机选择的动物溃疡伯格菌测试数据集(48组群完整动物溃疡伯格菌vi-b1基因座,56组群bzcas13b)的优化的rnaplfold模型的性能:经验p值从左至右:3e-6、1e-6、8.7e-3、6e-6。d)所有基因(从5'utr至基因和从3'utr至基因)的安全耗竭的动物溃疡伯格菌间隔子的经验累积性分布函数。黄线表示utr和基因,红线表示均匀分布的间隔子的理论累积性分布函数,蓝线表示安全耗竭的动物溃疡伯格菌的经验累积性分布。图67a-67e展示了由csx27和csx28差异调节的2类vi-b型系统。a)颊普雷沃菌vi-b2基因座的归一化pfs矩阵。b)完整颊普雷沃菌vi-b2基因座(左)和pbcas13b(右)的ms2噬斑滴定测定。c)与具有和不具有pbcsx28(金色)的pbcas13b相比,具有和不具有bzcsx27(棕色)的bzcas13b的间隔子耗竭。d)cas13b的序列、结构和空间rna靶向模型。(在我们的网站上是一个可下载的bzcas13b靶向设计脚本,其中包含针对研究人员提供的说明以及在另一个crispr系统上执行大肠杆菌必需基因筛选的方案。)e)vi-b系统的双模态功能模型,具有csx27阻遏和csx28增强cas13b介导的rna干扰。图68显示了分支成两种vi-b型crispr基因座的cas13b的系统树。非冗余cas13b效应物的系统树(由blosum62产生的比对),在每种情况下描绘了完整vi-b型基因座。包括基因组、cas13b(蓝色)和csx27(棕色)/csx28(金色)的登录号,且通过piler-cr检测到的邻近间隔子的数量、基因组中其他crispr-cas元件的存在、以及cas13b的尺寸见表1。图69a-69b揭示了预测的vi-b型同向重复的二级结构是高度保守的。a)预测的结构独特的crispr2类vi-b1型同向重复(viennarnafold)的二级结构折叠。b)预测的结构独特的crispr2类vi-b2型同向重复的二级结构折叠。图70a-70b显示了高度保守的vi-b型同向重复序列;预测的原型间隔子侧翼序列是不确定的。a)长度为36nt的所有独特的vi-b同向重复序列的weblogo,被视为与cas13b相同的转录方向。b)所有独特的vi-b原型间隔子侧翼序列的weblogo,从噬菌体和质粒数据库的crispr靶映射。图71a-71b显示了csx27和csx28的预测跨膜结构域未经实验验证。a)使用tmhmmv2对动物溃疡伯格菌的csx27和颊普雷沃菌的csx28进行跨膜结构域预测。b)动物溃疡伯格菌的csx27和颊普雷沃菌的csx28的n-和c-末端融合的rfp成像。图72a-72b显示了针对来自动物溃疡伯格菌的cas13b筛选的卡那霉素验证的第二生物重复与第一生物重复的一致性。a)靶向卡那霉素的间隔子以验证5'pfs(d)和3'pfs(n随后是an或na)的pfs靶向规则。b)间隔子丰度对比对照的单个动物溃疡伯格菌间隔子,其中根据间隔子类型着色丰度。图73展示了ms2噬菌体噬斑滴定分析的生物重复。使用生物重复进行针对动物溃疡伯格菌vi-b1基因座和cas13b以及颊普雷沃菌vi-b2基因座和cas13b的噬斑滴定测定。图74展示了hepn突变体噬斑滴定分析的生物重复。使用生物重复进行针对动物溃疡伯格菌cas13bhepn突变体(r116a/h121a和r1177a/h1182a)对比野生型cas13b的噬斑滴定分析。图75a-75b显示了颊普雷沃菌vi-b2crispr基因座的大肠杆菌必需基因筛选。a)间隔子耗竭的曼哈顿图显示超过45个基因,并且跨完整颊普雷沃菌vi-b2基因座(左图)和cas13b(右图)的归一化的基因距离聚集,其中非靶向间隔子处于灰色,高于蓝线是安全耗竭间隔子(>5σ以上意指非靶向间隔子的耗竭)和且高于红线是强耗竭间隔子(前1%耗竭)。b)强耗竭的颊普雷沃菌间隔子的序列weblogos,揭示了双侧pfs(原型间隔子侧翼序列)。图76a-76c显示了颊普雷沃菌cas13brna靶向的二级结构和空间规则的计算分析。a)使用rnaplfold从随机选择的颊普雷沃菌培养数据集中对前1准确度(计算预测的间隔子是最高耗竭的)和前3准确度(计算预测的间隔子落入前3耗竭)的优化,首先用u起始和u终止,然后用w和l。b)针对106蒙特卡洛模拟,随机选择的颊普雷沃菌测试数据集(41组群完整颊普雷沃菌vi-b2基因座,40组群pbcas13b)的优化的rnaplfold模型的性能:经验p值从左至右:3.3e-2、2.7e-3、3.9e-3、1.5e-5。c)所有基因(从5'utr至基因和从3'utr至基因)的安全耗竭的颊普雷沃菌间隔子的经验累积性分布函数。黄线表示utr和基因,红线表示均匀分布的间隔子的理论累积性分布函数,蓝线表示安全耗竭的颊普雷沃菌的经验累积性分布。图77显示了cas13b对具有不同间隔子序列长度(其范围从30个核苷酸或更少)的crrna的靶序列的切割活性。如图所示,27-30个核苷酸的间隔子长度适用于最佳切割。在26-22个核苷酸的间隔子长度处,切割减少,并且在20个核苷酸或更少的长度处,靶序列没有切割活性。图78是示例性vi-b型基因座的示意图。图79是来自vi-b型基因座的示例性大型效应蛋白的示意图。图80是显示在候选vi-b型基因座中鉴定的假定大型效应蛋白的尺寸分布的图。图81是来自候选vi-b型基因座的假定大型效应蛋白的比对。图82是从假定效应物发现到潜在基因组工程应用的示意图工作流。本文的这些图仅仅是出于说明性的目的,并且不一定是按比例绘制的。具体实施方式一般而言,crispr-cas或crispr系统共同地是指转录物和涉及crispr相关(“cas”)基因的表达或指导其活性的其他元件,包括编码cas基因的序列、tracr(反式激活crispr)序列(例如tracrrna或活性部分tracrrna)、tracr配对序列(涵盖“同向重复”和在内源crispr系统背景下的tracrrna加工的部分同向重复)、指导序列(在内源crispr系统背景下也称为“间隔子(spacer)”)或如该术语在本文中使用的“一个或多个rna”(例如,指导cas(如cas9)的一个或多个rna,例如crisprrna和反式激活(tracr)rna或单指导rna(sgrna)(嵌合rna))或来自crispr座位的其他序列和转录物。一般而言,crispr系统的特征为促进在靶序列(在内源crispr系统的背景下也称为原型间隔子)的位点处的crispr复合物的形成的元件。当crispr蛋白是2类vi-b型效应物时,不需要tracrrna。在本发明的工程化系统中,同向重复可以包含天然存在的序列或非天然存在的序列。本发明的同向重复不限于天然存在的长度和序列。同向重复的长度可以是36nt,但是更长或更短的同向重复可以变化。例如,同向重复可以是30nt或更长,例如30-100nt或更长。例如,同向重复可以是30nt、40nt、50nt、60nt、70nt、80nt、90nt、100nt或更长。在一些实施例中,本发明的同向重复可以包括插入天然存在的同向重复的5'和3'末端之间的合成核苷酸序列。在某些实施例中,插入序列可以是自我互补的,例如20%、30%、40%、50%、60%、70%、80%、90%或100%自我互补。此外,本发明的同向重复可以包括插入核苷酸,例如适体或与衔接蛋白结合的序列(用于与功能域结合)。在某些实施例中,包含这种插入的同向重复的一端大致是短dr的前半部分,而另一端大致是短dr的后半部分。在crispr复合物形成的背景下,“靶序列”是指一种指导序列被设计为对其具有互补性的序列,其中在靶序列与指导序列之间的杂交促进crispr复合物的形成。靶序列可以包含任何多核苷酸,如dna或rna多核苷酸。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。在一些实施例中,可以通过计算机搜索重复基序来鉴定同向重复,其满足下列标准的任一项或全部:1.发现在ii型crispr基因座侧翼的基因组序列的2kb窗口;2.跨从20到50bp;并且3.以20到50bp间隔开。在一些实施例中,可以使用这些标准中的2条,例如1和2、2和3、或1和3。在一些实施例中,可以使用所有这3条标准。在本发明的实施例中,术语指导序列和指导rna(即能够将vi-b型效应蛋白(例如cas13b和组29组或组30蛋白)导向靶基因座的rna)可互换地使用,如在前述引用文献(如wo2014/093622(pct/us2013/074667))中。一般而言,指导序列(或间隔子序列)是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且引导crispr复合物与该靶序列的序列特异性结合的任何多核苷酸序列。在一些实施例中,当使用适合的比对算法进行最佳比对是,在指导序列与其相应的靶序列之间的互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼算法、尼德曼-翁施算法、基于伯罗斯-惠勒变换的算法(例如伯罗斯-惠勒比对工具)、clustalw、clustalx、blat、novoalign(novocraft技术公司;在www.novocraft.com可获得)、eland(亿明达公司(illumina),圣地亚哥,加利福尼亚州)、soap(在soap.genomics.org.cn可获得)、以及maq(在maq.sourceforge.net可获得)。在一些实施例中,指导序列(或间隔子序列)在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸。在一些实施例中,指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸。优选地,指导序列是10-40个核苷酸长,例如20-30或20-40个核苷酸长或更长,例如30个核苷酸长或约30个核苷酸长。在某些实施例中,指导序列是10-30个核苷酸长,例如20-30或20-40个核苷酸长或更长,例如30个核苷酸长或约30个核苷酸长(对于组29或组30效应物)。在某些实施例中,对于源自动物溃疡伯格菌(例如动物溃疡伯格菌atcc43767)的组29效应物,指导序列为10-30个核苷酸长,例如20-30个核苷酸长,例如30个核苷酸长或约30个核苷酸长。可以通过任何适合的测定法来评估指导序列引导crispr复合物与靶序列的序列特异性结合的能力。例如,足以形成crispr复合物的crispr系统的组分,包括有待测试的指导序列在内,可以例如通过用编码该crispr序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后通过如在此描述的surveyor测定来评估在该靶序列之内的优先切割。类似地,通过提供该靶序列、包括有待测试的指导序列在内的crispr复合物的组分、和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处的结合或切割率,可以在试管中评估靶多核苷酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。本发明提供了vi-b型crispr-cas效应物、核酸、系统、载体和使用方法。vi-b型crispr-cas效应物和核酸涵盖组29和组30。所有vi-b组效应物都可以通过结构(也可以通过hepn结构域的定位)与vi-a进行区分。如在此使用的,术语cas13b-s1辅助蛋白、cas13b-s1蛋白、cas13b-s1、csx27、和csx27蛋白可互换地使用,并且术语cas13b-s2辅助蛋白、cas13b-s2蛋白、cas13b-s2、csx28、和csx28蛋白可互换地使用。vi-b组crispr-cas效应物包括以下实例:在经典crispr-cas系统中,在指导序列与其相应的靶序列之间的互补程度可以是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或100%;指导或rna或sgrna在长度上可以为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸;或者指导或rna或sgrna在长度上可以为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸;并且有利地,tracrrna在长度上为30或50个核苷酸。然而,本发明的一个方面在于减少脱靶相互作用,例如减少与具有低互补性的靶序列的相互作用的指导。的确,在这些实例中,显示本发明涉及突变,这些突变产生能够将具有大于80%至约95%互补性(例如,83%-84%或88%-89%或94%-95%互补性)的靶序列与脱靶序列区分开(例如,将具有18个核苷酸的靶标与具有1、2或3个错配的18个核苷酸的脱靶区分开)的crispr-cas系统。因此,在本发明的背景下,在指导序列与其相应的靶序列之间的互补程度大于94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%,或是100%。脱靶小于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%的该序列与该指导物之间的互补性,其中有利的是脱靶是100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的该序列与该指导物之间的互补性。在根据本发明的特别优选实施例中,该指导rna(能够将cas引导到靶基因座)可以包含(1)能够杂交到真核细胞中的靶基因座(多核苷酸靶基因座,例如rna靶基因座)上的指导序列;(2)同向重复(dr)序列),其存在于单个rna中,即sgrna(以5'至3'方向排列)。在具体的实施例中,crispr/cas蛋白的特征在于其利用了包含能够与真核细胞中的基因组靶标基因座杂交的指导序列和同向重复序列的指导rna,并且不需要tracrrna。在具体的实施例中,其中crispr/cas蛋白的特征在于其利用tracrrna,指导序列、tracr配对序列和tracr序列可位于单个rna中,即sgrna(以5'至3'方向排列),或tracrrna可以是与含有指导序列和tracr配对序列的rna不同的rna。在这些实施例中,该tracr杂交到tracr配对序列上并且将crispr/cas复合物引导至靶序列。如在此使用的,“数据库”是指基因组序列信息库。非限制性实例包括ncbi数据库和欧洲ensembl数据库。如在此使用的,“crispr效应物”或“效应物”是指具有酶活性的rna-指导的dna靶向多肽或rna指导的rna靶向多肽。酶活性的非限制性实例包括核酸内切酶、切割酶、整合酶或转座酶活性。如在此使用的,“核酸酶结构域”是指能够切割rna、dna或两者的蛋白域。“切割”是指打断靶多核苷酸的一条或多条链的共价骨架。如在此使用的,术语“crispr阵列”是指包含所有crispr重复序列和间隔子的dna区段,从第一crispr重复序列的第一个核苷酸开始,并以最后(末端)crispr重复序列的最后一个核苷酸结束。典型地,crispr阵列中的每个间隔子序列位于两个重复之间。如在此使用的,术语“crispr重复”、“同向重复”、“重复序列”或“重复”具有本领域中使用的常规含义,即多个短同向重复序列,其显示非常少或没有序列给定crispr阵列内的变化。如在此使用的,“crispr间隔子”、“间隔子序列”或“间隔子”是指位于crispr阵列的重复序列之间的非重复序列。本领域技术人员将使用本领域熟知的实验技术来表征由本发明中公开的方法鉴定的效应系统。例如,足以形成crispr复合物的crispr系统的组分,包括有待测试的crispr效应物和rna指导序列在内,可以例如通过用编码该crispr系统的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后通过surveyor测定来评估在该靶序列之内的优先切割。类似地,通过提供该靶序列、包括有待测试的指导序列在内的crispr复合物的组分、和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处的结合或切割率,可以在试管中评估靶多核苷酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。在具体的实施例中,野生型组29/组30效应蛋白具有rna结合和切割功能。在具体的实施例中,组29/组30效应蛋白可以具有dna切割功能。在这些实施例中,可以基于效应蛋白提供方法,该方法包括在真核细胞中(在体外,即在分离的真核细胞中)诱导一个或多个如在此讨论的突变,包括向细胞递送如在此讨论的载体。该一个或多个突变可以包括经由一种或多种指导、一种或多种rna或一种或多种sgrna在一种或多种细胞的每个靶序列处引入、缺失、或取代一个或多个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种rna或一种或多种sgrna在所述一种或多种细胞的每个靶序列处引入、缺失、或取代1-75个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种rna或一种或多种sgrna在所述一种或多种细胞的每个靶序列处引入、缺失、或取代1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种rna或一种或多种sgrna在所述一种或多种细胞的每个靶序列处引入、缺失、或取代5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75个核苷酸。这些突变包括经由一种或多种指导、一种或多种rna或一种或多种sgrna在所述一种或多种细胞的每个靶序列处引入、缺失、或取代10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种rna或一种或多种sgrna在所述一种或多种细胞的每个靶序列处引入、缺失、或取代20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种rna或一种或多种sgrna在所述一种或多种细胞的每个靶序列处引入、缺失、或取代40、45、50、75、100、200、300、400或500个核苷酸。为了将毒性和脱靶效应最小化,重要的是控制所递送的casmrna和指导rna的浓度。casmrna和指导rna的最佳浓度可以通过在细胞或非人类真核生物动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组基因座处的修饰程度确定。可替代地,为了将毒性水平和脱靶效应最小化,可以用一对靶向感兴趣位点的指导rna来递送cas切割酶mrna(例如,具有d10a突变的化脓链球菌cas9)。将毒性和脱靶效应最小化的指导序列和策略可以是如在wo2014/093622(pct/us2013/074667)中的;或者,经由如本文的突变。典型地,在内源crispr系统的背景下,crispr复合物(包含杂交到靶序列上并且与一种或多种cas蛋白复合的指导序列)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内)的一条链或两条链的切割(如果适用)。不希望受到理论的束缚,该tracr序列(其可以包含或其组成为野生型tracr序列的全部或部分(例如野生型tracr序列的约或多于约20、26、32、45、48、54、63、67、85个、或更多个核苷酸))(如果适用或存在)也可以形成crispr复合物的一部分,如通过沿着该tracr序列的至少一部分杂交到与该指导序列可操作地连接的tracr配对序列的全部或部分上。编码cas的核酸分子有利地是密码子优化的cas。密码子优化序列的一个实例在这种情形下是针对在真核生物(例如,人类)中表达(即,针对在人类中表达进行优化)或针对如本文讨论的另一种真核生物、动物或哺乳动物进行优化的序列;参见,例如,wo2014/093622(pct/us2013/074667)中的sacas9人类密码子优化序列。虽然这是优选的,但是应当理解的是,其他实例也是可能的,并且针对除人类之外的宿主物种的密码子优化或针对具体器官的密码子优化是已知的。在一些实施例中,编码cas的酶编码序列经密码子优化,以便在特异性细胞(如真核细胞)中表达。这些真核细胞可以是特定生物的那些或来源于特异性生物,如哺乳动物,包括但不限于人、或如在此讨论的非人类真核生物或动物或哺乳动物,例如,小鼠、大鼠、兔、狗、牲畜、或非人类哺乳动物或灵长动物。在一些实施例中,对于人类或动物而言很可能使得他们(它们)受苦而没有任何实质性医学益处的用于修饰人类的种系遗传同一性的方法和/或用于修饰动物的遗传同一性的方法、以及还有作为这样的方法的结果的动物,可以被排除在外。一般而言,密码子优化是指通过用在宿主细胞的基因中更频繁地或者最频繁地使用的密码子代替天然序列的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50个、或更多个密码子同时维持该天然氨基酸序列而修饰核酸序列以便增强在感兴趣宿主细胞中的表达的方法。不同的物种对于具有特定氨基酸的某些密码子展示出特定的偏好。密码子偏好性(在生物之间的密码子使用的差异)经常与信使rna(mrna)的翻译效率相关,而该翻译效率则被认为依赖于(除其他之外)被翻译的密码子的性质和特定的转运rna(trna)分子的可用性。细胞内选定的trna的优势一般反映了最频繁用于肽合成的密码子。因此,可以将基因定制为基于密码子优化在给定生物中的最佳基因表达。密码子利用率表可以容易地获得,例如在www.kazusa.orjp/codon/上可获得的密码子使用数据库(“codonusagedatabase”)中,并且这些表可以通过不同的方式调整适用。参见nakamura,y.等人“codonusagetabulatedfromtheinternationaldnasequencedatabases:statusfortheyear2000[从国际dna序列数据库中制表的密码子使用:2000年的状态]”nucl.acidsres.[核酸研究]28:292(2000)。用于密码子优化特定的序列以便在特定的宿主细胞中表达的计算机算法也是可得的,如geneforge[基因制造](aptagen公司[aptagen];jacobus[雅各布斯],pa),也是可得的。在一些实施例中,在编码cas的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个、或更多个、或所有密码子)对应于对于特定氨基酸最频繁使用的密码子。在某些实施例中,如在此描述的方法可以包括提供cas转基因细胞,在其中编码一种或多种指导rna的一个或多个核酸被提供或被引入,在该细胞中与包含一个或多个感兴趣基因的启动子的调控元件可操作地连接。如在此使用的,术语“cas转基因细胞”是指其中已经基因组整合了cas基因的细胞,如真核细胞。根据本发明,该细胞的性质、类型、或来源不是特别受限的。而且,该cas转基因被引入该细胞中的方式可以变化并且可以是如本领域中已知的任何方法。在某些实施例中,通过将该cas转基因引入分离的细胞中来获得该cas转基因细胞。在某些其他实施例中,通过从cas转基因生物中分离细胞来获得该cas转基因细胞。通过举例的方式并且没有限制,如在此称为cas转基因细胞可以来源于cas转基因真核生物(如cas敲入真核生物)。参考通过引用并入本文的wo2014/093622(pct/us13/74667)。可以修饰针对靶向rosa基因座的、转让给桑加莫生物科学公司(sangamobiosciences,inc.)的美国专利公开号20120017290和20110265198的方法,以便利用本发明的crisprcas系统。也可以修饰针对靶向rosa基因座的、转让给cellectis公司的美国专利公开号20130236946的方法,以便利用本发明的crisprcas系统。通过进一步举例的方式,参考platt等人(cell[细胞];159(2):440-455(2014)),描述了cas9敲入小鼠,将其通过引用并入本文。该cas转基因可以进一步包括lox-stop-polya-lox(lsl)盒,由此赋予可通过cre重组酶诱导的cas表达。可替代地,可以通过将该cas转基因引入分离的细胞中来获得该cas转基因细胞。转基因的递送系统在本领域是熟知的。通过举例的方式,该cas转基因可以借助载体(例如,aav、腺病毒、慢病毒)和/或粒子和/或纳米粒子递送而被递送到例如真核细胞中,还如在本文的其他地方所描述的。本领域技术人员将理解的是,如在此称为细胞(如cas转基因细胞)除了具有整合的cas基因之外还可以包括另外的基因组改变、或当与能够将cas导向靶基因座的rna复合时由cas的序列特异性作用产生的突变,例如像一个或多个致癌突变,例如像但不限于描述于platt等人(2014)、chen等人(2014)或kumar等人(2009)。在一些实施例中,该cas序列融合至一个或多个核定位序列(nls),如约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个nls。在一些实施例中,该cas包括在氨基-末端处或与其附近的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个nls,在或接近于羧基-末端约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个nls,或这些的组合(例如在氨基-末端的零个或至少一个或多个nls以及在羧基-末端的零个或至少一个或多个nls)。当存在多于一个nls时,每一个可以被选择为不依赖于其他nls,使得在多于一个拷贝中可以存在单个nls和/或与在一个或多个拷贝中存在一个或多个其他nls相组合。在本发明的一个优选实施例中,该cas包括至多6个nls。在一些实施例中,当nls的最邻近的氨基酸是在从n-末端或c-末端沿着该多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个、或更多个氨基酸之内时,nls可以被视为接近该n-末端或c-末端。nls的非限制性实例包括来源于以下项的nls序列:sv40病毒大t抗原的nls,其具有氨基酸序列pkkkrkv(seqidno:x);来自核质蛋白的nls(例如,具有序列krpaatkkagqakkkk的核质蛋白二分nls)(seqidno:x);c-mycnls,其具有氨基酸序列paakrvkld(seqidno:x)或rqrrnelkrsp(seqidno:x);hrnpa1m9nls,其具有序列nqssnfgpmkggnfggrssgpyggggqyfakprnqggy(seqidno:x);来自输入蛋白-α的ibb结构域的序列rmrizfknkgkdtaelrrrrvevsvelrkakkdeqilkrrnv(seqidno:x);肌瘤t蛋白的序列vsrkrprp(seqidno:x)和ppkkared(seqidno:x);人p53的序列popkkkpl(seqidno:x);小鼠c-abliv的序列salikkkkkmap(seqidno:x);流感病毒ns1的序列drlrr(seqidno:x)和pkqkkrk(seqidno:x);肝炎病毒δ抗原的序列rklkkkikkl(seqidno:x);小鼠mx1蛋白的序列rekkkflkrr(seqidno:x);人聚(adp-核糖)聚合酶的序列krkgdevdgvdevakkkskk(seqidno:x);以及类固醇激素受体(人)糖皮质激素的序列rkclqagmnlearktkk(seqidno:x)。一般而言,该一个或多个nls具有足够的强度,以便在真核细胞的细胞核中驱动该cas以可检测的量积聚。一般而言,核定位活性的强度可以由在该cas中的nls的数目、所使用的一个或多个特定的nls、或这些因素的组合导出。可以通过任何适合的技术进行细胞核中积聚的检测。例如,检测标记可以融合到该cas上,使得细胞内的位置可以被可视化,如与检测细胞核的位置的手段(例如,对于细胞核特异的染料,如dapi)相结合。还可以将细胞核从细胞中分离出来,然后可以通过任何适合的用于检测蛋白的方法分析其内容物,如免疫组织化学、western印迹或酶活性测定。如通过测定crispr复合物形成的作用(例如,测定在靶序列处的dna切割或突变、或测定由于crispr复合物形成和/或cas酶活性的影响而改变的基因表达活性),与没有暴露于该cas或复合物、或暴露于缺乏该一个或多个nls的cas的对照相比较,还可以间接地确定细胞核中的积聚。在某些方面,本发明涉及载体,这些载体例如用于将cas和/或能够将cas导向靶座位的rna(即指导rna)递送或引入细胞中,而且还用于繁殖这些组分(例如在原核细胞中)。如本文使用的,“载体”是允许或促进一个实体从一个环境转移到另一个环境中的工具。它是复制子,如质粒、噬菌体、或粘粒,另一个dna片段可以插入其中,从而引起该插入的片段的复制。通常,当与适当的控制元件相关时,载体能够复制。一般而言,术语“载体”是指一种核酸分子,其能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如环状的)的核酸分子;包括dna、rna、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的dna片段的环状双链dna环。另一种类型的载体是病毒载体,其中病毒衍生的dna或rna序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒(aav))的载体中。病毒载体还包含由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此称为“表达载体”。在重组dna技术中使用的普通表达栽体通常是质粒形式。重组表达载体可包含处于适合于在宿主细胞中的核酸表达的形式的本发明的核酸,这意味着这些重组表达载体包含基于待用于表达的宿主细胞而选择的一种或多种调控元件,所述调控元件可操作地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许该核苷酸序列的表达的方式被连接至该一种或多种调控元件(例如,处于体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。关于重组和克隆方法,提及2004年9月2日以us2004-0171156a1公开的美国专利申请10/815,730,该专利的内容通过引用以其整体并入本文。这一种或多种载体可以包括一种或多种调控元件,例如一种或多种启动子。该一种或多种载体可以包括cas编码序列,和/或单指导rna编码序列,但是可能地,还可以包括至少3或8或16或32或48或50个指导rna(例如,sgrna)编码序列,如1-2、1-3、1-4、1-5、3-6、3-7、3-8、3-9、3-10、3-8、3-16、3-30、3-32、3-48、3-50种rna(例如,sgrna)。在单一载体中,有利地当存在高达约16种rna(例如,sgrna)时,可以存在启动子针对每种rna(例如,sgrna);并且,当单一载体提供多于16种rna(例如,sgrna)时,一种或多种启动子可以驱动这一种或多种rna(例如,sgrna)中的多于一种的表达,例如当存在32种rna(例如,sgrna),每种启动子都可以驱动两种rna(例如,sgrna)的表达,并且当存在48种rna(例如,sgrna)时,每种启动子都可以驱动三种rna(例如,sgrna)的表达。通过简单的算术以及良好建立的克隆方案和本披露的传授,本领域的普通技术人员可以容易地就一种或多种rna(例如,适合的示例性载体如aav的一种或多种sgrna,和适合的启动子如u6启动子,例如u6-sgrna)而言实践本发明。例如,aav的包装极限是约4.7kb。单个u6-sgrna(加克隆用的限制酶切位点)的长度是361bp。因此,本领域技术人员可以容易地将约12-16个(例如,13个)u6-sgrna盒装配进单一载体中。这可以通过任何合适的手段进行组装,如用于tale组装的金门(goldengate)策略(http://www.genome-engineering.org/taleffectors/)。本领域技术人员还可以使用串联指导策略将u6-sgrna的数目增加大约1.5倍,例如从12-16个(例如,13个)增加到大约18-24个(例如,约19个)u6-sgrna。因此,本领域的普通技术人员可以在单一载体(例如,aav载体)中容易地达到大约18-24个(例如,约19个)启动子-rna(例如,u6-sgrna)。用于增加载体中的启动子和rna(例如,一种或多种sgrna)的数目的另一种手段是使用单个启动子(例如,u6)来表达一系列由可切割的序列隔开的rna(例如,sgrna)。并且用于增加载体中的启动子-rna(例如,sgrna)的数目的又另一种手段是在编码序列或基因的内含子中表达一系列由可切割的序列隔开的启动子-rna(例如,sgrna);并且,在这种情况下,有利的是使用聚合酶ii启动子,它可以具有增加的表达并且按组织特异性方式使得长rna能够转录。(参见例如,http://nar.oxfordjournals.org/content/34/7/e53.short,http://www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在一个有利的实施例中,aav可以包装靶向高达约50个基因的u6串联sgrna。因此,根据本领域的知识以及本披露的传授,本领域技术人员可以容易地制备和使用一种或多种载体(例如,单一载体),这一种或多种载体在操作性地或功能性地连接的一种或多种启动子的控制下表达多种rna或指导或sgrna-尤其是就在此讨论的rna或指导物或sgrna的数目而言,而无需进行任何过度的实验。这一种或多种指导rna(例如,一种或多种sgrna)的编码序列和/或cas编码序列可以功能性地或操作性地连接至一种或多种调控元件并且因此这一种或多种调控元件驱动表达。这一种或多种启动子可以是一种或多种组成型启动子和/或一种或多种条件型启动子和/或一种或多种诱导型启动子和/或一种或多种组织特异性启动子。该启动子可以选自下组,该组由以下组成:rna聚合酶、poli、polii、poliii、t7、u6、h1、逆转录劳斯肉瘤病毒(rsv)ltr启动子、巨细胞病毒(cmv)启动子、sv40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(pgk)启动子、以及ef1α启动子。一种有利的启动子是启动子u6。一般而言,该crispr-cas9系统是如在前述文献(如wo2014/093622(pct/us2013/074667))中所使用的并且总共是指转录物和涉及crispr相关(“cas”)酶(例如cas9)的表达或指导其活性的其他元件,包括编码或递送cas酶(靶向dna和/或rna)酶的序列、tracr(反式激活crispr)序列(例如tracrrna或活性部分tracrrna)、tracr配对序列(涵盖“同向重复”和在内源crispr系统背景下的tracrrna加工的部分同向重复)、指导序列(在内源crispr系统背景下也称为“间隔子(spacer)”)、或如本文使用的术语“rna”(例如,指导cas9的rna,例如,crisprrna(crrna)和反式激活crrna(tracrrna)或单一指导rna(sgrna)(嵌合rna))或来自crispr基因座的其他序列和转录物。一般而言,crispr系统的特征为促进在靶序列(在内源crispr系统的背景下也称为原型间隔子)的位点处的crispr复合物的形成的元件。在crispr复合物形成的背景下,“靶序列”是指一个指导序列被设计为对其具有互补性的靶标,其中在靶序列与指导序列之间的杂交促进crispr复合物的形成。通过其与靶序列的互补性对于切割活性而言重要的指导序列区段在此称为种子序列。靶序列可以包含任何多核苷酸,例如dna或rna多核苷酸,并且被包含在感兴趣的靶基因座内。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。在此描述的发明涵盖2类crispr-cas系统的新颖效应蛋白,其中cas9是示例性效应蛋白,因此本申请中用于描述新颖的效应蛋白的术语可能与用于描述crispr-cas9系统的术语向相关。crispr-cas基因座具有超过50个基因家族,并且没有严格的通用基因。因此,没有可行的单个进化树,需要多个方法来鉴定新家族。到目前为止,已有93个cas蛋白的395个谱的全面的cas基因鉴定。分类包括标签基因概况加基因座结构的签名。1类包括多亚基crrna效应复合物(cascade),并且2类包括单亚基crrna效应复合物(cas9样)。crispr-cas系统的作用通常分为三个阶段:(1)适应或间隔子整合,(2)crispr基因座的初级转录物(前crrna)的加工和crrna的成熟,其包括对应于crispr重复的5'和3'片段的间隔子和可变区,以及(3)dna或rna干扰。存在于绝大多数已知crispr-cas系统中的两种蛋白,cas1和cas2足够用于将间隔子插入crispr盒中。这两种蛋白形成这种适应过程所需的复合物;cas1的核酸内切酶活性对于间隔子整合是必需的,而cas2似乎进行非酶功能。cas1-cas2复合物代表crispr-cas的高度保守的“信息处理”模块,似乎与系统的其余部分是准自主的。(参见annotationandclassificationofcrispr-cassystems[crispr-cas系统的注释和分类].makarovaks,kooninev.methodsmolbiol.[分子生物学方法]2015;1311:47-75)。先前描述的2类系统,即ii型和假定v型,仅由cas操纵子中的三个或四个基因组成,即包含适应模块的cas1和cas2基因(基因的cas1-cas2配对不参与干扰)、单个的多域效应蛋白(负责干扰,但也有助于前crrna加工和适应,并且通常是具有未表征的功能的第四基因,这在至少某些ii型系统中是不必要的(并且在某些情况下,第四基因是cas4(生物化学或计算机证据显示cas4是具有三个半胱氨酸c-末端簇的pd-(de)xk超家族核酸酶;具有5′-ssdna外切核酸酶活性))或csn2(其编码失活的atp酶)。在大多数情况下,crispr阵列和称为tracrrna(一种反式编码的小crisprrna)的独特rna物种的基因与2类cas操纵子邻近。tracrrna与各自的crispr阵列内的重复序列部分同源,并且对于由核糖核酸酶iii催化的前crrna的加工是至关重要的,该核糖核酸酶iii是与crispr-cas基因座不相关的遍存的细菌酶。本发明的方面涉及鉴定和工程化与cas蛋白不可知的crispr系统相关的新颖效应蛋白。在一个优选实施例中,效应蛋白包含单亚基效应物模块。在另外的实施例中,效应蛋白在原核或真核细胞中起作用,用于体外、体内或离体应用。本发明的一个方面涵盖用于预测新的cas蛋白不可知的crispr系统并鉴定其中的组分的计算方法和算法。在一个方面中,通过将经鉴定的基因与cas蛋白特异性谱进行比较来鉴定所有预测的蛋白编码基因,并根据ncbi保守结构域数据库(cdd)对其进行注释,该ncbi保守域数据库(cdd)是蛋白注释资源,其由古生结构域和全长蛋白的注释良好的多重序列比对模型的集合组成。这些可用作位置特异性评分矩阵(pssm),用于经由rps-blast快速鉴定蛋白序列中的保守结构域。cdd内容包括ncbi收录的结构域,其使用3d结构信息来明确定义结构域边界,并提供对序列/结构/功能关系的见解、以及来自多个外部源数据库(pfam、smart、cog、prk、tigrfam)的结构域模型。在又一个方面,使用piler-cr程序预测crispr阵列,该程序是用于发现crispr重复的公共领域软件,如描述于“ppiler-cr:fastandaccurateidentificationofcrisprrepeats[ppiler-cr:快速和准确鉴定crispr重复]”,edgar,r.c.,bmcbioinformatics[bmc生物信息学],1月20日;8:18(2007),在此通过引用并入。在又一个方面,使用psi-blast(位置特异性迭代基本局部比对搜索工具(position-specificiterativebasiclocalalignmentsearchtool))进行逐个情况分析。使用蛋白-蛋白blast,psi-blast得到位置特异性评分矩阵(pssm)或来自在给定评分阈值以上检测到的序列的多重序列比对谱。这种pssm用于进一步搜索数据库中的新匹配,并随后用这些新检测到的序列进行迭代更新。因此,psi-blast提供了检测蛋白之间远缘关系的手段。在另一个方面,使用hhpred进行逐个情况分析,hhpred是用于序列数据库搜索和结构预测的方法,该方法与blast或psi-blast一样易于使用,并且同时在寻找远程同系物方面更敏感。事实上,hhpred的敏感性与目前可用的结构预测功能最强大的服务器相当。hhpred是第一款基于配置文件隐藏马尔可夫模型(hmm)成对比较的服务器。尽管大多数常规序列搜索方法搜索序列数据库(例如uniprot或nr),但hhpred搜索比对数据库(例如pfam或smart)。这极大地简化了针对多个序列家族而不是混乱的单个序列的命中物的列表。所有主要公开可用的配置文件和比对数据库都可以通过hhpred获得。hhpred接受单个查询序列或多重比对作为输入。在仅仅几分钟内,它就以与psi-blast相似的易读格式返回搜索结果。搜索选项包括局部对比或总体对比和评分二级结构相似性。hhpred可以产生成对的查询-模板序列比对,合并的查询-模板多重比对(例如用于传递式搜索),以及由来自hellpred比对的modeller软件计算的3d结构模型。在一个方面中,本披露针对一种用于鉴定新颖核酸修饰效应物的方法。在某些示例性实施例中,该方法针对鉴定新颖的crispr效应物。然而,在此公开的方法适用于含有保守遗传元件的其他核酸修饰基因座,例如在tale中发现的保守重复元素和潜在的其他核酸修饰效应物。同样,核酸修饰活性不限于核酸内切酶活性,但是任何核酸修饰活性包括但不限于转座酶、重组酶、连接酶、糖基、拓扑异构酶、切割酶、甲基化酶。应该进一步理解的是,该方法的一个或多个步骤可以在一个或多个计算设备上执行。在某些示例性实施例中,可以从一组核酸序列中鉴定假定核酸修饰基因座。该组核酸序列可以获得自基因组或宏基因组数据库。取决于待搜索的核酸修饰基因座,基因组或宏基因组数据库可以仅包含原核基因组序列、仅包含真核基因组序列或其组合。在某些示例性实施例中,该方法包括从基因组或宏基因组数据库获得所有可用的原核基因组序列。示例性数据库包括欧洲ensemble和ncbi数据库。然后可以选择包含保守基因组元件的核酸序列的亚类。用于搜索和鉴定保守基因组元件的工具将取决于待鉴定的保守基因组元件的组成。在某些示例性实施例中,piler-crcrispr用于鉴定包含一个或多个crispr阵列的基因组序列。r.c.edgar.“piler-cr:fastandaccurateidentificationofcrisprrepeats.[piler-cr:快速、准确地鉴定crispr重复序列]”bmcbioinformatics.[bmc生物信息学]2007;8:18。然后搜索组装的核酸序列组,以在保守基因组元件的定义的距离内、包含至少一种高于定义的尺寸限制的蛋白的基因座、或两者内鉴定假定核酸修饰基因座。包含保守基因组元件的序列选自所有核酸序列的组。距保守基因组元件的定义的距离可以通过已知的感兴趣的核酸修饰基因座的结构来知晓。在某些示例性实施例中,限定的距离在保守基因组元件的25kb、24kb、23kb、22kb、21kb、20kb、19kb、18kb、17kb、16kb、15kb、14kb、13kb、12kb、11kb、10kb、9kb、8kb、7kb、6kb、5kb、4kb、3kb、2kb或1kb内。在某些示例性实施例中,保守基因组元件是crispr阵列,并且定义的距离在crispr阵列的10kb内。根据基因座是否编码给定尺寸的一种或多种蛋白产品,可以进一步筛选假定核酸修饰基因座。可以通过类似效应物的已知特征来知晓定义的尺寸限制。在某些示例性实施例中,只有当定义的尺寸限制大于100、150、200、225、250、275、300、325、350、375、400、425、450、475、400、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、或1000个氨基酸时才选择基因座。在某些示例性实施例中,尺寸限制大于700个氨基酸。然后将经鉴定的假定核酸修饰基因座分组成包含同源蛋白的基因座的子集。在某些示例性实施例中,通过对蛋白数据库(例如ncbi蛋白数据库)进行ncbiblast同源性搜索来鉴定同源蛋白。ncbiblast同源性搜索的截断值参数可以在0到1e-15之间变化。在某些示例性实施例中,截止参数是1e-7。在某些示例性实施例中,hhpred蛋白域同源性搜索(soding等人nucleicacidsresearch.[核酸研究]2005:33(web服务器问题(webserverissue)):w244-8.doi:10.1093/nar/gki408)可以在以这种方式发现的所有蛋白上进行,以将假定结构域映射到每个假定蛋白。在某些示例性实施例中,从分组的子集中鉴定最终一组候选核酸修饰基因座。在某些示例性实施例中,基于与已知蛋白域的低hhpred同源性匹配来选择候选核酸修饰基因座的最终集合。低同源性可以指大于5、10、15、20、25或30个残基且与现有已知核酸催化结构域匹配大于50%的预测蛋白域。在某些其他示例性实施例中,低同源性可以指大于5、10、15、20、25或30个残基且与现有已知核酸催化结构域匹配大于50%的预测蛋白域。候选核酸修饰基因座的最终集合可以基于大假定蛋白效应物相对于假定相邻辅助蛋白的相同方向来进一步选择。此外,根据一组内单效应物候选的总数,可以评估该组是否是遗传保守的,并从而其是否可能具有生物功能。用于选择核酸修饰基因座的最终候选集合的进一步标准可以包括:相对于其他基因座具有最小的现有核酸修饰分类的假定蛋白的子集、包含相对于其他基因座与任何假定小辅助蛋白具有相同方向的大假定蛋白的子集、以及包含相对于其他基因座与保守基因组元件距离较短的大假定蛋白的基因座。这个短距离可能在3000kb、2500kb、2000kb、1500kb或1000kb之内。在某些示例性实施例中,候选核酸修饰基因座的最终集合选自下组,该组包含最大数量的假定效应蛋白。在某些示例性实施例中,上述标准的任何组合可以用来选择候选核酸修饰基因座的最终集合。在某些示例性实施例中,通过进行一种或多种生物化学验证测定(包括在此进一步公开的那些生物化学验证测定),通过实验验证候选核酸修饰效应物的核酸修饰功能,可以进一步筛选候选核酸修饰基因座的最终集合。然后使用上述方法鉴定的候选核酸修饰基因座可以用于制备非天然存在的或工程化的组合物的基础,这些组合物包含来自如在此进一步公开的经鉴定的核酸修饰基因座的一种或多种蛋白。在某些示例性实施例中,从基因组数据库鉴定新颖crispr效应物的方法包括以下步骤:a)从编码crispr阵列的数据库中选择序列,b)鉴定位于crispr阵列10kb内的基因座,该crispr阵列包含来自(a)的选定序列中的可读框(orf),c)从(b)包含orf(其中仅单个orf编码与已知crispr效应物具有大于700个氨基酸并且不超过90%同源性的新颖crispr效应物)的基因座中进行选择。在某些其他示例性实施例中,从基因组数据库鉴定新颖crispr效应物的方法包括以下步骤:a)从编码crispr阵列的数据库中选择序列,b)鉴定位于crispr阵列10kb内的基因座,该crispr阵列包含来自(a)的选定序列中的可读框(orf),c)从(b)包含orf(其中仅单个orf编码具有大于700个氨基酸的新颖crispr效应物)的基因座中进行选择;和将新颖crispr效应物的二级结构与已知crispr效应物的二级结构进行比较,从而鉴定新颖crispr效应物。在某些其他示例性实施例中,从基因组数据库鉴定新颖crispr效应物的方法包括以下步骤:a)从编码crispr阵列的数据库中选择序列,b)鉴定位于crispr阵列10kb内的基因座,该crispr阵列包含来自(a)的选定序列中的可读框(orf),c)从(b)包含orf(其中仅单个orf编码具有大于700个氨基酸的新颖crispr效应物)的基因座中进行选择;和将新颖crispr效应物的二级结构与已知crispr效应物的二级结构进行比较,从而鉴定新颖crispr效应物。术语“靶向核酸的系统”,其中核酸是dna或rna,并且在一些方面还可以指dna-rna杂合体或其衍生物,总共是指转录物和涉及靶向dna或rna的crispr相关(“cas”)基因的表达或指导其活性的其他元件,其可以包括编码靶向dna或rna的cas蛋白的序列、和包括crisprrna(crrna)序列和(在一些但不是所有系统中)反式激活crispr/cas系统rna(tracrrna)序列的靶向dna或rna的指导rna、或来自靶向dna或rna的crispr基因座的其他序列和转录物。一般来说,靶向rna的系统的特征为促进在靶dna或rna序列的位点处形成dna或rna靶向复合物的元件。在dna或rna靶向复合物形成的背景下,“靶序列”是指靶向dna或rna的指导rna被设计为对其具有互补性的dna或rna序列,其中在靶序列与靶向rna的指导rna之间的杂交促进靶向rna的复合物的形成。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。在本发明的一个方面,新颖的rna靶向系统还称为本申请的rna或rna靶向crispr系统,是基于不要求产生用以靶向特异性rna序列的定制蛋白的鉴定的组29或组30蛋白,而是单个酶可以通过rna分子被编程为识别特异性rna靶标,换言之,使用所述rna分子可以将该酶募集到特异性dna靶标上。在此描述的这些靶向核酸的系统、载体系统、载体和组合物可以用于各种靶向核酸的应用中,由此改变或修饰基因产物的合成,如蛋白、核酸切割、核酸编辑、核酸剪接;靶核酸的运输、靶核酸的追踪、靶核酸的分离、靶核酸的可视化等。在一个有利的实施例中,本发明涵盖在没有邻近cas1或cas2的基因座中鉴定的效应蛋白。组29核酸酶组29蛋白的活性取决于两个hepn结构域的存在。已经显示这些是rna酶结构域,即核酸酶(特别是核酸内切酶)切割rna。hepn也可以靶向dna、或潜在的dna和/或rna。基于组29蛋白的hepn结构域至少能够与其野生型结合、并且以其野生型形式切割rna,则优选组29效应蛋白具有rna酶功能。其也可以或可替代地具有dnase功能。在此详细讨论dna酶功能、结合dna的能力以及潜在切割或切割dna的能力。因此,在一些实施例中,效应蛋白可以是rna结合蛋白,例如死亡cas型效应蛋白,其可以任选地如在此描述的用例如转录激活物或阻遏物结构域、nls或其他功能域功能化。在一些实施例中,效应蛋白可以是切割单链rna的rna结合蛋白。如果rna结合是ssrna,则ssrna被完全切割。在一些实施例中,效应蛋白可以是切割rna双链的rna结合蛋白,例如如果其包含两个rna酶结构域。如果rna结合是dsrna,则dsrna被完全切割。在一些实施例中,效应蛋白可以是具有切割酶活性的rna结合蛋白,即其结合dsrna,但仅切割一条rna链。crispr系统中的核糖核酸酶功能是已知的,例如已经报道了针对某些iii型crispr-cas系统的mrna靶向(hale等人,2014,genesdev[基因开发],第28卷,2432-2443;hale等人.,2009,cell[细胞],第139卷,945-956;peng等人,2015,nucleicacidsresearch[核酸研究],第43卷,406-417),并提供显著的优点。因此提供了经由本发明效应蛋白靶向rna的crispr-cas系统、组合物或方法。靶rna(即感兴趣的rna)是本发明靶向的rna,其导致靶rna上感兴趣的靶位点上的效应蛋白的募集和效应蛋白的结合。靶rna可以是任何合适形式的rna。在一些实施例中,这可以包括mrna。在其他实施例中,靶rna可以包括trna或rrna。干扰rna(rnai)和微小rna(mirna)在其他实施例中,靶rna可以包括干扰rna,即参与rna干扰途径的rna,例如shrna、sirna等。在某些实施例中,该靶rna可以包括微小rna(mirna)。对干扰rna或mirna的控制可以通过在体内或体外减少干扰rna或mirna的寿命来帮助减少用这些方法看到的脱靶效应(ote)。如果效应蛋白和合适的指导被选择性表达(例如在合适的启动子的控制下,例如在空间或时间上,例如组织或细胞周期特异性启动子和/或增强子),则这可以用于“保护”在这些细胞中来自rnai的细胞或系统(体内或体外)。在其中不需要rnai的邻近组织或细胞中,或者为了比较其中效应蛋白和合适的指导物表达和不被表达的细胞或组织(即,分别是其中rnai未被控制和其中rnai被控制),这可能是有用的。效应蛋白可以用于控制或结合包含rna或由rna组成的分子,例如核酶、核糖体或核糖开关。在本发明的实施例中,rna指导可以将效应蛋白募集到这些分子,使得效应蛋白能够结合至它们。核糖体rna(rrna)例如,氮杂内酯抗生素(例如阿奇毒素)是熟知的。它们靶向并破坏50s核糖体亚基。在一些实施例中,本发明的效应蛋白连同合适的靶向50s核糖体亚基的指导rna可以被募集并结合至50s核糖体亚基。因此,提供了与针对核糖体(特别是50s核糖体亚基)靶标的合适的指导一致的本发明的效应蛋白。使用这种与针对核糖体(特别是50s核糖体亚基)靶标的合适指导一致的效应蛋白的用途可以包括抗生素用途。具体而言,抗生素的用途类似于氮杂内酯抗生素(例如阿奇毒素)的作用。在一些实施例中,可以靶向原核核糖体亚基,例如原核生物中的70s亚基、上述50s亚基、30s亚基以及16s和5s亚基。在其他实施例中,真核生物核糖体亚基例如真核生物中的80s亚基、60s亚基、40s亚基以及28s、18s、5.8s和5s亚基可以被靶向。在一些实施例中,效应蛋白可以是任选官能化的rna结合蛋白,如在此描述的。在一些实施例中,效应蛋白可以是切割单链rna的rna结合蛋白。在任一种情况下,但特别是在rna结合蛋白切割单链rna的情况下,核糖体功能可以被调节,特别是被减少或破坏。这可以适用于任何核糖体rna和任何核糖体亚基,并且rrna的序列是熟知的。因此,通过使用与对核糖体靶标的合适指导一致的本发明的效应蛋白来设想核糖体活性的控制。这可以是通过切割或结合到核糖体。具体而言,设想降低核糖体活性。这可以用于体内或体外测定核糖体功能,但也可作为基于核糖体活性的体内或体外控制疗法的手段。此外,设想在体内或体外系统中控制(即减少)蛋白合成,这种控制包括抗生素和研究和诊断用途。核糖开关核糖开关(也称为船蛸属酶(aptozyme))是结合小分子的信使rna分子的调节片段。这典型地导致由mrna编码的蛋白的产生的变化。因此,通过使用与核糖开关靶标的合适指导一致的本发明的效应蛋白来设想对核糖开关活性的控制。这可以是通过切割或结合到核糖开关。具体而言,设想降低核糖开关活性。这可以用于体内或体外测定核糖开关功能,但也可作为基于核糖开关活性的体内或体外控制疗法的手段。此外,设想在体内或体外系统中控制(即减少)蛋白合成。对于rrna,这种控制可以包括抗生素和研究和诊断用途。核酶核酶是具有催化特性的rna分子,类似于酶(其当然是蛋白质)。因为核酶(天然存在的和工程化的核酶两者)包含rna或由rna组成,它们也可以被本发明的rna结合效应蛋白靶向。在一些实施例中,效应蛋白可以是rna结合蛋白切割核酶从而使其失活。因此,通过使用与核酶靶标的合适指导一致的本发明的效应蛋白来设想核酶活性的控制。这可以是通过切割或结合到核酶。具体而言,设想降低核酶活性。这可以用于体内或体外测定核酶功能,但也可作为基于核酶活性的体内或体外控制疗法的手段。基因表达,包括rna加工效应蛋白也可以与合适的指导一起用于靶向基因表达,包括经由rna加工的控制。rna加工的控制可以包括rna加工反应,例如rna剪接,包括经由靶向rnapol的可变剪接;病毒复制(特别是卫星病毒、噬菌体和逆转录病毒,如在此列出的hbv、hbc和hiv等),包括植物中的类病毒;和trna的生物合成。效应蛋白和合适的指导也可以用于控制rna激活(rnaa)。rnaa导致基因表达的促进,因此可以通过破坏或降低rnaa并因此减少基因表达的促进来实现对基因表达的控制。rnai筛选鉴定其敲低与表型变化相关的基因产物,可经由rnai筛选来探询生物学途径并鉴定组成部分。也可以通过使用效应蛋白和合适的指导在这些筛选中或在这些筛选期间施加对照,以去除或降低筛选中rnai的活性,从而(通过除去或减少干扰/阻遏)来恢复(先前受干扰的)基因产物的活性。卫星rna(satrnas)和卫星病毒也可以被处理。在此关于核糖核酸酶活性的对照通常意指降低、消极破坏或敲低或敲除。体内rna应用抑制基因表达在此提供的靶标特异性核糖核酸酶允许非常特异性切割靶rna。由于基因组未被修饰,rna水平上的干扰允许在空间和时间两者上以非侵入方式调节。已经证明许多疾病可通过mrna靶向治疗。尽管这些研究中的大多数涉及sirna的给药,但清楚的是在此提供的rna靶向效应蛋白可以以类似的方式给药。mrna靶标(和相应的疾病治疗)的实例是vegf、vegf-r1和rtp801(治疗amd和/或dme)、半胱天冬酶2(治疗naion)、adrb2(治疗眼内压)、trpvi(治疗干眼症)、syk激酶(用于治疗哮喘)、apob(治疗高胆固醇血症)、plk1、ksp和vegf(治疗实体瘤)、ber-abl(治疗cml)(burnett和rossichembiol.[生物化学]2012,19(1):60-71)。类似地,已经证实rna靶向在治疗rna病毒介导的疾病(例如hiv(靶向hivtet和rev)、rsv(靶向rsv核衣壳蛋白)和hcv(靶向mir-122)(burnett和rossichembiol.[生物化学]2012,19(1):60-71)。进一步设想本发明的rna靶向效应蛋白可以用于突变特异性或等位基因特异性敲低。指导rna可以设计为特异性靶向转录的mrna中包含突变或等位基因特异性序列的序列。这种特异性敲低特别适用于涉及与突变或等位基因特异性基因产物有关的疾病的治疗应用。例如,大多数家族性低脂血症蛋白血症(fhbl)病例是由apob基因突变引起的。该基因编码载脂蛋白b蛋白的两种版本:短版本(apob-48)和更长版本(apob-100)。导致fhbl的几种apob基因突变导致两种版本的apob异常短。用本发明的rna靶向效应蛋白进行突变的apobmrna转录物的特异性靶向和敲低可能有益于fhbl的治疗。又如,亨廷顿氏病(hd)是由编码亨廷顿蛋白的基因中cag三联体重复序列的扩增引起的,其导致异常蛋白。用本发明的rna靶向效应蛋白靶向和敲低编码亨廷顿蛋白的突变或等位基因特异性mrna转录物在治疗hd中可能是有益的。应该注意的是,在这种背景下,并且更一般地,如在此描述的不同应用,可以设想使用断裂版本的rna靶向效应蛋白。事实上,这不仅可以提高特异性,而且对于递送也可能是有利的。在cas13b酶的两个部分实质上包含功能化cas13b的意义上,该cas13b是断裂型的。理想地,断裂应当始终是这样的,使得该一个或多个催化结构域不受影响。该cas13b可以作为核酸酶发挥作用,或者由于在其催化结构域中典型的一个或多个突变,它可能是一种死亡cas13b(基本上是一种rna结合蛋白,具有很少或没有催化活性)。断裂cas13b的每一半可以与二聚化配偶体融合。通过举例的方式并且没有限制,采用雷帕霉素敏感的二聚化结构域,允许产生用于时空控制cas13b活性的化学诱导断裂型cas13b。通过被断裂成两个片段可以使cas13b成为化学诱导型的,并且雷帕霉素敏感型二聚化结构域可以被用于cas13b的受控重组装。断裂型cas13b的两个部分可以被认为是该断裂型cas13b的n’末端部分和c’末端部分。融合典型地是在cas13b的断裂点。换言之,断裂型cas13b的c’末端或n’末端部分融合至二聚体两个一半之一,同时n’末端的c’末端部分融合至二聚体的另一半。在断裂是新产生的意义上,cas13b不一定是断裂型的。典型地经由计算机模拟设计断裂点并将其克隆到构建体中。总之,断裂型cas13b的两个部分(n’末端和c’末端部分)形成完整的cas13b,优选地包含至少70%或更多的野生型氨基酸(或编码它们的核苷酸),优选至少80%或更多、优选至少90%或更多、优选至少95%或更多并且最优选至少99%或更多的野生型氨基酸(或编码它们的核苷酸)。一些修剪是可能的,并且设想了突变体。可以完全去除非功能域。重要的是,这两个部分可以被聚到一起并且所希望的cas13b功能被恢复或重构。该二聚体可以是同二聚体或异二聚体。在某些实施例中,如在此描述的cas13b效应物可以用于突变特异性或等位基因特异性靶向,例如。用于突变特异性或等位基因特异性敲低。此外,rna靶向效应蛋白可以与另一功能性核糖核酸酶结构域融合,如非特异性核糖核酸酶或argonaute2,它们协同作用以增加rna酶活性或确保信息的进一步降解。通过调节rna功能的基因表达的调节除了通过切割mrna直接影响基因表达外,rna靶向也可以用于影响细胞内rna加工的特定方面,这可能允许对基因表达进行更微妙的调节。通常,调节可以例如通过干扰蛋白与rna的结合来介导,例如阻断蛋白的结合或募集rna结合蛋白。事实上,可以在不同的水平(例如mrna的剪接、运输、定位、翻译和转换)上确保调节。类似地,在治疗的背景下,可以设想通过使用rna特异性靶向分子来解决在这些水平中的每一个水平上的(致病)错误(malfunctioning)。在这些实施例中,在许多情况下优选的是,rna靶向蛋白是丧失切割rna靶标但保持其结合rna靶标的能力的“死亡”cas13b,例如在此描述的cas13b的突变形式。a)可变剪接许多人类基因由于可变剪接而表达多种mrna。已经显示不同的疾病与异常剪接相关,导致功能丧失或表达基因的功能获得。虽然这些疾病中的一些是由引起剪接缺陷的突变引起的,但其中一些不是。一种治疗选择是直接针对剪接机制。在此描述的rna靶向效应蛋白可以例如用于阻断或促进剪接,包括或排除外显子并影响特定同种型的表达和/或刺激可替代蛋白产品的表达。下面将更详细地描述此类应用。与靶rna结合的rna靶向效应蛋白可以空间阻断剪接因子对rna序列的接入。靶向剪接位点的rna靶向效应蛋白可以在位点处阻断剪接,任选地将剪接重定向至邻近位点。例如,与5'剪接位点结合的rna靶向效应蛋白可以阻断剪接体的u1组分的募集,有利于外显子跨越。可替代地,靶向剪接增强子或沉默子的rna靶向效应蛋白可以防止在靶位点结合反式作用调节剪接因子并有效阻断或促进剪接。如在此描述的,通过rna靶向效应蛋白将ilf2/3募集到外显子附近的前体mrna可以进一步实现外显子排除。作为又一个实例,可以附接富含甘氨酸的结构域用于募集hnrnpa1和外显子排除(delgatto-konczak等人molcellbiol.[分子与细胞生物学]1999年1月;19(1):251-60)。在某些实施例中,通过适当选择grna,可以靶向特异性剪接变体,并且其他剪接变体不会被靶向在一些情况下,rna靶向效应蛋白可以用于促进剪接(例如,在剪接有缺陷的情况下)。例如,rna靶向效应蛋白可以与能够稳定剪接调节茎环的效应物相关,以便进一步剪接。rna靶向效应蛋白可以与特定剪接因子的共有结合位点序列连接,以将蛋白募集到靶dna。与异常剪接相关的疾病的实例包括但不限于由调节在突触中起作用的蛋白的剪接的nova蛋白的缺失导致的副癌性斜视性眼阵挛-肌阵挛共济失调症(或poma),和由囊性纤维化跨膜传导调节蛋白的缺陷型剪接引起的囊性纤维化,导致产生非功能性的氯通道。在其他疾病中,异常rna剪接导致功能获得。例如在强直性肌营养不良症中就是这种情况,这是由mrna的3'utr中的cug三联体重复扩增(从50至>1500重复)造成的,其引起剪接缺陷。rna靶向效应蛋白可以用于通过向5'剪接位点招募剪接因子(例如u1)来包括外显子,以促进所希望的外显子周围的内含子的切除。这种募集可以通过融合富含精氨酸/丝氨酸的结构域进行介导,该结构域起到剪接激活物的作用(gravelybr和maniatist,molcell.[分子细胞]1998(5):765-71)。可以设想,rna靶向效应蛋白可以用于在所希望的位点阻断剪接机器,从而防止外显子识别和不同蛋白产品的表达。可以治疗的病症的一个实例是迪谢内肌营养不良(dmd),其由编码肌营养不良蛋白的基因突变引起。几乎所有的dmd突变都会导致移码,导致肌养蛋白翻译受损。rna靶向效应蛋白可以与剪接结点或外显子剪接增强子(ese)配对,从而防止外显子识别,导致部分功能蛋白的翻译。这将致命的迪谢内表型转化为不太严重的becker表型。b)rna修饰rna编辑是一个自然过程,通过对rna进行微小修饰来增加给定序列的基因产物的多样性。典型地,修饰涉及腺苷(a)转化为肌苷(i),产生与基因组编码的rna序列不同的rna序列。通常通过adar酶来确保rna修饰,由此前rna靶通过含有待编辑的腺苷的外显子与内含子非编码元件之间的碱基配对来形成不完美的双螺旋rna。a-i编辑的典型实例是谷氨酸受体glur-bmrna,由此改变导致了通道的修饰的传导特性(higuchim等人.cell.[细胞]1993;75:1361-70)。在人类中,adar1基因中杂合的无功能突变导致皮肤疾病,人类色素性皮肤病(miyamuray等人amjhumgenet.[美国人类遗传学杂志]2003;73:693-9)。设想本发明的rna靶向效应蛋白可以用于纠正错误的rna修饰。进一步设想rna腺苷甲基化酶(n(6)-甲基腺苷)可以与本发明的rna靶向效应蛋白融合并靶向感兴趣的转录物。该甲基化酶引起可逆的甲基化,具有调节作用,并且可以通过调节多种rna相关的细胞途径来影响基因表达和细胞命运决定(fu等人natrevgenet.[遗传学自然评论]2014;15(5):293-306)。c)多聚腺苷酸化mrna的多聚腺苷酸化对于核转运、翻译效率和mrna的稳定性是重要的。并且所有这些以及多聚腺苷酸化的过程都依赖于特定的rbp。大多数真核生物mrna在转录后接受约200个核苷酸的3'多聚(a)尾。多聚腺苷酸化涉及刺激聚(a)聚合酶活性的不同rna结合蛋白复合物(minvielle-sebastial等人curropincellbiol.[细胞生物学研究现状]1999;11:352-7)。设想在此提供的rna靶向效应蛋白可以用于干扰或促进rna结合蛋白与rna之间的相互作用。与涉及聚腺苷酸化的缺陷型蛋白有关的疾病的实例是眼咽肌营养不良(opmd)(braisb等人natgenet.[自然遗传学]1998;18:164-7)。d)rna输出前mrna加工后,mrna从细胞核输出到细胞质中。这通过涉及产生载体复合物的细胞机制来确保,该载体复合物然后通过核孔移位并释放细胞质中的mrna,随后再循环该载体。已经发现在rna输出中起作用的蛋白(例如tap)的超表达在非洲爪蟾属中增加了转录物的输出(否则会无效率地输出)(katahiraj等人emboj.1999;18:2593-609)。e)mrna定位mrna定位确保了空间调节的蛋白生产。通过定位元件可以确保将转录物定位到细胞的特定区域。在具体的实施例中,设想在此描述的效应蛋白可以用于将定位元件靶向感兴趣的rna。效应蛋白可以被设计成结合靶转录物并将其穿梭至由其肽信号标签确定的细胞中的位置。更具体地说,例如,可以使用融合至核定位信号(nls)的rna靶向效应蛋白来改变rna定位。定位信号的进一步实例包括拉链码(zipcode)结合蛋白(zbp1),该拉链码(zipcode)结合蛋白确保在若干种不对称细胞类型、kdel保留序列(定位至内质网)、核输出信号(定位至细胞质)、线粒体靶向信号(定位至线粒体)、过氧化物酶体靶向信号(定位至过氧化物酶体)和m6a标记/ythdf2(定位至细胞质处理小体(p-body))的β-肌动蛋白的定位。设想的其他方法是将rna靶向效应蛋白与已知定位的蛋白(例如膜、突触)融合。可替代地,根据本发明的效应蛋白可以例如用于定位依赖性敲低。通过将效应蛋白与适当的定位信号融合,效应物被靶向特定的细胞区室。只有位于该区室中的靶rna才能被有效靶向,而其他相同的靶标(但位于不同的细胞区室中)则不会被靶向,从而可以建立定位依赖性敲低。f)翻译在此描述的rna靶向效应蛋白可以用于增强或阻遏翻译。设想上调翻译是控制细胞电路的一种非常稳健的方式。此外,对于功能研究,蛋白翻译筛选可能优于转录上调筛选,其具有转录上调没有翻译而使蛋白生产增加的缺点。设想在此描述的rna靶向效应蛋白可以用于将翻译起始因子(例如eif4g)带入感兴趣的信使rna的5'非翻译重复序列(5'utr)附近,以驱动翻译(如描述于degregorio等人emboj.1999;18(17):4865-74,针对不可重新编程的rna结合蛋白)。作为另一个实例,可以通过rna靶向效应蛋白将细胞质聚(a)聚合酶gld2募集到靶mrna。这将允许靶mrna的定向聚腺苷酸化,从而刺激翻译。类似地,在此设想的rna靶向效应蛋白可以用于阻断mrna的翻译阻遏物,如zbp1(huttelmaiers等人nature.[自然]2005;438:512-5)。通过与靶rna的翻译起始位点结合,翻译可以直接受到影响。另外,将rna靶向效应蛋白融合至稳定mrna的蛋白(例如,通过防止rna酶抑制剂等的降解)有可能从感兴趣的转录物增加蛋白产量。设想在此描述的rna靶向效应蛋白可以用于通过在rna转录物的5'utr区域中结合并阻止核糖体的翻译形成和开始来阻遏翻译。此外,rna靶向效应蛋白可以用于将caf1(ccr4-not去腺苷酶复合物的组分)募集到靶mrna,导致脱腺苷酸化或靶转录并抑制蛋白翻译。例如,本发明的rna靶向效应蛋白可以用于增加或减少治疗相关蛋白的翻译。其中rna靶向效应蛋白可以用于下调或上调翻译的治疗应用的实例是肌萎缩侧索硬化(als)和心血管疾病。在als运动皮层和脊髓中以及als脑组织中的多个异常eaat2mrna转录物中报道了胶质谷氨酸转运体eaat2的水平降低。eaat2蛋白和功能的丧失被认为是als中兴奋性毒性的主要原因。eaat2蛋白水平和功能的恢复可以提供治疗益处。因此,rna靶向效应蛋白可以有益地用于上调eaat2蛋白的表达,例如,如上所述阻断翻译阻遏物或稳定mrna。载脂蛋白a1是高密度脂蛋白(hdl)的主要蛋白组分,并且apoa1和hdl通常被认为是抗动脉粥样硬化的。设想rna靶向效应蛋白可以有益地用于上调apoa1的表达,例如,如上所述阻断翻译阻遏物或稳定mrna。g)mrna转换翻译与mrna转换和调节mrna的稳定性紧密耦合。已经描述了特定蛋白参与转录物(例如神经元中的elav/hu蛋白,keenejd,1999,procnatlacadsciusa.[美国国家科学院院刊]96:5-7)和tristetraprolin(ttp)的稳定性。这些蛋白通过保护信息免受细胞质中的降解而稳定靶mrna(pengss等人,1988,emboj.17:3461-70)。可以设想,本发明的rna靶向效应蛋白可以用于干扰或促进起稳定mrna转录物作用的蛋白的活性,从而影响mrna转换。例如,使用rna靶向效应蛋白将人ttp募集到靶rna将允许富含腺苷酸-尿苷酸的元件(富含au的元件)介导的翻译阻遏和靶降解。富含au的元件发现于编码原癌基因、核转录因子和细胞因子并促进rna稳定性的许多mrna的3'utr中。作为另一个实例,rna靶向效应蛋白可以与hur(另一种mrna稳定蛋白(hinmanmn和louh,cellmollifesci[细胞与分子生命科学]2008;65:3168-81))融合,并将其募集到靶转录物以延长其寿命或稳定短命的mrna。进一步设想在此描述的rna靶向效应蛋白可以用于促进靶转录物的降解。例如,可以将m6a甲基转移酶募集到靶转录物以将转录物定位至细胞质处理小体(p-body),导致靶降解。作为又一个实例,如在此描述的rna靶向效应蛋白可以与非特异性内切核酸酶结构域piltn-末端(pin)融合,以将其募集到靶转录物并允许其降解。患有副肿瘤性神经紊乱(pnd)相关脑脊髓炎和神经病变的患者是在中枢神经系统以外的肿瘤中发展针对胡蛋白的自身抗体的患者(szaboa等人1991,cell.[细胞];67:325-33),其然后穿过血脑屏障。可以设想,本发明的rna靶向效应蛋白可以用于干扰自身抗体与mrna转录物的结合。患有由肌强直性营养障碍-蛋白激酶(dmpk)基因的3'utr中(cug)n扩增引起的营养不良型1(dm1)患者的特征在于这些转录物在核中的积累。设想与靶向(cug)n重复的内切核酸酶融合的本发明的rna靶向效应蛋白可以抑制异常转录物的这种积累。h)与多功能蛋白的相互作用一些rna结合蛋白结合多个rna上的多个位点以在不同过程中起作用。例如,已经发现hnrnpa1蛋白结合外显子剪接沉默子序列、拮抗剪接因子、与端粒末端缔合(从而刺激端粒活性)并结合mirna以促进drosha介导的处理从而影响成熟。可以设想,本发明的rna结合效应蛋白可以干扰rna结合蛋白在一个或多个位置处的结合。i)rna折叠rna采用定义的结构以进行其生物活性。可替代的三级结构之间的构象转换对大多数rna介导的过程至关重要。但是,rna折叠可能与若干个问题有关。例如,rna可以倾向于折叠成不适当的可替代构象并以其保持,和/或与可替代结构相比,正确的三级结构可能没有足够的热力学优势。本发明的rna靶向效应蛋白,特别是切割缺陷型或死亡rna靶向蛋白可以用于指导(m)rna的折叠和/或捕获其正确的三级结构。在调节细胞状态中使用rna靶向效应蛋白在某些实施例中,具有crrna的复合物中的cas13b在与靶rna结合后被激活,随后切割任何附近的ssrna靶标(即“附带(collateral)”或“旁观(bystander)”效应)。cas13b一旦被同源靶标引发,可以切割其他(非互补)rna分子。这种混杂的rna切割可能会引起细胞毒性,或以其他方式影响细胞生理学或细胞状态。因此,在某些实施例中,如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞休眠或在其中使用。在某些实施例中,如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞周期阻滞或在其中使用。在某些实施例中,如在此描述的非天然存在的或工程化的组合物、载体系统、或递送系统用于减少细胞生长和/或细胞增殖或在其中使用。在某些实施例中,如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞无反应性或在其中使用。在某些实施例中,如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞凋亡或在其中使用。在某些实施例中,如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞坏死或在其中使用。在某些实施例中,如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞死亡或在其中使用。在某些实施例中,如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导程序性细胞死亡或在其中使用。在某些实施例中,本发明涉及用于诱导细胞休眠的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导细胞周期阻滞的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于减少细胞生长和/或细胞增殖的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导细胞无反应性的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导细胞凋亡的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导细胞坏死的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导细胞死亡的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导程序性细胞死亡的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。如在此描述的方法和用途可以是治疗性或预防性的并且可以靶向特定细胞、细胞(亚)群体或细胞/组织类型。具体而言,如在此描述的方法和用途可以是治疗性或预防性的,并且可以靶向表达一种或多种靶序列的特定细胞、细胞(亚)群体或细胞/组织类型,例如一个或多个特定靶rna(例如ssrna)。没有限制,靶细胞可以例如是表达特定转录物的癌细胞,例如,给定类别的神经元,导致例如自身免疫的(免疫)细胞或被特定(例如病毒)病原体感染的细胞等。因此,在某些实施例中,本发明涉及用于治疗特征在于存在不希望的细胞(宿主细胞)的病理学病况的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于治疗特征在于存在不希望的细胞(宿主细胞)的病理学病况的用途。在某些实施例中,本发明涉及如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于在治疗特征在于存在不希望的细胞(宿主细胞)的病理学病况中使用。应该理解的是,crispr-cas系统优选靶向针对不希望的细胞具有特异性的靶标。在某些实施例中,本发明涉及如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于治疗、预防或减轻癌症的用途。在某些实施例中,本发明涉及如在此描述的用于治疗、预防或减轻癌症的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于治疗、预防或减轻癌症的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。应该理解的是,crispr-cas系统优选靶向针对癌细胞具有特异性的靶标。在某些实施例中,本发明涉及如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于治疗、预防或减轻病原体对细胞的感染的用途。在某些实施例中,本发明涉及如在此描述用于治疗、预防或减轻病原体对细胞的感染的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于治疗、预防或减轻病原体对细胞的感染的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。应该理解的是,crispr-cas系统优选靶向针对病原体感染的细胞(例如病原体源靶标)具有特异性的靶标。在某些实施例中,本发明涉及如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统用于治疗、预防或减轻自身免疫障碍的用途。在某些实施例中,本发明涉及如在此描述的用于治疗、预防或减轻自身免疫障碍的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于治疗、预防或减轻自身免疫障碍的方法,该方法包括引入或诱导如在此描述的非天然存在的或工程化的组合物、载体系统或递送系统。应该理解,crispr-cas系统优选靶向针对负责自身免疫障碍的细胞(例如特定免疫细胞)具有特异性的靶标。在rna检测中使用rna靶向效应蛋白进一步设想rna靶向效应蛋白可以用于northern印迹分析。northern印迹涉及使用电泳按尺寸分离rna样品。rna靶向效应蛋白可以用于特异性结合和检测靶rna序列。rna靶向效应蛋白可与荧光蛋白(如gfp)融合并用于追踪活细胞中的rna定位。更具体地说,rna靶向效应蛋白可以失活,因为它不再切割rna。在具体的实施例中,可以设想可以使用断裂型rna靶向效应蛋白,其中信号取决于两种亚蛋白的结合,以确保更精确的可视化。可替代地,可以使用断裂荧光蛋白,当多种rna靶向效应蛋白复合物结合靶转录物时可重构该断裂荧光蛋白。进一步设想转录物靶向沿着mrna的多个结合位点,因此荧光信号可以放大真实信号并允许焦点识别。作为还另一种选择,荧光蛋白可以从断裂内含肽重构。rna靶向效应蛋白例如适合用于确定rna或特定剪接变体的定位、mrna转录物的水平、转录物的上调或下调和疾病特异性诊断。rna靶向效应蛋白可以用于例如使用荧光显微镜或流式细胞术(例如荧光活化细胞分选法(facs))(其允许细胞的高通量筛选和细胞分选后活细胞的恢复)使(活)细胞中的rna可视化。此外,不同转录物的表达水平可以在胁迫(例如,使用分子抑制剂或低氧条件抑制癌细胞生长)下同时评估。另一个应用是使用双光子显微镜在神经刺激期间追踪转录物到突触联系的定位。在某些实施例中,如在此描述的根据本发明的组分或复合物可以用于多重抗误差矫正荧光原位杂交技术(merfish;chen等人science[科学];2015;348(6233)),例如用(荧光标记的)cas13b效应物。体外顶点标记(apexlabeling)细胞过程依赖于蛋白、rna和dna之间的分子相互作用网络。准确检测蛋白-dna和蛋白-rna的相互作用是理解此类过程的关键。体外邻近标记技术采用结合了例如可光活化探针在体外标记感兴趣的蛋白或rna附近的多肽和rna。紫外光照射后,可光活化基团与蛋白和其他靠近标记分子的分子发生反应,从而标记它们。随后可以回收并鉴定标记的相互作用分子。本发明的rna靶向效应蛋白可以例如用于将探针靶向选定rna序列。这些应用也可应用于动物模型中,用于疾病相关应用或难培养细胞类型的体内成像。在rna折纸/体外组装线-组合式rna折纸中使用rna靶向效应蛋白是指纳米级折叠结构用于使用rna作为综合模板创建二维或三维结构。折叠结构在rna中被编码,因此所得rna的形状由合成的rna序列决定(geary等人2014.science[科学],345(6198).第799-804页)。rna折纸可以作为将其他成分(例如蛋白)的排列成复合物的支架。本发明的rna靶向效应蛋白可以例如用于使用合适的指导rna将感兴趣的蛋白靶向rna折纸。这些应用也可应用于动物模型中,用于疾病相关应用或难培养细胞类型的体内成像。在rna分离或纯化、富集或耗竭中使用靶向rna的效应蛋白进一步设想当与rna复合时rna靶向效应蛋白可以用于分离和/或纯化rna。rna靶向效应蛋白例如可以与可以与用于分离和/或纯化rna-rna靶向效应蛋白复合物的亲和标签融合。此类应用例如可以用于分析细胞中的基因表达谱。在具体的实施例中,可以设想rna靶向效应蛋白可以用于靶向特定的非编码rna(ncrna),从而阻断其活性,提供有用的功能探针。在某些实施例中,如在此描述的效应蛋白可以用于特异性富集特异性rna(包括但不限于提高稳定性等),或可替代地,可以用于特异性耗竭特异性rna(例如但不限于例如特定剪接变体、同种型等)。lincrna功能和其他核rna的探询目前的rna敲低策略如sirna具有缺点,即它们大多局限于靶向胞质转录物,因为蛋白质机器是胞质转录物。本发明的rna靶向效应蛋白(一种对细胞功能不重要的外源系统)的优点是它可以用于细胞中的任何区室。通过将nls信号与rna靶向效应蛋白融合,可将其指导至细胞核,允许使核rna被靶向。例如设想探查lincrna的功能。长基因间非编码rnas(lincrnas)是一个大大低于研究领域的研究。大多数lincrna具有迄今未知的功能,可以使用本发明的rna靶向效应蛋白进行研究。rna结合蛋白的鉴定鉴定与特异性rna结合的蛋白对于理解许多rna的作用可能是有用的。例如,许多lincrna与转录和表观遗传调节子相关以控制转录。了解什么蛋白与给定的lincrna结合可以帮助阐明给定调节途径中的组分。本发明的rna靶向效应蛋白可以被设计为将生物素连接酶募集到特异性转录物以便用生物素标记局部结合的蛋白。然后可以将蛋白下拉(pulldown)并通过质谱分析来鉴定它们。在rna上组装复合物和底物穿梭本发明的rna靶向效应蛋白可以进一步用于在rna上组装复合物。这可以通过用多种相关蛋白(例如特定合成途径的组分)功能化rna靶向效应蛋白来实现。可替代地,多种rna靶向效应蛋白可以用这种不同的相关蛋白功能化并靶向相同或相邻的靶rna。在rna上组装复合物的有用应用是例如促进蛋白之间的底物穿梭。合成生物学生物系统的开发具有广泛的用途,包括在临床应用中的用途。设想本发明的可编程的rna靶向效应蛋白可以与用于靶向细胞死亡的毒性结构域的断裂蛋白融合使用,例如使用癌症连接的rna作为靶转录物。此外,涉及蛋白-蛋白相互作用的途径可以在合成生物系统(例如具有合适的效应物(例如激酶或其他酶)的融合复合物))中受到影响。蛋白剪接:内含肽蛋白剪接是一种翻译后过程,其中介入多肽(被称为内含肽)催化从侧翼其的多肽(称为外显子)自切除,以及随后的外显子的连接。如在此描述的在靶转录物上组装两个或更多个rna靶向效应蛋白可以用于指导断裂内含肽的释放(topilina和millsmobdna.2014年2月4日;5(1):5),由此允许直接计算mrna转录物的存在并随后释放蛋白产品,例如代谢酶或转录因子(用于转录途径的下游致动)。该应用可能与合成生物学(见上)或大规模生物生产(仅在特定条件下生产产品)具有显著相关性。可诱导的、剂量的和自我失活性系统在一个实施例中,包含本发明的rna靶向效应蛋白和效应物组分的融合复合物被设计为可诱导的,例如光诱导的或化学诱导的。此类诱导性允许在希望的时刻激活效应组件。例如通过设计融合复合物来实现光诱导性,其中将cry2phr/cibn配对用于融合。该系统对活细胞中蛋白中相互作用的光诱导特别有用(konermanns等人nature.[自然]2013;500:472-476)。例如通过设计融合复合物来提供化学诱导能力,其中将fkbp/frb(fk506结合蛋白/fkbp雷帕霉素结合)配对用于融合。结合蛋白需要使用该系统雷帕霉素(zetsche等人natbiotechnol.[自然生物技术]2015;33(2):139-42,描述了该系统在cas9中的使用)。此外,当作为dna引入细胞时,本发明的rna靶向效应蛋白可以通过诱导型启动子(例如四环素或多西环素)控制的转录激活(tet-on和tet-off表达系统)、激素诱导型基因表达系统(例如蜕皮激素诱导型基因表达系统和阿拉伯糖诱导型基因表达系统)来进行调节。当以rna形式递送时,rna靶向效应蛋白的表达可以经由核糖开关来调节,该核糖开关可感应小分子(如四环素(如描述于goldfless等人nucleicacidsres.[核酸研究]2012;40(9):e64)。在一个实施例中,可以调节本发明的rna靶向效应蛋白的递送以改变细胞中蛋白或crrna的量,从而改变所希望的效应的量级或任何不希望的脱靶效应。在一个实施例中,在此描述的rna靶向效应蛋白可以被设计成自我失活。当作为rna、mrna或作为复制rna治疗递送至细胞时(wrobleska等人natbiotechnol.[自然生物技术]2015年8月;33(8):839-841),它们可以通过破坏自身rna来自我灭活表达和随后的效应从而减少驻留和潜在的不希望的效应。对于在此描述的rna靶向效应蛋白的进一步体内应用,参考mackayjp等人(natstructmolbiol.[自然结构与分子生物学]2011年3月;18(3):256-61)、nelles等人(bioessays.[生物学论文集]2015年7月;37(7):732-9)以及abilz和zhaoh(molbiosyst.[分子生物系统]2015年10月;11(10):2658-65),其通过引用并入本文。具体而言,在本发明的某些实施例中、优选在某些实施例中设想以下通过使用催化失活的cas13b的应用:增强翻译(例如cas13b-翻译促进因子融合(例如eif4融合));阻遏翻译(例如grna靶向核糖体结合位点);外显子跨越(例如grna靶向剪接供体和/或接受位点);外显子包含(例如靶向待包含的特定外显子剪接供体和/或接受位点的grna或融合于或募集剪接体组分(例如u1snrna)的cas13b);访问rna定位(例如cas13b-标记融合(例如,egfp融合));改变rna定位(例如cas13b-定位信号融合(例如nls或nes融合));rna降解(在这种情况下,如果依赖于cas13b的活性,则不使用无催化活性的cas13b,可替代地,为了提高特异性,可使用断裂型cas13b);例如通过降解或结合grna至功能位点(通过cas13b-信号序列融合重定位在特异性位点的可能滴定)来抑制非编码rna功能(例如mirna)。如前所述和实施例中所证明的,cas13b功能对crrna的5'或3'延伸以及crrna环的延伸是稳健的。因此设想可将ms2环和其他募集结构域添加到crrna中而不影响复合物形成和与靶转录物的结合。用于募集不同效应物结构域的此类crrna修饰适用于上述rna靶向效应蛋白的用途。如实施例中所证明的,cas13b,特别是bzcas13b能够介导对rna噬菌体的抗性。因此设想cas13b可以用于对于例如动物、人类和植物的针对仅rna病原体(包括但不限于埃博拉病毒和寨卡病毒)的免疫。在某些实施例中,cas13b可以加工(切割)其自身的阵列。这适用于野生型cas13b蛋白和含有一个或多个突变的氨基酸残基r116、h121、r1177和h1182的突变的cas13b蛋白,例如选自r116a、h121a、r1177a和h1182a的一种或多种修饰。因此设想为不同的靶转录物和/或应用设计的多种crrna可作为单个前crrna或作为由一个启动子驱动的单个转录物递送。这种递送方法具有这样的优点,即它实质上更紧凑、更容易合成并且更易于在病毒系统中递送。优选地,如在此描述的氨基酸编号是指bzcas13b蛋白。将理解的是,对于bzcas13b的直系同源物,精确的氨基酸位置可以不同,如本领域已知的和如本文别处所描述,该bzcas13b的直系同源物可以通过蛋白比对充分确定。本发明的方面还涵盖本文在基因组工程中描述的方法以及组合物和系统的用途,例如用于在原核或真核细胞中在体外、体内或离体改变或操纵一种或多种基因或一种或多种基因产物的表达。在一方面,本发明提供了用于调节(例如减少细胞中靶rna表达)的方法和组合物。在主题方法中,提供了干扰rna的转录、稳定性和/或翻译的本发明的cas13b系统。在某些实施例中,使用有效量的cas13b系统切割rna或以其他方式抑制rna表达。在这方面,该系统具有类似于sirna和shrna的用途,因此也可以替代此类方法。该方法包括但不限于使用cas13b系统作为例如干扰性核糖核酸(例如sirna或shrna)或其转录模板(例如编码shrna的dna)的替代物。例如通过给药至包含靶细胞的哺乳动物,将cas13b系统引入靶细胞中。有利地,本发明的cas13b系统是特异性的。例如,虽然干扰核糖核酸(例如sirna或shrna)多核苷酸系统受设计和稳定性问题以及脱靶结合的困扰,但本发明的cas13b系统可以设计为具有高特异性。去稳定化的cas13b在某些实施例中,如在此描述的根据本发明的效应蛋白(crispr酶;cas13b)与去稳定化结构域(dd)相关或融合。在一些实施例中,该dd是er50。在一些实施例中,这个dd的对应稳定化配体是4ht。因此,在一些实施例中,这至少一个dd之一是er50并且其稳定化配体是4ht或cmp8。在一些实施例中,该dd是dhfr50。在一些实施例中,这个dd的对应稳定化配体是tmp。因此,在一些实施例中,这至少一个dd之一是dhfr50并且其稳定化配体是tmp。在一些实施例中,该dd是er50。在一些实施例中,该dd的对应稳定化配体是cmp8。因此,在er50系统中,cmp8可以是4ht的替代稳定化配体。虽然也许有可能的是cmp8和4ht可以/应该以竞争性方式使用,但是一些细胞类型可能对这两种配体中的一者或另一者更加敏感,并且根据本披露和本领域的知识,熟练人员可以使用cmp8和/或4ht。在一些实施例中,一个或两个dd可以融合至crispr酶的n-末端,并且一个或两个dd融合至crispr酶的c-末端。在一些实施例中,这至少两个dd与该crispr酶相关并且这些dd是相同的dd,即这些dd是同源的。因此,这些dd中的两个(或两个或更多个)可以是er50dd。在一些实施例中这是优选的。可替代地,这些dd中的两个(或两个或更多个)可以是dhfr50dd。在一些实施例中这也是优选的。在一些实施例中,这至少两个dd与该crispr酶相关并且这些dd是不同的dd,即这些dd是异源的。因此,这些dd之一可以是er50,同时这些dd中的一个或多个或任何其他dd可以是dhfr50。具有两个或更多个异源的dd可以是有利的,因为它将提供更高水平的降解控制。n末端或c-末端处的多于一个dd的串联融合可以增强降解;并且这样一种串联融合可以是例如er50-er50-cas13b或dhfr-dhfr-cas13b。设想的是高水平的降解将在不存在任一种稳定化配体的情况下发生,中间水平的降解将在不存在一种稳定化配体并且存在其他(或另一种)稳定化配体的情况下发生,而低水平的降解将在存在两种(或两种或更多种)稳定化配体的情况下发生。还可以通过具有n-末端er50dd和c-末端dhfr50dd来进行控制。在一些实施例中,该crispr酶与该dd的融合包括在该dd与该crispr酶之间的接头。在一些实施例中,该接头是glyser接头。在一些实施例中,该dd-crispr酶进一步包括至少一个核输出信号(nes)。在一些实施例中,该dd-crispr酶包括两个或更多个nes。在一些实施例中,该dd-crispr酶包括至少一个核定位信号(nls)。这可以是除了nes外还有的。在一些实施例中,该crispr酶包括作为该crispr酶与该dd之间的接头的、或作为其一部分的定位(核输入或输出)信号或基本上由其组成或由其组成。ha或flag标签作为接头也落入本发明的范围内。申请人使用nls和/或nes作为接头并且还使用高达(ggggs)3的甘氨酸丝氨酸接头作为gs。去稳定化结构域具有普遍实用性以便为范围广泛的蛋白赋予不稳定性;参见例如,miyazaki,jamchemsoc.[化学学会杂志]2012年3月7日;134(9):3942-3945,通过引用并入本文。cmp8或4-羟基他莫昔芬可以是去稳定化结构域。更一般地说,发现哺乳动物dhfr(dhfrt)(遵循n端法则的去稳定化残基)的温度敏感型突变体在容许温度下是稳定的,但是在37℃下是不稳定的。向表达dhfrt的细胞中添加甲氨蝶呤(一种哺乳动物dhfr高亲和力配体)部分地抑制该蛋白的降解。这是重要的证明,即小分子配体可以稳定以其他方式在细胞中被靶向而降解的蛋白。使用雷帕霉素衍生物来稳定mtor的frb结构域的不稳定突变体(frb*)并且恢复融合的激酶gsk-3β的功能。6,7这个系统证明配体依赖性稳定性代表用于调节复杂的生物环境中的特异性蛋白的功能的有吸引力的策略。当通过雷帕霉素诱导的fk506结合蛋白和fkbp12的二聚化而发生泛素补偿时,用于控制蛋白活性的系统可以涉及变得具有功能性的dd。人类fkbp12或ecdhfr蛋白的突变体可以被工程化为分别在不存在它们的高亲和力配体shield-1或甲氧苄啶(tmp)的情况下在代谢上是不稳定的。这些突变体是在本发明的实践中有用的可能去稳定化结构域(dd)中的一些并且作为与crispr酶的融合的dd的不稳定性赋予整个融合蛋白被蛋白酶体进行crispr蛋白降解。shield-1和tmp以剂量依赖性方式结合至dd并且稳定该dd。雌激素受体配体结合结构域(erlbd,ers1的残基305-549)也可以被工程化为去稳定化结构域。由于雌激素受体信号传导途径牵涉在多种疾病(如乳腺癌)中,所以该途径已经得到广泛研究并且已经开发了雌激素受体的许多激动剂和拮抗剂。因此,erlbd和药物的兼容对是已知的。存在结合至erlbd的突变体但是不结合其野生型形式的配体。通过使用编码三个突变(l384m、m421g、g521r)12的这些突变型结构域之一,有可能的是使用不扰乱内源雌激素敏感性网络的配体调节erlbd衍生的dd的稳定性。可以引入另外的突变(y537s),以进一步使erlbd去稳定并且将它配置为潜在的dd候选物。这种四突变体是有利的dd发展。突变型erlbd可以融合至crispr酶并且可以使用配体调节或扰乱其稳定性,由此该crispr酶具有dd。另一种dd可以是由shield1配体稳定的、基于经突变的fkbp蛋白的12-kda(107-氨基酸)标签;参见例如,naturemethods[自然方法]5,(2008)。例如,dd可以是经修饰的fk506结合蛋白12(fkbp12),其结合至合成的、生物惰性小分子shield-1并且被shield-1可逆地稳定;参见例如,banaszynskila,chenlc,maynard-smithla,ooiag,wandlesstj.arapid,reversible,andtunablemethodtoregulateproteinfunctioninlivingcellsusingsyntheticsmallmolecules.[使用合成小分子调节活细胞中的蛋白功能的快速、可逆且可调的方法]cell.[细胞]2006;126:995-1004;banaszynskila,sellmyerma,contagch,wandlesstj,thornesh.chemicalcontrolofproteinstabilityandfunctioninlivingmice.[活小鼠中的蛋白稳定性和功能的化学控制]natmed.[自然医学]2008;14:1123-1127;maynard-smithla,chenlc,banaszynskila,ooiag,wandlesstj.adirectedapproachforengineeringconditionalproteinstabilityusingbiologicallysilentsmallmolecules.[用于使用生物沉默小分子工程化调节型蛋白稳定性的直接方法]thejournalofbiologicalchemistry.[生物化学杂志]2007;282:24866-24872;和rodriguezchembiol.[生物化学]2012年3月23日;19(3):391-398-将其全部通过引用并入本文,并且可以用在本发明的实践中,在选择有待与本发明的实践中的crispr酶相关的dd中。如可以看到的,本领域中的知识包括多种dd,并且dd可以与crispr酶相关(例如,融合到其上,有利地通过接头),由此该dd在配体的存在下可以被稳定并且当不存在该配体时该dd可以被去稳定,由此该crispr酶被完全去稳定,或者该dd在不存在配体下可以被稳定并且当存在该配体时该dd可以被去稳定;该dd允许调节或控制-打个譬喻说,启动或关闭-该crispr酶并且因此调节或控制crispr-cas复合物或系统,以由此提供用于例如在体内或体外环境中调节或控制该系统的手段。例如,当感兴趣的蛋白作为与dd标签的融合表达时,它被去稳定并且在细胞中例如被蛋白酶体迅速降解。因此,不存在稳定化配体导致d相关的cas被降解。当新的dd融合至感兴趣的蛋白时,其不稳定性被赋予给该感兴趣的蛋白,从而使得整个融合蛋白被快速降解。cas的峰活性对于减少脱靶效应而言有时是有益的。因此,短突发的高活性是优选的。本发明能够提供这样的峰值。从一些意义上来说,该系统是可诱导的。从一些其他意义上来说,该系统在不存在稳定化配体下被阻遏,并且在存在稳定化配体下被去阻遏。rna靶向crispr系统在植物和酵母中的应用定义:一般来说,术语“植物”涉及植物界中任何不同的光合、真核、单细胞或多细胞生物,其特征性地通过细胞分裂生长,包含叶绿体,并且具有由纤维素组成的细胞壁。术语植物涵盖单子叶植物和双子叶植物。确切地说,这些植物旨在包括但不限于被子植物和裸子植物,如阿拉伯树胶、苜蓿、苋菜、苹果、杏、朝鲜蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、桦树、山毛榉、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、油菜、哈密瓜、胡萝卜、木薯、花椰菜、雪松、谷类、芹菜、栗子、樱桃、大白菜、柑橘、克莱门氏小柑橘、三叶草、咖啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆树、菊苣、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、落花生、地樱桃、树胶铁杉、山核桃木、羽衣甘蓝、奇异果、甘蓝、落叶松、莴苣、韭、柠檬、青柠、洋槐、松树、孔雀草、玉米、芒果、枫树、甜瓜、粟、蘑菇、芥菜、坚果、橡树、燕麦、油棕、秋葵、洋葱、橙、观赏植物或花或树木、木瓜、棕榈、荷兰芹、欧洲防风草、豌豆、桃、花生、梨、泥炭(peat)、胡椒、柿子、木豆、松树、菠萝、大蕉、李子、石榴、马铃薯、南瓜、菊苣、萝卜、油菜籽、覆盆子、稻、黑麦、高粱、红花、黄华柳、大豆、菠菜、云杉、南瓜属植物果实、草莓、糖甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、烟草、番茄、树类、黑小麦、草坪草、芜菁、藤本植物、胡桃、豆瓣菜、西瓜、小麦、山药、紫杉、以及西葫芦。术语植物还涵盖藻类,藻类主要是光能自养生物,它们主要一致缺少根、叶以及其他表征高等植物的器官。使用在此描述的rna靶向系统调节基因表达的方法可用于赋予基本上任何植物所希望的性状。针对所希望的生理学以及农学特征,可以使用本披露的核酸构建体和以上所述的各种转化方法对多种多样的植物和植物细胞系统进行工程化。在优选实施例中,用于工程化的靶植物和植物细胞包括,但不限于,那些单子叶植物和双子叶植物,例如作物(包括谷类作物(例如,小麦、玉米、稻、粟、大麦)、果实作物(例如,番茄、苹果、梨、草莓、橙)、饲料作物(例如,苜蓿)、根用蔬菜作物(例如,胡萝卜、马铃薯、甜菜、山药)、叶类蔬菜作物(例如,莴苣、菠菜);开花植物(例如,矮牵牛、玫瑰、菊花)、松柏植物以及松树(例如,松杉、云杉);植物除污中所使用的植物(例如,重金属累积植物);油料作物(例如,向日葵、油菜种子)和用于实验目的植物(例如,拟南芥属)。因此,这些方法和crispr-cas系统可以用于遍及广泛范围的植物,像例如与属于以下目的双子叶植物:木兰目(magniolales)、八角茴香目(illiciales)、樟目(laurales)、胡椒目(piperales)、马览铃目(aristochiales)、睡莲目(nymphaeales)、毛茛目(ranunculales)、papeverales、瓶子草科(sarraceniaceae)、昆蓝树目(trochodendrales)、金缕梅目(hamamelidales)、eucomiales、莱脱纳目(leitneriales)、杨梅目(myricales)、壳斗目(fagales)、木麻黄目(casuarinales)、石竹目(caryophyllales)、肉穗果目(batales)、蓼目(polygonales)、蓝雪目(plumbaginales)、五桠果目(dilleniales)、山茶目(theales)、锦葵目(malvales)、荨麻目(urticales)、玉蕊目(lecythidales)、紫堇目(violales)、杨柳目(salicales)、白花菜目(capparales)、欧石楠目(ericales)、diapensales、柿树目(ebenales)、报春花目(primulales)、蔷薇目(rosales)、豆目(fabales)、川苔草目(podostemales)、小二仙草目(haloragales)、桃金娘目(myrtales)、山茱萸目(cornales)、睡莲目(proteales)、檀香目(santales)、大花草目(rafflesiales)、卫矛目(celastrales)、大戟目(euphorbiales)、鼠李目(rhamnales)、无患子目(sapindales)、胡桃目(juglandales)、牻牛儿苗目(geraniales)、远志目(polygalales)、伞形目(umbellales)、龙胆目(gentianales)、花葱目(polemoniales)、唇形目(lamiales)、车前草目(plantaginales)、玄参目(scrophulariales)、桔梗目(campanulales)、茜草目(rubiales)、川绿断目(dipsacales)、以及菊目(asterales);这些方法和crispr-cas系统可以与单子叶植物一起使用,如属于以下目的那些植物:泽泻目(alismatales)、水鳖目(hydrocharitales)、茨藻目(najadales)、霉草目(triuridales)、鸭跖草目(commelinales)、谷精草目(eriocaulales)、帚灯草目(restionales)、禾本目(poales)、灯芯草目(juncales)、莎草科(cyperales)、香蒲目(typhales)、凤梨目(bromeliales)、姜目(zingiberales)、槟榔目(arecales)、环花目(cyclanthales)、露兜树目(pandanales)、天南星目(arales)、(lilliales)、以及兰目(orchidales),或与属于裸子植物的植物一起使用,例如属于以下目的那些植物:松目(pinales)、银杏目(ginkgoales)、苏铁目(cycadales)、南洋杉目(araucariales)、cupressales以及麻黄目(gnetales)。在此描述的rna靶向crispr系统和使用方法可以用于遍及广泛范围的植物物种,这些植物物种包括在以下双子叶植物、单子叶植物或裸子植物属的非限制性列表:颠茄属(atropa)、油丹属(alseodaphne)、槚如树属(anacardium)、落花生属(arachis)、琼楠属(beilschmiedia)、芸苔属(brassica)、红花属(carthamus)、木防己属(cocculus)、巴豆属(croton)、黄瓜属(cucumis)、柑橘属(citrus)、西瓜属(citrullus)、辣椒属(capsicum)、长春花属(catharanthus)、椰子属(cocos)、咖啡属(coffea)、南瓜属(cucurbita)、胡萝卜属(daucus)、杜氏木属(duguetia)、花菱草属(eschscholzia)、无花果属(ficus)、草莓属(fragaria)、海罂粟属(glaucium)、大豆属(glycine)、棉属(gossypium)、向日葵属(helianthus)、橡胶树属(hevea)、天仙子属(hyoscyamus)、莴苣属(lactuca)、卷枝藤属(landolphia)、亚麻属(linum)、木姜子属(litsea)、番茄属(lycopersicon)、羽扇豆属(lupinus)、木薯属(manihot)、马郁兰属(majorana)、苹果属(malus)、苜蓿属(medicago)、烟草属(nicotiana)、齐墩果属(olea)、银胶菊属(parthenium)、罂粟属(papaver)、鳄梨属(persea)、菜豆属(phaseolus)、黄连木属(pistacia)、豌豆属(pisum)、梨属(pyrus)、李属(prunus)、萝卜属(raphanus)、蓖麻属(ricinus)、千里光属(senecio)、汉防己属(sinomenium)、千金藤属(stephania)、欧白芥属(sinapis)、茄属(solanum)、可可属(theobroma)、三叶草属(trifolium)、胡芦巴属(trigonella)、蚕豆属(vicia)、长春花属(vinca)、葡萄属(vilis)、以及豇豆属(vigna);以及以下属:葱属(allium)、须芒草属(andropogon)、画眉草属(aragrostis)、天门冬属(asparagus)、燕麦属(avena)、狗牙根属(cynodon)、油棕属(elaeis)、羊茅属(festuca)、黑麦草属(festulolium)、heterocallis、大麦属(hordeum)、浮萍属(lemna)、黑麦草属(lolium)、芭蕉属(musa)、稻属(oryza)、黍属(panicum)、pannesetum、梯牧草属(phleum)、早熟禾属(poa)、黑麦属(secale)、高粱(sorghum)、小麦属(triticum)、玉蜀黍属(zea)、冷杉属(abies)、杉木属(cunninghamia)、麻黄属(ephedra)、云杉属(picea)、松属(pinus)、以及黄杉属(pseudotsuga)。这些rna靶向crispr系统和使用方法还可以用于遍及广泛范围的“藻类”或“藻类细胞”;包括例如选自若干真核生物门的藻类,其包括红藻植物门(rhodophyta)(红藻)、绿藻门(chlorophyta)(绿藻)、褐藻门(phaeophyta)(褐藻)、硅藻门(bacillariophyta)(硅藻)、真眼点藻纲(eustigmatophyta)以及沟鞭藻类连同原核门蓝藻门(cyanobacteria)(蓝绿藻)。术语“藻类”包括例如选自以下的藻类:双眉藻属(amphora)、鱼腥藻属(anabaena)、anikstrodesmis、丛粒藻属(botryococcus)、角毛藻属(chaetoceros)、衣藻属(chlamydomonas)、小球藻属(chlorella)、绿球藻属(chlorococcum)、小环藻属(cyclotella)、筒柱藻属(cylindrotheca)、杜氏藻属(dunaliella)、emiliana、眼虫属(euglena)、血球菌属(hematococcus)、等边金藻属(isochrysis)、单鞭金藻属(monochrysis)、单针藻属(monoraphidium)、微绿球藻属(nannochloris)、微绿球藻(nannnochloropsis)、舟形藻属(navicula)、肾鞭藻属(nephrochloris)、肾爿藻属(nephroselmis)、菱形藻属(nitzschia)、节球藻属(nodularia)、念珠藻属(nostoc)、oochromonas、卵囊藻属(oocystis)、颤藻属(oscillartoria)、巴夫藻属(pavlova)、褐指藻属(phaeodactylum)、扁藻属(playtmonas)、颗石藻属(pleurochrysis)、紫菜属(porhyra)、假鱼腥藻属(pseudoanabaena)、塔胞藻属(pyramimonas)、裂丝藻属(stichococcus)、聚球藻属(synechococcus)、集胞藻属(synechocystis)、四爿藻属(tetraselmis)、海链藻属(thalassiosira)、以及束毛藻属(trichodesmium)。可以根据本发明的方法处理植物的一部分,即“植物组织”以产生改良的植物。植物组织还包括植物细胞。如在此使用的术语“植物细胞”是指活的植物的个人单位,不论在完整的全植物中或以离体组织培养、在培养基或琼脂上、悬浮于生长培养基或缓冲液中生长分离形式、或作为高等组织化个体的一部分,例如像,植物组织、植物器官、或全植物。“原生质体”是指已使用例如机械或酶手段完全或部分地去除防卫细胞壁的植物细胞,由此形成可以改造它们的细胞壁、增殖并在适当的生长条件下再生长成全植物的活的植物的完整的生物化学感受态单位。术语“转化”广义上是指以下过程,通过该过程借助农杆菌(agrobacteria)或多种化学或物理方法中的一种通过引入dna对植物宿主进行基因修饰。如在此所使用的,术语“植物宿主”是指植物,包括任何细胞、组织、器官、或植物子代。许多适合的植物组织或植物细胞可以被转化并且包括,但不局限于,原生质体、体细胞胚、花粉、叶、幼苗、茎、愈伤组织、匍匐茎、试管块茎、以及嫩枝。植物组织还指此种植物、种子、子代、不管有性还是无性生殖的繁殖体、以及这些中任一项所述的子代(例如插条或种子)的任何克隆。如在此使用的,术语“转化的”是指其中已经引入外源dna分子(如构建体)的细胞、组织、器官、或生物。所引入的dna分子可以被整合到受体细胞、组织、器官、或生物的基因组dna中,这样使得所引入的dna分子被传递至该后续子代。在这些实施例中,“转化的”或“转基因的”细胞或植物还可以包括细胞或植物的子代以及产自采用这种转化的植株作为杂交的亲本的育种计划并且展示出由存在所引入的dna分子导致的改变的表型的子代。优选地,转基因植物是能育的并且能够将所引入的dna通过有性生殖传递给子代。术语“子代”,如转基因植物的子代,出生自、产生自、或衍生自植物或转基因植物。所引入的dna分子也可以被瞬时引入到受体细胞中,这样使得所引入的dna分子不被后续子代遗传并且因此不被认为是转基因的。因此,如在此使用的,“非转基因”植物或植物细胞是不包含稳定整合到其基因组中的外源dna的植物。如在此所使用的术语“植物启动子”是能够启动植物细胞转录的启动子,无论其是否来源自植物细胞。示例性的适合植物启动子包括但不局限于,那些获得自植物、植物病毒、以及细菌(如包含在植物细胞中表达的基因的土壤杆菌属或根瘤菌属)的启动子。如在此使用的,“真菌细胞”是指真菌界内任何类型的真核细胞。真菌界内的门包括菌门子囊菌亚门(ascomycota)、担子菌门(basidiomycota)、芽枝霉门(blastocladiomycota)、壶菌门(chytridiomycota)、球囊菌门(glomeromycota)、微孢子虫目(microsporidia)、以及新美鞭菌门(neocallimastigomycota)。真菌细胞可以包括酵母菌、霉菌、和丝状真菌。在一些实施例中,真菌细胞是酵母细胞。如在此使用的,术语“酵母细胞”是指真菌子囊菌和担子菌门内的任何真菌细胞。酵母细胞可以包括芽殖酵母细胞、裂殖酵母细胞、以及霉菌细胞。不限于这些生物,在实验室和工业设置中使用的许多类型的酵母菌是门子囊菌亚门(ascomycota)的部分。在一些实施例中,酵母细胞是酿酒酵母(s.cerervisiae)、马克思克鲁维酵母(kluyveromycesmarxianus)、或东方伊萨酵母(issatchenkiaorientalis)细胞。其他酵母细胞可以包括但不限于假丝酵母属(candidaspp.)(例如,白色念珠菌(candidaalbicans))、亚罗酵母属(yarrowiaspp.)(例如,亚罗解脂酵母(yarrowialipolytica))、毕赤酵母属(pichiaspp.)(例如,巴斯德毕赤酵母(pichiapastoris))、克鲁维酵母菌属(kluyveromycesspp.)(例如,产乳糖酶酵母(kluyveromyceslactis)和马克思克鲁维酵母(kluyveromycesmarxianus))、脉孢菌属(neurosporaspp.)(例如,粗糙脉孢菌(neurosporacrassa))、镰刀菌属(fusariumspp.)(例如,尖孢镰刀菌(fusariumoxysporum))、以及伊萨酵母属(issatchenkiaspp.)(例如,东方伊萨酵母(issatchenkiaorientalis),又称为库德里阿兹威毕赤酵母(pichiakudriavzevii)以及candidaacidothermophilum)。在一些实施例中,真菌细胞是丝状真菌细胞。如在此所使用的术语“丝状真菌细胞”是指以丝状体(即菌丝或菌丝体)生长的任何类型的真菌细胞。丝状真菌细胞的实例可以包括但不限于曲霉属(aspergillusspp.)(例如,黑曲霉(aspergillusniger))、木霉属(trichodermaspp.)(例如,里氏木霉(trichodermareesei))、根霉(rhizopusspp.)(例如,米根霉(rhizopusoryzae))、和被孢霉属(mortierellaspp.)(例如,深黄被孢霉(mortierellaisabellina))。在一些实施例中,真菌细胞是工业菌株。如在此使用的,“工业菌株”是指工业工艺(例如,以商业或工业规模生产产品)中使用的或从中分离的任何真菌细胞菌株。工业菌株可以是指典型地在工业工艺中使用的真菌物种,或者它可以是指也可用于非工业目的(例如,实验室研究)的真菌物种的隔离群。工业工艺的实例可以包括发酵(例如,在食品或饮料产品的生产中)、蒸馏、生物燃料生产、化合物生产、以及多肽生产。工业菌株的实例可以包括但不限于,jay270和atcc4124。在一些实施例中,真菌细胞是多倍体细胞。如在此使用的,“多倍体”细胞可以是指其基因组存在于多于一个拷贝中的任何细胞。多倍体细胞可以是指天然地发现处于多倍体状态的细胞类型、或者它可以是指已被诱导以多倍体状态存在的细胞(例如,通过减数分裂、胞质分裂、或dna复制的特定调节、改变、失活、激活、或修饰)。多倍体细胞可以是指其整个基因组是多倍体的细胞、或者它可以是指感兴趣的具体基因组基因座是多倍体的细胞。不希望被理论所束缚,据认为指导rna的丰度在多倍体细胞的基因组工程化中比在单倍体细胞中可以更经常地是限速组分,并且因此使用在此描述的cas13bcrispr系统的方法可以利用某种真菌细胞类型。在一些实施例中,真菌细胞是二倍体细胞。如在此使用的,“二倍体”细胞可以是指其基因组存在于两个拷贝中的任何细胞。二倍体细胞可以是指天然地发现处于二倍体状态的细胞类型、或者它可以是指已被诱导以二倍体状态存在的细胞(例如,通过减数分裂、胞质分裂、或dna复制的特定调节、改变、失活、激活、或修饰)。例如,酿酒酵母菌株s228c可以维持处于单倍体或二倍体状态。二倍体细胞可以是指其整个基因组是二倍体的细胞、或者它可以是指感兴趣的具体基因组基因座是二倍体的细胞。在一些实施例中,真菌细胞是单倍体细胞。如在此使用的,“单倍体”细胞可以是指其基因组存在于一个拷贝中的任何细胞。单倍体细胞可以是指天然地发现处于单倍体状态的细胞类型、或者它可以是指已被诱导以单倍体状态存在的细胞(例如,通过减数分裂、胞质分裂、或dna复制的特定调节、改变、失活、激活、或修饰)。例如,酿酒酵母菌株s228c可以维持处于单倍体或二倍体状态。单倍体细胞可以是指其整个基因组是单倍体的细胞、或者它可以是指感兴趣的具体基因组基因座是单倍体的细胞。如在此使用的,“酵母表达载体”是指包含编码rna和/或多肽的一个或多个序列的核酸,并且可以进一步包含控制一种或多种核酸表达的任何所希望的元件,连同能够使得表达载体在酵母细胞内部复制和维持的任何元件。许多适合的酵母表达载体及其特征是本领域中已知的;例如,不同载体和技术在酵母菌实验室手册(yeastprotocols),第2版,肖(xiao),w.编辑,(胡玛纳出版社(humanapress),纽约,2007)以及巴克哥尔茨(buckholz),r.g.和格利森(gleeson),m.a.(1991),生物技术(biotechnology)(ny)9(11):1067-72中示出。酵母载体可以包含但不限于着丝粒(cen)序列、自主复制序列(ars)、可操作地连接到感兴趣的序列或基因上的启动子(如rna聚合酶iii启动子)、终止子(例如,rna聚合酶iii终止子)、复制原点、和标记基因(例如,营养缺陷型、抗生素、或其他选择性标记)。在酵母菌中使用的表达载体的实例可以包括质粒、酵母人工染色体、2μ质粒、酵母整合型质粒、酵母复制型质粒、穿梭载体、和游离型质粒。rna靶向crisp系统组分在植物和植物细胞基因组中的稳定整合在具体的实施例中,设想的是引入编码rna靶向crispr系统的组分的多核苷酸以便稳定整合进植物细胞的基因组中。在这些实施例中,可以依据该指导rna和/或一个或多个rna靶向基因在何时、何处及在何条件下表达,对转化载体或表达系统的设计进行调节。在具体的实施例中,设想了将rna靶向crispr系统的组分稳定地引入到植物细胞的基因组dna中。另外地或可替代地,设想了引入rna靶向crispr系统的组分以便稳定整合到植物细胞器的dna中,例如但不局限于质体、线粒体或叶绿体。稳定整合到植物细胞基因组中的表达系统可以含有一种或多种下列元件:可用于在植物细胞中表达指导rna和/或rna靶向酶的启动子元件;增强表达的5’非翻译区;进一步增强在某些细胞(如单子叶植物细胞)中表达的内含子元件;为插入该一个或多个指导rna和/或rna靶向基因序列以及其他所希望的元件提供方便的限制位点的多克隆位点;以及为所表达的转录物提供有效终止的3’非翻译区。表达系统的这些元件可以是圆形(如质粒或转化载体)或非圆形(如直链双链dna)的一种或多种表达构建体。在一个具体实施例中,rna靶向crispr表达系统包括至少:(a)编码与植物靶序列杂交的指导rna(grna)的核苷酸序列,并且其中该指导rna包括指导序列和同向重复序列,以及(b)编码rna靶向蛋白的核苷酸序列,其中组分(a)或(b)位于相同或不同的构建体上,并且由此不同的核苷酸序列可以在植物细胞中可操作的相同或不同调控元件的控制之下。含有rna靶向crispr系统的这些组分的一种或多种dna构建体可以通过各种各样的常规技术将模板序列引入到植物、植物部分、或植物细胞基因组中。该方法通常包括以下步骤:选择适合的宿主细胞或宿主组织,将一种或多种构建体引入到宿主细胞或宿主组织中、并且从中再生植物细胞或植物。在具体的实施例中,可以使用诸如但不限于电穿孔、微注射、植物细胞原生质体的气溶胶束注入的技术将dna构建体引入到植物细胞中,或者可以使用如dna粒子轰击的基因枪法直接将这些dna构建体引入到植物组织中(还参见fu等人,transgenicres.[转基因研究]2000年2月;9(1):11-9)。粒子轰击的基础是使涂覆有感兴趣的基因的粒子加速朝向细胞,由此导致粒子穿透原生质并且典型地稳定整合到基因组中。(参见例如klein等人,nature[自然](1987),klein等人,bio/technology[生物/技术](1992),casas等人,proc.natl.acad.sci.usa[美国国家科学院院刊](1993))。在具体的实施例中,可以通过土壤杆菌介导的转化将包含rna靶向crispr系统的组分的dna构建体引入到植物中。这些dna构建体可以与适合的t-dna侧翼区结合并且被引入到常规根癌农杆菌(agrobacteriumtumefaciens)宿主载体中。通过感染植物或通过用土壤杆菌属细菌(含有一种或多种ti(根瘤诱导)质粒)培育植物原生质体,可以将外源dna结合到植物基因组中。(参见,例如,fraley等人,(1985),rogers等人,(1987)以及美国专利5,563,055)。植物启动子为了确保在植物细胞中适当表达,典型地将在此描述的cas13bcrispr系统的组分置于植物启动子(即在植物细胞中可操作的启动子)的控制下。设想了使用不同类型的启动子。组成型植物启动子是能够在所有或几乎所有植物组织的所有或几乎所有植物发育阶段表达可读框(orf)的启动子(称为“组成型表达”)。组成型启动子的一个非限制性实例是花椰菜花叶病毒35s启动子。本发明设想了用于修饰rna序列的方法,并且因此也设想调节植物生物分子的表达。在本发明的具体实施例中,将一个或多个rna靶向crispr系统元件置于可被调节的启动子的控制下因此是有利的。“调节启动子”是指非组成型地、但是以暂时和/或空间调节方式指导基因表达的启动子,并且包括组织特异性、组织优选型及诱导型启动子。不同启动子可以指导在不同组织或细胞类型中、或在不同发育阶段、或响应于不同环境条件的基因表达。在具体的实施例中,rna靶向crispr组分中的一个或多个在组成型启动子(如花椰菜花叶病毒35s启动子)的控制之下表达。组织优选型启动子可以用于靶向具体植物组织中某些细胞类型的增强的表达,例如,叶或根的维管细胞或在种子的特异性细胞中。在rna靶向crispr系统中使用的具体启动子的实例发现于kawamata等人,(1997)plantcellphysiol[植物细胞生理学]38:792-803;yamamoto等人,(1997)plantj[植物杂志]12:255-65;hire等人,(1992)plantmolbiol[植物分子生物学]20:207-18,kuster等人,(1995)plantmolbiol[植物分子生物学]29:759-72,以及capana等人,(1994)plantmolbiol[植物分子生物学]25:681-91。可诱导并且允许对基因编辑或基因表达进行时空控制的启动子的实例可以利用一种能量形式。该能量形式可以包括但不限于,声能、电磁辐射、化学能和/或热能。可诱导系统的实例包括四环素诱导型启动子(tet-开(tet-on)或tet-关(tet-off))、小分子双杂交体转录激活系统(fkbp、aba等)或光可诱导系统(光敏素、lov结构域或隐花色素),如以序列特异性方式指导转录活性的变化的光诱导的转录效应因子(lite)。光诱导型系统的组分可以包括rna靶向crispr酶、光响应细胞色素异二聚体(例如,来自拟南芥)、以及转录激活/阻遏结构域。诱导型dna结合蛋白和关于使用它们的方法的其他实例提供在us61/736465和us61/721,283中,特此通过引用以其整体并入。在具体的实施例中,瞬时或诱导型表达可以通过使用例如化学调节型促进剂(即,由此应用外源化学制品诱导基因表达)来实现。也可以通过化学阻抑型启动子来获得对基因表达的调节,其中应用化学制品阻抑基因表达。化学诱导型启动子包括但不限于:由苯磺酰胺除草剂安全剂(德维尔德(deveylder)等人(1997)(植物细胞生理学(plantcellphysiol)38:568-77)激活的玉米ln2-2启动子、由用作萌前除草剂的疏水性亲电子化合物激活的玉米gst启动子(gst-ll-27,wo93/01294)、以及由水杨酸激活的烟草pr-1a启动子(奥诺(ono)等人,(2004)生物科学、生物技术、生物化学(bioscibiotechnolbiochem),68:803-7))。还可以在此使用由抗生素(如四环素诱导型和四环素阻抑型启动子(加茨(gatz)等人,(1991)分子遗传学与普通遗传学(molgengenet)227:229-37;美国专利号5,814,618和5,789,156)调节的启动子。转位至和/或在特定植物细胞器中表达该表达系统可以包括用于转位至和/或在特定植物细胞器中表达的元件。叶绿体靶向在具体的实施例中,设想的是将rna靶向crispr系统用于特异性修饰叶绿体基因的表达和/或翻译或确保叶绿体中的表达。为此目的,使用叶绿体转化方法或将rna靶向crispr组分区室化至叶绿体。例如,向质体基因组中引入遗传修饰可以减少生物安全性问题,如通过花粉的基因流。叶绿体转化的方法是本领域中已知的并且包括粒子轰击法、peg处理、以及微注射。此外,可以如在wo2010061186中所描述的来使用涉及将转化盒从核基因组转位至质体的方法。可替代地,设想了将rna靶向crispr组分中的一个或多个靶向植物叶绿体。这是通过将编码叶绿体转运肽(ctp)或质体转运肽的序列结合到可操作地连接到编码rna靶向蛋白的序列的5’区上的表达构建体中实现的。在处理步骤中的转位至叶绿体中的过程中去除ctp。表达蛋白的叶绿体靶向是本领域技术人员所熟知的(参见例如proteintransportintochloroplasts[蛋白质转运到叶绿体中],2010,annualreviewofplantbiology[植物生物学年度综述],第61卷:157-180)。在此类实施例中,还希望将一个或多个指导rna靶向植物叶绿体。借助叶绿体定位序列可以用于将指导rna转位到叶绿体中的方法和构建体描述于例如us20040142476中,其通过引用结合在此。可以将构建体的此类变化结合到本发明的表达系统中以有效转位一个或多个rna靶向指导rna。在藻细胞中引入编码crispr-rna靶向系统的多核苷酸。转基因藻类或其他植物,如油菜,可以在植物油或生物燃料像醇类(尤其是甲醇和乙醇)或其他产品的生产中特别有用。这些可以被工程化为表达或过表达高水平的油或醇类,以供在油或生物燃料行业中使用。us8945839描述了使用cas9改造微藻(莱氏衣藻细胞)物种的方法。使用类似方式,在此描述的rna靶向crispr系统的方法可以应用于衣藻属物种和其他藻类。在具体的实施例中,在藻类中引入rna靶向蛋白和一个或多个指导rna,其使用在组成型启动子如hsp70a-rbcs2或β2-微管蛋白的控制下表达rna靶向蛋白的载体进行表达。任选地,使用含有t7启动子的载体对指导rna进行递送。可替代地,可以将rna靶向mrna和体外转录的指导rna递送至藻类细胞中。电穿孔方案可由本领域技术人员获得,如来自geneartchlamydomonasengineering试剂盒的标准推荐方案。将编码rna靶向组分的多核苷酸引入酵母细胞中在具体的实施例中,本发明涉及rna靶向crispr系统用于酵母细胞中rna编辑的用途。可以用于引入编码rna靶向crispr系统组分的多核苷酸的用于转化酵母细胞的方法是本领域技术人员所熟知的,并且评述于kawai等人,2010,bioengbugs.[生物工程与昆虫]2010年11月-12月;1(6):395-403)。非限制性实例包括通过醋酸锂处理(其可以进一步包括载体dna和peg处理)、轰击或通过电穿孔来转化酵母细胞。在植物和植物细胞中瞬时表达rna靶向crisp系统组分在具体的实施例中,设想的是在植物细胞中瞬时表达指导rna和/或rna靶向基因。在这些实施例中,仅当细胞中存在指导rna和rna靶向蛋白两者时,rna靶向crispr系统可以确保rna靶分子的修饰,这样使得可以进一步控制基因表达。因为rna靶向酶的表达是瞬时的,再生自此类植物细胞的植物典型地不含外源dna。在具体的实施例中,rna靶向酶由植物细胞稳定表达,并且瞬时表达指导序列。在具体的优选实施例中,使用植物病毒载体可以将rna靶向crispr系统组分引入到植物细胞中(scholthof等人1996,annurevphytopathol.[植物病理学年鉴]1996;34:299-323)在另外的具体实施例中,所述病毒载体是来自dna病毒的载体。例如,双生病毒(例如,卷心菜叶曲病毒、豆黄矮病毒、小麦矮小病毒、番茄曲叶病毒、玉米条纹病毒、烟草曲叶病毒、或番茄金色花叶病毒)或矮缩病毒(nanovirus)(例如,蚕豆坏死黄化病毒)。在其他具体实施例中,所述病毒载体是来自rna病毒的载体。例如,烟草脆裂病毒组(例如,烟草脆裂病毒、烟草镶崁病毒)、马铃薯x病毒组(例如,马铃薯x病毒)、或大麦病毒(例如,大麦条纹花叶病毒)。植物病毒的复制基因组是非整合性载体,这在避免转基因植物产生的背景下是有意义的。在具体的实施例中,用于瞬时表达rna靶向crispr构建体的载体是例如peaq载体,其被定制为在原生质体中用于农杆菌介导的瞬时表达(塞恩思伯里(sainsburyf.等人,plantbiotechnolj.[植物生物技术杂志]2009年9月;7(7):682-93)。使用修饰的卷心菜叶曲病毒(calcuv)载体以在表达crispr酶的稳定转基因植物中表达grna证明了基因组位置的精确靶向(scientificreports[科技报告]5,文章号:14926(2015),doi:10.1038/srep14926)。在具体的实施例中,可以将编码指导rna和/或rna靶向基因的双链dna片段瞬时引入到植物细胞中。在此类实施例中,以足以修饰细胞中的一个或多个rna分子但在经过预期的时间段之后或在一次或多次细胞分裂之后不持续的量提供所引入的双链dna片段。用于在植物中直接dna转移的方法是本领域技术人员已知的(参见例如davey等人plantmolbiol.[植物分子生物学]1989年9月;13(3):273-85)。在其他实施例中,将编码rna靶向蛋白的rna多核苷酸引入到植物细胞中,然后它被以足以修饰一个或多个rna分子细胞但在经过预期的时间段之后或在一次或多次细胞分裂之后不持续的量产生蛋白(在至少一种指导rna的存在下)的宿主细胞翻译并加工。用于将mrna引入到植物原生质体中以便瞬时表达的方法是本领域技术人员已知的(参见例如在加利耶(gallie),植物细胞报告(plantcellreports)(1993),13;119-122中)。还设想了上述不同方法的组合。rna靶向crispr组分向植物细胞的递送在具体的实施例中,感兴趣的是将rna靶向crispr系统的一种或多种组分直接递送至植物细胞中。对于产生非转基因植物,这是尤其感兴趣的(参见下文)。在具体的实施例中,在植物或植物细胞外部制备rna靶向组分中的一个或多个并将其递送到细胞中。例如,在具体实施例中,在引入到植物细胞中之前,在体外制备rna靶向蛋白。rna靶向蛋白可以通过本领域技术人员已知的不同方法进行制备并且包括重组生产。在表达之后,将rna靶向蛋白分离,如果需要的话进行再折叠,进行纯化和任选地进行处理以除去任何纯化标签(如his标签)。一旦获得未加工、部分纯化、或更完全纯化的rna靶向蛋白,可以将蛋白引入到植物细胞中。在具体的实施例中,将rna靶向蛋白与靶向感兴趣的rna的指导rna进行混合,以形成预组装的核糖核蛋白。经由电穿孔、通过用rna靶向相关的基因产物包衣的粒子轰击、通过化学转染或通过跨细胞膜运输的一些其他手段,可以将这些单独的组分或预先装配的核糖核蛋白引入到植物细胞中。例如,用预组装的crispr核糖核蛋白对植物原生质体进行转染已经证实能确保植物基因组的定向修饰(如描述于:woo等人naturebiotechnology[自然生物技术],2015;doi:10.1038/nbt.3389)可以修改这些方法以实现植物中rna分子的靶向修饰。在具体的实施例中,使用粒子将rna靶向crispr系统组分引入到植物细胞中。可以将这些组分,作为蛋白或核酸或以其组合,上载到或包装在粒子中并将其施用到植物上(例如,如描述于wo2008042156和us20130185823中)。具体而言,本发明的实施例包括粒子,用编码rna靶向蛋白的一种或多种dna分子、编码指导rna和/或如描述于wo2015089419中的分离的指导rna的dna分子上载或填充该纳米粒子。用于将rna靶向crispr系统的一种或多种组分引入到植物细胞中的其他手段通过使用细胞穿透肽(cpp)进行。因此,具体地,本发明的实施例包括组合物,该组合物包括连接到rna靶向蛋白上的细胞穿透肽。在本发明的具体实施例中,rna靶向蛋白和/或指导rna与一种或多种cpp偶联以有效地将它们运输到植物原生质体内(ramakrishna(2014,genomeres.[基因组研究]2014年6月;24(6):1020-7,针对人细胞中的cas9)。在其他实施例中,rna靶向基因和/或一个或多个指导rna是由一个或多个环状或非环状dna分子所编码的,其被连接到一个或多个cpp上以便进行植物原生质体递送。然后,将这些植物原生质体再生成为植物细胞并且进一步成为植物。通常将cpp描述为具有少于35个氨基酸的短肽,这些氨基酸衍生自蛋白或衍生自嵌合序列,其能够以非受体依赖性方式跨细胞膜运输生物分子。cpp可以是阳离子肽、具有疏水序列的肽、两亲性肽、具有富含脯氨酸及抗微生物序列的肽、以及嵌合或二分肽(博客(pooga)和朗热尔(langel)2005)。cpp能够穿透生物膜,并且如此触发不同生物分子跨细胞膜移动到细胞质中,并能改进它们的细胞内通路,并且因此促进生物分子与靶标的相互作用。cpp的实例尤其包括:tat(通过hiv1型进行病毒复制所需的核转录激活蛋白)、穿透素、卡波济(kaposi)成纤维细胞增长因子(fgf)信号肽序列、整联蛋白β3信号肽序列;聚精氨酸肽arg序列、富含鸟嘌呤的分子转运体、甜箭头肽(sweetarrowpeptide)等。设想用于植物、藻类或真菌应用的靶rna靶rna(即感兴趣的rna)是本发明靶向的rna,其导致靶rna上感兴趣的靶位点上的效应蛋白的募集和rna靶向蛋白的结合。靶rna可以是任何合适形式的rna。在一些实施例中,这可以包括mrna。在其他实施例中,靶rna可以包括转运rna(trna)或核糖体rna(rrna)。在其他实施例中,靶rna可以包括干扰rna(rnai)、微小rna(mirna)、微开关,酵母菌(microzymes)、卫星rna和rna病毒。靶rna可以位于植物细胞的细胞质中,或位于细胞核或植物细胞器如线粒体、叶绿体或质体中。在具体的实施例中,rna靶向crispr系统用于切割rna或以其他方式抑制rna表达。使用rna靶向crispr系统经由rna调节来调节植物基因表达rna靶向蛋白也可以经由rna加工的控制与合适的指导rna一起用于靶向基因表达。rna加工的控制可以包括rna加工反应,例如rna剪接,包括可变剪接;病毒复制(特别是植物病毒,包括植物中的类病毒(virioid)和trna生物合成)。rna靶向蛋白与合适的指导rna组合也可以用于控制rna激活(rnaa)。rnaa导致基因表达的促进,因此可以通过破坏或降低rnaa并因此减少基因表达的促进来实现对基因表达的控制。本发明的rna靶向效应蛋白可以进一步用于植物中的抗病毒活性,特别抗rna病毒。效应蛋白可以使用对选择的病毒rna序列具有选择性的合适的指导rna来靶向病毒rna。具体而言,效应蛋白可以是切割rna的活性核酸酶,例如单链rna。因此提供了本发明的rna靶向效应蛋白作为抗病毒剂的用途。可以这种方式抵消的病毒的实例包括但不限于烟草镶崁病毒(tmv)、番茄斑萎病毒(tswv)、黄瓜花叶病毒(cmv)、马铃薯y病毒(pvy)、花椰菜花叶病毒(camv)(rt病毒)、李痘病毒(ppv)、雀麦草花叶病毒(bmv)和马铃薯x病毒(pvx)。在此进一步描述了在植物、藻类或真菌中调节rna表达的实例,作为靶向基因修饰的替代方案。具体感兴趣的是通过受调节的mrna切割来调节基因表达。这可以通过将rna靶向元件置于调节启动子控制下来实现,如在此描述的。使用rna靶向crispr系统恢复trna分子的功能。pring等人在plantmitochondriaandchloroplasts[植物线粒体和叶绿体]中描述了rna编辑,其改变mrna序列以编码与dna不同的蛋白。(plantmol.biol.[植物分子生物学](1993)21(6):1163-1170.doi:10.1007/bf00023611)。在本发明的具体实施例中,可将特异性靶向线粒体和叶绿体mrna的靶向rna靶向crispr系统的元件引入植物或植物细胞中,以在模拟体内发生的过程的此类植物细胞器中表达不同的蛋白。使用rna靶向crispr系统作为rna干扰的替代方案来抑制rna表达。rna靶向crispr系统具有类似于rna抑制或rna干扰的用途,因此也可以替代此类方法。在具体的实施例中,本发明的方法包括使用rna靶向crispr作为例如干扰性核糖核酸(例如sirna或shrna或dsrna)的替代物。在此进一步描述了在植物、藻类或真菌中抑制rna表达的实例,作为靶向基因修饰的替代方案。使用rna靶向crispr系统以控制rna干扰。对干扰rna或mirna的控制可以通过在体内或体外减少干扰rna或mirna的寿命来帮助减少用这些方法看到的脱靶效应(ote)。在具体的实施例中,靶rna可以包括干扰rna,即参与rna干扰途径的rna,诸如shrna,sirna等。在其他实施例中,靶rna可以包括微小rna(mirna)或双链rna(dsrna)。在其他具体的实施例中,如果rna靶向蛋白和一个或多个合适的指导rna被选择性表达(例如在调节启动子的控制下,例如在空间或时间上,例如组织或细胞周期特异性启动子和/或增强子),则这可以用于“保护”在这些细胞中来自rnai的细胞或系统(体内或体外)。在其中不需要rnai的邻近组织或细胞中,或者为了比较其中效应蛋白和合适的指导物表达和不被表达的细胞或组织(即,分别是其中rnai未被控制和其中rnai被控制),这可能是有用的。rna靶向蛋白可以用于控制或结合包含rna或由rna组成的分子,例如核酶、核糖体或核糖开关。在本发明的实施例中,指导rna可将rna靶向蛋白募集到这些分子,使得rna靶向蛋白能够与它们结合。本发明的rna靶向crispr系统可以应用于活体转化rnai
技术领域
:,而不需要过多的实验,来自本披露,包括害虫管理、植物病害管理和除草剂抗性管理,以及植物测定和其他应用(参见例如kim等人,于pesticidebiochemistryandphysiology[农药生物化学和生理学](影响因子:2.01).01/2015;120.doi:10.1016/j.pestbp.2015.01.002;sharma等人.于academicjournals[美国杂志](2015),第12(18)卷,第2303-2312页);greenj.m,于pestmanagementscience[害虫管理科学],第70(9)卷,第1351-1357页),因为本申请为系统的知情工程提供了基础。使用rna靶向crispr系统来修饰核糖开关并控制植物、藻类和真菌中的代谢调节核糖开关(也称为船蛸属酶(aptozyme))是结合小分子并反过来调节基因表达的信使rna的调节片段。这种机制允许细胞感知这些小分子的细胞内浓度。特定的核糖开关典型地通过改变该基因的转录、翻译或剪接来调节其邻近基因。因此,在本发明的具体实施例中,设想通过将rna靶向蛋白与合适的指导rna组合以靶向核糖开关,对核糖开关活性的控制。这可以是通过切割或结合到核糖开关。在具体的实施例中,设想减少核糖开关活性。最近,一种结合焦磷酸硫胺(tpp)的核糖开关被表征并发现可以调节植物和藻类中的硫胺素生物合成。此外,该元件似乎是植物中初级代谢的基本调节剂(bocobza和aharoni,plantj.[植物杂志]2014年8月;79(4):693-703.doi:10.1111/tpj.12540.epub2014年6月17日)。tpp核糖开关也发现于某些真菌中,例如在粗糙脉孢菌中,其在它控制可变剪接以有条件地产生上游可读框(uorf),从而影响下游基因的表达(cheahmt等人,(2007)nature[自然]447(7143):497-500.doi:10.1038/nature05769)。在此描述的rna靶向crispr系统可以用于操纵植物、藻类或真菌中的内源核糖开关活性,并因此改变由其控制的下游基因的表达。在具体的实施例中,rna靶向crisp系统可以用于测定体内或体外的核糖开关功能并研究其与代谢网络的相关性。在具体的实施例中,rna靶向crispr系统可以潜在地用于工程化作为植物和基因控制平台中的代谢物传感器的核糖开关。在rnai中使用rna靶向crispr系统筛选植物、藻类或真菌鉴定其敲低与表型变化相关的基因产物,可经由rnai筛选来探询生物学途径并鉴定组成部分。在本发明的具体实施例中,也可以通过使用在此描述的组29或组30蛋白和合适的指导rna在这些筛选中或在这些筛选期间施加对照,以去除或降低筛选中rnai的活性,从而(通过除去或减少干扰/阻遏)来恢复(先前受干扰的)基因产物的活性。使用rna靶向蛋白在体内和体外可视化rna分子在具体的实施例中,本发明提供了一种核酸结合系统。rna与互补探针的原位杂交是一种强有力的技术。典型地,使用荧光dna寡核苷酸通过杂交来检测核酸。通过例如锁核酸(lna)的某些修饰已经获得了增加的效率,但仍然需要高效和多功能的替代方案。因此,rna靶向系统的标记元件可以用作原位杂交的有效和适应性系统的替代方案。rna靶向crispr系统在植物和酵母中的进一步应用在生物燃料生产中使用rna靶向crispr系统如本文使用的术语“生物燃料”是从植物和植物衍生的资源制成的替代燃料。可再生生物燃料可以提取自已经通过固碳过程获得其能量的有机物质,或者是通过生物质的使用或转化来制得。这种生物质可以直接用于生物燃料或可以通过热转化、化学转化、和生物化学转化而转化为便利的含能量物质。这种生物质转化可以导致处于固体、液体、或气体形式的燃料。存在两种类型的生物燃料:生物乙醇和生物柴油。生物乙醇主要是通过大部分衍生自玉米和甘蔗的纤维素(淀粉)的糖发酵工艺产生。在另一方面生物柴油主要产自油料作物如油菜籽、棕榈、和大豆。生物燃料是主要用于运输。增强用于生物燃料生产的植物特性在具体的实施例中,使用采用了如在此描述的rna靶向crispr系统的方法来改变细胞壁特性,以便促进由关键水解试剂的接近,以用于更有效释放用于发酵的糖。在具体的实施例中,纤维素和/或木质素的生物合成被修饰。纤维素是细胞壁的主要组分。纤维素和木质素的生物合成被共调节。通过降低木质素在植物中的比例,可以增加纤维素的比例。在具体的实施例中,使用在此描述的方法下调植物中的木质素生物合成,从而增加可发酵的碳水化合物。更具体地说,使用在此描述的方法来下调选自下组的至少一种第一木质素生物合成基因,该组由以下组成:4-香豆酸3-羟化酶(c3h)、苯丙氨酸氨切割酶(pal)、肉桂酸4-羟化酶(c4h)、羟基肉桂酰转移酶(hct)、咖啡酸o-甲基转移酶(comt)、咖啡酰coa3-o-甲基转移酶(ccoaomt)、阿魏酸5-羟化酶(f5h)、肉桂醇脱氢酶(cad)、肉桂酰coa-还原酶(ccr)、4-香豆酸-coa连接酶(4cl)、单木质醇-特异性糖基转移酶、和醛脱氢酶(aldh),如wo2008064289a2中所披露的。在具体的实施例中,使用在此描述的方法来产生植物物质,该植物物质在发酵过程中产生更低水平的乙酸(还参见wo2010096488)。修饰酵母以用于生物燃料生产在具体的实施例中,在此提供的rna靶向酶用于由重组微生物进行生物乙醇生产。例如,可以使用rna靶向酶来改造微生物,例如酵母,以从可发酵糖产生生物燃料或生物聚合物,并且以任选地能够降解源自农业废物的植物衍生木质纤维素(作为可发酵糖的来源)。更具体地说,本发明提供了以下方法,使用rna靶向crispr复合物来修饰生物燃料生产所需的内源基因表达和/或修饰可干扰生物燃料合成的内源基因。更具体地说,这些方法涉及刺激编码以下酶的一个或多个核苷酸序列的微生物(例如酵母)中的表达,这些酶涉及丙酮酸到乙醇或另一种感兴趣产物的转化。在具体的实施例中,这些方法确保刺激允许微生物降解纤维素的一种或多种酶(例如纤维素酶)的表达。在又另外的实施例中,使用rna靶向crispr复合物来抑制与生物燃料生产途径竞争的内源代谢途径。修饰藻类和植物以用于生产植物油或生物燃料转基因藻类或其他植物,如油菜,可以在植物油或生物燃料例如像醇类(尤其是甲醇和乙醇)的生产中特别有用。这些可以被工程化为表达或过表达高水平的油或醇类,以供在油或生物燃料行业中使用。us8945839描述了使用cas9改造微藻(莱氏衣藻细胞)物种的方法。使用类似方式,在此描述的rna靶向crispr系统的方法可以应用于衣藻属物种和其他藻类。在具体的实施例中,在藻类中引入rna靶向效应蛋白和指导rna,其使用在组成型启动子如hsp70a-rbcs2或β2-微管蛋白的控制下表达rna靶向效应蛋白的载体进行表达。指导rna将使用含有t7启动子的载体来递送。可替代地,体外转录的指导rna可以被递送到藻类细胞中。电穿孔方案遵循来自geneartchlamydomonasengineering试剂盒的标准推荐方案。rna靶向酶在植物中的具体应用在具体的实施例中,本发明可以用作用于在植物系统中去除病毒的疗法,因为它能够切割病毒rna。在人类系统中的先前研究已经证实了在靶向丙型肝炎单链rna病毒(a.price等人.,proc.natl.acad.sci[国家科学院院刊],2015)。这些方法还可以被适配用于在植物中使用rna靶向crispr系统。改进的植物本发明还提供了通过本文提供的方法可获得和获得的植物和酵母细胞。通过在此描述的方法获得的改进的植物可以通过以下基因的修饰的表达用于食品或饲料生产中,这些基因例如确保对植物有害生物、除草剂、干旱、低温或高温、过量水等的耐受性。通过在此描述的方法获得的改进的植物,尤其是作物和藻类可以通过表达例如比在野生型中通常所见的更高的蛋白、碳水化合物、营养素或维生素水平而用于食品或饲料生产中。在此方面,改进的植物,尤其是豆类和块茎是优选的。改进的藻类或其他植物,如油菜,可以在植物油或生物燃料例如像醇类(尤其是甲醇和乙醇)的生产中特别有用。这些可以被工程化为表达或过表达高水平的油或醇类,以供在油或生物燃料行业中使用。本发明还提供了植物的改进部分。植物部分包括但不限于,叶、茎、根、块茎、种子、胚乳、胚珠、以及花粉。如本文设想的植物部分可以是可存活的、不可存活的、可再生的和/或不可再生的。还在此涵盖的是提供了根据本发明的方法产生的植物细胞和植物。通过传统育种方法产生的包括遗传修饰的植物的配子、种子、胚、合子或体细胞、子代或杂合体也包括在本发明的范围内。此类植物可以包含插入或代替靶序列的异源或外源dna序列。可替代地,此类植物可以仅包含在一个或多个核苷酸中的改变(突变、缺失、插入、取代)。这样,此类植物与它们的祖先植物的不同之处将仅在于具体修饰的存在。在本发明的一个实施例中,cas13b系统用于例如通过针对细菌、真菌或病毒引起的疾病产生抗性,来加工病原体抗性植物。在某些实施例中,病原体抗性可以通过对农作物进行工程化以产生将被害虫摄入从而导致死亡的cas13b系统来实现。在本发明的一个实施例中,使用cas13b系统来工程化非生物胁迫耐受性。在另一个实施例中,使用cas13b系统来构建干旱胁迫耐受性或盐胁迫耐性或冷或热胁迫耐受性。younis等人2014,int.j.biol.sci.[国际生物科学杂志]10;1150评述了植物育种方法的潜在目标,所有这些方法都可以通过使用在此描述的cas13b系统进行修正或改进。一些非限制性靶作物包括拟南芥、玉蜀黍、稻、欧洲李、陆地棉、黄花烟草、玉蜀黍、紫苜蓿、本氏烟和拟南芥。在本发明的一个实施例中,使用cas13b系统来管理作物害虫。例如,可以在作物害虫中操作的cas13b系统可以从植物宿主表达或者直接转移到靶标,例如使用病毒载体。在一个实施例中,本发明提供了从杂合的非人类起始生物有效产生纯合生物的方法。在一个实施例中,本发明用于植物育种。在另一个实施例中,本发明用于动物育种。在这样的实施例中,通过干扰参与双链断裂、染色体配对和/或链交换的至少一种靶基因来预防或抑制重组,从而制备纯合生物,例如植物或动物。cas13b蛋白在优化的功能性rna靶向系统中的应用在一个方面,本发明提供了用于将功能组分特异性递送至rna环境的系统。这可以使用包含本发明的rna靶向效应蛋白的crispr系统(其允许将不同组分特异性靶向rna)来确保。更具体地说,这样的组分包括激活物或阻遏物,例如rna翻译、降解等的激活物或阻遏物等。这种系统的应用在本文其他地方描述。根据一个方面,本发明提供了非天然存在的或工程化的组合物,其包含含有指导序列的指导rna,所述指导序列能够与细胞中感兴趣的基因组基因座中的靶序列杂交,其中所述指导rna通过插入结合衔接蛋白的一个或多个不同的rna序列来进行修饰。在具体的实施例中,rna序列可以结合两个或更多个衔接蛋白(例如适体),并且其中每个衔接蛋白与一个或多个功能域相关。显示在此描述的cas13b酶的指导rna能够修饰指导序列。在具体的实施例中,通过插入同向重复的5’、在同向重复内、或指导序列的3’的一个或多个不同rna序列,对指导rna进行修饰。当存在多于一个功能域时,这些功能域可以是相同或不同的,例如,两个相同或两个不同的激活物或阻遏物。在一个方面,本发明提供了一种在此讨论的组合物,其中该一个或多个功能域附接至该rna靶向酶,这样使得当结合至该靶rna时,该功能域处于空间取向,从而允许该功能域在其属性功能中起作用;在一个方面,本发明提供了一种在此讨论的组合物,其中该组合物包括一种crispr-cas复合物,该复合物具有至少三个功能域,其中至少一个与该rna靶向酶相关并且其中至少两个与grna相关。因此,在一个方面,本发明提供了非天然存在的或工程化的crispr-cas复合物组合物,该组合物包括在此讨论的指导rna和crispr酶,该酶是一种rna靶向酶,其中可任选地,该rna靶向酶包括至少一个突变,这样使得该rna靶向酶具有不超过5%的不具有该至少一个突变的rna靶向酶的核酸酶活性,以及任选地一种或多种包含至少一个或多个核定位序列。在具体的实施例中,该指导rna被另外地或可替代地修饰,以便仍确保rna靶向酶的结合,但防止被rna靶向酶切割(如在本文别处所详述的)。在具体的实施例中,rna靶向酶是cas13b酶,与不具有至少一个突变的cas13b酶相比,其核酸酶活性降低至少97%或100%。在一个方面,本发明提供了一种如在此讨论的文库,其中该cas13b酶包括两个或更多个突变。这些突变可以是选自以下一个或多个氨基酸残基的突变:r116、h121、r1177和h1182,例如以下突变中的一个或多个:r116a、h121a、r1177a和h1182a,根据动物溃疡伯格菌cas13b蛋白或直系同源物中的相应位置。在具体的实施例中,提供如上文所述的包含两个或更多个功能域的rna靶向系统。在一些实施例中,该一个或多个功能域是转录阻抑物结构域。在具体的实施例中,该系统包含衔接蛋白,该衔接蛋白是包含功能域的融合蛋白,该融合蛋白在衔接蛋白与功能域之间任选地包含接头。在具体的实施例中,该接头包括glyser接头。另外地或可替代地,一个或多个功能域通过接头(任选的glyser接头)附接至rna效应蛋白。在具体的实施例中,该一个或多个功能域通过hepn结构域中的一个或两个附接到rna靶向酶。在一个方面,本发明提供了一种在此讨论的组合物,其中该一个或多个与衔接蛋白或rna靶向酶相关的功能域是能够激活或阻遏rna翻译的结构域。在一个方面,本发明提供了一种在此讨论的组合物,其中该一个或多个与衔接蛋白相关的功能域中的至少一种具有一种或多种活性,这些活性包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、dna整合活性rna切割活性、dna切割活性或核酸结合活性、或分子开关活性或化学可诱导性或光可诱导性。在一个方面,本发明提供了包含适体序列的在此讨论的组合物。在某些实施例中,该适体序列是对同一衔接蛋白具有特异性的两个或更多个适体序列。在一个方面,本发明提供了一种在此讨论的组合物,其中该适体序列是对不同衔接蛋白具有特异性的两个或更多个适体序列。在一个方面,本发明提供了一种在此讨论的组合物,其中该衔接蛋白包括ms2、pp7、qβ、f2、ga、fr、jp501、m12、r17、bz13、jp34、jp500、ku1、m11、mx1、tw18、vk、sp、fi、id2、nl95、tw19、ap205、φcb5、φcb8r、φcb12r、φcb23r、7s、prr1。因此,在具体实施例中,该适体选自一种特异性结合以上列出的任一种衔接蛋白的结合蛋白。在一个方面,本发明提供了一种在此讨论的组合物,其中该细胞是真核细胞。在一个方面,本发明提供了一种在此讨论的组合物,其中该真核细胞是哺乳动物细胞、植物细胞或酵母细胞,由此该哺乳动物细胞任选地是小鼠细胞。在一个方面,本发明提供了一种在此讨论的组合物,其中该哺乳动物细胞是人细胞。在一个方面,本发明提供了一种在此以上讨论的组合物,其中存在多于一个grna,并且这些grna靶向不同序列,由此当使用该组合物时,存在着多路复用。在一个方面,本发明提供了一种组合物,其中存在多于一个grna是通过插入结合至一种或多种衔接蛋白的一个或多个不同rna序列而进行修饰的。在一个方面,本发明提供了一种在此讨论的组合物,其中与一个或多个功能域相关的一种或多种衔接蛋白是存在的并且结合到插入到该指导rna中的不同的rna序列上。在一个方面,本发明提供了一种在此讨论的组合物,其中该指导rna被修饰成具有至少一个非编码功能环;例如,其中该至少一个非编码功能环是阻遏性的;例如,其中至少一个非编码功能环包括alu。在一个方面,本发明提供了一种方法,该方法用于修饰基因表达,包括向宿主给药或在宿主中体内表达如在此讨论的一种或多种组合物。在一个方面,本发明提供了一种在此讨论的方法,该方法包括递送该组合物或用于编码它的一种或多种核酸分子,其中所述一种或多种核酸分子被操作性地连接至一个或多个调节序列并且在体内进行表达。在一个方面,本发明提供了一种在此讨论的方法,其中经由慢病毒、腺病毒、或aav进行体内表达。在一个方面,本发明提供了一种如在此讨论的细胞的哺乳动物细胞系,其中该细胞系任选地是人细胞系或小鼠细胞系。在一个方面,本发明提供了一种转基因哺乳动物模型,任选地是小鼠,其中该模型已经用一种在此讨论的组合物进行了转化或是所述转化体的子代。在一个方面,本发明提供一种或多种核酸分子,这些核酸分子编码指导rna或rna靶向crispr-cas复合物或如在此讨论的组合物。在一个方面,本发明提供了一种载体,该载体包含:核酸分子,该核酸分子编码指导rna(grna),该指导rna包括能够杂交到细胞中感兴趣的基因组基因座中靶序列上的指导序列,其中该grna的同向重复是通过插入结合至两个或更多个衔接蛋白的一个或多个不同rna序列而进行修饰的,并且其中每种衔接蛋白与一个或多个功能域相关;或者,其中该grna被修饰成具有至少一个非编码功能环。在一个方面,本发明提供了一种或多种载体,所述载体包括一种或多种编码以下各项的核酸分子:非天然存在的或工程化的crispr-cas复合物组合物,该组合物包括在此所讨论的grna和一种rna靶向酶,其中可任选地,该rna靶向酶包括至少一个突变,这样使得该rna靶向酶具有不超过5%的不具有该至少一个突变的rna靶向酶的核酸酶活性,以及任选地一种或多种包含至少一个或多个核定位序列。在一个方面,一种载体可以进一步包括一种或多种可在一种真核细胞中操作的调控元件,所述调控元件可操作地连接到编码指导rna(grna)的核酸分子和/或编码rna靶向酶和/或任选的一个或多个核定位序列的核酸分子上。在一个方面中,本发明提供了一种试剂盒,该试剂盒包括如上文所描述的一个或多个组分。在一些实施例中,该试剂盒包括一种如以上所描述的载体系统以及用于使用该试剂盒的说明书。在一个方面,本发明提供了一种筛选功能获得(gof)或功能缺失(lof)或用于筛选非编码rna或潜在调节区(例如,增强子、阻遏物)的方法,该方法包括如在此讨论的或在此讨论的含有或表达rna靶向酶的模型的细胞的细胞系,以及将如在此讨论的组合物引入该细胞系或模型的细胞中,由此该grna包括一种激活因子或一种阻遏物,并且分别监测用于gof或lof,关于grna引入其中的那些细胞包括一种激活因子或关于grna引入其中的那些细胞包括一种阻遏因子。在一个方面,本发明提供了一种非天然存在的或工程化的组合物的文库,所述组合物各自包含:rna靶向crispr指导rna(grna),所述指导rna包含能够杂交到细胞中感兴趣的靶rna序列上的指导序列;rna靶向酶,其中该rna靶向酶包括至少一个突变,这样使得该rna靶向酶具有不超过5%的不具有该至少一个突变的rna靶向酶的核酸酶活性,其中该grna是通过插入结合至一种或多种衔接蛋白的一个或多个不同rna序列而进行修饰的,并且其中该衔接蛋白与一个或多个功能域相关,其中该组合物包括一种或多种或两种或更多种衔接蛋白,其中每种蛋白与一个或多个功能域相关,并且其中这些grna包括基因组广度文库,所述文库包括多个rna靶向指导rna(grna)。在一个方面,本发明提供了一种如在此讨论的文库,其中该rna靶向酶当与不具有至少一个突变的rna靶向酶相比时具有降低至少97%或100%的核酸酶活性。在一个方面,本发明提供了一种如在此讨论的文库,其中该衔接蛋白是包括该功能域的融合蛋白。在一个方面,本发明提供了一种如在此讨论的文库,其中该grna不是通过插入结合至一种或两种或更多种衔接蛋白的一个或多个不同rna序列而进行修饰的。在一个方面,本发明提供了一种如在此讨论的文库,其中一个或两个或更多个与rna靶向酶相关的功能域是转录激活结构域。在一个方面,本发明提供了一种如在此讨论的文库,其中该细胞群是真核细胞群。在一个方面,本发明提供了一种如在此讨论的文库,其中该真核细胞是哺乳动物细胞、植物细胞或酵母细胞。在一个方面,本发明提供了一种如在此讨论的文库,其中该哺乳动物细胞是人细胞。在一个方面,本发明提供了一种如在此讨论的文库,其中该细胞群是胚胎干(es)细胞群。在一个方面,本发明提供了一种如在此讨论的文库,其中该靶向具有约100或更多个rna序列。在一个方面,本发明提供了一种如在此讨论的文库,其中该靶向具有约1000或更多个rna序列。在一个方面,本发明提供了一种如在此讨论的文库,其中该靶向具有约20,000或更多个序列。在一个方面,本发明提供了一种如在此讨论的文库,其中该靶向具有整个转录组。在一个方面,本发明提供了一种如在此讨论的文库,其中该靶向具有一系列聚焦于相关或令人希望的途径的靶序列。在一个方面,本发明提供了一种如在此讨论的文库,其中该途径是免疫途径。在一个方面,本发明提供了一种如在此讨论的文库,其中该途径是细胞分裂途径。在一个方面中,本发明提供了产生包含具有修饰的表达的基因的模式真核细胞的方法。在一些实施例中,疾病基因是与患有或产生一种疾病的风险的增加相关的任何基因。在一些实施例中,该方法包括(a)向真核细胞中引入上文所述的系统组分的一种或多种载体,以及(b)允许crispr复合物结合到靶多核苷酸上以便修饰基因的表达,由此产生包含修饰的基因表达的模式真核细胞。在此提供的结构信息允许探询指导rna与靶rna和rna靶向酶的相互作用,从而允许工程化或改变指导rna结构,以优化整个rna靶向crispr-cas系统的功能性。例如,通过插入可结合至rna上的衔接蛋白,可以扩展指导rna,而不与rna靶向蛋白冲突。这些衔接蛋白可以进一步募集效应蛋白或融合,这些效应蛋白或融合包括一个或多个功能域。本发明的一个方面是上述元件被包含在单个组合物中或被包含在单独的组合物中。这些组合物可以有利地被应用于宿主,以在基因组水平上引出功能效应。本领域技术人员理解的是,对指导rna进行允许结合衔接子+功能域但不适当定位该衔接子+功能域(例如,由于crispr复合物三维结构的位阻)的修饰不是预期的修饰。通过引入同向重复的5’、在同向重复内、或指导序列的3’的一个或多个不同rna序列,可以对一个或多个修饰的指导rna进行修饰。修饰的指导rna、失活的靶向rna酶(具有或不具有功能域)、以及具有与一个或多个功能域的结合蛋白,可以各自单独包含在组合物中并单独地或共同地给药至宿主。可替代地,这些组分可以被提供在用于给药至宿主的单个组合物中。可以经由本领域技术人员已知的或在此描述的用于递送到宿主的病毒载体(例如慢病毒载体、腺病毒载体、aav载体)进行向宿主的给药。如本文所解释的,使用不同的选择标记(例如用于慢病毒grna选择)和grna浓度(例如取决于是否使用多种grna)对于引出改进的效果而言可以是有利的。使用所提供的组合物,本领域的普通技术人员可以有利地且特异性地靶向具有相同或不同功能域的单个或多个基因座,以引出一个或多个基因组基因座事件。这些组合物可以按多种多样的方法应用,用于在细胞中筛选文库和在体内进行功能建模(例如,lincrna的基因激活和功能鉴定;功能获得建模;功能缺失建模;使用本发明的组合物建立用于优化和筛选目的细胞系和转基因动物)。本发明包括本发明的组合物用于建立和利用条件型或诱导型crisprrna靶向事件的用途;(参见,例如,platt等人,cell[细胞](2014),http://dx.doi.org/10.1016/j.cell.2014.09.014,或在此引用的pct专利公开,如wo2014/093622(pct/us2013/074667),其被认为不是先于本发明或申请)。例如,靶细胞有条件性地或诱导性地包括rna靶向crispr酶(例如,以cre依赖性构建体的形式)和/或有条件性地或诱导性地包括衔接蛋白并且,在表达被引入进靶细胞中的载体时,该载体表达的是诱导或产生在靶细胞中rna靶向酶表达和/或衔接体表达的条件。通过应用本发明的传授和组合物与产生crispr复合物的已知方法,受功能域影响的诱导型基因表达也是本发明的一个方面。可替代地,衔接蛋白可以作为条件型或诱导型元件与条件型或诱导型rna靶向酶一起提供,以便提供用于筛选目的有效模型,这有利地对于大量应用仅需要最小限度的设计和特异grna给药。根据本发明的包含死亡指导序列的指导rna在一个方面中,本发明提供了按以下方式修饰的指导序列,该方式允许形成crispr复合物并且成功地结合至靶标,但同时不允许成功的核酸酶活性(即没有核酸酶活性/没有indel活性)。出于解释的原因,这样的经修饰的指导物被称为“死亡指导物(deadguide)”或“死亡指导序列(deadguidesequence)”。就核酸酶活性而言,这些死亡指导物或死亡指导序列可以被认为是无催化活性的或无构象活性的。类似地,就促进催化活性的能力或区分中靶和脱靶结合活性的能力而言,死亡指导序列并不可以足够地参与富有成效的碱基配对。简言之,该测定涉及合成crispr靶rna和包含与靶rna错配的指导rna,将这些rna与rna靶向酶组合,并基于通过切割产物产生的条带的存在而在凝胶上进行分析,并基于相对带强度定量切割。因此,在一个相关方面,本发明提供了非天然存在的或工程化的组合物rna靶向crispr-cas系统,该系统包含如本文描述的功能性rna靶向、和指导rna(grna),其中该grna包含死亡指导序列,由此该grna能够杂交到靶序列上,这样使得该rna靶向crispr-cas系统被引导至细胞中的感兴趣基因组基因座,而没有该系统的非突变型rna靶向酶的可检测的rna切割活性。应理解的是,如在本文的其他地方描述的根据本发明的任何grna都可以用作死亡grna/包含如在下文描述的死亡指导序列的grna。如在本文的其他地方描述的任何方法、产品、组合物和用途都同样地适用于如下文进一步详述的死亡grna/包含如在下文描述的死亡指导序列的grna。通过进一步指导的方式,提供了以下具体方面和实施例。可以通过任何适合的测定法来评估死亡指导序列引导crispr复合物与rna靶序列的序列特异性结合的能力。例如,足以形成crispr复合物的crispr系统的组分(包括有待测试的死亡指导序列)可以例如通过用编码该crispr序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后评估在该靶序列之内的优先切割。例如,通过提供靶序列、crispr复合物的组分(包括有待测试的死亡指导序列)和不同于该测试死亡指导序列的对照指导序列,并且比较在该测试指导序列与对照指导序列反应之间的靶序列处的结合或切割率,可以在试管中评估靶rna多核苷酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。死亡指导序列可以被选择为靶向任何靶序列。在一些实施例中,该靶序列是在细胞的基因组内的序列。如本文进一步解释的,若干结构参数允许适当的框架到达这样的死亡指导物处。死亡指导序列典型地短于对应的指导序列,这导致活跃的rna切割。在具体的实施例中,死亡指导比针对其的相应指导短5%、10%、20%、30%、40%、50%。如下文解释的并且本领域已知的,grna-rna靶向特异性的一个方面是同向重复序列,它有待被适当地连接至这样的指导物。具体而言,这意味着该同向重复序列的设计取决于rna靶向酶的来源。因此,可用于经验证的死亡指导序列的结构数据可以用于设计cas13b特异性等效物。例如两个或更多个cas13b效应蛋白的直系同源物核酸酶结构域hepn之间的结构相似性可以用于迁移设计等效死亡指导物。因此,可以在长度和序列上对本文的死亡指导物进行适当修饰,以反映这样的cas13b特异性等效物,从而允许形成crispr复合物并且成功地结合至靶标,而同时不允许成功的核酸酶活性。死亡指导物在本文以及现有技术背景下的使用为体外、离体和体内应用两者中的网络生物学和/或系统生物学提供了令人惊讶且出乎意料的平台,从而允许多元基因靶向,并且特别是双向多元基因靶向。在死亡指导物的使用之前,处理多个靶标一直具有挑战性并且在一些情况下是不可能的。通过使用死亡指导物,可以例如在同一细胞中、在同一动物体内、或在同一患者体内处理多个靶标,并且因此处理多种活性。这种多元化可以同时发生或交错发生持续希望的时间段。例如,死亡指导物允许使用grna作为基因靶向工具,而不是核酸酶活性的结果,并且同时提供激活或阻遏的引导工具。包含死亡指导物的指导rna可以按一定方式被修饰为进一步包括以下元件,这些元件允许激活或阻遏基因活性,特别是如在本文的其他地方描述的允许功能性放置基因效应物(例如基因活性的激活物或阻遏物)的蛋白衔接体(例如适体)。一个实例是掺入适体,如在本文和在现有技术中所解释的。通过工程化包含死亡指导物的grna以掺入蛋白相互作用适体(konermann等人,“genome-scaletranscriptionactivationbyanengineeredcrispr-cas9complex[通过crispr-cas9复合物进行的基因组范围内的转录激活]”doi:10.1038/nature14136,通过引用并入本文),可以组装多个不同的效应结构域。在天然过程之后可以将其模式化。因此,一个方面是本发明的grna,该grna包含死亡指导物,其中该grna进一步包括修饰,这些修饰提供基因激活或阻遏,如本文所描述的。该死亡grna可以包含一种或多种适体。这些适体对于基因效应物、基因激活物或基因阻遏物而言可以是特异性的。可替代地,这些适体对于蛋白而言可以是特异性的,该蛋白转而对特异性基因效应物、基因激活物或基因阻遏物而言是特异性的并且募集/结合特异性基因效应物、基因激活物或基因阻遏物。如果存在多个激活物或阻遏物募集位点,优选的是这些位点对于激活物或阻遏物而言是特异性的。如果存在多个激活物或阻遏物结合位点,这些位点对于相同的激活物或相同的阻遏物而言可以是特异性的。这些位点对于不同激活物或不同阻遏物而言也可以是特异性的。基因效应物、基因激活物、基因阻遏物可以按融合蛋白的形式存在。在一个方面,本发明提供了选择用于将功能化的crispr系统引导至生物内的基因座的死亡指导rna靶向序列的方法,该方法包括:a)在该基因座中定位一个或多个crispr基序;b)分析每个crispr基序下游的20nt序列,通过:i)确定该序列的gc含量;并且ii)确定在该生物的基因组中是否存在该序列的前15nt的脱靶匹配;c)如果该序列的gc含量是70%或更低并且没有鉴定到脱靶匹配,则选择该序列用于在指导rna中使用。在一个实施例中,如果gc含量是50%或更低,则选择该序列。在一个实施例中,如果gc含量是40%或更低,则选择该序列。在一个实施例中,如果gc含量是30%或更低,则选择该序列。在一个实施例中,对两个或更多个序列加以分析,并且选择具有最低gc含量的序列。在一个实施例中,在该生物的调节序列中确定脱靶匹配。在一个实施例中,该基因座是调节区。一个方面提供了死亡指导rna,其包含根据上述方法所选择的靶向序列。在一个方面,本发明提供了用于将功能化的crispr系统靶向生物内的基因座的死亡指导rna。在本发明的一个实施例中,该死亡指导rna包含靶向序列,其中该靶序列的cg含量是70%或更低,并且该靶向序列的前15nt与该生物内的另一个基因座的调节序列中的crispr基序下游的脱靶序列不匹配。在某些实施例中,该靶向序列的gc含量是60%或更低、55%或更低、50%或更低、45%或更低、40%或更低、35%或更低或30%或更低。在某些实施例中,该靶向序列的gc含量是从70%至60%或从60%至50%或从50%至40%或从40%至30%。在一个实施例中,该靶向序列在该基因座的潜在靶向序列之中具有最低的cg含量。在本发明的一个实施例中,该死亡指导物的前15nt与该靶序列匹配。在另一个实施例中,该死亡指导物的前14nt与该靶序列匹配。在另一个实施例中,该死亡指导物的前13nt与该靶序列匹配。在另一个实施例中,该死亡指导物的前12nt与该靶序列匹配。在另一个实施例中,该死亡指导物的前11nt与该靶序列匹配。在另一个实施例中,该死亡指导物的前10nt与该靶序列匹配。在本发明的一个实施例中,该死亡指导物的前15nt与另一个基因座的调节区中的crispr基序下游的脱靶序列不匹配。在其他实施例中,该死亡指导物的前14nt或前13nt、或该指导物的前12nt、或该死亡指导物的前11nt、或该死亡指导物的前10nt与另一个基因座的调节区中的crispr基序下游的脱靶序列不匹配。在其他实施例中,该死亡指导物的前15nt、或14nt、或13nt、或12nt、或11nt与该基因组中的crispr基序下游的脱靶序列不匹配。在某些实施例中,该死亡指导rna在3'-端包括与靶序列不匹配的另外的核苷酸。因此,包括crispr基序下游的前20-28nt的死亡指导rna在3'端的长度可以延长。一般规定在一个方面,本发明提供了核酸结合系统。rna与互补探针的原位杂交是一种强有力的技术。典型地,使用荧光dna寡核苷酸通过杂交来检测核酸。通过例如锁核酸(lna)的某些修饰已经获得了增加的效率,但仍然需要高效和多功能的替代方案。本发明提供了用于原位杂交的有效和适应性系统。在本发明的实施例中,术语指导序列和指导rna可互换地使用,如在前述引用文献(如wo2014/093622(pct/us2013/074667))中。一般而言,指导序列是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且引导crispr复合物与该靶序列的序列特异性结合的任何多核苷酸序列。在一些实施例中,当使用适合的比对算法进行最佳比对是,在指导序列与其相应的靶序列之间的互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼(smith-waterman)算法、尼德曼-翁施(needleman-wunsch)算法、基于伯罗斯-惠勒变换(burrows-wheelertransform)的算法(例如,伯罗斯-惠勒比对工具(burrowswheeleraligner))、clustalw、clustalx、blat、novoalign(novocraft技术公司;在www.novocraft.com可获得)、eland(亿明达公司(illumina),圣地亚哥,加利福尼亚州)、soap(在soap.genomics.org.cn可获得)、以及maq(在maq.sourceforge.net可获得)。在一些实施例中,指导序列在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸。在一些实施例中,指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸。优选地,该指导序列是10-30个核苷酸长,例如30个核苷酸长。可以通过任何适合的测定法来评估指导序列引导crispr复合物与靶序列的序列特异性结合的能力。例如,足以形成crispr复合物的crispr系统的组分,包括有待测试的指导序列在内,可以例如通过用编码该crispr序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后通过如在此描述的surveyor测定来评估在该靶序列之内的优先切割。类似地,通过提供该靶序列、包括有待测试的指导序列在内的crispr复合物的组分、和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处的结合或切割率,可以在试管中评估靶多核苷酸序列的切割。其他测定是可能的,并且将由本领域技术人员想到。一个指导序列可以被选择为靶向任何靶序列。在一些实施例中,该靶序列是在细胞的基因组内的序列。示例性靶序列包括在靶基因组中为独特的那些。如在此使用的,“同源性”是指氨基酸或核酸序列之间的相似性程度。序列相似性搜索可以通过检测反映共同祖先的统计学显著相似性来鉴定“同源”蛋白或基因。blast、fasta、ssearch和其他常用的相似性搜索程序可以生成可用于可靠地推断同源性的准确的统计估计。一个常见的经验法则是,如果两条序列在其整个长度上超过30%相同,则两条序列是同源的(在短序列比对中偶然看到更高的同一性)。所谓“同源序列”意指由一个或多个多核苷酸或氨基酸序列(例如基因、基因转录物和/或非编码多核苷酸或蛋白)共有的核苷酸序列或氨基酸序列。同源序列还可以包括由一个以上多核苷酸或氨基酸序列共有的保守序列区域。本发明提供了具有小于90%同源性(例如,89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、70%、60%、50%、40%、30%、20%或更少等)的同源序列。序列同一性可以通过本领域中已知的序列比较和比对算法测定。为了确定两个核酸序列(或两个氨基酸序列)的百分比同一性,出于最佳比较目的,将序列进行比对(例如,可以在第一序列或第二序列中引入空位以获得最佳比对)。随后比较相应核苷酸(或氨基酸)位置的核苷酸(或氨基酸残基)。当占据第一序列某一位置的残基与第二序列相应位置的残基相同时,则分子在该位置相同。两个序列之间的百分比同一性是这两个序列共有相同位置的数量的函数(即,同一性%=相同位置的数量/位置总数x100),任选对引入的空位数量和/或引入的空位长度进行罚分。两个序列之间的序列的比较和一致性百分比的确定可使用数学算法来完成。在一个实施例中,比对是在所比对序列具有足够同一性的某一部分上发生,而不是在具有低同一性程度的部分上发生(即,局部比对)。用于比较序列的局部比对算法的优选的非限制性实例是如karlin和altschul(1990)proc.natl.acad.sci.usa[美国国家科学院院刊]87:2264-68的算法,如karlin和altschul(1993)proc.natl.acad.sci.usa[美国国家科学院院刊]90:5873-77中修改的算法。此类算法被并入altschul等(1990)j.mol.biol.[分子生物学杂志]215:403-10的blast程序(2.0版)中。通过引入适当适合空位而对比对进行优化,并测定比对序列长度上的百分比同一性(即,空位比对)。为了获得用于比较目标的有空位的比对,可以利用如在altschul等人,(1997)nucleicacidsres.[核酸研究]25(17):3389-3402中所述的有空位的blast。也可以通过引入适当的空位来优化比对,并且在比对的序列的整个长度上确定百分比同一性(即总体比对)。用于序列的总体比较的数学算法的优选的非限制性实例为myers和miller,cabios(1989)的算法。这一算法被并入align程序(2.0版)中,该程序是gcg序列算法软件包的一部分。当利用align程序来比较多个氨基酸序列时,可以使用一个pam120权重残基表、空位长度罚分12、以及空位罚分4。所谓“保守序列区域”意指多核苷酸或蛋白中的一个或多个区域的核苷酸或氨基酸序列在后代之间或从一个生物系统、受试者或生物到另一个生物系统、受试者或生物不发生显著变化。通常,并且贯穿本说明书,术语“载体”是指一种核酸分子,它能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如,环状的)的核酸分子;包括dna、rna、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的dna片段的环状双链dna环。另一种类型的载体是病毒载体,其中病毒衍生的dna或rna序列存在于用于包装进病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒)的载体中。病毒载体还包含由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此称为“表达载体”。用于在真核细胞中表达并且导致在真核细胞中表达的载体可以在此称为“真核表达载体”。在重组dna技术中使用的普通表达栽体通常是质粒形式。重组表达载体可包含处于适合于在宿主细胞中的核酸表达的形式的本发明的核酸,这意味着这些重组表达载体包含基于待用于表达的宿主细胞而选择的一种或多种调控元件,所述调控元件可操作地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许该核苷酸序列的表达的方式被连接至这一种或多种调控元件(例如,处于体外转录/翻译系统中或当该载体被引入宿主细胞中时,处于该宿主细胞中)。术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(ires)、以及其他表达调控元件(例如,转录终止信号,如多聚腺苷酸化信号和多聚u序列)。这类调控元件描述于例如goeddel,geneexpressiontechnology:methodsinenzymology[基因表达技术:酶学方法]185,academicpress[学术出版社],圣地亚哥(sandiego),加利福尼亚州(calif.)(1990年)中。调控元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异性启动子可主要引导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如,肝、胰腺)、或特殊的细胞类型(例如,淋巴细胞)。调控元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在一些实施例中,载体包括一个或多个poliii启动子(例如,1、2、3、4、5个、或更多个poliii启动子)、一个或多个polii启动子(例如,1、2、3、4、5个、或更多个polii启动子)、一个或多个poli启动子(例如,1、2、3、4、5个、或更多个poli启动子)、或其组合。poliii启动子的实例包括但不限于u6和h1启动子。polii启动子的实例包括但不限于逆转录劳斯肉瘤病毒(rsv)ltr启动子(任选地具有rsv增强子)、巨细胞病毒(cmv)启动子(任选地具有cmv增强子)[参见,例如,boshart等人,cell[细胞],41:521-530(1985)]、sv40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(pgk)启动子、和ef1α启动子。还被术语“调控元件”涵盖的是增强子元件,如wpre;cmv增强子;在htlv-i的ltr中的r-u5’片段(mol.cell.biol.[分子细胞生物学],第8(1)卷,第466-472页,1988);sv40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(proc.natl.acad.sci.usa.[美国国家科学院院刊],第78(3)卷,第1527-31页,1981)。本领域的普通技术人员应当理解的是,表达载体的设计可取决于比如待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以被引入到宿主细胞中而由此产生转录物、蛋白、或肽,包括由如在此描述的核酸编码的融合蛋白或肽(例如,规律间隔成簇短回文重复(crispr)转录物、蛋白、酶、其突变体形式、其融合蛋白等)。有利的载体包括慢病毒以及腺相关病毒,并且也可选择此类型的载体以靶向具体类型的细胞。如在此使用的,术语组29或组30效应蛋白基因座的“crrna”或“指导rna”或“单指导rna”或“sgrna”或“一个或多个核酸组分”包括与靶核酸序列具有足够互补性以与该靶核酸序列杂交并且引导靶向核酸的复合物与该靶核酸序列的序列特异性结合的任何多核苷酸序列。在一些实施例中,当使用适合的比对算法进行最佳比对时,互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼(smith-waterman)算法、尼德曼-翁施(needleman-wunsch)算法、基于伯罗斯-惠勒变换(burrows-wheelertransform)的算法(例如,伯罗斯-惠勒比对工具(burrowswheeleraligner))、clustalw、clustalx、blat、novoalign(novocraft技术公司;在www.novocraft.com可获得)、eland(亿明达公司(illumina),圣地亚哥,加利福尼亚州)、soap(在soap.genomics.org.cn可获得)、以及maq(在maq.sourceforge.net可获得)。可以通过任何适合的测定来评估指导序列(在靶向核酸的指导rna内)引导靶向核酸的复合物与靶核酸序列的序列特异性结合的能力。例如,足以形成靶向核酸的复合物的靶向核酸的crispr系统的组分(包括有待测试的指导序列)可以如通过用编码靶向核酸的该复合物的组分的载体进行转染而被提供到具有相应靶核酸序列的宿主细胞中,随后如通过如在此描述的surveyor测定来评估在该靶核酸序列内的优先靶向(例如,切割)。类似地,通过提供靶核酸序列、靶向核酸的复合物的组分(包括有待测试的指导序列)和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与对照指导序列反应之间的靶序列处的结合或切割率,可以在试管中评估该靶核酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。指导序列可以被选择为靶向任何靶核酸序列,并且因此靶向核酸的指导rna也可以。该靶序列可以是dna。该靶序列可以是任何rna序列。在一些实施例中,该靶序列可以是选自下组的rna分子内的序列,该组由以下组成:信使rna(mrna)、pre-mrna、核糖体rna(rrna)、转移rna(trna)、微小rna(mirna)、小干扰rna(sirna)、核小rna(snrna)、核仁小rna(snorna)、双链rna(dsrna)、非编码rna(ncrna)、长链非编码rna(lncrna)、以及胞质小rna(scrna)。在一些优选实施例中,该靶序列可以是选自下组的rna分子内的序列,该组由以下组成:mrna、pre-mrna、和rrna。在一些优选实施例中,该靶序列可以是选自下组的rna分子内的序列,该组由以下组成:ncrna、和lncrna。在一些更优选实施例中,该靶序列可以是mrna分子或pre-mrna分子内的序列。在一些实施例中,靶向核酸的指导rna被选择为降低在靶向rna的该指导rna内的二级结构水平。在一些实施例中,在最佳地折叠时,靶向核酸的该指导rna的约或少于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%、或更少的核苷酸参与自我互补碱基配对。可以通过任何适合的多核苷酸折叠算法来确定最佳折叠。一些算法是基于计算最小吉布斯(gibbs)自由能。一种这样的算法的实例是mfold,正如祖克(zuker)和施蒂格勒(stiegler)核酸研究(nucleicacidsres.)9(1981),133-148)所描述。折叠算法的另一个实例是使用质心结构预测算法的由维也纳大学(universityofvienna)的理论化学研究所(institutefortheoreticalchemistry)研发的在线网络服务器rnafold(参见例如,a.r.gruber等人,2008,cell[细胞]106(1):23-24;以及pacarr和gmchurch,2009,naturebiotechnology[自然生物技术]27(12):1151-62)。在某些实施例中,指导rna或crrna可以包括同向重复(dr)序列和指导序列或间隔子序列、基本上由其组成、或由其组成。在某些实施例中,该指导rna或crrna可以包括融合至或连接至指导序列或间隔子序列的同向重复序列、基本上由其组成、或由其组成。在某些实施例中,该同向重复序列可以位于该指导序列或间隔子序列的上游(即,5')。在其他实施例中,该同向重复序列可以位于该指导序列或间隔子序列的下游(即,3')。在其他实施例中,可以存在多个dr(如双dr)。在某些实施例中,该crrna包括茎环,优选单个茎环。在某些实施例中,该同向重复序列形成茎环,优选单个茎环。在某些实施例中,该指导rna的间隔子长度是从15至35nt。在某些实施例中,该指导rna的间隔子长度是至少15个核苷酸。在某些实施例中,间隔子长度是从15至17nt(例如,15、16或17nt)、从17至20nt(例如,17、18、19或20nt)、从20至24nt(例如,20、21、22、23或24nt)、从23至25nt(例如,23、24或25nt)、从24至27nt(例如,24、25、26或27nt)、从27-30nt(例如,27、28、29或30nt)、从30-35nt(例如,30、31、32、33、34或35nt、或35nt)或更长。“tracrrna”序列或类似术语包括与crrna序列具有足够互补性以便杂交的任何多核苷酸序列。通常,互补程度是就sca序列与tracr序列沿着这两个序列的较短者的长度的最佳比对而言。可以通过任何适合的比对算法来确定最佳比对,并且可以进一步对二级结构做出解释,如在该sca序列或tracr序列之内的自我互补性。在一些实施例中,在进行最佳比对时,在tracr序列与sca序列之间沿着这两者的较短者的长度的互补程度是约或多于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、或更高。在某些实施例中,可能不需要tracrrna。事实上,如本文所证明的,来自动物溃疡伯格菌及其直向同源物的组29效应蛋白不需要tracrrna来确保rna靶标的切割。更详细地,对于rna靶标的测定如下,条件是需要pam序列来指导识别。在该测定中使用两种大肠杆菌菌株。一个携带编码来自细菌菌株的内源效应蛋白基因座的质粒。另一株携带空质粒(例如pacyc184,对照菌株)。所有可能的7或8bppam序列都存在于抗生素抗性质粒(带有氨苄青霉素抗性基因的puc19)上。pam位于原型间隔子1序列旁边(内源效应蛋白基因座中第一个间隔子的rna靶标)。克隆了两个pam文库。一个具有原型间隔子的8个随机bp5'(例如,总共65536个不同pam序列=复杂性)。另一个文库具有原型间隔子的7个随机bp3'(例如总复杂性是16384个不同的pam)。克隆这两个文库以使每个可能的pam具有平均500个质粒。在分开的转化中用5'pam和3'pam文库来转化测试菌株和对照菌株,并将转化的细胞分别接种在氨苄青霉素平板上。对质粒的识别和随后的切割/干扰使得细胞容易受到氨苄青霉素影响并且阻止生长。转化后大约12小时,分离收获的测试和对照菌株形成的所有菌落和质粒rna。使用质粒rna作为模板用于pcr扩增和随后的深度测序。所有pam在未转化的文库中的表征显示了pam在转化细胞中的预期表征。在对照菌株中发现的所有pam的表征显示了实际表征。测试菌株中所有pam的表征显示哪些pam没有被酶识别出,并且与对照菌株比较允许提取耗竭pam的序列。在具体的实施例中,切割(例如rna切割)不是pam依赖性的。事实上,如在此证明的,对于动物溃疡伯格菌效应蛋白及其直向同源物,rna靶标切割似乎是与pam无关的。为了将毒性和脱靶效应最小化,重要的是控制所递送的核酸靶向指导rna的浓度。casmrna和指导rna的最佳浓度可以通过在细胞或非人类真核生物动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组基因座处的修饰的范围而确定。对于体内递送,应当选择产生最高的中靶修饰水平同时将脱靶修饰水平最小化的浓度。该核酸靶向系统有利地衍生自vi-b型crispr系统。在一些实施例中,核酸靶向系统的一个或多个元件来源于包含内源rna靶向crispr系统的特殊生物,如化脓链球菌。在具体的实施例中,cas蛋白crispr系统是组29或组30效应蛋白系统。术语“直系同源物”(在此还称为“直向同源物”)和“同系物”(在此还称为“同源物”)在本领域是熟知的。通过进一步指导的方式,在此使用的蛋白的“同系物”是相同物种的、执行与其同系物的蛋白相同或相似功能的蛋白。同源蛋白可以不必是结构相关的,或者仅仅是部分结构相关的。如在此使用的蛋白的“直系同源物”是对于与其直系同源物的蛋白执行相同或相似功能的蛋白来说的不同物种。直向同源蛋白可以不必是结构相关的,或者仅仅是部分结构相关的。在具体的实施例中,如在此称为组29或组30蛋白的同系物或直系同源物与所述组29或组30效应蛋白具有至少80%、更优选至少85%、甚至更优选至少90%,例如像至少95%的序列同源性或一致性。在一个优选实施例中,组29或组30效应蛋白可以是以下属的生物的直向同源物,这些属包括但不限于伯格菌属、普雷沃菌属、卟啉单胞菌属、拟杆菌属、alistipes属、里氏杆菌属、类香菌属、黄杆菌属、二氧化碳嗜纤维菌属、金黄杆菌属、棕指藻属杆属、沼杆菌属或冷弯菌属。一些鉴定crispr系统酶的直向同源物的方法可涉及鉴定感兴趣的基因组中的tracr序列。鉴定tracr序列可涉及以下步骤:鉴定tracr序列可涉及以下步骤:在一个数据库中搜索这些同向重复或tracr配对序列以鉴定包括一种crispr酶的一个crispr区域。在该crispr酶有义和反义两个方向的侧翼的crispr区域中搜索同源序列。寻找转录终止子以及二级结构。将不是一个同向重复或一种tracr配对序列但与tracr配对序列的同向重复具有超过50%一致性的任何序列鉴定为一个可能的tracr序列。取该可能的tracr序列并且分析与其相关的转录终止子序列。应当理解的是,可以将在此描述的任何功能性工程化到来自其他直向同源物的crispr酶中,包括包含来自多个直向同源物的片段的嵌合酶。此类直向同源物的实例是在此其他地方所述的。因此,嵌合酶可以包含以下生物的crispr酶直向同源物的片段,这些生物包括但不限于伯格菌属、普雷沃菌属、卟啉单胞菌属、拟杆菌属、alistipes属、里氏杆菌属、类香菌属、黄杆菌属、二氧化碳嗜纤维菌属、金黄杆菌属、棕指藻属杆属、沼杆菌属或冷弯菌属。嵌合酶可以包括第一片段和第二片段,并且这些片段可以是本文提到的属的生物的crispr酶直向同源物或本文提到的物种的片段;有利的是,这些片段来自不同物种的crispr酶直向同源物。在实施例中,在此称为vi-b型rna靶向效应蛋白还涵盖效应蛋白的功能变体或其同系物或直系同源物。如在此使用的蛋白的“功能变体”是指这样的蛋白的至少部分地保留该蛋白的活性的变体。功能变体可以包括突变体(其可以是插入、缺失、或置换突变体),包括多晶型物等。还包括在功能变体内的是这样的蛋白与另一种通常不相关的核酸、蛋白、多肽或肽的融合产物。功能变体可以是天然存在的或可以是人造的。在一个实施例中,编码组29或组30rna靶向效应蛋白或其直向同系物或同系物的一个或多个核酸分子可以被密码子优化以用于在真核细胞中表达。真核生物可以如在此所讨论的。一个或多个核酸分子可以是工程化的或非天然存在的。在一个实施例中vi-b型rna靶向(例如组29或组30)效应蛋白或其直向同源物或同系物可以包含一个或多个突变。该突变可以是人工引入的突变并且可包括但不限于催化结构域中的一个或多个突变。关于效应酶的催化结构域的实例可包括但不限于ruvci、ruvcii、ruvciii、hnh结构域以及hepn结构域。在具体的实施例中,一个或多个突变被引入一个或多个hepn结构域中。在一个实施例中,组29或组30蛋白或其直向同源物或同系物可以用作融合至或可操作地连接至功能域上的通用核酸结合蛋白。示例性的功能域可以包括但不限于:翻译起始子、翻译激活物、翻译阻遏物、核酸酶,特别是核糖核酸酶、剪接体、珠粒、光诱导型/可控型结构域或化学诱导型/可控结构域。在一些实施例中,靶向未改性的核酸的效应蛋白可以具有切割活性。在一些实施例中,该靶向rna的效应蛋白可以指导在靶序列位置处或其附近(例如在该靶序列之内和/或在该靶序列的互补物之内或在与该靶序列相关的序列处)的一条或两条核酸(dna或rna)链的切割。在一些实施例中,核酸靶向crispr蛋白可指导距离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个、或更多个碱基对之内的一条或两条dna或rna链的切割。在一些实施例中,核酸靶向crispr蛋白可以指导在靶序列内和/或在靶序列的互补序列内或在与靶序列相关的序列处和/或在来自靶序列的第一个或最后一个核苷酸的约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个碱基对内的一条或两条dna或rna链的多于一个的切割(例如一个、两个、三个、四个、五个或更多个个切割)。在一些实施例中,切割可以是平的,即由此产生平端。在一些实施例中,切割可以是交错的,即由此产生黏性末端。在一些实施例中,切割可以是具有5’突出端(例如,1至5个核苷酸的5’突出端)的交错切口。在一些实施例中,切割可以是具有3’突出端(例如,1至3个核苷酸的3’突出端)的交错切口。在一些实施例中,载体编码可相对于相应的野生型酶被突变的靶向核酸的cas蛋白,使得该突变的靶向核酸的cas蛋白缺乏切割含有靶序列的靶多核苷酸的一条或两条dna或rna链的能力。作为一个另外的实例,cas的两个或更多个催化结构域(ruvci、ruvcii和ruvciii或hnh结构域、或hepn结构域)可以被突变为产生实质上缺乏所有rna切割活性的突变的cas。如在此描述的,效应蛋白的对应催化结构域还可以被突变为产生缺乏所有核酸切割活性或具有实质上降低的核酸切割活性的突变的组29或组30效应蛋白。在一些实施例中,当该突变的酶的rna切割活性不多于该酶的非突变形式的核酸切割活性的约25%、10%、5%、1%、0.1%、0.01%、或更少时,则靶向核酸的效应蛋白可被考虑为实质上缺乏所有rna切割活性;一个实例可以是当突变形式的核酸切割活性与非突变形式相比是零或可忽略不计时。可以参考与来自先前描述的酶系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别来鉴定一种效应蛋白。关于衍生,申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义,但是如本领域已知或如在此描述的它在某些方面已经被突变(修饰)。再一次,应当理解的是,术语cas和crispr酶和crispr蛋白和cas蛋白通常可互换地使用,并且在此参考的各方面同样是指本申请中进一步描述的新颖的crispr效应蛋白,除非另外显而易见的,如通过具体参考cas9。如上提及的,在此使用的许多残基编号是指来自组29或组30crispr基因座的效应蛋白。然而,应当理解的是,本发明包括更多的来自其他微生物物种的效应蛋白。在某些实施例中,cas可以组成性地存在或诱导性地存在或条件性地存在或给药或递送。cas优化可以用来增强功能或者用来开发新的功能,可以产生嵌合cas蛋白。并且cas可以用作通用的核酸结合蛋白。典型地,在内源核酸靶向系统的背景下,核酸靶向复合物(包含杂交到靶序列上并且与一种或多种核酸靶向效应蛋白复合的指导rna)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内)的一条链或两条dna或rna链的切割。如在此使用的,术语“一个或多个与感兴趣的靶基因座相关的序列”是指在靶序列附近的序列(例如,离靶序列1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内,其中该靶序列被包含在感兴趣的靶基因座中)。密码子优化序列的一个实例在这种情形下是针对在真核生物(例如,人类)中表达(即,针对在人类中表达进行优化)或针对如本文讨论的另一种真核生物、动物或哺乳动物进行优化的序列;参见例如wo2014/093622(pct/us2013/074667)中的sacas9人密码子优化序列作为密码子优化序列的实例(来自本领域知识和本披露,一个或多个密码子优化编码核酸分子,尤其是对于效应蛋白(例如组29或组30)而言,在技术人员的范围内)。虽然这是优选的,但是应当理解的是,其他实例也是可能的,并且针对除人类之外的宿主物种的密码子优化或针对具体器官的密码子优化是已知的。在一些实施例中,编码dna/rna靶向cas蛋白的酶编码序列经密码子优化,以便在特定的细胞(如真核细胞)中表达。这些真核细胞可以是特定生物的那些或来源于特定生物,如哺乳动物,包括但不限于人、或如本文讨论的非人类真核生物或动物或哺乳动物,例如,小鼠、大鼠、兔、狗、牲畜、或非人类哺乳动物或灵长动物。在一些实施例中,对于人类或动物而言很可能使得他们(它们)受苦而没有任何实质性医学益处的用于修饰人类的种系遗传同一性的方法和/或用于修饰动物的遗传同一性的方法、以及还有作为这样的方法的结果的动物,可以被排除在外。一般而言,密码子优化是指通过用在宿主细胞的基因中更频繁地或者最频繁地使用的密码子代替天然序列的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50个、或更多个密码子同时维持该天然氨基酸序列而修饰核酸序列以便增强在感兴趣宿主细胞中的表达的方法。不同的物种对于具有特定氨基酸的某些密码子展示出特定的偏好。密码子偏好性(在生物之间的密码子使用的差异)经常与信使rna(mrna)的翻译效率相关,而该翻译效率则被认为依赖于(除其他之外)被翻译的密码子的性质和特定的转运rna(trna)分子的可用性。细胞内选定的trna的优势一般反映了最频繁用于肽合成的密码子。因此,可以将基因定制为基于密码子优化在给定生物中的最佳基因表达。密码子利用率表可以容易地获得,例如在www.kazusa.orjp/codon/上可获得的密码子使用数据库(“codonusagedatabase”)中,并且这些表可以通过不同的方式调整适用。参见nakamura,y.等人“codonusagetabulatedfromtheinternationaldnasequencedatabases:statusfortheyear2000[从国际dna序列数据库中制表的密码子使用:2000年的状态]”nucl.acidsres.[核酸研究]28:292(2000)。用于密码子优化特定的序列以便在特定的宿主细胞中表达的计算机算法也是可得的,如geneforge[基因制造](aptagen公司[aptagen];jacobus[雅各布斯],pa),也是可得的。在一些实施例中,在编码dna/rna靶向cas蛋白的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个、或更多个、或所有密码子)相应于对于特定氨基酸最频繁使用的密码子。在一些实施例中,一种载体编码包含一个或多个核定位序列(nls)(如约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个nls)的核酸靶向效应蛋白,如在此描述的组29或组30效应物),或其直向同源物或同系物。在一些实施例中,该rna靶向效应蛋白包括在氨基-末端处或与其附近的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个nls,在或接近于羧基-末端约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个nls,或这些的组合(例如在氨基-末端的零个或至少一个或多个nls以及在羧基-末端的零个或至少一个或多个nls)。当存在多于一个nls时,每一个可以被选择为不依赖于其他nls,使得在多于一个拷贝中可以存在单个nls和/或与在一个或多个拷贝中存在一个或多个其他nls相组合。在一些实施例中,当nls的最邻近的氨基酸是在从n-末端或c-末端沿着该多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个、或更多个氨基酸之内时,nls可以被视为接近该n-末端或c-末端。nls的非限制性实例包括来源于以下项的nls序列:sv40病毒大t抗原的nls,其具有氨基酸序列pkkkrkv;来自核质蛋白的nls(例如,具有序列krpaatkkagqakkkk的核质蛋白二分nls);c-mycnls,其具有氨基酸序列paakrvkld或rqrrnelkrsp;hrnpa1m9nls,其具有序列nqssnfgpmkggnfggrssgpyggggqyfakprnqggy;来自输入蛋白-α的ibb结构域的序列rmrizfknkgkdtaelrrrrvevsvelrkakkdeqilkrrnv;肌瘤t蛋白的序列vsrkrprp和ppkkared;人p53的序列popkkkpl;小鼠c-abliv的序列salikkkkkmap;流感病毒ns1的序列drlrr和pkqkkrk;肝炎病毒δ抗原的序列rklkkkikkl;小鼠mx1蛋白的序列rekkkflkrr;人聚(adp-核糖)聚合酶的序列krkgdevdgvdevakkkskk;以及类固醇激素受体(人)糖皮质激素的序列rkclqagmnlearktkk。一般而言,该一个或多个nls具有足够的强度,以便在真核细胞的细胞核中驱动该dna/rna靶向cas蛋白以可检测的量积聚。一般而言,核定位活性的强度可以由在该核酸靶向效应蛋白中的nls的数目、所使用的一个或多个特定的nls、或这些因素的组合导出。可以通过任何适合的技术进行细胞核中积聚的检测。例如,检测标记可以融合到该核酸靶向效应蛋白上,使得细胞内的位置可以被可视化,如与检测细胞核的位置的手段(例如,对于细胞核特异的染料,如dapi)相结合。还可以将细胞核从细胞中分离出来,然后可以通过任何适合的用于检测蛋白的方法分析其内容物,如免疫组织化学、western印迹或酶活性测定。如通过测定核酸靶向复合物形成的作用(例如,测定在靶序列处的dna或rna切割或突变、或测定由于dna或rna靶向复合物形成和/或dna或rna靶向cas蛋白活性的影响而改变的基因表达活性),与没有暴露于该核酸靶向cas蛋白或核酸靶向复合物、或暴露于缺乏该一个或多个nls的核酸靶向cas蛋白的对照相比较,还可以间接地确定细胞核中的积聚。在在此描述组29或组30效应蛋白复合物和系统的优选实施例中,密码子优化的cpf1效应蛋白包含附接到蛋白c-末端的nls。在一些实施例中,将驱动靶向核酸的系统的一个或多个元件的表达的一种或多种载体引入宿主细胞中,使得靶向核酸的该系统的这些元件的表达在一个或多个靶位点引导靶向核酸的复合物的形成。例如,靶向核酸的效应酶和靶向核酸的指导rna可以各自可操作地连接到分开的载体上的分开的调控元件上。可以将靶向核酸的该系统的一种或多种rna递送到转基因的靶向核酸的效应蛋白的动物或哺乳动物,例如组成性地或诱导性地或条件性地表达靶向核酸的效应蛋白的动物或哺乳动物;或以其他方式表达靶向核酸的效应蛋白或具有含有靶向核酸的效应蛋白的细胞的动物或哺乳动物,如通过向其先前给药编码并且在体内表达靶向核酸的效应蛋白的一种或多种载体的方式。可替代地,从相同或不同调控元件表达的两个或更多个元件可以结合在单一载体中,其中提供靶向核酸的该系统的任何组分的一种或多种另外的载体不包括在该第一载体中。结合在单一载体中的靶向核酸的系统元件可以按照任何适合的方向排列,如一个元件相对于第二元件位于5'(“上游”)或3'(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的同一条链或相对链上,并且方向为相同或相对的方向。在一些实施例中,单个启动子驱动编码靶向核酸的效应蛋白的转录物以及嵌入在一个或多个内含子序列之内(例如,各自在不同的内含子中、两个或更多个在至少一个内含子中、或全部在单个内含子中)的靶向核酸的指导rna的表达。在一些实施例中,靶向核酸的该效应蛋白和靶向核酸的该指导rna可以可操作地连接至同一启动子并且从其中表达。用于表达靶向核酸的系统的一个或多个元件的递送媒介、载体、粒子、粒子、配制品及其组分是如在前述文献(如wo2014/093622(pct/us2013/074667))中使用的。在一些实施例中,载体包括一个或多个插入位点,如限制性内切核酸酶识别序列(也称为“克隆位点”)。在一些实施例中,一个或多个插入位点(例如,约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个插入位点)位于一种或多种载体的一个或多个序列元件的上游和/或下游。在一些实施例中,载体包括在tracr配对序列的上游,并且任选地在可操作地连接到该tracr配对序列上的调控元件的下游的插入位点,使得在将指导序列插入到该插入位点中之后并且在表达时,该指导序列引导靶向核酸的复合物与真核细胞中的靶序列的序列特异性结合。在一些实施例中,载体包括两个或更多个插入位点,从而允许在每个位点插入指导序列。在这样一种安排中,两个或更多个指导序列可以包含单个指导序列的两个或更多个拷贝、两个或更多个不同的指导序列、或这些的组合。当使用多个不同的指导序列时,可以使用单个表达构建体使靶向核酸的活性靶向到细胞内的多个不同的相应靶序列。例如,单一载体可以包括约或多于约1、2、3、4、5、6、7、8、9、10、15、20个、或更多个指导序列。在一些实施例中,可以提供约或多于约1、2、3、4、5、6、7、8、9、10个、或更多种这样的含有靶序列的载体,并且任选地将其递送到细胞中。在一些实施例中,载体包括可操作地连接到编码靶向核酸的效应蛋白的酶编码序列上的调控元件。靶向核酸的效应蛋白或靶向核酸的指导rna或一种或多种rna可以分开地递送;并且有利地,这些中的至少一者经由粒子或粒子复合物递送。靶向核酸的效应蛋白mrna可以在靶向核酸的指导rna之前递送,以给靶向核酸的效应蛋白的表达留出时间。可以在给药靶向核酸的指导rna之前1-12小时(优选约2-6小时)给药靶向核酸的效应蛋白mrna。可替代地,可以一起给药靶向核酸的效应蛋白mrna和靶向核酸的指导rna。有利地,可以在初始给药靶向核酸的效应蛋白mrna+指导rna之后1-12小时(优选约2-6小时)给药指导rna的第二加强剂量。为了实现基因组修饰的最有效水平,另外给药靶向核酸的效应蛋白mrna和/或指导rna可以是有用的。在一个方面中,本发明提供了用于使用靶向核酸的系统的一个或多个元件的方法。本发明的靶向核酸的复合物提供了用于修饰靶dna或rna(单链或双链、直链或超螺旋的)的有效手段。本发明的靶向核酸的复合物具有多种多样的实用性,包括修饰(例如,缺失、插入、转位、失活、激活)多种细胞类型中的靶dna或rna。正因为如此,本发明的靶向核酸的复合物在例如基因治疗、药物筛选、疾病诊断以及预后中具有广阔的应用谱。示例性的靶向核酸的复合物包括与杂交到感兴趣的靶基因座内的靶序列上的指导rna复合的靶向dna或rna的效应蛋白。在其他实施例中,本发明提供了一种修饰rna在真核细胞中的表达的方法。该方法包括通过使用结合到rna(例如,mrna或pre-mrna)的靶向核酸的复合物增加或降低靶多核苷酸的表达。在一些方法中,可以使靶rna失活以实施细胞中的表达的修饰。例如,当靶向rna的复合物结合到细胞中的一个靶序列上时,该靶rna失活,这样使得该序列不被翻译,该编码蛋白不被产生,或者该序列不会像野生型序列一样起作用。例如,可以使蛋白或微小rna编码序列失活,这样使得该蛋白或微小rna或前-微小rna转录物不被产生。rna靶向复合物的靶rna可以是对真核细胞而言内源或外源的任何rna。例如,该靶rna可以是一种驻留在真核细胞的细胞核中的rna。靶rna可以是编码基因产物(例如,蛋白)的序列(例如,mrna或pre-mrna)的序列或非编码序列(例如,ncrna、lncrna、trna、或rrna)。靶rna的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关rna。靶rna的实例包括疾病相关rna。“疾病相关”rna是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生翻译产物的任何rna。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是从一个以异常高的水平被表达的基因转录的rna;它可以是从一个以异常低的水平被表达的基因转录的rna。疾病相关rna还指从具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因转录的rna。翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。rna靶向复合物的靶rna可以是对真核细胞而言内源或外源的任何rna。例如,该靶rna可以是一种驻留在真核细胞的细胞核中的rna。靶rna可以是编码基因产物(例如,蛋白)的序列(例如,mrna或pre-mrna)的序列或非编码序列(例如,ncrna、lncrna、trna、或rrna)。在一些实施例中,该方法可以包括允许靶向核酸的复合物结合到靶dna或rna以实现所述靶dna或rna的切割,由此修饰该靶dna或rna,其中靶向核酸的该复合物包含与指导rna复合的靶向核酸的效应蛋白,该指导rna杂交到所述靶dna或rna内的靶序列上。在一个方面中,本发明提供了修饰dna或rna在真核细胞中的表达的方法。在一些实施例中,该方法包括允许靶向核酸的复合物结合至该dna或rna,这样使得所述结合导致所述dna或rna的表达增加或降低;其中靶向核酸的该复合物包含与指导rna复合的靶向核酸的效应蛋白。类似的考虑因素和条件适用如上文针对修饰靶dna或rna的方法。事实上,这些取样、培养和重新引入选择跨本发明的多个方面而适用。在一个方面中,本发明提供了修饰真核细胞中的靶dna或rna的方法,这些方法可以在体内、离体地或在体外。在一些实施例中,该方法包括对来自人或非人动物的细胞或细胞群进行取样,并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入该非人动物或植物中。对于重新引入的细胞,特别优选的是这些细胞是干细胞。的确,在本发明的任何方面,靶向核酸的复合物可以包括与杂交到靶序列上的指导rna复合的靶向核酸的效应蛋白。本发明涉及用于控制涉及dna或rna序列靶向的基因表达的系统、方法、和组合物的工程化和优化,该序列靶向涉及靶向核酸的系统及其组分。本发明方法的一个优点在于,该crispr系统最小化或避免了脱靶结合及其所产生的副作用。这是通过使用被安排为具有针对靶dna或rna的高度序列特异性的系统而实现的。相对于靶向核酸的复合物或系统,优选地,该tracr序列具有一个或多个发夹结构,并且长度是30个或更多个核苷酸,长度是40个或更多个核苷酸,或长度是50或更多个核苷酸;该crrna序列的长度在10至30个核苷酸之间,该靶向核酸的效应蛋白是组29或组30效应蛋白。两种不同适体(每个与不同的核酸靶向指导rna相关)的使用允许使用激活物-衔接蛋白融合和阻遏物-衔接蛋白融合与不同核酸靶向rna,以激活一个dna或rna的表达,同时阻遏另一个的表达。可以在多元方法中一起或基本上一起给药它们连同其不同指导rna。可以同时使用大量的这样的经修饰的核酸靶向指导rna,例如10种或20种或30种等,同时待递送仅一种(或至少最小数目的)效应蛋白分子,因为相对较小数目的效应蛋白分子可以与大量的经修饰的指导物一起使用。衔接蛋白可以与一种或多种激活物或一种或多种阻遏物相关(优选连接至或融合至它们)。例如,衔接蛋白可以与第一激活物和第二激活物相关。该第一和第二激活物可以是相同的,但是优选地它们是不同的激活物。可以使用三种或更多种或甚至四种或更多种激活物(或阻遏物),但是包装尺寸可以将数目限制高于5个不同的功能域。在直接融合至衔接蛋白中优选使用接头,其中两个或更多个功能域与该衔接蛋白相关。适合的接头可以包括glyser接头。还可以设想的是,该核算靶向效应蛋白指导rna复合物整体上可以与两个或更多个功能域相关。例如,可以存在两个或更多个与核酸靶向效应蛋白相关的功能域,或者可以存在两个或更多个与指导rna相关的功能域(经由一种或多种衔接蛋白),或者可以存在一个或多个与该核酸靶向效应蛋白相关的功能域和一个或多个与该指导rna相关的功能域(经由一种或多种衔接蛋白)。衔接蛋白与激活物或阻遏物之间的融合可以包括接头。例如,可以使用glyser接头gggs。根据需要,它们可以按3个((ggggs)3)或6、9或甚至12个或更多个的重复使用,以提供适合的长度。接头可以用在指导rna与功能域(激活物或阻遏物)之间,或核酸靶向效应蛋白与功能域(激活物或阻遏物)之间。使用这些接头来工程化适当量的“机械柔性”。本发明涵盖包含核酸靶向效应蛋白和指导rna的靶向核酸的复合物,其中该靶向核酸的效应蛋白包含至少一个突变,使得靶向核酸的cas蛋白与不具有该至少一个突变的核酸靶向cas蛋白相比具有其不超过5%的活性,并且任选地具有至少一个或多个核定位序列;该rna指导包括能够杂交到细胞中的感兴趣的rna中的靶序列上的指导序列;并且其中:该核酸靶向效应蛋白与两个或更多个功能域相关;或者通过插入结合至一种或多种衔接蛋白的一个或多个不同rna序列来修饰该指导rna的至少一个环,并且其中该衔接蛋白与两个或更多个功能域相关;或者该核酸靶向效应蛋白与一个或多个功能域相关,并且通过插入结合至一种或多种衔接蛋白的一个或多个不同rna序列来修饰该指导rna的至少一个环,并且其中该衔接蛋白与一个或多个功能域相关。组29或组30效应蛋白复合物可以递送功能效应物不像crispr-cas介导的基因敲低,其通过在dna水平上使基因突变而永久消除表,crispr-cas敲减允许通过使用人工转录因子暂时降低基因表达。使组29或组30蛋白的一个或两个dna切割结构域中的关键残基突变导致产生无催化活性组29或组30蛋白。无催化活性组29或组30复合物与指导rna复合并且定位至由指导rna的靶向结构域指定的dna序列,然而,它不切割靶dna。无活性组29或组30蛋白与效应物结构域(例如,转录阻遏结构域)的融合能使得将效应物募集到由指导rna指定的任何dna位点。在某些实施例中,组29或组30可以融合至转录阻遏结构域并募集到基因的启动区。尤其针对基因阻遏,在此考虑到的是阻断内源转录因子的结合部位将有助于下调基因表达。在另一个实施例中,无活性组29或组30可以融合到染色质修饰蛋白上。改变染色质状态可以导致靶基因的表达降低。优化的功能性rna靶向系统因此,在一个方面,本发明提供了用于将功能组分特异性递送至rna环境的系统。这可以使用包含本发明的rna靶向效应蛋白的crispr系统(其允许将不同组分特异性靶向rna)来确保。更具体地说,这样的组分包括激活剂或阻遏物,例如rna翻译,降解等的激活剂或阻遏物。根据一个方面,本发明提供了非天然存在的或工程化的组合物,其包含含有指导序列的指导rna,所述指导序列能够与细胞中感兴趣的基因组基因座中的靶序列杂交,其中所述指导rna通过插入结合衔接蛋白的一个或多个不同的rna序列来进行修饰。在具体的实施例中,rna序列可以结合两个或更多个衔接蛋白(例如适体),并且其中每个衔接蛋白与一个或多个功能域相关。显示在此描述的至少组29酶的指导rna适于修饰指导序列。在具体的实施例中,通过插入同向重复的5’、在同向重复内、或指导序列的3’的一个或多个不同rna序列,对指导rna进行修饰。当存在多于一个功能域时,这些功能域可以是相同或不同的,例如,两个相同或两个不同的激活物或阻遏物。在一个方面,本发明提供了一种在此讨论的组合物,其中该一个或多个功能域附接至该rna靶向酶,这样使得当结合至该靶rna时,该功能域处于空间取向,从而允许该功能域在其属性功能中起作用;在一个方面,本发明提供了一种在此讨论的组合物,其中该组合物包括一种crispr-cas复合物,该复合物具有至少三个功能域,其中至少一个与该rna靶向酶相关并且其中至少两个与grna相关。在具体的实施例中,效应蛋白是来自动物溃疡伯格菌atcc43767的组29效应蛋白,并且功能域通过在最小同向重复之后插入的接头连接至指导rna。事实上,已经确定至少一些组29效应蛋白同时包含长(约87nt)和短(约36nt)的同向重复序列。因此,这暗示可以在保持功能指导的同时将非功能性序列插入短同向重复序列的3'中。因此,在一个方面,本发明提供了非天然存在的或工程化的crispr-cas复合物组合物,该组合物包括在此讨论的指导rna和crispr酶,该酶是一种rna靶向酶,其中可任选地,该rna靶向酶包括至少一个突变,这样使得该rna靶向酶具有不超过5%的不具有该至少一个突变的rna靶向酶的核酸酶活性,以及任选地一种或多种包含至少一个或多个核定位序列。在具体的实施例中,该指导rna被另外地或可替代地修饰,以便仍确保rna靶向酶的结合,但防止被rna靶向酶切割(如在本文别处所详述的)。在具体的实施例中,rna靶向酶是组29酶,与不具有至少一个突变的组29酶相比,其核酸酶活性降低至少97%或100%。在一个方面,本发明提供了一种如在此讨论的文库,其中该组29酶包括两个或更多个突变。根据动物溃疡伯格菌atcc43767组29蛋白或直向同源物中的相应位置,突变可以选自r116a,h121a,r1177a和h1182a。在具体的实施例中,提供如上文所述的包含两个或更多个功能域的rna靶向系统。在一些实施例中,该一个或多个功能域是转录阻抑物结构域。在具体的实施例中,该系统包含衔接蛋白,该衔接蛋白是包含功能域的融合蛋白,该融合蛋白在衔接蛋白与功能域之间任选地包含接头。在具体的实施例中,该接头包括glyser接头。另外地或可替代地,一个或多个功能域通过接头(任选的glyser接头)附接至rna效应蛋白。在具体的实施例中,该一个或多个功能域通过hepn结构域中的一个或两个附接到rna靶向酶。在具体的实施例中,一个或多个功能域连接到rna效应蛋白的c-末端,例如来自动物溃疡伯格菌atcc43767的组29效应蛋白的c-末端。在一个方面,本发明提供了一种在此讨论的组合物,其中该一个或多个与衔接蛋白或rna靶向酶相关的功能域是能够激活或阻遏rna翻译的结构域。在一个方面,本发明提供了一种在此讨论的组合物,其中该一个或多个与衔接蛋白相关的功能域中的至少一种具有一种或多种活性,这些活性包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、dna整合活性rna切割活性、dna切割活性或核酸结合活性、或分子开关活性或化学可诱导性或光可诱导性。设想的应用在下面详述。在一个方面,本发明提供了包含适体序列的在此讨论的组合物。在某些实施例中,该适体序列是对同一衔接蛋白具有特异性的两个或更多个适体序列。在一个方面,本发明提供了一种在此讨论的组合物,其中该适体序列是对不同衔接蛋白具有特异性的两个或更多个适体序列。在一个方面,本发明提供了一种在此讨论的组合物,其中该衔接蛋白包括ms2、pp7、qβ、f2、ga、fr、jp501、m12、r17、bz13、jp34、jp500、ku1、m11、mx1、tw18、vk、sp、fi、id2、nl95、tw19、ap205、φcb5、φcb8r、φcb12r、φcb23r、7s、prr1。因此,在具体实施例中,该适体选自一种特异性结合以上列出的任一种衔接蛋白的结合蛋白。在一个方面,本发明提供了一种在此讨论的组合物,其中该细胞是真核细胞。在一个方面,本发明提供了一种在此讨论的组合物,其中该真核细胞是哺乳动物细胞、植物细胞或酵母细胞,由此该哺乳动物细胞任选地是小鼠细胞。在一个方面,本发明提供了一种在此讨论的组合物,其中该哺乳动物细胞是人细胞。在一个方面,本发明提供了一种在此以上讨论的组合物,其中存在多于一个grna,并且这些grna靶向不同序列,由此当使用该组合物时,存在着多路复用。在一个方面,本发明提供了一种组合物,其中存在多于一个grna是通过插入结合至一种或多种衔接蛋白的一个或多个不同rna序列而进行修饰的。在一个方面,本发明提供了一种在此讨论的组合物,其中与一个或多个功能域相关的一种或多种衔接蛋白是存在的并且结合到插入到该指导rna中的不同的rna序列上。在一个方面,本发明提供了一种在此讨论的组合物,其中该指导rna被修饰成具有至少一个非编码功能环;例如,其中该至少一个非编码功能环是阻遏性的;例如,其中至少一个非编码功能环包括alu。在一个方面,本发明提供了一种方法,该方法用于修饰基因表达,包括向宿主给药或在宿主中体内表达如在此讨论的一种或多种组合物。在一个方面,本发明提供了一种在此讨论的方法,该方法包括递送该组合物或用于编码它的一种或多种核酸分子,其中所述一种或多种核酸分子被操作性地连接至一个或多个调节序列并且在体内进行表达。在一个方面,本发明提供了一种在此讨论的方法,其中经由慢病毒、腺病毒、或aav进行体内表达。在一个方面,本发明提供了一种如在此讨论的细胞的哺乳动物细胞系,其中该细胞系任选地是人细胞系或小鼠细胞系。在一个方面,本发明提供了一种转基因哺乳动物模型,任选地是小鼠,其中该模型已经用一种在此讨论的组合物进行了转化或是所述转化体的子代。在一个方面,本发明提供一种或多种核酸分子,这些核酸分子编码指导rna或rna靶向crispr-cas复合物或如在此讨论的组合物。在一个方面,本发明提供了一种载体,该载体包含:核酸分子,该核酸分子编码指导rna(grna),该指导rna包括能够杂交到细胞中感兴趣的基因组基因座中靶序列上的指导序列,其中该grna的同向重复是通过插入结合至两个或更多个衔接蛋白的一个或多个不同rna序列而进行修饰的,并且其中每种衔接蛋白与一个或多个功能域相关;或者,其中该grna被修饰成具有至少一个非编码功能环。在一个方面,本发明提供了一种或多种载体,所述载体包括一种或多种编码以下各项的核酸分子:非天然存在的或工程化的crispr-cas复合物组合物,该组合物包括在此所讨论的grna和一种rna靶向酶,其中可任选地,该rna靶向酶包括至少一个突变,这样使得该rna靶向酶具有不超过5%的不具有该至少一个突变的rna靶向酶的核酸酶活性,以及任选地一种或多种包含至少一个或多个核定位序列。在一个方面,一种载体可以进一步包括一种或多种可在一种真核细胞中操作的调控元件,所述调控元件可操作地连接到编码指导rna(grna)的核酸分子和/或编码rna靶向酶和/或任选的一个或多个核定位序列的核酸分子上。在一个方面中,本发明提供了一种试剂盒,该试剂盒包括上文所描述的一个或多个组分。在一些实施例中,该试剂盒包括一种如以上所描述的载体系统以及用于使用该试剂盒的说明书。在一个方面,本发明提供了一种筛选功能获得(gof)或功能缺失(lof)或用于筛选非编码rna或潜在调节区(例如,增强子、阻遏物)的方法,该方法包括如在此讨论的或在此讨论的含有或表达rna靶向酶的模型的细胞的细胞系,以及将如在此讨论的组合物引入该细胞系或模型的细胞中,由此该grna包括一种激活物或一种阻遏物,并且分别监测用于gof或lof,关于grna引入其中的那些细胞包括一种激活物或关于grna引入其中的那些细胞包括一种阻遏物。在一个方面,本发明提供了一种非天然存在的或工程化的组合物的文库,所述组合物各自包含:rna靶向crispr指导rna(grna),所述指导rna包含能够杂交到细胞中感兴趣的靶rna序列上的指导序列;rna靶向酶,其中该rna靶向酶包括至少一个突变,这样使得该rna靶向酶具有不超过5%的不具有该至少一个突变的rna靶向酶的核酸酶活性,其中该grna是通过插入结合至一种或多种衔接蛋白的一个或多个不同rna序列而进行修饰的,并且其中该衔接蛋白与一个或多个功能域相关,其中该组合物包括一种或多种或两种或更多种衔接蛋白,其中每种蛋白与一个或多个功能域相关,并且其中这些grna包括基因组广度文库,所述文库包括多个rna靶向指导rna(grna)。在一个方面,本发明提供了一种如在此讨论的文库,其中该rna靶向酶当与不具有至少一个突变的rna靶向酶相比时具有降低至少97%或100%的核酸酶活性。在一个方面,本发明提供了一种如在此讨论的文库,其中该衔接蛋白是包括该功能域的融合蛋白。在一个方面,本发明提供了一种如在此讨论的文库,其中该grna不是通过插入结合至一种或两种或更多种衔接蛋白的一个或多个不同rna序列而进行修饰的。在一个方面,本发明提供了一种如在此讨论的文库,其中一个或两个或更多个与rna靶向酶相关的功能域是转录激活结构域。在一个方面,本发明提供了一种如在此讨论的文库,其中该细胞群是真核细胞群。在一个方面,本发明提供了一种如在此讨论的文库,其中该真核细胞是哺乳动物细胞、植物细胞或酵母细胞。在一个方面,本发明提供了一种如在此讨论的文库,其中该哺乳动物细胞是人细胞。在一个方面,本发明提供了一种如在此讨论的文库,其中该细胞群是胚胎干(es)细胞群。在一个方面,本发明提供了一种如在此讨论的文库,其中该靶向具有约100或更多个rna序列。在一个方面,本发明提供了一种如在此讨论的文库,其中该靶向具有约1000或更多个rna序列。在一个方面,本发明提供了一种如在此讨论的文库,其中该靶向具有约20,000或更多个序列。在一个方面,本发明提供了一种如在此讨论的文库,其中该靶向具有整个转录组。在一个方面,本发明提供了一种如在此讨论的文库,其中该靶向具有一系列聚焦于相关或令人希望的途径的靶序列。在一个方面,本发明提供了一种如在此讨论的文库,其中该途径是免疫途径。在一个方面,本发明提供了一种如在此讨论的文库,其中该途径是细胞分裂途径。在一个方面中,本发明提供了产生包含具有修饰的表达的基因的模式真核细胞的方法。在一些实施例中,疾病基因是与患有或产生一种疾病的风险的增加相关的任何基因。在一些实施例中,该方法包括(a)向真核细胞中引入上文所述的系统组分的一种或多种载体,以及(b)允许crispr复合物结合到靶多核苷酸上以便修饰基因的表达,由此产生包含修饰的基因表达的模式真核细胞。在此提供的结构信息允许探询指导rna与靶rna和rna靶向酶的相互作用,从而允许工程化或改变指导rna结构,以优化整个rna靶向crispr-cas系统的功能性。例如,通过插入可结合至rna上的衔接蛋白,可以扩展指导rna,而不与rna靶向蛋白冲突。这些衔接蛋白可以进一步募集效应蛋白或融合,这些效应蛋白或融合包括一个或多个功能域。本发明的一个方面是上述元件被包含在单个组合物中或被包含在单独的组合物中。这些组合物可以有利地被应用于宿主,以在基因组水平上引出功能效应。本领域技术人员理解的是,对指导rna进行允许结合衔接子+功能域但不适当定位该衔接子+功能域(例如,由于crispr复合物三维结构的位阻)的修饰不是预期的修饰。通过引入同向重复的5’、在同向重复内、或指导序列的3’的一个或多个不同rna序列,可以对一个或多个修饰的指导rna进行修饰。修饰的指导rna、失活的靶向rna酶(具有或不具有功能域)、以及具有与一个或多个功能域的结合蛋白,可以各自单独包含在组合物中并单独地或共同地给药至宿主。可替代地,这些组分可以被提供在用于给药至宿主的单个组合物中。可以经由本领域技术人员已知的或在此描述的用于递送到宿主的病毒载体(例如慢病毒载体、腺病毒载体、aav载体)进行向宿主的给药。如本文所解释的,使用不同的选择标记(例如用于慢病毒grna选择)和grna浓度(例如取决于是否使用多种grna)对于引出改进的效果而言可以是有利的。使用所提供的组合物,本领域的普通技术人员可以有利地且特异性地靶向具有相同或不同功能域的单个或多个基因座,以引出一个或多个基因组基因座事件。这些组合物可以按多种多样的方法应用,用于在细胞中筛选文库和在体内进行功能建模(例如,lincrna的基因激活和功能鉴定;功能获得建模;功能缺失建模;使用本发明的组合物建立用于优化和筛选目的细胞系和转基因动物)。本发明包括本发明的组合物用于建立和利用条件型或诱导型crisprrna靶向事件的用途;(参见,例如,platt等人,cell[细胞](2014),http://dx.doi.org/10.1016/j.cell.2014.09.014,或本文引用的pct专利公开,如wo2014/093622(pct/us2013/074667),其被认为不是先于本发明或申请)。例如,靶细胞有条件性地或诱导性地包括rna靶向crispr酶(例如,以cre依赖性构建体的形式)和/或有条件性地或诱导性地包括衔接蛋白并且,在表达被引入进靶细胞中的载体时,该载体表达的是诱导或产生在靶细胞中rna靶向酶表达和/或衔接体表达的条件。通过应用本发明的传授和组合物与产生crispr复合物的已知方法,受功能域影响的诱导型基因表达也是本发明的一个方面。可替代地,衔接蛋白可以作为条件型或诱导型元件与条件型或诱导型rna靶向酶一起提供,以便提供用于筛选目的有效模型,这有利地对于大量应用仅需要最小限度的设计和特异grna给药。在一个实施例中,指导rna分子可以被靶向至已知的转录应答元件(例如,启动子、增强子等)、已知的上游激活序列、和/或疑似能够控制靶dna表达、具有未知或已知功能的序列。在一些方法中,可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如,当crispr复合物结合到细胞中的一个靶序列上时,该靶多核苷酸失活,这样使得该序列不被转录,该编码蛋白不被产生,或者该序列不会像野生型序列一样起作用。例如,可以使蛋白或微小rna编码序列失活,这样使得该蛋白不被产生。这个系统的应用的其他实例在本文其他地方描述。根据本发明的包含死亡指导序列的指导rna在一个方面中,本发明提供了按以下方式修饰的指导序列,该方式允许形成crispr复合物并且成功地结合至靶标,但同时不允许成功的核酸酶活性(即没有核酸酶活性/没有indel活性)。出于解释的原因,这样的经修饰的指导物被称为“死亡指导物”或“死亡指导物”。就核酸酶活性而言,这些死亡指导物或死亡指导物可以被认为是无催化活性的或无构象活性的。类似地,就促进催化活性的能力或区分中靶和脱靶结合活性的能力而言,死亡指导序列并不可以足够地参与富有成效的碱基配对。简言之,该测定涉及合成crispr靶rna和包含与靶rna错配的指导rna,将这些rna与rna靶向酶组合,并基于通过切割产物产生的条带的存在而在凝胶上进行分析,并基于相对带强度定量切割。因此,在一个相关方面,本发明提供了非天然存在的或工程化的组合物rna靶向crispr-cas系统,该系统包含如本文描述的功能性rna靶向、和指导rna(grna),其中该grna包含死亡指导序列,由此该grna能够杂交到靶序列上,这样使得该rna靶向crispr-cas系统被引导至细胞中的感兴趣基因组基因座,而没有该系统的非突变型rna靶向酶的可检测的rna切割活性。应理解的是,如在本文的其他地方描述的根据本发明的任何grna都可以用作死亡grna/包含如在下文描述的死亡指导序列的grna。如在本文的其他地方描述的任何方法、产品、组合物和用途都同样地适用于如下文进一步详述的死亡grna/包含如在下文描述的死亡指导序列的grna。通过进一步指导的方式,提供了以下具体方面和实施例。可以通过任何适合的测定法来评估死亡指导序列引导crispr复合物与rna靶序列的序列特异性结合的能力。例如,足以形成crispr复合物的crispr系统的组分(包括有待测试的死亡指导序列)可以例如通过用编码该crispr序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后评估在该靶序列之内的优先切割。例如,通过提供靶序列、crispr复合物的组分(包括有待测试的死亡指导序列)和不同于该测试死亡指导序列的对照指导序列,并且比较在该测试指导序列与对照指导序列反应之间的靶序列处的结合或切割率,可以在试管中评估靶rna多核苷酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。死亡指导序列可以被选择为靶向任何靶序列。在一些实施例中,该靶序列是在细胞的基因组内的序列。如本文进一步解释的,若干结构参数允许适当的框架到达这样的死亡指导物处。死亡指导序列典型地短于对应的指导序列,这导致活跃的rna切割。在具体的实施例中,死亡指导比针对其的相应指导短5%、10%、20%、30%、40%、50%。如下文解释的并且本领域已知的,grna-rna靶向特异性的一个方面是同向重复序列,它有待被适当地连接至这样的指导物。具体而言,这意味着该同向重复序列的设计取决于rna靶向酶的来源。因此,可用于经验证的死亡指导序列的结构数据可以用于设计组29特异性等效物。例如两个或更多个组29效应蛋白的直向同源核酸酶结构域hepn之间的结构相似性可以用于迁移设计等效死亡指导物。因此,可以在长度和序列上对本文的死亡指导物进行适当修饰,以反映这样的组29特异性等效物,从而允许形成crispr复合物并且成功地结合至靶rna,而同时不允许成功的核酸酶活性。死亡指导物在本文以及现有技术背景下的使用为体外、离体和体内应用两者中的网络生物学和/或系统生物学提供了令人惊讶且出乎意料的平台,从而允许多元基因靶向,并且特别是双向多元基因靶向。在死亡指导物的使用之前,处理多个靶标一直具有挑战性并且在一些情况下是不可能的。通过使用死亡指导物,可以例如在同一细胞中、在同一动物体内、或在同一患者体内处理多个靶标,并且因此处理多种活性。这种多元化可以同时发生或交错发生持续希望的时间段。例如,死亡指导物允许使用grna作为基因靶向工具,而不是核酸酶活性的结果,并且同时提供激活或阻遏的引导工具。包含死亡指导物的指导rna可以按一定方式被修饰为进一步包括以下元件,这些元件允许激活或阻遏基因活性,特别是如在本文的其他地方描述的允许功能性放置基因效应物(例如基因活性的激活物或阻遏物)的蛋白衔接体(例如适体)。一个实例是掺入适体,如在本文和在现有技术中所解释的。通过工程化包含死亡指导物的grna以掺入蛋白相互作用适体(konermann等人,“genome-scaletranscriptionactivationbyanengineeredcrispr-cas9complex[通过crispr-cas9复合物进行的基因组范围内的转录激活]”doi:10.1038/nature14136,通过引用并入本文),可以组装多个不同的效应结构域。在天然过程之后可以将其模式化。因此,一个方面是本发明的grna,该grna包含死亡指导物,其中该grna进一步包括修饰,这些修饰提供基因激活或阻遏,如本文所描述的。该死亡grna可以包含一种或多种适体。这些适体对于基因效应物、基因激活物或基因阻遏物而言可以是特异性的。可替代地,这些适体对于蛋白而言可以是特异性的,该蛋白转而对特异性基因效应物、基因激活物或基因阻遏物而言是特异性的并且募集/结合特异性基因效应物、基因激活物或基因阻遏物。如果存在多个激活物或阻遏物募集位点,优选的是这些位点对于激活物或阻遏物而言是特异性的。如果存在多个激活物或阻遏物结合位点,这些位点对于相同的激活物或相同的阻遏物而言可以是特异性的。这些位点对于不同激活物或不同阻遏物而言也可以是特异性的。基因效应物、基因激活物、基因阻遏物可以按融合蛋白的形式存在。在一个方面,本发明提供了选择用于将功能化的crispr系统引导至生物内的基因座的死亡指导rna靶向序列的方法,该方法包括:a)在该基因座中定位一个或多个crispr基序;b)分析每个crispr基序下游的20nt序列,通过:i)确定该序列的gc含量;并且ii)确定在该生物的基因组中是否存在该序列的前15nt的脱靶匹配;c)如果该序列的gc含量是70%或更低并且没有鉴定到脱靶匹配,则选择该序列用于在指导rna中使用。在一个实施例中,如果gc含量是50%或更低,则选择该序列。在一个实施例中,如果gc含量是40%或更低,则选择该序列。在一个实施例中,如果gc含量是30%或更低,则选择该序列。在一个实施例中,对两个或更多个序列加以分析,并且选择具有最低gc含量的序列。在一个实施例中,在该生物的调节序列中确定脱靶匹配。在一个实施例中,该基因座是调节区。一个方面提供了死亡指导rna,其包含根据上述方法所选择的靶向序列。在一个方面,本发明提供了用于将功能化的crispr系统靶向生物内的基因座的死亡指导rna。在本发明的一个实施例中,该死亡指导rna包含靶向序列,其中该靶序列的cg含量是70%或更低,并且该靶向序列的前15nt与该生物内的另一个基因座的调节序列中的crispr基序下游的脱靶序列不匹配。在某些实施例中,该靶向序列的gc含量是60%或更低、55%或更低、50%或更低、45%或更低、40%或更低、35%或更低或30%或更低。在某些实施例中,该靶向序列的gc含量是从70%至60%或从60%至50%或从50%至40%或从40%至30%。在一个实施例中,该靶向序列在该基因座的潜在靶向序列之中具有最低的cg含量。在本发明的一个实施例中,该死亡指导物的前15nt与该靶序列匹配。在另一个实施例中,该死亡指导物的前14nt与该靶序列匹配。在另一个实施例中,该死亡指导物的前13nt与该靶序列匹配。在另一个实施例中,该死亡指导物的前12nt与该靶序列匹配。在另一个实施例中,该死亡指导物的前11nt与该靶序列匹配。在另一个实施例中,该死亡指导物的前10nt与该靶序列匹配。在本发明的一个实施例中,该死亡指导物的前15nt与另一个基因座的调节区中的crispr基序下游的脱靶序列不匹配。在其他实施例中,该死亡指导物的前14nt或前13nt、或该指导物的前12nt、或该死亡指导物的前11nt、或该死亡指导物的前10nt与另一个基因座的调节区中的crispr基序下游的脱靶序列不匹配。在其他实施例中,该死亡指导物的前15nt、或14nt、或13nt、或12nt、或11nt与该基因组中的crispr基序下游的脱靶序列不匹配。在某些实施例中,该死亡指导rna在3'-端包括与靶序列不匹配的另外的核苷酸。因此,包括crispr基序下游的前36nt的死亡指导rna在3'端的长度可以延长。组29或组30效应蛋白复合物或其组分的递送根据本披露和本领域的知识,可以通过在本文一般性地和详细地描述的递送系统来递送tale、crispr-cas系统或其组分或其核酸分子(包括,例如hdr模板)或编码或提供其组分的核酸分子。载体递送,例如质粒、病毒递送:该crispr酶和/或本发明的任何rna,例如指导rna,可以使用任何适合载体,例如,质粒或病毒载体,如腺相关病毒(aav)、慢病毒、腺病毒或其他病毒载体类型、或其组合进行递送。效应蛋白以及一种或多种指导rna可以被包装到一种或多种载体(例如,质粒或病毒载体)中。在一些实施例中,病毒(例如,质粒或病毒载体)可以例如通过肌肉注射递送到感兴趣的组织中,而有时经由静脉内、经皮、鼻内、经口、粘膜、或其他递送方法进行递送。这样的递送可以经由单剂量或多剂量来进行。本领域技术人员理解的是,本文有待递送的实际剂量可以在很大程度上取决于多种因素而变化,如载体选择、靶细胞、生物、或组织、有待治疗的受试者的一般状况、所寻求的转化/修饰的程度、给药途径、给药方式、所寻求的转化/修饰的类型,等等。这样的剂量可以进一步含有,例如,载体(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油,等等)、稀释剂、药学上可接受的载体(例如,磷酸盐缓冲盐水)、药学上可接受的赋形剂、和/或本领域已知的其他化合物。该剂型可以进一步含有一种或多种药学上可接受的盐,例如像,无机酸盐如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐、等等;以及有机酸盐,如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等等。另外,在本文也可以存在辅助物质,如润湿剂或乳化剂、ph缓冲物质、凝胶或胶凝材料、调味剂、着色剂、微球体、聚合物、悬浮剂等等。另外,也可以存在一种或多种其他常规药用成分,如防腐剂、保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结剂、填充剂、螯合剂、包衣剂、化学稳定剂等等,尤其是该剂型是可复原形式时。适合的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨酯80、苯乙醇、三氯叔丁醇、山梨酸钾、抗坏血酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯酚、明胶、白蛋白和它们的组合。药学上可接受的赋形剂的彻底论述可获自remington'spharmaceuticalsciences[雷明顿药物科学](马克出版公司(mackpub.co.),新泽西州1991),其通过引用并入本文。在在此的一个实施例中,递送是经由腺病毒进行的,其可以是含有至少1×105个腺病毒载体粒子(也称为粒子单位,pu)的单次加强剂量。在在此的一个实施例中,该剂量优选地是该腺病毒载体的至少约1x106个粒子(例如,约1x106-1x1012个粒子),更优选至少约1x107个粒子,更优选至少约1x108个粒子(例如,约1x108-1x1011个粒子或约1x108-1x1012个粒子),并且最优选至少约1x100个粒子(例如,约1x109-1x1010个粒子或约1x109-1x1012个粒子),或者甚至至少约1x1010个粒子(例如,约1x1010-1x1012个粒子)。可替代地,该剂量包含不多于约1x1014个粒子,优选不多于约1x1013个粒子,甚至更优选不多于约1x1012个粒子,甚至更优选不多于约1x1011个粒子,并且最优选不多于约1x1010个粒子(例如,不多于约1x109个粒子)。因此,该剂量可以含有单剂量的腺病毒载体,其具有例如,约1x106粒子单位(pu),约2x106pu、约4x106pu、约1x107pu、约2x107pu、约4x107pu、约1x108pu、约2x108pu、约4x108pu、约1x109pu、约2x109pu、约4x109pu、约1x1010pu、约2x1010pu、约4x1010pu、约1x1011pu、约2x1011pu、约4x1011pu、约1x1012pu、约2x1012pu、或约4x1012pu的腺病毒载体。参见例如,在2013年6月4日授权的授予纳贝尔(nabel)等人的美国专利号8,454,972b2中的腺病毒载体(通过引用并入本文)以及在其第29栏第36-58行的剂型。在本文的一个实施例中,该腺病毒是经由多剂量递送的。在本文的一个实施例中,该递送是经由aav进行的。用于针对人类的aav的体内递送的治疗有效剂量被认为处于含有从约1x1010到约1x1010个功能aav/ml溶液的从约20到约50ml的盐水溶液的范围内。该剂量可以调整以便使治疗益处相对于任何副作用的平衡。在在此的一个实施例中,aav剂量大致处于从约1x105到1x1050个基因组aav、从约1x108到1x1020个基因组aav、从约1x1010到约1x1016个基因组、或约1x1011到约1x1016个基因组aav的浓度范围内。人类剂量可以是约1x1013个基因组aav。这样的浓度能以从约0.001ml到约100ml、约0.05到约50ml、或约10到约25ml的载体溶液进行递送。通过建立剂量反应曲线的常规试验,本领域普通技术人员可以容易地确立其他有效剂量。参见,例如,2013年3月26日授权的哈加(hajjar)等人的美国专利号8,404,658b2,在第27栏第45-60行。在在此的一个实施例中,该递送是经由质粒进行的。在这样的质粒组合物中,该剂量应当是足以引出反应的质粒的量。例如,对于70kg的个体而言,在质粒组合物中的质粒dna的适当量可以是从约0.1到约2mg,或从约1μg到约10μg。本发明的质粒一般将包括(i)启动子;(ii)编码核酸靶向crispr酶的序列,任选连接到所述启动子上;(iii)选择标记;(iv)复制起点;和(v)(ii)的下游的并且可操作连接到其上的转录终止子。该质粒还可以编码crispr复合物的rna组分,但是这些中的一种或多种相反可以被编码到不同载体上。在此的剂量是基于平均70kg的个体。给药频率在医学或兽医学从业者(例如医师、兽医师)或本领域熟练的科学家的范围之内。还应注意,在实验中所使用的小鼠典型地是约20g,并且从小鼠实验,一只小鼠可以扩展到70kg个体。在一些实施例中,本发明的rna分子在脂质体或阳离子脂质体配制品等等中进行递送并且可以通过本领域技术人员熟知的方法进行制备。此类方法描述于,例如,美国专利号5,593,972、5,589,466和5,580,859中,将其通过引用并入本文。已经开发了专门针对增强和改进递送sirna到哺乳动物细胞中的递送系统,(参见例如,shen等人febslet.[欧洲生化学会联合会快报]2003,539:111-114;xia等人.,nat.biotech.[自然生物技术]2002,20:1006-1010;reich等人.,mol.vision.[分子视界]2003,9:210-216;sorensen等人,j.mol.biol.[分子生物学杂志]2003,327:761-766;lewis等人,nat.gen.[自然遗传学]2002,32:107-108和simeoni等人,nar2003,31,11:2717-2724)并且也可以应用于本发明。最近,sirna已经成功用于抑制灵长动物中的基因表达(参见例如tolentino等人,retina[视网膜]24(4):660,它也可应用于本发明。实际上,rna递送是有用的体内递送方法。有可能使用脂质体或粒子将核酸靶向cas蛋白和指导rna(以及例如,hr修复模板)递送到细胞中。因此,核酸靶向cas蛋白/crispr酶如cascas9的递送和/或本发明的指导rna的递送可以处于rna的形式并且经由微泡、脂质体或粒子来进行。例如,casmrna和指导rna可以被包装到脂质体粒子中用于体内递送。脂质体转染试剂例如来自生命技术公司(lifetechnologies)的lipofectamine以及市售的其他试剂可以有效地将rna分子递送到肝脏中。rna的递送手段还优选包括经由粒子的rna递送(cho,s.,goldberg,m.,son,s.,xu,q.,yang,f.,mei,y.,bogatyrev,s.,langer,r.和anderson,d.,lipid-likenanoparticlesforsmallinterferingrnadeliverytoendothelialcells[用于将小干扰rna递送到内皮细胞的脂质样纳米粒子],advancedfunctionalmaterials[先进功能材料],19:3112-3118,2010)或外来体(schroeder,a.,levins,c.,cortez,c.,langer,r.,和anderson,d.,lipid-basednanotherapeuticsforsirnadelivery[用于sirna递送的基于脂质的纳米治疗剂],journalofinternalmedicine[内科学杂志],267:9-21,2010,pmid:20059641)。事实上,已经表明外来体在递送sirna中特别有用,其为与rna靶向系统有一些相似之处的系统。例如,el-andaloussi等人(“exosome-mediateddeliveryofsirnainvitroandinvivo[外泌体诱导的体外和体内sirna递送]”,natprotoc[自然-实验手册].2012年12月;7(12):2112-26.doi:10.1038/nprot.2012.131.电子版2012年11月15日描述了外来体对于跨不同的生物屏障的药物递送是有希望的工具并且可以用于体外和体内递送sirna。其途径在于通过转染包含与肽配体融合的外来体蛋白的表达载体产生靶向外来体。然后将这些外来体纯化并且从转染的细胞上清液中表征,然后将rna加载到外来体中。根据本发明的递送或给药可以用外来体进行,尤其是但不限于脑。维生素e(α-生育酚)可以与核酸-靶向cas蛋白结合并且连同高密度脂蛋白(hdl)一起递送到脑,例如以与uno等人完成的用于将短干扰rna(sirna)递送到脑的类似方式(humangenetherapy[人类基因治疗]22:711-719(2011年6))。经由用磷酸盐缓冲盐水(pbs)或游离tocsibace或toc-sibace/hdl充满的并且与脑灌注试剂盒3(braininfusionkit3)(alzet公司)连接的微渗透压泵(型号1007d;alzet公司,库比蒂诺(cupertino),ca)灌注小鼠。将一根脑灌注导管置于在正中线的前囱的后方约0.5mm,用于灌注到背侧第三脑室中。乌诺(uno)等人发现,通过相同的icv灌注方法,少至3nmol的toc-sirna与hdl可诱导相当程度的靶减少。可以考虑结合至α-生育酚的并且与hdl共同给药靶向脑的相似剂量的核酸靶向效应蛋白用于本发明,例如,可以考虑靶向脑的约3nmol到约3μmol的核酸靶向效应蛋白。zou等人(humangenetherapy[人类基因治疗]22:465-475(2011年4月))描述了靶向pkcγ的短发夹rna的慢病毒介导的递送方法,其用于在大鼠脊髓中的体内基因沉默。zou等人通过鞘内导管给药约10μl的具有1x109个转导单位(tu)/ml的滴度的重组慢病毒。在本发明中可以考虑相似剂量的在靶向脑的慢病毒载体中表达的核酸靶向效应蛋白用于人类,例如,可以考虑靶向脑的在具有1x109个转导单位(tu)/ml的滴度的慢病毒中的约10-50ml的核酸靶向效应蛋白。就局部递送到脑而言,这可以通过不同方式来实现。例如,材料可以例如通过注射递送到纹状体内。注射可以经由穿颅术立体定向地进行。通用包装和启动子将编码核酸分子(例如dna)的核酸靶向效应蛋白(例如组29或组30蛋白)包装到载体(例如病毒载体)以介导体内基因组修饰的方法包括:实现rna切割(并因此敲低):单病毒载体:含有两个或更多个表达盒的载体:启动子-核酸靶向效应蛋白编码核酸分子-终止子启动子-指导rna1-终止子启动子-grna(n)-终止子(一直到载体的尺寸限制)双病毒载体:含有一个用于驱动核酸靶向效应蛋白(如组29或组30)的表达盒的载体1启动子-核酸靶向效应蛋白编码核酸分子-终止子含有一个或多个用于驱动一个或多个指导rna表达的表达盒的载体2启动子-指导rna1-终止子启动子-指导rna1(n)-终止子(一直到载体的尺寸限制)用来驱动核酸靶向效应蛋白编码核酸分子表达的启动子可以包括:aavitr可以用作启动子:这对于消除另外的启动子元件(可在载体中占用空间)的需要是有利的。空出来的另外的空间可以用来驱动另外的元件的表达(grna,等等)。同样,itr活性是较弱的,因此可以用来降低由于核酸靶向效应蛋白的过表达所致的潜在毒性。对于遍存表达,可以使用启动子:cmv、cag、cbh、pgk、sv40、铁蛋白重链或轻链,等等。对于脑表达或其他cns表达,可以使用启动子:用于所有神经元的突触蛋白i、用于兴奋性神经元的camkiiα、用于gaba能神经元的gad67或gad65或vgat,等等。对于肝脏表达,可以使用白蛋白启动子。对于肺表达,可以使用sp-b。对于内皮细胞,可以使用icam。对于造血细胞,可以使用ifnβ或cd45。对于成骨细胞,可以使用og-2。用来驱动指导rna的启动子可以包括:poliii启动子,如u6或h1使用polii启动子和内含子盒来表达指导rna腺相关病毒(aav)核酸靶向效应蛋白(例如组29或组30效应蛋白)以及一种或多种指导rna可以使用腺相关病毒(aav)、慢病毒、腺病毒或其他质粒或病毒载体类型进行递送,尤其是,使用来自以下文献的配方和剂量:例如,美国专利号8,454,972(针对腺病毒的配方、剂量)、8,404,658(针对aav的配方、剂量)和5,846,946(针对dna质粒的配方、剂量)以及来自临床试验和关于涉及慢病毒、aav、和腺病毒的临床试验的出版物。例如,对于aav,给药途径、配方和剂量可以如美国专利号8,454,972并且如涉及aav的临床试验。对于腺病毒,给药途径、配方和剂量可以如美国专利号8,404,658并且如涉及腺病毒的临床试验。对于质粒递送,给药途径、配方和剂量可以如美国专利号5,846,946并且如涉及质粒的临床试验。剂量可以基于或推断为平均70kg的个体(例如,男性成人),并且可以针对患者、受试者、不同重量和物种的哺乳动物进行调整。给药频率在医学或兽医学从业者(例如,医师、兽医师)的范围之内,其取决于常规因素,包括患者或受试者的年龄、性别、一般健康状况、其他状况以及着手解决的特殊状况或症状。可以将病毒载体注射到感兴趣的组织中。对于细胞类型特异性基因组修饰,核酸靶向效应蛋白(如组29或组30效应蛋白)的表达可以由细胞类型特异性启动子驱动。例如,肝脏特异性表达可以使用白蛋白启动子,而神经元特异性表达(例如,用于靶向cns障碍)可以使用突触蛋白i启动子。就体内递送而言,aav相比于其他病毒载体是有利的,这是由于两个原因:·低毒性(这可以是由于纯化方法不需要细胞粒子的超速离心所致,而超速离心可能激活免疫反应)并且·引起插入诱变的低概率,原因在于它未整合到宿主基因组中。aav具有4.5或4.75kb的包装限制。这意味着核酸靶向效应蛋白(如组29或组30效应蛋白)以及启动子和转录终止子必须全部适合相同的病毒载体。因此,本发明的实施例包括利用较短的核酸靶向效应蛋白(例如组29或组30效应蛋白)的同系物。关于aav,aav可以是aav1、aav2、aav5或其任何组合。可以选择相对于有待被靶向的细胞的aav的aav;例如,可以选择用于靶向脑或神经元细胞的aav血清型1、2、5或杂合衣壳aav1、aav2、aav5或其任何组合;并且可以选择用于靶向心脏组织的aav4。aav8可用于递送到肝脏。在此的启动子和载体是单独优选的。就这些细胞而论(参见,grimm,d.等人,j.virol.[病毒学杂志]82:5887-5911(2008)),某些aav血清型的列表如下:细胞系aav-1aav-2aav-3aav-4aav-5aav-6aav-8aav-9huh-7131002.50.00.1100.70.0hek293251002.50.10.150.70.1海拉(hela)31002.00.16.710.20.1hepg2310016.70.31.750.3ndhep1a201000.21.00.110.20.091117100110.20.1170.1ndcho100100141.433350101.0cos33100333.35.0142.00.5mewo10100200.36.7101.00.2nih3t3101002.92.90.3100.3nda5491410020nd0.5100.50.1ht118020100100.10.3330.50.1单核细胞1111100ndnd1251429ndnd未成熟dc2500100ndnd2222857ndnd成熟dc2222100ndnd3333333ndnd慢病毒慢病毒是复杂的反转录病毒,其具有在有丝分裂细胞和有丝分裂后细胞两者中感染并表达其基因的能力。最为人熟知的慢病毒是人类免疫缺陷病毒(hiv),其利其他病毒的包膜糖蛋白来靶向广泛范围的细胞类型。慢病毒可以制备如下。在克隆pcases10(含有慢病毒转移质粒骨架)之后,将处于低传代数(p=5)的hek293ft接种在t-75烧瓶中,直到在转染之前的一天在具有10%胎牛血清而没有抗生素的dmem中50%汇合。在20小时之后,培养基更换为optimem(无血清)培养基,并且在4小时后进行转染。细胞用10μg的慢病毒转移质粒(pcases10)和下列包装质粒转染:5μg的pmd2.g(vsv-g假型)、和7.5μg的pspax2(gag/pol/rev/tat)。在具有阳离子脂质递送剂(50μl的lipofectamine2000和100μl的plus试剂)的4mloptimem中进行转染。在6小时之后,培养基更换为具有10%胎牛血清的无抗生素的dmem。这些方法在细胞培养过程中使用血清,但是不含血清的方法是优选的。慢病毒可以如下纯化。在48小时后收获病毒上清液。首先清除上清液的碎片并通过0.45μm的低蛋白结合(pvdf)滤膜进行过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀重新悬浮在50μl的dmem中在4℃过夜。然后将它们等分,并且立即在-80℃冷冻。在另一个实施例中,还考虑了基于马传染性贫血病毒(eiav)的最小非灵长类慢病毒载体,尤其是对于眼基因治疗而言(参见例如,balagaan,jgenemed2006[基因医学杂志];8:275-285)。在另一个实施例中,还考虑了一种经由视网膜下注射用于治疗湿型的年龄相关性黄斑变性的、表达血管生成抑制蛋白(内皮抑素和血管抑素)的基于马传染性贫血病毒的慢病毒基因治疗载体(参见,例如,binley等人,humangenetherapy[人类基因治疗]23:980-991(2012年9月)),并且这种载体可以经修饰用于本发明的核酸-靶向系统。在另一个实施例中,自我失活性慢病毒载体可以用于和/或适合于本发明的核酸靶向系统,该自我失活性慢病毒载体具有靶向由hivtat/rev共享的共有外显子的sirna、核仁定位tar诱饵、和抗ccr5特异性锤头状核酶(参见,例如,digiusto等人(2010)scitranslmed[科学转化医学]2:36ra43)。可以收集最少2.5×106个cd34+细胞/每千克患者体重,并且以2×106个细胞/ml的密度在x-vivo15培养基中(龙沙公司(lonza))预刺激16到20个小时,该培养基含有2μmol/l-谷氨酰胺、干细胞因子(100ng/ml)、flt-3配体(flt-3l)(100ng/ml)、和促血小板生成素(10ng/ml)(cellgenix公司)。可以用慢病毒以感染复数5在75-cm2的包被有纤连蛋白(25mg/cm2)(重组人纤维蛋白片段(retronectin),宝生物工程株式会社(takarabioinc.))的组织培养瓶中转导预刺激的细胞16到24小时。慢病毒载体还披露于帕金森病的治疗中,参见,例如,美国专利公开号20120295960以及美国专利号7303910和7351585。慢病毒载体还已经披露于眼病的治疗中,参见,例如,美国专利公开号20060281180、20090007284、us20110117189;us20090017543;us20070054961、us20100317109。慢病毒载体还已经披露于递送到脑中,参见,例如,美国专利公开号us20110293571;us20110293571、us20040013648、us20070025970、us20090111106和美国专利号us7259015。rna递送rna递送:核酸靶向cas蛋白和/或指导rna也可以以rna的形式递送。使用体外转录可以产生核酸靶向cas蛋白(例如组29或组30效应蛋白)mrna。例如,可以使用含有以下元件的pcr盒合成核酸靶向效应蛋白(例如组29或组30效应蛋白)mrna:来自β的t7启动子-kozak序列(gccacc)-效应蛋白-3'utr珠蛋白聚腺苷酸尾巴(120个或更多腺嘌呤)。该盒可以用于经由t7聚合酶的转录。也可以使用体外转录从含有t7_启动子-gg-指导rna序列的盒来转录指导rna。为了增强表达并且降低可能的毒性,可以,例如,使用假-u或5-甲基-c修饰该核酸靶向效应蛋白-编码序列和/或指导rna,以包括一个或多个经修饰的核苷。mrna递送方法用于当前的肝脏递送是特别有希望的。关于rna递送的很多临床工作已经集中于rnai或反义上,但是这些系统可以适用于递送rna用于实现本发明。应当相应地阅读以下关于rnai等的参考文献。粒子递送系统和/或配制品:已知一些类型的粒子递送系统和/或配制品在不同种类的生物医学应用中是有用的。总体上,粒子被定义为小物体,该物体在其运输和特性方面以整体单元表现。根据直径将粒子进一步分类。粗粒子涵盖在2,500与10,000纳米之间的范围。细粒子的尺寸在100与2,500纳米之间。超细粒子、或粒子的尺寸通常是在1和100纳米之间。100-nm极限的基础是以下事实:使粒子区分于大块材料的新颖特性典型地是在100nm之下的临界长度规模下显现的。如在此使用的,粒子递送系统/配制品被定义为任何包括根据本发明的粒子的生物学递送系统/配制品。根据本发明的粒子是任何具有小于100微米(μm)的最大尺寸(例如直径)的实体。在一些实施例中,本发明的粒子具有小于10μm的最大尺寸。在一些实施例中,本发明的粒子具有小于2000纳米(nm)的最大尺寸。在一些实施例中,本发明的粒子具有小于1000纳米(nm)的最大尺寸。在一些实施例中,本发明的粒子具有小于900nm、800nm、700nm、600nm、500nm、400nm、300nm、200nm、或100nm的最大尺寸。典型地,本发明的粒子具有500nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有250nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有200nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有150nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有100nm或更小的最大尺寸(例如,直径)。在本发明的一些实施例中使用更小的粒子(例如,具有50nm或更小的最大尺寸)。在一些实施例中,本发明的粒子具有范围在25nm与200nm之间的最大尺寸。粒子表征(包括,例如表征形态、尺寸、等)是使用各种不同的技术进行的。通用技术是电子显微术(tem、sem)、原子力显微镜(afm)、动态光散射(dls)、x-射线光电子光谱法(xps)、粉末x射线衍射(xrd)、傅里叶变换红外光谱法(ftir)、基质辅助激光解吸/电离飞行时间质谱法(maldi-tof)、紫外-可见光谱法、双偏振干涉法以及核磁共振(nmr)。表征(尺寸测量)可以针对天然粒子(即预加载)或在加载负荷物(在此负荷物指代例如crispr-cas系统的一种或多种组分,例如crispr酶或mrna或指导rna、或其任何组合,并且可以包括另外的载体和/或赋形剂)后进行,以提供具有最适尺寸的粒子以用于任何本发明的体外、离体和/或体内施用的递送。在某些优选实施例中,粒子尺寸(例如,直径)表征是基于使用动态激光散射(dls)的测量。提及的是美国专利号8,709,843;美国专利号6,007,845;美国专利号5,855,913;美国专利号5,985,309;美国专利号5,543,158;以及jamese.dahlman和carmenbarnes等人在naturenanotechnology[自然纳米技术](2014)的公开物,在线公开于2014年5月11日,doi:10.1038/nnano.2014.84,以上文献涉及粒子、制造和使用它们的方法及其测量。在本发明的范围内的粒子递送系统可以按任何形式提供,包括但不限于固体、半固体、乳液、或胶体粒子。这样可以将在此描述的任何递送系统,包括但不限于例如基于脂质的系统、脂质体、胶束、微泡、外来体、或基因枪,提供为在本发明的范围内的粒子递送系统。粒子可以使用粒子或脂质包膜同时递送crispr酶mrna和指导rna;例如,可以经由粒子递送本发明的crispr酶和rna(例如,作为复合物),如在dahlman等人,wo2015089419a2和其中引用的文献中的,如7c1(参见例如,jamese.dahlman和carmenbarnes等人naturenanotechnology[自然纳米技术](2014)在线公开于2014年5月11日,doi:10.1038/nnano.2014.84),例如,包含脂质或类脂质和亲水聚合物(例如阳离子脂质和亲水聚合物)的递送粒子,例如其中该阳离子脂质包括1,2-二油酰基-3-三甲基铵-丙烷(dotap)或1,2-二十四酰基-sn-甘油-3-磷酸胆碱(dmpc)和/或其中该亲水聚合物包括乙二醇或聚乙二醇(peg);和/或其中该粒子进一步包含胆固醇(例如,来自以下项的粒子:配制品1=dotap100、dmpc0、peg0、胆固醇0;配制品编号2=dotap90、dmpc0、peg10、胆固醇0;配制品编号3=dotap90、dmpc0、peg5、胆固醇5),其中使用有效的多步方法形成粒子,其中第一步,将效应蛋白和rna例如在无菌、不含核酸酶的1xpbs中例如在室温下以例如1:1的摩尔比在一起混合例如30分钟;并且分开地,将如适用于该配制品的dotap、dmpc、peg、和胆固醇溶解于醇(例如,100%乙醇)中;并且,将这两种溶液混合在一起以形成含有这些复合物的粒子)。核酸靶向效应蛋白(如组29或30效应蛋白)mrna和指导rna可以使用粒子或脂质包膜同时递送。例如,sux,frickej,kavanaghdg,irvinedj(“invitroandinvivomrnadeliveryusinglipid-envelopedph-responsivepolymernanoparticles[使用脂质包封的ph响应性聚合物纳米粒子的体外和体内mrna递送]”molpharm.[分子药理学],2011年6月6日;8(3):774-87.doi:10.1021/mp100390w.2011年4月1日电子版)描述了生物可降解的核-壳结构粒子,其具有由磷脂双层壳包封的聚(β-氨基酯)(pbae)核。这些被开发为用于体内mrna递送。该ph响应性pbae被选择为促进内体破裂,而该脂质表面层被选择为将聚阳离子核的毒性最小化。因此,这些对于递送本发明的rna是优选的。在一个实施例中,考虑了基于自组装生物粘附聚合物的粒子,其可应用于肽的经口递送、肽的静脉内递送以及肽的鼻递送,均递送到脑。其他实施例,还考虑了例如疏水性药物的经口吸收和眼部递送。分子包膜技术涉及被保护并递送到疾病部位的工程化聚合物包膜(参见例如,mazza,m.等人,acsnano[acs纳米],2013.7(2):1016-1026;siew,a.等人molpharm[分子药理学],2012.9(1):14-28;lalatsa,a.等人jcontrrel[控释杂志],2012.161(2):523-36;lalatsa,a.等人,molpharm[分子药理学],2012.9(6):1665-80;lalatsa,a.等人molpharm[分子药理学],2012.9(6):1764-74;garrett,n.l.等人jbiophotonics[生物光电杂志],2012.5(5-6):458-68;garrett,n.l.等人jramanspect[拉曼光谱杂志],2012.43(5):681-688;ahmad,s.等人jroyalsocinterface[皇家学会界面杂志]2010.7:s423-33;uchegbu,i.f.expertopindrugdeliv[药物递送专家评论],2006.3(5):629-40;qu,x.等人biomacromolecules[生物大分子],2006.7(12):3452-9,以及uchegbu,i.f.等人intjpharm[国际药学杂志],2001.224:185-199)。考虑了约5mg/kg的剂量,呈单剂量或多剂量形式,这取决于靶组织。在一个实施例中,可以使用由丹·安德森实验室(dananderson’slab)在mit开发的可将rna递送到癌细胞以便使肿瘤生长停止的粒子/并且或使其适用于本发明的核酸靶向系统。具体地说,安德森实验室开发了用于新生物材料和纳米制剂的合成、纯化、表征、和配制的全自动化组合系统。参见例如,alabi等人,procnatlacadsciusa.[美国国家科学院院刊]2013年8月6日;110(32):12881-6;zhang等人,advmater.[先进材料]2013年9月6日;25(33):4641-5;jiang等人,nanolett.[纳米通讯]2013年3月13日;13(3):1059-64;karagiannis等人,acsnano.[acs纳米]2012年10月23日;6(10):8484-7;whitehead等人,acsnano.[acs纳米]2012年8月28日;6(8):6922-9,以及lee等人,natnanotechnol.[自然纳米技术]2012年1月3日;7(6):389-93。美国专利申请20110293703涉及类脂质化合物,这些化合物在多核苷酸的给药中也是特别有用的,其可适用于递送本发明的核酸靶向系统。在一个方面中,氨基醇类脂质化合物与有待递送到细胞或受试者的药剂结合而形成微粒子、粒子、脂质体、或胶束。有待通过粒子、脂质体、或胶束递送的药剂可以处于气体、液体、或固体的形式,并且该药剂可以是多核苷酸、蛋白、肽、或小分子。这些氨基醇类脂质化合物可以与其他氨基醇类脂质化合物、聚合物(合成的或天然的)、表面活性剂、胆固醇、碳水化合物、蛋白、脂质、等等形成粒子。然后这些粒子可以任选地与药用赋形剂结合而形成药物组合物。美国专利公开号20110293703也提供了制备氨基醇类脂质化合物的方法。使胺的一种或多种等效物与环氧化物封端化合物的一种或多种等效物在适当条件下反应而形成本发明的氨基醇类脂质化合物。在某些实施例中,胺的所有氨基基团与环氧化物封端化合物充分反应而形成叔胺。在其他实施例中,胺的所有氨基基团未与环氧化物封端化合物完全反应形成叔胺,由此生成在氨基醇类脂质化合物中的伯胺或仲胺。这些伯胺或仲胺照原样留下或者可以与另一种亲电体如不同的环氧化物封端化合物反应。正如本领域技术人应当理解的,胺与未过量的环氧化物封端化合物反应将产生多种不同的具有不同数目的尾部的氨基醇类脂质化合物。某些胺类可以用两个环氧化物衍生的化合物尾部将其完全功能化,而其他分子用环氧化物衍生的化合物尾部将不会被完全功能化。例如,二胺或多胺可包括离开该分子的不同氨基部分的一个、二个、三个、或四个环氧化物衍生的化合物尾部,从而产生伯胺、仲胺、和叔胺。在某些实施例中,并不是所有氨基基团都被完全功能化。在某些实施例中,使用相同类型的环氧化物封端化合物中的两种。在其他实施例中,使用两个或更多个不同的环氧化物封端化合物。氨基醇类脂质化合物的合成是用或不用溶剂进行的,并且该合成可以在范围从30℃-100℃,优选在大致50℃-90℃的较高温度下进行。任选地,可以将制备的氨基醇类脂质化合物纯化。例如,可以纯化氨基醇类脂质化合物的混合物而产生具有特定数目的、环氧化物衍生的化合物尾部的氨基醇类脂质化合物。或者,该混合物可以被纯化而产生特定的立体异构体或区域异构体。也可以使用烷基卤化物(例如,碘甲烷)或其他烷化剂将这些氨基醇类脂质化合物烷化,和/或它们可以被酰化。美国专利公开号20110293703还提供了通过发明方法制备的氨基醇类脂质化合物的文库。使用涉及液体处理器、机器人、微量滴定板、计算机等的高通量技术,可以制备和/或筛选这些氨基醇类脂质化合物。在某些实施例中,筛选了这些氨基醇类脂质化合物的将多核苷酸或其他药剂(例如,蛋白、肽、小分子)转染到细胞中的能力。美国专利公开号20130302401涉及已经使用组合聚合制备的一类聚(β-氨基醇)(pbaas)。这些发明的pbaa可以在生物技术和生物医学应用中用作涂层(如用于医疗装置或植入物的薄膜或多层薄膜的涂层)、添加剂、材料、赋形剂、生物防污剂(non-biofoulingagent)、微图像化剂(micropatterningagent)、以及细胞封装剂(cellularencapsulationagent)。当用作表面涂层时,这些pbaa在体外和体内均引出不同水平的炎症,这取决于它们的化学结构。这类材料的巨大化学多样性允许我们鉴定出体外抑制巨噬细胞激活的聚合物涂层。此外,在羧化聚苯乙烯微粒的皮下移植之后,这些涂层减少了炎症细胞的募集,并且减轻了纤维化。这些聚合物可以用来形成用于细胞封装的聚电解质复合物胶囊。本发明还可具有许多其他的生物应用,如抗微生物涂层、dna或sirna递送、以及干细胞组织工程。美国专利公开号20130302401的传授内容可以适用于本发明的核酸靶向系统。在另一个实施例中,考虑了脂质粒子(lnp)。抗转甲状腺素蛋白小干扰rna已经被封装在脂质粒子中并且被递送到人体内(参见,例如,coelho等人,nengljmed[新英格兰医学杂志]2013;369:819-29),并且这样一种系统可以适用于并且应用于本发明的核酸靶向系统。考虑到静脉内给药约0.01到约1mg/kg体重的剂量。考虑了降低输注相关反应的风险的用药,如考虑到地塞米松、对乙酰氨基酚(acetampinophen)、苯海拉明或西替利嗪、以及雷尼替丁。考虑了约0.3mg/千克的多剂量,每4周一次,五个剂量。lnp已经显示在将sirna递送到肝脏中是高度有效的(参见,例如,tabernero等人,cancerdiscovery[癌症发现],2013年4月,第3卷,第4期,第363-470页),并且因此被考虑用于递送编码核酸rna靶向效应蛋白到肝脏。考虑了6mg/kg的lnp的约四个剂量的用量,每两周一次。tabernero等人证明,在以0.7mg/kg给药lnp的前2个周期之后,观察到肿瘤消退,并且在6个周期结束之后,患者已经实现了部分应答,具有淋巴结转移完全消退以及肝脏肿瘤的显著萎缩。在此患者中给药40个剂量之后获得完全应答,在接受经过26个月的剂量之后其保持缓解和完全治疗。具有rcc和在用vegf途径抑制剂进行的在先治疗之后进展的包括肾脏、肺、以及淋巴结在内的肝外部位疾病的两位患者在所有部位的疾病都保持稳定大约8到12个月,并且一位具有pnet和肝转移的患者继续在18个月(36个剂量)的延伸研究中保持疾病稳定。然而,必须将lnp的电荷考虑在内。当阳离子脂质与带负电的脂质结合时,诱导促进细胞内递送的非双层结构。由于带电荷的lnp在静脉注射之后迅速从循环中清除,开发了具有低于7的pka值的可电离阳离子脂质(参见,例如,rosin等人,moleculartherapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月)。带负电荷的聚合物如rna可以低ph值(例如,ph4)加载到lnp中,在此ph时可电离脂质展示出正电荷。然而,在生理学ph值时,lnp展现出与更长的循环时间相容的低表面电荷。已经关注了四种可电离阳离子脂质,即1,2-二亚油酰基-3-二甲基铵-丙烷(dlindap)、1,2-二亚油基氧基-3-n,n-二甲基氨基丙烷(dlindma)、1,2-二亚油基氧基-酮基-n,n-二甲基-3-氨基丙烷(dlinkdma)、以及1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(dlinkc2-dma)。已经表明,含有这些脂质的lnpsirna系统在体内肝细胞中展现出显著不同的基因沉默特性,具有根据采用因子vii基因沉默模型的dlinkc2-dma>dlinkdma>dlindma>>dlindap系列而变化的潜能(参见,例如,rosin等人,moleculartherapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月)。可以考虑lnp或者在lnp中的或与lnp相关的crispr-casrna的1μg/ml的剂量,尤其是对于含有dlinkc2-dma的配制品而言。lnp的制备和crisprcas封装可以使用/和或改编自rosin等人,moleculartherapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月)。阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(dlindap)、1,2-二亚油基氧基-3-n,n-二甲基氨基丙烷(dlindma)、1,2-二亚油基氧基酮基-n,n-二甲基-3-氨基丙烷(dlink-dma)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(dlinkc2-dma)、(3-o-[2″-(甲氧基聚乙二醇2000)琥珀酰]-1,2-二肉豆蔻酰基-sn-二醇(peg-s-dmg)、以及r-3-[(ω-甲氧基-聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻酰氧基丙基-3-胺(peg-c-domg)可以由tekmira制药公司(tekmirapharmaceuticals)(温哥华,加拿大)提供或者合成。胆固醇可以购自西格玛公司(圣路易斯,密苏里州)。可以将特异性核酸靶向复合物(crispr-cas)rna包封于含有dlindap、dlindma、dlink-dma和dlinkc2-dma(阳离子脂质:dspc:chol:40:10:40:10摩尔比的pegs-dmg或peg-c-domg)。在需要时,可以结合0.2%sp-dioc18(英杰公司,伯灵顿,加拿大)来评估细胞摄取、细胞内递送、和生物分布。通过将由阳离子脂质:dspc:胆固醇:peg-c-domg(40:10:40:10摩尔比)组成的混合物溶解在乙醇中直到最终脂质浓度为10mmol/l来进行封装。可以将脂质的这种乙醇溶液逐滴加入到ph4.0的50mmol/l柠檬酸盐中而形成多层囊泡,从而产生30%(vol/vol)乙醇的最终浓度。在使用挤出机(北方脂质公司(northernlipids),温哥华,加拿大)通过两个重叠的80nmnuclepore聚碳酸酯滤膜挤出多层囊泡之后,可以形成大的单层囊泡。可以通过如下步骤实现封装:将溶解在含有30%乙醇(vol/vol)的ph4.0的50mmol/l柠檬酸盐中的2mg/ml的rna逐滴加入到挤出的形成的大单层囊泡中,并且在31℃孵育30分钟,伴随持续混合直到最终的rna/脂质重量比为0.06/1(wt/wt)。通过使用spectra/por2再生纤维素透析膜在ph为7.4的磷酸盐缓冲盐水(pbs)中透析16小时进行乙醇的去除以及配制缓冲液的中和。使用nicomp370型粒度分析仪、囊泡/强度模式、以及高斯拟合,通过动态光散射,可以测定粒度分布(nicomp粒径分析仪公司(nicompparticlesizing),圣巴巴拉市,加利福尼亚州)。对于所有三个lnp系统的粒径可以是约70nm的直径。可以通过使用vivapuredminih柱(赛多利斯斯泰迪生物技术公司(sartoriusstedimbiotech))从分析前后收集的样品中去除游离rna来确定rna封装效率。从洗脱的粒子提取封装的rna并且将其在260nm定量。通过使用来自美国瓦克化学公司(wakochemicalsusa)(里士满(richmond),弗吉尼亚州)的胆固醇e酶法测定法测量囊泡中的胆固醇含量,确定了rna与脂质的比率。与在此关于lnp和peg脂质的讨论结合,聚乙二醇化的脂质体或lnp同样适于递送核酸靶向系统或其组分。大lnp的制备可以使用/和或改编自rosin等人,moleculartherapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月。可以在含有50:10:38.5的摩尔比的dlinkc2-dma、dspc、和胆固醇的乙醇中制备脂质预混物溶液(20.4mg/ml总脂质浓度)。可以按照0.75:1的摩尔比(乙酸钠:dlinkc2-dma)将乙酸钠添加到脂质预混物中。随后可以通过将该混合物与1.85倍体积的柠檬酸盐缓冲液(10mmol/l,ph3.0)在剧烈搅拌下合并而使脂质水合,从而导致在含有35%的在水性缓冲液中的自发脂质体形成。可以在37℃孵育该脂质体溶液以允许粒径的时间依赖性增加。可以通过动态光散射(纳米粒径电位分析仪(zetasizernanozs),马尔文仪器公司(malverninstruments),乌斯特郡(worcestershire),英国)在孵育的不同时间去除等分试样以研究脂质体尺寸的变化。一旦实现所希望的粒径,可以将水性peg脂质溶液(储备溶液=在35%(vol/vol)乙醇中的10mg/mlpeg-dmg)添加到该脂质体混合物中,以便产生3.5%总脂质的最终peg摩尔浓度。在添加peg-脂质之后,这些脂质体应该其尺寸,有效抑制进一步生长。然后以大约1:10(wt:wt)的rna与总脂质比率将rna添加到空脂质体,然后在37℃孵育30分钟以形成加载的lnp。随后将该混合物在pbs中透析过夜,并且用0.45-μm的注射器过滤器。球形核酸(snatm)构建体和其他粒子(尤其是金粒子)也被考虑为将核酸靶向系统递送到预期靶标的手段。重要数据表明,基于核酸功能化的金粒子的aurasense治疗性球形核酸(snatm)构建体是有用的。可以与在此的传授结合使用的文献包括:cutler等人,j.am.chem.soc.[美国化学会志]2011133:9254-9257,hao等人,small.20117:3158-3162,zhang等人,acsnano.[acs纳米]20115:6962-6970,cutler等人,j.am.chem.soc.[美国化学会志]2012134:1376-1391,young等人,nanolett.[纳米通讯]201212:3867-71,zheng等人,proc.natl.acad.sci.usa.[美国国家科学院院刊]2012109:11975-80,mirkin,nanomedicine[纳米医学]20127:635-638zhang等人,j.am.chem.soc.[美国化学会志]2012134:16488-1691,weintraub,nature[自然]2013495:s14-s16,choi等人,proc.natl.acad.sci.usa.[美国国家科学院院刊]2013110(19):7625-7630,jensen等人,sci.transl.med.[科学转化医学]5,209ra152(2013)以及mirkin,等人,small,10:186-192。具有rna的自组装粒子可以用被聚乙二醇化的聚乙烯亚胺(pei)进行构建,其中arg-gly-asp(rgd)肽配体附接在聚乙二醇(peg)的远端。例如,这一系统已经被用作靶向表达整合素的肿瘤新血管系统和递送抑制血管内皮生长因子受体2(vegfr2)表达以及由此实现抑制肿瘤血管发生的sirna的手段(参见,例如,施弗勒斯(schiffelers)等人,核酸研究(nucleicacidsresearch),2004,第32卷,第19期)。通过将等体积的阳离子聚合物水溶液和核酸水溶液混合从而产生在2到6范围上的可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量,从而制备纳米束。在阳离子聚合物与核酸之间的静电相互作用导致聚复合物的形成,其具有约100nm的平均粒径分布,此后称为纳米束。设想了核算靶向复合物rna的约100到200mg的剂量,用于schiffelers等人的自组装粒子中的递送。bartlett等人的纳米束(pnas,2007年9月25日,第104卷,第39期)也可以用于本发明。通过将等体积的阳离子聚合物水溶液和核酸水溶液混合从而产生在2到6范围上的可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量,从而制备巴特利特(bartlett)等人的纳米束。在阳离子聚合物与核酸之间的静电相互作用导致聚复合物的形成,其具有约100nm的平均粒径分布,此后称为纳米束。巴特利特(bartlett)等人的dota-sirna合成如下:1,4,7,10-四氮杂环十二烷-1,4,7,10-四乙酸单(n-羟基琥珀酰亚胺酯)(dota-nhs酯)订购自macrocyclics公司(达拉斯(dallas),德克萨斯州)。将碳酸盐缓冲液(ph9)中的具有100倍摩尔过量的dota-nhs-酯的胺修饰的rna有义链加入到微量离心管中。通过在室温搅拌4小时使这些内容物反应。将该dota-rna有义缀合物用乙醇沉淀,重新悬浮在水中,并且退火到未修饰的反义链上而产生dota-sirna。所有液体用chelex-100(伯乐公司,赫库斯(hercules),加利福尼亚州)预处理,以便去除微量金属污染物。通过使用含有环糊精的聚阳离子可以形成tf靶向和非靶向的sirna粒子。典型地,粒子以3(+/-)的进料比和0.5g/升的sirna浓度在水中形成。用tf(金刚烷-peg-tf)修饰在靶向粒子表面上的百分之一的金刚烷-peg分子。将粒子悬浮在用于注射的5%(wt/vol)的葡萄糖载体溶液中。davis等人(nature[自然],第464卷,2010年4月15日)使用靶向的粒子递送系统进行了rna临床试验(临床试验登记号nct00689065)。在21天周期的第1、3、8和10天通过30分钟的静脉输注对患有标准护理治疗难治的实体癌的患者给药靶向粒子剂量。来自包含合成递送系统,基本上由其组成、或由其组成,该合成递送系统包含:(1)线性的、基于环糊精的聚合物(cdp),(2)展示在粒子的外部上的用于接合癌细胞表面上的tf受体(tfr)的人转铁蛋白蛋白(tf)靶向配体,(3)亲水聚合物(用来促进在生物流体中的粒子稳定性的聚乙二醇(peg)),以及(4)被设计为降低rrm2(在临床中使用的序列,先前表示为sir2b+5)表达的sirna。tfr已经久为所知在恶性细胞中被下调,并且rrm2是确立的抗癌靶标。已经显示这些粒子(临床版本表示为calaa-01)在非人类灵长动物中的多剂量研究中良好耐受。虽然已经通过脂质体递送向患有慢性粒细胞白血病的单一患者给药了sirna,但是戴维斯等人的临床试验是初期人类试验,该试验用一个靶向的递送系统全身性地递送sirna并且治疗患有实体癌的患者。为了确定该靶向的递送系统是否能够将功能性sirna有效递送到人类肿瘤,戴维斯(davis)等人研究了来自三个不同的剂量组群的三位患者的活组织检查;患者a、b和c均患有转移性黑素瘤并且分别接受了18、24和30mgm-2sirna的calaa-01剂量。还可以针对本发明的核酸靶向系统考虑相似的剂量。用含有线性的基于环糊精的聚合物(cdp)、展示在粒子的外部上的用于接合癌细胞表面上的tf受体(tfr)的人转铁蛋白(tf)靶向配体和/或亲水聚合物(例如,用来促进在生物流体中的粒子稳定性的聚乙二醇(peg))的粒子,可以实现本发明的递送。就本发明而言,优选的是使用粒子或脂质包膜递送核酸靶向复合物的一种或多种组分例如核酸靶向效应蛋白或mrna或指导rna。其他递送系统或载体可以结合本发明的粒子方面使用。通常,“纳米粒子”是指任何具有小于1000nm的直径的粒子。在某些优选实施例中,本发明的纳米粒子具有500nm或更小的最大尺寸(例如,直径)。在其他优选实施例中,本发明的纳米粒子具有范围在25nm与200nm之间的最大尺寸。在其他优选实施例中,本发明的粒子具有100nm或更小的最大尺寸。在其他优选实施例中,本发明的纳米粒子具有范围在35nm与60nm之间的最大尺寸。包含于本发明中的粒子可以提供为不同形式,例如提供为固体粒子(例如,金属如银、金、铁、钛,非金属,基于脂质的固体,聚合物)、粒子悬浮液、或其组合。可以制备金属粒子、介电粒子和半导体粒子连同混合结构(例如,核-壳粒子)。由半导体材料制成的粒子也可以经量子点标记,如果它们足够小(典型地低于10nm)使得电子能级的量子化发生的话。此类纳米级粒子作为药物载体或成像剂用于生物医学应用中,并且可以被适配为用于本发明中的相似目的。半-固体和软粒子已经制造出,并且是在本发明的范围内。具有半-固体性质的原型粒子是脂质体。各种类型的脂质体粒子目前在临床上用作用于抗癌药物和疫苗的递送系统。一半亲水并且另一半疏水的粒子称为杰那斯(janus)粒子,并且对于稳定乳液是特别有效的。它们可以在水/油界面处自组装,并且充当固体表面活性剂。美国专利号8,709,843(通过引用结合在此)提供了用于将包含治疗剂的粒子靶向递送至组织、细胞和细胞内区室的药物递送系统。本发明提供了包含聚合物的靶向粒子,该聚合物缀合至表面活性剂、亲水聚合物或脂类。通过引用并入本文的美国专利号6,007,845提供了以下粒子,这些粒子具有多嵌段共聚物的核,该多嵌段共聚物是通过将多官能化合物与一种或多种疏水聚合物和一种或多种亲水聚合物共价连接而形成的,并且这些粒子包含生物活性材料。通过引用结合在此的美国专利号5,855,913提供了一种具有空气动力学上轻的粒子的微粒组合物,这些空气动力学上轻的粒子具有小于0.4g/cm3的振实密度,其平均直径在5μm与30μm之间,将一种表面活性剂结合在其表面以用于将药物递送至肺部系统。通过引用并入本文的美国专利号5,985,309提供了以下粒子,这些粒子结合表面活性剂和/或带正电或负电的治疗剂或诊断剂和相反电荷带电分子的亲水或疏水复合物,以用于递送至肺部系统。专利号5,543,158提供了生物可降解的可注射粒子,这些可注射粒子具有生物可降解的固体核,该固体核在表面上包含生物活性材料和聚(亚烷基二醇)部分。通过引用结合在此的wo2012135025(也公开为us20120251560)描述了缀合的聚乙烯亚胺(pei)聚合物和缀合的氮杂-大环化合物(统称为“缀合的微脂体(lipomer)”或“微脂体”)。在某些实施例中,可设想在此引用的文献的此类方法和材料(例如,缀合的微脂体)可以在核酸靶向系统的背景下使用,以实现体外、离体和体内基因组干扰以修饰基因表达,包括调节蛋白表达。在一个实施例中,该粒子可以是环氧化物-修饰的脂质-聚合物,有利地为7c1(参见例如,詹姆斯(james)e.达尔曼(dahlman)和卡门巴尔内斯(carmenbarnes)等人在自然纳米技术(naturenanotechnology)(2014)的公开物,在线公开于2014年5月11日,doi:10.1038/nnano.2014.84)。c71是通过使c15环氧化物终止的脂质与pei600以14:1摩尔比进行反应来合成,并且与c14peg2000配制以产生在pbs溶液中稳定持续至少40天的粒子(直径在35与60nm之间)。可以利用环氧化物-修饰的脂质-聚合物将本发明的核酸靶向系统递送至肺部细胞、心血管细胞或肾细胞,然而本领域的技术人员可以调适该系统以递送到其他靶器官。设想了从约0.05至约0.6mg/kg的剂量范围。还设想了经数天或数周的剂量,其中总剂量为约2mg/kg。外来体外来体是转运rna和蛋白的并且可以向脑和其他靶器官中递送rna的内源纳米囊泡。为了降低免疫原性,alvarez-erviti等人(2011,natbiotechnol[自然生物技术]29:341)使用了用于外来体产生的自我衍生的树突细胞。通过将树突细胞工程化为表达lamp2b(一种外泌体膜蛋白,融合到神经元特异性rvg肽上)而实现了靶向脑。通过电穿孔使纯化的外来体加载外源rna。静脉注射的rvg靶向的外来体特异性地将gapdhsirna递送到脑中的神经元、小胶质细胞、少突神经胶质细胞,导致特异性的基因敲低。预暴露于rvg外来体未减弱敲低,并且在其他组织中未观察到非特异性摄取。通过bace1的强的mrna(60%)和蛋白(62%)敲低证明了外来体介导的sirna递送的治疗潜能,bace1是一种阿尔茨海默病中的治疗靶标。为了获得免疫惰性的外来体池,alvarez-erviti等人收获了来自具有同源主要组织相容性复合物(mhc)单体型的近交c57bl/6小鼠的骨髓。由于未成熟树突细胞产生大量的缺乏t细胞激活物如mhc-ii和cd86的外来体,alvarez-erviti等人选择具有粒细胞/巨噬细胞集落刺激因子(gm-csf)的树突细胞持续7天。次日,使用良好建立的超速离心方案从培养上清中纯化外来体。这些产生的外来体在物理上是同质的,具有直径为80nm的粒度分布峰,正如通过粒子跟踪分析(nta)和电子显微镜检查所测定。alvarez-erviti等人获得了6-12μg的外来体(基于蛋白质浓度测量的)/每106个细胞。其次,alvarez-erviti等人研究了使用适用于纳米级应用的穿孔方案给修饰的外来体加载外源负荷的可能性。由于电穿孔对于纳米级的膜粒子尚未良好表征,使用非特异性cy5标记的rna用于电穿孔方案的经验优化。在外来体超速离心和溶解之后测定了封装的rna的量。在400v和125μf的电穿孔导致rna的最好保留并且用于所有的后续实验。alvarez-erviti等人向正常c57bl/6小鼠给药被包封在150μg的rvg外泌体中的150μg的每种bace1sirna并且将敲低效率与四个对照进行比较:未处理的小鼠、仅仅用rvg外泌体注射的小鼠,用与一种体内阳离子脂质体试剂络合的bace1sirna注射的小鼠、以及用与rvg-9r络合的bace1sirna注射的小鼠,该rvg肽与静电结合到sirna上的9个d-精氨酸缀合。在给药之后3天,分析皮层组织样品,并且在sirna-rvg-9r处理的和sirnarvg外来体处理的小鼠中均观察到显著的蛋白敲低(45%,p<0.05,相对于62%,p<0.01),这是由于显著的bace1mrna水平降低(分别为66%[+或-]15%,p<0.001以及61%[+或-]13%,p<0.01)。而且,申请人证明了在rvg-外泌体处理的动物中在总[β]-淀粉样蛋白1-42水平上的显著降低(55%,p<0.05),其中β淀粉样蛋白为一种在阿尔茨海默病理学中的淀粉样斑块的主要成分。所观察到的降低大于在心室内注射bace1抑制剂之后的正常小鼠中证明的β淀粉样蛋白1-40降低。alvarez-erviti在bace1切割产物上进行了5'-cdna末端快速扩增(race),其提供了经由sirna的rnai介导的敲低的证据。最后,alvarez-erviti等人通过评定il-6、ip-10、tnfα和ifn-α血清浓度研究了rna-rvg外来体是否诱导了体内免疫反应。在外来体处理之后,类似于与有力地刺激il-6分泌的sirna-rvg-9r相反的sirna转染试剂处理,登记了在所有细胞因子上的非显著性变化,证实了该外来体处理的免疫惰性属性。假定外来体仅仅封装20%的sirna,用rvg-外来体递送比rvg-9r递送显得更有效,因为用少五倍的sirna实现了相当的mrna敲低和更好的蛋白敲低,而没有相应水平的免疫刺激。这个实验证明了rvg-外来体技术的治疗潜力,其潜在地适合于与神经退行性疾病相关的基因的长期沉默。alvarez-erviti等人的外来体递送系统可以用于将本发明的核酸靶向系统递送至治疗靶标,尤其是神经退行性疾病。对于本发明可以考虑封装在约100到1000mg的rvg外来体中的约100到1000mg的核酸靶向系统的剂量。el-andaloussi等人(natureprotocols[自然-实验手册]7,2112-2126(2012))披露了可以如何利用来源于培养的细胞的外泌体用于体外和体内递送rna。这个方案首先描述了通过转染包含与肽配体融合的外来体蛋白的表达载体的靶向外来体的产生。其次,el-andaloussi等人解释了如何纯化和表征来自转染的细胞上清液的外来体。接着,el-andaloussi等人详述了将rna加载到外来体中的关键步骤。最后,el-andaloussi等人概述了如何使用外来体有效体外递送rna以及体内递送到小鼠脑中。还提供了预期结果的实例,其中外来体介导的rna递送通过功能分析和成像而评估。整个方案进行约3周。根据本发明的递送或给药可以使用从自我衍生的树突细胞产生的外来体来进行。根据本文的教导,这可以在本发明的实践中采用。在另一个实施例中,考虑了wahlgren等人的血浆外来体(nucleicacidsresearch[核酸研究],2012年,第40卷,第17期,e130)。外来体是由包括树突细胞(dc)、b细胞、t细胞、肥大细胞、上皮细胞和肿瘤细胞在内的许多细胞类型产生的纳米囊泡(30-90nm尺寸)。这些囊泡通过晚期核内体的向内出芽而形成,并且然后在与质膜融合后释放到细胞外环境中。由于外来体天然地在细胞之间运送rna,这种特性在基因治疗中可以是有用的,并且根据本披露可以用于本发明的实践中。来自血浆的外来体可以通过如下制备:在900g离心血沉棕黄层持续20分钟以便分离血浆,之后收获细胞上清液,在300g离心10分钟以便去除细胞,并且在16500g离心30分钟,之后通过0.22mm过滤器进行过滤。通过在120000g超速离心70min使外来体沉淀。根据在rnai人/小鼠启动试剂盒(quiagen,希尔顿(hilden),德国)中的制造商的说明进行sirna到外来体中的化学转染。sirna以终浓度2mmol/ml添加到100mlpbs中。在加入hiperfect转染试剂之后,将该混合物在室温下孵育10分钟。为了去除过量的胶束,使用醛/硫酸盐乳胶珠再分离外来体。可以类似于sirna进行核酸靶向系统到外来体中的化学转染。外来体可以与从健康供体的外周血中分离的单核细胞和淋巴细胞共培养。因此,可以考虑的是,可以将含有核酸靶向系统的外来体引入人单核细胞和淋巴细胞中并且以自体方式再引入。因此,可以使用血浆外来体进行根据本发明的递送或给药。脂质体可以用脂质体进行根据本发明的递送或给药。脂质体是球形囊泡结构,其组成为围绕内部水性区室的单层或多层脂质双层以及相对不可渗透的外部亲脂性磷脂双层。脂质体作为药物递送载体受到了相当的重视,因为它们是生物相容、无毒的,可以递送亲水和亲脂性药物分子,包护它们的负荷物免于被血浆酶降解,并且运送它们的负荷跨过生物膜和血脑屏障(bbb)(对于评述,参见,例如,斯普奇(spuch)和纳瓦罗(navarro)药物递送杂志(journalofdrugdelivery),2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。可以从几种不同类型的脂质制造脂质体;然而,磷脂最常用来产生作为药物载体的脂质体。虽然当脂质膜与一种水性溶液混合时脂质体形成是自发的,但也可通过使用一个均质机、超声发生器、或挤出设备以振摇的形式施加力使其加速(对于评述,参见,例如,spuch和navarro,journalofdrugdelivery[药物递送杂志],第2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。可以将几种其他的添加剂添加到脂质体,以便修饰其结构和特性。例如,可以将胆固醇或鞘磷脂添加到脂质体混合物中,以便帮助稳定脂质体结构并且防止脂质体内部负荷物的泄漏。此外,从氢化卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇、和磷酸二鲸蜡脂制备脂质体,并且脂质体的平均囊泡大小被调整到约50至100nm。(对于评述,参见,例如,spuch和navarro,journalofdrugdelivery[药物递送杂志],第2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。脂质体配制品主要可以由天然磷脂和脂质如1,2-二硬脂酰-sn-甘油基-3-磷脂酰胆碱(dspc)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷酯构成。由于这种配制品仅仅由磷脂组成,脂质体配制品已经遇到了许多挑战,其中之一是在血浆中的不稳定性。已经作出战胜这些挑战的若干尝试,特别是在脂质膜的处理方面。这些尝试之一集中于胆固醇的处理。将胆固醇添加到常规配制品中减缓了封装的生物活性化合物到血浆中的迅速释放,或者添加1,2-二油酰基-sn-甘油基-3-磷酸乙醇胺(dope)增加稳定性(对于评述,参见,例如,斯普奇(spuch)和纳瓦罗(navarro)药物递送杂志(journalofdrugdelivery),第2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。在一个特别有利的实施例中,特洛伊木马(trojanhorse)脂质体(也称为分子木马)是令人希望的并且方案可见于http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long。这些粒子允许转基因在血管内注射之后递送到整个脑。不受到限制,表面结合有特异性抗体的中性脂质粒子允许经由胞吞作用跨过血脑屏障。申请人假定利用特洛伊木马脂质体将核酸酶的crispr家族经由血管内注射递送到脑,这将允许全脑转基因动物,而不需要胚胎操作。对于在脂质体中的体内给药,可以考虑约1-5g的dna或rna。在另一个实施例中,该核酸靶向系统或其组分可以在脂质体中给药,如稳定的核酸-脂质粒子(snalp)(参见,例如,morrissey等人,naturebiotechnology[自然生物技术],第23卷,第8期,2005年8月)。考虑了约1、3或5mg/kg/天的靶向snalp中的特异性核酸靶向系统的每日静脉注射。日治疗可以经过约三天,然后每周治疗持续约五周。在另一个实施例中,还考虑了通过以约1或2.5mg/kg的剂量静脉注射给药的封装有特异性核酸靶向系统的snalp(参见,例如,zimmerman等人,natureletters[自然通讯],第441卷,2006年5月4日)。该snalp配制品可含有以2:40:10:48的摩尔百分比的脂质3-n-[(w甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基-丙胺(peg-c-dma)、1,2-二亚油基氧基-n,n-二甲基-3-氨基丙烷(dlindma)、1,2-二硬脂酰-sn-甘油基-3-磷酸胆碱(dspc)和胆固醇,(参见,例如,zimmerman等人,natureletters[自然通讯],第441卷,2006年5月4日)。在另一个实施例中,已经证明稳定的核酸-脂质粒子(snalp)将分子有效递送到高度血管化的hepg2-衍生的肝脏肿瘤,但是不递送到血管化不良的hct-116衍生的肝脏肿瘤(参见,例如,li,genetherapy[基因治疗](2012)19,775-780)。可以通过如下制备这些snalp脂质体:使用25:1的脂质/sirna比率和48/40/10/2的胆固醇/d-lin-dma/dspc/peg-c-dma的摩尔比,用二硬脂酰磷脂酰胆碱(dspc)、胆固醇和sirna配制d-lin-dma和peg-c-dma。生成的snalp脂质体在尺寸上为约80-100nm。在又另一个实施例中,snalp可以包含合成胆固醇(西格玛-奥德里奇公司(sigma-aldrich),圣路易斯,密苏里州,美国)、二棕榈酰磷脂酰胆碱(avantipolarlipids公司,阿拉巴斯特(alabaster),阿拉巴马州,美国)、3-n-[(w-甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基丙基胺、和阳离子的1,2-二亚油基氧基-3-n,n二甲基氨基丙烷(参见,例如,geisbert等人,lancet[柳叶刀]2010;375:1896-905)。例如可以考虑静脉推注给药约2mg/kg总核酸靶向系统的剂量。在又另一个实施例中,snalp可以包含合成胆固醇(西格玛-奥德里奇公司(sigma-aldrich))、1,2-二硬脂酰基-sn-甘油基-3-磷酸胆碱(dspc;avantipolarlipids公司)、peg-cdma、和1,2-二亚油基氧基-3-(n;n-二甲基)氨基丙烷(dlindma)(参见,例如,judge,j.clin.invest.[临床研究杂志]119:661-673(2009))。用于体内研究的配制品可包含约9:1的最终脂质/rna质量比。已经由阿尔尼拉姆制药公司(alnylampharmaceuticals)的巴洛斯(barros)和格罗布(gollob)评论了rnai纳米药物的安全性(参见,例如,advanceddrugdeliveryreviews[先进药物递送评论]64(2012)1730-1737)。稳定的核酸脂质粒子(snalp)由四种不同的脂质构成-在低ph时为阳离子的可电离脂质(dlindma)、中性辅助脂质、胆固醇、和可扩散的聚乙二醇(peg)-脂质。该粒子直径大约为80nm并且在生理ph时是电中性的。在配制过程中,该可电离脂质用于在粒子形成过程中使脂质与阴离子rna缩合。当在渐增的酸性内体条件下带正电荷时,该可电离的脂质还介导了snalp与内体膜的融合,从而使得能够将rna释放到细胞质中。该peg-脂质在配制过程中使该粒子稳定并且减少聚集,随后提供中性的亲水性外部,以改进药代动力学特性。到目前为止,已经使用具有rna的snalp配制品开始两个临床项目。tekmira制药公司最近完成了snalp-apob在具有增高的ldl胆固醇的成年志愿者中的i期单剂量研究。apob主要在肝脏和空肠中表达,并且对于vldl和ldl的组装和分泌是必需的。十七位受试者接受了snalp-apob的单剂量(跨7个剂量水平的剂量递增)。没有肝脏毒性(预期为基于临床前研究的潜在剂量限制性毒性)的证据。处于最高剂量的(两位中的)一位受试者经历了与免疫系统刺激一致的流感样症状,于是做出结束该试验的决定。阿尔尼拉姆制药公司(alnylampharmaceuticals)已经类似地推出了aln-ttr01,其采用上述snalp技术并且靶向突变体和野生型ttr的肝实质细胞产生,从而治疗ttr淀粉样变性(attr)。已经描述了三个attr综合征:家族性淀粉样多发性神经病变(fap)和家族性淀粉样心肌病(fac)-两者均由ttr中的常染色体显性突变引起;以及由野生型ttr引起的老年全身性淀粉样变性(ssa)。最近在具有attr的患者中完成了aln-ttr01的安慰剂对照单剂量递增i期试验。向31位患者(23位用研究药物,8位用安慰剂)在0.01到1.0mg/kg(基于sirna)的剂量范围内以15分钟静脉内输注给药aln-ttr01。治疗耐受良好,其中在肝功能试验中没有显著增加。在≥0.4mg/kg时在23位患者的3位中注意到输注相关反应;对所有患者均做出减慢输注速率的反应并且所有患者继续参与研究。在处于1mg/kg的最高剂量(如根据临床前和nhp研究预期的)的两位患者中注意到血清细胞因子il-6、ip-10和il-1ra的最小与瞬时升高。在1mg/kg时观察到aln-ttr01的预期药理效应,即,血清ttr的降低。在又另一个实施例中,可以通过将阳离子脂质、dspc、胆固醇和peg-脂质以40:10:40:10的摩尔比分别溶解在例如乙醇中来制作snalp(参见,森普尔(semple)等人,自然生物技术(natureniotechnology),第28卷,第2期,2010年2月,第172-177页)。将该脂质混合物添加到水性缓冲液中(50mm柠檬酸盐,ph4),混合至最终的乙醇和脂质浓度分别为30%(vol/vol)和6.1mg/ml,允许在22℃平衡2分钟,然后挤出。使用lipex挤出仪(北方脂质公司(northernlipids)),在22℃将水合脂质通过两层80nm孔径尺寸的过滤器(nuclepore)直到获得70-90nm直径的囊泡时为止,正如通过动态光散射分析测定的。这大致需要1-3次通过。将该sirna(溶解在50mm柠檬酸盐中,ph为4的含有30%乙醇的水溶液)以约5ml/min的速率在混合下添加到预平衡的(35℃)囊泡中。在达到0.06(wt/wt)的最终靶sirna/脂质比率之后,将该混合物在35℃另外孵育30分钟,以允许囊泡重组和该sirna的封装。然后去除乙醇并且通过透析或切向流渗滤用pbs(155mmnacl、3mmna2hpo4、1mmkh2po4,ph7.5)替换外部缓冲液。使用控制的逐步稀释法工艺将sirna封装在snalp中。kc2-snalp的脂质组分为以57.1:7.1:34.3:1.4的摩尔比使用的dlin-kc2-dma(阳离子脂质)、二棕榈酰磷脂酰胆碱(dppc;avantipolarlipids公司)、合成胆固醇(西格玛公司)和peg-c-dma。在形成加载的粒子后,将snalp在pbs中透析并且在使用之前通过0.2μm的滤膜消毒过滤。平均粒径为75-85nm,并且将90%-95%的sirna封装在脂质粒子内。用于体内测试的在配制品中的最终sirna/脂质比率是大约0.15(wt/wt)。在使用之前即刻将含有因子viisirna的lnp-sirna系统在无菌pbs中稀释到适当浓度,并且通过侧尾静脉以10ml/kg的总体积静脉内给药。这种方法和这些递送系统可以类推到本发明的核酸靶向系统。其他脂质其他阳离子脂质,如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(dlin-kc2-dma)可以例如类似于sirna地用来封装核酸靶向系统或其组分或对其进行编码的一个或多个核酸分子(参见,例如,jayaraman,angew.chem.int.ed.[德国应用化学]2012,51,8529-8533),并且因此可以在本发明的实践中采用。可以考虑具有下列脂质组成的预成型囊泡:分别处于摩尔比40/10/40/10的氨基脂质、二硬脂酰卵磷脂(dspc)、胆固醇和(r)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基碳酸酯(peg-脂质),以及大约0.05(w/w)的fviisirna/总脂质比率。为了确保在70-90nm范围内的窄粒径分布以及0.11±0.04(n=56)的低多分散性指数,可以在添加指导rna之前将粒子通过80nm的膜挤出达三次。可以使用含有高度有效的氨基脂质16的粒子,其中四种脂质组分16、dspc、胆固醇和peg-脂质的摩尔比(50/10/38.5/1.5)可以被进一步优化,以增强体内活性。michaelsdkormann等人(“expressionoftherapeuticproteinsafterdeliveryofchemicallymodifiedmrnainmice[在小鼠中递送化学修饰的mrna之后治疗蛋白的表达]”):naturebiotechnology[自然生物技术],第29卷,第154-157页,(2011))描述了脂质包膜用于递送rna的用途。脂质包膜的用途在本发明中也是优选的。在另一个实施例中,可以用本发明的核酸靶向系统或其一个或多个组分或编码其的一个或多个核酸分子配制脂质以形成脂质粒子(lnp)。脂质包括但不限于,dlin-kc2-dma4、c12-200和辅助脂质二硬脂酰磷脂酰胆碱、胆固醇和peg-dmg,可以使用自发囊泡形成程序将其与核酸靶向系统而不是sirna一起配制(参见,例如,novobrantseva,moleculartherapy-nucleicacids[分子治疗-核酸](2012)1,e4;doi:10.1038/mtna.2011.3)。组分摩尔比可以是约50/10/38.5/1.5(dlin-kc2-dma或c12-200/二硬脂酰磷脂酰胆碱/胆固醇/peg-dmg)。在dlin-kc2-dma和c12-200脂质粒子(lnp)的情况下,最终脂质:sirna重量比可以分别是约12:1和9:1。配制品可以具有约80nm的平均粒径,具有>90%的包覆效率。可以考虑3mg/kg的剂量。tekmira公司在美国和国外具有一组针对lnp和lnp配制品的不同方面的大约95个同族专利(参见,例如,美国专利号7,982,027;7,799,565;8,058,069;8,283,333;7,901,708;7,745,651;7,803,397;8,101,741;8,188,263;7,915,399;8,236,943和7,838,658以及欧洲专利号1766035;1519714;1781593和1664316),所有这些专利均可用于和/或适用于本发明。该核酸靶向系统或其组分或对其进行编码一个或多个核酸分子可以封装在plga微球中进行递送,例如进一步描述于美国公开申请20130252281和20130245107以及20130244279(转让给modernatherapeutics公司)中,其涉及包含修饰的核酸分子的组合物的配制品方面,所述核酸分子可以编码蛋白、蛋白前体、或该蛋白或蛋白前体的部分或完全加工形式。该配制品具有50:10:38.5:1.5-3.0(阳离子脂质:融合脂质:胆固醇:peg脂质)的摩尔比。该peg脂质可以选自,但不限于peg-c-domg、peg-dmg。该融合脂质可以是dspc。还参见,施鲁姆(schrum)等人,“工程化核酸的递送和配制”(deliveryandformulationofengineerednucleicacids),美国公开申请20120251618。nanomerics公司的技术着手解决针对广泛治疗学的生物利用度挑战,包括基于低分子量疏水药物、肽以及核酸(质粒、sirna、mirna)的治疗学。该技术已经证明了明显优势的特异性的给药途径包括口服途径、跨血脑屏障的运送、向实体瘤以及眼部的递送。参见,例如,mazza等人,2013,acsnano.[acs纳米]2013年2月26日;7(2):1016-26;uchegbu和siew,2013,jpharmsci.[制药科学杂志]102(2):305-10和lalatsa等人,2012,jcontrolrelease[控释杂志],2012年7月20日;161(2):523-36。美国专利公开号20050019923描述了用于向哺乳动物身体递送生物活性分子例如多核苷酸分子、肽和多肽和/或药剂的阳离子树状聚合物。这些树状聚合物适合于将生物活性分子的递送靶向到例如肝、脾、肺、肾或心脏(或甚至脑)。树状聚合物是从简单的支化单体单元以逐步方式制备的合成3维大分子,其性质和功能性可以容易地进行控制和改变。经由向多功能核(发散式合成法)或朝向多功能核(收敛式合成法)重复加成结构单元(buildingblocks)而合成树状聚合物,并且结构单元的3维壳的各次加成导致更高级别的树状聚合物的形成。聚丙烯亚胺树状聚合物从二氨基丁烷核开始,通过对伯胺的丙烯腈的双迈克尔加成反应向其上添加两倍数目的氨基基团,继之为腈的氢化。这导致氨基基团的加倍。聚丙烯亚胺树状聚合物含有100%的可质子化氮以及高达64个末端氨基基团(5级,dab64)。可质子化基团常常为能够在中性ph时接受质子的胺基。树状聚合物作为基因递送剂的用途在很大程度上集中于聚酰胺-胺和含磷化合物的用途,其中胺/酰胺的混合物或n--p(o2)s分别作为缀合单元,没有报道关于更低级别的聚丙烯亚胺树状聚合物用于基因递送的用途的工作。还研究了作为ph敏感的控制释放系统的聚丙烯亚胺树状聚合物,其用于药物递送以及当被外周氨基酸基团化学修饰时用于它们的客体分子的封装。还研究了聚丙烯亚胺树状聚合物的细胞毒性和与dna的相互作用以及dab64的转染效力。美国专利公开号20050019923是基于与早期报道相反的观察:阳离子树状聚合物例如聚丙烯亚胺树状聚合物展示出适当的特性,如,特异性靶向和低毒性,其用于在生物活性分子如基因材料的靶向递送中使用。另外,阳离子树状聚合物的衍生物也展示出适当的用于生物活性分子的靶向递送的特性。还参见,生物活性聚合物(bioactivepolymers)、美国公开申请20080267903,其披露了不同的聚合物,包括阳离子聚胺聚合物和树枝状聚合物,其显示具有抗增殖活性,并且因此可用于治疗其特征为不希望的细胞增殖的失调,如新生物和肿瘤、炎性失调(包括自身免疫性失调)、银屑病和动脉粥样硬化。这些聚合物可以作为活性剂单独使用、或者作为其他治疗剂(如药物分子或用于基因治疗的核酸)的递送媒介使用。在这样的情况下,这些聚合物自身固有的抗肿瘤活性可以补足有待递送的药剂的活性。这些专利公开的披露可以与本文针对递送一种或多种核酸靶向系统或其一种或多种组分或对其进行编码的一个或多个核酸分子的传授结合使用。超电荷蛋白超电荷蛋白是一类具有非常高的正或负理论净电荷的工程化的或天然存在的蛋白并且可以用于递送一种或多种核酸靶向系统或其一种或多种组分或对其进行编码的一个或多个核酸分子。超负电荷蛋白和超正电荷蛋白两者都展示出显著的抵抗热诱导或化学诱导的聚集的能力。超正电荷蛋白还能够渗透哺乳动物细胞。使负荷物与这些蛋白结合,如质粒dna、rna、或其他蛋白,可使得这些大分子到体外和体内的哺乳动物细胞中的功能递送成为可能。刘大卫实验室(davidliu’slab)在2007年报道了超电荷蛋白的建立和表征(劳伦斯(lawrence)等人,2007,美国化学会志(journaloftheamericanchemicalsociety)129,10110-10112)。rna和质粒dna到哺乳动物细胞中的非病毒递送对于研究和治疗应用都是有价值的(阿肯克(akinc)等人,2010,自然生物技术(nat.biotech.)26,561-569)。纯化的+36gfp蛋白(或其他超正电荷蛋白)与rna在适当的无血清培养基中混合并且允许在添加到细胞中之前复合。在这个阶段的血清的包含将会抑制超电荷蛋白-rna复合物的形成和降低治疗效果。已经发现以下方案对于多种细胞系是有效的(麦克诺顿(mcnaughton)等人,2009,美国国家科学院院刊(proc.natl.acad.sci.usa)106,6111-6116)。然而,应当进行改变蛋白和rna剂量的先导实验来优化用于特异性细胞系的程序。(1)在治疗前一天,以1x105个细胞/孔铺板于48孔板中。(2)在治疗当天,在无血清的培养基中稀释纯化的+36gfp蛋白直到终浓度200nm。添加rna到50nm的终浓度。涡旋混合并且在室温孵育10分钟。(3)在孵育过程中,抽吸培养基离开细胞并且再次用pbs洗涤。(4)在孵育+36gfp和rna之后,向细胞加入蛋白-rna复合物。(5)将细胞与复合物在37℃孵育4小时。(6)在孵育之后,抽出培养基并且用20u/ml的肝素pbs洗涤三次。用含血清培养基另外孵育细胞48小时或更长,这取决于用于活性的试验。(7)通过免疫印迹、qpcr、表型分析、或其他适当的方法分析细胞。刘大卫实验室(davidliu’slab)已经进一步发现+36gfp在一些列细胞中是一种有效的质粒递送试剂。由于质粒dna是一种比sirna大的负荷物,有效复合质粒需要成比例地更大的+36gfp蛋白。为了有效质粒递送,申请人已经开发了一种带有c末端ha2肽标签的+36gfp变体,这种肽是一种已知的从流感病毒血凝素蛋白衍生的内体破坏肽。下列方案在多种细胞中是有效的,但是如上所述,建议针对特异性细胞系和递送应用优化质粒dna的超电荷蛋白的剂量。(1)在治疗前一天,以1x105/孔铺板于48孔板中。(2)在治疗当天,在无血清的培养基中稀释纯化的gfp蛋白直到终浓度2mm。加入1mg的质粒dna。涡旋混合并且在室温孵育10分钟。(3)在孵育过程中,抽吸培养基离开细胞并且再次用pbs洗涤。(4)在孵育gfp和质粒dna之后,向细胞轻轻加入蛋白-dna复合物。(5)将细胞与复合物在37℃孵育4小时。(6)在孵育之后,抽出培养基并且用pbs洗涤。在含血清培养基中孵育细胞,并且另外孵育24-48小时。(7)在适当时分析质粒递送(例如,通过质粒驱动的基因表达)。还参见,例如mcnaughton等人,proc.natl.acad.sci.usa[美国国家科学院院刊]106,6111-6116(2009);cronican等人,acschemicalbiology[acs化学生物学]5,747-752(2010);cronican等人,chemistry&biology[化学与生物学]18,833-838(2011);thompson等人,methodsinenzymology[酶学方法]503,293-319(2012);thompson,d.b.等人,chemistry&biology[化学与生物学]19(7),831-843(2012)。超电荷蛋白的这些方法可以使用和/或适用于本发明的核酸靶向系统的递送。lui博士(dr.lui)以及与在此教导结合的本文的文献的这些系统可以用于递送一种或多种核酸靶向系统或其一种或多种组分或对其进行编码的一个或多个核酸分子。细胞穿透肽(cpp)在又另一个实施例中,考虑了细胞穿透肽(cpp)用于递送crisprcas系统。cpp是短肽,其促进细胞吸收不同分子负荷物(从纳米级粒子到小化学分子和dna的大片段)。如在此使用的术语“负荷物”包括但不限于下组,该组由以下组成:治疗剂、诊断探针、肽、核酸、反义寡核苷酸、质粒、蛋白、粒子(包括粒子)、脂质体、发色团、小分子和放射性物质。在本发明的多个方面,该负荷物还可包括crisprcas系统的任何组分或整个功能性crisprcas系统。本发明的方面进一步提供了用于将希望的负荷物递送到受试者体内的方法,这些方法包括:(a)制备一种复合物,其包含本发明的细胞穿透肽以及希望的负荷物,并且(b)经口服、关节内、腹膜内、鞘内、动脉内(intrarterially)、鼻内、实质内、皮下、肌内、静脉内、真皮、直肠内地、或局部给予该复合物至一位受试者。负荷物是通过化学键经由共价键或通过非共价相互作用与这些肽相关。cpp的功能是将该负荷物递送进入细胞,这是一种通常通过内吞作用发生的过程,其中该负荷物被递送到活体哺乳动物细胞的内体。细胞穿透肽具有不同的尺寸、氨基酸序列、和电荷,但所有cpp具有一种不同的特征,该特征是转位质膜并协助将各种分子量的负荷物递送到细胞质或细胞器的能力。cpp转位可以分为三个主要的进入机制:直接渗透于膜中、内吞作用-介导的进入、和通过形成暂时性结构转位。cpp已经发现在治疗不同疾病中在药物(包括癌症和病毒抑制剂)中作为药物递送剂的许多应用、连同在用于细胞标记的造影剂中的许多应用。后者的实例包括充当用于gfp、mri造影剂、或量子点的载体。cpp具有很大的作为用于研究和医学的体外和体内递送载体的潜力。cpp典型地具有一种氨基酸组合物,该氨基酸组合物包含高相对丰度的带负电荷的氨基酸,例如赖氨酸或精氨酸,或具有包含交替模式的极性/带电荷的氨基酸和非极性疏水性氨基酸的序列。这两种类型的结构分别称为聚阳离子或两亲性的。第三类cpp是仅含有非极性残基的疏水性肽,具有低净电荷或具有对于细胞摄入关键的疏水氨基酸基团。发现的初始cpp之一是来自人类免疫缺陷病毒1(hiv-1)的反式-激活转录激活物(tat),发现其高效地从周围介质被许多培养中的细胞类型摄取。从此以后,已知cpp的数目已经显著扩大,并且已经产生具有更有效蛋白转导特性的小分子合成类似物。cpp包括但不限于穿透素、tat(48-60)、转运素(transportan)、以及(r-ahx-r4)(ahx=氨基己酰基)。美国专利8,372,951提供了来源于嗜酸性粒细胞阳离子蛋白(ecp)的cpp,它展示出高度细胞穿透效率和低毒性。还提供了将cpp与其内负荷物递送进脊椎动物受试者中的多个方面。cpp的又一个方面及其递送描述于美国专利8,575,305;8,614,194和8,044,019中。cpp可以用来递送crispr-cas系统或其组分。可以采用cpp递送crispr-cas系统或其组分,也被提供于原稿“genedisruptionbycell-penetratingpeptide-mediateddeliveryofcas9proteinandguiderna[通过细胞穿透肽介导的对cas9蛋白和指导rna的递送进行的基因破坏]”,sureshramakrishna,abu-bonsrahkwakudad,jagadishbeloor等人,genomeres.[基因组研究],2014年4月2日。[电子出版先于印刷],通过引用以其整体并入,其中证实了用cpp-缀合的重组cas9蛋白和cpp-复合的指导rna进行治疗导致在人细胞系中的内源基因破坏。在该论文中,cas9蛋白经由硫醚键缀合至cpp,而指导rna与cpp复合,形成形成缩合的、带负电荷的粒子。已经显示,用修饰的cas9和指导rna同时和顺序地治疗人细胞,包括胚胎干细胞、真皮成纤维细胞、hek293t细胞、海拉(hela)细胞、和胚胎癌细胞,导致有效的基因破坏,伴随相对于质粒转染而言降低的脱靶突变。可植入装置在另一个实施例中,还考虑可植入装置用于递送该核酸靶向系统或其一种或多种组分或对其进行编码的一个或多个核酸分子。例如,美国专利公开20110195123披露了一种可植入医用装置,其局部地并且在延长的时期内洗脱药物,包括几种类型的这种装置、实施的治疗方式和植入方法。该装置包含聚合物基材,例如,用作装置主体的基质、以及药物,并且在一些情况下包含另外的支架材料,如金属或另外的聚合物,以及增强可见度和成像的材料。可植入递送装置在提供局部的并且在延长的时期内的释放方面可以是有利的,其中药物直接释放到患病区域的细胞外基质(ecm),所述患病区域如肿瘤、炎症、退化,或用于针对症状的目的,或者释放到受损的平滑肌细胞,或者用于预防。如在此公开的,一类药物是rna,并且这个系统可以用于和/或适用于本发明的核酸靶向系统。在一些实施例中,植入方式为用于包括近距离放射疗法和针吸活组织检查在内的其他治疗的、当今开发和使用的现有植入程序。在这样的情况下,在本发明中描述的新植入物的尺寸类似于初始植入物。典型地在相同的治疗程序中植物很少的装置。美国专利公开20110195123提供了药物递送可植入或可插入系统,包括适用于空腔例如腹腔和/或其中药物递送系统未被锚定或附接的任何其他类型的给药,其包含生物稳定的和/或可降解的和/或生物可吸收的聚合物基材,其可以例如任选地是基质。应当指出的是术语“插入”也包括植入。该药物递送系统优选地被实施为如美国专利公开20110195123中描述的“装填器(loder)”。聚合物或多种聚合物是生物相容的,其结合一种药剂和/或多种药剂,使得药剂以控制的速率释放,其中该聚合物基材如基质的总体积,例如在一些实施例中是任选地并且优选地不大于容许达到该药剂的治疗水平的最大体积。作为一个非限制性实例,这样的体积优选在0.1m3至1000mm3的范围内,正如该药剂负荷的体积所要求的。该装填器任选地是更大的,例如当结合有一个其尺寸由功能性决定的装置时,例如而不限于,膝关节、宫内节育环或子宫颈环等等。在一些实施例中,该药物递送系统(用于递送该组合物)被设计为优选地采用可降解聚合物,其中主要释放机制是本体溶蚀(bulkerosion);或者在一些实施例中,使用了不可降解的、或缓慢降解的聚合物,其中主要释放机制是扩散而不是本体溶蚀,使得外部部分用作膜,而其内部部分用作储药池,该储药池在延长的时期内(例如从约一周到约几个月)实际上不受环境的影响。还可以任选地使用具有不同释放机制的不同聚合物的组合。在总药物释放期的重要时段期间,在表面处的浓度梯度优选地被维持有效地恒定,并且因此扩散速率是有效地恒定的(称为“零模式”扩散)。关于术语“恒定”,它意指优选地维持在治疗效果的低阈值以上的扩散速率,但是可以仍然任选地具有初期突释的特征和/或可以波动,例如增加和降低到一定程度。该扩散速率优选地被如此维持一个延长的时期,并且它被考虑为相对于一定的水平是恒定的,以便优化治疗有效期,例如该有效沉默期。该药物递送系统任选地并且优选地被设计为保护基于核苷酸的治疗剂免于降解,而不论化学性质或由于受试者体内的酶和其他因素的攻击。美国专利公开20110195123的药物递送系统任选地与传感和/或激活器具相关,这些器具通过激活和/或加速/减速的无创和/或微创方法在该装置的植入之时和/或之后被操作,例如任选地包括但不限于热力加热和冷却、激光束和超声波,包括聚焦超声和/或rf(射频)方法或装置。根据美国专利公开20110195123的以下实施例,用于局部递送的部位可以任选地包括其特征为高度异常的细胞增殖、受到抑制的细胞凋亡的靶部位,包括肿瘤、活动性和/或慢性炎症和感染,包括自身免疫性疾病状态、退化组织(包括肌肉和神经组织)、慢性疼痛、退行性部位,以及用于增强组织再生的骨折位置以及其他伤口位置,以及损伤的心肌、平滑肌和横纹肌。用于植入该组合物的部位、或靶部位,优选地其特征为用于靶向局部递送的足够小的半径、面积和/或体积。例如,该靶部位任选地具有在从约0.1mm到约5cm范围内的直径。该靶部位的位置优选地针对最大治疗效力而选择。例如,该药物递送系统的组合物(任选地与如上所述的用于植入的装置一起)任选地并且优选地被植入在肿瘤环境或与之相关的血供之内或者附近。例如该组合物(任选地与该装置一起)任选地植入在胰脏、前列腺、乳房、肝脏之内或附近,通过乳头,在血管系统之内,等等。靶位置任选地选自下组,该组包含以下、基本上由以下组成、或由以下组成(仅仅作为非限制性实例,因为任选地在身体内的任何部位可以适合于植入装填器):1.脑,在退行性部位,像在帕金森病或阿尔茨海默病中的基底神经节、白质和灰质;2.如在肌萎缩性脊髓侧索硬化症(als)的情况下的脊柱;3.子宫颈以预防hpv感染;4.活动性或慢性炎性关节;5.在银屑病情况下的真皮;6.交感神经部位和感觉神经部位用于止痛作用;7.骨内植入;8.急性和慢性感染部位;9.阴道内;10.内耳--听觉系统、内耳的迷路、前庭系统;11.气管内;12.心内;冠状动脉、心外膜;13.膀胱;14.胆道系统;15.实质组织,包括且不限于肾脏、肝脏、脾脏;16.淋巴结;17.唾液腺;18.牙龈;19.关节内(进入关节);20.眼内;21.生物组织;22.脑室;23.空腔,包括腹腔(例如但不限于,用于卵巢癌);24.食管内以及25.直肠内。任选地,该系统(例如含有该组合物的装置)的插入与向在该靶部位和该部位附近的ecm注射材料有关,从而影响该靶部位和这个部位附近的ecm中的局部ph和/或温度和/或影响该药物的扩散和/或药物动力学的其他生物因素。任选地,根据一些实施例,所述药剂的释放可以与传感和/或激活器具相关,这些器具通过激活和/或加速/减速的无创和/或微创方法和/或别的方法在插入之前和/或之时和/或之后被操作,所述方法包括激光束、放射、热力加热和冷却、和超声波,包括聚焦超声和/或rf(射频)方法或装置、以及化学激活物。根据美国专利公开20110195123的其他实施例,该药物优选地包括rna,例如,对于局限性癌症情况,在乳房、胰脏、脑、肾脏、膀胱、肺、以及前列腺中,如下文所述。尽管用rnai进行示例,但是许多药物可适用于封装在装填器中,并且可以与本发明相关,只要这样的药物可以被封装在装填器基材(例如像一种基质)中即可,并且这种系统可以使用和/或适配来递送本发明的核酸靶向系统。作为特殊应用的另一个实例,神经肌肉退行性疾病由于异常基因表达而发生。rna的局部递送可以具有干扰这样的异常基因表达的治疗特性。包括小分子药物和大分子在内的抗凋亡、抗炎和抗退行性药物的局部递送也可以任选地是治疗性的。在这样的情况下,该装填器用于以恒定速率和/或通过单独植入的专用装置延长释放。这都可以用于和/或适用于本发明的核酸靶向系统。作为特殊应用的又另一个实例,用基因修饰剂治疗精神和认知障碍。基因敲低是治疗选项。向中枢神经系统部位局部递送药剂的装填器是对于精神和认知障碍的治疗选项,这些精神和认知障碍包括但不限于,精神病、双极性疾病、神经性障碍和行为疾病(behavioralmaladies)。这些装填器也可以在特定脑部位进行植入时局部递送包括小分子药物和大分子的药物。这都可以用于和/或适用于本发明的核酸靶向系统。作为特殊应用的另一个实例,在局部部位的先天性和/或适应性免疫介质的沉默使得能够预防器官移植排斥。用植入到移植器官和/或植入部位的装填器局部递送rna和免疫调节试剂致使经由排斥性免疫细胞(如针对移植器官而被激活的cd8)的局部免疫抑制。这都可以用于和/或适用于本发明的核酸靶向系统。作为特殊应用的另一个实例,包括vegf和血管生成素及其他在内的血管生长因子对于新血管形成是必需的。这些因子、肽、肽模拟物的局部递送或抑制它们的阻遏物是一种重要的治疗模式;使阻遏物沉默以及用装填器局部递送刺激血管发生的这些因子、肽、大分子和小分子药物对于周围血管疾病、全身性血管疾病和心血管疾病是治疗性的。插入的方法,如植入,可以任选地已用于其他类型的组织植入和/或用于组织取样,任选地在这种方法中没有修改,或者可替代地任选地仅仅具有非重点修改。这样的方法任选地包括但不限于,近距离放射治疗方法、活组织检查、用和/或不用超声的内窥镜检查如ercp、进入脑组织的立体定向法、腹腔镜检查,包括用腹腔镜进入关节、腹腔器官、膀胱壁和体腔的植入。在本文讨论的可植入装置技术可以与本文的教导一起使用并且因此根据本披露和本领域的知识,可以经由可植入装置递送crispr-cas系统或其组分或其核酸分子或编码或提供组分的核酸分子。患者特异性筛选方法靶向rna(例如三核苷酸重复)的核酸靶向系统可以用于针对此类重复的存在对患者或患者样品进行筛选。这些重复可以是该核酸靶向系统的rna的靶标,并且如果被该核酸靶向系统结合至其上,则可以检测到该结合,以由此指示存在这样一个重复。因此,核酸靶向系统可以用于针对该重复的存在对患者或患者样品进行筛选。然后可以向该患者给药一种或多种适合的化合物以解决该病症;或者,可以向该患者给药核酸靶向系统,该系统结合到并且引起插入、缺失或突变并且减轻该病症。本发明使用核酸来结合靶rna序列。crispr效应蛋白mrna和指导rna也可以单独递送crispr效应蛋白mrna和指导rna。可以在该指导rna在给出时间以待crispr效应蛋白表达之前递送crispr效应蛋白mrna。可以在给药指导rna之前1-12小时(优选约2-6小时)给药crispr效应蛋白mrna。可替代地,可以一起给药crispr效应蛋白mrna和指导rna。有利地,可以在初始给药crispr效应蛋白mrna+指导rna之后1-12小时(优选约2-6小时)给药指导rna的第二加强剂量。本发明的crispr效应蛋白,即组29或组30效应蛋白有时在此称为crispr酶。应当理解的是,效应蛋白是基于或来源于酶的,因此术语“效应蛋白”在一些实施例中当然包括“酶”。然而,应当理解的是,效应蛋白可以如在一些实施例中所要求的那样具有dna或rna结合但不一定具有切割(cutting)或切口(nicking)活性(包括死亡cas效应蛋白功能)。在一些实施例中,可以被靶向的疾病包括与引起疾病的剪接缺陷有关的那些。在一些实施例中,细胞靶标包括造血干细胞/祖细胞(cd34+);人类t细胞;以及眼(视网膜细胞)-例如光感器前体细胞。在一些实施例中,基因靶标包括:人类β珠蛋白-hbb(用于治疗镰状细胞贫血,包括通过刺激基因转换(使用密切相关的hbd基因作为内源模板));cd3(t细胞);以及cep920-视网膜(眼)。在一些实施例中,疾病靶标还包括:癌症;镰状细胞贫血(基于点突变);hiv;β-地中海贫血;以及眼科或眼部疾病-例如引起莱伯(leber)先天性黑朦(lca)的剪接缺陷。在一些实施例中,递送方法包括:酶-指导复合物(核糖核蛋白)的阳离子脂质介导的“直接”递送和质粒dna的电穿孔。为了使毒性和脱靶效应最小化,重要的是控制所递送的crispr效应蛋白mrna和指导rna的浓度。crispr效应蛋白mrna和指导rna的最佳浓度可以通过在细胞或动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组基因座处的修饰的范围而确定。例如,对于靶向人类基因组的emx1基因中的5’-gagtccgagcagaagaagaa-3’的指导序列,可以使用深度测序来评定在下列两个脱靶位点处的修饰水平,1:5’-gagtcctagcaggagaagaa-3’和2:5’-gagtctaagcagaagaagaa-3’。对于体内递送,应当选择产生最高的中靶修饰水平同时将脱靶修饰水平最小化的浓度。可诱导系统在一些实施例中,crispr效应蛋白可以形成可诱导系统的组分。该系统的诱导性质将允许该系统利用一种能量形式对基因编辑或基因表达进行时空控制。该能量形式可以包括但不限于,电磁辐射、声能、化学能和热能。可诱导系统的实例包括四环素诱导型启动子(tet-开或tet-关)、小分子双杂交体转录激活系统(fkbp、aba等)或光可诱导系统(光敏素、lov结构域或隐花色素)。在一个实施例中,该crispr效应蛋白可以是以序列特异性方式指导转录活性的变化的光诱导的转录效应因子(lite)的一部分。光的组分可以包括crispr效应蛋白、光响应细胞色素异二聚体(例如,来自拟南芥)、以及转录激活/阻遏结构域。诱导型dna结合蛋白和关于使用它们的方法的其他实例提供在us61/736465和us61/721,283,以及wo2014018423a2中,特此通过引用以其整体并入。自我失活性系统一旦在细胞的基因组中一种基因的所有拷贝已经被编辑,在该细胞中crisrp/组29或组30效应蛋白继续表达不再是必需的。事实上,持续表达在未预期的基因组位点等处的脱靶效应的情况下会是不令人希望的。因此时间限制性表达会是有用的。诱导型表达提供了一种方法,但是此外申请人已经工程化自我失活性crispr系统,该系统依赖于在该crispr载体本身内使用非编码指导靶序列。因此,表达开始后,该crispr系统将导致其自身的破坏,但是在破坏完成之前,它将有时间编辑靶基因的基因组拷贝(在二倍体细胞中具有正常点突变的情况下,需要至多两个编辑)。简单地,该自我失活型crispr-cas系统包括另外的rna(即指导rna),该rna靶向crispr效应蛋白本身的编码序列或者靶向与存在于以下项的一个或多个中的独特序列互补的一种或多种非编码指导靶序列:(a)在驱动非编码rna元件的表达的启动子内,(b)在驱动效应蛋白基因的表达的启动子内,(c)在效应蛋白编码序列中的atg翻译起始密码子的100bp内,(d)在病毒递送载体的例如aav基因组中的反向末端重复(itr)内。另外,该rna可以经由载体递送,例如编码crispr复合物的单独的载体或相同的载体。当由单独的载体提供时,靶向cas表达的crisprrna可以顺序地或同时地给药。当顺序给药时,靶向cas表达的crisprrna是在旨在用于例如基因编辑或基因工程的crisprrna之后被递送。此时期可以是数分钟时期(例如5分钟,10分钟,20分钟,30分钟,45分钟,60分钟)。此时期可以是数小时时期(例如2小时,4小时,6小时,8小时,12小时,24小时)。此时期可以是数天时期(例如2天,3天,4天,7天)。此时期可以是数周时期(例如2周,3周,4周)。此时期可以是数月时期(例如2个月,4个月,8个月,12个月)。此时期可以是数年时期(例如2年,3年,4年)。在指导rna靶向编码cas蛋白的表达的序列的情况下,该效应蛋白变得受阻碍并且该系统变为自我失活型。以相同方式,经由例如如在此解释的脂质体、脂质转染、粒子、微泡来应用的靶向cas表达的crisprrna可以顺序地或同时地给药。类似地,自失活可以用于用以靶向一种或多种靶标的一种或多种指导rna的失活。在一些方面,提供单一grna,该单一grna能够杂交到crispr效应蛋白起始密码子的序列下游,借此在一段时间之后crispr效应蛋白表达有损失。在一些方面,提供一种或多种grna,所述grna能够杂交到编码crispr-cas系统的多核苷酸的一种或多种编码区或非编码区,借此在一段时间之后crispr-cas系统的一种或多种或者在一些情况下全部失活。在该系统的一些方面,并且不受理论限制,该细胞可以包含多种crispr-cas复合物,其中crispr复合物的第一子集包含能够靶向有待编辑的一个或多个基因组基因座的第一指导rna,并且crispr复合物的第二子集包含能够靶向编码crispr-cas系统的多核苷酸的至少一种第二指导rna,其中crispr-cas复合物的第一子集介导对靶向的一个或多个基因组基因座的编辑,并且crispr复合物的第二子集最终使crispr-cas系统失活,由此使细胞中进一步的crispr-cas表达失活。因此,本发明提供了一种crispr-cas系统,包括一种或多种用于递送至真核细胞的载体,其中该一种或多种载体编码:(i)crispr效应蛋白;(ii)第一指导rna,该第一指导rna能够杂交到细胞中的靶序列上;(iii)第二指导rna,该第二指导rna能够杂交到编码crispr效应蛋白的载体中的一种或多种靶序列上;因此区别仅在于指导序列,其中当在细胞内表达时:该第一指导rna引导第一crispr复合物与细胞中的靶序列的序列特异性结合;该第二指导rna引导第二crispr复合物与编码crispr效应蛋白的载体中的靶序列的序列特异性结合;这些crispr复合物包含:与指导rna结合的crispr效应蛋白,使得指导rna可以与其靶序列杂交;并且该第二crispr复合物使crispr-cas系统失活以防止该细胞对crispr效应蛋白继续表达。这些不同的编码序列(crispr效应蛋白和指导)可以被包括在单一载体上或多种载体上。例如,有可能在一个载体上编码该效应蛋白,并且在另一个载体上编码不同的rna序列,或者有可能在一个载体上编码该效应蛋白并且编码一个指导rna,并且在另一个载体上编码其余指导rna,或者任何其他排列。总体上,使用总计一种或两种不同载体的系统是优选的。在使用多种载体的情况下,有可能以不等数目递送它们,并且理想地采用相对于第二指导rna而言的过量的编码第一指导rna的载体,由此有助于延迟crispr系统的最终失活,直至基因组编辑已经具有发生的机会。该第一指导rna可以靶向基因组内的任何感兴趣靶序列,如在此其他地方所述。该第二指导rna靶向编码crispr组29或组30效应蛋白的载体内的序列,并且由此使来自该载体的效应蛋白表达失活。因此在载体中的靶序列必须能够使表达失活。适合的靶序列可以是例如接近组29或组30效应蛋白编码序列的翻译起始密码子或在其内,在驱动非编码rna元件的表达的启动子中的非编码序列中,在驱动组29或组30效应蛋白基因的表达的启动子内,在cas编码序列中的atg翻译起始密码子的100bp内,和/或在病毒递送载体的例如在aav基因组中的反向末端重复(itr)内。在此区附近的双链断裂可以诱导cas编码序列中的移码,导致蛋白表达的损失。“自我失活性”指导rna的可替代靶序列目的在于编辑/失活多个表达crispr-系统所需的或者载体稳定性所需的调节区/序列。例如,如果cas编码序列的启动子被破坏,则转录可以被抑制或阻止。类似地,如果载体包括用于复制、维持或稳定性的序列,则有可能靶向这些。例如,在aav载体中,有用的靶序列是在itr内。其他用以靶向的有用序列可以是启动子序列、聚腺苷酸化位点等。另外,如果指导rna以阵列形式表达,同时靶向两种启动子的“自我失活性”指导rna将导致从crispr-cas表达构建体切除间插核苷酸,有效地导致其完全失活。类似地,在指导rna靶向两种itr或同时靶向两个或更多个其他crispr-cas组分的情况下,间插核苷酸的切除将产生。总体上如在此解释的自失活采用用以提供crispr-cas的调节的crispr-cas系统是可应用的。例如,如在此解释的自失活可以应用至突变例如扩增障碍的crispr修复,如在此解释的。作为该自失活的结果,crispr修复仅是瞬时有活性的。将非靶向核苷酸添加至“自我失活性”指导rna的5’端(例如1-10个核苷酸,优选1-5个核苷酸)可以用于延迟其加工和/或修饰其效力,作为确保在crispr-cas停止之前在靶向的基因组基因座处进行编辑的手段。在自我失活性aav-crispr-cas系统的一个方面,共表达靶向感兴趣基因组序列(例如1-2、1-5、1-10、1-15、1-20、1-30)的一种或多种指导rna的质粒可以用“自我失活性”指导rna建立,该“自我失活性”sgrna靶向在工程化的atg起始位点处或其附近(例如,在5个核苷酸内,在15个核苷酸内,在30个核苷酸内,在50个核苷酸内,在100个核苷酸内)的spcas9序列。在u6启动子区中的调节序列还可以用指导rna靶向。u6驱动的sgrna可以按阵列形式设计,使得多种指导rna序列可以同时释放。当首次递送到靶组织/细胞(左细胞)中,指导rna开始累积,同时在细胞核中的cas水平上升。cas复合所有指导rna以介导crispr-cas质粒的基因组编辑和自失活。自我失活性crispr-cas系统的一个方面是表达单个或来自1至4个或更多个不同指导序列;例如高达约20个或约30个指导物。每个单独的自我失活型指导序列可以靶向不同的靶标。这些可以从例如一个嵌合pol3转录物加工。可以使用pol3启动子例如u6或h1启动子。pol2启动子,例如在此遍及全文提及的那些。反向末端重复(itr)序列可以在pol3启动子-指导rna(s)-pol2启动子-cas的侧翼。串联阵列转录物的一个方面是一种或多种指导物编辑一种或多种靶标,同时一种或多种自我失活型指导物使crispr-cas系统失活。因此,例如用于修复扩增障碍的描述的crispr-cas系统可以直接与在此描述的自我失活性crispr-cas系统组合。这种系统可以例如具有针对用于修复的靶区域的两种指导物,以及针对crispr-cas的自我失活的至少一种第三指导物。参考申请序列号pct/us2014/069897,标题为“compositionsandmethodsofuseofcrispr-cassystemsinnucleotiderepeatdisorders[crispr-cas系统在核苷酸重复障碍中使用的组合物和方法]”,公开于2014年12月12日作为wo/2015/089351。试剂盒在一个方面中,本发明提供了以下试剂盒,这些试剂盒包含披露于以上方法和组合物中的元件中的任何一个或多个。在一些实施例中,该试剂盒包含如在此教导的载体系统或如在此教导的crispr/cas系统的一种或多种组分,例如grna和/或效应蛋白或效应蛋白编码mrna,以及使用试剂盒的说明书。元件可以单独地或组合地提供,并且可以被提供于任何适合的容器中,如小瓶、瓶子或管。在一些实施例中,该试剂盒包括一种或多种语言,例如多于一种语言的说明书。这些说明书可以是特定于在此描述的应用和方法的。在一些实施例中,试剂盒包括一种或多种用于在利用在此描述的元件中的一种或多种的方法中使用的试剂。试剂可以被提供于任何适合的容器中。例如,试剂盒可以提供一种或多种反应或存储缓冲液。可以按在具体测定中可用的形式或按在使用之前需要添加一种或多种其他组分的形式(例如按浓缩或冻干形式)提供试剂。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、tris缓冲液、mops缓冲液、hepes缓冲液及其组合。在一些实施例中,该缓冲液是碱性的。在一些实施例中,该缓冲液具有从约7至约10的ph。在一些实施例中,该试剂盒包括一个或多个寡核苷酸,该一个或多个寡核苷酸对应于用于插入进载体中的指导序列,以便可操作地连接该指导序列和调控元件。在一些实施例中,该试剂盒包括在此描述的载体中的一个或多个和/或在此描述的多核苷酸中的一个或多个。该试剂盒可以有利地允许提供本发明的系统的所有元件。在一个方面中,本发明提供了用于使用crispr系统的一个或多个元件的方法。本发明的crispr复合物提供了用于修饰靶多核苷酸的有效手段。本发明的crispr复合物具有多种多样的实用性,包括修饰(例如,缺失、插入、转位、失活、激活)多种细胞类型中的靶多核苷酸。正因为如此,本发明的crispr复合物在例如基因治疗、药物筛选、疾病诊断以及预后中具有广阔的应用谱。示例性crispr复合物包括与一种指导序列复合的crispr效应蛋白,该指导序列与靶多核苷酸内的靶序列杂交。在某些实施例中,将同向重复序列连接到指导序列上。在一个实施例中,本发明提供了一种切割靶多核苷酸的方法。该方法包括使用crispr复合物修饰靶多核苷酸,该crispr复合物结合到该靶多核苷酸上并且实施所述靶多核苷酸的切割。典型地,当被引入进细胞中时,本发明的crispr复合物在靶序列中产生断裂(例如,单链或双链断裂)。例如,可以使用该方法切割细胞中的疾病基因或基因产物。在希望的情况下,供体多核苷酸可以是dna,例如dna质粒、细菌人工染色体(bac)、酵母人工染色体(yac)、病毒载体、一段线性dna、pcr片段、裸核酸或与递送媒介(如脂质体或泊洛沙姆)复合的核酸。在其他实施例中,本发明提供了一种修饰多核苷酸在真核细胞中的表达的方法。该方法包括通过使用结合到多核苷酸上的crispr复合物增加或降低靶多核苷酸的表达。在一些方法中,可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如,当crispr复合物结合到细胞中的一个靶序列上时,该靶多核苷酸失活,这样使得该序列不被转录,该编码蛋白不被产生,或者该序列不会像野生型序列一样起作用。例如,可以使蛋白或微小rna编码序列失活,这样使得该蛋白不被产生。在一些方法中,可以使控制序列失活,这样使得它不再作为控制序列起作用。如在此使用的,“控制序列”是指影响核酸序列的转录、翻译或可及性的任何核酸序列。控制序列的实例包括启动子、转录终止子和增强子,它们是控制序列。失活的靶序列可以包括缺失突变(即,缺失一个或多个核苷酸)、插入突变(即,插入一个或多个核苷酸)或无义突变(即,用另一个核苷酸取代一个单核苷酸,这样使得引入终止密码子)。在一些方法中,靶序列的失活导致该靶序列的“敲除”。使用crisprcas系统的示例性方法本发明提供了非天然存在的或工程化的组合物、或编码所述组合物的组分的一种或多种多核苷酸、或包含对所述组合物的组分进行编码的一种或多种多核苷酸的载体或递送系统,其用于体内、离体或体外修饰靶细胞,并且是以改变细胞使得一旦被修饰则crispr修饰的细胞的子代或细胞系保留改变的表型的方式进行。这些修饰的细胞和子代可以是多细胞生物例如植物或动物的部分,其中在离体或体内向希望的细胞型应用crispr系统。crispr发明可以是治疗性处理方法。该治疗性处理方法可以包括基因或基因组编辑、或基因治疗和或基因敲低。使用crisprcas系统或复合物修饰靶标(例如,组29或组30效应蛋白-rna复合物)在一个方面中,本发明提供了修饰真核细胞中的靶多核苷酸的方法,这些方法可以在体内、离体或在体外进行。在一些实施例中,该方法包括对来自人或非人动物的细胞或细胞群进行取样,并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入该非人动物或植物中。对于重新引入的细胞,特别优选的是这些细胞是干细胞。在一些实施例中,该方法包括允许crispr复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该crispr复合物包含与指导序列复合的crispr效应蛋白,该指导序列可以与所述靶多核苷酸内的靶序列杂交或可与其杂交。在一个方面中,本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中,该方法包括允许crispr复合物结合到该多核苷酸上,这样使得所述结合导致所述多核苷酸的表达增加或降低;其中crispr复合物包含与指导序列复合的crispr效应蛋白,该指导序列与所述多核苷酸内的靶序列杂交或可与其杂交。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。事实上,这些取样、培养和重新引入选择跨本发明的多个方面而适用。的确,在本发明的任何方面,该crispr复合物可以包含与指导序列复合的crispr效应蛋白,该指导序列与靶序列杂交或可与其杂交。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。因此,在此描述的任何非天然存在的crispr效应蛋白包含至少一种修饰,并且其中效应蛋白具有某些改善的能力。具体而言,这些效应蛋白中的任一种能够与指导rna形成crispr复合物。当这种复合物形成时,该指导rna能够结合至靶多核苷酸序列上,并且该效应蛋白能够改变靶基因座。此外,与未修饰的酶/效应蛋白相比,在该crispr复合物中的效应蛋白具有降低的修饰一个或多个脱靶基因座的能力。此外,与未修饰的酶相比,在此描述的修饰的crispr酶涵盖这样的酶,由此其在crispr复合物中该效应蛋白具有增加的修饰一个或多个靶基因座的能力。这种功能可以单独或与降低的修饰一个或多个脱靶位点的能力的上述功能组合提供。任何此类效应蛋白可以被提供为具有对如在此描述的crispr效应蛋白的任一种另外修饰,例如与由一种或多种相关异源功能域提供的任何活性、用以降低核酸酶活性的任何另外突变等相组合。在本发明的有利的实施例中,经修饰的crispr效应蛋白被提供为与未修饰的酶/效应蛋白相比具有降低的修饰一个或多个脱靶位点的能力,并且与未修饰的酶/效应蛋白相比具有增加的修饰一个或多个靶基因座的能力。与对效应蛋白的另外修饰相组合,可以实现显著增强特异性。例如,提供了此类有利实施例与一种或多种另外的突变的组合,其中该一种或多种另外的突变是在一个或多个催化活性结构域中。此类另外的催化突变可以赋予切割酶如本文其他处详细描述的切割酶功能性。在此类效应蛋白中,可以由于在效应蛋白活性方面改进的特异性实现增强的特异性。如以上所述用以降低脱靶效应和/或增强靶标效应的修饰可以被制成位于带正电荷的区域/凹槽中的氨基酸残基,该带正电荷的区域/凹槽位于ruvc-iii和hnh之间。应当理解的是,可以通过修饰上述凹槽内的氨基酸,但还要通过修饰邻近于该凹槽或其外部的氨基酸来实现上述任何功能性作用。可以被工程化到如在此描述的经修饰的crispr效应蛋白中的另外的功能性包括以下这些。1.修饰的crispr效应蛋白破坏dna或rna:蛋白相互作用而不影响蛋白三级或二级结构。这包括接触rna:dna或rna:rna双链体任何部分的残基。2.修饰的crispr效应蛋白,其弱化蛋白内相互作用,该蛋白内相互作用使效应蛋白保持响应于dna结合(靶标或脱靶)的核酸酶切割所必需的构象。例如:轻度抑制、但仍然允许hnh结构域(定位在易切断的磷酸酯处)的核酸酶构象的修饰。3.经修饰的crispr效应蛋白,其强化蛋白内相互作用,该蛋白内相互作用使效应蛋白保持对响应于dna/rna结合(靶标或脱靶)的核酸酶活性进行抑制的构象。例如:将hnh结构域稳定在远离易切断的磷酸酯的构象中的修饰。任何这种功能增强可以提供为与如本文其他处详细描述的对crispr效应蛋白的任何其他修饰相组合。可以对任何crispr效应蛋白组29或组30效应蛋白进行任何本文所述的改进的功能性。然而,应理解的是,本文所述的任何功能性可以工程化到来自其他直向同源物的组29或组30组29或组30效应蛋白,包括包含来自多个直向同源物的片段的嵌合效应蛋白。本发明使用核酸来结合靶dna或rna序列。这是有利的,因为产生核酸比产生蛋白质容易且价廉得多,并且特异性可以根据其中寻求同源性的拉伸长度而变化。例如多指的复杂3-d复杂定位是不需要的。术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换地使用。它们是指具有任何长度的核苷酸的聚合形式,是脱氧核糖核苷酸或核糖核苷酸、或其类似物。多核苷酸可具有任何三维结构,并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、根据连接分析定义的多个座位(一个座位)、外显子、内含子、信使rna(mrna)、转运rna、核糖体rna、短干扰rna(sirna)、短发夹rna(shrna)、micro-rna(mirna)、核酶、cdna、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的dna、任何序列的分离的rna、核酸探针、和引物。该术语还涵盖具有合成骨架的核酸样结构,参见,例如,埃克斯坦(eckstein),1991;巴塞加(baserga)等人,1992;米利根(milligan),1993;wo97/03211;wo96/39154;马塔(mata),1997;施特劳斯-绍库普(strauss-soukup),1997;和扎姆斯塔(samstag),1996。多核苷酸可以包含一个或多个经修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在,可以在聚合物组装之前或之后进行核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后,如通过与标记的组分缀合来进一步修饰。如本文所用的术语“野生型”是本领域技术人员所理解的术语,并且表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征。“野生型”可以是基线。如本文所用的术语“变体”应当被理解为表示具有衍生自在自然界中存在的模式的性质的展示。术语“非天然存在的”或“工程化的”可互换地使用并且表面人工的参与。这些术语,当指核酸分子或多肽时,表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克碱基配对或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有5、6、7、8、9、10个即为50%、60%、70%、80%、90%、和100%互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互补程度,或者是指在严格条件下杂交的两个核酸。如本文使用的对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。一般而言,该序列越长,则该序列特异性地杂交到其靶序列上的温度就越高。严格条件的非限制性实例描述于蒂森(tijssen)(1993)的生物化学和分子生物学中的实验室技术-核酸探针杂交(laboratorytechniquesinbiochemistryandmolecularbiology-hybridizationwithnucleicacidprobes),第i部分,第二章,“杂交原理概述和核酸探针分析策略”(“overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassay”),爱思唯尔(elsevier),纽约。在提及一个多核苷酸序列时,那么也设想了互补的或部分互补的序列。能够在高严格条件下杂交到参考序列上的这些序列是优选的。通常,为了使杂交率最大化,选择了相对低严格性的杂交条件:低于热熔点(tm)约20℃到25℃。tm是50%的特异性靶序列在具有规定的离子强度和ph的溶液中杂交到完全互补的探针上的温度。通常,为了要求杂交序列的至少约85%的核苷酸互补性,高严格洗涤条件被选择为低于tm约5℃到15℃。为了要求杂交序列的至少约70%的核苷酸互补性,中等严格洗涤条件被选择为低于tm约15℃到30℃。高容许(极低严格性)洗涤条件可以低至在tm之下50℃,从而允许在杂交序列之间的高水平错配。本领域技术人员将认识到,在杂交和洗涤阶段中的其他物理和化学参数也可以改变,从而影响来自在靶序列与探针序列之间的特定同源性水平的可检测杂交信号的结果。优选的高严格条件包括在50%甲酰胺、5×ssc、和1%sds中在42℃孵育,或者在5×ssc和1%sds中在65℃孵育,在0.2×ssc和0.1%sds中在65℃洗涤。“杂交”是指其中一个或多个多核苷酸反应形成一种复合物的反应,该复合物经由这些核苷酸残基之间的碱基的氢键键合而稳定化。氢键键合可以借助于沃森-克里克碱基配对、hoogstein结合或以任何其他序列特异性方式而发生。该复合物可包含形成一个双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成更广泛的过程(如pcr的开始、或经由一种酶的多核苷酸的切割)中的步骤。能够与给定序列杂交的序列被称为该给定序列的“互补物”。如本文使用的,术语“基因组座位(locus)”或“座位(locus)”(复数是座位(loci))是在染色体上的基因或dna序列的特定位置。“基因”是指编码多肽或rna链的dna或rna的段(stretch),其在生物中发挥功能作用并且因此是活生物遗传的分子单元。出于本发明的目的,可以考虑包括调节基因产物的产生的区域的基因,而不论这样的调节序列是否接近编码和/或转录的序列。因此,基因包括而不必限于,启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、隔离子、边界元件、复制起点、核基质附着位点和座位控制区。如本文使用的“基因组座位的表达”或“基因表达”是藉此在功能性基因产物的合成中使用来自基因的信息的过程。基因表达的产物常常是蛋白质,但是在非蛋白质编码基因如rrna基因或trna基因中,产物是功能性rna。基因表达的过程由所有已知的生物利用-产生功能性产物以便存活的真核生物(包括多细胞生物)、原核生物(细菌和古细菌)以及病毒。如本文使用的基因或核酸的“表达”不仅涵盖细胞基因表达,而且涵盖在克隆系统中或在任何其他背景下的一个或多个核酸的转录和翻译。如本文使用的“表达”是指藉此从dna模板转录成多核苷酸(如转录成mrna或其他rna转录物)的过程和/或转录的mrna随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组dna,表达可以包括真核细胞中mrna的剪接。术语“多肽”、“肽”和“蛋白质”在本文可互换地使用,是指具有任何长度的氨基酸的聚合物。所述聚合物可为直链型或分支型,其可包含经过修饰的氨基酸,并且其可由非氨基酸中断。这些术语还涵盖已经被修饰的氨基酸聚合物;这些修饰例如二硫键形成、糖基化、脂化(lipidation)、乙酰化、磷酸化、或任何其他操纵,如与标记组分的缀合。如本文使用的术语“氨基酸”包括天然的和/或非天然的或者合成的氨基酸,包括甘氨酸以及d和l旋光异构体、以及氨基酸类似物和肽模拟物。如本文使用的,术语“结构域”或“蛋白结构域”是指可以独立于该蛋白质链的其余部分而存在并且起作用的蛋白质序列的一部分。正如在本发明的多个方面中所描述,序列一致性与序列同源性有关。可以通过肉眼、更通常地借助于可得的序列比较程序来进行同源性比较。这些可商购的计算机程序可以计算在两个或更多个序列之间的同源性的百分比(%)并且还可以计算由两个或更多个氨基酸或核酸序列共享的序列一致性。在本发明的多个方面中,术语“指导rna”,是指包括以下项中的一种或多种的多核苷酸序列:假定或鉴定的tracr序列和假定或鉴定的crrna序列或指导序列。在具体实施例中,“指导rna”包括假定或鉴别的crrna序列或指导序列。在另外的实施例中,该指导rna不包括假定或鉴定的tracr序列。如本文所用的术语“野生型”是本领域技术人员所理解的术语,并且表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征。“野生型”可以是基线。如本文所用的术语“变体”应当被理解为表示具有衍生自在自然界中存在的模式的性质的展示。术语“非天然存在的”或“工程化的”可互换地使用并且表面人工的参与。这些术语,当指核酸分子或多肽时,表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。在所有方面和实施例中,无论它们是否包括这些术语,将理解的是,优选地,可以是任选的并且由此是优选包括的或不是优选不包括的。此外,术语“非天然存在的”和“工程化”可以互换地使用,并且因此可以单独或组合使用,并且一者或另一者可以替代两种一起的提及。具体地,“工程化”优选替代“非天然存在的”或“非天然存在的和/或工程化的”。可以通过本领域已知的许多计算机程序(例如blast或fasta等等)来生成序列同源性。用于进行这样的比对的适合的计算机程序是gcg威斯康星bestfit软件包(威斯康星大学,美国;devereux等人,1984,nucleicacidsresearch[核酸研究]12:387)。可以进行序列比较的其他软件的实例包括但不限于,blast软件包(参见ausubel等人,1999,出处同上-第18章)、fast(aatschul等人,1990,j.mol.biol.[分子生物学杂志],403-410)以及geneworks系列比较工具。blast和fasta均可用于离线和在线搜索(参见奥苏贝尔(ausubel)等人,1999,出处同上,7-58页到7-60页)。然而,优选使用gcgbestfit程序。可以计算在连续序列上的序列同源性百分比(%),即,将一个序列与另一个序列比对,并且将一个序列中的每个氨基酸或核苷酸与另一个序列中的相应氨基酸或核苷酸直接进行比较,一次比较一个残基。这被称为“无空位”比对。典型地,这样的无空位比对仅仅在较少数目的残基上进行。虽然这是一种非常简单和一致的方法,但是它未能考虑的是,例如,在其他方面完全相同的序列对中,一个插入或缺失可以引起随后的氨基酸残基被排除在比对之外,因此当进行全局比对时可能导致在同源性%上的大幅降低。因此,大多数序列比较方法被设计为产生考虑到可能的插入和缺失的优化比对,而没有过度地使总体同源性或一致性评分不利。这是通过在序列比对中插入“空位”来实现的,以便试图将局部同源性或一致性最大化。然而,这些更复杂的方法向出现在该比对中的每个空位分配“空位罚分”,从而对于相同数目的一致的氨基酸而言,具有尽可能少的空位的序列比对-反映了在这两个比较的序列之间的更高关联性-可以比具有许多空位者实现更高的得分。“亲合空位成本”(“affinitygapcosts”)典型地用于对空位的存在要求相对高的成本并对空位中的每个后续残基施加较小的罚分。这是最常用的空位评分系统。高空位罚分当然将产生具有更少空位的最佳比对。大多数比对程序允许修改空位罚分。然而,当使用这种序列比较软件时优选使用默认值。例如当使用gcg威斯康星bestfit软件包时,氨基酸序列的默认空位罚分为对于每个空位的-12,以及对于每个延伸的-4。因此计算最大同源性%首先要求产生最佳比对,考虑空位罚分。用于进行这样的比对的适合的计算机程序是gcg威斯康星bestfit软件包(devereux等人,1984,nucleicacidsresearch[核酸研究]12p387)。可以进行序列比较的其他软件的实例包括但不限于,blast软件包(参见ausubel等人,1999shortprotocolsinmolecularbiology[精编分子生物学实验指南],第4次编辑-第18章)、fasta(altschul等人,1990j.mol.biol.[分子生物学杂志]403-410)以及geneworks系列比较工具。blast和fasta均可用于离线和在线搜索(参见ausubel等人,1999,shortprotocolsinmolecularbiology[精编分子生物学实验指南],第7-58页到第7-60页)。然而,对于一些应用,优选使用gcgbestfit程序。一种新的工具,称为blast2序列,也可用于比较蛋白质和核苷酸序列(参见femsmicrobiollett.[欧洲微生物学会联合会微生物学快报]1999174(2):247-50;femsmicrobiollett.[欧洲微生物学会联合会微生物学快报]1999177(1):187-8以及在国立卫生研究院的网址的国家生物技术信息中心的网址)。虽然最终同源性%可以按照一致性进行测量,但是比对过程自身典型地不是基于全或无配对比较(all-or-nothingpaircomparison)。相反,通常使用尺度相似性评分矩阵(scaledsimilarityscorematrix),基于化学相似性或进化距离对各个成对比较评分。通常使用的这种矩阵的实例为blosum62矩阵-blast系列程序的默认矩阵。gcg威斯康星程序通常使用公开的默认值或自定义符号比较表(更多细节详见用户手册)。对于一些应用,优选使用gcg软件包的公共默认值,或在其他软件情况下的默认矩阵,如blosum62。可替代地,可以基于类似于clustal(希金斯dg(higginsdg)和夏普pm(sharppm)(1988),基因(gene)73(1),237-244)的一种算法,使用在dnasistm(日立软件公司(hitachisoftware))中的多重比对特征来计算同源性百分比。一旦软件已经产生最佳比对,就有可能计算同源性%,优选序列一致性%。软件典型地这样进行,作为序列比较的一部分,并且产生数字结果。这些序列也可以具有氨基酸残基的缺失、插入或取代,其产生沉默变化并生成功能上等同的物质。可以基于氨基酸特性(如残基的极性、电荷、可溶性、疏水性、亲水性、和/或两亲性)的相似性做出有意氨基酸取代,并且因此它在将氨基酸集合成官能团中是有用的。可以仅仅基于氨基酸的侧链特性将它们集合在一起。然而,包括突变数据同样是更有用的。出于结构原因,如此衍生的氨基酸的集合很有可能是保守性的。这些集合可以被描述为文氏图形式(venndiagram)(livingstonec.d.和bartong.j.(1993)“proteinsequencealignments:astrategyforthehierarchicalanalysisofresidueconservation[蛋白质序列比对:用于残基保守些的分级分析的策略]”comput.appl.biosci.[生物科学计算应用]9:745-756)(taylorw.r.(1986)“theclassificationofaminoacidconservation[氨基酸保守性的分类]”j.theor.biol.[理论生物学杂志]119;205-218)。例如可以根据下表做出保守性取代,该表描述了普遍接受的氨基酸的文氏图分组。术语“受试者”、“个体”和“患者”在本文中是可互换地使用的,指的是脊椎动物,优选地是哺乳动物,更加优选地是人类。哺乳动物包括但不限于鼠类、猴、人、农畜、体育用动物和宠物。也包括体内获得或体外培养的生物实体的组织、细胞及其子代。术语“治疗剂(therapeuticagent)”、“可用于治疗的试剂(therapeuticcapableagent)”或“处理剂(treatmentagent)”是可互换地使用的,并且是指在给予受试者时赋予某种有益影响的一种分子或化合物。该有益影响包括诊断确定的实现;改善疾病、症状、障碍、或病理学病况;减少或预防疾病、症状、障碍或病况的发作;以及总体上对抗疾病、症状、障碍或病理学病况。如此处使用的,“治疗(treatment)”或“进行治疗(treating)”或“减轻”或“改善”是可互换地使用的。这些术语是指如下途径,该途径用于获得有益或希望的结果,包括但不限于一种治疗益处和/或一种预防益处。治疗益处意指治疗中的一种或多种疾病、病况、或症状上的任何治疗上相关的改进或对其的影响。对于预防益处,该组合物可给予至处于发展具体的疾病、病况、或症状的风险的受试者,或给予至报告了疾病的一个或多个生理学症状的受试者,尽管该疾病、病况、或症状可能还没有体现出来。术语“有效量”或“治疗有效量”是指一种药剂的足以实现有益或希望的结果的量。治疗有效量可依赖于正治疗的受试者和疾病病状、受试者的重量和年龄、疾病病况的严重度、给药方式等中一项或多个而改变,并可以由本领域普通技术人员容易地确定。该术语也适用通过此处描述的显像方法中的任一项提供一种检测用图像的一个剂量。具体剂量可依赖于以下中一个或多个而变化:所选择的具体药剂、所遵循的给药方案、是否与其他化合物组合给予、给予时间、待显像的组织、以及携带它的物理递送系统。除非另有说明,本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组dna的常规技术,这些在本领域的技能之内。参见sambrook、fritsch和maniatis,molecularcloning:alaboratorymanual[分子克隆:实验室手册],第2次编辑(1989);currentprotocolsinmolecularbiology[当代分子生物学实验手册](f.m.ausubel等人编辑,(1987));methodsinenzymology[酶学方法]系列(academicpress,inc.[学术出版公司]):pcr2:apracticalapproach[pcr2:实用方法](m.j.macpherson、b.d.hames和g.r.taylor编辑(1995))、harlow和lane编辑(1988)antibodies,alaboratorymanual[抗体:实验室手册],以及animalcellculture[动物细胞培养](r.i.freshney编辑(1987))。本发明的若干方面涉及包括一种或多种载体的载体系统,或载体本身。载体可以被设计为用于在原核或真核细胞中表达crispr转录物(例如核酸转录物、蛋白质、或酶)。例如,crispr转录物可表达于例如大肠杆菌的细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中。适合的宿主细胞进一步讨论于goeddel,geneexpressiontechnology:methodsinenzymology[基因表达技术:酶学方法]185,academicpress[学术出版社],圣地亚哥(sandiego),加利福尼亚州(calif.)(1990年)中。可替代地,重组表达载体可在体外例如使用t7启动子调节序列和t7聚合酶来转录和翻译。本发明的实施例包括可包含同源取代(本文使用取代和置换两者来表示现有氨基酸残基或核苷酸与替代残基和核苷酸之间的互换)的序列(多核苷酸或多肽两者),该同源取代,即,在氨基酸的情况下发生同类取代(like-for-likesubstitution),如碱性对碱性、酸性对酸性、极性对极性。也可以发生非同源取代,即,从一类残基到另一类残基,或者可替代地涉及包含非天然氨基酸如鸟氨酸(在下文称为z)、二氨基丁酸鸟氨酸(在下文称为b)、正亮氨酸鸟氨酸(在下文称为o)、吡啶基丙氨酸、噻吩基丙氨酸、萘基丙氨酸和苯基甘氨酸。变体氨基酸序列可以包括适合的可插入在该序列的任何两个氨基酸残基之间的间隔子基团,包括除了氨基酸间隔子(如甘氨酸或β-丙氨酸残基)之外的烷基基团,如甲基、乙基或丙基基团。一个另外的变化形式,其涉及处于类肽形式的一个或多个氨基酸残基的存在,也是本领域技术人员熟知的。为避免疑义,“该类肽形式”用来指代变体氨基酸残基,其中该α-碳取代基在该残基的氮原子上,而不是在该α-碳上。用于制备处于该类肽形式的肽的方法是本领域已知的,例如simonrj等人,pnas(1992)89(20),9367-9371和horwelldc,trendsbiotechnol.[生物技术趋势](1995)13(4),132-134。同源建模:可以通过zhang等人,2012(nature[自然];490(7421):556-60)和chen等人,2015(ploscomputbiol[plos计算生物学];11(5):e1004248)的方法-计算蛋白质-蛋白质相互作用(ppi)方法,鉴定其他组29或组30直系同源物中的相应残基用以预测由结构域-基序界面介导的相互作用。preppi(预测ppi),一种基于结构的ppi预测方法,使用贝叶斯统计框架(bayesianstatisticalframework)将结构证据与非结构证据相结合。该方法涉及取一对查询蛋白并使用结构比对以便鉴别与它们实验确定的结构或同源性模型相对应的结构代表。结构比对进一步用来通过考虑全局和局部几何关系来鉴定接近的和远程的结构相邻物。每当结构代表物的两个相邻物形成报告于蛋白质数据库中的复合物,这限定了用于对两个查询蛋白质之间的相互作用进行建模的模板。复合物的模型是通过在模板中将代表性结构叠加在其对应的结构相邻物上来创建。这种方法进一步描述于dey等人,2013(protsci[蛋白质科学];22:359-66)。出于本发明的目的,扩增意指利用引物和聚合酶的能够以合理的保真度复制靶序列的任何方法。可以通过天然或重组dna聚合酶,如taqgoldtm、t7dna聚合酶、大肠杆菌dna聚合酶的klenow片段以及逆转录酶进行扩增。一种优选的扩增方法是pcr。在某些方面,本发明涉及载体。如本文使用的,“载体”是一种允许或促进一个实体从一个环境转移到另一个环境中的工具。它是复制子,如质粒、噬菌体、或粘粒,另一个dna片段可以插入其中,从而引起该插入的片段的复制。通常,当与适当的控制元件关联时,载体能够复制。一般而言,术语“载体”是指一种核酸分子,其能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如,环状的)的核酸分子;包括dna、rna、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的dna片段的环状双链dna环。另一种类型的载体是病毒载体,其中病毒衍生的dna或rna序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒(aav))的载体中。病毒载体还包含由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此被称为“表达载体”。在重组dna技术中使用的普通表达栽体通常是质粒形式。重组表达载体可包含处于适合于在宿主细胞中的核酸表达的形式的本发明的核酸,这意味着这些重组表达载体包含基于待用于表达的宿主细胞而选择的一种或多种调控元件,所述调控元件可操作地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许该核苷酸序列的表达的方式被连接至这一种或多种调控元件(例如,处于体外转录/翻译系统中或当该载体被引入宿主细胞中时,处于该宿主细胞中)。关于重组和克隆方法,提及2004年9月2日以us2004-0171156a1公开的美国专利申请10/815,730,该专利的内容通过引用以其全文并入本文。本发明的方面涉及用于指导rna和野生型、修饰的或突变的crispr效应蛋白/酶(例如组29或组30效应蛋白)的双顺反子载体。优选的是用于指导rna和野生型、修饰的或突变的crispr效应蛋白/酶(例如组29或组30效应蛋白)的双顺反子表达载体。通常以及特别是在该实施例中,野生型、修饰的或突变的crispr效应蛋白/酶(例如组29或组30效应蛋白)优选由cbh启动子驱动。rna可以优选地由poliii启动子(如u6启动子)驱动。理想地,将这两者结合。在一些实施例中,提供了指导rna中的环。这可以是茎环或四核苷酸环(tetraloop)。该环优选地是gaaa,但是并不限于这个序列或者实际上在长度上仅仅为4bp。实际上,用于在发夹结构中使用的优选环形成序列在长度上为四个核苷酸,并且最优选地具有序列gaaa。然而,可以使用更长或更短的环序列,正如可替代的序列。这些序列优选地包括三联体(例如,aaa)、和另外的核苷酸(例如c或g)。环形成序列的实例包括caaa和aaag。在实践在此披露的任何方法中,可以经由本领域已知的一种或多种方法将适合的载体引入进细胞或胚胎中,这些方法包括但不限于,显微注射、电穿孔、声致穿孔、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状聚合物转染、热休克转染、核转染、磁转染、脂转染、刺穿转染(impalefection)、光学转染、专有剂增强的核酸摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒体进行递送。在一些方法中,通过显微注射将该载体引入进胚胎中。可以将这个或这些载体显微注射进胚胎的细胞核或细胞质中。在一些方法中,通过核转染将这个或这些载体引入进细胞中。术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(ires)、以及其他表达控制元件(例如,转录终止信号,如聚腺苷酸化信号和聚u序列)。这样的调节序列例如描述于goeddel,geneexpressiontechnology:methodsinenzymology[基因表达技术:酶学方法]185,academicpress[学术出版社],圣地亚哥(sandiego),加利福尼亚州(calif.)(1990年)中。调控元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异性启动子可主要引导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如,肝、胰腺)、或特殊的细胞类型(例如,淋巴细胞)。调控元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在一些实施例中,载体包括一个或多个poliii启动子(例如,1、2、3、4、5个、或更多个poliii启动子)、一个或多个polii启动子(例如,1、2、3、4、5个、或更多个polii启动子)、一个或多个poli启动子(例如,1、2、3、4、5个、或更多个poli启动子)、或其组合。poliii启动子的实例包括但不限于u6和h1启动子。polii启动子的实例包括但不限于逆转录劳斯肉瘤病毒(rsv)ltr启动子(任选地具有rsv增强子)、巨细胞病毒(cmv)启动子(任选地具有cmv增强子)[参见,例如,boshart等人,cell[细胞]41:521-530(1985)]、sv40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(pgk)启动子、和ef1α启动子。还被术语“调控元件”涵盖的是增强子元件,如wpre;cmv增强子;在htlv-i的ltr中的r-u5’片段(mol.cell.biol.[分子细胞生物学],第8(1)卷,第466-472页,1988);sv40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(proc.natl.acad.sci.usa.[美国国家科学院院刊],第78(3)卷,第1527-31页,1981)。本领域的普通技术人员应当理解的是,表达载体的设计可取决于比如待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文描述的核酸编码的融合蛋白或肽(例如,规律间隔成簇短回文重复(crispr)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。关于调节序列,提及美国专利申请10/491,026,该专利的内容通过引用以其全文并入本文。关于启动子,提及pct公开wo2011/028929和美国申请12/511,940,这些专利的内容通过引用以其全文并入本文。载体可以被设计为用于在原核或真核细胞中表达crispr转录物(例如核酸转录物、蛋白质、或酶)。例如,crispr转录物可表达于例如大肠杆菌的细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中。适合的宿主细胞进一步讨论于goeddel,geneexpressiontechnology:methodsinenzymology[基因表达技术:酶学方法]185,academicpress[学术出版社],圣地亚哥(sandiego),加利福尼亚州(calif.)(1990年)中。可替代地,重组表达载体可在体外例如使用t7启动子调节序列和t7聚合酶来转录和翻译。载体可以被引入原核生物或原核细胞中并且在其中增殖。在一些实施例中,原核生物用来扩增有待引入真核细胞中的载体的多个拷贝,或者作为有待引入真核细胞中的载体的产生中的中间载体(例如,扩增质粒作为病毒载体包装系统的一部分)。在一些实施例中,原核生物用来扩增一个载体的多个拷贝并且表达一种或多种核酸,如提供用于递送到宿主细胞或宿主生物中的一种或多种蛋白质的来源。蛋白质在原核生物中的表达最经常在大肠杆菌中用含有指导融合或非融合蛋白的表达的组成型或诱导型启动子的载体来进行。融合载体将多个氨基酸添加到在其中编码的蛋白质上,如该重组蛋白的氨基末端上。这样的融合载体可以用于一个或多个目的,如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解性;以及(iii)通过在亲和纯化中充当配体来辅助重组蛋白的纯化。通常,在融合表达载体中,将蛋白切割位点引入至融合部分与重组蛋白的接合处以使得能够在纯化融合蛋白之后将重组蛋白与融合部分分离。这类酶以及它们的同源识别序列包括因子xa、凝血酶以及肠激酶。示例性融合表达载体包括pgex(发玛西亚生物技术有限公司(pharmaciabiotechinc);smithandjohnson,1988.gene[基因]67:31-40)、pmal(newenglandbiolabs[纽英伦生物技术公司],贝弗利(beverly),马萨诸塞州(mass.))以及prit5(pharmacia[发玛西亚公司],皮斯卡塔韦(piscataway),新泽西州(n.j.)),它们分别将谷胱甘肽s-转移酶(gst)、麦芽糖e结合蛋白或蛋白a融合至靶重组蛋白。适合的诱导型非融合大肠杆菌表达载体的实例包括ptrc(amrann等人,(1988年)gene[基因]69:301-315)以及pet11d(studier等人,geneexpressiontechnology:methodsinenzymology[基因表达技术:酶学方法]185,academicpress[学术出版社],圣地亚哥(sandiego),加利福尼亚州(calif.)(1990年)60-89)。在一些实施例中,载体是酵母表达载体。用于在酵母酿酒中表达的载体的实例包括pyepsec1(baldari等人,1987,emboj[欧洲分子生物学学会杂志]6:229-234)、pmfa(kurjan和herskowitz,1982,cell[细胞]30:933-943)、pjry88(schultz等人,1987,gene[基因]54:113-123)、pyes2(invitrogencorporation[英杰公司],圣地亚哥(sandiego),加利福尼亚州(calif))、以及picz(invitrogencorp[英杰公司],圣地亚哥,加利福尼亚州)。在一些实施例中,使用杆状病毒载体,载体驱动昆虫细胞中的蛋白质表达。可用于在培养的昆虫细胞(例如,sf9细胞)中表达蛋白质的杆状病毒载体包括pac系列(smith等人,1983,mol.cell.biol.[分子细胞生物学]3:2156-2165)和pvl系列(lucklow和summers,1989,virology[病毒学]170:31-39)。在一些实施例中,使用哺乳动物表达载体,载体能够驱动一种或多种序列在哺乳动物细胞中表达。哺乳动物表达载体的实例包括pcdm8(seed,1987,nature[自然]329:840)和pmt2pc(kaufman等人,1987,emboj.[欧洲分子生物学学会杂志]6:187-195)。当用于哺乳动物细胞中时,表达载体的控制功能典型地由一种或多种调控元件提供。例如,常用的启动子来源于多瘤、腺病毒2、巨细胞病毒、猿猴病毒40、以及本文所述和本领域已知的其他病毒。对于用于原核细胞和真核细胞两者的其他适合的表达系统参见例如萨姆布鲁克(sambrook)等人的分子克隆实验指南(molecularcloning:alaboratorymanual.)(第2版)的第16和第17章,冷泉港实验室(coldspringharborlaboratory),冷泉港实验室出版社(coldspringharborlaboratorypress),冷泉港(coldspringharbor),纽约,1989。在一些实施例中,重组哺乳动物表达载体能够指导核酸优先在特定细胞类型中表达(例如,使用组织特异型调控元件来表达核酸)。组织特异型调控元件是本领域中已知的。适合的组织特异型启动子的非限制性实例包括白蛋白启动子(肝脏特异性的;pinkert等人,1987.genesdev.[基因发育]1:268-277),淋巴特异性启动子(calame和eaton,1988.adv.immunol.[免疫学进展]43:235-275),特别是t细胞受体的启动子(winoto和baltimore,1989.emboj.[欧洲分子生物学学会杂志]8:729-733)和免疫球蛋白(baneiji等人,1983.cell[细胞]33:729-740;queen和baltimore,1983.cell[细胞]33:741-748),神经元特异性启动子(例如,神经丝启动子;byrne和ruddle,1989.proc.natl.acad.sciusa[美国科学院院刊]86:5473-5477),胰腺特异性启动子(edlund等人,1985.science[科学]230:912-916),以及乳腺特异性启动子(例如,乳清启动子;美国专利号4,873,316和欧洲申请公开号264,166)。还涵盖发育型调节启动子,例如,鼠科动物同源框蛋白(hox)启动子(kessel和gruss,1990.science[科学]249:374-379)和α-甲胎蛋白启动子(campes和tilghman,1989.genesdev.[基因发育]3:537-546)。关于这些原核和真核载体,提及美国专利6,750,059,该专利的内容通过引用以其全文并入本文。本发明的其他实施例可涉及病毒载体的使用,关于它提及美国专利申请13/092,085,该专利的内容通过引用以其全文并入本文。组织特异型调控元件是本领域中已知的,并且在这个方面提及美国专利7,776,321,该专利的内容通过引用以其全文并入本文。在一些实施例中,调控元件可操作地连接至crispr系统的一个或多个元件,从而驱动该crispr系统的该一个或多个元件的表达。一般而言,crispr(规律间隔成簇短回文重复),也称为spidr(间隔子间隔开的同向重复),构成通常对于特定细菌物种而言特异性的dna基因座的家族。该crispr座位包含在大肠杆菌中被识别的间隔开的短序列重复(ssr)的一个不同类(ishino等人,j.bacteriol.[细菌学杂志],169:5429-5433[1987];和中田(nakata)等人,细菌学杂志(j.bacteriol.),171:3553-3556[1989])、以及相关基因。类似的间隔开的ssr已经鉴定于地中海富盐菌(haloferaxmediterranei)、化脓链球菌、鱼腥藻属、和结核分枝杆菌中(参见,groenen等人,mol.microbiol.[分子微生物学],10:1057-1065[1993];hoe等人,emerg.infect.dis.[新发感染性疾病],5:254-263[1999];masepohl等人,biochim.biophys.acta[生物化学与生物物理学学报]1307:26-30[1996];以及mojica等人,mol.microbiol.[分子微生物学],17:85-93[1995])。这些crispr座位典型地不同于其他ssr的重复结构,这些重复已被称为规律间隔的短重复(srsr)(janssen等人,omicsj.integ.biol.[omics:整合生物学杂志],6:23-33[2002];以及mojica等人,mol.microbiol.[分子微生物学],36:244-246[2000])。一般而言,这些重复是以簇存在的短元件,其被具有基本上恒定长度的独特间插序列规律地间隔开(莫吉卡(mojica)等人,[2000],同上)。虽然重复序列在菌株之间是高度保守的,许多间隔开的重复和这些间隔子区的序列一般在菌株与菌株之间不同(vanembden等人,j.bacteriol.[细菌学杂志],182:2393-2401[2000])。已经在40种以上的原核生物中鉴定出crispr基因座(参见,例如,janssen等人,mol.microbiol.[分子微生物学],43:1565-1575[2002];以及mojica等人,[2005]),包括但不限于:气火菌属(aeropyrum)、热棒菌属(pyrobaculum)、硫化叶菌属(sulfolobus)、古球菌属(archaeoglobus)、盐盒菌属(halocarcula)、甲烷杆菌属(methanobacterium)、甲烷球菌属(methanococcus)、甲烷八叠球菌属(methanosarcina)、甲烷火菌属(methanopyrus)、焦球菌属(pyrococcus)、嗜酸菌属(picrophilus)、热原体属(thermoplasma)、棒杆菌属(corynebacterium)、分枝杆菌属(mycobacterium)、链霉菌属(streptomyces)、产水菌属(aquifex)、紫单胞菌属(porphyromonas)、绿菌属(chlorobium)、栖热菌属(thermus)、芽孢杆菌属(bacillus)、利斯特菌属(listeria)、葡萄球菌属(staphylococcus)、梭菌属(clostridium)、好热厌氧杆菌属(thermoanaerobacter)、支原体属(mycoplasma)、梭杆菌属(fusobacterium)、固氮弓菌属(azarcus)、色杆菌属(chromobacterium)、奈瑟球菌属(neisseria)、亚硝化单胞菌属(nitrosomonas)、脱硫弧菌属(desulfovibrio)、地杆菌属(geobacter)、粘球菌属(myxococcus)、弯曲杆菌属(campylobacter)、类杆菌属(wolinella)、不动杆菌属(acinetobacter)、欧文菌属(erwinia)、埃希菌属(escherichia)、军团菌属(legionella)、甲基球菌属(methylococcus)、巴斯德菌属(pasteurella)、发光细菌属(photobacterium)、沙门菌属(salmonella)、黄单胞菌属(xanthomonas)、耶尔森菌属(yersinia)、密螺旋体属(treponema)、和栖热袍菌属(thermotoga)。一般而言,如在本申请中使用的“核酸靶向系统”统一指代在表达或引导核酸靶向crispr-相关(“cas”)基因(在本文还称为效应蛋白)的活性中涉及的转录物和其他元件,包括编码核酸靶向cas(效应物)蛋白和指导rna(包括crrna序列和反式激活crispr/cas系统rna(tracrrna)序列)的序列、或其他序列以及来自核酸靶向crispr座位的转录物。在一些实施例中,核酸靶向系统的一种或多种元件衍生自v型/vi型核酸靶向crispr系统。在一些实施例中,核酸靶向系统的一个或多个元件来源于包含内源核酸靶向crispr系统的特殊生物,如化脓链球菌。一般而言,核酸靶向系统表征为促进核酸靶向复合物在靶序列的位点处形成的元件。在核酸靶向复合物形成的背景下,“靶序列”是指指导序列被设计为对其具有互补性的序列,其中在靶序列与指导rna之间的杂交促进dna或rna靶向复合物的形成。完全互补性不是必需的,条件是存在足够互补性以引起杂交并且促进核酸靶向复合物的形成。靶序列可以包括rna多核苷酸。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。在一些实施例中,该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。典型地,在内源核酸靶向系统的背景下,核酸靶向复合物(包含杂交到靶序列上并且与一种或多种核酸靶向效应蛋白复合的指导rna)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内)的一条链或两条rna链的切割。在一些实施例中,将驱动核酸靶向系统的一个或多个元件的表达的一种或多种载体引入到宿主细胞中,使得该核酸靶向系统的这些元件的表达在一个或多个靶位点指导核酸靶向复合物的形成。例如,核酸-靶向效应蛋白和指导rna可以各自可操作地连接到在分开的载体上的单独的调控元件。可替代地,从相同或不同调控元件表达的二个或更多个元件可以结合在单一载体中,其中提供该核酸靶向系统的任何组分的一种或多种另外的载体不包括在该第一载体中。结合在单一载体中的靶向核酸的系统元件可以按照任何适合的方向排列,如一个元件相对于第二元件位于5'(“上游”)或3'(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的同一条链或相对链上,并且取向为相同或相对的方向。在一些实施例中,单一启动子驱动编码核酸靶向效应蛋白和指导rna的转录物的表达,该指导rna嵌入在一个或多个内含子序列中(例如,各自处于不同内含子中,两个或更多个处于至少一个内含子中,或全部处于单一内含子中)。在一些实施例中,核酸靶向效应蛋白和指导rna可操作地连接至相同的启动子上并且从其表达。一般而言,指导序列是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且引导核酸靶向复合物与该靶序列的序列特异性结合的任何多核苷酸序列。在一些实施例中,当使用适合的比对算法进行最佳比对是,在指导序列与其相应的靶序列之间的互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼(smith-waterman)算法、尼德曼-翁施(needleman-wunsch)算法、基于伯罗斯-惠勒变换(burrows-wheelertransform)的算法(例如伯罗斯-惠勒比对工具(burrowswheeleraligner))、clustalw、clustalx、blat、novoalign(novocraft技术公司)、eland(亿明达公司(illumina),圣地亚哥,加利福尼亚州)、soap(在soap.genomics.org.cn可获得)、以及maq(在maq.sourceforge.net可获得)。在一些实施例中,指导序列在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸。在一些实施例中,指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸。可以通过任何适合的测定法来评估指导序列引导核酸靶向复合物与靶序列的序列特异性结合的能力。例如,足以形成核酸靶向复合物的核酸靶向系统的组分,包括有待测试的指导序列在内,可以例如通过用编码该核酸靶crispr向序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后通过如本文所述的surveyor测定来评估在该靶序列之内或附近的优先切割。类似地,通过提供该靶序列、包括有待测试的指导序列在内的核酸靶向复合物的组分、和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处或附近的结合或切割率,可以在试管中评估靶多核苷酸序列(或在其附近的序列)的切割。其他测定法是可能的,并且将由本领域技术人员想到。指导序列可以被选择为靶向任何靶序列。在一些实施例中,该靶序列是在基因转录物或mrna内的序列。在一些实施例中,该靶序列是在细胞的基因组内的序列。在一些实施例中,指导序列被选择为降低在该指导序列内的二级结构程度。可以通过任何适合的多核苷酸折叠算法来确定二级结构。一些算法是基于计算最小吉布斯(gibbs)自由能。一种这样的算法的实例是mfold,正如祖克(zuker)和施蒂格勒(stiegler)核酸研究(nucleicacidsres.)9(1981),133-148)所描述。折叠算法的另一个实例是使用质心结构预测算法的由维也纳大学(universityofvienna)的理论化学研究所(institutefortheoreticalchemistry)研发的在线网络服务器rnafold(参见例如,a.r.gruber等人,2008,cell[细胞]106(1):23-24;以及pacarr和gmchurch,2009,naturebiotechnology[自然生物技术]27(12):1151-62)。另外的算法可以发现于通过引用结合在此的美国申请序列号tba(代理人案号44790.11.2022;博德参考号bi-2013/004a)中。在一些实施例中,该核酸靶向效应蛋白是包含一个或多个异源蛋白结构域(例如除了该核酸靶向效应蛋白之外的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个结构域)的融合蛋白的一部分。在一些实施例中,该crispr效应蛋白/酶是包含一个或多个异源蛋白结构域(例如除了该crispr酶之外的约或多于约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、或更多个结构域)的融合蛋白的一部分。crispr效应蛋白/酶融合蛋白可以包含任何其他蛋白质,以及任选地在任何两个结构域之间的连接序列。可以融合到效应蛋白上的蛋白结构域的实例包括但不限于,表位标签、报告基因序列、以及具有下列活性的一者或多者的蛋白结构域:甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、rna切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(his)标签、v5标签、flag标签、流感病毒血凝素(ha)标签、myc标签、vsv-g标签、和硫氧还蛋白(trx)标签。报告基因的实例包括,但不限于,谷胱甘肽-s-转移酶(gst)、辣根过氧化物酶(hrp)、氯霉素乙酰转移酶(cat)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、萤光素酶、绿色荧光蛋白(gfp)、hcred、dsred、青荧光蛋白(cfp)、黄色荧光蛋白(yfp)、以包括蓝色荧光蛋白(bfp)的自发荧光蛋白。核酸靶向效应蛋白可以融合到编码一种蛋白质或蛋白质片段的基因序列上,所述蛋白质或蛋白质片段结合dna分子或结合其他细胞分子,其包括,但不限于,麦芽糖结合蛋白(mbp)、s-tag、lexadna结合结构域(dbd)融合物、gal4dna结合结构域融合物、以及单纯疱疹病毒(hsv)bp16蛋白融合物。可以形成包含核酸靶向效应蛋白的融合蛋白的一部分的另外的结构域描述于us20110059502中,通过引用将其并入本文。在一些实施例中,使用标记的核酸靶向效应蛋白来鉴定靶序列的位置。在一些实施例中,crispr酶可以形成可诱导系统的组分。该系统的诱导性质将允许该系统利用一种能量形式对基因编辑或基因表达进行时空控制。该能量形式可以包括但不限于,电磁辐射、声能、化学能和热能。可诱导系统的实例包括四环素诱导型启动子(tet-开(tet-on)或tet-关(tet-off))、小分子双杂交体转录激活系统(fkbp、aba等)或光可诱导系统(光敏素、lov结构域或隐花色素)。在一个实施例中,该crispr酶可以是以序列特异性方式指导转录活性的变化的光诱导的转录效应因子(lite)。光的组分可以包括crispr酶、光响应细胞色素异二聚体(例如,来自拟南芥)、以及转录激活/阻遏结构域。可诱导的dna结合蛋白和它们的使用方法的另外实例提供于us61/736465和us61/721,283和wo2014/018423和us8889418、us8895308、us20140186919、us20140242700、us20140273234、us20140335620、wo2014093635中,将这些文献通过引用以其全文特此结合。在一些方面,本发明提供了以下方法,这些方法包括向宿主细胞递送一种或多种多核苷酸,如或如在此描述的一种或多种载体、其一种或多种转录物和/或一种或多种自其转录的蛋白。在一些方面,本发明进一步提供了通过这样的方法产生的细胞以及包括这样的细胞或由这样的细胞产生的生物(例如动物、植物、或真菌)。在一些实施例中,将与(并且任选地与其复合)指导rna组合的核酸靶向效应蛋白递送至细胞。可以使用常规的病毒和非病毒基的基因转移方法将核酸引入哺乳动物细胞或靶组织中。可以使用这样的方法向培养物中或宿主生物中的细胞给予编码核酸靶向系统的组分的核酸。非病毒载体递送系统包括dna质粒、rna(例如在此描述的载体的转录物)、裸核酸以及与递送媒介(如脂质体)复合的核酸。病毒载体递送系统包括dna和rna病毒,在被递送至细胞后它们具有游离型或整合型基因组。关于基因疗法程序的综述,参见安德森(anderson),科学(science)256:808-813(1992);纳贝尔(nabel)&费尔格纳(felgner),tibtech11:211-217(1993);三谷(mitani)&卡斯基(caskey),tibtech11:162-166(1993);狄龙(dillon),tibtech11:167-175(1993);米勒(miller),自然(nature)357:455-460(1992);范·布朗特(vanbrunt),生物技术(biotechnology)6(10):1149-1154(1988);维涅(vigne),恢复神经学和神经科学(restorativeneurologyandneuroscience)8:35-36(1995);克雷默(kremer)&佩里科德特(perricaudet),英国医学公报(britishmedicalbulletin)51(1):31-44(1995);哈嗒嗒(haddada)等人,在微生物学和免疫学当前主题(currenttopicsinmicrobiologyandimmunology)中,多尔夫勒(doerfler)和博姆(编辑)(1995);以及余(yu)等人,基因疗法(genetherapy)1:13-26(1994)。核酸的非病毒递送方法包括脂转染、核转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸共轭物、裸dna、人工病毒体以及dna的试剂增强性摄取。脂转染描述于例如美国专利号5,049,386、4,946,787和4,897,355中并且脂转染试剂是市售的(例如,transfectamtm和lipofectintm)。适于多核苷酸的有效的受体识别脂转染的阳离子和中性脂质包括felgner(费尔格纳),wo91/17424;wo91/16024的那些。递送可以针对细胞(例如体外或离体给予)或靶组织(例如体内给予)。脂质:核酸复合物(包括靶向的脂质体,如免疫脂质复合物)的制备是本领域的技术人员熟知的(参见例如,克丽丝特尔(crystal),科学(science)270:404-410(1995);blaese等人,cancergenether.[癌症基因疗法]2:291-297(1995);behr等人,bioconjugatechem.[生物共轭化学]5:382-389(1994);remy等人,bioconjugatechem.[生物共轭化学]5:647-654(1994);高(gao)等人,genetherapy[基因疗法]2:710-722(1995);ahmad等人,cancerres.[癌症研究]52:4817-4820(1992);美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028以及4,946,787)。使用rna或dna病毒基的系统递送核酸利用将病毒靶向体内的特定细胞并将病毒有效负荷(payload)运至细胞核中的高度进化的过程。可以将病毒载体直接给予至患者(体内)或可以使用它们在体外处理细胞,并且任选地,可以将修饰的细胞给予至患者(离体)。常规的病毒基的系统可以包括用于基因转移的逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体以及单纯疱疹病毒载体。用逆转录病毒、慢病毒和腺相关病毒基因转移方法整合进宿主基因组中是可能的,这通常导致插入转基因的长期表达。另外,已经在不同细胞类型和靶组织中观察到高转导效率。可以通过掺入外源包膜蛋白,扩展靶细胞的潜在靶群而改变逆转录病毒的向性。慢病毒载体是能够转导或感染非分裂细胞并典型地产生较高病毒效价的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将依赖于靶组织。逆转录病毒载体由顺式作用长末端重复组成,这些长末端重复具有包装多达6-10kb的外源序列的能力。最低量的顺式作用ltr对于载体的复制和包装而言是足够的,然后使用这些载体将治疗基因整合进靶细胞中,以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(mulv)、长臂猿白血病病毒(galv)、猴免疫缺陷病毒(siv)、人类免疫缺陷病毒(hiv)及其组合的那些(参见例如,buchscher等人,j.virol.[病毒学杂志]66:2731-2739(1992);johann等人,j.virol.[病毒学杂志]66:1635-1640(1992);sommnerfelt等人,virol.[病毒学]176:58-59(1990);wilson等人,j.virol.[病毒学杂志]63:2374-2378(1989);miller等人,j.virol.[病毒学杂志]65:2220-2224(1991);pct/us94/05700)。在瞬时表达是优选的应用中,可以使用腺病毒基系统。腺病毒基载体在许多细胞类型中能够具有非常高的转导效并且无需细胞分裂。用这样的载体,已经获得了较高的效价和表达水平。可以在相对简单的系统中大量地产生此载体。还可以使用腺相关病毒(“aav”)载体转导具有靶核酸的细胞,例如,在体外产生核酸和肽,以及用于体内和离体基因疗法程序(参见例如,韦斯特(west)等人,病毒学(virology)160:38-47(1987);美国专利号4,797,368;wo93/24641;kotin,humangenetherapy[人类基因疗法]5:793-801(1994);muzyczka,j.clin.invest.[临床研究杂志]94:1351(1994))。重组aav载体的构建描述于多个出版物中,包括美国专利号5,173,414;tratschin等人,mol.cell.biol.[分子与细胞生物学]5:3251-3260(1985);tratschin等人,mol.cell.biol.[分子与细胞生物学]4:2072-2081(1984);埃尔莫奈特(hermonat)&缪斯科斯卡(muzyczka),美国国家科学院院刊(pnas)81:6466-6470(1984);以及samulski等人,j.virol.[病毒学杂志]63:03822-3828(1989)。遗传以及表观遗传状况的模型本发明的方法可用于产生可用于模拟和/或研究感兴趣的遗传或表观遗传状况的植物、动物或细胞,例如通过感兴趣的突变模型或疾病模型。如在此使用,“疾病”是指受试者的疾病、障碍或适应症。例如,可以使用本发明的方法产生以下动物或细胞,该动物或细胞在一个或多个与疾病相关的核酸序列中包括修饰,或以下植物、动物或细胞,一个或多个与疾病相关的核酸序列的表达在该植物、动物或细胞中被改变。这样的核酸序列可以编码疾病相关蛋白序列或可以是疾病相关控制序列。因此,应该理解的是在本发明的实施例中,植物、受试者、患者、生物或细胞可以是非人受试者、患者、生物或细胞。因此,本发明提供了由本发明方法产生的植物、动物或细胞或其子代。该子代可以是产生的植物或动物的克隆或可以通过与同一物种的其他个体杂交而由有性繁殖产生,以在其子代中基因渗入另外的令人希望的性状。在多细胞生物(特别是动物或植物)的情况下,该细胞可以是在体内或离体的。在该细胞处于培养中的情况下,如果满足适当的培养条件并且优选地,如果该细胞适合地适于此目的(例如,干细胞),则可以建立细胞系。还设想了通过本发明产生的细菌细胞系。因此,还设想了细胞系。在一些方法中,可以使用疾病模型研究突变或更普遍的改变的例如减小的基因表达或基因产物表达对动物或细胞的影响以及使用在疾病研究中常用的措施对疾病的发展和/或进展的影响。可替代地,这样的一种疾病模型有用于研究药物活性化合物对疾病的影响。在一些方法中,可以使用疾病模型评估潜在的基因疗法策略的效力。也就是说,可以将疾病相关基因或多核苷酸进行修饰,这样使得疾病发展和/或进展被抑制或减少。具体而言,该方法包括修饰疾病相关基因或多核苷酸,这样使得产生一种改变的蛋白质,其结果是,该动物或细胞具有改变的反应。因此,在一些方法中,可以将基因修饰动物与易患该疾病的动物进行比较,这样使得可以评估基因疗法事件的效果。在另一个实施例中,本发明提供了一种研发生物活性剂的方法,该生物活性剂调制与疾病基因相关的细胞信号传导事件。该方法包括使测试化合物与细胞接触,该细胞包括一种或多种载体,这一种或多种载体驱动下列一者或多者的表达:crispr酶、和连接到指导序列的同向重复序列;并且检测读出的变化,该变化指示与例如包含在该细胞中的疾病基因的突变相关的细胞信号传导事件的减少或增加。可以与用于筛选细胞功能变化的本发明的方法组合构建细胞模型或动物模型。可以使用这样的一种模型研究由本发明的crispr复合物修饰的基因组序列对感兴趣的细胞功能的影响。例如,可以使用细胞功能模型研究修饰的基因组序列对细胞内信号传导或细胞外信号传导的影响。可替代地,可以使用细胞功能模型研究修饰的基因组序列对感知觉的影响。在一些这样的模型中,修饰一个或多个与该模型中的信号传导生化学途径相关的基因组序列。已经具体研究了若干疾病模型。这些疾病模型包括新生(denovo)自闭症风险基因chd8、katnal2和scn2a;以及综合征性自闭症(安格曼综合征(angelmansyndrome))基因ube3a。这些基因以及所得的自闭症模型当然是优选的,但用于显示本发明的跨基因和对应的模型的广阔的适用性。可以通过当将测试模型细胞和对照细胞与候选试剂接触时,测定它们之间的对应的基因的mrna水平差异而确定一个或多个与信号传导生化途径相关的基因组序列的改变的表达。可替代地,通过检测编码的多肽或基因产物的水平差异而确定与信号传导生化途径相关的序列的差异表达。为了在mrna转录物或对应的多核苷酸水平上测定试剂诱导的变化,首先根据本领域的标准方法提取包含在样品中的核酸。例如,可以根据陈述于sambrook等人(1989)中的程序使用各种水解酶分离mrna或遵循由制造商提供的随附说明书通过核酸结合树脂提取mrna。然后,根据本领域广泛已知的方法或基于在此示例的方法,通过扩增程序或常规的杂交测定(例如northern印迹分析)检测包含在提取的核酸样品中的mrna。出于本发明的目的,扩增意指利用引物和聚合酶的能够以合理的保真度复制靶序列的任何方法。可以通过天然或重组dna聚合酶,如taqgoldtm、t7dna聚合酶、大肠杆菌dna聚合酶的klenow片段以及逆转录酶进行扩增。一种优选的扩增方法是pcr。具体而言,可以使分离的rna经受逆转录测定,该测定与定量聚合酶链式反应(rt-pcr)耦合,以便定量与信号传导生化途径相关的序列的表达水平。在扩增测定中可以实时地执行基因表达水平的检测。在一个方面,可以用荧光dna结合剂直接使扩增产物可视化,这些荧光dna结合剂包括但不限于dna嵌入剂和dna沟结合剂。因为掺入进双链dna分子中的嵌入剂的量典型地与扩增dna产物的量成比例,可以常规地通过使用本领域的常规光学系统定量嵌入的染料的荧光而确定扩增产物的量。适于本申请的dna结合染料包括sybr绿、sybr蓝、dapi、碘化丙锭、hoeste、sybr金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、氟香豆素(fluorcoumanin)、玫瑰树碱、道诺霉素、氯喹、偏端霉素d、色霉素、乙菲啶(homidium)、光辉霉素、多吡啶钌、安曲霉素等。在另一个方面,可以在扩增反应中利用其他荧光标记物(如序列特异的探针),以促进扩增产物的检测和定量。基于探针的定量扩增依赖于希望的扩增产物的序列特异的检测。它利用荧光的靶标特异的探针(例如,探针),从而导致增加的特异性和敏感性。用于进行基于探针的定量扩增的方法本领域是确立的并且教导于美国专利号5,210,015中。在又另一个方面,可以使用与以下序列具有序列同源性的杂交探针进行常规的杂交测定,这些序列与信号传导生化途径相关。典型地,在杂交反应中,允许探针和与信号传导生化途径相关的序列形成稳定的复合物,这些序列被包含在来源于测试受试者的生物样品内。本领域的技术人员应该意识到的是,在将反义核酸用作探针核酸的情况下,提供于样品中的靶多核苷酸被选择为与该反义核酸的序列互补。相反地,在核苷酸探针是有义核酸的情况下,该靶多核苷酸被选择为与该有义核酸的序列互补。可以在不同严格度条件下进行杂交。用于实践本发明的适合的杂交条件是这样的,使得探针和与信号传导生化途径相关的序列之间的识别相互作用既是充分特异的又是充分稳定的。增加杂交反应的严格度的条件在本领域是广泛已知且公开的。参见例如,(萨姆布鲁克(sambrook)等人,(1989);非放射性原位杂交应用手册(nonradioactiveinsituhybridizationapplicationmanual),宝灵曼公司(boehringermannheim),第二版)。可以使用固定在任何固体支持物上的探针进行杂交测定,所述固体支持物包括但不限于硝化纤维、玻璃、硅以及多种基因阵列。如描述于美国专利号5,445,934中,在高密度基因芯片上执行优选的杂交测定。对于在杂交测定过程中形成的探针-靶标复合物的常规检测,将核苷酸探针络合至可检测标记物上。适于在本发明中使用的可检测标记物包括通过光化学、生物化学、光谱学、免疫化学、电学、光学或化学手段可检测的任何组合物。多种多样的适当的可检测标记物在本领域是已知的,包括荧光或化学发光标记物、放射性同位素标记物、酶或其他配体。在优选的实施例中,可能希望的是利用荧光标记物或酶标签,如地高辛、β-半乳糖苷酶、脲酶、碱性磷酸酶或过氧化物酶、亲和素/生物素复合物。用于检测或定量杂交强度的检测方法将典型地取决于以上选择的标记物。例如,可以使用照相底片或感光成像仪检测放射性标记物。可以使用检测发射光的光检测器检测并定量荧光标记物。典型地通过为酶提供底物并测量由酶对底物的作用而产生的反应产物来检测酶标记物;并且最后,通过简单地使着色的标记物可视化而检测比色标记物。还可以通过检查对应的基因产物确定与信号传导生化途径相关的序列的试剂诱导的表达变化。确定蛋白质水平典型地涉及a)使包含在生物样品中的蛋白质与特异性结合到与信号传导生化途径相关的蛋白质上的试剂接触;并且(b)鉴定这样形成的任何试剂:蛋白质复合物。在此实施例的一个方面,特异性结合与信号传导生化途径相关的蛋白质的该试剂是一种抗体,优选单克隆抗体。通过在将允许在该试剂和与信号传导生化途径相关的蛋白质之间形成复合物的条件下,通过使该试剂与来源于测试样品的与信号传导生化途径相关的蛋白质的样品接触而进行该反应。可以根据本领域中的标准程序直接地或间接地检测复合物的形成。在直接检测方法中,这些试剂提供有可检测的标记物并且未反应的试剂可以从复合物中除去;由此剩余的标记物的量指示形成的复合物的量。对于这样的方法,优选的是选择即使在严格洗涤条件过程中仍附接至这些试剂上的标记物。优选的是,该标记物不干扰结合反应。在替代方案中,间接检测程序可以使用包含用化学方法或酶方法引入的标记物的试剂。令人希望的标记物通常不干扰所得的试剂:多肽复合物的结合或稳定性。然而,标记物典型地被设计成是用于有效结合并且因此产生可检测的信号的抗体可及的。适于检测蛋白质水平的多种多样的标记物在本领域是已知的。非限制性实例包括放射性同位素、酶、胶体金属、荧光化合物、生物发光化合物以及化学发光化合物。可以通过标准定量测定定量在结合反应过程中形成的试剂:多肽复合物的量。如上所示,可以通过仍留在结合位点处的标记物的量直接测量试剂:多肽复合物的形成。在一个替代方案中,测试与信号传导生化途径相关的蛋白质与标记的类似物结合特定试剂上的位点的竞争能力。在此竞争测定中,捕获的标记物的量与存在于测试样品中的与信号传导生化途径相关的蛋白质序列的量成反比。多种用于蛋白质分析的基于以上概括的总则的技术在本领域是可获得的。它们包括但不限于放射免疫测定、elisa(酶联免疫放射测定)、“夹层”免疫测定、放射免疫测定、原位免疫测定(使用例如,胶体金、酶或放射性同位素标记物)、蛋白质印迹分析、免疫沉淀测定、免疫荧光测定以及sds-page。特异性识别或结合到与信号传导生化途径相关的蛋白质上的抗体对于执行前述蛋白质分析而言是优选的。在希望的情况下,可以使用识别特定类型的翻译后修饰(例如,信号传导生化途径诱导的修饰)的抗体。翻译后修饰包括但不限于糖基化、脂化、乙酰化以及磷酸化。这些抗体可以购自商业供应商。例如,特异性识别酪氨酸磷酸化蛋白质的抗磷酸酪氨酸抗体可以获得自多个供应商,包括英杰公司和珀金埃尔默公司(perkinelmer)。抗磷酸酪氨酸抗体在检测响应于er应激而在其酪氨酸残基上存在差异磷酸化的蛋白质中是特别有用的。这样的蛋白质包括但不限于真核翻译起始因子2α(eif-2α)。可替代地,可以通过用展示出希望的翻译后修饰的靶蛋白免疫宿主动物或抗体产生细胞而使用常规的多克隆或单克隆抗体技术产生这些抗体。在实践主题方法中,可以令人希望的是,在不同身体组织中、在不同细胞类型中和/或在不同亚细胞结构中辨别与信号传导生化途径相关的蛋白质的表达谱。可以通过使用能够结合到优先表达于某些组织、细胞类型或亚细胞结构中的蛋白质标记的组织特异的、细胞特异的或亚细胞结构特异的抗体进行这些研究。还可以通过检查基因产物相对于对照细胞的活性变化而确定与信号传导生化途径相关的基因的改变的表达。与信号传导生化途径相关的蛋白质的试剂诱导的活性变化的测定将取决于处于研究之下的生物活性和/或信号传导途径。例如,在该蛋白质是一种激酶的情况下,可以通过本领域已知的多种测定确定它磷酸化一种或多种下游底物的能力的变化。代表性测定包括但不限于用抗体进行免疫印迹和免疫沉淀,这些抗体是如识别磷酸化蛋白质的抗磷酸酪氨酸抗体。此外,可以通过高通量化学发光测定检测激酶活性,如alphascreentm(可获得自珀金埃尔默公司)和etagtm测定(陈-辉(chan-hui)等人(2003)临床免疫学(clinicalimmunology)111:162-174)。在与信号传导生化途径相关的蛋白质是使得细胞内ph条件波动的信号传导级联的一部分的情况下,可以将ph敏感的分子(如荧光ph染料)用作报道分子。在与信号传导生化途径相关的蛋白质是一种离子通道的另一个实例中,可以监测膜电位和/或细胞内离子浓度的波动。多种商业试剂盒和高通量装置特别适于快速且稳健地筛选离子通道调节剂。代表性仪器包括fliprtm(分子设备公司(moleculardevices,inc.))和vipr(奥罗拉生物科学公司(aurorabiosciences))。这些仪器能够同时检测微板的1000多个样品孔中的反应,并且能够提供一秒内或甚至一毫秒内的实时测量和功能数据。在实践在此披露的任何方法中,可以经由本领域已知的一种或多种方法将适合的载体引入进细胞或胚胎中,这些方法包括但不限于,显微注射、电穿孔、声致穿孔、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状聚合物转染、热休克转染、核转染、磁转染、脂转染、刺穿转染(impalefection)、光学转染、专有剂增强的核酸摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒体进行递送。在一些方法中,通过显微注射将该载体引入进胚胎中。可以将这个或这些载体显微注射进胚胎的细胞核或细胞质中。在一些方法中,通过核转染将这个或这些载体引入进细胞中。crispr复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如,该靶多核苷酸可以是一种驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)或被基因产物(例如蛋白质)编码的序列或一个非编码(rna)序列(例如,调节多核苷酸或无用dna)。靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是一个以异常高的水平被表达的基因;在改变的表达与疾病的出现和/或进展相关的情况下,它可以是一个以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因。转录的或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。crispr复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如,该靶多核苷酸可以是一种驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用dna)。不希望被理论所束缚,据信该靶序列可以与pam(原型间隔子邻近基序)相关;也就是说,与由crispr复合物识别的短序列相关。对pam的精确序列和长度要求取决于使用的crispr酶而不同,但是pam典型地是邻近原型间隔子(也就是说,靶序列)的2-5个碱基对序列。在以下实例部分中给出pam序列的实例,并且熟练人员将能够鉴定与给定的crispr酶一起使用的另外的pam序列。crispr复合物的靶多核苷酸可以包括多个疾病相关基因和多核苷酸以及信号传导生化途径相关基因和多核苷酸,如分别提交于2012年12月12日和2013年1月2日、标题均为用于序列操纵的系统方法和组合物(systemsmethodsandcompositionsforsequencemanipulation)的美国临时专利申请61/736,527和61/748,427和于2013年12月12日提交的标题为用于序列操纵和治疗应用的系统、方法和组合物的递送、工程化和优化(delivery,engineeringandoptimizationofsystems,methodsandcompositionsforsequencemanipulationandtherapeuticapplications)的pct申请中pct/us2013/074667所列举,将所有这些申请的内容通过引用以其全文结合在此。靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是一个以异常高的水平被表达的基因;在改变的表达与疾病的出现和/或进展相关的情况下,它可以是一个以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因。转录的或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。基因组/转录组广泛敲除或敲低筛选可以将在此描述的crispr效应蛋白复合物用于进行有效并且且符合成本效益的功能基因组筛选。此类筛选可以利用基于crispr效应蛋白的基因组广度文库。此类筛选和文库可以提供确定基因的功能,涉及的细胞路径基因,以及任何基因表达的改变是如何能够产生一个具体生物过程的。本发明的一个优点在于,该crispr系统避免了脱靶结合及其所产生的副作用。这是通过使用被安排为具有针对靶dna/rna的高度序列特异性的系统而实现的。在本发明的优选实施例中,crispr效应蛋白复合物是组29或组30效应蛋白复合物。在本发明的实施例中,基因组广度文库可以包括多个组29或组30效应蛋白指导rna,如在此描述的,其包括能够靶向真核细胞群中多个基因座中多个靶序列的指导序列。这些细胞群可以是胚胎干(es)细胞群。基因组座位中的靶序列可以是非编码序列。该非编码序列可以是内含子、调节序列、剪接位点、3’utr、5’utr、或多聚腺苷酸化信号。可以通过所述靶向来改变一种或多种基因产物的基因功能。该靶向可导致基因功能的敲除。基因产物的靶向可以包括多于一种指导rna。一种基因产物可以被2、3、4、5、6、7、8、9、或10种指导rna靶向,例如每个基因3至4种。通过利用由组29或组30效应蛋白复合物产生的交错双链断裂或通过利用类似于crispr-cas9系统中使用的那些的方法,可以使脱靶修饰最小化(参见例如rna-指导的cas9核酸酶的dna靶向特异性.徐(hsu),p.、斯科特(scott),d.、温斯坦(weinstein),j.、兰(ran),fa.、科纳曼(konermann),s.、阿格瓦拉(agarwala),v.、李(li),y.、法恩(fine),e.、吴(wu),x.、沙勒姆(shalem),o.、克拉迪克(cradick),tj.、马拉菲尼(marraffini),la.、包(bao),g.、&张(zhang),f.自然生物技术(natbiotechnol)doi:10.1038/nbt.2647(2013)),通过引用结合在此。该靶向可以具有约100或更多个序列。该靶向可以具有约1000或更多个序列。该靶向可以具有约20,000或更多个序列。该靶向可以具有整个基因组。该靶向可以具有一系列聚焦于相关或令人希望的途径的靶序列。该途径可以是免疫途径。该途径可以是细胞分裂途径。本发明的一个方面包括基因组或转录组广度文库,该基因组或转录组广度文库可以包括多个组29或组30指导rna,这些指导rna可以包括能够靶向多个基因座中多个靶序列的指导序列,其中所述靶向导致基因功能的敲低或敲低。该文库可以潜在包括靶向生物基因组中各个和每个基因的指导rna。在本发明的一些实施例中,该生物或受试者是真核生物(包括人类在内的哺乳动物)或非人类真核生物或非人类动物或非人类哺乳动物。在一些实施例中,该生物或受试者是非人类动物,并且可以是节肢动物例如昆虫,或者可以是线虫。在本发明的一些方法中,该生物或受试者是植物。在本发明的一些方法中,该生物或受试者是哺乳动物或非人类哺乳动物。非人类哺乳动物可以是例如啮齿动物(优选小鼠或大鼠)、有蹄动物、或灵长动物。在本发明的一些方法中,该生物或受试者是包括微藻在内的藻类,或者是真菌。基因功能的敲低或敲低可包括:向细胞群中的每个细胞中引入一种或多种载体的载体系统,所述载体系统包含组29或组30效应蛋白系统的工程化的、非天然存在的组29或组30效应蛋白,该组29或组30效应蛋白系统包含i.组29或组30效应蛋白,和ii.一种或多种指导rna,其中组分i和ii可以是相同的或位于系统的不同载体上;将组分i和ii整合到每个细胞中,其中指导序列靶向每个细胞中的独特基因或其转录物或其他rna序列细胞,其中组29或组30效应蛋白与调控元件可操作地连接,其中当转录时,包含指导序列的指导rna指导组29或组30效应蛋白系统的组29或30组效应蛋白的序列特异性结合至本文其他地方描述的独特基因(转录物)或其他rna的基因座的靶序列;诱导组29或组30效应蛋白对基因座的切割;并确认细胞群体的每个细胞中多个独特靶的不同的敲低/敲低突变从而产生基因敲低/敲低细胞文库。本发明包括,该细胞群是真核细胞群,并且在一个优选实施例中,该细胞群是胚胎干(es)细胞群。该一种或多种载体可以是质粒载体。该载体可以是单一载体,其包括组29或组30效应蛋白、sgrna,以及任选地,进入靶细胞中的选择性标记。不被理论所束缚,通过单一载体同时递送组29或组30效应蛋白和sgrna的能力使得能够应用于任何感兴趣的细胞类型,而不需要首先产生表达组29或组30效应蛋白的细胞系。该调控元件可以是诱导型启动子。该诱导型启动子可以是多西环素诱导型启动子。在本发明的一些方法中,该指导序列的表达是在t7启动子控制下并且是由t7聚合酶的表达驱动的。可以通过全外显子组/转录组测序证实不同敲低/敲低突变。可以在100或更多个独特基因中实现敲低/敲低突变。可以在1000或更多个独特基因中实现敲低/敲低突变。可以在20,000或更多个独特基因中实现敲除突变。可以在整个基因组/转录组中实现敲低/敲低突变。可以在多个独特基因中实现基因功能的敲低/敲低,这些独特基因在特定生理途径或状态下发挥作用。该途径或状态可以是免疫途径或状态。该途径或状态可以是细胞分裂途径或状态。本发明还提供了试剂盒,其包括在此提及的基因组/转录组(或其他的rna,如本文其他地方所描述的)广度文库。该试剂盒可以包括单个容器,该容器包括包含本发明所述文库的载体或质粒。该试剂盒还可以包括面板,该面板包括具有包括来自本发明所述文库的指导序列的组29或组30效应蛋白系统的独特的组29或组30效应蛋白指导rna的选择,其中该选择指示特定的生理条件。本发明包括,该靶向具有约100或更多个序列、约1000或更多个序列或约20,000或更多个序列或整个基因组/转录组。此外,一系列靶序列可以聚焦于相关或令人希望的途径,如免疫路径或细胞分裂。在本发明的另外方面,组29或组30效应蛋白可以包含一个或多个突变,并且可以用作具有或不具有与功能结构域融合的通用dna/rna结合蛋白。这些突变可以是人工引入的突变或获得性和丢失性功能突变。如本文所述对突变进行了表征。在本发明的一个方面,该功能结构域可以是转录激活结构域,其可以是vp64。在本发明的其他方面,该功能结构域可以是转录阻遏因子结构域,其可以是krab或sid4x。本发明的其他方面涉及融合到结构域上的突变的组29或组30效应蛋白,这些结构域包括但不限于,转录激活剂、阻遏因子、重组酶、转座酶、组蛋白重塑剂(histoneremodeler)、脱甲基酶、dna甲基转移酶、隐花色素、光可诱导/可控制结构域或化学可诱导/可控制结构域。本发明的一些方法可以包括诱导靶向基因的表达。在一个实施例中,通过利用功能结构域来通过靶向真核细胞群中多个基因组座位中多个靶序列诱导表达。在利用组29或组30效应蛋白复合物的本发明的实践中有用的是在crispr-cas9系统中使用的方法,并且参考:genome-scalecrispr-cas9knockoutscreeninginhumancells[在人细胞中基因组规模crispr-cas9敲除筛选].shalem,o.、sanjana,ne.、hartenian,e.、shi,x.、scott,da.、mikkelson,t.、heckl,d.、ebert,bl.、root,de.、doench,jg.、zhang,f.science[科学]12月12日.(2013)。[电子版先于印刷版];以最终编辑的形式发布为:science[科学].2014年1月3日;343(6166):84-87。沙勒姆(shalem)等人涉及新的在基因组广度范围上探询基因功能的方式。他们的研究显示,递送基因组范围的crispr-cas9敲除(gecko)文库利用64,751个独特的指导序列靶向18,080个基因,这些指导序列使得在人细胞中阴性和阳性选择筛选两者成为可能。首先,这些作者显示,使用该gecko文库来鉴定癌症和多能干细胞中对于细胞活力至关重要的基因。接着,在黑色素瘤模型中,这些作者针对基因进行筛选,这些基因的损失涉及对维罗非尼(一种抑制突变体蛋白激酶braf的治疗剂)的抗性。他们的研究显示,最高级候选物包括先前验证的基因nf1和med12连同新颖的命中物nf2、cul3、tada2b、和tada1。这些作者观察到在靶向相同基因的独立指导rna之间的高水平的一致性以及高比率的命中确认,并且因此证实了采用cas9进行基因组范围筛选的前景。还参考美国专利公开号us20140357530;以及pct专利公开wo2014093701,通过引用特此结合于此。功能改变和筛选另一方面,本发明提供功能评估和基因/转录物(或其他rna)筛选的方法。本发明的crispr系统用于精确地递送功能域、通过精确地改变感兴趣的特定基因座上的甲基化位点来激活或阻遏基因或改变表观遗传状态的用途可以与一种或多种指导rna一起应用于单细胞或细胞群体或与文库一起应用于离体或体内细胞池中的基因组,其包括施用或表达包含多种指导rna(sgrna)的文库并且其中该筛选还包括使用组29或组30效应蛋白的用途,其中包含组29或组30效应蛋白的crispr复合物被修饰以包含异源功能域。在一个方面,本发明提供了用于筛选基因组的方法,该方法包括向宿主给予文库或在宿主的体内表达文库。在一个方面,本发明提供了如本文讨论的方法,该方法进一步包括给予该宿主的或在该宿主中表达的激活因子。在一个方面,本发明提供了如本文讨论的方法,其中该激活因子附接至组29或组30效应蛋白。在一个方面,本发明提供了如本文讨论的方法,其中该激活因子附接至该组29或组30效应蛋白的n末端或c末端。在一个方面,本发明提供了如本文讨论的方法,其中该激活因子附接至sgrna环。在一个方面,本发明提供了如本文讨论的方法,该方法进一步包括给予该宿主的或在该宿主中表达的阻遏因子。在一个方面,本发明提供了如本文讨论的方法,其中该筛选包括在该基因座中影响并检测基因激活、基因抑制、或切割。在一个方面,本发明提供了有效的中靶活性并且最小化了脱靶活性。在一个方面,本发明提供了由组29或组30效应蛋白进行的有效的中靶切割并且最小化了由该组29或组30效应蛋白进行的脱靶切割。在一个方面,本发明提供了组29或组30效应蛋白在基因座处的指导特异性结合而没有dna/rna切割。因此,在一个方面,本发明提供了靶标特异性基因调节。在一个方面,本发明提供了组29或组30效应蛋白在基因座处的指导特异性结合而没有dna/rna切割。因此,在一个方面,本发明使用单一组29或组30效应蛋白提供了一个基因座处的切割和不同基因座处的基因调节。在一个方面,本发明使用一种或多种组29或组30效应蛋白和/或酶提供了多个靶标的正交激活和/或抑制和/或切割。在一个方面,本发明提供了如本文讨论的方法,其中该宿主是真核细胞。在一个方面,本发明提供了如本文讨论的方法,其中该宿主是哺乳动物细胞。在一个方面,本发明提供了一种如在此讨论的方法,其中该宿主是非人类真核生物。在一个方面,本发明提供了一种如在此讨论的方法,其中该非人类真核生物是非人哺乳动物。在一个方面,本发明提供了一种如在此讨论的方法,其中该非人哺乳动物是小鼠。在一个方面,本发明提供了如本文讨论的方法,该方法包括递送组29或组30效应蛋白复合物或其一种或多种组分或对其进行编码的一种或多种核酸分子,其中所述一种或多种核酸分子被操作性地连接至一个或多个调节序列并且在体内进行表达。在一个方面,本发明提供了如本文讨论的方法,其中该体内表达是经由慢病毒、腺病毒、或aav。在一个方面,本发明提供了如本文讨论的方法,其中该递送是经由粒子、粒子、脂质或细胞穿透肽(cpp)。在一个方面,本发明提供了包含组29或组30效应蛋白的一对crispr复合物,其各自包含指导rna(sgrna),该sgrna包含能够杂交到细胞中的感兴趣的基因座中的靶序列上的指导序列,其中每个sgrna的至少一个环通过插入一个或多个不同的rna序列而被修饰,该一个或多个rna序列结合至一种或多种衔接蛋白,并且其中该衔接蛋白与一个或多个功能域关联,其中每个组29或组30效应蛋白复合物的每个sgrna都包含具有dna和/或rna切割活性的功能域。在一个方面,本发明提供了如本文讨论的成对的组29和/或组30效应蛋白复合物,其中dna或rna切割活性是由于fok1核酸酶。在一个方面,本发明提供了如本文讨论的文库、方法或复合物,其中该sgrna被修饰成具有至少一个非编码功能环,例如其中这至少一个非编码功能环是阻遏性的;例如,其中这至少一个非编码功能环包含alu。在一个方面,本发明提供了用于改变或修饰基因产物表达的方法。所述方法可以包括向含有并表达编码该基因产物的dna/rna分子的细胞中引入工程化的、非天然存在的crispr系统,该系统包含组29或组30效应蛋白和靶向该dna/rna分子的指导rna,由此该指导rna靶向编码该基因产物的dna/rna分子,并且该组29或组30效应蛋白切割编码该基因产物的dna/rna分子,由此改变该基因产物的表达;并且,其中该组29或组30效应蛋白和这些指导rna并不天然地一起存在。本发明包括包含连接至同向重复序列上的指导序列的指导rna。本发明进一步包括经密码子优化以便在真核细胞中表达的组29或组30效应蛋白。在一个优选实施例中,该真核细胞是哺乳动物细胞,并且在一个更优选的实施例中,该哺乳动物细胞是人细胞。在本发明的一个另外的实施例中,该基因产物的表达被降低。在一些实施例中,一个或多个功能域与组29或组30效应蛋白关联。在一些实施例中,一个或多个功能域与衔接蛋白关联,例如,如与konnerman等人(nature[自然]517,583-588,2015年1月29日)的修饰指导一起使用的衔接蛋白。在一些实施例中,一个或多个功能结构域与死sgrna(drna)关联。在一些实施例中,drna复合物与活性组29或组30效应蛋白通过在一个基因座处的功能域指导基因调控,而sgrna通过在另一个基因座处的活性组29或组30效应蛋白指导dna/rna切割,例如,如dahlman等人,“orthogonalgenecontrolwithacatalyticallyactivecas9nuclease[用催化活性cas9核酸酶进行正交基因控制]”(出版中)在crispr-cas9系统中类似地描述的。在一些实施例中,相比于脱靶调节,drna被选择为最大化针对感兴趣的基因座位的调节的选择性。在一些实施例中,drna被选择为最大化靶基因调节和最小化靶切割。出于以下讨论的目的,参考功能域可以是与组29或组30效应蛋白关联的功能域或与衔接蛋白关联的功能域。在一些实施例中,该一个或多个功能结构域是nls(核定位序列)或nes(核输出信号)。在一些实施例中,该一个或多个功能结构域是转录激活结构域,其包括vp64、p65、myod1、hsf1、rta、set7/9和组蛋白乙酰转移酶。就与crispr酶关联的那些而言,在此其他对激活(或激活因子)结构域的参考文献包括任何已知的转录激活结构域,并且确切地为vp64、p65、myod1、hsf1、rta、set7/9或组蛋白乙酰转移酶。在一些实施例中,该一个或多个功能结构域是转录阻遏因子结构域。在一些实施例中,该转录阻遏因子结构域是krab结构域。在一些实施例中,该转录阻遏因子结构域是nue结构域,ncor结构域、sid结构域或sid4x结构域。在一些实施例中,一个或多个功能结构域具有一种或多种活性,包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、rna切割活性、dna切割活性、dna整合活性或核酸结合活性。在一些实施例中,组蛋白修饰结构域也是优选的。下文讨论了示例性组蛋白修饰结构域。转座酶结构域、hr(同源重组)机构结构域、重组酶结构域和/或整合酶结构域作为本发明的功能结构域也是优选的。在一些实施例中,dna整合活性包括hr机构结构域、整合酶结构域、重组酶结构域和/或转座酶结构域。在一些实施例中,组蛋白乙酰转移酶是优选的。在一些实施例中,dna切割活性是由于核酸酶。在一些实施例中,核酸酶包括fok1核酸酶。参见,“用于高度特异性基因组编辑的二聚体crisprrna-指导的foki核酸酶(dimericcrisprrna-guidedfokinucleasesforhighlyspecificgenomeediting)”,辛达尔(shengdar)q.蔡(tsai),尼古拉斯维尼肯斯(nicolaswyvekens),赛德凯特尔(cydkhayter),詹尼弗a.福登(jennifera.foden),维沙尔撒帕尔(vishalthapar),迪帕克瑞昂(deepakreyon),马修j.古德温(mathewj.goodwin),马丁j.阿里耶(martinj.aryee),j.基思庄(j.keithjoung)自然生物学技术(naturebiotechnology)32(6):569-77(2014),涉及识别延伸的序列并且可以在人细胞中高效编辑内源基因的二聚体rna-指导的foki核酸酶。在一些实施例中,该一个或多个功能结构域附接至该组29或组30效应蛋白,这样使得当结合至该sgrna和靶标时,该功能结构域处于空间取向,从而允许该功能结构域在其属性功能中起作用。在一些实施例中,该一个或多个功能域附接至该衔接蛋白,这样使得当该组29或组30效应蛋白结合至该sgrna和靶标时,该功能域处于允许该功能域以其属性功能起作用空间取向。在一个方面,本发明提供了如本文讨论的组合物,其中该一个或多个功能域经由接头(任选如本文讨论的glyser接头)附接至该组29或组30效应蛋白或衔接蛋白。经常通过染色质修饰酶(如组蛋白甲基转移酶(hmt)和脱乙酰基酶(hdac))介导内源转录阻遏。阻遏组蛋白效应子结构域是已知的,并且下面提供了示例性列表。在该示例性列表中,优选小尺寸的蛋白和功能性截短,以促进有效的病毒包装(例如经由aav)。一般来说,然而,这些结构域可以包括hdac、组蛋白甲基转移酶(hmt)、和组蛋白乙酰转移酶(hat)抑制剂,连同hdac和hmt募集蛋白。该功能结构域可以是或包括,在一些实施例中,hdac效应子结构域、hdac募集物效应子结构域(hdacrecruitereffectordomain)、组蛋白甲基转移酶(hmt)效应子结构域、组蛋白甲基转移酶(hmt)募集物效应子结构域、或组蛋白乙酰转移酶抑制剂效应子结构域。hdac效应结构域因此,本发明所述阻遏因子结构域可以选自组蛋白甲基转移酶(hmt)、组蛋白脱乙酰酶(hdac)、组蛋白乙酰转移酶(hat)抑制剂、连同hdac和hmt募集蛋白。hdac结构域可以是上表中的任何一个,即:hdac8、rpd3、mesolo4、hdac11、hdt1、sirt3、hst2、cobb、hst2、sirt5、sir2a或sirt6。在一些实施例中,该功能结构域可以是hdac募集物效应子结构域。优选的实例包括在下表中的那些,即:mecp2、mbd2b、sin3a、ncor、sall1、rcor1。在本发明实例中示例了ncor,并且尽管优选,但是设想该类别中的其他也是有用的。hdac募集物效应子结构域的表在一些实施例中,该功能结构域可以是甲基转移酶(hmt)效应子结构域。优选的实例包括在下表中的那些,即:nue、vset、ehmt2/g9a、suv39h1、dim-5、kyp、suvr4、set4、set1、setd8、以及tgset8。在本发明实例中示例了nue,并且尽管优选,但是设想该类别中的其他也是有用的。组蛋白甲基转移酶(hmt)效应子结构域的表在一些实施例中,该功能结构域可以是组蛋白甲基转移酶(hmt)募集物效应子结构域。优选的实例包括在下表中的那些,即:hp1a、phf19、以及nipp1。组蛋白甲基转移酶(hmt)募集物效应子结构域的表在一些实施例中,该功能结构域可以是组蛋白乙酰转移酶抑制剂效应子结构域。优选的实例包括在下表中列出的set/taf-1β。组蛋白乙酰转移酶抑制剂效应子结构域的表除了启动子或启动子近侧元件之外,还优选的是靶向内源(调节)控制元件(如增强子以及沉默子)。因此,除了靶向启动子之外,本发明还可以用于靶向内源控制元件(包括增强子以及沉默子)。这些控制元件可以位于转录起始位点(tss)的上游和下游,从距离tss200bp开始至100kb。对已知控制元件的靶向可以用于活化或阻遏感兴趣的基因。在一些情况下,单个控制元件可以影响多个靶基因的转录。对单个控制元件的靶向因此可以用于同时控制多个基因的转录。另一方面,对假定的控制元件的靶向(例如,通过对假定的控制元件连同该元件周围200bp直至100kb的区域进行铺瓦(tiling))可以用作一种验证此类元件(通过测量感兴趣的基因的转录)或检测新颖控制元件(例如,通过对感兴趣的基因的tss上游和下游的100kb进行铺瓦)的手段。此外,对假定的控制元件的靶向在理解疾病的遗传原因的情况下可以是有用的。与疾病表型关联的许多突变和常见的snp变体位于编码区之外。用本文描述的活化或阻遏系统对此类区域靶向后可以接着读出a)一组假定的靶标(例如,一组位于非常接近于控制元件处的基因)或b)通过例如rnaseq或微阵列进行全转录组读出的转录。这将允许鉴定疾病表型中所涉及的可能候选基因。此类候选基因可以用作新颖的药物靶标。本文中提及了组蛋白乙酰转移酶(hat)抑制剂。然而,在一些实施例中,一种替代方案是,该一个或多个功能结构域包括乙酰转移酶,优选组蛋白乙酰转移酶。这些在表观基因组学领域中是有用的,例如在探询表观基因组的方法中。探询表观基因组的方法可以包括,例如,靶向表观基因组序列。靶向表观基因组序列可以包括该指导被引导至表观基因组靶序列。表观基因组靶序列可以包括,在一些实施例中,包括启动子、沉默子或增强子序列。连接到如在此描述的组29或组30效应蛋白,优选死亡组29或组30效应蛋白,更优选死亡-fn组29或组30效应蛋白上的功能域靶向表观基因组序列的用途可以用于活化或阻遏启动子、沉默子或增强子。乙酰转移酶的实例是已知的,但在一些实施例中,可以包括组蛋白乙酰转移酶。在一些实施例中,组蛋白乙酰转移酶可以包括人类乙酰转移酶p300的催化核心(哲巴斯卡(gerbasch)和雷迪(reddy),自然生物技术(naturebiotech)2015年4月6日)。在一些优选实施例中,该功能结构域连接到失活的死亡组29或组30效应蛋白上以靶向并且活化表观基因组序列,如启动子或增强子。还可以提供针对此类启动子或增强子的一种或多种指导来引导crispr酶与此类启动子或增强子的结合。在此相对于功能域与组29或组30效应蛋白或衔接蛋白的关联使用术语“与……关联”。关于一种分子相对于另一种分子如何“关联”,例如在衔接蛋白与功能域之间、或在组29或组30效应蛋白与功能域之间进行使用。在这样的蛋白质-蛋白质相互作用的情况下,可以按抗体识别表位的方式就识别而论看待这种关联。可替代地,一种蛋白可以经由这两种蛋白的融合物与另一蛋白关联,例如一个亚基融合至另一亚基。融合典型地通过将一种蛋白的氨基酸序列添加至另一蛋白的氨基酸序列上而发生,例如经由一起剪接编码每种蛋白或亚基的核苷酸序列。可替代地,这基本上可以被视为两个分子之间的结合或直接连接,如融合蛋白。在任何情况下,融合蛋白可以在感兴趣的两个亚基之间(即酶与功能域之间或衔接蛋白与功能域之间)包括接头。因此,在一些实施例中,组29或组30效应蛋白或衔接蛋白通过结合至其上而与功能域关联。在其他实施例中,组29或组30效应蛋白或衔接蛋白任选地经由中间接头而与功能域关联,因为这两者被融合到一起。功能筛选在一个方面,本发明提供了用于筛选与表型变化关联的功能元件的方法。可以将该文库引入到被适配成包含组29或组30效应蛋白的细胞群中。基于表型,可以将这些细胞分选进至少两个组。表型可以是基因的表达、细胞生长、或细胞活力。对存在于每个组中的指导rna的相对表示进行确定,由此通过存在于每个组中的指导rna的表示来确定与表型变化关联的基因组位点。表型变化可以是感兴趣的基因表达的变化。可以是上调、下调、或敲除/敲低感兴趣的基因。可以将这些细胞分选进高表达组和低表达组。该细胞群可以包括用于确定表型的报告基因构建体。该报告基因构建体可以包括检测标记。可以通过使用检测标记分选细胞。在另一个方面,本发明提供了用于筛选与对化合物的抗性关联的位点的方法。该化合物可以是药物或杀有害生物剂。可以将该文库引入到被适配成包含组29或组30效应蛋白的细胞群中,其中每个细胞群包含不多于一种指导rna;用该化合物处理该细胞群;并且相比于早期时间点,在用该化合物处理之后稍后的时间点确定指导rna的表示,由此通过指导rna的富集来确定与对该化合物的抗性关联的位点。可以通过深度测序方法来确定sgrna的表示。在利用组29或组30效应蛋白复合物的本发明的实践中有用的是在crispr-cas9系统中使用的方法,并且参考:标题为bcl11aenhancerdissectionbycas9-mediatedinsitusaturatingmutagenesis[通过cas9介导的在原位饱和诱变的bcl11a增强子分解]的文章,canver,m.c.、smith,e.c.、sher,f.、pinello,l.、sanjana,n.e.、shalem,o.、chen,d.d.、schupp,p.g.、vinjamur,d.s.、garcia,s.p.、luc,s.、kurita,r.、nakamura,y.、fujiwara,y.、maeda,t.、yuan,g.、zhang,f.、orkin,s.h.&bauer,d.e.doi:10.1038/nature15521,在线公开于2015年9月16日,该文章通过引用结合在此,并且简要讨论如下:canver等人提到了新颖的合并crispr-cas9指导rna文库以进行人类和小鼠bcl11a红系增强子的原位饱和诱变,这些增强子先前被鉴定为与胎儿血红蛋白(hbf)水平相关的增强子,并且其小鼠直向同源物是红系bcl11a表达所必要的。这种方法揭示了关键最小特征和这些增强子的离散脆弱性。通过原代人类祖细胞和小鼠基因转移的编辑,诸位作者验证了bcl11a红系增强子作为针对hbf再诱导的靶标。诸位作者生成了告知治疗性基因组编辑的详细增强子图。使用组29或组30系统修饰细胞或生物的方法在一些实施例中,本发明包括一种修饰细胞或生物的方法。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。该哺乳动物细胞可以是非人类灵长动物、牛、猪、啮齿动物或小鼠细胞。该细胞可以是非哺乳动物真核细胞,如家禽、鱼类或虾。该细胞还可以是植物细胞。该植物细胞可以是作物植物(如木薯、玉米、高粱、小麦、或水稻)的细胞。该植物细胞还可以是藻类、乔木或蔬菜的细胞。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代被改变以便改进生物制品(如抗体、淀粉、醇或其他所希望的细胞产出)的生产。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代包括改变所生产的生物制品的变化。该系统可以包含一种或多种不同的载体。在本发明的一个方面,该效应蛋白经密码子优化以便在所希望的细胞类型,优先真核细胞,优选哺乳动物细胞或人细胞中表达。典型地使用包装细胞形成能够感染宿主细胞的病毒粒子。这样的细胞包括包装腺病毒的293细胞和包含逆转录病毒的ψ2细胞或pa317细胞。在基因疗法中使用的病毒载体通常由将核酸载体包装进病毒粒子的细胞系产生。这些载体典型地包含包装并且随后整合进宿主所需的最低量序列,其他病毒序列由用于有待表达的一个或多个多核苷酸的表达盒替换。失去的病毒功能典型地由包装细胞系反式地提供。例如,在基因疗法中使用的aav载体典型地仅具有来自aav基因组的itr序列,这些序列为包装并整合进宿主基因组所需。将病毒dna包装进以下细胞系中,该细胞系包含编码辅助质粒的其他aav基因,即rep和cap,但缺少itr序列。该细胞系还可以被作为辅助者的腺病毒感染。该辅助病毒促进aav载体的复制和从辅助质粒表达aav基因。由于缺少itr序列,未以显著的量包装该辅助质粒。可以通过例如与aav相比腺病毒更加敏感的热处理减少腺病毒的污染。用于将核酸递送至细胞的另外的方法是本领域的技术人员已知的。参见例如通过引用结合在此的us20030087817。在一些实施例中,用一种或多种在此描述的载体瞬时地或非瞬时地转染宿主细胞。在一些实施例中,当细胞天然地出现在受试者体内时将其转染。在一些实施例中,被转染的细胞取自受试者。在一些实施例中,该细胞来源于取自受试者的细胞,如细胞系。用于组织培养的多种多样的细胞系在本领域是已知的。细胞系的实例包括但不限于,c8161、ccrf-cem、molt、mimcd-3、nhdf、海拉-s3、huh1、huh4、huh7、huvec、hasmc、hekn、heka、miapacell、panc1、pc-3、tf1、ctll-2、c1r、rat6、cv1、rpte、a10、t24、j82、a375、arh-77、calu1、sw480、sw620、skov3、sk-ut、caco2、p388d1、sem-k2、wehi-231、hb56、tib55、jurkat、j45.01、lrmb、bcl-1、bc-3、ic21、dld2、raw264.7、nrk、nrk-52e、mrc5、mef、hepg2、海拉b、海拉t4、cos、cos-1、cos-6、cos-m6a、bs-c-1猴肾上皮细胞、balb/3t3小鼠胚胎成纤维细胞、3t3swiss、3t3-l1、132-d5人类胎儿成纤维细胞;10.1小鼠成纤维细胞、293-t、3t3、721、9l、a2780、a2780adr、a2780cis、a172、a20、a253、a431、a-549、alc、b16、b35、bcp-1细胞、beas-2b、bend.3、bhk-21、br293、bxpc3、c3h-10t1/2、c6/36、cal-27、cho、cho-7、cho-ir、cho-k1、cho-k2、cho-t、chodhfr-/-、cor-l23、cor-l23/cpr、cor-l23/5010、cor-l23/r23、cos-7、cov-434、cmlt1、cmt、ct26、d17、dh82、du145、ducap、el4、em2、em3、emt6/ar1、emt6/ar10.0、fm3、h1299、h69、hb54、hb55、hca2、hek-293、海拉、hepa1c1c7、hl-60、hmec、ht-29、jurkat、jy细胞、k562细胞、ku812、kcl22、kg1、kyo1、lncap、ma-mel1-48、mc-38、mcf-7、mcf-10a、mda-mb-231、mda-mb-468、mda-mb-435、mdckii、mdckii、mor/0.2r、mono-mac6、mtd-1a、myend、nci-h69/cpr、nci-h69/lx10、nci-h69/lx20、nci-h69/lx4、nih-3t3、nalm-1、nw-145、opcn/opct细胞系、peer、pnt-1a/pnt2、renca、rin-5f、rma/rmas、saos-2细胞、sf-9、skbr3、t2、t-47d、t84、thp1细胞系、u373、u87、u937、vcap、维洛(vero)细胞、wm39、wt-49、x63、yac-1、yar及其转基因变种。细胞系可获得自本领域的技术人员已知的多种来源(参见例如,美国典型培养物保藏中心(americantypeculturecollection)(atcc)(马纳萨斯(manassus),弗吉尼亚州))。在一些实施例中,使用用一种或多种在此描述的载体转染的细胞建立新的细胞系,该新的细胞系包括一种或多种载体来源的序列。在一些实施例中,使用用如在此描述的核酸靶向系统的组分转染(如通过用一种或多种载体进行瞬时转染或用rna进行转染)且通过核酸靶向复合物的活性修饰的细胞建立新的细胞系,该新的细胞系包括以下细胞,这些细胞包含吸水但是缺少任何其他外源序列。在一些实施例中,在评估一种或多种测试化合物中使用用一种或多种在此描述的载体瞬时或非瞬时转染的细胞或来源于这样的细胞的细胞系。在一些实施例中,使用一种或多种在此描述的载体产生非人转基因动物或转基因植物。在一些实施例中,该转基因动物是一种哺乳动物,如小鼠、大鼠或兔。在某些实施例中,该生物或受试者是植物。在某些实施例中,该生物或受试者或植物是藻类。用于产生转基因植物和动物的方法在本领域是已知的,并且通常以如在此描述的细胞转染方法开始。在一个方面,本发明提供了用于修饰在一种真核细胞中的靶多核苷酸的方法。在一些实施例中,该方法包括允许靶向核酸的复合物结合到靶多核苷酸上,以实现所述靶多核苷酸的切割,由此修饰靶多核苷酸,其中该靶向核酸的复合物包括与杂交到所述靶多核苷酸内的靶序列上的指导rna复合的靶向核酸的效应蛋白。在一个方面,本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中,该方法包括允许靶向核酸的复合物结合到该多核苷酸上,这样使得所述结合导致所述多核苷酸的表达增加或降低;其中该靶向核酸的复合物包含与指导rna复合的靶向核酸的效应蛋白,该指导rna与靶序列在所述多核苷酸中杂交。组29或组30效应蛋白复合物可用于植物在一些实施例中,本发明包括一种修饰细胞或生物的方法。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。该哺乳动物细胞可以是非人类灵长动物、牛、猪、啮齿动物或小鼠细胞。该细胞可以是非哺乳动物真核细胞,如家禽、鱼类或虾。该细胞还可以是植物细胞。该植物细胞可以是作物植物(如木薯、玉米、高粱、小麦、或水稻)的细胞。该植物细胞还可以是藻类、乔木或蔬菜的细胞。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代被改变以便改进生物制品(如抗体、淀粉、醇或其他所希望的细胞产出)的生产。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代包括改变所生产的生物制品的变化。该系统可以包含一种或多种不同的载体。在本发明的一个方面,该效应蛋白经密码子优化以便在所希望的细胞类型,优先真核细胞,优选哺乳动物细胞或人细胞中表达。一种或多种crispr效应蛋白系统(例如,单个的或多元化的)可以与作物基因组学的最新进展结合使用。这样一种或多种crispr系统可以用于进行有效且具成本效益的植物基因或基因组或转录组探询或编辑或操纵—例如,用于快速研究和/或选择和/或探询和/或比较和/或操纵和/或转化植物基因或基因组;例如,以为一种或多种植物产生、鉴定、开发、优化、或赋予一种或多种性状或一种或多种特征或者以转化植物基因组。因此,可以改进植物、具有性状或特征的新组合的新植物的生产、或具有增强的性状的新植物的生产。关于定点整合(sdi)或基因编辑(ge)或任何近反向育种(nearreversebreeding)(nrb)或反向育种(rb)技术中的植物,可以使用这样的一种或多种crispr系统。关于使用植物中的crispr系统,提及的是亚利桑那大学网站,“crispr-plant”(http://www.genome.arizona.edu/crispr/)(由宾州州立大学(pennstate)和agi提供支持)。本发明的实施例可以用于植物中的基因组编辑,或其中rnai或类似基因组编辑技术先前已经被使用;参见,例如,涅克拉索夫(nekrasov),“植物基因组编辑变得容易:使用crispr/cas系统在模式和作物植物中的靶定诱变(plantgenomeeditingmadeeasy:targetedmutagenesisinmodelandcropplantsusingthecrispr/cassystem)”,植物方法(plantmethods),2013,9:39(doi:10.1186/1746-4811-9-39);brooks,“efficientgeneeditingintomatointhefirstgenerationusingthecrispr/cas9system[使用crispr/cas系统在第一代番茄在有效基因编辑]”,plantphysiology[植物生理学],2014年9月,pp114.247577;单(shan),“使用crispr-cas系统对作物植物进行靶向基因组修饰(targetedgenomemodificationofcropplantsusingacrispr-cassystem)”,自然生物技术(naturebiotechnology)31,686-688(2013);feng,“efficientgenomeeditinginplantsusingacrispr/cassystem[使用crispr/cas系统在植物中的有效基因组编辑]”,cellresearch[细胞研究](2013)23:1229-1232.doi:10.1038/cr.2013.114;在线公开于2013年8月20日;xie,“rna-guidedgenomeeditinginplantsusingacrispr-cassystem[使用crispr-cas系统的植物中的rna引导基因组编辑]”,molplant.[分子植物]2013年11月;6(6):1975-83.doi:10.1093/mp/sst119.电子公开于2013年8月17日;徐(xu),“使用根癌农杆菌介导的crispr-cas系统在水稻中进行基因靶向(genetargetingusingtheagrobacteriumtumefaciens-mediatedcrispr-cassysteminrice)”,水稻(rice)2014,7:5(2014);周(zhou)等人,“在异交多年生木本植物胡杨中针对双等位基因crispr突变开发snp揭示了4-香豆酸:coa连接酶特异性与冗余(exploitingsnpsforbialleliccrisprmutationsintheoutcrossingwoodyperennialpopulusreveals4-coumarate:coaligasespecificityandredundancy)”,新植物学家(newphytologist)(2015)(论坛)1-4(仅在www.newphytologist.com在线可得);卡林多(caliando)等人,“使用crispr装置在宿主基因组中稳定进行的靶向向dna降解(targeteddnadegradationusingacrisprdevicestablycarriedinthehostgenome)”,自然通讯(naturecommunications)6:6989,doi:10.1038/ncomms7989、www.nature.com/naturecommunicationsdoi:10.1038/ncomms7989;美国专利号6,603,061-农杆菌介导的植物转化方法(agrobacterium-mediatedplanttransformationmethod);美国专利号7,868,149-植物基因组序列及其用途(plantgenomesequencesandusesthereof)以及us2009/0100536-转具有增强的农艺性状的基因植物(transgenicplantswithenhancedagronomictraits),将每者的所有内容和披露通过引用以其全文结合在此。在本发明的实践中,morrell等人“cropgenomics:advancesandapplications[作物基因组学:进展与应用]”natrevgenet.[遗传学自然评论]2011年12月29日;13(2):85-96的内容和披露;将其各自通过引用并入本文,包括关于本文的实施例如何可以就植物而使用。因此,加上必要的变更,此处对动物细胞的提及也可适用植物细胞,除非另外是显然的;并且,可以将具有降低的脱靶效应的本文所述的酶和采用此类酶的系统在植物应用中使用,包括在此提及的那些。sugano等人(plantcellphysiol.[植物细胞生理学]2014年3月;55(3):475-81.doi:10.1093/pcp/pcu014.电子公开于2014年1月18日)报道了将crispr/cas9应用于苔类地钱l.(marchantiapolymorphal.)的靶向诱变中,其已经被作为用于研究陆生植物进化的模式物种。对地钱(m.polymorpha)的u6启动子进行鉴定并克隆以表达grna。该grna的靶序列被设计为破坏编码地钱(m.polymorpha)的植物生长素响应因子1(arf1)的基因。使用土壤杆菌介导的转化,菅野(sugano)等人在地钱(m.polymorpha)的配子体世代中分离了稳定的突变体。使用花椰菜花叶病毒35s或地钱(m.polymorpha)ef1α启动子,来实现基于crispr/cas9的体内定点诱变,以表达cas9。显示出植物生长素抗性表型的分离的突变个体不是嵌合的。此外,通过无性繁殖t1植物来产生稳定的突变体。使用基于cripsr/cas9的靶向诱变,易于建立多个arf1等位基因。菅野(sugano)等人的这些方法可以应用于本发明的crisprcas系统。kabadi等人(nucleicacidsres.[核酸研究]2014年10月29日;42(19):e147.doi:10.1093/nar/gku749.epub2014年8月13日)开发了单个慢病毒系统以表达cas9变体,报告基因以及多至四个来自通过方便的金门(goldengate)克隆方法并入到载体中的独立rna聚合酶iii启动子的sgrna。每个sgrna充分表达并且可以介导在永生化和原代人细胞中的多重基因编辑和持续转录活化。卡巴迪(kabadi)等人的这些方法可以应用于本发明的crisprcas系统。xing等人,(bmcplantbiology[bmc植物生物学],2014,14:327)开发了基于pgreen或pcambia骨架连同grna设定的crispr/cas9二元载体。除了bsai以外,这种工具箱(toolkit)不需要限制性内切酶以产生具有玉米密码子优化的cas9以及在少至一个克隆步骤中高效率的一种或多种grna的最终构建体。使用玉米原生质体、转基因玉米株系、和转基因拟南芥属株系,对该工具箱进行验证并且显示其展示出高效率和特异性。更重要的是,使用这种工具箱,在t1代的转基因幼苗中检测出三个拟南芥基因的定向突变。此外,该多重基因突变可以被下一代遗传。(指导rna)模块载体作为工具箱设置用于植物的多元基因组编辑。xing等人的工具箱可以应用于本发明的crisprcas系统。用于经由crispr/cas9靶向植物基因组编辑的方案也可以在系列分子生物学方法(methodsinmolecularbiology)的第1284卷,第239-255页(2015年2月10日)中获得。描述了用于设计、构建、并且评估使用拟南芥和本氏烟原生质体作为模式细胞系统、用于植物密码子优化的cas9(pcocas9)介导的基因组编辑的双grna的详细程序。也讨论了将该crispr/cas9系统应用于在全株中产生靶向的基因组修饰的策略。该章节中描述的方案可以适用于本发明的crisprcas系统。ma等人(molplant.[分子植物]2015年8月,3;8(8):1274-84.doi:10.1016/j.molp.2015.04.007)报道了稳健的crispr/cas9载体系统,其利用植物密码子优化的cas9基因,以便在单子叶植物和双子叶植物中进行方便和高效的多元基因组编辑。马(ma)等人设计了基于pcr的程序以迅速产生多个sgrna表达盒,其可以通过金门(goldengate)连接或吉布森组装在一轮克隆中装配进二元crispr/cas9载体中。使用这种系统,马(ma)等人编辑了稻的46靶位点,突变率为平均85.4%,主要在双等位基因和纯合状态中。ma等人提供了通过同时靶向基因家族的多个(多达八个)成员、生物合成途径中的多基因、或单个基因中的多个位点,t0稻和t1拟南芥属植物中功能缺失基因突变的实例。马(ma)等人这些方法可以适用于本发明的crisprcas系统。lowder等人(plantphysiol.[植物生理学]2015年8月21日,pii:pp.00636.2015)还开发了使得能够在植物中多元基因组编辑和转录调控表达、沉默或非编码基因的crispr/cas9工具箱。该工具箱为研究者提供了方案和试剂以便使用金门和通路(gatewayge)克隆方法,为单子叶植物和双子叶植物快速并且有效地组装功能性crispr/cas9t-dna构建体。它伴随一整套能力发生,包括植物内源基因的多元基因编辑以及转录激活或阻遏。基于t-dna的转化技术是对现代植物生物技术、遗传学、分子生物学以及生理学很重要。因此,申请人开发了一种用于组装cas9(wt、切口酶或dcas9)和一种或多种grna进入感兴趣的t-dna目的载体中的方法。该组装方法基于金门(goldengate)组装和多位点gateway重组二者。组装需要三种模块。第一模块是cas9入门载体,其包含无启动子cas9或其衍生物基因,其侧翼为attl1和attr5位点。第二模块是grna入门载体,其包含入门grna表达盒,其侧翼为attl5和attl2位点。第三模块包括包含attr1-attr2的目的t-dna载体,其提供用于cas9表达的启动子的选择。lowder等人的工具箱可以应用于本发明的crisprcas系统。生物如酵母和微藻被广泛用于合成生物学。stovicek等人(metab.eng.comm.[代谢工程通讯],2015;2:13描述了工业酵母(例如酿酒酵母)的基因组编辑,以有效地产生用于工业生产的稳健菌株。stovicek使用为酵母密码子优化的crispr-cas9系统同时破坏内源基因的两个等位基因并敲入异源基因。cas9和grna从基于基因组或游离基因2μ的载体位置表达。作者还表明,通过优化cas9和grna表达水平可以提高基因破坏效率。hlavová等人(biotechnol.adv.[生物技术进展]2015)讨论了使用诸如crispr的技术开发微藻类物种或菌株以靶向用于插入诱变和筛选的核和叶绿体基因。彼得森(petersen)(“对于精确乙二醇工程化植物(towardspreciselyglycolengineeredplants)”,2015年丹麦植物生物技术年会(plantbiotechdenmarkannualmeeting2015),哥本哈根,丹麦)开发了一种使用crispr/cas9以工程化拟南芥中的基因组改变,例如,以乙二醇工程化拟南芥以便产生具有所希望的翻译后修饰的蛋白和产品的方法。hebelstrup等人(frontplantsci.[植物科学前沿])2015年4月23日;6:247)概述了在植物中淀粉生物工程,由此提供表达淀粉修饰酶并直接产生通常是通过工业化学和/或物理处理淀粉制成的产品的作物。petersen和hebelstrup的方法可以应用于本发明的效应蛋白系统。kurth等人,jvirol.[病毒学杂志]2012年6月;86(11):6002-9.doi:10.1128/jvi.00436-12.电子公开于:2012年3月21日开发了一种基于rna病毒的载体,用于将所需性状引入葡萄树中,而不会对基因组进行可遗传的修饰。载体提供了通过病毒诱导的基因沉默来调节内源基因表达的能力。本发明的系统和蛋白质可用于沉默基因和蛋白质,而不会对基因组进行可遗传的修饰。在一个实施例中,植物可以是豆科植物。本发明可以利用在此披露的crisp-cas系统用于探索并修饰,例如但不限于大豆、豌豆、和花生。curtin等人提供了一种针对豆科植物功能基因组学的工具箱。(参见柯廷等人,“用于豆科植物功能基因组学的基因组工程工具箱(agenomeengineeringtoolboxforlegumefunctionalgenomics)”,第22届国际植物和动物基因组会议(internationalplantandanimalgenomeconferencexxii)2014)。柯廷使用了crispr的遗传转化以敲除/敲低发根与全株系统中的单拷贝和复制豆科植物基因二者。选择这些靶基因中的一些以便探索和优化敲除/敲低系统的特征(例如,八氢番茄红素不饱和酶),而通过大豆与拟南芥切片机样基因的同源性或通过苜蓿属中结瘤的全基因组关联研究来鉴定其他靶基因。花生过敏症以及豆科植物过敏症通常是真实并且严重的健康问题。本发明可以用于鉴别并且然后编辑或沉默编码此类豆科植物的变应原性蛋白的基因。对于此类基因和蛋白没有限制,尼科拉乌(nicolaou)等人鉴别了花生、大豆、扁豆、豌豆、羽扇豆、青豆、和绿豆中的变应原性蛋白。参见,nicolaou等人,currentopinioninallergyandclinicalimmunology[变态反应学与临床免疫学当前观点],2011;11(3):222-228)。在一个有利的实施例中,植物可以是树。本发明还可以利用在此披露的crisprcas系统以用于草本系统(参见,例如,贝勒哈吉(belhaj)等人,植物方法(plantmethods),9:39,以及哈里森(harrison)等人,基因&发育(genes&development),28:1859-1872)。在一个特别有利的实施例中,本发明的crisprcas系统可以靶向树的单核苷酸多态性(snp)(参见,例如,周(zhou)等人,新植物学家(newphytologist),第208卷第2期,第298-301页,2015年10月)。在周(zhou)等人的研究中,诸位作者使用4-香豆酸:辅酶a连接酶(4cl)基因家族作为案例研究在木本多年生杨属植物中应用crisprcas系统,并且对于两个被靶向的4cl基因实现了100%突变效率,检查了携带双等位基因修饰的每个转化子。在周(zhou)等人的研究中,crispr/cas9系统对单核苷酸多态性(snp)高度敏感,因为用于第三4cl基因的切割由于靶序列中的snp而被消除。zhou等人(newphytologist[新植物学家],第208卷第2期,第298-301页,2015年10月)的这些方法可以适用于如下的本发明。与木质素和类黄酮生物合成关联的两个4cl基因(4cl1和4cl2)分别被靶向用于crispr/cas9编辑。常规地用于转化的欧洲山杨×阿尔巴(alba)克隆717-1b4与基因组测序的毛果杨不同。因此,就由参考基因组设计的4cl1和4cl2grna用内部717rna-seq数据进行探询,以确保不存在snp,这可以限制cas效率。针对4cl5设计的第三grna,4cl1的基因组重复,也包括在内。对应的717序列在每个等位基因附近/在pam之内具有一个snp,据期两者均通过4cl5-grna消除靶向。所有三种grna靶位点被定位在第一外显子之内。对于717转化,grna从苜蓿属u6.6启动子中表达,连同在二元载体的camv35s启动子的控制下的人类密码子优化的cas。用仅cas载体进行的转化可以充当对照。使随机选择的4cl1和4cl2株系均经受扩增子测序。然后,加工数据,并且在所有情况下证实双等位基因突变。这些方法可以应用于本发明的效应蛋白系统。在植物中,病原体常常是宿主特异性的。例如,番茄尖镰孢菌番茄专化型(fusariumoxysporumf.sp.lycopersici)引起番茄枯萎病,而且只攻击番茄,并且香石竹尖镰孢禾柄锈菌小麦专化型(f.oxysporumf.dianthiipucciniagraminisf.sp.tritici)只攻击小麦。植物具有抵抗大多数病原体的现有的和诱导性的防御。跨植物代的突变和重组事件导致产生敏感性的遗传变异性,特别是当病原体以比植物更高的频率繁殖时。在植物中可以存在非宿主抗性,例如,该宿主和病原体是不相容的。还可以存在水平抗性,例如典型地由许多基因控制的针对所有种的病原体的部分抗性,以及垂直抗性,例如典型地由很少的基因控制的针对病原体的某些种而不是其他种的完全抗性。在基因对基因水平中,植物和病原体一起演化,并且在一者中的遗传变化使在另一者中的变化平衡。因此,使用自然变异,育种者针对产率、质量、均匀性、耐性、抗性将最有用的基因进行结合。抗性基因的来源包括天然或外来品种、传家宝品种(heirloomvarieties)、近缘野生植物、以及诱导的突变,例如用诱变剂处理植物材料。利用本发明,向植物育种者提供了一种新的诱导突变的工具。因此,本领域的技术人员可以分析抗性基因的来源的基因组,并且在具有所希望的特征或性状的品种方面,采用本发明来诱导抗性基因的发生,这样具有比先前的诱变剂更好的精确性,并且因此加速并改良植物育种计划。除了本文和上文另外讨论的植物之外,提供了由效应蛋白和合适的指导物修饰的工程化植物及其子代。这些可能包括抗病或抗旱作物,如小麦、大麦、大米、大豆或玉米;被修饰以去除或降低自体授粉的能力的植物(但是其可以替代地,任选地,以杂交替代);和过敏食物,例如花生和坚果,其中免疫原性蛋白已通过效应蛋白和合适的指导物通过靶向失去能力,被毁灭或破坏。使用经典cripsr-cas系统的任何方面可以适用于是cas蛋白不可知的crispr系统,例如,组29和组30效应蛋白系统。治疗性处理所以本发明的系统可以从本公开(包括治疗、测定和其他应用)无需过多实验而应用于以前的rna切割
技术领域
:,因为本申请为系统的知情工程化提供了基础。本发明提供了由rna、毒性rna和/或突变rna(例如像剪接缺陷或截短)的过表达引起的疾病的治疗性处理。毒性rna的表达可能与核内含物的形成和脑、心脏或骨骼肌中迟发性退行性改变相关。在研究的最好的实例中,在强直性肌营养不良中似乎毒性rna的主要致病作用是隔离结合蛋白并危及选择性剪接的调节(hum.mol.genet.[人类分子遗传学](2006)15(增刊2):r162-r169)。强直性肌营养不良[dystrophiamyotonica(dm)]是遗传学家特别感兴趣的,因为它产生了极其广泛的临床特征。部分清单将包括肌肉萎缩、白内障、胰岛素抗性、睾丸萎缩、心脏传导减慢、皮肤肿瘤和对认知的影响。dm的经典形式,现在称为dm1型(dm1),是由于在编码细胞溶质蛋白激酶的基因dmpk的3'非翻译区(utr)中ctg重复的扩增而引起的。下表列出了在dm1骨骼肌、心脏或大脑中显示错配的选择性剪接的外显子列表。本发明的酶可靶向过表达的rna或毒性rna,例如像dmpk基因或在例如上表中的dm1骨骼肌、心脏或大脑中的任何错误调节的选择性剪接。如下表所示,本发明的酶还可以靶向影响导致疾病的rna依赖性功能的反式作用突变(cell.[细胞]2009年2月20日;136(4):777-793)。本发明的酶还可用于治疗各种tau疾病,包括原发性和继发性tau疾病,例如原发性年龄相关性tau疾病(part)/神经元纤维缠结主导的老年失智(具有与ad相似的nft但不具有神经斑)、拳击员痴呆(慢性创伤性脑病)、进行性核上性麻痹、皮层基底节变性、额颞痴呆和与第17号染色体相关的帕金森症、lytico-bodig病(guam氏帕金森痴呆复征)、神经节神经胶质瘤和神经节细胞瘤、脑膜血管瘤病、脑炎后帕金森症、亚急性硬化性全脑炎以及铅毒性脑病、结节性硬化症、哈勒沃登-施帕茨病和脂褐质沉积、阿尔茨海默病。本发明的酶还可靶向破坏引起剪接缺陷和疾病的顺式作用剪接代码的突变(概述于cell.[细胞]2009feb20;136(4):777-793)。运动神经元退行性疾病sma由smn1基因的缺失引起。剩下的smn2基因在外显子7中具有c→t取代,使外显子剪接增强子(ese)失活,并产生外显子剪接沉默子(ess),导致外显子7跳跃和截短的蛋白(smnδ7)。肌营养不良蛋白基因的外显子31中的t→a取代同时产生提前终止密码子(stop)和ess,导致外显子31跳跃。这种突变导致dmd的轻度形式,因为缺乏外显子31的mrna产生了部分功能性蛋白质。编码tau蛋白的mapt基因的外显子10内和下游的突变影响剪接调控元件并破坏包括或排除外显子10的mrna的正常1:1比例。这导致含有四个或三个微管结合结构域(分别为4r-tau和3r-tau)的tau蛋白之间的平衡打乱,引起神经病理学障碍ftdp-17。示出的实例是n279k突变,其增强促进了外显子10包含和向增加的4r-tau的平衡转换的ese功能。cftr基因外显子9的3'剪接位点内的多态性(ug)m(u)n通道影响外显子9包含的程度和全长功能蛋白的水平,改变由cftr基因他处突变引起的囊性纤维化(cf)的严重性。先天性免疫系统主要通过识别感染细胞内的病毒核酸(称为dna或rna感测)来检测病毒感染。体外rna感测分析可用于检测特定的rna底物。靶向rna的效应蛋白例如可用于活细胞中的基于rna的感测。应用的实例是通过感测例如疾病特异性rna的诊断。本发明的靶向rna的效应蛋白可以进一步用于抗病毒活性,特别是针对rna病毒。效应蛋白可以使用对选择的病毒rna序列具有选择性的合适的指导rna来靶向病毒rna。特别地,效应蛋白可以是切割rna的活性核酸酶,例如单链rna。因此提供了本发明的靶向rna的效应蛋白作为抗病毒剂的用途。本发明的酶系统用于靶向上述提及的rna中的rna的治疗剂量预期为约0.1mg/kg至约2mg/kg,该剂量可以与监测的响应相继施用,并且如果需要的话重复剂量直至每位患者约7个至10个剂量。有利地,在治疗方案期间从每个患者收集样品以确定治疗的有效性。例如,可以分离和量化rna样品以确定表达是否减少或改善。这种诊断是在本领域技术人员的范围内的。转录物检测方法本发明的效应蛋白和系统可用于特异性检测细胞或其他样品中的rna。在感兴趣的rna靶标的存在下,指导依赖性的cas13b核酸酶活性可能伴随着针对并行靶标的非特异性rna酶活性。为了利用rna酶活性,所需要的只是可进行检测地切割的报告底物。例如,报道分子可以包含rna,其一端用荧光报道分子(荧光剂)标记,并且另一端用猝灭剂标记。在没有cas13b核糖核酸酶活性的情况下,猝灭剂的物理邻近性将荧光剂的荧光衰减到低水平。当cas13b靶向特异性切割通过存在感兴趣的rna靶标和合适的指导rna而被激活时,含有rna的报道分子被非特异性切割,并且荧光剂和猝灭剂在空间上分开。这导致荧光剂在被适当波长的光激发时发出可检测信号。在一个示例性测定方法中,将cas13b效应蛋白,感兴趣的靶标特异性指导rna和报道分子被添加至细胞样品中。荧光的增加表明感兴趣的rna靶标的存在。在另一个示例性方法中,提供了检测阵列。阵列的每个位置都配有cas13b效应蛋白、报道分子和感兴趣的靶标特异性指导rna。取决于要进行的测定,阵列的每个位置处的感兴趣的靶标特异性指导rna可以是相同的、不同的或是其组合。例如,当需要测试单一来源样品中的一个或多个靶标时,可能会提供不同的感兴趣的靶标特异性指导rna。例如,当需要为相同靶标测试多个样品时,可以在每个位置上提供相同的感兴趣的靶标特异性指导rna。关于crispr-cas系统、其组分、及这类组分的递送(包括方法、材料、递送媒介、载体、粒子、aav、以及其制造和使用(包括关于量和配制品))的一般信息,都可用于本发明的实践中,参考以下:美国专利号8,999,641、8,993,233、8,945,839、8,932,814、8,906,616、8,895,308、8,889,418、8,889,356、8,871,445、8,865,406、8,795,965、8,771,945和8,697,359;美国专利出版物us2014-0310830(美国申请序列号14/105,031)、us2014-0287938a1(美国申请序列号14/213,991)、us2014-0273234a1(美国申请序列号14/293,674)、us2014-0273232a1(美国申请序列号14/290,575)、us2014-0273231(美国申请序列号14/259,420)、us2014-0256046a1(美国申请序列号14/226,274)、us2014-0248702a1(美国申请序列号14/258,458)、us2014-0242700a1(美国申请序列号14/222,930)、us2014-0242699a1(美国申请序列号14/183,512)、us2014-0242664a1(美国申请序列号14/104,990)、us2014-0234972a1(美国申请序列号14/183,471)、us2014-0227787a1(美国申请序列号14/256,912)、us2014-0189896a1(美国申请序列号14/105,035)、us2014-0186958(美国申请序列号14/105,017)、us2014-0186919a1(美国申请序列号14/104,977)、us2014-0186843a1(美国申请序列号14/104,900)、us2014-0179770a1(美国申请序列号14/104,837)和us2014-0179006a1(美国申请序列号14/183,486)、us2014-0170753(美国申请序列号14/183,429);欧洲专利ep2784162b1和ep2771468b1;欧洲专利申请ep2771468(ep13818570.7)、ep276410390(ep13824232.6)、和ep2784162(ep14170383.5);以及pct专利公开wo2014/093661(pct/us2013/074743)、wo2014/093694(pct/us2013/074790)、wo2014/093595(pct/us2013/074611)、wo2014/093718(pct/us2013/074825)、wo2014/093709(pct/us2013/074812)、wo2014/093622(pct/us2013/074667)、wo2014/093635(pct/us2013/074691)、wo2014/093655(pct/us2013/074736)、wo2014/093712(pct/us2013/074819)、wo2014/093701(pct/us2013/074800)、wo2014/018423(pct/us2013/051418)、wo2014/204723(pct/us2014/041790)、wo2014/204724(pct/us2014/041800)、wo2014/204725(pct/us2014/041803)、wo2014/204726(pct/us2014/041804)、wo2014/204727(pct/us2014/041806)、wo2014/204728(pct/us2014/041808)、wo2014/204729(pct/us2014/041809)。还参考分别提交于2013年1月30日;2013年3月15日;2013年3月28日;2013年4月20日;2013年5月6日和2013年5月28日的美国临时专利申请61/758,468;61/802,174;61/806,375;61/814,263;61/819,803和61/828,130。还参考提交于2013年6月17日的美国临时专利申请61/836,123。另外参考各自提交于2013年6月17日的美国临时专利申请61/835,931、61/835,936、61/836,127、61/836,101、61/836,080和61/835,973。进一步参考提交于2013年8月5日的美国临时专利申请61/862,468和61/862,355;提交于2013年8月28日的61/871,301;提交于2013年9月25日的61/960,777和提交于2013年10月28日的61/961,980。进一步参考了:各自提交于2014年6月10日(6/10/14)的pct专利申请号:pct/us2014/041803、pct/us2014/041800、pct/us2014/041809、pct/us2014/041804和pct/us2014/041806;提交于2014年6月11日的pct/us2014/041808;和提交于2014年10月28日的pct/us2014/62558,和美国临时专利申请序列号:61/915,150、61/915,301、61/915,267和61/915,260,各自提交于2013年12月12日;提交于2013年1月29日和2013年2月25日的61/757,972和61/768,959;提交于2013年6月17日的61/835,936、61/836,127、61/836,101、61/836,080、61/835,973、和61/835,931;都提交于2014年6月11日的62/010,888和62/010,879;各自提交于2014年6月10日的62/010,329和62/010,441;各自提交于2014年2月12日的61/939,228和61/939,242;提交于2014年4月15日的61/980,012;提交于2014年8月17日的62/038,358;各自提交于2014年9月25日的62/054,490、62/055,484、62/055,460和62/055,487;以及提交于2014年10月27日的62/069,243。还参考了提交于2014年9月25日的美国临时专利申请号62/055,484、62/055,460、和62/055,487;提交于2014年4月15日的美国临时专利申请61/980,012;和提交于2014年2月12日的美国临时专利申请61/939,242。参考提交于2014年6月10日的pct申请指定(尤其是美国)申请号pct/us14/41806。参考提交于2014年1月22日的美国临时专利申请61/930,214。参考了美国临时专利申请61/915,251;各自提交于2013年12月12日的61/915,260和61/915,267;参考提交于2014年4月15日的美国临时专利申请ussn61/980,012。参考提交于2014年6月10日的pct申请指定(尤其是美国)申请号pct/us14/41806。参考提交于2014年1月22日的美国临时专利申请61/930,214。参考了美国临时专利申请61/915,251;各自提交于2013年12月12日的61/915,260和61/915,267。还提及的是:14年12月12日提交的美国申请62/091,455,保护的指导rna(pgrna)(protectedguidernas(pgrnas));14年12月24日的美国申请62/096,708,保护的指导rna(protectedguidernas(pgrnas));美国申请62/091,462,14年12月12日,crispr转录因子的死亡指导物(deadguidesforcrisprtranscriptionfactors);美国申请62/096,324,14年12月23日,crispr转录因子的死亡指导物(deadguidesforcrisprtranscriptionfactors);14年12月12日的美国申请62/091,456,用于crispr-cas系统的护送的和功能化的指导物(escortedandfunctionalizedguidesforcrispr-cassystems);14年12月12日的美国申请62/091,461,用于关于造血干细胞(hsc)的基因组编辑的crispr-cas系统和组合物的递送、使用以及治疗应用(delivery,useandtherapeuticapplicationsofthecrispr-cassystemsandcompositionsforgenomeeditingastohematopoeticstemcells(hscs));14年12月19日的美国申请62/094,903,通过基因组范围的插入捕获测序对双链断裂和基因组重排的无偏鉴定(unbiasedidentificationofdouble-strandbreaksandgenomicrearrangementbygenome-wiseinsertcapturesequencing);14年12月24日的美国申请62/096,761,用于序列操纵的工程化系统、方法以及优化的酶及指导物支架(engineeringofsystems,methodsandoptimizedenzymeandguidescaffoldsforsequencemanipulation);美国申请62/098,059,14年12月30日,rna靶向系统(rna-targetingsystem);14年12月24日的美国申请62/096,656,具有或关联于去稳定化结构域的crispr(crisprhavingorassociatedwithdestabilizationdomains);14年12月24日的美国申请62/096,697,具有或关联于aav的crispr(crisprhavingorassociatedwithaav);14年12月30日的美国申请62/098,158,工程化crispr复合物插入靶向系统(engineeredcrisprcomplexinsertionaltargetingsystems);15年4月22日的美国申请62/151,052,用于胞外核外报告的细胞靶向(cellulartargetingforextracellularexosomalreporting);14年9月24日的美国申请62/054,490,使用粒子递送组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途以及治疗应用(delivery,useandtherapeuticapplicationsofthecrispr-cassystemsandcompositionsfortargetingdisordersanddiseasesusingparticledeliverycomponents);14年9月25日的美国申请62/055,484,用于用优化的功能性crispr-cas系统进行序列操纵的系统、方法和组合物(systems,methodsandcompositionsforsequencemanipulationwithoptimizedfunctionalcrispr-cassystems);14年12月4日的美国申请62/087,537,用于用优化的功能性crispr-cas系统进行序列操纵的系统、方法和组合物(systems,methodsandcompositionsforsequencemanipulationwithoptimizedfunctionalcrispr-cassystems);14年9月24日的美国申请62/054,651,用于对体内多种癌症突变的竞争建模的crispr-cas系统和组合物的递送、用途以及治疗应用(delivery,useandtherapeuticapplicationsofthecrispr-cassystemsandcompositionsformodelingcompetitionofmultiplecancermutationsinvivo);14年10月23日的美国申请62/067,886,用于对体内多种癌症突变的竞争建模的crispr-cas系统和组合物的递送、用途以及治疗应用(delivery,useandtherapeuticapplicationsofthecrispr-cassystemsandcompositionsformodelingcompetitionofmultiplecancermutationsinvivo);14年9月24日的美国申请62/054,675,在神经元细胞/组织中crispr-cas系统和组合物的递送、用途以及治疗应用(delivery,useandtherapeuticapplicationsofthecrispr-cassystemsandcompositionsinneuronalcells/tissues);14年9月24日的美国申请62/054,528,在免疫疾病或障碍中的crispr-cas系统和组合物的递送、用途以及治疗应用(delivery,useandtherapeuticapplicationsofthecrispr-cassystemsandcompositionsinimmunediseasesordisorders);14年9月25日的美国申请62/055,454,用于使用细胞穿透肽(cpp)靶向障碍和疾病的crispr-cas系统和组合物的递送、用途以及治疗应用(delivery,useandtherapeuticapplicationsofthecrispr-cassystemsandcompositionsfortargetingdisordersanddiseasesusingcellpenetrationpeptides(cpp));14年9月25日的美国申请62/055,460,多功能crispr复合物和/或优化的酶连接的功能性crispr复合物(multifunctional-crisprcomplexesand/oroptimizedenzymelinkedfunctional-crisprcomplexes);14年12月4日的美国申请62/087,475,用优化的功能性crispr-cas系统进行功能性筛选(functionalscreeningwithoptimizedfunctionalcrispr-cassystems);14年9月25日的美国申请62/055,487,用优化的功能性crispr-cas系统进行功能性筛选(functionalscreeningwithoptimizedfunctionalcrispr-cassystems);14年12月4日的美国申请62/087,546,多功能crispr复合物和/或优化的酶连接的功能性crispr复合物(multifunctional-crisprcomplexesand/oroptimizedenzymelinkedfunctional-crisprcomplexes);以及14年12月30日的美国申请62/098,285,对于肿瘤生长和转移的crispr介导的体内建模以及遗传筛选(crisprmediatedinvivomodelingandgeneticscreeningoftumorgrowthandmetastasis)。这些专利、专利公开和申请的每一者,以及在其中或在它们的审查程序期间引用的所有文献(“申请引用文献”)以及在这些申请引用文献中引用或参考的所有文献,连同其中提到的或在其中任何文献中提到并通过引用结合在其中的针对任何产品的任何说明书、说明、产品规格、和产品表,特此通过引用并入本文,并且可以在本发明的实践中采用。所有文献(例如,这些专利、专利公开和申请以及申请引用文献)在如同每个单独文献被确切地且单独地指明为通过引用结合的相同程度上通过引用并入本文。就关于crispr-cas系统的一般信息而言,还提及的是以下各项(也通过引用而特此并入本文):multiplexgenomeengineeringusingcrispr/cassystems.cong,l.,ran,f.a.,cox,d.,lin,s.,barretto,r.,habib,n.,hsu,p.d.,wu,x.,jiang,w.,marraffini,l.a.,&zhang,f.sciencefeb15;339(6121):819-23(2013);rna-guidededitingofbacterialgenomesusingcrispr-cassystems.jiangw.,bikardd.,coxd.,zhangf,marraffinila.natbiotechnolmar;31(3):233-9(2013);one-stepgenerationofmicecarryingmutationsinmultiplegenesbycrispr/cas-mediatedgenomeengineering.wangh.,yangh.,shivalilacs.,dawlatymm.,chengaw.,zhangf.,jaenischr.cellmay9;153(4):910-8(2013);opticalcontrolofmammalianendogenoustranscriptionandepigeneticstates.konermanns,brighammd,trevinoae,hsupd,heidenreichm,congl,plattrj,scottda,churchgm,zhangf.nature.aug22;500(7463):472-6.doi:10.1038/nature12466.epub2013aug23(2013);doublenickingbyrna-guidedcrisprcas9forenhancedgenomeeditingspecificity.ran,fa.,hsu,pd.,lin,cy.,gootenberg,js.,konermann,s.,trevino,ae.,scott,da.,inoue,a.,matoba,s.,zhang,y.,&zhang,f.cellaug28.pii:s0092-8674(13)01015-5(2013-a);dnatargetingspecificityofrna-guidedcas9nucleases.hsu,p.,scott,d.,weinstein,j.,ran,fa.,konermann,s.,agarwala,v.,li,y.,fine,e.,wu,x.,shalem,o.,cradick,tj.,marraffini,la.,bao,g.,&zhang,f.natbiotechnoldoi:10.1038/nbt.2647(2013);genomeengineeringusingthecrispr-cas9system.ran,fa.,hsu,pd.,wright,j.,agarwala,v.,scott,da.,zhang,f.natureprotocolsnov;8(11):2281-308(2013-b);genome-scalecrispr-cas9knockoutscreeninginhumancells.shalem,o.,sanjana,ne.,hartenian,e.,shi,x.,scott,da.,mikkelson,t.,heckl,d.,ebert,bl.,root,de.,doench,jg.,zhang,f.sciencedec12.(2013).[epubaheadofprint];crystalstructureofcas9incomplexwithguidernaandtargetdna.nishimasu,h.,ran,fa.,hsu,pd.,konermann,s.,shehata,si.,dohmae,n.,ishitani,r.,zhang,f.,nureki,o.cellfeb27,156(5):935-49(2014);genome-widebindingofthecrisprendonucleasecas9inmammaliancells.wux.,scottda.,krizaj.,chiuac.,hsupd.,dadondb.,chengaw.,trevinoae.,konermanns.,chens.,jaenischr.,zhangf.,sharppa.natbiotechnol.apr20.doi:10.1038/nbt.2889(2014);crispr-cas9knockinmiceforgenomeeditingandcancermodeling.plattrj,chens,zhouy,yimmj,swiechl,kemptonhr,dahlmanje,parnaso,eisenhauretm,jovanovicm,grahamdb,jhunjhunwalas,heidenreichm,xavierrj,langerr,andersondg,hacohenn,regeva,fengg,sharppa,zhangf.cell159(2):440-455doi:10.1016/j.cell.2014.09.014(2014);developmentandapplicationsofcrispr-cas9forgenomeengineering,hsupd,landeres,zhangf.,cell.jun5;157(6):1262-78(2014).geneticscreensinhumancellsusingthecrispr/cas9system,wangt,weijj,sabatinidm,landeres.,science.january3;343(6166):80-84.doi:10.1126/science.1246981(2014);rationaldesignofhighlyactivesgrnasforcrispr-cas9-mediatedgeneinactivation,doenchjg,harteniane,grahamdb,tothovaz,hegdem,smithi,sullenderm,ebertbl,xavierrj,rootde.,(publishedonline3september2014)natbiotechnol.dec;32(12):1262-7(2014);invivointerrogationofgenefunctioninthemammalianbrainusingcrispr-cas9,swiechl,heidenreichm,banerjeea,habibn,liy,trombettaj,surm,zhangf.,(publishedonline19october2014)natbiotechnol.jan;33(1):102-6(2015);genome-scaletranscriptionalactivationbyanengineeredcrispr-cas9complex,konermanns,brighammd,trevinoae,joungj,abudayyehoo,barcenac,hsupd,habibn,gootenbergjs,nishimasuh,nurekio,zhangf.,nature.jan29;517(7536):583-8(2015).asplit-cas9architectureforinduciblegenomeeditingandtranscriptionmodulation,zetscheb,volzse,zhangf.,(publishedonline02february2015)natbiotechnol.feb;33(2):139-42(2015);genome-widecrisprscreeninamousemodeloftumorgrowthandmetastasis,chens,sanjanane,zhengk,shalemo,leek,shix,scottda,songj,panjq,weisslederr,leeh,zhangf,sharppa.cell160,1246-1260,march12,2015(multiplexscreeninmouse),andinvivogenomeeditingusingstaphylococcusaureuscas9,ranfa,congl,yanwx,scottda,gootenbergjs,krizaj,zetscheb,shalemo,wux,makarovaks,kooninev,sharppa,zhangf.,(publishedonline01april2015),nature.apr9;520(7546):186-91(2015).shalemetal.,“high-throughputfunctionalgenomicsusingcrispr-cas9,”naturereviewsgenetics16,299-311(may2015).xuetal.,“sequencedeterminantsofimprovedcrisprsgrnadesign,”genomeresearch25,1147-1157(august2015).parnasetal.,“agenome-widecrisprscreeninprimaryimmunecellstodissectregulatorynetworks,”cell162,675-686(july30,2015).ramananetal.,crispr/cas9cleavageofviraldnaefficientlysuppresseshepatitisbvirus,”scientificreports5:10833.doi:10.1038/srep10833(june2,2015)nishimasuetal.,crystalstructureofstaphylococcusaureuscas9,”cell162,1113-1126(aug.27,2015)zetscheetal.,"cpf1isasinglerna-guidedendonucleaseofaclass2crispr-cassystem,"cell163,1-13(oct.22,2015)shmakovetal.,"discoveryandfunctionalcharacterizationofdiverseclass2crispr-cassystems,"molecularcell60,1-13(availableonlineoct.22,2015)将它们各自通过引用并入本文,可以在本发明的实践中考虑,并且下文简要讨论:cong等人基于嗜热链球菌cas9以及还有化脓链球菌cas9两者改造了ii型crispr-cas系统以用于在真核细胞中使用,并且证实了cas9分子可以通过短rna指导以诱导在人类和小鼠细胞中dna的精确切割。他们的研究进一步显示cas9在转化成一种切口酶时可以用来以最低诱变活性促进在真核细胞中的同源定向修复。另外,他们的研究证实多个指导序列可以被编码进单一crispr阵列中以使得能够在哺乳动物基因组内的内源性基因组座位位点处同时编辑若干,证实了rna指导的核酸酶技术的容易可编程性和广泛可应用性。这种使用rna以编程细胞内序列特异性dna切割的能力定义了新一类的基因组编辑工具。这些研究进一步显示,其他crispr座位可能是可移植入哺乳动物细胞中的,并且还可以介导哺乳动物基因组切割。重要地,可以设想的是crispr-cas系统的若干方面可以进一步改进以增加其效率和多功能性。jiang等人使用规律间隔成簇短回文重复(crispr)-关联的cas9内切核酸酶,与双-rna复合,以在肺炎链球菌和大肠杆菌的基因组中引入精确的突变。该途径依赖于在靶基因组位点处的双-rna:cas9-引导的切割,以杀死未突变的细胞,并且回避对选择性标记或反选择系统的需要。该研究报道通过改变短crisprrna(crrna)的序列以使单一-和多个多核苷酸变化被携带在编辑模板上而重编程双-rna:cas9特异性。该研究显示,同时使用两种crrna使得多元诱变成为可能。另外,当该途径与重组工程组合使用时,在肺炎链球菌中使用描述的途径回收的接近100%的细胞包含希望的突变,并且在大肠杆菌中回收的65%包含突变。wang等人(2013)使用crispr/cas系统用于一步生成携带多基因中突变的小鼠,所述小鼠传统上是以多步通过在胚胎干细胞中的连续重组和/或小鼠的与单一突变的耗时性杂交生成的。crispr/cas系统将大大加速功能上丰富的基因和上位基因相互作用的体内研究。konermann等人(2013)解决了在本领域中对通用和稳固技术的需要,其使得能够基于crisprcas9酶以及还有转录激活因子样效应子对dna-结合结构域进行光调节和化学调节ran等人(2013-a)描述了将cas9切口酶突变体与配对的指导rna相组合以引入靶向的双链断裂的途径。这解决了以下问题:来自微生物crispr-cas系统的cas9核酸酶通过指导序列而靶向特异性基因组座位,其可以耐受与该dna靶标的某些错配并由此促进不希望的脱靶诱变。因为基因组中的单独切口以高保真性被修复,所以同时经由适当补偿指导rna而形成切口对于双链断裂是必需的,并且所述切口形成延伸了特异性识别的碱基的数目以用于靶标切割。作者证实了使用配对的切口形成可以降低在细胞系中的脱靶活性50至1,500倍,并且从而促进在小鼠受精卵中的基因敲除而不牺牲中靶切割效率。这个通用策略使得多种多样的要求高特异性的基因组编辑应用成为可能。hsu等人(2013)表征了在人细胞中spcas9靶向特异性以告知靶位点的选择并避免脱靶效应。该研究评价了在293t和293ft细胞中的>100个预测的基因组脱靶座位处>700个指导rna变体和spcas9-诱导的indel突变水平。这些作者示出spcas9以序列依赖性方式耐受指导rna与靶dna之间在不同位置处的错配,对错配的数目、位置和分布敏感。这些作者进一步示出spcas9-介导的切割不受dna甲基化的影响,并且spcas9和sgrna的剂量可被滴定为使得脱靶修饰最小化。另外,为了促进哺乳动物基因组工程应用,这些作者报道提供基于网络的软件工具以指导靶序列的选择和验证连同脱靶分析。兰(ran)等人(2013-b)描述了用于在哺乳动物细胞中cas9-介导的经由非同源末端连接(nhej)或同源定向修复(hdr)基因组编辑、连同产生修饰的细胞系(以用于下游功能研究)的一组工具。为了最小化脱靶切割,这些作者进一步描述了一种双-切口策略,使用的是cas9切口酶突变体与配对的指导rna。由这些作者提供的方案经实验得出用于选择靶位点、评价切割效率和分析脱靶活性的指南。这些研究显示,以靶设计开始,基因修饰可以在少至1-2周内实现,并且修饰的克隆细胞系可以在2-3周内得以衍生。shalem等人描述了新的在基因组广度范围上探询基因功能的方式。他们的研究显示,递送基因组范围的crispr-cas9敲除(gecko)文库利用64,751个独特的指导序列靶向18,080个基因,这些指导序列使得在人细胞中阴性和阳性选择筛选两者成为可能。首先,这些作者显示,使用该gecko文库来鉴定癌症和多能干细胞中对于细胞活力至关重要的基因。接着,在黑色素瘤模型中,这些作者针对基因进行筛选,这些基因的损失涉及对维罗非尼(一种抑制突变体蛋白激酶braf的治疗剂)的抗性。他们的研究显示,最高级候选物包括先前验证的基因nf1和med12连同新颖的命中物nf2、cul3、tada2b、和tada1。这些作者观察到在靶向相同基因的独立指导rna之间的高水平的一致性以及高比率的命中确认,并且因此证实了采用cas9进行基因组范围筛选的前景。nishimasu等人以2.5a°分辨率报道了与sgrna复合的化脓链球菌cas9以及其靶dna的晶体结构。该结构揭示了一种由靶识别和核酸酶叶片组成的两叶片构造,其将sgrna:dna异源双链体容纳在它们的界面处的带正电的凹槽中。然而识别叶片对于结合sgrna和dna是至关重要的,核酸酶叶片包含hnh和ruvc核酸酶结构域,这些结构域适合地被定位为分别用于靶dna的互补和非互补链的切割。核酸酶叶片还包含负责与原型间隔子邻近基序(pam)相互作用的羧基-末端结构域。这种高分辨率结构和伴随的功能分析已经揭示了rna-指导的由cas9进行的dna靶向的分子机制,由此为合理设计新的通用基因组编辑技术做好准备。wu等人标定了在小鼠胚胎干细胞(mesc)中,来自化脓链球菌的无催化活性cas9(dcas9)(加载有单一指导rna(sgrna))的基因组广度的结合位点。这些作者显示,测试的四种sgrna中的每一种将dcas9靶向至数十和数千个之间的基因组位点,这些基因组位点频繁地通过sgrna中的5-核苷酸种子区和ngg原型间隔子邻近基序(pam)表征。染色质不可接近性降低了dcas9与具有匹配种子序列的其他位点的结合;因此70%的脱靶位点是与基因相关联的。这些作者显示,在用催化活性的cas9转染的mesc中295dcas9结合位点的靶向测序鉴定出超过背景水平的仅一个突变位点。这些作者提出了一种针对cas9结合和切割的两态模型,其中种子匹配触发了结合但是需要与靶dna的广泛配对用于切割。platt等人建立了cre依赖性cas9敲入式小鼠。这些作者证明了在神经元、免疫细胞、和内皮细胞中,使用腺相关病毒(aav)-、慢病毒-、或粒子介导的递送指导rna进行体内以及离体基因组编辑。hsu等人(2014)是综述文章,其总体讨论了crispr-cas9从酸奶到基因组编辑的历史,包括细胞的遗传筛选。wang等人(2014)涉及聚池的功能缺失遗传筛选方法,该方法适合用于使用基因组规模的慢病毒单一指导rna(sgrna)文库进行的正选择和负选择两者。doench等人创建了sgrna池,覆盖六个内源性小鼠基因和三个内源性人类基因的一组的全部可能靶位点,并且通过抗体染色和流式细胞术定量地测定了这些sgrna产生其靶基因的无效等位基因的能力。这些作者显示pam的优化改进了活性并且还提供了用于设计sgrna的在线工具。swiech等人证明了aav介导的spcas9基因组编辑可以使能进行脑中的基因功能的反向遗传学研究。konermann等人(2015)讨论了在有和没有接头的情况下,在指导物(例如茎或四核苷酸环)上的适当位置处,附接多种效应物结构域的能力,这些效应物结构域例如转录激活因子、功能和表观基因组调节物。zetsche等人证明了cas9酶可以分离为两个并且因此针对活化而言cas9的组装可以被控制。chen等人涉及通过证明以下进行多元筛选:在小鼠中基因组范围的体内crispr-cas9筛选揭示了调节肺转移的基因。ran等人(2015)涉及sacas9以及其编辑基因组的能力,并且证明不能从生物化学测定外推。shalem等人(2015)描述了催化无活性的cas9(dcas9)融合用于综合地阻遏(crispri)或活化(crispra)表达的方式,示出使用cas9用于基因组规模的筛选(包括测定且聚池的筛选)的进展、使基因组座位失活的敲除途径、以及调节转录活性的策略。末端编辑shalem等人(2015)描述了催化无活性的cas9(dcas9)融合用于综合地阻遏(crispri)或活化(crispra)表达的方式,示出使用cas9用于基因组规模的筛选(包括测定且聚池的筛选)的进展、使基因组座位失活的敲除途径、以及调节转录活性的策略。xu等人(2015)评估了在基于crispr的筛选中促成单一指导rna(sgrna)效率的dna序列特征。这些作者探索了crispr/cas9敲除的效率以及在切割位点处的核苷酸优选性。这些作者还发现对于crispri/a的序列优选性基本上不同于对于crispr/cas9敲除的序列优选性。parnas等人(2015)将基因组范围的聚池的crispr-cas9文库引入树突细胞(dc)中,以鉴定控制由细菌脂多糖(lps)对肿瘤坏死因子(tnf)的诱导的基因。对tlr4信号传导的已知调节物和先前未知的候选物进行鉴定,并根据对于对lps的典型响应的不同效果分成三个功能模块。ramanan等人(2015)证明了在受感染细胞中对病毒附加体dna(cccdna)的切割。hbv基因组作为3.2kb双链附加体dna种类存在于受感染的肝细胞的细胞核中,该种类称为共价闭合环状dna(cccdna),其是hbv生命周期中的关键组分,其复制不受目前疗法的抑制。这些作者显示特异性靶向hbv的高度保守区的sgrna稳固地抑制病毒复制并耗减cccdna。nishimasu等人(2015)报道了sacas9的晶体结构,该sacas9与单一指导rna(sgrna)以及其包含5'-ttgaat-3'pam和5'-ttgggt-3'pam的双链dna靶标复合。sacas9与spcas9的结构比较突出显示出结构保存和差别,解释了它们不同的pam特异性和直向同源性sgrna识别。zetsche等人(2015)报道了cpf1,一种假定的2类crispr效应蛋白的表征。已证实cpf1介导具有不同于cas9特征的稳健的dna干扰。鉴定这种干扰机制扩大了我们对crispr-cas系统的理解并推进了它们的基因组编辑应用。shmakov等人(2015)报道了三种不同的2类crispr-cas系统的表征。两种鉴定的系统c2c1和c2c3的效应蛋白含有与cpf1远缘相关的ruvc样内切核酸酶结构域。第三个系统c2c2包含具有两个预测的hepn核糖核酸酶结构域的效应蛋白。而且,“二聚crisprrna指导的foki核酸酶用于高度特异性基因组编辑(dimericcrisprrna-guidedfokinucleasesforhighlyspecificgenomeediting)”,胜达(shengdar)q.蔡(tsai)、尼古拉斯威肯(nicolaswyvekens)、西迪卡特(cydkhayter)、詹尼弗(jennifer)a.福登(foden)、维沙尔撒帕尔(vishalthapar)、迪帕克雷安(deepakreyon)、马修(mathew)j.古德温(goodwin)、马丁(martin)j.阿里耶(aryee)、j.基思俊(keithjoung)自然生物技术(naturebiotechnology)32(6):569-77(2014)涉及二聚rna指导的foki核酸酶,其识别延伸序列并且可以高效率地编辑人细胞中的内源性基因。此外,提及的是标题为“用于使用粒子递送组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用(delivery,useandtherapeuticapplicationsofthecrispr-cassystemsandcompositionsfortargetingdisordersanddiseasesusingparticledeliverycomponents)”的pct申请pct/us14/70057,案卷参考47627.99.2060和bi-2013/107(要求来自以下一个或多个或所有美国临时专利申请的权益:提交于2014年9月24日的62/054,490;提交于2014年6月10日的62/010,441;以及各自提交于2013年12月12日的61/915,118、61/915,215和61/915,148)(“粒子递送pct”),将其通过引用并入本文,关于一种制备含有sgrna-和-cas9蛋白的粒子的方法,该方法包括将包含sgrna和cas9蛋白(和任选地hdr模板)的混合物与以下混合物混合,该混合物包含表面活性剂、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其组成或由其组成;以及来自这样的工艺的粒子。例如,其中使cas9蛋白和sgrna在适合的温度(例如,15℃-30℃,例如,20℃-25℃,例如,室温)下以适合的摩尔比(例如,3:1至1:3或2:1至1:2或1:1)有利地在无菌、无核酸酶缓冲液(例如,1xpbs)中一起混合适合的时间(例如,15-45,如30分钟)。分开地,粒子组分如或包含:表面活性剂(例如,阳离子脂质(例如,1,2-二油酰基-3-三甲基铵-丙烷(dotap)));磷脂(例如,二肉豆蔻磷脂酰胆碱(dmpc));可生物降解的聚合物(例如,乙二醇聚合物或peg)、以及脂蛋白,如低密度脂蛋白,例如,胆固醇溶解于醇中,有利的是c1-6烷基醇,如甲醇、乙醇、异丙醇,例如,100%乙醇。将这两种溶液混合在一起以形成含有cas9-sgrna复合物的粒子。因此,在粒子中配制整个复合物之前,可以使sgrna与该cas9蛋白预复合。可以用不同摩尔比的不同组分来制备配制品,已知这些不同组分促进核酸递送进细胞中(例如,1,2-二油酰基-3-三甲基铵-丙烷(dotap)、1,2-双十四酰-sn-甘油基-3-磷酸胆碱(dmpc)、聚乙二醇(peg)、以及胆固醇)例如dotap:dmpc:peg:胆固醇摩尔比可以是dotap100、dmpc0、peg0、胆固醇0;或dotap90、dmpc0、peg10、胆固醇0;或dotap90、dmpc0、peg5、胆固醇5。dotap100、dmpc0、peg0、胆固醇0。因此,该申请包括将sgrna、cas9蛋白和形成粒子的组分混合;连同来自此类混合的粒子。本发明的方面可以涉及粒子;例如,使用类似于粒子递送pct的工艺的粒子,例如通过将如在本发明中的sgrna和/或cas9蛋白的混合物和形成粒子的组分混合,例如如在粒子递送pct中,以形成粒子;以及来自这样的混合的粒子(或者,当然,涉及如在本发明中的sgrna和/或cas9的其他粒子)。本发明将在以下实例中进一步说明,这些实例仅出于说明目的给出并且不旨在以任何方式限制本发明。实例实例1:rna可编程基因组工程化效应蛋白的扩展搜索cas9是一种已经转化生物学的、发现于原核生物中的crispr相关的rna可编程内切核酸酶。最近还发现了rna可编程单效应物的另外的独特候选物,并且其在一种情况下基于crispr相关cas1和cas2蛋白的邻近性而进行验证(例如cpf1)。本申请中描述的工作扩展了这种搜索,其目的是在完整的和最新的基因组数据集中穷尽rna可编程crispr单效应物的可能性空间。背景:在原核生物的crispr附近发现的crispr/cas9内切核酸酶系统(规律间隔成簇短回文重复)已经从根本上改变了生物学。由crispr阵列和crispr相关蛋白构成的crispr系统赋予细菌和古细菌针对侵入噬菌体的适应性免疫(makarova等人,2011;2015)。通过重建crispr系统,在几年的时间内,就可能在系统水平上精确修改生物的基因组(ran等人,2015)。crispr阵列包含从噬菌体dna获得的间隔子序列,其由重复序列分开用于阵列处理。crispr相关cas9蛋白通过从crispr阵列和该阵列附近的tracrrna募集crrna操作来切割dna并在特定的可编程序列处诱导双链断裂,所述序列由n-碱基对靶序列和短邻近m-碱基对原型间隔子邻近基序(pam)编码,其中n、m和pam的序列在物种之间是不同(chylinski等人,2013;fonfara等人,2014)。与多效应物crispr系统不同,ii型crispr系统依赖于单效应物cas9(chylinski等人,2014)。因此,使用最小的双组分系统可以实现精确的基因组工程化:cas9蛋白和修饰的sgrna(tracrrna和crrna的单分子组合)。最近,通过生物信息学搜索cas1和cas2(两个crispr间隔子获取涉及的小蛋白)附近的大型单效应物,发现了几种具有不同于cas9的效应物的新型单效应物crispr系统(shmakov等人,2015年提交)。另外,已经发现cpf1(一种先前鉴定的但功能尚未阐明的蛋白质)与cas9类似地操作,但没有使用tracrrna(zetsche等人,2015年提交)。据推测,可能发现更多的单效应物系统,其具有从共同的进化起源遗传的dna靶向、rna靶向或者也许甚至dna整合或转座能力(koonin&krupovic,2015)。在本发明之前,没有用于鉴定新颖的单效应物系统的crispr相关蛋白不可知的方法。如下面详细描述的,本发明提供了用于发现除cas1和cas2之外的新颖的2类crispr系统的生物信息学流程。除揭示新生物学外,本发明提供了通过以下步骤鉴定rna指导的单效应物以翻译成有用的基因组工程化工具的方式:1)对新的单效应物系统进行计算分类;并且2)通过实验追踪扩展基因组工程化能力。计算程序:设计并实施了一种生物计算流程并且通过宏基因组学数据集开发新颖的2类crispr单效应物,其类似于革命性的基因组工程化工具cas9和cpf1。尽管先前的搜索策略依赖于crispr相关间隔子获取蛋白cas1和cas2的蛋白质邻近性,但是该方法仅被种在crispr阵列上。结果是发现了一种潜在的新的2类crispr系统,其中两种亚型以不同的假定的辅助蛋白为特征。计算程序的实施已经产生了一些新的潜在的单效应物系统。图1描述了基本的工作流程。首先,下载了所有原核生物基因组(欧洲ensembl和美国ncbi数据库包含最大的可公开访问的库)。第二,在所有基因组上都运行piler-crcrispr阵列发现算法,采用默认设置,以将所有可能的crispr阵列存储在数据中(edgar,2007)。第三,将发现的阵列的10千碱基对范围的邻近蛋白存储在数据中。第四,在单效应物过滤器中,过滤出不具有超过700个氨基酸的邻近蛋白或不具有一个以上超过700个氨基酸的邻近蛋白的所有系统。此外,只选择具有900-1800个氨基酸的大型单效应物的系统(通过功能性和成形性考虑可知)。第五,对这些蛋白进行针对整个ncbi蛋白数据库的ncbiblast同源性搜索以鉴定同源蛋白,并且对所有发现的同源蛋白进行hhpred蛋白结构域同源性搜索(soding等人,2005)。从所有数据和文献中,可以看到基因组基因座。候选名单仅限于如下的家族,其中假定的效应物在至少有50%的成员中靠近crispr阵列以关注潜在的功能性crispr基因座。图2示出了来自ensembl基因组发布27(ensemblgenomesrelease27)的输入的总体初步数据,根据类别将发现的阵列和大型蛋白的数量绘图(所有阵列与大型单效应物阵列;具有不同的邻近cas1和cas2组合的阵列)。所提议的研究的相关值是没有邻近cas1或cas2的大型单效应物阵列中大型蛋白的数目,即1,531。在缺乏cas1和cas2的系统中,针对整个ncbi蛋白质数据库以1e-7的e值截断值对这些大型单效应物进行ncbiblast同源性搜索,以鉴定同源蛋白(camacho等人,2009)。对以这种方式发现的所有蛋白进行hhpred蛋白结构域同源性搜索(soding等人,2005)。从获得的和注释的数据中,可以看到基因组基因座,如图3中病原体大芬戈尔德菌(finegoldiamagna)的cas9的情况。为了选择实验候选物,考虑具有低hhpred同源性匹配的蛋白质、最小限度的现有crispr分类、基因组基因座中crispr阵列的蛋白质的短距离、相对于邻近蛋白质的蛋白质的相同取向、在基因组中crispr阵列的一致性质、以及几个注释的邻近crispr蛋白的存在是相关的。基于由ncbiblast同源性确定的家族内的蛋白质候选物的数量,可以评估所述家族是否进化保守,并且从而判断它是否可能具有生物学功能性。申请人在一个家族内的蛋白质中寻找保守结构域,即使之前是未注释过的。实验程序:发现新的2类基因座-组29当进行ncbiblast同源性检索时,将1,531个候选物增加到大约7,200种蛋白质。这些蛋白质及其各自的基因座根据1e-7的最邻近e值截断值被分组到266个目录中。这些组中许多是假阳性,例如转座子和甲基化酶,其中该组中大部分与任何crispr阵列不相关。其中几个组实际上是1类crispr基因座,这些基因座已经通过了大型单效应物过滤器。相当一部分组是真正的2类crispr基因座-包括cas9、cpf1和c2c2-其中组中一些没有邻近的cas1或cas2。特别是分类到目录29中的一组,具有多种新颖的蛋白质,所述蛋白质都缺乏cas1或cas2。在本说明书中称为“组29(group29)”或“grp29”,现在将以生物计算细节描述体现两个基因座的该系统。组29系统由一个大型单效应物(长度为约1100个氨基酸)和邻近crispr阵列的两个小的假定辅助蛋白(长度为约200个氨基酸)中的一个或零个组成。基于该邻近的小蛋白质,该系统被分成两个基因座a和b,如图78和图79所描绘。阵列上游或下游的25千碱基对之外的额外的蛋白质在每个基因座中不是物种间保守的。除少数例外,crispr阵列由长度为36个核苷酸的同向重复序列和长度为30个核苷酸的间隔子序列组成。同向重复通常是高度保守的,特别是在末端,其中在5'末端的gttg/guug与在3'末端的caac反向互补。这种保守性表明rna环结构的强碱基配对可能与基因座中的蛋白质相互作用。与同向重复序列互补的基序搜索揭示了在阵列附近没有候选tracrrna,可能指示如在cpf1基因座中发现的单个crrna。使用crispr靶标的grp29间隔子序列的噬菌体基因组检索揭示了没有超过90%的序列匹配(biswas等人,2013)。结果并不令人惊讶,鉴于噬菌体基因组的测序数量很少,除了相对较高的突变率,噬菌体持续回避了细菌获得性免疫。从匹配的不可靠性来看,靶标侧翼的pam序列无法预测。每种蛋白质都具有有趣的结构。大型蛋白含有许多保守残基形成的假定结构域,其散布在混合的α螺旋/β折叠结构中。两个hepn结构域(每个氨基酸基序rxxxxh)分别位于蛋白质的n和c末端附近。鉴于预测的hepn结构域的核糖核酸酶活性,其中两种也存在于c2c2蛋白质的内部,预测grp29可能是rna靶向效应物,尽管需要在本论文范围之外进行严格的实验性后续实验以验证这一假设(anantharaman等人,2013;shmakov等人,2015)。小蛋白质分为两个不同的类别。在基因座a中,预测小蛋白质全长含有四个假定的跨膜结构域,而在基因座b中,预测在n-末端附近含有单个假定的跨膜结构域,在c-末端附近含有hepn结构域(氨基酸基序rxxxxh)。tmhmm是一种实现隐马尔可夫模型(markovmodel)的膜蛋白拓扑预测模型,高度可能地识别了每个跨膜结构域(krogh等人,2001)。跨膜结构域通常含有疏水性残基,并且因此可能定位于细胞膜。(值得注意的是,蛋白质n末端的信号肽常常被误认为跨膜结构域,这可能与基因座b的小蛋白质的情况相同)。表征组29基因座通过一系列穷尽性的ncbiblast同源性检索发现了来自组29的总量111个大型蛋白。该111个的多重序列比对显示只有94个是完整注释的蛋白质,其余的通常落在测序片段的末端。图80示出了该第94个的尺寸分布。大部分大型蛋白的大小在1100个-1150个氨基酸范围内,这表明由于遗传时间跨度较短或选择性压力较大而维持了相似形式才导致的差别较小。在这94个大型蛋白中,只有77个被发现是ncbi上的非冗余蛋白质条目。使用blosum62算法对大型蛋白进行了比对并产生了系统发生树,在图81中与物种和基因座信息一起进行了描绘。代表的物种被发现于拟杆菌门中,这是革兰氏阴性棒状细菌的广泛的一门。值得注意的是,肠道微生物牙龈卟啉单胞菌(porphyromonasgingivalis)和咽喉卟啉单胞菌(porphyromonasgulae)具有这两个基因座。除了前面章节中概述的规则外,还有一些例外:i)与基因座b相比,基因座a有更多的没有小蛋白质的物种,ii)pilercr所识别的crispr阵列不存在于所有基因座,并且iii)最近发现的化学异养型夏亚菌三角棕指藻(phaeodactylibacterxiamenensis)具有异常位点方向和同向重复序列:5’-gtcctagtcactcctcaaaccgggagcctatcggac-3’。大多数细菌菌株没有完全注释的基因组,并且因此不能判断其基因组中是否存在其他crispr系统。(这在图81的最后三列中用一个问号来表示)。少数具有组29基因座的物种菌株,中间普雷沃菌(prevotellaintermedia)和牙龈卟啉单胞菌(porphyromonasgingivalis)在其全基因组中不具有cas1或cas2。鉴于crispr系统被怀疑通过水平基因转移而不是进化来传播,并且crispr系统没有明确要求附近的或者甚至在整个基因组中的(crispr系统可以在没有适应的情况下继续运作)适应性cas1/cas2(它可以反式募集它们,可能是所有组29基因座的情况),但结果并不强烈支持组29系统中的自适应。将计算工作转化为实验工作流程以产生新的效应物图82描绘了从组29基因座发现到潜在基因组工程化应用的极简实验工作流程。工作流程始于基因座表征。从生物计算工作来看,含有感兴趣的基因座的细菌菌株是已知的。因此,人们可以订购该菌株及其基因组dna,并在天然菌株或异源移植到已建立的模式生物如大肠杆菌中的基因座上进行rna测序。异源表达需要将基因座(蛋白质和crispr阵列)整合到质粒中,该质粒在药物选择下转化到了模式生物中。在基因座的天然调控元件不足以表达蛋白质和/或crispr阵列的情况下,必须插入一个或多个合成基因启动子以驱动表达。从rna测序数据,人们可以收集蛋白质是否充分处理crispr阵列到crrna中以用于rna可编程核酸靶向的信息。rna测序可以多种方法进行,所有这些方法都将细菌收获的rna转化进dna文库中,以待在下一代测序机器上进行测序(adiconis等人,2013;mardis,2013)。如果蛋白质确实处理其crispr阵列,则rna测序将指示成熟crrna在长度和方向上的性质。该信息可用于设计由蛋白质和成熟crrna组成的双组分系统以进行体外干扰实验。在这些实验中,将由细菌纯化的蛋白质和通过体外转录合成的crrna与靶核酸(dna或rna)一起孵育。孵育的产物在琼脂糖凝胶上进行,并且从对照条件(通常没有蛋白质和/或crrna)衍生指示了靶标的切割。预期了grp29的hepn结构域可能干扰rna,因此必须测试dna和rna靶标。如果示出了干扰,则下一阶段是确定体内的靶向规则。pam筛选旨在揭示与间隔子序列反向互补的靶序列侧翼的任何切割介导的序列基序,并且可适于发现rna靶向基序(zetsche等人,2015)。还可以进行高效筛选,特别是如果靶向规则比pam更复杂(doench等人,2014)。特别是对于rna靶向,应该进行rna噬菌体干扰实验以表明负责的是单独的rna干扰而不是转录依赖性的rna干扰(tamulaitis等人,2014)。对于潜在的内切核酸酶,申请人订购了具有感兴趣的蛋白质的细菌种类并将它们的基因组基因座克隆到质粒中以转化到感受态大肠杆菌中。然后申请人在细菌和转化的大肠杆菌上进行了rna测序以确定crispr阵列附近的转录的rna。在初步表征之后,申请人通过克隆间隔子序列侧翼的随机合成的核苷酸文库并与含有基因组基因座的质粒共转化来筛选pam。通过下一代测序并观察某些随机化核苷酸的消耗,申请人预测了pam序列。在细菌菌落中进行pam验证后,申请人合成了预测的crrna(如果可能的话,以及tracrrna和sgrna),纯化了来自细胞切割物的感兴趣的蛋白质,并且进行了体外切割测定,观察了通过surveyor方法的切割。申请人在哺乳动物细胞中进行实验以评估真核基因组工程化的潜力。申请人将组29蛋白鉴定为可能参与针对rna噬菌体的细菌获得性免疫的一组rna可编程的rna干扰核酸酶。这基于已知的rna催化hepn结构域在其n和c末端附近的预测存在以及指示将相邻crispr阵列处理为假定的crrna的rna-seq数据。鉴定出的组30蛋白是与组29几乎没有局部比对的偶联蛋白质,但其与组29中的辅助小蛋白质的一种聚集。从组29和组30蛋白中,申请人鉴定出以革兰氏阳性细菌为代表的两种新的基因多样性假定的2类crispr-cas系统(105个总基因组座位;81个具有非冗余单效应物的基因座)。所有这些基因座编码一个大型(约1100aa)候选效应蛋白,并且在约80%的该基因座中编码一个额外的小(约200aa)蛋白质(图46b,图68)。假定的效应蛋白在它们的n端和c端包含两个预测的hepn结构域(anantharaman等人,2013),其类似于2类vi-a型系统(cas13a)中的大效应物的结构域结构。然而,除了hepn结构域的催化特征外,新预测的效应物和cas13a之间没有显著的序列相似性。因此,我们将这些系统分类为vi-b亚型,并将其假定的效应蛋白表示为cas13b。一种或另一种假定的辅助蛋白的存在与cas13b的系统树中的两个不同分支相关,这表明存在两种变体系统,我们称其为vi-b1(辅助蛋白csx27)和vi-b2(辅助蛋白csx28)。我们鉴定出的vi-b2型系统几乎总是含有csx28,而csx27在vi-b1基因座中的存在较少。csx27和csx28蛋白序列显示与任何先前鉴定的crispr相关蛋白没有显著的相似性。预测了csx27和csx28含有一个或多个跨膜区段(图71a)。然而,在n末端或c末端上动物溃疡伯格菌的rfp-标记的csx27和csx28颊普雷沃菌没有明显定位到膜上(图71b),这表明两者都是可溶性蛋白,尽管存在疏水性α-解旋酶结构域。另外,csx28蛋白质的多重比对分析表明存在高度分散的hepn结构域(图46c)。与它们的趋异假定辅助蛋白不同,两种vi-b型系统在crispr阵列中都示出不同的、保守的特征。crispr阵列中的同向重复在大小、序列和结构上是保守的(图69和图70a),长度为36nt,开环区域为poly-u区,并且在重复的末端有互补序列为5'-guug和caac-3',其预测产生由分子内碱基配对介导的确定的二级结构。尽管原型间隔子的crispr靶探针未显示共有侧翼区序列(图70b)(biswas等人,2013),但30nt的良好保守原型间隔子长度与良好保守的同向重复序列和长度相结合表明了不同vi-b基因座之间的类似核酸靶向规则的可能性。在天然动物溃疡伯格菌(vi-b1型)中crispr阵列的rna测序显示将前crrna用完整的30nt5'间隔子,随后用完整的36nt3'同向重复处理成66nt成熟crrna(图47a)。还处理了更长的118ntcrrna,其位于crispr阵列中标称crrna的远端并由具有插入重复序列的5'和3'截短的同向重复序列组成,这是一个预测在其他vi-b基因座中发生的现象,这说明其有一些功能作用。为了验证vi-b系统的干扰活性并确定来自动物溃疡伯格菌(b.zoohelcum)的vi-b1基因座的靶向规则,申请人开发了大肠杆菌必需基因筛选(图64a)。对于该阴性选择筛选,申请人在45个操纵子独有的必需基因的编码区域上产生了具有单核苷酸解析率的54,600个独特间隔子的文库(gerdes等人,2003;baba等人,2006),加上进入5'和3'utr的60nt,以及1100个随机产生的非靶向间隔子。申请人然后用携带bzcas13b(来自动物溃疡伯格菌(b.zoohelcum)的cas13b基因)和bzcsx27、单独bzcas13b或对照空载体的质粒转化该文库。在对所有筛选间隔子进行质量控制过滤后,申请人发现靶向间隔子相对非靶向间隔子的统计学显著的耗竭,这表明cas13b单独或与csx27可实现核酸干扰(图64b)。为了评估cas13b靶向规则,申请人建立了两个耗竭水平:强耗竭(前1%耗竭间隔子)和安全耗竭(间隔子耗竭高于过滤的非靶向间隔子的平均耗竭5σ)。从通过强消耗截断值的间隔子中,申请人产生了定性识别双侧原型间隔子侧翼序列(pfs)的weblogo(图64c)(crooks等人,2004)。鉴于序列网络标识中的每个碱基都是独立的,申请人开发了一个更定量的、碱基依赖性的pfs评分,其被定义为安全耗竭的间隔子数量与所有间隔子数量之间的比率,在所有pfs评分中归一化(图64d)。归一化的pfs评分揭示了d(a、u或g)的5'pfs和n的3'pfs,随后是an或na,其对于cas13b和csx27以及单独的cas13b都是一致的。为了验证该序列靶向规则,申请人用cas13b单独进行正交耗竭筛选,靶向卡那霉素抗性基因(图64e)。创建了四类间隔子:非靶向的、用5'和3'pfs规则靶向、仅用5'或3'pfs规则靶向、和不用任何规则靶向。与来自大肠杆菌必需基因筛选的结果一致,5'和3'pfs间隔子导致卡那霉素敏感性最高(图64g,图72)。基于计算预测的hepn结构域(其在其他crispr-cas系统(例如vi-a)中作为核糖核酸酶起作用),申请人预测cas13b会干扰rna。为了检验这一预测,申请人分析了针对切割的单链rna噬菌体ms2的干扰,其生命周期不包含dna中间体。申请人对bzcas13b与bzcsx27和bzcas13b单独以连续稀释的噬菌体进行了ms2滴斑测定,其具有靶向ms2基因组的三个间隔子,两个在lys-rep界面和一个rep中,以及一个非靶向间隔子(图65a)。在完成测定后,观察到了与非靶向间隔子相比所有靶向间隔子的噬斑形成的实质减少,这与vi-b1系统的序列特异性rna靶向一致。(图65b,图73)。值得注意的是,bzcsx27的存在似乎减弱了bzcas13b对所有三种间隔子的rna干扰。申请人通过将两个hepn结构域中的保守的催化精氨酸和组氨酸突变成丙氨酸(r116a/h121a和r1177a/h1182a)导致对ms2噬菌体的抗性降低约4.5个数量级(图65d,图74)证实了预测的酶结构域对于干扰的重要性。为了排除作为另一种作用模式的dna干扰,申请人修改了现有的质粒干扰测定法,其中将原型间隔子放在bla氨苄青霉素抗性基因转录物的5’末端(转录靶标)或bla基因启动子上游(非转录靶标)。在双重抗生素选择时,用bzcas13b和间隔子以及未转录的靶标质粒共转化的细菌与对相同靶标以空载体共转化的存活率是相当的。对于与转录的靶标共转化的细菌,双重抗生素选择下的菌落形成单位速率在bzcas13b存在下减少约2个数量级,这表明cas13b专门靶向rna(图65c)。鉴于rna靶标可能含有多种二级结构,并且大肠杆菌必需基因筛选的结果表明存在超出pfs的额外靶向规则(对于bzcas13b只有约18%的间隔子安全耗竭;在充分的基因必要性下,预期值将仅为pfs规则的约33%),申请人试图确定rna可获得性如何影响靶向。使用已经成功用于预测rnai效率的viennarnaplfold模型(viennarnaplfoldmodel)(bernhart等人,2006)(tafer等人,2008),申请人在筛选数据上训练和测试了针对间隔子效率的rna可及性模型,并且发现rna可及性对crrna同向重复最远端的原型间隔子区最为重要(图66b,66c)。最后,申请人计算了安全耗竭的间隔子从5'utr到基因和从3'utr到基因的经验累积分布函数(图66d),发现3'utr中的间隔子与均匀分布相比边际代表性不足,但是另外在间隔子效率上没有显著的空间依赖性。为了确定这些rna靶向规则是否泛化于vi-b型基因座,申请人接下来表征了来自颊普雷沃菌(p.buccae)的vi-b2型基因座。除了长crrna外,crispr阵列的rna测序揭示了与动物溃疡伯格菌(b.zoohelcum)相同的处理(图47b)。用pbcas13b和pbcsx28或仅用pbcas13进行大肠杆菌必需基因筛选揭示了与动物溃疡伯格菌(b.zoohelcum)类似的pfs基质,其中某些pfs基质是不受欢迎的(图67a,图75)。和bzcsx27一样,pbcsx28的存在并没有明显地改变pfs。申请人还重复了用pbcas13b和应用的类似的rnaplfold模型进行的二级结构分析(图76a和图76b),但惊人的是,没有pbcsx28的pbcas13b的安全耗竭间隔子高度偏向于基因的5'utr,这说明了在不存在pbcsx28的情况下抑制的或更多空间定位的核糖核酸酶活性(图76c)。申请人使用ms2噬菌体噬斑滴定测定确认了pbcas13b相对于其完整基因座的活性降低,这表明pbcsx28将ms2噬菌体干扰增强了高达四个数量级(图67b,图73)。csx27阻遏和csx28增强cas13b活性的不同能力泛化于大肠杆菌必需基因筛选的数千个间隔子中(图67c),这突出说明了2类crispr-cas系统内的vi-b型的独特双模特性。以前的研究示出cas13a在靶标切割后表现出非特异性的rna酶活性。cas13b可能具有相似的并行活性,在这种情况下,csx27在vi-b1系统中阻遏cas13b可能是重要的调节机制(makarova等人,2009;hayes等人,2011)。在vi-b2型系统的情况下,csx28可能增强cas13b活性以克服入侵噬菌体的大量转录物或者甚至促进程序性细胞死亡(makarova等人,2012),但是这仍有待确定(图67e)。该新型高效rna靶向2类vi-b型crispr系统与前面描述的vi-a亚型在一般功能方案和效应蛋白结构类似,但在具体情况上有很大差异,特别是明显缺乏局部适应机制和存在调节干扰的辅助蛋白。由申请人设计的新颖的大肠杆菌必需基因筛选提供了一种快速、无偏的和可重现的方法,用于阐明crispr-cas系统的复杂核酸靶向规则,并且能够开发用于依赖于序列、结构和空间的cas13brna靶向的多面模型(图67d)。对cas13b和其他靶向rna的crispr系统的靶向规则的深入了解为研究广泛的生物学过程提高了拥有一套新的精确而强大的体内rna操作工具的前景。所有组29蛋白的氨基酸序列:>gi|34397202|gb|aaq66265.1|假定蛋白pg_1164[牙龈卟啉单胞菌(porphyromonasgingivalis)w83]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhnlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|188594807|dbj|bag33782.1|保守的假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)atcc33277]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfavffkpddfvlaknrkeqlisvadgkecltvsgfafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsensldeesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmdqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelrlldpssghpflsatmetahrytegfykcylekkrewlakifyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskvmellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvrdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|188595167|dbj|bag34142.1|保守的假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)atcc33277]mteqnerpyngtyytledkhfwaaffnlarhnayitlahidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrygnndnpffkhhfvdreekvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpvdilsdeddtdgteedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekysdeasaervqgrikrviedvyavydafargeintrdeldacladkgirrghlprqmigilsqehkdmeekvrkklqemivdtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemgldevgsykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileakehpyldfkswqkferelrlvknqdiitwmicrdlmeenkvegldtgtlylkdirtdvqeqgnlnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdknfrkmleswsdplldkwpdlhgnvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqakemaeriiqa>gi|288336166|gb|efc74556.1|假定的噬菌体头尾衔接体[颊普雷沃菌(prevotellabuccae)d17]mqkqdklfvdrkknaifafpkyitimenqekpepiyyeltdkhfwaaflnlarhnvyttinhinrrleiaelkddgymmdikgswneqakkldkkvrlrdlimkhfpfleaaayeitnskspnnkeqrekeqsealslnnlknvlfifleklqvlrnyyshykyseespkpifetsllknmykvfdanvrlvkrdymhhenidmqrdfthlnrkkqvgrtkniidspnfhyhfadkegnmtiagllffvslfldkkdaiwmqkklkgfkdgrnlreqmtnevfcrsrislpklklenvqtkdwmqldmlnelvrcpkslyerlrekdresfkvpfdifsddydaeeepfkntlvrhqdrfpyfvlryfdlneifeqlrfqidlgtyhfsiynkrigdedevrhlthhlygfariqdfaqqnqpevwrklvkdldyfeasqepyipktaphyhlenekigikfcsthnnlfpslktektcngrskfnlgtqftaeaflsvhellpmmfyyllltkdysrkesadkvegiirkeisniyaiydafangeinsiadltcrlqktnilqghlpkqmisilegrqkdmekeaerkigemiddtqrrldllckqtnqkirigkrnagllksgkiadwlvndmmrfqpvqkdqnnipinnskansteyrmlqralalfgsenfrlkayfnqmnlvgndnphpflaetqwehqtnilsfyrnylearkkylkglkpqnwkqyqhflilkvqktnrntlvtgwknsfnlprgiftqpirewfekhnnskriydqilsfdrvgfvakaiplyfaeeykdnvqpfydypfnignklkpqkgqfldkkervelwqknkelfknypsekkktdlayldflswkkferelrliknqdivtwlmfkelfnmatveglkigeihlrdidtntaneesnnilnrimpmklpvktyetdnkgnilkerplatfyieetetkvlkqgnfkvlakdrrlngllsfaettdidleknpitklsvdhelikyqttrisifemtlglekklinkyptlptdsfrnmlerwlqckanrpelknyvnsliavrnafshnqypmydatlfaevkkftlfpsvdtkkielniapqlleivgkaikeieksenkn>gi|312446353|gb|adq82708.1|假定蛋白riean_1551[鸭疫里氏杆菌(riemerellaanatipestifer)atcc11845=dsm15868]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaiknqpwepyqyclllkipkenrknlvkgweqggislprglfteairetlsedlmlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkreehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdvmlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypatafgevqyhktpirtvyireehtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhtslsslenefralleewkkeyaassmvtdehiafiasvrnafchnqypfykealhapiplftvaqptteekdglgiaeallkvlreyceivksqi>gi|315022569|gb|eft35596.1|假定蛋白raym_05191[鸭疫里氏杆菌(riemerellaanatipestifer)ra-ym]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaiknqpwepyqyclllkipkenrknlvkgweqggislprglfteairetlsedlmlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkreehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdvmlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypatafgevqyhktpirtvyireehtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhtslsslenefralleewkkeyaassmvtdehiafiasvrnafchnqypfykealhapiplftvaqptteekdglgiaeallkvlreyceivksqi>gi|315252008|gb|efu31981.1|假定蛋白hmpref6485_0083[颊普雷沃菌(prevotellabuccae)atcc33574]mqkqdklfvdrkknaifafpkyitimenkekpepiyyeltdkhfwaaflnlarhnvyttinhinrrleiaelkddgymmgikgswneqakkldkkvrlrdlimkhfpfleaaayemtnskspnnkeqrekeqsealslnnlknvlfifleklqvlrnyyshykyseespkpifetsllknmykvfdanvrlvkrdymhhenidmqrdfthlnrkkqvgrtkniidspnfhyhfadkegnmtiagllffvslfldkkdaiwmqkklkgfkdgrnlreqmtnevfcrsrislpklklenvqtkdwmqldmlnelvrcpkslyerlrekdresfkvpfdifsddynaeeepfkntlvrhqdrfpyfvlryfdlneifeqlrfqidlgtyhfsiynkrigdedevrhlthhlygfariqdfapqnqpeewrklvkdldhfetsqepyisktaphyhlenekigikfcsahnnlfpslqtdktcngrskfnlgtqftaeaflsvhellpmmfyyllltkdysrkesadkvegiirkeisniyaiydafanneinsiadltrrlqntnilqghlpkqmisilkgrqkdmgkeaerkigemiddtqrrldllckqtnqkirigkrnagllksgkiadwlvndmmrfqpvqkdqnnipinnskansteyrmlqralalfgsenfrlkayfnqmnlvgndnphpflaetqwehqtnilsfyrnylearkkylkglkpqnwkqyqhflilkvqktnrntlvtgwknsfnlprgiftqpirewfekhnnskriydqilsfdrvgfvakaiplyfaeeykdnvqpfydypfnignrlkpkkrqfldkkervelwqknkelfknypsekkktdlayldflswkkferelrliknqdivtwlmfkelfnmatveglkigeihlrdidtntaneesnnilnrimpmklpvktyetdnkgnilkerplatfyieetetkvlkqgnfkalvkdrrlnglfsfaettdlnleehpisklsvdlelikyqttrisifemtlglekklidkystlptdsfrnmlerwlqckanrpelknyvnsliavrnafshnqypmydatlfaevkkftlfpsvdtkkielniapqlleivgkaikeieksenkn>gi|325335526|gb|adz11800.1|假定蛋白ria_0639[鸭疫里氏杆菌(riemerellaanatipestifer)ra-gd]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaiknqpwepyqyclllkipkenrknlvkgweqggislprglfteairetlsedlmlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkreehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdvmlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypatafgevqyhktpirtvyireehtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhtslsslenefralleewkkeyaassmvtdehiafiasvrnafchnqypfykealhapiplftvaqptteekdglgiaeallkvlreyceivksqi>gi|333804399|dbj|bak25606.1|假定蛋白pgtdc60_1457[牙龈卟啉单胞菌(porphyromonasgingivalis)tdc60]mteqnekpyngtyytledkhfwaaffnlarhnayitlahidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrygnndnpffkhhfvdregtvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpvdilsdeedtdgaeedpfkntlvrhqdrfpyfalryfdlkkvftslrfqidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrftaeaflsahelmpmmfyyfllrekyseeasaervqgrikrviedvyavydafardeintrdeldacladkgirrghlprqmigilsqehkdmeekirkklqemmadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemgldevgsykevgfmakavplyferackdwvqpfynypfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileakehpyldfkswqkferelrlvknqdiitwmicgdlmeenkvegldtgtlylkdirtdvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltrcphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsfpdaieermglniahrlseevkqaketveriiqa>gi|339613716|gb|egq18444.1|假定蛋白hmpref9144_1146[灰白普雷沃菌(prevotellapallens)atcc700821]mkeeekgktpvvstynkddkhfwaaflnlarhnvyitvnhinkilgegeinrdgyentlekswneikdinkkdrlskliikhfpflevttyqrnsadttkqkeekqaeaqsleslkksffvfiyklrdlrnhyshykhskslerpkfeedlqekmynifdasiqlvkedykhntdikteedfkhldrkgqfkysfadnegnitesgllffvslflekkdaiwvqkklegfkcsnesyqkmtnevfcrsrmllpklrlqstqtqdwilldmlnelircpkslyerlreedrkkfrvpieiadedydaeqepfknalvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkqigdykeshhlthklygferiqeftkqnrpdewrkfvktfnsfetskepyipettphyhlenqkigirfrndndkiwpslktnseknekskykldksfqaeaflsvhellpmmfyylllktentdndneietkkkenkndkqekhkieeiienkiteiyalydafangkinsidkleeyckgkdieighlpkqmiailksehkdmateakrkqeemladvqkslesldnqineeienverknsslksgeiaswlvndmmrfqpvqkdnegnplnnskansteyqmlqrslalynkeekptryfrqvnliessnphpflnntewekcnnilsfyrsyleakknfleslkpedweknqyflmlkepktncetlvqgwkngfnlprgiftepirkwfmehrknitvaelkrvglvakviplffseeykdsvqpfynylfnvgninkpdeknflnceerrellrkkkdefkkmtdkekeenpsylefqswnkferelrlvrnqdivtwllcmelfnkkkikelnvekiylknintnttkkeknteekngeekiikeknnilnrimpmrlpikvygrenfsknkkkkirrntfftvyieekgtkllkqgnfkalerdrrlgglfsfvkthskaesksntisksrveyelgeyqkarieiikdmlaleetlidkynsldtdnfhnmltgwlklkdepdkasfqndvdlliavrnafshnqypmrnriafaninpfslssantseekglgianqlkdkthktiekiieiekpietke>gi|339902202|gb|aek23281.1|假定蛋白ccan_11650[狗咬二氧化碳嗜纤维菌(capnocytophagacanimorsus)cc5]mkniqrlgkgnefspfkkedkfyfggflnlannniedffkeiitrfgivitdenkkpketfgekilneifkkdisivdyekwvnifadyfpftkylslyleemqfknrvicfrdvmkellktvealrnfythydhepikiedrvfyfldkvlldvsltvknkylktdktkeflnqhigeelkelckqrkdylvgkgkridkeseiingiynnafkdfickrekqddkenhnsvekilcnkepqnkkqkssatvwelcskssskyteksfpnrendkhclevpisqkgivfllsfflnkgeiyaltsnikgfkakitkeepvtydknsirymathrmfsflaykglkrkirtseinynedgqasstyeketlmlqmldelnkvpdvvyqnlsedvqktfiedwneylkenngdvgtmeeeqvihpvirkryedkfnyfairfldefaqfptlrfqvhlgnylcdkrtkqicdttterevkkkitvfgrlselenkkaiflnereeikgwevfpnpsydfpkenisvnykdfpivgsildrekqpvsnkigirvkiadelqreidkaikekklrnpknrkanqdekqkerlvneivstnsneqgepvvfigqptaylsmndihsvlyeflinkisgealetkivekietqikqiigkdattkilkpytnansnsinrekllrdleqeqqilktlleeqqqrekdkkdkkskrkhelypsekgkvavwlandikrfmpkafkeqwrgyhhsllqkylayyeqskeelknllpkevfkhfpfklkgyfqqqylnqfytdylkrrlsyvnelllniqnfkndkdalkatekecfkffrkqnyiinpiniqiqsilvypiflkrgfldekptmidrekfkenkdteladwfmhyknykednyqkfyayplekveekekfkrnkqinkqkkndvytlmmveyiiqkifgdkfveenplvlkgifqskaerqqnnthaattqernlngilnqpkdikiqgkitvkgvklkdignfrkyeidqrvntfldyeprkewmaylpndwkekekqgqlppnnvidrqiskyetvrskillkdvqelekiisdeikeehrhdlkqgkyynfkyyilngllrqlknenvenykvfklntnpekvnitqlkqeatdleqkafvltyirnkfahnqlpkkefwdycqekygkiekektyaeyfaevfkrekealik>gi|365737173|gb|aew86266.1|假定蛋白fcol_07235[柱状黄杆菌(flavobacteriumcolumnare)atcc49512]mssknesynkqktfnhykqedkyffggflnnaddnlrqvgkefktrinfnhnnnelasvfkdyfnkeksvakrehalnllsnyfpvleriqkhtnhnfeqtreifellldtikklrdyythhyhkpitinpkiydflddtlldvlitikkkkvkndtsrellkeklrpeltqlknqkreelikkgkklleenlenavfnhclrpfleenktddkqnktvslrkyrkskpneetsitltqsglvflmsfflhrkefqvftsglegfkakvntikeeeislnknnivymithwsysyynfkglkhriktdqgvstleqnntthsltntntkealltqivdylskvpneiyetlsekqqkefeedineymrenpenedstfssivshkvirkryenkfnyfamrfldeyaelptlrfmvnfgdyikdrqkkilesiqfdseriikkeihlfeklslvteykknvylketsnidlsrfplfpnpsyvmannnipfyidsrsnnldeylnqkkkaqsqnkkrnltfekynkeqskdaiiamlqkeigvkdlqqrstigllscnelpsmlyevivkdikgaelenkiaqkireqyqsirdftldspqkdnipttliktintdssvtfenqpidiprlknaiqkeltltqekllnvkeheievdnynrnkntykfknqpknkvddkklqrkyvfyrneirqeanwlasdlihfmknkslwkgymhnelqsflaffedkkndcialletvfnlkedciltkglknlflkhgnfidfykeylklkedflntestflengliglppkilkkelskrfkyifivfqkrqfiikeleekknnlyadainlsrgifdekptmipfkkpnpdefaswfvasyqynnyqsfyeltpdiverdkkkkyknlrainkvkiqdyylklmvdtlyqdlfnqpldkslsdfyvskaerekikadakayqkrndsslwnkvihlslqnnritanpklkdigkykralqdekiatlltyddrtwtyalqkpekenendykelhytalnmelqeyekvrskellkqvqelekqileeytdflstqihpadferegnpnfkkylahsileneddldklpekveamreldetitnpiikkaivliiirnkmahnqyppkfiydlanrfvpkkeeeyfatyfnrvfetitkelwenkekkdktqv>gi|371640969|gb|eho06562.1|假定蛋白hmpref9712_03108[拟香味类香味菌(myroidesodoratimimus)ccug10230]mkdilttdttekqnrfyshkiadkyffggyfnlasnniyevfeevnkrntfgklakrdngnlknyiihvfkdelsisdfekrvaifasyfpiletvdkksikernrtidltlsqrirqfremlislvtavdqlrnfythyhhsdivienkvldflnssfvstalhvkdkylktdktkeflketiaaeldilieaykkkqiekkntrfkankredilnaiyneafwsfindkdkdkdketvvakgadayfeknhhksndpdfalnisekgivyllsffltnkemdslkanltgfkgkvdresgnsikymatqriysfhtyrglkqkirtseegvketllmqmidelskvpnvvyqhlsttqqnsfiedwneyykdyeddvetddlsrvihpvirkryedrfnyfairfldeffdfptlrfqvhlgdyvhdrrtkqlgkvesdriikekvtvfarlkdinsakasyfhsleeqdkeeldnkwtlfpnpsydfpkehtlqhqgeqknagkigiyvklrdtqykekaaleearkslnpkersatkaskydiitqiieandnvksekplvftgqpiaylsmndihsmlfslltdnaelkktpeeveaklidqigkqineilskdtdtkilkkykdndlketdtdkitrdlardkeeieklileqkqraddynytsstkfnidksrkrkhllfnaekgkigvwlandikrfmfkeskskwkgyqhtelqklfayfdtsksdlelilsnmvmvkdypielidlvkksrtlvdflnkylearleyienvitrvknsigtpqfktvrkecftflkksnytvvsldkqverilsmplfiergfmddkptmlegksykqhkekfadwfvhykensnyqnfydtevyeittedkrekakvtkkikqqqkndvftlmmvnymleevlklssndrlslnelyqtkeerivnkqvakdtqernknyiwnkvvdlqlcdglvhidnvklkdignfrkyendsrvkefltyqsdivwsaylsnevdsnklyvierqldnyesirskellkevqeiecsvynqvankeslkqsgnenfkqyvlqgllpigmdvremlilstdvkfkkeeiiqlgqageveqdlysliyirnkfahnqlpikeffdfcennyrsisdneyyaeyymeifrsikekyan>gi|380461034|gb|afd56718.1|假定蛋白ra0c_1842[鸭疫里氏杆菌(riemerellaanatipestifer)atcc11845=dsm15868]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaiknqpwepyqyclllkipkenrknlvkgweqggislprglfteairetlsedlmlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkreehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdvmlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypatafgevqyhktpirtvyireehtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhtslsslenefralleewkkeyaassmvtdehiafiasvrnafchnqypfykealhapiplftvaqptteekdglgiaeallkvlreyceivksqi>gi|386374623|gb|afj07523.1|假定蛋白pin17_0200[中间普雷沃菌(prevotellaintermedia)17]mkmeddkktkestnmldnkhfwaaflnlarhnvyitvnhinkvlelknkkdqdiiidndqdilaikthwekvngdlnkterlrelmtkhfpfletaiytknkedkeevkqekqakaqsfdslkhclflfleklqearnyyshykysestkepmlekellkkmynifddniqlvikdyqhnkdinpdedfkhldrteeefnyyfttnkkgnitasgllffvslflekkdaiwmqqklrgfkdnreskkkmthevfcrsrmllpklrlestqtqdwilldmlnelircpkslyerlqgeyrkkfnvpfdsadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkliggqkedrhlthklygferiqefakqnrtdewkaivkdfdtyetseepyisetaphyhlenqkigirfrndndeiwpslktngennekrkykldkqyqaeaflsvhellpmmfyylllkkeepnndkknasivegfikreirdiyklydafangeinniddlekycedkgipkrhlpkqmvailydehkdmaeeakrkqkemvkdtkkllatlekqtqgeiedggrnirllksgeiarwlvndmmrfqpvqkdnegnplnnskansteyqmlqrslalynkeekptryfrqvnlinssnphpflkwtkweecnnilsfyrsyltkkieflnklkpedweknqyflklkepktnretlvqgwkngfnlprgiftepirewfkrhqndseeyekvetldrvglvtkviplffkkedskdkeeylkkdaqkeinncvqpfygfpynvgnihkpdekdflpseerkklwgdkkykfkgykakvkskkltdkekeeyrsylefqswnkferelrlvrnqdivtwllctelidklkveglnveelkklrlkdidtdtakqeknnilnrvmpmqlpvtvyeiddshnivkdrplhtvyieetktkllkqgnfkalvkdrrlnglfsfvdtssetelksnpiskslveyelgeyqnarietikdmllleetliekyktlptdnfsdmlngwlegkdeadkarfqndvkllvavrnafshnqypmrnriafaninpfslssadtseekkldianqlkdkthkiikriieiekpietke>gi|392610411|gb|eiw93190.1|假定蛋白hmpref1322_2050[牙龈卟啉单胞菌(porphyromonasgingivalis)w50]mteqnekpyngtyytledkhfwaaffnlarhnayitlahidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdkygnndnpffkhhfvdreekvteagllffvslflekrdaiwmqkkirgfkggteayqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpvdilsdeddtdgteedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqllwpspevgatrtgrskyaqdkrftaeaflsvhelmpmmfyyfllrekyseeasaekvqgrikrviedvyavydafardeintrdeldacladkgirrghlprqmiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdreenhrflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrdleawshsaarriedafvgieyaswenkkkieqllqdlslwetfesklkvkadkiniaklkkeileakehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvqeqgslnvlnhvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdesfremleswsdplldkwpdlqrevrlliavrnafshnqypmydetifssirkydpssldaieermglniahrlseevklakemveriiqa>gi|392612061|gb|eiw94777.1|假定蛋白hmpref1322_1926[牙龈卟啉单胞菌(porphyromonasgingivalis)w50]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhnlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|400374977|gb|ejp27887.1|假定蛋白hmpref1146_2324[普雷沃菌属物种(prevotellasp.)msx73]mqkqdklfvdrkknaifafpkyitimenqekpepiyyeltdkhfwaaflnlarhnvyttinhinrrleiaelkddgymmgikgswneqakkldkkvrlrdlimkhfpfleaaayeitnskspnnkeqrekeqsealslnnlknvlfifleklqvlrnyyshykyseespkpifetsllknmykvfdanvrlvkrdymhhenidmqrdfthlnrkkqvgrtkniidspnfhyhfadkegnmtiagllffvslfldkkdaiwmqkklkgfkdgrnlreqmtnevfcrsrislpklklenvqtkdwmqldmlnelvrcpkslyerlrekdresfkvpfdifsddydaeeepfkntlvrhqdrfpyfvlryfdlneifeqlrfqidlgtyhfsiynkrigdedevrhlthhlygfariqdfapqnqpeewrklvkdldhfetsqepyisktaphyhlenekigikfcsthnnlfpslkrektcngrskfnlgtqftaeaflsvhellpmmfyyllltkdysrkesadkvegiirkeisniyaiydafanneinsiadltcrlqktnilqghlpkqmisilegrqkdmekeaerkigemiddtqrrldllckqtnqkirigkrnagllksgkiadwlvsdmmrfqpvqkdtnnapinnskansteyrmlqhalalfgsessrlkayfrqmnlvgnanphpflaetqwehqtnilsfyrnylearkkylkglkpqnwkqyqhflilkvqktnrntlvtgwknsfnlprgiftqpirewfekhnnskriydqilsfdrvgfvakaiplyfaeeykdnvqpfydypfnignklkpqkgqfldkkervelwqknkelfknypseknktdlayldflswkkferelrliknqdivtwlmfkelfktttveglkigeihlrdidtntaneesnnilnrimpmklpvktyetdnkgnilkerplatfyieetetkvlkqgnfkvlakdrrlngllsfaettdidleknpitklsvdyelikyqttrisifemtlglekklidkystlptdsfrnmlerwlqckanrpelknyvnsliavrnafshnqypmydatlfaevkkftlfpsvdtkkielniapqlleivgkaikeieksenkn>gi|405580121|gb|ekb54193.1|假定蛋白hmpref9699_02005[动物溃疡伯格菌(bergeyellazoohelcum)atcc43767]menktslgnniyynpfkpqdksyfagyfnaamentdsvfrelgkrlkgkeytsenffdaifkenislveyeryvkllsdyfpmarlldkkevpikerkenfkknfkgiikavrdlrnfythkehgeveitdeifgvldemlkstvltvkkkkvktdktkeilkksiekqldilcqkkleylrdtarkieekrrnqrergekelvapfkysdkrddliaaiyndafdvyidkkkdslkesskakyntksdpqqeegdlkipiskngvvfllslfltkqeihafkskiagfkatvideatvseatvshgknsicfmatheifshlaykklkrkvrtaeinygeaenaeqlsvyaketlmmqmldelskvpdvvyqnlsedvqktfiedwneylkenngdvgtmeeeqvihpvirkryedkfnyfairfldefaqfptlrfqvhlgnylhdsrpkenlisdrrikekitvfgrlselehkkalfikntetnedrehyweifpnpnydfpkenisvndkdfpiagsildrekqpvagkigikvkllnqqyvsevdkavkahqlkqrkaskpsiqniieeivpinesnpkeaivfggqptaylsmndihsilyeffdkwekkkeklekkgekelrkeigkelekkivgkiqaqiqqiidkdtnakilkpyqdgnstaidkeklikdlkqeqnilqklkdeqtvrekeyndfiayqdknreinkvrdrnhkqylkdnlkrkypeaparkevlyyrekgkvavwlandikrfmptdfknewkgeqhsllqkslayyeqckeelknllpekvfqhlpfklggyfqqkylyqfytcyldkrleyisglvqqaenfksenkvfkkvenecfkflkkqnythkeldarvqsilgypiflergfmdekptiikgktfkgnealfadwfryykeyqnfqtfydtenyplvelekkqadrkrktkiyqqkkndvftllmakhifksvfkqdsidqfsledlyqsreerlgnqerarqtgerntnyiwnktvdlklcdgkitvenvklknvgdfikyeydqrvqaflkyeeniewqaflikeskeeenypyvvereieqyekvrreellkevhlieeyilekvkdkeilkkgdnqnfkyyilngllkqlknedvesykvfnlntepedvninqlkqeatdleqkafvltyirnkfahnqlpkkefwdycqekygkiekektyaeyfaevfkkekealik>gi|408468850|gb|afu69194.1|假定蛋白p700755_002426[扭曲冷弯菌(psychroflexustorquis)atcc700755]mesiiglglsfnpyktadkhyfgsflnlvennlnavfaefkerisykakdenissliekhfidnmsivdyekkisilngylpiidflddelennlntrvknfkknfiilaeaieklrdyythfyhdpitfednkepllelldevllktildvkkkylktdktkeilkdslreemdllvirktdelrekkktnpkiqhtdssqiknsifndafqgllyedkgnnkktqvshraktrlnpkdihkqeerdfeiplstsglvflmslflskkeiedfksnikgfkgkvvkdenhnslkymathrvysilafkglkyriktdtfsketlmmqmidelskvpdcvyqnlsetkqkdfiedwneyfkdneentenlensrvvhpvirkryedkfnyfairfldefanfktlkfqvfmgyyihdqrtktigttnittertvkekinvfgklskmdnlkkhffsqlsddentdweffpnpsynfltqadnspannipiylelknqqiikekdaikaevnqtqnrnpnkpskrdllnkilktyedfhqgdptailslneipallhlflvkpnnktgqqieniirikiekqfkainhpsknnkgipkslfadtnvrvnaiklkkdleaeldmlnkkhiafkenqkassnydkllkehqftpknkrpelrkyvfyksekgeeatwlandikrfmpkdfktkwkgcqhselqrklafydrhtkqdikellsgcefdhslldinayfqkdnfedffskylenrietlegvlkklhdfkneptplkgvfkncfkflkrqnyvtespeiikkrilakptflprgvfderptmkkgknplkdknefaewfveylenkdyqkfynaeeyrmrdadfkknavikkqklkdfytlqmvnyllkevfgkdemnlqlselfqtrqerlklqgiakkqmnketgdssentrnqtyiwnkdvpvsffngkvtidkvklknigkykryerdervktfigyevdekwmmylphnwkdrysvkpinvidlqiqeyeeirshellkeiqnleqyiydhttdknillqdgnpnfkmyvlnglligikqvnipdfivlkqntnfdkidftgiascselekktiiliairnkfahnqlpnkmiydlaneflkieknetyanyylkvlkkmisdla>gi|441484656|gb|agc41342.1|假定蛋白g148_2038[鸭疫里氏杆菌(riemerellaanatipestifer)ra-ch-2]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifnslcilnntdf>gi|441484658|gb|agc41344.1|假定蛋白g148_2040[鸭疫里氏杆菌(riemerellaanatipestifer)ra-ch-2]mffsfhnaqrvifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaikhqpwepyqyclllkvpkenrknlvkgweqggislprglfteairetlskdltlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkkeehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdimlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypttafgevqyhetpirtvyireeqtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhaslsslenefrtlleewkkkyaassmvtdkhiafiasvrnafchnqypfyketlhapillftvaqptteekdglgiaeallkvlreyceivksqi>gi|482527725|gb|eoa10535.1|假定蛋白a343_1752[牙龈卟啉单胞菌(porphyromonasgingivalis)jcvisc001]mteqnekpyngtyytledkhfwaaffnlarhnayitlthidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrcgnndnpffkhhfvdreekvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpvdilsdeddtdgteedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqllwpspevgatrtgrskyaqdkrftaeaflsvhelmpmmfyyfllrekyseeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqmiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemgldevgsykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrdleawshsaarriedafagienasrenkkkieqllqdlslwetfesklkvkadkiniaklkkeileakehpyldfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdknfrkmleswsdplldkwpdlhgnvrlliavrnafshnqypmydetlfssirkydpsspdaieermglniahrlseevkqakemveriiqa>gi|488741127|ref|wp_002664492.1|假定蛋白[动物溃疡伯格菌(bergeyellazoohelcum)]menktslgnniyynpfkpqdksyfagyfnaamentdsvfrelgkrlkgkeytsenffdaifkenislveyeryvkllsdyfpmarlldkkevpikerkenfkknfkgiikavrdlrnfythkehgeveitdeifgvldemlkstvltvkkkkvktdktkeilkksiekqldilcqkkleylrdtarkieekrrnqrergekelvapfkysdkrddliaaiyndafdvyidkkkdslkesskakyntksdpqqeegdlkipiskngvvfllslfltkqeihafkskiagfkatvideatvseatvshgknsicfmatheifshlaykklkrkvrtaeinygeaenaeqlsvyaketlmmqmldelskvpdvvyqnlsedvqktfiedwneylkenngdvgtmeeeqvihpvirkryedkfnyfairfldefaqfptlrfqvhlgnylhdsrpkenlisdrrikekitvfgrlselehkkalfikntetnedrehyweifpnpnydfpkenisvndkdfpiagsildrekqpvagkigikvkllnqqyvsevdkavkahqlkqrkaskpsiqniieeivpinesnpkeaivfggqptaylsmndihsilyeffdkwekkkeklekkgekelrkeigkelekkivgkiqaqiqqiidkdtnakilkpyqdgnstaidkeklikdlkqeqnilqklkdeqtvrekeyndfiayqdknreinkvrdrnhkqylkdnlkrkypeaparkevlyyrekgkvavwlandikrfmptdfknewkgeqhsllqkslayyeqckeelknllpekvfqhlpfklggyfqqkylyqfytcyldkrleyisglvqqaenfksenkvfkkvenecfkflkkqnythkeldarvqsilgypiflergfmdekptiikgktfkgnealfadwfryykeyqnfqtfydtenyplvelekkqadrkrktkiyqqkkndvftllmakhifksvfkqdsidqfsledlyqsreerlgnqerarqtgerntnyiwnktvdlklcdgkitvenvklknvgdfikyeydqrvqaflkyeeniewqaflikeskeeenypyvvereieqyekvrreellkevhlieeyilekvkdkeilkkgdnqnfkyyilngllkqlknedvesykvfnlntepedvninqlkqeatdleqkafvltyirnkfahnqlpkkefwdycqekygkiekektyaeyfaevfkkekealik>gi|490473137|ref|wp_004343581.1|假定蛋白[颊普雷沃菌(prevotellabuccae)]mqkqdklfvdrkknaifafpkyitimenqekpepiyyeltdkhfwaaflnlarhnvyttinhinrrleiaelkddgymmdikgswneqakkldkkvrlrdlimkhfpfleaaayeitnskspnnkeqrekeqsealslnnlknvlfifleklqvlrnyyshykyseespkpifetsllknmykvfdanvrlvkrdymhhenidmqrdfthlnrkkqvgrtkniidspnfhyhfadkegnmtiagllffvslfldkkdaiwmqkklkgfkdgrnlreqmtnevfcrsrislpklklenvqtkdwmqldmlnelvrcpkslyerlrekdresfkvpfdifsddydaeeepfkntlvrhqdrfpyfvlryfdlneifeqlrfqidlgtyhfsiynkrigdedevrhlthhlygfariqdfaqqnqpevwrklvkdldyfeasqepyipktaphyhlenekigikfcsthnnlfpslktektcngrskfnlgtqftaeaflsvhellpmmfyyllltkdysrkesadkvegiirkeisniyaiydafangeinsiadltcrlqktnilqghlpkqmisilegrqkdmekeaerkigemiddtqrrldllckqtnqkirigkrnagllksgkiadwlvndmmrfqpvqkdqnnipinnskansteyrmlqralalfgsenfrlkayfnqmnlvgndnphpflaetqwehqtnilsfyrnylearkkylkglkpqnwkqyqhflilkvqktnrntlvtgwknsfnlprgiftqpirewfekhnnskriydqilsfdrvgfvakaiplyfaeeykdnvqpfydypfnignklkpqkgqfldkkervelwqknkelfknypsekkktdlayldflswkkferelrliknqdivtwlmfkelfnmatveglkigeihlrdidtntaneesnnilnrimpmklpvktyetdnkgnilkerplatfyieetetkvlkqgnfkvlakdrrlngllsfaettdidleknpitklsvdhelikyqttrisifemtlglekklinkyptlptdsfrnmlerwlqckanrpelknyvnsliavrnafshnqypmydatlfaevkkftlfpsvdtkkielniapqlleivgkaikeieksenkn>gi|490473535|ref|wp_004343973.1|假定蛋白[颊普雷沃菌(prevotellabuccae)]mqkqdklfvdrkknaifafpkyitimenkekpepiyyeltdkhfwaaflnlarhnvyttinhinrrleiaelkddgymmgikgswneqakkldkkvrlrdlimkhfpfleaaayemtnskspnnkeqrekeqsealslnnlknvlfifleklqvlrnyyshykyseespkpifetsllknmykvfdanvrlvkrdymhhenidmqrdfthlnrkkqvgrtkniidspnfhyhfadkegnmtiagllffvslfldkkdaiwmqkklkgfkdgrnlreqmtnevfcrsrislpklklenvqtkdwmqldmlnelvrcpkslyerlrekdresfkvpfdifsddynaeeepfkntlvrhqdrfpyfvlryfdlneifeqlrfqidlgtyhfsiynkrigdedevrhlthhlygfariqdfapqnqpeewrklvkdldhfetsqepyisktaphyhlenekigikfcsahnnlfpslqtdktcngrskfnlgtqftaeaflsvhellpmmfyyllltkdysrkesadkvegiirkeisniyaiydafanneinsiadltrrlqntnilqghlpkqmisilkgrqkdmgkeaerkigemiddtqrrldllckqtnqkirigkrnagllksgkiadwlvndmmrfqpvqkdqnnipinnskansteyrmlqralalfgsenfrlkayfnqmnlvgndnphpflaetqwehqtnilsfyrnylearkkylkglkpqnwkqyqhflilkvqktnrntlvtgwknsfnlprgiftqpirewfekhnnskriydqilsfdrvgfvakaiplyfaeeykdnvqpfydypfnignrlkpkkrqfldkkervelwqknkelfknypsekkktdlayldflswkkferelrliknqdivtwlmfkelfnmatveglkigeihlrdidtntaneesnnilnrimpmklpvktyetdnkgnilkerplatfyieetetkvlkqgnfkalvkdrrlnglfsfaettdlnleehpisklsvdlelikyqttrisifemtlglekklidkystlptdsfrnmlerwlqckanrpelknyvnsliavrnafshnqypmydatlfaevkkftlfpsvdtkkielniapqlleivgkaikeieksenkn>gi|491058119|ref|wp_004919755.1|假定蛋白[鸭疫里氏杆菌(riemerellaanatipestifer)]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaiknqpwepyqyclllkipkenrknlvkgweqggislprglfteairetlsedlmlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkreehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdvmlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypatafgevqyhktpirtvyireehtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhtslsslenefralleewkkeyaassmvtdehiafiasvrnafchnqypfykealhapiplftvaqptteekdglgiaeallkvlreyceivksqi>gi|492521417|ref|wp_005873511.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhnlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|492916530|ref|wp_006044833.1|假定蛋白[灰白普雷沃菌(prevotellapallens)]mkeeekgktpvvstynkddkhfwaaflnlarhnvyitvnhinkilgegeinrdgyentlekswneikdinkkdrlskliikhfpflevttyqrnsadttkqkeekqaeaqsleslkksffvfiyklrdlrnhyshykhskslerpkfeedlqekmynifdasiqlvkedykhntdikteedfkhldrkgqfkysfadnegnitesgllffvslflekkdaiwvqkklegfkcsnesyqkmtnevfcrsrmllpklrlqstqtqdwilldmlnelircpkslyerlreedrkkfrvpieiadedydaeqepfknalvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkqigdykeshhlthklygferiqeftkqnrpdewrkfvktfnsfetskepyipettphyhlenqkigirfrndndkiwpslktnseknekskykldksfqaeaflsvhellpmmfyylllktentdndneietkkkenkndkqekhkieeiienkiteiyalydafangkinsidkleeyckgkdieighlpkqmiailksehkdmateakrkqeemladvqkslesldnqineeienverknsslksgeiaswlvndmmrfqpvqkdnegnplnnskansteyqmlqrslalynkeekptryfrqvnliessnphpflnntewekcnnilsfyrsyleakknfleslkpedweknqyflmlkepktncetlvqgwkngfnlprgiftepirkwfmehrknitvaelkrvglvakviplffseeykdsvqpfynylfnvgninkpdeknflnceerrellrkkkdefkkmtdkekeenpsylefqswnkferelrlvrnqdivtwllcmelfnkkkikelnvekiylknintnttkkeknteekngeekiikeknnilnrimpmrlpikvygrenfsknkkkkirrntfftvyieekgtkllkqgnfkalerdrrlgglfsfvkthskaesksntisksrveyelgeyqkarieiikdmlaleetlidkynsldtdnfhnmltgwlklkdepdkasfqndvdlliavrnafshnqypmrnriafaninpfslssantseekglgianqlkdkthktiekiieiekpietke>gi|493302367|ref|wp_006259957.1|假定蛋白[拟香味类香味菌(myroidesodoratimimus)]mkdilttdttekqnrfyshkiadkyffggyfnlasnniyevfeevnkrntfgklakrdngnlknyiihvfkdelsisdfekrvaifasyfpiletvdkksikernrtidltlsqrirqfremlislvtavdqlrnfythyhhsdivienkvldflnssfvstalhvkdkylktdktkeflketiaaeldilieaykkkqiekkntrfkankredilnaiyneafwsfindkdkdkdketvvakgadayfeknhhksndpdfalnisekgivyllsffltnkemdslkanltgfkgkvdresgnsikymatqriysfhtyrglkqkirtseegvketllmqmidelskvpnvvyqhlsttqqnsfiedwneyykdyeddvetddlsrvihpvirkryedrfnyfairfldeffdfptlrfqvhlgdyvhdrrtkqlgkvesdriikekvtvfarlkdinsakasyfhsleeqdkeeldnkwtlfpnpsydfpkehtlqhqgeqknagkigiyvklrdtqykekaaleearkslnpkersatkaskydiitqiieandnvksekplvftgqpiaylsmndihsmlfslltdnaelkktpeeveaklidqigkqineilskdtdtkilkkykdndlketdtdkitrdlardkeeieklileqkqraddynytsstkfnidksrkrkhllfnaekgkigvwlandikrfmfkeskskwkgyqhtelqklfayfdtsksdlelilsnmvmvkdypielidlvkksrtlvdflnkylearleyienvitrvknsigtpqfktvrkecftflkksnytvvsldkqverilsmplfiergfmddkptmlegksykqhkekfadwfvhykensnyqnfydtevyeittedkrekakvtkkikqqqkndvftlmmvnymleevlklssndrlslnelyqtkeerivnkqvakdtqernknyiwnkvvdlqlcdglvhidnvklkdignfrkyendsrvkefltyqsdivwsaylsnevdsnklyvierqldnyesirskellkevqeiecsvynqvankeslkqsgnenfkqyvlqgllpigmdvremlilstdvkfkkeeiiqlgqageveqdlysliyirnkfahnqlpikeffdfcennyrsisdneyyaeyymeifrsikekyan>gi|494654219|ref|wp_007412163.1|假定蛋白[普雷沃菌属物种(prevotellasp.)msx73]mqkqdklfvdrkknaifafpkyitimenqekpepiyyeltdkhfwaaflnlarhnvyttinhinrrleiaelkddgymmgikgswneqakkldkkvrlrdlimkhfpfleaaayeitnskspnnkeqrekeqsealslnnlknvlfifleklqvlrnyyshykyseespkpifetsllknmykvfdanvrlvkrdymhhenidmqrdfthlnrkkqvgrtkniidspnfhyhfadkegnmtiagllffvslfldkkdaiwmqkklkgfkdgrnlreqmtnevfcrsrislpklklenvqtkdwmqldmlnelvrcpkslyerlrekdresfkvpfdifsddydaeeepfkntlvrhqdrfpyfvlryfdlneifeqlrfqidlgtyhfsiynkrigdedevrhlthhlygfariqdfapqnqpeewrklvkdldhfetsqepyisktaphyhlenekigikfcsthnnlfpslkrektcngrskfnlgtqftaeaflsvhellpmmfyyllltkdysrkesadkvegiirkeisniyaiydafanneinsiadltcrlqktnilqghlpkqmisilegrqkdmekeaerkigemiddtqrrldllckqtnqkirigkrnagllksgkiadwlvsdmmrfqpvqkdtnnapinnskansteyrmlqhalalfgsessrlkayfrqmnlvgnanphpflaetqwehqtnilsfyrnylearkkylkglkpqnwkqyqhflilkvqktnrntlvtgwknsfnlprgiftqpirewfekhnnskriydqilsfdrvgfvakaiplyfaeeykdnvqpfydypfnignklkpqkgqfldkkervelwqknkelfknypseknktdlayldflswkkferelrliknqdivtwlmfkelfktttveglkigeihlrdidtntaneesnnilnrimpmklpvktyetdnkgnilkerplatfyieetetkvlkqgnfkvlakdrrlngllsfaettdidleknpitklsvdyelikyqttrisifemtlglekklidkystlptdsfrnmlerwlqckanrpelknyvnsliavrnafshnqypmydatlfaevkkftlfpsvdtkkielniapqlleivgkaikeieksenkn>gi|501433495|ref|wp_012458151.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfavffkpddfvlaknrkeqlisvadgkecltvsgfafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsensldeesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmdqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelrlldpssghpflsatmetahrytegfykcylekkrewlakifyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskvmellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvrdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|501433759|ref|wp_012458414.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnerpyngtyytledkhfwaaffnlarhnayitlahidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrygnndnpffkhhfvdreekvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpvdilsdeddtdgteedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekysdeasaervqgrikrviedvyavydafargeintrdeldacladkgirrghlprqmigilsqehkdmeekvrkklqemivdtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemgldevgsykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileakehpyldfkswqkferelrlvknqdiitwmicrdlmeenkvegldtgtlylkdirtdvqeqgnlnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdknfrkmleswsdplldkwpdlhgnvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqakemaeriiqa>gi|503582079|ref|wp_013816155.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnekpyngtyytledkhfwaaffnlarhnayitlahidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrygnndnpffkhhfvdregtvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpvdilsdeedtdgaeedpfkntlvrhqdrfpyfalryfdlkkvftslrfqidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrftaeaflsahelmpmmfyyfllrekyseeasaervqgrikrviedvyavydafardeintrdeldacladkgirrghlprqmigilsqehkdmeekirkklqemmadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemgldevgsykevgfmakavplyferackdwvqpfynypfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileakehpyldfkswqkferelrlvknqdiitwmicgdlmeenkvegldtgtlylkdirtdvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltrcphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsfpdaieermglniahrlseevkqaketveriiqa>gi|503763195|ref|wp_013997271.1|假定蛋白[狗咬二氧化碳嗜纤维菌(capnocytophagacanimorsus)]mkniqrlgkgnefspfkkedkfyfggflnlannniedffkeiitrfgivitdenkkpketfgekilneifkkdisivdyekwvnifadyfpftkylslyleemqfknrvicfrdvmkellktvealrnfythydhepikiedrvfyfldkvlldvsltvknkylktdktkeflnqhigeelkelckqrkdylvgkgkridkeseiingiynnafkdfickrekqddkenhnsvekilcnkepqnkkqkssatvwelcskssskyteksfpnrendkhclevpisqkgivfllsfflnkgeiyaltsnikgfkakitkeepvtydknsirymathrmfsflaykglkrkirtseinynedgqasstyeketlmlqmldelnkvpdvvyqnlsedvqktfiedwneylkenngdvgtmeeeqvihpvirkryedkfnyfairfldefaqfptlrfqvhlgnylcdkrtkqicdttterevkkkitvfgrlselenkkaiflnereeikgwevfpnpsydfpkenisvnykdfpivgsildrekqpvsnkigirvkiadelqreidkaikekklrnpknrkanqdekqkerlvneivstnsneqgepvvfigqptaylsmndihsvlyeflinkisgealetkivekietqikqiigkdattkilkpytnansnsinrekllrdleqeqqilktlleeqqqrekdkkdkkskrkhelypsekgkvavwlandikrfmpkafkeqwrgyhhsllqkylayyeqskeelknllpkevfkhfpfklkgyfqqqylnqfytdylkrrlsyvnelllniqnfkndkdalkatekecfkffrkqnyiinpiniqiqsilvypiflkrgfldekptmidrekfkenkdteladwfmhyknykednyqkfyayplekveekekfkrnkqinkqkkndvytlmmveyiiqkifgdkfveenplvlkgifqskaerqqnnthaattqernlngilnqpkdikiqgkitvkgvklkdignfrkyeidqrvntfldyeprkewmaylpndwkekekqgqlppnnvidrqiskyetvrskillkdvqelekiisdeikeehrhdlkqgkyynfkyyilngllrqlknenvenykvfklntnpekvnitqlkqeatdleqkafvltyirnkfahnqlpkkefwdycqekygkiekektyaeyfaevfkrekealik>gi|503931547|ref|wp_014165541.1|假定蛋白[柱状黄杆菌(flavobacteriumcolumnare)]mssknesynkqktfnhykqedkyffggflnnaddnlrqvgkefktrinfnhnnnelasvfkdyfnkeksvakrehalnllsnyfpvleriqkhtnhnfeqtreifellldtikklrdyythhyhkpitinpkiydflddtlldvlitikkkkvkndtsrellkeklrpeltqlknqkreelikkgkklleenlenavfnhclrpfleenktddkqnktvslrkyrkskpneetsitltqsglvflmsfflhrkefqvftsglegfkakvntikeeeislnknnivymithwsysyynfkglkhriktdqgvstleqnntthsltntntkealltqivdylskvpneiyetlsekqqkefeedineymrenpenedstfssivshkvirkryenkfnyfamrfldeyaelptlrfmvnfgdyikdrqkkilesiqfdseriikkeihlfeklslvteykknvylketsnidlsrfplfpnpsyvmannnipfyidsrsnnldeylnqkkkaqsqnkkrnltfekynkeqskdaiiamlqkeigvkdlqqrstigllscnelpsmlyevivkdikgaelenkiaqkireqyqsirdftldspqkdnipttliktintdssvtfenqpidiprlknaiqkeltltqekllnvkeheievdnynrnkntykfknqpknkvddkklqrkyvfyrneirqeanwlasdlihfmknkslwkgymhnelqsflaffedkkndcialletvfnlkedciltkglknlflkhgnfidfykeylklkedflntestflengliglppkilkkelskrfkyifivfqkrqfiikeleekknnlyadainlsrgifdekptmipfkkpnpdefaswfvasyqynnyqsfyeltpdiverdkkkkyknlrainkvkiqdyylklmvdtlyqdlfnqpldkslsdfyvskaerekikadakayqkrndsslwnkvihlslqnnritanpklkdigkykralqdekiatlltyddrtwtyalqkpekenendykelhytalnmelqeyekvrskellkqvqelekqileeytdflstqihpadferegnpnfkkylahsileneddldklpekveamreldetitnpiikkaivliiirnkmahnqyppkfiydlanrfvpkkeeeyfatyfnrvfetitkelwenkekkdktqv>gi|504837663|ref|wp_015024765.1|假定蛋白[扭曲冷弯菌(psychroflexustorquis)]mesiiglglsfnpyktadkhyfgsflnlvennlnavfaefkerisykakdenissliekhfidnmsivdyekkisilngylpiidflddelennlntrvknfkknfiilaeaieklrdyythfyhdpitfednkepllelldevllktildvkkkylktdktkeilkdslreemdllvirktdelrekkktnpkiqhtdssqiknsifndafqgllyedkgnnkktqvshraktrlnpkdihkqeerdfeiplstsglvflmslflskkeiedfksnikgfkgkvvkdenhnslkymathrvysilafkglkyriktdtfsketlmmqmidelskvpdcvyqnlsetkqkdfiedwneyfkdneentenlensrvvhpvirkryedkfnyfairfldefanfktlkfqvfmgyyihdqrtktigttnittertvkekinvfgklskmdnlkkhffsqlsddentdweffpnpsynfltqadnspannipiylelknqqiikekdaikaevnqtqnrnpnkpskrdllnkilktyedfhqgdptailslneipallhlflvkpnnktgqqieniirikiekqfkainhpsknnkgipkslfadtnvrvnaiklkkdleaeldmlnkkhiafkenqkassnydkllkehqftpknkrpelrkyvfyksekgeeatwlandikrfmpkdfktkwkgcqhselqrklafydrhtkqdikellsgcefdhslldinayfqkdnfedffskylenrietlegvlkklhdfkneptplkgvfkncfkflkrqnyvtespeiikkrilakptflprgvfderptmkkgknplkdknefaewfveylenkdyqkfynaeeyrmrdadfkknavikkqklkdfytlqmvnyllkevfgkdemnlqlselfqtrqerlklqgiakkqmnketgdssentrnqtyiwnkdvpvsffngkvtidkvklknigkykryerdervktfigyevdekwmmylphnwkdrysvkpinvidlqiqeyeeirshellkeiqnleqyiydhttdknillqdgnpnfkmyvlnglligikqvnipdfivlkqntnfdkidftgiascselekktiiliairnkfahnqlpnkmiydlaneflkieknetyanyylkvlkkmisdla>gi|505158517|ref|wp_015345619.1|假定蛋白[鸭疫里氏杆菌(riemerellaanatipestifer)]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifnslcilnntdf>gi|505158518|ref|wp_015345620.1|假定蛋白[鸭疫里氏杆菌(riemerellaanatipestifer)]mffsfhnaqrvifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaikhqpwepyqyclllkvpkenrknlvkgweqggislprglfteairetlskdltlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkkeehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdimlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypttafgevqyhetpirtvyireeqtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhaslsslenefrtlleewkkkyaassmvtdkhiafiasvrnafchnqypfyketlhapillftvaqptteekdglgiaeallkvlreyceivksqi>gi|543953686|gb|erj64231.1|假定蛋白hmpref1555_01956[牙龈卟啉单胞菌(porphyromonasgingivalis)f0570]mrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekysdeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqmiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwksefhlprgifteavrdcliemghdevgsykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskedraeewesgkerfrlaklkkeileakehpyldfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvyeqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdesfremleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqakemaeriiqa>gi|543955272|gb|erj65637.1|假定蛋白hmpref1553_02065[牙龈卟啉单胞菌(porphyromonasgingivalis)f0568]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnprsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmdqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlqkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrhqfraivaelrlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|543955721|gb|erj66054.1|假定蛋白hmpref1553_01900[牙龈卟啉单胞菌(porphyromonasgingivalis)f0568]mrdldcfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekysdeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqiiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkiridrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemgldevgsykevgfmakavplyferackdrvqpfynypfnvgnilkpkkgrflskekraeewesgkerfrdleawsqstarriedafagikyaspgnkkkieqllqdlslwetfesklkvkadkinlaklkkeileakehpyldfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdiwtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcafeqtleleeslltrcphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqakemaeriiqa>gi|543956136|gb|erj66432.1|假定蛋白hmpref1555_01119[porphyromonasgingivalisf0570]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtnenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhdlrklllmellcegsfsrmqsgflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildkenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildhenrffgkllnnmsqpindl>gi|543977697|gb|erj81654.1|假定蛋白hmpref1989_02374[牙龈卟啉单胞菌(porphyromonasgingivalis)f0566]mrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqmiailsqehkdmeekirkklqemmadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemghdevasykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrdleawsqsavrriedafagienasrenkkkieqllqdlslwkafesklkvrgdkiniaklkkeileakehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltrcphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|543983828|gb|erj87335.1|假定蛋白hmpref1990_01800[牙龈卟啉单胞菌(porphyromonasgingivalis)w4087]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnprsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmdqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlqkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrhqfraivaelrlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskvmellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvrdkkrelrtagkpvppdlaayikrsfhravnerefmlrlvqeddrlmlmainkimtdreedilpglknidsildkenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaeipliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|543999227|gb|erj98772.1|假定蛋白hmpref1218_0639[prevotellapleuritidisf0068]mendkrleesacytlndkhfwaaflnlarhnvyitvnhinktlelknkknqeiiidndqdilaikthwakvngdlnktdrlrelmikhfpfleaaiysnnkedkeevkeekqakaqsfkslkdclflfleklqearnyyshykysesskepefeegllekmyntfdasirlvkedyqynkdidpekdfkhlerkedfnylftdkdnkgkitkngllffvslflekkdaiwmqqkfrgfkdnrgnkekmthevfcrsrmllpkirlestqtqdwilldmlnelircpkslyerlqgayrekfkvpfdsidedydaeqepfrntlvrhqdrfpyfalryfdyneifknlrfqidlgtyhfsiykkliggkkedrhlthklygferiqeftkqnrpdkwqaiikdldtyetsneryisettphyhlenqkigirfrndnndiwpslktngeknekskynldkpyqaeaflsvhellpmmfyylllkmentdndkednevgtkkkgnknnkqekhkieeiienkikdiyalydaftngeinsidelaeqregkdieighlpkqlivilknkskdmaekanrkqkemikdtkkrlatldkqvkgeiedggrnirllksgeiarwlvndmmrfqpvqkdnegkplnnskansteyqmlqrslalynkeekptryfrqvnlikssnphpfledtkweecynilsfyrnylkakikflnklkpedwkknqyflmlkepktnrktlvqgwkngfnlprgiftepikewfkrhqndseeykkvealdrvglvakviplffkeeyfkedaqkeinncvqpfysfpynvgnihkpeeknflhceerrklwdkkkdkfkgykakekskkmtdkekeehrsylefqswnkferelrlvrnqdiltwllctklidklkidelnieelqklrlkdidtdtakkeknnilnrvmpmrlpvtvyeidksfnivkdkplhtvyieetgtkllkqgnfkalvkdrrlnglfsfvktsseaeskskpisklrveyelgayqkaridiikdmlalektlidndenlptnkfsdmlkswlkgkgeankarlqndvgllvavrnafshnqypmynsevfkgmkllslssdipekeglgiakqlkdkiketieriieiekeirn>gi|545305353|ref|wp_021584635.1|假定蛋白[prevotellapleuritidis]mendkrleesacytlndkhfwaaflnlarhnvyitvnhinktlelknkknqeiiidndqdilaikthwakvngdlnktdrlrelmikhfpfleaaiysnnkedkeevkeekqakaqsfkslkdclflfleklqearnyyshykysesskepefeegllekmyntfdasirlvkedyqynkdidpekdfkhlerkedfnylftdkdnkgkitkngllffvslflekkdaiwmqqkfrgfkdnrgnkekmthevfcrsrmllpkirlestqtqdwilldmlnelircpkslyerlqgayrekfkvpfdsidedydaeqepfrntlvrhqdrfpyfalryfdyneifknlrfqidlgtyhfsiykkliggkkedrhlthklygferiqeftkqnrpdkwqaiikdldtyetsneryisettphyhlenqkigirfrndnndiwpslktngeknekskynldkpyqaeaflsvhellpmmfyylllkmentdndkednevgtkkkgnknnkqekhkieeiienkikdiyalydaftngeinsidelaeqregkdieighlpkqlivilknkskdmaekanrkqkemikdtkkrlatldkqvkgeiedggrnirllksgeiarwlvndmmrfqpvqkdnegkplnnskansteyqmlqrslalynkeekptryfrqvnlikssnphpfledtkweecynilsfyrnylkakikflnklkpedwkknqyflmlkepktnrktlvqgwkngfnlprgiftepikewfkrhqndseeykkvealdrvglvakviplffkeeyfkedaqkeinncvqpfysfpynvgnihkpeeknflhceerrklwdkkkdkfkgykakekskkmtdkekeehrsylefqswnkferelrlvrnqdiltwllctklidklkidelnieelqklrlkdidtdtakkeknnilnrvmpmrlpvtvyeidksfnivkdkplhtvyieetgtkllkqgnfkalvkdrrlnglfsfvktsseaeskskpisklrveyelgayqkaridiikdmlalektlidndenlptnkfsdmlkswlkgkgeankarlqndvgllvavrnafshnqypmynsevfkgmkllslssdipekeglgiakqlkdkiketieriieiekeirn>gi|545424591|ref|wp_021663197.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnprsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmdqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlqkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrhqfraivaelrlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|545427058|ref|wp_021665475.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtnenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhdlrklllmellcegsfsrmqsgflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildkenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildhenrffgkllnnmsqpindl>gi|545440038|ref|wp_021677657.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhdlrklllmellcegsfsrmqsgflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildhenrffgkllnnmsqpindl>gi|545442698|ref|wp_021680012.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnprsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmdqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlqkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrhqfraivaelrlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskvmellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvrdkkrelrtagkpvppdlaayikrsfhravnerefmlrlvqeddrlmlmainkimtdreedilpglknidsildkenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaeipliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|563396328|gb|eta27404.1|假定蛋白sjdpg2_03560[牙龈卟啉单胞菌(porphyromonasgingivalis)sjd2]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnprsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|564601847|ref|wp_023846767.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnprsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|567226320|dbj|gae20957.1|假定蛋白jcm10003_349[酿脓拟杆菌(bacteroidespyogenes)jcm10003]mesiknsqkstgktlqkdppyfglylnmallnvrkvenhirkwlgdvallpeksgfhsllttdnlssakwtrfyyksrkflpflemfdsdkksyenrretaecldtidrqkissllkevygklqdirnafshyhiddqsvkhtaliissemhrfienaysfalqktrarftgvfvetdflqaeekgdnkkffaiggnegiklkdnalifliclfldreeafkflsratgfkstkekgflavretfcalccrqpherllsvnpreallmdmlnelnrcpdilfemldekdqksflpllgeeeqahilenslndelceaiddpfemiaslskrvryknrfpylmlryieeknllpfirfridlgclelasypkkmgeennyersvtdhamafgrltdfhnedavlqqitkgitdevrfslyapryaiynnkigfvrtsgsdkisfptlkkkggeghcvaytlqntksfgfisiydlrkilllsfldkdkaknivsglleqcekhwkdlsenlfdairtelqkefpvplirytlprskggklvsskladkqekyeseferrkeklteilsekdfdlsqiprrmidewlnvlptsrekklkgyvetlkldcrerlrvfekrekgehplpprigematdlakdiirmvidqgvkqritsayyseiqrclaqyagddnrrhldsiirelrlkdtknghpflgkvlrpglghteklyqryfeekkewleatfypaaspkrvprfvnpptgkqkelpliirnlmkerpewrdwkqrknshpidlpsqlfeneicrllkdkigkepsgklkwnemfklywdkefpngmqrfyrckrrvevfdkvveyeyseeggnykkyyealidevvrqkissskeksklqvedltlsvrrvfkrainekeyqlrllceddrllfmavrdlydwkeaqldldkidnmlgepvsvsqviqleggqpdavikaecklkdvsklmrycydgrvkglmpyfanheatqeqvemelrhyedhrrrvfnwvfaleksvlkneklrrfyeesqggcehrrcidalrkaslvseeeyeflvhirnksahnqfpdleigklppnvtsgfceciwskykaiicriipfidperrffgklleqk>gi|640570032|ref|wp_025000926.1|假定蛋白[桔红色普雷沃菌(prevotellaaurantiaca)]meddkkttgsisyelkdkhfwaaflnlarhnvyitinhinklleireidndekvldiktlwqkgnkdlnqkarlrelmtkhfpfletaiytknkedkkevkqekqaeaqsleslkdclflfldklqearnyyshykysefskepefeegllekmynifgnniqlvindyqhnkdinpdedfkhldrkgqfkysfadnegnitesgllffvslflekkdaiwmqqklngfkdnlenkkkmthevfcrsrilmpklrlestqtqdwilldmlnelircpkslyerlqgddrekfkvpfdpadedynaeqepfkntlirhqdrfpyfvlryfdyneifknlrfqidlgtyhfsiykkliggqkedrhlthklygferiqefakqnrpdewkaivkdldtyetsnkryisettphyhlenqkigirfrngnkeiwpslktndennekskykldkqyqaeaflsvhellpmmfyylllkkekpnndeinasivegfikreirnifklydafangeinniddlekycadkgipkrhlpkqmvailydehkdmvkeakrkqkemvkdtkkllatlekqtqkekeddgrnvkllksgeiarwlvndmmrfqpvqkdnegkplnnskansteyqmlqrslalynneekptryfrqvnliesnnphpflkwtkweecnniltfyysyltkkieflnklkpedwkknqyflklkepktnretlvqgwkngfnlprgiftepirewfkrhqnnskeyekvealdrvglvtkviplffkeeyfkdkeenfkedtqkeindcvqpfynfpynvgnihkpkekdflhreerielwdkkkdkfkgykekikskkltekdkeefrsylefqswnkferelrlvrnqdivtwllckelidklkidelnieelkklrlnnidtdtakkeknnilnrvmpmelpvtvyeiddshkivkdkplhtiyikeaetkllkqgnfkalvkdrrlnglfsfvktnseaeskrnpisklrveyelgeyqearieiiqdmlaleeklinkykdlptnkfsemlnswlegkdeadkarfqndvdfliavrnafshnqypmhnkiefanikpfslytannseekglgianqlkdktkettdkikkiekpietke>gi|672596632|gb|aij35608.1|假定蛋白eg14_06045[牙龈卟啉单胞菌(porphyromonasgingivalis)]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfavffkpddfvlaknrkeqlisvadgkecltvsgfafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsensldeesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmdqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelrlldpssghpflsatmetahrytegfykcylekkrewlakifyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskvmellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvrdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|672597416|gb|aij36392.1|假定蛋白eg14_10345[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnerpyngtyytledkhfwaaffnlarhnayitlahidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrygnndnpffkhhfvdregtvteagllffvslflekrdaiwmqkkirgfkggteayqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpidilsdeddtdgteedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyavydafargeidtldrldacladkgirrghlprqmiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdreenhrflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileakehpyldfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqakemaeriiqv>gi|690716823|gb|kge88582.1|假定蛋白ix84_07840[三角棕指藻(phaeodactylibacterxiamenensis)]mtntpkrrtlhrhpsyfgaflniarhnafmimehlstkydmedkntldeaqlpnaklfgclkkrygkpdvtegvsrdlrryfpflnyplflhlekqqnaeqaatydinpedieftlkgffrllnqmrnnyshyisntdygkfdklpvqdiyeaaifrlldrgkhtkrfdvfeskhtrhlesnnseyrprslanspdhentvafvtclflerkyafpflsrldcfrstndaaegdplirkashecytmfccrlpqpklessdilldmvnelgrcpsalynllseedqarfhikreeitgfeedpdeeleqeivlkrhsdrfpyfalryfddteafqtlrfdvylgrwrtkpvykkriygqerdrvltqsirtftrlsrllpiyenvkhdavrqneedgklvnpdvtsqfhkswiqiesddraflsdriehfsphynfgdqviglkfinpdryaaiqnvfpklpgeekkdkdaklvnetadaiistheirslflyhylskkpisagderrfiqvdtetfikqyidtiklffediksgelqpiadppnyqkneplpyvrgdkektqeeraqyrerqkeikerrkelntllqnryglsiqyipsrlreyllgykkvpyeklalqklraqrkevkkrikdiekmrtprvgeqatwlaedivfltppkmhtperkttkhpqklnndqfrimqsslayfsvnkkaikkffqketgiglsnretshpflyridvgrcrgildfytgylkykmdwlddaikkvdnrkhgkkeakkyekylpssiqhktpleldytrlpvylprglfkkaivkalaahadfqvepeednvifcldqlldgdtqdfynwqryyrsalteketdnqlvlahpyaeqilgtiktlegkqknnklgnkakqkikdelidlkrakrrlldreqylravqaedralwlmiqerqkqkaeheeiafdqldlknitkiltesidarlripdtkvditdklplrrygdlrrvakdrrlvnlasyyhvaglseipydlvkkeleeydrrrvaffehvyqfekevydryaaelrnenpkgestyfshweyvavavkhsadthfnelfkekvmqlrnkfhhnefpyfdwllpevekasaalyadrvfdvaegyyqkmrklmrq>gi|696209666|gb|kgl48767.1|假定蛋白hq49_06245[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknldndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdsegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrmddwmlldmlnelvrcpkplydrlreddracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqtsphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintlkeldacladkgirrghlpkqmiailsqehknmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdasgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhdtrweshtnilsfyrsylrarkaflerigrsdrmenrpflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsyrevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskeeraeewergkerfrdleawshsaarriedafagieyaspgnkkkieqllrdlslweafesklkvradkinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtnvqeqgslnvlnhvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdknfrkmleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|696216474|gb|kgl55352.1|假定蛋白hq50_05870[卟啉单胞菌属物种(porphyromonassp.)cot-052oh4946]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdsegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlreddracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqttphyhiekgkiglrfvpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintlkeldacladkgirrghlpkqmigilsqerkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrvencpflllkepktdrqtlvagwkgefhlprgifteavrdcliemgydevgsyrevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskedraeewergkerfrdleawshsaarrikdafagieyaspgnkkkieqllrdlslweafesklkvradkinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleesllsryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|700219215|gb|kgn69120.1|假定蛋白hr09_05855[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdgegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlreddracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqtsphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintlkeldacladkgirrghlpkqmiailsqehkdmeekirkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekkrltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrmenrpflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsyrevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskeeraeewergkerfrdleawshsaarriedafagieyaspgnkkkieqllrdlslweafesklkvradkinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleeslltryphlpdesfrkmleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqv>gi|700224863|gb|kgn74647.1|假定蛋白hr17_04485[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkidhehndevdphyhfnhlvrkgkkdryghndnpsfkhhfvdgegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrmddwmlldmlnelvrcpkplydrlreddracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqtsphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaervqgrikrviedvyavydafardeintrdeldacladkgirrghlprqmiailsqehkdmeekirkklqemmadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdasgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrvenrpflllkepktdrqtlvagwkgefhlprgifteavrdcliemghdevasykevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskeeraeewergkerfrdleawsysaarriedafagieyaspgnkkkieqllrdlslweafesklkvradrinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleeslltryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|700226261|gb|kgn76020.1|假定蛋白hq40_04325[咽喉卟啉单胞菌(porphyromonasgulae)]mntvpatenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsidrwtkvyghsrrylpflhcfdpdsgiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlkvspdissfitgaytfaceraqsrfadffkpddfllaknrkeqlisvadgkecltvsgfafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvrdkkrelrtagkpvppdlaayikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildhenrffgkllnnmsqpindl>gi|700235983|gb|kgn85385.1|假定蛋白hr15_09830[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphyhfnhlvrkgkkdryghndnpsfkhhfvdsegmvteagllffvslflekrdaiwmqkkirgfkggtgpyeqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlrekdracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqttphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrvikdvyaiydafardeintlkeldacsadkgirrghlpkqmigilsqehknmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpfldetrweshtnilsfyrsylrarkaflerigrsdrvenrpflllkepkndrqtlvagwksefhlprgifteavrdcliemgydevgsykevgfmakavplyferackdrvqpfydspfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileakehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdenfremleswsdpllgkwpdlhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|700238026|gb|kgn87312.1|假定蛋白hq46_09365[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknldndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphyhfnhlvrkgkkdryghndnpsfkhhfvdsegmvteagllffvslflekrdaiwmqkkirgfkggtgpyeqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlrekdracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyletgdkpyisqttphyhiekgkiglrfvpegqhlwpspevgttrtgrskcaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintlkeldtcladkgirrghlpkqmitilsqerkdmkekirkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdasgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrvencpflllkepktdrqtlvagwkdefhlprgifteavrdcliemgydevgsyrevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskedraeewergmerfrdleawshsaarrikdafagieyaspgnkkkieqllrdlslweafesklkvradkinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeaplatvyieerntkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleesllsryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|700239027|gb|kgn88274.1|假定蛋白hr08_00310[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknldndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdgegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlrekdrarfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkvigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqttphyhiekgkiglrfvpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintrdeldacladkgirrghlpkqmigilsqehknmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpfldetrweshtnilsfyrsylrarkaflerigrsdrvenrpflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsykevgfmakavplyferackdrvqpfydspfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleesllsryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|700263343|gb|kgo05347.1|假定蛋白hr16_00525[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkidhehndevdphyhfnhlvrkgkkdryghndnpsfkhhfvdgegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrmddwmlldmlnelvrcpkplydrlreddracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqtsphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaervqgrikrviedvyavydafardeintrdeldacladkgirrghlprqmiailsqehkdmeekirkklqemmadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdasgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrvenrpflllkepktdrqtlvagwkgefhlprgifteavrdcliemghdevasykevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskeeraeewergkerfrdleawsysaarriedafagieyaspgnkkkieqllrdlslweafesklkvradrinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleeslltryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|736527371|ref|wp_034542281.1|假定蛋白[酿脓拟杆菌(bacteroidespyogenes)]mesiknsqkstgktlqkdppyfglylnmallnvrkvenhirkwlgdvallpeksgfhsllttdnlssakwtrfyyksrkflpflemfdsdkksyenrretaecldtidrqkissllkevygklqdirnafshyhiddqsvkhtaliissemhrfienaysfalqktrarftgvfvetdflqaeekgdnkkffaiggnegiklkdnalifliclfldreeafkflsratgfkstkekgflavretfcalccrqpherllsvnpreallmdmlnelnrcpdilfemldekdqksflpllgeeeqahilenslndelceaiddpfemiaslskrvryknrfpylmlryieeknllpfirfridlgclelasypkkmgeennyersvtdhamafgrltdfhnedavlqqitkgitdevrfslyapryaiynnkigfvrtsgsdkisfptlkkkggeghcvaytlqntksfgfisiydlrkilllsfldkdkaknivsglleqcekhwkdlsenlfdairtelqkefpvplirytlprskggklvsskladkqekyeseferrkeklteilsekdfdlsqiprrmidewlnvlptsrekklkgyvetlkldcrerlrvfekrekgehplpprigematdlakdiirmvidqgvkqritsayyseiqrclaqyagddnrrhldsiirelrlkdtknghpflgkvlrpglghteklyqryfeekkewleatfypaaspkrvprfvnpptgkqkelpliirnlmkerpewrdwkqrknshpidlpsqlfeneicrllkdkigkepsgklkwnemfklywdkefpngmqrfyrckrrvevfdkvveyeyseeggnykkyyealidevvrqkissskeksklqvedltlsvrrvfkrainekeyqlrllceddrllfmavrdlydwkeaqldldkidnmlgepvsvsqviqleggqpdavikaecklkdvsklmrycydgrvkglmpyfanheatqeqvemelrhyedhrrrvfnwvfaleksvlkneklrrfyeesqggcehrrcidalrkaslvseeeyeflvhirnksahnqfpdleigklppnvtsgfceciwskykaiicriipfidperrffgklleqk>gi|738977489|ref|wp_036860899.1|假定蛋白[中间普雷沃菌(prevotellaintermedia)]meddkkttdsiryelkdkhfwaaflnlarhnvyitvnhinkileegeinrdgyettlkntwneikdinkkdrlskliikhfpfleaatyrlnptdttkqkeekqaeaqsleslrksffvfiyklrdlrnhyshykhskslerpkfeegllekmynifnasirlvkedyqynkdinpdedfkhldrteeefnyyftkdnegnitesgllffvslflekkdaiwmqqklrgfkdnrenkkkmtnevfcrsrmllpklrlqstqtqdwilldmlnelircpkslyerlreedrekfrvpieiadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkqigdykeshhlthklygferiqeftkqnrpdewrkfvktfnsfetskepyipettphyhlenqkigirfrndndkiwpslktnseknekskykldksfqaeaflsvhellpmmfyylllktentdndneietkkkenkndkqekhkieeiienkiteiyalydtfangeiksideleeyckgkdieighlpkqmiailkdehkvmateaerkqeemlvdvqkslesldnqineeienverknsslksgkiaswlvndmmrfqpvqkdnegkplnnskansteyqllqrtlaffgseherlapyfkqtkliessnphpflkdtewekcnnilsfyrsyleakknfleslkpedweknqyflklkepktkpktlvqgwkngfnlprgiftepirkwfmkhrenitvaelkrvglvakviplffseeykdsvqpfynyhfnvgninkpdeknflnceerrellrkkkdefkkmtdkekeenpsylefkswnkferelrlvrnqdivtwllcmelfnkkkikelnvekiylknintnttkkeknteekngeeknikeknnilnrimpmrlpikvygrenfsknkkkkirrntfftvyieekgtkllkqgnfkalerdrrlgglfsfvktpskaesksntisklrveyelgeyqkarieiikdmlalektlidkynsldtdnfnkmltdwlelkgepdkasfqndvdlliavrnafshnqypmrnriafaninpfslssantseekglgianqlkdkthktiekiieiekpietke>gi|739003017|ref|wp_036884929.1|假定蛋白[prevotellafalsenii]mkndnnstkstdytlgdkhfwaaflnlarhnvyitvnhinkvlelknkkdqeiiidndqdilaiktlwgkvdtdinkkdrlrelimkhfpfleaatyqqsstnntkqkeeeqakaqsfeslkdclflfleklrearnyyshykhsksleepkleekllenmynifdtnvqlvikdyehnkdinpeedfkhlgraegefnyyftrnkkgnitesgllffvslflekkdaiwaqtkikgfkdnrenkqkmthevfcrsrmllpklrlestqtqdwilldmlnelircpkslykrlqgekrekfrvpfdpadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkqigdkkedrhlthklygferiqefakenrpdewkalvkdldtfeesnepyisettphyhlenqkigirnknkkkkktiwpsletkttvnerskynlgksfkaeaflsvhellpmmfyylllnkeepnngkinaskvegiiekkirdiyklygafaneeinneeelkeycegkdiairhlpkqmiailkneykdmakkaedkqkkmikdtkkrlaaldkqvkgevedggrnikplksgriaswlvndmmrfqpvqrdrdgyplnnskansteyqllqrtlalfgsererlapyfrqmnligkdnphpflkdtkwkehnnilsfyrsyleakknflgslkpedwkknqyflklkepktnretlvqgwkngfnlprgiftepirewfirhqneseeykkvkdfdriglvakviplffkedyqkeiedyvqpfygypfnvgnihnsqegtflnkkereelwkgnktkfkdyktkeknkektnkdkfkkktdeekeefrsyldfqswkkferelrlvrnqdivtwllcmelidklkidelnieelqklrlkdidtdtakkeknnilnrimpmelpvtvyetddsnniikdkplhtiyikeaetkllkqgnfkalvkdrrlnglfsfvetsseaelkskpiskslveyelgeyqrarveiikdmlrleetligndeklptnkfrqmldkwlehkketddtdlkndvklltevrnafshnqypmrdriafanikpfslssantsneeglgiakklkdktketidriieieeqtatkr>gi|739057304|ref|wp_036929175.1|假定蛋白[普雷沃菌属物种(prevotellasp.)ma2016]mskeckkqrqekkrrlqkanfsisltgkhvfgayfnmartnfvktinyilpiagvrgnysenqinkmlhalfliqagrneeltteqkqwekklrlnpeqqtkfqkllfkhfpvlgpmmadvadhkaylnkkkstvqtedetfamlkgvsladcldiiclmadtltecrnfythkdpynkpsqladqylhqemiakkldkvvvasrrilkdreglsvnevefltgidhlhqevlkdefgnakvkdgkvmktfveyddfyfkisgkrlvngytvttkddkpvnvntmlpalsdfgllyfcvlflskpyaklfidevrlfeyspfddkenmimsemlsiyrirtprlhkidshdskatlamdifgelrrcpmelynlldknagqpffhdevkhpnshtpdvskrlryddrfptlalryidetelfkrirfqlqlgsfrykfydkencidgrvrvrriqkeingygrmqevadkrmdkwgdliqkreersvkleheelyinldqfledtadstpyvtdrrpaynihanriglywedsqnpkqykvfdengmyipelvvtedkkapikmpaprcalsvydlpamlfyeylreqqdnefpsaeqviieyeddyrkffkavaegklkpfkrpkefrdflkkeypklrmadipkklqlflcshglcynnkpetvyerldrltlqhleerelhiqnrlehyqkdrdmignkdnqygkksfsdvrhgalarylaqsmmewqptklkdkekghdkltglnynvltaylatyghpqvpeegftprtleqvlinahliggsnphpfinkvlalgnrnieelylhyleeelkhirsriqslssnpsdkalsalpfihhdrmryhertseemmalaaryttiqlpdglftpyileilqkhytensdlqnalsqdvpvklnptcnaaylitlfyqtvlkdnaqpfylsdktytrnkdgekaesfsfkrayelfsvlnnnkkdtfpfemiplfltsdeiqerlsaklldgdgnpvpevgekgkpatdsqgntiwkrriysevddyaekltdrdmkisfkgeweklprwkqdkiikrrdetrrqmrdellqrmpryirdikdnertlrryktqdmvlfllaekmftniiseqssefnwkqmrlskvcneaflrqtltfrvpvtvgettiyveqenmslknygefyrfltddrlmsllnnivetlkpnengdlvirhtdlmselaaydqyrstifmliqsienliitnnavlddpdadgfwvredlpkrnnfasllelinqlnnveltdderkllvairnafshnsynidfslikdvkhlpevakgilqhlqsmlgveitk>gi|739060066|ref|wp_036931485.1|假定蛋白[prevotellapleuritidis]mendkrleestcytlndkhfwaaflnlarhnvyitinhinklleirqidndekvldikalwqkvdkdinqkarlrelmikhfpfleaaiysnnkedkeevkeekqakaqsfkslkdclflfleklqearnyyshykssesskepefeegllekmyntfgvsirlvkedyqynkdidpekdfkhlerkedfnylftdkdnkgkitkngllffvslflekkdaiwmqqklrgfkdnrgnkekmthevfcrsrmllpkirlestqtqdwilldmlnelircpkslyerlqgayrekfkvpfdsidedydaeqepfrntlvrhqdrfpyfalryfdyneifknlrfqidlgtyhfsiykkligdnkedrhlthklygferiqefakqkrpnewqalvkdldiyetsneqyisettphyhlenqkigirfknkkdkiwpsletngkenekskynldksfqaeaflsihellpmmfydlllkkeepnndeknasivegfikkeikrmyaiydafaneeinskegleeycknkgfqerhlpkqmiailtnksknmaekakrkqkemikdtkkrlatldkqvkgeiedggrnirllksgeiarwlvndmmrfqsvqkdkegkplnnskansteyqmlqrslalynkeqkptpyfiqvnlikssnphpfleetkweecnnilsfyrsyleakknfleslkpedwkknqyflmlkepktnrktlvqgwkngfnlprgiftepikewfkrhqndseeykkvealdrvglvakviplffkeeyfkedaqkeinncvqpfysfpynvgnihkpeeknflhceerrklwdkkkdkfkgykakekskkmtdkekeehrsylefqswnkferelrlvrnqdivtwllctelidklkidelnieelqklrlkdidtdtakkeknnilnrimpmqlpvtvyeidksfnivkdkplhtiyieetgtkllkqgnfkalvkdrrlnglfsfvktsseaeskskpisklrveyelgayqkaridiikdmlalektlidndenlptnkfsdmlkswlkgkgeankarlqndvdllvairnafshnqypmynsevfkgmkllslssdipekeglgiakqlkdkiketieriieiekeirn>gi|746373271|ref|wp_039417390.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnerpyngtyytledkhfwaaffnlarhnayitlahidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrygnndnpffkhhfvdregtvteagllffvslflekrdaiwmqkkirgfkggteayqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpidilsdeddtdgteedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyavydafargeidtldrldacladkgirrghlprqmiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdreenhrflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileakehpyldfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqakemaeriiqv>gi|746374939|ref|wp_039418912.1|假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknldndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdsegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrmddwmlldmlnelvrcpkplydrlreddracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqtsphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintlkeldacladkgirrghlpkqmiailsqehknmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdasgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhdtrweshtnilsfyrsylrarkaflerigrsdrmenrpflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsyrevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskeeraeewergkerfrdleawshsaarriedafagieyaspgnkkkieqllrdlslweafesklkvradkinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtnvqeqgslnvlnhvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdknfrkmleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|746375986|ref|wp_039419792.1|假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknldndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdgegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlrekdrarfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkvigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqttphyhiekgkiglrfvpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintrdeldacladkgirrghlpkqmigilsqehknmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpfldetrweshtnilsfyrsylrarkaflerigrsdrvenrpflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsykevgfmakavplyferackdrvqpfydspfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleesllsryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|746382772|ref|wp_039426176.1|假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphyhfnhlvrkgkkdryghndnpsfkhhfvdsegmvteagllffvslflekrdaiwmqkkirgfkggtgpyeqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlrekdracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqttphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrvikdvyaiydafardeintlkeldacsadkgirrghlpkqmigilsqehknmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpfldetrweshtnilsfyrsylrarkaflerigrsdrvenrpflllkepkndrqtlvagwksefhlprgifteavrdcliemgydevgsykevgfmakavplyferackdrvqpfydspfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileakehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdenfremleswsdpllgkwpdlhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|746385904|ref|wp_039428968.1|假定蛋白[卟啉单胞菌属物种(porphyromonassp.)cot-052oh4946]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdsegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlreddracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqttphyhiekgkiglrfvpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintlkeldacladkgirrghlpkqmigilsqerkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrvencpflllkepktdrqtlvagwkgefhlprgifteavrdcliemgydevgsyrevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskedraeewergkerfrdleawshsaarrikdafagieyaspgnkkkieqllrdlslweafesklkvradkinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleesllsryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|746388969|ref|wp_039431778.1|假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdgegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlreddracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqtsphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintlkeldacladkgirrghlpkqmiailsqehkdmeekirkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekkrltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrmenrpflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsyrevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskeeraeewergkerfrdleawshsaarriedafagieyaspgnkkkieqllrdlslweafesklkvradkinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleeslltryphlpdesfrkmleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqv>gi|746392082|ref|wp_039434803.1|假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkidhehndevdphyhfnhlvrkgkkdryghndnpsfkhhfvdgegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrmddwmlldmlnelvrcpkplydrlreddracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqtsphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaervqgrikrviedvyavydafardeintrdeldacladkgirrghlprqmiailsqehkdmeekirkklqemmadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdasgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrvenrpflllkepktdrqtlvagwkgefhlprgifteavrdcliemghdevasykevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskeeraeewergkerfrdleawsysaarriedafagieyaspgnkkkieqllrdlslweafesklkvradrinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleeslltryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|746399962|ref|wp_039442171.1|假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknldndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphyhfnhlvrkgkkdryghndnpsfkhhfvdsegmvteagllffvslflekrdaiwmqkkirgfkggtgpyeqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlrekdracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyletgdkpyisqttphyhiekgkiglrfvpegqhlwpspevgttrtgrskcaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintlkeldtcladkgirrghlpkqmitilsqerkdmkekirkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdasgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrvencpflllkepktdrqtlvagwkdefhlprgifteavrdcliemgydevgsyrevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskedraeewergmerfrdleawshsaarrikdafagieyaspgnkkkieqllrdlslweafesklkvradkinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeaplatvyieerntkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleesllsryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|746403165|ref|wp_039445055.1|假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mntvpatenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsidrwtkvyghsrrylpflhcfdpdsgiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlkvspdissfitgaytfaceraqsrfadffkpddfllaknrkeqlisvadgkecltvsgfafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvrdkkrelrtagkpvppdlaayikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildhenrffgkllnnmsqpindl>gi|749365741|emb|cen50095.1|保守的假定蛋白[狗咬二氧化碳嗜纤维菌(capnocytophagacanimorsus)]mdekptiikgktfkgnealfahwfryykeyqnfqtfydtenyplvklgkkqadrkrktkiyqqkkndvftllmakhifksvfkqdsidrfsledlyqsreerlgnqerarqtgerntnyiwnktvdlklcdgkitvenvklknvgdfikyeydqrvqafltyeeniewqaflikeskeeenypyvvereieqyekvrreellkevhlieeyilekvkdkeilkkgdnqnfkyyilngllkqvkkekekedvesykvfnlntkpedvdinqlkqkatdleqkafvltyirnkfahnqlpkkfwdycqeecgkiakgktyaeyfvevfkrekealmk>gi|749377015|emb|cen32480.1|保守的假定蛋白[犬咬二氧化碳嗜纤维菌(capnocytophagacynodegmi)]menktslgnniyynpfkpqdksyfagylnaamenidsvfrelgkrlkgkeytsenffdaifkenislveyeryvkllsdyfpmarlldkkevpikerkenfkknfrgiikavrdlrnfythkehgeveitdeifgvldemlkstvltvkkkkiktdktkeilkksiekqldilcqkkleylkdtarkieekrrnqrergekklvprfeysdrrddliaaiyndafdvyidkkkdslkessktkyntesypqqeegdlkipiskngvvfllslflskqevhafkskiagfkatvideatvshrknsicfmatheifshlaykklkrkvrtaeinyseaenaeqlsiyaketlmmqmldelskvpdvvyqnlsedvqktfiedwneylkenngdvgtmeeeqvihpvirkryedkfnyfairfldefaqfptlrfqvhlgnylhdsrpkehlisdrrikekitvfgrlselehkkalfikntetnedrkhywevfpnpnydfpkenisvndkdfpiagsildrekqptagkigikvnllnqkyisevdkavkahqlkqrnnkpsiqniieeivpingsnpkeiivfggqptaylsmndihsilyeffdkwekkkeklekkgekelrkeigkeleekivgkiqtqiqqiidkdinakilkpyqdddstaidkeklikdlkqeqkilqklkneqtarekeyqeciayqeesrkikrsdksrqkylrnqlkrkypevptrkeilyyqekgkvavwlandikrfmptdfknewkgeqhsllqkslayyeqckeelknllpqqkvfkhlpfelgghfqqkylyqfytryldkrlehisglvqqaenfknenkvfkkvenecfkflkkqnythkgldaqaqsvlgypiflergfmdekptiikgktfkgneslftdwfryykeyqnfqtfydtenyplvelekkqadrkretkiyqqkkndvftllmakhifksvfkqdsidrfsledlyqsreerlenqekakqtgerntnyiwnktvdlnlcdgkvtvenvklknvgnfikyeydqrvqtflkyeenikwqaflikeskeeenypyivereieqyekvrreellkevhlieeyilekvkdkeilkkgdnqnfkyyilngllkqlknedvesykvfnlntkpedvninqlkqeatdleqkafvltyirnkfahnqlpkkefwdycqekygkiekektyaeyfaevfkrekealmk>gi|754125679|ref|wp_041758328.1|假定蛋白[扭曲冷弯菌(psychroflexustorquis)]myvlnglltgikqiniedfivlkqntnfdkidfkgiasysvlekktiiliairnkfahnqlpnkiindlanefvkkeknetyanyylkvlkkmisdla>gi|754596085|ref|wp_041986150.1|假定蛋白[狗咬二氧化碳嗜纤维菌(capnocytophagacanimorsus)]mdekptiikgktfkgnealfahwfryykeyqnfqtfydtenyplvklgkkqadrkrktkiyqqkkndvftllmakhifksvfkqdsidrfsledlyqsreerlgnqerarqtgerntnyiwnktvdlklcdgkitvenvklknvgdfikyeydqrvqafltyeeniewqaflikeskeeenypyvvereieqyekvrreellkevhlieeyilekvkdkeilkkgdnqnfkyyilngllkqvkkekekedvesykvfnlntkpedvdinqlkqkatdleqkafvltyirnkfahnqlpkkfwdycqeecgkiakgktyaeyfvevfkrekealmk>gi|754599669|ref|wp_041989581.1|假定蛋白[犬咬二氧化碳嗜纤维菌(capnocytophagacynodegmi)]menktslgnniyynpfkpqdksyfagylnaamenidsvfrelgkrlkgkeytsenffdaifkenislveyeryvkllsdyfpmarlldkkevpikerkenfkknfrgiikavrdlrnfythkehgeveitdeifgvldemlkstvltvkkkkiktdktkeilkksiekqldilcqkkleylkdtarkieekrrnqrergekklvprfeysdrrddliaaiyndafdvyidkkkdslkessktkyntesypqqeegdlkipiskngvvfllslflskqevhafkskiagfkatvideatvshrknsicfmatheifshlaykklkrkvrtaeinyseaenaeqlsiyaketlmmqmldelskvpdvvyqnlsedvqktfiedwneylkenngdvgtmeeeqvihpvirkryedkfnyfairfldefaqfptlrfqvhlgnylhdsrpkehlisdrrikekitvfgrlselehkkalfikntetnedrkhywevfpnpnydfpkenisvndkdfpiagsildrekqptagkigikvnllnqkyisevdkavkahqlkqrnnkpsiqniieeivpingsnpkeiivfggqptaylsmndihsilyeffdkwekkkeklekkgekelrkeigkeleekivgkiqtqiqqiidkdinakilkpyqdddstaidkeklikdlkqeqkilqklkneqtarekeyqeciayqeesrkikrsdksrqkylrnqlkrkypevptrkeilyyqekgkvavwlandikrfmptdfknewkgeqhsllqkslayyeqckeelknllpqqkvfkhlpfelgghfqqkylyqfytryldkrlehisglvqqaenfknenkvfkkvenecfkflkkqnythkgldaqaqsvlgypiflergfmdekptiikgktfkgneslftdwfryykeyqnfqtfydtenyplvelekkqadrkretkiyqqkkndvftllmakhifksvfkqdsidrfsledlyqsreerlenqekakqtgerntnyiwnktvdlnlcdgkvtvenvklknvgnfikyeydqrvqtflkyeenikwqaflikeskeeenypyivereieqyekvrreellkevhlieeyilekvkdkeilkkgdnqnfkyyilngllkqlknedvesykvfnlntkpedvninqlkqeatdleqkafvltyirnkfahnqlpkkefwdycqekygkiekektyaeyfaevfkrekealmk>gi|755251047|gb|kip58950.1|假定蛋白st43_06385[普雷沃菌属物种(prevotellasp.)p5-60]mnipalvenqkkyfgtysvmamlnaqtvldhiqkvadiegeqnennenlwfhpvmshlynakngydkqpektmfiierlqsyfpflkimaenqreysngkykqnrvevnsndifevlkrafgvlkmyrdltnhyktyeeklidgcefltsteqpfsgmiskyytvalrntkerygykaedlafiqdnrykftkdaygkrksqvntgsflslqdyngdttkklhlsgvgialliclfldkqyinlflsrlpifssynaqseerriiirsfginsikqpkdrihseksnksvamdmlnevkrcpdelfttlsaekqsrfriisddhnevlmkrssdrfvplllqyidygklfdhirfhvnmgklryllkadktcidgqtrvrvieqplngfgrleevetmrkqengtfgnsgirirdfenmkrddanpanypyivetythyilennkvemfisdeenptpllpvieddryvvktipscrmstleipamafhmflfgsektekliidvhdrykrlfqamqkeevtaeniasfgiaesdlpqkimdlisgnahgkdvdafirltvddmltdterrikrfkddrksirsadnkmgkrgfkqistgkladflakdivlfqpsvndgenkitglnyrimqsaiavydsgddyeakqqfklmfekarligkgttephpflykvfvrsipanavdfyerylierkfyliglsneikkgnrvdvpfirrdqnkwktpamktlgriysedlpvelprqmfdneikshlkslpqmegidfnnanvtyliaeymkrvlnddfqtfyqwkrnyrymdmlrgeydrkgslqhcftsieereglwkerasrteryrklasnkirsnrqmrnasseeietildkrlsncrneyqksekiirryrvqdallfllakktlteladfdgerfklkeimpdaekgilseimpmsftfekggkiytitsggmklknygdffvlasdkrignllelvgsntvskedimeefkkydqcrpeissivfnlekwafdtypelparvdrkekvdfwsildvlsnnkdinneqsyilrkirnafdhnnypdkgiveikalpeiamsikkafgeyaimk>gi|755254328|gb|kip62088.1|假定蛋白st45_06380[普雷沃菌属物种(prevotellasp.)p5-125]mnipalvenqkkyfgtysvmamlnaqtvldhiqkvadiegeqnennenlwfhpvmshlynakngydkqpektmfiierlqsyfpflkimaenqreysngkykqnrvevnsndifevlkrafgvlkmyrdltnhyktyeeklndgcefltsteqplsgminnyytvalrnmnerygyktedlafiqdkrfkfvkdaygkkksqvntgfflslqdyngdtqkklhlsgvgialliclfldkqyiniflsrlpifssynaqseerriiirsfginsiklpkdrihseksnksvamdmlnevkrcpdelfttlsaekqsrfriisddhnevlmkrssdrfvplllqyidygklfdhirfhvnmgklryllkadktcidgqtrvrvieqplngfgrleeaetmrkqengtfgnsgirirdfenmkrddanpanypyivdtythyilennkvemfindkedsapllpvieddryvvktipscrmstleipamafhmflfgskkteklivdvhnrykrlfqamqkeevtaeniasfgiaesdlpqkildlisgnahgkdvdafirltvddmltdterrikrfkddrksirsadnkmgkrgfkqistgkladflakdivlfqpsvndgenkitglnyrimqsaiavydsgddyeakqqfklmfekarligkgttephpflykvfarsipanavefyerylierkfyltglsneikkgnrvdvpfirrdqnkwktpamktlgriysedlpvelprqmfdneikshlkslpqmegidfnnanvtyliaeymkrvldddfqtfyqwnrnyrymdmlkgeydrkgslqhcftsveereglwkerasrteryrkqasnkirsnrqmrnasseeietildkrlsnsrneyqksekvirryrvqdallfllakktlteladfdgerfklkeimpdaekgilseimpmsftfekggkkytitsegmklknygdffvlasdkrignllelvgsdivskedimeefnkydqcrpeissivfnlekwafdtypelsarvdreekvdfksilkillnnkninkeqsdilrkirnafdhnnypdkgvveikalpeiamsikkafgeyaimk>gi|755255649|gb|kip63359.1|假定蛋白st44_03600[普雷沃菌属物种(prevotellasp.)p5-119]mnipalvenqkkyfgtysvmamlnaqtvldhiqkvadiegeqnennenlwfhpvmshlynakngydkqpektmfiierlqsyfpflkimaenqreysngkykqnrvevnsndifevlkrafgvlkmyrdltnhyktyeeklidgcefltsteqplsgmiskyytvalrntkerygyktedlafiqdnikkitkdaygkrksqvntgfflslqdyngdtqkklhlsgvgialliclfldkqyiniflsrlpifssynaqseerriiirsfginsiklpkdrihseksnksvamdmlnevkrcpdelfttlsaekqsrfriisddhnevlmkrstdrfvplllqyidygklfdhirfhvnmgklryllkadktcidgqtrvrvieqplngfgrleeaetmrkqengtfgnsgirirdfenvkrddanpanypyivdtythyilennkvemfisdkgssapllplieddryvvktipscrmstleipamafhmflfgskkteklivdvhnrykrlfqamqkeevtaeniasfgiaesdlpqkildlisgnahgkdvdafirltvddmltdterrikrfkddrksirsadnkmgkrgfkqistgkladflakdivlfqpsvndgenkitglnyrimqsaiavydsgddyeakqqfklmfekarligkgttephpflykvfarsipanavdfyerylierkfyltglcneikrgnrvdvpfirrdqnkwktpamktlgriysedlpvelprqmfdneikshlkslpqmegidfnnanvtyliaeymkrvlnddfqtfyqwkrnyhymdmlkgeydrkgslqhcftsveereglwkerasrteryrklasnkirsnrqmrnasseeietildkrlsncrneyqksekvirryrvqdallfllakktlteladfdgerfklkeimpdaekgilseimpmsftfekggkkytitsegmklknygdffvlasdkrignllelvgsdivskedimeefnkydqcrpeissivfnlekwafdtypelsarvdreekvdfksilkillnnkninkeqsdilrkirnafdhnnypdkgiveikalpeiamsikkafgeyaimk>gi|755581756|ref|wp_042518169.1|假定蛋白[普雷沃菌属物种(prevotellasp.)p5-119]mnipalvenqkkyfgtysvmamlnaqtvldhiqkvadiegeqnennenlwfhpvmshlynakngydkqpektmfiierlqsyfpflkimaenqreysngkykqnrvevnsndifevlkrafgvlkmyrdltnhyktyeeklidgcefltsteqplsgmiskyytvalrntkerygyktedlafiqdnikkitkdaygkrksqvntgfflslqdyngdtqkklhlsgvgialliclfldkqyiniflsrlpifssynaqseerriiirsfginsiklpkdrihseksnksvamdmlnevkrcpdelfttlsaekqsrfriisddhnevlmkrstdrfvplllqyidygklfdhirfhvnmgklryllkadktcidgqtrvrvieqplngfgrleeaetmrkqengtfgnsgirirdfenvkrddanpanypyivdtythyilennkvemfisdkgssapllplieddryvvktipscrmstleipamafhmflfgskkteklivdvhnrykrlfqamqkeevtaeniasfgiaesdlpqkildlisgnahgkdvdafirltvddmltdterrikrfkddrksirsadnkmgkrgfkqistgkladflakdivlfqpsvndgenkitglnyrimqsaiavydsgddyeakqqfklmfekarligkgttephpflykvfarsipanavdfyerylierkfyltglcneikrgnrvdvpfirrdqnkwktpamktlgriysedlpvelprqmfdneikshlkslpqmegidfnnanvtyliaeymkrvlnddfqtfyqwkrnyhymdmlkgeydrkgslqhcftsveereglwkerasrteryrklasnkirsnrqmrnasseeietildkrlsncrneyqksekvirryrvqdallfllakktlteladfdgerfklkeimpdaekgilseimpmsftfekggkkytitsegmklknygdffvlasdkrignllelvgsdivskedimeefnkydqcrpeissivfnlekwafdtypelsarvdreekvdfksilkillnnkninkeqsdilrkirnafdhnnypdkgiveikalpeiamsikkafgeyaimk>gi|762997475|ref|wp_043894148.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnekpyngtyytledkhfwaaffnlarhnayitlthidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrcgnndnpffkhhfvdregkvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedracfrvpvdilsdeddtdgaeedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldcfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekysdeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqiiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemghdevasykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrdleawshsaarriedafvgieyaswenkkkieqllqdlslwetfesklkvkadkiniaklkkeileakehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpssldaieermglniahrlseevkqaketveriiqa>gi|762999449|ref|wp_043894372.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnerpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrygnndnpffkhhfvdregtvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlceedracfrvpvdilsdeddtdgaeedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekysdeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqmiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwksefhlprgifteavrdcliemghdevgsykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskedraeewesgkerfrlaklkkeileakehpyldfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvyeqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdesfremleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqakemaeriiqa>gi|763000465|ref|wp_043894537.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnerpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrygnndnpffkhhfvdreekvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpidilsdeddtdgaeedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqmiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdreenhrflllkepktdrqtlvagwksefhlprgifteavrdcliemgldevgsykevgfmakavplyferackdrvqpfynypfnvgnilkpkkgrflskekraeewesgkerfrdleawsqstarriedafagikyaspgnkkkieqllqdlslwetfesklkvkadkinlaklkkeileakehpyldfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvqeqgslnvlnhvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|763001609|ref|wp_043894751.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnerpyngtyytledkhfwaaflnlarhnayitlahidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrygnndnpffkhhfvdregtvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpvdilsdeddtdgteedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrftaeaflsvhelmpmmfyyfllrenysdeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqmiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteaardcliemghdevasykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileakehpyldfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdksfremleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpssldaieermglniahrlseevkqakemveriiqv>gi|763003511|ref|wp_043895240.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnekpyngtyytledkhfwaaffnlarhnayitlthidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdthrhfnhlvrkgkkdrygnndnpffkhhfvdregtvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedrarfrvpvdilsdeddtdgaeedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqmiailsqehkdmeekirkklqemmadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemghdevasykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrdleawsqsavrriedafagienasrenkkkieqllqdlslwkafesklkvrgdkiniaklkkeileakehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltrcphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>gi|763006464|ref|wp_043895933.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnerpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdkygnndnpffkhhfvdreetvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfyrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedracfrvpvdilsdeddtdgaeedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldcfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekysdeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqiiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkiridrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemgldevgsykevgfmakavplyferackdrvqpfynypfnvgnilkpkkgrflskekraeewesgkerfrdleawsqstarriedafagikyaspgnkkkieqllqdlslwetfesklkvkadkinlaklkkeileakehpyldfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdiwtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeqaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcafeqtleleeslltrcphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqakemaeriiqa>gi|763187618|ref|wp_044065294.1|假定蛋白[普雷沃菌属物种(prevotellasp.)p5-125]mnipalvenqkkyfgtysvmamlnaqtvldhiqkvadiegeqnennenlwfhpvmshlynakngydkqpektmfiierlqsyfpflkimaenqreysngkykqnrvevnsndifevlkrafgvlkmyrdltnhyktyeeklndgcefltsteqplsgminnyytvalrnmnerygyktedlafiqdkrfkfvkdaygkkksqvntgfflslqdyngdtqkklhlsgvgialliclfldkqyiniflsrlpifssynaqseerriiirsfginsiklpkdrihseksnksvamdmlnevkrcpdelfttlsaekqsrfriisddhnevlmkrssdrfvplllqyidygklfdhirfhvnmgklryllkadktcidgqtrvrvieqplngfgrleeaetmrkqengtfgnsgirirdfenmkrddanpanypyivdtythyilennkvemfindkedsapllpvieddryvvktipscrmstleipamafhmflfgskkteklivdvhnrykrlfqamqkeevtaeniasfgiaesdlpqkildlisgnahgkdvdafirltvddmltdterrikrfkddrksirsadnkmgkrgfkqistgkladflakdivlfqpsvndgenkitglnyrimqsaiavydsgddyeakqqfklmfekarligkgttephpflykvfarsipanavefyerylierkfyltglsneikkgnrvdvpfirrdqnkwktpamktlgriysedlpvelprqmfdneikshlkslpqmegidfnnanvtyliaeymkrvldddfqtfyqwnrnyrymdmlkgeydrkgslqhcftsveereglwkerasrteryrkqasnkirsnrqmrnasseeietildkrlsnsrneyqksekvirryrvqdallfllakktlteladfdgerfklkeimpdaekgilseimpmsftfekggkkytitsegmklknygdffvlasdkrignllelvgsdivskedimeefnkydqcrpeissivfnlekwafdtypelsarvdreekvdfksilkillnnkninkeqsdilrkirnafdhnnypdkgvveikalpeiamsikkafgeyaimk>gi|763200485|ref|wp_044074780.1|假定蛋白[普雷沃菌属物种(prevotellasp.)p5-60]mnipalvenqkkyfgtysvmamlnaqtvldhiqkvadiegeqnennenlwfhpvmshlynakngydkqpektmfiierlqsyfpflkimaenqreysngkykqnrvevnsndifevlkrafgvlkmyrdltnhyktyeeklidgcefltsteqpfsgmiskyytvalrntkerygykaedlafiqdnrykftkdaygkrksqvntgsflslqdyngdttkklhlsgvgialliclfldkqyinlflsrlpifssynaqseerriiirsfginsikqpkdrihseksnksvamdmlnevkrcpdelfttlsaekqsrfriisddhnevlmkrssdrfvplllqyidygklfdhirfhvnmgklryllkadktcidgqtrvrvieqplngfgrleevetmrkqengtfgnsgirirdfenmkrddanpanypyivetythyilennkvemfisdeenptpllpvieddryvvktipscrmstleipamafhmflfgsektekliidvhdrykrlfqamqkeevtaeniasfgiaesdlpqkimdlisgnahgkdvdafirltvddmltdterrikrfkddrksirsadnkmgkrgfkqistgkladflakdivlfqpsvndgenkitglnyrimqsaiavydsgddyeakqqfklmfekarligkgttephpflykvfvrsipanavdfyerylierkfyliglsneikkgnrvdvpfirrdqnkwktpamktlgriysedlpvelprqmfdneikshlkslpqmegidfnnanvtyliaeymkrvlnddfqtfyqwkrnyrymdmlrgeydrkgslqhcftsieereglwkerasrteryrklasnkirsnrqmrnasseeietildkrlsncrneyqksekiirryrvqdallfllakktlteladfdgerfklkeimpdaekgilseimpmsftfekggkiytitsggmklknygdffvlasdkrignllelvgsntvskedimeefkkydqcrpeissivfnlekwafdtypelparvdrkekvdfwsildvlsnnkdinneqsyilrkirnafdhnnypdkgiveikalpeiamsikkafgeyaimk>gi|763360704|ref|wp_044218239.1|假定蛋白[三角棕指藻(phaeodactylibacterxiamenensis)]mtntpkrrtlhrhpsyfgaflniarhnafmimehlstkydmedkntldeaqlpnaklfgclkkrygkpdvtegvsrdlrryfpflnyplflhlekqqnaeqaatydinpedieftlkgffrllnqmrnnyshyisntdygkfdklpvqdiyeaaifrlldrgkhtkrfdvfeskhtrhlesnnseyrprslanspdhentvafvtclflerkyafpflsrldcfrstndaaegdplirkashecytmfccrlpqpklessdilldmvnelgrcpsalynllseedqarfhikreeitgfeedpdeeleqeivlkrhsdrfpyfalryfddteafqtlrfdvylgrwrtkpvykkriygqerdrvltqsirtftrlsrllpiyenvkhdavrqneedgklvnpdvtsqfhkswiqiesddraflsdriehfsphynfgdqviglkfinpdryaaiqnvfpklpgeekkdkdaklvnetadaiistheirslflyhylskkpisagderrfiqvdtetfikqyidtiklffediksgelqpiadppnyqkneplpyvrgdkektqeeraqyrerqkeikerrkelntllqnryglsiqyipsrlreyllgykkvpyeklalqklraqrkevkkrikdiekmrtprvgeqatwlaedivfltppkmhtperkttkhpqklnndqfrimqsslayfsvnkkaikkffqketgiglsnretshpflyridvgrcrgildfytgylkykmdwlddaikkvdnrkhgkkeakkyekylpssiqhktpleldytrlpvylprglfkkaivkalaahadfqvepeednvifcldqlldgdtqdfynwqryyrsalteketdnqlvlahpyaeqilgtiktlegkqknnklgnkakqkikdelidlkrakrrlldreqylravqaedralwlmiqerqkqkaeheeiafdqldlknitkiltesidarlripdtkvditdklplrrygdlrrvakdrrlvnlasyyhvaglseipydlvkkeleeydrrrvaffehvyqfekevydryaaelrnenpkgestyfshweyvavavkhsadthfnelfkekvmqlrnkfhhnefpyfdwllpevekasaalyadrvfdvaegyyqkmrklmrq>gi|769827477|gb|kjj86756.1|假定蛋白m573_117042[中间普雷沃菌(prevotellaintermedia)zt]mkmeddkkttestnmldnkhfwaaflnlarhnvyitvnhinkvlelknkkdqdiiidndqdilaikthwekvngdlnkterlrelmtkhfpfletaiytknkedkeevkqekqaeaqsleslkdclflfleklqearnyyshykysestkepmleegllekmynifddniqlvikdyqhnkdinpdedfkhldrkgqfkysfadnegnitesgllffvslflekkdaiwmqqkltgfkdnreskkkmthevfcrrrmllpklrlestqtqdwilldmlnelircpkslyerlqgeyrkkfnvpfdsadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkliggqkedrhlthklygferiqefakqnrpdewkalvkdldtyetsneryisettphyhlenqkigirfrngnkeiwpslktngennekskykldkpyqaeaflsvhellpmmfyylllkkeepnndkknasivegfikreirdmyklydafangeinnigdlekycedkgipkrhlpkqmvailydepkdmvkeakrkqkemvkdtkkllatlekqtqeeiedggrnirllksgeiarwlvndmmrfqpvqkdnegnplnnskansteyqmlqrslalynkeekptryfrqvnlinssnphpflkwtkweecnnilsfyrnyltkkieflnklkpedweknqyflklkepktnretlvqgwkngfnlprgiftepirewfkrhqndskeyekvealkrvglvtkviplffkeeyfkedaqkeinncvqpfysfpynvgnihkpdekdflpseerkklwgdkkdkfkgykakvkskkltdkekeeyrsylefqswnkferelrlvrnqdivtwllctelidkmkveglnveelqklrlkdidtdtakqeknnilnrimpmqlpvtvyeiddshnivkdrplhtvyieetktkllkqgnfkalvkdrrlnglfsfvdtsskaelkdkpisksvveyelgeyqnarietikdmlllektlikkyeklptdnfsdmlngwlegkdesdkarfqndvkllvavrnafshnqypmrnriafaninpfslssadiseekkldianqlkdkthkiikkiieiekpietke>gi|806787645|gb|kkc50278.1|假定蛋白hr10_10685[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdsegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlrekdrarfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqttphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintlkeldacladkgirrghlpkqmiailsqehkdmeekirkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekkrltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrmenrpflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsyrevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskeeraeewergkerfrdleawshsaarriedafagieyaspgnkkkieqllrdlslweafesklkvradkinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleeslltryphlpdesfrkmleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqv>gi|807048513|ref|wp_046201018.1|假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdsegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlrekdrarfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqttphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintlkeldacladkgirrghlpkqmiailsqehkdmeekirkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekkrltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrmenrpflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsyrevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskeeraeewergkerfrdleawshsaarriedafagieyaspgnkkkieqllrdlslweafesklkvradkinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleeslltryphlpdesfrkmleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqv>gi|835310921|ref|wp_047447901.1|假定蛋白[alistipes属物种zor0009]msneigafrehqfayapgnekqeeatfatyfnlalsnvegmmfgevesnpdkieksldtlppailrqiasfiwlskedhpdkaysteevkvivtdlvrrlcfyrnyfshcfyldtqyfysdelvdttaigeklpynfhhfitnrlfryslpeitlfrwnegerkyeilrdgliffcclflkrgqaerflnelrffkrtdeegrikrtiftkyctreshkhigieeqdflifqdiigdlnrvpkvcdgvvdlskeneryiknretsnesdenkaryrllirekdkfpyylmryivdfgvlpcitfkqndystkegrgqfhyqdaavaqeercynfvvrngnvyysympqaqnvvriselqgtisveelrnmvyasingkdvnksveqylyhlhllyekiltisgqtikegrvdvedyrplldklllrpasngeelrrelrkllpkrvcdllsnrfdcsegvsavekrlkaillrheqlllsqnpalhidkiksvidylylffsddekfrqqptekahrglkdeefqmyhylvgdydshplalwkeleasgrlkpemrkltsatslhglymlclkgtvewcrkqlmsigkgtakveaiadrvglklydklkeytpeqlerevklvvmhgyaaaatpkpkaqaaipskltelrfysflgkremsfaafirqdkkaqklwlrnfytveniktlqkrqaaadaackklynlvgevervhtndkvlvlvaqryrerllnvgskcavtldnperqqkladvyevqnawlsirfddldftlthvnlsnlrkaynliprkhilafkeyldnrvkqklceecrnvrrkedlctccsprysnltswlkenhsessiereaatmmlldverkllsfllderrkaiieygkfipfsalvkecrladaglcgirndvlhdnvisyadaigklsayfpkeaseaveyirrtkevreqrreelmanssq>gi|874269987|gb|akp69887.1|假定蛋白cg08_1741[鸭疫里氏杆菌(riemerellaanatipestifer)]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaiknqpwepyqyclllkipkenrknlvkgweqggislprglfteairetlsedlmlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkreehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdvmlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypatafgevqyhktpirtvyireehtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhtslsslenefralleewkkeyaassmvtdehiafiasvrnafchnqypfykealhapiplftvaqptteekdglgiaeallkvlreyceivksqi>gi|874285978|gb|akp71851.1|假定蛋白cg09_1718[鸭疫里氏杆菌(riemerellaanatipestifer)]mffsfhnaqrvifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaiknqpwepyqyclllkipkenrknlvkgweqggislprglfteairetlsedlmlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkreehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdvmlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypatafgevqyhktpirtvyireehtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhtslsslenefralleewkkeyaassmvtdehiafiasvrnafchnqypfykealhapiplftvaqptteekdglgiaeallkvlreyceivksqi>gi|874285979|gb|akp71852.1|假定蛋白cg09_1721[鸭疫里氏杆菌(riemerellaanatipestifer)]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifnslcilnntdf>gi|877802244|dbj|bar96998.1|假定蛋白pi172_2270[中间普雷沃菌(prevotellaintermedia)]meddkktkestnmldnkhfwaaflnlarhnvyitvnhinkvlelknkkdqdiiidndqdilaikthwekvngdlnkterlrelmtkhfpfletaiytknkedkeevkqekqakaqsfdslkhclflfleklqearnyyshykysestkepmlekellkkmynifddniqlvikdyqhnkdinpdedfkhldrteeefnyyfttnkkgnitasgllffvslflekkdaiwmqqklrgfkdnreskkkmthevfcrsrmllpklrlestqtqdwilldmlnelircpkslyerlqgeyrkkfnvpfdsadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkliggqkedrhlthklygferiqefakqnrtdewkaivkdfdtyetseepyisetaphyhlenqkigirfrndndeiwpslktngennekrkykldkqyqaeaflsvhellpmmfyylllkkeepnndkknasivegfikreirdiyklydafangeinniddlekycedkgipkrhlpkqmvailydehkdmaeeakrkqkemvkdtkkllatlekqtqgeiedggrnirllksgeiarwlvndmmrfqpvqkdnegnplnnskansteyqmlqrslalynkeekptryfrqvnlinssnphpflkwtkweecnnilsfyrsyltkkieflnklkpedweknqyflklkepktnretlvqgwkngfnlprgiftepirewfkrhqndseeyekvetldrvglvtkviplffkkedskdkeeylkkdaqkeinncvqpfygfpynvgnihkpdekdflpseerkklwgdkkykfkgykakvkskkltdkekeeyrsylefqswnkferelrlvrnqdivtwllctelidklkveglnveelkklrlkdidtdtakqeknnilnrvmpmqlpvtvyeiddshnivkdrplhtvyieetktkllkqgnfkalvkdrrlnglfsfvdtssetelksnpiskslveyelgeyqnarietikdmllleetliekyktlptdnfsdmlngwlegkdeadkarfqndvkllvavrnafshnqypmrnriafaninpfslssadtseekkldianqlkdkthkiikriieiekpietke>gi|885008798|gb|akq40303.1|假定蛋白as87_08290[鸭疫里氏杆菌(riemerellaanatipestifer)yb2]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaiknqpwepyqyclllkipkenrknlvkgweqggislprglfteairetlsedlmlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkreehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdvmlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypatafgevqyhktpirtvyireehtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhtslsslenefralleewkkeyaassmvtdehiafiasvrnafchnqypfykealhapiplftvaqptteekdglgiaeallkvlreyceivksqi>gi|896419352|ref|wp_049354263.1|假定蛋白[鸭疫里氏杆菌(riemerellaanatipestifer)]mffsfhnaqrvifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaiknqpwepyqyclllkipkenrknlvkgweqggislprglfteairetlsedlmlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkreehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdvmlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypatafgevqyhktpirtvyireehtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhtslsslenefralleewkkeyaassmvtdehiafiasvrnafchnqypfykealhapiplftvaqptteekdglgiaeallkvlreyceivksqi>gi|914347928|gb|akv64040.1|假定蛋白pga7_00008170[牙龈卟啉单胞菌(porphyromonasgingivalis)]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfadffkpddfvlaknrkeqlisvadgkecltvsglafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhnlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvqdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>gi|914348650|gb|akv64762.1|假定蛋白pga7_00015700[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnekpyngtyytledkhfwaaffnlarhnayitlahidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdkygnndnpffkhhfvdreekvteagllffvslflekrdaiwmqkkirgfkggteayqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkllydrlreedrarfrvpvdilsdeddtdgteedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqllwpspevgatrtgrskyaqdkrftaeaflsvhelmpmmfyyfllrekyseeasaekvqgrikrviedvyavydafardeintrdeldacladkgirrghlprqmiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdreenhrflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrdleawshsaarriedafvgieyaswenkkkieqllqdlslwetfesklkvkadkiniaklkkeileakehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvqeqgslnvlnhvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdesfremleswsdplldkwpdlqrevrlliavrnafshnqypmydetifssirkydpssldaieermglniahrlseevklakemveriiqa>gi|916087402|ref|wp_050955369.1|假定蛋白[中间普雷沃菌(prevotellaintermedia)]meddkktkestnmldnkhfwaaflnlarhnvyitvnhinkvlelknkkdqdiiidndqdilaikthwekvngdlnkterlrelmtkhfpfletaiytknkedkeevkqekqakaqsfdslkhclflfleklqearnyyshykysestkepmlekellkkmynifddniqlvikdyqhnkdinpdedfkhldrteeefnyyfttnkkgnitasgllffvslflekkdaiwmqqklrgfkdnreskkkmthevfcrsrmllpklrlestqtqdwilldmlnelircpkslyerlqgeyrkkfnvpfdsadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkliggqkedrhlthklygferiqefakqnrtdewkaivkdfdtyetseepyisetaphyhlenqkigirfrndndeiwpslktngennekrkykldkqyqaeaflsvhellpmmfyylllkkeepnndkknasivegfikreirdiyklydafangeinniddlekycedkgipkrhlpkqmvailydehkdmaeeakrkqkemvkdtkkllatlekqtqgeiedggrnirllksgeiarwlvndmmrfqpvqkdnegnplnnskansteyqmlqrslalynkeekptryfrqvnlinssnphpflkwtkweecnnilsfyrsyltkkieflnklkpedweknqyflklkepktnretlvqgwkngfnlprgiftepirewfkrhqndseeyekvetldrvglvtkviplffkkedskdkeeylkkdaqkeinncvqpfygfpynvgnihkpdekdflpseerkklwgdkkykfkgykakvkskkltdkekeeyrsylefqswnkferelrlvrnqdivtwllctelidklkveglnveelkklrlkdidtdtakqeknnilnrvmpmqlpvtvyeiddshnivkdrplhtvyieetktkllkqgnfkalvkdrrlnglfsfvdtssetelksnpiskslveyelgeyqnarietikdmllleetliekyktlptdnfsdmlngwlegkdeadkarfqndvkllvavrnafshnqypmrnriafaninpfslssadtseekkldianqlkdkthkiikriieiekpietke>gi|916715432|ref|wp_051322523.1|假定蛋白[酿脓拟杆菌(bacteroidespyogenes)]mallnvrkvenhirkwlgdvallpeksgfhsllttdnlssakwtrfyyksrkflpflemfdsdkksyenrrettecldtidrqkissllkevygklqdirnafshyhiddqsvkhtaliissemhrfienaysfalqktrarftgvfvetdflqaeekgdnkkffaiggnegiklkdnalifliclfldreeafkflsratgfkstkekgflavretfcalccrqpherllsvnpreallmdmlnelnrcpdilfemldekdqksflpllgeeeqahilenslndelceaiddpfemiaslskrvryknrfpylmlryieeknllpfirfridlgclelasypkkmgeennyersvtdhamafgrltdfhnedavlqqitkgitdevrfslyapryaiynnkigfvrtggsdkisfptlkkkggeghcvaytlqntksfgfisiydlrkilllsfldkdkaknivsglleqcekhwkdlsenlfdairtelqkefpvplirytlprskggklvsskladkqekyeseferrkeklteilsekdfdlsqiprrmidewlnvlptsrekklkgyvetlkldcrerlrvfekrekgehpvpprigematdlakdiirmvidqgvkqritsayyseiqrclaqyagddnrrhldsiirelrlkdtknghpflgkvlrpglghteklyqryfeekkewleatfypaaspkrvprfvnpptgkqkelpliirnlmkerpewrdwkqrknshpidlpsqlfeneicrllkdkigkepsgklkwnemfklywdkefpngmqrfyrckrrvevfdkvveyeyseeggnykkyyealidevvrqkissskeksklqvedltlsvrrvfkrainekeyqlrllceddrllfmavrdlydwkeaqldldkidnmlgepvsvsqviqleggqpdavikaecklkdvsklmrycydgrvkglmpyfanheatqeqvemelrhyedhrrrvfnwvfaleksvlkneklrrfyeesqggcehrrcidalrkaslvseeeyeflvhirnksahnqfpdleigklppnvtsgfceciwskykaiicriipfidperrffgklleqk>gi|916915772|ref|wp_051522484.1|假定蛋白[糖解普雷沃菌(prevotellasaccharolytica)]medkpfwaaffnlarhnvyltvnhinklldleklydegkhkeiferedifnisddvmndansngkkrkldikkiwddldtdltrkyqlrelilkhfpfiqpaiigaqtkerttidkdkrststsndslkqtgegdindllslsnvksmffrllqileqlrnyyshvkhsksatmpnfdedllnwmryifidsvnkvkedyssnsvidpntsfshliykdeqgkikpcrypftskdgsinafgllffvslflekqdsiwmqkkipgfkkasenymkmtnevfcrnhillpkirletvydkdwmlldmlnevvrcplslykrltpaaqnkfkvpekssdnanrqeddnpfsrilvrhqnrfpyfvlrffdlnevfttlrfqinlgcyhfaickkqigdkkevhhlirtlygfsrlqnftqntrpeewntlvkttepssgndgktvqgvplpyisytiphyqienekigikifdgdtavdtdiwpsvstekqlnkpdkytltpgfkadvflsvhellpmmfyyqlllcegmlktdagnavekvlidtrnaifnlydafvqekintitdlenylqdkpilighlpkqmidllkghqrdmlkaveqkkamlikdterrlklldkqlkqetdvaakntgtllkngqiadwlvndmmrfqpvkrdkegnpincskansteyqmlqrafafyatdscrlsryftqlhlihsdnshlflsrfeydkqpnliafyaaylkakleflnelqpqnwasdnyflllrapkndrqklaegwkngfnlprglftekiktwfnehktivdisdcdifknrvgqvarlipvffdkkfkdhsqpfyrydfnvgnvskpteanylskgkreelfksyqnkfknnipaektkeyreyknfslwkkferelrliknqdiliwlmcknlfdekikpkkdilepriavsyikldslqtntstagslnalakvvpmtlaihidspkpkgkagnnekenkeftvyikeegtkllkwgnfktlladrrikglfsyiehddidlkqhpltkrrvdleldlyqtcridifqqtlgleaqlldkysdlntdnfyqmligwrkkegiprnikedtdflkdvrnafshnqypdskkiafrrirkfnpkelileeeeglgiatqmykevekvvnrikrielfd>gi|918017236|ref|wp_052309609.1|假定蛋白[糖解普雷沃菌(prevotellasaccharolytica)]mekenvqgshiyyeptdkcfwaafynlarhnayltiahinsfvnskkginnddkvldiiddwskfdndllmgarlnklilkhfpflkaplyqlakrktrkqqgkeqqdyekkgdedpeviqeaianafkmanvrktlhaflkqledlrnhfshynynspakkmevkfddgfcnklyyvfdaalqmvkddnrmnpeinmqtdfehlvrlgrnrkipntfkynftnsdgtinnngllffvslflekrdaiwmqkkikgfkggtenymrmtnevfcrnrmvipklrletdydnhqlmfdmlnelvrcplslykrlkqedqdkfrvpiefldedneadnpyqenansdenpteetdplkntlvrhqhrfpyfvlryfdlnevfkqlrfqinlgcyhfsiydktigertekrhltrtlfgfdrlqnfsvklqpehwknmvkhldteessdkpylsdamphyqienekigihflktdtekketvwpsleveevssnrnkykseknltadaflsthellpmmfyyqllsseektraaagdkvqgvlqsyrkkifdiyddfangtinsmqklderlakdnllrgnmpqqmlailehqepdmeqkakekldrlitetkkrigkledqfkqkvrigkrradlpkvgsiadwlvndmmrfqpakrnadntgvpdskansteyrllqealafysaykdrlepyfrqvnliggtnphpflhrvdwkkcnhllsfyhdyleakeqylshlspadwqkhqhflllkvrkdiqnekkdwkkslvagwkngfnlprglftesiktwfstdadkvqitdtklfenrvgliakliplyydkvyndkpqpfyqypfnindrykpedtrkrftaassklwnekkmlyknaqpdssdkieypqyldflswkklerelrmlrnqdmmvwlmckdlfaqctvegvefadlklsqlevdvnvqdnlnvlnnvssmilplsvypsdaqgnvlrnskplhtvyvqenntkllkqgnfksllkdrrlnglfsfiaaegedlqqhpltknrleyelsiyqtmrisvfeqtlqlekailtrnktlcgnnfnnllnswsehrtdkktlqpdidfliavrnafshnqypmstntvmqgiekfniqtpkleekdglgiasqlakktkdaasrlqniinggtn>gi|919116504|ref|wp_052672145.1|假定蛋白[中间普雷沃菌(prevotellaintermedia)]meddkkttestnmldnkhfwaaflnlarhnvyitvnhinkvlelknkkdqdiiidndqdilaikthwekvngdlnkterlrelmtkhfpfletaiytknkedkeevkqekqaeaqsleslkdclflfleklqearnyyshykysestkepmleegllekmynifddniqlvikdyqhnkdinpdedfkhldrkgqfkysfadnegnitesgllffvslflekkdaiwmqqkltgfkdnreskkkmthevfcrrrmllpklrlestqtqdwilldmlnelircpkslyerlqgeyrkkfnvpfdsadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkliggqkedrhlthklygferiqefakqnrpdewkalvkdldtyetsneryisettphyhlenqkigirfrngnkeiwpslktngennekskykldkpyqaeaflsvhellpmmfyylllkkeepnndkknasivegfikreirdmyklydafangeinnigdlekycedkgipkrhlpkqmvailydepkdmvkeakrkqkemvkdtkkllatlekqtqeeiedggrnirllksgeiarwlvndmmrfqpvqkdnegnplnnskansteyqmlqrslalynkeekptryfrqvnlinssnphpflkwtkweecnnilsfyrnyltkkieflnklkpedweknqyflklkepktnretlvqgwkngfnlprgiftepirewfkrhqndskeyekvealkrvglvtkviplffkeeyfkedaqkeinncvqpfysfpynvgnihkpdekdflpseerkklwgdkkdkfkgykakvkskkltdkekeeyrsylefqswnkferelrlvrnqdivtwllctelidkmkveglnveelqklrlkdidtdtakqeknnilnrimpmqlpvtvyeiddshnivkdrplhtvyieetktkllkqgnfkalvkdrrlnglfsfvdtsskaelkdkpisksvveyelgeyqnarietikdmlllektlikkyeklptdnfsdmlngwlegkdesdkarfqndvkllvavrnafshnqypmrnriafaninpfslssadiseekkldianqlkdkthkiikkiieiekpietke>gi|919932447|ref|wp_052912312.1|假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnekpyngtyytledkhfwaaffnlarhnayitlahidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdkygnndnpffkhhfvdreekvteagllffvslflekrdaiwmqkkirgfkggteayqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkllydrlreedrarfrvpvdilsdeddtdgteedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyitqttphyhiekgkiglrfvpegqllwpspevgatrtgrskyaqdkrftaeaflsvhelmpmmfyyfllrekyseeasaekvqgrikrviedvyavydafardeintrdeldacladkgirrghlprqmiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdreenhrflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrdleawshsaarriedafvgieyaswenkkkieqllqdlslwetfesklkvkadkiniaklkkeileakehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvqeqgslnvlnhvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgalameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdesfremleswsdplldkwpdlqrevrlliavrnafshnqypmydetifssirkydpssldaieermglniahrlseevklakemveriiqa大型蛋白序列:>1假定蛋白[动物溃疡伯格菌(bergeyellazoohelcum)]menktslgnniyynpfkpqdksyfagyfnaamentdsvfrelgkrlkgkeytsenffdaifkenislveyeryvkllsdyfpmarlldkkevpikerkenfkknfkgiikavrdlrnfythkehgeveitdeifgvldemlkstvltvkkkkvktdktkeilkksiekqldilcqkkleylrdtarkieekrrnqrergekelvapfkysdkrddliaaiyndafdvyidkkkdslkesskakyntksdpqqeegdlkipiskngvvfllslfltkqeihafkskiagfkatvideatvseatvshgknsicfmatheifshlaykklkrkvrtaeinygeaenaeqlsvyaketlmmqmldelskvpdvvyqnlsedvqktfiedwneylkenngdvgtmeeeqvihpvirkryedkfnyfairfldefaqfptlrfqvhlgnylhdsrpkenlisdrrikekitvfgrlselehkkalfikntetnedrehyweifpnpnydfpkenisvndkdfpiagsildrekqpvagkigikvkllnqqyvsevdkavkahqlkqrkaskpsiqniieeivpinesnpkeaivfggqptaylsmndihsilyeffdkwekkkeklekkgekelrkeigkelekkivgkiqaqiqqiidkdtnakilkpyqdgnstaidkeklikdlkqeqnilqklkdeqtvrekeyndfiayqdknreinkvrdrnhkqylkdnlkrkypeaparkevlyyrekgkvavwlandikrfmptdfknewkgeqhsllqkslayyeqckeelknllpekvfqhlpfklggyfqqkylyqfytcyldkrleyisglvqqaenfksenkvfkkvenecfkflkkqnythkeldarvqsilgypiflergfmdekptiikgktfkgnealfadwfryykeyqnfqtfydtenyplvelekkqadrkrktkiyqqkkndvftllmakhifksvfkqdsidqfsledlyqsreerlgnqerarqtgerntnyiwnktvdlklcdgkitvenvklknvgdfikyeydqrvqaflkyeeniewqaflikeskeeenypyvvereieqyekvrreellkevhlieeyilekvkdkeilkkgdnqnfkyyilngllkqlknedvesykvfnlntepedvninqlkqeatdleqkafvltyirnkfahnqlpkkefwdycqekygkiekektyaeyfaevfkkekealik>2假定蛋白[中间普雷沃菌(prevotellaintermedia)]meddkkttdsiryelkdkhfwaaflnlarhnvyitvnhinkileegeinrdgyettlkntwneikdinkkdrlskliikhfpfleaatyrlnptdttkqkeekqaeaqsleslrksffvfiyklrdlrnhyshykhskslerpkfeegllekmynifnasirlvkedyqynkdinpdedfkhldrteeefnyyftkdnegnitesgllffvslflekkdaiwmqqklrgfkdnrenkkkmtnevfcrsrmllpklrlqstqtqdwilldmlnelircpkslyerlreedrekfrvpieiadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkqigdykeshhlthklygferiqeftkqnrpdewrkfvktfnsfetskepyipettphyhlenqkigirfrndndkiwpslktnseknekskykldksfqaeaflsvhellpmmfyylllktentdndneietkkkenkndkqekhkieeiienkiteiyalydtfangeiksideleeyckgkdieighlpkqmiailkdehkvmateaerkqeemlvdvqkslesldnqineeienverknsslksgkiaswlvndmmrfqpvqkdnegkplnnskansteyqllqrtlaffgseherlapyfkqtkliessnphpflkdtewekcnnilsfyrsyleakknfleslkpedweknqyflklkepktkpktlvqgwkngfnlprgiftepirkwfmkhrenitvaelkrvglvakviplffseeykdsvqpfynyhfnvgninkpdeknflnceerrellrkkkdefkkmtdkekeenpsylefkswnkferelrlvrnqdivtwllcmelfnkkkikelnvekiylknintnttkkeknteekngeeknikeknnilnrimpmrlpikvygrenfsknkkkkirrntfftvyieekgtkllkqgnfkalerdrrlgglfsfvktpskaesksntisklrveyelgeyqkarieiikdmlalektlidkynsldtdnfnkmltdwlelkgepdkasfqndvdlliavrnafshnqypmrnriafaninpfslssantseekglgianqlkdkthktiekiieiekpietke>3假定蛋白[颊普雷沃菌(prevotellabuccae)]mqkqdklfvdrkknaifafpkyitimenkekpepiyyeltdkhfwaaflnlarhnvyttinhinrrleiaelkddgymmgikgswneqakkldkkvrlrdlimkhfpfleaaayemtnskspnnkeqrekeqsealslnnlknvlfifleklqvlrnyyshykyseespkpifetsllknmykvfdanvrlvkrdymhhenidmqrdfthlnrkkqvgrtkniidspnfhyhfadkegnmtiagllffvslfldkkdaiwmqkklkgfkdgrnlreqmtnevfcrsrislpklklenvqtkdwmqldmlnelvrcpkslyerlrekdresfkvpfdifsddynaeeepfkntlvrhqdrfpyfvlryfdlneifeqlrfqidlgtyhfsiynkrigdedevrhlthhlygfariqdfapqnqpeewrklvkdldhfetsqepyisktaphyhlenekigikfcsahnnlfpslqtdktcngrskfnlgtqftaeaflsvhellpmmfyyllltkdysrkesadkvegiirkeisniyaiydafanneinsiadltrrlqntnilqghlpkqmisilkgrqkdmgkeaerkigemiddtqrrldllckqtnqkirigkrnagllksgkiadwlvndmmrfqpvqkdqnnipinnskansteyrmlqralalfgsenfrlkayfnqmnlvgndnphpflaetqwehqtnilsfyrnylearkkylkglkpqnwkqyqhflilkvqktnrntlvtgwknsfnlprgiftqpirewfekhnnskriydqilsfdrvgfvakaiplyfaeeykdnvqpfydypfnignrlkpkkrqfldkkervelwqknkelfknypsekkktdlayldflswkkferelrliknqdivtwlmfkelfnmatveglkigeihlrdidtntaneesnnilnrimpmklpvktyetdnkgnilkerplatfyieetetkvlkqgnfkalvkdrrlnglfsfaettdlnleehpisklsvdlelikyqttrisifemtlglekklidkystlptdsfrnmlerwlqckanrpelknyvnsliavrnafshnqypmydatlfaevkkftlfpsvdtkkielniapqlleivgkaikeieksenkn>4假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mntvpasenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsvdrwtkvyghsrrylpflhyfdpdsqiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlevspdissfitgtyslacgraqsrfavffkpddfvlaknrkeqlisvadgkecltvsgfafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsensldeesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmdqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelrlldpssghpflsatmetahrytegfykcylekkrewlakifyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskvmellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvrdkkrelrtagkpvppdlaadikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildpenrffgkllnnmsqpindl>5假定蛋白[酿脓拟杆菌(bacteroidespyogenes)]mesiknsqkstgktlqkdppyfglylnmallnvrkvenhirkwlgdvallpeksgfhsllttdnlssakwtrfyyksrkflpflemfdsdkksyenrretaecldtidrqkissllkevygklqdirnafshyhiddqsvkhtaliissemhrfienaysfalqktrarftgvfvetdflqaeekgdnkkffaiggnegiklkdnalifliclfldreeafkflsratgfkstkekgflavretfcalccrqpherllsvnpreallmdmlnelnrcpdilfemldekdqksflpllgeeeqahilenslndelceaiddpfemiaslskrvryknrfpylmlryieeknllpfirfridlgclelasypkkmgeennyersvtdhamafgrltdfhnedavlqqitkgitdevrfslyapryaiynnkigfvrtsgsdkisfptlkkkggeghcvaytlqntksfgfisiydlrkilllsfldkdkaknivsglleqcekhwkdlsenlfdairtelqkefpvplirytlprskggklvsskladkqekyeseferrkeklteilsekdfdlsqiprrmidewlnvlptsrekklkgyvetlkldcrerlrvfekrekgehplpprigematdlakdiirmvidqgvkqritsayyseiqrclaqyagddnrrhldsiirelrlkdtknghpflgkvlrpglghteklyqryfeekkewleatfypaaspkrvprfvnpptgkqkelpliirnlmkerpewrdwkqrknshpidlpsqlfeneicrllkdkigkepsgklkwnemfklywdkefpngmqrfyrckrrvevfdkvveyeyseeggnykkyyealidevvrqkissskeksklqvedltlsvrrvfkrainekeyqlrllceddrllfmavrdlydwkeaqldldkidnmlgepvsvsqviqleggqpdavikaecklkdvsklmrycydgrvkglmpyfanheatqeqvemelrhyedhrrrvfnwvfaleksvlkneklrrfyeesqggcehrrcidalrkaslvseeeyeflvhirnksahnqfpdleigklppnvtsgfceciwskykaiicriipfidperrffgklleqk>6假定蛋白[alistipes属物种zor0009]msneigafrehqfayapgnekqeeatfatyfnlalsnvegmmfgevesnpdkieksldtlppailrqiasfiwlskedhpdkaysteevkvivtdlvrrlcfyrnyfshcfyldtqyfysdelvdttaigeklpynfhhfitnrlfryslpeitlfrwnegerkyeilrdgliffcclflkrgqaerflnelrffkrtdeegrikrtiftkyctreshkhigieeqdflifqdiigdlnrvpkvcdgvvdlskeneryiknretsnesdenkaryrllirekdkfpyylmryivdfgvlpcitfkqndystkegrgqfhyqdaavaqeercynfvvrngnvyysympqaqnvvriselqgtisveelrnmvyasingkdvnksveqylyhlhllyekiltisgqtikegrvdvedyrplldklllrpasngeelrrelrkllpkrvcdllsnrfdcsegvsavekrlkaillrheqlllsqnpalhidkiksvidylylffsddekfrqqptekahrglkdeefqmyhylvgdydshplalwkeleasgrlkpemrkltsatslhglymlclkgtvewcrkqlmsigkgtakveaiadrvglklydklkeytpeqlerevklvvmhgyaaaatpkpkaqaaipskltelrfysflgkremsfaafirqdkkaqklwlrnfytveniktlqkrqaaadaackklynlvgevervhtndkvlvlvaqryrerllnvgskcavtldnperqqkladvyevqnawlsirfddldftlthvnlsnlrkaynliprkhilafkeyldnrvkqklceecrnvrrkedlctccsprysnltswlkenhsessiereaatmmlldverkllsfllderrkaiieygkfipfsalvkecrladaglcgirndvlhdnvisyadaigklsayfpkeaseaveyirrtkevreqrreelmanssq>7假定蛋白[普雷沃菌属物种(prevotellasp.)ma2016]mskeckkqrqekkrrlqkanfsisltgkhvfgayfnmartnfvktinyilpiagvrgnysenqinkmlhalfliqagrneeltteqkqwekklrlnpeqqtkfqkllfkhfpvlgpmmadvadhkaylnkkkstvqtedetfamlkgvsladcldiiclmadtltecrnfythkdpynkpsqladqylhqemiakkldkvvvasrrilkdreglsvnevefltgidhlhqevlkdefgnakvkdgkvmktfveyddfyfkisgkrlvngytvttkddkpvnvntmlpalsdfgllyfcvlflskpyaklfidevrlfeyspfddkenmimsemlsiyrirtprlhkidshdskatlamdifgelrrcpmelynlldknagqpffhdevkhpnshtpdvskrlryddrfptlalryidetelfkrirfqlqlgsfrykfydkencidgrvrvrriqkeingygrmqevadkrmdkwgdliqkreersvkleheelyinldqfledtadstpyvtdrrpaynihanriglywedsqnpkqykvfdengmyipelvvtedkkapikmpaprcalsvydlpamlfyeylreqqdnefpsaeqviieyeddyrkffkavaegklkpfkrpkefrdflkkeypklrmadipkklqlflcshglcynnkpetvyerldrltlqhleerelhiqnrlehyqkdrdmignkdnqygkksfsdvrhgalarylaqsmmewqptklkdkekghdkltglnynvltaylatyghpqvpeegftprtleqvlinahliggsnphpfinkvlalgnrnieelylhyleeelkhirsriqslssnpsdkalsalpfihhdrmryhertseemmalaaryttiqlpdglftpyileilqkhytensdlqnalsqdvpvklnptcnaaylitlfyqtvlkdnaqpfylsdktytrnkdgekaesfsfkrayelfsvlnnnkkdtfpfemiplfltsdeiqerlsaklldgdgnpvpevgekgkpatdsqgntiwkrriysevddyaekltdrdmkisfkgeweklprwkqdkiikrrdetrrqmrdellqrmpryirdikdnertlrryktqdmvlfllaekmftniiseqssefnwkqmrlskvcneaflrqtltfrvpvtvgettiyveqenmslknygefyrfltddrlmsllnnivetlkpnengdlvirhtdlmselaaydqyrstifmliqsienliitnnavlddpdadgfwvredlpkrnnfasllelinqlnnveltdderkllvairnafshnsynidfslikdvkhlpevakgilqhlqsmlgveitk>8假定蛋白[鸭疫里氏杆菌(riemerellaanatipestifer)]mekpllpnvytlkhkffwgaflniarhnafitichineqlglktpsnddkivdvvcetwnnilnndhdllkksqltelilkhfpfltamcyhppkkegkkkghqkeqqkekeseaqsqaealnpskliealeilvnqlhslrnyyshykhkkpdaekdifkhlykafdaslrmvkedykahftvnltrdfahlnrkgknkqdnpdfnryrfekdgfftesgllfftnlfldkrdaywmlkkvsgfkashkqrekmttevfcrsrillpklrlesrydhnqmlldmlselsrcpkllyeklseenkkhfqveadgfldeieeeqnpfkdtlirhqdrfpyfalryldlnesfksirfqvdlgtyhyciydkkigdeqekrhltrtllsfgrlqdfteinrpqewkaltkdldyketsnqpfiskttphyhitdnkigfrlgtskelypsleikdganriakypynsgfvahafisvhellplmfyqhltgksedllketvrhiqriykdfeeerintiedlekanqgrlplgafpkqmlgllqnkqpdlsekakikiekliaetkllshrlntklksspklgkrrekliktgvladwlvkdfmrfqpvaydaqnqpiksskanstefwfirralalyggeknrlegyfkqtnligntnphpflnkfnwkacrnlvdfyqqyleqrekfleaiknqpwepyqyclllkipkenrknlvkgweqggislprglfteairetlsedlmlskpirkeikkhgrvgfisraitlyfkekyqdkhqsfynlsykleakapllkreehyeywqqnkpqsptesqrlelhtsdrwkdyllykrwqhlekklrlyrnqdvmlwlmtleltknhfkelnlnyhqlklenlavnvqeadaklnplnqtlpmvlpvkvypatafgevqyhktpirtvyireehtkalkmgnfkalvkdrrlnglfsfikeendtqkhpisqlrlrreleiyqslrvdafketlsleekllnkhtslsslenefralleewkkeyaassmvtdehiafiasvrnafchnqypfykealhapiplftvaqptteekdglgiaeallkvlreyceivksqi>9假定蛋白[桔红色普雷沃菌(prevotellaaurantiaca)]meddkkttgsisyelkdkhfwaaflnlarhnvyitinhinklleireidndekvldiktlwqkgnkdlnqkarlrelmtkhfpfletaiytknkedkkevkqekqaeaqsleslkdclflfldklqearnyyshykysefskepefeegllekmynifgnniqlvindyqhnkdinpdedfkhldrkgqfkysfadnegnitesgllffvslflekkdaiwmqqklngfkdnlenkkkmthevfcrsrilmpklrlestqtqdwilldmlnelircpkslyerlqgddrekfkvpfdpadedynaeqepfkntlirhqdrfpyfvlryfdyneifknlrfqidlgtyhfsiykkliggqkedrhlthklygferiqefakqnrpdewkaivkdldtyetsnkryisettphyhlenqkigirfrngnkeiwpslktndennekskykldkqyqaeaflsvhellpmmfyylllkkekpnndeinasivegfikreirnifklydafangeinniddlekycadkgipkrhlpkqmvailydehkdmvkeakrkqkemvkdtkkllatlekqtqkekeddgrnvkllksgeiarwlvndmmrfqpvqkdnegkplnnskansteyqmlqrslalynneekptryfrqvnliesnnphpflkwtkweecnniltfyysyltkkieflnklkpedwkknqyflklkepktnretlvqgwkngfnlprgiftepirewfkrhqnnskeyekvealdrvglvtkviplffkeeyfkdkeenfkedtqkeindcvqpfynfpynvgnihkpkekdflhreerielwdkkkdkfkgykekikskkltekdkeefrsylefqswnkferelrlvrnqdivtwllckelidklkidelnieelkklrlnnidtdtakkeknnilnrvmpmelpvtvyeiddshkivkdkplhtiyikeaetkllkqgnfkalvkdrrlnglfsfvktnseaeskrnpisklrveyelgeyqearieiiqdmlaleeklinkykdlptnkfsemlnswlegkdeadkarfqndvdfliavrnafshnqypmhnkiefanikpfslytannseekglgianqlkdktkettdkikkiekpietke>10假定蛋白[糖解普雷沃菌(prevotellasaccharolytica)]medkpfwaaffnlarhnvyltvnhinklldleklydegkhkeiferedifnisddvmndansngkkrkldikkiwddldtdltrkyqlrelilkhfpfiqpaiigaqtkerttidkdkrststsndslkqtgegdindllslsnvksmffrllqileqlrnyyshvkhsksatmpnfdedllnwmryifidsvnkvkedyssnsvidpntsfshliykdeqgkikpcrypftskdgsinafgllffvslflekqdsiwmqkkipgfkkasenymkmtnevfcrnhillpkirletvydkdwmlldmlnevvrcplslykrltpaaqnkfkvpekssdnanrqeddnpfsrilvrhqnrfpyfvlrffdlnevfttlrfqinlgcyhfaickkqigdkkevhhlirtlygfsrlqnftqntrpeewntlvkttepssgndgktvqgvplpyisytiphyqienekigikifdgdtavdtdiwpsvstekqlnkpdkytltpgfkadvflsvhellpmmfyyqlllcegmlktdagnavekvlidtrnaifnlydafvqekintitdlenylqdkpilighlpkqmidllkghqrdmlkaveqkkamlikdterrlklldkqlkqetdvaakntgtllkngqiadwlvndmmrfqpvkrdkegnpincskansteyqmlqrafafyatdscrlsryftqlhlihsdnshlflsrfeydkqpnliafyaaylkakleflnelqpqnwasdnyflllrapkndrqklaegwkngfnlprglftekiktwfnehktivdisdcdifknrvgqvarlipvffdkkfkdhsqpfyrydfnvgnvskpteanylskgkreelfksyqnkfknnipaektkeyreyknfslwkkferelrliknqdiliwlmcknlfdekikpkkdilepriavsyikldslqtntstagslnalakvvpmtlaihidspkpkgkagnnekenkeftvyikeegtkllkwgnfktlladrrikglfsyiehddidlkqhpltkrrvdleldlyqtcridifqqtlgleaqlldkysdlntdnfyqmligwrkkegiprnikedtdflkdvrnafshnqypdskkiafrrirkfnpkelileeeeglgiatqmykevekvvnrikrielfd>11假定蛋白[拟香味类香味菌(myroidesodoratimimus)]mkdilttdttekqnrfyshkiadkyffggyfnlasnniyevfeevnkrntfgklakrdngnlknyiihvfkdelsisdfekrvaifasyfpiletvdkksikernrtidltlsqrirqfremlislvtavdqlrnfythyhhsdivienkvldflnssfvstalhvkdkylktdktkeflketiaaeldilieaykkkqiekkntrfkankredilnaiyneafwsfindkdkdkdketvvakgadayfeknhhksndpdfalnisekgivyllsffltnkemdslkanltgfkgkvdresgnsikymatqriysfhtyrglkqkirtseegvketllmqmidelskvpnvvyqhlsttqqnsfiedwneyykdyeddvetddlsrvihpvirkryedrfnyfairfldeffdfptlrfqvhlgdyvhdrrtkqlgkvesdriikekvtvfarlkdinsakasyfhsleeqdkeeldnkwtlfpnpsydfpkehtlqhqgeqknagkigiyvklrdtqykekaaleearkslnpkersatkaskydiitqiieandnvksekplvftgqpiaylsmndihsmlfslltdnaelkktpeeveaklidqigkqineilskdtdtkilkkykdndlketdtdkitrdlardkeeieklileqkqraddynytsstkfnidksrkrkhllfnaekgkigvwlandikrfmfkeskskwkgyqhtelqklfayfdtsksdlelilsnmvmvkdypielidlvkksrtlvdflnkylearleyienvitrvknsigtpqfktvrkecftflkksnytvvsldkqverilsmplfiergfmddkptmlegksykqhkekfadwfvhykensnyqnfydtevyeittedkrekakvtkkikqqqkndvftlmmvnymleevlklssndrlslnelyqtkeerivnkqvakdtqernknyiwnkvvdlqlcdglvhidnvklkdignfrkyendsrvkefltyqsdivwsaylsnevdsnklyvierqldnyesirskellkevqeiecsvynqvankeslkqsgnenfkqyvlqgllpigmdvremlilstdvkfkkeeiiqlgqageveqdlysliyirnkfahnqlpikeffdfcennyrsisdneyyaeyymeifrsikekyan>12假定蛋白[柱状黄杆菌(flavobacteriumcolumnare)]mssknesynkqktfnhykqedkyffggflnnaddnlrqvgkefktrinfnhnnnelasvfkdyfnkeksvakrehalnllsnyfpvleriqkhtnhnfeqtreifellldtikklrdyythhyhkpitinpkiydflddtlldvlitikkkkvkndtsrellkeklrpeltqlknqkreelikkgkklleenlenavfnhclrpfleenktddkqnktvslrkyrkskpneetsitltqsglvflmsfflhrkefqvftsglegfkakvntikeeeislnknnivymithwsysyynfkglkhriktdqgvstleqnntthsltntntkealltqivdylskvpneiyetlsekqqkefeedineymrenpenedstfssivshkvirkryenkfnyfamrfldeyaelptlrfmvnfgdyikdrqkkilesiqfdseriikkeihlfeklslvteykknvylketsnidlsrfplfpnpsyvmannnipfyidsrsnnldeylnqkkkaqsqnkkrnltfekynkeqskdaiiamlqkeigvkdlqqrstigllscnelpsmlyevivkdikgaelenkiaqkireqyqsirdftldspqkdnipttliktintdssvtfenqpidiprlknaiqkeltltqekllnvkeheievdnynrnkntykfknqpknkvddkklqrkyvfyrneirqeanwlasdlihfmknkslwkgymhnelqsflaffedkkndcialletvfnlkedciltkglknlflkhgnfidfykeylklkedflntestflengliglppkilkkelskrfkyifivfqkrqfiikeleekknnlyadainlsrgifdekptmipfkkpnpdefaswfvasyqynnyqsfyeltpdiverdkkkkyknlrainkvkiqdyylklmvdtlyqdlfnqpldkslsdfyvskaerekikadakayqkrndsslwnkvihlslqnnritanpklkdigkykralqdekiatlltyddrtwtyalqkpekenendykelhytalnmelqeyekvrskellkqvqelekqileeytdflstqihpadferegnpnfkkylahsileneddldklpekveamreldetitnpiikkaivliiirnkmahnqyppkfiydlanrfvpkkeeeyfatyfnrvfetitkelwenkekkdktqv>13假定蛋白[酿脓拟杆菌(bacteroidespyogenes)]mallnvrkvenhirkwlgdvallpeksgfhsllttdnlssakwtrfyyksrkflpflemfdsdkksyenrrettecldtidrqkissllkevygklqdirnafshyhiddqsvkhtaliissemhrfienaysfalqktrarftgvfvetdflqaeekgdnkkffaiggnegiklkdnalifliclfldreeafkflsratgfkstkekgflavretfcalccrqpherllsvnpreallmdmlnelnrcpdilfemldekdqksflpllgeeeqahilenslndelceaiddpfemiaslskrvryknrfpylmlryieeknllpfirfridlgclelasypkkmgeennyersvtdhamafgrltdfhnedavlqqitkgitdevrfslyapryaiynnkigfvrtggsdkisfptlkkkggeghcvaytlqntksfgfisiydlrkilllsfldkdkaknivsglleqcekhwkdlsenlfdairtelqkefpvplirytlprskggklvsskladkqekyeseferrkeklteilsekdfdlsqiprrmidewlnvlptsrekklkgyvetlkldcrerlrvfekrekgehpvpprigematdlakdiirmvidqgvkqritsayyseiqrclaqyagddnrrhldsiirelrlkdtknghpflgkvlrpglghteklyqryfeekkewleatfypaaspkrvprfvnpptgkqkelpliirnlmkerpewrdwkqrknshpidlpsqlfeneicrllkdkigkepsgklkwnemfklywdkefpngmqrfyrckrrvevfdkvveyeyseeggnykkyyealidevvrqkissskeksklqvedltlsvrrvfkrainekeyqlrllceddrllfmavrdlydwkeaqldldkidnmlgepvsvsqviqleggqpdavikaecklkdvsklmrycydgrvkglmpyfanheatqeqvemelrhyedhrrrvfnwvfaleksvlkneklrrfyeesqggcehrrcidalrkaslvseeeyeflvhirnksahnqfpdleigklppnvtsgfceciwskykaiicriipfidperrffgklleqk>14假定蛋白[狗咬二氧化碳嗜纤维菌(capnocytophagacanimorsus)]mkniqrlgkgnefspfkkedkfyfggflnlannniedffkeiitrfgivitdenkkpketfgekilneifkkdisivdyekwvnifadyfpftkylslyleemqfknrvicfrdvmkellktvealrnfythydhepikiedrvfyfldkvlldvsltvknkylktdktkeflnqhigeelkelckqrkdylvgkgkridkeseiingiynnafkdfickrekqddkenhnsvekilcnkepqnkkqkssatvwelcskssskyteksfpnrendkhclevpisqkgivfllsfflnkgeiyaltsnikgfkakitkeepvtydknsirymathrmfsflaykglkrkirtseinynedgqasstyeketlmlqmldelnkvpdvvyqnlsedvqktfiedwneylkenngdvgtmeeeqvihpvirkryedkfnyfairfldefaqfptlrfqvhlgnylcdkrtkqicdttterevkkkitvfgrlselenkkaiflnereeikgwevfpnpsydfpkenisvnykdfpivgsildrekqpvsnkigirvkiadelqreidkaikekklrnpknrkanqdekqkerlvneivstnsneqgepvvfigqptaylsmndihsvlyeflinkisgealetkivekietqikqiigkdattkilkpytnansnsinrekllrdleqeqqilktlleeqqqrekdkkdkkskrkhelypsekgkvavwlandikrfmpkafkeqwrgyhhsllqkylayyeqskeelknllpkevfkhfpfklkgyfqqqylnqfytdylkrrlsyvnelllniqnfkndkdalkatekecfkffrkqnyiinpiniqiqsilvypiflkrgfldekptmidrekfkenkdteladwfmhyknykednyqkfyayplekveekekfkrnkqinkqkkndvytlmmveyiiqkifgdkfveenplvlkgifqskaerqqnnthaattqernlngilnqpkdikiqgkitvkgvklkdignfrkyeidqrvntfldyeprkewmaylpndwkekekqgqlppnnvidrqiskyetvrskillkdvqelekiisdeikeehrhdlkqgkyynfkyyilngllrqlknenvenykvfklntnpekvnitqlkqeatdleqkafvltyirnkfahnqlpkkefwdycqekygkiekektyaeyfaevfkrekealik>15假定蛋白[犬咬二氧化碳嗜纤维菌(capnocytophagacynodegmi)]menktslgnniyynpfkpqdksyfagylnaamenidsvfrelgkrlkgkeytsenffdaifkenislveyeryvkllsdyfpmarlldkkevpikerkenfkknfrgiikavrdlrnfythkehgeveitdeifgvldemlkstvltvkkkkiktdktkeilkksiekqldilcqkkleylkdtarkieekrrnqrergekklvprfeysdrrddliaaiyndafdvyidkkkdslkessktkyntesypqqeegdlkipiskngvvfllslflskqevhafkskiagfkatvideatvshrknsicfmatheifshlaykklkrkvrtaeinyseaenaeqlsiyaketlmmqmldelskvpdvvyqnlsedvqktfiedwneylkenngdvgtmeeeqvihpvirkryedkfnyfairfldefaqfptlrfqvhlgnylhdsrpkehlisdrrikekitvfgrlselehkkalfikntetnedrkhywevfpnpnydfpkenisvndkdfpiagsildrekqptagkigikvnllnqkyisevdkavkahqlkqrnnkpsiqniieeivpingsnpkeiivfggqptaylsmndihsilyeffdkwekkkeklekkgekelrkeigkeleekivgkiqtqiqqiidkdinakilkpyqdddstaidkeklikdlkqeqkilqklkneqtarekeyqeciayqeesrkikrsdksrqkylrnqlkrkypevptrkeilyyqekgkvavwlandikrfmptdfknewkgeqhsllqkslayyeqckeelknllpqqkvfkhlpfelgghfqqkylyqfytryldkrlehisglvqqaenfknenkvfkkvenecfkflkkqnythkgldaqaqsvlgypiflergfmdekptiikgktfkgneslftdwfryykeyqnfqtfydtenyplvelekkqadrkretkiyqqkkndvftllmakhifksvfkqdsidrfsledlyqsreerlenqekakqtgerntnyiwnktvdlnlcdgkvtvenvklknvgnfikyeydqrvqtflkyeenikwqaflikeskeeenypyivereieqyekvrreellkevhlieeyilekvkdkeilkkgdnqnfkyyilngllkqlknedvesykvfnlntkpedvninqlkqeatdleqkafvltyirnkfahnqlpkkefwdycqekygkiekektyaeyfaevfkrekealmk>16假定蛋白[金黄杆菌属物种yr477]metqtighgiaydhskiqdkhffggflnlaennikavlkafsekfnvgnvdvkqfadvslkdnlpdndfqkrvsflkmyfpvvdfinipnnrakfrsdlttlfksvdqlrnfythyyhkpldfdaslfillddifartakevrdqkmkddktrqllskslseelqkgyelqlerlkelnrlgkkvnihdqlgikngvlnnafnhliykdgesfktkltyssaltsfesaengieisqsgllfllsmflkrkeiedlknrnkgfkakvvidedgkvnglkfmathwvfsylcfkglksklstefheetlliqiidelskvpdelycafdketrdkfiedineyvkeghqdfsledakvihpvirkryenkfnyfairfldefvkfpslrfqvhvgnyvhdrriknidgttfetervvkdrikvfgrlseissykaqylssvsdkhdetgweifpnpsyvfinnnipihisvdtsfkkeiadfkklrraqvpdelkirgaekkrkfeitqmigsksvlnqeepiallslneipallyeilingkepaeieriikdklnerqdviknynpenwlpasqisrrlrsnkgeriintdkllqlvtkellvteqklkiisdnrealkqkkegkyirkfiftnselgreaiwladdikrfmpadvrkewkgyqhsqlqqslafynsrpkealailesswnlkdekiiwnewilksftqnkffdafyneylkgrkkyfaflsehivqytsnaknlqkfikqqmpkdlfekrhyiiedlqteknkilskpfifprgifdkkptfikgvkvedspesfanwyqygyqkdhqfqkfydwkrdysdvflehlgkpfinngdrrtlgmeelkeriiikqdlkikkikiqdlflrliaenlfqkvfkysaklplsdfyltqeermekenmaalqnvreegdkspniikdnfiwskmipykkgqiienavklkdigklnvlslddkvqtllsyddakpwskialenefsigensyevirreklfkeiqqfeseilfrsgwdginhpaqlednrnpkfkmyivngilrksaglysqgediwfeynadfnnldadvletkselvqlaflvtairnkfahnqlpakefyfyirakygfadepsvalvylnftkyainefkkvmi>17假定蛋白[三角棕指藻(phaeodactylibacterxiamenensis)]mtntpkrrtlhrhpsyfgaflniarhnafmimehlstkydmedkntldeaqlpnaklfgclkkrygkpdvtegvsrdlrryfpflnyplflhlekqqnaeqaatydinpedieftlkgffrllnqmrnnyshyisntdygkfdklpvqdiyeaaifrlldrgkhtkrfdvfeskhtrhlesnnseyrprslanspdhentvafvtclflerkyafpflsrldcfrstndaaegdplirkashecytmfccrlpqpklessdilldmvnelgrcpsalynllseedqarfhikreeitgfeedpdeeleqeivlkrhsdrfpyfalryfddteafqtlrfdvylgrwrtkpvykkriygqerdrvltqsirtftrlsrllpiyenvkhdavrqneedgklvnpdvtsqfhkswiqiesddraflsdriehfsphynfgdqviglkfinpdryaaiqnvfpklpgeekkdkdaklvnetadaiistheirslflyhylskkpisagderrfiqvdtetfikqyidtiklffediksgelqpiadppnyqkneplpyvrgdkektqeeraqyrerqkeikerrkelntllqnryglsiqyipsrlreyllgykkvpyeklalqklraqrkevkkrikdiekmrtprvgeqatwlaedivfltppkmhtperkttkhpqklnndqfrimqsslayfsvnkkaikkffqketgiglsnretshpflyridvgrcrgildfytgylkykmdwlddaikkvdnrkhgkkeakkyekylpssiqhktpleldytrlpvylprglfkkaivkalaahadfqvepeednvifcldqlldgdtqdfynwqryyrsalteketdnqlvlahpyaeqilgtiktlegkqknnklgnkakqkikdelidlkrakrrlldreqylravqaedralwlmiqerqkqkaeheeiafdqldlknitkiltesidarlripdtkvditdklplrrygdlrrvakdrrlvnlasyyhvaglseipydlvkkeleeydrrrvaffehvyqfekevydryaaelrnenpkgestyfshweyvavavkhsadthfnelfkekvmqlrnkfhhnefpyfdwllpevekasaalyadrvfdvaegyyqkmrklmrq>18假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mteqnekpyngtyytledkhfwaaffnlarhnayitlthidrqlayskaditndedilffkgqwknldndlerkarlrslilkhfsflegaaygkklfesqssgnksskkkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhpesselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdrcgnndnpffkhhfvdregkvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkslydrlreedracfrvpvdilsdeddtdgaeedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykknigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldcfetgdkpyitqttphyhiekgkiglrfvpegqhlwpspevgatrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekysdeasaervqgrikrviedvyavydafargeidtldrldacladkgirrghlprqiiailsqehkdmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylkarkaflqsigrsdrvenhrflllkepktdrqtlvagwkgefhlprgifteavrdcliemghdevasykevgfmakavplyferackdrvqpfydypfnvgnslkpkkgrflskekraeewesgkerfrdleawshsaarriedafvgieyaswenkkkieqllqdlslwetfesklkvkadkiniaklkkeileakehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirtdvheqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcafeqtleleeslltryphlpdknfrkmleswsdplldkwpdlhrkvrlliavrnafshnqypmydeavfssirkydpssldaieermglniahrlseevkqaketveriiqa>19假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mntvpatenkgqsrtveddpqyfglylnlarenlieveshvrikfgkkklneeslkqsllcdhllsidrwtkvyghsrrylpflhcfdpdsgiekdhdsktgvdpdsaqrlirelyslldflrndfshnrldgttfehlkvspdissfitgaytfaceraqsrfadffkpddfllaknrkeqlisvadgkecltvsgfafficlfldreqasgmlsrirgfkrtdenwaravhetfcdlcirhphdrlessntkeallldmlnelnrcprilydmlpeeeraqflpaldensmnnlsenslneesrllwdgssdwaealtkrirhqdrfpylmlrfieemdllkgirfrvdlgeieldsyskkvgrngeydrtitdhalafgklsdfqneeevsrmisgeasypvrfslfapryaiydnkigychtsdpvypksktgekralsnpqsmgfisvhdlrklllmellcegsfsrmqsdflrkanrildetaegklqfsalfpemrhrfippqnpkskdrrekaettlekykqeikgrkdklnsqllsafdmnqrqlpsrlldewmnirpashsvklrtyvkqlnedcrlrlrkfrkdgdgkaraiplvgematflsqdivrmiiseetkklitsayynemqrslaqyageenrrqfraivaelhlldpssghpflsatmetahrytedfykcylekkrewlaktfyrpeqdentkrrisvffvpdgearkllpllirrrmkeqndlqdwirnkqahpidlpshlfdskimellkvkdgkkkwneafkdwwstkypdgmqpfyglrrelnihgksvsyipsdgkkfadcythlmektvrdkkrelrtagkpvppdlaayikrsfhravnerefmlrlvqeddrlmlmainkmmtdreedilpglknidsildeenqfslavhakvlekegeggdnslslvpatieikskrkdwskyiryrydrrvpglmshfpehkatldevktllgeydrcrikifdwafalegaimsdrdlkpylhesssregksgehstlvkmlvekkgcltpdesqylilirnkaahnqfpcaaempliyrdvsakvgsiegssakdlpegsslvdslwkkyemiirkilpildhenrffgkllnnmsqpindl>20假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknfdndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkidhehndevdphyhfnhlvrkgkkdryghndnpsfkhhfvdgegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrmddwmlldmlnelvrcpkplydrlreddracfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkmigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqtsphyhiekgkiglrfmpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaervqgrikrviedvyavydafardeintrdeldacladkgirrghlprqmiailsqehkdmeekirkklqemmadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdasgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpflhetrweshtnilsfyrsylrarkaflerigrsdrvenrpflllkepktdrqtlvagwkgefhlprgifteavrdcliemghdevasykevgfmakavplyferacedrvqpfydspfnvgnslkpkkgrflskeeraeewergkerfrdleawsysaarriedafagieyaspgnkkkieqllrdlslweafesklkvradrinlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleeslltryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>21假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mteqserpyngtyytledkhfwaaflnlarhnayitlthidrqlayskaditndqdvlsfkalwknldndlerksrlrslilkhfsflegaaygkklfeskssgnkssknkeltkkekeelqanalsldnlksilfdflqklkdfrnyyshyrhsgsselplfdgnmlqrlynvfdvsvqrvkrdhehndkvdphrhfnhlvrkgkkdryghndnpsfkhhfvdgegmvteagllffvslflekrdaiwmqkkirgfkggtetyqqmtnevfcrsrislpklkleslrtddwmlldmlnelvrcpkplydrlrekdrarfrvpvdilpdeddtdgggedpfkntlvrhqdrfpyfalryfdlkkvftslrfhidlgtyhfaiykkvigeqpedrhltrnlygfgriqdfaeehrpeewkrlvrdldyfetgdkpyisqttphyhiekgkiglrfvpegqhlwpspevgttrtgrskyaqdkrltaeaflsvhelmpmmfyyfllrekyseevsaekvqgrikrviedvyaiydafardeintrdeldacladkgirrghlpkqmigilsqehknmeekvrkklqemiadtdhrldmldrqtdrkirigrknaglpksgviadwlvrdmmrfqpvakdtsgkplnnskansteyrmlqralalfggekerltpyfrqmnltggnnphpfldetrweshtnilsfyrsylrarkaflerigrsdrvenrpflllkepktdrqtlvagwksefhlprgifteavrdcliemgydevgsykevgfmakavplyferackdrvqpfydspfnvgnslkpkkgrflskekraeewesgkerfrlaklkkeileaqehpyhdfkswqkferelrlvknqdiitwmmcrdlmeenkvegldtgtlylkdirpnvqeqgslnvlnrvkpmrlpvvvyradsrghvhkeeaplatvyieerdtkllkqgnfksfvkdrrlnglfsfvdtgglameqypisklrveyelakyqtarvcvfeltlrleesllsryphlpdesfremleswsdpllakwpelhgkvrlliavrnafshnqypmydeavfssirkydpsspdaieermglniahrlseevkqaketveriiqa>22假定蛋白[prevotellafalsenii]mkndnnstkstdytlgdkhfwaaflnlarhnvyitvnhinkvlelknkkdqeiiidndqdilaiktlwgkvdtdinkkdrlrelimkhfpfleaatyqqsstnntkqkeeeqakaqsfeslkdclflfleklrearnyyshykhsksleepkleekllenmynifdtnvqlvikdyehnkdinpeedfkhlgraegefnyyftrnkkgnitesgllffvslflekkdaiwaqtkikgfkdnrenkqkmthevfcrsrmllpklrlestqtqdwilldmlnelircpkslykrlqgekrekfrvpfdpadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkqigdkkedrhlthklygferiqefakenrpdewkalvkdldtfeesnepyisettphyhlenqkigirnknkkkkktiwpsletkttvnerskynlgksfkaeaflsvhellpmmfyylllnkeepnngkinaskvegiiekkirdiyklygafaneeinneeelkeycegkdiairhlpkqmiailkneykdmakkaedkqkkmikdtkkrlaaldkqvkgevedggrnikplksgriaswlvndmmrfqpvqrdrdgyplnnskansteyqllqrtlalfgsererlapyfrqmnligkdnphpflkdtkwkehnnilsfyrsyleakknflgslkpedwkknqyflklkepktnretlvqgwkngfnlprgiftepirewfirhqneseeykkvkdfdriglvakviplffkedyqkeiedyvqpfygypfnvgnihnsqegtflnkkereelwkgnktkfkdyktkeknkektnkdkfkkktdeekeefrsyldfqswkkferelrlvrnqdivtwllcmelidklkidelnieelqklrlkdidtdtakkeknnilnrimpmelpvtvyetddsnniikdkplhtiyikeaetkllkqgnfkalvkdrrlnglfsfvetsseaelkskpiskslveyelgeyqrarveiikdmlrleetligndeklptnkfrqmldkwlehkketddtdlkndvklltevrnafshnqypmrdriafanikpfslssantsneeglgiakklkdktketidriieieeqtatkr>23假定蛋白[中间普雷沃菌(prevotellaintermedia)]meddkktkestnmldnkhfwaaflnlarhnvyitvnhinkvlelknkkdqdiiidndqdilaikthwekvngdlnkterlrelmtkhfpfletaiytknkedkeevkqekqakaqsfdslkhclflfleklqearnyyshykysestkepmlekellkkmynifddniqlvikdyqhnkdinpdedfkhldrteeefnyyfttnkkgnitasgllffvslflekkdaiwmqqklrgfkdnreskkkmthevfcrsrmllpklrlestqtqdwilldmlnelircpkslyerlqgeyrkkfnvpfdsadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkliggqkedrhlthklygferiqefakqnrtdewkaivkdfdtyetseepyisetaphyhlenqkigirfrndndeiwpslktngennekrkykldkqyqaeaflsvhellpmmfyylllkkeepnndkknasivegfikreirdiyklydafangeinniddlekycedkgipkrhlpkqmvailydehkdmaeeakrkqkemvkdtkkllatlekqtqgeiedggrnirllksgeiarwlvndmmrfqpvqkdnegnplnnskansteyqmlqrslalynkeekptryfrqvnlinssnphpflkwtkweecnnilsfyrsyltkkieflnklkpedweknqyflklkepktnretlvqgwkngfnlprgiftepirewfkrhqndseeyekvetldrvglvtkviplffkkedskdkeeylkkdaqkeinncvqpfygfpynvgnihkpdekdflpseerkklwgdkkykfkgykakvkskkltdkekeeyrsylefqswnkferelrlvrnqdivtwllctelidklkveglnveelkklrlkdidtdtakqeknnilnrvmpmqlpvtvyeiddshnivkdrplhtvyieetktkllkqgnfkalvkdrrlnglfsfvdtssetelksnpiskslveyelgeyqnarietikdmllleetliekyktlptdnfsdmlngwlegkdeadkarfqndvkllvavrnafshnqypmrnriafaninpfslssadtseekkldianqlkdkthkiikriieiekpietke>24假定蛋白[中间普雷沃菌(prevotellaintermedia)]meddkkttestnmldnkhfwaaflnlarhnvyitvnhinkvlelknkkdqdiiidndqdilaikthwekvngdlnkterlrelmtkhfpfletaiytknkedkeevkqekqaeaqsleslkdclflfleklqearnyyshykysestkepmleegllekmynifddniqlvikdyqhnkdinpdedfkhldrkgqfkysfadnegnitesgllffvslflekkdaiwmqqkltgfkdnreskkkmthevfcrrrmllpklrlestqtqdwilldmlnelircpkslyerlqgeyrkkfnvpfdsadedydaeqepfkntlvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkliggqkedrhlthklygferiqefakqnrpdewkalvkdldtyetsneryisettphyhlenqkigirfrngnkeiwpslktngennekskykldkpyqaeaflsvhellpmmfyylllkkeepnndkknasivegfikreirdmyklydafangeinnigdlekycedkgipkrhlpkqmvailydepkdmvkeakrkqkemvkdtkkllatlekqtqeeiedggrnirllksgeiarwlvndmmrfqpvqkdnegnplnnskansteyqmlqrslalynkeekptryfrqvnlinssnphpflkwtkweecnnilsfyrnyltkkieflnklkpedweknqyflklkepktnretlvqgwkngfnlprgiftepirewfkrhqndskeyekvealkrvglvtkviplffkeeyfkedaqkeinncvqpfysfpynvgnihkpdekdflpseerkklwgdkkdkfkgykakvkskkltdkekeeyrsylefqswnkferelrlvrnqdivtwllctelidkmkveglnveelqklrlkdidtdtakqeknnilnrimpmqlpvtvyeiddshnivkdrplhtvyieetktkllkqgnfkalvkdrrlnglfsfvdtsskaelkdkpisksvveyelgeyqnarietikdmlllektlikkyeklptdnfsdmlngwlegkdesdkarfqndvkllvavrnafshnqypmrnriafaninpfslssadiseekkldianqlkdkthkiikkiieiekpietke>25假定蛋白[灰白普雷沃菌(prevotellapallens)]mkeeekgktpvvstynkddkhfwaaflnlarhnvyitvnhinkilgegeinrdgyentlekswneikdinkkdrlskliikhfpflevttyqrnsadttkqkeekqaeaqsleslkksffvfiyklrdlrnhyshykhskslerpkfeedlqekmynifdasiqlvkedykhntdikteedfkhldrkgqfkysfadnegnitesgllffvslflekkdaiwvqkklegfkcsnesyqkmtnevfcrsrmllpklrlqstqtqdwilldmlnelircpkslyerlreedrkkfrvpieiadedydaeqepfknalvrhqdrfpyfalryfdyneiftnlrfqidlgtyhfsiykkqigdykeshhlthklygferiqeftkqnrpdewrkfvktfnsfetskepyipettphyhlenqkigirfrndndkiwpslktnseknekskykldksfqaeaflsvhellpmmfyylllktentdndneietkkkenkndkqekhkieeiienkiteiyalydafangkinsidkleeyckgkdieighlpkqmiailksehkdmateakrkqeemladvqkslesldnqineeienverknsslksgeiaswlvndmmrfqpvqkdnegnplnnskansteyqmlqrslalynkeekptryfrqvnliessnphpflnntewekcnnilsfyrsyleakknfleslkpedweknqyflmlkepktncetlvqgwkngfnlprgiftepirkwfmehrknitvaelkrvglvakviplffseeykdsvqpfynylfnvgninkpdeknflnceerrellrkkkdefkkmtdkekeenpsylefqswnkferelrlvrnqdivtwllcmelfnkkkikelnvekiylknintnttkkeknteekngeekiikeknnilnrimpmrlpikvygrenfsknkkkkirrntfftvyieekgtkllkqgnfkalerdrrlgglfsfvkthskaesksntisksrveyelgeyqkarieiikdmlaleetlidkynsldtdnfhnmltgwlklkdepdkasfqndvdlliavrnafshnqypmrnriafaninpfslssantseekglgianqlkdkthktiekiieiekpietke>26假定蛋白[prevotellapleuritidis]mendkrleesacytlndkhfwaaflnlarhnvyitvnhinktlelknkknqeiiidndqdilaikthwakvngdlnktdrlrelmikhfpfleaaiysnnkedkeevkeekqakaqsfkslkdclflfleklqearnyyshykysesskepefeegllekmyntfdasirlvkedyqynkdidpekdfkhlerkedfnylftdkdnkgkitkngllffvslflekkdaiwmqqkfrgfkdnrgnkekmthevfcrsrmllpkirlestqtqdwilldmlnelircpkslyerlqgayrekfkvpfdsidedydaeqepfrntlvrhqdrfpyfalryfdyneifknlrfqidlgtyhfsiykkliggkkedrhlthklygferiqeftkqnrpdkwqaiikdldtyetsneryisettphyhlenqkigirfrndnndiwpslktngeknekskynldkpyqaeaflsvhellpmmfyylllkmentdndkednevgtkkkgnknnkqekhkieeiienkikdiyalydaftngeinsidelaeqregkdieighlpkqlivilknkskdmaekanrkqkemikdtkkrlatldkqvkgeiedggrnirllksgeiarwlvndmmrfqpvqkdnegkplnnskansteyqmlqrslalynkeekptryfrqvnlikssnphpfledtkweecynilsfyrnylkakikflnklkpedwkknqyflmlkepktnrktlvqgwkngfnlprgiftepikewfkrhqndseeykkvealdrvglvakviplffkeeyfkedaqkeinncvqpfysfpynvgnihkpeeknflhceerrklwdkkkdkfkgykakekskkmtdkekeehrsylefqswnkferelrlvrnqdiltwllctklidklkidelnieelqklrlkdidtdtakkeknnilnrvmpmrlpvtvyeidksfnivkdkplhtvyieetgtkllkqgnfkalvkdrrlnglfsfvktsseaeskskpisklrveyelgayqkaridiikdmlalektlidndenlptnkfsdmlkswlkgkgeankarlqndvgllvavrnafshnqypmynsevfkgmkllslssdipekeglgiakqlkdkiketieriieiekeirn>27假定蛋白[prevotellapleuritidis]mendkrleestcytlndkhfwaaflnlarhnvyitinhinklleirqidndekvldikalwqkvdkdinqkarlrelmikhfpfleaaiysnnkedkeevkeekqakaqsfkslkdclflfleklqearnyyshykssesskepefeegllekmyntfgvsirlvkedyqynkdidpekdfkhlerkedfnylftdkdnkgkitkngllffvslflekkdaiwmqqklrgfkdnrgnkekmthevfcrsrmllpkirlestqtqdwilldmlnelircpkslyerlqgayrekfkvpfdsidedydaeqepfrntlvrhqdrfpyfalryfdyneifknlrfqidlgtyhfsiykkligdnkedrhlthklygferiqefakqkrpnewqalvkdldiyetsneqyisettphyhlenqkigirfknkkdkiwpsletngkenekskynldksfqaeaflsihellpmmfydlllkkeepnndeknasivegfikkeikrmyaiydafaneeinskegleeycknkgfqerhlpkqmiailtnksknmaekakrkqkemikdtkkrlatldkqvkgeiedggrnirllksgeiarwlvndmmrfqsvqkdkegkplnnskansteyqmlqrslalynkeqkptpyfiqvnlikssnphpfleetkweecnnilsfyrsyleakknfleslkpedwkknqyflmlkepktnrktlvqgwkngfnlprgiftepikewfkrhqndseeykkvealdrvglvakviplffkeeyfkedaqkeinncvqpfysfpynvgnihkpeeknflhceerrklwdkkkdkfkgykakekskkmtdkekeehrsylefqswnkferelrlvrnqdivtwllctelidklkidelnieelqklrlkdidtdtakkeknnilnrimpmqlpvtvyeidksfnivkdkplhtiyieetgtkllkqgnfkalvkdrrlnglfsfvktsseaeskskpisklrveyelgayqkaridiikdmlalektlidndenlptnkfsdmlkswlkgkgeankarlqndvdllvairnafshnqypmynsevfkgmkllslssdipekeglgiakqlkdkiketieriieiekeirn>28假定蛋白[糖解普雷沃菌(prevotellasaccharolytica)]mekenvqgshiyyeptdkcfwaafynlarhnayltiahinsfvnskkginnddkvldiiddwskfdndllmgarlnklilkhfpflkaplyqlakrktrkqqgkeqqdyekkgdedpeviqeaianafkmanvrktlhaflkqledlrnhfshynynspakkmevkfddgfcnklyyvfdaalqmvkddnrmnpeinmqtdfehlvrlgrnrkipntfkynftnsdgtinnngllffvslflekrdaiwmqkkikgfkggtenymrmtnevfcrnrmvipklrletdydnhqlmfdmlnelvrcplslykrlkqedqdkfrvpiefldedneadnpyqenansdenpteetdplkntlvrhqhrfpyfvlryfdlnevfkqlrfqinlgcyhfsiydktigertekrhltrtlfgfdrlqnfsvklqpehwknmvkhldteessdkpylsdamphyqienekigihflktdtekketvwpsleveevssnrnkykseknltadaflsthellpmmfyyqllsseektraaagdkvqgvlqsyrkkifdiyddfangtinsmqklderlakdnllrgnmpqqmlailehqepdmeqkakekldrlitetkkrigkledqfkqkvrigkrradlpkvgsiadwlvndmmrfqpakrnadntgvpdskansteyrllqealafysaykdrlepyfrqvnliggtnphpflhrvdwkkcnhllsfyhdyleakeqylshlspadwqkhqhflllkvrkdiqnekkdwkkslvagwkngfnlprglftesiktwfstdadkvqitdtklfenrvgliakliplyydkvyndkpqpfyqypfnindrykpedtrkrftaassklwnekkmlyknaqpdssdkieypqyldflswkklerelrmlrnqdmmvwlmckdlfaqctvegvefadlklsqlevdvnvqdnlnvlnnvssmilplsvypsdaqgnvlrnskplhtvyvqenntkllkqgnfksllkdrrlnglfsfiaaegedlqqhpltknrleyelsiyqtmrisvfeqtlqlekailtrnktlcgnnfnnllnswsehrtdkktlqpdidfliavrnafshnqypmstntvmqgiekfniqtpkleekdglgiasqlakktkdaasrlqniinggtn>29假定蛋白[普雷沃菌属物种(prevotellasp.)p5-119]mnipalvenqkkyfgtysvmamlnaqtvldhiqkvadiegeqnennenlwfhpvmshlynakngydkqpektmfiierlqsyfpflkimaenqreysngkykqnrvevnsndifevlkrafgvlkmyrdltnhyktyeeklidgcefltsteqplsgmiskyytvalrntkerygyktedlafiqdnikkitkdaygkrksqvntgfflslqdyngdtqkklhlsgvgialliclfldkqyiniflsrlpifssynaqseerriiirsfginsiklpkdrihseksnksvamdmlnevkrcpdelfttlsaekqsrfriisddhnevlmkrstdrfvplllqyidygklfdhirfhvnmgklryllkadktcidgqtrvrvieqplngfgrleeaetmrkqengtfgnsgirirdfenvkrddanpanypyivdtythyilennkvemfisdkgssapllplieddryvvktipscrmstleipamafhmflfgskkteklivdvhnrykrlfqamqkeevtaeniasfgiaesdlpqkildlisgnahgkdvdafirltvddmltdterrikrfkddrksirsadnkmgkrgfkqistgkladflakdivlfqpsvndgenkitglnyrimqsaiavydsgddyeakqqfklmfekarligkgttephpflykvfarsipanavdfyerylierkfyltglcneikrgnrvdvpfirrdqnkwktpamktlgriysedlpvelprqmfdneikshlkslpqmegidfnnanvtyliaeymkrvlnddfqtfyqwkrnyhymdmlkgeydrkgslqhcftsveereglwkerasrteryrklasnkirsnrqmrnasseeietildkrlsncrneyqksekvirryrvqdallfllakktlteladfdgerfklkeimpdaekgilseimpmsftfekggkkytitsegmklknygdffvlasdkrignllelvgsdivskedimeefnkydqcrpeissivfnlekwafdtypelsarvdreekvdfksilkillnnkninkeqsdilrkirnafdhnnypdkgiveikalpeiamsikkafgeyaimk>30假定蛋白[扭曲冷弯菌(psychroflexustorquis)]mesiiglglsfnpyktadkhyfgsflnlvennlnavfaefkerisykakdenissliekhfidnmsivdyekkisilngylpiidflddelennlntrvknfkknfiilaeaieklrdyythfyhdpitfednkepllelldevllktildvkkkylktdktkeilkdslreemdllvirktdelrekkktnpkiqhtdssqiknsifndafqgllyedkgnnkktqvshraktrlnpkdihkqeerdfeiplstsglvflmslflskkeiedfksnikgfkgkvvkdenhnslkymathrvysilafkglkyriktdtfsketlmmqmidelskvpdcvyqnlsetkqkdfiedwneyfkdneentenlensrvvhpvirkryedkfnyfairfldefanfktlkfqvfmgyyihdqrtktigttnittertvkekinvfgklskmdnlkkhffsqlsddentdweffpnpsynfltqadnspannipiylelknqqiikekdaikaevnqtqnrnpnkpskrdllnkilktyedfhqgdptailslneipallhlflvkpnnktgqqieniirikiekqfkainhpsknnkgipkslfadtnvrvnaiklkkdleaeldmlnkkhiafkenqkassnydkllkehqftpknkrpelrkyvfyksekgeeatwlandikrfmpkdfktkwkgcqhselqrklafydrhtkqdikellsgcefdhslldinayfqkdnfedffskylenrietlegvlkklhdfkneptplkgvfkncfkflkrqnyvtespeiikkrilakptflprgvfderptmkkgknplkdknefaewfveylenkdyqkfynaeeyrmrdadfkknavikkqklkdfytlqmvnyllkevfgkdemnlqlselfqtrqerlklqgiakkqmnketgdssentrnqtyiwnkdvpvsffngkvtidkvklknigkykryerdervktfigyevdekwmmylphnwkdrysvkpinvidlqiqeyeeirshellkeiqnleqyiydhttdknillqdgnpnfkmyvlnglligikqvnipdfivlkqntnfdkidftgiascselekktiiliairnkfahnqlpnkmiydlaneflkieknetyanyylkvlkkmisdla小蛋白质序列>1假定蛋白[动物溃疡伯格菌(bergeyellazoohelcum)]mielinfsaeyvfgkaplitagnlsdgllffaialfigclihiitfwlikrkwykklactpmdkmkndeyiteilpdlkeiyrtnkgisvtenisngsvfdtayyyleaqgkisqaknfqsiyflfrnivtlslfvlpvsvifllasffmndcslsekiitiiigtfvlgglssviaqwfrvkmtdrifglyyaelthnkk>2多物种:假定蛋白[普氏菌属(prevotella)]miialitslfssatiifagyrtyrnaikklreesienikrahyeailkahqsiykllrfttdtenddcilvweqpkdggektyyfrqanirqffkelteevynkgngiylskevmslifkyrtlvhklllaeknnpdekimihnrevvkemieinqslsiqirkdidlqqrnlynhnkkgkkywwkrkkqni>3假定蛋白[颊普雷沃菌(prevotellabuccae)]mdymelakeafsiictfiaayvayyyaikqlhqksvenieyakyqavlqahkslykllrfttntenedsiliwektkdgkqeatyyfrkenirkfikelskeiynegcgifmskealsliseyrnivygfmlsaqnnpqetiritnresvermkkihqnlsieirqainlkkrdlrf>4假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mekfslydflaiilpgiafivvfriifsslhlslpvdiplglestivyalicgavlyvlsfslvklfprlfglyrhvadlyqkmkalhpimndtlnrqaeqwglgkiylseeefcqseekekirmlqsdfydrmwyrldfrgklgnaksfqcyyfffrhsfwglvlislillsykllayipacdmedigwreysdiavpimilsalfvflaqwfrikmvekmywtfyislieqensnl>5假定蛋白[酿脓拟杆菌(bacteroidespyogenes)]mnkfslydflsillpgviflvairvaqpfwrfntglyfpqgwefslvyslvigaslyvlgfsvkknysvffrrlglyehvtilyhrfetlhpfmngalnkyaeewngtkpyctveqydamdasaqkeiedaqdifydhmyyrldckgklegakafqsyylcflhsflgllifgvyllicillsyfmdvlladtwqvaflflmnlcvmylfmrlarwfrqrmvlkmywafyeslie>8假定蛋白[鸭疫里氏杆菌(riemerellaanatipestifer)]mywilevlkivtptiavivsaivstivlsrkirqelkgnierqkyedilhahkqmyrllaymtdqdnpknllkwevpkgqkdkihyinranaqaflrelpelfygegcglflseevtkkffeyrsivhklllaeqnsteaefrlkneeaatrmkvlhhklsqsirqclkieqrdlkal>9假定蛋白[桔红色普雷沃菌(prevotellaaurantiaca)]mdctliskevatallstissfipiviaayltyryaikklhkesienierakyeailkahqsiykllrfttdtenddcillweqskgskekvyyfrqanirkfikelteeiynkgngiylskevillvfkyrtlvhklllaeknnpdekimiskqeiaksmieihqslsiqirndinlkkrdlclnsent>11假定蛋白[拟香味类香味菌(myroidesodoratimimus)]mdklslyelfsfvipggialhllnwcsvnvlstgtlfnlsdlsnslialvfalligvtlhiitfnillkcgsyrqiiyksvqeiklddyiqqvipflnqeyfhnkkhevaantnnavpaenlfdyayyylevngknaqaknfqslyfffrnmftlgivsiviliialvystitsvgkdvlseivfkiaffaviigiavpvanwlrkkmiitvfgcyyadrvhqtnk>13假定蛋白[酿脓拟杆菌(bacteroidespyogenes)]mnkfsfydflsillpgviflvairvaqlfwrfntglyfpqgwefslvyslvigaslyvlgfsvkknysgffrclglyehvtilyyrfetlhpfmngalnkyaeewngtkpyctveqydamdasaqkeiedaqdifydhmyyrldckgklegakafqsyylcflhsflgllifgvyllicillsyfmdvlladtwqvaflflmnlcvmylfmrlarwfrqrmvlkmywafyeslie>14假定蛋白[狗咬二氧化碳嗜纤维菌(capnocytophagacanimorsus)]mdrlsiyellsfvvpgvimielinfsaeyvfgkdrlitagnlsdgllffaialfigclihiitfrlikrkwykklaykpineiennayikqifttlkeeyskihninsideisklnifeavitt>15假定蛋白[犬咬二氧化碳嗜纤维菌(capnocytophagacynodegmi)]merlsiyellsfvvlgvimielmnfsaeyvfgkaplitagnlsdsllffaialfigclihiitfrlikrkwyqklactpmdkmkndeyiteilphlkeiyrankgisatenisngsvfdtayyyleaqgkisqaknfqsiyflfrnivtlslfvlpvsvifllasffmndcklsgkiitivigtlviggissviaqwfrvkmtdrifglyyaelthhkk>17假定蛋白[三角棕指藻(phaeodactylibacterxiamenensis)]mdegtlliniltgpakdkplwfefigigvtislaawgylrafgawekqkkrelelqhkqrkleiklqfekqryehelkaaegvwpllayfslwendksvfvkrgdhwyfrqeqgreyilalsenffnkgygvfmpgpakenlyhfrgmiykllqdsksngndnnevllknqsmvqkkdkqaapnkksveqlkdeinaslrnmlqkseidld>18假定蛋白[牙龈卟啉单胞菌(porphyromonasgingivalis)]mmtmticwtpicvqliklsgifiaaylayryavhklskesienierckyqavleahrsfykllrfttdtenadsilvwqkakgggaktyyfrpacirgflseltdefykngngiflskeiisrifeyrsivyglllserqnsdervvmnkpetaermisihqeltqtvreaialkkrtlnf>19假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mekfslydflaiilpgiafivvfrvvfsslhlslpvdipldleftivyalicgavlyvlsfslvklfprlfglyrhvadlyqrmkalhpimndtlnrqaeqwglgriylseeeycrseekekirmlqsdfynrmwyrldfrgklgnaksfqcyyfffrhsflglvlislillsykllayipaceledigwkeysdiavpiiilsvlfvflaqwfrikmvekmywtfyislieqensnl>20假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mmtmticwtpicvqliklsgifiaaylayryavrklskesienierckyqavleahrsfykllrfttdtenadsilvwqkakgggaktyyfrpacirgflseltdefykngngvflskeiisrifeyrsivyglllserqnsderivmnkpetaermirihqeltqtvreaialkgrtlnf>21假定蛋白[咽喉卟啉单胞菌(porphyromonasgulae)]mtmticwtpicvqlielsgifiaaylayryavrklskesienierckyqavleahrsfykllrfttdtenadsilvwqkakgggaktyyfrpacirgflseltdefykngngvflskeiisrifeyrsivyglllserdssderivmnkpetaermirihqeltqtvreaialkgrtlnf>22假定蛋白[prevotellafalsenii]miialipalinsaaiivvvyltyfyavkklreesfenierakyeailkahqsvykllrfitdtenddcilvweepkgggekayyfrqanirkfirelteeiynkgngiflskktmslifeyrtlvygllltakdnpaeaieitnkklakrmieihqslsiqirkdrnlqq>23假定蛋白[中间普雷沃菌(prevotellaintermedia)]mdctliskevatalfstisslipiviaayltyryaikklrkesfenierakyeailkahqsiykllrfitdtenddcilvweqpkgggektyyfrqanirkfikelteeiynkgngiflskkvmplifeyrslvygllltakdkpdetieikneklakrmieihqslsiqirkdinlkqrdlqldnkkgkkwcwkrkkqni>24假定蛋白[中间普雷沃菌(prevotellaintermedia)]mdctliskevatamfstisslipiviaayltyryaikklrkesfenierakyeavlkahqsiykllrfitdtenddcimvweqpkgggekvyyfrqanirkfikelteeiynkgngiflskkvmplifeyrslvygllltakdkpdetieikneklakrmieihqslsiqirkdinlkqrdlqfds>26假定蛋白[prevotellapleuritidis]mdctliskevatalfstlsslvpiviaayltyryaikklhkesfesiecakyeailkahqsiykllrfitdtenddcilvweqpkgggenvyyfrqanirkfikelteeiynkgngiflskevmslifeyrslvygllltekdnpkdkiiiknlklakrmieihqnlsikireainlqqrdlhfk>27假定蛋白[prevotellapleuritidis]mdctliskevatalfstlsslvpiviaayltyryaikklhkesfesiecakyeailkahqsiykllrfitdtenddcilvweqpkgggektyyfrqanirkfikelteeiynkgngiylskevmslifkyrtlvhklllakknnpdekimidkrelakrmieihqnlsikireainlqqrdlhfk>28假定蛋白[糖解普雷沃菌(prevotellasaccharolytica)]mecndcsqlittlvslltaalsgflsyyfavrkyrkesqenverwkyeaiwhahqsfykllrfmtdnenadsilvfrkqegskqpqpifrkdkareflaeltdefykkgnglflskevadslfkyrhivfgllqvfsnydenevqlkntqavenmkknfqqlspeirkslhlhrrdllfs参考文献1.abilz,zhaoh.engineeringreprogrammablerna-bindingproteinsforstudyandmanipulationofthetranscriptome.molecularbiosystems.2015;11(10):2658-65.doi:10.1039/c5mb00289c.pubmedpmid:26166256.2.abudayyehoo,gootenbergjs,konermanns,joungj,slaymakerim,coxdb,etal.c2c2isasingle-componentprogrammablerna-guidedrna-targetingcrispreffector.science.2016;353(6299):aaf5573.doi:10.1126/science.aaf5573.pubmedpmid:27256883.3.anantharamanv,makarovaks,burroughsam,kooninev,aravindl.comprehensiveanalysisofthehepnsuperfamily:identificationofnovelrolesinintra-genomicconflicts,defense,pathogenesisandrnaprocessing.biologydirect.2013;8:15.doi:10.1186/1745-6150-8-15.pubmedpmid:23768067;pubmedcentralpmcid:pmc3710099.4.bernhartsh,hofackeril,stadlerpf.localrnabasepairingprobabilitiesinlargesequences.bioinformatics.2006;22(5):614-5.doi:10.1093/bioinformatics/btk014.pubmedpmid:16368769.5.biswasa,gagnonjn,brounssj,fineranpc,browncm.crisprtarget:bioinformaticpredictionandanalysisofcrrnatargets.rnabiology.2013;10(5):817-27.doi:10.4161/rna.24046.pubmedpmid:23492433;pubmedcentralpmcid:pmc3737339.6.brounssj,joremm,lundgrenm,westraer,slijkhuisrj,snijdersap,etal.smallcrisprrnasguideantiviraldefenseinprokaryotes.science.2008;321(5891):960-4.doi:10.1126/science.1159689.pubmedpmid:18703739.7.camachoc,coulourisg,avagyanv,man,papadopoulosj,bealerk,etal.blast+:architectureandapplications.bmcbioinformatics.2009;10:421.doi:10.1186/1471-2105-10-421.pubmedpmid:20003500;pubmedcentralpmcid:pmc2803857.8.crooksge,hong,chandoniajm,brennerse.weblogo:asequencelogogenerator.genomeresearch.2004;14(6):1188-90.doi:10.1101/gr.849004.pubmedpmid:15173120;pubmedcentralpmcid:pmc419797.9.east-seletskya,o'connellmr,knightsc,bursteind,catejh,tjianr,etal.twodistinctrnaseactivitiesofcrispr-c2c2enableguide-rnaprocessingandrnadetection.nature.2016.doi:10.1038/nature19802.pubmedpmid:27669025.10.edgarrc.piler-cr:fastandaccurateidentificationofcrisprrepeats.bmcbioinformatics.2007;8:18.doi:10.1186/1471-2105-8-18.pubmedpmid:17239253;pubmedcentralpmcid:pmc1790904.11.filipovskaa,rackhamo.designerrna-bindingproteins:newtoolsformanipulatingthetranscriptome.rnabiology.2011;8(6):978-83.doi:10.4161/rna.8.6.17907.pubmedpmid:21941129.12.gerdessy,schollemd,campbelljw,balazsig,ravasze,daughertymd,etal.experimentaldeterminationandsystemlevelanalysisofessentialgenesinescherichiacolimg1655.journalofbacteriology.2003;185(19):5673-84.pubmedpmid:13129938;pubmedcentralpmcid:pmc193955.13.halecr,cocozakia,lih,ternsrm,ternsmp.targetrnacaptureandcleavagebythecmrtypeiii-bcrispr-caseffectorcomplex.genes&development.2014;28(21):2432-43.doi:10.1101/gad.250712.114.pubmedpmid:25367038;pubmedcentralpmcid:pmc4215187.14.halecr,majumdars,elmorej,pfistern,comptonm,olsons,etal.essentialfeaturesandrationaldesignofcrisprrnasthatfunctionwiththecasrampmodulecomplextocleavernas.molecularcell.2012;45(3):292-302.doi:10.1016/j.molcel.2011.10.023.pubmedpmid:22227116;pubmedcentralpmcid:pmc3278580.15.halecr,zhaop,olsons,duffmo,graveleybr,wellsl,etal.rna-guidedrnacleavagebyacrisprrna-casproteincomplex.cell.2009;139(5):945-56.doi:10.1016/j.cell.2009.07.040.pubmedpmid:19945378;pubmedcentralpmcid:pmc2951265.16.hayesf,vanmelderenl.toxins-antitoxins:diversity,evolutionandfunction.criticalreviewsinbiochemistryandmolecularbiology.2011;46(5):386-408.doi:10.3109/10409238.2011.600437.pubmedpmid:21819231.17.jiangw,samaip,marraffinila.degradationofphagetranscriptsbycrispr-associatedrnasesenablestypeiiicrispr-casimmunity.cell.2016;164(4):710-21.doi:10.1016/j.cell.2015.12.053.pubmedpmid:26853474;pubmedcentralpmcid:pmc4752873.18.jinekm,chylinskik,fonfarai,hauerm,doudnaja,charpentiere.aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science.2012;337(6096):816-21.doi:10.1126/science.1225829.pubmedpmid:22745249.19.mackayjp,fontj,segaldj.theprospectsfordesignersingle-strandedrna-bindingproteins.naturestructural&molecularbiology.2011;18(3):256-61.doi:10.1038/nsmb.2005.pubmedpmid:21358629.20.makarovaks,anantharamanv,aravindl,kooninev.livevirus-freeordie:couplingofantivirusimmunityandprogrammedsuicideordormancyinprokaryotes.biologydirect.2012;7:40.doi:10.1186/1745-6150-7-40.pubmedpmid:23151069;pubmedcentralpmcid:pmc3506569.21.makarovaks,haftdh,barrangour,brounssj,charpentiere,horvathp,etal.evolutionandclassificationofthecrispr-cassystems.naturereviewsmicrobiology.2011;9(6):467-77.doi:10.1038/nrmicro2577.pubmedpmid:21552286;pubmedcentralpmcid:pmc3380444.22.makarovaks,wolfyi,alkhnbashios,costaf,shahsa,saunderssj,etal.anupdatedevolutionaryclassificationofcrispr-cassystems.naturereviewsmicrobiology.2015;13(11):722-36.doi:10.1038/nrmicro3569.pubmedpmid:26411297.23.makarovaks,wolfyi,kooninev.comprehensivecomparative-genomicanalysisoftype2toxin-antitoxinsystemsandrelatedmobilestressresponsesystemsinprokaryotes.biologydirect.2009;4:19.doi:10.1186/1745-6150-4-19.pubmedpmid:19493340;pubmedcentralpmcid:pmc2701414.24.marraffinila.crispr-casimmunityinprokaryotes.nature.2015;526(7571):55-61.doi:10.1038/nature15386.pubmedpmid:26432244.25.mollers,croningmd,apweilerr.evaluationofmethodsforthepredictionofmembranespanningregions.bioinformatics.2001;17(7):646-53.pubmedpmid:11448883.26.nunezjk,leeas,engelmana,doudnaja.integrase-mediatedspaceracquisitionduringcrispr-casadaptiveimmunity.nature.2015;519(7542):193-8.doi:10.1038/nature14237.pubmedpmid:25707795;pubmedcentralpmcid:pmc4359072.27.remmertm,biegerta,hausera,sodingj.hhblits:lightning-fastiterativeproteinsequencesearchingbyhmm-hmmalignment.naturemethods.2012;9(2):173-5.doi:10.1038/nmeth.1818.pubmedpmid:22198341.28.shmakovs,abudayyehoo,makarovaks,wolfyi,gootenbergjs,semenovae,etal.discoveryandfunctionalcharacterizationofdiverseclass2crispr-cassystems.molecularcell.2015;60(3):385-97.doi:10.1016/j.molcel.2015.10.008.pubmedpmid:26593719;pubmedcentralpmcid:pmc4660269.29.staalsrh,agariy,maki-yonekuras,zhuy,taylordw,vanduijne,etal.structureandactivityoftherna-targetingtypeiii-bcrispr-cascomplexofthermusthermophilus.molecularcell.2013;52(1):135-45.doi:10.1016/j.molcel.2013.09.013.pubmedpmid:24119403;pubmedcentralpmcid:pmc4006948.30.staalsrh,zhuy,taylordw,kornfeldje,sharmak,barendregta,etal.rnatargetingbythetypeiii-acrispr-cascsmcomplexofthermusthermophilus.molecularcell.2014;56(4):518-30.doi:10.1016/j.molcel.2014.10.005.pubmedpmid:25457165;pubmedcentralpmcid:pmc4342149.31.taferh,ameressl,obernostererg,gebeshuberca,schroederr,martinezj,etal.theimpactoftargetsiteaccessibilityonthedesignofeffectivesirnas.naturebiotechnology.2008;26(5):578-83.doi:10.1038/nbt1404.pubmedpmid:18438400.32.tamulaitisg,kazlauskienem,manakovae,venclovasc,nwokeojiao,dickmanmj,etal.programmablernashreddingbythetypeiii-acrispr-cassystemofstreptococcusthermophilus.molecularcell.2014;56(4):506-17.doi:10.1016/j.molcel.2014.09.027.pubmedpmid:25458845.33.vanderoostj,joremm,westraer,lundgrenm,brounssj.crispr-basedadaptiveandheritableimmunityinprokaryotes.trendsinbiochemicalsciences.2009;34(8):401-7.doi:10.1016/j.tibs.2009.05.002.pubmedpmid:19646880.34.wrightav,nunezjk,doudnaja.biologyandapplicationsofcrisprsystems:harnessingnature'stoolboxforgenomeengineering.cell.2016;164(1-2):29-44.doi:10.1016/j.cell.2015.12.035.pubmedpmid:26771484.35.yatesa,akanniw,amodemr,barrelld,billisk,carvalho-silvad,etal.ensembl2016.nucleicacidsresearch.2016;44(d1):d710-6.doi:10.1093/nar/gkv1157.pubmedpmid:26687719;pubmedcentralpmcid:pmc4702834.36.yosefi,gorenmg,qimronu.proteinsanddnaelementsessentialforthecrispradaptationprocessinescherichiacoli.nucleicacidsresearch.2012;40(12):5569-76.doi:10.1093/nar/gks216.pubmedpmid:22402487;pubmedcentralpmcid:pmc3384332.37.zhangj,rouillonc,keroum,reeksj,bruggerk,grahams,etal.structureandmechanismofthecmrcomplexforcrispr-mediatedantiviralimmunity.molecularcell.2012;45(3):303-13.doi:10.1016/j.molcel.2011.12.013.pubmedpmid:22227115;pubmedcentralpmcid:pmc3381847.实例2:在体外(生物化学)和真核(人)细胞中验证在细菌中的组29效应蛋白rna干扰。哺乳动物干扰测定(蛋白质和crrna质粒):对于哺乳动物干扰实验,申请人设计了两种质粒以在hek293t细胞中共转染:·含有cmv驱动的组29蛋白的蛋白质质粒,其是人类密码子优化的11种蛋白质(选择独特蛋白质的蛋白质1-11)。·含有具有重复和靶序列的u6驱动的crrna的crrna质粒,重复序列依赖于测定随着物种和靶标而变化基于外源荧光素酶的测定:申请人使用promega的nano-双重荧光素酶报道分子在hek293t细胞中进行外源哺乳动物干扰测定。萤光素酶测定法在基因转录物活性的光学读出中提供了最高的灵敏度,并且最近设计的nluc提供了比fluc和rluc大2个数量级的灵敏度。用于归一化的nluc和fluc将在由cmv或另一种组成型哺乳动物启动子(或可能是诱导型启动子)驱动的两种慢病毒骨架质粒上表达。质粒将具有抗生素抗性基因,所述基因可能用于翻译至表达nluc/fluc的hek293t细胞系中。另外,标准的u2内含子可以包含在活性nluc和rluc区域中以允许跨越外显子至内含子的crrna靶序列。内源性转录物rt-qpcr测定:申请人在hek293t细胞中使用跨内源性哺乳动物基因外显子至内含子的crrna靶序列(例如cxcr4和b4galnt1)进行内源性哺乳动物干扰测定。申请人通过rt-qpcr评估了rna干扰,其中将使用δct值来计算样品和条件之间的相对干扰。ms2噬菌体干扰:为了测定组29crispr核酸酶的潜在rna靶向能力,申请人设计了一系列可能干扰ms2噬菌体复制的构建体。如kannoly,s.、shao,y.&wang,i.n.所述,ms2噬菌体是感染大肠杆菌的+单链rna病毒。基于基因组序列和两个r-质粒依赖性ssrna噬菌体c-1和hgal1的特征,重新思考了单链rna(ssrna)噬菌体的进化。journalofbacteriology[细菌学杂志]194,5073-5079(2012)。其复制不涉及任何dna中间体。可以利用特异性作用于rna的crispr系统干扰ms2复制_enref_2,如tamulaitis,g.,等人在通过嗜热链球菌的iii-a型crispr-cas系统进行可编程rna破碎(programmablernashreddingbythetypeiii-acrispr-cassystemofstreptococcusthermophilus)进一步描述的。molecularcell[分子细胞]56,506-517(2014)。为了测试组29蛋白是否可以切割rna,申请人设计了一系列可以指导组29核酸酶干扰ms2复制的构建体。该测定具体涉及1)在氯霉素抗性质粒pacyc184上产生携带组29基因座的大肠杆菌,其元件在其天然或合成启动子下表达并含有靶向mat、lys和repms2基因的crrna表达盒,2)用ms2噬菌体感染来自上述步骤1的大肠杆菌和3)通过噬斑测定的标准效率确定感染效率。质粒干扰测定:为了测定组29crispr核酸酶的潜在rna靶向能力,申请人设计了一系列干扰来自puc19质粒的基因表达的构建体。该测定具体涉及1)在氯霉素抗性质粒pacyc184上产生携带组29基因座的化学感受态大肠杆菌,其元件在其天然或合成启动子下表达并含有靶向puc19的氨苄青霉素抗性基因的crrna表达盒,2)用puc19质粒转化来自上述步骤1的大肠杆菌和3)通过在具有合适的抗生素的lb琼脂平板上铺板来计数对氯霉素和氨苄青霉素都具有抗性的菌落。如果具有正确靶向的crrna的组29基因座显示氯霉素、氨苄青霉素抗性cfu数量相对于对照减少,则可能发生了干扰。此外,通过设计预测与氨苄青霉素抗性转录物(bla)或puc19的非转录部分杂交的crrna,申请人期望测定干扰是否是mrna靶向或dna切割的结果。如果组29靶向mrna用于破坏,那么只有与转录物互补的crrna才能消除氨苄青霉素抗性。如果组29靶向dna用于破坏,那么只有具有正确pam的靶向序列的crrna(如果pam需要用于切割)预计会导致转化细胞的氨苄青霉素抗性的损失。蛋白质纯化:申请人使用标准测定法表达和纯化组29蛋白,如rigaut,guillaume,等人在“agenericproteinpurificationmethodforproteincomplexcharacterizationandproteomeexploration(用于蛋白质复合物表征和蛋白质组探索的通用蛋白质纯化方法)”中进一步描述的。naturebiotechnology[自然生物技术]17.10(1999):1030-1032。简而言之,申请人将组29大型蛋白(如本申请中所述)克隆到pet21表达载体中,并将其融合到6xhis标签用于ni-his纯化和麦芽糖结合蛋白以帮助溶解。组29蛋白将在大肠杆菌rosetta2(de3)(novagen)中表达,并使用ni-nta树脂(bio-rad)使用重力流动柱进行纯化。使用尺寸排阻色谱法进一步纯化蛋白质。电泳迁移率变动分析(emsa)和切割分析:申请人进行了emsa和切割分析,如tamulaitis,gintautas等人所述“通过嗜热链球菌的iii-a型crispr-cas系统进行可编程rna破碎(programmablernashreddingbythetypeiii-acrispr-cassystemofstreptococcusthermophilus)”.molecularcell[分子细胞]56,506-517,2014,有略微的变动。对于emsa,申请人将纯化的组29蛋白与荧光标记的核酸(包括crrna和双重重复crrna)一起孵育,并在天然page凝胶上运行。对于切割测定,申请人在25℃和37℃将组29蛋白与crrna和靶核酸孵育,并在page凝胶上运行靶核酸以分析切割。用于体外试验的rna纯化:为了纯化足够的rna用于组29体外rna结合/切割测定,申请人遵循使用快速高效液相色谱(fplc)的快速纯化rna的方案(kim等人,rna,2007)。这个为期一天的方案涉及t7聚合酶的体外转录,随后是快速高效液相色谱(fplc)尺寸排阻色谱法。申请人合成并纯化了组29crrna(具有靶序列的重复序列)和靶rna。对于靶rna,申请人合成了与靶序列互补的ssrna和具有靶序列的dsrna(互补ssrna退火至其反向互补序列)。图35的方案:体外切割测定。以1:1:1的单个靶标、单个指导(egfp1靶标)t2crrna和01(n2)crrna的靶标:crrna:prot摩尔比测试切割时间蛋白质浓度变化ivc方案1.将短crrna归一化至36.5ng/ul2.将每个pam文库归一化为100ng/ul3.制备10x缓冲液+dtt4.在h2o中稀释蛋白质:需要26个样品=7ul蛋白质+19ulh2o5.制备主要混合物egfp靶1-mm设计:1.用于每个crrna的时间样品的mm(8个样品9x)。取72ulmm,添加9ul稀释蛋白和9ul。每孔添加10ul。2.-蛋白质+crrna的mm。对于每个crrna,移取17.6ulmm,2.2ul稀释的盐,2.2的crrna。移取10ul到90min的时间点。3.-rrna的mm(为所有4个样品制备)。移取35.2mm,4.4h2o,4.4的蛋白稀释液4.-蛋白质-crrna的mm(为全部4个样品制备)。移取35.2mm,4.4h2o,4.4的稀释的盐。5.混合各组分。在上述所示的时间孵育。6.对于每个时间点,在适当的时间,在85℃加热5min,然后在室温添加1ul的蛋白酶k(15min)7.设置凝胶。在42℃加热。孵化15min后,开始运行凝胶(以稳定内部温度)。8.去除5ul混合物,添加5ul2x加样染料。9.冻结静置以进行排序。10.在95℃加热10ul持续5分钟。11.在冰上冷却并旋降。12.每泳道加载8ul。紧密加载13.在42℃在180v运行凝胶45分钟。14.取出凝胶并冲洗进去离子水中15.在完成凝胶之后不迟于1小时,向下成像。图35示出了通过组29蛋白(从动物溃疡伯格菌(bergeyellazoohelcum)atcc43767纯化)对egfprna的体外切割测定的结果。使用两种不同的crrna(分别为图35a和图35b)。在存在或不存在crrna和/或效应蛋白的情况下,在含有50mmnacl、1mmdtt、tris-hclph7.5、1%bsa的缓冲液中进行切割反应达指定的时间点。组分以1:1:1靶标:蛋白质:crrna的比例混合。从图35可以看出,组29蛋白进行一次或几次初始切割,并且随着时间的流逝,靶标被进一步处理。切割似乎是非随机的,因为切割图案是可重现的。图36a/c的方案:emsa凝胶迁移。使用egfp1靶标和t2crrna测试wt和失活蛋白与crrna和crrna+靶标的结合。蛋白质浓度变化ivc方案1.将短crrna归一化至50ng/ul(具有8ulh2o的稀释的8ulcrrna)2.将e1靶标归一化至125ng/ul(1ul+7ulh2o)3.制备10x缓冲液+dtt(10uldtt+9010x)4.制备主要混合物egfp靶1设计:1.移取44ulmm2.添加1ul的dh2o或e1靶。3.制备蛋白质稀释液。(wt=1ug/ul)(d=6ug/ul)a.wt0:5.5ul2mnacl,5.5ulh2ob.wt.25:0.55ul蛋白质、4.952mnacl、5.5ulh2oc.wt2.5:5.5ul蛋白质、5.5ulh2od.d0:5.5ul2mnacl,5.5ulh2oe.d.25:8.5ulnacl,8.5ulh2o.取出1.5ul。制备稀释液5ul蛋白质+4.5ul50/50混合物。f.d2.5:1.5+8.12mnacl,7.4ulh2o4.移取每个蛋白质溶液5ul到孔中。5.混合各组分。孵育30分钟。6.设置凝胶。7.除去10ul样品,混合1ul新浓缩加样染料(甘油和颜料)8.每泳道加载10ul。紧密加载9.在42℃在180v运行凝胶45分钟。10.取出凝胶并冲洗进去离子水中11.在完成凝胶之后不迟于1小时,向下成像。图36a示出crispr复合物(或其各个组分)与egfprna靶的结合测定结果。进行emsa,包括作为所示浓度的组29蛋白(从动物溃疡伯格菌(bergeyellazoohelcum)atcc43767纯化)中的一种或多种、egfp靶和crrna。结合测定反应混合物含有50ngcrrna、125ng靶(如果存在)。添加0.25ug蛋白质对应于约1:1:1摩尔比的蛋白质:crrna:靶。添加2.5ug蛋白质对应于约10:1:1摩尔比的蛋白质:crrna:靶。结合测定在含有100mmnacl、1mmdtt、tris-hclph7.5、1%bsa的缓冲液中进行30分钟。评估野生型组29蛋白(图36的左图)和突变的组29蛋白(图36的右图)的结合。突变的组29蛋白含有以下突变:r116a、h121a、r1177a和h1182a。从图36看来,突变的组29蛋白(dgroup29)与crrna、复合物中的crrna及其靶rna结合。通过在hepn结构域中进行突变不能消除结合。图36c示出了hepn结构域2突变体组29蛋白(即,具有突变r1177a、h1182a)的类似结果。图36b/d的方案:测试dgroup29是否切割蛋白质的方案现在盐浓度将是50mm(100ulrxn中2.708ul的2mnacl)1.将短crrna归一化至36.5ng/ul(8.7ulddh20中5ul)。2.稀释冷冻蛋白质。a.wt:1.08ul蛋白质+2.92h2ob.d0.27:1ul以上混合物+4uls200c.d1.35:1.35ul蛋白质+4.65s200缓冲液3.将每个pam文库归一化为100ng/ul4.制备10x缓冲液w/dtt(将10uldtt添加至90ul不含dtt的10x缓冲液)5.制备主要混合物:egfp靶1设计:1.等分8ulmm。2.每孔添加1ul蛋白质或盐。3.每孔添加1ul短crrna(36.5ng/ul)或ddh2o。4.混合各组分。5.在37℃孵育60分钟。然后在85℃加热灭活5分钟。6.蛋白质k处理:每个样品1ul,在室温下持续15min7.运行tbe尿素凝胶图36b示出了评估了野生型和突变的组29蛋白的通过组29蛋白(从动物溃疡伯格菌(bergeyellazoohelcum)atcc43767纯化)对egfprna体外切割测定的结果。突变的组29效应蛋白具有以下突变:r116a、h121a、r1177a和h1182a。如所示使用两种不同的crrna。如所示,测试了不同的组分比例。孵育60分钟后评估测定;使用的缓冲液是:50mmnacl、1mmdtt、tris-hclph7.5、1%bsa。从图36b可以得出结论,突变体组29效应蛋白不会切割靶rna,不考虑组分比例。图36d示出了hepn结构域2突变体组29蛋白(即,具有突变r1177a、h1182a)的类似结果。图37的方案:ivcdna;测试ssdna切割。长与短crrnaivc方案线性化质粒,纯化,在凝胶上运行以确认切割将短crrna归一化至100ng/ul,将长crrna归一化至200ng/ul制备主要混合物:设计:12345678910dna靶标++++++++++crrna短短(ns)长长(ns)-短短(ns)长长(ns)-蛋白质+++++-----等分每孔14ul的mm(每种pam文库10孔)稀释蛋白质。总共需要10个样品。将6ul蛋白质与18ulh2o混合。向需要蛋白质的每个孔添加2ul将蛋白质缓冲液添加到其他孔(2ul)(500mms200蛋白质溶液的1:4稀释液)添加4ul适当的crrna。混合各组分。在37℃孵育1小时。蛋白质在85℃灭活5min。与核糖核酸酶a孵育。用50ulh2o稀释10ul原液。每孔添加1ul。在37℃孵育30min。用蛋白酶k孵育(15minrt)在变性凝胶上运行。图37示出了通过组29蛋白(从动物溃疡伯格菌(bergeyellazoohelcum)atcc43767纯化)对ssdna的体外切割测定的结果。评估与ssdnalpam文库(图37的左图)和ssdnarpam文库(图37的右图)的结合。图37表明组29蛋白不切割ssdna,不论同向重复序列的长度。图38的方案:ivc;测试crispr阵列的切割1.合成crrna2.将crrna归一化至100ng/ul3.制备蛋白质浓度:1:1ul原液2:.65ul原液+35ul2mnacl3:添加.5ul原液+2ul2mnacl。取1ul4:.65ul200ng/ul+.35ul2mnacl5/6:1μl2m4.制备10x缓冲液+dtt5.制备主要混合物mgmm设计:1.添加1ul靶crrna(每个反应100ng)2.将蛋白质或盐缓冲液添加至其他孔(1ul)。3.混合各组分。在37℃孵育60分钟,然后在85℃加热5分钟,然后在室温添加1ul的蛋白酶k(15min)4.设置凝胶。在42℃加热。孵化15min后,开始运行凝胶(以稳定内部温度)。5.去除7ul混合物,添加7ul2x加样染料。6.在95℃加热10ul持续5分钟。7.在冰上冷却并旋降。8.每泳道加载12ul。紧密加载9.在42℃在180v运行凝胶45分钟。lpamdsdna序列*gggcgatggtccataccttagatgcgttagcattaatcaggcaacggctctctagatagnnnnnnngtaggctctttgtgcctctacgccatctccatagagccctcaaccggagtttgaagcatggcttctaactttactcagttcgttctcgtcgacaatggcggaactggcgacgtgactrpamdsdna序列*gggcgatggtccataccttagatgcgttagcattaatcaggcaacggctctctagataggtaggctctttgtgcctctacgccatctccnnnnnnnatagagccctcaaccggagtttgaagcatggcttctaactttactcagttcgttctcgtcgacaatggcggaactggcgacgtgactlpamss/dsdna序列*taatacgactcactatagggcgatggtccataccttagatgcgttagcattaatcaggcaacggctctctagatagnnnnnnngtaggctctttgtgcctctacgccatctccatagagccctcaaccggagtttgaagcatggcttctaactttactcagttcgttctcgtcgacaatggcggaactggcgacgtgactrpamss/dsdna序列*taatacgactcactatagggcgatggtccataccttagatgcgttagcattaatcaggcaacggctctctagataggtaggctctttgtgcctctacgccatctccnnnnnnnatagagccctcaaccggagtttgaagcatggcttctaactttactcagttcgttctcgtcgacaatggcggaactggcgacgtgactbz的crrnadr序列(短)guuggaacugcucucauuuuggaggguaaucacaacbz的crrnadr序列(长)guuggaacugcucucauuuuauucgugaaguuuuuauuuguuuucaaaggaacucaugaauacagaguauuuggaggguaauaacaaccrrna序列5'-指导序列-dr序列-3'*突出显示的靶序列的指导序列反向互补(在rna中)图38示出了组29蛋白(从动物溃疡伯格菌(bergeyellazoohelcum)atcc43767纯化)处理它们自己的crrna。组29天然基因座在图38a中示意性地表示。评估两种不同的crispr阵列片段用于通过组29蛋白的处理(表示为#1和#2)。图38b表示这两个片段被有效地处理。成熟crrna约为66nt。图39的方案:重复egfp切割的方案现在盐浓度将是50mm(100ulrxn中2.708ul的2mnacl)1.将短crrna归一化至36.5ng/ul(8.7ulddh20中5ul)。2.稀释冷冻蛋白质。(在21.9h2o中的8.1ul)需要24个(制备30个)样品(每个样品1ul),每rxn.27ug。新原液是以1ug/ul;2000mmnacl。3.将每个pam文库归一化至100ng/ul(在90ulddh20中10ul)4.制备10x缓冲液w/dtt(将10uldtt添加至90ul不含dtt的10x缓冲液)5.制备主要混合物:egfp靶1egfp靶1设计:凝胶11234567891011121314模板11111111111111蛋白质+++++++++++++-rnat1t2t3t4t5t6111213141516--凝胶21234567891011121314模板11111222222222蛋白质++++-++++++++-rnat21125--21222324252611--1.等分8ulmm。2.向每个孔中添加1ul蛋白质或ddh20。3.每孔添加1ul短crrna(36.5ng/ul)或ddh2o。4.混合各组分。5.在37℃孵育60分钟。然后在85℃加热灭活5分钟。6.蛋白质k处理:每个样品1ul,在室温下持续15min7.运行tbe尿素凝胶图39示出了通过组29蛋白(从动物溃疡伯格菌(bergeyellazoohelcum)atcc43767纯化)对两种不同的egfprna的体外切割测定的结果。egfprna模板1约290nt长。egfprna模板2是约240nt长(参见图42)。反应是在50mmnacl、ph7.5(10mmtris-hcl)、0.1%bsa、1mmdtt中,并在37℃进行60min。蛋白质与crrna与靶rna的摩尔比为1:1:1。如图39所示,评估了不同的crrna。从图39以及表2中看出,可以区分切割和切割指导物。表2图40的方案:所有n2平铺实验的方案。现在盐浓度将是50mm(在100μl的rxn中2.708μl的2mnacl)6.将短crrna归一化至36.5ng/μl(在8.7μl的ddh20中5μl)。7.稀释冷冻蛋白质。(8.1μl,在21.9h2o中。)需要24个(制备30个)样品(每个样品1μl),每rxn.27μg。新原液是1μg/μl;2000mmnacl。8.将每个pam文库归一化至100ng/μl(45μlddh20中的5μl)9.制备10x缓冲液w/dtt(将10μldtt添加至90μl不含dtt的10x缓冲液中)10.制备主要混合物:egfp靶11.等分8μlmm。2.每孔添加1μl蛋白质或ddh20。3.向每孔添加1μl短crrna(36.5ng/μl)或ddh2o。4.混合各组分。5.在37℃孵育60分钟。然后在85℃加热灭活5分钟。6.蛋白质k处理:每个样品1μl,在室温下持续15min7.运行tbe尿素凝胶图40示出了通过组29蛋白(从动物溃疡伯格菌(bergeyellazoohelcum)atcc43767纯化)对egfprna(a:靶1;b:靶2;参见图41;100ng)的体外切割测定的结果。随机选择的20个靶,代表30个核苷酸靶序列任一侧上的n^2个核苷酸(即aa、ac、at、ag、...、gt、gg)。反应是在50mmnacl、ph7.5(10mmtris-hcl)、0.1%bsa、1mmdtt中,并在37℃进行60min。蛋白质与crrna与靶rna的摩尔比为1:1:1。如图39所示,评估了不同的crrna。从图40以及表3(靶1)和表4(靶2)中看出,可以区分切割和非切割指导物。表3表4从表1、表2和表3看来,如果靶序列前面有c(即“c”直接接靶序列的5'),则不会发生模板的切割。从表1和表2可以看出,如果靶序列后面跟着“a”(即c直接接靶序列的3'),则更可能切割模板。图42示出了导致靶切割的各个指导序列的位置。切割依赖性似乎不是序列特异性的,也不是二级结构依赖性的,也不是沿着rna靶的位置依赖性的。egfp靶2:#8和#17的相似切割强度(其前4个5’近端核苷酸相同并且它们的靶位置距离39个核苷酸)给出了5'近端切割依赖性的可信度。不希望受理论束缚,可能的是或许rna切割活性可能(至少部分地)不同于dna切割活性,因为在小尺度下,dna二级结构比rna二级结构(基于堆积能量的dna最近邻热力学模型比rna更精确)更加固定,这就是为什么对于dna靶向来说强或高度保守的pam序列的存在是优选的。对于rna靶向(其二级结构在与蛋白质相互作用相关的小尺度上变得更加可变),活性可能不(或不仅)依赖于rna序列本身,而是(或者也)依赖于rna二级结构。下面的rna效率筛选被用来测试这个假设。用ms2(或具有较大基因组的qbeta)感染细胞。对于组29蛋白的给定种类,设计了一个crrna文库,其中一个可以用于ngs。crrna文库由一次一个碱基对覆盖整个rna病毒基因组的靶组成,并且在病毒感染之前用组29蛋白转化到细菌中。进行阳性选择筛选,其中当从存活病毒感染的细菌菌落中收获时,最有效的切割靶相对对照crrna文库过度表达。病毒基因组的某些区域可能对切割更加耐受。鉴于筛选的单碱基对分辨率,这种对切割效率的耐受可以在空间上进行解卷积。进一步的生物物理计算分析揭示了决定切割效率的是序列还是二级结构。不希望受理论束缚,可能的是或许rna切割活性可能(至少部分地)不同于dna切割活性,因为在小尺度下,dna二级结构比rna二级结构(基于堆积能量的dna最近邻热力学模型比rna更精确)更加固定,这就是为什么存在强或高度保守性。实例3:组30蛋白要了解有关小蛋白质的更多信息,申请人完成了blast蛋白质检索。申请人感兴趣的是了解这些小蛋白质是否在其他基因组或其他基因座中。对于s2小蛋白质,唯一其他显著相似的蛋白质是其他s2蛋白质。对s1来说,有一个新物种嗜鳃黄杆菌(flavobacteriumbranchiophilum)(fb)含有它。当检测了fb小蛋白质时,发现其紧邻crispr阵列旁的大(1,151aa)蛋白质。fb大蛋白与其他与crispr阵列相关联的已知蛋白质没有同源性。blast检索只揭示了具有这种大型蛋白的三种已知物种:fb、产丙酸沼杆菌和bacteroidescoprosuis。仅观察到一个小同源性区域-与l-赖氨酸-6-单加氧酶具有同源性的34aa序列。似乎s1a小蛋白质与具有双重重复序列的crispr基因座相关联。申请人将进一步研究为什么只有三种不同的蛋白质。这可能是一个非常特定的系统,一个突变或死亡系统,或者在ncbi或其他数据库上测序覆盖很少的细菌类型中。申请人将进一步研究与l-赖氨酸-6-单加氧酶具有同源性的区域。申请人总共鉴定了5种具有显著的序列同源性的蛋白质:fb、pp和三个小于800aa(732aa、680aa和370aa)的bc蛋白质截短。实例4:生成具有增强的特异性的组29突变体最近描述了用于生成具有增强的特异性的cas9直系同源物的方法(slaymaker等人,2015)。该方案可用于增强组29直向同源物的特异性。用于诱变的主要残基都是hepn结构域内的正电荷残基,因为这是在没有晶体时唯一已知的结构,而且我们知道ruvc中的特异性突变体在cas9中起作用。hepn结构域内保守的精氨酸残基的实例是r204。另外的候选物是在不同的直向同源物之间保守的带正电荷的残基。这些可以用于生产具有增强的特异性的组29突变体。实例5:rna指导物大肠杆菌筛选和验证的设计设计rna指导物大肠杆菌筛选以确定针对rna的指导物工作的可能性。通过铺瓦大肠杆菌中的大量必需基因来鉴定靶向指导物。具体而言,基于其操纵子特有的45个必需基因创建了55,700个靶向指导物的文库。由此可以推测,观察到的任何敲低都可能是由于顺式干扰而不是反式干扰,这对于并行影响是可能的。包括整个编码区加上进入5'和3'utr中的核苷酸,大肠杆菌基因组中总共54,600个独特的位点被靶向。为了建立基线耗竭,还通过产生未映射到大肠杆菌基因组中任何地方的随机化的30个核苷酸序列来选择一千一百(1100)个非靶向指导物(“虚拟”指导物)。这些虚拟指导物的相对耗竭用于确定靶向指导物中显著的耗竭水平。如图50所示,制备了蛋白质质粒和指导物质粒,其中蛋白质质粒包含rna靶向蛋白质,例如组29大蛋白质(grp29大蛋白质),例如动物溃疡伯格菌(bergeyellazoohelcum)(bz)或颊普雷沃菌(prevotellabuccae)(pb)蛋白质或无cas蛋白和第一抗生素抗性基因(例如ampr基因),并且所述指导物质粒包含靶向指导物或非靶向指导物和第二抗生素抗性基因,例如cmr基因。从靶向指导物的文库中,生成了一个指导物质粒文库。将蛋白质质粒和指导物质粒以50/50比率共电穿孔并共同导入电感受态细胞,例如megaxdh10bt1r细胞。然后使转化的细胞在37℃生长1小时,并且随后在氯霉素和羧苄青霉素琼脂平板上孵育过夜。转化后11小时收集生长在氯霉素和羧苄青霉素琼脂平板上的菌落,并且制备dna用于测序(maxiprep,ngs文库制备,并加载到nextseq上)。该实验由每种条件(对照条件,即无cas蛋白,和实验条件,即含bz或pb)四个平板的三个生物复制(bioreps)组成。指导物丰度的互相关性如图51(含bz)和图52(含pb)所示。图53中针对bz筛选和图54中针对pb筛选示出了45个必需基因的根据基因交替着色的靶向指导物耗竭。红色水平线代表安全耗竭的线,即线以上的耗竭代表非靶向指导物以上的耗竭。非靶向(虚拟)指导物耗竭以黑色示出。图55示出了pb和bz(交叉的指导物)共同的靶向指导物的耗竭水平。如图56(bz)和图57(pb)所示,使用bz和pb使每个基因的耗竭的指导物功效归一化表明靶向位置没有空间偏差。创建序列标志,显示了左侧原型间隔子侧翼序列(lpfs)和右侧原型间隔子侧翼序列(rpfs)的核苷酸频率。如图58所示,核苷酸g、a或u在含有bz蛋白质的位置10(l1)是更优选的。换句话说,当c处于l1时,观察到很少或没有切割。类似地,pb优选l1处的a、g或u核苷酸。对于rpfs,当对于bz和pb,a、g、u或c存在于r2(位置42)或r3(位置43)时,观察到了切割。图59显示了说明bz的l1、r2和r3的核苷酸频率的原型间隔子侧翼序列(pfs)轮。图60显示了说明pb的l1、r2和r3的核苷酸频率的原型间隔子侧翼序列(pfs)轮。图61示出了固定的lpfs(l1)的rpfs(r2和r3)的平均耗竭。对于验证筛选,选择了氨苄青霉素(162个位点)/卡那霉素(162个位点)中的4种类型的位点,并产生322个位点的文库。确定在实验条件和控制条件中指导物的丰度并绘制如图62(pb)和图63(bz)所示。实验条件表示用具有文库和靶抗生素抗性基因的cas蛋白(bz或pb)筛选,并且对照条件表示仅用文库和靶抗生素抗性基因(无cas蛋白)筛选。bz和pb验证筛选的结果在图62和图63中示出。实例6:计算性序列分析从完整编译的ensembl发布27基因组(ensemblrelease27genomes)(yates等人,2016),使用piler-cr(edgar,2007)鉴定了crispr重复序列。在10kb鉴定的crispr阵列中的蛋白质被聚类成基因座,其中如果存在多于一个蛋白质大小为700个氨基酸或更大,或者存在cas1或cas2,基因座被拒绝。对于候选的2类效应物,仅选择这些其余的900aa至1800aa大小的基因座中的蛋白质。对这些候选效应物进行blastp程序(camacho等人,2008),以1e-7的e值截断值对ncbi非冗余(nr)蛋白质序列数据库进行搜索。然后将所有发现的蛋白质使用相同e值截断值通过最邻近分组方法分组为假定的家族。只考虑了具有至少10个候选效应物和crispr阵列10kb以内候选效应物的超过50%的假定家族。hhpred(remmert等人,2012)和现有的crispr基因座分类规则被用来对每个家族进行分类,使cas13b成为唯一未分类的家族。在这个家族内,舍弃截断的或可疑的部分测序的效应物,留下105个基因座,81个具有非冗余蛋白质。使用blosum62(henikoff和henikoff,1992)对这81种蛋白质(以及附属csx27和csx28蛋白质)进行多重序列比对以鉴定hepn结构域并将基因座分类到系统树中。使用viennarnafold(lorenz等人,2011)预测每个同向重复序列的二级结构,其转录方向选择为与其基因座中的cas13b相同。crispr靶(biswas等人,2013)用于针对ncbi噬菌体和质粒基因组搜索每个基因座中的间隔子。针对所有独特的同向重复序列和原型间隔子侧翼序列生成了weblogo(crooks等人,2004)。使用tmhmmserverv.2.0(moller等人,2001)预测csx27和csx28中的跨膜螺旋。实例7:rfp标记的蛋白质荧光成像用rfp(阴性对照)或融合于动物溃疡伯格菌(bergeyellazoohelcum)的csx27或颊普雷沃菌(prevotellabuccae)的csx28的n-或c-末端的rfp转化oneshotstbl3化学感受态大肠杆菌。将克隆在5ml抗生素lb中培养过夜,然后在5000g旋转沉降并重悬于含有1%的无甲醇甲醛的pbs中。固定30分钟后,将细胞用pbs洗涤一次,并且然后在pbs中以1:2稀释。将5ul样品移取到涂有硅烷的载玻片上,将其用盖玻片盖上。荧光成像在具有油浸的63倍物镜显微镜下进行。实例8:细菌rna测序使用先前描述的方案(shmakov等人,2015;heidrich等人,2015)分离rna并制备用于测序。对于天然动物溃疡伯格菌(bergeyellazoohelcum)atcc43767rna测序,我们用修改的方案重复了实验,在5’适配子连接之前省略tap以促进源自crispr阵列的处理的转录物的富集。所制备的cdna文库在miseq(illumina[亿明达公司])上测序。每个样品的读数都基于其相关的条形码进行鉴定,并使用bwa与适当的refseq参考基因组进行比对(li和durbin,2009年)。使用galaxy(https://usegalaxy.org)使用配对末端比对提取完整转录物序列,并使用geneious8.1.8分析这些序列。实例9:大肠杆菌必需基因实验取2个大肠杆菌dh10b菌株必需基因研究的交叉点(gerdes等人,2003;baba等人,2006),并通过仅选择其各自的操纵子独有的基因进一步削减该交叉点到45个基因。在所有基因中,54,600个间隔子被设计成以单一分辨率铺瓦整个编码区,并且将60nt延伸到5'utr和3'utr中。另外,将与大肠杆菌dh10b株基因组没有精确匹配的1100个非靶向随机产生的间隔子作为非靶向阴性对照添加到文库中。使用金门组装(neb)进行100次循环,将间隔子文库克隆到含有氯霉素抗性基因的动物溃疡伯格菌(bergeyellazoohelcum)或颊普雷沃菌(prevotellabuccae)同向重复-间隔子-同向重复骨架中,并且然后转化在5个22.7cmx22.7cm氯霉素lb琼脂板上。从平板上刮下转化体文库,并且使用macherey-nagelnucleobondxtramidiprep试剂盒(macherey-nagel公司)提取dna。根据制造商的方案,将50ng含有氨苄青霉素抗性基因(bzcas13b、bzcas13b&bzcsx27、pbcas13b、pbcas13b&pbcsx28、空载体pbr322)的文库质粒和等摩尔基因质粒转化到megaxdh10btmt1relectrocomptm细胞(thermofisher[赛默飞世尔公司])中,每个生物重复四个单独的22.7cmx22.7cm羧苄青霉素-氯霉素lb琼脂平板,并且每个条件三个生物重复(每个条件总共12次转化)。转化11小时后,从平板上刮下转化体文库,并使用macherey-nagelnucleobondxtramaxiprep试剂盒(macherey-nagel公司)提取dna。实例10:大肠杆菌必需基因分析制备的dna文库在nextseq(illumina[亿明达公司])上进行测序,读数映射到间隔子的输入文库。计算间隔子耗竭作为空载体条件下间隔子的读数丰度除以每个基因质粒条件下的读数丰度。计算了三次生物重复的平均耗竭,最大变异系数为0.2并且最小间隔子读数丰度为1/3n,其中n=55,700,作为质量控制过滤器。产生了强耗竭(前1%耗竭)间隔子的网络标识(crooks等人,2004年),并且从安全耗竭(高于非靶向间隔子的平均耗竭的>5σ)的间隔子与筛选的全部间隔子的比率的每个鉴定的pfs热点图中产生了网络标识。对于通过经验累积分布函数的空间分析,安全耗竭的间隔子在第一个或最后250nt的基因上聚集。对于二级结构分析,利用了来自viennarnaplfold(bernhart等人,2006)的rna可及性模型。rnaplfold通过rna折叠的移动平均来计算rna的区域u在四参数模型中给定其顺式序列的背景中不配对的概率,其中w是核苷酸的移动平均窗口长度,l是窗口中两个核苷酸之间的最大允许配对距离,u起始和u末端分别为区域u的起始和末端。为了将该模型应用于我们的数据,来自大肠杆菌必需基因筛选的间隔子被分成5个或更多的训练/测试组群,每个组群由独特的允许的pfs和基因表示,并且在筛选的前2%的耗竭间隔子中包含至少一个间隔子(以增强预测信号)。这些组群随机分为训练组(约80%)和测试组(约20%)。为了优化有效的间隔子设计的二级结构介导模型,选择最高间隔子精确预测或落入组群中的前3个耗竭间隔子中的组群的百分比作为目标函数前1和前3准确性。对训练数据集上的两个目标函数进行了优化,首先通过固定w和l,同时改变u起始和u末端,然后通过固定u起始和u末端并改变w和l(图66b)。在bzcas13b和bzcsx27以及bzcas13b单独的情况下,发现优化的参数大约为w=240,l=180,u起始=16,并且u末端=30。测量了在测试数据集上进行的相对于106montecarlo模拟的这种rnaplfold模型的性能,并且发现对于前1准确性的经验p值小于1e-2,并且对于前3准确性小于1e-5。类似的预测能力应用于pbcas13b和pbcsx28,以及单独的pbcas13b。实例11:卡那霉素验证筛选实验总共选择了160个卡那霉素靶向间隔子,其中42个包含pfs规则,其中47个包含一个规则,并且其中71个不包含规则,其中添加了162个非靶向对照间隔子。使用金门组装(neb),以100个循环,将间隔子文库克隆入含有氯霉素抗性基因的bzcas13b和动物溃疡伯格菌(bergeyellazoohelcum)同向重复序列-间隔子-同向重复序列骨架或仅仅是动物溃疡伯格菌(bergeyellazoohelcum)同向重复序列-间隔子-同向重复序列骨架,并且然后在一个22.7cmx22.7cm羧苄青霉素lb琼脂平板上转化。然后在22.7cmx22.7cm的氯霉素lb琼脂平板或22.7cmx22.7cm的卡那霉素-氯霉素lb琼脂平板上重新转化两个克隆的文库质粒。从平板上刮下转化体文库,并且使用qiagen质粒外加maxi试剂盒(qiagen[凯杰公司])提取dna。将100ng文库dna和100ng含有卡那霉素抗性基因的pmax-gfp(lonza)添加到50ul化学感受态10-β细胞(neb)中并根据制造商的方案进行转化。实例12:卡那霉素验证筛选分析制备的dna文库在nextseq(illumina[亿明达公司])上进行测序,读数映射到间隔子的输入文库。为了使两个单独克隆的间隔子丰度归一化,将给定间隔子的校正实验读数丰度计算为在bzcas13b质粒中间隔子的读数丰度(卡那霉素-氯霉素转化)乘以在非bzcas13b质粒中间隔子中的读数丰度比(仅氯霉素转化)与在bzcas13b质粒中间隔子的读数丰度比(仅氯霉素转化)的比率。实例12:ms2噬菌体滴斑测定ms2干涉的单个间隔子被命名为含有突出端的互补寡核苷酸,其允许在含有cas13b的载体中的两个同向重复序列之间的定向克隆。将10um的每种互补寡核苷酸在补充有10mmatp和5单位t4pnk(neb)的10xpnk缓冲液(neb)中退火。寡核苷酸在37℃孵育30min,然后加热至95℃5min,并且然后通过冷却至4℃进行退火。然后将退火的寡核苷酸以1:100稀释并在快速连接缓冲液和t7dna连接酶(enzymatics公司)存在下与25ngeco31i消化的cas13b载体一起孵育。使用qiaprepspinminiprep试剂盒(qiagen[凯杰公司])制备单个质粒,确认序列,并且然后转化到使用mix&go大肠杆菌转化试剂盒(zymo公司)成为感受态的c3000(atcc15597)细胞中。在使用csx27或csx28的实验中,使携带这些质粒的c3000细胞成为感受态,并且然后用cas13bdr-间隔子-dr质粒转化。转化后,挑取单个克隆并在含有适当抗生素的lb中生长过夜。第二天早上,将培养物以1:100稀释并生长至od600为2.0,然后与4ml含有顶层琼脂的抗生素(10g/l胰蛋白胨,5g/l酵母提取物,10g/l氯化钠,5g/l琼脂)混合并倒在lb-抗生素基板上。在lb中制备10倍连续稀释的ms2噬菌体,并且然后用多通道移液管点在硬化的顶层琼脂上。为了评估图4中的干扰水平,使用密钥对样品进行屏蔽,并且将噬斑形成发生的噬菌体的最低稀释度通过眼睛与pacyc进行比较,其中将在pacyc上形成噬斑的ms2的最低稀释度设定为1。实例13:dna靶向将由30nt原型间隔子和可允许的pfs可允许的pfs(5'-g、3'-aaa)组成的34nt靶序列克隆到puc19中两个位置。对于转录靶,将靶序列克隆到bla基因的编码链中,紧接在起始密码子之后的框内,起始密码子的g用作5'pfs。对于未转录的靶标,将相同的靶序列(原型间隔子和pfs)克隆到puc19的aatii位点,使得原型间隔子相对于pbla和plac启动子出现在未转录的链上。为了确定干扰,将25ng氨苄青霉素抗性靶质粒和25ng氯霉素抗性bzcas13b或空载体(pacyc)添加到5μl的novabluegigasingle细胞(novagen公司)中。将细胞在冰上孵育30分钟,在42℃热休克30秒并在冰上孵育2分钟。然后,将95ul的soc添加到细胞中,并将它们在37℃振荡孵育90分钟,然后在含有氯霉素和氨苄青霉素的平板上铺平全部生长物(100μl)。方法参考文献1.babat,arat,hasegawam,takaiy,okumuray,babam,etal.constructionofescherichiacolik-12in-frame,single-geneknockoutmutants:thekeiocollection.molecularsystemsbiology.2006;2:20060008.doi:10.1038/msb4100050.pubmedpmid:16738554;pubmedcentralpmcid:pmc1681482.2.bernhartsh,hofackeril,stadlerpf.localrnabasepairingprobabilitiesinlargesequences.bioinformatics.2006;22(5):614-5.doi:10.1093/bioinformatics/btk014.pubmedpmid:16368769.3.biswasa,gagnonjn,brounssj,fineranpc,browncm.crisprtarget:bioinformaticpredictionandanalysisofcrrnatargets.rnabiology.2013;10(5):817-27.doi:10.4161/rna.24046.pubmedpmid:23492433;pubmedcentralpmcid:pmc3737339.4.camachoc,coulourisg,avagyanv,man,papadopoulosj,bealerk,etal.blast+:architectureandapplications.bmcbioinformatics.2009;10:421.doi:10.1186/1471-2105-10-421.pubmedpmid:20003500;pubmedcentralpmcid:pmc2803857.5.crooksge,hong,chandoniajm,brennerse.weblogo:asequencelogogenerator.genomeresearch.2004;14(6):1188-90.doi:10.1101/gr.849004.pubmedpmid:15173120;pubmedcentralpmcid:pmc419797.6.edgarrc.piler-cr:fastandaccurateidentificationofcrisprrepeats.bmcbioinformatics.2007;8:18.doi:10.1186/1471-2105-8-18.pubmedpmid:17239253;pubmedcentralpmcid:pmc1790904.7.gerdessy,schollemd,campbelljw,balazsig,ravasze,daughertymd,etal.experimentaldeterminationandsystemlevelanalysisofessentialgenesinescherichiacolimg1655.journalofbacteriology.2003;185(19):5673-84.pubmedpmid:13129938;pubmedcentralpmcid:pmc193955.8.heidrichn,dugarg,vogelj,sharmacm.investigatingcrisprrnabiogenesisandfunctionusingrna-seq.methodsinmolecularbiology.2015;1311:1-21.doi:10.1007/978-1-4939-2687-9_1.pubmedpmid:25981463.9.henikoffs,henikoffjg.aminoacidsubstitutionmatricesfromproteinblocks.proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica.1992;89(22):10915-9.pubmedpmid:1438297;pubmedcentralpmcid:pmc50453.10.lih,durbinr.fastandaccurateshortreadalignmentwithburrows-wheelertransform.bioinformatics.2009;25(14):1754-60.doi:10.1093/bioinformatics/btp324.pubmedpmid:19451168;pubmedcentralpmcid:pmc2705234.11.lorenzr,bernhartsh,honerzusiederdissenc,taferh,flammc,stadlerpf,etal.viennarnapackage2.0.algorithmsformolecularbiology:amb.2011;6:26.doi:10.1186/1748-7188-6-26.pubmedpmid:22115189;pubmedcentralpmcid:pmc3319429.12.mollers,croningmd,apweilerr.evaluationofmethodsforthepredictionofmembranespanningregions.bioinformatics.2001;17(7):646-53.pubmedpmid:11448883.13.remmertm,biegerta,hausera,sodingj.hhblits:lightning-fastiterativeproteinsequencesearchingbyhmm-hmmalignment.naturemethods.2012;9(2):173-5.doi:10.1038/nmeth.1818.pubmedpmid:22198341.14.shmakovs,abudayyehoo,makarovaks,wolfyi,gootenbergjs,semenovae,etal.discoveryandfunctionalcharacterizationofdiverseclass2crispr-cassystems.molecularcell.2015;60(3):385-97.doi:10.1016/j.molcel.2015.10.008.pubmedpmid:26593719;pubmedcentralpmcid:pmc4660269.15.yatesa,akanniw,amodemr,barrelld,billisk,carvalho-silvad,etal.ensembl2016.nucleicacidsresearch.2016;44(d1):d710-6.doi:10.1093/nar/gkv1157.pubmedpmid:26687719;pubmedcentralpmcid:pmc4702834.***虽然已经在本文示出并描述了本发明的优选实施例,但是对本领域的普通技术人员而言应该显而易见是这样的实施例仅以举例方式提供。在不偏离本发明的情况下众多变化、改变和取代现在将被本领域的普通技术人员想到。应该理解的是,在实践本发明中可以采用本文描述的本发明的实施例的不同替代方案。旨在按照以下权利要求限定本发明的范围,并且在这些权利要求范围内的方法和结构及其等同物也包括在本发明的范围内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1