用于使用CRISPR相关基因RNA引导阻遏转录的方法和组合物与流程

文档序号:12285350阅读:2788来源:国知局
本发明涉及合成CRISPR-Cas系统及其用于阻遏和调节基因表达的使用方法。发明背景成簇的规律间隔的短回文重复(ClusteredRegularlyInterspacedShortPalindromicRepeats,CRISPR)与CRISPR相关基因(cas)的组合构成CRISPR-Cas系统,其在许多细菌和大多数古细菌中赋予适应性免疫。CRISPR介导的免疫通过整合来自侵入性遗传元件诸如质粒和噬菌体的DNA而发生,其可以用于阻碍含有相同序列的侵入物的未来感染。CRISPR-Cas系统由通过高变“间隔区”序列和侧翼cas基因的集合间插的短DNA“重复”的CRISPR阵列组成。该系统通过经由外来核酸的序列特异性靶向和干扰提供针对侵入性遗传元件诸如噬菌体和质粒的适应性免疫来发挥作用(Barrangou等人2007.Science.315:1709-1712;Brouns等人2008.Science321:960-4;HorvathandBarrangou.2010.Science.327:167-70;MarraffiniandSontheimer.2008.Science.322:1843-1845;Bhaya等人2011.Annu.Rev.Genet.45:273-297;TernsandTerns.2011.Curr.Opin.Microbiol.14:321-327;Westra等人2012.Annu.Rev.Genet.46:311-339;BarrangouR.2013.RNA.4:267-278)。通常,获得侵入性DNA序列作为新型“间隔区”(Barrangou等人2007.Science.315:1709-1712),每个与CRISPR重复配对并作为CRISPR基因座中的新型重复间隔区单元插入。“间隔区”由所有CRISPR-Cas系统通用的Cas1和Cas2蛋白获得(Makarova等人2011.NatureRev.Microbiol.9:467-477;Yosef等人2012.NucleicAcidsRes.40:5569-5576),其中在一些系统中由Cas4蛋白质参与(Plagens等人2012.J.Bact.194:2491–2500;Zhang等人2012.PLoSOne7:e47232)。所得重复间隔区阵列被转录为长的前-CRISPRRNA(前-crRNA)(Brouns等人,2008.Science321:960-4),其被加工成驱动DNA或RNA的序列特异性识别的CRISPRRNAs(crRNA)。具体地,crRNA引导核酸酶朝向由Cas内切核酸酶介导的序列特异性核酸切割的互补靶标(Garneau等人2010.Nature.468:67-71;Haurwitz等人2010.Science.329:1355-1358;Sapranauskas等人2011.NucleicAcidRes.39:9275-9282;Jinek等人2012.Science.337:816-821;Gasiunas等人2012.Proc.Natl.Acad.Sci.109:E2579-E2586;Magadan等人2012.PLoSOne.7:e40913;Karvelis等人2013.RNABiol.10:841-851)。这些广泛的系统存在于近一半的细菌(~46%)和大多数古细菌(~90%)。它们基于驱动crRNA生物发生的生物化学过程中的cas基因含量、组织和变化以及介导靶标识别和切割的Cas蛋白质复合物,它们被分为三种主要类型(Makarova等人2011.NatureRev.Microbiol.9:467-477;Makarova等人2013.NucleicAcidRes.41:4360-4377)。I型系统在细菌和古细菌(Makarova等人2011.NatureRev.Microbiol.9:467-477)中最普遍并靶向DNA(Brouns等人2008.Science321:960-4)。被称为用于抗病毒防御的CRISPR相关复合物(Cascade)的3-8种Cas蛋白的复合物加工前-crRNA(Brouns等人2008.Science321:960-4),保留crRNA以识别与crRNA的间隔区部分互补的被称为“原间隔区”的DNA序列。除了crRNA间隔区和原间隔区之间的互补性,靶向需要位于原间隔区的5’末端的原间隔区相邻基序(PAM)(Mojica等人2009.Microbiology155:733-740;Sorek等人2013.Ann.Rev.Biochem.82:237-266)。对于I型系统,PAM直接由Cascade识别(Sashital等人2012.Mol.Cell46:606-615;Westra等人2012.Mol.Cell46:595-605)。所需的精确PAM序列可以在不同的I型系统之间变化,并且可以通过建立的生物信息学和实验方法来鉴定(Esvelt等人2013.Nat.Methods10:1116-11121;Jiang等人2013.Nat.Biotechnol.31:233-239;Mojica等人2009.Microbiology155:733-740)。一旦识别原间隔区,Cascade通常募集核酸内切酶Cas3,其切割和降解靶DNA(Sinkunas等人2011.EMBOJ.30:1335-1342;Sinkunas等人2013.EMBOJ.32:385-394)。干扰需要表达构成复合物的所有Cas蛋白质、Cas3蛋白质和CRISPR阵列。在大多数生物体中,这些蛋白质似乎是组成型表达的,尽管在一些实例中,这些蛋白质中的一些诱导性表达。例如,在大肠杆菌中,编码复合物的基因编码于在正常生长条件下被阻遏的单个操纵子中。然而,可以通过缺失阻遏子H-NS来消除操纵子的阻遏(Pul等人2010.Mol.Microbiol.75:1495-1512;Westra等人2010.Mol.Microbiol.77:1380-1393)。本公开提供了用于靶向基因沉默的方法和组合物,其不仅提供阻遏一种或多种目标基因的表达的能力,而且提供调节一种或多种目标基因表达的阻遏的能力。发明概述在一个方面,提供了重组核酸分子,其包含编码来自I型CRISPR-cas系统的CRISPR-cas多肽或其功能片段的子集的核苷酸序列。在一些方面,本发明的重组核酸包含编码与I型Cascade多肽具有实质同一性的三种或更多种I型Cascade多肽的核苷酸序列。在还有其它方面,三种或更多种I型Cascade多肽或其功能片段可以融合以形成单一多肽。在另一个方面,提供了重组核酸分子,其包含与以下具有实质相似性的核苷酸序列:(a)编码Cas6b多肽的核苷酸序列,编码Cas8b(Csh1)多肽的核苷酸序列,编码Cas7(Csh2)多肽的核苷酸序列和编码Cas5多肽的核苷酸序列(I-B型);(b)编码Cas5d多肽的核苷酸序列,编码Cas8c(Csd1)多肽的核苷酸序列和编码Cas7(Csd2)多肽的核苷酸序列(I-C型);(c)编码Cse1(CasA)多肽的核苷酸序列,编码Cse2(CasB)多肽的核苷酸序列,编码Cas7(CasC)多肽的核苷酸序列,编码Cas5(CasD)多肽的核苷酸序列和核苷酸序列编码Cas6e(CasE)多肽(I-E型);(d)编码Cys1多肽的核苷酸序列,编码Cys2多肽的核苷酸序列,编码Cas7(Cys3)多肽的核苷酸序列和编码Cas6f多肽的核苷酸序列(I-F型);(e)编码Cas7(Csa2)多肽的核苷酸序列,编码Cas8a1(Csx13)多肽或Cas8a2(Csx9)多肽的核苷酸序列,编码Cas5多肽的核苷酸序列,编码Csa5多肽的核苷酸序列,编码Csa5多肽的核苷酸序列,编码Cas6a多肽的核苷酸序列,编码Cas3’多肽的核苷酸序列和编码不具有核酸酶活性的Cas3”多肽的核苷酸序列(I-A型);和/或(f)编码Cas10d(Csc3)多肽的核苷酸序列,编码Csc2多肽的核苷酸序列,编码Csc1多肽的核苷酸序列,编码Cas6d多肽的核苷酸序列(I-D型)。本发明的一个进一步的方面提供了重组成簇的规律间隔的短回文重复(ClusteredRegularlyInterspacedShortPalindromicRepeats,CRISPR)RNA,其包含至少一个在其3’末端连接至重复核苷酸序列的间隔区核苷酸序列,其中所述至少一个间隔区核苷酸序列任选地在其5’末端包含至少一个额外核苷酸。本发明的一个额外方面提供了重组CRISPR阵列,其包含两个或更多个重复核苷酸序列和一个或多个间隔区核苷酸序列,其中所述CRISPR阵列中的每个间隔区核苷酸序列在其5'端和在其3'端连接至重复核苷酸序列。本发明的另一个方面提供了用于阻遏目标核苷酸序列的表达(例如,减少转录)的方法,其包括:将本发明的重组核酸分子和本发明的至少一个重组CRISPR阵列引入生物体,由此阻遏所述生物体中的所述目标核苷酸序列的表达。一个进一步方面提供了用于调节(增加/减少)目标基因的阻遏的方法,其中引入生物体的至少一个重组CRISPR阵列包含至少两个间隔区核苷酸序列(各自包含与来自单个目标基因的不同目标核苷酸序列互补的核苷酸序列),由此调节所述目标基因的阻遏。一个又进一步方面提供了用于阻遏生物体中的至少两种基因的表达的方法,其中所述至少一个重组CRISPR阵列包含至少两个间隔区核苷酸序列(各自包含与来自不同目标基因的不同目标核苷酸序列互补的核苷酸序列),由此阻遏所述生物体中至少两种基因的表达。本发明的一个进一步方面包括阻遏细菌或古细菌目标核苷酸序列的表达(减少转录)的方法,其包括:破坏细菌或古细菌中的内源性cas3核苷酸序列,其中破坏的内源性cas3核苷酸序列不存在,或存在、但不表达,和/或表达、但无功能;和将至少一个包含本发明的重组CRISPR阵列的表达盒引入所述细菌或古细菌,由此阻遏所述细菌或目标核苷酸序列的表达。在一些实施方案中,所述方法进一步包括调节(增加/减少)目标基因的阻遏(例如,转录降低),其中至少一个重组CRISPR阵列包含至少两个间隔区核苷酸序列(各自包含与来自单个目标基因的不同目标核苷酸序列互补的核苷酸序列),由此调节所述细菌或古细菌目标基因的阻遏。一个又进一步方面包括阻遏细菌或古细菌中的至少两种目标基因的表达,其中所述至少一个重组CRISPR阵列包含至少两个间隔区核苷酸序列(各自包含与来自不同目标基因的不同目标核苷酸序列互补的核苷酸序列),且所述细菌或古细菌包含破坏的内源性cas3核苷酸序列,由此阻遏所述细菌或古细菌中的至少两个目标基因的表达。本文进一步提供了包含本发明的重组核酸分子、CRISPR阵列和/或核苷酸序列的表达盒、细胞和试剂盒。本发明的这些和其它方面在下面本发明的描述中更详细地记载。附图简述图1显示编码在LacZ启动子控制下的荧光GFP多肽的质粒pUA66lacZ中的感兴趣区域。长箭头表示gfp的编码区。细黑色箭头表示以黑色描绘的启动子的-35和-10元件起始转录。顶部上的每个间隔区匹配顶部链或编码链(并因此结合底部链或非编码链)。类似地,底部上的每个间隔区匹配底部链或非编码链(并因此结合顶部链)。确立的PAMAAG或AGG位于每个原间隔区的5'末端。图2提供显示使用如本文描述的本发明的方法转录阻遏携带质粒pUA66lacZ的大肠杆菌K-12亚株MG1655中的荧光GFP蛋白质的图。使携带具有指定间隔区的pCRISPR质粒的细胞在补充有0.4%甘油和0.2%酪蛋白氨基酸的M9基本培养基中生长,反向稀释至相同培养基中,并培养6小时至对数中期。然后在AccuriC6流式细胞仪上测量荧光。倍数变化w.r.t.pCRISPR意指相对于pCRISPR的倍数变化。pCRISPR是相同的质粒,但不编码靶向GFP基因的间隔区。图3提供携带具有靶向不同内源性糖利用操纵子的间隔区的质粒的转导MG1655细胞的培养物的光密度(ABS600)的条形图,且显示所得的对指示糖上的培养物生长的影响。用pCRISPR质粒(pCRISPR)或携带针对相关糖的利用基因的启动子(ParaB,L-阿拉伯糖的araB启动子;PlacZ,乳糖的lacZ启动子;和PxylA,D-木糖的xylA启动子)的间隔区的相同质粒转化细胞。使细胞在补充有甘油的M9培养基中生长24小时,在补充有指定碳源的M9培养基中反向稀释至0.001的ABS600,并培养22小时。条形图报道使用Nanodrop2000c分光光度计测量的最终ABS600值。图4A-4B显示大肠杆菌K-12中的I-E型CRISPR-Cas系统。图4A提供I-E型系统的遗传基因座。cas3基因位于编码Cascade蛋白质复合物的casABCDE操纵子的上游。两个下游基因cas1和cas2参与间隔区获取。天然间隔区阵列由相同重复(白色椭圆形)和间插间隔区(灰色圆形)构成。图4B显示基于先前工作(Sorek等人(2013)Annu.Rev.Biochem.,82,237-266;Barrangou等人(2007)Science,315,1709-17122)的DNA破坏机制。转录的阵列由Cascade加工成单个crRNA。阵列的间隔区部分然后用于鉴定侧接PAM的互补DNA序列(黑色圆形)。DNA结合导致Cas3的募集,所述Cas3裂解和降解目标DNA。图5A-5B显示再利用大肠杆菌K-12中的I-E型CRISPR-Cas系统用于可编程基因阻遏。图5A显示I-E型CRISPR-Cas系统转化为可编程阻遏物。cas3的缺失和Cascade操纵子上游组成型启动子的插入允许crRNA引导的DNA结合而不切割。图5B显示crRNA引导的基因阻遏的推定机制。Cascade将转录的CRISPR阵列加工成单个crRNA。Cascade-crRNA复合物然后结合侧接PAM(黑色圆形)的目标DNA序列(灰色线),导致转录阻遏。图6提供合成的I-E型CRISPR阵列的克隆方案。鉴定目标序列中的PAM之后,下游32个碱基对充当原间隔区。将除了最后两个碱基对以外的所有碱基对拷贝至两个退火的寡核苷酸,当退火时,其形成重复-间隔区对。间隔区-重复对含有用于切割的KpnI限制性位点(左侧)和切割的XhoI限制性位点(右侧)以及内部XhoI限制性位点的突出端。只要原间隔区中的第30个碱基不是C,退火的寡核苷酸连接至用KpnI/XhoI消化的任一质粒就破坏原始XhoI限制位点。因此,随后可以将额外的重复-间隔区插入KpnI/XhoI限制性位点。图7A-7C显示用大肠杆菌K-12中的再利用的I-E型CRISPR-Cas系统的RNA介导的转录阻遏。图7A显示基于质粒的GFP表达的靶向沉默。gfp基因在低拷贝质粒pUA66-lacZ中的lacZ启动子的控制下。每个间隔区序列(中间灰色线)和PAM(黑色圆形)匹配原间隔区的最接近链。RBS,核糖体结合位点。图7B显示GFP表达的位置依赖性和链依赖性的阻遏。携带中拷贝pUA66-lacZ和指定单一间隔区质粒的BW25113Δcas3::cat在用IPTG和L-阿拉伯糖诱导后进行流式细胞术分析。非靶向mviM间隔区充当阴性对照。阻遏被计算为诱导型无间隔区质粒(pcrRNA.ind)和每种单个间隔区质粒的自发荧光被减去的荧光的比率。图7C显示基因沉默的可逆性。将携带pUA66-lacZ和无间隔区质粒(pcrRNA.ind,白色圆形)或T2单间隔区质粒(T2,灰色圆形)的BW25113Δcas3::cat细胞仅用IPTG预诱导,并转换为IPTG和L-阿拉伯糖(左侧)或用IPTG和L-阿拉伯糖预诱导并转换为仅IPTG(右侧)。在t=0时诱导物转换之后,随时间追踪单个细胞的自发荧光被减去的荧光和培养物的浊度。具有靶向质粒的细胞的GFP荧光相比于具有不含间隔区的质粒的细胞低约10倍,这归因于在这些生长条件下从ParaB启动子的渗漏表达(Afroz等人(2014)TACSSynth.Biol.,10.1021/sb400162z)。值代表从三个独立集落开始的独立实验开始的几何平均值和S.E.M。C中的误差条小于符号。图8A-8C显示亲本菌株BW25113和NM500的变体中的GFP表达和DNA转化。图8A显示BW25113(顶部)或携带pUA66-lacZ和所示质粒的BW25113ΔCRISPR-Cas(底部)的GFP荧光。在流式细胞术分析前,使细胞在含有0.2%酪蛋白氨基酸、0.4%甘油、0.2%L-阿拉伯糖和0.1mMIPTG的M9最低培养基中培养约3-4小时至ABS600~0.2。报道的值是绝对荧光减去来自缺少GFP的细胞的自发荧光。图8B显示cas3存在或不存在的情况下的转化效率。携带pUA66-lacZ的BW25113Δcas3::cat或NM500cas3+细胞用50ng所示质粒转化,并铺板于具有氨苄青霉素、卡那霉素、IPTG和L-阿拉伯糖的LB琼脂上,并计数集落数。菌株之间的转化效率的差异归因于转换比色杯制造商。图8C显示在切除抗性盒或在cas3存在的情况下的GFP阻遏。携带pUA66-lacZ和pCRISPR.ind、pCRISPR.ind-T2(T2)、pCRISPR.ind-NT2(NT2)或pCRISPR.ind-mviM(mviM)的BW25113Δcas3或NM500cas3+细胞如图8A所示生长。阻遏被计算为pcrRNA.ind和每种单个间隔区质粒的自发荧光被减去的荧光的比率。对于更多信息,参见图7A-7C。值代表来自三个集落的独立实验的几何平均值和S.E.M。图9显示阵列长度和间隔区位置对沉默效率的影响。携带pUA66-lacZ和所示诱导型CRISPR阵列质粒的BW25113Δcas3::cat细胞在用IPTG和L-阿拉伯糖诱导后进行流式细胞术分析。阻遏被计算为诱导型无间隔区质粒(pcrRNA.ind)和每种多间隔区质粒的自发荧光被减去的荧光的比率。重复,白色椭圆形;T2间隔区,深灰色圆形;与肠道沙门氏菌(Salmonellaenterica)mviM基因匹配的非靶向间隔区,浅灰色圆形。值代表从三个独立集落开始的独立实验开始的几何平均值和S.E.M。图10A-10D显示内源性基因和途径的靶向抑制。图10A显示负责糖分解代谢的靶向操纵子。间隔区被设计为靶向在其同源糖上生长所需的每个分解代谢操纵子的启动子。图10B显示启动子活性的阻遏。阻遏被计算为组成型无间隔区质粒(pcrRNA.con)和每种单间隔区或多间隔区质粒的自发荧光被减去的荧光的比率。值代表来自三个集落的独立实验的几何平均值和S.E.M。图10C显示内源性基因的阻遏。在用同源糖诱导后,收集具有所示单间隔区质粒的MG1655Δcas3::cat细胞的总RNA,并进行qRT-PCR分析。阻遏被计算为来自无间隔区质粒(pcrRNA.con)和所示单间隔区质粒的相对mRNA水平的比率。值代表四重技术重复的几何平均值和S.E.M。图10D显示生长的靶向抑制。使携带所示单间隔区或多间隔区质粒的MG1655Δcas3::cat细胞在作为唯一碳源的每种糖上生长。在生长24小时后测量浊度。值代表从三个独立集落开始的独立实验的测量的ABS600值的几何平均值。图11A-11B显示生长测定的扩展信息。图11A显示生长测定的各个ABS600值。数据代表图10D中所示的那些,除了最后一列显示含有四种糖的培养基中的生长。各点代表来自独立培养物的个别测量值。图11B提供在以所示糖作为唯一碳源的最低培养基中生长的携带组成型pcrRNA.con质粒的MG1655Δcas3细胞的倍增时间。值代表来自三个集落的独立实验的几何平均值和S.E.M。图12A-12B显示在本发明的重组构建体中改变间隔区长度对阻遏的影响。图12A显示构建体和原间隔区的位置。对于更多信息,参见图7A。图12B显示通过增加间隔区的长度而增加阻遏,并且通过减小间隔区长度而减少阻遏。图13显示针对间隔区长度变体靶向的不同位置的示意图。T2靶向启动子区域中的模板链,T4靶向编码区中的模板链,且NT3靶向非翻译区中的非模板链。图14显示NT3增加间隔区长度变体的平均阻遏倍数。除了标准的30个核苷酸以外指定长度。例如,NT3+12编码42个核苷酸的间隔区。图15显示T2间隔区长度变体的平均阻遏倍数。对于关于间隔区长度的更多信息,参见图14。图16显示T4间隔区长度变体的平均阻遏倍数。对于关于间隔区长度的更多信息,参见图14。图17显示破坏较长间隔区和靶标之间的碱基配对相互作用的示意图。底部图描绘T2+12突变体,其中远离crRNA的5’柄的额外12个核苷酸被设计为不与靶标进行碱基配对。在间隔区的前30个核苷酸与靶标之间保持碱基配对。图18显示T2突变型间隔区的平均阻遏倍数。图19显示NT3突变型间隔区的平均阻遏倍数。图20A-20B显示用来自耐盐芽孢杆菌(Bacillushalodurans)I-C型CRISPR-Cas系统的Cascade的靶向基因阻遏。图20A显示了耐盐芽孢杆菌I-C型Cascade操纵子(上图)和引导Cascade复合物通过靶向lac启动子沉默GFP表达的CRISPR(下图);图20B显示通过流式细胞术分析对培养物的荧光测量。发明详述现在下文将参考其中显示本发明的实施方案的附图和实施例描述本发明。本说明不意欲为本发明可以其实施的所有不同方式或可以加入本发明中的所有特征的详细目录。例如,关于一个实施方案所说明的特征可以并入其它实施方案中,并且关于一个具体实施方案所说明的特征可以从该实施方案删除。因此,本发明考虑,在本发明的一些实施方案中,可以排除或省略本文所述的任何特征或特征的组合。此外,鉴于本公开内容,对本文建议的各种实施方案的许多变化和添加对于本领域技术人员是明显的,这不背离本发明。因此,以下说明意欲举例说明本发明的一些具体实施方案,并且并没有穷尽地指明其所有排列、组合和变化。除非另有定义,本文所使用的所有技术和科学术语具有与本发明所属领域普通技术人员通常理解的相同含义。本发明的说明书中使用的术语仅用于描述具体实施方案的目的,且不意欲限制本发明。本文引用的所有出版物、专利申请、专利和其它参考文献对于其中呈现参考的句子和/或段落相关的教导以其整体通过引用并入本文。除非上下文另有说明,否则特别意欲本文描述的本发明的各个特征可以以任何组合使用。此外,本发明还考虑,在本发明的一些实施方案中,可以排除或省略本文所述的任何特征或特征的组合。为了举例说明,如果说明书规定复合物包含组分A、B和C,则特别意欲可以单独或组合地省略和排除保护任何A、B或C或其组合。如本发明说明书和随附权利要求中所使用,单数形式“一(a)”、“一(an)”和“该(the)”意欲同样包括复数对象,除非上下文另有清楚指出。同样如本文所使用的“和/或”是指且涵盖,一个或多个相关所列项的任何和所有可能组合,以及当以替代方式(“或”)解释时缺乏组合。如本文所使用的术语“约”,当指可测量的值诸如剂量或时间段等时,是指指定量的±20%、±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。如本文所使用的短语诸如“X和Y之间”与“约X和Y之间”应当解释为包括X和Y。如本文所使用的短语诸如“约X和Y之间”意指“约X和约Y之间”,并且短语诸如“约X至Y”意指“约X至约Y”。如本文所使用的术语“包含(comprise)”、“包含(comprises)”和“包含(comprising)”指示所说明的特征、整数、步骤、操作、要素和/或组分的存在,但不排除一个或多个其它特征、整数、步骤、操作、要素、组分和/或其组的存在或添加。如本文所使用的过渡短语“基本上由...组成”意指权利要求的范围应被解释为涵盖权利要求中记载的指定材料或步骤,以及不实质性影响请求保护的发明的基本和新颖特征的那些。因此,术语“基本上由...组成”,当在本发明的权利要求中使用时,不意欲被解释为等同于“包含”。如本文所使用的“嵌合”是指其中至少两种组分源自不同来源(例如,不同生物体、不同编码区)的核酸分子或多肽。如本文所使用的“互补物”可以意指与比较核苷酸序列的100%互补性或同一性,或者其可以意指小于100%互补性(例如,约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%等的互补性)。如本文所使用的术语“互补的”或“互补性”是指多核苷酸在允许的盐和温度条件下通过碱基配对的天然结合。例如,序列“5’-A-G-T-3’”与互补序列“5’-T-C-A-3’”结合。两个单链分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在完全互补性时,它可以是完全的。核酸链之间的互补性程度对核酸链之间的杂交的效率和强度具有显著影响。如本文所使用的“接触(contact)”、“接触(contacting)”、“接触(contacted)”及其语法变化是指在适合于实施期望反应(例如,整合,转化,位点特异性切割(切口、切割),扩增,感兴趣多肽的位点特异性靶向等)的条件下将期望反应的组分放在一起。用于实施这样的反应的方法和条件是本领域众所周知的(参见,例如,Gasiunas等人(2012)Proc.Natl.Acad.Sci.109:E2579-E2586;M.R.GreenandJ.Sambrook(2012)MolecularCloning:ALaboratoryManual.4thEd.,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY)。如本文所使用的用于抗病毒防御的I型成簇的规律间隔的短回文重复(ClusteredRegularlyInterspacedShortPalindromicRepeats,CRISPR)相关复合物(Cascade)是指参与pre-crRNA的加工和随后与I型CRISPR-Cas系统中的目标DNA结合的多肽的复合物。这些多肽包括,但不限于,I型I-A、I-B、I-C、I-D、I-E和I-F亚型的Cascade多肽。I-A型多肽的非限制性实例包括Cas7(Csa2)、Cas8a1(Csx13)、Cas8a2(Csx9)、Cas5、Csa5、Cas6a、Cas3’和/或Cas3”。I-B型多肽的非限制性实例包括Cas6b、Cas8b(Csh1)、Cas7(Csh2)和/或Cas5。I-C型多肽的非限制性实例包括Cas5d、Cas8c(Csd1)和/或Cas7(Csd2)。I-D型多肽的非限制性实例包括Cas10d(Csc3)、Csc2、Csc1和/或Cas6d。I-E型多肽的非限制性实例包括Cse1(CasA)、Cse2(CasB)、Cas7(CasC)、Cas5(CasD)和/或Cas6e(CasE)。I-F型多肽的非限制性实例包括Cys1、Cys2、Cas7(Cys3)和/或Cas6f(Csy4)。因此,在本发明的一些实施方案中,重组核酸包含编码I型Cascade多肽的子集的核苷酸序列,基本上由其组成,或由其组成,所述I型Cascade多肽发挥功能以加工CRISPR阵列,随后使用加工的CRISPRRNA的间隔区作为指导结合目标DNA。核苷酸序列的“片段”或“部分”将被理解为意指这样的核苷酸序列,其相对于参考核酸或核苷酸序列长度减少(例如,减少1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20或更多个核苷酸),并且包含与参考核酸或核苷酸序列相同或几乎相同(例如,50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续核苷酸的核苷酸序列,基本上由其组成,和/或由其组成。根据本发明的这样的核酸片段或部分可以在适当时包括于其作为成分的较大多核苷酸中。在一些实施方案中,多核苷酸的片段可以是编码保留其功能的多肽的片段(例如,编码与野生型多肽相比长度减少、但其保留1型Cascade蛋白质的至少一种功能(例如,加工CRISPRRNA,结合DNA和/或形成复合物)的1型Cascade多肽的片段)。如本文所使用的术语“基因”是指能够用于产生mRNA、tRNA、rRNA、miRNA、抗微小RNA、调节RNA等的核酸分子。基因可以能够或不能用于产生功能性蛋白质或基因产物。基因可以包括编码区和非编码区两者(例如,内含子、调节元件、启动子、增强子、终止序列和/或5'和3'非翻译区)。基因可以是“分离的”,其意指实质上或基本上不含通常在其天然状态下与核酸缔合的组分的核酸。这样的组分包括其它细胞材料,来自重组生产的培养基和/或用于化学合成核酸的各种化学品。如本文所使用的“发夹序列”是包含发夹的核苷酸序列。发夹(例如茎-环,折回)是指具有二级结构的核酸分子,所述二级结构包括形成在任一侧进一步侧接双链区域的单链的核苷酸区域。这样的结构是本领域众所周知的。如本领域已知,双链区域可以包含碱基配对中的一些错配或可以是完全互补的。在一些实施方案中,重复核苷酸序列包含发夹序列,基本上由其组成,或由其组成,所述发夹序列位于所述重复核苷酸序列内(即,重复核苷酸序列的至少一个核苷酸(例如,一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个)存在于所述重复核苷酸序列内的发夹的任一侧上)。“异源”或“重组”核苷酸序列是与其被引入的宿主细胞不天然相关的核苷酸序列,包括天然存在的核苷酸序列的非天然存在的多个拷贝。具有同源性的不同核酸或蛋白质在本文中称为“同源物”。术语同源物包括来自相同和其它物种的同源序列和来自相同和其它物种的直系同源序列。“同源性”是指两个或更多个核酸和/或氨基酸序列之间在位置同一性(即,序列相似性或同一性)的百分比方面的相似性水平。同源性还指不同核酸或蛋白质之间类似功能特性的概念。因此,本发明的组合物和方法进一步包含本发明的核苷酸序列和多肽序列的同源物。如本文所使用的“直系同源物”是指在物种形成期间从共同祖先基因产生的不同物种中的同源核苷酸序列和/或氨基酸序列。本发明的核苷酸序列的同源物与所述本发明的核苷酸序列具有实质性序列同一性(例如,至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和/或100%)。如本文所使用的杂交(hybridization)、杂交(hybridize)、杂交(hybridizing)和其语法变化是指其中存在一些错配的碱基对的两个互补核苷酸序列或基本上互补的序列的结合。杂交条件是本领域众所周知的,并且基于核苷酸序列的长度和核苷酸序列之间的互补程度而变化。在一些实施方案中,杂交条件可以是高严格性,或者它们可以是中严格性或低严格性,这取决于互补性的量和待杂交的序列的长度。为了核苷酸序列之间的杂交而构成低、中和高严格性的条件是本领域众所周知的(参见,例如,Gasiunas等人(2012)Proc.Natl.Acad.Sci.109:E2579-E2586;M.R.Green和J.Sambrook(2012)MolecularCloning:ALaboratoryManual.第4版,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY)。如本文所使用的术语“增加(increase)”、“增加(increasing)”、“增加(increased)”、“增强(enhance)”、“增强(enhanced)”、“增强(enhancing)”和“增强(enhancement)”(及其语法变化)描述了与对照相比提高至少约5%、10%、15%、20%、25%、50%、75%、100%、150%、200%、300%、400%、500%、750%、1000%、2500%、5000%、10,000%、20,000%或更多(例如,靶向特定基因的CRISPR阵列,所述特定基因具有(例如)更多靶向该基因的不同区域的间隔区核苷酸序列,因此与靶向相同基因、但具有(例如)更少靶向该基因的不同区域的间隔区核苷酸序列的CRISPR阵列相比具有该基因的增加阻遏)。“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在的或内源的核酸、核苷酸序列、多肽或氨基酸序列。因此,例如,“野生型mRNA”是天然存在于生物体中或内源于生物体的mRNA。“同源”核酸序列是与其被引入的宿主细胞天然相关的核苷酸序列。还如本文所使用的术语“核酸”、“核酸分子”、“核酸构建体”、“核苷酸序列”和“多核苷酸”是指线性或分支的、单链或双链的RNA或DNA,或其杂合体。该术语还涵盖RNA/DNA杂合体。当合成产生dsRNA时,不太常见的碱基,诸如肌苷、5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤及其它也可用于反义、dsRNA和核酶配对。例如,含有尿苷和胞苷的C-5丙炔类似物的多核苷酸已显示以高亲和力结合RNA,并且是基因表达的有效反义抑制剂。也可以进行其它修饰,诸如对RNA的磷酸二酯骨架或核糖糖基团中的2'-羟基的修饰。本公开的核酸构建体可以是DNA或RNA,但优选是DNA。因此,尽管本发明的核酸构建体可以根据预期用途以DNA的形式描述和使用,但它们也可以以RNA的形式描述和使用。如本文所使用的“合成的”核酸或核苷酸序列是指在自然界中没有发现、但通过人工构建并因此不是自然产物的核酸或核苷酸序列。如本文所使用的术语“核苷酸序列”是指核苷酸的杂聚物或这些核苷酸从核酸分子的5'至3'末端的序列,并且包括DNA或RNA分子,包括cDNA、DNA片段或部分,基因组DNA,合成的(例如,化学合成的)DNA,质粒DNA,mRNA和反义RNA,其中任何都可以是单链或双链的。术语“核苷酸序列”、“核酸”、“核酸分子”、“寡核苷酸”和“多核苷酸”在本文中也可互换使用,是指核苷酸的杂聚物。除非另有说明,本文提供的核酸分子和/或核苷酸序列在本文中以5'至3'方向从左至右呈现,并且使用如美国序列法规37CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中记载的用于代表核苷酸特征的标准代码来代表。如本文所使用的“5’区域”可以意指最接近5’末端的多核苷酸的区域。因此,例如,多核苷酸的5’区域中的元件可以位于从位于多核苷酸的5’末端的第一个核苷酸至位于通过多核苷酸中途的核苷酸的任何位置。如本文所使用的“3’区域”可以意指最接近3’末端的多核苷酸的区域。因此,例如,多核苷酸的3’区域中的元件可以位于从位于多核苷酸的3’末端的第一个核苷酸至位于通过多核苷酸中途的核苷酸的任何位置。如本文所使用的术语“百分比序列同一性”或“百分比同一性”是指当最佳比对两个序列时参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列与测试(“主题”)多核苷酸分子(或其互补链)相比的相同核苷酸的百分比。在一些实施方案中,“同一性百分比”可以是指氨基酸序列中的相同氨基酸的百分比。“目标核苷酸序列”是指目标基因的与重组CRISPR阵列的间隔区序列互补的部分。如本文所使用的术语“降低(reduce)”、“降低(reduced)”、“降低(reducing)”、“降低(reduction)”,“减少(diminish)”,“抑制”和“减少(decrease)”(及其语法变化)描述与对照相比减少至少约5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、97%、98%、99%或100%。在具体实施方案中,所述降低导致没有或基本上没有(即,不显著量,例如小于约10%或甚至小于约5%)可检测的活性或量。因此,在一些实施方案中,Cas3核酸酶中的突变可以与对照(例如,野生型Cas3)相比使Cas3的核酸酶活性降低至少约90%、95%、97%、98%、99%或100%。在其它实施方案中,如本文所使用,与对照(例如,靶向特定基因的CRISPR阵列,例如,与靶向相同基因、但具有例如更多靶向该基因的不同区域的间隔区核苷酸序列的CRISPR阵列相比,其具有更少靶向该基因的不同区域的间隔区核苷酸序列,因此具有该基因的减少阻遏;或靶向特定基因的CRISPR阵列,例如,与例如靶向相同基因且具有与目标基因更大的互补性的CRISPR阵列相比,其具有与目标基因的互补性更小且具有该基因的减少阻遏的间隔区核苷酸序列)相比,调节阻遏可以导致阻遏减少。在进一步实施方案中,对照还可以包含不靶向任何基因的CRISPR阵列,靶向完全不相关基因的CRISPR阵列或根本无CRISPR阵列。因此,在一些实施方案中,与对照相比降低的阻遏可以降低约5%至约100%(例如,约5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、97%、98%、99%或100%,或其中的任何范围或值)。在其它实施方案中,与对照相比降低的阻遏可以降低约1.1倍至约10,000倍(例如,约1.1、1.5、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90,95、100、150、200、250、300、350、400、450、500、750、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10,000倍等,和其中的任何范围或值)。因此,在一些实施方案中,与对照相比降低的阻遏可以大于1倍。在其它实施方案中,与对照相比减少的阻遏可以是约2倍至约100倍,约10倍至约100倍,约20倍至约100倍,约20倍至约1000倍,约50倍至约约1000倍,约100倍至约1000倍,约500倍至约2000倍,约500倍至约5000倍,约2500倍至约7500倍,约5000倍至约10,000倍等,或其中的任何值或范围。如本文所使用的“重复核苷酸序列”是指任何野生型CRISPRI型基因座的任何已知的重复序列,或者可以是具有与本领域已知的核苷酸序列不同的那些、但与具有环区域的发夹结构的野生型重复核苷酸序列的结构共享类似结构的合成重复序列。因此,在一些实施方案中,重复核苷酸序列可以与来自野生型CRISPRI型基因座的重复序列相同或基本上相同。在一些实施方案中,重复核苷酸序列可以包含野生型重复核苷酸序列的一部分(例如,野生型重复核苷酸序列的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个连续核苷酸)。在一些实施方案中,重复序列包含至少一个核苷酸(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100或更多个核苷酸或其中的任何范围),基本上由其组成,或由其组成。在其它实施方案中,重复序列包含至少约一至约150个核苷酸,基本上由其组成,或由其组成。在还有其它实施方案中,重复序列包含至少约一个核苷酸至约100个核苷酸或其中的任何范围或值,基本上由其组成,或由其组成。在进一步实施方案中,重复序列可以包含以下,基本上由以下组成,或由以下组成:约3个核苷酸至约100个核苷酸,约10个核苷酸至约100个核苷酸,约15个核苷酸至约100个核苷酸,约20至约50个核苷酸,约20至约40个核苷酸,约20至约30个核苷酸,约30至约40个核苷酸,约25至约40个核苷酸,约25至约45个核苷酸,和/或约25至约50个核苷酸,或其中的任何范围或值。在代表性实施方案中,重复序列可以包含约25个核苷酸至约38个核苷酸,或其中的任何范围或值,基本上由组成,或由其组成。在又进一步实施方案中,重复序列可以包含约29个核苷酸,基本上由其组成,或由其组成。在又进一步实施方案中,重复序列可以包含仅具有至少约20至30个核苷酸长度的发夹,基本上由其组成,或由其组成。在还有其它实施方案中,重复序列包含至少约至少三个核苷酸,基本上由其组成,或由其组成。当CRISPR阵列中存在多于一个间隔区核苷酸序列时,每个间隔区核苷酸序列与另一个隔开“重复核苷酸序列”。因此,在一些代表性实施方案中,连接至间隔区核苷酸序列的5’末端的重复核苷酸序列可以是约三个核苷酸长度(例如,3、4、5、6、7、8、9、10个核苷酸或更多个)并且与野生型重复核苷酸序列的相同区域(即,5’末端)具有至少90%同一性(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)。在其它实施方案中,连接至间隔序列的3'末端的重复序列的部分可以具有与野生型重复核苷酸序列具有至少约50%或更多同一性的三个或更多个核苷酸。在又进一步实施方案中,重复序列可以包含仅具有至少约20至30个核苷酸长度的发夹,基本上由其组成,或由其组成。如本文所使用的“CRISPR阵列”是指包含至少两个重复核苷酸序列或其部分和至少一个间隔序列的核酸分子,其中两个重复核苷酸序列之一或其部分连接至间隔区核苷酸序列的5’末端,并且两个重复核苷酸序列之另一者或其部分连接至间隔区核苷酸序列的3’末端。在重组CRISPR阵列中,重复核苷酸序列和间隔区核苷酸序列的组合是合成的、由人制备且自然界中不存在。如本文所使用的“序列同一性”是指两个最佳比对的多核苷酸或肽序列在整个组分(例如,核苷酸或氨基酸)的比对窗口内不变的程度。“同一性”可以通过已知的方法容易地计算,所述方法包括,但不限于,以下中描述的那些:ComputationalMolecularBiology(Lesk,A.M.,编)OxfordUniversityPress,NewYork(1988);Biocomputing:InformaticsandGenomeProjects(Smith,D.W.,编)AcademicPress,NewYork(1993);ComputerAnalysisofSequenceData,PartI(Griffin,A.M.,andGriffin,H.G.,编)HumanaPress,NewJersey(1994);SequenceAnalysisinMolecularBiology(vonHeinje,G.,编)AcademicPress(1987);和SequenceAnalysisPrimer(Gribskov,M.和Devereux,J.,编)StocktonPress,NewYork(1991)。如本文所使用的“间隔区核苷酸序列”是与目标基因上的目标核苷酸序列互补的核苷酸序列。在一些实施方案中,本发明的间隔区核苷酸序列可以是约15个核苷酸至约150个核苷酸长度。在其它实施方案中,本发明的间隔区核苷酸序列可以是约15个核苷酸至约100个核苷酸长度(例如,约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个核苷酸或更多)。在一些具体实施方案中,间隔区核苷酸序列可以是约8至约150个核苷酸、约8至约100个核苷酸、约8至约50个核苷酸、约8至约40个核苷酸、约8至约30个核苷酸、约8至约25个核苷酸、约8至约20个核苷酸、约10至约50个核苷酸、约10至约40、约10至约30、约10至约25、约10至约20、约15至约50、至少约8、至少约10、至少约15、至少约20、至少约25、至少约30、至少约35、至少约40、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约110、至少约120、至少约130、至少约140、至少约150个核苷酸长度或更多和其中的任何值或范围的长度。在进一步实施方案中,间隔区序列可以与目标基因的目标核苷酸序列相同(完全(100%)互补)或实质上相同(实质上互补)(例如,至少50%(例如,50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)相同)。因此,在一些实施方案中,间隔区核苷酸序列可以具有一个、两个、三个、四个或五个错配,其可以是连续或非连续的。在代表性实施方案中,间隔区核苷酸序列可以与目标基因的目标核苷酸序列具有50%同一性。在进一步实施方案中,间隔区核苷酸序列可以与目标基因的目标核苷酸序列具有70%同一性。在又进一步实施方案中,间隔区核苷酸序列可以与目标基因的目标核苷酸序列具有80%同一性。在其它实施方案中,间隔区核苷酸序列可以与目标基因的目标核苷酸序列具有85%同一性,90%同一性,95%,96%,97%,98%,99%同一性等。在具体实施方案中,间隔区核苷酸序列可以与目标基因的目标核苷酸序列100%相同。在具体实施方案中,间隔区序列在至少约8个核苷酸至约150个核苷酸长度的目标核苷酸序列的区域具有完全同一性或实质同一性。在一些实施方案中,间隔区核苷酸序列的5’区域可以与目标核苷酸序列相同,而所述间隔区的3’区域可以与所述目标核苷酸序列基本相同。因此,在一些实施方案中,间隔区核苷酸序列的5’区域(例如,在5’末端的前8个核苷酸,在5’末端的前10个核苷酸,在5’末端的前15个核苷酸,在5’末端的前20个核苷酸)与目标核苷酸序列具有约75%同一性或更多(75%至约100%同一性),而间隔区核苷酸序列的其余部分可以与目标核苷酸序列具有约50%或更多同一性。因此,例如,间隔区核苷酸序列的5’末端的前8个核苷酸可以与目标核苷酸序列100%相同,或者它可以具有一个或两个突变,因此可以分别与目标核苷酸序列约88%相同或约75%相同,而间隔区核苷酸序列的其余部分可以与目标核苷酸序列至少约50%或更多相同。如本文所使用的在两个核酸分子、核苷酸序列或蛋白质序列的上下文中,短语“实质上相同”或“实质性同一性”是指两个或更多个序列或子序列,当如使用以下序列比较算法之一或通过目视检查测量而针对最大对应性比较和比对时,具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和/或100%核苷酸或氨基酸残基同一性。在具体实施方案中,实质性同一性可以是指具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95、96、96、97、98或99%同一性的两个或更多个序列或子序列。对于序列比较,通常一个序列充当与测试序列比较的参考序列。当使用序列比较算法时,将测试和参考序列输入计算机,如果必要的话,指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法基于指定的程序参数计算测试序列相对于参考序列的百分比序列同一性。用于比对比较窗口的序列的最佳比对是本领域技术人员众所周知的,并且可以通过以下进行:工具诸如Smith和Waterman的局部同源性算法,Needleman和Wunsch的同源性比对算法,Pearson和Lipman的相似性搜索方法,以及任选这些算法的计算机化执行,诸如作为Wisconsin(AccelrysInc.,SanDiego,CA)的一部分可得的GAP、BESTFIT、FASTA和TFASTA。测试序列和参考序列的比对片段的“同一性分数”是两个比对序列共享的相同组分的数目除以参考序列区段中组分的总数,即整个参考序列或参考序列的较小限定部分。百分比序列同一性表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以与全长多核苷酸序列或其部分或更长多核苷酸序列进行。为了本发明的目的,还可以使用用于翻译的核苷酸序列的BLASTX版本2.0和用于多核苷酸序列的BLASTN版本2.0来确定“同一性百分比”。用于进行BLAST分析的软件可以通过国家生物技术信息中心(NationalCenterforBiotechnologyInformation)公开获得。该算法涉及首先通过在询问序列中鉴定长度为W的短词而鉴定高得分序列对(HSPs),当与数据库中相同长度的词比对时,其或匹配或满足一些正数阈值得分T。T被称为邻近字段得分阈值(Altschul等人,1990)。这些初始字段采样数作为起始寻找包含它们的更长HSP的搜索的种子。然后字段采样数沿每条序列在两个方向延伸,直至累积比对分数增加。对于核苷酸序列,使用参数M(一对匹配残基的奖励分数;总是>0)和N(错配残基的罚分;总是<0)来计算累积分数。对于氨基酸序列,用得分矩阵计算累积分数。当累积比对分数被数值X从其获得的最大数值跌落、由于一种或多种阴性得分残基比对而使累积分数达到或低于0、或达到任一条序列的末端时,字段采样数在每一方向的延伸即停止。BLAST算法参数W、T和X决定了比对的敏感度和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值:字长(W)为11,期望值(E)为10,截止值为100,M=5,N=-4以及两条链的比较。对于氨基酸序列,BLASTP程序使用以下作为默认值:字长(W)为3,期望值(E)为10,以及BLOSUM62评分矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA89:10915(1989))。除了计算序列同一性百分比之外,BLAST算法还进行两个序列之间相似性的统计分析(参见,例如,Karlin&Altschul,Proc.Nat'l.Acad.Sci.USA90:5873-5787(1993))。BLAST算法提供的相似性的一种量度是最小总和概率(P(N)),其提供了两个核苷酸或氨基酸序列之间的匹配偶然发生的概率的指示。例如,如果测试核苷酸序列与参考核苷酸序列的比较中的最小总概率小于约0.1至小于约0.001,则认为测试核酸序列与参考序列相似。因此,在本发明的一些实施方案中,测试核苷酸序列与参考核苷酸序列比较中的最小总和概率小于约0.001。当两个核苷酸序列在严格条件下彼此杂交时,也可认为两个序列实质上相同。在一些代表性实施方案中,被认为实质上相同的两个核苷酸序列在高度严格条件下彼此杂交。在核酸杂交实验诸如Southern和Northern杂交的背景下,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。核酸杂交的广泛指导见于TijssenLaboratoryTechniquesinBiochemistryandMolecularBiology-HybridizationwithNucleicAcidProbespartIchapter2“Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays”Elsevier,NewYork(1993)。通常,选择高度严格的杂交和洗涤条件以便在定义的离子强度和pH下比特定序列的热解链点(Tm)低约5℃。Tm是50%的目标序列与完全匹配的探针杂交的温度(在定义离子强度和pH下)。非常严格的条件被选择为等于特定探针的Tm。在Southern或northern印迹中在滤膜上具有多于100个互补残基的互补核苷酸序列杂交的严格杂交条件的实例是在42℃下具有1mg肝素的50%甲酰胺,其中杂交实施过夜。高度严格的洗涤条件的实例是0.15MNaCl,在72℃下,持续约15分钟。严格洗涤条件的实例是0.2xSSC洗涤,在65℃下,持续15分钟(对于SSC缓冲液的描述,参见Sambrook,同上)。经常,高严格洗涤之前是低严格洗涤以除去背景探针信号。对于双链体、例如大于100个核苷酸的双链体的中等严格洗涤的实例是1xSSC,在45℃下,持续15分钟。对于双链体、例如大于100个核苷酸的双链体的低严格洗涤的实例是4-6xSSC,在40℃下,持续15分钟。对于短探针(例如,约10至50个核苷酸),严格条件通常涉及在pH7.0至8.3的小于约1.0MNa离子、通常约0.01至1.0MNa离子浓度(或其它盐)的盐浓度,且温度通常为至少约30℃。严格条件也可以通过添加去稳定剂诸如甲酰胺来实现。通常,在特定杂交测定中为不相关探针观察到的信噪比的2倍(或更高倍)的信噪比表明检测到特异性杂交。在严格条件下不与彼此杂交的核苷酸序列,如果它们编码的蛋白质实质上相同,则仍然实质上相同。这可以例如当使用遗传密码允许的最大密码子简并性产生核苷酸序列的拷贝时发生。以下是可用于克隆与本发明的参考核苷酸序列实质上相同的同源核苷酸序列的杂交/洗涤条件的集合的实例。在一个实施方案中,在7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mMEDTA、50℃下以及2XSSC、0.1%SDS、50℃下洗涤时,参考核苷酸序列与“测试”核苷酸序列杂交。在另一个实施方案中,在7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mMEDTA、50℃下以及1XSSC、0.1%SDS、50℃下洗涤,或者在7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mMEDTA、50℃下以及0.5XSSC、0.1%SDS、50℃下洗涤时,参考核苷酸序列与“测试”核苷酸序列杂交。在又进一步实施方案中,在7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mMEDTA、50℃下以及0.1XSSC、0.1%SDS、50℃下洗涤,或者在7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mMEDTA、50℃下以及0.1XSSC、0.1%SDS、65℃下洗涤时,参考核苷酸序列与“测试”核苷酸序列杂交。在一些方面,目标核苷酸序列位于PAM(原间隔区邻近基序)附近或侧翼。尽管PAM经常对于特定CRISPR-Cas系统是特异性的,但本领域技术人员可以通过建立的实验和计算方法来确定PAM序列。因此,例如,实验方法包括靶向侧接所有可能核苷酸序列的序列和鉴定不经历靶向的序列成员,诸如通过目标DNA的体外切割(Patanayak等人2013.Nat.Biotechnol.31:839-843)或目质粒DNA的转化(Esvelt等人2013.Nat.Methods10:1116-1121;Jiang等人2013.Nat.Biotechnol.31:233-239)。在一些方面,计算方法可以包括进行天然间隔区的BLAST搜索以鉴定噬菌体或质粒中的原始目标DNA序列,并比对这些序列以确定与目标序列邻近的保守序列(Briner和Barrangou.2014.Appl.Environ.Microbiol.80:994-1001;Mojica等人2009.Microbiology155:733-740)。本发明的任何核苷酸序列和/或重组核酸分子可以被密码子优化用于在任何感兴趣的物种中表达。密码子优化是本领域众所周知的,并且涉及使用物种特异性密码子使用表针对密码子使用偏好修饰核苷酸序列。基于用于感兴趣的物种的最高表达的基因的序列分析产生密码子使用表。当在核中表达核苷酸序列时,基于用于感兴趣的物种的高度表达的核基因的序列分析产生密码子使用表。通过比较物种特异性密码子使用表与天然多核苷酸序列中存在的密码子来确定核苷酸序列的修饰。如本领域中所理解,核苷酸序列的密码子优化导致产生这样的核苷酸序列,其与天然核苷酸序列具有小于100%同一性(例如,50%、60%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%等),但仍编码与原始核苷酸序列编码的多肽具有相同功能的多肽。因此,在本发明的代表性实施方案中,本发明的核苷酸序列和/或重组核酸分子可以被密码子优化用于在感兴趣的特定生物体/物种中表达。在一些实施方案中,本发明的重组核酸分子、核苷酸序列和多肽是“分离的”。“分离的”核酸分子、“分离的”核苷酸序列或“分离的”多肽是这样的核酸分子、核苷酸序列或多肽,其通过人工远离其天然环境存在,因此不是自然的产物。分离的核酸分子、核苷酸序列或多肽可以以纯化形式存在,其至少部分地与天然存在的生物体或病毒的至少一些其它组分、例如通常发现与多核苷酸缔合的细胞或病毒结构组分或其它多肽或核酸分离。在代表性实施方案中,分离的核酸分子、分离的核苷酸序列和/或分离的多肽的纯度为至少约1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或更高。在其它实施方案中,分离的核酸分子、核苷酸序列或多肽可存在于非天然环境中,诸如例如重组宿主细胞中。因此,例如,关于核苷酸序列,术语“分离的”意指其与其天然存在的染色体和/或细胞分离。如果多核苷酸与其天然存在于其中、然后插入遗传背景的染色体和/或细胞、其不天然存在于其中的染色体和/或细胞(例如,不同的宿主细胞,不同的调节序列和/或基因组中与在自然界中发现的不同位置)分离,则其也是分离的。因此,重组核酸分子、核苷酸序列及其编码的多肽是“分离的”,因为通过人工,它们与其天然环境分开存在,因此不是自然产物,然而,在一些实施方案中,它们可以引入并存在于重组宿主细胞中。在本文所述的任何实施方案中,本发明的重组CRISPR阵列、核苷酸序列和/或核酸分子可以与用于在各种生物体或细胞中表达的各种启动子、终止子和其它调节元件可操作缔合。因此,在代表性实施方案中,至少一个启动子和/或终止子可以可操作连接至本发明的重组核酸分子和/或重组CRISPR阵列。可以使用本发明可用的任何启动子,并且其包括,例如,对于感兴趣的生物体有功能的启动子以及组成型、诱导型、发育调节型、组织特异性/优选的启动子等,如本文所述。如本文所使用的调节元件可以是内源性或异源性的。在一些实施方案中,源自受试生物体的内源性调节元件可以插入其不天然存在的遗传背景中(例如,基因组中的不同于天然存在的位置),由此产生重组或非天然核酸。本文所使用的“可操作连接”或“可操作缔合”是指所示元件在功能上彼此相关,并且通常也是物理相关的。因此,如本文所使用的术语“可操作连接”或“可操作缔合”是指单一核酸分子上功能上相关的核苷酸序列。因此,可操作连接至第二核苷酸序列的第一核苷酸序列意指当第一核苷酸序列与第二核苷酸序列处于功能关系时的情况。例如,如果启动子影响所述核苷酸序列的转录或表达,则启动子与核苷酸序列可操作缔合。本领域技术人员将理解,控制序列(例如启动子)不需要与其可操作缔合的核苷酸序列相邻,只要控制序列发挥功能以引导其表达。因此,例如,间插的非翻译、但转录的序列可以存在于启动子和核苷酸序列之间,并且启动子仍然可以被认为与核苷酸序列“可操作连接”。“启动子”是控制或调节与启动子可操作缔合的核苷酸序列(即,编码序列)的转录的核苷酸序列。所述编码序列可以编码多肽和/或功能性RNA。通常,“启动子”是指含有RNA聚合酶的结合位点并引导转录起始的核苷酸序列。一般而言,启动子存在于相对于相应编码序列的编码区的起点的5'端或上游。启动子区域可以包含充当基因表达的调节子的其它元件。这些包括,但不限于,-35元件共有序列和-10共有序列(Simpson.1979.Proc.Natl.Acad.Sci.U.S.A.76:3233-3237)。在哺乳动物细胞中,这包括TATA框共有序列,并且经常为CAAT框共有序列(Breathnach和Chambon.1981.Annu.Rev.Biochem.50:349)。在植物中,CAAT盒可以被AGGA盒取代(Messing等人1983.GeneticEngineeringofPlants,T.Kosuge,C.Meredith和A.Hollaender(编),PlenumPress,pp.211-227)。启动子可以包括,例如,用于制备重组核酸分子(即,“嵌合基因”或“嵌合多核苷酸”)的组成型、诱导型、时间调节型、发育调节型、化学调节型、组织优选型和/或组织特异性启动子。这些各种类型的启动子是本领域已知的。因此,在一些实施方案中,使用可操作连接至在感兴趣的生物体中有功能的适当启动子的本发明的重组核酸构建体,可以用组成型、诱导型、时间调节型、发育调节型、化学调节型、组织优选型和/或组织特异性启动子实现阻遏。在代表性实施方案中,可以使用可操作连接至(例如)在感兴趣的生物体中有功能的诱导型启动子的本发明的重组核酸构建体使阻遏可逆。启动子的选择将根据表达的定量、时间和空间需求并且还根据待转化的宿主细胞而变化。用于许多不同生物体的启动子是本领域众所周知的。基于本领域存在的广泛知识,可以针对感兴趣的特定宿主生物体选择适当的启动子。因此,例如,关于模型生物体中高度组成型表达的基因上游的启动子了解很多,并且这样的知识可以容易获得并适当时在其它系统中实施。示例性启动子包括,但不限于,在真核生物和原核生物(包括,但不限于,植物、细菌、真菌、古细菌、动物和哺乳动物)中有功能的启动子。例如,古细菌可用的启动子包括,但不限于,沃氏富盐菌(Haloferaxvolcanii)tRNA(Lys)启动子(Palmer等人J.Bacteriol.1995.177(7):1844-1849),强烈火球菌(Pyrococcusfuriosus)gdh启动子(Waege等人2010.Appl.Environ.Microbiol.76:3308-3313),硫化裂片菌(Sulfolobussulfataricus)16S/23SrRNA基因核心启动子(DeYoung等人2011.FEMSMicrobiol.Lett.321:92-99)。酵母可用的示例性启动子可包括来自以下的启动子:磷酸甘油酸激酶(PGK),甘油醛-3-磷酸脱氢酶(GAP),丙糖磷酸异构酶(TPI),半乳糖-调节子(GAL1,GAL10),醇脱氢酶(ADH1,ADH2),磷酸酶(PHO5),铜激活的金属硫蛋白(CUP1),MFα1,PGK/α2操纵子,TPI/α2操纵子,GAP/GAL,PGK/GAL,GAP/ADH2,GAP/PHO5,异-1-细胞色素c/糖皮质激素反应元件(CYC/GRE),磷酸甘油酸激酶/Angrogen反应元件(PGK/ARE),转录延长因子EF-1α(TEF1),丙糖磷酸脱氢酶(TDH3),磷酸甘油酸激酶1(PGK1),丙酮酸激酶1(PYK1)和/或己糖转运蛋白(HXT7)(参见,Romanos等人Yeast8:423-488(1992);andPartow等人Yeast27:955-964(2010))。在额外实施方案中,细菌可用的启动子可以包括,但不限于,L-阿拉伯糖诱导型(araBAD、PBAD)启动子,任何lac启动子,L-鼠李糖诱导型(rhaPBAD)启动子,T7RNA聚合酶启动子,trc启动子,tac启动子,λ噬菌体启动子(pL、pL-9G-50),脱水四环素-诱导型(tetA)启动子,trp,lpp,phoA,recA,proU,cst-1,cadA,nar,lpp-lac,cspA,T7-lac操纵子,T3-lac操纵子,T4基因32,T5-lac操纵子,nprM-lac操纵子,Vhb,蛋白质A,棒状杆菌-大肠杆菌样启动子,thr,hom,白喉毒素启动子,sigA,sigB,nusG,SoxS,katb,α-淀粉酶(Pamy),Ptms,P43(由两个重叠的RNA聚合酶σ因子识别位点σA、σB组成),Ptms,P43,rplK-rplA,铁氧还蛋白启动子和/或木糖启动子。(参见,K.TerpeAppl.Microbiol,Biotechnol.72:211-222(2006);Hannig等人TrendsinBiotechnology16:54-60(1998);和SrivastavaProteinExprPurif40:221-229(2005))。在植物中有功能的启动子的非限制性实例包括RubisCo小亚基基因1(PrbcS1)的启动子,肌动蛋白基因的启动子(Pactin),硝酸还原酶基因的启动子(Pnr)和重复的碳酸酐酶基因1的启动子(Pdca1)(参见,Walker等人PlantCellRep.23:727-735(2005);Li等人Gene403:132-142(2007);Li等人MolBiol.Rep.37:1143-1154(2010))。PrbcS1和Pactin是组成型启动子,且Pnr和Pdca1是诱导型启动子。Pnr由硝酸盐诱导且被铵阻遏(Li等人Gene403:132-142(2007)),并且Pdca1被盐诱导(Li等人MolBiol.Rep.37:1143-1154(2010))。植物可用的组成型启动子的实例包括,但不限于,匍匐茎病毒启动子(cmp)(美国专利号7,166,770),水稻肌动蛋白1启动子(Wang等人(1992)Mol.Cell.Biol.12:3399-3406;以及美国专利号5,641,876),CaMV35S启动子(Odell等人(1985)Nature313:810-812),CaMV19S启动子(Lawton等人(1987)PlantMol.Biol.9:315-324),nos启动子(Ebert等人(1987)Proc.Natl.Acad.SciUSA84:5745-5749),Adh启动子(Walker等人(1987)Proc.Natl.Acad.Sci.USA84:6624-6629),蔗糖合酶启动子(Yang&Russell(1990)Proc.Natl.Acad.Sci.USA87:4144-4148)和泛素启动子。源自泛素的组成型启动子在许多细胞类型中积累。已经从几种植物物种克隆了泛素启动子用于转基因植物,例如向日葵(Binet等人,1991.PlantScience79:87-94),玉米(Christensen等人,1989.PlantMolec.Biol.12:619-632)和拟南芥(Norris等人1993.PlantMolec.Biol.21:895-906)。已经在转基因单子叶植物系统中开发了玉米泛素启动子(UbiP),并且专利公开EP0342926中公开了其序列和构建用于单子叶植物转化的载体。泛素启动子适合于在转基因植物、尤其是单子叶植物中表达本发明的核苷酸序列。此外,McElroy等人(Mol.Gen.Genet.231:150-160(1991))描述的启动子表达盒可以容易地被修饰用于表达本发明的核苷酸序列,并且特别适用于单子叶宿主。在一些实施方案中,组织特异性/组织优选的启动子可用于在植物细胞中表达异源多核苷酸。组织特异性启动子的非限制性实例包括与编码种子贮藏蛋白质(诸如β-伴大豆球蛋白,十字花科蛋白,napin和菜豆蛋白),玉米醇溶蛋白或油体蛋白质(诸如油质蛋白)或参与脂肪酸生物合成的蛋白质(包括酰基载体蛋白质,硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad2-1))和在胚胎发育期间表达的其它核酸(诸如Bce4,参见,例如,Kridl等人(1991)SeedSci.Res.1:209-219;以及EP专利号255378)。植物组织特异性/组织优选的启动子的其它实例包括,但不限于,根毛特异性顺式元件(RHEs)(Kim等人ThePlantCell18:2958-2970(2006)),根部特异性启动子RCc3(Jeong等人PlantPhysiol.153:185-197(2010))和RB7(美国专利号5459252),凝集素启动子(Lindstrom等人(1990)Der.Genet.11:160-167;和Vodkin(1983)Prog.Clin.Biol.Res.138:87-98),玉米醇脱氢酶1启动子(Dennis等人(1984)NucleicAcidsRes.12:3983-4000),和/或S-腺苷基-L-甲硫氨酸合酶(SAMS)(VanderMijnsbrugge等人(1996)PlantandCellPhysiology,37(8):1108-1115)。此外,可以使用在叶绿体中有功能的启动子。这样的启动子的非限制性实例包括噬菌体T3基因95'UTR和美国专利号7,579,516中公开的其它启动子。本发明可用的其它启动子包括,但不限于,S-E9小亚基RuBP羧化酶启动子和Kunitz胰蛋白酶抑制基因启动子(Kti3)。在本发明的一些实施方案中,可以使用诱导型启动子。因此,例如,化学调节型启动子可以用于通过应用外源化学调节剂来调节生物体中基因的表达。经由化学调节的启动子调节本发明的核苷酸序列的表达使得本发明的RNA和/或多肽仅当例如用诱导化学品处理植物作物时才被合成。根据目标,所述启动子可以是化学诱导型启动子(其中化学品的应用诱导基因表达)或化学阻遏型启动子(其中化学品的应用阻遏基因表达)。在一些方面,启动子还可以包括光诱导型启动子,其中特定波长光的应用诱导基因表达(Levskaya等人2005.Nature438:441-442)。在其它方面,启动子可以包括光阻遏型启动子,其中特定波长光的应用阻遏基因表达(Ye等人.2011.Science332:1565-1568)。植物可用的化学诱导型启动子是本领域已知的,并且包括,但不限于,由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子,用作发芽前除草剂的疏水亲电性化合物活化的玉米GST启动子,和由水杨酸(例如,PR1a系统)活化的烟草PR-1a启动子,类固醇响应的启动子(参见,例如,Schena等人(1991)Proc.Natl.Acad.Sci.USA88,10421-10425和McNellis等人(1998)PlantJ.14,247-257中的糖皮质激素诱导型启动子)和四环素诱导型和四环素阻遏型启动子(参见,例如,Gatz等人(1991)Mol.Gen.Genet.227,229-237和美国专利号5,814,618and5,789,156),Lac阻遏物系统启动子,铜诱导型系统启动子,水杨酸盐诱导型系统启动子(例如,PR1a系统),糖皮质激素诱导型启动子(Aoyama等人(1997)PlantJ.11:605-612)和蜕皮激素诱导型系统启动子。在一些具体实施方案中,藻类可用的启动子包括,但不限于,RubisCo小亚基基因1的启动子(PrbcS1),肌动蛋白基因的启动子(Pactin),硝酸还原酶基因的启动子(Pnr)和重复碳酸酐酶基因1的启动子(Pdca1)(参见,Walker等人PlantCellRep.23:727-735(2005);Li等人Gene403:132-142(2007);Li等人MolBiol.Rep.37:1143-1154(2010)),σ70-型质体rRNA基因的启动子(Prrn),psbA基因(编码光系统-II反应中心蛋白质D1)的启动子(PpsbA),psbD基因(编码光系统-II反应中心蛋白质D2)的启动子(PpsbD),psaA基因(编码光系统I的载脂蛋白)的启动子(PpsaA),ATP酶α亚基基因的启动子(PatpA)和RuBisCo大亚基基因的启动子(PrbcL)及其任何组合(参见,例如,DeCosa等人.Nat.Biotechnol.19:71-74(2001);Daniell等人BMCBiotechnol.9:33(2009);Muto等人BMCBiotechnol.9:26(2009);Surzycki等人Biologicals37:133-138(2009))。在进一步实施方案中,本发明可用的启动子可以包括,但不限于,polIII启动子,诸如人U6小核启动子(U6)和人H1启动子(H1)等人JGeneMed.8(4):433-41(2006))和polII启动子诸如CMV(巨细胞病毒)启动子(Barrow等人MethodsinMol.Biol.329:283-294(2006)),SV40(猿猴病毒40)来源的启动子,EF-1α(延长因子-1α)启动子,Ubc(人泛素C)启动子,PGK(鼠磷酸甘油酸激酶-1)启动子和/或组成型蛋白质基因启动子诸如β-肌动蛋白基因启动子,tRNA启动子等。此外,已经报道了组织特异性调节的核酸和/或启动子以及肿瘤特异性调节的核酸和/或启动子。因此,在一些实施方案中,可以使用组织特异性或肿瘤特异性启动子。一些报道的组织特异性核酸包括,但不限于,B29(B细胞),CD14(单核细胞),CD43(白细胞和血小板),CD45(造血细胞),CD68(巨噬细胞),结蛋白(肌肉),弹性蛋白酶-1(胰腺腺泡细胞),内皮因子(内皮细胞),纤连蛋白(分化细胞和愈合组织),FLT-1(内皮细胞),GFAP(星形胶质细胞),GPIIb(巨核细胞),ICAM-2(内皮细胞),INF-β(造血细胞),Mb(肌肉),NPHSI(足细胞),OG-2(成骨细胞),SP-B(肺),SYN1(神经元)和WASP(造血细胞)。一些报道的肿瘤特异性核酸和启动子包括,但不限于,AFP(肝细胞癌),CCKAR(胰腺癌),CEA(上皮癌),c-erbB2(乳腺癌和胰腺癌),COX-2,CXCR4,E2F-1,HE4,LP,MUC1(癌),PRC1(乳腺癌),PSA(前列腺癌),RRM2(乳腺癌),存活蛋白,TRP1(黑色素瘤)和TYR(黑色素瘤)。在一些实施方案中,可以在哺乳动物细胞中使用诱导型启动子。诱导型启动子的实例包括,但不限于,四环素阻遏物系统启动子,Lac阻遏物系统启动子,铜诱导型系统启动子,水杨酸盐诱导型系统启动子(例如,PR1a系统),糖皮质激素诱导型启动子和蜕皮激素诱导型系统启动子。在一些实施方案中,本发明的核酸构建体可以是“表达盒”或可以包含于表达盒内。如本文所使用的“表达盒”意指包含感兴趣的核苷酸序列的重组核酸分子(例如,本发明的重组核酸分子和CRISPR阵列),其中所述核苷酸序列与至少一个控制序列(例如,启动子)可操作缔合。因此,本发明的一些方面提供了设计用于表达本发明的核苷酸序列(例如,重组核酸分子和/或重组CRISPR阵列)的表达盒。包含感兴趣的核苷酸序列的表达盒可以是嵌合的,意味着其组分中的至少一种相对于其至少一种其它组分是异源性的。表达盒也可以是天然存在、但已经以可用于异源表达的重组形式获得的表达盒。表达盒还可以任选地包括在所选宿主细胞中有功能的转录和/或翻译终止区(即,终止区)。各种转录终止子可用于表达盒中使用,并且负责终止在感兴趣的异源核苷酸序列之前的转录和正确的mRNA聚腺苷酸化。终止区对于转录起始区可以是天然的,对于可操作连接的感兴趣的核苷酸序列可以是天然的,对于宿主细胞可以是天然的,或者可以源自另一来源(即,对于启动子、感兴趣的核苷酸序列、宿主或其任何组合是外来的或异源的)。在本发明的一些实施方案中,终止子可以可操作连接至本发明的重组核酸分子和CRISPR阵列。表达盒还可以包括用于可选择标记的核苷酸序列,所述可选择标记可以用于选择转化的宿主细胞。如本文所使用的“可选择标记”是指这样的核苷酸序列,其当表达时赋予表达该标记的宿主细胞不同的表型,因此允许将这样的转化的细胞与不具有标记的细胞区分开。这样的核苷酸序列可以编码可选择或可筛选的标记,这取决于该标记是否赋予可以通过化学方式,诸如通过使用选择剂(例如,抗生素等)选择的性状,或者该标记是否仅仅是可以通过观察或测试(诸如通过筛选(例如,荧光))鉴定的性状。当然,合适的可选择标记的许多实例是本领域已知的,并且可以用于本文所述的表达盒。除了表达盒以外,本文所述的核酸分子和核苷酸序列可以与载体结合使用。术语“载体”是指用于将核酸(或核酸)转移、递送或引入细胞中的组合物。载体包含含有待转移、递送或引入的核苷酸序列的核酸分子。用于转化宿主生物体的载体是本领域众所周知的。一般种类的载体的非限制性实例包括但不限于,病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、福斯质粒载体、噬菌体、人工染色体或农杆菌二元载体,其为双链或单链线性或环状形式,其可以是或可以不是自传递或可移动的。如本文定义的载体可以通过整合入细胞基因组或染色体外存在(例如,具有复制起点的自主复制质粒)来转化原核或真核宿主。另外包括穿梭载体,其意指能够天然或通过设计在两种不同宿主生物体中复制的DNA载体,所述宿主生物体可以选自放线菌和相关物种,细菌和真核生物(例如,高等植物、哺乳动物、酵母或真菌细胞)。在一些代表性实施方案中,载体中的核酸处于适当的启动子或用于宿主细胞中的转录的其它调节元件的控制下并与之可操作连接。所述载体可以是在多个宿主中发挥功能的双功能表达载体。在基因组DNA的情况下,其可以含有其自身启动子或其它调节元件,并且在cDNA的情况下,其可以在适当的启动子或用于宿主细胞中的表达的其它调节元件的控制下。因此,本发明的核酸分子(例如,重组核酸分子和/或重组CRISPR阵列)和/或包含本发明的核酸分子的表达盒可以包含于本文所述和本领域已知的载体中。如本文所使用的术语“接触”、“引入”、“递送”和“施用”是指这样的过程,通过所述过程,将本发明的重组核酸分子和/或重组CRISPR阵列递送至细胞或受试者,以便阻遏细胞或受试者中的一种或多种目标基因的表达或改变所述表达的阻遏。重组核酸分子和/或重组CRISPR阵列可以以多种方式施用,包括,但不限于,直接引入细胞(即,胞内)和/或细胞外引入腔,间质空间,滋养特定器官或组织的区域循环,或组织或结构(例如,肿瘤)。在感兴趣的多核苷酸的上下文中的“引入(Introducing)”、“引入(introduce)”、“引入(introduced)”(及其语法变体)意指将感兴趣的核苷酸序列递呈至宿主生物体或所述生物体的细胞(例如,宿主细胞),其方式使得所述核苷酸序列进入细胞内部,并且包括术语诸如“转化”、“转染”和/或“转导”。当引入多于一个核苷酸序列时,这些核苷酸序列可以组装为单个多核苷酸或核酸构建体的部分或组装为单独的多核苷酸或核酸构建体,并且可位于相同或不同的表达构建体或转化载体上。因此,这些多核苷酸可以在单个转化事件中、在分开的转化事件中引入细胞,或者例如,它们可以通过常规育种方案并入生物体。因此,在本发明的一些方面,可以将本发明的一种或多种核酸构建体(例如,重组核酸分子、重组CRISPR阵列等)可以引入宿主生物体或所述宿主生物体的细胞中。如本文所使用的术语“转化”、“转染”和“转导”是指将异源核酸引入细胞中。这样的引入细胞可以是稳定的或瞬时的。因此,在一些实施方案中,宿主细胞或宿主生物体用本发明的核酸分子稳定转化。在其它实施方案中,宿主细胞或宿主生物体用本发明的重组核酸分子瞬时转化。在多核苷酸的上下文中的“瞬时转化”意指将多核苷酸引入细胞中并且不整合至细胞的基因组中。在将多核苷酸引入细胞的上下文中的“稳定引入(stablyintroducing)”或“稳定引入(stablyintroduced)”意指引入的多核苷酸稳定地整合至细胞的基因组中,因此细胞用多核苷酸稳定转化。如本文所使用的“稳定转化(Stabletransformation)”或“稳定转化(stablytransformed)”意指将核酸分子引入细胞并整合至细胞的基因组中。因此,整合的核酸分子能够被其后代,更具体地,被多个连续世代的后代遗传。如本文所使用的“基因组”还包括核、质粒和质体基因组,因此包括将核酸构建体整合入例如叶绿体或线粒体基因组中。本文所使用的稳定转化也可以是指保持在染色体外、例如作为微染色体或质粒的转基因。瞬时转化可以通过例如酶联免疫吸附测定(ELISA)或Western印迹(其可以检测由引入生物体中的一种或多种转基因编码的肽或多肽的存在)检测。细胞的稳定转化可以通过以下检测:例如用与导入生物体(例如,植物、哺乳动物、昆虫、古细菌、细菌等)的转基因的核苷酸序列特异性杂交的核酸序列Southern印迹杂交测定细胞的基因组DNA。细胞的稳定转化可以通过以下检测:例如,用与引入植物或其它生物体的转基因的核苷酸序列特异性杂交的核酸序列RNA印迹杂交测定细胞的RNA。细胞的稳定转化还可以通过以下检测:例如,如本领域众所周知的聚合酶链式反应(PCR)或其它扩增反应,其采用与转基因的目标序列杂交的特异性引物序列,导致转基因序列的扩增,其可以根据标准方法检测。转化也可以通过本领域众所周知的直接测序和/或杂交方案来检测。因此,在一些实施方案中,核苷酸序列、构建体、表达盒可以瞬时表达和/或它们可以稳定地引入宿主生物体的基因组中。可以通过本领域技术人员已知的任何方法将本发明的重组核酸分子和/或CRISPR阵列引入细胞中。转化或转染的示例性方法包括使用病毒和细菌(例如,农杆菌)的生物学方法,物理化学方法诸如电穿孔,花浸法,颗粒或弹道轰击,显微注射,须技术,花粉管转化,磷酸钙介导的转化,纳米颗粒介导的转化,聚合物介导的转化,包括环糊精介导和聚乙二醇介导的转化,超声处理,渗入以及导致核酸引入细胞的任何其它电、化学、物理(机械)和/或生物机制,包括其任何组合。在本发明的一些实施方案中,细胞的转化包括核转化。在其它实施方案中,细胞的转化包括质体转化(例如,叶绿体转化)。在又进一步实施方案中,本发明的重组核酸分子或CRISPR阵列可以通过常规育种技术引入细胞。用于转化真核生物和原核生物两者的程序是本领域众所周知和常规的,并且在整个文献中描述(参见,例如,Jiang等人.2013.Nat.Biotechnol.31:233-239;Ran等人NatureProtocols8:2281–2308(2013))因此,可以以本领域众所周知的多种方式将核苷酸序列引入宿主生物体或其细胞中。本发明的方法不依赖于将一种或多种核苷酸序列引入生物体的具体方法,仅仅是它们进入生物体的至少一个细胞的内部。当引入多于一种核苷酸序列时,它们可以组装为单个核酸构建体的一部分或组装为分开的核酸构建体,并且可以位于相同或不同的核酸构建体上。因此,可以在单一转化事件中或在分开的转化事件中将核苷酸序列引入目标细胞中,或者可替代地,可以作为育种方案的一部分将核苷酸序列并入植物中。本发明涉及用于在感兴趣的生物体或其细胞中或在无细胞系统中靶向基因沉默或更具体地阻遏表达和/或调节表达阻遏的组合物和方法。因此,在本发明的一个方面,提供了重组核酸分子,其包含编码参与用于抗病毒防御的CRISPR相关复合物(Cascade)加工的I型CRISPR-Cas多肽的子集的核苷酸序列。本发明可使用的I型Cascade多肽加工CRISPR阵列以产生加工的RNA,然后用于使复合物结合与加工的RNA中的间隔区互补的DNA。在一些实施方案中,参与获取的Cascade多肽不包含于本发明的核酸分子(例如,Cas1、Cas2)中。来自本领域已知的I型CRISPR-cas系统的Cascade多肽的任何这样的子集或后来发现的那些可以包含于本发明的重组核酸分子中。这样的多肽可以例如经由BLAST搜索鉴定。因此,在本发明的一些方面,提供了重组核酸分子,其包含编码来自I型CRISPR-Cas系统的CRISPR-Cas多肽的子集的核苷酸序列,基本上由其组成,或由其组成。在具体实施方案中,本发明的重组核酸包含编码三个或更多个I型Cascade多肽的核苷酸序列,基本上由其组成或由其组成,所述I型Cascade多肽与野生型I型Cascade多肽具有实质性同一性(例如,至少80%;约80%、85%、90%、95%、96%、97%、98%、99%、100%,和其中的任何范围或值)。在一些实施方案中,本发明的重组核酸包含编码所述三个或更多个I型Cascade多肽的功能片段的核苷酸序列,基本上由其组成,或由其组成。如本文所使用的I型Cascade多肽的功能片段意指与野生型多肽相比长度减少、但仍然可以作为I型Cascade蛋白质发挥功能(例如,加工CRISPRRNA,结合DNA和/或形式复合物)。在进一步实施方案中,本发明的重组核酸可以包含编码两个或更多个I型Cascade多肽或其功能片段或其任何组合的融合体的核苷酸序列,基本上由其组成,或由其组成。在一个代表性实施方案中,提供了重组核酸分子,其包含与以下具有实质性同一性的核苷酸序列,基本上由其组成,或由其组成:(a)编码Cas6b多肽的核苷酸序列,编码Cas8b(Csh1)多肽的核苷酸序列,编码Cas7(Csh2)多肽的核苷酸序列和编码Cas5多肽的核苷酸序列(I-B型);(b)编码Cas5d多肽的核苷酸序列,编码Cas8c(Csd1)多肽的核苷酸序列和编码Cas7(Csd2)多肽的核苷酸序列(I-C型);(c)编码Cse1(CasA)多肽的核苷酸序列,编码Cse2(CasB)多肽的核苷酸序列,编码Cas7(CasC)多肽的核苷酸序列,编码Cas5(CasD)多肽的核苷酸序列和核苷酸序列编码Cas6e(CasE)多肽(I-E型);(d)编码Cys1多肽的核苷酸序列,编码Cys2多肽的核苷酸序列,编码Cas7(Cys3)多肽的核苷酸序列和编码Cas6f多肽的核苷酸序列(I-F型);(e)编码Cas7(Csa2)多肽的核苷酸序列,编码Cas8a1(Csx13)多肽或Cas8a2(Csx9)多肽的核苷酸序列,编码Cas5多肽的核苷酸序列,编码Csa5多肽的核苷酸序列,编码Cas6a多肽的核苷酸序列,编码Cas3’多肽的核苷酸序列和编码不具有核酸酶活性的Cas3”多肽的核苷酸序列(I-A型);和/或(f)编码Cas10d(Csc3)多肽的核苷酸序列,编码Csc2多肽的核苷酸序列,编码Csc1多肽的核苷酸序列,编码Cas6d多肽的核苷酸序列(I-D型)。在本发明的代表性实施方案中,编码Cas6b多肽的核苷酸序列包括,但不限于,编码SEQIDNO:18、SEQIDNO:19和/或SEQIDNO:20的氨基酸序列的核苷酸序列;编码Cas8b(Csh1)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:21和/或SEQIDNO:22的氨基酸序列的核苷酸序列;编码Cas7(Csh2)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:23和/或SEQIDNO:24的氨基酸序列的核苷酸序列;编码Cas5多肽的核苷酸序列包括,但不限于,编码SEQIDNO:25和/或SEQIDNO:26的氨基酸序列的核苷酸序列;编码Cas5d多肽的核苷酸序列包括,但不限于,编码SEQIDNO:27和/或SEQIDNO:28的氨基酸序列的核苷酸序列;编码Cas8c(Csd1)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:29和/或SEQIDNO:30的氨基酸序列的核苷酸序列;编码Cas7(Csd2)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:31和/或SEQIDNO:32的氨基酸序列的核苷酸序列;编码Cse1(CasA)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:41和/或SEQIDNO:42的氨基酸序列的核苷酸序列;编码Cse2(CasB)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:43和/或SEQIDNO:44的氨基酸序列的核苷酸序列;编码Cas7(CasC)的核苷酸序列包括,但不限于,编码SEQIDNO:45和/或SEQIDNO:46的氨基酸序列的核苷酸序列;编码Cas5(CasD)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:47和/或SEQIDNO:48的氨基酸序列的核苷酸序列;编码Cas6e(CasE)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:49和/或SEQIDNO:50的氨基酸序列的核苷酸序列;编码Cys1多肽的核苷酸序列包括,但不限于,编码SEQIDNO:51和/或SEQIDNO:52的氨基酸序列的核苷酸序列;编码Cys2多肽的核苷酸序列包括,但不限于,编码SEQIDNO:53和/或SEQIDNO:54的氨基酸序列的核苷酸序列;编码Cas7(Cys3)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:55和/或SEQIDNO:56的氨基酸序列的核苷酸序列;编码Cas6f多肽的核苷酸序列包括,但不限于,编码SEQIDNO:57和/或SEQIDNO:58的氨基酸序列的核苷酸序列;编码Cas7(Csa2)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:1、SEQIDNO:2和/或SEQIDNO:3的氨基酸序列的核苷酸序列;编码Cas8a1(Csx13)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:4的氨基酸序列的核苷酸序列;编码Cas8a2(Csx9)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:5和/或SEQIDNO:6的氨基酸序列的核苷酸序列;编码Cas5多肽的核苷酸序列包括,但不限于,编码SEQIDNO:7、SEQIDNO:8和/或SEQIDNO:9的氨基酸序列的核苷酸序列;编码Cas6a多肽的核苷酸序列包括,但不限于,编码SEQIDNO:10和/或SEQIDNO:11的氨基酸序列的核苷酸序列;编码Cas3’多肽的核苷酸序列包括,但不限于,编码SEQIDNO:12、SEQIDNO:13和/或SEQIDNO:14的氨基酸序列的核苷酸序列;编码Cas3”多肽的核苷酸序列包括,但不限于,编码SEQIDNO:15、SEQIDNO:16和/或SEQIDNO:17的氨基酸序列的核苷酸序列;编码Cas10d(Csc3)多肽的核苷酸序列包括,但不限于,编码SEQIDNO:33和/或SEQIDNO:34的氨基酸序列的核苷酸序列;编码Csc2多肽的核苷酸序列包括,但不限于,编码SEQIDNO:35和/或SEQIDNO:36的氨基酸序列的核苷酸序列;编码Csc1多肽的核苷酸序列包括,但不限于,编码SEQIDNO:37和/或SEQIDNO:38的氨基酸序列的核苷酸序列;和/或编码Cas6d多肽的核苷酸序列包括,但不限于,编码SEQIDNO:39和/或SEQIDNO:40的氨基酸序列的核苷酸序列。编码I型Cascade多肽的额外氨基酸和核苷酸序列可以由技术人员使用本领域中用于鉴定同源物的常规方法来鉴定,所述方法如例如,使用已知Cascade多肽的氨基酸序列、基因名称或蛋白质家族来筛选NCBIGenBank数据库。因此,I型多肽的进一步非限制性实例包括如通过其GenBank登录号鉴定的以下。因此,例如,I-A型cas7/csa2多肽包括,但不限于,GenBank登录号ACP34796.1、ACV25240.1、ADC69851.1、ADX81774.1、ADX84848.1、BAB64980.2、Q97Y91.1、YP_002831441.1、YP_003128740.1、YP_003458587.1、YP_005644988.1和/或YP_005648062。在其它实施方案中,I-A型cas8a1/csx13多肽包括,但不限于,如表6中记载的GenBank登录号。表6.I-A型cas8a1/csx13多肽登录号。在一些实施方案中,I-A型cas8a2/csx9多肽包括,但不限于,如表7中记载的GenBank登录号。表7.I-A型cas8a2/csx13多肽登录号。在一些实施方案中,I-A型cas5多肽包括,但不限于,如表8中记载的GenBank登录号。表8.I-A型cas5多肽登录号。在还有其它实施方案中,I-A型csa5多肽包括,但不限于,如表9中记载的GenBank登录号。表9.I-A型csa5多肽登录号。在一些实施方案中,I-A型cas6a多肽包括,但不限于,GenBank登录号CCC39326.1、Q57820.1、Q97Y96.1和/或YP_005839101.1。在进一步实施方案中,I-A型cas3’多肽包括,但不限于,GenBank登录号NP_147808.1、NP_343399.1和/或CCC81888.1。在又进一步实施方案中,I-A型cas3”多肽包括,但不限于,GenBank登录号NP_147807.1、NP_343400.1和/或CCC81889.1。在一些实施方案中,I-B型cas6b多肽包括,但不限于,GenBank登录号Q8U3R3.1、Q97WV8.1、Q58631.1、YP_003533663.1、YP_002534242.1和/或YP_002534249.1。在其它实施方案中,I-B型cas8b/csh1多肽包括,但不限于,如表10中记载的GenBank登录号。表10.I-A型cas8b/csh1多肽登录号。在一些实施方案中,I-B型cas7/csh2多肽包括,但不限于,如表11中记载的GenBank登录号。表11.I-A型cas7/csh2多肽登录号。在一些实施方案中,I-B型cas5多肽包括,但不限于,如表12中记载的GenBank登录号。表12.I-B型cas5多肽登录号。在一些实施方案中,I-C型cas5d多肽包括,但不限于,如表13中记载的GenBank登录号。表13.I-C型cas5d多肽登录号。在一些实施方案中,I-C型cas8c/csd1多肽包括,但不限于,如表14中记载的GenBank登录号。表14.I-C型cas8c/csd1多肽登录号。在一些实施方案中,I-C型cas7/csd2多肽包括,但不限于,如表15中记载的GenBank登录号。表15.I-C型cas7/csd2多肽登录号。在其它实施方案中,I-D型cas10d/csc3多肽包括,但不限于,如表16中记载的GenBank登录号。表16.I-D型cas10d/csc3多肽登录号。在一些实施方案中,I-D型csc2多肽包括,但不限于,如表17中记载的GenBank登录号。表17.I-D型csc2多肽登录号。在一些实施方案中,I-D型csc1多肽包括,但不限于,如表18中记载的GenBank登录号。表18.I-D型csc1多肽登录号。在一些实施方案中,I-D型cas6d多肽包括,但不限于,GenBank登录号YP_503301.1和/或YP_327278.1。在其它实施方案中,I-E型cse1/casA多肽包括,但不限于,如表19中记载的GenBank登录号。表19.I-E型cse1/casA多肽登录号。在一些实施方案中,I-E型cse2/casB多肽包括,但不限于,如表20中记载的GenBank登录号。表20.I-E型cse2/casB多肽登录号。在一些实施方案中,I-E型cas7/casC多肽包括,但不限于,如表21中记载的GenBank登录号。表21.I-E型cas7/casC多肽登录号。在一些实施方案中,I-E型cas5/casD多肽包括,但不限于,如表22中记载的GenBank登录号。表22.I-E型cas5/casD多肽登录号。在一些实施方案中,I-E型cas6e/case多肽包括,但不限于,如表23中记载的GenBank登录号。表23.I-E型cas6e/case多肽登录号。在一些实施方案中,I-F型cys1多肽包括,但不限于,如表24中记载的GenBank登录号。表24.I-F型cys1多肽登录号。在一些实施方案中,I-F型cys2多肽包括,但不限于,如表25中记载的GenBank登录号。表25.I-F型cys2多肽登录号。在一些实施方案中,I-F型cas7/cys3多肽包括,但不限于,如表26中记载的GenBank登录号。表26.I-F型cas7/cys3多肽登录号。在一些实施方案中,I-F型cas6f/cys4多肽包括,但不限于,如表27中记载的GenBank登录号。表27.I-F型cas6f/cys4多肽登录号。在一些实施方案中,Cas3多肽包括,但不限于,如表28中记载的GenBank登录号。表28.Cas3多肽登录号。因此,在一些实施方案中,包含编码来自I型CRISPR-Cas系统的CRISPR-Cas多肽或其功能片段的子集的核苷酸序列的本发明的重组核酸分子可以包含以下、基本上由以下组成或由以下组成:编码三个或更多个具有上述GenBank登录号的多肽或任何其它I型CRISPR-Cas多肽的核苷酸序列。在另一个方面,本发明提供重组CRISPR阵列,其包含以下、基本上由以下组成或由以下组成:两个或更多个重复核苷酸序列或其部分和一个或多个间隔区核苷酸序列,其中所述CRISPR阵列中的每个间隔区核苷酸序列在其5’末端和在其3’末端连接至重复核苷酸序列。因此,CRISPR阵列的重复核苷酸序列和间隔区核苷酸序列彼此交替,例如5’至3’,重复、间隔区、重复等。本发明的重组CRISPR阵列可以是任何长度,并且包含实现一种或多种目标基因的期望水平的表达阻遏(例如转录阻遏)所需的与如上所述的重复核苷酸序列交替的任何数目的间隔区核苷酸序列。在一些实施方案中,CRISPR阵列可以包含以下、基本上由以下组成或由以下组成:1至约100个间隔区核苷酸序列,每个间隔区核苷酸序列在其5’末端和其3’末端连接至重复核苷酸序列。因此,在一些实施方案中,本发明的重组CRISPR阵列可以包含以下、基本上由以下组成或由以下组成:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多个间隔区核苷酸序列。本发明的CRISPR阵列的重复核苷酸序列可以包含I型CRISPRcas系统的任何已知重复核苷酸序列的核苷酸序列,基本上由其组成或由其组成。如本文所述,重复核苷酸序列也可以具有包含来自I型CRISPRcas系统的天然重复的二级结构(例如,内部发夹)的合成设计。在一些实施方案中,本发明的重组CRISPR阵列的重复核苷酸序列可以包含SEQIDNO:59-249的核苷酸序列,基本上由其组成或由其组成。在一些实施方案中,至少一个间隔区核苷酸序列可以在其3’末端连接至重复序列,并在其5’末端连接至来自重复核苷酸序列的3'末端的约1至约8、约1至约10、约1至约15个核苷酸(例如,重复核苷酸序列的一部分)。在其它实施方案中,所述至少一个间隔区核苷酸序列可以在其5’末端连接至来自重复核苷酸序列的3’末端的约2至约6个或约2至约4个核苷酸。在代表性实施方案中,所述重组CRISPER阵列包含两个或更多个(例如,2、3、4、5、6、7、8、9、10或更多个,如本文所述)间隔区核苷酸序列,每个间隔区核苷酸序列在其3’末端和其5’末端侧接重复核苷酸序列,并且所述重组CRISPR阵列的两个或更多个间隔区核苷酸序列中的至少两个可各自包含与来自单个目标基因的不同目标核苷酸序列(例如,相同目标基因的不同区域)互补的核苷酸序列目标基因。通过靶向单个目标基因的至少两个不同区域,可以使用CRISPR阵列来改变所述目标基因表达的阻遏(例如,增加或降低阻遏水平)。更具体地,与具有相对较少间隔区核苷酸序列(其各自与来自单个目标基因的不同目标核苷酸序列互补)的CRISPR阵列相比,具有多个间隔区核苷酸序列(其各自与来自单个基因的不同非重叠目标核苷酸序列互补)的CRISPR阵列可以提供该目标基因的表达的更强/增加的阻遏。可以通过设计具有与相同目标基因内重叠的目标核苷酸序列互补的间隔区核苷酸序列的CRISPR阵列进一步改变转录阻遏的水平。与其中间隔区核苷酸序列与相同目标基因内的不同目标核苷酸序列互补、但所述目标核苷酸序列不重叠的CRISPR阵列相比,与相同目标基因内的重叠目标核苷酸序列互补的重叠间隔区核苷酸序列可以导致该目标基因的表达阻遏降低。也就是说,这样的重叠间隔区序列比不重叠的间隔区序列对表达阻遏具有降低的效应。不希望束缚于任何特定理论,据信重叠序列与彼此竞争,由此与非重叠序列相比降低阻遏的水平。除了靶向单个基因上的不同位置/区域以调节该基因的阻遏以外,可以改变间隔区的长度或其与目标核苷酸序列的互补性以调节阻遏。因此,例如,与更长间隔区和/或与目标核苷酸序列具有更大互补性的间隔区相比,更短间隔区或与目标核苷酸序列具有较少互补性的间隔区通常将导致阻遏降低。因此,在一些实施方案中,可以通过向所述间隔区的长度添加一个或多个核苷酸来增加间隔区的阻遏,与用相同间隔区、但无额外核苷酸相比,当与本发明的重组核酸一起使用时,所述间隔区导致增加的阻遏。在一些实施方案中,间隔区的长度可以增加一至约100个核苷酸,和/或其中的任何范围或值(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多)。在代表性实施方案中,间隔区的长度可以增加约1至约40个、约5至约30个、10至约30个、约20至约30个核苷酸。在其它实施方案中,间隔区的长度可以增加约6个核苷酸、约8个核苷酸、约10个核苷酸、约12个核苷酸、约18个核苷酸、约24个核苷酸等。在进一步实施方案中,可以通过将所述间隔区的长度减少一个或多个核苷酸来减少间隔区的阻遏,与用相同间隔区、但无核苷酸数目减少相比,当与本发明的重组核酸一起使用时,所述间隔区导致增加的减少。因此,在一些实施方案中,可以通过将间隔区的长度减少1至约100个核苷酸和其中的任何范围或值来减少间隔区的阻遏。在代表性实施方案中,间隔区的长度可以减少约1至约40个、约5至约30个、10至约30个、约20至约30个核苷酸。在其它实施方案中,间隔区的长度可以减少约6个核苷酸、约8个核苷酸、约10个核苷酸、约12个核苷酸、约18个核苷酸、约24个核苷酸等。在进一步方面,本发明的CRISPR阵列的间隔区序列可以与来自双链目标基因的编码链或正(顶部)链和/或来自双链目标基因的非编码链或负(底部)链的目标核苷酸序列互补。如本文所表明,设计重组CRISPR阵列以包括靶向编码链/正链、而不是非编码链/负链的间隔区(反之亦然),提供了阻遏的进一步调节,其中与靶向相同目标基因的非编码链/负链相比,靶向编码链/正链提供了增加或更大的阻遏。如本文所述的CRISPR阵列构建体的间隔区核苷酸序列的这些变化和其它变化是可能的,并且可以用于阻遏或改变目标基因表达的阻遏。本文所述的间隔区类型以及其它间隔区类型的任何组合可以单独或以任何组合用于抑制表达或调节目标基因表达的阻遏。因此,显然,CRISPR阵列设计中的上述和其它变化可用于实现期望水平的目标基因表达的阻遏。在其它实施方案中,重组CRISPR阵列可以设计为包含以下、基本上由以下组成、由以下组成:至少两个间隔区核苷酸序列,每个间隔区核苷酸序列包含与来自不同目标基因的不同目标核苷酸序列互补的核苷酸序列,由此使用单个CRISPR阵列实现不同目标基因表达的阻遏。或者,可以使用两个或更多个重组CRISPR阵列靶向不同基因以阻遏表达。如将容易理解,可以构建各种重组CRISPR阵列设计并将其引入细胞或生物体中的单个或多个重组CRISPR阵列构建体,用于阻遏和/或调节所述细胞或生物体中的一个或多个目标基因的表达。因此,例如,如本文所述的不同类型的间隔区核苷酸序列的各种组合可以引入单个重组CRISPR阵列上,使得可以阻遏和/或调节一个或多个目标基因的表达。或者,在其它实施方案中,可以在两个或多个重组CRISPR阵列上引入各种间隔区核苷酸序列,用于阻遏或调节一个或多个目标基因的表达。在一些实施方案中,本发明的重组CRISPR阵列的间隔区核苷酸序列可以与来自目标基因的目标核苷酸序列或其互补物完全相同或基本上相同。在具体实施方案中,一个或多个间隔区核苷酸序列可以与目标核苷酸序列或其互补物具有至少约50%同一性。在其它实施方案中,一个或多个间隔区核苷酸序列可以与目标核苷酸序列或其互补物具有至少约70%同一性。在进一步实施方案中,一个或多个间隔区核苷酸序列可以与目标核苷酸序列或其互补物具有至少约80%同一性。在又进一步实施方案中,一个或多个间隔区核苷酸序列可以与目标核苷酸序列或其互补物具有至少约85%、90%、95%、96%、97%、98%、99%或100%同一性。在本发明的其它方面,目标核苷酸序列和/或目标基因来自目标生物体的基因组、质粒或质体。在一些实施方案中,目标生物体可以是真核生物、原核生物或病毒。在其它实施方案中,原核生物包括,但不限于,细菌或古细菌。在还有其它实施方案中,真核生物包括,但不限于,动物、哺乳动物、昆虫、植物、真菌、昆虫、禽类、鱼类、两栖动物、爬行动物或野生动物。在额外实施方案中,哺乳动物可以包括,但不限于,啮齿动物,马,狗,猫,人,非人灵长类动物(例如,猴、狒狒和黑猩猩),山羊,猪,牛(例如,家牛),绵羊,实验室动物(例如,大鼠,小鼠,沙鼠,仓鼠等)等。本发明可用的禽类的非限制性实例包括鸡类,鸭类,火鸡类,鹅,鹌鹑类和作为宠物的禽类(例如,长尾鹦鹉类,鹦鹉类,金刚鹦鹉类等)。额外实施方案可以包括,例如,哺乳动物和昆虫细胞系。哺乳动物和昆虫细胞系的非限制性实例包括HEK293细胞、HeLa细胞、CHO细胞、MEF细胞、3T3细胞、Hi-5细胞和Sf21细胞。合适的目标生物体可以包括雄性和雌性两者,以及所有年龄的受试者,包括胚胎(例如,在子宫内或卵内),婴儿,幼年,青少年,成年和老年受试者。在本发明的实施方案中,目标生物体不是人胚胎受试者。因此,例如,任何细菌、古细菌、植物或真菌可用于实施本发明。在代表性实施方案中,本发明可用的细菌的非限制性实例包括埃希氏菌属(Escherichiaspp.),沙门氏菌属(Salmonellaspp.),芽孢杆菌属(Bacillusspp.),梭状棒状芽胞杆菌属(CorynebacteriumClostridiumspp.),梭状芽胞杆菌属(Clostridiumspp.),假单胞菌属(Psuedomonasspp.),梭状芽胞杆菌属(Clostridiumspp.),乳球菌属(Lactococcusspp.),不动杆菌属(Acinetobacterspp.),分枝杆菌属(Mycobacteriumspp.),粘球菌属(Myxococcusspp.),葡萄球菌属(Staphylococcusspp.),链球菌属(Streptococcusspp.)或蓝细菌(cyanobacteria)。在进一步实施方案中,本发明可用的细菌的非限制性实例包括大肠杆菌、肠道沙门氏菌(Salmonellaenterica)、枯草芽孢杆菌(Bacillussubtilis)、丙酮丁醇梭菌(Clostridiumacetobutylicum)、杨氏梭菌(Clostridiumljungdahlii)、艰难梭菌(Clostridiumdifficile)、鲍曼不动杆菌(Acinetobacterbaumannii)、结核分枝杆菌(Mycobacteriumtuberculosis)、黄色粘球菌(Myxococcusxanthus)、金黄色葡萄球菌(Staphylococcusaureus)、化脓性链球菌(Streptococcuspyogenes)或蓝藻。本发明可用的细菌的进一步非限制性实例包括乳酸细菌,包括但不限于乳杆菌属和双歧杆菌属;电染料细菌菌株,包括但不限于地杆菌属(Geobacterspp.),梭状芽孢杆菌(Clostridiumspp.),或真氧产碱杆菌(Ralstoniaeutropha);或细菌病原体,例如,植物和哺乳动物上的细菌病原体。在具体实施方案中,所述细菌可以是大肠杆菌。这样的古细菌的非限制性实例包括激烈热球菌,水生栖热菌,Sulfolobussulfataricus或嗜盐古细菌,包括,但不限于,Haladaptatus(例如,Haladaptatuspaucihalophilus),Halalkalicoccus(例如,Halalkalicoccustibetensis),Halobaculum(例如,Halobaculumgomorrense),Halobellus(例如,Halobellusclavatus),嗜盐微菌属(Halomicrobium)(例如,Halomicrobiummukohataei),钠白菌属(Natrialba)(例如,Natrialbaasiatica),钠线菌属(Natrinema)(例如,Natrinemapellirubrum),Natronorubrum(例如,Natronorubrumbangense),Salarchaeum(例如,Salarchaeumjaponicum)。在本发明的一些实施方案中,本发明可用的植物和/或植物细胞可以包括,但不限于,亚麻荠属,大豆属,高粱属,芸苔属,葱属,辣根属,早熟禾属,剪股颖属,黑麦草属,羊茅属,Calamogrostis,发草属,菠菜属,菾属,豌豆属,藜属,向日葵属,欧防风属,胡萝卜属,Petroselium,杨树属,李属,栗属,桉树属,枫属,栎属,柳属,胡桃属,云杉属,松属,冷杉属,浮萍属,芜萍属,紫萍属,稻属,玉蜀黍属或棉属。在其它实施方案中,所述植物和/或植物细胞可以包括,但不限于,庭荠亚麻荠(Camelinaalyssum)(Mill.)Thell.,小果亚麻荠(Camelinamicrocarpa)Andrz.exDC.,CamelinarumelicaVelen.,荠蓝(Camelinasativa)(L.)Crantz,高粱(Sorghumbicolor)(例如,高粱L.Moench),陆地棉,大豆,玉蜀黍,甘蓝,芜菁,欧洲油菜,萝卜(Raphanussativus),马萝卜(Armoraciarusticana),Alliumsative,洋葱(Alliumcepa),大齿杨(Populusgrandidentata),欧洲山杨,美洲山杨,野黑樱桃,欧洲山樱桃,Castaneadentate,Populusbalsamifer,美洲黑杨,糖槭(AcerSaccharum),黑槭树(Acernigrum),复叶槭(Acernegundo),红花槭(Acerrubrum),银白槭(Acersaccharinum),欧亚槭(Acerpseudoplatanus)或水稻。在额外实施方案中,植物和/或植物细胞可以是,但不限于,小麦,大麦,燕麦,草坪草(蓝草,本特草,黑麦草,牛毛草),羽毛芦苇草,簇状毛草,菠菜,甜菜,食用甜菜,藜麦,糖用甜菜,莴苣,向日葵(Helianthusannuus),豌豆(Pisumsativum),欧洲防风草(Pastinacasativa),胡萝卜(Daucuscarota),荷兰芹(Petroselinumcrispum),浮萍,松树,云杉,冷杉,桉树,橡树,胡桃或柳树。在具体实施方案中,所述植物和/或植物细胞可以是拟南芥(Arabidopsisthaliana)。在一些代表性实施方案中,所述植物和/或植物细胞可以是亚麻荠,小麦,水稻,玉米,油菜,卡诺拉,大豆,高粱,番茄,竹或棉。在进一步实施方案中,植物和/或植物细胞可以是藻类或藻类细胞,包括,但不限于,硅藻纲(硅藻类),定鞭藻纲,褐藻纲(褐藻),红藻纲(红藻)或Glaucophyceae(红藻)。在还有其它实施方案中,藻类或藻类细胞的非限制性实例可以是曲壳藻属,Actinella,菱形藻属,Nupela,Geissleria,异极藻属,Planothidium,Halamphora,Psammothidium,舟形藻属,短缝藻属,辐节藻属,衣藻属,杜氏藻属,微球藻属,微拟球藻属,栅藻属,小球藻属,小环藻属,双眉藻属,海链藻属,褐指藻属,金色藻属,金藻属,海链藻属,褐指藻属,灰胞藻属,Cyanophora,Galdieria或紫球藻属。本发明可用的真菌的非限制性实例包括念珠菌属,镰刀菌属,曲霉属,隐球菌属,球孢子菌属,癣属,孢子丝菌属,芽生菌属,组织胞浆菌属,肺囊虫属,酵母属,类酵母属,克鲁维酵母属,毕赤酵母属,念珠菌属,接合酵母属或汉逊酵母属。在代表性实施方案中,真菌可以包括,但不限于,酿酒酵母,葡萄汁酵母(carlsbergensis),糖化酵母,路德氏酵母,马克斯克鲁维酵母,巴斯德毕赤酵母,星形念珠菌,铁红念珠菌,发酵型接合酵母,葡萄汁有孢汉逊酵母,烟曲霉,黄曲霉,黑曲霉,土曲霉,构巢曲霉,白色念珠菌,粗球孢子菌,新型隐球菌,茄病镰孢霉菌,黄色镰孢霉菌,甲癣菌,体癣菌,股癣菌,申克孢子丝菌,皮炎芽生菌,荚膜组织胞浆菌,卡氏肺孢子虫或杜氏组织胞浆菌。目标基因可以是需要阻遏表达或调节表达的阻遏的任何感兴趣的基因。因此,在一些实施方案中,目标基因的非限制性实例可以包括编码转录调节子、翻译调节子、聚合酶基因、代谢酶、转运蛋白、RNA酶、蛋白酶、DNA复制酶、DNA修饰或降解酶、调节RNA、转移RNA或核糖体RNA的基因。目标基因还可以是例如参与细胞分裂、细胞结构、代谢、运动性、致病性或毒力的基因。在其它实施方案中,本发明可使用的目标基因还可以包括其功能尚未特征的假设基因(参见,例如,Kolker等人NucleicAcidsResearch32(8):2353-2363(2004))。在代表性实施方案中,目标核苷酸序列可以包含编码目标基因的启动子或其互补物的核苷酸序列的全部或部分,基本上由其组成或由其组成。本发明人已经发现,与目标基因的启动子或其部分互补的间隔区核苷酸序列,当如本文所公开使用时,实现实质性的基因阻遏。具体而言,发现可以用这样的间隔区实现实质性的基因阻遏,而无论靶向哪条链。在进一步方面,可将本发明的重组核酸分子、重组CRISPR阵列和/或核苷酸序列引入宿主生物体的细胞。可以使用本发明可用的任何细胞/宿主生物体。示例性宿主生物体包括,但不限于,植物、细菌、古细菌、真菌、动物、哺乳动物、昆虫、鸟、鱼、两栖动物、刺胞动物、人或非人灵长类动物。在进一步实施方案中,本发明可用的细胞可以是,但不限于,干细胞、体细胞、生殖细胞、植物细胞、动物细胞、细菌细胞、古细菌细胞、真菌细胞、哺乳动物细胞、昆虫细胞、鸟类细胞、鱼类细胞、两栖动物细胞、刺胞动物细胞、人细胞或非人灵长类动物细胞。因此,在一些实施方案中,可将本发明的重组核酸分子、重组CRISPR阵列或核苷酸序列引入生物体的细胞中,对于生物体的细胞,期望表达抑制或调节表达抑制用于靶向所述细胞/生物体中的目标基因。因此,进一步提供了使用本公开的重组核酸分子和CRISPR阵列的方法。因此,在一些实施方案中,提供了用于阻遏目标基因的表达(降低转录)的方法,所述方法包括:将本发明的重组核酸分子和本发明的至少一个重组CRISPR阵列引入生物体(例如,引入细胞),由此阻遏所述目标基因的表达(减少转录)。可以根据本发明的方法实现不同水平的阻遏。因此,任何给定目标基因的阻遏(例如,沉默)的程度将取决于靶向感兴趣基因(例如目标基因)的间隔区的设计,包括但不限于用于靶向感兴趣的基因的间隔区的数目(多重化),间隔区与之具有互补性的目标基因上的目标核苷酸序列的位置(包括重叠对非重叠目标核苷酸序列的数目),间隔区的长度和/或每个间隔区与目标基因的目标核苷酸序列的互补性。在其它实施方案中,提供了用于阻遏目标基因的表达(降低转录)的方法,所述方法包括:将本发明的重组核酸分子和本发明的至少一个重组CRISPR阵列引入生物体(例如,引入所述生物体的细胞),其中引入生物体的至少一个重组CRISPR阵列包含至少两个间隔区核苷酸序列(各自包含与来自单个目标基因的不同目标核苷酸序列互补的核苷酸序列),由此相对于不具有针对所述目标基因的间隔区的重组CRISPR阵列或具有具有更多或更少这样的间隔区核苷酸序列(各自包含与来自单个目标基因的不同目标核苷酸序列互补的核苷酸序列)的CRISPR阵列调节所述目标基因的阻遏。在其它实施方案中,与具有更多与源自单个目标基因的不同目标核苷酸序列互补的间隔区核苷酸序列的CRISPR阵列相比,具有更少与源自相同目标基因的不同目标核苷酸序列互补的间隔区核苷酸序列的CRISPR阵列,当引入生物体或细胞时可导致阻遏降低或减少。在进一步实施方案中,与和源自单个目标基因的目标核苷酸序列具有更大互补性程度的间隔区核苷酸序列相比,与和源自相同目标基因的相同目标核苷酸序列更少互补的间隔区核苷酸序列,当引入生物体或细胞时可导致阻遏降低或减少。在又进一步实施方案中,与和源自单个目标基因的目标核苷酸序列互补的更短间隔区核苷酸序列相比,与和源自相同目标基因的相同目标核苷酸序列互补的更长间隔区核苷酸序列,当引入生物体或细胞时可导致阻遏增加。如技术人员所容易理解,可以单独使用或与彼此在单个或多个CRISPR阵列中组合使用各种间隔区核苷酸序列和CRIPSR阵列设计,以提供在单个或多个目标基因中实现的阻遏量或水平的显著灵活性。因此,例如,可以单独或连同任何其它间隔区/CRISPR阵列设计组合使用间隔区的总数以及每个间隔区的长度、目标基因中的位置和/或互补性程度,以提供目标基因的期望水平的阻遏。在还有其它实施方案中,提供了用于阻遏生物体中至少两个基因的表达(减少转录)的方法,所述方法包括:将本发明的重组核酸分子和本发明的至少一个重组CRISPR阵列引入生物体,其中所述至少一个重组CRISPR阵列包含至少两个间隔区核苷酸序列(各自包含与来自不同目标基因的不同目标核苷酸序列互补的核苷酸序列),由此阻遏所述生物体中的至少两个基因的表达。如技术人员所容易理解,本文所述的间隔区和CRISPR阵列设计及其变体的任何组合可用于阻遏所述两个基因的表达和/或调节所述两个基因表达的阻遏。在一些实施方案中,为了设计用于靶向基因组序列的间隔区核苷酸序列,首先鉴定与被称为原间隔区邻近基序(PAM)的核苷酸序列的集合邻近的感兴趣的基因区域(例如,目标核苷酸序列)。因此,该基序挨着这样的区域存在于目标基因中:间隔区序列由于与该区域互补而结合所述区域,并鉴定与间隔区核苷酸序列的碱基配对开始的点。对于I型系统,PAM直接位于与间隔区匹配的序列的5’末端,因此在与间隔区核苷酸序列碱基配对的序列的3’末端。PAM的非限制性实例包括CCA、CCT、CCG、CCT、CCA、TTC、AAG、AGG、ATG、GAG和/或CC。在一些实施方案中,由如本文公开的重组核酸分子编码的多肽可以作为蛋白质复合物引入。因此,在一些实施方案中,蛋白质复合物可包含来自I型Cascade的一组多肽的任何亚组,基本上由其组成,或由其组成。在其它实施方案中,蛋白质复合物可以包含以下,基本上由以下组成,或由以下组成:(a)Cas6b多肽、Cas8b(Csh1)多肽、Cas7(Csh2)多肽和Cas5d多肽(I-B型);(b)Cas5多肽、Cas8c(Csd1)多肽和Cas7(Csd2)多肽(I-C型);(c)Cse1(CasA)多肽、Cse2(CasB)多肽、Cas7(CasC)多肽、Cas5(CasD)多肽和Cas6e(CasE)多肽(I-E型);(d)Cys1多肽、Cys2多肽、Cas7(Cys3)多肽和Cas6f多肽(I-F型);(e)Cas7(Csa2)多肽、Cas8a1(Csx13)多肽或Cas8a2(Csx9)多肽、Cas5多肽、Csa5多肽、Cas6a多肽、Cas3’多肽和不具有核酸酶活性的Cas3”多肽(I-A型);或(f)Cas10d(Csc3)多肽、Csc2多肽、Csc1多肽和Cas6d多肽(I-D型)。因此,在一些实施方案中,将蛋白质复合物和CRISPR阵列引入无细胞系统、细胞和/或生物体。在一些实施方案中,将所述蛋白质复合物和CRISPR阵列单独引入或作为核糖核蛋白一起引入。因此,在进一步实施方案中,可以将包含本发明的蛋白质复合物和CRISPR阵列、基本上由其组成或由其组成的核糖核蛋白复合物引入无细胞系统、细胞和/或生物体。在一些实施方案中,可将蛋白质复合物/核糖核蛋白复合物递送以瞬时阻遏基因,由此提供用于实现期望水平的目标基因阻遏的其它有利方法。因此,在又进一步实施方案中,由重组核酸分子编码的多肽可以作为蛋白质复合物、DNA、RNA(例如mRNA)或核糖核蛋白复合物递送。在一些实施方案中,CRISPR阵列可以作为DNA或RNA递送。在额外方面,本发明提供了阻遏细菌或古细菌目标基因的表达的方法,其包括:破坏细菌或古细菌中的内源性cas3核苷酸序列,其中破坏的内源性cas3核苷酸序列不存在,或存在、但不表达,和/或表达、但无功能;和将本发明的至少一个重组CRISPR阵列或包含本发明的至少一个重组CRISPR阵列的表达盒或载体引入所述细菌或古细菌,由此阻遏所述细菌或目标基因的表达。在又进一步方面,本发明提供了调节细菌或古细菌目标基因表达的阻遏的方法,其包括:破坏细菌或古细菌中的内源性cas3核苷酸序列,其中破坏的内源性cas3核苷酸序列不存在,或存在、但不表达,和/或表达、但无功能;和将本发明的至少一个重组CRISPR阵列或包含本发明的至少一个重组CRISPR阵列的表达盒或载体引入所述细菌或古细菌,其中至少一个重组CRISPR阵列包含至少两个间隔区核苷酸序列(各自包含与来自单个目标基因的不同目标核苷酸序列互补的核苷酸序列),由此相对于细菌或古细菌中的包含不具有针对所述目标基因的间隔区的CRISPR阵列或具有具有更多或更少这样的间隔区核苷酸序列(各自包含与来自单个目标基因的不同目标核苷酸序列互补的核苷酸序列)的CRISPR阵列的相同目标基因调节所述细菌或古细菌目标基因的阻遏。在额外实施方案中,本发明提供了阻遏细菌或古细菌目标基因的至少两个基因的表达的方法,其包括:破坏细菌或古细菌中的内源性cas3核苷酸序列,其中破坏的内源性cas3核苷酸序列不存在,或存在、但不表达,和/或表达、但无功能;和将本发明的至少一个重组CRISPR阵列或包含本发明的至少一个重组CRISPR阵列的表达盒或载体引入所述细菌或古细菌,其中所述至少一个重组CRISPR阵列包含至少两个间隔区核苷酸序列(各自包含与来自不同目标基因的不同目标核苷酸序列互补的核苷酸序列),由此阻遏所述细菌或古细菌中的至少两个目标基因的表达。在一些实施方案中,可将本发明的至少一个重组CRISPR阵列或包含本发明的至少一个重组CRISPR阵列的表达盒或载体在破坏所述内源性cas3核苷酸序列的同时引入所述细菌或古细菌。在其它实施方案中,可将本发明的至少一个重组CRISPR阵列或包含本发明的至少一个重组CRISPR阵列的表达盒或载体在破坏所述内源性cas3核苷酸序列之后引入所述细菌或古细菌。在一些实施方案中,所述细菌或古细菌包含内源性Cascade。在进一步实施方案中,将至少一种异源性启动子引入细菌或古细菌并可操作连接至所述内源性Cascade。在代表性实施方案中,所述异源性启动子在经由例如同源重组破坏内源性cas3的同时引入。如本文所使用的“破坏(disrupt)”,“破坏(disrupted)”或“破坏(disrupting)”和/或其它语法变体意指cas3核苷酸序列被突变或以其它方式改变,使得编码cas3蛋白质的核苷酸序列不存在,或编码cas3蛋白质的序列存在,但Cas3蛋白质不产生,或产生且是非功能性的。cas3核苷酸序列的破坏可以通过本领域普通技术人员已知用于改变或突变核苷酸序列的任何方法完成。这样的方法包括但不限于产生点突变(例如,错义或无义,或导致读框移位的单个碱基对的插入或缺失),插入,缺失和/或截短。在一些实施方案中,破坏导致整个cas3核苷酸序列或其部分(例如,1%至99%,或其中的任何值或范围)的去除或缺失。在代表性实施方案中,编码cas3基因的整个核苷酸序列通过例如同源重组缺失。在具体实施方案中,破坏可以导致过早翻译终止、过早转录终止、破坏性内切核酸酶催化位点或使蛋白质不稳定或阻止蛋白质的正常折叠的突变,其中不产生cas3多肽或产生非功能性cas3多肽。用于突变或以其它方式改变内源性基因的方法是本领域众所周知的,并且可以容易与本发明的方法一起使用以产生不具有内源性cas3多肽或非功能性cas3多肽的细菌或古细菌。如本文所使用的“非功能性Cas3多肽”是具有很少或不具有核酸酶活性的Cas3多肽。具有“很少或不具有核酸酶活性”意指破坏的cas3多肽与野生型/未破坏的Cas3多肽相比表现出约10%或更少的活性(例如,约10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0%,或其中的任何值或范围)。此外,如本文所使用的非功能性Cas3多肽在宽范围的温度(包括约10℃至约125℃或其中的任何值或范围)下具有很少或不具有核酸酶活性。因此,如本文定义的非功能性Cas3多肽是在约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124和/或125℃的温度下具有很少活性至不具有活性的cas3多肽。因此,作为一个实例,本发明的破坏的Cas3多肽包括在30℃有活性、但在42℃无活性的cas3多肽。本发明的一个进一步方面涉及用于本发明方法中的试剂盒。所述试剂盒可以包含适合于引入细胞和/或施用于受试者的形式的本发明的重组核酸构建体、CRISPR阵列、核苷酸序列和/或载体/表达盒。所述试剂盒可以进一步包含其它治疗剂、载体、缓冲液、容器、用于施用的装置等。所述试剂盒可以进一步包含用于阻遏目标基因的表达和/或调节目标基因表达的阻遏的标记和/或说明书。这样的标记和/或说明书可包括例如关于重组核酸构建体、CRISPR阵列、核苷酸序列和/或载体/表达盒的引入和/或施用的量、频率和方法的信息。因此,在一个方面,提供了用于阻遏至少一个目标核苷酸序列的表达的试剂盒,所述试剂盒包含以下,基本上由以下组成,或由以下组成:本发明的重组核酸分子,本发明的重组CRISPR阵列和/或包含本发明的所述重组核酸分子和/或本发明的重组CRISPR阵列的表达盒或载体。在一些实施方案中,提供了用于调节至少一个目标基因的阻遏的试剂盒,所述试剂盒包含以下,基本上由以下组成,或由以下组成:本发明的重组核酸分子,本发明的重组CRISPR阵列和/或包含本发明的所述重组核酸分子和/或本发明的重组CRISPR阵列的表达盒或载体,其中所述重组CRISPR阵列包含以下,基本上由以下组成,或由以下组成:至少两个间隔区核苷酸序列(各自包含与来自单个目标基因的不同目标核苷酸序列互补的核苷酸序列)。在额外实施方案中,提供了用于调节至少两个目标基因的阻遏的试剂盒,所述试剂盒包含以下,基本上由以下组成,或由以下组成:本发明的重组核酸分子,本发明的重组CRISPR阵列和/或包含本发明的所述重组核酸分子和/或本发明的重组CRISPR阵列的表达盒或载体,其中所述重组CRISPR阵列包含以下,基本上由以下组成,或由以下组成:至少两个间隔区核苷酸序列(各自包含与来自不同目标基因的不同目标核苷酸序列互补的核苷酸序列)。在一些实施方案中,所述试剂盒的重组核酸分子和重组CRISPR阵列包含于单个载体或表达盒上或分开的载体或表达盒上。在进一步实施方案中,所述试剂盒包含使用说明书。现在将参考以下实施例描述本发明。应当理解,这些实施例不旨在将权利要求的范围限制为本发明,而是旨在例举某些实施方案。技术人员想到的例举方法中的任何变化旨在落入本发明的范围内。实施例实施例1.方法使用同源重组和P1转导,从大肠杆菌BW25113的基因组以及大肠杆菌MG1655的基因组敲除了cas3基因,且组成型启动子位于casABCDE操纵子的上游。这确保了Cas3蛋白质完全不存在,而Cascade复合物(由五个Cas蛋白CasA、CasB、CasC、CasD和CasE构成)将组成型表达。设计间隔区以靶向荧光报告质粒pUA66lacZ。该质粒在lacZ启动子的控制下表达荧光GFP蛋白质。通过定位PAM(原间隔区相邻基序)序列(AGG或AAG)并在3'末端选择相邻30个核苷酸来设计间隔区。选择间隔区以覆盖不同的感兴趣位置,包括启动子、非翻译区和编码区。靶向DNA的编码和非编码链两者。将每个间隔区克隆入表达载体pCRISPR中。该载体含有最小的CRISPR阵列:启动子、单一重复和终止子。载体允许间隔区的依次引入,使得多个间隔区可以从单一CRISPR阵列表达。以工作间隔区,引导Cascade(例如,重组核酸分子)以结合pUA66lacZ的DNA并降低GFP的表达水平,因此减少荧光。将质粒pUA66lacZ和pCRISPR共转化入BW25113Δcas3。使携带具有指定间隔区的pCRISPR质粒的细胞在补充有0.4%甘油和0.2%酪蛋白氨基酸的M9基本培养基中生长,反向稀释至相同培养基中,并培养6小时至对数中期。然后在AccuriC6流式细胞仪上测量荧光。使用流式细胞术,通过测量荧光的减少定量转录阻遏的水平。在没有任何阻遏的情况下,pUA66lacZ产生强荧光。进一步设计间隔区以靶向负责L-阿拉伯糖(araBAD)、D-木糖(xylAB)和乳糖(lacZYA)的分解代谢的三种内源性操纵子的启动子。使携带pCRISPR或间隔区编码质粒的转导MG1655细胞在补充有甘油的M9培养基中生长24小时,在补充有指定碳源的M9培养基中反向稀释至0.001的ABS600,并在37℃下培养22小时。然后使用Nanodrop2000c分光光度计测量每种培养物的最终ABS600值。实施例2.数据图1显示编码在lacZ启动子控制下的荧光GFP多肽的质粒pUA66lacZ中的感兴趣区域。长绿色箭头表示gfp的编码区。细黑色箭头表示以黑色描绘的启动子的-35和-10元件起始转录。顶部上的每个间隔区匹配顶部链或编码链(并因此结合底部链或非编码链)。类似地,底部上的每个间隔区匹配底部链或非编码链(并因此结合顶部链)。确立的PAMAAG或AGG位于每个原间隔区的5'末端。图2提供显示携带质粒pUA66lacZ的转导MG1655细胞中的荧光GFP蛋白质的转录阻遏的图。倍数变化w.r.t.pCRISPR意指相对于缺乏任何间隔区的pCRISPR的倍数变化。流式细胞术实验一式三份进行。为了计算阻遏倍数,将每个间隔区的中值荧光平均化,并除去背景自发荧光。接下来,将荧光与不编码任何间隔区的原始pCRISPR进行比较。例如,pCRISPR对照记录为7332AU而lac1记录为56AU;这对应于131倍变化。图3提供携带具有靶向不同内源性糖利用操纵子的间隔区的质粒的转导MG1655细胞的培养物的光密度的条形图,和所得的对指示糖上的培养物生长的影响。甘油用作阴性对照,其分解代谢不应受任何间隔区影响。对生长测定进行单次实验,其报道测量的ABS600值。实施例3.结果和结论数据证实本发明如预期地工作;在Cas3不存在的情况下,Cascade结合DNA并引发可变水平的转录阻遏。除了概念原理证明以外,我们还发现(1)靶向-35/-10区域(lac1/lac2)中的启动子引发最强的阻遏,和(2)在转录区域内,结合编码DNA链的间隔区比结合非编码DNA链的间隔区显示更强的沉默。进一步发现,靶向内源性糖利用基因导致在相关糖上的可忽略的生长。这些数据表明,本发明也可以阻遏内源性基因的表达,导致预期的表型。实施例4.经由间隔区长度调节阻遏。改变大肠杆菌间隔区的长度,并测量长度变化对阻遏程度的影响。原始间隔区具有32个核苷酸的长度。在本研究中,间隔区长度增加6、8、10或12个核苷酸或减少6个核苷酸。构建体显示于图12A中。结果显示于图12B中,其中增加的长度导致增加的阻遏,而减少的长度消除阻遏。实施例5.通过改变间隔区长度和互补性程度调节基因沉默。使用靶向pUA66lacZ的启动子的两个报道的间隔区,我们将在15nt和40nt之间改变间隔区的长度。我们还将在整个32-nt间隔区以及在前8个nt内(从5'末端开始)在50%和100%之间改变这些间隔区的互补性程度。在pCRISPR质粒内,每个间隔区将在两侧侧接相同的重复序列(GAGTTCCCCGCGCCAGCGGGGATAAACCG,SEQIDNO:73)。将表明减少互补性的长度和程度降低GFP表达的程度。实施例6.通过异源表达的基因沉默在整个天然CRISPR-Cas系统将通过同源重组缺失的大肠杆菌BL21(DE3)菌株中,来自大肠杆菌MG1655的casABCDE操纵子将不从pCDF-1b质粒表达。该菌株还将携带pUA66lacZ质粒和无间隔区或有lacZ靶向间隔区的pCRISPR质粒。然后我们将测量每种菌株中的GFP表达,其中我们预期与不表达操纵子或lacZ靶向间隔区的菌株相比,表达casABCDE操纵子和lacZ-靶向间隔区的菌株将显示降低的表达。这将表明通过来自I-E型系统的基因的异源表达的基因沉默。实施例7.相同或不同基因的多重靶向已经显示减少来自pUA66lacZ的表达的两至四个间隔区将被组合成pCRISPR质粒中的单一阵列(例如,对于三个间隔区,重复-间隔区1-重复-间隔区2-重复-间隔区3-重复)。此外,我们将整合和测试间隔区与重叠其他间隔区之一的靶标。然后我们将测量每种菌株的GFP表达。我们预期GFP表达随着非重叠间隔区的添加而减少,并且随着重叠间隔区的添加而增加。此外,我们将靶向糖利用操纵子(araBAD、lacZYA、xylAB)的三个间隔基组合成pCRISPR质粒中的单一阵列。携带该质粒或原始pCRISPR质粒的转导的大肠杆菌MG1655菌株将在每种相关糖(L-阿拉伯糖、乳糖、D-木糖)或葡萄糖上的M9基本培养基中生长。我们的预期是具有三个间隔区的pCRISPR质粒将减少L-阿拉伯糖、乳糖和D-木糖上的生长,但不减少葡萄糖上的生长。将通过qRT-PCR来证实沉默。这些实验将表明单一阵列中的多个间隔区用于调节沉默或多个基因的沉默。实施例8.催化死亡Cas3将引入大肠杆菌MG1655的cas3基因中的点突变,其使Cas3催化活性失活。这些点突变,D75A和D229A,位于Cas3的活性位点中。所得基因将在pCDF-1b质粒上编码。天然CRISPR-Cas系统缺失且携带该质粒连同pUA66lacZ以及编码验证的lacZ靶向间隔区之一的pCRISPR质粒的大肠杆菌BL21(DE3)菌株。然后我们将通过流式细胞术分析测量该菌株以及具有原始pCDF1-b质粒的菌株的GFP表达。我们的预期是具有无活性的Cas3或无Cas3的菌株将得到相似水平的GFP。实施例9.CRISPR阵列内的间隔区位置为了测试阵列内间隔区的位置是否影响其阻遏效力,我们将在pCRISPR质粒内编码具有三个非靶向间隔区和一个验证的lacZ靶向间隔区的4-间隔区阵列。每个阵列将在阵列内的不同位置含有lacZ靶向间隔区。将通过经由流式细胞术定量GFP表达,测试携带pUA66lacZ和每种pCRISPR质粒的转导的大肠杆菌MG1655菌株。通过比较阻遏的水平,我们可以比较CRISPR阵列内哪些位置引发最强的阻遏或位置是否不相关。实施例10.其它I型系统在大肠杆菌中使用I-E型CRISPR-Cas系统的本方法将被推广至其它I型系统。推理是cas3是具有切割和降解由Cascade结合的DNA的保守功能的所有I型系统(I-A、I-B、I-C、I-D、I-E、I-F)的特征基因(signaturegene)。为了进一步探究其它I型系统实现转录阻遏的倾向,我们将研究化脓性链球菌(Streptococcuspyogenes)中的I-C型系统、黑腐果胶杆菌(Pectobacteriumatrosepticum)中的I-F型系统、Aeropyrumpernix中的I-B型系统和甲烷螺旋菌(Methanospirillumhungatei)中的I-D型系统。我们将编码包含来自每个系统的Cascade的基因作为pCDF-1b和pRSF-1b表达载体中的操纵子。然后将用编码每个系统的质粒和原始pCRISPR质粒或编码侧接来自天然系统的重复的间隔区的pCRISPR质粒转化大肠杆菌BL21(DE3)细胞。间隔区将被设计为使用源自天然系统的PAM靶向xylA启动子。然后我们将评估生长和xylAB表达(通过qRT-PCR)。我们期望编码每个系统和靶向xylA启动子的细胞在木糖上将生长较差并显示降低的xylAB表达。实施例11.古细菌还将使用激烈火球菌(Pyrococcusfuriosus)COM1研究用古细菌中的I型系统的转录沉默。首先,我们将通过Pgdh-pyrF基因的同源重组和在具有尿嘧啶的定义培养基上选择、随后通过在5'FOA上生长而去除pyrF基因来缺失与I-B系统相关的天然cas3基因(PFC_04820)。也将使用相同方法缺失与I-A型系统相关的cas3’(PFC_02330)和cas3”(PFC_02335)基因。然后我们将编码在两侧侧接靶向gdh基因(PFC_00670)或2-氢酸脱氢酶基因(PFC_00915)的启动子的天然重复序列(GTTACAATAAGACTAAAATAGAATTGAAAG,SEQIDNO:74)的30-nt间隔区。将测试含有具有5’CCNPAM的原间隔区的间隔区。每个构建体将由S-层蛋白质(slp)启动子驱动并与pyrF整合入基因组中。然后我们将通过针对靶向间隔区和非靶向间隔区的qRT-PCR测量每个靶基因的mRNA水平。我们预期显著降低缺乏cas3的COM1菌株以及缺乏cas3、cas3’和cas3”的菌株中的任一基因的mRNA水平。实施例12.真核生物将使用Baker氏酵母和Hela细胞作为示例性宿主研究真核生物中的转录沉默。将在每种宿主的标准表达载体中编码合成的CRISPR阵列和来自大肠杆菌中的I-E型系统的Cascade基因(casA、casB、casC、casD、casE),其中每个基因将从单独的启动子和终止子(例如每个基因的CMV启动子和SV40polyA尾部)单独表达。我们还将使用间插IRES序列和自切割肽序列在两个转录物中编码多个基因以简化表达构建体。构建体将被转化入稳定表达GFP的细胞系中。该阵列将编码一个、两个或三个32-nt间隔区,其被设计为靶向异源GFP启动子以及编码区。流式细胞术分析将用于测量阻遏的程度。预期表达CRISPR阵列和Cascade基因的细胞系中的GFP荧光将降低。实施例13.菌株和质粒构建下表1提供使用的大肠杆菌菌株的列表。表1.大肠杆菌菌株aCGSC:大肠杆菌遗传贮存中心(cgsc.biology.yale.edu)。为了产生BW25113Δcas3::cat和MG1655Δcas3::cat,使用寡核苷酸从pKD3质粒(Datsenko等人(2000)Proc.Natl.Acad.Sci.U.S.A.,97,6640–6645)PCR扩增cat抗性盒,所述寡核苷酸附接合成的组成型启动子J23119(标准生物学部分的注册表中的BBa_J23119,www.partsregistry.org)(J23119-pKD3.for,J23119-pKD3.rev)。在第二次PCR扩增以引入同源臂(HR-cas3.for,HR-cas3.rev)之后,通过mini-λ-介导的重组将所得PCR产物重组至NM500(Court等人(2003)Gene,315,63-69)中。插入用cat盒和J23119启动子替代天然cas3基因和Cascade操纵子的天然启动子。通过测序验证成功的重组。然后使用P1转导将cat盒和合成启动子转移至BW25113和MG1655中。通过PCR验证成功的转导。为了产生BW25113Δcas3,使用pCP20质粒切除来自BW25113Δcas3::cat的cat盒,如先前所述(Chereanov等人,(1995)Gene,158,9-14)。为了产生NM500cas3+,使用寡核苷酸从pKD3质粒PCR扩增cat抗性盒,所述寡核苷酸附接组成型启动子J23119(J23119-pKD3.for,HR-casA.rev)。在第二次PCR扩增以引入同源臂(HR-cas3.for,HR-casA.rev)之后,将所得PCR产物重组至NM500中。该NM500cas3+菌株用组成型启动子替代Cascade操纵子的天然启动子,同时保留天然cas3基因。为了产生BW25113ΔCRISPR-Cas::cat,从pKD3质粒PCR扩增cat抗性盒(HR-CRISPR.for,HR-cas3.rev),并重组入NM500中,随后P1转导入BW25113中。该BW25113ΔCRISPR-Cas消除了整个CRISPR基因座以及cas3,Cascade操纵子和CRISPR1基因座。对于该工作中使用的所有质粒的列表,参见下表2。表2.质粒GFP报道质粒基于pUA66质粒(低拷贝sc101复制起点)(Zaslaver等人(2006)Nat.Methods,3,623-628),并且报道于先前工作中(Afroz等人(排版中)Bacterialsugarutilizationgivesrisetodistinctsingle-cellbehaviors.Mol.Microbiol.)。为了构建阿拉伯糖诱导的pcrRNA.ind质粒(中拷贝pBR322复制起点),设计寡核苷酸以编码单个重复和合成的rho非依赖性终止子(标准生物部分的注册表中的BBa_B1006)(pcrRNA.ind.for,pcrRNA.ind.rev)。将这些寡核苷酸退火,使用多核苷酸激酶(PNK)5’磷酸化,并连接至用KpnI-HF和HindIII-HF消化的pBAD18质粒中。为了构建组成型表达的pcrRNA.con质粒,将编码合成组成型启动子J23119的寡核苷酸(pcrRNA.con.for,pcrRNA.con.rev)退火,用多核苷酸激酶(PNK)5'磷酸化,并连接至用NsiI和NheI消化的pcrRNA.ind质粒中。插入用合成组成型启动子替代araC基因和ParaB启动子。为了将新的重复间隔区对插入pcrRNA.con或pcrRNA.ind中,将编码回文重复和crRNA间隔区的寡核苷酸退火,用PNK5’磷酸化,并连接至用KpnI和XhoI消化的任一质粒中。为了说明克隆方案,参见图6。通过测序验证所有质粒克隆。对于该工作中使用的寡核苷酸的列表,参见下表3。寡核苷酸由IDT化学合成。所有酶都购自NEB。表3寡核苷酸生长条件将所有菌株在14ml圆底聚丙烯管中在37℃和250RPM下在高达5mlLB培养基(10g/L胰蛋白胨、5g/L酵母提取物、10g/LNaCl)或M9最低培养基(1XM9盐、2mMMgSO4、0.1mMCaCl2、10μg/ml硫胺素)中培养,所述培养基含有0.4%甘油、0.2%所示糖和0.2%酪蛋白氨基酸的一些组合。将所有菌株铺板于100x15mm聚苯乙烯petri皿中的LB琼脂(具有1.2%琼脂的LB培养基)上。为了维持任何质粒,将细胞在含有以下浓度的适当抗生素的液体培养基中或琼脂平板上培养:50μg/ml氨苄青霉素、34μg/ml氯霉素、50μg/ml卡那霉素。间隔区设计对于该工作中靶向的原间隔区的列表,参见下表4。表4.原间隔区a与间隔区互补的目标链的特征:T,基因的模板链;N,基因的非模板链。b从转录起始位点(TSS)至PAM最近端的距离。负值和正值分别是TSS的上游和下游。cPAM为粗体红色字母(每个序列的前三个核苷酸)。设计CRISPR间隔区以匹配原间隔区序列。d靶向鼠伤寒沙门氏菌LT2中的原间隔区,并已显示在大肠杆菌中是非靶向的(4)。通过鉴定用于大肠杆菌中的I-E型系统的PAM(位于目标序列3’末端的CTT、CCT、CAT、CTC)选择原间隔区(Westra等人,(2012)Mol.Cell,46,595-605)。注意,基于我们以前用这些PAM序列的经验(Gomaa等人(2014)mBio,5,e00928-00913),仅在本工作中使用CTT和CCT。然后将紧接PAM下游的32个核苷酸用作间隔区。克隆方案需要将间隔区的最后两个核苷酸改变为TC(图6),预期其不影响crRNA活性(Semenova等人(2011)Proc.Natl.Acad.Sci.U..S.A.,108,10098-10103)。转化测定与先前工作(Gomaa等人(2014)mBio,5,e00928-00913)类似地进行转化测定。简言之,将大肠杆菌BW25113Δcas3::cat或NM500cas3+细胞在LB培养基中培养过夜。将培养物1:25反向稀释至125mlErlenmeyer烧瓶中的25mlLB培养基中并生长至0.6-0.8的ABS600,其使用Nanodrop2000c分光光度计(ThermoScientific)定量。然后将细胞在冰冷10%甘油中洗涤并浓缩100倍。使用MicroPulser电穿孔仪(Bio-Rad)用50ng质粒DNA转化总共50μl浓缩细胞。将转化的细胞在500μlSOC培养基中在37℃下恢复1小时。恢复期之后,将细胞稀释104–106倍,并将250μl稀释液铺板于具有适当抗生素和诱导物的LB琼脂上。流式细胞术分析将在含有0.2%酪蛋白氨基酸和0.4%甘油的M9最低培养基中生长过夜的细胞在具有0.1mMIPTG和0.2%所示诱导糖的特定组合的M9最低培养基中反向稀释至0.01的ABS600。在生长约3-4小时之后达到约0.2的ABS600后,将培养物在1XPBS中1:100稀释,并在配备有CFlow板取样器、488nm激光器和530±15nm带通滤光片的AccuriC6流式细胞仪(BectonDickinson)上运行。基于前向散射(FSC-H)和侧向散射(SSC-H)对反映事件的细胞进行门控,相应的下限截止值为11,500和600以减少颗粒的测量。使用用DRAQ5染料(ThermoScientific)染色的大肠杆菌细胞设置门控。然后在FL1-H中测量门控细胞的荧光。对每份样品分析至少30,000个事件。对于可逆性实验,将细胞在含有0.2%酪蛋白氨基酸、0.4%甘油和0.1mMIPTG且有或无0.2%L-阿拉伯糖的M9最低培养基中生长过夜。将过夜培养物沉淀并在具有0.2%酪蛋白氨基酸、0.4%甘油和0.1mMIPTG的M9最低培养基中重悬浮两次以除去残余的L-阿拉伯糖。然后将洗涤的培养物在30ml分别有或无0.2%L-阿拉伯糖的相同培养基中反向稀释至~0.001的ABS600。每小时,取出800μl培养物用于流式细胞术分析和ABS600的测量。倍增时间测量使细胞在具有0.4%甘油的M9最低培养基中生长过夜。将过夜培养物沉淀并在没有碳源的M9最低培养基中重悬浮两次。然后将洗涤的培养物向125mlErlenmeyer烧瓶中的25ml含有0.2%所示糖的M9最低培养基中反向稀释至~0.001的ABS600。每30分钟,取出800μl培养物用于测量ABS600。定量实时PCR使细胞在含有0.2%酪蛋白氨基酸和0.4%甘油的M9最低培养基中生长过夜。将过夜培养物在含有0.2%酪蛋白氨基酸、0.4%甘油和0.2%所示糖的M9最低培养基中1:250反向稀释。一旦培养物达到约0.4的ABS600,就如先前报道分离总RNA(Stead,等人(2012)NucleicAcidsRes.,40,e156),随后用DNA酶I处理。使用随机引物和SuperScriptIII逆转录酶(Invitrogen)从2μg所得RNA产生cDNA,随后用RNA酶H处理。使用表3中提供的基因特异性引物(X-qPCR.fwd/rev,其中X是目标基因)和SYBRGreen(Bio-Rad)对cDNA样品进行定量PCR。根据制造商的说明书,在Mastercyclereprealplex2实时PCR系统(Eppendorf)上运行cDNA。对于PCR运行,将各cDNA加热至95℃持续2分钟,随后50个循环的在95℃的15秒变性步骤、在55℃的15秒退火步骤和在72℃的30秒延伸步骤。在运行结束时,产生熔解曲线以确保不存在非特异性产物。使用2-ΔCt方法计算基因表达的相对定量。生长测定将细胞接种至含有0.4%甘油的M9最低培养基中并生长过夜。24小时之后,将细胞沉淀并在2ml不含碳源的M9最低培养基中重悬浮两次,以除去作为可能生长源的甘油。然后将洗涤的培养物向2ml含有0.2%所示糖的M9最低培养基中反向稀释至0.001的ABS600。最后,使培养物生长24小时,直到测量ABS600。实施例14.结果缺失cas3后的靶向基因阻遏为了探索I型系统用于基因调节的能力,我们在大肠杆菌K-12中采用I-E型CRISPR-Cas系统(图4)。因为编码Cascade(cse1-cse2-cas7-cas5-cas6e)的casABCDE操纵子在正常生长条件下被强烈阻遏(Pul,等人(2010)Mol.Microbiol.,75,1495–1512;Westra,等人(2010)Mol.Microbiol.,77,1380–1393),我们在一轮同源重组中用组成型启动子替代cas3和天然cse1启动子(图5)。用编码L-阿拉伯糖-诱导型单间隔区阵列的中拷贝质粒(图6)和编码lacZ启动子(pUA66-lacZ,表5)下游的绿色荧光蛋白(gfp)基因的低拷贝报道质粒转化所得菌株(BW25113Δcas3::cat)。设计间隔区以靶向启动子和gfp编码区中的十个位置以及启动子上游远端的两个位置(图7A,表4)。使用流式细胞术分析,然后在诱导GFP和crRNA表达后测量单个细胞的荧光。表5.启动子序列a以灰色突出的序列来自pUA66,表明每个启动子插入质粒中的位置。加下划线和加粗的碱基是先前绘制的转录起始位点。与不含间隔区的质粒(pCRISPR.ind,图6)相比,我们观察到取决于靶向pUA66-lacZ的哪个区域的阻遏程度(图7B)。靶向启动子区域的任一链强烈减少GFP荧光(~200倍)。靶向转录区域适度地减少GFP荧光,但仅当靶向沿着非模板链或在模板链上的RNA聚合酶足迹附近的任何地方时(Kovacic,R.T.(1987)J.Biol.Chem.,262,13654–13661.)。有趣的是,当靶向模板相对于非模板链时观察到的链偏差反映了在细菌中对于dCas9观察到的结果(Qi等人(2013)Cell,152,1173–1183;Bikard等人(2013)NucleicAcidsRes.,41,7429–37)。如预期,靶向启动子区的上游几乎不减少荧光。在所有情况下,基因沉默的程度在整个细菌群体中是一致的。重要的是,GFP水平对于无间隔区质粒和编码靶向沙门氏菌中的mviM基因的间隔区的质粒是类似的(图7B),排除了由于Cascade组装导致的可能差异。基于添加或去除L-阿拉伯糖后荧光的变化,我们还发现GFP沉默是可逆的(图7C)。类似于先前工作(Bikard等人(2013)F1000primeRep.,5,47),相关的动力学可以归因于GFP的稳定性。我们接下来进行一系列对照实验以评价缺失cas3和组成型表达Cascade操纵子的影响。我们首先在其中Cascade操纵子被紧密阻遏且cas3仍然存在的原始野生型菌株(BW25113)和其中cas3和Cascade操纵子都缺失的菌株(BW25113ΔCRISPR-Cas::cat)中测量GFP荧光。无论是否使用靶向间隔区,荧光水平是相似的(图8A),表明对于基因沉默,Cascade必须存在且Cas3必须不存在。接下来,为了评价对DNA完整性的影响,我们在具有组成型表达的Cascade和cas3存在(NM500cas3+)或不存在(BW25113Δcas3::cat)的菌株中的靶向和非靶向质粒的转化效率。令人惊讶地,我们观察到,靶向和非靶向质粒的类似转化效率,甚至当cas3存在时(图8B),表明Cas3在该菌株中表达较差或无活性。作为进一步支持,cas3存在的菌株仍然可以强烈沉默GFP(图8C)。最后,为了测量抗性盒的影响,我们切除了用于缺失cas3的盒以产生BW25113Δcas3–cat菌株并测量基因沉默。所得菌株(BW25113Δcas3)和原始菌株(BW25113Δcas3::cat)表现出类似的沉默效率(补充图S4C),表明抗性盒的可忽略的影响。阵列长度和间隔区位置的影响Cascade的一个有益特征是其可以处理来自单个间隔区阵列的多个crRNA。然而,很少知道天然或合成的多间隔区阵列的组成如何定量地影响单个目标。为了评估阵列长度的影响,我们产生了具有一个启动子-靶向间隔区(T2)、随后零至三个非靶向间隔区(mviM)的阵列(图9)。流式细胞术分析揭示沉默效率随着每个额外间隔区逐渐降低。我们推测,这种降低可能是由于非靶向间隔区稀释了用于靶向crRNA的可用Cascade复合物,如用其它基于RNA的系统所观察到的(Hussein,R.和Lim,H.N.(2011)Proc.Natl.Acad.Sci.U.S.A.,108,1110–1115)。为了支持该论断,单间隔区阵列和四个靶向间隔区的阵列表现出统计学不可区分的沉默程度(双尾t检验,t(4)=1.05,p=0.35)(图9)。为了评估间隔区位置的影响,我们产生具有一个靶向间隔区和三个非靶向间隔区的不同排列的阵列(图9)。除了四间隔区阵列的第一位置中的靶向间隔区以外,无论间隔区位置,gfp沉默的程度是类似的(单向ANOVA,F(2,6)=0.15,p=0.86)。这些结果表明,较长阵列可以降低单个间隔区的效力,而阵列内间隔区的精确位置对沉默效力具有较小的贡献。内源性基因的多重阻遏作为靶向异源基因诸如gfp的补充,我们探究间隔区调节内源性目标的能力。我们聚焦于参与糖L-阿拉伯糖(araBAD)、L-鼠李糖(rhaBAD)、D-木糖(xylAB)和D-乳糖(lacZYA)的分解代谢的操纵子(图10A),因为这些操纵子得到充分表征并且是它们的同源糖上的生长所需(Gross,J.和Englesberg,E.(1959)Virology,9,314–331;Power,J.(1967)Genetics,55,557–568;Lawlis,等人(1984)Appl.Environ.Microbiol.,47,15–21;Beckwith,J.R.(1967)Science,156,597–604)。因为araBAD、rhaBAD和lacZYA操纵子在BW25113中被破坏,我们将cas3缺失和合成启动子引入大肠杆菌K-12的另一菌株(MG1655Δcas3::cat)。我们还将每个单一间隔区阵列置于强组成型启动子的控制下,以避免需要L-阿拉伯糖作为诱导物(图6)。为了评价启动子活性的沉默,我们在pUA66质粒中克隆了gfp上游的每个操纵子的启动子(下表5)。将所得质粒置于携带相应的单间隔区质粒(上顶部)或多间隔区质粒(底部)的MG1655Δcas3细胞中,然后在用同源糖诱导启动子后通过流式细胞术分析测试阻遏它们各自的目标启动子的能力(图10B)。与不含间隔区的质粒(pCRISPRcon,图6)相比,各靶向质粒大大降低荧光(约80倍至约900倍)。如所预期,当单独测试时,将间隔区组合成一个阵列强烈降低了所有四种启动子的荧光(图10B),尽管沉默程度通常小于对于单个间隔区观察到的程度(图9)。为了评估内源性基因的沉默,我们用各单一间隔区质粒测量细胞的各操纵子的mRNA水平。与无间隔区质粒相比,单一间隔区质粒大大降低了目标操纵子的mRNA水平(约11倍至约2,200倍)(图10C),与对于GFP报道分子观察到的结果相平行(图10B)。这种宽范围的阻遏与用dCas9观察到的基因沉默的变异性(Qi等人(2013)Cell,152,1173–1183;Bikard等人(2013)NucleicAcidsRes.,41,7429–37)相匹配。最后,我们探究靶向内源性基因是否可以产生定义的表型。因为每种操纵子是其同源糖的分解代谢所需,所以我们测量了每种糖以及两种非靶向糖D-葡萄糖和N-乙酰基-D-葡糖胺(GlcNAc)上的生长。我们培养以不同糖作为唯一碳源表达单个间隔区或四间隔区阵列的MG1655Δcas3::cat,并测量生长24小时后培养物的浊度(图10D;图11A)。我们发现,靶向每个操纵子都限制同源糖上的生长,无论使用单间隔区阵列还是使用四间隔区阵列。四个间隔区阵列沉默单个细胞中的所有目标操纵子,因为该阵列限制含有所有四种靶向糖的培养基中的生长(图11A)。对于所有非靶向糖,生长都是无阻碍的,这支持了靶向的特异性。对于在L-鼠李糖中生长的所有培养物,最终浊度一般较低(图10D,图11A),我们将其归因于L-鼠李糖是贫碳源(图11B)。因此,我们得出结论,在大肠杆菌中缺乏Cas3的I-E型系统可以被编程为沉默多个内源性基因并产生复杂表型。实施例15.讨论如本文所示,大肠杆菌中的I-E型CRISPR-Cas系统可以通过cas3的缺失和Cascade操纵子的组成型表达而重新用于可编程的基因阻遏。结构和系统进化数据表明,基于在Cas3不存在的情况下Cascade的稳定性和该复合物加工转录的CRISPR阵列的能力,该相同现象容易应用于I-B、I-C和I-F型系统(Makarova等人(2011)9,467–477;Nam等人(2012)Struct.Lond.Engl.1993,20,1574–1584;Brendel等人(2014)J.Biol.Chem.,289,7164–7177;Wiedenheft等人(2011)Proc.Natl.Acad.Sci.U.S.A.,108,10092–10097)。I-A和I-B型系统似乎是例外,因为需要两种不同的Cas3蛋白质(Cas3’和Cas3”)用于稳定I-A型Cascade,且未表征的I-B型Cascade与I-A型系统最密切相关(Sorek等人(2013)Annu.Rev.Biochem.,82,237–266;Plagens等人(2014)NucleicAcidsRes.,42,5125–5138)。然而,这些cas3基因可以被催化灭活(Hochstrasser等人(2014)Proc.Natl.Acad.Sci.U.S.A.,111,6618–6623),如用Cas9所进行(Jinek等人(2012)Science,337,816–821),尽管具有使用基本遗传工具更难引入的点突变。表明了这一点,另一个问题是I型系统或II型系统是否应该用于转录调节。dCas9形式的II型系统是非常有吸引力的,因为它们提供了可以引入多种生物体中的紧凑异源性系统。然而,开发内源性I型系统确实提供了一些潜在优势。例如,一旦缺失cas3,就必须仅引入总共最多几百个碱基的CRISPR阵列。另一个潜在优势在于天然I型系统将非常适合于在环境条件下生长的嗜热和超嗜热微生物,所述环境条件将阻止常见Cas9蛋白质的正确折叠。I型系统还提供不同于与已知II型系统相关的PAM的PAM,包括不同的取向和对T/C富集序列的偏好(Sorek等人(2013)Annu.Rev.Biochem.,82,237–266;Westra等人(2012)Mol.Cell,46,595–605;Esvelt等人(2013)Nat.Methods,10,1116–21.)。最后,I型系统天然存在于多种工业和医学相关的菌株中,包括大肠杆菌、嗜热链球菌、自产乙醇梭菌和鲍曼不动杆菌(Grissa等人(2007)BMCBioinformatics,8,172)。该策略的可能缺点在于所述菌株可能丧失针对一些侵入病原体的免疫性。在Cas3不存在的情况下的Cascade的过表达也可能无意影响转录景观,尽管这甚至对于dCas9仍然有待探究。当靶向转录区域时,对于用I型和II型系统的转录调节观察到的一个有趣并行结果是链偏差(图7B)(Qi等人(2013)Cell,152,1173–1183;Bikard等人(2013)NucleicAcidsRes.,41,7429–37)。先前用dCas9的工作表明,靶向非模板链、而非靶向模板链强烈干扰RNA聚合酶延伸。我们用I-E型Cascade观察到相同趋势(图7B),尽管与dCas9相比具有结构差异和相反的PAM位置(Jore等人(2011)Nat.Struct.Mol.Biol.,18,529–536.;Westra等人(2012)Mol.Cell,46,595–605;Jiang等人(2013)RNat.Biotechnol.,31,233–239.;Nishimasu等人(2014)Cell,156,935–949)。总之,本发明提供了利用I型CRISPR-Cas系统用于转录调节的新颖策略。此外,我们的发现提供了鉴定天然I型系统的框架,所述天然I型系统天然调节基因表达,潜在地扩展了协调细胞过程的已知系统的列表(Sampson等人(2014)Proc.Natl.Acad.Sci.U.S.A.,111,11163-8;Sampson等人(2013)Nature,497,254-257)。实施例16.间隔区长度研究了1型CRISPR-Cas系统的间隔区长度和其它特征的影响。间隔区从其3’末端延伸,其保留了PAM的位置。图13显示靶向的不同位置的示意图。图14前进直至+24核苷酸至NT3间隔区,并显示增加间隔区长度改善沉默效率,尽管趋势是非单调的。图15显示增加间隔区长度似乎不会改善用T2间隔区的沉默效率,因为“正常”间隔区长度已经将荧光减少到近背景水平,为可能的沉默改善留下很少的空间。图16显示增加间隔区长度似乎不会改善用T4间隔区的沉默效率。图17、18和19显示互补性的量如何影响用较长间隔区的沉默效应。图17显示破坏较长间隔区和目标之间的碱基配对相互作用的示意图。图18和19显示用额外核苷酸破坏碱基配对将沉默效率降低约10倍。总而言之,数据显示,沉默效率可以通过改变间隔区的长度来改变,并且必须维持延伸的碱基配对以保持沉默活性。实施例17.用来自耐盐芽孢杆菌I-C型CRISPR-Cas系统的Cascade的靶向基因阻遏从大肠杆菌中的组成型质粒表达与I-CCascade复合物(cas5c、cas8c和cas7)相关的三个基因。大肠杆菌细胞还携带编码由lac启动子控制的绿色荧光蛋白(gfp)基因的质粒和编码耐盐芽孢杆菌重复(间隔区-)或重复-间隔区-重复(间隔区+)的另一种质粒。设计整合的间隔区以靶向具有侧翼CTC或TTCPAM的lac启动子内的序列。对于I-C型系统预测两种PAM。使携带三种质粒的细胞在具有适当抗生素的LB中生长过夜,反向稀释至相同培养基中,并培养,直至达到对数中期。然后通过流式细胞术分析来分析培养物。报道的值是单峰直方图的平均荧光减去GFP阴性细胞的荧光。图20A显示在组成型启动子控制下的耐盐芽孢杆菌I-C型Cascade操纵子。如下所述,CRISPRRNA指导Cascade结合控制GFP表达的lac启动子;图20B显示通过流式细胞术分析的培养物的分析。数据表明来自耐盐芽孢杆菌的I-CCascade的阻遏,其中阻遏的程度在两种不同的PAM之间变化。这些数据表明我们使用异源表达的Cascade实现靶向基因沉默的能力和我们的一般方法超出I-E型系统的适用性。前述内容是说明本发明的,而不应被解释为限制本发明。本发明由以下权利要求与其中包括的权利要求的等同方案所定义。序列表<110>北卡罗来纳州立大学C·拜塞尔M·罗<120>用于使用CRISPR相关基因RNA引导阻遏转录的方法和组合物<130>5051-861WO<150>US62/058,365<151>2014-10-01<150>US61/976,883<151>2014-04-08<160>249<170>PatentIn版本3.5<210>1<211>346<212>PRT<213>AeropyrumpernixK1<400>1AlaTyrValArgValAlaGlyArgValArgValAsnValAlaValLeu151015ThrGlyHisGlyThrAlaGlyAsnTyrSerMetHisAlaArgAlaArg202530ValTyrCysCysGlyAspSerSerLysValTyrGluValProValLeu354045ThrGlyAsnSerLeuLysHisTrpHisAlaTyrTyrAlaAlaGlnVal505560TyrGlnAlaLeuGlyGlySerMetLeuAsnGluLeuCysLysArgGly65707580IleGlyLeuArgGlyTyrAsnValAspThrAsnLeuGluGlyGluArg859095ArgLeuAlaThrArgGluSerGluAlaIleLysAspPheCysAsnAsp100105110LeuHisGlyPheLeuIleAlaGluArgGlyArgGlnLeuLysArgAsp115120125SerLeuAlaArgPheSerPheAlaIleProValLeuAsnAsnGluVal130135140LeuGluAsnIleGluLysPheSerValThrHisAsnArgValAspPro145150155160LeuGlnArgArgArgAlaGlyGluGluSerAsnSerGlnGluThrGly165170175AlaThrGluMetMetValPheLysGlnGluTyrSerSerGlyLeuTyr180185190GlyIleSerAlaSerPheAspLeuGluTyrLeuCysArgProLeuTyr195200205GluSerGluGluGlyGlySerAlaCysAspGluGluGluArgMetArg210215220ArgAlaArgAlaSerLeuLeuAlaLeuAlaTyrLeuLeuGlyGlyAla225230235240AlaSerLysGlnAlaArgAlaLeuProIleAlaMetValGluGluLeu245250255ValValAlaValCysAsnLysProValProAsnAlaValHisGlySer260265270TyrGluAsnTyrValGluLysThrAlaSerLeuLeuLysSerValThr275280285GluSerLeuGlyAspGlyAlaSerCysIleLeuHisCysTyrProGlu290295300GlyIleCysGlyGlyTyrGlySerAspLysLeuLysIleLysGluTyr305310315320ArgAspLeuGlyThrLeuLeuLysGluAlaAlaAspHisAlaSerGlu325330335LeuValGlyGlyTyrGlyGlyLysGluAla340345<210>2<211>320<212>PRT<213>SulfolobussolfataricusP2<400>2IleGlyGlySerGlyArgPheLeuValAsnLeuGluSerLeuAsnGly151015ValGluSerIleGlyAsnLeuThrLysHisArgThrAlaProValVal202530LeuLysThrSerThrGlyTyrLeuValArgTyrValProValIleSer354045GlyGluAlaLeuAlaHisAlaTyrGlnAlaSerLeuValAspIleAla505560LysLysGluGlyLeuProValGlyAsnLeuSerSerGlnTyrGluPhe65707580IleLysPheSerThrAspGluAlaLeuLysIleGluGlyIleLysGlu859095ProLysAspTyrAsnAspAlaArgArgPheGluValGluValMetLeu100105110LysAspValIleAlaAspValGlyGlyPheMetTyrAlaGlySerAla115120125ProValArgArgThrSerArgIleLysLeuGlyTyrMetIleProAla130135140LeuArgGlyAspGluIleProAlaGlnLeuGluAlaGlnPheHisVal145150155160ArgPheSerAsnLysProValLysGlySerGlnAlaIlePheAsnVal165170175GluValSerSerAlaLeuTyrThrPheSerPheGluLeuAspGluAsp180185190LeuIleAlaValProSerThrValGlyGluLysValLysGlyGluGlu195200205GluLeuGluArgGlnLysAlaArgArgValAspSerAlaIleLysAla210215220LeuTyrSerLeuLeuAlaGlyAsnPheGlyGlyLysArgSerArgPhe225230235240LeuProSerMetLysLeuMetSerLeuValValValLysThrAspPhe245250255ProPheIleProGluProGlyHisAspAspSerTyrIleLysThrThr260265270ValMetArgLeuGluLysAlaLysSerValLeuAsnGlyAsnValAla275280285LysValTyrValIleAsnAsnGluGlyIleGluValGlyGluGlyAla290295300ThrValLeuSerSerValGluAspLeuValAlaLysLeuLysGluLys305310315320<210>3<211>328<212>PRT<213>ThermoproteustenaxKra1<400>3ArgValAlaProProTyrValArgAlaAlaGlyArgPheGluAlaGln151015LeuSerValLeuThrGlyAlaGlyAsnMetGlyAsnTyrAsnMetHis202530AlaValAlaLysValIleHisGlyGlyLysAlaTyrGluValProVal354045LeuThrGlyAsnAlaLeuLysHisTrpHisSerValTyrLeuAlaGlu505560ValTyrGlnAspLeuGlyGlyThrGlnLeuAsnGluPheCysLysLys65707580GlyValGlyLeuArgGlyLysAsnMetSerGlyGluAspAlaSerSer859095GluAlaGluAlaIleLysAspLeuCysAsnAspLeuHisGlyPheLeu100105110LeuProAspLysGlnIleLysArgAspSerLeuValArgValSerPhe115120125AlaValProValLeuGluGluLysAsnLeuGluAlaAlaSerLysPhe130135140AlaValValHisAsnArgValAspProPheLysArgThrGlnGlnVal145150155160LysSerLysGluGluGlnGluGlyThrGluMetMetValPheLysGln165170175GluTyrSerSerAlaValTyrGlyPheAlaAlaAlaMetAspLeuGly180185190LeuSerGlyValProLeuTyrGlnGluGlyGluSerGlyValAspAsp195200205ArgGluArgAlaLeuArgIleLysSerAlaLeuValAlaLeuLeuArg210215220LeuPheAsnGlyValGlySerLysGlnAlaArgAlaLeuProIleAla225230235240ArgLeuArgGluLeuValIleAlaIleSerAspSerProIleProAsn245250255LeuValHisGlyAlaTyrProAspTyrValAlaArgSerAlaGluLeu260265270LeuThrAlaTyrLeuLysAlaValGlyLysLysGlyValValLeuCys275280285TyrGlyValAspCysProGlnSerAsnAsnValLeuGluCysLysLys290295300AlaAspThrLeuAspAspLeuPheGlnGluAlaLeuArgArgAlaLeu305310315320ProGlyGlyGlnProAlaArgArg325<210>4<211>130<212>PRT<213>AeropyrumpernixK1<400>4GluArgValAspGlyGlnArgAspProValGluAspLeuAlaArgAla151015AlaArgIleValIleLeuAlaGluGluAlaTyrAspIleThrAspThr202530LeuAlaSerArgProSerSerTyrGluGluGlnLeuAlaLeuLeuAla354045ArgLeuAlaValLysValTyrLysAspLeuGluSerPheTyrAsnLys505560GlyGluGlyGluArgValGluGluAlaLeuLysArgLeuLysTyrMet65707580AlaAlaAsnLeuGluLysLeuPheArgTyrLeuArgCysValGluAla859095GluGlyGlyGluLysLeuLeuAsnArgGluValArgArgLeuAlaAla100105110LeuSerLeuAlaProAspTyrHisAlaLeuSerValArgGluIleLeu115120125TrpGly130<210>5<211>373<212>PRT<213>AeropyrumpernixK1<400>5ValCysIleLeuTyrThrProGlyHisAsnLeuTyrThrAspThrLeu151015IleLeuTyrGlyIleAlaArgLeuLeuAlaTrpSerGlyLysValSer202530GlyGluValGluArgValGlyGluArgTyrValValLysValAspAla354045AspAsnCysHisProValSerGlnLeuProGluSerIleArgLeuAla505560LeuArgLeuLeuGlnGluGluGlnGlnGlnValPheLeuGlyAspGlu65707580GlyThrPheTyrSerAspLeuTyrArgLeuAlaArgGlySerLysVal859095GlyGluSerIleLeuAsnAsnLeuArgIleArgValAlaAlaLysIle100105110LeuSerAsnAspAlaAsnIleLeuGluLysTyrValSerProGlyHis115120125LysLysLeuGlnGlyGluPheArgGlyArgLysLysGlyLeuValThr130135140LeuValLeuProLeuGlyProLeuTyrGlyLysPheTyrThrTrpSer145150155160LeuLysProArgArgLeuThrGluLysProTyrValValCysProTyr165170175CysTyrPheLeuSerValLeuGlyPheHisTyrGlySerTyrThrTyr180185190GlnLysAspGlyGluSerLysValValThrLeuSerProHisHisAla195200205SerLeuGluAspValLeuAlaLeuSerGlnSerPheGluAlaAlaSer210215220IleTrpMetProAlaIleLeuArgTyrArgAsnSerLeuThrGlyPro225230235240GlyLeuSerLeuTyrValLeuSerLeuGlyGluThrLeuLeuSerSer245250255SerSerHisPheGluValLeuTyrGlyGluPheSerValAspAsnAsn260265270ThrPheArgValValAspValGlyArgLeuProGlyValLeuLeuThr275280285SerIleAlaIleIleLysTyrHisMetAlaSerTrpProArgLeuIle290295300AspPheIleAlaArgArgAspProGlyLeuLeuHisArgIleAlaLeu305310315320ThrLeuSerPheGluValGlyAsnGluTyrAlaLeuTyrGlyIleLeu325330335ArgGluIleLeuSerLeuLeuAsnAspAspLysSerGlnGluAlaArg340345350TyrLeuAlaLysGlnLeuAspArgLeuAlaGluGlyLeuAlaMetVal355360365TrpGluSerGlyGly370<210>6<211>360<212>PRT<213>ThermoproteustenaxKra1<400>6ThrGlnCysProGlnGluMetIleThrProGlyHisGlyIleIleAla151015AspAlaLeuIleMetHisGlyLeuIleLysIleLeuHisIleGluGly202530LysMetGluGlyTrpAlaGluArgArgGlyGluArgPheValValCys354045AlaGluArgProAspLeuAsnTrpIleAspGlnTrpGluProMetGlu505560LeuLeuGluIleAlaAlaGluPheLysAlaLysGlyLysAspArgAla65707580SerGluGluGluGluGlnArgProTyrPheGlyLeuValHisAspLeu859095SerArgSerThrValAspProGlyAsnPheSerSerTrpIleSerAsp100105110ValArgGluAlaLeuTyrAlaLeuLysAlaAspPheAspLeuSerGlu115120125GluHisLysGluLysArgGlyGluGlyArgAlaArgSerLysLysArg130135140GlyTyrTyrThrLeuTyrLeuProLeuSerGlyValTyrGlyLysTyr145150155160ValValGluAsnTyrGlyIleArgGlnSerGlnTyrAlaValCysAla165170175ThrCysPheAlaLeuSerThrLeuGlyTyrIleTyrGlyThrValLys180185190AlaArgValGluArgArgSerSerSerGlyGlyGlyHisAspValPhe195200205AsnLeuThrPheIleProArgGluArgThrSerLeuArgSerLeuMet210215220AlaLeuGlnArgMetAlaGlyLeuValGluMetArgProGlyAspLeu225230235240AsnGluLeuGlyAlaValValTyrMetLeuSerValGlyGluThrIle245250255TyrAlaValArgGluGlyValAspIleLeuValTrpValThrGlnArg260265270AlaGlyAsnPheGlnArgThrValGlyValAsnIlePheArgGlyAsp275280285ArgLeuLeuGluAlaIleAlaGluIleLysTyrArgAlaProSerTrp290295300ProLysIleAlaArgGlnLeuGlySerSerLeuAsnValLeuGlyGlu305310315320TyrLeuAlaPheGlyGlyAspValTyrHisValIleArgSerValMet325330335AlaAspLeuGlyArgLysGlyGlyLysLeuAlaGlyLeuGluGlyLeu340345350AlaGluAlaLeuLysLysIleGly355360<210>7<211>281<212>PRT<213>AeropyrumpernixK1<400>7ArgProGlyAspTrpValValValAlaGluLeuAlaThrProAlaPhe151015SerValLysAsnProGluSerTyrGlnValAlaSerProLeuProLeu202530ProLeuProSerThrLeuLeuGlyGlyLeuMetArgGlyAlaSerLeu354045LeuGlySerCysThrGlyGlyIleAlaSerGlnSerCysIleLysLys505560ThrGlyArgIleValLysAlaAlaAlaProLeuSerLysProGlyGln65707580IleLeuGlyValGluTrpGluValValLeuArgArgLeuArgLysVal859095LeuGluProAspSerGluGluGlySerThrArgGluAsnArgGlyAsn100105110ArgValLeuAspGluLeuSerArgIleSerAspAlaLeuLeuArgGly115120125TyrIleThrProTyrAsnProValTyrAlaValPheValAlaArgGly130135140ArgAspAsnAlaAsnArgIleGluLysAlaLeuTrpTyrIleAspArg145150155160LeuGlyAspSerGluSerLeuValSerAlaArgProValGlyArgCys165170175GlnLeuAlaGluPheArgSerLysSerValAsnThrProValAlaLeu180185190AspSerAlaValGlyGlySerPheThrValValTyrAlaProAlaArg195200205AlaGlyArgThrGlyArgThrArgArgSerGluAlaIleAlaIleAla210215220MetProValLysLysGluAlaValGluArgGlyTyrValLeuValTyr225230235240SerGluIleGluValGluGlySerValTyrGlyCysSerValGluGly245250255IleAspGlyArgIleAsnValAlaValHisGluSerPheHisGluVal260265270SerGlyTyrGlyIleTrpMetProAla275280<210>8<211>239<212>PRT<213>SulfolobussolfataricusP2<400>8IleTyrSerLysValPheLeuLysLeuHisTrpGlyPheSerValVal151015LysProSerAlaAlaLysAlaLysSerGlyPheTyrLeuProProPro202530ThrThrLeuIleGlyAlaLeuSerTyrGlyLysPheArgGlyIleAsp354045AsnThrAsnLeuGlyLysIleTyrGlySerProAlaTyrAsnPheArg505560AsnValMetAlaThrAlaArgLeuGluSerGluGlyAlaTyrThrGlu65707580AspIleValArgAsnValIleSerTyrPheGlnArgLysAspArgArg859095AspAsnProArgTyrIleTyrGlyValIleProThrGlyLysValTyr100105110MetProAsnGlyThrLeuValValValTyrValThrAspSerMetSer115120125LysGluGluLeuGluLysLeuSerTrpSerIleThrArgIleGlyGly130135140LysGluCysLeuValSerValGluAsnValGluIleGlyGluAlaLys145150155160LysValSerGlyArgMetLysThrArgTyrTyrPheArgAspThrVal165170175LysValValGlyLysLysGluPheLeuGluTyrValThrPheTrpGlu180185190GluAsnGlyTyrIleTrpGlyLysGluGlyGlyProIleArgTyrIle195200205LeuProValAlaThrTyrProLeuAlaSerLysGluValGluValGlu210215220AlaLysGluAlaTyrGluValGlyGlyGluTyrValValPheSer225230235<210>9<211>225<212>PRT<213>ThermoproteustenaxKra1<400>9HisTyrTyrLeuIleGluAlaArgAlaProLeuTyrSerValLysVal151015ValAspValTyrGlnValAlaSerAlaTyrProLeuProThrProHis202530AlaValValGlyAlaLeuGlyAlaAlaMetAlaHisAlaGlyMetCys354045ArgGlyLeuGlnCysMetLysGluAlaGluGlyLeuValValAlaAla505560ArgProAlaAlaValGlyGluLeuAlaLysPheProAlaValLeuTrp65707580ArgThrArgGlyValLeuGluAspLysSerLeuProAlaGlyLeuGlu859095AspTyrAlaGlyAlaArgAspAlaMetValArgGluTyrValTyrAla100105110HisAlaValLysIleLeuLeuValThrArgLysArgValProGlnHis115120125ValIleArgLeuMetAlaArgLeuGlyAspSerGluSerTyrValSer130135140ValValAspValLeuGluGlyLysProArgGluCysGlyGlyLeuVal145150155160AsnValAlaValArgAlaAlaLysAlaArgArgGlySerTyrThrLeu165170175TyrArgAlaLeuAspGluArgGlyAsnArgGluLeuPheAlaTyrPro180185190ValValGluGluGlyGlyValTyrArgArgGlyGlyValGluValGly195200205SerLysValLeuCysLeuGlyGluAlaValPheProGluGlyAspGly210215220Trp225<210>10<211>242<212>PRT<213>AeropyrumpernixK1<400>10ValIleGlyLeuTyrLysValSerLeuIleLeuGluSerThrArgPro151015LeuProLeuLeuSerTrpSerGlyValValAlaAlaArgIleValLys202530GluCysIleGlyGlyArgGluGlyLeuValSerValGluProLeuGln354045LysGluGlyGlnProLeuAsnAlaSerProSerLysProSerThrIle505560GluGluProAsnIleLeuLeuGlyAlaThrLeuAsnThrThrGlyPhe65707580TyrArgLeuArgSerSerLeuProGlyCysLeuAspArgTrpGlyPhe859095ArgValIleSerPheGluValGluArgTrpValProArgLeuProArg100105110ArgValThrThrSerArgAspAlaIleGluPheThrValGluTyrTrp115120125ProThrIleTyrMetPheArgSerArgProIleLeuTyrProSerPro130135140GlnArgLeuValTyrSerValPheSerAlaLeuAlaArgHisThrGly145150155160LeuSerLeuLysGlyTyrAlaAsnThrLeuAlaSerAsnValGluLeu165170175LeuGlyTrpAsnGlyArgValGlyLeuTyrSerIleGlyArgAspArg180185190LysValArgAlaPheTyrGlyArgAlaThrTyrAlaAlaThrAlaArg195200205TyrValGluLeuLeuGlnLeuValMetGluAlaAlaGlnValLeuHis210215220ValGlyLysSerArgGlyIleGlyPheGlyAlaValLysThrGlySer225230235240IleMet<210>11<211>288<212>PRT<213>SulfolobussolfataricusP2<400>11ProLeuIlePheLysIleGlyTyrAsnValIleProLeuGlnAspVal151015IleLeuProThrProSerSerLysValLeuLysTyrLeuIleGlnSer202530GlyLysLeuIleProSerLeuLysAspLeuIleThrSerArgAspLys354045TyrLysProIlePheIleSerHisLeuGlyPheAsnGlnArgArgIle505560PheGlnThrAsnGlyAsnLeuLysThrIleThrLysGlySerArgLeu65707580SerSerIleIleAlaPheSerThrGlnAlaAsnValLeuSerGluVal859095AlaAspGluGlyIlePheGluThrValTyrGlyLysPheHisIleMet100105110IleGluSerIleGluIleValGluValGluLysLeuLysGluGluVal115120125GluLysHisMetAsnAspAsnIleArgValArgPheValSerProThr130135140LeuLeuSerSerLysValLeuLeuProProSerLeuSerGluArgTyr145150155160LysLysIleHisAlaGlyTyrSerThrLeuProSerValGlyLeuIle165170175ValAlaTyrAlaTyrAsnValTyrCysAsnLeuIleGlyLysLysGlu180185190ValGluValArgAlaPheLysPheGlyIleLeuSerAsnAlaLeuSer195200205ArgIleIleGlyTyrAspLeuHisProValThrValAlaIleGlyGlu210215220AspSerLysGlyAsnLeuArgLysAlaArgGlyValMetGlyTrpIle225230235240GluPheAspIleProAspGluArgLeuLysArgArgAlaLeuAsnTyr245250255LeuLeuThrSerSerTyrLeuGlyIleGlyArgSerArgGlyIleGly260265270PheGlyGluIleArgLeuGluPheArgLysIleGluGluLysGluGly275280285<210>12<211>569<212>PRT<213>AeropyrumpernixK1<400>12GluTyrGlyCysGlnProAsnValLeuLysLysThrIleLeuLysMet151015ValLysArgArgIleHisValGluGlyAlaLysLysAlaValAsnGlu202530AlaLeuLeuAsnSerGlnAlaLysAlaAlaGluGluIleCysArgIle354045AlaTyrGluSerProGlyGlyValValPheLeuGlyAlaProThrGly505560AlaGlyLysThrGluValPheMetAlaProLeuLeuAlaSerPheAla65707580SerLysArgProIleAlaAlaArgGlyPheLeuValGluProMetHis859095SerLeuIleLysAlaMetValAspArgLeuLysThrSerIleGluThr100105110LeuGlyValSerGluAspHisGlyGluThrValGlnProThrPheLeu115120125TyrThrAlaProIleThrValThrThrProAspThrTyrPheTyrGly130135140PheAlaAlaSerArgValTyrArgIleLeuThrHisGluGlyValGlu145150155160ThrGlyArgPheSerMetProValGlyLeuGlnAlaThrSerTyrThr165170175ValPheAspGluAlaHisLeuValGlnAspGluValPheLeuSerPro180185190ArgLeuLeuSerLeuValValAlaAlaLeuAlaArgAlaGlyGlyLeu195200205IleValValSerSerAlaThrLeuProSerTyrTyrLysThrValIle210215220ArgGluLysLeuGlyAspTrpArgValGluGluValGluLeuAspHis225230235240ThrValLeuSerProLysIleAspValGluValLysAsnAsnSerLeu245250255GluProAspAspValAspCysAsnValLysGlyLeuValLeuValAsn260265270ThrValSerLysSerIleArgValTyrLysSerLeuLysThrArgCys275280285SerAsnSerLysValLeuLeuLeuHisSerLeuPheLysArgArgAsp290295300LysAsnSerLysIleGluLeuLeuGlnLysLeuLeuLysGluGlnAsp305310315320AsnGlyValIleAlaValAlaThrGlnValLeuGluValGlyValAsp325330335LeuAspPheGluAlaLeuTyrThrGluThrAlaProIleAspSerVal340345350IleGlnArgLeuGlyArgIleGlyArgArgArgGlyArgGlyTyrAla355360365IleIleTyrAsnAlaGluThrHisHisProTyrProGluLysLeuTyr370375380LeuLysSerLysGluIleMetAspGlnLeuAlaGlyThrTyrThrPro385390395400SerIleArgThrSerSerAspLeuValAsnThrValTyrGluArgAsp405410415ValValAspSerLeuAlaArgLeuGlyAspLysLeuMetLeuArgAla420425430LeuAlaTyrLeuGluSerLeuAlaProLeuSerTyrProProAsnAsp435440445AspLeuTyrPheArgProSerAlaPheIleAspIleAlaIleLeuPro450455460CysAspIleValGlyAspGlyArgGluTrpGluProGluTrpGluGlu465470475480HisLeuValArgLeuSerIleProLeuSerAlaAsnGluArgThrSer485490495GlyTrpAspArgLeuThrArgLeuLeuSerLysAlaLysGluValTyr500505510GluValArgSerGlyProGlyGlyArgArgLeuIleArgAlaSerGln515520525ArgProLysProGlySerThrLeuValValCysLeuGluAsnProGlu530535540TyrValTyrAsnAspGluGluGlyLeuLeuValSerProLeuValGly545550555560GlyArgProArgValGlyGlyLysSer565<210>13<211>514<212>PRT<213>SulfolobussolfataricusP2<400>13LysLeuArgLeuArgLysHisMetArgLeuValGluAsnMetLeuSer151015LeuAlaAspPheTyrAsnAspPheIleThrArgHisGlyPheGluGlu202530ArgLysGlyIleGluGluThrLeuLeuAsnLeuGluAsnGlyHisSer354045ValIleLeuLysAlaProThrGlyTyrGlyLysThrThrLeuThrMet505560IleLeuAlaAsnAlaValSerSerAspIleAspLeuGlySerArgVal65707580IleHisValLeuProTyrArgAlaIleValGlnAspLeuTyrLeuLys859095LeuLysAsnTyrAlaAspArgGlyValIleTyrThrLysAsnIleGly100105110AlaGlnAspMetAspTyrGlnAspSerProPhePheMetLysLysVal115120125AsnValThrThrLeuAspThrPheIleLeuAsnLeuPheLysLeuPro130135140ThrValAspPheLysLeuIlePheLysAsnTyrGlySerHisTyrGlu145150155160PheProArgAlaLeuIleTyrSerSerIleValIlePheAspGluPhe165170175HisLeuLeuGlyGluAspGlyLysSerLeuGlyAlaGlyLeuAlaAla180185190LeuGluValLeuArgAspAlaGlyValProIleValValThrSerAla195200205ThrIleAspLysGlyLeuGluArgValLeuMetAsnLysLeuGlyLys210215220AsnValLysValValAsnAlaAspAspPheLysIleAspArgLysIle225230235240TyrValAsnValLeuGluAsnAspGluIleSerIleThrGluGluLys245250255ValLysGluGlyLysArgValLeuLeuValTyrAsnThrArgMetGly260265270AlaIleGluAlaTyrLysLysLeuLysGlyArgGlyLeuSerProIle275280285LeuIleHisSerLysPheSerLysLysAspArgIleAspLysValAsn290295300LysIleAsnGluAlaLysLeuValValSerThrGlnValIleGluAla305310315320GlyIleAspThrSerPheAspValLeuIleThrGluAlaSerProSer325330335HisAsnLeuIleGlnArgAlaGlyArgValAlaArgTyrGlyLysGly340345350GlyArgGlyLysLeuGluGlyGluValTyrIlePheProPheSerGly355360365LysValTyrAspGluArgGluValLysGluThrValGluArgValArg370375380GluLeuLysThrIleAspGluAsnLeuLeuIleGluArgAspTyrThr385390395400GluValIleAspSerIleLeuAlaLysAspLeuSerValIleAspAsn405410415SerValPheValAspSerLysLysValLysSerIleTyrGluLysIle420425430CysSerIleThrArgAsnAlaSerIleIleLeuGlyPheProProAsn435440445SerAsnAspValAsnAspAlaIleProLeuThrGluGluGluAlaIle450455460LysIleIleGluSerLysGlySerSerAlaPheValGlyAsnGlyAsn465470475480ValLysLeuTyrAsnLysLysCysLeuGlnLeuGluMetLeuLysAsn485490495AspIleLeuGlyValArgIleGlnAspTyrAsnSerGluIleGlyGly500505510ValTyr<210>14<211>566<212>PRT<213>ThermoproteustenaxKra1<400>14MetValGlyArgArgLeuAspThrLeuValArgGluLeuSerLeuAla151015TrpCysArgSerLysGlyGluProSerCysAlaValArgGluAspLeu202530LeuAlaGluGlnAlaLysAlaAlaGluValIleGluArgSerAspGly354045ValIleLeuLeuLysAlaProThrGlyPheGlyLysThrGluIleTrp505560ThrAlaProPhePheAlaGlnTrpLeuArgGlyGluTrpPheAlaPro65707580ArgMetTyrValValGluProMetHisAlaLeuLeuArgGlnMetLys859095ArgArgMetGluValTyrAlaGlnAlaValGlnGlyLeuGlyLeuPro100105110ArgLeuAsnValAlaGluAspHisGlyGluValAlaLysProLeuPhe115120125LeuTyrGlyGlyHisIleValLeuThrThrValAspSerLeuAlaTyr130135140GlyTyrLeuAlaArgArgValGlnArgTrpArgGluGluGlyValGlu145150155160ArgGlyArgTyrSerMetProAlaGlyLeuLeuAlaSerAlaTyrIle165170175ValLeuAspGluAlaHisLeuIleGlnAspGluAlaTyrLeuGlyPro180185190ArgValLeuGlyLysIleValCysAspLeuAlaSerAlaGlyAlaLys195200205ValValIleSerThrAlaThrValProGluThrPheLeuLysHisIle210215220ProCysLeuGlyGlyArgLeuThrLeuGlySerGlyThrValArgArg225230235240AsnValLysValGluArgArgLysGlyValLeuLysAlaGluGluIle245250255GluCysGlyLysProThrIleValIleValAsnThrIleGluArgAla260265270ArgArgIleTyrLysGlnValArgCysGlyLysLysAlaValValHis275280285SerLeuMetArgArgGluAspLysGluArgGlnLeuSerLysValLeu290295300AlaAspGlyLysValAlaGluAspAlaValLeuIleGlyThrGlnAla305310315320LeuGluValGlyLeuAspPheSerAsnLeuArgAlaLeuTyrThrGlu325330335ThrAlaProValAspAlaLeuIleGlnArgIleGlyArgValGlyArg340345350AspGlyAspLysAlaGluAlaTyrIleTyrGluAlaGluGlyAspAla355360365ProTyrProGlnThrLeuMetArgAlaThrArgGluAlaLeuGluLys370375380GluLeuLeuGlyGlyAlaAlaLeuThrSerTrpGluAspAlaGlnArg385390395400AlaValAspLysValTyrAsnGluLysAlaValGluGluLeuMetThr405410415ArgGlyLeuAlaTrpTyrGlyGlnAlaLeuGlyTyrLeuGlnGluLeu420425430SerLeuPheSerTyrProProArgGlyGluValArgIleArgProSer435440445AsnTyrIleThrLeuValIleAlaAspValLysGlnAspGlyAspLys450455460GlyArgTyrIleThrGluAspAspValGluArgGlyAlaMetLysMet465470475480SerTyrThrSerArgAspAspProArgIleAsnAlaLeuLeuGlnLys485490495ValSerThrAlaTyrThrValArgGlyValAlaThrAlaLysAspGlu500505510ThrArgTyrTyrLeuSerGluLeuArgArgSerTrpAspGlyValGlu515520525ValValValValAspArgArgAspValGluGluLeuTyrAspGluAla530535540GlyLeuAspValAlaGlnLeuSerGlyGlyGlyGlnLysArgLysGly545550555560ArgGlyArgArgArgArg565<210>15<211>281<212>PRT<213>AeropyrumpernixK1<400>15SerArgValAlaCysAlaTyrIleIleArgLysAlaThrGlyGluHis151015GluCysCysGluThrLeuGluGluHisValGlnArgSerLeuGluVal202530TrpLeuGlyArgLeuLysLysCysTyrSerSerAlaValAsnArgIle354045IleTyrSerGlnGlySerGlnThrLeuAlaSerValLeuGlyAspPro505560ValAlaValAlaIleValLeuHisAspIleGlyLysAlaValProAla65707580TyrGlnLysLysArgIleMetArgGlyArgValGlnTyrArgHisGlu859095LeuValSerGlyAlaLeuSerLeuLeuAlaIleGluLysAlaAlaAsp100105110MetAlaGlyIleGlyArgAsnAspArgGlyLeuTyrValPheGluVal115120125ProLeuAlaValMetMetHisHisGluSerIleSerMetGlyValLeu130135140AlaGlyGluLeuGlyGluArgPheValThrLeuSerValAlaSerLeu145150155160MetLeuGluAspTyrTyrAspGlyGluLeuTrpGlyLeuGluArgLeu165170175AlaArgThrValLysAsnMetGlyAlaValGlyAspAlaValValAsp180185190ValLeuLysIleLeuSerGlySerProProSerArgLysGluValLeu195200205IleAlaLeuGlyArgLeuLysAlaTyrSerLeuSerGlyAspThrLeu210215220SerArgLeuSerAlaArgAlaArgValAlaGlyIleLeuHisProLeu225230235240ValValAlaAspSerIleAlaAlaAsnGluGlyArgLysArgCysAsn245250255GlyAspGlyGlyThrTrpIleValLysArgAlaLeuGlyArgAspSer260265270GlnGluProAlaGluProCysLeuSer275280<210>16<211>238<212>PRT<213>SulfolobussolfataricusP2<400>16IleLysProCysAlaTyrGluLysGlnGlyLeuIleAspHisAlaIle151015GlySerTyrArgValLeuAspGlyLysIleSerGluSerTyrTyrLys202530IleIleSerArgArgLeuGluArgTyrGlyIleValLeuAspLeuAsn354045GlyValLysGluMetValLysAspValValValLeuHisAspMetGly505560LysAlaGlyGluTyrTyrGlnAsnGlnPheAspAspAsnCysAsnPro65707580LeuLysSerAsnPheSerPheIleTyrHisGluLeuGlySerAlaLeu859095PhePheTyrTyrAspTyrGluProIleAspValGluLysAlaGluGlu100105110ValLysSerLeuLeuThrLeuAlaValLeuAsnHisLeuAsnAlaIle115120125ArgValIleSerAspTyrLeuValAsnLysPheProAspAsnPheAsp130135140GluArgMetIleLysLeuAsnLysTyrGlySerIleMetLeuGlnAsn145150155160LeuArgGlyValIleSerLysSerLeuLysValArgAspTyrThrPhe165170175AspAspTyrHisAspMetLeuTyrAlaPheSerLysLysSerAspLys180185190TyrLeuLysLeuTyrAsnLeuPheLeuAlaProIleMetLeuGlyAsp195200205AsnLeuAspSerSerLeuValArgAsnAsnGlySerLysThrGlyPhe210215220ValArgIleLeuGluGlyGluLeuAsnGlyGlySerThrLeu225230235<210>17<211>226<212>PRT<213>ThermoproteustenaxKra1<400>17MetSerCysCysAlaTyrPheArgGlyArgAspCysLeuGlnThrTyr151015GluAspHisIleThrGlnAlaLeuGluAlaCysGluArgLeuArgPro202530TyrTyrGlyArgTrpMetGluLysAlaPheGlyThrAlaAspAlaAla354045AlaLeuAlaValGluPheHisAspLeuGlyLysLeuAlaLysAlaTyr505560IleAlaGlyAsnArgAlaArgTyrArgHisGluValLeuGlyAlaTyr65707580PheAlaLeuLysThrLeuGlnThrGluAlaArgTyrTyrValAlaAla859095AlaValAlaLeuHisHisGluProMetIleLeuAlaAlaTyrAlaGly100105110GluLeuGlyGluArgAlaIleHisValSerThrLeuArgAlaMetLeu115120125LysAspSerAspLeuSerLeuGlyCysThrProAsnTyrSerTyrArg130135140ProGluValAlaAlaAlaLeuArgGluTrpAlaSerArgProProThr145150155160AlaAspAspValAlaAspAlaPheGlnGluLeuAlaValTyrLeuSer165170175GlyGlyAlaProGluGluAlaArgValLysArgLeuArgValAlaGly180185190LeuLeuHisValLeuThrValCysAspAsnTrpGlyAlaArgGlyArg195200205ProGlyGluGlyThrPheIleSerArgTyrMetThrValSerGluLeu210215220GlyLeu225<210>18<211>272<212>PRT<213>HaloferaxvolcaniiDS2<400>18MetArgIleGluLeuAlaLeuAspAlaValAlaAspAlaAlaTyrAsp151015ArgSerTyrPheHisLysAlaArgGlyArgIleTrpArgGlyLeuGlu202530AsnAspAspThrPheSerGluThrHisAspSerAsnHisGlyValGly354045PheSerTyrSerAsnIlePheProTrpGlyGlnIleGluGluGlyAsp505560ArgArgTyrPheArgIleAlaSerProArgArgGlyLeuLeuAspThr65707580LeuIleAlaHisPheGlyArgGluArgAlaPheGluIleGlyGlnMet859095ArgPheThrIleAspAspIleThrGlyHisAlaProAspValGlyGlu100105110AlaGlySerThrGlyValLeuGluThrGlyThrGlyValHisCysAla115120125LeuGlyArgGlnLeuAlaGluGluTyrAsnLeuAspThrSerLysIle130135140AspAlaGlyGluSerGluThrGluLeuPheTrpArgProLysHisGly145150155160MetGluProLeuGlnAspAlaIleArgArgSerLeuGlnGlnThrHis165170175GluLeuTyrGlyAspAspTyrTyrAspGlyProGlyGluValAspGlu180185190ProLeuPheAspArgIleGluProIleLysAspAspValValTyrPro195200205ValArgPheGlnProAlaThrAlaValAspArgThrValLeuLeuSer210215220LysTrpArgPheGlyTyrArgValArgAspGluThrHisArgTyrHis225230235240LeuAsnLeuAlaLeuAspSerGlyIleGlyGlnArgArgGluHisGly245250255PheGlyPheLeuAsnLeuThrAspLysThrLeuProArgAlaSerAsp260265270<210>19<211>300<212>PRT<213>Thermotoganeapolitana<400>19MetProLysAsnLeuLysThrGlnAspIleIleLysGluGlyArgVal151015GluLysValArgArgGluGlyProSerLeuSerTyrValGlnLeuIle202530ThrValPheLeuValAspLysAsnAspLysIleIleThrLysArgGly354045CysGlyMetArgIleLysIleAsnPheGlnThrThrLysAlaArgIle505560ProLeuAsnTyrAsnTyrPheLeuSerSerPheIleTyrLysArgLeu65707580AlaAlaGlnAsnGluAsnPheAlaArgPheLeuHisGluSerGlyTyr859095GlyLysArgPheLysPhePheThrPheSerGlnLeuPhePheGluAsn100105110SerLysValAspGlyAspLysIleValIlePheProGlyArgGlyTrp115120125TrpHisIleSerSerProValValAspPheValArgTyrMetPheSer130135140SerLeuSerGluAspProValIleArgValGlyLysThrGluPhePhe145150155160ValGlnSerIleThrValGluGluSerLeuProAlaLeuSerGluTyr165170175AsnPheValMetIleSerProLeuValValSerValProGluGluLys180185190AsnGlyLysLeuValHisArgTyrLeuHisProCysGluGluGluPhe195200205TyrGluAlaPheLysLysAsnLeuTyrLysLysTyrArgIlePheTyr210215220GlyLysAspProGluGlyAspValGluIleIleProAspTrpAsnTyr225230235240IleLysSerArgGluArgIleThrLysArgIleLysLeuLysAspVal245250255PheValArgAlaValValPheProPheArgMetArgGlyAspArgLys260265270LeuValGluIleGlyTyrGluThrGlyPheGlyGluLysAsnSerMet275280285GlyPheGlyMetValAlaLeuLysGluAsnLysPro290295300<210>20<211>244<212>PRT<213>Thermotoganeapolitana<400>20MetAsnMetArgIlePheValLysIleGlnProGluSerGlySerGlu151015GlyLysPheProAlaAspTyrArgArgIlePheMetSerLeuLeuLys202530GlnValTyrLysArgThrProPheGluGluIleValAsnSerHisAsp354045ArgIleProLysProTyrValPheSerValGlyPheAsnLysIleLys505560AspIleSerGlyAspSerIleIlePheGluSerProIlePhePheAsn65707580PheSerSerSerIleProGlnMetValGlyTyrLeuTyrAsnTyrIle859095ValSerGlnAspSerIleMetAsnGlyLeuLysValAlaGlyValAsp100105110LeuProValProLysIleIleThrSerLysThrValThrPheLysIle115120125MetGlySerAlaValLeuThrArgAlaGluLysAspArgTyrTyrVal130135140LeuProGluAspAsnAspPheGluGluAlaLeuAsnHisSerIleGln145150155160ValArgLeuAsnLeuSerArgGluLeuPheGluThrPheGlyValArg165170175IleProAsnPheLysProValLysValValAsnLysAsnLeuArgLys180185190ValProAlaLysHisTyrGlyGlyTyrIleGluAlaPheSerGlyThr195200205IleThrLeuAspGlyAspProAspValLeuSerPheLeuHisGluAsn210215220GlyLeuGlyValArgThrGlyGlnGlyPheGlyMetLeuLysValVal225230235240ArgGluTrpHis<210>21<211>717<212>PRT<213>HaloferaxvolcaniiDS2<400>21MetThrGlyProAspIleAspAspPheGluAsnAlaLeuAsnAlaPhe151015TrpHisGlyArgProProAlaSerLeuGluAspValMetAlaLeuTyr202530GlyValLeuAlaValAlaGluSerGlyGlyGluLeuTyrGlyThrAsp354045SerLysLeuGluProPheValAspAspGlyArgLeuValThrIleAsp505560IleAspLeuThrGlyGluThrProAsnValSerAspProLysValAsp65707580ThrLeuArgValGluAspValSerLysLeuArgTyrAlaHisLysSer859095SerGlyArgGlyAlaLysTyrSerLeuThrGlnIleGlySerLysAsn100105110GlyAsnAspAlaGluGlyValAlaSerThrIleLeuGlyArgValArg115120125SerTrpThrThrGlnAspSerValArgSerValThrGlyGluAspGly130135140HisProAspGlyTrpIleValGluGluLeuAlaAlaValPheGluLys145150155160GlySerAspThrLeuGluAlaLeuGluGluAlaIleLysAlaLeuLeu165170175ProProAspGluSerLeuProThrValIleThrValArgLeuArgLeu180185190AspAlaGlyArgLeuSerHisGlyGluGluSerGlyProArgTrpPhe195200205TrpProAlaGluLeuAspValLeuGluGluAlaMetLysArgTyrAla210215220ThrAlaAsnAlaAlaAspLysAsnValGluSerGlyAspGlyIleSer225230235240GluGlyGluSerValGlyLeuValThrAspArgValGluArgValVal245250255GlyThrProAspAsnProIleGlyValPheSerValLysHisProAsp260265270AlaGlnProGlyLeuArgGlnAspGlnSerTrpArgAsnTyrProVal275280285GlyAlaAspThrAlaMetLeuPheSerLysGlyGlnAspLeuValGlu290295300ThrCysValLeuArgArgGlyGlyValGluThrTyrAlaLeuProTyr305310315320PheAlaGlyGluLeuThrProLeuLysAlaGlnSerLeuTyrGlyAla325330335IleGlnSerLeuAspArgGluSerAspTyrAspAspSerGlyGlySer340345350ProLeuAlaArgValThrTyrGluLeuArgGluSerAspAspGluThr355360365LeuGlnGluLeuAlaLysThrGluLeuArgPheTyrThrIleThrLeu370375380ProIleGlyAspAspLysAsnValIleAlaGluGluProAlaAlaPro385390395400ValTyrTrpValSerGluLeuAlaAspAlaLeuAlaGlnThrValHis405410415GlyProThrLeuAsnProGluArgGlyGlyPheAlaProTyrAspAsn420425430TrpSerLeuLeuGluLeuAlaThrGluAspPheGluGluSerArgLys435440445PheGlyPheTyrArgIleValGlyHisGlnPheThrAspSerAlaPhe450455460AlaTyrArgGlyAspAspGluAspAspAspPheArgArgValValAsp465470475480HisArgLeuIleAlaGlyValProLeuAspAlaSerMetLeuPheAsp485490495GluTyrLeuArgArgTyrHisAspGluSerGluGlyGlyAspLeuPro500505510ProHisGlnIleValAlaGlnGlnLeuValHisLeuGluThrLeuSer515520525ArgAlaGlyLeuLeuAsnGlyLeuAspValProIleGluProProThr530535540MetThrThrGluThrGluThrGluThrAspPheAspThrThrSerLeu545550555560ProAlaIleArgGluHisArgLeuGluSerPheLeuAspArgProLeu565570575PheGluAlaProAlaArgArgAlaAlaAlaLeuAlaGlyValLeuVal580585590GlyGlnValSerTrpHisGlnGluSerGluArgAsnValGlyArgPro595600605LeuAspAlaGlnThrLysGlyAspGlnLeuThrLysAsnSerLeuGlu610615620AsnAlaLeuThrSerAlaLeuGluLysAlaLysValTyrAlaLeuAsp625630635640SerGluTyrArgSerAspArgAspMetLeuPheProGluThrValAsp645650655ArgLeuLeuGluThrThrGluAspMetProSerAlaTrpProIleGlu660665670LysArgGluLeuGlnPheCysTyrValLeuGlyHisAlaHisGlyArg675680685ArgSerMetProValAlaPheAspLeuHisGluLysGluAspGluAsp690695700AspGlnAspThrGluGluProAlaGluSerThrThrAsn705710715<210>22<211>455<212>PRT<213>Thermotoganeapolitana<400>22MetAlaLeuValIleTyrProGlnGlyTrpLeuHisAsnAlaAsnVal151015TyrGlyPheLeuLysValIleAsnGluLysSerArgGluArgLysIle202530SerPheGluLeuSerAspIleLeuLysAspAspGlyThrIleValLeu354045GluAspLysMetLeuAspGluLeuTyrLeuIleAspAsnPheAspAsn505560LeuSerLeuProArgLeuPheValPheIleLeuGluGluThrAlaArg65707580IleGluGlyAspIleArgLysAlaTyrAsnTyrPheLysGlyAsnVal859095GlyTyrTyrGluAsnTyrValAlaGlnValLysGluLysGlnPheMet100105110GluAsnLeuSerLysIleValHisTyrIlePheArgLysProSerLeu115120125GluGlyThrAspArgCysPhePheCysGlyAsnSerLeuLysThrAsp130135140GluAspArgSerIleLeuGlnArgLysGlnPheSerArgIleLeuPhe145150155160LysAspPheSerSerSerGluGlyLysPheProAsnSerPheTrpAsn165170175MetSerAsnGluPheTyrLeuCysAspValCysSerGlnMetAlaLeu180185190PheArgHisPheValPheProLysSerGlyGluSerIlePheValAsn195200205ValProSerPheLysAlaIleTrpTyrLeuAsnGluAlaIleLysAla210215220TyrArgAspLeuSerLeuGluLeuSerValSerArgAlaIleSerGlu225230235240ValHisLeuLysLeuGlnArgLeuLeuGlyIleTrpGluArgGlnAsn245250255ValGluValIleTyrTyrAsnSerLysSerTyrArgIleTyrTyrMet260265270ProGlnArgValIleAsnLeuLeuLeuAsnThrArgIleSerSerIle275280285LeuAsnSerLeuAsnSerIleLysIlePheGluAlaValIleTyrGln290295300GluArgLeuAsnGluIleLeuGluCysGluTyrLeuLeuLeuLysTyr305310315320LeuPheAspValSerSerSerGlyArgSerHisLeuAlaGluAsnVal325330335LysGlnTyrValGlyAspValLysArgAsnAlaGlyTyrTyrMetAsn340345350ThrLeuProAspLeuPheGlnGluValArgSerValMetGlyValLys355360365GlnMetValProValTrpArgMetArgGluLeuGlyLysGluAlaSer370375380GlnLeuPheGluArgThrArgTyrArgLeuLeuGluLeuIleArgLeu385390395400AlaLysLysAspGluValTyrHisLeuIleLeuLysThrTyrMetAla405410415AsnAsnLysProPheProGluAspLeuAsnArgValPheSerAlaLys420425430AspGluAspPheLysAsnLeuMetPheAlaTyrValSerGlyMetIle435440445SerGlyGlyGluGluAsnGlu450455<210>23<211>340<212>PRT<213>HaloferaxvolcaniiDS2<400>23MetThrThrLeuAsnArgSerGluLeuLeuPheValTyrAspAlaGln151015AspCysAsnProAsnGlyAsnProIleGlyAspAsnArgProArgArg202530AspProAspThrGlyGlnGlyIleIleThrAspValArgLeuLysArg354045TyrLeuArgAspGlnLeuGlnAspAspGlyPheAspIleTyrValLys505560LysThrGluGlyArgSerHisThrArgThrLysLeuIleLysAspVal65707580LeuGlyGlyValAspAspAlaAspAspLeuGluAspLeuGlyAspVal859095AlaGluAlaPheLeuAspAlaAlaThrAspValArgTyrPheGlySer100105110ThrLeuSerPheGluAlaSerAspLysAspGluAspGluAlaPheArg115120125AspAlaLeuAsnSerSerLeuProAsnAsnTyrGlnGlyProValGln130135140PheLeuProSerLysSerLeuAsnGluValGluGluAsnGluGluTyr145150155160AspSerLeuThrSerValIleSerThrGlyGluGlyAsnArgGlnGly165170175GlyPheAspLeuAspAspLysArgIleLysTyrGlyIlePheProPhe180185190TrpGlyLeuValAspAsnAsnGlyAlaGluSerThrAsnLeuSerGln195200205AlaAspValGluArgLeuAspThrLeuCysTrpArgAlaLeuLysAsn210215220GlnThrThrSerArgSerLysLeuGlyGlnGluProArgLeuTyrVal225230235240ArgValGluTyrGluGluGlyAsnTyrHisValGlyGlyLeuGlnAsn245250255LeuLeuGluLeuGlyAspAspSerSerGluSerLeuArgSerValLys260265270AspValValValAspValThrGluLeuValGluThrLeuGluArgVal275280285AlaAspArgIleAspThrLeuHisValValGlyAspGlyArgLeuGlu290295300LeuAspIleGlyAspGluThrIleArgAlaAspGluPheTrpSerHis305310315320LeuSerGluAlaGlyHisAspValHisGluIleAspValLeuAsnGlu325330335ArgAspLeuAla340<210>24<211>337<212>PRT<213>Thermotoganeapolitana<400>24SerAsnProLysAlaIleThrAlaThrIleValPheGluSerSerAla151015ValAsnArgAspGluAsnIleAlaAsnAsnIleGlnSerLeuLysLys202530LeuArgArgGluAspGlyValTyrThrPhePheSerArgAlaSerMet354045ArgHisHisValPheAsnAlaLeuValArgLysHisGlyTrpLysPro505560AlaArgValAlaLysAspGlyAspValIleGlnPheAspValLeuGlu65707580GluSerIleLeuThrSerGluGluLeuAspPhePheGlyTyrMetArg859095ThrPheGluSerAlaSerLeuSerArgLysAlaProValGlyMetThr100105110LysAlaValSerLeuGluLysTrpGluGlyAspMetAlaPheTyrAla115120125AsnHisAspLeuValGlnArgAlaArgGluIleGlyGluSerAlaAsp130135140ProAsnProPheSerLysGluGluHisLeuSerLeuTyrLysTyrSer145150155160ValValValAspLeuGluAsnIleGlyLysGluLysValIleIleAsn165170175GluLysGlnCysGluLysLeuAsnArgLeuPheGlyIleAspLeuLys180185190GluLeuLysGluLysGluSerIleAlaAsnAspLysGlyThrIleSer195200205LeuGluSerValGlyGluLysSerTyrArgIleLeuValThrLeuAsn210215220AspProGluLysGlnLysArgLeuLysGlnPhePheAspIleIleIle225230235240AsnGlyPheGluIleHisSerSerThrGluSerTrpCysValSerPro245250255ValPheIleValIleAlaThrThrArgLeuProValThrLeuPheAsn260265270ProTyrIleLysLeuAspAspGlyLysIleAspValAspLeuValAla275280285LysIleAlaGluGluAsnThrAsnValIleAspTyrArgIleTrpGly290295300ValProPheIleLeuLysGlyGluValAspLysLeuCysLysGlyPro305310315320LysAspLeuAsnAspTrpValThrGlyValIleGlyGlyLysGluAsn325330335Ser<210>25<211>264<212>PRT<213>HaloferaxvolcaniiDS2<400>25SerProHisIleAspAlaAsnGlyValProIleAspCysLeuSerPhe151015ThrValArgSerThrTrpGlyHisPheLysArgValGlyArgSerVal202530ThrLysGlnThrTyrArgIleProProArgThrThrValAlaGlyMet354045LeuAlaAlaIleValGlyAlaAspArgAspSerTyrTyrAspValPhe505560GlyAlaAspAsnSerAlaIleAlaIleThrProLeuSerAspLeuArg65707580ThrValAsnIleProThrThrGlyLeuGlyThrAspProLysGlnAsp859095ValThrGluThrAlaGlySerTrpArgThrTyrLysLeuThrTyrGln100105110AsnThrThrGlyAspArgGlnLeuHisSerTyrGluValLeuAlaAsp115120125ProAlaTyrArgIleAspValAlaLeuGluAsnGluGluPheTyrAsp130135140SerLeuArgGluHisLeuValAsnGlyThrSerIleTyrProProSer145150155160LeuGlyLysSerGluTyrLeuAlaValIleGluAspValGluValAsp165170175ArgGluProGluValGlnAspIleAspGluThrLeuAspIleAspSer180185190ValValProIleSerLeuSerGluAlaValProGlnGlyLysValThr195200205TyrGlyValGluArgSerProAlaValMetValArgGluSerGlyGly210215220ArgArgThrThrArgPheAspAspTyrValTyrAlaGlnGlnAlaSer225230235240AsnProValArgIleGlyGluGlnThrAspValAlaProValGlnVal245250255GlyAspArgThrValValPheArg260<210>26<211>260<212>PRT<213>Thermotoganeapolitana<400>26MetLysLeuLeuArgIleGluIleLysAlaSerThrGlyHisPheAla151015IleProPheLeuIlePheGluArgLysThrPheProIleProMetTyr202530SerThrMetIleGlyPheValCysAsnIleLeuAlaAspGluAlaLys354045IleSerArgPheLeuSerSerAsnPheSerMetAlaValValGlyAsp505560HisAspGlyValValGluGluTyrThrTrpPheArgAsnLeuSerLys65707580GluSerHisThrLysLysPheIleCysSerPheAsnArgGluAlaAsn859095AsnGluIleGluHisProGlyGlyGlnSerProValLysIleGlnThr100105110LeuIleAsnProLysIleAsnLeuPheLeuLysAlaGluGluTrpIle115120125LeuGluMetValLysGluSerPheGluAsnProGlnCysIleSerArg130135140ProHisLeuGlyArgSerGluAspValValAspAspIleLysValGlu145150155160LeuIleAspCysGluLysLysGlnValPheAspThrAsnGlyTyrThr165170175TrpMetProSerProGluPheValAspAspValSerAspSerTyrGlu180185190GluLeuTyrLysArgIleSerGlySerValTyrArgValSerSerVal195200205TyrIleIleGlnAsnAsnArgArgIlePheGluPheValHisAlaLys210215220LeuHisArgGlyAlaIleProMetValGlyPheLysValProGluVal225230235240LeuSerTrpAsnGlyThrProIlePheLeuAlaArgIleArgPhePro245250255AspLysGlyGly260<210>27<211>226<212>PRT<213>DesulfovibriovulgarisDP4<400>27ThrHisGlyAlaValLysThrTyrGlyIleArgLeuArgValTrpGly151015AspTyrAlaCysPheThrArgProGluMetLysValGluArgValSer202530TyrAspValMetThrProSerAlaAlaArgGlyIleLeuGluAlaIle354045HisTrpLysProAlaIleArgTrpIleValAspArgIleHisValLeu505560ArgProIleValPheAspAsnValArgArgAsnGluValSerSerLys65707580IleProLysProAsnProAlaThrAlaMetArgAspArgLysProLeu859095TyrPheLeuValAspAspGlySerAsnArgGlnGlnArgAlaAlaThr100105110LeuLeuArgAsnValAspTyrValIleGluAlaHisPheGluLeuThr115120125AspLysAlaGlyAlaGluAspAsnAlaGlyLysHisLeuAspIlePhe130135140ArgArgArgAlaArgAlaGlyGlnSerPheGlnGlnProCysLeuGly145150155160CysArgGluPheProAlaSerPheGluLeuLeuGluGlyAspValPro165170175LeuSerCysTyrAlaGlyGluLysArgAspLeuGlyTyrMetLeuLeu180185190AspIleAspPheGluArgAspMetThrProLeuPhePheLysAlaVal195200205MetGluAspGlyValIleThrProProSerArgThrSerProGluVal210215220ArgAla225<210>28<211>241<212>PRT<213>StreptococcuspyogenesMGAS5005<400>28TyrArgSerArgAspPheTyrValArgValSerGlyGlnArgAlaLeu151015PheThrAsnProAlaThrLysGlyGlySerGluArgSerSerTyrSer202530ValProThrArgGlnAlaLeuAsnGlyIleValAspAlaIleTyrTyr354045LysProThrPheThrAsnIleValThrGluValLysValIleAsnGln505560IleGlnThrGluLeuGlnGlyValArgAlaLeuLeuHisAspTyrSer65707580AlaAspLeuSerTyrValSerTyrLeuSerAspValValTyrLeuIle859095LysPheHisPheValTrpAsnGluAspArgLysAspLeuAsnSerAsp100105110ArgLeuProAlaLysHisGluAlaIleMetGluArgSerIleArgLys115120125GlyGlyArgArgAspValPheLeuGlyThrArgGluCysLeuGlyLeu130135140ValAspAspIleSerGlnGluGluTyrGluThrThrValSerTyrTyr145150155160AsnGlyValAsnIleAspLeuGlyIleMetPheHisSerPheAlaTyr165170175ProLysAspLysLysThrProLeuLysSerTyrPheThrLysThrVal180185190MetLysAsnGlyValIleThrPheLysAlaGlnSerGluCysAspIle195200205ValAsnThrLeuSerSerTyrAlaPheLysAlaProGluGluIleLys210215220SerValAsnAspGluCysMetGluTyrAspAlaMetGluLysGlyGlu225230235240Asn<210>29<211>598<212>PRT<213>DesulfovibriovulgarisDP4<400>29IleLeuGlnAlaLeuHisGlyTyrTyrGlnArgMetSerAlaAspPro151015AspAlaGlyMetProProTyrGlyThrSerMetGluAsnIleSerPhe202530AlaLeuValLeuAspAlaLysGlyThrLeuArgGlyIleGluAspLeu354045ArgGluGlnAspGlyLysLysLeuArgProArgLysMetAlaValPro505560AlaAlaValThrArgThrSerGlyValLysAlaAsnPheCysTrpAsp65707580LysThrAlaTyrValLeuGlyAsnAspAlaAsnGlyAlaAlaLysAsn859095AlaGluArgPheAlaAlaPheArgGluLeuLeuThrAlaValCysAla100105110AspValAspAspGluGlyPheArgAlaValThrArgPheLeuAspThr115120125TrpAspProGluGlnAlaAlaGlnValValAlaAlaLeuHisAspTrp130135140AspAspIleValProAlaAsnLeuValPheArgLeuGluGlyThrLys145150155160GlyPheIleHisAspArgProAlaIleGlnLysAlaTrpSerAlaPhe165170175CysAlaAsnSerAspAsnSerProLysGlyArgCysLeuIleThrGly180185190GluArgAspValAlaGlnAlaLeuValHisThrProIleLysGlyVal195200205AlaGlyGlyGlnThrSerGlyGlyTyrIleValSerPheAsnAlaPro210215220AlaPheValSerTyrHisLysAspLysAlaAspValGlyGluValAla225230235240AlaPheAlaTyrThrThrAlaLeuAsnThrLeuLeuAlaArgGlySer245250255ArgGlnArgValProIleAlaAspAlaThrValValPheTrpAlaGlu260265270ArgSerSerProAlaGluAspIlePheAlaGlyMetPheAspProPro275280285SerThrThrAlaLysProGluSerSerAsnGlyThrGlnProGluAsp290295300SerGluGluGlySerGlnProAspThrThrArgAspAspProHisAla305310315320AlaAlaArgMetHisAspLeuLeuValAlaIleArgSerGlyLysArg325330335AlaThrAspIleMetProAspMetAspGluSerValArgPheHisVal340345350LeuGlyLeuSerProAsnAlaAlaArgLeuSerValArgPheTrpGlu355360365ValAspThrValGlyHisMetLeuAspLysValGlyArgHisTyrArg370375380GluLeuGluIleValArgGlnTyrAspAsnGluProGluPheProPro385390395400LeuTrpLeuLeuLeuArgGlnThrAlaAlaLeuAsnLysThrGluAsn405410415IleSerProValLeuAlaGlyGlyLeuPheArgAlaMetLeuThrGly420425430GlyProTyrProGlnSerLeuLeuProAlaValLeuGlyArgIleArg435440445AlaGluHisThrValThrTyrTyrArgAlaAlaLeuIleLysAlaTyr450455460LeuIleArgAsnArgLysLeuGluValProValSerLeuAspProAla465470475480ArgThrAspArgProTyrLeuLeuGlyArgLeuPheAlaValLeuGlu485490495LysAlaGlnGluAspAlaValProGlyAlaAsnAlaThrIleLysAsp500505510ArgTyrLeuAlaSerAlaSerAlaAsnProGlyGlnValPheHisMet515520525LeuLeuLysAsnAlaSerAsnHisThrAlaLysLeuArgLysAspPro530535540GluArgLysGlySerAlaIleHisTyrGluIleMetMetGlnGluIle545550555560IleAspAsnIleSerAspPheProValThrMetSerSerAspGluGln565570575GlyLeuPheMetIleGlyTyrTyrHisGlnArgLysAlaLeuPheThr580585590LysLysAsnLysGluAsn595<210>30<211>630<212>PRT<213>StreptococcuspyogenesMGAS5005<400>30AspPhePheThrSerLeuLeuLysThrTyrGluLysAlaGluLeuAla151015AspLeuValAspHisGlnLysArgAsnAsnGluProValLeuLeuPro202530IleTyrHisThrSerLeuLysSerAsnGlyLysAsnIleIleSerVal354045LysLeuAspLysAspGlyGlnPheHisLysAlaGluPheMetAlaAsp505560LysGlnMetIleIlePheProValThrAlaAspSerValAlaArgSer65707580GlySerHisProAlaProHisProLeuValAspLysPheAlaTyrTyr859095SerAlaGluMetGlyGlnIleGlnTyrAspSerPheHisLysGlnLeu100105110AsnAsnTrpIleAspTyrCysGluGluGlyAspValLysLysPheLeu115120125ThrPheValGlnGlnPheIleLeuLysProGluPheLeuThrLeuIle130135140LeuAspSerLeuIleGlyProAspTyrGlnHisAsnGlnLeuLysVal145150155160ThrPheCysAspAlaThrGlyLysGluLysLeuIleAspLeuSerAla165170175CysPheLeuGluPheSerIleAspGlnPheGlnGlyPheLysAsnGlu180185190SerValSerThrPheLysAlaLeuHisGlnSerTyrIleSerPheVal195200205GluAlaAsnArgGluAsnLeuGlyIleCysAsnIleSerGlyArgGlu210215220GluGlnLeuThrAspLysHisArgGlyLeuMetGlyAsnAlaLysIle225230235240IleSerValSerAsnLysArgGluAlaTyrLysGlyArgPheArgGlu245250255ArgGluAspValPheSerValGlyTyrGluThrSerGluLysIleHis260265270LeuMetLeuLysTyrLeuLeuGluAsnLysAsnThrSerThrTrpLeu275280285GlySerSerGlnTyrLeuIleAsnTrpPheSerAspAspLeuThrAsn290295300AspSerArgLeuAspIleValSerProIlePheAspAspGlyLeuGlu305310315320GluGluAspAspAspAspThrProProValIleThrLeuAlaThrGlu325330335AspAsnLysArgIleGlyLysSerPheIleLysGlyGlnLysLeuPhe340345350AlaAsnAspAlaThrTyrTyrValAlaIleLeuAsnLysThrSerAsn355360365GlyArgIleAlaLeuLysTyrPheArgGlnLeuGlnAlaSerGlnLeu370375380LeuThrAsnLeuAsnLysTrpGlnGluThrTyrSerTrpGluSerArg385390395400SerLysPheGlyLysSerArgLeuArgThrProThrPheHisAspIle405410415LeuAsnValSerTyrGlyValAspArgAspArgPheLeuGluLeuAsp420425430AsnAspAsnPheLysSerAspGlnIleGlnLysLeuValAlaSerLeu435440445IleAspGlyLysProMetProGlnSerIleValLysLysLeuGlyAsn450455460AsnValLysGluArgHisArgTyrArgLysHisTrpTyrGlnValGlu465470475480GlnValCysLeuAlaIleLeuHisLysGlnAsnGlyGluGluPheSer485490495ProMetLeuAspHisThrAsnGlnAsnArgSerTyrLeuPheGlyArg500505510LeuLeuAlaIlePheGluLeuIleGluThrLeuArgTyrGlyLeuAsp515520525GlyAsnAsnAsnAspArgIleThrAsnAlaGluArgTyrTrpThrAla530535540TyrThrGlyGlnProThrLysLeuMetMetLeuLeuGluAsnLysIle545550555560LysProTyrGluGluProLeuLysLeuAsnArgArgGlySerTrpMet565570575LysLeuGluLysGluLysGluGluIleLeuGluLeuLeuAsnProLeu580585590LeuGluThrGluThrMetGluLysProLeuAspTyrArgPheIlePhe595600605GlyTyrTyrAlaGluLysAsnTyrTyrTyrThrLysGlnAsnThrGlu610615620ValThrGluSerGluGlu625630<210>31<211>289<212>PRT<213>DesulfovibriovulgarisDP4<400>31ThrAlaIleAlaAsnArgTyrGluPheValLeuLeuPheAspValGlu151015AsnGlyAsnProAsnGlyAspProAspAlaGlyAsnMetProArgIle202530AspProGluThrGlyHisGlyLeuValThrAspValCysLeuLysArg354045LysIleArgAsnHisValAlaLeuThrLysGluGlyAlaGluArgPhe505560AsnIleTyrIleGlnGluLysAlaIleLeuAsnGluThrHisGluArg65707580AlaTyrThrAlaCysLysLeuLysProGluProLysLysLeuProLys859095LysValGluAspAlaLysSerValThrAspTrpMetCysThrAsnPhe100105110TyrAspIleArgThrPheGlyAlaValMetThrThrGluValAsnCys115120125GlyGlnValArgGlyProValGlnMetAlaPheAlaArgSerValGlu130135140ProValValProGlnGluValSerIleThrArgMetAlaValThrThr145150155160LysAlaGluAlaGluLysGlnGlnGlyAspAsnArgThrMetGlyArg165170175LysHisIleValProTyrGlyLeuTyrValAlaHisGlyPheIleSer180185190AlaProLeuAlaGluLysThrGlyPheSerAspGluAspLeuThrLeu195200205PheTrpAspAlaLeuValAsnMetPheGluHisAspArgSerAlaAla210215220ArgGlyLeuMetSerSerArgLysLeuIleValPheLysHisGlnAsn225230235240LysLeuGlyAsnAlaProAlaHisLysLeuPheAspLeuValLysVal245250255SerArgAlaGluGlySerSerGlyProAlaArgSerPheAlaAspTyr260265270AlaValThrValGlyGlnAlaProGluGlyValGluValLysGluMet275280285Leu<210>32<211>281<212>PRT<213>StreptococcuspyogenesMGAS5005<400>32LeuGluHisLysIleAspPheMetValThrLeuGluValLysGluAla151015AsnAlaAsnGlyAspProLeuAsnGlyAsnMetProArgThrAspAla202530LysGlyTyrGlyValMetSerAspValSerIleLysArgLysIleArg354045AsnArgLeuGlnAspMetGlyLysSerIlePheValGlnAlaAsnGlu505560ArgIleGluAspAspPheArgSerLeuGluLysArgPheSerGlnHis65707580PheThrAlaLysThrProAspLysGluIleGluGluLysAlaAsnAla859095LeuTrpPheAspValArgAlaPheGlyGlnValPheThrTyrLeuLys100105110LysSerIleGlyValArgGlyProValSerIleSerMetAlaLysSer115120125LeuGluProIleValIleSerSerLeuGlnIleThrArgSerThrAsn130135140GlyMetGluAlaLysAsnAsnSerGlyArgSerSerAspThrMetGly145150155160ThrLysHisPheValAspTyrGlyValTyrValLeuLysGlySerIle165170175AsnAlaTyrPheAlaGluLysThrGlyPheSerGlnGluAspAlaGlu180185190AlaIleLysGluValLeuValSerLeuPheGluAsnAspAlaSerSer195200205AlaArgProGluGlySerMetArgValCysGluValPheTrpPheThr210215220HisSerSerLysLeuGlyAsnValSerSerAlaArgValPheAspLeu225230235240LeuGluTyrHisGlnSerIleGluGluLysSerThrTyrAspAlaTyr245250255GlnIleHisLeuAsnGlnGluLysLeuAlaLysTyrGluAlaLysGly260265270LeuThrLeuGluIleLeuGluGlyLeu275280<210>33<211>1079<212>PRT<213>MethanospirillumhungateiJF-1<400>33ArgThrLysLysIleThrSerValPheThrHisAspMetLeuPheGly151015GluGlyHisAspAspHisGlyAsnMetGlnGluAspTyrAspLeuLeu202530LeuHisGluTyrPheGlnThrIleAspHisProLeuArgThrSerLys354045TyrAlaTyrMetProAlaLysSerValGluPheGlyLysThrAspGln505560ProMetIleAsnHisValArgAsnGlyIleGlnAlaLeuIleGluLeu65707580AsnLysThrLeuLeuGlnSerGlySerAlaHisTyrLeuProValSer859095LysLeuArgGluValIleAlaLeuPheSerIleHisAspLeuHisLys100105110ThrIleGlyLysAspTrpArgAspGlnPheAspLeuAsnGluAspGlu115120125ValMetSerPheAlaHisAlaIleGlnAlaAspIlePheAlaProAla130135140LeuThrProAsnAspPheLeuSerValAlaValAlaThrHisProThr145150155160GlnGlyPheHisGlyAspLeuSerHisThrPheIleThrTyrLysAsn165170175TrpValLeuLeuAlaAspIlePheAlaSerLeuGluMetProValVal180185190ThrGluGlyMetLysLysHisIleAlaPheIleAspAlaLysLysThr195200205PhePheTyrHisThrPheSerGluSerIleGlyLeuLeuSerAsnVal210215220ValHisAlaAlaValLeuGluTrpAlaLysGlnTyrAlaLeuPhePro225230235240LeuLeuPhePheGluLysGlyValIleTyrLeuGlyAspLysAsnSer245250255ArgPheGluPheThrGlnAlaSerGlnIleGluGluIleTyrGlnGlu260265270LeuLysLysLysIleGlnSerSerHisGluSerLeuSerArgProGlu275280285LysLeuGlnLysTyrIleGlnValGlnGlySerLysGlyLeuPheSer290295300ValGluGluSerPhePhePheTyrSerGlyIleHisThrValIleLys305310315320AlaPheLeuAlaAlaAlaValMetThrSerGluLysAspAsnSerGly325330335AsnPheGluIleAspThrSerThrProSerLeuThrLeuAsnLysSer340345350AspLeuGluMetGlnTyrProProAlaGluValIleAspValProAla355360365HisPheIleLysSerIleSerValAspGlyAsnValIleProValSer370375380AspValArgIleIleCysHisGlyGluGluArgLysAlaLysLysTyr385390395400ThrLeuValProAspSerValPheValGlyGluGluGluIlePheGly405410415LeuIleThrIleThrGlyIleGlyLeuMetProSerMetValGlyTyr420425430ArgSerHisIleLeuSerAspPheGlyValAspThrGlyTrpAspGlu435440445SerIleIleProLeuAlaArgAlaValSerGlyIleArgLysAspVal450455460IleThrGluLeuIleLysAlaGlySerLeuProThrAspAspProLeu465470475480LeuGluAlaCysArgMetPheGlnThrAsnAspAspLeuThrGlnLys485490495MetValThrTyrAlaSerGluAsnArgGlyGlnAspHisHisSerVal500505510GlyGlyPheTrpAsnTyrSerTyrAlaIleAlaArgAspIleLeuAsp515520525ArgGluValAsnGlyIleAlaPheSerGlnIleAlaSerIleGlnGlu530535540LysIleSerTyrLeuAsnThrLeuValAspGluTyrLeuSerThrIle545550555560SerSerGluAsnLeuGluLysPheGluSerAlaIleLeuTyrProTyr565570575LysGluLysLeuLeuValTrpLeuCysGluAsnLeuSerIleAsnGly580585590SerMetLeuTyrGlySerPheGluAsnLysThrAsnLysPheLysAla595600605TyrCysAspGlyThrGlyIleCysArgLeuThrAsnAspThrProTyr610615620AspLysGluArgLysThrThrSerLysAspValSerMetLeuLysTyr625630635640ThrPheSerAsnArgValProIleGlySerSerGluProSerLeuTyr645650655ValSerValProValGlnIleGluLeuGlyLeuArgSerIleGlyHis660665670GlyIleArgLysGlySerAspLysIleTyrPheArgLeuIleProAsp675680685TyrHisPheSerHisThrThrAlaSerIlePheSerGlnPheAlaAsn690695700TyrPheAspGlyAspSerGlyThrArgValLeuAspLeuAlaArgGlu705710715720PheLeuArgGluAspValProSerGluAspSerIleIleGluLeuLeu725730735IleAlaGluThrGlyArgLysAsnIleCysGlnTyrAlaGlyLeuGly740745750PhePheTyrGlnAsnSerThrPheAspPheValPheAsnLysLysArg755760765AsnGlyAspGlyGluTyrTrpPhePheGlySerTyrLeuAlaLeuIle770775780LeuAlaTyrValThrGlyCysArgValValAlaGlyGluAsnProIle785790795800CysMetThrSerGlyAspGluPheSerGluPheValLeuLeuGluAla805810815ProHisValAlaValLysArgIlePheSerAspArgIleArgLeuSer820825830AspLeuLysLysThrLeuMetThrAlaSerLeuIleIleSerMetGly835840845TyrGluIleArgMetAspAspAlaAlaPheValArgPheLeuGlnThr850855860PheArgAsnHisProPheProGlySerThrLeuLeuLysGlnIleArg865870875880ArgValTyrGluGlnAspLysLysLysGlyGlyMetGlyGlyPheVal885890895AsnSerAlaArgGlyTrpArgLysValAspGlyGluIleIleArgSer900905910GluTyrProGlyPheIlePheGlnAlaValLysLeuAspThrPheGly915920925GluAsnProMetAlaValAlaSerIleHisGluLeuAlaArgLeuGly930935940LeuSerValAlaIleProArgAsnTyrAspProHisLysValGluLys945950955960LeuPheArgGluSerValLysAlaIleLeuGlyLysArgGlySerGln965970975TyrProArgGluAspTyrValAspAlaValSerGlyArgLeuLeuLys980985990MetIleLysArgAlaGlyAspAspGlnPheSerArgThrProGlyLeu99510001005TyrAspPheSerLeuIleValSerPheAlaGluTyrPheValAsp101010151020HisIlePheTyrGlnValAlaSerGlyAspProGlyLysLeuLys102510301035ArgAlaAlaAsnAspLeuAlaAspGlyPheTyrSerAlaThrLeu104010451050GlnLeuArgGluGluTyrPheGluSerArgLysGluAlaPheGlu105510601065SerGluGlnAspLeuSerSerGluGlnGluAsn10701075<210>34<211>1022<212>PRT<213>NatronomonaspharaonisDSM2160<400>34ThrGluAsnAspGlyLysGlnThrLysLeuGlyGluIleGluSerGlu151015ThrAspAspValAlaGluGluGluProAlaGluGlyValGlySerPhe202530SerProAlaPheLeuAlaAsnProGluGluGluPheGluThrAspPro354045AsnSerGluThrValAspAlaLysLeuAspAsnValLeuGlyGluTyr505560IleSerGluValAspProArgLeuIleGluAlaGlyTrpAlaPheLeu65707580ProAsnLysSerValGluTyrGlyLysValAspGlnSerMetLeuAsn859095HisThrArgAsnLeuValTyrPheLeuHisGlnLeuAlaArgGlnIle100105110GluAsnThrAspLeuProSerIleThrProLysLysLeuArgHisLeu115120125ValAlaLeuAlaValAlaHisAspTyrHisLysLeuArgGluGluAsp130135140GluAsnProAsnGluArgPheAspIleLysIleLysGluLeuGluPro145150155160PheIleGluGluIleGlyLeuAspGluPheSerSerThrProAspAsp165170175ProGluSerGluLeuSerIleArgThrPheArgSerCysAlaValAsp180185190HisHisAspThrGluAsnAlaAsnSerThrArgValThrThrThrTrp195200205ArgGluTyrArgProLeuIleArgLeuAlaAspSerMetAlaSerSer210215220AlaThrProGluAlaAlaThrAsnAsnArgValGlnAspArgPheArg225230235240GluAlaPheProSerGlyAsnPheGluLeuAlaTyrHisGlnThrAsp245250255HisValSerGlyValPheThrAsnLeuLeuAsnLysValValSerGlu260265270TyrLeuGlnGluGluTyrAspTyrGlnLeuLeuThrMetTyrGlnAsp275280285GlyCysValTyrLeuThrProAlaGluLeuAspGlnProGluThrAsp290295300GluAspIleValAlaAlaIleThrSerArgLeuGlyAspSerIleGly305310315320AspSerHisProSerTyrAsnAspIleAspGlnLeuArgSerAsnPhe325330335SerIleValGlyAlaGlnGlyLeuTyrSerLeuAsnGluProAspPhe340345350PheTyrAlaGlySerGlyLysMetLeuGlnAlaValValArgLysGly355360365ValThrAspGlyAspAlaAspAlaSerAlaThrAspAlaAlaThrGlu370375380SerMetGluLeuLeuGluAlaGluLeuGlyThrLysPheGluLysThr385390395400GluGlnGlnTyrGlyLeuGlyArgPheValAsnThrIleLysSerTrp405410415PheValAspProLeuLeuProSerAspArgThrAlaAsnAspLeuIle420425430ArgAlaThrValThrAlaPheGlyLeuSerAspGluLeuAlaGluAsp435440445LeuValAlaLeuSerGluGluThrThrSerAlaLeuThrSerGlyGly450455460LysTrpGluTyrSerTyrAlaIleAlaGlnGlyLeuLeuAspArgHis465470475480GlyThrGlyProValIleProThrValGluAspGluIleValMetThr485490495LeuSerAspGlyPheAlaAlaLeuValGluAspAspSerAspTrpGln500505510ThrArgIleGlnAsnAlaHisAlaGlyAspMetAlaThrGluValGln515520525AlaPheIleGlyGluThrLeuArgIleGlyGlyGlyAsnLeuIleLeu530535540ThrSerAlaThrValAspThrTyrAspGluTyrValLysSerSerArg545550555560GlyLysThrCysThrLeuCysSerArgGlyValAlaValGlyGlyAsn565570575LeuGlyProMetLysSerLysGlnSerLeuThrThrLeuGlnGlyGly580585590PheSerAsnArgGluMetValGlyGlyMetLysArgAspLysLeuLeu595600605LeuCysSerIleCysArgIleGluPheSerLeuArgGluThrAlaAla610615620SerArgArgAspGlyGlyArgLeuPhePheHisLeuValProAspTyr625630635640PheTyrThrProTyrSerTrpArgLeuTyrSerArgLeuValAsnArg645650655PheThrGlyGluAsnArgValArgLeuGlyArgLeuAlaGluArgVal660665670PheAspIleAspSerLeuGluGluPheThrGlyValMetAspGluLeu675680685ThrGlnProGluGlyAsnGlyArgThrMetIleGluSerLeuSerGln690695700GluPheAspArgAsnArgGlnPheGlyAlaGlnThrValGlyTyrPhe705710715720LysAsnProAspAsnAspThrGluPheGlnPhePheGlyAlaPheLeu725730735AlaLeuThrValSerAlaTyrThrGlyMetArgValTyrLeuSerSer740745750SerProValProGluMetArgSerArgAspPheProGluPheAlaLys755760765IleGlySerGlyPheThrGlnValThrSerPheTyrGlyGluThrVal770775780SerLeuThrSerLeuGlnSerGluLeuGlnSerAlaAlaAlaValVal785790795800LysLeuGlyTyrAlaIleGlnGlyAsnAspArgAsnAspSerLeuPhe805810815AlaLysTyrLeuArgThrThrArgAsnGluLeuLeuProGlySerTyr820825830LeuLeuLysArgAlaValGlnThrSerAspGluGlyProTyrIlePro835840845AlaLeuMetArgTyrAlaValAlaLeuAspGlnArgAsnAlaIleArg850855860GlnSerAsnSerGlnMetThrAspThrProHisAsnArgIleSerThr865870875880LeuAlaGluLeuAlaTyrAspAlaIleArgProAlaSerGlyHisGly885890895ArgLysProHisArgValGluArgValPheArgGluSerValLysAla900905910ValSerLysThrGlyGlnGlnLeuAspGlnGluAspTyrLysMetCys915920925ValSerGlyArgLeuGlnLysMetIleAspArgGlnAlaGlyAspAla930935940ValTyrProValSerAlaGluGluSerAspAlaGlyThrProLeuGln945950955960GluArgIleGluGluTyrAlaAlaTyrPheValAspGluIleLeuTyr965970975GlyIleAlaAsnGlyArgProSerGlnLeuLysArgLeuGluAsnAsn980985990LeuAlaAspGlyPhePheGlyAlaThrLeuArgAlaGluAlaGluTyr99510001005TyrAspGlnLysGlyGluGluLysGlnLysAlaAsnGluAla101010151020<210>35<211>334<212>PRT<213>MethanospirillumhungateiJF-1<400>35AlaAspLysValIleGlnSerPheTyrAlaSerIleLysProTyrThr151015LeuGluLysProGluArgLysProLysGlnAsnTyrValSerIleLeu202530IleLeuArgGluLeuGlnSerAlaAlaArgPheThrThrAspGlyThr354045GluAlaAsnSerSerIleIleArgIleGlyAspGluGluValThrVal505560GlyLysLeuPheGlyArgLysGlnValAlaSerAspArgArgIleAla65707580LysAlaLeuGlnArgAspLeuIleAlaGluLysMetAsnSerPheTyr859095LysLysGlyGlyTrpSerGlyCysSerMetGluValThrLysMetCys100105110GlnLysCysProGluCysAlaLeuPheGlySerAlaAlaSerGluGly115120125AspMetSerValThrSerArgValMetTyrAspGluAlaTyrThrIle130135140ArgGlyIleAsnSerValValGluGluTyrPheGlnAsnAlaProGly145150155160AspAspTyrAlaLysLysAlaThrSerGlyIleArgGluProAspPhe165170175PheLysGluGlyThrLeuPheProCysValValThrLeuArgAspVal180185190ThrCysGluGluValLeuPhePheLeuAsnIleThrAspArgAsnThr195200205ArgTyrGlyAlaThrGlyThrArgPheGlyLysThrArgAsnHisIle210215220LeuGlyValPheAlaSerAsnArgGluGlyProSerSerLeuGluIle225230235240SerArgGlyValAlaLeuArgLeuAlaGlyGlyAspGluValArgLeu245250255ProAspSerGluSerLeuLysArgValLeuGluLeuAspSerLeuPro260265270LeuHisAspValLysLysAsnAlaLeuGluValTyrGlnHisLeuLeu275280285LysThrHisArgIleSerGlyIleAspLeuGlyGluSerGluValThr290295300AlaLeuLeuAspAlaMetLysAspAspAlaValIleLysGluIleLeu305310315320IleThrGlnIleGluLysIleSerAspPheLeuAlaAspGln325330<210>36<211>328<212>PRT<213>NatronomonaspharaonisDSM2160<400>36IleProAspAsnIleThrAsnAlaLeuAlaAspGlyThrValProIle151015AspGlyMetThrAsnThrProGlyThrAsnTyrThrThrLeuLeuVal202530LeuArgGluLeuAspSerHisAlaIlePheThrThrAsnGlyGlnAsp354045AlaAspIleThrSerLeuSerValValGlyAspSerGlySerIleGlu505560TyrSerProGlyLeuMetPheMetArgLysGlnThrGlySerAspArg65707580ArgAlaGlyLysAlaIleGlnArgGluLeuLeuGluTyrAspArgSer859095AspSerMetAspValAsnAspMetAsnProGlnSerValGluSerAla100105110LeuTyrGlySerAlaAlaSerGlyAspAspAspValAspIleGlyVal115120125ThrSerArgValMetTyrAspThrAlaPheThrValArgAspAlaSer130135140AlaCysIleAspGluLysPheGlnAsnAlaProGlyGluGlyTyrAla145150155160LysGlySerThrAlaAsnIleArgGluProAspPhePheGluProGly165170175ThrLeuPheProCysThrIleThrLeuArgAspAlaThrProAlaGlu180185190ValAlaPheValThrAlaIleThrSerArgAsnLysArgTyrGlyAla195200205AlaThrThrArgLeuGlyArgValAsnAsnArgIleLeuGlyLeuTyr210215220ThrGlySerGluGluGlyProSerAsnArgGluLeuThrAlaGluThr225230235240IleValSerPheAlaSerGluSerAsnArgThrLeuGlyAspValVal245250255GlnAlaProAlaLeuAsnAlaAspGlnAlaAlaAlaTyrValArgGlu260265270AlaTyrAspThrAlaCysThrGluThrValAlaGlnThrProValAsp275280285AspGluValLeuAspGluLeuLeuAlaLeuThrAspAspAspAspLeu290295300ArgAlaValLeuGluAlaGlnGlnProHisSerArgSerPheIleAsp305310315320AspAlaIleAlaAlaAspGluSer325<210>37<211>243<212>PRT<213>MethanospirillumhungateiJF-1<400>37AsnAsnGlnSerSerValArgAlaPheGluGlyValLeuGluMetMet151015SerGluLeuPhePheAlaSerLeuGluProGlyAsnAsnTyrThrThr202530ArgProLeuIleLeuAsnThrAlaLeuTyrTyrAlaLeuGlyTyrCys354045SerGlyArgTyrValAsnValProValLysLysGlySerAlaLysGln505560AsnProThrTyrValGluAspThrAlaSerPheTyrSerLysLeuTyr65707580ValSerProAlaLysProValLysSerIleArgPheAlaSerGluIle859095ThrAsnAlaArgSerAspGluTyrIleGlnTyrAsnThrTyrGluLys100105110GlnMetAsnSerProThrGlyLysTyrGlyValArgLysGlnIleLeu115120125ProGlyGlyLysPheValPhePheValLeuSerPheAspGlyAsnGlu130135140ProAspLeuProValTyrIleArgLeuGlyLysLysArgSerLysAla145150155160SerValThrTrpSerGluCysProValThrArgLysLysGlySerPhe165170175IleLeuAsnHisProValLeuValAspAspLeuThrGlnIleProSer180185190ArgAspIleSerPheLysArgMetGlnProPheAspValIleGluArg195200205GlySerPheGluGlyGluTyrIleGlnIleGlnArgGlyGlyLysGlu210215220LysLysGluAspValValPheProAlaSerIleArgPheLeuGlnArg225230235240IleArgSer<210>38<211>246<212>PRT<213>NatronomonaspharaonisDSM2160<400>38GluValLeuGluAlaThrLeuThrThrHisGlyLysValGlyPheAla151015SerArgGluValGlyArgMetAlaAspThrAspProTyrIleLeuAsn202530ThrAlaLeuHisTyrAlaLeuGlyLeuAlaGlyGlyAsnTyrValAsp354045ValThrHisGlnProThrTyrIleGluAspThrAlaAspIleValAsp505560GluValTyrValThrProAlaThrProValAlaValGluSerGluSer65707580IleArgThrGluTyrLeuThrThrAsnArgAsnAlaArgAlaAspThr859095TyrAlaThrProAsnTyrProAlaGluAspAspProThrGlyLysAla100105110SerGlnAsnLeuProThrPheGluArgGluArgAlaLeuAlaProGly115120125AsnHisPheArgPheTyrValPheProTyrGlyArgThrAlaLysSer130135140AlaLysGluThrLeuProSerTyrIleArgLeuGlyLysLysArgGly145150155160LysGlyArgValArgTyrArgIleValGluAlaGluArgLysSerGly165170175ThrPheSerLeuGlyHisProLeuSerIleTyrAspHisAspAlaGln180185190ProLeuGlyGlyValValMetArgGlnMetGlnProThrProLeuTrp195200205PheGluGlyLysPheGluAlaAspHisTyrAlaIleGluSerProThr210215220GluSerAlaAspArgValTyrTyrProAlaGlyAlaLysPheLeuAla225230235240ThrLysArgGlyAspVal245<210>39<211>284<212>PRT<213>MethanospirillumhungateiJF-1<400>39HisLeuIleHisLeuThrValSerProLysThrSerPheAspIlePro151015LeuSerAspGlyTyrGlnLeuTyrSerAlaLeuLeuSerPheIleAsn202530GluLysAsnProSerThrSerLeuLysIleHisAsnSerProLeuPro354045SerLeuSerThrThrGlyLeuMetGlyLysPheGluLysSerPheHis505560LysGlyHisLysArgIleLeuGluGlyGluValTyrHisTrpArgIle65707580GlyValThrAspProGluAspGluAspLeuPheThrHisIleIleThr859095ProPheLeuLeuAspArgLysGluLeuSerLeuHisGluGlyGluLeu100105110CysIleCysSerValGluThrGlnTyrGlnSerPheGlnAspIleIle115120125GlnLysValLysGluCysGlnArgProAlaValLysMetAspPheIle130135140ThrProThrCysIleGlnTyrArgAsnSerArgValThrGluMetPhe145150155160ProAsnArgIleAlaValPhePheSerIleLeuSerLysTyrAsnGln165170175ValCysProGluGluLeuArgLeuSerLeuAsnArgAspAspPheGly180185190ArgTyrLeuLeuGluSerProHisProGlnThrTyrArgThrHisSer195200205ValLeuThrAsnThrIleTyrAspThrLysLysGlnHisHisArgPro210215220IlePheLysGlnGlyPheThrGlyThrCysHisTyrSerPheThrSer225230235240AspAlaProAlaAlaIleArgAsnAlaSerLeuIleLeuAlaTyrPhe245250255AlaGluTyrCysGlyValGlySerSerValSerArgGlyCysGlyGln260265270ValIleValSerValValGluGluSerTyrGluAsn275280<210>40<211>289<212>PRT<213>NatronomonaspharaonisDSM2160<400>40AlaSerAlaGlyGluLysGlyThrValValProGlnValArgGlnVal151015ThrValSerLeuThrProArgThrArgPheProValProLysSerAsp202530GlyTyrSerValTyrSerAlaLeuLeuSerValLeuSerAspValSer354045GluGluIleGlySerSerValHisAspSerProLeuGlySerLeuHis505560AsnSerGlyLeuLeuGlyProArgGlySerSerAspArgProHisHis65707580LysLeuLeuLeuProAspGluThrTyrGluLeuSerLeuGlyIleVal859095HisProGluAspGlyGluValPheGlnAlaLeuValAsnAlaLeuVal100105110LeuGlnAsnGluThrValGluLeuSerHisGlyGluLeuGluValArg115120125GluPheGluSerSerAsnAlaThrHisGluGluLeuLeuAlaGluAla130135140SerGlnTyrAspAspProThrValGluMetThrPheGlnThrAlaThr145150155160CysIleGluGluAlaAspGlyValThrThrMetPheProThrArgGly165170175AlaValPheAsnSerLeuLeuGlyLysTrpAsnArgSerValProGlu180185190GluLeuGluLeuAspLeuThrArgGluGluValAspAlaSerValIle195200205GluLysProAsnAspArgSerTyrGlnThrHisSerValLeuValAsn210215220ArgValLysAsnAspAsnGlyGluAsnArgAsnIlePheArgGlnGly225230235240PheThrGlyGluCysAlaTyrAlaPheLysGlyAlaSerGluSerVal245250255GluAsnAlaValThrAlaLeuAlaLeuPheGlyGluTyrSerGlyVal260265270GlySerAlaValAlaArgGlyCysGlyGlnValSerThrGluValLys275280285Asp<210>41<211>501<212>PRT<213>Escherichiacolistr.K-12substr.MG1655<400>41AsnLeuLeuIleAspAsnTrpIleProValArgProArgAsnGlyGly151015LysValGlnIleIleAsnLeuGlnSerLeuTyrCysSerArgAspGln202530TrpArgLeuSerLeuProArgAspAspMetGluLeuAlaAlaLeuAla354045LeuLeuValCysIleGlyGlnIleIleAlaProAlaLysAspAspVal505560GluPheArgHisArgIleMetAsnProLeuThrGluAspGluPheGln65707580GlnLeuIleAlaProTrpIleAspMetPheTyrLeuAsnHisAlaGlu859095HisProPheMetGlnThrLysGlyValLysAlaAsnAspValThrPro100105110MetGluLysLeuLeuAlaGlyValSerGlyAlaThrAsnCysAlaPhe115120125ValAsnGlnProGlyGlnGlyGluAlaLeuCysGlyGlyCysThrAla130135140IleAlaLeuPheAsnGlnAlaAsnGlnAlaProGlyPheGlyGlyGly145150155160PheLysSerGlyLeuArgGlyGlyThrProValThrThrPheValArg165170175GlyIleAspLeuArgSerThrValLeuLeuAsnValLeuThrLeuPro180185190ArgLeuGlnLysGlnPheProAsnGluSerHisThrGluAsnGlnPro195200205ThrTrpIleLysProIleLysSerAsnGluSerIleProAlaSerSer210215220IleGlyPheValArgGlyLeuPheTrpGlnProAlaHisIleGluLeu225230235240CysAspProIleGlyIleGlyLysCysSerCysCysGlyGlnGluSer245250255AsnLeuArgTyrThrGlyPheLeuLysGluLysPheThrPheThrVal260265270AsnGlyLeuTrpProHisProHisSerProCysLeuValThrValLys275280285LysGlyGluValGluGluLysPheLeuAlaPheThrThrSerAlaPro290295300SerTrpThrGlnIleSerArgValValValAspLysIleIleGlnAsn305310315320GluAsnGlyAsnArgValAlaAlaValValAsnGlnPheArgAsnIle325330335AlaProGlnSerProLeuGluLeuIleMetGlyGlyTyrArgAsnAsn340345350GlnAlaSerIleLeuGluArgArgHisAspValLeuMetPheAsnGln355360365GlyTrpGlnGlnTyrGlyAsnValIleAsnGluIleValThrValGly370375380LeuGlyTyrLysThrAlaLeuArgLysAlaLeuTyrThrPheAlaGlu385390395400GlyPheLysAsnLysAspPheLysGlyAlaGlyValSerValHisGlu405410415ThrAlaGluArgHisPheTyrArgGlnSerGluLeuLeuIleProAsp420425430ValLeuAlaAsnValAsnPheSerGlnAlaAspGluValIleAlaAsp435440445LeuArgAspLysLeuHisGlnLeuCysGluMetLeuPheAsnGlnSer450455460ValAlaProTyrAlaHisHisProLysLeuIleSerThrLeuAlaLeu465470475480AlaArgAlaThrLeuTyrLysHisLeuArgGluLeuLysProGlnGly485490495GlyProSerAsnGly500<210>42<211>501<212>PRT<213>ThermusthermophilusHB8<400>42GlySerLeuGluLysPheAsnLeuIleAspGluProTrpIleProVal151015LeuLysGlyGlyArgValValGluValGlyIleGlyGluAlaLeuLeu202530ArgAlaHisGluPheAlaArgIleGluThrProSerProLeuGluGlu354045AlaValLeuHisArgLeuLeuLeuAlaValLeuHisArgAlaLeuSer505560GlyProArgCysProGluAspValLeuAspTrpTrpArgLysGlyGly65707580PheProGlnAspProIleArgAspTyrLeuAsnArgPheArgAspArg859095PhePheLeuPheHisProGluAlaProPheLeuGlnValAlaAspLeu100105110ProGluGluAsnProLeuProTrpSerLysLeuLeuProGluLeuAla115120125SerGlyAsnAsnProThrLeuPheAspHisThrThrGluGluAsnLeu130135140ProLysAlaThrTyrAlaGlnAlaAlaArgAlaLeuLeuValHisGln145150155160AlaPheAlaProGlyGlyLeuLeuArgArgTyrGlyValGlySerAla165170175LysAspAlaProValAlaArgProAlaLeuPheLeuProThrGlyGln180185190AsnLeuLeuGluThrLeuLeuLeuAsnLeuValProTyrThrProGlu195200205AspAspAlaProIleTrpGluValProProLeuArgLeuGlyAspLeu210215220GluGlyAlaArgThrLysTrpProLeuThrGlyArgThrArgValTyr225230235240ThrTrpProAlaArgGlyValArgLeuLeuAspGluGlyAspGlyVal245250255ArgPheMetGlyTyrGlyProGlyValGluProLeuGluAlaThrHis260265270ArgAspProMetValAlaGlnArgLeuAspAlaLysGlyAsnLeuLeu275280285ValLeuArgLeuSerGluGluArgSerPheTrpArgAspPheSerAla290295300MetLeuProArgGlnGlyGlyLysValAlaAlaThrLeuGluHisAla305310315320GluAsnLeuGlnGlyGluLeuGluAspGluGlyLeuGluGlyArgIle325330335ThrLeuArgValLeuGlyGlnValSerAspGlnAlaLysValLeuAsp340345350IleArgArgGluValTyrProLeuProSerGlyLeuLeuThrProLys355360365AlaGluGluAsnLeuGluLysAlaLeuLysMetAlaGluGluLeuGly370375380GlnGlyLeuLysHisLeuAlaGlnGluValAlaLysAlaValValGly385390395400GluArgAspArgGlyHisGlyArgSerProTyrLeuGluGluLeuThr405410415LysLeuAlaAsnSerLeuProLeuGluArgLeuTyrTrpHisAlaLeu420425430AspGlyAlaPheProArgPhePheAlaArgValGluGluGluAlaSer435440445LeuAspLeuTrpArgGluAlaLeuArgGlyAlaAlaLeuGluAlaTrp450455460LysAlaThrArgArgPheLeuGlyThrGlyAlaArgHisLeuLysAla465470475480LeuAlaGlnGlyGluGlnGluPheGlyArgLeuLeuGlyGluLeuGly485490495GluGluValArgThr500<210>43<211>159<212>PRT<213>Escherichiacolistr.K-12substr.MG1655<400>43AlaAspGluIleAspAlaMetAlaLeuTyrArgAlaTrpGlnGlnLeu151015AspAsnGlySerCysAlaGlnIleArgArgValSerGluProAspGlu202530LeuArgAspIleProAlaPheTyrArgLeuValGlnProPheGlyTrp354045GluAsnProArgHisGlnGlnAlaLeuLeuArgMetValPheCysLeu505560SerAlaGlyLysAsnValIleArgHisGlnAspLysLysSerGluGln65707580ThrThrGlyIleSerLeuGlyArgAlaLeuAlaAsnSerGlyArgIle859095AsnGluArgArgIlePheGlnLeuIleArgAlaAspArgThrAlaAsp100105110MetValGlnLeuArgArgLeuLeuThrHisAlaGluProValLeuAsp115120125TrpProLeuMetAlaArgMetLeuThrTrpTrpGlyLysArgGluArg130135140GlnGlnLeuLeuGluAspPheValLeuThrThrAsnLysAsnAla145150155<210>44<211>168<212>PRT<213>ThermusthermophilusHB8<400>44SerProGlyGluArgPheLeuAspTrpLeuLysArgLeuGlnGlyGln151015LysAlaTrpThrAlaAlaArgAlaAlaPheArgArgSerLeuAlaPhe202530ProProGlyAlaTyrProArgAlaMetProTyrValGluProPheLeu354045AlaLysGlyAspTrpArgGlnGluGluArgGluAlaHisTyrLeuVal505560AlaAlaLeuTyrAlaLeuLysAspGlyAspHisGlnValGlyArgThr65707580LeuAlaArgAlaLeuTrpGluLysAlaGlnGlySerAlaSerValGlu859095LysArgPheLeuAlaLeuLeuGluAlaAspArgAspGlnIleAlaPhe100105110ArgLeuArgGlnAlaValAlaLeuValGluGlyGlyIleAspPheAla115120125ArgLeuLeuAspAspLeuLeuArgTrpPheSerProGluArgHisVal130135140GlnAlaArgTrpAlaArgGluTyrTyrGlyAlaGlyAlaSerGluGlu145150155160GluLysLysLysGluValGluAla165<210>45<211>362<212>PRT<213>Escherichiacolistr.K-12substr.MG1655<400>45SerAsnPheIleAsnIleHisValLeuIleSerHisSerProSerCys151015LeuAsnArgAspAspMetAsnMetGlnLysAspAlaIlePheGlyGly202530LysArgArgValArgIleSerSerGlnSerLeuLysArgAlaMetArg354045LysSerGlyTyrTyrAlaGlnAsnIleGlyGluSerSerLeuArgThr505560IleHisLeuAlaGlnLeuArgAspValLeuArgGlnLysLeuGlyGlu65707580ArgPheAspGlnLysIleIleAspLysThrLeuAlaLeuLeuSerGly859095LysSerValAspGluAlaGluLysIleSerAlaAspAlaValThrPro100105110TrpValValGlyGluIleAlaTrpPheCysGluGlnValAlaLysAla115120125GluAlaAspAsnLeuAspAspLysLysLeuLeuLysValLeuLysGlu130135140AspIleAlaAlaIleArgValAsnLeuGlnGlnGlyValAspIleAla145150155160LeuSerGlyArgMetAlaThrSerGlyMetMetThrGluLeuGlyLys165170175ValAspGlyAlaMetSerIleAlaHisAlaIleThrThrHisGlnVal180185190AspSerAspIleAspTrpPheThrAlaValAspAspLeuGlnGluGln195200205GlySerAlaHisLeuGlyThrGlnGluPheSerSerGlyValPheTyr210215220ArgTyrAlaAsnIleAsnLeuAlaGlnLeuGlnGluAsnLeuGlyGly225230235240AlaSerArgGluGlnAlaLeuGluIleAlaThrHisValValHisMet245250255LeuAlaThrGluValProGlyAlaLysGlnArgThrTyrAlaAlaPhe260265270AsnProAlaAspMetValMetValAsnPheSerAspMetProLeuSer275280285MetAlaAsnAlaPheGluLysAlaValLysAlaLysAspGlyPheLeu290295300GlnProSerIleGlnAlaPheAsnGlnTyrTrpAspArgValAlaAsn305310315320GlyTyrGlyLeuAsnGlyAlaAlaAlaGlnPheSerLeuSerAspVal325330335AspProIleThrAlaGlnValLysGlnMetProThrLeuGluGlnLeu340345350LysSerTrpValArgAsnAsnGlyGluAla355360<210>46<211>370<212>PRT<213>ThermusthermophilusHB8<400>46LysLeuLeuGluValHisIleLeuGlnThrValAlaProSerAsnLeu151015AsnArgAspAspThrGlySerProLysAspAlaLeuPheGlyGlyPhe202530ArgArgAlaArgIleSerSerGlnAlaGlnLysArgAlaValArgVal354045AlaPheArgAspTrpProLeuLeuSerGluGluGluArgAlaValArg505560ThrLysArgLeuValGluGluLeuLeuArgArgLeuAlaGlyValGlu65707580GluGluLeuAlaArgArgAlaIleGluAsnAlaLeuAsnAlaLeuGly859095PheGlyValLysGluGlyArgThrGluTyrLeuLeuPheLeuGlyAsn100105110ArgGluLeuAspAlaLeuAlaGlnGlyIleArgGluAsnLeuGluAla115120125LeuSerGlyGluValLysGlyLysLysLysAlaGluValProProGlu130135140LeuLysLysAlaLeuGluArgValLeuAspGlyGlyLysAlaValAsp145150155160LeuAlaLeuPheGlyArgMetLeuAlaAspArgProGluLeuGlyVal165170175AspAlaAlaAlaGlnValAlaHisAlaLeuSerThrHisLysValAsp180185190ArgGluPheAspPheTyrThrAlaValAspAspLeuAsnProLysGlu195200205AspThrGlyAlaGlyMetMetGlyAspValGluPheTyrSerAlaThr210215220LeuTyrArgTyrAlaValValAspLeuAspLysLeuValGluAsnLeu225230235240GlnGlyAspLysGluLeuAlaLeuLysGlyValLeuAlaPheLeuGlu245250255AlaPheAlaLeuThrLeuProSerGlyLysGlnAsnSerPheAlaAla260265270HisAsnProProLeuPheValAlaPheArgAlaGlyGluGlyMetPro275280285ArgAsnLeuAlaThrAlaPheGluAlaProLeuArgProLysGluGlu290295300ValProLeuSerArgLeuSerAlaGluAlaLeuLeuLysGluTrpAla305310315320LysPheAspArgValTyrGlyProLeuGluProGluTrpLysGlyAla325330335LeuAspLeuThrGlyAlaGluGlyAspGlyValProArgLeuGluAsn340345350LeuLysAlaLeuLysGluLysAlaAlaGluAlaValLysAlaLeuLeu355360365GlyVal370<210>47<211>223<212>PRT<213>Escherichiacolistr.K-12substr.MG1655<400>47ArgSerTyrLeuIleLeuArgLeuAlaGlyProMetGlnAlaTrpGly151015GlnProThrPheGluGlyThrArgProThrGlyArgPheProThrArg202530SerGlyLeuLeuGlyLeuLeuGlyAlaCysLeuGlyIleGlnArgAsp354045AspThrSerSerLeuGlnAlaLeuSerGluSerValGlnPheAlaVal505560ArgCysAspGluLeuIleLeuAspAspArgArgValSerValThrGly65707580LeuArgAspTyrHisThrValLeuGlyAlaArgGluAspTyrArgGly859095LeuLysSerHisGluThrIleGlnThrTrpArgGluTyrLeuCysAsp100105110AlaSerPheThrValAlaLeuTrpLeuThrProHisAlaThrMetVal115120125IleSerGluLeuGluLysAlaValLeuLysProArgTyrThrProTyr130135140LeuGlyArgArgSerCysProLeuThrHisProLeuPheLeuGlyThr145150155160CysGlnAlaSerAspProGlnLysAlaLeuLeuAsnTyrGluProVal165170175GlyGlyAspIleTyrSerGluGluSerValThrGlyHisHisLeuLys180185190PheThrAlaArgAspGluProMetIleThrLeuProArgGlnPheAla195200205SerArgGluTrpTyrValIleLysGlyGlyMetAspValSerGln210215220<210>48<211>247<212>PRT<213>ThermusthermophilusHB8<400>48ProThrLeuLeuIleArgLeuGlnGlyProLeuGlnSerTrpGlyThr151015ArgSerArgPheAspHisArgAspThrTrpProTyrProThrLysSer202530GlyValValGlyLeuLeuAlaAlaAlaLeuGlyArgAspArgArgGlu354045AspValSerAspLeuAlaAlaLeuArgMetGlyValArgValAspArg505560LysGlyValLeuLysValAspTyrGlnThrAlaGlnPheValTyrArg65707580ThrGluGlyTyrValAlaValSerThrProLysGluArgGluTrpLeu859095SerArgTyrThrLysThrProIleArgValAspGluArgAsnAlaThr100105110ValThrSerLysArgTyrPheLeuSerAspAlaAlaPheLeuValGly115120125LeuGluGlyGluArgAlaLeuLeuGluAlaLeuHisArgAlaLeuLys130135140AsnProArgPheProLeuTyrLeuGlyArgLysSerTyrValProSer145150155160ProProProTyrLeuProAspGlyLeuValGluAlaProLeuAlaGlu165170175AlaLeuGluGlyTyrProTyrLeuLeuGlyGlyLysProProGluAsp180185190LeuLeuLeuAlaLeuGluAlaGluGluGlyArgLeuValTyrAspGln195200205ProAlaGlyProPheSerGluArgArgPheAlaAlaArgPheValArg210215220GluGluValLeuProLysGluArgValProGluGlyProProAlaTrp225230235240GluValAlaArgValAlaHis245<210>49<211>198<212>PRT<213>Escherichiacolistr.K-12substr.MG1655<400>49TyrLeuSerLysValIleIleAlaArgAlaTrpSerArgAspLeuTyr151015GlnLeuHisGlnGlyLeuTrpHisLeuPheProAsnArgProAspAla202530AlaArgAspPheLeuPheHisValGluLysArgAsnThrProGluGly354045CysHisValLeuLeuGlnSerAlaGlnMetProValSerThrAlaVal505560AlaThrValIleLysThrLysGlnValGluPheGlnLeuGlnValGly65707580ValProLeuTyrPheArgLeuArgAlaAsnProIleLysThrIleLeu859095AspAsnGlnLysArgLeuAspSerLysGlyAsnIleLysArgCysArg100105110ValProLeuIleLysGluAlaGluGlnIleAlaTrpLeuGlnArgLys115120125LeuGlyAsnAlaAlaArgValGluAspValHisProIleSerGluArg130135140ProGlnTyrPheSerGlyAspGlyLysSerGlyLysIleGlnThrVal145150155160CysPheGluGlyValLeuThrIleAsnAspAlaProAlaLeuIleAsp165170175LeuValGlnGlnGlyIleGlyProAlaLysSerMetGlyCysGlyLeu180185190LeuSerLeuAlaProLeu195<210>50<211>210<212>PRT<213>ThermusthermophilusHB8<400>50TrpLeuThrLysLeuValLeuAsnProAlaSerArgAlaAlaArgArg151015AspLeuAlaAsnProTyrGluMetHisArgThrLeuSerLysAlaVal202530SerArgAlaLeuGluGluGlyArgGluArgLeuLeuTrpArgLeuGlu354045ProAlaArgGlyLeuGluProProValValLeuValGlnThrLeuThr505560GluProAspTrpSerValLeuAspGluGlyTyrAlaGlnValPhePro65707580ProLysProPheHisProAlaLeuLysProGlyGlnArgLeuArgPhe859095ArgLeuArgAlaAsnProAlaLysArgLeuAlaAlaThrGlyLysArg100105110ValAlaLeuLysThrProAlaGluLysValAlaTrpLeuGluArgArg115120125LeuGluGluGlyGlyPheArgLeuLeuGluGlyGluArgGlyProTrp130135140ValGlnIleLeuGlnAspThrPheLeuGluValArgArgLysLysAsp145150155160GlyGluGluAlaGlyLysLeuLeuGlnValGlnAlaValLeuPheGlu165170175GlyArgLeuGluValValAspProGluArgAlaLeuAlaThrLeuArg180185190ArgGlyValGlyProGlyLysAlaLeuGlyLeuGlyLeuLeuSerVal195200205AlaPro210<210>51<211>448<212>PRT<213>YersiniapestisCO92<400>51MetSerAspGluGlyLeuAlaAlaPheIleValSerTyrIleLysSer151015ArgGluGlnProLysLeuGluAlaPheAspLysGluAlaGluLysArg202530LeuAlaGlyLeuThrGlnAlaGluAspIleAlaLeuAlaGlnGlnGlu354045IleAlaGlnGlnArgGlnGluLeuIleAlaArgTyrGluValArgAsn505560TrpLeuThrAspAlaAlaAsnArgAlaGlyGlnIleLysLeuAlaThr65707580HisAlaProLysTyrThrHisSerAspSerLysSerSerGlyIleLeu859095AsnIleGluLeuGlnSerLysLysLysAspTyrPheSerSerValAsp100105110LeuAlaGluGlnAlaSerAspValIleGlyAsnAlaAlaValPheAsp115120125LeuValLysLeuLeuGlnSerGluCysGluGlyGlySerLeuIleLys130135140CysLeuGluGlnGlyAspAsnSerValLeuLysLeuPheSerAsnAsp145150155160AspGluLeuValGluGluTrpThrThrLysPheLysSerIleLeuAsn165170175AsnGluLysPheThrSerHisLysLeuAlaLysGlnPheTyrPhePro180185190ValGlyProAspGlnTyrHisLeuLeuSerProLeuPheSerSerSer195200205LeuAlaGlnAlaMetHisGlnArgIleIleGluAlaArgPheSerAsp210215220GlnSerLysGluAlaLysAlaAlaHisLysAlaGlyArgTrpHisPro225230235240ThrValArgValLeuTyrLeuAspThrAlaValGlnHisIleGlyGly245250255ThrLysProGlnAsnIleSerTyrLeuAsnSerValArgGlyGlyLys260265270ValTrpLeuLeuProCysGlyAlaProSerTrpLysAsnIleGlnLys275280285ProProIleLysTyrArgSerIlePheHisAspArgSerGluPheThr290295300ValLeuAlaArgAsnAsnLeuTrpGlnMetGlnLeuTyrLeuLeuGly305310315320ValLysProLeuSerAsnThrMetAspIleArgAlaAlaArgLeuAla325330335CysCysAspGluIleIleAspIleLeuPheAsnTyrValAlaGluIle340345350GlnAsnLeuAspGlyThrAsnGlyTrpSerAspAlaGluAspCysLys355360365LeuLysArgSerGluGlnLeuTrpLeuAspProThrArgAlaMetAsp370375380AspProValPheLysLeuGluArgGluLysGluAspTrpLysGlnGlu385390395400ValSerGlnAspPheGlyTyrTrpLeuAsnArgTrpLeuGlnHisAsp405410415GluLeuValPheGlyTyrValGluGlnArgGluTrpSerSerLeuPhe420425430LysGlnArgLeuArgGluPheGluGlnGlySerLeuGluThrSerSer435440445<210>52<211>433<212>PRT<213>PseudomonasaeruginosaUCBPP-PA14<400>52ThrSerProLeuProThrProThrTrpGlnGluLeuArgGlnPheIle151015GluSerPheIleGlnGluArgLeuGlnGlyLysLeuAspLysLeuGln202530ProAspGluAspAspLysArgGlnThrLeuLeuAlaThrHisArgArg354045GluAlaTrpLeuAlaAspAlaAlaArgArgValGlyGlnLeuGlnLeu505560ValThrHisThrLeuLysProIleHisProAspAlaArgGlySerAsn65707580LeuHisSerLeuProGlnAlaProGlyGlnProGlyLeuAlaGlySer859095HisGluLeuGlyAspArgLeuValSerAspValValGlyAsnAlaAla100105110AlaLeuAspValPheLysPheLeuSerLeuGlnTyrGlnGlyLysAsn115120125LeuLeuAsnTrpLeuThrGluAspSerAlaGluAlaLeuGlnAlaLeu130135140SerAspAsnAlaGluGlnAlaArgGluTrpArgGlnAlaPheIleGly145150155160IleThrThrValLysGlyAlaProAlaSerHisSerLeuAlaLysGln165170175LeuTyrPheProLeuProGlySerGlyTyrHisLeuLeuAlaProLeu180185190PheProThrSerLeuValHisHisValHisAlaLeuLeuArgGluAla195200205ArgPheGlyAspAlaAlaLysAlaAlaArgGluAlaArgSerArgGln210215220GluSerTrpProHisGlyPheSerGluTyrProAsnLeuAlaIleGln225230235240LysPheGlyGlyThrLysProGlnAsnIleSerGlnLeuAsnAsnGlu245250255ArgArgGlyGluAsnTrpLeuLeuProSerLeuProProAsnTrpGln260265270ArgGlnAsnValAsnAlaProMetArgHisSerSerValPheGluHis275280285AspPheGlyArgThrProGluValSerArgLeuThrArgThrLeuGln290295300ArgPheLeuAlaLysThrValHisAsnAsnLeuAlaIleArgGlnArg305310315320ArgAlaGlnLeuValAlaGlnIleCysAspGluAlaLeuGlnTyrAla325330335AlaArgLeuArgGluLeuGluProGlyTrpSerAlaThrProGlyCys340345350GlnLeuHisAspAlaGluGlnLeuTrpLeuAspProLeuArgAlaGln355360365ThrAspGluThrPheLeuGlnArgArgLeuArgGlyAspTrpProAla370375380GluValGlyAsnArgPheAlaAsnTrpLeuAsnArgAlaValSerSer385390395400AspSerGlnIleLeuGlySerProGluAlaAlaGlnTrpSerGlnGlu405410415LeuSerLysGluLeuThrMetPheLysGluIleLeuGluAspGluArg420425430Asp<210>53<211>316<212>PRT<213>YersiniapestisCO92<400>53MetSerSerLeuIleValLeuHisGlnValArgValGluAsnAlaAsn151015AlaIleAlaGlyLeuThrTyrGlyPheProAlaIleThrHisPheLeu202530GlyTyrSerHisAlaLeuSerArgLysLeuGlnSerSerHisGlyLeu354045ThrLeuArgGlyCysAlaValIleCysHisTyrGlnGlnValHisAla505560TyrLeuSerGlyTrpAspTyrValPheSerLeuThrArgAsnProLeu65707580ThrLysGluAlaLysThrAlaAlaPheAsnGluGluGlyArgMetHis859095MetThrValSerLeuValIleGluCysAspGlyThrIleAlaAsnGly100105110AspAspGlyAlaAsnAlaLeuGluLysHisLeuAlaSerLeuCysLeu115120125ThrGlnArgLeuAlaGlyGlyThrIleThrAsnIleArgArgValLys130135140ValIleAsnTyrProGluThrGluValAlaThrArgArgLeuLeuCys145150155160ArgLeuLeuProGlyPheAlaLeuLeuAspArgSerGluLeuLeuAla165170175GluHisLeuAsnArgLeuArgGlnThrAsnProGlnAlaGluMetLeu180185190AspAlaTrpLeuAspPheSerAlaLeuLysIleGlnAlaIleProPro195200205GlnSerAspThrProValGluSerGlyAlaProAlaProTrpGlyTyr210215220ValGlyLysProAlaAlaGlyTyrLeuValProIleValThrGlyTyr225230235240ArgAlaIleSerProLeuTyrAlaProGlyGluValAspLysThrArg245250255AspProHisThrProPheArgPheValGluSerLeuTyrGlyIleGly260265270GluTrpArgGlyLeuHisArgIleThrAspLeuArgGlnLeuLeuTrp275280285GlyTyrHisGlnGluGlyAspAsnTyrLeuCysArgCysAlaLeuPro290295300AlaSerValAspThrTyrLeuLeuAsnAspGluGlu305310315<210>54<211>326<212>PRT<213>PseudomonasaeruginosaUCBPP-PA14<400>54SerValThrAspProGluAlaLeuLeuLeuLeuProArgLeuSerIle151015GlnAsnAlaAsnAlaIleSerSerProLeuThrTrpGlyPheProSer202530ProGlyAlaPheThrGlyPheValHisAlaLeuGlnArgArgValGly354045IleSerLeuAspIleGluLeuAspGlyValGlyIleValCysHisArg505560PheGluAlaGlnIleSerGlnProAlaGlyLysArgThrLysValPhe65707580AsnLeuThrArgAsnProLeuAsnArgAspGlySerThrAlaAlaIle859095ValGluGluGlyArgAlaHisLeuGluValSerLeuLeuLeuGlyVal100105110HisGlyAspGlyLeuAspAspHisProAlaGlnGluIleAlaArgGln115120125ValGlnGluGlnAlaGlyAlaMetArgLeuAlaGlyGlySerIleLeu130135140ProTrpCysAsnGluArgPheProAlaProAsnAlaGluLeuLeuMet145150155160LeuGlyGlySerAspGluGlnArgArgLysAsnGlnArgArgLeuThr165170175ArgArgLeuLeuProGlyPheAlaLeuValSerArgGluAlaLeuLeu180185190GlnGlnHisLeuGluThrLeuArgThrThrLeuProGluAlaThrThr195200205LeuAspAlaLeuLeuAspLeuCysArgIleAsnPheGluProProAla210215220ThrSerSerGluGluGluAlaSerProProAspAlaAlaTrpGlnVal225230235240ArgAspLysProGlyTrpLeuValProIleProAlaGlyTyrAsnAla245250255LeuSerProLeuTyrLeuProGlyGluValArgAsnAlaArgAspArg260265270GluThrProLeuArgPheValGluAsnLeuPheGlyLeuGlyGluTrp275280285LeuSerProHisArgValAlaAlaLeuSerAspLeuLeuTrpTyrHis290295300HisAlaGluProAspLysGlyLeuTyrArgTrpSerThrProArgPhe305310315320ValGluHisAlaIleAla325<210>55<211>334<212>PRT<213>YersiniapestisCO92<400>55MetAlaLysAlaThrIleLysThrAlaSerValLeuAlaPheGluArg151015LysLeuSerAsnSerAspAlaMetMetTyrAlaGlyAsnTrpGlyGln202530ThrAspAsnTrpGlnProIleIleIleLysGluLysAlaValArgGly354045ThrIleSerAsnArgLeuLysAsnAlaLeuAlaSerAspProAlaLys505560LeuAspAlaGluIleGlnLysAlaAsnLeuGlnArgValAspValAla65707580AlaLeuProPheAspThrAspThrLeuLysMetSerPheThrLeuArg859095ValLeuGlyAsnLeuAlaThrProSerValCysAsnAspGlnGluTyr100105110GlnAlaGluLeuAlaSerValIleAsnGlyTyrIleSerGluGlnSer115120125PheSerValLeuAlaAlaArgTyrAlaGluAsnLeuAlaAsnGlyArg130135140PheLeuTrpArgAsnArgValGlyAlaGluAspIleLysValCysIle145150155160ThrSerGlnThrLysSerTyrGlnPheAspSerAsnGluPheSerLeu165170175ArgGlnPheSerGlnProSerLysGluLeuThrAlaLeuAlaGlnGlu180185190IleGluGlnGlyLeuAlaGlyAsnGlyPheAlaPhePheThrValAsp195200205AlaPheValArgLeuGlyAsnGlyGlnGluValPheProSerGlnGlu210215220LeuValLeuAspSerAsnSerLysLysSerLysValLeuTyrGlnIle225230235240AspGlyIleAlaAlaLeuHisSerGlnLysValGlyAsnAlaLeuArg245250255ThrIleAspAspTrpTyrProAspAlaThrGluLeuAlaLeuGlyPro260265270IleAlaValGluProTyrGlySerValThrSerArgGlyLysAlaTyr275280285ArgGlnProLysGlnLysMetAspPheTyrThrLeuLeuAspAsnTrp290295300ValThrLysGlyThrValProAlaValGluGlnGlnHisTyrValMet305310315320AlaThrLeuIleArgGlyGlyValPheGlyGluLysGlyGlu325330<210>56<211>341<212>PRT<213>PseudomonasaeruginosaUCBPP-PA14<400>56SerLysProIleLeuSerThrAlaSerValLeuAlaPheGluArgLys151015LeuAspProSerAspAlaLeuMetSerAlaGlyAlaTrpAlaGlnArg202530AspAlaSerGlnGluTrpProAlaValThrValArgGluLysSerVal354045ArgGlyThrIleSerAsnArgLeuLysThrLysAspArgAspProAla505560LysLeuAspAlaSerIleGlnSerProAsnLeuGlnThrValAspVal65707580AlaAsnLeuProSerAspAlaAspThrLeuLysValArgPheThrLeu859095ArgValLeuGlyGlyAlaGlyThrProSerAlaCysAsnAspAlaAla100105110TyrArgAspLysLeuLeuGlnThrValAlaThrTyrValAsnAspGln115120125GlyPheAlaGluLeuAlaArgArgTyrAlaHisAsnLeuAlaAsnAla130135140ArgPheLeuTrpArgAsnArgValGlyAlaGluAlaValGluValArg145150155160IleAsnHisIleArgGlnGlyGluValAlaArgAlaTrpArgPheAsp165170175AlaLeuAlaIleGlyLeuArgAspPheLysAlaAspAlaGluLeuAsp180185190AlaLeuAlaGluLeuIleAlaSerGlyLeuSerGlySerGlyHisVal195200205LeuLeuGluValValAlaPheAlaArgIleGlyAspGlyGlnGluVal210215220PheProSerGlnGluLeuIleLeuAspLysGlyAspLysLysGlyGln225230235240LysSerLysThrLeuTyrSerValArgAspAlaAlaAlaIleHisSer245250255GlnLysIleGlyAsnAlaLeuArgThrIleAspThrTrpTyrProAsp260265270GluAspGlyLeuGlyProIleAlaValGluProTyrGlySerValThr275280285SerGlnGlyLysAlaTyrArgGlnProLysGlnLysLeuAspPheTyr290295300ThrLeuLeuAspAsnTrpValLeuArgAspGluAlaProAlaValGlu305310315320GlnGlnHisTyrValIleAlaAsnLeuIleArgGlyGlyValPheGly325330335GluAlaGluGluLys340<210>57<211>183<212>PRT<213>YersiniapestisCO92<400>57AspHisTyrLeuAspIleArgValLeuProAspProGluPheSerAla151015GlnThrLeuLeuGluAlaLeuPheAlaLysLeuHisArgAlaLeuVal202530AlaThrIleProGlyArgValGlyValSerPheProThrAlaGlyLys354045ThrLeuGlySerGlnLeuArgLeuHisGlySerArgGlyAspLeuLeu505560GluLeuGlnSerAlaGlyTrpLeuLysGlyLeuGlnAspTyrCysGlu65707580CysSerGluIleLeuProValProAlaAspValLysHisArgThrIle859095ArgArgValGlnValLysSerSerAlaGlnArgLeuArgArgArgSer100105110ValSerLysGlyTrpLeuThrGluGluGlnAlaArgLeuArgIlePro115120125AspSerHisAspLysArgCysAspLeuProPheLeuArgLeuLysSer130135140ArgSerSerGluGlnTyrPheLeuLeuPheIleGluGlnGlyThrLeu145150155160GlnAlaSerAlaThrThrGlyGluPheSerAlaTyrGlyLeuSerVal165170175AsnAlaThrIleProTrpPhe180<210>58<211>166<212>PRT<213>PseudomonasaeruginosaUCBPP-PA14<400>58SerValLeuPheGlyLysLeuHisGlnAlaLeuValAlaGlnGlyGly151015AspArgIleGlyValSerPheProAspLeuAspGluSerArgSerArg202530LeuGlyGluArgLeuArgIleHisAlaSerAlaAspAspLeuArgAla354045LeuLeuAlaArgProTrpLeuGluGlyLeuArgAspHisLeuGlnPhe505560GlyGluProAlaValValProHisProThrProTyrArgGlnValSer65707580ArgValGlnAlaLysSerAsnProGluArgLeuArgArgArgLeuMet859095ArgArgHisAspLeuSerGluGluGluAlaArgLysArgIleProAsp100105110ThrValAlaArgAlaLeuAspLeuProPheValThrLeuArgSerGln115120125SerThrGlyGlnHisPheArgLeuPheIleArgHisGlyProLeuGln130135140ValThrAlaGluGluGlyGlyPheThrCysTyrGlyLeuSerLysGly145150155160GlyPheValProTrpPhe165<210>59<211>25<212>DNA<213>AeropyrumpernixK1<400>59gcatatccctaaagggaatagaaag25<210>60<211>24<212>DNA<213>SulfolobussolfataricusP2<400>60ctttcaattctatagtagattagc24<210>61<211>24<212>DNA<213>ThermoproteustenaxKra1<400>61ctttcaatcctctttttgagattc24<210>62<211>31<212>DNA<213>HaloferaxvolcaniiDS2<400>62ggtttcagacgaacccttgtgggtttgaagc31<210>63<211>30<212>DNA<213>ThermotoganeapolitanaDSM4359<400>63gtttcaatacttccttagaggtatggaaac30<210>64<211>32<212>DNA<213>DesulfovibriovulgarisDP4<400>64gtttcaatccacgcccccgcacggggggcgac32<210>65<211>32<212>DNA<213>StreptococcuspyogenesMGAS5005<400>65atttcaatccactcacccatgaagggtgagac32<210>66<211>37<212>DNA<213>MethanospirillumhungateiJF-1<400>66gtttcaatccctatcgggttttcttttccattgtgac37<210>67<211>37<212>DNA<213>NatronomonaspharaonisDSM2160<400>67gtcgagacggactgaaaacccagaacgggattgaaac37<210>68<211>28<212>DNA<213>Escherichiacolistr.K-12substr.MG1655<400>68ggtttatccccgctggcgcggggaacac28<210>69<211>27<212>DNA<213>Escherichiacoli<400>69gttccccgcgccagcggggataaaccg27<210>70<211>29<212>DNA<213>ThermusthermophilusHB8<400>70gtagtccccacgcgtgtggggatggaccg29<210>71<211>28<212>DNA<213>YersiniapestisCO92<400>71tttctaagctgcctgtgcggcagtgaac28<210>72<211>28<212>DNA<213>PseudomonasaeruginosaUCBPP-PA14<400>72gttcactgccgtataggcagctaagaaa28<210>73<211>25<212>DNA<213>AeropyrumpernixK1<400>73gcatatccctaaagggaatagaaag25<210>74<211>24<212>DNA<213>SulfolobussolfataricusP2<400>74ctttcaattctatagtagattagc24<210>75<211>24<212>DNA<213>ThermoproteustenaxKra1<400>75ctttcaatcctctttttgagattc24<210>76<211>30<212>DNA<213>AcetobacteriumwoodiiDSM1030<400>76atttacattccaatatggatctactcaaat30<210>77<211>29<212>DNA<213>Caldicellulosiruptorhydrothermalis108<400>77gtttacatccctaatagttcagataaaac29<210>78<211>37<212>DNA<213>ChloroflexusaggregansDSM9485<400>78gtttcagtgctctaccgtgagccgaaagtattgaaag37<210>79<211>30<212>DNA<213>Clostridiumacidurici9a<400>79gcattaatagaactaaagtagaatgtaaat30<210>80<211>37<212>DNA<213>HalobacteroideshalobiusDSM5150<400>80gttacaaaccttactccgttaagtaggagactgaaag37<210>81<211>29<212>DNA<213>Sulfurihydrogenibiumsp.YO3AOP1<400>81ctttataacccacacggttcagatgtaac29<210>82<211>36<212>DNA<213>Synechococcussp.PCC6312<400>82gtgctcaacgccttacggcatctaaggtagaggaac36<210>83<211>29<212>DNA<213>Thermoanaerobactermathraniisubsp.mathraniistr.A3<400>83atttacatccctcatagttcagataaaac29<210>84<211>24<212>DNA<213>SulfolobusislandicusM.16.4<400>84gataatctactatagaattgaaag24<210>85<211>25<212>DNA<213>StaphylothermusmarinusF1<400>85ctttcaattctttctatgttgttac25<210>86<211>30<212>DNA<213>PyrococcusyayanosiiCH1<400>86gttccaataagactcaaagagaattgaaag30<210>87<211>25<212>DNA<213>PyrobaculumogunienseTE7<400>87gtttcaactatcttttgattttgac25<210>88<211>24<212>DNA<213>MetallosphaerasedulaDSM5348<400>88ctttcaactctataggagattaac24<210>89<211>26<212>DNA<213>CandidatusKorarchaeumcryptofilumOPF8<400>89tctttcaatcctcttttcatcgagac26<210>90<211>30<212>DNA<213>ThermotogathermarumDSM5069<400>90gtttgaaccctacctataaggaatggaaac30<210>91<211>30<212>DNA<213>ThermodesulfovibrioyellowstoniiDSM11347<400>91gttttgagcctacctatgaggaattgaaac30<210>92<211>30<212>DNA<213>ThermococcuslitoralisDSM5473<400>92ctttcaattcttctaaagtcttattggaac30<210>93<211>31<212>DNA<213>HaloferaxvolcaniiDS2<400>93ggtttcagacgaacccttgtgggtttgaagc31<210>94<211>30<212>DNA<213>ThermotoganeapolitanaDSM4359<400>94gtttcaatacttccttagaggtatggaaac30<210>95<211>30<212>DNA<213>AmmonifexdegensiiKC4<400>95gtttgtagcctacctatgagggattgaaac30<210>96<211>30<212>DNA<213>AnaerobaculummobileDSM13181<400>96gtttccatccctcataggaagttcaaaaac30<210>97<211>30<212>DNA<213>CarboxydothermushydrogenoformansZ-2901<400>97gtttcaatcccagaatggttcgattaaaac30<210>98<211>30<212>DNA<213>DeferribacterdesulfuricansSSM1<400>98gtttcaattcctcataggcactctaaaaac30<210>99<211>37<212>DNA<213>DesulfobacteriumautotrophicumHRM2<400>99cctggaatgcctgatccacgacaacaaggattgaaac37<210>100<211>29<212>DNA<213>DictyoglomusthermophilumH-6-12<400>100gtttaaatcccacatagttcagatcaaac29<210>101<211>30<212>DNA<213>Ferroplasmaacidarmanusfer1<400>101gtgtttagtctatctataagggtttgaaat30<210>102<211>30<212>DNA<213>FervidobacteriumnodosumRt17-B1<400>102gcttttagcatacctattagggattgaaac30<210>103<211>30<212>DNA<213>Fusobacteriumnucleatumsubsp.animalis4_8<400>103atgaactgtaaacttgaaaagttttgaaat30<210>104<211>30<212>DNA<213>HaloarculahispanicaN601<400>104gtttcagacgaaccctcgtggggttgaagc30<210>105<211>30<212>DNA<213>HalorhabdustiamateaSARL4B<400>105gtttcagacggaccctcgtggggttgaagc30<210>106<211>30<212>DNA<213>HydrogenobacterthermophilusTK-6<400>106gtttcaatcccttataggcacctaataaac30<210>107<211>30<212>DNA<213>Mahellaaustraliensis50-1BON<400>107gtttcaattcctcataggtaggctaaaaac30<210>108<211>31<212>DNA<213>NitratifractorsalsuginisDSM16511<400>108atcatgaagcagtccctatgggatttgaaat31<210>109<211>30<212>DNA<213>OdoribactersplanchnicusDSM20712<400>109gtttcaattctaccttagttcaattaaaag30<210>110<211>29<212>DNA<213>PersephonellamarinaEX-H1<400>110ctttctatcccacttagttcaaagaaaac29<210>111<211>30<212>DNA<213>PetrotogamobilisSJ95<400>111ctttttatcctacctatgaggaatggaaac30<210>112<211>30<212>DNA<213>NatronobacteriumgregoryiSP2<400>112gtttcagacgaaccctcgtggggttgaagc30<210>113<211>32<212>DNA<213>Natrinemasp.J7-2<400>113gtttcagaaggacccttgtagggttgaagcga32<210>114<211>24<212>DNA<213>MethanosarcinamazeiTuc01<400>114gtttcaatccttgttttaatggat24<210>115<211>37<212>DNA<213>MethanosaetathermophilaPT<400>115gtcgaagagcgagttccaggaaaacaaggattgaaac37<210>116<211>37<212>DNA<213>MethanoregulaformicicumSMSP<400>116gtttcaatccttgttctcgtggatgtttcgctcgaag37<210>117<211>37<212>DNA<213>MethanococcusvoltaeA3<400>117gtttcaatccttgttttaatggattatgcattgtgac37<210>118<211>30<212>DNA<213>HalorhabdusutahensisDSM12940<400>118gcttcaaccccacgagggtccgtctgaaac30<210>119<211>30<212>DNA<213>HalomicrobiummukohataeiDSM12286<400>119gtttcagacggacccttgtgggattgaagc30<210>120<211>30<212>DNA<213>HaloferaxvolcaniiDS2<400>120gtttcagacgaacccttgtgggattgaagc30<210>121<211>30<212>DNA<213>Aciduliprofundumsp.MAR08-339<400>121ctttcaatcccaacatggtctgattctaac30<210>122<211>37<212>DNA<213>ZunongwangiaprofundaSM-A87<400>122cttccagaccattccatcaaacaactaggattgaaac37<210>123<211>30<212>DNA<213>ThermovirgalieniiDSM17291<400>123gttttagaccttcctataagggatggaaac30<210>124<211>30<212>DNA<213>ThermosiphoafricanusTCF52B<400>124gtttcaatccctaataggtatgctaaaaac30<210>125<211>30<212>DNA<213>ThermosediminibacteroceaniDSM16646<400>125gttactagcttacctatgaggggttgaaac30<210>126<211>30<212>DNA<213>ThermodesulfobiumnarugenseDSM14796<400>126gtttttacgatacctatgaggaattgaaac30<210>127<211>32<212>DNA<213>DesulfovibriovulgarisDP4<400>127gtttcaatccacgcccccgcacggggggcgac32<210>128<211>32<212>DNA<213>StreptococcuspyogenesMGAS5005<400>128atttcaatccactcacccatgaagggtgagac32<210>129<211>31<212>DNA<213>AcidaminococcusfermentansDSM20731<400>129gtcgcccccgcaagggggcgtggattgaaat31<210>130<211>32<212>DNA<213>Acidobacteriumcapsulatum<400>130gtttcaatccacgcgcccgcgaggggcgcgac32<210>131<211>32<212>DNA<213>Acidovoraxavenaesubsp.avenae<400>131gtcgcgccccgcgtgggcgcgtgggttgaaac32<210>132<211>32<212>DNA<213>AggregatibacteractinomycetemcomitansD7S-1<400>132gcagccatcttcgcatggctctgttttgaaat32<210>133<211>32<212>DNA<213>AlkaliphilusmetalliredigensQYMF<400>133gtcgctccctatatggggggcgtggattgaaa32<210>134<211>32<212>DNA<213>AzotobactervinelandiiCA<400>134gtttcaatccacacgcccgcatggggcgtgac32<210>135<211>32<212>DNA<213>BacteroideshelcogenesP36-108<400>135gtttcaatccacacacccgtatagggtgtgac32<210>136<211>32<212>DNA<213>BibersteiniatrehalosiUSDA-ARS-USMARC-192<400>136ccagctacgtacgcgtagctgtgagttgaaac32<210>137<211>32<212>DNA<213>CellvibriojaponicusUeda107<400>137gtttcaatccacgcgctcgcgaagagcgcgac32<210>138<211>37<212>DNA<213>ChamaesiphonminutusPCC6605<400>138gttccaatcctcgatcaacccgaaagccgatcgctac37<210>139<211>32<212>DNA<213>DehalococcoidesmccartyiDCMB5<400>139gtcgctccccgtgcgggagcgtgaattgaaac32<210>140<211>32<212>DNA<213>DesulfobulbuspropionicusDSM2032<400>140gtcgccccccacgcgggggcgtggattgaaac32<210>141<211>32<212>DNA<213>DesulfocapsasulfexigensDSM10523<400>141gtttcaatccacgcccccgcatggagggcgac32<210>142<211>32<212>DNA<213>DesulfomoniletiedjeiDSM6799<400>142gtcgcccctcacgcaggggcgtggattgaaac32<210>143<211>32<212>DNA<213>DesulfosporosinusacidiphilusSJ4<400>143gtcgctccctacgtgggagcgtggattgaaat32<210>144<211>32<212>DNA<213>DesulfotomaculumcarboxydivoransCO-1-SRB<400>144gtcgcgccccacacgggcgcgtggattgaaac32<210>145<211>33<212>DNA<213>EggerthellalentaDSM2243<400>145atttcaacccgcactccccatgcggggagtgac33<210>146<211>33<212>DNA<213>EthanoligenensharbinenseYUAN-3<400>146atttcaatccacgctctccgtgtggagagcgac33<210>147<211>32<212>DNA<213>Exiguobacteriumsibiricum255-15<400>147gtcgcactcctcgtgagtgcgtggattgaaat32<210>148<211>33<212>DNA<213>FaecalibacteriumprausnitziiL2-6<400>148gtcgccctcctcgcggagggcgtggatagaaat33<210>149<211>32<212>DNA<213>Filifactoralocis<400>149gtcgcgtcccacaggggcgcgtggattgaaat32<210>150<211>37<212>DNA<213>Halothiobacillusneapolitanusc2<400>150gtttcaatccgcgcccggcggttaggccgggcgattc37<210>151<211>32<212>DNA<213>HyphomicrobiumnitrativoransNL23<400>151gtttctatccacgcctccgcgcgggaggcgac32<210>152<211>32<212>DNA<213>KetogulonicigeniumvulgareY25<400>152gtcgctccccccacgggagcgtggatagaaac32<210>153<211>37<212>DNA<213>LeptothrixcholodniiSP-6<400>153gtttcaatccacgcccgccagtttcccggcgagcgac37<210>154<211>33<212>DNA<213>Magnetococcussp.MC-1<400>154gtcgccccctcccacgggggcgtggattgaaac33<210>155<211>37<212>DNA<213>MyxococcusfulvusHW-1<400>155gtcgctccccgtgaacgcggggagcgtgggttgaaac37<210>156<211>32<212>DNA<213>Nitrosomonassp.AL212<400>156gtttcaatccacgcgcccacgcggggcgcgac32<210>157<211>32<212>DNA<213>PelodictyonphaeoclathratiformeBU-1<400>157gtcgcgccccctgcgggcgcgtggattgaaac32<210>158<211>31<212>DNA<213>PlanctomycesbrasiliensisDSM5305<400>158gtttcaatccgcgcccctgtggaggggcgat31<210>159<211>33<212>DNA<213>PorphyromonasasaccharolyticaDSM20707<400>159gtcgcaccccgcacggggtgcgtgaattgaaac33<210>160<211>32<212>DNA<213>PrevotelladentalisDSM3688<400>160gtcgcgtctcacgtaggcgcgtggattgaaac32<210>161<211>32<212>DNA<213>ProsthecochlorisvibrioformisDSM265<400>161gtcgcgcccttcacgggcgcgtggattgaaac32<210>162<211>31<212>DNA<213>PseudoxanthomonasspadixBD-a59<400>162gtcgcgctctcacgagcgcgtggattgaaac31<210>163<211>32<212>DNA<213>RhodobactersphaeroidesKD131<400>163gtcgcccctcacgcgggggcgtggatcgaaac32<210>164<211>32<212>DNA<213>RhodopseudomonaspalustrisDX-1<400>164gtcgctccccgcgcgggagcgtggatcgaaac32<210>165<211>33<212>DNA<213>RoseburiahominisA2-183<400>165atttcaatccacgctcccctcacagggagcgac33<210>166<211>32<212>DNA<213>Sphingobiumsp.SYK-6<400>166gtcgctccccgtgcgggggcgtggatcgaaac32<210>167<211>32<212>DNA<213>TeredinibacterturneraeT7901<400>167gtttcaatccacgcgctcgcgaggagcgcgaa32<210>168<211>31<212>DNA<213>Xanthomonasoryzaepv.oryzaePXO99A<400>168gtcgcgtcctcacgggcgcgtggattgaaac31<210>169<211>32<212>DNA<213>UnculturedTermitegroup1bacteriumphylotypeRs-D17<400>169gtcgcgccccgtgtgggcgcgtgaattgaaat32<210>170<211>32<212>DNA<213>TreponemabrennaborenseDSM12168<400>170gtttcaatccacgctcccgtgaagggagcgac32<210>171<211>37<212>DNA<213>ThermusthermophilusSG0.5JP17-16<400>171gtttcaatcctcaccggccctttcgggccggtgcaac37<210>172<211>37<212>DNA<213>MethanospirillumhungateiJF-1<400>172gtttcaatccctatcgggttttcttttccattgtgac37<210>173<211>37<212>DNA<213>NatronomonaspharaonisDSM2160<400>173gtcgagacggactgaaaacccagaacgggattgaaac37<210>174<211>38<212>DNA<213>AcetohalobiumarabaticumDSM5501<400>174ctttaaagaactataatttcgtttaaggaattgaaacg38<210>175<211>37<212>DNA<213>AnabaenacylindricaPCC7122<400>175gtttcaatccctaatagggagtaatagaaattgcaat37<210>176<211>37<212>DNA<213>Calothrixsp.PCC6303<400>176gttcctataaactaaaatccctatcagggattgaaac37<210>177<211>37<212>DNA<213>Cyanothecesp.PCC7425<400>177gtttccaagcctgaatcccggtctacgggactgaaac37<210>178<211>37<212>DNA<213>Gloeocapsasp.PCC7428<400>178atttcaattaacataaatccttatcagggattgaaac37<210>179<211>31<212>DNA<213>MethanotorrisigneusKol5<400>179gtttccatccccctatgggtctgattttaat31<210>180<211>30<212>DNA<213>MethanothermococcusokinawensisIH1<400>180atttccatccatcaatggtctgattttaac30<210>181<211>30<212>DNA<213>MethanocaldococcusvulcaniusM7<400>181attaaaatcagcacggatcgtgatggaaac30<210>182<211>37<212>DNA<213>HaloquadratumwalsbyiC23<400>182gttgcaacgaagagaaaacccgctaagggattgaaac37<210>183<211>37<212>DNA<213>HalophilicarchaeonDL31<400>183gtttcaatcccgttctgggttttctgggtgtcgcgac37<210>184<211>28<212>DNA<213>Escherichiacolistr.K-12substr.MG1655<400>184ggtttatccccgctggcgcggggaacac28<210>185<211>27<212>DNA<213>Escherichiacoli<400>185gttccccgcgccagcggggataaaccg27<210>186<211>29<212>DNA<213>ThermusthermophilusHB8<400>186gtagtccccacgcgtgtggggatggaccg29<210>187<211>29<212>DNA<213>AcetobacterpasteurianusIFO3283-01<400>187gtgttccccgcacacgcggggatgaaccg29<210>188<211>28<212>DNA<213>AcidimicrobiumferrooxidansDSM10331<400>188ggatcacccccgcctgcgcggggagcac28<210>189<211>28<212>DNA<213>AlkalilimnicolaehrlicheiMLHE-1<400>189ggtctatccccgcaggcgcgggggagcc28<210>190<211>29<212>DNA<213>AllochromatiumvinosumDSM180<400>190cggttcatccccgcgagcgcggggaacgg29<210>191<211>29<212>DNA<213>Alteromonasmacleodii<400>191gtgttccccgtgcccacggggatgaacca29<210>192<211>29<212>DNA<213>AmycolatopsismediterraneiRB<400>192gtcgtccccgcgcacgcggggccggtccg29<210>193<211>29<212>DNA<213>Anaeromyxobacterdehalogenans2CP-1<400>193ggcttccccgcgtgcgcggggatcgaccc29<210>194<211>29<212>DNA<213>Anaeromyxobactersp.K<400>194ggcttccccgcgtgcgcggggattgtaga29<210>195<211>29<212>DNA<213>ArcanobacteriumhaemolyticumDSM20595<400>195ctcttccccgcacacgcgggggtatttcc29<210>196<211>29<212>DNA<213>Bifidobacteriumanimalissubsp.animalis<400>196cggatcatccccgcctgtgcggggcaaac29<210>197<211>27<212>DNA<213>Burkholderiasp.YI23<400>197gtctatctccgcacacgcggaggaacc27<210>198<211>29<212>DNA<213>CandidatusAccumulibacterphosphatiscladeIIAstr.UW-1<400>198gtttcccccgcgtcagcggggataggccc29<210>199<211>26<212>DNA<213>CatenulisporaacidiphilaDSM44928<400>199gggaccagccccgcacgcgcggggag26<210>200<211>28<212>DNA<213>CellulomonasfimiATCC484<400>200gtcgtctccccgcgtgcggggatgagcc28<210>201<211>29<212>DNA<213>ChromohalobactersalexigensDSM3043<400>201ccgttccccgcaggcgcggggatcaaccg29<210>202<211>28<212>DNA<213>CoriobacteriumglomeransPW2<400>202gtgctccccgcgcatgcggggatgatcc28<210>203<211>29<212>DNA<213>Cycloclasticuszancles7-ME<400>203cggttcatccccacgcttgtggggaacac29<210>204<211>29<212>DNA<213>DesulfatibacillumalkenivoransAK-01<400>204gtcttccccacgcccgtgggggtgtttct29<210>205<211>29<212>DNA<213>Erwiniaamylovora<400>205cggtttatccccgcatacgcggggaacac29<210>206<211>28<212>DNA<213>Gardnerellavaginalis409-05<400>206gtctttcccgcatacgcgggggtgatcc28<210>207<211>29<212>DNA<213>GeobacterlovleyiSZ<400>207cggttcatccccgcgggtgcggggaacgg29<210>208<211>28<212>DNA<213>KlebsiellapneumoniaeNTUH-K2044<400>208gaaacacccccacgtgcgtggggaagac28<210>209<211>28<212>DNA<213>LactobacillusfermentumF-6<400>209ggatcacccccatatacatggggagcac28<210>210<211>29<212>DNA<213>Marinomonassp.MWYL1<400>210cggtttatccccgtgtgctcggggaacgc29<210>211<211>29<212>DNA<213>PelobacterpropionicusDSM2379<400>211cggttcatccccgcgcatgcggggaacac29<210>212<211>29<212>DNA<213>PolymorphumgilvumSL003B-26A1<400>212gtctcccccgcctacgcggggatgaaccc29<210>213<211>29<212>DNA<213>Propionibacteriumacidipropionici<400>213gtcgtccccgcgcaggcgggggtaatccg29<210>214<211>29<212>DNA<213>PseudomonasaeruginosaRP73<400>214gtgttccccacgggtgtggggatgaaccg29<210>215<211>29<212>DNA<213>RalstoniasolanacearumCFBP2957<400>215gtgttccccgcgcctgcggggatgaaccg29<210>216<211>29<212>DNA<213>RhodospirillumphotometricumDSM122<400>216cggttcatccccgcgcaggcggggaacac29<210>217<211>29<212>DNA<213>RubrivivaxgelatinosusIL144<400>217cggttcatccccacccgcgtggggaacgc29<210>218<211>29<212>DNA<213>SalmonellabongoriN268-08<400>218cggtttatccccgctggcgcggggaacac29<210>219<211>29<212>DNA<213>SphaerobacterthermophilusDSM20745<400>219cggttcacccccacgcgtgtggggacaac29<210>220<211>29<212>DNA<213>Thauerasp.MZ1T<400>220ggttcccccgcgtccgcggggataggccc29<210>221<211>27<212>DNA<213>MethanospirillumhungateiJF-1<400>221gttcatccccatacacacggggaactc27<210>222<211>28<212>DNA<213>MethanosalsumzhilinaeDSM4017<400>222ggttcatccccacgtgtgtggggaactc28<210>223<211>29<212>DNA<213>MethanococcoidesburtoniiDSM6242<400>223gagttccccatgcatgtggggataaaccg29<210>224<211>29<212>DNA<213>TrueperaradiovictrixDSM17093<400>224cggttcatccccacgtgtgtggggaatag29<210>225<211>29<212>DNA<213>ThiocystisviolascensDSM198<400>225gtgttccccgcgctcgcggggatgaaccg29<210>226<211>29<212>DNA<213>ThermomonosporacurvataDSM43183<400>226cggaccacccccgcctgcgcggggagcac29<210>227<211>29<212>DNA<213>ThermobisporabisporaDSM43833<400>227gggatcatccccgcgtgcgcggggagcac29<210>228<211>29<212>DNA<213>ThermobifidafuscaYX<400>228cggtccatccccacgtgcgtggggctcac29<210>229<211>28<212>DNA<213>YersiniapestisCO92<400>229tttctaagctgcctgtgcggcagtgaac28<210>230<211>28<212>DNA<213>PseudomonasaeruginosaUCBPP-PA14<400>230gttcactgccgtataggcagctaagaaa28<210>231<211>28<212>DNA<213>Acidovoraxsp.JS42<400>231tttctgagctgcctatgcggcagtgaac28<210>232<211>28<212>DNA<213>AlcanivoraxdieseloleiB5<400>232tttcttagctgcctgcgcggcagcgaac28<210>233<211>28<212>DNA<213>DelftiaacidovoransSPH-1<400>233gttcgctgccgcgtaggcagctcagaaa28<210>234<211>28<212>DNA<213>DesulfurispirillumindicumS5<400>234tttctgagctgcctatgcggcagtgaac28<210>235<211>28<212>DNA<213>DesulfurivibrioalkaliphilusAHT2<400>235tttctgagctgcctgtgcggcagtgaac28<210>236<211>28<212>DNA<213>HalomonaselongataDSM2581<400>236gttcgctgccgcccaggcagctcagaaa28<210>237<211>28<212>DNA<213>Methylophagasp.JAM1<400>237tttctaagctgcctgttcggcagtgaac28<210>238<211>28<212>DNA<213>MoraxellacatarrhalisRH4<400>238tttctaagcgacctgtgcggtcgtgaag28<210>239<211>29<212>DNA<213>NitrosococcuswatsoniC-113<400>239ggttcaccgccgcacaggcggtttagaaa29<210>240<211>28<212>DNA<213>Pasteurellamultocida36950<400>240gttcaccatcgtgtagatggcttagaaa28<210>241<211>28<212>DNA<213>ProvidenciastuartiiMRSN2154<400>241gttcactgccgcataggcagcttagaaa28<210>242<211>28<212>DNA<213>Rahnellaaquatilis<400>242gttcactgccgtacaggcagcttagaaa28<210>243<211>28<212>DNA<213>Selenomonasruminantiumsubsp.lactilyticaTAM6421<400>243gtgttccgccgtataggcggcttagaaa28<210>244<211>28<212>DNA<213>SpirochaetaafricanaDSM8902<400>244gttacctgccgcataggcagcttagaaa28<210>245<211>28<212>DNA<213>YersiniapseudotuberculosisYPIII<400>245gttcactgccgcacaggcagcttagaaa28<210>246<211>28<212>DNA<213>VibrioparahaemolyticusBB22OP<400>246gtgaactgccgaataggtagctgataat28<210>247<211>28<212>DNA<213>VerminephrobactereiseniaeEF01-2<400>247tttctgagctgcctatccggcagtgaac28<210>248<211>28<212>DNA<213>TolumonasauensisDSM9187<400>248cttcactgccgcacaggcagcttagaaa28<210>249<211>28<212>DNA<213>Thioalkalivibriosp.K90mix<400>249gttagctgccgcacaggcagctcagaaa28当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1