核糖核酸内切酶组合物及其使用方法与流程

文档序号:11996180阅读:892来源:国知局
核糖核酸内切酶组合物及其使用方法交叉引用该申请要求2010年5月10日提交的美国临时专利申请号61/333,163;2010年7月19日提交的美国临时专利申请号61/365,627;以及2010年11月12日提交的美国临时专利申请号61/413,287的权益,这些申请各自以引用方式全部并入本文。关于政府赞助研究的声明该发明是根据美国国立卫生研究院授予的拨款号T32GM07232和美国国家科学基金会授予的拨款号MCB-0950971的政府支持下进行的。政府具有本发明的某些权利。发明背景在二十世纪七十年代,DNA限制酶通过使随意裂解特定DNA序列成为可能而改变了分子生物学。目前RNA分子的测序必需将RNA拷贝进DNA链,然后通过常规方法来对所述DNA链进行测序。该方法也称为RNASeq,其有效并且可产生数百万个序列读数。然而,由于个别步骤的序列依赖性功效,产生cDNA的必要性导致固有偏好。文献Carte等(2008)GenesDev.22:3489;美国专利公开号2010/0093026。发明概要本公开提供了变体Csy4核糖核酸内切酶、编码变体Csy4核糖核酸内切酶的核酸以及经所述核酸遗传修饰的宿主细胞。也提供了变体Csy4核糖核酸内切酶用于多种应用。本公开也提供了检测靶多核糖核苷酸中特定序列的方法;以及调节真核细胞中靶RNA的生成的方法。附图简述图1A-C示出Pal4Csy4对前体-crRNA(pre-crRNA)底物的特异性识别。示出的核苷酸序列是5′-GUUCACUGCCGUAUAGGCAGCUAAGAAA-3′(SEQIDNO:1)。图2A-C示出结合RNA底物的Csy4的晶体结构。图3A和3B示出:Csy4的催化中心的详细视图(图3A);以及Csy4野生型(WT)和突变体的裂解活性(图3B)。图4示出12个Csy4序列中不变的氨基酸。Pa(SEQIDNO:8);Yp(SEQIDNO:34);Ec89(SEQIDNO:39);Dn(SEQIDNO:79);Ab(SEQIDNO:84);MP1(SEQIDNO:2);MP01(SEQIDNO:3);SW(SEQIDNO:4);Pm(SEQIDNO:85);Pw(SEQIDNO:13);和Dd(SEQIDNO:10)。图5A-5BD展示各种Csy4多肽的氨基酸序列比对以及由各Csy4多肽识别的RNA序列的核苷酸序列。图6示出无酶活性、序列特异性核糖核酸内切酶的氨基酸序列的例子。图7示出检测靶多核糖核苷酸中特定序列的方法的例子。图8示出咪唑对各种无酶活性的Csy4变体的活化的作用。图9示出分离靶RNA的示例性方法。示出Csy4靶茎-环(SEQIDNO:103)。图10示出调节真核细胞中靶RNA的表达的示例性方法。示出Csy4RNA底物序列(SEQIDNO:103)。定义如本文所使用,“多核糖核苷酸”是指核苷酸的聚合形式,并且包括RNA、包含脱氧核苷酸的RNA以及包含核苷酸的DNA。在一些情况下,多核糖核苷酸可包括一种或多种修饰的核苷酸(例如,脱氧肌苷、脱氧尿苷或羟甲基脱氧尿苷)。在一些情况下,多核糖核苷酸仅由核苷酸组成(即,不包括任何脱氧核苷酸)。在一些情况下,多核糖核苷酸包含核苷酸,以及一种或多种修饰的核苷酸,但不包括任何脱氧核苷酸。在其他情况下,多核糖核苷酸包含核苷酸,并且可包含一种或多种修饰的核苷酸,以及一种或多种脱氧核苷酸(包括修饰的脱氧核苷酸)。在一些情况下,其中多核糖核苷酸包含一种或多种脱氧核苷酸,脱氧核苷酸占多核糖核苷酸中总核苷酸的约50%至约40%、约40%至约30%、约30%至约20%、约20%至约10%、约10%至约1%或者小于1%。术语“核酸”和“多核苷酸”可交换使用并且指任意长度的核苷酸(脱氧核苷酸或核苷酸或其类似物)的聚合形式。多核苷酸的非限制性例子包括线性和环状核酸、信使RNA(mRNA)、cDNA、重组多核苷酸、载体、探针和引物。“生物样本”涵盖从细胞、细胞外物质、组织或多细胞生物体中获得的多种样本类型。定义涵盖血液和生物来源的其他液体样本、固体组织样本,例如活检标本或组织培养物或者由其衍生的细胞及其子代。定义也包括在采购后以任何方式进行操作的样本,所述方式例如通过使用试剂处理、溶解或富集某些组分诸如多核苷酸。术语“生物样本”涵盖临床样本,并且也包括培养物中的细胞、细胞上清液、细胞裂解物、血清、血浆、生物流体(例如,脑脊液、支气管肺泡灌洗液、尿液、血液、血液部分(例如,血浆、血清)、痰等)以及组织样本。在一些情况下,生物样本包括细胞。在其他情况下,生物样本无细胞。术语“可操作连接”是指在分子之间功能性连接以提供期望的功能。在核酸的情况中,“可操作连接”是指核酸之间的功能性连接以提供期望的功能,诸如转录、翻译等,例如,在核酸表达控制序列(例如启动子、信号序列或转录因子结合位点的阵列)和第二多核苷酸之间的功能性连接,其中表达控制序列影响第二多核苷酸的转录和/或翻译。在多肽的情况中,“可操作连接”是指在(例如,不同结构域的)氨基酸序列之间的功能性连接以提供多肽的所述活性。“分离的”是指(如果天然存在)在与其天然存在的环境不同的环境中的蛋白质或核酸。“分离的”意思为包括在样本内的蛋白质或核酸,该样本基本上富含目标蛋白质或核酸和/或其中目标蛋白质或核酸是部分或基本上纯的。在其中蛋白质或核酸不是天然存在的情况中,“分离的”表示已经将蛋白质或核酸通过合成或重组方式从其制备的环境中分离。“基本上纯的”表示实体(例如,多肽或核酸)构成组合物的总含量(例如,组合物的总蛋白)的大于约50%并且通常总蛋白含量的大于约60%。在一些实施方案中,“基本上纯的”是指其中总组合物的至少75%、至少85%、至少90%或更多为目标实体(例如总蛋白的95%)的组合物。在一些实施方案中,目标蛋白质或核酸将构成组合物中总蛋白质或核酸的大于约90%、大于约95%、大于约98%或大于约99%。在进一步描述本发明之前,应理解,本发明不受描述的具体实施方案限制,因为其当然可变化。也应理解,本文所使用的术语的目的仅仅是为了描述具体实施方案,而不是旨在限制,因为本发明的范围仅受所附权利要求的限制。在其中提供大量数值的情况中,应理解,除非上下文中明确另有说明,该范围和任何其他所述范围的上下限之间的下限单位的十分之一的各居中值或者在所述范围中居中值涵盖在本发明内。这些较小范围的上限和下限可独立地包括在较小范围中,并且也涵盖在本发明内,服从在所述范围中任何具体排除限制。在其中所述范围包括限值的一个或两者的情况中,排除一个或两个这些包括的限值的范围也包括在本发明中。除非另有定义,本文所使用的所有技术和科学术语具有与本发明所属
技术领域
:普通技术人员通常所理解的相同的含义。尽管在本发明的实践或测试中也可使用与本文所述类似或等同的任何方法和材料,但现描述优选的方法和材料。本文所提及的所有出版物以引用的方式并入本文以公开和描述关于其这些出版物被引用的方法和/或材料。必须注意的是,除非上下文中明确另有说明,如本文所使用以及在所附权利要求中,单数形式“一个”、“一种”、和“所述”包括复数参照对象。因此,例如,参照“位点特异性核糖核酸内切酶”包括多种此类位点特异性核糖核酸内切酶以及参照“靶多核糖核苷酸”包括参照一种或多种靶多核糖核苷酸及其本领域技术人员已知的等同形式等。还需注意,可撰写权利要求以排除任何任选要素。就其本身而言,该陈述旨在用作使用与权利要求要素的叙述相关的此类排除性术语如“单独地”、“仅”等或者使用“消极”限制的先行基础。仅提供在本申请的提交日之前公开的本文所讨论的出版物。不应当将本文中任何内容解释为承认本发明不可凭借之前的发明早于这些公开。而且,所提供的公开日可能与实际公开日不同,这可能需要独立确定。发明详述本公开提供了变体Csy4核糖核酸内切酶、编码变体Csy4核糖核酸内切酶的核酸以及经核酸遗传修饰的宿主细胞。也提供了变体Csy4核糖核酸内切酶用于多种应用。本公开也提了供检测靶多核糖核苷酸中特定序列的方法;以及调节真核细胞中靶RNA的生成的方法。检测在靶多核糖核苷酸中序列的方法本公开提供了检测靶多核糖核苷酸中序列的方法。本方法用于检测在多核糖核苷酸中特定序列的存在,并且因而可用于检测包含特定序列的多核糖核苷酸。例如,本方法可用于检测样本中(例如,生物样本中)病原体的多核糖核苷酸的存在。主题方法可检测仅仅100拷贝、少至单一拷贝的靶多核糖核苷酸。因此,例如,主题方法可检测在样本中(例如,在单细胞中、在单胚胎或其他生物样本中)1至约5、约5至约10、约10至约50、或约50至约100或大于100拷贝的靶多核糖核苷酸。因此,主题方法用于各种法医、研究和诊断应用中。在一些实施方案中,检测靶多核糖核苷酸中特定序列的主题方法包括:a)在有利于寡核苷酸探针和靶多核糖核苷酸之间形成双链体的条件下使靶多核糖核苷酸与寡核苷酸探针接触,所述寡核苷酸探针包含特定序列以及酶活性序列特异性Csy4核糖核酸内切酶,其中双链体被Csy4核糖核酸内切酶裂解;以及b)检测寡核苷酸探针和靶多核糖核苷酸之间的特异性结合,其中检测到寡核苷酸探针和靶多核糖核苷酸之间双链体的形成指示在靶多核糖核苷酸中特定序列的存在。在一些情况下,寡核苷酸探针连接肽,并且由Csy4核糖核酸内切酶裂解双链体后,则释放肽;在这些情况下,检测步骤包括检测释放的肽。例如,通过结合对肽特异性的抗体来检测所述释放的肽,例如,其中抗体被固定。在一些实施方案中,靶多核糖核苷酸被固定在固体支撑物上。靶多核糖核苷酸包括多种多核苷酸的任何一种,例如,靶多核糖核苷酸可以是病原体的多核糖核苷酸。如上所示,在一些实施方案中,抗体或靶多核苷酸被固定在固体支撑物(不溶性支撑物)上。合适的不溶性支撑物包括但不限于琼脂糖珠、磁珠、试验条、多孔平皿等。不溶性支撑物可包括多种物质(玻璃、聚苯乙烯、聚氯乙烯、聚丙烯、聚乙烯、聚碳酸酯、葡聚糖、尼龙、直链淀粉、天然和修饰的纤维素、聚丙烯酰胺、琼脂糖和磁铁)以及可以多种形式提供,包括例如,琼脂糖珠、聚苯乙烯珠、乳胶珠、磁珠、胶态金属粒子、玻璃和/或硅片以及表面、硝化纤维条带、尼龙膜、薄片、反应盘的孔(例如,多孔板)、塑料管等。在一些实施方案中,本方法通常包括::a)使靶多核糖核苷酸与序列特异性核糖核酸内切酶接触;以及b)检测通过靶多核糖核苷酸的位点特异性裂解产生的裂解片段,其中在多核糖核苷酸中特定序列处裂解后产生预期的裂解片段,则表明存在特定序列。在其他实施方案中,在检测靶多核糖核苷酸中序列的主题方法包括:a)使靶多核糖核苷酸与以下物质接触:i)序列特异性核糖核酸内切酶;以及ii)包含连接的检测部分的寡核苷酸探针,其中寡核苷酸探针包含特异性、已知的核苷酸序列;其中基于在寡核苷酸探针中存在的已知核苷酸序列与靶多核糖核苷酸中互补序列的结合,寡核苷酸探针与靶多核糖核苷酸中的互补序列形成双链体,以及其中序列特异性核糖核酸内切酶以序列特异性方式裂解双链体,从而释放来自寡核苷酸探针的检测部分;以及b)检测释放的检测部分,其中检测部分的释放指示特定序列的存在。在一些实施方案中,使用两种或多种不同的寡核苷酸探针,各自包含不同的特异性、已知的核苷酸序列。在一些实施方案中,检测部分是多肽。使用免疫测定(例如,酶联免疫吸附测定法(ELISA)、放射免疫测定(RIA)等)、使用对多肽检测部分特异的抗体可检测多肽。对多肽检测部分特异的抗体可包含可检测标记。可在试验条(例如,在横向流动测定中)或者诸如多孔板的其他合适的介质上进行免疫测定。在一些实施方案中,检测部分是荧光蛋白,其中合适的荧光蛋白如本文所述。在其他实施方案中,检测部分是荧光素或者萤光素酶的其他底物。合适的荧光素或其他萤光素酶底物包括例如荧光素(例如,萤火虫荧光素);氨基酸荧光素;腔肠素;如美国专利号7,537,912所描述的修饰的腔肠素;如美国专利公开号2009/0081129所描述的腔肠素类似物(例如,如在美国专利公开号2009/0081129中所描述的膜渗透腔肠素类似物;例如,美国专利公开号2009/0081129的结构II、III、IV、V和VI之一);氨基酸荧光素;二氢荧光素;荧光素6′甲基醚;或者荧光素6′氯乙醚。例如,参见Branchini,B.R.等Anal.Biochem.2010,396,290-296;以及Mezzanotte,L.等Invivobioluminescenceimagingofmurinexenograftcancermodelswithared-shiftedthermostableluciferase.Mol.ImagingBiol.(2009年11月9日,在线;PubMedID:19937390)。主题检测方法的非限制性例子示意性图示在图7中。在图7示出的例子中,使结合靶多核苷酸(例如,病毒RNA)的离散区域的小寡核苷酸与靶多核苷酸接触,其中寡核苷酸包含可检测的部分(例如,配体、肽等)。将靶向寡核苷酸/病毒RNA双链体的酶活性、序列特异性限制性核酸内切酶(RRE)加入。酶裂解寡核苷酸/病毒RNA双链体;并且释放配体用于检测。酶进一步裂解双链体,从而放大信号。使用横向流动(例如,试验条)或者基于免疫的测定(例如,ELISA)来测定释放的配体。合适的序列特异性核糖核酸内切酶是酶活性、序列特异性核糖核酸内切酶。适合在主题检测方法中使用的核糖核酸内切酶包括以序列特异性方式结合和裂解底物多核糖核苷酸、包括酶活性多肽并且与图4所示的氨基酸序列(Csy4氨基酸序列)具有至少约85%、至少约90%、至少约95%、至少约98%、至少约99%、或100%氨基酸序列同一性的核糖核酸内切酶。适合在主题检测方法中使用的核糖核酸内切酶包括以序列特异性方式结合和裂解底物多核糖核苷酸、包括酶活性多肽并且与图5所示的氨基酸序列(Csy4氨基酸序列)具有至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%氨基酸序列同一性的核糖核酸内切酶。图5提供由各种核糖核酸内切酶特异性结合的序列。在一些情况下,合适的酶活性序列特异性Csy4核糖核酸内切酶可包含在图5中示出的Csy4氨基酸序列的氨基酸序列。适合在主题检测方法中使用的核糖核酸内切酶包括以序列特异性方式结合和裂解底物多核糖核苷酸、包括酶活性多肽并且通过1至20(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20)个氨基酸取代和/或插入和/或缺失而与图4或5中任一图中所示的氨基酸序列不同的核糖核酸内切酶。待检测的靶多核糖核苷酸可存在于样本中,例如生物样本,例如血液、血液产品(例如,血浆)、尿、脑脊液、支气管肺泡灌洗液、唾液、组织、细胞等。可将靶多核糖核苷酸分离或纯化。靶多核糖核苷酸可以为信使RNA(mRNA)、病毒RNA、细菌RNA、寄生虫RNA或其他RNA种类。病毒RNA包括但不限于:黄病毒科(Flaviviridae)的任何成员,例如,丙型肝炎病毒、登革病毒、黄热病病毒、西尼罗河病毒等;逆转录病毒科(Retroviridae)的任何成员;免疫缺陷病毒(例如,人免疫缺陷病毒)等。待检测的靶多核糖核苷酸可存在于多细胞生物体的细胞中(或者可从多细胞生物体的细胞中获得)。待检测的靶多核糖核苷酸可存在于六界中任何一种的细胞或生物体或从六界中任何一种的细胞或生物体中获得,例如,细菌界(例如,真细菌界);原始细菌界;原生生物界;真菌界;植物界;和动物界。靶多核糖核苷酸的合适的来源包括原生生物界的类似植物的成员,包括但不限于藻类(例如,绿藻、红藻、灰胞藻、蓝细菌);原生生物界类似真菌的成员,例如,粘菌、水霉等;原生生物界的类似动物的成员,例如,鞭毛类(例如,眼虫属)、变形虫(例如,阿米巴)、孢子虫(例如,顶复亚门、粘原虫门、微孢子目)和纤毛虫(例如,草履虫)。靶多核糖核苷酸的合适的来源包括真菌界的成员,包括但不限于以下任意门的任何成员:担子菌亚门(珊瑚菌(clubfungi);例如,蘑菇属(Agaricus)、鹅膏属(Amanita)、牛肝菌属(Boletus)、鸡油菌属(Cantherellus)等的成员);子囊菌亚门(Ascomycota)(子囊菌,包括例如酵母菌属(Saccharomyces));菌藻门(Mycophycophyta)(地衣);接合菌门(Zygomycota)(接合菌);以及不完全菌门(Deuteromycota)。靶多核糖核苷酸的合适的来源包括植物界的成员,包括但不限于以下任意分类的成员:苔藓植物门(Bryophyta)(例如,藓类);角苔门(Anthocerotophyta)(例如,角藓);苔类(Hepaticophyta)(例如,地钱);石松植物门(Lycophyta)(例如,石松类);楔叶植物门(Sphenophyta)(例如,木贼);裸蕨类(Psilophyta)(例如,松叶蕨);瓶尔小草门(Ophioglossophyta);蕨类门(Pterophyta)(例如,厥类植物);苏铁门(Cycadophyta);银杏门(Gingkophyta);松柏门(Pinophyta);买麻藤门(Gnetophyta);以及木兰门(Magnoliophyta)(例如,显花植物)。靶多核糖核苷酸的合适的来源包括动物界的成员,包括但不限于以下任意门的成员:多孔动物门(Porifera)(海绵动物);扁盘动物门(Placozoa);直泳虫门(Orthonectida)(海洋无脊椎动物的寄生虫);菱形虫门(Rhombozoa);刺胞动物门(Cnidaria)(珊瑚、海葵、水母、海笔、海肾、海黄蜂);栉水母类(Ctenophora)(栉水母);扁形动物门(Platyhelminthes)(扁形虫);纽形动物门(Nemertina)(纽形动物类);颚胃动物门(Ngathostomulida)(颚胃动物);腹毛纲(Gastrotricha);轮虫纲(Rotifera);三部虫门(Priapulida);动吻纲(Kinorhyncha);铠甲动物门(Loricifera);棘头动物门(Acanthocephala);内肛动物门(Entoprocta);线虫门(Nemotoda);线形虫动物门(Nematomorpha);环口动物门(Cycliophora);软体动物门(Mollusca)(软体动物);星虫动物门(Sipuncula)(花生蠕虫);环节动物门(Annelida)(分节蠕虫);缓步动物门(Tardigrada)(北极熊);有爪动物门(Onychophora)(天鹅绒虫);节肢动物门(Arthropoda)(包括以下亚门:有螯肢亚门(Chelicerata)、多足纲(Myriapoda)、六足纲(Hexapoda)和甲壳纲(Crustacea),其中有螯肢亚门包括:例如,蛛形纲(arachnids)、肢口纲(Merostomata)和海蜘蛛亚门(Pycnogonida),其中多足纲包括:例如,唇足纲(Chilopoda)(唇足类)、倍足纲(Diplopoda)(千足虫)、少足纲(Paropoda)和综合纲(Symphyla),其中六足纲包括昆虫,以及其中甲壳纲包括虾、磷虾、贝属动物等);帚虫动物门(Phoronida);外肛动物门(Ectoprocta)(苔藓虫);腕足动物门(Brachiopoda);棘皮动物门(Echinodermata)(例如海星、海菊花、毛头星、海胆、海参、海蛇尾、brittlebaskets等);毛颚动物门(Chaetognatha)(矢虫);半索动物门(Hemichordata)(囊舌虫);以及脊索动物门(Chordata)。脊索动物门的合适的成员包括以下亚门的任何成员:尾索动物(Urochordata)(海鞘;包括海鞘纲(Ascidiacea)、海樽纲(Thaliacea)和幼形纲(Larvacea));头索亚门(Cephalochordata)(文昌鱼);盲鳗纲(Myxini)(粘盲鳗);以及脊椎动物门(Vertebrata),其中脊椎动物门的成员包括:例如,七鰓鳗纲(Petromyzontida)(七鳃鳗)、软骨鱼纲(Chondrichthyces)(软骨鱼)、辐鳍亚纲(Actinopterygii)(辐鰭鱼)、Actinista(空棘鱼亚目)、肺鱼纲(Dipnoi)(肺鱼)、爬行纲(Reptilia)(爬行类,例如蛇、短吻鳄、鳄鱼、蜥蜴等)、鸟纲(Aves)(鸟)和哺乳纲(哺乳动物)的成员。合适的植物包括任何单子叶植物和任何双子叶植物。因此,例如,靶多核糖核苷酸可存在于来自生物体的细胞或从来自生物体的细胞获得,该生物体包括但不限于:原生动物、植物、真菌、藻类细胞、酵母、爬行动物、两栖动物、哺乳动物、海洋微生物、海洋无脊椎动物、节肢动物、等足类动物、昆虫、蛛形纲动物、古生细菌以及真细菌。靶多核糖核苷酸可以存在于非人胚胎中或由非人胚胎获得,例如果蝇(Drosophila)胚胎、斑马鱼胚胎、小鼠胚胎等。靶多核糖核苷酸可以存在于干细胞中或由干细胞获得,例如,体外干细胞、非人干细胞等。合适的干细胞包括胚胎干细胞、成体干细胞和诱发多能性干(iPS)细胞。在一些实施方案中,将靶多核糖核苷酸从生物体中取得的组织、从生物体中分离的特定细胞或细胞组等中分离。例如,在生物体是植物的情况下,在一些实施方案中,靶多核糖核苷酸将从木质部、韧皮部、形成层、叶、根等中分离。在生物体是动物的情况下,在一些实施方案中,靶多核糖核苷酸将从特定组织(例如,肺、肝脏、心脏、肾脏、脑、脾脏、皮肤、胎儿组织等)或特定细胞类型(例如,神经细胞、上皮细胞、内皮细胞、星形细胞、巨噬细胞、胶质细胞、胰岛细胞、T淋巴细胞、B淋巴细胞等)中分离。调节靶RNA生成的方法本公开提供调节细胞中靶RNA生成的方法。本方法通常包括使遗传修饰的宿主细胞与活化诱导型启动子的试剂接触,其中遗传修饰的宿主细胞被重组表达载体遗传修饰,该重组表达载体包含编码酶的核苷酸序列,该酶催化底物多核糖核苷酸中序列特异性裂解位点处的裂解,其中编码酶的核苷酸序列可操作连接至诱导型启动子,并且其中活化诱导型启动子后,酶在细胞中生成并且从前体RNA中裂解所述靶RNA。图10提供调节靶RNA生成的示例性方法的示意性说明。在图10中,内源性靶RNA被修饰以在3′非翻译区(3′UTR)中包括Csy4RNA底物(例如,GUUCACUGCCGUAUAGGCAG(SEQIDNO:103);或者SEQIDNO:1)。在宿主细胞中Cys4表达导致RNA底物的结合和裂解。裂解的RNA现缺乏其polyA尾且将被降解。例如,在一些实施方案中,本公开提供调节真核细胞中靶RNA的生成的方法,其中该方法包括使遗传修饰的宿主细胞与活化诱导型启动子的试剂接触,其中遗传修饰的宿主细胞被重组表达载体遗传修饰,该重组表达载体包含编码酶活性序列特异性Csy4核糖核酸内切酶的核苷酸序列,该酶活性序列特异性Csy4核糖核酸内切酶催化在底物多核糖核苷酸中序列特异性裂解位点处的裂解,其中编码酶的核苷酸序列可操作连接至诱导型启动子,并且其中活化所述诱导型启动子后,酶在所述细胞中生成并且从前体RNA中裂解所述靶RNA。在一些情况下,靶RNA种类是调控RNA。在一些情况下,从前体RNA中裂解靶RNA使前体RNA失活。合适的序列特异性核糖核酸内切酶是酶活性、序列特异性核糖核酸内切酶。适合在调节靶RNA生成的主题方法中使用的核糖核酸内切酶包括以序列特异性方式结合和裂解底物多核糖核苷酸、包括酶活性多肽并且与图4中所示的氨基酸序列(Csy4氨基酸序列)具有至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%氨基酸序列同一性的核糖核酸内切酶。适合在调节靶RNA生成的主题方法中使用的核糖核酸内切酶包括以序列特异性方式结合和裂解底物多核糖核苷酸、包括酶活性多肽并且与图5所示的氨基酸序列(Csy4氨基酸序列)具有至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%氨基酸序列同一性的核糖核酸内切酶。图5提供由各种核糖核酸内切酶特异性结合的序列。适合在调节靶RNA生成的主题方法中使用的核糖核酸内切酶包括以序列特异性方式结合和裂解底物多核糖核苷酸、包括酶活性多肽并且通过1至20(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20)个氨基酸取代和/或插入和/或缺失而与图4或5中任一图中所示的氨基酸序列不同的核糖核酸内切酶。合适的诱导型启动子可包括在真核细胞中发挥功能的启动子。合适的诱导型启动子是本领域已知的。例如,合适的诱导型启动子包括但不限于:GAL1启动子、GAL10启动子、ADH2启动子、PHO5启动子、CUP1启动子、GAL7启动子、MET25启动子、MET3启动子、CYC1启动子、HIS3启动子、ADH1启动子、PGK启动子、GAPDH启动子、ADC1启动子、TRP1启动子、URA3启动子、LEU2启动子、ENO启动子、TP1启动子和AOX1。合适的诱导型启动子包括四环素-诱导型启动子;金属硫蛋白启动子;四环素-诱导型启动子;甲硫氨酸-诱导型启动子;以及半乳糖-诱导型启动子,这些启动子是本领域熟知的。其他合适的启动子包括ADH2乙醇脱氢酶启动子(在葡萄糖中被抑制;当葡萄糖耗尽并且产生乙醇时被诱导)以及CUP1金属硫蛋白启动子(在Cu2+、Zn2+的存在下诱导)。诱导任何给定诱导型启动子的试剂是本领域已知的。例如,通过四环素或强力霉素可调节四环素-可调控的启动子;糖类可用于诱导糖类-诱导型启动子(例如,用于半乳糖-诱导型启动子的半乳糖);甲硫氨酸可用于诱导甲硫氨酸-诱导型启动子;金属可用于诱导金属硫蛋白启动子。靶RNA可以为调控RNA。调节RNA是本领域熟知的并且包括例如微-RNA、短发夹RNA(shRNAs)等。在一些实施方案中,来自前体RNA的靶RNA的裂解使前体RNA失活。遗传修饰的宿主细胞可以为体外细胞,例如,原核细胞或真核细胞(例如,哺乳动物细胞,包括原生细胞、转化细胞系等)。遗传修饰的宿主细胞可以为体内细胞。在一些实施方案中,体内细胞是非人细胞。遗传修饰的宿主细胞可以为多细胞生物体的细胞(或可由多细胞生物体的细胞获得)。遗传修饰的宿主细胞可以是由六界中任一种的生物体中获得或者存在于六界中任一的生物体中的细胞,例如,细菌界(例如,真细菌界);原始细菌;原生生物界;真菌界;植物界;和动物界。合适的生物体包括原生生物界的类似植物的成员,包括但不限于藻类(例如,绿藻、红藻、灰胞藻、蓝细菌);原生生物界的类似真菌的成员,例如,粘菌、水霉等;原生生物界的类似动物的成员,例如,鞭毛类(例如,眼虫属)、变形虫(例如,阿米巴)、孢子虫(例如,顶复亚门、粘原虫门、微孢子目)和纤毛虫(例如,草履虫)。合适的生物体包括真菌界的成员,包括但不限于以下任意门的成员:担子菌亚门(珊瑚菌;例如,蘑菇属、鹅膏属、牛肝菌属、鸡油菌属等的成员);子囊菌亚门(子囊菌,包括例如,酵母菌属);菌藻门(地衣);接合菌门(接合菌);以及不完全菌门。合适的生物体包括植物界的成员,包括但不限于以下任意分类的成员:苔藓植物门(例如,藓类);角苔门(例如,角藓);苔类(Hepaticophyta)(例如,地钱);石松植物门(例如,石松类);楔叶植物门(例如,木贼);裸蕨类(例如,松叶蕨);瓶尔小草门;蕨类门(例如,厥类植物);苏铁门;银杏门(Gingkophyta);松柏门;买麻藤门;和木兰门(例如,显花植物)。合适的生物体包括动物界的成员,包括但不限于以下任意门的成员:多孔动物门(海绵动物);扁盘动物门;直泳虫门(海洋无脊椎动物的寄生虫);菱形虫门;刺胞动物门(珊瑚、海葵、水母、海笔、海肾、海黄蜂);栉水母类(栉水母);扁形动物门(扁形虫);纽形动物门(纽虫);颚胃动物门(颚胃动物);腹毛纲;轮虫纲;三部虫门;动吻纲;铠甲动物门;棘头动物门;内肛动物门;线虫门;线形虫动物门;环口动物门;软体动物门(软体动物);星虫动物门(花生蠕虫);环节动物门(分节蠕虫);缓步动物门(北极熊);有爪动物门(天鹅绒虫);节肢动物门(包括以下亚门:有螯肢亚门、多足纲、六足纲和甲壳纲,其中有螯肢亚门包括:例如,蛛形纲、肢口纲和海蜘蛛亚门;其中多足纲包括:例如,唇足纲(唇足类)、倍足纲(千足虫)、少足纲和综合纲;其中六足纲包括昆虫,以及其中甲壳纲包括虾、磷虾、贝属动物等);帚虫动物门;外肛动物门(苔藓虫);腕足动物门;棘皮动物门(例如海星、海菊花、毛头星、海胆、海参、海蛇尾、brittlebaskets等);毛颚动物门(矢虫);半索动物门(囊舌虫);以及脊索动物门。脊索动物门的合适的成员包括以下亚门的任何成员:尾索动物(海鞘;包括海鞘纲、海樽纲和幼形纲);头索亚门(文昌鱼);盲鳗纲(粘盲鳗);以及脊椎动物门,其中脊椎动物门的成员包括:例如,七鰓鳗纲(七鳃鳗)、软骨鱼纲(软骨鱼)、辐鳍亚纲(辐鰭鱼)、Actinista(空棘鱼亚目)、肺鱼纲(肺鱼)、爬行纲(爬行类,例如蛇、短吻鳄、鳄鱼、蜥蜴等)、鸟纲(鸟)和哺乳纲(哺乳动物)的成员。合适的植物包括任何单子叶植物和任何双子叶植物。因此,例如,遗传修饰的宿主细胞可以是由以下获得或存在于以下中的细胞:原生动物、植物、真菌、藻类细胞、酵母、爬行动物、两栖动物、哺乳动物、海洋微生物、海洋无脊椎动物、节肢动物、等足类动物、昆虫、蛛形纲动物、古生细菌以及真细菌。合适的哺乳动物细胞包括原生细胞和无限增殖化细胞系。合适的哺乳动物细胞系包括人细胞系、非人灵长类细胞系、啮齿类(例如,小鼠、大鼠)细胞系等。合适的哺乳动物细胞系包括但不限于:海拉细胞(例如,美国模式培养物保藏所(ATCC)编号CCL-2)、CHO细胞(例如,ATCC编号CRL9618、CCL61、CRL9096)、293细胞(例如,ATCC编号CRL-1573)、Vero细胞、NIH3T3细胞(例如,ATCC编号CRL-1658)、Huh-7细胞、BHK细胞(例如,ATCC编号CCL10)、PC12细胞(ATCC编号CRL1721)、COS细胞、COS-7细胞(ATCC编号CRL1651)、RATI细胞、小鼠L细胞(ATCC编号CCLI.3)、人胚胎肾(HEK)细胞(ATCC编号CRL1573)、HLHepG2细胞等。遗传修饰的宿主细胞可以是由非人胚胎获得或存在于非人胚胎中的细胞,例如,果蝇胚胎;斑马鱼胚胎;小鼠胚胎等。遗传修饰的宿主细胞可以为干细胞,例如,体外干细胞;非人干细胞等。合适的干细胞包括胚胎干细胞、成体干细胞和诱发多能性干(iPS)细胞。分离靶核酸的方法本公开提供从核酸的混合群中分离靶核酸的方法。本方法通常包括:a)使核酸的混合群与固定的序列特异性、无酶活性核糖核酸内切酶接触,其中核酸的混合群包括靶核酸,该靶核酸包含由固定的序列特异性、无酶活性核糖核酸内切酶特异性结合的“标记”(或“识别”)核苷酸序列,使得包含标记核苷酸序列(“标记的靶核酸”)的靶核酸结合固定的序列特异性、无酶活性核糖核酸内切酶,形成标记的靶核酸/固定的序列特异性、酶活性核糖核酸内切酶复合物,其中接触步骤发生在液体溶液(“结合溶液”)中;以及b)将咪唑加入液体溶液至约100mM至约500mM的最终浓度(例如,约100mM至约150mM、约150mM至约200mM、约200mM至约250mM、约250mM至约300mM、约300mM至约350mM、约350mM至约400mM、约400mM至约450mM或约450mM至约500mM),从而形成酶再活化无酶活性核糖核酸内切酶的再活化溶液,使得核糖核酸内切酶变得具有酶活性并且从“标记”核苷酸序列中裂解靶核酸,从而释放靶核酸。图9是用于分离靶RNA的主题方法的示例性实施方案示意图。本方法可进一步包括一个或多个洗涤步骤。例如,在步骤(a)之后以及在步骤(b)之前,可使用结合溶液将包含结合的靶核酸的固定的序列特异性、无酶活性核糖核酸内切酶洗涤一次或多次,该结合的靶核酸包含“标记”核苷酸序列,使得靶核酸保持与序列特异性、无酶活性核糖核酸内切酶结合,并且将任何未结合的核酸洗涤掉。核酸的混合群可包括RNA和DNA。靶核酸是包含由序列特异性核糖核酸内切酶来特异性结合的“标记””或“识别”核苷酸序列的RNA。在其无酶活性状态(“未诱导的”状态)下,核糖核酸内切酶可结合、但不可裂解标记的靶RNA。在其酶活性状态(“诱导的”状态)下(例如,在约100mM至约500mM的浓度的咪唑存在下),核糖核酸内切酶可结合和裂解标记的靶核酸中的识别核苷酸序列,从而从标记中释放靶核酸。结合溶液可包括缓冲剂和盐;但没有咪唑。再活化溶液可包括最终浓度为约100mM至约500mM(例如,约100mM至约150mM、约150mM至约200mM、约250mM至约350mM、约350mM至约400mM或约400mM至约500mM)的咪唑。咪唑的存在再活化序列特异性、无酶活性核糖核酸内切酶,使得核糖核酸内切酶变得具有酶活性,例如,核糖核酸内切酶表现出至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%或大于95%的野生型序列特异性核糖核酸内切酶(例如,如图5中所示的氨基酸序列(例如,SEQIDNO:6、8、或9))。如一个非限制性例子中,序列特异性、无酶活性核糖核酸内切酶是Csy4的H29A突变体(如下所描述;以及如在图6中所示);如上所述,使Csy4(H29A)突变体与咪唑接触;再活化核糖核酸内切酶,使得它能够以序列特异性方式裂解靶核糖核酸中的识别序列。也适合使用的是Csy4的H29A、S50C双重突变体(如下所描述)。在一些实施方案中,“标记”或识别序列包含核苷酸序列5′-GUUCACUGCCGUAUAGGCAGCUAAGAAA-3′(SEQIDNO:1)。使用标准重组方法可将“标记”或“识别”核苷酸序列引入核酸。因此,标记的靶核酸将包括酶裂解的标记,从而释放靶核酸。在一些实施方案中,标记的靶核酸(RNA)将具有结合至其的一个或多个多肽。具有结合至其的一个或多个多肽的标记的靶RNA在本文中称为RNA蛋白复合物。因此,在一些实施方案中,使用主题方法分离的靶RNA是RNA蛋白复合物。在一些实施方案中,主题方法可进一步包括分析结合至分离的靶RNA的多肽。主题方法提供分离靶RNA(或RNA蛋白复合物)。在一些实施方案中,主题方法提供纯化靶RNA(或RNA蛋白复合物),使得靶RNA(或RNA蛋白复合物)至少约50%纯、至少约60%纯、至少约70%纯、至少约80%纯、至少约90%纯、至少约95%纯、至少约98%纯或大于98%纯。在一些实施方案中,在靶RNA/蛋白复合物中结合靶RNA的蛋白质可从RNA/蛋白复合物中洗脱。通过例如测序、酶消化、功能测定等可进一步对洗脱的蛋白质进行表征。核酸的混合群可存在于细胞裂解物中。例如,将包含编码标记的靶RNA的核苷酸序列的表达载体引入细胞(例如,体外或体内),使得细胞合成标记的靶RNA。从细胞中产生裂解物,并且将裂解物(任选地经过一个或多个步骤以使富集核酸)施加至固定的序列特异性、无酶活性核糖核酸内切酶。可将序列特异性、无酶活性的核糖核酸内切酶固定在多种不溶性支撑物的任何一种上。合适的不溶性支撑物包括但不限于琼脂糖珠、磁珠、试验条、多孔平皿等。不溶性支撑物可包括各种物质(玻璃、聚苯乙烯、聚氯乙烯、聚丙烯、聚乙烯、聚碳酸酯、葡聚糖、尼龙、直链淀粉、天然和修饰的纤维素、聚丙烯酰胺、琼脂糖和磁铁)以及可以各种形式来提供,包括例如,琼脂糖珠、聚苯乙烯珠、乳胶珠、磁珠、胶态金属粒子、玻璃和/或硅片以及表面、硝化纤维条带、尼龙膜、薄片、反应盘的孔(例如,多孔板)、塑料管等。本公开也提供分离结合靶RNA的多肽的方法,其中该方法包括:a)使固定的复合物与液体溶液接触,该液体溶液包含结合靶RNA的多肽,其中固定的复合物包含变体Csy4核糖核酸内切酶和标记的靶RNA,该标记的靶RNA包含由变体Csy4核糖核酸内切酶特异性结合的识别核苷酸序列,其中所述接触导致多肽与靶RNA结合,其中所述接触在没有咪唑的结合溶液中进行;以及b)洗脱结合的多肽。核糖核酸内切酶本公开提供序列特异性核糖核酸内切酶。在一些实施方案中,本公开提供结合靶多核糖核苷酸中的识别序列,但不裂解靶多核糖核苷酸的序列特异性核糖核酸内切酶,即,序列特异性核糖核酸内切酶无水解靶多核糖核苷酸的酶活性。在一些实施方案中,本公开提供结合靶多核糖核苷酸中的识别序列,并且裂解在识别序列内或靠近识别序列的靶多核糖核苷酸的序列特异性核糖核酸内切酶,即,序列特异性核糖核酸内切酶具有水解靶多核糖核苷酸的酶活性。在一些实施方案中,将主题序列特异性核糖核酸内切酶固定在不溶性底物上。合适的不溶性底物包括但不限于琼脂糖珠、磁珠、试验条、多孔平皿等。不溶性底物可包括多种物质(玻璃、聚苯乙烯、聚氯乙烯、聚丙烯、聚乙烯、聚碳酸酯、葡聚糖、尼龙、直链淀粉、天然和修饰的纤维素、聚丙烯酰胺、琼脂糖和磁铁)并且可以各种形式来提供,包括例如,琼脂糖珠、聚苯乙烯珠、乳胶珠、磁珠、胶态金属粒子、玻璃和/或硅片以及表面、硝化纤维条带、尼龙膜、薄片、反应盘的孔(例如,多孔板)、塑料管等。无酶活性、序列特异性核糖核酸内切酶本公开提供无酶活性、序列特异性核糖核酸内切酶,其中无酶活性、序列特异性核糖核酸内切酶以序列特异性方式结合多核糖核苷酸中的靶序列。主题无酶活性、序列特异性核糖核酸内切酶以序列特异性方式结合靶多核糖核苷酸,但不裂解靶多核糖核苷酸。如上所述,主题无酶活性、序列特异性核糖核酸内切酶用于从核酸的混合群中分离靶RNA。在一些实施方案中,与天然存在的酶活性Csy4、CasE或Cas6多肽相比,主题无酶活性、序列特异性核糖核酸内切酶包含一个或多个氨基酸取代。在一些实施方案中,主题无酶活性、序列特异性核糖核酸内切酶包含在Csy4多肽的His-29处或在CasE或者Cas6多肽的等同位置处的氨基酸取代。在一些实施方案中,主题无酶活性、序列特异性核糖核酸内切酶包含在Csy4多肽的Ser-148处或者在CasE或者Cas6多肽的等同位置处的氨基酸取代。图6示出合适的无酶活性、序列特异性核糖核酸内切酶氨基酸序列的非限制性例子。在一些实施方案中,主题无酶活性、序列特异性核糖核酸内切酶包含与图6示出的氨基酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%氨基酸序列同一性的氨基酸序列,其中氨基酸序列包括在His-29、Ser-50或者His-29和Ser-50处的取代。例如,变体Csy4核糖核酸内切酶可包括H29A(His-29至Ala-29)取代、S50C(Ser-50至Cys-50)取代或者H29A和S50C取代。在一些实施方案中,主题无酶活性、序列特异性核糖核酸内切酶是变体Csy4核糖核酸内切酶。在一些情况下,主题变体Csy4核糖核酸内切酶包含与图6所示的氨基酸序列具有至少约95%氨基酸序列同一性的氨基酸序列,其中核糖核酸内切酶包含在His-29处的氨基酸取代,其中在缺乏咪唑时,变体Csy4核糖核酸内切酶无酶活性,并且其中在咪唑存在下,变体Csy4核糖核酸内切酶可活化。在一些例子中,氨基酸取代是His29至Ala29取代。在一些情况下,变体Csy4核糖核酸内切酶也包括Ser-50取代。在一些例子中,主题变体Csy4核糖核酸内切酶结合包含核苷酸序列5′-GUUCACUGCCGUAUAGGCAGCUAAGAAA-3′(SEQIDNO:1)的RNA底物。主题无酶活性、序列特异性核糖核酸内切酶是“有条件地”无酶活性,例如,在没有咪唑下,主题无酶活性、序列特异性核糖核酸内切酶(例如,主题变体Csy4核糖核酸内切酶)无酶活性;以及通过咪唑可活化无酶活性、序列特异性核糖核酸内切酶(例如,主题变体Csy4核糖核酸内切酶)。例如,通过使核糖核酸内切酶与浓度为约100mM至约500mM的咪唑接触可酶促活化无酶活性、序列特异性核糖核酸内切酶(例如,主题变体Csy4核糖核酸内切酶)。咪唑(例如,浓度范围为约100mM至约500mM)的存在再活化序列特异性、无酶活性核糖核酸内切酶,使得核糖核酸内切酶变得具有酶活性,例如,核糖核酸内切酶表现出至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%或大于95%的野生型序列特异性核糖核酸内切酶(例如,如图5所示的氨基酸序列(例如,SEQIDNO:6、8、或9))。在一些实施方案中,主题无酶活性、序列特异性核糖核酸内切酶(例如,主题变体Csy4核糖核酸内切酶)包含可检测标记,该可检测标记包括提供可检测信号的部分。合适的可检测标记和/或提供可检测信号的部分包括但不限于:酶、放射性同位素、FRET对的成员、特异性结合对的成员、荧光团、荧光蛋白、量子点等。适合使用的FRET对(供体/受体)包括但不限于:EDANS/荧光素、IAEDANS/荧光素、荧光素/四甲基若丹明、荧光素/Cy5、IEDANS/DABCYL、荧光素/QSY-7、荧光素/LCRed640、荧光素/Cy5.5和荧光素/LCRed705。此外,可使用荧光团/量子点供体/受体对。合适的荧光团(“荧光标记”)包括通过它的固有荧光性能可被检测的任何分子,其包括激发后即可检测的荧光。合适的荧光标记包括但不限于:荧光素、若丹明、四甲基若丹明、伊红、赤藓红、香豆素、甲基-香豆素、芘、孔雀石绿、芪、萤光黄、CascadeBlueTM、TexasRed、IAEDANS、EDANS、BODIPYFL、LCRed640、Cy5、Cy5.5、LCRed705和OregonGreen。合适的光学染料描述在2002年MolecularProbesHandbook,第9版,RichardP.Haugland中,其以引用方式明确并入。合适的酶包括但不限于辣根过氧化物酶、萤光素酶、β-半乳糖苷酶等。合适的荧光蛋白包括但不限于绿色荧光蛋白(GFP),例如,如美国专利号6,066,476;6,020,192;5,985,577;5,976,796;5,968,750;5,968,738;5,958,713;5,919,445;5,874,304中所描述的来自维多利亚多管发光水母(Aequoriavictoria)或者其突变体或衍生物的GFP;红色荧光蛋白;黄色荧光蛋白;如Matz等(1999)NatureBiotechnol.17:969-973描述的来自珊瑚虫种类的多种荧光和有色蛋白的任一种等。合适的纳米粒子包括例如量子点(QD)、荧光或冷光纳米粒子和磁纳米粒子。可检测纳米粒子的任意光学或磁性能或特征。QD和它们的合成方法是本领域熟知的(参见,例如,美国专利号6,322,901;6,576,291;和6,815,064)。通过施加包含多种不同材料的涂层可使QD为水溶性的(参见,例如,美国专利号6,423,551;6,251,303;6,319,426;6,426,513;6,444,143;和6,649,138)。例如,使用两性聚合物来溶解QD。已经使用的示例性聚合物包括经辛胺修饰的低分子量聚丙烯酸、由聚乙二醇(PEG)衍生的磷脂、聚酐、嵌段共聚物等。通过大量不同官能团或连接剂中的任何一种可使QD与多肽缀合,所述官能团或连接剂可直接或间接连接涂层(参见,例如,美国专利号5,990,479;6,207,392;6,251,303;6,306,610;6,325,144;和6,423,551)。具有多种吸收和发射光谱的QD可从例如QuantumDotCorp.(HaywardCalif.;现属于Invitrogen)或者从EvidentTechnologies(Troy,N.Y.)商购。例如,可获得峰值发射波长为约525、535、545、565、585、605、655、705和800nm的QD。因此,QD可具有穿过光谱的可见部分并且在一些情况下甚至超过的一系列不同颜色。合适的放射性同位素包括但不限于14C、3H、32P、33P、35S、1251和131I。用作标记的放射性同位素的使用是本领域熟知的。在一些实施方案中,将主题无酶活性、序列特异性核糖核酸内切酶(例如,主题变体Csy4核糖核酸内切酶)固定在不溶性底物上。合适的不溶性底物包括但不限于琼脂糖珠、磁珠、试验条、多孔平皿等。不溶性底物可包括多种物质(玻璃、聚苯乙烯、聚氯乙烯、聚丙烯、聚乙烯、聚碳酸酯、葡聚糖、尼龙、直链淀粉、天然和修饰的纤维素、聚丙烯酰胺、琼脂糖和磁铁)并且可以各种形式来提供,包括例如,琼脂糖珠、聚苯乙烯珠、乳胶珠、磁珠、胶态金属粒子、玻璃和/或硅片以及表面、硝化纤维条带、尼龙膜、薄片、反应盘的孔(例如,多孔板)、塑料管等。在一些实施方案中,将主题无酶活性、序列特异性核糖核酸内切酶(例如,主题变体Csy4核糖核酸内切酶)纯化至例如,至少80%纯、至少85%纯、至少90%纯、至少95%纯、至少98%纯、至少99%纯或大于99%纯。组合物本公开提供包含主题序列特异性、无酶活性核糖核酸内切酶的组合物。除主题序列特异性、无酶活性核糖核酸内切酶之外,主题组合物可包含以下一种或多种:盐,例如NaCl、MgCl、KCl、MgSO4等;缓冲剂,例如,Tris缓冲剂、N-(2-羟乙基)哌嗪-N′-(2-乙磺酸)(HEPES)、2-(N-吗啉代)乙磺酸(MES)、2-(N-吗啉代)乙磺酸钠盐(MES)、3-(N-吗啉代)丙磺酸(MOPS)、N-三[羟甲基]甲基-3-氨基丙磺酸(TAPS)等;增溶剂;去污剂,例如非离子去污剂,例如Tween-20等;蛋白酶抑制剂等。酶活性序列特异性核糖核酸内切酶在一些实施方案中,主题酶活性序列特异性核糖核酸内切酶包含提供检测的部分。例如,主题酶活性序列特异性核糖核酸内切酶可包含提供检测的共价或非共价连接的部分。合适的可检测标记包括通过光谱、光化学、生物化学、免疫化学、电学、光学或化学方法可检测的任何组合物。提供检测的部分包括但不限于:荧光分子;量子点;酶(不是核糖核酸内切酶),其中酶催化底物转化至可检测的产物,其中产物可直接检测;纳米粒子等。可连接至主题酶活性序列特异性核糖核酸内切酶的合适的荧光蛋白包括但不限于:绿色荧光蛋白(GFP),例如美国专利号6,066,476;6,020,192;5,985,577;5,976,796;5,968,750;5,968,738;5,958,713;5,919,445;5,874,304中所描述的来自维多利亚多管发光水母或者其突变体或衍生物的GFP;红色荧光蛋白;黄色荧光蛋白;如Matz等(1999)NatureBiotechnol.17:969-973描述的来自珊瑚虫种类的多种荧光和有色蛋白的任一种等。合适的纳米粒子包括例如量子点(QD);荧光或冷光纳米粒子;和磁纳米粒子。可检测纳米粒子的任何光学或磁性能或特征。QD和它们合成的方法是本领域熟知的(参见,例如,美国专利号6,322,901;6,576,291;和6,815,064)。通过施加包含多在不同材料的涂层可使QD溶于水中(参见,例如,美国专利号6,423,551;6,251,303;6,319,426;6,426,513;6,444,143;和6,649,138)。例如,使用两性聚合物来溶解QD。已经使用的示例性聚合物包括经辛胺修饰的低分子量聚丙烯酸、由聚乙二醇(PEG)衍生的磷脂、聚酐、嵌段共聚物等。通过大量不同官能团或连接剂中的任何一种可使QD与多肽缀合,该官能团或连接剂可直接或间接连接涂层(参见,例如,美国专利号5,990,479;6,207,392;6,251,303;6,306,610;6,325,144;和6,423,551)。具有多种吸收和发射光谱的QD可从例如QuantumDotCorp.(HaywardCalif.;现属于Invitrogen)或者从EvidentTechnologies(Troy,N.Y.)商购。例如,可获得峰值发射波长为约525、535、545、565、585、605、655、705和800nm的QD。因此,QD可具有穿过光谱的可见部分以及在一些情况下甚至超过的一系列不同颜色。在一些实施方案中,将主题酶活性、序列特异性核糖核酸内切酶纯化至例如,至少80%纯、至少85%纯、至少90%纯、至少95%纯、至少98%纯、至少99%纯或大于99%纯。组合物本公开提供包含主题序列特异性、酶活性核糖核酸内切酶的组合物。除主题序列特异性、酶活性核糖核酸内切酶之外,主题组合物可包含以下一种或多种:盐,例如NaCl、MgCl、KCl、MgSO4等;缓冲剂,例如,Tris缓冲剂、N-(2-羟乙基)哌嗪-N′-(2-乙磺酸)(HEPES)、2-(N-吗啉代)乙磺酸(MES)、2-(N-吗啉代)乙磺酸钠盐(MES)、3-(N-吗啉代)丙磺酸(MOPS)、N-三[羟甲基]甲基-3-氨基丙磺酸(TAPS)等;增溶剂;去污剂,例如非离子去污剂,例如Tween-20等;蛋白酶抑制剂等。本公开提供包含主题序列特异性、无酶活性核糖核酸内切酶(例如,主题变体Csy4核糖核酸内切酶)的组合物。除主题序列特异性、无酶活性核糖核酸内切酶(例如,主题变体Csy4核糖核酸内切酶)之外,主题组合物可包含以下一种或多种:盐,例如NaCl、MgCl、KCl、MgSO4等;缓冲剂,例如,Tris缓冲剂、N-(2-羟乙基)哌嗪-N′-(2-乙磺酸)(HEPES)、2-(N-吗啉代)乙磺酸(MES)、2-(N-吗啉代)乙磺酸钠盐(MES)、3-(N-吗啉代)丙磺酸(MOPS)、N-三[羟甲基]甲基-3-氨基丙磺酸(TAPS)等;增溶剂;去污剂,例如非离子去污剂,例如Tween-20等;蛋白酶抑制剂等。在一些实施方案中,组合物没有咪唑。在一些实施方案中,组合物包含浓度为约100mM至约500mM的咪唑。制备主题序列特异性核糖核酸内切酶的方法通过任何已知方法,例如,用于蛋白质合成的常规合成方法;重组DNA方法等可制备主题序列特异性核糖核酸内切酶(例如,主题序列特异性酶活性、核糖核酸内切酶;主题序列特异性、无酶活性核糖核酸内切酶)。在化学合成主题序列特异性核糖核酸内切酶的情况下,可通过液相或固相来进行合成。固相多肽合成(SPPS)(其中序列的C-末端氨基酸附接不溶性支撑物,随后连续加入序列中的其余氨基酸)是化学合成主题序列特异性核糖核酸内切酶的合适的方法的例子。可使用用于合成主题序列特异性核糖核酸内切酶的SPPS的各种形式,诸如Fmoc和Boc。用于固相合成的技术描述在Barany和Merrifield,Solid-PhasePeptideSynthesis;第3-284页,在Peptides:Analysis,Synthesis,Biology.第2卷:SpecialMethodsinPeptideSynthesis,PartA.;Merrifield,等J.Am.Chem.Soc,85:2149-2156(1963);Stewart等,SolidPhasePeptideSynthesis,第2版,PierceChem.Co.,Rockford,111.(1984);以及GanesanA.2006MiniRev.MedChem.6:3-10和CamareroJA等2005ProteinPeptLett.12:723-8中。标准重组方法可用于制备主题序列特异性核糖核酸内切酶。例如,将编码主题序列特异性核糖核酸内切酶的核酸插入表达载体内。编码主题序列特异性核糖核酸内切酶的DNA片段可操作连接至确保编码的多肽的表达的表达载体中的控制序列。表达控制序列包括但不限于:启动子(例如,天然相关的或异源性启动子)、信号序列、增强子元件以及转录终止序列。表达控制序列可以是能够转化或转染真核宿主细胞(例如,COS或CHO细胞)的载体中的真核启动子体系。一旦载体已经合并至恰当的宿主内,则将宿主保持在适合核苷酸序列的高水平表达的条件下,并且收集和纯化核糖核酸内切酶。核酸和宿主细胞本公开提供包含编码主题序列特异性核糖核酸内切酶(例如,主题序列特异性、酶活性核糖核酸内切酶;主题序列特异性、无酶活性核糖核酸内切酶)的核苷酸序列的核酸。在一些实施方案中,核酸是表达载体,其中表达载体可提供例如在细胞中产生序列特异性核糖核酸内切酶。编码主题序列特异性核糖核酸内切酶(例如,主题序列特异性、酶活性核糖核酸内切酶;主题序列特异性、无酶活性核糖核酸内切酶)的核苷酸序列可操作连接至一个或多个调控元件,例如启动子和增强子,该一个或多个调节元件使核苷酸序列在预期靶细胞(例如,经遗传修饰以合成编码的核糖核酸内切酶的细胞)中表达。在一些实施方案中,主题核酸包含编码具有与图4或图5所示的氨基酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%的多肽的核苷酸序列。在一些实施方案中,如上所述,主题核酸包含编码变体Csy4多肽的核苷酸序列。编码主题序列特异性核糖核酸内切酶(例如,主题序列特异性、酶活性核糖核酸内切酶;主题序列特异性、无酶活性核糖核酸内切酶)的核苷酸序列可操作连接至转录控制元件(例如,启动子、增强子等)。合适的启动子和增强子元件是本领域已知的。对于在细菌细胞中表达,合适的启动子包括但不限于:lacI、lacZ、T3、T7、gpt、λP和trc。对于在真核细胞中表达,合适的启动子包括但不限于:巨细胞病毒早期瞬时启动子(cytomegalovirusimmediateearlypromoter);单纯疱疹病毒胸苷激酶启动子;早期和晚期SV40启动子;逆转录病毒的长末端重复序列中存在的启动子;小鼠金属硫蛋白-I启动子;以及各种本领域已知组织特异性启动子。在一些实施方案中,例如,对于在酵母细胞中表达,合适的启动子是组成型启动子,例如ADH1启动子、PGK1启动子、ENO启动子、PYK1启动子等;或者调控型启动子,例如GAL1启动子、GAL10启动子、ADH2启动子、PHO5启动子、CUP1启动子、GAL7启动子、MET25启动子、MET3启动子、CYC1启动子、HIS3启动子、ADH1启动子、PGK启动子、GAPDH启动子、ADC1启动子、TRP1启动子、URA3启动子、LEU2启动子、ENO启动子、TP1启动子以及AOX1(例如,毕赤酵母属(Pichia)中使用)。恰当的载体和启动子的选择正好在本领域普通技术的水平范围内。在原核宿主细胞中使用的适合的启动子包括但不限于:噬菌体T7RNA聚合酶启动子;trp启动子;lac操纵子启动子;杂合启动子,例如,lac/tac杂合启动子、tac/trc杂合启动子、trp/lac启动子、T7/lac启动子;trc启动子;tac启动子等;araBAD启动子;体内调控启动子,例如ssaG启动子或相关的启动子(参见,例如,美国专利公开号20040131637);pagC启动子(Pulkkinen和Miller,J.Bacteriol,1991:173(1):86-93;Alpuche-Aranda等,PNAS,1992;89(21):10079-83);nirB启动子(Harborne等(1992)Mol.Micro.6:2805-2813)等(参见,例如,Dunstan等(1999)Infect.Immun.67:5133-5141;McKelvie等(2004)Vaccine22:3243-3255;以及Chatfield等(1992)Biotechnol.10:888-892);sigma70启动子,例如,共有sigma70启动子(参见,例如,GenBank登记号AX798980、AX798961和AX798183);固定相启动子,例如,dps启动、spv启动子等;由致病岛SPI-2衍生的启动子(参见,例如,W096/17951);actA启动子(参见,例如,Shetron-Rama等(2002)Infect.Immun.70:1087-1096);rpsM启动子(参见,例如,Valdivia和Falkow(1996).Mol.Microbiol.22:367);tet启动子(参见,例如,Hillen,W.和Wissmann,A.(1989),由Saenger,W.和Heinemann,U.(编著),TopicsinMolecularandStructuralBiology,Protein-NucleicacidInteraction.Macmillan,London,UK,第10卷,第143-162页);SP6启动子(参见,例如,Melton等(1984)Nucl.AcidsRes.12:7035)等。在诸如大肠杆菌的原核细胞生物中使用的合适的强启动子包括但不限于:Trc、Tac、T5、T7和Pλ。在细菌宿主细胞中使用的操纵基因的非限制性例子包括乳糖启动子操纵基因(当与乳糖接触时,LacI阻遏蛋白改变构象,从而防止LacI阻遏蛋白结合操纵基因)、色氨酸启动子操纵基因(当与色氨酸复合时,TrpR阻遏蛋白具有结合操纵基因的构象;没有色氨酸时,TrpR阻遏蛋白具有未结合操纵基因的构象)以及tac启动子操纵基因(参见,例如,deBoer等(1983)Proc.Natl.Acad.Sci.U.S.A.80:21-25)。编码主题序列特异性核糖核酸内切酶(例如,主题序列特异性、酶活性核糖核酸内切酶;主题序列特异性、无酶活性核糖核酸内切酶)的核苷酸序列可存在于表达载体和/或克隆载体中。表达载体可包括可选择标志、复制起点以及提供复制和/或维持载体的其他特征。大量合适的载体和启动子是本领域技术人员已知的;许多可商购用于产生主题重组构建体。以例子方式提供以下载体。细菌:pBs、phagescript、PsiX174、pBluescriptSK、pBsKS、pNH8a、pNH16a、pNH18a、pNH46a(Stratagene,LaJolla,Calif.,USA)、pTrc99A、pKK223-3、pKK233-3、pDR540和pRIT5(Pharmacia,Uppsala,Sweden)。真核生物:pWLneo、pSV2cat、pOG44、PXR1、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。表达载体通常具有位于靠近启动子序列的便利限制位点以提供插入编码异源性蛋白质的核酸序列。可存在在表达宿主中可操作的可选择标志。合适的表达载体包括但不限于:病毒载体(例如基于以下的病毒载体:牛痘病毒;脊髓灰质炎病毒;腺病毒(参见,例如,Li等,InvestOpthalmolVisSci35:25432549,1994;Borras等,GeneTher6:515524,1999;Li和Davidson,PNAS92:77007704,1995;Sakamoto等,HGeneTher5:10881097,1999;WO94/12649;WO93/03769;WO93/1919l;WO94/28938;WO95/11984和WO95/00655);腺伴随病毒(参见,例如,Ali等,HumGeneTher9:8186,1998,Flannery等,PNAS94:69166921,1997;Bennett等,InvestOpthalmolVisSci38:28572863,1997;Jomary等,GeneTher4:683690,1997;Rolling等,HumGeneTher10:641648,1999;Ali等,HumMolGenet5:591594,1996;Srivastava的WO93/09239;Samulski等,J.Vir.(1989)63:3822-3828;Mendelson等,Virol.(1988)166:154-165;以及Flotte等,PNAS(1993)90:10613-10617);SV40;单纯疱疹病毒;人免疫缺陷病毒(参见,例如,Miyoshi等,PNAS94:1031923,1997;Takahashi等,JVirol73:78127816,1999));逆转录病毒载体(例如,鼠白血病病毒;脾坏死病毒;以及由诸如劳氏肉瘤病毒(RousSarcomaVirus)、哈维肉瘤病毒(HarveySarcomaVirus)、禽白血病病毒、人免疫缺陷病毒、骨髓增生性肉瘤病毒和乳腺肿瘤病毒的逆转录病毒衍生的载体)等。本公开提供分离的遗传修饰的宿主细胞(例如,体外细胞),该宿主细胞经主题核酸遗传修饰。在一些实施方案中,主题分离的遗传修饰的宿主细胞可产生主题序列特异性核糖核酸内切酶(例如,主题序列特异性、酶活性核糖核酸内切酶;主题序列特异性、无酶活性核糖核酸内切酶)。合适的宿主细胞包括真核宿主细胞,诸如哺乳动物细胞、昆虫宿主细胞、酵母细胞;和原核细胞,诸如细菌细胞。例如通过磷酸钙沉淀、DEAE葡聚糖介导的转染、脂质体介导的转染、电穿孔或其他已知方法可将主题核酸引入宿主细胞。合适的哺乳动物细胞包括原生细胞和无限增殖化细胞系。合适的哺乳动物细胞系包括人细胞系、非人灵长类细胞系、啮齿类(例如,小鼠、大鼠)细胞系等。合适的哺乳动物细胞系包括但不限于:HeLa细胞(例如,美国模式培养物保藏所(ATCC)编号CCL-2)、CHO细胞(例如,ATCC编号CRL9618、CCL61、CRL9096)、293细胞(例如,ATCC编号CRL-1573)、Vero细胞、NIH3T3细胞(例如,ATCC编号CRL-1658)、Huh-7细胞、BHK细胞(例如,ATCC编号CCL10)、PC12细胞(ATCC编号CRL1721)、COS细胞、COS-7细胞(ATCC编号CRL1651)、RATI细胞、小鼠L细胞(ATCC编号CCLI.3)、人胚胎肾(HEK)细胞(ATCC编号CRL1573)、HLHepG2细胞等。合适的酵母细胞包括但不限于:巴斯德毕赤氏酵母(Pichiapastoris)、芬兰毕赤酵母(Pichiafinlandica)、喜海藻糖毕赤氏酵母(Pichiatrehalophila)、Pichiakoclamae、膜醭毕赤酵母(Pichiamembranaefaciens)、Pichiaopuntiae、耐热毕赤酵母(Pichiathermotolerans)、柳毕赤酵母(Pichiasalictaria)、Pichiaguercuum、皮杰普毕赤酵母(Pichiapijperi)、树干毕赤酵母(Pichiastiptis)、嗜甲毕赤酵母(Pichiamethanolica)、毕赤酵母(Pichiasp.)、酿酒酵母(Saccharomycescerevisiae)、酵母菌(Saccharomycessp.)、多形汉逊酵母属(Hansenulapolymorpha)、克鲁维酵母(Kluyveromycessp.)、乳酸克鲁维酵母(Kluyveromyceslactis)、白色念珠菌(Candidaalbicans)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger);米曲霉(Aspergillusoryzae)、里氏木霉(Trichodermareesei)、Chrysosporiumlucknowense、镰刀菌(Fusariumsp.)、禾谷镰孢(Fusariumgramineum)、嗜热真菌木聚糖酶(Fusariumvenenatum)、粗糙脉孢菌(Neurosporacrassa)、莱因衣藻(Chlamydomonasreinhardtii)等。合适的原核细胞包括但不限于大肠杆菌(Escherichiacoli)、乳酸杆菌(Lactobacillussp.)、沙门氏菌(Salmonellasp.)、志贺菌(Shigellasp.)等的多种实验室菌株中的任何一种。参见,例如,Carrier等(1992)J.Immunol.148:1176-1181;美国专利号6,447,784;和Sizemore等(1995)Science270:299-302。在本发明中可采用的沙门氏菌菌株的例子包括但不限于:伤寒沙门氏菌(Salmonellatyphi)和鼠伤寒沙门氏菌(S.typhimurium)。合适的志贺氏菌菌株包括但不限于:弗氏志贺氏菌(Shigellaflexneri)、宋内志贺菌(Shigellasonnei)和痢疾志贺菌(Shigelladisenteriae)。通常,实验室菌株是非病原性菌株。其他合适的细菌的非限制性例子包括但不限于:枯草杆菌(Bacillussubtilis)、恶臭假单胞菌(Pseudomonaspudita)、绿脓假单胞菌(Pseudomonasaeruginosa)、Pseudomonasmevalonii、类球红细菌(Rhodobactersphaeroides)、荚膜红细菌(Rhodobactercapsulatus)、深红红螺菌(Rhodospirillumrubrum)、红球菌属(Rhodococcussp.)等。在一些实施方案中,宿主细胞是大肠杆菌。试剂盒本公开也提供了用于测定靶多核糖核苷酸的核苷酸序列的试剂盒。本公开提供了进行底物多核糖核苷酸的序列特异性裂解的试剂盒。本公开提供了进行检测靶多核糖核苷酸中RNA序列的试剂盒。本公开提供了进行分离靶RNA的试剂盒。本公开提供了进行分离结合靶RNA的多肽的试剂盒。进行多核糖核苷酸直接测序的试剂盒进行多核糖核苷酸的直接测序的主题试剂盒至少包括主题序列特异性、无酶活性核糖核酸内切酶,其中序列特异性、无酶活性核糖核酸内切酶被纯化。在一些实施方案中,无酶活性、序列特异性核糖核酸内切酶连接至受体分子或供体分子,用于FRET检测。进行多核糖核苷酸的直接测序的主题试剂盒至少包括主题序列特异性、无酶活性核糖核酸内切酶;并且可包括一种或多种另外的组分,其中一种或多种另外的组分可以为:1)缓冲剂;2)包含确定序列的探针寡核苷酸;3)包含确定序列的探针寡核苷酸,其中探针寡核苷酸连接至受体分子或供体分子,用于FRET检测;4)用于连接至靶多核糖核苷酸的不溶性支撑物;5)阳性对照多核糖核苷酸,其中阳性对照多核糖核苷酸包含已知核苷酸序列;6)与阳性对照多核糖核苷酸的已知序列结合和形成双链体的阳性对照探针寡核苷酸。除了上述组分外,主题试剂盒可进一步包括使用试剂盒的组分以实施主题方法的说明书。实施主题方法的说明书通常记录在合适的记录介质上。例如,说明书可印刷在诸如纸张或塑料等的基材上。同样地,说明书可作为包装说明书存在于试剂盒、试剂盒或其组件(即,与包装或分包装相关)等的容器的标记中。在其他实施方案中,说明书可作为存在于诸如CD-ROM、软磁盘等的合适的计算机可读存储介质上的电子储存数据文件而存在。在又一其他实施方案中,实际的说明书未存在于试剂盒中,但提供获取来自远端来源的说明书的方法,例如通过互联网。该实施方案的例子是包括网址的试剂盒,其中可由此查看说明书和/或由此下载说明书。与说明书一样,获取说明书的该方式记录在合适的基材上。进行底物多核糖核苷酸的序列特异性裂解的试剂盒进行底物多核糖核苷酸的序列特异性裂解的主题试剂盒至少包括纯化的序列特异性核糖核酸内切酶和/或核酸,该核酸包含编码序列特异性核糖核酸内切酶的核苷酸序列。除纯化的序列特异性核糖核酸内切酶(和/或包含编码序列特异性核糖核酸内切酶的核苷酸序列的核酸)外,进行底物多核糖核苷酸的序列特异性裂解的主题试剂盒可包括一种或多种另外的组分。合适的另外的组分包括:例如,缓冲剂;用作阳性对照的多核糖核苷酸底物;多核糖核苷酸尺寸标准品;阴性对照底物等。组分可各自在单独的容器中。试剂盒可进一步包括一种或多种阳性和阴性对照。除了上述组分外,主题试剂盒可进一步包括使用试剂盒的组分以实施主题方法的说明书。实施主题方法的说明书通常记录在合适的记录介质上。例如,说明书可印刷在诸如纸张或塑料等的基材上。同样地,说明书可作为包装说明书存在于试剂盒、试剂盒或其组件(即,与包装或分包装相关)等的容器的标记中。在其他实施方案中,说明书可作为存在于诸如CD-ROM、软磁盘等的合适的计算机可读存储介质上的电子储存数据文件而存在。在又一其他实施方案中,实际的说明书未存在于试剂盒中,但提供获取来自远端来源的说明书的方法,例如通过互联网。该实施方案的例子是包括网址的试剂盒,其中可由此查看说明书和/或由此下载说明书。与说明书一样,获取说明书的该方式记录在合适的基材上。进行靶多核糖核苷酸中序列的检测的试剂盒进行靶多核糖核苷酸中序列的检测(例如,进行多核糖核苷酸的检测)的主题试剂盒可包括包含已知序列的寡核苷酸探针。在一些实施方案中,试剂盒将包括包含已知序列并包含可检测部分的寡核苷酸探针,所述可检测部分例如使用免疫测定可检测的多肽;荧光蛋白;荧光素等。试剂盒可进一步包括阳性对照多核糖核苷酸,该阳性对照多核糖核苷酸包含能够与寡核苷酸探针形成双链体的核苷酸序列。试剂盒可进一步包括酶活性、序列特异性核糖核酸内切酶,该酶活性、序列特异性核糖核酸内切酶特异性检测和裂解由寡核苷酸探针和靶多核糖核苷酸所形成的双链体。试剂盒可进一步包括一种或多种缓冲剂;用于检测可检测部分的组分;试验条等。试剂盒可进一步包括一种或多种阳性和阴性对照。除了上述组分外,主题试剂盒可进一步包括使用试剂盒的组分以实施主题方法的说明书。实施主题方法的说明书通常记录在合适的记录介质上。例如,说明书可印刷在诸如纸张或塑料等的基材上。同样地,说明书可作为包装说明书存在于试剂盒、试剂盒或其组件(即,与包装或分包装相关)等的容器的标记中。在其他实施方案中,说明书可作为存在于诸如CD-ROM、软磁盘等的合适的计算机可读存储介质上的电子储存数据文件而存在。在又一其他实施方案中,实际的说明书未存在于试剂盒中,但提供获取来自远端来源的说明书的方法,例如通过互联网。该实施方案的例子是包括网址的试剂盒,其中可由此查看说明书和/或由此下载说明书。与说明书一样,获取说明书的该方式记录在合适的基材上。进行靶RNA的分离的试剂盒进行靶RNA的分离(例如,纯化)的主题试剂盒可包括以下的一种或多种:1)主题序列特异性、无酶活性核糖核酸内切酶;2)包含“标记”核苷酸序列的表达构建体,即,由序列特异性、无酶活性核糖核酸内切酶特异性结合的核苷酸序列,其中可将编码选择靶RNA的核苷酸序列插入“标记”核苷酸序列的3′;以及3)咪唑。可将序列特异性、无酶活性核糖核酸内切酶固定在不溶性支撑物上。试剂盒可进一步包括用于使核酸的混合群与固定的序列特异性、无酶活性核糖核酸内切酶接触的液体组合物。试剂盒可进一步包括洗涤缓冲剂。试剂盒可进一步包括一种或多种阳性和阴性对照。阳性对照可包括表达载体,该表达载体包含编码标记的靶RNA的核苷酸序列,其中标记由序列特异性、无酶活性核糖核酸内切酶特异性结合。组分可各自在单独的容器中。例如,主题试剂盒可包括主题序列特异性、无酶活性核糖核酸内切酶。主题试剂盒可进一步包括重组表达载体,该重组表达载体以5′至3′的顺序以及可操作连接包含:a)编码由主题变体Csy4核糖核酸内切酶特异性结合的RNA底物的核苷酸序列;以及b)适合插入编码靶RNA的核酸的多克隆位点。编码RNA底物的核苷酸序列可操作连接至启动子。在一些例子中,启动子是诱导型启动子。RNA底物可包含核苷酸序列5′-GUUCACUGCCGUAUAGGCAGCUAAGAAA-3′(SEQIDNO:1)。在一些情况下,重组表达载体包含编码靶RNA的核苷酸序列,该核苷酸序列插入多克隆位点内。试剂盒可进一步包括没有咪唑的缓冲剂。试剂盒可进一步包括咪唑或咪唑溶液。试剂盒可进一步包括一种或多种洗涤缓冲剂。在一些情况下,试剂盒将包括阳性对照表达载体。可将变体Csy4核糖核酸内切酶固定在不溶性支撑物上,其中合适的不溶性支撑物包括但不限于琼脂糖珠、磁珠、试验条、多孔平皿等。不溶性支撑物可包括多种物质(玻璃、聚苯乙烯、聚氯乙烯、聚丙烯、聚乙烯、聚碳酸酯、葡聚糖、尼龙、直链淀粉、天然和修饰的纤维素、聚丙烯酰胺、琼脂糖和磁铁)以及可以多种形式来提供,包括例如,琼脂糖珠、聚苯乙烯珠、乳胶珠、磁珠、胶态金属粒子、玻璃和/或硅片以及表面、硝化纤维条带、尼龙膜、薄片、反应盘的孔(例如,多孔板)、塑料管等。除了上述组分外,主题试剂盒可进一步包括使用试剂盒的组分以实施主题方法的说明书。实施主题方法的说明书通常记录在合适的记录介质上。例如,说明书可印刷在诸如纸张或塑料等的基材上。同样地,说明书可作为包装说明书存在于试剂盒、试剂盒或其组件(即,与包装或分包装相关)等的容器的标记中。在其他实施方案中,说明书可作为存在于诸如CD-ROM、软磁盘等的合适的计算机可读存储介质上的电子储存数据文件而存在。在又一其他实施方案中,实际的说明书未存在于试剂盒中,但提供获取来自远端来源的说明书的方法,例如通过互联网。该实施方案的例子是包括网址的试剂盒,其中可由此查看说明书和/或由此下载说明书。与说明书一样,获取说明书的该方式记录在合适的基材上。直接对靶多核糖核苷酸进行测序的方法本公开提供直接测定靶多核糖核苷酸的核苷酸序列的方法。因此,例如,本方法无需合成靶多核糖核苷酸的聚脱氧核苷酸对应物以测定靶多核糖核苷酸的核苷酸序列。病毒诊断、个体化用药、单细胞转录物分析以及翻译图谱均是直接RNA检测和测序应用的领域。主题多核糖核苷酸测序方法以及检测多核糖核苷酸中的特定序列的主题方法应用于这些各种领域中。主题多核糖核苷酸测序方法通常包括:a)在有利于在寡核苷酸探针和靶多核糖核苷酸之间形成双链体的条件下使靶多核糖核苷酸与寡核苷酸探针接触,寡核苷酸探针包含特定已知序列和无酶活性序列特异性Csy4核糖核酸内切酶,其中无酶活性、序列特异性核糖核酸内切酶结合双链体中的特定序列;以及b)检测寡核苷酸探针和靶多核糖核苷酸之间的特异性结合,其中无酶活性、序列特异性核糖核酸内切酶与双链体的特异性结合指示靶多核糖核苷酸中特定序列的存在。在一些情况下,无酶活性、序列特异性核糖核酸内切酶连接(共价或非共价)至发射性标记。所谓“发射性标记”是指通过其固有发射性能可检测的任何分子,其包括激发后可检测的发射。合适的发射性标记包括但不限于:荧光素、若丹明、四甲基若丹明、伊红、赤藓红、香豆素、甲基-香豆素、芘、孔雀石绿、芪、萤光黄、CascadeBlueTM、TexasRed、IAEDANS、EDANS、BODIPYFL、LCRed640、Cy5、Cy5.5、LCRed705和OregonGreen。合适的光学染料描述在2002MolecularProbesHandbook,第9版,RichardP.Haugland。在一些例子中,在主题多核糖核苷酸测序方法中使用的寡核苷酸探针连接至供体分子;无酶活性、序列特异性核糖核酸内切酶连接至受体分子,并且通过荧光共振能量转移(也称为“福斯特共振能量转移(resonanceenergytransfer)”或者″FRET″)来检测双链体形成。福斯特共振能量转移(FRET)是本领域已知的现象,其中在没有发射光子下,一种发射性染料的激发转移至另一染料中。FRET对由供体发色团和受体发色团(其中受体发色团可以为猝灭剂分子)组成。供体的发射光谱和受体的吸收光谱必须重叠,并且两种分子必须紧密靠近。通过福斯特半径(radius)来定义50%的供体失活(转移能量至受体)的供体和受体之间的距离,其通常为10-100埃。可检测包含FRET对的发射光谱的改变,其表明紧密靠近(即,彼此在100埃内)的数目变化。这将通常由两种分子的结合或缔合所致,其中之一为用FRET供体标记,并且另一用FRET受体标记,其中这种结合使得FRET对紧密靠近。这些分子的结合将导致增加受体发射和/或供体荧光发射的猝灭。适合使用的FRET对(供体/受体)包括但不限于:EDANS/荧光素、IAEDANS/荧光素、荧光素/四甲基若丹明、荧光素/Cy5、IEDANS/DABCYL、荧光素/QSY-7、荧光素/LCRed640、荧光素/Cy5.5以及荧光素/LCRed705。此外,可使用荧光团/量子点供体/受体对。EDANS是(5-((2-氨基乙基)氨基)萘-1-磺酸);IAEDANS是5-({2-[(碘乙酰基)氨基]乙基}氨基)萘-1-磺酸);DABCYL是4-(4-二甲基氨基苯基)二氮烯基苯甲酸。Cy3、Cy5、Cy5.5等是花青。例如,Cy3和Cy5是花青染料家族中反应性、水溶性荧光染料。Cy3染料是红色(-550nm激发、-570nm发射,并且因而呈现绿色),而Cy5在红色区域(-650/670nm)具有荧光,但在橙色区域(-649nm)吸收。也可使用AlexaFluor染料、Dylight、IRIS染料、Seta染料、SeTau染料、SRfluor染料和Square染料。在FRET的另一方面中,可采用发射性供体分子和非发射性受体分子(“猝灭剂”)。在该申请中,当将猝灭剂放置紧密靠近供体时,供体发射将增加,并且当将猝灭剂带到紧密靠近供体时,发射将减少。有用的猝灭剂包括但不限于:DABCYL、QSY7和QSY33。有用的荧光供体/猝灭剂对包括但不限于:EDANS/DABCYL、TexasRed/DABCYL、BODIPY/DABCYL、萤光黄/DABCYL、香豆素/DABCYL和荧光素/QSY7染料。在一些情况下,无酶活性、序列特异性核糖核酸内切酶连接(共价或非共价)至标记酶。所谓“标记酶”是指在标记酶底物的存在下可反应、产生可检测的产物的酶。合适的标记酶也包括光学可检测标记(例如,在辣根过氧化物酶(HRP)的情况下)。合适的标记酶包括但不限于:HRP、碱性磷酸酶、萤光素酶、β-半乳糖苷酶以及葡糖氧化酶。使用这些底物的方法是本领域熟知的。通过酶与标记酶底物的催化反应通常可揭示标记酶的存在,从而产生可识别的产物。这些产物是不透明的(例如辣根过氧化物酶与四甲基联苯胺的反应),并且可具有各种颜色。已经开发出诸如鲁米诺(Luminol)(购自PierceChemicalCo.)的其他标记酶底物,其产生荧光反应产物。使用标记酶底物来识别标记酶的方法是本领域熟知的,并且可获得许多市售试剂盒。使用各种标记酶的例子和方法描述在Savage等,Previews247:6-9(1998),Young,J.Virol.Methods24:227-236(1989)中。在一些情况下,无酶活性、序列特异性核糖核酸内切酶包含放射性同位素。所谓“放射性同位素”是指任何放射性分子。在本发明中使用的合适的放射性同位素包括但不限于14C、3H、32P、33P、35S、1251、和131I。使用放射性同位素作为标记是本领域熟知的。在一些情况下,无酶活性、序列特异性核糖核酸内切酶连接(共价或非共价)至特异性结合对的成员(“结合对的配偶体”)。所谓“结合对的配偶体”或者“结合对的成员”是指第一和第二部分之一,其中第一和第二部分具有对彼此的特异性结合亲和力。合适的结合对包括但不限于:抗原/抗体(例如,异羟基洋地黄毒苷元/抗-异羟基洋地黄毒苷元、二硝基苯基(DNP)/抗-DNP、丹酰基-X-抗-丹酰基、荧光素/抗-荧光素、萤光黄/抗-萤光黄以及若丹明和抗-若丹明);生物素/抗生物素蛋白(或者生物素/链霉亲和素)以及钙调蛋白结合蛋白(CBP)/钙调蛋白。在一些实施方案中,寡核苷酸探针包含提供对非特异性水解增加的抵抗性的修饰。这些修饰是本领域熟知的,并且包括例如抗核酸酶核苷间键合(nuclease-resistantinternucleosidiclinkage)、修饰的主链、碱基修饰、碱基取代、糖修饰等。其中包含磷原子的合适的修饰的寡核苷酸主链包括例如,硫代磷酸酯;手性硫代磷酸酯;二硫代磷酸酯;磷酸三酯;氨基烷基磷酸三酯;甲基和其他烷基磷酸酯,包括具有常规3′-5′键合的3′-亚烷基磷酸酯、5′-亚烷基磷酸酯以及手性磷酸酯;亚磷酸酯;氨基磷酸酯,包括3′-氨基氨基磷酸酯和氨基烷基氨基磷酸酯;二氨基磷酸酯;硫羰基氨基磷酸酯;硫羰基烷基磷酸酯;硫羰基烷基磷酸三酯;硒代磷酸酯以及甲硼烷磷酸酯;这些的2′-5′连接类似物,以及具有反向极性的那些,其中一种或多种核苷酸间键合是3′至3′、5′至5′或者2′至2′键合。具有反向极性的合适的寡核苷酸在3′-大部分核苷酸间键合处包括单个3′至3′键合,即,可以为碱性的单个反向核苷酸残基(核碱基缺失或在其位置上具有羟基)。各种盐(例如,钾或钠)、混合盐和游离酸形式也包括在内。修饰的寡核苷酸可包含一种或多种硫代磷酸酯和/或杂原子核苷酸间键合,尤其是-CH2-NH-O-CH2-、-CH2-N(CH3)-O-CH2-(称为亚甲基(甲基亚氨基)或者MMI主链)、-CH2-O-N(CH3)-CH2-、-CH2-N(CH3)-N(CH3)-CH2-和-O-N(CH3)-CH2-CH2-(其中天然磷酸二酯核苷酸间键合表示为-O-P(=O)(OH)-O-CH2-)。MMI类型核苷酸间键合公开在以上引用的美国专利号5,489,677中。合适的酰胺核苷酸间键合公开在美国专利号5,602,240中。修饰的寡核苷酸可包含如在例如美国专利号5,034,506中所述的一个或多个吗啉代主链结构。例如,在一些实施方案中,修饰的寡核苷酸包含6-元的吗啉代环而替代核糖环。在这些实施方案的一些中,二氨基磷酸酯或其他非-磷酸二酯核苷酸间键合替代磷酸二酯键。吗啉代核酸(“吗啉代”)包括结合吗啉环而非脱氧核糖环的碱基;此外,磷酸主链可包括非磷酸酯基团,例如,二氨基磷酸酯基团而非磷酸酯。Summerton(1999)Biochim.Biophys.Acta1489:141;Heasman(2002)Dev.Biol.243:209;Summerton和Weller(1997)Antisense&Nucl.AcidDrugDev.7:187;Hudziak等(1996)Antisense&Nucl.AcidDrugDev.6:267;Partridge等(1996)Antisense&Nucl.AcidDrugDev.6:169;Amantana等(2007)Bioconj.Chem.18:1325;Morcos等(2008)BioTechniques45:616。修饰的寡核苷可包含修饰的主链。其中不包括磷原子的修饰的多核苷酸主链具有通过短链烷基或环烷基核苷酸间键合、混合的杂原子和烷基或环烷基核苷酸间键合或者一个或多个短链杂原子或杂环核苷酸间键合而形成的主链。这些包括具有吗啉代键合和(部分从核苷的糖部分形成);硅氧烷主链;硫化物、亚砜和砜主链;甲酰基和硫代甲酰基主链;亚甲基甲酰基和硫代甲酰基主链;核糖乙酰基主链;包含烯烃的主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和磺酰胺主链;酰胺主链的那些;以及具有混合的N、O、S和CH2组分部分的其他主链。修饰的寡核苷酸可包含一种或多种取代的糖部分。合适的寡核苷酸包含选自以下的糖取代基:OH;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或者O-烷基-O-烷基,其中烷基、烯基和炔基可以为取代的或未取代的C1至C10烷基或者C2至C10烯基和炔基。同样合适的是O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3、O(CH2)nONH2和O(CH2)nON((CH2)nCH3)2,其中n和m是1至约10。其他合适的寡核苷酸包含选自以下的糖取代基:C1至C10低级烷基;取代的低级烷基、烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基;SH;SCH3;OCN;Cl;Br;CN;CF3;OCF3;SOCH3;SO2CH3;ONO2;NO2;N3;NH2;杂环烷基;杂环烷芳基;氨基烷基氨基;聚烷基氨基;取代的甲硅烷基;RNA裂解基团;报告基团;嵌入剂(intercalator)等。合适的修饰基团包括:2′-甲氧基乙氧基(2′-O-CH2CH2OCH3,也称为′-O-(2-甲氧基乙基)或者2′-MOE)(Martin等,Helv.Chim.Acta,1995,78,486-504),即,烷氧基烷氧基。另外合适的修饰基团包括2′-二甲基氨基氧基乙氧基,即,O(CH2)2ON(CH3)2基团,也称为2′-DMAOE以及2′-二甲基氨基乙氧基乙氧基(在本领域中也称为2′-O-二甲基-氨基-乙氧基-乙基或者2′-DMAEOE),即,2′-O-CH2-O-CH2-N(CH3)2。修饰的寡核苷酸可包含一个或多个核碱基(在本领域中通常简称为“碱基”)修饰或取代。如本文所使用,“未修饰的”或“天然的”核碱基包括嘌呤碱基腺嘌呤(A)和鸟嘌呤(G);以及嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核碱基包括其他合成的和天然的核碱基,例如5-甲基胞嘧啶(5-me-C);5-羟甲基胞嘧啶;黄嘌呤;次黄嘌呤;2-氨基腺嘌呤;腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物;腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物;2-硫尿嘧啶;2-硫代胸腺嘧啶和2-硫代胞嘧啶;5-卤代尿嘧啶和胞嘧啶;5-丙炔基(-C=C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物;6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶;5-尿嘧啶(假尿嘧啶);4-硫尿嘧啶;8-卤代、8-氨基、8-硫醇、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤;5-卤代特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶以及胞嘧啶;7-甲基鸟嘌呤和7-甲基腺嘌呤;2-F-腺嘌呤;2-氨基-腺嘌呤;8-氮杂鸟嘌呤以及8-氮杂腺嘌呤;7-去氮鸟嘌呤和7-去氮腺嘌呤;以及3-去氮鸟嘌呤和3-去氮腺嘌呤。另外的修饰的核碱基包括三环嘧啶,例如吩噁嗪胞嘧啶核苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮);吩噻嗪胞嘧啶核苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮);G-夹子(G-clamps),例如取代的吩噁嗪胞嘧啶核苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞嘧啶核苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞嘧啶核苷(H-吡啶并(3′,2′:4,5)吡咯并2,3-d)嘧啶-2-酮)。杂环碱基部分还可包括其中嘌呤或嘧啶碱基被其他杂环取代的那些,例如7-去氮-腺嘌呤、7-去氮鸟嘌呤核苷、2-氨基吡啶和2-吡啶酮。合适的无酶活性、序列特异性核糖核酸内切酶包括本文以下所述的无酶活性、序列特异性核糖核酸内切酶。例如,可使用如图6所示的无酶活性、序列特异性核糖核酸内切酶。在一些实施方案中,靶多核糖核苷酸连接(共价或非共价)至固体支撑物(不溶性支撑物)。合适的不溶性支撑物包括但不限于:小珠、板(例如,多孔板)、条带等,其中不溶性支撑物可包含各种材料,这些材料包括但不限于聚苯乙烯、聚丙烯、琼脂糖等。寡核苷酸探针(“检测寡核苷酸”)可以为RNA、DNA或者RNA或DNA的任何化学修饰形式,例如,肽核酸(PNA、锁核酸(LNA)等。主题多核糖核苷酸测序方法可包括一个或多个洗涤步骤,例如从而去除诸如非特异性结合的寡核苷酸探针、任何非特异性结合的可检测部分等的非特异性结合组分。如何进行主题多核糖核苷酸测序方法的非限制性例子如下。使靶多核糖核苷酸结合固体支撑物。靶多核糖核苷酸具有未知序列并且是“待测序的RNA”。四个不同的已知核苷酸序列的四种寡核苷酸探针各自包含不同的荧光团(荧光团1-4)。荧光团是FRET对的成员。FRET对的对应物成员是量子点。量子点连接无酶活性、序列特异性核糖核酸内切酶。无酶活性、序列特异性核糖核酸内切酶连接、但不裂解在寡核苷酸探针和靶多核糖核苷酸之间形成的双链体。四种寡核苷酸探针中仅一种与靶多核糖核苷酸结合并且形成双链体。洗涤步骤去除任何未结合的寡核苷酸探针。寡核苷酸探针-荧光团2的结合导致与靶多核糖核苷酸形成双链体。因而将荧光团2引入邻近连接无酶活性、序列特异性核糖核酸内切酶的量子点处,并且荧光被猝灭。裂解多核糖核苷酸的方法本公开提供以序列特异性方式裂解多核糖核苷酸的方法。本方法通常包括:在有利于多核糖核苷酸底物的序列特异性裂解的条件下使底物多核糖核苷酸与酶活性序列特异性核糖核酸内切酶(例如,Csy4核糖核酸内切酶)接触。以序列特异性方式裂解多核糖核苷酸的主题方法可用于:1)从底物多核糖核苷酸中去除亲和标记;2)在5′端处产生具有均匀性的产物多核糖核苷酸的群,例如,其中底物多核糖核苷酸是体外转录的mRNA;以及3)调节在体外或体内细胞中的基因表达。底物多核糖核苷酸术语“底物多核糖核苷酸”和“靶多核糖核苷酸”在本文可交换使用,其是指以序列特异性方式由序列特异性核糖核酸内切酶结合的多核糖核苷酸。底物多核糖核苷酸可以为单链的。在一些例子中,底物多核糖核苷酸是双链的。核糖核酸内切酶以序列特异性方式结合并裂解底物多核糖核苷酸。因此,例如,核糖核酸内切酶在本文称为“识别序列”或“识别位点”的特定序列处结合并裂解底物多核糖核苷酸。识别序列可以为四核苷酸序列、五核苷酸序列、六核苷酸序列、七核苷酸序列、八核苷酸序列或比八核苷酸更长的序列。例如,在一些实施方案中,识别序列的长度为9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸。在一些实施方案中,序列特异性核糖核酸内切酶立即裂解识别序列的5′。在一些实施方案中,序列特异性核糖核酸内切酶立即裂解识别序列的3′。在一些实施方案中,序列特异性核糖核酸内切酶在识别序列内裂解。在一些情况下,识别序列立即裂解二级结构的5′。在一些情况下,识别序列位于二级结构的5′并且在二级结构的1个核苷酸(nt)、2nt、3nt、4nt、5nt或者5nt至10nt内。在一些情况下,识别序列立即裂解二级结构的3′。在一些情况下,识别序列位于二级结构的3′并且在二级结构的1个核苷酸(nt)、2nt、3nt、4nt、5nt、或者5nt至10nt内。在一些实施方案中,底物多核糖核苷酸包含结构XxX2X3X4X5X6X7X8X9X10X11X12X13X14X15,其中核苷酸X1-X5与X11-X15碱基配对,使得X1和X15形成茎结构的基础,并且使得X6、X7、X8、X9和X10形成环;结构是常规A-形状的螺旋结构。在一些实施方案中,底物多核糖核苷酸包含亲和标记;并且主题方法提供从底物多核糖核苷酸中去除亲和标记。序列特异性核糖核酸内切酶以序列特异性方式结合和裂解底物多核糖核苷酸的核糖核酸内切酶包括酶活性多肽,该酶活性多肽以金属离子依赖性方式裂解(水解)底物多核糖核苷酸。以序列特异性和金属离子依赖性方式结合和裂解底物多核糖核苷酸的核糖核酸内切酶的结构特征可包括以下的一种或多种:1)通过例如,R114、R115、R118、R119或其等同物的RNA大沟的RNA磷酸主链的序列非特异性识别的高碱基α螺旋;2)R102和/或Q104或其等同物,使得氢键与RNA茎的大沟接触;3)以及参与催化的His29、Ser148和Tyr176或其等同物的一种或多种;以及4)F155或其等同物。以序列特异性方式结合和裂解底物多核糖核苷酸的核糖核酸内切酶包括酶活性多肽,该酶活性多肽与图4所示的氨基酸序列(Csy4氨基酸序列)具有至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%氨基酸序列同一性。以序列特异性方式结合和裂解底物多核糖核苷酸的核糖核酸内切酶包括酶活性多肽,该酶活性多肽与图5所示的氨基酸序列(Csy4氨基酸序列)具有至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%氨基酸序列同一性。以序列特异性方式结合和裂解底物多核糖核苷酸的核糖核酸内切酶包括酶活性多肽,该酶活性多肽与Cas6氨基酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%氨基酸序列同一性。以序列特异性方式结合和裂解底物多核糖核苷酸的核糖核酸内切酶包括酶活性多肽,该酶活性多肽与CasE氨基酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%氨基酸序列同一性。以序列特异性方式结合和裂解底物多核糖核苷酸的核糖核酸内切酶包括酶活性多肽,该酶活性多肽通过1至20(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20)个氨基酸取代和/或插入和/或缺失而与图4或5中任一图中所示的氨基酸序列不同。反应条件序列特异性核糖核酸内切酶可在约15℃至约100℃的温度范围内以序列特异性方式水解底物多核糖核苷酸,所述温度范围例如为约15℃至约17℃、约17℃至约20℃、约20℃至约25℃、约25℃至约30℃、约30℃至约40℃、约40℃至约50℃、约50℃至约60℃、约60℃至约70℃、约70℃至约80℃、约80℃至约90℃或约90℃至约100℃。序列特异性核糖核酸内切酶可在pH为约4.0至约8.0的范围内以序列特异性方式水解底物多核糖核苷酸,所述pH范围例如为pH约4.0至约4.5、pH约4.5至约5.0、pH约5.0至约5.5、pH约5.5至约6.0、pH约6.0至约6.5、pH约6.5至约7.0、pH约7.0至约7.5、pH约6.5至约7.5、pH约7.5至约8.0、pH约6.5至约8.0或pH约5.5至约7.5。实施例示出以下例子以为本领域普通技术人员对如何进行和使用本发明提供完整公开和描述,并且以下例子并非旨在限制发明人所认定其发明的范围,也并非旨在呈现以下实验为进行的全部或仅有的实验。对于使用的数值(例如数量、温度等),已经尽力确保其准确性,但还应当考虑到一些实验误差和偏差。除非另有说明,部分是按重量计的部分,分子量是重均分子量,温度是摄氏度,并且压力为大气压或接近大气压。可使用标准缩略语,例如,bp,碱基对;kb,千碱基;pi,皮升;s或sec,秒;min,分钟;h或hr,小时;aa,氨基酸;kb,千碱基;bp,碱基对;nt,核苷酸;i.m.,肌肉内;i.p.,腹膜内;s.c,皮下等。实施例1:使用Csy4家族蛋白的直接RNA检测和测序材料和方法野生型Csy4、点突变体和硒代甲硫氨酸(SeMet)-取代的Csy4在Rosetta2(DE3)细胞中表达为His6-麦芽糖结合蛋白(MBP)融合物或His6融合蛋白,并通过Ni-亲和层析法,随后为蛋白水解去除His(MBP)标记、进一步的Ni-亲和步骤以及尺寸排阻层析法来纯化。使用T7聚合酶将前体-crRNA体外转录并且在变性凝胶上纯化。通过在30℃下将RNA与Csy4以2∶1的比率孵育30分钟,然后通过尺寸排阻层析来形成复合物。使用悬滴方法在200mM柠檬酸钠(pH5.0)、100mM氯化镁、20%(w/v)聚(乙二醇)(PEG)-4000(野生型(WT)复合物)或者在150mM乙酸钠(pH4.6)、17%PEG4000或160mM乙酸钠(pH4.6)、18%PEG4000中(包含S22C的复合物)中来结晶复合物。通过使用SeMet-取代的结晶的多波长反常色散(MAD)来测定WTCsy4-RNA复合物的结构。通过分子置换来测定Csy4(S22C)-RNA复合物的结构。基因注释、克隆、蛋白表达和纯化。在物种中Csy4基因的对比序列分析识别在PA14基因组中注释的起始密码子上游处保守区20密码子。Lee,等GenomeBiol7,R90(2006)。将保守的Csy4(PA14_33300)序列使用Pal4Csy4_fwd:caccatggaccactacctcgacattcg和Pal4Csy4_rev:gaaccagggaacgaaacctcc从绿脓假单胞菌(Peeudomonasaeruginosa)UCBPP-PA14基因组DNA进行PCR扩增。使用Gateway体系将聚合酶链反应(PCR)产物克隆至pENTR/TEV/D-TOPO入门载体(Invitrogen)内,随后进行位点特异性重组至表达载体pHGWA或pHMGWA内。Busso,等AnalyticalBiochemistry343,313-321,(2005)。使用QuikChange定点诱变试剂盒(Stratagene)将点突变引入Csy4内。将Pal4Csy4表达质粒转化至大肠杆菌Rosetta2(DE3)细胞(Novagen)内或者与通过Geneart(Regensburg,Germany)合成的表达CRISPRRNA的pMK载体来共转化。使Rosetta2(DE3)细胞在用氨苄青霉素和氯霉素补充的Luria肉汤(LB)中生长。使用~0.5OD的细胞密度的0.5mM异丙基β-D-1-硫代吡喃半乳糖苷(IPTG)(Affymetrix)来诱导蛋白质表达,然后在18℃下振荡16小时。将细胞在裂解缓冲剂(15.5mM磷酸氢二钠;4.5mM磷酸二氢钠;500mM氯化钠;10mM咪唑;蛋白酶抑制剂;5%甘油;0.01%TritonX-100;100μ/mlDNaseI;ImMTris[2-羧乙基]膦盐酸盐(TCEP);0.5mM苯甲基磺酰氟,pH7.4)中沉淀和再悬浮,然后在冰上以10秒脉冲声处理两分钟,通过离心(24,000×g,30分钟)使裂解物澄清,并与分批的氮川三乙酸镍(Ni-NTA)亲和树脂(Qiagen)来孵育。使用高咪唑缓冲剂(15.5mM磷酸氢二钠;4.5mM磷酸二氢钠;500mM氯化钠;300mM咪唑;1mMTCEP;5%甘油,pH7.4)来洗脱结合的蛋白质,然后在烟草蚀纹病毒(TEV)的存在下在透析缓冲剂(仅具有20mM咪唑的洗脱缓冲剂)中透析过夜,从而裂解His6或His6MBP标记。将蛋白质浓缩(Amicon)并在镍亲和柱(GE)上纯化,随后在凝胶过滤缓冲剂(100mMHEPESpH7.5;500mMKCl;5%甘油;1mMTCEP)中串联Sup75(16/60)柱纯化。然后将样本通过仅包含150mM氯化钾的凝胶过滤缓冲剂来透析。使用类似的方案来制备硒基甲硫氨酸(SeMet)-衍生蛋白,并且显著差别仅在于表达介质。简单地说,将使用Csy4(pHGWA)表达载体转化的BL21(DE3)细胞在使用如前所述用氨苄青霉素补充的M9最小培养基中生长。Wiedenheft,等Structure17,904-912(2009)。核酸酶活性测定。在25℃下将75pmol的野生型或突变型Csy4与5pmol体外转录的Pa14前体-crRNA(如所述制备;Wiedenheft(2009)上文)在包含20mMHEPES(pH7.5)、100mM氯化钾缓冲剂的10ul反应物中孵育五分钟。加入50ul酸酚-氯仿(Ambion)来猝灭反应。加入10μl另外的反应缓冲剂,并且将样本离心(16,000×g,30分钟),并且将16μl水性样本去除,以1∶1与2X甲酰胺加样缓冲液混合,然后在15%变性聚丙烯酰胺凝胶上分离。使用SYBRGold染色(Invitrogen)来观察RNA。结晶。在18℃下使用悬滴蒸汽扩散方法通过混合等体积(1μl+1μl)的复合物和储备溶液来进行所有结晶实验。使野生型Csy4-RNA复合物的板状结晶在200mM柠檬酸钠(pH5.0)、100mM氯化镁、20%(w/v)聚(乙二醇)-4000(PEG4000)中生长。这些晶体属于空间群C2,其包含在不对称单元中复合物的一个拷贝,并且在同步加速器X射线源下衍射至的分辨率。使用经Csy4S22C点突变体再造的复合物,在150mM乙酸钠(pH4.6);17%(w/v)PEG4000和160mM乙酸钠(pH4.6);18%PEG4000中获得两种另外的晶形。开始,在24小时内出现六边形晶体。这些晶体衍射至的分辨率,其属于空间群P61以及包含在不对称单元中复合物的一个拷贝。48小时之后,相同结晶条件产生针状晶体,其属于空间群P212121,包含复合物的两个拷贝以及衍射至多的分辨率。对于数据收集,在液氮中快速冷却之前通过浸渍在它们各自用30%甘油补充的母液中来对所有晶形进行冰冻保护。结构测定。在AdvancedLightSource(LawrenceBerkeleyNationalLaboratory)的光束线8.2.2和8.3.1的100K下收集所有衍射数据。使用XDS来处理数据,Kabsch,ActaCrystallogrDBiolCrystallogr66,125-132(2010)。使用包含硒代甲硫氨酸取代的野生型Csy4的单斜Csy4-RNA晶体由三波长多波长反常色散(MAD)实验来确定实验阶段(峰、弯曲和远端数据集)。使用Phenix程序包的混合亚结构检索(HybridSubstructureSearch)(HySS)模块来定位两个硒位置。Grosse-Kunstleve和Adams.ActaCrystallogrDBiolCrystallogr59,1966-1973(2003)。使用AutoSHARP.Vonrhein,等MethodsMolBiol364,215-230(2007)来进行亚结构精细、定相和密度改变。所得电子密度图表现出由蛋白质和RNA沿着c-轴交替导致的密度的透明层,其中RNA层由构成“吻环”交互作用中接合的两同轴堆叠的RNA螺旋形成。通过使用PhenixAutoBuild模块的自动构建来获得Csy4蛋白的初始原子模型。Terwilliger,等ActaCrystallogrDBiolCrystallogr64,61-69,(2008)。通过在COOT(Emsley和Cowtan,ActaCrystallogrDBiolCrystallogr60,2126-2132(2004))中手动构建的迭代循环以及使用Phenix.refine36(Adams,等ActaCrystallogrDBiolCrystallogr66,213-221(2010))的精细化天然的分辨率数据集来完成复杂模型,产生具有21.4%的结晶的Rwork因子和26.4%的Rfree因子的最终模型(表1)。模型包括RNA核苷酸C1-G15和核苷酸C16的磷酸基团以及蛋白质残基1-104、109-120和139-187。由于在晶格中蛋白质和RNA的分层布置并且在RNA层内没有横向晶体接触,如通过显著增加的温度因数以及没有U9的核苷酸碱基可解释的密度所证实,RNA表现出显著无序。与插入RNA的大沟的富含精氨酸的螺旋相对应,在蛋白质残基109-120中无序也很明显,因而仅能构建多肽主链(除了残基Arg115和Arg118)。使用Csy4蛋白(没有富含精氨酸的螺旋)和来自单斜晶形的RNA模型作为单独的检索系综,通过在移相器(Phaser)(McCoy,等JApplCrystallogr40,658-674(2007))中分子置换来测定在六边形和斜方晶形中Csy4(S22C)-RNA复合物的结构。在两晶形中,富含精氨酸的螺旋和包含Csy4残基105-108的接头区域的电子密度在由分子置换方案获得的2FO-FC图谱中立即可见。将六边形的Csy4(S22C)-RNA复合物的结构精细化至在的分辨率下25.5%的Rwork因子以及27.9%的Rfree。最终模型包括Csy4残基1-120和139-187和RNA核苷酸C1-G15以及核苷酸C16的磷酸基团。在的分辨率下分析Csy4(S22C)-RNA复合物的斜方晶形并且精细化至具有极佳立体化学的18.7%的Rwork因子以及22.0%的Rfree。在不对称单元中两个复合物中,复合物1(链A和C)包含Csy4残基1-187和RNA核苷酸C1-G15以及核苷酸C16的磷酸基团,而有序性更差的复合物2(链B和D)包含除了残基13-15和135-138之外的Csy4残基1-187,其显示没有有序的电子密度和RNA核苷酸C1-G15以及核苷酸C16的磷酸基团。Csy4的两个拷贝与的rmsd在179Cα原子上叠加,最大不同在于富含精氨酸的螺旋的位置的轻微差别。在不对称单元中两个RNA分子与的rmsd叠加,最大偏差是由于凸出的核苷酸U9,其在两个RNA中假定不同构象。在原稿中我们的讨论和图示均基于斜方晶形的复合物1。使用Pymol来产生所有结构图示(http://www(dot)pymol(dot)org)。结果使CRISPR-介导的免疫发生在基于在测序的基因组中CRISPR基因座的存在下的约90%的古细菌以及40%的细菌基因组中。Horvath和Barrangou,Science327,167-170(2010);Jansen,等MolecularMicrobiology43,1565-1575(2002);Sorek,等NatRevMicrobiol6,181-186(2008);Marraffini和Sontheimer,NatRevGenet11,181-190(2010)。属于八种已知CRISPR/Cas亚型的CRISPR相关(Cas)的蛋白在基本序列水平上高度分散,使功能性同源物难于识别。Haft,等PLoSComputBiol1,e60(2005);Makarova,等BiologyDirect1,1-26(2006)。绿脓假单胞菌UCBPP-PA14(以下称为Pal4)、具有耶尔森(Yersinia)亚型的CRISPR/Cas体系的革兰氏阴性条件致病菌包含通过两个CRISPR元件侧面相接的六种Cas基因(图1A)。尽管在包含CRISPR的生物体中广泛发现Casl,并且在大部分亚型中Cas3很明显,但Csyl-4是耶尔森亚型所独有的。CRISPR元件均包含在使用~32-核苷酸特有间隔序列穿插的CRISPR内均相同(除了一个核苷酸之外)的28-核苷酸重复序列的特征性布置,在噬菌体或质粒中发现其的一些匹配序列。Grissa,等BMCBioinformatics8,172(2007)。在许多生物体中,已经显示,CRISPR基因座被转录为单个长单元以及经转录后处理以生成各自包含与由重复元件衍生的序列侧面相接一个特有序列的crRNA。Brouns等Science321,960-964(2008);Carte,等GenesandDevelopment22,3489-3496(2008);Tang,等Proc.Natl.Acad.Sci.USA99,7536-7541(2002);Lillestol,等Archaea2,59-72(2006);Lillestol等MolMicrobiol72,259-272(2009);Tang,等MolecularMicrobiology55,469-481(2005)。为了鉴定在耶尔森亚型中负责产生来自长CRISPR转录物(前体-crRNA)的蛋白质,将来自Pa14的六种Cas蛋白各自重组表达,并且使用体外转录的前体-crRNA来测试重组表达的蛋白质的内切核糖核水解(endoribonucleolytic)功能。基于序列特异性前体-crRNA处理活性,发现Csy4是导致crRNA生物生成的核糖核酸内切酶。如在两种其他CRISPR/Cas亚型内观察到的crRNA处理(Brouns等(2008)supra;Carte等(2008)上文),CRISPR转录物裂解是快速、金属离子依赖性反应。Csy4在重复元件内在预测的茎-环结构的碱基处裂解前体-crRNA,生成由32个核苷酸特有(由噬菌体衍生的)序列组成的60个核苷酸crRNA,该特有序列在5′和3′端处分别侧边连接重复序列的8和20个核苷酸(图1A)。对于Csy4发挥作用,据推测,其RNA识别机制必须高度特异性以仅靶向由CRISPR衍生的转录物,而不靶向包含发夹序列和/或相关序列的其他细胞RNA。为了测试这个,将Csy4单独表达在大肠杆菌中或者与Pal4CRISPRRNA共表达。尽管等电点高(PI=10.2),但Csy4不与细胞核酸缔合;然而,当与Pal4CRISPR共表达时,蛋白质与crRNA缔合(图1B,C)。这些观察强调Csy4识别的特异性,导致我们可以探索Csy4底物识别和裂解所需的蛋白质/RNA相互作用。使用对应28-核苷酸Pal4CRISPR重复序列的不同区域的RNA寡核苷酸体外进行Csy4结合和活性测定。使用该方法,鉴定由Csy4识别的由重复序列衍生的茎-环和一个下游核苷酸组成的最小RNA片段。使用该最小RNA作为底物的裂解测定显示Csy4活性需要在裂解位点的正上游的核糖处的2’OH。在该位置处的2′-脱氧核糖完全中断裂解,但不会破坏Csy4结合。为了了解crRNA识别和裂解的结构,将Csy4与最小RNA底物在复合物中共结晶。为了生成用于结构分析的稳定的复合物,使Csy4结合以上所述的不可裂解的16个核苷酸最小RNA底物,其中在裂解位点之前的核苷酸是2′-脱氧核苷酸。在三个特有空间群中获得复合物的结晶,各自表现不同晶体包装;一个包含野生型Csy4并且两个包含Csy4点突变体。将Csy4-RNA复合物的晶体结构在的分辨率下分析(图2A,表1),其揭示出人意料之外的机制,由此CRISPRRNA被识别并通过CRISPR-介导的沉默机制(silencingmachinery)来处理以供使用。Csy4使得与RNA茎的磷酸主链在CRISPR重复序列的茎-环的大沟中序列特异性接触以及另外的序列非特异性接触。大部分特征化蛋白质/RNA相互作用通过RNA螺旋的小沟来介导;通过Csy4的RNA大沟的识别是蛋白质/RNA相互作用极其不寻常的机制。在基本序列水平下,Csy4与在crRNA生物生成中包括的其他已知核糖核酸内切酶(来自Thermusthermophiles(Ebihara,等ProteinSci15,1494-1499(2006)的CasE以及来自PyrococcusfuriosusCarte等(2008)上文的Cas6)极不相同,其仅有~10%的同一性。CasE和Cas6的晶体结构表明:这些蛋白质采用串联铁氧还蛋白样折叠(tandemferrodoxin-likefold)。显然,Csy4与这些酶共享该折叠;在Csy4-RNA复合物中,Csy4的N-末端结构域(残基1-94)实际采用铁氧还蛋白样折叠。然而,尽管C-末端结构域(残基95-187)共享相同二级结构连通性作为铁氧还蛋白样折叠,但是其构象显著不同。引人注目的是,来自推定C-末端铁氧还蛋白结构域的富含精氨酸的螺旋(残基108-120)插入发夹RNA的大沟内。使用DALI服务器(Holm和Sander,JMolBiol233,123-138(1993))的结构叠加表明:在其RNA-结合构象中Csy4以(在111Ca原子上)以及(在104Ca原子上)的均方根偏差(rmsd)分别与CasE和Cas6叠加。Csy4、CasE和Cas6可以为单个原始核糖核酸内切酶的衍生物,随着其CRISPR基因座的重复序列共同演变时,其在序列水平处显著不同,但同时保持类似蛋白质重叠。如对crRNA重复序列的该亚类所预测(Kunin,等GenomeBiol8,R61(2007)),crRNA底物与核苷酸1-5和11-15碱基配对形成发夹结构,从而产生常规A-形螺旋茎。GUAUA五环包含经修剪的G6-A10碱基对以及凸出的核苷酸U9,其结构类似在酵母U6小核RNA分子内茎-环(Huppler,等NatStructBiol9,431-435(2002))中以及在噬菌体λBoxBRNA(Legault,等Cell93,289-299(1998))中发现GNR(N)A五环。在Csy4-RNA复合物中,RNA茎-环跨在由Csy4的链β7-β8与C1-G15碱基对形成的β-发夹上,该C1-G15碱基对直接堆叠在Phe155的芳香侧链上(图2B)。这锚定RNA茎并将以合适的角度定向以使得可在大沟中进行序列特异性相互作用。在接头片段中连接Csy4主体至富含精氨酸的螺旋的两个残基,Arg102和Gln104,在RNA茎的大沟中形成氢键接触,从而分别序列特异性识别G15和A14(图2B)。通过将富含精氨酸的螺旋插入靠近凸出的核苷酸U9处RNA发夹的大沟内来进一步稳定Csy4-crRNA相互作用(图2C)。Arg114、Arg115、Arg118和Arg119的侧链接触核苷酸2-6的磷酸基团。此外,Arg115的侧链与G6的碱基接合作为在富含精氨酸的螺旋和RNA发夹之间仅有的序列特异性相互作用。令人感兴趣的是,该相互作用易令人想起某些病毒蛋白如何与dsRNA分子的大沟相互作用,例如在人免疫缺陷病毒(HIV)23中Tat/Tar相互作用以及在λ形噬菌体中λ-N/boxB复合物(Cai等NatureStructuralBiology5,203-212(1998))。在两种情况下,采用高碱基α螺旋用于使用RNA大沟的RNA的磷酸主链的序列非特异性识别。Csy4识别CRISPR重复序列的发夹元件并立即裂解其下游序列。在该例子中描述的结构包含底物-模拟RNA,其不能用于裂解。在该活性位点处,仅观察倒数第二个核苷酸的磷酸基团3′的密度,而未观察到末端糖基或碱基的密度,预测这是由于该核苷酸的柔性(图3A)。可剪切的磷酸酯在之前在Cas6和CasE中鉴定的位于一侧的β7-β8发夹的β-转弯以及螺旋α1和富含甘氨酸的环之间的口袋中在另一侧上结合。在磷酸基团近侧的三个残基(His29、Ser148和Tyr176)可能参与催化。这些残基在12个Csy4序列之间是不变的,使用BLAST检索(Altschul,等NucleicAcidsResearch25,3389-3402(1997))以及靠近CRISPR基因座(Grissa,等BMCBioinformatics8,172(2007))的人工验证来识别该Csy4序列(图4)。这些结构表明:在Csy4中多个残基对于介导底物识别/结合和催化是重要的。产生这些残基各自的点突变体;生化测定它们的裂解活性(图3B)。设想的催化位点残基His29或Ser148的突变破坏裂解活性。然而,Tyr176突变至苯丙氨酸并未破坏活性,这表明虽然它未直接参与催化,但Tyr176在定向His29中起决定性作用。Arg102突变至丙氨酸破坏crRNA的聚集,而Gln104至丙氨酸的突变并未显著破坏活性,这表明识别末端碱基对的Arg102对于正确定向RNA底物是重要的,但对于体内活性则无需Gln104。Phe155似乎在适当定向RNA底物中起重要作用,因为在该残基处丙氨酸突变严重破坏crRNA生物生成。参与介导RNA裂解中的丝氨酸的鉴定是出人意料之外的。尽管His29突变至丙氨酸导致Csy4失去催化活性,但突变至赖氨酸部分恢复活性,这强有力地表明His29用作质子供体,而不是通过亲核攻击来起始裂解。CRISPR是依赖小的由CRISPR衍生的RNA来将免疫体系引导至与侵入遗传元件相关的同源序列的基于核酸的免疫体系的遗传存储器。CRISPR重复序列的系统发育分析已经鉴定与特定组的Cas基因相关的不同的CRISPR种类(Kunin,等GenomeBiol8,R61(2007))。Cas基因与特异性CRISPR重复序列的共同变化表明:CRISPR重复序列与负责CRISPR适应性、crRNA的生成和入侵遗传元件的沉默的Cas基因共同进化。在此所述结构详述基于序列-和结构-特异性来辨别crRNA底物的非常规识别机制,这提供对Csy4及其同源物从所有细胞RNA中容易地辨别底物RNA的能力的较好的理解。图1A-C。Pal4Csy4仅特异性识别其前体-crRNA底物。a,在Pal4中CRISPR/Cas基因座的示意图。通过CRISPR基因座使六个Cas基因在两侧侧面相接。放大的是显示在通过32-核苷酸间隔序列(蓝色)分隔的28-核苷酸直接重复序列(黑体字)中预测的茎-环的示意图。红色箭头表示通过Csy4裂解的键。b,c,在具有(+)以及不具有(-)包含Pal4CRISPR基因座的质粒的大肠杆菌中Pal4Csy4表达之后蛋白质(b)和RNA内容物(c)的比较。将来自两种制备物的纯化的Csy4分成两组。将一半在SDS-PAGE上分析并且使用Coomassie蓝色染料观察;将另一半用酸酚-氯仿萃取,在UREA-PAGE上分析,然后使用SYBRGold(Invitrogen)观察。图2A-C。结合RNA底物的Csy4的晶体结构。a,复合物的前和后视图。将Csy4染成蓝色以及将RNA主链染成橙色。b,在残基R102和Q104以及核苷酸A14和G15之间的详细相互作用。氢键使用虚线表示。c,在富含精氨酸的α螺旋以及RNA主链和G6之间的详细相互作用。图3A和3B。假定活性位点。a,催化中心的详细视图。b,Csy4的裂解活性。在25℃下将野生型(WT)Csy4和一系列单个点突变体与体外转录的前体-crRNA体外孵育5分钟。使用酸酚-氯仿萃取产物并且在UREA-PAGE上分析,并且通过SYBRGold染色来观察。实施例2:直接RNA测序可使用福斯特共振能量转移(FRET)在单个分子水平对RNA进行测序。通过其3′核糖使待测序的RNA附接固体表面。应当将RNA放置在距离表面上邻近RNA分子足够距离以使得在单分子水平下可检测。取决于发射光的波长,通过衍射限制方法来表示间隔。可选择地,如果使用超高分辨率显像方法,RNA间隔可比衍射极限更靠近。在第一序列检测步骤中,将已知核酸结合特异性的Csy4家族蛋白连同一组检测寡核苷酸的池加入待测序的RNA。如果检测寡核苷酸之一可与待测序的RNA形成4个碱基对的双螺旋,Csy4蛋白将仅结合待测序的RNA。此外,检测核苷酸必须与在待测序的RNA中4个碱基对的识别序列的3′的另外3个核苷酸碱基配对,从而使Csy4蛋白稳定结合。检测寡核苷酸将含有4个核苷酸的识别序列的3′的3个核苷酸的延伸。在检测寡核苷酸的组中,3个核苷酸的延伸将具有确定的5′核苷酸,随后为两个随机核苷酸位置;或者在5′位置处随机核苷酸之后为确定的核苷酸和随机核苷酸;或者在5′端处为2个随机核苷酸,随后为确定的核苷酸。在任意这些组中,已知确定的核苷酸基于所附的荧光分子,其发射或激发光谱由核苷酸限定。Csy4蛋白将附接量子点,这些量子点的激发光谱与附接至检测寡核苷酸的荧光分子的发射光谱重叠。在结合检测寡核苷酸和Csy4之后,将过量试剂洗涤掉。仅当检测核苷酸与待测序的RNA形成7-核苷酸双螺旋时,才可检测到阳性结合现象。如果出现结合,从附接至检测寡核苷酸的荧光分子至附接Csy4蛋白的量子点,通过FRET可检测待测序的RNA、检测寡核苷酸和Csy4蛋白的所得三元复合物。在各自结合循环之后,使用化学和/或热变性和洗涤从样本中去除Csy4蛋白和检测寡核苷酸。在随后的测序步骤中,以类似的方式将具有不同序列特异性的其他Csy4蛋白和它们对应的检测寡核苷酸进行孵育。可设想在检测寡核苷酸上3-核苷酸延伸的其他变形,例如在检测寡核苷酸的5′端或3′端处具有不同长度的延伸。检测寡核苷酸可以为RNA、DNA或这些聚合物的任意化学修饰形式,如PNA或LNA。实施例3:可诱导序列特异性核糖核酸内切酶通过生化和结构技术,生成缺乏裂解活性,但同时保留底物结合活性的Csy4的点突变体。例子是上述Csy4(H29A)突变体。在外源性咪唑的存在下可再活化另外的无催化活性的Csy4(H29A)突变体。将150mM至300mM的咪唑加入至反应缓冲剂中足够刺激至接近野生型裂解活性。结果显示在图8中。图8显示咪唑再活化时的裂解活性测定。Csy4H29A是保留以<1nM的kd结合其底物的能力的无催化活性的Csy4的突变体。反应详细说明:每10μl反应物包含如所示的5pmol体外转录的前体-crRNA底物、100pmol的Csy4(WT或H29A,如图8所示)、20mMHEPES(pH7.5)、100mMKCl以及150-300mM咪唑。在25℃下使反应进行30分钟。将产物经酸酚-氯仿萃取,在15%变性凝胶上分离,并且使用SYBRGold来观察。Csy4(H29A)的生化特征显示其以<1nM亲和力结合它的RNA底物。当无当前可选择方法时,Csy4(H29A)可用于体内和体外施用。Csy4(H29A)(本文也称为“诱导型”Csy4)可用于纯化来自RNA和RNP的复合混合物(RNA/蛋白质复合物)的特定RNA/蛋白质复合物(RNP)。例如,研究者可能对何种蛋白质结合特定RNA转录物感兴趣。使用该体系,研究者可工程化他们选择的RNA的表达构建体,该表达构建体包括由茎-环Csy4靶序列组成的5′标记。研究者然后将该表达构建体转染至他们选择的细胞类型内,使得生成许多RNA和RNP。然后将细胞裂解,并且将裂解物施加至包含固定在琼脂糖珠上诱导型Csy4的柱子。具有Csy4靶序列的RNA或RNP将结合。随后洗涤步骤将去除非特异性结合RNA。使用咪唑(~300mM)的洗涤将活化诱导型Csy4,这将裂解靶序列并且释放结合的RNA/RNP。该方法示意性图示在图9中。可使用类似方法来体外装配RNP。例如,使用类似于对以上实验所设计的表达质粒的构建体可体外转录选择的RNA。(构建体必须在转录的RNA的5′端处引入Csy4茎-环靶序列)。然后可将该体外转录的产物与已知或怀疑结合特定转录物的蛋白质孵育。包含诱导型Csy4的柱子可用于纯化体外形成的与游离蛋白分离的RNP。实施例4已经测定核糖核酸内切酶CasE的特异性底物识别机制和在大多数细菌和古细菌(vanderOost等,TrendsBiochemSci.34,401-7(2009))中发现的CRISPR免疫系统的主要组分。使用结构和生化方法,鉴定了最佳底物裂解所需的最小RNA序列,包括七个碱基对茎-环,随后为两未配对核苷酸的20个核苷酸的序列(CRISPR重复序列的5-24)。使用X-射线结晶术在分辨率下分析结合来自嗜热栖热菌(Thermusthermophilus)的CasE的该RNA的结构。该结构揭示蛋白质和RNA之间的许多序列特异性接触,包括在RNA的大沟中许多相互作用。在茎-环中末端碱基对被破坏,其中A22翻转出螺旋并与U23碱基堆叠。通过与S34和E38的相互作用使该构象部分稳定化,这也赋予底物识别的序列特异性。通过定位末端核苷酸,G24,来实现A22和U23构象的进一步稳定化,该G24向后翻转至具有茎-环的寄存结构(register)内,但正好位于结合口袋中的螺旋下方,所述结合口袋由残基D18、E24和K31构成,其中在U23和G24之间R27接触主链。A22的定位延长在可剪切磷酸处RNA的主链,其在两活性位点残基(Y23和H26)之间向外延伸。基于该观察和通过G24证实的该RNA构象的明显稳定化,据推测,在催化构象中可能需要G24用于定位RNA。与该假设一致,如同在G24结合中参与的蛋白质残基突变,G24的缺失或突变导致裂解活性显著降低。为了证实G24在诱导催化RNA构象中的作用,测定缺乏末端G24残基的结合19个核苷酸的RNA的CasE的结构。该复合物以两种不同形式结晶,其显示在蛋白质的活性位点处两种不同的RNA构象。在一种晶形(P21)中,在不对称单元中结构包含8个分子。所有8个分子揭示:A22碱基与G21堆叠,保持与茎-环的其他部分形成A-形几何形状。除了RNA结构的改变之外,蛋白质结构也不同于在结构中观察到的催化构象。在该结构中,包含R158和K160的环与活性位点并列,这表明这些残基可在催化或在过渡状态中间体的稳定化中起作用。在结构中,该环远离活性位点,并且部分无序化,这表明环的定位是灵活的。令人感兴趣的是,在CasE的apo结构中,该环也无序化(Ebihara等,ProteinSci.15,1494-9(2006)),这表明对于该环的稳定需要正确的RNA构象。将对于CasE/19-核苷酸RNA复合物中获得的第二晶形(P212121)用于测定结构,其揭示在催化构象中结合A22和U23的RNA翻转出螺旋。然而,在该结构中包含R158和K160的环仍然无序,这表明对于该蛋白质结构的稳定可能也需要G24结合。对相同复合物的两种不同的RNA构象的观察表明RNA可取样多种结构状态,并且它需要G24将其锁定至具催化能力的构象内。尽管参照其具体实施方案已经描述本发明,但本领域技术人员应当理解,在未背离本发明的真实精神和范围下可进行各种改变并且等同形式可被替代。此外,可进行许多修改以使特定情况、材料、物质组分、工序、工序步骤适应本发明的主题、精神和范围。所有这些修改旨在涵盖在所附权利要求的范围内。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1