新型AAV衣壳和含有其的组合物

文档序号:28219890发布日期:2021-12-29 01:16阅读:121来源:国知局
新型aav衣壳和含有其的组合物
背景技术
::1.腺相关病毒(aav)在人类基因疗法中具有广阔的前景,且由于其能够提供长期基因表达且缺乏致病性,因此在各种研究中已广泛用于靶向肝脏、肌肉、心脏、脑、眼睛、肾脏和其它组织。aav属于细小病毒家族,且每个都含有单股dna,两侧是两个反向末端重复序列。已经报道了数十种天然存在的aav衣壳;其独特衣壳结构使其能够识别和转导不同的细胞类型和器官。2.自1981年开始第一次试验以来,基于aav载体的基因治疗的临床试验中没有报告任何与载体相关的毒性。aav载体在临床试验中不断积累的安全记录,结合已证明的功效,表明aav是一个有前景的基因递送平台。另一个有吸引力的特征是aav相对容易操纵,因为它是一种单股dna病毒,具有小基因组(~4.7kb)和简单的遗传成分‑反向末端重复序列(itr)以及rep和cap基因。aav载体中只需要itr和aav衣壳蛋白,其中itr作为载体生产的复制和包装信号,且衣壳蛋白不仅形成衣壳以容纳载体基因组dna,而且决定组织向性以将载体基因组递送到靶细胞和组织。3.由于aav的低免疫原性和非致病性,aav是基因疗法最有效的候选载体之一。然而,尽管允许有效的基因转移,但目前在临床中使用的aav载体可能会受到对病毒的预先存在的免疫力和限制的组织向性的阻碍。需要新的和更有效的aav载体。技术实现要素:4.在一个实施例中,本文提供一种重组腺相关病毒(raav),其具有包含衣壳蛋白的aav衣壳,所述衣壳蛋白包含seqidno:2(aavrh.92)、seqidno:4(aavrh.93)或seqidno:6(aavrh.91.93),且在衣壳中包装有包含异源核酸序列的载体基因组。在某些实施例中,raav具有包含衣壳蛋白的衣壳,所述衣壳蛋白由seqidno:1、seqidno:3或seqidno:5的aav衣壳序列,或与seqidno:1、seqidno:3或seqidno:5具有至少90%、至少95%、至少97%、至少98%、或至少99%一致性的序列的表达产生,且在衣壳中包装有包含异源核酸序列的载体基因组。5.在某些实施例中,本文提供raav,其中aav衣壳包含aav衣壳蛋白,所述aav衣壳蛋白包含:(1)选自以下的vp1蛋白的异质群体:通过由编码seqidno:2的1至733的预测氨基酸序列的核酸序列的表达产生的vp1蛋白、由seqidno:1产生的vp1蛋白、或由与seqidno:1具有至少70%一致性的核酸序列产生的vp1蛋白,所述核酸序列编码seqidno:2的1至733的预测氨基酸序列;选自以下的vp2蛋白的异质群体:通过由编码seqidno:2的至少约氨基酸138至733的预测氨基酸序列的核酸序列的表达产生的vp2蛋白、由包含seqidno:1的至少核苷酸412至2199的序列产生的vp2蛋白、或由与seqidno:1的至少核苷酸412至2199具有至少70%一致性的核酸序列产生的vp2蛋白,所述核酸序列编码seqidno:2的至少约氨基酸138至738的预测氨基酸序列;选自以下的vp3蛋白的异质群体:通过由编码seqidno:2的至少约氨基酸204至738的预测氨基酸序列的核酸序列的表达产生的vp3蛋白、由包含seqidno:1的至少核苷酸589到2199的序列产生的vp3蛋白、或由与seqidno:1的至少核苷酸589至2199具有至少70%一致性的核酸序列产生的vp3蛋白,所述核酸序列编码seqidno:2的至少约氨基酸197至733的预测氨基酸序列;和/或(2)作为编码seqidno:2的氨基酸序列的核酸序列的产物的vp1蛋白的异质群体、作为编码seqidno:2的至少约氨基酸138至733的氨基酸序列的核酸序列的产物的vp2蛋白的异质群体和作为编码seqidno:2的至少氨基酸197至733的核酸序列的产物的vp3蛋白的异质群体,其中:vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群,所述氨基酸修饰包含seqidno:2中的天冬酰胺‑甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(n),并且任选地进一步含有包含其它脱酰胺化的氨基酸的亚群,其中所述脱酰胺化引起氨基酸变化。6.在某些实施例中,本文提供raav,其中aav衣壳包含aav衣壳蛋白,所述aav衣壳蛋白包含:(1)选自以下的vp1蛋白的异质群体:通过由编码seqidno:4的1至728的预测氨基酸序列的核酸序列的表达产生的vp1蛋白、由seqidno:3产生的vp1蛋白、或由与seqidno:3具有至少70%一致性的核酸序列产生的vp1蛋白,所述核酸序列编码seqidno:4的1至728的预测氨基酸序列;选自以下的vp2蛋白的异质群体:通过由编码seqidno:4的至少约氨基酸138至728的预测氨基酸序列的核酸序列的表达产生的vp2蛋白、由包含seqidno:3的至少核苷酸412至2184的序列产生的vp2蛋白、或由与seqidno:3的至少核苷酸412至2184具有至少70%一致性的核酸序列产生的vp2蛋白,所述核酸序列编码seqidno:4的至少约氨基酸138至728的预测氨基酸序列;选自以下的vp3蛋白的异质群体:通过由编码seqidno:4的至少约氨基酸199至728的预测氨基酸序列的核酸序列的表达产生的vp3蛋白、由包含seqidno:3的至少核苷酸595到2184的序列产生的vp3蛋白、或由与seqidno:3的至少核苷酸595至2184具有至少70%一致性的核酸序列产生的vp3蛋白,所述核酸序列编码seqidno:4的至少约氨基酸199至728的预测氨基酸序列;和/或(2)作为编码seqidno:4的氨基酸序列的核酸序列的产物的vp1蛋白的异质群体、作为编码seqidno:4的至少约氨基酸138至728的氨基酸序列的核酸序列的产物的vp2蛋白的异质群体和作为编码seqidno:4的至少氨基酸197至728的核酸序列的产物的vp3蛋白的异质群体,其中:vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群,所述氨基酸修饰包含seqidno:4中的天冬酰胺‑甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(n),并且任选地进一步含有包含其它脱酰胺化的氨基酸的亚群,其中所述脱酰胺化引起氨基酸变化。7.在某些实施例中,本文提供raav,其中aav衣壳包含aav衣壳蛋白,所述aav衣壳蛋白包含:(1)选自以下的vp1蛋白的异质群体:通过由编码seqidno:6的1至733的预测氨基酸序列的核酸序列的表达产生的vp1蛋白、由seqidno:5产生的vp1蛋白、或由与seqidno:5具有至少70%一致性的核酸序列产生的vp1蛋白,所述核酸序列编码seqidno:6的1至733的预测氨基酸序列;选自以下的vp2蛋白的异质群体:通过由编码seqidno:6的至少约氨基酸138至733的预测氨基酸序列的核酸序列的表达产生的vp2蛋白、由包含seqidno:5的至少核苷酸412至2199的序列产生的vp2蛋白、或由与seqidno:5的至少核苷酸412至2199具有至少70%一致性的核酸序列产生的vp2蛋白,所述核酸序列编码seqidno:6的至少约氨基酸138至738的预测氨基酸序列;选自以下的vp3蛋白的异质群体:通过由编码seqidno:6的至少约氨基酸203至733的预测氨基酸序列的核酸序列的表达产生的vp3蛋白、由包含seqidno:5的至少核苷酸607到2199的序列产生的vp3蛋白、或由与seqidno:5的至少核苷酸607至2199具有至少70%一致性的核酸序列产生的vp3蛋白,所述核酸序列编码seqidno:6的至少约氨基酸203至733的预测氨基酸序列;和/或(2)作为编码seqidno:6的氨基酸序列的核酸序列的产物的vp1蛋白的异质群体、作为编码seqidno:6的至少约氨基酸138至733的氨基酸序列的核酸序列的产物的vp2蛋白的异质群体和作为编码seqidno:6的至少氨基酸203至733的核酸序列的产物的vp3蛋白的异质群体,其中:vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群,所述氨基酸修饰包含seqidno:6中的天冬酰胺‑甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(n),并且任选地进一步含有包含其它脱酰胺化的氨基酸的亚群,其中所述脱酰胺化引起氨基酸变化。8.在另一实施例中,本文提供一种组合物,其至少包含raav和生理学上相容的载剂、缓冲剂、佐剂和/或稀释剂。在某些实施例中,组合物被调配成用于鞘内递送,且载体基因组包含编码用于递送至中枢神经系统的基因产物的核酸序列。在另一实施例中,组合物被调配成用于静脉内递送、鼻内和/或肌肉内递送。9.在某些实施例中,提供一种适用于产生raav的系统。所述系统包含:(a)编码seqidno:2、4或6的氨基酸序列的核酸序列;(b)适合于包装至aav衣壳中的核酸分子,其中所述核酸分子包含至少一个aav反向末端重复序列(itr)和编码基因产物的非aav核酸序列,所述核酸序列与引导所述产物在宿主细胞中的表达的序列可操作地连接;和(c)允许将核酸分子包装至raav衣壳中的足够aavrep功能和辅助功能。10.在某些实施例中,提供一种产生包含aav衣壳的raav的方法。所述方法包含培养宿主细胞的步骤,所述宿主细胞含有:(a)编码包含seqidno:2、4或6的氨基酸序列的aav衣壳蛋白的核酸分子;(b)功能rep基因;(c)包含aav5′itr、aav3′itr和转基因的小基因;和(d)允许将所述小基因包装到aav衣壳中的足够辅助功能。11.在又一实施例中,提供含有本文所述的raav、表达盒或核酸分子的宿主细胞。12.在某些实施例中,提供将转基因递送到细胞的方法。所述方法包括使细胞与如本文所述的raav接触的步骤,其中raav包含转基因。附图说明13.图1示出用于aav‑sga工作流程的图。从恒河猴组织样本分离基因组dna并且针对aav衣壳基因的存在进行筛选。对aav阳性dna进行终点稀释且进行另一轮pcr。根据泊松分布,在不超过30%的孔中产生pcr产物的dna稀释液在80%的时间内每个阳性pcr含有一个可扩增的dna模板。使用illuminamiseq2x150或2x250配对末端测序平台对阳性扩增子进行测序,并使用spades组装器从头组装所得读段。14.图2是示出新型aav天然分离物和代表性进化枝对照的dna基因组序列的相邻连接系统发生的图。15.图3a‑图3d示出aavrh.92(seqidno:1)、aavrh.93(seqidno:3)、aavrh91.93(seqidno:5)和aav7(seqidno:7)衣壳的核酸序列的比对。16.图4a和图4b示出aavrh.92(seqidno:2)、aavrh.93(seqidno:4)、aavrh91.93(seqidno:6)和aav7(seqidno:8)衣壳的氨基酸序列的比对。17.图5a‑图5d示出注射后14天小鼠组织中的egfp转基因生物分布。(图5a和图5b)以每只小鼠1e12gc的剂量向c57bl/6小鼠iv注射含有cb7.ci.egfp.wpre.rbg转基因的aav衣壳(n=5)。(图5c和图5d)以每只小鼠1e11gc的剂量向c57bl/6小鼠脑室内icv注射含有cb7.ci.egfp.wpre.rbg转基因的各种aav衣壳(以6.9e10gc/小鼠给药的进化枝a载体)(n=5)。值表示为平均值±sd;*p<0.01,**p<0.001。18.图6a和图6b示出im递送aav载体后肌肉中的lacz表达的分析。向小鼠施用3e9gc的具有各种衣壳并在cmv启动子下表达lacz的载体。在第20天,收集肌肉组织,并通过x‑gal染色评估转基因表达。19.图7示出im递送各种aav载体后血清中mab的含量。向b6小鼠施用1e11gc的载体,所述载体在tmck启动子下表达3d6抗体。20.图8示出表达3d6或lacz转基因的载体的产率(相对于aav8)。21.图9示出nhp中汇集的带条形码的载体研究的实验设计(图10a‑图10c中示出的数据)。五个新型衣壳和五个对照(aavrh.90、aavrh9.1、aavrh.92、aavrh.93、aavrh.91.93、aav8、aav6.2、aavrh32.33、aav7和aav9)用具有独特6bp条形码的改良的atg耗尽gfp转基因包装。将载体以等量汇集并在食蟹猴体内iv或icm注射(总剂量:2e13gc/kgiv和3e13gcicm)。iv注射的动物在基线时对aav6、aav8和aavrh32.33呈血清阴性,并且针对aav7和aav9的中和抗体滴度分别为1∶5和1∶10。22.图10a‑图10c是示出在iv递送(图10a和图10b)和icm递送(图10c)之后带条形码的衣壳的rna表达分析的图。iv施用‑2e13gc/kg总剂量,第30天尸体剖检(此动物在基线时具有低含量的aav7和aav9nabs)。icm施用‑3e13gc/动物,第30天尸体剖检。每个组织rna样品中的条形码频率被归一化为注射输入材料中的频率,使得每个条码在混合物中具有等效的表示(10%)。十个载体的输入量范围为8.5‑12%。值表示为平均值±sem,**p<0.001。23.图11是示出nhp条形码研究中使用的各种aav衣壳的小规模制剂滴度的条形图。每个点代表一个单独的小规模制剂。24.图12a和图12b示出脑内皮细胞中的靶向ly6表达对balb/crag‑/‑小鼠中的php.b转导的影响。(图12a)实验设计‑向小鼠施用(iv1e12gc/小鼠)含有用于表达ly6a或ly6c1的转基因的aavrh.92,且接着在第7天,施用表达egfp的aav9或aav9php.b。(图12b)egfp检测以评估转基因向脑组织的递送。25.图13示出小鼠脑的组织学分析,其展示iv注射后14天脉管系统中的aavrh92.cb7.ci.egfp.wpre.rbg转导,每只c57bl/6小鼠1e12gc。暗染色:抗gfp;比例尺:100μm具体实施方式26.通过使用aav单基因组扩增来探索aav在其天然哺乳动物宿主中的遗传变异,所述技术用于从病毒群体内准确分离单个aav基因组(图1)。本文描述从恒河猴组织中分离出新的aav序列,所述序列可以归类为各种进化枝。我们在静脉内(iv)和脑室内(icv)递送后在小鼠中以及在iv和大池内(icm)递送后在nhp中评估了天然分离物衍生的aav载体的生物学特性。与原型进化枝成员对照相比时,结果确定了新aav变体的进化枝特异性和可变转导模式。27.本文提供了重组aavrh.90载体,其具有aavrh.92、aavrh.93或aavrh91.93衣壳和编码转基因的核酸,所述转基因在递送至受试者后处于指导其表达的调节序列的控制下。提供含有这些载体的组合物。本文所述的方法涉及使用raav靶向所关注的组织以治疗各种病状。28.有趣的是,aavrh.92在iv递送后在cd31阳性脑血管内皮细胞中显示出高水平的转导。这种细胞类型的有效转导具有治疗多种神经血管疾病的潜力。在某些实施例中,本文提供包含非常适合递送至神经脉管系统的aavrh.92衣壳的载体。在某些实施例中,需要鞘内递送,包括例如通过icm递送而递送至脑。在某些实施例中,包含本文所述的衣壳的载体非常适合递送至心脏(平滑肌)。在其它实施例中,包含本文所述的衣壳的载体非常适合递送至骨骼(横纹)肌。载体可以全身递送或通过适合靶向这些组织的施用途径靶向递送。29.除非另外定义,否则本文所使用的技术和科学术语具有与本发明所属领域的普通技术人员通常所理解和参照公开的文本相同的含义,这些术语为本领域的技术人员提供了本技术中使用的许多术语的通用指南。以下定义仅出于清楚起见而提供且并不打算限制所要求的发明。如本文所用,术语“一个(a/an)”是指一个或多个,例如,“一个宿主细胞”应理解为表示一个或多个宿主细胞。如此,术语“一个(a/an)”、“一个或多个”和“至少一个”在本文可互换地使用。如本文所用,除非另有说明,否则术语“约”意指相对于给定参考的10%的变化性。虽然说明书中的各个实施例是使用“包含”语言来呈现的,但是在其它情况下,也意图使用“由......组成”或“基本上由......组成”的语言来解释和描述相关的实施例。30.关于以下描述,希望在另一实施例中,本文描述的每种组合物适用于本发明的方法。另外,还希望在另一实施例中,被描述为适用于所述方法的每种组合物本身是本发明的实施例。[0031]“重组aav”或“raav”是含有两个元件的dna酶抗性病毒颗粒,所述两个元件即aav衣壳和至少含有包装在aav衣壳内的非aav编码序列的载体基因组。除非另有说明,否则此术语可以与短语“raav载体”互换使用。raav是“复制缺陷型病毒”或“病毒载体”,因为其缺少任何功能性aavrep基因或功能性aavcap基因并且不能产生子代。在某些实施例中,仅aav序列是aav反向末端重复序列(itr),通常定位在载体基因组的5′和3′最末端处,以允许定位在itr之间的基因和调节序列包装在aav衣壳内。[0032]如本文所用,“载体基因组”是指包装在形成病毒颗粒的raav衣壳内部的核酸序列。此类核酸序列含有aav反向末端重复序列(itr)。在本文的实例中,载体基因组至少含有从5′到3′的aav5′itr、编码序列和aav3′itr。在某些实施例中,itr来自aav2,可以选择与衣壳不同,或与全长itr不同的源aav。在某些实施例中,itr来自与在产生或反式补充aav期间提供rep功能的aav源相同的aav。另外,可以使用其它itr。另外,载体基因组含有引导基因产物表达的调节序列。在本文中更详细地论述载体基因组的合适成分。载体基因组在本文中有时被称作“小基因”。[0033]术语“表达盒”是指包含转基因序列和其调节序列(例如启动子、增强子、polya)的核酸分子,所述表达盒可以被包装到病毒载体(例如病毒颗粒)的衣壳中。通常,这种用于产生病毒载体的表达盒含有转基因序列,所述转基因序列的两侧是病毒基因组的包装信号和其它表达控制序列,例如本文所述的那些。例如,对于aav病毒载体,包装信号是5′反向末端重复序列(itr)和3′itr。在某些实施例中,术语“转基因”可以与“表达盒”互换使用。在其它实施例中,术语“转基因”仅仅是指所选基因的编码序列。[0034]raav由aav衣壳和载体基因组构成。aav衣壳是vp1的异质群体、vp2的异质群体和vp3蛋白的异质群体的组装。如本文所用,当用于指vp衣壳蛋白时,术语“异源”或其任何语法变型是指由不相同的元件组成的群体,例如具有含有不同的经过修饰的氨基酸序列的vp1、vp2或vp3单体(蛋白)。[0035]如本文所用,与vp1、vp2和vp3蛋白(可替代地被称为同种型)结合使用的术语“异质群体”是指衣壳内的vp1、vp2和vp3蛋白的氨基酸序列中的差异。aav衣壳含有具有来自预测的氨基酸残基的修饰的vp1蛋白内、vp2蛋白内和vp3蛋白内的亚群。这些亚群至少包括某些脱酰胺的天冬酰胺(n或asn)残基。例如,某些亚群包含天冬酰胺‑甘氨酸对中的至少一个、两个、三个或四个高度脱酰胺的天冬酰胺(n)位置,并且任选地进一步包含其它脱酰胺的氨基酸,其中脱酰胺引起氨基酸变化和其它任选的修饰。[0036]如本文所用,除非另有说明,否则vp蛋白的“亚群”是指一组vp蛋白,所述一组vp蛋白具有至少一个限定的共同特性,并且由参考组的至少一个组成员到少于所有成员组成。例如,除非另有说明,否则vp1蛋白的“亚群”可以是组装的aav衣壳中的至少一种(1)vp1蛋白,并且少于所有vp1蛋白。除非另有说明,否则vp3蛋白的“亚群”可以是少于组装的aav衣壳中的所有vp3蛋白的一种(1)vp3蛋白。例如,vpl蛋白可以是vp蛋白的亚群;vp2蛋白可以是vp蛋白的单独的亚群,并且vp3是组装的aav衣壳中的vp蛋白的又另外的亚群。在另一实例中,vp1、vp2和vp3蛋白可含有具有不同修饰的亚群体,例如,至少一种、两种、三种或四种高度脱酰胺化的天冬酰胺,例如在天冬酰胺‑甘氨酸对处。[0037]除非另有说明,否则高度脱酰胺化是指与在参考氨基酸位置处的预测的氨基酸序列相比,在参考的氨基酸位置处被至少45%脱酰胺化、至少50%脱酰胺化、至少60%脱酰胺化、至少65%脱酰胺化、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或至多约100%脱酰胺化。此类百分比可以使用2d凝胶、质谱技术或其它合适的技术来确定。[0038]不希望受理论束缚,aav衣壳中的vp蛋白中的至少高度脱酰胺的残基的脱酰胺化被认为本质上主要是非酶促的,这是由衣壳蛋白内的官能团引起的,所述官能团使所选天冬酰胺脱酰胺化,并在较小程度上使谷氨酰胺残基脱酰胺化。大多数脱酰胺化vp1蛋白的有效衣壳组装表明这些事件在衣壳组装之后发生,或者单独单体(vp1、vp2或vp3)中的脱酰胺化在结构上具有良好的耐受性,并且在很大程度上不会影响组装动力学。vp1独特(vp1‑u)区(约aa1‑137)中的广泛的脱酰胺化通常被认为在细胞进入之前定位在内部,这表明vp脱酰胺化可以在衣壳组装之前发生。[0039]不希望受理论束缚,n的脱酰胺化可以通过其c端残基的骨架氮原子对asn的侧链酰胺基碳原子进行亲核攻击而发生。据信形成了中间闭环的琥珀酰亚胺残基。然后,琥珀酰亚胺残基进行快速水解以产生最终产物天冬氨酸(asp)或异天冬氨酸(isoasp)。因此,在某些实施例中,天冬酰胺(n或asn)的脱酰胺化产生asp或isoasp,其可以通过琥珀酰亚胺中间体相互转化,例如如下文所示的。[0040][0041]如本文所提供的,vp1、vp2或vp3中的每个脱酰胺的n可以独立地是天冬氨酸(asp)、异天冬氨酸(isoasp)、天冬氨酸和/或asp和isoasp的相互转化的共混物或其组合。可以存在任何合适比率的α‑和异天冬氨酸。例如,在某些实施例中,比率可以是10∶1到1∶10天冬氨酸∶异天冬氨酸、约50∶50天冬氨酸∶异天冬氨酸或约1∶3天冬氨酸∶异天冬氨酸,或另一所选比率。[0042]在某些实施例中,一种或多种谷氨酰胺(q)可以脱酰胺化为谷氨酸(glu),即α‑谷氨酸、γ‑谷氨酸(glu)或α‑和γ‑谷氨酸的共混物,其可以通过常见的戊二酰亚胺(glutarinimide)中间体相互转化。可以存在任何合适比率的α‑和γ‑谷氨酸。例如,在某些实施例中,比率可以是10∶1到1∶10α∶γ、约50∶50α∶γ或约1∶3α∶γ或另一所选比率。[0043][0044]因此,raav包括vp1、vp2和/或vp3蛋白的raav衣壳内具有脱酰胺化的氨基酸的亚群,至少包括至少一个包含至少一种高度脱酰胺化的天冬酰胺的亚群。另外,其它修饰可以包括异构化,特别是在所选天冬氨酸(d或asp)残基位置处。在仍其它实施例中,修饰可以包括在asp位置处的酰胺化。[0045]在某些实施例中,aav衣壳含有具有至少1个、至少2个、至少3个、至少4个、至少5个到至少约25个脱酰胺化的氨基酸残基位置的vp1、vp2和vp3的亚群体,与vp蛋白的经过编码的氨基酸序列相比,所述vp1、vp2和vp3的至少1%到10%、至少10%到25%、至少25%到50%、至少50%到70%、至少70%到100%、至少75%到100%、至少80%到100%或至少90%到100%被脱酰胺化。这些中的大部分可以是n残基。然而,q残基也可以被脱酰胺化。[0046]如本文所用,“经编码的氨基酸序列”是指基于被翻译成氨基酸的参考核酸序列的已知dna密码子的翻译而预测的氨基酸。下表展示了dna密码子和二十种常见氨基酸,分别示出了单字母代码(slc)和三个字母代码(3lc)。[0047]氨基酸slc3lcdna密码子异亮氨酸iileatt、atc、ata亮氨酸lleuctt、ctc、cta、ctg、tta、ttg缬氨酸vvalgtt、gtc、gta、gtg苯丙氨酸fphettt、ttc甲硫氨酸mmetatg半胱氨酸ccystgt、tgc丙氨酸aalagct、gcc、gca、gcg甘氨酸gglyggt、ggc、gga、ggg脯氨酸pprocct、ccc、cca、ccg苏氨酸tthract、acc、aca、acg丝氨酸ssertct、tcc、tca、tcg、agt、agc酪氨酸ytyrtat、tac色氨酸wtrptgg谷氨酰胺qglncaa、cag天冬酰胺nasnaat、aac组氨酸hhiscat、cac谷氨酸eglugaa、gag天冬氨酸daspgat、gac赖氨酸klysaaa、aag精氨酸rargcgt、cgc、cga、cgg、aga、agg终止密码子终止taa、tag、tga[0048]在某些实施例中,raav具有含有vp1、vp2和vp3蛋白的aav衣壳,所述蛋白具有包含在本文提供的表中所阐述的位置处的两个、三个、四个、五个或更多个脱酰胺化的残基的组合的亚群,并以引用的方式并入本文中。[0049]raav中的脱酰胺化可以使用2d凝胶电泳和/或质谱和/或蛋白质建模技术来确定。在线色谱可以使用acclaimpepmap柱和与qexactivehf和nanoflex源(赛默飞世尔科技公司(thermofisherscientific))耦合的thermoultimate3000rslc系统(赛默飞世尔科技公司)执行。ms数据是使用用于qexactivehf的数据依赖性前20种方法获取的,所述方法从调查扫描(200‑2000m/z)中动态选择最丰富的尚未测序的前体离子。测序通过高能碰撞解离片段进行,其中通过预测性自动增益控制确定的目标值为1e5离子,并且以4m/z的窗口进行前体分离。在m/z200下以120,000的分辨率获取调查扫描。hcd光谱的分辨率可以在m/z200下设置为30,000,其中最大离子注入时间为50毫秒,并且归一化碰撞能量为30。s‑透镜rf水平可以设置为50,以使消化肽所占据的m/z区达到最佳传输。可以从片段选择中排除具有单个、未分配或六个和更高电荷状态的前体离子。biopharmafinder1.0软件(赛默飞世尔科技公司)可以用于分析所获取的数据。对于肽作图,使用单进入蛋白fasta数据库进行搜索,其中脲基甲基化设置为固定的修饰;并将氧化、脱酰胺化和磷酸化设置为可变修饰、10ppm质量准确度、高蛋白酶特异性和置信水平为0.8的ms/ms光谱。合适的蛋白酶的实例可包括例如胰蛋白酶或胰凝乳蛋白酶。脱酰胺化的肽的质谱鉴定相对简单,因为脱酰胺化向完整分子的质量添加了+0.984da(‑oh基团与‑nh2基团之间的质量差)。特定肽的脱酰胺化百分比通过将脱酰胺化的肽的质量面积除以脱酰胺化的和天然的肽的面积之和来确定。考虑到可能的脱酰胺化位点的数量,在不同位点处被脱酰胺化的同量异位物种可以在单个峰中共迁移。因此,源自具有多个潜在的脱酰胺化位点的肽的片段离子可以用于定位或区分多个脱酰胺化位点。在这些情况下,观察到的同位素图案内的相对强度可以用于特异性确定不同的脱酰胺化的肽异构体的相对丰度。此方法假设所有异构物种的片段化效率是相同的,并且在脱酰胺化位点上是独立的。本领域的技术人员将理解的是,可以使用这些说明性方法的多种变型。例如,合适的质谱仪可包括例如四极杆飞行时间质谱仪(qtof),如watersxevo或agilent6530,或orbitrap仪器,如orbitrapfusion或orbitrapvelos(赛默飞世尔科技公司)。合适的液相色谱系统包括例如来自沃特世(waters)的acquityuplc系统或agilent系统(1100或1200系列)。合适的数据分析软件可包括例如masslynx(沃特世)、pinpoint和petfinder(赛默飞世尔科技公司)、mascot(矩阵科学公司(matrixscience))、peaksdb(生物信息学解决方案公司(bioinformaticssolutions))。可以在例如x.jin等人于2017年6月16日在线公开的《人类基因疗法方法(hugenetherapymethods)》,第28卷,第5期,第255‑267页中描述仍其它技术。[0050]除脱酰胺化之外,可能发生不会导致一个氨基酸转化为不同的氨基酸残基的其它修饰。这种修饰可包括乙酰化残基、异构化、磷酸化或氧化。[0051]脱酰胺化的调节:在某些实施例中,aav被修饰成改变天冬酰胺‑甘氨酸对中的甘氨酸,以降低脱酰胺化。在其它实施例中,将天冬酰胺改变为不同的氨基酸,例如以较慢速率进行脱酰胺化的谷氨酰胺;或改变为缺乏酰胺基的氨基酸(例如,含有酰胺基的谷氨酰胺和天冬酰胺);和/或改变为缺乏胺基的氨基酸(例如,含有胺基的赖氨酸、精氨酸和组氨酸)。如本文所用,缺乏酰胺或胺侧基的氨基酸是指例如甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸、胱氨酸、苯丙氨酸、酪氨酸或色氨酸和/或脯氨酸。如所描述的修饰可以在经过编码的aav氨基酸序列中存在的天冬酰胺‑甘氨酸对中的一个、两个或三个天冬酰胺‑甘氨酸对中。在某些实施例中,在所有四个天冬酰胺‑甘氨酸对中没有进行此类修饰。因此,一种用于降低具有较低脱酰胺化速率的aav和/或工程化aav变体的脱酰胺化的方法。另外地或可替代地,可以将一种或多种其它酰胺氨基酸改变为非酰胺氨基酸以降低aav的脱酰胺化。在某些实施例中,本文所描述的突变aav衣壳含有天冬酰胺‑甘氨酸对中的突变,使得甘氨酸变为丙氨酸或丝氨酸。突变aav衣壳可以含有一个、两个或三个突变体,其中参考aav天然地含有四个ng对。在某些实施例中,aav衣壳可以含有一个、两个、三个或四个此类突变体,其中参考aav天然地含有五个ng对。在某些实施例中,突变aav衣壳含有ng对中的仅单个突变。在某些实施例中,突变aav衣壳含有两个不同的ng对中的突变。在某些实施例中,突变aav衣壳含有定位在aav衣壳中的结构上分开的位置中的两个不同的ng对中的突变。在某些实施例中,突变不在vp1独特区中。在某些实施例中,突变中的一个突变不在vp1独特区中。任选地,突变aav衣壳不含有ng对中的修饰,但是含有突变以最小化或消除定位在ng对的外部的一个或多个天冬酰胺或谷氨酰胺中的脱酰胺化。[0052]在某些实施例中,提供了一种增加raav载体的效力的方法,所述方法包含使aav衣壳工程化,这消除了野生型aav衣壳中的ng中的一个或多个ng。在某些实施例中,“ng”的“g”的编码序列被工程化为对另一种氨基酸进行编码。在下文的某些实例中,“s”或“a”被取代。然而,可以选择其它合适的氨基酸编码序列。[0053]这些氨基酸修饰可以通过常规的基因工程化技术进行。例如,可以产生含有经过修饰的aavvp密码子的核酸序列,其中修饰天冬酰胺‑甘氨酸对中对甘氨酸进行编码的密码子中的一到三个密码子以对除甘氨酸之外的氨基酸进行编码。在某些实施例中,含有经过修饰的天冬酰胺密码子的核酸序列可以在天冬酰胺‑甘氨酸对中的一到三个天冬酰胺‑甘氨酸对处被工程化,使得经过修饰的密码子对除精氨酸之外的氨基酸进行编码。每个经修饰的密码子可以对不同的氨基酸进行编码。或者,改变的密码子中的一个或多个密码子可以对相同的氨基酸进行编码。在某些实施例中,这些经过修饰的aavrh.92、aavrh.93或aavrh.91.93核酸序列可以用于产生具有比天然aavrh.92、aavrh.93或aavrh.91.93衣壳脱酰胺化程度更低的衣壳的突变raav。此类突变raav可以具有降低的免疫原性和/或增加储存时的稳定性,特别是以悬浮液形式储存时的稳定性。[0054]本文还提供了对具有降低的脱酰胺化的aav衣壳进行编码的核酸序列。设计对此aav衣壳进行编码的核酸序列,包括dna(基因组或cdna)或rna(例如,mrna)在本领域的技术范围内。此类核酸序列可以被密码子优化以在所选系统(即,细胞类型)中进行表达并且可以通过各种方法设计。可以使用在线可用的方法(例如,geneart)、公开的方法或提供密码子优化服务的公司(例如,dna2.0)(加利福尼亚州门洛帕克市(menlopark,ca))来执行此优化。例如,在国际专利公开第wo2015/012924号中描述了一种密码子优化方法,其以全文引用的方式并入本文中。还参见例如美国专利公开案第2014/0032186号和美国专利公开案第2006/0136184号。适合地,修饰产物的开放阅读框(orf)的全长。然而,在一些实施例中,仅orf的片段可以被改变。通过使用这些方法中的一种方法,可以将频率应用于任何给定的多肽序列,并产生对多肽进行编码的经密码子优化的编码区的核酸片段。许多选项可用于对密码子进行实际改变或者可用于合成如本文所述地设计的密码子优化的编码区。此类修饰或合成可以使用本领域普通技术人员已熟知的标准和常规分子生物学操作来进行。在一种方法中,通过标准方法合成各自长度为80‑90个核苷酸且跨越希望的序列的长度的一系列互补寡核苷酸对。这些寡核苷酸对被合成为使得在退火时它们形成80‑90个碱基对的双股片段,所述双股片段含有粘性末端,例如在所述对中的各寡核苷酸被合成来延伸超过与所述对中另一寡核苷酸互补的区域3个、4个、5个、6个、7个、8个、9个、10个或更多个碱基。每对寡核苷酸的单股末端被设计为用另一对寡核苷酸的单股末端粘接。允许这些寡核苷酸对粘接,并且然后允许约五至六个这些双链片段经由粘性单股末端一起粘接,并且随后它们连接在一起并克隆到标准细菌克隆载体中,例如可获自加利福尼亚州卡尔斯巴德英杰公司(invitrogencorporation,carlsbad,calif)的载体。然后通过标准方法对构建体进行测序。制备由连接在一起的80到90个碱基对片段的5到6个片段(即约500个碱基对的片段)组成的这些构建体中的若干构建体,以使得整个希望的序列以一系列质粒构建体表示。然后用适当的限制性酶切割这些质粒的插入物并且将其连接在一起以形成最终构建体。然后将最终构建体克隆到标准细菌克隆载体中,并进行测序。另外的方法对于技术人员而言将立即是清楚的。另外,基因合成易于商购获得。[0055]在某些实施例中,提供了aav衣壳,所述aav衣壳具有含有多个高度脱酰胺化的“ng”位置的aav衣壳同种型(即,vp1、vp2、vp3)的异质群体。在某些实施例中,高度脱酰胺化的位置在下文参考预测的全长vp1氨基酸序列鉴定的位置中。在其它实施例中,衣壳基因被修饰成使得参考的“ng”被消融,并且突变体“ng”被工程化到另一个位置中。[0056]如本文所用,术语“靶细胞”和“靶组织”可以指打算被受试者aav载体转导的任何细胞或组织。所述术语可以指肌肉、肝脏、肺、气道上皮、中枢神经系统、神经元、眼睛(眼细胞)或心脏中的任何一种或多种。在一个实施例中,靶组织为肝脏。在另一实施例中,靶组织为心脏。在另一实施例中,靶组织为脑。在另一实施例中,靶组织为肌肉。[0057]如本文所用,术语“哺乳动物受试者”或“受试者”包括需要本文所述的治疗或预防方法的任何哺乳动物,尤其包括人类。需要此类治疗或预防的其它哺乳动物包括狗、猫或其它驯养动物、马、家畜、实验动物,包括非人类灵长类动物等。受试者可以是雄性或雌性。[0058]如本文所使用,术语“宿主细胞”可以指重组raav由质粒产生的包装细胞系。在替代方案中,术语“宿主细胞”可以指需要转基因表达的靶细胞。[0059]a.aav衣壳[0060]本文提供具有序列表中所阐述的vp1序列的新型aav衣壳蛋白:aavrh.92(seqidno:2)、aavrh.93(seqidno:4)或aavrh.91.93(seqidno:6)。aav衣壳由三个重叠编码序列组成,由于使用替代起始密码子,所述编码序列的长度不同。这些可变蛋白被称为vp1、vp2和vp3,其中vp1是最长的且vp3是最短的。aav粒子由比率为约1∶1∶10(vp1∶vp2∶vp3)的所有三种衣壳蛋白组成。vp3包含在n端的vp1和vp2中,是构建粒子的主要结构成分。可使用若干不同编号系统来指代衣壳蛋白。为方便起见,如本文所用,使用vp1编号来指代aav序列,所述编号从vp1的第一个残基的aa1开始。但是,本文所述的衣壳蛋白包括vp1、vp2和vp3(在本文中可与vp1、vp2和vp3互换使用)。衣壳的可变蛋白的编号如下:[0061]核苷酸(nt)[0062]aavrh.92:vp1‑nt1至2199;vp2‑nt412至2199;vp3‑seqidno:1的nt589至2199;[0063]aavrh.93:vp1‑nt1至2184;vp2‑nt412至2184;vp3‑seqidno:3的nt595至2184;[0064]aavrh.91.93:vp1‑nt1至2199;vp2‑nt412至2199;vp3‑seqidno:5的nt607至2199。[0065]本文所述的衣壳与aav7(seqidno:7)的比对在图3a‑图3d中示出。[0066]氨基酸(aa)[0067]aavrh.92:aavp1‑1至733;vp2‑aa138至733;vp3‑seqidno:2的aa197至733;[0068]aavrh.93:aavp1‑1至728;vp2‑aa138至728;vp3‑seqidno:4的aa199至728;[0069]aavrh.91.93:aavp1‑1至733;vp2‑aa138至733;vp3‑seqidno:4的aa203至733。[0070]本文所述的衣壳与aav7(seqidno:8)的比对在图4a‑图4b中示出。no:2的氨基酸序列的核酸序列的产物的vp1蛋白的异质群体、作为编码seqidno:1的至少约氨基酸138至733的氨基酸序列的核酸序列的产物的vp2蛋白的异质群体和作为编码seqidno:2的至少氨基酸197至733的核酸序列的产物的vp3蛋白的异质群体,其中:vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群,所述氨基酸修饰包含seqidno:2中的天冬酰胺‑甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(n),并且任选地进一步含有包含其它脱酰胺化的氨基酸的亚群,其中所述脱酰胺化引起氨基酸变化;以及(b)aavrh.92衣壳中的载体基因组,所述载体基因组含有包含aav反向末端重复序列和编码产物的非aav核酸序列的核酸分子,所述核酸序列与引导产物在宿主细胞中的表达的序列可操作地连接。[0076]在某些实施例中,aavrh.92衣壳包含:作为编码seqidno:2的氨基酸序列的核酸序列的产物的vp1蛋白的异质群体、作为对seqidno:2的至少约氨基酸138到733的氨基酸序列进行编码的核酸序列的产物的vp2蛋白的异质群体、以及作为编码seqidno:2的至少氨基酸197到733的核酸序列的产物的vp3蛋白的异质群体。[0077]在某些实施例中,编码aavrh.92vp1衣壳蛋白的核酸序列提供于seqidno:1中。在其它实施例中,可以选择与seqidno:1具有70%到99.9%一致性的核酸序列以表达aavrh.92衣壳蛋白。在某些其它实施例中,核酸序列与seqidno:1至少约75%一致、至少80%一致、至少85%、至少90%、至少95%、至少97%一致或至少99%到99.9%一致。然而,可以选择编码seqidno:2的氨基酸序列的其它核酸序列用于产生raav衣壳。在某些实施例中,核酸序列具有seqidno:1的核酸序列,或与seqidno:1至少70%至99.9%一致,至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码seqidno:2。在某些实施例中,核酸序列具有seqidno:1的核酸序列,或与seqidno:1的约nt412至约nt2199至少70%至99.9%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码seqidno:2的vp2衣壳蛋白(约aa138至733)。在某些实施例中,核酸序列具有seqidno:1的约nt589至约nt2199的核酸序列,或与seqidno:1的约nt589至约nt2199至少70%至99.9%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码seqidno:2的vp3衣壳蛋白(约aa197至733)。[0078]本发明还涵盖编码突变型aavrh.92的核酸序列,其中已经改变一个或多个残基以降低脱酰胺化或本文所鉴定的其它修饰。此类核酸序列可用于产生突变型raavrh.92衣壳。[0079]在某些实施例中,提供了新型分离的aavrh.93衣壳。编码aav的核酸序列提供于seqidno:3中,且编码的氨基酸序列提供于seqidno:4中。本文提供包含aavrh.93(seqidno:4)的vp1、vp2和vp3中的至少一个的raav。本文还提供包含由aavrh.93(seqidno:3)的vp1、vp2和vp3中的至少一个编码的aav衣壳的raav。[0080]在另一方面,提供了一种重组腺相关病毒(raav),所述raav包含:(a)aavrh.93衣壳,所述衣壳包含以下中的一种或多种:(1)aavrh.93衣壳蛋白,其包含:选自以下的aavrh.93vp1蛋白的异质群体:通过由编码seqidno:4的1至728的预测氨基酸序列的核酸序列的表达产生的vp1蛋白、由seqidno:3产生的vp1蛋白、或由与seqidno:3具有至少70%一致性的核酸序列产生的vp1蛋白,所述核酸序列编码seqidno:4的1至728的预测氨基酸序列;选自以下的aavrh.93vp2蛋白的异质群体:通过由编码seqidno:4的至少约氨基酸138至728的预测氨基酸序列的核酸序列的表达产生的vp2蛋白、由包含seqidno:3的至少核苷酸412至2184的序列产生的vp2蛋白、或由与seqidno:3的至少核苷酸412至2184具有至少70%一致性的核酸序列产生的vp2蛋白,所述核酸序列编码seqidno:4的至少约氨基酸138至728的预测氨基酸序列,选自以下的aavrh.93vp3蛋白的异质群体:通过由编码seqidno:4的至少约氨基酸199至728的预测氨基酸序列的核酸序列的表达产生的vp3蛋白、由包含seqidno:3的至少核苷酸595至2184的序列产生的vp3蛋白、或由与seqidno:3的至少核苷酸595至2184具有至少70%一致性的核酸序列产生的vp3蛋白,所述核酸序列编码seqidno:4的至少约氨基酸199至728的预测氨基酸序列;和/或(2)作为编码seqidno:4的氨基酸序列的核酸序列的产物的vp1蛋白的异质群体、作为编码seqidno:4的至少约氨基酸138至728的氨基酸序列的核酸序列的产物的vp2蛋白的异质群体和作为编码seqidno:4的至少氨基酸199至728的核酸序列的产物的vp3蛋白的异质群体,其中:vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群,所述氨基酸修饰包含seqidno:4中的天冬酰胺‑甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(n),并且任选地进一步含有包含其它脱酰胺化的氨基酸的亚群,其中所述脱酰胺化引起氨基酸变化;以及(b)aavrh.93衣壳中的载体基因组,所述载体基因组含有包含aav反向末端重复序列和编码产物的非aav核酸序列的核酸分子,所述产物可操作地连接于引导产物在宿主细胞中的表达的序列。[0081]在某些实施例中,aavrh.93衣壳包含:作为编码seqidno:4的氨基酸序列的核酸序列的产物的vp1蛋白的异质群体、作为编码seqidno:4的至少约氨基酸138到728的氨基酸序列的核酸序列的产物的vp2蛋白的异质群体、以及作为编码seqidno:4的至少氨基酸199至728的核酸序列的产物的vp3蛋白的异质群体。[0082]在某些实施例中,编码aavrh.93vp1衣壳蛋白的核酸序列提供于seqidno:3中。在其它实施例中,可以选择与seqidno:3具有70%到99.9%一致性的核酸序列以表达aavrh.93衣壳蛋白。在某些其它实施例中,核酸序列与seqidno:3至少约75%一致、至少80%一致、至少85%、至少90%、至少95%、至少97%一致或至少99%到99.9%一致。然而,可以选择编码seqidno:4的氨基酸序列的其它核酸序列用于产生raav衣壳。在某些实施例中,核酸序列具有seqidno:3的核酸序列,或与seqidno:3至少70%至99.9%一致,至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码seqidno:4。在某些实施例中,核酸序列具有seqidno:3的核酸序列,或与seqidno:3的约nt412至约nt2184至少70%至99.9%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码seqidno:4的vp2衣壳蛋白(约aa138至728)。在某些实施例中,核酸序列具有seqidno:3的约nt595至约nt2184的核酸序列,或与seqidno:3的约nt595至约nt2184至少70%至99.9%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码seqidno:4的vp3衣壳蛋白(约aa199至728)。[0083]本发明还涵盖编码突变型aavrh.93的核酸序列,其中已经改变一个或多个残基以降低脱酰胺化或本文所鉴定的其它修饰。此类核酸序列可用于产生突变型raavrh.93衣壳。[0084]在某些实施例中,提供了新型分离的aavrh.91.93衣壳。编码aav的核酸序列提供于seqidno:5中,且编码的氨基酸序列提供于seqidno:6中。本文提供包含aavrh.91.93(seqidno:6)的vp1、vp2和vp3中的至少一个的raav。本文还提供包含由aavrh.91.93(seqidno:5)的vp1、vp2和vp3中的至少一个编码的aav衣壳的raav。[0085]在另一方面,提供了一种重组腺相关病毒(raav),所述raav包含:(a)aavrh.91.93衣壳,所述衣壳包含以下中的一种或多种:(1)aavrh.91.93衣壳蛋白,其包含:选自以下的aavrh.91.93vp1蛋白的异质群体:通过由编码seqidno:6的1至733的预测氨基酸序列的核酸序列的表达产生的vp1蛋白、由seqidno:5产生的vp1蛋白、或由与seqidno:5具有至少70%一致性的核酸序列产生的vp1蛋白,所述核酸序列编码seqidno:6的1至733的预测氨基酸序列;选自以下的aavrh.91.93vp2蛋白的异质群体:通过由编码seqidno:6的至少约氨基酸138至733的预测氨基酸序列的核酸序列的表达产生的vp2蛋白、由包含seqidno:5的至少核苷酸412至2199的序列产生的vp2蛋白、或由与seqidno:5的至少核苷酸412至2199具有至少70%一致性的核酸序列产生的vp2蛋白,所述核酸序列编码seqidno:6的至少约氨基酸138至733的预测氨基酸序列,选自以下的aavrh.91.93vp3蛋白的异质群体:通过由编码seqidno:6的至少约氨基酸203至733的预测氨基酸序列的核酸序列的表达产生的vp3蛋白、由包括seqidno:5的至少核苷酸607至2199的序列产生的vp3蛋白、或由与seqidno:5的至少核苷酸607至2199具有至少70%一致性的核酸序列产生的vp3蛋白,所述核酸序列编码seqidno:6的至少约氨基酸203至733的预测氨基酸序列;和/或(2)作为编码seqidno:6的氨基酸序列的核酸序列的产物的vp1蛋白的异质群体、作为编码seqidno:5的至少约氨基酸138至733的氨基酸序列的核酸序列的产物的vp2蛋白的异质群体和作为编码seqidno:6的至少氨基酸203至733的核酸序列的产物的vp3蛋白的异质群体,其中:vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群,所述氨基酸修饰包含seqidno:6中的天冬酰胺‑甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(n),并且任选地进一步含有包含其它脱酰胺化的氨基酸的亚群,其中所述脱酰胺化引起氨基酸变化;以及(b)aavrh.91.93衣壳中的载体基因组,所述载体基因组含有包含aav反向末端重复序列和编码产物的非aav核酸序列的核酸分子,所述产物可操作地连接于引导产物在宿主细胞中的表达的序列。[0086]在某些实施例中,aavrh.91.93衣壳包含:作为编码seqidno:6的氨基酸序列的核酸序列的产物的vp1蛋白的异质群体、作为编码seqidno:6的至少约氨基酸138到733的氨基酸序列的核酸序列的产物的vp2蛋白的异质群体、以及作为编码seqidno:6的至少氨基酸203到733的核酸序列的产物的vp3蛋白的异质群体。[0087]在某些实施例中,编码aavrh.91.93vp1衣壳蛋白的核酸序列提供于seqidno:5中。在其它实施例中,可以选择与seqidno:5具有70%到99.9%一致性的核酸序列以表达aavrh.91.93衣壳蛋白。在某些其它实施例中,核酸序列与seqidno:5至少约75%一致、至少80%一致、至少85%、至少90%、至少95%、至少97%一致或至少99%到99.9%一致。然而,可以选择编码seqidno:6的氨基酸序列的其它核酸序列用于产生raav衣壳。在某些实施例中,核酸序列具有seqidno:5的核酸序列,或与seqidno:5至少70%至99.9%一致,至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码seqidno:6。在某些实施例中,核酸序列具有seqidno:5的核酸序列,或与seqidno:5的约nt412至约nt2199至少70%至99.9%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码seqidno:6的vp2衣壳蛋白(约aa138至733)。在某些实施例中,核酸序列具有seqidno:5的约nt589至约nt2199的核酸序列,或与seqidno:5的nt607至约nt2199至少70%至99.9%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码seqidno:6的vp3衣壳蛋白(约aa203至733)。[0088]本发明还涵盖编码突变型aavrh.91.93的核酸序列,其中已经改变一个或多个残基以降低脱酰胺化或本文所鉴定的其它修饰。此类核酸序列可用于产生突变型raavrh.91.93衣壳。[0089]在某些实施例中,本文提供一种核酸分子,其具有seqidno:1的序列,或与seqidno:1至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码具有如本文所述的修饰(例如,脱酰胺化的氨基酸)的seqidno:2的vp1氨基酸序列。在某些实施例中,本文提供一种核酸分子,其具有seqidno:3的序列,或与seqidno:3至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码具有如本文所述的修饰(例如,脱酰胺化的氨基酸)的seqidno:4的vp1氨基酸序列。在某些实施例中,本文提供一种核酸分子,其具有seqidno:5的序列,或与seqidno:5至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%一致的序列,所述序列编码具有如本文所述的修饰(例如,脱酰胺化的氨基酸)的seqidno:6的vp1氨基酸序列。在某些实施例中,提供具有本文所述的核酸序列的质粒。[0090]当提及核酸或其片段时,术语“基本同源性”或“基本类似性”表示当与另一个核酸(或其互补股)的适当核苷酸插入或缺失进行最佳比对时,至少约95到99%的比对序列具有核苷酸序列一致性。优选地,同源性在全长序列、或其开放阅读框或长度为至少15个核苷酸的另一合适的片段上。本文描述了合适片段的实例。[0091]在核酸序列的情况下,术语“百分比(%)一致性”、“序列一致性”、“百分比序列一致性”或“百分比一致”是指当比对对应关系时相同的两个序列中的残基。期望序列一致性比较的长度可以超过基因组的全长、基因编码序列的全长或至少约500到5000个核苷酸的片段。然而,也可以期望较小片段之间的一致性,例如至少约九个核苷酸,通常至少约20到24个核苷酸、至少约28到32个核苷酸、至少约36个或更多个核苷酸。[0092]可以容易地确定蛋白质、多肽、约32个氨基酸、约330个氨基酸或其肽片段或对应核酸序列编码序列的全长上的氨基酸序列的百分比一致性。合适的氨基酸片段可以是至少约8个氨基酸长度,并且可以是至多约700个氨基酸。通常,当提及两个不同序列之间的“一致性”、“同源性”或“类似性”时,参考“比对”序列来确定“一致性”、“同源性”或“类似性”。“比对”序列或“比对”是指与参考序列相比,通常含有对缺失的或额外的碱基或氨基酸的校正的多个核酸序列或蛋白质(氨基酸)序列。[0093]一致性可以通过制备序列的比对和通过使用本领域中已知或可商购的多种算法和/或计算机程序[例如blast、expasy;clustalo;fasta;使用例如尼德曼‑翁施算法(needleman‑wunschalgorithm)、史密斯‑沃特曼算法(smith‑watermanalgorithm)]来确定。使用多种公开或可商购的多序列比对程序中的任一种进行比对。序列比对程序可供用于氨基酸序列,例如“clustalomega”、“clustalx”、“map”、“pima”、“msa”、“blockmaker”、“meme”以及“match‑box”程序。通常,以默认设置使用这些程序中的任何程序,尽管本领域技术人员可以根据需要改变这些设置。或者,本领域技术人员可以利用另一种算法或计算机程序,所述算法或程序提供至少与通过参考算法和程序所提供的一样水平的一致性或比对。参见例如j.d.thomson等人,《核酸研究(nucl.acids.res.)》,“多序列比对的全面比较(acomprehensivecomparisonofmultiplesequencealignments)”,27(13):2682‑2690(1999)。[0094]多序列比对程序也可用于核酸序列。此类程序的实例包括“clustalomega”、“clustalw”、“capsequenceassembly”、“blast”、“map”和“meme”,所述程序可通过因特网上的web服务器进行访问。此类程序的其它来源是本领域技术人员已知的。或者,也使用vectornti实用程序。还存在多种本领域已知的可以用于测量核苷酸序列一致性的算法,包括上述程序中包含的那些。作为另一实例,可以使用gcg6.1版本的程序fastatm比较多核苷酸序列。fastatm提供了查询序列与搜索序列之间最佳重叠区的比对和序列一致性百分比。例如,核酸序列之间的序列一致性百分比可使用如gcg6.1版本中所提供的采用其默认参数(字号6和评分矩阵的nopam系数)的fastatm确定,所述程序以引用的方式并入本文中。[0095]b.raav载体和组合物[0096]在另一方面,本文描述了利用本文所述的aav衣壳序列(包括其片段)来产生适用于将异源基因或其它核酸序列递送至靶细胞的病毒载体的分子。在一个实施例中,适用于本文所述的组合物和方法的载体至少含有编码如本文所述的所选aav衣壳,例如aavrh.92、aavrh.93或aavrh.91.93衣壳或其片段的序列。在另一实施例中,适用的载体至少含有编码所选aav血清型rep蛋白或其片段的序列。任选地,此类载体可含有aavcap和rep蛋白。在提供aavrep和cap的载体中,aavrep和aavcap序列可以是一种血清型来源,例如都是aavrh.92、aavrh.93或aavrh.91.93来源。或者,可以使用rep序列来自与提供cap序列的野生型aav不同的aav的载体。在一个实施例中,rep和cap序列由单独来源(例如单独的载体,或宿主细胞和载体)表达。在另一实施例中,这些rep序列与不同aav血清型的cap序列同框融合以形成嵌合aav载体,如以引用的方式并入本文中的美国专利第7,282,199号中所描述的aav2/8。任选地,载体进一步含有小基因,所述小基因包含两侧是aav5′itr和aav3′itr的所选转基因。在另一实施例中,aav是自互补aav(sc‑aav)(参见以引用的方式并入本文中的us2012/0141422)。自互补载体包装一个反向重复基因组,它可以折叠成dsdna,而无需dna合成或多个载体基因组之间的碱基配对。由于scaav不需要在表达之前将单股dna(ssdna)基因组转化为双股dna(dsdna),因此其为更有效的载体。然而,这种效率的代价是损失了载体一半的编码能力,scaav适用于小蛋白质编码基因(至多约55kd)和任何当前可用的基于rna的疗法。[0097]假型载体适用于本文,其中一个aav的衣壳被异源衣壳蛋白替换。出于说明性目的,在下文所述的实例中使用了利用本文所述的aavrh.92、aavrh.93或aavrh.91.93衣壳和aav2itr的aav载体。参见上文所引用的mussolino等人。除非另外规定,否则本文所述的aavitr和其它所选aav成分可个别地选自任何aav血清型,包括但不限于aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aav9或其它已知和未知的aav血清型。在一个理想的实施例中,使用aav血清型2的itr。然而,可选择来自其它合适血清型的itr。这些itr或其它aav成分可以使用本领域技术人员可用的技术从aav血清型中容易地分离。此类aav可以从学术、商业或公共来源(例如弗吉尼亚州马纳萨斯的美国典型培养物保藏中心(americantypeculturecollection,manassas,va))分离。或者,可以通过合成或其它合适的手段,通过参考公开的序列,如在文献中或在如genbank、pubmed等数据库中可获得的公开的序列获得aav序列。[0098]本文所述的raav还包含载体基因组。载体基因组至少由如下所述的非aav或异源核酸序列(转基因)和其调节序列以及5′和3′aav反向末端重复序列(itr)组成。这种小基因被包装到衣壳蛋白中并且递送到所选靶细胞。[0099]转基因是与转基因两侧的载体序列异源的核酸序列,其编码所关注的多肽、蛋白质或其它产物。核酸编码序列以允许转基因在靶细胞中转录、翻译和/或表达的方式与调节成分可操作地连接。异源核酸序列(转基因)可以来源于任何生物体。aav可以包含一种或多种转基因。[0100]在某些实施例中,本文提供包括转基因的aavrh.92、aavrh.93或aavrh.91.93载体,所述转基因包含编码红细胞生成素(epo)的序列。在某些实施例中,转基因编码犬或猫epo基因。此类重组载体适用于例如治疗受试者的慢性肾病和其它以循环红细胞的量减少为特征的病状的方案。[0101]在某些实施例中,本文提供包括转基因的aavrh.92、aavrh.93或aavrh.91.93载体,所述转基因包含编码抗神经生长因子(ngf)抗体的序列。在某些实施例中,转基因编码犬或猫抗ngf抗体。此类重组载体适用于例如治疗受试者的骨关节炎疼痛的方案。[0102]在某些实施例中,本文提供包括转基因的aavrh.92、aavrh.93或aavrh.91.93载体,所述转基因包含编码抗神经生长因子(ngf)抗体的序列。在某些实施例中,转基因编码犬或猫抗ngf抗体。此类重组载体适用于例如治疗受试者的骨关节炎疼痛的方案。[0103]在某些实施例中,本文提供包括转基因的aavrh.92、aavrh.93或aavrh.91.93载体,所述转基因包含编码胰高血糖素样肽1(glp‑1)的序列。在某些实施例中,转基因编码犬或猫glp‑1。此类重组载体适用于例如治疗受试者的ii型糖尿病的方案。[0104]在某些实施例中,本文提供包括转基因的aavrh.92、aavrh.93或aavrh.91.93载体,所述转基因包含编码胰高血糖素样肽1(glp‑1)的序列。在某些实施例中,转基因编码犬或猫glp‑1。此类重组载体适用于例如治疗受试者的ii型糖尿病的方案。[0105]在某些实施例中,本文提供包括转基因的aavrh.92、aavrh.93或aavrh.91.93载体,所述转基因包含编码胰岛素的序列。在某些实施例中,转基因编码犬或猫胰岛素。此类重组载体适用于例如治疗受试者的i型糖尿病或ii型糖尿病的方案。[0106]在某些实施例中,本文提供包括转基因的aavrh.92、aavrh.93或aavrh.91.93载体,所述转基因包含编码ige、il‑32或il‑4/il‑13受体(包括例如抗体和受体‑igg融合蛋白)的白介素‑4受体α(il‑4rα)亚单位的拮抗剂的序列。在某些实施例中,转基因编码犬或猫ige、il‑32或il‑4rα亚单位的拮抗剂。此类重组载体适用于例如治疗受试者的异位性皮肤炎的方案。[0107]转基因序列的组成将取决于所得载体的用途。例如,一种类型的转基因序列包括报告序列,其在表达时产生可检测信号。此类报告序列包括但不限于编码以下者的dna序列:β‑内酰胺酶、β‑半乳糖苷酶(lacz)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(gfp)、增强型gfp(egfp)、氯霉素乙酰转移酶(cat)、荧光素酶、膜结合蛋白(包括例如cd2、cd4、cd8)、流感血凝素蛋白和本领域熟知的其它蛋白,针对其存在或可通过常规方法产生高亲和力抗体,以及融合蛋白,包含适当地与尤其来自血凝素或myc的抗原标签域融合的膜结合蛋白。[0108]这些编码序列当与驱动其表达的调节元件相关联时提供可通过常规方法检测的信号,所述常规方法包括酶促、放射照相、比色、荧光或其它光谱分析、荧光激活细胞分选分析和免疫分析,包括酶联免疫吸附分析(elisa)、放射免疫分析(ria)和免疫组织化学。例如,当标记序列为lacz基因时,通过针对β‑半乳糖苷酶活性的分析来检测携带信号的载体的存在。当转基因为绿色荧光蛋白质或荧光素酶时,携带信号的载体可以通过光度计中的颜色或光产生在视觉上测量。[0109]但是,理想地,转基因是编码适用于生物学和医学的产物,如蛋白质、肽、rna、酶、显性失活突变体或催化rna的非标记序列。理想的rna分子包括trna、dsrna、核糖体rna、催化rna、sirna、小发夹rna、反式剪接rna和反义rna。适用的rna序列的一个实例是抑制或消除经治疗动物中的靶核酸序列表达的序列。通常,合适的靶序列包括肿瘤靶标和病毒性疾病。关于此类靶标的实例,参见下文与免疫原相关的部分中鉴定的肿瘤靶标和病毒。[0110]转基因可用于纠正或改善基因缺陷,所述基因缺陷可包括正常基因以低于正常水平表达的缺陷或功能基因产物不表达的缺陷。或者,转基因可以向细胞提供不天然表达于所述细胞类型或宿主中的产物。优选类型的转基因序列编码在宿主细胞中表达的治疗性蛋白质或多肽。本发明进一步包括使用多种转基因。在某些情形下,不同转基因可用于编码蛋白质的每个亚单位,或编码不同肽或蛋白质。当编码蛋白质亚单位的dna的大小较大时,例如对于免疫球蛋白、血小板衍生生长因子或肌营养不良蛋白,这是理想的。为了使细胞产生多亚单位蛋白质,细胞用含有不同亚单位中的每一个的重组病毒感染。或者,蛋白质的不同亚单位可以由相同转基因编码。在此情况下,单一转基因包括编码亚单位中的每一个的dna,其中每个亚单位的dna由内部核酶进入位点(ires)分离。当编码亚单位中的每一个的dna的大小较小,例如编码亚单位的dna和ires的总大小为小于五千碱基时,这是理想的。作为ires的替代方案,dna可由编码2a肽的序列分离,所述肽在翻译后事件中自裂解。参见例如m.l.donnelly等人,《普通病毒学杂志(j.gen.virol.)》,78(pt1):13‑21(1997年1月);furler,s.等人,《基因疗法》,8(11):864‑873(2001年6月);klumph.等人,《基因疗法》,8(10):811‑817(2001年5月)。这种2a肽显著小于ires,因此非常适合在空间为限制因素时使用。更常见的是,当转基因较大,由多个亚单位组成,或两个转基因共同递送时,携带所需转基因或亚单位的raav被共同施用以允许其在体内连环化以形成单个载体基因组。在此类实施例中,第一aav可以携带表达单一转基因的表达盒,并且第二aav可以携带表达不同转基因以在宿主细胞中共表达的表达盒。然而,所选转基因可以编码任何生物活性产物或其它产物,例如研究所需的产物。[0111]合适的转基因或基因产物的实例包括与家族性高胆固醇血症、肌营养不良、囊性纤维化以及罕见病或孤儿病相关的那些。此类罕见疾病的实例可包括脊髓性肌萎缩(sma)、亨廷顿氏病(huntingdon′sdisease)、瑞特综合征(rettsyndrome)(例如,甲基‑cpg结合蛋白2(mecp2);uniprotkb‑p51608)、肌肉萎缩性侧索硬化(als)、杜氏型肌肉营养不良(duchennetypemusculardystrophy)、弗雷德里希共济失调(friedrichsataxia)(例如共济蛋白)、与2型脊髓小脑共济失调(sca2)/als相关的atxn2;与als、颗粒蛋白前体(prgn)(与非阿尔茨海默氏病脑变性相关,包括额颞叶痴呆(ftd)、进行性非流畅性失语症(pnfa)和语义性痴呆)相关的tdp‑43等。参见例如www.orpha.net/consor/cgi‑bin/disease_search_list.php;rarediseases.info.nih.gov/diseases。[0112]由转基因编码的适用的治疗产物包括激素以及生长和分化因子,包括但不限于胰岛素、胰高血糖素、胰高血糖素样肽1(glp‑1)、生长激素(gh)、甲状旁腺激素(pth)、生长激素释放因子(grf)、促卵泡激素(fsh)、促黄体激素(lh)、人绒毛膜促性腺激素(hcg)、血管内皮生长因子(vegf)、血管生成素、血管生长抑素、粒细胞集落刺激因子(gcsf)、红细胞生成素(epo)、结缔组织生长因子(ctgf)碱性成纤维细胞生长因子(bfgf)、酸性成纤维细胞生长因子(afgf)、表皮生长因子(egf)、转型生长因子α(tgfα)、血小板衍生生长因子(pdgf)、胰岛素生长因子i和ii(igf‑i和igf‑ii)、转型生长因子β超家族中的任一种(包括tgfβ)、激活素、抑制素、或骨形态发生蛋白(bmp)bmp1‑15中的任一种、生长因子的调蛋白/神经调节蛋白/aria/neu分化因子(ndf)家族中的任一种、神经生长因子(ngf)、脑源性神经营养因子(bdnf)、神经营养素nt‑3和nt‑4/5、睫状神经营养因子(cntf)、神经胶质细胞系衍生神经营养因子(gdnf)、神经营养因子、集聚蛋白、信号素(semaphorin)/脑衰蛋白(collapsin)家族中的任一种、轴突引导因子‑1和轴突引导因子‑2、肝细胞生长因子(hgf)、肝配蛋白(ephrin)、头蛋白(noggin)、音猬因子和酪氨酸羟化酶。[0113]其它适用的转基因产物包括调节免疫系统的蛋白质,包括但不限于细胞因子和淋巴因子,如血小板生成素(tpo)、白介素(il)il‑1至il‑25(包括il‑2、il‑4、il‑12和il‑18)、单核细胞趋化蛋白、白血病抑制因子、粒细胞‑巨噬细胞集落刺激因子、fas配体、肿瘤坏死因子α和β、干扰素(α、β和γ)、干细胞因子、flk‑2/flt3配体。由免疫系统产生的基因产物也可用于本发明。这些包括但不限于免疫球蛋白igg、igm、iga、igd和ige、嵌合免疫球蛋白、人源化抗体、单链抗体、t细胞受体、嵌合t细胞受体、单链t细胞受体、mhci类和ii类分子以及经过工程化的免疫球蛋白和mhc分子。适用的基因产物还包括补体调节蛋白,如补体调节蛋白、膜辅因子蛋白(mcp)、衰变加速因子(daf)、cr1、cf2和cd59。[0114]其它适用的基因产物包括用于激素、生长因子、细胞因子、淋巴因子、调节蛋白和免疫系统蛋白的受体中的任一种。本发明涵盖用于胆固醇调节的受体,包括低密度脂蛋白(ldl)受体、高密度脂蛋白(hdl)受体、极低密度脂蛋白(vldl)受体和清道夫受体。本发明还涵盖基因产物,如类固醇激素受体超家族的成员,包括糖皮质激素受体和雌激素受体、维生素d受体和其它核受体。另外,适用的基因产物包括转录因子,如jun、fos、max、mad、血清应答因子(srf)、ap‑1、ap2、myb、myod和肌生成素、含ets盒的蛋白质、tfe3、e2f、atf1、atf2、atf3、atf4、zf5、nfat、creb、hnf‑4、c/ebp、sp1、ccaat盒结合蛋白、干扰素调节因子(irf‑1)、威尔姆斯肿瘤蛋白、ets结合蛋白、stat、gata盒结合蛋白(例如,gata‑3)和带翼螺旋蛋白的叉头家族。[0115]其它适用的基因产物包括氨甲酰基合成酶i、鸟氨酸转氨甲酰酶、精氨酸琥珀酸合成酶、精氨酸琥珀酸裂解酶、精氨酸酶、富马酸乙酰乙酸水解酶、苯丙氨酸羟化酶、α‑1抗胰蛋白酶、葡萄糖‑6‑磷酸酶、胆色素原脱氨酶、胱硫醚β‑合成酶、支链酮酸脱羧酶、白蛋白、异戊酰coa脱氢酶、丙酰coa羧化酶、甲基丙二酰coa变位酶、戊二酰coa脱氢酶、胰岛素、β‑葡萄糖苷酶、丙酮酸羧化酶、肝磷酸化酶、磷酸化酶激酶、甘氨酸脱羧酶、h蛋白、t蛋白、囊性纤维化跨膜调节(cftr)序列和肌营养不良蛋白序列或其功能片段。其它适用的基因产物包括如可适用于酶替代疗法的酶,所述酶替代疗法适用于由于酶活性不足而导致的多种病状。例如,可以将含有甘露糖‑6‑磷酸的酶用于溶酶体贮积病的疗法中(例如,合适的基因包括对β‑葡糖醛酸酶(gusb)进行编码的基因)。在另一实例中,基因产物为泛素蛋白质连接酶e3a(ube3a)。仍适用的基因产物包括udp葡萄糖醛酸基转移酶家族1成员a1(ugt1a1)。[0116]其它适用的基因产物包括非天然存在的多肽,如具有含有插入、缺失或氨基酸取代的非天然存在的氨基酸序列的嵌合或杂合多肽。例如,单链工程化的免疫球蛋白可能适用于某些免疫功能不全患者。其它类型的非天然存在的基因序列包括反义分子和催化核酸,如核酶,其可以用于减少靶标的过度表达。[0117]减少和/或调节基因表达对于治疗以过度增殖细胞为特征的过度增殖性病状(如癌症和牛皮癣)是特别期望的。靶多肽包括与正常细胞相比在过度增殖性细胞中专门产生或以更高水平产生的那些多肽。靶抗原包括由癌基因如myb、myc、fyn和易位基因bcr/abl、ras、src、p53、neu、trk和egrf编码的多肽。除作为靶抗原的癌基因产物之外,用于抗癌治疗和保护方案的靶多肽包括由b细胞淋巴瘤产生的抗体的可变区和t细胞淋巴瘤的t细胞受体的可变区,在一些实施例中,所述可变区还被用作自身免疫疾病的靶抗原。其它肿瘤相关多肽可用作靶多肽,如在肿瘤细胞中以较高水平存在的多肽,包括由单克隆抗体17‑1a识别的多肽和叶酸结合多肽。[0118]其它合适的治疗性多肽和蛋白质包括可适用于通过为针对与自身免疫相关的靶标赋予广泛基础的保护性免疫应答而治疗患有自身免疫性疾病和病症的个体的多肽和蛋白质,所述靶标包括细胞受体和产生自身定向抗体的细胞。t细胞介导的自身免疫疾病包括类风湿关节炎(ra)、多发性硬化症(ms)、休格连氏综合征(syndrome)、类肉瘤病、胰岛素依赖型糖尿病(iddm)、自身免疫甲状腺炎、反应性关节炎、强直性脊柱炎、硬皮病、多发性肌炎、皮肌炎、牛皮癣、韦格纳氏肉芽肿病(wegner′sgranulomatosis)、克罗恩氏病(crohn′sdisease)和溃疡性结肠炎。这些疾病中的每一种以与内源性抗原结合并引发与自身免疫疾病相关的发炎级联的t细胞受体(tcr)为特征。[0119]其它适用的基因产物包括用于治疗血友病的基因产物,所述血友病包括血友病b(包括因子ix)和血友病a(包括因子viii和其变体,如异二聚体和b缺失结构域的轻链和重链;美国专利第6,200,560号和美国专利第6,221,349号)。在一些实施例中,小基因包含因子viii重链的前57个碱基对,所述重链对10个氨基酸信号序列以及人生长激素(hgh)聚腺苷酸化序列进行编码。在替代性实施例中,小基因进一步包含a1和a2域,以及来自b域的n端的5个氨基酸和/或b域的c端的85个氨基酸,以及a3、c1和c2域。在其它实施例中,编码因子viii重链和轻链的核酸在由42个编码b结构域的14个氨基酸的核酸分隔的单个小基因中提供[美国专利第6,200,560号]。[0120]可以通过raav递送的其它示例性基因包括但不限于与糖原贮积病或1a型缺陷相关的葡萄糖‑6‑磷酸酶(gsd1)、与pepck缺陷相关的磷酸烯醇丙酮酸羧激酶(pepck);与癫痫发作和严重的神经发育障碍相关的细胞周期蛋白依赖性激酶样5(cdkl5),也称为丝氨酸/苏氨酸激酶9(stk9);与半乳糖血症相关的半乳糖‑1磷酸尿苷转移酶;与苯丙酮尿症(pku)相关的苯丙氨酸羟化酶(pah);与原发性高草酸尿症1型相关的基因产物,包括羟基酸氧化酶1(go/hao1)和agxt,与枫糖浆尿病相关的支链α‑酮酸脱氢酶,包括bckdh、bckdh‑e2、bakdh‑e1a和bakdh‑e1b;与1型酪氨酸血症相关的延胡索乙酰乙酸水解酶;与甲基丙二酸血症相关的甲基丙二酰辅酶a变位酶;与中链乙酰辅酶a缺乏相关的中链酰基辅酶a脱氢酶;与鸟氨酸转氨甲酰酶缺乏相关的鸟氨酸转氨甲酰酶(otc);与瓜氨酸血症相关的精氨琥珀酸合成酶(ass1);卵磷脂‑胆固醇酰基转移酶(lcat)缺乏症;无甲基丙二酸血症(mma);与尼曼匹克病(niemann‑pickdisease),c1型相关的npc1);丙酸血症(pa);与转甲状腺素蛋白(ttr)相关的遗传性淀粉样变性相关的ttr;与家族性高胆固醇血症(fh)相关的低密度脂蛋白受体(ldlr)蛋白,ldlr变体,例如wo2015/164778中描述的那些;pcsk9;与痴呆症相关的apoe和apoc蛋白;与克里格勒‑纳贾尔病(crigler‑najjardisease)相关的udp‑葡萄糖醛酸转移酶;与严重的联合免疫缺陷病相关的腺苷脱氨酶;与痛风和勒什‑纳阳综合征(lesch‑nyansyndrome)相关的次黄嘌呤鸟嘌呤磷酸核糖转移酶;与生物素酶缺乏相关的生物素酶;与法布里病(fabrydisease)相关的α‑半乳糖苷酶a(α‑gala);与gm1神经节苷脂病相关的b‑半乳糖苷酶(glb1);与威尔逊病(wilson′sdisease)相关的atp7b;与戈谢病(gaucherdisease)2型和3型相关的β‑葡萄糖脑苷脂酶;与齐薇格综合征(zellwegersyndrome)相关的过氧化物酶体膜蛋白70kda;与异染性脑白质营养不良相关的芳基硫酸酯酶a(arsa)、与克拉培病(krabbedisease)相关的半乳糖脑苷脂酶(galc)、与庞贝病(pompedisease)相关的α‑葡萄糖苷酶(gaa);与尼曼匹克病a型相关的鞘磷脂酶(smpd1)基因;与成人发病的ii型瓜氨酸血症(ctln2)相关的精氨酸琥珀酸合酶;与尿素循环障碍相关的氨基甲酰磷酸合酶1(cps1);与脊髓性肌萎缩症相关的存活运动神经元(smn)蛋白;与法伯脂肪肉芽肿(farberlipogranulomatosis)相关的神经酰胺酶;与gm2神经节苷脂病和泰‑萨病(tay‑sachsdisease)和桑德霍夫病(sandhoffdisease)相关的b‑氨基己糖苷酶;与天冬氨酰葡萄糖胺相关的天冬氨酰氨基葡萄糖苷酶;与岩藻糖苷中毒相关的α‑岩藻糖苷酶;与α‑甘露糖苷中毒相关的α‑甘露糖苷酶;与急性间歇性卟啉症(aip)相关的胆色素原脱氨酶,;用于治疗α‑1抗胰蛋白酶缺乏症(肺气肿)的α‑1抗胰蛋白酶;用于治疗地中海贫血或肾功能衰竭引起的贫血的红细胞生成素;用于治疗缺血性疾病的血管内皮生长因子、血管生成素‑1和成纤维细胞生长因子;血栓调节蛋白和组织因子通路抑制剂,用于治疗闭塞的血管,例如动脉粥样硬化、血栓形成或栓塞中所见;用于治疗帕金森病(parkinson′sdisease)的芳香族氨基酸脱羧酶(aadc)和酪氨酸羟化酶(th);用于治疗充血性心力衰竭的β肾上腺素能受体、磷蛋白、肌(内)质网腺苷三磷酸酶‑2(serca2)和心脏腺苷酸环化酶的反义或突变形式;用于治疗各种癌症的肿瘤抑制基因,如p53;细胞因子,例如用于治疗炎症和免疫疾病和癌症的各种白介素中的一种;用于治疗肌营养不良的肌营养不良蛋白或小肌营养不良蛋白和用于治疗肌营养不良的肌营养相关蛋白或小肌营养相关蛋白;以及用于治疗糖尿病的胰岛素或glp‑1。[0121]替代地或另外,本发明的载体可含有本发明的aav序列和转基因,所述转基因编码诱导针对所选免疫原的免疫反应的肽、多肽或蛋白质。例如,免疫原可以选自多种病毒科。需要针对其产生免疫反应的理想病毒科的实例包括小核糖核酸病毒科,其包括鼻病毒属,其造成大约50%的普通感冒病例;肠道病毒属,包括脊髓灰质炎病毒、柯萨奇病毒、埃可病毒和人类肠道病毒,如甲型肝炎病毒;和主要在非人类动物中引起口蹄疫的口蹄疫病毒属。在病毒的小核糖核酸病毒家族内,靶抗原包括vp1、vp2、vp3、vp4和vpg。另一病毒家族包括杯状病毒家族,所述家族涵盖诺瓦克(norwalk)病毒群,其为流行性胃肠炎的重要病原体。另一个期望用于靶向抗原以在人类和非人类动物中诱导免疫反应的病毒家族是披膜病毒科,其包括甲病毒属,其包括辛德毕斯病毒、罗斯河病毒和委内瑞拉、东方和西方马脑炎,以及风疹病毒属,包括风疹病毒。黄病毒科包括登革热、黄热病、日本脑炎、圣路易斯脑炎和蜱传脑炎病毒。其它靶抗原可能从丙型肝炎或冠状病毒科产生,包括非人类病毒,例如传染性支气管炎病毒(家禽)、猪传染性胃肠病毒(猪)、猪血凝性脑脊髓炎病毒(猪)、猫传染性腹膜炎病毒(猫)、猫肠道冠状病毒(猫)、犬冠状病毒(狗)和人类呼吸道冠状病毒,其可能导致普通感冒和/或非甲、乙或丙型肝炎。在冠状病毒科中,靶抗原包括e1(也称为m或基质蛋白)、e2(也称为s或纤突蛋白)、e3(也称为he或血凝素‑依尔替糖(elterose))糖蛋白(并非在所有冠状病毒中都存在)或n(核衣壳)。其它抗原可以靶向弹状病毒科,其包括水疱病毒属(例如水泡性口炎病毒)和一般狂犬病毒属(例如狂犬病)。在弹状病毒科中,合适的抗原可以来源于g蛋白或n蛋白。包括马堡病毒和埃博拉病毒等出血热病毒的丝状病毒科可能是合适的抗原来源。副粘病毒科包括副流感病毒1型、副流感病毒3型、牛副流感病毒3型、腮腺炎病毒属(腮腺炎病毒)、副流感病毒2型、副流感病毒4型、新城疫病毒(鸡)、牛瘟、麻疹病毒(其包括麻疹和犬瘟热)和肺病毒属,其包括呼吸道合胞病毒。流感病毒分类在正粘病毒科内,并且是合适的抗原来源(例如ha蛋白、n1蛋白)。布尼亚病毒科包括布尼亚病毒属(加利福尼亚脑炎、拉克罗斯(lacrosse))、白蛉病毒属(裂谷热)、汉坦病毒(普马拉病毒(puremala)是一种出血热病毒)、内罗病毒(内罗毕绵羊病)和各种未指定的布尼亚病毒。沙粒病毒科提供了抗lcm和拉沙热病毒的抗原来源。呼肠孤病毒家族包括呼肠孤病毒属、轮状病毒(其可引起儿童急性肠胃炎)、轮状病毒和科罗拉多蜱传热病毒属(cultivirus)(科罗拉多蜱传热、莱邦博病(lebombo)(人类)、马脑病、蓝舌病)。[0122]逆转录病毒科包括肿瘤病毒(oncorivirinal)亚科,其涵盖人类和兽医疾病,如猫白血病病毒、htlvi和htlvii、慢病毒(包括人类免疫缺陷病毒(hiv)、猿猴免疫缺陷病毒(siv)、猫免疫缺陷病毒(fiv)、马传染性贫血病毒和泡沫病毒)。在hiv与siv之间,已描述许多合适的抗原并且可以容易地选择。合适的hiv和siv抗原的实例包括但不限于gag、pol、vif、vpx、vpr、env、tat和rev蛋白以及其各种片段。另外,已描述对这些抗原的多种修饰。出于此目的的合适抗原是本领域的技术人员已知的。例如,可选择编码gag、pol、vif和vpr、env、tat和rev的序列,以及其它蛋白质。参见例如美国专利5,972,596中所描述的经修饰的gag蛋白。另外参见d.h.barouch等人,《病毒学杂志》,75(5):2462‑2467(2001年3月)和r.r.amara等人,《科学》,292:69‑74(2001年4月6日)中描述的hiv和siv蛋白。这些蛋白质或其亚单位可单独递送,或经由单独载体或从单一载体组合递送。[0123]乳多泡病毒科包括亚科多瘤病毒(bku和jcu病毒)和亚科乳头状瘤病毒(与癌症或乳头状瘤的恶性进展相关)。腺病毒科包括引起呼吸道疾病和/或肠炎的病毒(ex、ad7、ard、o.b.)。细小病毒家科猫细小病毒(猫肠炎)、猫泛白细胞减少症病毒、犬细小病毒和猪细小病毒。疱疹病毒科包括亚科α疱疹病毒,其涵盖单纯疱疹病毒属(hsvi、hsvii)、水痘病毒属(假性狂犬病、水痘带状疱疹);和亚科β疱疹病毒,其包括巨细胞病毒属(hcmv、鼠巨细胞病毒属);和亚科γ疱疹病毒亚科,其包括淋巴隐病毒属、ebv(伯基特氏淋巴瘤)、传染性鼻气管炎、马立克氏病(marek′sdisease)病毒和细长病毒属(rhadinovirus)。痘病毒科包括脊痘病毒亚科,其涵盖正痘病毒属(天花(variola/smallpox)和牛痘(vaccinia/cowpox))、副痘病毒、禽痘病毒、山羊痘病毒、麻痘病毒、水痘病毒和昆虫痘病毒亚科。肝炎病毒科包括乙型肝炎病毒。一种可能是合适的抗原来源的未分类病毒是丁型肝炎病毒。其它病毒来源可包括禽传染性法氏囊病病毒和猪呼吸和生殖综合征病毒。甲病毒科包括马动脉炎病毒和各种脑炎病毒。[0124]本发明还可以涵盖适用于使人类或非人类动物免疫其它病原体的免疫原,所述病原体包括感染人类和非人类脊椎动物的细菌、真菌、寄生微生物或多细胞寄生虫,或来自癌细胞或肿瘤细胞。细菌病原体的实例包括致病性革兰氏阳性球菌,包括肺炎球菌;葡萄球菌;和链球菌。致病性革兰氏阴性球菌包括脑膜炎球菌;淋球菌。致病性肠道革兰氏阴性杆菌包括肠杆菌科;假单胞菌、不动杆菌和艾肯氏菌;类鼻疽;沙门氏菌;志贺氏菌;嗜血杆菌;莫拉氏菌;杜克雷嗜血杆菌(h.ducreyi)(导致软下疳);布鲁氏菌;土拉弗朗西斯菌(franisellatularensis)(导致土拉菌病);耶尔森氏菌(巴氏杆菌);念珠状链杆菌和螺旋菌;革兰氏阳性杆菌包括单核细胞增生李斯特菌;猪红斑丹毒丝菌;白喉棒状杆菌(白喉);霍乱;炭疽芽孢杆菌(b.anthracis)(炭疽);杜诺凡病(donovanosis)(腹股沟肉芽肿);和巴尔通体病(bartonellosis)。由致病性厌氧菌引起的疾病包括破伤风;肉毒杆菌;其它梭菌;结核;麻风;和其它分枝杆菌。致病性螺旋体病包括梅毒;密螺旋体病:雅司病(yaws)、斑点病和地方性梅毒;以及钩端螺旋体病。其它由高等致病性细菌和致病性真菌引起的感染包括放线菌病;诺卡氏菌病;隐球菌病、芽生菌病、组织胞浆菌病和球孢子菌病;念珠菌病、曲霉病和毛霉菌病;孢子丝菌病;副球孢子菌病、球孢菌病、圆环孢菌病、足菌肿和染色体病;和皮肤癣菌病。立克次体感染包括斑疹伤寒、落基山斑疹热、q热和立克次体痘。支原体和衣原体感染的实例包括:肺炎支原体;性病淋巴肉芽肿;鹦鹉热;和围产期衣原体感染。致病性真核生物涵盖致病性原生动物和蠕虫,且由此产生的感染包括:阿米巴病;疟疾;利什曼病;锥虫病;弓形体病;卡氏肺孢子虫(pneumocystiscarinii);特里坎斯(trichans);刚地弓形虫(toxoplasmagondii);巴贝斯虫病(babesiosis);贾第鞭毛虫病(giardiasis);旋毛虫病;丝虫病;血吸虫病;线虫;吸虫(trematodes)或吸虫(flukes);和绦虫(cestode/tapeworm)感染。[0125]许多这些生物体和/或由此产生的毒素已被疾病控制中心[(cdc),美国卫生和公共服务部]确定为具有用于生物攻击的潜力的病原体。例如,这些生物病原体中的一些,包括炭疽芽孢杆菌(bacillusanthracis)(炭疽)、肉毒杆菌(clostridiumbotulinum)和其毒素(肉毒中毒)、鼠疫耶尔森菌(yersiniapestis)(鼠疫)、大天花(天花)、土拉热弗朗西斯氏菌(francisellatularensis)(土拉菌病)和病毒性出血热,所有这些目前都归类为a类病原体;立克次体(coxiellaburnetti)(q热);布鲁氏菌属(布鲁氏菌病)、鼻疽伯克霍尔德氏菌(burkholderiamallei)(鼻疽病)、蓖麻(ricinuscommunis)和其毒素(蓖麻毒素)、产气荚膜芽胞梭菌(clostridiumperfringens)和其毒素(ε毒素)、葡萄球菌属和其毒素(肠毒素b),所有这些目前都归类为b类病原体;以及尼潘病毒(nipanvirus)和汉坦病毒(hantavirus),目前被归类为c类病原体。此外,被如此分类或不同分类的其它生物体可以在未来被识别和/或用于这样的目的。将容易理解的是,本文所述的病毒载体和其它构建体可用于从这些生物体、病毒、其毒素或其它副产物递送抗原,这将预防和/或治疗感染或与这些生物制剂有关的其它不良反应。[0126]施用本发明的载体以递送针对t细胞可变区的免疫原引发包括ctl在内的免疫反应以消除那些t细胞。在类风湿性关节炎(ra)中,已经表征了与所述疾病相关的t细胞受体(tcr)的若干特定可变区。这些tcr包括v‑3、v‑14、v‑17和vα‑17。因此,编码这些多肽中的至少一种的核酸序列的递送将引发免疫反应,所述免疫反应将靶向涉及ra的t细胞。在多发性硬化症(ms)中,已表征涉及所述疾病的tcr的若干特定可变区。这些tcr包括v‑7和va‑10。因此,编码这些多肽中的至少一种的核酸序列的递送将引发免疫反应,所述免疫反应将靶向涉及ms的t细胞。在硬皮病中,已表征涉及所述疾病的tcr的若干特定可变区。这些tcr包括v‑6、v‑8、v‑14和vα‑16、vα‑3c、vα‑7、vα‑14、vα‑15、vα‑16、vα‑28和vα‑12。因此,编码这些多肽中的至少一种的核酸分子的递送将引发免疫反应,所述免疫反应将靶向涉及硬皮病的t细胞。[0127]在一个实施例中,选择转基因以提供光遗传疗法。在光遗传疗法中,人工光感受器是通过将光激活通道或泵基因递送到剩余视网膜回路中的存活细胞类型来构建的。这特别适用于已经失去大量光感受器功能,但其双极细胞回路至神经节细胞和视神经保持完整的患者。在一个实施例中,异源核酸序列(转基因)为视蛋白。视蛋白序列可以来源于任何合适的单细胞或多细胞生物,包括人类、藻类和细菌。在一个实施例中,视蛋白为视紫红质、光视蛋白、l/m波长(红色/绿色)‑视蛋白或短波长(s)视蛋白(蓝色)。在另一实施例中,视蛋白为通道视紫红质或盐细菌视紫红质。[0128]在另一实施例中,选择转基因用于基因增强疗法,即提供缺失或缺陷基因的替代拷贝。在此实施例中,本领域技术人员可以容易地选择转基因以提供必要的替代基因。在一个实施例中,缺失/缺陷的基因与眼部病症有关。在另一实施例中,转基因为nyx、grm6、trpml或gpr179,并且眼部病症为先天性静止性夜盲症。参见例如zeitz等人,《美国人类遗传学杂志(amjhumgenet.)》2013年1月10日;92(1):67‑75.电子版2012年12月13日,其以引用的方式并入本文中。在另一实施例中,转基因为rpgr。[0129]在另一实施例中,选择转基因用于基因抑制疗法,即,一种或多种天然基因的表达在转录或翻译水平下被中断或抑制。这可以使用短发夹rna(shrna)或所属领域中众所周知的其它技术实现。参见例如sun等人,《国际癌症杂志(intjcancer.)》2010年2月1日;126(3):764‑74和o′reillym等人《美国人类遗传学杂志》2007年7月;81(1):127‑35,其以引用的方式并入本文中。在此实施例中,本领域的技术人员可以基于需要沉默的基因容易地选择转基因。[0130]在另一实施例中,转基因包含多于一个转基因。这可以使用携带两个或更多个异源序列的单一载体,或使用各自携带一个或多个异源序列的两个或更多个aav来实现。在一个实施例中,aav用于基因抑制(或敲低)和基因增强协同疗法。在敲低/增强协同疗法中,所关注的基因的缺陷拷贝被沉默并提供非突变拷贝。在一个实施例中,这使用两个或更多个共同施用的载体实现。参见millington‑ward等人,《分子疗法(moleculartherapy)》,2011年4月,19(4):642‑649,其以引用的方式并入本文中。转基因可由本领域的技术人员基于所需结果容易地选择。[0131]在另一实施例中,选择转基因用于基因校正疗法。这可以使用例如锌指核酸酶(zfn)诱导的dna双股断裂结合外源dna供体底物来实现。参见例如ellis等人,《基因疗法》(电子版2012年1月)20:35‑42,其以引用的方式并入本文中。转基因可由本领域的技术人员基于所需结果容易地选择。[0132]在一个实施例中,本文所述的衣壳可用于美国临时专利申请号61/153,470、62/183,825、62/254,225和62/287,511中描述的crispr‑cas双载体系统,这些申请各自以引用的方式并入本文中。衣壳还可用于递送归巢核酸内切酶或其它大范围核酸酶。[0133]在另一实施例中,适用于本文的转基因包括报告序列,其在表达时产生可检测信号。此类报告序列包括但不限于编码以下者的dna序列:β‑内酰胺酶、β‑半乳糖苷酶(lacz)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(gfp)、红色荧光蛋白(rfp)、氯霉素乙酰转移酶(cat)、荧光素酶、膜结合蛋白(包括例如cd2、cd4、cd8)、流感血凝素蛋白和本领域熟知的其它蛋白,针对其存在或可通过常规方法产生高亲和力抗体,以及融合蛋白,包含适当地与尤其来自血凝素或myc的抗原标签域融合的膜结合蛋白。[0134]这些编码序列当与驱动其表达的调节元件相关联时提供可通过常规方法检测的信号,所述常规方法包括酶促、放射照相、比色、荧光或其它光谱分析、荧光激活细胞分选分析和免疫分析,包括酶联免疫吸附分析(elisa)、放射免疫分析(ria)和免疫组织化学。例如,当标记序列为lacz基因时,通过针对β‑半乳糖苷酶活性的分析来检测携带信号的载体的存在。当转基因为绿色荧光蛋白质或荧光素酶时,携带信号的载体可以通过光度计中的颜色或光产生在视觉上测量。[0135]理想地,转基因编码适用于生物学和医学的产品,如蛋白质、肽、rna、酶或催化rna。理想的rna分子包括shrna、trna、dsrna、核糖体rna、催化rna和反义rna。适用的rna序列的一个实例是消除经治疗动物中的靶核酸序列表达的序列。[0136]调节序列包括常规控制元件,所述控制元件以允许转基因在用载体转染或用如本文所述产生的病毒感染的细胞中转录、翻译和/或表达的方式与转基因可操作地连接。如本文所用,“可操作地连接的”序列包括与所关注的基因邻接的表达控制序列和以反式或相隔一定距离起作用以控制所关注的基因的表达控制序列。[0137]表达控制序列包括适当的转录起始、终止、启动子和增强子序列;有效的rna加工信号,例如剪接和聚腺苷酸化(polya)信号;稳定细胞质mrna的序列;增强翻译效率的序列(即,kozak共有序列);增强蛋白质稳定性的序列;以及当需要时,增强所编码产物的分泌的序列。大量表达控制序列(包括启动子)在本领域中已知并且可以被利用。[0138]可用于本文提供的构建体中的调节序列还可含有内含子,理想地位于启动子/增强子序列与基因之间。一种理想的内含子序列源自sv‑40,并且是100bp的微型内含子剪接供体/剪接受体,称为sd‑sa。另一合适的序列包括土拔鼠肝炎病毒转录后元件。(参见例如l.wang和i.verma,1999《美国国家科学院院刊(proc.natl.acad.sci.,usa)》,96:3906‑3910)。polya信号可以源自许多合适的物种,包括但不限于sv‑40、人类和牛。[0139]适用于本文所述的方法的raav的另一调节成分为内部核糖体进入位点(ires)。ires序列或其它合适的系统可用于从单一基因转录物产生多于一种多肽。ires(或其它合适的序列)用于产生含有多于一条多肽链的蛋白质或从相同细胞或在相同细胞内表达两种不同蛋白质。示例性ires是脊髓灰质炎病毒内部核糖体进入序列,其支持光感受器、rpe和神经节细胞中的转基因表达。优选地,ires位于raav载体的转基因的3′。[0140]在一个实施例中,aav包含启动子(或启动子的功能片段)。用于raav中的启动子可选自多种可在所需靶细胞中表达所选转基因的组成性或诱导性启动子。在一个实施例中,靶细胞是眼细胞。启动子可以来源于任何物种,包括人类。理想地,在一个实施例中,启动子具有“细胞特异性”。术语“细胞特异性”意指为重组载体选择的特定启动子可以引导所选转基因在特定细胞组织中的表达。在一个实施例中,启动子对转基因在肌肉细胞中的表达具有特异性。在另一实施例中,启动子对肺中的表达具有特异性。在另一实施例中,启动子对转基因在肝细胞中的表达具有特异性。在另一实施例中,启动子对转基因在气道上皮中的表达具有特异性。在另一实施例中,启动子对转基因在神经元中的表达具有特异性。在另一实施例中,启动子对转基因在心脏中的表达具有特异性。[0141]表达盒通常含有作为表达控制序列的一部分的启动子序列,例如位于所选5′itr序列与免疫球蛋白构建体编码序列之间。在一个实施例中,肝脏中的表达是合乎需要的。因此,在一个实施例中,使用肝特异性启动子。可以在本文所述的载体中使用组织特异性启动子、组成型启动子、可调控启动子[参见例如wo2011/126808和wo2013/04943]或对生理学线索有应答的启动子。在另一实施例中,肌肉中的表达是合乎需要的。因此,在一个实施例中,使用肌肉特异性启动子。在一个实施例中,启动子是基于mck的启动子,如dmck(509‑bp)或tmck(720‑bp)启动子(参见例如wang等人,《基因疗法》2008年11月;15(22):1489‑99.doi:10.1038/gt.2008.104.电子版2008年6月19日,其以引用的方式并入本文中)。另一适用的启动子是spc5‑12启动子(参见rasowo等人,《欧洲科学杂志(europeanscientificjournal)》2014年6月版第10卷,第18期,其以引用的方式并入本文中)。在一个实施例中,启动子为cmv启动子。在另一实施例中,启动子为tbg启动子。在另一实施例中,使用cb7或cag启动子。cb7是具有巨细胞病毒增强子元件的鸡β‑肌动蛋白启动子。或者,可以使用其它肝特异性启动子[参见例如,肝特异性基因启动子数据库(theliverspecificgenepromoterdatabase),coldspringharbor,rulai.schl.edu/lspd,α‑1抗胰蛋白酶(a1at);人白蛋白,miyatake等人,《病毒学杂志》,71:512432(1997),humalb;以及乙型肝炎病毒核心启动子,sandig等人,《基因疗法》,3:10029(1996)]。ttr最小增强子/启动子、α‑抗胰蛋白酶启动子、lsp(845nt)25(需要无内含子scaav)。[0142]一种或多种启动子可以选自不同的来源,例如人巨细胞病毒(cmv)立即早期增强子/启动子、sv40早期增强子/启动子、jc多瘤病毒启动子、髓鞘碱性蛋白(mbp)或神经胶质原纤维酸性蛋白(gfap)启动子、单纯疱疹病毒(hsv‑1)潜伏期相关启动子(lap)、劳氏肉瘤病毒(rsv)长末端重复(ltr)启动子、神经元特异性启动子(nse)、血小板源性生长因子(pdgf)启动子、hsyn、黑色素浓缩激素(mch)启动子、cba、基质金属蛋白启动子(mpp)和鸡β‑肌动蛋白启动子。[0143]表达盒可含有至少一种增强子,即cmv增强子。其它增强子元件可包括例如载脂蛋白增强子、斑马鱼增强子、gfap增强子元件和脑特异性增强子(如wo2013/1555222中所描述)、土拔鼠肝炎后转录后调节元件。另外或替代地,可以选择其它,例如杂交人类巨细胞病毒(hcmv)立即早期(ie)‑pdgr启动子或其它启动子‑增强子元件。本文适用的其它增强子序列包括irbp增强子(nicoud2007,《基因医学杂志》2007年12月;9(12):1015‑23)、立即早期巨细胞病毒增强子、源自免疫球蛋白基因或sv40增强子的一种、小鼠近端启动子中鉴别的顺式作用元件等。[0144]除启动子之外,表达盒和/或载体还可以含有一个或多个其它合适的转录起始、终止、增强子序列、如剪接和聚腺苷酸化(polya)信号等的有效rna加工信号;稳定胞质mrna的序列;增强翻译效率的序列(即,kozak共有序列);增强蛋白稳定性的序列;以及当需要时,增强所编码的产物的分泌的序列。多种合适的polya是已知的。在一个实例中,polya是兔β珠蛋白,如127bp兔β珠蛋白聚腺苷酸化信号(genbank编号v00882.1)。在其它实施例中,选择sv40polya信号。可选择其它合适的polya序列。在某些实施例中,包括内含子。一个合适的内含子是鸡β‑肌动蛋白内含子。在一个实施例中,内含子为875bp(genbank编号x00182.1)在另一实施例中,使用可购自promega的嵌合内含子。然而,可选择其它合适的内含子。在一个实施例中,包括间隔子以使得载体基因组与天然aav载体基因组的大小大致相同(例如,在4.1与5.2kb之间)。在一个实施例中,包括间隔子以使得载体基因组为约4.7kb。参见wu等人,基因组大小对aav载体包装的影响(effectofgenomesizeonaavvectorpackaging),《分子治疗学(molther.)》2010年1月;18(1):80‑86,其以引用的方式并入本文中。[0145]这些和其它常见载体和调节元件的选择是常规的,并且许多此类序列是可用的。参见例如sambrook等人和其中所引用的参考文献,例如第3.18‑3.26和16.17‑16.27页,以及ausubel等人,现代分子生物学实验技术(currentprotocolsinmolecularbiology),johnwiley&sons,newyork,1989。当然,并非所有载体和表达控制序列都将同样好地起作用以表达如本文所述的所有转基因。然而,本领域的技术人员可以在不脱离本发明的范围的情况下在这些和其它表达控制序列中进行选择。[0146]在某些实施例中,表达盒含有作为mir‑183靶序列的至少一个mirna靶序列。在某些实施例中,载体基因组或表达盒含有mir‑183靶序列,其包括agtgaattctaccagtgccata(seqidno:13),其中与mir‑183种子序列互补的序列加下划线。在某些实施例中,载体基因组或表达盒含有与mir‑183种子序列100%互补的序列的多于一个拷贝(例如,两个或三个拷贝)。在某些实施例中,mir‑183靶序列的长度为约7个核苷酸到约28个核苷酸并且包括与mir‑183种子序列至少100%互补的至少一个区。在某些实施例中,mir‑183靶序列含有与seqidno:13部分互补的序列,且因此当与seqidno:13比对时,存在一个或多个错配。在某些实施例中,当与seqidno:13比对时,mir‑183靶序列包含具有至少1、2、3、4、5、6、7、8、9或10个错配的序列,其中所述错配可以是不连续的。在某些实施例中,mir‑183靶序列包括具有100%互补性的区,所述区还包含mir‑183靶序列的长度的至少30%。在某些实施例中,具有100%互补性的区域包括与mir‑183种子序列具有100%互补性的序列。在某些实施例中,mir‑183靶序列的其余部分与mir‑183具有至少约80%至约99%的互补性。在某些实施例中,表达盒或载体基因组包括mir‑183靶序列,所述靶序列包含截短的seqidno:13,即在seqidno:13的5′端或3′端中的任一端或两端处缺乏至少1、2、3、4,5,6,7、8、9或10个核苷酸的序列。在某些实施例中,表达盒或载体基因组包含转基因和一个mir‑183靶序列。在又其它实施例中,表达盒或载体基因组包含至少两个、三个或四个mir‑183靶序列。[0147]在某些实施例中,表达盒含有作为mir‑182靶序列的至少一个mirna靶序列。在某些实施例中,载体基因组或表达盒含有mir‑182靶序列,其包括agtgtgagttctaccattgccaaa(seqidno:14)。在某些实施例中,载体基因组或表达盒含有与mir‑182种子序列100%互补的序列的多于一个拷贝(例如,两个或三个拷贝)。在某些实施例中,mir‑182靶序列的长度为约7个核苷酸到约28个核苷酸并且包括与mir‑182种子序列至少100%互补的至少一个区。在某些实施例中,mir‑182靶序列含有与seqidno:14部分互补的序列,且因此当与seqidno:14比对时,存在一个或多个错配。在某些实施例中,当与seqidno:14比对时,mir‑183靶序列包含具有至少1、2、3、4、5、6、7、8、9或10个错配的序列,其中所述错配可以是不连续的。在某些实施例中,mir‑182靶序列包括具有100%互补性的区,所述区还包含mir‑182靶序列的长度的至少30%。在某些实施例中,具有100%互补性的区包括与mir‑182种子序列具有100%互补性的序列。在某些实施例中,mir‑182靶序列的其余部分与mir‑182具有至少约80%至约99%的互补性。在某些实施例中,表达盒或载体基因组包括mir‑182靶序列,所述靶序列包含截短的seqidno:14,即在seqidno:14的5′端或3′端中的任一端或两端处缺乏至少1、2、3、4,5,6,7、8、9或10个核苷酸的序列。在某些实施例中,表达盒或载体基因组包含转基因和一个mir‑182靶序列。在其它实施例中,表达盒或载体基因组包含至少两个、三个或四个mir‑182靶序列。[0148]本文所使用的术语“串联重复序列”是指存在两个或更多个连续mirna靶序列。这些mirna靶序列可以是连续的,即一个接一个地直接定位,使得一个靶序列的3′端直接位于下一个靶序列的5′端的上游,没有中间序列,或者反之亦然。在另一个实施例中,mirna靶序列中的两个或更多个mirna靶序列由短间隔序列隔开。[0149]如本文所用,“间隔子”是任何所选核酸序列,例如,长度为1个、2个、3个、4个、5个、6个、7个、8个、9个或10个核苷酸的定位在两个或更多个连续mirna靶序列之间的核酸序列。在某些实施例中,间隔子的长度为1个到8个核苷酸、长度为2个到7个核苷酸、长度为3个到6个核苷酸、长度为四个核苷酸、4个到9个核苷酸、3个到7个核苷酸或更大的值。合适地,间隔子是非编码序列。在某些实施例中,间隔子可以具有四(4)个核苷酸。在某些实施例中,间隔子是ggat。在某些实施例中,间隔子是六(6)个核苷酸。在某些实施例中,间隔子是cacgtg或gcatgc。[0150]在某些实施例中,串联重复序列含有相同mirna靶序列中的两个、三个、四个或更多个。在某些实施例中,串联重复序列含有至少两个不同mirna靶序列、至少三个不同mirna靶序列或至少四个不同mirna靶序列等。在某些实施例中,串联重复序列可含有相同mirna靶序列中的两个或三个和不同的第四mirna靶序列。[0151]在某些实施例中,表达盒中可存在至少两组不同的串联重复序列。例如,3′utr可含有紧接在转基因下游的串联重复序列、utr序列和两个或更多个更接近utr的3′端的串联重复序列。在另一实例中,5′utr可含有一个、两个或更多个mirna靶序列。在另一实例中,3′可含有串联重复序列,并且5′utr可含有至少一个mirna靶序列。[0152]在某些实施例中,表达盒含有两个、三个、四个或更多个串联重复序列,所述串联重复序列在转基因的终止密码子的约0个至20个核苷酸内开始。在其它实施例中,表达盒含有距转基因的终止密码子至少100个至约4000个核苷酸的mirna串联重复序列。[0153]参见2019年12月20日提交的pct/us19/67872,其以引用的方式并入本文中并且要求2018年12月21日申请的美国临时专利申请第62/783,956号的优先权,所述临时申请以引用的方式并入本文中。[0154]在另一实施例中,提供一种产生重组腺相关病毒的方法。合适的重组腺相关病毒(aav)通过培养宿主细胞产生,所述宿主细胞含有编码如本文所述的aav衣壳蛋白质或其片段的核酸序列;功能性rep基因;至少由aav反向末端重复序列(itr)和编码所需转基因的异源核酸序列构成的小基因;和允许将小基因包装至aav衣壳蛋白质中的足够辅助功能。在宿主细胞中培养以将aav小基因包装至aav衣壳中所需的组分可以反式形式提供至宿主细胞。或者,可通过稳定宿主细胞提供所需组分(例如小基因、rep序列、cap序列和/或辅助功能)中的任一种或多种,所述宿主细胞已使用本领域的技术人员已知的方法工程化为含有所需组分中的一种或多种。[0155]本文还提供用如本文所述的aav转染的宿主细胞。最合适的是,此类稳定的宿主细胞将含有在诱导型启动子的控制下的所需组分。然而,所需组分可在组成型启动子的控制下。合适的诱导型和组成型启动子的实例提供于下文适用于转基因的调节元件的论述中。在另一替代方案中,所选稳定宿主细胞可含有在组成型启动子控制下的所选成分和在一或多个诱导型启动子控制下的其它所选成分。例如,可产生稳定宿主细胞,所述宿主细胞来源于293细胞(其含有在组成型启动子控制下的e1辅助功能),但含有在诱导型启动子控制下的rep和/或cap蛋白。其它稳定的宿主细胞可由本领域的技术人员产生。在另一实施例中,宿主细胞包含如本文所述的核酸分子。[0156]产生本文所述的raav所需的小基因、rep序列、cap序列和辅助功能可以转移其上携带的序列的任何遗传元件的形式递送到包装宿主细胞。所选遗传元件可通过包括本文所述的方法在内的任何合适方法递送。用于构建本发明的任何实施例的方法对核酸操纵技术人员是已知的并且包括基因工程、重组工程以及合成技术。参见例如sambrook等人,《分子克隆实验指南(molecularcloning:alaboratorymanual)》,coldspringharborpress,coldspringharbor,ny。类似地,产生raav病毒粒子的方法是众所周知的并且对合适的方法的选择不是对本发明的限制。参见例如k.fisher等人,1993,《病毒学杂志(j.virol.)》,70:520‑532和美国专利5,478,745等。这些出版物以引用的方式并入本文中。[0157]本文还提供用于产生本文所述的载体的质粒。此类质粒描述于实例部分中。[0158]c.药物组合物和施用[0159]在一个实施例中,任选地通过常规方法评估如上所详述用于靶细胞的含有所需转基因和启动子的重组aav的污染,且接着配制成意图向有需要的受试者施用的药物组合物。此类调配物涉及使用药学上和/或生理学上可接受的媒剂或载剂,如缓冲生理盐水或其它缓冲剂,例如hepes,以将ph维持在适当生理水平,和任选地其它药剂、医药剂、稳定剂、缓冲剂、载剂、佐剂、稀释剂等。对于注射,载剂将通常为液体。示例性生理上可接受的载剂包括无菌、无热原水和无菌、无热原磷酸盐缓冲盐水。美国专利公开案第7,629,322号中提供了各种此类已知载剂,所述公开案以引用的方式并入本文中。在一个实施例中,载剂是等渗氯化钠溶液。在另一实施例中,载剂是平衡盐溶液。在一个实施例中,载剂包括tween。如果病毒要长期存储,则其可以在甘油或tween20存在下冷冻。在另一实施例中,药学上可接受的载剂包含表面活性剂,例如全氟辛烷(perfluoron液体)。在适合人类受试者输注的缓冲液/载剂中配制载体。缓冲液/载剂应包括防止raav粘附到输液管道上但不干扰raav体内结合活性的成分。[0160]在本文所述的方法的某些实施例中,向受试者肌内(im)施用上文所述的药物组合物。在其它实施例中,通过静脉内(iv)施用药物组合物。在其它实施例中,通过脑室内(icv)注射施用药物组合物。在其它实施例中,药物组合物通过小脑延髓池内(icm)注射给药。可用于本文所述的方法的其它施用形式包括但不限于直接递送至所需器官(例如,眼睛),包括视网膜下或玻璃体内递送、口服、吸入、鼻内、气管内、静脉内、肌肉内、皮下、皮内和其它肠胃外施用途径。必要时,可以组合施用途径。[0161]如本文所用,术语“鞘内递送”或“鞘内施用”是指通过注射到椎管中,更具体地注射到蛛网膜下腔中使得其到达脑脊液(csf)的施用途径。鞘内递送可包括腰椎穿刺、室内(包括脑室内(icv))、枕骨下/脑池内和/或c1‑2穿刺。例如,可以通过腰椎穿刺引入材料以在整个蛛网膜下腔中扩散。在另一实例中,可以向小脑延髓池中注射。[0162]如本文所用,术语“脑池内递送”或“脑池内施用”是指直接进入小脑延髓池(cisternamagnacerebellomedularis)的脑脊液中,更具体地通过枕骨下穿刺或通过直接注射到小脑延髓池(cisternamagna)中或通过永久定位的管的施用途径。[0163]取决于待治疗区域的大小、所用病毒滴度、施用途径和所述方法的期望效果,组合物可以约0.1μl至约10ml体积递送,包括在所述范围内的所有数字。在一个实施例中,体积为约50μl。在另一实施例中,体积为约70μl。在另一实施例中,体积为约100μl。在另一实施例中,体积为约125μl。在另一实施例中,体积为约150μl。在另一实施例中,体积为约175μl。在另一实施例中,体积为约200μl。在另一实施例中,体积为约250μl。在另一实施例中,体积为约300μl。在另一实施例中,体积为约450μl。在另一实施例中,体积为约500μl。在另一实施例中,体积为约600μl。在另一实施例中,体积为约750μl。在另一实施例中,体积为约850μl。在另一实施例中,体积为约1000μl。在另一实施例中,体积为约1.5ml。在另一实施例中,体积为约2ml。在另一实施例中,体积为约2.5ml。在另一实施例中,体积为约3ml。在另一实施例中,体积为约3.5ml。在另一实施例中,体积为约4ml。在另一实施例中,体积为约5ml。在另一实施例中,体积为约5.5ml。在另一实施例中,体积为约6ml。在另一实施例中,体积为约6.5ml。在另一实施例中,体积为约7ml。在另一实施例中,体积为约8ml。在另一实施例中,体积为约8.5ml。在另一实施例中,体积为约9ml。在另一实施例中,体积为约9.5ml。在另一实施例中,体积为约10ml。[0164]携带在调节序列控制下编码所需转基因的核酸序列的重组腺相关病毒的有效浓度理想地在约107至1014个载体基因组/毫升(vg/ml)(也称为基因组拷贝/毫升(gc/ml))范围内。在一个实施例中,raav载体基因组通过实时pcr测量。在另一实施例中,raav载体基因组通过数字pcr测量。参见lock等人,通过液滴数字pcr绝对测定单股和自互补腺相关病毒载体基因组滴度(absolutedeterminationofsingle‑strandedandself‑complementaryadeno‑associatedviralvectorgenometitersbydropletdigitalpcr),《人类基因治疗方法(humgenethermethods.)》2014年4月;25(2):115‑25.doi:10.1089/hgtb.2013.131.电子版2014年2月14日,所述文献以引用的方式并入本文中。在另一实施例中,如以引用的方式并入本文中的s.k.mclaughlin等人,1988《病毒学杂志(j.virol.)》,62:1963中所述地测量raav感染单位。[0165]优选地,浓度为约1.5×109vg/ml至约1.5×1013vg/ml,并且更优选为约1.5×109vg/ml至约1.5×1011vg/ml。在一个实施例中,有效浓度为约1.4×108vg/ml。在一个实施例中,有效浓度为约3.5×1010vg/ml。在另一实施例中,有效浓度为约5.6×1011vg/ml。在另一实施例中,有效浓度为约5.3×1012vg/ml。在另一实施例中,有效浓度为约1.5×1012vg/ml。在另一实施例中,有效浓度为约1.5×1013vg/ml。本文中所述的所有范围均包括端点。[0166]在一个实施例中,剂量为约1.5×109vg/kg体重至约1.5×1013vg/kg,并且更优选为约1.5×109vg/kg至约1.5×1011vg/kg。在一个实施例中,剂量为约1.4×108vg/kg。在一个实施例中,剂量为约3.5×1010vg/kg。在另一实施例中,剂量为约5.6×1011vg/kg。在另一实施例中,剂量为约5.3×1012vg/kg。在另一实施例中,剂量为约1.5×1012vg/kg。在另一实施例中,剂量为约1.5×1013vg/kg。在另一实施例中,剂量为约3.0×1013vg/kg。在另一实施例中,剂量为约1.0×1014vg/kg。本文所述的所有范围均包括端点。[0167]在一个实施例中,有效剂量(递送的总基因组复本)为约107至1013个载体基因组。在一个实施例中,总剂量为约108个基因组复本。在一个实施例中,总剂量为约109个基因组复本。在一个实施例中,总剂量为约1010个基因组复本。在一个实施例中,总剂量为约1011个基因组复本。在一个实施例中,总剂量为约1012个基因组复本。在一个实施例中,总剂量为约1013个基因组复本。在一个实施例中,总剂量为约1014个基因组复本。在一个实施例中,总剂量为约1015个基因组复本。[0168]需要利用最低有效病毒浓度以便降低不合需要的影响(例如毒性)的风险。在这些范围内的其它剂量和施用体积可以由主治医师考虑正在治疗的受试者(优选地人类)的身体状态、所述受试者的年龄、特定病症以及所述病症(如果是进行性的)的发展程度来选择。例如,静脉内递送可能需要约1.5×1013vg/kg的剂量。[0169]d.方法[0170]在另一方面,提供了一种转导靶组织的方法。在一个实施例中,所述方法包括施用具有如本文所述的aavrh.92、aavrh.93或aavrh.91.93衣壳的aav。如以下实例中所示,本发明人已经证明称为aavrh.92的aav有效地转导cns(脑)。因此,本文提供一种转导脑的方法,其包含施用具有aavrh.92衣壳的raav。在一个实施例中,采用静脉内施用。在另一实施例中,采用icv施用。在另一实施例中,采用icm施用。[0171]本文还提供一种将转基因递送至脑细胞的方法。所述方法包括使细胞与具有aavrh.92衣壳的raav接触,其中所述raav包含转基因。在另一方面,提供具有aavrh.92衣壳的raav的用途,其用于将转基因递送至脑。在一个实施例中,raav使用icm递送来递送。[0172]单基因组扩增[0173]aav基因组传统上使用基于pcr的方法与全哺乳动物基因组dna分离:引物用于检测在大部分不同vp1(衣壳)基因两侧的保守区。然后将pcr产物克隆到质粒主链中并且使用桑格方法对单独的克隆进行测序。传统的基于pcr和分子克隆的病毒分离方法对于恢复新的aav基因组有效,但所恢复的基因组可能受pcr介导的重组和聚合酶错误的影响。此外,与先前使用的桑格技术相比,当前可用的下一代测序技术允许我们以空前未有的准确度对病毒基因组测序。本文提供一种从病毒群体内准确分离单个aav基因组的新型、更高通量、基于pcr和下一代测序的方法。此方法,aav‑单基因组扩增(aav‑sga)可用于提高我们对哺乳动物宿主体内的aav多样性的了解。此外,它允许我们鉴别适用作基因疗法的载体的新型衣壳。[0174]aav‑sga已经过验证和优化,以有效地从包含基因组群体的样本中恢复单个aav序列。此技术先前已用于从人类和非人类灵长类动物宿主内分离单个hiv和hcv基因组。对通过衣壳检测pcr筛选出aav阳性的基因组dna样本进行终点稀释。根据泊松分布(置信度为80%),pcr扩增产生小于30%阳性反应的稀释度含有单个可扩增aav基因组。此程序允许病毒基因组的pcr扩增,降低由聚合酶的模板转换引起的pcr介导的重组的机率。aav‑sgapcr扩增子使用illuminamiseq平台使用2×150或2×250双端测序进行测序。此方法允许对全长aavvp1序列进行准确的从头组装,而无需担心来自包含具有高度同源性区域的多个病毒的单个样本的测序读段的收敛。[0175]aav‑sga技术已成功从恒河猴组织中分离出多种新型aav衣壳序列。有趣的是,已经从单个样本中鉴定出来自不同aav进化枝的多种病毒;这表明宿主组织中可以存在aav的群体。例如,从单个肝组织样本中分离出与进化枝d、e和外围“边缘”病毒具有序列相似性的衣壳。[0176]虽然sga先前已被应用于分离其它病毒,但在aav发现中的应用是新型的。其解决了可能导致无效aav基因组序列的模板转换和聚合酶错误问题。此外,当从与单个分离株相同的宿主样本中重复回收相同的序列时,分离出的基因组的质量是不言而喻的。[0177]提供以下实例以说明本发明的各种实施例。实例并不打算以任何方式限制本发明[0178]e.实例[0179]实例1:材料和方法[0180]aav序列的检测和分离[0181]非人灵长类动物组织来源[0182]来自宾夕法尼亚大学群落的恒河猴是人工饲养的,并且源自中国或印度。恒河猴的肝组织样本由宾夕法尼亚大学的基因疗法计划和timothyh.lucas实验室友情提供。[0183]新型aav分离[0184]提取基因组dna(qiampdnaminikit,qiagen)并通过使用pcr策略从nhp肝组织标本中扩增3.1‑kb全长cap片段来分析aavdna的存在。使用aavrep基因保守区内的5′引物(av1ns,5′‑gctgcgtcaactggaccaatgagaac‑3′)(seqidno:9)与位于aavcap下游保守区的3′引物(av2cas,5′‑cgcagagaccaaagttcaactgaaacga‑3′)(seqidno:10)的组合来扩增全长aavcap扩增子的基因。q5high‑fidelityhotstartdna聚合酶(newenglandbiolabs)用于使用以下循环条件扩增aavdna:98℃持续30s;98℃持续10s,59℃持续10s,72℃持续93s,50个循环;以及72℃延伸持续120s。[0185]对pcr反应呈阳性的模板基因组dna样品进行aav‑单基因组扩增(aav‑sga)。在96孔板中对基因组dna进行终点稀释,使得使用上述相同引物的96次pcr反应中的少于29次产生扩增产物。根据泊松分布,在不超过30%的孔中产生pcr产物的dna稀释液在超过80%的时间内每个阳性pcr含有一个可扩增的aavdna模板。使用illuminamiseq2×150或2×250配对末端测序平台对来自阳性pcr反应的aavdna扩增子进行测序,并使用spades组装程序(cab.spbu.ru/software/spades)从头组装所得读段。使用ncbiblastn(blast.ncbi.nlm.nih.gov)和vectorntialignx软件(thermofisher)进行序列分析。[0186]使用新型aav衣壳生产载体[0187]来自所关注的pcr产物的aav衣壳基因dna序列被topo克隆和扩增(invitrogen)。扩增的衣壳基因被进一步克隆到包含aav2rep基因和其它相关质粒元件的aav转质粒骨架中。[0188]如前所述,aav载体由pennvectorcore生产和滴定(参见例如lock,m.等人(2010)《人类基因疗法(hum.genether.)》21:1259‑71)。hek293细胞进行三次转染,然后收集细胞培养上清液,浓缩,并用碘克沙醇梯度纯化。如前所述,使用针对兔β‑珠蛋白polya序列的引物,通过液滴数字pcr滴定纯化的载体(参见例如lock,m.等人(2014)《人类基因治疗方法(hum.genether.methods)》25:115‑125)。[0189]啮齿动物中新型aav衣壳的体内表征[0190]动物[0191]所有动物方案均经宾夕法尼亚大学的机构动物护理和使用委员会(theinstitutionalanimalcareandusecommitteeoftheuniversityofpennsylvania)批准。从杰克逊实验室(jacksonlaboratory)购买c56bl/6j小鼠。对于gfp报告基因实验,对成年(6‑8周大)雄性进行注射。动物被圈养在每笼二到五只动物的标准笼中。笼子、水瓶和垫料基材在屏障设施中进行高压灭菌,且每周更换一次笼子。保持自动控制的12小时光暗循环。每个黑暗期从晚上7:00(±30分钟)开始。随意提供辐射的实验室啮齿动物食物。[0192]测试品和研究设计[0193]小鼠通过侧尾静脉以静脉内(iv)0.1ml接受每只小鼠1×1012gc的每种载体,或以每只小鼠含1×1011gc的5μl剂量脑室内(icv)注射到脑的侧脑室。每组向三或五只小鼠给药。[0194]注射后14天通过吸入co2对小鼠实施安乐死。收集组织,在干冰上快速冷冻以进行生物分布分析,或在10%中性福尔马林中浸泡固定,在蔗糖中冷冻保存,在oct中冷冻,并用低温恒温器切片用于gfp直接观察。用于内皮细胞转导分析的组织在尸体剖检后进行石蜡包埋。[0195]载体生物分布[0196]使用qiaampdnaminikit(qiagen)提取组织基因组dna,并使用taqman试剂(appliedbiosystems,lifetechnologies)与靶向载体的egfp序列的引物/探针通过实时pcr对aav载体基因组进行定量。[0197]报告基因可视化[0198]为了观察直接gfp荧光,将组织样品在福尔马林中固定约24小时,在pbs中短暂洗涤,在含15%和30%蔗糖的pbs中依次平衡直至达到最大密度,且接着在oct包埋培养基中冷冻以制备冷冻切片。切片安装在含有dapi(electronmicroscopysciences,hatfield,pa)作为核复染剂的fluoromountg中。[0199]对石蜡包埋的组织样本进行gfp免疫组织化学。切片用乙醇和二甲苯脱蜡,在10mm柠檬酸盐缓冲液(ph6.0)中煮沸6分钟以进行抗原修复,依次用2%h2o2处理15分钟,用抗生物素蛋白/生物素封闭试剂各处理15分钟(vectorlaboratories),以及用封闭缓冲液(含1%驴血清的pbs+0.2%triton)处理10分钟。然后将其与一级抗体一起培育1小时,并在封闭缓冲液中与生物素标记的二级抗体一起培育45分钟(jacksonimmunoresearch)。使用一级抗体鸡抗gfp(abcamab13970)和兔抗cd31(abcamab28364)内皮细胞标记。按照制造商说明书使用vectastaineliteabc试剂盒(vectorlaboratories),以dab作为底物,将结合的抗体可视化为棕色沉淀物。[0200]对于免疫荧光,在用含1%驴血清的pbs+0.2%triton进行抗原修复后,石蜡切片脱蜡并封闭15分钟,然后与在封闭缓冲液中稀释的一级(1小时)和荧光标记的二级抗体(45分钟,jacksonimmunoresearch)连续培育。使用的抗体是鸡抗gfp(abcamab13970)、兔抗cd31(abcamab28364)和小鼠抗nf‑200(克隆rt97,milliporecbl212)。将一级抗体混合在一起,且分别通过fitc和tritc标记的二抗检测gfp和nf‑200抗体。根据制造商的方案(vectorlabs),使用vectafluortmexcelamplified488anti‑rabbitigg试剂盒增强了针对cd31的兔抗体的信号。荧光和明场显微镜图像是用nikoneclipsetie显微镜拍摄的。[0201]带条形码的载体转基因的非人灵长类动物转导评估[0202]测试品和研究设计[0203]五个新型衣壳和五个对照衣壳(aavrh90、aavrh91、aavrh92、aavrh93、aavrh91.93、aav8、aav6.2、aavrh32.33、aav7和aav9)用于包装改良的atg耗尽自互补egfp(dgfp)转基因。每个独特的衣壳制剂都含有dgfp转基因,在载体基因组的多聚腺苷酸化序列之前具有相应的独特6bp条形码。转基因含有cb8启动子和sv40聚腺苷酸化序列(aavsc.cb8.dgfp.barcode.sv40)。如前所述,aav载体由pennvectorcore生产和滴定(参见例如lock,m.等人(2010)《人类基因疗法(hum.genether.)》21:1259‑71)。hek293细胞进行三次转染,然后收集细胞培养上清液,浓缩,并用碘克沙醇梯度纯化。如前所述,使用靶向sv40polya序列的引物,通过液滴数字pcr滴定纯化的载体(参见例如lock,m.等人(2014)《人类基因治疗方法(hum.genether.methods)》25:115‑25)。[0204]将十个纯化的载体以相等的基因组拷贝量汇集,用于注射到两只不同的动物中:通过iv递送递送的总剂量为2e13gc/kg,且通过小脑延髓池内(icm)递送递送到鞘内空间的总剂量为3e13gc/动物。在注射后30天处死动物,并在rnalater(qiagen)中收集所有组织用于下游转基因rna表达分析。[0205]动物[0206]所有动物程序均经宾夕法尼亚大学的机构动物护理和使用委员会(theinstitutionalanimalcareandusecommitteeoftheuniversityofpennsylvania)批准。猕猴(食蟹猴)由bristolmeyerssquibb(usa)捐赠。动物被安置在宾夕法尼亚州费城市的费城儿童医院的实验室动物护理评估和认证协会认可的非人类灵长类动物研究计划设施的不锈钢挤压式后笼(squeezebackcage)中。动物接受了各种丰富活动,如食物款待、视觉和听觉刺激、操纵和社会互动。[0207]一只10岁的雄性8kg动物被用于icm研究。一只6岁的雄性6.98kg动物被用于iv研究。对此动物进行了aav中和抗体的存在的筛选,且基线时aav6、aav8和aavrh32.33呈血清阴性。在基线时,此动物针对aav7和aav9的中和抗体滴度分别为1∶5和1∶10。[0208]icm注射程序[0209]将麻醉的猕猴以侧卧位放置在x射线台上,头部向前弯曲。使用无菌技术将21g‑27g、1至1.5英寸quincke脊髓针(bectondickinson,franklinlakes,nj,usa)推进至枕下空间,直至观察到csf流动。收集1mlcsf用于基线分析。针的正确放置通过荧光透视法(oec9800c形臂;gehealthcare,littlechalfont,uk)进行验证,以避免潜在的脑干损伤。csf收集后,将luer通路延长装置或小口径t端口延长装置导管连接到脊髓针上,以促进180mg/ml碘海醇造影剂(gehealthcare,littlechalfont,uk)的给药。在验证针头位置后,将装有测试品的注射器(体积等于1ml加上注射器体积和接头死区)连接到柔性接头并注射30±5秒。取下针头,且直接对穿刺部位施加压力。[0210]iv注射程序[0211]通过输液泵(harvardapparatus,holliston,ma)以1ml/min的速率将10ml载体测试品施用至猕猴的外周静脉。[0212]转基因表达分析[0213]根据制造商说明书(lifetechnologies),使用trizol从所有rnalater处理的组织中提取全组织rna。根据制造商的方案(roche,basel,switzerland)用dnasei处理提取的rna。使用rneasyminikit(qiagen)纯化rna。使用appliedbiosystemshighcapacitycdnareversetranscriptasekit(lifetechnologies)进行cdna的逆转录合成。靶向位于6bp独特条形码两侧的区域的引物用于pcr扩增117bp扩增子(正向引物:ggcgaacagcggacaccgatatgaa(seqidno:11),反向引物:ggctctcgtcgcgtgagaatgagaa(seqidno:12)),且q5high‑fidelityhotstartdna聚合酶(newenglandbiolabs)用于使用以下循环条件进行反应:98℃持续30s;98℃持续10s,72℃持续17s,25个循环;以及72℃延伸持续120s。使用miseqstandard2×150bp测序平台(illumina)对扩增子进行测序。[0214]使用来自expressionanalysis包(github.com/expressionanalysis/ea‑utils)、cutadapt(cutadapt.readthedocs.io/en/stable/)、fastx工具包(hannonlab.cshl.edu/fastx_toolkit/)和r版本3.3.1.(cran.r‑project.org/bin/windows/base/old/3.3.1/)的fastq‑join程序分析条形码读段。来自组织样本的条形码表达计数数据被标准化为来自每个动物的测序注射载体材料的条形码计数,并且来自每个组织样本的条形码比例使用graphpadprism版本7.04绘制。[0215]实例2:aav‑sga[0216]腺相关病毒(aav)是单股dna细小病毒,无致病性且免疫原性较弱,这使其成为基因疗法的有效候选载体。自从发现第一代aav(aav1‑6)以来,我们的实验室一直在努力从各种高等灵长类动物物种中分离出大量病毒。此处鉴定的第二代aav是使用基于批量pcr的技术分离的,所述技术使用针对特异于灵长类动物源性aav基因组的保守区的引物。我们使用aav‑sga探索了aav在其天然哺乳动物宿主中的遗传变异(图1)。[0217]aav‑sga是一种强大的技术,可用于从混合群体中高精度分离单个病毒基因组。在本研究中,我们使用aav‑sga从恒河猴组织标本中鉴定了新的aav基因组。新病毒分离株具有遗传多样性,并且可分类成进化枝d、e和边缘进化枝(图2)。我们的小鼠研究表明,新型衣壳表现出特定于进化枝的转导模式。[0218]实例3:使用带条形码的转基因系统对非人类灵长类动物的新型aav天然分离物进行转导评估[0219]腺相关病毒(aav)载体已被证明是临床应用中安全且有效的基因转移载体,但它们可能会受到预先存在的对病毒的免疫力的阻碍,并且可能具有受限的组织向性。我们证明了带条形码的转基因方法可以有效地同时比较多种aav血清型对单一动物中各种组织的转导。这种技术减少了使用的动物数量,并防止了与外来转基因相关的免疫反应。因此,在转录本的polya信号之前,将新型衣壳和其各自的原型进化枝成员对照(aav6.2、aav7、aav8、aavrh32.33和aav9)制成包含修饰的egfp转基因和独特的六碱基对条形码的载体(图9)。通过删除atg序列基序来修饰转基因,以防止多肽翻译和随后对外来蛋白质的免疫反应。载体以等量汇集并在食蟹猴体内iv或icm注射(总剂量:2e13gc/kgiv和3e13gcicm)以评估新型衣壳的全身和中枢神经系统转导模式。iv注射的动物在基线时对aav6、aav8和aavrh32.33呈血清阴性,并且针对aav7和aav9的中和抗体滴度分别为1∶5和1∶10。[0220]具有cb7.ci.egfp.wpre.rbg的aavrh92载体在对小鼠iv注射后14天显示出脑脉管系统的转导(图13)。对新型和对照衣壳的小规模制剂产率的评估表明,aavrh.92和aavrh.93显示出与其它先前鉴定的衣壳(包括aav8)相当的产率。(图11)。[0221]实例4:ly6基因在脑内皮细胞中的靶向表达[0222]aavrh.92用于将ly6a和ly6c1基因递送至balb/crag‑/‑小鼠的血脑屏障(bbb)(图12a)。ly6a基因产物已显示与iv递送的aav.php.b结合并促进其在c57bl/6而非balb/c小鼠中穿过bbb的转移(参见hordeaux,j.等人,《分子疗法》,2019,27:912‑21)。我们旨在使用aavrh.92的内皮靶向特性将ly6a基因递送至ly6a缺陷型balb/crag‑/‑小鼠的bbb,然后递送携带egfp转基因的aav.php.b,以重现其bbb穿越能力。结果表明,通过载体基因组生物分布分析,小鼠脑中有足够的aavrh92.ly6a转导。然而,ly6a的表达不会使aav.php.b穿过bbb或后续脑实质转导增强(图12b)。在通过aavrh92递送将ly6a引入至balb/crag‑/‑小鼠的bbb后,aav9或aavphp.b的转导没有差异。[0223](序列表自由文本)[0224]针对含有在数字标识符<223>下的自由文本的序列提供以下信息。[0225][0226][0227]本说明书中引用的所有文献均以引用的方式并入本文中。于2019年10月21日提交的美国临时专利申请第62/924,095号、于2019年10月10日提交的美国临时专利申请第62/913,314号以及于2019年4月29日提交的美国临时专利申请第62/840,184号连同其序列表以全文引用的方式并入。随此提交的名称为“19‑8901pct3_st25.txt”的序列表和其中的序列和文本以引用的方式并入。虽然已经参考特定实施例描述了本发明,但应当理解,可以在不脱离本发明的精神的情况下进行修改。此类修改意图属于所附权利要求的范围内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1