腺相关病毒变体衣壳和其使用方法与流程

文档序号:17117568发布日期:2019-03-15 23:28阅读:4474来源:国知局
腺相关病毒变体衣壳和其使用方法与流程

通过引用作为文本文件提供的序列表并入

序列表在本文中作为于2017年5月12日创建并且大小为198kb的文本文件“4d_st25.txt”提供。文本文件的内容通过引用以其全文并入本文。

本文公开的发明总体上涉及包括变体衣壳蛋白的腺相关病毒(aav)病毒粒子领域和使用定向进化技术产生这种变体衣壳。



背景技术:

遗传性视网膜疾病涵盖大量异质性遗传疾病,其影响约3000人中的1人(全世界超过2百万人),并且是严重视力丧失或失明的主要来源。复杂的多因素视网膜疾病如湿性年龄相关性黄斑变性(wamd)和糖尿病性视网膜病变(dr)影响甚至更多的个体,目前有170万美国人患有与wamd相关的严重中央视力丧失,并且患有糖尿病的年龄超过40岁的近三分之一成年人具有视力障碍。这些疾病通常与一种或多种类型的视网膜细胞的功能障碍或死亡相关联,在某些情况下由于缺乏关键蛋白的表达或功能,例如lca2中的rpe65,在其它情况下由于产生毒性基因产物的基因突变,例如影响视紫红质蛋白折叠的显性突变,或者在又其它情况下由于由蛋白质的异位表达诱导的视网膜生理学变化,例如wamd中的vegf。

解决这种巨大的非医学需求的一种方法是基于基因的腺相关病毒(aav)介导疗法,其中使用重组腺相关病毒(raav)将基因递送到视网膜中的一种或多种类型的细胞以例如替换缺失的基因、纠正显性缺陷基因、或提供连续蛋白质疗法的模板。虽然基于aav的临床基因疗法已经越来越成功,但是在病毒载体性质方面仍然存在缺点,包含例如以高效率靶向期望的视网膜细胞。例如,已经识别并表征了多种同源灵长类动物aav血清型和许多非人灵长类血清型,其中aav2在aav血清型中是最佳表征的并且是第一种适合作为眼中的基因递送媒剂的。然而,尚未报道这些aav(包含aav2)在通过玻璃体内施用递送时有效转导视网膜的较深细胞类型。因此,本领域需要具有优异转导能力的新aav变体,其将为视网膜细胞提供更有效的基于基因的递送以治疗眼病。本领域需要这种aav变体,所述aav变体显示出增强的视网膜转导谱-与本领域已知的野生型aav和aav变体相比,在某些情况下,所述aav变体广泛地用于某些视网膜细胞类型,在其它情况下,所述aav变体优先用于某些视网膜细胞类型。

天然存在的aav是单链dna病毒,其含有三个开放阅读框,rep、cap和aap。第一个基因rep对基因组复制必需的四种蛋白质(rep78、rep68、rep52和是rep40)进行编码,第二个基因cap表达组装形成病毒衣壳的三种结构蛋白(vp1-3),并且第三个基因表达对衣壳组装至关重要的组装激活蛋白(aap)。aav依赖于辅助病毒的存在进行活性复制,如腺病毒或疱疹病毒。在没有辅助病毒的情况下,aav建立潜伏状态,其中其基因组以游离方式维持或整合到aavs1基因座中的宿主染色体中。

体外和体内定向进化技术可以用于选择aav变体,所述aav变体提供对当前基于aav的基因递送载体的改进。这种定向进化技术是本领域已知的并且描述于例如pct公开wo2014/194132和kotterman&schaffer(《遗传性自然评论(naturereviewgenetics)》,aop,2014年5月20日在线出版;doi:10.1038/nrg3742)中,这两者均通过引用以其全部并入本文。定向进化是一种衣壳工程方法,其通过迭代轮次的遗传多样化和选择过程模拟自然进化,从而能够积累逐步改善生物分子的功能如基于aav的病毒粒子的有益的突变。在此方法中,使野生型aavcap基因多样化以产生大的遗传文库,其被包装以产生病毒颗粒文库,并且应用选择性压力以分离具有可以克服基因递送障碍的优良表型的独特变体。

以下中已经公开了aav变体:例如美国专利号9,193,956;9;186;419;8,632,764;8,663,624;8,927,514;8,628,966;8,263,396;8,734,809;8,889,641;8,632,764;8,691,948;8,299,295;8,802,440;8,445,267;8,906,307;8,574,583;8,067,015;7,588,772;7,867,484;8,163,543;8,283,151;8,999,678;7,892,809;7,906,111;7,259,151;7,629,322;7,220,577;8,802,080;7,198,951;8,318,480;8,962,332;7,790,449;7,282,199;8,906,675;8,524,446;7,712,893;6,491,907;8,637,255;7,186,522;7,105,345;6,759,237;6,984,517;6,962,815;7,749,492;7,259,151;和6,156,303;美国公开号2013/0295614;2015/0065562;2014/0364338;2013/0323226;2014/0359799;2013/0059732;2014/0037585;2014/0056854;2013/0296409;2014/03350542013/0195801;2012/0070899;2011/0275529;2011/0171262;2009/0215879;2010/0297177;2010/0203083;2009/0317417;2009/0202490;2012/0220492;2006/0292117;和2004/0002159;欧洲公开号2692731a1;2383346b1;2359865b1;2359866b1;2359867b1;和2357010b1;1791858b1;1668143b1;1660678b1;1664314b1;1496944b1;1456383b1;2341068b1;2338900b1;1456419b1;1310571b1;1456383b1;1633772b1;和1135468b1;以及国际(pct)公开号wo2014/124282;wo2013/170078;wo2014/160092;wo2014/103957;wo2014/052789;wo2013/174760;wo2013/123503;wo2011/038187;以及wo2008/124015;wo2003/054197;然而,这些参考文献没有公开本文所描述的aav变体的实施例和/或特征和/或物质结构的组合物。

本文引用的和引用的专利文献中引用的所有文献和参考文献均通过引用结合到本文中。



技术实现要素:

本文提供了变体腺相关病毒(aav)衣壳蛋白,其具有相对于亲代aav衣壳蛋白对氨基酸序列的一种或多种修饰,当存在于aav病毒粒子中时,所述变体aav衣壳蛋白赋予一种或多种类型的视网膜细胞与通过包括未修饰的亲代aav衣壳蛋白的aav病毒粒子对所述视网膜细胞的感染性相比增加的感染性。还提供了重组aav病毒粒子和其包括如本文所描述的变体aav衣壳蛋白的药物组合物、制造变体raav衣壳蛋白和病毒粒子的方法、以及在研究和临床实践中使用这些raav衣壳蛋白和病毒粒子的方法,例如在将核酸序列递送到视网膜的一个或多个细胞以治疗视网膜病症和疾病的临床实践中。

在本公开的一些方面,提供了变体腺相关病毒(aav)衣壳蛋白,这些变体aav衣壳蛋白相对于亲本aav衣壳具有对氨基酸序列的一个或多个修饰,当存在于aav病毒粒子中时,所述变体aav衣壳蛋白赋予一种或多种类型的视网膜细胞(例如,感光细胞(例如视杆;视锥)、视网膜神经节细胞(rgc)、神经胶质细胞(例如müller胶质细胞、小胶质细胞)、双极细胞、无长突细胞、水平细胞和/或视网膜色素上皮(rpe)细胞)与通过包括亲代aav衣壳蛋白的aav病毒粒子对所述视网膜细胞的感染性相比增加的感染性,所述亲代aav衣壳蛋白不包括氨基酸序列修饰。

在本公开的一些方面,提供了重组aav(raav)病毒粒子,这些raav病毒粒子包括如本文所述的变体衣壳蛋白,其中所述raav病毒粒子表现出一种或多种类型的视网膜细胞(例如感光细胞)(例如,视杆;视锥)、视网膜神经节细胞(rgc)、神经胶质细胞(例如müller胶质细胞、小胶质细胞)、双极细胞、无长突细胞、水平细胞和/或视网膜色素上皮(rpe)细胞)相对于通过包括相应未修饰的亲代aav衣壳蛋白的aav病毒粒子对所述视网膜细胞的感染性的增加的感染性。在一些实施例中,相对于包括所述亲代aav衣壳蛋白的所述aav病毒粒子,所述raav病毒粒子表现出对所有视网膜细胞的增加的感染性。在其它实施例中,所述raav病毒粒子表现出对视网膜的某些细胞类型而不是相对于包括亲代aav衣壳蛋白的aav病毒粒子的其它细胞类型的增加的感染性。换句话说,所述raav病毒粒子表现出对视网膜的某些细胞类型而不是对其它细胞类型优选增加的感染性,例如raav表现出优选地对选自感光细胞、视网膜神经节细胞、神经胶质细胞、双极细胞、无长突细胞水平细胞和/或视网膜色素上皮(rpe)细胞的一种或多种细胞类型的增加的感染性,但未表现出对所有细胞类型的增加的感染性。

在一些实施例中,所述raav病毒粒子包括异源核酸。在一些这种实施例中,所述异源核酸对编码多肽的rna进行编码。在其它此类实施例中,所述异源核酸序列对不编码多肽的rna进行编码,例如核酸酶的异源核酸序列、rna干扰剂、指导rna等。

本文还提供了包括主题感染性raav病毒粒子和药学上可接受的载剂的药物组合物。

还提供了包括本文所述的变体衣壳蛋白的raav病毒粒子在通过使靶细胞与raav病毒粒子接触而将异源核酸递送到靶细胞(例如视网膜细胞)的方法中的用途。在一些实施例中,所述靶细胞在体内,例如在需要治疗眼部疾病的个体的眼睛中。在其它实施例中,所述靶细胞在体外。

还提供了通过向需要这种治疗的受试者施用有效量的raav病毒粒子来治疗眼病的方法,所述病毒离子包括如本文所述的变体衣壳蛋白或包括有效量的raav病毒粒子的药物组合物。

还提供了一种分离的核酸和包括所述分离的核酸的宿主细胞,所述分离的核酸包含对如本文所述的变体aav衣壳蛋白进行编码的序列。在又其它实施例中,所述分离的核酸和/或分离的宿主细胞包括raav。

在一些方面,所述变体aav衣壳蛋白包括在相对于相应的亲代aav衣壳蛋白的所述衣壳蛋白的gh-环中插入约5个氨基酸到约20个氨基酸(“异源肽”或“肽插入”),其中当存在于aav病毒粒子中时,所述变体衣壳蛋白赋予视网膜蛋白与包括相应亲代aav衣壳蛋白的aav病毒粒子相比增加的感染性。在一些实施例中,所述肽包括选自由以下组成的组的序列:qadttkn(seqidno:13)、isdqtkh(seqidno:14)、asdstka(seqidno:15)、nqdytkt(seqidno:16)、hditkni(seqidno:17)、hpdttkn(seqidno:18)、hqdttkn(seqidno:19)、nkttnkd(seqidno:20)、isneneh(seqidno:21)、qananen(seqidno:22)、gkskvid(seqidno:23)、tnrtspd(seqidno:24)、pnsthgs(seqidno:25)、kdrapst(seqidno:26)、laqadttkna(seqidno:27)、laisdqtkha(seqidno:28)、lgisdqtkha(seqidno:29)、laasdstkaa(seqidno:30)、lanqdytkta(seqidno:31)、lahditknia(seqidno:32)、lahpdttkna(seqidno:33)、lahqdttkna(seqidno:34)、lankttnkda(seqidno:35)、lpisneneha(seqidno:36)、lpqananena(seqidno:37)、lagkskvida(seqidno:38)、latnrtspda(seqidno:39)、lapnsthgsa(seqidno:40)和lakdrapsta(seqidno:41)。在一些实施例中,所述肽主要由选自由以下组成的组的序列组成:qadttkn(seqidno:13)、isdqtkh(seqidno:14)、asdstka(seqidno:15)、nqdytkt(seqidno:16)、hditkni(seqidno:17)、hpdttkn(seqidno:18)、hqdttkn(seqidno:19)、nkttnkd(seqidno:20)、isneneh(seqidno:21)、qananen(seqidno:22)、gkskvid(seqidno:23)、tnrtspd(seqidno:24)、pnsthgs(seqidno:25)、kdrapst(seqidno:26)、laqadttkna(seqidno:27)、laisdqtkha(seqidno:28)、lgisdqtkha(seqidno:29)、laasdstkaa(seqidno:30)、lanqdytkta(seqidno:31)、lahditknia(seqidno:32)、lahpdttkna(seqidno:33)、lahqdttkna(seqidno:34)、lankttnkda(seqidno:35)、lpisneneha(seqidno:36)、lpqananena(seqidno:37)、lagkskvida(seqidno:38)、latnrtspda(seqidno:39)、lapnsthgsa(seqidno:40)和lakdrapsta(seqidno:41)。在一些方面,所述变体aav衣壳蛋白包括相对于相应的亲代aav衣壳蛋白的一个或多个氨基酸取代,其中当存在于aav病毒粒子中时,所述变体衣壳蛋白赋予视网膜蛋白与通过包括相应亲代aav衣壳蛋白的aav病毒粒子对视网膜细胞的感染相比增加的感染性。

在相关方面,所述变体aav衣壳蛋白包括肽插入和相对于相应的亲代aav衣壳蛋白的一个或多个氨基酸取代,其中当存在于aav病毒粒子中时,所述变体衣壳蛋白赋予视网膜蛋白与通过包括相应亲代aav衣壳蛋白的aav病毒粒子对视网膜细胞的感染相比增加的感染性。

本文还公开了变体aav衣壳蛋白,其包括异源肽laisdqtkha(seqidno:28)和相对于aav2的p34a取代。

本文还公开了变体aav衣壳蛋白,其包括异源肽laisdqtkha(seqidno:28)和相对于aav2的氨基酸取代n312k、n449d、n551s、i698v和l735q。

本文还公开了用于制造和/或递送包括如本文中公开的变体aav衣壳的raav的方法。另外,本文提供了包括raav的试剂盒和用于本文所述的方法的用途,所述raav包括如本文公开的变体aav衣壳。

在其它实施例中,包括前述段落中的变体衣壳蛋白的aav病毒粒子可以并入任何前述或随后公开的实施例。实际上,应理解的是,为清楚起见在单独的实施例的上下文中描述的本发明的某些特征也可以在单个实施例中组合提供。相反,为简洁起见而在单个实施例的背景下描述的本发明的不同特征也可以单独地或以任何适合的子组合形式提供。本发明具体涵盖与本发明有关的实施例的所有组合,并且在本文中公开,就好像每个和每个组合被单独和明确地公开一样。此外,本发明还具体涵盖了各种实施例和其元件的所有子组合,并且在本文中公开,就好像每个子组合和每个这种子组合在本文中单独和明确地公开一样。

发明内容并非旨在限定权利要求,也不旨在以任何方式限制本发明的范围。

根据以下附图、具体实施方式和权利要求,本文公开的本发明的其它特征和优点将显而易见。

附图说明

当结合附图阅读时,从以下详细描述中可以最好地理解本发明。本专利或申请文件含有至少一幅彩色附图。在请求并支付必要的费用后,官方将会提供带有一幅或多幅彩色附图的本专利或专利申请公开物的副本。需要强调的是,根据惯例,附图的各种特征不是按比例的。相反,为了清楚这些不同的特征的尺寸被任意地扩大或减少。附图中包括以下图:

图1描绘了定向进化方法论的实施例。步骤(a)描绘了包括dna突变技术和cap基因的组合的病毒衣壳文库的产生。步骤(b)描绘了病毒的包装,使得每个病毒颗粒由围绕编码那个衣壳和纯化的cap基因的突变衣壳组成。然后将衣壳文库置于体外或体内选择压力下。在定向进化技术的这个方面,收获感兴趣的组织或细胞材料以分离已成功感染那个靶的aav变体,并回收成功的病毒。步骤(c)描绘了通过重复选择的成功克隆的阶段1富集。步骤(d)描绘了选择的cap基因的阶段2富集,所选择的cap基因经历再分散和进一步选择步骤以迭代地增加病毒适应性。步骤(e)描绘了在载体选择阶段1和2期间识别为命中的变体,其将作为重组aav载体制造并表征各种细胞类型和组织靶的转导水平。根据aav定向进化过程的性质,本文公开的变体已经证明在选择过程期间转导视网膜细胞并递送基因组(对变体cap基因进行编码的基因组)的能力。

图2提供了视网膜平面安装示意图,其显示了从视网膜的广泛区域收集、扩增病毒基因组的样品的位置。

图3示出了来自代表性选择轮的神经节细胞层(gcl)、内核层(inl)、光感受器/外核层(onl)和视网膜色素上皮(rpe)层视网膜组织的病毒基因组的pcr扩增。右眼(顶部图像)和左眼(底部图像)都注入了文库。对内视网膜(内)、中间视网膜(中)和外/周边视网膜(外)进行取样。红框内的条带代表病毒基因组的成功扩增。

图4a到图4d示出了测序分析内的基序的频率。图4a提供了第3轮测序分析。图4b提供了第4轮测序分析。图4c提供了第5轮测序分析。图4d提供了第6轮测序分析。

图5提供了含有氨基酸587后随机七聚体的aav2的代表性三维模型。

图6提供了野生型aavseqidno:1-11的比对,其示出了野生型(天然存在的)血清型aav1、aav2、aav3a、aav3b与aav4-10之间和跨其的氨基酸位置。

图7提供了用在玻璃体内施用2×1011个aav2的载体基因组(vg)后的非洲绿猴视网膜的heidelbergspectralistm拍摄的眼底荧光图像,所述aav2在cmv启动子的控制下递送gfp转基因(aav2.cmv.gfp)。图像是在注射后的基线(a)和第14天(b)、第28天(c)和第42天(d)拍摄的。

图8提供了在用玻璃体内施用2×1011个新型aav变体laisdqtkha+p34a的载体基因组(vg)后的非洲绿猴视网膜的heidelbergspectralistm拍摄的眼底荧光图像,所述aav变体在cmv启动子的控制下递送gfp转基因(laisdqtkha+p34a.cmv.gfp)。图像是在注射后的基线(a)和第14天(b)、第28天(c)和第42天(d)拍摄的。

图9提供了在用玻璃体内施用新型aav变体laisdqtkha+p34a后的非洲绿猴视网膜的heidelbergspectralistm拍摄的眼底荧光图像,所述aav变体在cag启动子的控制下递送gfp转基因(laisdqtkha+p34a.cag.egfp)。(a)用2×1011vg载体玻璃体内注射猴子的视网膜,注射后第14天(a1)、第21天(a2)和第28天(a3)成像。(b)用1×1012vg载体玻璃体内注射猴子的视网膜,注射后第14天(b1)和第21天(b2)成像。

图10a到图10e提供了在注射后三周分析的玻璃体内注射1×1012vg新型aav变体laisdqtkha+p34a的猴视网膜的免疫组织化学分析结果,所述新型aav变体在cag启动子控制下递送gfp转基因。所有免疫组织化学与相应的眼底荧光图像一起提供,红色框表示大约在视网膜中进行分析的位置。图10a:使用gfp特异性抗体(红色)观察到稳健的视网膜色素上皮(rpe)和光感受器转导。使用m/l视蛋白抗体的锥形光感受器免疫染色示出为白色。图10b和图10c:通过直接egfp荧光(绿色)和使用gfp特异性抗体(红色)的免疫组织化学观察到稳健的视杆和视锥光感受器(图10b)和rpe(图10c)转导。rpe中的黑素体在图像中显示为黑色。图10d:通过直接egfp荧光(绿色)和使用gfp特异性抗体(红色)的免疫组织化学观察到锥形光感受器(由m/l视蛋白识别,白色)和视网膜神经节细胞(rgc)在中央凹中和周围的转导。中间图中的图像是由左图中白色框表示的区域的更高放大率(63倍)。图10e:通过直接egfp荧光观察视网膜神经节细胞(rgc)和视网膜神经节细胞层的转导(右图,绿色;右下图是右上图的63倍放大);左上方示出了明场照明下的区域。

图11a到图11f提供了体外通过重组aav病毒转导人视网膜色素上皮(rpe)细胞的数据,所述重组aav病毒包括在cag启动子控制下的新型aav变体laisdqtkha+p34a衣壳和gfp转基因。用新型aav变体laisdqtkha+p34a.cag.gfp或野生型对照aav2.cag.gfp感染从人胚胎干细胞系(图11a和图11c)或人成纤维细胞源性诱导多能干细胞(fb-ipsc)分化成rpe细胞的细胞(图11b和11d)。图11a和11b:在moi为500的感染后7天对细胞培养物进行免疫荧光成像表明新型aav变体衣壳(左图)比野生型aav2衣壳更好地转导rpe细胞(右图)。图11c和图11d:通过流式细胞术定量每种培养物中gfp阳性rpe细胞的百分比揭示新型aav变体衣壳提供了在野生型aav2衣壳上转导的细胞数量的显著剂量依赖性改善,而与细胞来源无关。图11e和图11f:通过蛋白质印迹定量每种培养物中gfp的量揭示新型aav变体提供了转基因表达相对于野生型衣壳的显著改善,而与细胞来源无关。

具体实施方式

在描述本发明的方法和组合物之前,应理解本发明不限于所述的特定方法或组合物,并且因此可以变化。还应当理解,本文所使用的术语仅是为了描述具体实施例的目的,而不旨在是限制性的,因为本发明的范围将仅由所附权利要求限定。

在附图和说明书中说明了本文公开的发明。然而,虽然在附图中示出了具体实施例,但是并不意图将本发明限制于所说明和/或公开的具体实施例或实施例。相反,本文公开的发明旨在覆盖落入本发明的精神和范围内的所有修改、替代构造和等同物。因此,附图旨在是说明性的而非限制性的。

在提供了一系列值时,应理解每个中间值,到下限的第十个单位(除非上下文清晰地另外指示),还具体地披露了该范围的上限与下限之间的值。陈述范围内的任何陈述值或中间值以及该规定范围内的任何其他陈述值或中间值之间每个较小的范围涵盖在本发明之内。这些较小范围的上限和下限可以独立地包括在所述范围内或排除在其外,并且每个范围(其中两个极限之一、没有一个、或都包括在所述较小的范围内)也包括在本发明内,服从所述范围中任何特别排除的限值。在所陈述的范围包括一个或两个限值时,排除了那些被包括的限值的任一个或两者的范围也被包括在本发明之内。

除非另外定义,在此所使用的全部技术术语和科学术语具有与本发明所属领域之内的普通技术人员通常所理解的相同的意思。虽然类似或等效于在此描述的那些方法和材料的任何方法和材料也可以用于本发明的实践或测试,但现在描述一些潜在以及优选的方法和材料。在此提及的所有公开是通过引用结合在此,以结合所引用的这些公开来披露和描述这些方法和/或材料。应理解的是,本披露取代结合的出版物的任何矛盾的披露。

如将对于本领域技术人员清楚的是,在阅读本披露时,在此描述和展示的单独实施例的每一个具有离散的组成部分和特征,这些组成部分和特征可以在不偏离本发明的范围或精神的情况下易于与任何其他一些实施例的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可行的任何其他顺序来进行任何叙述的方法。

应当指出,如本文以及在所附权利要求书中所用的,单数形式“一个/一种(a/an)”以及“所述(the)”包括复数指代物,除非上下文另外清晰地指示。因此,例如,提及“重组aav病毒粒子”时包含多个此类病毒粒子,并且提及“感光细胞”时包含提及一种或多种感光细胞和其本领域技术人员已知的等同物等等。应当进一步指出,权利要求书可以撰写成排除任何可选的要素。因此,这样的陈述旨在用作使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”等或使用“否定型”限定的前提基础。

仅提供在此讨论的这些公开在本申请的提交日期之前的披露内容。在此不应被视为承认本发明因现有发明而无权先于这些公开。另外,所提供的公开日期可能与实际公开日期不同,实际公开日期可能需要独立地确定。

定义

除非另有定义,否则在此所使用的所有科学和技术术语均具有与本技术所属领域技术人员所通常理解的相同含义。

腺相关病毒是一种非致病性细小病毒,其由无包膜二十面体衣壳内的4.7kb单链dna基因组构成。基因组包含三个开放阅读框(orf),两侧是作为病毒复制和包装信号起源的反向末端重复序列(itr)。reporf对四种非结构蛋白进行编码,这四种非结构蛋白在病毒复制、转录调节、位点特异性整合和病毒粒子组装中发挥作用。caporf对三种结构蛋白(vp1-3)进行编码,这三种结构蛋白组装形成60-mer病毒衣壳。最后,作为cap基因内的替代阅读框存在的orf产生组装激活蛋白(aap),aap是一种病毒蛋白,其将aav衣壳蛋白定位于细胞核并在衣壳组装过程中起作用。

存在若干种天然存在的(“野生型”)血清型和超过100种已知的aav变体,所述变体中的每种变体的氨基酸序列不同,特别是在衣壳蛋白的高变区内以及因此在其基因递送性质方面。没有aav与任何人类疾病相关,使得重组aav对临床应用具有吸引力。

出于本文公开的目的,术语“aav”是腺相关病毒的缩写,包含但不限于病毒本身和其衍生物。除非另有说明,否则术语是指所有亚型或血清型以及复制能力型和重组型。术语“aav”包含但不限于aav1型(aav-1或aav1)、aav2型(aav-2或aav2)、aav3a型(aav-3a或aav3a)、aav3b型(aav-3b或aav3b)、aav4型(aav-4或aav4)、aav5型(aav-5或aav5)、aav6型(aav-6或aav6)、aav7型(aav-7或aav7)、aav型8(aav-8或aav8)、aav9型(aav-9或aav9)、aav10型(aav-10或aav10或aavrh10)、禽aav、牛aav、犬aav、山羊aav、马aav、灵长类动物aav、非灵长类动物aav和绵羊aav。“灵长类动物aav”是指感染灵长类动物的aav,“非灵长类动物aav”是指感染非灵长类哺乳动物的aav,“牛aav”是指感染牛哺乳动物的aav等。

各种血清型aav的基因组序列以及天然末端重复序列(tr)、rep蛋白和衣壳亚基序列是本领域已知的。这种序列可以在文献中或在如genbank等公共数据库中找到。参见,例如,genbank登录号nc_002077.1(aav1)、af063497.1(aav1)、nc_001401.2(aav2)、af043303.1(aav2)、j01901.1(aav2)、u48704.1(aav3a)、nc_001729.1(aav3a)、af028705.1(aav3b)、nc_001829.1(aav4)、u89790.1(aav4)、nc_006152.1(aa5)、af085716.1(aav-5)、af028704.1(aav6)、nc_006260.1(aav7)、af513851.1(aav7)、af513852.1(aav8)nc_006261.1(aav-8)、ay530579.1(aav9)、aat46337(aav10)和aao88208(aavrh10);其公开内容通过引用并入本文以教导aav核酸和氨基酸序列。参见,例如,srivistava等人,(1983),《病毒学期刊(j.virology)》,45:555;chiorini等人,(1998),《病毒学期刊(j.virology)》,71:6823;chiorini等人,(1999),《病毒学期刊(j.virology)》,73:1309;bantel-schaal等人,(1999),《病毒学期刊(j.virology)》,73:939;xiao等人,(1999),《病毒学期刊(j.virology)》,73:3994;muramatsu等人,(1996)《病毒学(virology)》,221:208;shade等人,(1986),《病毒学期刊(j.virol.)》58:921;gao等人,(2002)《美国科学院院报(proc.nat.acad.sci.usa)》,99:11854;moris等人,(2004)《病毒学(virology)》,33:375-383;国际公开号wo00/28061、wo99/61601、wo98/11244;以及美国专利号6,156,303。

与aav血清型相关的天然存在的cap(衣壳)蛋白的序列是本领域已知的并且包含本文公开的那些序列号:如aav1(seqidno:1)、aav2(seqidno:2)、aav3a(seqidno:3)、aav3b(seqidno:4)、aav4(seqidno:5)、aav5(seqidno:6)、aav6(seqidno:7)、aav7(seqidno:8)、aav8(seqidno:9)、aav9(seqidno:10)、aav10(seqidno:11)和aavrh10(seqidno:12)。术语“变体aav衣壳蛋白”或“aav变体”是指包括氨基酸序列的aav衣壳蛋白,所述氨基酸序列包含相对于天然存在的或“野生型”aav衣壳蛋白序列例如如本文seqidno:1-12所阐述的至少一个修饰或取代(包含缺失、插入、点突变等)。变体aav衣壳蛋白可以与野生型衣壳蛋白的氨基酸序列具有约80%的一致性或更多,例如与野生型衣壳蛋白的氨基酸序列具有85%一致性或更高、90%一致性或更高、或95%一致性或更高,例如与野生型衣壳蛋白具有98%或99%的一致性。变体aav衣壳蛋白可能不是野生型衣壳蛋白。

出于本文公开的目的,“aav病毒粒子”或“aav病毒颗粒”是指由至少一种aav衣壳蛋白和衣壳化的aav多核苷酸构成的病毒颗粒。

出于本文公开的目的,术语“raav”是指重组腺相关病毒的缩写。应用于多核苷酸的“重组”是指多核苷酸是克隆、限制或连接步骤的各种组合的产物、以及导致不同于在自然中找到的的多核苷酸的构建体的其它过程。重组病毒是包括重组多核苷酸的病毒颗粒。所述术语分别包含原始多核苷酸构建体的复制和原始病毒构建体的后代。

术语“raav载体”涵盖raav病毒粒子(即raav病毒粒子)(例如,感染性raav病毒粒子),其定义包含raav多核苷酸;并且还涵盖对raav进行编码的多核苷酸(例如,对raav进行编码的单链多核苷酸(ss-raav);对raav进行编码的双链多核苷酸(ds-raav),例如对raav进行编码的质粒;等等)。

如果aav病毒粒子包括异源多核苷酸(即除野生型aav基因组以外的多核苷酸,例如待递送到靶细胞的转基因、待递送到靶细胞的rnai剂或crispr剂等),它通常被称为“重组aav(raav)病毒粒子”或“raav病毒颗粒”。通常,异源多核苷酸的两侧是至少一个,并且通常是两个aav反向末端重复序列(itr)。

术语“包装”是指导致aav颗粒的组装和衣壳化的一系列细胞内事件。aav“rep”和“cap”基因是指对腺相关病毒的复制和衣壳化蛋白进行编码的多核苷酸序列。aavrep和cap在本文中称为aav“包装基因”。

术语aav的“辅助病毒”是指允许aav(例如野生型aav)被哺乳动物细胞复制和包装的病毒。用于aav的各种各样的辅助病毒是本领域已知的,包含腺病毒、疱疹病毒和痘病毒如牛痘病毒。腺病毒涵盖许多不同的亚组,尽管最常用的是亚组c的5型腺病毒。人、非人哺乳动物和禽类的许多腺病毒是已知的并且可从如atcc等保藏机构获得。疱疹病毒家族的病毒包含例如单纯疱疹病毒(hsv)和爱泼斯坦巴尔病毒(ebv)、以及巨细胞病毒(cmv)和伪狂犬病病毒(prv);这些也可以从如atcc等保藏机构获得。

术语“一个或多个辅助病毒功能”是指在辅助病毒基因组中编码的一个或多个功能,其允许aav复制和包装(结合本文所述的复制和包装的其它要求)。如本文所述,“辅助病毒功能”可以多种方式提供,包含通过提供辅助病毒或向反式生产细胞提供对一个或多个必需功能进行编码的多核苷酸序列。例如,将包括对一种或多种腺病毒蛋白进行编码的核苷酸序列的质粒或其它表达载体与raav载体一起转染到生产细胞中。

术语“感染性”病毒或病毒颗粒是包括有效组装的病毒衣壳并且能够将多核苷酸组分递送到病毒物种为热带的细胞中的术语。所述术语不一定意味着病毒的任何复制能力。在本公开内容和本领域中描述了用于计数感染性病毒颗粒的测定。病毒感染性可以表示为感染性病毒颗粒与总病毒颗粒的比例。确定感染性病毒颗粒与总病毒颗粒的比例的方法是本领域已知的。参见例如,grainger等人,(2005)《分子疗法(mol.ther.)》11:s337(描述tcid50感染性滴度测定);和zolotukhin等人,(1999)《基因疗法(genether.)》6:973。另见实例。

如本文所用的术语“趋向性”是指病毒(例如,aav)优先靶向特定宿主物种的细胞或宿主物种内的特定细胞类型。例如,相对于仅可能感染肺和肌肉细胞的病毒,可以感染心脏、肺、肝和肌肉细胞的病毒具有更宽(即增加)的趋向性。趋向性还可以包含病毒对宿主的特定类型的细胞表面分子的依赖性。例如,一些病毒只可能感染具有表面糖胺聚糖的细胞,而其它病毒只可能感染具有唾液酸的细胞(这种依赖性可以使用缺乏特定类别分子的各种细胞系作为病毒感染的潜在宿主细胞进行测试)。在某些情况下,病毒的趋向性描述了病毒的相对偏好。例如,第一种病毒可能能够感染所有细胞类型,但在用表面糖胺聚糖感染这些细胞方面更成功。如果第二种病毒也更喜欢相同的特征(例如,第二种病毒在用表面糖胺聚糖感染这些细胞方面也更成功),则可以认为第二种病毒与第一种病毒具有相似(或一致)的趋向性,即使绝对转导效率不相似。例如,第二种病毒在感染每种测试的给定细胞类型时可能比第一种病毒更有效,但如果相对偏好相似(或一致),则第二种病毒仍可被认为具有与第一种病毒相似(或一致)的趋向性。在一些实施例中,相对于天然存在的病毒粒子,包括主题变体aav衣壳蛋白的病毒粒子的趋向性没有改变。在一些实施例中,相对于天然存在的病毒粒子,包括主题变体aav衣壳蛋白的病毒粒子的趋向性被扩展(即,变宽)。在一些实施例中,相对于天然存在的病毒粒子,包括主题变体aav衣壳蛋白的病毒粒子的趋向性降低。

术语“具有复制能力的”病毒(例如,具有复制能力的aav)是指具有感染性并且还能够在受感染的细胞中复制(即在存在辅助病毒或辅助病毒功能的情况下)的表型野生型病毒。在aav的情况下,复制能力通常需要存在功能性aav包装基因。通常,由于缺乏一种或多种aav包装基因,如本文所述的raav载体在哺乳动物细胞(特别是在人细胞中)中是不能复制的。通常,此类raav载体缺乏任何aav包装基因序列,以最小化通过aav包装基因与进入的raav载体之间的重组产生复制能力aav的可能性。在许多实施例中,如本文所述的raav载体制剂是那些含有很少(如果有的话)复制能力aav(rcaav,也称为rca)的那些载体制剂(例如,每102个raav颗粒小于约1rcaav、每104个raav颗粒小于约1rcaav、每10个raav颗粒小于约1rcaav、每1012个raav颗粒小于约1rcaav、或没有rcaav)。

术语“多核苷酸”是指任何长度的聚合形式的核苷酸,包含脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸可以包括修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物,并且可以被非核苷酸组分中断。如果存在对核苷酸结构的修饰,那么在组装聚合物之前或之后进行。如本文所用,术语多核苷酸可互换地指双链和单链分子。除非另有说明或要求,否则本文包括多核苷酸的任何实施例涵盖双链形式和已知或预测构成双链形式的两种互补单链形式中的每一种。

多核苷酸或多肽与另一多核苷酸或多肽具有一定百分比的“序列一致性”,这意味着当比对时,碱基或氨基酸的百分比在与两个序列比较时是相同的。序列相似性可以以多种不同方式确定。为了确定序列一致性,可以使用包含可通过万维网ncbi.nlm.nih.gov/blast/获得的blast的方法和计算机程序对序列进行比对。另一种比对算法是fasta,其可从是oxfordmoleculargroup,inc的全资子公司美国威斯康星州麦迪逊市的遗传计算组(gcg)包中获得。其它用于比对的技术描述于《酶学方法(methodsinenzymology)》,第266卷:用于大分子序列分析的计算机方法(1996),编辑,美国加利福尼亚州圣地亚哥harcourtbrace&co.的部门doolittle,academicpress,inc.特别感兴趣的是允许序列中存在间隙的比对程序。smith-waterman是一种允许序列比对间隙的算法。参见《(分子生物学方法(meth.mol.biol.)》,70:173-187(1997)。此外,使用needleman和wunsch比对方法的gap程序可以用于比对序列。参见《(分子生物学期刊(j.mol.biol.)》,48:443-453(1970)。

术语“基因”是指在细胞中发挥某种功能的多核苷酸。例如,基因可以含有能够对基因产物进行编码的开放阅读框。基因产物的一个实例是从基因转录和转译的蛋白质。基因产物的另一个实例是被转录但未转译的rna,例如功能性rna产物,例如核酸酶的适体、干扰rna、核糖体rna(rrna)、转移rna(trna)、非编码rna(ncrna)、指导rna等。

术语“基因表达产物”或“基因产物”是由如上文限定的特定基因的表达产生的分子。基因表达产物包含例如多肽、适体、干扰rna、信使rna(mrna)、rrna、trna、非编码rna(ncrna)等。

术语“sirna剂”(“小干扰”或“短干扰rna”(或sirna))是靶向感兴趣基因(“靶基因”)的核苷酸的rna双链体。“rna双链体”是指通过rna分子的形成双链rna区域(dsrna)的两个区域之间的互补配对形成的结构。sirna被“靶向”基因,因为sirna的双链体部分的核苷酸序列与靶基因的核苷酸序列互补。在一些实施例中,sirna的双链体的长度小于30个核苷酸。在一些实施例中,双链体的长度可以是29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11或10个核苷酸。在一些实施例中,双链体的长度为19到25个核苷酸。在一些实施例中,sirna介导的基因靶向是通过使用dna指导的rna干扰(ddrnai)实现的,所述ddrnai是利用dna构建体激活动物细胞的内源rna干扰(rnai)途径的基因沉默技术。这种dna构建体被设计成表达一旦处理就引起一个靶基因或多个靶基因沉默的自身互补的双链rna,通常是短发夹rna(shrna)。包含内源mrna或病毒rna的任何rna可以通过设计构建体以表达与期望mrna靶互补的双链rna被沉默。因此,sirna剂的rna双链体部分可以是被称为shrna的短发夹结构的一部分。除了双链体部分之外,发夹结构可以包含位于形成双链体的两个序列之间的环部分。所述环的长度可以变化。在一些实施例中,环的长度为5、6、7、8、9、10、11、12或13个核苷酸。发夹结构还可以包含3'或5'突出部分。在一些实施例中,突出是长度为0、1、2、3、4或5个核苷酸的3'或5'突出。通常,靶基因的表达产物(例如,mrna、多肽等)的水平被包含特异性双链核苷酸序列的sirna剂(例如,sirna、shrna等)降低,所述特异性双链核苷酸序列与长度至少为19到25个核苷酸区段(例如,20到21个核苷酸序列)的靶基因转录物互补,包含5'非转译(ut)区、orf或3'ut区。在一些实施例中,短干扰rna的长度为约19到25nt。参见,例如,pct申请woo/44895、w099/32619、wo01/75164、wo01/92513、wo01/29058、wo01/89304、wo02/16620和wo02/29858;以及描述sirna技术的美国专利公开号20040023390。sirna和/或shrna可以由核酸序列编码,并且核酸序列还可以包括启动子。核酸序列还可以包含多腺苷酸化信号。在一些实施例中,多腺苷酸化信号是合成的最小多腺苷酸化信号。

术语“反义rna”涵盖与基因表达产物互补的rna。例如,靶向特异性mrna的反义rna是基于rna的药剂(或可以是修饰的rna),所述基于rna的药剂与mrna互补,其中反义rna与mrna的杂交改变mrna的表达(例如,通过改变rna的稳定性、改变rna的转译等。)。“反义rna”中还包含对反义rna进行编码的核酸。

关于“crispr/cas9药剂”,术语“crispr”涵盖聚集的规则间隔短回文重复/crispr相关(cas)系统,其通过使用crisprrna(crrna)引导入侵核酸沉默进行进化以提供针对病毒和质粒的细菌和古细菌的适应性免疫。cas9蛋白(或其功能等同物和/或其变体,即cas9样蛋白)天然含有dna核酸内切酶活性,其依赖于蛋白质与被称为crrna和tracrrna(也称为指导rna)的两种天然存在的或合成的rna分子缔合。在一些情况下,两个分子共价连接以形成单个分子(也称为单个指导rna(“sgrna”))。因此,cas9或cas9样蛋白与dna靶向rna(所述术语涵盖双分子指导rna配置和单分子指导rna配置)相关联,所述dna靶向rna激活cas9或cas9样蛋白并将蛋白质指导到靶核酸序列。

如果cas9或cas9样蛋白保留其天然酶功能,则它将切割靶dna以产生双链断裂,这可导致基因组改变(即编辑:缺失、插入(当存在供体多核苷酸时)、替换等),从而改变基因表达。cas9的一些变体(其变体被术语cas9样涵盖)已被改变,使得它们具有降低的dna切割活性(在一些情况下,它们切割单链而不是靶dna的两条链,而在其它情况下,它们严重减少到没有dna切割活性)。具有降低的dna切割活性(甚至没有dna切割活性)的cas9样蛋白仍然可以被引导到靶dna以阻断rna聚合酶活性。可替代地,cas9或cas9样蛋白可以通过将vp64转录激活结构域与cas9蛋白融合并用ms2-p65-hsf1辅助蛋白和在四环上包括ms2rna适体的单一指导rna编码协同递送来修饰以在激活转录的细胞中形成协同激活介质(cas9-sam)复合物。因此,酶促失活的cas9样蛋白可以通过靶向dna的rna来靶向靶dna中的特定位置,以阻断或激活靶dna的转录。如本文所用的术语“crispr/cas9剂”涵盖如上所述或本领域已知的所有形式的crispr/cas9。

关于crispr剂的详细信息可以在以下文献中找到:例如(a)jinek等人,《科学(science)》,2012年8月17日;337(6096):816-21:“适应性细菌免疫中的可编程双-rna指导的dna内切核酸酶(aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity)”;(b)qi等人,《细胞(cell)》2013年2月28日;152(5):1173-83:“将crispr重新用作基因表达的序列特异性对照的rna指导平台(repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression)”,和(c)美国专利申请号13/842,859和pct申请号pct/us13/32589;其通过引用以其全部内容并入本文。因此,本文使用的术语“crispr剂”涵盖可以在基于cas9的系统(例如,cas9或cas9样蛋白;靶向dna的rna的任何组分,例如crrna样rna、tracrrna样rna、单一指导rna等;供体多核苷酸;等等)中使用的包括天然存在和/或合成序列的任何药剂。

“锌指核酸酶”(zfn)是指通过将锌指dna结合结构域与dna切割结构域融合而产生的人工dna内切核酸酶。zfn可以被工程化成靶向期望的dna序列,并且这使得锌指核酸酶能够切割独特的靶序列。当引入细胞中时,zfn可以用于通过诱导双链断裂来编辑细胞中的靶dna(例如,细胞的基因组)。有关使用zfn的更多信息,请参阅例如:asuri等人,《分子疗法(molther)》,2012年2月;20(2):329-38;bibikova等人,《科学(science)》,2003年5月2日;300(5620):764;wood等人,《科学(science)》,2011年7月15日;333(6040):307;ochiai等人,《基因细胞(genescells.)》,2010年8月;15(8):875-85;takasu等人,《昆虫生物化学分子生物学(insectbiochemmolbiol.)》,2010年10月;40(10):759-65;ekker等人,《斑马鱼(zebrafish)》,2008年夏天;5(2):121-3;young等人,《美国科学院院报(procnatlacadsciusa.)》2011年4月26日;108(17):7052-7;goldberg等人,《细胞(cell.)》,2010年5月5日;140(3):678-91;geurts等人,《科学(science)》,2009年7月24日;325(5939):433;flisikowska等人,《公共科学图书馆综合(plosone)》,2011;6(6):e21045.doi:10.1371/journal.pone.0021045.电子版2011年6月13日;hauschild等人,《美国科学院院报(procnatlacadsciusa.)》,2011年7月19日;108(29):12013-7;和yu等人,《细胞研究(cellres.)》,2011年11月;21(l1):1638-40;其通过引用以其与zfn相关的教导并入本文。术语“zfn剂”涵盖锌指核酸酶和/或包括对锌指核酸酶进行编码的核苷酸序列的多核苷酸。

术语“转录激活因子样效应核酸酶”或“talen”剂是指转录激活子样效应子核酸酶(talen)是通过将tal(转录激活子样)效应子dna结合结构域与dna切割结构域融合而产生的人工dna核酸内切酶。talens可以被快速工程化成实际上结合任何期望dna序列,并且当引入细胞时,talen可以通过诱导双链断裂来编辑细胞中的靶dna(例如,细胞的基因组)。有关使用talen的更多信息,请参阅例如:hockemeyer等人,《自然生物技术(natbiotechnol.)》,2011年7月7日;29(8):731-4;wood等人,《科学(science)》,2011年7月15日;333(6040):307;tesson等人,《自然生物技术(natbiotechnol.)》,2011年8月5日;29(8):695-6;和huang等人,《(自然生物技术(natbiotechnol.)》,2011年8月5日;29(8):699-700;其通过引用以其与talen相关的教导并入本文。术语“talen剂”涵盖talen和/或包括对talen进行编码的核苷酸序列的多核苷酸。

术语“对照元件”或“对照序列”是指参与分子相互作用的核苷酸序列,所述核苷酸序列有助于多核苷酸的功能调节,包含多核苷酸的复制、重复、转录、剪接、转译或降解。所述调节可能影响过程的频率、速度或特异性,并且可能本质上是增强或抑制的。本领域已知的对照元件包含例如转录调节序列,如启动子和增强子。启动子是能够在某些条件下与rna聚合酶结合并且启动通常位于启动子下游(3'方向)的编码区转录的dna区域。启动子可以普遍起作用,即在许多细胞类型中有活性,例如cag或cmv启动子;或组织或细胞特异性的,例如在视杆中有活性的rho启动子,或在视锥中有活性的视蛋白启动子。

术语“可操作地连接(operativelylinked或operablylinked)”是指遗传元件的并置,其中所述元件处于允许其以预期方式操作的关系中。例如,如果启动子有助于启动编码序列的转录,则启动子可操作地连接到编码区。只要保持这种功能关系,在启动子和编码区之间就可能存在间插残基。

术语“表达载体”涵盖包括对感兴趣多肽进行编码的多核苷酸区域的载体,并且用于实现蛋白质在预期靶细胞中的表达。表达载体还可以包括与编码区可操作地连接的控制元件,以促进蛋白质在靶中的表达。控制元件和其可操作地连接以进行表达的一个基因或多个基因的组合有时被称为“表达盒”,其中许多是本领域已知的并可获得的,或者可以容易地由在本领域可获得的组分构造。

术语“异源”是指源自与其进行比较的实体的其余部分的基因型不同的实体。例如,通过基因工程技术引入到衍生自不同物种的质粒或载体中的多核苷酸是异源多核苷酸。从其天然编码序列中除去并与天然未发现连接的编码序列可操作地连接的启动子是异源启动子。因此,例如,包含对异源基因产物进行编码的异源核酸序列的raav是包含通常不包含在天然存在的野生型aav中的多核苷酸的raav,并且编码的异源基因产物是通常不由天然存在的野生型aav编码的基因产物。

术语“遗传改变”和“遗传修饰”(和其语法变体)在本文中可互换使用以指代其中遗传元件(例如,多核苷酸)被引入除有丝分裂或减数分裂之外的细胞中的过程。所述元件对于细胞可以是异源的,或者它可以是已经存在于细胞中的元件的额外拷贝或改进版本。遗传改变可以例如通过用重组质粒或其它多核苷酸通过本领域已知的任何方法转染细胞来实现,如电穿孔、磷酸钙沉淀、或与多核苷酸-脂质体复合物接触。遗传改变还可以例如通过用dna或rna病毒或病毒载体转导或感染来实现。通常,遗传元件被引入细胞中的染色体或微型染色体中;但是任何改变细胞和其后代的表型和/或基因型的改变都包括在此术语中。

关于细胞修饰,术语(例如通过重组病毒)由外源性dna进行的“遗传修饰”或“转化”或“转染”或“转导”的术语是指何时这种dna已引入细胞内。外源dna的存在导致永久或瞬时的遗传变化。转化dna可以或可以不整合(共价连接)到细胞的基因组中。“克隆”是通过有丝分裂从单个细胞或共同祖先衍生的细胞群。“细胞系”是能够在体外稳定生长许多代的原代细胞的克隆。

如本文所用,如果序列可用于在体外延长的细胞培养期间和/或在体内延长的时间段发挥其功能,则称细胞被“稳定地”改变、转导、遗传修饰或用基因序列转化。通常,这种细胞被“可遗传地”改变(遗传修饰),因为引入了还可通过改变的细胞的后代遗传的遗传改变。

在此可互换使用的术语“多肽”、“肽”和“蛋白质”是指具有任何长度的氨基酸聚合物。这些术语还涵盖已修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂化、磷酸化或与标记组分的缀合。当在向哺乳动物受试者递送基因产物的背景下讨论时,多肽如抗血管生成多肽、神经保护多肽等和其组合物是指保留了完整蛋白质所需的生化功能的相应的完整多肽、或其任何片段或基因工程衍生物。类似地,提及对抗血管生成多肽进行编码的核酸、对神经保护多肽进行编码的核酸和其它用于将基因产物递送到哺乳动物受试者(其可以被称为待递送到受体细胞的“转基因”)的此类核酸包含对完整多肽进行编码的多核苷酸或具有期望生化功能的任何片段或基因工程衍生物。

如本文所用,“分离的”质粒、核酸、载体、病毒、病毒粒子、宿主细胞、蛋白质或其它物质是指缺乏至少一些其它组分的物质的制剂,所述其它组分还可以存在于天然存在或最初由其制备的物质或类似物质中。因此,例如,可以通过使用纯化技术从源混合物中富集分离的物质来制备所述分离的物质。富集可以在绝对基础上测量,如每体积溶液的重量,或者可以相对于源混合物中存在的第二种潜在干扰物质进行测量。本公开的实施例的增加的富集越来越孤立。在一些实施例中,分离的质粒、核酸、载体、病毒、宿主细胞或其它物质是纯化的,例如纯度为约80%到约90%、纯度至少为约90%、纯度至少为约95%、纯度至少为约98%、或纯度至少为约99%或更多。

如本文所用,术语“治疗(treatment、treating)”等是指获得期望药理学和/或生理学效果。就完全或部分预防疾病或其症状而言,所述效果可以是预防性的,和/或就部分或完全治愈疾病和/或可归因于疾病的副作用而言可以是治疗性的。如本文所用,“治疗”涵盖哺乳动物,特别是人类的疾病的任何治疗,并且包含:(a)预防可能在受试者中发生的疾病(和/或由疾病引起的症状),所述受试者可能易患所述疾病或有患病风险但尚未被诊断为患有所述疾病;(b)抑制疾病(和/或由疾病引起的症状),即阻止其发展;以及(c)缓解疾病(和/或由疾病引起的症状),即引起疾病(和/或由疾病引起的症状)消退,即改善疾病和/或疾病的一种或多种症状。例如,主题组合物和方法可以针对视网膜疾病的治疗。用于评估视网膜疾病和其治疗的非限制性方法包含测量视网膜功能和其变化,例如视力的变化(例如最佳矫正视力[bcva]、移动、导航、物体检测和辨别)、视野的变化(例如,静态和动态视野视野检查)、临床检查(例如,眼睛前后段的裂隙灯检查)、对所有光明和黑暗波长的电生理反应(例如所有形式的视网膜电图(erg)[全视野,多视野和模式]、所有形式的视觉诱发电位(vep)、眼电图(eog)、色觉、暗适应和/或对比敏感度;使用解剖学和/或摄影措施来测量解剖学或健康的变化,例如光学相干断层扫描(oct)、眼底照相、自适应光学扫描激光检眼镜、荧光和/或自发荧光;测量眼球动性和眼球运动(例如,眼球震颤、固定偏好和稳定性)、测量报告的结果(患者报告的视觉和非视觉引导行为和活动的变化、患者报告的结果[pro]、基于问卷的生活质量评估、日常活动和神经功能的测量(例如功能性磁共振成像(mri))。

术语“个体”,“宿主”,“受试者”和“患者”在本文中可互换使用,并且指哺乳动物,包含但不限于:人;非人类灵长类动物,包含猿猴;哺乳动物运动动物(如马);哺乳动物农场动物(如绵羊,山羊等);哺乳动物宠物(狗,猫等);和啮齿动物(例如,小鼠,大鼠等)。

在一些实施例中,个体是先前已经天然暴露于aav并且因此携带抗aav抗体(即,aav中和抗体)的人。在一些实施例中,个体是先前已经施用aav载体的人(并且因此可能携带抗aav抗体)并且需要再次施用载体以治疗不同病症或进一步治疗相同病症。基于将aav基因递送到受针对此载剂的中和抗体影响的所有组织例如肝脏、肌肉和视网膜的临床试验中的阳性结果,存在许多此类治疗应用/疾病靶。

如本文所用的,术语“有效量”是足以实现有益或期望的临床结果的量。有效量可以在一次或多次施用中施用。出于本公开的目的,有效量的化合物(例如,感染性raav病毒粒子)是足以减轻、改善、稳定、逆转、预防、减缓或延迟(和/或与其相关的症状)特定疾病状态(例如,视网膜疾病)的进展的量。因此,有效量的感染性raav病毒粒子是能够将异源核酸有效递送到个体的靶细胞(或多个靶细胞)的感染性raav病毒粒子的量。有效量可以通过例如使用本领域熟知的技术例如rt-pcr、蛋白质印迹、elisa、荧光或其它报道因子读数等在细胞或组织中检测由异源核酸序列编码的基因产物(rna,蛋白质)来临床前确定。如本文所述和如本领域已知的,有效量可以通过例如使用本领域已知的方法例如眼底自发荧光、荧光血管造影、oct、微观测量、自适应光学等检测疾病的发作或进展的变化来临床确定。

术语“视网膜细胞”在本文中是指包括视网膜的任何细胞类型,如但不限于视网膜神经节(rg)细胞、无长突细胞、水平细胞、双极细胞、感光细胞、müller神经胶质细胞、小神经胶质细胞和视网膜色素上皮(rpe)。术语“感光细胞”在本文中是指但不限于视杆细胞或“视杆”和视锥细胞或“视锥”。术语“müller细胞”或“müller神经胶质”是指支持脊椎动物视网膜中神经元的神经胶质细胞。

术语“定向进化”是指体外和/或体内衣壳工程方法论,其通过迭代轮次的遗传多样化和选择过程模拟自然进化,从而积累逐渐改善生物分子的功能的有益突变。定向进化通常涉及被称为“生物淘选”的体内方法,其用于从文库中选择aav变体,所述变体具有感兴趣的细胞或组织类型的更有效水平的感染性。

具体实施方式

腺相关病毒(aav)是一种细小病毒家族,其具有包含在无包膜衣壳内的4.7kb的单链dna基因组。天然存在的aav的病毒基因组具有2个反向末端重复序列(itr)-其作为复制和包装信号的病毒源起作用-侧翼为2个主要开放阅读框(orf):rep(编码在病毒复制中起作用的蛋白质、转录监管、位点特异性整合和病毒粒子装配)和cap。caporf对3种结构蛋白编码,这3种结构蛋白组装形成60-mer病毒衣壳。已经分离出许多天然存在的aav变体和血清型,并且没有一种与人类疾病相关。

aav的重组版本可以用作基因递送载体,其中感兴趣的标记或治疗基因插入取代rep和cap的itr之间。已经示出这些载体在体外和体内转导分裂和非分裂细胞,并且可以在有丝分裂后组织中导致稳定的转基因表达多年。参见例如,knipedm、howleypm,《费氏病毒学(fields'virology)》,美国宾夕法尼亚州费城lippincottwilliams&wilkins,2007年;gaog-p、alviramr、wangl、calcedor、johnstonj、wilsonjm,来自恒河猴的作为人类基因疗法的载体的新型腺相关病毒。《美国国家科学院院刊(procnatlacadsciusa)》(2002);99:11854–9;atchisonrw、castobc、hammonwm,腺病毒相关的缺陷病毒颗粒,《科学(science)》,1965;149:754–6;hogganmd、blacklownr、rowewp,在各种腺病毒制剂中发现的小dna病毒的研究:物理、生物和免疫学特征,《美国国家科学院院刊(procnatlacadsciusa)》(1966);55:1467-74;blacklownr、hogganmd、rowewp,从人体中分离腺病毒相关病毒,《美国国家科学院院刊(procnatlacadsciusa)》(1967);58:1410-5;bantel-schaalu、zurhausenh,表征从生殖器部位分离的缺陷型人细小病毒的dna,《病毒学(virology)》,1984;134:52-63;mayorhd、melnickjl,含有小脱氧核糖核酸的病毒(小脱氧糖核酸病毒基团),《自然(nature)》,1966;210:331-2;moris、wangl、takeuchit、kandat,来自食蟹猴的两种新型腺相关病毒:衣壳蛋白的假型表征,《病毒学(virology)》,2004;330:375-83;flottetr,基因疗法的进展和前景:重组腺相关病毒(raav)载体,《基因疗法(genether)》,2004;11:805–10.

重组aav(在本文中简称为“aav”)在越来越多的临床试验中具有有希望的结果。然而,基因递送的障碍可能限制aav的效用,如抗衣壳免疫应答、某些组织的低转导、不能靶向递送到特定细胞类型和相对低的携带能力。在许多情况下,没有足够的机械知识来有效地赋予具有改善aav的能力的合理设计。作为替代方案,定向进化已成为创建满足特定生物医学需求的新型aav变体的策略。定向进化策略利用遗传多样化和选择过程来积累能够逐步改善生物分子的功能的有益突变。在此过程中,野生型aavcap基因通过若干种方法多样化以产生大型遗传文库,所述大型遗传文库被包装以产生病毒颗粒文库,并且然后应用选择性压力以分离可以克服基因递送障碍的新型变体。重要的是,基因递送问题的机制基础不需要为功能的定向进化所知,这可以因此加速增强的载体的发展。

通常,本文公开的变体是通过使用一个aav文库和/或多个aav文库产生的。通过病毒基因组工程领域的技术人员已知且可容易获得的一系列定向进化技术使cap基因突变产生此类一种aav文库或多种aav文库,所述cap基因是一种对aav衣壳结构蛋白进行编码的基因。参见例如,bartel等人,《美国基因与细胞疗法协会第15届年会(am.soc.genecellther.15thannu.meet.20,s140(2012);bowles,d.等人,《病毒学期刊(j.virol.)》77,423-432(2003);gray等人,《分子疗法(mol.ther.)》18,570-578(2010);grimm,d.等人,《病毒学期刊(j.virol.)》82,5887-5911;koerber,j.t.等人,《分子疗法(mol.ther.)》16,1703-1709(2008);liw.等人,《分子疗法(mol.ther.)》16,1252-1260(2008);koerber,j.t.等人,《分子生物学方法(methodsmol.biol.)》,434,161-170(2008);koerber,j.t.等人,《人类基因疗法(hum.genether.)》,18,367-378(2007);和koerber,j.t.等人,《分子疗法(mol.ther.)》17,2088-2095(2009)。这种技术非限制性地如下:i)用于以预定的可修改的速率将随机点突变引入aavcap开放阅读框(orf)的易错pcr;ii)体外或体内病毒重组或“dna改组”,其用于产生aavcap基因的随机嵌合体以产生具有多种aav血清型的基因文库;iii)通过在caporf中连接简并寡核苷酸而在衣壳的限定位点处的随机肽插入;iv)使用转座子诱变将肽编码序列限定插入aavcaporf的随机位置;v)用基于天然aav血清型和变体中每个氨基酸位置的保守水平生物信息设计的肽序列文库替换aav衣壳的表面环,以产生“环交换”文库;vi)在aav血清型之间的简并性位置处的随机氨基酸取代以产生祖先变体的文库(santiago-ortiz等人,2015);和其这种技术的组合。

dna改组产生嵌合体,所述嵌合体以独特且通常有益的方式结合其亲代特性;然而,有些可能无法进行包装,这实际上会降低文库的多样性。通过肽插入技术实现文库的多样性浓度,如但不限于上述iii-iv)。文库的多样性也集中在诸上述v)的技术中,并且这种浓度指向位于aav衣壳的表面暴露环上的多个高变区。虽然许多技术产生变异衣壳,只有一小部分衣壳突变,但这些技术可以与额外诱变策略配对以修饰完整的衣壳。

一旦产生一个aav文库或多个aav文库,病毒然后就被包装,使得每个aav颗粒由围绕对那个衣壳进行编码的cap基因的突变衣壳组成并纯化。然后使文库的变体经受aav领域的技术人员已知的并且容易获得的体外和/或体内选择性压力技术。参见例如maheshri,n.等人,《自然生物技术(naturebiotech.)》,24,198-204(2006);dalkara,d.等人,《科学转化医学(sci.transl.med.)》,5,189ra76(2013);lisowski,l.等人,《自然(nature.)》,506,382-286(2013);yang,l.等人,pnas106,3946-3951(2009);gao,g.等人,《分子疗法(mol.ther.)》13,77-87(2006);和bell,p.等人,《人类基因疗法(hum.gene.ther.)》22,985-997(2011)。例如但非限制性地,可以使用以下选择aav变体:i)亲和柱,其中不同级分的洗脱产生具有改变的结合特性的变体;ii)原代细胞-从模拟人体细胞行为的组织样品或永生细胞系中分离-产生具有提高的效率和/或组织特异性的aav变体;iii)动物模型-模拟临床基因疗法环境-产生已成功感染靶组织的aav变体;iv)人异种移植模型,其产生已感染移植的人细胞的aav变体;和/或其选择技术的组合。

一旦选择了病毒,就可以通过已知技术回收它们,例如但不限于腺病毒介导复制、pcr扩增、新一代测序和克隆等。然后通过重复轮次的选择技术富集病毒克隆,并分离aavdna以回收所选择的感兴趣的变体cap基因。这种选择的变体可以经受进一步的修饰或突变,并且因此作为进一步选择步骤的新起点以迭代地增加aav病毒适合度。然而,在某些情况下,已经生成了成功的衣壳而没有额外的突变。

本文公开的aav变体至少部分地通过使用体内定向进化方法产生,例如上述技术,所述方法涉及在玻璃体内施用后使用灵长类视网膜筛选。因此,本文公开的aav变体衣壳包括氨基酸序列中的一个或多个修饰,其赋予灵长类动物视网膜细胞比相应的亲代aav衣壳蛋白更有效的转导。如本文所用,“相应的亲代aav衣壳蛋白”是指与主题变体aav衣壳蛋白相同的野生型或变体aav血清型的aav衣壳蛋白,但不包括主题变体aav衣壳蛋白的一个或多个氨基酸序列修饰。

在一些实施例中,主题变体aav衣壳蛋白包括相对于相应的亲代aav衣壳蛋白通过共价连接插入aav衣壳蛋白gh环或环iv的约5个氨基酸到约20个氨基酸的异源肽。aav衣壳蛋白的“gh环”或环iv是指本领域中称为aav衣壳蛋白的gh环或环iv的溶剂可及部分。对于aav衣壳的gh环/环iv,参见例如vanvliet等人,(2006)《分子疗法(mol.ther.)》14:809;padron等人,(2005),《病毒学期刊(j.virol.)》79:5047;和shen等人,(2007)《分子疗法(mol.ther.)》15:1955。因此,例如,插入位点可以在aavvp1衣壳蛋白的氨基酸约411-650内。例如,插入位点可以在aav1vp1的氨基酸571-612、aav2vp1的氨基酸570-611、aav3avp1的氨基酸571-612内、在aav3bvp1的氨基酸571-612内、在aav4vp1的氨基酸569-610内、在aav5vp1的氨基酸560-601内、在aav6vp1的氨基酸571-612内、在aav7vp1的氨基酸572-613内、在aav8vp1的氨基酸573-614内、在aav9vp1的氨基酸571-612内、或aav10vp1的氨基酸573-614内、或其任何变体的相应氨基酸。基于各种aav血清型的衣壳蛋白的氨基酸序列的比较,本领域技术人员将知道“对应于aav2的氨基酸”的插入位点将在任何给定aav血清型的衣壳蛋白中。还参见图6以了解野生型aavseqidno:1-11的比对,其提供野生型(天然存在的)血清型aav1、aav2、aav3a、aav3b和aav4-10之间和跨其的氨基酸位置。

在某些实施例中,插入位点是位于任何野生型aav血清型或aav变体的vp1的氨基酸570-614之间的两个相邻氨基酸之间的单个插入位点,例如,插入位点在位于任何aav血清型或变体的vp1的氨基酸570-610、氨基酸580-600、氨基酸570-575、氨基酸575-580、氨基酸580-585、氨基酸585-590、氨基酸590-600、或氨基酸600-614的两个相邻氨基酸之间。例如,插入位点可以在氨基酸580与581之间、氨基酸581与582之间、氨基酸583与584之间、氨基酸584与585之间、氨基酸585与586之间、氨基酸586与587之间、氨基酸587与588之间、氨基酸588与589之间、或氨基酸589与590之间。插入位点可以在氨基酸575与576之间、氨基酸576与577之间、氨基酸577与578之间、氨基酸578与579之间、或氨基酸579与580之间。插入位点可以在氨基酸590与591之间、氨基酸591与592之间、氨基酸592与593之间、氨基酸593与594之间、氨基酸594与595之间、氨基酸595与596之间、氨基酸596与597之间、氨基酸597与598之间、氨基酸598与599之间、或氨基酸599与600之间。例如,插入位点可以在aav2的氨基酸587与588之间、aav1的氨基酸590与591之间、aav3a的氨基酸588与589之间、aav3b的氨基酸588与589之间、aav4的氨基酸584与585之间、aav5的氨基酸575与576之间、aav6的氨基酸590与591之间、aav7的氨基酸589与590之间、aav8的氨基酸590与591之间、aav9的氨基酸588与589之间、或aav10的氨基酸588与589之间。

在一些实施例中,本文公开的肽插入的长度为5个氨基酸、6个氨基酸、7个氨基酸、8个氨基酸、9个氨基酸、10个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸或20个氨基酸。在另一个实施例中,本文公开的肽插入在本文公开的肽插入中的任何一种的氨基末端(n末端)和/或羧基末端(c末端)包括1到4个间隔氨基酸。示例性间隔氨基酸包含但不限于亮氨酸(l)、丙氨酸(a)、甘氨酸(g)、丝氨酸(s)、苏氨酸(t)和脯氨酸(p)。在某些实施例中,肽插入包括在n末端处的2个间隔氨基酸和在c末端处的2个间隔氨基酸。在其它实施例中,肽插入包括在n末端处的2个间隔氨基酸和在c末端处的1个间隔氨基酸。

本文公开的肽插入先前未描述和/或插入aav衣壳中。不希望受理论束缚,任何公开的肽插入的存在可以起到降低变体衣壳对硫酸肝素的亲和力的作用,这可能降低与灵长类动物视网膜前面的细胞外基质的结合。此外,本文公开的肽插入基序可通过添加细胞表面受体结合结构域赋予灵长类动物视网膜细胞增强的转导。

在一些优选的实施例中,插入肽包括下式中任一个的氨基酸序列。

在一些方面,插入肽可以是式1a的长度为7到10个氨基酸的肽:

y1y2x1x2x3x4x5x6x7y3

其中y1到y3中的每一个(如果存在的话)独立地选自ala、leu、gly、ser、thr、pro

x1选自gln、asn、his、ile和ala

x2选自ala、gln、asp、ser、lys和pro

x3选自asp、ile、thr和asn

x4选自thr、ser、tyr、gln、glu和ala

x5选自thr、lys和asn

x6选自lys、asn和glu

x7选自asn、thr、ile、his、asp和ala

在某些实施例中,式1a的插入肽包括选自以下的氨基酸序列:qadttkn(seqidno:13)、isdqtkh(seqidno:14)、asdstka(seqidno:15)、nqdytkt(seqidno:16)、hditkni(seqidno:17)、hpdttkn(seqidno:18)、hqdttkn(seqidno:19)、nkttnkd(seqidno:20)、isneneh(seqidno:21)和qananen(seqidno:22)。

在其它方面,插入肽可以是式1b的长度为7到10个氨基酸的肽:

y1y2x1x2x3x4x5x6x7y3

其中y1到y3中的每一个(如果存在的话)独立地选自ala、leu、gly、ser、thr、pro

x1选自gln、asn、his和ile

x2选自ala、gln、asp和ser

x3选自asp和ile

x4选自thr、tyr和gln

x5选自thr和lys

x6选自lys和asn

x7选自asn、thr、ile和his

在某些实施例中,式1b的插入肽包括选自以下的氨基酸序列:qadttkn(seqidno:13)、isdqtkh(seqidno:14)、nqdytkt(seqidno:16)、hditkni(seqidno:17)和hqdttkn(seqidno:19)。

在其它方面,插入肽可以是式1c的长度为7到10个氨基酸的肽:

y1y2x1x2aspx3thrlysx4y3

其中y1到y3中的每一个(如果存在的话)独立地选自ala、leu、gly、ser、thr、pro

x1选自gln、asn、his和ile

x2选自ala、gln和ser

x3选自thr、tyr和gln

x4选自asn、thr和his

在某些实施例中,式1c的插入肽包括选自以下的氨基酸序列:qadttkn(seqidno:13)、isdqtkh(seqidno:14)、nqdytkt(seqidno:16)和hqdttkn(seqidno:19)。

在其它方面,插入肽可以是式1d的长度为7到10个氨基酸的肽:

y1y2x1x2aspx3thrthrx4y3

其中y1到y3中的每一个(如果存在的话)独立地选自ala、leu、gly、ser、thr、pro

x1选自gln和ile

x2选自ala和ser

x3选自thr和gln

x4选自asn和his

在某些实施例中,式1d的插入肽包括选自以下的氨基酸序列:qadttkn(seqidno:13)和isdqtkh(seqidno:14)。

在其它方面,插入肽可以是式1e的长度为7到11个氨基酸的肽:

y1y2x1x2asnx3asnglux4y3

其中y1到y3中的每一个(如果存在的话)独立地选自ala、leu、gly、ser、thr、pro

x1选自gln和ile

x2选自ala和ser

x3选自glu和ala

x4选自asn和his

在其它实施例中,式1e的插入肽包括选自以下的氨基酸序列:isneneh(seqidno:21)和qananen(seqidno:22)。

在又另一个实施例中,插入肽可以是式iia的长度为7到11个氨基酸的肽:

y1y2x1x2dx3tkx4y3。

其中y1到y3中的每一个(如果存在的话)独立地选自ala、leu、gly、ser、thr、pro

x1选自q、n、a、h和i;

x2选自q、a、p和s

x3选自t、y、s和q;并且

x4选自t、n、a和h。

在式x1x2dx3tkx4的氨基酸序列的肽插入的另一个实施例中,肽插入选自由以下组成的组:qadttkn(seqidno:13)、isdqtkh(seqidno:14)、asdstka,nqdytkt(seqidno:16)、hqdttkn(seqidno:19)和hpdttkn(seqidno:18)。

在一些这种实施例中,插入肽可以是式iib的长度为7到11个氨基酸的肽:

y1y2x1x2dx3tkx4y3

其中y1到y3中的每一个(如果存在的话)独立地选自ala、leu、gly、ser、thr、pro

x1选自n、a和h;

x2选自q、p和s;

x3选自t、y和s;并且

x4选自t、n和a。

在式x1x2dx3tkx4的氨基酸序列的肽插入的另一个实施例中,肽插入选自由以下组成的组:asdstka,nqdytkt(seqidno:16)、hqdttkn(seqidno:19)和hpdttkn(seqidno:18)。

在其它实施例中,插入肽包括选自以下的氨基酸序列:kdrapst(seqidno:26)、tnrtspd(seqidno:24)、pnsthgs(seqidno:25)和gkskvid(seqidno:23)。

在一些实施例中,插入肽包括选自以下的氨基酸序列:asdstka(seqidno:15)、qananen(seqidno:22)、qadttkn(seqidno:13)、isdqtkh(seqidno:14)、nqdytkt(seqidno:16)、hditkni(seqidno:17)、hpdttkn(seqidno:18)、hqdttkn(seqidno:19)、nkttnkd(seqidno:20)、isneneh(seqidno:21)、gkskvid(seqidno:23)、tnrtspd(seqidno:24)、pnsthgs(seqidno:25)和kdrapst(seqidno:26)。

在其它优选的实施例中,插入肽在选自以下的氨基酸序列的氨基和/或羧基末端具有1到3个间隔氨基酸(y1-y3):qadttkn(seqidno:13)、isdqtkh(seqidno:14)、asdstka(seqidno:15)、nqdytkt(seqidno:16)、hditkni(seqidno:17)、hpdttkn(seqidno:18)、hqdttkn(seqidno:19)、nkttnkd(seqidno:20)、isneneh(seqidno:21)、qananen(seqidno:22)、gkskvid(seqidno:23)、tnrtspd(seqidno:24)、pnsthgs(seqidno:25)和kdrapst(seqidno:26)。在某些这种实施例中,插入肽选自由以下组成的组:laqadttkna(seqidno:27)、laisdqtkha(seqidno:28)、lgisdqtkha(seqidno:29)、laasdstkaa(seqidno:30)、lanqdytkta(seqidno:31)、lahditknia(seqidno:32)、lahpdttkna(seqidno:33)、lahqdttkna(seqidno:34)、lankttnkda(seqidno:35)、lpisneneha(seqidno:36)、lpqananena(seqidno:37)、lagkskvida(seqidno:38)、latnrtspda(seqidno:39)、lapnsthgsa(seqidno:40)和lakdrapsta(seqidno:41)。

在一些实施例中,主题变体aav衣壳蛋白不包含除gh环或环iv中约5个氨基酸到约20个氨基酸的肽插入之外的任何其它氨基酸序列修饰。例如,在一些实施例中,主题变体aav衣壳蛋白包括肽插入,所述肽插入包括选自由以下组成的组的氨基酸序列:qadttkn(seqidno:13)、isdqtkh(seqidno:14)、asdstka(seqidno:15)、nqdytkt(seqidno:16)、hditkni(seqidno:17)、hpdttkn(seqidno:18)、hqdttkn(seqidno:19)、nkttnkd(seqidno:20)、isneneh(seqidno:21)、qananen(seqidno:22)、gkskvid(seqidno:23)、tnrtspd(seqidno:24)、pnsthgs(seqidno:25)、kdrapst(seqidno:26)、laqadttkna(seqidno:27)、laisdqtkha(seqidno:28)、lgisdqtkha(seqidno:29)、laasdstkaa(seqidno:30)、lanqdytkta(seqidno:31)、lahditknia(seqidno:32)、lahpdttkna(seqidno:33)、lahqdttkna(seqidno:34)、lankttnkda(seqidno:35)、lpisneneha(seqidno:36)、lpqananena(seqidno:37)、lagkskvida(seqidno:38)、latnrtspda(seqidno:39)、lapnsthgsa(seqidno:40)和lakdrapsta(seqidno:41),变体aav衣壳不包含任何其它氨基酸取代、插入或缺失(即,变体aav衣壳蛋白包括所述插入,并且在其它方面与相应的aav衣壳蛋白一致)。换句话说,包括所述插入的变体aav衣壳蛋白在其它方面与肽已插入的亲代aav衣壳蛋白一致。作为另一个实例,主题变体aav衣壳蛋白包括具有选自以下的氨基酸序列的肽插入:qadttkn(seqidno:13)、isdqtkh(seqidno:14)、asdstka(seqidno:15)、nqdytkt(seqidno:16)、hditkni(seqidno:17)、hpdttkn(seqidno:18)、hqdttkn(seqidno:19)、nkttnkd(seqidno:20)、isneneh(seqidno:21)、qananen(seqidno:22)、gkskvid(seqidno:23)、tnrtspd(seqidno:24)、pnsthgs(seqidno:25)、kdrapst(seqidno:26)、laqadttkna(seqidno:27)、laisdqtkha(seqidno:28)、lgisdqtkha(seqidno:29)、laasdstkaa(seqidno:30)、lanqdytkta(seqidno:31)、lahditknia(seqidno:32)、lahpdttkna(seqidno:33)、lahqdttkna(seqidno:34)、lankttnkda(seqidno:35)、lpisneneha(seqidno:36)、lpqananena(seqidno:37)、lagkskvida(seqidno:38)、latnrtspda(seqidno:39)、lapnsthgsa(seqidno:40)和lakdrapsta(seqidno:41),其中肽插入位于aav2衣壳的vp1的氨基酸587与588或另一种亲代aav的vp1的相应氨基酸之间,例如在aav1、aav3a、aav3b、aav6或aav9的vp1的氨基酸588与589之间、在aav4的vp1的氨基酸586与587之间、在aav5的vp1的氨基酸577与578之间、在aav7的vp1的氨基酸589与590之间、在aav8或aav10的vp1的氨基酸590到591之间等,其中变体aav衣壳蛋白序列在其它方面与相应的亲代aav衣壳蛋白序列一致,例如seqidno:1-12中的任何一个。

在其它实施例中,除了包括gh环中例如如本文公开的或如本领域已知的肽插入外,主题变体aav衣壳蛋白包括约1到约100个氨基酸取代或缺失,例如,与亲代aav衣壳蛋白相比1个到约5个、约2个到约4个、约2个到约5个、约5个到约10个、约10个到约15个、约15个到约20个、约20个到约25个、约25个到约50个、约50个到约100个氨基酸取代或缺失。因此,在一些实施例中,主题变体衣壳蛋白包括与相应的亲代aav衣壳具有85%或更高、90%或更高、95%或更高、或98%或更高例如或99%的序列一致性,例如如seqidno:1-12中所示的野生型衣壳蛋白。

在进一步的实施例中,所述一个或多个氨基酸取代位于如肽插入前编号的aav2vp1衣壳蛋白的一个或多个氨基酸残基1、15、34、57、66、81、101、109、144、164、176、188、196、226、236、240、250、312、363、368、449、456、463、472、484、524、535、551、593、698、708、719、721和/或735或另一种aav衣壳蛋白的相应的一个或多个氨基酸残基处。在一些这种实施例中,所述一个或多个氨基酸取代选自由以下组成的组:如肽插入前编号的aav2vp1衣壳蛋白的m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l和l735q或另一种aav衣壳蛋白的相应的一个或多个氨基酸残基。

在优选的实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:isdqtkh(seqidno:14),lgisdqtkha(seqidno:29)和laisdqtkha(seqidno:28),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。在一些实施例中,所述一个或多个氨基酸取代选自由以下组成的组:m1l+l15p+p535s、p34a、p34a+s721l、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、q164k+v708i、t176p、l188i、s196y、g226e、g236v、i240t、n312k、n312k+n449d+d472n+n551s+i698v+l735q、p363l、r484c+v708i、t456k和v708i。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。

在特别优选的实施例中,变体aav衣壳包括肽插入,所述肽插入包括氨基酸序列isdqtkh(seqidno:14)或包括、基本上由以下组成、或由以下组成:在aav2的vp1的氨基酸587与588之间或另一个aav衣壳的相应氨基酸之间的氨基酸序列laisdqtkha(seqidno:28)或lgisdqtkha(seqidno:29),并且进一步包括在相对于aav2衣壳的氨基酸序列(seqidno:2)的残基34或另一种aav衣壳的相应残基处的p34a氨基酸取代。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度或相应的亲代aav衣壳具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%、或更高的氨基酸序列一致性。在特别优选的实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkaaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlaisdqtkharqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:42)

在另一个特别优选的实施例中,变体aav衣壳包括肽插入,所述肽插入包括氨基酸序列isdqtkh(seqidno:14)或包括、基本上由以下组成、或由以下组成:在aav2衣壳蛋白的氨基酸587与588之间或另一个aav血清型的衣壳蛋白中的相应位置的氨基酸序列laisdqtkha(seqidno:28)或lgisdqtkha(seqidno:29),并且包括与aav2衣壳的氨基酸序列(seqidno:2)相比的n312k氨基酸取代或另一种aav亲代血清型的相应取代,并且任选地进一步包括与aav2衣壳的氨基酸序列或另一种aav亲代血清型的相应取代相比的n449d、d472n、n551s、i698v和/或l735q氨基酸取代。在另一个特别优选的实施例中,变体aav衣壳包括肽插入,所述肽插入包括氨基酸序列isdqtkh(seqidno:14)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间或另一个aav血清型的衣壳蛋白中的相应位置的氨基酸序列laisdqtkha(seqidno:28)或lgisdqtkha(seqidno:29),并且包括与aav2衣壳的氨基酸序列(seqidno:2)相比的n312k、n449d、d472n、n551s、i698v和l735q氨基酸取代或另一种aav亲代血清型中的相应残基的取代。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在特别优选的实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlkfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtdtpsgtttqsrlqfsqagasdirnqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektsvdiekvmitdeeeirttnpvateqygsvstnlqrgnlaisdqtkharqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpevqytsnynksvnvdftvdtngvyseprpigtryltrnq(seqidno:43)

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)位于aav1、aav3a、aav3b、aav6或aav9的vp1的氨基酸588与589之间、aav4的氨基酸586与587之间、aav5的氨基酸577与578之间、aav7的氨基酸589与590之间、或aav8或aav10的氨基酸590到591之间的肽插入,肽插入包括选自以下的氨基酸序列:isdqtkh(seqidno:14)、lgisdqtkha(seqidno:29)和laisdqtkha(seqidno:28),和b)aav3a或aav3b的氨基酸709处的缬氨酸到异亮氨酸取代、aav1或aav6的位置709处的丙氨酸到异亮氨酸取代、aav4的氨基酸707处或aav9的氨基酸709处的天冬酰胺到异亮氨酸取代、或aav7的氨基酸710处或aav8或aav10的氨基酸711处的苏氨酸到异亮氨酸取代、或aav5的氨基酸697处的谷氨酰胺到异亮氨酸取代,并且任选地在其它方面与seqidno:1和3-12中的任一个一致。在优选的实施例中,变体衣壳蛋白包括:a)肽插入,其包括氨基酸序列isdqtkh(seqidno:14)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列laisdqtkha(seqidno:28)或lgisdqtkha(seqidno:29)和b)与aav2的氨基酸序列相比在氨基酸708处的缬氨酸到异亮氨酸氨基酸取代,其中变体衣壳蛋白包括2个到5个、5个到10个、或10个到15个氨基酸取代。

在又另一个实施例中,变体衣壳蛋白包括:a)肽插入,其包括氨基酸序列isdqtkh(seqidno:14)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列laisdqtkha(seqidno:28)或lgisdqtkha(seqidno:29)和b)与aav2的氨基酸序列相比氨基酸708处的缬氨酸到异亮氨酸氨基酸取代,并且在其它方面与氨基酸序列seqidno:2一致。

在又另一个实施例中,变体衣壳蛋白包括:a)肽插入,其包括氨基酸序列isdqtkh(seqidno:14)或包括、基本上由以下组成、或由以下组成:aav2衣壳的氨基酸587与588之间的氨基酸序列laisdqtkha(seqidno:28)或lgisdqtkha(seqidno:29),并且在其它方面与氨基酸序列seqidno:2一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlgisdqtkharqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:44)

在优选的实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:qadttkn(seqidno:13)和laqadttkna(seqidno:27),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v719m、s721l、l735q和其组合,优选地选自s109t、p250s、a524t、a593e、i698v、v708i和/或v719m.肽插入位点优选地位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。在特别优选的实施例中,变体aav衣壳包括肽插入,所述肽插入包括氨基酸序列qadttkn(seqidno:13)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置的氨基酸序列laqadttkna(seqidno:27),并且包括与aav2的氨基酸序列相比的i698v氨基酸取代或另一种aav亲代血清型中的相应取代,其中取代的一种或多种氨基酸不会自然地出现在相应的位置。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在一些实施例中,相应的氨基酸取代是与aav3a、aav3b或aav9衣壳的氨基酸序列相比的i699v氨基酸取代、与aav5衣壳的氨基酸序列相比的i687v取代、与aav7的氨基酸序列相比的i700v取代、与aav8或aav10的氨基酸序列相比的i701v取代。在特别优选的实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlaqadttknarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpevqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:45)

在其它优选的实施例中,变体aav衣壳包括肽插入,所述肽插入包括氨基酸序列qadttkn(seqidno:13)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置的氨基酸序列laqadttkna(seqidno:27),并且包括v719m氨基酸取代以及任选地与aav2的氨基酸序列相比的v708i取代或另一种aav亲代血清型中的相应取代,其中取代的一种或多种氨基酸不会自然地出现在相应的位置。

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)位于aav1、aav3a、aav3b、aav6或aav9的vp1的氨基酸588与589之间、aav4的氨基酸586与587之间、aav5的氨基酸577与578之间、aav7的氨基酸589与590之间、或aav8或aav10的氨基酸590到591之间的肽插入,肽插入包括选自以下的氨基酸序列:qadttkn(seqidno:13)和laqadttkna(seqidno:27),和b)aav3a或aav3b的氨基酸709处的缬氨酸到异亮氨酸取代、aav1或aav6的位置709处的丙氨酸到异亮氨酸取代、aav4的氨基酸707处或aav9的氨基酸709处的天冬酰胺到异亮氨酸取代、或aav7的氨基酸710处或aav8或aav10的氨基酸711处的苏氨酸到异亮氨酸取代、或aav5的氨基酸697处的谷氨酰胺到异亮氨酸取代。在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)位于aav1、aav3a、aav3b、aav6或aav9的vp1的氨基酸588与589之间、aav4的氨基酸586与587之间、aav5的氨基酸577与578之间、aav7的氨基酸589与590之间、或aav8或aav10的氨基酸590到591之间的肽插入,肽插入包括选自以下的氨基酸序列:qadttkn(seqidno:13)和laqadttkna(seqidno:27),和b)与aav1、aav3a、aav3b、aav4、aav7、aav8、aav9或aav10的氨基酸序列相比位置109处或与aav5或aav6的氨基酸序列相比位置108处的丝氨酸到苏氨酸氨基酸取代。在优选的实施例中,变体aav衣壳包括肽插入,其包括氨基酸序列qadttkn(seqidno:13)或包括、基本上由以下组成、或由以下组成:aav2衣壳的氨基酸587与588之间的氨基酸序列laqadttkna(seqidno:27),并且包括与aav2氨基酸序列相比氨基酸109处的丝氨酸到苏氨酸取代(s109t)或氨基酸708处的缬氨酸到异亮氨酸氨基酸取代(v708i),其中变体衣壳蛋白包括1个到5个、5个到10个、或10个到15个氨基酸取代,并且与seqidno:2所示的氨基酸序列的整个长度优选地具有至少约85%、至少约90%、至少约95%、至少约98%或更高的氨基酸序列一致性。在其它优选的实施例中,变体aav衣壳包括肽插入,所述肽插入包括氨基酸序列qadttkn(seqidno:13)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置的氨基酸序列laqadttkna(seqidno:27),并且包括与aav2的氨基酸序列相比氨基酸109处的丝氨酸到苏氨酸取代和氨基酸708处的缬氨酸到异亮氨酸氨基酸取代。

在又另一个实施例中,变体衣壳蛋白包括:a)肽插入,其包括氨基酸序列qadttkn(seqidno:13)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列laqadttkna(seqidno:27)和b)至少一个氨基酸取代,其中变体衣壳的氨基酸序列不包括与aav2的氨基酸序列相比氨基酸708处的缬氨酸到异亮氨酸氨基酸取代,并且不包括与aav2的氨基酸序列相比氨基酸109处的丝氨酸到苏氨酸取代。

在又另一个实施例中,变体衣壳蛋白包括:a)肽插入,其包括氨基酸序列qadttkn(seqidno:13)或包括、基本上由以下组成、或由以下组成:aav2衣壳的氨基酸587与588之间的氨基酸序列laqadttkna(seqidno:27),并且在其它方面与氨基酸序列seqidno:2一致。

在另一个优选的实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:hditkni(seqidno:17)、iahditknia(seqidno:60)和lahditknia(seqidno:32),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、r389s、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。在一些实施例中,aav衣壳蛋白包括选自s109t、r389s、a593e和/或v708i的一个或多个氨基酸取代。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。在一个优选的实施例中,变体aav衣壳包括肽插入,所述肽插入包括氨基酸序列hditkni(seqidno:17)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列iahditknia(seqidno:60)或lahditknia(seqidno:32),并且包括与aav2衣壳的氨基酸序列相比的s109t氨基酸取代或另一种aav亲代血清型中的相应取代。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。

在又另一个实施例中,变体衣壳包括:a)肽插入,其包括氨基酸序列hditkni(seqidno:17)或包括、基本上由以下组成、或由以下组成:aav2衣壳的氨基酸587与588之间的氨基酸序列iahditknia(seqidno:60)或lahditknia(seqidno:32),并且在其它方面与seqidno:2中所述的氨基酸序列一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlahditkniarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:46)

在其它实施例中,变体衣壳包括:a)肽插入,其包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lahditknia,和b)至少一个氨基酸取代,其中变体衣壳的氨基酸序列不包括与aav2的氨基酸序列相比氨基酸708处的缬氨酸到异亮氨酸氨基酸取代。在又其它实施例中,变体衣壳包括:a)肽插入,其包括氨基酸序列ditknia(seqidno:61)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列iahditknia(seqidno:60)或lahditknia(seqidno:32),和b)与aav2的氨基酸序列相比的v708i取代。在其它实施例中,变体衣壳包括:a)肽插入,其包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lahditknia(seqidno:32),和b)两个或更多个氨基酸取代,其中变体衣壳的氨基酸序列包括与aav2的氨基酸序列相比氨基酸708处的缬氨酸到异亮氨酸氨基酸取代。

在另一个优选的实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:nqdytkt(seqidno:16)和lanqdytkta(seqidno:31),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。在一些实施例中,aav衣壳蛋白包括选自s109t、s109t+s463y、d368h和v708i的一个或多个氨基酸取代。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。在一个优选的实施例中,变体aav衣壳包括肽插入,所述肽插入包括氨基酸序列nqdytkt(seqidno:16)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lanqdytkta(seqidno:31),并且包括与aav2衣壳的氨基酸序列相比的v708i氨基酸取代或另一种aav亲代血清型中的相应取代。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在又另一个实施例中,变体衣壳包括:a)肽插入,其包括氨基酸序列nqdytkt(seqidno:16)或包括、基本上由以下组成、或由以下组成:aav2衣壳的氨基酸587与588之间的氨基酸序列lanqdytkta(seqidno:31),并且在其它方面与seqidno:2中所述的氨基酸序列一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlanqdytktarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:47)

在其它实施例中,变体衣壳包括:a)肽插入,其包括氨基酸序列nqdytkt(seqidno:16)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lanqdytkta(seqidno:31)和b)与seqidno:2的序列相比的s109t氨基酸取代以及和任选地s463y氨基酸取代,其中变体衣壳与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%一致性。在相关实施例中,变体衣壳包括:a)肽插入,其包括氨基酸序列nqdytkt(seqidno:16)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lanqdytkta(seqidno:31)和b)与氨基酸序列seqidno:2相比的s109t氨基酸取代,并且在其它方面与氨基酸序列seqidno:2一致。

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)位于aav1、aav3a、aav3b、aav6或aav9的vp1的氨基酸588与589之间、aav4的氨基酸586与587之间、aav5的氨基酸577与578之间、aav7的氨基酸589与590之间、或aav8或aav10的氨基酸590到591之间的肽插入,肽插入包括选自以下的氨基酸序列:nqdytkt(seqidno:16)和lanqdytkta(seqidno:31)和b)与aav1或aav6的氨基酸序列相比位置313处或与aav9的氨基酸序列相比位置314处的天冬酰胺到赖氨酸氨基酸取代、或aav3a或aav3b的位置312处或aav8或aav10的位置315处的丝氨酸到赖氨酸取代、或aav4或aav5的位置303处或aav7的位置314处的精氨酸到赖氨酸取代。在另一个实施例中,变体衣壳包括:a)肽插入,其包括氨基酸序列nqdytkt(seqidno:16)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lanqdytkta(seqidno:31)和b)n312k氨基酸取代,其中变体衣壳蛋白包括1个到5个、5个到10个、或10个到15个氨基酸取代。

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:pnsthgs(seqidno:25)和lapnsthgsa(seqidno:40),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。在一个优选的实施例中,变体aav衣壳包括肽插入,所述肽插入包括氨基酸序列pnsthgs(seqidno:25)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lapnsthgsa(seqidno:40),并且包括与aav2衣壳的氨基酸序列相比的v708i氨基酸取代或另一种aav亲代血清型中的相应取代。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在又另一个实施例中,变体衣壳包括:a)肽插入,其包括氨基酸序列pnsthgs(seqidno:25)或包括、基本上由以下组成、或由以下组成:aav2衣壳的氨基酸587与588之间的氨基酸序列lapnsthgsa(seqidno:40),并且在其它方面与seqidno:2中所述的氨基酸序列一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlapnsthgsarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:48)

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:nkttnkda(seqidno:62)和lankttnkda(seqidno:35),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。在一个优选的实施例中,变体aav衣壳包括肽插入,所述肽插入包括氨基酸序列nkttnkda(seqidno:62)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lankttnkda(seqidno:35),并且包括与aav2衣壳的氨基酸序列相比的n449d氨基酸取代或另一种aav亲代血清型中的相应取代。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在又另一个实施例中,变体衣壳包括:a)肽插入,其包括氨基酸序列nkttnkda(seqidno:62)或包括、基本上由以下组成、或由以下组成:aav2衣壳的氨基酸587与588之间的氨基酸序列lankttnkda(seqidno:35),并且在其它方面与seqidno:2中所述的氨基酸序列一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlankttnkdarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:49)

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:tnrtspd(seqidno:24)和latnrtspda(seqidno:39),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v719m、s721l、l735q和其组合。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。在相关实施例中,提供了一种变体aav衣壳蛋白,其包括a)位于aav1、aav3a、aav3b、aav6或aav9的vp1的氨基酸588与589之间、aav4的氨基酸586与587之间、aav5的氨基酸577与578之间、aav7的氨基酸589与590之间、或aav8或aav10的氨基酸590到591之间的肽插入,肽插入包括选自以下的氨基酸序列:tnrtspd(seqidno:24)和latnrtspda(seqidno:39),和b)aav3a或aav3b的氨基酸709处的缬氨酸到异亮氨酸取代、aav1或aav6的位置709处的丙氨酸到异亮氨酸取代、aav4的氨基酸707处或aav9的氨基酸709处的天冬酰胺到异亮氨酸取代、或aav7的氨基酸710处或aav8或aav10的氨基酸711处的苏氨酸到异亮氨酸取代、或aav5的氨基酸697处的谷氨酰胺到异亮氨酸取代。在其它实施例中,变体衣壳蛋白包括:a)肽插入,其包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列latnrtspda(seqidno:39)和b)与aav2的氨基酸序列相比在氨基酸708处的缬氨酸到异亮氨酸氨基酸取代,其中变体衣壳蛋白包括1个到5个、5个到10个、或10个到15个氨基酸取代。在又另一个实施例中,变体衣壳蛋白包括:a)肽插入,其包括在aav2衣壳的氨基酸587与588之间的氨基酸序列tnrtspd(seqidno:24)和b)与aav2的氨基酸序列相比在氨基酸708处的缬氨酸到异亮氨酸氨基酸取代。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。

在又另一个实施例中,变体衣壳蛋白包括:a)肽插入,其包括氨基酸序列tnrtspd(seqidno:24)或包括、基本上由以下组成、或由以下组成:aav2衣壳的氨基酸587与588之间的氨基酸序列latnrtspda(seqidno:39),并且在其它方面与氨基酸序列seqidno:2一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlatnrtspdarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:50)

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:gkskvid(seqidno:23)和lagkskvida(seqidno:38),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在一些实施例中,变体aav衣壳包括位于aav2衣壳的氨基酸587与588之间的肽插入,所述肽插入包括氨基酸序列gkskvid(seqidno:23)或包括、基本上由以下组成、或由以下组成:氨基酸序列lagkskvida(seqidno:38),并且在其它方面与氨基酸序列seqidno:2一致。在其它实施例中,变体aav衣壳包括:a)肽插入,其包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lagkskvida(seqidno:38),并且包括至少一个氨基酸取代。

在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlagkskvidarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:51)

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:asdstka(seqidno:15)和laasdstkaa(seqidno:30),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在又另一个实施例中,变体衣壳包括肽插入,其包括氨基酸序列asdstka(seqidno:15)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列laasdstkaa(seqidno:30),并且在其它方面与seqidno:2中所述的氨基酸序列一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlaasdstkaarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:52)

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:kdrapst(seqidno:26)和lakdraptsa(seqidno:41),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在又另一个实施例中,变体衣壳包括肽插入,其包括氨基酸序列kdrapst(seqidno:26)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lakdraptsa(seqidno:41),并且在其它方面与seqidno:2中所述的氨基酸序列一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlakdrapstarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:53)

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:hqdttkn(seqidno:19)和lahqdttkna(seqidno:34),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置中的一个或多个位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在又另一个实施例中,变体衣壳包括肽插入,其包括氨基酸序列hqdttkn(seqidno:19)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lahqdttkna(seqidno:34),并且在其它方面与seqidno:2中所述的氨基酸序列一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlahqdttknarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:54)

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:isneneh(seqidno:21)和lpisneneha(seqidno:36),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置中的一个或多个位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在又另一个实施例中,变体衣壳包括肽插入,其包括氨基酸序列isneneh(seqidno:21)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lpisneneha(seqidno:36),并且在其它方面与seqidno:2中所述的氨基酸序列一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlpisneneharqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:55)

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:qananen(seqidno:22)和lpqananena(seqidno:37),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在又另一个实施例中,变体衣壳包括肽插入,其包括氨基酸序列qananen(seqidno:22)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lpqananena(seqidno:37),并且在其它方面与seqidno:2中所述的氨基酸序列一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlpqananenarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:56)

在另一个实施例中,提供了一种变体aav衣壳蛋白,其包括a)在衣壳蛋白的gh-环中的插入肽,其中肽插入包括选自以下的肽插入:hpdttkn(seqidno:18)和lahpdttkna(seqidno:33),和b)与aav2的氨基酸序列(seqidno:2)相比以下氨基酸取代中的一个或多个或另一个aav亲代血清型(即除了aav2之外)的相应取代,其中取代的一个或多个氨基酸不天然存在于相应的位置:m1l、l15p、p34a、n57d、n66k、r81q、q101r、s109t、r144k、r144m、q164k、t176p、l188i、s196y、g226e、g236v、i240t、p250s、n312k、p363l、d368h、n449d、t456k、s463y、d472n、r484c、a524t、p535s、n551s、a593e、i698v、v708i、v719m、s721l、l735q和其组合。优选地,肽插入位点位于aav2衣壳的氨基酸587与588之间或另一种aav血清型的衣壳蛋白中的相应位置。变体aav衣壳可以与seqidno:2所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或更高的氨基酸序列一致性。在又另一个实施例中,变体衣壳包括肽插入,其包括氨基酸序列hpdttkn(seqidno:18)或包括、基本上由以下组成、或由以下组成:在aav2衣壳的氨基酸587与588之间的氨基酸序列lahpdttkna(seqidno:33),并且在其它方面与seqidno:2中所述的氨基酸序列一致。在一些实施例中,变体aav衣壳具有氨基酸序列,所述氨基酸序列与以下氨基酸序列具有至少约85%、至少约90%、至少约95%、至少约98%序列一致性或与以下氨基酸序列100%一致:

maadgylpdwledtlsegirqwwklkpgppppkpaerhkddsrglvlpgykylgpfngldkgepvneadaaalehdkaydrqldsgdnpylkynhadaefqerlkedtsfggnlgravfqakkrvleplglveepvktapgkkrpvehspvepdsssgtgkagqqparkrlnfgqtgdadsvpdpqplgqppaapsglgtntmatgsgapmadnnegadgvgnssgnwhcdstwmgdrvittstrtwalptynnhlykqissqsgasndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevtqndgtttiannltstvqvftdseyqlpyvlgsahqgclppfpadvfmvpqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylsrtntpsgtttqsrlqfsqagasdirdqsrnwlpgpcyrqqrvsktsadnnnseyswtgatkyhlngrdslvnpgpamashkddeekffpqsgvlifgkqgsektnvdiekvmitdeeeirttnpvateqygsvstnlqrgnlahpdttknarqaatadvntqgvlpgmvwqdrdvylqgpiwakiphtdghfhpsplmggfglkhpppqilikntpvpanpsttfsaakfasfitqystgqvsveiewelqkenskrwnpeiqytsnynksvnvdftvdtngvyseprpigtryltrnl(seqidno:57)。

在若干方面,提供了一种变体aav衣壳蛋白,其包括相对于相应的亲代aav衣壳蛋白的一个或多个氨基酸取代,其中当存在于aav病毒粒子中时,所述变体衣壳蛋白赋予视网膜蛋白与通过包括相应亲代aav衣壳蛋白的aav病毒粒子对视网膜细胞的感染相比增加的感染性。

在一些实施例中,变体aav衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比的p34a氨基酸取代或与aav5衣壳的氨基酸序列(seqidno:6)相比的p33a氨基酸取代。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:2或seqidno:6中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且包括分别与aav2或aav5衣壳的氨基酸序列相比p34a或p33a氨基酸取代。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列包括与seqidno2中所示的氨基酸序列相比的p34a氨基酸取代,并且在其它方面与seqidno:2中所示的氨基酸序列一致。在相关实施例中,变体衣壳蛋白包括与氨基酸序列seqidno:2相比的p34a氨基酸取代,其中变体衣壳蛋白包括与seqidno:2中所示的aav2衣壳蛋白的氨基酸序列相比的1个到5个、5个到10个、或10个到15个氨基酸取代。

在其它实施例中,变体aav衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比基酸164处或在另一种aav亲代血清型(即除了aav2之外)中的相应位置的氨基酸取代,其中取代的氨基酸不会自然地出现在相应的位置。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且包括与aav2衣壳的氨基酸序列(seqidno:2)相比氨基酸164处的氨基酸取代。在一些实施例中,raav病毒粒子包括与aav1、aav2或aav6的氨基酸序列相比氨基酸164处或与aav7、aav8或aav10的氨基酸序列相比氨基酸165处的谷氨酰胺到赖氨酸氨基酸取代;或包括在aav5的氨基酸160处的丝氨酸到赖氨酸取代或在aav9的氨基酸164处的丙氨酸到赖氨酸取代。在相关实施例中,变体衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比的氨基酸164(例如,q164k)处的氨基酸取代,其中变体衣壳蛋白包括与seqidno:2中所示的aav2衣壳蛋白的氨基酸序列相比的1个到5个、5个到10个、或10个到15个氨基酸取代。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列包括与seqidno:2中所示的氨基酸序列相比的q164k氨基酸取代,并且在其它方面与seqidno:2中所示的氨基酸序列一致。在其它实施例中,变体衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比的q164k和v708i氨基酸取代或另一种aav亲代血清型(即除aav2之外)的相应取代,并且与seqidno:2中所示的氨基酸序列的整个长度具有至少约为的85%、至少约90%、至少约95%、至少约98%、或至少约99%或更高的氨基酸序列一致性。

在其它实施例中,变体aav衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比基酸698处或在另一种aav亲代血清型(即除了aav2之外)中的相应位置的氨基酸取代,其中取代的氨基酸不会自然地出现在相应的位置。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且包括与aav2衣壳的氨基酸序列(seqidno:2)相比氨基酸698处的氨基酸取代。在一些实施例中,raav病毒粒子包括与aav2的氨基酸序列相比氨基酸698处、或与aav3a、aav3b或aav9的氨基酸序列相比氨基酸699处、或aav5的氨基酸687处、或aav7的氨基酸700处、或aav8或aav10的氨基酸701处的异亮氨酸到缬氨酸氨基酸取代。在相关实施例中,变体衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比的氨基酸699(例如,i698v)处的氨基酸取代,其中变体衣壳蛋白包括与seqidno:2中所示的aav2衣壳蛋白的氨基酸序列相比的1个到5个、5个到10个、或10个到15个氨基酸取代。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列包括与seqidno:2中所示的氨基酸序列相比的i698v氨基酸取代,并且在其它方面与seqidno:2中所示的氨基酸序列一致。

在其它实施例中,变体aav衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比基酸109处或在另一种aav亲代血清型(即除了aav2之外)中的相应位置的氨基酸取代。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且包括与aav2衣壳的氨基酸序列(seqidno:2)相比氨基酸109处的氨基酸取代。在一些实施例中,变体衣壳蛋白包括与aav1、aav3a、aav3b、aav4、aav7、aav8、aav9或aav10的氨基酸序列相比位置109处或与aav5或aav6的氨基酸序列相比位置108处的丝氨酸到苏氨酸氨基酸取代。在相关实施例中,变体衣壳蛋白包括与氨基酸序列aav2相比的s109t氨基酸取代,其中变体衣壳蛋白包括1个到5个、5个到10个、或10个到15个氨基酸取代。在其它相关实施例中,变体衣壳蛋白包括与aav2的氨基酸序列相比的s109t氨基酸取代和a593e氨基酸取代。在一些实施例中,变体衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比的s109t和a493v以及任选地a593e和/或v708i氨基酸取代或另一种aav亲代血清型(即除aav2之外)的相应取代,并且与seqidno:2中所示的氨基酸序列的整个长度具有至少约为的85%、至少约90%、至少约95%、至少约98%、或至少约99%或更高的氨基酸序列一致性。在一些优选的实施例中,变体衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比的s109t、a493v、a593e和v708i氨基酸取代或另一种aav亲代血清型(即除aav2之外)的相应取代,并且与seqidno:2中所示的氨基酸序列的整个长度具有至少约为的85%、至少约90%、至少约95%、至少约98%、或至少约99%或更高的氨基酸序列一致性。在其它优选的实施例中,变体衣壳蛋白包括与aav2的氨基酸序列相比的s109t和v708i氨基酸取代,并且与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且在其它方面与氨基酸序列seqidno:2一致。

在其它实施例中,变体aav衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比基酸593处或在另一种aav亲代血清型(即除了aav2之外)中的相应位置的氨基酸取代。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且包括与aav2衣壳的氨基酸序列(seqidno:2)相比氨基酸593处的氨基酸取代。在一些实施例中,变体衣壳蛋白包括与aav1、aav3a、aav6或aav9的氨基酸序列相比氨基酸594处、aav5的氨基酸583处或aav8或aav10的氨基酸596处的甘氨酸到谷氨酸氨基酸取代、或aav3b的氨基酸594处的精氨酸到谷氨酸氨基酸取代、或aav4的氨基酸592处的天冬氨酸到谷氨酸氨基酸取代或aav7的位置595处的谷氨酰胺到谷氨酸氨基酸取代。在其它实施例中,变体衣壳蛋白包括与aav2的氨基酸序列相比的a593e氨基酸取代,并且不包括与aav2的氨基酸序列相比的以下氨基酸取代中的一个或多个:i19v、v369a、k26r、n215d、g355s、v46a和s196p。在相关实施例中,变体衣壳蛋白包括与aav2的氨基酸序列相比的a593e和n596d氨基酸取代,并且与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%的一致性。在其它实施例中,变体衣壳包括与aav2的氨基酸序列相比的a593e和n596d氨基酸取代,并且在其它方面与aav2的氨基酸序列一致。在其它实施例中,变体衣壳蛋白包括与aav2的氨基酸序列相比的a593e和v708i氨基酸取代,并且与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%的一致性。在其它实施例中,变体衣壳包括与aav2的氨基酸序列相比的a593e和v708i氨基酸取代,并且在其它方面与aav2的氨基酸序列一致。

在其它实施例中,变体aav衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比基酸708处或在另一种aav亲代血清型(即除了aav2之外)中的相应位置的氨基酸取代,其中取代的氨基酸不会自然地出现在相应的位置。优选地,raav病毒粒子不包括与aav2相比的氨基酸250处或另一种aav亲代血清型中的相应氨基酸的脯氨酸到丝氨酸取代。在一些实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且包括与aav2衣壳的氨基酸序列(seqidno:2)相比氨基酸708处的氨基酸取代。在优选的实施例中,变体衣壳蛋白包括与aav2衣壳的氨基酸序列相比的氨基酸708处的缬氨酸到异亮氨酸(v708i)取代,并且与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且在其它方面与氨基酸序列seqidno:2一致,其中变体衣壳蛋白不包括p250s氨基酸取代。在一些实施例中,变体衣壳蛋白包括aav3a或aav3b的氨基酸709处的缬氨酸到异亮氨酸取代、aav1或aav6的位置709处的丙氨酸到异亮氨酸取代、aav4的氨基酸707处或aav9的氨基酸709处的天冬酰胺到异亮氨酸取代、或aav7的氨基酸710处或aav8或aav10的氨基酸711处的苏氨酸到异亮氨酸取代、或aav5的氨基酸697处的谷氨酰胺到异亮氨酸取代。在相关实施例中,变体衣壳蛋白包括与aav2的氨基酸序列相比的v708i氨基酸取代,其中变体衣壳蛋白包括2个到5个、5个到10个、或10个到15个氨基酸取代,并且其中变体衣壳蛋白不包括p250s氨基酸取代。在其它实施例中,变体衣壳蛋白包括v708i氨基酸取代,并且还包括与aav2的氨基酸序列相比的a593e和/或s109t氨基酸取代。在其它相关实施例中,变体衣壳包括与aav2的氨基酸序列相比的v708i和a593e氨基酸取代,其中变体衣壳蛋白在其它方面与aav2的氨基酸序列一致。在其它相关实施例中,变体衣壳包括与aav2的氨基酸序列相比的v708i和s109t氨基酸取代,其中变体衣壳蛋白在其它方面与aav2的氨基酸序列一致。在其它实施例中,变体衣壳蛋白包括与aav2的氨基酸序列相比的v708i和v719m氨基酸取代,并且与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且在其它方面与氨基酸序列seqidno:2一致。在其它实施例中,变体衣壳蛋白包括与aav2的氨基酸序列相比的v708i和r733c氨基酸取代,并且与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且在其它方面与氨基酸序列seqidno:2一致。在其它实施例中,变体衣壳蛋白包括与aav2的氨基酸序列相比的v708i和g727d氨基酸取代,并且与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且在其它方面与氨基酸序列seqidno:2一致。

在其它实施例中,变体aav衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比基酸196处或在另一种aav亲代血清型(即除了aav2之外)中的相应位置的氨基酸取代,其中取代的氨基酸不会自然地出现在相应的位置并且任选地除了脯氨酸之外。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且包括与aav2衣壳的氨基酸序列(seqidno:2)相比氨基酸196处的氨基酸取代并且任选地除了s196p取代之外。在优选的实施例中,变体衣壳蛋白包括aav2或aav9的氨基酸196处或aav7、aav8或aav10的氨基酸197处或aav5的氨基酸186处的丝氨酸到酪氨酸氨基酸取代;或aav1或aav6的氨基酸196处的丙氨酸到酪氨酸取代;或aav4的氨基酸191处的甲硫氨酸到酪氨酸取代;或aav3a或aav3b的氨基酸196处的苏氨酸到酪氨酸取代。在相关实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列包括与seqidno:2中所示的氨基酸序列相比的s196y氨基酸取代,并且在其它方面与seqidno:2中所示的氨基酸序列一致。在相关实施例中,变体衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比的氨基酸196处的除了s196p取代(例如,包括s196y取代)之外的氨基酸取代,其中变体衣壳蛋白包括与seqidno:2中所示的aav2衣壳蛋白的氨基酸序列相比的1个到5个、5个到10个、或10个到15个氨基酸取代。

在其它实施例中,变体aav衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比基酸175处或在另一种aav亲代血清型(即除了aav2之外)中的相应位置的氨基酸取代,其中取代的氨基酸不会自然地出现在相应的位置。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且包括与aav2衣壳的氨基酸序列(seqidno:2)相比氨基酸175处的氨基酸取代。在一些实施例中,变体衣壳包括与seqidno:2中所示的aav2的氨基酸序列相比的q175h氨基酸取代或在另一种aav亲代血清型中的相应位置处的谷氨酰胺到组氨酸取代。在相关实施例中,变体衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比的氨基酸175(例如,q175h)处的氨基酸取代,其中变体衣壳蛋白包括与seqidno:2中所示的aav2衣壳蛋白的氨基酸序列相比的1个到5个、5个到10个、或10个到15个氨基酸取代。

在其它实施例中,变体aav衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比基酸64处或在另一种aav亲代血清型(即除了aav2之外)中的相应位置的氨基酸取代,其中取代的氨基酸不会自然地出现在相应的位置。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:2中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性,并且包括与aav2衣壳的氨基酸序列(seqidno:2)相比氨基酸64处的氨基酸取代。在一些实施例中,raav病毒粒子包括与seqidno:2中所示的aav2的氨基酸序列相比的ap64s氨基酸取代或另一种aav亲代血清型中的相应位置处的脯氨酸到丝氨酸取代。在相关实施例中,变体衣壳蛋白包括与aav2衣壳的氨基酸序列(seqidno:2)相比的氨基酸64(例如,p64s)处的氨基酸取代,其中变体衣壳蛋白包括与seqidno:2中所示的aav2衣壳蛋白的氨基酸序列相比的1个到5个、5个到10个、或10个到15个氨基酸取代。

在其它实施例中,变体aav衣壳蛋白包括与选自由以下组成的组的野生型aav衣壳序列至少85%、至少90%、至少95%或至少98%一致的氨基酸序列:seqidnos:1、2、3、4、5、6、7、8、10、11和12,并且还包括i)一个或多个选自由以下组成的组的氨基酸取代:p34a、s109t+v708i、a593e+n596d、v708i+v719m、v708i+g727d、s109t+a493v+a593e+v708i、v708i+r733c、q164k和i698v和/或(ii)选自由以下组成的组的肽插入:qadttkn(seqidno:13)、isdqtkh(seqidno:14)、asdstka(seqidno:15)、nqdytkt(seqidno:16)、hditkni(seqidno:17)、pqananen(seqidno:63)、tnrtspd(seqidno:24)、pnsthgs(seqidno:25)、kdrapst(seqidno:26)、hqdttkn(seqidno:19)、hpdttkn(seqidno:18)、nkttnkd(seqidno:20)、gkskvid(seqidno:23)、pisneneh(seqidno:64)、laqadttkna(seqidno:27)、laisdqtkha(seqidno:28)、lgisdqtkha(seqidno:29)、laasdstkaa(seqidno:30)、lahditknia(seqidno:32)、lpqananena(seqidno:37)、lanqdytkta(seqidno:31)、latnrtspda(seqidno:39)、lapnsthgsa(seqidno:40)、lakdrapsta(seqidno:41)、lahqdttkna(seqidno:34)、lahpdttkna(seqidno:33)、lankttnkda(seqidno:35)、lagkskvida(seqidno:38)和lpisneneha(seqidno:36)。在一些实施例中,变体aav衣壳包括指定的一个或多个氨基酸取代和/或肽插入,并且在其它方面与选自由以下组成的组的序列一致:seqidno:1-12。

在一些实施例中,变体aav衣壳蛋白是祖先衣壳蛋白。祖先衣壳蛋白是指今天在自然界中发现的衣壳蛋白的进化祖先,例如aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aav9、aavrh10、aav11、aav12、aav13,其是通过在今天自然界中发现的aav衣壳蛋白之间的简并性位置处的随机氨基酸取代来计算机模拟产生的。下面提供了祖先衣壳的一个非限制性实例,其中简并性的位置(残基264、266、268、448、459、460、467、470、471、474、495、516、533、547、551、555、557、561、563、577、583、593、596、661、662、664、665、710、717、718、719、723)被标记为“x”:

maadgylpdwlednlsegirewwdlkpgapkpkanqqkqddgrglvlpgykylgpfngldkgepvnaadaaalehdkaydqqlkagdnpylrynhadaefqerlqedtsfggnlgravfqakkrvleplglveegaktapgkkrpvepspqrspdsstgigkkgqqpakkrlnfgqtgdsesvpdpqplgeppagpsglgsgtmaagggapmadnnegadgvgnasgnwhcdstwlgdrvittstrtwalptynnhlykqissxsxgxtndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevttndgvttiannltstvqvfsdseyqlpyvlgsahqgclppfpadvfmipqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylxrtqstggtagxxellfsqxgpxxmsxqaknwlpgpcyrqqrvsktlxqnnnsnfawtgatkyhlngrxslvnpgvamathkddexrffpssgvlifgkxgagxnntxlxnvmxtxeeeikttnpvatexygvvaxnlqssntapxtgxvnsqgalpgmvwqnrdvylqgpiwakiphtdgnfhpsplmggfglkhpppqilikntpvpanppxxfxxakfasfitqystgqvsveiewelqkenskrwnpeiqytsnyaksxnvdfavxxxgvyxeprpigtryltrnl(seqidno:58)

在一些实施例中,祖先衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:58中所示的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性。在一些实施例中,祖先衣壳蛋白包括氨基酸序列,所述氨基酸序列与例如如seqidno:2中所示的aav2的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更多氨基酸序列一致性。在一些实施例中,祖先衣壳蛋白包括氨基酸序列,所述氨基酸序列与seqidno:58或seqidno:2中公开的祖先序列的氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%或更高的氨基酸序列一致性,并且包括选自由以下组成的组的一个或多个氨基酸残基:264处的丙氨酸(a)、266处的丙氨酸(a)、268处的丝氨酸(s)、448处的丙氨酸(a)、459处的苏氨酸(t)、460处的精氨酸(r)、467处的丙氨酸(a)、470处的丝氨酸(s)、471处的天冬酰胺(n)、474处的丙氨酸(a)、495处的丝氨酸(s)、516处的天冬酰胺(d)、533处的天冬酰胺(d)、547处的谷氨酰胺(q)、551处的丙氨酸(a)、555处的丙氨酸(a)、557处的谷氨酸(e)、561处的甲硫氨酸(m)、563处的丝氨酸(s)、577处的谷氨酰胺(q)、583处的丝氨酸(s)、593处的缬氨酸(v)、596处的苏氨酸(t)、661处的丙氨酸(a)、662处的缬氨酸(v)、664处的苏氨酸(t)、665处的脯氨酸(p)、710处的苏氨酸(t)、717处的天冬氨酸(d)、718处的天冬酰胺(n)、719处的谷氨酸(e)、以及723处的丝氨酸(s)。在一些优选的实施例中,变体衣壳蛋白包括氨基酸序列,所述氨基酸序列与以下氨基酸序列的整个长度具有至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%、在一些情况下100%的氨基酸序列一致性,并且包括选自由以下组成的组的一个或多个氨基酸残基:264处的丙氨酸(a)、266处的丙氨酸(a)、268处的丝氨酸(s)、448处的丙氨酸(a)、459处的苏氨酸(t)、460处的精氨酸(r)、467处的丙氨酸(a)、470处的丝氨酸(s)、471处的天冬酰胺(n)、474处的丙氨酸(a)、495处的丝氨酸(s)、516处的天冬酰胺(d)、533处的天冬酰胺(d)、547处的谷氨酰胺(q)、551处的丙氨酸(a)、555处的丙氨酸(a)、557处的谷氨酸(e)、561处的蛋氨酸(m)、563处的丝氨酸(s)、577处的谷氨酰胺(q)、583处的丝氨酸(s)、593处的缬氨酸(v)、596处的苏氨酸(t)、661处的丙氨酸(a)、662处的缬氨酸(v)、664处的苏氨酸(t)、665处的脯氨酸(p)、710处的苏氨酸(t)、717处的天冬氨酸(d)、718处的天冬酰胺(n)、719处的谷氨酸(e)和723处的丝氨酸(s):

maadgylpdwlednlsegirewwdlkpgapkpkanqqkqddgrglvlpgykylgpfngldkgepvnaadaaalehdkaydqqlkagdnpylrynhadaefqerlqedtsfggnlgravfqakkrvleplglveegaktapgkkrpvepspqrspdsstgigkkgqqpakkrlnfgqtgdsesvpdpqplgeppagpsglgsgtmaagggapmadnnegadgvgnasgnwhcdstwlgdrvittstrtwalptynnhlykqissasagstndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevttndgvttiannltstvqvfsdseyqlpyvlgsahqgclppfpadvfmipqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylartqstggtagtrellfsqagpsnmsaqaknwlpgpcyrqqrvsktlsqnnnsnfawtgatkyhlngrdslvnpgvamathkddedrffpssgvlifgkqgaganntalenvmmtseeeikttnpvateqygvvasnlqssntapvtgtvnsqgalpgmvwqnrdvylqgpiwakiphtdgnfhpsplmggfglkhpppqilikntpvpanppavftpakfasfitqystgqvsveiewelqkenskrwnpeiqytsnyakstnvdfavdnegvyseprpigtryltrnl(seqidno:59)。

在其它实施例中,变体aav衣壳蛋白包括与选自由以下组成的组的野生型aav衣壳序列至少85%、至少90%、至少95%或至少98%一致的氨基酸序列:如本文seqidno:58中公开的祖先变体,包括选自由以下组成的组的一个或多个氨基酸残基:264处的丙氨酸(a)、266处的丙氨酸(a)、268处的丝氨酸(s)、448处的丙氨酸(a)、459处的苏氨酸(t)、460处的精氨酸(r)、467处的丙氨酸(a)、470处的丝氨酸(s)、471处的天冬酰胺(n)、474处的丙氨酸(a)、495处的丝氨酸(s)、516处的天冬酰胺(d)、533处的天冬酰胺(d)、547处的谷氨酰胺(q)、551处的丙氨酸(a)、555处的丙氨酸(a)、557处的谷氨酸(e)、561处的蛋氨酸(m)、563处的丝氨酸(s)、577处的谷氨酰胺(q)、583处的丝氨酸(s)、593处的缬氨酸(v)、596处的苏氨酸(t)、661处的丙氨酸(a)、662处的缬氨酸(v)、664处的苏氨酸(t)、665处的脯氨酸(p)、710处的苏氨酸(t)、717处的天冬氨酸(d)、718处的天冬酰胺(n)、719处的谷氨酸(e)和723处的丝氨酸(s);并且还包括i)一个或多个选自由以下组成的组的氨基酸取代:p34a、s109t+v708i、a593e+n596d、v708i+v719m、v708i+g727d、s109t+a493v+a593e+v708i、v708i+r733c、q164k和i698v和/或(ii)选自由以下组成的组的肽插入:qadttkn(seqidno:13)、isdqtkh(seqidno:14)、asdstka(seqidno:15)、nqdytkt(seqidno:16)、hditkni(seqidno:17)、pqananen(seqidno:63)、tnrtspd(seqidno:24)、pnsthgs(seqidno:25)、kdrapst(seqidno:26)、hqdttkn(seqidno:19)、hpdttkn(seqidno:18)、nkttnkd(seqidno:20)、gkskvid(seqidno:23)、pisneneh(seqidno:64)、laqadttkna(seqidno:27)、laisdqtkha(seqidno:28)、lgisdqtkha(seqidno:29)、laasdstkaa(seqidno:30)、lahditknia(seqidno:32)、lpqananena(seqidno:37)、lanqdytkta(seqidno:31)、latnrtspda(seqidno:39)、lapnsthgsa(seqidno:40)、lakdrapsta(seqidno:41)、lahqdttkna(seqidno:34)、lahpdttkna(seqidno:33)、lankttnkda(seqidno:35)、lagkskvida(seqidno:38)和lpisneneha(seqidno:36)。在一些实施例中,变体aav衣壳包括指定的一个或多个氨基酸取代和/或肽插入,并且在其它方面与seqidno:59一致。

本文公开的aav变体通过使用体内定向进化产生,包括在玻璃体内施用后使用灵长类视网膜筛选。在一些实施例中,与通过包括相应亲代aav衣壳蛋白或野生型aav的aav病毒粒子转导视网膜细胞相比,当存在于aav病毒粒子中时,本文公开的变体衣壳蛋白赋予视网膜细胞的增加的转导。例如,在一些实施例中,当存在于aav病毒粒子中时,本文公开的变体衣壳蛋白赋予灵长类视网膜细胞比包括相应亲代aav衣壳蛋白或野生型aav衣壳蛋白的aav病毒粒子更有效地转导,例如视网膜细胞比包括亲代aav衣壳蛋白或野生型aav的aav病毒粒子摄取更多的包括受试者变体aav衣壳蛋白的aav病毒粒子。在一些这种实施例中,与通过野生型aav病毒粒子或包括相应亲代aav衣壳蛋白的raav转导视网膜细胞相比,aav变体病毒粒子或变体raav表现出至少2倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少50倍或超过50倍的视网膜细胞的增加的转导。在某些此类实施例中,当存在于aav病毒粒子中时,本文公开的变体衣壳蛋白赋予灵长类视网膜细胞比包括相应亲代aav衣壳蛋白或野生型aav衣壳蛋白的aav病毒粒子更广泛的转导。换句话说,变体aav病毒粒子转导未被包括相应亲代aav衣壳蛋白的病毒粒子转导的细胞类型,因此视网膜中比相应亲代aav病毒粒子中细胞类型更多。在一些实施例中,aav变体病毒粒子优先转导视网膜细胞,例如,与另一种视网膜细胞或非视网膜细胞,例如眼睛外的细胞相比,受试者raav病毒粒子以2倍、5倍、10倍、15倍、20倍、25倍、50倍或多于50倍特异性感染视网膜细胞。在一些实施例中,转导的视网膜细胞是感光细胞(例如,视杆;视锥)。在一些实施例中,视网膜细胞是视网膜神经节细胞(rgc)。在一些实施例中,视网膜细胞是视网膜上皮细胞(rpe细胞)。在一些实施例中,视网膜细胞是müller神经胶质细胞。在一些实施例中,视网膜细胞是小神经胶质细胞。在一些实施例中,视网膜细胞是无长突细胞。在一些实施例中,视网膜细胞是双极细胞。在一些实施例中,视网膜细胞是水平细胞。通过任何数量的本领域中用于测量基因表达的方法,可以容易地在体外或体内评估视网膜细胞转导的增加,例如增加的转导效率、更广泛的转导、更优先的转导等。例如,在普遍存在的或组织特异性启动子的控制下,aav可以与包括表达盒的基因组一起包装,所述表达盒包括报告基因,例如荧光蛋白,并且通过由例如荧光显微镜检测荧光蛋白来评估转导程度。作为另一个实例,aav可以与包括条形码核酸序列的基因组一起包装,并且通过由例如pcr检测核酸序列来评估转导程度。作为另一个实例,aav可以与包括表达盒的基因组一起包装,所述表达盒包括用于治疗视网膜疾病的治疗基因,并且通过检测施用aav的受治疗的患者的视网膜疾病的治疗来评估转导程度。

可使用本文公开的变体raav载体或病毒粒子和/或方法治疗的眼部疾病包含但不限于单基因疾病、复杂遗传疾病、获得性疾病和创伤性损伤。单基因疾病的实例包含但不限于巴德-毕德(bardet-biedl)综合征;巴藤病(batten'sdisease);bietti氏结晶营养不良;无脉络膜症;脉络膜视网膜萎缩;脉络膜视网膜变性;锥形或锥形杆状营养不良(常染色体显性遗传、常染色体隐性遗传和x连锁);先天性静止性夜盲症(常染色体显性遗传、常染色体隐性遗传和x连锁);色觉障碍,包含全色盲(包含achm2、achm3、achm4和achm5)、红色盲、绿色盲和蓝色盲;弗里德赖希共济失调;莱伯氏先天性黑朦(常染色体显性遗传和常染色体隐性遗传),包含但不限于lca1、lca2、lca3、lca4、lca6、lca7、lca8、lca12和lca15;莱伯氏遗传性视神经病变;黄斑营养不良(常染色体显性遗传和常染色体隐性遗传),包含但不限于急性黄斑变性、最佳卵黄样黄斑营养不良、图形样营养不良、北卡罗莱纳黄斑营养不良(northcarolinamaculardystrophy)、遗传性玻璃疣、索斯比眼底营养不良(sorsby'sfundusdystrophy)、malattialevantanese和遗传决定的早产儿视网膜病;眼视网膜发育疾病;眼白化病;视神经萎缩(常染色体显性遗传、常染色体隐性遗传和x连锁);色素性视网膜炎(常染色体显性遗传、常染色体隐性遗传、x连锁和线粒体遗传性状),其实例包含rp1、rp2、rp3、rp10、rp20、rp38、rp40和rp43;x连锁视网膜劈裂症;斯特格氏病(stargardtdisease);以及尤塞氏综合症(ushersyndrome),包含但不限于ush1b、ush1c、ush1d、ush1f、ush1g、ush2a、ush2c、ush2d和ush3。复杂遗传疾病的实例包含但不限于青光眼(开角型、闭角型、低眼压性、正常眼压性、先天性、新生血管性、色素性、假性剥脱);年龄相关和其它形式的黄斑变性,渗出性和非渗出性形式(常染色体显性遗传和常染色体隐性遗传),如急性黄斑变性,卵黄样黄斑变性;早产儿视网膜病;和vogtkoyanagi-harada(vkh)综合症。获得性疾病的实例包含但不限于急性黄斑神经视网膜病;前部缺血性视神经病和后部缺血性视神经病;白塞氏病(behcet'sdisease);分支视网膜静脉阻塞;脉络膜新生血管;糖尿病视网膜病变,包含增殖性糖尿病视网膜病变和相关并发症;糖尿病性葡萄膜炎;水肿,如黄斑水肿、囊样黄斑水肿和糖尿病性黄斑水肿;视网膜前膜病症;黄斑毛细血管扩张症;多灶性脉络膜炎;非视网膜病变糖尿病性视网膜功能障碍;眼部肿瘤;视神经萎缩;视网膜脱离;视网膜病症,如视网膜中央静脉阻塞、增殖性玻璃体视网膜病变(pvr)、视网膜动脉和静脉闭塞性疾病、血管闭塞、葡萄膜炎性视网膜疾病;葡萄膜渗漏;视网膜感染和浸润性疾病;视神经疾病,如获得性视神经萎缩。创伤性损伤的实例包含但不限于组织胞浆菌病;视神经损伤;影响后眼部位或位置的眼外伤;视网膜损伤;病毒感染的眼睛;病毒感染的视神经;由眼部激光治疗引起或受其影响的后眼部病症;由光动力疗法引起或受其影响的后眼部病症;光凝,放射性视网膜病变;以及交感性眼炎。

在另一个实施例中,本文公开的变体衣壳包括异源核酸,其包括编码基因产物的核苷酸序列,例如但不限于干扰rna、长非编码rna、短非编码rna、反义rna、适体、多肽、分泌的抗体、单链抗体、vhh结构域、可溶性受体、亲和体(affibody)、打结素(knottin)、darpin、centurin、伴侣蛋白、提供基因功能的位点特异性敲低的位点特异性核酸酶或提供转录的基因特异性活化的修饰的位点特异性核酸酶。

本文公开的raav变体病毒粒子包括异源核酸,其包括编码基因产物的核苷酸序列。在一些实施例中,基因产物是干扰rna。在一些实施例中,基因产物是长的非编码rna。在一些实施例中,基因产物是短的非编码rna。在一些实施例中,基因产物是反义rna。在一些实施例中,基因产物是适体。在一些实施例中,基因产物是多肽。在一些实施例中,基因产物是分泌的抗体。在一些实施例中,基因产物是单链抗体。在一些实施例中,基因产物是vhh结构域。在一些实施例中,基因产物是可溶性受体。在一些实施例中,基因产物是亲和体。在一些实施例中,基因产物是打结素。在一些实施例中,基因产物是darpin。在一些实施例中,基因产物是centurin。在一些实施例中,基因产物是伴侣蛋白。在一些实施例中,基因产物是提供基因功能的位点特异性敲低的位点特异性核酸酶。

基因产物的用途包含但不限于:提高细胞中因子的水平;通过分泌因子来提高相邻细胞中因子的水平;降低细胞中因子的水平;或者通过分泌因子来降低相邻细胞中因子的水平。基因产物可以设计为:补充缺失基因产物缺陷的水平;降低缺失基因产物缺陷的水平;引入新的支持基因产物;补充支持基因产物的水平;降低阻碍基因产物的水平;或者降低阻碍基因产物的水平并引入或补充支持基因产物的水平。

由受试者aav变体递送的基因产物可以用于改变直接或间接与视网膜疾病和创伤相关的基因产物或基因产物活性的水平。基因产物与遗传疾病直接或间接相关的基因包含例如adp-核糖基化因子样6(arl6);bbsome相互作用蛋白1(bbip1);bbsome蛋白1(bbs1);bbsome蛋白2(bbs2);bbsome蛋白4(bbs4);bbsome蛋白5(bbs5);bbsome蛋白7(bbs7);bbsome蛋白9(bbs9);bbsome蛋白10(bbs10);bbsome蛋白12(bbs12);中心体蛋白290kda(cep290);细胞纤毛内运输蛋白172(ift172);细胞纤毛内运输蛋白27(ift27);肌醇多磷酸-5-磷酸酶e(inpp5e);内向整流钾通道亚家族j成员13(kcnj13);亮氨酸拉链转录因子样-1(lztfl1);mckusick-kaufman综合征蛋白(mkks);梅克尔(meckel)综合征1型蛋白(mks1);肾结核3蛋白(nphp1);血清学定义的结肠癌抗原8(sdccag8);含有三重基序的蛋白32(trim32);三角形四肽(tetratricopeptide)重复结构域8(ttc8);巴特病蛋白(cln3);细胞色素p4504v2(cyp4v2);拉布(rab)护送蛋白1(chm);pr(正调节)含结构域13蛋白(prdm13);rpe-视网膜g蛋白偶联受体(rgr);tea结构域家族成员1(tead1);芳香烃相互作用受体蛋白样1(aipl1);锥-杆otx样光感受器同源框转录因子(crx);鸟苷酸环化酶活化蛋白1a(guca1a);视网膜特异性鸟苷酸环化酶(gucy2d);磷脂酰肌醇转移膜相关家族成员3(pitpnm3);prominin1(prom1);外周蛋白(prph);外周蛋白2(prph2);调节突触膜胞吐蛋白1(rims1);臂板蛋白4a(sema4a);秀丽隐杆线虫unc119蛋白的人类同源物(unc119);atp结合盒转运蛋白-视黄醛(abca4);adam金属肽酶结构域9(adam9);活化转录因子6(atf6);21号染色体开放阅读框2(c21orf2);8号染色体开放阅读框37(c8orf37);钙通道;电压依赖性;α2/δ亚基4(cacna2d4);钙粘蛋白相关的家庭成员1(原钙粘附蛋白21)(cdhr1);神经酰胺激酶样蛋白(cerkl);锥形光感受器cgmp门控阳离子通道α亚基(cnga3);锥环核苷酸门控阳离子通道β3亚基(cngb3);细胞周期蛋白m4(cnnm4);鸟嘌呤核苷酸结合蛋白(g蛋白);α转导活性多肽2(gnat2);钾通道亚家族v成员2(kcnv2);磷酸二酯酶6c(pde6c);磷酸二酯酶6h(pde6h);中心粒1中心蛋白b蛋白质组(poc1b);ras癌基因家族的rab28成员(rab28);视网膜和前神经折叠同源框2转录因子(rax2);11-顺式视黄醇脱氢酶5(rdh5);rpgtp酶调节子相互作用蛋白1(rpgrip1);微管蛋白酪氨酸连接酶样家族成员5(ttll5);l型电压门控钙通道α-1亚基(cacna1f);视网膜色素变性gtp酶调节子(rpgr);视杆转导α亚基(gnat1);视杆cgmp磷酸二酯酶β亚基(pde6b);视紫红质(rho);钙结合蛋白4(cabp4);g蛋白偶联受体179(gpr179);视紫红质激酶(grk1);代谢型谷氨酸受体6(grm6);富亮氨酸重复免疫球蛋白样跨膜结构域蛋白3(lrit3);抑制蛋白(s-抗原)(sag);溶质运载蛋白家族24(slc24a1);瞬时受体电位阳离子通道,亚家族m,成员1(trpm1);夜盲蛋白(nyctalopin)(nyx);绿视锥视蛋白(opn1lw);红视锥视蛋白(opn1mw);蓝视锥视蛋白(opn1sw);共济蛋白(fxn);肌苷一磷酸脱氢酶1(impdh1);正小齿同源框2蛋白(otx2);crumbs同源物1(crb1);含死亡结构域蛋白1(dthd1);生长分化因子6(gdf6);细胞纤毛内转运蛋白140衣藻同源蛋白(ift140);含iq基序b1蛋白(iqcb1);lebercilin(lca5);卵磷脂视黄醇酰基转移酶(lrat);烟酰胺核苷酸腺苷酰转移酶1(nmnat1);rd3蛋白(rd3);视黄醇脱氢酶12(rdh12);视网膜色素上皮特异性65kd蛋白(rpe65);精子形成相关蛋白7(spata7);tubby样蛋白1(tulp1);线粒体病毒基因(kss、lhon、mt-atp6、mt-th、mt-tl1、mt-tp、mt-ts2,线粒体编码的nadh脱氢酶[mt-nd]);斑萎蛋白1(best1);c1q和肿瘤坏死相关蛋白5胶原(c1qtnf5);含egf微纤维蛋白样胞外基质蛋白1(efemp1);延长极长脂肪酸蛋白(elovl4);视网膜肌同源物2,肌动蛋白集束蛋白(fscn2);鸟苷酸环化酶活化蛋白1b(guca1b);hemicentin1(hmcn1);间基质蛋白聚糖1(impg1);色素性视网膜炎1样蛋白1(rp1l1);金属蛋白酶-3组织抑制剂(timp3);补体因子h(cfh);补体因子d(cfd);补体成分2(c2);补体成分3(c3);补体因子b(cfb);dna损伤调节自噬调节剂2(dram2);硫酸软骨素蛋白多糖2(vcan);线粒体融合蛋白2(mfn2);核受体亚家族2群f成员1(nr2f1);视神经萎缩1(opa1);跨膜蛋白126a(tmem126a);线粒体内膜移位酶8同源物a(timm8a);碳酸酐酶iv(ca4);己糖激酶1(hk1);kelch样7蛋白(klhl7);核受体亚家族2群e3(nr2e3);神经视网膜lucine拉链(nrl);嗅觉受体家族2亚家族w成员3(or2w3);前mrna加工因子3(prpf3);前mrna加工因子4(prpf4);前mrna加工因子6(prpf6);前mrna加工因子8(prpf8);前mrna加工因子31(prpf31);视网膜外节膜蛋白1(rom1);视网膜色素变性蛋白1(rp1);pim1激酶相关蛋白1(rp9);小核糖核蛋白200kda(snrnp200);分泌性磷蛋白2(spp2);拓扑异构酶i结合精氨酸/富丝氨酸蛋白质(topors);adp-核糖基化因子-样2结合蛋白(arl2bp);染色体2开放阅读框71(c2orf71);肝素钾-1(clrn1);视杆cgmp门控通道α亚基(cnga1);视杆cgmp门控通道β亚基(cngb1);细胞色素p4504v2(cyp4v2);脱氢长醇二磷酸合成酶(dhdds);deah盒多肽38(dhx38);er膜蛋白复合物亚基1(emc1);眼睛关闭/spacemaker同源物(eys);具有序列相似161家族的成员a(fam161a);g蛋白偶联受体125(gpr125);乙酰肝素-α-氨基葡萄糖苷n-乙酰转移酶(hgsnat);nad(+)-特异性异柠檬酸脱氢酶3β(idh3b);间基质蛋白聚糖2(impg2);kiaa1549蛋白(kiaa1549);kizuna中心体蛋白(kiz);雄性生殖细胞相关激酶(mak)c-mer原癌基因受体酪氨酸激酶(mertk);甲羟戊酸激酶(mvk);nima(从未在有丝分裂基因a中)相关激酶2(nek2);神经元分化蛋白1(neurod1);cgmp磷酸二酯酶α亚基(pde6a);磷酸二酯酶6gcgmp特异性杆γ(pde6g);进行性杆-锥变性蛋白(prcd);视黄醇结合蛋白3(rbp3);视黄醛结合蛋白1(rlbp1);溶质载剂家族7成员14(slc7a14);usherin(ush2a);锌指蛋白408(znf408);锌指蛋白513(znf513);口腔面部数字综合征1蛋白(ofd1);视网膜色素变性2(rp2);视网膜劈裂蛋白(rs1);含蛋白的自水解酶结构域12(abhd12);钙粘蛋白样基因23(cdh23);中心体蛋白250kda(cep250);钙和整联蛋白结合家族成员2(cib2);whirlin(dfnb31);单基因听源性惊厥的易感性1同源物(gpr98);组氨酰-trna合成酶(hars);肌球蛋白viia(myo7a);原钙粘附蛋白15(pcdh15);甲丙氨酯(ush1c);含锚蛋白重复和sam结构域的小鼠支架蛋白的人类同源物(ush1g);肌营养不良蛋白(dmd);norrin(ndp);磷酸甘油酸激酶(pgk1);钙蛋白酶5(capn5);卷曲-4wnt受体同源物(fzd4);整合膜蛋白2b(itm2b);低密度脂蛋白受体相关蛋白5(lrp5);微rna204(mir204);视网膜母细胞瘤蛋白1(rb1);跨膜四蛋白12(tspan12);染色体12开放阅读框65(c12orf65);钙粘蛋白3(cdh3);膜型卷曲相关蛋白(mfrp);鸟氨酸氨基转移酶(oat);磷脂酶a2群v(pla2g5);视黄醇结合蛋白4(rbp4);g蛋白信号传导的调节剂9(rgs9);g蛋白的信号传导9结合蛋白的调节剂(rgs9bp);arms2;切除修复交叉互补啮齿动物修复缺陷互补群6蛋白(ercc6);腓骨蛋白5(fbln5);htra丝氨酸肽酶1(htra1);toll样受体3(tlr3);和toll样受体4(tlr4)。

基因产物诱导或促进细胞凋亡的基因在本文中称为“促凋亡基因”,这些基因(mrna;蛋白质)的产物被称为“促凋亡基因产物”。促凋亡靶标包含例如bax基因产物;bid基因产物;bak基因产物;bad基因产物;bcl-2;bcl-x1。抗凋亡基因产物包含x连锁的凋亡抑制剂。

基因产物诱导或促进血管生成的基因在本文中称为“促血管生成基因”,这些基因(mrna;蛋白质)的产物被称为“促血管生成基因产物”。促血管生成靶标包含例如血管内皮生长因子(vegfa、vegfb、vegfc、vegfd);血管内皮生长因子受体1(vegfr1);血管内皮生长因子受体2(vegfr2);fms相关酪氨酸激酶1(flt1);胎盘生长因子(pgf);血小板源性生长因子(pdgf);血管生成素;声波刺猬。基因产物抑制血管生成的基因在本文中称为“抗血管生成基因”,并且这些基因(mrna;蛋白质)的产物被称为“抗血管生成基因产物”。抗血管生成基因产物包含内皮抑素;肿瘤抑素;血管抑素;色素上皮源性因子(pedf),以及特异于促血管生成靶标和/或其受体的融合蛋白或抗体,例如抗vegf融合蛋白sflt1或eylea,vegf特异性抗体lucentistm和avastintm等。

基因产物充当免疫调节剂的基因例如补体因子、toll样受体,被称为“免疫调节基因”。示例性的免疫调节基因包含细胞因子,趋化因子和特异于它们和/或其受体的融合蛋白或抗体,例如抗il-6融合蛋白rilonacepttm、补体因子h特异性抗体lampamizumab等。基因产物充当神经保护因子的基因例如:血小板源性生长因子受体(pdgfr);神经胶质源性神经营养因子(gdnf);视杆源性反对生存力因子(rdcvf);成纤维细胞生长因子(fgf);神经秩蛋白(ntn);睫状神经营养因子(cntf);神经生长因子(ngf);神经营养因子-4(nt4);脑源性神经营养因子(bdnf);表皮生长因子。基因产物充当光响应视蛋白的基因,例如视蛋白;视紫红质;通道视紫红质;晕光视紫红质。

在一些情况下,关注的基因产物是位点特异性内切核酸酶,其提供基因功能的位点特异性敲低,例如,其中内切核酸酶敲除与视网膜疾病相关的等位基因。例如,当显性等位基因编码基因的缺陷拷贝时,所述缺陷拷贝当为野生型时是视网膜结构蛋白和/或提供正常的视网膜功能,可以将位点特异性内切核酸酶靶向缺陷等位基因并敲除缺陷等位基因。

除了敲除缺陷等位基因外,位点特异性核酸酶还可以用于刺激与供体dna的同源重组,所述供体dna编码由缺陷等位基因编码的蛋白质的功能性拷贝。因此,例如,受试者raav病毒粒子可以用于递送敲除缺陷等位基因的位点特异性内切核酸酶,并且可以用于递送缺陷等位基因的功能性拷贝,从而导致缺陷等位基因的修复,由此提供用于产生功能性视网膜蛋白(例如,功能性视网膜劈裂蛋白、功能性rpe65、功能性外周蛋白等)。参见,例如,li等人,(2011年),《自然》,475:217。在一些实施例中,本文公开的raav病毒粒子包括编码位点特异性内切核酸酶的异源核苷酸序列;和编码缺陷等位基因的功能性拷贝的异源核苷酸序列,其中功能性拷贝编码功能性视网膜蛋白。功能性视网膜蛋白包含例如视网膜劈裂蛋白、rpe65、视网膜色素变性gtp酶调节剂(rgpr)-相互作用蛋白-1、外周蛋白、外周蛋白-2等。

适合使用的位点特异性内切核酸酶包含例如大范围核酸酶;锌指核酸酶(zfn);转录活化剂样效应核酸酶(talen);以及定期聚集的间隙短回文重复/crispr相关(cas),其中这些位点特异性核酸内切酶是非天然存在的,并被修饰以靶向特定基因。可以工程化这种位点特异性核酸酶以切割基因组内的特定位置,并且然后非同源末端连接可以在插入或缺失几个核苷酸时修复断裂。这样的位点特异性内切核酸酶(也称为“indel”)然后将蛋白质抛出框架并有效地敲除基因。参见,例如美国专利公开号2011/0301073。

在本文公开的变体raav载体的一些实施例中,编码关注的基因产物的核苷酸序列与组成型启动子可操作地连接。合适的组成型启动子包含例如巨细胞病毒启动子(cmv)(stinski等人,(1985年),《病毒学杂志(journalofvirology)》,55(2):431-441),cmv早期增强子/鸡β-肌动蛋白(cba)启动子/兔β-珠蛋白内含子(cag)(miyazaki等人,(1989年),《基因学(gene)》,79(2):269-277,cbsb(jacobson等人,(2006年),《分子治疗(moleculartherapy)》,13(6):1074-1084),人类延伸因子1α启动子(ef1α)(kim等人,(1990年),《基因学》,91(2):217-223),人类磷酸甘油酸激酶启动子(pgk)(singer-sam等人,(1984年),《基因学》,32(3):409-417,线粒体重链启动子(loderio等人,(2012年),《pnas》,109(17):6513-6518),泛素启动子(wulff等人,(1990年),《欧洲生化学会联合会快报(febsletters)》,261:101-105)。在其它实施例中,编码关注的基因产物的核苷酸序列与诱导型启动子可操作地连接。在一些情况下,编码关注的基因产物的核苷酸序列与组织特异性或细胞类型特异性调节元件可操作地连接。例如,在一些情况下,编码关注的基因产物的核苷酸序列与光感受器特异性调节元件(例如,光感受器特异性启动子)可操作地连接,所述光感受器特异性调节元件例如在感光细胞中赋予可操作连接基因的选择性表达的调节元件。合适的光感受器特异性调节元件包含例如视紫红质启动子;视紫红质激酶启动子(young等人,(2003年),《眼科学研究与视力学(ophthalmol)》,44:4076);β磷酸二酯酶基因启动子(nicoud等人,(2007年),《基因医学杂志(j.genemed.)》,9:1015);视网膜色素变性基因启动子(nicoud等人,(2007年)同上);光感受器间维甲酸结合蛋白(irbp)基因增强子(nicoud等人,(2007年)同上);irbp基因启动子(yokoyama等人,(1992年),《实验眼科研究(expeyeres.)》,55:225),视蛋白基因启动子(tucker等人,(1994年),《pnas》,91:2611-2615),视网膜劈裂蛋白基因启动子(park等人,(2009年),《基因治疗(genetherapy)》,16(7):916-926),crx同源域蛋白基因启动子(furukawa等人,(2002年),《神经科学杂志(thejournalofneuroscience)》thejournalofneuroscience22(5):1640-1647),鸟嘌呤核苷酸结合蛋白α转导活性多肽1(gnat1)基因启动子(lee等人,(2010年),《基因治疗(genetherapy)》,17:1390-1399),神经视网膜特异性亮氨酸拉链蛋白(nrl)基因启动子(akimoto等人,(2006年),《pnas》,103(10):3890-3895),人类视锥抑制蛋白(hcar)启动子(li等人,(2002年),《生物化学与分子生物学(biochemistryandmolecularbiology)》,43:1375-1383),以及pr2.1、pr1.7、pr1.5和pr1.1启动子(ye等人,(2016年),《人类基因治疗(humangenetherapy)》,27(1):72-82))。在一些情况下,编码关注的基因产物的核苷酸序列与视网膜色素上皮细胞(rpe)细胞特异性调节元件(例如,rpe特异性启动子)可操作地连接,所述细胞特异性调节元件例如在rpe细胞中赋予可操作连接的基因选择性表达的调节元件。合适的rpe特异性调节元件包含例如rpe65基因启动子(meur等人,(2007年),《基因治疗》,14:292-303),细胞视黄醛结合蛋白(cralbp)基因启动子(kennedy等人,(1998年),《生物化学杂志(journalofbiologicalchemistry)》,273:5591-5598),色素上皮源性因子(pedfakaserpinf1)基因启动子(kojima等人,(2006年),《分子和细胞生物化学(molecularandcellularbiochemistry)》,293(1-2):63-69),和卵黄样黄斑营养不良(vmd2)启动子(esumi等人,(2004),《生物化学杂志》,279(18):19064-19073)。在一些情况下,编码关注的基因产物的核苷酸序列与müller神经胶质细胞特异性调节元件(例如,神经胶质特异性启动子)可操作地连接,所述细胞特异性调节元件例如在视网膜神经胶质细胞中赋予可操作连接基因的选择性表达的调节元件。合适的神经胶质特异性调节元件包含例如神经胶质原纤维酸性蛋白(gfap)启动子(besnard等人,(1991年),《生物化学杂志》,266(28):18877-18883)。在一些情况下,编码关注的基因产物的核苷酸序列与双极细胞特异性调节元件(例如,双极特异性启动子)可操作地连接,所述细胞特异性调节元件例如在双极细胞中赋予可操作连接基因的选择性表达的调节元件。合适的双极特异性调节元件包含例如grm6启动子(cronin等人,(2014年),《embo分子医学(embomolecularmedicine)》,6(9):1175-1190)。

出于本发明的目的,本文的公开内容提供了分离的核酸,其包括编码如上所述的变体aav衣壳蛋白的核苷酸序列。分离的核酸可以是aav载体,例如重组aav载体。

本文的公开内容还提供了一种治疗视网膜疾病的方法,所述方法包括向有此需要的个体施用有效量的raav变体病毒粒子,其包括如上所述和本文公开的关注的转基因。本领域普通技术人员将能够容易地确定受试者raav病毒粒子的有效量,并且通过测试一个或多个功能或解剖学参数的变化来治疗疾病,所述参数例如视敏度、视野、对亮和暗的电生理学反应、色觉、对比敏感度、解剖学、视网膜健康和脉管系统、眼能动性、固定偏好和稳定性。

用于评估视网膜功能和其变化的非限制性方法包含:评估视力(例如最佳矫正视力[bcva]、移动、导航、物体检测和辨别);评估视野(例如静态和动态视野测量);进行临床检查(例如,对眼睛的前段和后段进行裂隙灯检查);评估对所有亮和暗波长的电生理反应(例如所有形式的视网膜电图(erg)[全视角、多焦点和模式]、所有形式的视觉诱发电位(vep)、眼电图(eog)、色觉、暗适应和/或对比敏感度)。用于评估解剖学和视网膜健康和其变化的非限制性方法包含光学相干断层扫描(oct)、眼底摄影、自适应光学扫描激光检眼镜检查(ao-slo)、荧光和/或自发荧光;测量眼球动性和眼球运动(例如,眼球震颤、固定偏好和稳定性)、测量报告的结果(患者报告的视觉和非视觉引导行为和活动的变化、患者报告的结果[pro]、基于问卷的生活质量评估、日常活动和神经功能的测量(例如功能性磁共振成像(mri))。

在一些实施例中,有效量的受试者raav病毒粒子导致视网膜功能、解剖学完整性或视网膜健康的丧失速率降低,例如丧失速率以及因此疾病的进展降低2倍、3倍、4倍或5倍或者更多,例如丧失速率以及因此疾病的进展降低10倍或更多。在一些实施例中,有效量的受试者raav病毒粒子导致视觉功能、视网膜功能、视网膜解剖学或健康的改善、和/或眼能动性的改善和/或神经功能的改善增加,例如视网膜功能、视网膜解剖学或健康和/或眼能动性的改善提高2倍、3倍、4倍或5倍或者更高,例如视网膜功能、视网膜解剖学或健康和/或眼能动性的改善提高10倍或更多。如普通技术人员将容易理解的,实现期望的治疗效果所需的剂量通常在1x108到约1x1015个重组病毒粒子的范围内,通常被普通技术人员称为1x108到约1x1015个“载体基因组”。

受试者raav病毒粒子可以通过眼内注射施用,例如通过玻璃体内注射、通过视网膜下注射、通过脉络膜上注射或通过将导致raav病毒粒子递送至眼睛的任何其它方便的施用模式或途径。其它方便的施用模式或途径包含但不限于静脉内、动脉内、眼周、前房内、结膜下和眼球囊下注射和局部施用和鼻内施用。当通过玻璃体内注射施用时,受试者的raav病毒粒子能够穿过玻璃体并穿过内界膜(在本文中也称为内界膜,或“ilm”;视网膜的表面上的形成视网膜与玻璃体之间的边界的薄的、透明的无细胞膜,其由星形胶质细胞和müller细胞的终足形成),和/或与包括相应亲代aav衣壳蛋白的aav病毒粒子的能力相比,更有效地移动通过视网膜层。

本文公开的变体衣壳蛋白被分离,例如纯化。在一些实施例中,本文公开的变体衣壳蛋白包含在aav载体或重组aav(raav)病毒粒子中。在其它实施例中,这种aav变体载体和/或aav变体病毒粒子用于治疗灵长类动物视网膜中的眼病的体内或离体方法。

本文的公开内容还提供了宿主细胞,如但不限于包括受试者核酸的分离的(遗传修饰的)宿主细胞。本文公开的根据本发明的宿主细胞可以是分离的细胞,如来自体外细胞培养物的细胞。如本文所述,这种宿主细胞用于产生受试者raav变体病毒粒子。在一个实施例中,用核酸对这种宿主细胞进行稳定地遗传修饰。在其它实施例中,用核酸对宿主细胞进行瞬时遗传修饰。使用已建立的技术将这种核酸稳定地或瞬时地引入宿主细胞中,所述技术包含但不限于电穿孔、磷酸钙沉淀、脂质体介导的转染等。为了稳定转化,核酸通常还包含可选择标记,例如,几种众所周知的可选择标记中的任何一种,如新霉素抗性等。通过将核酸引入多种细胞中的任何细胞中来产生这种宿主细胞,所述多种细胞例如哺乳动物细胞,包含例如小鼠细胞和灵长类动物细胞(例如人类细胞)。示例性哺乳动物细胞包含但不限于原代细胞和细胞系,其中示例性细胞系包含但不限于293细胞、cos细胞、hela细胞、vero细胞、3t3小鼠成纤维细胞、c3h10t1/2成纤维细胞、cho细胞等。示例性宿主细胞包含但不限于hela细胞(例如,美国典型培养物保藏中心(atcc)编号ccl-2)、cho细胞(例如,atcc编号crl9618、ccl61、crl9096)、293细胞(例如,atcc编号crl-1573)、vero细胞、nih3t3细胞(例如,atcc编号crl-1658)、huh-7细胞、bhk细胞(例如,atcc编号ccl10)、pc12细胞(atcc编号crl1721)、cos细胞、cos-7细胞(atcc编号crl1651)、rat1细胞、鼠l细胞(atcc编号ccli.3)、人胚肾(hek)细胞(atcc编号crl1573)、hlhepg2细胞等等。还可以使用杆状病毒来感染宿主细胞以感染昆虫细胞,如产生aav的sf9细胞(参见,例如,美国专利号7,271,002;美国专利申请序列号12/297,958)。在一些实施例中,除了包括对变体aav衣壳蛋白进行编码的核苷酸序列的核酸之外,遗传修饰的宿主细胞包含如上所述的核酸,所述核酸包括对一种或多种aavrep蛋白进行编码的核苷酸序列。在其它实施例中,宿主细胞进一步包括raav变体载体。可以使用此类宿主细胞产生raav变体病毒粒子。例如美国专利公开号2005/0053922和美国专利公开号2009/0202490中描述了生raav病毒粒子的方法。

本公开在本文中另外提供了一种药物组合物,其包括:a)如上所述和本文公开的raav变体病毒粒子;b)药学上可接受的载剂、稀释剂、赋形剂或缓冲剂。在一些实施例中,药学上可接受的载剂、稀释剂、赋形剂或缓冲剂适用于人或非人患者。此类赋形剂、载剂、稀释剂和缓冲剂包含可以在没有过度毒性的情况下施用的任何药剂。药学上可接受的赋形剂包含但不局限于液体,如水、盐水、甘油、以及乙醇。可以包含药学上可接受的盐,例如无机酸盐,如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等;和有机酸的盐,如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。此外,这种媒剂中可以存在辅助物质,如润湿剂或乳化剂、ph缓冲物质等。多种药学上可接受的赋形剂是本领域已知的,无需在此详细讨论。已在各种出版物中充分描述了药学上可接受的赋形剂,包含例如a.gennaro(2000)《雷明顿:药物科学与实践(remington:thescienceandpracticeofpharmacy)》,第20版,lippincott,williams,&wilkins;《药物剂型和药物递送系统(pharmaceuticaldosageformsanddrugdeliverysystems)(1999)h.c.ansel等人,编辑,第7版,lippincott,williams,&wilkins;和《药物赋形剂手册(handbookofpharmaceuticalexcipients)》(2000)a.h.kibbe等人,编辑,第3版,《美国药物协会(amer.pharmaceuticalassoc.)》在本发明的一些方面,本发明提供了一种药物组合物,其包括约1×108到约1×1015个重组病毒或1×108到约1×1015个载体基因组,其中每个所述重组病毒包括对一种或多种基因产物进行编码的基因组。

提出以下实施例以向普通技术人员提供关于如何制作和使用本文公开的变体aav衣壳的指导的完整公开和描述,并且不旨在限制本文公开的本发明的范围。另外,以下实施例不旨在表示以下实验是所进行的全部或仅有的实验。

实例

提出以下实例以便向本领域普通技术人员提供如何制备和使用本发明的完整披露和描述,并且不旨在限制诸位发明人看待其发明的范围,它们也不旨在表示以下实验是进行的全部或仅有的实验。虽然已尽力确保所用数字(例如量、温度等)的准确性,但仍应考虑一些实验误差和偏差。除非另外指明,份数是重量份,分子量是重量平均分子量,温度是摄氏度,并且压力是或接近大气压。

可以在这种标准教科书中找到分子和细胞生物化学的一般方法,如《分子克隆:molecularcloning:实验室手册(molecularcloning:alaboratorymanual)》第3版,(sambrook等人,harborlaboratorypress2001);《精编分子生物学实验指南(shortprotocolsinmolecularbiology)》第4版,(ausubel等人,编辑,johnwiley&sons1999);《蛋白质方法(proteinmethods)》(bollag等人,johnwiley&sons1996);《基因疗法的非病毒载体(nonviralvectorsforgenetherapy)》,(wagner等人,编辑,学术出版社(academicpress),1999);《病毒载体(viralvector)》,(kaplift&loewy编辑,学术出版社,1995);《免疫学方法手册(immunologymethodsmanual)》(i.lefkovits编辑,学术出版社,1997);和《细胞和组织培养:生物技术实验室程序(cellandtissueculture:laboratoryproceduresinbiotechnology)》(doyle&griffiths,johnwiley&sons1998),其公开内容通过引用并入本文。本公开中提及的用于遗传操纵的试剂、克隆载体和试剂盒可从商业供应商获得,如biorad、stratagene、invitrogen、sigma-aldrich和clontech。

实例1

玻璃体内注射和组织收获.通过玻璃体内注射通过巩膜(使用适于人类使用的程序和递送装置在角膜缘后约3mm)为年龄为4到10岁并且体重至少为4kg的单一雄性食蟹猴(macacafascicularis)给药。将动物麻醉,并将给定的文库的100μl局部麻醉剂施用到每一只眼睛。

在第14±3天,由经过培训的兽医人员使用100mg/kg戊巴比妥钠静脉注射进行安乐死。将眼睛成核并储存在4℃下直至解剖。

组织解剖.用手术刀沿锯齿锯切开眼睛,并移除前段。在中央凹周围的视网膜上进行减压切割,以使视网膜能够平坦安装,并移除玻璃体。收集来自每个象限(上,下,鼻和颞)的六个视网膜样品,如图2所示的对应于rpe细胞的细胞材料、光感受器、生物极细胞、无长突细胞、水平细胞和/或分离出神经节细胞。

定向进化.图1a到图1e中示出了定向进化过程。简而言之,创建了包括20多种dna突变技术和cap基因的专有组合的病毒衣壳文库(图1a)。然后包装病毒(图1b)-使得每个颗粒由围绕对那个衣壳进行编码的cap基因的突变衣壳组成-并且被纯化。将衣壳文库置于体内选择压力下。收获感兴趣的组织或细胞材料以分离已成功感染那个靶标的aav变体,并回收成功的病毒。通过重复选择来富集成功的克隆(阶段i到图1d)。选择的cap基因然后经历专有的再分散,并通过进一步的选择步骤富集以迭代地增加病毒适应性(阶段2到图1d)。在载体选择阶段1和2期间识别的变体证明了转导灵长类动物视网膜细胞的能力(图1e)。

aav衣壳基因组成功恢复:第1到6轮。从每轮选择中回收的衣壳用于包装注射的文库以开始随后的一轮选择。从组织中回收衣壳基因表示文库载体成功地内化到感兴趣的组织中。在第4轮之后,在文库包装和第5轮注射之前,将文库的额外重新多样化纳入其中。图3中示出了来自代表性选择轮次的rpe、pr、内核层(inl)和神经节细胞层(gcl)视网膜组织的病毒基因组的回收。盒内的条带代表病毒基因组的成功恢复。

测序分析:第3到6轮。在第3到6轮期间,对文库内的单个克隆进行测序以确定群体内变体的频率。评估变体在测序数据中是否存在基序。基于在多个序列中发生的统一变异(例如,衣壳内一致位置中的特异性点突变或特异性肽插入序列)的存在,将变体分组为基序。图4a(第3轮测序分析)、图4b(第4轮测序分析)、图4c(第5轮测序分析)和4d(第6轮测序分析)中表示了代表两轮或更多轮选择中至少5%的测序群体或一轮或更多轮选择中至少10%的测序群体的基序。

下表1中列出了赋予视网膜细胞增加的感染性的识别的若干个代表性克隆(每个克隆含有识别的一个或多个取代和/或肽插入,并且在其它方面与seqidno:2一致;列出了针对每个克隆的选择轮次、序列编号和频率(在括号中):

表1.对赋予视网膜的一个或多个细胞增加的感染性的aavvp1衣壳蛋白的氨基酸序列修饰。第2列中列出的取代基于野生型aav2的氨基酸序列,即不存在插入的肽。

还识别为具有增加的一种或多种视网膜细胞感染性的衣壳是具有以下祖先vp1衣壳序列的克隆:

maadgylpdwlednlsegirewwdlkpgapkpkanqqkqddgrglvlpgykylgpfngldkgepvnaadaaalehdkaydqqlkagdnpylrynhadaefqerlqedtsfggnlgravfqakkrvleplglveegaktapgkkrpvepspqrspdsstgigkkgqqpakkrlnfgqtgdsesvpdpqplgeppagpsglgsgtmaagggapmadnnegadgvgnasgnwhcdstwlgdrvittstrtwalptynnhlykqissasagstndnhyfgystpwgyfdfnrfhchfsprdwqrlinnnwgfrpkrlnfklfniqvkevttndgvttiannltstvqvfsdseyqlpyvlgsahqgclppfpadvfmipqygyltlnngsqavgrssfycleyfpsqmlrtgnnftfsytfedvpfhssyahsqsldrlmnplidqylyylartqstggtagtrellfsqagpsnmsaqaknwlpgpcyrqqrvsktlsqnnnsnfawtgatkyhlngrdslvnpgvamathkddedrffpssgvlifgkqgaganntalenvmmtseeeikttnpvateqygvvasnlqssntapvtgtvnsqgalpgmvwqnrdvylqgpiwakiphtdgnfhpsplmggfglkhpppqilikntpvpanppavftpakfasfitqystgqvsveiewelqkenskrwnpeiqytsnyakstnvdfavdnegvyseprpigtryltrnl.(seqidno:59)

这种祖先衣壳变体是从祖先衣壳seqidno:58进化而来的,其中简并性位置(残基264、266、268、448、459、460、467、470、471、474、495、516、533、547、551、555、557、561、563、577、583、593、596、661、662、664、665、710、717、718、719、723)进化成包括:264处的丙氨酸(a)、266处的丙氨酸(a)、268处的丝氨酸(s)、448处的丙氨酸(a)、459处的苏氨酸(t)、460处的精氨酸(r)、467处的丙氨酸(a)、470处的丝氨酸(s)、471处的天冬酰胺(n)、474处的丙氨酸(a)、495处的丝氨酸(s)、516处的天冬酰胺(d)、533处的天冬酰胺(d)、547处的谷氨酰胺(q)、551处的丙氨酸(a)、555处的丙氨酸(a)、557处的谷氨酸(e)、561处的甲硫氨酸(m)、563处的丝氨酸(s)、577处的谷氨酰胺(q)、583处的丝氨酸(s)、593处的缬氨酸(v)、596处的苏氨酸(t)、661处的丙氨酸(a)、662处的缬氨酸(v)、664处的苏氨酸(t)、665处的脯氨酸(p)、710处的苏氨酸(t)、717处的天冬氨酸(d)、718处的天冬酰胺(n)、719处的谷氨酸(e)、以及723处的丝氨酸(s)。

本文公开的aav变体病毒粒子可以并入合理的合理设计参数、特征、修饰、优点和变化,这些是本领域技术人员在工程化aav病毒载体领域中显而易见的。

实例2

采用定向进化通过在玻璃体内(ivt)施用后将优异的基因递送到视网膜细胞来发现新型腺相关病毒(aav)变体,其施用途径显著优于将基因递送到人眼的其它方法(实例1)。玻璃体内施用包括p34a取代的新型aav变体和插入氨基酸588(laisdqtkha+p34a)处的肽laisdqtkha(seqidno:28)后的细胞趋向性在非人灵长类动物(nhp)中体内评估为含有isdqtkh(seqidno:14)的aav变体转导视网膜细胞的能力的代表性实例。

使用标准方法来制造包括aav2衣壳或新型变体衣壳laisdqtkha+p34a的重组aav病毒粒子和包括与cmv启动子(分别为aav2.cmv.gfp和laisdqtkha+p34a.cmv.gfp)和cag启动子(分别为aav2.cag.egfp和laisdqtkha+p34a.cag.egfp)可操作地连接的绿色荧光蛋白(gfp)转基因的基因组。非洲绿猴(图7、图8)或食蟹猴(图9)玻璃体内注射有各种剂量的载体,每只眼睛注射范围为4×1010vg到1×10121e12vg(详见图例),并且用heidelbergspectralistm通过眼底荧光成像评估视网膜细胞转导寿命。

包括新型变体laisdqtkha+p34a的aav的玻璃体内递送导致跨nhp视网膜的转基因表达比aav2更广泛且更稳健(图7到图9)。图像显示新型aav变体衣壳在中央凹(富含视锥的区域)的中心内提供稳健的表达;早在注射后2周,在旁中心凹环(富含视网膜神经节细胞的区域)和周边(富含许多类型的细胞的区域,包含视杆、muller胶质细胞、无长突细胞,双极细胞)中。相比之下并且并且与由其它人报道的结果一致,野生型aav2提供较弱的表达,其主要在旁中心凹环中并且仅可以在稍后的时间点检测到。注射后3周对视网膜的各个区域进行的免疫组织化学分析证实,已经在整个视网膜中成功转导了许多类型的视网膜细胞,包含视网膜色素上皮细胞、视杆和视锥光感受器、以及视网膜神经节细胞(图10a到图10e)。

此研究表明了与临床相关的aav2相比临床上优选的施用途径后包括isdqtkh的变体的优异基因递送。用包括此肽插入基序的其它变体可实现类似的功效。同样地,使用本文中公开的使用相同的定向进化方法识别的其它变体可以实现类似的功效。

实例3

用于视网膜色素上皮(rpe)细胞和光感受器(pr)细胞的新型aav变体laisdqtkha+p34a的细胞趋向性在体外使用rpe细胞和由成纤维细胞源性人诱导多能干细胞(fb-ipsc)或人胚胎干细胞(esc)产生的pr细胞进行评估。

使用标准方法来制造包括aav2衣壳或新型变体衣壳laisdqtkha+p34a的aav病毒粒子和包括与cag启动子(分别为aav2.cag.egfp和laisdqtkha+p34a.cag.egfp)可操作地连接的绿色荧光蛋白(egfp)转基因的基因组。使用45天的分化方案,由人胚胎干细胞系esi-017或人成纤维细胞源性诱导多能干细胞(“fb-ipsc”)产生人rpe细胞培养物。通过检测以下来确认成熟为rpe细胞:包含rpe65和best1的成熟rpe标记物的表达;vegf和pedf的合成;和吞噬杆外段的能力。通过多步眼杯形成范例产生pr培养物,并通过在培养179天后检测恢复蛋白和s视蛋白的表达证实包括pr。

相对于aav2,如通过免疫荧光(图11a到图11b)、流式细胞术(增加2.7倍;图11c到图11d)和蛋白质印迹分析(图11e到图11f)所确定的,laisdqtkha+p34a在感染后7天在人rpe培养物中提供显著更高的转导效率和转基因表达。在感染后32天,使用laisdqtkha+p34a.cag.egfp在人pr培养物中同样实现了稳健的转导和表达。此研究说明了包括isdqtkh(seqidno:14)的变体将基因递送给视网膜细胞的优越能力。

前述内容仅说明了本发明的原理。将理解的是,本领域技术人员将能够设计不同的安排,所述不同的安排虽然没有在此明确地描述或显示,但体现本发明的原理并且包括在其精神和范围之内。另外,在此叙述的所有实例和条件性语言主要打算帮助读者理解诸位发明人所贡献的本发明的原理和概念以推动本领域发展,并且将被视为而不限于这些特别叙述的实例和条件。

并且,引用本发明的原理、方面、以及实施例的所有在此的陈述连同其具体实例旨在涵盖其结构和功能等效物两者。另外,预期此类等效物包括当前已知的等效物以及有朝一日开发的等效物两者,即不论结构而执行相同功能的发展的任何要素。因此,本发明的范围不是旨在受限于在此显示和描述的示例性实施例。相反,本发明的范围和精神通过所附权利要求书来具体化。

当前第1页1 2 
网友询问留言 已有1条留言
  • 访客 来自[江苏省常州市电信] 2019年05月15日 16:44
    有关腺病毒变体衣壳的方法和流程,文中介绍的还是比较清楚的。不知道一些检测的盒子BIODAI,ABI,可不可以,或许作者研究交流一下。
    0
1