本发明涉及用于在靶细胞中表达人abca4蛋白的腺伴随病毒(aav)载体系统和aav载体。本发明的aav载体系统和aav载体可用于预防或治疗与视网膜细胞降解相关的疾病,例如斯塔加特病。
发明背景
斯塔加特病(stargardtdisease)是视网膜的遗传性疾病,其可通过破坏眼中的光感测光受体细胞而导致失明。疾病通常出现在儿童时期,导致年轻人失明。
斯塔加特病的最常见形式是与编码蛋白atp结合盒,亚家族a,成员4(abca4)的基因中突变相关的隐性疾病。abca4是一种大的跨膜蛋白,其在视网膜细胞中光敏感色素的再循环中发挥作用。在斯塔加特病中,abca4基因的突变导致视网膜细胞中缺乏功能性abca4蛋白。这又导致二类视黄醇(bisretinoid)副产物的形成和积累,在视网膜色素上皮细胞(rpe)细胞中产生脂褐素的毒性颗粒。这导致rpe细胞的降解和最终破坏,这导致感光细胞的损失,导致视力逐渐丧失和最终失明。
基因疗法有望成为斯塔加特病的治疗方法。目的是通过使用载体将功能性abca4基因引入受影响的光受体细胞中来纠正疾病的缺陷,从而恢复abca4功能。
源自腺伴随病毒(aav)的载体目前正在研究,用于视网膜基因疗法。aav是一种小病毒,其呈现非常低的免疫原性,并且与任何已知的人类疾病无关。缺乏相关的炎性应答意味着aav在注射到眼中时不引起视网膜损伤。
然而,aav壳体的大小限制了可以包装在其中的dna的量。aav基因组的大小约为4.7千碱基(kb),并且认为aav中dna包装的相应上限大小约为5kb(wuetal.,moleculartherapy,vol.18,no.1,jan2010)。abca4基因的编码序列大小约为6.8kb(基因表达需要进一步的遗传元件),使其太大而不能掺入标准aav载体中。
已经试验了许多克服此大小上限并且从aav载体表达大基因如abca4的方法。这些方法包括“超大(oversize)”载体方法和“双重”载体方法。
“超大”载体
已经进行了许多尝试以迫使比天然4.7kb基因组大得多的基因进入aav载体中,在转导靶细胞方面取得了一些成功。举例来说,allocca等人(j.clin.invest.vol.118,no.5,may2008)制备了包装鼠abca4和人myo7a基因的超大aav载体,并且证明了在转导小鼠视网膜细胞后的蛋白质表达。然而,虽然allocca等人提出某些aav壳体可以容纳高达8.9kb,但是随后的研究发现“超大”方法实际上并没有克服包装大小上限,而是导致转基因以随机方式截断,从而提供各自包含转基因片段的异质aav载体群体(dongetal.,moleculartherapy,vol.18,no.1,jan2010)。认为给定群体中一定比例的超大载体包装过大的转基因的足够大的片段,使得片段之间存在重叠区域,允许在转导靶细胞后再装配成全长基因。然而,这种方法是不可预测且低效的,缺乏包装控制和随后重组失败,提供了对一致性的可检测的成功的相当大的障碍。
“双重”载体
备选的方法是制备双重载体系统,其中大于约5kb限度的转基因以大致一半分成两个分开的限定序列的载体:含有转基因5'部分的“上游”载体,和含有转基因的3'部分的“下游”载体。通过上游和下游载体两者转导靶细胞允许使用多种胞内机制从两个片段重装配全长转基因。
在所谓的“反式剪接”双重载体方法中,剪接供体信号位于上游转基因片段的3'端,并且剪接-受体信号位于下游转基因片段的5'端。在通过双重载体转导靶细胞后,aav基因组中存在的反向末端重复(itr)序列介导转基因片段的头至尾连环化(concatermerisation)和转录物的反式剪接导致产生全长mrna序列,允许全长蛋白质表达。
备选的双重载体系统使用“重叠”方法。在重叠双重载体系统中,上游编码序列部分3'端的编码序列的部分与下游编码序列部分5'的同源序列重叠。在通过上游和下游载体转导靶细胞后,编码序列的上游和下游部分之间的同源重组允许重新创建全长转基因,从中可以转录相应的mrna并表达全长蛋白。
wo2014/170480描述了编码人abca4蛋白的双重aav载体系统的产生。
因此,本领域需要编码abca4蛋白并适用于基因疗法的备选和/或改善的aav载体系统。
发明概述
本发明通过提供如权利要求中描述的腺伴随病毒(aav)载体系统解决了上述现有技术问题。
有利地,本发明的aav载体系统在转导的细胞中提供高得令人惊讶的全长abca4蛋白表达水平,且abca4的不想要的截短片段的有限产生。
在一个方面,本发明提供了用于在靶细胞中表达人abca4蛋白的aav载体系统,该aav载体系统包含含有第一核酸序列的第一aav载体和含有第二核酸序列的第二aav载体;其中第一核酸序列包含abca4编码序列(cds)的5'端部分,和第二核酸序列包含abca4cds的3'端部分,并且5'端部分和3'端部分一起包含整个abca4cds;其中第一核酸序列包含对应于seqidno:1的核苷酸105至3597的连续核苷酸序列;其中第二核酸序列包含对应于seqidno:1的核苷酸3806至6926的连续核苷酸序列;其中第一核酸序列和第二核酸序列各自包含与另一个序列重叠的区域;其中,序列重叠区域包含对应于seqidno:1的核苷酸3598至3805的核酸序列的至少约20个连续核苷酸。
序列重叠区域的长度可以在20至550个核苷酸之间;优选长度为50至250个核苷酸;更优选长度为175至225个核苷酸;最优选长度为195至215个核苷酸。
序列重叠区域还可以包含对应于seqidno:1的核苷酸3598至3805的核酸序列的至少约50个连续核苷酸;优选至少约75个连续核苷酸;更优选至少约100个连续核苷酸;甚至更优选至少约150个连续核苷酸;且最优选至少约200个连续核苷酸。
在一个实施方案中,第一核酸序列包含由seqidno:1的核苷酸105至3597组成的连续核苷酸序列。在一个实施方案中,第二核酸序列包含由seqidno:1的3806至6926的核苷酸组成的连续核苷酸序列。
在一个实施方案中,第一核酸序列包含由seqidno:2的核苷酸105至3597组成的连续核苷酸序列。在一个实施方案中,第二核酸序列包含由seqidno:2的核苷酸3806至6926的核苷酸组成的连续核苷酸序列。
在一个实施方案中,序列重叠区域包含由seqidno:1的核苷酸3598至3805组成的核酸序列的至少约20个连续核苷酸。在一个实施方案中,序列重叠区域包含由seqidno:2的核苷酸3598至3805组成的核酸序列的至少约20个连续核苷酸。
在一个实施方案中,序列重叠区域包含由seqidno:1的核苷酸3598至3805组成的核酸序列的至少约50个连续核苷酸;优选至少约75个连续核苷酸;更优选至少约100个连续核苷酸;甚至更优选至少约150个连续核苷酸;最优选至少约200个连续核苷酸。在一个实施方案中,序列重叠区域包含由seqidno:2的核苷酸3598至3805组成的核酸序列的至少约50个连续核苷酸;优选至少约75个连续核苷酸;更优选至少约100个连续核苷酸;甚至更优选至少约150个连续核苷酸;最优选至少约200个连续核苷酸。
在一个实施方案中,第一核酸序列包含对应于seqidno:1的核苷酸105至3805的连续核苷酸序列;第二核酸序列包含对应于seqidno:1的核苷酸3598至6926的连续核苷酸序列。
在一个实施方案中,第一核酸序列包含由seqidno:1的核苷酸105至3805组成的连续核苷酸序列;第二核酸序列包含由seqidno:1的核苷酸3598至6926组成的连续核苷酸序列。
在一个实施方案中,第一核酸序列包含由seqidno:2的核苷酸105至3805组成的连续核苷酸序列;第二核酸序列包含由seqidno:2的核苷酸3598至6926组成的连续核苷酸序列。
第一aav载体可包含可操作地连接至abca4编码序列(cds)的5'端部分的grk1启动子。
第一核酸序列可包含位于abca4编码序列(cds)的5'端部分上游的非翻译区(utr)。
第二核酸序列可包含转录后响应元件(pre);优选土拨鼠肝炎病毒转录后响应元件(wpre)。
第二核酸序列可包含牛生长激素(bgh)聚腺苷酸化序列。
另一方面,本发明提供了在靶细胞中表达人abca4蛋白的方法,该方法包括以下步骤:用如上定义的第一aav载体和第二aav载体转导靶细胞,使得功能性abca4蛋白质在靶细胞中表达。
在另一方面,本发明提供了aav载体,其包含含有abca4cds的5'端部分的核酸序列,其中abca4cds的5'端部分由对应于seqidno:1的核苷酸105至3805的连续核苷酸序列组成。在一个实施方案中,该aav载体包含seqidno:9的核酸序列。在一个实施方案中,abca4cds的5'端部分由seqidno:1的核苷酸105至3805组成。在一个实施方案中,abca4cds的5'端部分由seqidno:2的核苷酸105至3805组成。
在另一方面,本发明提供了aav载体,其包含含有abca4cds的3'端部分的核酸序列,其中abca4cds的3'端部分由对应于seqidno:1的核苷酸3598至6926的连续核苷酸序列组成。在一个实施方案中,该aav载体包含seqidno:10的核酸序列。在一个实施方案中,abca4cds的3'端部分由seqidno:1的核苷酸3598至6926组成。在一个实施方案中,abca4cds的3'端部分由seqidno:2的核苷酸3598至6926组成。
另一方面,本发明提供了包含如上定义的第一核酸序列的核酸。
另一方面,本发明提供了包含如上定义的第二核酸序列的核酸。
本发明还提供了包含seqidno:9的核酸序列的核酸,和包含seqidno:10的核酸序列的核酸。
在另一方面,本发明提供了试剂盒,其包含如上所述的aav载体系统,或如上所述的上游aav载体和下游aav载体。
本发明还提供了试剂盒,其包含含有第一核酸序列的核酸和含有第二核酸序列的核酸,如上所述,或含有seqidno:9的核酸序列的核酸和包含seqidno:10的核酸序列的核酸,如上所述。
在另一方面,本发明提供药物组合物,其包含如上所述的aav载体系统和药学上可接受的赋形剂。
在又一方面,本发明提供如上所述的aav载体系统,如上所述的试剂盒,或如上所述的药物组合物,其用于预防或治疗以视网膜细胞降解为特征的疾病;优选用于预防或治疗斯塔加特病。
另一方面,本发明提供了预防或治疗以视网膜细胞降解为特征的疾病,例如斯塔加特病的方法,其包括向有此需要的受试者施用有效量的如上所述的aav载体系统,如上所述的试剂盒,或如上所述的药物组合物。
另一方面,本发明提供了用于在靶细胞中表达人abca4蛋白的aav载体系统,该aav载体系统包含含有第一核酸序列的第一aav载体和含有第二核酸序列的第二aav载体;其中第一核酸序列包含abca4编码序列(cds)的5'端部分,第二核酸序列包含abca4cds的3'端部分,并且5'端部分和3'端部分一起包含整个abca4cds;其中第一核酸序列包含与seqidno:1的核苷酸105至3597具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列;其中第二核酸序列包含与seqidno:1的核苷酸3806至6926具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列;其中第一核酸序列和第二核酸序列各自包含与另一个序列重叠的区域;其中序列重叠区域包含与seqidno:1的核苷酸3598至3805具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的核酸序列的至少约20个连续核苷酸。
另一方面,本发明提供了用于在靶细胞中表达人abca4蛋白的aav载体系统,该aav载体系统包含含有第一核酸序列的第一aav载体和含有第二核酸序列的第二aav载体,其中第一核酸序列包含abca4编码序列(cds)的5'端部分,第二核酸序列包含abca4cds的3'端部分,并且5'端部分和3'端部分一起包含整个abca4cds;其中abca4cds的5'端部分由与seqidno:1的核苷酸105至3805具有至少90%(90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列组成,并且其中abca4cds的3'端部分由与seqidno:1的核苷酸3598至6926具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列组成。
另一方面,本发明提供了aav载体,其包含含有abca4cds的5'端部分的核酸序列,其中abca4cds的5'端部分由与seqidno:1的核苷酸105至3805具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列组成。
另一方面,本发明提供了aav载体,其包含含有abca4cds的3'端部分的核酸序列,其中abca4cds的3'端部分由与seqidno:1的核苷酸3598至6926具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列组成。
另一方面,本发明提供了用于在靶细胞中表达人abca4蛋白的aav载体系统,该aav载体系统包含含有第一核酸序列的第一aav载体和含有第二核酸序列的第二aav载体;其中第一核酸序列包含abca4编码序列(cds)的5'端部分,第二核酸序列包含abca4cds的3'端部分,并且5'端部分和3'端部分一起包含整个abca4cds;其中第一核酸序列包含与seqidno:2的核苷酸105至3597具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)的序列)的序列同一性的序列;其中第二核酸序列包含与seqidno:2的核苷酸3806至6926具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列;其中第一核酸序列和第二核酸序列各自包含与另一个序列重叠的区域;其中序列重叠区域包含与seqidno:2的核苷酸3598至3805具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的核酸序列的至少约20个连续核苷酸。
另一方面,本发明提供了用于在靶细胞中表达人abca4蛋白的aav载体系统,该aav载体系统包含含有第一核酸序列的第一aav载体和含有第二核酸序列的第二aav载体,其中第一核酸序列包含abca4编码序列(cds)的5'端部分,第二核酸序列包含abca4cds的3'端部分,并且5'端部分和3'端部分一起包含整个abca4cds;其中abca4cds的5'端部分由与seqidno:2的核苷酸105至3805具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列组成,并且其中abca4cds的3'端部分由与seqidno:2的核苷酸3598至6926具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列组成。
另一方面,本发明提供了aav载体,其包含含有abca4cds的5'端部分的核酸序列,其中abca4cds的5'端部分由与seqidno:2的核苷酸105至3805具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列组成。
另一方面,本发明提供了aav载体,其包含含有abca4cds的3'端部分的核酸序列,其中abca4cds的3'端部分由与seqidno:2的核苷酸3598至6926具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8,99.9或100%)序列同一性的序列组成。
本发明还提供了核酸,其包含与seqidno:9具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的核酸序列和与seqidno:10具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的核酸序列。
附图简述
图1.组合形成完整abca4转基因的上游和下游转基因结构。
图2.用具有(5'c)和没有(c)额外的utr序列的双重载体变体c注射后6周abca4-/-视网膜中的abca4蛋白检测。单位表示相对于未注射的ko样品的倍数增加。误差棒代表sem。单因素anova,tukey事后,p=**0.009。
图3.包含在构成重叠变体a,b,c,d,e,f和x的上游和下游转基因中的abca4cds的表示。(a)在体外和(b)体内用不同重叠区载体变体转导后的abca4蛋白检测。单位表示相对于未处理的样品的倍数增加(-=未处理的hek293t细胞;ko=未注射的abca4-/-视网膜)。误差棒表示sem。单因素anova,tukey事后分析揭示在体外,双重载体变体b和c比所有其他样品产生显著更多的abca4蛋白,但b和c之间没有显著差异。在体内,双重载体变体c比所有其他变体(b除外)产生显著更多的abca4蛋白。
图4.(a)在用未组合的下游载体处理的hek293t细胞中可检测的截短的abca4蛋白变体;(b)在注射双重载体5'b或5'c的abca4-/-视网膜样品中检测的截短的和全长的abca4蛋白;(c)表呈现通过经注射的视网膜的western印迹检测的总abca4蛋白群体中存在的全长abca4的百分比,(d)在转录物和蛋白质水平上通过经重叠c双重载体变体注射的视网膜和经重叠b双重载体变体注射的视网膜之间的abca4表达的倍数变化的差异。误差棒表示sem。
图5.a)在框内aug密码子之前具有框外aug密码子的重叠c序列;b)重叠区c和b的预测的二级结构。
图6.注射后6周收获的abca4-/-视网膜中感光细胞的外部区段中abca4(绿色)的染色。hcn1(红色)染色标记内部区段。还包括wt视网膜中天然abca4定位的染色实例以及未注射的abca4-/-视网膜中染色缺乏的证据。
图7.野生型(wt)和abca4-/-眼中的abca4/abca4(绿色)和hcn1(红色)染色。
图8.野生型(wt)和abca4-/-眼中的感光细胞外部区段中的abca4/abca4(绿色)和视紫红质(红色)染色。
图9.野生型(wt)和abca4-/-眼中的abca4/abca4(绿色)和视紫红质(红色)顶端rpe染色。
图10.示例重叠载体图。
图11.正常的类视黄醇循环显示在图的左手侧。右侧显示了在abca4缺陷小鼠和人中以增强程度发生的二类视黄醇(bisretinoids)和a2e的产生。在abca4-/-小鼠中评估图中右手侧框中突出显示的分子。(实施例6)
图12.对于接受假(sham)注射或治疗注射的13只abca4-/-小鼠,配对眼中的二类视黄醇和a2e同种型的水平。在假性和治疗眼之间观察到二类视黄醇和a2e水平的显著降低(p=0.017,f=5.849)。此外,对于所有二类视黄醇和a2e测量,在双重载体处理的眼中观察到最低水平。(实施例6)
序列表
seqidno:1人abca4核酸序列。seqidno:1与ncbi参考序列nm_000350.2相同。
seqidno:2人abca4核酸序列变体。seqidno:2与seqidno:1相同,除了以下突变:核苷酸1640g>t,核苷酸5279g>a,核苷酸6173t>c。
seqidno:3示例性上游载体序列,包含itr、启动子、cds、itr。
seqidno:4示例性下游载体序列,包含itr、cds、转录后响应元件、聚腺苷酸化序列、itr。
seqidno:5grk1启动子序列。
seqidno:6utr序列。
seqidno:7土拨鼠肝炎病毒转录后响应元件。
seqidno:8牛生长激素聚腺苷酸化序列。
seqidno:9示例性部分上游载体序列,包含启动子,cds。
seqidno:10示例性部分下游载体序列,包含cds、转录后响应元件、聚腺苷酸化序列。
发明详述
病毒载体源自野生型病毒,其使用重组核酸技术修饰以将非天然核酸序列(或转基因)掺入病毒基因组中。病毒靶向和感染特定细胞的能力用于将转基因递送到靶细胞中,导致基因的表达和编码的基因产物的产生。
本发明涉及源自腺伴随病毒(aav)的载体。
在第一方面,本发明提供了用于在靶细胞中表达人abca4蛋白的腺伴随病毒(aav)载体系统,该aav载体系统包含含有第一核酸序列的第一aav载体和含有第二核酸序列的第二aav载体;其中第一核酸序列包含abca4编码序列(cds)的5'端部分,第二核酸序列包含abca4cds的3'端部分,并且5'端部分和3'端部分一起包含整个abca4cds;其中第一核酸序列包含对应于seqidno:1的核苷酸105至3597的连续核苷酸序列;其中第二核酸序列包含对应于seqidno:1的核苷酸3806至6926的连续核苷酸序列;其中第一核酸序列和第二核酸序列各自包含与另一个序列重叠的区域;并且其中序列重叠区域包含对应于seqidno:1的核苷酸3598至3805的核酸序列的至少约20个连续核苷酸。
aav载体通常是本领域公知的,并且技术人员将熟悉适合于根据本领域的公知常识制备它们的一般技术。技术人员的知识将包括适合于将感兴趣的核酸序列掺入aav载体的基因组中的技术。
术语“aav载体系统”用于包括第一和第二aav载体旨在以互补方式一起工作的事实。
本发明的aav载体系统的第一和第二aav载体一起编码完整的abca4转基因。因此,编码的abca4转基因在靶细胞中的表达需要用第一(上游)和第二(下游)载体两者转导靶细胞。
本发明的aav载体系统的aav载体通常是aav颗粒(也称为病毒体)的形式。aav颗粒包含围绕作为aav基因组的核酸核心的蛋白质外壳(壳体)。本发明还包括编码本文所述aav载体系统的aav载体基因组的核酸序列。
seqidno:1是对应于ncbi参考序列nm_000350.2的人abca4核酸序列。seqidno:1与ncbi参考序列nm_000350.2相同。abca4编码序列跨越seqidno:1的核苷酸105至6926。
第一aav载体包含第一核酸序列,其包含abca4cds的5'端部分。abca4cds的5'端部分是abca4cd的一部分,该部分包括其5'端。因为它只是cds的一部分,所以abca4cds的5'端部分不是全长(即不是完整的)abca4cds。因此,第一核酸序列(和因此第一aav载体)不包含全长abca4cds。
第二aav载体包含第二核酸序列,其包含abca4cds的3'端部分。abca4cds的3'端部分是abca4cds的一部分,该部分包括其3'端。因为它只是cds的一部分,所以abca4cds的3'端部分不是全长(即不是整个)abca4cds。因此,第二核酸序列(和因此第二aav载体)不包含全长abca4cds。
5'端部分和3'端部分一起包含整个abca4cds(具有序列重叠的区域,如下所述)。因此,全长abca4cds包含在本发明的aav载体系统中,分成第一和第二aav载体,并且可以在用第一和第二aav载体转导靶细胞后在靶细胞中再装配。
如上所述的第一核酸序列包含对应于seqidno:1的核苷酸105至3597的连续核苷酸序列。abca4cds开始于seqidno:1的核苷酸105。
如上所述的第二核酸序列包含对应于seqidno:1的核苷酸3806至6926的连续核苷酸序列。
为了包含整个abca4cds,第一和第二核酸序列各自进一步包含对应于seqidno:1的核苷酸3598至3805的abca4cds的至少一部分,使得当第一和第二核酸序列对齐时包括对应于seqidno:1的核苷酸3598至3805的abca4cds。因此,当对齐时,第一和第二核酸序列一起包含整个abca4cds。
此外,第一和第二核酸序列包含序列重叠区域,允许重构建整个abca4cds,作为用本发明的第一和第二aav载体转导的靶细胞内的全长转基因的一部分。
当第一和第二核酸序列彼此对齐时,第一核酸序列的3'端的区域与第二核酸序列的5'端的相应区域重叠。因此,第一和第二核酸序列都包含形成序列重叠区域的abca4cds的一部分。
本发明人发现当第一和第二核酸序列之间的重叠区域包含对应于seqidno:1的核苷酸3598至3805的abca4cds的部分的至少约20个连续核苷酸时,获得特别有利的结果。。
重叠区域可以在所述20个连续核苷酸的上游和/或下游延伸。因此,重叠区域的长度可以超过20个核苷酸。
重叠区域可以包含对应于seqidno:1的核苷酸3598的位置上游的核苷酸。或者/另外,重叠区域可以包含对应于seqidno:1的核苷酸3805的位置下游的核苷酸。
或者,核酸序列重叠区域可以包含在对应于seqidno:1的核苷酸3598至3805的abca4cds部分内。
因此,在一个实施方案中,核酸序列重叠区域的长度为20至550个核苷酸;优选长度为50至250个核苷酸;优选长度为175至225个核苷酸;优选长度为195至215个核苷酸。
在一个实施方案中,核酸序列重叠区域包含对应于seqidno:1的核苷酸3598至3805的核酸序列的至少约50个连续核苷酸;优选至少约75个连续核苷酸;优选至少约100个连续核苷酸;优选至少约150个连续核苷酸;优选至少约200个连续核苷酸;优选所有208个连续核苷酸。
在一个优选的实施方案中,核酸序列重叠区域开始于对应于seqidno:1的核苷酸3598的核苷酸。术语“开始”是指核酸序列重叠区域沿5'至3'方向运行,从对应于seqidno:1的核苷酸3598的核苷酸开始。因此,在优选的实施方案中,核酸序列重叠区域的最5'核苷酸对应于seqidno:1的核苷酸3598。
在进一步优选的实施方案中,第一核酸序列和第二核酸序列载体之间的核酸序列重叠区域对应于seqidno:1的核苷酸3598至3805。
本发明的另一个优点是包含如上所述的核酸序列区域重叠的双重aav载体的构建可以有利地降低不想要的截短的abca4肽的翻译水平。
当从仅从源自下游载体的mrna转录物开始翻译时,双重aav载体系统中可能出现截短的abca4肽的翻译问题。在这方面,aavitr如aav25'itr可以具有启动子活性;这与wpre的下游载体和bgh聚腺苷酸化序列(如下所述)的存在一起可导致从未重组的下游载体产生稳定的mrna转录物。野生型abca4cds在其下游部分携带多个框内aug密码子,其不能替代其他密码子而不改变氨基酸序列。这产生从稳定转录物发生翻译的可能性,导致截短的abca4肽的存在。
在本发明的优选实施方案中,其中核酸序列重叠区域开始于对应于seqidno:1的核苷酸3598的核苷酸,重叠区的起始序列包括良好背景(就潜在的kozak共有序列而言)中的框外aug(起始)密码子,之后是较弱背景中的框内aug密码子,以促进翻译机制启动来自框外位点的未重组的仅下游转录物的翻译。在本发明特别优选的实施方案中,在框内aug之前的各种环境中总共有四个框外aug密码子。所有这些都将转化为10个氨基酸内的终止密码子,从而阻止不想要的截短的abca4肽的翻译。
优选地,第一核酸序列包含对应于seqidno:1的核苷酸105至3805的连续核苷酸序列,并且第二核酸序列包含对应于seqidno:1的核苷酸3598至6926的连续核苷酸序列,因此,包括如上所述的特别优选的核酸序列重叠区域。
因此,在优选的实施方案中,abca4cds的5'端部分由对应于seqidno:1的核苷酸105至3805的连续核苷酸序列组成,并且abca4cds的3'端部分由对应于seqidno:1的核苷酸3598至6926的连续核苷酸序列组成。
在进一步优选的实施方案中,abca4cds的5'端部分由seqidno:1的核苷酸105至3805组成,abca4cds的3'端部分由seqidno:1的核苷酸3598至6926组成。
因此,在优选的实施方案中,本发明提供了用于在靶细胞中表达人abca4蛋白的aav载体系统,aav载体系统包含含有第一核酸序列的第一aav载体和含有第二核酸的第二aav载体。序列,其中第一核酸序列包含abca4编码序列(cds)的5'端部分,第二核酸序列包含abca4cds的3'端部分,以及5'端部分和3'端部分一起包含整个abca4cds;其中abca4cds的5'端部分由对应于seqidno:1的核苷酸105至3805的连续核苷酸序列组成,并且其中abca4cds的3'端部分由对应于seqidno:1的核苷酸3598至6926的连续核苷酸序列组成。
在进一步优选的实施方案中,本发明提供了用于在靶细胞中表达人abca4蛋白的aav载体系统,该aav载体系统包含含有第一核酸序列的第一aav载体和含有第二核酸序列的第二aav载体。其中第一核酸序列包含abca4编码序列(cds)的5'端部分,第二核酸序列包含abca4cds的3'端部分,以及5'端部分和3'端部分一起包含整个abca4cds;其中abca4cds的5'端部分由seqidno:1的核苷酸105至3805组成,并且其中abca4cds的3'端部分由seqidno:1的核苷酸3598至6926组成。
根据术语“由......组成”,在abca4cds的5'端部分和abca4cds的3'端部分由如上所述的连续核苷酸的特定序列组成的实施方案中,则第一核酸序列和第二核酸序列各自不包含任何另外的abca4cds。
通常,第一aav载体和第二aav载体中的每一个包含5'和3'反向末端重复(itr)。
通常,aav的天然衍生的血清型、隔离物或进化枝的aav基因组包含至少一个反向末端重复序列(itr)。itr序列以顺式作用以提供功能性复制起点并允许载体整合和从细胞基因组切除。认为aavitr有助于在aav感染的细胞的细胞核中形成多联体,例如在通过宿主细胞dna聚合酶的作用将单链载体dna转化为双链dna之后。此类附加体多联体的形成可以用来在宿主细胞的生命期间保护载体构建体,从而允许转基因在体内延长表达。
因此,在一个实施方案中,itr是aavitr(即源自aav基因组中发现的itr序列的itr序列)。
本发明的aav载体系统的第一和第二aav载体一起包含在通过这两种载体转导后在靶细胞中再装配的全功能abca4转基因所必需的所有组分。技术人员将意识到通常用于确保病毒载体转导细胞中转基因表达的其他基因组元件。这些可以称为表达控制序列。因此,本发明的aav病毒载体系统的aav载体通常包含与编码abca4转基因的核苷酸序列可操作地连接的表达控制序列(例如包含启动子序列)。
5'表达控制序列组分适当地位于病毒载体系统的第一(“上游”)aav载体中,而3'表达控制序列适当地位于病毒载体系统的第二(“下游”)aav载体中。
因此,第一aav载体通常包含与abca4cds的5'端部分可操作连接的启动子。启动子本质上需要位于abca4cds的5',因此其位于第一aav载体中。
可以使用任何合适的启动子,本领域技术人员可以容易地选择它们。启动子序列可以是组成型活性的(即在任何宿主细胞背景中可操作),或者备选可以仅在特定宿主细胞环境中有活性,因此允许转基因在特定细胞类型中的靶向表达(例如组织特异性启动子)。启动子可以响应于另一因子,例如宿主细胞中存在的因子的存在而显示诱导型表达。无论如何,在施用载体进行治疗的情况下,优选启动子应当在靶细胞背景中起作用。
在一些实施方案中,优选启动子显示视网膜细胞特异性表达,以允许转基因仅在视网膜细胞群中表达。因此,来自启动子的表达可以是视网膜细胞特异性的,例如仅限于神经感觉视网膜和视网膜色素上皮细胞。
适用于本发明的示例性启动子是鸡β-肌动蛋白(cba)启动子,任选地与巨细胞病毒(cmv)增强子元件组合。用于本发明的另一个示例性启动子是杂合cba/cag启动子,例如rave表达盒(genedetect.com)中使用的启动子。
基于诱导视网膜特异性基因表达的人序列的启动子的实例包括用于视杆和视锥的视紫红质激酶,仅用于视锥的pr2.1和用于视网膜色素上皮的rpe65。
本发明人发现使用grk1启动子可以实现特别有利的基因表达水平。因此,在优选的实施方案中,启动子是人视紫红质激酶(grk1)启动子。
本发明的grk1启动子序列长度可以是199个核苷酸,并且包含grk1基因的核苷酸-112至+87。在优选的实施方案中,启动子包含seqidno:5的核酸序列或其变体,其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4or99.5,99.6,99.7,99.8或99.9%)序列同一性。
第一aav载体可包含位于启动子和上游abca4核酸序列(即5'utr)之间的非翻译区(utr)。
可以使用任何合适的utr序列,技术人员可以容易地进行其选择。
utr可包含以下元件中的一种或多种:原鸡(gallusgallus)β肌动蛋白(cba)内含子1片段、穴兔(oryctolaguscuniculus)β珠蛋白(rbg)内含子2片段和穴兔β珠蛋白外显子3片段。
utr可包含kozak共有序列。可以使用任何合适的kozak共有序列,本领域技术人员可以容易进行其选择。
在优选的实施方案中,utr包含seqidno:6中指定的核酸序列或其变体,其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%))序列同一性。
seqidno:6的utr为186个核苷酸的长度并且包括原鸡β肌动蛋白(cba)内含子1片段(具有预测的剪接供体位点),穴兔β珠蛋白(rbg)内含子2片段(包括预测的分支点和剪接受体位点)和穴兔β珠蛋白外显子3片段,之后直接是kakak共有序列。
令人惊讶地,本发明人发现如上所述的utr的存在,特别是如seqidno:6或其具有至少90%序列同一性的变体中所述的utr序列有利地增加来自abca4转基因的翻译产率。
本发明的aav载体系统的第二(“下游”)aav载体可包含转录后响应元件(也称为转录后调节元件)或pre。可以使用任何合适的pre,本领域技术人员可以容易地进行其选择。合适的pre的存在可以增强abca4转基因的表达。
在优选的实施方案中,pre是土拨鼠肝炎病毒pre(wpre)。在特别优选的实施方案中,wpre具有seqidno:7中规定的序列或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。
第二aav载体可包含位于下游abca4核酸序列3'的聚腺苷酸化序列。可以使用任何合适的聚腺苷酸化序列,本领域技术人员可以容易地进行其选择。
在优选的实施方案中,聚腺苷酸化序列是牛生长激素(bgh)聚腺苷酸化序列。在特别优选的实施方案中,bgh多聚腺苷酸化序列具有seqidno:8中规定的序列或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。
在本发明的aav载体系统的优选实施方案中,第一aav载体包含seqidno:9的核酸序列,第二aav载体包含seqidno:10的核酸序列。
在本发明的aav载体系统的另一个优选实施方案中,第一aav载体包含seqidno:3的核酸序列,第二aav载体包含seqidno:4的核酸序列。
本发明的aav载体系统适用于在靶细胞中表达人abca4蛋白。
因此,在一个方面,本发明提供了在靶细胞中表达人abca4蛋白的方法,该方法包括以下步骤:用如上所述的第一aav载体和第二aav载体转导靶细胞,使得在靶细胞中表达功能性abca4蛋白。
人abca4蛋白的表达需要用第一aav载体和第二aav载体两者转导靶细胞;但是,顺序并不重要。因此,可以以任何顺序(第一aav载体,然后是第二aav载体,或第二aav载体,然后是第一aav载体)或同时用第一aav载体和第二aav载体转导靶细胞。
用aav载体转导靶细胞的方法是本领域已知的并且是技术人员熟悉的。
靶细胞优选是眼细胞,优选视网膜细胞(例如神经元感光细胞,视杆细胞,视锥细胞或视网膜色素上皮细胞)。
本发明还提供了如上定义的第一aav载体。还提供了如上定义的第二aav载体。
另一方面,本发明提供aav载体,其包含含有abca4cds的5'端部分的核酸序列,其中abca4cds的5'端部分由对应于seqidno:1的核苷酸105至3805的连续核苷酸序列组成。因此,该aav载体不包含超出所述连续核苷酸序列的任何另外的abca4cds。
第一aav载体可包含5'和3'itr,优选aavitr;启动子,优选grk1启动子;和/或utr;所述元件如上文关于本发明的aav载体系统所述。
在一个实施方案中,第一aav载体包含seqidno:9的核酸序列。
在一个实施方案中,第一aav载体包含seqidno:9的核酸序列或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。
在一个实施方案中,第一aav载体包含seqidno:9的核酸序列,条件是对应于seqidno:1的核苷酸1640的位置处的核苷酸是g,或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。。
在一个实施方案中,第一aav载体包含seqidno:3的核酸序列。
在一个实施方案中,第一aav载体包含seqidno:3的核酸序列或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。
在一个实施方案中,第一aav载体包含seqidno:3的核酸序列,条件是对应于seqidno:1的核苷酸1640的位置处的核苷酸是g,或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。
在另一个方面,本发明提供aav载体,其包含含有abca4cds的3'端部的核酸序列,其中abca4cds的3'端部分由对应于seqidno:1的核苷酸3598到6926的连续核苷酸序列组成。因此,该aav载体不包含超出所述连续核苷酸序列的任何另外的abca4cds。
第二载体可包含5'和3'itr,优选aavitr;pre,优选wpre;和/或聚腺苷酸化序列,优选abgh聚腺苷酸化序列;所述元件如上文关于本发明的aav载体系统所述。
在一个实施方案中,第二aav载体包含seqidno:10的核酸序列。
在一个实施方案中,第二aav载体包含seqidno:10的核酸序列或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。
在一个实施方案中,第二aav载体包含seqidno:10的核酸序列,条件是对应于seqidno:1的核苷酸5279的位置处的核苷酸是g,并且对应于seqidno:1的核苷酸6173的位置处的核苷酸是t,或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。
在一个实施方案中,第二aav载体包含seqidno:4的核酸序列。
在一个实施方案中,第二aav载体包含seqidno:4的核酸序列或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。
在一个实施方案中,第二aav载体包含seqidno:4的核酸序列,条件是对应于seqidno:1的核苷酸5279的位置处的核苷酸是g,并且对应于seqidno:1的核苷酸6173的位置处的核苷酸是t,或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。
本发明还提供了包含上述核酸序列的核酸。
本发明还提供了可源自如上所述的aav载体的aav载体基因组。
还提供了包含如上所述的第一aav载体和第二aav载体的试剂盒。aav载体可以以aav颗粒的形式提供在试剂盒中。
还提供了试剂盒,其包含含有第一核酸序列的核酸和含有第二核酸序列的核酸,如上所述。
本发明还提供了药物组合物,其包含如上所述的aav载体系统和药学上可接受的赋形剂。
本发明的aav载体系统,本发明的试剂盒和本发明的药物组合物可用于基因疗法。例如,本发明的aav载体系统,本发明的试剂盒和本发明的药物组合物可用于预防或治疗疾病。
使用本发明预防或治疗疾病需要对靶细胞施用第一种aav载体和第二种aav载体,以提供abca4蛋白的表达。
优选地,待预防或治疗的疾病的特征在于视网膜细胞的降解。此类疾病的例子是斯塔加特病。因此,本发明的第一和第二aav载体可以施用于患者的眼,优选施用于眼的视网膜组织,从而表达功能性abca4蛋白质以补偿疾病中存在的突变。
本发明的aav载体可以配制成药物组合物或药物。
本发明的示例性aav载体系统包括第一aav载体和第二aav载体;其中第一aav载体包含seqidno:9的核酸序列;第二aav载体包含seqidno:10的核酸序列。
本发明的另一个示例性aav载体系统包括第一aav载体和第二aav载体;其中第一aav载体包含seqidno:9的核酸序列或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体;第二aav载体包含seqidno:10的核酸序列或其具有至少90%(例如至少90,95,96,97,98,99,99.1,99.2,99.3,99.4,99.5,99.6,99.7,99.8或99.9%)序列同一性的变体。
还可以进行本发明,其中seqidno:2用作参考序列代替seqidno:1。
在这方面,seqidno:2与seqidno:1相同,除了以下突变:核苷酸1640g>t,核苷酸5279g>a,核苷酸6173t>c。这些突变不改变编码的氨基酸序列,因此由seqidno:2编码的abca4蛋白与由seqidno:1编码的abca4蛋白相同。
因此,在本发明的备选实施方案中,上文对seqidno:1的引用可以用对seqidno:2的引用替换。
序列对应
如本文所用,当就给定核酸序列中的核苷酸而言使用时,术语“对应于”通过参考特定的seqidno限定核苷酸位置。然而,当进行此类参考时,应理解本发明不限于所提及的特定seqidno中列出的确切序列,而且包括其变体序列。对应于seqidno:1中的核苷酸位置的核苷酸可以通过序列比对容易地确定,例如通过使用序列比对程序,其使用是本领域公知的。在这方面,技术人员将容易理解,遗传密码的简并性质意味着可以存在编码给定多肽的核酸序列的变异而不改变编码的多肽的氨基酸序列。因此,考虑鉴定其他abca4编码序列中的核苷酸位置(即,技术人员将考虑的位置处的核苷酸对应于例如seqidno:1中鉴定的位置)。
举例来说,seqidno:2与seqidno:1相同,除了三种特异性突变,如上所述(这三种突变不改变编码的abca4多肽的氨基酸序列)。在这种情况下因此,技术人员将认为seqidno:2中的给定核苷酸位置对应于seqidno:1中的等同编号的核苷酸位置。
aav载体
本发明的病毒载体是腺伴随病毒(aav)载体。本发明的aav载体可以是成熟aav颗粒或病毒体的形式,即由aav蛋白壳体包围的核酸。
aav载体可包含aav基因组或其衍生物。
aav基因组是多核苷酸序列,其编码产生aav颗粒所需的功能。这些功能包括在宿主细胞中以aav的复制和包装循环运行的那些功能,包括将aav基因组壳体化成aav颗粒。天然存在的aav是复制缺陷的并且依赖于反式提供辅助功能以完成复制和包装循环。因此,本发明的载体的aav基因组通常是复制缺陷的。
aav基因组可以是单链形式,可以是正义或负义,或者是双链形式。使用双链形式允许绕过靶细胞中的dna复制步骤,因此可以加速转基因表达。
本发明的载体的aav基因组通常是单链形式。
aav基因组可以来自aav的任何天然来源的血清型,隔离群或进化枝。因此,aav基因组可以是天然存在的aav的全基因组。如本领域技术人员已知的,可以根据各种生物系统对天然存在的aav进行分类。
通常,aav就其血清型而言被提及。血清型对应于aav的变体亚种,由于其壳体表面抗原的表达谱,其具有独特的反应性,所述反应性可用于将其与其他变体亚种区分开。通常,具有特定aav血清型的病毒不与对任何其他aav血清型特异型的中和抗体有效交叉反应。
aav血清型包括aav1,aav2,aav3,aav4,aav5,aav6,aav7,aav8,aav9,aav10和aav11,以及最近从灵长类脑中鉴定的重组血清型,例如rec2和rec3。任何这些aav血清型都可用于本发明。因此,在本发明的一个实施方案中,本发明的aav载体可以源自aav1,aav2,aav3,aav4,aav5,aav6,aav7,aav8,aav9,aav10,aav11,rec2或rec3aav。
可以在choietal.(2005)curr.genether.5:299-310andwuetal.(2006)moleculartherapy14:316-27中找到aav血清型的综述。aav基因组或包括itr序列,rep或cap基因的aav基因组元件的序列可以源自aav全基因组序列的以下登录号:腺伴随病毒1nc_002077,af063497;腺伴随病毒2nc_001401;腺伴随病毒3nc_001729;腺伴随病毒3bnc_001863;腺伴随病毒4nc_001829;腺伴随病毒5y18065,af085716;腺伴随病毒6nc_001862;禽aavatccvr-865ay186198,ay629583,nc_004828;禽aav株da-1nc_006263,ay629583;牛aavnc_005889,ay388617。
aav也可以根据进化枝或克隆来提及。这指天然衍生的aav的系统发育关系,并且通常指aav的系统发育组,其可以追溯到共同的祖先,并且包括其所有后代。另外,aav可以根据特定隔离群,即天然存在的特定aav的遗传隔离群来提及。术语遗传隔离群描述了aav群体,其与其他天然存在的aav经历有限的遗传混合,从而在遗传水平上限定可识别独特群体。
技术人员可以基于其公知常识选择用于本发明的合适的aav血清型、进化枝、克隆或隔离群。例如,已经显示aav5壳体有效地转导灵长类视锥光感受器,如通过成功校正遗传性色觉缺陷所证明的(mancusoetal.(2009)nature461:784-7)。
aav血清型决定了aav病毒的感染(或趋向性)的组织特异性。因此,用于根据本发明对患者施用的aav的优选aav血清型是对眼内靶细胞具有天然向性或高感染效率的那些。在一个实施方案中,用于本发明的aav血清型是感染神经感觉视网膜,视网膜色素上皮细胞和/或脉络膜细胞的那些血清型。
通常,aav的天然衍生的血清型、隔离群或进化枝的aav基因组包含至少一个反向末端重复序列(itr)。itr序列以顺式起作用以提供功能性复制起点,并允许载体整合和从细胞基因组切除。aav基因组通常还包含包装基因,例如rep和/或cap基因,其编码aav颗粒的包装功能。该rep基因编码下列一种或多种蛋白质:rep78,rep68,rep52和rep40或其变体。cap基因编码下列一种或多种壳体蛋白,例如vp1,vp2和vp3或其变体。这些蛋白质构成aav颗粒的壳体。壳体变体如下讨论。
启动子将与每个包装基因可操作地连接。此类启动子的具体实例包括p5、p19和p40启动子(laughlinetal.(1979)proc.natl.acad.sci.usa76:5567-5571)。例如,p5和p19启动子通常用于表达rep基因,而p40启动子通常用于表达cap基因。
因此,在本发明的载体中使用的aav基因组可以是天然存在的aav的全基因组。例如,包含完整aav基因组的载体可用于体外制备aav载体。然而,虽然此类载体原则上可以对患者施用,但这在实践中很少进行。优选地,aav基因组将被衍生化以用于对患者施用。此类衍生化是本领域的标准,本发明包括aav基因组的任何已知衍生物的用途,以及可以通过应用本领域已知技术产生的衍生物。在couraandnardi(2007)virologyjournal4:99和如上引用的choi等和wu等的综述中综述了aav基因组和aav壳体的衍生化。
aav基因组的衍生物包括aav基因组的任何截短或修饰形式,其允许在体内从本发明的载体表达转基因。通常,可以显著截短aav基因组以包括最小的病毒序列但仍保留上述功能。出于安全原因,这是优选的,以降低载体与野生型病毒重组的风险,并且还避免提供靶细胞中病毒基因蛋白的存在而引发细胞免疫应答。
通常,aav基因组的衍生物将包括至少一个反向末端重复序列(itr),优选超过一个itr,例如两个itr或更多。一种或多种itr可以源自具有不同血清型的aav基因组,或者可以是嵌合或突变体itr。优选的突变体itr是具有trs(末端分辨位点)缺失的突变体。该缺失允许基因组的连续复制以产生包含编码和互补序列两者的单链基因组,即自身互补的aav基因组。这允许绕过靶细胞中的dna复制,因此能够加速转基因表达。
包含一个或多个itr是优选的,以帮助在宿主细胞的细胞核中本发明的载体的多联体形成,例如在通过宿主细胞dna聚合酶的作用将单链载体dna转化为双链dna后。此类附加型多联体的形成在宿主细胞的生命期间保护载体构建体,从而允许转基因在体内延长表达。
在优选的实施方案中,itr元件是衍生物中从天然aav基因组保留的唯一序列。因此,衍生物优选不包括天然基因组的rep和/或cap基因以及天然基因组的任何其他序列。由于上述原因,这是优选的,并且还降低了载体整合到宿主细胞基因组中的可能性。另外,除了转基因之外,减小aav基因组的大小允许在载体内掺入其他序列元件(例如调节元件)的灵活性增加。
因此,可以在本发明的衍生物中除去以下部分:一个反向末端重复(itr)、复制(rep)和壳体(cap)基因。然而,在一些实施方案中,衍生物可另外包括一种或多种rep和或cap基因或aav基因组的其他病毒序列。天然存在的aav在人19号染色体上的特定位点以高频率整合,并且显示可忽略的随机整合频率,使得在治疗背景中可以容忍载体中整合能力的保留。
当衍生物包含壳体蛋白,即vp1,vp2和/或vp3时,衍生物可以是一种或多种天然存在的aav的嵌合,改组或壳体修饰的衍生物。特别地,本发明包括在同一载体(即假型化载体)中提供来自aav的不同血清型、进化枝、克隆或隔离群的壳体蛋白序列。
通常选择嵌合,改组或壳体修饰的衍生物以为病毒载体提供一种或多种期望的功能。因此,与包含天然存在的aav基因组,诸如aav的aav基因组相比,这些衍生物可显示增加的基因递送效率,降低的免疫原性(体液或细胞),改变的向性范围和/或改善的特定细胞类型的靶向。通过细胞表面处改善的受体或共受体结合,改善的内化,细胞内和对细胞核的改善的运输,改善的病毒颗粒的脱壳和改善的单链基因组转化成双链形式,可以实现增加的基因递送的效率。增加的效率还可以涉及特定细胞群的改变的向性范围或靶向,使得载体剂量未通过施用于不需要它的组织而稀释。
嵌合壳体蛋白包括通过天然存在的aav血清型的两种或更多种壳体编码序列之间的重组产生的那些。这可以例如通过标志物拯救方法进行,其中一种血清型的非感染性壳体序列与不同血清型的壳体序列共转染,并且定向选择用于选择具有期望特性的壳体序列。可以通过细胞内的同源重组来改变不同血清型的壳体序列以产生新的嵌合壳体蛋白。
嵌合壳体蛋白还包括通过工程化改造壳体蛋白序列以在两种或更多种壳体蛋白之间,例如在两种或更多种不同血清型的壳体蛋白之间转移特定壳体蛋白域,表面环或特定氨基酸残基而产生的那些。
改组或嵌合壳体蛋白也可以通过dna改组或易错pcr产生。可以通过如下创建杂合aav壳体基因:随机片段化相关aav基因的序列,例如那些编码多种不同血清型的壳体蛋白的基因,然后在自引发聚合酶反应中再装配片段,这也可能导致序列同源性区域的交换。可以筛选通过改组几种血清型的壳体基因以这种方式创建的杂合aav基因文库,以鉴定具有期望功能的病毒克隆。类似地,易错pcr可用于随机突变aav壳体基因以创建多种变体文库,其然后可以针对期望的特性进行选择。
还可以对壳体基因的序列进行遗传修饰以引入相对于天然野生型序列的特定缺失,取代或插入。特别地,壳体基因可以通过在壳体编码序列的可读框内或在壳体编码序列的n-和/或c-末端插入无关蛋白质或肽的序列来修饰。
无关的蛋白质或肽可以有利地是充当特定细胞类型的配体的蛋白质或肽,从而赋予改善的与靶细胞的结合或改善载体靶向特定细胞群的特异性。无关蛋白质也可以是有助于纯化病毒颗粒作为生产过程的一部分的蛋白质,即表位或亲和标签。通常选择插入位点以便不干扰病毒颗粒的其他功能,例如,内化,病毒颗粒的运输。技术人员可以基于其公知常识来鉴定适合于插入的位点。在上面引用的choi等人中公开了特定的位点。
本发明还包括以与天然aav基因组不同的顺序和构型提供aav基因组的序列。本发明还包括用来自另一种病毒的序列或用来自超过一种病毒的序列组成的嵌合基因替换一种或多种aav序列或基因。此类嵌合基因可以由来自不同病毒种类的两种或更多种相关病毒蛋白的序列组成。
本发明的aav载体包括壳体转移形式,其中aav基因组或具有一种血清型itr的衍生物包装在不同血清型的壳体中。本发明的aav载体还包括嵌合(mosaic)形式,其中来自两种或更多种不同血清型的未修饰壳体蛋白的混合物构成病毒壳体。aav载体还可以包括带有吸附在壳体表面的配体的化学修饰形式。例如,此类配体可包括用于靶向特定细胞表面受体的抗体。
因此,例如,本发明的aav载体包括具有aav2基因组和aav2壳体蛋白(aav2/2)的那些,具有aav2基因组和aav5壳体蛋白(aav2/5)的那些以及具有aav2基因组和aav8壳体蛋白(aav2/8)的那些载体。
本发明的aav载体可包含突变体aav壳体蛋白。在一个实施方案中,本发明的aav载体包含突变体aav8壳体蛋白。优选地,突变体aav8壳体蛋白是aav8y733f壳体蛋白。
施用方法
本发明的病毒载体可以通过视网膜下,直接视网膜或玻璃体内注射对受试者的眼施用。
技术人员将熟悉并且能够进行个体视网膜下、直接视网膜或玻璃体内注射。
视网膜下注射
视网膜下注射注射到视网膜下空间,即神经感觉视网膜下方。在视网膜下注射期间,将注射的材料引导到感光细胞和视网膜色素上皮(rpe)层并在它们间创建空间。
当通过小视网膜切开术进行注射时,可创建视网膜脱离。由注射材料产生的视网膜的分离的突出层称为“泡”。
由视网膜下注射产生的孔必须足够小,使得注射的溶液在施用后不显著地回流到玻璃体腔中。当注射药物时,此类回流特别成问题,因为药物的作用将被引导远离靶区域。优选地,注射在神经感觉视网膜中创建自密封进入点,即一旦取出注射针,由针创建的孔重新密封,使得非常少或基本上没有注射材料通过孔释放。
为了促进该过程,专家视网膜下注射针是商品化的(例如dorc41gteflon视网膜下注射针,dutchophthalmicresearchcenterinternationalbv,zuidland,thenetherlands)。这些是设计用于进行视网膜下注射的针。
除非在注射期间发生对视网膜的损伤,并且只要使用足够小的针,基本上所有注射的材料仍然位于分离的神经感觉视网膜和局部视网膜脱离位置处的rpe之间(即不回流到玻璃体腔)。实际上,在短时间范围内泡的典型持久性表明注射材料通常很少逃逸到玻璃体内。当注射的材料被吸收时,泡可以在更长的时间范围内消散。
可以在手术前进行眼,特别是视网膜的可视化,例如使用光学相干断层摄影术。
两步视网膜下注射
通过使用两步法,可以以增加的准确性和安全性递送本发明的aav载体,其中通过视网膜下注射第一溶液创建局部视网膜脱离。第一溶液不包含载体。然后使用第二视网膜下注射将包含载体的药物递送到由第一视网膜下注射创建的泡的视网膜下液体中。因为递送药物的注射不用于分离视网膜,所以可以在该第二步中注射特定体积的溶液。
本发明的aav载体可以通过以下方式递送:
(a)通过视网膜下注射以对于至少部分脱离视网膜以形成视网膜下泡有效的量对受试者施用溶液;和
(b)通过视网膜下注射将药物组合物施用到由步骤(a)形成的泡中,其中药物包含载体。
在步骤(a)中注射以至少部分脱离视网膜的溶液体积可以是例如约10-1000μl,例如约50-1000,100-1000,250-1000,500-1000,10-500,50-500,100-500,250-500μl。体积可以是例如约10,50,100,200,300,400,500,600,700,800,900或1000μl。
在步骤(b)中注射的药物组合物的体积可以是例如约10-500μl,例如约50-500,100-500,200-500,300-500,400-500,50-250,100-250,200-250或50-150μl。体积可以是例如约10,50,100,150,200,250,300,350,400,450或500μl。优选地,步骤(b)中注射的药物组合物的体积为100μl。较大的体积可以增加伸展视网膜的风险,而较小的体积可能难以看出。
不包含药物的溶液(即步骤(a)的“第一溶液”)可以类似地配制成包含药物的溶液,如下所述。不包含药物的优选溶液是与视网膜下空间的ph和同渗重摩(osmolality)匹配的平衡盐水溶液(bss)或类似缓冲溶液。
在手术期间可视化视网膜
在某些情况下,例如在终末期视网膜变性期间,鉴定视网膜是困难的,因为它是薄的,透明的并且相对于它所在的受破坏的且重度色素沉着的上皮难以看到。使用蓝色活体染料(bluevitaldye)(例如
蓝色活体染料的使用还鉴定视网膜中存在增厚的内部限制膜或视网膜外层膜的任何区域,因为通过这些结构中的任一个的注射将阻碍进入视网膜下空间的清洁进入。此外,在术后即刻期中这些结构中的任一个的收缩可以导致视网膜进入孔的拉伸,这可以导致药物回流到玻璃体腔中。
药物组合物和注射溶液
可以将本发明的aav载体和aav载体系统配制成药物组合物。除药物外,这些组合物还可包含药学上可接受的载体,稀释剂,赋形剂,缓冲剂,稳定剂或本领域公知的其他物质。这些材料应当无毒,并且不应干扰活性成分的功效。载体或其他材料的确切性质可由技术人员根据施用途径,例如,视网膜下,直接视网膜或玻璃体内注射确定。
药物组合物通常为液体形式。液体药物组合物通常包括液体载体,例如水,石油,动物或植物油,矿物油或合成油。可以包括生理盐水溶液,氯化镁,右旋糖或其他糖溶液,或二醇如乙二醇,丙二醇或聚乙二醇。在一些情况下,可以使用表面活性剂,例如0.001%的普朗尼克酸(pluronicacid)(pf68)。
对于病痛部位的注射,活性成分可以是无热原的水溶液形式,并且具有合适的ph,等张性和稳定性。技术人员能够使用例如等张媒介物如氯化钠注射液,林格氏注射液或乳酸林格氏注射液制备合适的溶液。根据需要可以包含防腐剂,稳定剂,缓冲剂,抗氧化剂和/或其他添加剂。
对于延迟释放,药物可以包含在药物组合物中,所述药物组合物根据本领域已知的方法配制用于缓慢释放,例如在由生物相容性聚合物形成的微胶囊中或在脂质体载体系统中。
治疗方法
应当理解,本文对治疗的所有提及包括治愈性,姑息性和预防性治疗;尽管在本发明的上下文中,提及预防通常与预防性治疗相关。治疗还可包括阻止疾病严重性的进展。
哺乳动物,特别是人的治疗是优选的。然而,人和兽医治疗两者都在本发明的范围内。
变体,衍生物,类似物,同源物和片段
除了本文提到的特定蛋白质和核苷酸之外,本发明还包括其变体,衍生物,类似物,同源物和片段的用途。
在本发明的上下文中,任何给定序列的变体是其中残基的特定序列(无论氨基酸还是核酸残基)已经以使得所讨论的多肽或多核苷酸基本上保留其功能的方式进行了修饰的序列。可以通过天然存在的蛋白质中存在的至少一个残基的添加,缺失,取代,修饰,替换和/或变异来获得变体序列。
如本文所用,术语“衍生物”就本发明的蛋白质或多肽而言包括自或对序列的一个(或多个)氨基酸残基的任何取代,改变,修饰,替换,缺失和/或添加,条件是所得的蛋白质或多肽基本上保留其至少一种内源功能。
如本文所用,术语“类似物”就多肽或多核苷酸而言包括任何模拟物,即拥有其模拟的多肽或多核苷酸的至少一种内源功能的化学化合物。
通常,可以进行氨基酸取代,例如1、2或3至10或20个取代,条件是经修饰的序列基本上保留所需要的活性或能力。氨基酸取代可以包括使用非天然存在的类似物。
本发明中使用的蛋白质也可以具有氨基酸残基的缺失,插入或取代,其产生沉默变化并产生功能等同的蛋白质。可以基于残基的极性,电荷,溶解度,疏水性,亲水性和/或两亲性质的相似性来进行有意的氨基酸取代,只要保留内源功能。例如,带负电荷的氨基酸包括天冬氨酸和谷氨酸;带正电荷的氨基酸包括赖氨酸和精氨酸;具有相似亲水性值的不带电荷的极性首基的氨基酸包括天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸和酪氨酸。
可以进行保守取代,例如根据下表。第二列中相同区块中并且优选在第三列中的相同行中的氨基酸可以彼此替换:
如本文所用,术语“同源物”是指与野生型氨基酸序列和野生型核苷酸序列具有一定同源性的实体。术语“同源性”可以等同于“同一性”。
同源序列可包括氨基酸序列,其可以与主题序列是至少50%,55%,60%,65%,70%,75%,80%,85%或90%相同,优选至少95%或97%或99%相同。通常,同源物将包含与主题氨基酸序列相同的活性位点等。尽管也可以在相似性(即具有相似化学性质/功能的氨基酸残基)方面考虑同源性,但在本发明的上下文中,优选在序列同一性方面表示同源性。
同源序列可包括可与主题序列至少50%,55%,60%,65%,70%,75%,80%,85%或90%相同,优选至少95%或97%或99%相同的核苷酸序列。虽然也可以在相似性方面考虑同源性,但在本发明的上下文中,优选在序列同一性方面表示同源性。
优选地,提及与本文详述的任一种seqidno具有百分比同一性的序列是指在提及的seqidno的整个长度上具有所述百分比同一性的序列。
可以通过眼,或者更通常地,借助于容易获得的序列比较程序进行同源性比较。这些商品化的计算机程序可以计算两个或更多个序列之间的百分比同源性或同一性。
可以在连续序列上计算百分比同源性,即一个序列与另一个序列比对,并且一个序列中的每个氨基酸直接与另一个序列中的相应氨基酸比较,一次一个残基。这称为“无缺口”比对。通常,此类无缺口比对仅在相对少量的残基上进行。
虽然这是一种非常简单且一致的方法,但是未能考虑到例如在其他方面相同的序列对中,核苷酸序列中的一个插入或缺失可以导致以下密码子不对齐,因此当进行全局比对时,潜在导致同源性百分比的大幅降低。因此,大多数序列比较方法设计为产生最佳比对,其考虑可能的插入和缺失而不对整体同源性评分过度罚分。这通过在序列比对中插入“缺口”以试图最大化局部同源性来实现。
然而,这些更复杂的方法对比对中出现的每个缺口分配“缺口罚分”,使得对于相同数量的相同氨基酸,具有尽可能少的缺口的序列比对(反映两个比较序列之间更高的相关性)将比具有许多缺口的序列比对实现更高的得分。通常使用“仿射缺口成本(affinegapcost)”,其对于缺口的存在记入相对高的成本并且对缺口中的每个后续残基记入较小的罚分。这是最常用的缺口评分系统。高缺口罚分当然会产生具有较少缺口的优化比对。大多数比对程序允许修改缺口罚分。但是,当使用此类软件进行序列比较时,优选使用默认值。例如,当使用gcgwisconsinbestfit包时,氨基酸序列的默认缺口罚分对于缺口为-12,并且对于每个延伸为-4。
因此,计算最大百分比同源性首先需要产生最佳比对,考虑缺口罚分。用于进行此类比对的合适的计算机程序是gcgwisconsinbestfit包(universityofwisconsin,u.s.a.;devereuxetal.(1984)nucleicacidsres.12:387)。可以进行序列比较的其他软件的实例包括但不限于blast包(参见ausubel等人(1999)如上-ch.18),fasta(atschuletal.(1990)j.mol.biol.403-410)和geneworks比较工具套件。blast和fasta都可用于离线和在线搜索(参见ausubel等人(1999)同上,第7-58至7-60页)。但是,对于某些应用,优选使用gcgbestfit程序。另一种称为blast2序列的工具也可用于比较蛋白质和核苷酸序列(参见femsmicrobiol.lett.(1999)174:247-50;femsmicrobiol.lett.(1999)177:187-8)。
尽管可以就同一性而言测量最终的同源性百分比,但是比对过程本身通常不基于全有或全无对的比较。相反,通常使用缩放的相似性得分矩阵,其基于化学相似性或进化距离为每个成对比较分配得分。常用的此类矩阵的一个例子是blosum62矩阵-blast程序套件的默认矩阵。gcgwisconsin程序通常使用公共默认值或自定义符号比较表(如果提供的话)(关于更多详情,参见用户手册)。对于某些应用,优选使用gcg软件包的公共默认值,或者在其他软件的情况下,使用默认矩阵,例如blosum62。
一旦软件产生了最佳比对,就可以计算同源性百分比,优选序列同一性百分比。软件通常将此作为序列比较的一部分进行并生成数值结果。
“片段”也是变体,并且该术语通常指在功能上或例如在测定中感兴趣的多肽或多核苷酸的选定区域。因此,“片段”指作为全长多肽或多核苷酸的一部分的氨基酸或核酸序列。
可以使用标准重组dna技术例如定点诱变来制备此类变体。在要进行插入的情况下,可以制备编码插入以及对应于插入位点任一侧的天然存在序列的5'和3'侧翼区的合成dna。侧翼区含有对应于天然存在序列中的位点的方便的限制性位点,以便可以用合适的酶切割序列,并将合成的dna连接到切口中。然后根据本发明表达dna以制备编码的蛋白质。这些方法仅说明本领域已知的用于操纵dna序列的众多标准技术,也可使用其他已知技术。
密码子优化
本发明包括本文所述核酸序列的密码子优化的变体。
密码子优化利用遗传密码中的冗余性来在维持编码蛋白质的相同氨基酸序列的情况下使核苷酸序列能够得到改变。
通常,进行密码子优化以促进编码蛋白质表达的增加或减少。这通过将核苷酸序列中的密码子选择适合于特定细胞类型的密码子选择,因此利用对应于细胞类型中特定trna的相对丰度偏倚的细胞密码子偏倚来实现。通过改变核苷酸序列中的密码子以使它们适合于匹配相应trna的相对丰度,可以增加表达。相反,可以通过选择已知相应trna在特定细胞类型中罕见的密码子来降低表达。
用于核酸序列的密码子优化的方法是本领域已知的并且是技术人员熟悉的。
序列
seqidno:1
aggacacagcgtccggagccagaggcgctcttaacggcgtttatgtcctttgctgtctgaggggcctcagctctgaccaatctggtcttcgtgtggtcattagcatgggcttcgtgagacagatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagctacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaagaggaatacgaataagggatatcttgaaagatgaagaaacactgacactatttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttctggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaagccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgcaccctccgcctggtcaatcaatacctggagtgcttggtcctggataagtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctgggccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtattgggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctgggaaaaccaccaccttgtccatcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggacccttactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatcatgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcccagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaaataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctggctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctgaaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccccaggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctcccccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatgtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatccctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccctgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttccagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaacacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttggtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaacagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaagcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatcactagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaacattaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcccacaacgccatcttacgggccagcctgcctaaggacaggagccccgaggagtatggaatcaccgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctgaccacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccagccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagtttatcagtggagtgagccccaccacctactgggtgaccaacttcctctgggacatcatgaattattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtcattcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggctttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaattatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtgacagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctgattgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaactgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatgggctactgtcctcagtttgatgcaattgatgagctgctcacaggacgagaacatctttacctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtattaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggcaacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctggatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattcagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccaggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctccctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtactcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggactgatctttcacaccgctcgttcctgcagccagaaaggaactctgggcagctggaggcgcaggagcctgtgcccatatggtcatccaaatggactggccagcgtaaatgaccccactgcagcagaaaacaaacacacgaggagcatgcagcgaattcagaaagaggtctttcagaaggaaaccgaaactgacttgctcacctggaacacctgatggtgaaaccaaacaaatacaaaatccttctccagaccccagaactagaaaccccgggccatcccactagcagctttggcctccatattgctctcatttcaagcagatctgcttttctgcatgtttgtctgtgtgtctgcgttgtgtgtgattttcatggaaaaataaaatgcaaatgcactcatcacaaa
seqidno:2
aggacacagcgtccggagccagaggcgctcttaacggcgtttatgtcctttgctgtctgaggggcctcagctctgaccaatctggtcttcgtgtggtcattagcatgggcttcgtgagacagatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagctacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaagaggaatacgaataagggatatcttgaaagatgaagaaacactgacactatttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttctggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaagccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctgggccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtattgggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctgggaaaaccaccaccttgtccatcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggacccttactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatcatgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcccagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaaataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctggctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctgaaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccccaggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctcccccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatgtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatccctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccctgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttccagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaacacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttggtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaacagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaagcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatcactagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaacattaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcccacaacgccatcttacgggccagcctgcctaaggacaggagccccgaggagtatggaatcaccgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctgaccacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccagccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagtttatcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaattattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtcattcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggctttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaattatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtgacagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctgattgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaactgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatgggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttacctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtattaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggcaacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctggatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattcagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccaggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctccctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtactcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggactgatctttcacaccgctcgttcctgcagccagaaaggaactctgggcagctggaggcgcaggagcctgtgcccatatggtcatccaaatggactggccagcgtaaatgaccccactgcagcagaaaacaaacacacgaggagcatgcagcgaattcagaaagaggtctttcagaaggaaaccgaaactgacttgctcacctggaacacctgatggtgaaaccaaacaaatacaaaatccttctccagaccccagaactagaaaccccgggccatcccactagcagctttggcctccatattgctctcatttcaagcagatctgcttttctgcatgtttgtctgtgtgtctgcgttgtgtgtgattttcatggaaaaataaaatgcaaatgcactcatcacaaa
seqidno:3
ttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctgcggcaattcagtcgataactataacggtcctaaggtagcgatttaaatggtaccgggccccagaagcctggtggttgtttgtccttctcaggggaaaagtgaggcggccccttggaggaaggggccgggcagaatgatctaatcggattccaagcagctcaggggattgtctttttctagcaccttcttgccactcctaagcgtcctccgtgaccccggctgggatttagcctggtgctgtgtcagccccgggtgccgcagggggacggctgccttcgggggggacggggcagggcggggttcggcttctggcgtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttcctacagctcctgggcaacgtgctggttattgtgctgtctcatcattttggcaaagaattaccaccatgggcttcgtgagacagatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagctacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaagaggaatacgaataagggatatcttgaaagatgaagaaacactgacactatttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttctggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaagccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctgggccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtattgggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctgggaaaaccaccaccttgtccatcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggacccttactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatcatgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcccagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccatttaaattagggataacagggtaatggcgcgggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaa
seqidno:4
ttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctgcggcaattcagtcgataactataacggtcctaaggtagcgatttaaataacatccagagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaaataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctggctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctgaaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccccaggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctcccccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatgtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatccctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccctgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttccagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaacacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttggtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaacagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaagcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatcactagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaacattaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcccacaacgccatcttacgggccagcctgcctaaggacaggagccccgaggagtatggaatcaccgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctgaccacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccagccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagtttatcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaattattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtcattcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggctttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaattatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtgacagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctgattgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaactgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatgggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttacctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtattaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggcaacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctggatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattcagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccaggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctccctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtactcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggactgaaagcttatcgataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcatgccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggatttaaattagggataacagggtaatggcgcgggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaa
seqidno:5
gggccccagaagcctggtggttgtttgtccttctcaggggaaaagtgaggcggccccttggaggaaggggccgggcagaatgatctaatcggattccaagcagctcaggggattgtctttttctagcaccttcttgccactcctaagcgtcctccgtgaccccggctgggatttagcctggtgctgtgtcagccccggg
seqidno:6
gtgccgcagggggacggctgccttcgggggggacggggcagggcggggttcggcttctggcgtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttcctacagctcctgggcaacgtgctggttattgtgctgtctcatcattttggcaaagaattaccaccatgg
seqidno:7
atcgataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctcccc
seqidno:8
cgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctgggg
seqidno:9
ggtaccgggccccagaagcctggtggttgtttgtccttctcaggggaaaagtgaggcggccccttggaggaaggggccgggcagaatgatctaatcggattccaagcagctcaggggattgtctttttctagcaccttcttgccactcctaagcgtcctccgtgaccccggctgggatttagcctggtgctgtgtcagccccgggtgccgcagggggacggctgccttcgggggggacggggcagggcggggttcggcttctggcgtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttcctacagctcctgggcaacgtgctggttattgtgctgtctcatcattttggcaaagaattaccaccatgggcttcgtgagacagatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagctacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaagaggaatacgaataagggatatcttgaaagatgaagaaacactgacactatttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttctggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaagccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctgggccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtattgggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctgggaaaaccaccaccttgtccatcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggacccttactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatcatgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcccagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttcc
seqidno:10
acatccagagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaaataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctggctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctgaaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccccaggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctcccccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatgtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatccctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccctgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttccagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaacacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttggtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaacagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaagcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatcactagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaacattaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcccacaacgccatcttacgggccagcctgcctaaggacaggagccccgaggagtatggaatcaccgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctgaccacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccagccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagtttatcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaattattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtcattcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggctttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaattatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtgacagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctgattgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaactgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatgggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttacctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtattaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggcaacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctggatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattcagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccaggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctccctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtactcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggactgaaagcttatcgataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcatgccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctgggg
实施例
实施例1-上游和下游aav载体的制备
为了产生给定的aav载体,需要三种质粒:ptransgene,prepcap和phelper。ptransgene含有上游或下游abca4转基因,如下详述(经itr完整性确认)。prepcap含有aav基因组的rep和cap基因。rep基因来自aav2基因组,而cap基因将根据血清型要求而变化。phelper含有成功产生aav需要的腺病毒基因。将质粒与聚乙烯亚胺(pei)复合,用于应用于hek293t细胞的三重转染混合物。转染后三天,收集细胞并裂解。用benzonase处理裂解物并澄清,之后应用包含15%,25%,40%和60%相的碘克沙醇梯度。梯度以59,000rpm旋转1小时30分钟,然后取出40%的级份。然后使用amiconultra100k过滤装置纯化和浓缩该aav相。在该步骤之后,在pbs中获得100-200μl纯化的aav。
实施例2-示例性aav载体的结构上游载体
该载体含有启动子,非翻译区(utr)和abca4cds的上游区段,在转基因的每个末端具有aav2itr(图1)。abca4在视网膜的感光细胞中表达,因此掺入了人视紫红质激酶(grk1)启动子元件。上游载体中包含的特定grk1启动子序列如khani等人(investigativeophthalmologyandvisualscience,48(9),3954–3961,2007)所述,包含grk1基因的核苷酸-112至+87,并且已经用于靶向感光细胞的基因疗法的临床前研究中。
grk1启动子的199个核苷酸之后是长度186个核苷酸的非翻译区(utr)。该核苷酸序列选自rep1临床试验载体中包含的较大utr(443个核苷酸)(maclaren等,2014)。具体而言,所选择的序列包括原鸡β-肌动蛋白(cba)内含子1片段(具有预测的剪接供体位点),穴兔β-珠蛋白(rbg)内含子2片段(包括预测的分支点和剪接受体位点)和穴兔β-珠蛋白外显子3片段,之后直接是kozak共有序列,这导致了abca4cds。已将该utr片段添加到原始grk1启动子元件中以增加翻译产率(rafiq等人,1997;chatterjee等人,2009)。就其本身而言,grk1启动子在感光细胞中显示出非常好的基因表达能力,表明没有抑制表达的主要特征。
经双重载体注射的abca4-/-视网膜的比较揭示了与单独的grk1启动子元件相比,上游载体携带grk1.5'utr元件的眼产生显著更多的abca4蛋白(图2)。
在上游载体中的kozak共有序列之后是自核苷酸1至3,701的abca4cds(ncbi参考文件nm_000350中的105至3,805)。abca4cds的最后208个核苷酸形成下游载体中包含的cds的前208个核苷酸,并充当重叠区。包含在上游载体中的编码序列片段与参考序列nm_000350匹配,除了核苷酸1,536(nm_0003501,640)g>t的碱基变化。这是密码子的第三个碱基,并且不导致氨基酸序列改变。abca4cds在外显子25内被截短,其下游具有3'itr。
下游载体
该载体含有abca4cds的下游片段,土拨鼠肝炎病毒转录后响应元件(wpre)和牛生长激素聚腺苷酸化信号(bghpolya),在转基因的每个末端具有aav2itr(图1)。abca4cds在位置3,494(nm_0003503,598)的5'itr下游开始并继续至6,822(nm_0003506,926)的终止密码子。abca4cds的前208个核苷酸与上游载体中包含的最终208个abca4cds核苷酸相同,并且充当转基因之间的重叠区。除了核苷酸5,175(nm_0003505,279)g>a和6,069(nm_0003506,173)t>c的碱基变化外,包含在下游载体中的编码序列片段与参考序列nm_000350匹配。这些变化都发生在密码子的第三个碱基中,并且不导致氨基酸序列改变。
限制性位点hindiii将abca4cds终止密码子与wpre分开。该元件长度为593个核苷酸,并且与rep1临床试验载体中包含的x抗原灭活的wpre相匹配。然后,sphi的限制性位点将wpre与bgh多聚a信号分开,所述bgh多聚a信号的长度为269个核苷酸并且与rep1临床试验载体中存在的bgh多聚a信号匹配。然后3'itr位于polya信号的下游。
已知aav25'itr具有启动子活性,并且在下游转基因内具有wpre和bgh多聚a信号,将从未重组的下游载体产生稳定的转录物。包含在下游转基因中的野生型abca4cds携带多个框内aug密码子,其不能替代其他密码子而不改变氨基酸序列。这产生了从稳定转录物发生翻译的可能性,导致可通过western印迹检测的截短的abca4肽的存在(图4a)。仔细选择所选重叠区的起始序列以包括良好背景(就潜在的kozak共有序列而言)中的框外aug密码子,之后是较弱背景下的框内aug密码子(图5a)以促进翻译机制从框外位点启动。在框内aug之前的各种背景中总共有四个框外aug密码子。所有这些都将转化为10个氨基酸内的终止密码子。这些框外aug密码子的存在可以防止截短的abca4蛋白从未重组的下游转基因翻译。
实施例3-重叠区域的评估
在六种重叠变体的体外和体内评估后确定最佳重叠区(分别为图3a和3b)。这些称为a,b,c,d,e和f并且代表以下重叠区域(x代表不重叠):a.1,173个核苷酸(3259-4430);b.506个核苷酸(3300-3805);c.208个核苷酸(3598-3805);d.99个核苷酸(3707-3805);e.49个核苷酸(3757-3805)和;f.24个核苷酸(3782-3805)。重叠区b至x的下游转基因均与相同的上游转基因配对。重叠变体b和c比所有其他变体更好以及在相似程度上表现,但出于各种原因选择双重载体c型。第一个原因是由于截短的abca4从未重组的下游转基因的其有限生成(图4a)。来自c,d,e,f和x变体的未重组的下游转基因产生比a或b形式显著降低的截短的abca4蛋白水平。在双重载体背景中,与全长abca4相比,重叠c产生截短的abca4的最低比例(图4b和4c)。这表明重叠c转基因设计不仅限制了来自未重组转基因的不想要的表达,而且还比重叠b以更高的效率重组。通过比较经重叠c和b注射的abca4-/-视网膜之间转录物倍数变化和蛋白质倍数变化差异产生这点的进一步证据。靶向abca4cds的上游部分(因此除了从重组转基因的全长abca4转录物外,检测来自未重组上游转基因的转录物)的引物检测到经重叠b和c双重载体注射的视网膜两者中存在的非常高的转录物水平。然而,重叠c产生小于一半的重叠b的转录物水平,但仍然产生abca4蛋白水平的1.5倍(图4d)。鉴于两者共享相同的上游载体并且仅在它们的下游转基因序列上不同,这表明选择用于重叠c的重叠区比重叠b以更大的效率重组。
选择的重叠区具有52%的gc含量和-19.60kcal/mol的自由能预测,这比-55.60kcal/mol(53%gc含量)的重叠区b自由能低近三倍,图5b。自由能的此减少表明由未重组的重叠c形成的二级结构将比重叠b更容易解析,我们预测这使它更可用于与相对转基因上的重叠区相互作用。
实施例4-实验方案
图2
abca4-/-小鼠接受2μl双重载体混合物(1:1)的视网膜下注射,每只眼递送每个载体的1e+9个基因组拷贝。在注射后6周进行眼的摘出术,从眼杯中切下神经视网膜并在ripa缓冲液中裂解。将组织匀浆,离心后提取上清液。将上清液与变性上样缓冲液混合,并在变性条件下在7.5%tgx凝胶上运行。将蛋白质转移至pvdf膜,用兔多克隆抗abca4(abcam)检测abca4,用小鼠单克隆抗gapdh(origene)检测gapdh。使用licor成像系统对条带进行可视化和分析。对于每个样品,相对于gapdh标准化abca4水平,然后相对于未注射的abca4-/-眼呈现。
图3a
使用hek293t细胞以每孔2e5个细胞接种6孔培养板。24小时后,将一孔细胞提出并计数。该计数用于确定向每个孔提供的适当量的载体,以给出每个载体10,000的感染复数(moi)。除去培养基并在1ml不含胎牛血清(fbs)的培养基中加入aav。将细胞在37℃温育1小时,然后加入1ml含有20%fbs的培养基。转导后48小时,除去培养基并施加含有10%fbs的新鲜培养基。将细胞再温育48小时,之后发生另一个培养基变化。24小时后,收获细胞并在冷pbs中使用温和的离心循环洗涤三次。除去最终的pbs洗涤液并冷冻细胞团粒。将细胞团粒在冰上解冻,然后在ripa缓冲液中裂解。根据上文对于western印迹分析所述的视网膜样品处理裂解物。
图3b
就图2而言。
图4a
使用hek293t细胞以每孔1e6个细胞接种6孔培养板。24小时后,将含有1μg与转染试剂lt1(geneflow)复合的质粒的转染混合物应用于细胞。测试质粒携带用于创建aav载体的下游转基因。转染后48小时,将细胞洗涤,收获并通过western印迹评估,如上文所述。
图4b
就图2而言
图4d
如图2中所述从western印迹分析获得abca4蛋白水平,并且在重叠变体c和b双重载体处理之间比较倍数变化。对于转录物水平比较,在rnalater(ambion)中收集组织样品,并使用dynabeads-oligodtmrnadirect(lifetechnologies)提取mrna。使用oligodt引物和superscriptiii(lifetechnologies)用500ngmrna进行cdna合成。使用pcr纯化旋转柱(qiagen)清洁样品,并在50μldepc处理的水中洗脱。通过靶向abca4cds上游部分的qpcr评估cdna。相对于肌动蛋白水平将abca4的水平标准化,并相对于未注射的abca4-/-样品表示。然后比较重叠变体c和b双重载体处理之间abca4转录物水平的倍数变化。
实施例5-使用重叠双重载体策略的aav介导的将abca4递送至abca4-/-小鼠的光感受器
该实施例中呈现的数据证明了在用本发明的重叠双重载体系统进行视网膜下注射后,abca4蛋白的表达特异性地定位在abca4-/-小鼠模型的光感受器外部区段中。
转基因设计和生产:
将重叠的abca4转基因包装到aav8y733f壳体中。上游转基因含有人视紫红质激酶(grk1)启动子和aav2反向末端重复序列(itr)之间的abca4编码序列(cds)的上游部分。下游转基因含有abca4cds的下游部分,土拨鼠肝炎病毒转录后调控元件(wpre)和polya信号(pa)。上游和下游转基因都携带abca4cds重叠区域。
注射:
abac4-/-小鼠在4-5周龄时接受2μl视网膜下注射,其含有上游和下游载体的1:1混合物(1x1013gc/ml)。在注射后6周收获眼用于免疫组织化学(ihc)评估。
免疫组化染色:
将除去了晶状体(lens)的全眼杯在4%多聚甲醛(pfa)中固定20分钟,然后在30%蔗糖中于4℃温育过夜。将眼在封固介质中冷冻,之后切成切片。将组织切片在室温干燥过夜,然后在磷酸盐缓冲盐水(pbs)中漂洗5分钟,三次。样品用0.2%triton-x-100透化20分钟,然后在pbs中洗涤三次,然后用10%驴血清(ds),1%牛血清白蛋白(bsa),0.1%triton-x-100温育1小时。将抗体在1%ds,0.1%bsa中以1/200倍稀释,应用于切片并在室温放置2小时。用山羊抗abca4(antibodiesonline)实现abca4/abca4检测,用小鼠抗hcn1(abcam)实现超极化激活的环核苷酸门控钾通道1(hcn1)检测,并且用小鼠抗-1d4(abcam)实现视紫红质检测。用0.05%tween-20冲洗切片三次,然后在黑暗条件下施用二抗(稀释1/400)1小时。用0.05%tween-20冲洗切片两次,然后用hoescht染色剂(1/1,000)温育15分钟。将切片在pbs中漂洗,然后风干。将diamond抗褪色封固介质施加到每个切片,并在成像前将载玻片放置过夜。
结果:
abca4表达定位于感光细胞外部区段。
图7显示野生型(wt)和abca4-/-眼中的abca4/abca4(绿色)和hcn1(红色)染色。针对光感受器内部区段标志物hcn1和abca4/abca4染色wtsvev129、未注射的和注射的abca4-/-眼。wt和经双重载体处理的abca4-/-眼揭示了abca4/abca4在感光细胞外部区段中的特异性定位。
abca4与视紫红质共定位。
图8显示野生型(wt)和abca4-/-眼中的感光细胞外部区段中的abca4/abca4(绿色)和视紫红质(红色)染色。wt和经双重载体处理的abca4-/-眼揭示了视紫红质和abca4/abca4在感光细胞外部区段中的共定位。
图9显示野生型(wt)和abca4-/-眼中的abca4/abca4(绿色)和视紫红质(红色)顶端rpe染色。wt和双重载体处理的abca4-/-眼揭示了视紫红质和abca4/abca4在rpe细胞的顶端区域中的共定位,假设起源于脱落的外部区段盘。未用双重载体处理的abca4-/-眼在rpe细胞的顶端区域中仅显示视紫红质染色。框示图像a显示了从转导的rpe细胞实现的表达模式,与abca4/abca4/rho染色相反揭示了扩散染色模式。图像b证实没有从grk1启动子的rpe表达。
结论:
优化的重叠双重载体系统可用于在感光细胞中产生abca4表达,其中它以ihc可检测的水平运输至期望的外部区段结构。
实施例6-经双重载体处理的abca4-/-小鼠中的二类视黄醇/a2e评估
与野生型小鼠相比,abca4-/-小鼠模型随龄期表现出二类视黄醇和a2e的水平升高。然而,与人相反,二类视黄醇的增加未达到引起任何显著视网膜变性所需要的水平。这表明abca4缺陷型小鼠眼中可以存在其他代偿机制。在野生型视网膜中,abca4促进视网膜从感光细胞外部区段盘膜移出以进行再循环。当缺乏功能性abca4时,如在abca4-/-小鼠模型中,视网膜维持在外部区段盘膜中,在那里它经历生化变化形成各种二类视黄醇形式(图11)。感光细胞不断地产生新的外部区段盘,并且在这样做时,较老的更远侧的盘朝向rpe细胞移动,其随后通过吞噬作用降解它们。在abca4缺陷小鼠中,吞噬的盘含有升高的二类视黄醇水平。在rpe细胞内,这些细胞进一步转化为a2e同种型,其积累导致脂褐素。因此,尽管abca4缺陷型小鼠中的二类视黄醇积累不足以引起视网膜变性,但是仍然可以量化所得的高于基线的升高的水平,从而提供abca4功能的生物标志物。
可通过高效液相色谱(hplc)精确测量二类视黄醇和a2e化合物。因此,与未治疗的眼相比,用abca4基因疗法治疗的小鼠的治疗功效的量度将是实现二类视黄醇和a2e水平的降低。然而,有两个需要解决的考虑因素。在第一种情况下,对于临床应用,我们需要使用人abca4编码序列和人光感受器启动子,并且这在小鼠中不太可能有效。此外,hplc测量自整个眼取得,而不仅从通过视网膜下注射暴露于载体的区域取得。因此,abca4缺陷型小鼠中二类视黄醇的总体减少不可能达到野生型水平。第二个考虑因素是视网膜下注射,其可以导致外部区段盘的损坏。由于这些结构富含二类视黄醇,因此需要将abca4基因疗法的效果与类似的假注射进行比较。理想情况下,应当对这使用相同小鼠的对侧眼来控制眼大小和终身光暴露,这也可能影响二类视黄醇积累。
出于此原因,我们比较abca4-/-小鼠分组中的二类视黄醇/a2e水平,所述小鼠在一只眼中接受了假注射并且在对侧眼中接受了类似的治疗注射。每只假性眼以与配对的双重载体治疗眼中接收的剂量相同的总aav剂量接收上游载体。因此,每只小鼠的双眼接受2μl视网膜下注射,形成含有2x1010个aav载体基因组颗粒的泡。
在4-5周龄时注射总共13只abca4敲除小鼠,并在注射后3个月收获眼。将小鼠暗适应16小时,之后组织收集,其在昏暗的红光下在黑暗中进行。然后将整眼隐去名称,并冷冻运送到julesstein眼科研究所,以使用建立的hplc测定法进行二类视黄醇/a2e评估。取出每只整眼,并加工而不进行解剖。在对所有26只眼进行hplc评估之后,随后对身份进行揭示,并将每只经处理的眼的二类视黄醇/a2e水平与其配对的假注射眼进行比较。双因素anova确定治疗对二类视黄醇/a2e的水平具有显著影响,与配对的假注射眼相比,观察到双重载体处理眼的减少(p=0.0171),图12。
上述说明书中提及的所有出版物均通过引用并入本文。在不脱离本发明的范围和精神的情况下,本发明所述产品,系统,用途,过程和方法的各种修改和变化对于本领域技术人员来说是显而易见的。尽管已经结合具体的优选实施方案描述了本发明,但是应当理解,如要求保护的本发明不应该过度限于这些具体的实施方案。实际上,对于生物化学和生物技术或相关领域的技术人员显而易见的,用于实施本发明的所述模式的各种修改旨在落入所附权利要求书的范围内。
序列表
<110>牛津大学创新有限公司
<120>腺伴随病毒载体系统
<130>p107080pct
<150>gb1610448.1
<151>2016-06-15
<150>gb1707261.2
<151>2017-05-05
<160>11
<170>patentinversion3.5
<210>1
<211>7326
<212>dna
<213>智人
<400>1
aggacacagcgtccggagccagaggcgctcttaacggcgtttatgtcctttgctgtctga60
ggggcctcagctctgaccaatctggtcttcgtgtggtcattagcatgggcttcgtgagac120
agatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttg180
tggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgcca240
acccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaa300
tgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagcccca360
ccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaagggtat420
atcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtattt480
ggacagagctacacatcttgtcccaattcatggacaccctccggactcacccggagagaa540
ttgcaggaagaggaatacgaataagggatatcttgaaagatgaagaaacactgacactat600
ttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaag660
tccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgca720
gcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgc780
gctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactctgtatg840
ccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctc900
aaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaattcaag960
agtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcaga1020
atggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggct1080
accccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaataactata1140
aggcctttctggggattgactccacaaggaaggatcctatctattcttatgacagaagaa1200
caacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcg1260
cttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctg1320
cagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacgttagga1380
agttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgacaacagca1440
cacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttttgaata1500
ggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggcc1560
ctcgggaaagccaggctgacgacatggccaacttcgactggagggacatatttaacatca1620
ctgatcgcaccctccgcctggtcaatcaatacctggagtgcttggtcctggataagtttg1680
aaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggaggaaaaca1740
tgttctgggccggagtggtattccctgacatgtatccctggaccagctctctaccacccc1800
acgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataagattaaag1860
acaggtattgggattctggtcccagagctgatcccgtggaagatttccggtacatctggg1920
gcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcagg1980
cggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgatt2040
ctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctact2100
ctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagacct2160
tgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttct2220
ccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctac2280
attacagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatca2340
tgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtg2400
gtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgca2460
tgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggca2520
ctgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcggga2580
acagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttg2640
atgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatg2700
gaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggt2760
gttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggagg2820
atccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtggg2880
ttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctg2940
tggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatg3000
gagctgggaaaaccaccaccttgtccatcctgacgggtctgttgccaccaacctctggga3060
ctgtgctcgttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttg3120
gcatgtgtccacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgt3180
tctatgcccagctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgt3240
tggaggacacaggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggca3300
tgcagagaaagctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctgg3360
acgaacccacctctggggtggacccttactcgagacgctcaatctgggatctgctcctga3420
agtatcgctcaggcagaaccatcatcatgtccactcaccacatggacgaggccgacctcc3480
ttggggaccgcattgccatcattgcccagggaaggctctactgctcaggcaccccactct3540
tcctgaagaactgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaaca3600
tccagagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctcca3660
ccacgtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaa3720
atgagctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattg3780
gtcaagaacttatcttccttcttccaaataagaacttcaagcacagagcatatgccagcc3840
ttttcagagagctggaggagacgctggctgaccttggtctcagcagttttggaatttctg3900
acactcccctggaagagatttttctgaaggtcacggaggattctgattcaggacctctgt3960
ttgcgggtggcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgggtc4020
ccagagagaaggctggacagacaccccaggactccaatgtctgctccccaggggcgccgg4080
ctgctcacccagagggccagcctcccccagagccagagtgcccaggcccgcagctcaaca4140
cggggacacagctggtcctccagcatgtgcaggcgctgctggtcaagagattccaacaca4200
ccatccgcagccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgtttt4260
tggctctgatgctttctattgttatccctccttttggcgaataccccgctttgacccttc4320
acccctggatatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtgagc4380
agttcacggtacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcctga4440
aggaagggtggcttccggagtacccctgtggcaactcaacaccctggaagactccttctg4500
tgtccccaaacatcacccagctgttccagaagcagaaatggacacaggtcaacccttcac4560
catcctgcaggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagggtg4620
ccgggggcctcccgcccccccagagaacacagcgcagcacggaaattctacaagacctga4680
cggacaggaacatctccgacttcttggtaaaaacgtatcctgctcttataagaagcagct4740
taaagagcaaattctgggtcaatgaacagaggtatggaggaatttccattggaggaaagc4800
tcccagtcgtccccatcacgggggaagcacttgttgggtttttaagcgaccttggccgga4860
tcatgaatgtgagcgggggccctatcactagagaggcctctaaagaaatacctgatttcc4920
ttaaacatctagaaactgaagacaacattaaggtgtggtttaataacaaaggctggcatg4980
ccctggtcagctttctcaatgtggcccacaacgccatcttacgggccagcctgcctaagg5040
acaggagccccgaggagtatggaatcaccgtcattagccaacccctgaacctgaccaagg5100
agcagctctcagagattacagtgctgaccacttcagtggatgctgtggttgccatctgcg5160
tgattttctccatgtccttcgtcccagccagctttgtcctttatttgatccaggagcggg5220
tgaacaaatccaagcacctccagtttatcagtggagtgagccccaccacctactgggtga5280
ccaacttcctctgggacatcatgaattattccgtgagtgctgggctggtggtgggcatct5340
tcatcgggtttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtggcac5400
tgctcctgctgtatggatgggcggtcattcccatgatgtacccagcatccttcctgtttg5460
atgtccccagcacagcctatgtggctttatcttgtgctaatctgttcatcggcatcaaca5520
gcagtgctattaccttcatcttggaattatttgagaataaccggacgctgctcaggttca5580
acgccgtgctgaggaagctgctcattgtcttcccccacttctgcctgggccggggcctca5640
ttgaccttgcactgagccaggctgtgacagatgtctatgcccggtttggtgaggagcact5700
ctgcaaatccgttccactgggacctgattgggaagaacctgtttgccatggtggtggaag5760
gggtggtgtacttcctcctgaccctgctggtccagcgccacttcttcctctcccaatgga5820
ttgccgagcccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaagac5880
aaagaattattactggtggaaataaaactgacatcttaaggctacatgaactaaccaaga5940
tttatccaggcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctggag6000
agtgctttggcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgctca6060
ctggggacaccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaacca6120
atatttctgaagtccatcaaaatatgggctactgtcctcagtttgatgcaattgatgagc6180
tgctcacaggacgagaacatctttacctttatgcccggcttcgaggtgtaccagcagaag6240
aaatcgaaaaggttgcaaactggagtattaagagcctgggcctgactgtctacgccgact6300
gcctggctggcacgtacagtgggggcaacaagcggaaactctccacagccatcgcactca6360
ttggctgcccaccgctggtgctgctggatgagcccaccacagggatggacccccaggcac6420
gccgcatgctgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcctca6480
catcccacagcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaaagg6540
gcgcctttcgatgtatgggcaccattcagcatctcaagtccaaatttggagatggctata6600
tcgtcacaatgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctgtgg6660
agcagttcttccaggggaacttcccaggcagtgtgcagagggagaggcactacaacatgc6720
tccagttccaggtctcctcctcctccctggcgaggatcttccagctcctcctctcccaca6780
aggacagcctgctcatcgaggagtactcagtcacacagaccacactggaccaggtgtttg6840
taaattttgctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctgctg6900
gagccagtcgacaagcccaggactgatctttcacaccgctcgttcctgcagccagaaagg6960
aactctgggcagctggaggcgcaggagcctgtgcccatatggtcatccaaatggactggc7020
cagcgtaaatgaccccactgcagcagaaaacaaacacacgaggagcatgcagcgaattca7080
gaaagaggtctttcagaaggaaaccgaaactgacttgctcacctggaacacctgatggtg7140
aaaccaaacaaatacaaaatccttctccagaccccagaactagaaaccccgggccatccc7200
actagcagctttggcctccatattgctctcatttcaagcagatctgcttttctgcatgtt7260
tgtctgtgtgtctgcgttgtgtgtgattttcatggaaaaataaaatgcaaatgcactcat7320
cacaaa7326
<210>2
<211>7326
<212>dna
<213>智人
<400>2
aggacacagcgtccggagccagaggcgctcttaacggcgtttatgtcctttgctgtctga60
ggggcctcagctctgaccaatctggtcttcgtgtggtcattagcatgggcttcgtgagac120
agatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttg180
tggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgcca240
acccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaa300
tgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagcccca360
ccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaagggtat420
atcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtattt480
ggacagagctacacatcttgtcccaattcatggacaccctccggactcacccggagagaa540
ttgcaggaagaggaatacgaataagggatatcttgaaagatgaagaaacactgacactat600
ttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaag660
tccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgca720
gcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgc780
gctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactctgtatg840
ccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctc900
aaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaattcaag960
agtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcaga1020
atggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggct1080
accccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaataactata1140
aggcctttctggggattgactccacaaggaaggatcctatctattcttatgacagaagaa1200
caacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcg1260
cttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctg1320
cagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacgttagga1380
agttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgacaacagca1440
cacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttttgaata1500
ggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggcc1560
ctcgggaaagccaggctgacgacatggccaacttcgactggagggacatatttaacatca1620
ctgatcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttg1680
aaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggaggaaaaca1740
tgttctgggccggagtggtattccctgacatgtatccctggaccagctctctaccacccc1800
acgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataagattaaag1860
acaggtattgggattctggtcccagagctgatcccgtggaagatttccggtacatctggg1920
gcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcagg1980
cggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgatt2040
ctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctact2100
ctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagacct2160
tgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttct2220
ccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctac2280
attacagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatca2340
tgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtg2400
gtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgca2460
tgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggca2520
ctgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcggga2580
acagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttg2640
atgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatg2700
gaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggt2760
gttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggagg2820
atccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtggg2880
ttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctg2940
tggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatg3000
gagctgggaaaaccaccaccttgtccatcctgacgggtctgttgccaccaacctctggga3060
ctgtgctcgttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttg3120
gcatgtgtccacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgt3180
tctatgcccagctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgt3240
tggaggacacaggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggca3300
tgcagagaaagctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctgg3360
acgaacccacctctggggtggacccttactcgagacgctcaatctgggatctgctcctga3420
agtatcgctcaggcagaaccatcatcatgtccactcaccacatggacgaggccgacctcc3480
ttggggaccgcattgccatcattgcccagggaaggctctactgctcaggcaccccactct3540
tcctgaagaactgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaaca3600
tccagagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctcca3660
ccacgtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaa3720
atgagctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattg3780
gtcaagaacttatcttccttcttccaaataagaacttcaagcacagagcatatgccagcc3840
ttttcagagagctggaggagacgctggctgaccttggtctcagcagttttggaatttctg3900
acactcccctggaagagatttttctgaaggtcacggaggattctgattcaggacctctgt3960
ttgcgggtggcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgggtc4020
ccagagagaaggctggacagacaccccaggactccaatgtctgctccccaggggcgccgg4080
ctgctcacccagagggccagcctcccccagagccagagtgcccaggcccgcagctcaaca4140
cggggacacagctggtcctccagcatgtgcaggcgctgctggtcaagagattccaacaca4200
ccatccgcagccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgtttt4260
tggctctgatgctttctattgttatccctccttttggcgaataccccgctttgacccttc4320
acccctggatatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtgagc4380
agttcacggtacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcctga4440
aggaagggtggcttccggagtacccctgtggcaactcaacaccctggaagactccttctg4500
tgtccccaaacatcacccagctgttccagaagcagaaatggacacaggtcaacccttcac4560
catcctgcaggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagggtg4620
ccgggggcctcccgcccccccagagaacacagcgcagcacggaaattctacaagacctga4680
cggacaggaacatctccgacttcttggtaaaaacgtatcctgctcttataagaagcagct4740
taaagagcaaattctgggtcaatgaacagaggtatggaggaatttccattggaggaaagc4800
tcccagtcgtccccatcacgggggaagcacttgttgggtttttaagcgaccttggccgga4860
tcatgaatgtgagcgggggccctatcactagagaggcctctaaagaaatacctgatttcc4920
ttaaacatctagaaactgaagacaacattaaggtgtggtttaataacaaaggctggcatg4980
ccctggtcagctttctcaatgtggcccacaacgccatcttacgggccagcctgcctaagg5040
acaggagccccgaggagtatggaatcaccgtcattagccaacccctgaacctgaccaagg5100
agcagctctcagagattacagtgctgaccacttcagtggatgctgtggttgccatctgcg5160
tgattttctccatgtccttcgtcccagccagctttgtcctttatttgatccaggagcggg5220
tgaacaaatccaagcacctccagtttatcagtggagtgagccccaccacctactgggtaa5280
ccaacttcctctgggacatcatgaattattccgtgagtgctgggctggtggtgggcatct5340
tcatcgggtttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtggcac5400
tgctcctgctgtatggatgggcggtcattcccatgatgtacccagcatccttcctgtttg5460
atgtccccagcacagcctatgtggctttatcttgtgctaatctgttcatcggcatcaaca5520
gcagtgctattaccttcatcttggaattatttgagaataaccggacgctgctcaggttca5580
acgccgtgctgaggaagctgctcattgtcttcccccacttctgcctgggccggggcctca5640
ttgaccttgcactgagccaggctgtgacagatgtctatgcccggtttggtgaggagcact5700
ctgcaaatccgttccactgggacctgattgggaagaacctgtttgccatggtggtggaag5760
gggtggtgtacttcctcctgaccctgctggtccagcgccacttcttcctctcccaatgga5820
ttgccgagcccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaagac5880
aaagaattattactggtggaaataaaactgacatcttaaggctacatgaactaaccaaga5940
tttatccaggcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctggag6000
agtgctttggcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgctca6060
ctggggacaccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaacca6120
atatttctgaagtccatcaaaatatgggctactgtcctcagtttgatgcaatcgatgagc6180
tgctcacaggacgagaacatctttacctttatgcccggcttcgaggtgtaccagcagaag6240
aaatcgaaaaggttgcaaactggagtattaagagcctgggcctgactgtctacgccgact6300
gcctggctggcacgtacagtgggggcaacaagcggaaactctccacagccatcgcactca6360
ttggctgcccaccgctggtgctgctggatgagcccaccacagggatggacccccaggcac6420
gccgcatgctgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcctca6480
catcccacagcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaaagg6540
gcgcctttcgatgtatgggcaccattcagcatctcaagtccaaatttggagatggctata6600
tcgtcacaatgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctgtgg6660
agcagttcttccaggggaacttcccaggcagtgtgcagagggagaggcactacaacatgc6720
tccagttccaggtctcctcctcctccctggcgaggatcttccagctcctcctctcccaca6780
aggacagcctgctcatcgaggagtactcagtcacacagaccacactggaccaggtgtttg6840
taaattttgctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctgctg6900
gagccagtcgacaagcccaggactgatctttcacaccgctcgttcctgcagccagaaagg6960
aactctgggcagctggaggcgcaggagcctgtgcccatatggtcatccaaatggactggc7020
cagcgtaaatgaccccactgcagcagaaaacaaacacacgaggagcatgcagcgaattca7080
gaaagaggtctttcagaaggaaaccgaaactgacttgctcacctggaacacctgatggtg7140
aaaccaaacaaatacaaaatccttctccagaccccagaactagaaaccccgggccatccc7200
actagcagctttggcctccatattgctctcatttcaagcagatctgcttttctgcatgtt7260
tgtctgtgtgtctgcgttgtgtgtgattttcatggaaaaataaaatgcaaatgcactcat7320
cacaaa7326
<210>3
<211>4464
<212>dna
<213>人工序列
<220>
<223>示例性上游载体序列,包含itr,启动子,cds,
itr
<400>3
ttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcc60
cgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtg120
gccaactccatcactaggggttcctgcggcaattcagtcgataactataacggtcctaag180
gtagcgatttaaatggtaccgggccccagaagcctggtggttgtttgtccttctcagggg240
aaaagtgaggcggccccttggaggaaggggccgggcagaatgatctaatcggattccaag300
cagctcaggggattgtctttttctagcaccttcttgccactcctaagcgtcctccgtgac360
cccggctgggatttagcctggtgctgtgtcagccccgggtgccgcagggggacggctgcc420
ttcgggggggacggggcagggcggggttcggcttctggcgtgtgaccggcggctctagag480
cctctgctaaccatgttcatgccttcttctttttcctacagctcctgggcaacgtgctgg540
ttattgtgctgtctcatcattttggcaaagaattaccaccatgggcttcgtgagacagat600
acagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggt660
ggaactcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaaccc720
gctctacagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgct780
gccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccacccc840
aggagaatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcg900
agattttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggac960
agagctacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgc1020
aggaagaggaatacgaataagggatatcttgaaagatgaagaaacactgacactatttct1080
cattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccg1140
tccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcga1200
ggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgcta1260
tgccctgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaa1320
cgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaagg1380
tatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtt1440
tatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatgg1500
tggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccc1560
cgagggaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggc1620
ctttctggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaac1680
atccttttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttg1740
gagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagc1800
acgaaggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagtt1860
ggtcaaagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacaca1920
gatgaacatgatcagagataccctggggaacccaacagtaaaagactttttgaataggca1980
gcttggtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcg2040
ggaaagccaggctgacgacatggccaacttcgactggagggacatatttaacatcactga2100
tcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaag2160
ctacaatgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgtt2220
ctgggccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgt2280
gaagtataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacag2340
gtattgggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgg2400
gtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcgga2460
ggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattcttt2520
catgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgt2580
ctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaa2640
aaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccat2700
catgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacatta2760
cagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgct2820
gtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgt2880
catctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgac2940
cgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactga3000
gtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacag3060
tcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgc3120
tgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaac3180
cccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttc3240
aaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatcc3300
agagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcc3360
tggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtgga3420
ccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagc3480
tgggaaaaccaccaccttgtccatcctgacgggtctgttgccaccaacctctgggactgt3540
gctcgttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttggcat3600
gtgtccacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgttcta3660
tgcccagctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgttgga3720
ggacacaggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggcatgca3780
gagaaagctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctggacga3840
acccacctctggggtggacccttactcgagacgctcaatctgggatctgctcctgaagta3900
tcgctcaggcagaaccatcatcatgtccactcaccacatggacgaggccgacctccttgg3960
ggaccgcattgccatcattgcccagggaaggctctactgctcaggcaccccactcttcct4020
gaagaactgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaacatcca4080
gagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccac4140
gtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatga4200
gctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtca4260
agaacttatcttccttcttccatttaaattagggataacagggtaatggcgcgggccgca4320
ggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggc4380
cgcccgggcaaagcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcg4440
agcgcgcagagagggagtggccaa4464
<210>4
<211>4581
<212>dna
<213>人工序列
<220>
<223>示例性下游载体序列,包含itr,cds,
转录后响应元件,多腺苷酸化序列,
itr
<400>4
ttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcc60
cgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtg120
gccaactccatcactaggggttcctgcggcaattcagtcgataactataacggtcctaag180
gtagcgatttaaataacatccagagccaaaggaaaggcagtgaggggacctgcagctgct240
cgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaactccagaacaag300
tcctggatggggatgtaaatgagctgatggatgtagttctccaccatgttccagaggcaa360
agctggtggagtgcattggtcaagaacttatcttccttcttccaaataagaacttcaagc420
acagagcatatgccagccttttcagagagctggaggagacgctggctgaccttggtctca480
gcagttttggaatttctgacactcccctggaagagatttttctgaaggtcacggaggatt540
ctgattcaggacctctgtttgcgggtggcgctcagcagaaaagagaaaacgtcaaccccc600
gacacccctgcttgggtcccagagagaaggctggacagacaccccaggactccaatgtct660
gctccccaggggcgccggctgctcacccagagggccagcctcccccagagccagagtgcc720
caggcccgcagctcaacacggggacacagctggtcctccagcatgtgcaggcgctgctgg780
tcaagagattccaacacaccatccgcagccacaaggacttcctggcgcagatcgtgctcc840
cggctacctttgtgtttttggctctgatgctttctattgttatccctccttttggcgaat900
accccgctttgacccttcacccctggatatatgggcagcagtacaccttcttcagcatgg960
atgaaccaggcagtgagcagttcacggtacttgcagacgtcctcctgaataagccaggct1020
ttggcaaccgctgcctgaaggaagggtggcttccggagtacccctgtggcaactcaacac1080
cctggaagactccttctgtgtccccaaacatcacccagctgttccagaagcagaaatgga1140
cacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaagctcaccatgctgc1200
cagagtgccccgagggtgccgggggcctcccgcccccccagagaacacagcgcagcacgg1260
aaattctacaagacctgacggacaggaacatctccgacttcttggtaaaaacgtatcctg1320
ctcttataagaagcagcttaaagagcaaattctgggtcaatgaacagaggtatggaggaa1380
tttccattggaggaaagctcccagtcgtccccatcacgggggaagcacttgttgggtttt1440
taagcgaccttggccggatcatgaatgtgagcgggggccctatcactagagaggcctcta1500
aagaaatacctgatttccttaaacatctagaaactgaagacaacattaaggtgtggttta1560
ataacaaaggctggcatgccctggtcagctttctcaatgtggcccacaacgccatcttac1620
gggccagcctgcctaaggacaggagccccgaggagtatggaatcaccgtcattagccaac1680
ccctgaacctgaccaaggagcagctctcagagattacagtgctgaccacttcagtggatg1740
ctgtggttgccatctgcgtgattttctccatgtccttcgtcccagccagctttgtccttt1800
atttgatccaggagcgggtgaacaaatccaagcacctccagtttatcagtggagtgagcc1860
ccaccacctactgggtaaccaacttcctctgggacatcatgaattattccgtgagtgctg1920
ggctggtggtgggcatcttcatcgggtttcagaagaaagcctacacttctccagaaaacc1980
ttcctgcccttgtggcactgctcctgctgtatggatgggcggtcattcccatgatgtacc2040
cagcatccttcctgtttgatgtccccagcacagcctatgtggctttatcttgtgctaatc2100
tgttcatcggcatcaacagcagtgctattaccttcatcttggaattatttgagaataacc2160
ggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgtcttcccccacttct2220
gcctgggccggggcctcattgaccttgcactgagccaggctgtgacagatgtctatgccc2280
ggtttggtgaggagcactctgcaaatccgttccactgggacctgattgggaagaacctgt2340
ttgccatggtggtggaaggggtggtgtacttcctcctgaccctgctggtccagcgccact2400
tcttcctctcccaatggattgccgagcccactaaggagcccattgttgatgaagatgatg2460
atgtggctgaagaaagacaaagaattattactggtggaaataaaactgacatcttaaggc2520
tacatgaactaaccaagatttatccaggcacctccagcccagcagtggacaggctgtgtg2580
tcggagttcgccctggagagtgctttggcctcctgggagtgaatggtgccggcaaaacaa2640
ccacattcaagatgctcactggggacaccacagtgacctcaggggatgccaccgtagcag2700
gcaagagtattttaaccaatatttctgaagtccatcaaaatatgggctactgtcctcagt2760
ttgatgcaatcgatgagctgctcacaggacgagaacatctttacctttatgcccggcttc2820
gaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtattaagagcctgggcc2880
tgactgtctacgccgactgcctggctggcacgtacagtgggggcaacaagcggaaactct2940
ccacagccatcgcactcattggctgcccaccgctggtgctgctggatgagcccaccacag3000
ggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgagcatcatcagagaag3060
ggagggctgtggtcctcacatcccacagcatggaagaatgtgaggcactgtgtacccggc3120
tggccatcatggtaaagggcgcctttcgatgtatgggcaccattcagcatctcaagtcca3180
aatttggagatggctatatcgtcacaatgaagatcaaatccccgaaggacgacctgcttc3240
ctgacctgaaccctgtggagcagttcttccaggggaacttcccaggcagtgtgcagaggg3300
agaggcactacaacatgctccagttccaggtctcctcctcctccctggcgaggatcttcc3360
agctcctcctctcccacaaggacagcctgctcatcgaggagtactcagtcacacagacca3420
cactggaccaggtgtttgtaaattttgctaaacagcagactgaaagtcatgacctccctc3480
tgcaccctcgagctgctggagccagtcgacaagcccaggactgaaagcttatcgataatc3540
aacctctggattacaaaatttgtgaaagattgactggtattcttaactatgttgctcctt3600
ttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatgg3660
ctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggc3720
ccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggtt3780
ggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattg3840
ccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgg3900
gcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcct3960
gtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatc4020
cagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtcttcgcc4080
ttcgccctcagacgagtcggatctccctttgggccgcctccccgcatgccgctgatcagc4140
ctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttcctt4200
gaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgca4260
ttgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaaggggga4320
ggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggc4380
ggaaagaaccagctggggatttaaattagggataacagggtaatggcgcgggccgcagga4440
acccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgc4500
ccgggcaaagcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagc4560
gcgcagagagggagtggccaa4581
<210>5
<211>199
<212>dna
<213>智人
<400>5
gggccccagaagcctggtggttgtttgtccttctcaggggaaaagtgaggcggccccttg60
gaggaaggggccgggcagaatgatctaatcggattccaagcagctcaggggattgtcttt120
ttctagcaccttcttgccactcctaagcgtcctccgtgaccccggctgggatttagcctg180
gtgctgtgtcagccccggg199
<210>6
<211>186
<212>dna
<213>人工序列
<220>
<223>非翻译区(utr)序列
<400>6
gtgccgcagggggacggctgccttcgggggggacggggcagggcggggttcggcttctgg60
cgtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttccta120
cagctcctgggcaacgtgctggttattgtgctgtctcatcattttggcaaagaattacca180
ccatgg186
<210>7
<211>593
<212>dna
<213>土拨鼠肝炎病毒
<400>7
atcgataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactat60
gttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgct120
tcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgag180
gagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacc240
cccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttcccc300
ctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggct360
cggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttgg420
ctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcg480
gccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccg540
cgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctcccc593
<210>8
<211>269
<212>dna
<213>人工序列
<220>
<223>牛生长激素多腺苷酸化序列
<400>8
cgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctccccc60
gtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaa120
attgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggac180
agcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatg240
gcttctgaggcggaaagaaccagctgggg269
<210>9
<211>4087
<212>dna
<213>人工序列
<220>
<223>示例性部分上游载体序列,包含启动子,
cds
<400>9
ggtaccgggccccagaagcctggtggttgtttgtccttctcaggggaaaagtgaggcggc60
cccttggaggaaggggccgggcagaatgatctaatcggattccaagcagctcaggggatt120
gtctttttctagcaccttcttgccactcctaagcgtcctccgtgaccccggctgggattt180
agcctggtgctgtgtcagccccgggtgccgcagggggacggctgccttcgggggggacgg240
ggcagggcggggttcggcttctggcgtgtgaccggcggctctagagcctctgctaaccat300
gttcatgccttcttctttttcctacagctcctgggcaacgtgctggttattgtgctgtct360
catcattttggcaaagaattaccaccatgggcttcgtgagacagatacagcttttgctct420
ggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaactcgtgtggc480
ctttatctttatttctggtcttgatctggttaaggaatgccaacccgctctacagccatc540
atgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgtggctccagg600
ggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggagaatctcctg660
gaattgtgtcaaactataacaactccatcttggcaagggtatatcgagattttcaagaac720
tcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagctacacatct780
tgtcccaattcatggacaccctccggactcacccggagagaattgcaggaagaggaatac840
gaataagggatatcttgaaagatgaagaaacactgacactatttctcattaaaaacatcg900
gcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccagagcagttcg960
ctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccctcctggagc1020
gcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccctgtgctccc1080
tctcccagggcaccctacagtggatagaagacactctgtatgccaacgtggacttcttca1140
agctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatcaatctgagat1200
cttggggaggaatattatctgatatgtcaccaagaattcaagagtttatccatcggccga1260
gtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtccagagacct1320
ttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagggaggtggct1380
ctcgggtgctctccttcaactggtatgaagacaataactataaggcctttctggggattg1440
actccacaaggaaggatcctatctattcttatgacagaagaacaacatccttttgtaatg1500
cattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggagggcggcaaagc1560
ctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaaggatactga1620
agaatgccaactcaacttttgaagaactggaacacgttaggaagttggtcaaagcctggg1680
aagaagtagggccccagatctggtacttctttgacaacagcacacagatgaacatgatca1740
gagataccctggggaacccaacagtaaaagactttttgaataggcagcttggtgaagaag1800
gtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaagccaggctg1860
acgacatggccaacttcgactggagggacatatttaacatcactgatcgcaccctccgcc1920
ttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctacaatgatgaaa1980
ctcagctcacccaacgtgccctctctctactggaggaaaacatgttctgggccggagtgg2040
tattccctgacatgtatccctggaccagctctctaccaccccacgtgaagtataagatcc2100
gaatggacatagacgtggtggagaaaaccaataagattaaagacaggtattgggattctg2160
gtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttgcctatctgc2220
aggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctccagttggaa2280
tctacctccagcagatgccctacccctgcttcgtggacgattctttcatgatcatcctga2340
accgctgtttccctatcttcatggtgctggcatggatctactctgtctccatgactgtga2400
agagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatcagggtgtct2460
ccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgtcgatgagca2520
tcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcgacccattca2580
tcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgctttctgctca2640
gcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatctatttcaccc2700
tctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctgagctgaaga2760
aggctgtgagcttactgtctccggtggcatttggatttggcactgagtacctggttcgct2820
ttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtcccacggaagggg2880
acgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctgtctatggct2940
tactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccacttccttggt3000
actttcttctacaagagtcgtattggcttggcggtgaagggtgttcaaccagagaagaaa3060
gagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagcacccagaag3120
gaatacacgactccttctttgaacgtgagcatccagggtgggttcctggggtatgcgtga3180
agaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtctgaacatca3240
ccttctacgagaaccagatcaccgcattcctgggccacaatggagctgggaaaaccacca3300
ccttgtccatcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaa3360
gggacattgaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcaca3420
acatcctgttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaag3480
gaaagtcccaggaggaggcccagctggagatggaagccatgttggaggacacaggcctcc3540
accacaagcggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcgg3600
ttgccattgcctttgtgggagatgccaaggtggtgattctggacgaacccacctctgggg3660
tggacccttactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaa3720
ccatcatcatgtccactcaccacatggacgaggccgacctccttggggaccgcattgcca3780
tcattgcccagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttg3840
gcacaggcttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaag3900
gcagtgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacg3960
tcgatgacctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtag4020
ttctccaccatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttcc4080
ttcttcc4087
<210>10
<211>4203
<212>dna
<213>人工序列
<220>
<223>示例性部分下游载体序列,包含cds,
转录后响应元件,多腺苷酸化序列
<400>10
acatccagagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttct60
ccaccacgtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatg120
taaatgagctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgca180
ttggtcaagaacttatcttccttcttccaaataagaacttcaagcacagagcatatgcca240
gccttttcagagagctggaggagacgctggctgaccttggtctcagcagttttggaattt300
ctgacactcccctggaagagatttttctgaaggtcacggaggattctgattcaggacctc360
tgtttgcgggtggcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgg420
gtcccagagagaaggctggacagacaccccaggactccaatgtctgctccccaggggcgc480
cggctgctcacccagagggccagcctcccccagagccagagtgcccaggcccgcagctca540
acacggggacacagctggtcctccagcatgtgcaggcgctgctggtcaagagattccaac600
acaccatccgcagccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgt660
ttttggctctgatgctttctattgttatccctccttttggcgaataccccgctttgaccc720
ttcacccctggatatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtg780
agcagttcacggtacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcc840
tgaaggaagggtggcttccggagtacccctgtggcaactcaacaccctggaagactcctt900
ctgtgtccccaaacatcacccagctgttccagaagcagaaatggacacaggtcaaccctt960
caccatcctgcaggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagg1020
gtgccgggggcctcccgcccccccagagaacacagcgcagcacggaaattctacaagacc1080
tgacggacaggaacatctccgacttcttggtaaaaacgtatcctgctcttataagaagca1140
gcttaaagagcaaattctgggtcaatgaacagaggtatggaggaatttccattggaggaa1200
agctcccagtcgtccccatcacgggggaagcacttgttgggtttttaagcgaccttggcc1260
ggatcatgaatgtgagcgggggccctatcactagagaggcctctaaagaaatacctgatt1320
tccttaaacatctagaaactgaagacaacattaaggtgtggtttaataacaaaggctggc1380
atgccctggtcagctttctcaatgtggcccacaacgccatcttacgggccagcctgccta1440
aggacaggagccccgaggagtatggaatcaccgtcattagccaacccctgaacctgacca1500
aggagcagctctcagagattacagtgctgaccacttcagtggatgctgtggttgccatct1560
gcgtgattttctccatgtccttcgtcccagccagctttgtcctttatttgatccaggagc1620
gggtgaacaaatccaagcacctccagtttatcagtggagtgagccccaccacctactggg1680
taaccaacttcctctgggacatcatgaattattccgtgagtgctgggctggtggtgggca1740
tcttcatcgggtttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtgg1800
cactgctcctgctgtatggatgggcggtcattcccatgatgtacccagcatccttcctgt1860
ttgatgtccccagcacagcctatgtggctttatcttgtgctaatctgttcatcggcatca1920
acagcagtgctattaccttcatcttggaattatttgagaataaccggacgctgctcaggt1980
tcaacgccgtgctgaggaagctgctcattgtcttcccccacttctgcctgggccggggcc2040
tcattgaccttgcactgagccaggctgtgacagatgtctatgcccggtttggtgaggagc2100
actctgcaaatccgttccactgggacctgattgggaagaacctgtttgccatggtggtgg2160
aaggggtggtgtacttcctcctgaccctgctggtccagcgccacttcttcctctcccaat2220
ggattgccgagcccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaa2280
gacaaagaattattactggtggaaataaaactgacatcttaaggctacatgaactaacca2340
agatttatccaggcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctg2400
gagagtgctttggcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgc2460
tcactggggacaccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaa2520
ccaatatttctgaagtccatcaaaatatgggctactgtcctcagtttgatgcaatcgatg2580
agctgctcacaggacgagaacatctttacctttatgcccggcttcgaggtgtaccagcag2640
aagaaatcgaaaaggttgcaaactggagtattaagagcctgggcctgactgtctacgccg2700
actgcctggctggcacgtacagtgggggcaacaagcggaaactctccacagccatcgcac2760
tcattggctgcccaccgctggtgctgctggatgagcccaccacagggatggacccccagg2820
cacgccgcatgctgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcc2880
tcacatcccacagcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaa2940
agggcgcctttcgatgtatgggcaccattcagcatctcaagtccaaatttggagatggct3000
atatcgtcacaatgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctg3060
tggagcagttcttccaggggaacttcccaggcagtgtgcagagggagaggcactacaaca3120
tgctccagttccaggtctcctcctcctccctggcgaggatcttccagctcctcctctccc3180
acaaggacagcctgctcatcgaggagtactcagtcacacagaccacactggaccaggtgt3240
ttgtaaattttgctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctg3300
ctggagccagtcgacaagcccaggactgaaagcttatcgataatcaacctctggattaca3360
aaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggat3420
acgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcct3480
ccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaac3540
gtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccacca3600
cctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactca3660
tcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccg3720
tggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctgga3780
ttctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttcctt3840
cccgcggcctgctgccggctctgcggcctcttccgcgtcttcgccttcgccctcagacga3900
gtcggatctccctttgggccgcctccccgcatgccgctgatcagcctcgactgtgccttc3960
tagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgc4020
cactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtg4080
tcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaa4140
tagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctg4200
ggg4203
<210>11
<211>208
<212>dna
<213>人工序列
<220>
<223>重叠c序列,在框内aug密码子前具有框外aug密码子
<400>11
acauccagagccaaaggaaaggcagugaggggaccugcagcugcucgucuaaggguuucu60
ccaccacguguccagcccacgucgaugaccuaacuccagaacaaguccuggauggggaug120
uaaaugagcugauggauguaguucuccaccauguuccagaggcaaagcugguggagugca180
uuggucaagaacuuaucuuccuucuucc208