与相关申请的交叉引用
本申请要求2018年10月1日提交的美国临时专利申请号62/739,471的利益和优先权,所述临时申请的全部公开内容为所有目的整体通过参考并入本文。
序列表
本申请含有以ascii格式电子提交并整体通过参考并入本文的序列表。所述2019年9月22日生成的ascii副本名为ulp-001wo_sl_st25.txt,大小为98,889字节。
本公开总的来说涉及腺相关病毒载体、腺相关病毒以及它们在用于治疗丙酸血症的基因疗法中的使用方法。
背景技术:
丙酸血症(pa),又称丙酸尿,是由有活性的丙酰辅酶a羧化酶(pcc)的缺乏引起的一种有机酸代谢的先天性错误,所述酶为丙酰辅酶a转化为(d)-甲基丙二酰辅酶a所需,这是奇数链脂肪酸和产丙酸氨基酸、特别是异亮氨酸、苏氨酸、甲硫氨酸和缬氨酸分解代谢途径中的关键步骤。pcc酶由两个不同的亚基α和β组成,它们分别由pcca和pccb基因编码。丙酰辅酶a羧化酶缺陷可以由pcca或pccb任一者中的突变引起。在一项研究中,对30位pa患者进行了突变分析,发现15位患者具有α-亚基缺乏,并且15位患者具有β-亚基缺乏。参见yang等,2004,molgenetandmetab.81:335-342。
在美国,pa的估计发病率是1:105,000至1:130,000。这种罕见的常染色体隐性代谢障碍在新生儿早期表现为进食不良、呕吐、嗜睡、癫痫发作和缺乏肌肉张力。如果不治疗,由于继发性高氨血症、感染、心肌病或基底节性中风,死亡可能迅速发生。pa在新生儿中可以几乎立即被诊断出来,并且在美国所述疾病被包括在新生儿筛查疾病组中。
目前,pa通过氨基酸前体的饮食限制、补充l-肉碱以解决肉碱水平降低问题以及施用抗生素以降低肠道细菌的丙酸产量进行管控。在患者无法通过标准治疗来管控的情况下,肝移植在pa的管控中发挥作用。然而,尽管通过营养、辅因子和抗生素疗法的复杂组合进行了应对所述疾病的积极尝试,但pa患者的长期预后仍然不良。参见vandermeer等,1996,eur.j.pediatr.155:205-210。因此,需要解决所述疾病的根本原因即pcc的缺乏的改进的治疗方法。
本发明通过产生介导功能性pcca或pccb基因向pa患者的转移的腺相关病毒载体来应对这种需求。本发明还描述了将功能性pcca或pccb基因递送到pa患者的重组腺相关病毒(raav)的产生。
技术实现要素:
本发明提供了组合物和它们在基因疗法中的使用方法。更具体来说,本文中提供了可用于治疗pa的包含腺相关病毒(aav)衣壳和包装在其中的载体基因组的重组腺相关病毒(raav)。
一方面,本公开提供了一种重组腺相关病毒(raav),其包含aav衣壳和包装在其中的载体基因组,所述载体基因组以5’至3’的顺序包含:(a)5’-反向末端重复序列(5’-itr)序列;(b)启动子序列;(c)pcca的部分或完整编码序列;和(d)3’-反向末端重复序列(3’-itr)序列。
另一方面,本公开提供了一种raav,其包含aav衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-itr序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)pcca的部分或完整编码序列;(f)多聚腺苷酸化信号序列;和(g)3’-itr序列。
在某些实施方式中,本公开提供了一种raav,其包含aav衣壳和包装在其中的载体基因组,所述载体基因组包含aav5’-itr序列、启动子序列、pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列和aav3’-itr序列。
在某些实施方式中,本公开提供了一种raav,其包含aav衣壳和包装在其中的载体基因组,所述载体基因组包含aav5’-itr、启动子序列、人类pcca5’-非翻译区(5’-utr)的截短或完整的核苷酸序列、pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类pcca3’-非翻译区(3’-utr)核苷酸序列和aav3’-itr。
在某些实施方式中,本公开提供了一种raav,其包含aav衣壳和包装在其中的载体基因组,所述载体基因组包含由seqidno:30表示的完整的人类pcca5’-utr。在某些实施方式中,所述包装的基因组包含截短的人类pcca5’-utr核苷酸序列。在某些实施方式中,所述人类pcca5’-utr的截短的核苷酸序列包含seqidno:30的一部分。在某些实施方式中,所述人类pcca5’-utr的截短的核苷酸序列包含与seqidno:30的等长度区域至少95%同一性的至少100个连续核苷酸的核苷酸序列。在某些实施方式中,当所述包装的载体基因组中的部分或完整编码序列是针对pcca时,所述截短或完整的人类pcca5’-utr位于所述内含子序列与pcca的部分或完整编码序列之间。
在某些实施方式中,所述包装的载体基因组包含由seqidno:31表示的完整的人类pcca3’-utr。在某些实施方式中,所述包装的基因组包含截短的人类pcca3’-utr核苷酸序列。在某些实施方式中,所述人类pcca3’-utr的截短的核苷酸序列包含seqidno:31的一部分。在某些实施方式中,所述人类pcca3’-utr的截短的核苷酸序列包含与seqidno:31的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,当所述包装的载体基因组中的部分或完整编码序列是针对pcca时,所述截短或完整的人类pcca3’-utr位于所述多聚腺苷酸化信号序列与3’-itr序列之间。
在一个实施方式中,所述pcca的部分或完整编码序列是野生型编码序列。在可选实施方式中,所述pcca的部分或完整编码序列是密码子优化的编码序列。在一个示例性实施方式中,所述pcca的部分或完整编码序列为了在人类中表达而被密码子优化。
在某些实施方式中,pcca由seqidno:1中示出的野生型编码序列编码。在另一个实施方式中,可以使用表达pcca的天然同型或变体的编码序列,例如在uniprotkb/swiss-prot登记号p05165-1(seqidno:25)、p05165-2(seqidno:26)和p05165-3(seqidno:27)中示出的。在某些实施方式中,pcca由密码子优化的编码序列编码。
在某些实施方式中,pcca由与seqidno:1中示出的野生型编码序列具有少于80%同一性的密码子优化的编码序列编码。在某些示例性实施方式中,pcca由选自seqidnos:2-6的密码子优化的编码序列编码。在某些实施方式中,pcca由与选自seqidnos:2-6的序列至少80%同一性的密码子优化的编码序列编码。在某些实施方式中,pcca由与选自seqidnos:2-6的序列至少90%同一性的密码子优化的编码序列编码。在某些实施方式中,pcca由与选自seqidnos:2-6的序列至少95%同一性的密码子优化的编码序列编码。在某些实施方式中,所述pcca的编码序列可以在3’末端处进一步包含终止密码子(tga、taa或tag)。在某些实施方式中,所述表达的pcca包含seqidno:16的氨基酸序列或由其构成。
另一方面,本公开提供了一种重组腺相关病毒(raav),其包含aav衣壳和包装在其中的载体基因组,所述载体基因组以5’至3’的顺序包含:(a)5’-itr序列;(b)启动子序列;(c)pccb的部分或完整编码序列;和(d)3’-itr序列。
另一方面,本公开提供了一种raav,其包含aav衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-itr序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)pccb的部分或完整编码序列;(f)多聚腺苷酸化信号序列;和(g)3’-itr序列。
在某些实施方式中,本公开提供了一种raav,其包含aav衣壳和包装在其中的载体基因组,所述载体基因组包含aav5’-itr序列、启动子序列、pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列和aav3’-itr序列。
在某些实施方式中,本公开提供了一种raav,其包含aav衣壳和包装在其中的载体基因组,所述载体基因组包含aav5’-itr、启动子序列、人类pccb5’-非翻译区(5’-utr)的截短或完整的核苷酸序列、pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类pccb3’-非翻译区(3’-utr)核苷酸序列和aav3’-itr。
在某些实施方式中,所述包装的载体基因组包含由seqidno:32表示的完整的人类pccb5’-utr。在某些实施方式中,所述包装的载体基因组包含截短的人类pccb5’-utr核苷酸序列。在某些实施方式中,所述人类pccb5’-utr的截短的核苷酸序列包含seqidno:32的一部分。在某些实施方式中,所述人类pccb5’-utr的截短的核苷酸序列包含与seqidno:32的等长度区域至少95%同一性的至少100个连续核苷酸的核苷酸序列。在某些实施方式中,当所述包装的载体基因组中的部分或完整编码序列是针对pccb时,所述截短或完整的人类pccb5’-utr位于所述内含子序列与pccb的部分或完整编码序列之间。
在某些实施方式中,所述包装的载体基因组包含由seqidno:33表示的完整的人类pccb3’-utr。在某些实施方式中,所述包装的载体基因组包含截短的人类pccb3’-utr核苷酸序列。在某些实施方式中,所述人类pccb3’-utr的截短的核苷酸序列包含seqidno:33的一部分。在某些实施方式中,所述人类pccb3’-utr的截短的核苷酸序列包含与seqidno:33的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,当所述包装的载体基因组中的部分或完整编码序列是针对pccb时,所述截短或完整的人类pccb3’-utr位于所述多聚腺苷酸化信号序列与3’-itr序列之间。
在一个实施方式中,所述pccb的部分或完整编码序列是野生型编码序列。在可选实施方式中,所述pccb的部分或完整编码序列是密码子优化的编码序列。在一个示例性实施方式中,所述pccb的部分或完整编码序列为了在人类中表达而被密码子优化。
在某些实施方式中,pccb由seqidno:7中示出的野生型编码序列编码。在另一个实施方式中,可以使用表达pccb的天然同型或变体的编码序列,例如在uniprotkb/swiss-prot登记号p05166-1(seqidno:28)和p05166-2(seqidno:29)中示出的。在可选实施方式中,pccb由密码子优化的编码序列编码。在某些实施方式中,pccb由与seqidno:7中示出的野生型编码序列具有少于80%同一性的密码子优化的编码序列编码。在某些示例性实施方式中,pccb由选自seqidnos:8-12的密码子优化的编码序列编码。在某些实施方式中,pccb由与选自seqidnos:8-12的序列至少80%同一性的密码子优化的编码序列编码。在某些实施方式中,pccb由与选自seqidnos:8-12的序列至少90%同一性的密码子优化的编码序列编码。在某些实施方式中,pccb由与选自seqidnos:8-12的序列至少95%同一性的密码子优化的编码序列编码。在某些实施方式中,所述pccb的编码序列还可以在3’末端处包含终止密码子(tga、taa或tag)。在某些实施方式中,所述表达的pccb包含seqidno:17的氨基酸序列或由其构成。
在某些实施方式中,所述5’-itr序列来自于aav2。在某些实施方式中,所述3’-itr序列来自于aav2。在某些实施方式中,所述5’-itr序列和3’-itr序列来自于aav2。在某些实施方式中,所述5’-itr序列和/或3’-itr序列包含seqidno:15或由其构成。在其他实施方式中,所述5’-itr序列和/或3’-itr序列来自于非aav2来源。
在一个实施方式中,所述启动子选自鸡β-肌动蛋白(cba)启动子、巨细胞病毒(cmv)立即早期基因启动子、甲状腺素运载蛋白(ttr)启动子、甲状腺素结合球蛋白(tbg)启动子、α-1抗胰蛋白酶因子(a1at)启动子、cag启动子(使用cmv早期增强子元件、cba基因的启动子、第一外显子和第一内含子以及兔β-珠蛋白基因的剪接受体构建)、pcca基因特异性内源启动子和pccb基因特异性内源启动子。在示例性实施方式中,所述启动子是cba启动子。在一个实施方式中,所述cba启动子包含seqidno:18或由其构成。在某些实施方式中,所述启动子是基因特异性内源启动子。在一个实施方式中,所述启动子包含本源基因启动子元件。在示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对pcca时,所述启动子是pcca基因特异性内源启动子,其包含与seqidno:34的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对pccb时,所述启动子是pccb基因特异性内源启动子,其包含与seqidno:36的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。
在某些实施方式中,所述包装的载体基因组还包含一个或多个增强子序列。在一个实施方式中,所述增强子选自巨细胞病毒(cmv)立即早期基因增强子、甲状腺素运载蛋白增强子(enttr)、鸡β-肌动蛋白(cba)增强子、en34增强子和载脂蛋白e(apoe)增强子。在示例性实施方式中,所述增强子是cmv增强子。在一个实施方式中,所述cmv增强子包含seqidno:19或由其构成。在某些实施方式中,所述增强子位于所述启动子序列上游。
在某些实施方式中,包装的载体基因组还包含一个或多个内含子序列。在一个实施方式中,所述内含子选自sv40小t内含子、兔血红蛋白亚基β(rhbb)内含子、人类β珠蛋白ivs2内含子、β-珠蛋白/igg嵌合内含子(promega嵌合内含子)或hfix内含子。在一个示例性实施方式中,所述内含子是sv40小t内含子。在一个实施方式中,所述sv40小t内含子序列包含seqidno:20或由其构成。在另一个示例性实施方式中,所述内含子是rhbb内含子。在一个实施方式中,所述rhbb内含子序列包含seqidno:21或由其构成。
在某些实施方式中,包装的载体基因组还包含共有kozak序列。在某些实施方式中,所述共有kozak序列位于内含子序列下游。在一个实施方式中,所述共有kozak序列是gccgcc(seqidno:24)。在某些实施方式中,所述共有kozak序列位于pcca的编码序列上游。在某些实施方式中,所述共有kozak序列位于pccb的编码序列上游。
在某些实施方式中,包装的载体基因组还包含多聚腺苷酸化信号序列。在某些实施方式中,所述多聚腺苷酸化信号序列选自牛生长激素(bgh)多聚腺苷酸化信号序列、sv40多聚腺苷酸化信号序列、兔β珠蛋白多聚腺苷酸化信号序列、pcca基因特异性内源多聚腺苷酸化信号序列、pccb基因特异性内源多聚腺苷酸化信号序列。在示例性实施方式中,所述多聚腺苷酸化信号序列是牛生长激素(bgh)多聚腺苷酸化信号序列。在一个实施方式中,所述bgh多聚腺苷酸化信号序列包含seqidno:22或由其构成。在另一个示例性实施方式中,所述多聚腺苷酸化信号序列是sv40多聚腺苷酸化信号序列。在一个实施方式中,所述sv40多聚腺苷酸化信号序列包含seqidno:23或由其构成。在另一个示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对pcca时,所述多聚腺苷酸化信号序列包含pcca基因特异性内源多聚腺苷酸化信号序列。在一个实施方式中,所述pcca基因特异性内源多聚腺苷酸化信号序列包含与seqidno:35的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在另一个示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对pccb时,所述多聚腺苷酸化信号序列包含pccb基因特异性内源多聚腺苷酸化信号序列。在一个实施方式中,所述pccb基因特异性内源多聚腺苷酸化信号序列包含与seqidno:37的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。
在某些实施方式中,所述aav衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的aav。在一个示例性实施方式中,所述aav衣壳来自于aav9。在另一个示例性实施方式中,所述aav衣壳来自于aav8。在另一个示例性实施方式中,所述aav衣壳是aav9变体衣壳。
在某些实施方式中,本公开提供了一种raav,其中所述编码序列是针对pcca而不是针对pccb,所述启动子是pcca基因特异性内源启动子而不是pccb基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是pcca基因特异性内源多聚腺苷酸化信号序列而不是pccb基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,本公开提供了一种raav,其中所述编码序列是针对pccb而不是针对pcca,所述启动子是pccb基因特异性内源启动子而不是pcca基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是pccb基因特异性内源多聚腺苷酸化信号序列而不是pcca基因特异性内源多聚腺苷酸化信号序列。
在某些情况下,本公开提供了编码pcca的新的密码子优化的核酸序列。在一个实施方式中,所述编码pcca的密码子优化的核酸序列与seqidno:1中示出的野生型编码序列具有少于80%同一性。在某些实施方式中,所述编码pcca的密码子优化的核酸序列与seqidnos:2-6的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。在某些实施方式中,本公开提供了与seqidno:1中示出的野生型编码序列具有少于80%同一性并且与seqidnos:2-6的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核酸序列。在示例性实施方式中,本公开提供了选自seqidnos:2-6的编码pcca的核酸序列。还提供了seqidnos:2-6中示出的核酸序列的编码具有功能性pcca活性的多肽的片段。在某些实施方式中,所述编码pcca的核酸序列还可以在3’末端处包含终止密码子(tga、taa或tag)。
在某些情况下,本公开提供了编码pccb的新的密码子优化的核酸序列。在一个实施方式中,所述编码pccb的密码子优化的核酸序列与seqidno:7中示出的野生型编码序列具有少于80%同一性。在某些实施方式中,所述编码pccb的密码子优化的核酸序列与seqidnos:8-12的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。本公开提供了与seqidno:7中示出的野生型编码序列具有少于80%同一性并且与seqidnos:8-12的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核酸序列。在示例性实施方式中,本公开提供了选自seqidnos:8-12的编码pccb的核酸序列。还提供了seqidnos:8-12中示出的核酸序列的编码具有功能性pccb活性的多肽的片段。在某些实施方式中,所述编码pccb的核酸序列还可以在3’末端处包含终止密码子(tga、taa或tag)。
在某些实施方式中,本公开提供了可作为基因疗法药剂用于治疗pa的重组腺相关病毒(raav),其中所述raav包含aav衣壳和包装在其中的本文中所描述的载体基因组。在某些实施方式中,所述aav衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的aav(即aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav9、aav10、aav11、aav12、aavrh10或aavhu37)。在示例性实施方式中,所述aav载体是aav血清型9(aav9)载体、aav9变体载体、aav血清型8(aav8)载体或aav血清型2(aav2)载体。
在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(pa)的raav,所述raav包含aav衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-itr序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)选自seqidnos:1-6的pcca的编码序列;(f)多聚腺苷酸化信号序列;和(g)3’itr序列。
在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(pa)的raav,所述raav包含aav衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-itr序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)选自seqidnos:7-12的pccb的编码序列;(f)多聚腺苷酸化信号序列;和(g)3’itr序列。
在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(pa)的raav,所述raav包含aav9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-itr序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)选自seqidnos:1-6的pcca的编码序列;(f)多聚腺苷酸化信号序列;和(g)3’-itr序列。
在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(pa)的raav,所述raav包含aav9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-itr序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)选自seqidnos:7-12的pccb的编码序列;(f)多聚腺苷酸化信号序列;和(g)3’-itr序列。
在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(pa)的raav,所述raav包含aav9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)aav25’-itr序列;(b)cmv增强子序列;(c)cba启动子序列;(d)rhbb或sv40小t内含子序列;(e)选自seqidnos:1-6的pcca的编码序列;(f)bgh或sv40多聚腺苷酸化信号序列;和(g)aav23’-itr序列。
在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(pa)的raav,所述raav包含aav9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)aav25’-itr序列;(b)cmv增强子序列;(c)cba启动子序列;(d)rhbb或sv40小t内含子序列;(e)选自seqidnos:7-12的pccb的编码序列;(f)bgh或sv40多聚腺苷酸化信号序列;和(g)aav23’-itr序列。
在某些实施方式中,本公开提供了一种重组核酸构建物,其包含(a)5’-itr序列;(b)启动子序列;(c)pcca的部分或完整编码序列;和(d)3’-itr序列。在某些实施方式中,本公开提供了一种重组核酸构建物,其包含(a)5’-itr序列;(b)启动子序列;(c)pccb的部分或完整编码序列;和(d)3’-itr序列。
在某些情况下,本公开提供了本文公开的raav用于治疗pa的用途,其中所述raav包括aav衣壳和包装在其中的载体基因组。在某些实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-itr,启动子序列,pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列,以及3’-itr。在示例性实施方式中,所述包装的基因组还包含在所述启动子上游的增强子序列、在所述启动子下游的内含子和在所述3’-itr上游的多聚腺苷酸化序列。在一个示例性实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:aav25’-itr序列,cmv增强子,cba启动子,sv40小t内含子,pcca的编码序列,bgh多聚腺苷酸化信号序列和aav23’-itr。在某些实施方式中,所述包装的基因组还包含位于所述内含子序列下游的共有kozak序列。在某些实施方式中,所述pcca的编码序列选自seqidnos:1-6。在某些实施方式中,所述衣壳是aav9衣壳。
在某些情况下,本公开提供了本文中公开的raav用于治疗pa的用途,其中所述raav包括aav衣壳和包装在其中的载体基因组。在某些实施方式中,所述包装的基因组作为可操作连接的组件以5’至3’的顺序包含:5’-itr,启动子序列(例如pcca基因特异性内源启动子序列),人类pcca5’-utr的截短或完整的核苷酸序列,pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列,人类pcca3’-utr的截短或完整的核苷酸序列,以及3’-itr。在示例性实施方式中,所述包装的基因组还包含在所述启动子序列上游的增强子序列、在所启动子述下游的内含子和在所述3’-itr上游的pcca基因特异性多聚腺苷酸化序列。在某些实施方式中,所述包装的基因组还包含位于所述人类pcca5’-utr的截短或完整的核苷酸序列下游并在pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列上游的共有kozak序列。在某些实施方式中,所述pcca的编码序列选自seqidnos:1-6。在某些实施方式中,所述衣壳是aav9衣壳。
在某些情况下,本公开提供了本文中公开的raav用于治疗pa的用途,其中所述raav包括aav衣壳和包装在其中的载体基因组。在某些实施方式中,所述包装的基因组作为可操作连接的组件以5’至3’的顺序包含:5’-itr,启动子序列,pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列,以及3’-itr。在示例性实施方式中,所述包装的基因组还包含在所述启动子序列上游的增强子序列、在所述启动子下游的内含子和在所述3’-itr上游的多聚腺苷酸化序列。在一个示例性实施方式中,所述包装的基因组作为可操作连接的组件以5’至3’的顺序包含:aav25’-itr序列,cmv增强子,cba启动子,sv40小t内含子,pccb的编码序列,bgh多聚腺苷酸化信号序列和aav23’-itr。在某些实施方式中,所述包装的基因组还包含位于所述内含子序列下游的共有kozak序列。在某些实施方式中,所述pccb的编码序列选自seqidnos:7-12。在某些实施方式中,所述衣壳是aav9衣壳。
在某些情况下,本公开提供了本文中公开的raav用于治疗pa的用途,其中所述raav包括aav衣壳和包装在其中的载体基因组。在某些实施方式中,所述包装的基因组作为可操作连接的组件以5’至3’的顺序包含:5’-itr,启动子序列(例如pccb基因特异性内源启动子序列),人类pccb5’-utr的截短或完整的核苷酸序列,pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列,人类pccb3’-utr的截短或完整的核苷酸序列,以及3’-itr。在示例性实施方式中,所述包装的基因组还包含在所述启动子序列上游的增强子序列、在所述启动子下游的内含子和在所述3’-itr上游的pccb基因特异性多聚腺苷酸化序列。在某些实施方式中,所述包装的基因组还包含位于所述人类pccb5’-utr的截短或完整的核苷酸序列下游并在pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列上游的共有kozak序列。在某些实施方式中,所述pccb的编码序列选自seqidno:7-12。在某些实施方式中,所述衣壳是aav9衣壳。
本公开还涉及包含本文中公开的raav的药物组合物。在某些实施方式中,所述药物组合物包含可药用载体或赋形剂。在某些实施方式中,所述药物组合物被配制成用于皮下、肌肉内、真皮内、腹膜内或静脉内施用。在示例性实施方式中,所述药物组合物被配制成用于静脉内施用。
另一方面,本公开提供了在人类受试者中治疗pa的方法,所述方法包括向所述人类受试者施用治疗有效量的至少一种本文中公开的raav。在一个实施方式中,本公开提供了一种治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列。在另一个实施方式中,本公开提供了一种治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列。
在某些实施方式中,本公开提供了一种治疗pa的方法,所述方法包括施用:(1)包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列;和(2)包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,所述(1)和(2)的raav可以同时施用。在某些实施方式中,所述(1)和(2)的raav可以顺序施用。在某些实施方式中,所述(1)和(2)的raav可以分开施用。
在某些实施方式中,本公开提供了一种治疗pa的方法,所述方法包括施用:(1)包含aav衣壳和包装在其中的载体基因组的raav,其中所述编码序列是针对pcca而不是针对pccb,所述启动子是pcca基因特异性内源启动子而不是pccb基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是pcca基因特异性内源多聚腺苷酸化信号序列而不是pccb基因特异性内源多聚腺苷酸化信号序列;和(2)包含aav衣壳和包装在其中的载体基因组的raav,其中所述编码序列是针对pccb而不是针对pcca,所述启动子是pccb基因特异性内源启动子而不是pcca基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是pccb基因特异性内源多聚腺苷酸化信号序列而不是pcca基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述(1)和(2)的raav可以同时施用。在某些实施方式中,所述(1)和(2)的raav可以顺序施用。在某些实施方式中,所述(1)和(2)的raav可以分开施用。
在某些实施方式中,本公开提供了在人类受试者中治疗pa的方法,所述方法包括向被诊断为在pcca中具有至少一个突变的人类受试者施用治疗有效量的至少一种本文中公开的raav。在一个实施方式中,本公开提供了一种在被诊断为在pcca中具有至少一个突变的人类受试者中治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,本公开提供了一种在被诊断为在pcca中具有至少一个突变的人类受试者中治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述编码序列是针对pcca而不是针对pccb,所述启动子是pcca基因特异性内源启动子而不是pccb基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是pcca基因特异性内源多聚腺苷酸化信号序列而不是pccb基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述pcca中的突变选自表1。在某些实施方式中,所述pcca的编码序列选自seqidnos:1-6。在某些实施方式中,所述衣壳是aav9衣壳。
在某些情况下,本公开提供了在人类受试者中治疗pa的方法,所述方法包括向被诊断为在pccb中具有至少一个突变的人类受试者施用治疗有效量的至少一种本文中公开的raav。在一个实施方式中,本公开提供了一种在被诊断为在pccb中具有至少一个突变的人类受试者中治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,本公开提供了一种在被诊断为在pccb中具有至少一个突变的人类受试者中治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述编码序列是针对pccb而不是针对pcca,所述启动子是pccb基因特异性内源启动子而不是pcca基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是pccb基因特异性内源多聚腺苷酸化信号序列而不是pcca基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述pccb中的突变选自表2。在某些实施方式中,所述pccb的编码序列选自seqidnos:7-12。在某些实施方式中,所述衣壳是aav9衣壳。
在某些实施方式中,所述raav被皮下、肌肉内、真皮内、腹膜内或静脉内施用。在示例性实施方式中,所述raav被静脉内施用。在某些实施方式中,所述raav以约1x1011至约1x1014基因组拷贝(gc)/kg的剂量施用。在其他实施方式中,所述raav以约1x1012至约1x1013基因组拷贝(gc)/kg的剂量施用。在某些实施方式中,施用单剂raav。在其他实施方式中,施用多剂raav。
在某些情况下,本文中提供了包含本文中公开的重组核酸分子、aav载体或raav的宿主细胞。在特定实施方式中,所述宿主细胞可能适合于aav的繁殖。在某些实施方式中,所述宿主细胞选自hela、cos-7、hek293、a549、bhk、vero、rd、ht-1080、arpe-19或mrc-5细胞。
本发明的这些和其他方面和特点在本公开的下述章节中描述。
附图说明
参考下述附图,可以更完全地理解本发明。
图1是原理图,示出了根据一个实施方式的包含pcca的示例性包装的载体基因组构建物。在所述图中,5’-itr、cmv增强子、鸡β-肌动蛋白启动子、sv40小t内含子、共有kozak序列、pcca编码序列、sv40多聚腺苷酸化信号和3’-itr分别由1、2、3、4、5、6、7和8表示。
图2是原理图,示出了根据一个实施方式的包含pccb的示例性包装的载体基因组构建物。在所述图中,5’-itr、cmv增强子、鸡β-肌动蛋白启动子、sv40小t内含子、共有kozak序列、pccb编码序列、sv40多聚腺苷酸化信号和3’-itr分别由1、2、3、4、5、6、7和8表示。
图3是条形图,示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)或带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)转染连续肝细胞系(hepg2)后,通过rt-qpcr所确定的pccarna表达的变化倍数。
图4a是照片,从第1道至第7道分别示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)、带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)、带有编码人类pcca的完整本源序列的核苷酸序列和编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc365)或带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)转染的连续肝细胞系(hepg2)中,通过western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
图4b是照片,从第1道至第7道分别示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)、带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)或带有编码人类pcca的完整本源序列的核苷酸序列和编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc365)转染的连续肝细胞系(huh7)中,通过western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
图5是照片,示出了在从用或未用带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)转染的连续肝细胞系(hepg2)分离的全细胞裂解液(wcl)、亚细胞级分(胞质级分(cyto)和线粒体级分(线粒体))中,通过western印迹所检测的pcca蛋白表达水平。1x和2x表示所载样的线粒体级分的相对体积。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
图6是条形图,从左至右示出了在连续肾细胞系(hek293)的三重转染后通过qpcr所确定的pccaaav9滴度(以基因组拷贝(gc)/ml为单位)的变化倍数,所述细胞用带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)或带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)转染,每种质粒在用表达aav9衣壳的质粒(paav2/9)和提供腺病毒辅助功能的质粒(padhelper)共转染的细胞中表达。未转染的细胞被用作对照并被表示为“无tx”。
图7是从左至右分别为亲和纯化的含有表达pcca和pccb的重组aav(raav)载体盒(dtc365)、表达pcca的重组aav(raav)载体盒(dtc349、dtc348、dtc347或dtc346)或表达egfp的重组aav(raav)载体盒(dtc343)的aav9粒子的dna碱性琼脂糖凝胶的照片。
图8是条形图,示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pccb的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc370、dtc368、dtc369或dtc371)转染连续肝细胞系(hepg2)后,通过rt-qpcr所确定的pccbrna表达的变化倍数。
图9a是照片,从第1道至第8道分别示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pccb的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc368、dtc369、dtc370或dtc371)转染的连续肝细胞系(hepg2)中,通过western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
图9b是照片,从第1道至第8道分别示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pccb的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc369、dtc368、dtc370或dtc371)转染的连续肝细胞系(huh7)中,通过western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
图10是照片,示出了在从用或未用带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)转染的连续肝细胞系(hepg2)分离的全细胞裂解液(wcl)、亚细胞级分(胞质级分(cyto)和线粒体级分(线粒体))中,通过western印迹所检测的pccb蛋白表达水平。1x和2x表示所载样的线粒体级分的相对体积。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
图11是条形图,从左至右示出了在连续肾细胞系(hek293)的三重转染后通过qpcr所确定的pccbaav9滴度(以基因组拷贝(gc)/ml为单位)的变化倍数,所述细胞用带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc368、dtc369、dtc370或dtc371)转染,每种质粒在用表达aav9衣壳的质粒(paav2/9)和提供腺病毒辅助功能的质粒(padhelper)共转染的细胞中表达。未转染的细胞被用作对照并被表示为“无tx”。
图12是从左至右分别为亲和纯化的含有对照质粒(带有空载体、没有tx的质粒)、表达egfp的重组aav(raav)载体盒(dtc343)或表达pccb的重组aav(raav)载体盒(dtc366、dtc367、dtc368、dtc369、dtc370或dtc371)的aav9粒子的dna碱性琼脂糖凝胶的照片。
图13是条形图,示出了在野生型fvb小鼠中,在用编码人类pcca的完整本源序列(dtc346)或人类pcca的密码子优化的序列(dtc347、dtc348或dtc349)的raav治疗后,人类pcca蛋白表达相对于小鼠内源pcca表达的百分率。误差条表示标准偏差。
图14是条形图,示出了在用编码人类pcca的完整本源序列(dtc346)或人类pcca的密码子优化的序列(dtc347、dtc348或dtc349)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中表达的人类野生型pcca蛋白的浓度(以nmol/g蛋白为单位)。所列出的百分数表示被计算为相对于野生型fvb小鼠的内源pcca蛋白水平的百分率的人类野生型pcca表达。误差条表示标准偏差。
图15是条形图,示出了在用编码人类pcca的完整本源序列(dtc346)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中通过每分钟的平均计数(cpm)数据所度量的人类pcca活性。误差条表示标准偏差。所列出的百分数描述了相对于在野生型fvb小鼠中观察到的数据的cpm数据。**表示使用dunnett多重比较检验与pbs治疗组相比p<0.01。
图16a-c是条形图,示出了在用编码人类pcca的完整本源序列(dtc346)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中的已知丙酸血症生物标志物的浓度。图16a是条形图,示出了在用编码人类pcca的完整本源序列(dtc346)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中c3(丙酰肉碱)的血浆浓度。图16b是在用编码人类pcca的完整本源序列(dtc346)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中血浆c3/c2浓度比(丙酰肉碱/乙酰肉碱)的条形图。图16c是条形图,示出了在用编码人类pcca的完整本源序列(dtc346)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中2-甲基柠檬酸(2mc)的血浆浓度。pre表示在raav注射前0至14天,2w表示在raav注射后2周,3w表示在raav注射后3周,4w表示在raav注射后4周,6w表示在raav注射后6周。误差条表示标准偏差。**表示与pbs治疗组相比p<0.01,***表示与pbs治疗组相比p<0.001,使用dunnett多重比较检验。
发明详述
本发明提供了大量用于治疗性应用的新的药剂和组合物。正如本文中所描述的,本发明的核酸序列、载体、重组病毒和相关组合物可用于改善、预防或治疗pa。
除非另有指明,否则技术术语按照常规用法使用。分子生物学常用术语的定义可以在下述文献中找到:benjaminlewin,《基因v》(genesv),oxforduniversitypress出版,1994(isbn0-19-854287-9);kendrew等主编,《分子生物学百科全书》(theencyclopediaofmolecularbiology),blackwellscienceltd.出版,1994(isbn0-632-02182-9);roberta.meyers主编,《分子生物学和生物技术详尽桌面参考》(molecularbiologyandbiotechnology:acomprehensivedeskreference),vchpublishers,inc.出版,1995(isbn1-56081-569-8)。
为了促进对本公开的各种不同实施方式的回顾,提供了下述对特定术语的解释:
腺相关病毒(aav):一种小型的复制缺陷型无包膜病毒,可感染人类和一些其他灵长类物种。尚不知道aav会引起疾病,并且它引发非常轻微的免疫应答。利用aav的基因疗法载体可以感染分裂和静止期细胞两者,并且可以以染色体外状态持续存在而不会整合到宿主细胞的基因组中。这些特性使aav成为有吸引力的用于基因疗法的病毒载体。目前存在12种公认的aav血清型(aav1–12)。
施用:将药剂例如治疗剂(例如重组aav)通过任何有效的途径提供或给予到受试者。示例性的施用途径包括但不限于注射(例如皮下、肌肉内、真皮内、腹膜内和静脉内)、口服、管内、舌下、直肠、透皮、鼻内、阴道和吸入途径。
密码子优化的:“密码子优化的”核酸是指已被改变以使密码子最适合于在特定系统(例如特定物种或物种组)中表达的核酸序列。例如,可以将核酸序列优化以在哺乳动物细胞或特定哺乳动物物种(例如人类细胞)中表达。密码子优化不改变所编码的蛋白质的氨基酸序列。
增强子:一种通过提高启动子活性来提高转录速率的核酸序列。
内含子:基因内不含蛋白质编码信息的一段dna。内含子在信使rna翻译之前被去除。
反向末端重复序列(itr):腺相关病毒的基因组中为高效复制所需的对称核酸序列。itr序列位于aavdna基因组的每个末端处。itr充当病毒dna合成的复制原点,并且是用于产生aav整合载体的必需顺式组分。
分离的:“分离的”生物组分(例如核酸分子、蛋白质、病毒或细胞)已与所述组分天然存在于其中的生物体的细胞或组织中的其他生物组分或所述生物体本身,例如其他染色体和染色体外dna和rna、蛋白质和细胞基本上分离开或从其中纯化出来。已被“分离的”核酸分子和蛋白质包括通过标准纯化方法纯化的那些核酸分子和蛋白质。所述术语还包括在宿主细胞中通过重组表达制备的核酸分子和蛋白质以及化学合成的核酸分子和蛋白质。
可操作连接:当第一核酸序列被放置成与第二核酸序列功能上相关时,所述第一核酸序列与所述第二核酸序列可操作连接。例如,如果启动子影响编码序列的转录或表达,则所述启动子可操作连接到所述编码序列。通常,可操作连接的dna序列是毗邻的,并且在必需联结两个蛋白质编码区的情况下处于同一阅读框中。
可药用载体:在本公开中有用的可药用载体(介质)是常规的。《remington制药学》(remington'spharmaceuticalsciences),e.w.martin,mackpublishingco.,easton,pa.,第15版(1975)描述了适合于一种或多种治疗性化合物、分子或药剂的药物递送的组合物和制剂。
通常,载体的性质取决于所采用的特定施用方式。例如,肠胃外制剂通常包含可注射流体作为介质,其包括制药学和生理学上可接受的流体例如水、生理盐水、平衡盐溶液、右旋糖水溶液、甘油等。对于固体组合物例如粉剂、丸剂、片剂或胶囊形式来说,常规的无毒固体载体可以包括例如制药级甘露糖醇、乳糖、淀粉或硬脂酸镁。除了生物学中性的载体之外,待施用的药物组合物还可以含有少量无毒辅助性物质,例如润湿剂或乳化剂、防腐剂和ph缓冲剂等,例如乙酸钠或失水山梨糖醇单月桂酸酯。
预防、治疗或改善疾病:“预防”疾病(例如pa)是指抑制疾病的全面发展。“治疗”是指在疾病或病理状况(例如pa)已开始发展后改善其体征或症状的治疗性干预。“改善”是指降低疾病(例如pa)的体征或症状的数目或严重性。
启动子:指导/启动核酸(例如基因)的转录的dna区域。启动子包括靠近转录起始位点的必需核酸序列。对于本领域技术人员来说许多启动子序列是已知的,甚至在人工核酸分子中不同启动子序列的组合也是可能的。当在本文中使用时,基因特异性内源启动子是指调控感兴趣的内源基因的表达的本源启动子元件。在示例性实施方式中,pcca基因特异性内源启动子调控pcca基因的表达。在另一个示例性实施方式中,pccb基因特异性内源启动子调控pccb基因的表达。
纯化的:术语“纯化的”不要求绝对纯度;相反,它打算作为相对术语。因此,例如,纯化的肽、蛋白质、病毒或其他活性化合物是与天然相伴的蛋白质和其他污染物完全或部分分离开的肽、蛋白质、病毒或其他活性化合物。在某些实施方式中,术语“基本上纯化的”是指已从细胞、细胞培养基或其他粗制备物中分离出来并经过分级分离以除去初始制备物中的各种不同组分例如蛋白质、细胞碎片和其他组分的肽、蛋白质、病毒或其他活性化合物。
重组的:重组核酸分子是具有非天然存在的序列或具有通过两个原本分开的序列区段的人工合并而制造的序列的核酸分子。这种人工组合可以通过化学合成或通过分离的核酸分子区段的人工操作,例如通过遗传工程技术来实现。
同样地,重组病毒是包含非天然存在的或通过至少两个不同起源的序列的人工合并而制造的序列(例如基因组序列)的病毒。术语“重组的”还包括仅仅通过天然核酸分子、蛋白质或病毒的一部分的添加、替换或缺失而改变的核酸、蛋白质和病毒。当在本文中使用时,“重组aav”是指重组核酸分子例如编码pcca的重组核酸分子和/或编码pccb的重组核酸分子已被包装在其中的aav粒子。
序列同一性:两个或更多个核酸序列或两个或更多个氨基酸序列之间的同一性或相似性根据所述序列之间的同一性或相似性来表示。序列同一性可以根据同一性百分数来度量;所述百分数越高,所述序列越同一性。序列相似性可以根据相似性百分数(其将保守氨基酸替换考虑在内)来度量;所述百分数越高,所述序列越相似。核酸或氨基酸序列的同源物或直向同源物在使用标准方法比对时具有相对高的序列同一性/相似性程度。与亲缘关系更远的物种(例如人类和秀丽隐杆线虫序列)相比,当所述直向同源蛋白或cdna源自于亲缘关系更近的物种(例如人类和小鼠序列)时,这种同源性更加显著。
用于比较目的的序列比对方法在本领域中是公知的。各种不同的程序和比对算法描述在下述文献中:smith&waterman,adv.appl.math.2:482,1981;needleman&wunsch,j.mol.biol.48:443,1970;pearson&lipman,proc.natl.acad.sci.usa85:2444,1988;higgins&sharp,gene,73:237-44,1988;higgins&sharp,cabios5:151-3,1989;corpet等,nuc.acidsres.16:10881-90,1988;huang等,computerappls.inthebiosciences8,155-65,1992;和pearson等,meth.mol.rio.24:307-31,1994。altschul等,j.mol.biol.215:403-10,1990提出了序列比对方法和同源性计算的详细考量。
ncbi基本局部比对搜索工具(basiclocalalignmentsearchtool)(blast)(altschul等,j.mol.biol.215:403-10,1990)可以从几个来源获得,包括美国国家生物信息中心(nationalcenterforbiologicalinformation)(ncbi)和因特网上,以与序列分析程序blastp、blastn、blastx、tblastn和tblastx结合使用。其他信息可以在ncbi网站上找到。
血清型:通过一组特征性抗原区分的一组密切相关的微生物(例如病毒)。
填充片段序列:是指包含在较大核酸分子(例如载体)内的,通常用于在两个核酸零件之间(例如启动子与编码序列之间)产生所需间隔或延伸核酸分子以使它具有所需长度的核苷酸序列。填充片段序列不含蛋白质编码信息,并且可以具有未知/合成起源和/或与较大核酸分子内的其他核酸序列无关。
受试者:活的多细胞脊椎动物生物体,包括人类和非人类哺乳动物的一个类别。
合成的:在实验室中通过人工手段生产的,例如合成的核酸可以在实验室中化学合成。
非翻译区(utr):典型的mrna在编码区的上游和下游分别含有5′非翻译区(“5′utr”)和3′非翻译区(3′utr)(参见mignonef.等,(2002)genomebiol3:reviews0004)。
治疗有效量:指定药物或治疗剂(例如重组aav)的足以在正用所述药剂治疗的受试者或细胞中实现所需效果的量。药剂的有效量取决于几种因素,包括但不限于正治疗的受试者或细胞和所述治疗性组合物的施用方式。
载体:载体是一种核酸分子,其允许外来核酸的插入而不破坏所述载体在宿主细胞中复制和/或整合的能力。载体可以包括允许它在宿主细胞中复制的核酸序列,例如复制原点。载体还可以包括一个或多个可选择标记基因和其他遗传元件。表达载体是含有允许插入的一个或多个基因的转录和翻译的必需调控序列的载体。在本文的某些实施方式中,所述载体是aav载体。
除非另有解释,否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的相同的含义。没有具体数目的指称包括复数指称物,除非上下文清楚地指明不是如此。“包含a或b”意味着包括a或b或a和b。还应该理解,为核酸或多肽提供的所有碱基尺寸或氨基酸尺寸以及所有分子重量或分子质量值均为近似值,并且出于描述的目的而提供。尽管与本文中描述的相似或等同的方法和材料可用于本公开的实践或试验,但在下文中描述了适合的方法和材料。本文中提到的所有出版物、专利申请、专利和其他参考文献整体通过参考并入本文。在有冲突的情况下,以本说明书包括术语的解释为准。此外,材料、方法和实例仅仅是说明性的而不打算是限制性的。
病毒载体:
在某些情况下,本公开提供了腺相关病毒(aav)载体,其含有包装的基因组,所述包装的基因组包含aav5’-itr、启动子序列、pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列以及aav3’-itr。
在某些实施方式中,本公开提供了一种aav载体,其含有包装的基因组,所述包装的基因组包含aav5’-itr、启动子序列、人类pcca5’-utr的截短或完整的核苷酸序列、pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类pcca3’-utr核苷酸序列以及aav3’-itr。
在某些情况下,本公开提供了aav载体,其含有包装的基因组,所述包装的基因组包含aav5’-itr、启动子序列、pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列以及aav3’-itr。
在某些实施方式中,本公开提供了一种aav载体,其含有包装的基因组,所述包装的基因组包含aav5’-itr、启动子序列、人类pccb5’-utr的截短或完整的核苷酸序列、pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类pccb3’-utr核苷酸序列以及aav3’-itr。
在某些实施方式中,所述包装的基因组还可以包含本文中所描述的增强子、内含子、共有kozak序列和/或多聚腺苷酸化信号。在某些实施方式中,所述重组载体还可以包含一个或多个填充片段核酸序列。在一个实施方式中,填充片段核酸序列位于所述内含子与pcca或pccb的部分或完整编码序列之间。
在本文中描述的各种不同实施方式中,所述重组病毒载体是aav载体。所述aav载体可以是血清型1、2、3、4、5、6、7、8、9、10、11或12的aav载体(即aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aav9、aav10、aav11或aav12)以及从人类和非人类灵长动物组织分离的超过100种变体中的任一者。参见例如choi等,2005,currgenether.5:299-310,2005和gao等,2005,currgenether.5:285-297。在本发明中可以使用任何血清型的aav载体,并且aav血清型的选择部分取决于基因疗法所靶向的细胞类型。对于pa的治疗来说,肝脏是相关的靶器官之一。在某些实施方式中,所述aav载体选自血清型9(aav9)、血清型8(aav8)或其变体。在示例性实施方式中,所述aav载体是血清型9(aav9)或其变体。
在某些实施方式中,所述重组aav载体包括aavitr序列,其在aav和腺病毒辅助功能以反式提供时发挥载体dna复制原点和载体基因组的包装信号两种作用。另外,所述itr充当大rep蛋白的单链核酸内切切口的靶,从复制中间体中拆分出单个基因组。
在某些实施方式中,所述5’-itr序列来自于aav2。在某些实施方式中,所述3’-itr序列来自于aav2。在某些实施方式中,所述5’-itr序列和3’-itr序列来自于aav2。在某些实施方式中,所述5’-itr序列和/或3’-itr序列来自于aav2,并且包含seqidno:15或由其构成。在其他实施方式中,所述5’-itr序列和/或3’-itr序列来自于非aav2来源。
在某些示例性实施方式中,所述aav载体是aav血清型9(aav9)载体,并且所述载体包含本文中描述的增强子、启动子、内含子、pcca或pccb的编码序列和多聚腺苷酸化信号。在某些实施方式中,所述aav9载体还包含两个aav2、aav8或aav9反向末端重复序列(itr)序列:一个在所述增强子的5’,一个在所述多聚腺苷酸化信号的3’。在示例性实施方式中,所述aav9载体包含两个aav2反向末端重复序列(itr)序列:一个在所述增强子的5’,一个在所述多聚腺苷酸化信号的3’。在某些实施方式中,所述aav2itr序列包含seqidno:15或由其构成。在另一个示例性实施方式中,所述aav9载体包含两个aav9反向末端重复序列(itr)序列:一个在所述增强子的5’,一个在所述多聚腺苷酸化信号的3’。
启动子:
在本文中描述的各种不同情况下,提供了含有包装的基因组的病毒载体,所述包装的基因组包含帮助驱动和调控转入基因表达例如pcca或pccb的表达的启动子序列。在某些实施方式中,所述启动子选自鸡β-肌动蛋白(cba)启动子、巨细胞病毒(cmv)立即早期基因启动子、甲状腺素运载蛋白(ttr)启动子、甲状腺素结合球蛋白(tbg)启动子、α-1抗胰蛋白酶因子(a1at)启动子、cag启动子、pcca基因特异性内源启动子和pccb基因特异性内源启动子。在示例性实施方式中,所述启动子序列位于所选的5’-itr序列与pcca或pccb的部分或完整编码序列之间。在某些实施方式中,所述启动子序列位于增强子序列下游。在某些实施方式中,所述启动子序列位于内含子序列上游。在某些实施方式中,所述启动子序列位于所选的5’-itr序列与人类pcca或人类pccb5’-非翻译区(utr)的截短或完整的核苷酸序列之间。
在某些说明性实施方式中,使用遍在的鸡β-肌动蛋白启动子(cba),其可以任选地位于cmv立即早期增强子(cmvie)下游。在某些实施方式中,本文描述的包装的基因组包含本源pcca或pccb启动子元件。在某些说明性实施方式中,当所述包装的基因组中的部分或完整编码序列是针对pcca时,本文描述的包装的基因组包含pcca基因特异性内源启动子,其包含与seqidno:34的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,本文描述的包装的基因组包含pcca基因特异性内源启动子,其包含与seqidno:34的等长度区域至少95%同一性的约15个连续核苷酸(例如约30、约45、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270、约280、约290、约300、约325、约350、约375、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725或约750)的核苷酸序列。在某些说明性实施方式中,当所述载体基因组中的部分或完整编码序列是针对pcca时,本文描述的包装的基因组包含pcca基因特异性内源启动子,其包含与seqidno:34的等长度区域100%同一性的至少15个连续核苷酸的核苷酸序列。
在某些说明性实施方式中,当所述载体基因组中的部分或完整编码序列是针对pccb时,本文描述的包装的基因组包含pccb基因特异性内源启动子,其包含与seqidno:36的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,本文描述的包装的基因组包含pccb基因特异性内源启动子,其包含与seqidno:36的等长度区域至少95%同一性的约15个连续核苷酸(例如约30、约45、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270、约280、约290、约300、约325、约350、约375、约400、约425或约450)的核苷酸序列。在某些说明性实施方式中,当所述载体基因组中的部分或完整编码序列是针对pccb时,本文描述的包装的基因组包含pccb基因特异性内源启动子,其包含与seqidno:36的等长度区域100%同一性的至少15个连续核苷酸的核苷酸序列。
在某些实施方式中,所述启动子选自鸡β-肌动蛋白(cba)启动子、巨细胞病毒(cmv)立即早期基因启动子、甲状腺素运载蛋白(ttr)启动子、甲状腺素结合球蛋白(tbg)启动子、α-1抗胰蛋白酶因子(a1at)启动子和cag启动子。在示例性实施方式中,所述启动子是cba启动子。在一个实施方式中,所述cba启动子包含seqidno:18或由其构成。
除了启动子之外,包装的基因组还可以含有其他适合的转录起始、终止、增强子序列和高效rna加工信号。正如在下文中进一步详细描述的,此类序列包括剪接和多聚腺苷酸化(polya)信号、增强表达的调控元件(即wpre)、使细胞质mrna稳定的序列、增强翻译效率的序列(即kozak共有序列)和增强蛋白质稳定性的序列。
在某些实施方式中,所述包装的基因组还包含共有kozak序列。在某些实施方式中,所述共有kozak序列位于内含子序列下游。在一个实施方式中,所述共有kozak序列是gccgcc(seqidno:24)。正如本领域技术人员将会理解的,所述共有kozak序列通常紧靠编码序列的上游;在这种情况下,紧靠pcca或pccb的部分或完整编码序列的上游。正如专业技术人员将会认识到的,所述共有kozak序列可以被认为共享对应于治疗性多肽例如pcca或pccb的起始密码子的atg残基。为了公开的简化,本文中描述的共有kozak序列包含对应于不与所述治疗性多肽例如pcca或pccb共享的区域的6个核苷酸的序列。
非翻译区(utr):
已知来自于内源基因特异性mrna的5’-非翻译区(utr)在通过与细胞内转录本竞争翻译起始因子和核糖体来优化转入基因生产,通过最小化mrna衰减或转录后基因沉默来提高mrna半衰期,以及避免与调控性蛋白或抑制性rna二级结构的有害相互作用中发挥重要作用(参见chiba,y.和green,p.(2009)j.plantbiol.52,114–124;moore,m.j.和proudfoot,n.j.(2009)cell136,688–700;jackson,r.j.等,(2010)nat.rev.mol.cellbiol.11,113–127)。已发现所述位于蛋白质编码序列下游的3’-非翻译区(3’-utr)参与大量调控过程,包括转录本切割、稳定性和多聚腺苷酸化、翻译和mrna定位。因此它们在决定mrna的命运中是至关重要的(参见barrett,l.w.等,(2012)cellmollifesci.nov;69(21):3613–3634)。在某些实施方式中,本公开提供了一种含有包装的基因组的raav,所述包装的基因组包含人类pcca或pccb5’-utr的截短或完整的核苷酸序列。在某些实施方式中,本公开提供了一种含有包装的基因组的raav,所述包装的基因组包含人类pcca或pccb3’-utr的截短或完整的核苷酸序列。
在某些实施方式中,本公开提供了一种含有包装的基因组的raav,所述包装的基因组包含aav5’-itr、启动子序列、人类pcca5’-utr的截短或完整的核苷酸序列、pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类pcca3’-utr核苷酸序列和aav3’-反向末端重复序列(itr)。
在某些实施方式中,本公开提供了一种含有包装的基因组的raav,所述包装的基因组包含aav5’-itr、启动子序列、人类pccb5’-utr的截短或完整的核苷酸序列、pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类pccb3’-utr核苷酸序列和aav3’-itr。
在某些实施方式中,所述包装的基因组包含由seqidno:30表示的完整的人类pcca5’-utr。在某些实施方式中,所述包装的基因组包含由seqidno:32表示的完整的人类pccb5’-utr。
在某些实施方式中,所述包装的基因组包含截短的本源人类pcca5’-utr。在某些实施方式中,所述截短的人类pcca5’-utr包含与seqidno:30的等长度区域至少95%同一性的约50个连续核苷酸至约1400个连续核苷酸(例如约75、约100、约125、约150、约175、约200、约250、约275、约300、约325、约350、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约900、约925、约950、约975、约1000、约1025、约1050、约1075、约1100、约1125、约1150、约1175、约1200、约1225、约1250、约1275、约1300、约1325或约1350)的核苷酸序列。
在某些实施方式中,所述包装的基因组包含截短的本源人类pccb5’-utr。在某些实施方式中,所述截短的人类pccb5’-utr包含与seqidno:32的等长度区域至少95%同一性的约50个连续核苷酸至约1400个连续核苷酸(例如约75、约100、约125、约150、约175、约200、约250、约275、约300、约325、约350、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约900、约925、约950、约975、约1000、约1025、约1050、约1075、约1100、约1125、约1150、约1175、约1200、约1225、约1250、约1275、约1300、约1325或约1350)的核苷酸序列。
在某些实施方式中,所述包装的基因组包含由seqidno:31表示的完整的人类pcca3’-utr。在某些实施方式中,所述包装的基因组包含由seqidno:33表示的完整的人类pccb3’-utr。
在某些实施方式中,所述包装的基因组包含截短的本源人类pcca3’-utr。在某些实施方式中,所述截短的人类pcca3’-utr包含与seqidno:31的等长度区域至少95%同一性的约15个连续核苷酸(例如约30、约45、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270)的核苷酸序列。
在某些实施方式中,所述包装的基因组包含截短的本源人类pccb3’-utr。在某些实施方式中,所述截短的人类pccb3’-utr包含与seqidno:33的等长度区域至少95%同一性的约15个连续核苷酸(例如约30、约45、约60、约70、约80、约90、约100、约110、约120、约130、约140或约150)的核苷酸序列。
pcca或pccb多肽:
真如本文中所描述的,本发明的各个方面提供了含有包装的基因组的重组载体,所述包装的基因组包含aav5’-itr、启动子序列、pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列和aav3’-itr。本文中还描述了含有包装的基因组的重组载体,所述包装的基因组包含aav5’-itr、启动子序列、部分或完整编码序列forpccb或其同型或其功能性片段或功能性变体和aav3’-itr。
在一个实施方式中,所述pcca或pccb的部分或完整编码序列是野生型编码序列。当在本文中使用时,术语“野生型”是指与自然界中存在的生物聚合物(例如多肽序列或多核苷酸序列)相同的生物聚合物(例如多肽序列或多核苷酸序列)。
在可选实施方式中,所述pcca或pccb的部分或完整编码序列是密码子优化的编码序列。在一个实施方式中,所述pcca或pccb的部分或完整编码序列为了在人类中表达而被密码子优化。
在本文中描述的各种不同实施方式中,提供了含有包装的基因组的载体,所述包装的基因组包含pcca或pccb的编码序列。使用本文中描述的载体递送的多肽涵盖可能在哺乳动物包括人类的治疗中有用的pcca和pccb多肽。
在某些实施方式中,所述用本文描述的载体表达的多肽是pcca(seqidno:16;genbank登记号np_000273.2;728个氨基酸)或其功能性片段、功能性变体或功能性同型。在某些实施方式中,所述用本文中描述的载体表达的多肽是pcca,并且包含seqidno:16或由其构成。
在一个实施方式中,所述pcca多肽由seqidno:1中示出的野生型编码序列编码。在另一个实施方式中,可以使用表达pcca的天然同型或变体的编码序列,例如在uniprotkb/swiss-prot登记号p05165-1(seqidno:25)、p05165-2(seqidno:26)和p05165-3(seqidno:27)中示出的。在可选实施方式中,所述pcca多肽由密码子优化的编码序列编码。在某些实施方式中,所述pcca多肽由与seqidno:1中示出的野生型编码序列的同一性少于80%的密码子优化的编码序列编码。在某些示例性实施方式中,所述pcca多肽由选自seqidnos:2-6的密码子优化的编码序列编码。在某些实施方式中,所述pcca的编码序列还可能在3’末端处包含终止密码子(tga、taa或tag)。
在某些实施方式中,所述用本文中描述的载体表达的多肽是pccb(seqidno:17;genbank登记号np_000523.2;539个氨基酸)或其功能性片段、功能性变体或功能性同型。在某些实施方式中,所述用本文中描述的载体表达的多肽是pccb,并且包含seqidno:17或由其构成。
在一个实施方式中,所述pccb多肽由seqidno:7中示出的野生型编码序列编码。在另一个实施方式中,可以使用表达pccb的天然同型或变体的编码序列,例如在uniprotkb/swiss-prot登记号p05166-1(seqidno:28)和p05166-2(seqidno:29)中示出的。在可选实施方式中,所述pccb多肽由密码子优化的编码序列编码。在某些实施方式中,所述pccb多肽由与seqidno:7中示出的野生型编码序列的同一性少于80%的密码子优化的编码序列编码。在某些示例性实施方式中,所述pccb多肽由选自seqidnos:8-12的密码子优化的编码序列编码。在某些实施方式中,所述pccb的编码序列还可能在3’末端处包含终止密码子(tga、taa或tag)。
在各种不同情况下,本发明可用于递送本文中描述的pcca或pccb多肽的片段、变体、同型或融合体。
在某些实施方式中,本发明可用于递送pcca或pccb多肽的片段,其包含至少50、100、150、200、250、300、350、400、450、500、550或600个氨基酸残基,并保留与所述全长多肽相关的一种或多种活性(例如在酶的情况下催化活性)。此类片段可以通过本领域中常规且公知的重组技术来获得。此外,可以通过专业技术人员已知的常规体外测定法来测试此类片段。例如,丙酰辅酶a羧化酶(pcc)活性可以通过下述步骤测定:(1)将所述多肽在含有1mm2-巯基乙醇和0.1mg/ml牛血清白蛋白的10mm磷酸盐缓冲液(ph7.0)中稀释,(2)取出含有50mmtris-hclph8.0、5mm谷胱甘肽、2mmatp、100mmkcl、10mmmgcl2、10mm[14c]-碳酸氢盐(比活度为12.4mci/mmol)、3mm丙酰辅酶a的标准反应混合物,并与酶在37摄氏度温育15min,(3)通过添加10%三氯乙酸终止反应,(4)以200xg离心,(5)在加热灯下干燥等分试样,(6)溶解在水中,和(7)在aquasol中计数,其中一个单位的酶活性被定义为在37摄氏度下每分钟催化1pmol碳酸氢盐固定的酶量。对于pcc活性测定法的描述,参见kalousek等,1980,jbiolchem255(1):60-65和hsia等,1973j.pediatr.83:625-628。本发明还包括编码上述多肽片段的核酸分子。
在某些实施方式中,本发明可用于递送所述pcca或pccb多肽的变体。在某些实施方式中,所述变体多肽可以与野生型治疗性多肽例如seqidno:16的野生型pcca多肽或seqidno:17的野生型pccb多肽至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)同一性。在某些实施方式中,所述变体治疗性多肽与相应的野生型多肽相比可能具有至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个不同残基。此类变体可以通过本领域中常规且公知的重组技术来获得。此外,可以通过专业技术人员已知的常规体外测定法来测试此类变体的催化活性。对于丙酰辅酶a羧化酶活性测定法的描述,参见例如kalousek等,1980,jbiolchem255(1):60-65和hsia等,1973j.pediatr.83:625-628。本发明还包括编码上述治疗性多肽变体的核酸分子。
新的密码子优化的序列:
在某些情况下,本公开提供了编码pcca的新的密码子优化的核酸序列。在一个实施方式中,所述编码pcca的密码子优化的核酸序列与seqidno:1中示出的野生型编码序列的同一性少于80%。在某些实施方式中,所述编码pcca的密码子优化的核酸序列与seqidnos:2-6至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)同一性。在某些实施方式中,所述编码pcca的密码子优化的核酸序列与选自seqidnos:2-6的序列100%同一性。在某些实施方式中,本公开提供了与seqidno:1中示出的野生型编码序列的同一性少于80%,并且与seqidnos:2-6的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核酸序列。在示例性实施方式中,本公开提供了选自seqidnos:2-6的编码pcca的核酸序列。还提供了seqidnos:2-6中示出的核酸序列的片段,其编码具有功能性pcca活性的多肽。在某些实施方式中,所述编码pcca的核酸序列还可以在3’末端处包含终止密码子(tga、taa或tag)。
在某些情况下,本公开提供了编码pccb的新的密码子优化的核酸序列。在一个实施方式中,所述编码pccb的密码子优化的核酸序列与seqidno:7中示出的野生型编码序列的同一性少于80%。在某些实施方式中,所述编码pccb的密码子优化的核酸序列与seqidnos:8-12至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)同一性。在某些实施方式中,所述编码pccb的密码子优化的核酸序列与选自seqidnos:8-12的序列100%同一性。在某些实施方式中,本公开提供了与seqidno:7中示出的野生型编码序列的同一性少于80%,并且与seqidnos:8-12的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核酸序列。在示例性实施方式中,本公开提供了选自seqidnos:8-12的编码pccb的核酸序列。还提供了在seqidnos:8-12中示出的核酸序列的片段,其编码具有功能性pccb活性的多肽。在某些实施方式中,所述编码pccb的核酸序列还可以在3’末端处包含终止密码子(tga、taa或tag)。
载体基因组元件:
在某些实施方式中,所述raav含有包装的载体基因组,其还包含一个或多个增强子序列。在一个实施方式中,所述增强子选自巨细胞病毒立即早期基因(cmv)增强子、甲状腺素运载蛋白增强子(enttr)、鸡β-肌动蛋白(cba)增强子、en34增强子和apoe增强子。在示例性实施方式中,所述增强子是cmv增强子。在一个实施方式中,所述cmv增强子包含seqidno:19或由其构成。
在某些实施方式中,所述raav含有包装的载体基因组,其还包含一个或多个内含子序列。在一个实施方式中,所述内含子选自sv40小t内含子、兔血红蛋白亚基β(rhbb)内含子、人类β珠蛋白ivs2内含子、promega嵌合内含子或hfix内含子。在一个示例性实施方式中,所述内含子是sv40小t内含子。在一个实施方式中,所述sv40小t内含子序列包含seqidno:20或由其构成。在另一个示例性实施方式中,所述内含子是rhbb内含子。在一个实施方式中,所述rhbb内含子序列包含seqidno:21或由其构成。
在某些实施方式中,所述raav含有包装的载体基因组,其还包含多聚腺苷酸化信号序列。在一个实施方式中,所述多聚腺苷酸化信号序列选自牛生长激素(bgh)多聚腺苷酸化信号序列、sv40多聚腺苷酸化信号序列、兔β珠蛋白多聚腺苷酸化信号序列、pcca基因特异性内源多聚腺苷酸化信号序列、pccb基因特异性内源多聚腺苷酸化信号序列。在示例性实施方式中,所述多聚腺苷酸化信号序列是牛生长激素(bgh)多聚腺苷酸化信号序列。在一个实施方式中,所述bgh多聚腺苷酸化信号序列包含seqidno:22或由其构成。在另一个示例性实施方式中,所述多聚腺苷酸化信号序列是sv40多聚腺苷酸化信号序列。在一个实施方式中,所述sv40多聚腺苷酸化信号序列包含seqidno:23或由其构成。在一个实施方式中,所述多聚腺苷酸化信号序列是基因特异性内源多聚腺苷酸化序列。在示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对pcca时,所述多聚腺苷酸化信号序列是pcca基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述pcca基因特异性内源多聚腺苷酸化信号序列包含与seqidno:35的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,所述pcca基因特异性内源多聚腺苷酸化信号序列包含与seqidno:35的等长度区域至少95%同一性的约15个连续核苷酸(例如约20、约30、约40、约50、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150或约160)的核苷酸序列。在另一个示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对pccb时,所述多聚腺苷酸化信号序列是pccb基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述pccb基因特异性内源多聚腺苷酸化信号序列包含与seqidno:37的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,所述pcca基因特异性内源多聚腺苷酸化信号序列包含与seqidno:37的等长度区域至少95%同一性的约15个连续核苷酸(例如约20、约30、约40、约50、约60、约70、约80、约90或约100)的核苷酸序列。
aav衣壳:
另一方面,本公开提供了在pa的治疗中可用作基因疗法药剂的raav,其中所述raav包含aav衣壳和包装在其中的本文中所描述的载体基因组。在某些实施方式中,所述aav衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的aav(即aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav9、aav10、aav11、aav12、aavrh10或aavhu37)。在示例性实施方式中,所述aav载体是aav血清型9(aav9)载体、aav9变体载体、aav血清型8(aav8)载体或aav血清型2(aav2)载体。
所述aav9衣壳是一种由多个aav9vp蛋白组成的自组装的aav衣壳。所述aav9vp蛋白通常被表达为由seqidno:13的核酸序列或与其至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%同一性的序列编码的可选剪接变体,所述核酸序列编码seqidno:14的vp1氨基酸序列(genbank登记号aas99264)。这些剪接变体产生seqidno:14的不同长度的蛋白质。在某些实施方式中,aav9衣壳包括具有与aas9926499%同一性或与seqidno:1499%同一性的氨基酸序列的aav。也参见美国专利号7,906,111和wo/2005/033321。当在本文中使用时,aav9变体包括在例如wo/2016/049230、美国专利号8,927,514、美国专利公布号2015/0344911和美国专利号8,734,809中所描述的。
正如本文中指示的,所述aav9序列和蛋白可用于生产raav。然而,在其他实施方式中,选择另一种aav衣壳。组织特异性由衣壳类型决定。可以选择转导适合的靶(例如肝脏、肌肉、肺或cns)的aav血清型作为aav病毒载体的衣壳的来源,包括例如aav1、aav2、aav3、aav4、aav5、aav6、aav6.2、aav7、aav8、aav9、aavrh10、aavrh64rl、aavrh64r2、aavrh8。参见例如美国专利公布号2007/0036760、美国专利公布号2009/0197338和ep1310571。也参见wo2003/042397(aav7和其他猿猴aav)、美国专利号7282199和7790449(aav8)。此外,可以使用尚未发现的aav或基于它们的重组aav作为aav衣壳的来源。这些文献还描述了可以被选择用于产生aav的其他aav,并且通过参考并入本文。在某些实施方式中,在病毒载体中使用的aav衣壳可以通过上述aav衣壳之一或其编码核酸的突变(即通过插入、缺失或替换)来产生。在某些实施方式中,所述aav衣壳是嵌合的,包含来自于上述aav衣壳蛋白中的两者或三者或四者或更多者的结构域。在某些实施方式中,所述aav衣壳是来自于两种或三种不同aav或重组aav的vpl、vp2和vp3单体的嵌合体。在某些实施方式中,raav组合物包含超过一种上述衣壳。
包含重组核酸分子的宿主细胞:
在某些情况下,本文提供了包含本文中公开的重组核酸分子、病毒载体例如aav载体或raav的宿主细胞。在特定实施方式中,所述宿主细胞可能适合于aav的繁殖。
可以使用广范围的宿主细胞,例如细菌、酵母、昆虫、哺乳动物细胞等。在某些实施方式中,所述宿主细胞可以是适合于生产重组aav(raav)的细胞(或细胞系),例如hela、cos-7、hek293、a549、bhk、vero、rd、ht-1080、arpe-19或mrc-5细胞。
所述重组核酸分子或载体可以使用本领域中已知的任何适合的方法递送到所述宿主细胞培养物。在某些实施方式中,产生在其基因组中插入有所述重组核酸分子或载体的稳定的宿主细胞系。在某些实施方式中,产生含有本文中描述的raav载体的稳定宿主细胞系。在将所述raav载体转染到宿主培养物后,所述raav在宿主基因组中的整合可以通过各种不同方法来测定,例如抗生素选择、荧光激活细胞分拣、southern印迹、基于pcr的检测、荧光原位杂交,正如在下述文献中所描述的:nakai等,naturegenetics(2003)34,297-302;philpott等,journalofvirology(2002)76(11):5411-5421;和howden等,jgenemed2008;10:42-50。此外,可以按照本领域中公知的流程来建立稳定的细胞系,例如在clark,kidneyinternationalvol61(2002):s9-s15和yuan等,humangenetherapy2011may;22(5):613-24中所描述的流程。
用于基因疗法的重组aav:
aav属于细小病毒科和依赖病毒属。aav是一种小型无包膜病毒,其包装线性单链dna基因组。aavdna的正义链和反义链两者以相同频率包装到aav衣壳中。
aav基因组的特征在于位于两个开放阅读框(orb)侧翼的两个反向末端重复序列(itr)。例如,在aav2基因组中,itr的前125个核苷酸是回文,其自身折叠以使碱基配对最大化,并形成t形发夹结构。被称为d序列的itr的其他20个碱基保持未配对。itr是对aavdna复制来说重要的顺式作用序列;itr是复制原点,并充当dna聚合酶合成第二链的引物。在该合成过程中形成的被称为复制型单体的双链dna被用于第二轮自引发复制,并形成复制型二聚体。这些双链中间体通过链置换机制进行加工,产生用于包装的单链dna和用于转录的双链dna。位于所述itr内的是rep结合元件和末端解离位点(trs)。这些零件在aav复制期间被病毒调控蛋白rep用于加工所述双链中间体。除了它们在aav复制中的作用之外,itr对于aav基因组包装、转录、非容许条件下的负调控以及位点特异性整合来说也是必不可少的(days和berns,clinmicrobiolrev21(4):583-593,2008)。
aav的左侧orf含有rep基因,其编码四种蛋白质——rep78、rep68、rep52和rep40。右侧orf含有cap基因,其产生三种病毒衣壳蛋白(vp1、vp2和vp3)。所述aav衣壳含有以二十面体对称排布的60个病毒衣壳蛋白。vp1、vp2和vp3以1:1:10的摩尔比存在(daya和berns,clinmicrobiolrev21(4):583-593,2008)。
aav目前是基因疗法最常用的病毒之一。尽管aav感染人类和某些其他灵长类物种,但尚不知道会引起疾病,并且它引发非常轻微的免疫应答。利用aav的基因疗法载体可以感染分裂和静止期细胞两者,并以染色体外状态持续存在而不整合到宿主细胞的基因组中。由于aav的有利特点,因此本公开设想了将aav用于本文公开的重组核酸分子和方法。
aav具有基因疗法载体所需的几种特点,包括结合和进入靶细胞、进入细胞核的能力,在细胞核中长期表达的能力和低毒性。然而,aav基因组的小尺寸限制了可以并入的异源dna的尺寸。为了使这个问题最小化,已构建了不编码rep和整合效率元件(iee)的aav载体。itr得以保留,因为它们是包装所需的顺式信号(daya和berns,clinmicrobiolrev,21(4):583-593,2008)。
用于生产适合于基因疗法的raav的方法在本领域中是公知的(参见例如美国专利申请号2012/0100606、2012/0135515、2011/0229971和2013/0072548;以及ghosh等,genether13(4):321-329,2006),并且可用于本文中公开的重组核酸分子和方法。
在某些情况下,本公开提供了本文中公开的raav用于治疗丙酸血症(pa)的用途,其中所述raav包含aav衣壳和包装在其中的载体基因组。在某些实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-itr,启动子序列,pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列和3’-itr。在某些实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-itr,启动子序列,人类pcca5’-utr的截短或完整的核苷酸序列,pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列,人类pcca3’-utr的截短或完整的核苷酸序列和3’-itr。在示例性实施方式中,所述包装的基因组还包含在所述启动子序列上游的增强子序列、在所述启动子下游的内含子和在所述3’-itr上游的多聚腺苷酸化序列。因此,在另一个示例性实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-itr,增强子序列,启动子序列,内含子序列,pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列,多聚腺苷酸化信号序列和3’-itr。在另一个示例性实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-itr,增强子序列,启动子序列,内含子序列,人类pcca5’-utr的截短或完整的核苷酸序列,pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列,多聚腺苷酸化信号序列,人类pcca3’-utr的截短或完整的核苷酸序列和3’-itr。在另一个示例性实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:aav25’-itr序列,cmv增强子,cba启动子,sv40小t内含子,pcca的编码序列,bgh多聚腺苷酸化信号序列进而aav23’-itr。在另一个示例性实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:aav25’-itr序列,cmv增强子,本源pcca启动子,sv40小t内含子,pcca5’-utr的核苷酸序列,pcca的编码序列,本源pcca多聚腺苷酸化信号序列,pcca3’-utr的核苷酸序列和aav23’-itr。在某些实施方式中,所述包装的基因组还包含位于所述内含子序列下游的共有kozak序列。在某些实施方式中,所述包装的基因组还包含位于所述本源pcca5’-utr序列下游的共有kozak序列。在某些实施方式中,所述pcca的编码序列选自seqidno:1-6。在某些实施方式中,所述衣壳是aav9衣壳。
图1中提供的原理图示出了用于表达pcca的示例性包装的载体基因组构建物,其以5’至3’的顺序示出了:5’-itr,cmv增强子,cba启动子,sv40小t内含子,共有kozak序列,pcca编码序列,sv40多聚腺苷酸化信号序列和3’-itr。
在某些情况下,本公开提供了本文中公开的raav用于治疗丙酸血症(pa)的用途,其中所述raav包含aav衣壳和包装在其中的载体基因组,其中所述包装的基因组作为可操作连接的组件以5’至3’的顺序包含:5’-itr,启动子序列,pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列和3’-itr。在某些实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-itr,启动子序列,人类pccb5’-utr的截短或完整的核苷酸序列,pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列,人类pccb3’-utr的截短或完整的核苷酸序列和3’-itr。在示例性实施方式中,所述包装的基因组还包含在所述启动子序列上游的增强子序列、在所述启动子下游的内含子和在所述3’-itr上游的多聚腺苷酸化序列。因此,在另一个示例性实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-itr,增强子序列,启动子序列,内含子序列,pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列,多聚腺苷酸化信号序列和3’-itr。在另一个示例性实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-itr,增强子序列,启动子序列,内含子序列,人类pccb5’-utr的截短或完整的核苷酸序列,pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列,多聚腺苷酸化信号序列,人类pccb3’-utr的截短或完整的核苷酸序列和3’-itr。在另一个示例性实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:aav25’-itr序列,cmv增强子,cba启动子,sv40小t内含子,pccb的编码序列,bgh多聚腺苷酸化信号序列和aav23’-itr。在另一个示例性实施方式中,所述raav含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:aav25’-itr序列,cmv增强子,本源pccb启动子,sv40小t内含子,pccb5’-utr的核苷酸序列,pccb的编码序列,本源pccb多聚腺苷酸化信号序列,pccb3’-utr的核苷酸序列和aav23’-itr。在某些实施方式中,所述包装的基因组还包含位于所述内含子序列下游的共有kozak序列。在某些实施方式中,所述包装的基因组还包含位于所述本源pccb5’-utr序列下游的共有kozak序列。在某些实施方式中,所述pccb的编码序列选自seqidnos:7-12。在某些实施方式中,所述衣壳是aav9衣壳。
图2中提供的原理图示出了用于表达pccb的示例性包装的载体基因组构建物,其以5’至3’的顺序示出了:5’-itr,cmv增强子,cba启动子,sv40小t内含子,共有kozak序列,pcca编码序列,sv40多聚腺苷酸化信号序列和3’-itr。
蛋白质定位:
丙酰辅酶a羧化酶是一种定位到线粒体基质的多聚体蛋白(参见browner等,(1989)journalofbiologicalchemistry.264:12680-5)。因此,递送pcca和/或pccb基因的基因疗法载体必须能够编码在线粒体中有功能并且定位于线粒体中的蛋白质。一方面,本文中公开的一种或多种病毒载体驱动并调控编码位于线粒体中的pcca和/或pccb蛋白的基因的表达(例如pcca或pccb的表达)。
药物组合物:
本公开提供了包含本文中公开的raav和可药用载体的组合物。适合用于raav的施用的药物剂型可以在例如美国专利申请公布号2012/0219528中找到。在本公开中有用的可药用载体(介质)是常规的。《remington制药学》(remington'spharmaceuticalsciences),e.w.martin,mackpublishingco.,easton,pa.,第15版(1975)描述了适用于一种或多种治疗性化合物、分子或药剂的药物递送的组合物和剂型。
正如在前述段落中强调的,本公开在某些方面涉及包含本发明的raav的药物组合物。在某些实施方式中,所述药物组合物包含可药用载体或赋形剂。在某些实施方式中,所述药物组合物被配制成用于皮下、肌肉内、真皮内、腹膜内或静脉内施用。在示例性实施方式中,所述药物组合物被配制成用于静脉内施用。
在某些实施方式中,所述raav被配制在适合于在人类受试者中输注的缓冲剂/载体中。所述缓冲剂/载体应该包含防止所述raav粘附到输液管,但是不干扰所述raav的体内结合活性的组分。各种适合的溶液可以包含下述一者或多者:缓冲盐水,表面活性剂,以及离子强度被调整到等同于约100mm氯化钠(nacl)至约250mm氯化钠的生理相容的盐或盐的混合物或被调整到等同离子浓度的生理相容的盐。ph可以在6.5至8.5或7至8.5或7.5至8的范围内。适合的表面活性剂或表面活性剂的组合可以选自泊洛沙姆(即由中央的聚氧丙烯10(聚(氧化丙烯))疏水链和两侧的两个聚氧乙烯(聚(氧化乙烯))的亲水链组成的三嵌段共聚物)、solutolhs15(聚乙二醇-15羟基硬脂酸酯)、labrasol(聚氧乙烯辛酸甘油酯)、聚氧乙烯10油基醚、tween(聚氧乙烯失水山梨糖醇脂肪酸酯)、乙醇和聚乙二醇。
治疗丙酸血症的方法:
另一方面,本公开提供了在人类受试者中治疗pa的方法,所述方法包括向所述人类受试者施用治疗有效量的至少一种本文中公开的raav。
在一个实施方式中,本公开提供了一种治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列。
在另一个实施方式中,本公开提供了一种治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列。
在又一个实施方式中,本公开提供了一种治疗pa的方法,所述方法包括施用:(1)包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列;和(2)包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,所述(1)和(2)的raav可以同时施用。在某些实施方式中,所述(1)和(2)的raav可以顺序施用。在某些实施方式中,所述(1)和(2)的raav可以分开施用。
在某些实施方式中,本公开提供了一种治疗pa的方法,所述方法包括施用:(1)包含aav衣壳和包装在其中的载体基因组的raav,其中所述编码序列是针对pcca而不是针对pccb,所述启动子是pcca基因特异性内源启动子而不是pccb基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是pcca基因特异性内源多聚腺苷酸化信号序列而不是pccb基因特异性内源多聚腺苷酸化信号序列;和/或(2)包含aav衣壳和载体基因组的raav,其中所述编码序列是针对pccb而不是针对pcca,所述启动子是pccb基因特异性内源启动子而不是pcca基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是pccb基因特异性内源多聚腺苷酸化信号序列而不是pcca基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述(1)和(2)的raav可以同时施用。在某些实施方式中,所述(1)和(2)的raav可以顺序施用。在某些实施方式中,所述(1)和(2)的raav可以分开施用。
在某些实施方式中,本公开提供了在人类受试者中治疗pa的方法,所述方法包括向被诊断为在pcca中具有至少一个突变的人类受试者施用治疗有效量的至少一种本文中公开的raav。在一个实施方式中,本公开提供了一种在被诊断为在pcca中具有至少一个突变的人类受试者中治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,本公开提供了一种在被诊断为在pcca中具有至少一个突变的人类受试者中治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述编码序列是针对pcca而不是针对pccb,所述启动子是pcca基因特异性内源启动子而不是pccb基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是pcca基因特异性内源多聚腺苷酸化信号序列而不是pccb基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述pcca中的突变选自表1。在某些实施方式中,所述pcca的编码序列选自seqidnos:1-6。在某些实施方式中,所述衣壳是aav9衣壳。
在某些情况下,本公开提供了在人类受试者中治疗pa的方法,所述方法包括向被诊断为在pccb中具有至少一个突变的人类受试者施用治疗有效量的至少一种本文中公开的raav。在一个实施方式中,本公开提供了一种在被诊断为在pccb中具有至少一个突变的人类受试者中治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,本公开提供了一种在被诊断为在pccb中具有至少一个突变的人类受试者中治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述编码序列是针对pccb而不是针对pcca,所述启动子是pccb基因特异性内源启动子而不是pcca基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是pccb基因特异性内源多聚腺苷酸化信号序列而不是pcca基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述pccb中的突变选自表2。在某些实施方式中,所述pccb的编码序列选自seqidnos:7-12。
在某些实施方式中,所述衣壳是aav9衣壳。
描述引起pa的pcca和pccb中的突变的综述文章提供在ugarte等,1999,hum.mutat.14(4):275-282中。
在由突变的pcca基因引起的pa中,已鉴定到pcca基因中的下述突变和多态性:
表1–pcca基因突变和多态性:
在由突变的pccb基因引起的pa中,已鉴定到pccb基因中的下述突变和多态性:
表2–pccb基因突变和多态性:
在某些实施方式中,本公开提供了在被诊断为在pcca中具有选自表1的至少一个突变的人类受试者中治疗pa的方法,所述方法包括向所述人类受试者施用治疗有效量的至少一种本文中公开的raav。在一个实施方式中,本公开提供了一种在被诊断为在pcca中具有选自表1的至少一个突变的人类受试者中治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pcca或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,所述pcca的编码序列选自seqidnos:1-6。在某些实施方式中,所述衣壳是aav9衣壳。
在某些实施方式中,本公开提供了在被诊断为在pccb中具有选自表2的至少一个突变的人类受试者中治疗pa的方法,所述方法包括向所述人类受试者施用治疗有效量的至少一种本文中公开的raav。在一个实施方式中,本公开提供了一种在被诊断为在pccb中具有选自表2的至少一个突变的人类受试者中治疗pa的方法,所述方法包括施用包含aav衣壳和包装在其中的载体基因组的raav,其中所述载体基因组包含pccb或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,所述pccb的编码序列选自seqidnos:7-12。在某些实施方式中,所述衣壳是aav9衣壳。
任何适合的方法或途径可用于施用本文中描述的raav或含有raav的组合物。施用途径包括例如系统性、口服、吸入、鼻内、气管内、动脉内、眼内、静脉内、肌肉内、皮下、真皮内和其他肠胃外施用途径。在某些实施方式中,所述raav、包含raav的组合物或包含多种raav(例如一种raav表达pcca并且第二种raav表达pccb)的组合物被静脉内施用。
对于每位患者来说,施用的具体剂量可以是均一的剂量,例如每位患者1.0x1011–1.0x1014基因组拷贝(gc)的病毒。或者,患者的剂量可以根据所述患者的粗略体重或表面积来定制。确定适合剂量的其他因素可以包括待治疗或预防的疾病或病症、所述疾病的严重性、施用途径、所述患者的年龄、性别和医疗状况。确定适合的治疗剂量所必需的计算的进一步改进由本领域技术人员常规做出,尤其是根据本文公开的剂量信息和测定法。剂量也可通过使用与适合的剂量响应数据相结合使用的用于确定剂量的已知测定法来确定。也可以随着疾病进展的监测来调整各个患者的剂量。
在某些实施方式中,所述raav以例如约1.0x1011基因组拷贝/千克患者体重(gc/kg)至约1x1014gc/kg、约5x1011基因组拷贝/千克患者体重(gc/kg)至约5x1013gc/kg或约1x1012至约1x1013gc/kg的剂量施用,正如通过qpcr或数字液滴pcr(ddpcr)所测量的。在某些实施方式中,所述raav以约1x1012至约1x1013基因组拷贝(gc)/kg的剂量施用。在某些实施方式中,所述raav以约1.1x1011、约1.3x1011、约1.6x1011、约1.9x1011、约2x1011、约2.5x1011、约3.0x1011、约3.5x1011、约4.0x1011、约4.5x1011、约5.0x1011、约5.5x1011、约6.0x1011、约6.5x1011、约7.0x1011、约7.5x1011、约8.0x1011、约8.5x1011、约9.0x1011、约9.5x1011、约1.0x1012、约1.5x1012、约2.0x1012、约2.5x1012、约3.0x1012、约3.5x1012、约4.0x1012、约4.5x1012、约5.0x1012、约5.5x1012、约6.0x1012、约6.5x1012、约7.0x1012、约7.5x1012、约8.0x1012、约8.5x1012、约9.0x1012、约9.5x1012、约1.0x1013、约1.5x1013、约2.0x1013、约2.5x1013、约3.0x1013、约3.5x1013、约4.0x1013、约4.5x1013、约5.0x1013、约5.5x1013、约6.0x1013、约6.5x1013、约7.0x1013、约7.5x1013、约8.0x1013、约8.5x1013、约9.0x1013、约9.5x1013基因组拷贝(gc)/kg的剂量施用。根据需要,所述raav可以在单剂或多剂(例如2、3、4、5、6、7、8、9、10剂或更多剂)中施用,以获得所需治疗结果。
药剂可以每周、每月或每年施用一次或多次,或甚至每2至20年施用一次。例如,每剂药剂可以最少隔1周、隔2周、隔3周、隔1个月、隔3个月、隔6个月或隔1年施用。本领域普通技术人员可以根据所述可靶向构建物或复合物在体液或组织中的实测停留时间和浓度,容易地估算出施用的重复率。
在整个本说明书中,在组合物被描述成具有、包括或包含特定组分的情况下或过程和方法被描述成具有、包括或包含特定步骤的情况下,设想了另外存在基本上由所叙述的组分构成或由其构成的本发明的组合物,并且另外存在基本上由所叙述的过程步骤构成或由其构成的本发明的过程和方法。
在本公开中,在要素或组分被描述为包括在所叙述的要素或组分名单中和/或选自所述名单的情况下,应该理解所述要素或组分可以是所叙述的要素或组分中的任一者,或者所述要素或组分可以选自所叙述的要素或组分中的两者或更多者。
此外,应该理解,本文中描述的组合物或方法的要素和/或特点可以以不背离本公开的精神和范围的各种不同方式组合,不论在本文中明示还是暗示。例如,在指称特定化合物的情况下,该化合物可用于本发明的组合物的各种不同实施方式中和/或本发明的方法中,除非从上下文另有理解。换句话说,在本公开中,实施方式以能够书写并描绘清楚简明的申请的方式描述和描绘,但是应当理解并且可以理解,在不脱离本文的教导和发明的情况下可以对实施方式进行各种不同的组合或分离。例如,应该认识到,本文中描述和描绘的所有特点可以适用于本文中描述和描绘的发明的所有方面。
应当理解,表述“……中的至少一者”分别包括在所述表述之后的每个所叙述的受试者以及所叙述的受试者中的两者或更多者的各种不同组合,除非从上下文和用法中另有理解。与三个或更多个所叙述的受试者相关联的表述“和/或”应该被理解为具有相同的含义,除非从上下文另有理解。
术语“包括”、“具有”、“含有”、包括其语法等同形式的使用,通常应该被理解为开放性且非限制性的,例如不排除另外的未叙述的要素或步骤,除非另有具体陈述或从上下文另有理解。
在定量值之前使用术语“约”的情况下,除非另有具体陈述,否则本发明还包括所述具体定量值本身。当在本文中使用时,除非另有指明或推断,否则术语“约”是指与所述标称值相差±10%。
应该理解,步骤顺序或用于执行某些行动的顺序是不重要的,只要本发明仍然可操作即可。此外,两个或更多个步骤或行动可以同时进行。
本文中的任何和所有的实例或示例性语言例如“例如”或“包括”的使用仅打算更好地说明本发明,并且除非宣称,否则不对本发明的范围构成限制。本说明书中的任何语言均不应被解释为表明任何未要求保护的要素对于本发明的实践来说是必不可少的。
实施例
通过参考下面的实施例,现在正一般性描述的本公开将更容易理解,包含所述实施例仅仅是出于说明本公开的某些方面和实施方式的目的,并不打算以任何方式限制本公开的范围。
实施例1:pcca的rna和蛋白质表达
rna表达
本实施例涉及在转染连续肝细胞系(hepg2)后通过rt-qpcr所确定的pcca的rna表达。简单来说,使用lipofectamine2000(invitrogen),按照制造商的说明书将hepg2细胞用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)或带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)转染。在转染后72小时收获hepg2细胞并裂解。使用trizol试剂(invitrogen),按照制造商的说明书从裂解的hepg2细胞提取rna。使用nanodropnd-1000(thermoscientific),通过od260/280和od260/230比率来测量rna的质量和数量。使用高能力cdna反转录试剂盒(thermofisherscientific),按照制造商的说明书将总rna反转录成。使用appliedbiosystems7500实时pcr系统,使用powersybrgreenpcr主混合物(appliedbiosystems),按照制造商的说明书进行实时rt-qpcr。通过delta-deltact(2-δδct)方法计算pcca表达的变化倍数,使用rna聚合酶ii多肽a(polr2a)作为每个样品的内部对照并将所述计算的变化倍数相对于“无tx”对照进行归一化(参见livakkj,schmittgentd(2001),“使用实时定量pcr和2(-deltadeltac(t))方法分析相对基因表达”(analysisofrelativegeneexpressiondatausingreal-timequantitativepcrandthe2(-deltadeltac(t))method),methods25(4):402–408)。图3是条形图,示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)或带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)转染连续肝细胞系(hepg2)后,通过rt-qpcr所确定的pccarna表达的变化倍数。
所述作图的数据显示,用dtc346转染后完全本源的人类pcca的rna表达,与用dtc347和dtc348转染后两种密码子优化的人类pcca版本的表达相当。用dtc349转染的细胞表现出更高的rna表达。
蛋白质表达
本实施例还涉及连续肝细胞系hepg2和huh7的转染后pcca的蛋白质表达。简单来说,使用lipofectamine2000(invitrogen),按照制造商的说明书将hepg2和huh7细胞系用对照质粒(带有空载体、没有tx的质粒)、带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)、带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)、带有编码人类pcca的完整本源序列的核苷酸序列和编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc365)或带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)转染。在转染后72小时收获细胞,并用增补有蛋白酶抑制剂混合物(sigma)和磷酸酶抑制剂混合物2+3(sigmap5726和p0044)的np-40裂解缓冲液(50mmtris·hclph8.0,150mmnacl,1.0%np-40)裂解。将蛋白质在10%十二烷基硫酸钠聚丙烯酰胺电泳(sds-page)凝胶上分离,并转移到
图4a是照片,从第1道至第7道分别示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)、带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)、带有编码人类pcca的完整本源序列的核苷酸序列和编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc365)或带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)转染的连续肝细胞系(hepg2)中,通过western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
如图4a中所示,在“无tx”对照(第1道)中存在预期的基础水平的pcca蛋白表达,并且当与“无tx”对照(第1道)相比时,在用dtc346(第2道)转染的细胞和用dtc347(第3道)或dtc348(第4道)转染的细胞中存在pcca蛋白的过表达。用dtc349(第5道)转染的细胞未表现出pcca蛋白的过表达,尽管观察到这个版本表达大量rna。正如预期,用dtc343(第7道)转染的细胞表现出egfp表达。
图4b是照片,从第1道至第7道分别示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)、带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)或带有编码人类pcca的完整本源序列的核苷酸序列和编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc365)转染的连续肝细胞系(huh7)中,通过western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
如图4b中所示,在“无tx”对照(第1道)中存在预期的基础水平的pcca蛋白表达,并且当与“无tx”对照(第1道)相比时,在用dtc346(第3道)转染的细胞和用dtc347(第4道)或dtc348(第5道)转染的细胞中存在pcca蛋白的过表达。用dtc349(第6道)转染的细胞未表现出pcca蛋白的过表达,尽管观察到这个版本表达大量rna。正如预期,用dtc343(第2道)转染的细胞表现出egfp表达。
实施例2:过表达的人类pcca蛋白定位到线粒体
这个实施例显示出在连续肝细胞系(hepg2)中过表达的人类pcca定位到线粒体。简单来说,将连续肝细胞系(hepg2)用带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)转染。在转染后,对细胞进行亚细胞分级,其中将胞质和线粒体级分分离。也对全细胞裂解液进行处理。将蛋白质在10%十二烷基硫酸钠聚丙烯酰胺电泳(sds-page)凝胶上分离,并转移到
如图5中所示并且与图4a-b中示出的结果相一致,当与未转染的对照细胞相比时,用带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)转染的细胞在全细胞裂解液中表现出pcca过表达(图5中的第7道相比于第8道)。调查了一种已知定位到线粒体的蛋白质mitofilin的水平,以确定分离的细胞级分的相对纯度。如图5中所示,未转染的和dtc346转染的细胞的胞质级分未表现出可检测水平的mitofilin(图5中的第1道相比于第2道),而正如预期的,mitofilin在线粒体级分和全细胞裂解液中被容易地检测到(图5中的第3-8道)。过表达的pcca主要定位到线粒体(图5中的第2道相比于第4和6道)。
实施例3:pccaaav9滴度产量的比较
本实施例涉及从带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)或带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)获得的pccaaav9滴度产量的比较。将连续肾细胞系(hek293)用带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)、带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)或带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)三重转染;每个所述载体质粒被表达在用表达aav9衣壳的质粒(paav2/9)和提供腺病毒辅助功能的质粒(padhelper)共转染的细胞中。未转染的细胞被用作对照并在图6中被表示为“无tx”。收获细胞上清液并用dnasei或等同物处理,以消除未被衣壳包裹的dna,并便于利用对包含在这些构建物的设计中的多聚腺苷酸化信号特异的引物/探针组对dnase抗性粒子(drp)滴度进行定量。图6是条形图,从左至右示出了在连续肾细胞系(hek293)的三重转染后通过qpcr所确定的pccaaav9滴度(以基因组拷贝(gc)/ml为单位)的变化倍数,所述细胞用带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pcca的完整本源序列的核苷酸序列的raav载体质粒(dtc346)或带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc347、dtc348或dtc349)转染,每种质粒在用表达aav9衣壳的质粒(paav2/9)和提供腺病毒辅助功能的质粒(padhelper)共转染的细胞中表达。未转染的细胞被用作对照并被表示为“无tx”。图6示出了通过qpcr确定的pccaaav9滴度(以基因组拷贝(gc)/ml为单位)相对于未转染的细胞的变化倍数。图6中示出的数据证实了表达本源的完整人类pcca的构建物(dtc346)与所有密码子优化的版本(dtc347、dtc348和dtc349)之间可比的raav滴度。
实施例4:测试pccadna完整性
在通过三重转染在hek293细胞中产生aav9raav病毒粒子后,收获细胞上清液并与aavx树脂(thermofisher)或等同物温育。将aav9raav病毒粒子纯化,然后用amicon离心管式滤器(milliporesigma)浓缩。将纯化的病毒在碱性裂解缓冲液中温育,载样到dna琼脂糖凝胶中,并在存在碱性运行缓冲液的情况下运行过夜。图7是从左至右分别为亲和纯化的含有表达pcca和pccb的重组aav(raav)载体盒(dtc365)、表达pcca的重组aav(raav)载体盒(dtc349、dtc348、dtc347或dtc346)或表达egfp的重组aav(raav)载体盒(dtc343)的aav9粒子的dna碱性琼脂糖凝胶的照片。
如图7中所示,凝胶照片在本源和密码子优化的pcca载体盒的预期大小处显示出清楚的单一条带,表明载体基因组(dtc346、dtc347、dtc348和dtc349)的适合的包装。egfp对照(dtc343)表明两个条带的包装,与包装小载体基因组的已知限制相符。
实施例5:pccb的rna和蛋白质表达
rna表达
本实施例涉及在转染连续肝细胞系(hepg2)后通过rt-qpcr所确定的pccb的rna表达。简单来说,使用lipofectamine2000(invitrogen),按照制造商的说明书将hepg2细胞用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pccb的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc370、dtc368、dtc369或dtc371)转染。在转染后72小时收获hepg2细胞并裂解。使用trizol试剂(invitrogen),按照制造商的说明书从裂解的hepg2细胞提取rna。使用nanodropnd-1000(thermoscientific),通过od260/280和od260/230比率来测量rna的质量和数量。使用高能力cdna反转录试剂盒(thermofisherscientific),按照制造商的说明书将总rna反转录成。使用appliedbiosystems7500实时pcr系统,使用powersybrgreenpcr主混合物(appliedbiosystems),按照制造商的说明书进行实时rt-qpcr。通过delta-deltact(2-δδct)方法计算pccb表达的变化倍数,使用rna聚合酶ii多肽a(polr2a)作为每个样品的内部对照并将所述计算的变化倍数相对于“无tx”对照进行归一化(参见livakkj,schmittgentd(2001),“使用实时定量pcr和2(-deltadeltac(t))方法分析相对基因表达”(analysisofrelativegeneexpressiondatausingreal-timequantitativepcrandthe2(-deltadeltac(t))method),methods25(4):402–408)。图8是条形图,示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pccb的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc370、dtc368、dtc369或dtc371)转染连续肝细胞系(hepg2)后,通过rt-qpcr所确定的pccbrna表达的变化倍数。
所述作图的数据显示,用dtc366转染后人类pccb的完全本源列的rna表达,与用dtc367、dtc368、dtc370或dtc371转染后的四种密码子优化的人类pccb版本的表达相当。用dtc369转染的细胞表现出更低的rna表达。
蛋白质表达
本实施例还涉及连续肝细胞系hepg2和huh7的转染后pccb的蛋白质表达。简单来说,使用lipofectamine2000(invitrogen),按照制造商的说明书将hepg2和huh7细胞系用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pccb的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc368、dtc369、dtc370或dtc371)转染。在转染后72小时收获细胞,并用增补有蛋白酶抑制剂混合物(sigma)和磷酸酶抑制剂混合物2+3(sigmap5726和p0044)的np-40裂解缓冲液(50mmtris·hclph8.0,150mmnacl,1.0%np-40)裂解。将蛋白质在10%十二烷基硫酸钠聚丙烯酰胺电泳(sds-page)凝胶上分离,并转移到immun-
图9a是照片,从第1道至第8道分别示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pccb的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc368、dtc369、dtc370或dtc371)转染的连续肝细胞系(hepg2)中,通过western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
如图9a中所示,在“无tx”对照(第1道)中存在预期的基础水平的pccb蛋白表达,并且当与“无tx”对照(第1道)相比时,在用dtc366(第3道)转染的细胞和用dtc367(第4道)或dtc370(第7道)转染的细胞中存在pccb蛋白的过表达。用dtc368(第5道)、dtc369(第6道)或dtc371(第8道)转染的细胞未表现出pccb蛋白的过表达。正如预期,用dtc343(第2道)转染的细胞表现出egfp表达。
图9b是照片,从第1道至第8道分别示出了在用对照质粒(带有空载体、没有tx的质粒)、带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pccb的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc369、dtc368、dtc370或dtc371)转染的连续肝细胞系(huh7)中,通过western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
如图9b中所示,在“无tx”对照(第1道)中存在预期的基础水平的pccb蛋白表达,并且当与“无tx”对照(第1道)相比时,在用dtc366(第3道)转染的细胞和用dtc367(第4道)或dtc370(第7道)转染的细胞中存在pccb蛋白的过表达。用dtc368(第6道)、dtc369(第5道)或dtc371(第8道)转染的细胞未表现出pccb蛋白的过表达。正如预期,用dtc343(第2道)转染的细胞表现出egfp表达。
实施例6:过表达的人类pccb蛋白定位到线粒体
这个实施例显示出在连续肝细胞系(hepg2)中过表达的人类pccb定位到线粒体。简单来说,将连续肝细胞系(hepg2)用带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)转染。在转染后,对细胞进行亚细胞分级,其中将胞质和线粒体级分分离。也对全细胞裂解液进行处理。将蛋白质在10%十二烷基硫酸钠聚丙烯酰胺电泳(sds-page)凝胶上分离,并转移到
图10是照片,示出了在从用或未用带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)转染的连续肝细胞系(hepg2)分离的全细胞裂解液(wcl)、亚细胞级分(胞质级分(cyto)和线粒体级分(线粒体))中,通过western印迹所检测的pccb蛋白表达水平。1x和2x表示所载样的线粒体级分的相对体积。β-肌动蛋白(“肌动蛋白”)被用作载样对照。
如图10中所示并且与前述结果相一致,当与未转染的对照细胞相比时,用带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)转染的细胞在全细胞裂解液中表现出pccb蛋白过表达(图10中的第7道相比于第8道)。调查了一种已知定位到线粒体的蛋白质mitofilin的水平,以确定分离的细胞级分的相对纯度。如图10中所示,未转染的和dtc366转染的细胞的胞质级分未表现出可检测水平的mitofilin(第1道相比于第2道),而正如预期的,mitofilin在线粒体级分和全细胞裂解液中被容易地检测到(第3-8道)。过表达的pccb主要定位到线粒体(第2道相比于第4和6道)。
实施例7:pccbaav9滴度产量的比较
本实施例涉及从带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pccb的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc368、dtc369、dtc370或dtc371)获得的pccbaav9滴度产量的比较。将连续肾细胞系(hek293)用带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc368、dtc369、dtc370或dtc371)三重转染;每个所述载体质粒被表达在用表达aav9衣壳的质粒(paav2/9)和提供腺病毒辅助功能的质粒(padhelper)共转染的细胞中。未转染的细胞被用作对照并在图11中被表示为“无tx”。收获细胞上清液并用dnasei或等同物处理,以消除未被衣壳包裹的dna,并便于利用对包含在这些构建物的设计中的多聚腺苷酸化信号特异的引物/探针组对dnase抗性粒子(drp)滴度进行定量。图11是条形图,从左至右示出了在连续肾细胞系(hek293)的三重转染后通过qpcr所确定的pccbaav9滴度(以基因组拷贝(gc)/ml为单位)的变化倍数,所述细胞用带有编码增强绿色荧光蛋白egfp的核苷酸序列的raav载体质粒(dtc343)、带有编码人类pccb的完整本源序列的核苷酸序列的raav载体质粒(dtc366)或带有编码人类pcca的密码子优化的序列的核苷酸序列的raav载体质粒(dtc367、dtc368、dtc369、dtc370或dtc371)转染,每种质粒在用表达aav9衣壳的质粒(paav2/9)和提供腺病毒辅助功能的质粒(padhelper)共转染的细胞中表达。未转染的细胞被用作对照并被表示为“无tx”。图11示出了通过qpcr确定的pccbaav9滴度(以基因组拷贝(gc)/ml为单位)相对于未转染的细胞的变化倍数。图11中示出的数据证实了表达本源的完整人类pccb的构建物(dtc366)与所有密码子优化的版本(dtc367、dtc368、dtc369、dtc370和dtc371)之间可比的raav滴度。
实施例8:测试pccbdna完整性
在通过三重转染在hek293细胞中产生aav9raav病毒粒子后,收获细胞上清液并与aavx树脂(thermofisher)或等同物温育。将aav9raav病毒粒子纯化,然后用amicon离心管式滤器(milliporesigma)浓缩。将纯化的病毒在碱性裂解缓冲液中温育,载样到dna琼脂糖凝胶中,并在存在碱性运行缓冲液的情况下运行过夜。图12是从左至右分别为亲和纯化的含有对照质粒(带有空载体、没有tx的质粒)、表达egfp的重组aav(raav)载体盒(dtc343)或表达pccb的重组aav(raav)载体盒(dtc366、dtc367、dtc368、dtc369、dtc370或dtc371)的aav9粒子的dna碱性琼脂糖凝胶的照片。
如图12中所示,凝胶照片在本源和密码子优化的pccb载体盒的预期大小处显示出清楚的单一条带,表明载体基因组(dtc366、dtc367、dtc368、dtc369、dtc370和dtc371)的适合的包装。egfp对照(dtc343)表明两个条带的包装,与包装小载体基因组的已知限制相符。
实施例9:pcca病毒载体向野生型小鼠的施用
本实施例涉及在用表达完整本源人类pcca(dtc346)或密码子优化的(dtc347、dtc348和dtc349)人类pcca的raav治疗后,野生型fvb小鼠中人类pcca蛋白的表达。简单来说,将小鼠(n=2或3)用1.66x1011病毒基因组(vg)或5x1011vg的表达由seqidno:38表示的完整本源人类pcca的raav(dtc346)或表达密码子优化的人类pcca的raav(dtc347、dtc348和dtc349)静脉内注射。人类pcca蛋白和内源小鼠pcca蛋白通过lc-ms来检测。图13是条形图,示出了在野生型fvb小鼠中,在用编码人类pcca的完整本源序列(dtc346)或人类pcca的密码子优化的序列(dtc347、dtc348或dtc349)的raav治疗后,人类pcca蛋白表达相对于小鼠内源pcca表达的百分率。误差条表示标准偏差。图13中呈现的数据显示,从1.66x1011vg的本源pcca(dtc346)的施用表达的人类pcca为内源小鼠pcca水平的2.5%,并且从5x1011vg的本源pcca病毒载体(dtc346)的施用表达的人类pcca为内源小鼠pcca水平的11.6%。
实施例10:亚效等位基因pcca小鼠模型中的人类pcca活性
本实施例涉及在亚效等位基因pcca小鼠模型中测试人类pcca活性。在小鼠中pcca基因的缺失模拟了所述人类疾病的最严重的形式。pcca基因缺失的小鼠在出生后36小时内死亡,使得难以在它们中试验静脉内系统性疗法(参见guenzel等,molther.2013jul;21(7):1316–1323)。由于在小鼠pcca敲除的背景上引入了编码具有致病性a138t突变的人类pcca的转入基因,亚效等位基因pcca小鼠具有降低的pcca活性。这种突变的pcca基因导致丙酰肉碱、甲基柠檬酸、甘氨酸、丙氨酸、赖氨酸、氨和与心肌病相关的标志物的水平升高,与丙酸血症(pa)患者中这些化合物的水平相近。简单来说,将小鼠(n=5)用1.66x1011病毒基因组(vg)或5x1011vg的编码由seqidno:38表示的人类pcca的完整本源序列(dtc346)的raav静脉内注射。pbs治疗的小鼠被用作对照小鼠。
pcca表达水平和酶活性测定法
在注射后6周,将小鼠肝脏匀浆,并通过lc-ms测量人类野生型pcca蛋白。图14是条形图,示出了在用编码人类pcca的完整本源序列(dtc346)或人类pcca的密码子优化的序列(dtc347、dtc348或dtc349)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中表达的人类野生型pcca蛋白的浓度(以nmol/g蛋白为单位)。所列出的百分数表示被计算为相对于野生型fvb小鼠的内源pcca蛋白水平的百分率的人类野生型pcca表达。误差条表示标准偏差。所列出的百分数表示被计算为相对于野生型fvb小鼠的内源pcca蛋白水平的百分率的人类野生型pcca表达。与前述结果相一致,当与从编码完整本源人类pcca的raav表达的本源人类pcca蛋白相比时,从编码密码子优化的人类pcca的raav表达的人类pcca蛋白表现出更低的表达水平。使用闪烁计数器将肝匀浆液的pcca酶活性测量为碳酸氢钠[c14]的掺入。图15是在用编码人类pcca的完整本源序列(dtc346)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中通过每分钟的平均计数(cpm)数据所度量的人类pcca活性的条形图。误差条表示标准偏差。所列出的百分数描述了相对于在野生型fvb小鼠中观察到的数据的cpm数据。**表示使用dunnett多重比较检验与pbs治疗组相比p<0.01。
如图15中所示,用较高剂量(5x1011vg)的编码完整本源人类pcca的raav注射的小鼠与pbs治疗的小鼠相比表现出pcca活性的统计显著的提高(11%)。
向亚效等位基因pcca小鼠施用本源pcca病毒载体对丙酸血症(pa)的已知生物标志物的浓度的影响
本实施例还涉及测试向亚效等位基因pcca小鼠施用编码人类pcca的完整本源序列的raav(dtc346)对pa的已知生物标志物的血浆浓度的影响。简单来说,将小鼠(n=5)用1.66x1011vg或5x1011vg的编码由seqidno:38表示的人类pcca的完整本源序列的raav(dtc346)静脉内注射。通过液相色谱-质谱术(lc-ms)确定pa的已知生物标志物(丙酰肉碱(c3)、乙酰肉碱(c2)和2-甲基柠檬酸(2mc))的血浆浓度。图16a-c是条形图,示出了在用编码人类pcca的完整本源序列的raav(dtc346)治疗之前(pre)和之后2、3、4和6周(分别为2w、3w、4w和6w),亚效等位基因pcca小鼠模型(a138t突变体)中已知的丙酸血症生物标志物的血浆浓度。误差条表示标准偏差。**表示与pbs治疗组相比p<0.01,***表示与pbs治疗组相比p<0.001,使用dunnett多重比较检验。图16a是条形图,示出了在用编码人类pcca的完整本源序列(dtc346)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中c3(丙酰肉碱)的血浆浓度。图16b是在用编码人类pcca的完整本源序列(dtc346)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中血浆c3/c2浓度比(丙酰肉碱/乙酰肉碱)的条形图。图16c是条形图,示出了在用编码人类pcca的完整本源序列(dtc346)的raav治疗后,亚效等位基因pcca小鼠模型(a138t突变体)中2-甲基柠檬酸(2mc)的血浆浓度。
用任一剂量(1.66x1011vg或5x1011vg)的编码人类pcca的完整本源序列的raav(dtc346)治疗的小鼠与pbs治疗的小鼠相比,表现出血浆c3、c3/c2和2-mc水平的统计显著的降低。
编号实施方式
本文公开的实施方式包括在本公开的编号实施方式中所提供的实施方式p1至p136。
实施方式p1:一种重组腺相关病毒(raav),所述raav包含aav衣壳和包装在其中的载体基因组,所述载体基因组以5’至3’的顺序包含:
(a)5’itr序列;
(b)启动子序列;
(c)pcca的部分或完整编码序列;和
(d)3’itr序列。
实施方式p2:根据实施方式p1所述的raav,其中所述aav衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的aav。
实施方式p3:根据实施方式p2所述的raav,其中所述aav衣壳来自于aav9。
实施方式p4:根据实施方式p2所述的raav,其中所述aav衣壳来自于aav8。
实施方式p5:根据实施方式p1所述的raav,其中所述aav衣壳是aav9变体衣壳。
实施方式p6:根据实施方式p1-p5中的任一项所述的raav,其中所述启动子选自鸡β-肌动蛋白(cba)启动子、巨细胞病毒(cmv)立即早期基因启动子、甲状腺素运载蛋白(ttr)启动子、甲状腺素结合球蛋白(tbg)启动子、α-1抗胰蛋白酶因子(a1at)启动子和cag启动子。
实施方式p7:根据实施方式p6所述的raav,其中所述启动子是cba启动子。
实施方式p8:根据实施方式p1至p7中的任一项所述的raav,其中所述pcca的部分或完整编码序列是野生型编码序列。
实施方式p9:根据实施方式p8所述的raav,其中所述pcca的编码序列包含seqidno:1。
实施方式p10:根据实施方式p1至p7中的任一项所述的raav,其中所述pcca的部分或完整编码序列是密码子优化的编码序列。
实施方式p11:根据实施方式p10所述的raav,其中所述pcca的编码序列包含选自seqidnos:2-6的编码序列。
实施方式p12:根据实施方式p1至p11中的任一项所述的raav,其中所述5’itr序列来自于aav2。
实施方式p13:根据实施方式p1至p11中的任一项所述的raav,其中所述3’itr序列来自于aav2。
实施方式p14:根据实施方式p1至p11中的任一项所述的raav,其中所述5’itr序列和3’itr序列来自于aav2。
实施方式p15:根据实施方式p12至p14中的任一项所述的raav,其中所述5’itr序列和3’itr序列包含seqidno:15或由其构成。
实施方式p16:根据实施方式p1至p11中的任一项所述的raav,其中所述5’itr序列和/或3’itr序列来自于非aav2来源。
实施方式p17:根据实施方式p1至p16中的任一项所述的raav,其中所述包装的基因组还包含一个或多个增强子序列。
实施方式p18:根据实施方式p17所述的raav,其中所述增强子选自巨细胞病毒立即早期基因(cmv)增强子、甲状腺素运载蛋白增强子(enttr)、鸡β-肌动蛋白(cba)增强子、en34增强子和apoe增强子。
实施方式p19:根据实施方式p18所述的raav,其中所述增强子是cmv增强子。
实施方式p20:根据实施方式p19所述的raav,其中所述增强子包含seqidno:19或由其构成。
实施方式p21:根据实施方式p18至p20中的任一项所述的raav,其中所述增强子位于所述启动子序列上游。
实施方式p22:根据实施方式p1至p21中的任一项所述的raav,其中所述包装的基因组还包含一个或多个内含子序列。
实施方式p23:根据实施方式p22所述的raav,其中所述内含子选自sv40小t内含子、兔血红蛋白亚基β(rhbb)内含子、人类β珠蛋白ivs2内含子、promega嵌合内含子或hfix内含子。
实施方式p24:根据实施方式p23所述的raav,其中所述内含子是sv40小t内含子。
实施方式p25:根据实施方式p24所述的raav,其中所述内含子包含seqidno:20或由其构成。
实施方式p26:根据实施方式p23所述的raav,其中所述内含子是rhbb内含子。
实施方式p27:根据实施方式p26所述的raav,其中所述内含子包含seqidno:21或由其构成。
实施方式p28:根据实施方式p1至p27中的任一项所述的raav,其中所述包装的基因组还包含多聚腺苷酸化信号序列。
实施方式p29:根据实施方式p28所述的raav,其中所述多聚腺苷酸化信号序列选自牛生长激素(bgh)多聚腺苷酸化信号序列、sv40多聚腺苷酸化信号序列和兔β珠蛋白多聚腺苷酸化信号序列。
实施方式p30:根据实施方式p29所述的raav,其中所述多聚腺苷酸化信号序列是牛生长激素(bgh)多聚腺苷酸化信号序列。
实施方式p31:根据实施方式p30所述的raav,其中所述多聚腺苷酸化信号序列包含seqidno:22或由其构成。
实施方式p32:根据实施方式p29所述的raav,其中所述多聚腺苷酸化信号序列是sv40多聚腺苷酸化信号序列。
实施方式p33:根据实施方式p32所述的raav,其中所述多聚腺苷酸化信号序列包含seqidno:23或由其构成。
实施方式p34:一种重组腺相关病毒(raav),所述raav包含aav衣壳和包装在其中的载体基因组,所述载体基因组以5’至3’的顺序包含:
(a)5’itr序列;
(b)启动子序列;
(c)pccb的部分或完整编码序列;和
(d)3’itr序列。
实施方式p35:根据实施方式p34所述的raav,其中所述aav衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的aav。
实施方式p36:根据实施方式p35所述的raav,其中所述aav衣壳来自于aav9。
实施方式p37:根据实施方式p35所述的raav,其中所述aav衣壳来自于aav8。
实施方式p38:根据实施方式p34所述的raav,其中所述aav衣壳是aav9变体衣壳。
实施方式p39:根据实施方式p34至p38中的任一项所述的raav,其中所述启动子选自鸡β-肌动蛋白(cba)启动子、巨细胞病毒立即早期基因(cmv)启动子、甲状腺素运载蛋白(ttr)启动子、甲状腺素结合球蛋白(tbg)启动子、α-1抗胰蛋白酶因子(a1at)启动子和cag启动子。
实施方式p40:根据实施方式p39所述的raav,其中所述启动子是cba启动子。
实施方式p41:根据实施方式p34至p40中的任一项所述的raav,其中所述pccb的部分或完整编码序列是野生型编码序列。
实施方式p42:根据实施方式p41所述的raav,其中所述pccb的编码序列包含seqidno:7。
实施方式p43:根据实施方式p34至p40中的任一项所述的raav,其中所述pccb的部分或完整编码序列是密码子优化的编码序列。
实施方式p44:根据实施方式p43所述的raav,其中所述pccb的编码序列包含选自seqidnos:8-12的编码序列。
实施方式p45:根据实施方式p34至p44中的任一项所述的raav,其中所述5’itr序列来自于aav2。
实施方式p46:根据实施方式p34至p44中的任一项所述的raav,其中所述3’itr序列来自于aav2。
实施方式p47:根据实施方式p34至p44中的任一项所述的raav,其中所述5’itr序列和3’itr序列来自于aav2。
实施方式p48:根据实施方式p45至p47中的任一项所述的raav,其中所述5’itr序列和3’itr序列包含seqidno:15或由其构成。
实施方式p49:根据实施方式p34至p44中的任一项所述的raav,其中所述5’itr序列和/或3’itr序列来自于非aav2来源。
实施方式p50:根据实施方式p34至p49中的任一项所述的raav,其中所述包装的基因组还包含一个或多个增强子序列。
实施方式p51:根据实施方式p50所述的raav,其中所述增强子选自巨细胞病毒立即早期基因(cmv)增强子、甲状腺素运载蛋白增强子(enttr)、鸡β-肌动蛋白(cba)增强子、en34增强子和apoe增强子。
实施方式p52:根据实施方式p51所述的raav,其中所述增强子是cmv增强子。
实施方式p53:根据实施方式p52所述的raav,其中所述增强子包含seqidno:19或由其构成。
实施方式p54:根据实施方式p51至p53中的任一项所述的raav,其中所述增强子位于所述启动子序列上游。
实施方式p55:根据实施方式p34至p54中的任一项所述的raav,其中所述包装的基因组还包含一个或多个内含子序列。
实施方式p56:根据实施方式p55所述的raav,其中所述内含子选自sv40小t内含子、兔血红蛋白亚基β(rhbb)内含子、人类β珠蛋白ivs2内含子、promega嵌合内含子或hfix内含子。
实施方式p57:根据实施方式p56所述的raav,其中所述内含子是sv40小t内含子。
实施方式p58:根据实施方式p57所述的raav,其中所述内含子包含seqidno:20或由其构成。
实施方式p59:根据实施方式p56所述的raav,其中所述内含子是rhbb内含子。
实施方式p60:根据实施方式p59所述的raav,其中所述内含子包含seqidno:21或由其构成。
实施方式p61:根据实施方式p34至p60中的任一项所述的raav,其中所述包装的基因组还包含多聚腺苷酸化信号序列。
实施方式p62:根据实施方式p61所述的raav,其中所述多聚腺苷酸化信号序列选自牛生长激素(bgh)多聚腺苷酸化信号序列、sv40多聚腺苷酸化信号序列和兔β珠蛋白多聚腺苷酸化信号序列。
实施方式p63:根据实施方式p62所述的raav,其中所述多聚腺苷酸化信号序列是牛生长激素(bgh)多聚腺苷酸化信号序列。
实施方式p64:根据实施方式p63所述的raav,其中所述多聚腺苷酸化信号序列包含seqidno:22或由其构成。
实施方式p65:根据实施方式p62所述的raav,其中所述多聚腺苷酸化信号序列是sv40多聚腺苷酸化信号序列。
实施方式p66:根据实施方式p65所述的raav,其中所述多聚腺苷酸化信号序列包含seqidno:23或由其构成。
实施方式p67:一种重组腺相关病毒(raav),所述raav包含aav衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:
(a)5’itr序列;
(b)增强子序列;
(c)启动子序列;
(d)内含子序列;
(e)pcca的部分或完整编码序列;
(f)多聚腺苷酸化信号序列;和
(g)3’itr序列。
实施方式p68:一种重组腺相关病毒(raav),所述raav包含aav衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:
(a)5’itr序列;
(b)增强子序列;
(c)启动子序列;
(d)内含子序列;
(e)pccb的部分或完整编码序列;
(f)多聚腺苷酸化信号序列;和
(g)3’itr序列。
实施方式p69:根据实施方式p67或实施方式p68所述的raav,其中所述aav衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的aav。
实施方式p70:根据实施方式p69所述的raav,其中所述aav衣壳来自于aav9。
实施方式p71:根据实施方式p69所述的raav,其中所述aav衣壳来自于aav8。
实施方式p72:根据实施方式p67或实施方式p68所述的raav,其中所述aav衣壳是aav9变体衣壳。
实施方式p73:根据实施方式p67至p72中的任一项所述的raav,其中所述启动子选自鸡β-肌动蛋白(cba)启动子、巨细胞病毒立即早期基因(cmv)启动子、甲状腺素运载蛋白(ttr)启动子、甲状腺素结合球蛋白(tbg)启动子、α-1抗胰蛋白酶因子(a1at)启动子和cag启动子。
实施方式p74:根据实施方式p73所述的raav,其中所述启动子是cba启动子。
实施方式p75:根据实施方式p67所述的raav,其中所述pcca的部分或完整编码序列是野生型编码序列。
实施方式p76:根据实施方式p75所述的raav,其中所述pcca的编码序列包含seqidno:1。
实施方式p77:根据实施方式p67所述的raav,其中所述pcca的部分或完整编码序列是密码子优化的编码序列。
实施方式p78:根据实施方式p77所述的raav,其中所述pcca的编码序列包含选自seqidnos:2-6的编码序列。
实施方式p79:根据实施方式p68所述的raav,其中所述pccb的部分或完整编码序列是野生型编码序列。
实施方式p80:根据实施方式p79所述的raav,其中所述pccb的编码序列包含seqidno:7。
实施方式p81:根据实施方式p68所述的raav,其中所述pccb的部分或完整编码序列是密码子优化的编码序列。
实施方式p82:根据实施方式p81所述的raav,其中所述pccb的编码序列包含选自seqidnos:8-12的编码序列。
实施方式p83:根据实施方式p67至p82中的任一项所述的raav,其中所述增强子选自巨细胞病毒立即早期基因(cmv)增强子、甲状腺素运载蛋白增强子(enttr)、鸡β-肌动蛋白(cba)增强子、en34增强子和apoe增强子。
实施方式p84:根据所述实施方式p83的raav,其中所述增强子是cmv增强子。
实施方式p85:根据实施方式p67至p84中的任一项所述的raav,其中所述内含子选自sv40小t内含子、兔血红蛋白亚基β(rhbb)内含子、人类β珠蛋白ivs2内含子、promega嵌合内含子或hfix内含子。
实施方式p86:根据实施方式p85所述的raav,其中所述内含子是sv40小t内含子。
实施方式p87:根据实施方式p85所述的raav,其中所述内含子是rhbb内含子。
实施方式p88:根据实施方式p67至p87中的任一项所述的raav,其中所述多聚腺苷酸化信号序列选自牛生长激素(bgh)多聚腺苷酸化信号序列、sv40多聚腺苷酸化信号序列和兔β珠蛋白多聚腺苷酸化信号序列。
实施方式p89:根据实施方式p88所述的raav,其中所述多聚腺苷酸化信号序列是牛生长激素(bgh)多聚腺苷酸化信号序列。
实施方式p90:根据实施方式p88所述的raav,其中所述多聚腺苷酸化信号序列是sv40多聚腺苷酸化信号序列。
实施方式p91:一种可用于治疗丙酸血症(pa)的重组腺相关病毒(raav),所述raav包含aav衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:
(a)5’itr序列;
(b)增强子序列;
(c)启动子序列;
(d)内含子序列;
(e)选自seqidnos:1-6的pcca的编码序列;
(f)多聚腺苷酸化信号序列;和
(g)3’itr序列。
实施方式p92:一种可用于治疗丙酸血症(pa)的重组腺相关病毒(raav),所述raav包含aav衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:
(a)5’itr序列;
(b)增强子序列;
(c)启动子序列;
(d)内含子序列;
(e)选自seqidnos:7-12的pccb的编码序列;
(f)多聚腺苷酸化信号序列;和
(g)3’itr序列。
实施方式p93:根据实施方式p91或p92所述的raav,其中所述aav衣壳来自于aav9。
实施方式p94:一种可用于治疗丙酸血症(pa)的重组腺相关病毒(raav),所述raav包含aav9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:
(a)5’itr序列;
(b)增强子序列;
(c)启动子序列;
(d)内含子序列;
(e)选自seqidnos:1-6的pcca的编码序列;
(f)多聚腺苷酸化信号序列;和
(g)3’itr序列。
实施方式p95:一种可用于治疗丙酸血症(pa)的重组腺相关病毒(raav),所述raav包含aav9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:
(a)5’itr序列;
(b)增强子序列;
(c)启动子序列;
(d)内含子序列;
(e)选自seqidnos:7-12的pccb的编码序列;
(f)多聚腺苷酸化信号序列;和
(g)3’itr序列。
实施方式p96:一种可用于治疗丙酸血症(pa)的重组腺相关病毒(raav),所述raav包含aav9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:
(a)aav25’itr序列;
(b)cmv增强子序列;
(c)cba启动子序列;
(d)rhbb或sv40小t内含子序列;
(e)选自seqidnos:1-6的pcca的编码序列;
(f)bgh或sv40多聚腺苷酸化信号序列;和
(g)aav23’itr序列。
实施方式p97:一种可用于治疗丙酸血症(pa)的重组腺相关病毒(raav),所述raav包含aav9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:
(a)aav25’itr序列;
(b)cmv增强子序列;
(c)cba启动子序列;
(d)rhbb或sv40小t内含子序列;
(e)选自seqidnos:7-12的pccb的编码序列;
(f)bgh或sv40多聚腺苷酸化信号序列;和
(g)aav23’itr序列。
实施方式p98:根据实施方式p67至p97中的任一项所述的raav,其中所述载体基因组包含位于载体基因组元件(d)与(e)之间的共有kozak序列。
实施方式p99:根据实施方式p98所述的raav,其中所述共有kozak序列包含seqidno:24。
实施方式p100:一种组合物,其包含前述实施方式中的任一项所述的raav和可药用载体。
实施方式p101:一种在人类受试者中治疗丙酸血症(pa)的方法,所述方法包括向所述人类受试者施用治疗有效量的实施方式p1至p99中的任一项所述的raav或实施方式p100所述的组合物。
实施方式p102:一种在人类受试者中治疗丙酸血症(pa)的方法,所述方法包括向所述人类受试者施用
(1)治疗有效量的包含实施方式p1至p33中的任一项所述的raav的组合物;和
(2)治疗有效量的包含实施方式p34至p66中的任一项所述的raav的组合物。
实施方式p103:实施方式p102所述的方法,其中所述(1)和(2)的组合物被同时施用。
实施方式p104:实施方式p102所述的方法,其中所述(1)和(2)的组合物被顺序施用。
实施方式p105:实施方式p102所述的方法,其中所述(1)和(2)的组合物被分开施用。
实施方式p106:一种在被诊断为在pcca中具有至少一个突变的人类受试者中治疗丙酸血症(pa)的方法,所述方法包括向所述人类受试者施用治疗有效量的包含实施方式p1至p33中的任一项所述的raav的组合物。
实施方式p107:实施方式p106所述的方法,其中所述pcca中的突变选自表1。
实施方式p108:一种在被诊断为在pccb中具有至少一个突变的人类受试者中治疗丙酸血症(pa)的方法,所述方法包括向所述人类受试者施用治疗有效量的包含实施方式p34至p66中的任一项所述的raav的组合物。
实施方式p109:实施方式p108所述的方法,其中所述pccb中的突变选自表2。
实施方式p110:实施方式p101至p109中的任一项所述的方法,其中所述重组病毒、raav或组合物被皮下、肌肉内、真皮内、腹膜内或静脉内施用。
实施方式p111:实施方式p110所述的方法,其中所述raav或组合物被静脉内施用。
实施方式p112:实施方式p101至p111中的任一项所述的方法,其中所述raav以约1x1011至约1x1014基因组拷贝(gc)/kg的剂量施用。
实施方式p113:实施方式p112所述的方法,其中所述raav以约1x1012至约1x1013基因组拷贝(gc)/kg的剂量施用。
实施方式p114:根据实施方式p110至p113中的任一项所述的方法,其中施用所述raav包括单剂raav的施用。
实施方式p115:根据实施方式p110至p113中的任一项所述的方法,其中施用所述raav包括多剂raav的施用。
实施方式p116:一种重组核酸,其编码seqidno:16的pcca多肽,其中所述核酸序列与seqidno:1的野生型编码序列的同一性少于80%。
实施方式p117:实施方式p116所述的重组核酸,其中所述核酸序列包含与选自seqidnos:2-6的序列具有至少80%同一性的序列。
实施方式p118:实施方式p117所述的重组核酸,其中所述核酸序列包含选自seqidnos:2-6的序列。
实施方式p119:实施方式p116至p118中的任一项所述的重组核酸,其中所述核酸序列还在3’末端处包含选自tga、taa和tag的一个或多个终止密码子。
实施方式p120:一种重组核酸,其编码seqidno:17的pccb多肽,其中所述核酸序列与seqidno:7的野生型编码序列的同一性少于80%。
实施方式p121:实施方式p120所述的重组核酸,其中所述核酸序列包含与选自seqidnos:8-12的序列具有至少80%同一性的序列。
实施方式p122:实施方式p121所述的重组核酸,其中所述核酸序列包含选自seqidnos:8-12的序列。
实施方式p123:实施方式p120至p122中的任一项所述的重组核酸,其中所述核酸序列还在3’末端处包含选自tga、taa和tag的一个或多个终止密码子。
实施方式p124:一种重组核酸,其包含与选自seqidnos:2-6的序列至少80%同一性的序列。
实施方式p125:所实施方式p124述的重组核酸,其中所述重组核酸包含与选自seqidnos:2-6的序列至少90%同一性的序列。
实施方式p126:实施方式p125所述的重组核酸,其中所述重组核酸包含与选自seqidnos:2-6的序列至少95%同一性的序列。
实施方式p127:一种重组核酸,其包含选自seqidnos:2-6的序列。
实施方式p128:实施方式p124至p127中的任一项所述的重组核酸,其中所述核酸序列还在3’末端处包含选自tga、taa和tag的一个或多个终止密码子。
实施方式p129:一种重组核酸,其包含与选自seqidnos:7-12的序列至少80%同一性的序列。
实施方式p130:实施方式p129所述的重组核酸,其中所述重组核酸包含与选自seqidnos:7-12的序列至少90%同一性的序列。
实施方式p131:实施方式p130所述的重组核酸,其中所述重组核酸包含与选自seqidnos:7-12的序列至少95%同一性的序列。
实施方式p132:一种重组核酸,其包含选自seqidnos:7-12的序列。
实施方式p133:实施方式p129至p132中的任一项所述的重组核酸,其中所述核酸序列还在3’末端处包含选自tga、taa和tag的一个或多个终止密码子。
实施方式p134:一种raav,其包含根据实施方式p116至p133中的任一项所述的重组核酸。
实施方式p135:一种宿主细胞,其包含根据实施方式p116至p133中的任一项所述的重组核酸或实施方式p134的raav。
实施方式p136:所实施方式p135述的宿主细胞,其中所述宿主细胞选自hela、cos-7、hek293、a549、bhk、vero、rd、ht-1080、arpe-19或mrc-5细胞。
通过参考并入
本文中提到的每个专利文献和科学论文的整个公开内容为所有目的通过参考并入本文。
等同性
在不背离本发明的精神或本质特征的情况下,本发明可以以其他特定形式来体现。因此,前述实施方式应该在所有情况下被认为是说明性的,而不是限制本文描述的发明。不同实施方式的各种不同结构要素和公开的各种不同方法步骤可以以各种不同的组合和排列使用,并且所有这样的变化形式应该被认为是本公开的形式。因此,本根据的范围由随附的权利要求书而不是上面的描述指明,并且打算将进入权利要求书的意义和等同性范围之内的所有变化涵盖在其中。
序列表
<110>奥特吉尼克斯制药公司
<120>用于治疗丙酸血症的基因疗法
<130>aj4309pt2103
<150>62/739,471
<151>2018-10-01
<160>39
<170>patentinversion3.5
<210>1
<211>2184
<212>dna
<213>智人(homosapiens)
<400>1
atggcggggttctgggtcgggacagcaccgctggtcgctgccggacggcgtgggcggtgg60
ccgccgcagcagctgatgctgagcgcggcgctgcggaccctgaagcatgttctgtactat120
tcaagacagtgcttaatggtgtcccgtaatcttggttcagtgggatatgatcctaatgaa180
aaaacttttgataaaattcttgttgctaatagaggagaaattgcatgtcgggttattaga240
acttgcaagaagatgggcattaagacagttgccatccacagtgatgttgatgctagttct300
gttcatgtgaaaatggcggatgaggctgtctgtgttggcccagctcccaccagtaaaagc360
tacctcaacatggatgccatcatggaagccattaagaaaaccagggcccaagctgtacat420
ccaggttatggattcctttcagaaaacaaagaatttgccagatgtttggcagcagaagat480
gtcgttttcattggacctgacacacatgctattcaagccatgggcgacaagattgaaagc540
aaattattagctaagaaagcagaggttaatacaatccctggctttgatggagtagtcaag600
gatgcagaagaagctgtcagaattgcaagggaaattggctaccctgtcatgatcaaggcc660
tcagcaggtggtggtgggaaaggcatgcgcattgcttgggatgatgaagagaccagggat720
ggttttagattgtcatctcaagaagctgcttctagttttggcgatgatagactactaata780
gaaaaatttattgataatcctcgtcatatagaaatccaggttctaggtgataaacatggg840
aatgctttatggcttaatgaaagagagtgctcaattcagagaagaaatcagaaggtggtg900
gaggaagcaccaagcatttttttggatgcggagactcgaagagcgatgggagaacaagct960
gtagctcttgccagagcagtaaaatattcctctgctgggaccgtggagttccttgtggac1020
tctaagaagaatttttatttcttggaaatgaatacaagactccaggttgagcatcctgtc1080
acagaatgcattactggcctggacctagtccaggaaatgatccgtgttgctaagggctac1140
cctctcaggcacaaacaagctgatattcgcatcaacggctgggcagttgaatgtcgggtt1200
tatgctgaggacccctacaagtcttttggtttaccatctattgggagattgtctcagtac1260
caagaaccgttacatctacctggtgtccgagtggacagtggcatccaaccaggaagtgat1320
attagcatttattatgatcctatgatttcaaaactaatcacatatggctctgatagaact1380
gaggcactgaagagaatggcagatgcactggataactatgttattcgaggtgttacacat1440
aatattgcattacttcgagaggtgataatcaactcacgctttgtaaaaggagacatcagc1500
actaaatttctctccgatgtgtatcctgatggcttcaaaggacacatgctaaccaagagt1560
gagaagaaccagttattggcaatagcatcatcattgtttgtggcattccagttaagagca1620
caacattttcaagaaaattcaagaatgcctgttattaaaccagacatagccaactgggag1680
ctctcagtaaaattgcatgataaagttcataccgtagtagcatcaaacaatgggtcagtg1740
ttctcggtggaagttgatgggtcgaaactaaatgtgaccagcacgtggaacctggcttcg1800
cccttattgtctgtcagcgttgatggcactcagaggactgtccagtgtctttctcgagaa1860
gcaggtggaaacatgagcattcagtttcttggtacagtgtacaaggtgaatatcttaacc1920
agacttgccgcagaattgaacaaatttatgctggaaaaagtgactgaggacacaagcagt1980
gttctgcgttccccgatgcccggagtggtggtggccgtctctgtcaagcctggagacgcg2040
gtagcagaaggtcaagaaatttgtgtgattgaagccatgaaaatgcagaatagtatgaca2100
gctgggaaaactggcacggtgaaatctgtgcactgtcaagctggagacacagttggagaa2160
ggggatctgctcgtggagctggaa2184
<210>2
<211>2184
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:pcca编码序列-
密码子优化的
<400>2
atggctggattttgggtcggaacggcccctctcgtggccgccggccgccggggtcggtgg60
ccgccgcaacagctgatgttgtcggccgcgctgcgcacccttaagcatgtgctgtactac120
tcccggcaatgccttatggtgtccagaaacctgggtagcgtgggctatgacccgaacgag180
aaaaccttcgacaagattctggtggccaaccggggggaaattgcctgccgggtcatcagg240
acttgcaagaagatgggcatcaagaccgtcgccattcactccgacgtggacgcctcctcc300
gtgcacgtgaagatggcagatgaagccgtctgcgtgggccccgccccgacctccaagtcc360
taccttaacatggacgcgatcatggaagccatcaaaaagaccagagcccaggcagtgcac420
ccgggatacggctttctctccgaaaacaaggagttcgcgcggtgcctggccgctgaagat480
gtcgtgttcatcggccctgatacccacgcgatccaggctatgggagacaagatcgaatcc540
aagctgctcgccaagaaagccgaagtcaacaccatacctgggtttgacggcgtggtcaag600
gacgcagaagaagccgtcaggattgcccgcgagatcggataccccgtgatgatcaaggca660
tccgccggggggggaggaaagggaatgcgcatcgcctgggatgacgaagaaacccgggac720
ggcttcagactctcgtcacaagaggccgcgtcctcattcggggatgaccggctcctgatt780
gagaagttcattgacaatcctcggcacatcgagattcaggtcctgggcgataagcatgga840
aacgccctgtggctgaacgaacgcgaatgcagcatccagaggcggaaccagaaagtggtg900
gaagaggccccatccatctttctcgacgccgagactcggagagcgatgggtgaacaggcc960
gtggccctggcccgagccgtgaagtactccagcgcggggactgtcgagttcctggtggac1020
agcaagaagaatttctacttcctggagatgaatactcggctccaagtggaacaccccgtg1080
accgaatgcattaccggtctggacctcgtccaagaaatgatccgcgtcgccaagggctac1140
ccattgagacacaaacaggccgacattcggatcaacggatgggccgtcgagtgtcgcgtg1200
tacgcggaagatccgtataagtcgttcggactgccgtccattggtagactctcgcagtac1260
caagagccactgcacctccccggagtgcgcgtggactcaggcatccagcccggaagcgac1320
atctctatctactacgaccccatgatttccaagttgatcacctacgggtccgataggacc1380
gaggcactgaagcgcatggctgacgcacttgacaactacgtgatccgcggggtcactcac1440
aacattgccctgctccgcgaagtgatcatcaactcgcgcttcgtgaagggcgacatctcc1500
actaagttcctgtccgacgtgtaccctgacggtttcaagggccatatgctgaccaagtcc1560
gagaagaaccagctcctggctatcgcctcctccctgtttgtggcgttccagctgagggcg1620
cagcacttccaggagaacagccggatgcccgtgatcaagcctgacatcgccaattgggag1680
ctgtccgtgaagctgcacgataaggtccataccgtggtggcatccaacaacggatcggtg1740
ttcagcgtggaagtggacgggtccaagctgaacgtgaccagcacatggaacctggcgtcc1800
cccctgttgtctgtgtcggtcgatggcacgcagcgcactgtgcagtgcctctcccgggaa1860
gctggcggaaacatgagcatccagttcctgggtactgtgtacaaggtcaacattctgact1920
cggctggccgccgagctgaacaagttcatgttggaaaaagtcaccgaagatacatcgtca1980
gtcctgcggagcccaatgcctggagtcgtggtggcggtgtcagtgaagcccggcgatgct2040
gtggccgaaggccaagagatctgcgtgatcgaggccatgaagatgcagaactcgatgacc2100
gccggaaagaccggtaccgtgaagtccgtgcattgtcaagcgggcgacactgtgggagag2160
ggagatctgctcgtggagctggag2184
<210>3
<211>2184
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:pcca编码序列-
密码子优化的
<400>3
atggccggcttctgggtcggcaccgcccctctggtcgcggccggacgacgcggacgctgg60
ccaccccagcaactgatgctgagcgcggccttgaggactctgaagcacgtgctctactac120
tcgcggcagtgcctgatggtgtcccggaatctggggtccgtgggatacgaccctaacgaa180
aagaccttcgataagatcctcgtggcaaatcggggagagatcgcgtgtcgcgtgatccgc240
acgtgcaagaagatggggatcaagactgtggcaatccatagcgatgtggatgcatcctcg300
gtccacgtgaagatggccgacgaagctgtgtgcgtgggaccggcgccgacttcgaaatcg360
tacctgaacatggacgctattatggaggcgatcaagaaaacgcgcgcccaagcggtccat420
cccggttacggattcctgagcgagaacaaggaatttgcacggtgcctcgctgccgaggac480
gtggtgtttatcggtcccgacacccacgccatccaagctatgggggacaagattgagtcc540
aagctcctggcgaaaaaggcagaggtcaacacaattcctggtttcgacggcgtcgtgaag600
gacgccgaagaagccgtgcgcatcgcgagggaaatcggttaccctgtgatgattaaggcc660
tccgccggcggcggtggaaagggaatgagaattgcctgggacgatgaagaaacccgcgac720
ggattccgcctgtcgagccaggaagccgcctcttccttcggcgatgacagactgctgatc780
gaaaagttcatcgataaccccagacacattgagatccaagtgctcggggataagcacggc840
aacgccctttggctgaacgagagagagtgctccattcaacgccgcaatcagaaggtcgtg900
gaggaagccccgtcgatattcctggatgccgaaacccggcgggccatgggagagcaggct960
gtcgcgttggcgcgggccgtcaagtacagctcggccgggaccgtggaatttctggtcgat1020
tccaagaagaacttctatttcctggagatgaacaccagactccaggtcgagcacccggtc1080
actgagtgtatcaccgggctcgatctggtgcaagagatgattcgggtggcgaagggatat1140
ccccttcggcataaacaagccgacatcaggatcaacggttgggccgtggaatgcagggtc1200
tacgccgaggacccctacaagagcttcggcctgcccagcatcggccgcctgtcacagtat1260
caggaaccgctgcatcttccgggcgtgcgggtcgacagcggaattcagcctggctcagat1320
atctccatctactacgatccaatgatctcaaagctgattacttatggatccgaccggacc1380
gaagcccttaagcgaatggccgacgccctggacaactacgtgatccggggagtgacccac1440
aacatcgccttgctgcgggaagtgatcattaacagcagattcgtgaagggagacatcagc1500
accaagttcctgtcggatgtctacccggacgggttcaaagggcacatgcttactaagtcc1560
gagaagaatcagctgctcgccattgcgtcaagcttgttcgtggcctttcaactccgggcc1620
cagcacttccaggaaaactcccgcatgccagtcattaagccggacatcgccaactgggaa1680
ctcagcgtgaagctccatgacaaagtgcataccgtggtggccagcaacaacggtagcgtg1740
ttctcagtcgaggtcgatggctcgaagctcaacgtcacttccacttggaacttggccagc1800
ccgctgctgtccgtgtccgtggacggaacccagaggaccgtgcagtgtctgtcgagagaa1860
gccggcggcaacatgtcaatccagttcctgggaaccgtgtacaaggtcaacatcctgacc1920
agactggccgccgaactgaacaagtttatgctcgagaaagtgaccgaggacactagctcc1980
gtgctgcgctcccctatgcccggagtggtcgtggcagtgtccgtgaagccgggcgacgcc2040
gtggccgagggacaggaaatctgtgtgatcgaagcgatgaagatgcagaattcaatgacc2100
gcgggaaagactgggaccgtgaagtctgtgcactgccaggctggcgataccgtgggggag2160
ggcgaccttctggtggaactcgag2184
<210>4
<211>2184
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:pcca编码序列-
密码子优化的
<400>4
atggctgggttttgggtggggacagctcctctggtggctgctgggaggagggggaggtgg60
cctcctcagcagctgatgctgtctgctgctctgaggacactgaagcatgtgctgtattat120
tctaggcagtgtctgatggtgtctaggaatctggggtctgtggggtatgatcctaatgag180
aagacatttgataagattctggtggctaataggggggagattgcttgtagggtgattagg240
acatgtaagaagatggggattaagacagtggctattcattctgatgtggatgcttcttct300
gtgcatgtgaagatggctgatgaggctgtgtgtgtggggcctgctcctacatctaagtct360
tatctgaatatggatgctattatggaggctattaagaagacaagggctcaggctgtgcat420
cctgggtatgggtttctgtctgagaataaggagtttgctaggtgtctggctgctgaggat480
gtggtgtttattgggcctgatacacatgctattcaggctatgggggataagattgagtct540
aagctgctggctaagaaggctgaggtgaatacaattcctgggtttgatggggtggtgaag600
gatgctgaggaggctgtgaggattgctagggagattgggtatcctgtgatgattaaggct660
tctgctggggggggggggaaggggatgaggattgcttgggatgatgaggagacaagggat720
gggtttaggctgtcttctcaggaggctgcttcttcttttggggatgataggctgctgatt780
gagaagtttattgataatcctaggcatattgagattcaggtgctgggggataagcatggg840
aatgctctgtggctgaatgagagggagtgttctattcagaggaggaatcagaaggtggtg900
gaggaggctccttctatttttctggatgctgagacaaggagggctatgggggagcaggct960
gtggctctggctagggctgtgaagtattcttctgctgggacagtggagtttctggtggat1020
tctaagaagaatttttattttctggagatgaatacaaggctgcaggtggagcatcctgtg1080
acagagtgtattacagggctggatctggtgcaggagatgattagggtggctaaggggtat1140
cctctgaggcataagcaggctgatattaggattaatgggtgggctgtggagtgtagggtg1200
tatgctgaggatccttataagtcttttgggctgccttctattgggaggctgtctcagtat1260
caggagcctctgcatctgcctggggtgagggtggattctgggattcagcctgggtctgat1320
atttctatttattatgatcctatgatttctaagctgattacatatgggtctgataggaca1380
gaggctctgaagaggatggctgatgctctggataattatgtgattaggggggtgacacat1440
aatattgctctgctgagggaggtgattattaattctaggtttgtgaagggggatatttct1500
acaaagtttctgtctgatgtgtatcctgatgggtttaaggggcatatgctgacaaagtct1560
gagaagaatcagctgctggctattgcttcttctctgtttgtggcttttcagctgagggct1620
cagcattttcaggagaattctaggatgcctgtgattaagcctgatattgctaattgggag1680
ctgtctgtgaagctgcatgataaggtgcatacagtggtggcttctaataatgggtctgtg1740
ttttctgtggaggtggatgggtctaagctgaatgtgacatctacatggaatctggcttct1800
cctctgctgtctgtgtctgtggatgggacacagaggacagtgcagtgtctgtctagggag1860
gctggggggaatatgtctattcagtttctggggacagtgtataaggtgaatattctgaca1920
aggctggctgctgagctgaataagtttatgctggagaaggtgacagaggatacatcttct1980
gtgctgaggtctcctatgcctggggtggtggtggctgtgtctgtgaagcctggggatgct2040
gtggctgaggggcaggagatttgtgtgattgaggctatgaagatgcagaattctatgaca2100
gctgggaagacagggacagtgaagtctgtgcattgtcaggctggggatacagtgggggag2160
ggggatctgctggtggagctggag2184
<210>5
<211>2184
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:pcca编码序列-
密码子优化的
<400>5
atggcagggttttgggtggggacagcaccactggtggcagcagggaggagggggaggtgg60
ccaccacagcagctgatgctgtcagcagcactgaggacactgaagcatgtgctgtattat120
tcaaggcagtgtctgatggtgtcaaggaatctggggtcagtggggtatgatccaaatgag180
aagacatttgataagattctggtggcaaataggggggagattgcatgtagggtgattagg240
acatgtaagaagatggggattaagacagtggcaattcattcagatgtggatgcatcatca300
gtgcatgtgaagatggcagatgaggcagtgtgtgtggggccagcaccaacatcaaagtca360
tatctgaatatggatgcaattatggaggcaattaagaagacaagggcacaggcagtgcat420
ccagggtatgggtttctgtcagagaataaggagtttgcaaggtgtctggcagcagaggat480
gtggtgtttattgggccagatacacatgcaattcaggcaatgggggataagattgagtca540
aagctgctggcaaagaaggcagaggtgaatacaattccagggtttgatggggtggtgaag600
gatgcagaggaggcagtgaggattgcaagggagattgggtatccagtgatgattaaggca660
tcagcaggggggggggggaaggggatgaggattgcatgggatgatgaggagacaagggat720
gggtttaggctgtcatcacaggaggcagcatcatcatttggggatgataggctgctgatt780
gagaagtttattgataatccaaggcatattgagattcaggtgctgggggataagcatggg840
aatgcactgtggctgaatgagagggagtgttcaattcagaggaggaatcagaaggtggtg900
gaggaggcaccatcaatttttctggatgcagagacaaggagggcaatgggggagcaggca960
gtggcactggcaagggcagtgaagtattcatcagcagggacagtggagtttctggtggat1020
tcaaagaagaatttttattttctggagatgaatacaaggctgcaggtggagcatccagtg1080
acagagtgtattacagggctggatctggtgcaggagatgattagggtggcaaaggggtat1140
ccactgaggcataagcaggcagatattaggattaatgggtgggcagtggagtgtagggtg1200
tatgcagaggatccatataagtcatttgggctgccatcaattgggaggctgtcacagtat1260
caggagccactgcatctgccaggggtgagggtggattcagggattcagccagggtcagat1320
atttcaatttattatgatccaatgatttcaaagctgattacatatgggtcagataggaca1380
gaggcactgaagaggatggcagatgcactggataattatgtgattaggggggtgacacat1440
aatattgcactgctgagggaggtgattattaattcaaggtttgtgaagggggatatttca1500
acaaagtttctgtcagatgtgtatccagatgggtttaaggggcatatgctgacaaagtca1560
gagaagaatcagctgctggcaattgcatcatcactgtttgtggcatttcagctgagggca1620
cagcattttcaggagaattcaaggatgccagtgattaagccagatattgcaaattgggag1680
ctgtcagtgaagctgcatgataaggtgcatacagtggtggcatcaaataatgggtcagtg1740
ttttcagtggaggtggatgggtcaaagctgaatgtgacatcaacatggaatctggcatca1800
ccactgctgtcagtgtcagtggatgggacacagaggacagtgcagtgtctgtcaagggag1860
gcaggggggaatatgtcaattcagtttctggggacagtgtataaggtgaatattctgaca1920
aggctggcagcagagctgaataagtttatgctggagaaggtgacagaggatacatcatca1980
gtgctgaggtcaccaatgccaggggtggtggtggcagtgtcagtgaagccaggggatgca2040
gtggcagaggggcaggagatttgtgtgattgaggcaatgaagatgcagaattcaatgaca2100
gcagggaagacagggacagtgaagtcagtgcattgtcaggcaggggatacagtgggggag2160
ggggatctgctggtggagctggag2184
<210>6
<211>2184
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:pcca编码序列-
密码子优化的
<400>6
atggctggtttttgggtaggtacagcaccactagtagcagcaggtaggaggggtaggtgg60
ccaccacaacaactaatgctatcagcagcactaaggacactaaagcatgtactatattat120
tcaaggcaatgtctaatggtatcaaggaatctggggtctgtggggtatgatcctaatgag180
aagacatttgataagattctggtggctaataggggggagattgcttgtagggtgattagg240
acatgtaagaagatggggattaagacagtggctattcattctgatgtggatgcttcttct300
gtgcatgtgaagatggctgatgaggctgtgtgtgtggggcctgctcctacatctaagtct360
tatctgaatatggatgctattatggaggctattaagaagacaagggctcaggctgtgcat420
cctgggtatgggtttctgtctgagaataaggagtttgctaggtgtctggctgctgaggat480
gtggtgtttattgggcctgatacacatgctattcaggctatgggggataagattgagtct540
aagctgctggctaagaaggctgaggtgaatacaattcctgggtttgatggggtggtgaag600
gatgctgaggaggctgtgaggattgctagggagattgggtatcctgtgatgattaaggct660
tctgctggggggggggggaaggggatgaggattgcttgggatgatgaggagacaagggat720
gggtttaggctgtcttctcaggaggctgcttcttcttttggggatgataggctgctgatt780
gagaagtttattgataatcctaggcatattgagattcaggtgctgggggataagcatggg840
aatgctctgtggctgaatgagagggagtgttctattcagaggaggaatcagaaggtggtg900
gaggaggctccttctatttttctggatgctgagacaaggagggctatgggggagcaggct960
gtggctctggctagggctgtgaagtattcttctgctgggacagtggagtttctggtggat1020
tctaagaagaatttttattttctggagatgaatacaaggctgcaggtggagcatcctgtg1080
acagagtgtattacagggctggatctggtgcaggagatgattagggtggctaaggggtat1140
cctctgaggcataagcaggctgatattaggattaatgggtgggctgtggagtgtagggtg1200
tatgctgaggatccttataagtcttttgggctgccttctattgggaggctgtctcagtat1260
caggagcctctgcatctgcctggggtgagggtggattctgggattcagcctgggtctgat1320
atttctatttattatgatcctatgatttctaagctgattacatatgggtctgataggaca1380
gaggctctgaagaggatggctgatgctctggataattatgtgattaggggggtgacacat1440
aatattgctctgctgagggaggtgattattaattctaggtttgtgaagggggatatttct1500
acaaagtttctgtctgatgtgtatcctgatgggtttaaggggcatatgctgacaaagtct1560
gagaagaatcagctgctggctattgcttcttctctgtttgtggcttttcagctgagggct1620
cagcattttcaggagaattctaggatgcctgtgattaagcctgatattgctaattgggag1680
ctgtctgtgaagctgcatgataaggtgcatacagtggtggcttctaataatgggtctgtg1740
ttttctgtggaggtggatgggtctaagctgaatgtgacatctacatggaatctggcttct1800
cctctgctgtctgtgtctgtggatgggacacagaggacagtgcagtgtctgtctagggag1860
gctggggggaatatgtctattcagtttctggggacagtgtataaggtgaatattctgaca1920
aggctggctgctgagctgaataagtttatgctggagaaggtgacagaggatacatcttct1980
gtgctgaggtctcctatgcctggggtggtggtggctgtgtctgtgaagcctggggatgct2040
gtggctgaggggcaggagatttgtgtgattgaggctatgaagatgcagaattctatgaca2100
gctgggaagacagggacagtgaagtctgtgcattgtcaggctggggatacagtgggggag2160
ggggatctgctggtggagctggag2184
<210>7
<211>1617
<212>dna
<213>智人(homosapiens)
<400>7
atggcggcggcattacgggtggcggcggtcggggcaaggctcagcgttctggcgagcggt60
ctccgcgccgcggtccgcagcctttgcagccaggccacctctgttaacgaacgcatcgaa120
aacaagcgccggaccgcgctgctgggagggggccaacgccgtattgacgcgcagcacaag180
cgaggaaagctaacagccagggagaggatcagtctcttgctggaccctggcagctttgtt240
gagagcgacatgtttgtggaacacagatgtgcagattttggaatggctgctgataagaat300
aagtttcctggagacagcgtggtcactggacgaggccgaatcaatggaagattggtttat360
gtcttcagtcaggattttacagtttttggaggcagtctgtcaggagcacatgcccaaaag420
atctgcaaaatcatggaccaggccataacggtgggggctccagtgattgggctgaatgac480
tctgggggagcacggatccaagaaggagtggagtctttggctggctatgcagacatcttt540
ctgaggaatgttacggcatccggagtcatccctcagatttctctgatcatgggcccatgt600
gctggtggggccgtctactccccagccctaacagacttcacgttcatggtaaaggacacc660
tcctacctgttcatcactggccctgatgttgtgaagtctgtcaccaatgaggatgttacc720
caggaggagctcggtggtgccaagacccacaccaccatgtcaggtgtggcccacagagct780
tttgaaaatgatgttgatgccttgtgtaatctccgggatttcttcaactacctgcccctg840
agcagtcaggacccggctcccgtccgtgagtgccacgatcccagtgaccgtctggttcct900
gagcttgacacaattgtccctttggaatcaaccaaagcctacaacatggtggacatcata960
cactctgttgttgatgagcgtgaattttttgagatcatgcccaattatgccaagaacatc1020
attgttggttttgcaagaatgaatgggaggactgttggaattgttggcaaccaacctaag1080
gtggcctcaggatgcttggatattaattcatctgtgaaaggggctcgttttgtcagattc1140
tgtgatgcattcaatattccactcatcacttttgttgatgtccctggctttctacctggc1200
acagcacaggaatacgggggcatcatccggcatggtgccaagcttctctacgcatttgct1260
gaggcaactgtacccaaagtcacagtcatcaccaggaaggcctatggaggtgcctatgat1320
gtcatgagctctaagcacctttgtggtgataccaactatgcctggcccaccgcagagatt1380
gcagtcatgggagcaaagggcgctgtggagatcatcttcaaagggcatgagaatgtggaa1440
gctgctcaggcagagtacatcgagaagtttgccaaccctttccctgcagcagtgcgaggg1500
tttgtggatgacatcatccaaccttcttccacacgtgcccgaatctgctgtgacctggat1560
gtcttggccagcaagaaggtacaacgtccttggagaaaacatgcaaatattccattg1617
<210>8
<211>1617
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:pccb编码序列-
密码子优化的
<400>8
atggctgccgccctgcgcgtggcggccgtgggagcaagactgtccgtgctggcgtcgggc60
ttgagagcggccgtgcggagcctgtgctcacaagcaacctcggtgaacgaacgcatcgag120
aacaagcgcaggactgcgctgctgggcgggggccagcgcaggatcgacgcacagcataag180
cgcggaaagctgaccgcccgcgagcggatttccctgctcctggatcctggaagcttcgtg240
gagtccgacatgttcgtggagcaccgctgcgccgacttcgggatggctgccgacaagaac300
aagttccccggggactcagtggtcactggtcgcggaagaatcaatggccggctcgtctac360
gtgttctcacaagactttactgtgttcggcggctccctgtcgggagcccacgcgcaaaag420
atctgcaagattatggatcaggccatcactgtgggagcgcctgtgattggactcaacgac480
tccgggggagcaagaatccaggaaggagtggaaagccttgccggctacgctgacatcttc540
ctccggaacgtgaccgcctctggagtgattccgcaaatctccctgatcatgggaccatgt600
gccgggggcgccgtgtactccccggcgctgactgacttcactttcatggtcaaggacaca660
tcctacctgttcatcaccggtcccgacgtcgtgaagtccgtgaccaacgaggatgtgacc720
caggaagaactggggggggccaagacgcataccaccatgtcgggagtggcccaccgggcc780
ttcgagaacgatgtggacgccttgtgcaaccttcgggacttcttcaattatctcccgctg840
agcagccaggatccggccccagtgcgggaatgccacgacccttcggatcggttggtgcct900
gagctggataccatcgtgcccctcgaatccaccaaggcttacaacatggtcgacatcatt960
cactccgtggtggacgagagggaattcttcgagattatgccgaactacgccaagaacatc1020
attgtcggattcgcccgcatgaacggtcgaactgtgggcattgtcggaaaccagcctaaa1080
gtggcctccggttgcctggacatcaactcaagcgtgaagggtgccagatttgtgcggttt1140
tgtgacgcgttcaatattccgctgatcaccttcgtcgacgtcccgggcttcctgcctggg1200
accgcccaggaatacggcggcatcatcagacacggcgcgaagctcctctacgcgttcgcg1260
gaagccaccgtgcccaaggtcaccgtgatcactcgcaaggcatacggcggcgcatacgat1320
gtgatgtcctccaagcacctgtgtggcgacaccaactacgcctggcccaccgccgagatc1380
gccgtgatgggtgccaagggtgctgtcgagatcatcttcaagggacatgaaaacgtggaa1440
gctgcccaggccgagtacattgaaaagttcgctaaccccttccctgccgccgtgcgggga1500
tttgtggatgacattatccagccgagctcgaccagggccagaatctgctgcgatcttgat1560
gtgttggccagcaaaaaggtccagcggccctggcggaaacacgccaacattccactg1617
<210>9
<211>1617
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:pccb编码序列-
密码子优化的
<400>9
atggccgcggcgcttagagtggccgctgtgggagccaggctgagcgtgctggccagcggt60
ctgcgcgccgcagtgcgctcgctgtgtagccaggctacctccgtgaatgagcggatcgaa120
aacaagcggcgcaccgccctgttgggcggcggacagcggcgaattgacgcccaacacaag180
cggggaaagctcactgcgagggaaagaatctcactgctgctcgaccccgggtcgttcgtg240
gaatcggatatgtttgtcgaacatagatgcgcagatttcggaatggccgctgacaagaac300
aagttcccgggagattccgtcgtgaccggaagggggcgcattaacgggagacttgtgtac360
gtgttcagccaggatttcacggtgttcggcggatcactgagcggtgcacatgcacagaag420
atctgcaagatcatggaccaggccattaccgtcggggcacctgtgatcggcctgaatgat480
tcgggcggagcccggattcaagagggcgtggagtcactcgcgggttacgccgacattttc540
ctgcggaacgtcaccgcctccggcgtgatccctcaaatcagcctcattatgggcccctgc600
gcgggcggtgccgtctactcacccgctctgaccgattttaccttcatggtcaaggacacc660
tcctatctgtttatcactggaccagatgtggtcaagtccgtgaccaacgaggacgtcact720
caggaagaactcggtggagcaaagacccacactactatgtccggggtcgcgcatagagct780
ttcgaaaacgacgtcgatgctctctgtaacctgagggatttcttcaactaccttccactg840
tcgtcgcaagacccagcccccgtgcgcgagtgccacgatccctccgaccgcctggtgccg900
gaactcgacactattgtccctctggagtcaaccaaggcctacaacatggtggacatcatc960
catagcgtcgtggatgaacgggagttcttcgaaatcatgcccaactatgcgaaaaatatc1020
atcgtgggctttgcgcggatgaacggccgcaccgtgggcatagtgggcaaccagccgaag1080
gtcgcgtcgggatgcctcgatatcaacagctctgtgaagggagcgcggttcgtgcgcttc1140
tgcgacgccttcaacatccccttgatcaccttcgtggatgtgcctgggttcttgcctgga1200
accgcccaggaatacggggggatcattcggcacggagcaaaactgctgtacgccttcgcc1260
gaggccactgtgccgaaagtgacagtgattacccggaaggcctacgggggtgcctacgac1320
gtgatgagctccaagcacctgtgcggagacaccaattacgcgtggcctactgctgaaatt1380
gctgtcatgggagccaagggcgccgtggaaatcattttcaagggccacgaaaacgtcgag1440
gccgcccaagctgagtacatcgagaagtttgccaacccgtttcctgcggctgtgcgcggc1500
ttcgtcgacgatatcattcagccctcgtccactcgcgcccgcatttgttgtgacctcgac1560
gtgctggcgtccaagaaagtgcaaagaccgtggagaaagcatgcaaacatcccgctc1617
<210>10
<211>1617
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:pccb编码序列-
密码子优化的
<400>10
atggctgctgctctgagggtggctgctgtgggggctaggctgtctgtgctggcttctggg60
ctgagggctgctgtgaggtctctgtgttctcaggctacatctgtgaatgagaggattgag120
aataagaggaggacagctctgctggggggggggcagaggaggattgatgctcagcataag180
agggggaagctgacagctagggagaggatttctctgctgctggatcctgggtcttttgtg240
gagtctgatatgtttgtggagcataggtgtgctgattttgggatggctgctgataagaat300
aagtttcctggggattctgtggtgacagggagggggaggattaatgggaggctggtgtat360
gtgttttctcaggattttacagtgtttggggggtctctgtctggggctcatgctcagaag420
atttgtaagattatggatcaggctattacagtgggggctcctgtgattgggctgaatgat480
tctgggggggctaggattcaggagggggtggagtctctggctgggtatgctgatattttt540
ctgaggaatgtgacagcttctggggtgattcctcagatttctctgattatggggccttgt600
gctgggggggctgtgtattctcctgctctgacagattttacatttatggtgaaggataca660
tcttatctgtttattacagggcctgatgtggtgaagtctgtgacaaatgaggatgtgaca720
caggaggagctggggggggctaagacacatacaacaatgtctggggtggctcatagggct780
tttgagaatgatgtggatgctctgtgtaatctgagggatttttttaattatctgcctctg840
tcttctcaggatcctgctcctgtgagggagtgtcatgatccttctgataggctggtgcct900
gagctggatacaattgtgcctctggagtctacaaaggcttataatatggtggatattatt960
cattctgtggtggatgagagggagttttttgagattatgcctaattatgctaagaatatt1020
attgtggggtttgctaggatgaatgggaggacagtggggattgtggggaatcagcctaag1080
gtggcttctgggtgtctggatattaattcttctgtgaagggggctaggtttgtgaggttt1140
tgtgatgcttttaatattcctctgattacatttgtggatgtgcctgggtttctgcctggg1200
acagctcaggagtatggggggattattaggcatggggctaagctgctgtatgcttttgct1260
gaggctacagtgcctaaggtgacagtgattacaaggaaggcttatgggggggcttatgat1320
gtgatgtcttctaagcatctgtgtggggatacaaattatgcttggcctacagctgagatt1380
gctgtgatgggggctaagggggctgtggagattatttttaaggggcatgagaatgtggag1440
gctgctcaggctgagtatattgagaagtttgctaatccttttcctgctgctgtgaggggg1500
tttgtggatgatattattcagccttcttctacaagggctaggatttgttgtgatctggat1560
gtgctggcttctaagaaggtgcagaggccttggaggaagcatgctaatattcctctg1617
<210>11
<211>1617
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:pccb编码序列-
密码子优化的
<400>11
atggcagcagcactgagggtggcagcagtgggggcaaggctgtcagtgctggcatcaggg60
ctgagggcagcagtgaggtcactgtgttcacaggcaacatcagtgaatgagaggattgag120
aataagaggaggacagcactgctggggggggggcagaggaggattgatgcacagcataag180
agggggaagctgacagcaagggagaggatttcactgctgctggatccagggtcatttgtg240
gagtcagatatgtttgtggagcataggtgtgcagattttgggatggcagcagataagaat300
aagtttccaggggattcagtggtgacagggagggggaggattaatgggaggctggtgtat360
gtgttttcacaggattttacagtgtttggggggtcactgtcaggggcacatgcacagaag420
atttgtaagattatggatcaggcaattacagtgggggcaccagtgattgggctgaatgat480
tcagggggggcaaggattcaggagggggtggagtcactggcagggtatgcagatattttt540
ctgaggaatgtgacagcatcaggggtgattccacagatttcactgattatggggccatgt600
gcagggggggcagtgtattcaccagcactgacagattttacatttatggtgaaggataca660
tcatatctgtttattacagggccagatgtggtgaagtcagtgacaaatgaggatgtgaca720
caggaggagctggggggggcaaagacacatacaacaatgtcaggggtggcacatagggca780
tttgagaatgatgtggatgcactgtgtaatctgagggatttttttaattatctgccactg840
tcatcacaggatccagcaccagtgagggagtgtcatgatccatcagataggctggtgcca900
gagctggatacaattgtgccactggagtcaacaaaggcatataatatggtggatattatt960
cattcagtggtggatgagagggagttttttgagattatgccaaattatgcaaagaatatt1020
attgtggggtttgcaaggatgaatgggaggacagtggggattgtggggaatcagccaaag1080
gtggcatcagggtgtctggatattaattcatcagtgaagggggcaaggtttgtgaggttt1140
tgtgatgcatttaatattccactgattacatttgtggatgtgccagggtttctgccaggg1200
acagcacaggagtatggggggattattaggcatggggcaaagctgctgtatgcatttgca1260
gaggcaacagtgccaaaggtgacagtgattacaaggaaggcatatgggggggcatatgat1320
gtgatgtcatcaaagcatctgtgtggggatacaaattatgcatggccaacagcagagatt1380
gcagtgatgggggcaaagggggcagtggagattatttttaaggggcatgagaatgtggag1440
gcagcacaggcagagtatattgagaagtttgcaaatccatttccagcagcagtgaggggg1500
tttgtggatgatattattcagccatcatcaacaagggcaaggatttgttgtgatctggat1560
gtgctggcatcaaagaaggtgcagaggccatggaggaagcatgcaaatattccactg1617
<210>12
<211>1617
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:pccb编码序列-
密码子优化的
<400>12
atggctgcagcactaagggtagcagcagtaggtgcaaggctatcagtactagcatcaggt60
ctaagggcagcagtaaggtcactatgttcacaagcaacatcagtaaatgaaaggatagaa120
aataagaggaggacagcactactaggtggtgggcagaggaggattgatgctcagcataag180
agggggaagctgacagctagggagaggatttctctgctgctggatcctgggtcttttgtg240
gagtctgatatgtttgtggagcataggtgtgctgattttgggatggctgctgataagaat300
aagtttcctggggattctgtggtgacagggagggggaggattaatgggaggctggtgtat360
gtgttttctcaggattttacagtgtttggggggtctctgtctggggctcatgctcagaag420
atttgtaagattatggatcaggctattacagtgggggctcctgtgattgggctgaatgat480
tctgggggggctaggattcaggagggggtggagtctctggctgggtatgctgatattttt540
ctgaggaatgtgacagcttctggggtgattcctcagatttctctgattatggggccttgt600
gctgggggggctgtgtattctcctgctctgacagattttacatttatggtgaaggataca660
tcttatctgtttattacagggcctgatgtggtgaagtctgtgacaaatgaggatgtgaca720
caggaggagctggggggggctaagacacatacaacaatgtctggggtggctcatagggct780
tttgagaatgatgtggatgctctgtgtaatctgagggatttttttaattatctgcctctg840
tcttctcaggatcctgctcctgtgagggagtgtcatgatccttctgataggctggtgcct900
gagctggatacaattgtgcctctggagtctacaaaggcttataatatggtggatattatt960
cattctgtggtggatgagagggagttttttgagattatgcctaattatgctaagaatatt1020
attgtggggtttgctaggatgaatgggaggacagtggggattgtggggaatcagcctaag1080
gtggcttctgggtgtctggatattaattcttctgtgaagggggctaggtttgtgaggttt1140
tgtgatgcttttaatattcctctgattacatttgtggatgtgcctgggtttctgcctggg1200
acagctcaggagtatggggggattattaggcatggggctaagctgctgtatgcttttgct1260
gaggctacagtgcctaaggtgacagtgattacaaggaaggcttatgggggggcttatgat1320
gtgatgtcttctaagcatctgtgtggggatacaaattatgcttggcctacagctgagatt1380
gctgtgatgggggctaagggggctgtggagattatttttaaggggcatgagaatgtggag1440
gctgctcaggctgagtatattgagaagtttgctaatccttttcctgctgctgtgaggggg1500
tttgtggatgatattattcagccttcttctacaagggctaggatttgttgtgatctggat1560
gtgctggcttctaagaaggtgcagaggccttggaggaagcatgctaatattcctctg1617
<210>13
<211>2211
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:aav9核酸序列
<400>13
atggctgccgatggttatcttccagattggctcgaggacaaccttagtgaaggaattcgc60
gagtggtgggctttgaaacctggagcccctcaacccaaggcaaatcaacaacatcaagac120
aacgctcgaggtcttgtgcttccgggttacaaataccttggacccggcaacggactcgac180
aagggggagccggtcaacgcagcagacgcggcggccctcgagcacgacaaggcctacgac240
cagcagctcaaggccggagacaacccgtacctcaagtacaaccacgccgacgccgagttc300
caggagcggctcaaagaagatacgtcttttgggggcaacctcgggcgagcagtcttccag360
gccaaaaagaggcttcttgaacctcttggtctggttgaggaagcggctaagacggctcct420
ggaaagaagaggcctgtagagcagtctcctcaggaaccggactcctccgcgggtattggc480
aaatcgggtgcacagcccgctaaaaagagactcaatttcggtcagactggcgacacagag540
tcagtcccagaccctcaaccaatcggagaacctcccgcagccccctcaggtgtgggatct600
cttacaatggcttcaggtggtggcgcaccagtggcagacaataacgaaggtgccgatgga660
gtgggtagttcctcgggaaattggcattgcgattcccaatggctgggggacagagtcatc720
accaccagcacccgaacctgggccctgcccacctacaacaatcacctctacaagcaaatc780
tccaacagcacatctggaggatcttcaaatgacaacgcctacttcggctacagcaccccc840
tgggggtattttgacttcaacagattccactgccacttctcaccacgtgactggcagcga900
ctcatcaacaacaactggggattccggcctaagcgactcaacttcaagctcttcaacatt960
caggtcaaagaggttacggacaacaatggagtcaagaccatcgccaataaccttaccagc1020
acggtccaggtcttcacggactcagactatcagctcccgtacgtgctcgggtcggctcac1080
gagggctgcctcccgccgttcccagcggacgttttcatgattcctcagtacgggtatctg1140
acgcttaatgatggaagccaggccgtgggtcgttcgtccttttactgcctggaatatttc1200
ccgtcgcaaatgctaagaacgggtaacaacttccagttcagctacgagtttgagaacgta1260
cctttccatagcagctacgctcacagccaaagcctggaccgactaatgaatccactcatc1320
gaccaatacttgtactatctctcaaagactattaacggttctggacagaatcaacaaacg1380
ctaaaattcagtgtggccggacccagcaacatggctgtccagggaagaaactacatacct1440
ggacccagctaccgacaacaacgtgtctcaaccactgtgactcaaaacaacaacagcgaa1500
tttgcttggcctggagcttcttcttgggctctcaatggacgtaatagcttgatgaatcct1560
ggacctgctatggccagccacaaagaaggagaggaccgtttctttcctttgtctggatct1620
ttaatttttggcaaacaaggaactggaagagacaacgtggatgcggacaaagtcatgata1680
accaacgaagaagaaattaaaactactaacccggtagcaacggagtcctatggacaagtg1740
gccacaaaccaccagagtgcccaagcacaggcgcagaccggctgggttcaaaaccaagga1800
atacttccgggtatggtttggcaggacagagatgtgtacctgcaaggacccatttgggcc1860
aaaattcctcacacggacggcaactttcacccttctccgctgatgggagggtttggaatg1920
aagcacccgcctcctcagatcctcatcaaaaacacacctgtacctgcggatcctccaacg1980
gccttcaacaaggacaagctgaactctttcatcacccagtattctactggccaagtcagc2040
gtggagatcgagtgggagctgcagaaggaaaacagcaagcgctggaacccggagatccag2100
tacacttccaactattacaagtctaataatgttgaatttgctgttaatactgaaggtgta2160
tatagtgaaccccgccccattggcaccagatacctgactcgtaatctgtaa2211
<210>14
<211>736
<212>prt
<213>人工序列
<220>
<223>人工序列的描述:aav9氨基酸序列
<400>14
metalaalaaspglytyrleuproasptrpleugluaspasnleuser
151015
gluglyileargglutrptrpalaleulysproglyalaproglnpro
202530
lysalaasnglnglnhisglnaspasnalaargglyleuvalleupro
354045
glytyrlystyrleuglyproglyasnglyleuasplysglyglupro
505560
valasnalaalaaspalaalaalaleugluhisasplysalatyrasp
65707580
glnglnleulysalaglyaspasnprotyrleulystyrasnhisala
859095
aspalaglupheglngluargleulysgluaspthrserpheglygly
100105110
asnleuglyargalavalpheglnalalyslysargleuleuglupro
115120125
leuglyleuvalgluglualaalalysthralaproglylyslysarg
130135140
provalgluglnserproglngluproaspserseralaglyilegly
145150155160
lysserglyalaglnproalalyslysargleuasnpheglyglnthr
165170175
glyaspthrgluservalproaspproglnproileglyglupropro
180185190
alaalaproserglyvalglyserleuthrmetalaserglyglygly
195200205
alaprovalalaaspasnasngluglyalaaspglyvalglyserser
210215220
serglyasntrphiscysaspserglntrpleuglyaspargvalile
225230235240
thrthrserthrargthrtrpalaleuprothrtyrasnasnhisleu
245250255
tyrlysglnileserasnserthrserglyglyserserasnaspasn
260265270
alatyrpheglytyrserthrprotrpglytyrpheasppheasnarg
275280285
phehiscyshispheserproargasptrpglnargleuileasnasn
290295300
asntrpglypheargprolysargleuasnphelysleupheasnile
305310315320
glnvallysgluvalthraspasnasnglyvallysthrilealaasn
325330335
asnleuthrserthrvalglnvalphethraspserasptyrglnleu
340345350
protyrvalleuglyseralahisgluglycysleuproprophepro
355360365
alaaspvalphemetileproglntyrglytyrleuthrleuasnasp
370375380
glyserglnalavalglyargserserphetyrcysleuglutyrphe
385390395400
proserglnmetleuargthrglyasnasnpheglnphesertyrglu
405410415
phegluasnvalprophehissersertyralahisserglnserleu
420425430
aspargleumetasnproleuileaspglntyrleutyrtyrleuser
435440445
lysthrileasnglyserglyglnasnglnglnthrleulyspheser
450455460
valalaglyproserasnmetalavalglnglyargasntyrilepro
465470475480
glyprosertyrargglnglnargvalserthrthrvalthrglnasn
485490495
asnasnsergluphealatrpproglyalasersertrpalaleuasn
500505510
glyargasnserleumetasnproglyproalametalaserhislys
515520525
gluglygluaspargphepheproleuserglyserleuilephegly
530535540
lysglnglythrglyargaspasnvalaspalaasplysvalmetile
545550555560
thrasngluglugluilelysthrthrasnprovalalathrgluser
565570575
tyrglyglnvalalathrasnhisglnseralaglnalaglnalagln
580585590
thrglytrpvalglnasnglnglyileleuproglymetvaltrpgln
595600605
aspargaspvaltyrleuglnglyproiletrpalalysileprohis
610615620
thraspglyasnphehisproserproleumetglyglypheglymet
625630635640
lyshisproproproglnileleuilelysasnthrprovalproala
645650655
aspproprothralapheasnlysasplysleuasnserpheilethr
660665670
glntyrserthrglyglnvalservalgluileglutrpgluleugln
675680685
lysgluasnserlysargtrpasnprogluileglntyrthrserasn
690695700
tyrtyrlysserasnasnvalgluphealavalasnthrgluglyval
705710715720
tyrsergluproargproileglythrargtyrleuthrargasnleu
725730735
<210>15
<211>145
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:aav2itr
<400>15
ttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcc60
cgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtg120
gccaactccatcactaggggttcct145
<210>16
<211>728
<212>prt
<213>智人(homosapiens)
<400>16
metalaglyphetrpvalglythralaproleuvalalaalaglyarg
151015
argglyargtrpproproglnglnleumetleuseralaalaleuarg
202530
thrleulyshisvalleutyrtyrserargglncysleumetvalser
354045
argasnleuglyservalglytyraspproasnglulysthrpheasp
505560
lysileleuvalalaasnargglygluilealacysargvalilearg
65707580
thrcyslyslysmetglyilelysthrvalalailehisseraspval
859095
aspalaserservalhisvallysmetalaaspglualavalcysval
100105110
glyproalaprothrserlyssertyrleuasnmetaspalailemet
115120125
glualailelyslysthrargalaglnalavalhisproglytyrgly
130135140
pheleusergluasnlysgluphealaargcysleualaalagluasp
145150155160
valvalpheileglyproaspthrhisalaileglnalametglyasp
165170175
lysilegluserlysleuleualalyslysalagluvalasnthrile
180185190
proglypheaspglyvalvallysaspalagluglualavalargile
195200205
alaarggluileglytyrprovalmetilelysalaseralaglygly
210215220
glyglylysglymetargilealatrpaspaspglugluthrargasp
225230235240
glypheargleuserserglnglualaalaserserpheglyaspasp
245250255
argleuleuileglulyspheileaspasnproarghisilegluile
260265270
glnvalleuglyasplyshisglyasnalaleutrpleuasngluarg
275280285
glucysserileglnargargasnglnlysvalvalgluglualapro
290295300
serilepheleuaspalagluthrargargalametglygluglnala
305310315320
valalaleualaargalavallystyrserseralaglythrvalglu
325330335
pheleuvalaspserlyslysasnphetyrpheleuglumetasnthr
340345350
argleuglnvalgluhisprovalthrglucysilethrglyleuasp
355360365
leuvalglnglumetileargvalalalysglytyrproleuarghis
370375380
lysglnalaaspileargileasnglytrpalavalglucysargval
385390395400
tyralagluaspprotyrlysserpheglyleuproserileglyarg
405410415
leuserglntyrglngluproleuhisleuproglyvalargvalasp
420425430
serglyileglnproglyseraspileseriletyrtyrasppromet
435440445
ileserlysleuilethrtyrglyseraspargthrglualaleulys
450455460
argmetalaaspalaleuaspasntyrvalileargglyvalthrhis
465470475480
asnilealaleuleuarggluvalileileasnserargphevallys
485490495
glyaspileserthrlyspheleuseraspvaltyrproaspglyphe
500505510
lysglyhismetleuthrlysserglulysasnglnleuleualaile
515520525
alaserserleuphevalalapheglnleuargalaglnhisphegln
530535540
gluasnserargmetprovalilelysproaspilealaasntrpglu
545550555560
leuservallysleuhisasplysvalhisthrvalvalalaserasn
565570575
asnglyservalpheservalgluvalaspglyserlysleuasnval
580585590
thrserthrtrpasnleualaserproleuleuservalservalasp
595600605
glythrglnargthrvalglncysleuserargglualaglyglyasn
610615620
metserileglnpheleuglythrvaltyrlysvalasnileleuthr
625630635640
argleualaalagluleuasnlysphemetleuglulysvalthrglu
645650655
aspthrserservalleuargserprometproglyvalvalvalala
660665670
valservallysproglyaspalavalalagluglyglngluilecys
675680685
valileglualametlysmetglnasnsermetthralaglylysthr
690695700
glythrvallysservalhiscysglnalaglyaspthrvalglyglu
705710715720
glyaspleuleuvalgluleuglu
725
<210>17
<211>539
<212>prt
<213>智人(homosapiens)
<400>17
metalaalaalaleuargvalalaalavalglyalaargleuserval
151015
leualaserglyleuargalaalavalargserleucysserglnala
202530
thrservalasngluargilegluasnlysargargthralaleuleu
354045
glyglyglyglnargargileaspalaglnhislysargglylysleu
505560
thralaarggluargileserleuleuleuaspproglyserpheval
65707580
gluseraspmetphevalgluhisargcysalaasppheglymetala
859095
alaasplysasnlyspheproglyaspservalvalthrglyarggly
100105110
argileasnglyargleuvaltyrvalpheserglnaspphethrval
115120125
pheglyglyserleuserglyalahisalaglnlysilecyslysile
130135140
metaspglnalailethrvalglyalaprovalileglyleuasnasp
145150155160
serglyglyalaargileglngluglyvalgluserleualaglytyr
165170175
alaaspilepheleuargasnvalthralaserglyvalileprogln
180185190
ileserleuilemetglyprocysalaglyglyalavaltyrserpro
195200205
alaleuthraspphethrphemetvallysaspthrsertyrleuphe
210215220
ilethrglyproaspvalvallysservalthrasngluaspvalthr
225230235240
glnglugluleuglyglyalalysthrhisthrthrmetserglyval
245250255
alahisargalaphegluasnaspvalaspalaleucysasnleuarg
260265270
aspphepheasntyrleuproleuserserglnaspproalaproval
275280285
argglucyshisaspproseraspargleuvalprogluleuaspthr
290295300
ilevalproleugluserthrlysalatyrasnmetvalaspileile
305310315320
hisservalvalaspgluarggluphephegluilemetproasntyr
325330335
alalysasnileilevalglyphealaargmetasnglyargthrval
340345350
glyilevalglyasnglnprolysvalalaserglycysleuaspile
355360365
asnserservallysglyalaargphevalargphecysaspalaphe
370375380
asnileproleuilethrphevalaspvalproglypheleuprogly
385390395400
thralaglnglutyrglyglyileilearghisglyalalysleuleu
405410415
tyralaphealaglualathrvalprolysvalthrvalilethrarg
420425430
lysalatyrglyglyalatyraspvalmetserserlyshisleucys
435440445
glyaspthrasntyralatrpprothralagluilealavalmetgly
450455460
alalysglyalavalgluileilephelysglyhisgluasnvalglu
465470475480
alaalaglnalaglutyrileglulysphealaasnpropheproala
485490495
alavalargglyphevalaspaspileileglnproserserthrarg
500505510
alaargilecyscysaspleuaspvalleualaserlyslysvalgln
515520525
argprotrparglyshisalaasnileproleu
530535
<210>18
<211>278
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:cba启动子
<400>18
tcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaa60
ttttgtatttatttattttttaattattttgtgcagcgatgggggcgggggggggggggg120
ggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcggagaggtg180
cggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggcggcggc240
ggcggcggccctataaaaagcgaagcgcgcggcgggcg278
<210>19
<211>304
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:cmv增强子
<400>19
cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccatt60
gacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtca120
atgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgcc180
aagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagta240
catgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattac300
catg304
<210>20
<211>95
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:sv40小t内含子
<400>20
gctctaaggtaaatataaaatttttaagtgtataatgtgttaaactactgattctaattg60
tttctctcttttagattccaacctttggaactgat95
<210>21
<211>315
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:rhbb内含子
<400>21
gtgagcgggcgggacggcccttctcctccgggctgtaattagcgcttggtttaatgacgg60
cttgtttcttttctgtggctgcgtgaaagccttgaggggctccgggagggccctttgtgc120
ggggggagcggctcggggctgtccgcggggggacggctgccttcgggggggacggggcag180
ggcggggttcggcttctggcgtgtgaccggcggctcaagagcctctgctaaccatgttca240
tgccttcttctttttcctacagctcctgggcaacgtgctggttattgtgctgtctcatca300
ttttggcaaagaatt315
<210>22
<211>215
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:bgh多聚腺苷酸化信号序列
<400>22
gcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttcc60
ttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcg120
cattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggg180
gaggattgggaagacaatagcaggcatgctgggga215
<210>23
<211>198
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:sv40晚期多聚腺苷酸化信号序列
<400>23
gatccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtga60
aaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagc120
tgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggag180
gtgtgggaggttttttag198
<210>24
<400>24
000
<210>25
<211>728
<212>prt
<213>智人(homosapiens)
<400>25
metalaglyphetrpvalglythralaproleuvalalaalaglyarg
151015
argglyargtrpproproglnglnleumetleuseralaalaleuarg
202530
thrleulyshisvalleutyrtyrserargglncysleumetvalser
354045
argasnleuglyservalglytyraspproasnglulysthrpheasp
505560
lysileleuvalalaasnargglygluilealacysargvalilearg
65707580
thrcyslyslysmetglyilelysthrvalalailehisseraspval
859095
aspalaserservalhisvallysmetalaaspglualavalcysval
100105110
glyproalaprothrserlyssertyrleuasnmetaspalailemet
115120125
glualailelyslysthrargalaglnalavalhisproglytyrgly
130135140
pheleusergluasnlysgluphealaargcysleualaalagluasp
145150155160
valvalpheileglyproaspthrhisalaileglnalametglyasp
165170175
lysilegluserlysleuleualalyslysalagluvalasnthrile
180185190
proglypheaspglyvalvallysaspalagluglualavalargile
195200205
alaarggluileglytyrprovalmetilelysalaseralaglygly
210215220
glyglylysglymetargilealatrpaspaspglugluthrargasp
225230235240
glypheargleuserserglnglualaalaserserpheglyaspasp
245250255
argleuleuileglulyspheileaspasnproarghisilegluile
260265270
glnvalleuglyasplyshisglyasnalaleutrpleuasngluarg
275280285
glucysserileglnargargasnglnlysvalvalgluglualapro
290295300
serilepheleuaspalagluthrargargalametglygluglnala
305310315320
valalaleualaargalavallystyrserseralaglythrvalglu
325330335
pheleuvalaspserlyslysasnphetyrpheleuglumetasnthr
340345350
argleuglnvalgluhisprovalthrglucysilethrglyleuasp
355360365
leuvalglnglumetileargvalalalysglytyrproleuarghis
370375380
lysglnalaaspileargileasnglytrpalavalglucysargval
385390395400
tyralagluaspprotyrlysserpheglyleuproserileglyarg
405410415
leuserglntyrglngluproleuhisleuproglyvalargvalasp
420425430
serglyileglnproglyseraspileseriletyrtyrasppromet
435440445
ileserlysleuilethrtyrglyseraspargthrglualaleulys
450455460
argmetalaaspalaleuaspasntyrvalileargglyvalthrhis
465470475480
asnilealaleuleuarggluvalileileasnserargphevallys
485490495
glyaspileserthrlyspheleuseraspvaltyrproaspglyphe
500505510
lysglyhismetleuthrlysserglulysasnglnleuleualaile
515520525
alaserserleuphevalalapheglnleuargalaglnhisphegln
530535540
gluasnserargmetprovalilelysproaspilealaasntrpglu
545550555560
leuservallysleuhisasplysvalhisthrvalvalalaserasn
565570575
asnglyservalpheservalgluvalaspglyserlysleuasnval
580585590
thrserthrtrpasnleualaserproleuleuservalservalasp
595600605
glythrglnargthrvalglncysleuserargglualaglyglyasn
610615620
metserileglnpheleuglythrvaltyrlysvalasnileleuthr
625630635640
argleualaalagluleuasnlysphemetleuglulysvalthrglu
645650655
aspthrserservalleuargserprometproglyvalvalvalala
660665670
valservallysproglyaspalavalalagluglyglngluilecys
675680685
valileglualametlysmetglnasnsermetthralaglylysthr
690695700
glythrvallysservalhiscysglnalaglyaspthrvalglyglu
705710715720
glyaspleuleuvalgluleuglu
725
<210>26
<211>702
<212>prt
<213>智人(homosapiens)
<400>26
metalaglyphetrpvalglythralaproleuvalalaalaglyarg
151015
argglyargtrpproproglnglnleumetleuseralaalaleuarg
202530
thrleulysthrpheasplysileleuvalalaasnargglygluile
354045
alacysargvalileargthrcyslyslysmetglyilelysthrval
505560
alailehisseraspvalaspalaserservalhisvallysmetala
65707580
aspglualavalcysvalglyproalaprothrserlyssertyrleu
859095
asnmetaspalailemetglualailelyslysthrargalaglnala
100105110
valhisproglytyrglypheleusergluasnlysgluphealaarg
115120125
cysleualaalagluaspvalvalpheileglyproaspthrhisala
130135140
ileglnalametglyasplysilegluserlysleuleualalyslys
145150155160
alagluvalasnthrileproglypheaspglyvalvallysaspala
165170175
gluglualavalargilealaarggluileglytyrprovalmetile
180185190
lysalaseralaglyglyglyglylysglymetargilealatrpasp
195200205
aspglugluthrargaspglypheargleuserserglnglualaala
210215220
serserpheglyaspaspargleuleuileglulyspheileaspasn
225230235240
proarghisilegluileglnvalleuglyasplyshisglyasnala
245250255
leutrpleuasngluargglucysserileglnargargasnglnlys
260265270
valvalgluglualaproserilepheleuaspalagluthrargarg
275280285
alametglygluglnalavalalaleualaargalavallystyrser
290295300
seralaglythrvalglupheleuvalaspserlyslysasnphetyr
305310315320
pheleuglumetasnthrargleuglnvalgluhisprovalthrglu
325330335
cysilethrglyleuaspleuvalglnglumetileargvalalalys
340345350
glytyrproleuarghislysglnalaaspileargileasnglytrp
355360365
alavalglucysargvaltyralagluaspprotyrlysserphegly
370375380
leuproserileglyargleuserglntyrglngluproleuhisleu
385390395400
proglyvalargvalaspserglyileglnproglyseraspileser
405410415
iletyrtyraspprometileserlysleuilethrtyrglyserasp
420425430
argthrglualaleulysargmetalaaspalaleuaspasntyrval
435440445
ileargglyvalthrhisasnilealaleuleuarggluvalileile
450455460
asnserargphevallysglyaspileserthrlyspheleuserasp
465470475480
valtyrproaspglyphelysglyhismetleuthrlysserglulys
485490495
asnglnleuleualailealaserserleuphevalalapheglnleu
500505510
argalaglnhispheglngluasnserargmetprovalilelyspro
515520525
aspilealaasntrpgluleuservallysleuhisasplysvalhis
530535540
thrvalvalalaserasnasnglyservalpheservalgluvalasp
545550555560
glyserlysleuasnvalthrserthrtrpasnleualaserproleu
565570575
leuservalservalaspglythrglnargthrvalglncysleuser
580585590
argglualaglyglyasnmetserileglnpheleuglythrvaltyr
595600605
lysvalasnileleuthrargleualaalagluleuasnlysphemet
610615620
leuglulysvalthrgluaspthrserservalleuargserpromet
625630635640
proglyvalvalvalalavalservallysproglyaspalavalala
645650655
gluglyglngluilecysvalileglualametlysmetglnasnser
660665670
metthralaglylysthrglythrvallysservalhiscysglnala
675680685
glyaspthrvalglygluglyaspleuleuvalgluleuglu
690695700
<210>27
<211>681
<212>prt
<213>智人(homosapiens)
<400>27
metalaglyphetrpvalglythralaproleuvalalaalaglyarg
151015
argglyargtrpproproglnglnleumetleuseralaalaleuarg
202530
thrleulyshisvalleutyrtyrserargglncysleumetvalser
354045
argasnleuglyservalglytyraspproasnglulysthrpheasp
505560
lysileleuvalalaasnargglygluilealacysargvalilearg
65707580
thrcyslyslysmetglyilelysthrvalalailehisseraspval
859095
aspalaserservalhisvallysmetalaaspglualavalcysval
100105110
glyproalaprothrserlyssertyrleuasnmetaspalailemet
115120125
glualailelyslysthrargalaglnalavalhisproglytyrgly
130135140
pheleusergluasnlysgluphealaargcysleualaalagluasp
145150155160
valvalpheileglyproaspthrhisalaileglnalametglyasp
165170175
lysilegluserlysleuleualalyslysalagluvalasnthrile
180185190
proglypheaspglyvalvallysaspalagluglualavalargile
195200205
alaarggluileglytyrprovalmetilelysalaseralaglygly
210215220
glyglylysglymetargilealatrpaspaspglugluthrargasp
225230235240
glypheargleuserserglnglualaalaserserpheglyaspasp
245250255
argleuleuileglulyspheileaspasnproarghisilegluile
260265270
glnvalleuglyasplyshisglyasnalaleutrpleuasngluarg
275280285
glucysserileglnargargasnglnlysvalvalgluglualapro
290295300
serilepheleuaspalagluthrargargalametglygluglnala
305310315320
valalaleualaargalavallystyrserseralaglythrvalglu
325330335
pheleuvalaspserlyslysasnphetyrpheleuglumetasnthr
340345350
argleuglnvalgluhisprovalthrglucysilethrglyleuasp
355360365
leuvalglnglumetileargvalalalysglytyrproleuarghis
370375380
lysglnalaaspileargileasnglytrpalavalglucysargval
385390395400
tyralagluaspprotyrlysserpheglyleuproserileglyarg
405410415
leuserglntyrglngluproleuhisleuproglyvalargvalasp
420425430
serglyileglnproglyseraspileseriletyrtyrasppromet
435440445
ileserlysleuilethrtyrglyseraspargthrglualaleulys
450455460
argmetalaaspalaleuaspasntyrvalileargglyvalthrhis
465470475480
asnilealaleuleuarggluvalileileasnserargphevallys
485490495
glyaspileserthrlyspheleuseraspvaltyrproaspglyphe
500505510
lysglyhismetleuthrlysserglulysasnglnleuleualaile
515520525
alaserserleuphevalalapheglnleuargalaglnhisphegln
530535540
gluasnserargmetprovalilelysproaspilealaasntrpglu
545550555560
leuservallysleuhisasplysvalhisthrvalvalalaserasn
565570575
asnglyservalpheservalgluvalaspglyserlysleuasnval
580585590
thrserthrtrpasnleualaserproleuleuservalservalasp
595600605
glythrglnargthrvalglncysleuserargglualaglyglyasn
610615620
metserileglnpheleuglythrvalvalalagluglyglngluile
625630635640
cysvalileglualametlysmetglnasnsermetthralaglylys
645650655
thrglythrvallysservalhiscysglnalaglyaspthrvalgly
660665670
gluglyaspleuleuvalgluleuglu
675680
<210>28
<211>539
<212>prt
<213>智人(homosapiens)
<400>28
metalaalaalaleuargvalalaalavalglyalaargleuserval
151015
leualaserglyleuargalaalavalargserleucysserglnala
202530
thrservalasngluargilegluasnlysargargthralaleuleu
354045
glyglyglyglnargargileaspalaglnhislysargglylysleu
505560
thralaarggluargileserleuleuleuaspproglyserpheval
65707580
gluseraspmetphevalgluhisargcysalaasppheglymetala
859095
alaasplysasnlyspheproglyaspservalvalthrglyarggly
100105110
argileasnglyargleuvaltyrvalpheserglnaspphethrval
115120125
pheglyglyserleuserglyalahisalaglnlysilecyslysile
130135140
metaspglnalailethrvalglyalaprovalileglyleuasnasp
145150155160
serglyglyalaargileglngluglyvalgluserleualaglytyr
165170175
alaaspilepheleuargasnvalthralaserglyvalileprogln
180185190
ileserleuilemetglyprocysalaglyglyalavaltyrserpro
195200205
alaleuthraspphethrphemetvallysaspthrsertyrleuphe
210215220
ilethrglyproaspvalvallysservalthrasngluaspvalthr
225230235240
glnglugluleuglyglyalalysthrhisthrthrmetserglyval
245250255
alahisargalaphegluasnaspvalaspalaleucysasnleuarg
260265270
aspphepheasntyrleuproleuserserglnaspproalaproval
275280285
argglucyshisaspproseraspargleuvalprogluleuaspthr
290295300
ilevalproleugluserthrlysalatyrasnmetvalaspileile
305310315320
hisservalvalaspgluarggluphephegluilemetproasntyr
325330335
alalysasnileilevalglyphealaargmetasnglyargthrval
340345350
glyilevalglyasnglnprolysvalalaserglycysleuaspile
355360365
asnserservallysglyalaargphevalargphecysaspalaphe
370375380
asnileproleuilethrphevalaspvalproglypheleuprogly
385390395400
thralaglnglutyrglyglyileilearghisglyalalysleuleu
405410415
tyralaphealaglualathrvalprolysvalthrvalilethrarg
420425430
lysalatyrglyglyalatyraspvalmetserserlyshisleucys
435440445
glyaspthrasntyralatrpprothralagluilealavalmetgly
450455460
alalysglyalavalgluileilephelysglyhisgluasnvalglu
465470475480
alaalaglnalaglutyrileglulysphealaasnpropheproala
485490495
alavalargglyphevalaspaspileileglnproserserthrarg
500505510
alaargilecyscysaspleuaspvalleualaserlyslysvalgln
515520525
argprotrparglyshisalaasnileproleu
530535
<210>29
<211>559
<212>prt
<213>智人(homosapiens)
<400>29
metalaalaalaleuargvalalaalavalglyalaargleuserval
151015
leualaserglyleuargalaalavalargserleucysserglnala
202530
thrservalasngluargilegluasnlysargargthralaleuleu
354045
glyglyglyglnargargileaspalaglnhislysargglylysleu
505560
thralaarggluargileserleuleuleuaspproglyserpheval
65707580
gluseraspmetphevalgluhisargcysalaasppheglymetala
859095
alaasplysasnlyspheproglyaspservalvalthrglyarggly
100105110
argileasnglyargleuvaltyrvalpheserglnglnileilegly
115120125
trpalaglntrpleuproleuvalileseralaleutrpglualaglu
130135140
aspphethrvalpheglyglyserleuserglyalahisalaglnlys
145150155160
ilecyslysilemetaspglnalailethrvalglyalaprovalile
165170175
glyleuasnaspserglyglyalaargileglngluglyvalgluser
180185190
leualaglytyralaaspilepheleuargasnvalthralasergly
195200205
valileproglnileserleuilemetglyprocysalaglyglyala
210215220
valtyrserproalaleuthraspphethrphemetvallysaspthr
225230235240
sertyrleupheilethrglyproaspvalvallysservalthrasn
245250255
gluaspvalthrglnglugluleuglyglyalalysthrhisthrthr
260265270
metserglyvalalahisargalaphegluasnaspvalaspalaleu
275280285
cysasnleuargaspphepheasntyrleuproleuserserglnasp
290295300
proalaprovalargglucyshisaspproseraspargleuvalpro
305310315320
gluleuaspthrilevalproleugluserthrlysalatyrasnmet
325330335
valaspileilehisservalvalaspgluarggluphephegluile
340345350
metproasntyralalysasnileilevalglyphealaargmetasn
355360365
glyargthrvalglyilevalglyasnglnprolysvalalasergly
370375380
cysleuaspileasnserservallysglyalaargphevalargphe
385390395400
cysaspalapheasnileproleuilethrphevalaspvalprogly
405410415
pheleuproglythralaglnglutyrglyglyileilearghisgly
420425430
alalysleuleutyralaphealaglualathrvalprolysvalthr
435440445
valilethrarglysalatyrglyglyalatyraspvalmetserser
450455460
lyshisleucysglyaspthrasntyralatrpprothralagluile
465470475480
alavalmetglyalalysglyalavalgluileilephelysglyhis
485490495
gluasnvalglualaalaglnalaglutyrileglulysphealaasn
500505510
propheproalaalavalargglyphevalaspaspileileglnpro
515520525
serserthrargalaargilecyscysaspleuaspvalleualaser
530535540
lyslysvalglnargprotrparglyshisalaasnileproleu
545550555
<210>30
<211>1412
<212>dna
<213>智人(homosapiens)
<400>30
tctcaaggtgactctgcaggagatgcaaagtagttaagaggagaacccccaatactgatg60
tgtttataggtgaggtggtctgatgtcttagatttgctttaaaatattcctgcacaaaat120
aaaaaggggaatagatgaaacaagattgacaaaatgttgattcattgacgcggtgtaatg180
ggtatctgggtgatcatagtacaattttatctcttttgtatatattttaaaatttccata240
atatagcaaaacatgagcccagtccctcaaggcagccagatttgggttcaaaccctagtt300
tgaccttttactcgctgagtgactttaccctgctacagcttcagtttctccaaatggaaa360
taatatatactccattaaggttcttgtaaactctcaagtaagagggaatctgaggctcta420
gcacacggcccggcccttaatagttgtactaatttttattttatttttcgaaacggagtt480
tgctctgtcacccaggctggagtgtagtggcatgatccggctcactgcaacctccacctc540
cagggttcaagcaattctcctgcctcagcctcctcccgagtaactgggattacaggagtg600
cgccaccacgcccagctaatttttgtattttttagtagagacggggtttcggcatgttgt660
ccaggctggtctccaactcctgacctcaggttatcctcccgcctcggcctcccagagtgc720
tgggattacaggcgtgagccactgcgcctggccagtagttgtactaacaagggtttctgc780
ttgcgagcaacaaagactgactctagttgtggctaatttctttcacacacacatattaag840
tgccagaggtaggacttgagctcggatctctgatttccagacctagaactttttatgtgt900
tattacagtcgttaaaaaccttacctggatttgtgctttgcaatttacgctttcgaacat960
gcaggaatgtagtttgggcatttgtctggaacttcggattctcgggactccagggtggcc1020
aaggcgcggaggtgactcaatgacattgaccggcctggatgcacgtgggttgctgagccg1080
atgctgggaaggtacggggtttgcccggtgcaggccgccggaactcacgcacgcccctgt1140
ctctctcactcctggggtcggctctggccggtggcctccagctcagctagcggccggacg1200
cgcagcccgccgactagccctccaggtcctagcgcgactcccggatcccggatccggcgg1260
atctggccgaccactcaccctcccctttccgcaagttagggggcggggcatcgggtttct1320
ggctcgtgatttgccggagctcctgcgctccccttctccaccccctccggctgtgtgaga1380
ggtcagcagaggggcggtctgcggggacaaca1412
<210>31
<211>275
<212>dna
<213>智人(homosapiens)
<400>31
aggatttataacctttcagtcatcacccaatttaattagccatttgcatgatgctttcac60
acacaattgattcaagcattatacaggaacacccctgtgcagctacgtttacgtcgtcat120
ttattccacagagtcaagaccaatattctgccaaaaaatcaccaatggaaattttcattg180
atataaatacttgtacatatgatttgtacttctgctgtgagattccctagtgtcaaaatt240
aaatcaataaaactgagcatttgtctaaatattag275
<210>32
<211>1378
<212>dna
<213>智人(homosapiens)
<400>32
gctggccccagccccagagtttctgatttaaaggtctggagtaagttctgagaattcgag60
cttgcatttccaactcactcccaggtgatactgaagttgctggattgacaagattccctc120
cttgatcaaacattggtcaggctcttctgagctctctctttgactaggcctgagtgtggg180
ctcccatgtcattccttgtggaattccattttagcaagaaacttgccaagtcagtttagc240
cagaatcctccattcttgatatctgattactctccatatctggttttgacccataccgcc300
accatcccccaggtgatgttcagttaccctgacctgccttgggcaggaatcctgttaggt360
caatttagccagattccccgccaatgtttcctcttagtaattttccatccactgacttcc420
acacactgccccttagctataaattaccactttgctatattcagcccaatcgctctgact480
tatggcaaaactctatccctacctctgtcagattgggcctgaataaagtttgccttacca540
ttcttaaacatgaataattaagtgtcatgaatagttttttctttaatgggatccatactt600
tgagaactactgattagaggttaagggtcctgtgctcattatctggcacatattaatgat660
aggtctctgagtttgaatcctggccaaccacattgtcagtcttggctttttttttttttt720
ttttttgagacagggttttgcccaggctggagtgcagtgatgcaatcacggctcactgca780
gcctcgacttcctgggccaagccatcctgccgccttagcctcccgagtagctggggtcac840
aggtgcaagccgccatgcccagctaatttttaatttttttgtagaggtggggtcttacta900
tattgctcaggctggtcttgggctcctgggctcacctacctcggcctcagtcttgcctct960
tgatcaaatcactcatctctctgtgcttgatttacctcatctgtgaaatccagatagtaa1020
gctagtgcatggtaagtgcaaaaagcaacacctggcacaatgcttaataaatgttggtta1080
aatcttataatcattttctgtaggaagtgggacgacaaagttaagggtctaggtggtcag1140
agaagagcaaggactatgtcccttttttgtgcagccaggcaggccctgtactttttctct1200
gcgcgaccctcctcgggcagcaccgggtctcgaactctcacgccttactcccaagcaggt1260
tctgtagtccagcccccgcggctccctacagccagccgatgctgcgcaagcgccgtaccc1320
acgctttagcacatgcgtactcaggtgcgccggtaggggacgcgccggcacagcaaaa1378
<210>33
<211>159
<212>dna
<213>智人(homosapiens)
<400>33
acaaatcaaaggaaaagaaaccaagaactgaattactgtctgcccattcacatcccattc60
ctgccttttgcaatcatgaaacctgggaatccaaatagttggataacttagaataactaa120
gtttattaaattctagaaagatctcttttgtgccttact159
<210>34
<211>793
<212>dna
<213>智人(homosapiens)
<400>34
tttttgtattttttagtagagacggggtttcggcatgttgtccaggctggtctccaactc60
ctgacctcaggttatcctcccgcctcggcctcccagagtgctgggattacaggcgtgagc120
cactgcgcctggccagtagttgtactaacaagggtttctgcttgcgagcaacaaagactg180
actctagttgtggctaatttctttcacacacacatattaagtgccagaggtaggacttga240
gctcggatctctgatttccagacctagaactttttatgtgttattacagtcgttaaaaac300
cttacctggatttgtgctttgcaatttacgctttcgaacatgcaggaatgtagtttgggc360
atttgtctggaacttcggattctcgggactccagggtggccaaggcgcggaggtgactca420
atgacattgaccggcctggatgcacgtgggttgctgagccgatgctgggaaggtacgggg480
tttgcccggtgcaggccgccggaactcacgcacgcccctgtctctctcactcctggggtc540
ggctctggccggtggcctccagctcagctagcggccggacgcgcagcccgccgactagcc600
ctccaggtcctagcgcgactcccggatcccggatccggcggatctggccgaccactcacc660
ctcccctttccgcaagttagggggcggggcatcgggtttctggctcgtgatttgccggag720
ctcctgcgctccccttctccaccccctccggctgtgtgagaggtcagcagaggggcggtc780
tgcggggacaaca793
<210>35
<211>168
<212>dna
<213>智人(homosapiens)
<400>35
aggatttataacctttcagtcatcacccaatttaattagccatttgcatgatgctttcac60
acacaattgattcaagcattatacaggaacacccctgtgcagctacgtttacgtcgtcat120
ttattccacagagtcaagaccaatattctgccaaaaaatcaccaatgg168
<210>36
<211>468
<212>dna
<213>智人(homosapiens)
<400>36
gctggtcttgggctcctgggctcacctacctcggcctcagtcttgcctcttgatcaaatc60
actcatctctctgtgcttgatttacctcatctgtgaaatccagatagtaagctagtgcat120
ggtaagtgcaaaaagcaacacctggcacaatgcttaataaatgttggttaaatcttataa180
tcattttctgtaggaagtgggacgacaaagttaagggtctaggtggtcagagaagagcaa240
ggactatgtcccttttttgtgcagccaggcaggccctgtactttttctctgcgcgaccct300
cctcgggcagcaccgggtctcgaactctcacgccttactcccaagcaggttctgtagtcc360
agcccccgcggctccctacagccagccgatgctgcgcaagcgccgtacccacgctttagc420
acatgcgtactcaggtgcgccggtaggggacgcgccggcacagcaaaa468
<210>37
<211>102
<212>dna
<213>智人(homosapiens)
<400>37
acaaatcaaaggaaaagaaaccaagaactgaattactgtctgcccattcacatcccattc60
ctgccttttgcaatcatgaaacctgggaatccaaatagttgg102
<210>38
<211>3360
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:带有本源pccacdna序列的raav(dtc346)
<400>38
ttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcc60
cgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtg120
gccaactccatcactaggggttcctcgttacataacttacggtaaatggcccgcctggct180
gaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgc240
caatagggactttccattgacgtcaatgggtggactatttacggtaaactgcccacttgg300
cagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaat360
ggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtaca420
tctacgtattagtcatcgctattaccatgcgtcgaggtgagccccacgttctgcttcact480
ctccccatctcccccccctccccacccccaattttgtatttatttattttttaattattt540
tatgcagcgatgggggcggggggggggggggcgcgcgccaggcggggcggggcggggcga600
ggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccg660
aaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcg720
gcgggcggctctaaggtaaatataaaatttttaagtgtataatgtgttaaactactgatt780
ctaattgtttctctcttttagattccaacctttggaactgatgccgccaccatggcgggg840
ttctgggtcgggacagcaccgctggtcgctgccggacggcgtgggcggtggccgccgcag900
cagctgatgctgagcgcggcgctgcggaccctgaagcatgttctgtactattcaagacag960
tgcttaatggtgtcccgtaatcttggttcagtgggatatgatcctaatgaaaaaactttt1020
gataaaattcttgttgctaatagaggagaaattgcatgtcgggttattagaacttgcaag1080
aagatgggcattaagacagttgccatccacagtgatgttgatgctagttctgttcatgtg1140
aaaatggcggatgaggctgtctgtgttggcccagctcccaccagtaaaagctacctcaac1200
atggatgccatcatggaagccattaagaaaaccagggcccaagctgtacatccaggttat1260
ggattcctttcagaaaacaaagaatttgccagatgtttggcagcagaagatgtcgttttc1320
attggacctgacacacatgctattcaagccatgggcgacaagattgaaagcaaattatta1380
gctaagaaagcagaggttaatacaatccctggctttgatggagtagtcaaggatgcagaa1440
gaagctgtcagaattgcaagggaaattggctaccctgtcatgatcaaggcctcagcaggt1500
ggtggtgggaaaggcatgcgcattgcttgggatgatgaagagaccagggatggttttaga1560
ttgtcatctcaagaagctgcttctagttttggcgatgatagactactaatagaaaaattt1620
attgataatcctcgtcatatagaaatccaggttctaggtgataaacatgggaatgcttta1680
tggcttaatgaaagagagtgctcaattcagagaagaaatcagaaggtggtggaggaagca1740
ccaagcatttttttggatgcggagactcgaagagcgatgggagaacaagctgtagctctt1800
gccagagcagtaaaatattcctctgctgggaccgtggagttccttgtggactctaagaag1860
aatttttatttcttggaaatgaatacaagactccaggttgagcatcctgtcacagaatgc1920
attactggcctggacctagtccaggaaatgatccgtgttgctaagggctaccctctcagg1980
cacaaacaagctgatattcgcatcaacggctgggcagttgaatgtcgggtttatgctgag2040
gacccctacaagtcttttggtttaccatctattgggagattgtctcagtaccaagaaccg2100
ttacatctacctggtgtccgagtggacagtggcatccaaccaggaagtgatattagcatt2160
tattatgatcctatgatttcaaaactaatcacatatggctctgatagaactgaggcactg2220
aagagaatggcagatgcactggataactatgttattcgaggtgttacacataatattgca2280
ttacttcgagaggtgataatcaactcacgctttgtaaaaggagacatcagcactaaattt2340
ctctccgatgtgtatcctgatggcttcaaaggacacatgctaaccaagagtgagaagaac2400
cagttattggcaatagcatcatcattgtttgtggcattccagttaagagcacaacatttt2460
caagaaaattcaagaatgcctgttattaaaccagacatagccaactgggagctctcagta2520
aaattgcatgataaagttcataccgtagtagcatcaaacaatgggtcagtgttctcggtg2580
gaagttgatgggtcgaaactaaatgtgaccagcacgtggaacctggcttcgcccttattg2640
tctgtcagcgttgatggcactcagaggactgtccagtgtctttctcgagaagcaggtgga2700
aacatgagcattcagtttcttggtacagtgtacaaggtgaatatcttaaccagacttgcc2760
gcagaattgaacaaatttatgctggaaaaagtgactgaggacacaagcagtgttctgcgt2820
tccccgatgcccggagtggtggtggccgtctctgtcaagcctggagacgcggtagcagaa2880
ggtcaagaaatttgtgtgattgaagccatgaaaatgcagaatagtatgacagctgggaaa2940
actggcacggtgaaatctgtgcactgtcaagctggagacacagttggagaaggggatctg3000
ctcgtggagctggaatgaatccagacatgataagatacattgatgagtttggacaaacca3060
caactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttat3120
ttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgt3180
ttcaggttcagggggaggtgtgggaggttttttagaggaacccctagtgatggagttggc3240
cactccctctctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcg3300
ggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaa3360
<210>39
<211>2806
<212>dna
<213>人工序列
<220>
<223>人工序列的描述:带有本源pccbcdna序列的raav
<400>39
ttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcc60
cgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtg120
gccaactccatcactaggggttcctcgttacataacttacggtaaatggcccgcctggct180
gaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgc240
caatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttgg300
cagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaat360
ggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtaca420
tctacgtattagtcatcgctattaccatgtcgaggtgagccccacgttctgcttcactct480
ccccatctcccccccctccccacccccaattttgtatttatttattttttaattattttg540
tgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggcga600
ggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccg660
aaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcg720
gcgggcggctctaaggtaaatataaaatttttaagtgtataatgtgttaaactactgatt780
ctaattgtttctctcttttagattccaacctttggaactgatctcgaggccgccaccatg840
gcggcggcattacgggtggcggcggtcggggcaaggctcagcgttctggcgagcggtctc900
cgcgccgcggtccgcagcctttgcagccaggccacctctgttaacgaacgcatcgaaaac960
aagcgccggaccgcgctgctgggagggggccaacgccgtattgacgcgcagcacaagcga1020
ggaaagctaacagccagggagaggatcagtctcttgctggaccctggcagctttgttgag1080
agcgacatgtttgtggaacacagatgtgcagattttggaatggctgctgataagaataag1140
tttcctggagacagcgtggtcactggacgaggccgaatcaatggaagattggtttatgtc1200
ttcagtcaggattttacagtttttggaggcagtctgtcaggagcacatgcccaaaagatc1260
tgcaaaatcatggaccaggccataacggtgggggctccagtgattgggctgaatgactct1320
gggggagcacggatccaagaaggagtggagtctttggctggctatgcagacatctttctg1380
aggaatgttacggcatccggagtcatccctcagatttctctgatcatgggcccatgtgct1440
ggtggggccgtctactccccagccctaacagacttcacgttcatggtaaaggacacctcc1500
tacctgttcatcactggccctgatgttgtgaagtctgtcaccaatgaggatgttacccag1560
gaggagctcggtggtgccaagacccacaccaccatgtcaggtgtggcccacagagctttt1620
gaaaatgatgttgatgccttgtgtaatctccgggatttcttcaactacctgcccctgagc1680
agtcaggacccggctcccgtccgtgagtgccacgatcccagtgaccgtctggttcctgag1740
cttgacacaattgtccctttggaatcaaccaaagcctacaacatggtggacatcatacac1800
tctgttgttgatgagcgtgaattttttgagatcatgcccaattatgccaagaacatcatt1860
gttggttttgcaagaatgaatgggaggactgttggaattgttggcaaccaacctaaggtg1920
gcctcaggatgcttggatattaattcatctgtgaaaggggctcgttttgtcagattctgt1980
gatgcattcaatattccactcatcacttttgttgatgtccctggctttctacctggcaca2040
gcacaggaatacgggggcatcatccggcatggtgccaagcttctctacgcatttgctgag2100
gcaactgtacccaaagtcacagtcatcaccaggaaggcctatggaggtgcctatgatgtc2160
atgagctctaagcacctttgtggtgataccaactatgcctggcccaccgcagagattgca2220
gtcatgggagcaaagggcgctgtggagatcatcttcaaagggcatgagaatgtggaagct2280
gctcaggcagagtacatcgagaagtttgccaaccctttccctgcagcagtgcgagggttt2340
gtggatgacatcatccaaccttcttccacacgtgcccgaatctgctgtgacctggatgtc2400
ttggccagcaagaaggtacaacgtccttggagaaaacatgcaaatattccattgtaatct2460
agagatccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcag2520
tgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattata2580
agctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggg2640
gaggtgtgggaggttttttagaggaacccctagtgatggagttggccactccctctctgc2700
gcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttggtc2760
gcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaa2806