多重载体系统及其应用的制作方法

文档序号:13170314阅读:1009来源:国知局
多重载体系统及其应用的制作方法

本发明涉及构建体、载体、相应的宿主细胞和药物组合物,其允许有效的基因治疗,尤其是大于5kb的基因。

发明背景

许多遗传性视网膜变性(ird)的复明治疗仍是一项未满足的主要医疗需求。迄今,采用腺相关病毒(aav)载体的基因治疗代表着用于治疗许多ird的最具前景的方法。事实上,对于不同的ird进行的多年的临床前研究和大量的临床试验已经确定了aav高效地递送治疗基因至患病视网膜层[光感受器(pr)和视网膜色素上皮(rpe)]的能力1,2,并且已经强调了它们在人类情况中优良的安全和功效概况3-7。不过,将该成功扩大至其它致盲病症的障碍之一是aav载体的包装能力(约5kb)。这已成为对于因大于5kb(后文也称作大基因(largegene))的编码序列(cds)的基因中的突变所致的常规ird的基因替代治疗的开发的限制性因素。

因此,几年来,人们对增加aav的携带能力的策略的鉴定产生了浓厚的兴趣。二元aav载体,基于aav基因组通过分子间重组多连体化(concatamerize)的能力,已被成功地用于解决该问题14-16。二元aav载体通过将大转基因表达盒分裂成分开的两半来产生,所述两半各自包装在单一常规尺寸(ns;<5kb)aav载体中。全长表达盒的重建通过如下方式来实现:在相同细胞被两种二元aav载体共同感染之后,进行:i)这两种载体基因组的反向末端重复(itr)介导的尾-头(tail-to-head)连环化,之后剪接(二元aav反式剪接,ts)15,ii)这两种载体基因组中所含的重叠区域之间的同源重组(二元aav重叠,ov)15,iii)这两者的组合(二元aav杂合)16。发明人及他人已于近期显示了二元aav载体在视网膜中的潜力14,17-19。用于二元aav杂合载体的情况中的最常用的重组引发性区域衍生自人碱性磷酸酶cdna的中间三分之一的872bp序列,其已显示能提供高水平的二元aav杂合载体重建16。发明人显示,包括ak序列的二元aav杂合载体胜过包括正义碱性磷酸酶头区域序列14的那些,这些载体由发明人在ghosh等22的描述的基础上生成。额外的研究已显示该碱性磷酸酶区域的头或尾提供的转基因重建的水平与采用碱性磷酸酶cdna的全长中间三分之一所实现的那些22类似。发明人发现,二元aav反式剪接和杂合ak载体(其包含来自f1噬菌体的短ak重组引发性序列)能高效地转导小鼠和猪视网膜,并且援救小鼠斯特格氏病(stgd)和乌谢尔1b(ush1b)模型14,19。采用二元aavts和杂合ak载体实现的pr转导的水平导致ird小鼠模型的视网膜表型的显著改善,并且可能对治疗遗传性致盲病症有效。此外,具有来自血清型2和5的异源性itr(分别是itr2和itr5)的载体,其具有高度差异性(58%的同源性23),相较于具有同源itr的载体24,显示降低的形成环状单体的能力和增加的定向尾-头连环化。基于此,yan等已显示具有异源性itr2和itr5的二元aav载体能比具有同源itr的二元aav载体24,25更高效地重建转基因表达。

尽管这些研究强调了二元aav载体用于感兴趣的组织(例如视网膜)中的大基因重建的潜力,但人们也表示它们存在关键问题,这些问题需要在考虑该策略的进一步临床转化之前被解决。

来自5′半部载体(其包含启动子序列)和/或来自3′半部载体的截短蛋白产物的生成因为该itr的低启动子活性14,17,20,21而依然是与二元载体的应用相关联的一项主要问题。迄今为止尚未进行正式毒性研究以评价这些截短产物的体内的潜在不利作用,因此产生了安全方面的顾虑。因此,高度希望减少或消除它们的生成。因此,本发明的目的是解决与二元载体系统的应用相关联的这一主要问题。



技术实现要素:

本发明涉及构建体、载体、相应的宿主细胞和药物组合物,其允许有效的基因治疗,尤其是大于5kb的基因。

大基因包括,例如:

斯特格氏病(stgd1;mim#248200)是由abca4(cds:6822bp)中的突变所致的遗传性黄斑变性的最常见形式,该基因编码光感受器-特异性全反式视网膜转运体8,9。视锥-视杆营养不良3型、眼底黄色斑点症、衰老相关黄斑变性2型、早发重度视网膜营养不良和视网膜色素变性19型也与abca4突变相关(abca4相关疾病)。乌谢尔综合征ib型(ush1b;mim#276900)是由myo7a(cds:6648bp)10中的突变所致的耳聋和色素性视网膜炎的最严重组合形式,该基因编码在视网膜的pr和rpe中表达的基于肌动蛋白的传动器(motor)11-13

此外,许多其它遗传学疾病(不一定造成视网膜症状)也归因于大基因中的突变。这些包括,例如:因dmd中的突变所致的杜氏肌营养不良、因cftr中的突变所致的囊胞性纤维症、因f8中的突变所致的甲型血友病,和因dysf基因中的突变所致的dysferlin肌病。

具体地,本发明目的是,通过利用介导蛋白质降解或避免它们的翻译的信号(后文称作降解信号),减少与多重载体系统相关联(优选与多重病毒载体系统相关联)的截短蛋白产物的表达。降解信号此前从未被用于多重病毒载体。本发明中惊人地发现,当多重载体系统的至少一个载体中存在降解信号时,截短形式的蛋白质的表达显著减少,导致较高产量的全长蛋白质。

因此,本发明的第一方面提供载体系统,以在细胞中表达感兴趣的基因的编码序列,所述编码序列包含第一部分和第二部分,所述载体系统包含:

e)第一载体,其包含:

-所述编码序列的所述第一部分(cds1),

-第一重建序列;和

f)第二载体,其包含:

-所述编码序列的所述第二部分(cds2),

-第二重建序列,

其中,所述第一和第二重建序列选自下组:

i]第一重建序列由所述编码序列的所述第一部分的3'端组成,且第二重建序列由所述编码序列的所述第二部分的5'端组成,所述第一和第二重建序列是重叠序列;或

ii]第一重建序列包含剪接供体信号(sd),且第二重建序列包含剪接受体信号(sa),任选地,第一和第二重建序列各自之一还包含重组引发性序列,

其特征在于,第一和第二载体之一或两者还包含降解信号的核苷酸序列,所述序列在i)的情况中位于cds1的3'端和/或cds2的5'端,而在ii)的情况中位于相对于sd的3'位置中和/或相对于sa的5'位置中。

优选第一和第二载体两者还包含所述降解信号的核苷酸序列,其中,第一载体中的降解信号的核苷酸序列与第二载体中的相同或不同。

优选第一重建序列在相对于所述sd的3'位置中包含剪接供体信号(sd)和重组引发性区域,第二重建序列在相对于所述sa的5'位置中包含剪接受体信号(sa)和重组引发性序列;其中所述降解信号的核苷酸序列位于第一和第二载体之一或两者的重组引发性区域的核苷酸序列的5'端和/或3'端处。

优选所述降解信号的核苷酸序列选自:一种或多种蛋白质泛素化信号、一种或多种微小rna靶序列,和/或一种或多种人工终止密码子。

优选所述降解信号的核苷酸序列包含或由如下部分组成:编码选自cl1seqidno.1、cl2seqidno.2、cl6seqidno.3、cl9seqidno.4、cl10seqidno.5、cl11seqidno.6、cl12seqidno.7、cl15seqidno.8、cl16seqidno.9、sl17seqidno.10,或pb29(seqidno.14或seqidno.15)的序列的序列;或者,其中所述降解信号的核苷酸序列包含或由如下部分组成:选自mir-204seqidno.11、mir-124seqidno.12或mir-26aseqidno.13的序列。

优选第一载体的降解信号的核苷酸序列包含或由如下部分组成:编码cl1seqidno.1的序列,或包含或由如下部分组成:seqidno.16,或包含或由如下部分组成:mir-204seqidno.11和mir-124seqidno.12,优选包含三个拷贝的mir204seqidno.11和三个拷贝的mir124seqidno.12,或包含或由如下部分组成:mir-26aseqidno.13,优选包含四个拷贝的mir-26aseqidno.13。

优选第二载体的降解信号的核苷酸序列包含或由如下部分组成:编码pb29(seqidno.14或seqidno.15)的序列,或包含或由如下部分组成:seqidno.19或seqidno.20,优选第二载体的降解信号包含或由如下部分组成:编码三个拷贝的seqidno.14或seqidno.15的pb29的序列。

优选第一载体还包含操作性地连接至所述编码序列的所述第一部分(cds1)的5'端部分的启动子序列。

优选第一载体和第二载体两者还包含5'末端重复(5'-tr)核苷酸序列和3'末端重复(3'-tr)核苷酸序列,优选所述5'-tr是5'-反向末端重复(5'-itr)核苷酸序列并且所述3'-tr是3'-反向末端重复(3'-itr)核苷酸序列,优选所述itr衍生自相同病毒血清型或衍生自不同的病毒血清型,优选所述病毒是aav。

优选所述重组引发性序列选自下组:akgggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaat(seqidno.22)或

gggatttttccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaat(seqidno.23)、ap1(seqidno.24)、ap2(seqidno.25)和ap(seqidno.26)。

优选所述编码序列在天然外显子-外显子接合部分处被分成第一部分和第二部分。

优选所述剪接供体信号包含或基本由如下部分组成:与gtaagtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgagacagagaagactcttgcgtttct(seqidno.27)至少70%、75%、80%、85%、90%、95%或100%相同的序列。

优选所述剪接受体信号包含或基本由如下部分组成:与gataggcacctattggtcttactgacatccactttgcctttctctccacag(seqidno.28)至少70%、75%、80%、85%、90%、95%或100%相同的序列。

优选第一载体还包含至少一个增强子核苷酸序列,其操作性地连接至所述编码序列。

优选所述编码序列编码能够纠正视网膜变性的蛋白质。

优选所述编码序列编码能够纠正杜氏肌营养不良、囊胞性纤维症、甲型血友病和dysferlin肌病的蛋白质。

在视网膜降解的情况中,优选所述编码序列是选自下组的基因的编码序列:abca4、myo7a、cep290、cdh23、eys、pcdh15、cacna1、snrnp200、rp1、prpf8、rp1l1、alms1、ush2a、gpr98、hmcn1。

在杜氏肌营养不良、囊胞性纤维症、甲型血友病和dysferlin肌病的情况中,优选所述编码序列是选自下组的基因的编码序列:dmd、cftr、f8和dysf。

优选第一载体不包含聚腺苷酸化信号核苷酸序列。

优选所述载体系统包含:

e)第一载体,其以5'-3'方向包含:

-5'反向末端重复(5'-itr)序列;

-启动子序列;

-感兴趣的基因的编码序列的5'端部分(cds1),所述5'端部分操作性地连接至并受控于所述启动子;

-剪接供体信号的核苷酸序列;

-重组引发性区域的核苷酸序列;和

-3'反向末端重复(3'-itr)序列;以及

f)第二载体,其以5'-3'方向包含:

-5'反向末端重复(5'-itr)序列;

-重组引发性区域的核苷酸序列;

-剪接受体信号的核苷酸序列;

-所述编码序列的3'端(cds2);

-聚腺苷酰化信号核苷酸序列;以及

-3’反向末端重复(3’-itr)序列,

其特征在于,还包含降解信号的核苷酸序列,所述序列位于第一和第二载体之一或两者的重组引发性区域的核苷酸序列的5'端或3'端。

优选地,本发明的载体中,所述第一和第二载体独立地是病毒载体,优选腺病毒载体或腺相关病毒(aav)载体,优选所述第一和第二腺相关病毒(aav)载体选自相同或不同的aav血清型,优选所述腺相关病毒选自血清型2、血清型8、血清型5、血清型7或血清型9。

优选地,本发明的载体系统还包含第三载体,其包含所述编码序列的第三部分(cds3)和重建序列,其中第二载体包含两个重建序列,各重建序列位于cds2的各端。

优选地,第一载体的重建序列由cds1的3'端组成,第二载体的两个重建序列各自分别由cds2的5'端和3'端组成,第三载体的重建序列由cds3的5'端组成;

其中,由cds2的5'端组成的第二载体的所述重建序列和第一载体的所述重建序列是重叠序列,并且

其中,由cds2的3'端组成的第二载体的所述重建序列和所述第三载体的所述重建序列是重叠序列;

其中,所述第二载体还包含降解信号,所述降解信号位于cds2的5'端和/或3'端。

优选地,所述第三载体还包含降解信号的至少一个核苷酸序列。

优选地,第二载体还包含连接至所述编码序列的3'端部分(cds2)的聚腺苷酸化信号核苷酸序列。

本发明提供宿主细胞,其用如上定义的载体系统转化。

优选地,本发明的载体系统或宿主细胞用于医学应用。优选用于基因治疗。优选用于治疗和/或预防以视网膜变性为特征的病理状态或疾病,或用于预防和/或治疗杜氏肌营养不良、囊胞性纤维症、甲型血友病和dysferlin肌病。

优选地,该视网膜变性是遗传性的。

优选地,所述病理状态或疾病选自下组:色素性视网膜炎(rp)、莱伯氏先天性黑蒙(lca)、斯特格氏病(stgd)、阿瑟氏病(ush)、阿尔斯特雷姆综合征、先天性静止性夜盲(csnb)、黄斑营养不良、隐匿性黄斑营养不良、由abca4基因中的突变所致的疾病。

本发明提供药物组合物,其包含如上定义的载体系统或宿主细胞,和药学上可接受的载剂。

本发明提供治疗和/或预防以视网膜变性为特征的病理状态或疾病的方法,其包括,给予有此需要的对象有效量的如上定义的载体系统、宿主细胞或药物组合物。

本发明提供治疗和/或预防杜氏肌营养不良、囊胞性纤维症、甲型血友病或dysferlin肌病的方法,其包括,给予有此需要的对象有效量的如上定义的载体系统、宿主细胞或药物组合物。

本发明提供降解信号的核苷酸序列在载体系统的应用,以减少截短形式的蛋白质的表达。

本发明提供减少截短形式的蛋白质的表达的方法,其包括,在载体系统的一个或多个载体中插入降解信号的核苷酸序列。

根据本发明的优选实施方式,在细胞中表达感兴趣的基因的编码序列的载体系统包含两种载体,各载体包含所述编码序列的不同的部分和重建序列;优选地,第一载体的重建序列是包含剪接供体的序列,而第二载体的重建序列是包含剪接受体的序列。

根据本发明的更优选的实施方式,在细胞中表达感兴趣的基因的编码序列的载体系统包含三种载体,各载体包含所述编码序列的不同的部分和至少一个重建序列;优选地,第一载体包含,在相对于所述编码序列的第一部分的3'位置中包含剪接供体的重建序列,第二载体包含,在相对于第二部分编码序列的5'位置中包含剪接受体的重建序列和在相对于所述编码序列的第二部分的3'位置中包含剪接供体的重建序列,第三载体包含,在相对于第三部分编码序列的5'位置中包含剪接受体的重建序列。

优选地,第一和第二载体的重建序列或第一、第二和第三载体的重建序列还包含重组引发性区域,优选位于相对于剪接供体的3'位置中和相对于剪接受体的5'位置中。

本发明的载体系统的载体之一或两种或全部还包含降解信号的核苷酸序列。

优选地,第一载体包含降解信号。优选地,第二载体包含降解信号。

根据本发明的优选实施方式,其中,所述载体包含重建序列,所述重组序列包含重组引发性区域,一种位于所述重组引发性区域的序列的5'端或3'端处的降解信号。

根据本发明的优选实施方式,在细胞中表达感兴趣的基因的编码序列的载体系统包含两种载体;所述载体系统的第一载体以5'-3'方向包含:

-感兴趣的基因的编码序列的5'端部分,

-剪接供体信号的核酸序列,

-重组引发性区域的核酸序列,和

-降解信号的核酸序列。

根据本发明的优选实施方式,在细胞中表达感兴趣的基因的编码序列的载体系统包含两种载体,所述载体系统的第二载体以5'-3'方向包含:

-所述重组引发性区域的核酸序列,

-所述降解信号的核酸序列,

-所述剪接受体信号的核酸序列,和

-感兴趣的基因的编码序列的3'端部分。

优选地,本发明的载体系统的第一载体还包含启动子序列,更优选所述启动子序列操作性地连接至感兴趣的基因的编码序列的第一部分的5'端。

优选地,由两种载体组成的载体系统的第二载体还包含聚腺苷酸化信号核酸序列,更优选所述聚腺苷酸化信号核酸序列连接至感兴趣的基因的编码序列的第二部分的3'端。优选地,本发明的载体系统的第一载体不包含聚腺苷酸化信号核酸序列。

优选地,由三种载体组成的载体系统的第三载体还包含聚腺苷酸化信号核酸序列,更优选所述聚腺苷酸化信号核酸序列连接至感兴趣的基因的编码序列的第三部分的3'端。

优选地,本发明的载体系统的载体中的至少一种,更优选本发明的载体系统的第一载体,包含如下序列的降解信号,所述序列包含或由如下部分组成:编码cl1seqidno.1的序列;优选地,所述编码cl1seqidno.1的序列包含或由如下部分组成:seqidno.16。

优选地,本发明的载体系统的载体中的至少一种,更优选本发明的载体系统的第一载体,包含如下序列的降解信号,所述序列包含mir-204seqidno.11和mir-124seqidno.12,更优选三个拷贝的mir204seqidno.11和三个拷贝的mir124seqidno.12;优选mir204序列和mir124序列,和/或,mir204序列和mir124序列的各个拷贝通过至少1个、至少2个、至少3个、至少4个核苷酸的接头序列连接。

优选地,本发明的载体系统的载体中的至少一种,更优选本发明的载体系统的第一载体,包含如下序列的降解信号,所述序列包含或由如下部分组成:mir-26aseqidno.13,更优选包含四个拷贝的mir-26aseqidno.13。

优选地,本发明的载体系统的载体中的至少一种,更优选本发明的载体系统的第二载体,包含如下序列的降解信号,所述序列包含或由如下部分组成:编码pb29(seqidno.14或seqidno.15)的序列;优选地,所述编码pb29的序列包含或由如下部分组成:seqidno.19或seqidno.20;更优选地,序列的所述降解信号包含或由如下部分组成:编码seqidno.14或seqidno.15的三个拷贝的pb29的序列。

根据本发明的优选实施方式,所述载体系统包含:

a)第一载体,其以5'-3'方向包含:

-5'反向末端重复(5'-itr)序列;

-启动子序列;

-感兴趣的基因的编码序列的第一部分,优选是所述编码序列的5'端部分,优选所述第一部分操作性地连接至并受控于所述启动子;

-剪接供体信号的核酸序列;

-重组引发性区域的核酸序列;和

-3'反向末端重复(3'-itr)序列;以及

b)第二载体,其以5'-3'方向包含:

-5'反向末端重复(5'-itr)序列;

-重组引发性区域的核酸序列;

-剪接受体信号的核酸序列;

-感兴趣的基因的编码序列的第二部分,优选是所述编码序列的3'端部分;

-聚腺苷酰化信号核酸序列;以及

-3'反向末端重复(3'-itr)序列,

所述第一和/或第二载体还包含降解信号的核酸序列,所述序列位于所述重组引发性区域的核酸序列的5'端或3'端。

根据本发明的更优选的实施方式,所述载体系统包含:

a)第一载体,其以5'-3'方向包含:

-5'反向末端重复(5'-itr)序列;

-启动子序列;

-感兴趣的基因的编码序列的第一部分,其优选操作性地连接至并受控于所述启动子;

-剪接供体信号的核酸序列;

-重组引发性区域的核酸序列;和

-3'反向末端重复(3'-itr)序列;

b)第二载体,其以5'-3'方向包含:

-5'反向末端重复(5'-itr)序列;

-重组引发性区域的核酸序列;

-剪接受体信号的核酸序列;

-感兴趣的基因的编码序列的第二部分;

-剪接供体信号的核酸序列;

-重组引发性区域的核酸序列;

-3'反向末端重复(3'-itr)序列;以及

c)第三载体,其以5'-3'方向包含:

-5'反向末端重复(5'-itr)序列;

-重组引发性区域的核酸序列;

-剪接受体信号的核酸序列;

-感兴趣的基因的编码序列的第三部分;

-聚腺苷酰化信号核酸序列;以及

-3'反向末端重复(3'-itr)序列,

所述第一和/或第二和/或第三载体还包含降解信号的核酸序列,所述序列位于一个或多个重组引发性区域的核酸序列的5'端或3'端。

优选地,所述病理状态或疾病选自:乌谢尔1f型(ush1f)、先天性静止性夜盲(csnb2)、常染色体显性(ad)和/或常染色体隐性(ar)色素性视网膜炎(rp)、ush1b、stgd1、莱伯氏先天性黑蒙10型(lca10)、rp、乌谢尔1d型(ush1d)、乌谢尔2a型(ush2a)、常染色体显性黄斑营养不良、乌谢尔2c型(ush2c)、隐匿性黄斑营养不良、阿尔斯特雷姆综合征。

本发明中,载体系统表示构建体系统、质粒系统以及病毒颗粒。

本发明中,所述构建体或载体系统可包括多于两种载体。

具体地,所述构建体系统可包括第三载体,其包含感兴趣的序列的第三部分。

本发明中,在不同的(2、3或更多)载体被引入细胞时,重建或获得全长编码序列。

所述编码序列可一分为二。这些部分的长度可以相等或不同。当所述载体系统的载体被引入细胞时,获得全长编码序列。第一部分可以是所述编码序列的5'端部分。第二部分可以是所述编码序列的3'端。此外,所述编码序列可被分成三个部分。这些部分的长度可以相等或不同。当所述载体系统的载体被引入细胞时,获得全长编码序列。第一部分是编码序列的5'端部分,第二部分是所述编码序列的中间部分,第三部分是编码序列的3'部分。

本发明中,所述细胞优选是哺乳动物细胞,优选人细胞。

本发明中,所述载体中的任何一种中的一个降解信号的存在足以减少截短形式的蛋白质的生成。

术语降解信号表示(核苷酸或氨基酸的)序列,它可介导包含它的mrna/蛋白质的降解。

术语“截短形式的蛋白质”或“截短蛋白”是这样的蛋白质,它不以其全长形式产生,因为它存在从单个氨基酸到多个(例如1-10、1-20、1-50、100、200个等)氨基酸的缺失。

本发明中,“重建序列”是这样的序列,它允许重建具有正确框(correctframe)的全长编码序列,因此允许功能蛋白的表达。

术语“剪接供体/受体信号”表示mrna的剪接中涉及的核苷酸序列。

本发明中,可采用来自任何内含子的任何剪接供体或受体信号序列。本领域技术人员知晓如何通过常规实验识别并选择合适的剪接供体或受体信号序列。

本发明中,如果两种序列各自的至少一部分是彼此同源的,那么这两种序列是重叠的。所述序列可以重叠至少1个、至少2个、至少5个、至少10个、至少20个、至少50个、至少100个、至少200个核苷酸。

术语“重组引发性区域或序列”表示这样的序列,其介导两种不同的序列之间的重组。“重组引发性区域或序列”和“同源区域”在本文中可互换使用。

术语“末端重复”表示这样的序列,其在核苷酸序列的两端重复。

术语“反向末端重复”表示这样的序列,其在核苷酸序列的两端以相反方向(反向互补)重复。

蛋白质泛素化信号是通过蛋白酶体介导蛋白质降解的信号。

本发明中,如果降解信号包含重复序列(是相同序列或不同序列),则所述重复序列优选通过至少1个核苷酸的接头连接。

人工终止密码子是故意包括在转录本中以诱导蛋白质翻译的过早终止的核苷酸序列。

增强子序列是增加基因的转录的序列。

根据本发明,合适的降解信号包括:(i)短降解决定子cl1,一种c末端失稳肽,其与错误折叠的蛋白质共有结构相似性,因此被泛素化系统识别31,32,(ii)泛素,其在供体蛋白质的n末端的融合介导直接蛋白质降解或通过n端规则途径的降解33,34,和(iii)n末端pb29降解决定子,其是9个氨基酸长的肽,其与cl1降解决定子相似,预期能在被泛素化途径的酶识别的结构中折叠35。发明人发现,在多重载体系统中纳入降解序列或信号能减少截短蛋白的表达。在一个实例中,发明人发现,包括cl1降解信号能导致从5'半部的截短蛋白的选择性降解,而不影响体外和大猪视网膜中的全长蛋白质生成。

此外,可插入人工终止密码子以造成mrna的早期终止。

微小rna(mir)靶序列,人工终止密码子或蛋白质泛素化信号可用于介导截短蛋白产物的降解。本发明中,降解信号序列可包含重复序列,例如多于一种微小rna(mir)靶序列、人工终止密码子或蛋白质泛素化信号,所述重复序列是重复至少两次的相同序列或不同序列;优选地,所述重复序列通过至少1个核苷酸的接头连接。

在视网膜中表达的mir中,mir-let7b或-26a以高水平表达26-29,而mir-204和-124已显示将aav-介导的转基因表达限制到rpe或光感受器30。karali等30测试了mir靶位点在调控特异性细胞类型中的单一aav载体中包括的基因的表达的功效。在karali等中,mir靶位点包括在典型表达盒(编码整个报告基因)中,编码序列的下游,并且在聚腺苷酸化信号(polya)之前。karali等采用针对mir-204或mir-124的mir靶位点,并且采用4个串联拷贝的各mir。

本发明中mir还可以是mir模拟物(xiao等.jcellphysiol212:285-292,2007;wangzmethodsmolbiol676:211-223,2011)。发明人首次将这些策略应用于多重载体构建体,并且能够使从所述载体产生的截短蛋白的表达沉默。

在过去的十年间,已在数以百计的临床试验中将基因治疗应用于治疗疾病。已开发不同的工具用于将基因递送进入人细胞。本发明中,可将递送载剂给予患者。本领域技术人员能够确定适当的给药范围。术语“给予”包括通过病毒或非病毒技术递送。非病毒递送机制包括但不限于脂质介导的转染、脂质体、免疫脂质体、脂质体转染试剂、阳离子表面两亲物(cfa)及其组合。病毒递送中,遗传学工程改造的病毒,包括腺相关病毒,是目前用于基因递送的最广泛应用的工具之一。基于病毒的基因递送的概念是对病毒进行工程改造以使其表达感兴趣的基因或调控序列例如启动子和内含子。取决于具体应用和病毒类型,大多数病毒载体含有阻碍其在宿主中像野生型病毒那样自由复制的能力的突变。已对来自若干不同家族的病毒进行修饰以生成用于基因递送的病毒载体。这些病毒包括逆转录病毒、慢病毒、腺病毒、腺相关病毒、疱疹病毒、杆状病毒、小核糖核酸病毒和α病毒。本发明优选使用腺相关病毒。大多数系统含有能够容纳感兴趣的基因的载体和辅助细胞,这些辅助细胞可提供病毒结构蛋白和酶以允许生成含有载体的感染性病毒颗粒。腺相关病毒是一种病毒家族,其在核苷酸和氨基酸序列、基因组结构、致病性和宿主范围方面存在差异。该多样性提供了使用具有不同生物学性质的病毒来开发不同的治疗性应用的机会。如同使用任何递送工具那样,效率、靶向特定组织或细胞类型的能力、感兴趣的基因的表达以及基于腺相关病毒的系统的安全性对于基因治疗的成功应用至关重要。近年来已在这些研究领域做出了众多尝试。已对基于腺相关病毒的载体和辅助细胞进行了多种修饰以改变基因表达、靶向递送、改善病毒效价并提高安全性。本发明代表了该设计过程的改进,其中其作用是向这类病毒载体有效地递送感兴趣的基因。

理想的用于基因递送的基于腺相关病毒的载体必须是高效、细胞特异性、受调控和安全的。递送效率是重要的,因为其可决定治疗的效力。目前的努力旨在使用腺相关病毒载体实现细胞类型特异性感染和基因表达。此外,腺相关病毒载体正在被开发用于调控感兴趣基因的表达,因为治疗可能需要长时间或受调控的表达。安全性是病毒基因递送的一个重要问题,因为大多数病毒是病原体或具有致病潜力。重要的是,在基因递送期间,患者还不会不经意地接受具有全复制潜能的致病性病毒。

腺相关病毒(aav)是一种感染人和一些其他灵长类物种的小病毒。目前已知aav不会导致疾病,因此该病毒导致非常轻度的免疫应答。使用aav的基因治疗载体可感染分裂和静止的细胞,并维持在染色体外状态且不整合至宿主细胞的基因组中。这些特征使得aav是一种建立用于基因治疗的病毒载体和建立同基因人疾病模型的非常有吸引力的候选物。

因为多种特征,野生型aav吸引了基因治疗研究者的大量兴趣。其中最主要的是该病毒明显缺少致病性。其还可感染非分裂细胞并能够在人染色体19的特定位点处(命名为aavs1)稳定整合至宿主细胞基因组中。该特征使其与逆转录病毒相比更具可预测性,所述逆转录病毒代表了随机插入和诱变的威胁,这之后有时会发生癌症。aav基因组最频繁地整合至上述位点,而向基因组的随机整合以可忽略的频率发生。然而,开发aav作为基因治疗载体已通过从载体的dna上除去rep和cap消除了这种整合能力。所需基因以及驱动该基因表达的启动子被插入itr之间,所述反向末端重复辅助在通过宿主细胞dna聚合酶复合物将单链载体dna转化为双链dna后在核中形成多联体(concatamer)。基于aav的基因治疗载体在宿主细胞核中形成附加型多联体。在非分裂细胞中,这些多联体在宿主细胞生命期间维持完整。在分裂细胞中,aavdna通过细胞分裂而丢失,因为附加型dna不会随宿主细胞dna复制。aavdna向宿主基因组中的随机整合是可检测的,但以非常低的频率发生。aav还具有非常低的免疫原性,似乎限于生成中和抗体,而其不诱导清楚界定的细胞毒性应答。该特征以及感染静止细胞的能力使其在用于人基因治疗的载体方面优于腺病毒。

aav基因组、转录组和蛋白质组

aav基因组由长度约4.7千碱基的正义或反义的单链脱氧核糖核酸(ssdna)构成。该基因组包含位于dna链两端的反向末端重复(itr)以及两个开放阅读框(orf):rep和cap。前者由编码aav生命周期所需的rep蛋白的四个重叠基因组成,且后者含有衣壳蛋白的重叠核苷酸序列:vp1、vp2和vp3,其相互作用以形成二十四面对称的衣壳。

itr序列

反向末端重复(itr)序列的名称来源于它们的对称性,所述对称性显示是aav基因组的高效增加所需的。这些序列的另一个性质是其形成发卡结构的能力,所述发卡结构有助于所谓自启效应(self-priming),其允许第二dna链的引发酶非依赖性合成。这些itr还显示是aavdna整合至宿主细胞基因组(人的第19号染色体)并从中拯救以及aavdna的有效衣壳化和生成完全组装且脱氧核酸酶耐受性aav颗粒所必需的。

对于基因治疗,itr似乎是与治疗性基因顺式相邻所需的唯一序列:结构(cap)和包装(rep)基因可反式递送。在该假定下,建立了许多方法以有效生成含有报告基因或治疗性基因的重组aav(raav)载体。然而,还公开了itr不是顺式有效复制和衣壳化所需的唯一元件。一些研究组鉴定到了rep基因编码序列内命名为顺式作用rep依赖性元件(care)的序列。care被证明在顺式情况下增加复制和衣壳化。

截至2006年已描述了11种aav血清型,2004年时描述了第11种。所有已知的血清型都可感染来自多种不同组织类型的细胞。通过衣壳血清型确定组织特异性且假型化aav载体以改变其向性范围对其在治疗中的应用可能是重要的。

用于本发明的aav载体系统的反向末端重复(itr)序列可以是任何aavitr。用于aav载体的itr可以是相同或不同的。例如,载体可包含aav血清型2的itr和aav血清型5的itr。在本发明的载体的一个实施方式中,itr来自aav血清型2、4、5或8。在本发明中,优选aav血清型2和血清型5的itr。aavitr序列是本领域熟知的(例如,对于itr2,参见genbank登录号af043303.1;nc_001401.2;j01901.1;jn898962.1;对于itr5,参见genbank登录号nc_006152.1)。

血清型2

迄今为止,血清型2(aav2)被研究得最为透彻。aav2对于骨骼肌、神经元、血管平滑肌细胞和肝细胞具有天然向性。

已描述了三种针对aav2的细胞受体:硫酸乙酰肝素蛋白多糖(hspg)、avβ5整联蛋白和成纤维细胞生长因子受体1(fgfr-1)。第一种的功能是主要受体,而后两种具有共受体活性并能够使aav通过受体介导的胞吞作用进入细胞。这些研究结果受到了qiu,handa等的怀疑。hspg的功能是主要受体,但其在胞外基质中的丰度可清除aav颗粒并损伤感染效率。

血清型2和癌症

研究证明,该病毒的血清型2(aav-2)明显杀伤癌细胞而不损害健康细胞。“我们的结果表明,感染大部分群体但不具有已知疾病作用的2型腺相关病毒杀伤多种类型的癌细胞但对健康细胞没有影响”,宾夕法尼亚州的宾州州立大学医学院的免疫学和微生物学教授craigmeyers说。这可导向新的抗癌试剂。

其他血清型

虽然aav2是多种基于aav2的研究中最常用的血清型,但也证明其他血清型可更有效地作为基因递送载体。例如,aav在感染气道上皮细胞中似乎更好,aav7对鼠骨骼肌细胞具有非常高的转导率(类似于aav1和aav5),aav8最适合转导肝细胞和光感受器,且aav1和5显示在向血管内皮细胞的基因递送中非常有效。在脑中,大多数aav血清型显示神经元向性,而aav5还能转导星形细胞。aav1和aav2的杂合体aav6还显示比aav2低的免疫原性。

各血清型的不同之处可在于其结合的受体。例如,aav4和aav5转导可被可溶性唾液酸抑制(对于各种这类血清型有不同的形式),且aav5显示通过血细胞衍生的生长因子受体进入细胞。

本发明还涉及病毒载体系统,其包含本发明的多核苷酸、表达构建体,或载体构建体。在一个实施方式中,所述病毒载体系统是aav系统。制备包含异源性多核苷酸的病毒和病毒粒或构建体的方法是本领域已知的。对于aav,细胞可用腺病毒或包含适于aav辅助功能的腺病毒基因的多核苷酸构建体共同感染或转染。材料和方法的示例描述于,例如,美国专利号8,137,962和6,967,018。本发明的aav病毒或aav载体可以是任何aav血清型,包括但不限于,血清型aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aav9、aav10和aav11。在具体实施方式中,采用aav2或aav5或aav7或aav8或aav9血清型。在一个实施方式中,aav血清型在衣壳表面上提供一个或多个酪氨酸-苯丙氨酸(y-f)突变。在具体实施方式中,aav是aav8血清型,其具有位置733处的酪氨酸-苯丙氨酸突变(y733f)。

通过本发明所述载体系统递送一种或多种治疗基因或调控序列例如启动子或内含子可单独使用或与其他治疗或治疗组分联用。

本发明还涉及宿主细胞,其包含本发明的构建体系统或病毒载体系统。该宿主细胞可以是培养的细胞或原代细胞,即直接从生物体(如人)中分离。该宿主细胞可以是粘附性细胞或悬浮的细胞,即悬液形式生长的细胞。合适的宿主细胞是本领域已知的且包括例如dh5α、大肠杆菌细胞、中华仓鼠卵巢细胞、猴vero细胞、cos细胞、hek293细胞等。细胞可以是人细胞或来自其它动物。在一个实施方式中,所述细胞是光感受器细胞或rpe细胞。在具体实施方式中,所述细胞是视锥细胞。所述细胞还可以是肌细胞,具体地,骨骼肌细胞,肺细胞,胰腺细胞,肝细胞,肾细胞,肠细胞,血液细胞。在具体实施方式中,所述细胞是人视锥细胞或视杆细胞。本领域技术人员根据本文教导能够选择合适的宿主。优选地,所述宿主细胞是动物细胞,且更优选是人细胞。所述细胞可表达在本发明的病毒载体系统中提供的核苷酸序列。

本领域技术人员应理解将多核苷酸或载体整合至宿主细胞内的标准方法,例如转染、脂质转染、电穿孔、微注射、病毒感染、热击、转化(细胞融合或细胞膜的化学通透后)。本发明的构建体或载体系统还可以裸dna的形式被引入体内,所述引入采用本领域已知的方法进行,例如转染、微注射、电穿孔、磷酸钙沉淀和通过基因枪方法。

本文中,术语“宿主细胞或遗传工程改造的宿主细胞”指使用本发明的构建体系统或使用本发明的病毒载体系统转导、转化或转染的宿主细胞。

本文所用的术语"核酸"和"多核苷酸序列"和“构建体”指,单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,除非另有限制,其将涵盖能够以与天然产生的核苷酸相似的方式行使功能的天然核苷酸的已知类似物。所述多核苷酸序列包括全长序列以及源自全长序列的较短序列。应理解,具体多核苷酸序列包括一种或多种原始序列的简并密码子,其可被引入以在特异性宿主细胞中提供密码子偏好。落入本发明范围内的多核苷酸序列还包括这样的序列,其与编码本发明的肽的序列特异性地杂交。所述多核苷酸包括正义和反义链,以个体链或以双链体的形式。

本发明还设想这样的多核苷酸分子,它们具有与本发明的多核苷酸序列充分同源的序列,从而允许在标准严格条件下采用标准方法与该序列杂交(maniatis,t.等,1982)。

本发明还涉及构建体系统,其可包括在其中表达所述构建体的目标宿主细胞中行使功能的调节元件。本领域普通技术人员可选择用于合适的宿主细胞(例如,哺乳动物或人宿主细胞)的调节元件。调节元件包括,例如,启动子、转录终止序列、翻译终止序列、增强子、信号肽、降解信号和聚腺苷酸化元件。本发明的构建体可包含操作性地连接至编码所需的多肽的核苷酸序列的启动子序列。

设想用于本发明中的启动子包括但不限于,原始基因启动子、巨细胞病毒(cmv)启动子(kf853603.1,bp149-735)、嵌合cmv/鸡β肌动蛋白启动子(cba)和截短形式的cba(smcba)启动子(us8298818和“用aavgc1处理的产后鸟苷酸环化酶-1敲出小鼠视网膜的视椎中的光驱动视锥抑制蛋白的易位(light-drivenconearrestintranslocationinconesofpostnatalguanylatecyclase-1knockoutmouseretinatreatedwithaavgc1)”)、视紫红质启动子(ng_009115,bp4205-5010)、光感受器间类视黄醇结合蛋白质启动子(ng_029718.1,bp4777-5011)、卵黄状黄斑营养不良2启动子(ng_009033.1,bp4870-5470)、pr-特异性人g蛋白质偶联受体激酶1(hgrk1;ay327580.1bp1793-2087或bp1793-1991)(haire等.2006;美国专利号8,298,818)。但可以使用本领域已知的任何合适启动子。在具体实施方式中,启动子是cmv或hgrk1启动子。在一个实施方式中,启动子是组织-特异性启动子,其在一种或一组组织中显示选择性活性,但在其它组织中显示低活性或无活性。在一个实施方式中,该启动子是光感受器特异性启动子。在另一个实施方式中,所述启动子是视锥细胞-特异性和/或视杆细胞-特异性启动子。

优选的启动子是cmv、grk1、cba和irbp启动子。更优选的启动子是杂合启动子,其组合了来自不同的启动子的调节元件(例如,嵌合cba启动子,其组合了来自cmv启动子的增强子、cba启动子和sv40嵌合内含子,本文中称为cba杂合启动子。

可采用本领域已知的标准技术将启动子纳入构建体。多重拷贝的启动子或多重启动子可用于本发明的载体。在一个实施方式中,所述启动子的定位与转录起始位点的距离可以与其在其天然遗传学环境中与转录起始位点的距离大约相同。允许该距离上存在一些变化而不显著减少启动子活性。在本发明的系统中,转录起始位点通常包括在5'构建体中,但不在3'构建体中。在另一个实施方式中,转录起始位点可包括在降解信号上游的3'构建体中。

本发明的构建体可任选地包含转录终止序列、翻译终止序列、信号肽序列、内部核糖体进入位点(ires)、增强子元件,和/或转录后调节元件例如土拨鼠肝炎病毒(whv)转录后调节元件(wpre)。转录终止区域通常可获自真核或病毒基因序列的3'未翻译区域。转录终止序列可定位于编码序列下游以提供高效终止。在本发明的系统中,转录终止位点通常包括在3'构建体中但不在5'构建体中。

信号肽序列是编码与将操作性连接至广泛多种翻译后细胞目的地(从特定细胞器区室到蛋白质作用和胞外环境位点)的多肽的重新定位相关联的信息的氨基末端序列。增强子是顺式作用元件,其增加基因转录,从而也可被包括在载体中。增强子元件是本领域已知的,并且包括但不限于,camv35s增强子元件、巨细胞病毒(cmv)早期启动子增强子元件,和sv40增强子元件。引导由结构基因编码的mrna的聚腺苷酸化的dna序列也可被包括在载体中。

优选地,在本发明中,该编码序列在天然的外显子-外显子连接点处被分为第一和第二片段或部分(5'端部分和3'端部分)。优选地,编码序列的各片段或部分的大小应不超过60kb,优选编码序列的各片段或部分的大小应不超过50kb、40kb、30kb、20kb、10kb。优选地,编码序列的各片段或部分的大小为约2kb、2.5kb、3kb、3.5kb、4kb、4.5kb、5kb、5.5kb、6kb、6.5kb、7kb、7.5kb、8kb、8.5kb、9kb、9.5kb或更小尺寸。

剪接体内含子通常位于真核细胞的蛋白质编码基因的序列内。在内含子内,需要供体位点(内含子的5'端)、分支位点(靠近内含子的3'端)和受体位点(内含子的3'端)来进行剪接。该剪接供体位点在较大、较不高度保守的区域内的位于内含子5'端处包含几乎不变的序列gu。内含子3'端的剪接受体位点以几乎不变的ag序列终止该内含子。在ag的上游(5'方向),存在富嘧啶(c和u)区域或多聚嘧啶序列。在该多聚嘧啶序列的上游是分支点,其包含腺嘌呤核苷酸。剪接受体信号和剪接供体信号还可由本领域技术人员在已知的序列中选择。

介导蛋白质降解且在之前尚未被用于多重病毒系统的信号包括但不限于:短降解决定子,如cl1、cl2、cl6、cl9、cl10、cl11、cl12、cl15、cl16、sl17,c末端失稳肽,其与错误折叠的蛋白质共有结构相似性,因此被泛素化系统识别,泛素,其在供体蛋白质的n末端的融合介导直接蛋白质降解或通过n端规则途径的降解,n末端pb29降解决定子,其是9个氨基酸长的肽,其类似于cl1降解决定子,预期在被泛素化途径的酶识别的结构中折叠,人工终止密码子,其造成mrna,微小rna(mir)靶序列的早期终止。

本领域技术人员可容易地理解,除了可通过实验室技术人员人工生成的那些变体以外,可以存在天然存在的蛋白质的多种变体序列。本发明的多核苷酸和多肽涵盖本文中具体示例的那些,以及其任何天然变体,以及可经人工生成任何变体,只要那些变体保留所需的功能活性即可。本发明范围内还涵盖这样的多肽,其与本文中示例的多肽具有相同氨基酸序列,不同之处在于该多肽的序列中存在氨基酸取代、添加或缺失,只要这些变体多肽基本保留与本文中具体示例的多肽相同的相关功能活性即可。例如,多肽中不影响该多肽功能的保守氨基酸取代将落在本发明范围内。因此,应理解,本文所述的多肽包括具体示例的序列的变体和片段,如上所述。本发明还包括编码本文所述的多肽的核苷酸序列。这些核苷酸序列可由了解本文所述的蛋白质和氨基酸序列的本领域技术人员容易地构建。本领域技术人员应理解,遗传学密码的简并使技术人员能够构建编码具体多肽或蛋白质的多种核苷酸序列。对于具体核苷酸序列的选择可能取决于,例如,具体表达系统或宿主细胞的密码子使用。具有与主题多肽中具体示例的那些不同的氨基酸取代的多肽也设想在本发明范围内。例如,本发明的多肽的氨基酸可用非天然氨基酸取代,只要该具有取代的氨基酸的多肽基本保留与其中氨基酸尚未被取代的多肽相同的活性即可。非天然氨基酸的示例包括但不限于,鸟氨酸、瓜氨酸、羟脯氨酸、高丝氨酸、苯基甘氨酸、牛磺酸、碘化酪氨酸、2,4-二氨基丁酸、a-氨基异丁酸、4-氨基丁酸、2-氨基丁酸、γ-氨基丁酸、ε-氨基己酸、6-氨基己酸、2-氨基异丁酸、3-氨基丙酸、正亮氨酸、戊氨酸、肌氨酸、高瓜氨酸、磺丙氨酸、τ-丁基甘氨酸、τ-丁基丙氨酸、苯基甘氨酸、环己基丙氨酸、β-丙氨酸、氟-氨基酸、设计氨基酸例如β-甲基氨基酸、c-甲基氨基酸、n-甲基氨基酸,和一般的氨基酸类似物。非天然氨基酸还包括具有衍生的侧基的氨基酸。此外,所述蛋白质中的任何氨基酸均可以是d(右旋)形式或l(左旋)形式。氨基酸可一般地分为如下几类:非极性、不带电极性、碱性和酸性。保守取代(其中多肽的一种类别的氨基酸被相同类别的另一种氨基酸取代)落在本发明范围内,只要具有所述取代的所述多肽仍基本保留与不具有所述取代的多肽相同的生物学活性即可。表1提供属于各类别的氨基酸的示例。

本发明范围内还涵盖这样的多核苷酸,其与本文示例的多核苷酸有相同的核苷酸序列,不同之处在于所述多核苷酸的序列中具有核苷酸取代、添加或缺失,只要这些变体多核苷酸基本保留与本文中示例的多核苷酸相同的相关功能活性(例如,它们编码与所述示例的多核苷酸所编码的物质具有相同的氨基酸序列或相同功能活性的蛋白质)即可。因此,应理解,本文所述的多核苷酸包括具体示例的序列的变体和片段,如上所述。

本发明还设想这样的多核苷酸分子,它们具有与本发明的多核苷酸序列充分同源的序列,从而允许在标准严谨条件下采用标准方法与该序列杂交(maniatis,t.等,1982)。本文所述的多核苷酸还可以与本文中示例的那些的更具体的相同性和/或相似性范围限定。序列相同性通常将大于60%、优选大于75%、更优选大于80%、甚至更优选大于90%,并且可大于95%。序列的相同性和/或相似性可以是与本文示例的序列相比49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98,或99%或更大的相同性和/或相似性。除非另有说明,本文中所用的两种序列的序列相同性和/或相似性的百分比可以采用由karlin和altschul(1993)修改的karlin和altschul的算法(1990)来确定。所述算法整合在altschul等的nblast和xblast程序(1990)中。blast检索采用nblast程序进行,评分=100,字长=12,以获得具有所需序列相同性百分比的序列。为获得缺口算法以供比较目的,可按altschul等.(1997)的描述使用缺口blast。利用blast和缺口blast程序时,可使用各程序(如nblast和xblast)的默认参数。参见ncbi/n1h网站。

本发明还涉及药物组合物,其包含本发明的载体系统或病毒载体系统或宿主细胞,任选地,与药学上可接受的运载体、稀释剂、赋形剂或佐剂的组合。药用运载体、赋形剂或稀释剂的选择可基于指定的给药途径和标准药学实践。除运载体、赋形剂或稀释剂外,该药物组合物还可包含任何合适的粘合剂、润滑剂、助悬剂、包衣剂、增溶剂和辅助或提高病毒进入靶位点的其他运载体试剂(例如脂质递送系统)。所述构建体或载体可体内或离体给予。

适用于局部或胃肠外给予的包含一定量的化合物的药物组合物构成本发明的优选实施方式。对于胃肠外给药,这些组合物最好是无菌水溶液形式,可包含其他物质如足量的盐或单糖以使溶液与血液等渗。本发明的药物组合物可优选通过视网膜下注射被递送至视网膜,或其还可制备为可注射悬液、眼用洗剂或眼科油膏形式,它们可采用非侵入性方式被递送至视网膜。

在本发明内容中,给予患者(具体是人)的剂量应足以在合理时间范围内在该患者中实现治疗响应,同时不造成致命毒性,并且优选造成不超过可接受水平的副作用或发病率。本领域技术人员应理解,剂量将取决于多种因素,包括对象的状况(健康)、对象体重、并行治疗的种类(若存在)、治疗频率、治疗比例,以及病理状态的严重性和阶段。

本发明的方法可用于人和其它动物。本文所用的术语"患者"和"对象"可互换使用,并且意在包括例如人和非人物种。同样地,本发明的体外方法可在所述人和非人物种的细胞上进行。

本发明还涉及试剂盒,其包含一个或多个容器中的本发明的构建体系统或病毒载体系统或宿主细胞。本发明的试剂盒可任选地包括药学上可接受的运载体和/或稀释剂。在一个实施方式中,本发明的试剂盒包括一种或多种其它组分、附属物或佐剂,本文所述。在一个实施方式中,本发明的试剂盒包括说明书或包装材料,其描述如何给予所述试剂盒的载体系统。所述试剂盒的容器可由任何合适的材料制成,例如,玻璃、塑料、金属等,且具有任何合适的尺寸、形状或构型。在一个实施方式中,在所述试剂盒中提供固体形式的本发明的构建体系统或病毒载体系统或宿主细胞。在另一个实施方式中,在所述试剂盒中提供液体或溶液形式的本发明的构建体系统或病毒载体系统或宿主细胞。在一个实施方式中,所述试剂盒包含安瓿或注射器,其含有液体或溶液形式的本发明的构建体系统或病毒载体系统或宿主细胞。

本发明还提供了一种通过基因治疗来治疗个体的药物组合物,该组合物包含治疗有效量的本发明的载体系统或病毒载体系统或宿主细胞,其包含一种或多种可递送的治疗性和/或诊断性转基因或由所述转基因生成或获得的病毒颗粒。该药物组合物可用于人或动物用途。通常,普通技术临床医师都可确定对单个患者而言最适用的实际剂量且其会根据特定个体的年龄、体重和反应以及给予途径而变化。对于人,各载体的1x10e10~1x10e15基因组拷贝/kg,优选各载体的1x10e11~1x10e13基因组拷贝/kg的剂量范围预期将是有效的。各载体的1x10e10~1x10e15基因组拷贝/眼的剂量范围,优选1x10e10~1x10e13,预期将有效于眼部给予。

待给予的剂量方案和有效量可通过普通技术临床医师来确定。给予可以是单一剂量或多重剂量的形式。进行采用多核苷酸、表达构建体和载体的基因治疗的一般方法是本领域已知的(参见例如,基因治疗:原理与应用(genetherapy:principlesandapplications),springerverlag1999;和美国专利号6,461,606;6,204,251和6,106,826)。本发明还涉及用于在细胞中表达选择的多肽的方法。在一个实施方式中,所述方法包括:将包含编码选择的多肽的多核苷酸序列的本发明的载体系统引入所述细胞,和,在所述细胞中表达所述多核苷酸序列。所述选择的多肽对于所述细胞可以是异源性的。在一个实施方式中,所述细胞是哺乳动物细胞。在一个实施方式中,所述细胞是人细胞。在一个实施方式中,所述细胞是光感受器细胞或rpe细胞。所述细胞还可以是肌肉细胞,具体地,骨骼肌细胞,肺细胞,胰腺细胞,肝细胞,肾细胞,肠细胞,血液细胞。在一个特定实施方式中,所述细胞是视椎细胞或视杆细胞。在具体实施方式中,所述细胞是人视锥细胞或视杆细胞。

序列表

ap1(seqidno.24)

ap2(seqidno.25)

akseqa(seqidno.22)

akseqb(seqidno.23)

ap(seqidno.26)

左itr2(seqidno.29)

右itr2(seqidno.30)

左itr5(seqidno.31)

右itr5(seqidno.32)

cmv

cmv增强子(seqidno.33)

cmv启动子(seqidno.34)

嵌合内含子(sv40内含子)(seqidno.35)

hgrk1启动子(seqidno.36)

cba杂合启动子

cmv增强子(seqidno.37)

cba启动子(seqidno.38)

irbp(seqidno.39)

剪接供体信号(seqidno.27)

mir-let7b降解信号(seqidno.40)

4xmir-let7b降解信号(seqidno.41)

mir-26a降解信号(seqidno.13)

4xmir-26a降解信号(seqidno.18)

mir-204降解信号(seqidno.11)

mir-124降解信号(seqidno.12)

3xmir-204+3xmir-124降解信号(seqidno.17)

cl1降解信号(降解决定子)

核苷酸序列:(seqidno.16)

氨基酸序列:(seqidno.1)

cl2降解信号(降解决定子)

核苷酸序列:(seqidno.42)

氨基酸序列:(seqidno.2)

cl6降解信号(降解决定子)

核苷酸序列:(seqidno.43)

氨基酸序列:(seqidno.3)

cl9降解信号(降解决定子)

核苷酸序列:(seqidno.44)

氨基酸序列:(seqidno.4)

cl10降解信号(降解决定子)

核苷酸序列:(seqidno.45)

氨基酸序列:(seqidno.5)

cl11降解信号(降解决定子)

核苷酸序列:(seqidno.46)

氨基酸序列:(seqidno.6)

cl12降解信号(降解决定子)

核苷酸序列:(seqidno.47)

氨基酸序列:(seqidno.7)

cl15降解信号(降解决定子)

核苷酸序列:(seqidno.48)

氨基酸序列:(seqidno.8)

cl16降解信号(降解决定子)

核苷酸序列:(seqidno.49)

氨基酸序列:(seqidno.9)

sl17降解信号(降解决定子)

核苷酸序列:(seqidno.50)

氨基酸序列:(seqidno.10)

pb29降解信号(降解决定子)

核苷酸序列:(seqidno.19)

氨基酸序列:(seqidno.15)

短pb29降解信号(降解决定子)

核苷酸序列:(seqidno.20)

氨基酸序列:(seqidno.14)

3xpb29降解信号(降解决定子)(seqidno.21)

人工终止密码子(seqidno.51)

剪接受体信号(seqidno.28)

sv40多聚a(seqidno.52)

abca45’(seqidno.53)

hgrk1-5’abca4+ak+cl1全长序列(seqidno.54)

注释:

itr:大写字母粗体

hgrk启动子:小写字母粗体斜体

abca45':小写字母下划线

sds:小写字母粗体

ak:大写字母

cl1:小写字母斜体下划线

abca4_3'(seqidno.55)

abca43'+ak_sv40全长序列(seqidno.56)

注释:

itr:大写字母粗体下划线

ak:大写字母

sas:小写字母粗体

abca43':小写字母下划线

sv40多聚a:小写字母粗体斜体

cmv5'abca4-sd-ak全长序列(seqidno.57)

ak-sa-3'abca4-3xflag-sv40全长序列(seqidno.58).

cmv5'abca4-sd-ap1全长序列(seqidno.59)

ap1-sa-3'abca4-3xflag-sv40全长序列(seqidno.60)

cmv5'abca4-sd-ap2全长序列(seqidno.61)

ap2-sa-3'abca4-3xflag-sv40全长序列(seqidno.62)

cmv5'abca4-sd-ap全长序列(seqidno.63)

ap-sa-3'abca4-3xflag-sv40全长序列(seqidno.64)

hgrk15'abca4-sd-ap1全长序列(seqidno.65)

grk15'abca4-sd-ap2全长序列(seqidno.66)

itr5-cmv5'abca4-sd-ak-itr2全长序列(seqidno.67)

itr2-ak-sa-3'abca4-sv40-itr5全长序列(seqidno.68)

itr5-cba5'myo7a-sd-ak-itr2全长序列(seqidno.69)

itr2-ak-sa-3'myo7a-ha-bgh-itr5全长序列(seqidno.70)

cmv5'abca4-3xflag-sd-ak-4xmir26a全长序列(seqidno.71)

cmv5'abca4-3xflag-sd-ak-3xmir204+3xmir124全长序列(seqidno.72)

cmv5'abca4-3xflag-sd-ak-cl1全长序列(seqidno.73)

ak-stop-sa-3'abca4-3xflag-sv40全长序列(seqidno.74)

ak-pb29-sa-3'abca4-3xflag-sv40全长序列(seqidno.75)

ak-3xpb29-sa-3'abca4-3xflag-sv40全长序列(seqidno.76)

ak-泛素-sa-3'abca4-3xflag-sv40全长序列(seqidno.77).

通过参考下图非限制性实施例阐述本发明。

图1.本发明实施例的多重-载体策略的示意图。itr:反向末端重复;prom:启动子;cds,编码序列;sd,剪接供体信号;rr:重组引发性区域,ak或来自碱性磷酸酶(ap1、ap2和ap);degsig;降解信号(参见表2);sa,剪接受体信号;pa,聚腺苷酸化信号。a和c:(二元或三元)杂合载体策略,包括反式剪接和重组引发性区域,根据本发明的优选实施方式,b和d:(二元或三元)载体重叠载体策略。对于其它实施例,参见图12-14。

图2.采用同源的ak、ap1和ap2区域的高效abca4蛋白表达

(a、c):(a)用二元aav2/2(aav血清型2,具有来自aav2的同源itr)载体感染的hek293细胞(50微克/泳道),或(c)用二元aav2/8(aav血清型8,具有来自aav2的同源itr)载体(编码abca4)注射的c57bl/6视网膜(全视网膜裂解物)的代表性的western印迹分析。箭头指示全长蛋白质,分子量梯标描述于左侧。(b)来自(a)中的western印迹分析的abca4蛋白条带的定量。用(a)中的abca4条带的强度除以细丝蛋白a条带的强度。这些柱形图显示相对于二元aav杂合ak载体的百分比形式的蛋白质表达,平均值显示在相应柱上方。值表示为:平均值±s.e.m(该平均值的标准误)。*panova<0.05;星号指示与ak、ap1和ap2的显著差异。(a-c)ak:用二元aav杂合ak载体感染的细胞或注射的眼;ap1:用二元aav杂合ap1载体感染的细胞或注射的眼;ap2:用二元aav杂合ap2载体感染的细胞或注射的眼;ap:用二元aav杂合ap载体感染的细胞;neg:用3'半部载体或egfp表达载体(作为阴性对照)感染的细胞或注射的眼。α-3xflag:采用抗3xflag抗体的western印迹;α-细丝蛋白a,用于抗细丝蛋白a抗体的western印迹,用作上样对照;α-dysferlin,采用抗dysferlin抗体的western印迹,用作上样对照。

图3.采用异源性itr2和itr5的载体的基因组和转导功效。

(a)从采用同源(2:2)或异源性(5:2或2:5)itr的、5′-和3′-abca4半部载体的,和采用同源itr2的对照aav制备物(ctrl)的3×1010gc提取的dna的碱性southern印迹分析。各基因组的预期尺寸描述在各泳道下方。分子量标志物(kb)描述于左侧,5′:5′半部载体;3′:3′半部载体。(b–d)被采用异源性itr2和itr5或同源itr2的二元aav2/2杂合abca4载体感染的hek293细胞的代表性的western印迹分析和定量,以m.o.i.计,基于itr2(b和c)或转基因(b和d)效价。western印迹图像(b)是n=3独立实验的代表;定量(c和d)来自n=3个独立实验。(b)上方箭头指示全长abca4蛋白,下方箭头指示截短蛋白;分子量梯标描述于左侧。上样的蛋白质微克数示于图像下方。α-3×flag:采用抗3×flag抗体的western印迹;α-细丝蛋白a:采用抗细丝蛋白a抗体(用作上样对照)的western印迹。(c和d)来自以一定剂量的载体(基于itr2(c)或转基因(d)效价)感染的细胞的western印迹分析的全长和截短abca4蛋白条带的定量。柱状图显示全长和截短蛋白条带的强度除以细丝蛋白a条带的强度,或全长蛋白质条带的强度除以对应泳道中截短蛋白条带的强度。被具有编码myo7a的异源性itr2和itr5或同源itr2(e、f)的二元aav2(aav血清型2)杂合载体感染的hek293细胞的代表性的western印迹分析和定量。western印迹图像(e)是代表性的,并且定量(f)来自n=3个独立实验。(e)上方箭头指示全长蛋白质,下方箭头指示截短蛋白,分子量梯标描述于左侧。上样的蛋白质微克量描述于图像下方。(f)来自western印迹分析的myo7a蛋白质条带的定量。

平均值描述于相应柱上方。值表示为:平均值±s.e.m。*p斯氏t检验≤0.05。

2:22:2:用具有来自aav2的同源itr的二元aav杂合载体感染的细胞;5:22:5:用具有来自aav2和aav5的异源性itr的二元aav杂合载体感染的细胞;neg:用egfp-表达载体感染的细胞,作为阴性对照。

图4.mir靶位点在5'半部载体中的纳入不导致截短蛋白产物的显著减少。

用二元aav2/2(aav血清型2)杂合载体感染的hek293细胞的代表性的western印迹分析,所述载体编码abca4,包含供于mir-let7b(左图)、mir-204+124(中图)或mir-26a(右图)的mir靶位点。上方箭头指示全长abca4蛋白,下方箭头指示截短蛋白;分子量梯标描述于左侧。上样的蛋白质微克量描述于图像下方。5'+3':不含mir靶位点的5'半部载体和3'半部载体共同感染的细胞;5'+3'+序列打乱(scramble):用无mir靶位点的5'半部载体和3'半部载体在序列打乱的mir模拟物的存在下共同感染的细胞;5'mir+3':用包含mir靶位点的5'半部载体和3'半部载体共同感染的细胞;5'mir+3'+序列打乱:用包含mir靶位点的5'半部载体和3'半部载体在序列打乱的mir模拟物的存在下共同感染的细胞;5'mir+3'+模拟物let7b:用包含mir靶位点的5'半部载体和3'半部载体在mir-let7b模拟物的存在下共同感染的细胞;5':用无mir靶位点的5'半部载体感染的细胞;5'mir:用包含mir靶位点的5'半部载体在序列打乱的mir模拟物的存在下感染的细胞;5'mir+模拟物let7b:用包含mir靶位点的5'半部载体在mir-let7b模拟物的存在下感染的细胞;neg:用3'半部载体或egfp-表达载体感染的对照细胞;5'mir+3'+模拟物204+124:用包含mir靶位点的5'半部载体和3'半部载体在mir-204和124模拟物的存在下共同感染的细胞;5'mir+模拟物204+124:用包含mir靶位点的5'半部载体在mir-204和124模拟物的存在下感染的细胞;5'mir+3'+模拟物26a:用包含mir靶位点的5'半部载体和3'半部载体在mir-26a模拟物的存在下共同感染的细胞;5'mir+模拟物26a:用包含mir靶位点的5'半部载体在mir-26a模拟物的存在下感染的细胞。α-3xflag:采用抗3xflag抗体的western印迹;α-细丝蛋白a,采用抗细丝蛋白a抗体的western印迹,用作上样对照。

序列打乱的序列对应于不同的mirna的序列,例如在采用mir-let7b模拟物的实验中,序列打乱的序列是mir26a的序列。

图5.cl1降解信号在5'半部载体中的纳入导致截短蛋白产物的显著减少

代表性的western印迹分析(a)用二元aav2/2(aav血清型2,具有来自aav2的同源itr)杂合载体感染的hek293细胞,或(b)用二元aav2/8(aav血清型8,具有来自aav2的同源itr)杂合载体(编码abca4,并且含有或不含cl1降解信号)注射后一个月的猪眼(rpe+视网膜)。上方箭头指示全长abca4蛋白,下方箭头指示来自5'半部载体的截短蛋白;分子量梯标描述于左侧。上样的蛋白质微克量描述于各图像下方。5'+3':用不含cl1的5'半部载体和3'半部载体共同感染的细胞或共同注射的眼;5'-cl1+3':用包含cl1的5'半部载体和3'半部载体共同感染的细胞或共同注射的眼;5':用不含cl1的5'半部载体感染的细胞;5'-cl1:用包含cl1的5'半部载体感染的细胞;neg:用3'半部载体或egfp表达载体(作为阴性对照)感染的对照细胞或注射的对照眼;α-3xflag:采用抗3xflag抗体的western印迹;α-细丝蛋白a:采用抗细丝蛋白a抗体的western印迹,用作上样对照;α-dysferlin:采用抗dysferlin抗体的western印迹,用作上样对照。(a)western印迹图像是n=3个独立实验的代表性图像。(b)western印迹图像是n=5个眼(用5'+3'载体注射),n=2个眼(用5'-cl1+3'载体注射)和n=5个眼(用3'半部载体或egfp表达载体作为阴性对照注射)的代表性图像。

图6.降解信号在3'半部载体中的纳入导致截短蛋白产物的小幅减少

用二元aav2/2杂合载体感染的hek293细胞代表性的western印迹分析,所述载体编码abca4且含有不同的降解信号。上方箭头指示全长abca4蛋白,下方箭头指示截短蛋白产物;分子量梯标描述于左侧。上样的蛋白质微克量描述于各图像下方。5'+3':用无降解信号的5'半部载体和3'半部载体共同感染的细胞;5':用5'半部载体感染的细胞;3'(无标记):用无降解信号的3'半部载体感染的细胞;终止:用含有终止密码子的3'半部载体感染的细胞;pb29:用包含pb29降解信号的3'半部载体感染的细胞;3xpb29:用包含3个串联拷贝的pb29降解信号的3'半部载体感染的细胞;泛素:用包含泛素降解信号的3'半部载体感染的细胞。α-3xflag:采用抗3xflag抗体的western印迹;α-细丝蛋白a:采用抗细丝蛋白a抗体的western印迹,用作上样对照。

图7:本发明的优选实施方式所用的同源的源自alpp(胎盘碱性磷酸酶)的ap、ap1和ap2区域的示意图。cds:编码序列

图8:改进的二元aav载体的视网膜下递送导致小鼠光感受器中的abca4表达和abca4-/-小鼠视网膜中的脂褐质累积的显著减少。(a)采用二元aav2/8杂合abca4载体(5'+3')或采用阴性对照(neg)注射的c57bl/6视网膜(全视网膜裂解物)的代表性的western印迹分析。箭头指示全长蛋白质,分子量梯标描述于左侧。α-3×flag:采用抗3×flag抗体的western印迹;α-dysferlin:采用抗dysferlin抗体的western印迹,用作上样对照。(b和c)未注射或注射了aav(作为对照(abca4+/-))的色素化abca4+/-小鼠或未注射(abca4-/-)或注射了双重aav杂合abca4载体(abca4-/-aav5′+3′)的色素化abca4-/-小鼠的视网膜(rpe或rpe+os)中的脂褐质自发荧光(红色信号)的代表性图片(b)和定量(c)。(b)比例尺(75μm)如图所示。rpe:视网膜色素上皮;onl:外核层;inl:内核层;gcl:神经节细胞层。箭头指示脂褐质信号。(c)各样品的三个切片的颞侧中的平均脂褐质自发荧光。各切片中的平均自发荧光针对潜在rpe的长度进行标准化。平均值描述于相应柱上方。值表示为平均值±s.e.m。***panova<0.0001。各组n=4个眼。(d)在至少40个视场(25μm2)/未注射(abca4+/+未注射)或注射pbs(abca4+/+pbs)的白化abca4+/+小鼠和注射pbs(abca4-/-pbs)或二元aav杂合abca4载体(abca4-/-aav5′+3′)的白化abca4-/-小鼠的视网膜中计数的rpe脂褐质颗粒的平均数。平均值描述于相应柱上方。值表示为平均值±s.e.m。*panova≤0.05;**panova≤0.01。n=4个眼,来自abca4+/+未注射;n=4个眼,来自abca4+/+pbs;n=3个眼,来自abca4-/-pbs;n=3个眼,来自abca4-/-aav5′+3′。

图9:阴性对照或改进的二元aav处理的小鼠和猪的眼的类似电活动。(a)二元aav杂合abca4载体(aav5'+3')或阴性对照(即阴性对照aav载体或pbs;neg)注射后1个月的c57bl/6小鼠的平均a-波(左图)和b-波(右图)振幅。数据表示为平均值±s.e.m.;n指示分析的眼的数量。

(b)二元aav杂合abca4载体(aav5′+3′)或pbs注射后1个月的猪中的暗视、最大响应、明视和闪烁erg测试中的平均b-波幅(μv)。n=5个用二元aav杂合abca4载体注射的眼;n=4个用pbs注射的眼;*:n=2。

图10:来自猪视杆和视锥光感受器中的irbp和grk1启动子的egfp蛋白质表达。三月龄的大白猪视网膜下注射1x1011gc/眼的各aav2/8-irbp-或aav2/8-grk1-egfp载体。视网膜冷冻切片在注射后4周获得并采用荧光显微镜分析egfp。(a-b)pr层中的荧光强度的代表性图像(a)和定量(b)。定量各组动物的冷冻切片的荧光强度(六个不同的视场/眼;20x放大倍率)。(c-d)视锥转导功效的代表性图像(c)和定量(d)。评价冷冻切片上的视锥转导功效(六个不同的视场/眼;63x放大倍率),所述冷冻切片用抗lumif-hcar抗体免疫染色,并且表达为各视场中的视锥(car+)的总数上表达egfp(egfp+/car+)的视锥的数量。(a、c)比例尺如图所示。(b-d)n=3个眼(用aav2/8-irbp-egfp载体注射);n=3个眼(用aav2/8-grk1-egfp载体注射)。值表示为平均值±s.e.m.。采用斯氏t检验发现无显著差异。os:外节;onl:外核层;egfp:原始egfp荧光;car:抗视锥抑制蛋白染色;dapi:4',6'-双脒-2-苯基吲哚染色。箭头指向转导的视锥。

图11:改进的二元aav载体的视网膜下递送导致abca4-/-小鼠视网膜中的脂褐质累积的显著减少。视网膜横截面的颞(注射)侧的图像的拼集显示未注射或注射aav作为对照(abca4+/-)的色素化abca4+/-小鼠或未注射(abca4-/-)或注射二元aav杂合abca4载体(abca4-/-aav5'+3')的色素化abca4-/-小鼠的视网膜(rpe或rpe+os)中的脂褐质自发荧光(红色信号)。对于各组,n=4个眼。t:颞侧;n:鼻侧。

图12:阴性对照或改进的二元aav处理的小鼠和猪中的眼的类似电活动。(a)来自二元aav杂合abca4载体(aav5'+3')或阴性对照(即阴性对照aav载体或pbs;neg)注射后一个月的c57bl/6小鼠的代表性的erg痕迹。(b)来自二元aav杂合abca4载体(aav5'+3')或pbs注射后一个月的猪中的暗视、最大响应、明视和闪烁erg测试的代表性的痕迹。

图13.根据本发明实施例的载体系统策略的示意图。(a)根据本发明的优选实施方式,由两种载体组成的载体系统的示意图:第一载体包含编码序列的第一部分(cds1部分),第二载体包含编码序列的第二部分(cds2部分)。(a1)载体系统的重建序列在于所述编码序列部分的重叠末端。(a2),第一和第二载体的重建序列分别在于剪接供体和剪接受体序列。(a3)各重建序列包含剪接供体/受体,如在a2中排列,并且其还包含重组引发性区域。降解信号包含于至少一个载体中。该图显示根据本发明的优选非限制性实施方式,对于各载体,所述载体系统的一个或多个降解信号的所有可能的位置。

(b)根据本发明的优选实施方式,由三种载体组成的载体系统的示意图:第一载体包含编码序列的第一部分(cds1部分)、第二载体包含编码序列的第二部分(cds2部分),且第三载体包含编码序列的第三部分(cds3部分)。(b1)所述载体系统的重建序列在于编码序列部分的重叠末端(cds1的3'端与cds2的5'端重叠;cds2的3'端与cds3的5'端重叠)。(b2)第一载体的重建序列在于剪接供体,第一载体的重建序列在于剪接供体;第二载体在cds2的5'端包含第一重建序列,且第二重建序列位于cds2的3'端,第一重建序列是剪接受体且第二是剪接供体;第三载体的重建序列在于剪接受体。(b3)各重建序列包含剪接供体/受体,如在b2中排列,并且还包含重组引发性区域。降解信号包含于至少一个载体中。该图显示根据本发明的优选非限制性实施方式,对于各载体,所述载体系统的一个或多个降解信号的所有可能的位置。

cds,编码序列;sd,剪接供体信号;rr:重组引发性区域;degsig;降解信号(参见表2);sa,剪接受体信号。

图14.用于大基因转导的现有技术基于多重载体的策略的示意图。cds:编码序列;pa:聚腺苷酸化信号;sd:剪接供体信号;sa:剪接受体信号;ap:碱性磷酸酶重组引发性区域;ak:f1噬菌体重组引发性区域。虚线(dottedline)显示sd和sa之间发生的剪接,点线(pointedline)显示可用于同源重组的重叠区域。正常尺寸和超大型aav载体质粒含有全长表达盒,其包含启动子、全长转基因cds和聚腺苷酰化信号(pa)。生成二元aav载体所需的两个单独的aav载体质粒(5'和3')含有启动子以及之后的转基因cds的n端部分(5'质粒)或转基因cds的c端部分以及之后的pa信号(3'质粒)。

具体实施方式

材料和方法

质粒的生成

用于aav载体生成的质粒全部源自二元杂合ak载体质粒,其编码人abca4、人myo7a或egfp报告蛋白(包含aav血清型2的反向末端重复(itr))14

编码abca4的载体质粒中包含的ak重组引发性序列14用源自碱性磷酸酶基因的三种不同的重组引发性序列替代:ap(nm_001632,bp823-1100,14);ap1(xm_005246439.2,bp1802-151620);ap2(xm_005246439.2,bp1225-93820)。

以5:2-2:5构型携载来自aav血清型2(itr2)的异源性itr和来自aav血清型5(itr5)的itr的二元aav载体质粒通过如下方式产生:将5'半部载体质粒中的左itr2和3'半部载体质粒中的右itr2分别用itr5(nc_006152.1,bp1-175)替代。以2:5或5:2构型携载异源性itr2和itr5的二元aav载体质粒通过如下方式产生:将右或左itr2分别用itr5替代。包含rep5(nc_006152.1,bp171-2206)和aav2cap(af043303bp2203-2208)基因(rep5cap2)的paav5/2包装质粒从包含rep(af043303bp321-1993)和来自aav2(rep2cap2)的cap(af043303bp2203-2208)基因的paav2/2包装质粒,通过将rep2基因用来自aav5(nc_006152.1,bp171-2206)的rep5开放阅读框替代来获得。

包含具有itr5的egfp表达盒的pzac5:5-cmv-egfp质粒由包含侧接egfp表达盒的itr2的paav2.1-cmv-egfp质粒45获得。

降解信号如下克隆在编码abca4的二元aav杂合ak载体中:在ak序列和右itr2之间的5'半部载体质粒中;在ak序列和剪接受体信号之间的3'半部载体质粒中。降解信号序列的详细信息可见于表2。

表2.该研究中所用的降解信号

下划线序列对应于降解信号;对于包括重复序列的降解信号,显示不带下划线的核苷酸,其已包括在重复序列之间以用于克隆目的。

从二元aav载体表达的abca4蛋白在n-(氨基酸位置590)和c末端带有3xflag标签,用于图3和4和图6中所示的实验,并且在c末端单独带标签,用于图2和8a中所示的实验。

在该研究中所用的编码abca4的二元aav杂合载体组包括遍在cmv46或pr-特异性人g蛋白质-偶联的受体激酶1(grk1)47启动子,而编码myo7a的二元aav杂合载体包括遍在cb启动子39

aav载体生成和表征

aav载体大型制备物由tigemaav载体中心,通过三元转染hek293细胞随后进行两轮cscl2纯化生成。携载同源itr2的aav载体如前所述48获得。

为获得携载异源性itr2和itr5的aav载体,1.1x109低传代hek293细胞的悬液,通过磷酸钙法,采用500μg的pdeltaf6辅助质粒(其包含ad辅助基因49)、260μg的paav顺式质粒和不同的量的rep2cap2和rep5包装构建体,四倍转染。rep2cap2和rep5包装构建体的量如下:

(i)方案a:130μg的各rep5和rep2cap2(比例1:1)

(ii)方案b:90μg的rep5和260μg的rep2cap2(比例1:3)

(iii)方案c:26μg的rep5和260μg的rep2cap2(比例1:10)

然后,各aav制备物根据公开的方案48纯化。

采用下文所述的方案进行rep竞争实验:

1-为评估rep5与rep2竞争生成具有itr2的aav载体,hek293细胞,通过磷酸钙法,采用pdeltaf6、paav2.1-cmv-egfpcis、rep2cap2和rep5cap2构建体以重量比2:1:1.5:1.5四倍转染,或者,作为对照,用pdeltaf6、paav2.1-cmv-egfp、rep2cap2包装构建体和对照不相关质粒以重量比2:1:1.5:1.5四倍转染;

2-为评估rep2与rep5竞争生成具有itr5的aav载体,hek293细胞,通过磷酸钙法,采用pdeltaf6、pzac5:5-cmv-egfp、rep5cap2和rep2cap2构建体以重量比2:1:1.5:1.5四倍转染,或者,作为对照,用pdeltaf6、pzac5:5-cmv-egfp、rep5构建体和对照不相关质粒以重量比2:1:1.5:1.5四倍转染。

对于大规模aav载体制备物,物理效价[基因组拷贝(gc)/ml]通过如下方式确定,将通过采用taqman(应用生物系统公司(appliedbiosystems),美国加利福尼亚州卡尔斯巴德)48采用在itr2上退火的探针的pcr定量获得的效价和通过圆点印迹法分析50采用在itr2的1kb以内退火的探针获得的效价平均化。对于采用不同的rep5:rep2cap2重量比产生的大规模aav载体制备物,物理效价[基因组拷贝(gc)/ml]采用taqman采用在itr2上退火的探针通过pcr定量确定。对于用于竞争实验的aav载体制备物,物理效价[基因组拷贝(gc)]采用taqman采用在牛生长激素(bgh)聚腺苷酸化信号上退火的探针(包括在aav载体中包装的egfp-表达盒中),通过pcr定量确定。

hek293细胞的aav感染

hek293细胞的aav感染如前所述进行14。携载异源性itr2和itr5并根据方案c产生的aav2载体用于各载体以1x104gc/细胞的感染复数(m.o.i)感染hek293细胞(2x104总gc/细胞,当发明人以1:1比例采用二元aav载体时),计算考虑各病毒制备物实现的最低效价。采用携载重组引发性区域和降解信号的aav2/2感染以各载体5x104gc/细胞的m.o.i进行(在以1:1比例的二元aav载体的情况中,1x105总gc/细胞),计算考虑taqman和圆点印迹法之间的平均效价。

对于采用包含mir靶位点的5'半部载体的实验,细胞在用对应mir模拟物(50nm;miridian微小rna模拟物hsa-let-7b-5p、hsa-mir-204-5p、hsa-mir-124-3p和hsa-mir-26a-5p;dharmacon,美国科罗拉多州拉斐特)感染之前4小时采用磷酸钙法转染。

小鼠和猪中aav载体的视网膜下注射

将小鼠置于遗传学和生物物理学研究所动物房中(意大利那不勒斯),维持于12小时光/暗循环中(光阶段期间10-50勒克司暴露)。c57bl/6小鼠购自哈兰意大利公司(harlanitalysrl)(意大利乌迪内)。色素化abca4-/-小鼠通过白化abca4-/-小鼠14与sv129小鼠的连续杂交产生,并且维持同系交配;在杂合子小鼠与纯合子小鼠之间进行繁殖。白化abca4-/-小鼠通过与balb/c小鼠(rpe65leu450纯合子)连续杂交与回交来产生,并维持同系交配;在杂合子小鼠与纯合子小鼠之间进行繁殖。c57bl/6(5周龄)、色素化abca4-/-(5.5月龄)和白化abca4-/-(2.5-3-月龄)小鼠如前所述麻醉61,然后通过liang等62所述的方法经巩膜经脉络膜方法,将1μl的pbs或aav2/8载体视网膜下递送至视网膜的颞侧。将aav2/5-vmd2-人酪氨酸酶63(剂量:2x108gc/眼)添加至aav2/8载体溶液,该载体溶液被视网膜下递送至白化abca4-/-小鼠(图8d)。这允许我们标记洗眼杯的转导的部分中的rpe,其后续经解剖和分析。

该研究中所用的大白雌猪在意大利国家猪育种者协会(italiannationalpigbreeders’association)的lw良种登记册中登记为纯种。猪在卡达尔里医院动物房(意大利那不勒斯)圈养并保持在12小时明/暗周期(在光照期,10–50勒克斯暴露)下。该研究根据视觉与眼科学研究协会关于眼科与视觉研究中的动物应用的声明(associationforresearchinvisionandophthalmologystatementfortheuseofanimalsinophthalmicandvisionresearch)且采用意大利卫生部关于动物操作的规定来进行。所有的操作均提交至意大利卫生部;公共卫生、动物健康、营养与食品安全安全部。手术在麻醉下进行,并且尽全力使痛苦程度最小化。动物如前所述处死39。如前所述向3月龄猪视网膜下递送aav载体39。所有的眼用100μl的pbs或aav2/8载体溶液处理。aav2/8剂量为各载体1x1011gc/眼,因此,二元aav载体以1:1比例的共同注射导致2x1011gc/眼的总剂量。

对于图2c、5b、8、9、10、11和12中所包括的动物研究,右和左眼随机分配至不同的实验组,并且,操作和定量所述实验的研究人员不知晓动物所经历的处理。

western印迹分析

为了western印迹分析hek293细胞,小鼠和猪视网膜裂解于ripa缓冲液(50mmtris–hclph8.0、150mmnacl、1%np40、0.5%脱氧胆酸钠、1mmedtaph8.0,0.1%sds)。向裂解缓冲液中补充蛋白酶抑制剂(完全蛋白酶抑制剂混合物片,罗氏公司(roche))和1mm苯甲基磺酰氟。裂解后,包含myo7a的细胞的样品在1xlaemli样品缓冲液中于99℃变性5分钟;包含abca4的样品在补充有4m脲的1xlaemli样品缓冲液于37℃变性15分钟。裂解物通过6-7%(分别是abca4和myo7a样品)或8%(图5b中的wb)sds–聚丙烯酰胺凝胶电泳分离。用于免疫-印迹的抗体如下:抗3xflag(1:1000,a8592;西格玛奥德里奇公司(sigma-aldrich));抗myo7a(1:500,多克隆;primmsrl,意大利米兰)采用对应于人myo7a蛋白的氨基酸941–1070的肽产生;抗细丝蛋白a(1:1000,目录号#4762;细胞信号技术公司(cellsignalingtechnology),美国马萨诸塞州丹弗斯);抗dysferlin(1:500,dysferlin,克隆ham1/7b6,monx10795;tebu-bio,leperray-en-yveline,法国)。使用图像j软件(可从http://rsbweb.nih.gov/ij/免费下载)对western印迹检测的abca4和myo7a条带进行定量。对于采用携载异源性itr2和itr5的aav的体外实验,全长abca4和myo7a条带的强度对于对应泳道中截短蛋白产物的结果或对于细丝蛋白a条带的结果进行标准化,而较短abca4和myo7a蛋白条带的强度对于细丝蛋白a条带的结果进行标准化。采用携载降解信号或同源性区域的aav载体获得的abca4条带的强度对于细丝蛋白a条带(体外实验)或dysferlin条带(体内实验)的结果标准化。

western印迹实验的定量已如下进行:

-图2a-b:abca4条带的强度对于对应泳道中的细丝蛋白a条带的结果标准化。然后,标准化的abca4表达表示为相对于二元aav杂合ak载体的百分数;

-图2c:abca4条带的强度(a.u.)计算为相对于以相同水平在各凝胶的阴性对照泳道中检测的平均强度的增加倍数(因为背景信号异常地高,左下图的泳道7中的阴性对照样品的测量结果从分析中排除)。各组的值表示为平均值±平均值的标准误(s.e.m.);

-图3b-d:全长abca4和截短蛋白条带强度除以细丝蛋白a条带的强度或全长abca4蛋白条带的强度除以对应泳道中截短蛋白条带的强度。值表示为:平均值±s.e.m.;

-表5:在用5'-和3'半部载体共同感染的细胞中检测的全长abca4和截短蛋白条带强度。计算在对应模拟物或序列打乱的模拟物的存在下的全长abca4和截短蛋白条带的强度之间的比例。值代表来自三个独立实验的比例的平均值±s.e.m.;

-表6:在用5'-和3'半部载体共同感染的细胞中检测的全长abca4和截短蛋白条带强度。计算来自具有或不具有降解信号的载体的全长abca4和截短条带的强度之间的比例。值代表来自三个独立实验的比例的平均值±s.e.m.。

-图8a:abca4条带的强度(a.u.)计算为相对于在对应凝胶的阴性对照泳道中检测的平均背景强度的增加的倍数。值表示为平均值±s.e.m.。

southern印迹分析

从aav颗粒提取3x1010gc的病毒dna。为消化未包装的基因组,所述载体溶液重悬于240μl的pbsph7.419(gibco;英杰公司(invitrogens.r.l.),意大利米兰),然后用包含40mmtris–hcl、10mmnacl、6mmmgcl2、1mmcacl2的300μl总体积(ph7.9)中的1u/μl的dna酶i(roche)在37℃孵育2小时。然后,dna酶i用50mmedta失活,之后用蛋白酶k和2.5%n-月桂酰-肌氨酸(sarcosil)溶液在50℃孵育45分钟以裂解衣壳。dna用苯酚-氯仿提取两次并用两体积的乙醇100和10%乙酸钠(3m,ph7)沉淀。碱性琼脂糖凝胶电泳和印迹如前所述进行(sambrook和russell,2001《分子克隆》(molecularcloning))。十微升的1kbdna梯标(n3232l;新英格兰生物实验室公司(newenglandbiolabs),美国马萨诸塞州伊普斯威奇)上样作为分子量标志物。两种不同的双链dna片段采用dighighprimedna标记和检测起始试剂盒(罗氏)用异羟基洋地黄毒苷-dutp标记,并用作探针。5′探针(768bp)通过用spei和noti对pzac2.1-cmv-abca4_5′质粒进行双重消化产生;3′探针(974bp)通过用clai和mfei对pzac2.1-abca4_3′_3xflag_sv40质粒进行双重消化产生。预杂交和杂交在church缓冲液(sambrook和russel,2001《分子克隆》(molecularcloning))中于65℃分别进行1小时和过夜。然后,膜(whatmannytrann,带电尼龙膜;西格玛奥德里奇公司,意大利米兰)首先在ssc29-0.1%sds中清洗30分钟,然后在ssc0.59-0.1%sds中于65℃清洗30分钟,然后在ssc0.19-0.1%sds中于37℃清洗30分钟。然后,通过化学发光检测,通过采用digdna标记和检测试剂盒(罗氏)的酶免疫试验分析该膜。

组织学分析

使小鼠安乐死,随后收集其眼球并通过浸没在4%多聚甲醛(pfa)中固定过夜。收获眼球前,通过烧灼标记的巩膜的颞部以在包含时相对于注射位点对眼进行定向。切下眼球,从而移出晶状体和玻璃体同时保持洗眼杯完整。小鼠洗眼杯用30%蔗糖浸润供于冻存,并包埋于组织冷冻介质(o.c.t.基质;kaltek,意大利帕多瓦)中。对于各眼,沿水平面切割150-200个连续切片(10μm厚)并使切片进行性分布在10张载玻片上,使得各载玻片含有15-20个切片,各自代表不同水平的整个眼。这些切片使用4',6'-二眯基-2-苯基吲哚(载体实验室公司(vectorlab),英国彼得堡)染色,并以不同放大倍数使用zeissaxiocam(卡尔蔡司公司(carlzeiss),德国上科亨)监测。

猪经处死,然后收集其眼球,并通过将其浸没在4%pfa中固定过夜。切下眼球,从而移出晶状体和玻璃体,使洗眼杯处于原位。通过渐进地用10%、20%和30%蔗糖浸润洗眼杯,使它们逐渐脱水。进行组织冷冻介质(o.c.t.基质;kaltek)包埋。包埋前,猪洗眼杯用荧光立体显微镜(徕卡微系统公司(leicamicrosystemsgmbh),德国韦茨拉尔)分析以定位给予了egfp-编码载体时的转导的区域。对于各眼,沿着水平子午线切下200–300连续切片(12μm厚),然后使所述切片渐进地分布在载玻片上,从而各载玻片包含6–10个切片。切片染色和图像采集如对于小鼠描述的那样进行。

视锥免疫荧光染色

冷冻的视网膜切片用pbs清洗一次,然后在包含0.1%曲通x-100的pbs中透化1小时。包含10%常规山羊血清(西格玛奥德里奇公司)的封闭溶液处理1小时。一抗[抗人car66,67,其也识别猪car("光源发现者(luminairefounders)”—hcar,1:10,000;由加利福尼亚州洛杉矶多希尼眼科研究所的cherylm.craft博士友情提供)]在pbs中稀释并4℃孵育过夜。二抗(alexafluor594,抗兔,1:1,000;molecularprobes,英杰公司,加利福尼亚州卡尔斯巴德)孵育45分钟。用抗car抗体染色的切片以63x放大倍率采用leicalaser共聚焦显微镜系统(徕卡微系统公司)分析,如前所述64。简言之,对于各眼,采集六个不同的转导的区域的六个不同的z堆栈。对于各z堆栈,来自单一平面的图像用于car+/egfp+细胞计数。在该过程中,发明人小心地沿z轴移动,以将细胞彼此区分开来,因此避免对相同细胞重复计数。对于各视网膜,发明人对总car+细胞计数了car-阳性(car+)/egfp-阳性(egfp+)细胞。然后,发明人计算了各实验组的三个眼的car+/egfp+细胞的平均数。

egfp定量

pr中的荧光强度如前所述以无偏好方式严格且可再现地定量64。单色通道图像采用leica显微镜(徕卡微系统公司)采集。tiff图像用图像分析软件(lasaflite;徕卡微系统公司)灰度处理。各眼的六幅图像以20x放大倍率通过遮罩的观察器进行分析。在各图像中对pr(外核层+os)选择性地示出轮廓,并且采用该图像分析软件以无偏好方式计算封闭区域内的总荧光。然后,从收集自各眼的不同的视网膜切片的六幅图像平均化pr中的荧光。然后,发明人计算了各实验组的三个眼的平均荧光。

脂褐质自发荧光的定量

对于脂褐质荧光分析,眼收集自aav注射后3个月的色素化abca4+/-和abca4-/-小鼠。小鼠适应暗环境过夜并在昏暗的红光下处死。对于各眼,来自眼的不同区域的三个切片的颞侧的四幅重叠图片用配备有tx2滤镜(激发:560±40nm;发射:645±75)71-75的leicadm5000b显微镜在20x物镜下采集。然后,各切片的四幅图像在单一图集中合并用于进一步荧光分析。各切片中的脂褐质荧光的强度(红色信号)采用imagej软件自动计算,然后对荧光区域潜在的rpe的长度标准化。

透射电子显微术

对于电子显微镜分析,眼收集自aav注射后3个月的白化abca4-/-和abca4+/+小鼠。眼在0.1mphem缓冲液ph6.9(240mmpipes、100mmhepes、8mmmgcl2、40mmegta)中的0.2%戊二醛-2%多聚甲醛中固定过夜,然后在0.1mphem缓冲液中漂洗。然后,眼在光学显微镜下解剖,以选择洗眼杯的酪氨酸酶阳性部分。随后将洗眼杯的经转导部分包埋在12%明胶中,使用2.3m蔗糖输注并在液氮中冷冻。使用leicaultramicrotomeemfc7(徕卡微系统公司)切割冷冻切片(50nm)并非常小心地排列纵向衔接纤毛的pr。为了避免不同实验组的形态学数据的属性偏差,脂褐质颗粒的计数通过遮罩的观察器(romanpolishchuk博士)采用item软件(olympussys,德国汉堡)进行。使用item软件的“touchcount”模块来对rpe层上随机分布的25μm2区域(至少40个)中脂褐质颗粒数目进行计数。颗粒密度表示为颗粒数目/25μm2

视网膜电图记录

小鼠和猪的电生理学记录分别如(68)和(69)中详述进行。

统计学分析

认为p值≤0.05具有统计学显著性。采用事后多重比较检验的单因素anova(r统计学软件)用于比较图2b(panova=1,2x10-6)、2c(panova=0,326)、8c(panova=1,5x10-10)、8d(panova=0,034)和9a(panovaa-波:0,5;panovab-波:0,8)和表6(panova=0,0135)中所示的数据。因为脂褐质颗粒的计数(图8d)表示为离散数字,所以这些通过从负二项泛化的线性模型65的偏差进行分析。采用事后多重比较检验确定的组间统计学显著差异如下:图2b:ap比对ak:1,08x10-5;ap1比对ak:0,05;ap2比对ak:0,17;ap1比对ap:1,8x10-6;ap2比对ap:2,8x10-6;ap2比对ap1:0,82。图8c:abca4+/-未注射比对abca4-/-未注射:0,00;abca4-/-未注射比对abca4-/-aav5'+3':9,3x10-5;abca4+/-未注射比对abca4-/-aav5'+3':4x10-6。图8d:abca4-/-pbs比对abca4-/-aav5'+3':0,01;abca4+/+pbs比对abca4-/-aav5'+3':0,37;abca4+/+未注射比对abca4-/-aav5'+3':0,53;abca4+/+pbs比对abca4-/-pbs:0,05;abca4+/+未注射比对abca4-/-pbs:0,03;abca4+/+未注射比对abca4+/+pbs:0,76。表6:3xstop比对无降解信号:0,97;3xstop比对pb29:1,0;3xstop比对3xpb29:0,15;3xstop比对泛素:0,10;pb29比对无降解信号:1,0;pb29比对3xpb29:0,1;pb29比对泛素:0,07;3xpb29比对无降解信号:0,06;3xpb29比对泛素:1,0;泛素比对无降解信号:0,04。

斯氏t检验用于比较图3c、d和f中所示的数据。

结果

包括ap1、ap2或ak重组引发性区域的二元aav杂合载体显示高效转导

发明人评价了图1和13中所示的数种多重载体策略。

具体地,它们平行地评价具有不同的同源性区域的二元aav杂合载体的转导功效。出于该目的,发明人生成了二元aav2/2杂合载体,其包括abca4-3xflag编码序列,受控于遍在cmv启动子,以及具有同源性的ak14、ap14、ap1或ap220区域(图7)。发明人采用这些载体来感染hek293细胞[感染复数,m.o.i.:各载体,5x104基因组拷贝(gc)/细胞]。细胞裂解物通过采用抗3xflag抗体的western印迹分析以检测abca4-3xflag(图2)。各二元aav杂合载体组导致预期大小的全长蛋白质的表达,其未在采用阴性对照上样的泳道中检测到(图2a)。abca4表达的定量(图2b)显示采用二元aav杂合ap1和ap2载体的感染所导致的转基因表达的水平略高于二元aav杂合ak载体,且完全显著地胜过二元aav杂合ap载体14。发明人先前发现依赖于同源重组的二元aav载体的功效在末端分化的细胞如pr中低于细胞培养物中14。因此,发明人评价了在视网膜下给予包括pr-特异性人g蛋白质-偶联的受体激酶1(grk1)启动子的二元aavak、ap1和ap2载体(各载体的剂量/眼:1.9x109gc;图2c)的c57bl/6小鼠中的pr-特异性转导水平。载体给予后一个月,发明人检测出abca4蛋白表达在用二元aav杂合ak处理的视网膜中的一致性高于ap1或ap2载体(图2c)。

异源性itr在aav载体中的纳入影响了它们的生成产量并且不减少截短蛋白产物的水平

为测试异源性itr的应用是否改善二元aav载体的生产性定向连环化,发明人产生了二元aav2/2杂合ak载体,该载体包括abca4-3xflag或myo7a-ha编码序列,具有异源性itr2和itr5,具有5:2(来自aav5的左itr和来自aav2的右itr)或2:5(来自aav2的左itr和来自aav5的右itr)构型(图1)。携载异源性itr2和itr5的二元aav载体的生成要求来自aav血清型2和5的rep蛋白的同时表达,其无法交叉互补病毒复制23。事实上,已显示rep2和rep5可以可互换地结合至itr2或itr5,尽管不如同源itr高效,然而它们无法切割来自其它血清型的itr的末端解离位点36。因此,在产生具有异源性itr2和itr5的二元aav杂合ak载体之前,发明人评估了(i)rep5与rep2在aav2/2-cmv-egfp载体(即具有同源itr2的载体)的生成中的潜在竞争,和(ii)rep2与rep5在aav5/2-cmv-egfp载体(即具有同源itr5的载体)的生成中的潜在竞争,采用相同量的rep5cap2和rep2cap2包装构建体(比例1:1)。事实上,在除了rep2cap2以外还提供rep5cap2包装构建体的情况下,aav2/2-cmv-egfp载体的总产量减少至仅提供rep2cap2作为包装构建体的情况下所得的对照制备物的结果的42%(各类型的4个独立制备物的平均,p斯氏t检验<0.05)。相反,发现在将rep2cap2添加至rep5cap2的情况下获得的aav5/2-cmv-egfp制备物的总产量中无显著差异,其为在rep5cap2为转染的唯一包装构建体的情况下获得的结果的83%(各类型的4个独立制备物的平均,采用斯氏t检验发现无显著差异)。鉴于在具有itr2的载体的生成中的rep5与rep2的竞争,发明人测试了rep5和rep2cap2包装构建体在具有异源性itr2和itr5的aav中的三个不同的比例(方案a采用1:1、方案b采用1:3,且方案c采用1:10rep5/rep2cap2比例)。如表3中所示,当rep5的量减少时,通过pcr定量采用退火至itr2的探针测定的病毒效价逐步增加,采用方案c获得最佳效价。

表3.aav5:2/2载体在不同的比例的rep5和rep2包装构建体的存在下的产量

id:aav5:2/2载体的数量鉴定;gc:基因组拷贝。

这些结果证实rep5与rep2在具有itr2的载体的生成中的竞争,并且致使我们遵循方案c来生成具有异源性itr2和itr5的aav载体。然而,采用该策略获得的若干aav制备物揭示:(i)对于itr2确定的效价至多6倍更低于对于itr之间的转基因序列确定的效价(表4),这可表明itr2的完整性受损,和(ii)具有异源性itr2和itr5的aav载体的总产量相较于含有同源itr2的那些平均减少约6倍(表4)。

表4.itr2之间的低产量和差异,和具有异源性itr2和itr5的aav2的转基因效价

id:aav载体的编号;gc:基因组拷贝。a值代表平均值±sem。

然而,具有异源性itr的aav制备物的southern印迹分析揭示基因组完整性无明显改变(图3a)。

为测试异源性itr在二元aav杂合ak载体中的纳入是否能增强尾-头生产性多联体的形成和全长蛋白质转导,同时减少截短蛋白的生成,发明人用编码abca4或myo7a、具有异源性itr2和itr5(以5:2/2:5构型)或同源itr2(图3b、3e)的二元aav杂合载体感染hek293细胞。

鉴于itr2之间的差异和具有异源但非同源itr的载体的转基因效价(表4),发明人基于itr2或转基因效价,对各载体用104基因组拷贝(gc)/细胞来感染细胞。基于itr2效价,用二元aav载体感染的hek293细胞的western印迹分析,采用抗3xflag(以检测abca4-3xflag,图3b)或抗myo7a(图3e)抗体,显示异源性itr2和itr5的纳入所导致的全长和截短蛋白的水平高于同源itr2(图3b、c、d、f)。然而,当hek293细胞用基于转基因效价的相同二元aav载体制备物感染时并没有观察到该情况(图3b、d)。总而言之,全长和截短蛋白表达之间的比例类似,无关于载体中所包括的itr(图3c、d、f)和用于给予细胞的载体效价(图3b、c、d)。

5'半部载体中的cl1降解决定子减少截短蛋白产物的生成

为了选择性地减少由二元aav杂合载体14的各5'-和3'半部产生的截短蛋白产物的水平,发明人将推定的降解序列置于5'半部载体中剪接供体信号之后的ak和右itr之间,和3'半部载体中的ak和剪接受体信号之间(图1)。因此,该降解信号将被包括在截短物中但不在全长蛋白中,得到经剪接的mrna。作为5'半部载体中的降解信号,发明人已包括:(i)cl1降解决定子(cl1)、(ii)4个拷贝的mir-let7b靶位点(4xlet7b)、(iii)4个拷贝的mir-26a靶位点(4x26a)或(iv)mir-204和mir-124靶位点各自3个拷贝的组合(3x204+3x124)(表2)。作为3'半部载体中的降解信号,发明人已包括:(i)3终止密码子(stop)、(ii)单一(pb29)或三个串联拷贝(3xpb29)中的pb29,或(iii)泛素(表2)。发明人生成了编码abca4的、包括不同的降解信号的二元aav2/2杂合ak载体,并评价了它们在感染hek293细胞[m.o.i.:各载体,5x104基因组拷贝(gc)/细胞]之后的功效。因为mir-let7b、mir-26a、mir-204和mir-124在hek293细胞中低表达或完全不存在(ambionmirna研究指南和37),为了测试含有这些mir的靶位点的构建体的沉默,发明人用mir模拟物(即化学修饰的小双链rna,其模拟内源性mir38)转染细胞,然后用包含对应靶位点的aav2/2载体进行感染。为了确定实现包含对应mir靶位点的基因的沉默所需的mir模拟物浓度,发明人采用编码报告egfp蛋白质且在聚腺苷酸化信号之前包含mir靶位点的质粒(数据未显示)。相同实验设置用于进一步评价二元aav杂合ak载体情况中的mir靶位点。发明人发现,mir-204+124和26a靶序列在二元aav杂合ak载体的5'半部中的纳入减少了(虽然未消除)截短蛋白产物的表达,但不影响全长蛋白质表达(图4)。不同地,mir-let7b靶位点的纳入未能有效减少截短蛋白表达(图4)。

显然,如图5a中所示,发明人发现,cl1降解信号在5'半部载体中的纳入将截短蛋白表达减少到无法检测的水平,但不影响全长蛋白质表达(图5a)。鉴于介导cl1降解的泛素化途径的酶的组织特异性表达的差异31可能有关于cl1功效的改变,发明人进一步评价了cl1降解决定子在猪视网膜中的功效,其大小和结构类似于人19,30,39,40,因此是用于评价载体安全和功效的优良的临床前大动物模型。为此,发明人在大白猪中视网膜下注射编码abca4的aav2/8二元aav杂合ak载体(其中5'半部载体包括或不包括cl1序列)(各载体的剂量/眼:1x1011gc)。显然,发明人发现,cl1降解信号在5'半部载体中的纳入导致截短蛋白表达的显著减少,低于western印迹分析的检测限,但不影响全长蛋白质表达(图5b)。在3'半部载体中测试的降解信号中,发明人发现终止密码子不影响截短蛋白生成。不同地,pb29(以单一或三个串联拷贝形式)和泛素均全部有效于减少截短蛋白表达。然而,尽管泛素也消除全长蛋白质表达,但pb29对全长蛋白质生成的影响程度较低(图6)。

在3'半部载体中测试的降解信号中,发明人鉴定出既减少截短蛋白产物的水平又减少全长蛋白的水平的三个(pb29、3xpb29和泛素)(图6和表5和6)。

表5.相对于截短蛋白表达的全长abca4的定量,来自对用在5'半部载体中包括mir靶位点的二元aav杂合载体感染的hek293细胞的western印迹分析

值代表在对应模拟物或序列打乱的模拟物的存在下,全长abca4和截短蛋白条带的强度之间的比例(来自三个独立实验)的平均值±s.e.m.。在序列打乱的或对应模拟物的的存在下,对于各对载体的比例,采用斯氏t检验进行比较且发现无显著差异。

表6:全长abca4和截短蛋白表达的定量,来自对用在3'半部载体中包括降解信号的二元aav杂合载体感染的hek293细胞的western印迹分析。

值表示为来自具有或不具有降解信号的载体的全长abca4和截短蛋白条带的强度之间的比例(来自三个独立实验)的平均值±s.e.m.。对于统计学分析的更多细节包括特异性统计学值可见于材料与方法部分的统计学分析段落。

改进的二元aav载体的视网膜下给予减少了abca4-/-视网膜中的脂褐质累积

基于我们的发现结果,改进的二元aav杂合-abca4载体应包括同源itr2、ak同源区域和cl1。因为abca4在人的视杆和视锥光感受器中表达70,发明人鉴定了用于abca4递送的合适的启动子,通过比较来自人grk1(g蛋白质-偶联的受体激酶1)或irbp(光感受器间类视黄醇结合蛋白质)启动子的编码egfp的单一aav2/8载体的pr转导性质,它们已被描述为在不同的物种中驱动高水平的联合视杆和视锥pr转导53-55。利用包括类似于人黄斑的具有视锥:视杆=1:3的线状区域56的猪视网膜架构,发明人在3月龄大白猪中视网膜下注射1x1011gc/眼的aav2/8-grk1-或irbp-egfp载体。注射后四周,发明人在荧光显微镜下分析了对应的视网膜冷冻切片。pr细胞层中的egfp荧光定量(图10a-b)显示这两种启动子均产生了相当水平的pr转导(该区域中主要是视杆)。然而,当发明人对用针对视锥抑制蛋白(car)(也是egfp阳性)57引起的抗体标记的视椎数量进行计数时,发现采用grk1启动子产生了较高的(尽管不是统计学显著水平的)视锥pr转导(材料,图10c-d)。因此,发明人将grk1启动子纳入我们的改进的二元aav杂合abca4载体中,并研究它们表达abca4并减少abca4-/-小鼠的rpe中的含a2e的自发荧光的脂褐质物质的异常含量的能力。发明人初始用改进的二元aav载体(各载体剂量/眼:2x109gc)视网膜下注射一月龄c57/bl6小鼠,并通过western印迹发现24只中的12只(50%)注射眼具有可检测的(尽管是可变的)水平的全长abca4蛋白[图8a;abca4-阳性眼中的abca4蛋白水平:2,8±0,7a.u.(平均值±平均值的标准误)]。这类似于我们先前的发现,即,不同形式的二元aav平台导致50%abca4-表达眼14。然后,发明人用改进的二元aav载体视网膜下注射5.5月龄色素化abca4-/-小鼠的眼的颞区域(各载体剂量/眼:1.8x109gc)。三个月后,发明人收获眼并检测视网膜冷冻切片上的眼的颞区域中的脂褐质荧光的水平(激发:560±40nm;发射:645±75)[在仅rpe中或在rpe+外节(os)中](图8b-c和图11)。发明人发现,未处理的abca4-/-的眼的该区域中的脂褐质荧光强度显著高于用治疗性二元aav杂合abca4载体注射的abca4+/-和-/-小鼠(图8b、c和图11)。然后,发明人采用透射电子显微镜对rpe脂褐质颗粒的数量进行计数。相较于年龄匹配的abca4+/+对照,这些在用pbs注射的5.5-6-月龄白化abca4-/-小鼠中增加(图8d),增加的水平类似于发明人已独立地在未注射或注射有对照aav载体的abca4-/-小鼠中所检测到的那些(数据未显示)。abca4-/-rpe中的脂褐质颗粒的数量在视网膜下注射改进的二元aav杂合abca4载体后3个月标准化(各载体剂量/眼:1x109gc,图8d)。

改进的二元aav载体在视网膜下给予小鼠和猪视网膜之后是安全的

为了研究改进的二元aav2/8杂合abca4载体的安全性,发明人将它们视网膜下注射进入野生型c57bl/6小鼠和大白猪(各载体剂量/眼:分别为3x109和1x1011gc)。注射后一个月,发明人通过ganzfeld视网膜电图(erg)检测了视网膜电活动,并发现在用二元aav杂合abca4载体注射的小鼠眼和用阴性对照aav载体或pbs注射的眼之间,a-和b-波幅均无显著不同(图9a和材料,图12a)。相似地,在用二元aav杂合abca4载体注射的猪眼和用pbs注射的对照眼的那些中,暗视、明视、最大响应和闪烁erg测试中的b-波幅是相当的(图9b和材料,图12b)。

讨论

aav限制的包装能力代表着扩大aav在ird基因治疗中的应用的主要障碍之一。然而,近期,若干研究组已独立地报道二元aav载体能有效地扩大aav在小鼠和猪视网膜中的装载能力14,17,19,41,从而拓展了aav对于ird的应用性,这归因于不适于单一典型aav载体的基因中的突变。发明人在此设计并克服了与二元aav载体的应用相关联的一些限制,即它们相较于单一载体时相对较低的功效,以及可能引起安全性问题的截短蛋白的生成。

目的在于增加二元aav基因组尾-头连环化的策略应理论上增加全长的水平并减少来自游离单一半部载体的截短蛋白的水平。发明人通过包括同源性或异源性itr的最佳区域,设计改善了尾-头二元aav杂合基因组连环化。在前述同源性区域的并行评价中,发明人发现,采用二元aav杂合ak载体,近期由lostal等20公开的ap1和ap2序列和来自f1噬菌体的ak序列14驱动总体类似水平的蛋白质体外表达,所述载体在小鼠视网膜中驱动更一致的abca4表达。独立地,不同的同源区域的可用性有利于引导三元aav载体的正确连环化以进一步扩大aav装载能力20,42。异源性itr2和itr5已被成功地纳入二元24,25和三元42aav载体。发明人发现,具有异源性itr2和itr5的aav载体的产量低于具有同源itr2的那些。发明人还检测到,当发明人探测它们的itr2时,较少载体基因组具有异源性itr,相较于当发明人探测它们的基因组的不同区域时。由于发明人显示rep5干扰具有itr2的载体的生产,这表明在具有异源性itr的aav载体中包括的itr2的水平下的异常现象,其在rep5的存在下产生,但在具有同源itr2的aav载体中并非如此,其仅在rep2的存在下产生并且无论在发明人探测itr2还是该基因组的不同区域时均显示类似效价。这些结果部分区别于先前报道的那些(其中具有异源性itr2和itr5的二元aav载体的转导功效高于具有同源itr的载体并且明显无生产问题24,25)。除了不同的包装构建体和生成方案以外,在该研究中,发明人采用包括两种半部载体之间的同源区域(与用于先前报道中的反式剪接系统相反,其简单地依赖于itr用于连环化24,25)的二元aav杂合载体。由于在二元aav杂合载体中,全长基因的重建主要由载体中包括的同源区域16(其引导多联体形成)介导,这可造成发明人采用具有异源性itr的载体相较于采用反式剪接载体的先前研究24,25观察到的在转基因表达方面的较小增加。此外,发明人可能高估了具有异源性itr的载体的功效,由于发明人基于比分别对于myo7a-和abca4-表达载体的转基因序列所计算的结果低3-6倍的对itr2计算的效价使用它们。由于在具有同源itr2的对应的二元aav载体之间对于itr2和转基因序列计算的效价类似,发明人以比采用异源性itr2和itr5的那些低3-6倍的体积使用它们。这可以解释来自具有异源性itr的二元aav载体的全长和截短蛋白产物的水平明显高于具有同源itr的情况。

在发明人的先前研究中,直至视网膜下给予二元aav载体后8个月,发明人未观察到局部毒性的迹象14,然而,来自二元aav的单一半部载体的截短蛋白产物的生成可能会引起安全性问题。已显示,mir靶位点在基因的转录本中的纳入是限制不同的组织(包括视网膜30)中的转基因表达的有效策略。然而,仅在发明人纳入mir-204+124和26a的靶位点时,发明人体外实现了截短蛋白生成的部分减少。事实上,mir靶位点外部的mrna特征可能会影响沉默的功效43,44。就此而言,因为衍生自5'半部的截短蛋白产物产生自不具有典型聚腺苷酸化信号的载体,所得mrna可能无法经历高效的mir-介导的沉默。重要的是,发明人通过纳入cl1降解决定子实现了来自5'半部载体的截短蛋白产物的完全降解。发明人显示,该信号在体外和猪视网膜中均有效,指示cl1活性所需的降解途径的酶在不同的细胞类型中表达。由于来自3'半部载体的截短蛋白产物的丰度低于由5'半部载体产生的情况(图6),其存在引起的安全性问题应较低。本文所示的小鼠和猪视网膜中的数据支持改进的二元aav载体的安全性。

显然,发明人发现视网膜下给予改进的二元aav载体(该载体受控于grk1启动子,其提供高水平的联合视杆和视锥转导),导致小鼠中的有效的abca4递送,尽管其处于变化水平。这可能归因于小鼠眼中视网膜下注射的遗传变异性和二元aav系统的功效总体低于单一aav载体14。不论该变异性,发明人发现二元aav介导的abca4递送导致abca4-/-视网膜中的显著脂褐质减少,这表明广泛多种转基因表达水平可相似地贡献治疗功效。采用两种独立技术观察到该情况,然而,当发明人解剖并分析视网膜的aav转导区域(其实际显示脂褐质颗粒数量标准化)时,观察到更显著的表型改善。总而言之,本发明提供具有适于临床应用(具体地用于治疗视网膜疾病)的改进特征的多重载体。此外,本发明改善了进一步扩大装载能力的多重载体的安全性和功效20,42

参考文献

1.trapani,i等(2014).progressinretinalandeyeresearch43:108-128.

2.boye,se,boye,sl,lewin,as和hauswirth,ww(2013).moleculartherapy:thejournaloftheamericansocietyofgenetherapy21:509-519.

3.bainbridge,jw等.(2008).thenewenglandjournalofmedicine358:2231-2239.

4.maguire,am等.(2009).lancet374:1597-1605.

5.maguire,am等.(2008).thenewenglandjournalofmedicine358:2240-2248.

6.cideciyan,av等.(2009).humangenetherapy20:999-1004.

7.simonelli,f等.(2010).moleculartherapy:thejournaloftheamericansocietyofgenetherapy18:643-650.

8.allikmets,r等.(1997).naturegenetics15:236-246.

9.molday,rs和zhang,k(2010).progressinlipidresearch49:476-492.

10.millan,jm等.(2011).journalofophthalmology2011:417217.

11.hasson,t等.(1995).pnas92:9815-9819.

12.liu,x,ondek,b和williams,ds(1998).naturegenetics19:117-118.

13.gibbs,d等.(2010).investigativeophthalmology&visualscience51:1130-1135.

14.trapani,i,colella,p,sommella,a,iodice,c,cesi,g,desimone,s等.(2014).通过二元aav载体有效地递送大基因至视网膜(effectivedeliveryoflargegenestotheretinabydualaavvectors).embomolecularmedicine6:194-211.

15.duan,d,yue,y和engelhardt,jf(2001).moleculartherapy:thejournaloftheamericansocietyofgenetherapy4:383-391.

16.ghosh,a,yue,y,lai,y和duan,d(2008).moleculartherapy:thejournaloftheamericansocietyofgenetherapy16:124-130.

17.dyka,fm等.,(2014).humangenetherapymethods25:166-177.

18.lopes,vs等.(2013).genether.

19.colella,p等.(2014).genether21:450-456.

20.lostal,w,kodippili,k,yue,y和duan,d(2014).humangenetherapy25:552-562.

21.flotte,tr等.(1993).thejournalofbiologicalchemistry268:3781-3790.

22.ghosh,a,yue,y和duan,d(2011).humangenetherapy22:77-83.

23.chiorini,ja等.,(1999).journalofvirology73:1309-1319.

24.yan,z,zak,r,zhang,y和engelhardt,jf(2005).journalofvirology79:364-379.

25.yan,z等.(2007).humangenetherapy18:81-87.

26.karali等.(2010).bmcgenomics11:715.

27.kutty,rk等.(2010).molecularvision16:1475-1486.

28.ragusa,m等.(2013).molecularvision19:430-440.

29.sundermeier,tr和palczewski,k(2012).cellularandmolecularlifesciences:cmls69:2739-2750.

30.karali,m等.(2011).plosone6:e22166.

31.gilon,t,chomsky,o和kulka,rg(1998).theembojournal17:2759-2766.

32.bence,nf,sampat,rm和kopito,rr(2001).science292:1552-1555.

33.bachmair,a,finley,d和varshavsky,a(1986).science234:179-186.

34.johnson,es等.,(1992).theembojournal11:497-505.

35.sadis,s等.,(1995).molecularandcellularbiology15:4086-4094.

36.chiorini,ja,afione,s和kotin,rm(1999).journalofvirology73:4293-4298.

37.tian,w等.(2012).plosone7:e29551.

38.wang,z(2011).methodsinmolecularbiology676:211-223.

39.mussolino,c等.(2011).genether18:637-645.

40.hendrickson,a和hicks,d(2002).experimentaleyeresearch74:435-444.

41.reich,sj等.(2003).humangenetherapy14:37-44.

42.koo,t等.,(2014).humangenetherapy25:98-108.

43.walters,rw,bradrick,ss和gromeier,m(2010).rna16:239-250.

44.ricci,ep等.(2011).nucleicacidsresearch39:5215-5231.

45.auricchio等.(2001).humanmoleculargenetics10:3075-3081.

46.gao,g等.(2000).humangenetherapy11:2079-2091.

47.young,je等.,(2003).investigativeophthalmology&visualscience44:4076-4085.

48.doria,m等.,(2013).humangenetherapymethods24:392-398.

49.zhang,y等.,(2000).journalofvirology74:8003-8010.

50.drittanti,l等.,(2000).genether7:924-929.

51.gargiulo,s等.(2012).ilarjournal/nationalresearchcouncil,instituteoflaboratoryanimalresources53:e70-81.

52.liang,fq等.,(2001).methodsinmolecularmedicine47:125-139.

53.beltran等.(2012)proc.natl.acad.sci.u.s.a.,109,2132-2137.

54.boye,s.e.等.(2012)hum.genether.,23,1101-1115.

55.khani,s.c.等.,(2007)invest.ophthalmol.vis.sci.,48,3954-3961.

56.chandler,m.j.等.,(1999)vet.ophthalmol.,2,179-184.

57.li,a.,zhu,x.和craft,c.m.(2002)invest.ophthalmol.vis.sci.,43,1375-1383.

58.allocca,m.等.(2008)j.clin.invest.,118,1955-1964.

59.parish,c.a.等.,(1998)proc.natl.acad.sci.u.s.a.,95,14609-14613.

60.ben-shabat,s.等.,(2002)j.biol.chem.,277,7183-7190.

61.gargiulo,s.等.,(2012)ilarj,53,e70-81.

62.liang,f.q.等.,(2001)methodsmol.med.,47,125-139.

63.gargiulo,a.等.(2009)mol.ther.,17,1347-1354.

64.manfredi,a.等.(2013)hum.genether.,24,982-992.

65.venablesvn和ripleybd.(2002)《采用s.的现代应用统计学》(modernappliedstatisticswiths.)施普林格科学+商业媒体出版社(springerscience+businessmedia),美国纽约.

66.li,a.,zhu,x.,brown,b.和craft,c.m.(2003)adv.exp.med.biol.,533,361-368.

67.li,a.等.(2003)invest.ophthalmol.vis.sci.,44,996-1007.

68.allocca,m.等.(2011)invest.ophthalmol.vis.sci.,52,5713-5719.

69.testa,f.等.(2011)invest.ophthalmol.vis.sci.,52,5618-5624.

70.molday,l.l.,rabin,a.r.和molday,r.s.(2000)nat.genet.,25,257-258.

71.sparrow,j.r.,wu,y.,nagasaki,t.,yoon,k.d.,yamamoto,k.和zhou,j.(2010)photochemphotobiolsci,9,1480-1489.

72.sparrow,j.r.和duncker,t.(2014)jclinmed,3,1302-1321.

73.finnemann,s.c.,leung,l.w.和rodriguez-boulan,e.(2002)proc.natl.acad.sci.u.s.a.,99,3842-3847.

74.secondi,r.,kong,j.,blonska,a.m.,staurenghi,g.和sparrow,j.r.(2012)invest.ophthalmol.vis.sci.,53,5190-5197.

75.delori,f.c.,dorey,c.k.,staurenghi,g.,arend,o.,goger,d.g.和weiter,j.j.(1995)invest.ophthalmol.vis.sci.,36,718-729.

序列表

<110>泰莱托恩基金会(fondazionetelethon)

<120>多重载体系统及其应用

<130>pct129062

<150>us62/127,463

<151>2015-03-03

<160>78

<170>patentinversion3.5

<210>1

<211>16

<212>prt

<213>人工序列

<220>

<223>合成

<400>1

alacyslysasntrppheserserleuserhisphevalilehisleu

151015

<210>2

<211>35

<212>prt

<213>人工序列

<220>

<223>合成

<400>2

serleuileserleuproleuprothrargvallyspheserserleu

151015

leuleuileargilemetlysileilethrmetthrpheprolyslys

202530

leuargser

35

<210>3

<211>16

<212>prt

<213>人工序列

<220>

<223>合成

<400>3

phetyrtyrproiletrpphealaargvalleuleuvalhistyrgln

151015

<210>4

<211>46

<212>prt

<213>人工序列

<220>

<223>合成

<400>4

serasnpropheserserleupheglyalaserleuleuileaspser

151015

valserleulysserasntrpaspthrsersersersercysleuile

202530

serphepheserservalmetpheserserthrthrargser

354045

<210>5

<211>39

<212>prt

<213>人工序列

<220>

<223>合成

<400>5

cysargglnargphesercyshisleuthralasertyrproglnser

151015

thrvalthrpropheleualapheleuargargaspphephepheleu

202530

arghisasnserseralaasp

35

<210>6

<211>46

<212>prt

<213>人工序列

<220>

<223>合成

<400>6

glyalaprohisvalvalleupheaspphegluleuargilethrasn

151015

proleuserhisileglnservalserleuglnilethrleuilephe

202530

cysserleuproserleuileleuserlyspheleuglnval

354045

<210>7

<211>39

<212>prt

<213>人工序列

<220>

<223>合成

<400>7

asnthrproleupheserlysserpheserthrthrcysglyvalala

151015

lyslysthrleuleuleualaglnileserserleuphepheleuleu

202530

leuserserasnilealaval

35

<210>8

<211>45

<212>prt

<213>人工序列

<220>

<223>合成

<400>8

prothrvallysasnserprolysilephecysleuserserserpro

151015

tyrleualapheasnleuglutyrleuserleuargilepheserthr

202530

leuserlyscysserasnthrleuleuthrserleuser

354045

<210>9

<211>30

<212>prt

<213>人工序列

<220>

<223>合成

<400>9

serasnglnleulysargleutrpleutrpleuleugluvalargser

151015

pheaspargthrleuargargprotrpilehisleuproser

202530

<210>10

<211>50

<212>prt

<213>人工序列

<220>

<223>合成

<400>10

serileserphevalileargserhisalaserileargmetglyala

151015

serasnaspphephehislysleutyrphethrlyscysleuthrser

202530

valileleuserlyspheleuilehisleuleuleuargserthrpro

354045

argval

50

<210>11

<211>22

<212>dna

<213>人工序列

<220>

<223>合成

<400>11

aggcataggatgacaaagggaa22

<210>12

<211>20

<212>dna

<213>人工序列

<220>

<223>合成

<400>12

ggcattcaccgcgtgcctta20

<210>13

<211>22

<212>dna

<213>人工序列

<220>

<223>合成

<400>13

agcctatcctggattacttgaa22

<210>14

<211>9

<212>prt

<213>人工序列

<220>

<223>合成

<400>14

sertrpasnphelysleutyrvalmet

15

<210>15

<211>14

<212>prt

<213>人工序列

<220>

<223>合成

<400>15

methissertrpasnphelysleutyrvalmetglysergly

1510

<210>16

<211>48

<212>dna

<213>人工序列

<220>

<223>合成

<400>16

gcctgcaagaactggttcagcagcctgagccacttcgtgatccacctg48

<210>17

<211>158

<212>dna

<213>人工序列

<220>

<223>合成

<400>17

aggcataggatgacaaagggaacgataggcataggatgacaaagggaaaagcttaggcat60

aggatgacaaagggaaggtaccagatctggcattcaccgcgtgccttacgatggcattca120

ccgcgtgccttaaagcttggcattcaccgcgtgcctta158

<210>18

<211>102

<212>dna

<213>人工序列

<220>

<223>合成

<400>18

agcctatcctggattacttgaacgatagcctatcctggattacttgaaaagcttagccta60

tcctggattacttgaatcacagcctatcctggattacttgaa102

<210>19

<211>42

<212>dna

<213>人工序列

<220>

<223>合成

<400>19

atgcacagctggaacttcaagctgtacgtcatgggcagcggc42

<210>20

<211>27

<212>dna

<213>人工序列

<220>

<223>合成

<400>20

agctggaacttcaagctgtacgtcatg27

<210>21

<211>136

<212>dna

<213>人工序列

<220>

<223>合成

<400>21

atgcacagctggaacttcaagctgtacgtcatgggcagcggcggggtaccatgcacagct60

ggaacttcaagctgtacgtcatgggcagcggcggatgcacagctggaacttcaagctgta120

cgtcatgggcagcggc136

<210>22

<211>77

<212>dna

<213>人工序列

<220>

<223>合成

<400>22

gggatttttccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaac60

gcgaattttaacaaaat77

<210>23

<211>77

<212>dna

<213>人工序列

<220>

<223>合成

<400>23

gggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaac60

gcgaattttaacaaaat77

<210>24

<211>287

<212>dna

<213>人工序列

<220>

<223>合成

<400>24

ccccgggtgcgcggcgtcggtggtgccggcggggggcgccaggtcgcaggcggtgtaggg60

ctccaggcaggcggcgaaggccatgacgtgcgctatgaaggtctgctcctgcacgccgtg120

aaccaggtgcgcctgcgggccgcgcgcgaacaccgccacgtcctcgcctgcgtgggtctc180

ttcgtccaggggcactgctgactgctgccgatactcggggctcccgctctcgctctcggt240

aacatccggccgggcgccgtccttgagcacatagcctggaccgtttc287

<210>25

<211>288

<212>dna

<213>人工序列

<220>

<223>合成

<400>25

cgcagggcagcctctgtcatctccatcagggaggggtccagtgtggagtctcggtggatc60

tcgtatttcatgtctccaggctcaaagagacccatgagatgggtcacagacgggtccagg120

gaagcctgcatgagctcagtgcggttccacacataccgggcaccctggcgcttcgccagc180

cattcctgcaccagattcttcccgtccagcctggtcccaccttggctgtagtcatctggg240

tactcagggtctggggttcccatgcgaaacatgtactttcggcctcca288

<210>26

<211>278

<212>dna

<213>人工序列

<220>

<223>合成

<400>26

gtgatcctaggtggaggccgaaagtacatgtttcgcatgggaaccccagaccctgagtac60

ccagatgactacagccaaggtgggaccaggctggacgggaagaatctggtgcaggaatgg120

ctggcgaagcgccagggtgcccggtacgtgtggaaccgcactgagctcatgcaggcttcc180

ctggacccgtctgtgacccatctcatgggtctctttgagcctggagacatgaaatacgag240

atccaccgagactccacactggacccctccctgatgga278

<210>27

<211>82

<212>dna

<213>人工序列

<220>

<223>合成

<400>27

gtaagtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgaga60

cagagaagactcttgcgtttct82

<210>28

<211>51

<212>dna

<213>人工序列

<220>

<223>合成

<400>28

gataggcacctattggtcttactgacatccactttgcctttctctccacag51

<210>29

<211>130

<212>dna

<213>人工序列

<220>

<223>合成

<400>29

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcct130

<210>30

<211>130

<212>dna

<213>人工序列

<220>

<223>合成

<400>30

aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgagg60

ccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagc120

gagcgcgcag130

<210>31

<211>175

<212>dna

<213>人工序列

<220>

<223>合成

<400>31

ctctcccccctgtcgcgttcgctcgctcgctggctcgtttgggggggtggcagctcaaag60

agctgccagacgacggccctctggccgtcgcccccccaaacgagccagcgagcgagcgaa120

cgcgacaggggggagagtgccacactctcaagcaagggggttttgtaagcagtga175

<210>32

<211>175

<212>dna

<213>人工序列

<220>

<223>合成

<400>32

tcactgcttacaaaacccccttgcttgagagtgtggcactctcccccctgtcgcgttcgc60

tcgctcgctggctcgtttgggggggcgacggccagagggccgtcgtctggcagctctttg120

agctgccacccccccaaacgagccagcgagcgagcgaacgcgacaggggggagag175

<210>33

<211>153

<212>dna

<213>人工序列

<220>

<223>合成

<400>33

tcaatattggccattagccatattattcattggttatatagcataaatcaatattggcta60

ttggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtcc120

aatatgaccgccatgttggcattgattattgac153

<210>34

<211>583

<212>dna

<213>人工序列

<220>

<223>合成

<400>34

tagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccg60

cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccatt120

gacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtca180

atgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgcc240

aagtccgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagta300

catgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgctattac360

catggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacgggg420

atttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacg480

ggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgt540

acggtgggaggtctatataagcagagctcgtttagtgaaccgt583

<210>35

<211>133

<212>dna

<213>人工序列

<220>

<223>合成

<400>35

gtaagtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgaga60

cagagaagactcttgcgtttctgataggcacctattggtcttactgacatccactttgcc120

tttctctccacag133

<210>36

<211>299

<212>dna

<213>人工序列

<220>

<223>合成

<400>36

ctagtgggccccagaagcctggtggttgtttgtccttctcaggggaaaagtgaggcggcc60

ccttggaggaaggggccgggcagaatgatctaatcggattccaagcagctcaggggattg120

tctttttctagcaccttcttgccactcctaagcgtcctccgtgaccccggctgggattta180

gcctggtgctgtgtcagccccgggctcccaggggcttcccagtggtccccaggaaccctc240

gacagggccagggcgtctctctcgtccagcaagggcagggacgggccacaggcaagggc299

<210>37

<211>365

<212>dna

<213>人工序列

<220>

<223>合成

<400>37

ctagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttcc60

gcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccat120

tgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtc180

aatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgc240

caagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagt300

acatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctatta360

ccatg365

<210>38

<211>229

<212>dna

<213>人工序列

<220>

<223>合成

<400>38

tcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaa60

ttttgtatttatttattttttaattattttgtgcagcgatgggggcggggcggggcgagg120

cggagaggtgcggcggcagccaatcggagcggcgcgctccgaaagtttccttttatggcg180

aggcggcggcggcggcggctctataaaaagcgaagcgcgcggcgggcgg229

<210>39

<211>235

<212>dna

<213>人工序列

<220>

<223>合成

<400>39

agcacagtgtctggcatgtagcaggaactaaaataatggcagtgattaatgttatgatat60

gcagacacaacacagcaagataagatgcaatgtaccttctgggtcaaaccaccctggcca120

ctcctccccgatacccagggttgatgtgcttgaattagacaggattaaaggcttactgga180

gctggaagccttgccccaactcaggagtttagccccagaccttctgtccaccagc235

<210>40

<211>22

<212>dna

<213>人工序列

<220>

<223>合成

<400>40

aaccacacaacctactacctca22

<210>41

<211>102

<212>dna

<213>人工序列

<220>

<223>合成

<400>41

aaccacacaacctactacctcacgataaccacacaacctactacctcaaagcttaaccac60

acaacctactacctcatcacaaccacacaacctactacctca102

<210>42

<211>105

<212>dna

<213>人工序列

<220>

<223>合成

<400>42

agcctgatcagcctgcccctgcccacccgggtgaagttcagcagcctgctgctgatccgg60

atcatgaagatcatcaccatgaccttccccaagaagctgcggagc105

<210>43

<211>48

<212>dna

<213>人工序列

<220>

<223>合成

<400>43

ttctactaccccatctggttcgcccgggtgctgctggtgcactaccag48

<210>44

<211>138

<212>dna

<213>人工序列

<220>

<223>合成

<400>44

agcaaccccttcagcagcctgttcggcgccagcctgctgatcgacagcgtgagcctgaag60

agcaactgggacaccagcagcagcagctgcctgatcagcttcttcagcagcgtgatgttc120

agcagcaccacccggagc138

<210>45

<211>117

<212>dna

<213>人工序列

<220>

<223>合成

<400>45

tgccggcagcggttcagctgccacctgaccgccagctacccccagagcaccgtgaccccc60

ttcctggccttcctgcggcgggacttcttcttcctgcggcacaacagcagcgccgac117

<210>46

<211>138

<212>dna

<213>人工序列

<220>

<223>合成

<400>46

ggcgccccccacgtggtgctgttcgacttcgagctgcggatcaccaaccccctgagccac60

atccagagcgtgagcctgcagatcaccctgatcttctgcagcctgcccagcctgatcctg120

agcaagttcctgcaggtg138

<210>47

<211>117

<212>dna

<213>人工序列

<220>

<223>合成

<400>47

aacacccccctgttcagcaagagcttcagcaccacctgcggcgtggccaagaagaccctg60

ctgctggcccagatcagcagcctgttcttcctgctgctgagcagcaacatcgccgtg117

<210>48

<211>135

<212>dna

<213>人工序列

<220>

<223>合成

<400>48

cccaccgtgaagaacagccccaagatcttctgcctgagcagcagcccctacctggccttc60

aacctggagtacctgagcctgcggatcttcagcaccctgagcaagtgcagcaacaccctg120

ctgaccagcctgagc135

<210>49

<211>90

<212>dna

<213>人工序列

<220>

<223>合成

<400>49

agcaaccagctgaagcggctgtggctgtggctgctggaggtgcggagcttcgaccggacc60

ctgcggcggccctggatccacctgcccagc90

<210>50

<211>150

<212>dna

<213>人工序列

<220>

<223>合成

<400>50

agcatcagcttcgtgatccggagccacgccagcatccggatgggcgccagcaacgacttc60

ttccacaagctgtacttcaccaagtgcctgaccagcgtgatcctgagcaagttcctgatc120

cacctgctgctgcggagcaccccccgggtg150

<210>51

<211>11

<212>dna

<213>人工序列

<220>

<223>合成

<400>51

tgaatgaatga11

<210>52

<211>243

<212>dna

<213>人工序列

<220>

<223>合成

<400>52

ttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagt60

gaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataa120

gctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcaggggg180

agatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataagg240

atc243

<210>53

<211>2918

<212>dna

<213>人工序列

<220>

<223>合成

<400>53

atgggcttcgtgagacagatacagcttttgctctggaagaactggaccctgcggaaaagg60

caaaagattcgctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatc120

tggttaaggaatgccaacccgctctacagccatcatgaatgccatttccccaacaaggcg180

atgccctcagcaggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccc240

tgttttcaaagccccaccccaggagaatctcctggaattgtgtcaaactataacaactcc300

atcttggcaagggtatatcgagattttcaagaactcctcatgaatgcaccagagagccag360

caccttggccgtatttggacagagctacacatcttgtcccaattcatggacaccctccgg420

actcacccggagagaattgcaggaagaggaattcgaataagggatatcttgaaagatgaa480

gaaacactgacactatttctcattaaaaacatcggcctgtctgactcagtggtctacctt540

ctgatcaactctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctg600

aaggacatcgcctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgc660

ggggcaaagacggtgcgctatgccctgtgctccctctcccagggcaccctacagtggata720

gaagacactctgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactc780

ctagacagccgttctcaaggtatcaatctgagatcttggggaggaatattatctgatatg840

tcaccaagaattcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgacc900

aggcccctcatgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtct960

gacctcctgtgtggctaccccgagggaggtggctctcgggtgctctccttcaactggtat1020

gaagacaataactataaggcctttctggggattgactccacaaggaaggatcctatctat1080

tcttatgacagaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaat1140

cctttaaccaaaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtac1200

actcctgattcacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaa1260

ctggaacacgttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtac1320

ttctttgacaacagcacacagatgaacatgatcagagataccctggggaacccaacagta1380

aaagactttttgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaac1440

ttcctctacaagggccctcgggaaagccaggctgacgacatggccaacttcgactggagg1500

gacatatttaacatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttg1560

gtcctggataagtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctct1620

ctactggaggaaaacatgttctgggccggagtggtattccctgacatgtatccctggacc1680

agctctctaccaccccacgtgaagtataagatccgaatggacatagacgtggtggagaaa1740

accaataagattaaagacaggtattgggattctggtcccagagctgatcccgtggaagat1800

ttccggtacatctggggcgggtttgcctatctgcaggacatggttgaacaggggatcaca1860

aggagccaggtgcaggcggaggctccagttggaatctacctccagcagatgccctacccc1920

tgcttcgtggacgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtg1980

ctggcatggatctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttg2040

cgactgaaggagaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctgg2100

ttcctggacagcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatg2160

catggaagaatcctacattacagcgacccattcatcctcttcctgttcttgttggctttc2220

tccactgccaccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctg2280

gcagcagcctgtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttc2340

gcctggcaggaccgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtg2400

gcatttggatttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcag2460

tggagcaacatcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatg2520

cagatgatgctccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtg2580

tttccaggagactatggaaccccacttccttggtactttcttctacaagagtcgtattgg2640

cttggcggtgaagggtgttcaaccagagaagaaagagccctggaaaagaccgagccccta2700

acagaggaaacggaggatccagagcacccagaaggaatacacgactccttctttgaacgt2760

gagcatccagggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccc2820

tgtggccggccagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgca2880

ttcctgggccacaatggagctgggaaaaccaccacctt2918

<210>54

<211>3945

<212>dna

<213>人工序列

<220>

<223>合成

<400>54

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180

aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240

atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300

gctcatgtccaatatgaccgccatgttggcattgattattgactagtgggccccagaagc360

ctggtggttgtttgtccttctcaggggaaaagtgaggcggccccttggaggaaggggccg420

ggcagaatgatctaatcggattccaagcagctcaggggattgtctttttctagcaccttc480

ttgccactcctaagcgtcctccgtgaccccggctgggatttagcctggtgctgtgtcagc540

cccgggctcccaggggcttcccagtggtccccaggaaccctcgacagggccagggcgtct600

ctctcgtccagcaagggcagggacgggccacaggcaagggcgcggccgccatgggcttcg660

tgagacagatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattc720

gctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaagga780

atgccaacccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcag840

caggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaa900

gccccaccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaa960

gggtatatcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggcc1020

gtatttggacagagctacacatcttgtcccaattcatggacaccctccggactcacccgg1080

agagaattgcaggaagaggaattcgaataagggatatcttgaaagatgaagaaacactga1140

cactatttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaact1200

ctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcg1260

cctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaaga1320

cggtgcgctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactc1380

tgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagcc1440

gttctcaaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaa1500

ttcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctca1560

tgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgt1620

gtggctaccccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaata1680

actataaggcctttctggggattgactccacaaggaaggatcctatctattcttatgaca1740

gaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaacca1800

aaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgatt1860

cacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacg1920

ttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgaca1980

acagcacacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttt2040

tgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctaca2100

agggccctcgggaaagccaggctgacgacatggccaacttcgactggagggacatattta2160

acatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggata2220

agtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggagg2280

aaaacatgttctgggccggagtggtattccctgacatgtatccctggaccagctctctac2340

caccccacgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataaga2400

ttaaagacaggtattgggattctggtcccagagctgatcccgtggaagatttccggtaca2460

tctggggcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccagg2520

tgcaggcggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtgg2580

acgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatgga2640

tctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaagg2700

agaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggaca2760

gcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaa2820

tcctacattacagcgacccattcatcctcttcctgttcttgttggctttctccactgcca2880

ccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcct2940

gtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcagg3000

accgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggat3060

ttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaaca3120

tcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgc3180

tccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggag3240

actatggaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtg3300

aagggtgttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaa3360

cggaggatccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccag3420

ggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggc3480

cagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggcc3540

acaatggagctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaagg3600

agaccaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgggatttttc3660

cgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaatttta3720

acaaaatattaacgtttataatttcaggtggcatctttcccgcctgcaagaactggttca3780

gcagcctgagccacttcgtgatccacctgcaattgaggaacccctagtgatggagttggc3840

cactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacg3900

cccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag3945

<210>55

<211>3904

<212>dna

<213>人工序列

<220>

<223>合成

<400>55

gtccatcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaaggga60

cattgaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacat120

cctgttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaa180

gtcccaggaggaggcccagctggagatggaagccatgttggaggacacaggcctccacca240

caagcggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgc300

cattgcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtgga360

cccttactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccat420

catcatgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcat480

tgcccagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcac540

aggcttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcag600

tgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcga660

tgacctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttct720

ccaccatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttct780

tccaaataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagac840

gctggctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttt900

tctgaaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaa960

aagagaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagac1020

accccaggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcc1080

tcccccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctcca1140

gcatgtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggactt1200

cctggcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgt1260

tatccctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagca1320

gtacaccttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgt1380

cctcctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagta1440

cccctgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagct1500

gttccagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccag1560

ggagaagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgccccccca1620

gagaacacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgactt1680

cttggtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaa1740

tgaacagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacggg1800

ggaagcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccc1860

tatcactagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaaga1920

caacattaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgt1980

ggcccacaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatgg2040

aatcaccgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagt2100

gctgaccacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgt2160

cccagccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctcca2220

gtttatcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcat2280

gaattattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagc2340

ctacacttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggc2400

ggtcattcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgt2460

ggctttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatctt2520

ggaattatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgct2580

cattgtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggc2640

tgtgacagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactggga2700

cctgattgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgac2760

cctgctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcc2820

cattgttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaa2880

taaaactgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagccc2940

agcagtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagt3000

gaatggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctc3060

aggggatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaa3120

tatgggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatct3180

ttacctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactg3240

gagtattaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgg3300

gggcaacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgct3360

gctggatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcat3420

cgtgagcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatg3480

tgaggcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcac3540

cattcagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatc3600

cccgaaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaactt3660

cccaggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctc3720

ctccctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgagga3780

gtactcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagac3840

tgaaagtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccagga3900

ctga3904

<210>56

<211>4636

<212>dna

<213>人工序列

<220>

<223>合成

<400>56

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180

ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240

ctttcgataggcacctattggtcttactgacatccactttgcctttctctccacaggtcc300

atcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacatt360

gaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctg420

ttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcc480

caggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaag540

cggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccatt600

gcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggaccct660

tactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatc720

atgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcc780

cagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggc840

ttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgag900

gggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgac960

ctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccac1020

catgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttcca1080

aataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctg1140

gctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctg1200

aaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaaga1260

gaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccc1320

caggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctccc1380

ccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcat1440

gtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctg1500

gcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatc1560

cctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtac1620

accttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctc1680

ctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccc1740

tgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttc1800

cagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggag1860

aagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagaga1920

acacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttg1980

gtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaa2040

cagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaa2100

gcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatc2160

actagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaac2220

attaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcc2280

cacaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatc2340

accgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctg2400

accacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtccca2460

gccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagttt2520

atcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaat2580

tattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctac2640

acttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtc2700

attcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggct2760

ttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaa2820

ttatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcatt2880

gtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtg2940

acagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctg3000

attgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctg3060

ctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccatt3120

gttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaa3180

actgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagca3240

gtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaat3300

ggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggg3360

gatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatg3420

ggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttac3480

ctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagt3540

attaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggc3600

aacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctg3660

gatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtg3720

agcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgag3780

gcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccatt3840

cagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccg3900

aaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttccca3960

ggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctcc4020

ctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtac4080

tcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaa4140

agtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggactga4200

gcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactag4260

aatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaac4320

cattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggt4380

tcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaat4440

cgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaatcatta4500

actacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctca4560

ctgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtga4620

gcgagcgagcgcgcag4636

<210>57

<211>4540

<212>dna

<213>人工序列

<220>

<223>合成

<400>57

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180

aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240

atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300

gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360

caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420

taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480

atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540

ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600

acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660

ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720

ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780

ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840

gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900

taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960

acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020

gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080

accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140

ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200

acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260

gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320

ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380

tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440

acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500

ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560

aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620

ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680

tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740

gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800

aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860

agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920

tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980

tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040

acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100

atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160

atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220

cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280

gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340

tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400

tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460

cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520

ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580

aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640

acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700

gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760

gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820

ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880

atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940

ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000

ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060

gggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttg3120

cctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctc3180

cagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatga3240

tcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctcca3300

tgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatc3360

agggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgt3420

cgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcg3480

acccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgct3540

ttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatct3600

atttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctg3660

agctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacc3720

tggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtccca3780

cggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctg3840

tctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccac3900

ttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaacca3960

gagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagc4020

acccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctgggg4080

tatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtc4140

tgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctggga4200

aaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaatagaaact4260

gggcttgtcgagacagagaagactcttgcgtttctgggatttttccgatttcggcctatt4320

ggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgt4380

ttataatttcaggtggcatctttccaattgaggaacccctagtgatggagttggccactc4440

cctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgg4500

gctttgcccgggcggcctcagtgagcgagcgagcgcgcag4540

<210>58

<211>4702

<212>dna

<213>人工序列

<220>

<223>合成

<400>58

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180

ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240

ctttcgataggcacctattggtcttactgacatccactttgcctttctctccacaggtcc300

atcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacatt360

gaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctg420

ttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcc480

caggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaag540

cggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccatt600

gcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggaccct660

tactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatc720

atgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcc780

cagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggc840

ttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgag900

gggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgac960

ctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccac1020

catgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttcca1080

aataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctg1140

gctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctg1200

aaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaaga1260

gaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccc1320

caggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctccc1380

ccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcat1440

gtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctg1500

gcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatc1560

cctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtac1620

accttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctc1680

ctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccc1740

tgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttc1800

cagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggag1860

aagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagaga1920

acacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttg1980

gtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaa2040

cagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaa2100

gcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatc2160

actagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaac2220

attaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcc2280

cacaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatc2340

accgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctg2400

accacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtccca2460

gccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagttt2520

atcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaat2580

tattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctac2640

acttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtc2700

attcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggct2760

ttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaa2820

ttatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcatt2880

gtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtg2940

acagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctg3000

attgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctg3060

ctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccatt3120

gttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaa3180

actgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagca3240

gtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaat3300

ggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggg3360

gatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatg3420

ggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttac3480

ctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagt3540

attaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggc3600

aacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctg3660

gatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtg3720

agcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgag3780

gcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccatt3840

cagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccg3900

aaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttccca3960

ggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctcc4020

ctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtac4080

tcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaa4140

agtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgac4200

tacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatgac4260

aagtgagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccac4320

aactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatt4380

tgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtt4440

tcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtgg4500

taaaatcgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaa4560

tcattaactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgct4620

cgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcct4680

cagtgagcgagcgagcgcgcag4702

<210>59

<211>4718

<212>dna

<213>人工序列

<220>

<223>合成

<400>59

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180

aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240

atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300

gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360

caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420

taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480

atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540

ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600

acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660

ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720

ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780

ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840

gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900

taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960

acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020

gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080

accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140

ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200

acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260

gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320

ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380

tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440

acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500

ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560

aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620

ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680

tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740

gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800

aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860

agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920

tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980

tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040

acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100

atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160

atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220

cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280

gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340

tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400

tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460

cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520

ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580

aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640

acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700

gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760

gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820

ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880

atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940

ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000

ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060

gggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttg3120

cctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctc3180

cagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatga3240

tcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctcca3300

tgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatc3360

agggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgt3420

cgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcg3480

acccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgct3540

ttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatct3600

atttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctg3660

agctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacc3720

tggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtccca3780

cggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctg3840

tctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccac3900

ttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaacca3960

gagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagc4020

acccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctgggg4080

tatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtc4140

tgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctggga4200

aaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaatagaaact4260

gggcttgtcgagacagagaagactcttgcgtttctccccgggtgcgcggcgtcggtggtg4320

ccggcggggggcgccaggtcgcaggcggtgtagggctccaggcaggcggcgaaggccatg4380

acgtgcgctatgaaggtctgctcctgcacgccgtgaaccaggtgcgcctgcgggccgcgc4440

gcgaacaccgccacgtcctcgcctgcgtgggtctcttcgtccaggggcactgctgactgc4500

tgccgatactcggggctcccgctctcgctctcggtaacatccggccgggcgccgtccttg4560

agcacatagcctggaccgtttccaattgaggaacccctagtgatggagttggccactccc4620

tctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggc4680

tttgcccgggcggcctcagtgagcgagcgagcgcgcag4718

<210>60

<211>4880

<212>dna

<213>人工序列

<220>

<223>合成

<400>60

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatccccccgggtgcgcggcgtcggtggtgccggcggggggcgccaggt180

cgcaggcggtgtagggctccaggcaggcggcgaaggccatgacgtgcgctatgaaggtct240

gctcctgcacgccgtgaaccaggtgcgcctgcgggccgcgcgcgaacaccgccacgtcct300

cgcctgcgtgggtctcttcgtccaggggcactgctgactgctgccgatactcggggctcc360

cgctctcgctctcggtaacatccggccgggcgccgtccttgagcacatagcctggaccgt420

ttcgataggcacctattggtcttactgacatccactttgcctttctctccacaggtccat480

cctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacattga540

aaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgtt600

ccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtccca660

ggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaagcg720

gaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattgc780

ctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggaccctta840

ctcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatcat900

gtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgccca960

gggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggctt1020

gtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgaggg1080

gacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacct1140

aactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccacca1200

tgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaaa1260

taagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctggc1320

tgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctgaa1380

ggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagaga1440

aaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacacccca1500

ggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctccccc1560

agagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatgt1620

gcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctggc1680

gcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatccc1740

tccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtacac1800

cttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcct1860

gaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccctg1920

tggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttcca1980

gaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaa2040

gctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaac2100

acagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttggt2160

aaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaaca2220

gaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaagc2280

acttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatcac2340

tagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaacat2400

taaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggccca2460

caacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatcac2520

cgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctgac2580

cacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccagc2640

cagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagtttat2700

cagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaatta2760

ttccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctacac2820

ttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtcat2880

tcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggcttt2940

atcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaatt3000

atttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgt3060

cttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtgac3120

agatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctgat3180

tgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgct3240

ggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccattgt3300

tgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaac3360

tgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagcagt3420

ggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatgg3480

tgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcagggga3540

tgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatggg3600

ctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttacct3660

ttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtat3720

taagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggcaa3780

caagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctgga3840

tgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgag3900

catcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgaggc3960

actgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattca4020

gcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccgaa4080

ggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccagg4140

cagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctccct4200

ggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtactc4260

agtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaag4320

tcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgacta4380

caaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatgacaa4440

gtgagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaa4500

ctagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttg4560

taaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttc4620

aggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggta4680

aaatcgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaatc4740

attaactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcg4800

ctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctca4860

gtgagcgagcgagcgcgcag4880

<210>61

<211>4719

<212>dna

<213>人工序列

<220>

<223>合成

<400>61

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180

aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240

atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300

gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360

caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420

taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480

atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540

ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600

acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660

ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720

ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780

ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840

gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900

taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960

acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020

gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080

accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140

ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200

acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260

gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320

ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380

tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440

acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500

ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560

aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620

ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680

tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740

gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800

aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860

agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920

tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980

tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040

acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100

atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160

atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220

cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280

gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340

tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400

tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460

cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520

ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580

aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640

acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700

gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760

gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820

ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880

atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940

ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000

ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060

gggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttg3120

cctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctc3180

cagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatga3240

tcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctcca3300

tgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatc3360

agggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgt3420

cgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcg3480

acccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgct3540

ttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatct3600

atttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctg3660

agctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacc3720

tggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtccca3780

cggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctg3840

tctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccac3900

ttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaacca3960

gagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagc4020

acccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctgggg4080

tatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtc4140

tgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctggga4200

aaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaatagaaact4260

gggcttgtcgagacagagaagactcttgcgtttctcgcagggcagcctctgtcatctcca4320

tcagggaggggtccagtgtggagtctcggtggatctcgtatttcatgtctccaggctcaa4380

agagacccatgagatgggtcacagacgggtccagggaagcctgcatgagctcagtgcggt4440

tccacacataccgggcaccctggcgcttcgccagccattcctgcaccagattcttcccgt4500

ccagcctggtcccaccttggctgtagtcatctgggtactcagggtctggggttcccatgc4560

gaaacatgtactttcggcctccacaattgaggaacccctagtgatggagttggccactcc4620

ctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccggg4680

ctttgcccgggcggcctcagtgagcgagcgagcgcgcag4719

<210>62

<211>4881

<212>dna

<213>人工序列

<220>

<223>合成

<400>62

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatcccgcagggcagcctctgtcatctccatcagggaggggtccagtgt180

ggagtctcggtggatctcgtatttcatgtctccaggctcaaagagacccatgagatgggt240

cacagacgggtccagggaagcctgcatgagctcagtgcggttccacacataccgggcacc300

ctggcgcttcgccagccattcctgcaccagattcttcccgtccagcctggtcccaccttg360

gctgtagtcatctgggtactcagggtctggggttcccatgcgaaacatgtactttcggcc420

tccagataggcacctattggtcttactgacatccactttgcctttctctccacaggtcca480

tcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacattg540

aaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgt600

tccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtccc660

aggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaagc720

ggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattg780

cctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggaccctt840

actcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatca900

tgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgccc960

agggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggct1020

tgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgagg1080

ggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacc1140

taactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccacc1200

atgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaa1260

ataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctgg1320

ctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctga1380

aggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagag1440

aaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacacccc1500

aggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctcccc1560

cagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatg1620

tgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctgg1680

cgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatcc1740

ctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtaca1800

ccttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcc1860

tgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccct1920

gtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttcc1980

agaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggaga2040

agctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaa2100

cacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttgg2160

taaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaac2220

agaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaag2280

cacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatca2340

ctagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaaca2400

ttaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggccc2460

acaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatca2520

ccgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctga2580

ccacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccag2640

ccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagttta2700

tcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaatt2760

attccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctaca2820

cttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtca2880

ttcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggctt2940

tatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaat3000

tatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattg3060

tcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtga3120

cagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctga3180

ttgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgc3240

tggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccattg3300

ttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaa3360

ctgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagcag3420

tggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatg3480

gtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcagggg3540

atgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatgg3600

gctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttacc3660

tttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagta3720

ttaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggca3780

acaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctgg3840

atgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtga3900

gcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgagg3960

cactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattc4020

agcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccga4080

aggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccag4140

gcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctccc4200

tggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtact4260

cagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaa4320

gtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgact4380

acaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatgaca4440

agtgagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccaca4500

actagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttattt4560

gtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgttt4620

caggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggt4680

aaaatcgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaat4740

cattaactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgctc4800

gctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctc4860

agtgagcgagcgagcgcgcag4881

<210>63

<211>4709

<212>dna

<213>人工序列

<220>

<223>合成

<400>63

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180

aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240

atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300

gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360

caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420

taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480

atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540

ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600

acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660

ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720

ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780

ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840

gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900

taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960

acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020

gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080

accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140

ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200

acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260

gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320

ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380

tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440

acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500

ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560

aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620

ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680

tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740

gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800

aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860

agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920

tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980

tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040

acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100

atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160

atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220

cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280

gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340

tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400

tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460

cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520

ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580

aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640

acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700

gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760

gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820

ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880

atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940

ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000

ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060

gggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttg3120

cctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctc3180

cagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatga3240

tcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctcca3300

tgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatc3360

agggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgt3420

cgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcg3480

acccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgct3540

ttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatct3600

atttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctg3660

agctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacc3720

tggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtccca3780

cggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctg3840

tctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccac3900

ttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaacca3960

gagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagc4020

acccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctgggg4080

tatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtc4140

tgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctggga4200

aaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaatagaaact4260

gggcttgtcgagacagagaagactcttgcgtttctgtgatcctaggtggaggccgaaagt4320

acatgtttcgcatgggaaccccagaccctgagtacccagatgactacagccaaggtggga4380

ccaggctggacgggaagaatctggtgcaggaatggctggcgaagcgccagggtgcccggt4440

acgtgtggaaccgcactgagctcatgcaggcttccctggacccgtctgtgacccatctca4500

tgggtctctttgagcctggagacatgaaatacgagatccaccgagactccacactggacc4560

cctccctgatggacaattgaggaacccctagtgatggagttggccactccctctctgcgc4620

gctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgg4680

gcggcctcagtgagcgagcgagcgcgcag4709

<210>64

<211>4871

<212>dna

<213>人工序列

<220>

<223>合成

<400>64

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatccgtgatcctaggtggaggccgaaagtacatgtttcgcatgggaac180

cccagaccctgagtacccagatgactacagccaaggtgggaccaggctggacgggaagaa240

tctggtgcaggaatggctggcgaagcgccagggtgcccggtacgtgtggaaccgcactga300

gctcatgcaggcttccctggacccgtctgtgacccatctcatgggtctctttgagcctgg360

agacatgaaatacgagatccaccgagactccacactggacccctccctgatggagatagg420

cacctattggtcttactgacatccactttgcctttctctccacaggtccatcctgacggg480

tctgttgccaccaacctctgggactgtgctcgttgggggaagggacattgaaaccagcct540

ggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgttccaccacct600

cacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcccaggaggaggc660

ccagctggagatggaagccatgttggaggacacaggcctccaccacaagcggaatgaaga720

ggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattgcctttgtggg780

agatgccaaggtggtgattctggacgaacccacctctggggtggacccttactcgagacg840

ctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatcatgtccactca900

ccacatggacgaggccgacctccttggggaccgcattgccatcattgcccagggaaggct960

ctactgctcaggcaccccactcttcctgaagaactgctttggcacaggcttgtacttaac1020

cttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgaggggacctgcag1080

ctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaactccaga1140

acaagtcctggatggggatgtaaatgagctgatggatgtagttctccaccatgttccaga1200

ggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaaataagaactt1260

caagcacagagcatatgccagccttttcagagagctggaggagacgctggctgaccttgg1320

tctcagcagttttggaatttctgacactcccctggaagagatttttctgaaggtcacgga1380

ggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagagaaaacgtcaa1440

cccccgacacccctgcttgggtcccagagagaaggctggacagacaccccaggactccaa1500

tgtctgctccccaggggcgccggctgctcacccagagggccagcctcccccagagccaga1560

gtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatgtgcaggcgct1620

gctggtcaagagattccaacacaccatccgcagccacaaggacttcctggcgcagatcgt1680

gctcccggctacctttgtgtttttggctctgatgctttctattgttatccctccttttgg1740

cgaataccccgctttgacccttcacccctggatatatgggcagcagtacaccttcttcag1800

catggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcctgaataagcc1860

aggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccctgtggcaactc1920

aacaccctggaagactccttctgtgtccccaaacatcacccagctgttccagaagcagaa1980

atggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaagctcaccat2040

gctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaacacagcgcag2100

cacggaaattctacaagacctgacggacaggaacatctccgacttcttggtaaaaacgta2160

tcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaacagaggtatgg2220

aggaatttccattggaggaaagctcccagtcgtccccatcacgggggaagcacttgttgg2280

gtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatcactagagaggc2340

ctctaaagaaatacctgatttccttaaacatctagaaactgaagacaacattaaggtgtg2400

gtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcccacaacgccat2460

cttacgggccagcctgcctaaggacagaagccccgaggagtatggaatcaccgtcattag2520

ccaacccctgaacctgaccaaggagcagctctcagagattacagtgctgaccacttcagt2580

ggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccagccagctttgt2640

cctttatttgatccaggagcgggtgaacaaatccaagcacctccagtttatcagtggagt2700

gagccccaccacctactgggtaaccaacttcctctgggacatcatgaattattccgtgag2760

tgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctacacttctccaga2820

aaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtcattcccatgat2880

gtacccagcatccttcctgtttgatgtccccagcacagcctatgtggctttatcttgtgc2940

taatctgttcatcggcatcaacagcagtgctattaccttcatcttggaattatttgagaa3000

taaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgtcttccccca3060

cttctgcctgggccggggcctcattgaccttgcactgagccaggctgtgacagatgtcta3120

tgcccggtttggtgaggagcactctgcaaatccgttccactgggacctgattgggaagaa3180

cctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgctggtccagcg3240

ccacttcttcctctcccaatggattgccgagcccactaaggagcccattgttgatgaaga3300

tgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaactgacatctt3360

aaggctacatgaactaaccaagatttatccaggcacctccagcccagcagtggacaggct3420

gtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatggtgccggcaa3480

aacaaccacattcaagatgctcactggggacaccacagtgacctcaggggatgccaccgt3540

agcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatgggctactgtcc3600

tcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttacctttatgcccg3660

gcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtattaagagcct3720

gggcctgactgtctacgccgactgcctggctggcacgtacagtgggggcaacaagcggaa3780

actctccacagccatcgcactcattggctgcccaccgctggtgctgctggatgagcccac3840

cacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgagcatcatcag3900

agaagggagggctgtggtcctcacatcccacagcatggaagaatgtgaggcactgtgtac3960

ccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattcagcatctcaa4020

gtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccgaaggacgacct4080

gcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccaggcagtgtgca4140

gagggagaggcactacaacatgctccagttccaggtctcctcctcctccctggcgaggat4200

cttccagctcctcctctcccacaaggacagcctgctcatcgaggagtactcagtcacaca4260

gaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaagtcatgacct4320

ccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgactacaaagacca4380

tgacggtgattataaagatcatgacatcgactacaaggatgacgatgacaagtgagcggc4440

cgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgc4500

agtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccatta4560

taagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagg4620

gggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgata4680

aggatcttcctagagcatggctacgtagataagtagcatggcgggttaatcattaactac4740

aaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgag4800

gccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgag4860

cgagcgcgcag4871

<210>65

<211>4073

<212>dna

<213>人工序列

<220>

<223>合成

<400>65

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180

aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240

atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300

gctcatgtccaatatgaccgccatgttggcattgattattgactagtgggccccagaagc360

ctggtggttgtttgtccttctcaggggaaaagtgaggcggccccttggaggaaggggccg420

ggcagaatgatctaatcggattccaagcagctcaggggattgtctttttctagcaccttc480

ttgccactcctaagcgtcctccgtgaccccggctgggatttagcctggtgctgtgtcagc540

cccgggctcccaggggcttcccagtggtccccaggaaccctcgacagggccagggcgtct600

ctctcgtccagcaagggcagggacgggccacaggcaagggcgcggccgccatgggcttcg660

tgagacagatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattc720

gctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaagga780

atgccaacccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcag840

caggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaa900

gccccaccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaa960

gggtatatcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggcc1020

gtatttggacagagctacacatcttgtcccaattcatggacaccctccggactcacccgg1080

agagaattgcaggaagaggaattcgaataagggatatcttgaaagatgaagaaacactga1140

cactatttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaact1200

ctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcg1260

cctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaaga1320

cggtgcgctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactc1380

tgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagcc1440

gttctcaaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaa1500

ttcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctca1560

tgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgt1620

gtggctaccccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaata1680

actataaggcctttctggggattgactccacaaggaaggatcctatctattcttatgaca1740

gaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaacca1800

aaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgatt1860

cacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacg1920

ttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgaca1980

acagcacacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttt2040

tgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctaca2100

agggccctcgggaaagccaggctgacgacatggccaacttcgactggagggacatattta2160

acatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggata2220

agtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggagg2280

aaaacatgttctgggccggagtggtattccctgacatgtatccctggaccagctctctac2340

caccccacgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataaga2400

ttaaagacaggtattgggattctggtcccagagctgatcccgtggaagatttccggtaca2460

tctggggcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccagg2520

tgcaggcggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtgg2580

acgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatgga2640

tctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaagg2700

agaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggaca2760

gcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaa2820

tcctacattacagcgacccattcatcctcttcctgttcttgttggctttctccactgcca2880

ccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcct2940

gtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcagg3000

accgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggat3060

ttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaaca3120

tcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgc3180

tccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggag3240

actatggaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtg3300

aagggtgttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaa3360

cggaggatccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccag3420

ggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggc3480

cagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggcc3540

acaatggagctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaagg3600

agaccaatagaaactgggcttgtcgagacagagaagactcttgcgtttctccccgggtgc3660

gcggcgtcggtggtgccggcggggggcgccaggtcgcaggcggtgtagggctccaggcag3720

gcggcgaaggccatgacgtgcgctatgaaggtctgctcctgcacgccgtgaaccaggtgc3780

gcctgcgggccgcgcgcgaacaccgccacgtcctcgcctgcgtgggtctcttcgtccagg3840

ggcactgctgactgctgccgatactcggggctcccgctctcgctctcggtaacatccggc3900

cgggcgccgtccttgagcacatagcctggaccgtttccaattgaggaacccctagtgatg3960

gagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtc4020

gcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag4073

<210>66

<211>4074

<212>dna

<213>人工序列

<220>

<223>合成

<400>66

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180

aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240

atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300

gctcatgtccaatatgaccgccatgttggcattgattattgactagtgggccccagaagc360

ctggtggttgtttgtccttctcaggggaaaagtgaggcggccccttggaggaaggggccg420

ggcagaatgatctaatcggattccaagcagctcaggggattgtctttttctagcaccttc480

ttgccactcctaagcgtcctccgtgaccccggctgggatttagcctggtgctgtgtcagc540

cccgggctcccaggggcttcccagtggtccccaggaaccctcgacagggccagggcgtct600

ctctcgtccagcaagggcagggacgggccacaggcaagggcgcggccgccatgggcttcg660

tgagacagatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattc720

gctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaagga780

atgccaacccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcag840

caggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaa900

gccccaccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaa960

gggtatatcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggcc1020

gtatttggacagagctacacatcttgtcccaattcatggacaccctccggactcacccgg1080

agagaattgcaggaagaggaattcgaataagggatatcttgaaagatgaagaaacactga1140

cactatttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaact1200

ctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcg1260

cctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaaga1320

cggtgcgctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactc1380

tgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagcc1440

gttctcaaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaa1500

ttcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctca1560

tgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgt1620

gtggctaccccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaata1680

actataaggcctttctggggattgactccacaaggaaggatcctatctattcttatgaca1740

gaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaacca1800

aaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgatt1860

cacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacg1920

ttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgaca1980

acagcacacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttt2040

tgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctaca2100

agggccctcgggaaagccaggctgacgacatggccaacttcgactggagggacatattta2160

acatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggata2220

agtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggagg2280

aaaacatgttctgggccggagtggtattccctgacatgtatccctggaccagctctctac2340

caccccacgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataaga2400

ttaaagacaggtattgggattctggtcccagagctgatcccgtggaagatttccggtaca2460

tctggggcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccagg2520

tgcaggcggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtgg2580

acgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatgga2640

tctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaagg2700

agaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggaca2760

gcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaa2820

tcctacattacagcgacccattcatcctcttcctgttcttgttggctttctccactgcca2880

ccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcct2940

gtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcagg3000

accgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggat3060

ttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaaca3120

tcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgc3180

tccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggag3240

actatggaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtg3300

aagggtgttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaa3360

cggaggatccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccag3420

ggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggc3480

cagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggcc3540

acaatggagctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaagg3600

agaccaatagaaactgggcttgtcgagacagagaagactcttgcgtttctcgcagggcag3660

cctctgtcatctccatcagggaggggtccagtgtggagtctcggtggatctcgtatttca3720

tgtctccaggctcaaagagacccatgagatgggtcacagacgggtccagggaagcctgca3780

tgagctcagtgcggttccacacataccgggcaccctggcgcttcgccagccattcctgca3840

ccagattcttcccgtccagcctggtcccaccttggctgtagtcatctgggtactcagggt3900

ctggggttcccatgcgaaacatgtactttcggcctccacaattgaggaacccctagtgat3960

ggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggt4020

cgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag4074

<210>67

<211>4636

<212>dna

<213>人工序列

<220>

<223>合成

<400>67

ctctcccccctgtcgcgttcgctcgctcgctggctcgtttgggggggtggcagctcaaag60

agctgccagacgacggccctctggccgtcgcccccccaaacgagccagcgagcgagcgaa120

cgcgacaggggggagagtgccacactctcaagcaagggggttttgtaagcagtgagctag180

cctgaattccagcacactggcggccgttactagtggatcttcaatattggccattagcca240

tattattcattggttatatagcataaatcaatattggctattggccattgcatacgttgt300

atctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttggc360

attgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccat420

atatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacg480

acccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactt540

tccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaag600

tgtatcatatgccaagtccgccccctattgacgtcaatgacggtaaatggcccgcctggc660

attatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattag720

tcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggt780

ttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggc840

accaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgg900

gcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcaga960

tcactagaagctttattgcggtagtttatcacagttaaattgctaacgcagtcagtgctt1020

ctgacacaacagtctcgaacttaagctgcagaagttggtcgtgaggcactgggcaggtaa1080

gtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgagacaga1140

gaagactcttgcgtttctgataggcacctattggtcttactgacatccactttgcctttc1200

tctccacaggtgtccactcccagttcaattacagctcttaaggctagagtacttaatacg1260

actcactataggctagcctcgagaattcacgcgtggtacctctagagtcgacccgggcgg1320

ccgccatgggcttcgtgagacagatacagcttttgctctggaagaactggaccctgcgga1380

aaaggcaaaagattcgctttgtggtggaactcgtgtggcctttatctttatttctggtct1440

tgatctggttaaggaatgccaacccgctctacagccatcatgaatgccatttccccaaca1500

aggcgatgccctcagcaggaatgctgccgtggctccaggggatcttctgcaatgtgaaca1560

atccctgttttcaaagccccaccccaggagaatctcctggaattgtgtcaaactataaca1620

actccatcttggcaagggtatatcgagattttcaagaactcctcatgaatgcaccagaga1680

gccagcaccttggccgtatttggacagagctacacatcttgtcccaattcatggacaccc1740

tccggactcacccggagagaattgcaggaagaggaattcgaataagggatatcttgaaag1800

atgaagaaacactgacactatttctcattaaaaacatcggcctgtctgactcagtggtct1860

accttctgatcaactctcaagtccgtccagagcagttcgctcatggagtcccggacctgg1920

cgctgaaggacatcgcctgcagcgaggccctcctggagcgcttcatcatcttcagccaga1980

gacgcggggcaaagacggtgcgctatgccctgtgctccctctcccagggcaccctacagt2040

ggatagaagacactctgtatgccaacgtggacttcttcaagctcttccgtgtgcttccca2100

cactcctagacagccgttctcaaggtatcaatctgagatcttggggaggaatattatctg2160

atatgtcaccaagaattcaagagtttatccatcggccgagtatgcaggacttgctgtggg2220

tgaccaggcccctcatgcagaatggtggtccagagacctttacaaagctgatgggcatcc2280

tgtctgacctcctgtgtggctaccccgagggaggtggctctcgggtgctctccttcaact2340

ggtatgaagacaataactataaggcctttctggggattgactccacaaggaaggatccta2400

tctattcttatgacagaagaacaacatccttttgtaatgcattgatccagagcctggagt2460

caaatcctttaaccaaaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcc2520

tgtacactcctgattcacctgcagcacgaaggatactgaagaatgccaactcaacttttg2580

aagaactggaacacgttaggaagttggtcaaagcctgggaagaagtagggccccagatct2640

ggtacttctttgacaacagcacacagatgaacatgatcagagataccctggggaacccaa2700

cagtaaaagactttttgaataggcagcttggtgaagaaggtattactgctgaagccatcc2760

taaacttcctctacaagggccctcgggaaagccaggctgacgacatggccaacttcgact2820

ggagggacatatttaacatcactgatcgcaccctccgccttgtcaatcaatacctggagt2880

gcttggtcctggataagtttgaaagctacaatgatgaaactcagctcacccaacgtgccc2940

tctctctactggaggaaaacatgttctgggccggagtggtattccctgacatgtatccct3000

ggaccagctctctaccaccccacgtgaagtataagatccgaatggacatagacgtggtgg3060

agaaaaccaataagattaaagacaggtattgggactacaaagaccatgacggtgattata3120

aagatcatgacatcgactacaaggatgacgatgacaaggattctggtcccagagctgatc3180

ccgtggaagatttccggtacatctggggcgggtttgcctatctgcaggacatggttgaac3240

aggggatcacaaggagccaggtgcaggcggaggctccagttggaatctacctccagcaga3300

tgccctacccctgcttcgtggacgattctttcatgatcatcctgaaccgctgtttcccta3360

tcttcatggtgctggcatggatctactctgtctccatgactgtgaagagcatcgtcttgg3420

agaaggagttgcgactgaaggagaccttgaaaaatcagggtgtctccaatgcagtgattt3480

ggtgtacctggttcctggacagcttctccatcatgtcgatgagcatcttcctcctgacga3540

tattcatcatgcatggaagaatcctacattacagcgacccattcatcctcttcctgttct3600

tgttggctttctccactgccaccatcatgctgtgctttctgctcagcaccttcttctcca3660

aggccagtctggcagcagcctgtagtggtgtcatctatttcaccctctacctgccacaca3720

tcctgtgcttcgcctggcaggaccgcatgaccgctgagctgaagaaggctgtgagcttac3780

tgtctccggtggcatttggatttggcactgagtacctggttcgctttgaagagcaaggcc3840

tggggctgcagtggagcaacatcgggaacagtcccacggaaggggacgaattcagcttcc3900

tgctgtccatgcagatgatgctccttgatgctgctgtctatggcttactcgcttggtacc3960

ttgatcaggtgtttccaggagactatggaaccccacttccttggtactttcttctacaag4020

agtcgtattggcttggcggtgaagggtgttcaaccagagaagaaagagccctggaaaaga4080

ccgagcccctaacagaggaaacggaggatccagagcacccagaaggaatacacgactcct4140

tctttgaacgtgagcatccagggtgggttcctggggtatgcgtgaagaatctggtaaaga4200

tttttgagccctgtggccggccagctgtggaccgtctgaacatcaccttctacgagaacc4260

agatcaccgcattcctgggccacaatggagctgggaaaaccaccaccttgtaagtatcaa4320

ggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgagacagagaagact4380

cttgcgtttctgggatttttccgatttcggcctattggttaaaaaatgagctgatttaac4440

aaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcatctttc4500

caattgaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctca4560

ctgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtga4620

gcgagcgagcgcgcag4636

<210>68

<211>4731

<212>dna

<213>人工序列

<220>

<223>合成

<400>68

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180

ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240

ctttcgataggcacctattggtcttactgacatccactttgcctttctctccacaggtcc300

atcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacatt360

gaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctg420

ttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcc480

caggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaag540

cggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccatt600

gcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggaccct660

tactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatc720

atgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcc780

cagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggc840

ttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgag900

gggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgac960

ctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccac1020

catgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttcca1080

aataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctg1140

gctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctg1200

aaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaaga1260

gaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccc1320

caggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctccc1380

ccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcat1440

gtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctg1500

gcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatc1560

cctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtac1620

accttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctc1680

ctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccc1740

tgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttc1800

cagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggag1860

aagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagaga1920

acacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttg1980

gtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaa2040

cagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaa2100

gcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatc2160

actagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaac2220

attaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcc2280

cacaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatc2340

accgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctg2400

accacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtccca2460

gccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagttt2520

atcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaat2580

tattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctac2640

acttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtc2700

attcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggct2760

ttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaa2820

ttatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcatt2880

gtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtg2940

acagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctg3000

attgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctg3060

ctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccatt3120

gttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaa3180

actgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagca3240

gtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaat3300

ggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggg3360

gatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatg3420

ggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttac3480

ctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagt3540

attaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggc3600

aacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctg3660

gatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtg3720

agcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgag3780

gcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccatt3840

cagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccg3900

aaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttccca3960

ggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctcc4020

ctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtac4080

tcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaa4140

agtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgac4200

tacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatgac4260

aagtgagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccac4320

aactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatt4380

tgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtt4440

tcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtgg4500

taaaatcgataaggatcttcctagagcatggctacatctgcagaattcaggctagctcac4560

tgcttacaaaacccccttgcttgagagtgtggcactctcccccctgtcgcgttcgctcgc4620

tcgctggctcgtttgggggggcgacggccagagggccgtcgtctggcagctctttgagct4680

gccacccccccaaacgagccagcgagcgagcgaacgcgacaggggggagag4731

<210>69

<211>4420

<212>dna

<213>人工序列

<220>

<223>合成

<400>69

ctctcccccctgtcgcgttcgctcgctcgctggctcgtttgggggggtggcagctcaaag60

agctgccagacgacggccctctggccgtcgcccccccaaacgagccagcgagcgagcgaa120

cgcgacaggggggagagtgccacactctcaagcaagggggttttgtaagcagtgagctag180

cgtgccacctggtcgacattgattattgactagttattaatagtaatcaattacggggtc240

attagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcc300

tggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagt360

aacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgccca420

cttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacgg480

taaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggca540

gtacatctacgtattagtcatcgctattaccatggtcgaggtgagccccacgttctgctt600

cactctccccatctcccccccctccccacccccaattttgtatttatttattttttaatt660

attttgtgcagcgatgggggcggggcggggcgaggcggagaggtgcggcggcagccaatc720

ggagcggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggctctata780

aaaagcgaagcgcgcggcgggcggctgcagaagttggtcgtgaggcactgggcaggtaag840

tatcaaggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgagacagag900

aagactcttgcgtttctgataggcacctattggtcttactgacatccactttgcctttct960

ctccacaggtgtccaggcggccgccatggtgattcttcagcagggggaccatgtgtggat1020

ggacctgagattggggcaggagttcgacgtgcccatcggggcggtggtgaagctctgcga1080

ctctgggcaggtccaggtggtggatgatgaagacaatgaacactggatctctccgcagaa1140

cgcaacgcacatcaagcctatgcaccccacgtcggtccacggcgtggaggacatgatccg1200

cctgggggacctcaacgaggcgggcatcttgcgcaacctgcttatccgctaccgggacca1260

cctcatctacacgtatacgggctccatcctggtggctgtgaacccctaccagctgctctc1320

catctactcgccagagcacatccgccagtataccaacaagaagattggggagatgccccc1380

ccacatctttgccattgctgacaactgctacttcaacatgaaacgcaacagccgagacca1440

gtgctgcatcatcagtggggaatctggggccgggaagacggagagcacaaagctgatcct1500

gcagttcctggcagccatcagtgggcagcactcgtggattgagcagcaggtcttggaggc1560

cacccccattctggaagcatttgggaatgccaagaccatccgcaatgacaactcaagccg1620

tttcggaaagtacatcgacatccacttcaacaagcggggcgccatcgagggcgcgaagat1680

tgagcagtacctgctggaaaagtcacgtgtctgtcgccaggccctggatgaaaggaacta1740

ccacgtgttctactgcatgctggagggcatgagtgaggatcagaagaagaagctgggctt1800

gggccaggcctctgactacaactacttggccatgggtaactgcataacctgtgagggccg1860

ggtggacagccaggagtacgccaacatccgctccgccatgaaggtgctcatgttcactga1920

caccgagaactgggagatctcgaagctcctggctgccatcctgcacctgggcaacctgca1980

gtatgaggcacgcacatttgaaaacctggatgcctgtgaggttctcttctccccatcgct2040

ggccacagctgcatccctgcttgaggtgaaccccccagacctgatgagctgcctgactag2100

ccgcaccctcatcacccgcggggagacggtgtccaccccactgagcagggaacaggcact2160

ggacgtgcgcgacgccttcgtaaaggggatctacgggcggctgttcgtgtggattgtgga2220

caagatcaacgcagcaatttacaagcctccctcccaggatgtgaagaactctcgcaggtc2280

catcggcctcctggacatctttgggtttgagaactttgctgtgaacagctttgagcagct2340

ctgcatcaacttcgccaatgagcacctgcagcagttctttgtgcggcacgtgttcaagct2400

ggagcaggaggaatatgacctggagagcattgactggctgcacatcgagttcactgacaa2460

ccaggatgccctggacatgattgccaacaagcccatgaacatcatctccctcatcgatga2520

ggagagcaagttccccaagggcacagacaccaccatgttacacaagctgaactcccagca2580

caagctcaacgccaactacatcccccccaagaacaaccatgagacccagtttggcatcaa2640

ccattttgcaggcatcgtctactatgagacccaaggcttcctggagaagaaccgagacac2700

cctgcatggggacattatccagctggtccactcctccaggaacaagttcatcaagcagat2760

cttccaggccgatgtcgccatgggcgccgagaccaggaagcgctcgcccacacttagcag2820

ccagttcaagcggtcactggagctgctgatgcgcacgctgggtgcctgccagcccttctt2880

tgtgcgatgcatcaagcccaatgagttcaagaagcccatgctgttcgaccggcacctgtg2940

cgtgcgccagctgcggtactcaggaatgatggagaccatccgaatccgccgagctggcta3000

ccccatccgctacagcttcgtagagtttgtggagcggtaccgtgtgctgctgccaggtgt3060

gaagccggcctacaagcagggcgacctccgcgggacttgccagcgcatggctgaggctgt3120

gctgggcacccacgatgactggcagataggcaaaaccaagatctttctgaaggaccacca3180

tgacatgctgctggaagtggagcgggacaaagccatcaccgacagagtcatcctccttca3240

gaaagtcatccggggattcaaagacaggtctaactttctgaagctgaagaacgctgccac3300

actgatccagaggcactggcggggtcacaactgtaggaagaactacgggctgatgcgtct3360

gggcttcctgcggctgcaggccctgcaccgctcccggaagctgcaccagcagtaccgcct3420

ggcccgccagcgcatcatccagttccaggcccgctgccgcgcctatctggtgcgcaaggc3480

cttccgccaccgcctctgggctgtgctcaccgtgcaggcctatgcccggggcatgatcgc3540

ccgcaggctgcaccaacgcctcagggctgagtatctgtggcgcctcgaggctgagaaaat3600

gcggctggcggaggaagagaagcttcggaaggagatgagcgccaagaaggccaaggagga3660

ggccgagcgcaagcatcaggagcgcctggcccagctggctcgtgaggacgctgagcggga3720

gctgaaggagaaggaggccgctcggcggaagaaggagctcctggagcagatggaaagggc3780

ccgccatgagcctgtcaatcactcagacatggtggacaagatgtttggcttcctggggac3840

ttcaggtggcctgccaggccaggagggccaggcacctagtggctttgaggacctggagcg3900

agggcggagggagatggtggaggaggacctggatgcagccctgcccctgcctgacgagga3960

tgaggaggacctctctgagtataaatttgccaagttcgcggccacctacttccaggggac4020

aactacgcactcctacacccggcggccactcaaacagccactgctctaccatgacgacga4080

gggtgaccagctggtaagtatcaaggttacaagacaggtttaaggagaccaatagaaact4140

gggcttgtcgagacagagaagactcttgcgtttctgggatttttccgatttcggcctatt4200

ggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgt4260

ttataatttcaggtggcatctttccaattgaggaacccctagtgatggagttggccactc4320

cctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgg4380

gctttgcccgggcggcctcagtgagcgagcgagcgcgcag4420

<210>70

<211>4367

<212>dna

<213>人工序列

<220>

<223>合成

<400>70

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatccgggattttgccgatttcggcctattggttaaaaaatgagctgat180

ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240

ctttcgataggcacctattggtcttactgacatccactttgcctttctctccacaggcag300

ccctggcggtctggatcaccatcctccgcttcatgggggacctccctgagcccaagtacc360

acacagccatgagtgatggcagtgagaagatccctgtgatgaccaagatttatgagaccc420

tgggcaagaagacgtacaagagggagctgcaggccctgcagggcgagggcgaggcccagc480

tccccgagggccagaagaagagcagtgtgaggcacaagctggtgcatttgactctgaaaa540

agaagtccaagctcacagaggaggtgaccaagaggctgcatgacggggagtccacagtgc600

agggcaacagcatgctggaggaccggcccacctccaacctggagaagctgcacttcatca660

tcggcaatggcatcctgcggccagcactccgggacgagatctactgccagatcagcaagc720

agctgacccacaacccctccaagagcagctatgcccggggctggattctcgtgtctctct780

gcgtgggctgtttcgccccctccgagaagtttgtcaagtacctgcggaacttcatccacg840

ggggcccgcccggctacgccccgtactgtgaggagcgcctgagaaggacctttgtcaatg900

ggacacggacacagccgcccagctggctggagctgcaggccaccaagtccaagaagccaa960

tcatgttgcccgtgacattcatggatgggaccaccaagaccctgctgacggactcggcaa1020

ccacggccaaggagctctgcaacgcgctggccgacaagatctctctcaaggaccggttcg1080

ggttctccctctacattgccctgtttgacaaggtgtcctccctgggcagcggcagtgacc1140

acgtcatggacgccatctcccagtgcgagcagtacgccaaggagcagggcgcccaggagc1200

gcaacgccccctggaggctcttcttccgcaaagaggtcttcacgccctggcacagcccct1260

ccgaggacaacgtggccaccaacctcatctaccagcaggtggtgcgaggagtcaagtttg1320

gggagtacaggtgtgagaaggaggacgacctggctgagctggcctcccagcagtactttg1380

tagactatggctctgagatgatcctggagcgcctcctgaacctcgtgcccacctacatcc1440

ccgaccgcgagatcacgcccctgaagacgctggagaagtgggcccagctggccatcgccg1500

cccacaagaaggggatttatgcccagaggagaactgatgcccagaaggtcaaagaggatg1560

tggtcagttatgcccgcttcaagtggcccttgctcttctccaggttttatgaagcctaca1620

aattctcaggccccagtctccccaagaacgacgtcatcgtggccgtcaactggacgggtg1680

tgtactttgtggatgagcaggagcaggtacttctggagctgtccttcccagagatcatgg1740

ccgtgtccagcagcagggagtgccgtgtctggctctcactgggctgctctgatcttggct1800

gtgctgcgcctcactcaggctgggcaggactgaccccggcggggccctgttctccgtgtt1860

ggtcctgcaggggagcgaaaacgacggcccccagcttcacgctggccaccatcaaggggg1920

acgaatacaccttcacctccagtaatgctgaggacattcgtgacctggtggtcaccttcc1980

tagaggggctccggaagagatctaagtatgttgtggccctgcaggataaccccaaccccg2040

caggcgaggagtcaggcttcctcagctttgccaagggagacctcatcatcctggaccatg2100

acacgggcgagcaggtcatgaactcgggctgggccaacggcatcaatgagaggaccaagc2160

agcgtggggacttccccaccgactgtgtgtacgtcatgcccactgtcaccatgccacctc2220

gtgagattgtggccctggtcaccatgactcccgatcagaggcaggacgttgtccggctct2280

tgcagctgcgaacggcggagcccgaggtgcgtgccaagccctacacgctggaggagtttt2340

cctatgactacttcaggcccccacccaagcacacgctgagccgtgtcatggtgtccaagg2400

cccgaggcaaggaccggctgtggagccacacgcgggaaccgctcaagcaggcgctgctca2460

agaagctcctgggcagtgaggagctctcgcaggaggcctgcctggccttcattgctgtgc2520

tcaagtacatgggcgactacccgtccaagaggacacgctccgtcaatgagctcaccgacc2580

agatctttgagggtcccctgaaagccgagcccctgaaggacgaggcatatgtgcagatcc2640

tgaagcagctgaccgacaaccacatcaggtacagcgaggagcggggttgggagctgctct2700

ggctgtgcacgggccttttcccacccagcaacatcctcctgccccacgtgcagcgcttcc2760

tgcagtcccgaaagcactgcccactcgccatcgactgcctgcaacggctccagaaagccc2820

tgagaaacgggtcccggaagtaccctccgcacctggtggaggtggaggccatccagcaca2880

agaccacccagattttccacaaggtctacttccctgatgacactgacgaggccttcgaag2940

tggagtccagcaccaaggccaaggacttctgccagaacatcgccaccaggctgctcctca3000

agtcctcagagggattcagcctctttgtcaaaattgcagacaaggtcatcagcgttcctg3060

agaatgacttcttctttgactttgttcgacacttgacagactggataaagaaagctcggc3120

ccatcaaggacggaattgtgccctcactcacctaccaggtgttcttcatgaagaagctgt3180

ggaccaccacggtgccagggaaggatcccatggccgattccatcttccactattaccagg3240

agttgcccaagtatctccgaggctaccacaagtgcacgcgggaggaggtgctgcagctgg3300

gggcgctgatctacagggtcaagttcgaggaggacaagtcctacttccccagcatcccca3360

agctgctgcgggagctggtgccccaggaccttatccggcaggtctcacctgatgactgga3420

agcggtccatcgtcgcctacttcaacaagcacgcagggaagtccaaggaggaggccaagc3480

tggccttcctgaagctcatcttcaagtggcccacctttggctcagccttcttcgaggtga3540

agcaaactacggagccaaacttccctgagatcctcctaattgccatcaacaagtatgggg3600

tcagcctcatcgatcccaaaacgaaggatatcctcaccactcatcccttcaccaagatct3660

ccaactggagcagcggcaacacctacttccacatcaccattgggaacttggtgcgcggga3720

gcaaactgctctgcgagacgtcactgggctacaagatggatgacctcctgacttcctaca3780

ttagccagatgctcacagccatgagcaaacagcggggctccaggagcggcaagatgtatg3840

atgttcctgattatgctagcctctgaccgcggcctgctgccggctctgcggcctcttccg3900

cgtcttcgagatctgcctcgactgtgccttctagttgccagccatctgttgtttgcccct3960

cccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatg4020

aggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggc4080

aggacagcaagggggaggattgggaagacaatagcaggcatgctggggactcgagcaatt4140

cccgataaggatcttcctagagcatggctacatctgcagaattcaggctagctcactgct4200

tacaaaacccccttgcttgagagtgtggcactctcccccctgtcgcgttcgctcgctcgc4260

tggctcgtttgggggggcgacggccagagggccgtcgtctggcagctctttgagctgcca4320

cccccccaaacgagccagcgagcgagcgaacgcgacaggggggagag4367

<210>71

<211>4738

<212>dna

<213>人工序列

<220>

<223>合成

<400>71

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180

aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240

atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300

gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360

caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420

taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480

atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540

ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600

acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660

ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720

ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780

ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840

gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900

taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960

acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020

gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080

accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140

ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200

acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260

gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320

ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380

tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440

acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500

ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560

aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620

ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680

tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740

gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800

aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860

agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920

tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980

tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040

acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100

atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160

atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220

cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280

gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340

tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400

tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460

cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520

ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580

aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640

acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700

gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760

gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820

ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880

atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940

ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000

ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060

gggactacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacg3120

atgacaaggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcg3180

ggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcgg3240

aggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctt3300

tcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctg3360

tctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttga3420

aaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctcca3480

tcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacatt3540

acagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgc3600

tgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtg3660

tcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatga3720

ccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactg3780

agtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaaca3840

gtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatg3900

ctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaa3960

ccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgtt4020

caaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatc4080

cagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttc4140

ctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtgg4200

accgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggag4260

ctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaata4320

gaaactgggcttgtcgagacagagaagactcttgcgtttctgggatttttccgatttcgg4380

cctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatat4440

taacgtttataatttcaggtggcatctttccaattcgcccttagatctagcctatcctgg4500

attacttgaacgatagcctatcctggattacttgaaaagcttagcctatcctggattact4560

tgaatcacagcctatcctggattacttgaaagatctaagggcgaattgaggaacccctag4620

tgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaa4680

aggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag4738

<210>72

<211>4770

<212>dna

<213>人工序列

<220>

<223>合成

<400>72

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180

aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240

atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300

gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360

caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420

taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480

atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540

ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600

acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660

ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720

ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780

ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840

gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900

taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960

acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020

gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080

accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140

ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200

acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260

gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320

ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380

tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440

acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500

ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560

aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620

ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680

tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740

gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800

aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860

agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920

tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980

tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040

acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100

atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160

atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220

cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280

gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340

tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400

tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460

cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520

ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580

aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640

acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700

gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760

gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820

ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880

atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940

ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000

ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060

gggactacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacg3120

atgacaaggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcg3180

ggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcgg3240

aggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctt3300

tcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctg3360

tctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttga3420

aaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctcca3480

tcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacatt3540

acagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgc3600

tgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtg3660

tcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatga3720

ccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactg3780

agtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaaca3840

gtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatg3900

ctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaa3960

ccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgtt4020

caaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatc4080

cagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttc4140

ctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtgg4200

accgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggag4260

ctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaata4320

gaaactgggcttgtcgagacagagaagactcttgcgtttctgggatttttccgatttcgg4380

cctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatat4440

taacgtttataatttcaggtggcatctttccaattgaggcataggatgacaaagggaacg4500

ataggcataggatgacaaagggaaaagcttaggcataggatgacaaagggaaggtaccag4560

atctggcattcaccgcgtgccttacgatggcattcaccgcgtgccttaaagcttggcatt4620

caccgcgtgccttacaattgaggaacccctagtgatggagttggccactccctctctgcg4680

cgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccg4740

ggcggcctcagtgagcgagcgagcgcgcag4770

<210>73

<211>4656

<212>dna

<213>人工序列

<220>

<223>合成

<400>73

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180

aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240

atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300

gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360

caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420

taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480

atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540

ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600

acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660

ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720

ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780

ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840

gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900

taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960

acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020

gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080

accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140

ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200

acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260

gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320

ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380

tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440

acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500

ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560

aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620

ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680

tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740

gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800

aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860

agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920

tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980

tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040

acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100

atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160

atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220

cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280

gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340

tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400

tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460

cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520

ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580

aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640

acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700

gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760

gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820

ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880

atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940

ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000

ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060

gggactacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacg3120

atgacaaggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcg3180

ggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcgg3240

aggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctt3300

tcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctg3360

tctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttga3420

aaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctcca3480

tcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacatt3540

acagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgc3600

tgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtg3660

tcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatga3720

ccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactg3780

agtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaaca3840

gtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatg3900

ctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaa3960

ccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgtt4020

caaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatc4080

cagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttc4140

ctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtgg4200

accgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggag4260

ctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaata4320

gaaactgggcttgtcgagacagagaagactcttgcgtttctgggatttttccgatttcgg4380

cctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatat4440

taacgtttataatttcaggtggcatctttcccgcctgcaagaactggttcagcagcctga4500

gccacttcgtgatccacctgcaattgaggaacccctagtgatggagttggccactccctc4560

tctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctt4620

tgcccgggcggcctcagtgagcgagcgagcgcgcag4656

<210>74

<211>4719

<212>dna

<213>人工序列

<220>

<223>合成

<400>74

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180

ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240

ctttcaagctttgaatgaatgagataggcacctattggtcttactgacatccactttgcc300

tttctctccacaggtccatcctgacgggtctgttgccaccaacctctgggactgtgctcg360

ttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttggcatgtgtc420

cacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgttctatgccc480

agctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgttggaggaca540

caggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggcatgcagagaa600

agctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctggacgaaccca660

cctctggggtggacccttactcgagacgctcaatctgggatctgctcctgaagtatcgct720

caggcagaaccatcatcatgtccactcaccacatggacgaggccgacctccttggggacc780

gcattgccatcattgcccagggaaggctctactgctcaggcaccccactcttcctgaaga840

actgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaacatccagagcc900

aaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtc960

cagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatgagctga1020

tggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtcaagaac1080

ttatcttccttcttccaaataagaacttcaagcacagagcatatgccagccttttcagag1140

agctggaggagacgctggctgaccttggtctcagcagttttggaatttctgacactcccc1200

tggaagagatttttctgaaggtcacggaggattctgattcaggacctctgtttgcgggtg1260

gcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgggtcccagagaga1320

aggctggacagacaccccaggactccaatgtctgctccccaggggcgccggctgctcacc1380

cagagggccagcctcccccagagccagagtgcccaggcccgcagctcaacacggggacac1440

agctggtcctccagcatgtgcaggcgctgctggtcaagagattccaacacaccatccgca1500

gccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgtttttggctctga1560

tgctttctattgttatccctccttttggcgaataccccgctttgacccttcacccctgga1620

tatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtgagcagttcacgg1680

tacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcctgaaggaagggt1740

ggcttccggagtacccctgtggcaactcaacaccctggaagactccttctgtgtccccaa1800

acatcacccagctgttccagaagcagaaatggacacaggtcaacccttcaccatcctgca1860

ggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagggtgccgggggcc1920

tcccgcccccccagagaacacagcgcagcacggaaattctacaagacctgacggacagga1980

acatctccgacttcttggtaaaaacgtatcctgctcttataagaagcagcttaaagagca2040

aattctgggtcaatgaacagaggtatggaggaatttccattggaggaaagctcccagtcg2100

tccccatcacgggggaagcacttgttgggtttttaagcgaccttggccggatcatgaatg2160

tgagcgggggccctatcactagagaggcctctaaagaaatacctgatttccttaaacatc2220

tagaaactgaagacaacattaaggtgtggtttaataacaaaggctggcatgccctggtca2280

gctttctcaatgtggcccacaacgccatcttacgggccagcctgcctaaggacagaagcc2340

ccgaggagtatggaatcaccgtcattagccaacccctgaacctgaccaaggagcagctct2400

cagagattacagtgctgaccacttcagtggatgctgtggttgccatctgcgtgattttct2460

ccatgtccttcgtcccagccagctttgtcctttatttgatccaggagcgggtgaacaaat2520

ccaagcacctccagtttatcagtggagtgagccccaccacctactgggtaaccaacttcc2580

tctgggacatcatgaattattccgtgagtgctgggctggtggtgggcatcttcatcgggt2640

ttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtggcactgctcctgc2700

tgtatggatgggcggtcattcccatgatgtacccagcatccttcctgtttgatgtcccca2760

gcacagcctatgtggctttatcttgtgctaatctgttcatcggcatcaacagcagtgcta2820

ttaccttcatcttggaattatttgagaataaccggacgctgctcaggttcaacgccgtgc2880

tgaggaagctgctcattgtcttcccccacttctgcctgggccggggcctcattgaccttg2940

cactgagccaggctgtgacagatgtctatgcccggtttggtgaggagcactctgcaaatc3000

cgttccactgggacctgattgggaagaacctgtttgccatggtggtggaaggggtggtgt3060

acttcctcctgaccctgctggtccagcgccacttcttcctctcccaatggattgccgagc3120

ccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaagacaaagaatta3180

ttactggtggaaataaaactgacatcttaaggctacatgaactaaccaagatttatccag3240

gcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctggagagtgctttg3300

gcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgctcactggggaca3360

ccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaaccaatatttctg3420

aagtccatcaaaatatgggctactgtcctcagtttgatgcaatcgatgagctgctcacag3480

gacgagaacatctttacctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaa3540

aggttgcaaactggagtattaagagcctgggcctgactgtctacgccgactgcctggctg3600

gcacgtacagtgggggcaacaagcggaaactctccacagccatcgcactcattggctgcc3660

caccgctggtgctgctggatgagcccaccacagggatggacccccaggcacgccgcatgc3720

tgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcctcacatcccaca3780

gcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaaagggcgcctttc3840

gatgtatgggcaccattcagcatctcaagtccaaatttggagatggctatatcgtcacaa3900

tgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctgtggagcagttct3960

tccaggggaacttcccaggcagtgtgcagagggagaggcactacaacatgctccagttcc4020

aggtctcctcctcctccctggcgaggatcttccagctcctcctctcccacaaggacagcc4080

tgctcatcgaggagtactcagtcacacagaccacactggaccaggtgtttgtaaattttg4140

ctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctgctggagccagtc4200

gacaagcccaggacgactacaaagaccatgacggtgattataaagatcatgacatcgact4260

acaaggatgacgatgacaagtgagcggccgcttcgagcagacatgataagatacattgat4320

gagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgt4380

gatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaat4440

tgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaa4500

aacctctacaaatgtggtaaaatcgataaggatcttcctagagcatggctacgtagataa4560

gtagcatggcgggttaatcattaactacaaggaacccctagtgatggagttggccactcc4620

ctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccggg4680

ctttgcccgggcggcctcagtgagcgagcgagcgcgcag4719

<210>75

<211>4758

<212>dna

<213>人工序列

<220>

<223>合成

<400>75

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180

ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240

ctttcaagcttatgcacagctggaacttcaagctgtacgtcatgggcagcggcggggtac300

cgataggcacctattggtcttactgacatccactttgcctttctctccacaggtccatcc360

tgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacattgaaa420

ccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgttcc480

accacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcccagg540

aggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaagcgga600

atgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattgcct660

ttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggacccttact720

cgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatcatgt780

ccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcccagg840

gaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggcttgt900

acttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgagggga960

cctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaa1020

ctccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccaccatg1080

ttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaaata1140

agaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctggctg1200

accttggtctcagcagttttggaatttctgacactcccctggaagagatttttctgaagg1260

tcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagagaaa1320

acgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccccagg1380

actccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctcccccag1440

agccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatgtgc1500

aggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctggcgc1560

agatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatccctc1620

cttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtacacct1680

tcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcctga1740

ataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccctgtg1800

gcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttccaga1860

agcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaagc1920

tcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaacac1980

agcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttggtaa2040

aaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaacaga2100

ggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaagcac2160

ttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatcacta2220

gagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaacatta2280

aggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcccaca2340

acgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatcaccg2400

tcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctgacca2460

cttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccagcca2520

gctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagtttatca2580

gtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaattatt2640

ccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctacactt2700

ctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtcattc2760

ccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggctttat2820

cttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaattat2880

ttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgtct2940

tcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtgacag3000

atgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctgattg3060

ggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgctgg3120

tccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccattgttg3180

atgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaactg3240

acatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagcagtgg3300

acaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatggtg3360

ccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggggatg3420

ccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatgggct3480

actgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttaccttt3540

atgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtatta3600

agagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggcaaca3660

agcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctggatg3720

agcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgagca3780

tcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgaggcac3840

tgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattcagc3900

atctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccgaagg3960

acgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccaggca4020

gtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctccctgg4080

cgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtactcag4140

tcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaagtc4200

atgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgactaca4260

aagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatgacaagt4320

gagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaact4380

agaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgta4440

accattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcag4500

gttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaa4560

atcgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaatcat4620

taactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgct4680

cactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagt4740

gagcgagcgagcgcgcag4758

<210>76

<211>4844

<212>dna

<213>人工序列

<220>

<223>合成

<400>76

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180

ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240

ctttcaagcttatgcacagctggaacttcaagctgtacgtcatgggcagcggcggggtac300

catgcacagctggaacttcaagctgtacgtcatgggcagcggcggatgcacagctggaac360

ttcaagctgtacgtcatgggcagcggcgataggcacctattggtcttactgacatccact420

ttgcctttctctccacaggtccatcctgacgggtctgttgccaccaacctctgggactgt480

gctcgttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttggcat540

gtgtccacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgttcta600

tgcccagctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgttgga660

ggacacaggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggcatgca720

gagaaagctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctggacga780

acccacctctggggtggacccttactcgagacgctcaatctgggatctgctcctgaagta840

tcgctcaggcagaaccatcatcatgtccactcaccacatggacgaggccgacctccttgg900

ggaccgcattgccatcattgcccagggaaggctctactgctcaggcaccccactcttcct960

gaagaactgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaacatcca1020

gagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccac1080

gtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatga1140

gctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtca1200

agaacttatcttccttcttccaaataagaacttcaagcacagagcatatgccagcctttt1260

cagagagctggaggagacgctggctgaccttggtctcagcagttttggaatttctgacac1320

tcccctggaagagatttttctgaaggtcacggaggattctgattcaggacctctgtttgc1380

gggtggcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgggtcccag1440

agagaaggctggacagacaccccaggactccaatgtctgctccccaggggcgccggctgc1500

tcacccagagggccagcctcccccagagccagagtgcccaggcccgcagctcaacacggg1560

gacacagctggtcctccagcatgtgcaggcgctgctggtcaagagattccaacacaccat1620

ccgcagccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgtttttggc1680

tctgatgctttctattgttatccctccttttggcgaataccccgctttgacccttcaccc1740

ctggatatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtgagcagtt1800

cacggtacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcctgaagga1860

agggtggcttccggagtacccctgtggcaactcaacaccctggaagactccttctgtgtc1920

cccaaacatcacccagctgttccagaagcagaaatggacacaggtcaacccttcaccatc1980

ctgcaggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagggtgccgg2040

gggcctcccgcccccccagagaacacagcgcagcacggaaattctacaagacctgacgga2100

caggaacatctccgacttcttggtaaaaacgtatcctgctcttataagaagcagcttaaa2160

gagcaaattctgggtcaatgaacagaggtatggaggaatttccattggaggaaagctccc2220

agtcgtccccatcacgggggaagcacttgttgggtttttaagcgaccttggccggatcat2280

gaatgtgagcgggggccctatcactagagaggcctctaaagaaatacctgatttccttaa2340

acatctagaaactgaagacaacattaaggtgtggtttaataacaaaggctggcatgccct2400

ggtcagctttctcaatgtggcccacaacgccatcttacgggccagcctgcctaaggacag2460

aagccccgaggagtatggaatcaccgtcattagccaacccctgaacctgaccaaggagca2520

gctctcagagattacagtgctgaccacttcagtggatgctgtggttgccatctgcgtgat2580

tttctccatgtccttcgtcccagccagctttgtcctttatttgatccaggagcgggtgaa2640

caaatccaagcacctccagtttatcagtggagtgagccccaccacctactgggtaaccaa2700

cttcctctgggacatcatgaattattccgtgagtgctgggctggtggtgggcatcttcat2760

cgggtttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtggcactgct2820

cctgctgtatggatgggcggtcattcccatgatgtacccagcatccttcctgtttgatgt2880

ccccagcacagcctatgtggctttatcttgtgctaatctgttcatcggcatcaacagcag2940

tgctattaccttcatcttggaattatttgagaataaccggacgctgctcaggttcaacgc3000

cgtgctgaggaagctgctcattgtcttcccccacttctgcctgggccggggcctcattga3060

ccttgcactgagccaggctgtgacagatgtctatgcccggtttggtgaggagcactctgc3120

aaatccgttccactgggacctgattgggaagaacctgtttgccatggtggtggaaggggt3180

ggtgtacttcctcctgaccctgctggtccagcgccacttcttcctctcccaatggattgc3240

cgagcccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaagacaaag3300

aattattactggtggaaataaaactgacatcttaaggctacatgaactaaccaagattta3360

tccaggcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctggagagtg3420

ctttggcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgctcactgg3480

ggacaccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaaccaatat3540

ttctgaagtccatcaaaatatgggctactgtcctcagtttgatgcaatcgatgagctgct3600

cacaggacgagaacatctttacctttatgcccggcttcgaggtgtaccagcagaagaaat3660

cgaaaaggttgcaaactggagtattaagagcctgggcctgactgtctacgccgactgcct3720

ggctggcacgtacagtgggggcaacaagcggaaactctccacagccatcgcactcattgg3780

ctgcccaccgctggtgctgctggatgagcccaccacagggatggacccccaggcacgccg3840

catgctgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcctcacatc3900

ccacagcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaaagggcgc3960

ctttcgatgtatgggcaccattcagcatctcaagtccaaatttggagatggctatatcgt4020

cacaatgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctgtggagca4080

gttcttccaggggaacttcccaggcagtgtgcagagggagaggcactacaacatgctcca4140

gttccaggtctcctcctcctccctggcgaggatcttccagctcctcctctcccacaagga4200

cagcctgctcatcgaggagtactcagtcacacagaccacactggaccaggtgtttgtaaa4260

ttttgctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctgctggagc4320

cagtcgacaagcccaggacgactacaaagaccatgacggtgattataaagatcatgacat4380

cgactacaaggatgacgatgacaagtgagcggccgcttcgagcagacatgataagataca4440

ttgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaa4500

tttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaaca4560

acaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagca4620

agtaaaacctctacaaatgtggtaaaatcgataaggatcttcctagagcatggctacgta4680

gataagtagcatggcgggttaatcattaactacaaggaacccctagtgatggagttggcc4740

actccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgc4800

ccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag4844

<210>77

<211>4944

<212>dna

<213>人工序列

<220>

<223>合成

<400>77

ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60

ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120

aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180

ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240

ctttcaagcttatgcagatcttcgtgaagactctgactggtaagaccatcaccctcgagg300

tggagcccagtgacaccatcgagaatgtcaaggcaaagatccaagataaggaaggcattc360

ctcctgatcagcagaggttgatctttgccggaaaacagctggaagatggtcgtaccctgt420

ctgactacaacatccagaaagagtccaccttgcacctggtactccgtctcagaggtgggc480

gaagcttgataggcacctattggtcttactgacatccactttgcctttctctccacaggt540

ccatcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggaca600

ttgaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcc660

tgttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagt720

cccaggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccaca780

agcggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgcca840

ttgcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggacc900

cttactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatca960

tcatgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattg1020

cccagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacag1080

gcttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtg1140

aggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatg1200

acctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctcc1260

accatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttc1320

caaataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgc1380

tggctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttc1440

tgaaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaa1500

gagaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacac1560

cccaggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctc1620

ccccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagc1680

atgtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcc1740

tggcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgtta1800

tccctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagt1860

acaccttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcc1920

tcctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacc1980

cctgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgt2040

tccagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccaggg2100

agaagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccaga2160

gaacacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttct2220

tggtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatg2280

aacagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacggggg2340

aagcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggcccta2400

tcactagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagaca2460

acattaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtgg2520

cccacaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaa2580

tcaccgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgc2640

tgaccacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcc2700

cagccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagt2760

ttatcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatga2820

attattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcct2880

acacttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcgg2940

tcattcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtgg3000

ctttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttgg3060

aattatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctca3120

ttgtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctg3180

tgacagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacc3240

tgattgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccc3300

tgctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagccca3360

ttgttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaata3420

aaactgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccag3480

cagtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtga3540

atggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcag3600

gggatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaata3660

tgggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatcttt3720

acctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactgga3780

gtattaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggg3840

gcaacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgc3900

tggatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcg3960

tgagcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtg4020

aggcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcacca4080

ttcagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccc4140

cgaaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcc4200

caggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcct4260

ccctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagt4320

actcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactg4380

aaagtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacg4440

actacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatg4500

acaagtgagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaacc4560

acaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgcttta4620

tttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatg4680

tttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgt4740

ggtaaaatcgataaggatcttcctagagcatggctacgtagataagtagcatggcgggtt4800

aatcattaactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcg4860

ctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggc4920

ctcagtgagcgagcgagcgcgcag4944

<210>78

<211>228

<212>dna

<213>人工序列

<220>

<223>合成

<400>78

atgcagatcttcgtgaagactctgactggtaagaccatcaccctcgaggtggagcccagt60

gacaccatcgagaatgtcaaggcaaagatccaagataaggaaggcattcctcctgatcag120

cagaggttgatctttgccggaaaacagctggaagatggtcgtaccctgtctgactacaac180

atccagaaagagtccaccttgcacctggtactccgtctcagaggtggg228

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1