本发明涉及构建体、载体、相应的宿主细胞和药物组合物,其允许有效的基因治疗,尤其是大于5kb的基因。
发明背景
许多遗传性视网膜变性(ird)的复明治疗仍是一项未满足的主要医疗需求。迄今,采用腺相关病毒(aav)载体的基因治疗代表着用于治疗许多ird的最具前景的方法。事实上,对于不同的ird进行的多年的临床前研究和大量的临床试验已经确定了aav高效地递送治疗基因至患病视网膜层[光感受器(pr)和视网膜色素上皮(rpe)]的能力1,2,并且已经强调了它们在人类情况中优良的安全和功效概况3-7。不过,将该成功扩大至其它致盲病症的障碍之一是aav载体的包装能力(约5kb)。这已成为对于因大于5kb(后文也称作大基因(largegene))的编码序列(cds)的基因中的突变所致的常规ird的基因替代治疗的开发的限制性因素。
因此,几年来,人们对增加aav的携带能力的策略的鉴定产生了浓厚的兴趣。二元aav载体,基于aav基因组通过分子间重组多连体化(concatamerize)的能力,已被成功地用于解决该问题14-16。二元aav载体通过将大转基因表达盒分裂成分开的两半来产生,所述两半各自包装在单一常规尺寸(ns;<5kb)aav载体中。全长表达盒的重建通过如下方式来实现:在相同细胞被两种二元aav载体共同感染之后,进行:i)这两种载体基因组的反向末端重复(itr)介导的尾-头(tail-to-head)连环化,之后剪接(二元aav反式剪接,ts)15,ii)这两种载体基因组中所含的重叠区域之间的同源重组(二元aav重叠,ov)15,iii)这两者的组合(二元aav杂合)16。发明人及他人已于近期显示了二元aav载体在视网膜中的潜力14,17-19。用于二元aav杂合载体的情况中的最常用的重组引发性区域衍生自人碱性磷酸酶cdna的中间三分之一的872bp序列,其已显示能提供高水平的二元aav杂合载体重建16。发明人显示,包括ak序列的二元aav杂合载体胜过包括正义碱性磷酸酶头区域序列14的那些,这些载体由发明人在ghosh等22的描述的基础上生成。额外的研究已显示该碱性磷酸酶区域的头或尾提供的转基因重建的水平与采用碱性磷酸酶cdna的全长中间三分之一所实现的那些22类似。发明人发现,二元aav反式剪接和杂合ak载体(其包含来自f1噬菌体的短ak重组引发性序列)能高效地转导小鼠和猪视网膜,并且援救小鼠斯特格氏病(stgd)和乌谢尔1b(ush1b)模型14,19。采用二元aavts和杂合ak载体实现的pr转导的水平导致ird小鼠模型的视网膜表型的显著改善,并且可能对治疗遗传性致盲病症有效。此外,具有来自血清型2和5的异源性itr(分别是itr2和itr5)的载体,其具有高度差异性(58%的同源性23),相较于具有同源itr的载体24,显示降低的形成环状单体的能力和增加的定向尾-头连环化。基于此,yan等已显示具有异源性itr2和itr5的二元aav载体能比具有同源itr的二元aav载体24,25更高效地重建转基因表达。
尽管这些研究强调了二元aav载体用于感兴趣的组织(例如视网膜)中的大基因重建的潜力,但人们也表示它们存在关键问题,这些问题需要在考虑该策略的进一步临床转化之前被解决。
来自5′半部载体(其包含启动子序列)和/或来自3′半部载体的截短蛋白产物的生成因为该itr的低启动子活性14,17,20,21而依然是与二元载体的应用相关联的一项主要问题。迄今为止尚未进行正式毒性研究以评价这些截短产物的体内的潜在不利作用,因此产生了安全方面的顾虑。因此,高度希望减少或消除它们的生成。因此,本发明的目的是解决与二元载体系统的应用相关联的这一主要问题。
技术实现要素:
本发明涉及构建体、载体、相应的宿主细胞和药物组合物,其允许有效的基因治疗,尤其是大于5kb的基因。
大基因包括,例如:
斯特格氏病(stgd1;mim#248200)是由abca4(cds:6822bp)中的突变所致的遗传性黄斑变性的最常见形式,该基因编码光感受器-特异性全反式视网膜转运体8,9。视锥-视杆营养不良3型、眼底黄色斑点症、衰老相关黄斑变性2型、早发重度视网膜营养不良和视网膜色素变性19型也与abca4突变相关(abca4相关疾病)。乌谢尔综合征ib型(ush1b;mim#276900)是由myo7a(cds:6648bp)10中的突变所致的耳聋和色素性视网膜炎的最严重组合形式,该基因编码在视网膜的pr和rpe中表达的基于肌动蛋白的传动器(motor)11-13。
此外,许多其它遗传学疾病(不一定造成视网膜症状)也归因于大基因中的突变。这些包括,例如:因dmd中的突变所致的杜氏肌营养不良、因cftr中的突变所致的囊胞性纤维症、因f8中的突变所致的甲型血友病,和因dysf基因中的突变所致的dysferlin肌病。
具体地,本发明目的是,通过利用介导蛋白质降解或避免它们的翻译的信号(后文称作降解信号),减少与多重载体系统相关联(优选与多重病毒载体系统相关联)的截短蛋白产物的表达。降解信号此前从未被用于多重病毒载体。本发明中惊人地发现,当多重载体系统的至少一个载体中存在降解信号时,截短形式的蛋白质的表达显著减少,导致较高产量的全长蛋白质。
因此,本发明的第一方面提供载体系统,以在细胞中表达感兴趣的基因的编码序列,所述编码序列包含第一部分和第二部分,所述载体系统包含:
e)第一载体,其包含:
-所述编码序列的所述第一部分(cds1),
-第一重建序列;和
f)第二载体,其包含:
-所述编码序列的所述第二部分(cds2),
-第二重建序列,
其中,所述第一和第二重建序列选自下组:
i]第一重建序列由所述编码序列的所述第一部分的3'端组成,且第二重建序列由所述编码序列的所述第二部分的5'端组成,所述第一和第二重建序列是重叠序列;或
ii]第一重建序列包含剪接供体信号(sd),且第二重建序列包含剪接受体信号(sa),任选地,第一和第二重建序列各自之一还包含重组引发性序列,
其特征在于,第一和第二载体之一或两者还包含降解信号的核苷酸序列,所述序列在i)的情况中位于cds1的3'端和/或cds2的5'端,而在ii)的情况中位于相对于sd的3'位置中和/或相对于sa的5'位置中。
优选第一和第二载体两者还包含所述降解信号的核苷酸序列,其中,第一载体中的降解信号的核苷酸序列与第二载体中的相同或不同。
优选第一重建序列在相对于所述sd的3'位置中包含剪接供体信号(sd)和重组引发性区域,第二重建序列在相对于所述sa的5'位置中包含剪接受体信号(sa)和重组引发性序列;其中所述降解信号的核苷酸序列位于第一和第二载体之一或两者的重组引发性区域的核苷酸序列的5'端和/或3'端处。
优选所述降解信号的核苷酸序列选自:一种或多种蛋白质泛素化信号、一种或多种微小rna靶序列,和/或一种或多种人工终止密码子。
优选所述降解信号的核苷酸序列包含或由如下部分组成:编码选自cl1seqidno.1、cl2seqidno.2、cl6seqidno.3、cl9seqidno.4、cl10seqidno.5、cl11seqidno.6、cl12seqidno.7、cl15seqidno.8、cl16seqidno.9、sl17seqidno.10,或pb29(seqidno.14或seqidno.15)的序列的序列;或者,其中所述降解信号的核苷酸序列包含或由如下部分组成:选自mir-204seqidno.11、mir-124seqidno.12或mir-26aseqidno.13的序列。
优选第一载体的降解信号的核苷酸序列包含或由如下部分组成:编码cl1seqidno.1的序列,或包含或由如下部分组成:seqidno.16,或包含或由如下部分组成:mir-204seqidno.11和mir-124seqidno.12,优选包含三个拷贝的mir204seqidno.11和三个拷贝的mir124seqidno.12,或包含或由如下部分组成:mir-26aseqidno.13,优选包含四个拷贝的mir-26aseqidno.13。
优选第二载体的降解信号的核苷酸序列包含或由如下部分组成:编码pb29(seqidno.14或seqidno.15)的序列,或包含或由如下部分组成:seqidno.19或seqidno.20,优选第二载体的降解信号包含或由如下部分组成:编码三个拷贝的seqidno.14或seqidno.15的pb29的序列。
优选第一载体还包含操作性地连接至所述编码序列的所述第一部分(cds1)的5'端部分的启动子序列。
优选第一载体和第二载体两者还包含5'末端重复(5'-tr)核苷酸序列和3'末端重复(3'-tr)核苷酸序列,优选所述5'-tr是5'-反向末端重复(5'-itr)核苷酸序列并且所述3'-tr是3'-反向末端重复(3'-itr)核苷酸序列,优选所述itr衍生自相同病毒血清型或衍生自不同的病毒血清型,优选所述病毒是aav。
优选所述重组引发性序列选自下组:akgggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaat(seqidno.22)或
gggatttttccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaat(seqidno.23)、ap1(seqidno.24)、ap2(seqidno.25)和ap(seqidno.26)。
优选所述编码序列在天然外显子-外显子接合部分处被分成第一部分和第二部分。
优选所述剪接供体信号包含或基本由如下部分组成:与gtaagtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgagacagagaagactcttgcgtttct(seqidno.27)至少70%、75%、80%、85%、90%、95%或100%相同的序列。
优选所述剪接受体信号包含或基本由如下部分组成:与gataggcacctattggtcttactgacatccactttgcctttctctccacag(seqidno.28)至少70%、75%、80%、85%、90%、95%或100%相同的序列。
优选第一载体还包含至少一个增强子核苷酸序列,其操作性地连接至所述编码序列。
优选所述编码序列编码能够纠正视网膜变性的蛋白质。
优选所述编码序列编码能够纠正杜氏肌营养不良、囊胞性纤维症、甲型血友病和dysferlin肌病的蛋白质。
在视网膜降解的情况中,优选所述编码序列是选自下组的基因的编码序列:abca4、myo7a、cep290、cdh23、eys、pcdh15、cacna1、snrnp200、rp1、prpf8、rp1l1、alms1、ush2a、gpr98、hmcn1。
在杜氏肌营养不良、囊胞性纤维症、甲型血友病和dysferlin肌病的情况中,优选所述编码序列是选自下组的基因的编码序列:dmd、cftr、f8和dysf。
优选第一载体不包含聚腺苷酸化信号核苷酸序列。
优选所述载体系统包含:
e)第一载体,其以5'-3'方向包含:
-5'反向末端重复(5'-itr)序列;
-启动子序列;
-感兴趣的基因的编码序列的5'端部分(cds1),所述5'端部分操作性地连接至并受控于所述启动子;
-剪接供体信号的核苷酸序列;
-重组引发性区域的核苷酸序列;和
-3'反向末端重复(3'-itr)序列;以及
f)第二载体,其以5'-3'方向包含:
-5'反向末端重复(5'-itr)序列;
-重组引发性区域的核苷酸序列;
-剪接受体信号的核苷酸序列;
-所述编码序列的3'端(cds2);
-聚腺苷酰化信号核苷酸序列;以及
-3’反向末端重复(3’-itr)序列,
其特征在于,还包含降解信号的核苷酸序列,所述序列位于第一和第二载体之一或两者的重组引发性区域的核苷酸序列的5'端或3'端。
优选地,本发明的载体中,所述第一和第二载体独立地是病毒载体,优选腺病毒载体或腺相关病毒(aav)载体,优选所述第一和第二腺相关病毒(aav)载体选自相同或不同的aav血清型,优选所述腺相关病毒选自血清型2、血清型8、血清型5、血清型7或血清型9。
优选地,本发明的载体系统还包含第三载体,其包含所述编码序列的第三部分(cds3)和重建序列,其中第二载体包含两个重建序列,各重建序列位于cds2的各端。
优选地,第一载体的重建序列由cds1的3'端组成,第二载体的两个重建序列各自分别由cds2的5'端和3'端组成,第三载体的重建序列由cds3的5'端组成;
其中,由cds2的5'端组成的第二载体的所述重建序列和第一载体的所述重建序列是重叠序列,并且
其中,由cds2的3'端组成的第二载体的所述重建序列和所述第三载体的所述重建序列是重叠序列;
其中,所述第二载体还包含降解信号,所述降解信号位于cds2的5'端和/或3'端。
优选地,所述第三载体还包含降解信号的至少一个核苷酸序列。
优选地,第二载体还包含连接至所述编码序列的3'端部分(cds2)的聚腺苷酸化信号核苷酸序列。
本发明提供宿主细胞,其用如上定义的载体系统转化。
优选地,本发明的载体系统或宿主细胞用于医学应用。优选用于基因治疗。优选用于治疗和/或预防以视网膜变性为特征的病理状态或疾病,或用于预防和/或治疗杜氏肌营养不良、囊胞性纤维症、甲型血友病和dysferlin肌病。
优选地,该视网膜变性是遗传性的。
优选地,所述病理状态或疾病选自下组:色素性视网膜炎(rp)、莱伯氏先天性黑蒙(lca)、斯特格氏病(stgd)、阿瑟氏病(ush)、阿尔斯特雷姆综合征、先天性静止性夜盲(csnb)、黄斑营养不良、隐匿性黄斑营养不良、由abca4基因中的突变所致的疾病。
本发明提供药物组合物,其包含如上定义的载体系统或宿主细胞,和药学上可接受的载剂。
本发明提供治疗和/或预防以视网膜变性为特征的病理状态或疾病的方法,其包括,给予有此需要的对象有效量的如上定义的载体系统、宿主细胞或药物组合物。
本发明提供治疗和/或预防杜氏肌营养不良、囊胞性纤维症、甲型血友病或dysferlin肌病的方法,其包括,给予有此需要的对象有效量的如上定义的载体系统、宿主细胞或药物组合物。
本发明提供降解信号的核苷酸序列在载体系统的应用,以减少截短形式的蛋白质的表达。
本发明提供减少截短形式的蛋白质的表达的方法,其包括,在载体系统的一个或多个载体中插入降解信号的核苷酸序列。
根据本发明的优选实施方式,在细胞中表达感兴趣的基因的编码序列的载体系统包含两种载体,各载体包含所述编码序列的不同的部分和重建序列;优选地,第一载体的重建序列是包含剪接供体的序列,而第二载体的重建序列是包含剪接受体的序列。
根据本发明的更优选的实施方式,在细胞中表达感兴趣的基因的编码序列的载体系统包含三种载体,各载体包含所述编码序列的不同的部分和至少一个重建序列;优选地,第一载体包含,在相对于所述编码序列的第一部分的3'位置中包含剪接供体的重建序列,第二载体包含,在相对于第二部分编码序列的5'位置中包含剪接受体的重建序列和在相对于所述编码序列的第二部分的3'位置中包含剪接供体的重建序列,第三载体包含,在相对于第三部分编码序列的5'位置中包含剪接受体的重建序列。
优选地,第一和第二载体的重建序列或第一、第二和第三载体的重建序列还包含重组引发性区域,优选位于相对于剪接供体的3'位置中和相对于剪接受体的5'位置中。
本发明的载体系统的载体之一或两种或全部还包含降解信号的核苷酸序列。
优选地,第一载体包含降解信号。优选地,第二载体包含降解信号。
根据本发明的优选实施方式,其中,所述载体包含重建序列,所述重组序列包含重组引发性区域,一种位于所述重组引发性区域的序列的5'端或3'端处的降解信号。
根据本发明的优选实施方式,在细胞中表达感兴趣的基因的编码序列的载体系统包含两种载体;所述载体系统的第一载体以5'-3'方向包含:
-感兴趣的基因的编码序列的5'端部分,
-剪接供体信号的核酸序列,
-重组引发性区域的核酸序列,和
-降解信号的核酸序列。
根据本发明的优选实施方式,在细胞中表达感兴趣的基因的编码序列的载体系统包含两种载体,所述载体系统的第二载体以5'-3'方向包含:
-所述重组引发性区域的核酸序列,
-所述降解信号的核酸序列,
-所述剪接受体信号的核酸序列,和
-感兴趣的基因的编码序列的3'端部分。
优选地,本发明的载体系统的第一载体还包含启动子序列,更优选所述启动子序列操作性地连接至感兴趣的基因的编码序列的第一部分的5'端。
优选地,由两种载体组成的载体系统的第二载体还包含聚腺苷酸化信号核酸序列,更优选所述聚腺苷酸化信号核酸序列连接至感兴趣的基因的编码序列的第二部分的3'端。优选地,本发明的载体系统的第一载体不包含聚腺苷酸化信号核酸序列。
优选地,由三种载体组成的载体系统的第三载体还包含聚腺苷酸化信号核酸序列,更优选所述聚腺苷酸化信号核酸序列连接至感兴趣的基因的编码序列的第三部分的3'端。
优选地,本发明的载体系统的载体中的至少一种,更优选本发明的载体系统的第一载体,包含如下序列的降解信号,所述序列包含或由如下部分组成:编码cl1seqidno.1的序列;优选地,所述编码cl1seqidno.1的序列包含或由如下部分组成:seqidno.16。
优选地,本发明的载体系统的载体中的至少一种,更优选本发明的载体系统的第一载体,包含如下序列的降解信号,所述序列包含mir-204seqidno.11和mir-124seqidno.12,更优选三个拷贝的mir204seqidno.11和三个拷贝的mir124seqidno.12;优选mir204序列和mir124序列,和/或,mir204序列和mir124序列的各个拷贝通过至少1个、至少2个、至少3个、至少4个核苷酸的接头序列连接。
优选地,本发明的载体系统的载体中的至少一种,更优选本发明的载体系统的第一载体,包含如下序列的降解信号,所述序列包含或由如下部分组成:mir-26aseqidno.13,更优选包含四个拷贝的mir-26aseqidno.13。
优选地,本发明的载体系统的载体中的至少一种,更优选本发明的载体系统的第二载体,包含如下序列的降解信号,所述序列包含或由如下部分组成:编码pb29(seqidno.14或seqidno.15)的序列;优选地,所述编码pb29的序列包含或由如下部分组成:seqidno.19或seqidno.20;更优选地,序列的所述降解信号包含或由如下部分组成:编码seqidno.14或seqidno.15的三个拷贝的pb29的序列。
根据本发明的优选实施方式,所述载体系统包含:
a)第一载体,其以5'-3'方向包含:
-5'反向末端重复(5'-itr)序列;
-启动子序列;
-感兴趣的基因的编码序列的第一部分,优选是所述编码序列的5'端部分,优选所述第一部分操作性地连接至并受控于所述启动子;
-剪接供体信号的核酸序列;
-重组引发性区域的核酸序列;和
-3'反向末端重复(3'-itr)序列;以及
b)第二载体,其以5'-3'方向包含:
-5'反向末端重复(5'-itr)序列;
-重组引发性区域的核酸序列;
-剪接受体信号的核酸序列;
-感兴趣的基因的编码序列的第二部分,优选是所述编码序列的3'端部分;
-聚腺苷酰化信号核酸序列;以及
-3'反向末端重复(3'-itr)序列,
所述第一和/或第二载体还包含降解信号的核酸序列,所述序列位于所述重组引发性区域的核酸序列的5'端或3'端。
根据本发明的更优选的实施方式,所述载体系统包含:
a)第一载体,其以5'-3'方向包含:
-5'反向末端重复(5'-itr)序列;
-启动子序列;
-感兴趣的基因的编码序列的第一部分,其优选操作性地连接至并受控于所述启动子;
-剪接供体信号的核酸序列;
-重组引发性区域的核酸序列;和
-3'反向末端重复(3'-itr)序列;
b)第二载体,其以5'-3'方向包含:
-5'反向末端重复(5'-itr)序列;
-重组引发性区域的核酸序列;
-剪接受体信号的核酸序列;
-感兴趣的基因的编码序列的第二部分;
-剪接供体信号的核酸序列;
-重组引发性区域的核酸序列;
-3'反向末端重复(3'-itr)序列;以及
c)第三载体,其以5'-3'方向包含:
-5'反向末端重复(5'-itr)序列;
-重组引发性区域的核酸序列;
-剪接受体信号的核酸序列;
-感兴趣的基因的编码序列的第三部分;
-聚腺苷酰化信号核酸序列;以及
-3'反向末端重复(3'-itr)序列,
所述第一和/或第二和/或第三载体还包含降解信号的核酸序列,所述序列位于一个或多个重组引发性区域的核酸序列的5'端或3'端。
优选地,所述病理状态或疾病选自:乌谢尔1f型(ush1f)、先天性静止性夜盲(csnb2)、常染色体显性(ad)和/或常染色体隐性(ar)色素性视网膜炎(rp)、ush1b、stgd1、莱伯氏先天性黑蒙10型(lca10)、rp、乌谢尔1d型(ush1d)、乌谢尔2a型(ush2a)、常染色体显性黄斑营养不良、乌谢尔2c型(ush2c)、隐匿性黄斑营养不良、阿尔斯特雷姆综合征。
本发明中,载体系统表示构建体系统、质粒系统以及病毒颗粒。
本发明中,所述构建体或载体系统可包括多于两种载体。
具体地,所述构建体系统可包括第三载体,其包含感兴趣的序列的第三部分。
本发明中,在不同的(2、3或更多)载体被引入细胞时,重建或获得全长编码序列。
所述编码序列可一分为二。这些部分的长度可以相等或不同。当所述载体系统的载体被引入细胞时,获得全长编码序列。第一部分可以是所述编码序列的5'端部分。第二部分可以是所述编码序列的3'端。此外,所述编码序列可被分成三个部分。这些部分的长度可以相等或不同。当所述载体系统的载体被引入细胞时,获得全长编码序列。第一部分是编码序列的5'端部分,第二部分是所述编码序列的中间部分,第三部分是编码序列的3'部分。
本发明中,所述细胞优选是哺乳动物细胞,优选人细胞。
本发明中,所述载体中的任何一种中的一个降解信号的存在足以减少截短形式的蛋白质的生成。
术语降解信号表示(核苷酸或氨基酸的)序列,它可介导包含它的mrna/蛋白质的降解。
术语“截短形式的蛋白质”或“截短蛋白”是这样的蛋白质,它不以其全长形式产生,因为它存在从单个氨基酸到多个(例如1-10、1-20、1-50、100、200个等)氨基酸的缺失。
本发明中,“重建序列”是这样的序列,它允许重建具有正确框(correctframe)的全长编码序列,因此允许功能蛋白的表达。
术语“剪接供体/受体信号”表示mrna的剪接中涉及的核苷酸序列。
本发明中,可采用来自任何内含子的任何剪接供体或受体信号序列。本领域技术人员知晓如何通过常规实验识别并选择合适的剪接供体或受体信号序列。
本发明中,如果两种序列各自的至少一部分是彼此同源的,那么这两种序列是重叠的。所述序列可以重叠至少1个、至少2个、至少5个、至少10个、至少20个、至少50个、至少100个、至少200个核苷酸。
术语“重组引发性区域或序列”表示这样的序列,其介导两种不同的序列之间的重组。“重组引发性区域或序列”和“同源区域”在本文中可互换使用。
术语“末端重复”表示这样的序列,其在核苷酸序列的两端重复。
术语“反向末端重复”表示这样的序列,其在核苷酸序列的两端以相反方向(反向互补)重复。
蛋白质泛素化信号是通过蛋白酶体介导蛋白质降解的信号。
本发明中,如果降解信号包含重复序列(是相同序列或不同序列),则所述重复序列优选通过至少1个核苷酸的接头连接。
人工终止密码子是故意包括在转录本中以诱导蛋白质翻译的过早终止的核苷酸序列。
增强子序列是增加基因的转录的序列。
根据本发明,合适的降解信号包括:(i)短降解决定子cl1,一种c末端失稳肽,其与错误折叠的蛋白质共有结构相似性,因此被泛素化系统识别31,32,(ii)泛素,其在供体蛋白质的n末端的融合介导直接蛋白质降解或通过n端规则途径的降解33,34,和(iii)n末端pb29降解决定子,其是9个氨基酸长的肽,其与cl1降解决定子相似,预期能在被泛素化途径的酶识别的结构中折叠35。发明人发现,在多重载体系统中纳入降解序列或信号能减少截短蛋白的表达。在一个实例中,发明人发现,包括cl1降解信号能导致从5'半部的截短蛋白的选择性降解,而不影响体外和大猪视网膜中的全长蛋白质生成。
此外,可插入人工终止密码子以造成mrna的早期终止。
微小rna(mir)靶序列,人工终止密码子或蛋白质泛素化信号可用于介导截短蛋白产物的降解。本发明中,降解信号序列可包含重复序列,例如多于一种微小rna(mir)靶序列、人工终止密码子或蛋白质泛素化信号,所述重复序列是重复至少两次的相同序列或不同序列;优选地,所述重复序列通过至少1个核苷酸的接头连接。
在视网膜中表达的mir中,mir-let7b或-26a以高水平表达26-29,而mir-204和-124已显示将aav-介导的转基因表达限制到rpe或光感受器30。karali等30测试了mir靶位点在调控特异性细胞类型中的单一aav载体中包括的基因的表达的功效。在karali等中,mir靶位点包括在典型表达盒(编码整个报告基因)中,编码序列的下游,并且在聚腺苷酸化信号(polya)之前。karali等采用针对mir-204或mir-124的mir靶位点,并且采用4个串联拷贝的各mir。
本发明中mir还可以是mir模拟物(xiao等.jcellphysiol212:285-292,2007;wangzmethodsmolbiol676:211-223,2011)。发明人首次将这些策略应用于多重载体构建体,并且能够使从所述载体产生的截短蛋白的表达沉默。
在过去的十年间,已在数以百计的临床试验中将基因治疗应用于治疗疾病。已开发不同的工具用于将基因递送进入人细胞。本发明中,可将递送载剂给予患者。本领域技术人员能够确定适当的给药范围。术语“给予”包括通过病毒或非病毒技术递送。非病毒递送机制包括但不限于脂质介导的转染、脂质体、免疫脂质体、脂质体转染试剂、阳离子表面两亲物(cfa)及其组合。病毒递送中,遗传学工程改造的病毒,包括腺相关病毒,是目前用于基因递送的最广泛应用的工具之一。基于病毒的基因递送的概念是对病毒进行工程改造以使其表达感兴趣的基因或调控序列例如启动子和内含子。取决于具体应用和病毒类型,大多数病毒载体含有阻碍其在宿主中像野生型病毒那样自由复制的能力的突变。已对来自若干不同家族的病毒进行修饰以生成用于基因递送的病毒载体。这些病毒包括逆转录病毒、慢病毒、腺病毒、腺相关病毒、疱疹病毒、杆状病毒、小核糖核酸病毒和α病毒。本发明优选使用腺相关病毒。大多数系统含有能够容纳感兴趣的基因的载体和辅助细胞,这些辅助细胞可提供病毒结构蛋白和酶以允许生成含有载体的感染性病毒颗粒。腺相关病毒是一种病毒家族,其在核苷酸和氨基酸序列、基因组结构、致病性和宿主范围方面存在差异。该多样性提供了使用具有不同生物学性质的病毒来开发不同的治疗性应用的机会。如同使用任何递送工具那样,效率、靶向特定组织或细胞类型的能力、感兴趣的基因的表达以及基于腺相关病毒的系统的安全性对于基因治疗的成功应用至关重要。近年来已在这些研究领域做出了众多尝试。已对基于腺相关病毒的载体和辅助细胞进行了多种修饰以改变基因表达、靶向递送、改善病毒效价并提高安全性。本发明代表了该设计过程的改进,其中其作用是向这类病毒载体有效地递送感兴趣的基因。
理想的用于基因递送的基于腺相关病毒的载体必须是高效、细胞特异性、受调控和安全的。递送效率是重要的,因为其可决定治疗的效力。目前的努力旨在使用腺相关病毒载体实现细胞类型特异性感染和基因表达。此外,腺相关病毒载体正在被开发用于调控感兴趣基因的表达,因为治疗可能需要长时间或受调控的表达。安全性是病毒基因递送的一个重要问题,因为大多数病毒是病原体或具有致病潜力。重要的是,在基因递送期间,患者还不会不经意地接受具有全复制潜能的致病性病毒。
腺相关病毒(aav)是一种感染人和一些其他灵长类物种的小病毒。目前已知aav不会导致疾病,因此该病毒导致非常轻度的免疫应答。使用aav的基因治疗载体可感染分裂和静止的细胞,并维持在染色体外状态且不整合至宿主细胞的基因组中。这些特征使得aav是一种建立用于基因治疗的病毒载体和建立同基因人疾病模型的非常有吸引力的候选物。
因为多种特征,野生型aav吸引了基因治疗研究者的大量兴趣。其中最主要的是该病毒明显缺少致病性。其还可感染非分裂细胞并能够在人染色体19的特定位点处(命名为aavs1)稳定整合至宿主细胞基因组中。该特征使其与逆转录病毒相比更具可预测性,所述逆转录病毒代表了随机插入和诱变的威胁,这之后有时会发生癌症。aav基因组最频繁地整合至上述位点,而向基因组的随机整合以可忽略的频率发生。然而,开发aav作为基因治疗载体已通过从载体的dna上除去rep和cap消除了这种整合能力。所需基因以及驱动该基因表达的启动子被插入itr之间,所述反向末端重复辅助在通过宿主细胞dna聚合酶复合物将单链载体dna转化为双链dna后在核中形成多联体(concatamer)。基于aav的基因治疗载体在宿主细胞核中形成附加型多联体。在非分裂细胞中,这些多联体在宿主细胞生命期间维持完整。在分裂细胞中,aavdna通过细胞分裂而丢失,因为附加型dna不会随宿主细胞dna复制。aavdna向宿主基因组中的随机整合是可检测的,但以非常低的频率发生。aav还具有非常低的免疫原性,似乎限于生成中和抗体,而其不诱导清楚界定的细胞毒性应答。该特征以及感染静止细胞的能力使其在用于人基因治疗的载体方面优于腺病毒。
aav基因组、转录组和蛋白质组
aav基因组由长度约4.7千碱基的正义或反义的单链脱氧核糖核酸(ssdna)构成。该基因组包含位于dna链两端的反向末端重复(itr)以及两个开放阅读框(orf):rep和cap。前者由编码aav生命周期所需的rep蛋白的四个重叠基因组成,且后者含有衣壳蛋白的重叠核苷酸序列:vp1、vp2和vp3,其相互作用以形成二十四面对称的衣壳。
itr序列
反向末端重复(itr)序列的名称来源于它们的对称性,所述对称性显示是aav基因组的高效增加所需的。这些序列的另一个性质是其形成发卡结构的能力,所述发卡结构有助于所谓自启效应(self-priming),其允许第二dna链的引发酶非依赖性合成。这些itr还显示是aavdna整合至宿主细胞基因组(人的第19号染色体)并从中拯救以及aavdna的有效衣壳化和生成完全组装且脱氧核酸酶耐受性aav颗粒所必需的。
对于基因治疗,itr似乎是与治疗性基因顺式相邻所需的唯一序列:结构(cap)和包装(rep)基因可反式递送。在该假定下,建立了许多方法以有效生成含有报告基因或治疗性基因的重组aav(raav)载体。然而,还公开了itr不是顺式有效复制和衣壳化所需的唯一元件。一些研究组鉴定到了rep基因编码序列内命名为顺式作用rep依赖性元件(care)的序列。care被证明在顺式情况下增加复制和衣壳化。
截至2006年已描述了11种aav血清型,2004年时描述了第11种。所有已知的血清型都可感染来自多种不同组织类型的细胞。通过衣壳血清型确定组织特异性且假型化aav载体以改变其向性范围对其在治疗中的应用可能是重要的。
用于本发明的aav载体系统的反向末端重复(itr)序列可以是任何aavitr。用于aav载体的itr可以是相同或不同的。例如,载体可包含aav血清型2的itr和aav血清型5的itr。在本发明的载体的一个实施方式中,itr来自aav血清型2、4、5或8。在本发明中,优选aav血清型2和血清型5的itr。aavitr序列是本领域熟知的(例如,对于itr2,参见genbank登录号af043303.1;nc_001401.2;j01901.1;jn898962.1;对于itr5,参见genbank登录号nc_006152.1)。
血清型2
迄今为止,血清型2(aav2)被研究得最为透彻。aav2对于骨骼肌、神经元、血管平滑肌细胞和肝细胞具有天然向性。
已描述了三种针对aav2的细胞受体:硫酸乙酰肝素蛋白多糖(hspg)、avβ5整联蛋白和成纤维细胞生长因子受体1(fgfr-1)。第一种的功能是主要受体,而后两种具有共受体活性并能够使aav通过受体介导的胞吞作用进入细胞。这些研究结果受到了qiu,handa等的怀疑。hspg的功能是主要受体,但其在胞外基质中的丰度可清除aav颗粒并损伤感染效率。
血清型2和癌症
研究证明,该病毒的血清型2(aav-2)明显杀伤癌细胞而不损害健康细胞。“我们的结果表明,感染大部分群体但不具有已知疾病作用的2型腺相关病毒杀伤多种类型的癌细胞但对健康细胞没有影响”,宾夕法尼亚州的宾州州立大学医学院的免疫学和微生物学教授craigmeyers说。这可导向新的抗癌试剂。
其他血清型
虽然aav2是多种基于aav2的研究中最常用的血清型,但也证明其他血清型可更有效地作为基因递送载体。例如,aav在感染气道上皮细胞中似乎更好,aav7对鼠骨骼肌细胞具有非常高的转导率(类似于aav1和aav5),aav8最适合转导肝细胞和光感受器,且aav1和5显示在向血管内皮细胞的基因递送中非常有效。在脑中,大多数aav血清型显示神经元向性,而aav5还能转导星形细胞。aav1和aav2的杂合体aav6还显示比aav2低的免疫原性。
各血清型的不同之处可在于其结合的受体。例如,aav4和aav5转导可被可溶性唾液酸抑制(对于各种这类血清型有不同的形式),且aav5显示通过血细胞衍生的生长因子受体进入细胞。
本发明还涉及病毒载体系统,其包含本发明的多核苷酸、表达构建体,或载体构建体。在一个实施方式中,所述病毒载体系统是aav系统。制备包含异源性多核苷酸的病毒和病毒粒或构建体的方法是本领域已知的。对于aav,细胞可用腺病毒或包含适于aav辅助功能的腺病毒基因的多核苷酸构建体共同感染或转染。材料和方法的示例描述于,例如,美国专利号8,137,962和6,967,018。本发明的aav病毒或aav载体可以是任何aav血清型,包括但不限于,血清型aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aav9、aav10和aav11。在具体实施方式中,采用aav2或aav5或aav7或aav8或aav9血清型。在一个实施方式中,aav血清型在衣壳表面上提供一个或多个酪氨酸-苯丙氨酸(y-f)突变。在具体实施方式中,aav是aav8血清型,其具有位置733处的酪氨酸-苯丙氨酸突变(y733f)。
通过本发明所述载体系统递送一种或多种治疗基因或调控序列例如启动子或内含子可单独使用或与其他治疗或治疗组分联用。
本发明还涉及宿主细胞,其包含本发明的构建体系统或病毒载体系统。该宿主细胞可以是培养的细胞或原代细胞,即直接从生物体(如人)中分离。该宿主细胞可以是粘附性细胞或悬浮的细胞,即悬液形式生长的细胞。合适的宿主细胞是本领域已知的且包括例如dh5α、大肠杆菌细胞、中华仓鼠卵巢细胞、猴vero细胞、cos细胞、hek293细胞等。细胞可以是人细胞或来自其它动物。在一个实施方式中,所述细胞是光感受器细胞或rpe细胞。在具体实施方式中,所述细胞是视锥细胞。所述细胞还可以是肌细胞,具体地,骨骼肌细胞,肺细胞,胰腺细胞,肝细胞,肾细胞,肠细胞,血液细胞。在具体实施方式中,所述细胞是人视锥细胞或视杆细胞。本领域技术人员根据本文教导能够选择合适的宿主。优选地,所述宿主细胞是动物细胞,且更优选是人细胞。所述细胞可表达在本发明的病毒载体系统中提供的核苷酸序列。
本领域技术人员应理解将多核苷酸或载体整合至宿主细胞内的标准方法,例如转染、脂质转染、电穿孔、微注射、病毒感染、热击、转化(细胞融合或细胞膜的化学通透后)。本发明的构建体或载体系统还可以裸dna的形式被引入体内,所述引入采用本领域已知的方法进行,例如转染、微注射、电穿孔、磷酸钙沉淀和通过基因枪方法。
本文中,术语“宿主细胞或遗传工程改造的宿主细胞”指使用本发明的构建体系统或使用本发明的病毒载体系统转导、转化或转染的宿主细胞。
本文所用的术语"核酸"和"多核苷酸序列"和“构建体”指,单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,除非另有限制,其将涵盖能够以与天然产生的核苷酸相似的方式行使功能的天然核苷酸的已知类似物。所述多核苷酸序列包括全长序列以及源自全长序列的较短序列。应理解,具体多核苷酸序列包括一种或多种原始序列的简并密码子,其可被引入以在特异性宿主细胞中提供密码子偏好。落入本发明范围内的多核苷酸序列还包括这样的序列,其与编码本发明的肽的序列特异性地杂交。所述多核苷酸包括正义和反义链,以个体链或以双链体的形式。
本发明还设想这样的多核苷酸分子,它们具有与本发明的多核苷酸序列充分同源的序列,从而允许在标准严格条件下采用标准方法与该序列杂交(maniatis,t.等,1982)。
本发明还涉及构建体系统,其可包括在其中表达所述构建体的目标宿主细胞中行使功能的调节元件。本领域普通技术人员可选择用于合适的宿主细胞(例如,哺乳动物或人宿主细胞)的调节元件。调节元件包括,例如,启动子、转录终止序列、翻译终止序列、增强子、信号肽、降解信号和聚腺苷酸化元件。本发明的构建体可包含操作性地连接至编码所需的多肽的核苷酸序列的启动子序列。
设想用于本发明中的启动子包括但不限于,原始基因启动子、巨细胞病毒(cmv)启动子(kf853603.1,bp149-735)、嵌合cmv/鸡β肌动蛋白启动子(cba)和截短形式的cba(smcba)启动子(us8298818和“用aavgc1处理的产后鸟苷酸环化酶-1敲出小鼠视网膜的视椎中的光驱动视锥抑制蛋白的易位(light-drivenconearrestintranslocationinconesofpostnatalguanylatecyclase-1knockoutmouseretinatreatedwithaavgc1)”)、视紫红质启动子(ng_009115,bp4205-5010)、光感受器间类视黄醇结合蛋白质启动子(ng_029718.1,bp4777-5011)、卵黄状黄斑营养不良2启动子(ng_009033.1,bp4870-5470)、pr-特异性人g蛋白质偶联受体激酶1(hgrk1;ay327580.1bp1793-2087或bp1793-1991)(haire等.2006;美国专利号8,298,818)。但可以使用本领域已知的任何合适启动子。在具体实施方式中,启动子是cmv或hgrk1启动子。在一个实施方式中,启动子是组织-特异性启动子,其在一种或一组组织中显示选择性活性,但在其它组织中显示低活性或无活性。在一个实施方式中,该启动子是光感受器特异性启动子。在另一个实施方式中,所述启动子是视锥细胞-特异性和/或视杆细胞-特异性启动子。
优选的启动子是cmv、grk1、cba和irbp启动子。更优选的启动子是杂合启动子,其组合了来自不同的启动子的调节元件(例如,嵌合cba启动子,其组合了来自cmv启动子的增强子、cba启动子和sv40嵌合内含子,本文中称为cba杂合启动子。
可采用本领域已知的标准技术将启动子纳入构建体。多重拷贝的启动子或多重启动子可用于本发明的载体。在一个实施方式中,所述启动子的定位与转录起始位点的距离可以与其在其天然遗传学环境中与转录起始位点的距离大约相同。允许该距离上存在一些变化而不显著减少启动子活性。在本发明的系统中,转录起始位点通常包括在5'构建体中,但不在3'构建体中。在另一个实施方式中,转录起始位点可包括在降解信号上游的3'构建体中。
本发明的构建体可任选地包含转录终止序列、翻译终止序列、信号肽序列、内部核糖体进入位点(ires)、增强子元件,和/或转录后调节元件例如土拨鼠肝炎病毒(whv)转录后调节元件(wpre)。转录终止区域通常可获自真核或病毒基因序列的3'未翻译区域。转录终止序列可定位于编码序列下游以提供高效终止。在本发明的系统中,转录终止位点通常包括在3'构建体中但不在5'构建体中。
信号肽序列是编码与将操作性连接至广泛多种翻译后细胞目的地(从特定细胞器区室到蛋白质作用和胞外环境位点)的多肽的重新定位相关联的信息的氨基末端序列。增强子是顺式作用元件,其增加基因转录,从而也可被包括在载体中。增强子元件是本领域已知的,并且包括但不限于,camv35s增强子元件、巨细胞病毒(cmv)早期启动子增强子元件,和sv40增强子元件。引导由结构基因编码的mrna的聚腺苷酸化的dna序列也可被包括在载体中。
优选地,在本发明中,该编码序列在天然的外显子-外显子连接点处被分为第一和第二片段或部分(5'端部分和3'端部分)。优选地,编码序列的各片段或部分的大小应不超过60kb,优选编码序列的各片段或部分的大小应不超过50kb、40kb、30kb、20kb、10kb。优选地,编码序列的各片段或部分的大小为约2kb、2.5kb、3kb、3.5kb、4kb、4.5kb、5kb、5.5kb、6kb、6.5kb、7kb、7.5kb、8kb、8.5kb、9kb、9.5kb或更小尺寸。
剪接体内含子通常位于真核细胞的蛋白质编码基因的序列内。在内含子内,需要供体位点(内含子的5'端)、分支位点(靠近内含子的3'端)和受体位点(内含子的3'端)来进行剪接。该剪接供体位点在较大、较不高度保守的区域内的位于内含子5'端处包含几乎不变的序列gu。内含子3'端的剪接受体位点以几乎不变的ag序列终止该内含子。在ag的上游(5'方向),存在富嘧啶(c和u)区域或多聚嘧啶序列。在该多聚嘧啶序列的上游是分支点,其包含腺嘌呤核苷酸。剪接受体信号和剪接供体信号还可由本领域技术人员在已知的序列中选择。
介导蛋白质降解且在之前尚未被用于多重病毒系统的信号包括但不限于:短降解决定子,如cl1、cl2、cl6、cl9、cl10、cl11、cl12、cl15、cl16、sl17,c末端失稳肽,其与错误折叠的蛋白质共有结构相似性,因此被泛素化系统识别,泛素,其在供体蛋白质的n末端的融合介导直接蛋白质降解或通过n端规则途径的降解,n末端pb29降解决定子,其是9个氨基酸长的肽,其类似于cl1降解决定子,预期在被泛素化途径的酶识别的结构中折叠,人工终止密码子,其造成mrna,微小rna(mir)靶序列的早期终止。
本领域技术人员可容易地理解,除了可通过实验室技术人员人工生成的那些变体以外,可以存在天然存在的蛋白质的多种变体序列。本发明的多核苷酸和多肽涵盖本文中具体示例的那些,以及其任何天然变体,以及可经人工生成任何变体,只要那些变体保留所需的功能活性即可。本发明范围内还涵盖这样的多肽,其与本文中示例的多肽具有相同氨基酸序列,不同之处在于该多肽的序列中存在氨基酸取代、添加或缺失,只要这些变体多肽基本保留与本文中具体示例的多肽相同的相关功能活性即可。例如,多肽中不影响该多肽功能的保守氨基酸取代将落在本发明范围内。因此,应理解,本文所述的多肽包括具体示例的序列的变体和片段,如上所述。本发明还包括编码本文所述的多肽的核苷酸序列。这些核苷酸序列可由了解本文所述的蛋白质和氨基酸序列的本领域技术人员容易地构建。本领域技术人员应理解,遗传学密码的简并使技术人员能够构建编码具体多肽或蛋白质的多种核苷酸序列。对于具体核苷酸序列的选择可能取决于,例如,具体表达系统或宿主细胞的密码子使用。具有与主题多肽中具体示例的那些不同的氨基酸取代的多肽也设想在本发明范围内。例如,本发明的多肽的氨基酸可用非天然氨基酸取代,只要该具有取代的氨基酸的多肽基本保留与其中氨基酸尚未被取代的多肽相同的活性即可。非天然氨基酸的示例包括但不限于,鸟氨酸、瓜氨酸、羟脯氨酸、高丝氨酸、苯基甘氨酸、牛磺酸、碘化酪氨酸、2,4-二氨基丁酸、a-氨基异丁酸、4-氨基丁酸、2-氨基丁酸、γ-氨基丁酸、ε-氨基己酸、6-氨基己酸、2-氨基异丁酸、3-氨基丙酸、正亮氨酸、戊氨酸、肌氨酸、高瓜氨酸、磺丙氨酸、τ-丁基甘氨酸、τ-丁基丙氨酸、苯基甘氨酸、环己基丙氨酸、β-丙氨酸、氟-氨基酸、设计氨基酸例如β-甲基氨基酸、c-甲基氨基酸、n-甲基氨基酸,和一般的氨基酸类似物。非天然氨基酸还包括具有衍生的侧基的氨基酸。此外,所述蛋白质中的任何氨基酸均可以是d(右旋)形式或l(左旋)形式。氨基酸可一般地分为如下几类:非极性、不带电极性、碱性和酸性。保守取代(其中多肽的一种类别的氨基酸被相同类别的另一种氨基酸取代)落在本发明范围内,只要具有所述取代的所述多肽仍基本保留与不具有所述取代的多肽相同的生物学活性即可。表1提供属于各类别的氨基酸的示例。
本发明范围内还涵盖这样的多核苷酸,其与本文示例的多核苷酸有相同的核苷酸序列,不同之处在于所述多核苷酸的序列中具有核苷酸取代、添加或缺失,只要这些变体多核苷酸基本保留与本文中示例的多核苷酸相同的相关功能活性(例如,它们编码与所述示例的多核苷酸所编码的物质具有相同的氨基酸序列或相同功能活性的蛋白质)即可。因此,应理解,本文所述的多核苷酸包括具体示例的序列的变体和片段,如上所述。
本发明还设想这样的多核苷酸分子,它们具有与本发明的多核苷酸序列充分同源的序列,从而允许在标准严谨条件下采用标准方法与该序列杂交(maniatis,t.等,1982)。本文所述的多核苷酸还可以与本文中示例的那些的更具体的相同性和/或相似性范围限定。序列相同性通常将大于60%、优选大于75%、更优选大于80%、甚至更优选大于90%,并且可大于95%。序列的相同性和/或相似性可以是与本文示例的序列相比49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98,或99%或更大的相同性和/或相似性。除非另有说明,本文中所用的两种序列的序列相同性和/或相似性的百分比可以采用由karlin和altschul(1993)修改的karlin和altschul的算法(1990)来确定。所述算法整合在altschul等的nblast和xblast程序(1990)中。blast检索采用nblast程序进行,评分=100,字长=12,以获得具有所需序列相同性百分比的序列。为获得缺口算法以供比较目的,可按altschul等.(1997)的描述使用缺口blast。利用blast和缺口blast程序时,可使用各程序(如nblast和xblast)的默认参数。参见ncbi/n1h网站。
本发明还涉及药物组合物,其包含本发明的载体系统或病毒载体系统或宿主细胞,任选地,与药学上可接受的运载体、稀释剂、赋形剂或佐剂的组合。药用运载体、赋形剂或稀释剂的选择可基于指定的给药途径和标准药学实践。除运载体、赋形剂或稀释剂外,该药物组合物还可包含任何合适的粘合剂、润滑剂、助悬剂、包衣剂、增溶剂和辅助或提高病毒进入靶位点的其他运载体试剂(例如脂质递送系统)。所述构建体或载体可体内或离体给予。
适用于局部或胃肠外给予的包含一定量的化合物的药物组合物构成本发明的优选实施方式。对于胃肠外给药,这些组合物最好是无菌水溶液形式,可包含其他物质如足量的盐或单糖以使溶液与血液等渗。本发明的药物组合物可优选通过视网膜下注射被递送至视网膜,或其还可制备为可注射悬液、眼用洗剂或眼科油膏形式,它们可采用非侵入性方式被递送至视网膜。
在本发明内容中,给予患者(具体是人)的剂量应足以在合理时间范围内在该患者中实现治疗响应,同时不造成致命毒性,并且优选造成不超过可接受水平的副作用或发病率。本领域技术人员应理解,剂量将取决于多种因素,包括对象的状况(健康)、对象体重、并行治疗的种类(若存在)、治疗频率、治疗比例,以及病理状态的严重性和阶段。
本发明的方法可用于人和其它动物。本文所用的术语"患者"和"对象"可互换使用,并且意在包括例如人和非人物种。同样地,本发明的体外方法可在所述人和非人物种的细胞上进行。
本发明还涉及试剂盒,其包含一个或多个容器中的本发明的构建体系统或病毒载体系统或宿主细胞。本发明的试剂盒可任选地包括药学上可接受的运载体和/或稀释剂。在一个实施方式中,本发明的试剂盒包括一种或多种其它组分、附属物或佐剂,本文所述。在一个实施方式中,本发明的试剂盒包括说明书或包装材料,其描述如何给予所述试剂盒的载体系统。所述试剂盒的容器可由任何合适的材料制成,例如,玻璃、塑料、金属等,且具有任何合适的尺寸、形状或构型。在一个实施方式中,在所述试剂盒中提供固体形式的本发明的构建体系统或病毒载体系统或宿主细胞。在另一个实施方式中,在所述试剂盒中提供液体或溶液形式的本发明的构建体系统或病毒载体系统或宿主细胞。在一个实施方式中,所述试剂盒包含安瓿或注射器,其含有液体或溶液形式的本发明的构建体系统或病毒载体系统或宿主细胞。
本发明还提供了一种通过基因治疗来治疗个体的药物组合物,该组合物包含治疗有效量的本发明的载体系统或病毒载体系统或宿主细胞,其包含一种或多种可递送的治疗性和/或诊断性转基因或由所述转基因生成或获得的病毒颗粒。该药物组合物可用于人或动物用途。通常,普通技术临床医师都可确定对单个患者而言最适用的实际剂量且其会根据特定个体的年龄、体重和反应以及给予途径而变化。对于人,各载体的1x10e10~1x10e15基因组拷贝/kg,优选各载体的1x10e11~1x10e13基因组拷贝/kg的剂量范围预期将是有效的。各载体的1x10e10~1x10e15基因组拷贝/眼的剂量范围,优选1x10e10~1x10e13,预期将有效于眼部给予。
待给予的剂量方案和有效量可通过普通技术临床医师来确定。给予可以是单一剂量或多重剂量的形式。进行采用多核苷酸、表达构建体和载体的基因治疗的一般方法是本领域已知的(参见例如,基因治疗:原理与应用(genetherapy:principlesandapplications),springerverlag1999;和美国专利号6,461,606;6,204,251和6,106,826)。本发明还涉及用于在细胞中表达选择的多肽的方法。在一个实施方式中,所述方法包括:将包含编码选择的多肽的多核苷酸序列的本发明的载体系统引入所述细胞,和,在所述细胞中表达所述多核苷酸序列。所述选择的多肽对于所述细胞可以是异源性的。在一个实施方式中,所述细胞是哺乳动物细胞。在一个实施方式中,所述细胞是人细胞。在一个实施方式中,所述细胞是光感受器细胞或rpe细胞。所述细胞还可以是肌肉细胞,具体地,骨骼肌细胞,肺细胞,胰腺细胞,肝细胞,肾细胞,肠细胞,血液细胞。在一个特定实施方式中,所述细胞是视椎细胞或视杆细胞。在具体实施方式中,所述细胞是人视锥细胞或视杆细胞。
序列表
ap1(seqidno.24)
ap2(seqidno.25)
akseqa(seqidno.22)
akseqb(seqidno.23)
ap(seqidno.26)
左itr2(seqidno.29)
右itr2(seqidno.30)
左itr5(seqidno.31)
右itr5(seqidno.32)
cmv
cmv增强子(seqidno.33)
cmv启动子(seqidno.34)
嵌合内含子(sv40内含子)(seqidno.35)
hgrk1启动子(seqidno.36)
cba杂合启动子
cmv增强子(seqidno.37)
cba启动子(seqidno.38)
irbp(seqidno.39)
剪接供体信号(seqidno.27)
mir-let7b降解信号(seqidno.40)
4xmir-let7b降解信号(seqidno.41)
mir-26a降解信号(seqidno.13)
4xmir-26a降解信号(seqidno.18)
mir-204降解信号(seqidno.11)
mir-124降解信号(seqidno.12)
3xmir-204+3xmir-124降解信号(seqidno.17)
cl1降解信号(降解决定子)
核苷酸序列:(seqidno.16)
氨基酸序列:(seqidno.1)
cl2降解信号(降解决定子)
核苷酸序列:(seqidno.42)
氨基酸序列:(seqidno.2)
cl6降解信号(降解决定子)
核苷酸序列:(seqidno.43)
氨基酸序列:(seqidno.3)
cl9降解信号(降解决定子)
核苷酸序列:(seqidno.44)
氨基酸序列:(seqidno.4)
cl10降解信号(降解决定子)
核苷酸序列:(seqidno.45)
氨基酸序列:(seqidno.5)
cl11降解信号(降解决定子)
核苷酸序列:(seqidno.46)
氨基酸序列:(seqidno.6)
cl12降解信号(降解决定子)
核苷酸序列:(seqidno.47)
氨基酸序列:(seqidno.7)
cl15降解信号(降解决定子)
核苷酸序列:(seqidno.48)
氨基酸序列:(seqidno.8)
cl16降解信号(降解决定子)
核苷酸序列:(seqidno.49)
氨基酸序列:(seqidno.9)
sl17降解信号(降解决定子)
核苷酸序列:(seqidno.50)
氨基酸序列:(seqidno.10)
pb29降解信号(降解决定子)
核苷酸序列:(seqidno.19)
氨基酸序列:(seqidno.15)
短pb29降解信号(降解决定子)
核苷酸序列:(seqidno.20)
氨基酸序列:(seqidno.14)
3xpb29降解信号(降解决定子)(seqidno.21)
人工终止密码子(seqidno.51)
剪接受体信号(seqidno.28)
sv40多聚a(seqidno.52)
abca45’(seqidno.53)
hgrk1-5’abca4+ak+cl1全长序列(seqidno.54)
注释:
itr:大写字母粗体
hgrk启动子:小写字母粗体斜体
abca45':小写字母下划线
sds:小写字母粗体
ak:大写字母
cl1:小写字母斜体下划线
abca4_3'(seqidno.55)
abca43'+ak_sv40全长序列(seqidno.56)
注释:
itr:大写字母粗体下划线
ak:大写字母
sas:小写字母粗体
abca43':小写字母下划线
sv40多聚a:小写字母粗体斜体
cmv5'abca4-sd-ak全长序列(seqidno.57)
ak-sa-3'abca4-3xflag-sv40全长序列(seqidno.58).
cmv5'abca4-sd-ap1全长序列(seqidno.59)
ap1-sa-3'abca4-3xflag-sv40全长序列(seqidno.60)
cmv5'abca4-sd-ap2全长序列(seqidno.61)
ap2-sa-3'abca4-3xflag-sv40全长序列(seqidno.62)
cmv5'abca4-sd-ap全长序列(seqidno.63)
ap-sa-3'abca4-3xflag-sv40全长序列(seqidno.64)
hgrk15'abca4-sd-ap1全长序列(seqidno.65)
grk15'abca4-sd-ap2全长序列(seqidno.66)
itr5-cmv5'abca4-sd-ak-itr2全长序列(seqidno.67)
itr2-ak-sa-3'abca4-sv40-itr5全长序列(seqidno.68)
itr5-cba5'myo7a-sd-ak-itr2全长序列(seqidno.69)
itr2-ak-sa-3'myo7a-ha-bgh-itr5全长序列(seqidno.70)
cmv5'abca4-3xflag-sd-ak-4xmir26a全长序列(seqidno.71)
cmv5'abca4-3xflag-sd-ak-3xmir204+3xmir124全长序列(seqidno.72)
cmv5'abca4-3xflag-sd-ak-cl1全长序列(seqidno.73)
ak-stop-sa-3'abca4-3xflag-sv40全长序列(seqidno.74)
ak-pb29-sa-3'abca4-3xflag-sv40全长序列(seqidno.75)
ak-3xpb29-sa-3'abca4-3xflag-sv40全长序列(seqidno.76)
ak-泛素-sa-3'abca4-3xflag-sv40全长序列(seqidno.77).
通过参考下图非限制性实施例阐述本发明。
图1.本发明实施例的多重-载体策略的示意图。itr:反向末端重复;prom:启动子;cds,编码序列;sd,剪接供体信号;rr:重组引发性区域,ak或来自碱性磷酸酶(ap1、ap2和ap);degsig;降解信号(参见表2);sa,剪接受体信号;pa,聚腺苷酸化信号。a和c:(二元或三元)杂合载体策略,包括反式剪接和重组引发性区域,根据本发明的优选实施方式,b和d:(二元或三元)载体重叠载体策略。对于其它实施例,参见图12-14。
图2.采用同源的ak、ap1和ap2区域的高效abca4蛋白表达
(a、c):(a)用二元aav2/2(aav血清型2,具有来自aav2的同源itr)载体感染的hek293细胞(50微克/泳道),或(c)用二元aav2/8(aav血清型8,具有来自aav2的同源itr)载体(编码abca4)注射的c57bl/6视网膜(全视网膜裂解物)的代表性的western印迹分析。箭头指示全长蛋白质,分子量梯标描述于左侧。(b)来自(a)中的western印迹分析的abca4蛋白条带的定量。用(a)中的abca4条带的强度除以细丝蛋白a条带的强度。这些柱形图显示相对于二元aav杂合ak载体的百分比形式的蛋白质表达,平均值显示在相应柱上方。值表示为:平均值±s.e.m(该平均值的标准误)。*panova<0.05;星号指示与ak、ap1和ap2的显著差异。(a-c)ak:用二元aav杂合ak载体感染的细胞或注射的眼;ap1:用二元aav杂合ap1载体感染的细胞或注射的眼;ap2:用二元aav杂合ap2载体感染的细胞或注射的眼;ap:用二元aav杂合ap载体感染的细胞;neg:用3'半部载体或egfp表达载体(作为阴性对照)感染的细胞或注射的眼。α-3xflag:采用抗3xflag抗体的western印迹;α-细丝蛋白a,用于抗细丝蛋白a抗体的western印迹,用作上样对照;α-dysferlin,采用抗dysferlin抗体的western印迹,用作上样对照。
图3.采用异源性itr2和itr5的载体的基因组和转导功效。
(a)从采用同源(2:2)或异源性(5:2或2:5)itr的、5′-和3′-abca4半部载体的,和采用同源itr2的对照aav制备物(ctrl)的3×1010gc提取的dna的碱性southern印迹分析。各基因组的预期尺寸描述在各泳道下方。分子量标志物(kb)描述于左侧,5′:5′半部载体;3′:3′半部载体。(b–d)被采用异源性itr2和itr5或同源itr2的二元aav2/2杂合abca4载体感染的hek293细胞的代表性的western印迹分析和定量,以m.o.i.计,基于itr2(b和c)或转基因(b和d)效价。western印迹图像(b)是n=3独立实验的代表;定量(c和d)来自n=3个独立实验。(b)上方箭头指示全长abca4蛋白,下方箭头指示截短蛋白;分子量梯标描述于左侧。上样的蛋白质微克数示于图像下方。α-3×flag:采用抗3×flag抗体的western印迹;α-细丝蛋白a:采用抗细丝蛋白a抗体(用作上样对照)的western印迹。(c和d)来自以一定剂量的载体(基于itr2(c)或转基因(d)效价)感染的细胞的western印迹分析的全长和截短abca4蛋白条带的定量。柱状图显示全长和截短蛋白条带的强度除以细丝蛋白a条带的强度,或全长蛋白质条带的强度除以对应泳道中截短蛋白条带的强度。被具有编码myo7a的异源性itr2和itr5或同源itr2(e、f)的二元aav2(aav血清型2)杂合载体感染的hek293细胞的代表性的western印迹分析和定量。western印迹图像(e)是代表性的,并且定量(f)来自n=3个独立实验。(e)上方箭头指示全长蛋白质,下方箭头指示截短蛋白,分子量梯标描述于左侧。上样的蛋白质微克量描述于图像下方。(f)来自western印迹分析的myo7a蛋白质条带的定量。
平均值描述于相应柱上方。值表示为:平均值±s.e.m。*p斯氏t检验≤0.05。
2:22:2:用具有来自aav2的同源itr的二元aav杂合载体感染的细胞;5:22:5:用具有来自aav2和aav5的异源性itr的二元aav杂合载体感染的细胞;neg:用egfp-表达载体感染的细胞,作为阴性对照。
图4.mir靶位点在5'半部载体中的纳入不导致截短蛋白产物的显著减少。
用二元aav2/2(aav血清型2)杂合载体感染的hek293细胞的代表性的western印迹分析,所述载体编码abca4,包含供于mir-let7b(左图)、mir-204+124(中图)或mir-26a(右图)的mir靶位点。上方箭头指示全长abca4蛋白,下方箭头指示截短蛋白;分子量梯标描述于左侧。上样的蛋白质微克量描述于图像下方。5'+3':不含mir靶位点的5'半部载体和3'半部载体共同感染的细胞;5'+3'+序列打乱(scramble):用无mir靶位点的5'半部载体和3'半部载体在序列打乱的mir模拟物的存在下共同感染的细胞;5'mir+3':用包含mir靶位点的5'半部载体和3'半部载体共同感染的细胞;5'mir+3'+序列打乱:用包含mir靶位点的5'半部载体和3'半部载体在序列打乱的mir模拟物的存在下共同感染的细胞;5'mir+3'+模拟物let7b:用包含mir靶位点的5'半部载体和3'半部载体在mir-let7b模拟物的存在下共同感染的细胞;5':用无mir靶位点的5'半部载体感染的细胞;5'mir:用包含mir靶位点的5'半部载体在序列打乱的mir模拟物的存在下感染的细胞;5'mir+模拟物let7b:用包含mir靶位点的5'半部载体在mir-let7b模拟物的存在下感染的细胞;neg:用3'半部载体或egfp-表达载体感染的对照细胞;5'mir+3'+模拟物204+124:用包含mir靶位点的5'半部载体和3'半部载体在mir-204和124模拟物的存在下共同感染的细胞;5'mir+模拟物204+124:用包含mir靶位点的5'半部载体在mir-204和124模拟物的存在下感染的细胞;5'mir+3'+模拟物26a:用包含mir靶位点的5'半部载体和3'半部载体在mir-26a模拟物的存在下共同感染的细胞;5'mir+模拟物26a:用包含mir靶位点的5'半部载体在mir-26a模拟物的存在下感染的细胞。α-3xflag:采用抗3xflag抗体的western印迹;α-细丝蛋白a,采用抗细丝蛋白a抗体的western印迹,用作上样对照。
序列打乱的序列对应于不同的mirna的序列,例如在采用mir-let7b模拟物的实验中,序列打乱的序列是mir26a的序列。
图5.cl1降解信号在5'半部载体中的纳入导致截短蛋白产物的显著减少
代表性的western印迹分析(a)用二元aav2/2(aav血清型2,具有来自aav2的同源itr)杂合载体感染的hek293细胞,或(b)用二元aav2/8(aav血清型8,具有来自aav2的同源itr)杂合载体(编码abca4,并且含有或不含cl1降解信号)注射后一个月的猪眼(rpe+视网膜)。上方箭头指示全长abca4蛋白,下方箭头指示来自5'半部载体的截短蛋白;分子量梯标描述于左侧。上样的蛋白质微克量描述于各图像下方。5'+3':用不含cl1的5'半部载体和3'半部载体共同感染的细胞或共同注射的眼;5'-cl1+3':用包含cl1的5'半部载体和3'半部载体共同感染的细胞或共同注射的眼;5':用不含cl1的5'半部载体感染的细胞;5'-cl1:用包含cl1的5'半部载体感染的细胞;neg:用3'半部载体或egfp表达载体(作为阴性对照)感染的对照细胞或注射的对照眼;α-3xflag:采用抗3xflag抗体的western印迹;α-细丝蛋白a:采用抗细丝蛋白a抗体的western印迹,用作上样对照;α-dysferlin:采用抗dysferlin抗体的western印迹,用作上样对照。(a)western印迹图像是n=3个独立实验的代表性图像。(b)western印迹图像是n=5个眼(用5'+3'载体注射),n=2个眼(用5'-cl1+3'载体注射)和n=5个眼(用3'半部载体或egfp表达载体作为阴性对照注射)的代表性图像。
图6.降解信号在3'半部载体中的纳入导致截短蛋白产物的小幅减少
用二元aav2/2杂合载体感染的hek293细胞代表性的western印迹分析,所述载体编码abca4且含有不同的降解信号。上方箭头指示全长abca4蛋白,下方箭头指示截短蛋白产物;分子量梯标描述于左侧。上样的蛋白质微克量描述于各图像下方。5'+3':用无降解信号的5'半部载体和3'半部载体共同感染的细胞;5':用5'半部载体感染的细胞;3'(无标记):用无降解信号的3'半部载体感染的细胞;终止:用含有终止密码子的3'半部载体感染的细胞;pb29:用包含pb29降解信号的3'半部载体感染的细胞;3xpb29:用包含3个串联拷贝的pb29降解信号的3'半部载体感染的细胞;泛素:用包含泛素降解信号的3'半部载体感染的细胞。α-3xflag:采用抗3xflag抗体的western印迹;α-细丝蛋白a:采用抗细丝蛋白a抗体的western印迹,用作上样对照。
图7:本发明的优选实施方式所用的同源的源自alpp(胎盘碱性磷酸酶)的ap、ap1和ap2区域的示意图。cds:编码序列
图8:改进的二元aav载体的视网膜下递送导致小鼠光感受器中的abca4表达和abca4-/-小鼠视网膜中的脂褐质累积的显著减少。(a)采用二元aav2/8杂合abca4载体(5'+3')或采用阴性对照(neg)注射的c57bl/6视网膜(全视网膜裂解物)的代表性的western印迹分析。箭头指示全长蛋白质,分子量梯标描述于左侧。α-3×flag:采用抗3×flag抗体的western印迹;α-dysferlin:采用抗dysferlin抗体的western印迹,用作上样对照。(b和c)未注射或注射了aav(作为对照(abca4+/-))的色素化abca4+/-小鼠或未注射(abca4-/-)或注射了双重aav杂合abca4载体(abca4-/-aav5′+3′)的色素化abca4-/-小鼠的视网膜(rpe或rpe+os)中的脂褐质自发荧光(红色信号)的代表性图片(b)和定量(c)。(b)比例尺(75μm)如图所示。rpe:视网膜色素上皮;onl:外核层;inl:内核层;gcl:神经节细胞层。箭头指示脂褐质信号。(c)各样品的三个切片的颞侧中的平均脂褐质自发荧光。各切片中的平均自发荧光针对潜在rpe的长度进行标准化。平均值描述于相应柱上方。值表示为平均值±s.e.m。***panova<0.0001。各组n=4个眼。(d)在至少40个视场(25μm2)/未注射(abca4+/+未注射)或注射pbs(abca4+/+pbs)的白化abca4+/+小鼠和注射pbs(abca4-/-pbs)或二元aav杂合abca4载体(abca4-/-aav5′+3′)的白化abca4-/-小鼠的视网膜中计数的rpe脂褐质颗粒的平均数。平均值描述于相应柱上方。值表示为平均值±s.e.m。*panova≤0.05;**panova≤0.01。n=4个眼,来自abca4+/+未注射;n=4个眼,来自abca4+/+pbs;n=3个眼,来自abca4-/-pbs;n=3个眼,来自abca4-/-aav5′+3′。
图9:阴性对照或改进的二元aav处理的小鼠和猪的眼的类似电活动。(a)二元aav杂合abca4载体(aav5'+3')或阴性对照(即阴性对照aav载体或pbs;neg)注射后1个月的c57bl/6小鼠的平均a-波(左图)和b-波(右图)振幅。数据表示为平均值±s.e.m.;n指示分析的眼的数量。
(b)二元aav杂合abca4载体(aav5′+3′)或pbs注射后1个月的猪中的暗视、最大响应、明视和闪烁erg测试中的平均b-波幅(μv)。n=5个用二元aav杂合abca4载体注射的眼;n=4个用pbs注射的眼;*:n=2。
图10:来自猪视杆和视锥光感受器中的irbp和grk1启动子的egfp蛋白质表达。三月龄的大白猪视网膜下注射1x1011gc/眼的各aav2/8-irbp-或aav2/8-grk1-egfp载体。视网膜冷冻切片在注射后4周获得并采用荧光显微镜分析egfp。(a-b)pr层中的荧光强度的代表性图像(a)和定量(b)。定量各组动物的冷冻切片的荧光强度(六个不同的视场/眼;20x放大倍率)。(c-d)视锥转导功效的代表性图像(c)和定量(d)。评价冷冻切片上的视锥转导功效(六个不同的视场/眼;63x放大倍率),所述冷冻切片用抗lumif-hcar抗体免疫染色,并且表达为各视场中的视锥(car+)的总数上表达egfp(egfp+/car+)的视锥的数量。(a、c)比例尺如图所示。(b-d)n=3个眼(用aav2/8-irbp-egfp载体注射);n=3个眼(用aav2/8-grk1-egfp载体注射)。值表示为平均值±s.e.m.。采用斯氏t检验发现无显著差异。os:外节;onl:外核层;egfp:原始egfp荧光;car:抗视锥抑制蛋白染色;dapi:4',6'-双脒-2-苯基吲哚染色。箭头指向转导的视锥。
图11:改进的二元aav载体的视网膜下递送导致abca4-/-小鼠视网膜中的脂褐质累积的显著减少。视网膜横截面的颞(注射)侧的图像的拼集显示未注射或注射aav作为对照(abca4+/-)的色素化abca4+/-小鼠或未注射(abca4-/-)或注射二元aav杂合abca4载体(abca4-/-aav5'+3')的色素化abca4-/-小鼠的视网膜(rpe或rpe+os)中的脂褐质自发荧光(红色信号)。对于各组,n=4个眼。t:颞侧;n:鼻侧。
图12:阴性对照或改进的二元aav处理的小鼠和猪中的眼的类似电活动。(a)来自二元aav杂合abca4载体(aav5'+3')或阴性对照(即阴性对照aav载体或pbs;neg)注射后一个月的c57bl/6小鼠的代表性的erg痕迹。(b)来自二元aav杂合abca4载体(aav5'+3')或pbs注射后一个月的猪中的暗视、最大响应、明视和闪烁erg测试的代表性的痕迹。
图13.根据本发明实施例的载体系统策略的示意图。(a)根据本发明的优选实施方式,由两种载体组成的载体系统的示意图:第一载体包含编码序列的第一部分(cds1部分),第二载体包含编码序列的第二部分(cds2部分)。(a1)载体系统的重建序列在于所述编码序列部分的重叠末端。(a2),第一和第二载体的重建序列分别在于剪接供体和剪接受体序列。(a3)各重建序列包含剪接供体/受体,如在a2中排列,并且其还包含重组引发性区域。降解信号包含于至少一个载体中。该图显示根据本发明的优选非限制性实施方式,对于各载体,所述载体系统的一个或多个降解信号的所有可能的位置。
(b)根据本发明的优选实施方式,由三种载体组成的载体系统的示意图:第一载体包含编码序列的第一部分(cds1部分)、第二载体包含编码序列的第二部分(cds2部分),且第三载体包含编码序列的第三部分(cds3部分)。(b1)所述载体系统的重建序列在于编码序列部分的重叠末端(cds1的3'端与cds2的5'端重叠;cds2的3'端与cds3的5'端重叠)。(b2)第一载体的重建序列在于剪接供体,第一载体的重建序列在于剪接供体;第二载体在cds2的5'端包含第一重建序列,且第二重建序列位于cds2的3'端,第一重建序列是剪接受体且第二是剪接供体;第三载体的重建序列在于剪接受体。(b3)各重建序列包含剪接供体/受体,如在b2中排列,并且还包含重组引发性区域。降解信号包含于至少一个载体中。该图显示根据本发明的优选非限制性实施方式,对于各载体,所述载体系统的一个或多个降解信号的所有可能的位置。
cds,编码序列;sd,剪接供体信号;rr:重组引发性区域;degsig;降解信号(参见表2);sa,剪接受体信号。
图14.用于大基因转导的现有技术基于多重载体的策略的示意图。cds:编码序列;pa:聚腺苷酸化信号;sd:剪接供体信号;sa:剪接受体信号;ap:碱性磷酸酶重组引发性区域;ak:f1噬菌体重组引发性区域。虚线(dottedline)显示sd和sa之间发生的剪接,点线(pointedline)显示可用于同源重组的重叠区域。正常尺寸和超大型aav载体质粒含有全长表达盒,其包含启动子、全长转基因cds和聚腺苷酰化信号(pa)。生成二元aav载体所需的两个单独的aav载体质粒(5'和3')含有启动子以及之后的转基因cds的n端部分(5'质粒)或转基因cds的c端部分以及之后的pa信号(3'质粒)。
具体实施方式
材料和方法
质粒的生成
用于aav载体生成的质粒全部源自二元杂合ak载体质粒,其编码人abca4、人myo7a或egfp报告蛋白(包含aav血清型2的反向末端重复(itr))14。
编码abca4的载体质粒中包含的ak重组引发性序列14用源自碱性磷酸酶基因的三种不同的重组引发性序列替代:ap(nm_001632,bp823-1100,14);ap1(xm_005246439.2,bp1802-151620);ap2(xm_005246439.2,bp1225-93820)。
以5:2-2:5构型携载来自aav血清型2(itr2)的异源性itr和来自aav血清型5(itr5)的itr的二元aav载体质粒通过如下方式产生:将5'半部载体质粒中的左itr2和3'半部载体质粒中的右itr2分别用itr5(nc_006152.1,bp1-175)替代。以2:5或5:2构型携载异源性itr2和itr5的二元aav载体质粒通过如下方式产生:将右或左itr2分别用itr5替代。包含rep5(nc_006152.1,bp171-2206)和aav2cap(af043303bp2203-2208)基因(rep5cap2)的paav5/2包装质粒从包含rep(af043303bp321-1993)和来自aav2(rep2cap2)的cap(af043303bp2203-2208)基因的paav2/2包装质粒,通过将rep2基因用来自aav5(nc_006152.1,bp171-2206)的rep5开放阅读框替代来获得。
包含具有itr5的egfp表达盒的pzac5:5-cmv-egfp质粒由包含侧接egfp表达盒的itr2的paav2.1-cmv-egfp质粒45获得。
降解信号如下克隆在编码abca4的二元aav杂合ak载体中:在ak序列和右itr2之间的5'半部载体质粒中;在ak序列和剪接受体信号之间的3'半部载体质粒中。降解信号序列的详细信息可见于表2。
表2.该研究中所用的降解信号
下划线序列对应于降解信号;对于包括重复序列的降解信号,显示不带下划线的核苷酸,其已包括在重复序列之间以用于克隆目的。
从二元aav载体表达的abca4蛋白在n-(氨基酸位置590)和c末端带有3xflag标签,用于图3和4和图6中所示的实验,并且在c末端单独带标签,用于图2和8a中所示的实验。
在该研究中所用的编码abca4的二元aav杂合载体组包括遍在cmv46或pr-特异性人g蛋白质-偶联的受体激酶1(grk1)47启动子,而编码myo7a的二元aav杂合载体包括遍在cb启动子39。
aav载体生成和表征
aav载体大型制备物由tigemaav载体中心,通过三元转染hek293细胞随后进行两轮cscl2纯化生成。携载同源itr2的aav载体如前所述48获得。
为获得携载异源性itr2和itr5的aav载体,1.1x109低传代hek293细胞的悬液,通过磷酸钙法,采用500μg的pdeltaf6辅助质粒(其包含ad辅助基因49)、260μg的paav顺式质粒和不同的量的rep2cap2和rep5包装构建体,四倍转染。rep2cap2和rep5包装构建体的量如下:
(i)方案a:130μg的各rep5和rep2cap2(比例1:1)
(ii)方案b:90μg的rep5和260μg的rep2cap2(比例1:3)
(iii)方案c:26μg的rep5和260μg的rep2cap2(比例1:10)
然后,各aav制备物根据公开的方案48纯化。
采用下文所述的方案进行rep竞争实验:
1-为评估rep5与rep2竞争生成具有itr2的aav载体,hek293细胞,通过磷酸钙法,采用pdeltaf6、paav2.1-cmv-egfpcis、rep2cap2和rep5cap2构建体以重量比2:1:1.5:1.5四倍转染,或者,作为对照,用pdeltaf6、paav2.1-cmv-egfp、rep2cap2包装构建体和对照不相关质粒以重量比2:1:1.5:1.5四倍转染;
2-为评估rep2与rep5竞争生成具有itr5的aav载体,hek293细胞,通过磷酸钙法,采用pdeltaf6、pzac5:5-cmv-egfp、rep5cap2和rep2cap2构建体以重量比2:1:1.5:1.5四倍转染,或者,作为对照,用pdeltaf6、pzac5:5-cmv-egfp、rep5构建体和对照不相关质粒以重量比2:1:1.5:1.5四倍转染。
对于大规模aav载体制备物,物理效价[基因组拷贝(gc)/ml]通过如下方式确定,将通过采用taqman(应用生物系统公司(appliedbiosystems),美国加利福尼亚州卡尔斯巴德)48采用在itr2上退火的探针的pcr定量获得的效价和通过圆点印迹法分析50采用在itr2的1kb以内退火的探针获得的效价平均化。对于采用不同的rep5:rep2cap2重量比产生的大规模aav载体制备物,物理效价[基因组拷贝(gc)/ml]采用taqman采用在itr2上退火的探针通过pcr定量确定。对于用于竞争实验的aav载体制备物,物理效价[基因组拷贝(gc)]采用taqman采用在牛生长激素(bgh)聚腺苷酸化信号上退火的探针(包括在aav载体中包装的egfp-表达盒中),通过pcr定量确定。
hek293细胞的aav感染
hek293细胞的aav感染如前所述进行14。携载异源性itr2和itr5并根据方案c产生的aav2载体用于各载体以1x104gc/细胞的感染复数(m.o.i)感染hek293细胞(2x104总gc/细胞,当发明人以1:1比例采用二元aav载体时),计算考虑各病毒制备物实现的最低效价。采用携载重组引发性区域和降解信号的aav2/2感染以各载体5x104gc/细胞的m.o.i进行(在以1:1比例的二元aav载体的情况中,1x105总gc/细胞),计算考虑taqman和圆点印迹法之间的平均效价。
对于采用包含mir靶位点的5'半部载体的实验,细胞在用对应mir模拟物(50nm;miridian微小rna模拟物hsa-let-7b-5p、hsa-mir-204-5p、hsa-mir-124-3p和hsa-mir-26a-5p;dharmacon,美国科罗拉多州拉斐特)感染之前4小时采用磷酸钙法转染。
小鼠和猪中aav载体的视网膜下注射
将小鼠置于遗传学和生物物理学研究所动物房中(意大利那不勒斯),维持于12小时光/暗循环中(光阶段期间10-50勒克司暴露)。c57bl/6小鼠购自哈兰意大利公司(harlanitalysrl)(意大利乌迪内)。色素化abca4-/-小鼠通过白化abca4-/-小鼠14与sv129小鼠的连续杂交产生,并且维持同系交配;在杂合子小鼠与纯合子小鼠之间进行繁殖。白化abca4-/-小鼠通过与balb/c小鼠(rpe65leu450纯合子)连续杂交与回交来产生,并维持同系交配;在杂合子小鼠与纯合子小鼠之间进行繁殖。c57bl/6(5周龄)、色素化abca4-/-(5.5月龄)和白化abca4-/-(2.5-3-月龄)小鼠如前所述麻醉61,然后通过liang等62所述的方法经巩膜经脉络膜方法,将1μl的pbs或aav2/8载体视网膜下递送至视网膜的颞侧。将aav2/5-vmd2-人酪氨酸酶63(剂量:2x108gc/眼)添加至aav2/8载体溶液,该载体溶液被视网膜下递送至白化abca4-/-小鼠(图8d)。这允许我们标记洗眼杯的转导的部分中的rpe,其后续经解剖和分析。
该研究中所用的大白雌猪在意大利国家猪育种者协会(italiannationalpigbreeders’association)的lw良种登记册中登记为纯种。猪在卡达尔里医院动物房(意大利那不勒斯)圈养并保持在12小时明/暗周期(在光照期,10–50勒克斯暴露)下。该研究根据视觉与眼科学研究协会关于眼科与视觉研究中的动物应用的声明(associationforresearchinvisionandophthalmologystatementfortheuseofanimalsinophthalmicandvisionresearch)且采用意大利卫生部关于动物操作的规定来进行。所有的操作均提交至意大利卫生部;公共卫生、动物健康、营养与食品安全安全部。手术在麻醉下进行,并且尽全力使痛苦程度最小化。动物如前所述处死39。如前所述向3月龄猪视网膜下递送aav载体39。所有的眼用100μl的pbs或aav2/8载体溶液处理。aav2/8剂量为各载体1x1011gc/眼,因此,二元aav载体以1:1比例的共同注射导致2x1011gc/眼的总剂量。
对于图2c、5b、8、9、10、11和12中所包括的动物研究,右和左眼随机分配至不同的实验组,并且,操作和定量所述实验的研究人员不知晓动物所经历的处理。
western印迹分析
为了western印迹分析hek293细胞,小鼠和猪视网膜裂解于ripa缓冲液(50mmtris–hclph8.0、150mmnacl、1%np40、0.5%脱氧胆酸钠、1mmedtaph8.0,0.1%sds)。向裂解缓冲液中补充蛋白酶抑制剂(完全蛋白酶抑制剂混合物片,罗氏公司(roche))和1mm苯甲基磺酰氟。裂解后,包含myo7a的细胞的样品在1xlaemli样品缓冲液中于99℃变性5分钟;包含abca4的样品在补充有4m脲的1xlaemli样品缓冲液于37℃变性15分钟。裂解物通过6-7%(分别是abca4和myo7a样品)或8%(图5b中的wb)sds–聚丙烯酰胺凝胶电泳分离。用于免疫-印迹的抗体如下:抗3xflag(1:1000,a8592;西格玛奥德里奇公司(sigma-aldrich));抗myo7a(1:500,多克隆;primmsrl,意大利米兰)采用对应于人myo7a蛋白的氨基酸941–1070的肽产生;抗细丝蛋白a(1:1000,目录号#4762;细胞信号技术公司(cellsignalingtechnology),美国马萨诸塞州丹弗斯);抗dysferlin(1:500,dysferlin,克隆ham1/7b6,monx10795;tebu-bio,leperray-en-yveline,法国)。使用图像j软件(可从http://rsbweb.nih.gov/ij/免费下载)对western印迹检测的abca4和myo7a条带进行定量。对于采用携载异源性itr2和itr5的aav的体外实验,全长abca4和myo7a条带的强度对于对应泳道中截短蛋白产物的结果或对于细丝蛋白a条带的结果进行标准化,而较短abca4和myo7a蛋白条带的强度对于细丝蛋白a条带的结果进行标准化。采用携载降解信号或同源性区域的aav载体获得的abca4条带的强度对于细丝蛋白a条带(体外实验)或dysferlin条带(体内实验)的结果标准化。
western印迹实验的定量已如下进行:
-图2a-b:abca4条带的强度对于对应泳道中的细丝蛋白a条带的结果标准化。然后,标准化的abca4表达表示为相对于二元aav杂合ak载体的百分数;
-图2c:abca4条带的强度(a.u.)计算为相对于以相同水平在各凝胶的阴性对照泳道中检测的平均强度的增加倍数(因为背景信号异常地高,左下图的泳道7中的阴性对照样品的测量结果从分析中排除)。各组的值表示为平均值±平均值的标准误(s.e.m.);
-图3b-d:全长abca4和截短蛋白条带强度除以细丝蛋白a条带的强度或全长abca4蛋白条带的强度除以对应泳道中截短蛋白条带的强度。值表示为:平均值±s.e.m.;
-表5:在用5'-和3'半部载体共同感染的细胞中检测的全长abca4和截短蛋白条带强度。计算在对应模拟物或序列打乱的模拟物的存在下的全长abca4和截短蛋白条带的强度之间的比例。值代表来自三个独立实验的比例的平均值±s.e.m.;
-表6:在用5'-和3'半部载体共同感染的细胞中检测的全长abca4和截短蛋白条带强度。计算来自具有或不具有降解信号的载体的全长abca4和截短条带的强度之间的比例。值代表来自三个独立实验的比例的平均值±s.e.m.。
-图8a:abca4条带的强度(a.u.)计算为相对于在对应凝胶的阴性对照泳道中检测的平均背景强度的增加的倍数。值表示为平均值±s.e.m.。
southern印迹分析
从aav颗粒提取3x1010gc的病毒dna。为消化未包装的基因组,所述载体溶液重悬于240μl的pbsph7.419(gibco;英杰公司(invitrogens.r.l.),意大利米兰),然后用包含40mmtris–hcl、10mmnacl、6mmmgcl2、1mmcacl2的300μl总体积(ph7.9)中的1u/μl的dna酶i(roche)在37℃孵育2小时。然后,dna酶i用50mmedta失活,之后用蛋白酶k和2.5%n-月桂酰-肌氨酸(sarcosil)溶液在50℃孵育45分钟以裂解衣壳。dna用苯酚-氯仿提取两次并用两体积的乙醇100和10%乙酸钠(3m,ph7)沉淀。碱性琼脂糖凝胶电泳和印迹如前所述进行(sambrook和russell,2001《分子克隆》(molecularcloning))。十微升的1kbdna梯标(n3232l;新英格兰生物实验室公司(newenglandbiolabs),美国马萨诸塞州伊普斯威奇)上样作为分子量标志物。两种不同的双链dna片段采用dighighprimedna标记和检测起始试剂盒(罗氏)用异羟基洋地黄毒苷-dutp标记,并用作探针。5′探针(768bp)通过用spei和noti对pzac2.1-cmv-abca4_5′质粒进行双重消化产生;3′探针(974bp)通过用clai和mfei对pzac2.1-abca4_3′_3xflag_sv40质粒进行双重消化产生。预杂交和杂交在church缓冲液(sambrook和russel,2001《分子克隆》(molecularcloning))中于65℃分别进行1小时和过夜。然后,膜(whatmannytrann,带电尼龙膜;西格玛奥德里奇公司,意大利米兰)首先在ssc29-0.1%sds中清洗30分钟,然后在ssc0.59-0.1%sds中于65℃清洗30分钟,然后在ssc0.19-0.1%sds中于37℃清洗30分钟。然后,通过化学发光检测,通过采用digdna标记和检测试剂盒(罗氏)的酶免疫试验分析该膜。
组织学分析
使小鼠安乐死,随后收集其眼球并通过浸没在4%多聚甲醛(pfa)中固定过夜。收获眼球前,通过烧灼标记的巩膜的颞部以在包含时相对于注射位点对眼进行定向。切下眼球,从而移出晶状体和玻璃体同时保持洗眼杯完整。小鼠洗眼杯用30%蔗糖浸润供于冻存,并包埋于组织冷冻介质(o.c.t.基质;kaltek,意大利帕多瓦)中。对于各眼,沿水平面切割150-200个连续切片(10μm厚)并使切片进行性分布在10张载玻片上,使得各载玻片含有15-20个切片,各自代表不同水平的整个眼。这些切片使用4',6'-二眯基-2-苯基吲哚(载体实验室公司(vectorlab),英国彼得堡)染色,并以不同放大倍数使用zeissaxiocam(卡尔蔡司公司(carlzeiss),德国上科亨)监测。
猪经处死,然后收集其眼球,并通过将其浸没在4%pfa中固定过夜。切下眼球,从而移出晶状体和玻璃体,使洗眼杯处于原位。通过渐进地用10%、20%和30%蔗糖浸润洗眼杯,使它们逐渐脱水。进行组织冷冻介质(o.c.t.基质;kaltek)包埋。包埋前,猪洗眼杯用荧光立体显微镜(徕卡微系统公司(leicamicrosystemsgmbh),德国韦茨拉尔)分析以定位给予了egfp-编码载体时的转导的区域。对于各眼,沿着水平子午线切下200–300连续切片(12μm厚),然后使所述切片渐进地分布在载玻片上,从而各载玻片包含6–10个切片。切片染色和图像采集如对于小鼠描述的那样进行。
视锥免疫荧光染色
冷冻的视网膜切片用pbs清洗一次,然后在包含0.1%曲通x-100的pbs中透化1小时。包含10%常规山羊血清(西格玛奥德里奇公司)的封闭溶液处理1小时。一抗[抗人car66,67,其也识别猪car("光源发现者(luminairefounders)”—hcar,1:10,000;由加利福尼亚州洛杉矶多希尼眼科研究所的cherylm.craft博士友情提供)]在pbs中稀释并4℃孵育过夜。二抗(alexafluor594,抗兔,1:1,000;molecularprobes,英杰公司,加利福尼亚州卡尔斯巴德)孵育45分钟。用抗car抗体染色的切片以63x放大倍率采用leicalaser共聚焦显微镜系统(徕卡微系统公司)分析,如前所述64。简言之,对于各眼,采集六个不同的转导的区域的六个不同的z堆栈。对于各z堆栈,来自单一平面的图像用于car+/egfp+细胞计数。在该过程中,发明人小心地沿z轴移动,以将细胞彼此区分开来,因此避免对相同细胞重复计数。对于各视网膜,发明人对总car+细胞计数了car-阳性(car+)/egfp-阳性(egfp+)细胞。然后,发明人计算了各实验组的三个眼的car+/egfp+细胞的平均数。
egfp定量
pr中的荧光强度如前所述以无偏好方式严格且可再现地定量64。单色通道图像采用leica显微镜(徕卡微系统公司)采集。tiff图像用图像分析软件(lasaflite;徕卡微系统公司)灰度处理。各眼的六幅图像以20x放大倍率通过遮罩的观察器进行分析。在各图像中对pr(外核层+os)选择性地示出轮廓,并且采用该图像分析软件以无偏好方式计算封闭区域内的总荧光。然后,从收集自各眼的不同的视网膜切片的六幅图像平均化pr中的荧光。然后,发明人计算了各实验组的三个眼的平均荧光。
脂褐质自发荧光的定量
对于脂褐质荧光分析,眼收集自aav注射后3个月的色素化abca4+/-和abca4-/-小鼠。小鼠适应暗环境过夜并在昏暗的红光下处死。对于各眼,来自眼的不同区域的三个切片的颞侧的四幅重叠图片用配备有tx2滤镜(激发:560±40nm;发射:645±75)71-75的leicadm5000b显微镜在20x物镜下采集。然后,各切片的四幅图像在单一图集中合并用于进一步荧光分析。各切片中的脂褐质荧光的强度(红色信号)采用imagej软件自动计算,然后对荧光区域潜在的rpe的长度标准化。
透射电子显微术
对于电子显微镜分析,眼收集自aav注射后3个月的白化abca4-/-和abca4+/+小鼠。眼在0.1mphem缓冲液ph6.9(240mmpipes、100mmhepes、8mmmgcl2、40mmegta)中的0.2%戊二醛-2%多聚甲醛中固定过夜,然后在0.1mphem缓冲液中漂洗。然后,眼在光学显微镜下解剖,以选择洗眼杯的酪氨酸酶阳性部分。随后将洗眼杯的经转导部分包埋在12%明胶中,使用2.3m蔗糖输注并在液氮中冷冻。使用leicaultramicrotomeemfc7(徕卡微系统公司)切割冷冻切片(50nm)并非常小心地排列纵向衔接纤毛的pr。为了避免不同实验组的形态学数据的属性偏差,脂褐质颗粒的计数通过遮罩的观察器(romanpolishchuk博士)采用item软件(olympussys,德国汉堡)进行。使用item软件的“touchcount”模块来对rpe层上随机分布的25μm2区域(至少40个)中脂褐质颗粒数目进行计数。颗粒密度表示为颗粒数目/25μm2。
视网膜电图记录
小鼠和猪的电生理学记录分别如(68)和(69)中详述进行。
统计学分析
认为p值≤0.05具有统计学显著性。采用事后多重比较检验的单因素anova(r统计学软件)用于比较图2b(panova=1,2x10-6)、2c(panova=0,326)、8c(panova=1,5x10-10)、8d(panova=0,034)和9a(panovaa-波:0,5;panovab-波:0,8)和表6(panova=0,0135)中所示的数据。因为脂褐质颗粒的计数(图8d)表示为离散数字,所以这些通过从负二项泛化的线性模型65的偏差进行分析。采用事后多重比较检验确定的组间统计学显著差异如下:图2b:ap比对ak:1,08x10-5;ap1比对ak:0,05;ap2比对ak:0,17;ap1比对ap:1,8x10-6;ap2比对ap:2,8x10-6;ap2比对ap1:0,82。图8c:abca4+/-未注射比对abca4-/-未注射:0,00;abca4-/-未注射比对abca4-/-aav5'+3':9,3x10-5;abca4+/-未注射比对abca4-/-aav5'+3':4x10-6。图8d:abca4-/-pbs比对abca4-/-aav5'+3':0,01;abca4+/+pbs比对abca4-/-aav5'+3':0,37;abca4+/+未注射比对abca4-/-aav5'+3':0,53;abca4+/+pbs比对abca4-/-pbs:0,05;abca4+/+未注射比对abca4-/-pbs:0,03;abca4+/+未注射比对abca4+/+pbs:0,76。表6:3xstop比对无降解信号:0,97;3xstop比对pb29:1,0;3xstop比对3xpb29:0,15;3xstop比对泛素:0,10;pb29比对无降解信号:1,0;pb29比对3xpb29:0,1;pb29比对泛素:0,07;3xpb29比对无降解信号:0,06;3xpb29比对泛素:1,0;泛素比对无降解信号:0,04。
斯氏t检验用于比较图3c、d和f中所示的数据。
结果
包括ap1、ap2或ak重组引发性区域的二元aav杂合载体显示高效转导
发明人评价了图1和13中所示的数种多重载体策略。
具体地,它们平行地评价具有不同的同源性区域的二元aav杂合载体的转导功效。出于该目的,发明人生成了二元aav2/2杂合载体,其包括abca4-3xflag编码序列,受控于遍在cmv启动子,以及具有同源性的ak14、ap14、ap1或ap220区域(图7)。发明人采用这些载体来感染hek293细胞[感染复数,m.o.i.:各载体,5x104基因组拷贝(gc)/细胞]。细胞裂解物通过采用抗3xflag抗体的western印迹分析以检测abca4-3xflag(图2)。各二元aav杂合载体组导致预期大小的全长蛋白质的表达,其未在采用阴性对照上样的泳道中检测到(图2a)。abca4表达的定量(图2b)显示采用二元aav杂合ap1和ap2载体的感染所导致的转基因表达的水平略高于二元aav杂合ak载体,且完全显著地胜过二元aav杂合ap载体14。发明人先前发现依赖于同源重组的二元aav载体的功效在末端分化的细胞如pr中低于细胞培养物中14。因此,发明人评价了在视网膜下给予包括pr-特异性人g蛋白质-偶联的受体激酶1(grk1)启动子的二元aavak、ap1和ap2载体(各载体的剂量/眼:1.9x109gc;图2c)的c57bl/6小鼠中的pr-特异性转导水平。载体给予后一个月,发明人检测出abca4蛋白表达在用二元aav杂合ak处理的视网膜中的一致性高于ap1或ap2载体(图2c)。
异源性itr在aav载体中的纳入影响了它们的生成产量并且不减少截短蛋白产物的水平
为测试异源性itr的应用是否改善二元aav载体的生产性定向连环化,发明人产生了二元aav2/2杂合ak载体,该载体包括abca4-3xflag或myo7a-ha编码序列,具有异源性itr2和itr5,具有5:2(来自aav5的左itr和来自aav2的右itr)或2:5(来自aav2的左itr和来自aav5的右itr)构型(图1)。携载异源性itr2和itr5的二元aav载体的生成要求来自aav血清型2和5的rep蛋白的同时表达,其无法交叉互补病毒复制23。事实上,已显示rep2和rep5可以可互换地结合至itr2或itr5,尽管不如同源itr高效,然而它们无法切割来自其它血清型的itr的末端解离位点36。因此,在产生具有异源性itr2和itr5的二元aav杂合ak载体之前,发明人评估了(i)rep5与rep2在aav2/2-cmv-egfp载体(即具有同源itr2的载体)的生成中的潜在竞争,和(ii)rep2与rep5在aav5/2-cmv-egfp载体(即具有同源itr5的载体)的生成中的潜在竞争,采用相同量的rep5cap2和rep2cap2包装构建体(比例1:1)。事实上,在除了rep2cap2以外还提供rep5cap2包装构建体的情况下,aav2/2-cmv-egfp载体的总产量减少至仅提供rep2cap2作为包装构建体的情况下所得的对照制备物的结果的42%(各类型的4个独立制备物的平均,p斯氏t检验<0.05)。相反,发现在将rep2cap2添加至rep5cap2的情况下获得的aav5/2-cmv-egfp制备物的总产量中无显著差异,其为在rep5cap2为转染的唯一包装构建体的情况下获得的结果的83%(各类型的4个独立制备物的平均,采用斯氏t检验发现无显著差异)。鉴于在具有itr2的载体的生成中的rep5与rep2的竞争,发明人测试了rep5和rep2cap2包装构建体在具有异源性itr2和itr5的aav中的三个不同的比例(方案a采用1:1、方案b采用1:3,且方案c采用1:10rep5/rep2cap2比例)。如表3中所示,当rep5的量减少时,通过pcr定量采用退火至itr2的探针测定的病毒效价逐步增加,采用方案c获得最佳效价。
表3.aav5:2/2载体在不同的比例的rep5和rep2包装构建体的存在下的产量
id:aav5:2/2载体的数量鉴定;gc:基因组拷贝。
这些结果证实rep5与rep2在具有itr2的载体的生成中的竞争,并且致使我们遵循方案c来生成具有异源性itr2和itr5的aav载体。然而,采用该策略获得的若干aav制备物揭示:(i)对于itr2确定的效价至多6倍更低于对于itr之间的转基因序列确定的效价(表4),这可表明itr2的完整性受损,和(ii)具有异源性itr2和itr5的aav载体的总产量相较于含有同源itr2的那些平均减少约6倍(表4)。
表4.itr2之间的低产量和差异,和具有异源性itr2和itr5的aav2的转基因效价
id:aav载体的编号;gc:基因组拷贝。a值代表平均值±sem。
然而,具有异源性itr的aav制备物的southern印迹分析揭示基因组完整性无明显改变(图3a)。
为测试异源性itr在二元aav杂合ak载体中的纳入是否能增强尾-头生产性多联体的形成和全长蛋白质转导,同时减少截短蛋白的生成,发明人用编码abca4或myo7a、具有异源性itr2和itr5(以5:2/2:5构型)或同源itr2(图3b、3e)的二元aav杂合载体感染hek293细胞。
鉴于itr2之间的差异和具有异源但非同源itr的载体的转基因效价(表4),发明人基于itr2或转基因效价,对各载体用104基因组拷贝(gc)/细胞来感染细胞。基于itr2效价,用二元aav载体感染的hek293细胞的western印迹分析,采用抗3xflag(以检测abca4-3xflag,图3b)或抗myo7a(图3e)抗体,显示异源性itr2和itr5的纳入所导致的全长和截短蛋白的水平高于同源itr2(图3b、c、d、f)。然而,当hek293细胞用基于转基因效价的相同二元aav载体制备物感染时并没有观察到该情况(图3b、d)。总而言之,全长和截短蛋白表达之间的比例类似,无关于载体中所包括的itr(图3c、d、f)和用于给予细胞的载体效价(图3b、c、d)。
5'半部载体中的cl1降解决定子减少截短蛋白产物的生成
为了选择性地减少由二元aav杂合载体14的各5'-和3'半部产生的截短蛋白产物的水平,发明人将推定的降解序列置于5'半部载体中剪接供体信号之后的ak和右itr之间,和3'半部载体中的ak和剪接受体信号之间(图1)。因此,该降解信号将被包括在截短物中但不在全长蛋白中,得到经剪接的mrna。作为5'半部载体中的降解信号,发明人已包括:(i)cl1降解决定子(cl1)、(ii)4个拷贝的mir-let7b靶位点(4xlet7b)、(iii)4个拷贝的mir-26a靶位点(4x26a)或(iv)mir-204和mir-124靶位点各自3个拷贝的组合(3x204+3x124)(表2)。作为3'半部载体中的降解信号,发明人已包括:(i)3终止密码子(stop)、(ii)单一(pb29)或三个串联拷贝(3xpb29)中的pb29,或(iii)泛素(表2)。发明人生成了编码abca4的、包括不同的降解信号的二元aav2/2杂合ak载体,并评价了它们在感染hek293细胞[m.o.i.:各载体,5x104基因组拷贝(gc)/细胞]之后的功效。因为mir-let7b、mir-26a、mir-204和mir-124在hek293细胞中低表达或完全不存在(ambionmirna研究指南和37),为了测试含有这些mir的靶位点的构建体的沉默,发明人用mir模拟物(即化学修饰的小双链rna,其模拟内源性mir38)转染细胞,然后用包含对应靶位点的aav2/2载体进行感染。为了确定实现包含对应mir靶位点的基因的沉默所需的mir模拟物浓度,发明人采用编码报告egfp蛋白质且在聚腺苷酸化信号之前包含mir靶位点的质粒(数据未显示)。相同实验设置用于进一步评价二元aav杂合ak载体情况中的mir靶位点。发明人发现,mir-204+124和26a靶序列在二元aav杂合ak载体的5'半部中的纳入减少了(虽然未消除)截短蛋白产物的表达,但不影响全长蛋白质表达(图4)。不同地,mir-let7b靶位点的纳入未能有效减少截短蛋白表达(图4)。
显然,如图5a中所示,发明人发现,cl1降解信号在5'半部载体中的纳入将截短蛋白表达减少到无法检测的水平,但不影响全长蛋白质表达(图5a)。鉴于介导cl1降解的泛素化途径的酶的组织特异性表达的差异31可能有关于cl1功效的改变,发明人进一步评价了cl1降解决定子在猪视网膜中的功效,其大小和结构类似于人19,30,39,40,因此是用于评价载体安全和功效的优良的临床前大动物模型。为此,发明人在大白猪中视网膜下注射编码abca4的aav2/8二元aav杂合ak载体(其中5'半部载体包括或不包括cl1序列)(各载体的剂量/眼:1x1011gc)。显然,发明人发现,cl1降解信号在5'半部载体中的纳入导致截短蛋白表达的显著减少,低于western印迹分析的检测限,但不影响全长蛋白质表达(图5b)。在3'半部载体中测试的降解信号中,发明人发现终止密码子不影响截短蛋白生成。不同地,pb29(以单一或三个串联拷贝形式)和泛素均全部有效于减少截短蛋白表达。然而,尽管泛素也消除全长蛋白质表达,但pb29对全长蛋白质生成的影响程度较低(图6)。
在3'半部载体中测试的降解信号中,发明人鉴定出既减少截短蛋白产物的水平又减少全长蛋白的水平的三个(pb29、3xpb29和泛素)(图6和表5和6)。
表5.相对于截短蛋白表达的全长abca4的定量,来自对用在5'半部载体中包括mir靶位点的二元aav杂合载体感染的hek293细胞的western印迹分析
值代表在对应模拟物或序列打乱的模拟物的存在下,全长abca4和截短蛋白条带的强度之间的比例(来自三个独立实验)的平均值±s.e.m.。在序列打乱的或对应模拟物的的存在下,对于各对载体的比例,采用斯氏t检验进行比较且发现无显著差异。
表6:全长abca4和截短蛋白表达的定量,来自对用在3'半部载体中包括降解信号的二元aav杂合载体感染的hek293细胞的western印迹分析。
值表示为来自具有或不具有降解信号的载体的全长abca4和截短蛋白条带的强度之间的比例(来自三个独立实验)的平均值±s.e.m.。对于统计学分析的更多细节包括特异性统计学值可见于材料与方法部分的统计学分析段落。
改进的二元aav载体的视网膜下给予减少了abca4-/-视网膜中的脂褐质累积
基于我们的发现结果,改进的二元aav杂合-abca4载体应包括同源itr2、ak同源区域和cl1。因为abca4在人的视杆和视锥光感受器中表达70,发明人鉴定了用于abca4递送的合适的启动子,通过比较来自人grk1(g蛋白质-偶联的受体激酶1)或irbp(光感受器间类视黄醇结合蛋白质)启动子的编码egfp的单一aav2/8载体的pr转导性质,它们已被描述为在不同的物种中驱动高水平的联合视杆和视锥pr转导53-55。利用包括类似于人黄斑的具有视锥:视杆=1:3的线状区域56的猪视网膜架构,发明人在3月龄大白猪中视网膜下注射1x1011gc/眼的aav2/8-grk1-或irbp-egfp载体。注射后四周,发明人在荧光显微镜下分析了对应的视网膜冷冻切片。pr细胞层中的egfp荧光定量(图10a-b)显示这两种启动子均产生了相当水平的pr转导(该区域中主要是视杆)。然而,当发明人对用针对视锥抑制蛋白(car)(也是egfp阳性)57引起的抗体标记的视椎数量进行计数时,发现采用grk1启动子产生了较高的(尽管不是统计学显著水平的)视锥pr转导(材料,图10c-d)。因此,发明人将grk1启动子纳入我们的改进的二元aav杂合abca4载体中,并研究它们表达abca4并减少abca4-/-小鼠的rpe中的含a2e的自发荧光的脂褐质物质的异常含量的能力。发明人初始用改进的二元aav载体(各载体剂量/眼:2x109gc)视网膜下注射一月龄c57/bl6小鼠,并通过western印迹发现24只中的12只(50%)注射眼具有可检测的(尽管是可变的)水平的全长abca4蛋白[图8a;abca4-阳性眼中的abca4蛋白水平:2,8±0,7a.u.(平均值±平均值的标准误)]。这类似于我们先前的发现,即,不同形式的二元aav平台导致50%abca4-表达眼14。然后,发明人用改进的二元aav载体视网膜下注射5.5月龄色素化abca4-/-小鼠的眼的颞区域(各载体剂量/眼:1.8x109gc)。三个月后,发明人收获眼并检测视网膜冷冻切片上的眼的颞区域中的脂褐质荧光的水平(激发:560±40nm;发射:645±75)[在仅rpe中或在rpe+外节(os)中](图8b-c和图11)。发明人发现,未处理的abca4-/-的眼的该区域中的脂褐质荧光强度显著高于用治疗性二元aav杂合abca4载体注射的abca4+/-和-/-小鼠(图8b、c和图11)。然后,发明人采用透射电子显微镜对rpe脂褐质颗粒的数量进行计数。相较于年龄匹配的abca4+/+对照,这些在用pbs注射的5.5-6-月龄白化abca4-/-小鼠中增加(图8d),增加的水平类似于发明人已独立地在未注射或注射有对照aav载体的abca4-/-小鼠中所检测到的那些(数据未显示)。abca4-/-rpe中的脂褐质颗粒的数量在视网膜下注射改进的二元aav杂合abca4载体后3个月标准化(各载体剂量/眼:1x109gc,图8d)。
改进的二元aav载体在视网膜下给予小鼠和猪视网膜之后是安全的
为了研究改进的二元aav2/8杂合abca4载体的安全性,发明人将它们视网膜下注射进入野生型c57bl/6小鼠和大白猪(各载体剂量/眼:分别为3x109和1x1011gc)。注射后一个月,发明人通过ganzfeld视网膜电图(erg)检测了视网膜电活动,并发现在用二元aav杂合abca4载体注射的小鼠眼和用阴性对照aav载体或pbs注射的眼之间,a-和b-波幅均无显著不同(图9a和材料,图12a)。相似地,在用二元aav杂合abca4载体注射的猪眼和用pbs注射的对照眼的那些中,暗视、明视、最大响应和闪烁erg测试中的b-波幅是相当的(图9b和材料,图12b)。
讨论
aav限制的包装能力代表着扩大aav在ird基因治疗中的应用的主要障碍之一。然而,近期,若干研究组已独立地报道二元aav载体能有效地扩大aav在小鼠和猪视网膜中的装载能力14,17,19,41,从而拓展了aav对于ird的应用性,这归因于不适于单一典型aav载体的基因中的突变。发明人在此设计并克服了与二元aav载体的应用相关联的一些限制,即它们相较于单一载体时相对较低的功效,以及可能引起安全性问题的截短蛋白的生成。
目的在于增加二元aav基因组尾-头连环化的策略应理论上增加全长的水平并减少来自游离单一半部载体的截短蛋白的水平。发明人通过包括同源性或异源性itr的最佳区域,设计改善了尾-头二元aav杂合基因组连环化。在前述同源性区域的并行评价中,发明人发现,采用二元aav杂合ak载体,近期由lostal等20公开的ap1和ap2序列和来自f1噬菌体的ak序列14驱动总体类似水平的蛋白质体外表达,所述载体在小鼠视网膜中驱动更一致的abca4表达。独立地,不同的同源区域的可用性有利于引导三元aav载体的正确连环化以进一步扩大aav装载能力20,42。异源性itr2和itr5已被成功地纳入二元24,25和三元42aav载体。发明人发现,具有异源性itr2和itr5的aav载体的产量低于具有同源itr2的那些。发明人还检测到,当发明人探测它们的itr2时,较少载体基因组具有异源性itr,相较于当发明人探测它们的基因组的不同区域时。由于发明人显示rep5干扰具有itr2的载体的生产,这表明在具有异源性itr的aav载体中包括的itr2的水平下的异常现象,其在rep5的存在下产生,但在具有同源itr2的aav载体中并非如此,其仅在rep2的存在下产生并且无论在发明人探测itr2还是该基因组的不同区域时均显示类似效价。这些结果部分区别于先前报道的那些(其中具有异源性itr2和itr5的二元aav载体的转导功效高于具有同源itr的载体并且明显无生产问题24,25)。除了不同的包装构建体和生成方案以外,在该研究中,发明人采用包括两种半部载体之间的同源区域(与用于先前报道中的反式剪接系统相反,其简单地依赖于itr用于连环化24,25)的二元aav杂合载体。由于在二元aav杂合载体中,全长基因的重建主要由载体中包括的同源区域16(其引导多联体形成)介导,这可造成发明人采用具有异源性itr的载体相较于采用反式剪接载体的先前研究24,25观察到的在转基因表达方面的较小增加。此外,发明人可能高估了具有异源性itr的载体的功效,由于发明人基于比分别对于myo7a-和abca4-表达载体的转基因序列所计算的结果低3-6倍的对itr2计算的效价使用它们。由于在具有同源itr2的对应的二元aav载体之间对于itr2和转基因序列计算的效价类似,发明人以比采用异源性itr2和itr5的那些低3-6倍的体积使用它们。这可以解释来自具有异源性itr的二元aav载体的全长和截短蛋白产物的水平明显高于具有同源itr的情况。
在发明人的先前研究中,直至视网膜下给予二元aav载体后8个月,发明人未观察到局部毒性的迹象14,然而,来自二元aav的单一半部载体的截短蛋白产物的生成可能会引起安全性问题。已显示,mir靶位点在基因的转录本中的纳入是限制不同的组织(包括视网膜30)中的转基因表达的有效策略。然而,仅在发明人纳入mir-204+124和26a的靶位点时,发明人体外实现了截短蛋白生成的部分减少。事实上,mir靶位点外部的mrna特征可能会影响沉默的功效43,44。就此而言,因为衍生自5'半部的截短蛋白产物产生自不具有典型聚腺苷酸化信号的载体,所得mrna可能无法经历高效的mir-介导的沉默。重要的是,发明人通过纳入cl1降解决定子实现了来自5'半部载体的截短蛋白产物的完全降解。发明人显示,该信号在体外和猪视网膜中均有效,指示cl1活性所需的降解途径的酶在不同的细胞类型中表达。由于来自3'半部载体的截短蛋白产物的丰度低于由5'半部载体产生的情况(图6),其存在引起的安全性问题应较低。本文所示的小鼠和猪视网膜中的数据支持改进的二元aav载体的安全性。
显然,发明人发现视网膜下给予改进的二元aav载体(该载体受控于grk1启动子,其提供高水平的联合视杆和视锥转导),导致小鼠中的有效的abca4递送,尽管其处于变化水平。这可能归因于小鼠眼中视网膜下注射的遗传变异性和二元aav系统的功效总体低于单一aav载体14。不论该变异性,发明人发现二元aav介导的abca4递送导致abca4-/-视网膜中的显著脂褐质减少,这表明广泛多种转基因表达水平可相似地贡献治疗功效。采用两种独立技术观察到该情况,然而,当发明人解剖并分析视网膜的aav转导区域(其实际显示脂褐质颗粒数量标准化)时,观察到更显著的表型改善。总而言之,本发明提供具有适于临床应用(具体地用于治疗视网膜疾病)的改进特征的多重载体。此外,本发明改善了进一步扩大装载能力的多重载体的安全性和功效20,42。
参考文献
1.trapani,i等(2014).progressinretinalandeyeresearch43:108-128.
2.boye,se,boye,sl,lewin,as和hauswirth,ww(2013).moleculartherapy:thejournaloftheamericansocietyofgenetherapy21:509-519.
3.bainbridge,jw等.(2008).thenewenglandjournalofmedicine358:2231-2239.
4.maguire,am等.(2009).lancet374:1597-1605.
5.maguire,am等.(2008).thenewenglandjournalofmedicine358:2240-2248.
6.cideciyan,av等.(2009).humangenetherapy20:999-1004.
7.simonelli,f等.(2010).moleculartherapy:thejournaloftheamericansocietyofgenetherapy18:643-650.
8.allikmets,r等.(1997).naturegenetics15:236-246.
9.molday,rs和zhang,k(2010).progressinlipidresearch49:476-492.
10.millan,jm等.(2011).journalofophthalmology2011:417217.
11.hasson,t等.(1995).pnas92:9815-9819.
12.liu,x,ondek,b和williams,ds(1998).naturegenetics19:117-118.
13.gibbs,d等.(2010).investigativeophthalmology&visualscience51:1130-1135.
14.trapani,i,colella,p,sommella,a,iodice,c,cesi,g,desimone,s等.(2014).通过二元aav载体有效地递送大基因至视网膜(effectivedeliveryoflargegenestotheretinabydualaavvectors).embomolecularmedicine6:194-211.
15.duan,d,yue,y和engelhardt,jf(2001).moleculartherapy:thejournaloftheamericansocietyofgenetherapy4:383-391.
16.ghosh,a,yue,y,lai,y和duan,d(2008).moleculartherapy:thejournaloftheamericansocietyofgenetherapy16:124-130.
17.dyka,fm等.,(2014).humangenetherapymethods25:166-177.
18.lopes,vs等.(2013).genether.
19.colella,p等.(2014).genether21:450-456.
20.lostal,w,kodippili,k,yue,y和duan,d(2014).humangenetherapy25:552-562.
21.flotte,tr等.(1993).thejournalofbiologicalchemistry268:3781-3790.
22.ghosh,a,yue,y和duan,d(2011).humangenetherapy22:77-83.
23.chiorini,ja等.,(1999).journalofvirology73:1309-1319.
24.yan,z,zak,r,zhang,y和engelhardt,jf(2005).journalofvirology79:364-379.
25.yan,z等.(2007).humangenetherapy18:81-87.
26.karali等.(2010).bmcgenomics11:715.
27.kutty,rk等.(2010).molecularvision16:1475-1486.
28.ragusa,m等.(2013).molecularvision19:430-440.
29.sundermeier,tr和palczewski,k(2012).cellularandmolecularlifesciences:cmls69:2739-2750.
30.karali,m等.(2011).plosone6:e22166.
31.gilon,t,chomsky,o和kulka,rg(1998).theembojournal17:2759-2766.
32.bence,nf,sampat,rm和kopito,rr(2001).science292:1552-1555.
33.bachmair,a,finley,d和varshavsky,a(1986).science234:179-186.
34.johnson,es等.,(1992).theembojournal11:497-505.
35.sadis,s等.,(1995).molecularandcellularbiology15:4086-4094.
36.chiorini,ja,afione,s和kotin,rm(1999).journalofvirology73:4293-4298.
37.tian,w等.(2012).plosone7:e29551.
38.wang,z(2011).methodsinmolecularbiology676:211-223.
39.mussolino,c等.(2011).genether18:637-645.
40.hendrickson,a和hicks,d(2002).experimentaleyeresearch74:435-444.
41.reich,sj等.(2003).humangenetherapy14:37-44.
42.koo,t等.,(2014).humangenetherapy25:98-108.
43.walters,rw,bradrick,ss和gromeier,m(2010).rna16:239-250.
44.ricci,ep等.(2011).nucleicacidsresearch39:5215-5231.
45.auricchio等.(2001).humanmoleculargenetics10:3075-3081.
46.gao,g等.(2000).humangenetherapy11:2079-2091.
47.young,je等.,(2003).investigativeophthalmology&visualscience44:4076-4085.
48.doria,m等.,(2013).humangenetherapymethods24:392-398.
49.zhang,y等.,(2000).journalofvirology74:8003-8010.
50.drittanti,l等.,(2000).genether7:924-929.
51.gargiulo,s等.(2012).ilarjournal/nationalresearchcouncil,instituteoflaboratoryanimalresources53:e70-81.
52.liang,fq等.,(2001).methodsinmolecularmedicine47:125-139.
53.beltran等.(2012)proc.natl.acad.sci.u.s.a.,109,2132-2137.
54.boye,s.e.等.(2012)hum.genether.,23,1101-1115.
55.khani,s.c.等.,(2007)invest.ophthalmol.vis.sci.,48,3954-3961.
56.chandler,m.j.等.,(1999)vet.ophthalmol.,2,179-184.
57.li,a.,zhu,x.和craft,c.m.(2002)invest.ophthalmol.vis.sci.,43,1375-1383.
58.allocca,m.等.(2008)j.clin.invest.,118,1955-1964.
59.parish,c.a.等.,(1998)proc.natl.acad.sci.u.s.a.,95,14609-14613.
60.ben-shabat,s.等.,(2002)j.biol.chem.,277,7183-7190.
61.gargiulo,s.等.,(2012)ilarj,53,e70-81.
62.liang,f.q.等.,(2001)methodsmol.med.,47,125-139.
63.gargiulo,a.等.(2009)mol.ther.,17,1347-1354.
64.manfredi,a.等.(2013)hum.genether.,24,982-992.
65.venablesvn和ripleybd.(2002)《采用s.的现代应用统计学》(modernappliedstatisticswiths.)施普林格科学+商业媒体出版社(springerscience+businessmedia),美国纽约.
66.li,a.,zhu,x.,brown,b.和craft,c.m.(2003)adv.exp.med.biol.,533,361-368.
67.li,a.等.(2003)invest.ophthalmol.vis.sci.,44,996-1007.
68.allocca,m.等.(2011)invest.ophthalmol.vis.sci.,52,5713-5719.
69.testa,f.等.(2011)invest.ophthalmol.vis.sci.,52,5618-5624.
70.molday,l.l.,rabin,a.r.和molday,r.s.(2000)nat.genet.,25,257-258.
71.sparrow,j.r.,wu,y.,nagasaki,t.,yoon,k.d.,yamamoto,k.和zhou,j.(2010)photochemphotobiolsci,9,1480-1489.
72.sparrow,j.r.和duncker,t.(2014)jclinmed,3,1302-1321.
73.finnemann,s.c.,leung,l.w.和rodriguez-boulan,e.(2002)proc.natl.acad.sci.u.s.a.,99,3842-3847.
74.secondi,r.,kong,j.,blonska,a.m.,staurenghi,g.和sparrow,j.r.(2012)invest.ophthalmol.vis.sci.,53,5190-5197.
75.delori,f.c.,dorey,c.k.,staurenghi,g.,arend,o.,goger,d.g.和weiter,j.j.(1995)invest.ophthalmol.vis.sci.,36,718-729.
序列表
<110>泰莱托恩基金会(fondazionetelethon)
<120>多重载体系统及其应用
<130>pct129062
<150>us62/127,463
<151>2015-03-03
<160>78
<170>patentinversion3.5
<210>1
<211>16
<212>prt
<213>人工序列
<220>
<223>合成
<400>1
alacyslysasntrppheserserleuserhisphevalilehisleu
151015
<210>2
<211>35
<212>prt
<213>人工序列
<220>
<223>合成
<400>2
serleuileserleuproleuprothrargvallyspheserserleu
151015
leuleuileargilemetlysileilethrmetthrpheprolyslys
202530
leuargser
35
<210>3
<211>16
<212>prt
<213>人工序列
<220>
<223>合成
<400>3
phetyrtyrproiletrpphealaargvalleuleuvalhistyrgln
151015
<210>4
<211>46
<212>prt
<213>人工序列
<220>
<223>合成
<400>4
serasnpropheserserleupheglyalaserleuleuileaspser
151015
valserleulysserasntrpaspthrsersersersercysleuile
202530
serphepheserservalmetpheserserthrthrargser
354045
<210>5
<211>39
<212>prt
<213>人工序列
<220>
<223>合成
<400>5
cysargglnargphesercyshisleuthralasertyrproglnser
151015
thrvalthrpropheleualapheleuargargaspphephepheleu
202530
arghisasnserseralaasp
35
<210>6
<211>46
<212>prt
<213>人工序列
<220>
<223>合成
<400>6
glyalaprohisvalvalleupheaspphegluleuargilethrasn
151015
proleuserhisileglnservalserleuglnilethrleuilephe
202530
cysserleuproserleuileleuserlyspheleuglnval
354045
<210>7
<211>39
<212>prt
<213>人工序列
<220>
<223>合成
<400>7
asnthrproleupheserlysserpheserthrthrcysglyvalala
151015
lyslysthrleuleuleualaglnileserserleuphepheleuleu
202530
leuserserasnilealaval
35
<210>8
<211>45
<212>prt
<213>人工序列
<220>
<223>合成
<400>8
prothrvallysasnserprolysilephecysleuserserserpro
151015
tyrleualapheasnleuglutyrleuserleuargilepheserthr
202530
leuserlyscysserasnthrleuleuthrserleuser
354045
<210>9
<211>30
<212>prt
<213>人工序列
<220>
<223>合成
<400>9
serasnglnleulysargleutrpleutrpleuleugluvalargser
151015
pheaspargthrleuargargprotrpilehisleuproser
202530
<210>10
<211>50
<212>prt
<213>人工序列
<220>
<223>合成
<400>10
serileserphevalileargserhisalaserileargmetglyala
151015
serasnaspphephehislysleutyrphethrlyscysleuthrser
202530
valileleuserlyspheleuilehisleuleuleuargserthrpro
354045
argval
50
<210>11
<211>22
<212>dna
<213>人工序列
<220>
<223>合成
<400>11
aggcataggatgacaaagggaa22
<210>12
<211>20
<212>dna
<213>人工序列
<220>
<223>合成
<400>12
ggcattcaccgcgtgcctta20
<210>13
<211>22
<212>dna
<213>人工序列
<220>
<223>合成
<400>13
agcctatcctggattacttgaa22
<210>14
<211>9
<212>prt
<213>人工序列
<220>
<223>合成
<400>14
sertrpasnphelysleutyrvalmet
15
<210>15
<211>14
<212>prt
<213>人工序列
<220>
<223>合成
<400>15
methissertrpasnphelysleutyrvalmetglysergly
1510
<210>16
<211>48
<212>dna
<213>人工序列
<220>
<223>合成
<400>16
gcctgcaagaactggttcagcagcctgagccacttcgtgatccacctg48
<210>17
<211>158
<212>dna
<213>人工序列
<220>
<223>合成
<400>17
aggcataggatgacaaagggaacgataggcataggatgacaaagggaaaagcttaggcat60
aggatgacaaagggaaggtaccagatctggcattcaccgcgtgccttacgatggcattca120
ccgcgtgccttaaagcttggcattcaccgcgtgcctta158
<210>18
<211>102
<212>dna
<213>人工序列
<220>
<223>合成
<400>18
agcctatcctggattacttgaacgatagcctatcctggattacttgaaaagcttagccta60
tcctggattacttgaatcacagcctatcctggattacttgaa102
<210>19
<211>42
<212>dna
<213>人工序列
<220>
<223>合成
<400>19
atgcacagctggaacttcaagctgtacgtcatgggcagcggc42
<210>20
<211>27
<212>dna
<213>人工序列
<220>
<223>合成
<400>20
agctggaacttcaagctgtacgtcatg27
<210>21
<211>136
<212>dna
<213>人工序列
<220>
<223>合成
<400>21
atgcacagctggaacttcaagctgtacgtcatgggcagcggcggggtaccatgcacagct60
ggaacttcaagctgtacgtcatgggcagcggcggatgcacagctggaacttcaagctgta120
cgtcatgggcagcggc136
<210>22
<211>77
<212>dna
<213>人工序列
<220>
<223>合成
<400>22
gggatttttccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaac60
gcgaattttaacaaaat77
<210>23
<211>77
<212>dna
<213>人工序列
<220>
<223>合成
<400>23
gggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaac60
gcgaattttaacaaaat77
<210>24
<211>287
<212>dna
<213>人工序列
<220>
<223>合成
<400>24
ccccgggtgcgcggcgtcggtggtgccggcggggggcgccaggtcgcaggcggtgtaggg60
ctccaggcaggcggcgaaggccatgacgtgcgctatgaaggtctgctcctgcacgccgtg120
aaccaggtgcgcctgcgggccgcgcgcgaacaccgccacgtcctcgcctgcgtgggtctc180
ttcgtccaggggcactgctgactgctgccgatactcggggctcccgctctcgctctcggt240
aacatccggccgggcgccgtccttgagcacatagcctggaccgtttc287
<210>25
<211>288
<212>dna
<213>人工序列
<220>
<223>合成
<400>25
cgcagggcagcctctgtcatctccatcagggaggggtccagtgtggagtctcggtggatc60
tcgtatttcatgtctccaggctcaaagagacccatgagatgggtcacagacgggtccagg120
gaagcctgcatgagctcagtgcggttccacacataccgggcaccctggcgcttcgccagc180
cattcctgcaccagattcttcccgtccagcctggtcccaccttggctgtagtcatctggg240
tactcagggtctggggttcccatgcgaaacatgtactttcggcctcca288
<210>26
<211>278
<212>dna
<213>人工序列
<220>
<223>合成
<400>26
gtgatcctaggtggaggccgaaagtacatgtttcgcatgggaaccccagaccctgagtac60
ccagatgactacagccaaggtgggaccaggctggacgggaagaatctggtgcaggaatgg120
ctggcgaagcgccagggtgcccggtacgtgtggaaccgcactgagctcatgcaggcttcc180
ctggacccgtctgtgacccatctcatgggtctctttgagcctggagacatgaaatacgag240
atccaccgagactccacactggacccctccctgatgga278
<210>27
<211>82
<212>dna
<213>人工序列
<220>
<223>合成
<400>27
gtaagtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgaga60
cagagaagactcttgcgtttct82
<210>28
<211>51
<212>dna
<213>人工序列
<220>
<223>合成
<400>28
gataggcacctattggtcttactgacatccactttgcctttctctccacag51
<210>29
<211>130
<212>dna
<213>人工序列
<220>
<223>合成
<400>29
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcct130
<210>30
<211>130
<212>dna
<213>人工序列
<220>
<223>合成
<400>30
aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgagg60
ccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagc120
gagcgcgcag130
<210>31
<211>175
<212>dna
<213>人工序列
<220>
<223>合成
<400>31
ctctcccccctgtcgcgttcgctcgctcgctggctcgtttgggggggtggcagctcaaag60
agctgccagacgacggccctctggccgtcgcccccccaaacgagccagcgagcgagcgaa120
cgcgacaggggggagagtgccacactctcaagcaagggggttttgtaagcagtga175
<210>32
<211>175
<212>dna
<213>人工序列
<220>
<223>合成
<400>32
tcactgcttacaaaacccccttgcttgagagtgtggcactctcccccctgtcgcgttcgc60
tcgctcgctggctcgtttgggggggcgacggccagagggccgtcgtctggcagctctttg120
agctgccacccccccaaacgagccagcgagcgagcgaacgcgacaggggggagag175
<210>33
<211>153
<212>dna
<213>人工序列
<220>
<223>合成
<400>33
tcaatattggccattagccatattattcattggttatatagcataaatcaatattggcta60
ttggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtcc120
aatatgaccgccatgttggcattgattattgac153
<210>34
<211>583
<212>dna
<213>人工序列
<220>
<223>合成
<400>34
tagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccg60
cgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccatt120
gacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtca180
atgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgcc240
aagtccgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagta300
catgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgctattac360
catggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacgggg420
atttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacg480
ggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgt540
acggtgggaggtctatataagcagagctcgtttagtgaaccgt583
<210>35
<211>133
<212>dna
<213>人工序列
<220>
<223>合成
<400>35
gtaagtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgaga60
cagagaagactcttgcgtttctgataggcacctattggtcttactgacatccactttgcc120
tttctctccacag133
<210>36
<211>299
<212>dna
<213>人工序列
<220>
<223>合成
<400>36
ctagtgggccccagaagcctggtggttgtttgtccttctcaggggaaaagtgaggcggcc60
ccttggaggaaggggccgggcagaatgatctaatcggattccaagcagctcaggggattg120
tctttttctagcaccttcttgccactcctaagcgtcctccgtgaccccggctgggattta180
gcctggtgctgtgtcagccccgggctcccaggggcttcccagtggtccccaggaaccctc240
gacagggccagggcgtctctctcgtccagcaagggcagggacgggccacaggcaagggc299
<210>37
<211>365
<212>dna
<213>人工序列
<220>
<223>合成
<400>37
ctagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttcc60
gcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccat120
tgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtc180
aatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgc240
caagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagt300
acatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctatta360
ccatg365
<210>38
<211>229
<212>dna
<213>人工序列
<220>
<223>合成
<400>38
tcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaa60
ttttgtatttatttattttttaattattttgtgcagcgatgggggcggggcggggcgagg120
cggagaggtgcggcggcagccaatcggagcggcgcgctccgaaagtttccttttatggcg180
aggcggcggcggcggcggctctataaaaagcgaagcgcgcggcgggcgg229
<210>39
<211>235
<212>dna
<213>人工序列
<220>
<223>合成
<400>39
agcacagtgtctggcatgtagcaggaactaaaataatggcagtgattaatgttatgatat60
gcagacacaacacagcaagataagatgcaatgtaccttctgggtcaaaccaccctggcca120
ctcctccccgatacccagggttgatgtgcttgaattagacaggattaaaggcttactgga180
gctggaagccttgccccaactcaggagtttagccccagaccttctgtccaccagc235
<210>40
<211>22
<212>dna
<213>人工序列
<220>
<223>合成
<400>40
aaccacacaacctactacctca22
<210>41
<211>102
<212>dna
<213>人工序列
<220>
<223>合成
<400>41
aaccacacaacctactacctcacgataaccacacaacctactacctcaaagcttaaccac60
acaacctactacctcatcacaaccacacaacctactacctca102
<210>42
<211>105
<212>dna
<213>人工序列
<220>
<223>合成
<400>42
agcctgatcagcctgcccctgcccacccgggtgaagttcagcagcctgctgctgatccgg60
atcatgaagatcatcaccatgaccttccccaagaagctgcggagc105
<210>43
<211>48
<212>dna
<213>人工序列
<220>
<223>合成
<400>43
ttctactaccccatctggttcgcccgggtgctgctggtgcactaccag48
<210>44
<211>138
<212>dna
<213>人工序列
<220>
<223>合成
<400>44
agcaaccccttcagcagcctgttcggcgccagcctgctgatcgacagcgtgagcctgaag60
agcaactgggacaccagcagcagcagctgcctgatcagcttcttcagcagcgtgatgttc120
agcagcaccacccggagc138
<210>45
<211>117
<212>dna
<213>人工序列
<220>
<223>合成
<400>45
tgccggcagcggttcagctgccacctgaccgccagctacccccagagcaccgtgaccccc60
ttcctggccttcctgcggcgggacttcttcttcctgcggcacaacagcagcgccgac117
<210>46
<211>138
<212>dna
<213>人工序列
<220>
<223>合成
<400>46
ggcgccccccacgtggtgctgttcgacttcgagctgcggatcaccaaccccctgagccac60
atccagagcgtgagcctgcagatcaccctgatcttctgcagcctgcccagcctgatcctg120
agcaagttcctgcaggtg138
<210>47
<211>117
<212>dna
<213>人工序列
<220>
<223>合成
<400>47
aacacccccctgttcagcaagagcttcagcaccacctgcggcgtggccaagaagaccctg60
ctgctggcccagatcagcagcctgttcttcctgctgctgagcagcaacatcgccgtg117
<210>48
<211>135
<212>dna
<213>人工序列
<220>
<223>合成
<400>48
cccaccgtgaagaacagccccaagatcttctgcctgagcagcagcccctacctggccttc60
aacctggagtacctgagcctgcggatcttcagcaccctgagcaagtgcagcaacaccctg120
ctgaccagcctgagc135
<210>49
<211>90
<212>dna
<213>人工序列
<220>
<223>合成
<400>49
agcaaccagctgaagcggctgtggctgtggctgctggaggtgcggagcttcgaccggacc60
ctgcggcggccctggatccacctgcccagc90
<210>50
<211>150
<212>dna
<213>人工序列
<220>
<223>合成
<400>50
agcatcagcttcgtgatccggagccacgccagcatccggatgggcgccagcaacgacttc60
ttccacaagctgtacttcaccaagtgcctgaccagcgtgatcctgagcaagttcctgatc120
cacctgctgctgcggagcaccccccgggtg150
<210>51
<211>11
<212>dna
<213>人工序列
<220>
<223>合成
<400>51
tgaatgaatga11
<210>52
<211>243
<212>dna
<213>人工序列
<220>
<223>合成
<400>52
ttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagt60
gaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataa120
gctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcaggggg180
agatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataagg240
atc243
<210>53
<211>2918
<212>dna
<213>人工序列
<220>
<223>合成
<400>53
atgggcttcgtgagacagatacagcttttgctctggaagaactggaccctgcggaaaagg60
caaaagattcgctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatc120
tggttaaggaatgccaacccgctctacagccatcatgaatgccatttccccaacaaggcg180
atgccctcagcaggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccc240
tgttttcaaagccccaccccaggagaatctcctggaattgtgtcaaactataacaactcc300
atcttggcaagggtatatcgagattttcaagaactcctcatgaatgcaccagagagccag360
caccttggccgtatttggacagagctacacatcttgtcccaattcatggacaccctccgg420
actcacccggagagaattgcaggaagaggaattcgaataagggatatcttgaaagatgaa480
gaaacactgacactatttctcattaaaaacatcggcctgtctgactcagtggtctacctt540
ctgatcaactctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctg600
aaggacatcgcctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgc660
ggggcaaagacggtgcgctatgccctgtgctccctctcccagggcaccctacagtggata720
gaagacactctgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactc780
ctagacagccgttctcaaggtatcaatctgagatcttggggaggaatattatctgatatg840
tcaccaagaattcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgacc900
aggcccctcatgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtct960
gacctcctgtgtggctaccccgagggaggtggctctcgggtgctctccttcaactggtat1020
gaagacaataactataaggcctttctggggattgactccacaaggaaggatcctatctat1080
tcttatgacagaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaat1140
cctttaaccaaaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtac1200
actcctgattcacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaa1260
ctggaacacgttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtac1320
ttctttgacaacagcacacagatgaacatgatcagagataccctggggaacccaacagta1380
aaagactttttgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaac1440
ttcctctacaagggccctcgggaaagccaggctgacgacatggccaacttcgactggagg1500
gacatatttaacatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttg1560
gtcctggataagtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctct1620
ctactggaggaaaacatgttctgggccggagtggtattccctgacatgtatccctggacc1680
agctctctaccaccccacgtgaagtataagatccgaatggacatagacgtggtggagaaa1740
accaataagattaaagacaggtattgggattctggtcccagagctgatcccgtggaagat1800
ttccggtacatctggggcgggtttgcctatctgcaggacatggttgaacaggggatcaca1860
aggagccaggtgcaggcggaggctccagttggaatctacctccagcagatgccctacccc1920
tgcttcgtggacgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtg1980
ctggcatggatctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttg2040
cgactgaaggagaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctgg2100
ttcctggacagcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatg2160
catggaagaatcctacattacagcgacccattcatcctcttcctgttcttgttggctttc2220
tccactgccaccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctg2280
gcagcagcctgtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttc2340
gcctggcaggaccgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtg2400
gcatttggatttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcag2460
tggagcaacatcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatg2520
cagatgatgctccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtg2580
tttccaggagactatggaaccccacttccttggtactttcttctacaagagtcgtattgg2640
cttggcggtgaagggtgttcaaccagagaagaaagagccctggaaaagaccgagccccta2700
acagaggaaacggaggatccagagcacccagaaggaatacacgactccttctttgaacgt2760
gagcatccagggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccc2820
tgtggccggccagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgca2880
ttcctgggccacaatggagctgggaaaaccaccacctt2918
<210>54
<211>3945
<212>dna
<213>人工序列
<220>
<223>合成
<400>54
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180
aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240
atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300
gctcatgtccaatatgaccgccatgttggcattgattattgactagtgggccccagaagc360
ctggtggttgtttgtccttctcaggggaaaagtgaggcggccccttggaggaaggggccg420
ggcagaatgatctaatcggattccaagcagctcaggggattgtctttttctagcaccttc480
ttgccactcctaagcgtcctccgtgaccccggctgggatttagcctggtgctgtgtcagc540
cccgggctcccaggggcttcccagtggtccccaggaaccctcgacagggccagggcgtct600
ctctcgtccagcaagggcagggacgggccacaggcaagggcgcggccgccatgggcttcg660
tgagacagatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattc720
gctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaagga780
atgccaacccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcag840
caggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaa900
gccccaccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaa960
gggtatatcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggcc1020
gtatttggacagagctacacatcttgtcccaattcatggacaccctccggactcacccgg1080
agagaattgcaggaagaggaattcgaataagggatatcttgaaagatgaagaaacactga1140
cactatttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaact1200
ctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcg1260
cctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaaga1320
cggtgcgctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactc1380
tgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagcc1440
gttctcaaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaa1500
ttcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctca1560
tgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgt1620
gtggctaccccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaata1680
actataaggcctttctggggattgactccacaaggaaggatcctatctattcttatgaca1740
gaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaacca1800
aaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgatt1860
cacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacg1920
ttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgaca1980
acagcacacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttt2040
tgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctaca2100
agggccctcgggaaagccaggctgacgacatggccaacttcgactggagggacatattta2160
acatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggata2220
agtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggagg2280
aaaacatgttctgggccggagtggtattccctgacatgtatccctggaccagctctctac2340
caccccacgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataaga2400
ttaaagacaggtattgggattctggtcccagagctgatcccgtggaagatttccggtaca2460
tctggggcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccagg2520
tgcaggcggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtgg2580
acgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatgga2640
tctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaagg2700
agaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggaca2760
gcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaa2820
tcctacattacagcgacccattcatcctcttcctgttcttgttggctttctccactgcca2880
ccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcct2940
gtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcagg3000
accgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggat3060
ttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaaca3120
tcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgc3180
tccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggag3240
actatggaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtg3300
aagggtgttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaa3360
cggaggatccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccag3420
ggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggc3480
cagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggcc3540
acaatggagctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaagg3600
agaccaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgggatttttc3660
cgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaatttta3720
acaaaatattaacgtttataatttcaggtggcatctttcccgcctgcaagaactggttca3780
gcagcctgagccacttcgtgatccacctgcaattgaggaacccctagtgatggagttggc3840
cactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacg3900
cccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag3945
<210>55
<211>3904
<212>dna
<213>人工序列
<220>
<223>合成
<400>55
gtccatcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaaggga60
cattgaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacat120
cctgttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaa180
gtcccaggaggaggcccagctggagatggaagccatgttggaggacacaggcctccacca240
caagcggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgc300
cattgcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtgga360
cccttactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccat420
catcatgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcat480
tgcccagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcac540
aggcttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcag600
tgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcga660
tgacctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttct720
ccaccatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttct780
tccaaataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagac840
gctggctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttt900
tctgaaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaa960
aagagaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagac1020
accccaggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcc1080
tcccccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctcca1140
gcatgtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggactt1200
cctggcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgt1260
tatccctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagca1320
gtacaccttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgt1380
cctcctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagta1440
cccctgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagct1500
gttccagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccag1560
ggagaagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgccccccca1620
gagaacacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgactt1680
cttggtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaa1740
tgaacagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacggg1800
ggaagcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccc1860
tatcactagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaaga1920
caacattaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgt1980
ggcccacaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatgg2040
aatcaccgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagt2100
gctgaccacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgt2160
cccagccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctcca2220
gtttatcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcat2280
gaattattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagc2340
ctacacttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggc2400
ggtcattcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgt2460
ggctttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatctt2520
ggaattatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgct2580
cattgtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggc2640
tgtgacagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactggga2700
cctgattgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgac2760
cctgctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcc2820
cattgttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaa2880
taaaactgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagccc2940
agcagtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagt3000
gaatggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctc3060
aggggatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaa3120
tatgggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatct3180
ttacctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactg3240
gagtattaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgg3300
gggcaacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgct3360
gctggatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcat3420
cgtgagcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatg3480
tgaggcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcac3540
cattcagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatc3600
cccgaaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaactt3660
cccaggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctc3720
ctccctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgagga3780
gtactcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagac3840
tgaaagtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccagga3900
ctga3904
<210>56
<211>4636
<212>dna
<213>人工序列
<220>
<223>合成
<400>56
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180
ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240
ctttcgataggcacctattggtcttactgacatccactttgcctttctctccacaggtcc300
atcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacatt360
gaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctg420
ttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcc480
caggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaag540
cggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccatt600
gcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggaccct660
tactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatc720
atgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcc780
cagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggc840
ttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgag900
gggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgac960
ctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccac1020
catgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttcca1080
aataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctg1140
gctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctg1200
aaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaaga1260
gaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccc1320
caggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctccc1380
ccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcat1440
gtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctg1500
gcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatc1560
cctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtac1620
accttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctc1680
ctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccc1740
tgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttc1800
cagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggag1860
aagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagaga1920
acacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttg1980
gtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaa2040
cagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaa2100
gcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatc2160
actagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaac2220
attaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcc2280
cacaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatc2340
accgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctg2400
accacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtccca2460
gccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagttt2520
atcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaat2580
tattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctac2640
acttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtc2700
attcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggct2760
ttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaa2820
ttatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcatt2880
gtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtg2940
acagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctg3000
attgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctg3060
ctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccatt3120
gttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaa3180
actgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagca3240
gtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaat3300
ggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggg3360
gatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatg3420
ggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttac3480
ctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagt3540
attaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggc3600
aacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctg3660
gatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtg3720
agcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgag3780
gcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccatt3840
cagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccg3900
aaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttccca3960
ggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctcc4020
ctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtac4080
tcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaa4140
agtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggactga4200
gcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactag4260
aatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaac4320
cattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggt4380
tcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaat4440
cgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaatcatta4500
actacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctca4560
ctgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtga4620
gcgagcgagcgcgcag4636
<210>57
<211>4540
<212>dna
<213>人工序列
<220>
<223>合成
<400>57
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180
aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240
atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300
gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360
caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420
taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480
atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540
ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600
acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660
ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720
ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780
ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840
gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900
taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960
acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020
gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080
accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140
ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200
acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260
gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320
ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380
tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440
acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500
ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560
aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620
ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680
tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740
gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800
aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860
agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920
tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980
tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040
acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100
atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160
atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220
cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280
gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340
tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400
tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460
cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520
ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580
aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640
acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700
gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760
gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820
ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880
atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940
ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000
ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060
gggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttg3120
cctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctc3180
cagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatga3240
tcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctcca3300
tgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatc3360
agggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgt3420
cgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcg3480
acccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgct3540
ttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatct3600
atttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctg3660
agctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacc3720
tggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtccca3780
cggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctg3840
tctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccac3900
ttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaacca3960
gagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagc4020
acccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctgggg4080
tatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtc4140
tgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctggga4200
aaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaatagaaact4260
gggcttgtcgagacagagaagactcttgcgtttctgggatttttccgatttcggcctatt4320
ggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgt4380
ttataatttcaggtggcatctttccaattgaggaacccctagtgatggagttggccactc4440
cctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgg4500
gctttgcccgggcggcctcagtgagcgagcgagcgcgcag4540
<210>58
<211>4702
<212>dna
<213>人工序列
<220>
<223>合成
<400>58
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180
ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240
ctttcgataggcacctattggtcttactgacatccactttgcctttctctccacaggtcc300
atcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacatt360
gaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctg420
ttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcc480
caggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaag540
cggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccatt600
gcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggaccct660
tactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatc720
atgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcc780
cagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggc840
ttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgag900
gggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgac960
ctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccac1020
catgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttcca1080
aataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctg1140
gctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctg1200
aaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaaga1260
gaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccc1320
caggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctccc1380
ccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcat1440
gtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctg1500
gcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatc1560
cctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtac1620
accttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctc1680
ctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccc1740
tgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttc1800
cagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggag1860
aagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagaga1920
acacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttg1980
gtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaa2040
cagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaa2100
gcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatc2160
actagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaac2220
attaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcc2280
cacaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatc2340
accgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctg2400
accacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtccca2460
gccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagttt2520
atcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaat2580
tattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctac2640
acttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtc2700
attcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggct2760
ttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaa2820
ttatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcatt2880
gtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtg2940
acagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctg3000
attgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctg3060
ctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccatt3120
gttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaa3180
actgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagca3240
gtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaat3300
ggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggg3360
gatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatg3420
ggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttac3480
ctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagt3540
attaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggc3600
aacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctg3660
gatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtg3720
agcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgag3780
gcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccatt3840
cagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccg3900
aaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttccca3960
ggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctcc4020
ctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtac4080
tcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaa4140
agtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgac4200
tacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatgac4260
aagtgagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccac4320
aactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatt4380
tgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtt4440
tcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtgg4500
taaaatcgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaa4560
tcattaactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgct4620
cgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcct4680
cagtgagcgagcgagcgcgcag4702
<210>59
<211>4718
<212>dna
<213>人工序列
<220>
<223>合成
<400>59
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180
aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240
atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300
gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360
caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420
taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480
atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540
ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600
acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660
ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720
ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780
ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840
gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900
taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960
acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020
gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080
accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140
ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200
acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260
gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320
ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380
tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440
acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500
ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560
aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620
ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680
tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740
gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800
aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860
agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920
tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980
tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040
acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100
atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160
atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220
cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280
gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340
tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400
tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460
cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520
ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580
aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640
acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700
gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760
gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820
ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880
atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940
ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000
ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060
gggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttg3120
cctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctc3180
cagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatga3240
tcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctcca3300
tgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatc3360
agggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgt3420
cgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcg3480
acccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgct3540
ttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatct3600
atttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctg3660
agctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacc3720
tggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtccca3780
cggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctg3840
tctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccac3900
ttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaacca3960
gagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagc4020
acccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctgggg4080
tatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtc4140
tgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctggga4200
aaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaatagaaact4260
gggcttgtcgagacagagaagactcttgcgtttctccccgggtgcgcggcgtcggtggtg4320
ccggcggggggcgccaggtcgcaggcggtgtagggctccaggcaggcggcgaaggccatg4380
acgtgcgctatgaaggtctgctcctgcacgccgtgaaccaggtgcgcctgcgggccgcgc4440
gcgaacaccgccacgtcctcgcctgcgtgggtctcttcgtccaggggcactgctgactgc4500
tgccgatactcggggctcccgctctcgctctcggtaacatccggccgggcgccgtccttg4560
agcacatagcctggaccgtttccaattgaggaacccctagtgatggagttggccactccc4620
tctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggc4680
tttgcccgggcggcctcagtgagcgagcgagcgcgcag4718
<210>60
<211>4880
<212>dna
<213>人工序列
<220>
<223>合成
<400>60
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatccccccgggtgcgcggcgtcggtggtgccggcggggggcgccaggt180
cgcaggcggtgtagggctccaggcaggcggcgaaggccatgacgtgcgctatgaaggtct240
gctcctgcacgccgtgaaccaggtgcgcctgcgggccgcgcgcgaacaccgccacgtcct300
cgcctgcgtgggtctcttcgtccaggggcactgctgactgctgccgatactcggggctcc360
cgctctcgctctcggtaacatccggccgggcgccgtccttgagcacatagcctggaccgt420
ttcgataggcacctattggtcttactgacatccactttgcctttctctccacaggtccat480
cctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacattga540
aaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgtt600
ccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtccca660
ggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaagcg720
gaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattgc780
ctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggaccctta840
ctcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatcat900
gtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgccca960
gggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggctt1020
gtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgaggg1080
gacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacct1140
aactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccacca1200
tgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaaa1260
taagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctggc1320
tgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctgaa1380
ggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagaga1440
aaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacacccca1500
ggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctccccc1560
agagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatgt1620
gcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctggc1680
gcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatccc1740
tccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtacac1800
cttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcct1860
gaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccctg1920
tggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttcca1980
gaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaa2040
gctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaac2100
acagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttggt2160
aaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaaca2220
gaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaagc2280
acttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatcac2340
tagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaacat2400
taaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggccca2460
caacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatcac2520
cgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctgac2580
cacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccagc2640
cagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagtttat2700
cagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaatta2760
ttccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctacac2820
ttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtcat2880
tcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggcttt2940
atcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaatt3000
atttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgt3060
cttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtgac3120
agatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctgat3180
tgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgct3240
ggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccattgt3300
tgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaac3360
tgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagcagt3420
ggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatgg3480
tgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcagggga3540
tgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatggg3600
ctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttacct3660
ttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtat3720
taagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggcaa3780
caagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctgga3840
tgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgag3900
catcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgaggc3960
actgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattca4020
gcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccgaa4080
ggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccagg4140
cagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctccct4200
ggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtactc4260
agtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaag4320
tcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgacta4380
caaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatgacaa4440
gtgagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaa4500
ctagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttg4560
taaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttc4620
aggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggta4680
aaatcgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaatc4740
attaactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcg4800
ctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctca4860
gtgagcgagcgagcgcgcag4880
<210>61
<211>4719
<212>dna
<213>人工序列
<220>
<223>合成
<400>61
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180
aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240
atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300
gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360
caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420
taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480
atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540
ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600
acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660
ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720
ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780
ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840
gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900
taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960
acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020
gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080
accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140
ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200
acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260
gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320
ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380
tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440
acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500
ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560
aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620
ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680
tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740
gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800
aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860
agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920
tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980
tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040
acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100
atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160
atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220
cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280
gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340
tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400
tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460
cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520
ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580
aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640
acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700
gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760
gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820
ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880
atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940
ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000
ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060
gggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttg3120
cctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctc3180
cagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatga3240
tcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctcca3300
tgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatc3360
agggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgt3420
cgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcg3480
acccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgct3540
ttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatct3600
atttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctg3660
agctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacc3720
tggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtccca3780
cggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctg3840
tctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccac3900
ttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaacca3960
gagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagc4020
acccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctgggg4080
tatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtc4140
tgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctggga4200
aaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaatagaaact4260
gggcttgtcgagacagagaagactcttgcgtttctcgcagggcagcctctgtcatctcca4320
tcagggaggggtccagtgtggagtctcggtggatctcgtatttcatgtctccaggctcaa4380
agagacccatgagatgggtcacagacgggtccagggaagcctgcatgagctcagtgcggt4440
tccacacataccgggcaccctggcgcttcgccagccattcctgcaccagattcttcccgt4500
ccagcctggtcccaccttggctgtagtcatctgggtactcagggtctggggttcccatgc4560
gaaacatgtactttcggcctccacaattgaggaacccctagtgatggagttggccactcc4620
ctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccggg4680
ctttgcccgggcggcctcagtgagcgagcgagcgcgcag4719
<210>62
<211>4881
<212>dna
<213>人工序列
<220>
<223>合成
<400>62
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatcccgcagggcagcctctgtcatctccatcagggaggggtccagtgt180
ggagtctcggtggatctcgtatttcatgtctccaggctcaaagagacccatgagatgggt240
cacagacgggtccagggaagcctgcatgagctcagtgcggttccacacataccgggcacc300
ctggcgcttcgccagccattcctgcaccagattcttcccgtccagcctggtcccaccttg360
gctgtagtcatctgggtactcagggtctggggttcccatgcgaaacatgtactttcggcc420
tccagataggcacctattggtcttactgacatccactttgcctttctctccacaggtcca480
tcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacattg540
aaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgt600
tccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtccc660
aggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaagc720
ggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattg780
cctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggaccctt840
actcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatca900
tgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgccc960
agggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggct1020
tgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgagg1080
ggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacc1140
taactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccacc1200
atgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaa1260
ataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctgg1320
ctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctga1380
aggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagag1440
aaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacacccc1500
aggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctcccc1560
cagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatg1620
tgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctgg1680
cgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatcc1740
ctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtaca1800
ccttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcc1860
tgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccct1920
gtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttcc1980
agaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggaga2040
agctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaa2100
cacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttgg2160
taaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaac2220
agaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaag2280
cacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatca2340
ctagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaaca2400
ttaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggccc2460
acaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatca2520
ccgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctga2580
ccacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccag2640
ccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagttta2700
tcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaatt2760
attccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctaca2820
cttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtca2880
ttcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggctt2940
tatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaat3000
tatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattg3060
tcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtga3120
cagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctga3180
ttgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgc3240
tggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccattg3300
ttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaa3360
ctgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagcag3420
tggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatg3480
gtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcagggg3540
atgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatgg3600
gctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttacc3660
tttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagta3720
ttaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggca3780
acaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctgg3840
atgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtga3900
gcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgagg3960
cactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattc4020
agcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccga4080
aggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccag4140
gcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctccc4200
tggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtact4260
cagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaa4320
gtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgact4380
acaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatgaca4440
agtgagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccaca4500
actagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttattt4560
gtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgttt4620
caggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggt4680
aaaatcgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaat4740
cattaactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgctc4800
gctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctc4860
agtgagcgagcgagcgcgcag4881
<210>63
<211>4709
<212>dna
<213>人工序列
<220>
<223>合成
<400>63
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180
aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240
atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300
gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360
caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420
taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480
atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540
ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600
acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660
ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720
ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780
ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840
gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900
taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960
acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020
gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080
accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140
ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200
acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260
gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320
ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380
tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440
acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500
ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560
aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620
ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680
tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740
gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800
aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860
agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920
tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980
tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040
acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100
atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160
atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220
cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280
gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340
tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400
tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460
cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520
ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580
aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640
acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700
gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760
gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820
ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880
atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940
ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000
ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060
gggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcgggtttg3120
cctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcggaggctc3180
cagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctttcatga3240
tcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctgtctcca3300
tgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttgaaaaatc3360
agggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctccatcatgt3420
cgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacattacagcg3480
acccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgctgtgct3540
ttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtgtcatct3600
atttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatgaccgctg3660
agctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactgagtacc3720
tggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaacagtccca3780
cggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatgctgctg3840
tctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaaccccac3900
ttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgttcaacca3960
gagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatccagagc4020
acccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttcctgggg4080
tatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtggaccgtc4140
tgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggagctggga4200
aaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaatagaaact4260
gggcttgtcgagacagagaagactcttgcgtttctgtgatcctaggtggaggccgaaagt4320
acatgtttcgcatgggaaccccagaccctgagtacccagatgactacagccaaggtggga4380
ccaggctggacgggaagaatctggtgcaggaatggctggcgaagcgccagggtgcccggt4440
acgtgtggaaccgcactgagctcatgcaggcttccctggacccgtctgtgacccatctca4500
tgggtctctttgagcctggagacatgaaatacgagatccaccgagactccacactggacc4560
cctccctgatggacaattgaggaacccctagtgatggagttggccactccctctctgcgc4620
gctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgg4680
gcggcctcagtgagcgagcgagcgcgcag4709
<210>64
<211>4871
<212>dna
<213>人工序列
<220>
<223>合成
<400>64
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatccgtgatcctaggtggaggccgaaagtacatgtttcgcatgggaac180
cccagaccctgagtacccagatgactacagccaaggtgggaccaggctggacgggaagaa240
tctggtgcaggaatggctggcgaagcgccagggtgcccggtacgtgtggaaccgcactga300
gctcatgcaggcttccctggacccgtctgtgacccatctcatgggtctctttgagcctgg360
agacatgaaatacgagatccaccgagactccacactggacccctccctgatggagatagg420
cacctattggtcttactgacatccactttgcctttctctccacaggtccatcctgacggg480
tctgttgccaccaacctctgggactgtgctcgttgggggaagggacattgaaaccagcct540
ggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgttccaccacct600
cacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcccaggaggaggc660
ccagctggagatggaagccatgttggaggacacaggcctccaccacaagcggaatgaaga720
ggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattgcctttgtggg780
agatgccaaggtggtgattctggacgaacccacctctggggtggacccttactcgagacg840
ctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatcatgtccactca900
ccacatggacgaggccgacctccttggggaccgcattgccatcattgcccagggaaggct960
ctactgctcaggcaccccactcttcctgaagaactgctttggcacaggcttgtacttaac1020
cttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgaggggacctgcag1080
ctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaactccaga1140
acaagtcctggatggggatgtaaatgagctgatggatgtagttctccaccatgttccaga1200
ggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaaataagaactt1260
caagcacagagcatatgccagccttttcagagagctggaggagacgctggctgaccttgg1320
tctcagcagttttggaatttctgacactcccctggaagagatttttctgaaggtcacgga1380
ggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagagaaaacgtcaa1440
cccccgacacccctgcttgggtcccagagagaaggctggacagacaccccaggactccaa1500
tgtctgctccccaggggcgccggctgctcacccagagggccagcctcccccagagccaga1560
gtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatgtgcaggcgct1620
gctggtcaagagattccaacacaccatccgcagccacaaggacttcctggcgcagatcgt1680
gctcccggctacctttgtgtttttggctctgatgctttctattgttatccctccttttgg1740
cgaataccccgctttgacccttcacccctggatatatgggcagcagtacaccttcttcag1800
catggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcctgaataagcc1860
aggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccctgtggcaactc1920
aacaccctggaagactccttctgtgtccccaaacatcacccagctgttccagaagcagaa1980
atggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaagctcaccat2040
gctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaacacagcgcag2100
cacggaaattctacaagacctgacggacaggaacatctccgacttcttggtaaaaacgta2160
tcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaacagaggtatgg2220
aggaatttccattggaggaaagctcccagtcgtccccatcacgggggaagcacttgttgg2280
gtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatcactagagaggc2340
ctctaaagaaatacctgatttccttaaacatctagaaactgaagacaacattaaggtgtg2400
gtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcccacaacgccat2460
cttacgggccagcctgcctaaggacagaagccccgaggagtatggaatcaccgtcattag2520
ccaacccctgaacctgaccaaggagcagctctcagagattacagtgctgaccacttcagt2580
ggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccagccagctttgt2640
cctttatttgatccaggagcgggtgaacaaatccaagcacctccagtttatcagtggagt2700
gagccccaccacctactgggtaaccaacttcctctgggacatcatgaattattccgtgag2760
tgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctacacttctccaga2820
aaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtcattcccatgat2880
gtacccagcatccttcctgtttgatgtccccagcacagcctatgtggctttatcttgtgc2940
taatctgttcatcggcatcaacagcagtgctattaccttcatcttggaattatttgagaa3000
taaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgtcttccccca3060
cttctgcctgggccggggcctcattgaccttgcactgagccaggctgtgacagatgtcta3120
tgcccggtttggtgaggagcactctgcaaatccgttccactgggacctgattgggaagaa3180
cctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgctggtccagcg3240
ccacttcttcctctcccaatggattgccgagcccactaaggagcccattgttgatgaaga3300
tgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaactgacatctt3360
aaggctacatgaactaaccaagatttatccaggcacctccagcccagcagtggacaggct3420
gtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatggtgccggcaa3480
aacaaccacattcaagatgctcactggggacaccacagtgacctcaggggatgccaccgt3540
agcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatgggctactgtcc3600
tcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttacctttatgcccg3660
gcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtattaagagcct3720
gggcctgactgtctacgccgactgcctggctggcacgtacagtgggggcaacaagcggaa3780
actctccacagccatcgcactcattggctgcccaccgctggtgctgctggatgagcccac3840
cacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgagcatcatcag3900
agaagggagggctgtggtcctcacatcccacagcatggaagaatgtgaggcactgtgtac3960
ccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattcagcatctcaa4020
gtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccgaaggacgacct4080
gcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccaggcagtgtgca4140
gagggagaggcactacaacatgctccagttccaggtctcctcctcctccctggcgaggat4200
cttccagctcctcctctcccacaaggacagcctgctcatcgaggagtactcagtcacaca4260
gaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaagtcatgacct4320
ccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgactacaaagacca4380
tgacggtgattataaagatcatgacatcgactacaaggatgacgatgacaagtgagcggc4440
cgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgc4500
agtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccatta4560
taagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagg4620
gggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgata4680
aggatcttcctagagcatggctacgtagataagtagcatggcgggttaatcattaactac4740
aaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgag4800
gccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgag4860
cgagcgcgcag4871
<210>65
<211>4073
<212>dna
<213>人工序列
<220>
<223>合成
<400>65
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180
aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240
atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300
gctcatgtccaatatgaccgccatgttggcattgattattgactagtgggccccagaagc360
ctggtggttgtttgtccttctcaggggaaaagtgaggcggccccttggaggaaggggccg420
ggcagaatgatctaatcggattccaagcagctcaggggattgtctttttctagcaccttc480
ttgccactcctaagcgtcctccgtgaccccggctgggatttagcctggtgctgtgtcagc540
cccgggctcccaggggcttcccagtggtccccaggaaccctcgacagggccagggcgtct600
ctctcgtccagcaagggcagggacgggccacaggcaagggcgcggccgccatgggcttcg660
tgagacagatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattc720
gctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaagga780
atgccaacccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcag840
caggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaa900
gccccaccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaa960
gggtatatcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggcc1020
gtatttggacagagctacacatcttgtcccaattcatggacaccctccggactcacccgg1080
agagaattgcaggaagaggaattcgaataagggatatcttgaaagatgaagaaacactga1140
cactatttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaact1200
ctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcg1260
cctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaaga1320
cggtgcgctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactc1380
tgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagcc1440
gttctcaaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaa1500
ttcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctca1560
tgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgt1620
gtggctaccccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaata1680
actataaggcctttctggggattgactccacaaggaaggatcctatctattcttatgaca1740
gaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaacca1800
aaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgatt1860
cacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacg1920
ttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgaca1980
acagcacacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttt2040
tgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctaca2100
agggccctcgggaaagccaggctgacgacatggccaacttcgactggagggacatattta2160
acatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggata2220
agtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggagg2280
aaaacatgttctgggccggagtggtattccctgacatgtatccctggaccagctctctac2340
caccccacgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataaga2400
ttaaagacaggtattgggattctggtcccagagctgatcccgtggaagatttccggtaca2460
tctggggcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccagg2520
tgcaggcggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtgg2580
acgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatgga2640
tctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaagg2700
agaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggaca2760
gcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaa2820
tcctacattacagcgacccattcatcctcttcctgttcttgttggctttctccactgcca2880
ccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcct2940
gtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcagg3000
accgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggat3060
ttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaaca3120
tcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgc3180
tccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggag3240
actatggaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtg3300
aagggtgttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaa3360
cggaggatccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccag3420
ggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggc3480
cagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggcc3540
acaatggagctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaagg3600
agaccaatagaaactgggcttgtcgagacagagaagactcttgcgtttctccccgggtgc3660
gcggcgtcggtggtgccggcggggggcgccaggtcgcaggcggtgtagggctccaggcag3720
gcggcgaaggccatgacgtgcgctatgaaggtctgctcctgcacgccgtgaaccaggtgc3780
gcctgcgggccgcgcgcgaacaccgccacgtcctcgcctgcgtgggtctcttcgtccagg3840
ggcactgctgactgctgccgatactcggggctcccgctctcgctctcggtaacatccggc3900
cgggcgccgtccttgagcacatagcctggaccgtttccaattgaggaacccctagtgatg3960
gagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtc4020
gcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag4073
<210>66
<211>4074
<212>dna
<213>人工序列
<220>
<223>合成
<400>66
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180
aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240
atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300
gctcatgtccaatatgaccgccatgttggcattgattattgactagtgggccccagaagc360
ctggtggttgtttgtccttctcaggggaaaagtgaggcggccccttggaggaaggggccg420
ggcagaatgatctaatcggattccaagcagctcaggggattgtctttttctagcaccttc480
ttgccactcctaagcgtcctccgtgaccccggctgggatttagcctggtgctgtgtcagc540
cccgggctcccaggggcttcccagtggtccccaggaaccctcgacagggccagggcgtct600
ctctcgtccagcaagggcagggacgggccacaggcaagggcgcggccgccatgggcttcg660
tgagacagatacagcttttgctctggaagaactggaccctgcggaaaaggcaaaagattc720
gctttgtggtggaactcgtgtggcctttatctttatttctggtcttgatctggttaagga780
atgccaacccgctctacagccatcatgaatgccatttccccaacaaggcgatgccctcag840
caggaatgctgccgtggctccaggggatcttctgcaatgtgaacaatccctgttttcaaa900
gccccaccccaggagaatctcctggaattgtgtcaaactataacaactccatcttggcaa960
gggtatatcgagattttcaagaactcctcatgaatgcaccagagagccagcaccttggcc1020
gtatttggacagagctacacatcttgtcccaattcatggacaccctccggactcacccgg1080
agagaattgcaggaagaggaattcgaataagggatatcttgaaagatgaagaaacactga1140
cactatttctcattaaaaacatcggcctgtctgactcagtggtctaccttctgatcaact1200
ctcaagtccgtccagagcagttcgctcatggagtcccggacctggcgctgaaggacatcg1260
cctgcagcgaggccctcctggagcgcttcatcatcttcagccagagacgcggggcaaaga1320
cggtgcgctatgccctgtgctccctctcccagggcaccctacagtggatagaagacactc1380
tgtatgccaacgtggacttcttcaagctcttccgtgtgcttcccacactcctagacagcc1440
gttctcaaggtatcaatctgagatcttggggaggaatattatctgatatgtcaccaagaa1500
ttcaagagtttatccatcggccgagtatgcaggacttgctgtgggtgaccaggcccctca1560
tgcagaatggtggtccagagacctttacaaagctgatgggcatcctgtctgacctcctgt1620
gtggctaccccgagggaggtggctctcgggtgctctccttcaactggtatgaagacaata1680
actataaggcctttctggggattgactccacaaggaaggatcctatctattcttatgaca1740
gaagaacaacatccttttgtaatgcattgatccagagcctggagtcaaatcctttaacca1800
aaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcctgtacactcctgatt1860
cacctgcagcacgaaggatactgaagaatgccaactcaacttttgaagaactggaacacg1920
ttaggaagttggtcaaagcctgggaagaagtagggccccagatctggtacttctttgaca1980
acagcacacagatgaacatgatcagagataccctggggaacccaacagtaaaagactttt2040
tgaataggcagcttggtgaagaaggtattactgctgaagccatcctaaacttcctctaca2100
agggccctcgggaaagccaggctgacgacatggccaacttcgactggagggacatattta2160
acatcactgatcgcaccctccgccttgtcaatcaatacctggagtgcttggtcctggata2220
agtttgaaagctacaatgatgaaactcagctcacccaacgtgccctctctctactggagg2280
aaaacatgttctgggccggagtggtattccctgacatgtatccctggaccagctctctac2340
caccccacgtgaagtataagatccgaatggacatagacgtggtggagaaaaccaataaga2400
ttaaagacaggtattgggattctggtcccagagctgatcccgtggaagatttccggtaca2460
tctggggcgggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccagg2520
tgcaggcggaggctccagttggaatctacctccagcagatgccctacccctgcttcgtgg2580
acgattctttcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatgga2640
tctactctgtctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaagg2700
agaccttgaaaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggaca2760
gcttctccatcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaa2820
tcctacattacagcgacccattcatcctcttcctgttcttgttggctttctccactgcca2880
ccatcatgctgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcct2940
gtagtggtgtcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcagg3000
accgcatgaccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggat3060
ttggcactgagtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaaca3120
tcgggaacagtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgc3180
tccttgatgctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggag3240
actatggaaccccacttccttggtactttcttctacaagagtcgtattggcttggcggtg3300
aagggtgttcaaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaa3360
cggaggatccagagcacccagaaggaatacacgactccttctttgaacgtgagcatccag3420
ggtgggttcctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggc3480
cagctgtggaccgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggcc3540
acaatggagctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaagg3600
agaccaatagaaactgggcttgtcgagacagagaagactcttgcgtttctcgcagggcag3660
cctctgtcatctccatcagggaggggtccagtgtggagtctcggtggatctcgtatttca3720
tgtctccaggctcaaagagacccatgagatgggtcacagacgggtccagggaagcctgca3780
tgagctcagtgcggttccacacataccgggcaccctggcgcttcgccagccattcctgca3840
ccagattcttcccgtccagcctggtcccaccttggctgtagtcatctgggtactcagggt3900
ctggggttcccatgcgaaacatgtactttcggcctccacaattgaggaacccctagtgat3960
ggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggt4020
cgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag4074
<210>67
<211>4636
<212>dna
<213>人工序列
<220>
<223>合成
<400>67
ctctcccccctgtcgcgttcgctcgctcgctggctcgtttgggggggtggcagctcaaag60
agctgccagacgacggccctctggccgtcgcccccccaaacgagccagcgagcgagcgaa120
cgcgacaggggggagagtgccacactctcaagcaagggggttttgtaagcagtgagctag180
cctgaattccagcacactggcggccgttactagtggatcttcaatattggccattagcca240
tattattcattggttatatagcataaatcaatattggctattggccattgcatacgttgt300
atctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttggc360
attgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccat420
atatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacg480
acccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactt540
tccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaag600
tgtatcatatgccaagtccgccccctattgacgtcaatgacggtaaatggcccgcctggc660
attatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattag720
tcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggt780
ttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggc840
accaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgg900
gcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcaga960
tcactagaagctttattgcggtagtttatcacagttaaattgctaacgcagtcagtgctt1020
ctgacacaacagtctcgaacttaagctgcagaagttggtcgtgaggcactgggcaggtaa1080
gtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgagacaga1140
gaagactcttgcgtttctgataggcacctattggtcttactgacatccactttgcctttc1200
tctccacaggtgtccactcccagttcaattacagctcttaaggctagagtacttaatacg1260
actcactataggctagcctcgagaattcacgcgtggtacctctagagtcgacccgggcgg1320
ccgccatgggcttcgtgagacagatacagcttttgctctggaagaactggaccctgcgga1380
aaaggcaaaagattcgctttgtggtggaactcgtgtggcctttatctttatttctggtct1440
tgatctggttaaggaatgccaacccgctctacagccatcatgaatgccatttccccaaca1500
aggcgatgccctcagcaggaatgctgccgtggctccaggggatcttctgcaatgtgaaca1560
atccctgttttcaaagccccaccccaggagaatctcctggaattgtgtcaaactataaca1620
actccatcttggcaagggtatatcgagattttcaagaactcctcatgaatgcaccagaga1680
gccagcaccttggccgtatttggacagagctacacatcttgtcccaattcatggacaccc1740
tccggactcacccggagagaattgcaggaagaggaattcgaataagggatatcttgaaag1800
atgaagaaacactgacactatttctcattaaaaacatcggcctgtctgactcagtggtct1860
accttctgatcaactctcaagtccgtccagagcagttcgctcatggagtcccggacctgg1920
cgctgaaggacatcgcctgcagcgaggccctcctggagcgcttcatcatcttcagccaga1980
gacgcggggcaaagacggtgcgctatgccctgtgctccctctcccagggcaccctacagt2040
ggatagaagacactctgtatgccaacgtggacttcttcaagctcttccgtgtgcttccca2100
cactcctagacagccgttctcaaggtatcaatctgagatcttggggaggaatattatctg2160
atatgtcaccaagaattcaagagtttatccatcggccgagtatgcaggacttgctgtggg2220
tgaccaggcccctcatgcagaatggtggtccagagacctttacaaagctgatgggcatcc2280
tgtctgacctcctgtgtggctaccccgagggaggtggctctcgggtgctctccttcaact2340
ggtatgaagacaataactataaggcctttctggggattgactccacaaggaaggatccta2400
tctattcttatgacagaagaacaacatccttttgtaatgcattgatccagagcctggagt2460
caaatcctttaaccaaaatcgcttggagggcggcaaagcctttgctgatgggaaaaatcc2520
tgtacactcctgattcacctgcagcacgaaggatactgaagaatgccaactcaacttttg2580
aagaactggaacacgttaggaagttggtcaaagcctgggaagaagtagggccccagatct2640
ggtacttctttgacaacagcacacagatgaacatgatcagagataccctggggaacccaa2700
cagtaaaagactttttgaataggcagcttggtgaagaaggtattactgctgaagccatcc2760
taaacttcctctacaagggccctcgggaaagccaggctgacgacatggccaacttcgact2820
ggagggacatatttaacatcactgatcgcaccctccgccttgtcaatcaatacctggagt2880
gcttggtcctggataagtttgaaagctacaatgatgaaactcagctcacccaacgtgccc2940
tctctctactggaggaaaacatgttctgggccggagtggtattccctgacatgtatccct3000
ggaccagctctctaccaccccacgtgaagtataagatccgaatggacatagacgtggtgg3060
agaaaaccaataagattaaagacaggtattgggactacaaagaccatgacggtgattata3120
aagatcatgacatcgactacaaggatgacgatgacaaggattctggtcccagagctgatc3180
ccgtggaagatttccggtacatctggggcgggtttgcctatctgcaggacatggttgaac3240
aggggatcacaaggagccaggtgcaggcggaggctccagttggaatctacctccagcaga3300
tgccctacccctgcttcgtggacgattctttcatgatcatcctgaaccgctgtttcccta3360
tcttcatggtgctggcatggatctactctgtctccatgactgtgaagagcatcgtcttgg3420
agaaggagttgcgactgaaggagaccttgaaaaatcagggtgtctccaatgcagtgattt3480
ggtgtacctggttcctggacagcttctccatcatgtcgatgagcatcttcctcctgacga3540
tattcatcatgcatggaagaatcctacattacagcgacccattcatcctcttcctgttct3600
tgttggctttctccactgccaccatcatgctgtgctttctgctcagcaccttcttctcca3660
aggccagtctggcagcagcctgtagtggtgtcatctatttcaccctctacctgccacaca3720
tcctgtgcttcgcctggcaggaccgcatgaccgctgagctgaagaaggctgtgagcttac3780
tgtctccggtggcatttggatttggcactgagtacctggttcgctttgaagagcaaggcc3840
tggggctgcagtggagcaacatcgggaacagtcccacggaaggggacgaattcagcttcc3900
tgctgtccatgcagatgatgctccttgatgctgctgtctatggcttactcgcttggtacc3960
ttgatcaggtgtttccaggagactatggaaccccacttccttggtactttcttctacaag4020
agtcgtattggcttggcggtgaagggtgttcaaccagagaagaaagagccctggaaaaga4080
ccgagcccctaacagaggaaacggaggatccagagcacccagaaggaatacacgactcct4140
tctttgaacgtgagcatccagggtgggttcctggggtatgcgtgaagaatctggtaaaga4200
tttttgagccctgtggccggccagctgtggaccgtctgaacatcaccttctacgagaacc4260
agatcaccgcattcctgggccacaatggagctgggaaaaccaccaccttgtaagtatcaa4320
ggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgagacagagaagact4380
cttgcgtttctgggatttttccgatttcggcctattggttaaaaaatgagctgatttaac4440
aaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcatctttc4500
caattgaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctca4560
ctgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtga4620
gcgagcgagcgcgcag4636
<210>68
<211>4731
<212>dna
<213>人工序列
<220>
<223>合成
<400>68
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180
ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240
ctttcgataggcacctattggtcttactgacatccactttgcctttctctccacaggtcc300
atcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacatt360
gaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctg420
ttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcc480
caggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaag540
cggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccatt600
gcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggaccct660
tactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatc720
atgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcc780
cagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggc840
ttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgag900
gggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgac960
ctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccac1020
catgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttcca1080
aataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctg1140
gctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttctg1200
aaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaaga1260
gaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccc1320
caggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctccc1380
ccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcat1440
gtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctg1500
gcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatc1560
cctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtac1620
accttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctc1680
ctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccc1740
tgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttc1800
cagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggag1860
aagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagaga1920
acacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttg1980
gtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaa2040
cagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaa2100
gcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatc2160
actagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaac2220
attaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcc2280
cacaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatc2340
accgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctg2400
accacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtccca2460
gccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagttt2520
atcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaat2580
tattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctac2640
acttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtc2700
attcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggct2760
ttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaa2820
ttatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcatt2880
gtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtg2940
acagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctg3000
attgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctg3060
ctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccatt3120
gttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaa3180
actgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagca3240
gtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaat3300
ggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggg3360
gatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatg3420
ggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttac3480
ctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagt3540
attaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggc3600
aacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctg3660
gatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtg3720
agcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgag3780
gcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccatt3840
cagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccg3900
aaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttccca3960
ggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctcc4020
ctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtac4080
tcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaa4140
agtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgac4200
tacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatgac4260
aagtgagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccac4320
aactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatt4380
tgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtt4440
tcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtgg4500
taaaatcgataaggatcttcctagagcatggctacatctgcagaattcaggctagctcac4560
tgcttacaaaacccccttgcttgagagtgtggcactctcccccctgtcgcgttcgctcgc4620
tcgctggctcgtttgggggggcgacggccagagggccgtcgtctggcagctctttgagct4680
gccacccccccaaacgagccagcgagcgagcgaacgcgacaggggggagag4731
<210>69
<211>4420
<212>dna
<213>人工序列
<220>
<223>合成
<400>69
ctctcccccctgtcgcgttcgctcgctcgctggctcgtttgggggggtggcagctcaaag60
agctgccagacgacggccctctggccgtcgcccccccaaacgagccagcgagcgagcgaa120
cgcgacaggggggagagtgccacactctcaagcaagggggttttgtaagcagtgagctag180
cgtgccacctggtcgacattgattattgactagttattaatagtaatcaattacggggtc240
attagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcc300
tggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagt360
aacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgccca420
cttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacgg480
taaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggca540
gtacatctacgtattagtcatcgctattaccatggtcgaggtgagccccacgttctgctt600
cactctccccatctcccccccctccccacccccaattttgtatttatttattttttaatt660
attttgtgcagcgatgggggcggggcggggcgaggcggagaggtgcggcggcagccaatc720
ggagcggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggctctata780
aaaagcgaagcgcgcggcgggcggctgcagaagttggtcgtgaggcactgggcaggtaag840
tatcaaggttacaagacaggtttaaggagaccaatagaaactgggcttgtcgagacagag900
aagactcttgcgtttctgataggcacctattggtcttactgacatccactttgcctttct960
ctccacaggtgtccaggcggccgccatggtgattcttcagcagggggaccatgtgtggat1020
ggacctgagattggggcaggagttcgacgtgcccatcggggcggtggtgaagctctgcga1080
ctctgggcaggtccaggtggtggatgatgaagacaatgaacactggatctctccgcagaa1140
cgcaacgcacatcaagcctatgcaccccacgtcggtccacggcgtggaggacatgatccg1200
cctgggggacctcaacgaggcgggcatcttgcgcaacctgcttatccgctaccgggacca1260
cctcatctacacgtatacgggctccatcctggtggctgtgaacccctaccagctgctctc1320
catctactcgccagagcacatccgccagtataccaacaagaagattggggagatgccccc1380
ccacatctttgccattgctgacaactgctacttcaacatgaaacgcaacagccgagacca1440
gtgctgcatcatcagtggggaatctggggccgggaagacggagagcacaaagctgatcct1500
gcagttcctggcagccatcagtgggcagcactcgtggattgagcagcaggtcttggaggc1560
cacccccattctggaagcatttgggaatgccaagaccatccgcaatgacaactcaagccg1620
tttcggaaagtacatcgacatccacttcaacaagcggggcgccatcgagggcgcgaagat1680
tgagcagtacctgctggaaaagtcacgtgtctgtcgccaggccctggatgaaaggaacta1740
ccacgtgttctactgcatgctggagggcatgagtgaggatcagaagaagaagctgggctt1800
gggccaggcctctgactacaactacttggccatgggtaactgcataacctgtgagggccg1860
ggtggacagccaggagtacgccaacatccgctccgccatgaaggtgctcatgttcactga1920
caccgagaactgggagatctcgaagctcctggctgccatcctgcacctgggcaacctgca1980
gtatgaggcacgcacatttgaaaacctggatgcctgtgaggttctcttctccccatcgct2040
ggccacagctgcatccctgcttgaggtgaaccccccagacctgatgagctgcctgactag2100
ccgcaccctcatcacccgcggggagacggtgtccaccccactgagcagggaacaggcact2160
ggacgtgcgcgacgccttcgtaaaggggatctacgggcggctgttcgtgtggattgtgga2220
caagatcaacgcagcaatttacaagcctccctcccaggatgtgaagaactctcgcaggtc2280
catcggcctcctggacatctttgggtttgagaactttgctgtgaacagctttgagcagct2340
ctgcatcaacttcgccaatgagcacctgcagcagttctttgtgcggcacgtgttcaagct2400
ggagcaggaggaatatgacctggagagcattgactggctgcacatcgagttcactgacaa2460
ccaggatgccctggacatgattgccaacaagcccatgaacatcatctccctcatcgatga2520
ggagagcaagttccccaagggcacagacaccaccatgttacacaagctgaactcccagca2580
caagctcaacgccaactacatcccccccaagaacaaccatgagacccagtttggcatcaa2640
ccattttgcaggcatcgtctactatgagacccaaggcttcctggagaagaaccgagacac2700
cctgcatggggacattatccagctggtccactcctccaggaacaagttcatcaagcagat2760
cttccaggccgatgtcgccatgggcgccgagaccaggaagcgctcgcccacacttagcag2820
ccagttcaagcggtcactggagctgctgatgcgcacgctgggtgcctgccagcccttctt2880
tgtgcgatgcatcaagcccaatgagttcaagaagcccatgctgttcgaccggcacctgtg2940
cgtgcgccagctgcggtactcaggaatgatggagaccatccgaatccgccgagctggcta3000
ccccatccgctacagcttcgtagagtttgtggagcggtaccgtgtgctgctgccaggtgt3060
gaagccggcctacaagcagggcgacctccgcgggacttgccagcgcatggctgaggctgt3120
gctgggcacccacgatgactggcagataggcaaaaccaagatctttctgaaggaccacca3180
tgacatgctgctggaagtggagcgggacaaagccatcaccgacagagtcatcctccttca3240
gaaagtcatccggggattcaaagacaggtctaactttctgaagctgaagaacgctgccac3300
actgatccagaggcactggcggggtcacaactgtaggaagaactacgggctgatgcgtct3360
gggcttcctgcggctgcaggccctgcaccgctcccggaagctgcaccagcagtaccgcct3420
ggcccgccagcgcatcatccagttccaggcccgctgccgcgcctatctggtgcgcaaggc3480
cttccgccaccgcctctgggctgtgctcaccgtgcaggcctatgcccggggcatgatcgc3540
ccgcaggctgcaccaacgcctcagggctgagtatctgtggcgcctcgaggctgagaaaat3600
gcggctggcggaggaagagaagcttcggaaggagatgagcgccaagaaggccaaggagga3660
ggccgagcgcaagcatcaggagcgcctggcccagctggctcgtgaggacgctgagcggga3720
gctgaaggagaaggaggccgctcggcggaagaaggagctcctggagcagatggaaagggc3780
ccgccatgagcctgtcaatcactcagacatggtggacaagatgtttggcttcctggggac3840
ttcaggtggcctgccaggccaggagggccaggcacctagtggctttgaggacctggagcg3900
agggcggagggagatggtggaggaggacctggatgcagccctgcccctgcctgacgagga3960
tgaggaggacctctctgagtataaatttgccaagttcgcggccacctacttccaggggac4020
aactacgcactcctacacccggcggccactcaaacagccactgctctaccatgacgacga4080
gggtgaccagctggtaagtatcaaggttacaagacaggtttaaggagaccaatagaaact4140
gggcttgtcgagacagagaagactcttgcgtttctgggatttttccgatttcggcctatt4200
ggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgt4260
ttataatttcaggtggcatctttccaattgaggaacccctagtgatggagttggccactc4320
cctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgg4380
gctttgcccgggcggcctcagtgagcgagcgagcgcgcag4420
<210>70
<211>4367
<212>dna
<213>人工序列
<220>
<223>合成
<400>70
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatccgggattttgccgatttcggcctattggttaaaaaatgagctgat180
ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240
ctttcgataggcacctattggtcttactgacatccactttgcctttctctccacaggcag300
ccctggcggtctggatcaccatcctccgcttcatgggggacctccctgagcccaagtacc360
acacagccatgagtgatggcagtgagaagatccctgtgatgaccaagatttatgagaccc420
tgggcaagaagacgtacaagagggagctgcaggccctgcagggcgagggcgaggcccagc480
tccccgagggccagaagaagagcagtgtgaggcacaagctggtgcatttgactctgaaaa540
agaagtccaagctcacagaggaggtgaccaagaggctgcatgacggggagtccacagtgc600
agggcaacagcatgctggaggaccggcccacctccaacctggagaagctgcacttcatca660
tcggcaatggcatcctgcggccagcactccgggacgagatctactgccagatcagcaagc720
agctgacccacaacccctccaagagcagctatgcccggggctggattctcgtgtctctct780
gcgtgggctgtttcgccccctccgagaagtttgtcaagtacctgcggaacttcatccacg840
ggggcccgcccggctacgccccgtactgtgaggagcgcctgagaaggacctttgtcaatg900
ggacacggacacagccgcccagctggctggagctgcaggccaccaagtccaagaagccaa960
tcatgttgcccgtgacattcatggatgggaccaccaagaccctgctgacggactcggcaa1020
ccacggccaaggagctctgcaacgcgctggccgacaagatctctctcaaggaccggttcg1080
ggttctccctctacattgccctgtttgacaaggtgtcctccctgggcagcggcagtgacc1140
acgtcatggacgccatctcccagtgcgagcagtacgccaaggagcagggcgcccaggagc1200
gcaacgccccctggaggctcttcttccgcaaagaggtcttcacgccctggcacagcccct1260
ccgaggacaacgtggccaccaacctcatctaccagcaggtggtgcgaggagtcaagtttg1320
gggagtacaggtgtgagaaggaggacgacctggctgagctggcctcccagcagtactttg1380
tagactatggctctgagatgatcctggagcgcctcctgaacctcgtgcccacctacatcc1440
ccgaccgcgagatcacgcccctgaagacgctggagaagtgggcccagctggccatcgccg1500
cccacaagaaggggatttatgcccagaggagaactgatgcccagaaggtcaaagaggatg1560
tggtcagttatgcccgcttcaagtggcccttgctcttctccaggttttatgaagcctaca1620
aattctcaggccccagtctccccaagaacgacgtcatcgtggccgtcaactggacgggtg1680
tgtactttgtggatgagcaggagcaggtacttctggagctgtccttcccagagatcatgg1740
ccgtgtccagcagcagggagtgccgtgtctggctctcactgggctgctctgatcttggct1800
gtgctgcgcctcactcaggctgggcaggactgaccccggcggggccctgttctccgtgtt1860
ggtcctgcaggggagcgaaaacgacggcccccagcttcacgctggccaccatcaaggggg1920
acgaatacaccttcacctccagtaatgctgaggacattcgtgacctggtggtcaccttcc1980
tagaggggctccggaagagatctaagtatgttgtggccctgcaggataaccccaaccccg2040
caggcgaggagtcaggcttcctcagctttgccaagggagacctcatcatcctggaccatg2100
acacgggcgagcaggtcatgaactcgggctgggccaacggcatcaatgagaggaccaagc2160
agcgtggggacttccccaccgactgtgtgtacgtcatgcccactgtcaccatgccacctc2220
gtgagattgtggccctggtcaccatgactcccgatcagaggcaggacgttgtccggctct2280
tgcagctgcgaacggcggagcccgaggtgcgtgccaagccctacacgctggaggagtttt2340
cctatgactacttcaggcccccacccaagcacacgctgagccgtgtcatggtgtccaagg2400
cccgaggcaaggaccggctgtggagccacacgcgggaaccgctcaagcaggcgctgctca2460
agaagctcctgggcagtgaggagctctcgcaggaggcctgcctggccttcattgctgtgc2520
tcaagtacatgggcgactacccgtccaagaggacacgctccgtcaatgagctcaccgacc2580
agatctttgagggtcccctgaaagccgagcccctgaaggacgaggcatatgtgcagatcc2640
tgaagcagctgaccgacaaccacatcaggtacagcgaggagcggggttgggagctgctct2700
ggctgtgcacgggccttttcccacccagcaacatcctcctgccccacgtgcagcgcttcc2760
tgcagtcccgaaagcactgcccactcgccatcgactgcctgcaacggctccagaaagccc2820
tgagaaacgggtcccggaagtaccctccgcacctggtggaggtggaggccatccagcaca2880
agaccacccagattttccacaaggtctacttccctgatgacactgacgaggccttcgaag2940
tggagtccagcaccaaggccaaggacttctgccagaacatcgccaccaggctgctcctca3000
agtcctcagagggattcagcctctttgtcaaaattgcagacaaggtcatcagcgttcctg3060
agaatgacttcttctttgactttgttcgacacttgacagactggataaagaaagctcggc3120
ccatcaaggacggaattgtgccctcactcacctaccaggtgttcttcatgaagaagctgt3180
ggaccaccacggtgccagggaaggatcccatggccgattccatcttccactattaccagg3240
agttgcccaagtatctccgaggctaccacaagtgcacgcgggaggaggtgctgcagctgg3300
gggcgctgatctacagggtcaagttcgaggaggacaagtcctacttccccagcatcccca3360
agctgctgcgggagctggtgccccaggaccttatccggcaggtctcacctgatgactgga3420
agcggtccatcgtcgcctacttcaacaagcacgcagggaagtccaaggaggaggccaagc3480
tggccttcctgaagctcatcttcaagtggcccacctttggctcagccttcttcgaggtga3540
agcaaactacggagccaaacttccctgagatcctcctaattgccatcaacaagtatgggg3600
tcagcctcatcgatcccaaaacgaaggatatcctcaccactcatcccttcaccaagatct3660
ccaactggagcagcggcaacacctacttccacatcaccattgggaacttggtgcgcggga3720
gcaaactgctctgcgagacgtcactgggctacaagatggatgacctcctgacttcctaca3780
ttagccagatgctcacagccatgagcaaacagcggggctccaggagcggcaagatgtatg3840
atgttcctgattatgctagcctctgaccgcggcctgctgccggctctgcggcctcttccg3900
cgtcttcgagatctgcctcgactgtgccttctagttgccagccatctgttgtttgcccct3960
cccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatg4020
aggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggc4080
aggacagcaagggggaggattgggaagacaatagcaggcatgctggggactcgagcaatt4140
cccgataaggatcttcctagagcatggctacatctgcagaattcaggctagctcactgct4200
tacaaaacccccttgcttgagagtgtggcactctcccccctgtcgcgttcgctcgctcgc4260
tggctcgtttgggggggcgacggccagagggccgtcgtctggcagctctttgagctgcca4320
cccccccaaacgagccagcgagcgagcgaacgcgacaggggggagag4367
<210>71
<211>4738
<212>dna
<213>人工序列
<220>
<223>合成
<400>71
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180
aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240
atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300
gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360
caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420
taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480
atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540
ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600
acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660
ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720
ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780
ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840
gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900
taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960
acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020
gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080
accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140
ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200
acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260
gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320
ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380
tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440
acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500
ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560
aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620
ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680
tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740
gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800
aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860
agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920
tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980
tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040
acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100
atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160
atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220
cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280
gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340
tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400
tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460
cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520
ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580
aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640
acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700
gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760
gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820
ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880
atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940
ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000
ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060
gggactacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacg3120
atgacaaggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcg3180
ggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcgg3240
aggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctt3300
tcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctg3360
tctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttga3420
aaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctcca3480
tcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacatt3540
acagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgc3600
tgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtg3660
tcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatga3720
ccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactg3780
agtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaaca3840
gtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatg3900
ctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaa3960
ccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgtt4020
caaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatc4080
cagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttc4140
ctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtgg4200
accgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggag4260
ctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaata4320
gaaactgggcttgtcgagacagagaagactcttgcgtttctgggatttttccgatttcgg4380
cctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatat4440
taacgtttataatttcaggtggcatctttccaattcgcccttagatctagcctatcctgg4500
attacttgaacgatagcctatcctggattacttgaaaagcttagcctatcctggattact4560
tgaatcacagcctatcctggattacttgaaagatctaagggcgaattgaggaacccctag4620
tgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaa4680
aggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag4738
<210>72
<211>4770
<212>dna
<213>人工序列
<220>
<223>合成
<400>72
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180
aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240
atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300
gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360
caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420
taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480
atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540
ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600
acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660
ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720
ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780
ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840
gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900
taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960
acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020
gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080
accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140
ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200
acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260
gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320
ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380
tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440
acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500
ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560
aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620
ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680
tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740
gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800
aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860
agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920
tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980
tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040
acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100
atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160
atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220
cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280
gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340
tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400
tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460
cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520
ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580
aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640
acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700
gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760
gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820
ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880
atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940
ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000
ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060
gggactacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacg3120
atgacaaggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcg3180
ggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcgg3240
aggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctt3300
tcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctg3360
tctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttga3420
aaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctcca3480
tcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacatt3540
acagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgc3600
tgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtg3660
tcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatga3720
ccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactg3780
agtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaaca3840
gtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatg3900
ctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaa3960
ccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgtt4020
caaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatc4080
cagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttc4140
ctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtgg4200
accgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggag4260
ctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaata4320
gaaactgggcttgtcgagacagagaagactcttgcgtttctgggatttttccgatttcgg4380
cctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatat4440
taacgtttataatttcaggtggcatctttccaattgaggcataggatgacaaagggaacg4500
ataggcataggatgacaaagggaaaagcttaggcataggatgacaaagggaaggtaccag4560
atctggcattcaccgcgtgccttacgatggcattcaccgcgtgccttaaagcttggcatt4620
caccgcgtgccttacaattgaggaacccctagtgatggagttggccactccctctctgcg4680
cgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccg4740
ggcggcctcagtgagcgagcgagcgcgcag4770
<210>73
<211>4656
<212>dna
<213>人工序列
<220>
<223>合成
<400>73
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctct180
aggaagatcttcaatattggccattagccatattattcattggttatatagcataaatca240
atattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattg300
gctcatgtccaatatgaccgccatgttggcattgattattgactagttattaatagtaat360
caattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacgg420
taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt480
atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttac540
ggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattg600
acgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggact660
ttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggtttt720
ggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccacc780
ccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc840
gtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctata900
taagcagagctcgtttagtgaaccgtcagatcactagaagctttattgcggtagtttatc960
acagttaaattgctaacgcagtcagtgcttctgacacaacagtctcgaacttaagctgca1020
gaagttggtcgtgaggcactgggcaggtaagtatcaaggttacaagacaggtttaaggag1080
accaatagaaactgggcttgtcgagacagagaagactcttgcgtttctgataggcaccta1140
ttggtcttactgacatccactttgcctttctctccacaggtgtccactcccagttcaatt1200
acagctcttaaggctagagtacttaatacgactcactataggctagcctcgagaattcac1260
gcgtggtacctctagagtcgacccgggcggccgccatgggcttcgtgagacagatacagc1320
ttttgctctggaagaactggaccctgcggaaaaggcaaaagattcgctttgtggtggaac1380
tcgtgtggcctttatctttatttctggtcttgatctggttaaggaatgccaacccgctct1440
acagccatcatgaatgccatttccccaacaaggcgatgccctcagcaggaatgctgccgt1500
ggctccaggggatcttctgcaatgtgaacaatccctgttttcaaagccccaccccaggag1560
aatctcctggaattgtgtcaaactataacaactccatcttggcaagggtatatcgagatt1620
ttcaagaactcctcatgaatgcaccagagagccagcaccttggccgtatttggacagagc1680
tacacatcttgtcccaattcatggacaccctccggactcacccggagagaattgcaggaa1740
gaggaattcgaataagggatatcttgaaagatgaagaaacactgacactatttctcatta1800
aaaacatcggcctgtctgactcagtggtctaccttctgatcaactctcaagtccgtccag1860
agcagttcgctcatggagtcccggacctggcgctgaaggacatcgcctgcagcgaggccc1920
tcctggagcgcttcatcatcttcagccagagacgcggggcaaagacggtgcgctatgccc1980
tgtgctccctctcccagggcaccctacagtggatagaagacactctgtatgccaacgtgg2040
acttcttcaagctcttccgtgtgcttcccacactcctagacagccgttctcaaggtatca2100
atctgagatcttggggaggaatattatctgatatgtcaccaagaattcaagagtttatcc2160
atcggccgagtatgcaggacttgctgtgggtgaccaggcccctcatgcagaatggtggtc2220
cagagacctttacaaagctgatgggcatcctgtctgacctcctgtgtggctaccccgagg2280
gaggtggctctcgggtgctctccttcaactggtatgaagacaataactataaggcctttc2340
tggggattgactccacaaggaaggatcctatctattcttatgacagaagaacaacatcct2400
tttgtaatgcattgatccagagcctggagtcaaatcctttaaccaaaatcgcttggaggg2460
cggcaaagcctttgctgatgggaaaaatcctgtacactcctgattcacctgcagcacgaa2520
ggatactgaagaatgccaactcaacttttgaagaactggaacacgttaggaagttggtca2580
aagcctgggaagaagtagggccccagatctggtacttctttgacaacagcacacagatga2640
acatgatcagagataccctggggaacccaacagtaaaagactttttgaataggcagcttg2700
gtgaagaaggtattactgctgaagccatcctaaacttcctctacaagggccctcgggaaa2760
gccaggctgacgacatggccaacttcgactggagggacatatttaacatcactgatcgca2820
ccctccgccttgtcaatcaatacctggagtgcttggtcctggataagtttgaaagctaca2880
atgatgaaactcagctcacccaacgtgccctctctctactggaggaaaacatgttctggg2940
ccggagtggtattccctgacatgtatccctggaccagctctctaccaccccacgtgaagt3000
ataagatccgaatggacatagacgtggtggagaaaaccaataagattaaagacaggtatt3060
gggactacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacg3120
atgacaaggattctggtcccagagctgatcccgtggaagatttccggtacatctggggcg3180
ggtttgcctatctgcaggacatggttgaacaggggatcacaaggagccaggtgcaggcgg3240
aggctccagttggaatctacctccagcagatgccctacccctgcttcgtggacgattctt3300
tcatgatcatcctgaaccgctgtttccctatcttcatggtgctggcatggatctactctg3360
tctccatgactgtgaagagcatcgtcttggagaaggagttgcgactgaaggagaccttga3420
aaaatcagggtgtctccaatgcagtgatttggtgtacctggttcctggacagcttctcca3480
tcatgtcgatgagcatcttcctcctgacgatattcatcatgcatggaagaatcctacatt3540
acagcgacccattcatcctcttcctgttcttgttggctttctccactgccaccatcatgc3600
tgtgctttctgctcagcaccttcttctccaaggccagtctggcagcagcctgtagtggtg3660
tcatctatttcaccctctacctgccacacatcctgtgcttcgcctggcaggaccgcatga3720
ccgctgagctgaagaaggctgtgagcttactgtctccggtggcatttggatttggcactg3780
agtacctggttcgctttgaagagcaaggcctggggctgcagtggagcaacatcgggaaca3840
gtcccacggaaggggacgaattcagcttcctgctgtccatgcagatgatgctccttgatg3900
ctgctgtctatggcttactcgcttggtaccttgatcaggtgtttccaggagactatggaa3960
ccccacttccttggtactttcttctacaagagtcgtattggcttggcggtgaagggtgtt4020
caaccagagaagaaagagccctggaaaagaccgagcccctaacagaggaaacggaggatc4080
cagagcacccagaaggaatacacgactccttctttgaacgtgagcatccagggtgggttc4140
ctggggtatgcgtgaagaatctggtaaagatttttgagccctgtggccggccagctgtgg4200
accgtctgaacatcaccttctacgagaaccagatcaccgcattcctgggccacaatggag4260
ctgggaaaaccaccaccttgtaagtatcaaggttacaagacaggtttaaggagaccaata4320
gaaactgggcttgtcgagacagagaagactcttgcgtttctgggatttttccgatttcgg4380
cctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatat4440
taacgtttataatttcaggtggcatctttcccgcctgcaagaactggttcagcagcctga4500
gccacttcgtgatccacctgcaattgaggaacccctagtgatggagttggccactccctc4560
tctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctt4620
tgcccgggcggcctcagtgagcgagcgagcgcgcag4656
<210>74
<211>4719
<212>dna
<213>人工序列
<220>
<223>合成
<400>74
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180
ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240
ctttcaagctttgaatgaatgagataggcacctattggtcttactgacatccactttgcc300
tttctctccacaggtccatcctgacgggtctgttgccaccaacctctgggactgtgctcg360
ttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttggcatgtgtc420
cacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgttctatgccc480
agctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgttggaggaca540
caggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggcatgcagagaa600
agctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctggacgaaccca660
cctctggggtggacccttactcgagacgctcaatctgggatctgctcctgaagtatcgct720
caggcagaaccatcatcatgtccactcaccacatggacgaggccgacctccttggggacc780
gcattgccatcattgcccagggaaggctctactgctcaggcaccccactcttcctgaaga840
actgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaacatccagagcc900
aaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccacgtgtc960
cagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatgagctga1020
tggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtcaagaac1080
ttatcttccttcttccaaataagaacttcaagcacagagcatatgccagccttttcagag1140
agctggaggagacgctggctgaccttggtctcagcagttttggaatttctgacactcccc1200
tggaagagatttttctgaaggtcacggaggattctgattcaggacctctgtttgcgggtg1260
gcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgggtcccagagaga1320
aggctggacagacaccccaggactccaatgtctgctccccaggggcgccggctgctcacc1380
cagagggccagcctcccccagagccagagtgcccaggcccgcagctcaacacggggacac1440
agctggtcctccagcatgtgcaggcgctgctggtcaagagattccaacacaccatccgca1500
gccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgtttttggctctga1560
tgctttctattgttatccctccttttggcgaataccccgctttgacccttcacccctgga1620
tatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtgagcagttcacgg1680
tacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcctgaaggaagggt1740
ggcttccggagtacccctgtggcaactcaacaccctggaagactccttctgtgtccccaa1800
acatcacccagctgttccagaagcagaaatggacacaggtcaacccttcaccatcctgca1860
ggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagggtgccgggggcc1920
tcccgcccccccagagaacacagcgcagcacggaaattctacaagacctgacggacagga1980
acatctccgacttcttggtaaaaacgtatcctgctcttataagaagcagcttaaagagca2040
aattctgggtcaatgaacagaggtatggaggaatttccattggaggaaagctcccagtcg2100
tccccatcacgggggaagcacttgttgggtttttaagcgaccttggccggatcatgaatg2160
tgagcgggggccctatcactagagaggcctctaaagaaatacctgatttccttaaacatc2220
tagaaactgaagacaacattaaggtgtggtttaataacaaaggctggcatgccctggtca2280
gctttctcaatgtggcccacaacgccatcttacgggccagcctgcctaaggacagaagcc2340
ccgaggagtatggaatcaccgtcattagccaacccctgaacctgaccaaggagcagctct2400
cagagattacagtgctgaccacttcagtggatgctgtggttgccatctgcgtgattttct2460
ccatgtccttcgtcccagccagctttgtcctttatttgatccaggagcgggtgaacaaat2520
ccaagcacctccagtttatcagtggagtgagccccaccacctactgggtaaccaacttcc2580
tctgggacatcatgaattattccgtgagtgctgggctggtggtgggcatcttcatcgggt2640
ttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtggcactgctcctgc2700
tgtatggatgggcggtcattcccatgatgtacccagcatccttcctgtttgatgtcccca2760
gcacagcctatgtggctttatcttgtgctaatctgttcatcggcatcaacagcagtgcta2820
ttaccttcatcttggaattatttgagaataaccggacgctgctcaggttcaacgccgtgc2880
tgaggaagctgctcattgtcttcccccacttctgcctgggccggggcctcattgaccttg2940
cactgagccaggctgtgacagatgtctatgcccggtttggtgaggagcactctgcaaatc3000
cgttccactgggacctgattgggaagaacctgtttgccatggtggtggaaggggtggtgt3060
acttcctcctgaccctgctggtccagcgccacttcttcctctcccaatggattgccgagc3120
ccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaagacaaagaatta3180
ttactggtggaaataaaactgacatcttaaggctacatgaactaaccaagatttatccag3240
gcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctggagagtgctttg3300
gcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgctcactggggaca3360
ccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaaccaatatttctg3420
aagtccatcaaaatatgggctactgtcctcagtttgatgcaatcgatgagctgctcacag3480
gacgagaacatctttacctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaa3540
aggttgcaaactggagtattaagagcctgggcctgactgtctacgccgactgcctggctg3600
gcacgtacagtgggggcaacaagcggaaactctccacagccatcgcactcattggctgcc3660
caccgctggtgctgctggatgagcccaccacagggatggacccccaggcacgccgcatgc3720
tgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcctcacatcccaca3780
gcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaaagggcgcctttc3840
gatgtatgggcaccattcagcatctcaagtccaaatttggagatggctatatcgtcacaa3900
tgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctgtggagcagttct3960
tccaggggaacttcccaggcagtgtgcagagggagaggcactacaacatgctccagttcc4020
aggtctcctcctcctccctggcgaggatcttccagctcctcctctcccacaaggacagcc4080
tgctcatcgaggagtactcagtcacacagaccacactggaccaggtgtttgtaaattttg4140
ctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctgctggagccagtc4200
gacaagcccaggacgactacaaagaccatgacggtgattataaagatcatgacatcgact4260
acaaggatgacgatgacaagtgagcggccgcttcgagcagacatgataagatacattgat4320
gagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgt4380
gatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaat4440
tgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaa4500
aacctctacaaatgtggtaaaatcgataaggatcttcctagagcatggctacgtagataa4560
gtagcatggcgggttaatcattaactacaaggaacccctagtgatggagttggccactcc4620
ctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccggg4680
ctttgcccgggcggcctcagtgagcgagcgagcgcgcag4719
<210>75
<211>4758
<212>dna
<213>人工序列
<220>
<223>合成
<400>75
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180
ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240
ctttcaagcttatgcacagctggaacttcaagctgtacgtcatgggcagcggcggggtac300
cgataggcacctattggtcttactgacatccactttgcctttctctccacaggtccatcc360
tgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggacattgaaa420
ccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcctgttcc480
accacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagtcccagg540
aggaggcccagctggagatggaagccatgttggaggacacaggcctccaccacaagcgga600
atgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgccattgcct660
ttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggacccttact720
cgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatcatcatgt780
ccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattgcccagg840
gaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacaggcttgt900
acttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtgagggga960
cctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatgacctaa1020
ctccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctccaccatg1080
ttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttccaaata1140
agaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgctggctg1200
accttggtctcagcagttttggaatttctgacactcccctggaagagatttttctgaagg1260
tcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaagagaaa1320
acgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacaccccagg1380
actccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctcccccag1440
agccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagcatgtgc1500
aggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcctggcgc1560
agatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgttatccctc1620
cttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagtacacct1680
tcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcctcctga1740
ataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacccctgtg1800
gcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgttccaga1860
agcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccagggagaagc1920
tcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccagagaacac1980
agcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttcttggtaa2040
aaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatgaacaga2100
ggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacgggggaagcac2160
ttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggccctatcacta2220
gagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagacaacatta2280
aggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtggcccaca2340
acgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaatcaccg2400
tcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgctgacca2460
cttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcccagcca2520
gctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagtttatca2580
gtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatgaattatt2640
ccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcctacactt2700
ctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcggtcattc2760
ccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtggctttat2820
cttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttggaattat2880
ttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctcattgtct2940
tcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctgtgacag3000
atgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacctgattg3060
ggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccctgctgg3120
tccagcgccacttcttcctctcccaatggattgccgagcccactaaggagcccattgttg3180
atgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaataaaactg3240
acatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccagcagtgg3300
acaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtgaatggtg3360
ccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcaggggatg3420
ccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaatatgggct3480
actgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatctttaccttt3540
atgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactggagtatta3600
agagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggggcaaca3660
agcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgctggatg3720
agcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcgtgagca3780
tcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtgaggcac3840
tgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcaccattcagc3900
atctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccccgaagg3960
acgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcccaggca4020
gtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcctccctgg4080
cgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagtactcag4140
tcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactgaaagtc4200
atgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacgactaca4260
aagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatgacaagt4320
gagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaact4380
agaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgta4440
accattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcag4500
gttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaa4560
atcgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaatcat4620
taactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgct4680
cactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagt4740
gagcgagcgagcgcgcag4758
<210>76
<211>4844
<212>dna
<213>人工序列
<220>
<223>合成
<400>76
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180
ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240
ctttcaagcttatgcacagctggaacttcaagctgtacgtcatgggcagcggcggggtac300
catgcacagctggaacttcaagctgtacgtcatgggcagcggcggatgcacagctggaac360
ttcaagctgtacgtcatgggcagcggcgataggcacctattggtcttactgacatccact420
ttgcctttctctccacaggtccatcctgacgggtctgttgccaccaacctctgggactgt480
gctcgttgggggaagggacattgaaaccagcctggatgcagtccggcagagccttggcat540
gtgtccacagcacaacatcctgttccaccacctcacggtggctgagcacatgctgttcta600
tgcccagctgaaaggaaagtcccaggaggaggcccagctggagatggaagccatgttgga660
ggacacaggcctccaccacaagcggaatgaagaggctcaggacctatcaggtggcatgca720
gagaaagctgtcggttgccattgcctttgtgggagatgccaaggtggtgattctggacga780
acccacctctggggtggacccttactcgagacgctcaatctgggatctgctcctgaagta840
tcgctcaggcagaaccatcatcatgtccactcaccacatggacgaggccgacctccttgg900
ggaccgcattgccatcattgcccagggaaggctctactgctcaggcaccccactcttcct960
gaagaactgctttggcacaggcttgtacttaaccttggtgcgcaagatgaaaaacatcca1020
gagccaaaggaaaggcagtgaggggacctgcagctgctcgtctaagggtttctccaccac1080
gtgtccagcccacgtcgatgacctaactccagaacaagtcctggatggggatgtaaatga1140
gctgatggatgtagttctccaccatgttccagaggcaaagctggtggagtgcattggtca1200
agaacttatcttccttcttccaaataagaacttcaagcacagagcatatgccagcctttt1260
cagagagctggaggagacgctggctgaccttggtctcagcagttttggaatttctgacac1320
tcccctggaagagatttttctgaaggtcacggaggattctgattcaggacctctgtttgc1380
gggtggcgctcagcagaaaagagaaaacgtcaacccccgacacccctgcttgggtcccag1440
agagaaggctggacagacaccccaggactccaatgtctgctccccaggggcgccggctgc1500
tcacccagagggccagcctcccccagagccagagtgcccaggcccgcagctcaacacggg1560
gacacagctggtcctccagcatgtgcaggcgctgctggtcaagagattccaacacaccat1620
ccgcagccacaaggacttcctggcgcagatcgtgctcccggctacctttgtgtttttggc1680
tctgatgctttctattgttatccctccttttggcgaataccccgctttgacccttcaccc1740
ctggatatatgggcagcagtacaccttcttcagcatggatgaaccaggcagtgagcagtt1800
cacggtacttgcagacgtcctcctgaataagccaggctttggcaaccgctgcctgaagga1860
agggtggcttccggagtacccctgtggcaactcaacaccctggaagactccttctgtgtc1920
cccaaacatcacccagctgttccagaagcagaaatggacacaggtcaacccttcaccatc1980
ctgcaggtgcagcaccagggagaagctcaccatgctgccagagtgccccgagggtgccgg2040
gggcctcccgcccccccagagaacacagcgcagcacggaaattctacaagacctgacgga2100
caggaacatctccgacttcttggtaaaaacgtatcctgctcttataagaagcagcttaaa2160
gagcaaattctgggtcaatgaacagaggtatggaggaatttccattggaggaaagctccc2220
agtcgtccccatcacgggggaagcacttgttgggtttttaagcgaccttggccggatcat2280
gaatgtgagcgggggccctatcactagagaggcctctaaagaaatacctgatttccttaa2340
acatctagaaactgaagacaacattaaggtgtggtttaataacaaaggctggcatgccct2400
ggtcagctttctcaatgtggcccacaacgccatcttacgggccagcctgcctaaggacag2460
aagccccgaggagtatggaatcaccgtcattagccaacccctgaacctgaccaaggagca2520
gctctcagagattacagtgctgaccacttcagtggatgctgtggttgccatctgcgtgat2580
tttctccatgtccttcgtcccagccagctttgtcctttatttgatccaggagcgggtgaa2640
caaatccaagcacctccagtttatcagtggagtgagccccaccacctactgggtaaccaa2700
cttcctctgggacatcatgaattattccgtgagtgctgggctggtggtgggcatcttcat2760
cgggtttcagaagaaagcctacacttctccagaaaaccttcctgcccttgtggcactgct2820
cctgctgtatggatgggcggtcattcccatgatgtacccagcatccttcctgtttgatgt2880
ccccagcacagcctatgtggctttatcttgtgctaatctgttcatcggcatcaacagcag2940
tgctattaccttcatcttggaattatttgagaataaccggacgctgctcaggttcaacgc3000
cgtgctgaggaagctgctcattgtcttcccccacttctgcctgggccggggcctcattga3060
ccttgcactgagccaggctgtgacagatgtctatgcccggtttggtgaggagcactctgc3120
aaatccgttccactgggacctgattgggaagaacctgtttgccatggtggtggaaggggt3180
ggtgtacttcctcctgaccctgctggtccagcgccacttcttcctctcccaatggattgc3240
cgagcccactaaggagcccattgttgatgaagatgatgatgtggctgaagaaagacaaag3300
aattattactggtggaaataaaactgacatcttaaggctacatgaactaaccaagattta3360
tccaggcacctccagcccagcagtggacaggctgtgtgtcggagttcgccctggagagtg3420
ctttggcctcctgggagtgaatggtgccggcaaaacaaccacattcaagatgctcactgg3480
ggacaccacagtgacctcaggggatgccaccgtagcaggcaagagtattttaaccaatat3540
ttctgaagtccatcaaaatatgggctactgtcctcagtttgatgcaatcgatgagctgct3600
cacaggacgagaacatctttacctttatgcccggcttcgaggtgtaccagcagaagaaat3660
cgaaaaggttgcaaactggagtattaagagcctgggcctgactgtctacgccgactgcct3720
ggctggcacgtacagtgggggcaacaagcggaaactctccacagccatcgcactcattgg3780
ctgcccaccgctggtgctgctggatgagcccaccacagggatggacccccaggcacgccg3840
catgctgtggaacgtcatcgtgagcatcatcagagaagggagggctgtggtcctcacatc3900
ccacagcatggaagaatgtgaggcactgtgtacccggctggccatcatggtaaagggcgc3960
ctttcgatgtatgggcaccattcagcatctcaagtccaaatttggagatggctatatcgt4020
cacaatgaagatcaaatccccgaaggacgacctgcttcctgacctgaaccctgtggagca4080
gttcttccaggggaacttcccaggcagtgtgcagagggagaggcactacaacatgctcca4140
gttccaggtctcctcctcctccctggcgaggatcttccagctcctcctctcccacaagga4200
cagcctgctcatcgaggagtactcagtcacacagaccacactggaccaggtgtttgtaaa4260
ttttgctaaacagcagactgaaagtcatgacctccctctgcaccctcgagctgctggagc4320
cagtcgacaagcccaggacgactacaaagaccatgacggtgattataaagatcatgacat4380
cgactacaaggatgacgatgacaagtgagcggccgcttcgagcagacatgataagataca4440
ttgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaa4500
tttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaaca4560
acaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagca4620
agtaaaacctctacaaatgtggtaaaatcgataaggatcttcctagagcatggctacgta4680
gataagtagcatggcgggttaatcattaactacaaggaacccctagtgatggagttggcc4740
actccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgc4800
ccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag4844
<210>77
<211>4944
<212>dna
<213>人工序列
<220>
<223>合成
<400>77
ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60
ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120
aggggttcctggatccgggatttttccgatttcggcctattggttaaaaaatgagctgat180
ttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcat240
ctttcaagcttatgcagatcttcgtgaagactctgactggtaagaccatcaccctcgagg300
tggagcccagtgacaccatcgagaatgtcaaggcaaagatccaagataaggaaggcattc360
ctcctgatcagcagaggttgatctttgccggaaaacagctggaagatggtcgtaccctgt420
ctgactacaacatccagaaagagtccaccttgcacctggtactccgtctcagaggtgggc480
gaagcttgataggcacctattggtcttactgacatccactttgcctttctctccacaggt540
ccatcctgacgggtctgttgccaccaacctctgggactgtgctcgttgggggaagggaca600
ttgaaaccagcctggatgcagtccggcagagccttggcatgtgtccacagcacaacatcc660
tgttccaccacctcacggtggctgagcacatgctgttctatgcccagctgaaaggaaagt720
cccaggaggaggcccagctggagatggaagccatgttggaggacacaggcctccaccaca780
agcggaatgaagaggctcaggacctatcaggtggcatgcagagaaagctgtcggttgcca840
ttgcctttgtgggagatgccaaggtggtgattctggacgaacccacctctggggtggacc900
cttactcgagacgctcaatctgggatctgctcctgaagtatcgctcaggcagaaccatca960
tcatgtccactcaccacatggacgaggccgacctccttggggaccgcattgccatcattg1020
cccagggaaggctctactgctcaggcaccccactcttcctgaagaactgctttggcacag1080
gcttgtacttaaccttggtgcgcaagatgaaaaacatccagagccaaaggaaaggcagtg1140
aggggacctgcagctgctcgtctaagggtttctccaccacgtgtccagcccacgtcgatg1200
acctaactccagaacaagtcctggatggggatgtaaatgagctgatggatgtagttctcc1260
accatgttccagaggcaaagctggtggagtgcattggtcaagaacttatcttccttcttc1320
caaataagaacttcaagcacagagcatatgccagccttttcagagagctggaggagacgc1380
tggctgaccttggtctcagcagttttggaatttctgacactcccctggaagagatttttc1440
tgaaggtcacggaggattctgattcaggacctctgtttgcgggtggcgctcagcagaaaa1500
gagaaaacgtcaacccccgacacccctgcttgggtcccagagagaaggctggacagacac1560
cccaggactccaatgtctgctccccaggggcgccggctgctcacccagagggccagcctc1620
ccccagagccagagtgcccaggcccgcagctcaacacggggacacagctggtcctccagc1680
atgtgcaggcgctgctggtcaagagattccaacacaccatccgcagccacaaggacttcc1740
tggcgcagatcgtgctcccggctacctttgtgtttttggctctgatgctttctattgtta1800
tccctccttttggcgaataccccgctttgacccttcacccctggatatatgggcagcagt1860
acaccttcttcagcatggatgaaccaggcagtgagcagttcacggtacttgcagacgtcc1920
tcctgaataagccaggctttggcaaccgctgcctgaaggaagggtggcttccggagtacc1980
cctgtggcaactcaacaccctggaagactccttctgtgtccccaaacatcacccagctgt2040
tccagaagcagaaatggacacaggtcaacccttcaccatcctgcaggtgcagcaccaggg2100
agaagctcaccatgctgccagagtgccccgagggtgccgggggcctcccgcccccccaga2160
gaacacagcgcagcacggaaattctacaagacctgacggacaggaacatctccgacttct2220
tggtaaaaacgtatcctgctcttataagaagcagcttaaagagcaaattctgggtcaatg2280
aacagaggtatggaggaatttccattggaggaaagctcccagtcgtccccatcacggggg2340
aagcacttgttgggtttttaagcgaccttggccggatcatgaatgtgagcgggggcccta2400
tcactagagaggcctctaaagaaatacctgatttccttaaacatctagaaactgaagaca2460
acattaaggtgtggtttaataacaaaggctggcatgccctggtcagctttctcaatgtgg2520
cccacaacgccatcttacgggccagcctgcctaaggacagaagccccgaggagtatggaa2580
tcaccgtcattagccaacccctgaacctgaccaaggagcagctctcagagattacagtgc2640
tgaccacttcagtggatgctgtggttgccatctgcgtgattttctccatgtccttcgtcc2700
cagccagctttgtcctttatttgatccaggagcgggtgaacaaatccaagcacctccagt2760
ttatcagtggagtgagccccaccacctactgggtaaccaacttcctctgggacatcatga2820
attattccgtgagtgctgggctggtggtgggcatcttcatcgggtttcagaagaaagcct2880
acacttctccagaaaaccttcctgcccttgtggcactgctcctgctgtatggatgggcgg2940
tcattcccatgatgtacccagcatccttcctgtttgatgtccccagcacagcctatgtgg3000
ctttatcttgtgctaatctgttcatcggcatcaacagcagtgctattaccttcatcttgg3060
aattatttgagaataaccggacgctgctcaggttcaacgccgtgctgaggaagctgctca3120
ttgtcttcccccacttctgcctgggccggggcctcattgaccttgcactgagccaggctg3180
tgacagatgtctatgcccggtttggtgaggagcactctgcaaatccgttccactgggacc3240
tgattgggaagaacctgtttgccatggtggtggaaggggtggtgtacttcctcctgaccc3300
tgctggtccagcgccacttcttcctctcccaatggattgccgagcccactaaggagccca3360
ttgttgatgaagatgatgatgtggctgaagaaagacaaagaattattactggtggaaata3420
aaactgacatcttaaggctacatgaactaaccaagatttatccaggcacctccagcccag3480
cagtggacaggctgtgtgtcggagttcgccctggagagtgctttggcctcctgggagtga3540
atggtgccggcaaaacaaccacattcaagatgctcactggggacaccacagtgacctcag3600
gggatgccaccgtagcaggcaagagtattttaaccaatatttctgaagtccatcaaaata3660
tgggctactgtcctcagtttgatgcaatcgatgagctgctcacaggacgagaacatcttt3720
acctttatgcccggcttcgaggtgtaccagcagaagaaatcgaaaaggttgcaaactgga3780
gtattaagagcctgggcctgactgtctacgccgactgcctggctggcacgtacagtgggg3840
gcaacaagcggaaactctccacagccatcgcactcattggctgcccaccgctggtgctgc3900
tggatgagcccaccacagggatggacccccaggcacgccgcatgctgtggaacgtcatcg3960
tgagcatcatcagagaagggagggctgtggtcctcacatcccacagcatggaagaatgtg4020
aggcactgtgtacccggctggccatcatggtaaagggcgcctttcgatgtatgggcacca4080
ttcagcatctcaagtccaaatttggagatggctatatcgtcacaatgaagatcaaatccc4140
cgaaggacgacctgcttcctgacctgaaccctgtggagcagttcttccaggggaacttcc4200
caggcagtgtgcagagggagaggcactacaacatgctccagttccaggtctcctcctcct4260
ccctggcgaggatcttccagctcctcctctcccacaaggacagcctgctcatcgaggagt4320
actcagtcacacagaccacactggaccaggtgtttgtaaattttgctaaacagcagactg4380
aaagtcatgacctccctctgcaccctcgagctgctggagccagtcgacaagcccaggacg4440
actacaaagaccatgacggtgattataaagatcatgacatcgactacaaggatgacgatg4500
acaagtgagcggccgcttcgagcagacatgataagatacattgatgagtttggacaaacc4560
acaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgcttta4620
tttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatg4680
tttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgt4740
ggtaaaatcgataaggatcttcctagagcatggctacgtagataagtagcatggcgggtt4800
aatcattaactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcg4860
ctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggc4920
ctcagtgagcgagcgagcgcgcag4944
<210>78
<211>228
<212>dna
<213>人工序列
<220>
<223>合成
<400>78
atgcagatcttcgtgaagactctgactggtaagaccatcaccctcgaggtggagcccagt60
gacaccatcgagaatgtcaaggcaaagatccaagataaggaaggcattcctcctgatcag120
cagaggttgatctttgccggaaaacagctggaagatggtcgtaccctgtctgactacaac180
atccagaaagagtccaccttgcacctggtactccgtctcagaggtggg228