本发明涉及基因组序列的修饰方法,及其使用的核酸碱基转变酶和核酸序列识别模块的复合体,其不伴随dna的双链切割(无切割或者单链切割),而能够进行单子叶植物基因组的特定区域内的核酸碱基的修饰。
背景技术:
单子叶植物是指在被子植物中的一组具有1枚子叶的植物,水稻、小麦、玉米这三大谷物分类于该组。因此,虽然以前对单子叶植物的分子育种进行了热烈的研究,但由于单子叶植物不是农杆菌的宿主,因此作为植物的转化法无法长期利用最一般的农杆菌法,而使用了直接导入法。到了1990年代中旬,从报告了通过使细胞分裂旺盛的细胞感染农杆菌,由此可有效地使水稻转化以来,基于基因导入进行的单子叶植物的分子育种有了大幅进步。
另一方面,近年来,作为在各种生物种类中修饰目标的基因、基因组区域的技术,基因组编辑受到了关注。目前,作为基因组编辑的方法,提出了利用由具有非序列依赖性的dna切割能力的分子、与具有序列识别能力的分子组合而成的人工核酸酶的方法(非专利文献1)。
例如,使用由锌指dna结合结构域与非特异性dna切割结构域连接而成的锌指核酸酶(zfn),来进行在宿主的植物细胞或昆虫细胞中的dna中的、在目标基因座(genelocus)位置的重组的方法(专利文献1),使用由dna核酸内切酶和转录激活子样(tal)效应子(其为植物病原菌黄单胞菌属所具有的dna结合模块)连接而成的talen,在特定的核苷酸序列内或与其相邻的位点中切割、修饰靶基因的方法(专利文献2),或者,已报告了利用crispr-cas9系统的方法,crispr-cas9系统由(在真细菌、古细菌所具有的获得性免疫系统中起作用的)dna序列crispr(clusteredregularlyinterspacedshortpalindromicrepeats)和与crispr一起具有重要作用的核酸酶cas(crispr-associated)蛋白家族所组合而成(专利文献3)等。另外,最近报告了cpf1作为crispr-cas系统的新的核酸内切酶(非专利文献2)。进一步,也有报告了使用由核酸酶和ppr蛋白质所连接而成的人工核酸酶,其中,所述ppr蛋白质被构成为利用ppr基序(ppr基序可识别包括35个氨基酸的1个核酸碱基)的连续来识别特定的核苷酸序列的方式,从而在该特定序列的附近切割靶基因的方法(专利文献4)。
但是,这些基因组编辑技术基本上以基于核酸酶的dna双链切割(double-strandeddnabreaks:dsb)为前提,但存在这样的课题:由于dsb伴随了意想不到的基因组修饰,因此存在强细胞毒性、染色体的重排等副作用,细胞存活数极其少,根据细胞种类不同,本来就难以进行基因修饰。
对于上述课题,本发明人报告了:使用了催化脱氨基反应的脱氨酶,通过将其与具有dna序列识别能力的分子连接而成的复合体导入宿主细胞,成功地在包括酵母、大肠杆菌的各种生物种类中,不伴随dsb,而在包含特定的dna序列的区域中进行了基于核酸碱基转变的基因组序列的修饰(专利文献5)。
但是,在如单子叶植物这样的高等植物中使用该方法的情况下,为了进一步提高导入突变效率,期望将待导入的分子复合体的构成、导入后的植物细胞的培养条件等进行进一步优化。另外,在酵母、原核生物中,如从脱氨酶的使用所预测的那样,突变方式主要为碱基取代,而插入/缺失突变的频率较低,因此,需要开发可有效地导入不同方式的突变的技术。
现有技术文献
专利文献
专利文献1:日本专利第4968498号公报
专利文献2:日本特表2013-513389号公报
专利文献3:日本特表2010-519929号公报
专利文献4:日本特开2013-128413号公报
专利文献5:国际公开第2015/133554号
非专利文献
非专利文献1:kelvinmesvelt,harrishwang(2013)genome-scaleengineeringforsystemsandsyntheticbiology,molecularsystemsbiology9:641
非专利文献2:berndzetscheetal.(2015)cpf1isasinglerna-guidedendonucleaseofaclass2crispr-cassystem,cell163:759-771
技术实现要素:
发明要解决的问题
因此,本发明的第1目的在于提供新型基因组编辑的方法、以及用于此目的的核酸碱基转变酶和经进一步优化的核酸序列识别模块的复合体,其不伴随dsb,即,通过不切割双链dna或者单链切割,可有效地修饰单子叶植物的基因组基因的特定序列的核酸碱基。另外,本发明的第2目的在于提供:可在使用脱氨酶而不伴随dsb的基因组编辑中,以与碱基取代不同的方式有效地向宿主细胞导入突变的办法。
解决问题的方法
本发明人为了完成上述第1目的,首先将作为人工核酸酶的crispr/cas9系统针对水稻进行最优化而成的靶向载体pzh_osu6grna_mmcas9(plantmolbiol(2015)88:561-572)与脱氨酶进行了组合(参考图1b)。即,向上述靶向载体中的针对水稻的密码子使用而最优化的cas9编码序列(oscas9),导入使目标dna双链或者一条链的切割能力失活的突变,并且使该编码序列与针对植物的密码子使用而最优化的胞苷脱氨酶编码序列(atpmcda)进行融合。进一步,由于植物细胞比酵母等的细胞尺寸大,所以在细胞质中合成的cas9/脱氨酶融合蛋白的向核的转移效率可能降低的假说下,不仅在cas9的上游、在脱氨酶的两末端也分别加上了核定位信号(nls)。将该改良型载体导入水稻愈伤组织,结果可以将靶核苷酸序列内的目标碱基顺利取代为其它碱基。进一步,惊讶地发现,在使用目标dna的一个链的切割能力失活的(具有切口酶活性)cas9(d10a)的情况下,主要发生在由脱氨酶而脱氨基的碱基为中心的区域中的缺失突变。
另外,本发明人在导入突变株的选择步骤中,以比通常使用的培养温度比更低温的温度来培养基因导入后的水稻愈伤组织,结果成功地将导入突变效率进一步提高。
本发明人基于这些见解进一步反复研究,结果完成了本发明。
即,本发明如下所述。
[1]修饰单子叶植物细胞所具有的双链dna的靶向位点的方法,其包括:使由核酸碱基转变酶、和与所选择的双链dna中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体,与该双链dna接触,在该靶向位点中不切割的该双链dna的至少一个链,而使该靶向位点的1个以上的核苷酸缺失或转换为其它1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸的步骤,其中,该双链dna与该复合体的接触通过向该单子叶植物细胞导入编码该复合体的核酸,培养该单子叶植物细胞而使该复合体在细胞内表达来进行。
[2]上述[1]所述的方法,其中,上述培养步骤中的至少一部分在与该单子叶植物细胞的最适培养温度比更低温的温度下进行。
[3]上述[1]或[2]所述的方法,其中,上述核酸序列识别模块选自:cas的至少1个dna切割能力失活的crispr-cas系统、锌指基序、tal效应子及ppr基序。
[4]上述[1]或[2]所述的方法,其中,上述核酸序列识别模块我cas的至少1个dna切割能力失活的crispr-cas系统。
[5]上述[4]所述的方法,其中,上述核酸序列识别模块为与指导rna形成互补链的链的相反链的切割能力失活的crispr-cas系统。
[6]上述[5]所述的方法,其使靶向位点的1个以上的核苷酸缺失。
[7]上述[1]~[6]中任一项所述的方法,其中,上述核酸碱基转变酶为脱氨酶。
[8]上述[7]所述的方法,其中,上述脱氨酶为胞苷脱氨酶。
[9]上述[8]所述的方法,其中,上述胞苷脱氨酶为源自七腮鳗的pmcda1。
[10]上述[1]~[9]中任一项所述的方法,其中,编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。
[11]上述[1]~[10]中任一项所述的方法,其中,在核酸序列识别模块及核酸碱基转变酶的两末端添加了核定位信号。
[12]上述[1]~[11]中任一项所述的方法,其中,单子叶植物为水稻、小麦或玉米。
[13]上述[12]所述的方法,其中,单子叶植物为水稻。
[14]核酸修饰酶复合体,其为核酸碱基转变酶和与单子叶植物细胞具有的双链dna中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体,所述核酸修饰酶复合体在该靶向位点中,不切割该双链dna的至少一个链,该靶向位点的1个以上的核苷酸缺失或转换为其它1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸而在该单子叶植物细胞中起作用。
[15]上述[14]所述的核酸修饰酶复合体,其中,核酸序列识别模块为cas的至少1个dna切割能力失活的crispr-cas系统,核酸碱基转变酶为胞苷脱氨酶。
[16]上述[14]或[15]所述的核酸修饰酶复合体,其中,在核酸序列识别模块及核酸碱基转变酶的两末端添加了核定位信号。
[17]编码上述[14]~[16]中任一项所述的核酸修饰酶复合体的核酸。
[18]上述[17]所述的核酸,其中编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。
发明效果
根据本发明的基因组编辑技术,由于不伴随dna双链切割因而安全性优异,且能够以较高的突变导入效率进行单子叶植物的基因修饰。
附图说明
[图1]示意地示出实施例中使用的载体质粒的结构的图。a:target-aid评价用载体。b:target-aid载体。
[图2]示出在导入了两种target-aid评价用载体的水稻愈伤组织中的egfp的表达的图。
[图3]示出通过对导入prit3-megfp和2409所得到的双重转化体的pcr分析,确认了megfp及hpt基因的并入的结果的图。
[图4]示出导入prit3-megfp和2409所得到的双重转化克隆no.6中的egfp表达的图。
[图5]示出导入prit3-megfp和2409所得到的双重转化克隆no.3中的egfp表达的图。
[图6]示出导入prit3-megfp和2409所得到的两种双重转化克隆(a及b)中的靶核苷酸序列附近的测序分析结果的图。
[图7]示出导入prit3-megfp和2409所得到的双重转化克隆no.39中的靶核苷酸序列附近的测序分析结果的图。
[图8]示出导入prit3-megfp和2408所得到的双重转化克隆no.1中的靶核苷酸序列附近的测序分析结果的图。
[图9]示出导入prit3-megfp和2408所得到的双重转化克隆no.2中的靶核苷酸序列附近的测序分析结果的图。
[图10]示出导入prit3-megfp和2408所得到的双重转化克隆no.4中的靶核苷酸序列附近的测序分析结果的图。
[图11]示出导入prit3-megfp和2408所得到的双重转化克隆no.1的亚克隆no.1d(gfp信号阴性)中的靶核苷酸序列附近的测序分析结果的图。
[图12]示出甲氧咪草烟(imazamox)对水稻愈伤组织的有效浓度的评价的结果的图。上图为将水稻愈伤组织接芽至添加了甲氧咪草烟的培养基的当天,下图为培养28天时间之后的照片。
[图13]甲氧咪草烟抗性赋予试验中使用的野生型als及突变型alsa96v的表达载体的模式图。
[图14]示出基于target-aid的水稻alsa96v的修饰的靶序列的图。
[图15]示出基于target-aid的水稻als基因的修饰的图。
[图16]是基于target-aid的水稻alsa96v修饰愈伤组织进行再分化而成的t0植物体的照片。
[图17]示出由基于target-aid的水稻alsa96v修饰愈伤组织进行再分化而成的t0植物体,保持了与原始的愈伤组织相同的als基因修饰的图。
[图18]示出基于target-aid的多个基因的同时修饰的图。
具体实施方式
本发明提供不切割单子叶植物细胞内的待修饰的双链dna,通过将该双链dna中的靶核苷酸序列及其附近的核苷酸转换为其它核苷酸等,从而修饰该双链dna的该靶向位点的方法(以下也称为“本发明的方法”)。该方法包括:通过使由核酸碱基转变酶和与该双链dna中的靶核苷酸序列进行特异性结合的核酸序列识别模块结合而成的复合体在宿主单子叶植物细胞内与该双链dna接触,而使该靶向位点(即,靶核苷酸序列及其附近的核苷酸)转换为其它核苷酸等的步骤。
对在本发明的方法中可使用的单子叶植物没有特别的限制,例如:水稻、小麦、玉米、大麦、黑麦等谷物类,百合等园艺植物,更优选为水稻、小麦、玉米,特别优选为水稻。
在本发明中,双链dna的“修饰”是指使dna链上具有的核苷酸(例如:dc)缺失或转换为其它核苷酸(例如:dt、da或dg),或者向dna链上具有的核苷酸之间插入核苷酸或者核苷酸序列。这里,对待修饰的双链dna而言,只要是宿主细胞内存在的双链dna即可,没有特别限制,优选为基因组dna、特别是核基因组dna。另外,双链dna的“靶向位点”是指,核酸序列识别模块可特异性识别并结合的“靶核苷酸序列”的全部或者一部分,或指该靶核苷酸序列的附近(5'上游及3'下游的任意一种或两种)。另外,“靶核苷酸序列”是指双链dna中的核酸序列识别模块可结合的序列。
在本发明中“核酸序列识别模块”是指具有特异性识别并结合dna链上的特定的核苷酸序列(即靶核苷酸序列)的能力的分子或分子复合体。核酸序列识别模块可以通过与靶核苷酸序列结合,使与该模块连接的核酸碱基转变酶在双链dna的靶向位点发挥特异性的作用。
在本发明中,“核酸碱基转变酶”是指,可以通过催化dna碱基的嘌呤或嘧啶环上的取代基转换为其它基团或原子的反应,而不切割dna链从而将靶核苷酸转换为其它核苷酸的酶。
在本发明中,“核酸修饰酶复合体”是指,包含由上述核酸序列识别模块和核酸碱基转变酶连接而成的复合体,赋予了特定的核苷酸序列识别能力的具有核酸碱基转变酶活性的分子复合体。在此,“复合体”不仅包括由多个分子构成的形式,也包括像融合蛋白那样在单个分子内具有核酸序列识别模块和核酸碱基转变酶的形式。
就用于本发明的方法的核酸碱基转变酶而言,只要可以催化上述反应即可,没有特别限制,可列举例如:催化氨基转换为羰基的脱氨基反应的,属于核酸/核苷酸脱氨酶超家族的脱氨酶。可列举优选:可以将胞嘧啶或5-甲基胞嘧啶分别转换为尿嘧啶或胸腺嘧啶的胞苷脱氨酶,可以将腺嘌呤转换为次黄嘌呤的腺苷脱氨酶,可以将鸟嘌呤转换为黄嘌呤的鸟苷脱氨酶等。作为胞苷脱氨酶,更优选可列举活化诱导的胞苷脱氨酶(以下也称为aid)等,其为在脊椎动物的获得性免疫中在免疫球蛋白基因中导入突变的酶。
对核酸碱基转变酶的来源没有特别限制,例如,只要是胞苷脱氨酶即可,可以使用源自七腮鳗的pmcda1(petromyzonmarinuscytosinedeaminase1)、源自脊椎动物(例如:人、猪、牛、犬、黑猩猩等哺乳动物,鸡等鸟类,非洲爪蟾(xenopuslaevis)等两栖类,斑马鱼、香鱼、布氏鲶鱼等鱼类等)的aid(激活诱导的胞苷脱氨酶,activation-inducedcytidinedeaminase;aicda)。
对由本发明的核酸修饰酶复合体的核酸序列识别模块所识别的双链dna中的靶核苷酸序列而言,只要可以与该模块特异性结合即可,没有特别限制,可以为双链dna中的任意序列。就靶核苷酸序列的长度而言,只要足以与核酸序列识别模块进行特异性结合即可,根据单子叶植物的基因组尺寸,例如为12个核苷酸以上、优选为15个核苷酸以上、更优选为18个核苷酸以上。对长度的上限没有特别限制,优选为25个核苷酸以下,更优选为22个核苷酸以下。
作为本发明的核酸修饰酶复合体的核酸序列识别模块,可以使用例如:cas的至少1种dna切割能力失活的crispr-cas系统(crispr-突变cas)、锌指基序、tal效应子及ppr基序等,除此以外,可以使用包含限制酶、转录因子、rna聚合酶等可与dna进行特异性结合的蛋白质的dna结合结构域且不具有dna双链切割能力的片段等,但不限于这些。优选可列举:crispr-突变cas、锌指基序、tal效应子、ppr基序等。
锌指基序为由3~6个不同的cys2his2型锌指单元(1个手指识别约3个碱基)连接而成,可以识别9~18个碱基的靶核苷酸序列。锌指基序可以根据modularassembly法(natbiotechnol(2002)20:135-141)、open法(molcell(2008)31:294-301)、coda法(natmethods(2011)8:67-69)、大肠杆菌单杂交法(natbiotechnol(2008)26:695-701)等公知的方法产生。对于产生锌指基序的细节,可以参照上述专利文献1。
对tal效应子而言,其具有以约34个氨基酸作为单位的模块的重复结构,利用1个模块的第12及13个氨基酸残基(称为rvd)来确定结合稳定性和碱基特异性。由于各个模块的独立性较高,因此可以仅将模块相连来产生对靶核苷酸序列特异性的tal效应子。tal效应子可以由利用openresource的产生方法(real法(currprotocmolbiol(2012)chapter12:unit12.15)、flash法(natbiotechnol(2012)30:460-465)、goldengate法(nucleicacidsres(2011)39:e82)等)进行构建,比较简便地设计相对于靶核苷酸序列的tal效应子。对于产生tal效应子的细节,可以参照上述专利文献2。
构建ppr基序进而特定的核苷酸序列由ppr基序的连续识别,所述ppr基序各包含35个氨基酸并识别1个核酸碱基,且仅由每个基序的1、4和ii(-2)氨基酸识别靶向碱基。由于对基序构成没有依赖性,不受两侧的基序的干涉,因此与tal效应子同样可以仅将ppr基序相连,来产生对靶核苷酸序列特异性的ppr蛋白质。对于产生ppr基序的细节,可以参照上述专利文献4。
另外,在使用限制酶、转录因子、rna聚合酶等片段的情况下,由于它们的蛋白质的dna结合结构域是众所周知的,因此可以容易地设计、构建包含该结构域且不具有dna双链切割能力的片段。
上述任意核酸序列识别模块也可以以与上述核酸碱基转变酶的融合蛋白的形式提供,或者,也可以将sh3结构域、pdz结构域、gk结构域、gb结构域等蛋白质结合结构域和它们的结合配偶体,分别与核酸序列识别模块和与核酸碱基转变酶融合,通过该结构域和它们的结合配偶体的相互作用而以蛋白质复合体的形式提供。或者,也可以将核酸序列识别模块与核酸碱基转变酶和与内含肽(intein)分别融合,通过各蛋白质合成后的连接(ligation)将两者连接。
就包含核酸碱基转变酶与核酸序列识别模块结合而成的复合体(包括融合蛋白)的本发明的核酸修饰酶复合体,与双链dna的接触而言,通过向具有目标的双链dna(例如,核基因组dna)的单子叶植物细胞导入编码该复合体的核酸来实施。
因此,对核酸序列识别模块与核酸碱基转变酶而言,以编码它们的融合蛋白的核酸的形式进行制备,或以使得利用结合结构域、内含肽等翻译成蛋白质之后可以在宿主细胞内形成复合体的形态,以分别编码它们的核酸的形式进行制备。在此,核酸可以为dna也可以为rna,优选为dna。在为dna时,优选为双链dna,并以在宿主细胞内在功能性的启动子的操纵下配置的表达载体的形态提供。
由于核酸序列识别模块和核酸碱基转变酶结合而成的本发明的复合体不伴随dna双链切割(dsb),因此,能够进行毒性较低的基因组编辑,本发明的基因修饰方法可以广泛适用于单子叶植物全体。
对编码锌指基序、tal效应子、ppr基序等核酸序列识别模块的dna而言,对于各模块,可以通过上述任意方法获得。对编码限制酶、转录因子、rna聚合酶等序列识别模块的dna而言,可以通过以下进行克隆:例如基于它们的cdna序列信息,而合成使得覆盖编码该蛋白质的期望部分(包含dna结合结构域的部分)的区域的寡dna引物,并利用由产生该蛋白质的细胞制备的总rna或者mrna级分作为模板,通过rt-pcr法进行扩增。
编码核酸碱基转变酶的dna也可以同样地通过以下进行克隆:基于待使用的酶的cdna序列信息来合成寡dna引物,使用由产生该酶的细胞制备的总rna或者mrna级分作为模板,通过rt-pcr法进行扩增。例如,就编码七腮鳗的pmcda1的dna而言,可以基于ncbi数据库中登记的cdna序列(登记号.ef094822),针对cds的上游及下游设计适当的引物,从源自七腮鳗的mrna通过rt-pcr法进行克隆。另外,就编码人aid的dna而言,可以基于ncbi数据库登记的cdna序列(登记号.ab040431),针对cds的上游及下游设计适当的引物,例如从源自人淋巴结的mrna通过rt-pcr法进行克隆。其它源自脊椎动物的aid同源也可以基于公知的cdna序列信息(例如:猪(登记号.cu582981)、牛(登记号.nm_110138682)、犬(登记号.nm_001003380)、黑猩猩(登记号.nm_001071809)、鸡(登记号.nm_001243222)、非洲爪蟾(登记号.nm_001095712)、斑马鱼(登记号.aai62573)、香鱼(登记号.ab619797)、布氏鲶鱼(登记号.nm_001200185)等),与上述同样地进行而克隆。
经克隆的dna可以直接或根据需要利用限制酶进行消化,或在加上适当的接头和/或核定位信号(在目标的双链dna为线粒体、叶绿体dna时,为各细胞器定位信号)之后,与编码核酸序列识别模块的dna进行连接,来制备编码融合蛋白的dna。在优选实施方式中,优选在编码核酸序列识别模块的dna和编码核酸碱基转变酶的dna这两者的两末端,加上编码核定位信号等细胞器定位信号的dna序列。由于单子叶植物细胞的尺寸大于酵母细胞,因此合成蛋白质的细胞质与核之间的距离变大。因此,对于如核酸碱基转变酶与核酸序列识别模块的复合体这样的分子量较大的蛋白质分子有效地输送至核,优选在核酸序列识别模块和核酸碱基转变酶的两者均加上核定位信号。在将核酸碱基转变酶与核酸序列识别模块以融合蛋白的形式表达的情况下,可以在融合蛋白的两末端、和核酸序列识别模块与核酸碱基转变酶之间加上核定位信号。作为核定位信号,只要可以在单子叶植物中起作用即可,没有特别的限制,可列举例如源自sv40的核定位信号(pkkkrkv;seqidno:6)。
或者,编码核酸序列识别模块的dna和编码核酸碱基转变酶的dna可以分别与编码结合结构域或其的结合配偶体的dna进行融合,或也可以通过使两种dna与编码分离内含肽的dna进行融合,从而使得核酸序列识别转变模块和核酸碱基转变酶在宿主细胞内翻译后再形成复合体。在这些情况下,也可以根据需要在一方或双方dna的适当的位置连接接头及/或核定位信号。
对编码核酸序列识别模块的dna和编码核酸碱基转变酶的dna而言,可以化学合成dna链,或者也可以通过将合成的部分重叠的寡dna短链利用pcr法、gibsonassembly法进行连接,从而构建编码其全长的dna。利用化学合成或pcr法或者gibsonassembly法的组合来构建全长dna的优点在于,可以在整个cds全长上设计与待导入该dna的宿主配合的使用密码子。在表达异种dna时,通过将该dna序列转换为在宿主生物中使用频率较高的密码子,可以期待使蛋白质表达量增大。就待使用的宿主中的密码子使用频率的数据而言,可以使用例如在(公财)kazusadna研究所的主页上公开的遗传密码使用频率数据库(http://www.kazusa.or.jp/codon/index.html),也可以参照记载了各宿主中的密码子的使用频率的文献。只要参照取得的数据和准备导入的dna序列,将该dna序列中使用的密码子中的在宿主中使用频率较低的密码子,转换为编码同一氨基酸且使用频率较高的密码子即可。例如,在宿主细胞为水稻细胞的情况下,可以使用针对水稻等单子叶植物,或者拟南芥等被子植物的一般的密码子使用而最优化的核酸序列识别模块和/或编码核酸碱基转变酶的序列。例如,作为具有适于在被子植物中的表达的密码子使用的pmcda1dna,可列举具有以seqidno:1表示的核苷酸序列的dna。
含有编码核酸序列识别模块和/或核酸碱基转变酶的dna的表达载体,例如可以通过以下制造:在包含在单子叶植物细胞中可发挥作用的启动子的载体中,将该dna连接于该启动子的下游。
作为在单子叶植物细胞中可复制的载体,只要是具有在单子叶植物细胞中起作用的复制起点(例如,ti质粒、ri质粒的ori等)的那些即可,没有特别的限制,优选也具有大肠杆菌的复制起点(例如,cole1ori等)。在作为基因导入法使用了农杆菌法的情况,需要进一步包含ti质粒、ri质粒的已除去致病性基因的t-dna片段(包括边界序列rb及lb),可列举例如:源自pbin193的pbi101、pbi121(clontech)、以它们为骨架的改良型载体(例如,pri909、pri910、pri101、pri201(takarabio)等),但不限于这些。
作为启动子,只要是在单子叶植物细胞中可发挥作用的启动子即可,可以是任意启动子。由于伴随dsb的常规法有毒性,因此宿主细胞的生存率可能显著降低,所以优选在使用诱导启动子(例如,被受伤、水杨酸处理所诱导的pr1α基因启动子,被干燥、低温、脱落酸处理所诱导的rd29a基因启动子、被二氯丙烯胺(dichlormid)处理所诱导的gst-27基因启动子等)事先增加细胞数量至开始诱导为止,但本发明的核酸修饰酶复合体即使表达也可得到充分的细胞增殖,所以可以不限制地使用构成启动子。作为构成启动子,可列举花椰菜花叶病毒(cauliflowermosaicvirus)(camv)35s启动子、camv19s启动子、胭脂碱合成酶(nopalinesynthetase)(nos)启动子、源自欧芹的泛素启动子(pcubi4-2)等。也可以使用这些启动子或其片段串联相连而成的片段(例如,2x35s)。
在表达载体中,可以根据需要含有终止子(例如,nos终止子、豌豆rbcs3a终止子、热休克蛋白质(hsp)17.3终止子等),翻译增强子(例如,源自水稻的醇脱氢酶5'非翻译区(osadh-5'utr)、camv、源自烟草花叶病毒(tmv)的ω序列等),3'调节区(例如,源自水稻的肌动蛋白基因(act1)3'utr等),polya加成信号,药物抗性基因(例如,g418抗性基因(nptii),潮霉素抗性基因(hpt)等)选择标记等。
编码核酸序列识别模块和/或核酸碱基转变酶的rna可以通过例如以下制备:以编码上述核酸序列识别模块和/或核酸碱基转变酶的dna编码的载体作为模板,通过本身公知的体外转录系统转录为mrna。
可以通过将包含编码核酸序列识别模块及/或核酸碱基转变酶的dna表达载体导入宿主单子叶植物细胞,并培养该宿主细胞,从而使核酸碱基转变酶与核酸序列识别模块的复合体在细胞内表达。
对作为宿主的单子叶植物细胞而言,可以使用例如:从水稻、小麦、玉米、大麦、黑麦等谷物,百合等花卉园艺植物等制备的悬浮培养细胞、愈伤组织、原生质体、叶切片、根切片、种子(不成熟的胚等)等。
单子叶植物细胞可以为单倍体(一倍体)、也可以为多倍体(例如,二倍体、三倍体、四倍体等)。在常规的突变导入方法中,作为原则仅向同源染色体的一条中导入突变而形成杂合基因型,因此,如果不是优势突变,就不会表达需要的特性,而纯合化耗时耗力,大多情况不方便。与此相对,根据本发明,由于存在可以对基因组内的同源染色体上的等位基因全部导入突变的可能性,所以即使为劣势突变,也可以在该代中表达期望的表现,可克服常规法的问题。
表达载体的导入可以根据单子叶植物的种类,相对于适当的组织(例如,愈伤组织、根、叶、种子、生长点等),依照公知的方法(例如:农杆菌法、peg法、电穿孔法、粒子枪法等)实施。例如,在为水稻的情况下,通常可以使用农杆菌法、whisker直接导入法等,但不限于这些。例如,在农杆菌法的情况下,依照常规方法从水稻种子诱导愈伤组织,使该愈伤组织感染已导入农杆菌表达用载体的农杆菌,3天后进行灭菌,其中,在所述农杆菌表达用载体的t-dna片段中,内置了编码核酸序列识别模块和/或核酸碱基转变酶的dna的表达盒。另一方面,在whisker直接导入法的情况下,将表达载体与多聚鸟氨酸进行混合而制成复合体后,与钛酸钾制成的whisker一起添加至水稻愈伤组织并混合,之后进行超声波处理。
在为小麦、玉米的情况下,可以例如将从不成熟的种子收集的不成熟的胚作为植物材料,同样地使用农杆菌法导入表达载体。
在使用peg法、电穿孔法的情况下,从适当的细胞、组织依照常规方法制备原生质体,向其导入表达载体。在粒子枪法的情况下,可以使用粒子枪对愈伤组织、不成熟的胚、存在于茎尖、腋芽的生长点等,导入吸附于金微粒的表达载体。
在粒子枪法、农杆菌法中,基因导入大多情况为嵌合,所以为了进行转化需要使用向生殖系列(germline)的细胞高频率地导入了上述核酸的试样细胞。可列举例如:胚、胚轴切片、胚形成愈伤组织(embryogeniccallus),分离的生长点等。
导入了载体的单子叶植物细胞的培养,可以根据其种类依照公知的方法实施。作为用于培养的培养基,优选为固态培养基(例如,琼脂培养基、琼脂糖培养基、结冷胶培养基等)。另外,培养基优选含有转化体的生长所必需的碳源、氮源、无机物等。例如,作为基础培养基,可以使用n6培养基、ms培养基、ls培养基、b5培养基等。也可以在培养基中适当添加植物生长物质(例如,生长素类、细胞分裂素类等)等。培养基的ph优选为约5~约8。培养温度可以根据单子叶植物细胞的种类,在通常约20℃~约35℃的范围内适当选择。例如,在为水稻愈伤组织的情况下,可以通常在28~33℃、优选在30~33℃中培养。
如上所述操作,可以在细胞内表达核酸序列识别模块和核酸碱基转变酶的复合体,即核酸修饰酶复合体。
稳定地表达导入的核酸碱基转变酶与核酸序列识别模块的转化体的选择可以通过以下进行:在添加了与导入的表达载体中包含的选择标记基因(例如,nptii、hpt等药物抗性基因)相对应的药品的培养基上,培养单子叶植物细胞,并选择药物抗性菌落。对选择培养的时期没有特别限制,通常在3-6周左右出现药物抗性菌落。
在可以可视化目标导入突变的情况下,也可以例如,在通过该导入突变而赋予单子叶植物细胞以药物抗性,对产生色素的能力发生变化的情况下,不进行使用选择标记的初步筛选,而是以基于目标导入突变的特质的变化作为指标,直接选择该导入突变株。
转化体可以根据适于其培养的本身公知的方法进行传代培养。例如,可以使用与上述转化体的选择培养中所使用的同样的方法。这里,可以通过将转化体在比通常更低的温度(例如,在为水稻愈伤组织的情况下为20-26℃、优选为约25℃)中培养,使导入突变效率升高。虽然不愿以任何理论来进行限制,但作为1种解释,作为本发明中的优选核酸碱基转变酶之一的pmcda1,源自于変温动物七腮鳗,因此对pmcda1的酶活性的最适温度而言,存在比普通酶的最适温度(约37℃)更低的可能性,因此,可考虑通过低温培养增大酶活性。因此,在本发明的优选一实施方式中,作为核酸碱基转变酶使用了pmcda1,并且将导入了编码核酸序列识别模块/pmcda1复合体的核酸的单子叶植物细胞在低温下培养。
另外,也可以通过将转化体以比通常更高的密度条件(例如,在为水稻愈伤组织的情况下,通过使愈伤组织之间可相接程度的密度,从而限定与培养基的接触,细胞受到应激这样的条件)下进行培养,使导入突变效率升高。
是否在转化体的目标双链dna中顺利导入突变的确认,在由于导入突变而可以可视化表现型的变化的情况下,可以通过检查表现型来进行,但最终的确认优选通过以下来进行:将包含靶核苷酸序列的目标dna区域通过基因组pcr进行扩增,确定扩增片段的碱基序列。由于即使是1个转化体克隆,根据细胞不同,导入突变的方式也可能不同,所以例如在作为植物材料使用愈伤组织的情况下,例如可以通过重复进行以下操作而得到具有均一的导入突变方式的克隆:将转化愈伤组织悬浊于液体培养基中,并再接种至固态培养基上,对形成的亚克隆确认导入突变方式。
确认了导入突变的转化体克隆,可以根据本身公知的再分化法,使其再分化为植物体。在杂合性地导入了突变的情况下,可以通过将使得到的植物体进行自体受粉所得到的r1植物,进一步进行自体受粉而得到r2植物,从而得到纯合性导入突变的植物体。
由导入至细胞内的表达载体,表达核酸碱基转变酶与核酸序列识别模块的复合体时,该核酸序列识别模块特异性识别并结合于目标的双链dna(例如,基因组dna)内的靶核苷酸序列,利用连接于该核酸序列识别模块的核酸碱基转变酶的作用,在靶向位点(在靶核苷酸序列的全部或者一部分或它们的附近)的有义链或者反义链发生碱基转变,在双链dna内发生错配(例如,在将pmcda1、aid等胞苷脱氨酶作为核酸碱基转变酶使用的情况下,靶向位点的有义链或者反义链上的胞嘧啶被转换为尿嘧啶,发生u:g或者g:u错配)。该错配未被正确修复,而修复使得相反链的碱基与转换后的链的碱基成对(上述例子中,为t-a或者a-t),或修复时进一步取代为其它核苷酸(例如:u→a、g),或者发生1个~数十个碱基的缺失或者插入,由此导入了各种突变。
对锌指基序而言,由于与靶核苷酸序列特异性结合的锌指的产生效率不高,另外,结合特异性高的锌指的筛选较为复杂,因此,产生多个实际发挥作用的锌指基序并不容易。就tal效应子、ppr基序而言,比锌指基序的靶核酸序列识别的自由度高,但需要每次根据靶核苷酸序列设计并构建巨大的蛋白质,因此在效率方面存在问题。
与此相对,由于crispr-cas系统是通过相对于与靶核苷酸序列互补的指导rna来识别目标的双链dna的序列,因此可以仅通过合成可与靶核苷酸序列形成特异性的杂合的寡dna,而将任意序列靶向化。
因此,在本发明的更优选的实施方式中,作为核酸序列识别模块,可以使用cas效应子蛋白质的至少1个dna切割能力失活的crispr-cas系统(crispr-突变cas)。
使用了crispr-突变cas的本发明的核酸序列识别模块,是以包含与靶核苷酸序列互补的序列的crispr-rna(crrna)、(根据需要)trans-activatingrna(tracrrna)、与突变cas效应子蛋白质的复合体的形式提供的,其中,tracrrna为在突变cas效应子蛋白质的募集中所需要(在需要tracrrna时,可以以与crrna的嵌合rna形式来提供)。将与突变cas效应子蛋白质进行组合而构成核酸序列识别模块的、仅包括crrna或者包括crrna与tracrrna的嵌合rna的rna分子总称为“指导rna”。
本发明使用的cas效应子蛋白质,只要与指导rna形成复合体,可识别并结合靶基因中的靶核苷酸序列和与其相邻的protospaceradjacentmotif(pam)即可,没有特别限制、优选为cas9或cpf1。作为cas9,可列举例如:源自化脓性链球菌(streptococcuspyogenes)的cas9(spcas9;pam序列ngg(n为a、g、t或c。以下相同))、源自嗜热链球菌(streptococcusthermophilus)的cas9(stcas9;pam序列nnagaaw)、源自脑膜炎奈瑟菌(neisseriameningitidis)的cas9(mmcas9;pam序列nnnngatt)等,但不限于这些。优选为基于pam的限制较少的spcas9(实质上为2个碱基,理论上可以靶向于基因组上的基本所有位置)。另外,作为cpf1,可列举例如:源自土拉热弗朗西丝菌(francisellanovicida)的cpf1(fncpf1;pam序列ntt)、源自氨基酸球菌属种(acidaminococcussp.)的cpf1(ascpf1;pam序列nttt)、源自毛螺菌科的细菌(lachnospiraceaebacterium)的cpf1(lbcpf1;pam序列nttt)等,但不限于这些。作为本发明中使用的突变cas效应子蛋白质(有时简称为突变cas),能够使用cas效应子蛋白质的双链dna的两条链的切割能力失活的那些,和具有仅一条链的切割能力失活的切口酶活性的那些中的任意。例如,在为spcas9的情况下,可以使用将第10位的asp残基转换为ala残基,欠缺与指导rna形成互补链的链的相反链的切割能力(因此,具有针对与指导rna形成互补链的链的切口酶活性)的d10a突变体,或者将第840位的his残基转换为ala残基,欠缺与指导rna形成互补链的链的切割能力(因此,具有针对与指导rna形成互补链的链的相反链的切口酶活性)的h840a突变体,进一步及其双重突变体(dcas9)。另外,在为fncpf1的情况下,可以使用将第917位的asp残基转换为ala残基(d917a)、或者将第1006位的glu残基转换为ala残基(e1006a)的,欠缺两条链的切割能力的突变体。只要欠缺对双链dna的至少一条链的切割能力即可,也同样可以使用其它突变cas。
对核酸碱基转变酶而言,通过与上述锌指等之间的连接方式相同的方法,以突变cas的复合体的形式提供。或者,核酸碱基转变酶和突变cas也可以利用rna适体的ms2f6、pp7等、由它们的结合蛋白质构成的rna支架进行结合。指导rna中的靶向序列与靶核苷酸序列形成互补链,指导rna中的其它区域(即,crrna中的除了靶向序列以外的序列,或者与crrna连续的tracrrna)募集突变cas而识别pam,不切割一方或者两者的dna,利用连接于突变cas的核酸碱基转变酶的作用,使靶向位点(可以在靶核苷酸序列的全部或者一部分包含的几百个碱基的范围内适当调节)发生碱基转变,在双链dna内发生错配。该错配未被正确修复,而修复使得相反链的碱基与转换后的链的碱基成对,或修复时进一步转换为其它核苷酸,发生1个~数十个碱基缺失或者插入由此导入了各种突变。
在将crispr-突变cas用作核酸序列识别模块的情况下,也与将锌指等作为核酸序列识别模块的情况相同地,核酸序列识别模块和核酸碱基转变酶,以编码它们的核酸(优选为dna)的形态,导入具有目标的双链dna单子叶植物细胞。
对编码cas效应子蛋白质(例如,cas9、cpf1)的dna而言,可以根据与编码核酸碱基转变酶的dna的上述的同样的方法,从产生该酶的细胞进行克隆。另外,突变cas可以通过以下获得:在编码克隆的cas的dna中,使用本身公知的位点特异性的突变诱发法,以将对dna切割活性重要的位点的氨基酸残基(例如:在为spcas9的情况下,可列举第10位的asp残基、第840位的his残基,在为fncpf1的情况下,可列举第917位的asp残基、第1006位的glu残基等,但不限于这些)转换为其它氨基酸的方式导入突变。
或者,对编码突变cas的dna而言,也可以针对编码核酸序列识别模块的dna、编码核酸碱基转变酶的dna,通过与上述相同的方法和化学合成或pcr法或者gibsonassembly法的组合,构建具有适于使用的宿主单子叶植物细胞的表达的密码子使用的dna形式。例如,作为具有适于在水稻中的表达的密码子使用的spcas9dna,可列举具有以seqidno:3表示的核苷酸序列的dna。
对编码突变cas的dna和编码核酸碱基转变酶的dna而言,可以连接使得以融合蛋白的形式表达,也可以设计成使得使用结合结构域、内含肽等分别进行表达,并通过蛋白质间相互作用、蛋白质连接而在宿主细胞内形成复合体。在以上任一种情况下,均对编码突变cas的dna和编码核酸碱基转变酶的dna而言,优选在各自的两末端加上编码在单子叶植物细胞中可发挥作用的核定位信号(nls)的序列(例如,源自sv40的nls编码序列;seqidno:5)。在突变cas和核酸碱基转变酶以融合蛋白的形式表达的情况下,可以在一个蛋白质的c末端和另一个蛋白质的n末端作为添加的nls而共有1个nls序列。在对于真核细胞适用crispr-cas技术的情况下,为了改善cas效应子蛋白质的核定位的效率而加上nls为传统方法,由于基于本发明是以突变cas与核酸碱基转变酶的复合体形式进行表达,因此分子量变大,在将尺寸大于本发明人等先前报告的酵母细胞的单子叶植物细胞用作宿主的情况下,存在该复合体的核定位的效率降低的可能性。因此,本发明人为了改善该复合体的核定位效率,构思在突变cas效应子蛋白质和核酸碱基转变酶的各两末端加上nls,由此即使是在单子叶植物细胞中,也成功地使用本发明的基因组编辑技术而得到较高的导入突变效率。
得到的编码突变cas和/或核酸碱基转变酶的dna可以插入于与上述相同的表达载体的启动子的下游,例如:camv35s启动子、camv19s启动子、nos启动子、pcubi4-2启动子、2x35s启动子等。在表达载体中,如上所述,可以根据需要含有:终止子(例如,nos终止子、豌豆rbcs3a终止子、热休克蛋白质(hsp)17.3终止子等),翻译增强子(例如,源自水稻的醇脱氢酶5'非翻译区(osadh-5'utr)、camv、源自烟草花叶病毒(tmv)的ω序列等),3'调节区(例如,源自水稻的肌动蛋白基因(act1)3'utr等),polya加成信号,药物抗性基因(例如,g418抗性基因(nptii)、潮霉素抗性基因(hpt)等)的选择标记等。在优选的实施方式中,为了提高在单子叶植物细胞中的翻译效率,可以将osadh-5'utr插入启动子和编码突变cas和/或核酸碱基转变酶的dna之间。
另一方面,编码指导rna的dna可以通过设计(1)或(2)而使用dna/rna合成仪进行化学合成:(1)包含与靶核苷酸序列的“目标链(targetedstrand)”互补的核苷酸序列(也称为“靶向序列(targetingsequence)”)的crrna序列(例如,在作为cas效应子蛋白质募集fncpf1时,可使用在靶向序列的5'侧包括aauuucuacuguuguagau(seqidno:7;下划线部的序列之间形成碱基对而形成茎-环结构)的crrna)的编码序列;(2)将crrna编码序列根据需要与已知的tracrrna编码序列(例如,作为作为cas效应子蛋白质募集cas9时的tracrrna编码序列,为gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtgctttt;seqidno:8)连接而成的寡dna序列。
在此“目标链”是指与靶核苷酸序列的crrna杂交的链,将其的相反链而通过目标链与crrna的杂交而成为一条链状的链称为“非目标链(non-targetedstrand)”。另外,由于推定核酸碱基转换反应通常大多情况在已成为一条链状的非目标链上发生,所以在将靶核苷酸序列以一条链的形式表现时(例如在标记pam序列时,表示靶核苷酸序列与pam的位置关系时等),用非目标链的序列进行代表。
对靶向序列的长度而言,只要是可相对于靶核苷酸序列特异性结合即可,没有特别限制,例如为15~30个核苷酸、优选为18~25个核苷酸。靶核苷酸序列的选择受到该序列的3'侧(在cas9的情况下)或者5'侧(在cpf1的情况下)相邻的pam的存在所限制,根据酵母等中的见解,在将crispr-突变cas9与胞苷脱氨酶进行组合的本发明的系统中,不论靶核苷酸序列的长度如何,也存在容易对位于其从5'端向3'方向7个核苷酸以内的位置的c进行取代的规律性,所以可以通过适当选择靶核苷酸序列(作为其互补链的靶向序列)的长度,而使可导入突变碱基的位点移位。由此,可以至少部分解除基于pam(在spcas9中为ngg)的限制,进一步提高导入突变的自由度。
靶向序列的设计可以例如通过以下进行:在作为cas效应子蛋白质使用cas9的情况下,使用公开的指导rna设计网站(crisprdesigntool,crisprdirect等),从靶基因的cds序列中列表出与pam(例如:在为spcas9的情况下,为ngg)在3'侧相邻的20mer序列,在将其从5'端向3'方向7个核苷酸以内的c转换为t的情况下,选择使得靶基因所编码的蛋白质发生氨基酸变化的序列。进一步,在使靶向序列的长度在例如18~25个核苷酸的范围中变化的情况下,同理选择存在从其5'端向3'方向7个核苷酸以内的通过变为t的碱基转变而发生氨基酸变化的c的序列。可以从这些候选中,将目标的单子叶植物基因组中脱靶位点数量较少的候选序列用作靶向序列。在使用的指导rna设计软件中没有检索单子叶植物基因组的脱靶位点的功能的情况下,例如可以通过针对候选序列的3'侧的8~12个核苷酸(靶核苷酸序列的识别能力高的seed序列),对作为宿主的单子叶植物基因组进行blast检索来检索脱靶位点。
编码指导rna的dna也可以插入至与上述相同的表达载体,作为启动子,优选使用poliii类的启动子(例如,snr6、snr52、scr1、rpr1、u3、u6、h1启动子等)及终止子(例如,polyt序列(t6序列等))。例如,在宿主细胞为水稻细胞的情况下,可使用源自水稻的u6或u3启动子,更优选为u6启动子。在使用poliii类启动子的情况下,应该使得不将具有连续4个以上的t的核苷酸序列选择为靶向序列。
对编码指导rna(crrna或crrna-tracrrna嵌合)的dna而言,可以设计与靶核苷酸序列的目标链互补的序列与已知的tracrrna序列(募集cas9时)或crrna的直接重复序列(募集cpf1时)连接而成的寡rna序列,并使用dna/rna合成仪进行化学合成。
编码突变cas和/或核酸碱基转变酶的dna、编码指导rna(crrna或crrna-tracrrna嵌合)的dna可以根据宿主单子叶植物细胞,而利用与上述同样的方法导入细胞。稳定表达突变cas及核酸碱基转变酶的转化体的选择、对所选择的转化体的保持培养(maintenanceculture),也可以与上述同样操作而进行。
在常规型的人工核酸酶中,由于伴随dna双链切割(dsb),因此,对基因组内的序列进行靶向时,发生认为由染色体的无序切割(脱靶切割)而导致的增殖阻碍和细胞死亡。在本发明中,由于通过不切割dna的对dna碱基上的取代基的转换反应(特别是脱氨基反应)进行突变导入,因此,可以实现毒性的大幅降低。
需要说明的是,在本发明的双链dna的修饰中,除了靶向位点(可以在包含靶核苷酸序列的全部或者一部分的几百个碱基的范围内适当调节)以外,不会妨碍该双链dna的切割的发生。然而,考虑到本发明的最大的一个优点是避免了由脱靶切割导致的毒性,则在优选的一种实施形态中,本发明的双链dna的修饰,不仅在选择的双链dna的靶向位点中,在其以外的位点中也不伴随dna链的切割。
如下文的实施例所示,在作为突变cas使用了具有仅可切割双链dna中的一个链的切口酶(nickase)活性的cas9的情况下,与在使用不能切割两条链的突变cas9的情况下的导入突变方式的倾向明显不同。如果作为突变cas,使用了欠缺对与指导rna形成互补链的链的相反链(非目标链)的切割能力(因此,具有对目标链的切口酶活性)的d10a突变体,则比起碱基取代,导入1至20个核苷酸左右的缺失突变的倾向更强。缺失大多情况下在以碱基取代位点(靶核苷酸序列的从5'末端向3'方向的7个核苷酸以内)为中心的区域发生,而不是在基于cas的切割位点(pam的上游2-3个核苷酸),另外,也存在与该缺失同时,伴随插入1或多个核苷酸的情况。虽然不愿以任何理论来进行限制,但在除去修复受到非目标链上的碱基取代的核苷酸时,在单子叶植物中,可考虑将周边的碱基也一总除去,并且以相反链(目标链)作为模板进行延长反应。此时,推测如果在目标链产生了缺口,则除去修复机制在目标链也发挥作用,变成在两条链中发生核苷酸的脱落的状态,无法进行正常的延长反应而勉强发生连接,由此结果是导致容易发生缺失突变。
另一方面,在使用不能切割两条链的突变cas9时,导入突变方式与芽殖酵母、大肠杆菌等的情况相同,以碱基取代为主。其中,导入突变位点的范围比芽殖酵母的情况下更广泛一些,达到靶核苷酸序列的5'末端的更上游(例如:pam序列的上游21个核苷酸)为止。虽然不愿以任何理论来进行限制,但基于上述假说,可认为由于在目标链中不产生缺口,因此以目标链为模板的延长反应正常进展,结果导致碱基取代成为主要的突变。同样地,在使用欠缺目标链的切割能力(因此,具有对非目标链的切口酶活性)的h840a突变体的情况下,推定由于以作为相反链的目标链作为模板的延长反应也正常进展,因此作为导入突变方式,以碱基取代为主。
因此,通过适当选择突变cas的dna链切割能力,能够向双链dna的特定的核苷酸或核苷酸区域中对针点导入碱基取代,或者导入以碱基取代位点为中心的约20个核苷酸以内的缺失突变,也可以根据目标不同而分开使用。
本发明人另外使用芽殖酵母确认了:与以单独的核苷酸序列为靶相比,通过产生针对相邻的多个靶核苷酸序列的序列的识别模块并同时使用,导入突变效率大幅升高,在单子叶植物细胞中也可以期待同样的效果。对其效果而言,由使得两个靶核苷酸序列的一部分发生重复的情况可知,即使在两者分开600bp左右的情况下,也同样实现了突变诱导。另外,在靶核苷酸序列存在于相同方向(目标链为相同链)、以及对向(以双链dna的两条链为目标链)的两种情况下,均可发生。
另外,也能够以完全不同位置的多个dna区域为靶进行修饰。因此,在本发明优选的一种实施方式中,可以使用与不同的靶核苷酸序列(可以在1个靶基因内,也可以在不同的2个以上的靶基因内。)分别特异性结合的、两种以上的核酸序列识别模块。在该情况下,核酸碱基转变酶与每个这些核酸序列识别模块的1个形成核酸修饰酶复合体。在此核酸碱基转变酶为共通的东西可以使用。例如,在作为核酸序列识别模块使用crispr-cas系统的情况下,可以使用与cas效应子蛋白质和核酸碱基转变酶的复合体(融合蛋白包含)共通的那些,作为指导rna(crrna或crrna-tracrrna嵌合)可以产生并使用两种以上的嵌合rna,所述嵌合rna为由与不同靶核苷酸序列分别形成互补链的2种以上的crrna,或者2种以上的crrna每一种分别与tracrrna形成的嵌合rna。另一方面,在使用锌指基序、tal效应子等作为核酸序列识别模块的情况下,例如可以将与不同的靶核苷酸特异性结合的各核酸序列识别模块,与核酸碱基转变酶进行融合。
为了使本发明的核酸修饰酶复合体在宿主细胞内表达,因此如上所述将包含编码该核酸修饰酶复合体的dna的表达载体导入单子叶植物细胞,但为了有效地导入突变,因此优选能保持规定时期以上、规定水平以上的核酸修饰酶复合体的表达。从该观点出发,对该表达载体而言,虽然确实被组装入宿主基因组,但由于核酸修饰酶复合体的持续表达使脱靶切割的风险增大,所以优选在顺利完成导入突变后将其迅速除去。作为用于去除组装在宿主基因组中的dna的方法,可列举使用cre-loxp类的方法、使用转座子的方法等。
或者,通过仅在用于在期望的时期发生核酸碱基转换反应、固定靶向位点的修饰所需要的时期一过性地使本发明的核酸修饰酶复合体在宿主细胞内表达,由此避免脱靶切割的风险并且可以有效地实现宿主基因组的编辑。对用于发生核酸碱基转换反应、固定靶向位点的修饰所需要的时期而言,根据宿主细胞的种类、培养条件等而不同,但由于至少需要经过数代的细胞分裂,因此可认为需要2-3天左右。本领域技术人员可以基于使用培养条件等而适当确定优选的表达诱导期。对编码本发明的核酸修饰酶复合体的核酸的表达诱导期而言,在对宿主细胞不产生副作用,且可保持宿主细胞的再分化能力的范围,可以超出上述“固定靶位点的修饰所需要的时期”并延长。
作为将本发明的核酸修饰酶复合体在期望的时期进行一过性地表达的方法,可列举产生以能够控制表达期的形态,包含编码该核酸修饰酶复合体的核酸(在crispr-cas系统中,编码指导rna-的dna、和编码突变cas及核酸碱基置换酶的dna)的构建体(表达载体),并导入单子叶植物細胞的方法。作为“能够控制表达期的形态”,具体而言,可列举将编码本发明的核酸修饰酶复合体的dna置于诱导性的调节区的操纵下的形态。对“诱导性的调节区”没有特别限制,可列举例如:上述诱导启动子(例如,pr1α基因启动子、rd29a基因启动子、gst-27基因启动子等)。
以下,根据实施例对本发明进行说明。但是,本发明并不限于这些实施例。
实施例
1.载体构建
(1)target-aid评价用载体的构建
利用常规方法产生了具有图1a所示的结构的prit3-egfp(具有egfporf;seqidno:9)和prit3-megfp(在egfp开始密码子后直接存在终始密码子;seqidno:10)。
(2)target-aid载体的构建
通过以下产生了具有图1b所示的结构的target-aid载体2408(编码dcas9的;seqidno:11)和2409(编码d10a突变体的;seqidno:12):将pzh_osu6grna_mmcas9(plantmolbiol(2015)88:561-572)的osopt.cas9取代为编码(具有h840a及d10a的双重突变、或仅d10a突变的)突变cas9的dna,在其下游在两末端加上了编码源自sv40的核定位信号(nls)的序列,并使其与编码针对拟南芥的密码子使用而最优化的pmcda1的dna融合。
2.向农杆菌细菌导入target-aid及评价用载体
将作为target-aid载体的2408和2409(图1b)、作为评价用载体的prit3-egfp和prit3-megfp(图1a),通过电穿孔(biorad公司micropulser电穿孔系统)导入农杆菌细菌(根癌土壤杆菌(agrobacteriumtumefaciens)eha101株)。
首先,以下述的顺序进行了农杆菌细菌的感受态细胞的产生。
将农杆菌菌株涂布于yeb琼脂培养基(牛肉提取物5g/l、酵母提取物1g/l、bacto蛋白胨1g/l、蔗糖5g/l、mgso42mm、bacto琼脂12g(1.2%)),于28℃、暗处培养2天时间。将得到的单一菌落接菌至yeb液体培养基5ml后,于28℃、暗处振荡培养12小时,将悬浊液200μl加入200ml的yeb液体培养基,于28℃、暗处进行振荡培养,增殖至od600=0.2-0.4。然后将菌体进行离心(3000rpm,4℃、10分钟)收集细菌,悬浊于20ml的10mmhepes(ph8.0),重复离心2-3次。将通过离心回收的菌体悬浊于灭菌的10%丙三醇水溶液2ml,制成了感受态细胞。下面,以后述的顺序将各载体导入农杆菌。将各载体以1μg/μl的浓度溶解于灭菌水,与上述的农杆菌细菌悬浊液50μl混合,移至微脉冲比色皿(0.1cm间隙,biorad公司)进行了电穿孔(2.2kv,5.8ms)。然后,向该液体添加800μl的yeb液体培养基,于28℃、暗处2小时振荡培养,涂布于包含100mg/l大观霉素的yeb琼脂培养基,于28℃、暗处培养36~48小时。将得到的细菌菌落在包含100mg/l大观霉素的yeb液体培养基5ml中增殖,以丙三醇(最终浓度35%)储存液形式移液至微管,于-80℃保存。
3.将target-aid评价用载体导入水稻培养细胞
水稻的转化基本依照terada等的方法(terada,r.,urawa,h.,inagaki,y.,tsugane,k.,andiida,s.(2002)efficientgenetargetingbyhomologousrecombinationinrice.nat.biotechnol.20,1030-1034)进行。
3-1.准备转化用的水稻愈伤组织
摘除约100粒水稻(oryzasativa.ljaponica品种;日本晴)的种子的稻壳,在70%乙醇中振荡1分钟后,在2.5%次氯酸钠中浸渍20-30分钟进行灭菌。之后,用灭菌用水涮洗,接芽于2n6培养基(n6培养基用混合盐(sigma-aldrich公司)4.0g/l、酪蛋白氨基酸300mg/l、肌肉肌醇100mg/l、烟酸0.5mg/l、吡哆醇盐酸盐0.5mg/l、盐酸硫胺0.5mg/l、l-脯氨酸2878mg/l、蔗糖30.0g/l、2,4-d(2,4-二氯苯氧乙酸)2mg/l、gelrite4.0g/l、ph5.8)上,于暗处、31.5℃培养3周,诱导成源自胚盘细胞的去分化细胞团块(愈伤组织)。之后,每1个月选择细胞分裂活性高的愈伤组织进行传代培养,将从培养开始经历4个月的愈伤组织用于转化。
3-2.准备转化用的农杆菌细菌
在冰上溶解导入了target-aid评价用载体的各农杆菌菌液,将其中300μl涂布于添加了100mg/l大观霉素的ab培养基(nh4cl1g/l、mgso4·7h2o3g/l、kcl0.15g/l、cacl2·2h2o0.012g/l、feso4·7h2o0.0025g/l、k2hpo43g/l、nah2po4·h2o1.15g/l、蔗糖5.5g/l、琼脂糖6.0g/l、ph7.2),于28℃、暗处培养3天时间。之后,将增殖的农杆菌细菌悬浊于添加了40mg/l的乙酰丁香酮(3',5'-二甲氧基-4'-羟基-苯乙酮)的aai液体培养基(mgso4·7h2o5g/l、cacl2·2h2o1.5g/l、nah2po4·h2o1.5g/l、kcl29.5g/l、mnso4·4h2o10g/l、znso4·7h2o2g/l、h3bo33g/l、ki0.75g/l、na2moo4·2h2o0.25g/l、cocl2·6h2o25mg/l、cuso4·5h2o25mg/l、feso4·7h2o13.9g/l、na2edta18.7g/l、肌肉肌醇100mg/l、盐酸硫胺0.01g/l、烟酸1mg/l、吡哆醇盐酸盐1mg/l)于25℃振荡培养2小时。将该悬浊液用包含40mg/ml的乙酰丁香酮的aai液体培养基进行稀释,制备了为od600=0.008的悬浊液120ml。
3-3.prit3-egfp、prit3-megfp导入水稻愈伤组织(农杆菌细菌接种、共存培养、灭菌、水稻重组体愈伤组织选择)
将水稻愈伤组织约5g收集于灭菌的玻璃烧杯,加入导入了各载体的农杆菌细菌悬浊液(上述),振荡3-5分钟同时进行接种。将悬浊液用不锈钢网(接缝开口1.5mm)过滤,除去多余的农杆菌细菌。然后,在2n6共存培养基(n6培养基用混合盐(sigma公司制)4.0g/l、酪蛋白氨基酸300mg/l、肌肉肌醇100mg/l、烟酸0.5mg/l、吡哆醇盐酸盐0.5mg/l、盐酸硫胺0.5mg/l、蔗糖30.0g/l、葡萄糖10g/l、2,4-d2mg/l、gelrite4.0g/l、乙酰丁香酮40mg/l,ph5.2)上铺上灭菌滤纸,在其上用镊子以等间隔排列愈伤组织,于25℃、暗处共存培养3天时间。之后,为了将共存培养后的愈伤组织进行农杆菌细菌灭菌,将愈伤组织收集于500ml的烧杯,使用灭菌液1(包含万古霉素200mg/l、tween2020μl/l的灭菌水)300ml,在搅拌的同时洗涤30分钟。之后,将愈伤组织收集于不锈钢网,用纸巾除去愈伤组织周边的水分后,使用灭菌液2(包含万古霉素200mg/l、tween2020μl/l的灭菌水)300ml,重复四次同样的灭菌操作。然后,将灭菌后的愈伤组织用2n6nu培养基(n6培养基用混合盐[sigma公司制]4.0g/l、酪蛋白氨基酸300mg/l、肌肉肌醇100mg/l、烟酸0.5mg/l、吡哆醇盐酸盐0.5mg/l、盐酸硫胺0.5mg/l、l-脯氨酸2878mg/l、蔗糖30.0g/l、2,4-d2mg/l、gelrite4.0g/l、万古霉素100mg/l、美洛培南25mg/l,ph5.8)调养培养5天时间。之后,用包含巴龙霉素(paromomycin)50mg/l的选择培养基2n6sepa50(n6培养基用混合盐[sigma公司制]4.0g/l、酪蛋白氨基酸300mg/l、肌肉肌醇100mg/l、烟酸0.5mg/l、吡哆醇盐酸盐0.5mg/l、盐酸硫胺0.5mg/l、l-脯氨酸2878mg/l、蔗糖30.0g/l、2,4-d2mg/l、琼脂糖8.0g/l、万古霉素100mg/l、美洛培南25mg/l、ph5.8)上以等间隔排列,于31.5℃的暗处进行培养约6周。其结果选择出了多个谱系(lineages)的巴龙霉素抗性愈伤组织。
3-4.对导入了prit3-egfp、prit3-megfp的水稻愈伤组织的分析
从导入prit3-egfp并显示巴龙霉素抗性的愈伤组织中任意选择96个谱系,用于以后的分析。从各谱系的愈伤组织的一部分利用自动核酸提取装置(kurabo株式会社px-80)提取基因组dna,进行了使用引物组”sbfi-p35s-f”(seqidno:13)和“egfp-noti-r”(seqidno:14)(表1)的pcr分析,结果检测到源自prit3-egfp的1238bp的dna片段,确认了基因重组体。然后,对其进行使用实体荧光显微镜的观察,结果全部检测到egfp信号(图2)。对导入了prit3-megfp的愈伤组织也进行了同样的分析,通过pcr分析确认了基因重组体。对它们进行了实体荧光显微镜下的观察,结果完全未检测到egfp信号(图2)。
[表1]
3-5.将prit3-megfp和2408、或prit3-megfp和2409同时导入水稻愈伤组织(农杆菌细菌接种、共存培养、灭菌、水稻重组体愈伤组织选择)
基本操作根据3-3。将具有prit3-megfp的农杆菌的菌液和具有2408或2409的农杆菌的菌液等量混合,接种了水稻愈伤组织约30g。以后至调养培养为止的操作,参照上述。在选择培养中,使用了包含潮霉素(hygromycin)40mg/l、巴龙霉素(paromomycin)50mg/l的2n6seh40pa50培养基。在约6周的选择培养之后,可以确认对潮霉素和巴龙霉素显示抗性的愈伤组织有多个谱系,在导入prit3-megfp和2408的情况下得到了14个谱系,在导入prit3-megfp和2409的情况下得到了56个谱系。
3-6.对导入了prit3-megfp和2408、或prit3-megfp和2409的水稻愈伤组织的分析
从选择的各谱系的愈伤组织提取基因组dna,进行了使用引物组“sbfi-p35s-f”和“egfp-noti-r”、及”hmr-f”(seqidno:15)和“hmr2408r-1”(seqidno:16)(表1)的pcr分析,结果内置了prit3-megfp的双重转化体有269个谱系,内置了prit3-megfp和2409的双重转化体有264个谱系(表2、图3)。
[表2]
然后,对全部双重转化体愈伤组织使用实体荧光显微镜进行观察,结果通过内置了prit3-megfp和2409的2个谱系(no.6、3)确认了egfp的表达(图4、5)。为了确认这些愈伤组织中的基于target-aid的基因组序列修饰,在各谱系中从表达egfp的愈伤组织提取基因组dna,使用引物组“sbfi-p35s-f”和“egfp-noti-r”(表1)的pcr产物通过monofasdna纯化试剂盒i(glsciences公司)进行纯化,克隆至pcr4blunttopo载体(thermofisher公司)sbfi-noti位点之间。对总和111个克隆利用dna测序来解读碱基序列,结果在一部分中确认了基于target-aid的碱基序列修饰(表3、图6a、b)。在切口酶型的2409中,发生较短的缺失突变(1-20个核苷酸)的频率较高,但也发生了单纯的碱基取代(图7)。
[表3]
另一方面,在使用欠缺两条链的切割能力的cas9(2408)的情况下,作为导入突变方式以碱基取代为主(图8、9、10),对发生碱基取代的区域而言,比芽殖酵母的情况下更宽,确认到至靶核苷酸序列外(pam序列的上游21个核苷酸)为止(图10)。另外,在gfp信号阴性细胞中,未在靶核苷酸序列及其附近导入突变(图11)。
4.对水稻的内源性基因als(乙酰乳酸合成酶(acetolactatesynthase))的修饰
迄今为止,基于target-aid的外源性报告基因的修饰已经成功,因此下面实施了对水稻内源性基因的修饰。作为对象选择了als(乙酰乳酸合成酶)基因,尝试了通过基因序列内的靶向碱基取代,创建使第96位的氨基酸从丙氨酸(a)变化为缬氨酸(v)的突变型als基因(alsa96v)。根据其他种类植物的已有报告,预测表达alsa96v的水稻的植物体及愈伤组织将获得对除草剂(甲氧咪草烟(imazamox))的抗性,但没有先例。另外,也没有试验过甲氧咪草烟对在无菌培养条件下的水稻植物体及愈伤组织的的效果的例子。因此,本实施例中首先作为初步研究,在确认了甲氧咪草烟对无菌培养条件下的水稻的种子及愈伤组织的有效浓度检验(下述4-1、4-2)、基于alsa96v的对甲氧咪草烟的抗性获得(下述4-3)的基础上,实施了基于target-aid的alsa96v修饰(下述4-4)。
4-1.无细菌培养条件中的甲氧咪草烟对水稻植物体的有效浓度的验证
以1/2ms固态培养基(msmix(sigma)、蔗糖15.0g/l、gelrite(和光纯药)4.0g/l、ph5.8)为基础,产生了甲氧咪草烟浓度不同的9个梯度(0mg/l、0.5mg/l、1mg/l、2mg/l、4mg/l、5mg/l、10mg/l、20mg/l、30mg/l)的培养基。接下来,摘除水稻(oryzasativa.ljaponica品种;日本晴)的种子的稻壳,在70%乙醇中振荡1分钟后,在2.5%次氯酸钠中渗透同时浸渍20-30分钟进行灭菌。在每个处理区接芽24粒已灭菌的种子,于25℃、明11小时(8000lux)/暗13小时条件下培养7天时间,观察发芽情况。其结果,在不含有甲氧咪草烟的1/2ms培养基中,24粒种子中有23粒发芽,显示出顺利生长,与此相对,在添加了甲氧咪草烟0.5mg/l或其以上的浓度的培养基中,在全部种子中确认到胚基部变褐,子叶鞘变白,保持在伸长了5mm左右为止(表4)。
从以上判断,在水稻植物体的无菌培养条件下的甲氧咪草烟的有效浓度为0.5mg/l。
[表4]甲氧咪草烟对水稻植物体的有效浓度的评价
4-2.对无细菌培养条件下的甲氧咪草烟对水稻愈伤组织的有效浓度的验证
以2n6固态培养基(上述)为基础,产生了甲氧咪草烟浓度不同的4个梯度(0mg/l、30mg/l、50mg/l、70mg/l)的培养基。从水稻种子的胚盘部诱导愈伤组织(上述),接芽于添加了甲氧咪草烟的2n6固态培养基,于31.5℃、整日暗处培养28天时间,确认了愈伤组织的增殖情况。其结果,在添加了甲氧咪草烟70mg/l的培养基中,愈伤组织发生一定程度的肥大化,阻碍了分裂增殖,与此相对,在50mg/l以下的浓度下确认了愈伤组织的分裂增殖(图12)。
从以上判断,甲氧咪草烟对水稻愈伤组织的有效浓度为70mg/l。
4-3.由突变型als基因(alsa96v)对水稻愈伤组织赋予甲氧咪草烟抗性
为了评价由突变型alsa96v对水稻愈伤组织赋予的甲氧咪草烟抗性,构建了prit4-alswt及prit4-alsa96v的(图13)。prit4为水稻转化用双载体,作为植物用正标记基因具有潮霉素磷酸转移酶(hygromycinphosphotransferase)(hpt)。prit4-alswt为以从野生型水稻(oryzasativa.ljaponica品种;日本晴)提取的基因组dna为基础,通过pcr克隆分离了als基因和其启动子和转录终止区,并组装入prit4。prit4-alsa96v为通过利用pcr的位点特异性的导入突变法,产生人为地导入了a96v突变的als基因,并组装入prit4。将这2种载体导入(上述)农杆菌细菌eha101谱系,转化(上述)为源自水稻种子胚盘的愈伤组织。之后,将愈伤组织在添加了潮霉素(hygromycin)40mg/l的选择培养基(2n6seh50;n6培养基用混合盐[sigma公司制]4.0g/l、酪蛋白氨基酸1000mg/l、肌肉肌醇100mg/l、烟酸0.5mg/l、吡哆醇盐酸盐0.5mg/l、盐酸硫胺0.5mg/l、l-脯氨酸2878mg/l、蔗糖30.0g/l、2,4-d2mg/l、gelrite4.0g/l、万古霉素100mg/l、美洛培南(meropenem)25mg/l、ph5.8)上等间隔排列,于31.5℃、暗处培养约4周。结果得到了导入了prit4-alswt的愈伤组织169个谱系、导入了prit4-alsa96v的愈伤组织263个谱系(表5)。在以后的步骤中,这些愈伤组织每个谱系个别进行培养。将在2n6seh50培养基上增殖的各愈伤组织谱系传代于在2n6seh40中添加了甲氧咪草烟70mg/l的选择培养基(2n6seh40imz70),于31.5℃、暗处培养约6周。其结果,在导入了prit4-alswt的愈伤组织中,对甲氧咪草烟70mg/l显示抗性的愈伤组织仅有6个谱系(3.6%),与此相对,在导入了prit4-alsa96v的情况下,有261个谱系(99.2%)显示抗性(表5)。
根据以上确认了由突变型alsa96v赋予水稻愈伤组织的甲氧咪草烟抗性。
[表5]由突变型alsa96v对水稻愈伤组织赋予甲氧咪草烟抗性
4-4.基于target-aid的alsa96v修饰
target-aid载体1476(dcas-aid)及1477(ncas-aid)被设计为:经过对水稻基因组中的als基因的靶向碱基取代(c287t)而修饰为alsa96v(图14)。将1476、1477导入(上述)农杆菌细菌eha101谱系,用于源自水稻种子胚的愈伤组织约8g的转化(上述)。经过农杆菌细菌的接种、灭菌的愈伤组织,利用2n6nu培养基调养培养14天时间后,在添加了潮霉素(hygromycin)40mg/l的选择培养基(2n6seh40)上等间隔排列,于31.5℃、暗处培养约3周。然后以同样的培养基进行传代,在25℃的暗处培养约10周,得到了导入了1476的愈伤组织155个谱系、导入了1477的愈伤组织203个谱系。在以后的步骤中,每个谱系个别进行培养。将各谱系的愈伤组织分为二,传代于添加了潮霉素(hygromycin)50mg/l的培养基(2n6seh50)和添加了甲氧咪草烟70mg/l的培养基(2n6seh50imz70),与31.5℃的暗处选择培养约6周。在2n6seh50上培养的结果为,所有谱系的愈伤组织发生增殖,与此相对,在2n6seh50imz70上培养的情况下,在导入了1476的愈伤组织中有3个谱系、在导入了1477的愈伤组织中有6个谱系确认增殖。为了确认在这9个谱系的愈伤组织中的als基因序列,提取基因组dna,通过使用引物组“alscloning-f”(seqidno:17)和“alscloning-r”(seqidno:18)的pcr扩增dna片段,并加上了sbfi及noti识别位点。得到的pcr产物利用monofasdna纯化试剂盒i(glsciences公司)进行纯化,克隆至修饰pdonrzeo(thermofisherscientific公司)而成的克隆用载体的sbfi-noti位点之间。使用引物“alsf-1”(seqidno:19)利用dna测序(abi,3130xl)对得到的质粒克隆分析了碱基序列。使用了的引物序列示于表1。
其结果,在导入1477并显示甲氧咪草烟抗性的6个谱系中,在4个谱系中导入了als基因中的a96v突变。其中的3个谱系中,确认了发生a96v突变的靶向碱基的取代(c287t)(图15b)。其余1个谱系中,确认了c287t以及氨基酸序列不发生变化的c285t(图15c)。这些均为在载体1477的靶序列内的从c变为t的碱基取代。另外,对这些谱系确认了als基因及其启动子和转录终止区的基因组序列,但未确认到除了c285t及c287t以外的突变。因此,判断成功实现了基于target-aid的水稻内在性als伝子的修饰和基于其的除草剂抗性的赋予。需要说明的是,对于成功地导入对als基因的a96v突变的4个谱系中的3个谱系,t0植物体成功地进行了再分化(图16)。对得到的t0植物体,对通过使用了“alscloning-f”和“alscloning-r”的pcr所扩增的dna片段使用“alsf-1”进行直接测序,结果确认了在与全部源自t0植物体的愈伤组织中相同的突变(c287t或c285t/c287t)(图17)。
5.基于target-aid的多个基因的同时修饰
target-aid载体2455(dcas-aid)被产生用于同时修饰prit3-megfp上的megfp基因及水稻内源性的als基因,分别与2408/2409及1476/1477表达相同的grna。将导入了prit3-megfp的愈伤组织约17g通过上述的方法导入2455,得到了124个谱系的双重转化谱系(doubletransformantlineage)。对它们进行了利用实体荧光显微镜的观察,结果在3个谱系中确认了egfp的表达。进一步,将这3个谱系的愈伤组织传代至2n6seh40imz70培养基,于31.5℃的暗处中培养约6周,结果均显示了甲氧咪草烟的抗性,活跃地增殖。从3个谱系的愈伤组织提取基因组dna,通过使用引物组“sbfi-p35s-f”和“egfp-noti-r”,或“alscloning-f”和“alscloning-r”的pcr,扩增了megfp基因区域及als基因区域。得到的pcr产物利用monofasdna纯化试剂盒i(glsciences公司)纯化,供直接测序用。结果在1个谱系中确认了在megfp基因和als基因两者中的基于target-aid的靶向碱基取代(图18)。直接设定在megfp基因的开始密码子后的终止密码子(tag)被修饰为与酪氨酸相对应的tat,紧接其后的gtg被修饰为与甲硫氨酸相对应的atg(图18a)。在als基因中确认了c287t(图18b)。
根据以上,验证了可以利用target-aid同时修饰水稻基因组中的多个靶序列。
工业实用性
根据本发明,可以不伴随dna双链的切割,安全地向任意单子叶植物导入位点特异性的突变。如上得到的基因修饰单子叶植物,在以水稻等主要谷物为首的单子叶植物的分子育种中极其有用。
本申请以在日本申请的日本特愿2015-232379(申请日:2015年11月27日)及日本特愿2016-134613(申请日:2016年7月6日)为基础,并将其内容全部并入本说明书。
sequencelisting
<110>国立大学法人神户大学(nationaluniversitycorporationkobeuniversity)
<120>用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体
<130>092545
<150>jp2015-232379
<151>2015-11-27
<150>jp2016-134613
<151>2016-07-06
<160>19
<170>patentin3.5版
<210>1
<211>627
<212>dna
<213>人工序列
<220>
<223>针对拟南芥(arabidopsisthaliana)优化的pmcda密码子。
<220>
<221>cds
<222>(1)..(627)
<400>1
atgacagatgctgaatatgtcagaatccacgaaaagttggacatttac48
metthraspalaglutyrvalargilehisglulysleuaspiletyr
151015
acgtttaagaagcagttcttcaacaacaagaaatctgtttcgcatagg96
thrphelyslysglnphepheasnasnlyslysservalserhisarg
202530
tgctatgtgcttttcgaactaaaacgtcgtggagaaagacgggcttgc144
cystyrvalleuphegluleulysargargglygluargargalacys
354045
ttttggggttacgcggttaacaaaccacaatcaggtactgaacgagga192
phetrpglytyralavalasnlysproglnserglythrgluarggly
505560
atacacgctgaaatcttttctatccgaaaggttgaggaatatctacgt240
ilehisalagluilepheserilearglysvalgluglutyrleuarg
65707580
gacaatcctggacagttcactatcaattggtattctagctggtcacca288
aspasnproglyglnphethrileasntrptyrsersertrpserpro
859095
tgtgcagattgtgctgagaagattctcgaatggtacaatcaagagctt336
cysalaaspcysalaglulysileleuglutrptyrasnglngluleu
100105110
agaggcaatggacatacattgaaaatatgggcatgcaagctctactac384
argglyasnglyhisthrleulysiletrpalacyslysleutyrtyr
115120125
gaaaagaatgccagaaaccaaattgggctttggaacttgagggataat432
glulysasnalaargasnglnileglyleutrpasnleuargaspasn
130135140
ggagttgggcttaatgtcatggtttctgagcactatcaatgttgtcgg480
glyvalglyleuasnvalmetvalsergluhistyrglncyscysarg
145150155160
aagatcttcatacaaagttcccataaccagttgaatgagaacagatgg528
lysilepheileglnserserhisasnglnleuasngluasnargtrp
165170175
ttagagaaaacccttaaaagagccgagaagagaagatccgaactgagc576
leuglulysthrleulysargalaglulysargargsergluleuser
180185190
attatgatacaggtcaaaattctgcataccactaagagtccagctgta624
ilemetileglnvallysileleuhisthrthrlysserproalaval
195200205
ggt627
gly
<210>2
<211>209
<212>prt
<213>人工序列
<220>
<223>合成结构
<400>2
metthraspalaglutyrvalargilehisglulysleuaspiletyr
151015
thrphelyslysglnphepheasnasnlyslysservalserhisarg
202530
cystyrvalleuphegluleulysargargglygluargargalacys
354045
phetrpglytyralavalasnlysproglnserglythrgluarggly
505560
ilehisalagluilepheserilearglysvalgluglutyrleuarg
65707580
aspasnproglyglnphethrileasntrptyrsersertrpserpro
859095
cysalaaspcysalaglulysileleuglutrptyrasnglngluleu
100105110
argglyasnglyhisthrleulysiletrpalacyslysleutyrtyr
115120125
glulysasnalaargasnglnileglyleutrpasnleuargaspasn
130135140
glyvalglyleuasnvalmetvalsergluhistyrglncyscysarg
145150155160
lysilepheileglnserserhisasnglnleuasngluasnargtrp
165170175
leuglulysthrleulysargalaglulysargargsergluleuser
180185190
ilemetileglnvallysileleuhisthrthrlysserproalaval
195200205
gly
<210>3
<211>4104
<212>dna
<213>人工序列
<220>
<223>针对小鼠优化的cas9密码子。
<220>
<221>cds
<222>(1)..(4101)
<400>3
atggacaagaagtactcgatcgggctggmcatcggaacaaattctgta48
metasplyslystyrserileglyleuxaaileglythrasnserval
151015
ggctgggctgtaataaccgatgagtacaaggtgccctctaaaaaattt96
glytrpalavalilethraspglutyrlysvalproserlyslysphe
202530
aaggtccttggcaatacggatagacattccataaagaagaatcttatc144
lysvalleuglyasnthrasparghisserilelyslysasnleuile
354045
ggtgcgctgctctttgacagcggcgagaccgcggaggcgacccggttg192
glyalaleuleupheaspserglygluthralaglualathrargleu
505560
aaacgcaccgcgagacgccgttacacaaggcgtaagaatagaatctgt240
lysargthralaargargargtyrthrargarglysasnargilecys
65707580
tatctccaggagatattctctaatgaaatggcgaaggtagacgattcc288
tyrleuglngluilepheserasnglumetalalysvalaspaspser
859095
ttctttcaccgtctggaggaaagttttctcgttgaggaagataagaaa336
phephehisargleuglugluserpheleuvalglugluasplyslys
100105110
catgaaagacacccgatcttcggaaacattgtcgacgaggtcgcttat384
hisgluarghisproilepheglyasnilevalaspgluvalalatyr
115120125
catgaaaagtaccctaccatctaccatcttagaaagaaacttgttgac432
hisglulystyrprothriletyrhisleuarglyslysleuvalasp
130135140
agcacggataaggctgatctcaggctgatatacctggctctggcacat480
serthrasplysalaaspleuargleuiletyrleualaleualahis
145150155160
atgattaagttcagagggcatttccttatcgaaggcgacctgaatcca528
metilelyspheargglyhispheleuilegluglyaspleuasnpro
165170175
gataattcagatgtagacaagctcttcattcaacttgtgcagacttat576
aspasnseraspvalasplysleupheileglnleuvalglnthrtyr
180185190
aatcagctcttcgaagaaaatccaataaacgcgtcgggtgtagacgca624
asnglnleupheglugluasnproileasnalaserglyvalaspala
195200205
aaggccatactgtccgctaggctttctaagtcacgtagacttgagaat672
lysalaileleuseralaargleuserlysserargargleugluasn
210215220
ctcattgcccaactccccggcgagaagaagaacggcttgtttggaaat720
leuilealaglnleuproglyglulyslysasnglyleupheglyasn
225230235240
ctgatagcgctgtccctgggtcttacaccaaatttcaagagtaatttc768
leuilealaleuserleuglyleuthrproasnphelysserasnphe
245250255
gatttggcagaagatgctaagttgcagctcagtaaagacacctacgat816
aspleualagluaspalalysleuglnleuserlysaspthrtyrasp
260265270
gacgatcttgataatttgttggctcagattggcgatcagtatgcagat864
aspaspleuaspasnleuleualaglnileglyaspglntyralaasp
275280285
cttttcttggccgctaagaatttgtctgatgcaattctgcttagcgac912
leupheleualaalalysasnleuseraspalaileleuleuserasp
290295300
attttgagggttaatacagaaatcaccaaggcacccttgtcggcgtca960
ileleuargvalasnthrgluilethrlysalaproleuseralaser
305310315320
atgataaagaggtatgatgagcaccaccaagacctgacgctcctcaag1008
metilelysargtyraspgluhishisglnaspleuthrleuleulys
325330335
gctcttgttcggcagcaattgccggagaagtacaaagagatcttcttc1056
alaleuvalargglnglnleuproglulystyrlysgluilephephe
340345350
gaccagtctaagaacggatatgcgggctacatagacggtggagcgagt1104
aspglnserlysasnglytyralaglytyrileaspglyglyalaser
355360365
caggaggaattctacaagttcataaagcccattctcgagaagatggat1152
glnglugluphetyrlyspheilelysproileleuglulysmetasp
370375380
ggtacggaagaactgcttgtgaaacttaacagagaagatcttttgcgg1200
glythrglugluleuleuvallysleuasnarggluaspleuleuarg
385390395400
aagcagagaactttcgacaacggaagtataccacaccagatacatctc1248
lysglnargthrpheaspasnglyserileprohisglnilehisleu
405410415
ggagagcttcatgctattctcagaagacaagaggatttctaccctttc1296
glygluleuhisalaileleuargargglngluaspphetyrprophe
420425430
ttgaaggataacagagaaaagatagagaagatcctcacgtttaggatc1344
leulysaspasnargglulysileglulysileleuthrpheargile
435440445
ccttactacgtaggtcctcttgctcgcggcaatagtaggttcgcctgg1392
protyrtyrvalglyproleualaargglyasnserargphealatrp
450455460
atgacccgcaagtctgaagaaactatcaccccttggaatttcgaagag1440
metthrarglysserglugluthrilethrprotrpasnphegluglu
465470475480
gttgtagacaaaggtgcttcagcacagagtttcattgagaggatgacc1488
valvalasplysglyalaseralaglnserpheilegluargmetthr
485490495
aacttcgacaagaacctccccaacgaaaaggtcctgcctaagcacagc1536
asnpheasplysasnleuproasnglulysvalleuprolyshisser
500505510
ctcctctacgaatactttactgtctataatgagcttacaaaagttaag1584
leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys
515520525
tacgtgacagagggaatgcggaagcccgcattcctttccggagaacaa1632
tyrvalthrgluglymetarglysproalapheleuserglyglugln
530535540
aagaaggcgatcgtggatcttctcttcaagacgaaccgcaaggtgacg1680
lyslysalailevalaspleuleuphelysthrasnarglysvalthr
545550555560
gttaaacagttgaaggaagattacttcaagaagatagaatgttttgat1728
vallysglnleulysgluasptyrphelyslysileglucyspheasp
565570575
agcgtggaaatcagcggcgtcgaagataggttcaacgcttccctggga1776
servalgluileserglyvalgluaspargpheasnalaserleugly
580585590
acgtaccacgatctcctcaagattatcaaagataaggactttcttgat1824
thrtyrhisaspleuleulysileilelysasplysasppheleuasp
595600605
aacgaagagaatgaggacatcttggaagacattgttctgacgctcacc1872
asnglugluasngluaspileleugluaspilevalleuthrleuthr
610615620
ctgttcgaagatcgcgagatgattgaggaacgcttgaagacctacgca1920
leuphegluaspargglumetileglugluargleulysthrtyrala
625630635640
cacctgttcgatgacaaggttatgaagcaacttaaacggcgccggtat1968
hisleupheaspasplysvalmetlysglnleulysargargargtyr
645650655
acgggctggggacggctttcgcggaagctgataaatggaatccgtgac2016
thrglytrpglyargleuserarglysleuileasnglyileargasp
660665670
aagcagtctggcaagacaatactcgacttcttgaagtcggatggtttt2064
lysglnserglylysthrileleuasppheleulysseraspglyphe
675680685
gccaatagaaattttatgcaactcattcatgatgactcgcttactttt2112
alaasnargasnphemetglnleuilehisaspaspserleuthrphe
690695700
aaggaggacatccagaaggcccaggtatcaggacagggtgactctttg2160
lysgluaspileglnlysalaglnvalserglyglnglyaspserleu
705710715720
cacgaacacatcgcgaacctggcgggctcccccgcgattaagaaggga2208
hisgluhisilealaasnleualaglyserproalailelyslysgly
725730735
attttgcagactgtcaaggtggtcgatgaactcgtgaaggttatggga2256
ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly
740745750
cgtcataagccggaaaatattgtgattgagatggctcgcgagaatcaa2304
arghislysprogluasnilevalileglumetalaarggluasngln
755760765
acaacacagaagggccaaaagaacagtagagaacgcatgaagcgcatc2352
thrthrglnlysglyglnlysasnserarggluargmetlysargile
770775780
gaagagggcatcaaagagctgggcagtcagatccttaaagaacatcca2400
glugluglyilelysgluleuglyserglnileleulysgluhispro
785790795800
gtcgagaatacacagcttcagaacgaaaagctgtacctttattacctt2448
valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu
805810815
caaaatgggcgtgatatgtatgtggatcaggaactcgatatcaatagg2496
glnasnglyargaspmettyrvalaspglngluleuaspileasnarg
820825830
ctgagtgactatgatgtcgacsmtatcgtcccgcaaagtttcctcaag2544
leuserasptyraspvalaspxaailevalproglnserpheleulys
835840845
gacgacagtatagacaacaaagttctcacacggtcagataagaatcgc2592
aspaspserileaspasnlysvalleuthrargserasplysasnarg
850855860
ggcaagagcgataatgtaccgtcggaggaggtagtcaagaagatgaag2640
glylysseraspasnvalproserglugluvalvallyslysmetlys
865870875880
aattactggcgccagttgctcaacgccaagctcatcactcagaggaaa2688
asntyrtrpargglnleuleuasnalalysleuilethrglnarglys
885890895
tttgacaaccttacgaaagccgagcggggcggactctctgaactggac2736
pheaspasnleuthrlysalagluargglyglyleusergluleuasp
900905910
aaggccggtttcataaagcgccagctcgttgagacacgtcaaattact2784
lysalaglypheilelysargglnleuvalgluthrargglnilethr
915920925
aagcacgtcgctcaaatattggattcccgcatgaatactaagtacgat2832
lyshisvalalaglnileleuaspserargmetasnthrlystyrasp
930935940
gagaatgataagctcatacgtgaagttaaggtcattactctcaagtcc2880
gluasnasplysleuilearggluvallysvalilethrleulysser
945950955960
aagcttgtatcggacttccgtaaggacttccaattctacaaggtccgg2928
lysleuvalseraspphearglysasppheglnphetyrlysvalarg
965970975
gaaatcaataattatcaccatgcccatgacgcttatctgaacgcggtc2976
gluileasnasntyrhishisalahisaspalatyrleuasnalaval
980985990
gtgggcacggcactcattaagaaatacccaaaacttgagtcagaattt3024
valglythralaleuilelyslystyrprolysleuglusergluphe
99510001005
gtttacggggactataaagtttatgacgtgcggaagatgatagcg3069
valtyrglyasptyrlysvaltyraspvalarglysmetileala
101010151020
aagtcggaacaagagataggaaaggcgactgcaaagtactttttt3114
lyssergluglngluileglylysalathralalystyrphephe
102510301035
tactccaacataatgaatttctttaagaccgaaataacccttgca3159
tyrserasnilemetasnphephelysthrgluilethrleuala
104010451050
aacggtgaaatcagaaagcggcctctgattgaaacaaatggcgag3204
asnglygluilearglysargproleuilegluthrasnglyglu
105510601065
acgggcgagatcgtctgggacaaggggagggacttcgcaacggtt3249
thrglygluilevaltrpasplysglyargaspphealathrval
107010751080
cgcaaggtccttagcatgccgcaagtaaatatagttaagaagacg3294
arglysvalleusermetproglnvalasnilevallyslysthr
108510901095
gaagttcagaccggcggctttagtaaagaaagcatacttcctaaa3339
gluvalglnthrglyglypheserlysgluserileleuprolys
110011051110
aggaattccgacaaactgatagcgcgcaagaaggactgggatcca3384
argasnserasplysleuilealaarglyslysasptrpasppro
111511201125
aagaagtatggaggatttgactccccaaccgttgcttatagcgtg3429
lyslystyrglyglypheaspserprothrvalalatyrserval
113011351140
ttggtagtagccaaggtggaaaagggtaagtctaagaaattgaag3474
leuvalvalalalysvalglulysglylysserlyslysleulys
114511501155
tcggtgaaggagttgttggggataactataatggagcggagttcg3519
servallysgluleuleuglyilethrilemetgluargserser
116011651170
ttcgagaagaacccaattgactttctcgaagccaaaggctacaag3564
pheglulysasnproileasppheleuglualalysglytyrlys
117511801185
gaggtcaagaaggacctgattattaagttgccaaagtactcgctc3609
gluvallyslysaspleuileilelysleuprolystyrserleu
119011951200
ttcgaactcgagaacgggagaaagcgtatgctggcgtcggcgggc3654
phegluleugluasnglyarglysargmetleualaseralagly
120512101215
gagctgcagaaaggaaacgagctggctttgccatcgaaatacgta3699
gluleuglnlysglyasngluleualaleuproserlystyrval
122012251230
aatttcctgtacctcgcctcacattatgagaagcttaaagggtct3744
asnpheleutyrleualaserhistyrglulysleulysglyser
123512401245
ccagaagacaatgaacagaagcagctgtttgttgaacagcacaag3789
progluaspasngluglnlysglnleuphevalgluglnhislys
125012551260
cactacttggacgagattatagaacaaatctccgagttctctaaa3834
histyrleuaspgluileilegluglnileserglupheserlys
126512701275
cgggttatccttgcagacgccaatttggataaggtcctctcggct3879
argvalileleualaaspalaasnleuasplysvalleuserala
128012851290
tataataagcatagagataagccaatccgggagcaggctgaaaat3924
tyrasnlyshisargasplysproilearggluglnalagluasn
129513001305
atcatacacctctttacgttgactaatttgggtgcgccagcggca3969
ileilehisleuphethrleuthrasnleuglyalaproalaala
131013151320
ttcaagtacttcgatacaacaatcgatcgtaagcgctacacaagc4014
phelystyrpheaspthrthrileasparglysargtyrthrser
132513301335
actaaggaagtcctggacgcgacgctgatacaccagtccattact4059
thrlysgluvalleuaspalathrleuilehisglnserilethr
134013451350
ggactgtatgaaaccagaatagatcttagccagctcggcggtgat4104
glyleutyrgluthrargileaspleuserglnleuglygly
135513601365
<210>4
<211>1367
<212>prt
<213>人工序列
<220>
<221>misc_feature
<222>(10)..(10)
<223>位于定位10的'xaa'代表asp或ala。
<220>
<221>misc_feature
<222>(840)..(840)
<223>位于定位840的'xaa'代表asp、ala、his或pro。
<220>
<223>合成结构
<400>4
metasplyslystyrserileglyleuxaaileglythrasnserval
151015
glytrpalavalilethraspglutyrlysvalproserlyslysphe
202530
lysvalleuglyasnthrasparghisserilelyslysasnleuile
354045
glyalaleuleupheaspserglygluthralaglualathrargleu
505560
lysargthralaargargargtyrthrargarglysasnargilecys
65707580
tyrleuglngluilepheserasnglumetalalysvalaspaspser
859095
phephehisargleuglugluserpheleuvalglugluasplyslys
100105110
hisgluarghisproilepheglyasnilevalaspgluvalalatyr
115120125
hisglulystyrprothriletyrhisleuarglyslysleuvalasp
130135140
serthrasplysalaaspleuargleuiletyrleualaleualahis
145150155160
metilelyspheargglyhispheleuilegluglyaspleuasnpro
165170175
aspasnseraspvalasplysleupheileglnleuvalglnthrtyr
180185190
asnglnleupheglugluasnproileasnalaserglyvalaspala
195200205
lysalaileleuseralaargleuserlysserargargleugluasn
210215220
leuilealaglnleuproglyglulyslysasnglyleupheglyasn
225230235240
leuilealaleuserleuglyleuthrproasnphelysserasnphe
245250255
aspleualagluaspalalysleuglnleuserlysaspthrtyrasp
260265270
aspaspleuaspasnleuleualaglnileglyaspglntyralaasp
275280285
leupheleualaalalysasnleuseraspalaileleuleuserasp
290295300
ileleuargvalasnthrgluilethrlysalaproleuseralaser
305310315320
metilelysargtyraspgluhishisglnaspleuthrleuleulys
325330335
alaleuvalargglnglnleuproglulystyrlysgluilephephe
340345350
aspglnserlysasnglytyralaglytyrileaspglyglyalaser
355360365
glnglugluphetyrlyspheilelysproileleuglulysmetasp
370375380
glythrglugluleuleuvallysleuasnarggluaspleuleuarg
385390395400
lysglnargthrpheaspasnglyserileprohisglnilehisleu
405410415
glygluleuhisalaileleuargargglngluaspphetyrprophe
420425430
leulysaspasnargglulysileglulysileleuthrpheargile
435440445
protyrtyrvalglyproleualaargglyasnserargphealatrp
450455460
metthrarglysserglugluthrilethrprotrpasnphegluglu
465470475480
valvalasplysglyalaseralaglnserpheilegluargmetthr
485490495
asnpheasplysasnleuproasnglulysvalleuprolyshisser
500505510
leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys
515520525
tyrvalthrgluglymetarglysproalapheleuserglyglugln
530535540
lyslysalailevalaspleuleuphelysthrasnarglysvalthr
545550555560
vallysglnleulysgluasptyrphelyslysileglucyspheasp
565570575
servalgluileserglyvalgluaspargpheasnalaserleugly
580585590
thrtyrhisaspleuleulysileilelysasplysasppheleuasp
595600605
asnglugluasngluaspileleugluaspilevalleuthrleuthr
610615620
leuphegluaspargglumetileglugluargleulysthrtyrala
625630635640
hisleupheaspasplysvalmetlysglnleulysargargargtyr
645650655
thrglytrpglyargleuserarglysleuileasnglyileargasp
660665670
lysglnserglylysthrileleuasppheleulysseraspglyphe
675680685
alaasnargasnphemetglnleuilehisaspaspserleuthrphe
690695700
lysgluaspileglnlysalaglnvalserglyglnglyaspserleu
705710715720
hisgluhisilealaasnleualaglyserproalailelyslysgly
725730735
ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly
740745750
arghislysprogluasnilevalileglumetalaarggluasngln
755760765
thrthrglnlysglyglnlysasnserarggluargmetlysargile
770775780
glugluglyilelysgluleuglyserglnileleulysgluhispro
785790795800
valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu
805810815
glnasnglyargaspmettyrvalaspglngluleuaspileasnarg
820825830
leuserasptyraspvalaspxaailevalproglnserpheleulys
835840845
aspaspserileaspasnlysvalleuthrargserasplysasnarg
850855860
glylysseraspasnvalproserglugluvalvallyslysmetlys
865870875880
asntyrtrpargglnleuleuasnalalysleuilethrglnarglys
885890895
pheaspasnleuthrlysalagluargglyglyleusergluleuasp
900905910
lysalaglypheilelysargglnleuvalgluthrargglnilethr
915920925
lyshisvalalaglnileleuaspserargmetasnthrlystyrasp
930935940
gluasnasplysleuilearggluvallysvalilethrleulysser
945950955960
lysleuvalseraspphearglysasppheglnphetyrlysvalarg
965970975
gluileasnasntyrhishisalahisaspalatyrleuasnalaval
980985990
valglythralaleuilelyslystyrprolysleuglusergluphe
99510001005
valtyrglyasptyrlysvaltyraspvalarglysmetileala
101010151020
lyssergluglngluileglylysalathralalystyrphephe
102510301035
tyrserasnilemetasnphephelysthrgluilethrleuala
104010451050
asnglygluilearglysargproleuilegluthrasnglyglu
105510601065
thrglygluilevaltrpasplysglyargaspphealathrval
107010751080
arglysvalleusermetproglnvalasnilevallyslysthr
108510901095
gluvalglnthrglyglypheserlysgluserileleuprolys
110011051110
argasnserasplysleuilealaarglyslysasptrpasppro
111511201125
lyslystyrglyglypheaspserprothrvalalatyrserval
113011351140
leuvalvalalalysvalglulysglylysserlyslysleulys
114511501155
servallysgluleuleuglyilethrilemetgluargserser
116011651170
pheglulysasnproileasppheleuglualalysglytyrlys
117511801185
gluvallyslysaspleuileilelysleuprolystyrserleu
119011951200
phegluleugluasnglyarglysargmetleualaseralagly
120512101215
gluleuglnlysglyasngluleualaleuproserlystyrval
122012251230
asnpheleutyrleualaserhistyrglulysleulysglyser
123512401245
progluaspasngluglnlysglnleuphevalgluglnhislys
125012551260
histyrleuaspgluileilegluglnileserglupheserlys
126512701275
argvalileleualaaspalaasnleuasplysvalleuserala
128012851290
tyrasnlyshisargasplysproilearggluglnalagluasn
129513001305
ileilehisleuphethrleuthrasnleuglyalaproalaala
131013151320
phelystyrpheaspthrthrileasparglysargtyrthrser
132513301335
thrlysgluvalleuaspalathrleuilehisglnserilethr
134013451350
glyleutyrgluthrargileaspleuserglnleuglygly
135513601365
<210>5
<211>21
<212>dna
<213>人工序列
<220>
<223>sv40衍生的核定位信号。
<220>
<221>cds
<222>(1)..(21)
<400>5
cctaagaagaarmgkaargtw21
prolyslyslysxaalysxaa
15
<210>6
<211>7
<212>prt
<213>人工序列
<220>
<221>misc_feature
<222>(5)..(5)
<223>位于定位5的'xaa'代表arg或ser。
<220>
<221>misc_feature
<222>(7)..(7)
<223>位于定位7的'xaa'代表val。
<220>
<223>合成结构
<400>6
prolyslyslysxaalysxaa
15
<210>7
<211>19
<212>rna
<213>francisellanovicida
<220>
<221>misc_structure
<222>(1)..(19)
<223>crrna直接重复序列。
<400>7
aauuucuacuguuguagau19
<210>8
<211>83
<212>dna
<213>化脓性链球菌(streptococcuspyogenes)
<220>
<221>misc_structure
<222>(1)..(83)
<223>tracrrna
<400>8
gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagt60
ggcaccgagtcggtggtgctttt83
<210>9
<211>14551
<212>dna
<213>人工序列
<220>
<223>prit3-egfp的完整核苷酸序列。
<400>9
agatggttgttcaagacgatctacgaacgcagtggcagcgccggagagttcaagaagttc60
tgtttcaccgtgcgcaagctgatcgggtcaaatgacctgccggagtacgatttgaaggag120
gaggcggggcaggctggcccgatcctagtcatgcgctaccgcaacctgatcgagggcgaa180
gcatccgccggttcctaatgtacggagcagatgctagggcaaattgccctagcaggggaa240
aaaggtcgaaaaggtctctttcctgtggatagcacgtacattgggaacccaaagccgtac300
attgggaaccggaacccgtacattgggaacccaaagccgtacattgggaaccggtcacac360
atgtaagtgactgatataaaagagaaaaaaggcgatttttccgcctaaaactctttaaaa420
cttattaaaactcttaaaacccgcctggcctgtgcataactgtctggccagcgcacagcc480
gaagagctgcaaaaagcgcctacccttcggtcgctgcgctccctacgccccgccgcttcg540
cgtcggcctatcgcggccgctggccgctcaaaaatggctggcctacggccaggcaatcta600
ccagggcgcggacaagccgcgccgtcgccactcgaccgccggcgcccacatcaaggcacc660
ctgcctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagac720
ggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagc780
gggtgttggcgggtgtcggggcgcagccatgacccagtcacgtagcgatagcggagtgta840
tactggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgt900
gaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgctcttccgcttcctcg960
ctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaag1020
gcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaa1080
ggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctc1140
cgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgaca1200
ggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccg1260
accctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttct1320
catagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgt1380
gtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgag1440
tccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagc1500
agagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctac1560
actagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaaga1620
gttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgc1680
aagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacg1740
gggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatca1800
aaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagt1860
atatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctca1920
gcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacg1980
atacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctca2040
ccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggt2100
cctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagt2160
agttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtca2220
cgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttaca2280
tgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcaga2340
agtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttact2400
gtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctga2460
gaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaacacgggataataccgcg2520
ccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactc2580
tcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactga2640
tcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaat2700
gccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttccttttt2760
caatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgt2820
atttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgac2880
gtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccc2940
tttcgtcttcgaataaatacctgtgacggaagatcacttcgcagaataaataaatcctgg3000
tgtccctgttgataccgggaagccctgggccaacttttggcgaaaatgagacgttgatcg3060
gcacgtaagaggttccaactttcaccataatgaaataagatcactaccgggcgtattttt3120
tgagttatcgagattttcaggagctaaggaagctaaaatggagaaaaaaatcactggata3180
taccaccgttgatatatcccaatggcatcgtaaagaacattttgaggcatttcagtcagt3240
tgctcaatgtacctataaccagaccgttcctggatattacggcctttttaaagaccgtaa3300
agaaaaataagcacaagttttatccggcctttattcacattcttgcccgcctgatgaatg3360
ctcatccggaataattcgaagctcggtcccgtgggtgttctgtcgtctcgttgtacaacg3420
aaatccattcccattccgcgctcaagatggcttcccctcggcagttcatcagggctaaat3480
caatctagccgacttgtccggtgaaatgggctgcactccaacagaaacaatcaaacaaac3540
atacacagcgacttattcacacgagctcaaattacaacggtatatatcctgccagtcagc3600
atcatcacaccaaaagttaggcccgaatagtttgaaattagaaagctcgcaattgaggtc3660
tacaggccaaattcgctcttagccgtacaatattactcaccggtgcgatgccccccatcg3720
taggtgaaggtggaaattaatgatccatcttgagaccacaggcccacaacagctaccagt3780
ttcctcaagggtccaccaaaaacgtaagcgcttacgtacatggtcgataagaaaaggcaa3840
tttgtagatgttaattcccatcttgaaagaaatatagtttaaatatttattgataaaata3900
acaagtcaggtattatagtccaagcaaaaacataaatttattgatgcaagtttaaattca3960
gaaatatttcaataactgattatatcagctggtacattgccgtagatgaaagactgagtg4020
cgatattatgtgtaatacataaattgatgatatagctagcttagctcatcgggggatccg4080
tcgacctgcagccaagctgggatcccagctgggatcccagcttgtcgacggtaccccctc4140
tagagttccttctagacccgatctagtaacatagatgacaccgcgcgcgataatttatcc4200
tagtttgcgcgctatattttgttttctatcgcgtattaaatgtataattgcgggactcta4260
atcataaaaacccatctcataaataacgtcatgcattacatgttaattattacatgctta4320
acgtaattcaacagaaattatatgataatcatcgcaagaccggcaacaggattcaatctt4380
aagaaactttattgccaaatgtttgaacgatcggggatcatccgggtctgtggcgggaac4440
tccacgaaaatatccgaacgcagcaagatatcgcggtgcatctcggtcttgcctgggcag4500
tcgccgccgacgccgttgatgtggacgccgggcccgatcatattgtcgctcaggatcgtg4560
gcgttgtgcttgtcggccgttgctgtcgtaatgatatcggcaccttcgaccgcctgttcc4620
gcagagatcccgtgggcgaagaactccagcatgagatccccgcgctggaggatcatccag4680
ccggcgtcccggaaaacgattccgaagcccaacctttcatagaaggcggcggtggaatcg4740
aaatctcgtgatggcaggttgggcgtcgcttggtcggtcatttcgaaccccagagtcccg4800
ctcagaagaactcgtcaagaaggcgatagaaggcgatgcgctgcgaatcgggagcggcga4860
taccgtaaagcacgaggaagcggtcagcccattcgccgccaagctcttcagcaatatcac4920
gggtagccaacgctatgtcctgatagcggtccgccacacccagccggccacagtcgatga4980
atccagaaaagcggccattttccaccatgatattcggcaagcaggcatcgccatgggtca5040
cgacgagatcatcgccgtcgggcatgcgcgccttgagcctggcgaacagttcggctggcg5100
cgagcccctgatgctcttcgtccagatcatcctgatcgacaagaccggcttccatccgag5160
tacgtgctcgctcgatgcgatgtttcgcttggtggtcgaatgggcaggtagccggatcaa5220
gcgtatgcagccgccgcattgcatcagccatgatggatactttctcggcaggagcaaggt5280
gagatgacaggagatcctgccccggcacttcgcccaatagcagccagtcccttcccgctt5340
cagtgacaacgtcgagcacagctgcgcaaggaacgcccgtcgtggccagccacgatagcc5400
gcgctgcctcgtcctgcagttcattcagggcaccggacaggtcggtcttgacaaaaagaa5460
ccgggcgcccctgcgctgacagccggaacacggcggcatcagagcagccgattgtctgtt5520
gtgcccagtcatagccgaatagcctctccacccaagcggccggagaacctgcgtgcaatc5580
catcttgttcaatcatatctcattgccccccggtctacctacaaaaaagctccgcacgag5640
gctgcatttgtcacaaatcatgaaaagaaaaactaccgatgaacaatgctgagggattca5700
aattctacccacaaaaagaagaaagaaagatctagcacatctaagcctgacgaagcagca5760
gaaatatataaaaatataaaccatagtgcccttttcccctcttcctgatcttgtttagca5820
tggcggaaattttaaaccccccatcatctcccccaacaacggcggatcgcagatctacat5880
ccgagagccccattccccgcgagatccgggccggatccacgccggcgagagccccagccg5940
cgagatcccgcccctcccgcgcaccgatctgggcgcgcacgaagccgcctctcgcccacc6000
caaactaccaaggccaaagatcgagaccgagacggaaaaaaaaaacggagaaagaaagag6060
gagaggggcggggtggttaccggcgcggcggcggcggagggggaggggggaggagctcgt6120
cgtccggcagcgaggggggaggaggtggaggtggtggtggtggtggtggtagggttgggg6180
ggatgggaggagaggggggggtatgtatatagtggcgatggggggcgtttctttggaagc6240
ggagggagggccggcctcgtcgctggctcgcgatcctcctcgcgtttccggcccccacga6300
cccggacccacctgctgttttttctttttcttttttttctttctttttttttttttggct6360
gcgagacgtgcggtgcgtgcggacaactcacggtgatagtgggggggtgtggagactatt6420
gtccagttggctggactggggtgggttgggttgggttgggttgggctgggcttgctatgg6480
atcgtggatagcactttgggctttaggaactttaggggttgtttttgtaaatgttttgag6540
tctaagtttatcttttatttttactagaaaaaatacccatgcgctgcaacgggggaaagc6600
tattttaatcttattattgttcattgtgagaattcgcctgaatatatatttttctcaaaa6660
attatgtcaaattagcatatgggtttttttaaagatatttcttatacaaatccctctgta6720
tttacaaaagcaaacgaacttaaaacccgactcaaatacagatatgcatttccaaaagcg6780
aataaacttaaaaaccaattcatacaaaaatgacgtatcaaagtaccgacaaaaacatcc6840
tcaatttttataatagtagaaaagagtaaatttcactttgggccaccttttattaccgat6900
attttactttataccaccttttaactgatgttttcacttttgaccaggtaatcttacctt6960
tgttttattttggactatcccgactctcttctcaagcatatgaatgaccgtatgctagtg7020
cggccgcaagcttgactactagtctctcttaaggtagcatcacaagtttgtacaaaaaag7080
caggctcctgcaggtgagacttttcaacaaagggtaatatcgggaaacctcctcggattc7140
cattgcccagctatctgtcacttcatcgaaaggacagtagaaaaggaaggtggctcctac7200
aaatgccatcattgcgataaaggaaaggctatcgttcaagatgcctctaccgacagtggt7260
cccaaagatggacccccacccacgaggaacatcgtggaaaaagaagacgttccaaccacg7320
tcttcaaagcaagtggattgatgtgatatctccactgacgtaagggatgacgcacaatcc7380
cactatccttcgcaagacccttcctctatataaggaagttcatttcatttggagaggaca7440
ggcttcttgagatccttcaacaattaccaacaacaacaaacaacaaacaacattacaatt7500
actatttacaattacagtcgactctagaggatccatggtgagcaagggcgaggagctgtt7560
caccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcag7620
cgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctg7680
caccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccttcacctacggcgt7740
gcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccat7800
gcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagac7860
ccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcat7920
cgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagcca7980
caacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccg8040
ccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccat8100
cggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgag8160
caaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgg8220
gatcactcacggcatggacgagctgtacaagtaaagcggccgcccggctgcattcgagta8280
ttatggcattgggaaaactgtttttcttgtaccatttgttgtgcttgtaatttactgtgt8340
tttttattcggttttcgctatcgaactgtgaaatggaaatggatggagaagagttaatga8400
atgatatggtccttttgttcattctcaaattaatattatttgttttttctcttatttgtt8460
gtgtgttgaatttgaaattataagagatatgcaaacattttgttttgagtaaaaatgtgt8520
caaatcgtggcctctaatgaccgaagttaatatgaggagtaaaacactagacccagcttt8580
cttgtacaaagtggtgatgttgtggtcgacccatcgatgggcatgcaagctgggatccca8640
gcttggtaccagatcttataattaaatggccttcgctgcccatattattggtaactcaac8700
agcatcaatcacgggatttttctcgaattaattgcgtcgaatctcagcatcgaaatattc8760
gcctttttcgtccattagactatctattgtgatggtggatttatcacaaatgggacccgc8820
cgccgacagaggtgtgatgttaggccaggactttgaaaatttgcgcaactatcgtatagt8880
ggccgacaaattgacgccgagttgacagactgcctagcatttgagtgaattatgtaaggt8940
aatgggctacactgaattggtagctcaaactgtcagtatttatgtatatgagtgtatatt9000
ttcgcataatctcagaccaatctgaagatgaaatgggtatctgggaatggcgaaatcaag9060
gcatcgatcgtgaagtttctcatctaagcccccatttggacgtgaatgtagacacgtcga9120
aataaagatttccgaattagaataatttgtttattgctttcgcctataaatacgacggat9180
cgtaatttgtcgttttatcaaaatgtactttcattttataataacgctgcggacatctac9240
atttttgaattgaaaaaaaattggtaattactctttctttttctccatattgaccatcat9300
actcattgctgatccatgtagatttcccggacatgaagccatttacaattgaatatatcc9360
tgccgccgctgccgctttgcacccggtggagcttgcatgttggtttctacgcagaactga9420
gccggttaggcagataatttccattgagaactgagccatgtgcaccttccccccaacacg9480
gtgagcgacggggcaacggagtgatccacatgggacttttaaacatcatccgtcggatgg9540
cgttgcgagagaagcagtcgatccgtgagatcagccgacgcaccgggcaggcgcgcaaca9600
cgatcgcaaagtatttgaacgcaggtacaatcgagccgacgttcacggtaccggaacgac9660
caagcaagctagcttagtaaagccctcgctagattttaatgcggatgttgcgattacttc9720
gccaactattgcgataacaagaaaaagccagcctttcatgatatatctcccaatttgtgt9780
agggcttattatgcacgcttaaaaataataaaagcagacttgacctgatagtttggctgt9840
gagcaattatgtgcttagtgcatctaacgcttgagttaagccgcgccgcgaagcggcgtc9900
ggcttgaacgaattgttagacattatttgccgactaccttggtgatctcgcctttcacgt9960
agtggacaaattcttccaactgatctgcgcgcgaggccaagcgatcttcttcttgtccaa10020
gataagcctgtctagcttcaagtatgacgggctgatactgggccggcaggcgctccattg10080
cccagtcggcagcgacatccttcggcgcgattttgccggttactgcgctgtaccaaatgc10140
gggacaacgtaagcactacatttcgctcatcgccagcccagtcgggcggcgagttccata10200
gcgttaaggtttcatttagcgcctcaaatagatcctgttcaggaaccggatcaaagagtt10260
cctccgccgctggacctaccaaggcaacgctatgttctcttgcttttgtcagcaagatag10320
ccagatcaatgtcgatcgtggctggctcgaagatacctgcaagaatgtcattgcgctgcc10380
attctccaaattgcagttcgcgcttagctggataacgccacggaatgatgtcgtcgtgca10440
caacaatggtgacttctacagcgcggagaatctcgctctctccaggggaagccgaagttt10500
ccaaaaggtcgttgatcaaagctcgccgcgttgtttcatcaagccttacggtcaccgtaa10560
ccagcaaatcaatatcactgtgtggcttcaggccgccatccactgcggagccgtacaaat10620
gtacggccagcaacgtcggttcgagatggcgctcgatgacgccaactacctctgatagtt10680
gagtcgatacttcggcgatcaccgcttccctcatgatgtttaactttgttttagggcgac10740
tgccctgctgcgtaacatcgttgctgctccataacatcaaacatcgacccacggcgtaac10800
gcgcttgctgcttggatgcccgaggcatagactgtaccccaaaaaaacagtcataacaag10860
ccatgaaaaccgccactgcgccgttaccaccgctgcgttcggtcaaggttctggaccagt10920
tgcgtgagcgcatacgctacttgcattacagcttacgaaccgaacaggcttatgtccact10980
gggttcgtgccttcatccgtttccacggtgtgcgtcacccggcaaccttgggcagcagcg11040
aagtcgaggcatttctgtcctggctggcgaacgagcgcaaggtttcggtctccacgcatc11100
gtcaggcattggcggccttgctgttcttctacggcaaggtgctgtgcacggatctgccct11160
ggcttcaggagatcggaagacctcggccgtcgcggcgcttgccggtggtgctgaccccgg11220
atgaagtggttcgcatcctcggttttctggaaggcgagcatcgtttgttcgcccagcttc11280
tgtatggaacgggcatgcggatcagtgagggtttgcaactgcgggtcaaggatctggatt11340
tcgatcacggcacgatcatcgtgcgggagggcaagggctccaaggatcgggccttgatgt11400
tacccgagagcttggcacccagcctgcgcgagcaggatcgatccaacccctccgctgcta11460
tagtgcagtcggcttctgacgttcagtgcagccgtcttctgaaaacgacatgtcgcacaa11520
gtcctaagttacgcgacaggctgccgccctgcccttttcctggcgttttcttgtcgcgtg11580
ttttagtcgcataaagtagaatacttgcgactagaaccggagacattacgccatgaacaa11640
gagcgccgccgctggcctgctgggctatgcccgcgtcagcaccgacgaccaggacttgac11700
caaccaacgggccgaactgcacgcggccggctgcaccaagctgttttccgagaagatcac11760
cggcaccaggcgcgaccgcccggagctggccaggatgcttgaccacctacgccctggcga11820
cgttgtgacagtgaccaggctagaccgcctggcccgcagcacccgcgacctactggacat11880
tgccgagcgcatccaggaggccggcgcgggcctgcgtagcctggcagagccgtgggccga11940
caccaccacgccggccggccgcatggtgttgaccgtgttcgccggcattgccgagttcga12000
gcgttccctaatcatcgaccgcacccggagcgggcgcgaggccgccaaggcccgaggcgt12060
gaagtttggcccccgccctaccctcaccccggcacagatcgcgcacgcccgcgagctgat12120
cgaccaggaaggccgcaccgtgaaagaggcggctgcactgcttggcgtgcatcgctcgac12180
cctgtaccgcgcacttgagcgcagcgaggaagtgacgcccaccgaggccaggcggcgcgg12240
tgccttccgtgaggacgcattgaccgaggccgacgccctggcggccgccgagaatgaacg12300
ccaagaggaacaagcatgaaaccgcaccaggacggccaggacgaaccgtttttcattacc12360
gaagagatcgaggcggagatgatcgcggccgggtacgtgttcgagccgcccgcgcacgtc12420
tcaaccgtgcggctgcatgaaatcctggccggtttgtctgatgccaagctggcggcctgg12480
ccggccagcttggccgctgaagaaaccgagcgccgccgtctaaaaaggtgatgtgtattt12540
gagtaaaacagcttgcgtcatgcggtcgctgcgtatatgatgcgatgagtaaataaacaa12600
atacgcaaggggaacgcatgaaggttatcgctgtacttaaccagaaaggcgggtcaggca12660
agacgaccatcgcaacccatctagcccgcgccctgcaactcgccggggccgatgttctgt12720
tagtcgattccgatccccagggcagtgcccgcgattgggcggccgtgcgggaagatcaac12780
cgctaaccgttgtcggcatcgaccgcccgacgattgaccgcgacgtgaaggccatcggcc12840
ggcgcgacttcgtagtgatcgacggagcgccccaggcggcggacttggctgtgtccgcga12900
tcaaggcagccgacttcgtgctgattccggtgcagccaagcccttacgacatatgggcca12960
ccgccgacctggtggagctggttaagcagcgcattgaggtcacggatggaaggctacaag13020
cggcctttgtcgtgtcgcgggcgatcaaaggcacgcgcatcggcggtgaggttgccgagg13080
cgctggccgggtacgagctgcccattcttgagtcccgtatcacgcagcgcgtgagctacc13140
caggcactgccgccgccggcacaaccgttcttgaatcagaacccgagggcgacgctgccc13200
gcgaggtccaggcgctggccgctgaaattaaatcaaaactcatttgagttaatgaggtaa13260
agagaaaatgagcaaaagcacaaacacgctaagtgccggccgtccgagcgcacgcagcag13320
caaggctgcaacgttggccagcctggcagacacgccagccatgaagcgggtcaactttca13380
gttgccggcggaggatcacaccaagctgaagatgtacgcggtacgccaaggcaagaccat13440
taccgagctgctatctgaatacatcgcgcagctaccagagtaaatgagcaaatgaataaa13500
tgagtagatgaattttagcggctaaaggaggcggcatggaaaatcaagaacaaccaggca13560
ccgacgccgtggaatgccccatgtgtggaggaacgggcggttggccaggcgtaagcggct13620
gggttgtctgccggccctgcaatggcactggaacccccaagcccgaggaatcggcgtgag13680
cggtcgcaaaccatccggcccggtacaaatcggcgcggcgctgggtgatgacctggtgga13740
gaagttgaaggccgcgcaggccgcccagcggcaacgcatcgaggcagaagcacgccccgg13800
tgaatcgtggcaagcggccgctgatcgaatccgcaaagaatcccggcaaccgccggcagc13860
cggtgcgccgtcgattaggaagccgcccaagggcgacgagcaaccagattttttcgttcc13920
gatgctctatgacgtgggcacccgcgatagtcgcagcatcatggacgtggccgttttccg13980
tctgtcgaagcgtgaccgacgagctggcgaggtgatccgctacgagcttccagacgggca14040
cgtagaggtttccgcagggccggccggcatggccagtgtgtgggattacgacctggtact14100
gatggcggtttcccatctaaccgaatccatgaaccgataccgggaagggaagggagacaa14160
gcccggccgcgtgttccgtccacacgttgcggacgtactcaagttctgccggcgagccga14220
tggcggaaagcagaaagacgacctggtagaaacctgcattcggttaaacaccacgcacgt14280
tgccatgcagcgtacgaagaaggccaagaacggccgcctggtgacggtatccgagggtga14340
agccttgattagccgctacaagatcgtaaagagcgaaaccgggcggccggagtacatcga14400
gatcgagctagctgattggatgtaccgcgagatcacagaaggcaagaacccggacgtgct14460
gacggttcaccccgattactttttgatcgatcccggcatcggccgttttctctaccgcct14520
ggcacgccgcgccgcaggcaaggcagaagcc14551
<210>10
<211>14569
<212>dna
<213>人工序列
<220>
<223>prit3-megfp的完整核苷酸序列。
<400>10
agatggttgttcaagacgatctacgaacgcagtggcagcgccggagagttcaagaagttc60
tgtttcaccgtgcgcaagctgatcgggtcaaatgacctgccggagtacgatttgaaggag120
gaggcggggcaggctggcccgatcctagtcatgcgctaccgcaacctgatcgagggcgaa180
gcatccgccggttcctaatgtacggagcagatgctagggcaaattgccctagcaggggaa240
aaaggtcgaaaaggtctctttcctgtggatagcacgtacattgggaacccaaagccgtac300
attgggaaccggaacccgtacattgggaacccaaagccgtacattgggaaccggtcacac360
atgtaagtgactgatataaaagagaaaaaaggcgatttttccgcctaaaactctttaaaa420
cttattaaaactcttaaaacccgcctggcctgtgcataactgtctggccagcgcacagcc480
gaagagctgcaaaaagcgcctacccttcggtcgctgcgctccctacgccccgccgcttcg540
cgtcggcctatcgcggccgctggccgctcaaaaatggctggcctacggccaggcaatcta600
ccagggcgcggacaagccgcgccgtcgccactcgaccgccggcgcccacatcaaggcacc660
ctgcctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagac720
ggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagc780
gggtgttggcgggtgtcggggcgcagccatgacccagtcacgtagcgatagcggagtgta840
tactggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgt900
gaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgctcttccgcttcctcg960
ctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaag1020
gcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaa1080
ggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctc1140
cgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgaca1200
ggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccg1260
accctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttct1320
catagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgt1380
gtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgag1440
tccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagc1500
agagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctac1560
actagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaaga1620
gttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgc1680
aagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacg1740
gggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatca1800
aaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagt1860
atatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctca1920
gcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacg1980
atacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctca2040
ccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggt2100
cctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagt2160
agttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtca2220
cgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttaca2280
tgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcaga2340
agtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttact2400
gtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctga2460
gaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaacacgggataataccgcg2520
ccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactc2580
tcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactga2640
tcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaat2700
gccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttccttttt2760
caatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgt2820
atttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgac2880
gtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccc2940
tttcgtcttcgaataaatacctgtgacggaagatcacttcgcagaataaataaatcctgg3000
tgtccctgttgataccgggaagccctgggccaacttttggcgaaaatgagacgttgatcg3060
gcacgtaagaggttccaactttcaccataatgaaataagatcactaccgggcgtattttt3120
tgagttatcgagattttcaggagctaaggaagctaaaatggagaaaaaaatcactggata3180
taccaccgttgatatatcccaatggcatcgtaaagaacattttgaggcatttcagtcagt3240
tgctcaatgtacctataaccagaccgttcctggatattacggcctttttaaagaccgtaa3300
agaaaaataagcacaagttttatccggcctttattcacattcttgcccgcctgatgaatg3360
ctcatccggaataattcgaagctcggtcccgtgggtgttctgtcgtctcgttgtacaacg3420
aaatccattcccattccgcgctcaagatggcttcccctcggcagttcatcagggctaaat3480
caatctagccgacttgtccggtgaaatgggctgcactccaacagaaacaatcaaacaaac3540
atacacagcgacttattcacacgagctcaaattacaacggtatatatcctgccagtcagc3600
atcatcacaccaaaagttaggcccgaatagtttgaaattagaaagctcgcaattgaggtc3660
tacaggccaaattcgctcttagccgtacaatattactcaccggtgcgatgccccccatcg3720
taggtgaaggtggaaattaatgatccatcttgagaccacaggcccacaacagctaccagt3780
ttcctcaagggtccaccaaaaacgtaagcgcttacgtacatggtcgataagaaaaggcaa3840
tttgtagatgttaattcccatcttgaaagaaatatagtttaaatatttattgataaaata3900
acaagtcaggtattatagtccaagcaaaaacataaatttattgatgcaagtttaaattca3960
gaaatatttcaataactgattatatcagctggtacattgccgtagatgaaagactgagtg4020
cgatattatgtgtaatacataaattgatgatatagctagcttagctcatcgggggatccg4080
tcgacctgcagccaagctgggatcccagctgggatcccagcttgtcgacggtaccccctc4140
tagagttccttctagacccgatctagtaacatagatgacaccgcgcgcgataatttatcc4200
tagtttgcgcgctatattttgttttctatcgcgtattaaatgtataattgcgggactcta4260
atcataaaaacccatctcataaataacgtcatgcattacatgttaattattacatgctta4320
acgtaattcaacagaaattatatgataatcatcgcaagaccggcaacaggattcaatctt4380
aagaaactttattgccaaatgtttgaacgatcggggatcatccgggtctgtggcgggaac4440
tccacgaaaatatccgaacgcagcaagatatcgcggtgcatctcggtcttgcctgggcag4500
tcgccgccgacgccgttgatgtggacgccgggcccgatcatattgtcgctcaggatcgtg4560
gcgttgtgcttgtcggccgttgctgtcgtaatgatatcggcaccttcgaccgcctgttcc4620
gcagagatcccgtgggcgaagaactccagcatgagatccccgcgctggaggatcatccag4680
ccggcgtcccggaaaacgattccgaagcccaacctttcatagaaggcggcggtggaatcg4740
aaatctcgtgatggcaggttgggcgtcgcttggtcggtcatttcgaaccccagagtcccg4800
ctcagaagaactcgtcaagaaggcgatagaaggcgatgcgctgcgaatcgggagcggcga4860
taccgtaaagcacgaggaagcggtcagcccattcgccgccaagctcttcagcaatatcac4920
gggtagccaacgctatgtcctgatagcggtccgccacacccagccggccacagtcgatga4980
atccagaaaagcggccattttccaccatgatattcggcaagcaggcatcgccatgggtca5040
cgacgagatcatcgccgtcgggcatgcgcgccttgagcctggcgaacagttcggctggcg5100
cgagcccctgatgctcttcgtccagatcatcctgatcgacaagaccggcttccatccgag5160
tacgtgctcgctcgatgcgatgtttcgcttggtggtcgaatgggcaggtagccggatcaa5220
gcgtatgcagccgccgcattgcatcagccatgatggatactttctcggcaggagcaaggt5280
gagatgacaggagatcctgccccggcacttcgcccaatagcagccagtcccttcccgctt5340
cagtgacaacgtcgagcacagctgcgcaaggaacgcccgtcgtggccagccacgatagcc5400
gcgctgcctcgtcctgcagttcattcagggcaccggacaggtcggtcttgacaaaaagaa5460
ccgggcgcccctgcgctgacagccggaacacggcggcatcagagcagccgattgtctgtt5520
gtgcccagtcatagccgaatagcctctccacccaagcggccggagaacctgcgtgcaatc5580
catcttgttcaatcatatctcattgccccccggtctacctacaaaaaagctccgcacgag5640
gctgcatttgtcacaaatcatgaaaagaaaaactaccgatgaacaatgctgagggattca5700
aattctacccacaaaaagaagaaagaaagatctagcacatctaagcctgacgaagcagca5760
gaaatatataaaaatataaaccatagtgcccttttcccctcttcctgatcttgtttagca5820
tggcggaaattttaaaccccccatcatctcccccaacaacggcggatcgcagatctacat5880
ccgagagccccattccccgcgagatccgggccggatccacgccggcgagagccccagccg5940
cgagatcccgcccctcccgcgcaccgatctgggcgcgcacgaagccgcctctcgcccacc6000
caaactaccaaggccaaagatcgagaccgagacggaaaaaaaaaacggagaaagaaagag6060
gagaggggcggggtggttaccggcgcggcggcggcggagggggaggggggaggagctcgt6120
cgtccggcagcgaggggggaggaggtggaggtggtggtggtggtggtggtagggttgggg6180
ggatgggaggagaggggggggtatgtatatagtggcgatggggggcgtttctttggaagc6240
ggagggagggccggcctcgtcgctggctcgcgatcctcctcgcgtttccggcccccacga6300
cccggacccacctgctgttttttctttttcttttttttctttctttttttttttttggct6360
gcgagacgtgcggtgcgtgcggacaactcacggtgatagtgggggggtgtggagactatt6420
gtccagttggctggactggggtgggttgggttgggttgggttgggctgggcttgctatgg6480
atcgtggatagcactttgggctttaggaactttaggggttgtttttgtaaatgttttgag6540
tctaagtttatcttttatttttactagaaaaaatacccatgcgctgcaacgggggaaagc6600
tattttaatcttattattgttcattgtgagaattcgcctgaatatatatttttctcaaaa6660
attatgtcaaattagcatatgggtttttttaaagatatttcttatacaaatccctctgta6720
tttacaaaagcaaacgaacttaaaacccgactcaaatacagatatgcatttccaaaagcg6780
aataaacttaaaaaccaattcatacaaaaatgacgtatcaaagtaccgacaaaaacatcc6840
tcaatttttataatagtagaaaagagtaaatttcactttgggccaccttttattaccgat6900
attttactttataccaccttttaactgatgttttcacttttgaccaggtaatcttacctt6960
tgttttattttggactatcccgactctcttctcaagcatatgaatgaccgtatgctagtg7020
cggccgcaagcttgactactagtctctcttaaggtagcatcacaagtttgtacaaaaaag7080
caggctcctgcaggtgagacttttcaacaaagggtaatatcgggaaacctcctcggattc7140
cattgcccagctatctgtcacttcatcgaaaggacagtagaaaaggaaggtggctcctac7200
aaatgccatcattgcgataaaggaaaggctatcgttcaagatgcctctaccgacagtggt7260
cccaaagatggacccccacccacgaggaacatcgtggaaaaagaagacgttccaaccacg7320
tcttcaaagcaagtggattgatgtgatatctccactgacgtaagggatgacgcacaatcc7380
cactatccttcgcaagacccttcctctatataaggaagttcatttcatttggagaggaca7440
ggcttcttgagatccttcaacaattaccaacaacaacaaacaacaaacaacattacaatt7500
actatttacaattacagtcgactctagaggatccggcccagttggaatgtaggtggtgag7560
caagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgt7620
aaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagct7680
gaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgac7740
caccttcacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacga7800
cttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaagga7860
cgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccg7920
catcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctgga7980
gtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaa8040
ggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccacta8100
ccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgag8160
cacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctgga8220
gttcgtgaccgccgccgggatcactcacggcatggacgagctgtacaagtaaagcggccg8280
cccggctgcattcgagtattatggcattgggaaaactgtttttcttgtaccatttgttgt8340
gcttgtaatttactgtgttttttattcggttttcgctatcgaactgtgaaatggaaatgg8400
atggagaagagttaatgaatgatatggtccttttgttcattctcaaattaatattatttg8460
ttttttctcttatttgttgtgtgttgaatttgaaattataagagatatgcaaacattttg8520
ttttgagtaaaaatgtgtcaaatcgtggcctctaatgaccgaagttaatatgaggagtaa8580
aacactagacccagctttcttgtacaaagtggtgatgttgtggtcgacccatcgatgggc8640
atgcaagctgggatcccagcttggtaccagatcttataattaaatggccttcgctgccca8700
tattattggtaactcaacagcatcaatcacgggatttttctcgaattaattgcgtcgaat8760
ctcagcatcgaaatattcgcctttttcgtccattagactatctattgtgatggtggattt8820
atcacaaatgggacccgccgccgacagaggtgtgatgttaggccaggactttgaaaattt8880
gcgcaactatcgtatagtggccgacaaattgacgccgagttgacagactgcctagcattt8940
gagtgaattatgtaaggtaatgggctacactgaattggtagctcaaactgtcagtattta9000
tgtatatgagtgtatattttcgcataatctcagaccaatctgaagatgaaatgggtatct9060
gggaatggcgaaatcaaggcatcgatcgtgaagtttctcatctaagcccccatttggacg9120
tgaatgtagacacgtcgaaataaagatttccgaattagaataatttgtttattgctttcg9180
cctataaatacgacggatcgtaatttgtcgttttatcaaaatgtactttcattttataat9240
aacgctgcggacatctacatttttgaattgaaaaaaaattggtaattactctttcttttt9300
ctccatattgaccatcatactcattgctgatccatgtagatttcccggacatgaagccat9360
ttacaattgaatatatcctgccgccgctgccgctttgcacccggtggagcttgcatgttg9420
gtttctacgcagaactgagccggttaggcagataatttccattgagaactgagccatgtg9480
caccttccccccaacacggtgagcgacggggcaacggagtgatccacatgggacttttaa9540
acatcatccgtcggatggcgttgcgagagaagcagtcgatccgtgagatcagccgacgca9600
ccgggcaggcgcgcaacacgatcgcaaagtatttgaacgcaggtacaatcgagccgacgt9660
tcacggtaccggaacgaccaagcaagctagcttagtaaagccctcgctagattttaatgc9720
ggatgttgcgattacttcgccaactattgcgataacaagaaaaagccagcctttcatgat9780
atatctcccaatttgtgtagggcttattatgcacgcttaaaaataataaaagcagacttg9840
acctgatagtttggctgtgagcaattatgtgcttagtgcatctaacgcttgagttaagcc9900
gcgccgcgaagcggcgtcggcttgaacgaattgttagacattatttgccgactaccttgg9960
tgatctcgcctttcacgtagtggacaaattcttccaactgatctgcgcgcgaggccaagc10020
gatcttcttcttgtccaagataagcctgtctagcttcaagtatgacgggctgatactggg10080
ccggcaggcgctccattgcccagtcggcagcgacatccttcggcgcgattttgccggtta10140
ctgcgctgtaccaaatgcgggacaacgtaagcactacatttcgctcatcgccagcccagt10200
cgggcggcgagttccatagcgttaaggtttcatttagcgcctcaaatagatcctgttcag10260
gaaccggatcaaagagttcctccgccgctggacctaccaaggcaacgctatgttctcttg10320
cttttgtcagcaagatagccagatcaatgtcgatcgtggctggctcgaagatacctgcaa10380
gaatgtcattgcgctgccattctccaaattgcagttcgcgcttagctggataacgccacg10440
gaatgatgtcgtcgtgcacaacaatggtgacttctacagcgcggagaatctcgctctctc10500
caggggaagccgaagtttccaaaaggtcgttgatcaaagctcgccgcgttgtttcatcaa10560
gccttacggtcaccgtaaccagcaaatcaatatcactgtgtggcttcaggccgccatcca10620
ctgcggagccgtacaaatgtacggccagcaacgtcggttcgagatggcgctcgatgacgc10680
caactacctctgatagttgagtcgatacttcggcgatcaccgcttccctcatgatgttta10740
actttgttttagggcgactgccctgctgcgtaacatcgttgctgctccataacatcaaac10800
atcgacccacggcgtaacgcgcttgctgcttggatgcccgaggcatagactgtaccccaa10860
aaaaacagtcataacaagccatgaaaaccgccactgcgccgttaccaccgctgcgttcgg10920
tcaaggttctggaccagttgcgtgagcgcatacgctacttgcattacagcttacgaaccg10980
aacaggcttatgtccactgggttcgtgccttcatccgtttccacggtgtgcgtcacccgg11040
caaccttgggcagcagcgaagtcgaggcatttctgtcctggctggcgaacgagcgcaagg11100
tttcggtctccacgcatcgtcaggcattggcggccttgctgttcttctacggcaaggtgc11160
tgtgcacggatctgccctggcttcaggagatcggaagacctcggccgtcgcggcgcttgc11220
cggtggtgctgaccccggatgaagtggttcgcatcctcggttttctggaaggcgagcatc11280
gtttgttcgcccagcttctgtatggaacgggcatgcggatcagtgagggtttgcaactgc11340
gggtcaaggatctggatttcgatcacggcacgatcatcgtgcgggagggcaagggctcca11400
aggatcgggccttgatgttacccgagagcttggcacccagcctgcgcgagcaggatcgat11460
ccaacccctccgctgctatagtgcagtcggcttctgacgttcagtgcagccgtcttctga11520
aaacgacatgtcgcacaagtcctaagttacgcgacaggctgccgccctgcccttttcctg11580
gcgttttcttgtcgcgtgttttagtcgcataaagtagaatacttgcgactagaaccggag11640
acattacgccatgaacaagagcgccgccgctggcctgctgggctatgcccgcgtcagcac11700
cgacgaccaggacttgaccaaccaacgggccgaactgcacgcggccggctgcaccaagct11760
gttttccgagaagatcaccggcaccaggcgcgaccgcccggagctggccaggatgcttga11820
ccacctacgccctggcgacgttgtgacagtgaccaggctagaccgcctggcccgcagcac11880
ccgcgacctactggacattgccgagcgcatccaggaggccggcgcgggcctgcgtagcct11940
ggcagagccgtgggccgacaccaccacgccggccggccgcatggtgttgaccgtgttcgc12000
cggcattgccgagttcgagcgttccctaatcatcgaccgcacccggagcgggcgcgaggc12060
cgccaaggcccgaggcgtgaagtttggcccccgccctaccctcaccccggcacagatcgc12120
gcacgcccgcgagctgatcgaccaggaaggccgcaccgtgaaagaggcggctgcactgct12180
tggcgtgcatcgctcgaccctgtaccgcgcacttgagcgcagcgaggaagtgacgcccac12240
cgaggccaggcggcgcggtgccttccgtgaggacgcattgaccgaggccgacgccctggc12300
ggccgccgagaatgaacgccaagaggaacaagcatgaaaccgcaccaggacggccaggac12360
gaaccgtttttcattaccgaagagatcgaggcggagatgatcgcggccgggtacgtgttc12420
gagccgcccgcgcacgtctcaaccgtgcggctgcatgaaatcctggccggtttgtctgat12480
gccaagctggcggcctggccggccagcttggccgctgaagaaaccgagcgccgccgtcta12540
aaaaggtgatgtgtatttgagtaaaacagcttgcgtcatgcggtcgctgcgtatatgatg12600
cgatgagtaaataaacaaatacgcaaggggaacgcatgaaggttatcgctgtacttaacc12660
agaaaggcgggtcaggcaagacgaccatcgcaacccatctagcccgcgccctgcaactcg12720
ccggggccgatgttctgttagtcgattccgatccccagggcagtgcccgcgattgggcgg12780
ccgtgcgggaagatcaaccgctaaccgttgtcggcatcgaccgcccgacgattgaccgcg12840
acgtgaaggccatcggccggcgcgacttcgtagtgatcgacggagcgccccaggcggcgg12900
acttggctgtgtccgcgatcaaggcagccgacttcgtgctgattccggtgcagccaagcc12960
cttacgacatatgggccaccgccgacctggtggagctggttaagcagcgcattgaggtca13020
cggatggaaggctacaagcggcctttgtcgtgtcgcgggcgatcaaaggcacgcgcatcg13080
gcggtgaggttgccgaggcgctggccgggtacgagctgcccattcttgagtcccgtatca13140
cgcagcgcgtgagctacccaggcactgccgccgccggcacaaccgttcttgaatcagaac13200
ccgagggcgacgctgcccgcgaggtccaggcgctggccgctgaaattaaatcaaaactca13260
tttgagttaatgaggtaaagagaaaatgagcaaaagcacaaacacgctaagtgccggccg13320
tccgagcgcacgcagcagcaaggctgcaacgttggccagcctggcagacacgccagccat13380
gaagcgggtcaactttcagttgccggcggaggatcacaccaagctgaagatgtacgcggt13440
acgccaaggcaagaccattaccgagctgctatctgaatacatcgcgcagctaccagagta13500
aatgagcaaatgaataaatgagtagatgaattttagcggctaaaggaggcggcatggaaa13560
atcaagaacaaccaggcaccgacgccgtggaatgccccatgtgtggaggaacgggcggtt13620
ggccaggcgtaagcggctgggttgtctgccggccctgcaatggcactggaacccccaagc13680
ccgaggaatcggcgtgagcggtcgcaaaccatccggcccggtacaaatcggcgcggcgct13740
gggtgatgacctggtggagaagttgaaggccgcgcaggccgcccagcggcaacgcatcga13800
ggcagaagcacgccccggtgaatcgtggcaagcggccgctgatcgaatccgcaaagaatc13860
ccggcaaccgccggcagccggtgcgccgtcgattaggaagccgcccaagggcgacgagca13920
accagattttttcgttccgatgctctatgacgtgggcacccgcgatagtcgcagcatcat13980
ggacgtggccgttttccgtctgtcgaagcgtgaccgacgagctggcgaggtgatccgcta14040
cgagcttccagacgggcacgtagaggtttccgcagggccggccggcatggccagtgtgtg14100
ggattacgacctggtactgatggcggtttcccatctaaccgaatccatgaaccgataccg14160
ggaagggaagggagacaagcccggccgcgtgttccgtccacacgttgcggacgtactcaa14220
gttctgccggcgagccgatggcggaaagcagaaagacgacctggtagaaacctgcattcg14280
gttaaacaccacgcacgttgccatgcagcgtacgaagaaggccaagaacggccgcctggt14340
gacggtatccgagggtgaagccttgattagccgctacaagatcgtaaagagcgaaaccgg14400
gcggccggagtacatcgagatcgagctagctgattggatgtaccgcgagatcacagaagg14460
caagaacccggacgtgctgacggttcaccccgattactttttgatcgatcccggcatcgg14520
ccgttttctctaccgcctggcacgccgcgccgcaggcaaggcagaagcc14569
<210>11
<211>18695
<212>dna
<213>人工序列
<220>
<223>2408的完整核苷酸序列。
<400>11
taaacgctcttttctcttaggtttacccgccaatatatcctgtcaaacactgatagttta60
aactgaaggcgggaaacgacaatctgatccaagctcaagctccaatacgcaaaccgcctc120
tccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaag180
cgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctt240
tacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcaca300
caggaaacagctatgaccatgattacgaatttcaggtgactgatagtgacctgttcgttg360
caacaaattgatgagcaatgcttttttataatgccaactttgtacaaaaaagcaggcggc420
gcgtcctgcaggatagggataacagggtaatggcgcgccaagcttatcgataccgtcgac480
ctcgagcggccgccagtgtgatggatatctgcagaattgcccttcgaagggacaaaaaaa540
gcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgcta600
tttctagctctaaaacgcccagttggaatgtaggtgcaacacaagcgacagcgcgcgggt660
ttataagttggtcgcgttcgagttagctgggcaatgtggtactaaactgttcctcccgcc720
tctcgcgctcacactcgccctgtgggccgctcaccgtgcacgtacttgggcctcccgctc780
ccccgcatgcatccagcccatcacagcgaagagaatcgggcttttcttctccccatctcc840
ctacacaaccaccaaatacagccaggccgttggttcatgatccaagggcaattccagcac900
actggcggccgttactagtggatccgagctcggtaccttaattaaattaccctgttatcc960
ctatcctgcaggattaacacccaacttttctatccaagcttgccaacatggtggagcacg1020
acactctcgtctactccaagaatatcaaagatacagtctcagaagaccaaagggctattg1080
agacttttcaacaaagggtaatatcgggaaacctcctcggattccattgcccagctatct1140
gtcacttcatcaaaaggacagtagaaaaggaaggtggcacctacaaatgccatcattgcg1200
ataaaggaaaggctatcgttcaagatgcctctgccgacagtggtcccaaagatggacccc1260
cacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtgg1320
attgatgtgataacatggtggagcacgacactctcgtctactccaagaatatcaaagata1380
cagtctcagaagaccaaagggctattgagacttttcaacaaagggtaatatcgggaaacc1440
tcctcggattccattgcccagctatctgtcacttcatcaaaaggacagtagaaaaggaag1500
gtggcacctacaaatgccatcattgcgataaaggaaaggctatcgttcaagatgcctctg1560
ccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacg1620
ttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaagggatg1680
acgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttcatt1740
tggagaggccggtctagagaattccaagcaacgaactgcgagtgattcaagaaaaaagaa1800
aacctgagctttcgatctctacggagtggtttcttgttctttgaaaaagagggggattac1860
atatggctcctaagaagaagcggaaggttggtattcacggggtgcctgcggctatggaca1920
agaagtactcgatcgggctggccatcggaacaaattctgtaggctgggctgtaataaccg1980
atgagtacaaggtgccctctaaaaaatttaaggtccttggcaatacggatagacattcca2040
taaagaagaatcttatcggtgcgctgctctttgacagcggcgagaccgcggaggcgaccc2100
ggttgaaacgcaccgcgagacgccgttacacaaggcgtaagaatagaatctgttatctcc2160
aggagatattctctaatgaaatggcgaaggtagacgattccttctttcaccgtctggagg2220
aaagttttctcgttgaggaagataagaaacatgaaagacacccgatcttcggaaacattg2280
tcgacgaggtcgcttatcatgaaaagtaccctaccatctaccatcttagaaagaaacttg2340
ttgacagcacggataaggctgatctcaggctgatatacctggctctggcacatatgatta2400
agttcagagggcatttccttatcgaaggcgacctgaatccagataattcagatgtagaca2460
agctcttcattcaacttgtgcagacttataatcagctcttcgaagaaaatccaataaacg2520
cgtcgggtgtagacgcaaaggccatactgtccgctaggctttctaagtcacgtagacttg2580
agaatctcattgcccaactccccggcgagaagaagaacggcttgtttggaaatctgatag2640
cgctgtccctgggtcttacaccaaatttcaagagtaatttcgatttggcagaagatgcta2700
agttgcagctcagtaaagacacctacgatgacgatcttgataatttgttggctcagattg2760
gcgatcagtatgcagatcttttcttggccgctaagaatttgtctgatgcaattctgctta2820
gcgacattttgagggttaatacagaaatcaccaaggcacccttgtcggcgtcaatgataa2880
agaggtatgatgagcaccaccaagacctgacgctcctcaaggctcttgttcggcagcaat2940
tgccggagaagtacaaagagatcttcttcgaccagtctaagaacggatatgcgggctaca3000
tagacggtggagcgagtcaggaggaattctacaagttcataaagcccattctcgagaaga3060
tggatggtacggaagaactgcttgtgaaacttaacagagaagatcttttgcggaagcaga3120
gaactttcgacaacggaagtataccacaccagatacatctcggagagcttcatgctattc3180
tcagaagacaagaggatttctaccctttcttgaaggataacagagaaaagatagagaaga3240
tcctcacgtttaggatcccttactacgtaggtcctcttgctcgcggcaatagtaggttcg3300
cctggatgacccgcaagtctgaagaaactatcaccccttggaatttcgaagaggttgtag3360
acaaaggtgcttcagcacagagtttcattgagaggatgaccaacttcgacaagaacctcc3420
ccaacgaaaaggtcctgcctaagcacagcctcctctacgaatactttactgtctataatg3480
agcttacaaaagttaagtacgtgacagagggaatgcggaagcccgcattcctttccggag3540
aacaaaagaaggcgatcgtggatcttctcttcaagacgaaccgcaaggtgacggttaaac3600
agttgaaggaagattacttcaagaagatagaatgttttgatagcgtggaaatcagcggcg3660
tcgaagataggttcaacgcttccctgggaacgtaccacgatctcctcaagattatcaaag3720
ataaggactttcttgataacgaagagaatgaggacatcttggaagacattgttctgacgc3780
tcaccctgttcgaagatcgcgagatgattgaggaacgcttgaagacctacgcacacctgt3840
tcgatgacaaggttatgaagcaacttaaacggcgccggtatacgggctggggacggcttt3900
cgcggaagctgataaatggaatccgtgacaagcagtctggcaagacaatactcgacttct3960
tgaagtcggatggttttgccaatagaaattttatgcaactcattcatgatgactcgctta4020
cttttaaggaggacatccagaaggcccaggtatcaggacagggtgactctttgcacgaac4080
acatcgcgaacctggcgggctcccccgcgattaagaagggaattttgcagactgtcaagg4140
tggtcgatgaactcgtgaaggttatgggacgtcataagccggaaaatattgtgattgaga4200
tggctcgcgagaatcaaacaacacagaagggccaaaagaacagtagagaacgcatgaagc4260
gcatcgaagagggcatcaaagagctgggcagtcagatccttaaagaacatccagtcgaga4320
atacacagcttcagaacgaaaagctgtacctttattaccttcaaaatgggcgtgatatgt4380
atgtggatcaggaactcgatatcaataggctgagtgactatgatgtcgacgctatcgtcc4440
cgcaaagtttcctcaaggacgacagtatagacaacaaagttctcacacggtcagataaga4500
atcgcggcaagagcgataatgtaccgtcggaggaggtagtcaagaagatgaagaattact4560
ggcgccagttgctcaacgccaagctcatcactcagaggaaatttgacaaccttacgaaag4620
ccgagcggggcggactctctgaactggacaaggccggtttcataaagcgccagctcgttg4680
agacacgtcaaattactaagcacgtcgctcaaatattggattcccgcatgaatactaagt4740
acgatgagaatgataagctcatacgtgaagttaaggtcattactctcaagtccaagcttg4800
tatcggacttccgtaaggacttccaattctacaaggtccgggaaatcaataattatcacc4860
atgcccatgacgcttatctgaacgcggtcgtgggcacggcactcattaagaaatacccaa4920
aacttgagtcagaatttgtttacggggactataaagtttatgacgtgcggaagatgatag4980
cgaagtcggaacaagagataggaaaggcgactgcaaagtactttttttactccaacataa5040
tgaatttctttaagaccgaaataacccttgcaaacggtgaaatcagaaagcggcctctga5100
ttgaaacaaatggcgagacgggcgagatcgtctgggacaaggggagggacttcgcaacgg5160
ttcgcaaggtccttagcatgccgcaagtaaatatagttaagaagacggaagttcagaccg5220
gcggctttagtaaagaaagcatacttcctaaaaggaattccgacaaactgatagcgcgca5280
agaaggactgggatccaaagaagtatggaggatttgactccccaaccgttgcttatagcg5340
tgttggtagtagccaaggtggaaaagggtaagtctaagaaattgaagtcggtgaaggagt5400
tgttggggataactataatggagcggagttcgttcgagaagaacccaattgactttctcg5460
aagccaaaggctacaaggaggtcaagaaggacctgattattaagttgccaaagtactcgc5520
tcttcgaactcgagaacgggagaaagcgtatgctggcgtcggcgggcgagctgcagaaag5580
gaaacgagctggctttgccatcgaaatacgtaaatttcctgtacctcgcctcacattatg5640
agaagcttaaagggtctccagaagacaatgaacagaagcagctgtttgttgaacagcaca5700
agcactacttggacgagattatagaacaaatctccgagttctctaaacgggttatccttg5760
cagacgccaatttggataaggtcctctcggcttataataagcatagagataagccaatcc5820
gggagcaggctgaaaatatcatacacctctttacgttgactaatttgggtgcgccagcgg5880
cattcaagtacttcgatacaacaatcgatcgtaagcgctacacaagcactaaggaagtcc5940
tggacgcgacgctgatacaccagtccattactggactgtatgaaaccagaatagatctta6000
gccagctcggcggtgatggaggagggcctagggctgatcctaagaagaagaggaaggttg6060
gaggagggccaggagcagagtatgttagagcgttgtttgattttaacggtaacgatgaag6120
aggatttaccctttaagaaaggcgacattctcaggattagggataaacctgaagagcaat6180
ggtggaatgctgaggatagtgaaggcaaacgaggaatgattttagtgccgtatgtggaga6240
aatattcgggtgactacaaagatcatgatggtgattacaaagaccatgacatcgactaca6300
aggatgatgatgataagtcagggatgacagatgctgaatatgtcagaatccacgaaaagt6360
tggacatttacacgtttaagaagcagttcttcaacaacaagaaatctgtttcgcataggt6420
gctatgtgcttttcgaactaaaacgtcgtggagaaagacgggcttgcttttggggttacg6480
cggttaacaaaccacaatcaggtactgaacgaggaatacacgctgaaatcttttctatcc6540
gaaaggttgaggaatatctacgtgacaatcctggacagttcactatcaattggtattcta6600
gctggtcaccatgtgcagattgtgctgagaagattctcgaatggtacaatcaagagctta6660
gaggcaatggacatacattgaaaatatgggcatgcaagctctactacgaaaagaatgcca6720
gaaaccaaattgggctttggaacttgagggataatggagttgggcttaatgtcatggttt6780
ctgagcactatcaatgttgtcggaagatcttcatacaaagttcccataaccagttgaatg6840
agaacagatggttagagaaaacccttaaaagagccgagaagagaagatccgaactgagca6900
ttatgatacaggtcaaaattctgcataccactaagagtccagctgtaggtcctaagaaga6960
aacgtaaagtagggccctgatccaggcctcccagctttcgtccgtatcatcggtttcgac7020
aacgttcgtcaagttcaatgcatcagtttcattgcccacacaccagaatcctactaagtt7080
tgagtattatggcattggaaaagctgttttcttctatcatttgttctgcttgtaatttac7140
tgtgttctttcagtttttgttttcggacatcaaaatgcaaatggatggataagagttaat7200
aaatgatatggtccttttgttcattctcaaattattattatctgttgtttttactttaat7260
gggttgaatttaagtaagaaaggaactaacagtgtgatattaaggtgcaatgttagacat7320
ataaaacagtctttcacctctctttggttatgtcttgaattggtttgtttcttcacttat7380
ctgtgtaatcaagtttactatgagtctatgatcaagtaattatgcaatcaagttaagtac7440
agtataggcttgagctccctaggcccctaggtaattcttcggacccaagaatgctaagcc7500
aagaggagctgttatcgccgtcctcctgcttgtttctctctttttgttgctgtttcttca7560
ttagcgtggacaaagttttcaaccggcctatctgttatcattttcttctattcaaagact7620
gtaatacctattgctacctgtggttctcacttgtgattttggacacatatgttcggttta7680
ttcaaatttaatcagatgcctgatgagggtaccagaaaaaatacgtgttctggttgtttt7740
tgagttgcgattattctatgaaatgaataacatcgaagttatcatcccagtattttcgca7800
tgaatgttcttttcttctgtcttgtgcatcagtgatctagtgcatgggagtttgtattgt7860
gatgttcgacatcacgtaacttccactttgcctttgctgttcgatattttaatgacatgt7920
cacacacacttctgatacttttctttcttggctattgtgccagcatgatgcaagatgcat7980
cacagcatcagatatattctcatcgtcaggctttagcagcacacgagcacgctttgccgc8040
ttaaaagttgtacggcgcagcttagacatcccctgtagaagtgataatcttttcactttt8100
ccttaaacaaattgagaggggaaatggaaccatgtggatcagagaagcttttgtttcttt8160
acacaagaatatttggtacagtgggggtcctatgttcgtgggttcgtggcttggctgcct8220
gtcttcaaccaagtgttttcagttcaacatgttagcgtgtagaaagagcacaattctgtt8280
tatctccaaggtaaaatgtggcattctgttaaagaacatgatcctgccaattttttaagt8340
ttcaatggaagaggaatgtaaagctttctatggtttgtgtacacaacacagtggaagagg8400
agtgcaagctttctatggtttgtgtgcgcgttgtgtgtcagcacttcaattttgttagaa8460
aatgaaagaaaaaaaaggatgatcatgcttatagtaaatcactctttttcctcgccttct8520
gtacgttttgacttgacaagattttaaaatctgtacatgacctttgttttaaaattactt8580
tatgtatttccatctttcaagttatgcagatgtcatcacaaattgttacaccaatcacca8640
ggctggctgtttatatattatcagaccaggctatatagagtatactatactaactgttca8700
tattatctggaaatcttgcttgctacttgagcggtaaaagggtatagatatgagggtccc8760
cagattagccttttcaatttcagaaagaatgctaacccacagatggttagagaggcttac8820
gcagcaggtctcatcaagacgatctacccgagcaataatctccaggaaatcaaatacctt8880
cccaagaaggttaaagatgcagtcaaaagattcaggactaactgcatcaagaacacagag8940
aaagatatatttctcaagatcagaagtactattccagtatggacgattcaaggcttgctt9000
cacaaaccaaggcaagtaatagagattggagtctctaaaaaggtagttcccactgaatca9060
aaggccatggagtcaaagattcaaatagaggacctaacagaactcgccgtaaagactggc9120
gaacagttcatacagagtctcttacgactcaatgacaagaagaaaatcttcgtcaacatg9180
gtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaa9240
agggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgc9300
ccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgc9360
catcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaa9420
gatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttca9480
aagcaagtggattgatgtgatatctccactgacgtaagggatgacgcacaatcccactat9540
ccttcgcaagacccttcctctatataaggaagttcatttcatttggagagaacacggggg9600
actctagaatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaa9660
agttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttca9720
gcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttct9780
acaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgc9840
ttgacattggggagtttagcgagagcctgacctattgcatctcccgccgttcacagggtg9900
tcacgttgcaagacctgcctgaaaccgaactgcccgctgttctacaaccggtcgcggagg9960
ctatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggac10020
cgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatcccc10080
atgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctc10140
tcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcgg10200
atttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactgga10260
gcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgt10320
ggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcag10380
gatcgccacgactccgggcgtatatgctccgcattggtcttgaccaactctatcagagct10440
tggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtcc10500
gatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctgga10560
ccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccga10620
gggcaaagaaataggagctctgggctaatctaaaacgatttatctgtggcttcaagtgta10680
tcgatcacttatgtgaggtgtaattactggtgtttttggtgtgctctggttcctttcaag10740
tgtgttgttgccgctcgaactactccgctatgtaaaacggtaaaacctgttgtctcatta10800
tgaaagtgaactatattatgttctactactactctacttagtcaattttcttcaccttga10860
ttagtgtaaatatgaatcttatattcttatgtcttaagaaattagcacatgtgaagcctc10920
caagtgcatattttctcgatcgcgagacgcacaatgcgtgagaaattcagctggttatac10980
tcaaatatattaatatatctagcagcagctcatggagattcaggaaacttggcatcccta11040
atccctaccatttccattcttccgagattgacagttcaatacaagtacagtaatctcctg11100
gtaagtttcttattaacttgacatgtagtagtaataatttgtacgtagcatagatacata11160
gacacaaaaatgtcctccccattgagctagccgattggagccgaacaccgcaggaatgaa11220
tttacataatctgcaaagaataaatggaatgtgcctccacaggaaaaccagcggcagtgt11280
ggcgttttcaagagcagccgtaagtcgaagcctattctgaatcgtagaaatcactggggc11340
atggtgtaattacatccgactccaacatctgtaccaccctgtgcattgtaggccgctcct11400
ctggcaaagaacttacacattgtttagcaagagaaagtagagcatccaaggtctcaatct11460
gcactccctcacaatatggatcgacaatttccctctcccgattctcaccgaccaggaaat11520
tcaactgccacagagcaagtagattatttcaagaatacattaaatcaattgaaggcatac11580
gtaattcatatcagaaaactgtggatatgaaatggaaggacataaaggtcatacataccc11640
atccaacaatgttcaatcccttttcaataaatgatgcatcagtaggtcgttttccgctta11700
gtatttcaagtagcaaaactccaaaactgtagacgtcagtcttttcggtggctctgccac11760
tttgcatatactcctgcaggtcgaccatagtgactggatatgttgtgttttacagtatta11820
tgtagtctgttttttatgcaaaatctaatttaatatattgatatttatatcattttacgt11880
ttctcgttcagctttcttgtacaaagtggtgatatcccgcggaaatacgtagaattcggg11940
aagcttggcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttaccca12000
acttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccg12060
caccgatcgcccttcccaacagttgcgcagcctgaatggcgaatgctagagcaattcggc12120
gttaattcagtacattaaaaacgtccgcaatgtgttattaagttgtctaagcgtcaattt12180
gtttacaccacaatatatcctgccaccagccagccaacagctccccgaccggcagctcgg12240
cacaaaatcaccactcgatacaggcagcccatcagtccgggacggcgtcagcgggagagc12300
cgttgtaaggcggcagactttgctcatgttaccgatgctattcggaagaacggcaactaa12360
gctgccgggtttgaaacacggatgatctcgcggagggtagcatgttgattgtaacgatga12420
cagagcgttgctgcctgtgatcaattcgggcacgaacccagtggacataagcctcgttcg12480
gttcgtaagctgtaatgcaagtagcgtaactgccgtcacgcaactggtccagaaccttga12540
ccgaacgcagcggtggtaacggcgcagtggcggttttcatggcttcttgttatgacatgt12600
ttttttggggtacagtctatgcctcgggcatccaagcagcaagcgcgttacgccgtgggt12660
cgatgtttgatgttatggagcagcaacgatgttacgcagcagggcagtcgccctaaaaca12720
aagttaaacatcatgggggaagcggtgatcgccgaagtatcgactcaactatcagaggta12780
gttggcgtcatcgagcgccatctcgaaccgacgttgctggccgtacatttgtacggctcc12840
gcagtggatggcggcctgaagccacacagtgatattgatttgctggttacggtgaccgta12900
aggcttgatgaaacaacgcggcgagctttgatcaacgaccttttggaaacttcggcttcc12960
cctggagagagcgagattctccgcgctgtagaagtcaccattgttgtgcacgacgacatc13020
attccgtggcgttatccagctaagcgcgaactgcaatttggagaatggcagcgcaatgac13080
attcttgcaggtatcttcgagccagccacgatcgacattgatctggctatcttgctgaca13140
aaagcaagagaacatagcgttgccttggtaggtccagcggcggaggaactctttgatccg13200
gttcctgaacaggatctatttgaggcgctaaatgaaaccttaacgctatggaactcgccg13260
cccgactgggctggcgatgagcgaaatgtagtgcttacgttgtcccgcatttggtacagc13320
gcagtaaccggcaaaatcgcgccgaaggatgtcgctgccgactgggcaatggagcgcctg13380
ccggcccagtatcagcccgtcatacttgaagctagacaggcttatcttggacaagaagaa13440
gatcgcttggcctcgcgcgcagatcagttggaagaatttgtccactacgtgaaaggcgag13500
atcaccaaggtagtcggcaaataatgtctagctagaaattcgttcaagccgacgccgctt13560
cgccggcgttaaatcaagcgattagatgcactaagcacataattgctcacagccaaacta13620
tcaggtcaagtctgcttttattatttttaagcgtgcataataagccctacacaaattggg13680
agatatatcatgcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcaga13740
ccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctg13800
cttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctacc13860
aactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttct13920
agtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgc13980
tctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggtt14040
ggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtg14100
cacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagct14160
atgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcag14220
ggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatag14280
tcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggg14340
gcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctg14400
gccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattac14460
cgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagt14520
gagcgaggaagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtat14580
ttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagcca14640
gtatacactccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaaca14700
cccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtg14760
accgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagg14820
cagggtgccttgatgtgggcgccggcggtcgagtggcgacggcgcggcttgtccgcgccc14880
tggtagattgcctggccgtaggccagccatttttgagcggccagcggccgcgataggccg14940
acgcgaagcggcggggcgtagggagcgcagcgaccgaagggtaggcgctttttgcagctc15000
ttcggctgtgcgctggccagacagttatgcacaggccaggcgggttttaagagttttaat15060
aagttttaaagagttttaggcggaaaaatcgccttttttctcttttatatcagtcactta15120
catgtgtgaccggttcccaatgtacggctttgggttcccaatgtacgggttccggttccc15180
aatgtacggctttgggttcccaatgtacgtgctatccacaggaaagagaccttttcgacc15240
tttttcccctgctagggcaatttgccctagcatctgctccgtacattaggaaccggcgga15300
tgcttcgccctcgatcaggttgcggtagcgcatgactaggatcgggccagcctgccccgc15360
ctcctccttcaaatcgtactccggcaggtcatttgacccgatcagcttgcgcacggtgaa15420
acagaacttcttgaactctccggcgctgccactgcgttcgtagatcgtcttgaacaacca15480
tctggcttctgccttgcctgcggcgcggcgtgccaggcggtagagaaaacggccgatgcc15540
gggatcgatcaaaaagtaatcggggtgaaccgtcagcacgtccgggttcttgccttctgt15600
gatctcgcggtacatccaatcagctagctcgatctcgatgtactccggccgcccggtttc15660
gctctttacgatcttgtagcggctaatcaaggcttcaccctcggataccgtcaccaggcg15720
gccgttcttggccttcttcgtacgctgcatggcaacgtgcgtggtgtttaaccgaatgca15780
ggtttctaccaggtcgtctttctgctttccgccatcggctcgccggcagaacttgagtac15840
gtccgcaacgtgtggacggaacacgcggccgggcttgtctcccttcccttcccggtatcg15900
gttcatggattcggttagatgggaaaccgccatcagtaccaggtcgtaatcccacacact15960
ggccatgccggccggccctgcggaaacctctacgtgcccgtctggaagctcgtagcggat16020
cacctcgccagctcgtcggtcacgcttcgacagacggaaaacggccacgtccatgatgct16080
gcgactatcgcgggtgcccacgtcatagagcatcggaacgaaaaaatctggttgctcgtc16140
gcccttgggcggcttcctaatcgacggcgcaccggctgccggcggttgccgggattcttt16200
gcggattcgatcagcggccgcttgccacgattcaccggggcgtgcttctgcctcgatgcg16260
ttgccgctgggcggcctgcgcggccttcaacttctccaccaggtcatcacccagcgccgc16320
gccgatttgtaccgggccggatggtttgcgaccgtcacgccgattcctcgggcttggggg16380
ttccagtgccattgcagggccggcagacaacccagccgcttacgcctggccaaccgcccg16440
ttcctccacacatggggcattccacggcgtcggtgcctggttgttcttgattttccatgc16500
cgcctcctttagccgctaaaattcatctactcatttattcatttgctcatttactctggt16560
agctgcgcgatgtattcagatagcagctcggtaatggtcttgccttggcgtaccgcgtac16620
atcttcagcttggtgtgatcctccgccggcaactgaaagttgacccgcttcatggctggc16680
gtgtctgccaggctggccaacgttgcagccttgctgctgcgtgcgctcggacggccggca16740
cttagcgtgtttgtgcttttgctcattttctctttacctcattaactcaaatgagttttg16800
atttaatttcagcggccagcgcctggacctcgcgggcagcgtcgccctcgggttctgatt16860
caagaacggttgtgccggcggcggcagtgcctgggtagctcacgcgctgcgtgatacggg16920
actcaagaatgggcagctcgtacccggccagcgcctcggcaacctcaccgccgatgcgcg16980
tgcctttgatcgcccgcgacacgacaaaggccgcttgtagccttccatccgtgacctcaa17040
tgcgctgcttaaccagctccaccaggtcggcggtggcccatatgtcgtaagggcttggct17100
gcaccggaatcagcacgaagtcggctgccttgatcgcggacacagccaagtccgccgcct17160
ggggcgctccgtcgatcactacgaagtcgcgccggccgatggccttcacgtcgcggtcaa17220
tcgtcgggcggtcgatgccgacaacggttagcggttgatcttcccgcacggccgcccaat17280
cgcgggcactgccctggggatcggaatcgactaacagaacatcggccccggcgagttgca17340
gggcgcgggctagatgggttgcgatggtcgtcttgcctgacccgcctttctggttaagta17400
cagcgataaccttcatgcgttccccttgcgtatttgtttatttactcatcgcatcatata17460
cgcagcgaccgcatgacgcaagctgttttactcaaatacacatcacctttttagacggcg17520
gcgctcggtttcttcagcggccaagctggccggccaggccgccagcttggcatcagacaa17580
accggccaggatttcatgcagccgcacggttgagacgtgcgcgggcggctcgaacacgta17640
cccggccgcgatcatctccgcctcgatctcttcggtaatgaaaaacggttcgtcctggcc17700
gtcctggtgcggtttcatgcttgttcctcttggcgttcattctcggcggccgccagggcg17760
tcggcctcggtcaatgcgtcctcacggaaggcaccgcgccgcctggcctcggtgggcgtc17820
acttcctcgctgcgctcaagtgcgcggtacagggtcgagcgatgcacgccaagcagtgca17880
gccgcctctttcacggtgcggccttcctggtcgatcagctcgcgggcgtgcgcgatctgt17940
gccggggtgagggtagggcgggggccaaacttcacgcctcgggccttggcggcctcgcgc18000
ccgctccgggtgcggtcgatgattagggaacgctcgaactcggcaatgccggcgaacacg18060
gtcaacaccatgcggccggccggcgtggtggtgtcggcccacggctctgccaggctacgc18120
aggcccgcgccggcctcctggatgcgctcggcaatgtccagtaggtcgcgggtgctgcgg18180
gccaggcggtctagcctggtcactgtcacaacgtcgccagggcgtaggtggtcaagcatc18240
ctggccagctccgggcggtcgcgcctggtgccggtgatcttctcggaaaacagcttggtg18300
cagccggccgcgtgcagttcggcccgttggttggtcaagtcctggtcgtcggtgctgacg18360
cgggcatagcccagcaggccagcggcggcgctcttgttcatggcgtaatgtctccggttc18420
tagtcgcaagtattctactttatgcgactaaaacacgcgacaagaaaacgccaggaaaag18480
ggcagggcggcagcctgtcgcgtaacttaggacttgtgcgacatgtcgttttcagaagac18540
ggctgcactgaacgtcagaagccgactgcactatagcagcggaggggttggatcaaagta18600
ctttgatcccgaggggaaccctgtggttggcatgcacatacaaatggacgaacggataaa18660
ccttttcacgcccttttaaatatccgttattctaa18695
<210>12
<211>18695
<212>dna
<213>人工序列
<220>
<223>2409的完整核苷酸序列。
<400>12
taaacgctcttttctcttaggtttacccgccaatatatcctgtcaaacactgatagttta60
aactgaaggcgggaaacgacaatctgatccaagctcaagctccaatacgcaaaccgcctc120
tccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaag180
cgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctt240
tacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcaca300
caggaaacagctatgaccatgattacgaatttcaggtgactgatagtgacctgttcgttg360
caacaaattgatgagcaatgcttttttataatgccaactttgtacaaaaaagcaggcggc420
gcgtcctgcaggatagggataacagggtaatggcgcgccaagcttatcgataccgtcgac480
ctcgagcggccgccagtgtgatggatatctgcagaattgcccttcgaagggacaaaaaaa540
gcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgcta600
tttctagctctaaaacgcccagttggaatgtaggtgcaacacaagcgacagcgcgcgggt660
ttataagttggtcgcgttcgagttagctgggcaatgtggtactaaactgttcctcccgcc720
tctcgcgctcacactcgccctgtgggccgctcaccgtgcacgtacttgggcctcccgctc780
ccccgcatgcatccagcccatcacagcgaagagaatcgggcttttcttctccccatctcc840
ctacacaaccaccaaatacagccaggccgttggttcatgatccaagggcaattccagcac900
actggcggccgttactagtggatccgagctcggtaccttaattaaattaccctgttatcc960
ctatcctgcaggattaacacccaacttttctatccaagcttgccaacatggtggagcacg1020
acactctcgtctactccaagaatatcaaagatacagtctcagaagaccaaagggctattg1080
agacttttcaacaaagggtaatatcgggaaacctcctcggattccattgcccagctatct1140
gtcacttcatcaaaaggacagtagaaaaggaaggtggcacctacaaatgccatcattgcg1200
ataaaggaaaggctatcgttcaagatgcctctgccgacagtggtcccaaagatggacccc1260
cacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtgg1320
attgatgtgataacatggtggagcacgacactctcgtctactccaagaatatcaaagata1380
cagtctcagaagaccaaagggctattgagacttttcaacaaagggtaatatcgggaaacc1440
tcctcggattccattgcccagctatctgtcacttcatcaaaaggacagtagaaaaggaag1500
gtggcacctacaaatgccatcattgcgataaaggaaaggctatcgttcaagatgcctctg1560
ccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacg1620
ttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaagggatg1680
acgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttcatt1740
tggagaggccggtctagagaattccaagcaacgaactgcgagtgattcaagaaaaaagaa1800
aacctgagctttcgatctctacggagtggtttcttgttctttgaaaaagagggggattac1860
atatggctcctaagaagaagcggaaggttggtattcacggggtgcctgcggctatggaca1920
agaagtactcgatcgggctggccatcggaacaaattctgtaggctgggctgtaataaccg1980
atgagtacaaggtgccctctaaaaaatttaaggtccttggcaatacggatagacattcca2040
taaagaagaatcttatcggtgcgctgctctttgacagcggcgagaccgcggaggcgaccc2100
ggttgaaacgcaccgcgagacgccgttacacaaggcgtaagaatagaatctgttatctcc2160
aggagatattctctaatgaaatggcgaaggtagacgattccttctttcaccgtctggagg2220
aaagttttctcgttgaggaagataagaaacatgaaagacacccgatcttcggaaacattg2280
tcgacgaggtcgcttatcatgaaaagtaccctaccatctaccatcttagaaagaaacttg2340
ttgacagcacggataaggctgatctcaggctgatatacctggctctggcacatatgatta2400
agttcagagggcatttccttatcgaaggcgacctgaatccagataattcagatgtagaca2460
agctcttcattcaacttgtgcagacttataatcagctcttcgaagaaaatccaataaacg2520
cgtcgggtgtagacgcaaaggccatactgtccgctaggctttctaagtcacgtagacttg2580
agaatctcattgcccaactccccggcgagaagaagaacggcttgtttggaaatctgatag2640
cgctgtccctgggtcttacaccaaatttcaagagtaatttcgatttggcagaagatgcta2700
agttgcagctcagtaaagacacctacgatgacgatcttgataatttgttggctcagattg2760
gcgatcagtatgcagatcttttcttggccgctaagaatttgtctgatgcaattctgctta2820
gcgacattttgagggttaatacagaaatcaccaaggcacccttgtcggcgtcaatgataa2880
agaggtatgatgagcaccaccaagacctgacgctcctcaaggctcttgttcggcagcaat2940
tgccggagaagtacaaagagatcttcttcgaccagtctaagaacggatatgcgggctaca3000
tagacggtggagcgagtcaggaggaattctacaagttcataaagcccattctcgagaaga3060
tggatggtacggaagaactgcttgtgaaacttaacagagaagatcttttgcggaagcaga3120
gaactttcgacaacggaagtataccacaccagatacatctcggagagcttcatgctattc3180
tcagaagacaagaggatttctaccctttcttgaaggataacagagaaaagatagagaaga3240
tcctcacgtttaggatcccttactacgtaggtcctcttgctcgcggcaatagtaggttcg3300
cctggatgacccgcaagtctgaagaaactatcaccccttggaatttcgaagaggttgtag3360
acaaaggtgcttcagcacagagtttcattgagaggatgaccaacttcgacaagaacctcc3420
ccaacgaaaaggtcctgcctaagcacagcctcctctacgaatactttactgtctataatg3480
agcttacaaaagttaagtacgtgacagagggaatgcggaagcccgcattcctttccggag3540
aacaaaagaaggcgatcgtggatcttctcttcaagacgaaccgcaaggtgacggttaaac3600
agttgaaggaagattacttcaagaagatagaatgttttgatagcgtggaaatcagcggcg3660
tcgaagataggttcaacgcttccctgggaacgtaccacgatctcctcaagattatcaaag3720
ataaggactttcttgataacgaagagaatgaggacatcttggaagacattgttctgacgc3780
tcaccctgttcgaagatcgcgagatgattgaggaacgcttgaagacctacgcacacctgt3840
tcgatgacaaggttatgaagcaacttaaacggcgccggtatacgggctggggacggcttt3900
cgcggaagctgataaatggaatccgtgacaagcagtctggcaagacaatactcgacttct3960
tgaagtcggatggttttgccaatagaaattttatgcaactcattcatgatgactcgctta4020
cttttaaggaggacatccagaaggcccaggtatcaggacagggtgactctttgcacgaac4080
acatcgcgaacctggcgggctcccccgcgattaagaagggaattttgcagactgtcaagg4140
tggtcgatgaactcgtgaaggttatgggacgtcataagccggaaaatattgtgattgaga4200
tggctcgcgagaatcaaacaacacagaagggccaaaagaacagtagagaacgcatgaagc4260
gcatcgaagagggcatcaaagagctgggcagtcagatccttaaagaacatccagtcgaga4320
atacacagcttcagaacgaaaagctgtacctttattaccttcaaaatgggcgtgatatgt4380
atgtggatcaggaactcgatatcaataggctgagtgactatgatgtcgaccatatcgtcc4440
cgcaaagtttcctcaaggacgacagtatagacaacaaagttctcacacggtcagataaga4500
atcgcggcaagagcgataatgtaccgtcggaggaggtagtcaagaagatgaagaattact4560
ggcgccagttgctcaacgccaagctcatcactcagaggaaatttgacaaccttacgaaag4620
ccgagcggggcggactctctgaactggacaaggccggtttcataaagcgccagctcgttg4680
agacacgtcaaattactaagcacgtcgctcaaatattggattcccgcatgaatactaagt4740
acgatgagaatgataagctcatacgtgaagttaaggtcattactctcaagtccaagcttg4800
tatcggacttccgtaaggacttccaattctacaaggtccgggaaatcaataattatcacc4860
atgcccatgacgcttatctgaacgcggtcgtgggcacggcactcattaagaaatacccaa4920
aacttgagtcagaatttgtttacggggactataaagtttatgacgtgcggaagatgatag4980
cgaagtcggaacaagagataggaaaggcgactgcaaagtactttttttactccaacataa5040
tgaatttctttaagaccgaaataacccttgcaaacggtgaaatcagaaagcggcctctga5100
ttgaaacaaatggcgagacgggcgagatcgtctgggacaaggggagggacttcgcaacgg5160
ttcgcaaggtccttagcatgccgcaagtaaatatagttaagaagacggaagttcagaccg5220
gcggctttagtaaagaaagcatacttcctaaaaggaattccgacaaactgatagcgcgca5280
agaaggactgggatccaaagaagtatggaggatttgactccccaaccgttgcttatagcg5340
tgttggtagtagccaaggtggaaaagggtaagtctaagaaattgaagtcggtgaaggagt5400
tgttggggataactataatggagcggagttcgttcgagaagaacccaattgactttctcg5460
aagccaaaggctacaaggaggtcaagaaggacctgattattaagttgccaaagtactcgc5520
tcttcgaactcgagaacgggagaaagcgtatgctggcgtcggcgggcgagctgcagaaag5580
gaaacgagctggctttgccatcgaaatacgtaaatttcctgtacctcgcctcacattatg5640
agaagcttaaagggtctccagaagacaatgaacagaagcagctgtttgttgaacagcaca5700
agcactacttggacgagattatagaacaaatctccgagttctctaaacgggttatccttg5760
cagacgccaatttggataaggtcctctcggcttataataagcatagagataagccaatcc5820
gggagcaggctgaaaatatcatacacctctttacgttgactaatttgggtgcgccagcgg5880
cattcaagtacttcgatacaacaatcgatcgtaagcgctacacaagcactaaggaagtcc5940
tggacgcgacgctgatacaccagtccattactggactgtatgaaaccagaatagatctta6000
gccagctcggcggtgatggaggagggcctagggctgatcctaagaagaagaggaaggttg6060
gaggagggccaggagcagagtatgttagagcgttgtttgattttaacggtaacgatgaag6120
aggatttaccctttaagaaaggcgacattctcaggattagggataaacctgaagagcaat6180
ggtggaatgctgaggatagtgaaggcaaacgaggaatgattttagtgccgtatgtggaga6240
aatattcgggtgactacaaagatcatgatggtgattacaaagaccatgacatcgactaca6300
aggatgatgatgataagtcagggatgacagatgctgaatatgtcagaatccacgaaaagt6360
tggacatttacacgtttaagaagcagttcttcaacaacaagaaatctgtttcgcataggt6420
gctatgtgcttttcgaactaaaacgtcgtggagaaagacgggcttgcttttggggttacg6480
cggttaacaaaccacaatcaggtactgaacgaggaatacacgctgaaatcttttctatcc6540
gaaaggttgaggaatatctacgtgacaatcctggacagttcactatcaattggtattcta6600
gctggtcaccatgtgcagattgtgctgagaagattctcgaatggtacaatcaagagctta6660
gaggcaatggacatacattgaaaatatgggcatgcaagctctactacgaaaagaatgcca6720
gaaaccaaattgggctttggaacttgagggataatggagttgggcttaatgtcatggttt6780
ctgagcactatcaatgttgtcggaagatcttcatacaaagttcccataaccagttgaatg6840
agaacagatggttagagaaaacccttaaaagagccgagaagagaagatccgaactgagca6900
ttatgatacaggtcaaaattctgcataccactaagagtccagctgtaggtcctaagaaga6960
aacgtaaagtagggccctgatccaggcctcccagctttcgtccgtatcatcggtttcgac7020
aacgttcgtcaagttcaatgcatcagtttcattgcccacacaccagaatcctactaagtt7080
tgagtattatggcattggaaaagctgttttcttctatcatttgttctgcttgtaatttac7140
tgtgttctttcagtttttgttttcggacatcaaaatgcaaatggatggataagagttaat7200
aaatgatatggtccttttgttcattctcaaattattattatctgttgtttttactttaat7260
gggttgaatttaagtaagaaaggaactaacagtgtgatattaaggtgcaatgttagacat7320
ataaaacagtctttcacctctctttggttatgtcttgaattggtttgtttcttcacttat7380
ctgtgtaatcaagtttactatgagtctatgatcaagtaattatgcaatcaagttaagtac7440
agtataggcttgagctccctaggcccctaggtaattcttcggacccaagaatgctaagcc7500
aagaggagctgttatcgccgtcctcctgcttgtttctctctttttgttgctgtttcttca7560
ttagcgtggacaaagttttcaaccggcctatctgttatcattttcttctattcaaagact7620
gtaatacctattgctacctgtggttctcacttgtgattttggacacatatgttcggttta7680
ttcaaatttaatcagatgcctgatgagggtaccagaaaaaatacgtgttctggttgtttt7740
tgagttgcgattattctatgaaatgaataacatcgaagttatcatcccagtattttcgca7800
tgaatgttcttttcttctgtcttgtgcatcagtgatctagtgcatgggagtttgtattgt7860
gatgttcgacatcacgtaacttccactttgcctttgctgttcgatattttaatgacatgt7920
cacacacacttctgatacttttctttcttggctattgtgccagcatgatgcaagatgcat7980
cacagcatcagatatattctcatcgtcaggctttagcagcacacgagcacgctttgccgc8040
ttaaaagttgtacggcgcagcttagacatcccctgtagaagtgataatcttttcactttt8100
ccttaaacaaattgagaggggaaatggaaccatgtggatcagagaagcttttgtttcttt8160
acacaagaatatttggtacagtgggggtcctatgttcgtgggttcgtggcttggctgcct8220
gtcttcaaccaagtgttttcagttcaacatgttagcgtgtagaaagagcacaattctgtt8280
tatctccaaggtaaaatgtggcattctgttaaagaacatgatcctgccaattttttaagt8340
ttcaatggaagaggaatgtaaagctttctatggtttgtgtacacaacacagtggaagagg8400
agtgcaagctttctatggtttgtgtgcgcgttgtgtgtcagcacttcaattttgttagaa8460
aatgaaagaaaaaaaaggatgatcatgcttatagtaaatcactctttttcctcgccttct8520
gtacgttttgacttgacaagattttaaaatctgtacatgacctttgttttaaaattactt8580
tatgtatttccatctttcaagttatgcagatgtcatcacaaattgttacaccaatcacca8640
ggctggctgtttatatattatcagaccaggctatatagagtatactatactaactgttca8700
tattatctggaaatcttgcttgctacttgagcggtaaaagggtatagatatgagggtccc8760
cagattagccttttcaatttcagaaagaatgctaacccacagatggttagagaggcttac8820
gcagcaggtctcatcaagacgatctacccgagcaataatctccaggaaatcaaatacctt8880
cccaagaaggttaaagatgcagtcaaaagattcaggactaactgcatcaagaacacagag8940
aaagatatatttctcaagatcagaagtactattccagtatggacgattcaaggcttgctt9000
cacaaaccaaggcaagtaatagagattggagtctctaaaaaggtagttcccactgaatca9060
aaggccatggagtcaaagattcaaatagaggacctaacagaactcgccgtaaagactggc9120
gaacagttcatacagagtctcttacgactcaatgacaagaagaaaatcttcgtcaacatg9180
gtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaa9240
agggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgc9300
ccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgc9360
catcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaa9420
gatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttca9480
aagcaagtggattgatgtgatatctccactgacgtaagggatgacgcacaatcccactat9540
ccttcgcaagacccttcctctatataaggaagttcatttcatttggagagaacacggggg9600
actctagaatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaa9660
agttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttca9720
gcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttct9780
acaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgc9840
ttgacattggggagtttagcgagagcctgacctattgcatctcccgccgttcacagggtg9900
tcacgttgcaagacctgcctgaaaccgaactgcccgctgttctacaaccggtcgcggagg9960
ctatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggac10020
cgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatcccc10080
atgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctc10140
tcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcgg10200
atttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactgga10260
gcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgt10320
ggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcag10380
gatcgccacgactccgggcgtatatgctccgcattggtcttgaccaactctatcagagct10440
tggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtcc10500
gatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctgga10560
ccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccga10620
gggcaaagaaataggagctctgggctaatctaaaacgatttatctgtggcttcaagtgta10680
tcgatcacttatgtgaggtgtaattactggtgtttttggtgtgctctggttcctttcaag10740
tgtgttgttgccgctcgaactactccgctatgtaaaacggtaaaacctgttgtctcatta10800
tgaaagtgaactatattatgttctactactactctacttagtcaattttcttcaccttga10860
ttagtgtaaatatgaatcttatattcttatgtcttaagaaattagcacatgtgaagcctc10920
caagtgcatattttctcgatcgcgagacgcacaatgcgtgagaaattcagctggttatac10980
tcaaatatattaatatatctagcagcagctcatggagattcaggaaacttggcatcccta11040
atccctaccatttccattcttccgagattgacagttcaatacaagtacagtaatctcctg11100
gtaagtttcttattaacttgacatgtagtagtaataatttgtacgtagcatagatacata11160
gacacaaaaatgtcctccccattgagctagccgattggagccgaacaccgcaggaatgaa11220
tttacataatctgcaaagaataaatggaatgtgcctccacaggaaaaccagcggcagtgt11280
ggcgttttcaagagcagccgtaagtcgaagcctattctgaatcgtagaaatcactggggc11340
atggtgtaattacatccgactccaacatctgtaccaccctgtgcattgtaggccgctcct11400
ctggcaaagaacttacacattgtttagcaagagaaagtagagcatccaaggtctcaatct11460
gcactccctcacaatatggatcgacaatttccctctcccgattctcaccgaccaggaaat11520
tcaactgccacagagcaagtagattatttcaagaatacattaaatcaattgaaggcatac11580
gtaattcatatcagaaaactgtggatatgaaatggaaggacataaaggtcatacataccc11640
atccaacaatgttcaatcccttttcaataaatgatgcatcagtaggtcgttttccgctta11700
gtatttcaagtagcaaaactccaaaactgtagacgtcagtcttttcggtggctctgccac11760
tttgcatatactcctgcaggtcgaccatagtgactggatatgttgtgttttacagtatta11820
tgtagtctgttttttatgcaaaatctaatttaatatattgatatttatatcattttacgt11880
ttctcgttcagctttcttgtacaaagtggtgatatcccgcggaaatacgtagaattcggg11940
aagcttggcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttaccca12000
acttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccg12060
caccgatcgcccttcccaacagttgcgcagcctgaatggcgaatgctagagcaattcggc12120
gttaattcagtacattaaaaacgtccgcaatgtgttattaagttgtctaagcgtcaattt12180
gtttacaccacaatatatcctgccaccagccagccaacagctccccgaccggcagctcgg12240
cacaaaatcaccactcgatacaggcagcccatcagtccgggacggcgtcagcgggagagc12300
cgttgtaaggcggcagactttgctcatgttaccgatgctattcggaagaacggcaactaa12360
gctgccgggtttgaaacacggatgatctcgcggagggtagcatgttgattgtaacgatga12420
cagagcgttgctgcctgtgatcaattcgggcacgaacccagtggacataagcctcgttcg12480
gttcgtaagctgtaatgcaagtagcgtaactgccgtcacgcaactggtccagaaccttga12540
ccgaacgcagcggtggtaacggcgcagtggcggttttcatggcttcttgttatgacatgt12600
ttttttggggtacagtctatgcctcgggcatccaagcagcaagcgcgttacgccgtgggt12660
cgatgtttgatgttatggagcagcaacgatgttacgcagcagggcagtcgccctaaaaca12720
aagttaaacatcatgggggaagcggtgatcgccgaagtatcgactcaactatcagaggta12780
gttggcgtcatcgagcgccatctcgaaccgacgttgctggccgtacatttgtacggctcc12840
gcagtggatggcggcctgaagccacacagtgatattgatttgctggttacggtgaccgta12900
aggcttgatgaaacaacgcggcgagctttgatcaacgaccttttggaaacttcggcttcc12960
cctggagagagcgagattctccgcgctgtagaagtcaccattgttgtgcacgacgacatc13020
attccgtggcgttatccagctaagcgcgaactgcaatttggagaatggcagcgcaatgac13080
attcttgcaggtatcttcgagccagccacgatcgacattgatctggctatcttgctgaca13140
aaagcaagagaacatagcgttgccttggtaggtccagcggcggaggaactctttgatccg13200
gttcctgaacaggatctatttgaggcgctaaatgaaaccttaacgctatggaactcgccg13260
cccgactgggctggcgatgagcgaaatgtagtgcttacgttgtcccgcatttggtacagc13320
gcagtaaccggcaaaatcgcgccgaaggatgtcgctgccgactgggcaatggagcgcctg13380
ccggcccagtatcagcccgtcatacttgaagctagacaggcttatcttggacaagaagaa13440
gatcgcttggcctcgcgcgcagatcagttggaagaatttgtccactacgtgaaaggcgag13500
atcaccaaggtagtcggcaaataatgtctagctagaaattcgttcaagccgacgccgctt13560
cgccggcgttaaatcaagcgattagatgcactaagcacataattgctcacagccaaacta13620
tcaggtcaagtctgcttttattatttttaagcgtgcataataagccctacacaaattggg13680
agatatatcatgcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcaga13740
ccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctg13800
cttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctacc13860
aactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttct13920
agtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgc13980
tctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggtt14040
ggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtg14100
cacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagct14160
atgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcag14220
ggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatag14280
tcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggg14340
gcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctg14400
gccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattac14460
cgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagt14520
gagcgaggaagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtat14580
ttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagcca14640
gtatacactccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaaca14700
cccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtg14760
accgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagg14820
cagggtgccttgatgtgggcgccggcggtcgagtggcgacggcgcggcttgtccgcgccc14880
tggtagattgcctggccgtaggccagccatttttgagcggccagcggccgcgataggccg14940
acgcgaagcggcggggcgtagggagcgcagcgaccgaagggtaggcgctttttgcagctc15000
ttcggctgtgcgctggccagacagttatgcacaggccaggcgggttttaagagttttaat15060
aagttttaaagagttttaggcggaaaaatcgccttttttctcttttatatcagtcactta15120
catgtgtgaccggttcccaatgtacggctttgggttcccaatgtacgggttccggttccc15180
aatgtacggctttgggttcccaatgtacgtgctatccacaggaaagagaccttttcgacc15240
tttttcccctgctagggcaatttgccctagcatctgctccgtacattaggaaccggcgga15300
tgcttcgccctcgatcaggttgcggtagcgcatgactaggatcgggccagcctgccccgc15360
ctcctccttcaaatcgtactccggcaggtcatttgacccgatcagcttgcgcacggtgaa15420
acagaacttcttgaactctccggcgctgccactgcgttcgtagatcgtcttgaacaacca15480
tctggcttctgccttgcctgcggcgcggcgtgccaggcggtagagaaaacggccgatgcc15540
gggatcgatcaaaaagtaatcggggtgaaccgtcagcacgtccgggttcttgccttctgt15600
gatctcgcggtacatccaatcagctagctcgatctcgatgtactccggccgcccggtttc15660
gctctttacgatcttgtagcggctaatcaaggcttcaccctcggataccgtcaccaggcg15720
gccgttcttggccttcttcgtacgctgcatggcaacgtgcgtggtgtttaaccgaatgca15780
ggtttctaccaggtcgtctttctgctttccgccatcggctcgccggcagaacttgagtac15840
gtccgcaacgtgtggacggaacacgcggccgggcttgtctcccttcccttcccggtatcg15900
gttcatggattcggttagatgggaaaccgccatcagtaccaggtcgtaatcccacacact15960
ggccatgccggccggccctgcggaaacctctacgtgcccgtctggaagctcgtagcggat16020
cacctcgccagctcgtcggtcacgcttcgacagacggaaaacggccacgtccatgatgct16080
gcgactatcgcgggtgcccacgtcatagagcatcggaacgaaaaaatctggttgctcgtc16140
gcccttgggcggcttcctaatcgacggcgcaccggctgccggcggttgccgggattcttt16200
gcggattcgatcagcggccgcttgccacgattcaccggggcgtgcttctgcctcgatgcg16260
ttgccgctgggcggcctgcgcggccttcaacttctccaccaggtcatcacccagcgccgc16320
gccgatttgtaccgggccggatggtttgcgaccgtcacgccgattcctcgggcttggggg16380
ttccagtgccattgcagggccggcagacaacccagccgcttacgcctggccaaccgcccg16440
ttcctccacacatggggcattccacggcgtcggtgcctggttgttcttgattttccatgc16500
cgcctcctttagccgctaaaattcatctactcatttattcatttgctcatttactctggt16560
agctgcgcgatgtattcagatagcagctcggtaatggtcttgccttggcgtaccgcgtac16620
atcttcagcttggtgtgatcctccgccggcaactgaaagttgacccgcttcatggctggc16680
gtgtctgccaggctggccaacgttgcagccttgctgctgcgtgcgctcggacggccggca16740
cttagcgtgtttgtgcttttgctcattttctctttacctcattaactcaaatgagttttg16800
atttaatttcagcggccagcgcctggacctcgcgggcagcgtcgccctcgggttctgatt16860
caagaacggttgtgccggcggcggcagtgcctgggtagctcacgcgctgcgtgatacggg16920
actcaagaatgggcagctcgtacccggccagcgcctcggcaacctcaccgccgatgcgcg16980
tgcctttgatcgcccgcgacacgacaaaggccgcttgtagccttccatccgtgacctcaa17040
tgcgctgcttaaccagctccaccaggtcggcggtggcccatatgtcgtaagggcttggct17100
gcaccggaatcagcacgaagtcggctgccttgatcgcggacacagccaagtccgccgcct17160
ggggcgctccgtcgatcactacgaagtcgcgccggccgatggccttcacgtcgcggtcaa17220
tcgtcgggcggtcgatgccgacaacggttagcggttgatcttcccgcacggccgcccaat17280
cgcgggcactgccctggggatcggaatcgactaacagaacatcggccccggcgagttgca17340
gggcgcgggctagatgggttgcgatggtcgtcttgcctgacccgcctttctggttaagta17400
cagcgataaccttcatgcgttccccttgcgtatttgtttatttactcatcgcatcatata17460
cgcagcgaccgcatgacgcaagctgttttactcaaatacacatcacctttttagacggcg17520
gcgctcggtttcttcagcggccaagctggccggccaggccgccagcttggcatcagacaa17580
accggccaggatttcatgcagccgcacggttgagacgtgcgcgggcggctcgaacacgta17640
cccggccgcgatcatctccgcctcgatctcttcggtaatgaaaaacggttcgtcctggcc17700
gtcctggtgcggtttcatgcttgttcctcttggcgttcattctcggcggccgccagggcg17760
tcggcctcggtcaatgcgtcctcacggaaggcaccgcgccgcctggcctcggtgggcgtc17820
acttcctcgctgcgctcaagtgcgcggtacagggtcgagcgatgcacgccaagcagtgca17880
gccgcctctttcacggtgcggccttcctggtcgatcagctcgcgggcgtgcgcgatctgt17940
gccggggtgagggtagggcgggggccaaacttcacgcctcgggccttggcggcctcgcgc18000
ccgctccgggtgcggtcgatgattagggaacgctcgaactcggcaatgccggcgaacacg18060
gtcaacaccatgcggccggccggcgtggtggtgtcggcccacggctctgccaggctacgc18120
aggcccgcgccggcctcctggatgcgctcggcaatgtccagtaggtcgcgggtgctgcgg18180
gccaggcggtctagcctggtcactgtcacaacgtcgccagggcgtaggtggtcaagcatc18240
ctggccagctccgggcggtcgcgcctggtgccggtgatcttctcggaaaacagcttggtg18300
cagccggccgcgtgcagttcggcccgttggttggtcaagtcctggtcgtcggtgctgacg18360
cgggcatagcccagcaggccagcggcggcgctcttgttcatggcgtaatgtctccggttc18420
tagtcgcaagtattctactttatgcgactaaaacacgcgacaagaaaacgccaggaaaag18480
ggcagggcggcagcctgtcgcgtaacttaggacttgtgcgacatgtcgttttcagaagac18540
ggctgcactgaacgtcagaagccgactgcactatagcagcggaggggttggatcaaagta18600
ctttgatcccgaggggaaccctgtggttggcatgcacatacaaatggacgaacggataaa18660
ccttttcacgcccttttaaatatccgttattctaa18695
<210>13
<211>35
<212>dna
<213>人工序列
<220>
<223>引物
<400>13
atgcatcctgcaggctctagaggatcccccctcag35
<210>14
<211>35
<212>dna
<213>人工序列
<220>
<223>引物
<400>14
agccgggcggccgctttacttgtacagctcgtcca35
<210>15
<211>30
<212>dna
<213>人工序列
<220>
<223>引物
<400>15
atgaaaaagcctgaactcaccgcgacgtct30
<210>16
<211>30
<212>dna
<213>人工序列
<220>
<223>引物
<400>16
cctcgctccagtcaatgaccgctgttatgc30
<210>17
<211>45
<212>dna
<213>人工序列
<220>
<223>引物
<400>17
agtccctgcaggttaattaacttgcgctgcgtttgtgcgggtgcg45
<210>18
<211>47
<212>dna
<213>人工序列
<220>
<223>引物
<400>18
tgacggtaccactagttagtagtacccaataagatcgaccgaagaga47
<210>19
<211>30
<212>dna
<213>人工序列
<220>
<223>引物
<400>19
ccgtaagaaccaccagcgacaccacgtcct30