用于特异性转换靶向DNA序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体与流程

文档序号:15361445发布日期:2018-09-05 00:48阅读:859来源:国知局

本发明涉及基因组序列的修饰方法,及其使用的核酸碱基转变酶和核酸序列识别模块的复合体,其不伴随dna的双链切割(无切割或者单链切割),而能够进行单子叶植物基因组的特定区域内的核酸碱基的修饰。



背景技术:

单子叶植物是指在被子植物中的一组具有1枚子叶的植物,水稻、小麦、玉米这三大谷物分类于该组。因此,虽然以前对单子叶植物的分子育种进行了热烈的研究,但由于单子叶植物不是农杆菌的宿主,因此作为植物的转化法无法长期利用最一般的农杆菌法,而使用了直接导入法。到了1990年代中旬,从报告了通过使细胞分裂旺盛的细胞感染农杆菌,由此可有效地使水稻转化以来,基于基因导入进行的单子叶植物的分子育种有了大幅进步。

另一方面,近年来,作为在各种生物种类中修饰目标的基因、基因组区域的技术,基因组编辑受到了关注。目前,作为基因组编辑的方法,提出了利用由具有非序列依赖性的dna切割能力的分子、与具有序列识别能力的分子组合而成的人工核酸酶的方法(非专利文献1)。

例如,使用由锌指dna结合结构域与非特异性dna切割结构域连接而成的锌指核酸酶(zfn),来进行在宿主的植物细胞或昆虫细胞中的dna中的、在目标基因座(genelocus)位置的重组的方法(专利文献1),使用由dna核酸内切酶和转录激活子样(tal)效应子(其为植物病原菌黄单胞菌属所具有的dna结合模块)连接而成的talen,在特定的核苷酸序列内或与其相邻的位点中切割、修饰靶基因的方法(专利文献2),或者,已报告了利用crispr-cas9系统的方法,crispr-cas9系统由(在真细菌、古细菌所具有的获得性免疫系统中起作用的)dna序列crispr(clusteredregularlyinterspacedshortpalindromicrepeats)和与crispr一起具有重要作用的核酸酶cas(crispr-associated)蛋白家族所组合而成(专利文献3)等。另外,最近报告了cpf1作为crispr-cas系统的新的核酸内切酶(非专利文献2)。进一步,也有报告了使用由核酸酶和ppr蛋白质所连接而成的人工核酸酶,其中,所述ppr蛋白质被构成为利用ppr基序(ppr基序可识别包括35个氨基酸的1个核酸碱基)的连续来识别特定的核苷酸序列的方式,从而在该特定序列的附近切割靶基因的方法(专利文献4)。

但是,这些基因组编辑技术基本上以基于核酸酶的dna双链切割(double-strandeddnabreaks:dsb)为前提,但存在这样的课题:由于dsb伴随了意想不到的基因组修饰,因此存在强细胞毒性、染色体的重排等副作用,细胞存活数极其少,根据细胞种类不同,本来就难以进行基因修饰。

对于上述课题,本发明人报告了:使用了催化脱氨基反应的脱氨酶,通过将其与具有dna序列识别能力的分子连接而成的复合体导入宿主细胞,成功地在包括酵母、大肠杆菌的各种生物种类中,不伴随dsb,而在包含特定的dna序列的区域中进行了基于核酸碱基转变的基因组序列的修饰(专利文献5)。

但是,在如单子叶植物这样的高等植物中使用该方法的情况下,为了进一步提高导入突变效率,期望将待导入的分子复合体的构成、导入后的植物细胞的培养条件等进行进一步优化。另外,在酵母、原核生物中,如从脱氨酶的使用所预测的那样,突变方式主要为碱基取代,而插入/缺失突变的频率较低,因此,需要开发可有效地导入不同方式的突变的技术。

现有技术文献

专利文献

专利文献1:日本专利第4968498号公报

专利文献2:日本特表2013-513389号公报

专利文献3:日本特表2010-519929号公报

专利文献4:日本特开2013-128413号公报

专利文献5:国际公开第2015/133554号

非专利文献

非专利文献1:kelvinmesvelt,harrishwang(2013)genome-scaleengineeringforsystemsandsyntheticbiology,molecularsystemsbiology9:641

非专利文献2:berndzetscheetal.(2015)cpf1isasinglerna-guidedendonucleaseofaclass2crispr-cassystem,cell163:759-771



技术实现要素:

发明要解决的问题

因此,本发明的第1目的在于提供新型基因组编辑的方法、以及用于此目的的核酸碱基转变酶和经进一步优化的核酸序列识别模块的复合体,其不伴随dsb,即,通过不切割双链dna或者单链切割,可有效地修饰单子叶植物的基因组基因的特定序列的核酸碱基。另外,本发明的第2目的在于提供:可在使用脱氨酶而不伴随dsb的基因组编辑中,以与碱基取代不同的方式有效地向宿主细胞导入突变的办法。

解决问题的方法

本发明人为了完成上述第1目的,首先将作为人工核酸酶的crispr/cas9系统针对水稻进行最优化而成的靶向载体pzh_osu6grna_mmcas9(plantmolbiol(2015)88:561-572)与脱氨酶进行了组合(参考图1b)。即,向上述靶向载体中的针对水稻的密码子使用而最优化的cas9编码序列(oscas9),导入使目标dna双链或者一条链的切割能力失活的突变,并且使该编码序列与针对植物的密码子使用而最优化的胞苷脱氨酶编码序列(atpmcda)进行融合。进一步,由于植物细胞比酵母等的细胞尺寸大,所以在细胞质中合成的cas9/脱氨酶融合蛋白的向核的转移效率可能降低的假说下,不仅在cas9的上游、在脱氨酶的两末端也分别加上了核定位信号(nls)。将该改良型载体导入水稻愈伤组织,结果可以将靶核苷酸序列内的目标碱基顺利取代为其它碱基。进一步,惊讶地发现,在使用目标dna的一个链的切割能力失活的(具有切口酶活性)cas9(d10a)的情况下,主要发生在由脱氨酶而脱氨基的碱基为中心的区域中的缺失突变。

另外,本发明人在导入突变株的选择步骤中,以比通常使用的培养温度比更低温的温度来培养基因导入后的水稻愈伤组织,结果成功地将导入突变效率进一步提高。

本发明人基于这些见解进一步反复研究,结果完成了本发明。

即,本发明如下所述。

[1]修饰单子叶植物细胞所具有的双链dna的靶向位点的方法,其包括:使由核酸碱基转变酶、和与所选择的双链dna中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体,与该双链dna接触,在该靶向位点中不切割的该双链dna的至少一个链,而使该靶向位点的1个以上的核苷酸缺失或转换为其它1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸的步骤,其中,该双链dna与该复合体的接触通过向该单子叶植物细胞导入编码该复合体的核酸,培养该单子叶植物细胞而使该复合体在细胞内表达来进行。

[2]上述[1]所述的方法,其中,上述培养步骤中的至少一部分在与该单子叶植物细胞的最适培养温度比更低温的温度下进行。

[3]上述[1]或[2]所述的方法,其中,上述核酸序列识别模块选自:cas的至少1个dna切割能力失活的crispr-cas系统、锌指基序、tal效应子及ppr基序。

[4]上述[1]或[2]所述的方法,其中,上述核酸序列识别模块我cas的至少1个dna切割能力失活的crispr-cas系统。

[5]上述[4]所述的方法,其中,上述核酸序列识别模块为与指导rna形成互补链的链的相反链的切割能力失活的crispr-cas系统。

[6]上述[5]所述的方法,其使靶向位点的1个以上的核苷酸缺失。

[7]上述[1]~[6]中任一项所述的方法,其中,上述核酸碱基转变酶为脱氨酶。

[8]上述[7]所述的方法,其中,上述脱氨酶为胞苷脱氨酶。

[9]上述[8]所述的方法,其中,上述胞苷脱氨酶为源自七腮鳗的pmcda1。

[10]上述[1]~[9]中任一项所述的方法,其中,编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。

[11]上述[1]~[10]中任一项所述的方法,其中,在核酸序列识别模块及核酸碱基转变酶的两末端添加了核定位信号。

[12]上述[1]~[11]中任一项所述的方法,其中,单子叶植物为水稻、小麦或玉米。

[13]上述[12]所述的方法,其中,单子叶植物为水稻。

[14]核酸修饰酶复合体,其为核酸碱基转变酶和与单子叶植物细胞具有的双链dna中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体,所述核酸修饰酶复合体在该靶向位点中,不切割该双链dna的至少一个链,该靶向位点的1个以上的核苷酸缺失或转换为其它1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸而在该单子叶植物细胞中起作用。

[15]上述[14]所述的核酸修饰酶复合体,其中,核酸序列识别模块为cas的至少1个dna切割能力失活的crispr-cas系统,核酸碱基转变酶为胞苷脱氨酶。

[16]上述[14]或[15]所述的核酸修饰酶复合体,其中,在核酸序列识别模块及核酸碱基转变酶的两末端添加了核定位信号。

[17]编码上述[14]~[16]中任一项所述的核酸修饰酶复合体的核酸。

[18]上述[17]所述的核酸,其中编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。

发明效果

根据本发明的基因组编辑技术,由于不伴随dna双链切割因而安全性优异,且能够以较高的突变导入效率进行单子叶植物的基因修饰。

附图说明

[图1]示意地示出实施例中使用的载体质粒的结构的图。a:target-aid评价用载体。b:target-aid载体。

[图2]示出在导入了两种target-aid评价用载体的水稻愈伤组织中的egfp的表达的图。

[图3]示出通过对导入prit3-megfp和2409所得到的双重转化体的pcr分析,确认了megfp及hpt基因的并入的结果的图。

[图4]示出导入prit3-megfp和2409所得到的双重转化克隆no.6中的egfp表达的图。

[图5]示出导入prit3-megfp和2409所得到的双重转化克隆no.3中的egfp表达的图。

[图6]示出导入prit3-megfp和2409所得到的两种双重转化克隆(a及b)中的靶核苷酸序列附近的测序分析结果的图。

[图7]示出导入prit3-megfp和2409所得到的双重转化克隆no.39中的靶核苷酸序列附近的测序分析结果的图。

[图8]示出导入prit3-megfp和2408所得到的双重转化克隆no.1中的靶核苷酸序列附近的测序分析结果的图。

[图9]示出导入prit3-megfp和2408所得到的双重转化克隆no.2中的靶核苷酸序列附近的测序分析结果的图。

[图10]示出导入prit3-megfp和2408所得到的双重转化克隆no.4中的靶核苷酸序列附近的测序分析结果的图。

[图11]示出导入prit3-megfp和2408所得到的双重转化克隆no.1的亚克隆no.1d(gfp信号阴性)中的靶核苷酸序列附近的测序分析结果的图。

[图12]示出甲氧咪草烟(imazamox)对水稻愈伤组织的有效浓度的评价的结果的图。上图为将水稻愈伤组织接芽至添加了甲氧咪草烟的培养基的当天,下图为培养28天时间之后的照片。

[图13]甲氧咪草烟抗性赋予试验中使用的野生型als及突变型alsa96v的表达载体的模式图。

[图14]示出基于target-aid的水稻alsa96v的修饰的靶序列的图。

[图15]示出基于target-aid的水稻als基因的修饰的图。

[图16]是基于target-aid的水稻alsa96v修饰愈伤组织进行再分化而成的t0植物体的照片。

[图17]示出由基于target-aid的水稻alsa96v修饰愈伤组织进行再分化而成的t0植物体,保持了与原始的愈伤组织相同的als基因修饰的图。

[图18]示出基于target-aid的多个基因的同时修饰的图。

具体实施方式

本发明提供不切割单子叶植物细胞内的待修饰的双链dna,通过将该双链dna中的靶核苷酸序列及其附近的核苷酸转换为其它核苷酸等,从而修饰该双链dna的该靶向位点的方法(以下也称为“本发明的方法”)。该方法包括:通过使由核酸碱基转变酶和与该双链dna中的靶核苷酸序列进行特异性结合的核酸序列识别模块结合而成的复合体在宿主单子叶植物细胞内与该双链dna接触,而使该靶向位点(即,靶核苷酸序列及其附近的核苷酸)转换为其它核苷酸等的步骤。

对在本发明的方法中可使用的单子叶植物没有特别的限制,例如:水稻、小麦、玉米、大麦、黑麦等谷物类,百合等园艺植物,更优选为水稻、小麦、玉米,特别优选为水稻。

在本发明中,双链dna的“修饰”是指使dna链上具有的核苷酸(例如:dc)缺失或转换为其它核苷酸(例如:dt、da或dg),或者向dna链上具有的核苷酸之间插入核苷酸或者核苷酸序列。这里,对待修饰的双链dna而言,只要是宿主细胞内存在的双链dna即可,没有特别限制,优选为基因组dna、特别是核基因组dna。另外,双链dna的“靶向位点”是指,核酸序列识别模块可特异性识别并结合的“靶核苷酸序列”的全部或者一部分,或指该靶核苷酸序列的附近(5'上游及3'下游的任意一种或两种)。另外,“靶核苷酸序列”是指双链dna中的核酸序列识别模块可结合的序列。

在本发明中“核酸序列识别模块”是指具有特异性识别并结合dna链上的特定的核苷酸序列(即靶核苷酸序列)的能力的分子或分子复合体。核酸序列识别模块可以通过与靶核苷酸序列结合,使与该模块连接的核酸碱基转变酶在双链dna的靶向位点发挥特异性的作用。

在本发明中,“核酸碱基转变酶”是指,可以通过催化dna碱基的嘌呤或嘧啶环上的取代基转换为其它基团或原子的反应,而不切割dna链从而将靶核苷酸转换为其它核苷酸的酶。

在本发明中,“核酸修饰酶复合体”是指,包含由上述核酸序列识别模块和核酸碱基转变酶连接而成的复合体,赋予了特定的核苷酸序列识别能力的具有核酸碱基转变酶活性的分子复合体。在此,“复合体”不仅包括由多个分子构成的形式,也包括像融合蛋白那样在单个分子内具有核酸序列识别模块和核酸碱基转变酶的形式。

就用于本发明的方法的核酸碱基转变酶而言,只要可以催化上述反应即可,没有特别限制,可列举例如:催化氨基转换为羰基的脱氨基反应的,属于核酸/核苷酸脱氨酶超家族的脱氨酶。可列举优选:可以将胞嘧啶或5-甲基胞嘧啶分别转换为尿嘧啶或胸腺嘧啶的胞苷脱氨酶,可以将腺嘌呤转换为次黄嘌呤的腺苷脱氨酶,可以将鸟嘌呤转换为黄嘌呤的鸟苷脱氨酶等。作为胞苷脱氨酶,更优选可列举活化诱导的胞苷脱氨酶(以下也称为aid)等,其为在脊椎动物的获得性免疫中在免疫球蛋白基因中导入突变的酶。

对核酸碱基转变酶的来源没有特别限制,例如,只要是胞苷脱氨酶即可,可以使用源自七腮鳗的pmcda1(petromyzonmarinuscytosinedeaminase1)、源自脊椎动物(例如:人、猪、牛、犬、黑猩猩等哺乳动物,鸡等鸟类,非洲爪蟾(xenopuslaevis)等两栖类,斑马鱼、香鱼、布氏鲶鱼等鱼类等)的aid(激活诱导的胞苷脱氨酶,activation-inducedcytidinedeaminase;aicda)。

对由本发明的核酸修饰酶复合体的核酸序列识别模块所识别的双链dna中的靶核苷酸序列而言,只要可以与该模块特异性结合即可,没有特别限制,可以为双链dna中的任意序列。就靶核苷酸序列的长度而言,只要足以与核酸序列识别模块进行特异性结合即可,根据单子叶植物的基因组尺寸,例如为12个核苷酸以上、优选为15个核苷酸以上、更优选为18个核苷酸以上。对长度的上限没有特别限制,优选为25个核苷酸以下,更优选为22个核苷酸以下。

作为本发明的核酸修饰酶复合体的核酸序列识别模块,可以使用例如:cas的至少1种dna切割能力失活的crispr-cas系统(crispr-突变cas)、锌指基序、tal效应子及ppr基序等,除此以外,可以使用包含限制酶、转录因子、rna聚合酶等可与dna进行特异性结合的蛋白质的dna结合结构域且不具有dna双链切割能力的片段等,但不限于这些。优选可列举:crispr-突变cas、锌指基序、tal效应子、ppr基序等。

锌指基序为由3~6个不同的cys2his2型锌指单元(1个手指识别约3个碱基)连接而成,可以识别9~18个碱基的靶核苷酸序列。锌指基序可以根据modularassembly法(natbiotechnol(2002)20:135-141)、open法(molcell(2008)31:294-301)、coda法(natmethods(2011)8:67-69)、大肠杆菌单杂交法(natbiotechnol(2008)26:695-701)等公知的方法产生。对于产生锌指基序的细节,可以参照上述专利文献1。

对tal效应子而言,其具有以约34个氨基酸作为单位的模块的重复结构,利用1个模块的第12及13个氨基酸残基(称为rvd)来确定结合稳定性和碱基特异性。由于各个模块的独立性较高,因此可以仅将模块相连来产生对靶核苷酸序列特异性的tal效应子。tal效应子可以由利用openresource的产生方法(real法(currprotocmolbiol(2012)chapter12:unit12.15)、flash法(natbiotechnol(2012)30:460-465)、goldengate法(nucleicacidsres(2011)39:e82)等)进行构建,比较简便地设计相对于靶核苷酸序列的tal效应子。对于产生tal效应子的细节,可以参照上述专利文献2。

构建ppr基序进而特定的核苷酸序列由ppr基序的连续识别,所述ppr基序各包含35个氨基酸并识别1个核酸碱基,且仅由每个基序的1、4和ii(-2)氨基酸识别靶向碱基。由于对基序构成没有依赖性,不受两侧的基序的干涉,因此与tal效应子同样可以仅将ppr基序相连,来产生对靶核苷酸序列特异性的ppr蛋白质。对于产生ppr基序的细节,可以参照上述专利文献4。

另外,在使用限制酶、转录因子、rna聚合酶等片段的情况下,由于它们的蛋白质的dna结合结构域是众所周知的,因此可以容易地设计、构建包含该结构域且不具有dna双链切割能力的片段。

上述任意核酸序列识别模块也可以以与上述核酸碱基转变酶的融合蛋白的形式提供,或者,也可以将sh3结构域、pdz结构域、gk结构域、gb结构域等蛋白质结合结构域和它们的结合配偶体,分别与核酸序列识别模块和与核酸碱基转变酶融合,通过该结构域和它们的结合配偶体的相互作用而以蛋白质复合体的形式提供。或者,也可以将核酸序列识别模块与核酸碱基转变酶和与内含肽(intein)分别融合,通过各蛋白质合成后的连接(ligation)将两者连接。

就包含核酸碱基转变酶与核酸序列识别模块结合而成的复合体(包括融合蛋白)的本发明的核酸修饰酶复合体,与双链dna的接触而言,通过向具有目标的双链dna(例如,核基因组dna)的单子叶植物细胞导入编码该复合体的核酸来实施。

因此,对核酸序列识别模块与核酸碱基转变酶而言,以编码它们的融合蛋白的核酸的形式进行制备,或以使得利用结合结构域、内含肽等翻译成蛋白质之后可以在宿主细胞内形成复合体的形态,以分别编码它们的核酸的形式进行制备。在此,核酸可以为dna也可以为rna,优选为dna。在为dna时,优选为双链dna,并以在宿主细胞内在功能性的启动子的操纵下配置的表达载体的形态提供。

由于核酸序列识别模块和核酸碱基转变酶结合而成的本发明的复合体不伴随dna双链切割(dsb),因此,能够进行毒性较低的基因组编辑,本发明的基因修饰方法可以广泛适用于单子叶植物全体。

对编码锌指基序、tal效应子、ppr基序等核酸序列识别模块的dna而言,对于各模块,可以通过上述任意方法获得。对编码限制酶、转录因子、rna聚合酶等序列识别模块的dna而言,可以通过以下进行克隆:例如基于它们的cdna序列信息,而合成使得覆盖编码该蛋白质的期望部分(包含dna结合结构域的部分)的区域的寡dna引物,并利用由产生该蛋白质的细胞制备的总rna或者mrna级分作为模板,通过rt-pcr法进行扩增。

编码核酸碱基转变酶的dna也可以同样地通过以下进行克隆:基于待使用的酶的cdna序列信息来合成寡dna引物,使用由产生该酶的细胞制备的总rna或者mrna级分作为模板,通过rt-pcr法进行扩增。例如,就编码七腮鳗的pmcda1的dna而言,可以基于ncbi数据库中登记的cdna序列(登记号.ef094822),针对cds的上游及下游设计适当的引物,从源自七腮鳗的mrna通过rt-pcr法进行克隆。另外,就编码人aid的dna而言,可以基于ncbi数据库登记的cdna序列(登记号.ab040431),针对cds的上游及下游设计适当的引物,例如从源自人淋巴结的mrna通过rt-pcr法进行克隆。其它源自脊椎动物的aid同源也可以基于公知的cdna序列信息(例如:猪(登记号.cu582981)、牛(登记号.nm_110138682)、犬(登记号.nm_001003380)、黑猩猩(登记号.nm_001071809)、鸡(登记号.nm_001243222)、非洲爪蟾(登记号.nm_001095712)、斑马鱼(登记号.aai62573)、香鱼(登记号.ab619797)、布氏鲶鱼(登记号.nm_001200185)等),与上述同样地进行而克隆。

经克隆的dna可以直接或根据需要利用限制酶进行消化,或在加上适当的接头和/或核定位信号(在目标的双链dna为线粒体、叶绿体dna时,为各细胞器定位信号)之后,与编码核酸序列识别模块的dna进行连接,来制备编码融合蛋白的dna。在优选实施方式中,优选在编码核酸序列识别模块的dna和编码核酸碱基转变酶的dna这两者的两末端,加上编码核定位信号等细胞器定位信号的dna序列。由于单子叶植物细胞的尺寸大于酵母细胞,因此合成蛋白质的细胞质与核之间的距离变大。因此,对于如核酸碱基转变酶与核酸序列识别模块的复合体这样的分子量较大的蛋白质分子有效地输送至核,优选在核酸序列识别模块和核酸碱基转变酶的两者均加上核定位信号。在将核酸碱基转变酶与核酸序列识别模块以融合蛋白的形式表达的情况下,可以在融合蛋白的两末端、和核酸序列识别模块与核酸碱基转变酶之间加上核定位信号。作为核定位信号,只要可以在单子叶植物中起作用即可,没有特别的限制,可列举例如源自sv40的核定位信号(pkkkrkv;seqidno:6)。

或者,编码核酸序列识别模块的dna和编码核酸碱基转变酶的dna可以分别与编码结合结构域或其的结合配偶体的dna进行融合,或也可以通过使两种dna与编码分离内含肽的dna进行融合,从而使得核酸序列识别转变模块和核酸碱基转变酶在宿主细胞内翻译后再形成复合体。在这些情况下,也可以根据需要在一方或双方dna的适当的位置连接接头及/或核定位信号。

对编码核酸序列识别模块的dna和编码核酸碱基转变酶的dna而言,可以化学合成dna链,或者也可以通过将合成的部分重叠的寡dna短链利用pcr法、gibsonassembly法进行连接,从而构建编码其全长的dna。利用化学合成或pcr法或者gibsonassembly法的组合来构建全长dna的优点在于,可以在整个cds全长上设计与待导入该dna的宿主配合的使用密码子。在表达异种dna时,通过将该dna序列转换为在宿主生物中使用频率较高的密码子,可以期待使蛋白质表达量增大。就待使用的宿主中的密码子使用频率的数据而言,可以使用例如在(公财)kazusadna研究所的主页上公开的遗传密码使用频率数据库(http://www.kazusa.or.jp/codon/index.html),也可以参照记载了各宿主中的密码子的使用频率的文献。只要参照取得的数据和准备导入的dna序列,将该dna序列中使用的密码子中的在宿主中使用频率较低的密码子,转换为编码同一氨基酸且使用频率较高的密码子即可。例如,在宿主细胞为水稻细胞的情况下,可以使用针对水稻等单子叶植物,或者拟南芥等被子植物的一般的密码子使用而最优化的核酸序列识别模块和/或编码核酸碱基转变酶的序列。例如,作为具有适于在被子植物中的表达的密码子使用的pmcda1dna,可列举具有以seqidno:1表示的核苷酸序列的dna。

含有编码核酸序列识别模块和/或核酸碱基转变酶的dna的表达载体,例如可以通过以下制造:在包含在单子叶植物细胞中可发挥作用的启动子的载体中,将该dna连接于该启动子的下游。

作为在单子叶植物细胞中可复制的载体,只要是具有在单子叶植物细胞中起作用的复制起点(例如,ti质粒、ri质粒的ori等)的那些即可,没有特别的限制,优选也具有大肠杆菌的复制起点(例如,cole1ori等)。在作为基因导入法使用了农杆菌法的情况,需要进一步包含ti质粒、ri质粒的已除去致病性基因的t-dna片段(包括边界序列rb及lb),可列举例如:源自pbin193的pbi101、pbi121(clontech)、以它们为骨架的改良型载体(例如,pri909、pri910、pri101、pri201(takarabio)等),但不限于这些。

作为启动子,只要是在单子叶植物细胞中可发挥作用的启动子即可,可以是任意启动子。由于伴随dsb的常规法有毒性,因此宿主细胞的生存率可能显著降低,所以优选在使用诱导启动子(例如,被受伤、水杨酸处理所诱导的pr1α基因启动子,被干燥、低温、脱落酸处理所诱导的rd29a基因启动子、被二氯丙烯胺(dichlormid)处理所诱导的gst-27基因启动子等)事先增加细胞数量至开始诱导为止,但本发明的核酸修饰酶复合体即使表达也可得到充分的细胞增殖,所以可以不限制地使用构成启动子。作为构成启动子,可列举花椰菜花叶病毒(cauliflowermosaicvirus)(camv)35s启动子、camv19s启动子、胭脂碱合成酶(nopalinesynthetase)(nos)启动子、源自欧芹的泛素启动子(pcubi4-2)等。也可以使用这些启动子或其片段串联相连而成的片段(例如,2x35s)。

在表达载体中,可以根据需要含有终止子(例如,nos终止子、豌豆rbcs3a终止子、热休克蛋白质(hsp)17.3终止子等),翻译增强子(例如,源自水稻的醇脱氢酶5'非翻译区(osadh-5'utr)、camv、源自烟草花叶病毒(tmv)的ω序列等),3'调节区(例如,源自水稻的肌动蛋白基因(act1)3'utr等),polya加成信号,药物抗性基因(例如,g418抗性基因(nptii),潮霉素抗性基因(hpt)等)选择标记等。

编码核酸序列识别模块和/或核酸碱基转变酶的rna可以通过例如以下制备:以编码上述核酸序列识别模块和/或核酸碱基转变酶的dna编码的载体作为模板,通过本身公知的体外转录系统转录为mrna。

可以通过将包含编码核酸序列识别模块及/或核酸碱基转变酶的dna表达载体导入宿主单子叶植物细胞,并培养该宿主细胞,从而使核酸碱基转变酶与核酸序列识别模块的复合体在细胞内表达。

对作为宿主的单子叶植物细胞而言,可以使用例如:从水稻、小麦、玉米、大麦、黑麦等谷物,百合等花卉园艺植物等制备的悬浮培养细胞、愈伤组织、原生质体、叶切片、根切片、种子(不成熟的胚等)等。

单子叶植物细胞可以为单倍体(一倍体)、也可以为多倍体(例如,二倍体、三倍体、四倍体等)。在常规的突变导入方法中,作为原则仅向同源染色体的一条中导入突变而形成杂合基因型,因此,如果不是优势突变,就不会表达需要的特性,而纯合化耗时耗力,大多情况不方便。与此相对,根据本发明,由于存在可以对基因组内的同源染色体上的等位基因全部导入突变的可能性,所以即使为劣势突变,也可以在该代中表达期望的表现,可克服常规法的问题。

表达载体的导入可以根据单子叶植物的种类,相对于适当的组织(例如,愈伤组织、根、叶、种子、生长点等),依照公知的方法(例如:农杆菌法、peg法、电穿孔法、粒子枪法等)实施。例如,在为水稻的情况下,通常可以使用农杆菌法、whisker直接导入法等,但不限于这些。例如,在农杆菌法的情况下,依照常规方法从水稻种子诱导愈伤组织,使该愈伤组织感染已导入农杆菌表达用载体的农杆菌,3天后进行灭菌,其中,在所述农杆菌表达用载体的t-dna片段中,内置了编码核酸序列识别模块和/或核酸碱基转变酶的dna的表达盒。另一方面,在whisker直接导入法的情况下,将表达载体与多聚鸟氨酸进行混合而制成复合体后,与钛酸钾制成的whisker一起添加至水稻愈伤组织并混合,之后进行超声波处理。

在为小麦、玉米的情况下,可以例如将从不成熟的种子收集的不成熟的胚作为植物材料,同样地使用农杆菌法导入表达载体。

在使用peg法、电穿孔法的情况下,从适当的细胞、组织依照常规方法制备原生质体,向其导入表达载体。在粒子枪法的情况下,可以使用粒子枪对愈伤组织、不成熟的胚、存在于茎尖、腋芽的生长点等,导入吸附于金微粒的表达载体。

在粒子枪法、农杆菌法中,基因导入大多情况为嵌合,所以为了进行转化需要使用向生殖系列(germline)的细胞高频率地导入了上述核酸的试样细胞。可列举例如:胚、胚轴切片、胚形成愈伤组织(embryogeniccallus),分离的生长点等。

导入了载体的单子叶植物细胞的培养,可以根据其种类依照公知的方法实施。作为用于培养的培养基,优选为固态培养基(例如,琼脂培养基、琼脂糖培养基、结冷胶培养基等)。另外,培养基优选含有转化体的生长所必需的碳源、氮源、无机物等。例如,作为基础培养基,可以使用n6培养基、ms培养基、ls培养基、b5培养基等。也可以在培养基中适当添加植物生长物质(例如,生长素类、细胞分裂素类等)等。培养基的ph优选为约5~约8。培养温度可以根据单子叶植物细胞的种类,在通常约20℃~约35℃的范围内适当选择。例如,在为水稻愈伤组织的情况下,可以通常在28~33℃、优选在30~33℃中培养。

如上所述操作,可以在细胞内表达核酸序列识别模块和核酸碱基转变酶的复合体,即核酸修饰酶复合体。

稳定地表达导入的核酸碱基转变酶与核酸序列识别模块的转化体的选择可以通过以下进行:在添加了与导入的表达载体中包含的选择标记基因(例如,nptii、hpt等药物抗性基因)相对应的药品的培养基上,培养单子叶植物细胞,并选择药物抗性菌落。对选择培养的时期没有特别限制,通常在3-6周左右出现药物抗性菌落。

在可以可视化目标导入突变的情况下,也可以例如,在通过该导入突变而赋予单子叶植物细胞以药物抗性,对产生色素的能力发生变化的情况下,不进行使用选择标记的初步筛选,而是以基于目标导入突变的特质的变化作为指标,直接选择该导入突变株。

转化体可以根据适于其培养的本身公知的方法进行传代培养。例如,可以使用与上述转化体的选择培养中所使用的同样的方法。这里,可以通过将转化体在比通常更低的温度(例如,在为水稻愈伤组织的情况下为20-26℃、优选为约25℃)中培养,使导入突变效率升高。虽然不愿以任何理论来进行限制,但作为1种解释,作为本发明中的优选核酸碱基转变酶之一的pmcda1,源自于変温动物七腮鳗,因此对pmcda1的酶活性的最适温度而言,存在比普通酶的最适温度(约37℃)更低的可能性,因此,可考虑通过低温培养增大酶活性。因此,在本发明的优选一实施方式中,作为核酸碱基转变酶使用了pmcda1,并且将导入了编码核酸序列识别模块/pmcda1复合体的核酸的单子叶植物细胞在低温下培养。

另外,也可以通过将转化体以比通常更高的密度条件(例如,在为水稻愈伤组织的情况下,通过使愈伤组织之间可相接程度的密度,从而限定与培养基的接触,细胞受到应激这样的条件)下进行培养,使导入突变效率升高。

是否在转化体的目标双链dna中顺利导入突变的确认,在由于导入突变而可以可视化表现型的变化的情况下,可以通过检查表现型来进行,但最终的确认优选通过以下来进行:将包含靶核苷酸序列的目标dna区域通过基因组pcr进行扩增,确定扩增片段的碱基序列。由于即使是1个转化体克隆,根据细胞不同,导入突变的方式也可能不同,所以例如在作为植物材料使用愈伤组织的情况下,例如可以通过重复进行以下操作而得到具有均一的导入突变方式的克隆:将转化愈伤组织悬浊于液体培养基中,并再接种至固态培养基上,对形成的亚克隆确认导入突变方式。

确认了导入突变的转化体克隆,可以根据本身公知的再分化法,使其再分化为植物体。在杂合性地导入了突变的情况下,可以通过将使得到的植物体进行自体受粉所得到的r1植物,进一步进行自体受粉而得到r2植物,从而得到纯合性导入突变的植物体。

由导入至细胞内的表达载体,表达核酸碱基转变酶与核酸序列识别模块的复合体时,该核酸序列识别模块特异性识别并结合于目标的双链dna(例如,基因组dna)内的靶核苷酸序列,利用连接于该核酸序列识别模块的核酸碱基转变酶的作用,在靶向位点(在靶核苷酸序列的全部或者一部分或它们的附近)的有义链或者反义链发生碱基转变,在双链dna内发生错配(例如,在将pmcda1、aid等胞苷脱氨酶作为核酸碱基转变酶使用的情况下,靶向位点的有义链或者反义链上的胞嘧啶被转换为尿嘧啶,发生u:g或者g:u错配)。该错配未被正确修复,而修复使得相反链的碱基与转换后的链的碱基成对(上述例子中,为t-a或者a-t),或修复时进一步取代为其它核苷酸(例如:u→a、g),或者发生1个~数十个碱基的缺失或者插入,由此导入了各种突变。

对锌指基序而言,由于与靶核苷酸序列特异性结合的锌指的产生效率不高,另外,结合特异性高的锌指的筛选较为复杂,因此,产生多个实际发挥作用的锌指基序并不容易。就tal效应子、ppr基序而言,比锌指基序的靶核酸序列识别的自由度高,但需要每次根据靶核苷酸序列设计并构建巨大的蛋白质,因此在效率方面存在问题。

与此相对,由于crispr-cas系统是通过相对于与靶核苷酸序列互补的指导rna来识别目标的双链dna的序列,因此可以仅通过合成可与靶核苷酸序列形成特异性的杂合的寡dna,而将任意序列靶向化。

因此,在本发明的更优选的实施方式中,作为核酸序列识别模块,可以使用cas效应子蛋白质的至少1个dna切割能力失活的crispr-cas系统(crispr-突变cas)。

使用了crispr-突变cas的本发明的核酸序列识别模块,是以包含与靶核苷酸序列互补的序列的crispr-rna(crrna)、(根据需要)trans-activatingrna(tracrrna)、与突变cas效应子蛋白质的复合体的形式提供的,其中,tracrrna为在突变cas效应子蛋白质的募集中所需要(在需要tracrrna时,可以以与crrna的嵌合rna形式来提供)。将与突变cas效应子蛋白质进行组合而构成核酸序列识别模块的、仅包括crrna或者包括crrna与tracrrna的嵌合rna的rna分子总称为“指导rna”。

本发明使用的cas效应子蛋白质,只要与指导rna形成复合体,可识别并结合靶基因中的靶核苷酸序列和与其相邻的protospaceradjacentmotif(pam)即可,没有特别限制、优选为cas9或cpf1。作为cas9,可列举例如:源自化脓性链球菌(streptococcuspyogenes)的cas9(spcas9;pam序列ngg(n为a、g、t或c。以下相同))、源自嗜热链球菌(streptococcusthermophilus)的cas9(stcas9;pam序列nnagaaw)、源自脑膜炎奈瑟菌(neisseriameningitidis)的cas9(mmcas9;pam序列nnnngatt)等,但不限于这些。优选为基于pam的限制较少的spcas9(实质上为2个碱基,理论上可以靶向于基因组上的基本所有位置)。另外,作为cpf1,可列举例如:源自土拉热弗朗西丝菌(francisellanovicida)的cpf1(fncpf1;pam序列ntt)、源自氨基酸球菌属种(acidaminococcussp.)的cpf1(ascpf1;pam序列nttt)、源自毛螺菌科的细菌(lachnospiraceaebacterium)的cpf1(lbcpf1;pam序列nttt)等,但不限于这些。作为本发明中使用的突变cas效应子蛋白质(有时简称为突变cas),能够使用cas效应子蛋白质的双链dna的两条链的切割能力失活的那些,和具有仅一条链的切割能力失活的切口酶活性的那些中的任意。例如,在为spcas9的情况下,可以使用将第10位的asp残基转换为ala残基,欠缺与指导rna形成互补链的链的相反链的切割能力(因此,具有针对与指导rna形成互补链的链的切口酶活性)的d10a突变体,或者将第840位的his残基转换为ala残基,欠缺与指导rna形成互补链的链的切割能力(因此,具有针对与指导rna形成互补链的链的相反链的切口酶活性)的h840a突变体,进一步及其双重突变体(dcas9)。另外,在为fncpf1的情况下,可以使用将第917位的asp残基转换为ala残基(d917a)、或者将第1006位的glu残基转换为ala残基(e1006a)的,欠缺两条链的切割能力的突变体。只要欠缺对双链dna的至少一条链的切割能力即可,也同样可以使用其它突变cas。

对核酸碱基转变酶而言,通过与上述锌指等之间的连接方式相同的方法,以突变cas的复合体的形式提供。或者,核酸碱基转变酶和突变cas也可以利用rna适体的ms2f6、pp7等、由它们的结合蛋白质构成的rna支架进行结合。指导rna中的靶向序列与靶核苷酸序列形成互补链,指导rna中的其它区域(即,crrna中的除了靶向序列以外的序列,或者与crrna连续的tracrrna)募集突变cas而识别pam,不切割一方或者两者的dna,利用连接于突变cas的核酸碱基转变酶的作用,使靶向位点(可以在靶核苷酸序列的全部或者一部分包含的几百个碱基的范围内适当调节)发生碱基转变,在双链dna内发生错配。该错配未被正确修复,而修复使得相反链的碱基与转换后的链的碱基成对,或修复时进一步转换为其它核苷酸,发生1个~数十个碱基缺失或者插入由此导入了各种突变。

在将crispr-突变cas用作核酸序列识别模块的情况下,也与将锌指等作为核酸序列识别模块的情况相同地,核酸序列识别模块和核酸碱基转变酶,以编码它们的核酸(优选为dna)的形态,导入具有目标的双链dna单子叶植物细胞。

对编码cas效应子蛋白质(例如,cas9、cpf1)的dna而言,可以根据与编码核酸碱基转变酶的dna的上述的同样的方法,从产生该酶的细胞进行克隆。另外,突变cas可以通过以下获得:在编码克隆的cas的dna中,使用本身公知的位点特异性的突变诱发法,以将对dna切割活性重要的位点的氨基酸残基(例如:在为spcas9的情况下,可列举第10位的asp残基、第840位的his残基,在为fncpf1的情况下,可列举第917位的asp残基、第1006位的glu残基等,但不限于这些)转换为其它氨基酸的方式导入突变。

或者,对编码突变cas的dna而言,也可以针对编码核酸序列识别模块的dna、编码核酸碱基转变酶的dna,通过与上述相同的方法和化学合成或pcr法或者gibsonassembly法的组合,构建具有适于使用的宿主单子叶植物细胞的表达的密码子使用的dna形式。例如,作为具有适于在水稻中的表达的密码子使用的spcas9dna,可列举具有以seqidno:3表示的核苷酸序列的dna。

对编码突变cas的dna和编码核酸碱基转变酶的dna而言,可以连接使得以融合蛋白的形式表达,也可以设计成使得使用结合结构域、内含肽等分别进行表达,并通过蛋白质间相互作用、蛋白质连接而在宿主细胞内形成复合体。在以上任一种情况下,均对编码突变cas的dna和编码核酸碱基转变酶的dna而言,优选在各自的两末端加上编码在单子叶植物细胞中可发挥作用的核定位信号(nls)的序列(例如,源自sv40的nls编码序列;seqidno:5)。在突变cas和核酸碱基转变酶以融合蛋白的形式表达的情况下,可以在一个蛋白质的c末端和另一个蛋白质的n末端作为添加的nls而共有1个nls序列。在对于真核细胞适用crispr-cas技术的情况下,为了改善cas效应子蛋白质的核定位的效率而加上nls为传统方法,由于基于本发明是以突变cas与核酸碱基转变酶的复合体形式进行表达,因此分子量变大,在将尺寸大于本发明人等先前报告的酵母细胞的单子叶植物细胞用作宿主的情况下,存在该复合体的核定位的效率降低的可能性。因此,本发明人为了改善该复合体的核定位效率,构思在突变cas效应子蛋白质和核酸碱基转变酶的各两末端加上nls,由此即使是在单子叶植物细胞中,也成功地使用本发明的基因组编辑技术而得到较高的导入突变效率。

得到的编码突变cas和/或核酸碱基转变酶的dna可以插入于与上述相同的表达载体的启动子的下游,例如:camv35s启动子、camv19s启动子、nos启动子、pcubi4-2启动子、2x35s启动子等。在表达载体中,如上所述,可以根据需要含有:终止子(例如,nos终止子、豌豆rbcs3a终止子、热休克蛋白质(hsp)17.3终止子等),翻译增强子(例如,源自水稻的醇脱氢酶5'非翻译区(osadh-5'utr)、camv、源自烟草花叶病毒(tmv)的ω序列等),3'调节区(例如,源自水稻的肌动蛋白基因(act1)3'utr等),polya加成信号,药物抗性基因(例如,g418抗性基因(nptii)、潮霉素抗性基因(hpt)等)的选择标记等。在优选的实施方式中,为了提高在单子叶植物细胞中的翻译效率,可以将osadh-5'utr插入启动子和编码突变cas和/或核酸碱基转变酶的dna之间。

另一方面,编码指导rna的dna可以通过设计(1)或(2)而使用dna/rna合成仪进行化学合成:(1)包含与靶核苷酸序列的“目标链(targetedstrand)”互补的核苷酸序列(也称为“靶向序列(targetingsequence)”)的crrna序列(例如,在作为cas效应子蛋白质募集fncpf1时,可使用在靶向序列的5'侧包括aauuucuacuguuguagau(seqidno:7;下划线部的序列之间形成碱基对而形成茎-环结构)的crrna)的编码序列;(2)将crrna编码序列根据需要与已知的tracrrna编码序列(例如,作为作为cas效应子蛋白质募集cas9时的tracrrna编码序列,为gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtgctttt;seqidno:8)连接而成的寡dna序列。

在此“目标链”是指与靶核苷酸序列的crrna杂交的链,将其的相反链而通过目标链与crrna的杂交而成为一条链状的链称为“非目标链(non-targetedstrand)”。另外,由于推定核酸碱基转换反应通常大多情况在已成为一条链状的非目标链上发生,所以在将靶核苷酸序列以一条链的形式表现时(例如在标记pam序列时,表示靶核苷酸序列与pam的位置关系时等),用非目标链的序列进行代表。

对靶向序列的长度而言,只要是可相对于靶核苷酸序列特异性结合即可,没有特别限制,例如为15~30个核苷酸、优选为18~25个核苷酸。靶核苷酸序列的选择受到该序列的3'侧(在cas9的情况下)或者5'侧(在cpf1的情况下)相邻的pam的存在所限制,根据酵母等中的见解,在将crispr-突变cas9与胞苷脱氨酶进行组合的本发明的系统中,不论靶核苷酸序列的长度如何,也存在容易对位于其从5'端向3'方向7个核苷酸以内的位置的c进行取代的规律性,所以可以通过适当选择靶核苷酸序列(作为其互补链的靶向序列)的长度,而使可导入突变碱基的位点移位。由此,可以至少部分解除基于pam(在spcas9中为ngg)的限制,进一步提高导入突变的自由度。

靶向序列的设计可以例如通过以下进行:在作为cas效应子蛋白质使用cas9的情况下,使用公开的指导rna设计网站(crisprdesigntool,crisprdirect等),从靶基因的cds序列中列表出与pam(例如:在为spcas9的情况下,为ngg)在3'侧相邻的20mer序列,在将其从5'端向3'方向7个核苷酸以内的c转换为t的情况下,选择使得靶基因所编码的蛋白质发生氨基酸变化的序列。进一步,在使靶向序列的长度在例如18~25个核苷酸的范围中变化的情况下,同理选择存在从其5'端向3'方向7个核苷酸以内的通过变为t的碱基转变而发生氨基酸变化的c的序列。可以从这些候选中,将目标的单子叶植物基因组中脱靶位点数量较少的候选序列用作靶向序列。在使用的指导rna设计软件中没有检索单子叶植物基因组的脱靶位点的功能的情况下,例如可以通过针对候选序列的3'侧的8~12个核苷酸(靶核苷酸序列的识别能力高的seed序列),对作为宿主的单子叶植物基因组进行blast检索来检索脱靶位点。

编码指导rna的dna也可以插入至与上述相同的表达载体,作为启动子,优选使用poliii类的启动子(例如,snr6、snr52、scr1、rpr1、u3、u6、h1启动子等)及终止子(例如,polyt序列(t6序列等))。例如,在宿主细胞为水稻细胞的情况下,可使用源自水稻的u6或u3启动子,更优选为u6启动子。在使用poliii类启动子的情况下,应该使得不将具有连续4个以上的t的核苷酸序列选择为靶向序列。

对编码指导rna(crrna或crrna-tracrrna嵌合)的dna而言,可以设计与靶核苷酸序列的目标链互补的序列与已知的tracrrna序列(募集cas9时)或crrna的直接重复序列(募集cpf1时)连接而成的寡rna序列,并使用dna/rna合成仪进行化学合成。

编码突变cas和/或核酸碱基转变酶的dna、编码指导rna(crrna或crrna-tracrrna嵌合)的dna可以根据宿主单子叶植物细胞,而利用与上述同样的方法导入细胞。稳定表达突变cas及核酸碱基转变酶的转化体的选择、对所选择的转化体的保持培养(maintenanceculture),也可以与上述同样操作而进行。

在常规型的人工核酸酶中,由于伴随dna双链切割(dsb),因此,对基因组内的序列进行靶向时,发生认为由染色体的无序切割(脱靶切割)而导致的增殖阻碍和细胞死亡。在本发明中,由于通过不切割dna的对dna碱基上的取代基的转换反应(特别是脱氨基反应)进行突变导入,因此,可以实现毒性的大幅降低。

需要说明的是,在本发明的双链dna的修饰中,除了靶向位点(可以在包含靶核苷酸序列的全部或者一部分的几百个碱基的范围内适当调节)以外,不会妨碍该双链dna的切割的发生。然而,考虑到本发明的最大的一个优点是避免了由脱靶切割导致的毒性,则在优选的一种实施形态中,本发明的双链dna的修饰,不仅在选择的双链dna的靶向位点中,在其以外的位点中也不伴随dna链的切割。

如下文的实施例所示,在作为突变cas使用了具有仅可切割双链dna中的一个链的切口酶(nickase)活性的cas9的情况下,与在使用不能切割两条链的突变cas9的情况下的导入突变方式的倾向明显不同。如果作为突变cas,使用了欠缺对与指导rna形成互补链的链的相反链(非目标链)的切割能力(因此,具有对目标链的切口酶活性)的d10a突变体,则比起碱基取代,导入1至20个核苷酸左右的缺失突变的倾向更强。缺失大多情况下在以碱基取代位点(靶核苷酸序列的从5'末端向3'方向的7个核苷酸以内)为中心的区域发生,而不是在基于cas的切割位点(pam的上游2-3个核苷酸),另外,也存在与该缺失同时,伴随插入1或多个核苷酸的情况。虽然不愿以任何理论来进行限制,但在除去修复受到非目标链上的碱基取代的核苷酸时,在单子叶植物中,可考虑将周边的碱基也一总除去,并且以相反链(目标链)作为模板进行延长反应。此时,推测如果在目标链产生了缺口,则除去修复机制在目标链也发挥作用,变成在两条链中发生核苷酸的脱落的状态,无法进行正常的延长反应而勉强发生连接,由此结果是导致容易发生缺失突变。

另一方面,在使用不能切割两条链的突变cas9时,导入突变方式与芽殖酵母、大肠杆菌等的情况相同,以碱基取代为主。其中,导入突变位点的范围比芽殖酵母的情况下更广泛一些,达到靶核苷酸序列的5'末端的更上游(例如:pam序列的上游21个核苷酸)为止。虽然不愿以任何理论来进行限制,但基于上述假说,可认为由于在目标链中不产生缺口,因此以目标链为模板的延长反应正常进展,结果导致碱基取代成为主要的突变。同样地,在使用欠缺目标链的切割能力(因此,具有对非目标链的切口酶活性)的h840a突变体的情况下,推定由于以作为相反链的目标链作为模板的延长反应也正常进展,因此作为导入突变方式,以碱基取代为主。

因此,通过适当选择突变cas的dna链切割能力,能够向双链dna的特定的核苷酸或核苷酸区域中对针点导入碱基取代,或者导入以碱基取代位点为中心的约20个核苷酸以内的缺失突变,也可以根据目标不同而分开使用。

本发明人另外使用芽殖酵母确认了:与以单独的核苷酸序列为靶相比,通过产生针对相邻的多个靶核苷酸序列的序列的识别模块并同时使用,导入突变效率大幅升高,在单子叶植物细胞中也可以期待同样的效果。对其效果而言,由使得两个靶核苷酸序列的一部分发生重复的情况可知,即使在两者分开600bp左右的情况下,也同样实现了突变诱导。另外,在靶核苷酸序列存在于相同方向(目标链为相同链)、以及对向(以双链dna的两条链为目标链)的两种情况下,均可发生。

另外,也能够以完全不同位置的多个dna区域为靶进行修饰。因此,在本发明优选的一种实施方式中,可以使用与不同的靶核苷酸序列(可以在1个靶基因内,也可以在不同的2个以上的靶基因内。)分别特异性结合的、两种以上的核酸序列识别模块。在该情况下,核酸碱基转变酶与每个这些核酸序列识别模块的1个形成核酸修饰酶复合体。在此核酸碱基转变酶为共通的东西可以使用。例如,在作为核酸序列识别模块使用crispr-cas系统的情况下,可以使用与cas效应子蛋白质和核酸碱基转变酶的复合体(融合蛋白包含)共通的那些,作为指导rna(crrna或crrna-tracrrna嵌合)可以产生并使用两种以上的嵌合rna,所述嵌合rna为由与不同靶核苷酸序列分别形成互补链的2种以上的crrna,或者2种以上的crrna每一种分别与tracrrna形成的嵌合rna。另一方面,在使用锌指基序、tal效应子等作为核酸序列识别模块的情况下,例如可以将与不同的靶核苷酸特异性结合的各核酸序列识别模块,与核酸碱基转变酶进行融合。

为了使本发明的核酸修饰酶复合体在宿主细胞内表达,因此如上所述将包含编码该核酸修饰酶复合体的dna的表达载体导入单子叶植物细胞,但为了有效地导入突变,因此优选能保持规定时期以上、规定水平以上的核酸修饰酶复合体的表达。从该观点出发,对该表达载体而言,虽然确实被组装入宿主基因组,但由于核酸修饰酶复合体的持续表达使脱靶切割的风险增大,所以优选在顺利完成导入突变后将其迅速除去。作为用于去除组装在宿主基因组中的dna的方法,可列举使用cre-loxp类的方法、使用转座子的方法等。

或者,通过仅在用于在期望的时期发生核酸碱基转换反应、固定靶向位点的修饰所需要的时期一过性地使本发明的核酸修饰酶复合体在宿主细胞内表达,由此避免脱靶切割的风险并且可以有效地实现宿主基因组的编辑。对用于发生核酸碱基转换反应、固定靶向位点的修饰所需要的时期而言,根据宿主细胞的种类、培养条件等而不同,但由于至少需要经过数代的细胞分裂,因此可认为需要2-3天左右。本领域技术人员可以基于使用培养条件等而适当确定优选的表达诱导期。对编码本发明的核酸修饰酶复合体的核酸的表达诱导期而言,在对宿主细胞不产生副作用,且可保持宿主细胞的再分化能力的范围,可以超出上述“固定靶位点的修饰所需要的时期”并延长。

作为将本发明的核酸修饰酶复合体在期望的时期进行一过性地表达的方法,可列举产生以能够控制表达期的形态,包含编码该核酸修饰酶复合体的核酸(在crispr-cas系统中,编码指导rna-的dna、和编码突变cas及核酸碱基置换酶的dna)的构建体(表达载体),并导入单子叶植物細胞的方法。作为“能够控制表达期的形态”,具体而言,可列举将编码本发明的核酸修饰酶复合体的dna置于诱导性的调节区的操纵下的形态。对“诱导性的调节区”没有特别限制,可列举例如:上述诱导启动子(例如,pr1α基因启动子、rd29a基因启动子、gst-27基因启动子等)。

以下,根据实施例对本发明进行说明。但是,本发明并不限于这些实施例。

实施例

1.载体构建

(1)target-aid评价用载体的构建

利用常规方法产生了具有图1a所示的结构的prit3-egfp(具有egfporf;seqidno:9)和prit3-megfp(在egfp开始密码子后直接存在终始密码子;seqidno:10)。

(2)target-aid载体的构建

通过以下产生了具有图1b所示的结构的target-aid载体2408(编码dcas9的;seqidno:11)和2409(编码d10a突变体的;seqidno:12):将pzh_osu6grna_mmcas9(plantmolbiol(2015)88:561-572)的osopt.cas9取代为编码(具有h840a及d10a的双重突变、或仅d10a突变的)突变cas9的dna,在其下游在两末端加上了编码源自sv40的核定位信号(nls)的序列,并使其与编码针对拟南芥的密码子使用而最优化的pmcda1的dna融合。

2.向农杆菌细菌导入target-aid及评价用载体

将作为target-aid载体的2408和2409(图1b)、作为评价用载体的prit3-egfp和prit3-megfp(图1a),通过电穿孔(biorad公司micropulser电穿孔系统)导入农杆菌细菌(根癌土壤杆菌(agrobacteriumtumefaciens)eha101株)。

首先,以下述的顺序进行了农杆菌细菌的感受态细胞的产生。

将农杆菌菌株涂布于yeb琼脂培养基(牛肉提取物5g/l、酵母提取物1g/l、bacto蛋白胨1g/l、蔗糖5g/l、mgso42mm、bacto琼脂12g(1.2%)),于28℃、暗处培养2天时间。将得到的单一菌落接菌至yeb液体培养基5ml后,于28℃、暗处振荡培养12小时,将悬浊液200μl加入200ml的yeb液体培养基,于28℃、暗处进行振荡培养,增殖至od600=0.2-0.4。然后将菌体进行离心(3000rpm,4℃、10分钟)收集细菌,悬浊于20ml的10mmhepes(ph8.0),重复离心2-3次。将通过离心回收的菌体悬浊于灭菌的10%丙三醇水溶液2ml,制成了感受态细胞。下面,以后述的顺序将各载体导入农杆菌。将各载体以1μg/μl的浓度溶解于灭菌水,与上述的农杆菌细菌悬浊液50μl混合,移至微脉冲比色皿(0.1cm间隙,biorad公司)进行了电穿孔(2.2kv,5.8ms)。然后,向该液体添加800μl的yeb液体培养基,于28℃、暗处2小时振荡培养,涂布于包含100mg/l大观霉素的yeb琼脂培养基,于28℃、暗处培养36~48小时。将得到的细菌菌落在包含100mg/l大观霉素的yeb液体培养基5ml中增殖,以丙三醇(最终浓度35%)储存液形式移液至微管,于-80℃保存。

3.将target-aid评价用载体导入水稻培养细胞

水稻的转化基本依照terada等的方法(terada,r.,urawa,h.,inagaki,y.,tsugane,k.,andiida,s.(2002)efficientgenetargetingbyhomologousrecombinationinrice.nat.biotechnol.20,1030-1034)进行。

3-1.准备转化用的水稻愈伤组织

摘除约100粒水稻(oryzasativa.ljaponica品种;日本晴)的种子的稻壳,在70%乙醇中振荡1分钟后,在2.5%次氯酸钠中浸渍20-30分钟进行灭菌。之后,用灭菌用水涮洗,接芽于2n6培养基(n6培养基用混合盐(sigma-aldrich公司)4.0g/l、酪蛋白氨基酸300mg/l、肌肉肌醇100mg/l、烟酸0.5mg/l、吡哆醇盐酸盐0.5mg/l、盐酸硫胺0.5mg/l、l-脯氨酸2878mg/l、蔗糖30.0g/l、2,4-d(2,4-二氯苯氧乙酸)2mg/l、gelrite4.0g/l、ph5.8)上,于暗处、31.5℃培养3周,诱导成源自胚盘细胞的去分化细胞团块(愈伤组织)。之后,每1个月选择细胞分裂活性高的愈伤组织进行传代培养,将从培养开始经历4个月的愈伤组织用于转化。

3-2.准备转化用的农杆菌细菌

在冰上溶解导入了target-aid评价用载体的各农杆菌菌液,将其中300μl涂布于添加了100mg/l大观霉素的ab培养基(nh4cl1g/l、mgso4·7h2o3g/l、kcl0.15g/l、cacl2·2h2o0.012g/l、feso4·7h2o0.0025g/l、k2hpo43g/l、nah2po4·h2o1.15g/l、蔗糖5.5g/l、琼脂糖6.0g/l、ph7.2),于28℃、暗处培养3天时间。之后,将增殖的农杆菌细菌悬浊于添加了40mg/l的乙酰丁香酮(3',5'-二甲氧基-4'-羟基-苯乙酮)的aai液体培养基(mgso4·7h2o5g/l、cacl2·2h2o1.5g/l、nah2po4·h2o1.5g/l、kcl29.5g/l、mnso4·4h2o10g/l、znso4·7h2o2g/l、h3bo33g/l、ki0.75g/l、na2moo4·2h2o0.25g/l、cocl2·6h2o25mg/l、cuso4·5h2o25mg/l、feso4·7h2o13.9g/l、na2edta18.7g/l、肌肉肌醇100mg/l、盐酸硫胺0.01g/l、烟酸1mg/l、吡哆醇盐酸盐1mg/l)于25℃振荡培养2小时。将该悬浊液用包含40mg/ml的乙酰丁香酮的aai液体培养基进行稀释,制备了为od600=0.008的悬浊液120ml。

3-3.prit3-egfp、prit3-megfp导入水稻愈伤组织(农杆菌细菌接种、共存培养、灭菌、水稻重组体愈伤组织选择)

将水稻愈伤组织约5g收集于灭菌的玻璃烧杯,加入导入了各载体的农杆菌细菌悬浊液(上述),振荡3-5分钟同时进行接种。将悬浊液用不锈钢网(接缝开口1.5mm)过滤,除去多余的农杆菌细菌。然后,在2n6共存培养基(n6培养基用混合盐(sigma公司制)4.0g/l、酪蛋白氨基酸300mg/l、肌肉肌醇100mg/l、烟酸0.5mg/l、吡哆醇盐酸盐0.5mg/l、盐酸硫胺0.5mg/l、蔗糖30.0g/l、葡萄糖10g/l、2,4-d2mg/l、gelrite4.0g/l、乙酰丁香酮40mg/l,ph5.2)上铺上灭菌滤纸,在其上用镊子以等间隔排列愈伤组织,于25℃、暗处共存培养3天时间。之后,为了将共存培养后的愈伤组织进行农杆菌细菌灭菌,将愈伤组织收集于500ml的烧杯,使用灭菌液1(包含万古霉素200mg/l、tween2020μl/l的灭菌水)300ml,在搅拌的同时洗涤30分钟。之后,将愈伤组织收集于不锈钢网,用纸巾除去愈伤组织周边的水分后,使用灭菌液2(包含万古霉素200mg/l、tween2020μl/l的灭菌水)300ml,重复四次同样的灭菌操作。然后,将灭菌后的愈伤组织用2n6nu培养基(n6培养基用混合盐[sigma公司制]4.0g/l、酪蛋白氨基酸300mg/l、肌肉肌醇100mg/l、烟酸0.5mg/l、吡哆醇盐酸盐0.5mg/l、盐酸硫胺0.5mg/l、l-脯氨酸2878mg/l、蔗糖30.0g/l、2,4-d2mg/l、gelrite4.0g/l、万古霉素100mg/l、美洛培南25mg/l,ph5.8)调养培养5天时间。之后,用包含巴龙霉素(paromomycin)50mg/l的选择培养基2n6sepa50(n6培养基用混合盐[sigma公司制]4.0g/l、酪蛋白氨基酸300mg/l、肌肉肌醇100mg/l、烟酸0.5mg/l、吡哆醇盐酸盐0.5mg/l、盐酸硫胺0.5mg/l、l-脯氨酸2878mg/l、蔗糖30.0g/l、2,4-d2mg/l、琼脂糖8.0g/l、万古霉素100mg/l、美洛培南25mg/l、ph5.8)上以等间隔排列,于31.5℃的暗处进行培养约6周。其结果选择出了多个谱系(lineages)的巴龙霉素抗性愈伤组织。

3-4.对导入了prit3-egfp、prit3-megfp的水稻愈伤组织的分析

从导入prit3-egfp并显示巴龙霉素抗性的愈伤组织中任意选择96个谱系,用于以后的分析。从各谱系的愈伤组织的一部分利用自动核酸提取装置(kurabo株式会社px-80)提取基因组dna,进行了使用引物组”sbfi-p35s-f”(seqidno:13)和“egfp-noti-r”(seqidno:14)(表1)的pcr分析,结果检测到源自prit3-egfp的1238bp的dna片段,确认了基因重组体。然后,对其进行使用实体荧光显微镜的观察,结果全部检测到egfp信号(图2)。对导入了prit3-megfp的愈伤组织也进行了同样的分析,通过pcr分析确认了基因重组体。对它们进行了实体荧光显微镜下的观察,结果完全未检测到egfp信号(图2)。

[表1]

3-5.将prit3-megfp和2408、或prit3-megfp和2409同时导入水稻愈伤组织(农杆菌细菌接种、共存培养、灭菌、水稻重组体愈伤组织选择)

基本操作根据3-3。将具有prit3-megfp的农杆菌的菌液和具有2408或2409的农杆菌的菌液等量混合,接种了水稻愈伤组织约30g。以后至调养培养为止的操作,参照上述。在选择培养中,使用了包含潮霉素(hygromycin)40mg/l、巴龙霉素(paromomycin)50mg/l的2n6seh40pa50培养基。在约6周的选择培养之后,可以确认对潮霉素和巴龙霉素显示抗性的愈伤组织有多个谱系,在导入prit3-megfp和2408的情况下得到了14个谱系,在导入prit3-megfp和2409的情况下得到了56个谱系。

3-6.对导入了prit3-megfp和2408、或prit3-megfp和2409的水稻愈伤组织的分析

从选择的各谱系的愈伤组织提取基因组dna,进行了使用引物组“sbfi-p35s-f”和“egfp-noti-r”、及”hmr-f”(seqidno:15)和“hmr2408r-1”(seqidno:16)(表1)的pcr分析,结果内置了prit3-megfp的双重转化体有269个谱系,内置了prit3-megfp和2409的双重转化体有264个谱系(表2、图3)。

[表2]

然后,对全部双重转化体愈伤组织使用实体荧光显微镜进行观察,结果通过内置了prit3-megfp和2409的2个谱系(no.6、3)确认了egfp的表达(图4、5)。为了确认这些愈伤组织中的基于target-aid的基因组序列修饰,在各谱系中从表达egfp的愈伤组织提取基因组dna,使用引物组“sbfi-p35s-f”和“egfp-noti-r”(表1)的pcr产物通过monofasdna纯化试剂盒i(glsciences公司)进行纯化,克隆至pcr4blunttopo载体(thermofisher公司)sbfi-noti位点之间。对总和111个克隆利用dna测序来解读碱基序列,结果在一部分中确认了基于target-aid的碱基序列修饰(表3、图6a、b)。在切口酶型的2409中,发生较短的缺失突变(1-20个核苷酸)的频率较高,但也发生了单纯的碱基取代(图7)。

[表3]

另一方面,在使用欠缺两条链的切割能力的cas9(2408)的情况下,作为导入突变方式以碱基取代为主(图8、9、10),对发生碱基取代的区域而言,比芽殖酵母的情况下更宽,确认到至靶核苷酸序列外(pam序列的上游21个核苷酸)为止(图10)。另外,在gfp信号阴性细胞中,未在靶核苷酸序列及其附近导入突变(图11)。

4.对水稻的内源性基因als(乙酰乳酸合成酶(acetolactatesynthase))的修饰

迄今为止,基于target-aid的外源性报告基因的修饰已经成功,因此下面实施了对水稻内源性基因的修饰。作为对象选择了als(乙酰乳酸合成酶)基因,尝试了通过基因序列内的靶向碱基取代,创建使第96位的氨基酸从丙氨酸(a)变化为缬氨酸(v)的突变型als基因(alsa96v)。根据其他种类植物的已有报告,预测表达alsa96v的水稻的植物体及愈伤组织将获得对除草剂(甲氧咪草烟(imazamox))的抗性,但没有先例。另外,也没有试验过甲氧咪草烟对在无菌培养条件下的水稻植物体及愈伤组织的的效果的例子。因此,本实施例中首先作为初步研究,在确认了甲氧咪草烟对无菌培养条件下的水稻的种子及愈伤组织的有效浓度检验(下述4-1、4-2)、基于alsa96v的对甲氧咪草烟的抗性获得(下述4-3)的基础上,实施了基于target-aid的alsa96v修饰(下述4-4)。

4-1.无细菌培养条件中的甲氧咪草烟对水稻植物体的有效浓度的验证

以1/2ms固态培养基(msmix(sigma)、蔗糖15.0g/l、gelrite(和光纯药)4.0g/l、ph5.8)为基础,产生了甲氧咪草烟浓度不同的9个梯度(0mg/l、0.5mg/l、1mg/l、2mg/l、4mg/l、5mg/l、10mg/l、20mg/l、30mg/l)的培养基。接下来,摘除水稻(oryzasativa.ljaponica品种;日本晴)的种子的稻壳,在70%乙醇中振荡1分钟后,在2.5%次氯酸钠中渗透同时浸渍20-30分钟进行灭菌。在每个处理区接芽24粒已灭菌的种子,于25℃、明11小时(8000lux)/暗13小时条件下培养7天时间,观察发芽情况。其结果,在不含有甲氧咪草烟的1/2ms培养基中,24粒种子中有23粒发芽,显示出顺利生长,与此相对,在添加了甲氧咪草烟0.5mg/l或其以上的浓度的培养基中,在全部种子中确认到胚基部变褐,子叶鞘变白,保持在伸长了5mm左右为止(表4)。

从以上判断,在水稻植物体的无菌培养条件下的甲氧咪草烟的有效浓度为0.5mg/l。

[表4]甲氧咪草烟对水稻植物体的有效浓度的评价

4-2.对无细菌培养条件下的甲氧咪草烟对水稻愈伤组织的有效浓度的验证

以2n6固态培养基(上述)为基础,产生了甲氧咪草烟浓度不同的4个梯度(0mg/l、30mg/l、50mg/l、70mg/l)的培养基。从水稻种子的胚盘部诱导愈伤组织(上述),接芽于添加了甲氧咪草烟的2n6固态培养基,于31.5℃、整日暗处培养28天时间,确认了愈伤组织的增殖情况。其结果,在添加了甲氧咪草烟70mg/l的培养基中,愈伤组织发生一定程度的肥大化,阻碍了分裂增殖,与此相对,在50mg/l以下的浓度下确认了愈伤组织的分裂增殖(图12)。

从以上判断,甲氧咪草烟对水稻愈伤组织的有效浓度为70mg/l。

4-3.由突变型als基因(alsa96v)对水稻愈伤组织赋予甲氧咪草烟抗性

为了评价由突变型alsa96v对水稻愈伤组织赋予的甲氧咪草烟抗性,构建了prit4-alswt及prit4-alsa96v的(图13)。prit4为水稻转化用双载体,作为植物用正标记基因具有潮霉素磷酸转移酶(hygromycinphosphotransferase)(hpt)。prit4-alswt为以从野生型水稻(oryzasativa.ljaponica品种;日本晴)提取的基因组dna为基础,通过pcr克隆分离了als基因和其启动子和转录终止区,并组装入prit4。prit4-alsa96v为通过利用pcr的位点特异性的导入突变法,产生人为地导入了a96v突变的als基因,并组装入prit4。将这2种载体导入(上述)农杆菌细菌eha101谱系,转化(上述)为源自水稻种子胚盘的愈伤组织。之后,将愈伤组织在添加了潮霉素(hygromycin)40mg/l的选择培养基(2n6seh50;n6培养基用混合盐[sigma公司制]4.0g/l、酪蛋白氨基酸1000mg/l、肌肉肌醇100mg/l、烟酸0.5mg/l、吡哆醇盐酸盐0.5mg/l、盐酸硫胺0.5mg/l、l-脯氨酸2878mg/l、蔗糖30.0g/l、2,4-d2mg/l、gelrite4.0g/l、万古霉素100mg/l、美洛培南(meropenem)25mg/l、ph5.8)上等间隔排列,于31.5℃、暗处培养约4周。结果得到了导入了prit4-alswt的愈伤组织169个谱系、导入了prit4-alsa96v的愈伤组织263个谱系(表5)。在以后的步骤中,这些愈伤组织每个谱系个别进行培养。将在2n6seh50培养基上增殖的各愈伤组织谱系传代于在2n6seh40中添加了甲氧咪草烟70mg/l的选择培养基(2n6seh40imz70),于31.5℃、暗处培养约6周。其结果,在导入了prit4-alswt的愈伤组织中,对甲氧咪草烟70mg/l显示抗性的愈伤组织仅有6个谱系(3.6%),与此相对,在导入了prit4-alsa96v的情况下,有261个谱系(99.2%)显示抗性(表5)。

根据以上确认了由突变型alsa96v赋予水稻愈伤组织的甲氧咪草烟抗性。

[表5]由突变型alsa96v对水稻愈伤组织赋予甲氧咪草烟抗性

4-4.基于target-aid的alsa96v修饰

target-aid载体1476(dcas-aid)及1477(ncas-aid)被设计为:经过对水稻基因组中的als基因的靶向碱基取代(c287t)而修饰为alsa96v(图14)。将1476、1477导入(上述)农杆菌细菌eha101谱系,用于源自水稻种子胚的愈伤组织约8g的转化(上述)。经过农杆菌细菌的接种、灭菌的愈伤组织,利用2n6nu培养基调养培养14天时间后,在添加了潮霉素(hygromycin)40mg/l的选择培养基(2n6seh40)上等间隔排列,于31.5℃、暗处培养约3周。然后以同样的培养基进行传代,在25℃的暗处培养约10周,得到了导入了1476的愈伤组织155个谱系、导入了1477的愈伤组织203个谱系。在以后的步骤中,每个谱系个别进行培养。将各谱系的愈伤组织分为二,传代于添加了潮霉素(hygromycin)50mg/l的培养基(2n6seh50)和添加了甲氧咪草烟70mg/l的培养基(2n6seh50imz70),与31.5℃的暗处选择培养约6周。在2n6seh50上培养的结果为,所有谱系的愈伤组织发生增殖,与此相对,在2n6seh50imz70上培养的情况下,在导入了1476的愈伤组织中有3个谱系、在导入了1477的愈伤组织中有6个谱系确认增殖。为了确认在这9个谱系的愈伤组织中的als基因序列,提取基因组dna,通过使用引物组“alscloning-f”(seqidno:17)和“alscloning-r”(seqidno:18)的pcr扩增dna片段,并加上了sbfi及noti识别位点。得到的pcr产物利用monofasdna纯化试剂盒i(glsciences公司)进行纯化,克隆至修饰pdonrzeo(thermofisherscientific公司)而成的克隆用载体的sbfi-noti位点之间。使用引物“alsf-1”(seqidno:19)利用dna测序(abi,3130xl)对得到的质粒克隆分析了碱基序列。使用了的引物序列示于表1。

其结果,在导入1477并显示甲氧咪草烟抗性的6个谱系中,在4个谱系中导入了als基因中的a96v突变。其中的3个谱系中,确认了发生a96v突变的靶向碱基的取代(c287t)(图15b)。其余1个谱系中,确认了c287t以及氨基酸序列不发生变化的c285t(图15c)。这些均为在载体1477的靶序列内的从c变为t的碱基取代。另外,对这些谱系确认了als基因及其启动子和转录终止区的基因组序列,但未确认到除了c285t及c287t以外的突变。因此,判断成功实现了基于target-aid的水稻内在性als伝子的修饰和基于其的除草剂抗性的赋予。需要说明的是,对于成功地导入对als基因的a96v突变的4个谱系中的3个谱系,t0植物体成功地进行了再分化(图16)。对得到的t0植物体,对通过使用了“alscloning-f”和“alscloning-r”的pcr所扩增的dna片段使用“alsf-1”进行直接测序,结果确认了在与全部源自t0植物体的愈伤组织中相同的突变(c287t或c285t/c287t)(图17)。

5.基于target-aid的多个基因的同时修饰

target-aid载体2455(dcas-aid)被产生用于同时修饰prit3-megfp上的megfp基因及水稻内源性的als基因,分别与2408/2409及1476/1477表达相同的grna。将导入了prit3-megfp的愈伤组织约17g通过上述的方法导入2455,得到了124个谱系的双重转化谱系(doubletransformantlineage)。对它们进行了利用实体荧光显微镜的观察,结果在3个谱系中确认了egfp的表达。进一步,将这3个谱系的愈伤组织传代至2n6seh40imz70培养基,于31.5℃的暗处中培养约6周,结果均显示了甲氧咪草烟的抗性,活跃地增殖。从3个谱系的愈伤组织提取基因组dna,通过使用引物组“sbfi-p35s-f”和“egfp-noti-r”,或“alscloning-f”和“alscloning-r”的pcr,扩增了megfp基因区域及als基因区域。得到的pcr产物利用monofasdna纯化试剂盒i(glsciences公司)纯化,供直接测序用。结果在1个谱系中确认了在megfp基因和als基因两者中的基于target-aid的靶向碱基取代(图18)。直接设定在megfp基因的开始密码子后的终止密码子(tag)被修饰为与酪氨酸相对应的tat,紧接其后的gtg被修饰为与甲硫氨酸相对应的atg(图18a)。在als基因中确认了c287t(图18b)。

根据以上,验证了可以利用target-aid同时修饰水稻基因组中的多个靶序列。

工业实用性

根据本发明,可以不伴随dna双链的切割,安全地向任意单子叶植物导入位点特异性的突变。如上得到的基因修饰单子叶植物,在以水稻等主要谷物为首的单子叶植物的分子育种中极其有用。

本申请以在日本申请的日本特愿2015-232379(申请日:2015年11月27日)及日本特愿2016-134613(申请日:2016年7月6日)为基础,并将其内容全部并入本说明书。

sequencelisting

<110>国立大学法人神户大学(nationaluniversitycorporationkobeuniversity)

<120>用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体

<130>092545

<150>jp2015-232379

<151>2015-11-27

<150>jp2016-134613

<151>2016-07-06

<160>19

<170>patentin3.5版

<210>1

<211>627

<212>dna

<213>人工序列

<220>

<223>针对拟南芥(arabidopsisthaliana)优化的pmcda密码子。

<220>

<221>cds

<222>(1)..(627)

<400>1

atgacagatgctgaatatgtcagaatccacgaaaagttggacatttac48

metthraspalaglutyrvalargilehisglulysleuaspiletyr

151015

acgtttaagaagcagttcttcaacaacaagaaatctgtttcgcatagg96

thrphelyslysglnphepheasnasnlyslysservalserhisarg

202530

tgctatgtgcttttcgaactaaaacgtcgtggagaaagacgggcttgc144

cystyrvalleuphegluleulysargargglygluargargalacys

354045

ttttggggttacgcggttaacaaaccacaatcaggtactgaacgagga192

phetrpglytyralavalasnlysproglnserglythrgluarggly

505560

atacacgctgaaatcttttctatccgaaaggttgaggaatatctacgt240

ilehisalagluilepheserilearglysvalgluglutyrleuarg

65707580

gacaatcctggacagttcactatcaattggtattctagctggtcacca288

aspasnproglyglnphethrileasntrptyrsersertrpserpro

859095

tgtgcagattgtgctgagaagattctcgaatggtacaatcaagagctt336

cysalaaspcysalaglulysileleuglutrptyrasnglngluleu

100105110

agaggcaatggacatacattgaaaatatgggcatgcaagctctactac384

argglyasnglyhisthrleulysiletrpalacyslysleutyrtyr

115120125

gaaaagaatgccagaaaccaaattgggctttggaacttgagggataat432

glulysasnalaargasnglnileglyleutrpasnleuargaspasn

130135140

ggagttgggcttaatgtcatggtttctgagcactatcaatgttgtcgg480

glyvalglyleuasnvalmetvalsergluhistyrglncyscysarg

145150155160

aagatcttcatacaaagttcccataaccagttgaatgagaacagatgg528

lysilepheileglnserserhisasnglnleuasngluasnargtrp

165170175

ttagagaaaacccttaaaagagccgagaagagaagatccgaactgagc576

leuglulysthrleulysargalaglulysargargsergluleuser

180185190

attatgatacaggtcaaaattctgcataccactaagagtccagctgta624

ilemetileglnvallysileleuhisthrthrlysserproalaval

195200205

ggt627

gly

<210>2

<211>209

<212>prt

<213>人工序列

<220>

<223>合成结构

<400>2

metthraspalaglutyrvalargilehisglulysleuaspiletyr

151015

thrphelyslysglnphepheasnasnlyslysservalserhisarg

202530

cystyrvalleuphegluleulysargargglygluargargalacys

354045

phetrpglytyralavalasnlysproglnserglythrgluarggly

505560

ilehisalagluilepheserilearglysvalgluglutyrleuarg

65707580

aspasnproglyglnphethrileasntrptyrsersertrpserpro

859095

cysalaaspcysalaglulysileleuglutrptyrasnglngluleu

100105110

argglyasnglyhisthrleulysiletrpalacyslysleutyrtyr

115120125

glulysasnalaargasnglnileglyleutrpasnleuargaspasn

130135140

glyvalglyleuasnvalmetvalsergluhistyrglncyscysarg

145150155160

lysilepheileglnserserhisasnglnleuasngluasnargtrp

165170175

leuglulysthrleulysargalaglulysargargsergluleuser

180185190

ilemetileglnvallysileleuhisthrthrlysserproalaval

195200205

gly

<210>3

<211>4104

<212>dna

<213>人工序列

<220>

<223>针对小鼠优化的cas9密码子。

<220>

<221>cds

<222>(1)..(4101)

<400>3

atggacaagaagtactcgatcgggctggmcatcggaacaaattctgta48

metasplyslystyrserileglyleuxaaileglythrasnserval

151015

ggctgggctgtaataaccgatgagtacaaggtgccctctaaaaaattt96

glytrpalavalilethraspglutyrlysvalproserlyslysphe

202530

aaggtccttggcaatacggatagacattccataaagaagaatcttatc144

lysvalleuglyasnthrasparghisserilelyslysasnleuile

354045

ggtgcgctgctctttgacagcggcgagaccgcggaggcgacccggttg192

glyalaleuleupheaspserglygluthralaglualathrargleu

505560

aaacgcaccgcgagacgccgttacacaaggcgtaagaatagaatctgt240

lysargthralaargargargtyrthrargarglysasnargilecys

65707580

tatctccaggagatattctctaatgaaatggcgaaggtagacgattcc288

tyrleuglngluilepheserasnglumetalalysvalaspaspser

859095

ttctttcaccgtctggaggaaagttttctcgttgaggaagataagaaa336

phephehisargleuglugluserpheleuvalglugluasplyslys

100105110

catgaaagacacccgatcttcggaaacattgtcgacgaggtcgcttat384

hisgluarghisproilepheglyasnilevalaspgluvalalatyr

115120125

catgaaaagtaccctaccatctaccatcttagaaagaaacttgttgac432

hisglulystyrprothriletyrhisleuarglyslysleuvalasp

130135140

agcacggataaggctgatctcaggctgatatacctggctctggcacat480

serthrasplysalaaspleuargleuiletyrleualaleualahis

145150155160

atgattaagttcagagggcatttccttatcgaaggcgacctgaatcca528

metilelyspheargglyhispheleuilegluglyaspleuasnpro

165170175

gataattcagatgtagacaagctcttcattcaacttgtgcagacttat576

aspasnseraspvalasplysleupheileglnleuvalglnthrtyr

180185190

aatcagctcttcgaagaaaatccaataaacgcgtcgggtgtagacgca624

asnglnleupheglugluasnproileasnalaserglyvalaspala

195200205

aaggccatactgtccgctaggctttctaagtcacgtagacttgagaat672

lysalaileleuseralaargleuserlysserargargleugluasn

210215220

ctcattgcccaactccccggcgagaagaagaacggcttgtttggaaat720

leuilealaglnleuproglyglulyslysasnglyleupheglyasn

225230235240

ctgatagcgctgtccctgggtcttacaccaaatttcaagagtaatttc768

leuilealaleuserleuglyleuthrproasnphelysserasnphe

245250255

gatttggcagaagatgctaagttgcagctcagtaaagacacctacgat816

aspleualagluaspalalysleuglnleuserlysaspthrtyrasp

260265270

gacgatcttgataatttgttggctcagattggcgatcagtatgcagat864

aspaspleuaspasnleuleualaglnileglyaspglntyralaasp

275280285

cttttcttggccgctaagaatttgtctgatgcaattctgcttagcgac912

leupheleualaalalysasnleuseraspalaileleuleuserasp

290295300

attttgagggttaatacagaaatcaccaaggcacccttgtcggcgtca960

ileleuargvalasnthrgluilethrlysalaproleuseralaser

305310315320

atgataaagaggtatgatgagcaccaccaagacctgacgctcctcaag1008

metilelysargtyraspgluhishisglnaspleuthrleuleulys

325330335

gctcttgttcggcagcaattgccggagaagtacaaagagatcttcttc1056

alaleuvalargglnglnleuproglulystyrlysgluilephephe

340345350

gaccagtctaagaacggatatgcgggctacatagacggtggagcgagt1104

aspglnserlysasnglytyralaglytyrileaspglyglyalaser

355360365

caggaggaattctacaagttcataaagcccattctcgagaagatggat1152

glnglugluphetyrlyspheilelysproileleuglulysmetasp

370375380

ggtacggaagaactgcttgtgaaacttaacagagaagatcttttgcgg1200

glythrglugluleuleuvallysleuasnarggluaspleuleuarg

385390395400

aagcagagaactttcgacaacggaagtataccacaccagatacatctc1248

lysglnargthrpheaspasnglyserileprohisglnilehisleu

405410415

ggagagcttcatgctattctcagaagacaagaggatttctaccctttc1296

glygluleuhisalaileleuargargglngluaspphetyrprophe

420425430

ttgaaggataacagagaaaagatagagaagatcctcacgtttaggatc1344

leulysaspasnargglulysileglulysileleuthrpheargile

435440445

ccttactacgtaggtcctcttgctcgcggcaatagtaggttcgcctgg1392

protyrtyrvalglyproleualaargglyasnserargphealatrp

450455460

atgacccgcaagtctgaagaaactatcaccccttggaatttcgaagag1440

metthrarglysserglugluthrilethrprotrpasnphegluglu

465470475480

gttgtagacaaaggtgcttcagcacagagtttcattgagaggatgacc1488

valvalasplysglyalaseralaglnserpheilegluargmetthr

485490495

aacttcgacaagaacctccccaacgaaaaggtcctgcctaagcacagc1536

asnpheasplysasnleuproasnglulysvalleuprolyshisser

500505510

ctcctctacgaatactttactgtctataatgagcttacaaaagttaag1584

leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys

515520525

tacgtgacagagggaatgcggaagcccgcattcctttccggagaacaa1632

tyrvalthrgluglymetarglysproalapheleuserglyglugln

530535540

aagaaggcgatcgtggatcttctcttcaagacgaaccgcaaggtgacg1680

lyslysalailevalaspleuleuphelysthrasnarglysvalthr

545550555560

gttaaacagttgaaggaagattacttcaagaagatagaatgttttgat1728

vallysglnleulysgluasptyrphelyslysileglucyspheasp

565570575

agcgtggaaatcagcggcgtcgaagataggttcaacgcttccctggga1776

servalgluileserglyvalgluaspargpheasnalaserleugly

580585590

acgtaccacgatctcctcaagattatcaaagataaggactttcttgat1824

thrtyrhisaspleuleulysileilelysasplysasppheleuasp

595600605

aacgaagagaatgaggacatcttggaagacattgttctgacgctcacc1872

asnglugluasngluaspileleugluaspilevalleuthrleuthr

610615620

ctgttcgaagatcgcgagatgattgaggaacgcttgaagacctacgca1920

leuphegluaspargglumetileglugluargleulysthrtyrala

625630635640

cacctgttcgatgacaaggttatgaagcaacttaaacggcgccggtat1968

hisleupheaspasplysvalmetlysglnleulysargargargtyr

645650655

acgggctggggacggctttcgcggaagctgataaatggaatccgtgac2016

thrglytrpglyargleuserarglysleuileasnglyileargasp

660665670

aagcagtctggcaagacaatactcgacttcttgaagtcggatggtttt2064

lysglnserglylysthrileleuasppheleulysseraspglyphe

675680685

gccaatagaaattttatgcaactcattcatgatgactcgcttactttt2112

alaasnargasnphemetglnleuilehisaspaspserleuthrphe

690695700

aaggaggacatccagaaggcccaggtatcaggacagggtgactctttg2160

lysgluaspileglnlysalaglnvalserglyglnglyaspserleu

705710715720

cacgaacacatcgcgaacctggcgggctcccccgcgattaagaaggga2208

hisgluhisilealaasnleualaglyserproalailelyslysgly

725730735

attttgcagactgtcaaggtggtcgatgaactcgtgaaggttatggga2256

ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly

740745750

cgtcataagccggaaaatattgtgattgagatggctcgcgagaatcaa2304

arghislysprogluasnilevalileglumetalaarggluasngln

755760765

acaacacagaagggccaaaagaacagtagagaacgcatgaagcgcatc2352

thrthrglnlysglyglnlysasnserarggluargmetlysargile

770775780

gaagagggcatcaaagagctgggcagtcagatccttaaagaacatcca2400

glugluglyilelysgluleuglyserglnileleulysgluhispro

785790795800

gtcgagaatacacagcttcagaacgaaaagctgtacctttattacctt2448

valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu

805810815

caaaatgggcgtgatatgtatgtggatcaggaactcgatatcaatagg2496

glnasnglyargaspmettyrvalaspglngluleuaspileasnarg

820825830

ctgagtgactatgatgtcgacsmtatcgtcccgcaaagtttcctcaag2544

leuserasptyraspvalaspxaailevalproglnserpheleulys

835840845

gacgacagtatagacaacaaagttctcacacggtcagataagaatcgc2592

aspaspserileaspasnlysvalleuthrargserasplysasnarg

850855860

ggcaagagcgataatgtaccgtcggaggaggtagtcaagaagatgaag2640

glylysseraspasnvalproserglugluvalvallyslysmetlys

865870875880

aattactggcgccagttgctcaacgccaagctcatcactcagaggaaa2688

asntyrtrpargglnleuleuasnalalysleuilethrglnarglys

885890895

tttgacaaccttacgaaagccgagcggggcggactctctgaactggac2736

pheaspasnleuthrlysalagluargglyglyleusergluleuasp

900905910

aaggccggtttcataaagcgccagctcgttgagacacgtcaaattact2784

lysalaglypheilelysargglnleuvalgluthrargglnilethr

915920925

aagcacgtcgctcaaatattggattcccgcatgaatactaagtacgat2832

lyshisvalalaglnileleuaspserargmetasnthrlystyrasp

930935940

gagaatgataagctcatacgtgaagttaaggtcattactctcaagtcc2880

gluasnasplysleuilearggluvallysvalilethrleulysser

945950955960

aagcttgtatcggacttccgtaaggacttccaattctacaaggtccgg2928

lysleuvalseraspphearglysasppheglnphetyrlysvalarg

965970975

gaaatcaataattatcaccatgcccatgacgcttatctgaacgcggtc2976

gluileasnasntyrhishisalahisaspalatyrleuasnalaval

980985990

gtgggcacggcactcattaagaaatacccaaaacttgagtcagaattt3024

valglythralaleuilelyslystyrprolysleuglusergluphe

99510001005

gtttacggggactataaagtttatgacgtgcggaagatgatagcg3069

valtyrglyasptyrlysvaltyraspvalarglysmetileala

101010151020

aagtcggaacaagagataggaaaggcgactgcaaagtactttttt3114

lyssergluglngluileglylysalathralalystyrphephe

102510301035

tactccaacataatgaatttctttaagaccgaaataacccttgca3159

tyrserasnilemetasnphephelysthrgluilethrleuala

104010451050

aacggtgaaatcagaaagcggcctctgattgaaacaaatggcgag3204

asnglygluilearglysargproleuilegluthrasnglyglu

105510601065

acgggcgagatcgtctgggacaaggggagggacttcgcaacggtt3249

thrglygluilevaltrpasplysglyargaspphealathrval

107010751080

cgcaaggtccttagcatgccgcaagtaaatatagttaagaagacg3294

arglysvalleusermetproglnvalasnilevallyslysthr

108510901095

gaagttcagaccggcggctttagtaaagaaagcatacttcctaaa3339

gluvalglnthrglyglypheserlysgluserileleuprolys

110011051110

aggaattccgacaaactgatagcgcgcaagaaggactgggatcca3384

argasnserasplysleuilealaarglyslysasptrpasppro

111511201125

aagaagtatggaggatttgactccccaaccgttgcttatagcgtg3429

lyslystyrglyglypheaspserprothrvalalatyrserval

113011351140

ttggtagtagccaaggtggaaaagggtaagtctaagaaattgaag3474

leuvalvalalalysvalglulysglylysserlyslysleulys

114511501155

tcggtgaaggagttgttggggataactataatggagcggagttcg3519

servallysgluleuleuglyilethrilemetgluargserser

116011651170

ttcgagaagaacccaattgactttctcgaagccaaaggctacaag3564

pheglulysasnproileasppheleuglualalysglytyrlys

117511801185

gaggtcaagaaggacctgattattaagttgccaaagtactcgctc3609

gluvallyslysaspleuileilelysleuprolystyrserleu

119011951200

ttcgaactcgagaacgggagaaagcgtatgctggcgtcggcgggc3654

phegluleugluasnglyarglysargmetleualaseralagly

120512101215

gagctgcagaaaggaaacgagctggctttgccatcgaaatacgta3699

gluleuglnlysglyasngluleualaleuproserlystyrval

122012251230

aatttcctgtacctcgcctcacattatgagaagcttaaagggtct3744

asnpheleutyrleualaserhistyrglulysleulysglyser

123512401245

ccagaagacaatgaacagaagcagctgtttgttgaacagcacaag3789

progluaspasngluglnlysglnleuphevalgluglnhislys

125012551260

cactacttggacgagattatagaacaaatctccgagttctctaaa3834

histyrleuaspgluileilegluglnileserglupheserlys

126512701275

cgggttatccttgcagacgccaatttggataaggtcctctcggct3879

argvalileleualaaspalaasnleuasplysvalleuserala

128012851290

tataataagcatagagataagccaatccgggagcaggctgaaaat3924

tyrasnlyshisargasplysproilearggluglnalagluasn

129513001305

atcatacacctctttacgttgactaatttgggtgcgccagcggca3969

ileilehisleuphethrleuthrasnleuglyalaproalaala

131013151320

ttcaagtacttcgatacaacaatcgatcgtaagcgctacacaagc4014

phelystyrpheaspthrthrileasparglysargtyrthrser

132513301335

actaaggaagtcctggacgcgacgctgatacaccagtccattact4059

thrlysgluvalleuaspalathrleuilehisglnserilethr

134013451350

ggactgtatgaaaccagaatagatcttagccagctcggcggtgat4104

glyleutyrgluthrargileaspleuserglnleuglygly

135513601365

<210>4

<211>1367

<212>prt

<213>人工序列

<220>

<221>misc_feature

<222>(10)..(10)

<223>位于定位10的'xaa'代表asp或ala。

<220>

<221>misc_feature

<222>(840)..(840)

<223>位于定位840的'xaa'代表asp、ala、his或pro。

<220>

<223>合成结构

<400>4

metasplyslystyrserileglyleuxaaileglythrasnserval

151015

glytrpalavalilethraspglutyrlysvalproserlyslysphe

202530

lysvalleuglyasnthrasparghisserilelyslysasnleuile

354045

glyalaleuleupheaspserglygluthralaglualathrargleu

505560

lysargthralaargargargtyrthrargarglysasnargilecys

65707580

tyrleuglngluilepheserasnglumetalalysvalaspaspser

859095

phephehisargleuglugluserpheleuvalglugluasplyslys

100105110

hisgluarghisproilepheglyasnilevalaspgluvalalatyr

115120125

hisglulystyrprothriletyrhisleuarglyslysleuvalasp

130135140

serthrasplysalaaspleuargleuiletyrleualaleualahis

145150155160

metilelyspheargglyhispheleuilegluglyaspleuasnpro

165170175

aspasnseraspvalasplysleupheileglnleuvalglnthrtyr

180185190

asnglnleupheglugluasnproileasnalaserglyvalaspala

195200205

lysalaileleuseralaargleuserlysserargargleugluasn

210215220

leuilealaglnleuproglyglulyslysasnglyleupheglyasn

225230235240

leuilealaleuserleuglyleuthrproasnphelysserasnphe

245250255

aspleualagluaspalalysleuglnleuserlysaspthrtyrasp

260265270

aspaspleuaspasnleuleualaglnileglyaspglntyralaasp

275280285

leupheleualaalalysasnleuseraspalaileleuleuserasp

290295300

ileleuargvalasnthrgluilethrlysalaproleuseralaser

305310315320

metilelysargtyraspgluhishisglnaspleuthrleuleulys

325330335

alaleuvalargglnglnleuproglulystyrlysgluilephephe

340345350

aspglnserlysasnglytyralaglytyrileaspglyglyalaser

355360365

glnglugluphetyrlyspheilelysproileleuglulysmetasp

370375380

glythrglugluleuleuvallysleuasnarggluaspleuleuarg

385390395400

lysglnargthrpheaspasnglyserileprohisglnilehisleu

405410415

glygluleuhisalaileleuargargglngluaspphetyrprophe

420425430

leulysaspasnargglulysileglulysileleuthrpheargile

435440445

protyrtyrvalglyproleualaargglyasnserargphealatrp

450455460

metthrarglysserglugluthrilethrprotrpasnphegluglu

465470475480

valvalasplysglyalaseralaglnserpheilegluargmetthr

485490495

asnpheasplysasnleuproasnglulysvalleuprolyshisser

500505510

leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys

515520525

tyrvalthrgluglymetarglysproalapheleuserglyglugln

530535540

lyslysalailevalaspleuleuphelysthrasnarglysvalthr

545550555560

vallysglnleulysgluasptyrphelyslysileglucyspheasp

565570575

servalgluileserglyvalgluaspargpheasnalaserleugly

580585590

thrtyrhisaspleuleulysileilelysasplysasppheleuasp

595600605

asnglugluasngluaspileleugluaspilevalleuthrleuthr

610615620

leuphegluaspargglumetileglugluargleulysthrtyrala

625630635640

hisleupheaspasplysvalmetlysglnleulysargargargtyr

645650655

thrglytrpglyargleuserarglysleuileasnglyileargasp

660665670

lysglnserglylysthrileleuasppheleulysseraspglyphe

675680685

alaasnargasnphemetglnleuilehisaspaspserleuthrphe

690695700

lysgluaspileglnlysalaglnvalserglyglnglyaspserleu

705710715720

hisgluhisilealaasnleualaglyserproalailelyslysgly

725730735

ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly

740745750

arghislysprogluasnilevalileglumetalaarggluasngln

755760765

thrthrglnlysglyglnlysasnserarggluargmetlysargile

770775780

glugluglyilelysgluleuglyserglnileleulysgluhispro

785790795800

valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu

805810815

glnasnglyargaspmettyrvalaspglngluleuaspileasnarg

820825830

leuserasptyraspvalaspxaailevalproglnserpheleulys

835840845

aspaspserileaspasnlysvalleuthrargserasplysasnarg

850855860

glylysseraspasnvalproserglugluvalvallyslysmetlys

865870875880

asntyrtrpargglnleuleuasnalalysleuilethrglnarglys

885890895

pheaspasnleuthrlysalagluargglyglyleusergluleuasp

900905910

lysalaglypheilelysargglnleuvalgluthrargglnilethr

915920925

lyshisvalalaglnileleuaspserargmetasnthrlystyrasp

930935940

gluasnasplysleuilearggluvallysvalilethrleulysser

945950955960

lysleuvalseraspphearglysasppheglnphetyrlysvalarg

965970975

gluileasnasntyrhishisalahisaspalatyrleuasnalaval

980985990

valglythralaleuilelyslystyrprolysleuglusergluphe

99510001005

valtyrglyasptyrlysvaltyraspvalarglysmetileala

101010151020

lyssergluglngluileglylysalathralalystyrphephe

102510301035

tyrserasnilemetasnphephelysthrgluilethrleuala

104010451050

asnglygluilearglysargproleuilegluthrasnglyglu

105510601065

thrglygluilevaltrpasplysglyargaspphealathrval

107010751080

arglysvalleusermetproglnvalasnilevallyslysthr

108510901095

gluvalglnthrglyglypheserlysgluserileleuprolys

110011051110

argasnserasplysleuilealaarglyslysasptrpasppro

111511201125

lyslystyrglyglypheaspserprothrvalalatyrserval

113011351140

leuvalvalalalysvalglulysglylysserlyslysleulys

114511501155

servallysgluleuleuglyilethrilemetgluargserser

116011651170

pheglulysasnproileasppheleuglualalysglytyrlys

117511801185

gluvallyslysaspleuileilelysleuprolystyrserleu

119011951200

phegluleugluasnglyarglysargmetleualaseralagly

120512101215

gluleuglnlysglyasngluleualaleuproserlystyrval

122012251230

asnpheleutyrleualaserhistyrglulysleulysglyser

123512401245

progluaspasngluglnlysglnleuphevalgluglnhislys

125012551260

histyrleuaspgluileilegluglnileserglupheserlys

126512701275

argvalileleualaaspalaasnleuasplysvalleuserala

128012851290

tyrasnlyshisargasplysproilearggluglnalagluasn

129513001305

ileilehisleuphethrleuthrasnleuglyalaproalaala

131013151320

phelystyrpheaspthrthrileasparglysargtyrthrser

132513301335

thrlysgluvalleuaspalathrleuilehisglnserilethr

134013451350

glyleutyrgluthrargileaspleuserglnleuglygly

135513601365

<210>5

<211>21

<212>dna

<213>人工序列

<220>

<223>sv40衍生的核定位信号。

<220>

<221>cds

<222>(1)..(21)

<400>5

cctaagaagaarmgkaargtw21

prolyslyslysxaalysxaa

15

<210>6

<211>7

<212>prt

<213>人工序列

<220>

<221>misc_feature

<222>(5)..(5)

<223>位于定位5的'xaa'代表arg或ser。

<220>

<221>misc_feature

<222>(7)..(7)

<223>位于定位7的'xaa'代表val。

<220>

<223>合成结构

<400>6

prolyslyslysxaalysxaa

15

<210>7

<211>19

<212>rna

<213>francisellanovicida

<220>

<221>misc_structure

<222>(1)..(19)

<223>crrna直接重复序列。

<400>7

aauuucuacuguuguagau19

<210>8

<211>83

<212>dna

<213>化脓性链球菌(streptococcuspyogenes)

<220>

<221>misc_structure

<222>(1)..(83)

<223>tracrrna

<400>8

gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagt60

ggcaccgagtcggtggtgctttt83

<210>9

<211>14551

<212>dna

<213>人工序列

<220>

<223>prit3-egfp的完整核苷酸序列。

<400>9

agatggttgttcaagacgatctacgaacgcagtggcagcgccggagagttcaagaagttc60

tgtttcaccgtgcgcaagctgatcgggtcaaatgacctgccggagtacgatttgaaggag120

gaggcggggcaggctggcccgatcctagtcatgcgctaccgcaacctgatcgagggcgaa180

gcatccgccggttcctaatgtacggagcagatgctagggcaaattgccctagcaggggaa240

aaaggtcgaaaaggtctctttcctgtggatagcacgtacattgggaacccaaagccgtac300

attgggaaccggaacccgtacattgggaacccaaagccgtacattgggaaccggtcacac360

atgtaagtgactgatataaaagagaaaaaaggcgatttttccgcctaaaactctttaaaa420

cttattaaaactcttaaaacccgcctggcctgtgcataactgtctggccagcgcacagcc480

gaagagctgcaaaaagcgcctacccttcggtcgctgcgctccctacgccccgccgcttcg540

cgtcggcctatcgcggccgctggccgctcaaaaatggctggcctacggccaggcaatcta600

ccagggcgcggacaagccgcgccgtcgccactcgaccgccggcgcccacatcaaggcacc660

ctgcctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagac720

ggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagc780

gggtgttggcgggtgtcggggcgcagccatgacccagtcacgtagcgatagcggagtgta840

tactggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgt900

gaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgctcttccgcttcctcg960

ctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaag1020

gcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaa1080

ggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctc1140

cgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgaca1200

ggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccg1260

accctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttct1320

catagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgt1380

gtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgag1440

tccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagc1500

agagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctac1560

actagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaaga1620

gttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgc1680

aagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacg1740

gggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatca1800

aaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagt1860

atatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctca1920

gcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacg1980

atacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctca2040

ccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggt2100

cctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagt2160

agttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtca2220

cgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttaca2280

tgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcaga2340

agtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttact2400

gtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctga2460

gaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaacacgggataataccgcg2520

ccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactc2580

tcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactga2640

tcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaat2700

gccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttccttttt2760

caatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgt2820

atttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgac2880

gtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccc2940

tttcgtcttcgaataaatacctgtgacggaagatcacttcgcagaataaataaatcctgg3000

tgtccctgttgataccgggaagccctgggccaacttttggcgaaaatgagacgttgatcg3060

gcacgtaagaggttccaactttcaccataatgaaataagatcactaccgggcgtattttt3120

tgagttatcgagattttcaggagctaaggaagctaaaatggagaaaaaaatcactggata3180

taccaccgttgatatatcccaatggcatcgtaaagaacattttgaggcatttcagtcagt3240

tgctcaatgtacctataaccagaccgttcctggatattacggcctttttaaagaccgtaa3300

agaaaaataagcacaagttttatccggcctttattcacattcttgcccgcctgatgaatg3360

ctcatccggaataattcgaagctcggtcccgtgggtgttctgtcgtctcgttgtacaacg3420

aaatccattcccattccgcgctcaagatggcttcccctcggcagttcatcagggctaaat3480

caatctagccgacttgtccggtgaaatgggctgcactccaacagaaacaatcaaacaaac3540

atacacagcgacttattcacacgagctcaaattacaacggtatatatcctgccagtcagc3600

atcatcacaccaaaagttaggcccgaatagtttgaaattagaaagctcgcaattgaggtc3660

tacaggccaaattcgctcttagccgtacaatattactcaccggtgcgatgccccccatcg3720

taggtgaaggtggaaattaatgatccatcttgagaccacaggcccacaacagctaccagt3780

ttcctcaagggtccaccaaaaacgtaagcgcttacgtacatggtcgataagaaaaggcaa3840

tttgtagatgttaattcccatcttgaaagaaatatagtttaaatatttattgataaaata3900

acaagtcaggtattatagtccaagcaaaaacataaatttattgatgcaagtttaaattca3960

gaaatatttcaataactgattatatcagctggtacattgccgtagatgaaagactgagtg4020

cgatattatgtgtaatacataaattgatgatatagctagcttagctcatcgggggatccg4080

tcgacctgcagccaagctgggatcccagctgggatcccagcttgtcgacggtaccccctc4140

tagagttccttctagacccgatctagtaacatagatgacaccgcgcgcgataatttatcc4200

tagtttgcgcgctatattttgttttctatcgcgtattaaatgtataattgcgggactcta4260

atcataaaaacccatctcataaataacgtcatgcattacatgttaattattacatgctta4320

acgtaattcaacagaaattatatgataatcatcgcaagaccggcaacaggattcaatctt4380

aagaaactttattgccaaatgtttgaacgatcggggatcatccgggtctgtggcgggaac4440

tccacgaaaatatccgaacgcagcaagatatcgcggtgcatctcggtcttgcctgggcag4500

tcgccgccgacgccgttgatgtggacgccgggcccgatcatattgtcgctcaggatcgtg4560

gcgttgtgcttgtcggccgttgctgtcgtaatgatatcggcaccttcgaccgcctgttcc4620

gcagagatcccgtgggcgaagaactccagcatgagatccccgcgctggaggatcatccag4680

ccggcgtcccggaaaacgattccgaagcccaacctttcatagaaggcggcggtggaatcg4740

aaatctcgtgatggcaggttgggcgtcgcttggtcggtcatttcgaaccccagagtcccg4800

ctcagaagaactcgtcaagaaggcgatagaaggcgatgcgctgcgaatcgggagcggcga4860

taccgtaaagcacgaggaagcggtcagcccattcgccgccaagctcttcagcaatatcac4920

gggtagccaacgctatgtcctgatagcggtccgccacacccagccggccacagtcgatga4980

atccagaaaagcggccattttccaccatgatattcggcaagcaggcatcgccatgggtca5040

cgacgagatcatcgccgtcgggcatgcgcgccttgagcctggcgaacagttcggctggcg5100

cgagcccctgatgctcttcgtccagatcatcctgatcgacaagaccggcttccatccgag5160

tacgtgctcgctcgatgcgatgtttcgcttggtggtcgaatgggcaggtagccggatcaa5220

gcgtatgcagccgccgcattgcatcagccatgatggatactttctcggcaggagcaaggt5280

gagatgacaggagatcctgccccggcacttcgcccaatagcagccagtcccttcccgctt5340

cagtgacaacgtcgagcacagctgcgcaaggaacgcccgtcgtggccagccacgatagcc5400

gcgctgcctcgtcctgcagttcattcagggcaccggacaggtcggtcttgacaaaaagaa5460

ccgggcgcccctgcgctgacagccggaacacggcggcatcagagcagccgattgtctgtt5520

gtgcccagtcatagccgaatagcctctccacccaagcggccggagaacctgcgtgcaatc5580

catcttgttcaatcatatctcattgccccccggtctacctacaaaaaagctccgcacgag5640

gctgcatttgtcacaaatcatgaaaagaaaaactaccgatgaacaatgctgagggattca5700

aattctacccacaaaaagaagaaagaaagatctagcacatctaagcctgacgaagcagca5760

gaaatatataaaaatataaaccatagtgcccttttcccctcttcctgatcttgtttagca5820

tggcggaaattttaaaccccccatcatctcccccaacaacggcggatcgcagatctacat5880

ccgagagccccattccccgcgagatccgggccggatccacgccggcgagagccccagccg5940

cgagatcccgcccctcccgcgcaccgatctgggcgcgcacgaagccgcctctcgcccacc6000

caaactaccaaggccaaagatcgagaccgagacggaaaaaaaaaacggagaaagaaagag6060

gagaggggcggggtggttaccggcgcggcggcggcggagggggaggggggaggagctcgt6120

cgtccggcagcgaggggggaggaggtggaggtggtggtggtggtggtggtagggttgggg6180

ggatgggaggagaggggggggtatgtatatagtggcgatggggggcgtttctttggaagc6240

ggagggagggccggcctcgtcgctggctcgcgatcctcctcgcgtttccggcccccacga6300

cccggacccacctgctgttttttctttttcttttttttctttctttttttttttttggct6360

gcgagacgtgcggtgcgtgcggacaactcacggtgatagtgggggggtgtggagactatt6420

gtccagttggctggactggggtgggttgggttgggttgggttgggctgggcttgctatgg6480

atcgtggatagcactttgggctttaggaactttaggggttgtttttgtaaatgttttgag6540

tctaagtttatcttttatttttactagaaaaaatacccatgcgctgcaacgggggaaagc6600

tattttaatcttattattgttcattgtgagaattcgcctgaatatatatttttctcaaaa6660

attatgtcaaattagcatatgggtttttttaaagatatttcttatacaaatccctctgta6720

tttacaaaagcaaacgaacttaaaacccgactcaaatacagatatgcatttccaaaagcg6780

aataaacttaaaaaccaattcatacaaaaatgacgtatcaaagtaccgacaaaaacatcc6840

tcaatttttataatagtagaaaagagtaaatttcactttgggccaccttttattaccgat6900

attttactttataccaccttttaactgatgttttcacttttgaccaggtaatcttacctt6960

tgttttattttggactatcccgactctcttctcaagcatatgaatgaccgtatgctagtg7020

cggccgcaagcttgactactagtctctcttaaggtagcatcacaagtttgtacaaaaaag7080

caggctcctgcaggtgagacttttcaacaaagggtaatatcgggaaacctcctcggattc7140

cattgcccagctatctgtcacttcatcgaaaggacagtagaaaaggaaggtggctcctac7200

aaatgccatcattgcgataaaggaaaggctatcgttcaagatgcctctaccgacagtggt7260

cccaaagatggacccccacccacgaggaacatcgtggaaaaagaagacgttccaaccacg7320

tcttcaaagcaagtggattgatgtgatatctccactgacgtaagggatgacgcacaatcc7380

cactatccttcgcaagacccttcctctatataaggaagttcatttcatttggagaggaca7440

ggcttcttgagatccttcaacaattaccaacaacaacaaacaacaaacaacattacaatt7500

actatttacaattacagtcgactctagaggatccatggtgagcaagggcgaggagctgtt7560

caccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcag7620

cgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctg7680

caccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccttcacctacggcgt7740

gcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccat7800

gcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagac7860

ccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcat7920

cgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagcca7980

caacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccg8040

ccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccat8100

cggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgag8160

caaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgg8220

gatcactcacggcatggacgagctgtacaagtaaagcggccgcccggctgcattcgagta8280

ttatggcattgggaaaactgtttttcttgtaccatttgttgtgcttgtaatttactgtgt8340

tttttattcggttttcgctatcgaactgtgaaatggaaatggatggagaagagttaatga8400

atgatatggtccttttgttcattctcaaattaatattatttgttttttctcttatttgtt8460

gtgtgttgaatttgaaattataagagatatgcaaacattttgttttgagtaaaaatgtgt8520

caaatcgtggcctctaatgaccgaagttaatatgaggagtaaaacactagacccagcttt8580

cttgtacaaagtggtgatgttgtggtcgacccatcgatgggcatgcaagctgggatccca8640

gcttggtaccagatcttataattaaatggccttcgctgcccatattattggtaactcaac8700

agcatcaatcacgggatttttctcgaattaattgcgtcgaatctcagcatcgaaatattc8760

gcctttttcgtccattagactatctattgtgatggtggatttatcacaaatgggacccgc8820

cgccgacagaggtgtgatgttaggccaggactttgaaaatttgcgcaactatcgtatagt8880

ggccgacaaattgacgccgagttgacagactgcctagcatttgagtgaattatgtaaggt8940

aatgggctacactgaattggtagctcaaactgtcagtatttatgtatatgagtgtatatt9000

ttcgcataatctcagaccaatctgaagatgaaatgggtatctgggaatggcgaaatcaag9060

gcatcgatcgtgaagtttctcatctaagcccccatttggacgtgaatgtagacacgtcga9120

aataaagatttccgaattagaataatttgtttattgctttcgcctataaatacgacggat9180

cgtaatttgtcgttttatcaaaatgtactttcattttataataacgctgcggacatctac9240

atttttgaattgaaaaaaaattggtaattactctttctttttctccatattgaccatcat9300

actcattgctgatccatgtagatttcccggacatgaagccatttacaattgaatatatcc9360

tgccgccgctgccgctttgcacccggtggagcttgcatgttggtttctacgcagaactga9420

gccggttaggcagataatttccattgagaactgagccatgtgcaccttccccccaacacg9480

gtgagcgacggggcaacggagtgatccacatgggacttttaaacatcatccgtcggatgg9540

cgttgcgagagaagcagtcgatccgtgagatcagccgacgcaccgggcaggcgcgcaaca9600

cgatcgcaaagtatttgaacgcaggtacaatcgagccgacgttcacggtaccggaacgac9660

caagcaagctagcttagtaaagccctcgctagattttaatgcggatgttgcgattacttc9720

gccaactattgcgataacaagaaaaagccagcctttcatgatatatctcccaatttgtgt9780

agggcttattatgcacgcttaaaaataataaaagcagacttgacctgatagtttggctgt9840

gagcaattatgtgcttagtgcatctaacgcttgagttaagccgcgccgcgaagcggcgtc9900

ggcttgaacgaattgttagacattatttgccgactaccttggtgatctcgcctttcacgt9960

agtggacaaattcttccaactgatctgcgcgcgaggccaagcgatcttcttcttgtccaa10020

gataagcctgtctagcttcaagtatgacgggctgatactgggccggcaggcgctccattg10080

cccagtcggcagcgacatccttcggcgcgattttgccggttactgcgctgtaccaaatgc10140

gggacaacgtaagcactacatttcgctcatcgccagcccagtcgggcggcgagttccata10200

gcgttaaggtttcatttagcgcctcaaatagatcctgttcaggaaccggatcaaagagtt10260

cctccgccgctggacctaccaaggcaacgctatgttctcttgcttttgtcagcaagatag10320

ccagatcaatgtcgatcgtggctggctcgaagatacctgcaagaatgtcattgcgctgcc10380

attctccaaattgcagttcgcgcttagctggataacgccacggaatgatgtcgtcgtgca10440

caacaatggtgacttctacagcgcggagaatctcgctctctccaggggaagccgaagttt10500

ccaaaaggtcgttgatcaaagctcgccgcgttgtttcatcaagccttacggtcaccgtaa10560

ccagcaaatcaatatcactgtgtggcttcaggccgccatccactgcggagccgtacaaat10620

gtacggccagcaacgtcggttcgagatggcgctcgatgacgccaactacctctgatagtt10680

gagtcgatacttcggcgatcaccgcttccctcatgatgtttaactttgttttagggcgac10740

tgccctgctgcgtaacatcgttgctgctccataacatcaaacatcgacccacggcgtaac10800

gcgcttgctgcttggatgcccgaggcatagactgtaccccaaaaaaacagtcataacaag10860

ccatgaaaaccgccactgcgccgttaccaccgctgcgttcggtcaaggttctggaccagt10920

tgcgtgagcgcatacgctacttgcattacagcttacgaaccgaacaggcttatgtccact10980

gggttcgtgccttcatccgtttccacggtgtgcgtcacccggcaaccttgggcagcagcg11040

aagtcgaggcatttctgtcctggctggcgaacgagcgcaaggtttcggtctccacgcatc11100

gtcaggcattggcggccttgctgttcttctacggcaaggtgctgtgcacggatctgccct11160

ggcttcaggagatcggaagacctcggccgtcgcggcgcttgccggtggtgctgaccccgg11220

atgaagtggttcgcatcctcggttttctggaaggcgagcatcgtttgttcgcccagcttc11280

tgtatggaacgggcatgcggatcagtgagggtttgcaactgcgggtcaaggatctggatt11340

tcgatcacggcacgatcatcgtgcgggagggcaagggctccaaggatcgggccttgatgt11400

tacccgagagcttggcacccagcctgcgcgagcaggatcgatccaacccctccgctgcta11460

tagtgcagtcggcttctgacgttcagtgcagccgtcttctgaaaacgacatgtcgcacaa11520

gtcctaagttacgcgacaggctgccgccctgcccttttcctggcgttttcttgtcgcgtg11580

ttttagtcgcataaagtagaatacttgcgactagaaccggagacattacgccatgaacaa11640

gagcgccgccgctggcctgctgggctatgcccgcgtcagcaccgacgaccaggacttgac11700

caaccaacgggccgaactgcacgcggccggctgcaccaagctgttttccgagaagatcac11760

cggcaccaggcgcgaccgcccggagctggccaggatgcttgaccacctacgccctggcga11820

cgttgtgacagtgaccaggctagaccgcctggcccgcagcacccgcgacctactggacat11880

tgccgagcgcatccaggaggccggcgcgggcctgcgtagcctggcagagccgtgggccga11940

caccaccacgccggccggccgcatggtgttgaccgtgttcgccggcattgccgagttcga12000

gcgttccctaatcatcgaccgcacccggagcgggcgcgaggccgccaaggcccgaggcgt12060

gaagtttggcccccgccctaccctcaccccggcacagatcgcgcacgcccgcgagctgat12120

cgaccaggaaggccgcaccgtgaaagaggcggctgcactgcttggcgtgcatcgctcgac12180

cctgtaccgcgcacttgagcgcagcgaggaagtgacgcccaccgaggccaggcggcgcgg12240

tgccttccgtgaggacgcattgaccgaggccgacgccctggcggccgccgagaatgaacg12300

ccaagaggaacaagcatgaaaccgcaccaggacggccaggacgaaccgtttttcattacc12360

gaagagatcgaggcggagatgatcgcggccgggtacgtgttcgagccgcccgcgcacgtc12420

tcaaccgtgcggctgcatgaaatcctggccggtttgtctgatgccaagctggcggcctgg12480

ccggccagcttggccgctgaagaaaccgagcgccgccgtctaaaaaggtgatgtgtattt12540

gagtaaaacagcttgcgtcatgcggtcgctgcgtatatgatgcgatgagtaaataaacaa12600

atacgcaaggggaacgcatgaaggttatcgctgtacttaaccagaaaggcgggtcaggca12660

agacgaccatcgcaacccatctagcccgcgccctgcaactcgccggggccgatgttctgt12720

tagtcgattccgatccccagggcagtgcccgcgattgggcggccgtgcgggaagatcaac12780

cgctaaccgttgtcggcatcgaccgcccgacgattgaccgcgacgtgaaggccatcggcc12840

ggcgcgacttcgtagtgatcgacggagcgccccaggcggcggacttggctgtgtccgcga12900

tcaaggcagccgacttcgtgctgattccggtgcagccaagcccttacgacatatgggcca12960

ccgccgacctggtggagctggttaagcagcgcattgaggtcacggatggaaggctacaag13020

cggcctttgtcgtgtcgcgggcgatcaaaggcacgcgcatcggcggtgaggttgccgagg13080

cgctggccgggtacgagctgcccattcttgagtcccgtatcacgcagcgcgtgagctacc13140

caggcactgccgccgccggcacaaccgttcttgaatcagaacccgagggcgacgctgccc13200

gcgaggtccaggcgctggccgctgaaattaaatcaaaactcatttgagttaatgaggtaa13260

agagaaaatgagcaaaagcacaaacacgctaagtgccggccgtccgagcgcacgcagcag13320

caaggctgcaacgttggccagcctggcagacacgccagccatgaagcgggtcaactttca13380

gttgccggcggaggatcacaccaagctgaagatgtacgcggtacgccaaggcaagaccat13440

taccgagctgctatctgaatacatcgcgcagctaccagagtaaatgagcaaatgaataaa13500

tgagtagatgaattttagcggctaaaggaggcggcatggaaaatcaagaacaaccaggca13560

ccgacgccgtggaatgccccatgtgtggaggaacgggcggttggccaggcgtaagcggct13620

gggttgtctgccggccctgcaatggcactggaacccccaagcccgaggaatcggcgtgag13680

cggtcgcaaaccatccggcccggtacaaatcggcgcggcgctgggtgatgacctggtgga13740

gaagttgaaggccgcgcaggccgcccagcggcaacgcatcgaggcagaagcacgccccgg13800

tgaatcgtggcaagcggccgctgatcgaatccgcaaagaatcccggcaaccgccggcagc13860

cggtgcgccgtcgattaggaagccgcccaagggcgacgagcaaccagattttttcgttcc13920

gatgctctatgacgtgggcacccgcgatagtcgcagcatcatggacgtggccgttttccg13980

tctgtcgaagcgtgaccgacgagctggcgaggtgatccgctacgagcttccagacgggca14040

cgtagaggtttccgcagggccggccggcatggccagtgtgtgggattacgacctggtact14100

gatggcggtttcccatctaaccgaatccatgaaccgataccgggaagggaagggagacaa14160

gcccggccgcgtgttccgtccacacgttgcggacgtactcaagttctgccggcgagccga14220

tggcggaaagcagaaagacgacctggtagaaacctgcattcggttaaacaccacgcacgt14280

tgccatgcagcgtacgaagaaggccaagaacggccgcctggtgacggtatccgagggtga14340

agccttgattagccgctacaagatcgtaaagagcgaaaccgggcggccggagtacatcga14400

gatcgagctagctgattggatgtaccgcgagatcacagaaggcaagaacccggacgtgct14460

gacggttcaccccgattactttttgatcgatcccggcatcggccgttttctctaccgcct14520

ggcacgccgcgccgcaggcaaggcagaagcc14551

<210>10

<211>14569

<212>dna

<213>人工序列

<220>

<223>prit3-megfp的完整核苷酸序列。

<400>10

agatggttgttcaagacgatctacgaacgcagtggcagcgccggagagttcaagaagttc60

tgtttcaccgtgcgcaagctgatcgggtcaaatgacctgccggagtacgatttgaaggag120

gaggcggggcaggctggcccgatcctagtcatgcgctaccgcaacctgatcgagggcgaa180

gcatccgccggttcctaatgtacggagcagatgctagggcaaattgccctagcaggggaa240

aaaggtcgaaaaggtctctttcctgtggatagcacgtacattgggaacccaaagccgtac300

attgggaaccggaacccgtacattgggaacccaaagccgtacattgggaaccggtcacac360

atgtaagtgactgatataaaagagaaaaaaggcgatttttccgcctaaaactctttaaaa420

cttattaaaactcttaaaacccgcctggcctgtgcataactgtctggccagcgcacagcc480

gaagagctgcaaaaagcgcctacccttcggtcgctgcgctccctacgccccgccgcttcg540

cgtcggcctatcgcggccgctggccgctcaaaaatggctggcctacggccaggcaatcta600

ccagggcgcggacaagccgcgccgtcgccactcgaccgccggcgcccacatcaaggcacc660

ctgcctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagac720

ggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagc780

gggtgttggcgggtgtcggggcgcagccatgacccagtcacgtagcgatagcggagtgta840

tactggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgt900

gaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgctcttccgcttcctcg960

ctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaag1020

gcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaa1080

ggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctc1140

cgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgaca1200

ggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccg1260

accctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttct1320

catagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgt1380

gtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgag1440

tccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagc1500

agagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctac1560

actagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaaga1620

gttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgc1680

aagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacg1740

gggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatca1800

aaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagt1860

atatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctca1920

gcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacg1980

atacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctca2040

ccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggt2100

cctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagt2160

agttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtca2220

cgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttaca2280

tgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcaga2340

agtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttact2400

gtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctga2460

gaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaacacgggataataccgcg2520

ccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactc2580

tcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactga2640

tcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaat2700

gccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttccttttt2760

caatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgt2820

atttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgac2880

gtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccc2940

tttcgtcttcgaataaatacctgtgacggaagatcacttcgcagaataaataaatcctgg3000

tgtccctgttgataccgggaagccctgggccaacttttggcgaaaatgagacgttgatcg3060

gcacgtaagaggttccaactttcaccataatgaaataagatcactaccgggcgtattttt3120

tgagttatcgagattttcaggagctaaggaagctaaaatggagaaaaaaatcactggata3180

taccaccgttgatatatcccaatggcatcgtaaagaacattttgaggcatttcagtcagt3240

tgctcaatgtacctataaccagaccgttcctggatattacggcctttttaaagaccgtaa3300

agaaaaataagcacaagttttatccggcctttattcacattcttgcccgcctgatgaatg3360

ctcatccggaataattcgaagctcggtcccgtgggtgttctgtcgtctcgttgtacaacg3420

aaatccattcccattccgcgctcaagatggcttcccctcggcagttcatcagggctaaat3480

caatctagccgacttgtccggtgaaatgggctgcactccaacagaaacaatcaaacaaac3540

atacacagcgacttattcacacgagctcaaattacaacggtatatatcctgccagtcagc3600

atcatcacaccaaaagttaggcccgaatagtttgaaattagaaagctcgcaattgaggtc3660

tacaggccaaattcgctcttagccgtacaatattactcaccggtgcgatgccccccatcg3720

taggtgaaggtggaaattaatgatccatcttgagaccacaggcccacaacagctaccagt3780

ttcctcaagggtccaccaaaaacgtaagcgcttacgtacatggtcgataagaaaaggcaa3840

tttgtagatgttaattcccatcttgaaagaaatatagtttaaatatttattgataaaata3900

acaagtcaggtattatagtccaagcaaaaacataaatttattgatgcaagtttaaattca3960

gaaatatttcaataactgattatatcagctggtacattgccgtagatgaaagactgagtg4020

cgatattatgtgtaatacataaattgatgatatagctagcttagctcatcgggggatccg4080

tcgacctgcagccaagctgggatcccagctgggatcccagcttgtcgacggtaccccctc4140

tagagttccttctagacccgatctagtaacatagatgacaccgcgcgcgataatttatcc4200

tagtttgcgcgctatattttgttttctatcgcgtattaaatgtataattgcgggactcta4260

atcataaaaacccatctcataaataacgtcatgcattacatgttaattattacatgctta4320

acgtaattcaacagaaattatatgataatcatcgcaagaccggcaacaggattcaatctt4380

aagaaactttattgccaaatgtttgaacgatcggggatcatccgggtctgtggcgggaac4440

tccacgaaaatatccgaacgcagcaagatatcgcggtgcatctcggtcttgcctgggcag4500

tcgccgccgacgccgttgatgtggacgccgggcccgatcatattgtcgctcaggatcgtg4560

gcgttgtgcttgtcggccgttgctgtcgtaatgatatcggcaccttcgaccgcctgttcc4620

gcagagatcccgtgggcgaagaactccagcatgagatccccgcgctggaggatcatccag4680

ccggcgtcccggaaaacgattccgaagcccaacctttcatagaaggcggcggtggaatcg4740

aaatctcgtgatggcaggttgggcgtcgcttggtcggtcatttcgaaccccagagtcccg4800

ctcagaagaactcgtcaagaaggcgatagaaggcgatgcgctgcgaatcgggagcggcga4860

taccgtaaagcacgaggaagcggtcagcccattcgccgccaagctcttcagcaatatcac4920

gggtagccaacgctatgtcctgatagcggtccgccacacccagccggccacagtcgatga4980

atccagaaaagcggccattttccaccatgatattcggcaagcaggcatcgccatgggtca5040

cgacgagatcatcgccgtcgggcatgcgcgccttgagcctggcgaacagttcggctggcg5100

cgagcccctgatgctcttcgtccagatcatcctgatcgacaagaccggcttccatccgag5160

tacgtgctcgctcgatgcgatgtttcgcttggtggtcgaatgggcaggtagccggatcaa5220

gcgtatgcagccgccgcattgcatcagccatgatggatactttctcggcaggagcaaggt5280

gagatgacaggagatcctgccccggcacttcgcccaatagcagccagtcccttcccgctt5340

cagtgacaacgtcgagcacagctgcgcaaggaacgcccgtcgtggccagccacgatagcc5400

gcgctgcctcgtcctgcagttcattcagggcaccggacaggtcggtcttgacaaaaagaa5460

ccgggcgcccctgcgctgacagccggaacacggcggcatcagagcagccgattgtctgtt5520

gtgcccagtcatagccgaatagcctctccacccaagcggccggagaacctgcgtgcaatc5580

catcttgttcaatcatatctcattgccccccggtctacctacaaaaaagctccgcacgag5640

gctgcatttgtcacaaatcatgaaaagaaaaactaccgatgaacaatgctgagggattca5700

aattctacccacaaaaagaagaaagaaagatctagcacatctaagcctgacgaagcagca5760

gaaatatataaaaatataaaccatagtgcccttttcccctcttcctgatcttgtttagca5820

tggcggaaattttaaaccccccatcatctcccccaacaacggcggatcgcagatctacat5880

ccgagagccccattccccgcgagatccgggccggatccacgccggcgagagccccagccg5940

cgagatcccgcccctcccgcgcaccgatctgggcgcgcacgaagccgcctctcgcccacc6000

caaactaccaaggccaaagatcgagaccgagacggaaaaaaaaaacggagaaagaaagag6060

gagaggggcggggtggttaccggcgcggcggcggcggagggggaggggggaggagctcgt6120

cgtccggcagcgaggggggaggaggtggaggtggtggtggtggtggtggtagggttgggg6180

ggatgggaggagaggggggggtatgtatatagtggcgatggggggcgtttctttggaagc6240

ggagggagggccggcctcgtcgctggctcgcgatcctcctcgcgtttccggcccccacga6300

cccggacccacctgctgttttttctttttcttttttttctttctttttttttttttggct6360

gcgagacgtgcggtgcgtgcggacaactcacggtgatagtgggggggtgtggagactatt6420

gtccagttggctggactggggtgggttgggttgggttgggttgggctgggcttgctatgg6480

atcgtggatagcactttgggctttaggaactttaggggttgtttttgtaaatgttttgag6540

tctaagtttatcttttatttttactagaaaaaatacccatgcgctgcaacgggggaaagc6600

tattttaatcttattattgttcattgtgagaattcgcctgaatatatatttttctcaaaa6660

attatgtcaaattagcatatgggtttttttaaagatatttcttatacaaatccctctgta6720

tttacaaaagcaaacgaacttaaaacccgactcaaatacagatatgcatttccaaaagcg6780

aataaacttaaaaaccaattcatacaaaaatgacgtatcaaagtaccgacaaaaacatcc6840

tcaatttttataatagtagaaaagagtaaatttcactttgggccaccttttattaccgat6900

attttactttataccaccttttaactgatgttttcacttttgaccaggtaatcttacctt6960

tgttttattttggactatcccgactctcttctcaagcatatgaatgaccgtatgctagtg7020

cggccgcaagcttgactactagtctctcttaaggtagcatcacaagtttgtacaaaaaag7080

caggctcctgcaggtgagacttttcaacaaagggtaatatcgggaaacctcctcggattc7140

cattgcccagctatctgtcacttcatcgaaaggacagtagaaaaggaaggtggctcctac7200

aaatgccatcattgcgataaaggaaaggctatcgttcaagatgcctctaccgacagtggt7260

cccaaagatggacccccacccacgaggaacatcgtggaaaaagaagacgttccaaccacg7320

tcttcaaagcaagtggattgatgtgatatctccactgacgtaagggatgacgcacaatcc7380

cactatccttcgcaagacccttcctctatataaggaagttcatttcatttggagaggaca7440

ggcttcttgagatccttcaacaattaccaacaacaacaaacaacaaacaacattacaatt7500

actatttacaattacagtcgactctagaggatccggcccagttggaatgtaggtggtgag7560

caagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgt7620

aaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagct7680

gaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgac7740

caccttcacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacga7800

cttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaagga7860

cgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccg7920

catcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctgga7980

gtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaa8040

ggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccacta8100

ccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgag8160

cacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctgga8220

gttcgtgaccgccgccgggatcactcacggcatggacgagctgtacaagtaaagcggccg8280

cccggctgcattcgagtattatggcattgggaaaactgtttttcttgtaccatttgttgt8340

gcttgtaatttactgtgttttttattcggttttcgctatcgaactgtgaaatggaaatgg8400

atggagaagagttaatgaatgatatggtccttttgttcattctcaaattaatattatttg8460

ttttttctcttatttgttgtgtgttgaatttgaaattataagagatatgcaaacattttg8520

ttttgagtaaaaatgtgtcaaatcgtggcctctaatgaccgaagttaatatgaggagtaa8580

aacactagacccagctttcttgtacaaagtggtgatgttgtggtcgacccatcgatgggc8640

atgcaagctgggatcccagcttggtaccagatcttataattaaatggccttcgctgccca8700

tattattggtaactcaacagcatcaatcacgggatttttctcgaattaattgcgtcgaat8760

ctcagcatcgaaatattcgcctttttcgtccattagactatctattgtgatggtggattt8820

atcacaaatgggacccgccgccgacagaggtgtgatgttaggccaggactttgaaaattt8880

gcgcaactatcgtatagtggccgacaaattgacgccgagttgacagactgcctagcattt8940

gagtgaattatgtaaggtaatgggctacactgaattggtagctcaaactgtcagtattta9000

tgtatatgagtgtatattttcgcataatctcagaccaatctgaagatgaaatgggtatct9060

gggaatggcgaaatcaaggcatcgatcgtgaagtttctcatctaagcccccatttggacg9120

tgaatgtagacacgtcgaaataaagatttccgaattagaataatttgtttattgctttcg9180

cctataaatacgacggatcgtaatttgtcgttttatcaaaatgtactttcattttataat9240

aacgctgcggacatctacatttttgaattgaaaaaaaattggtaattactctttcttttt9300

ctccatattgaccatcatactcattgctgatccatgtagatttcccggacatgaagccat9360

ttacaattgaatatatcctgccgccgctgccgctttgcacccggtggagcttgcatgttg9420

gtttctacgcagaactgagccggttaggcagataatttccattgagaactgagccatgtg9480

caccttccccccaacacggtgagcgacggggcaacggagtgatccacatgggacttttaa9540

acatcatccgtcggatggcgttgcgagagaagcagtcgatccgtgagatcagccgacgca9600

ccgggcaggcgcgcaacacgatcgcaaagtatttgaacgcaggtacaatcgagccgacgt9660

tcacggtaccggaacgaccaagcaagctagcttagtaaagccctcgctagattttaatgc9720

ggatgttgcgattacttcgccaactattgcgataacaagaaaaagccagcctttcatgat9780

atatctcccaatttgtgtagggcttattatgcacgcttaaaaataataaaagcagacttg9840

acctgatagtttggctgtgagcaattatgtgcttagtgcatctaacgcttgagttaagcc9900

gcgccgcgaagcggcgtcggcttgaacgaattgttagacattatttgccgactaccttgg9960

tgatctcgcctttcacgtagtggacaaattcttccaactgatctgcgcgcgaggccaagc10020

gatcttcttcttgtccaagataagcctgtctagcttcaagtatgacgggctgatactggg10080

ccggcaggcgctccattgcccagtcggcagcgacatccttcggcgcgattttgccggtta10140

ctgcgctgtaccaaatgcgggacaacgtaagcactacatttcgctcatcgccagcccagt10200

cgggcggcgagttccatagcgttaaggtttcatttagcgcctcaaatagatcctgttcag10260

gaaccggatcaaagagttcctccgccgctggacctaccaaggcaacgctatgttctcttg10320

cttttgtcagcaagatagccagatcaatgtcgatcgtggctggctcgaagatacctgcaa10380

gaatgtcattgcgctgccattctccaaattgcagttcgcgcttagctggataacgccacg10440

gaatgatgtcgtcgtgcacaacaatggtgacttctacagcgcggagaatctcgctctctc10500

caggggaagccgaagtttccaaaaggtcgttgatcaaagctcgccgcgttgtttcatcaa10560

gccttacggtcaccgtaaccagcaaatcaatatcactgtgtggcttcaggccgccatcca10620

ctgcggagccgtacaaatgtacggccagcaacgtcggttcgagatggcgctcgatgacgc10680

caactacctctgatagttgagtcgatacttcggcgatcaccgcttccctcatgatgttta10740

actttgttttagggcgactgccctgctgcgtaacatcgttgctgctccataacatcaaac10800

atcgacccacggcgtaacgcgcttgctgcttggatgcccgaggcatagactgtaccccaa10860

aaaaacagtcataacaagccatgaaaaccgccactgcgccgttaccaccgctgcgttcgg10920

tcaaggttctggaccagttgcgtgagcgcatacgctacttgcattacagcttacgaaccg10980

aacaggcttatgtccactgggttcgtgccttcatccgtttccacggtgtgcgtcacccgg11040

caaccttgggcagcagcgaagtcgaggcatttctgtcctggctggcgaacgagcgcaagg11100

tttcggtctccacgcatcgtcaggcattggcggccttgctgttcttctacggcaaggtgc11160

tgtgcacggatctgccctggcttcaggagatcggaagacctcggccgtcgcggcgcttgc11220

cggtggtgctgaccccggatgaagtggttcgcatcctcggttttctggaaggcgagcatc11280

gtttgttcgcccagcttctgtatggaacgggcatgcggatcagtgagggtttgcaactgc11340

gggtcaaggatctggatttcgatcacggcacgatcatcgtgcgggagggcaagggctcca11400

aggatcgggccttgatgttacccgagagcttggcacccagcctgcgcgagcaggatcgat11460

ccaacccctccgctgctatagtgcagtcggcttctgacgttcagtgcagccgtcttctga11520

aaacgacatgtcgcacaagtcctaagttacgcgacaggctgccgccctgcccttttcctg11580

gcgttttcttgtcgcgtgttttagtcgcataaagtagaatacttgcgactagaaccggag11640

acattacgccatgaacaagagcgccgccgctggcctgctgggctatgcccgcgtcagcac11700

cgacgaccaggacttgaccaaccaacgggccgaactgcacgcggccggctgcaccaagct11760

gttttccgagaagatcaccggcaccaggcgcgaccgcccggagctggccaggatgcttga11820

ccacctacgccctggcgacgttgtgacagtgaccaggctagaccgcctggcccgcagcac11880

ccgcgacctactggacattgccgagcgcatccaggaggccggcgcgggcctgcgtagcct11940

ggcagagccgtgggccgacaccaccacgccggccggccgcatggtgttgaccgtgttcgc12000

cggcattgccgagttcgagcgttccctaatcatcgaccgcacccggagcgggcgcgaggc12060

cgccaaggcccgaggcgtgaagtttggcccccgccctaccctcaccccggcacagatcgc12120

gcacgcccgcgagctgatcgaccaggaaggccgcaccgtgaaagaggcggctgcactgct12180

tggcgtgcatcgctcgaccctgtaccgcgcacttgagcgcagcgaggaagtgacgcccac12240

cgaggccaggcggcgcggtgccttccgtgaggacgcattgaccgaggccgacgccctggc12300

ggccgccgagaatgaacgccaagaggaacaagcatgaaaccgcaccaggacggccaggac12360

gaaccgtttttcattaccgaagagatcgaggcggagatgatcgcggccgggtacgtgttc12420

gagccgcccgcgcacgtctcaaccgtgcggctgcatgaaatcctggccggtttgtctgat12480

gccaagctggcggcctggccggccagcttggccgctgaagaaaccgagcgccgccgtcta12540

aaaaggtgatgtgtatttgagtaaaacagcttgcgtcatgcggtcgctgcgtatatgatg12600

cgatgagtaaataaacaaatacgcaaggggaacgcatgaaggttatcgctgtacttaacc12660

agaaaggcgggtcaggcaagacgaccatcgcaacccatctagcccgcgccctgcaactcg12720

ccggggccgatgttctgttagtcgattccgatccccagggcagtgcccgcgattgggcgg12780

ccgtgcgggaagatcaaccgctaaccgttgtcggcatcgaccgcccgacgattgaccgcg12840

acgtgaaggccatcggccggcgcgacttcgtagtgatcgacggagcgccccaggcggcgg12900

acttggctgtgtccgcgatcaaggcagccgacttcgtgctgattccggtgcagccaagcc12960

cttacgacatatgggccaccgccgacctggtggagctggttaagcagcgcattgaggtca13020

cggatggaaggctacaagcggcctttgtcgtgtcgcgggcgatcaaaggcacgcgcatcg13080

gcggtgaggttgccgaggcgctggccgggtacgagctgcccattcttgagtcccgtatca13140

cgcagcgcgtgagctacccaggcactgccgccgccggcacaaccgttcttgaatcagaac13200

ccgagggcgacgctgcccgcgaggtccaggcgctggccgctgaaattaaatcaaaactca13260

tttgagttaatgaggtaaagagaaaatgagcaaaagcacaaacacgctaagtgccggccg13320

tccgagcgcacgcagcagcaaggctgcaacgttggccagcctggcagacacgccagccat13380

gaagcgggtcaactttcagttgccggcggaggatcacaccaagctgaagatgtacgcggt13440

acgccaaggcaagaccattaccgagctgctatctgaatacatcgcgcagctaccagagta13500

aatgagcaaatgaataaatgagtagatgaattttagcggctaaaggaggcggcatggaaa13560

atcaagaacaaccaggcaccgacgccgtggaatgccccatgtgtggaggaacgggcggtt13620

ggccaggcgtaagcggctgggttgtctgccggccctgcaatggcactggaacccccaagc13680

ccgaggaatcggcgtgagcggtcgcaaaccatccggcccggtacaaatcggcgcggcgct13740

gggtgatgacctggtggagaagttgaaggccgcgcaggccgcccagcggcaacgcatcga13800

ggcagaagcacgccccggtgaatcgtggcaagcggccgctgatcgaatccgcaaagaatc13860

ccggcaaccgccggcagccggtgcgccgtcgattaggaagccgcccaagggcgacgagca13920

accagattttttcgttccgatgctctatgacgtgggcacccgcgatagtcgcagcatcat13980

ggacgtggccgttttccgtctgtcgaagcgtgaccgacgagctggcgaggtgatccgcta14040

cgagcttccagacgggcacgtagaggtttccgcagggccggccggcatggccagtgtgtg14100

ggattacgacctggtactgatggcggtttcccatctaaccgaatccatgaaccgataccg14160

ggaagggaagggagacaagcccggccgcgtgttccgtccacacgttgcggacgtactcaa14220

gttctgccggcgagccgatggcggaaagcagaaagacgacctggtagaaacctgcattcg14280

gttaaacaccacgcacgttgccatgcagcgtacgaagaaggccaagaacggccgcctggt14340

gacggtatccgagggtgaagccttgattagccgctacaagatcgtaaagagcgaaaccgg14400

gcggccggagtacatcgagatcgagctagctgattggatgtaccgcgagatcacagaagg14460

caagaacccggacgtgctgacggttcaccccgattactttttgatcgatcccggcatcgg14520

ccgttttctctaccgcctggcacgccgcgccgcaggcaaggcagaagcc14569

<210>11

<211>18695

<212>dna

<213>人工序列

<220>

<223>2408的完整核苷酸序列。

<400>11

taaacgctcttttctcttaggtttacccgccaatatatcctgtcaaacactgatagttta60

aactgaaggcgggaaacgacaatctgatccaagctcaagctccaatacgcaaaccgcctc120

tccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaag180

cgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctt240

tacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcaca300

caggaaacagctatgaccatgattacgaatttcaggtgactgatagtgacctgttcgttg360

caacaaattgatgagcaatgcttttttataatgccaactttgtacaaaaaagcaggcggc420

gcgtcctgcaggatagggataacagggtaatggcgcgccaagcttatcgataccgtcgac480

ctcgagcggccgccagtgtgatggatatctgcagaattgcccttcgaagggacaaaaaaa540

gcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgcta600

tttctagctctaaaacgcccagttggaatgtaggtgcaacacaagcgacagcgcgcgggt660

ttataagttggtcgcgttcgagttagctgggcaatgtggtactaaactgttcctcccgcc720

tctcgcgctcacactcgccctgtgggccgctcaccgtgcacgtacttgggcctcccgctc780

ccccgcatgcatccagcccatcacagcgaagagaatcgggcttttcttctccccatctcc840

ctacacaaccaccaaatacagccaggccgttggttcatgatccaagggcaattccagcac900

actggcggccgttactagtggatccgagctcggtaccttaattaaattaccctgttatcc960

ctatcctgcaggattaacacccaacttttctatccaagcttgccaacatggtggagcacg1020

acactctcgtctactccaagaatatcaaagatacagtctcagaagaccaaagggctattg1080

agacttttcaacaaagggtaatatcgggaaacctcctcggattccattgcccagctatct1140

gtcacttcatcaaaaggacagtagaaaaggaaggtggcacctacaaatgccatcattgcg1200

ataaaggaaaggctatcgttcaagatgcctctgccgacagtggtcccaaagatggacccc1260

cacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtgg1320

attgatgtgataacatggtggagcacgacactctcgtctactccaagaatatcaaagata1380

cagtctcagaagaccaaagggctattgagacttttcaacaaagggtaatatcgggaaacc1440

tcctcggattccattgcccagctatctgtcacttcatcaaaaggacagtagaaaaggaag1500

gtggcacctacaaatgccatcattgcgataaaggaaaggctatcgttcaagatgcctctg1560

ccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacg1620

ttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaagggatg1680

acgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttcatt1740

tggagaggccggtctagagaattccaagcaacgaactgcgagtgattcaagaaaaaagaa1800

aacctgagctttcgatctctacggagtggtttcttgttctttgaaaaagagggggattac1860

atatggctcctaagaagaagcggaaggttggtattcacggggtgcctgcggctatggaca1920

agaagtactcgatcgggctggccatcggaacaaattctgtaggctgggctgtaataaccg1980

atgagtacaaggtgccctctaaaaaatttaaggtccttggcaatacggatagacattcca2040

taaagaagaatcttatcggtgcgctgctctttgacagcggcgagaccgcggaggcgaccc2100

ggttgaaacgcaccgcgagacgccgttacacaaggcgtaagaatagaatctgttatctcc2160

aggagatattctctaatgaaatggcgaaggtagacgattccttctttcaccgtctggagg2220

aaagttttctcgttgaggaagataagaaacatgaaagacacccgatcttcggaaacattg2280

tcgacgaggtcgcttatcatgaaaagtaccctaccatctaccatcttagaaagaaacttg2340

ttgacagcacggataaggctgatctcaggctgatatacctggctctggcacatatgatta2400

agttcagagggcatttccttatcgaaggcgacctgaatccagataattcagatgtagaca2460

agctcttcattcaacttgtgcagacttataatcagctcttcgaagaaaatccaataaacg2520

cgtcgggtgtagacgcaaaggccatactgtccgctaggctttctaagtcacgtagacttg2580

agaatctcattgcccaactccccggcgagaagaagaacggcttgtttggaaatctgatag2640

cgctgtccctgggtcttacaccaaatttcaagagtaatttcgatttggcagaagatgcta2700

agttgcagctcagtaaagacacctacgatgacgatcttgataatttgttggctcagattg2760

gcgatcagtatgcagatcttttcttggccgctaagaatttgtctgatgcaattctgctta2820

gcgacattttgagggttaatacagaaatcaccaaggcacccttgtcggcgtcaatgataa2880

agaggtatgatgagcaccaccaagacctgacgctcctcaaggctcttgttcggcagcaat2940

tgccggagaagtacaaagagatcttcttcgaccagtctaagaacggatatgcgggctaca3000

tagacggtggagcgagtcaggaggaattctacaagttcataaagcccattctcgagaaga3060

tggatggtacggaagaactgcttgtgaaacttaacagagaagatcttttgcggaagcaga3120

gaactttcgacaacggaagtataccacaccagatacatctcggagagcttcatgctattc3180

tcagaagacaagaggatttctaccctttcttgaaggataacagagaaaagatagagaaga3240

tcctcacgtttaggatcccttactacgtaggtcctcttgctcgcggcaatagtaggttcg3300

cctggatgacccgcaagtctgaagaaactatcaccccttggaatttcgaagaggttgtag3360

acaaaggtgcttcagcacagagtttcattgagaggatgaccaacttcgacaagaacctcc3420

ccaacgaaaaggtcctgcctaagcacagcctcctctacgaatactttactgtctataatg3480

agcttacaaaagttaagtacgtgacagagggaatgcggaagcccgcattcctttccggag3540

aacaaaagaaggcgatcgtggatcttctcttcaagacgaaccgcaaggtgacggttaaac3600

agttgaaggaagattacttcaagaagatagaatgttttgatagcgtggaaatcagcggcg3660

tcgaagataggttcaacgcttccctgggaacgtaccacgatctcctcaagattatcaaag3720

ataaggactttcttgataacgaagagaatgaggacatcttggaagacattgttctgacgc3780

tcaccctgttcgaagatcgcgagatgattgaggaacgcttgaagacctacgcacacctgt3840

tcgatgacaaggttatgaagcaacttaaacggcgccggtatacgggctggggacggcttt3900

cgcggaagctgataaatggaatccgtgacaagcagtctggcaagacaatactcgacttct3960

tgaagtcggatggttttgccaatagaaattttatgcaactcattcatgatgactcgctta4020

cttttaaggaggacatccagaaggcccaggtatcaggacagggtgactctttgcacgaac4080

acatcgcgaacctggcgggctcccccgcgattaagaagggaattttgcagactgtcaagg4140

tggtcgatgaactcgtgaaggttatgggacgtcataagccggaaaatattgtgattgaga4200

tggctcgcgagaatcaaacaacacagaagggccaaaagaacagtagagaacgcatgaagc4260

gcatcgaagagggcatcaaagagctgggcagtcagatccttaaagaacatccagtcgaga4320

atacacagcttcagaacgaaaagctgtacctttattaccttcaaaatgggcgtgatatgt4380

atgtggatcaggaactcgatatcaataggctgagtgactatgatgtcgacgctatcgtcc4440

cgcaaagtttcctcaaggacgacagtatagacaacaaagttctcacacggtcagataaga4500

atcgcggcaagagcgataatgtaccgtcggaggaggtagtcaagaagatgaagaattact4560

ggcgccagttgctcaacgccaagctcatcactcagaggaaatttgacaaccttacgaaag4620

ccgagcggggcggactctctgaactggacaaggccggtttcataaagcgccagctcgttg4680

agacacgtcaaattactaagcacgtcgctcaaatattggattcccgcatgaatactaagt4740

acgatgagaatgataagctcatacgtgaagttaaggtcattactctcaagtccaagcttg4800

tatcggacttccgtaaggacttccaattctacaaggtccgggaaatcaataattatcacc4860

atgcccatgacgcttatctgaacgcggtcgtgggcacggcactcattaagaaatacccaa4920

aacttgagtcagaatttgtttacggggactataaagtttatgacgtgcggaagatgatag4980

cgaagtcggaacaagagataggaaaggcgactgcaaagtactttttttactccaacataa5040

tgaatttctttaagaccgaaataacccttgcaaacggtgaaatcagaaagcggcctctga5100

ttgaaacaaatggcgagacgggcgagatcgtctgggacaaggggagggacttcgcaacgg5160

ttcgcaaggtccttagcatgccgcaagtaaatatagttaagaagacggaagttcagaccg5220

gcggctttagtaaagaaagcatacttcctaaaaggaattccgacaaactgatagcgcgca5280

agaaggactgggatccaaagaagtatggaggatttgactccccaaccgttgcttatagcg5340

tgttggtagtagccaaggtggaaaagggtaagtctaagaaattgaagtcggtgaaggagt5400

tgttggggataactataatggagcggagttcgttcgagaagaacccaattgactttctcg5460

aagccaaaggctacaaggaggtcaagaaggacctgattattaagttgccaaagtactcgc5520

tcttcgaactcgagaacgggagaaagcgtatgctggcgtcggcgggcgagctgcagaaag5580

gaaacgagctggctttgccatcgaaatacgtaaatttcctgtacctcgcctcacattatg5640

agaagcttaaagggtctccagaagacaatgaacagaagcagctgtttgttgaacagcaca5700

agcactacttggacgagattatagaacaaatctccgagttctctaaacgggttatccttg5760

cagacgccaatttggataaggtcctctcggcttataataagcatagagataagccaatcc5820

gggagcaggctgaaaatatcatacacctctttacgttgactaatttgggtgcgccagcgg5880

cattcaagtacttcgatacaacaatcgatcgtaagcgctacacaagcactaaggaagtcc5940

tggacgcgacgctgatacaccagtccattactggactgtatgaaaccagaatagatctta6000

gccagctcggcggtgatggaggagggcctagggctgatcctaagaagaagaggaaggttg6060

gaggagggccaggagcagagtatgttagagcgttgtttgattttaacggtaacgatgaag6120

aggatttaccctttaagaaaggcgacattctcaggattagggataaacctgaagagcaat6180

ggtggaatgctgaggatagtgaaggcaaacgaggaatgattttagtgccgtatgtggaga6240

aatattcgggtgactacaaagatcatgatggtgattacaaagaccatgacatcgactaca6300

aggatgatgatgataagtcagggatgacagatgctgaatatgtcagaatccacgaaaagt6360

tggacatttacacgtttaagaagcagttcttcaacaacaagaaatctgtttcgcataggt6420

gctatgtgcttttcgaactaaaacgtcgtggagaaagacgggcttgcttttggggttacg6480

cggttaacaaaccacaatcaggtactgaacgaggaatacacgctgaaatcttttctatcc6540

gaaaggttgaggaatatctacgtgacaatcctggacagttcactatcaattggtattcta6600

gctggtcaccatgtgcagattgtgctgagaagattctcgaatggtacaatcaagagctta6660

gaggcaatggacatacattgaaaatatgggcatgcaagctctactacgaaaagaatgcca6720

gaaaccaaattgggctttggaacttgagggataatggagttgggcttaatgtcatggttt6780

ctgagcactatcaatgttgtcggaagatcttcatacaaagttcccataaccagttgaatg6840

agaacagatggttagagaaaacccttaaaagagccgagaagagaagatccgaactgagca6900

ttatgatacaggtcaaaattctgcataccactaagagtccagctgtaggtcctaagaaga6960

aacgtaaagtagggccctgatccaggcctcccagctttcgtccgtatcatcggtttcgac7020

aacgttcgtcaagttcaatgcatcagtttcattgcccacacaccagaatcctactaagtt7080

tgagtattatggcattggaaaagctgttttcttctatcatttgttctgcttgtaatttac7140

tgtgttctttcagtttttgttttcggacatcaaaatgcaaatggatggataagagttaat7200

aaatgatatggtccttttgttcattctcaaattattattatctgttgtttttactttaat7260

gggttgaatttaagtaagaaaggaactaacagtgtgatattaaggtgcaatgttagacat7320

ataaaacagtctttcacctctctttggttatgtcttgaattggtttgtttcttcacttat7380

ctgtgtaatcaagtttactatgagtctatgatcaagtaattatgcaatcaagttaagtac7440

agtataggcttgagctccctaggcccctaggtaattcttcggacccaagaatgctaagcc7500

aagaggagctgttatcgccgtcctcctgcttgtttctctctttttgttgctgtttcttca7560

ttagcgtggacaaagttttcaaccggcctatctgttatcattttcttctattcaaagact7620

gtaatacctattgctacctgtggttctcacttgtgattttggacacatatgttcggttta7680

ttcaaatttaatcagatgcctgatgagggtaccagaaaaaatacgtgttctggttgtttt7740

tgagttgcgattattctatgaaatgaataacatcgaagttatcatcccagtattttcgca7800

tgaatgttcttttcttctgtcttgtgcatcagtgatctagtgcatgggagtttgtattgt7860

gatgttcgacatcacgtaacttccactttgcctttgctgttcgatattttaatgacatgt7920

cacacacacttctgatacttttctttcttggctattgtgccagcatgatgcaagatgcat7980

cacagcatcagatatattctcatcgtcaggctttagcagcacacgagcacgctttgccgc8040

ttaaaagttgtacggcgcagcttagacatcccctgtagaagtgataatcttttcactttt8100

ccttaaacaaattgagaggggaaatggaaccatgtggatcagagaagcttttgtttcttt8160

acacaagaatatttggtacagtgggggtcctatgttcgtgggttcgtggcttggctgcct8220

gtcttcaaccaagtgttttcagttcaacatgttagcgtgtagaaagagcacaattctgtt8280

tatctccaaggtaaaatgtggcattctgttaaagaacatgatcctgccaattttttaagt8340

ttcaatggaagaggaatgtaaagctttctatggtttgtgtacacaacacagtggaagagg8400

agtgcaagctttctatggtttgtgtgcgcgttgtgtgtcagcacttcaattttgttagaa8460

aatgaaagaaaaaaaaggatgatcatgcttatagtaaatcactctttttcctcgccttct8520

gtacgttttgacttgacaagattttaaaatctgtacatgacctttgttttaaaattactt8580

tatgtatttccatctttcaagttatgcagatgtcatcacaaattgttacaccaatcacca8640

ggctggctgtttatatattatcagaccaggctatatagagtatactatactaactgttca8700

tattatctggaaatcttgcttgctacttgagcggtaaaagggtatagatatgagggtccc8760

cagattagccttttcaatttcagaaagaatgctaacccacagatggttagagaggcttac8820

gcagcaggtctcatcaagacgatctacccgagcaataatctccaggaaatcaaatacctt8880

cccaagaaggttaaagatgcagtcaaaagattcaggactaactgcatcaagaacacagag8940

aaagatatatttctcaagatcagaagtactattccagtatggacgattcaaggcttgctt9000

cacaaaccaaggcaagtaatagagattggagtctctaaaaaggtagttcccactgaatca9060

aaggccatggagtcaaagattcaaatagaggacctaacagaactcgccgtaaagactggc9120

gaacagttcatacagagtctcttacgactcaatgacaagaagaaaatcttcgtcaacatg9180

gtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaa9240

agggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgc9300

ccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgc9360

catcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaa9420

gatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttca9480

aagcaagtggattgatgtgatatctccactgacgtaagggatgacgcacaatcccactat9540

ccttcgcaagacccttcctctatataaggaagttcatttcatttggagagaacacggggg9600

actctagaatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaa9660

agttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttca9720

gcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttct9780

acaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgc9840

ttgacattggggagtttagcgagagcctgacctattgcatctcccgccgttcacagggtg9900

tcacgttgcaagacctgcctgaaaccgaactgcccgctgttctacaaccggtcgcggagg9960

ctatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggac10020

cgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatcccc10080

atgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctc10140

tcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcgg10200

atttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactgga10260

gcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgt10320

ggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcag10380

gatcgccacgactccgggcgtatatgctccgcattggtcttgaccaactctatcagagct10440

tggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtcc10500

gatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctgga10560

ccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccga10620

gggcaaagaaataggagctctgggctaatctaaaacgatttatctgtggcttcaagtgta10680

tcgatcacttatgtgaggtgtaattactggtgtttttggtgtgctctggttcctttcaag10740

tgtgttgttgccgctcgaactactccgctatgtaaaacggtaaaacctgttgtctcatta10800

tgaaagtgaactatattatgttctactactactctacttagtcaattttcttcaccttga10860

ttagtgtaaatatgaatcttatattcttatgtcttaagaaattagcacatgtgaagcctc10920

caagtgcatattttctcgatcgcgagacgcacaatgcgtgagaaattcagctggttatac10980

tcaaatatattaatatatctagcagcagctcatggagattcaggaaacttggcatcccta11040

atccctaccatttccattcttccgagattgacagttcaatacaagtacagtaatctcctg11100

gtaagtttcttattaacttgacatgtagtagtaataatttgtacgtagcatagatacata11160

gacacaaaaatgtcctccccattgagctagccgattggagccgaacaccgcaggaatgaa11220

tttacataatctgcaaagaataaatggaatgtgcctccacaggaaaaccagcggcagtgt11280

ggcgttttcaagagcagccgtaagtcgaagcctattctgaatcgtagaaatcactggggc11340

atggtgtaattacatccgactccaacatctgtaccaccctgtgcattgtaggccgctcct11400

ctggcaaagaacttacacattgtttagcaagagaaagtagagcatccaaggtctcaatct11460

gcactccctcacaatatggatcgacaatttccctctcccgattctcaccgaccaggaaat11520

tcaactgccacagagcaagtagattatttcaagaatacattaaatcaattgaaggcatac11580

gtaattcatatcagaaaactgtggatatgaaatggaaggacataaaggtcatacataccc11640

atccaacaatgttcaatcccttttcaataaatgatgcatcagtaggtcgttttccgctta11700

gtatttcaagtagcaaaactccaaaactgtagacgtcagtcttttcggtggctctgccac11760

tttgcatatactcctgcaggtcgaccatagtgactggatatgttgtgttttacagtatta11820

tgtagtctgttttttatgcaaaatctaatttaatatattgatatttatatcattttacgt11880

ttctcgttcagctttcttgtacaaagtggtgatatcccgcggaaatacgtagaattcggg11940

aagcttggcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttaccca12000

acttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccg12060

caccgatcgcccttcccaacagttgcgcagcctgaatggcgaatgctagagcaattcggc12120

gttaattcagtacattaaaaacgtccgcaatgtgttattaagttgtctaagcgtcaattt12180

gtttacaccacaatatatcctgccaccagccagccaacagctccccgaccggcagctcgg12240

cacaaaatcaccactcgatacaggcagcccatcagtccgggacggcgtcagcgggagagc12300

cgttgtaaggcggcagactttgctcatgttaccgatgctattcggaagaacggcaactaa12360

gctgccgggtttgaaacacggatgatctcgcggagggtagcatgttgattgtaacgatga12420

cagagcgttgctgcctgtgatcaattcgggcacgaacccagtggacataagcctcgttcg12480

gttcgtaagctgtaatgcaagtagcgtaactgccgtcacgcaactggtccagaaccttga12540

ccgaacgcagcggtggtaacggcgcagtggcggttttcatggcttcttgttatgacatgt12600

ttttttggggtacagtctatgcctcgggcatccaagcagcaagcgcgttacgccgtgggt12660

cgatgtttgatgttatggagcagcaacgatgttacgcagcagggcagtcgccctaaaaca12720

aagttaaacatcatgggggaagcggtgatcgccgaagtatcgactcaactatcagaggta12780

gttggcgtcatcgagcgccatctcgaaccgacgttgctggccgtacatttgtacggctcc12840

gcagtggatggcggcctgaagccacacagtgatattgatttgctggttacggtgaccgta12900

aggcttgatgaaacaacgcggcgagctttgatcaacgaccttttggaaacttcggcttcc12960

cctggagagagcgagattctccgcgctgtagaagtcaccattgttgtgcacgacgacatc13020

attccgtggcgttatccagctaagcgcgaactgcaatttggagaatggcagcgcaatgac13080

attcttgcaggtatcttcgagccagccacgatcgacattgatctggctatcttgctgaca13140

aaagcaagagaacatagcgttgccttggtaggtccagcggcggaggaactctttgatccg13200

gttcctgaacaggatctatttgaggcgctaaatgaaaccttaacgctatggaactcgccg13260

cccgactgggctggcgatgagcgaaatgtagtgcttacgttgtcccgcatttggtacagc13320

gcagtaaccggcaaaatcgcgccgaaggatgtcgctgccgactgggcaatggagcgcctg13380

ccggcccagtatcagcccgtcatacttgaagctagacaggcttatcttggacaagaagaa13440

gatcgcttggcctcgcgcgcagatcagttggaagaatttgtccactacgtgaaaggcgag13500

atcaccaaggtagtcggcaaataatgtctagctagaaattcgttcaagccgacgccgctt13560

cgccggcgttaaatcaagcgattagatgcactaagcacataattgctcacagccaaacta13620

tcaggtcaagtctgcttttattatttttaagcgtgcataataagccctacacaaattggg13680

agatatatcatgcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcaga13740

ccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctg13800

cttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctacc13860

aactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttct13920

agtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgc13980

tctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggtt14040

ggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtg14100

cacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagct14160

atgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcag14220

ggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatag14280

tcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggg14340

gcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctg14400

gccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattac14460

cgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagt14520

gagcgaggaagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtat14580

ttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagcca14640

gtatacactccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaaca14700

cccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtg14760

accgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagg14820

cagggtgccttgatgtgggcgccggcggtcgagtggcgacggcgcggcttgtccgcgccc14880

tggtagattgcctggccgtaggccagccatttttgagcggccagcggccgcgataggccg14940

acgcgaagcggcggggcgtagggagcgcagcgaccgaagggtaggcgctttttgcagctc15000

ttcggctgtgcgctggccagacagttatgcacaggccaggcgggttttaagagttttaat15060

aagttttaaagagttttaggcggaaaaatcgccttttttctcttttatatcagtcactta15120

catgtgtgaccggttcccaatgtacggctttgggttcccaatgtacgggttccggttccc15180

aatgtacggctttgggttcccaatgtacgtgctatccacaggaaagagaccttttcgacc15240

tttttcccctgctagggcaatttgccctagcatctgctccgtacattaggaaccggcgga15300

tgcttcgccctcgatcaggttgcggtagcgcatgactaggatcgggccagcctgccccgc15360

ctcctccttcaaatcgtactccggcaggtcatttgacccgatcagcttgcgcacggtgaa15420

acagaacttcttgaactctccggcgctgccactgcgttcgtagatcgtcttgaacaacca15480

tctggcttctgccttgcctgcggcgcggcgtgccaggcggtagagaaaacggccgatgcc15540

gggatcgatcaaaaagtaatcggggtgaaccgtcagcacgtccgggttcttgccttctgt15600

gatctcgcggtacatccaatcagctagctcgatctcgatgtactccggccgcccggtttc15660

gctctttacgatcttgtagcggctaatcaaggcttcaccctcggataccgtcaccaggcg15720

gccgttcttggccttcttcgtacgctgcatggcaacgtgcgtggtgtttaaccgaatgca15780

ggtttctaccaggtcgtctttctgctttccgccatcggctcgccggcagaacttgagtac15840

gtccgcaacgtgtggacggaacacgcggccgggcttgtctcccttcccttcccggtatcg15900

gttcatggattcggttagatgggaaaccgccatcagtaccaggtcgtaatcccacacact15960

ggccatgccggccggccctgcggaaacctctacgtgcccgtctggaagctcgtagcggat16020

cacctcgccagctcgtcggtcacgcttcgacagacggaaaacggccacgtccatgatgct16080

gcgactatcgcgggtgcccacgtcatagagcatcggaacgaaaaaatctggttgctcgtc16140

gcccttgggcggcttcctaatcgacggcgcaccggctgccggcggttgccgggattcttt16200

gcggattcgatcagcggccgcttgccacgattcaccggggcgtgcttctgcctcgatgcg16260

ttgccgctgggcggcctgcgcggccttcaacttctccaccaggtcatcacccagcgccgc16320

gccgatttgtaccgggccggatggtttgcgaccgtcacgccgattcctcgggcttggggg16380

ttccagtgccattgcagggccggcagacaacccagccgcttacgcctggccaaccgcccg16440

ttcctccacacatggggcattccacggcgtcggtgcctggttgttcttgattttccatgc16500

cgcctcctttagccgctaaaattcatctactcatttattcatttgctcatttactctggt16560

agctgcgcgatgtattcagatagcagctcggtaatggtcttgccttggcgtaccgcgtac16620

atcttcagcttggtgtgatcctccgccggcaactgaaagttgacccgcttcatggctggc16680

gtgtctgccaggctggccaacgttgcagccttgctgctgcgtgcgctcggacggccggca16740

cttagcgtgtttgtgcttttgctcattttctctttacctcattaactcaaatgagttttg16800

atttaatttcagcggccagcgcctggacctcgcgggcagcgtcgccctcgggttctgatt16860

caagaacggttgtgccggcggcggcagtgcctgggtagctcacgcgctgcgtgatacggg16920

actcaagaatgggcagctcgtacccggccagcgcctcggcaacctcaccgccgatgcgcg16980

tgcctttgatcgcccgcgacacgacaaaggccgcttgtagccttccatccgtgacctcaa17040

tgcgctgcttaaccagctccaccaggtcggcggtggcccatatgtcgtaagggcttggct17100

gcaccggaatcagcacgaagtcggctgccttgatcgcggacacagccaagtccgccgcct17160

ggggcgctccgtcgatcactacgaagtcgcgccggccgatggccttcacgtcgcggtcaa17220

tcgtcgggcggtcgatgccgacaacggttagcggttgatcttcccgcacggccgcccaat17280

cgcgggcactgccctggggatcggaatcgactaacagaacatcggccccggcgagttgca17340

gggcgcgggctagatgggttgcgatggtcgtcttgcctgacccgcctttctggttaagta17400

cagcgataaccttcatgcgttccccttgcgtatttgtttatttactcatcgcatcatata17460

cgcagcgaccgcatgacgcaagctgttttactcaaatacacatcacctttttagacggcg17520

gcgctcggtttcttcagcggccaagctggccggccaggccgccagcttggcatcagacaa17580

accggccaggatttcatgcagccgcacggttgagacgtgcgcgggcggctcgaacacgta17640

cccggccgcgatcatctccgcctcgatctcttcggtaatgaaaaacggttcgtcctggcc17700

gtcctggtgcggtttcatgcttgttcctcttggcgttcattctcggcggccgccagggcg17760

tcggcctcggtcaatgcgtcctcacggaaggcaccgcgccgcctggcctcggtgggcgtc17820

acttcctcgctgcgctcaagtgcgcggtacagggtcgagcgatgcacgccaagcagtgca17880

gccgcctctttcacggtgcggccttcctggtcgatcagctcgcgggcgtgcgcgatctgt17940

gccggggtgagggtagggcgggggccaaacttcacgcctcgggccttggcggcctcgcgc18000

ccgctccgggtgcggtcgatgattagggaacgctcgaactcggcaatgccggcgaacacg18060

gtcaacaccatgcggccggccggcgtggtggtgtcggcccacggctctgccaggctacgc18120

aggcccgcgccggcctcctggatgcgctcggcaatgtccagtaggtcgcgggtgctgcgg18180

gccaggcggtctagcctggtcactgtcacaacgtcgccagggcgtaggtggtcaagcatc18240

ctggccagctccgggcggtcgcgcctggtgccggtgatcttctcggaaaacagcttggtg18300

cagccggccgcgtgcagttcggcccgttggttggtcaagtcctggtcgtcggtgctgacg18360

cgggcatagcccagcaggccagcggcggcgctcttgttcatggcgtaatgtctccggttc18420

tagtcgcaagtattctactttatgcgactaaaacacgcgacaagaaaacgccaggaaaag18480

ggcagggcggcagcctgtcgcgtaacttaggacttgtgcgacatgtcgttttcagaagac18540

ggctgcactgaacgtcagaagccgactgcactatagcagcggaggggttggatcaaagta18600

ctttgatcccgaggggaaccctgtggttggcatgcacatacaaatggacgaacggataaa18660

ccttttcacgcccttttaaatatccgttattctaa18695

<210>12

<211>18695

<212>dna

<213>人工序列

<220>

<223>2409的完整核苷酸序列。

<400>12

taaacgctcttttctcttaggtttacccgccaatatatcctgtcaaacactgatagttta60

aactgaaggcgggaaacgacaatctgatccaagctcaagctccaatacgcaaaccgcctc120

tccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaag180

cgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctt240

tacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcaca300

caggaaacagctatgaccatgattacgaatttcaggtgactgatagtgacctgttcgttg360

caacaaattgatgagcaatgcttttttataatgccaactttgtacaaaaaagcaggcggc420

gcgtcctgcaggatagggataacagggtaatggcgcgccaagcttatcgataccgtcgac480

ctcgagcggccgccagtgtgatggatatctgcagaattgcccttcgaagggacaaaaaaa540

gcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgcta600

tttctagctctaaaacgcccagttggaatgtaggtgcaacacaagcgacagcgcgcgggt660

ttataagttggtcgcgttcgagttagctgggcaatgtggtactaaactgttcctcccgcc720

tctcgcgctcacactcgccctgtgggccgctcaccgtgcacgtacttgggcctcccgctc780

ccccgcatgcatccagcccatcacagcgaagagaatcgggcttttcttctccccatctcc840

ctacacaaccaccaaatacagccaggccgttggttcatgatccaagggcaattccagcac900

actggcggccgttactagtggatccgagctcggtaccttaattaaattaccctgttatcc960

ctatcctgcaggattaacacccaacttttctatccaagcttgccaacatggtggagcacg1020

acactctcgtctactccaagaatatcaaagatacagtctcagaagaccaaagggctattg1080

agacttttcaacaaagggtaatatcgggaaacctcctcggattccattgcccagctatct1140

gtcacttcatcaaaaggacagtagaaaaggaaggtggcacctacaaatgccatcattgcg1200

ataaaggaaaggctatcgttcaagatgcctctgccgacagtggtcccaaagatggacccc1260

cacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtgg1320

attgatgtgataacatggtggagcacgacactctcgtctactccaagaatatcaaagata1380

cagtctcagaagaccaaagggctattgagacttttcaacaaagggtaatatcgggaaacc1440

tcctcggattccattgcccagctatctgtcacttcatcaaaaggacagtagaaaaggaag1500

gtggcacctacaaatgccatcattgcgataaaggaaaggctatcgttcaagatgcctctg1560

ccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacg1620

ttccaaccacgtcttcaaagcaagtggattgatgtgatatctccactgacgtaagggatg1680

acgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttcatt1740

tggagaggccggtctagagaattccaagcaacgaactgcgagtgattcaagaaaaaagaa1800

aacctgagctttcgatctctacggagtggtttcttgttctttgaaaaagagggggattac1860

atatggctcctaagaagaagcggaaggttggtattcacggggtgcctgcggctatggaca1920

agaagtactcgatcgggctggccatcggaacaaattctgtaggctgggctgtaataaccg1980

atgagtacaaggtgccctctaaaaaatttaaggtccttggcaatacggatagacattcca2040

taaagaagaatcttatcggtgcgctgctctttgacagcggcgagaccgcggaggcgaccc2100

ggttgaaacgcaccgcgagacgccgttacacaaggcgtaagaatagaatctgttatctcc2160

aggagatattctctaatgaaatggcgaaggtagacgattccttctttcaccgtctggagg2220

aaagttttctcgttgaggaagataagaaacatgaaagacacccgatcttcggaaacattg2280

tcgacgaggtcgcttatcatgaaaagtaccctaccatctaccatcttagaaagaaacttg2340

ttgacagcacggataaggctgatctcaggctgatatacctggctctggcacatatgatta2400

agttcagagggcatttccttatcgaaggcgacctgaatccagataattcagatgtagaca2460

agctcttcattcaacttgtgcagacttataatcagctcttcgaagaaaatccaataaacg2520

cgtcgggtgtagacgcaaaggccatactgtccgctaggctttctaagtcacgtagacttg2580

agaatctcattgcccaactccccggcgagaagaagaacggcttgtttggaaatctgatag2640

cgctgtccctgggtcttacaccaaatttcaagagtaatttcgatttggcagaagatgcta2700

agttgcagctcagtaaagacacctacgatgacgatcttgataatttgttggctcagattg2760

gcgatcagtatgcagatcttttcttggccgctaagaatttgtctgatgcaattctgctta2820

gcgacattttgagggttaatacagaaatcaccaaggcacccttgtcggcgtcaatgataa2880

agaggtatgatgagcaccaccaagacctgacgctcctcaaggctcttgttcggcagcaat2940

tgccggagaagtacaaagagatcttcttcgaccagtctaagaacggatatgcgggctaca3000

tagacggtggagcgagtcaggaggaattctacaagttcataaagcccattctcgagaaga3060

tggatggtacggaagaactgcttgtgaaacttaacagagaagatcttttgcggaagcaga3120

gaactttcgacaacggaagtataccacaccagatacatctcggagagcttcatgctattc3180

tcagaagacaagaggatttctaccctttcttgaaggataacagagaaaagatagagaaga3240

tcctcacgtttaggatcccttactacgtaggtcctcttgctcgcggcaatagtaggttcg3300

cctggatgacccgcaagtctgaagaaactatcaccccttggaatttcgaagaggttgtag3360

acaaaggtgcttcagcacagagtttcattgagaggatgaccaacttcgacaagaacctcc3420

ccaacgaaaaggtcctgcctaagcacagcctcctctacgaatactttactgtctataatg3480

agcttacaaaagttaagtacgtgacagagggaatgcggaagcccgcattcctttccggag3540

aacaaaagaaggcgatcgtggatcttctcttcaagacgaaccgcaaggtgacggttaaac3600

agttgaaggaagattacttcaagaagatagaatgttttgatagcgtggaaatcagcggcg3660

tcgaagataggttcaacgcttccctgggaacgtaccacgatctcctcaagattatcaaag3720

ataaggactttcttgataacgaagagaatgaggacatcttggaagacattgttctgacgc3780

tcaccctgttcgaagatcgcgagatgattgaggaacgcttgaagacctacgcacacctgt3840

tcgatgacaaggttatgaagcaacttaaacggcgccggtatacgggctggggacggcttt3900

cgcggaagctgataaatggaatccgtgacaagcagtctggcaagacaatactcgacttct3960

tgaagtcggatggttttgccaatagaaattttatgcaactcattcatgatgactcgctta4020

cttttaaggaggacatccagaaggcccaggtatcaggacagggtgactctttgcacgaac4080

acatcgcgaacctggcgggctcccccgcgattaagaagggaattttgcagactgtcaagg4140

tggtcgatgaactcgtgaaggttatgggacgtcataagccggaaaatattgtgattgaga4200

tggctcgcgagaatcaaacaacacagaagggccaaaagaacagtagagaacgcatgaagc4260

gcatcgaagagggcatcaaagagctgggcagtcagatccttaaagaacatccagtcgaga4320

atacacagcttcagaacgaaaagctgtacctttattaccttcaaaatgggcgtgatatgt4380

atgtggatcaggaactcgatatcaataggctgagtgactatgatgtcgaccatatcgtcc4440

cgcaaagtttcctcaaggacgacagtatagacaacaaagttctcacacggtcagataaga4500

atcgcggcaagagcgataatgtaccgtcggaggaggtagtcaagaagatgaagaattact4560

ggcgccagttgctcaacgccaagctcatcactcagaggaaatttgacaaccttacgaaag4620

ccgagcggggcggactctctgaactggacaaggccggtttcataaagcgccagctcgttg4680

agacacgtcaaattactaagcacgtcgctcaaatattggattcccgcatgaatactaagt4740

acgatgagaatgataagctcatacgtgaagttaaggtcattactctcaagtccaagcttg4800

tatcggacttccgtaaggacttccaattctacaaggtccgggaaatcaataattatcacc4860

atgcccatgacgcttatctgaacgcggtcgtgggcacggcactcattaagaaatacccaa4920

aacttgagtcagaatttgtttacggggactataaagtttatgacgtgcggaagatgatag4980

cgaagtcggaacaagagataggaaaggcgactgcaaagtactttttttactccaacataa5040

tgaatttctttaagaccgaaataacccttgcaaacggtgaaatcagaaagcggcctctga5100

ttgaaacaaatggcgagacgggcgagatcgtctgggacaaggggagggacttcgcaacgg5160

ttcgcaaggtccttagcatgccgcaagtaaatatagttaagaagacggaagttcagaccg5220

gcggctttagtaaagaaagcatacttcctaaaaggaattccgacaaactgatagcgcgca5280

agaaggactgggatccaaagaagtatggaggatttgactccccaaccgttgcttatagcg5340

tgttggtagtagccaaggtggaaaagggtaagtctaagaaattgaagtcggtgaaggagt5400

tgttggggataactataatggagcggagttcgttcgagaagaacccaattgactttctcg5460

aagccaaaggctacaaggaggtcaagaaggacctgattattaagttgccaaagtactcgc5520

tcttcgaactcgagaacgggagaaagcgtatgctggcgtcggcgggcgagctgcagaaag5580

gaaacgagctggctttgccatcgaaatacgtaaatttcctgtacctcgcctcacattatg5640

agaagcttaaagggtctccagaagacaatgaacagaagcagctgtttgttgaacagcaca5700

agcactacttggacgagattatagaacaaatctccgagttctctaaacgggttatccttg5760

cagacgccaatttggataaggtcctctcggcttataataagcatagagataagccaatcc5820

gggagcaggctgaaaatatcatacacctctttacgttgactaatttgggtgcgccagcgg5880

cattcaagtacttcgatacaacaatcgatcgtaagcgctacacaagcactaaggaagtcc5940

tggacgcgacgctgatacaccagtccattactggactgtatgaaaccagaatagatctta6000

gccagctcggcggtgatggaggagggcctagggctgatcctaagaagaagaggaaggttg6060

gaggagggccaggagcagagtatgttagagcgttgtttgattttaacggtaacgatgaag6120

aggatttaccctttaagaaaggcgacattctcaggattagggataaacctgaagagcaat6180

ggtggaatgctgaggatagtgaaggcaaacgaggaatgattttagtgccgtatgtggaga6240

aatattcgggtgactacaaagatcatgatggtgattacaaagaccatgacatcgactaca6300

aggatgatgatgataagtcagggatgacagatgctgaatatgtcagaatccacgaaaagt6360

tggacatttacacgtttaagaagcagttcttcaacaacaagaaatctgtttcgcataggt6420

gctatgtgcttttcgaactaaaacgtcgtggagaaagacgggcttgcttttggggttacg6480

cggttaacaaaccacaatcaggtactgaacgaggaatacacgctgaaatcttttctatcc6540

gaaaggttgaggaatatctacgtgacaatcctggacagttcactatcaattggtattcta6600

gctggtcaccatgtgcagattgtgctgagaagattctcgaatggtacaatcaagagctta6660

gaggcaatggacatacattgaaaatatgggcatgcaagctctactacgaaaagaatgcca6720

gaaaccaaattgggctttggaacttgagggataatggagttgggcttaatgtcatggttt6780

ctgagcactatcaatgttgtcggaagatcttcatacaaagttcccataaccagttgaatg6840

agaacagatggttagagaaaacccttaaaagagccgagaagagaagatccgaactgagca6900

ttatgatacaggtcaaaattctgcataccactaagagtccagctgtaggtcctaagaaga6960

aacgtaaagtagggccctgatccaggcctcccagctttcgtccgtatcatcggtttcgac7020

aacgttcgtcaagttcaatgcatcagtttcattgcccacacaccagaatcctactaagtt7080

tgagtattatggcattggaaaagctgttttcttctatcatttgttctgcttgtaatttac7140

tgtgttctttcagtttttgttttcggacatcaaaatgcaaatggatggataagagttaat7200

aaatgatatggtccttttgttcattctcaaattattattatctgttgtttttactttaat7260

gggttgaatttaagtaagaaaggaactaacagtgtgatattaaggtgcaatgttagacat7320

ataaaacagtctttcacctctctttggttatgtcttgaattggtttgtttcttcacttat7380

ctgtgtaatcaagtttactatgagtctatgatcaagtaattatgcaatcaagttaagtac7440

agtataggcttgagctccctaggcccctaggtaattcttcggacccaagaatgctaagcc7500

aagaggagctgttatcgccgtcctcctgcttgtttctctctttttgttgctgtttcttca7560

ttagcgtggacaaagttttcaaccggcctatctgttatcattttcttctattcaaagact7620

gtaatacctattgctacctgtggttctcacttgtgattttggacacatatgttcggttta7680

ttcaaatttaatcagatgcctgatgagggtaccagaaaaaatacgtgttctggttgtttt7740

tgagttgcgattattctatgaaatgaataacatcgaagttatcatcccagtattttcgca7800

tgaatgttcttttcttctgtcttgtgcatcagtgatctagtgcatgggagtttgtattgt7860

gatgttcgacatcacgtaacttccactttgcctttgctgttcgatattttaatgacatgt7920

cacacacacttctgatacttttctttcttggctattgtgccagcatgatgcaagatgcat7980

cacagcatcagatatattctcatcgtcaggctttagcagcacacgagcacgctttgccgc8040

ttaaaagttgtacggcgcagcttagacatcccctgtagaagtgataatcttttcactttt8100

ccttaaacaaattgagaggggaaatggaaccatgtggatcagagaagcttttgtttcttt8160

acacaagaatatttggtacagtgggggtcctatgttcgtgggttcgtggcttggctgcct8220

gtcttcaaccaagtgttttcagttcaacatgttagcgtgtagaaagagcacaattctgtt8280

tatctccaaggtaaaatgtggcattctgttaaagaacatgatcctgccaattttttaagt8340

ttcaatggaagaggaatgtaaagctttctatggtttgtgtacacaacacagtggaagagg8400

agtgcaagctttctatggtttgtgtgcgcgttgtgtgtcagcacttcaattttgttagaa8460

aatgaaagaaaaaaaaggatgatcatgcttatagtaaatcactctttttcctcgccttct8520

gtacgttttgacttgacaagattttaaaatctgtacatgacctttgttttaaaattactt8580

tatgtatttccatctttcaagttatgcagatgtcatcacaaattgttacaccaatcacca8640

ggctggctgtttatatattatcagaccaggctatatagagtatactatactaactgttca8700

tattatctggaaatcttgcttgctacttgagcggtaaaagggtatagatatgagggtccc8760

cagattagccttttcaatttcagaaagaatgctaacccacagatggttagagaggcttac8820

gcagcaggtctcatcaagacgatctacccgagcaataatctccaggaaatcaaatacctt8880

cccaagaaggttaaagatgcagtcaaaagattcaggactaactgcatcaagaacacagag8940

aaagatatatttctcaagatcagaagtactattccagtatggacgattcaaggcttgctt9000

cacaaaccaaggcaagtaatagagattggagtctctaaaaaggtagttcccactgaatca9060

aaggccatggagtcaaagattcaaatagaggacctaacagaactcgccgtaaagactggc9120

gaacagttcatacagagtctcttacgactcaatgacaagaagaaaatcttcgtcaacatg9180

gtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctcagaagaccaa9240

agggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgc9300

ccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgc9360

catcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaa9420

gatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttca9480

aagcaagtggattgatgtgatatctccactgacgtaagggatgacgcacaatcccactat9540

ccttcgcaagacccttcctctatataaggaagttcatttcatttggagagaacacggggg9600

actctagaatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaa9660

agttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttca9720

gcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttct9780

acaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgc9840

ttgacattggggagtttagcgagagcctgacctattgcatctcccgccgttcacagggtg9900

tcacgttgcaagacctgcctgaaaccgaactgcccgctgttctacaaccggtcgcggagg9960

ctatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggac10020

cgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatcccc10080

atgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctc10140

tcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcgg10200

atttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactgga10260

gcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgt10320

ggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcag10380

gatcgccacgactccgggcgtatatgctccgcattggtcttgaccaactctatcagagct10440

tggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtcc10500

gatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctgga10560

ccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccga10620

gggcaaagaaataggagctctgggctaatctaaaacgatttatctgtggcttcaagtgta10680

tcgatcacttatgtgaggtgtaattactggtgtttttggtgtgctctggttcctttcaag10740

tgtgttgttgccgctcgaactactccgctatgtaaaacggtaaaacctgttgtctcatta10800

tgaaagtgaactatattatgttctactactactctacttagtcaattttcttcaccttga10860

ttagtgtaaatatgaatcttatattcttatgtcttaagaaattagcacatgtgaagcctc10920

caagtgcatattttctcgatcgcgagacgcacaatgcgtgagaaattcagctggttatac10980

tcaaatatattaatatatctagcagcagctcatggagattcaggaaacttggcatcccta11040

atccctaccatttccattcttccgagattgacagttcaatacaagtacagtaatctcctg11100

gtaagtttcttattaacttgacatgtagtagtaataatttgtacgtagcatagatacata11160

gacacaaaaatgtcctccccattgagctagccgattggagccgaacaccgcaggaatgaa11220

tttacataatctgcaaagaataaatggaatgtgcctccacaggaaaaccagcggcagtgt11280

ggcgttttcaagagcagccgtaagtcgaagcctattctgaatcgtagaaatcactggggc11340

atggtgtaattacatccgactccaacatctgtaccaccctgtgcattgtaggccgctcct11400

ctggcaaagaacttacacattgtttagcaagagaaagtagagcatccaaggtctcaatct11460

gcactccctcacaatatggatcgacaatttccctctcccgattctcaccgaccaggaaat11520

tcaactgccacagagcaagtagattatttcaagaatacattaaatcaattgaaggcatac11580

gtaattcatatcagaaaactgtggatatgaaatggaaggacataaaggtcatacataccc11640

atccaacaatgttcaatcccttttcaataaatgatgcatcagtaggtcgttttccgctta11700

gtatttcaagtagcaaaactccaaaactgtagacgtcagtcttttcggtggctctgccac11760

tttgcatatactcctgcaggtcgaccatagtgactggatatgttgtgttttacagtatta11820

tgtagtctgttttttatgcaaaatctaatttaatatattgatatttatatcattttacgt11880

ttctcgttcagctttcttgtacaaagtggtgatatcccgcggaaatacgtagaattcggg11940

aagcttggcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttaccca12000

acttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccg12060

caccgatcgcccttcccaacagttgcgcagcctgaatggcgaatgctagagcaattcggc12120

gttaattcagtacattaaaaacgtccgcaatgtgttattaagttgtctaagcgtcaattt12180

gtttacaccacaatatatcctgccaccagccagccaacagctccccgaccggcagctcgg12240

cacaaaatcaccactcgatacaggcagcccatcagtccgggacggcgtcagcgggagagc12300

cgttgtaaggcggcagactttgctcatgttaccgatgctattcggaagaacggcaactaa12360

gctgccgggtttgaaacacggatgatctcgcggagggtagcatgttgattgtaacgatga12420

cagagcgttgctgcctgtgatcaattcgggcacgaacccagtggacataagcctcgttcg12480

gttcgtaagctgtaatgcaagtagcgtaactgccgtcacgcaactggtccagaaccttga12540

ccgaacgcagcggtggtaacggcgcagtggcggttttcatggcttcttgttatgacatgt12600

ttttttggggtacagtctatgcctcgggcatccaagcagcaagcgcgttacgccgtgggt12660

cgatgtttgatgttatggagcagcaacgatgttacgcagcagggcagtcgccctaaaaca12720

aagttaaacatcatgggggaagcggtgatcgccgaagtatcgactcaactatcagaggta12780

gttggcgtcatcgagcgccatctcgaaccgacgttgctggccgtacatttgtacggctcc12840

gcagtggatggcggcctgaagccacacagtgatattgatttgctggttacggtgaccgta12900

aggcttgatgaaacaacgcggcgagctttgatcaacgaccttttggaaacttcggcttcc12960

cctggagagagcgagattctccgcgctgtagaagtcaccattgttgtgcacgacgacatc13020

attccgtggcgttatccagctaagcgcgaactgcaatttggagaatggcagcgcaatgac13080

attcttgcaggtatcttcgagccagccacgatcgacattgatctggctatcttgctgaca13140

aaagcaagagaacatagcgttgccttggtaggtccagcggcggaggaactctttgatccg13200

gttcctgaacaggatctatttgaggcgctaaatgaaaccttaacgctatggaactcgccg13260

cccgactgggctggcgatgagcgaaatgtagtgcttacgttgtcccgcatttggtacagc13320

gcagtaaccggcaaaatcgcgccgaaggatgtcgctgccgactgggcaatggagcgcctg13380

ccggcccagtatcagcccgtcatacttgaagctagacaggcttatcttggacaagaagaa13440

gatcgcttggcctcgcgcgcagatcagttggaagaatttgtccactacgtgaaaggcgag13500

atcaccaaggtagtcggcaaataatgtctagctagaaattcgttcaagccgacgccgctt13560

cgccggcgttaaatcaagcgattagatgcactaagcacataattgctcacagccaaacta13620

tcaggtcaagtctgcttttattatttttaagcgtgcataataagccctacacaaattggg13680

agatatatcatgcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcaga13740

ccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctg13800

cttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctacc13860

aactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttct13920

agtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgc13980

tctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggtt14040

ggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtg14100

cacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagct14160

atgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcag14220

ggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatag14280

tcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggg14340

gcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctg14400

gccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattac14460

cgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagt14520

gagcgaggaagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtat14580

ttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagcca14640

gtatacactccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaaca14700

cccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtg14760

accgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagg14820

cagggtgccttgatgtgggcgccggcggtcgagtggcgacggcgcggcttgtccgcgccc14880

tggtagattgcctggccgtaggccagccatttttgagcggccagcggccgcgataggccg14940

acgcgaagcggcggggcgtagggagcgcagcgaccgaagggtaggcgctttttgcagctc15000

ttcggctgtgcgctggccagacagttatgcacaggccaggcgggttttaagagttttaat15060

aagttttaaagagttttaggcggaaaaatcgccttttttctcttttatatcagtcactta15120

catgtgtgaccggttcccaatgtacggctttgggttcccaatgtacgggttccggttccc15180

aatgtacggctttgggttcccaatgtacgtgctatccacaggaaagagaccttttcgacc15240

tttttcccctgctagggcaatttgccctagcatctgctccgtacattaggaaccggcgga15300

tgcttcgccctcgatcaggttgcggtagcgcatgactaggatcgggccagcctgccccgc15360

ctcctccttcaaatcgtactccggcaggtcatttgacccgatcagcttgcgcacggtgaa15420

acagaacttcttgaactctccggcgctgccactgcgttcgtagatcgtcttgaacaacca15480

tctggcttctgccttgcctgcggcgcggcgtgccaggcggtagagaaaacggccgatgcc15540

gggatcgatcaaaaagtaatcggggtgaaccgtcagcacgtccgggttcttgccttctgt15600

gatctcgcggtacatccaatcagctagctcgatctcgatgtactccggccgcccggtttc15660

gctctttacgatcttgtagcggctaatcaaggcttcaccctcggataccgtcaccaggcg15720

gccgttcttggccttcttcgtacgctgcatggcaacgtgcgtggtgtttaaccgaatgca15780

ggtttctaccaggtcgtctttctgctttccgccatcggctcgccggcagaacttgagtac15840

gtccgcaacgtgtggacggaacacgcggccgggcttgtctcccttcccttcccggtatcg15900

gttcatggattcggttagatgggaaaccgccatcagtaccaggtcgtaatcccacacact15960

ggccatgccggccggccctgcggaaacctctacgtgcccgtctggaagctcgtagcggat16020

cacctcgccagctcgtcggtcacgcttcgacagacggaaaacggccacgtccatgatgct16080

gcgactatcgcgggtgcccacgtcatagagcatcggaacgaaaaaatctggttgctcgtc16140

gcccttgggcggcttcctaatcgacggcgcaccggctgccggcggttgccgggattcttt16200

gcggattcgatcagcggccgcttgccacgattcaccggggcgtgcttctgcctcgatgcg16260

ttgccgctgggcggcctgcgcggccttcaacttctccaccaggtcatcacccagcgccgc16320

gccgatttgtaccgggccggatggtttgcgaccgtcacgccgattcctcgggcttggggg16380

ttccagtgccattgcagggccggcagacaacccagccgcttacgcctggccaaccgcccg16440

ttcctccacacatggggcattccacggcgtcggtgcctggttgttcttgattttccatgc16500

cgcctcctttagccgctaaaattcatctactcatttattcatttgctcatttactctggt16560

agctgcgcgatgtattcagatagcagctcggtaatggtcttgccttggcgtaccgcgtac16620

atcttcagcttggtgtgatcctccgccggcaactgaaagttgacccgcttcatggctggc16680

gtgtctgccaggctggccaacgttgcagccttgctgctgcgtgcgctcggacggccggca16740

cttagcgtgtttgtgcttttgctcattttctctttacctcattaactcaaatgagttttg16800

atttaatttcagcggccagcgcctggacctcgcgggcagcgtcgccctcgggttctgatt16860

caagaacggttgtgccggcggcggcagtgcctgggtagctcacgcgctgcgtgatacggg16920

actcaagaatgggcagctcgtacccggccagcgcctcggcaacctcaccgccgatgcgcg16980

tgcctttgatcgcccgcgacacgacaaaggccgcttgtagccttccatccgtgacctcaa17040

tgcgctgcttaaccagctccaccaggtcggcggtggcccatatgtcgtaagggcttggct17100

gcaccggaatcagcacgaagtcggctgccttgatcgcggacacagccaagtccgccgcct17160

ggggcgctccgtcgatcactacgaagtcgcgccggccgatggccttcacgtcgcggtcaa17220

tcgtcgggcggtcgatgccgacaacggttagcggttgatcttcccgcacggccgcccaat17280

cgcgggcactgccctggggatcggaatcgactaacagaacatcggccccggcgagttgca17340

gggcgcgggctagatgggttgcgatggtcgtcttgcctgacccgcctttctggttaagta17400

cagcgataaccttcatgcgttccccttgcgtatttgtttatttactcatcgcatcatata17460

cgcagcgaccgcatgacgcaagctgttttactcaaatacacatcacctttttagacggcg17520

gcgctcggtttcttcagcggccaagctggccggccaggccgccagcttggcatcagacaa17580

accggccaggatttcatgcagccgcacggttgagacgtgcgcgggcggctcgaacacgta17640

cccggccgcgatcatctccgcctcgatctcttcggtaatgaaaaacggttcgtcctggcc17700

gtcctggtgcggtttcatgcttgttcctcttggcgttcattctcggcggccgccagggcg17760

tcggcctcggtcaatgcgtcctcacggaaggcaccgcgccgcctggcctcggtgggcgtc17820

acttcctcgctgcgctcaagtgcgcggtacagggtcgagcgatgcacgccaagcagtgca17880

gccgcctctttcacggtgcggccttcctggtcgatcagctcgcgggcgtgcgcgatctgt17940

gccggggtgagggtagggcgggggccaaacttcacgcctcgggccttggcggcctcgcgc18000

ccgctccgggtgcggtcgatgattagggaacgctcgaactcggcaatgccggcgaacacg18060

gtcaacaccatgcggccggccggcgtggtggtgtcggcccacggctctgccaggctacgc18120

aggcccgcgccggcctcctggatgcgctcggcaatgtccagtaggtcgcgggtgctgcgg18180

gccaggcggtctagcctggtcactgtcacaacgtcgccagggcgtaggtggtcaagcatc18240

ctggccagctccgggcggtcgcgcctggtgccggtgatcttctcggaaaacagcttggtg18300

cagccggccgcgtgcagttcggcccgttggttggtcaagtcctggtcgtcggtgctgacg18360

cgggcatagcccagcaggccagcggcggcgctcttgttcatggcgtaatgtctccggttc18420

tagtcgcaagtattctactttatgcgactaaaacacgcgacaagaaaacgccaggaaaag18480

ggcagggcggcagcctgtcgcgtaacttaggacttgtgcgacatgtcgttttcagaagac18540

ggctgcactgaacgtcagaagccgactgcactatagcagcggaggggttggatcaaagta18600

ctttgatcccgaggggaaccctgtggttggcatgcacatacaaatggacgaacggataaa18660

ccttttcacgcccttttaaatatccgttattctaa18695

<210>13

<211>35

<212>dna

<213>人工序列

<220>

<223>引物

<400>13

atgcatcctgcaggctctagaggatcccccctcag35

<210>14

<211>35

<212>dna

<213>人工序列

<220>

<223>引物

<400>14

agccgggcggccgctttacttgtacagctcgtcca35

<210>15

<211>30

<212>dna

<213>人工序列

<220>

<223>引物

<400>15

atgaaaaagcctgaactcaccgcgacgtct30

<210>16

<211>30

<212>dna

<213>人工序列

<220>

<223>引物

<400>16

cctcgctccagtcaatgaccgctgttatgc30

<210>17

<211>45

<212>dna

<213>人工序列

<220>

<223>引物

<400>17

agtccctgcaggttaattaacttgcgctgcgtttgtgcgggtgcg45

<210>18

<211>47

<212>dna

<213>人工序列

<220>

<223>引物

<400>18

tgacggtaccactagttagtagtacccaataagatcgaccgaagaga47

<210>19

<211>30

<212>dna

<213>人工序列

<220>

<223>引物

<400>19

ccgtaagaaccaccagcgacaccacgtcct30

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1