孤雌生殖单倍体诱导基因DMP及其应用的制作方法

文档序号:23092177发布日期:2020-11-27 12:46阅读:259来源:国知局
孤雌生殖单倍体诱导基因DMP及其应用的制作方法
本发明涉及以基因组编辑技术为主的农业生物
技术领域
和作物遗传育种领域,具体涉及一种植物母本单倍体诱导系的制备方法及其应用,特别涉及一种利用基因编辑技术得到的孤雌生殖单倍体诱导基因dmp突变体作为植物单倍体诱导系在诱导植物产生母本单倍体中的应用。
背景技术
:优良自交系的选育是作物利用杂种优势、选育优良杂交种的基础和关键。但传统选育方法需要7~8个世代才能获得较为稳定的自交系,而单倍体育种技术只需2个世代(weberdf,2014),大大缩短了育种的周期。目前,在双子叶作物上单倍体的产生主要依靠的还是花药离体培养,效率低下且对材料的基因型依赖性较高,很难实现规模化的应用。虽然将遗传修饰的着丝粒特异组蛋白cenh3(centromere-specifichistone3variant)导入拟南芥cenh3突变体中可诱导单倍体的产生,但该方式在诱导过程中产生大量的整倍体(ravi,m,etal,2010)。目前,基因编辑技术的体系已经非常成熟稳定,但受遗传转化对材料和基因型依赖的限制而无法进一步发挥其最大的作用。虽然可通过将基因编辑载体导入某个容易转化的受体材料中,进一步将其与需要编辑的目标杂交而实现编辑(licetal.,2017),但需要经过长时间的回交才能将背景恢复且不能达到100%。将单倍体诱导与基因编辑技术结合实现了对目标材料单倍体基因的编辑而获得纯合的编辑系,极大缩短了及扩宽了单倍体和基因编辑技术的应用范围(kelliher,tetal.,2019;wang,betal.,2019;hu,netal.,2019)。然而,在双子叶植物中由于生物诱导产生单倍体方式的欠缺而无法与基因编辑技术进行结合。技术实现要素:本发明的目的是提供一种植物单倍体诱导系的制备方法。本发明提供的植物单倍体诱导系的制备方法包括如下步骤:沉默或抑制植物基因组中dmp基因的表达和/或活性或敲除dmp基因,得到转基因植物,即为植物单倍体诱导系;所述植物为双子叶植物;所述dmp基因编码的蛋白质为如下(1)或(2)或(3)或(4)所示的蛋白质:(1)氨基酸序列是序列2或序列4或序列6所示的蛋白质;(2)在序列2或序列4或序列6所示的蛋白质的n端和/或c端连接标签得到的融合蛋白质;(3)将序列2或序列4或序列6所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;(4)与序列2或序列4或序列6所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质。上述植物单倍体诱导系的制备方法中,所述双子叶植物为拟南芥时,所述dmp基因为atdmp8基因和/或atdmp9基因;所述方法为沉默或抑制拟南芥基因组中atdmp8基因和/或atdmp9基因的表达和/或活性或敲除atdmp8基因和/或atdmp9基因,得到转基因拟南芥,即为拟南芥单倍体诱导系;所述双子叶植物为番茄时,所述dmp基因为sldmp基因;所述方法为沉默或抑制番茄基因组中sldmp基因或敲除sldmp基因,得到转基因番茄,即为番茄单倍体诱导系。上述植物单倍体诱导系的制备方法中,所述沉默或抑制拟南芥基因组中atdmp8基因和/或atdmp9基因的表达和/或活性或敲除atdmp8基因和/或atdmp9基因为使拟南芥基因组中atdmp8基因和/或atdmp9基因表达量降低或使拟南芥基因组中atdmp8基因和/或atdmp9基因发生缺失突变或插入突变或碱基替换;所述沉默或抑制番茄基因组中sldmp基因的表达和/或活性或敲除sldmp基因为使番茄基因组中sldmp基因表达量降低或使番茄基因组中sldmp基因发生缺失突变或插入突变或碱基替换。所述使植物基因组中dmp基因表达量降低的方式可为rnai干扰或过表达或启动子编辑。所述rnai干扰可为单链rna干扰,如mirna,也可为双链rna干扰,如sirna、dsrna、shrna等。所述使植物基因组中dmp基因发生缺失突变或插入突变或碱基替换的方式可为crispr/cas9或tellen或t-dna插入或ems诱变。进一步的,所述使植物基因组中dmp基因发生缺失突变或插入突变或碱基替换的方式为crispr/cas9。更进一步的,所述拟南芥中,所述crispr/cas9的靶序列为序列1第98-117位、序列3第290-309位、序列3第368-387位和序列1第509-528位。所述番茄中,所述crispr/cas9的靶序列为序列5第76-95位和序列5第247-266位。在本发明的具体实施例中,所述使植物基因组中dmp基因发生缺失突变或插入突变或碱基替换的方法包括如下步骤:将含有所述靶序列的crispr/cas9载体导入植物中,得到转基因植物。所述植物为拟南芥时,所述含有所述靶序列的crispr/cas9载体为将序列7所示的dna分子(sgrna表达元件)、序列9所示的dna分子(cas9表达元件)和序列10所示的dna分子(荧光蛋白表达元件)通过goldengate的方法连接到picsl4723载体后得到的重组载体。所述植物为番茄时,所述含有所述靶序列的crispr/cas9载体为将序列8所示的dna分子(sgrna表达元件)、序列11所示的dna分子(cas9表达元件)、序列10所示的dna分子(荧光蛋白表达元件)和序列12所示的dna分子(nptii表达元件)通过goldengate的方法连接到picsl4723载体后得到的重组载体。上述植物单倍体诱导系的制备方法还包括筛选dmp基因突变体的步骤。本发明的另一个目的是提供一种植物单倍体的制备方法。本发明提供的植物单倍体的制备方法包括如下步骤:将由上述方法制备的植物单倍体诱导系或其后代进行自交或者作为父本与其他植物材料杂交,得到自交后代或杂交后代,即为所述植物单倍体;所述植物为双子叶植物。进一步的,上述植物单倍体的制备方法还包括如下步骤:将所述自交后代或所述杂交后代单株进行荧光标记鉴定和/或单倍体性状鉴定和/或叶片倍性鉴定和/或分子标记鉴定,选取至少一种方法鉴定为单倍体的后代单株为植物单倍体。更进一步的,所述荧光标记鉴定方法可按照如下方法进行:在含有所述靶序列的crispr/cas9载体上携带荧光蛋白表达元件(如启动子atoleo1驱动tagrfp(entacmaeaquadricolor)的表达元件),通过荧光灯对待测植株的荧光信号进行观察:若待测植株无荧光或弱荧光,则该植株为或候选为单倍体;若待测植株表现出相应荧光,则该植株为或候选为二倍体。所述单倍体性状鉴定方法可按照如下方法进行:若待测植株具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,则该植株为或候选为单倍体;若待测植株具有植株高大,叶片宽大,披散,育性正常等特征,则该植株为或候选为二倍体。所述叶片倍性鉴定方法可按照如下方法进行:提取待测植株幼嫩叶片的细胞核,以二倍体植物叶片作为对照;再用流式细胞仪器检测信号,首先检测二倍体细胞核信号,并将二倍体细胞核信号峰位设为50(由于二倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在25附近出现)。若待测植株细胞核信号峰出现在25附近,则该植株为或候选为单倍体;若待测植株的信号峰出现在50附近,其与二倍体细胞核信号强度富集位置相同,则该植株为或候选为二倍体。所述分子标记鉴定可按照如下方法进行:采用父本(母本单倍体诱导系)和母本间多态性引物进行pcr扩增,根据pcr扩增产物判断待测植株为单倍体还是二倍体:若待测植株的扩增产物仅具有母本的带型,不存在父本的带型,则该植株为或候选为单倍体;若待测植株的扩增产物具有父本和母本的杂合带型,则该植株为或候选为二倍体。如下1)-5)任一种应用也属于本发明的保护范围:1)由上述方法制备得到的植物单倍体诱导系在培育植物单倍体中的应用;2)沉默或抑制植物基因组中atdmp8基因和/或atdmp9基因的表达和/或活性或敲除atdmp8基因和/或atdmp9基因的物质在培育植物单倍体诱导系或培育植物单倍体中的应用;3)沉默或抑制植物基因组中sldmp基因的表达和/或活性或敲除sldmp基因的物质在培育植物单倍体诱导系或植物单倍体中的应用;4)atdmp8蛋白质或其相关生物材料和/或atdmp9蛋白质或其相关生物材料在调控植物单倍体诱导系的诱导率或提高植物单倍体诱导系的诱导率或培育植物单倍体诱导系或植物单倍体中的应用;5)sldmp蛋白质或其相关生物材料在调控植物单倍体诱导系的诱导率或提高植物单倍体诱导系的诱导率或培育植物单倍体诱导系或植物单倍体中的应用。上述任一所述的应用或方法中,所述atdmp8蛋白质是如下a1)或a2)或a3)或a4)所示的蛋白质:a1)氨基酸序列是序列2所示的蛋白质;a2)在序列2所示的蛋白质的n端和/或c端连接标签得到的融合蛋白质;a3)将序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;a4)与序列2所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质;所述atdmp9蛋白质是如下b1)或b2)或b3)或b4)所示的蛋白质:b1)氨基酸序列是序列4所示的蛋白质;b2)在序列4所示的蛋白质的n端和/或c端连接标签得到的融合蛋白质;b3)将序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;b4)与序列4所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质。所述sldmp蛋白质是如下c1)或c2)或c3)或c4)所示的蛋白质:c1)氨基酸序列是序列6所示的蛋白质;c2)在序列6所示的蛋白质的n端和/或c端连接标签得到的融合蛋白质;c3)将序列6所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;c4)与序列6所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质。所述atdmp8蛋白质或atdmp9蛋白质或sldmp蛋白质相关生物材料为下述a1)至a12)中的任一种:a1)编码所述atdmp8蛋白质或atdmp9蛋白质或sldmp蛋白质的核酸分子;a2)含有a1)所述核酸分子的表达盒;a3)含有a1)所述核酸分子的重组载体;a4)含有a2)所述表达盒的重组载体;a5)含有a1)所述核酸分子的重组微生物;a6)含有a2)所述表达盒的重组微生物;a7)含有a3)所述重组载体的重组微生物;a8)含有a4)所述重组载体的重组微生物;a9)含有a1)所述核酸分子的转基因植物细胞系;a10)含有a2)所述表达盒的转基因植物细胞系;a11)含有a3)所述重组载体的转基因植物细胞系;a12)含有a4)所述重组载体的转基因植物细胞系。进一步的,a1)所述核酸分子为如下b1)或b2)或b3)所示的基因:b1)其编码序列是序列1或序列3或序列5所示的cdna分子或基因组dna分子;b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述atdmp8蛋白质或atdmp9蛋白质或sldmp蛋白质的cdna分子或基因组dna分子;b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述atdmp8蛋白质或atdmp9蛋白质或sldmp蛋白质的cdna分子或基因组dna分子。其中,序列1为编码atdmp8蛋白质的核酸分子,序列3为编码atdmp9蛋白质的核酸分子,序列5为编码sldmp蛋白质的核酸分子。更进一步的,所述敲除atdmp8基因和/或atdmp9基因的物质或所述敲除sldmp基因的物质为上述含有所述靶序列的crispr/cas9载体。上述任一所述的应用或方法中,所述植物为双子叶植物;所述双子叶植物具体可为拟南芥或番茄;所述拟南芥具体可为野生型拟南芥(col-0)或ms1;所述番茄具体可为野生型番茄ac或micro-tom或由番茄ac和micro-tom杂交获得的f1代材料。本发明从拟南芥中克隆了孤雌生殖单倍体诱导基因atdmp8和atdmp9。实验证明,atdmp8和atdmp9的突变能够产生孤雌生殖单倍体诱导能力,这使得孤雌生殖方式诱导产生单倍体的应用向双子叶作物上延伸。本发明又进一步在番茄中进行了验证,在番茄中同样发现sldmp的突变能够产生孤雌生殖单倍体诱导能力。本发明为拓宽单倍体育种技术在双子叶植物上应用及揭示孤雌生殖单倍体产生的生物学机理奠定了重要的基础。鉴于目前育种行业中单倍体育种技术利用的广泛性,本发明具有十分广泛的应用空间和市场前景。附图说明图1为拟南芥单倍体和二倍体对比图。箭头所指的植株为单倍体。图2为拟南芥单倍体和二倍体抽薹后对比图。图3为拟南芥单倍体和二倍体流式细胞结果对比图。图4为拟南芥单倍体荧光鉴别图。图a为拟南芥种子在白光下的表型,图b为拟南芥种子在荧光下的表型,箭头所指的种子为单倍体。图5为拟南芥单倍体和二倍体的分子标记验证胶图。m为2k分子标记,i为母本材料带型,ii为父本材料带型,iii为单倍体带型,iv为二倍体带型。图6为野生型番茄和sldmp突变体的植株与果实对比图。图a,b分别为野生型番茄和sldmp突变体植株,图c,d分别为野生型番茄和sldmp突变体自交果实。图7为番茄种子荧光表达图。图a,b分别为在明场下拍摄番茄种子未发芽与发芽的表现,图c,d分别为荧光下拍摄番茄种子未发芽与发芽的表现。图8为番茄单倍体和二倍体流式细胞结果对比图。图9为重组载体中主要元件的结构示意图。图a,b分别为拟南芥和番茄的载体结构示意图。具体实施方式以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。下述实施例中的picsl4723载体记载于文献“castel,b.andl.tomlinson,etal.(2019).optimizationoft-dnaarchitectureforcas9-mediatedmutagenesisinarabidopsis.plosone,14(1).”中,公众可从中国农业大学获得,该试验材料只为重复本发明的相关实验所用,不可作为其它用途使用。下述实施例中的野生型拟南芥col-0和ms1均记载于文献“rosso,m.g.andy.li,etal.(2003).anarabidopsisthalianat-dnamutagenizedpopulation(gabi-kat)forflankingsequencetag-basedreversegenetics.plantmolbiol53(1-2):247-59.”中,公众可从中国农业大学获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。下述实施例中的野生型番茄ac记载于文献“yuan,g.andc.jia,etal.(2010).effectofbrassinosteroidsondroughtresistanceandabscisicacidconcentrationintomatounderwaterstress.scientiahorticulturae126(2):103-108.”中,公众可从中国农业大学获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。下述实施例中的野生型番茄micro-tom记载于文献“sun,h.ands.uchii,etal.(2006).ahighlyefficienttransformationprotocolformicro-tom,amodelcultivarfortomatofunctionalgenomics.plantandcellphysiology47(3):426-431.”中,公众可从中国农业大学获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。本发明中的atdmp8基因的cds序列如序列表中序列1第95-826位所示,atdmp8基因编码的蛋白的氨基酸序列如序列2所示。本发明中的atdmp9基因的cds序列如序列表中序列3第141-875位所示,atdmp9基因编码的蛋白的氨基酸序列如序列4所示。本发明中的sldmp基因的cds序列如序列表中序列5第1-678位所示,sldmp基因编码的蛋白的氨基酸序列如序列6所示。实施例1、atdmp8和/或atdmp9基因敲除的拟南芥突变体的制备及其应用一、利用crispr/cas9系统敲除atdmp8和/或atdmp9基因利用crispr/cas9系统敲除拟南芥中的atdmp8和/或atdmp9基因,获得atdmp8和/或atdmp9基因敲除的拟南芥突变体。具体步骤如下:1、sgrna序列的选择分别在atdmp8和atdmp9基因上设计靶位点序列,长度为20bp。靶位点1位于序列1第98-117位,位于序列3第144-163位,sgrna靶位点1序列为gagaaaacagaggaaagcgt。靶位点2位于序列3第290-309位,sgrna靶位点2序列为aagaggtcgaaaacgtcgca。靶位点3位于序列3第368-387位,sgrna靶位点3序列为tcaagagtgttcctgtcgga。靶位点4位于序列1第509-528位,位于序列3第558-577位,sgrna靶位点4序列为atgaacaccgcgagtccacg。2、crispr/cas9载体的构建crispr/cas9载体为将序列7所示的dna分子(sgrna表达元件)、序列9所示的dna分子(cas9表达元件)和序列10所示的dna分子(荧光蛋白表达元件)通过goldengate的方法连接到picsl4723载体后得到的重组载体(载体结构图如图9a所示)。序列7所示的dna分子依次包括靶向靶位点1的sgrna的编码序列、靶向靶位点2的sgrna的编码序列、靶向靶位点2的sgrna的编码序列、靶向靶位点4的sgrna的编码序列,每个sgrna的编码序列前均包括用于启动sgrna的编码序列表达的atu6-26启动子。3、转基因植株的获得将步骤2获得的crispr/cas9载体通过热激转化转至农杆菌感受态细胞gv3101(农杆菌gv3101感受态细胞购自北京奥森鼎信生物技术有限公司,公众可通过购买获得),得到重组菌gv3101/crispr/cas9。再将重组菌gv3101/crispr/cas9采用农杆菌侵染拟南芥花序的转化方法(重组农杆菌进行28℃扩繁,扩繁后的菌液用于拟南芥花序侵染)侵染野生型拟南芥col-0的花序,经过红色荧光筛选后获得t1代转基因拟南芥植株。4、atdmp8和/或atdmp9基因发生突变的转基因植株鉴定采集步骤3获得的t1代转基因拟南芥植株叶片,并提取基因组dna作为模板,采用如下两对引物分别进行pcr扩增,得到不同株系的pcr扩增产物。atdmp8突变序列检测引物的序列如下:dmp8f1:tgcgaaatgagattggttttggg;dmp8r1:aaacaccctgtgactctccg。atdmp9突变序列检测引物的序列如下:dmp9f1:ataaccgtcaataaccgccg;dmp9r2:ccagtcatgcaaccaacacc。将不同株系的pcr扩增产物进行sanger测序,并将测序结果与野生型拟南芥col-0的atdmp8和atdmp9分别进行比对。根据以下原则分别对atdmp8和atdmp9的基因型进行鉴定。自靶位点序列起具有双峰特征的序列,则该株系的基因型为杂合基因型(2条同源染色体中的1条染色体上的atdmp8和/或atdmp9基因突变,且另1条染色体上的atdmp8和/或atdmp9基因未突变),该株系为t1代转基因拟南芥杂合突变型株系;自靶位点序列起具有特异单峰特征的序列,若与野生型拟南芥col-0的atdmp8和atdmp9的基因序列相同,则该株系的基因型为野生型,即atdmp8和atdmp9基因序列没有发生突变;若与野生型拟南芥col-0的atdmp8和/或atdmp9的基因序列不同,则该株系的基因型为纯合基因型(2条同源染色体上的atdmp8和/或atdmp9基因均发生突变),该株系为t1代转基因拟南芥纯合突变型株系。鉴定结果如表1和2所示(表1,2分别为t1代转基因拟南芥的atdmp8和atdmp9基因突变情况):41株t1代转基因拟南芥植株中,33株t1代转基因植株的atdmp8基因发生突变,其中2株atdmp8基因发生纯合突变,17株atdmp8基因发生双等位突变。28株t1代转基因植株的atdmp9基因发生突变,其中5株atdmp9基因发生纯合突变,7株atdmp9基因发生双等位突变。atdmp8和atdmp9均发生纯合突变/双等位突变的有12株。进一步选择纯合突变/双等位突变单株中导致移码突变(缺失不是3的倍数)的单株进行表型鉴定。共有atdmp8纯合突变/双等位突变、atdmp9纯合突变/双等位突变、atdmp8和atdmp9均纯合突变/双等位突变这3种类型。表1、t1代转基因拟南芥的atdmp8基因突变类型表2、t1代转基因拟南芥的atdmp9基因突变类型获得的t1代转基因拟南芥atdmp8基因突变株系有t1-34,具体突变如下:经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t1代转基因拟南芥atdmp8基因突变株系t1-34的差异仅在于在编码atdmp8蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列1第115-512位;另一条染色体发生了一个碱基t的插入,该碱基t的插入位置位于序列1第114-115位之间。获得的t1代转基因拟南芥atdmp8和atdmp9基因双突变株系有t1-6、t1-11、t1-19、t1-24、t1-25、t1-28、t1-32,具体突变如下:经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t1代转基因拟南芥atdmp8和atdmp9基因双突变株系t1-6的差异仅在于在编码atdmp8蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列1第115-512位,另一条染色体发生了片段缺失,该缺失的片段位于序列1第113-114位,且在编码atdmp9蛋白的基因中发生了片段插入,该插入的片段的核苷酸序列为:gtttacacggcgactc,该片段的插入位置位于序列3第160-161位之间。经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t1代转基因拟南芥atdmp8和atdmp9基因双突变株系t1-11的差异仅在于在编码atdmp8蛋白的基因中发生了一个碱基t的插入,该碱基t的插入位置位于序列3第114-115位之间,且在编码atdmp9蛋白的基因中,一条染色体发生了碱基t插入,该碱基t的插入位置位于序列3第160-161位之间,另一条染色体发生片段插入,该插入的片段的核苷酸序列为:gtttacacggcgactc,该片段的插入位置位于序列3第160-161位之间。经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t1代转基因拟南芥atdmp8和atdmp9基因双突变株系t1-19的差异仅在于在编码atdmp8蛋白的基因中,一条染色体发生了一个碱基t的缺失,该缺失的碱基位于序列1第114位,另一条染色体发生了片段缺失,该缺失的片段位于序列1第115-511位,且在编码atdmp9蛋白的基因中,一条染色体发生了一个碱基t的缺失,该缺失的碱基位于序列1第114位,另一条染色体发生了片段缺失,该缺失的片段位于序列1第115-511位,在编码atdmp9蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列3第161-560位,另一条染色体发生了片段缺失,该缺失的片段位于序列3第161-564位。经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t1代转基因拟南芥atdmp8和atdmp9基因双突变株系t1-24的差异仅在于在编码atdmp8蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列1第115-512位,另一条染色体发生了一个碱基t的插入,该碱基t的插入位置位于序列1第114-115位之间;且在编码atdmp9蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列3第161-560位,另一条染色体发生了片段缺失,该缺失的片段位于序列3第159-160位。经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t1代转基因拟南芥atdmp8和atdmp9基因双突变株系t1-25的差异仅在于在编码atdmp8蛋白的基因中,一条染色体发生了一个碱基t的缺失,该缺失的碱基位于序列1第114位,另一条染色体发生了片段cgt的插入,该片段的插入位置位于序列1第114-115位之间;且在编码atdmp9蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列3第161-162位,另一条染色体发生了一个碱基a的插入,该碱基a的插入位置位于序列3第160-161位之间。经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t1代转基因拟南芥atdmp8和atdmp9基因双突变株系t1-28的差异仅在于在编码atdmp8蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列1第115-512位,另一条染色体发生了一个碱基t的缺失,该缺失的碱基位于序列1第114位;且在编码atdmp9蛋白的基因中发生了一个碱基a的插入,该碱基a的插入位置位于序列3第160-161位之间。经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t1代转基因拟南芥atdmp8和atdmp9基因双突变株系t1-32的差异仅在于在编码atdmp8蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列1第115-511位,另一条染色体发生了一个碱基t的插入,该碱基t的插入位置位于序列1第114-115位之间,且在编码atdmp9蛋白的基因中发生了碱基c的缺失,该缺失的碱基位于序列3第161位。5、t2代转基因拟南芥的基因型鉴定将步骤4获得的t1代转基因拟南芥atdmp8和/或atdmp9基因突变型株系t1-19、t1-33和t1-38自交,收获种子后再播种,得到t2代转基因拟南芥。鉴定t2代转基因拟南芥的atdmp8和atdmp9基因的基因型,具体方法如下:以t2代转基因拟南芥的基因组dna为模板,分别利用atdmp8(dmp8f1和dmp8r1)和atdmp9(dmp9f1和dmp9r2)的突变序列检测引物按照步骤4中的方法鉴定t2代转基因拟南芥atdmp8和atdmp9基因的基因型。获得的t2代转基因拟南芥atdmp8基因突变纯合型株系有t2-33-1、t2-33-2和t2-33-3,这3个株系的突变序列一样,具体突变如下:经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t2代转基因拟南芥atdmp8基因突变纯合型株系t2-33-1、t2-33-2和t2-33-3的差异仅在于在编码atdmp8蛋白的基因中发生了片段替换,该片段替换为将序列1第115-511位所示的片段替换为大小为202bp的片段。大小为202bp的片段的核苷酸序列具体如下:gaaattgacgagcattgatgtcttcgaaaccgttttttgaactcctttcgccaccatgcgacgttttctaccttttcctcctcccgcggcggctcctgccggaagcataggcagtgaagagagagggacaggtttgggcgaccgagacgatgttggtgacggattttgcgtcgttgtcgtcgtgtaaactctgattccgacg。获得的t2代转基因拟南芥atdmp9基因突变纯合型株系有t2-33-4、t2-33-5和t2-33-6,这3个株系的突变序列一样,具体突变如下:经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t2代转基因拟南芥atdmp9基因突变纯合型株系t2-33-4、t2-33-5和t2-33-6的差异仅在于在编码atdmp9蛋白的基因中发生了一个碱基t的插入,该碱基t的插入位置位于序列3第160-161位之间,且在编码atdmp9蛋白的基因中发生了片段插入,该插入的片段的核苷酸序列具体如下:cgtcggaatcagagtttacacggcgactccgccgcaaaaaccatcaccatcaccaccttctcgttcaccaaaacccgtcttaatctcttcattgccttccctcccgtcaggagccgccgctggaggaggaagaggtcgaaaacgtcgcatggtggcgcaaggagttcaaaaaacggtttcgaagacatcaatgctcgtcaacttccttccgacaggaacactcttgatgttcgaaatggttcttccatcaatataccgtgacggagactgtaacggaatcaacacactcatgattcatctcctcttgcttctttgcgcaatgtcttgtttcttcttccattttaccgacagtttcaaagcatccgatgggaagatctactacggtttcgtgacgccacgtg,该片段的插入位置位于序列3第561-562位之间。获得的t2代转基因拟南芥atdmp8和atdmp9基因突变纯合型株系有t2-19、t2-38-1和t2-38-2,且各个株系的突变类型如下:经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t2代转基因拟南芥atdmp8和atdmp9基因突变纯合型株系t2-19的差异仅在于在编码atdmp8蛋白的基因中发生了片段缺失,该缺失的片段位于序列1第115-511位,且在编码atdmp9蛋白的基因中发生了片段缺失,该缺失的片段位于序列3第161-564位。经测序鉴定表明:与野生型拟南芥col-0的基因组dna相比,t2代转基因拟南芥atdmp8和atdmp9基因突变纯合型株系t2-38-1和t2-38-2的差异仅在于在编码atdmp8蛋白的基因中发生了片段缺失,该缺失的片段位于序列1第115-127位,且在编码atdmp9蛋白的基因中两个位置发生了碱基t和碱基g的插入,分别位于序列3第160-161位之间和序列3第562-563位之间。选取以上t1和t2代转基因拟南芥突变株系用于下述单倍体诱导能力分析实验。二、atdmp8和/或atdmp9基因敲除的拟南芥突变体在诱导产生单倍体中的应用(一)atdmp8和atdmp9基因敲除的拟南芥突变体的单倍体自交诱导能力鉴定将atdmp8和atdmp9基因所获得3种类型突变体分别自交获得自交后代,通过如下方法对自交后代进行单倍体鉴别(由于野生拟南芥col为纯合的自交系,在此背景上敲除atdmp8和atdmp9基因所获得突变体自交后代无法通过分子标记去鉴定单倍体):1、植株表型鉴别将自交种子种植后,观察单株表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,二倍体则表现为植株高大,叶片宽大,披散,育性正常(图1、图2)。2、流式细胞检测叶片鉴别将上述步骤1中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以二倍体拟南芥叶片作为对照;再用流式细胞仪器检测信号,首先检测二倍体细胞核信号,并将二倍体细胞核信号峰位设为50(由于二倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在25附近出现)。若待测植株细胞核信号峰出现在25附近,则认为该待测植株为单倍体植株。若待测植株的信号峰出现在50附近,则认为其与二倍体细胞核信号强度富集位置相同,该待测植株为二倍体(图3)。统计上述鉴定结果并按照如下公式计算诱导率:诱导率(%)=(单倍体株数/总株数)×100。可以看出,atdmp8和atdmp9基因同时突变后,在自交后代中可获得单倍体。表3、dmp突变体自交后代中单倍体诱导率统计基因型植株编号总株数单倍体数单倍体诱导率(%)wtcol-052300dmp8t2-33-127000dmp9t2-33-418300dmp8dmp9t2-38-116563.64(二)atdmp8和atdmp9基因敲除的拟南芥突变体的单倍体杂交诱导能力鉴定将atdmp8和atdmp9基因所获得3种类型突变体分别与拟南芥ms1材料进行杂交获得杂交后代,通过如下方法对杂交后代中的单倍体进行鉴别:1、荧光标记鉴别crispr/cas9载体上携带启动子atoleo1驱动tagrfp(entacmaeaquadricolor)的表达元件。由于启动子atoleo1在成熟的种子胚中特异表达,可通过荧光灯对tagrfp的荧光信号进行观察。因此,用携带该表达元件的突变体为父本与其它不携带荧光的母本材料杂交,所得到的种子中,二倍体种子的胚由于具有父本的基因组而表现出强的红色荧光,而单倍体种子的胚由于来源于母本而表现为无荧光或弱荧光(图4)。2、分子标记鉴别将上述步骤1鉴定出的不具有荧光和具有弱荧光的种子进一步种植,提取其基因组dna,采用拟南芥ms1与atdmp8和atdmp9基因敲除的拟南芥突变体间多态性引物092b02-f(092b02-f:cagctgagatgaacgagttgtctt)、092b02-r(092b02-r:tcttttgagtcactccgtatgtcc)和lb-o8474(lb-o8474:ataataacgctgcggacatctacatttt)进行pcr扩增,并将扩增产物进行琼脂糖带型检测,若待测单株的扩增产物的大小为500bp,表现为1条带,认为该单株条带为拟南芥ms1带型,不存在父本材料的带型,则该单株是母本单倍体。若待测单株的扩增产物的大小为500bp和1094bp,表现为2条带,认为该单株条带为拟南芥ms1和转基因拟南芥突变株系杂合带型,则该单株是正常杂交的后代,是二倍体(图5)。3、成熟植株表型鉴别对上述步骤1和2鉴定出的植株进一步观察其表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,二倍体则表现为植株高大,叶片宽大,披散,育性正常。4、流式细胞检测叶片鉴别将上述步骤3中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以二倍体拟南芥叶片作为对照;再用流式细胞仪器检测信号,首先检测二倍体细胞核信号,并将二倍体细胞核信号峰位设为50(由于二倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在25附近出现)。若待测植株细胞核信号峰出现在25附近,则认为该待测植株为单倍体植株。若待测植株的信号峰出现在50附近,则认为其与二倍体细胞核信号强度富集位置相同,该待测植株为二倍体。统计上述鉴定结果并按照如下公式计算诱导率:诱导率(%)=(母本单倍体株数/总株数)×100。可以看出,atdmp8基因突变、atdmp9基因突变和atdmp8和atdmp9基因同时突变后与其他材料杂交,在后代中可获得母本单倍体。表4、dmp突变体杂交后代中单倍体诱导率统计实施例2、sldmp基因敲除的番茄突变体的制备及其应用一、利用crispr/cas9系统敲除sldmp基因利用crispr/cas9系统敲除番茄中的sldmp基因,获得sldmp基因敲除的番茄突变体。具体步骤如下:1、sgrna序列的选择在sldmp基因上设计靶位点序列,长度为20bp。靶位点1位于序列5第76-95位,sgrna靶位点1序列为tatcctactaatttaccaca。靶位点2位于序列5第247-266位,sgrna靶位点2序列为tctcctttaccaaatactga。2、crispr/cas9载体的构建crispr/cas9载体为将序列8所示的dna分子(sgrna表达元件)、序列11所示的dna分子(cas9表达元件)、序列10所示的dna分子(荧光蛋白表达元件)和序列12所示的dna分子(nptii表达元件)通过goldengate的方法连接到picsl4723载体后得到的重组载体(载体结构图如图9b所示)。序列8所示的dna分子依次包括靶向靶位点1的sgrna的编码序列、靶向靶位点2的sgrna的编码序列,每个sgrna的编码序列前均包括用于启动sgrna的编码序列表达的atu6-26启动子。3、转基因植株的获得将步骤2获得的crispr/cas9载体通过热激转化转至农杆菌感受态细胞gv3101(农杆菌gv3101感受态细胞购自北京奥森鼎信生物技术有限公司,公众可通过购买获得),得到重组菌gv3101/crispr/cas9。再将重组菌gv3101/crispr/cas9采用农杆菌侵染番茄子叶外植体的方法(重组农杆菌进行28℃扩繁,扩繁后的菌液用于番茄子叶外植体)侵染野生型番茄ac的子叶外植体,经过卡那抗性筛选后获得t0代转基因番茄植株。4、sldmp基因发生突变的转基因植株鉴定采集步骤3获得的t0代转基因番茄植株叶片,并提取基因组dna作为模板,采用如下引物进行pcr扩增,得到不同株系的pcr扩增产物。sldmp基因突变序列检测引物的序列如下:sldmpf2:actgcttaggatattaactgaccc;sldmpr1:ttttggcacatcgacaccaag。将不同株系的pcr扩增产物进行sanger测序,根据测序结果与野生型番茄ac的sldmp基因进行比对。根据以下原则对sldmp的基因型进行鉴定。自靶位点序列起具有双峰特征的序列,则该株系的基因型为杂合基因型(2条同源染色体中的1条染色体上的sldmp基因突变,且另1条染色体上的sldmp基因未突变),该株系为t0代转基因番茄杂合突变型株系;自靶位点序列起具有特异单峰特征的序列,若与野生型番茄ac的sldmp基因序列相同,则该株系的基因型为野生型,即sldmp基因序列没有发生突变;若与野生型番茄ac的sldmp基因序列不同,则该株系的基因型为纯合基因型(2条同源染色体上的sldmp基因发生突变),该株系为t0代转基因番茄纯合突变型株系。表5、t0代转基因番茄的sldmp基因突变类型5、t1代转基因番茄的基因型鉴定将步骤4获得的t0代转基因番茄sldmp基因突变株系t0-12和t0-34自交,收获种子后再播种,得到t1代转基因番茄。鉴定t1代转基因番茄的sldmp基因的基因型,具体方法如下:以t1代转基因番茄的基因组dna为模板,利用sldmp(sldmpf2和sldmpr1)的突变序列检测引物按照步骤4中的方法鉴定t1代转基因番茄sldmp基因的基因型。最终获得的t1代转基因番茄sldmp基因突变纯合型株系有sldmp-1和sldmp-2,各个株系的突变类型如下:经测序鉴定表明:与野生型番茄ac的基因组dna相比,t1代转基因番茄sldmp基因突变纯合型株系sldmp-1的差异仅在于在编码sldmp蛋白的基因中发生了一个碱基c的插入,该插入的碱基位于序列5第92-93位之间。经测序鉴定表明:与野生型番茄ac的基因组dna相比,t1代转基因番茄sldmp基因突变纯合型株系sldmp-2的差异仅在于在编码sldmp蛋白的基因中发生了片段缺失,该缺失片段位于序列5第93-249位。二、sldmp基因敲除的番茄突变体在诱导产生单倍体中的应用(一)sldmp基因敲除的番茄突变体的植株表现和结实率分析对比野生型番茄ac和ac背景下敲除sldmp基因的番茄突变体植株表现,可以发现sldmp基因敲除后并不影响植株的长势(图6)。对每个番茄自交果实的种子数目进行统计,野生型的每个自交果实平均约产生79.5粒种子,而sldmp突变体仅产生17粒,显著低于野生型(表6)。表明sldmp基因突变后导致了结实率下降,暗示了sldmp突变体具有单倍体诱导的能力。表6、sldmp突变体自交结实数目统计材料统计果穗数平均结实数wt1279.5±24.1sldmp-11419.7±7.1sldmp-22315.3±6.6注:wt为野生型番茄ac。(二)sldmp基因敲除的番茄突变体的单倍体杂交诱导能力鉴定将sldmp突变体与番茄ac和micro-tom杂交获得的f1代材料进行杂交获得杂交后代,通过如下方法对杂交后代中的单倍体进行鉴别:1、荧光标记鉴别crispr/cas9载体上携带启动子atoleo1驱动tagrfp(entacmaeaquadricolor)的表达元件。由于启动子atoleo1在成熟的种子胚中特异表达,可通过荧光灯对tagrfp的荧光信号进行观察。因此,用携带该表达元件的突变体为父本与其它不携带荧光的母本材料杂交,所得到的种子中,二倍体种子的胚由于具有父本的基因组而表现出红色荧光,而单倍体种子的胚由于来源于母本而表现为无荧光或弱荧光(图7)。2、分子标记鉴别将上述步骤1鉴定出的不具有荧光的种子进一步种植,提取其基因组dna,采用番茄ac与micro-tom杂交获得的f1代和sldmp基因敲除的番茄突变体间多态性引物sldmpf2+sldmpr1进行pcr扩增,并将扩增产物进行琼脂糖带型检测或者测序,若待测单株的扩增产物表现为1条带或测序结果为单一峰图,认为该单株条带为母本带型,不存在父本材料的带型,则该单株是母本单倍体。若待测单株的扩增产物表现为2条带或测序结果为杂合峰图,认为该单株条带为番茄ac与micro-tom杂交获得的f1代和sldmp基因敲除的番茄突变体的杂合带型,则该单株是正常杂交的后代,是二倍体。3、成熟植株表型鉴别对上述步骤1和2鉴定出的植株进一步观察其表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,二倍体则表现为植株高大,叶片宽大,披散,育性正常。4、流式细胞检测叶片鉴别将上述步骤3中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以二倍体番茄叶片作为对照;再用流式细胞仪器检测信号,首先检测二倍体细胞核信号,并将二倍体细胞核信号峰位设为100(由于二倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则认为该待测植株为单倍体植株。若待测植株的信号峰出现在100附近,则认为其与二倍体细胞核信号强度富集位置相同,该待测植株为二倍体(图8)。统计上述鉴定结果并按照如下公式计算诱导率:诱导率(%)=(母本单倍体株数/总株数)×100。sldmp基因突变后与其他材料杂交,在杂交后代中可获得母本单倍体。表7、sldmp突变体杂交后代中单倍体诱导率统计杂交组合总植株数单倍体数单倍体诱导率(%)f1×wt95400.00f1×sldmp-132320.62f1×sldmp-262930.99注:f1为番茄ac和micro-tom杂交的后代,wt为野生型番茄ac。序列表<110>中国农业大学<120>孤雌生殖单倍体诱导基因dmp及其应用<160>12<170>patentinversion3.5<210>1<211>856<212>dna<213>artificialsequence<400>1ccgtcgtactaaagatagttcgaacaaaaatccaaaacacatttctcatttcacaaaaca60aacgaaaactattgagtcacaaaacacagagagaatggagaaaacagaggaaagcgtcgg120aatcagagtttacacgacgacaacgacgcaaaatccgtcaccaacatcgtctcggtcgcc180caaacctgtccctctctcttcactgcctatgcttccggcaggagccgccgcgggaggagg240aaaaggtagaaaacgtcgcatggtggcgaaaggagttcaaaaaacggtttcgaagacatc300aatgctcgtcaatttccttccgacaggaactctcttgatgttcgaaatggttcttccgac360aatctaccgtgacggagactgtaacggaatcaacacactcatgattcatcttctcttgct420tctttgcgcaatgtcttgtttcttcttccatttcaccgacagtttcaaagcctccgatgg480gaaaatttactacggttttgtgactccacgtggactcgcggtgttcatgaaaccaccctc540gccggggtttggaggcggagatgtgattgcagagaaggagattccggtgacggatgagag600gtataagttgagggttaatgactttgtgcattcagtgatgagtgttttggtttttatggc660gatcgcgttttcggatcggagagtcacagggtgtttgtttccaggaaaagagaaggagat720ggatcaagttatggagagttttccgttaatggtcggaattgtttgcagtgctttgtttct780tgtttttccgaccagtcgatacggtgtcggatgcatgtctacataataactaatttcact840tttctgttgttttgtg856<210>2<211>243<212>prt<213>artificialsequence<400>2metglulysthrglugluservalglyileargvaltyrthrthrthr151015thrthrglnasnproserprothrserserargserprolysproval202530proleuserserleuprometleuproalaglyalaalaalaglygly354045glylysglyarglysargargmetvalalalysglyvalglnlysthr505560valserlysthrsermetleuvalasnpheleuprothrglythrleu65707580leumetpheglumetvalleuprothriletyrargaspglyaspcys859095asnglyileasnthrleumetilehisleuleuleuleuleucysala100105110metsercysphephephehisphethraspserphelysalaserasp115120125glylysiletyrtyrglyphevalthrproargglyleualavalphe130135140metlysproproserproglypheglyglyglyaspvalilealaglu145150155160lysgluileprovalthraspgluargtyrlysleuargvalasnasp165170175phevalhisservalmetservalleuvalphemetalailealaphe180185190seraspargargvalthrglycysleupheproglylysglulysglu195200205metaspglnvalmetgluserpheproleumetvalglyilevalcys210215220seralaleupheleuvalpheprothrserargtyrglyvalglycys225230235240metserthr<210>3<211>992<212>dna<213>artificialsequence<400>3cgatgaaactctataaccgtcaataaccgccgcgatttgaaaaataaatacaaaaatctc60attctccattaaaccatttaacacaacatacgaaaaactggtaaatcacaaaagaaaaaa120acagagagaaacacacgaaaatggagaaaacagaggaaagcgtcggaatcagagtttaca180cggcgactccgccgcaaaaaccatcaccatcaccaccttctcgttcaccaaaacccgtct240taatctcttcattgccttccctcccgtcaggagccgccgctggaggaggaagaggtcgaa300aacgtcgcatggtggcgcaaggagttcaaaaaacggtttcgaagacatcaatgctcgtca360acttccttccgacaggaacactcttgatgttcgaaatggttcttccatcaatataccgtg420acggagactgtaacggaatcaacacactcatgattcatctcctcttgcttctttgcgcaa480tgtcttgtttcttcttccattttaccgacagtttcaaagcatccgatgggaagatctact540acggtttcgtgacgccacgtggactcgcggtgttcatgaaaccgccgcctccagagtttg600gtggcggagatgttatagcggaggcagagattccggtgactgatgataggtataagttga660cggttaatgactttgttcatgcagtgatgagcgttttggtgtttatggcgattgcgtttt720cggatcgaagagtcacgggatgtttgtttccagggaaagagaaagagatggatcaagtta780tggagagttttccaataatggttggaattgtttgtagtgctttgtttcttgtttttccga840ccactcgatatggtgttggttgcatgactggttaatttattttcacttttctgttttttg900gtttgttttagtatctatttcgtattttccttgtaatttagattatctgatttaaactcc960aatgttctactatttttatctattgtattgtt992<210>4<211>244<212>prt<213>artificialsequence<400>4metglulysthrglugluservalglyileargvaltyrthralathr151015proproglnlysproserproserproproserargserprolyspro202530valleuileserserleuproserleuproserglyalaalaalagly354045glyglyargglyarglysargargmetvalalaglnglyvalglnlys505560thrvalserlysthrsermetleuvalasnpheleuprothrglythr65707580leuleumetpheglumetvalleuproseriletyrargaspglyasp859095cysasnglyileasnthrleumetilehisleuleuleuleuleucys100105110alametsercysphephephehisphethraspserphelysalaser115120125aspglylysiletyrtyrglyphevalthrproargglyleualaval130135140phemetlysproproproproglupheglyglyglyaspvalileala145150155160glualagluileprovalthraspaspargtyrlysleuthrvalasn165170175aspphevalhisalavalmetservalleuvalphemetalaileala180185190pheseraspargargvalthrglycysleupheproglylysglulys195200205glumetaspglnvalmetgluserpheproilemetvalglyileval210215220cysseralaleupheleuvalpheprothrthrargtyrglyvalgly225230235240cysmetthrgly<210>5<211>757<212>dna<213>artificialsequence<400>5atggagcaaactagtgaaggaattggaataaaaatgtatagtacatcgaaacgcgtcgat60aattcatcgtctatgtatcctactaatttaccacaaggtgaaataatcccagaattacca120ataccaattggtggtaaaaaaagaagagcaatggcaaatggtgtacaaaaaacactttca180aaaacttcattacttgttaattttctcccaacgggaacccttttaacatttgaaatgtta240cttccctcagtatttggtaaaggagattgttcaccaattactacatttatgattttaacg300ttacttggactttgtactttgtcatgttttttctttcattttaccgatagttttcgaggt360cctgatggtaaaatttactatggttttgttacaccaagaggtttgaaagttttcaagact420ggacttggtgtcgatgtgccaaaagatgaaaggtacattgtgggagtgacagattttgta480catgcaatgatgtctgttttggtgtttgtggcaattgcattttctgatcacagagtaaca540ctttgtctatttcctggacatgctaaagaacttgatgaaattatgaggagttttccatta600atggttggagttatttgtagtggactttttcttgtttttcctaattcgagatatggtgtt660ggatgtatgtctgcttagatatctacgtttacattctttcatgtattgtaatatacgttg720gttgatatttatttaaaatctatctatcttgtattga757<210>6<211>225<212>prt<213>artificialsequence<400>6metgluglnthrsergluglyileglyilelysmettyrserthrser151015lysargvalaspasnsersersermettyrprothrasnleuprogln202530glygluileileprogluleuproileproileglyglylyslysarg354045argalametalaasnglyvalglnlysthrleuserlysthrserleu505560leuvalasnpheleuprothrglythrleuleuthrpheglumetleu65707580leuproservalpheglylysglyaspcysserproilethrthrphe859095metileleuthrleuleuglyleucysthrleusercysphephephe100105110hisphethraspserpheargglyproaspglylysiletyrtyrgly115120125phevalthrproargglyleulysvalphelysthrglyleuglyval130135140aspvalprolysaspgluargtyrilevalglyvalthrasppheval145150155160hisalametmetservalleuvalphevalalailealapheserasp165170175hisargvalthrleucysleupheproglyhisalalysgluleuasp180185190gluilemetargserpheproleumetvalglyvalilecyssergly195200205leupheleuvalpheproasnserargtyrglyvalglycysmetser210215220ala225<210>7<211>1447<212>dna<213>artificialsequence<400>7catcttcattcttaagatatgaagataatcttcaaaaggcccctgggaatctgaaagaag60agaagcaggcccatttatatgggaaagaacaatagtatttcttatataggcccatttaag120ttgaaaacaatcttcaaaagtcccacatcgcttagataagaaaacgaagctgagtttata180tacagctagagtcgaagtagtgattgagaaaacagaggaaagcgtgttttagagctagaa240atagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtg300ctttttttctagacccagctttcttgtacaaagttggcattacgctttacgaattcccat360ggggagcatcttcattcttaagatatgaagataatcttcaaaaggcccctgggaatctga420aagaagagaagcaggcccatttatatgggaaagaacaatagtatttcttatataggccca480tttaagttgaaaacaatcttcaaaagtcccacatcgcttagataagaaaacgaagctgag540tttatatacagctagagtcgaagtagtgattgaagaggtcgaaaacgtcgcagttttaga600gctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccga660gtcggtgctttttttctagacccagctttcttgtacaaagttggcattacgctcagagaa720ttcgcatgcggagcatcttcattcttaagatatgaagataatcttcaaaaggcccctggg780aatctgaaagaagagaagcaggcccatttatatgggaaagaacaatagtatttcttatat840aggcccatttaagttgaaaacaatcttcaaaagtcccacatcgcttagataagaaaacga900agctgagtttatatacagctagagtcgaagtagtgattgtcaagagtgttcctgtcggag960ttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtg1020gcaccgagtcggtgctttttttctagacccagctttcttgtacaaagttggcattacgct1080tgtggaattcgcatgcggagcatcttcattcttaagatatgaagataatcttcaaaaggc1140ccctgggaatctgaaagaagagaagcaggcccatttatatgggaaagaacaatagtattt1200cttatataggcccatttaagttgaaaacaatcttcaaaagtcccacatcgcttagataag1260aaaacgaagctgagtttatatacagctagagtcgaagtagtgattgatgaacaccgcgag1320tccacggttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttga1380aaaagtggcaccgagtcggtgctttttttctagacccagctttcttgtacaaagttggca1440ttacgct1447<210>8<211>714<212>dna<213>artificialsequence<400>8catcttcattcttaagatatgaagataatcttcaaaaggcccctgggaatctgaaagaag60agaagcaggcccatttatatgggaaagaacaatagtatttcttatataggcccatttaag120ttgaaaacaatcttcaaaagtcccacatcgcttagataagaaaacgaagctgagtttata180tacagctagagtcgaagtagtgattgtatcctactaatttaccacagttttagagctaga240aatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggt300gctttttttctagacccagctttcttgtacaaagttggcattacgcttgtggaattcctc360gagggagcatcttcattcttaagatatgaagataatcttcaaaaggcccctgggaatctg420aaagaagagaagcaggcccatttatatgggaaagaacaatagtatttcttatataggccc480atttaagttgaaaacaatcttcaaaagtcccacatcgcttagataagaaaacgaagctga540gtttatatacagctagagtcgaagtagtgattgtctcctttaccaaatactgagttttag600agctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccg660agtcggtgctttttttctagacccagctttcttgtacaaagttggcattacgct714<210>9<211>6137<212>dna<213>artificialsequence<400>9ctcaacttttgattcgctatttgcagtgcacctgtggcgttcatcacatcttttgtggca60ctgtttgcactggtcattgctattacaaaggaccttcctgatgttgaaggagatcgaaag120taagtaactgcacgcataaccattttctttccgctctttggctcaatccatttgacagtc180aaagacaatgtttaaccagctccgtttgatatattgtctttatgtgtttgttcaagcatg240tttagttaatcatgcctttgattgatcttgaataggttccaaatatcaaccctggcaaca300aaacttggagtgagaaacattgcattcctcggttctggacttctgctagtaaattatgtt360tcagccatatcactagctttctacatgcctcaggtgaattcatctatttccgtcttaact420atttcggttaattaaagcacgaacaccattactgcatgtagaagcttgataaactatcgc480caccaatttatttttgttgcgatattgttactttcctcagtatgcagctttgaaaagacc540aaccctcttatcctttaacaatgaacaggtttttagaggtagcttgatgattcctgcaca600tgtgatcttggcttcaggcttaattttccaggtaaagcattatgagatactcttatatct660cttacatacttttgagataatgcacaagaacttcataactatatgctttagtttctgcat720ttgacactgccaaattcattaatctctaatatctttgttgttgatctttggtagacatgg780gtactagaaaaagcaaactacaccaaggtaaaatacttttgtacaaacataaactcgtta840tcacggaacatcaatggagtgtatatctaacggagtgtagaaacatttgattattgcagg900aagctatctcaggatattatcggtttatatggaatctcttctacgcagagtatctgttat960tccccttcctctagctttcaatttcatggtgaggatatgcagttttctttgtatatcatt1020cttcttcttctttgtagcttggagtcaaaatcggttccttcatgtacatacatcaaggat1080atgtccttctgaatttttatatcttgcaataaaaatgcttgtaccaattgaaacaccagc1140tttttgagttctatgatcactgacttggttctaaccaaaaaaaaaaaaatgtttaattta1200catatctaaaagtaggtttagggaaacctaaacagtaaaatatttgtatattattcgaat1260ttcactcatcataaaaacttaaattgcaccataaaattttgttttactattaatgatgta1320atttgtgtaacttaagataaaaataatattccgtaagttaaccggctaaaaccacgtata1380aaccagggaacctgttaaaccggttctttactggataaagaaatgaaagcccatgtagac1440agctccattagagcccaaaccctaaatttctcatctatataaaaggagtgacattagggt1500ttttgttcgtcctcttaaagcttctcgttttctctgccgtctctctcattcgcgcgacgc1560aaacgatcttcaggtgatcttctttctccaaatcctctctcataactctgatttcgtact1620tgtgtatttgagctcacgctctgtttctctcaccacagcctactgtatttttacaacaat1680taccaacaacaacaaacaacaaacaacattacaattactatttacaattacaatggataa1740gaagtactctatcggactcgatatcggaactaactctgtgggatgggctgtgatcaccga1800tgagtacaaggtgccatctaagaagttcaaggttctcggaaacaccgataggcactctat1860caagaaaaaccttatcggtgctctcctcttcgattctggtgaaactgctgaggctaccag1920actcaagagaaccgctagaagaaggtacaccagaagaaagaacaggatctgctacctcca1980agagatcttctctaacgagatggctaaagtggatgattcattcttccacaggctcgaaga2040gtcattcctcgtggaagaagataagaagcacgagaggcaccctatcttcggaaacatcgt2100tgatgaggtggcataccacgagaagtaccctactatctaccacctcagaaagaagctcgt2160tgattctactgataaggctgatctcaggctcatctacctcgctctcgctcacatgatcaa2220gttcagaggacacttcctcatcgagggtgatctcaaccctgataactctgatgtggataa2280gttgttcatccagctcgtgcagacctacaaccagcttttcgaagagaaccctatcaacgc2340ttcaggtgtggatgctaaggctatcctctctgctaggctctctaagtcaagaaggcttga2400gaacctcattgctcagctccctggtgagaagaagaacggacttttcggaaacttgatcgc2460tctctctctcggactcacccctaacttcaagtctaacttcgatctcgctgaggatgcaaa2520gctccagctctcaaaggatacctacgatgatgatctcgataacctcctcgctcagatcgg2580agatcagtacgctgatttgttcctcgctgctaagaacctctctgatgctatcctcctcag2640tgatatcctcagagtgaacaccgagatcaccaaggctccactctcagcttctatgatcaa2700gagatacgatgagcaccaccaggatctcacacttctcaaggctcttgttagacagcagct2760cccagagaagtacaaagagattttcttcgatcagtctaagaacggatacgctggttacat2820cgatggtggtgcatctcaagaagagttctacaagttcatcaagcctatcctcgagaagat2880ggatggaaccgaggaactcctcgtgaagctcaatagagaggatcttctcagaaagcagag2940gaccttcgataacggatctatccctcatcagatccacctcggagagttgcacgctatcct3000tagaaggcaagaggatttctacccattcctcaaggataacagggaaaagattgagaagat3060tctcaccttcagaatcccttactacgtgggacctctcgctagaggaaactcaagattcgc3120ttggatgaccagaaagtctgaggaaaccatcaccccttggaacttcgaagaggtggtgga3180taagggtgctagtgctcagtctttcatcgagaggatgaccaacttcgataagaaccttcc3240aaacgagaaggtgctccctaagcactctttgctctacgagtacttcaccgtgtacaacga3300gttgaccaaggttaagtacgtgaccgagggaatgaggaagcctgcttttttgtcaggtga3360gcaaaagaaggctatcgttgatctcttgttcaagaccaacagaaaggtgaccgtgaagca3420gctcaaagaggattacttcaagaaaatcgagtgcttcgattcagttgagatttctggtgt3480tgaggataggttcaacgcatctctcggaacctaccacgatctcctcaagatcattaagga3540taaggatttcttggataacgaggaaaacgaggatatcttggaggatatcgttcttaccct3600caccctctttgaagatagagagatgattgaagaaaggctcaagacctacgctcatctctt3660cgatgataaggtgatgaagcagttgaagagaagaagatacactggttggggaaggctctc3720aagaaagctcattaacggaatcagggataagcagtctggaaagacaatccttgatttcct3780caagtctgatggattcgctaacagaaacttcatgcagctcatccacgatgattctctcac3840ctttaaagaggatatccagaaggctcaggtttcaggacagggtgatagtctccatgagca3900tatcgctaacctcgctggatctcctgcaatcaagaagggaatcctccagactgtgaaggt3960tgtggatgagttggtgaaggtgatgggaaggcataagcctgagaacatcgtgatcgaaat4020ggctagagagaaccagaccactcagaagggacagaagaactctagggaaaggatgaagag4080gatcgaggaaggtatcaaagagcttggatctcagatcctcaaagagcaccctgttgagaa4140cactcagctccagaatgagaagctctacctctactacctccagaacggaagggatatgta4200tgtggatcaagagttggatatcaacaggctctctgattacgatgttgatcatatcgtgcc4260acagtcattcttgaaggatgattctatcgataacaaggtgctcaccaggtctgataagaa4320caggggtaagagtgataacgtgccaagtgaagaggttgtgaagaaaatgaagaactattg4380gaggcagctcctcaacgctaagctcatcactcagagaaagttcgataacttgactaaggc4440tgagaggggaggactctctgaattggataaggcaggattcatcaagaggcagcttgtgga4500aaccaggcagatcactaagcacgttgcacagatcctcgattctaggatgaacaccaagta4560cgatgagaacgataagttgatcagggaagtgaaggttatcaccctcaagtcaaagctcgt4620gtctgatttcagaaaggatttccaattctacaaggtgagggaaatcaacaactaccacca4680cgctcacgatgcttaccttaacgctgttgttggaaccgctctcatcaagaagtatcctaa4740gctcgagtcagagttcgtgtacggtgattacaaggtgtacgatgtgaggaagatgatcgc4800taagtctgagcaagagatcggaaaggctaccgctaagtatttcttctactctaacatcat4860gaatttcttcaagaccgagattaccctcgctaacggtgagatcagaaagaggccactcat4920cgagacaaacggtgaaacaggtgagatcgtgtgggataagggaagggatttcgctaccgt4980tagaaaggtgctctctatgccacaggtgaacatcgttaagaaaaccgaggtgcagaccgg5040tggattctctaaagagtctatcctccctaagaggaactctgataagctcattgctaggaa5100gaaggattgggaccctaagaaatacggtggtttcgattctcctaccgtggcttactctgt5160tctcgttgtggctaaggttgagaagggaaagagtaagaagctcaagtctgttaaggaact5220tctcggaatcactatcatggaaaggtcatctttcgagaagaacccaatcgatttcctcga5280ggctaagggatacaaagaggttaagaaggatctcatcatcaagctcccaaagtactcact5340cttcgaactcgagaacggtagaaagaggatgctcgcttctgctggtgagcttcaaaaggg5400aaacgagcttgctctcccatctaagtacgttaactttctttacctcgcttctcactacga5460gaagttgaagggatctccagaagataacgagcagaagcaacttttcgttgagcagcacaa5520gcactacttggatgagatcatcgagcagatctctgagttctctaaaagggtgatcctcgc5580tgatgcaaacctcgataaggtgttgtctgcttacaacaagcacagagataagcctatcag5640ggaacaggcagagaacatcatccatctcttcacccttaccaacctcggtgctcctgctgc5700tttcaagtacttcgatacaaccatcgataggaagagatacacctctaccaaagaagtgct5760cgatgctaccctcatccatcagtctatcactggactctacgagactaggatcgatctctc5820acagctcggtggtgattcaagggctgatcctaagaagaagaggaaggtttgagcttgtca5880agcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtct5940tgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgta6000atgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacattta6060atacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtc6120atctatgttactagatc6137<210>10<211>2311<212>dna<213>artificialsequence<400>10aatgtcgcggaacaaattttaaaactaaatcctaaatttttctaattttgttgccaatag60tggatatgtgggccgtatagaaggaatctattgaaggcccaaacccatactgacgagccc120aaaggttcgttttgcgttttatgtttcggttcgatgccaacgccacattctgagctaggc180aaaaaacaaacgtgtctttgaatagactcctctcgttaacacatgcagcggctgcatggt240gacgccattaacacgtggcctacaattgcatgatgtctccattgacacgtgacttctcgt300ctcctttcttaatatatctaacaaacactcctacctcttccaaaatatatacacatcttt360ttgatcaatctctcattcaaaatctcattctctctagtaaacaagaacaaaaaaatggcg420gatacagctagaggaacccatcacgatatcatcggcagagatcagtacccgatgatgggc480cgagatcgtgaccagtaccagatgtccggacgaggatctgactactccaagtctaggcag540attgctaaagctgcaactgctgtcacagctggtggttccctccttgttctctccagcctt600acccttgttggaactgtcatagctttgactgttgcaacacctctgctcgttatcttcagc660ccaatccttgtcccggctctcatcacagttgcactcctcatcaccggttttctttcctct720ggagggtttggcattgccgctataaccgttttctcttggatttacaagtaagcacacatt780tatcatcttacttcataattttgtgcaatatgtgcatgcatgtgttgagccagtagcttt840ggatcaatttttttggtcgaataacaaatgtaacaataagaaattgcaaattctagggaa900catttggttaactaaatacgaaatttgacctagctagcttgaatgtgtctgtgtatatca960tctatataggtaaaatgcttggtatgatacctattgattgtgaataggtacgcaacggga1020gagcacccacagggatcagacaagttggacagtgcaaggatgaagttgggaagcaaagct1080caggatctgaaagacagagctcagtactacggacagcaacatactggtggggaacatgac1140cgtgaccgtactcgtggtggccagcacactactatgagcgagctgattaaggagaacatg1200cacatgaagctgtacatggagggcaccgtgaacaaccaccacttcaagtgcacatccgag1260ggcgaaggcaagccctacgagggcacccagaccatgagaatcaaggtggtcgagggcggc1320cctctccccttcgccttcgacatcctggctaccagcttcatgtacggcagcagaaccttc1380atcaaccacacccagggcatccccgacttctttaagcagtccttccctgagggcttcaca1440tgggagagagtcaccacatacgaagatgggggcgtgctgaccgctacccaggacaccagc1500ctccaggacggctgcctcatctacaacgtcaagatcagaggggtgaacttcccatccaac1560ggccctgtgatgcagaagaaaacactcggctgggaggccaacaccgagatgctgtacccc1620gctgacggcggcctggaaggcagaagcgacatggccctgaagctcgtgggcgggggccac1680ctgatctgcaacttcaagaccacatacagatccaagaaacccgctaagaacctcaagatg1740cccggcgtctactatgtggaccacagactggaaagaatcaaggaggccgacaaagaaacc1800tacgtcgagcagcacgaggtggctgtggccagatactgcgacctccctagcaaactgggg1860cacaagtgagcttaccccactgatgtcatcgtcatagtccaataactccaatgtcgggga1920gttagtttatgaggaataaagtgtttagaatttgatcagggggagataataaaagccgag1980tttgaatctttttgttataagtaatgtttatgtgtgtttctatatgttgtcaaatggtac2040catgttttttttcctctctttttgtaacttgcaagtgttgtgttgtactttatttggctt2100ctttgtaagttggtaacggtggtctatatatggaaaaggtcttgttttgttaaacttatg2160ttagttaactggattcgtctttaaccacaaaaagttttcaataagctacaaatttagaca2220cgcaagccgatgcagtcattagtacatatatttattgcaagtgattacatggcaacccaa2280acttcaaaaacagtaggttgctccatttagt2311<210>11<211>5247<212>dna<213>artificialsequence<400>11gtcaacatggtggagcacgacactctggtctactccaaaaatgtcaaagatacagtctca60gaagatcaaagggctattgagacttttcaacaaaggataatttcgggaaacctcctcgga120ttccattgcccagctatctgtcacttcatcgaaaggacagtagaaaaggaaggtggctcc180tacaaatgccatcattgcgataaaggaaaggctatcattcaagatctctctgccgacagt240ggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagaggttccaacc300acgtctacaaagcaagtggattgatgtgataacatggtggagcacgacactctggtctac360tccaaaaatgtcaaagatacagtctcagaagatcaaagggctattgagacttttcaacaa420aggataatttcgggaaacctcctcggattccattgcccagctatctgtcacttcatcgaa480aggacagtagaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggct540atcattcaagatctctctgccgacagtggtcccaaagatggacccccacccacgaggagc600atcgtggaaaaagaagaggttccaaccacgtctacaaagcaagtggattgatgtgacatc660tccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctata720taaggaagttcatttcatttggagaggacacgctcgagtataagagctcatttttacaac780aattaccaacaacaacaaacaacaaacaacattacaattacatttacaattatcgataca840atggacaagaagtactccattgggctcgatatcggcacaaacagcgtcggctgggccgtc900attacggacgagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgc960cacagcataaagaagaacctcattggcgccctcctgttcgactccggggagacggccgaa1020gccacgcggctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgc1080tacctgcaggagatctttagtaatgagatggctaaggtggatgactctttcttccatagg1140ctggaggagtcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggc1200aatatcgtggacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaag1260aagcttgtagacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcat1320atgatcaaatttcggggacacttcctcatcgagggggacctgaacccagacaacagcgat1380gtcgacaaactctttatccaactggttcagacttacaatcagcttttcgaagagaacccg1440atcaacgcatccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccgg1500cggctcgaaaacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaat1560cttatcgccctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaa1620gatgccaagcttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcc1680cagatcggcgaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccatt1740ctgctgagtgatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagt1800atgatcaagcgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcaga1860cagcaactgcctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgcc1920ggatacattgacggcggagcaagccaggaggaattttacaaatttattaagcccatcttg1980gaaaaaatggacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgc2040aaacagcgcactttcgacaatggaagcatcccccaccagattcacctgggcgaactgcac2100gctatcctcaggcggcaagaggatttctacccctttttgaaagataacagggaaaagatt2160gagaaaatcctcacatttcggataccctactatgtaggccccctcgcccggggaaattcc2220agattcgcgtggatgactcgcaaatcagaagagactatcactccctggaacttcgaggaa2280gtcgtggataagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaa2340aatctgcctaacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtt2400tataacgagctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctg2460tctggagagcagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttacc2520gtgaaacagctcaaagaagattatttcaaaaagattgaatgtttcgactctgttgaaatc2580agcggagtggaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatc2640attaaagacaaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtc2700ctcacccttacgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgct2760catctcttcgacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatggggg2820cggctgtcaagaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctg2880gattttcttaagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgac2940tctctcacctttaaggaggacatccagaaagcacaagtttctggccagggggacagtctc3000cacgagcacatcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagacc3060gttaaggtcgtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgtt3120atcgagatggcccgagagaaccaaactacccagaagggacagaagaacagtagggaaagg3180atgaagaggattgaagagggtataaaagaactggggtcccaaatccttaaggaacaccca3240gttgaaaacacccagcttcagaatgagaagctctacctgtactacctgcagaacggcagg3300gacatgtacgtggatcaggaactggacatcaatcggctctccgactacgacgtggatcat3360atcgtgccccagtcttttctcaaagatgattctattgataataaagtgttgacaagatcc3420gataaaaatagagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaa3480aattattggcggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctg3540actaaggctgaacgaggtggcctgtctgagttggataaagccggcttcatcaaaaggcag3600cttgttgagacacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaac3660accaagtacgatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtct3720aagctggtttcagatttcagaaaggactttcagttttataaggtgagagagatcaacaat3780taccaccatgcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaa3840tatcccaagcttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaa3900atgatcgcaaagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagc3960aatattatgaattttttcaagaccgagattacactggccaatggagagattcggaagcga4020ccacttatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttc4080gcgacagtccggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagta4140cagaccggaggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatc4200gcacgcaaaaaagattgggaccccaagaaatacggcggattcgattctcctacagtcgct4260tacagtgtactggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtc4320aaggaactgctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgac4380tttctcgaggcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaag4440tactctctctttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctg4500cagaaaggtaacgagctggcactgccctctaaatacgttaatttcttgtatctggccagc4560cactatgaaaagctcaaaggatctcccgaagataatgagcagaagcagctgttcgtggaa4620caacacaaacactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtg4680atcctcgccgacgctaacctcgataaggtgctttctgcttacaataagcacagggataag4740cccatcagggagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcg4800cctgcagccttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaag4860gaggtcctggacgccacactgattcatcagtcaattacggggctctatgaaacaagaatc4920gacctctctcagctcggtggagacagcagggctgaccccaagaagaagaggaaggtgtga4980gcttgtcaagcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgtt5040gccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataatt5100aacatgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaatta5160tacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgc5220gcggtgtcatctatgttactagatcga5247<210>12<211>1867<212>dna<213>artificialsequence<400>12cggagaattaagggagtcacgttatgacccccgccgatgacgcgggacaagccgttttac60gtttggaactgacagaaccgcaacgttgaaggagccactgagccgcgggtttctggagtt120taatgagctaagcacatacgtcagaaaccattattgcgcgttcaaaagtcgcctaaggtc180actatcagctagcaaatatttcttgtcaaaaatgctccactgacgttccataaattcccc240tcggtatccaattagagtctcatattcactctcctatttttacaacaattaccaacaaca300acaaacaacaaacaacattacaattacatttacaattaccatggttgaacaagatggatt360gcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaaca420gacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttct480ttttgtcaagaccgacctgtccggtgccctgaatgaactgcaggacgaggcagcgcggct540atcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagc600gggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcacct660tgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttga720tccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcg780gatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgcc840agccgaactgttcgccaggctcaaggcgcgcatgcccgacggcgaggatctcgtcgtgac900tcatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcat960cgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtga1020tattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgc1080cgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctgagcggg1140actctggggttcgctagagtcctgctttaatgagatatgcgagacgcctatgatcgcatg1200atatttgctttcaattctgttgtgcacgttgtaaaaaacctgagcatgtgtagctcagat1260ccttaccgccggtttcggttcattctaatgaatatatcacccgttactatcgtattttta1320tgaataatattctccgttcaatttactgattgtaccctactacttatatgtacaatatta1380aaatgaaaacaatatattgtgctgaataggtttatagcgacatctatgatagagcgccac1440aataacaaacaattgcgttttattattacaaatccaattttaaaaaaagcggcagaaccg1500gtcaaacctaaaagactgattacataaatcttattcaaatttcaaaagtgccccaggggc1560tagtatctacgacacaccgagcggcgaactaataacgctcactgaagggaactccggttc1620cccgccggcgcgcatgggtgagattccttgaagttgagtattggccgtccgctctaccga1680aagttacgggcaccattcaacccggtccagcacggcggccgggtaaccgacttgctgccc1740cgagaattatgcagcatttttttggtgtatgtgggccccaaatgaagtgcaggtcaaacc1800ttgacagtgacgacaaatcgttgggcgggtccagggcgaattttgcgacaacatgtcgag1860gctcagc1867当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1