本发明属于分子生物学领域,具体涉及一种crisprspcas9(k510a)突变体及其应用。
背景技术:
spcas9(spcas9)在基因编辑中应用广泛。spcas9基因编辑系统包括spcas9蛋白和sgrna。spcas9蛋白和sgrna结合形成复合物,该复合物通过spcas9上的与pam相互作用结构域和sgrna上的向导序列(guidesequence)序列特异性识别靶位点,并利用hnh结构域和ruvc结构域对靶标dna进行双链平端剪切。在活体细胞中,剪切后的基因组dna可以启动nhej进行修复,从而产生插入/缺失突变(indel)。
但在相关技术中,野生型spcas9虽然可以高效的对基因进行编辑,却在编辑靶位点的同时也对一些与靶位点类似的非靶位点进行编辑,这严重影响了spcas9的临床应用。
因此,亟待开发一种新型spcas9。
技术实现要素:
本发明旨在至少解决上述现有技术中存在的技术问题之一。为此,本发明提出一种spcas9突变体或其活性片段,相比于常规的野生型spcas9,在保持了与野生型spcas9的对靶位点剪切效率基本相同的情况下,能够显著降低对脱靶位点的编辑效率,即显著降低脱靶率。
本发明还提出一种提供编码上述spcas9突变体或其活性片段的基因。
本发明还提出一种组合物。
本发明还提出一种多核苷酸。
本发明还提出一种向导多核苷酸/cas复合物。
本发明还提出含有上述基因的重组载体、重组菌或细胞。
本发明还提出一种修饰细胞基因组中的靶位点的方法。
本发明还提出上述spcas9突变体或其活性片段或上述基因在基因编辑中的应用。
根据本发明的第一个方面,提供一种spcas9突变体或其活性片段,该spcas9突变体或其活性片段包括:与seqidno.1所示的野生型spcas9多肽具有至少90%的氨基酸同一性,且野生型spcas9多肽的rec3结构域的第510位氨基酸残基突变为丙氨酸残基,其中,该spcas9突变体具有内切核酸酶活性。
根据本发明的一种优选的实施方式,至少具有以下有益效果:本发明中的spcas9(k510a)突变体,是将野生型spcas9(seqidno.1)的第510位赖氨酸残基突变为丙氨酸残基设计得到的。发明人分析野生型spcas9rec3结构域的氨基酸残基与sgrna/靶dna杂合双链的相互作用,发现rec3结构中的部分氨基酸残基与sgrna/靶dna双链形成了非特异性的氢键相互作用,通过进一步对于相互作用力类型、大小及结构的筛选后,得到了rec3结构中的第510位的亲水性氨基酸残基赖氨酸残基(lysineresidue)为最佳突变点。通过将将野生型spcas9rec3结构域第510位的赖氨酸残基突变为丙氨酸残基,在反复验证证实spcas9(k510a)突变体在保持了与野生型spcas9的对靶位点剪切效率基本相同的情况下,能够显著降低对脱靶位点的编辑效率,即显著降低脱靶率。
其中,上述seqidno.1所示野生型spcas9的氨基酸序列为:
mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdgspkkkrkvssdykdhdgdykdhdidykddddkaag(seqidno.1)。
加粗且标有下划线的部分即为突变前的赖氨酸残基;
仅标有下划线的部分为修饰序列。
在本发明的一些实施方式中,上述spcas9突变体或其活性片段还包括:与seqidno.1所示的野生型spcas9多肽具有至少89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%的氨基酸同一性,且野生型spcas9多肽的rec3结构域的第510位氨基酸残基突变为丙氨酸残基,其中,该spcas9突变体具有内切核酸酶活性。
在本发明的一些实施方式中,上述spcas9突变体或其活性片段的氨基酸序列包括:
(1)seqidno.2所示的氨基酸序列;或
(2)seqidno.2所示的spcas9(k510a)突变体的氨基酸序列经取代、缺失和/或增加一个或多个氨基酸和/或末端修饰后且具内切核酸酶活性的序列。
其中,上述seqidno.2所示的spcas9(k510a)突变体的氨基酸序列为:
mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpahsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdgspkkkrkvssdykdhdgdykdhdidykddddkaag(seqidno.2)。
加粗且标有下滑线的部分即为突变后的丙氨酸残基;
仅标有下划线的部分为修饰序列。
在本发明的一些优选的实施方式中,上述spcas9突变体或其活性片段的氨基酸序列还包括:在seqidno.2所示氨基酸序列的基础上加入核信号肽、3×flag或his6标签或其他本领域中常规的修饰序列等修饰得到的序列。
根据本发明的第二个方面,提供编码本发明第一个方面所述的spcas9突变体或其活性片段的基因。
根据本发明的一种优选的实施方式,至少具有以下有益效果:上述编码本发明第一个方面所述的spcas9突变体或其活性片段的基因可用于表达本发明第一个方面所述的spcas9突变体或其活性片段,表达得到的spcas9(k510a)突变体spcas9(k510a)突变体在保持了与野生型spcas9的对靶位点剪切效率基本相同的情况下,能够显著降低对脱靶位点的编辑效率,即显著降低脱靶率。
根据本发明的第三个方面,提供一种组合物,该组合物含有本发明第一个方面所述的spcas9突变体或其活性片段。
根据本发明的一种优选的实施方式,至少具有以下有益效果:上述组合物含有本发明第一个方面所述的spcas9突变体或其活性片段,通过利用该组合物,可以使基因编辑过程中的脱靶率显著降低。
根据本发明的第四个方面,提供一种多核苷酸,该多核苷酸含有本发明的第二个方面所述的基因。
在本发明的一些优选的实施方式中,上述多核苷酸为向导多核苷酸。
在本发明的一些更优选的实施方式中,上述向导多核苷酸为sgrna。
在本发明的一些更优选的实施方式中,上述sgrna的向导序列(guidesequence)为:
5’-gagtccgagcagaagaagaa-3’(seqidno.3)。
cas9的靶向特异性取决于20nt的sgrna向导序列以及基因组中与目标序列相邻的pam的存在,因此,涉及合理且有效的sgrna向导序列可有效的提高cas9的可用性。
使用上述sgrna的向导序列构建的sgrna质粒载体还可以插入抗生素抗性基因和报告基团(gfp)序列。
在本发明的一些更优选的实施方式中,上述抗生素抗性基因包括真核puromycin(嘌呤霉素)抗性基因或潮霉素抗性基因。
在本发明的一些更优选的实施方式中,上述抗生素抗性基因为真核puromycin抗性基因。
在本发明的一些更优选的实施方式中,上述报告基团包括egfp基团。
当然,本领域技术人员也可以根据实际需求,插入其他功能性基因,如强力霉素(doxycycline)的诱导启动子,以增强cas9的瞬时表达。
根据本发明的第五个方面,提供一种向导多核苷酸/cas复合物,该向导多核苷酸/cas复合物包含至少一种向导多核苷酸和至少一种本发明第一个方面所述的spcas9突变体或其活性片段;
其中,该向导多核苷酸是嵌合的非天然存在的向导多核苷酸;
该向导多核苷酸/cas复合物能完全或部分识别、结合靶序列并使靶序列产生切口或解旋、切割靶序列。
在本发明的一些优选的实施方式中,上述多核苷酸为向导多核苷酸。
在本发明的一些更优选的实施方式中,上述向导多核苷酸为sgrna。
在本发明的一些更优选的实施方式中,上述sgrna的向导序列(guidesequence)如seqidno.3所示。
将crispr/cas9组分导入细胞通常是利用dna导入系统来实现的,比如将编码cas9和sgrna的质粒转染到细胞内。但当质粒导入存在问题时,可以直接导入cas9/sgrna核糖核蛋白(rnp)复合物或者使用病毒载体(如慢病毒载体)来实现基因编辑。与导入质粒的方法相比,采用导入cas9/sgrna核糖核蛋白(rnp)复合物的方法进行编辑,在导入细胞后可以快速开始切割。cas9/sgrna核糖核蛋白(rnp)复合物具有较少的脱靶率和较低的免疫原性,使用病毒载体转染时,转染效率更高,且持续时间长。
根据本发明的第六个方面,提供含有本发明第二个方面所述基因的重组载体、重组菌或细胞。
在本发明的一些实施方式中,上述细胞包括原核细胞或真核细胞。
在本发明的一些优选的实施方式中,上述细胞包括:动物、细菌、真菌、昆虫、酵母和植物来源的细胞。
在本发明的一些更优选的实施方式中,上述细胞包括:体内、离体或体外的人细胞、动物细胞、植物细胞和单细胞生物;其中,所述人细胞、动物细胞优选为人和动物的血细胞。
根据本发明的第七个方面,提供一种修饰细胞基因组中的靶位点的方法,包括:将本发明的第五个方面所述的向导多核苷酸/cas复合物导入细胞中,使所述细胞中的靶位点具有如下修饰:
至少一个核苷酸的替代;和/或
至少一个核苷酸的缺失;和/或
至少一个核苷酸的插入。
根据本发明的第八个方面,提供本发明第一个方面所述spcas9突变体或其活性片段或本发明第二个方面所述基因在基因编辑中的应用。
根据本发明的一种优选的实施方式,至少具有以下有益效果:本发明中的spcas9(k510a)突变体是将野生型spcas9的第510位赖氨酸残基突变为丙氨酸残基设计得到的。发明人分析野生型spcas9rec3结构域的氨基酸残基与sgrna/靶dna杂合双链的相互作用,发现rec3结构中的部分氨基酸残基与sgrna/靶dna双链形成了非特异性的氢键相互作用,通过进一步对于相互作用力类型、大小及结构的筛选后,得到了rec3结构中的第510位的亲水性氨基酸残基赖氨酸残基(lysineresidue)为最佳突变点。通过将将野生型spcas9rec3结构域第510位的赖氨酸残基突变为丙氨酸残基,在反复验证证实spcas9突变体spcas9(k510a)在保持了与野生型spcas9的对靶位点剪切效率基本相同的情况下,能够显著降低对脱靶位点的编辑效率,即显著降低脱靶率。
附图说明
下面结合附图和实施例对本发明做进一步的说明,其中:
图1为本发明实施例中的spcas9的质粒图谱;
图2为本发明实施例中的sgrna质粒图谱;
图3为野生型spcas9在emx1-1(a)、emx1-1-ot1(b)、emx1-1-ot2(c)三个位点的编辑效率结果二维图;其中,蓝色点:单fam阳性,绿色点:单vic阳性,灰色点:fam/vic双阴性,棕色点:fam/vic双阳性;
图4为突变型spcas9(k510a)在emx1-1(a)、emx1-1-ot1(b)、emx1-1-ot2(c)三个位点的编辑效率结果二维图;其中,蓝色点:单fam阳性,绿色点:单vic阳性,灰色点:fam/vic双阴性,棕色点:fam/vic双阳性。
具体实施方式
以下将结合实施例对本发明的构思及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。
关于本发明说明书中的术语:spcas9是指酿脓链球菌(streptococcuspyogenes)cas9,cas是指成簇的规律的间隔回文序列(crispr(clusteredregularlyinterspacedshortpalindromicrepeats)associated)。
术语“cas蛋白”或“cas多肽”是指由cas(crispr-相关的)基因编码的多肽。cas蛋白包括cas内切核酸酶。
术语“cas内切核酸酶”是指当与适合的多核苷酸组分复合时能够识别、结合特定dna靶序列的全部或部分、并任选地使特定多核苷酸靶序列的全部或部分产生切口或切割特定多核苷酸靶序列的全部或部分的cas多肽(cas蛋白)。cas内切核酸酶由所述向导多核苷酸指导以识别、结合双链dna中的特定靶位点的全部或部分并任选地使双链dna中的特定靶位点的全部或部分产生切口或切割双链dna中的特定靶位点的全部或部分(例如,在细胞基因组中的靶位点处)。本文描述的cas内切核酸酶包含一个或多个核酸酶结构域。在本文所述的供体dna插入方法中采用的cas内切核酸酶是在靶位点处向dna中引入单链或双链断裂的内切核酸酶。可替代地,本文中的cas内切核酸酶可能缺乏dna切割或切口活性,但是当与合适的rna组分复合时,仍然可以特异性结合dna靶序列。
质粒的设计与构建
下述实施例中以bpk4410质粒(addgeneplasmid#101178)作为示例,但需要注意的是,本发明不限于bpk4410质粒,在所属技术领域普通技术人员所具备的知识范围内,可以合理选择具有替代性的质粒作为实验载体。
(1)spcas9突变体质粒载体构建:
发明人根据sgrna/靶dna杂合双链压缩可以引起双链的疏水性增强,从而引起sgrna/靶dna杂合双链与rec3结构域之间的疏水作用增强,而增强的疏水作用导致rec3结构域向sgrna/靶dna杂合双链移动,进而启动剪切这一假定。从而进一步设想上述发现的最佳情况应为rec3结构域与sgrna/靶dna杂合双链之间的作用力只有疏水相互作用而没有氢键等非特异性相互作用,且只有当sgrna与靶dna链100%匹配时才能启动rec3结构域向sgrna/靶dna杂合双链的移动。根据设想,发明人通过分析rec3结构域的氨基酸残基与sgrna/靶dna杂合双链的相互作用,发现部分氨基酸残基与sgrna/靶dna双链形成了非特异性的氢键相互作用,进一步通过考虑相互作用力类型、大小及结构等因素,筛选得到通过突变510位的亲水性氨基酸残基赖氨酸残基为丙氨酸残基可以获得最佳的突变体spcas9(k510a)。
具体构建步骤为:
以质粒bpk4410(hypercas9,addgeneplasmid#101178)为模板,首先将hypercas9的692位的丙氨酸残基突变为天冬酰胺残基,第694位的丙氨酸残基突变为蛋氨酸残基,将第695位的丙氨酸残基突变为谷氨酰胺残基,将第698位的丙氨酸残基突变为组氨酸残基,得到野生型spcas9。
将spcas9氨基酸序列的第510位赖氨酸残基突变为丙氨酸残基,得到突变体spcas9(k510a)。
其中,野生型spcas9氨基酸序列如seqidno.1所示,突变后的突变体spcas9(k510a)的氨基酸序列如seqidno.2所示。
表达野生型spcas9的质粒的核苷酸序列如seqidno.4所示。
表达spcas9(k510a)的质粒的核苷酸序列如seqidno.5所示:
构建完成的spcas9(k510a)突变体的质粒图谱如图1所示。
(2)构建sgrna质粒载体(sgrna-emx1-1-puro):
设计sgrna,经过筛选后,选择seqidno.3所示序列为向导序列。
seqidno.3所示序列为:
5’-gagtccgagcagaagaagaa-3’(seqidno.3)。
构建完成的sgrna质粒载体还包括启动子、真核puromycin抗性基因序列和egfp报告基团序列,转染后可以表达绿色荧光蛋白,且可以使用puromycin进行药筛以筛选出转染成功的阳性细胞。
为了验证spcas9突变体实际效果,以emx1基因的emx1-1位点为靶位点,使sgrna质粒载体靶向靶位点,该sgrna质粒载体被命名为sgrna-emx1-1-puro。
构建完成的sgrna质粒载体(sgrna-emx1-1-puro)的核苷酸序列如seqidno.6所示,质粒图谱如图2所示。
表达sgrna-emx1-1的质粒的核苷酸序列如seqidno.6)所示。
细胞培养
以hek293t细胞为转染对象。
用dmem培养基(含10%fbs、2mm的谷氨酰胺和两种抗生素(青霉素和链霉素))培养hek293t细胞,培养环境为37℃、5%co2。
构建转染细胞
将上述实施例中培养好的hek293t细胞移种至24孔板(2×105个细胞/孔)中,每孔加入0.5ml的完全培养基,培养过夜。直至次日细胞融合度约为70-80%时进行转染。转染共使用1μg质粒(750ng的spcas9/spcas9(k510a)质粒和250ngsgrna-emx1-1-puro质粒),采用lipofectamine3000(invitrogen,1.5μllipo3000,2μlp3000)作为转染试剂,参照试剂使用说明书或本领域常规操作转染细胞。
转染后的细胞使用2μg/ml的puromycin在转染后第2-4天进行药筛,药筛结束后的第二天提取基因组dna,备用。
在靶位点和脱靶位点的编辑效率检测
选取已有报道证实的,野生型spcas9在剪切emx1-1位点时,具有较高脱靶率的位点emx1-1-ot1和emx1-1-ot2,用以检测本发明实施例中的spcas9(k510a)突变体spcas9(k510a)突变体的脱靶情况。其中,靶位点emx1-1、脱靶位点emx1-1-ot1和emx1-1-ot2的序列和pam序列如表1所示。
表1靶位点和脱靶位点的靶序列和pam序列
其中,加粗部分为脱靶位点与靶位点不一致的碱基。
采用ddpcr(dropletdigitalpcr,微滴式数字pcr)验证在靶位点和脱靶位点的编辑效率。
针对表1所示的靶位点emx1-1、脱靶位点emx1-1-ot1和emx1-1-ot2的序列,分别设计引物组,以用于扩增出一段包含靶位点或脱靶位点的长约60-200bp的片段,同时,设计reference探针(含有fam荧光修饰基团),用于靶向剪切靶位点两端的序列,设计nhej探针(含有vic荧光修饰基团),用于靶向剪切靶位点。当靶位点没有被编辑时nhej探针可以与靶位点序列结合,当靶位点被编辑时,nhej探针将不能够再与靶位点相结合,因此,可以通过识别靶序列上的vic的荧光即可判断脱靶情况。
其中,靶位点emx1-1、脱靶位点emx1-1-ot1和emx1-1-ot2的引物组、reference探针和nhej探针序列分别为:
(1)靶位点emx1-1:
引物组序列:
上游引物f:5’-cggaggacaaagtacaaacgg-3’(seqidno.10);
下游引物r:5’-gtcattggaggtgacatcgatg-3’(seqidno.11)。
reference探针序列为:5’-fam-ccattggcctgcttcgtggcaatgcg-bhq1-3’(seqidno.12)。
nhej探针序列为:5’-vic-cgagcagaagaagaag-mgb-3’(seqidno.13)。
(2)脱靶位点emx1-1-ot1:
引物组序列:
上游引物f:5’-gctacctgtacatctgcacaag-3’(seqidno.14);
下游引物r:5’-aagaaatgcccaatcattgatgc-3’(seqidno.15)。
reference探针序列为:5’-fam-ctgtcttgccatgccataagcccctatt-bhq1-3’(seqidno.16)。
nhej探针序列为:5’-vic-atgcctttcttcttc-mgb-3’(seqidno.17)。
(3)脱靶位点emx1-1-ot2:
引物组序列:
上游引物f:5’-agcctctttctcaatgtgcttc-3’(seqidno.18);
下游引物r:5’-agagtagatggttgggtagtgg-3’(seqidno.19)。
reference探针序列为:5’-fam-ccatcacggcctttgcaaatagagccct-bhq1-3’(seqidno.20)。
nhej探针序列为:5’-vic-ctaagcagaagaagaagag-mgb-3’(seqidno.21)。
ddpcr中的微滴的制备参照qx200tm微滴式数字pcr系统的说明书或使用其他本领域常规操作进行。
ddpcr反应体系为:
表2.ddpcr反应体系
反应程序为:95℃预变性10min;94℃变性30s;50-65℃退火1min;循环40次;98℃,10min;4℃维持。
使用qx200tm微滴式数字pcr系统检测:微滴通过微滴分析仪依次分开,逐个进行荧光信号的检测,分别检测各个微滴在fam通道和vic通道的荧光信号值。有荧光信号的微滴为阳性,无荧光信号的微滴为阴性。记录每个样品里阳性微滴的数量和占比情况。根据比例关系计算编辑效率。
其中,编辑效率用nhej突变率来计算,公式如下:
结果如图3-4和表3所示。
图2-3分别为野生型spcas9和突变型spcas9(k510a)在emx1-1、emx1-1-ot1、emx1-1-ot2三个位点的编辑效率结果二维图。图2中的蓝色点为单fam阳性,绿色点为单vic阳性,灰色点为fam/vic双阴性,棕色点为fam/vic双阳性。进一步分析发现,野生型spcas9对靶位点emx1-1的编辑率为53.31%,对脱靶位点emx1-1-ot1的编辑率为2.51%,对脱靶位点emx1-1-ot2的编辑率为1.76%。spcas9(k510a)突变体spcas9(k510a)突变体对靶位点emx1-1的编辑率为41.47%,对脱靶位点emx1-1-ot1的编辑率为0.24%,对脱靶位点emx1-1-ot2的编辑率为0.08%。与野生型spcas9相比,突变体spcas9(k510a)对靶位点的编辑效率与野生型spcas9基本持平(70%以上),而且,对脱靶位点的编辑率有了大幅度的显著降低。
表3野生型spcas9和突变型spcas9(k510a)在emx1-1靶位点和脱靶位点的编辑效率
vs.野生型,**p<0.01,***p<0.001。
spcas9(k510a)突变体spcas9(k510a)突变体在靶位点emx1-1的编辑效率验证
采用t7e1酶切法检测spcas9(k510a)突变体的编辑效率。
设计针对emx1-1位点的引物(扩增产物长度为720bp):
上游引物f:5’-cttccagagcctgcactcct-3’(seqidno.22);
下游引物r:5’-aggctctccgaggagaaggc-3’(seqidno.23)。
使用该引物和
表4t7e1酶切法检测结果
vs.野生型,*p<0.05。
结果显示spcas9突变体(k510a)对靶位点emx1-1的剪切率为野生型剪切率的72.0%(表4),与ddpcr检测的结果一致。
综上所述,本发明实施例中的spcas9(k510a)突变体,是将野生型spcas9的第510位赖氨酸残基突变为丙氨酸残基设计得到的。通过t7e1实验对靶序列的编辑情况进行了检测,并通过ddpcr证实spcas9(k510a)突变体在保持了与野生型spcas9的对靶位点剪切效率基本相同的情况下,能够显著降低对脱靶位点的编辑效率,即显著降低脱靶率。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。此外,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
sequencelisting
<110>南方医科大学
<120>一种crisprspcas9突变体及其应用
<130>
<160>23
<170>patentinversion3.5
<210>1
<211>1404
<212>prt
<213>人工序列
<400>1
metasplyslystyrserileglyleuaspileglythrasnserval
151015
glytrpalavalilethraspglutyrlysvalproserlyslysphe
202530
lysvalleuglyasnthrasparghisserilelyslysasnleuile
354045
glyalaleuleupheaspserglygluthralaglualathrargleu
505560
lysargthralaargargargtyrthrargarglysasnargilecys
65707580
tyrleuglngluilepheserasnglumetalalysvalaspaspser
859095
phephehisargleuglugluserpheleuvalglugluasplyslys
100105110
hisgluarghisproilepheglyasnilevalaspgluvalalatyr
115120125
hisglulystyrprothriletyrhisleuarglyslysleuvalasp
130135140
serthrasplysalaaspleuargleuiletyrleualaleualahis
145150155160
metilelyspheargglyhispheleuilegluglyaspleuasnpro
165170175
aspasnseraspvalasplysleupheileglnleuvalglnthrtyr
180185190
asnglnleupheglugluasnproileasnalaserglyvalaspala
195200205
lysalaileleuseralaargleuserlysserargargleugluasn
210215220
leuilealaglnleuproglyglulyslysasnglyleupheglyasn
225230235240
leuilealaleuserleuglyleuthrproasnphelysserasnphe
245250255
aspleualagluaspalalysleuglnleuserlysaspthrtyrasp
260265270
aspaspleuaspasnleuleualaglnileglyaspglntyralaasp
275280285
leupheleualaalalysasnleuseraspalaileleuleuserasp
290295300
ileleuargvalasnthrgluilethrlysalaproleuseralaser
305310315320
metilelysargtyraspgluhishisglnaspleuthrleuleulys
325330335
alaleuvalargglnglnleuproglulystyrlysgluilephephe
340345350
aspglnserlysasnglytyralaglytyrileaspglyglyalaser
355360365
glnglugluphetyrlyspheilelysproileleuglulysmetasp
370375380
glythrglugluleuleuvallysleuasnarggluaspleuleuarg
385390395400
lysglnargthrpheaspasnglyserileprohisglnilehisleu
405410415
glygluleuhisalaileleuargargglngluaspphetyrprophe
420425430
leulysaspasnargglulysileglulysileleuthrpheargile
435440445
protyrtyrvalglyproleualaargglyasnserargphealatrp
450455460
metthrarglysserglugluthrilethrprotrpasnphegluglu
465470475480
valvalasplysglyalaseralaglnserpheilegluargmetthr
485490495
asnpheasplysasnleuproasnglulysvalleuprolyshisser
500505510
leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys
515520525
tyrvalthrgluglymetarglysproalapheleuserglyglugln
530535540
lyslysalailevalaspleuleuphelysthrasnarglysvalthr
545550555560
vallysglnleulysgluasptyrphelyslysileglucyspheasp
565570575
servalgluileserglyvalgluaspargpheasnalaserleugly
580585590
thrtyrhisaspleuleulysileilelysasplysasppheleuasp
595600605
asnglugluasngluaspileleugluaspilevalleuthrleuthr
610615620
leuphegluaspargglumetileglugluargleulysthrtyrala
625630635640
hisleupheaspasplysvalmetlysglnleulysargargargtyr
645650655
thrglytrpglyargleuserarglysleuileasnglyileargasp
660665670
lysglnserglylysthrileleuasppheleulysseraspglyphe
675680685
alaasnargasnphemetglnleuilehisaspaspserleuthrphe
690695700
lysgluaspileglnlysalaglnvalserglyglnglyaspserleu
705710715720
hisgluhisilealaasnleualaglyserproalailelyslysgly
725730735
ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly
740745750
arghislysprogluasnilevalileglumetalaarggluasngln
755760765
thrthrglnlysglyglnlysasnserarggluargmetlysargile
770775780
glugluglyilelysgluleuglyserglnileleulysgluhispro
785790795800
valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu
805810815
glnasnglyargaspmettyrvalaspglngluleuaspileasnarg
820825830
leuserasptyraspvalasphisilevalproglnserpheleulys
835840845
aspaspserileaspasnlysvalleuthrargserasplysasnarg
850855860
glylysseraspasnvalproserglugluvalvallyslysmetlys
865870875880
asntyrtrpargglnleuleuasnalalysleuilethrglnarglys
885890895
pheaspasnleuthrlysalagluargglyglyleusergluleuasp
900905910
lysalaglypheilelysargglnleuvalgluthrargglnilethr
915920925
lyshisvalalaglnileleuaspserargmetasnthrlystyrasp
930935940
gluasnasplysleuilearggluvallysvalilethrleulysser
945950955960
lysleuvalseraspphearglysasppheglnphetyrlysvalarg
965970975
gluileasnasntyrhishisalahisaspalatyrleuasnalaval
980985990
valglythralaleuilelyslystyrprolysleuglusergluphe
99510001005
valtyrglyasptyrlysvaltyraspvalarglysmetileala
101010151020
lyssergluglngluileglylysalathralalystyrphephe
102510301035
tyrserasnilemetasnphephelysthrgluilethrleuala
104010451050
asnglygluilearglysargproleuilegluthrasnglyglu
105510601065
thrglygluilevaltrpasplysglyargaspphealathrval
107010751080
arglysvalleusermetproglnvalasnilevallyslysthr
108510901095
gluvalglnthrglyglypheserlysgluserileleuprolys
110011051110
argasnserasplysleuilealaarglyslysasptrpasppro
111511201125
lyslystyrglyglypheaspserprothrvalalatyrserval
113011351140
leuvalvalalalysvalglulysglylysserlyslysleulys
114511501155
servallysgluleuleuglyilethrilemetgluargserser
116011651170
pheglulysasnproileasppheleuglualalysglytyrlys
117511801185
gluvallyslysaspleuileilelysleuprolystyrserleu
119011951200
phegluleugluasnglyarglysargmetleualaseralagly
120512101215
gluleuglnlysglyasngluleualaleuproserlystyrval
122012251230
asnpheleutyrleualaserhistyrglulysleulysglyser
123512401245
progluaspasngluglnlysglnleuphevalgluglnhislys
125012551260
histyrleuaspgluileilegluglnileserglupheserlys
126512701275
argvalileleualaaspalaasnleuasplysvalleuserala
128012851290
tyrasnlyshisargasplysproilearggluglnalagluasn
129513001305
ileilehisleuphethrleuthrasnleuglyalaproalaala
131013151320
phelystyrpheaspthrthrileasparglysargtyrthrser
132513301335
thrlysgluvalleuaspalathrleuilehisglnserilethr
134013451350
glyleutyrgluthrargileaspleuserglnleuglyglyasp
135513601365
glyserprolyslyslysarglysvalserserasptyrlysasp
137013751380
hisaspglyasptyrlysasphisaspileasptyrlysaspasp
138513901395
aspasplysalaalagly
1400
<210>2
<211>1404
<212>prt
<213>人工序列
<400>2
metasplyslystyrserileglyleuaspileglythrasnserval
151015
glytrpalavalilethraspglutyrlysvalproserlyslysphe
202530
lysvalleuglyasnthrasparghisserilelyslysasnleuile
354045
glyalaleuleupheaspserglygluthralaglualathrargleu
505560
lysargthralaargargargtyrthrargarglysasnargilecys
65707580
tyrleuglngluilepheserasnglumetalalysvalaspaspser
859095
phephehisargleuglugluserpheleuvalglugluasplyslys
100105110
hisgluarghisproilepheglyasnilevalaspgluvalalatyr
115120125
hisglulystyrprothriletyrhisleuarglyslysleuvalasp
130135140
serthrasplysalaaspleuargleuiletyrleualaleualahis
145150155160
metilelyspheargglyhispheleuilegluglyaspleuasnpro
165170175
aspasnseraspvalasplysleupheileglnleuvalglnthrtyr
180185190
asnglnleupheglugluasnproileasnalaserglyvalaspala
195200205
lysalaileleuseralaargleuserlysserargargleugluasn
210215220
leuilealaglnleuproglyglulyslysasnglyleupheglyasn
225230235240
leuilealaleuserleuglyleuthrproasnphelysserasnphe
245250255
aspleualagluaspalalysleuglnleuserlysaspthrtyrasp
260265270
aspaspleuaspasnleuleualaglnileglyaspglntyralaasp
275280285
leupheleualaalalysasnleuseraspalaileleuleuserasp
290295300
ileleuargvalasnthrgluilethrlysalaproleuseralaser
305310315320
metilelysargtyraspgluhishisglnaspleuthrleuleulys
325330335
alaleuvalargglnglnleuproglulystyrlysgluilephephe
340345350
aspglnserlysasnglytyralaglytyrileaspglyglyalaser
355360365
glnglugluphetyrlyspheilelysproileleuglulysmetasp
370375380
glythrglugluleuleuvallysleuasnarggluaspleuleuarg
385390395400
lysglnargthrpheaspasnglyserileprohisglnilehisleu
405410415
glygluleuhisalaileleuargargglngluaspphetyrprophe
420425430
leulysaspasnargglulysileglulysileleuthrpheargile
435440445
protyrtyrvalglyproleualaargglyasnserargphealatrp
450455460
metthrarglysserglugluthrilethrprotrpasnphegluglu
465470475480
valvalasplysglyalaseralaglnserpheilegluargmetthr
485490495
asnpheasplysasnleuproasnglulysvalleuproalahisser
500505510
leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys
515520525
tyrvalthrgluglymetarglysproalapheleuserglyglugln
530535540
lyslysalailevalaspleuleuphelysthrasnarglysvalthr
545550555560
vallysglnleulysgluasptyrphelyslysileglucyspheasp
565570575
servalgluileserglyvalgluaspargpheasnalaserleugly
580585590
thrtyrhisaspleuleulysileilelysasplysasppheleuasp
595600605
asnglugluasngluaspileleugluaspilevalleuthrleuthr
610615620
leuphegluaspargglumetileglugluargleulysthrtyrala
625630635640
hisleupheaspasplysvalmetlysglnleulysargargargtyr
645650655
thrglytrpglyargleuserarglysleuileasnglyileargasp
660665670
lysglnserglylysthrileleuasppheleulysseraspglyphe
675680685
alaasnargasnphemetglnleuilehisaspaspserleuthrphe
690695700
lysgluaspileglnlysalaglnvalserglyglnglyaspserleu
705710715720
hisgluhisilealaasnleualaglyserproalailelyslysgly
725730735
ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly
740745750
arghislysprogluasnilevalileglumetalaarggluasngln
755760765
thrthrglnlysglyglnlysasnserarggluargmetlysargile
770775780
glugluglyilelysgluleuglyserglnileleulysgluhispro
785790795800
valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu
805810815
glnasnglyargaspmettyrvalaspglngluleuaspileasnarg
820825830
leuserasptyraspvalasphisilevalproglnserpheleulys
835840845
aspaspserileaspasnlysvalleuthrargserasplysasnarg
850855860
glylysseraspasnvalproserglugluvalvallyslysmetlys
865870875880
asntyrtrpargglnleuleuasnalalysleuilethrglnarglys
885890895
pheaspasnleuthrlysalagluargglyglyleusergluleuasp
900905910
lysalaglypheilelysargglnleuvalgluthrargglnilethr
915920925
lyshisvalalaglnileleuaspserargmetasnthrlystyrasp
930935940
gluasnasplysleuilearggluvallysvalilethrleulysser
945950955960
lysleuvalseraspphearglysasppheglnphetyrlysvalarg
965970975
gluileasnasntyrhishisalahisaspalatyrleuasnalaval
980985990
valglythralaleuilelyslystyrprolysleuglusergluphe
99510001005
valtyrglyasptyrlysvaltyraspvalarglysmetileala
101010151020
lyssergluglngluileglylysalathralalystyrphephe
102510301035
tyrserasnilemetasnphephelysthrgluilethrleuala
104010451050
asnglygluilearglysargproleuilegluthrasnglyglu
105510601065
thrglygluilevaltrpasplysglyargaspphealathrval
107010751080
arglysvalleusermetproglnvalasnilevallyslysthr
108510901095
gluvalglnthrglyglypheserlysgluserileleuprolys
110011051110
argasnserasplysleuilealaarglyslysasptrpasppro
111511201125
lyslystyrglyglypheaspserprothrvalalatyrserval
113011351140
leuvalvalalalysvalglulysglylysserlyslysleulys
114511501155
servallysgluleuleuglyilethrilemetgluargserser
116011651170
pheglulysasnproileasppheleuglualalysglytyrlys
117511801185
gluvallyslysaspleuileilelysleuprolystyrserleu
119011951200
phegluleugluasnglyarglysargmetleualaseralagly
120512101215
gluleuglnlysglyasngluleualaleuproserlystyrval
122012251230
asnpheleutyrleualaserhistyrglulysleulysglyser
123512401245
progluaspasngluglnlysglnleuphevalgluglnhislys
125012551260
histyrleuaspgluileilegluglnileserglupheserlys
126512701275
argvalileleualaaspalaasnleuasplysvalleuserala
128012851290
tyrasnlyshisargasplysproilearggluglnalagluasn
129513001305
ileilehisleuphethrleuthrasnleuglyalaproalaala
131013151320
phelystyrpheaspthrthrileasparglysargtyrthrser
132513301335
thrlysgluvalleuaspalathrleuilehisglnserilethr
134013451350
glyleutyrgluthrargileaspleuserglnleuglyglyasp
135513601365
glyserprolyslyslysarglysvalserserasptyrlysasp
137013751380
hisaspglyasptyrlysasphisaspileasptyrlysaspasp
138513901395
aspasplysalaalagly
1400
<210>3
<211>20
<212>dna
<213>人工序列
<400>3
gagtccgagcagaagaagaa20
<210>4
<211>7614
<212>dna
<213>人工序列
<400>4
cggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctga60
tgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtg120
cgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatct180
gcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgaca240
ttgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccata300
tatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacga360
cccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggacttt420
ccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagt480
gtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggca540
ttatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagt600
catcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtt660
tgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggca720
ccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatggg780
cggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagat840
ccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatggata900
aaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccg960
atgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcga1020
ttaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactc1080
gcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttac1140
aagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaag1200
agtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatag1260
tagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctag1320
ttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataa1380
agttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgaca1440
aactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatg1500
caagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctag1560
aaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatag1620
cgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgcca1680
aattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattg1740
gagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctat1800
ctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatca1860
aaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaac1920
tgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttata1980
ttgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaaga2040
tggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagc2100
ggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatac2160
ttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaa2220
tcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcg2280
catggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcg2340
ataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttac2400
cgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatg2460
aactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggag2520
aacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagc2580
aattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccgggg2640
tagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaag2700
ataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactc2760
ttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgt2820
tcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgt2880
cgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttc2940
taaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaa3000
ccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaac3060
atattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaag3120
tagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgaga3180
tggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaaga3240
gaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaa3300
atacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgt3360
atgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtac3420
cccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataaga3480
accgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactatt3540
ggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaag3600
ctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtgg3660
aaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaat3720
acgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattgg3780
tgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccacc3840
atgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccga3900
agctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcg3960
cgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacatta4020
tgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaa4080
ttgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacgg4140
tgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccg4200
gagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgta4260
aaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctg4320
tcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaat4380
tattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttg4440
aggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtc4500
tgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaagg4560
ggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacg4620
agaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcaca4680
aacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctag4740
ctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatac4800
gtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccg4860
cattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgc4920
tagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgt4980
cacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaag5040
accatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctg5100
caggatgaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgac5160
tgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccct5220
ggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtct5280
gagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattg5340
ggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaag5400
aaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcata5460
gctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaag5520
cataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcg5580
ctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggcca5640
acgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactc5700
gctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacg5760
gttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaa5820
ggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctga5880
cgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaag5940
ataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgct6000
taccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacg6060
ctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaacc6120
ccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggt6180
aagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggta6240
tgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaac6300
agtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctc6360
ttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagat6420
tacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgc6480
tcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatctt6540
cacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagta6600
aacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtct6660
atttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggaggg6720
cttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccaga6780
tttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaacttt6840
atccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagt6900
taatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtt6960
tggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccat7020
gttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggc7080
cgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatc7140
cgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtat7200
gcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcag7260
aactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatctt7320
accgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatc7380
ttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaa7440
gggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattg7500
aagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaa7560
taaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcga7614
<210>5
<211>7614
<212>dna
<213>人工序列
<400>5
cggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctga60
tgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtg120
cgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatct180
gcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgaca240
ttgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccata300
tatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacga360
cccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggacttt420
ccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagt480
gtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggca540
ttatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagt600
catcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtt660
tgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggca720
ccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatggg780
cggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagat840
ccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatggata900
aaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccg960
atgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcga1020
ttaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactc1080
gcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttac1140
aagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaag1200
agtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatag1260
tagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctag1320
ttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataa1380
agttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgaca1440
aactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatg1500
caagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctag1560
aaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatag1620
cgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgcca1680
aattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattg1740
gagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctat1800
ctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatca1860
aaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaac1920
tgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttata1980
ttgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaaga2040
tggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagc2100
ggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatac2160
ttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaa2220
tcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcg2280
catggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcg2340
ataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttac2400
cgaacgaaaaagtattgcctgcccacagtttactttacgagtatttcacagtgtacaatg2460
aactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggag2520
aacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagc2580
aattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccgggg2640
tagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaag2700
ataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactc2760
ttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgt2820
tcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgt2880
cgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttc2940
taaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaa3000
ccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaac3060
atattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaag3120
tagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgaga3180
tggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaaga3240
gaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaa3300
atacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgt3360
atgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtac3420
cccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataaga3480
accgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactatt3540
ggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaag3600
ctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtgg3660
aaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaat3720
acgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattgg3780
tgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccacc3840
atgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccga3900
agctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcg3960
cgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacatta4020
tgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaa4080
ttgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacgg4140
tgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccg4200
gagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgta4260
aaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctg4320
tcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaat4380
tattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttg4440
aggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtc4500
tgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaagg4560
ggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacg4620
agaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcaca4680
aacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctag4740
ctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatac4800
gtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccg4860
cattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgc4920
tagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgt4980
cacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaag5040
accatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctg5100
caggatgaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgac5160
tgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccct5220
ggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtct5280
gagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattg5340
ggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaag5400
aaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcata5460
gctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaag5520
cataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcg5580
ctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggcca5640
acgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactc5700
gctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacg5760
gttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaa5820
ggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctga5880
cgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaag5940
ataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgct6000
taccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacg6060
ctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaacc6120
ccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggt6180
aagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggta6240
tgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaac6300
agtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctc6360
ttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagat6420
tacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgc6480
tcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatctt6540
cacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagta6600
aacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtct6660
atttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggaggg6720
cttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccaga6780
tttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaacttt6840
atccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagt6900
taatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtt6960
tggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccat7020
gttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggc7080
cgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatc7140
cgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtat7200
gcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcag7260
aactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatctt7320
accgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatc7380
ttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaa7440
gggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattg7500
aagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaa7560
taaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcga7614
<210>6
<211>8408
<212>dna
<213>人工序列
<400>6
aatgtagtcttatgcaatactcttgtagtcttgcaacatggtaacgatgagttagcaaca60
tgccttacaaggagagaaaaagcaccgtgcatgccgattggtggaagtaaggtggtacga120
tcgtgccttattaggaaggcaacagacgggtctgacatggattggacgaaccactgaatt180
gccgcattgcagagatattgtatttaagtgcctagctcgatacataaacgggtctctctg240
gttagaccagatctgagcctgggagctctctggctaactagggaacccactgcttaagcc300
tcaataaagcttgccttgagtgcttcaagtagtgtgtgcccgtctgttgtgtgactctgg360
taactagagatccctcagacccttttagtcagtgtggaaaatctctagcagtggcgcccg420
aacagggacttgaaagcgaaagggaaaccagaggagctctctcgacgcaggactcggctt480
gctgaagcgcgcacggcaagaggcgaggggcggcgactggtgagtacgccaaaaattttg540
actagcggaggctagaaggagagagatgggtgcgagagcgtcagtattaagcgggggaga600
attagatcgcgatgggaaaaaattcggttaaggccagggggaaagaaaaaatataaatta660
aaacatatagtatgggcaagcagggagctagaacgattcgcagttaatcctggcctgtta720
gaaacatcagaaggctgtagacaaatactgggacagctacaaccatcccttcagacagga780
tcagaagaacttagatcattatataatacagtagcaaccctctattgtgtgcatcaaagg840
atagagataaaagacaccaaggaagctttagacaagatagaggaagagcaaaacaaaagt900
aagaccaccgcacagcaagcggccgctgatcttcagacctggaggaggagatatgaggga960
caattggagaagtgaattatataaatataaagtagtaaaaattgaaccattaggagtagc1020
acccaccaaggcaaagagaagagtggtgcagagagaaaaaagagcagtgggaataggagc1080
tttgttccttgggttcttgggagcagcaggaagcactatgggcgcagcgtcaatgacgct1140
gacggtacaggccagacaattattgtctggtatagtgcagcagcagaacaatttgctgag1200
ggctattgaggcgcaacagcatctgttgcaactcacagtctggggcatcaagcagctcca1260
ggcaagaatcctggctgtggaaagatacctaaaggatcaacagctcctggggatttgggg1320
ttgctctggaaaactcatttgcaccactgctgtgccttggaatgctagttggagtaataa1380
atctctggaacagatttggaatcacacgacctggatggagtgggacagagaaattaacaa1440
ttacacaagcttaatacactccttaattgaagaatcgcaaaaccagcaagaaaagaatga1500
acaagaattattggaattagataaatgggcaagtttgtggaattggtttaacataacaaa1560
ttggctgtggtatataaaattattcataatgatagtaggaggcttggtaggtttaagaat1620
agtttttgctgtactttctatagtgaatagagttaggcagggatattcaccattatcgtt1680
tcagacccacctcccaaccccgaggggacccgacaggcccgaaggaatagaagaagaagg1740
tggagagagagacagagacagatccattcgattagtgaacggatctcgacggtatcgcta1800
gcttttaaaagaaaaggggggattggggggtacagtgcaggggaaagaatagtagacata1860
atagcaacagacatacaaactaaagaattacaaaaacaaattacaaaaattcaaaatttt1920
actagtgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgtt1980
agagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtga2040
cgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggac2100
tatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtgg2160
aaaggacgaaacaccggagtccgagcagaagaagaagttttagagctagaaatagcaagt2220
taaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttgt2280
ctagaggtaccgaattccaactttgtatagaaaagttggggttgcgccttttccaaggca2340
gccctgggtttgcgcagggacgcggctgctctgggcgtggttccgggaaacgcagcggcg2400
ccgaccctgggtctcgcacattcttcacgtccgttcgcagcgtcacccggatcttcgccg2460
ctacccttgtgggccccccggcgacgcttcctgctccgcccctaagtcgggaaggttcct2520
tgcggttcgcggcgtgccggacgtgacaaacggaagccgcacgtctcactagtaccctcg2580
cagacggacagcgccagggagcaatggcagcgcgccgaccgcgatgggctgtggccaata2640
gcggctgctcagcagggcgcgccgagagcagcggccgggaaggggcggtgcgggaggcgg2700
ggtgtggggcggtagtgtgggccctgttcctgcccgcgcggtgttccgcattctgcaagc2760
ctccggagcgcacgtcggcagtcggctccctcgttgaccgaatcaccgacctctctcccc2820
aggcaagtttgtacaaaaaagcaggctgccaccatggtgagcaagggcgaggagctgttc2880
accggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagc2940
gtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgc3000
accaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtg3060
cagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatg3120
cccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacc3180
cgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatc3240
gacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccac3300
aacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgc3360
cacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatc3420
ggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagc3480
aaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccggg3540
atcactctcggcatggacgagctgtacaagggctccggagagggcaggggaagtcttcta3600
acatgcggggacgtggaggaaaatcccggccccatgaccgagtacaagcccacggtgcgc3660
ctcgccacccgcgacgacgtccccagggccgtacgcaccctcgccgccgcgttcgccgac3720
taccccgccacgcgccacaccgtcgatccggaccgccacatcgagcgggtcaccgagctg3780
caagaactcttcctcacgcgcgtcgggctcgacatcggcaaggtgtgggtcgcggacgac3840
ggcgccgcggtggcggtctggaccacgccggagagcgtcgaagcgggggcggtgttcgcc3900
gagatcggcccgcgcatggccgagttgagcggttcccggctggccgcgcagcaacagatg3960
gaaggcctcctggcgccgcaccggcccaaggagcccgcgtggttcctggccaccgtcggc4020
gtctcgcccgaccaccagggcaagggtctgggcagcgccgtcgtgctccccggagtggag4080
gcggccgagcgcgccggggtgcccgccttcctggagacctccgcgccccgcaacctcccc4140
ttctacgagcggctcggcttcaccgtcaccgccgacgtcgaggtgcccgaaggaccgcgc4200
acctggtgcatgacccgcaagcccggtgcctgaacccagctttcttgtacaaagtggtgg4260
tacccgataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaact4320
atgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattg4380
cttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatg4440
aggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaa4500
cccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttcc4560
ccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacagggg4620
ctcggctgttgggcactgacaattccgtggtgttgtcggggaagctgacgtcctttccat4680
ggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtccctt4740
cggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttc4800
cgcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcatc4860
ggctttaagaccaatgacttacaaggcagctgtagatcttagccactttttaaaagaaaa4920
ggggggactggaagggctaattcactcccaacgaagacaagatctgctttttgcttgtac4980
tgggtctctctggttagaccagatctgagcctgggagctctctggctaactagggaaccc5040
actgcttaagcctcaataaagcttgccttgagtgcttcaagtagtgtgtgcccgtctgtt5100
gtgtgactctggtaactagagatccctcagacccttttagtcagtgtggaaaatctctag5160
cagtagtagttcatgtcatcttattattcagtatttataacttgcaaagaaatgaatatc5220
agagagtgagaggaacttgtttattgcagcttataatggttacaaataaagcaatagcat5280
cacaaatttcacaaataaagcatttttttcactgcattctagttgtggtttgtccaaact5340
catcaatgtatcttatcatgtctggctctagctatcccgcccctaactccgcccatcccg5400
cccctaactccgcccagttccgcccattctccgccccatggctgactaattttttttatt5460
tatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggcttt5520
tttggaggcctagggacgtacccaattcgccctatagtgagtcgtattacgcgcgctcac5580
tggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgcc5640
ttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcc5700
cttcccaacagttgcgcagcctgaatggcgaatgggacgcgccctgtagcggcgcattaa5760
gcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgc5820
ccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaag5880
ctctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgacccca5940
aaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttc6000
gccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaa6060
cactcaaccctatctcggtctattcttttgatttataagggattttgccgatttcggcct6120
attggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaa6180
cgcttacaatttaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatt6240
tttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttca6300
ataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattccctt6360
ttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaaga6420
tgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaa6480
gatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttct6540
gctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcat6600
acactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacgga6660
tggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggc6720
caacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacat6780
gggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaa6840
cgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaac6900
tggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataa6960
agttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatc7020
tggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagcc7080
ctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatag7140
acagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagttta7200
ctcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaa7260
gatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagc7320
gtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaat7380
ctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaaga7440
gctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgt7500
tcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacata7560
cctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttac7620
cgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacgggggg7680
ttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcg7740
tgagctatgagaaagcgccacgcttcccgaagagagaaaggcggacaggtatccggtaag7800
cggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatct7860
ttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtc7920
aggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggcctt7980
ttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccg8040
tattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcga8100
gtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttg8160
gccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcg8220
caacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgct8280
tccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagcta8340
tgaccatgattacgccaagcgcgcaattaaccctcactaaagggaacaaaagctggagct8400
gcaagctt8408
<210>7
<211>20
<212>dna
<213>人工序列
<400>7
gagtccgagcagaagaagaa20
<210>8
<211>20
<212>dna
<213>人工序列
<400>8
gagttagagcagaagaagaa20
<210>9
<211>20
<212>dna
<213>人工序列
<400>9
gagtctaagcagaagaagaa20
<210>10
<211>21
<212>dna
<213>人工序列
<400>10
cggaggacaaagtacaaacgg21
<210>11
<211>22
<212>dna
<213>人工序列
<400>11
gtcattggaggtgacatcgatg22
<210>12
<211>26
<212>dna
<213>人工序列
<400>12
ccattggcctgcttcgtggcaatgcg26
<210>13
<211>16
<212>dna
<213>人工序列
<400>13
cgagcagaagaagaag16
<210>14
<211>22
<212>dna
<213>人工序列
<400>14
gctacctgtacatctgcacaag22
<210>15
<211>23
<212>dna
<213>人工序列
<400>15
aagaaatgcccaatcattgatgc23
<210>16
<211>28
<212>dna
<213>人工序列
<400>16
ctgtcttgccatgccataagcccctatt28
<210>17
<211>15
<212>dna
<213>人工序列
<400>17
atgcctttcttcttc15
<210>18
<211>22
<212>dna
<213>人工序列
<400>18
agcctctttctcaatgtgcttc22
<210>19
<211>22
<212>dna
<213>人工序列
<400>19
agagtagatggttgggtagtgg22
<210>20
<211>28
<212>dna
<213>人工序列
<400>20
ccatcacggcctttgcaaatagagccct28
<210>21
<211>19
<212>dna
<213>人工序列
<400>21
ctaagcagaagaagaagag19
<210>22
<211>20
<212>dna
<213>人工序列
<400>22
cttccagagcctgcactcct20
<210>23
<211>20
<212>dna
<213>人工序列
<400>23
aggctctccgaggagaaggc20