一种CRISPRSpCas9(K510A)突变体及其应用的制作方法

文档序号:24368089发布日期:2021-03-23 11:01阅读:137来源:国知局
一种CRISPR SpCas9(K510A)突变体及其应用的制作方法

本发明属于分子生物学领域,具体涉及一种crisprspcas9(k510a)突变体及其应用。



背景技术:

spcas9(spcas9)在基因编辑中应用广泛。spcas9基因编辑系统包括spcas9蛋白和sgrna。spcas9蛋白和sgrna结合形成复合物,该复合物通过spcas9上的与pam相互作用结构域和sgrna上的向导序列(guidesequence)序列特异性识别靶位点,并利用hnh结构域和ruvc结构域对靶标dna进行双链平端剪切。在活体细胞中,剪切后的基因组dna可以启动nhej进行修复,从而产生插入/缺失突变(indel)。

但在相关技术中,野生型spcas9虽然可以高效的对基因进行编辑,却在编辑靶位点的同时也对一些与靶位点类似的非靶位点进行编辑,这严重影响了spcas9的临床应用。

因此,亟待开发一种新型spcas9。



技术实现要素:

本发明旨在至少解决上述现有技术中存在的技术问题之一。为此,本发明提出一种spcas9突变体或其活性片段,相比于常规的野生型spcas9,在保持了与野生型spcas9的对靶位点剪切效率基本相同的情况下,能够显著降低对脱靶位点的编辑效率,即显著降低脱靶率。

本发明还提出一种提供编码上述spcas9突变体或其活性片段的基因。

本发明还提出一种组合物。

本发明还提出一种多核苷酸。

本发明还提出一种向导多核苷酸/cas复合物。

本发明还提出含有上述基因的重组载体、重组菌或细胞。

本发明还提出一种修饰细胞基因组中的靶位点的方法。

本发明还提出上述spcas9突变体或其活性片段或上述基因在基因编辑中的应用。

根据本发明的第一个方面,提供一种spcas9突变体或其活性片段,该spcas9突变体或其活性片段包括:与seqidno.1所示的野生型spcas9多肽具有至少90%的氨基酸同一性,且野生型spcas9多肽的rec3结构域的第510位氨基酸残基突变为丙氨酸残基,其中,该spcas9突变体具有内切核酸酶活性。

根据本发明的一种优选的实施方式,至少具有以下有益效果:本发明中的spcas9(k510a)突变体,是将野生型spcas9(seqidno.1)的第510位赖氨酸残基突变为丙氨酸残基设计得到的。发明人分析野生型spcas9rec3结构域的氨基酸残基与sgrna/靶dna杂合双链的相互作用,发现rec3结构中的部分氨基酸残基与sgrna/靶dna双链形成了非特异性的氢键相互作用,通过进一步对于相互作用力类型、大小及结构的筛选后,得到了rec3结构中的第510位的亲水性氨基酸残基赖氨酸残基(lysineresidue)为最佳突变点。通过将将野生型spcas9rec3结构域第510位的赖氨酸残基突变为丙氨酸残基,在反复验证证实spcas9(k510a)突变体在保持了与野生型spcas9的对靶位点剪切效率基本相同的情况下,能够显著降低对脱靶位点的编辑效率,即显著降低脱靶率。

其中,上述seqidno.1所示野生型spcas9的氨基酸序列为:

mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdgspkkkrkvssdykdhdgdykdhdidykddddkaag(seqidno.1)。

加粗且标有下划线的部分即为突变前的赖氨酸残基;

仅标有下划线的部分为修饰序列。

在本发明的一些实施方式中,上述spcas9突变体或其活性片段还包括:与seqidno.1所示的野生型spcas9多肽具有至少89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%的氨基酸同一性,且野生型spcas9多肽的rec3结构域的第510位氨基酸残基突变为丙氨酸残基,其中,该spcas9突变体具有内切核酸酶活性。

在本发明的一些实施方式中,上述spcas9突变体或其活性片段的氨基酸序列包括:

(1)seqidno.2所示的氨基酸序列;或

(2)seqidno.2所示的spcas9(k510a)突变体的氨基酸序列经取代、缺失和/或增加一个或多个氨基酸和/或末端修饰后且具内切核酸酶活性的序列。

其中,上述seqidno.2所示的spcas9(k510a)突变体的氨基酸序列为:

mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpahsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdgspkkkrkvssdykdhdgdykdhdidykddddkaag(seqidno.2)。

加粗且标有下滑线的部分即为突变后的丙氨酸残基;

仅标有下划线的部分为修饰序列。

在本发明的一些优选的实施方式中,上述spcas9突变体或其活性片段的氨基酸序列还包括:在seqidno.2所示氨基酸序列的基础上加入核信号肽、3×flag或his6标签或其他本领域中常规的修饰序列等修饰得到的序列。

根据本发明的第二个方面,提供编码本发明第一个方面所述的spcas9突变体或其活性片段的基因。

根据本发明的一种优选的实施方式,至少具有以下有益效果:上述编码本发明第一个方面所述的spcas9突变体或其活性片段的基因可用于表达本发明第一个方面所述的spcas9突变体或其活性片段,表达得到的spcas9(k510a)突变体spcas9(k510a)突变体在保持了与野生型spcas9的对靶位点剪切效率基本相同的情况下,能够显著降低对脱靶位点的编辑效率,即显著降低脱靶率。

根据本发明的第三个方面,提供一种组合物,该组合物含有本发明第一个方面所述的spcas9突变体或其活性片段。

根据本发明的一种优选的实施方式,至少具有以下有益效果:上述组合物含有本发明第一个方面所述的spcas9突变体或其活性片段,通过利用该组合物,可以使基因编辑过程中的脱靶率显著降低。

根据本发明的第四个方面,提供一种多核苷酸,该多核苷酸含有本发明的第二个方面所述的基因。

在本发明的一些优选的实施方式中,上述多核苷酸为向导多核苷酸。

在本发明的一些更优选的实施方式中,上述向导多核苷酸为sgrna。

在本发明的一些更优选的实施方式中,上述sgrna的向导序列(guidesequence)为:

5’-gagtccgagcagaagaagaa-3’(seqidno.3)。

cas9的靶向特异性取决于20nt的sgrna向导序列以及基因组中与目标序列相邻的pam的存在,因此,涉及合理且有效的sgrna向导序列可有效的提高cas9的可用性。

使用上述sgrna的向导序列构建的sgrna质粒载体还可以插入抗生素抗性基因和报告基团(gfp)序列。

在本发明的一些更优选的实施方式中,上述抗生素抗性基因包括真核puromycin(嘌呤霉素)抗性基因或潮霉素抗性基因。

在本发明的一些更优选的实施方式中,上述抗生素抗性基因为真核puromycin抗性基因。

在本发明的一些更优选的实施方式中,上述报告基团包括egfp基团。

当然,本领域技术人员也可以根据实际需求,插入其他功能性基因,如强力霉素(doxycycline)的诱导启动子,以增强cas9的瞬时表达。

根据本发明的第五个方面,提供一种向导多核苷酸/cas复合物,该向导多核苷酸/cas复合物包含至少一种向导多核苷酸和至少一种本发明第一个方面所述的spcas9突变体或其活性片段;

其中,该向导多核苷酸是嵌合的非天然存在的向导多核苷酸;

该向导多核苷酸/cas复合物能完全或部分识别、结合靶序列并使靶序列产生切口或解旋、切割靶序列。

在本发明的一些优选的实施方式中,上述多核苷酸为向导多核苷酸。

在本发明的一些更优选的实施方式中,上述向导多核苷酸为sgrna。

在本发明的一些更优选的实施方式中,上述sgrna的向导序列(guidesequence)如seqidno.3所示。

将crispr/cas9组分导入细胞通常是利用dna导入系统来实现的,比如将编码cas9和sgrna的质粒转染到细胞内。但当质粒导入存在问题时,可以直接导入cas9/sgrna核糖核蛋白(rnp)复合物或者使用病毒载体(如慢病毒载体)来实现基因编辑。与导入质粒的方法相比,采用导入cas9/sgrna核糖核蛋白(rnp)复合物的方法进行编辑,在导入细胞后可以快速开始切割。cas9/sgrna核糖核蛋白(rnp)复合物具有较少的脱靶率和较低的免疫原性,使用病毒载体转染时,转染效率更高,且持续时间长。

根据本发明的第六个方面,提供含有本发明第二个方面所述基因的重组载体、重组菌或细胞。

在本发明的一些实施方式中,上述细胞包括原核细胞或真核细胞。

在本发明的一些优选的实施方式中,上述细胞包括:动物、细菌、真菌、昆虫、酵母和植物来源的细胞。

在本发明的一些更优选的实施方式中,上述细胞包括:体内、离体或体外的人细胞、动物细胞、植物细胞和单细胞生物;其中,所述人细胞、动物细胞优选为人和动物的血细胞。

根据本发明的第七个方面,提供一种修饰细胞基因组中的靶位点的方法,包括:将本发明的第五个方面所述的向导多核苷酸/cas复合物导入细胞中,使所述细胞中的靶位点具有如下修饰:

至少一个核苷酸的替代;和/或

至少一个核苷酸的缺失;和/或

至少一个核苷酸的插入。

根据本发明的第八个方面,提供本发明第一个方面所述spcas9突变体或其活性片段或本发明第二个方面所述基因在基因编辑中的应用。

根据本发明的一种优选的实施方式,至少具有以下有益效果:本发明中的spcas9(k510a)突变体是将野生型spcas9的第510位赖氨酸残基突变为丙氨酸残基设计得到的。发明人分析野生型spcas9rec3结构域的氨基酸残基与sgrna/靶dna杂合双链的相互作用,发现rec3结构中的部分氨基酸残基与sgrna/靶dna双链形成了非特异性的氢键相互作用,通过进一步对于相互作用力类型、大小及结构的筛选后,得到了rec3结构中的第510位的亲水性氨基酸残基赖氨酸残基(lysineresidue)为最佳突变点。通过将将野生型spcas9rec3结构域第510位的赖氨酸残基突变为丙氨酸残基,在反复验证证实spcas9突变体spcas9(k510a)在保持了与野生型spcas9的对靶位点剪切效率基本相同的情况下,能够显著降低对脱靶位点的编辑效率,即显著降低脱靶率。

附图说明

下面结合附图和实施例对本发明做进一步的说明,其中:

图1为本发明实施例中的spcas9的质粒图谱;

图2为本发明实施例中的sgrna质粒图谱;

图3为野生型spcas9在emx1-1(a)、emx1-1-ot1(b)、emx1-1-ot2(c)三个位点的编辑效率结果二维图;其中,蓝色点:单fam阳性,绿色点:单vic阳性,灰色点:fam/vic双阴性,棕色点:fam/vic双阳性;

图4为突变型spcas9(k510a)在emx1-1(a)、emx1-1-ot1(b)、emx1-1-ot2(c)三个位点的编辑效率结果二维图;其中,蓝色点:单fam阳性,绿色点:单vic阳性,灰色点:fam/vic双阴性,棕色点:fam/vic双阳性。

具体实施方式

以下将结合实施例对本发明的构思及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。

关于本发明说明书中的术语:spcas9是指酿脓链球菌(streptococcuspyogenes)cas9,cas是指成簇的规律的间隔回文序列(crispr(clusteredregularlyinterspacedshortpalindromicrepeats)associated)。

术语“cas蛋白”或“cas多肽”是指由cas(crispr-相关的)基因编码的多肽。cas蛋白包括cas内切核酸酶。

术语“cas内切核酸酶”是指当与适合的多核苷酸组分复合时能够识别、结合特定dna靶序列的全部或部分、并任选地使特定多核苷酸靶序列的全部或部分产生切口或切割特定多核苷酸靶序列的全部或部分的cas多肽(cas蛋白)。cas内切核酸酶由所述向导多核苷酸指导以识别、结合双链dna中的特定靶位点的全部或部分并任选地使双链dna中的特定靶位点的全部或部分产生切口或切割双链dna中的特定靶位点的全部或部分(例如,在细胞基因组中的靶位点处)。本文描述的cas内切核酸酶包含一个或多个核酸酶结构域。在本文所述的供体dna插入方法中采用的cas内切核酸酶是在靶位点处向dna中引入单链或双链断裂的内切核酸酶。可替代地,本文中的cas内切核酸酶可能缺乏dna切割或切口活性,但是当与合适的rna组分复合时,仍然可以特异性结合dna靶序列。

质粒的设计与构建

下述实施例中以bpk4410质粒(addgeneplasmid#101178)作为示例,但需要注意的是,本发明不限于bpk4410质粒,在所属技术领域普通技术人员所具备的知识范围内,可以合理选择具有替代性的质粒作为实验载体。

(1)spcas9突变体质粒载体构建:

发明人根据sgrna/靶dna杂合双链压缩可以引起双链的疏水性增强,从而引起sgrna/靶dna杂合双链与rec3结构域之间的疏水作用增强,而增强的疏水作用导致rec3结构域向sgrna/靶dna杂合双链移动,进而启动剪切这一假定。从而进一步设想上述发现的最佳情况应为rec3结构域与sgrna/靶dna杂合双链之间的作用力只有疏水相互作用而没有氢键等非特异性相互作用,且只有当sgrna与靶dna链100%匹配时才能启动rec3结构域向sgrna/靶dna杂合双链的移动。根据设想,发明人通过分析rec3结构域的氨基酸残基与sgrna/靶dna杂合双链的相互作用,发现部分氨基酸残基与sgrna/靶dna双链形成了非特异性的氢键相互作用,进一步通过考虑相互作用力类型、大小及结构等因素,筛选得到通过突变510位的亲水性氨基酸残基赖氨酸残基为丙氨酸残基可以获得最佳的突变体spcas9(k510a)。

具体构建步骤为:

以质粒bpk4410(hypercas9,addgeneplasmid#101178)为模板,首先将hypercas9的692位的丙氨酸残基突变为天冬酰胺残基,第694位的丙氨酸残基突变为蛋氨酸残基,将第695位的丙氨酸残基突变为谷氨酰胺残基,将第698位的丙氨酸残基突变为组氨酸残基,得到野生型spcas9。

将spcas9氨基酸序列的第510位赖氨酸残基突变为丙氨酸残基,得到突变体spcas9(k510a)。

其中,野生型spcas9氨基酸序列如seqidno.1所示,突变后的突变体spcas9(k510a)的氨基酸序列如seqidno.2所示。

表达野生型spcas9的质粒的核苷酸序列如seqidno.4所示。

表达spcas9(k510a)的质粒的核苷酸序列如seqidno.5所示:

构建完成的spcas9(k510a)突变体的质粒图谱如图1所示。

(2)构建sgrna质粒载体(sgrna-emx1-1-puro):

设计sgrna,经过筛选后,选择seqidno.3所示序列为向导序列。

seqidno.3所示序列为:

5’-gagtccgagcagaagaagaa-3’(seqidno.3)。

构建完成的sgrna质粒载体还包括启动子、真核puromycin抗性基因序列和egfp报告基团序列,转染后可以表达绿色荧光蛋白,且可以使用puromycin进行药筛以筛选出转染成功的阳性细胞。

为了验证spcas9突变体实际效果,以emx1基因的emx1-1位点为靶位点,使sgrna质粒载体靶向靶位点,该sgrna质粒载体被命名为sgrna-emx1-1-puro。

构建完成的sgrna质粒载体(sgrna-emx1-1-puro)的核苷酸序列如seqidno.6所示,质粒图谱如图2所示。

表达sgrna-emx1-1的质粒的核苷酸序列如seqidno.6)所示。

细胞培养

以hek293t细胞为转染对象。

用dmem培养基(含10%fbs、2mm的谷氨酰胺和两种抗生素(青霉素和链霉素))培养hek293t细胞,培养环境为37℃、5%co2。

构建转染细胞

将上述实施例中培养好的hek293t细胞移种至24孔板(2×105个细胞/孔)中,每孔加入0.5ml的完全培养基,培养过夜。直至次日细胞融合度约为70-80%时进行转染。转染共使用1μg质粒(750ng的spcas9/spcas9(k510a)质粒和250ngsgrna-emx1-1-puro质粒),采用lipofectamine3000(invitrogen,1.5μllipo3000,2μlp3000)作为转染试剂,参照试剂使用说明书或本领域常规操作转染细胞。

转染后的细胞使用2μg/ml的puromycin在转染后第2-4天进行药筛,药筛结束后的第二天提取基因组dna,备用。

在靶位点和脱靶位点的编辑效率检测

选取已有报道证实的,野生型spcas9在剪切emx1-1位点时,具有较高脱靶率的位点emx1-1-ot1和emx1-1-ot2,用以检测本发明实施例中的spcas9(k510a)突变体spcas9(k510a)突变体的脱靶情况。其中,靶位点emx1-1、脱靶位点emx1-1-ot1和emx1-1-ot2的序列和pam序列如表1所示。

表1靶位点和脱靶位点的靶序列和pam序列

其中,加粗部分为脱靶位点与靶位点不一致的碱基。

采用ddpcr(dropletdigitalpcr,微滴式数字pcr)验证在靶位点和脱靶位点的编辑效率。

针对表1所示的靶位点emx1-1、脱靶位点emx1-1-ot1和emx1-1-ot2的序列,分别设计引物组,以用于扩增出一段包含靶位点或脱靶位点的长约60-200bp的片段,同时,设计reference探针(含有fam荧光修饰基团),用于靶向剪切靶位点两端的序列,设计nhej探针(含有vic荧光修饰基团),用于靶向剪切靶位点。当靶位点没有被编辑时nhej探针可以与靶位点序列结合,当靶位点被编辑时,nhej探针将不能够再与靶位点相结合,因此,可以通过识别靶序列上的vic的荧光即可判断脱靶情况。

其中,靶位点emx1-1、脱靶位点emx1-1-ot1和emx1-1-ot2的引物组、reference探针和nhej探针序列分别为:

(1)靶位点emx1-1:

引物组序列:

上游引物f:5’-cggaggacaaagtacaaacgg-3’(seqidno.10);

下游引物r:5’-gtcattggaggtgacatcgatg-3’(seqidno.11)。

reference探针序列为:5’-fam-ccattggcctgcttcgtggcaatgcg-bhq1-3’(seqidno.12)。

nhej探针序列为:5’-vic-cgagcagaagaagaag-mgb-3’(seqidno.13)。

(2)脱靶位点emx1-1-ot1:

引物组序列:

上游引物f:5’-gctacctgtacatctgcacaag-3’(seqidno.14);

下游引物r:5’-aagaaatgcccaatcattgatgc-3’(seqidno.15)。

reference探针序列为:5’-fam-ctgtcttgccatgccataagcccctatt-bhq1-3’(seqidno.16)。

nhej探针序列为:5’-vic-atgcctttcttcttc-mgb-3’(seqidno.17)。

(3)脱靶位点emx1-1-ot2:

引物组序列:

上游引物f:5’-agcctctttctcaatgtgcttc-3’(seqidno.18);

下游引物r:5’-agagtagatggttgggtagtgg-3’(seqidno.19)。

reference探针序列为:5’-fam-ccatcacggcctttgcaaatagagccct-bhq1-3’(seqidno.20)。

nhej探针序列为:5’-vic-ctaagcagaagaagaagag-mgb-3’(seqidno.21)。

ddpcr中的微滴的制备参照qx200tm微滴式数字pcr系统的说明书或使用其他本领域常规操作进行。

ddpcr反应体系为:

表2.ddpcr反应体系

反应程序为:95℃预变性10min;94℃变性30s;50-65℃退火1min;循环40次;98℃,10min;4℃维持。

使用qx200tm微滴式数字pcr系统检测:微滴通过微滴分析仪依次分开,逐个进行荧光信号的检测,分别检测各个微滴在fam通道和vic通道的荧光信号值。有荧光信号的微滴为阳性,无荧光信号的微滴为阴性。记录每个样品里阳性微滴的数量和占比情况。根据比例关系计算编辑效率。

其中,编辑效率用nhej突变率来计算,公式如下:

结果如图3-4和表3所示。

图2-3分别为野生型spcas9和突变型spcas9(k510a)在emx1-1、emx1-1-ot1、emx1-1-ot2三个位点的编辑效率结果二维图。图2中的蓝色点为单fam阳性,绿色点为单vic阳性,灰色点为fam/vic双阴性,棕色点为fam/vic双阳性。进一步分析发现,野生型spcas9对靶位点emx1-1的编辑率为53.31%,对脱靶位点emx1-1-ot1的编辑率为2.51%,对脱靶位点emx1-1-ot2的编辑率为1.76%。spcas9(k510a)突变体spcas9(k510a)突变体对靶位点emx1-1的编辑率为41.47%,对脱靶位点emx1-1-ot1的编辑率为0.24%,对脱靶位点emx1-1-ot2的编辑率为0.08%。与野生型spcas9相比,突变体spcas9(k510a)对靶位点的编辑效率与野生型spcas9基本持平(70%以上),而且,对脱靶位点的编辑率有了大幅度的显著降低。

表3野生型spcas9和突变型spcas9(k510a)在emx1-1靶位点和脱靶位点的编辑效率

vs.野生型,**p<0.01,***p<0.001。

spcas9(k510a)突变体spcas9(k510a)突变体在靶位点emx1-1的编辑效率验证

采用t7e1酶切法检测spcas9(k510a)突变体的编辑效率。

设计针对emx1-1位点的引物(扩增产物长度为720bp):

上游引物f:5’-cttccagagcctgcactcct-3’(seqidno.22);

下游引物r:5’-aggctctccgaggagaaggc-3’(seqidno.23)。

使用该引物和hotstarthigh-fidelity2xmastermix预混液(m0494,neb)对emx1-1基因序列进行扩增。扩增产物进行t7e1酶切(e3321,neb)。结果如表4所示。

表4t7e1酶切法检测结果

vs.野生型,*p<0.05。

结果显示spcas9突变体(k510a)对靶位点emx1-1的剪切率为野生型剪切率的72.0%(表4),与ddpcr检测的结果一致。

综上所述,本发明实施例中的spcas9(k510a)突变体,是将野生型spcas9的第510位赖氨酸残基突变为丙氨酸残基设计得到的。通过t7e1实验对靶序列的编辑情况进行了检测,并通过ddpcr证实spcas9(k510a)突变体在保持了与野生型spcas9的对靶位点剪切效率基本相同的情况下,能够显著降低对脱靶位点的编辑效率,即显著降低脱靶率。

上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。此外,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。

sequencelisting

<110>南方医科大学

<120>一种crisprspcas9突变体及其应用

<130>

<160>23

<170>patentinversion3.5

<210>1

<211>1404

<212>prt

<213>人工序列

<400>1

metasplyslystyrserileglyleuaspileglythrasnserval

151015

glytrpalavalilethraspglutyrlysvalproserlyslysphe

202530

lysvalleuglyasnthrasparghisserilelyslysasnleuile

354045

glyalaleuleupheaspserglygluthralaglualathrargleu

505560

lysargthralaargargargtyrthrargarglysasnargilecys

65707580

tyrleuglngluilepheserasnglumetalalysvalaspaspser

859095

phephehisargleuglugluserpheleuvalglugluasplyslys

100105110

hisgluarghisproilepheglyasnilevalaspgluvalalatyr

115120125

hisglulystyrprothriletyrhisleuarglyslysleuvalasp

130135140

serthrasplysalaaspleuargleuiletyrleualaleualahis

145150155160

metilelyspheargglyhispheleuilegluglyaspleuasnpro

165170175

aspasnseraspvalasplysleupheileglnleuvalglnthrtyr

180185190

asnglnleupheglugluasnproileasnalaserglyvalaspala

195200205

lysalaileleuseralaargleuserlysserargargleugluasn

210215220

leuilealaglnleuproglyglulyslysasnglyleupheglyasn

225230235240

leuilealaleuserleuglyleuthrproasnphelysserasnphe

245250255

aspleualagluaspalalysleuglnleuserlysaspthrtyrasp

260265270

aspaspleuaspasnleuleualaglnileglyaspglntyralaasp

275280285

leupheleualaalalysasnleuseraspalaileleuleuserasp

290295300

ileleuargvalasnthrgluilethrlysalaproleuseralaser

305310315320

metilelysargtyraspgluhishisglnaspleuthrleuleulys

325330335

alaleuvalargglnglnleuproglulystyrlysgluilephephe

340345350

aspglnserlysasnglytyralaglytyrileaspglyglyalaser

355360365

glnglugluphetyrlyspheilelysproileleuglulysmetasp

370375380

glythrglugluleuleuvallysleuasnarggluaspleuleuarg

385390395400

lysglnargthrpheaspasnglyserileprohisglnilehisleu

405410415

glygluleuhisalaileleuargargglngluaspphetyrprophe

420425430

leulysaspasnargglulysileglulysileleuthrpheargile

435440445

protyrtyrvalglyproleualaargglyasnserargphealatrp

450455460

metthrarglysserglugluthrilethrprotrpasnphegluglu

465470475480

valvalasplysglyalaseralaglnserpheilegluargmetthr

485490495

asnpheasplysasnleuproasnglulysvalleuprolyshisser

500505510

leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys

515520525

tyrvalthrgluglymetarglysproalapheleuserglyglugln

530535540

lyslysalailevalaspleuleuphelysthrasnarglysvalthr

545550555560

vallysglnleulysgluasptyrphelyslysileglucyspheasp

565570575

servalgluileserglyvalgluaspargpheasnalaserleugly

580585590

thrtyrhisaspleuleulysileilelysasplysasppheleuasp

595600605

asnglugluasngluaspileleugluaspilevalleuthrleuthr

610615620

leuphegluaspargglumetileglugluargleulysthrtyrala

625630635640

hisleupheaspasplysvalmetlysglnleulysargargargtyr

645650655

thrglytrpglyargleuserarglysleuileasnglyileargasp

660665670

lysglnserglylysthrileleuasppheleulysseraspglyphe

675680685

alaasnargasnphemetglnleuilehisaspaspserleuthrphe

690695700

lysgluaspileglnlysalaglnvalserglyglnglyaspserleu

705710715720

hisgluhisilealaasnleualaglyserproalailelyslysgly

725730735

ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly

740745750

arghislysprogluasnilevalileglumetalaarggluasngln

755760765

thrthrglnlysglyglnlysasnserarggluargmetlysargile

770775780

glugluglyilelysgluleuglyserglnileleulysgluhispro

785790795800

valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu

805810815

glnasnglyargaspmettyrvalaspglngluleuaspileasnarg

820825830

leuserasptyraspvalasphisilevalproglnserpheleulys

835840845

aspaspserileaspasnlysvalleuthrargserasplysasnarg

850855860

glylysseraspasnvalproserglugluvalvallyslysmetlys

865870875880

asntyrtrpargglnleuleuasnalalysleuilethrglnarglys

885890895

pheaspasnleuthrlysalagluargglyglyleusergluleuasp

900905910

lysalaglypheilelysargglnleuvalgluthrargglnilethr

915920925

lyshisvalalaglnileleuaspserargmetasnthrlystyrasp

930935940

gluasnasplysleuilearggluvallysvalilethrleulysser

945950955960

lysleuvalseraspphearglysasppheglnphetyrlysvalarg

965970975

gluileasnasntyrhishisalahisaspalatyrleuasnalaval

980985990

valglythralaleuilelyslystyrprolysleuglusergluphe

99510001005

valtyrglyasptyrlysvaltyraspvalarglysmetileala

101010151020

lyssergluglngluileglylysalathralalystyrphephe

102510301035

tyrserasnilemetasnphephelysthrgluilethrleuala

104010451050

asnglygluilearglysargproleuilegluthrasnglyglu

105510601065

thrglygluilevaltrpasplysglyargaspphealathrval

107010751080

arglysvalleusermetproglnvalasnilevallyslysthr

108510901095

gluvalglnthrglyglypheserlysgluserileleuprolys

110011051110

argasnserasplysleuilealaarglyslysasptrpasppro

111511201125

lyslystyrglyglypheaspserprothrvalalatyrserval

113011351140

leuvalvalalalysvalglulysglylysserlyslysleulys

114511501155

servallysgluleuleuglyilethrilemetgluargserser

116011651170

pheglulysasnproileasppheleuglualalysglytyrlys

117511801185

gluvallyslysaspleuileilelysleuprolystyrserleu

119011951200

phegluleugluasnglyarglysargmetleualaseralagly

120512101215

gluleuglnlysglyasngluleualaleuproserlystyrval

122012251230

asnpheleutyrleualaserhistyrglulysleulysglyser

123512401245

progluaspasngluglnlysglnleuphevalgluglnhislys

125012551260

histyrleuaspgluileilegluglnileserglupheserlys

126512701275

argvalileleualaaspalaasnleuasplysvalleuserala

128012851290

tyrasnlyshisargasplysproilearggluglnalagluasn

129513001305

ileilehisleuphethrleuthrasnleuglyalaproalaala

131013151320

phelystyrpheaspthrthrileasparglysargtyrthrser

132513301335

thrlysgluvalleuaspalathrleuilehisglnserilethr

134013451350

glyleutyrgluthrargileaspleuserglnleuglyglyasp

135513601365

glyserprolyslyslysarglysvalserserasptyrlysasp

137013751380

hisaspglyasptyrlysasphisaspileasptyrlysaspasp

138513901395

aspasplysalaalagly

1400

<210>2

<211>1404

<212>prt

<213>人工序列

<400>2

metasplyslystyrserileglyleuaspileglythrasnserval

151015

glytrpalavalilethraspglutyrlysvalproserlyslysphe

202530

lysvalleuglyasnthrasparghisserilelyslysasnleuile

354045

glyalaleuleupheaspserglygluthralaglualathrargleu

505560

lysargthralaargargargtyrthrargarglysasnargilecys

65707580

tyrleuglngluilepheserasnglumetalalysvalaspaspser

859095

phephehisargleuglugluserpheleuvalglugluasplyslys

100105110

hisgluarghisproilepheglyasnilevalaspgluvalalatyr

115120125

hisglulystyrprothriletyrhisleuarglyslysleuvalasp

130135140

serthrasplysalaaspleuargleuiletyrleualaleualahis

145150155160

metilelyspheargglyhispheleuilegluglyaspleuasnpro

165170175

aspasnseraspvalasplysleupheileglnleuvalglnthrtyr

180185190

asnglnleupheglugluasnproileasnalaserglyvalaspala

195200205

lysalaileleuseralaargleuserlysserargargleugluasn

210215220

leuilealaglnleuproglyglulyslysasnglyleupheglyasn

225230235240

leuilealaleuserleuglyleuthrproasnphelysserasnphe

245250255

aspleualagluaspalalysleuglnleuserlysaspthrtyrasp

260265270

aspaspleuaspasnleuleualaglnileglyaspglntyralaasp

275280285

leupheleualaalalysasnleuseraspalaileleuleuserasp

290295300

ileleuargvalasnthrgluilethrlysalaproleuseralaser

305310315320

metilelysargtyraspgluhishisglnaspleuthrleuleulys

325330335

alaleuvalargglnglnleuproglulystyrlysgluilephephe

340345350

aspglnserlysasnglytyralaglytyrileaspglyglyalaser

355360365

glnglugluphetyrlyspheilelysproileleuglulysmetasp

370375380

glythrglugluleuleuvallysleuasnarggluaspleuleuarg

385390395400

lysglnargthrpheaspasnglyserileprohisglnilehisleu

405410415

glygluleuhisalaileleuargargglngluaspphetyrprophe

420425430

leulysaspasnargglulysileglulysileleuthrpheargile

435440445

protyrtyrvalglyproleualaargglyasnserargphealatrp

450455460

metthrarglysserglugluthrilethrprotrpasnphegluglu

465470475480

valvalasplysglyalaseralaglnserpheilegluargmetthr

485490495

asnpheasplysasnleuproasnglulysvalleuproalahisser

500505510

leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys

515520525

tyrvalthrgluglymetarglysproalapheleuserglyglugln

530535540

lyslysalailevalaspleuleuphelysthrasnarglysvalthr

545550555560

vallysglnleulysgluasptyrphelyslysileglucyspheasp

565570575

servalgluileserglyvalgluaspargpheasnalaserleugly

580585590

thrtyrhisaspleuleulysileilelysasplysasppheleuasp

595600605

asnglugluasngluaspileleugluaspilevalleuthrleuthr

610615620

leuphegluaspargglumetileglugluargleulysthrtyrala

625630635640

hisleupheaspasplysvalmetlysglnleulysargargargtyr

645650655

thrglytrpglyargleuserarglysleuileasnglyileargasp

660665670

lysglnserglylysthrileleuasppheleulysseraspglyphe

675680685

alaasnargasnphemetglnleuilehisaspaspserleuthrphe

690695700

lysgluaspileglnlysalaglnvalserglyglnglyaspserleu

705710715720

hisgluhisilealaasnleualaglyserproalailelyslysgly

725730735

ileleuglnthrvallysvalvalaspgluleuvallysvalmetgly

740745750

arghislysprogluasnilevalileglumetalaarggluasngln

755760765

thrthrglnlysglyglnlysasnserarggluargmetlysargile

770775780

glugluglyilelysgluleuglyserglnileleulysgluhispro

785790795800

valgluasnthrglnleuglnasnglulysleutyrleutyrtyrleu

805810815

glnasnglyargaspmettyrvalaspglngluleuaspileasnarg

820825830

leuserasptyraspvalasphisilevalproglnserpheleulys

835840845

aspaspserileaspasnlysvalleuthrargserasplysasnarg

850855860

glylysseraspasnvalproserglugluvalvallyslysmetlys

865870875880

asntyrtrpargglnleuleuasnalalysleuilethrglnarglys

885890895

pheaspasnleuthrlysalagluargglyglyleusergluleuasp

900905910

lysalaglypheilelysargglnleuvalgluthrargglnilethr

915920925

lyshisvalalaglnileleuaspserargmetasnthrlystyrasp

930935940

gluasnasplysleuilearggluvallysvalilethrleulysser

945950955960

lysleuvalseraspphearglysasppheglnphetyrlysvalarg

965970975

gluileasnasntyrhishisalahisaspalatyrleuasnalaval

980985990

valglythralaleuilelyslystyrprolysleuglusergluphe

99510001005

valtyrglyasptyrlysvaltyraspvalarglysmetileala

101010151020

lyssergluglngluileglylysalathralalystyrphephe

102510301035

tyrserasnilemetasnphephelysthrgluilethrleuala

104010451050

asnglygluilearglysargproleuilegluthrasnglyglu

105510601065

thrglygluilevaltrpasplysglyargaspphealathrval

107010751080

arglysvalleusermetproglnvalasnilevallyslysthr

108510901095

gluvalglnthrglyglypheserlysgluserileleuprolys

110011051110

argasnserasplysleuilealaarglyslysasptrpasppro

111511201125

lyslystyrglyglypheaspserprothrvalalatyrserval

113011351140

leuvalvalalalysvalglulysglylysserlyslysleulys

114511501155

servallysgluleuleuglyilethrilemetgluargserser

116011651170

pheglulysasnproileasppheleuglualalysglytyrlys

117511801185

gluvallyslysaspleuileilelysleuprolystyrserleu

119011951200

phegluleugluasnglyarglysargmetleualaseralagly

120512101215

gluleuglnlysglyasngluleualaleuproserlystyrval

122012251230

asnpheleutyrleualaserhistyrglulysleulysglyser

123512401245

progluaspasngluglnlysglnleuphevalgluglnhislys

125012551260

histyrleuaspgluileilegluglnileserglupheserlys

126512701275

argvalileleualaaspalaasnleuasplysvalleuserala

128012851290

tyrasnlyshisargasplysproilearggluglnalagluasn

129513001305

ileilehisleuphethrleuthrasnleuglyalaproalaala

131013151320

phelystyrpheaspthrthrileasparglysargtyrthrser

132513301335

thrlysgluvalleuaspalathrleuilehisglnserilethr

134013451350

glyleutyrgluthrargileaspleuserglnleuglyglyasp

135513601365

glyserprolyslyslysarglysvalserserasptyrlysasp

137013751380

hisaspglyasptyrlysasphisaspileasptyrlysaspasp

138513901395

aspasplysalaalagly

1400

<210>3

<211>20

<212>dna

<213>人工序列

<400>3

gagtccgagcagaagaagaa20

<210>4

<211>7614

<212>dna

<213>人工序列

<400>4

cggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctga60

tgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtg120

cgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatct180

gcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgaca240

ttgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccata300

tatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacga360

cccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggacttt420

ccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagt480

gtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggca540

ttatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagt600

catcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtt660

tgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggca720

ccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatggg780

cggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagat840

ccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatggata900

aaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccg960

atgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcga1020

ttaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactc1080

gcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttac1140

aagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaag1200

agtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatag1260

tagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctag1320

ttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataa1380

agttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgaca1440

aactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatg1500

caagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctag1560

aaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatag1620

cgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgcca1680

aattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattg1740

gagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctat1800

ctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatca1860

aaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaac1920

tgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttata1980

ttgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaaga2040

tggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagc2100

ggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatac2160

ttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaa2220

tcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcg2280

catggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcg2340

ataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttac2400

cgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatg2460

aactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggag2520

aacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagc2580

aattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccgggg2640

tagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaag2700

ataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactc2760

ttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgt2820

tcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgt2880

cgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttc2940

taaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaa3000

ccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaac3060

atattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaag3120

tagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgaga3180

tggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaaga3240

gaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaa3300

atacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgt3360

atgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtac3420

cccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataaga3480

accgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactatt3540

ggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaag3600

ctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtgg3660

aaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaat3720

acgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattgg3780

tgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccacc3840

atgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccga3900

agctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcg3960

cgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacatta4020

tgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaa4080

ttgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacgg4140

tgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccg4200

gagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgta4260

aaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctg4320

tcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaat4380

tattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttg4440

aggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtc4500

tgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaagg4560

ggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacg4620

agaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcaca4680

aacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctag4740

ctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatac4800

gtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccg4860

cattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgc4920

tagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgt4980

cacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaag5040

accatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctg5100

caggatgaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgac5160

tgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccct5220

ggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtct5280

gagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattg5340

ggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaag5400

aaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcata5460

gctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaag5520

cataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcg5580

ctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggcca5640

acgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactc5700

gctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacg5760

gttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaa5820

ggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctga5880

cgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaag5940

ataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgct6000

taccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacg6060

ctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaacc6120

ccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggt6180

aagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggta6240

tgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaac6300

agtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctc6360

ttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagat6420

tacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgc6480

tcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatctt6540

cacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagta6600

aacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtct6660

atttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggaggg6720

cttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccaga6780

tttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaacttt6840

atccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagt6900

taatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtt6960

tggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccat7020

gttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggc7080

cgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatc7140

cgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtat7200

gcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcag7260

aactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatctt7320

accgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatc7380

ttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaa7440

gggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattg7500

aagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaa7560

taaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcga7614

<210>5

<211>7614

<212>dna

<213>人工序列

<400>5

cggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctga60

tgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtg120

cgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatct180

gcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgaca240

ttgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccata300

tatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacga360

cccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggacttt420

ccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagt480

gtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggca540

ttatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagt600

catcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtt660

tgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggca720

ccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatggg780

cggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagat840

ccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatggata900

aaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccg960

atgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcga1020

ttaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactc1080

gcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttac1140

aagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaag1200

agtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatag1260

tagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctag1320

ttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataa1380

agttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgaca1440

aactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatg1500

caagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctag1560

aaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatag1620

cgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgcca1680

aattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattg1740

gagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctat1800

ctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatca1860

aaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaac1920

tgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttata1980

ttgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaaga2040

tggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagc2100

ggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatac2160

ttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaa2220

tcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcg2280

catggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcg2340

ataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttac2400

cgaacgaaaaagtattgcctgcccacagtttactttacgagtatttcacagtgtacaatg2460

aactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggag2520

aacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagc2580

aattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccgggg2640

tagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaag2700

ataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactc2760

ttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgt2820

tcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgt2880

cgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttc2940

taaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaa3000

ccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaac3060

atattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaag3120

tagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgaga3180

tggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaaga3240

gaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaa3300

atacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgt3360

atgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtac3420

cccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataaga3480

accgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactatt3540

ggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaag3600

ctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtgg3660

aaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaat3720

acgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattgg3780

tgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccacc3840

atgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccga3900

agctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcg3960

cgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacatta4020

tgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaa4080

ttgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacgg4140

tgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccg4200

gagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgta4260

aaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctg4320

tcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaat4380

tattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttg4440

aggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtc4500

tgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaagg4560

ggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacg4620

agaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcaca4680

aacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctag4740

ctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatac4800

gtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccg4860

cattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgc4920

tagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgt4980

cacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaag5040

accatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctg5100

caggatgaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgac5160

tgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccct5220

ggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtct5280

gagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattg5340

ggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaag5400

aaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcata5460

gctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaag5520

cataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcg5580

ctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggcca5640

acgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactc5700

gctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacg5760

gttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaa5820

ggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctga5880

cgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaag5940

ataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgct6000

taccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacg6060

ctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaacc6120

ccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggt6180

aagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggta6240

tgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaac6300

agtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctc6360

ttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagat6420

tacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgc6480

tcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatctt6540

cacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagta6600

aacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtct6660

atttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggaggg6720

cttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccaga6780

tttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaacttt6840

atccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagt6900

taatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtt6960

tggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccat7020

gttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggc7080

cgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatc7140

cgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtat7200

gcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcag7260

aactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatctt7320

accgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatc7380

ttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaa7440

gggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattg7500

aagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaa7560

taaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcga7614

<210>6

<211>8408

<212>dna

<213>人工序列

<400>6

aatgtagtcttatgcaatactcttgtagtcttgcaacatggtaacgatgagttagcaaca60

tgccttacaaggagagaaaaagcaccgtgcatgccgattggtggaagtaaggtggtacga120

tcgtgccttattaggaaggcaacagacgggtctgacatggattggacgaaccactgaatt180

gccgcattgcagagatattgtatttaagtgcctagctcgatacataaacgggtctctctg240

gttagaccagatctgagcctgggagctctctggctaactagggaacccactgcttaagcc300

tcaataaagcttgccttgagtgcttcaagtagtgtgtgcccgtctgttgtgtgactctgg360

taactagagatccctcagacccttttagtcagtgtggaaaatctctagcagtggcgcccg420

aacagggacttgaaagcgaaagggaaaccagaggagctctctcgacgcaggactcggctt480

gctgaagcgcgcacggcaagaggcgaggggcggcgactggtgagtacgccaaaaattttg540

actagcggaggctagaaggagagagatgggtgcgagagcgtcagtattaagcgggggaga600

attagatcgcgatgggaaaaaattcggttaaggccagggggaaagaaaaaatataaatta660

aaacatatagtatgggcaagcagggagctagaacgattcgcagttaatcctggcctgtta720

gaaacatcagaaggctgtagacaaatactgggacagctacaaccatcccttcagacagga780

tcagaagaacttagatcattatataatacagtagcaaccctctattgtgtgcatcaaagg840

atagagataaaagacaccaaggaagctttagacaagatagaggaagagcaaaacaaaagt900

aagaccaccgcacagcaagcggccgctgatcttcagacctggaggaggagatatgaggga960

caattggagaagtgaattatataaatataaagtagtaaaaattgaaccattaggagtagc1020

acccaccaaggcaaagagaagagtggtgcagagagaaaaaagagcagtgggaataggagc1080

tttgttccttgggttcttgggagcagcaggaagcactatgggcgcagcgtcaatgacgct1140

gacggtacaggccagacaattattgtctggtatagtgcagcagcagaacaatttgctgag1200

ggctattgaggcgcaacagcatctgttgcaactcacagtctggggcatcaagcagctcca1260

ggcaagaatcctggctgtggaaagatacctaaaggatcaacagctcctggggatttgggg1320

ttgctctggaaaactcatttgcaccactgctgtgccttggaatgctagttggagtaataa1380

atctctggaacagatttggaatcacacgacctggatggagtgggacagagaaattaacaa1440

ttacacaagcttaatacactccttaattgaagaatcgcaaaaccagcaagaaaagaatga1500

acaagaattattggaattagataaatgggcaagtttgtggaattggtttaacataacaaa1560

ttggctgtggtatataaaattattcataatgatagtaggaggcttggtaggtttaagaat1620

agtttttgctgtactttctatagtgaatagagttaggcagggatattcaccattatcgtt1680

tcagacccacctcccaaccccgaggggacccgacaggcccgaaggaatagaagaagaagg1740

tggagagagagacagagacagatccattcgattagtgaacggatctcgacggtatcgcta1800

gcttttaaaagaaaaggggggattggggggtacagtgcaggggaaagaatagtagacata1860

atagcaacagacatacaaactaaagaattacaaaaacaaattacaaaaattcaaaatttt1920

actagtgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgtt1980

agagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtga2040

cgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggac2100

tatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtgg2160

aaaggacgaaacaccggagtccgagcagaagaagaagttttagagctagaaatagcaagt2220

taaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttgt2280

ctagaggtaccgaattccaactttgtatagaaaagttggggttgcgccttttccaaggca2340

gccctgggtttgcgcagggacgcggctgctctgggcgtggttccgggaaacgcagcggcg2400

ccgaccctgggtctcgcacattcttcacgtccgttcgcagcgtcacccggatcttcgccg2460

ctacccttgtgggccccccggcgacgcttcctgctccgcccctaagtcgggaaggttcct2520

tgcggttcgcggcgtgccggacgtgacaaacggaagccgcacgtctcactagtaccctcg2580

cagacggacagcgccagggagcaatggcagcgcgccgaccgcgatgggctgtggccaata2640

gcggctgctcagcagggcgcgccgagagcagcggccgggaaggggcggtgcgggaggcgg2700

ggtgtggggcggtagtgtgggccctgttcctgcccgcgcggtgttccgcattctgcaagc2760

ctccggagcgcacgtcggcagtcggctccctcgttgaccgaatcaccgacctctctcccc2820

aggcaagtttgtacaaaaaagcaggctgccaccatggtgagcaagggcgaggagctgttc2880

accggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagc2940

gtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgc3000

accaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtg3060

cagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatg3120

cccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacc3180

cgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatc3240

gacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccac3300

aacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgc3360

cacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatc3420

ggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagc3480

aaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccggg3540

atcactctcggcatggacgagctgtacaagggctccggagagggcaggggaagtcttcta3600

acatgcggggacgtggaggaaaatcccggccccatgaccgagtacaagcccacggtgcgc3660

ctcgccacccgcgacgacgtccccagggccgtacgcaccctcgccgccgcgttcgccgac3720

taccccgccacgcgccacaccgtcgatccggaccgccacatcgagcgggtcaccgagctg3780

caagaactcttcctcacgcgcgtcgggctcgacatcggcaaggtgtgggtcgcggacgac3840

ggcgccgcggtggcggtctggaccacgccggagagcgtcgaagcgggggcggtgttcgcc3900

gagatcggcccgcgcatggccgagttgagcggttcccggctggccgcgcagcaacagatg3960

gaaggcctcctggcgccgcaccggcccaaggagcccgcgtggttcctggccaccgtcggc4020

gtctcgcccgaccaccagggcaagggtctgggcagcgccgtcgtgctccccggagtggag4080

gcggccgagcgcgccggggtgcccgccttcctggagacctccgcgccccgcaacctcccc4140

ttctacgagcggctcggcttcaccgtcaccgccgacgtcgaggtgcccgaaggaccgcgc4200

acctggtgcatgacccgcaagcccggtgcctgaacccagctttcttgtacaaagtggtgg4260

tacccgataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaact4320

atgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattg4380

cttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatg4440

aggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaa4500

cccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttcc4560

ccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacagggg4620

ctcggctgttgggcactgacaattccgtggtgttgtcggggaagctgacgtcctttccat4680

ggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtccctt4740

cggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttc4800

cgcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcatc4860

ggctttaagaccaatgacttacaaggcagctgtagatcttagccactttttaaaagaaaa4920

ggggggactggaagggctaattcactcccaacgaagacaagatctgctttttgcttgtac4980

tgggtctctctggttagaccagatctgagcctgggagctctctggctaactagggaaccc5040

actgcttaagcctcaataaagcttgccttgagtgcttcaagtagtgtgtgcccgtctgtt5100

gtgtgactctggtaactagagatccctcagacccttttagtcagtgtggaaaatctctag5160

cagtagtagttcatgtcatcttattattcagtatttataacttgcaaagaaatgaatatc5220

agagagtgagaggaacttgtttattgcagcttataatggttacaaataaagcaatagcat5280

cacaaatttcacaaataaagcatttttttcactgcattctagttgtggtttgtccaaact5340

catcaatgtatcttatcatgtctggctctagctatcccgcccctaactccgcccatcccg5400

cccctaactccgcccagttccgcccattctccgccccatggctgactaattttttttatt5460

tatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggcttt5520

tttggaggcctagggacgtacccaattcgccctatagtgagtcgtattacgcgcgctcac5580

tggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgcc5640

ttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcc5700

cttcccaacagttgcgcagcctgaatggcgaatgggacgcgccctgtagcggcgcattaa5760

gcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgc5820

ccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaag5880

ctctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgacccca5940

aaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttc6000

gccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaa6060

cactcaaccctatctcggtctattcttttgatttataagggattttgccgatttcggcct6120

attggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaa6180

cgcttacaatttaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatt6240

tttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttca6300

ataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattccctt6360

ttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaaga6420

tgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaa6480

gatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttct6540

gctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcat6600

acactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacgga6660

tggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggc6720

caacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacat6780

gggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaa6840

cgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaac6900

tggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataa6960

agttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatc7020

tggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagcc7080

ctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatag7140

acagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagttta7200

ctcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaa7260

gatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagc7320

gtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaat7380

ctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaaga7440

gctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgt7500

tcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacata7560

cctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttac7620

cgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacgggggg7680

ttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcg7740

tgagctatgagaaagcgccacgcttcccgaagagagaaaggcggacaggtatccggtaag7800

cggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatct7860

ttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtc7920

aggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggcctt7980

ttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccg8040

tattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcga8100

gtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttg8160

gccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcg8220

caacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgct8280

tccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagcta8340

tgaccatgattacgccaagcgcgcaattaaccctcactaaagggaacaaaagctggagct8400

gcaagctt8408

<210>7

<211>20

<212>dna

<213>人工序列

<400>7

gagtccgagcagaagaagaa20

<210>8

<211>20

<212>dna

<213>人工序列

<400>8

gagttagagcagaagaagaa20

<210>9

<211>20

<212>dna

<213>人工序列

<400>9

gagtctaagcagaagaagaa20

<210>10

<211>21

<212>dna

<213>人工序列

<400>10

cggaggacaaagtacaaacgg21

<210>11

<211>22

<212>dna

<213>人工序列

<400>11

gtcattggaggtgacatcgatg22

<210>12

<211>26

<212>dna

<213>人工序列

<400>12

ccattggcctgcttcgtggcaatgcg26

<210>13

<211>16

<212>dna

<213>人工序列

<400>13

cgagcagaagaagaag16

<210>14

<211>22

<212>dna

<213>人工序列

<400>14

gctacctgtacatctgcacaag22

<210>15

<211>23

<212>dna

<213>人工序列

<400>15

aagaaatgcccaatcattgatgc23

<210>16

<211>28

<212>dna

<213>人工序列

<400>16

ctgtcttgccatgccataagcccctatt28

<210>17

<211>15

<212>dna

<213>人工序列

<400>17

atgcctttcttcttc15

<210>18

<211>22

<212>dna

<213>人工序列

<400>18

agcctctttctcaatgtgcttc22

<210>19

<211>22

<212>dna

<213>人工序列

<400>19

agagtagatggttgggtagtgg22

<210>20

<211>28

<212>dna

<213>人工序列

<400>20

ccatcacggcctttgcaaatagagccct28

<210>21

<211>19

<212>dna

<213>人工序列

<400>21

ctaagcagaagaagaagag19

<210>22

<211>20

<212>dna

<213>人工序列

<400>22

cttccagagcctgcactcct20

<210>23

<211>20

<212>dna

<213>人工序列

<400>23

aggctctccgaggagaaggc20

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1