一种哺乳动物基因组修饰方法与流程

文档序号:12097554阅读:344来源:国知局
一种哺乳动物基因组修饰方法与流程

本发明属于基因工程技术领域,具体而言,涉及一种哺乳动物基因组修饰方法。



背景技术:

ZFN、TALEN及CRISPR/Cas9打靶技术是目前研究较为成熟的几种基因组修饰技术。(CRISPR)/CRISPR-associated(Cas)是细菌和古细菌一种不断进化适应的免疫防御机制。CRISPR/Cas9利用一段小RNA来识别并剪切DNA以降解外来核酸分子。Cong等(Multiplex Genome Engineering Using CRISPR/Cas Systems.Science.2013)及Mali等(RNA-guided human genome engineering via Cas9.Science.2013)证明Cas9系统能在293T、K562、iPS等多种细胞中,进行有效的靶向酶切,非同源重组(NHEJ)、同源重组(HR)效率在3-25%之间,与TALEN酶切效果相当。他们还证明,多个靶点可以同时进行靶向酶切。但是,随后的研究表明,Cas9存在较为明显的脱靶效应(High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells.Nature Biotechnology.Fu et al,2013;High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9nuclease specificity.Nature Biotechnology.Pattanayak et al,2013)。因此,开发出新的基因组修饰工具势在必行。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种新的哺乳动物基因组修饰方法。本发明针对某一特定靶点,设计识别这一靶点的一对单链DNA寡核苷酸,与质粒载体pcDNA-DN共转染哺乳动物细胞,对哺乳动物基因组上特定位点的序列进行修饰,从而达到失活或修改某一基因的目的。

具体地本发明是通过如下技术方案实现的:

一种哺乳动物基因组修饰方法,包括如下步骤:

1)根据研究目的选定哺乳动物基因组上特定区域的靶基因DNA序列;

2)设计识别靶基因DNA序列的一对单链DNA寡核苷酸,这一对单链DNA寡核苷酸除3'末端的一个碱基外分别与靶基因DNA不同区段的正义链和反义链互补;

3)步骤2)中所述的一对单链DNA寡核苷酸与质粒载体pcDNA-DN按照质量比1-2:1-2:5-20共转染哺乳动物细胞,所述pcDNA-DN序列如SEQ ID NO.2所示。

具体地,步骤3)中的质粒载体pcDNA-DN是通过如下步骤构建的:

a合成DNA片段DN,其序列如SEQ ID NO.1所示;

b片段DN通过BamHⅠ与EcoRⅠ双酶切克隆到pcDNA3.1(+)载体的相应多克隆位点,通过测序验证,获得质粒载体pcDNA-DN,正向测序引物pcDNA3.1-F其序列如SEQ ID NO.3所示,反向测序引物pcDNA3.1-R其序列如SEQ ID NO.4所示。

进一步地步骤2)中的一对单链DNA寡核苷酸长度是20-30nt。

本发明针对哺乳动物基因组上特定区域的(根据各自目的确定靶基因)DNA序列,合成一对单链DNA寡核苷酸(20-30nt),与质粒载体pcDNA-DN(其作用是表达核酸酶X,X的氨基酸序列如SEQ ID NO.20所示)按照质量比1-2:1-2:5-20的比例共转染哺乳动物细胞,48小时后提取基因组DNA,PCR扩增并克隆测序,检测靶标区域序列的突变比例。

与现有技术相比,本发明提供了一种哺乳动物基因组修饰方法,通过合成一对短链向导DNA引导核酸酶X在细胞或个体水平上对哺乳动物特定基因进行切割以达到敲除或修饰某一基因的目的,从而解析基因的功能、构建基因突变库。本发明的有益效果在于,向导DNA的总长度为40nt以上,极大增加了基因组修饰的特异性。

附图说明

图1为MSH2TF、MSH2TR与pcDNA-DN共转染293T细胞系,48小时后提取基因组DNA进行PCR扩增,将PCR产物克隆后的部分测序结果(突变序列);

图2为Tada1TF、Tada1TR与pcDNA-DN共转染NIH/3T3细胞系,48小时后提取基因组DNA进行PCR扩增,将PCR产物克隆后的部分测序结果(突变序列);

图3为RELATF、RELATR与pcDNA-DN共转染PIEC细胞系,48小时后提取基因组DNA进行PCR扩增,将PCR产物克隆后的部分测序结果(突变序列)。

具体实施方式

以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中,如无特殊说明,均采用低糖DMEM培养基培养细胞。内切酶均购自NEB公司。

DNA片段及引物均由北京六合华大基因科技股份有限公司合成。

实施例1质粒载体pcDNA-DN的构建

合成DNA片段DN(其序列如SEQ ID NO.1所示),通过BamHⅠ与EcoRⅠ双酶切克隆到pcDNA3.1(+)载体(购自Invitrogen,货号V79020)的多克隆位点,获得质粒载体pcDNA-DN。通过测序验证,证实其序列信息如SEQ ID NO.2所示,所用正向测序引物pcDNA3.1-F的序列如SEQ ID NO.3所示;反向测序引物pcDNA3.1-R的序列如SEQ ID NO.4所示。

pcDNA3.1-F:CTAGAGAACCCACTGCTTAC,pcDNA3.1-R:TAGAAGGCACAGTCGAGG;

实施例2本基因组修饰方法在人细胞系293T中的基因修饰效率验证

人细胞系293T,购自中国科学院上海细胞库,目录号:SCSP-502。

人MSH2基因的第一外显子序列(其序列如SEQ ID NO.5所示):

选取上述序列120-180bp区段作为靶标,针对这一靶标设计并合成2条DNA寡核苷酸MSH2TF与MSH2TR(其序列如SEQ ID NO.6-7所示),这两条寡核苷酸分别与上述序列131-153bp区域的反义链、161-180bp区域的正义链互补配对(3'末端最后一个碱基除外),如下:

MSH2TF:GGTGGAGCCGAAGGAGACGCTGCC,MSH2TR:AGCCGACCTCGGCCGCGCTCG

将MSH2TF、MSH2TR与pcDNA-DN载体按照1:1:5的比例转染人细胞系293T,48小时后,提取细胞基因组DNA,使用引物对MSH2F、MSH2R(其序列如SEQ ID NO.8-9所示)进行PCR扩增,对获得的258bp的PCR产物进行克隆测序。共挑取20个单克隆菌落测序,其中有6个单克隆的序列发生改变(如附图1所示)。该结果表明,MSH2TF、MSH2TR与pcDNA-DN载体混合转染对人细胞系293T的敲除效率达到30%。

MSH2F:TTGGGTGTGGTCGCCGT,MSH2R:CCGTGCGCCGTATAGAAGTC;

实施例3本基因组修饰方法在小鼠细胞系NIH/3T3中的基因修饰效率验证

小鼠细胞系NIH/3T3,购自中国科学院上海细胞库,目录号:SCSP-515。

小鼠Tada1基因的第一外显子序列(其序列如SEQ ID NO.10所示)如下:

1 agagccgagc cgagccgagc cgagcggagc cgagccgagc cgagcggagc cgagccgagc

61 cgagccgagc cgaaccgagc cgagccgagc cgaaccgagc cgagccgagc cgagtggaat

121 cgagtcgagt cgagcctcca gcgtccggcg cgcaggcctt ccgccgcgtt gatctttcgg

181 ttgctggtgg ccgtgggccg cgcggtctac ggtcgggctg aaagacgcgc gctgcaatgg

241 cgacctttgt gagcgagctg gaggcagcca agaagaactt gagcgaggcg ctgggggaca

301 acgtgaaaca

选取上述序列的200-280bp区段作为基因修饰的靶标,针对这一靶标设计并合成两条DNA寡核苷酸Tada1TF与Tada1TR(其序列如SEQ ID NO.11-12所示),这两条寡核苷酸分别与上述序列211-233bp区域的反义链、245-279bp区域的正义链互补配对(3'末端最后一个碱基除外),如下:

Tada1TF:GGTCGGGCTG AAAGACGCCC GCTA,Tada1TR:GGCTGCCTCCAGCTCGCTCACAAAGT

将Tada1TF、Tada1TR与pcDNA-DN载体按照1:2:20的比例转染小鼠细胞系NIH/3T3,48小时后,提取细胞基因组DNA,使用引物对Tada1F、Tada1R(其序列如SEQ ID NO.13-14所示)进行PCR扩增,对获得的157bp的PCR产物进行克隆测序。共挑取20个单克隆菌落测序,其中有5个单克隆的序列发生改变(如附图2所示)。该结果表明,Tada1TF、Tada1TR与pcDNA-DN载体混合转染对小鼠细胞系NIH/3T3的敲除效率达到25%。

Tada1F:CGCGTTGATCTTTCGGTTGC,Tada1R:GCGGCTCTTACTGTTTCACG;

实施例4本基因组修饰方法在猪细胞系PIEC中的基因修饰效率验证

猪血管内皮细胞系,购自中国科学院上海细胞库,目录号:GNO15。

猪RELA基因的第二外显子序列(其序列如SEQ ID NO.15所示)如下:

gccggccccg gcctcgggcc cctatgtgga gatcatcgag cagcccaagc

181 agcggggcat gcgcttccgc tacaagtgcg agggccgctc agccggcagt atcccgggcg

241 agaggagcac ggataccacc aagacccacc ccaccatcaa g

选取上述序列180-240bp区段作为基因修饰的靶标,针对这一靶标设计合成2条DNA寡核苷酸RELATF和RELATR(其序列如SEQ ID NO.16-17所示),这两条寡核苷酸分别与上述序列185-207bp区域的反义链、213-233bp区域的正义链互补配对(3'末端最后一个碱基除外),如下:

RELATF:GGGCATGCGCTTCCGCTACAAGC,RELATR:GATACTGCCGGCTGAGCGGCCT

将RELATF、RELATR与pcDNA-DN载体按照1:1:10的比例转染猪细胞系PIEC,48小时后,提取细胞基因组DNA,使用引物对RELAF、RELAR(其序列如SEQ ID NO.18-19所示)进行PCR扩增,对获得的316bp的PCR产物进行克隆测序。共挑取20个单克隆菌落测序,其中有6个单克隆的序列发生改变(如附图3所示)。该结果表明,RELAF、RELAR与pcDNA-DN载体混合转染对猪细胞系PIEC的敲除效率达到30%。

RELAF:TTCCCCTCGGGTAAGTTGGA,RELAR:TGGGGTTTCACCCCTACTGA。

SEQUENCE LISTING

<110> 青岛市畜牧兽医研究所

<120> 一种哺乳动物基因组修饰方法

<130> 2010

<160> 20

<170> PatentIn version 3.3

<210> 1

<211> 1728

<212> DNA

<213> 人工序列

<400> 1

ggatccatgg gcagcagcca tcatcatcat catcatagca gcggcctggt gccgcgcggc 60

agccatatgg gcgcggatat tggcgatctg tttgaacgcg aagaagtgga actggaatat 120

tttagcggca aaaaaattgc ggtggatgcg tttaacaccc tgtatcagtt tattagcatt 180

attcgccagc cggatggcac cccgctgaaa gatagccagg gccgcattac cagccatctg 240

agcggcattc tgtatcgcgt gagcaacatg gtggaagtgg gcattcgccc ggtgtttgtg 300

tttgatggcg aaccgccgga atttaaaaaa gcggaaattg aagaacgcaa aaaacgccgc 360

gcggaagcgg aagaaatgtg gattgcggcg ctgcaggcgg gcgataaaga tgcgaaaaaa 420

tatgcgcagg cggcgggccg cgtggatgaa tatattgtgg atagcgcgaa aaccctgctg 480

gcgtatatgg gcattccgtt tgtggatgcg ccggcggaag gcgaagcgca ggcggcgtat 540

atggcggcga aaggcgatgt ggaatatacc ggcagccagg attatgatag cctgctgttt 600

ggcagcccgc gcctggcgcg caacctggcg attaccggca aacgcaaact gccgggcaaa 660

aacgtgtatg tggatgtgaa accggaaatt attattctgg aaagcaacct gaaacgcctg 720

ggcctgaccc gcgaacagct gattgatatt gcgattctgg tgggcaccga ttataacgaa 780

ggcgtgaaag gcgtgggcgt gaaaaaagcg ctgaactata ttaaaaccta tggcgatatt 840

tttcgcgcgc tgaaagcgct gaaagtgaac attgatcatg tggaagaaat tcgcaacttt 900

tttctgaacc cgccggtgac cgatgattat cgcattgaat ttcgcgaacc ggattttgaa 960

aaagcgattg aatttctgtg cgaagaacat gattttagcc gcgaacgcgt ggaaaaagcg 1020

ctggaaaaac tgaaagcgct gaaaagcacc caggcgaccc tggaacgctg gtttgaattt 1080

ggcggcggcg gcagcggcgg cggcggcagc ggcggcggcg gcagccagct ggtgaaaagc 1140

gaactggaag aaaaaaaaag ctttctgcgc cataaactga aatatgtgcc gcatgaatat 1200

attgaactga ttgaaattgc gcgcaacagc acccaggatc gcattctgga aatgaaagtg 1260

atggaatttt ttatgaaagt gtatggctat cgcggcaaac atctgggcgg cagccgcaaa 1320

ccggatggcg cgatttatac cgtgggcagc ccgattgatt atggcgtgat tgtggatacc 1380

aaagcgtata gcggcggcta taacctgccg attggccagg cggatgaaat gcagcgctat 1440

gtggaagaaa accagacccg caacaaacat attaacccga acgaatggtg gaaagtgtat 1500

ccgagcagcg tgaccgaatt taaatttctg tttgtgagcg gccattttaa aggcaactat 1560

aaagcgcagc tgacccgcct gaaccatatt accaactgca acggcgcggt gctgagcgtg 1620

gaagaactgc tgattggcgg cgaaatgatt aaagcgggca ccctgaccct ggaagaagtg 1680

cgccgcaaat ttaacaacgg cgaaattaac tttaaactgt gagaattc 1728

<210> 2

<211> 7127

<212> DNA

<213> 人工序列

<400> 2

gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60

ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120

cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180

ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240

gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300

tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360

cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420

attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480

atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540

atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600

tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660

actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720

aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780

gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840

ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900

gtttaaactt aagcttggta ccgagctcgg atccatgggc agcagccatc atcatcatca 960

tcatagcagc ggcctggtgc cgcgcggcag ccatatgggc gcggatattg gcgatctgtt 1020

tgaacgcgaa gaagtggaac tggaatattt tagcggcaaa aaaattgcgg tggatgcgtt 1080

taacaccctg tatcagttta ttagcattat tcgccagccg gatggcaccc cgctgaaaga 1140

tagccagggc cgcattacca gccatctgag cggcattctg tatcgcgtga gcaacatggt 1200

ggaagtgggc attcgcccgg tgtttgtgtt tgatggcgaa ccgccggaat ttaaaaaagc 1260

ggaaattgaa gaacgcaaaa aacgccgcgc ggaagcggaa gaaatgtgga ttgcggcgct 1320

gcaggcgggc gataaagatg cgaaaaaata tgcgcaggcg gcgggccgcg tggatgaata 1380

tattgtggat agcgcgaaaa ccctgctggc gtatatgggc attccgtttg tggatgcgcc 1440

ggcggaaggc gaagcgcagg cggcgtatat ggcggcgaaa ggcgatgtgg aatataccgg 1500

cagccaggat tatgatagcc tgctgtttgg cagcccgcgc ctggcgcgca acctggcgat 1560

taccggcaaa cgcaaactgc cgggcaaaaa cgtgtatgtg gatgtgaaac cggaaattat 1620

tattctggaa agcaacctga aacgcctggg cctgacccgc gaacagctga ttgatattgc 1680

gattctggtg ggcaccgatt ataacgaagg cgtgaaaggc gtgggcgtga aaaaagcgct 1740

gaactatatt aaaacctatg gcgatatttt tcgcgcgctg aaagcgctga aagtgaacat 1800

tgatcatgtg gaagaaattc gcaacttttt tctgaacccg ccggtgaccg atgattatcg 1860

cattgaattt cgcgaaccgg attttgaaaa agcgattgaa tttctgtgcg aagaacatga 1920

ttttagccgc gaacgcgtgg aaaaagcgct ggaaaaactg aaagcgctga aaagcaccca 1980

ggcgaccctg gaacgctggt ttgaatttgg cggcggcggc agcggcggcg gcggcagcgg 2040

cggcggcggc agccagctgg tgaaaagcga actggaagaa aaaaaaagct ttctgcgcca 2100

taaactgaaa tatgtgccgc atgaatatat tgaactgatt gaaattgcgc gcaacagcac 2160

ccaggatcgc attctggaaa tgaaagtgat ggaatttttt atgaaagtgt atggctatcg 2220

cggcaaacat ctgggcggca gccgcaaacc ggatggcgcg atttataccg tgggcagccc 2280

gattgattat ggcgtgattg tggataccaa agcgtatagc ggcggctata acctgccgat 2340

tggccaggcg gatgaaatgc agcgctatgt ggaagaaaac cagacccgca acaaacatat 2400

taacccgaac gaatggtgga aagtgtatcc gagcagcgtg accgaattta aatttctgtt 2460

tgtgagcggc cattttaaag gcaactataa agcgcagctg acccgcctga accatattac 2520

caactgcaac ggcgcggtgc tgagcgtgga agaactgctg attggcggcg aaatgattaa 2580

agcgggcacc ctgaccctgg aagaagtgcg ccgcaaattt aacaacggcg aaattaactt 2640

taaactgtga gaattctgca gatatccagc acagtggcgg ccgctcgagt ctagagggcc 2700

cgtttaaacc cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 2760

cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 2820

aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 2880

ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 2940

gggctctatg gcttctgagg cggaaagaac cagctggggc tctagggggt atccccacgc 3000

gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 3060

acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 3120

cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 3180

tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 3240

gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 3300

cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 3360

gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 3420

gaattaattc tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg ctccccagca 3480

ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca 3540

ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc 3600

ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc 3660

catggctgac taattttttt tatttatgca gaggccgagg ccgcctctgc ctctgagcta 3720

ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggga 3780

gcttgtatat ccattttcgg atctgatcaa gagacaggat gaggatcgtt tcgcatgatt 3840

gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct attcggctat 3900

gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct gtcagcgcag 3960

gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga actgcaggac 4020

gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc tgtgctcgac 4080

gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg gcaggatctc 4140

ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg 4200

ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag 4260

cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga cgaagagcat 4320

caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc cgacggcgag 4380

gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga aaatggccgc 4440

ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca ggacatagcg 4500

ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg cttcctcgtg 4560

ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct tcttgacgag 4620

ttcttctgag cgggactctg gggttcgaaa tgaccgacca agcgacgccc aacctgccat 4680

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 4740

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 4800

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 4860

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 4920

cttatcatgt ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc 4980

tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 5040

taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 5100

cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 5160

gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 5220

tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 5280

tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 5340

ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 5400

agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 5460

accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 5520

ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 5580

gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 5640

ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 5700

gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 5760

taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 5820

tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 5880

gatccggcaa acaaaccacc gctggtagcg gtttttttgt ttgcaagcag cagattacgc 5940

gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 6000

ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct 6060

agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt 6120

ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc 6180

gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac 6240

catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat 6300

cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg 6360

cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata 6420

gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta 6480

tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt 6540

gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag 6600

tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa 6660

gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc 6720

gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt 6780

taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc 6840

tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 6900

ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 6960

taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 7020

tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 7080

aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtc 7127

<210> 3

<211> 20

<212> DNA

<213> 人工序列

<400> 3

ctagagaacc cactgcttac 20

<210> 4

<211> 18

<212> DNA

<213> 人工序列

<400> 4

tagaaggcac agtcgagg 18

<210> 5

<211> 336

<212> DNA

<213> 人工序列

<400> 5

aagctgattg ggtgtggtcg ccgtggccgg acgccgctcg ggggacgtgg gaggggaggc 60

gggaaacagc ttagtgggtg tggggtcgcg cattttcttc aaccaggagg tgaggaggtt 120

tcgacatggc ggtgcagccg aaggagacgc tgcagttgga gagcgcggcc gaggtcggct 180

tcgtgcgctt ctttcagggc atgccggaga agccgaccac cacagtgcgc cttttcgacc 240

ggggcgactt ctatacggcg cacggcgagg acgcgctgct ggccgcccgg gaggtgttca 300

agacccaggg ggtgatcaag tacatggggc cggcag 336

<210> 6

<211> 24

<212> DNA

<213> 人工序列

<400> 6

ggtggagccg aaggagacgc tgcc 24

<210> 7

<211> 21

<212> DNA

<213> 人工序列

<400> 7

agccgacctc ggccgcgctc g 21

<210> 8

<211> 17

<212> DNA

<213> 人工序列

<400> 8

ttgggtgtgg tcgccgt 17

<210> 9

<211> 20

<212> DNA

<213> 人工序列

<400> 9

ccgtgcgccg tatagaagtc 20

<210> 10

<211> 310

<212> DNA

<213> 人工序列

<400> 10

agagccgagc cgagccgagc cgagcggagc cgagccgagc cgagcggagc cgagccgagc 60

cgagccgagc cgaaccgagc cgagccgagc cgaaccgagc cgagccgagc cgagtggaat 120

cgagtcgagt cgagcctcca gcgtccggcg cgcaggcctt ccgccgcgtt gatctttcgg 180

ttgctggtgg ccgtgggccg cgcggtctac ggtcgggctg aaagacgcgc gctgcaatgg 240

cgacctttgt gagcgagctg gaggcagcca agaagaactt gagcgaggcg ctgggggaca 300

acgtgaaaca 310

<210> 11

<211> 24

<212> DNA

<213> 人工序列

<400> 11

ggtcgggctg aaagacgccc gcta 24

<210> 12

<211> 26

<212> DNA

<213> 人工序列

<400> 12

ggctgcctcc agctcgctca caaagt 26

<210> 13

<211> 20

<212> DNA

<213> 人工序列

<400> 13

cgcgttgatc tttcggttgc 20

<210> 14

<211> 20

<212> DNA

<213> 人工序列

<400> 14

gcggctctta ctgtttcacg 20

<210> 15

<211> 151

<212> DNA

<213> 人工序列

<400> 15

gccggccccg gcctcgggcc cctatgtgga gatcatcgag cagcccaagc agcggggcat 60

gcgcttccgc tacaagtgcg agggccgctc agccggcagt atcccgggcg agaggagcac 120

ggataccacc aagacccacc ccaccatcaa g 151

<210> 16

<211> 23

<212> DNA

<213> 人工序列

<400> 16

gggcatgcgc ttccgctaca agc 23

<210> 17

<211> 22

<212> DNA

<213> 人工序列

<400> 17

gatactgccg gctgagcggc ct 22

<210> 18

<211> 20

<212> DNA

<213> 人工序列

<400> 18

ttcccctcgg gtaagttgga 20

<210> 19

<211> 20

<212> DNA

<213> 人工序列

<400> 19

tggggtttca cccctactga 20

<210> 20

<211> 571

<212> PRT

<213> 人工序列

<400> 20

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Gly Ala Asp Ile Gly Asp Leu Phe Glu Arg Glu

20 25 30

Glu Val Glu Leu Glu Tyr Phe Ser Gly Lys Lys Ile Ala Val Asp Ala

35 40 45

Phe Asn Thr Leu Tyr Gln Phe Ile Ser Ile Ile Arg Gln Pro Asp Gly

50 55 60

Thr Pro Leu Lys Asp Ser Gln Gly Arg Ile Thr Ser His Leu Ser Gly

65 70 75 80

Ile Leu Tyr Arg Val Ser Asn Met Val Glu Val Gly Ile Arg Pro Val

85 90 95

Phe Val Phe Asp Gly Glu Pro Pro Glu Phe Lys Lys Ala Glu Ile Glu

100 105 110

Glu Arg Lys Lys Arg Arg Ala Glu Ala Glu Glu Met Trp Ile Ala Ala

115 120 125

Leu Gln Ala Gly Asp Lys Asp Ala Lys Lys Tyr Ala Gln Ala Ala Gly

130 135 140

Arg Val Asp Glu Tyr Ile Val Asp Ser Ala Lys Thr Leu Leu Ala Tyr

145 150 155 160

Met Gly Ile Pro Phe Val Asp Ala Pro Ala Glu Gly Glu Ala Gln Ala

165 170 175

Ala Tyr Met Ala Ala Lys Gly Asp Val Glu Tyr Thr Gly Ser Gln Asp

180 185 190

Tyr Asp Ser Leu Leu Phe Gly Ser Pro Arg Leu Ala Arg Asn Leu Ala

195 200 205

Ile Thr Gly Lys Arg Lys Leu Pro Gly Lys Asn Val Tyr Val Asp Val

210 215 220

Lys Pro Glu Ile Ile Ile Leu Glu Ser Asn Leu Lys Arg Leu Gly Leu

225 230 235 240

Thr Arg Glu Gln Leu Ile Asp Ile Ala Ile Leu Val Gly Thr Asp Tyr

245 250 255

Asn Glu Gly Val Lys Gly Val Gly Val Lys Lys Ala Leu Asn Tyr Ile

260 265 270

Lys Thr Tyr Gly Asp Ile Phe Arg Ala Leu Lys Ala Leu Lys Val Asn

275 280 285

Ile Asp His Val Glu Glu Ile Arg Asn Phe Phe Leu Asn Pro Pro Val

290 295 300

Thr Asp Asp Tyr Arg Ile Glu Phe Arg Glu Pro Asp Phe Glu Lys Ala

305 310 315 320

Ile Glu Phe Leu Cys Glu Glu His Asp Phe Ser Arg Glu Arg Val Glu

325 330 335

Lys Ala Leu Glu Lys Leu Lys Ala Leu Lys Ser Thr Gln Ala Thr Leu

340 345 350

Glu Arg Trp Phe Glu Phe Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

355 360 365

Gly Gly Gly Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys

370 375 380

Ser Phe Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu

385 390 395 400

Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met

405 410 415

Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His

420 425 430

Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser

435 440 445

Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly

450 455 460

Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu

465 470 475 480

Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys

485 490 495

Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly

500 505 510

His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile

515 520 525

Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly

530 535 540

Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg

545 550 555 560

Lys Phe Asn Asn Gly Glu Ile Asn Phe Lys Leu

565 570

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1