本发明涉及植物功能基因组和基因工程技术领域。具体涉及到一个位于水稻第5染色体着丝粒附近控制粒宽和粒重的主效qtl基因gw5.1的克隆与应用。
背景技术:
水稻是全球主要粮食作物,对其产量和品质的遗传改良,具有重要意义。(1)粒形由粒长、粒宽和粒厚构成,通过决定千粒重而影响水稻的谷粒产量。适当增加种子大小,是实现稻米增产和稳产的一条重要途径。(2)粒形是稻米外观品质的一个重要性状,不同的消费者对细长型和短圆型的大米有迥异的偏好性;同时,粒形可影响糙米率和整精米率等加工碾磨品质。(3)粒形是水稻驯化的重要靶标性状,粒形基因的鉴定和克隆可以为禾本科的进化研究提供线索(tan等,2000,theor.appl.genet.101:823-829;huang等,2013,trendsplantsci18:28-226;shomura等,2008,natgenet40:1023–1028)。
粒形性状属于典型的数量性状,对其控制基因的克隆存在相当的难度。一般的常规策略是,利用分子标记技术对初级作图遗传群体中控制粒形的qtl(quantitativetraitloci)进行初步定位和遗传效应分析,进而通过构建高级作图群体(如染色体片段代换系、近等基因系等),将复杂的数量性状分解为简单的孟德尔因子来进行精细定位和克隆(方宣钧等,2000)。借助这种策略,分子遗传学家们已经克隆了一系列水稻粒形qtl基因(fanandli,2019,mol.breeding39:163–187;li等,2019,annurevplantbiol70:435–463;zuoandli,2014,annurevgenet48:99–118),这些基因编码的蛋白主要涉及到:(1)植物生长发育相关的信号物质的生物合成、稳态调节和信号转导:g蛋白信号途径、激素(br、iaa和ck)途径,多肽信号途径和mapk信号途径。(2)蛋白水平的调控,主要是蛋白的泛素化修饰介导的蛋白降解途径和蛋白磷酸化修饰介导的相关信号分子的激活/失活。(3)转录水平的调控:包括转录因子的调控和表观调控(mirna降解靶基因mrna、dna修饰和组蛋白修饰)。然而,这些已克隆的粒形基因对揭示粒形遗传和生化调控机制来说,仍然是零散化和碎片化的。因此,迫切需要克隆更多的粒形基因,以全面解析粒形形成的分子机制。在此背景下,qtl-seq和qtg-seq等qtl基因克隆方法被开发出来(takagi等,2013,plantj.74:174–183;zhang等,2019,mol.plant12:426–437),但仍不能满足快速和大批量鉴定克隆qtl基因的需要。
申请人开发了rapmap技术,集成了bsa(bulkedsegregantanalysis)和芯片技术/二代测序技术的优点,并引入共分离标准的图位克隆新方法,大大加快了qtl基因克隆的效率,为快速大批量克隆自然变异调控基因提供了可能。
本发明利用rapmap的方法分离克隆一个控制水稻谷粒粒宽和粒重的主效基因gw5.1,为水稻产量和品质的遗传改良提供新的基因资源,也为作物的进化研究提供新的线索。
技术实现要素:
本发明的目的在于提供了水稻gw5.1基因及其等位基因在控制水稻粒宽和/或粒重性状中的应用;所述的gw5.1基因的ncbiaccession为loc4338398。
本发明的另一个目的在于提供了seqidno.3所示氨基酸序列或是编码seqidno.3所示序列的核苷酸序列在控制水稻粒宽和/或粒重性状中的应用。
本发明的最后一个目的在于提供了一段分离自iksan438的基因序列,所述序列为seqidno.1所示,其cds序列为seqidno.2所示。
为了达到上述目的,本发明采取以下技术措施:
本发明以宽粒品种zs97和窄粒品种iksan438为双亲得到f2随机小群体(图1),将极端表型单株按bsa方法混合建池后,进行rice6k育种芯片分析,最终发现了一个新的qtl,命名为gw5.1。根据当代的重组单株以及筛选后代大群体得到的重组单株及其后代测验结果,我们将gw5.1精细定位在28kb的染色体区段。根据rap-db数据库网站注释,该区段有两个候选基因orf1和orf2。其中orf2基因在幼穗时期几乎不表达,而珍汕97的orf1基因与iksan438相比,在第2外显子上有一个11.8kb反转录转座子插入,导致基因功能缺失。因此,我们将orf1初步确定为gw5.1候选基因,通过进一步的敲除和过表达实验,最终确定,该基因是一个负调控水稻粒宽的主效基因。在水稻iksan438中该基因的序列为seqidno.1所示,cds序列为seqidno.2所示,编码蛋白质序列为seqidno.3所示。
seqidno.3所示氨基酸序列或是编码seqidno.3所示序列的核苷酸序列在控制水稻粒宽和/或粒重性状中的应用,包括利用本领域的常规方式,将窄粒水稻中的该基因敲除,可获得粒宽更宽的水稻;或是在宽粒水稻中超表达该基因,可获得粒宽更窄的水稻。
与现有技术相比,本发明具有以下优点:
本发明在水稻中克隆了一个对粒宽和粒重具有很大负调控效应的基因gw5.1,其功能缺失的等位基因可以增加水稻谷粒粒宽和粒重,为水稻的产量和品质育种提供新的基因资源,也为作物的进化研究提供线索。
附图说明
图1为gw5.1基因克隆的技术路线示意图。
图2.本发明克隆的gw5.1的比较测序示意图和11.8kb反转录转座子插入在dna和mrna水平的验证。
图3.是本发明crispr敲除转基因和互补转基因粒宽表型分析示意图;
其中:zh11为中花11;cr4-4,cr4-8和cr9-3为中花11敲除了gw5.1基因的阳性株;aa是珍汕97背景的近等基因系;com.是complementation代表互补转基因阳性单株。
图4是本发明在阳性敲除转基因单株中,有三株独立阳性单株不同类型的纯合移码突变体的核苷酸序列。
图5本发明中的部分crispr敲除t0代转基因阳性、阴性单株的粒宽表型图;
其中,cr(+)表示crispr敲除t0代转基因阳性株,cr(-)表示crispr敲除t0代转基因阴性株。
图6本发明中的gw5.1近等基因系的粒宽和千粒重统计。
具体实施方式
本发明所述技术方案,如未特别说明,均为本领域的常规方案;所述试剂或材料,如未特别说明,均来源于商业渠道。
实施例1:gw5.1的初定位
1.gw5.1定位遗传群体构建及两个极端粒宽表型混池的芯片检测
初定位流程如附图1所示,用珍汕97与iksan438杂交,得到f1,再自交产生f2随机群体。对f2群体各个单株粒宽表型进行考察,每个单株选取有代表性的饱满的10粒种子,按照同样的方向肩并肩依次排列,不重叠且不留缝隙的紧靠在一起,用游标卡尺读取十粒宽数据,进行3次重复后取其平均值。根据得到的粒宽表型频数分布图,构建极端高低混池,极端池里每株随机选择10粒饱满的种子代表该f2单株的基因型。高低池分别混合发芽,两周后取等量叶片用液氮研磨,送中国种子集团(武汉)进行rice6k芯片检测。
2.分子标记的开发
使用ricevarmap数据库(http://ricevarmap.ncpgr.cn/)寻找在目标物理位置附近的indel多态性变异的“variationid”,并根据“variationid”在“searchforgenotypewithvariationid”中查询该检测该indel在双亲中的基因型。将在双亲中基因型有差异的indel的“variationid”通过“designprimerbyvariationid”功能设计indel引物。设计上优先选择indel差异3-8bp缺失的、pcr片段大约有100-200bp。然后用4%page胶电泳验证设计好的分子标记在双亲珍汕97与iksan438之间是否存在多态性。pcr产物在4%的聚丙烯酰胺胶上分离后进行银染(bassam等,1991,anal.biochem.196:80-83)。双亲中显示出条带差异的引物可以用来进一步检测群体单株的分子标记基因型。
3.分子标记基因型的鉴定
以群体单株的dna为pcr扩增模板,同时用双亲dna模板为对照,pcr反应体系和程序以及4%的聚丙烯酰胺胶检测依照上述分子标记的开发中采用的方法进行。检测单株分子标记的的带型:若与亲本珍汕97的带型相同,则记为a;若与亲本iksan438的带型相同则记为b;若同时显示两种亲本的带型,则记为h。
实施例2:gw5.1的精细定位及候选基因确定
1.重组单株筛选及后代测验
选择目标区段杂合的f2单株的种子发展成包含7872株的f2:3大群体,用初定位最小区间两侧的indel标记ind1和ind6筛选重组单株,两端标记基因型不同的单株即为重组单株。共得到得到32株重组单株。将每个重组单株的后代种植36株,考察36株粒宽表型确定该重组单株目标基因的基因型:若后代粒宽表型不分离且都表现为高值,则该重组单株的gw5.1的两个等位基因均来自珍汕97;若后代粒宽表型不分离且都表现为低值,则该重组单株的gw5.1的两个等位基因均来自iksan438;若后代粒宽表型出现明显分离,则该重组单株的gw5.1的两个等位基因为杂合。
2.gw5.1精细定位和候选基因确定
利用在初定位区间内部发展的8个indel标记分析这32个重组单株,根据标记基因型和重组单株后代测验结果,我们将gw5.1精细定位在28kb的染色体区段。。根据rap-db数据库网站注释,该区段有两个候选基因orf1和orf2。其中orf2基因在已公开的珍汕97和日本晴的表达数据库(http://crep.ncpgr.cn/;http://ricexpro.dna.affrc.go.jp/)在幼穗时期均几乎不表达,而珍汕97的orf1基因与iksan438相比,在第2外显子上有一个11.8kb反转录转座子插入,导致基因功能缺失(图2)。因此本发明将orf1确定为gw5.1候选基因。该基因在iksan438中的序列为seqidno.1所示,cds序列为seqidno.2所示,编码的氨基酸序列为seqidno.3所示。
对珍汕97和iksan438进行比较测序发现,除11.8kb反转录转座子变异外,起始密码子上游3.5kb和编码区存在14处多态性变异,这些变异包括替换、插入和缺失三种突变类型。此外,近等基因系比较中,nil(gw5.1)比nil(gw5.1)粒宽增加14.9%,千粒重增加12.9%(图6)。根据上述结果,gw5.1是一个负调控水稻谷粒粒宽的主效基因。
实施例3:
水稻gw5.1基因在控制水稻粒宽和/或粒重性状中的应用:
(1)gw5.1敲除载体的构建:
利用重叠pcr的方法将gw5.1靶点序列引入到u6启动子中,以携带u6启动子的质粒(u6promoter-sgrnawithagene-specifictargetsequenceclonedinper8-cas9,he,y.等,2017,j.genet.genomics44:469–472)为模板,分别以gw5.1cr-f/u6r和gw5.1cr-r/u6f为引物进行常规pcr扩增,并将两者扩增产物纯化混收后等比例混合作为模板,再以u6f/u6r引物扩增,对得到的pcr产物进行纯化回收。将其与kpni线性化后的pcxun-cas9载体连接,通过gibson一步连接法(gibson,d.等,2009,nat.methods6:343–345;he,y.等,2017,j.genet.genomics44:469–472)连接,终载测序无误后,即成功构建gw5.1的crispr/cas9载体,即敲除载体质粒。
(2)gw5.1互补载体的构建:
从iksan438基因组dna中利用gw5.1-ecori-f/gw5.1-kpni-r引物将包含gw5.1整个编码区及上游3.5kb总共6kb片段克隆出来,利用gibson一步连接法,连接到经kpni和ecori线性化后的pcambia1301,测序正确后,即成功构建gw5.1互补载体(gibson,d.等,2009,nat.methods6:343–345)。
(3)采用农杆菌介导的转基因方法,将得到的正确克隆的敲除载体质粒,通过农杆菌介导的水稻遗传转化体系导入到gw5.1有功能水稻品种中花11(gw5.1基因型与iksan438一样,均为有功能的等位基因);
同时,将得到的测序正确克隆的gw5.1互补载体,通过农杆菌介导的水稻遗传转化体系导入到水稻目标区段片段都来自珍汕97的gw5.1无功能的aa愈伤中。经过诱导、继代、侵染、共培养、筛选具有潮霉素抗性的愈伤、分化、生根、练苗移栽,得到转基因的水稻小植株。农杆菌介导的水稻(粳稻亚种)遗传转化体系主要应用hiei等人报道的方法(参见:efficienttransformationofrice,oryzasatival.,mediatedbyagrobacteriumandsequenceanalysisoftheboundariesofthet-dna,1994,plantjournal6:271-282)基础上进行优化。
(4)本发明获得转基因敲除t0代独立29株,经过6%聚丙烯酰胺凝胶电泳和一代测序检测,确认其中22株为阳性,7株为阴性。敲除转基因t0代粒宽表型统计如图5,阳性敲除植株的粒宽明显高于阴性植株。其中,在阳性敲除转基因单株中,有三株独立阳性单株为三种不同类型的纯合移码突变体(图4),其粒宽表型均比对照显著变宽(图3)(p<0.01),表明gw5.1是一个负调控水稻谷粒粒宽的基因。
在gw5.1互补的实验中,由于转化受体为籼稻背景,只得到了一棵阳性单株,且该互补转基因阳性植株粒宽比对照变窄(图3),这与敲除转基因结果一致,都证明了gw5.1负调控水稻谷粒粒宽。同时也证明了这个基因可以通过遗传转化来改良水稻品种。
本发明所用到的引物如下:
表1用于本发明图位克隆和基因功能分析的引物/分子标记
序列表
<110>华中农业大学
<120>水稻粒宽和粒重基因gw5.1的克隆与应用
<160>17
<170>siposequencelisting1.0
<210>1
<211>6268
<212>dna
<213>人工序列(artificialsequence)
<400>1
gacgaatttcggattaagcgacaaattgagagactcagtaaacttattcctaataatcta60
accgattttgcggttcagagacaccgataaaactcgatcatggacttttccttagcagcc120
cacagctcccacacggccacaccagctgggtccgaaacataggcccaacaaggagcaaca180
accctgttctagcccaccactcgacgccgacggccgacaccgctgacacgctgtccgcgg240
tccgcggtccgccgacgcttgcctcccgcagccgccgcccgtcggccctcccccctcccc300
tcgctggcacggcggctcggcggtcgccgagcactgacccgatgctgcgacctagccatc360
ggaggaagagatccttagccgatgccgtgaagaagctggtgaagcaagaggaggagtgga420
gctggggagaaaaggtcaacttcgtgggggtaaggatcagaatatcatatccaccacttt480
ctttttacaggcgtatttaactgtacatgatctttggttaggtaagacaaacaacacaat540
tagtcaaagtttttagtatgaagcattgaagttccctaattcttccaataaaatgcaatc600
ggacttgcaatattaacttgaactgcacagtttacctgttttggagaagtatacaatttc660
ttggccctgcccttttcagatgttttccagaaaaaaaaaacaatgccttggccctggatg720
accgtccaaaagaatactcaatactgtattcaacaaaatacaaaacacaaaaaataaaaa780
ttggaccgatttggaacccgagaaaagttttctgatgttgatctgtggggactcaggtac840
aatttcttatgtcctggaaaattactatagaactcctaacttccgaataggagatatttt900
ctaatgttcatgataacaacatttgtcaatactctatatttccaggagtacaaaatggtg960
ggctcgatgtctttctctattaatgtgtttcagtgtacagacgggtccactagaagtctc1020
agtctccttagcaccacagggaaatgattattaaagatcatatactttgtttaaatttat1080
tttgacctgatgagacgactttgactactggctgaagccagctacctgttggaaaattga1140
ttggctggtggccatagaaggagaacgaaaatatgggttggtggagttctcatatggctc1200
agacatggtctcatggtgtggagagaagcatgagaaaggagagagtagatcagcaatacg1260
ttgtttctattcattgatatcttgacatcttgtttctattcagtgatcataaccagtcca1320
atccagtttatgcagttttctccccttcgcgatggagttttcatgcatctggagtgatct1380
tatcaggtaagttctttccacgttgtctcatcattttgttctccaggtttcctgtaatca1440
tatttgatataaggtagtgctaaccttctctccagatcatggcttcatttttagaaataa1500
gctctgccctttatttgatatcttcttttcctgcttcgtagagttgtttgtgatcttaca1560
gttttacaggcttcaaaacccagctattttggcttcaattttttcccattacagttattt1620
aattaatttatgatctaccttatgttgcttttgtatgttttcctcttgaagttaaattag1680
gggatgttcggcacctagatttgctttaaaccaattcgactttaattcagaattccaatt1740
agagtaaatttaataaaaccccatgttttattaccaaagttaaaaaaatgcgttattgta1800
gcatgtactttgatgctaaagtttcacaaaatctcaaccctatttaaattccagacaatg1860
tagcatgtatttacttaatttttgccattataaaatgtctatagaatttgaattacgaat1920
ttcttggttaaaatgtttcattatattgaacccttcattactctgaacaatattgtttta1980
aatatttaaaatttgctaagagttgaataagggcgggactttatgaaaattttaacctat2040
atgctaccagctataactcccagagtttatagcaagtttgacaatgaataacctatagtt2100
tactgtgaaatttgttcttgtatttactttgatatttttgaaatttgaatggaaaaccat2160
acaattattttttagatttaatatgaattccttttttcttggttgcttgacatggactct2220
ttacttttaaatttgtaatcccaatttgaacacagagtcttattaatgaaactgtttcga2280
ggactggattggaacacagaggagatctgcctaaacaggattggactggttatgatcact2340
gaatagaaaccagagtcttattaatgaaaccatacaatttgaacgcagatctcctgcgtg2400
caaaaaaagttattgaacataggctttttggggtcgcgggagggggttgctacacatagg2460
ccattgagctcaattgaggcctgcacacaaacatttgttttagtgcttgagctgaaagaa2520
tgtgatggaactgtttcgagaaaatcactaagtggggatgaactgtaaatgttatataga2580
atttgtagccttttaaacatctaggactatattcttgaaggactctaattaatattcttt2640
gtacaggagtgcaaaaattgtcttttgatgacctagacatatcgttaatctgcggcaacc2700
acatagacaatgttgcattttctttctttaatcatgtgcctgtagatgctactgtcctga2760
taccatccaatggcttgttctggagtctttgttttgttctttcttttattcatcctatat2820
tggtcattttcttctcattacaaatttgtgacctttaacctgatgattttttttggcaaa2880
aaaaactcgtcacattaagtgtaatagaacaggagctcctagtagttcatgcaaatattc2940
tattctcccatacctctctttttgaaaatgtaacgaatatttgagcaaatagttaaatat3000
gagatcgtgagtaatatgtgttaaactagaagatggatcaagccaaaatgttttgccata3060
atattcaactctgttctcttctgcagaatttactagcggtttttcatagtacttggtaca3120
atgtatattattttggtgtgttttcttccatgatgaattattgatgttgcttcaatcttc3180
agtttgattataatttcttaagcagaaacttacaatacaattagctgaatttccaaattc3240
tttgtttcttgtgattgcagggaagtctatagctatctggacatgatttctccataaaaa3300
acagttcaattcctcaaacactccaatttccttgccccaagtcccacccatagaaaacat3360
tacgcaatcgttcccacctatcttatagcaatttgttagccggtaattttatagcattga3420
tgtgaaggaaccttcaaacttccatattttcatacaaaacaacaatcattacctatgata3480
cacccaagcctactaactaccatccaatgggtcgcactgtctaccctcatattgatcacc3540
atagcggctgataactactcatcatcctctagcccaatctttctaaattgtggagcctcc3600
accatgcaacttgatatcaataatcggagttgggagggggacactagatccaagtttgca3660
tcagcaatgaatggaattgcagctagtgctacataccaagacccttcactcccatctctt3720
gtgccttacatgacatcccgtatattcatttcaaattacacctattccttcccaattagc3780
ccagggcggatattcgtgcgcctttacttctatccagtggcctatggctactatgcttct3840
gaagatgcttactttggtgtcaaaacaaacaatttgattcttttagacaacttcaatgct3900
tcacaaactgctcaggcagcaaactatgcctacatccttcgagaattctcgctgaacgtc3960
actttaggtagtctagacctcacctttttcccatccacacagaatggttcttatgcattt4020
gtgaatgggattgagattgtgcccacgcctgacatcttcacaacacgaacacctacacat4080
aacaccgaagggaaccttgatccatccgatatagattctatgaccagtttccaaacgatg4140
taccgtctcaatgttgggggccaggcgatcattccacaaggtgattctaggttctatcgt4200
tcatgggaggatgactctccatacatatatggtgctgcctttggggtgaccttcggcaaa4260
gatagtaatgtcaccatcacatatccaggtactatgccaaactacactgcacctgctgat4320
gtgtatgcaacagcacgatcaatgggcccaaattggcagatcaacctgaactacaatctt4380
acatggatcttatcggttgacgcagggttttactacctcttaaggttccatttctgtgag4440
atccagtatcctataaccaagatgaatcagaggtcattcttcatttacatcaataatcag4500
acggtgcaggatcaaatggatgttattcgttggagtggaggaattggcatggcaacatat4560
gctgactatcttatcgtcacagttggttccggtcagatggatttgtgggttgcacttcat4620
cctgatctttcaagtagaccacagtattatgatgcaatactaaatggccttgaggtcttc4680
aagctatgggacattgggaaaaaaaaccttgctgggcttaaccctccacttccaccacaa4740
ccaaagactgatgtgaaccctaaaggggtgtctggtggagggaaattaaaggctgctgtc4800
ccagcagccatatgtgccgtggttgtgctgattacagcttgtttttgtgtgtgcatcatc4860
tgtagacgaaagaaagtggcaaagcattctggcaagactgacaaaaagtgcttgacttat4920
caaactgaattatacaaatcaccatcaaatctttgtcggaacttcaccttccatgaaatg4980
caaatagcaactagtagctttgatgaaacccttctgcttggtagaggtggatttggtgat5040
gtgtaccgtggagagatagataatggtacaacggtggcgatcaaacggagcaacccattg5100
tccctgcagggtgttcatgagttccagaccgagattgagacgctgtccaaggtcagacat5160
ggccatcttgtgtctctaatcggatactgccaggaaaaaaatgagatgattttggtgtat5220
gaatacatggcccgtggaacacttcgggagcacctgtacagcaccaagaggccaccatta5280
ccatggaaggagcgcctcaagatctgcattggtgcagcccgagggctgtattacctgcac5340
acgggcccgaaagaaacaatcatccatcgtgacgtgaagactgccaacattctactagat5400
gacaagtgggtggcaaaggtttcagactttgggttgtccaaggttaatccggacattgac5460
gccacccatgttagcactgttgtgaagggtacattcggatatttcgaccctgagtatttt5520
cggttgaagcaacttacccaaaggtcagatgtgttctcttttggggttgtgttgtttgag5580
atcctgtgcgctcgccctccagtaaacactgagcttccagaagagcaagtgagcttgcgt5640
gaatgggcattgtcttgcaagaagataggcactcttggtgaaattatagatccctatctt5700
cagggagaaatcgctcctgattgcctcaagaagtttgctgattgtgcagaacaatgtgtt5760
gctgatcgaagcatcgacaggccagagatgggtgatgttcttcggaacctagaggttgct5820
ctgaagatgcaggagtgtgcagagaacaatagcaaattcagtgaagaaacaacatcgtcg5880
aagacaacaccagacatgatgaccatcatggatactgacaaacaatccacctactcgaca5940
atgagcatcactggacaaaggaccatattctctgatatgatggatccgcaggcccgatga6000
aacacaacagttaatgtttcaactaatttcagatccatagttcatgtcctggtgatcttt6060
tgatcgcaatcactctagtatgttgaataattagttgtttcagatttttcatactagttc6120
caaatctaagcatagttagacttatcaagtaaataattctgcataccatttttaagaagt6180
aatgctactgtttgagtggttattttgttgcttttggatagtatagtttacccaatctat6240
ctacatacgaaggtgctgttaatgcagt6268
<210>2
<211>2526
<212>dna
<213>人工序列(artificialsequence)
<400>2
atgatacacccaagcctactaactaccatccaatgggtcgcactgtctaccctcatattg60
atcaccatagcggctgataactactcatcatcctctagcccaatctttctaaattgtgga120
gcctccaccatgcaacttgatatcaataatcggagttgggagggggacactagatccaag180
tttgcatcagcaatgaatggaattgcagctagtgctacataccaagacccttcactccca240
tctcttgtgccttacatgacatcccgtatattcatttcaaattacacctattccttccca300
attagcccagggcggatattcgtgcgcctttacttctatccagtggcctatggctactat360
gcttctgaagatgcttactttggtgtcaaaacaaacaatttgattcttttagacaacttc420
aatgcttcacaaactgctcaggcagcaaactatgcctacatccttcgagaattctcgctg480
aacgtcactttaggtagtctagacctcacctttttcccatccacacagaatggttcttat540
gcatttgtgaatgggattgagattgtgcccacgcctgacatcttcacaacacgaacacct600
acacataacaccgaagggaaccttgatccatccgatatagattctatgaccagtttccaa660
acgatgtaccgtctcaatgttgggggccaggcgatcattccacaaggtgattctaggttc720
tatcgttcatgggaggatgactctccatacatatatggtgctgcctttggggtgaccttc780
ggcaaagatagtaatgtcaccatcacatatccaggtactatgccaaactacactgcacct840
gctgatgtgtatgcaacagcacgatcaatgggcccaaattggcagatcaacctgaactac900
aatcttacatggatcttatcggttgacgcagggttttactacctcttaaggttccatttc960
tgtgagatccagtatcctataaccaagatgaatcagaggtcattcttcatttacatcaat1020
aatcagacggtgcaggatcaaatggatgttattcgttggagtggaggaattggcatggca1080
acatatgctgactatcttatcgtcacagttggttccggtcagatggatttgtgggttgca1140
cttcatcctgatctttcaagtagaccacagtattatgatgcaatactaaatggccttgag1200
gtcttcaagctatgggacattgggaaaaaaaaccttgctgggcttaaccctccacttcca1260
ccacaaccaaagactgatgtgaaccctaaaggggtgtctggtggagggaaattaaaggct1320
gctgtcccagcagccatatgtgccgtggttgtgctgattacagcttgtttttgtgtgtgc1380
atcatctgtagacgaaagaaagtggcaaagcattctggcaagactgacaaaaagtgcttg1440
acttatcaaactgaattatacaaatcaccatcaaatctttgtcggaacttcaccttccat1500
gaaatgcaaatagcaactagtagctttgatgaaacccttctgcttggtagaggtggattt1560
ggtgatgtgtaccgtggagagatagataatggtacaacggtggcgatcaaacggagcaac1620
ccattgtccctgcagggtgttcatgagttccagaccgagattgagacgctgtccaaggtc1680
agacatggccatcttgtgtctctaatcggatactgccaggaaaaaaatgagatgattttg1740
gtgtatgaatacatggcccgtggaacacttcgggagcacctgtacagcaccaagaggcca1800
ccattaccatggaaggagcgcctcaagatctgcattggtgcagcccgagggctgtattac1860
ctgcacacgggcccgaaagaaacaatcatccatcgtgacgtgaagactgccaacattcta1920
ctagatgacaagtgggtggcaaaggtttcagactttgggttgtccaaggttaatccggac1980
attgacgccacccatgttagcactgttgtgaagggtacattcggatatttcgaccctgag2040
tattttcggttgaagcaacttacccaaaggtcagatgtgttctcttttggggttgtgttg2100
tttgagatcctgtgcgctcgccctccagtaaacactgagcttccagaagagcaagtgagc2160
ttgcgtgaatgggcattgtcttgcaagaagataggcactcttggtgaaattatagatccc2220
tatcttcagggagaaatcgctcctgattgcctcaagaagtttgctgattgtgcagaacaa2280
tgtgttgctgatcgaagcatcgacaggccagagatgggtgatgttcttcggaacctagag2340
gttgctctgaagatgcaggagtgtgcagagaacaatagcaaattcagtgaagaaacaaca2400
tcgtcgaagacaacaccagacatgatgaccatcatggatactgacaaacaatccacctac2460
tcgacaatgagcatcactggacaaaggaccatattctctgatatgatggatccgcaggcc2520
cgatga2526
<210>3
<211>841
<212>prt
<213>人工序列(artificialsequence)
<400>3
metilehisproserleuleuthrthrileglntrpvalalaleuser
151015
thrleuileleuilethrilealaalaaspasntyrserserserser
202530
serproilepheleuasncysglyalaserthrmetglnleuaspile
354045
asnasnargsertrpgluglyaspthrargserlysphealaserala
505560
metasnglyilealaalaseralathrtyrglnaspproserleupro
65707580
serleuvalprotyrmetthrserargilepheileserasntyrthr
859095
tyrserpheproileserproglyargilephevalargleutyrphe
100105110
tyrprovalalatyrglytyrtyralasergluaspalatyrphegly
115120125
vallysthrasnasnleuileleuleuaspasnpheasnalasergln
130135140
thralaglnalaalaasntyralatyrileleuargglupheserleu
145150155160
asnvalthrleuglyserleuaspleuthrphepheproserthrgln
165170175
asnglysertyralaphevalasnglyilegluilevalprothrpro
180185190
aspilephethrthrargthrprothrhisasnthrgluglyasnleu
195200205
aspproseraspileaspsermetthrserpheglnthrmettyrarg
210215220
leuasnvalglyglyglnalaileileproglnglyaspserargphe
225230235240
tyrargsertrpgluaspaspserprotyriletyrglyalaalaphe
245250255
glyvalthrpheglylysaspserasnvalthrilethrtyrprogly
260265270
thrmetproasntyrthralaproalaaspvaltyralathralaarg
275280285
sermetglyproasntrpglnileasnleuasntyrasnleuthrtrp
290295300
ileleuservalaspalaglyphetyrtyrleuleuargphehisphe
305310315320
cysgluileglntyrproilethrlysmetasnglnargserphephe
325330335
iletyrileasnasnglnthrvalglnaspglnmetaspvalilearg
340345350
trpserglyglyileglymetalathrtyralaasptyrleuileval
355360365
thrvalglyserglyglnmetaspleutrpvalalaleuhisproasp
370375380
leuserserargproglntyrtyraspalaileleuasnglyleuglu
385390395400
valphelysleutrpaspileglylyslysasnleualaglyleuasn
405410415
proproleuproproglnprolysthraspvalasnprolysglyval
420425430
serglyglyglylysleulysalaalavalproalaalailecysala
435440445
valvalvalleuilethralacysphecysvalcysileilecysarg
450455460
arglyslysvalalalyshisserglylysthrasplyslyscysleu
465470475480
thrtyrglnthrgluleutyrlysserproserasnleucysargasn
485490495
phethrphehisglumetglnilealathrserserpheaspgluthr
500505510
leuleuleuglyargglyglypheglyaspvaltyrargglygluile
515520525
aspasnglythrthrvalalailelysargserasnproleuserleu
530535540
glnglyvalhisglupheglnthrgluilegluthrleuserlysval
545550555560
arghisglyhisleuvalserleuileglytyrcysglnglulysasn
565570575
glumetileleuvaltyrglutyrmetalaargglythrleuargglu
580585590
hisleutyrserthrlysargproproleuprotrplysgluargleu
595600605
lysilecysileglyalaalaargglyleutyrtyrleuhisthrgly
610615620
prolysgluthrileilehisargaspvallysthralaasnileleu
625630635640
leuaspasplystrpvalalalysvalserasppheglyleuserlys
645650655
valasnproaspileaspalathrhisvalserthrvalvallysgly
660665670
thrpheglytyrpheaspproglutyrpheargleulysglnleuthr
675680685
glnargseraspvalpheserpheglyvalvalleuphegluileleu
690695700
cysalaargproprovalasnthrgluleuproglugluglnvalser
705710715720
leuargglutrpalaleusercyslyslysileglythrleuglyglu
725730735
ileileaspprotyrleuglnglygluilealaproaspcysleulys
740745750
lysphealaaspcysalagluglncysvalalaaspargserileasp
755760765
argproglumetglyaspvalleuargasnleugluvalalaleulys
770775780
metglnglucysalagluasnasnserlyspheserglugluthrthr
785790795800
serserlysthrthrproaspmetmetthrilemetaspthrasplys
805810815
glnserthrtyrserthrmetserilethrglyglnargthrilephe
820825830
seraspmetmetaspproglnalaarg
835840
<210>4
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>4
ttgtcggaacttcaccttccatg23
<210>5
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>5
acctctaggttccgaagaacatcac25
<210>6
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>6
ttgtcggaacttcaccttccatg23
<210>7
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>7
ctgtggagtggagttgccatagc23
<210>8
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>8
cattgacgccacccatgttagc22
<210>9
<211>24
<212>dna
<213>人工序列(artificialsequence)
<400>9
tcatgtctggtgttgtcttcgacg24
<210>10
<211>46
<212>dna
<213>人工序列(artificialsequence)
<400>10
gggtagacagtgcgacccatgttttagagctagaaatagcaagtta46
<210>11
<211>40
<212>dna
<213>人工序列(artificialsequence)
<400>11
atgggtcgcactgtctacccaacctgagcctcagcgcagc40
<210>12
<211>40
<212>dna
<213>人工序列(artificialsequence)
<400>12
cccctttcgccaggggtacctatgtacagcattacgtagg40
<210>13
<211>40
<212>dna
<213>人工序列(artificialsequence)
<400>13
tacgaattcgagctcggtaccgatggtgcttactgtttag40
<210>14
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>14
cattacgcaatcgttcccacc21
<210>15
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>15
agtagccataggccactggatag23
<210>16
<211>44
<212>dna
<213>人工序列(artificialsequence)
<400>16
atgaccatgattacgaattcgggacgaatttcggattaagcgac44
<210>17
<211>43
<212>dna
<213>人工序列(artificialsequence)
<400>17
ctagaggatccccgggtacctcgggcctgcggatccatcatat43