本发明涉及基因工程技术领域,尤其涉及一种植物rna修饰和编辑的系统及方法,具体涉及使用具有甲基转移酶的重组核酸酶dcas13a-rsmb与dpspcas13b-rsmb和具有腺嘌呤脱氨酶活性的重组核酸酶dpspcas13b-hadar(e488q/t375g)对rna进行胞嘧啶c甲基化修饰和腺嘌呤a到次黄嘌呤i的特异性转换。
背景技术:
在遗传学的研究过程中基因编辑工具的作用是非常重要的,近几年发现的crispr基因编辑技术以其特异性强、靶向性好、适用性广等特点成为广大科研工作者研究和开发的热点。利用crispr系统对基因组dna进行敲除进而研究基因功能的方法是非常便利和高效的。crispr系统不仅能进行基因组dna的敲除还可以通过融合突变的cas蛋白序列与有催化功能的蛋白实现各种靶向基因编辑操作,如融合脱氨酶实现a-i和c-u的定点编辑。
以上多种编辑修饰方式都是在dna水平上进行的,而rna作为重要的遗传信息传递介质对其的研究一直受到很大的限制,直到张峰在2016年发现沙氏纤毛菌(leptotrichiashahii)中存在一种新型的crispr效应蛋白cas13a(c2c2)。cas13a具有rna介导的rna酶活性,这一发现为在rna水平改变遗传信息提供了一种新的工具abudayyeh,o.o.,j.s.gootenberg,s.konermann,j.joung,i.m.slaymaker,d.b.cox,s.shmakov,k.s.makarova,e.semenova,l.minakhin,k.severinov,a.regev,e.s.lander,e.v.kooninandf.zhang(2016)."c2c2isasingle-componentprogrammablerna-guidedrna-targetingcrispreffector."science.)。2017年张峰教授又发现了pspcas13b,pspcas13b是一种比cas13a更稳定更高效的核酸酶。pspcas13b不仅能进行rna的切割还可以通过dpspcas13b(失活的pspcas13b)与不同功能的蛋白融合,实现各种靶向rna的编辑,如通过融合hadar在动物细胞中在rna水平上实现a-i的定点编辑。但是目前该rna编辑系统仅用于动物细胞中,其在植物系统中的rna定点编辑效果还不知道。
在植物体中rna作为重要的遗传物质,截至目前已有100余种不同的化学修饰形式被发现。rna甲基化(rnamethylation)作为表观遗传学研究的重要内容之一,是指发生在rna分子上不同位置的甲基化修饰现象,6-甲基腺嘌呤(n6-methyladenosine,m6a)和5-甲基胞嘧啶(c5-methylcytidine,m5c)是真核生物中最常见的两种rna转录后修饰。rna甲基化在调控基因表达、编辑、稳定性及降解等方面扮演重要角色。相对于dna甲基化,rna甲基化更加复杂,种类繁多,且普遍存在于各种高级生物中。迄今为止,还没有能够人为靶向修饰rna的系统。
因此,本领域急需一种高效快速的rna编辑修饰系统。
技术实现要素:
鉴于上述现有技术中存在的缺陷,本发明的目的是提出一种植物rna修饰和编辑的系统及方法。
为了实现上述目的,本发明采用了如下技术方案:
一种植物rna修饰和编辑的系统,包括靶向rna的具有rna修饰和编辑功能的重组核酸酶及其靶向rna的grna。
进一步的,所述重组核酸酶是将靶向rna的无切割活性的核酸酶dcas13a(deadcas13a,cas13a也称为c2c2)和dpspcas13b分别与甲基转移酶结构域和腺嘌呤脱氨酶进行融合,形成的具有甲基转移酶活性的重组核酸酶dcas13a-rsmb与dpspcas13b-rsmb和具有腺嘌呤脱氨酶活性的重组核酸酶dpspcas13b-hadar。
一种植物rna修饰和编辑的方法,应用所述的植物rna修饰和编辑系统,将相应功能的酶引导到相应rna上,实现植物rna的修饰和编辑。
进一步的,利用所述重组核酸酶在靶位点处进行胞嘧啶碱基的甲基化和腺嘌呤碱基的脱氨,最终实现植物rna的m5c甲基化修饰和a转换为i。
进一步的,所述植物rna的修饰方法包括建立rnam5c甲基化修饰的体外表达系统;所述体外表达系统利用原核表达系统进行体外蛋白的表达,获得带his和msb标签的dcas13a-rsmb及dpspcas13b-rsmb的融合蛋白,并建立体外甲基化反应体系。
进一步的,所述植物rna的修饰方法包括建立rnam5c甲基化修饰的体内表达系统;所述体内表达系统分别利用atu6启动子驱动grna的表达,利用35s启动子驱动dcas13a-rsmb及dpspcas13b-rsmb的表达,在植物体内进行定点修饰实验。
进一步的,所述植物rna的编辑方法包括建立了提前翻译终止的dgfp的报告系统,用于其定点编辑的鉴定。
进一步的,所述植物rna的编辑方法为通过催化dgfp的rna上的提前终止密码子tag位点处的a碱基转换为了次黄嘌呤i,在翻译的过程中i将与c碱基配对,从而使终止密码子tag恢复为tgg,gfp蛋白得以正常翻译;在植物体中进行瞬时表达,通过观察gfp的绿色荧光,来判断rna定点编辑的效果。
本发明的突出效果为:
本发明的一种植物rna修饰和编辑的系统及方法,使用具有甲基转移酶的重组核酸酶dcas13a-rsmb与dpspcas13b-rsmb和具有腺嘌呤脱氨酶活性的重组核酸酶dpspcas13b-hadar(e488q/t375g)对rna进行胞嘧啶c甲基化修饰和腺嘌呤a到次黄嘌呤i的特异性转换,具有高效性和特异性等特点,是一种高效快速的rna修饰和编辑系统。
附图说明
图1a为本发明实施例1的dcas13a-rsmb体外甲基化蛋白纯化所用载体和实施例2的拟南芥稳转的载体示意图;
图1b为本发明实施例1的dcas13a-rsmb融合蛋白考马斯亮蓝染色的sds-page胶图;
图1c为本发明实施例1的dcas13a-rsmb体外甲基化结果图;
图2a为本发明实施例2的拟南芥甲基转移酶trm4b蛋白的保守结构域结构示意图;
图2b为本发明实施例2的用于亚细胞定位的载体结构示意图;
图2c为本发明实施例2的trm4b亚细胞定位结果图;
图3a为本发明实施例3dpspcas13b-rsmb体外甲基化蛋白纯化所用载体和用于拟南芥稳转的载体示意图;
图3b为本发明实施例3的dpspcas13b-rsmb融合蛋白考马斯亮蓝染色的sds-page胶图;
图3c为本发明实施例3的dcas13b-rsmb体外甲基化结果图;
图4为本发明实施例2的dcas13a-rsmb体内甲基化的靶位点序列及grna位置;
图5为本发明实施例4的dpspcas13b-hadar烟草rnaa到i碱基编辑的示意图;
图6为本发明实施例5的dpspcas13b-hadar拟南芥原生质体rnaa到i碱基编辑的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
本发明的一种植物rna修饰和编辑的方法,包括以下步骤:
1.改造pet28a原核细胞表达载体,构建具有msb超酸性水解蛋白(zou,z.,l.cao,p.zhou,y.su,y.sunandw.li(2008)."hyper-acidicproteinfusionpartnersimprovesolubilityandassistcorrectfoldingofrecombinantproteinsexpressedinescherichiacoli."jbiotechnol135(4):333-339.)标签的原核细胞表达载体
从dh5α中用pcr扩增得到msb的dna序列并通过pcr将his标签和tev蛋白酶切位点分别加到msb的n端和c端,然后用ncoi和bamhi双酶切pcr产物和pet28a载体,最后用t4dna连接酶连接得到pet28a-msb原核细胞表达载体。
ncoi-his-msb-tev-bamhi的基因序列如seqidno.1所示。
2.改造失活核酸酶dcas13a和dpspcas13b(δ984-1090),构建具有甲基转移活性的融合蛋白dcas13a-rsmb与dpspcas13b-rsmb到原核表达载体pet28a-msb上
从genewiz公司合成经过植物密码子优化的dcas13a(komor,a.c.,y.b.kim,m.s.packer,j.a.zurisandd.r.liu(2016)."programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage."nature.)和dpspcas13b(cox,d.b.t.,j.s.gootenberg,o.o.abudayyeh,b.franklin,m.j.kellner,j.joungandf.zhang(2017)."rnaeditingwithcrispr-cas13."science358(6366):1019-1027.)序列
dcas13a的基因序列如seqidno.2所示。
dpspcas13b的基因序列如seqidno.3所示。
用pcr扩增得到dcas13a和dpspcas13b的序列,然后通过bamhi和hindiii双酶切连入pet28a-msb原核表达载体上得到pet28a-msb-dcas13a和pet28a-msb-dpspcas13b。
从拟南芥基因组dna中pcr扩增得到trm4b的rsmb结构域,用hindiii酶切之后通过同源重组的方法将rsmb连入载体pet28a-msb-dcas13a和pet28a-msb-dpspcas13b得到原核表达载体pet28a-msb-dcas13a-rsmb和pet28a-msb-dpspcas13b-rsmb。rsmb结构域分别通过xten(komor,a.c.,y.b.kim,m.s.packer,j.a.zurisandd.r.liu(2016)."programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage."nature.)和hivnex(cox,d.b.t.,j.s.gootenberg,o.o.abudayyeh,b.franklin,m.j.kellner,j.joungandf.zhang(2017)."rnaeditingwithcrispr-cas13."science358(6366):1019-1027.)连接到dcas13a和dpspcas13b的c端。
xten连接序列如下:
tctggatctgagactcctggaacttctgagtctgctactcctgagtct
hivnex连接序列如下:
ggatcacttcaattgcctccacttgaaagattgacattgggatct
rsmb结构域的基因序列如seqidno.4所示。具体如下:
注:加粗标注出来的位置原基因组上hindiii酶切位点aagctt,将原序列通过pcr突变成aaactt消除了hindiii位点但是没有改变蛋白编码序列。
3.原核细胞表达纯化融合蛋白dcas13a-rsmb和dpspcas13b-rsmb
将构建好的载体pet28a-msb-dcas13a-rsmb和pet28a-msb-dpspcas13b-rsmb转入rosetta(de3)化学感受态细胞中。将12ml过夜培养的菌液接种到6升lb培养基中。在37℃下生长至细胞密度到od600为0.4,然后温度降至16℃。当细胞密度到od600为0.8时,加入iptg至浓度为250μm。培养16小时后,收获菌液并重悬于裂解缓冲液(50mmtris-hclph8.0,0.5mnacl,10mm咪唑,5%甘油,1%trixtonx-100,1mmpmsf,7.15mmbme)中,通过超声破碎裂解和超速离心澄清裂解物。使用ni-ntahis树脂
4.体外合成靶向rna和crrna
首先利用pcr获得用于体外转录的靶向rna和crrna的dna序列。
靶向rna的基因序列如seqidno.5所示。具体如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
dcas13a的grna17序列如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
dcas13a的grna18序列如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
dcas13a的grna27序列如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
dcas13a的grna31序列如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
dcas13a的grna33序列如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
dpspcas13b的grna17序列如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
dpspcas13b的grna18序列如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
dpspcas13b的grna27序列如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
dpspcas13b的grna31序列如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
dpspcas13b的grna33序列如下:
注:加粗标注的序列为t7启动子序列,用于t7rna聚合酶的体外转录。
靶向rna和crrna用hiscribetmt7quickhighyieldrnasynthesiskit(neb)合成,然后用rnaclean&concentrator(zymoresearch)纯化。
5.体外甲基化
用1xcutsmart缓冲液,80μmsam,8pmssrna,5pmcrrna,20pm的融合蛋白进行甲基化反应1小时,通过rnaclean&concentrator(zymoresearch)纯化rna。
6.亚硫酸氢盐处理rna(david,r.,a.burgess,b.parker,j.li,k.pulsford,t.sibbritt,t.preissandi.r.searle(2017)."transcriptome-widemappingofrna5-methylcytosineinarabidopsismrnasandnon-codingrnas."plantcell.)
配置亚硫酸氢盐溶液:40%亚硫酸氢钠,0.6mm对苯二酚,ph5.1。添加100μl亚硫酸氢盐溶液到需要处理的rna中,75℃处理4小时,用microbio-spin6chromatographycolumns脱盐2次。在脱盐处理之后的rna中加入100μl的1mhcl,ph9.0℃75处理1小时。最后用rnaclean&concentrator(zymoresearch)纯化rna。
7.用trizol提取rna
加入1ml的trizol到样品中,静置5分钟,加入200μl氯仿,剧烈震荡15s。室温静置5分钟,12000g,4℃离心15分钟。取上清加入500μl异丙醇,室温静置5分钟,离心10分钟。用75%乙醇洗一遍,超净台吹干乙醇,加入适量的水溶解rna。
8.rt-pcr和sanger测序检测甲基化效率
将rna用transscriptone-stepgdnaremovalandcdnasynthesissupermix试剂盒反转录得到crna,再用高保真酶扩增得到dna序列。将扩增得到的dna用
用于rt-pcr和扩增的引物序列bs-fp的序列如下:
ttagtgaatttgagtttggt
用于rt-pcr和扩增的引物序列bs-rp的序列如下:
ctttatacttccaactcata
用于rt-pcr和扩增的引物序列bs-s3fp的序列如下:
attttgattatttaatgagg
用于rt-pcr和扩增的引物序列bs-s3fp的序列如下:
tcattctttatctcaaactt
9.构建用于拟南芥稳定转化的pcambia1300atu6-35s-dcas13a-rsmb载体
将用于转录grna的启动子终止子和dcas13agrna骨架序列插入pcambia1300的hindiii和xmai位点之间。
atu6的基因序列如seqidno.6所示。
dcas13agrna骨架序列如下:
ccaccccaatatcgaaggggactaaaac
注:加粗标注的为含有两个bsai位点的序列,用于插入spacer。
终止子序列如下:
tttttttgttttttatgtct
将用于表达dcas13a-rsmb的35s启动子和nos终止子插入xmai和ecori之间,35s启动子和nos终止子之间插入了ncoi和bamhi位点。
35s启动子序列的基因序列如seqidno.7所示。
nos终止子的基因序列如seqidno.8所示。
用ncoi和bamhi双酶切后插入从pet28a-msb-dcas13a-rsmb扩增到的dcas13a-rsmb序列,并且在dcas13a-rsmb的n端和c端分别加上nls核定位信号。
nls-dcas13a-rsmb-nls的基因序列如seqidno.9所示。具体如下:
注:加粗标注出来的为n端和c端的nls核定位信号序列。
10.构建用于拟南芥稳定转化的pcambia1300atu6-35s-dpspcas13b-rsmb载体
用pcr扩增得到dpspcas13b的grna骨架序列,并通过hindiii和xmai双酶切的方法替换dcas13a的grna骨架序列。
dpspcas13b骨架序列如下:
注:加粗标注的为含有两个bsai位点的序列,用于插入spacer。
用ncoi和bamhi双酶切后插入从pet28a-msb-dpspcas13b-rsmb扩增到的dpspcas13b-rsmb序列,并且在dpspcas13b-rsmb的n端加上flag-nls核定位信号在c端加上nls核定位信号。
flag-nls-dpspcas13b-rsmb-nls的基因序列如seqidno.10所示。具体如下:
注:加粗标注出来的为n端的flag-nls核定位序列和c端的nls核定位信号序列。
11.用于trm4b蛋白亚细胞定位的载体构建
将35s启动子和nos终止子插入pcambia1300的hindiii和ecori酶切位点之间,35s启动子和nos终止子中间有ncoi和spei酶切位点。用spei切割之后将gfp序列通过同源重组的方法插入,用ncoi切割之后用同源重组的方法将从拟南芥基因组dna获得的trm4b的序列插入。
gfp的基因序列如seqidno.11所示。
trm4b的基因序列如seqidno.12所示。
12.在骨架载体中插入spacer序列
在目的rna上选取相应的序列后合成互补的引物(正反向引物分别加上相应的接头序列),退火之后用t4dna连接酶连接到bsai酶切之后的骨架载体上。
dcas13agrna-s1序列如下:
ttccacacctctttccacccatctcttt
dcas13agrna-s2序列如下:
cttcctcagctgggggttccacacctct
dcas13agrna-s3序列如下:
aggaggtagtgcagcttcctcagctggg
dpspcas13bgrna-s1序列如下:
tcagctgggggttccacacctctttccacccatctctttaggttatcgtc
dpspcas13bgrna-s2序列如下:
aggtagtgcagcttcctcagctgggggttccacacctctttccacccatc
dpspcas13bgrna-s3序列如下:
gacgttggaggaggaggtagtgcagcttcctcagctgggggttccacacc
dpspcas13bgrna10序列如下:
gcactgcacgccgtaggtgaaggtggtcacgagggtgggccagggcacgg
dpspcas13bgrna15序列如下:
gcacgccgtaggtgaaggtggtcacgagggtgggccagggcacgggcagc
dpspcas13bgrna20序列如下:
ccgtaggtgaaggtggtcacgagggtgggccagggcacgggcagcttgcc
dpspcas13bgrna25序列如下:
ggtgaaggtggtcacgagggtgggccagggcacgggcagcttgccggtgg
dpspcas13bgrna30序列如下:
aggtggtcacgagggtgggccagggcacgggcagcttgccggtggtgcag
dpspcas13bgrna35序列如下:
gtcacgagggtgggccagggcacgggcagcttgccggtggtgcagatgaa
dpspcas13bgrna40序列如下:
gagggtgggccagggcacgggcagcttgccggtggtgcagatgaacttca
dpspcas13bgrna45序列如下:
tgggccagggcacgggcagcttgccggtggtgcagatgaacttcagggtc
13.构建dpspcas13b-hadar载体
将载体pcambia1300atu6-35s-dpspcas13b-rsmb用xhoi和ecori酶切之后依次插入dpspcas13b和nos的序列,dpspcas13b和nos之间用bamhi隔开。合成植物密码子优化的hadar的序列(cox,gootenbergetal.2017),然后用bamhi切割载体后用同源重组的方法将hadar插入dpspcas13b和nos之间。
得到载体pcambia1300atu6-35s-dpspcas13b-hadar。
将载体pcambia1300atu6-35s-dpspcas13b-hadar用hindiii和ecori切割之后插入puc19的hindiii和ecori位点之间得到原生质体转化所用的载体puc19atu6-35s-dpspcas13b-hadar。
hadar的基因序列如seqidno.13所示。
14.dgfp报告系统的设计
在pcambia1300的sbfi和ecori之间插入35s启动子和nos终止子序列,35s启动子序列和nos终止子序列之间加入了bamhi位点。用bamhi切割之后用同源重组将dgfp插入35s启动子序列和nos终止子序列之间。
dgfp的基因序列如seqidno.14所示。具体如下:
注:加粗标注的地方为将原来的碱基g通过pcr变为a,使得原来编码w氨基酸的密码子变为了终止密码子,从而获得dgfp序列。
15.拟南芥原生质体的制备及转化
取幼嫩拟南芥叶片,使用刀片将叶片切为0.5mm-1mm大小。浸入10ml酶解液中,混匀,暗培养2h-3h,至原生质体完全从叶片上解离下来。酶解结束后,镜检酶解结果。使用200目不锈钢网筛过滤原生质体至新的离心管中10ml。100×g,4℃,离心2min,收集原生质体。重悬原生质体于等体积预冷的w5液体培养基中,100×g离心2min,收集原生质体,重复2次。重悬原生质体于等体积预冷的w5液体中,冰浴30min。100×g离心2min,收集原生质体,重悬原生质体于1/10体积mmg中。取少量重悬原生质体镜检,其余用于转化。
在2ml离心管中加入各10μl质粒dna,100μl原生质体,充分混匀后加入120μlpeg/ca2+溶液。室温放置15min。反应结束后加入500μlw5,充分混匀。100×g离心2min,收集原生质体,移除上清。加入700μlw5溶液,100×g离心2min,收集原生质体,重复一次。重悬原生质体于1mlw5中,将原生质体转移到用1%的bsa润洗的细胞培养板中,23℃黑暗培养16个小时,观察荧光信号。
16.烟草瞬时表达
将相应的载体转入农杆菌gv3101,28℃黑暗培养两天,挑取单克隆于5mllb抗性培养基(50mg/l卡那霉素,25mg/l利福平)中,28℃,240rpm培养16小时,以1:100的比例转接到新的5mllb抗性培养基中,28度,240rpm培养过夜到od600=3。4000rpm,10min收集菌体,用10mmmesph5.6,10mmmgcl2,10μm乙酰丁香酮溶液将菌体悬起,调od60020到1。温静置2-3小时后,用不带针头的1ml医用注射器将农杆菌注射到4周左右生长状态良好烟草叶片背面。培养36-48小时后取样观察荧光信号的。
17.拟南芥转化及阳性苗筛选
将相应的载体转入农杆菌gv3101中,选取健壮的开了花的拟南芥用浸花法进行遗传转化。正常生长一个月后收集t1代种子,然后在含50mg/l潮霉素的1/2ms平板上筛选阳性苗,移栽到土里。
实施例1dcas13a-rsmb体外甲基化
首先,构建了表达载体并且纯化得到了融合蛋白dcas13a-rsmb,dcas13a-rsmb的表达利用t7启动子驱动,并且在n端加了msb标签以增强表达,在n端和c端有his标签用于融合蛋白的纯化(图1a和图1b)。然后进行了体外甲基化实验,并用亚硫酸氢钠处理了体外甲基化后的rna。通过sanger测序得到了dcas13a-rsmb体外甲基化的结果,利用了5个grna来靶定靶向rna的不同位置,所用的5个grna都可以使靶向rna发生甲基化,但是不同的grna甲基化的位置和效率都不同(图1c)。虽然体外甲基化的效率较低为3.33%到6.67%之间,dcas13a-rsmb确实可以介导rna上胞嘧啶的甲基化。另外dcas13a-rsmb体外甲基化的位点不止限制在grna结合位点内部的胞嘧啶碱基,在grna结合位点周围也发现了许多发生了甲基化的胞嘧啶,这类似于crispr介导的dna甲基化(liu,x.s.,h.wu,x.ji,y.stelzer,x.wu,s.czauderna,j.shu,d.dadon,r.a.youngandr.jaenisch(2016)."editingdnamethylationinthemammaliangenome."cell167(1):233-247e217.)。而且dcas13a-rsmb的甲基化具有一定的位点倾向性,比如除了grna27之外另外的四个grna都可以介导dcas13a-rsmb对c79、c83、c87和c91。c96可以同时被grna17、grna18和grna31甲基化。体外甲基化表明只有某些特定的位点可以被grna介导的dcas13a-rsmb甲基化,这同已有的研究相吻合(david,r.,a.burgess,b.parker,j.li,k.pulsford,t.sibbritt,t.preissandi.r.searle(2017)."transcriptome-widemappingofrna5-methylcytosineinarabidopsismrnasandnon-codingrnas."plantcell.)。而且grna的结合位点对甲基化效率有很大的影响,如grna27只有一个位点的胞嘧啶发现有甲基化。
实施例2dcas13a-rsmb体内甲基化
在体外成功的将rna的胞嘧啶甲基化之后,尝试在体内进行rna的甲基化修饰。为了实现体内靶向rna的甲基化,首先做了拟南芥甲基转移酶trm4b的亚细胞定位。图2a所示,trm4b只有一个保守的结构域rsmb,所以在以后的体内甲基化实验中都是用rsmb而非全长的trm4b来进行甲基化实验。烟草瞬时转化的结果表明trm4b在植物体内定位在细胞核中(图2b和图2c),所以为了成功的进行体内甲基化,利用核定位信号将dcas13a-rsmb导入细胞核内。然后利用atu6驱动grna的表达,利用35s驱动dcas13a-rsmb的表达(图1a和图4)。mag5的mrna在拟南芥体内是trm4b的靶向rna,trm4b可以将mag5基因的特定位点甲基化(david,r.,a.burgess,b.parker,j.li,k.pulsford,t.sibbritt,t.preissandi.r.searle(2017)."transcriptome-widemappingofrna5-methylcytosineinarabidopsismrnasandnon-codingrnas."plantcell.)。所以构建了靶定mag5mrna的载体并且成功转化了trm4b的突变体trm4b-1并且得到了转基因植物。在t1代检测了mag5mrna的甲基化水平。结果表明在体内dcas13a-rsmb确实可以将靶向rna的特定位点甲基化,在尝试的3个grna序列中,grna_s3的一个转基因line可以将10%的c111甲基化。dcas13a-rsmb的体内结果表明在体内进行靶位点的甲基化是可行的虽然甲基化的效率比较低。
实施例3dpspcas13b-rsmb体外甲基化
dcas13a-rsmb虽然可以甲基化靶向rna上的胞嘧啶,但是甲基化的效率较低(图1c)。为了提高甲基化效率,用新报道的dpspcas13b构建了dpspcas13b-rsmb融合蛋白的载体并且纯化得到了融合蛋白(图3a和图3b)并且做了同样的体外甲基化实验,dpspcas13b-rsmb的表达利用t7启动子驱动,并且在n端加了msb标签以增强表达,在n端和c端有his标签用于融合蛋白的纯化。dpspcas13b-rsmb的体外甲基化效率明显比dcas13a-rsmb高,大部分的甲基化效率达到了6.67%以上,最高的甲基化效率为23.3%。同dcas13a-rsmb的一样,甲基化在一些位点的效率明显高于其他地方而且有些位点在多个grna的介导下都可以发生甲基化(图3c),利用了5个grna来靶定靶向rna的不同位置。所用的5个grna都可以使靶向rna发生甲基化,但是不同的grna甲基化的位置和效率都不同,同dcas13a-rsmb相比dpspcas13b-rsmb的甲基化效率更高。而且在dcas13a-rsmb中大部分的甲基化发生在靶向rna的中间位置,而在dpspcas13b-rsmb中大部分的甲基化发生在靶向rna对的n端。所以可以认为靶向rna的甲基化效率主要与grna对的结合位点有关而某一特定的靶向rna的甲基化模式和grna关系不是很大。
实施例4dpspcas13b-hadar烟草内腺嘌呤a到i的编辑
dpspcas13b-hadar据报道可以将rna上的a变为i,所以在烟草中进行了a到i的碱基编辑的尝试(cox,d.b.t.,j.s.gootenberg,o.o.abudayyeh,b.franklin,m.j.kellner,j.joungandf.zhang(2017)."rnaeditingwithcrispr-cas13."science358(6366):1019-1027)。首先构建了一个dgfp的报告系统将gfp的mrna中的一个编码w氨基酸的密码子替换成了终止密码子,所以dgfp的mrna能够正常的进行转录但是无法进行翻译。然后将报告系统和表达grna及dpspcas13b-hadar的载体同时注入烟草的叶片进行试验。实验结果表明,dpspcas13b-hadar确实可以将a碱基编辑为i碱基,从而成功的将gfp的绿色荧光信号恢复,在烟草a到i碱基编辑实验中一共用了8个不同的grna以恢复dgfp绿色荧光信号(图5)。
实施例5dpspcas13b-hadar拟南芥原生质体内腺嘌呤a到i的编辑
在烟草中将dgfp成功编辑成gfp看到绿色荧光信号之后,在拟南芥原生质体中进行的同样的dgfp编辑实验,并且成功的实现了dgfp到gfp的编辑,使用了和烟草中同样的grna并且得到了类似的结果(图6)。类似于烟草中的结果,只有部分细胞有绿色荧光信号,可以认为这同使用了表达dgfp报告系统和dpspcas13b-hadar及grna两个载体导致的较低的转化效率有关。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
序列表
<110>南昌大学
<120>一种植物rna修饰和编辑的系统及方法
<160>14
<170>siposequencelisting1.0
<210>1
<211>431
<212>dna
<213>人工序列()
<400>1
ccatggagcatcaccatcaccatcaccatcaccatcacaccatgtacgcaacgcttgaag60
aagccattgacgctgcacgcgaagaatttcttgcagacaaccccggcatcgacgccgaag120
atgcgaatgtgcaacagttcaatgcccaaaaatacgttttgcaggacggcgacatcatgt180
ggcaagttgagttttttgccgacgaaggggaagaaggtgaatgtttacctatgcttagcg240
gtgaagccgcgcaaagtgtttttgatggcgactatgatgagatagagatacgccaggagt300
ggcaggaagagaatacattacatgaatgggacgagggggaatttcagcttgagccaccgc360
tggataccgaggaaggacgcgcagcagctgatgagtgggatgaacgtgaaaacctgtatt420
ttcagggatcc431
<210>2
<211>4164
<212>dna
<213>人工序列()
<400>2
ggaaatcttttcggacataaaagatggtacgaagtgagagataagaaggatttcaagatt60
aagagaaaggttaaggttaagaggaattacgatggaaacaagtacattcttaatatcaat120
gagaataacaataaggaaaaaattgataataataagttcattaggaaatacatcaactat180
aaaaaaaacgataatatccttaaggaatttactagaaagttccatgcaggtaacattctt240
tttaaattaaaaggtaaagagggaattatcaggatcgaaaataacgatgattttcttgag300
actgaggaggtggtgttgtacatcgaggcatatggtaagtcagaaaaattaaaggcattg360
ggaatcacaaagaaaaagatcatcgacgaggctatcaggcaaggaattactaaggatgat420
aagaaaatcgagattaaaaggcaggagaacgaggaagagatcgaaatcgatattagagac480
gagtatacaaacaagacacttaatgattgttctatcatccttagaatcattgaaaatgat540
gaacttgaaactaagaagtcaatctatgagatctttaagaacattaacatgtcattgtat600
aagattatcgagaagatcatcgagaacgagactgagaaggtgttcgagaatagatattac660
gaagagcatcttagggagaaattgttgaaagacgataaaattgatgttattttgacaaat720
ttcatggaaattagagagaaaattaagtctaacttggaaattcttggtttcgttaagttc780
tacttgaatgttggaggtgacaaaaagaaatctaagaataagaaaatgttggttgaaaag840
attcttaacatcaatgttgaccttacagttgaagacattgctgatttcgttattaaggaa900
ttggaattttggaacattactaagagaatcgaaaaagttaaaaaagttaacaatgaattt960
ttggaaaaaagaaggaataggacttacatcaagtcatatgttcttttggataagcatgag1020
aaatttaagatcgaaagagagaacaagaaagataaaattgtgaagttttttgttgagaac1080
attaagaacaactctatcaaagagaaaattgagaagattcttgctgagtttaaaatcgac1140
gagttgatcaaaaagttggaaaaagagttgaagaagggaaactgtgatactgaaattttc1200
ggaattttcaaaaaacattacaaagttaacttcgattctaagaaattctctaagaagtct1260
gatgaggagaaggagctttacaaaatcatctatagataccttaagggaaggattgaaaag1320
atccttgttaatgagcagaaggttagattgaagaagatggagaagattgaaatcgagaaa1380
atccttaatgagtcaatcctttcagagaagatccttaagagggttaagcagtacactctt1440
gagcatattatgtatcttggtaaattgagacataatgatatcgatatgactactgtgaac1500
actgatgatttctcaagattgcatgcaaaggaggagcttgacttggagttgattactttt1560
ttcgcttctactaatatggagttgaacaagattttttcccgtgaaaacatcaacaacgac1620
gagaacatcgacttcttcggtggagacagggagaaaaactacgttttggataagaagatt1680
ttgaactctaagattaagattatcagagatttggatttcatcgataacaagaacaatatc1740
actaataattttattagaaagttcactaaaattggaactaatgaagcaaaccgtatttta1800
cacgctatttctaaggagagagatcttcagggaactcaagacgattataataaggtgatt1860
aacattatccaaaatttgaagatctctgatgaagaggtttctaaagctcttaatttggat1920
gtggtgttcaaggataagaagaatatcattactaaaatcaacgatatcaaaatttcagag1980
gagaataacaacgatattaaatacttgccttctttctctaaggttttgccagaaattctt2040
aacctttatagaaataaccctaagaatgagccattcgatacaattgagacagaaaagatt2100
gttcttaacgcacttatttatgttaacaaggagttgtataagaaattaattcttgaggat2160
gaccttgaagagaatgaatcaaaaaatatcttccttcaggagttgaaaaagactcttggt2220
aacattgatgaaattgatgagaacatcattgagaattattacaaaaatgctcagatttca2280
gcttctaagggtaataacaaggctattaaaaaatatcaaaagaaggttatcgaatgctac2340
atcggttatcttagaaaaaattatgaggaacttttcgacttttctgacttcaaaatgaac2400
atccaagaaatcaagaagcaaatcaaggatattaacgacaataagacttacgagagaatt2460
actgttaagacatctgacaagactatcgttatcaatgatgatttcgaatacatcatttct2520
attttcgcacttcttaattctaatgctgttatcaataaaatcaggaataggttcttcgct2580
acttcagtgtggcttaacacatctgagtaccagaatatcatcgatatccttgatgagatc2640
atgcagcttaatactttgagaaatgaatgtattacagagaactggaacttgaatcttgag2700
gagttcattcaaaagatgaaggagatcgagaaggattttgatgattttaaaattcagact2760
aagaaggaaatttttaacaactattacgaggatatcaaaaacaatattcttacagagttt2820
aaggatgatattaacggttgtgatgttcttgaaaagaaattagagaagattgttattttt2880
gatgacgaaactaaatttgaaattgacaaaaagtctaatattcttcaagacgagcagaga2940
aagttgtctaatatcaataagaaggacttgaagaagaaagtggatcagtatattaaagat3000
aaggatcaagaaatcaaatctaaaatcctttgtaggatcatcttcaactctgactttttg3060
aagaagtataaaaaggagatcgataatttgattgaagatatggaatctgaaaatgagaac3120
aagtttcaggaaatctactatcctaaagagagaaaaaacgaattgtacatctataagaaa3180
aacctttttttgaatattggtaatccaaattttgataaaatctacggacttatttctaac3240
gacattaagatggcagatgctaagttcctttttaatatcgatggaaagaatatcagaaaa3300
aataaaatctctgaaatcgacgctattcttaagaacttgaacgacaaattgaacggatat3360
tctaaggagtataaggaaaagtacattaaaaaattgaaggaaaatgatgatttttttgca3420
aagaacatccaaaacaaaaattacaagtcttttgagaaggattataacagagtgtctgaa3480
tataaaaaaatcagggatcttgtggaatttaactatttgaataaaattgaatcttacctt3540
attgatatcaactggaaattagctatccagatggcaagattcgagagggacatgcactac3600
atcgtgaacggacttagggaacttggtattatcaaattgtctggatacaacacaggtatc3660
tcccgtgcataccctaagaggaatggatctgatggattctacacaacaactgcttactat3720
aagttctttgatgaggaatcatataaaaagttcgagaagatttgctacggtttcggtatc3780
gatctttctgaaaattctgagatcaacaagcctgagaacgaatctattagaaactacatc3840
tctcatttttatatcgtgagaaatccattcgctgattattctatcgctgagcaaatcgat3900
agagtttcaaatcttttgtcttactctactaggtataacaactctacatacgcttctgtt3960
ttcgaagtttttaagaaggacgttaaccttgattatgatgaacttaagaaaaagttcaag4020
ttgattggaaataacgatatcttggagagattgatgaaaccaaagaaagtttctgttttg4080
gaacttgagtcttataactctgattacatcaaaaaccttattattgaacttttgacaaag4140
attgagaatactaatgatactctt4164
<210>3
<211>2949
<212>dna
<213>人工序列()
<400>3
atgaatattccagctttggttgaaaaccaaaagaaatattttggaacttactcagttatg60
gctatgttgaatgcacaaactgttcttgatcatattcagaaggttgcagacatagagggt120
gagcagaacgagaacaatgagaacctttggttccatccagttatgtcacatctttacaat180
gctaaaaatggttatgataagcagccagaaaaaactatgtttattattgagagacttcaa240
tcatactttcctttccttaagattatggctgaaaaccagagagaatactctaatggaaag300
tataagcaaaacagagttgaggttaattcaaatgacatatttgaggttttgaagagagct360
ttcggtgttttgaaaatgtatagagacttgactaatgcttataaaacatatgaggaaaag420
ttgaacgacggatgtgagttccttacttctactgagcagccactttctggtatgattaac480
aactattacactgttgctttgagaaatatgaatgaaagatatggttataaaacagaggac540
cttgcttttattcaagacaagagatttaagtttgttaaagatgcttatggtaaaaagaag600
tcacaagttaacactggtttcttcctttcattgcaagactataacggagatactcaaaaa660
aagttgcatttgtctggtgtgggaatagcattgcttatttgcctttttttggataagcaa720
tacattaatatttttttgtctagattgcctatattttcatcttataatgctcagtctgaa780
gaaaggaggattattattagatcatttggaataaactctattaaattgcctaaagatagg840
attcattctgaaaagtctaataagtcagttgcaatggatatgttgaacgaagtgaagagg900
tgccccgatgaactttttactactttgtcagctgaaaaacaatctaggtttaggattatt960
tctgatgatcataatgaagttcttatgaagcgttcttctgataggtttgttccacttctt1020
cttcaatatatagactacggaaagttgtttgaccacattaggttccacgttaacatggga1080
aaacttagatatttgttgaaggctgataagacatgtattgacggtcaaactagggttagg1140
gttattgagcagccattgaacggattcggtagacttgaggaggcagagactatgaggaag1200
caagaaaacggaactttcggaaattctggtattaggattagggattttgaaaatatgaag1260
agggatgacgctaacccagctaactacccatatattgttgatacatacacacattacatt1320
cttgagaataacaaggttgagatgtttattaatgataaggaggactctgctccattgctt1380
ccagtgattgaagatgatagatacgttgttaagactataccttcatgtagaatgtctact1440
cttgagattcccgctatggcttttcatatgtttctttttggttctaagaaaacagaaaag1500
ttgattgttgacgttcataatagatataagagattgttccaagctatgcagaaggaggag1560
gtgacagctgagaacattgcatctttcggaatagcagagtctgatttgcctcagaaaatt1620
ttggatcttatttctggaaatgcacacggtaaggacgtggacgctttcattaggttgaca1680
gttgatgatatgcttactgacactgagagaagaattaagaggtttaaagatgataggaaa1740
tcaattaggtctgctgacaacaaaatgggaaaaaggggattcaagcaaatttctactgga1800
aagttggcagactttttggctaaagacatagttttgtttcaaccatctgttaatgatgga1860
gagaacaagattactggtcttaactatcgtattatgcaatctgctattgctgtgtacgac1920
tctggtgacgattacgaggcaaagcaacagttcaaattaatgtttgaaaaggctagattg1980
attggaaagggaactactgagcctcaccctttcttgtataaagtgtttgcaaggtcaatt2040
cccgctaatgctgttgagttctacgaaaggtatcttattgaaagaaaattttatcttact2100
ggtctttctaatgaaattaaaaagggtaatagagtggacgtgccattcattaggagggac2160
cagaacaagtggaaaactcccgctatgaaaactcttggaagaatttactctgaggacctt2220
ccagttgagcttcctaggcaaatgtttgacaacgagattaaatctcatcttaagtcattg2280
cctcaaatggagggtattgatttcaataatgcaaatgtgacttatcttattgctgaatac2340
atgaaaagggttttggatgacgatttccagacattttatcaatggaataggaattataga2400
tatatggatatgcttaagggagagtacgatcgtaagggttctcttcagcactgcttcact2460
tctgtggaggaaagggagggtttgtggaaggagagggcttctaggacagaaaggtatcgt2520
aagcaagcctctaataagataagatctaatcgtcagatgaggaacgcatcatcagaggaa2580
attgagactattcttgataaaagactttctaattcaaggaacgaatatcaaaaatctgag2640
aaggttattagaagatatcgtgttcaagatgcattgcttttcttgcttgctaaaaagact2700
ttgacagaattggctgactttgatggagaaaggtttaagttgaaagagataatgccagac2760
gcagagaagggaattttgtctgaaattatgcctatgtcatttacatttgagaaaggtgga2820
aagaagtacactattacatctgagggaatgaaacttaaaaattacggagattttttcgtt2880
cttgcatctgataagagaattggtaatttgcttgagttggttggttctgatattgtttca2940
aaggaagat2949
<210>4
<211>993
<212>dna
<213>人工序列()
<400>4
ttcgaggaatattacaagaaacaagggatagtgaaagctgaagagtgggatttgttcatg60
gagattcttcgtaagcctttacctgctgcgtttagggttaactccaatggccaattttgc120
gatgagattatatcgatcttggagaatgactttatgaaatcacttcaggctgaggccata180
gaaggtggtgaattggaggctattaagcccttgccttggtatccaaagaatctcgcttgg240
cattctaatttttctcgaaaggagataagaaaaaatcagacacttgagaggtttcatgag300
tttctgaagttagaaaatgaagttggaaatattactaggcaggaagctgttagcatggta360
cctcctctcttcctagacgtacatccagatcatttcgtacttgacatgtgtgctgcaccg420
ggttccaaaacatttcagctgcttgagattatacatgaagcatcagaaccaggatctctt480
cctaatggattggtggtggctaatgatgttgattttaaaagatctaaccttctcattcac540
caaacaaagagaatgtgcacatccaacttgatagtgacaaatcatgaagggcaacagttt600
cctggttgccgtttgaacaaatcccgagcttctgagaaaggaataagtgaaaatatgcct660
attaatcaacttgcctttgaccgtgttctatgcgatgttccgtgcagtggtgatggtaca720
ctgcgcaaggctccagatatctggcgcaaatggaactctggtatgggcaatggacttcat780
agccttcagattattcttgctatgagaggtttatctctgttgaaagttggtgggaagatg840
atatactcaacctgctcaatgaacccagtggaggatgaagctgttgttgctgagattcta900
aggaggtgtggagactctgttgaacttttagatgtttccgataaacttcctgaacttata960
cgaagaccaggacttaaggcatggaaggtgcgt993
<210>5
<211>190
<212>dna
<213>人工序列()
<400>5
taatacgactcactatagggccagtgaattcgagctcggtacccggggatcctctagaaa60
tatggattacttggtagaacagcaatctactcgacctgcaggcatgaagcttggcgtaat120
catggtcatagctgtttcctgtgtttatccgctcacaattccacacaacatacgagccgg180
aagcataaag190
<210>6
<211>293
<212>dna
<213>人工序列()
<400>6
cattcggagtttttgtatcttgtttcatagtttgtcccaggattagaatgattaggcatc60
gaaccttcaagaatttgattgaataaaacatcttcattcttaagatatgaagataatctt120
caaaaggcccctgggaatctgaaagaagagaagcaggcccatttatatgggaaagaacaa180
tagtatttcttatataggcccatttaagttgaaaacaatcttcaaaagtcccacatcgct240
tagataagaaaacgaagctgagtttatatacagctagagtcgaagtagtgatt293
<210>7
<211>883
<212>dna
<213>人工序列()
<400>7
tcaacatggtggagcacgacacacttgtctactccaaaaatatcaaagatacagtctcag60
aagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggat120
tccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcct180
acaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtg240
gtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaacca300
cgtcttcaaagcaagtggattgatgtgataacatggtggagcacgacacacttgtctact360
ccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaa420
gggtgatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtga480
agatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggcca540
tcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagca600
tcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgatatct660
ccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctatat720
aaggaagttcatttcatttggagaggacctcgacctcaacacaacatatacaaaacaaac780
gaatctcaagcaatcaagcattctacttctattgcagcaatttaaatcatttcttttaaa840
gcaaaagcaattttctgaaaattttcaccatttacgaacgata883
<210>8
<211>284
<212>dna
<213>人工序列()
<400>8
tgattgatcgatagagctcgaatttccccgatcgttcaaacatttggcaataaagtttct60
taagattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaattacg120
ttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggtttttatga180
ttagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgcaaact240
aggataaattatcgcgcgcggtgtcatctatgttactagatcgg284
<210>9
<211>5301
<212>dna
<213>人工序列()
<400>9
gccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccggaaatcttttc60
ggacataaaagatggtacgaagtgagagataagaaggatttcaagattaagagaaaggtt120
aaggttaagaggaattacgatggaaacaagtacattcttaatatcaatgagaataacaat180
aaggaaaaaattgataataataagttcattaggaaatacatcaactataaaaaaaacgat240
aatatccttaaggaatttactagaaagttccatgcaggtaacattctttttaaattaaaa300
ggtaaagagggaattatcaggatcgaaaataacgatgattttcttgagactgaggaggtg360
gtgttgtacatcgaggcatatggtaagtcagaaaaattaaaggcattgggaatcacaaag420
aaaaagatcatcgacgaggctatcaggcaaggaattactaaggatgataagaaaatcgag480
attaaaaggcaggagaacgaggaagagatcgaaatcgatattagagacgagtatacaaac540
aagacacttaatgattgttctatcatccttagaatcattgaaaatgatgaacttgaaact600
aagaagtcaatctatgagatctttaagaacattaacatgtcattgtataagattatcgag660
aagatcatcgagaacgagactgagaaggtgttcgagaatagatattacgaagagcatctt720
agggagaaattgttgaaagacgataaaattgatgttattttgacaaatttcatggaaatt780
agagagaaaattaagtctaacttggaaattcttggtttcgttaagttctacttgaatgtt840
ggaggtgacaaaaagaaatctaagaataagaaaatgttggttgaaaagattcttaacatc900
aatgttgaccttacagttgaagacattgctgatttcgttattaaggaattggaattttgg960
aacattactaagagaatcgaaaaagttaaaaaagttaacaatgaatttttggaaaaaaga1020
aggaataggacttacatcaagtcatatgttcttttggataagcatgagaaatttaagatc1080
gaaagagagaacaagaaagataaaattgtgaagttttttgttgagaacattaagaacaac1140
tctatcaaagagaaaattgagaagattcttgctgagtttaaaatcgacgagttgatcaaa1200
aagttggaaaaagagttgaagaagggaaactgtgatactgaaattttcggaattttcaaa1260
aaacattacaaagttaacttcgattctaagaaattctctaagaagtctgatgaggagaag1320
gagctttacaaaatcatctatagataccttaagggaaggattgaaaagatccttgttaat1380
gagcagaaggttagattgaagaagatggagaagattgaaatcgagaaaatccttaatgag1440
tcaatcctttcagagaagatccttaagagggttaagcagtacactcttgagcatattatg1500
tatcttggtaaattgagacataatgatatcgatatgactactgtgaacactgatgatttc1560
tcaagattgcatgcaaaggaggagcttgacttggagttgattacttttttcgcttctact1620
aatatggagttgaacaagattttttcccgtgaaaacatcaacaacgacgagaacatcgac1680
ttcttcggtggagacagggagaaaaactacgttttggataagaagattttgaactctaag1740
attaagattatcagagatttggatttcatcgataacaagaacaatatcactaataatttt1800
attagaaagttcactaaaattggaactaatgaagcaaaccgtattttacacgctatttct1860
aaggagagagatcttcagggaactcaagacgattataataaggtgattaacattatccaa1920
aatttgaagatctctgatgaagaggtttctaaagctcttaatttggatgtggtgttcaag1980
gataagaagaatatcattactaaaatcaacgatatcaaaatttcagaggagaataacaac2040
gatattaaatacttgccttctttctctaaggttttgccagaaattcttaacctttataga2100
aataaccctaagaatgagccattcgatacaattgagacagaaaagattgttcttaacgca2160
cttatttatgttaacaaggagttgtataagaaattaattcttgaggatgaccttgaagag2220
aatgaatcaaaaaatatcttccttcaggagttgaaaaagactcttggtaacattgatgaa2280
attgatgagaacatcattgagaattattacaaaaatgctcagatttcagcttctaagggt2340
aataacaaggctattaaaaaatatcaaaagaaggttatcgaatgctacatcggttatctt2400
agaaaaaattatgaggaacttttcgacttttctgacttcaaaatgaacatccaagaaatc2460
aagaagcaaatcaaggatattaacgacaataagacttacgagagaattactgttaagaca2520
tctgacaagactatcgttatcaatgatgatttcgaatacatcatttctattttcgcactt2580
cttaattctaatgctgttatcaataaaatcaggaataggttcttcgctacttcagtgtgg2640
cttaacacatctgagtaccagaatatcatcgatatccttgatgagatcatgcagcttaat2700
actttgagaaatgaatgtattacagagaactggaacttgaatcttgaggagttcattcaa2760
aagatgaaggagatcgagaaggattttgatgattttaaaattcagactaagaaggaaatt2820
tttaacaactattacgaggatatcaaaaacaatattcttacagagtttaaggatgatatt2880
aacggttgtgatgttcttgaaaagaaattagagaagattgttatttttgatgacgaaact2940
aaatttgaaattgacaaaaagtctaatattcttcaagacgagcagagaaagttgtctaat3000
atcaataagaaggacttgaagaagaaagtggatcagtatattaaagataaggatcaagaa3060
atcaaatctaaaatcctttgtaggatcatcttcaactctgactttttgaagaagtataaa3120
aaggagatcgataatttgattgaagatatggaatctgaaaatgagaacaagtttcaggaa3180
atctactatcctaaagagagaaaaaacgaattgtacatctataagaaaaacctttttttg3240
aatattggtaatccaaattttgataaaatctacggacttatttctaacgacattaagatg3300
gcagatgctaagttcctttttaatatcgatggaaagaatatcagaaaaaataaaatctct3360
gaaatcgacgctattcttaagaacttgaacgacaaattgaacggatattctaaggagtat3420
aaggaaaagtacattaaaaaattgaaggaaaatgatgatttttttgcaaagaacatccaa3480
aacaaaaattacaagtcttttgagaaggattataacagagtgtctgaatataaaaaaatc3540
agggatcttgtggaatttaactatttgaataaaattgaatcttaccttattgatatcaac3600
tggaaattagctatccagatggcaagattcgagagggacatgcactacatcgtgaacgga3660
cttagggaacttggtattatcaaattgtctggatacaacacaggtatctcccgtgcatac3720
cctaagaggaatggatctgatggattctacacaacaactgcttactataagttctttgat3780
gaggaatcatataaaaagttcgagaagatttgctacggtttcggtatcgatctttctgaa3840
aattctgagatcaacaagcctgagaacgaatctattagaaactacatctctcatttttat3900
atcgtgagaaatccattcgctgattattctatcgctgagcaaatcgatagagtttcaaat3960
cttttgtcttactctactaggtataacaactctacatacgcttctgttttcgaagttttt4020
aagaaggacgttaaccttgattatgatgaacttaagaaaaagttcaagttgattggaaat4080
aacgatatcttggagagattgatgaaaccaaagaaagtttctgttttggaacttgagtct4140
tataactctgattacatcaaaaaccttattattgaacttttgacaaagattgagaatact4200
aatgatactctttctggatctgagactcctggaacttctgagtctgctactcctgagtct4260
ttcgaggaatattacaagaaacaagggatagtgaaagctgaagagtgggatttgttcatg4320
gagattcttcgtaagcctttacctgctgcgtttagggttaactccaatggccaattttgc4380
gatgagattatatcgatcttggagaatgactttatgaaatcacttcaggctgaggccata4440
gaaggtggtgaattggaggctattaagcccttgccttggtatccaaagaatctcgcttgg4500
cattctaatttttctcgaaaggagataagaaaaaatcagacacttgagaggtttcatgag4560
tttctgaagttagaaaatgaagttggaaatattactaggcaggaagctgttagcatggta4620
cctcctctcttcctagacgtacatccagatcatttcgtacttgacatgtgtgctgcaccg4680
ggttccaaaacatttcagctgcttgagattatacatgaagcatcagaaccaggatctctt4740
cctaatggattggtggtggctaatgatgttgattttaaaagatctaaccttctcattcac4800
caaacaaagagaatgtgcacatccaacttgatagtgacaaatcatgaagggcaacagttt4860
cctggttgccgtttgaacaaatcccgagcttctgagaaaggaataagtgaaaatatgcct4920
attaatcaacttgcctttgaccgtgttctatgcgatgttccgtgcagtggtgatggtaca4980
ctgcgcaaggctccagatatctggcgcaaatggaactctggtatgggcaatggacttcat5040
agccttcagattattcttgctatgagaggtttatctctgttgaaagttggtgggaagatg5100
atatactcaacctgctcaatgaacccagtggaggatgaagctgttgttgctgagattcta5160
aggaggtgtggagactctgttgaacttttagatgtttccgataaacttcctgaacttata5220
cgaagaccaggacttaaggcatggaaggtgcgtaaaaggccggcggccacgaaaaaggcc5280
ggccaggcaaaaaagaaaaag5301
<210>10
<211>4152
<212>dna
<213>人工序列()
<400>10
atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgat60
gacgataaggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccaat120
attccagctttggttgaaaaccaaaagaaatattttggaacttactcagttatggctatg180
ttgaatgcacaaactgttcttgatcatattcagaaggttgcagacatagagggtgagcag240
aacgagaacaatgagaacctttggttccatccagttatgtcacatctttacaatgctaaa300
aatggttatgataagcagccagaaaaaactatgtttattattgagagacttcaatcatac360
tttcctttccttaagattatggctgaaaaccagagagaatactctaatggaaagtataag420
caaaacagagttgaggttaattcaaatgacatatttgaggttttgaagagagctttcggt480
gttttgaaaatgtatagagacttgactaatgcttataaaacatatgaggaaaagttgaac540
gacggatgtgagttccttacttctactgagcagccactttctggtatgattaacaactat600
tacactgttgctttgagaaatatgaatgaaagatatggttataaaacagaggaccttgct660
tttattcaagacaagagatttaagtttgttaaagatgcttatggtaaaaagaagtcacaa720
gttaacactggtttcttcctttcattgcaagactataacggagatactcaaaaaaagttg780
catttgtctggtgtgggaatagcattgcttatttgcctttttttggataagcaatacatt840
aatatttttttgtctagattgcctatattttcatcttataatgctcagtctgaagaaagg900
aggattattattagatcatttggaataaactctattaaattgcctaaagataggattcat960
tctgaaaagtctaataagtcagttgcaatggatatgttgaacgaagtgaagaggtgcccc1020
gatgaactttttactactttgtcagctgaaaaacaatctaggtttaggattatttctgat1080
gatcataatgaagttcttatgaagcgttcttctgataggtttgttccacttcttcttcaa1140
tatatagactacggaaagttgtttgaccacattaggttccacgttaacatgggaaaactt1200
agatatttgttgaaggctgataagacatgtattgacggtcaaactagggttagggttatt1260
gagcagccattgaacggattcggtagacttgaggaggcagagactatgaggaagcaagaa1320
aacggaactttcggaaattctggtattaggattagggattttgaaaatatgaagagggat1380
gacgctaacccagctaactacccatatattgttgatacatacacacattacattcttgag1440
aataacaaggttgagatgtttattaatgataaggaggactctgctccattgcttccagtg1500
attgaagatgatagatacgttgttaagactataccttcatgtagaatgtctactcttgag1560
attcccgctatggcttttcatatgtttctttttggttctaagaaaacagaaaagttgatt1620
gttgacgttcataatagatataagagattgttccaagctatgcagaaggaggaggtgaca1680
gctgagaacattgcatctttcggaatagcagagtctgatttgcctcagaaaattttggat1740
cttatttctggaaatgcacacggtaaggacgtggacgctttcattaggttgacagttgat1800
gatatgcttactgacactgagagaagaattaagaggtttaaagatgataggaaatcaatt1860
aggtctgctgacaacaaaatgggaaaaaggggattcaagcaaatttctactggaaagttg1920
gcagactttttggctaaagacatagttttgtttcaaccatctgttaatgatggagagaac1980
aagattactggtcttaactatcgtattatgcaatctgctattgctgtgtacgactctggt2040
gacgattacgaggcaaagcaacagttcaaattaatgtttgaaaaggctagattgattgga2100
aagggaactactgagcctcaccctttcttgtataaagtgtttgcaaggtcaattcccgct2160
aatgctgttgagttctacgaaaggtatcttattgaaagaaaattttatcttactggtctt2220
tctaatgaaattaaaaagggtaatagagtggacgtgccattcattaggagggaccagaac2280
aagtggaaaactcccgctatgaaaactcttggaagaatttactctgaggaccttccagtt2340
gagcttcctaggcaaatgtttgacaacgagattaaatctcatcttaagtcattgcctcaa2400
atggagggtattgatttcaataatgcaaatgtgacttatcttattgctgaatacatgaaa2460
agggttttggatgacgatttccagacattttatcaatggaataggaattatagatatatg2520
gatatgcttaagggagagtacgatcgtaagggttctcttcagcactgcttcacttctgtg2580
gaggaaagggagggtttgtggaaggagagggcttctaggacagaaaggtatcgtaagcaa2640
gcctctaataagataagatctaatcgtcagatgaggaacgcatcatcagaggaaattgag2700
actattcttgataaaagactttctaattcaaggaacgaatatcaaaaatctgagaaggtt2760
attagaagatatcgtgttcaagatgcattgcttttcttgcttgctaaaaagactttgaca2820
gaattggctgactttgatggagaaaggtttaagttgaaagagataatgccagacgcagag2880
aagggaattttgtctgaaattatgcctatgtcatttacatttgagaaaggtggaaagaag2940
tacactattacatctgagggaatgaaacttaaaaattacggagattttttcgttcttgca3000
tctgataagagaattggtaatttgcttgagttggttggttctgatattgtttcaaaggaa3060
gattctggatctgagactcctggaacttctgagtctgctactcctgagtctttcgaggaa3120
tattacaagaaacaagggatagtgaaagctgaagagtgggatttgttcatggagattctt3180
cgtaagcctttacctgctgcgtttagggttaactccaatggccaattttgcgatgagatt3240
atatcgatcttggagaatgactttatgaaatcacttcaggctgaggccatagaaggtggt3300
gaattggaggctattaagcccttgccttggtatccaaagaatctcgcttggcattctaat3360
ttttctcgaaaggagataagaaaaaatcagacacttgagaggtttcatgagtttctgaag3420
ttagaaaatgaagttggaaatattactaggcaggaagctgttagcatggtacctcctctc3480
ttcctagacgtacatccagatcatttcgtacttgacatgtgtgctgcaccgggttccaaa3540
acatttcagctgcttgagattatacatgaagcatcagaaccaggatctcttcctaatgga3600
ttggtggtggctaatgatgttgattttaaaagatctaaccttctcattcaccaaacaaag3660
agaatgtgcacatccaacttgatagtgacaaatcatgaagggcaacagtttcctggttgc3720
cgtttgaacaaatcccgagcttctgagaaaggaataagtgaaaatatgcctattaatcaa3780
cttgcctttgaccgtgttctatgcgatgttccgtgcagtggtgatggtacactgcgcaag3840
gctccagatatctggcgcaaatggaactctggtatgggcaatggacttcatagccttcag3900
attattcttgctatgagaggtttatctctgttgaaagttggtgggaagatgatatactca3960
acctgctcaatgaacccagtggaggatgaagctgttgttgctgagattctaaggaggtgt4020
ggagactctgttgaacttttagatgtttccgataaacttcctgaacttatacgaagacca4080
ggacttaaggcatggaaggtgcgtaaaaggccggcggccacgaaaaaggccggccaggca4140
aaaaagaaaaag4152
<210>11
<211>717
<212>dna
<213>人工序列()
<400>11
gtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggc60
gacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggc120
aagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctc180
gtgaccaccttcacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcag240
cacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttc300
aaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtg360
aaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaag420
ctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggc480
atcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgac540
cactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactac600
ctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctg660
ctggagttcgtgaccgccgccgggatcactcacggcatggacgagctgtacaagtga717
<210>12
<211>2424
<212>dna
<213>人工序列()
<400>12
atgggaagaggaggaagacatagaggtcgtactcagagaaaagatttcaaagaaagcaga60
gagaatgtttggaaacgacccaaatccgatgcttccgttgatggttccgacaacgccgta120
ccggaacaaaaacccacttgggaacctattgtcactgttaaccctaacttcgaggaatat180
tacaagaaacaagggatagtgaaagctgaagagtgggatttgttcatggagattcttcgt240
aagcctttacctgctgcgtttagggttaactccaatggccaattttgcgatgagattata300
tcgatcttggagaatgactttatgaaatcacttcaggctgaggccatagaaggtggtgaa360
ttggaggctattaagcccttgccttggtatccaaagaatctcgcttggcattctaatttt420
tctcgaaaggagataagaaaaaatcagacacttgagaggtttcatgagtttctgaagtta480
gaaaatgaagttggaaatattactaggcaggaagctgttagcatggtacctcctctcttc540
ctagacgtacatccagatcatttcgtacttgacatgtgtgctgcaccgggttccaaaaca600
tttcagctgcttgagattatacatgaagcatcagaaccaggatctcttcctaatggattg660
gtggtggctaatgatgttgattttaaaagatctaaccttctcattcaccaaacaaagaga720
atgtgcacatccaacttgatagtgacaaatcatgaagggcaacagtttcctggttgccgt780
ttgaacaaatcccgagcttctgagaaaggaataagtgaaaatatgcctattaatcaactt840
gcctttgaccgtgttctatgcgatgttccgtgcagtggtgatggtacactgcgcaaggct900
ccagatatctggcgcaaatggaactctggtatgggcaatggacttcatagccttcagatt960
attcttgctatgagaggtttatctctgttgaaagttggtgggaagatgatatactcaacc1020
tgctcaatgaacccagtggaggatgaagctgttgttgctgagattctaaggaggtgtgga1080
gactctgttgaacttttagatgtttccgataagcttcctgaacttatacgaagaccagga1140
cttaaggcatggaaggtgcgtgataaaggtgggtggtttacttcttacaaagatgttcca1200
caaaaccggagaggtggagttcttgtgagcatgtttccttctgggaaatacctcaaggac1260
tcaactgaaaccacggaaaagaacgagaatggtgatgttaatggctgtgaggatggactc1320
aaagaaacagatatttctgtggtggatgctactcctgaagaacaagctgaggaagtctct1380
gatcttccacttgaacgttgcatgaggataatacctcatgatcagaacaccggagccttc1440
ttcattgcggtccttcaaaaaaaatctcccttaccagaatttcaggagaaaccaaatacg1500
aaaaggaactcaactgctaagtctactgactcgacagaaaagtctccgagtaaagaatct1560
gttgttacagtggatgctggtgtaccagatgagagtgcagtggagaaagttattgaagca1620
gattcaaacattgagaaaaatgatagcttggagcctgagaagaaaatcacagaaggagaa1680
agcatcacggaagataaagaggccaattcgagtaatgcgggaggcaagagaaaagtaccg1740
atgcaagggaagtggaaaggctttgacccagttgttttcgtgaaagatgaaacagtaatc1800
aatggcatcaaggaattctacggtatcaaagatgaatcatttccattacatggtcatctc1860
gtggcaagaaacaccgacacaagcagcgttaagaggatttactatgtttcaaaatcagtt1920
aaggaagttcttcagttgaattttgcagtcgggcagcagcttaagatcgcttctgttggc1980
ctcaaaatgtttgagagacaatcggcaaaagaaggttcaagcacgctgtgcccattccgt2040
atatcatccgagggactacctgtgattcttccatacattaccaaacaagtactttatact2100
ccaatggcagacttcaaacttctcctgcaagacaaatcaatcaagtttcacgattttgtc2160
aatccacagttggcccagaaagcaactgaccttgttatgggaagctgcgtggtgattctc2220
agcgatggtgaagtaccggtgaaagcggatgcatcaacaattgccatcagttgctggaga2280
gggaaggctagtttggctgttatggccactgtcgcagattgccaggagctgctagagaga2340
tttgccgagaaaacaccaaaaacagaaggtggttcggtaaatggaagcaacggcgattcg2400
gacggtccactagctatggagact2424
<210>13
<211>1155
<212>dna
<213>人工序列()
<400>13
cagcttcatttgccacaggttcttgctgatgctgtgtctaggcttgtgttgggtaagttt60
ggtgatttgacagataatttctcttcacctcacgctaggagaaaagtgcttgctggagtg120
gtgatgactactggaactgacgtgaaggacgcaaaggtgatttctgtttctactggtggt180
aagtgcattaacggagagtacatgtcagataggggattggctcttaatgattgtcatgct240
gaaattatttctagaagatctttgcttaggttcttgtatacacagttggaactttatctt300
aataataaggacgatcaaaaaaggtctatttttcagaagtctgagaggggaggttttcgt360
cttaaggaaaacgttcagtttcacttgtatatttctacttcaccatgtggtgacgctagg420
attttttcaccacacgagcctattcttgaggagcccgctgatagacacccaaatcgtaag480
gctaggggacagcttaggactaaaattgaatctggacaaggaactattccagttagatct540
aatgcatcaattcagacttgggatggtgtgttgcaaggtgagaggcttttgactatgtca600
tgctcagacaagatagctaggtggaacgtggtgggtattcaaggttctttgttgtctatt660
tttgttgaaccaatttatttttcttctattattttgggatctctttatcatggtgatcat720
ctttctagggctatgtatcaaagaatttctaatattgaagatttgccaccactttatact780
cttaataagcctcttctttctggaatttcaaacgctgaggctaggcaacccggtaaggct840
ccaaacttctctgtgaactggactgtgggagattcagctatagaggtgattaacgcaact900
actggtaaggatgagcttggtagggcttctaggttgtgcaagcacgcattgtactgtagg960
tggatgagggttcacggtaaggttccatctcacttgttgaggtctaagattacaaaacct1020
aacgtttaccacgagtcaaagttggctgctaaggagtaccaagctgcaaaggcaaggctt1080
ttcactgcattcattaaggctggtcttggagcttgggtggagaagccaactgaacaagat1140
cagttttctttgaca1155
<210>14
<211>718
<212>dna
<213>人工序列()
<400>14
atggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggac60
ggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctac120
ggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctagcccacc180
ctcgtgaccaccttcacctacggcgtgcagtgcttcagccgctaccccgaccacatgaag240
cagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttc300
ttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctg360
gtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcac420
aagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaac480
ggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgcc540
gaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccac600
tacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtc660
ctgctggagttcgtgaccgccgccgggatcactcacggcatggacgagctgtacaagt718