种子中蛋白质含量降低的植物及其制备方法和利用方法

文档序号:152613阅读:1348来源:国知局
专利名称:种子中蛋白质含量降低的植物及其制备方法和利用方法
技术领域
本发明涉及植物的功能改良。更具体地说,本发明涉及使贮藏蛋白的表达降低的方法和使外源蛋白质高效表达的方法、其中所使用的反义构建体、RNAi构建体、组合物、装置等。另外本发明还涉及用目标蛋白质替代天然蛋白质进行表达的方法。
背景技术
随着植物的基因操作技术的进步,包括水稻等谷物在内的植物功能改良得到显著的进展。最初是在病虫害抗性或除草剂抗性等方面,主要以农业生产为对象,在栽培方面进行改良,最近,转变为对消费者需求大的食用部分的转化投入了很大的科研力量。使各种生理机能肽或抗体等外源功能性蛋白质在植物中表达的研究在世界范围内进行着,特别是关于种子,由于可长期稳定保存,因此作为外源功能性蛋白质的生产装置受到人们的关注(日本特开2002-58492号公报、Molecular Breeding 9149-158(2002)),同时也对用于在种子中表达的启动子进行了研究(Plant Cell Physiol.39885-889(1998))。
水稻等谷物种子中,种子中的蛋白质含量为百分之几至百分之十,其大部分都以贮藏蛋白这样的形态存在。贮藏蛋白是发芽时的氮营养源,除此以外不具其它生理机能。通常,蛋白质根据其溶解性大致分为谷蛋白、谷醇溶蛋白、球蛋白、白蛋白四种,对于贮藏蛋白的类型,每种植物各有其特征。豆科种子多是以球蛋白为主要的贮藏蛋白,而谷类等单子叶植物中,除去一部分例外,谷醇溶蛋白是主要的贮藏蛋白(J.Exp.Botany 53947-958(2002))。
水稻在谷类中例外地是以谷蛋白为主要的贮藏蛋白,占种子蛋白的60-70%。谷蛋白基因群中每个单倍体基因组由约10个基因构成,这些基因群被分类为2个亚家族——GluA和GluB,所述亚家族在编码区中在氨基酸水平显示60-65%的同源性。另外,各个亚家族中含有氨基酸水平显示80%或以上的同源性的5个左右的基因。从进化角度看,谷蛋白与豆科的贮藏蛋白球蛋白具有亲缘关系,氨基酸组成上富含较多必须氨基酸,营养价高。而谷醇溶蛋白占水稻种子蛋白质的20-30%,具有仅次于谷蛋白的含量。其特征是大量含有谷氨酰胺,也较多含有脯氨酸,而作为必须氨基酸的赖氨酸极少,营养价低。已知谷醇溶蛋白的基因组中存在多个氨基酸序列稍有不同的类似结构的基因,推定其总数在25-100之间。除此之外的贮藏蛋白中,分子量为26kDa的球蛋白占数个百分比。种子中,贮藏蛋白蓄积在被称为蛋白体的颗粒状细胞内部结构中。如果以种子作为蛋白质的制造工厂,则蛋白体起到蛋白质的仓库的作用。水稻中,来源、外观完全不同的2种蛋白体共存于胚乳中,这是水稻的一个特征,分别称为蛋白体1(蓄积谷醇溶蛋白)、蛋白体2(蓄积谷蛋白和球蛋白)(Plant Cell Physiol.281517-1527(1987);Plant Physiol.88649-655(1988);PlantBiotechnology,16103-113(1999);酿协(1993414-420;稻学大成第3卷32-39(1990)和稻学大成第3卷317-325(1990))。
人们在各种作物中进行了改变贮藏蛋白的尝试,这主要针对营养价的改善、加工特性的改善。对于水稻,作为日本酒酿造或米加工食品的原料,人们希望为低蛋白质,因此人们致力于由放射线照射或诱变处理所得的水稻突变体库中搜索主要种子贮藏蛋白含量或组成低的突变系(Iida,S.等.(1997)Theor.Appl.Genet.94,177-183;Iida,S.等.(1993)Theor.Appl.Genet.87,374-378;Grop Sci.39825-831(1999);育种学研究4(别1)66(2002);育种学杂志47(别2)632(1997);育种学杂志47(别2)176(1997);育种学杂志45(别2)502(1995);以及育种学杂志45(别1)508(1995))。目前,对于特定谷蛋白缺失和谷蛋白含量减少的突变水稻的研究取得了进展,这是由于谷蛋白是水稻的主要贮藏蛋白,它适合作为目标。已知代表性的低谷蛋白水稻系有由突变产生的LGC-1和由反义法得到的重组低谷蛋白水稻系(日本特许3149951号公报;育种学研究3139-149(2001)和Molecular Breeding 8273-284(2001))。其中已明确LGC-1的变异引发基因是1个显性遗传的基因,并在最近将其分离出来(The Plant Cell 15,1455-1467,(2003))。其结构是原本相向的两个谷蛋白基因(GluB4和GluB5)转录的基因组区中,被夹在两个基因之间的终止子区缺失。由此,由GluB4启动子的转录超过原来的终止点,沿反义方向转录至GluB5基因,结果GluB4和GluB5的相同区形成双链RNA,发生了因RNAi现象导致的贮藏蛋白谷蛋白总体表达受到抑制的现象。突变可以直接用于杂交育种,因此该水稻与自身或其它水稻杂交的后代系已经进行了品种注册(农业技术55(10)、26-29(2000)和育种学研究433-42(2002))。不过,还不能说由LGC-1基因取得了谷蛋白表达抑制的最佳结构,在LGC-1仍残留了原品种30-50%的谷蛋白。本发明中,为了抑制贮藏蛋白的表达而利用了RNAi现象,其意义在于通过使用最佳结构的结构基因,可极大提高表达抑制效率,带来了技术上的大的进步。另外,低谷蛋白水稻系的共通问题点在于谷蛋白确实比原品种极大减少了,但作为反作用,可见谷醇溶蛋白显著增加。这是由通常种子内的蛋白质保持一定的调节机构起作用的,当探测到谷蛋白不足时,即增加了谷醇溶蛋白的合成。这意味着,低谷蛋白系是改变贮藏蛋白的组成的米,并未充分成功地实现低蛋白化。
另一方面,谷醇溶蛋白营养价缺乏、消化性差、使米的加工特性、米饭的味道降低,因此希望降低其含量。已知已经有了几个突变水稻(Iida,S.等.(1997)Theor.Appl.Genet.94,177-183;Iida,S.等.(1993)Theor.Appl.Genet.87,374-378;育种学研究4(别1)66(2002);育种学杂志47(别2)632(1997);育种学杂志47(别2)176(1997);育种学杂志45(别2)502(1995);以及育种学杂志45(别1)508(1995)15-19),但由于谷醇溶蛋白降低程度小,或者同时引起其它突变,不育性等原因,使对目标系的选育滞后。因此,对谷醇溶蛋白显著增多等一系列伴随低谷蛋白减低系统的问题至今尚未找到解决途径。这样,低谷醇溶蛋白水稻的开发成为留给今后的课题。
如本说明书开章所述,以种子作为有用蛋白质的制造装置(生物反应器)加以利用的研究受到人们的关注。种子作为食品,具有长期食用的历史,具有有害物质混入的风险小的优点,另外无需特别的纯化操作,可以直接食用,这点也很重要。这种情况下,如果使用贮藏蛋白少的种子,则剩余的氨基酸则可高效地用于外源蛋白质的合成,具有增加表达的可能性。减少贮藏蛋白,将该部分换成有用蛋白质,也可发挥氮源的功能,种子生理方面不会产生问题。另外,当为水稻时,谷蛋白和谷醇溶蛋白被严格分开,积聚在不同的颗粒中,因此如果充分运用该机理,使它们蓄积在蛋白体中,可以提高表达量,容易地纯化有用蛋白质。例如,对于贮藏蛋白谷醇溶蛋白的信号序列,如果是同种自不待言,禾本科种子例如小麦、大麦、玉米的贮藏蛋白,其同源性也高,因此可以使用这些序列,使蛋白质集聚在蛋白体1中。
但是,在现有的以功能性作物的培育为目的的使外源蛋白在种子中表达的成果(日本特开2002-17187号公报;日本特开平7-213185号公报;以及日本特表2001-518305号公报、育种学研究5(别2)294(2003))中,很多情况下是将通常的品种用于表达。这种情况下,种子内的氨基酸库的大部分被水稻的贮藏蛋白合成所消耗,可用于有用蛋白质生产的量非常有限。结果,有用蛋白质表达水平受到限制,机能改变的效率不好。另外,在将贮藏蛋白突变水稻用于外源蛋白质的表达的例子(日本特开2002-58492号公报)中,低谷蛋白水稻的种子蛋白质总量与原水稻几乎同等,仍未解决有用蛋白质和贮藏蛋白对种子内的氨基酸库的竞争问题。如上所述,现有的技术中并不能说是采用了外源蛋白质的高效表达品系。
如果是低蛋白水稻,当需要以一些形式除去米的蛋白质来使用时,都可以以少的劳力出去蛋白质,因此该低蛋白水稻是有用的。通常的食用米或米加工食品原料都优选低蛋白(“种子的生物科学”种子生理生化学研究会编学会出版中心2.水稻251-257(1995);“种子的生物科学”种子生理生化学研究会编学会出版中心4.米加工制品359-365(1995)以及“种子的生物科学”种子生理生化学研究会编学会出版中心5.日本酒·清酒366-371(1995)),但近年来需求增加的领域却是低变应原的米材料。据称患有各种变态反应的人群达到日本人口的约1/3,其中,对于以往没有问题的米发生变态反应的患者正在增加。这种情况下,虽然从营养学角度讲,摄取替代食品即可,但是吃惯的米突然不能吃了,其精神方面的痛苦极大。因此,针对米变态反应患者,对于使变应原降低的加工米的需求正在增加。米中会成为变应原的主要是球蛋白,例如日本特开平2-167040号公报中尝试使蛋白质分解酶作用于米,分解除去球蛋白,以除去变应原。另外,日本特许第3055729号公报中阐述了以低蛋白米为原材料,通过碱洗溶解除去变应原的方法。上述发明都是着眼于除去蛋白质,因此低蛋白米应当使蛋白质提取除去的效率更好,但实际使用的水稻系是通常的品系,或者是贮藏蛋白的组成有变化但尚没有成为低蛋白的品系,效率不高。另外,日本专利第2055729号公报中,只是试验了现有的各种突变水稻,并不是战略性地开发功能性作物。并且被视为优选结果的低谷蛋白或低谷醇溶蛋白的特性在现有品种中不能同时存在,在单独的品种中并没有实现对有广范围分子量分布的变应原的总结性的除去。
由以上可以看出,在米和米加工品的高度利用、功能性植物·育种等领域中,对低蛋白种子的提供和提高种子中外源蛋白质的表达的需求很高。
本发明的课题在于提供使种子的蛋白质含量减少的方法以及实现上述方法所需技术的开发、通过上述方法开发的植物及其种子、以及这样的植物和种子的利用方法。

发明内容
本发明人发现某种与编码谷醇溶蛋白的基因序列的至少一部分(有至少15个碱基即足够)互补的反义分子使谷醇溶蛋白多基因群的表达整体显著减少,结果可使种子的蛋白质含量减少,由此解决了上述课题。
因此本发明提供以下内容。
1.一种核酸分子,该核酸分子含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。
2.项目1的核酸分子,该核酸分子含有与编码谷醇溶蛋白多肽的基因序列互补、且具有至少15个连续的核苷酸长度的核酸序列。
3.项目1的核酸分子,其中上述谷醇溶蛋白是水稻的谷醇溶蛋白。
4.项目1的核酸分子,其中上述谷醇溶蛋白是粳稻种水稻的谷醇溶蛋白。
5.项目1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度是至少50个连续的核苷酸长度。
6.项目1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度的核酸序列含有上述编码谷醇溶蛋白多肽的全长序列的互补序列。
7.项目1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度的核酸序列是上述编码谷醇溶蛋白多肽的核酸序列的5’末端的序列。
8.项目1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度是50个核苷酸或以下的核苷酸长度。
9.项目1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度是30个核苷酸或以下的核苷酸长度。
10.项目1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度含有编码选自SEQ ID NO.98-101所示的任意氨基酸序列的核酸序列中至少15个核苷酸长度的序列。
11.项目1的核酸分子,其中上述谷醇溶蛋白是13kDa谷醇溶蛋白。
12.项目1的核酸分子,该核酸分子含有与下述多核苷酸互补、且具有至少15个连续的核苷酸长度的核酸序列(a)具有选自SEQ ID NO.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43和45所示的核酸序列或其片段序列的多核苷酸;(b)编码具有选自SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44和46所示的氨基酸序列的多肽或其片段的多核苷酸;(c)编码具有生物学活性、带有至少一种突变的变异体多肽的多核苷酸,其中所述多肽在选自SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44和46所示的氨基酸序列中的1或几个氨基酸被取代、附加或缺失;(d)为含有选自SEQ ID NO.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43和45所示的核酸序列的DNA等位基因突变体的多核苷酸;(e)编码含有选自SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44和46所示的氨基酸序列的多肽的物种同系物或直向同系物的多核苷酸;(f)与(a)-(e)的任意一个多核苷酸在严谨条件下杂交、且编码具有生物学活性的多肽的多核苷酸;或者(g)含有与(a)-(e)的任意一个多核苷酸或其互补序列的同源性至少为70%的碱基序列、且编码具有生物学活性的多肽的多核苷酸。
13.项目1的核酸分子,该核酸分子具有反义活性。
14.项目13的核酸分子,其中所述反义活性是使上述谷醇溶蛋白多肽的表达减少。
15.核酸分子,该核酸分子含有来自编码谷醇溶蛋白多肽的核酸序列、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。
16.核酸分子,该核酸分子含有(A)核酸序列A,该核酸序列A含有来自编码谷醇溶蛋白多肽的核酸序列、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列;以及(B)核酸序列B,该核酸序列B含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。
17.项目16的核酸分子,该核酸分子含有上述核酸序列A和核酸序列B互相基本上互补的部分。
18.项目16的核酸分子,其中上述核酸序列A和核酸序列B互相基本上互补。
19.项目16的核酸分子,该核酸分子还含有间隔序列。
20.项目19的核酸分子,其中上述间隔序列含有内含子序列。
21.项目19的核酸分子,其中上述间隔序列在上述核酸序列A和上述核酸序列B之间。
22.一种因子,该因子引发针对编码谷醇溶蛋白多肽的基因序列的RNAi。
23.核酸盒,该核酸盒含有核酸序列B,所述核酸序列B含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个连续的核苷酸长度的核酸序列或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。
24.项目23的核酸盒,其中,还含有编码外源基因的核酸序列。
25.项目23的核酸盒,其中,还含有核酸序列A,其中所述核酸序列A含有来自编码谷醇溶蛋白多肽的核酸序列、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。
26.项目25的核酸盒,其中,还含有间隔序列。
27.项目26的核酸盒,其中所述间隔序列含有内含子序列。
28.项目26的核酸盒,其中所述间隔序列在上述核酸序列A和核酸序列B之间。
29.项目25的核酸盒,其中,还含有信号序列。
30.项目29的核酸盒,其中上述信号序列设置于上述外源基因的上游。
31.项目29的核酸盒,其中上述信号序列为贮藏蛋白的信号序列。
32.项目29的核酸盒,其中上述信号序列为谷醇溶蛋白信号序列。
33.项目24的核酸盒,其中,还含有启动子序列。
34.项目33的核酸盒,其中上述启动子序列与上述外源基因和上述核酸序列B两者可操作地连接。
35.项目24的核酸盒,其中,启动子序列分别、独立地与上述外源基因和上述核酸序列B两者可操作地连接。
36.项目35的核酸盒,其中,与上述外源基因可操作地连接的启动子序列(启动子序列A)、以及与上述核酸序列B可操作地连接的启动子序列(启动子序列B)互相不同。
37.项目36的核酸盒,其中上述启动子序列B是可使基因在种子中表达的启动子序列。
38.项目36的核酸盒,其中上述启动子序列B来自贮藏蛋白的启动子。
39.项目36的核酸盒,其中上述启动子序列B来自贮藏蛋白的启动子,并与上述启动子序列A不同。
40.项目36的核酸盒,其中上述启动子序列B来自选自多遍在蛋白启动子、26k球蛋白启动子、谷蛋白A启动子、谷蛋白B启动子、16kDa谷醇溶蛋白启动子、13kDa谷醇溶蛋白启动子和10kDa谷醇溶蛋白启动子的启动子。
41.项目36的核酸盒,其中上述启动子序列A来自贮藏蛋白启动子。
42.项36的核酸盒,其中上述启动子序列A是天然伴随于上述核酸序列B的启动子。
43.项目36的核酸盒,其中上述启动子序列A来自选自26kDa球蛋白启动子、谷蛋白A启动子、谷蛋白B启动子、16kDa谷醇溶蛋白启动子、10kDa谷醇溶蛋白启动子和13kDa谷醇溶蛋白启动子的启动子。
44.项目36的核酸盒,其中上述启动子序列A是谷醇溶蛋白启动子。
45.项目36的核酸盒,其中上述启动子序列A来自谷醇溶蛋白启动子,上述启动子序列B来自上述谷醇溶蛋白启动子以外的启动子。
46.项目33的核酸盒,该核酸盒在上述外源基因和上述启动子序列之间含有框内信号序列。
47.项目25的核酸盒,该核酸盒进一步含有终止子序列。
48.项目47的核酸盒,其中上述终止子序列为10kDa谷醇溶蛋白的终止子序列。
49.项25的核酸盒,其中,还含有外源基因,上述外源基因存在于上述核酸序列A和上述核酸序列B的上游处。
50.项目49的核酸盒,该核酸盒在上述核酸序列A和上述核酸序列B之间含有间隔序列。
51.项目49的核酸盒,该核酸盒在上述核酸序列A和上述核酸序列B之间含有内含子序列。
52.用于制备核酸盒的方法,该方法包括以下步骤A)提供核酸盒的步骤,该核酸盒是在含有核酸序列B和核酸序列A的上游可操作地连接启动子序列B,其中所述核酸序列B含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个连续的核苷酸长度的核酸序列或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列;所述核酸序列A含有来自编码谷醇溶蛋白多肽的核酸序列、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列,外源基因设置于上述启动子序列B的上游或下游;启动子A与上述外源基因可操作地连接;B)用上述核酸盒转化植物的步骤;以及C)在上述被转化的植物中筛选谷醇溶蛋白表达量部分减少的植物的步骤。
53.载体,该载体含有项目1的核酸分子。
54.项目53的载体,该载体还含有具有启动子活性的序列。
55.项目54的载体,其中上述具有启动子活性的序列是贮藏蛋白的启动子。
56.项目53的载体,其中上述具有启动子活性的序列是上述谷醇溶蛋白的启动子。
57.项目53的载体,该载体还含有终止子。
58.项目53的载体,该载体还含有编码选择性标记的序列。
59.项目53的载体,该载体还含有编码与项目1的核酸分子不同的外源基因的序列。
60.植物细胞,该植物细胞含有项目1的核酸分子。
61.项目60的植物细胞,该植物细胞还含有编码与项目1的核酸分子不同的外源基因的核酸分子。
62.项目60的植物细胞,其中上述谷醇溶蛋白的来源植物种与上述植物的种为同种。
63.项目60的植物细胞,其中上述谷醇溶蛋白的来源植物种与上述植物的种为同一品种。
64.项目60的植物细胞,其中上述谷醇溶蛋白的来源植物种与上述植物的种都为水稻。
65.项目60的植物细胞,其中上述谷醇溶蛋白的来源植物种与上述植物的种都为粳稻种的水稻。
66.项目60的植物细胞,该植物细胞是向等位染色体双方导入项目1的上述核酸分子得到的。
67.植物组织,该植物组织含有项目60的植物细胞。
68.植物体,该植物体含有项目1的核酸分子。
69.项目68的植物体,该植物体还含有与项目1的核酸分子不同的、编码外源基因的核酸分子。
70.项目68的植物体,其中上述谷醇溶蛋白的来源植物种与上述植物的种为同种。
71.项目68的植物体,其中上述谷醇溶蛋白的来源植物种与上述植物的种为同一品种。
72.项目68的植物体,其中上述谷醇溶蛋白的来源植物种与上述植物的种都为水稻。
73.项目68的植物体,其中上述谷醇溶蛋白的来源植物种与上述植物的种都为粳稻品种水稻。
74.项目68的植物体,该植物体是向等位染色体双方导入项目1的上述核酸分子而成的。
75.种子,该种子由项目68的植物体生产。
76.种子,该种子由项目69的植物体生产。
77.淀粉制备物,该淀粉制备物由项目68的植物体或项目75的种子生产。
78.组合物,该组合物含有由项目69的植物体或项目76的种子生产的上述外源基因的基因产物。
79.植物中使种子中的蛋白质表达量减少的方法,该方法包括A)提供项目1的核酸分子的步骤;B)将上述核酸分子导入上述植物细胞的步骤;C)使上述细胞再分化,制备转基因植物的步骤;以及D)由上述转基因植物获得种子的步骤。
80.项目79的方法,其中上述导入步骤通过农杆菌法进行。
81.项目79的方法,该方法还包含E)对导入了上述核酸分子的植物细胞进行选择的步骤。
82.项目81的方法,其中上述选择步骤通过判定抗生素抗性来进行。
83.使外源基因在植物种子中表达的方法,该方法包含A)提供项目1的核酸分子的步骤;B)提供上述编码外源基因的核酸分子的步骤;C)将上述项目1的核酸分子和上述编码外源基因的核酸分子导入上述植物的细胞的步骤;D)使上述细胞再分化,制备转基因植物的步骤;以及E)由上述转基因植物获得种子的步骤。
84.项目83的方法,其中上述导入步骤通过农杆菌法进行。
85.项目83的方法,该方法还包含F)对导入了上述核酸分子的植物细胞进行选择的步骤。
86.项目85的方法,其中上述选择步骤通过判定抗生素抗性来进行。
87.项目83的方法,该方法还包含G)由上述种子分离上述外源基因的基因产物的步骤。
88.组合物,该组合物含有由项目83的方法生产的上述外源基因的基因产物。
89.项目1的核酸分子在使植物种子中的蛋白质表达量减少中的应用。
90.项目1的核酸分子在使植物种子中外源基因表达中的应用。
91.项目90的应用,该应用是在使上述种子中的上述植物天然蛋白质表达降低中的应用。
以下给出本发明的优选实施方案,通过本发明的说明和本领域周知的常规技术,可适当实施这些实施方案,本领域技术人员应该容易地理解本发明所起的作用和效果。
附图简述


图1表示本发明的谷醇溶蛋白反义基因盒、有用基因表达盒、以及为了简便地构建使用这些,现有载体和启动子改变的变异形式。利用这些,可以迅速构建表达盒、表达载体。并且可以迅速且容易地构建如同时将复杂的结构基因导入多个表达盒。
图2表示实际构建并导入的谷醇溶蛋白反义基因载体的结构概略示意图。
图3是通过SDS-PAGE电泳法对本发明的种子LP13K系(导入了13kDa谷醇溶蛋白反义基因盒的品系)中种子蛋白质进行分析的结果。蛋白质的检测通过考马斯亮蓝染色进行。电泳照片的横轴为相当于主要贮藏蛋白的条带,A10kDa谷醇溶蛋白、B13kDa谷醇溶蛋白、C16kDa谷醇溶蛋白、D谷蛋白碱性亚单元、E26kDa球蛋白、F谷蛋白酸性亚单元,纵轴标记的数字为分子量的大致范围。这些标记在以后的图中也通用。LP13K品系泳道4、5、6与其它泳道比较,相当于13kDa谷醇溶蛋白的B条带的浓度显著低,表示13kDa谷醇溶蛋白含量减少。
图4是通过SDS-PAGE对导入了各种结构的13kDa谷醇溶蛋白反义基因盒的种子的蛋白质进行分析的结果。在潮霉素抗性(图中用R标记)的泳道中,相当于13kDa谷醇溶蛋白的B条带的浓度无一例外地显著低。
图5是在导入了各种结构的谷醇溶蛋白反义基因表达盒的水稻中,对于抑制效果显著的品系随机选取种子,通过使用抗13kDa谷醇溶蛋白(Nipponbare)抗体的蛋白质印迹分析,调查低谷醇溶蛋白表型。图中a)是在SDS-PAGE后进行了考马斯亮蓝染色(使用15μl种子提取蛋白质)。b)是在SDS-PAGE后转印PVDF膜,用抗13kDa谷醇溶蛋白(Nipponbare)多克隆抗体进行蛋白质印迹分析(使用0.5μl种子提取蛋白质)。泳道下部给出了条带吸光度的相对比率。
图6(a和b)表示通过透射电子显微镜观察LP13K的胚乳表层细胞的图像。a中直接给出了观察图像,b是在上面叠加表示蛋白体类型。蛋白体1为灰色球形颗粒(蓄积谷醇溶蛋白)。在b)中以黑色三角表示。蛋白体2为色黑(浓)的稍大的颗粒(蓄积谷蛋白和球蛋白)。在b)中以白色三角表示。
与常规品种的观察图像(b2)比较,LP13K(b1)中应蓄积有谷醇溶蛋白的蛋白体1的数目大幅减少。LGC-1(b3)中则相反,蛋白体2的数目大幅减少,而蛋白体1的数目大幅增加。由此显示通过控制谷醇溶蛋白,可控制蛋白体的形成,且可极大改变表层细胞的内部状态。
图7表示各品种的种子蛋白质的SDS-PAGE结果和通过抗13kDa谷醇溶蛋白多克隆抗体进行蛋白质印迹分析的结果。在粳稻、籼稻的任意品种中均检测出与抗体良好反应的13kDa谷醇溶蛋白,显示其结构高度保守。
图8表示为了验证将本发明作为有用蛋白质表达系统应用的可能性而使用的表达载体结构的例子。
图9(A-B)是代表性的谷醇溶蛋白的序列比较图。
图10表示实施例8中的试验例和电泳的结果。
图11表示实施例11中,以GFP为模型蛋白质的水稻种子中外源基因表达实验中所用的结构基因的结构。显示同时导入13kDa谷醇溶蛋白表达抑制盒、即,使贮藏蛋白降低,这可增强GFP的表达。
图12表示根据实施例11的结果设计的在实施例12中使用的结构基因的结构。
图13表示导入
图12中的基因5和6的水稻种子蛋白质电泳结果和GFP量的定量结果。通过使用本发明的技术,以比原来的预想高很多的水平成功地进行了GFP的表达,显示成功地制造出种子蛋白质的电泳图谱与常规品种有很大不同的新型水稻种子。
图14是在
图12的结构基因中,通过蛋白质N末端的序列直接确认按照预想切除了信号序列、按照设计进行了正确的GFP蛋白表达的结果。证明了本发明的结构基因结构的优越性。
图15是实施例13中,应用本发明的技术实际进行有用蛋白质抑半胱氨酸蛋白酶蛋白的生产的例子。按照预想,以比现有成果高很多的水平实现了抑半胱氨酸蛋白酶蛋白的表达。
图16是通过本发明的过程阐明的水稻种子中的贮藏蛋白组成调节模式的总结。由此可明确本发明的基础理论——将贮藏蛋白所使用的氨基酸有效地转用于外源蛋白质的方法。
图17是总结全部结果,提出了对于种子中外源蛋白质有效表达普遍有用的结构基因的概念。
序列表说明SEQ ID NO.113kDa谷醇溶蛋白(RM9)的核酸序列SEQ ID NO.213kDa谷醇溶蛋白(RM9)的氨基酸序列SEQ ID NO.313kDa谷醇溶蛋白(RM1)的核酸序列SEQ ID NO.413kDa谷醇溶蛋白(RM1)的氨基酸序列SEQ ID NO.5-3013kDa谷醇溶蛋白的代表性序列SEQ ID NO.31-3216kDa谷醇溶蛋白的代表性序列SEQ ID NO.33-4610kDa谷醇溶蛋白的代表性序列SEQ ID NO.47来自水稻10kDa谷醇溶蛋白基因的启动子序列SEQ ID NO.48来自水稻谷蛋白B1基因的启动子序列SEQ ID NO.49来自CaMV35S基因的启动子序列
SEQ ID NO.50编码13kDa谷醇溶蛋白的cDNA全长(SEQ IDNO.1)的反义序列SEQ ID NO.51编码13kDa谷醇溶蛋白的cDNA的N末端的67bp的反义序列SEQ ID NO.52编码13kDa谷醇溶蛋白的cDNA的N末端的15bp的反义序列SEQ ID NO.53负调控序列SEQ ID NO.54潮霉素磷酸转移酶SEQ ID NO.55Nos终止子SEQ ID NO.56变异基因mHPT氨基酸序列SEQ ID NO.57使CaMV35S启动子和Nos终止子不会被限制酶切断地连接的选择标记表达盒SEQ ID NO.58mRUbiP启动子序列SEQ ID NO.59GUS基因片段SEQ ID NO.6013kDa谷醇溶蛋白启动子序列SEQ ID NO.6110kDa谷醇溶蛋白终止子序列SEQ ID NO.62谷蛋白A3启动子序列SEQ ID NO.63-72其它反义序列的例子SEQ ID NO.73-84与反义序列的例子所对应的氨基酸序列SEQ ID NO.85-88谷醇溶蛋白的特征基序SEQ ID NO.89RM4氨基酸序列SEQ ID NO.90RM5氨基酸序列SEQ ID NO.91RM7氨基酸序列SEQ ID NO.92RM10氨基酸序列SEQ ID NO.93RM16氨基酸序列SEQ ID NO.94RM4核酸序列SEQ ID NO.95RM5核酸序列SEQ ID NO.96RM7核酸序列SEQ ID NO.97水稻天冬氨酸蛋白酶基因内含子序列SEQ ID NO.9813kDa谷醇溶蛋白的共有序列例1SEQ ID NO.9913kDa谷醇溶蛋白的共有序列例2SEQ ID NO.10013kDa谷醇溶蛋白的共有序列例3
SEQ ID NO.10113kDa谷醇溶蛋白的共有序列例4SEQ ID NO.10213kDa谷醇溶蛋白的共有序列例1的编码核酸序列SEQ ID NO.10313kDa谷醇溶蛋白的共有序列例2的编码核酸序列SEQ ID NO.10413kDa谷醇溶蛋白的共有序列例3的编码核酸序列SEQ ID NO.10513kDa谷醇溶蛋白的共有序列例4的编码核酸序列SEQ ID NO.10616kDa谷醇溶蛋白启动子序列SEQ ID NO.10726kDa球蛋白启动子序列SEQ ID NO.10810kDa谷醇溶蛋白信号序列(核酸)SEQ ID NO.10910kDa谷醇溶蛋白信号序列(氨基酸)SEQ ID NO.11013kDa谷醇溶蛋白信号序列(核酸)SEQ ID NO.11113kDa谷醇溶蛋白信号序列(氨基酸)SEQ ID NO.11216kDa谷醇溶蛋白信号序列(核酸)SEQ ID NO.11316kDa谷醇溶蛋白信号序列(氨基酸)SEQ ID NO.114谷蛋白B1信号序列(核酸)SEQ ID NO.115谷蛋白B1信号序列(氨基酸)SEQ ID NO.11626kDa球蛋白信号序列(核酸)SEQ ID NO.11726kDa球蛋白信号序列(氨基酸)SEQ ID NO.118实施例11中的确定序列发明的实施方案以下对本发明的优选方案进行说明。本说明书中,如无特别说明,单数形式的表现应理解为包含其复数形式的概念。因此,如无特别说明,单数形式的冠词(例如英语中的“a”、“an”、“the”等、德语中的“ein”“der”“das”“die”等及其变格、法语中的“un”“une”“le”“la”等、西班牙语中的“un”“una”“el”“la”等、其他语言中对应的冠词、形容词等)应理解为包含其复数形式的概念。如无特别说明,本说明书中使用的术语应理解为是以该领域常用的含义使用。因此,如未另行定义,本说明书中使用的所有的专业术语和科技用语具有与本发明所属领域的技术人员通常理解的意思相同的含义。如有矛盾,则本说明书(包括定义)优先。
以下例举本说明书中特别使用到的术语的定义。
(术语)本说明书中,“种子蛋白质”是指蓄积在作物的种子中的蛋白质。大多根据对溶剂的溶解性的不同而区分,大致分为水溶性的白蛋白、盐水溶液可溶性的球蛋白、可溶于含水醇的谷醇溶蛋白、可溶解于稀酸或稀碱的谷蛋白。
本说明书中,“谷醇溶蛋白”是可溶解于50-90%左右的含水醇的蛋白质的总称,谷类种子的特征在于该谷醇溶蛋白形式的蛋白质是主要的贮藏蛋白。每种谷类的该蛋白都有其独特的称呼,代表性的有小麦麦谷蛋白、大麦醇溶蛋白、玉米醇溶蛋白、燕麦蛋白等,水稻则只称为谷醇溶蛋白。不过水稻中,谷蛋白是占种子蛋白质的60-70%的主要蛋白质,谷醇溶蛋白次于其,含量为20-30%,球蛋白有几个百分比。谷醇溶蛋白的分子量随植物的种类不同而不同,其共通的特征是它们的氨基酸序列富含谷氨酰胺,有连续(例如Gln-Gln、Gln-Gln-Gln等)的区或具有每隔特定的氨基酸出现的谷氨酰胺(例如Gln-Xaa-Gln-Xaa-Gln)区。还有一个特征就是谷醇溶蛋白基因的氨基酸序列中共同保守地具有由除谷氨酰胺之外还含有脯氨酸和半胱氨酸等的几个氨基酸或以上形成的基序(例如Glu-Phe-Val-Arg-Gln-Gln-Cys-Ser-Pro(SEQ ID NO.85)、或者Cys-Gln-Val-Met-Gln-Gln-Gln-Cys-Cys-Gln-Gln(SEQ ID NO.86)、及其含有1个或多个取代、附加或缺失的序列)。与SS键有关的Cys残基的位置也非常保守。这些基序并不限于同一植物内的谷醇溶蛋白基因,不同的植物种间也大多保守,由此形成了进化上具有共同祖先的谷醇溶蛋白基因超家族(Shewry,PE等.,Plant Cell 7,945-956,1995)。已知与其它贮藏蛋白的情况同样,谷醇溶蛋白基因在基因组中存在多拷贝,多基因家族(多基因)。由各个基因制备的、氨基酸序列稍有不同的蛋白质混合存在于种子中。
水稻谷醇溶蛋白可被55-60%的1-丙醇有效提取(Sugimoto,T等.,Agric.Biol.Chem.50,2409-2410,1986)。另外通过基因组DNA印迹分析、cDNA克隆或等电位电泳,推定基因数为25-100。它们可以分类成几个亚家族,不同的研究人员、或者实验所采用的不同的品种,其分类方法和蛋白质的称呼也各有不同,最通常的分类是根据一维SDS电泳的分子量来进行的。这种情况下,存在10kDa、13kDa(籼稻种中有时被称为14kDa,本说明书中称为13kDa谷醇溶蛋白时也包括该14kDa)、16kDa(籼稻种中有时被称为18kDa,本说明书中称为16kDa谷醇溶蛋白时也包括该18kDa)等。在一维SDS电泳中,各谷醇溶蛋白的条带即使是1条,其中也混合有多种蛋白质,已知10kDa有1种或以上,16kDa有3种或以上,多基因性最高的13kDa中仅可证明的就有12种,实际上应比这还多。在通过蛋白质印迹和cDNA的对应关系对13kDa谷醇溶蛋白进行详细的分类研究中(Mitsukawa,N等.,Plant Biotech.16,103-113,1999),有根据是否还原SS键而溶解性发生变化的性质、根据氨基酸序列的同源性和半胱氨酸残基的数目分类为4个型的例子。此外,也有效仿小麦的分类例,根据硫含量(主要是半胱氨酸残基含量)被分为富硫型(sulphur-richtype)、贫硫型(sulphur-poor type)的分类例子,贫硫型中不含半胱氨酸。任何一种谷醇溶蛋白的蛋白质N末端都被封闭,因此难以通过蛋白质序列进行分析,因此可以认为在蛋白质·cDNA水平尚未被鉴定的谷醇溶蛋白,或与cDNA的对应关系不明确的谷醇溶蛋白依然存在很多。但是,不管采取哪种分类方法·称呼由于谷醇溶蛋白有以下共通事项,因此关于该蛋白质是否属于谷醇溶蛋白,本领域技术人员很容易判别1)溶解于含水醇;2)是富含谷氨酰胺的氨基酸序列(至少为10%或以上),或者赖氨酸极少(3%或以下)或一个也没有;3)存在多个每隔1-数个氨基酸出现谷氨酰胺残基、或者连续出现2个或以上的谷氨酰胺的情况;4)以谷氨酰胺为核,保守有含有脯氨酸、半胱氨酸等氨基酸的基序(Glu-Phe-Val-Arg-Gln-Gln-Cys-Ser-Pro(SEQ IDNO.85)、或者Cys-Gln-Val-Met-Gln-Gln-Gln-Cys-Cys-Gln-Gln(SEQID NO.86)或者与它们具有50%或以上同源性的基序)。关于4)举例来讲,Gln-Gln-Cys-Cys-Gln-Gln(SEQ ID NO.87)的基序在水稻谷醇溶蛋白中和小麦麦谷蛋白中都高度保守,另外Glu-Phe-Val-Arg-Gln-Gln(SEQ ID NO.88)在水稻谷醇溶蛋白和玉米醇溶蛋白、燕麦蛋白等中保守。这样,即使分子量不同或蛋白质整体同源性低时,谷物谷醇溶蛋白也可以作为祖先基因相同的谷醇溶蛋白基因超家族被识别(Shewry,PE等.,Plant Cell 7,945-956,1995)。迄今为止的论文报道中提及的水稻谷醇溶蛋白在cDNA水平有λRM1、λRM2、λRM4、λRM7、λRM9、1pS18、pS23、pX24、pPro17、pProl14、pProl17、λRP16、λRP10,但并不限定于此。这些谷醇溶蛋白例如有具有选自DEQ ID NO.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29(13kDa谷醇溶蛋白)、31(16kDa谷醇溶蛋白)、33、35、37、39、41、43和45(10kDa谷醇溶蛋白)所示的核酸序列或其片段序列的多核苷酸;以及编码具有选自SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28、30(13kDa谷醇溶蛋白)、32(16kDa谷醇溶蛋白)、34、36、38、40、42、44和46(10kDa谷醇溶蛋白)所示的氨基酸序列的多肽或其片段序列的多核苷酸,但并不限于此。所述谷醇溶蛋白的基因只要是在Genbank、NCBI、EBML、DDBJ等基因库中登记谷醇溶蛋白基因即可,也可以使用除此以外的基因。
本说明书中,“13kDa谷醇溶蛋白”通常表示粳稻的SDS电泳法中,分子量在13kDa附近的谷醇溶蛋白,是水稻中最多含有的谷醇溶蛋白。其基因在基因组中存在较多,通过cDNA克隆或等电点电泳等分析的结果,可证实氨基酸序列稍有不同的基因最少也有12个或以上,可推定实际上数目更多。代表性的有含有DEQ ID NO.1、3、5、7、9、11、13、15、17、19、21、23、25、27或29所示的核酸序列和SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28或30所示的氨基酸序列的谷醇溶蛋白、以及与其对应的其它植物的谷醇溶蛋白超家族的基因,但并不限定于此。
本说明书中,“贮藏蛋白”是指在植物的种子中特别高度蓄积,在植物体内不具有酶活性等其它生理机能的蛋白质,通常聚集在蛋白体中。
本说明书中,“蛋白体”是指使贮藏蛋白聚集的颗粒状细胞内结构。通常大多一种植物中存在一种,但在水稻和燕麦中形成了外观、形态明显不同的2种蛋白体。水稻有蓄积谷醇溶蛋白的蛋白体类型1和蓄积谷蛋白和球蛋白的蛋白体类型2。两者的外观、形态、大小、来源等明显不同,蛋白体与贮藏蛋白的对应关系受到严密控制。
本发明中,有用的谷醇溶蛋白保守序列有以下。本发明中,编码所述保守序列的反义序列可作为优选序列例举。
序列1Gln Val Met Gln Gln Gln Cys Cys Gln Gln Leu Arg Leu Val Ala GlnGln Ser His Tyr Gln Ala Ile Ser Ser Val Gln Ala Ile Val Gln Gln Leu GlnLeu Gln Gln(SEQ ID NO.98)序列2Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys AsnAla Ser Ala Arg Phe Asp Ala Leu Ser Gln Ser Tyr Arg Gln Tyr Gln Leu Gln(SEQ ID NO.99)序列3Glu Phe Val Arg Gln Gln His Ser Ile Val Ala Thr Pro Phe Trp GlnPro Ala Thr Phe Gln Leu Ile Asn Asn Gln(SEQ ID NO.100)序列4Tyr Phe Asp Gln Thr Gln Ala Gln Ala Gln Ala Leu Leu Ala Leu AsnLeu Pro Ser Ile Cys Gly Ile Tyr Pro Asn Tyr Tyr工le Ala Pro(SEQ ID NO.101)本发明显示上述序列中,可以将与编码至少5个氨基酸的序列反义的序列用于实际的谷醇溶蛋白基因表达抑制。
本说明书中使用的术语“蛋白质”、“多肽”、“寡肽”和“肽”在本说明书中以相同的意思使用,是指任意长度的氨基酸的聚合物。该聚合物可以是直链也可以是支链,还可以是环状。氨基酸可以是天然的也可以是非天然的,还可以是改性的氨基酸。该术语还可以集合成为多个多肽链的复合物。该术语也包括天然或人工改性的氨基酸聚合物。所述改性例如有形成二硫键、糖基化、脂质化、乙酰基化、磷酸化或任意的其它操作或改性(例如与标记成分结合)。该定义还包括例如含有1或2个或以上的氨基酸类似物的多肽(例如含有非天然的氨基酸等)、肽样化合物(例如拟肽)和本领域中公知的其它的改性。
本说明书中使用的术语“多核苷酸”、“寡核苷酸”和“核酸”在本说明书中以相同的意思使用,是指任意长度的核苷酸的聚合物。该术语包括“寡核苷酸衍生物”或者“多核苷酸衍生物”。“寡核苷酸衍生物”或者“多核苷酸衍生物”包括核苷酸的衍生物,或者是指核苷酸之间的键与通常不同的寡核苷酸或多核苷酸,可互换使用。这样的寡核苷酸的具体例子有2’-氧-甲基-核糖核苷酸、寡核苷酸中的磷酸二酯键变换为硫代磷酸酯的寡核苷酸衍生物、寡核苷酸中的磷酸二酯键变换为N3’-P5’氨基磷酸盐键的寡核苷酸衍生物、寡核苷酸中的核糖和磷酸二酯键变换为肽-核酸键的寡核苷酸衍生物、寡核苷酸中的尿嘧啶被C-5丙炔基尿嘧啶取代的寡核苷酸衍生物、寡核苷酸中的尿嘧啶被C-5噻唑基尿嘧啶取代的寡核苷酸衍生物、寡核苷酸中的胞嘧啶被C-5丙炔基胞嘧啶取代的寡核苷酸衍生物、寡核苷酸中的胞嘧啶被吩■嗪改性的胞嘧啶取代的寡核苷酸衍生物、DNA中的核糖被2’-氧-丙基核糖取代的寡核苷酸衍生物、以及寡核苷酸中的核糖被2’-甲氧基乙氧基核糖取代的寡核苷酸衍生物等。除此之外如未表示,则是指特定的核酸序列与已明确表示出的序列同样,包括其保守性改变的变异体(例如简并密码子取代体)及其互补序列。具体来说,简并密码子取代体可通过制备以下序列实现1个或更多的(或者全部)密码子的第3位置被混合碱基和/或脱氧肌苷残基取代(Batzer等、Nucleic AcidRes.195081(1991);Ohtauka等、J.Biol.Chem.2602605-2608(1985);Rossolini等、Mol.Cell.Probrs 891-98(1994))。
术语“核酸分子”在本说明书中可以与核酸、寡核苷酸和多核苷酸互换使用,包括cDNA、mRNA、基因组DNA等。本说明书中,核酸和核酸分子可包含在术语“基因”的概念中。编码某个基因序列的核酸分子还包含“剪接突变体(变异体)”。同样,由核酸编码的特定蛋白质包含由该核酸的剪接变异体编码的任意的蛋白质。如名称所示,“剪接突变体”是基因的可变剪接的产物。转录后,最初的核酸转录物可剪接为使不同的(另外的)核酸剪接产物编码不同的多肽。剪接突变体的产生机理各有不同,包括外显子的可变剪接。通过错误转录得到的来自相同核酸的不同多肽也包括在该定义中。剪接反应的任何产物(包括重组形态的剪接产物)都包含在该定义中。
本说明书中,“分离”的生物学因子(例如核酸或蛋白质等)是指该生物学因子从天然存在的生物体细胞内的其它生物学因子(例如为核酸时,是指包含核酸以外的因子和目标核酸以外的核酸序列的核酸;为蛋白质时,是指包含蛋白质以外的因子和目标蛋白质以外的氨基酸序列的蛋白质等)基本上分离或纯化的因子。“分离的”核酸和蛋白质包括通过标准的纯化方法纯化的核酸和蛋白质。因此,分离的核酸和蛋白质包括化学合成的核酸和蛋白质。
本说明书中,“纯化的”生物学因子(例如核酸或蛋白质等)是指除去天然伴随该生物学因子的因子的至少一部分。因此,通常纯化的生物学因子中该生物学因子的纯度比该生物学因子通常存在的状态高(即被浓缩)。
本说明书中,“基因”是指规定遗传性状的因子。通常在染色体上按照一定的顺序排列,在染色体外,只要是规定遗传性状即属于基因的范畴。规定蛋白质的一级结构的称为结构基因,调控其表达的称为调控基因。
本说明书中。“基因”有时指“多核苷酸”、“寡核苷酸”和“核酸”以及/或“蛋白质”、“多肽”、“寡肽”和“肽”。本说明书中,“基因产物”是指通过基因表达的多核苷酸”、“寡核苷酸”和“核酸”以及/或“蛋白质”、“多肽”、“寡肽”和“肽”。本领域技术人员都可以根据情况理解基因产物为何物。
本说明书中,基因(例如核酸序列、氨基酸序列等)的“同源性”是指2个或以上的基因序列互相的同一性的程度。因此,某两个基因的同源性越高,则它们的序列的同一性或类似性就高。两种基因是否具有同源性,可通过序列的直接比较,或者当为核酸时,通过在严谨条件下的杂交法来测定。将两个基因序列直接比较时,在其基因序列间,DNA序列代表性地至少为50%同一、优选至少70%同一、更优选至少80%、90%、95%、96%、97%、98%或99%同一时,它们的基因具有同源性。本说明书中,基因(例如核酸序列、氨基酸序列等)的“类似性”是指在上述同源性中,当将保守性取代视为正向(同一)时,两个或以上的基因序列的相互的同一性程度。因此,当有保守性取代时,根据其保守性取代的存在而区分同一性和类似性。没有保守性取代时,统一性和类似性表示相同的数值。
本说明书中,碱基序列的类似性、同一性和同源性的比较可以使用序列分析工具BLAST,通过缺省参数计算。
本说明书中,“外源基因”是指某种植物中天然不存在的基因。所述外源基因可以是将天然存在于该植物中的基因进行修饰得到的,也可以是自然界中存在于其它植物中的基因,还可以是人工合成的基因,也可以是它们的复合物(例如融合物)。含有上述外源基因的植物可以表达天然状态下不表达的基因产物。
用于制备人工合成基因的DNA合成技术和核酸化学例如在Gait,M J.(1985).Oligonucleotide SynthesisA Pratical Approach,IRLPress;Gait,M J.(1990).Oligonucleotide SynthesisA PraticalApproach,IRL Press;Eckstein,F.(1991).Oligonucleotide andAnaloguesA Pratical Approach,IRL Press;Adamf,R.L.等.(1992).The Biochemistry of the Nucleic Acids,Chapman&Hall;Shabarova,Z.等.(1994).Advanced Organic Chemistry of Nucleic Acids,Weiheim;Blackburn,G.M.等.(1996).Nucleic Acids in Chemistry and Biology,Oxford University Press;Hermanson,G.T.(1996).BioconjugateTechniques,Academic Press等中有记载,其中的相关部分在本说明书中作为参考引用。
本说明书中,“外源基因”只要是可在植物中表达的基因即可,可以是任何基因。因此,在一个实施方案中,“外源基因”只要是编码希望其大量表达的有用蛋白质的基因即可,可以是任何基因,它们都包括在本发明的范围内。所述外源基因例如有具有药物活性的肽(例如细胞因子类(白细胞介素类、趋化因子类、粒细胞巨噬细胞集落刺激因子(GM-CSF)、巨噬细胞集落刺激因子(M-CSF)、粒细胞集落刺激因子(G-CSF)、广谱集落刺激因子(IL-3)、促红细胞生成素(EPO)、白血病抑制因子(LIF)、c-kit-配体(SCF)等造血因子、肿瘤坏死因子、干扰素类、血小板衍生生长因子(PDGF)、上皮生长因子(EGF)、成纤维细胞生长因子(FGF)、肝细胞生长因子(HGF)、血管内皮生长因子(VEGF)等),激素类(胰岛素、生长激素、甲状腺激素等)),疫苗抗原,血液制品,农业生产有用的肽,例如抗菌蛋白质,合成具有生理作用·药理作用的二次代谢产物的各种酶或水解酶,调节酶促反应的抑制物,被认为具有降血压作用的大豆球蛋白,或者通过在消化管内通过酶解、切出生理活性肽而设计成的人工蛋白质,但并不限定于此。另外具有营养学意义的物质有酪蛋白,豆类的白蛋白或球蛋白,或者维生素类·糖·脂质的合成酶等,但并不限定于此。还有作为各种加工食品原料、与加工特性有关的蛋白质,例如小麦麦谷蛋白(面包制作)、大豆球蛋白群(豆腐),乳酪蛋白群(干酪)等;改善食品的适口性或功能性的蛋白质,例如环糊精或低聚糖、γ氨基乙酸等特殊的糖·氨基酸类的合成酶类;与使外观良好的染料合成酶或与味觉成分合成有关的蛋白质群;或者通过在消化管内经酶消化、切出具有生理作用的肽(例如具有降血压效果的血管紧张肽转化酶抑制肽等)而设计成的人工蛋白质等,但并不受此限定。
本说明书中,“糖链”是指一个或以上糖单元(单糖和/或其衍生物)相连而成的化合物。2个或以上糖单元相连时,各糖单元之间通常通过糖苷键的脱水缩合而结合。所述糖链例如有生物体中含有的多糖类(葡萄糖、半乳糖、甘露糖、岩藻糖、木糖、N-乙酰葡糖胺、N-乙酰半乳糖胺、唾液酸以及它们的复合物和衍生物),除此之外还有由分解的多糖、糖蛋白、蛋白聚糖、糖胺聚糖、糖脂质等复合生物体分子分解或衍生的糖链等广范围的糖链,但并不限于这些。因此,本说明书中,糖链可以与“多糖”、“糖类”、“碳水化合物”互换使用。另外,如无特别说明,本说明书中的“糖链”包括糖链和含糖链物质两方面。
本说明书中,“单糖”是指未被水解为相似分子,含有至少一个羟基和至少一个醛基或酮基的多羟基醛或多羟基酮及其衍生物。通常的单糖由通式CnH2nOn表示,但并不限于此,还包括岩藻糖(脱氧己糖)、N-乙酰葡糖胺等。这里,在上式中,n=2、3、4、5、6、7、8、9和10的化合物分别为二糖、三糖、四糖、戊糖、己糖、庚糖、辛糖、壬糖和癸糖。通常相当于链式多元醇的醛或酮,因此将前者称为醛糖,将后者称为酮糖。本说明书中如无特别说明,单糖的衍生物是指未被取代的单糖上的一个或以上的羟基被其它的取代基取代而产生的物质。所述单糖的衍生物有具有羧基的糖(例如C-1位被氧化成羧酸的醛糖酸(例如D-葡萄糖被氧化得到的D-葡糖酸)、末端的C原子为羧酸的糖醛酸(D-葡萄糖被氧化得到的D-葡糖酸)、且具有氨基或氨基的衍生物(例如乙酰化氨基)的糖(例如N-乙酰-D-葡糖胺、N-乙酰-D-半乳糖胺等)、且具有氨基和羧基两者的糖(例如N-乙酰基神经氨酸(唾液酸)、N-乙酰基胞壁酸等)、脱氧糖(例如2-脱氧-D-核糖)、含有硫酸基的硫酸糖、含有磷酸基的磷酸糖等,但并不限于这些。本说明书中,称呼单糖时也包括上述衍生物。或者在形成半缩醛结构的糖中,与醇反应得到的缩醛结构的糖苷也在单糖的范围内。
本说明书中,天冬酰胺键型糖链结构的表示方法按照高桥等人的命名方法(http//www.gak.co.jp;高桥礼子编著、生化学实验法23、糖蛋白糖链研究法、学会出版中心、1989年;Takahashi N,Tomiya NAnalysis of N-linked oligosaccharidesApplication of glycoamidaseAIn Handbook of endoglycosidases and glycoamidases(Takahashi N,Muramatsu T eds.).209-241页,CRC press,Bpca Raton,FL,1992)。有以下要求1)当为N-乙酰基乳糖胺型(络合型)糖链时的命名方式是(A)以三位数的数字的第一个数表示支链数。(B)还原末端的N-乙酰基葡糖胺上以α-1,6键结合有岩藻糖时,三位数字的中间数字为1;未结合时三位数字的中间数字为0。(C)五糖核心结构的β-甘露糖上以β=1,4键结合有N-乙酰基葡糖胺时,三位数字的最后数字为1;未结合时三位数字的最后数字为0。三位数字的后面加入.,其右侧写上特定编号。2)高甘露糖型糖链的命名方式是首先写M,接着写甘露糖残基数。然后加入,在其右侧写上特定编号。还原末端的N-乙酰基葡糖胺上以α-1,6键结合有岩藻糖时,在M.后写上F。3)复杂型糖链命名方式是首先写H,接着写甘露糖残基数。然后加入,在其右侧写上特定编号。还原末端的N-乙酰基葡糖胺上以α-1,6键结合有岩藻糖时,在H后写上F。4)还原末端的N-乙酰基葡糖胺上以α-1,3键结合有岩藻糖时,在整个命名后面写F;五糖核心结构的β-甘露糖上以β-1,2键结合有木糖时,在整个命名后面写X。具有两者时,按照FX的顺序写。5)具有N-乙酰基半乳糖胺以代替半乳糖时,在半乳糖的名称记号后,N-乙酰基半乳糖胺数目为1时记为a、为2时记为b,为3时记为c…在最后加上与数目对应的小写英文字母。6)象五糖核心结构那样,可分为N-乙酰基乳糖胺型和高甘露糖型或复杂性的任何一种时,优选命名N-乙酰基乳糖胺型。7)具有唾液酸时,写上唾液酸的残基数,接着,当唾液酸的分子种类为N-乙酰基神经氨酸时,将A、以及特定编号写在上述糖链结构之前,以-连接。这样的表示方法的例子有将半乳糖β1,4-N-乙酰葡糖胺β1,2-甘露糖-α1,3-(甘露糖α1,3-(甘露糖α1,6-)甘露糖α1,6-)甘露糖β1,4-N-乙酰葡糖胺β1,4-N-乙酰葡糖胺命名为H5.12等的方式,但并不限于此。
本说明书中,根据本发明制备的蛋白质在植物中的翻译后修饰,结合特定的糖链。在以应用于动物为目的的情况下,优选所述糖链相同,在植物中的修饰如果相同,则可无问题地使用,只要是基本上相同即无问题。另外,即使糖链的修饰方式不同,只要在动物中有效作用、优选没有副作用,即可无问题地利用。如果希望改变修饰方式,可采用酶学等的方法来改变修饰。
要表达的外源基因还可以使用与上述天然型外源基因具有同源性的基因。这样的具有同源性的外源基因,例如采用Blast的缺省参数进行比较时,所述具有同源性的外源基因例如有含有与比对的外源基因具有至少约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、约99%的同一性或类似性的核酸序列的核酸分子,或者具有下述氨基酸序列的多肽分子与比对的外源基因具有至少约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、约99%的同一性或相似性的氨基酸序列。但并不限于此。
本说明书中,基因、多核苷酸、多肽等的“表达”是指该基因等在体内受到一定的作用,成为其它形态。优选指基因、多核苷酸等被转录和翻译,成为多肽的形态,不过转录制成mRNA,这也是表达的一种形式。更优选所述多肽的形式可以在翻译后加工。
因此,本说明书中,基因、多核苷酸、多肽等“表达”的“减少”是指使本发明的因子作用时比不作用时,表达量显著减少。优选表达量的减少包括多肽的表达量的减少。更特定的地说,表达量减少是指与因子作用前相比,作用后的表达量至少减少约10%,更优选至少减少约20%,进一步优选至少减少约30%,还优选至少减少约40%,又优选至少减少约50%,又进一步优选至少减少约75%,更进一步优选至少减少约90%,再进一步优选减少几乎100%。本说明书中,基因、多核苷酸、多肽等“表达”的“增加”是指使本发明的因子作用时比不作用时,表达量显著增加。优选表达量的增加包括多肽的表达量的增加。更特定的地说,表达量增加是指与因子作用前相比,作用后的表达量至少增加约10%,更优选至少增加约20%,进一步优选至少增加约30%,还优选至少增加约40%,又优选至少增加约50%,又进一步优选至少增加约75%,更进一步优选至少增加约90%,再进一步优选增加越100%或以上,又再进一步优选增加约200%,或者作用前不表达的变得表达。
本说明书中,“氨基酸”可以是天然的也可以是非天然的。“氨基酸衍生物”或者“氨基酸类似物”是指与天然存在的氨基酸不同,但具有与氨基酸同样机能的物质。这样的氨基酸衍生物和氨基酸类似物是本领域所周知的。术语“天然氨基酸”是指天然氨基酸的L-异构体。天然的氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、甲硫氨酸、苏氨酸、苯丙氨酸、酪氨酸、色氨酸、半胱氨酸、脯氨酸、组氨酸、天冬氨酸、天冬酰胺、谷氨酸、谷氨酰胺、γ-羧基谷氨酸、精氨酸、鸟氨酸和赖氨酸。如无特别注明,本说明书中所指的所有氨基酸都为L构型,但使用D构型的形式也在本发明的范围内。术语“非天然氨基酸”是指蛋白质中在天然状况下不存在的氨基酸。非天然氨基酸的例子有正亮氨酸、对硝基苯丙氨酸、高苯丙氨酸、对氟苯丙氨酸、3-氨基-2-苄基丙酸、高精氨酸的D构型或L构型以及D-苯丙氨酸。“氨基酸类似物”是指虽然不是氨基酸,但与氨基酸的物性和/或机能类似的分子。氨基酸类似物例如有乙硫氨酸、刀豆氨酸、2-甲基谷氨酰胺等。氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构,但以与天然存在的氨基酸同样的方式发挥机能的化合物。
氨基酸的通常公知的三字母符号或者由IUPAC-IUB BiochemicalNomenclature Commission推荐的单字母符号的任何一种在本说明书中都有采用。核苷酸也同样,本说明书中采用了通常认可的单字母编码。
本说明书中“对应”的氨基酸或核酸是指在某种多肽分子或多核苷酸分子中,与作为比较基准的多肽或多核苷酸中规定的氨基酸或核苷酸具有或者推测具有同样的作用的氨基酸或核苷酸,特别是对于酶分子,是指存在于活性部位中同样位置,对催化活性具有同样的贡献的氨基酸。例如如果是反义分子,可以是与该反义分子的特定部分对应的直向同源基因中的的同样部分。所述“对应”的氨基酸或核酸可以是一定范围内的区或结构域。因此,这种情况在本说明书中被称为“对应”的区或结构域。
本说明书中,“对应”的基因(例如多肽分子或多核苷酸分子)是指在某个种中,与作为比较基准的种的规定基因具有或者推测具有同样的作用的其它种中的基因,对应基因间经常可见特定的氨基酸序列高度保守的区。其特征是它们在进化学上具有同一祖先,某种基因所对应的基因是该基因的直向同源基因。对应的基因包括同族基因。例如与水稻谷醇溶蛋白对应的小麦基因可以是小麦麦谷蛋白。所述对应的基因可采用本领域周知的技术进行鉴定。因此,对于例如某种生物中对应基因,可以使用作为对应基因的基准的基因(例如水稻的谷醇溶蛋白等基因)的序列作为查询序列,通过检索该生物(例如小麦、玉米等)的序列数据库来发现。
本说明书中的“核苷酸”可以是天然的也可以是非天然的。“核苷酸衍生物”或“核苷酸类似物”是指与天然存在的核苷酸不同,但具有与原有核苷酸同样机能的物质。所述核苷酸衍生物和核苷酸类似物是本领域所周知的。所述核苷酸衍生物和核苷酸类似物的例子包括硫代磷酸酯、亚磷酰胺、磷酸甲酯、手性磷酸甲酯、2-O-甲基核苷酸、肽-核酸(PNA),但并不限定于此。
本说明书中,“片段”是指相对于全长多肽或多核苷酸(长度为n),具有1至n-1的序列长度的多肽或多核苷酸。片段的长度可根据其目的适当改变,例如当为多肽时,其长度的下限可以是3、4、5、6、7、8、9、10、15、20、25、30、40、50和更多个氨基酸,这里未具体列举的整数所表示的长度(例如11等)也适合作为下限。当为多核苷酸时,其长度的下限可以是5、6、7、8、9、10、15、20、25、30、40、50、75、100和更多个核苷酸,这里未具体列举的整数所表示的长度(例如11等)也适合作为下限。如上所述,本说明书中,多肽和多核苷酸的长度可以分别以氨基酸或核酸的个数表示,但上述个数并不是绝对的,只要具有同样的机能,作为上限或下限的上述个数的含义包含该个数的上下数个(或者例如上下10%)。为了表现这样的含义,本说明书中,在个数的前面加写“约”来表现。但是应理解为,本说明书中“约”的有无并不影响对该数值的解释。
本说明书中的“生物学活性”是指某种因子(例如多肽或蛋白质)在生物体内可具有的活性,包括发挥各种机能的活性。例如某种因子是反义分子时,其生物学活性包括与作为对象的核酸分子结合,由此抑制表达等。例如某种因子为酶,则其生物学活性包括其酶活性。另外举一例子,当某种因子为配体时,包括与该配体所对应的受体的结合。所述生物学活性可通过本领域所周知的技术进行测定。
本说明书中的“反义活性”是指可特异性抑制或减少目标基因的表达的活性。更具体地说,是指通过使基因的mRNA量特异性降低,使蛋白表达量减少的活性,其中所述基因依赖于导入细胞内的某种核苷酸序列,具有与该序列互补的核苷酸序列区。导入方法可大致分为将与由目标基因制备的mRNA互补的RNA分子直接导入细胞的方法、和将可使与目标基因互补的RNA表达的构建载体导入细胞内的方法,植物中通常采用后一种方法。
反义活性通常通过与目标基因的核酸序列互补的、且具有至少具有8个连续的核苷酸长的核酸序列来实现。所述核酸序列优选为至少具有9个连续的核苷酸长、更优选具有10个连续的核苷酸长、进一步优选具有11个连续的核苷酸长、12个连续的核苷酸长、13个连续的核苷酸长、14个连续的核苷酸长、15个连续的核苷酸长、20个连续的核苷酸长、25个连续的核苷酸长、30个连续的核苷酸长、40个连续的核苷酸长、50个连续的核苷酸长的核酸序列。所述核酸序列包括与上述序列至少70%同源、更优选至少80%同源、进一步优选90%同源、95%同源的核酸序列。所述反义活性优选与目标基因的核酸序列的5’末端的序列互补。这样的反义的核酸序列也包括相对于上述序列,具有1个或几个或者1个或以上的核苷酸被取代、附加和/或缺失。因此,本说明书中,“反义活性”包括基因的表达量减少,但并不限定于此。
通常的反义技术在教科书中有记载(Murray,JAH eds.,AntisenseRNA and DNA,Wiley-Liss Inc,1992)。最新的研究发现了被称为RNA干扰(RNAi)的现象,带来了反义技术的进步。RNAi是将具有与目标基因同源的序列的、短双链RNA(20个碱基左右)导入细胞内,与该RNA序列同源的目标基因的mRNA被特异性分解,表达水平降低的现象。目前已知最初在线虫中发现的该现象是包括植物在内的生物中的普遍现象,经过与该RNAi同样的程序,使反义技术抑制目标基因的表达在分子水平的机理得到阐明。以往,都是构建表达载体,将与目标基因的核苷酸序列互补的一个DNA序列与适当的启动子连接,导入细胞内,在其控制下使人工mRNA表达。最近的认识是采用设计成在细胞内可以构建双链RNA的表达载体。基本结构是将与某一目标基因互补的一种DNA序列连接在一个启动子下,再将与其相同的序列逆向连接一条。由该结构基因转录的单链mRNA中,逆向连接的核苷酸序列部分存在互补性关系,彼此配对形成具有类似发夹状的二级结构的双链RNA的状态,根据RNAi的机理,它引起目标基因的mRNA分解。植物中已有在拟南芥中使用的例子的报告(Smith,NA等.,Mature 407.319-320,2000)。另外,最近有关于RNAi的研究概况的汇总(森田和吉田、蛋白质·核酸·酶47、1939-1945、2002)。这些文献所载整体内容作为参考援引到本说明书中。
本说明书中,“RNAi”是RNA干扰的简称,是指将象双链RNA(也称为dsRNA)这样的引起RNAi的因子导入细胞,由此同源的mRNA被特异性分解,基因产物的合成受到抑制的现象以及其中所采用的技术。本手中,RNAi以及根据情况引起RNAi的因子可同义使用。
本说明书中,“引起RNAi的因子”是指可引起RNAi的任何因子。本说明书中,相对于“基因”,“引起RNAi的因子”是指引起与该基因有关的RNAi,产生RNAi的效果(例如抑制该基因的表达等)。所述引起RNAi的因子例如有含有与目标基因的核酸序列的一部分具有至少约70%的同源性的序列或者在严谨条件下杂交的序列、含有至少10个核苷酸长度的双链部分的RNA或其变异体,但并不限于此。这里,该因子优选含有3’突出末端的DNA,更优选3’突出末端为2个核苷酸长度或以上的DNA(例如2-4个核苷酸长度的DNA)。
或者,本发明中所使用的RNAi例如有短的、反向互补的序列(例如为15bp或以上,例如为23bp等)对,但并不限定于此。
本说明书中,“反义基因”表示带来反义活性的基因以及构建体(表达盒)。同样,“RNAi基因”表示引起RNAi的基因以及构建体(表达盒)。“表达抑制基因”是“反义基因”和“RNAi基因”两者的总称。
本说明书中,作为生产外源基因的多肽的方法,例如可利用基因操作方法将编码该多肽的基因整合适当的表达载体,用该载体转化表达宿主,从该转化细胞的培养上清中获得重组多肽。上述宿主细胞只要是可使保持外源基因的至少一个生理活性的多肽表达即可,并没有特别限定,可以使用以往基因操作中利用的各种宿主细胞(例如除植物细胞外,还有大肠杆菌、酵母、动物细胞等)。来自这样得到的来自细胞的多肽只要与天然型多肽基本上具有相同的作用即可,氨基酸序列中的1个或以上氨基酸可以被取代、附加和/或缺失,糖链也可以被取代、附加和/或缺失。
某种氨基酸无需相互作用结合能力的明显降低或消失,即可在阳离子性区或底物分子的结合部位等的蛋白质结构中被其它氨基酸取代。规定某种蛋白质的生物学机能的是蛋白质的相互作用能力和性质。因此,特定氨基酸的取代可在氨基酸序列中或者在其DNA编码序列水平中进行,取代后可产生保持原有性质的蛋白质。因此,在不使生物学有效性遭受明显损失的前提下,可在本说明书中公开的肽或编码该肽的对应的DNA中进行各种改变。
设计上述改变时,可以考虑氨基酸的疏水性指数。蛋白质的相互作用产生生物学机能时,疏水性氨基酸指数的重要性通常已得到该领域的认可(Kyte.J和Doolittle,R.F.J.Mol.Biol.157(1)105-132,1982)。氨基酸的疏水性质产生了蛋白质的二级结构,并规定了该蛋白质与其它分子(例如酶、底物、受体、DNA、抗体、抗原等)的相互作用。各氨基酸根据其疏水性和电荷的性质测算其疏水性指数。它们是异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9);以及精氨酸(-4.5)。
某种氨基酸与具有同样疏水性指数的其它的氨基酸取代,可生成依然具有同样的生物学机能的蛋白质(例如酶活性中等效价蛋白质),这是本领域周知的。所述氨基酸取代中,优选疏水性指数在±2以内,更优选在±1以内,进一步优选在±0.5以内。依据疏水性,则上述氨基酸的取代效率高,这是本领域可理解的。
蛋白质的修饰中也要考虑亲水性指数。如美国专利第4,554,101号所记载,氨基酸残基亲水性指数如下精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-0.1);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5)和色氨酸(-3.4)。可以理解氨基酸与具有同样的亲水性指数的其它氨基酸取代,可以得到具有起始蛋白生物学活性的等价物。所述氨基酸取代中,优选亲水性指数在±2以内,更优选在±1以内,进一步优选在±0.5以内。
本发明中,“保守性取代”是指在氨基酸取代中,原有氨基酸与被取代的氨基酸的亲水性指数或/和疏水性指数如上所述地类似的取代。保守性取代的例子有例如亲水性指数或者疏水性指数都在±2以内的氨基酸之间、优选都在±1以内的氨基酸之间、更优选都在±0.5以内的氨基酸之间,但并不限定于此。因此保守性取代的例子是本领域技术人员周知的,例如以下各基团内的取代精氨酸和赖氨酸;谷氨酸和天冬氨酸;丝氨酸和苏氨酸;谷氨酰胺和天冬酰胺;以及缬氨酸、亮氨酸和异亮氨酸等,但并不限于此。
本说明书中,“变异体”是指原有的多肽或多核苷酸等物质的一部分变更。这样的变异体有取代变异体、附加变异体、缺失变异体、截短变异体、等位基因突变体等。等位基因是指属于同一基因座、互相不同的遗传变异体。因此,“等位基因突变体”是指对于某种基因存在等位基因关系的变异体。所述等位基因突变体通常具有与该对应的等位基因同一或类似性非常高的序列,通常还具有大致相同的生物学活性,但偶尔也具有不同的生物学活性。“物种同系物或同系物”是指某种中,与某种基因在氨基酸水平或核苷酸水平具有同源性(优选60%或以上的同源性、更优选80%或以上、85%或以上、90%或以上、95%或以上的同源性)的种。可从本说明书中明确获取所述物种同系物的方法。“直向同源”也称作直向同源基因,是指两个基因来自由共同祖先的种分化的基因。例如以具有多基因结构的血红蛋白基因家族为例,人和小鼠的α血红蛋白基因为直向同源,人的α血红蛋白基因和β血红蛋白基因为共生同源(因基因重复而产生的基因)。将作为半胱氨酸蛋白酶抑制剂的人抑半胱氨酸蛋白酶蛋白A和水稻的稻抑半胱氨酸蛋白酶蛋白进行比较,只有被认为与目标蛋白酶的相互作用中很重要的3处短氨基酸基序得以保留,其它部分的氨基酸的相似性非常低。但是,两者都属于抑半胱氨酸蛋白酶蛋白基因超家族,被认为具有共同的祖先基因,因此,并不仅限于全体氨基酸的同源性,只要局部存在具有高同源性的氨基酸序列,也可得到直向同源。这样,直向同源通常在其它种中也可以发挥与原有种同样的机能,因此本发明的直向同源在本发明中有用。本发明中,作为靶的谷醇溶蛋白形成具有很多成员的家族,这也可以称为是被保守性改变的变异体。
“保守性(改变的)变异体”适用于氨基酸序列和核酸序列两者。对于特定的核酸序列,保守性改变的变异体是指编码相同的或本质相同的氨基酸序列的核酸,核酸不编码氨基酸序列时,是指本质相同的序列。由于遗传密码的简并,很多机能性相同的核酸编码任意的规定的蛋白质。例如密码子GCA、GCC、GCG和GCU全都编码丙氨酸。因此,无需变更该密码子所编码的多肽,在由密码子特定为丙氨酸的所有位置上,记载的对应的密码子都可任意改变。这样的核酸的变化是保守性改变的突变的一种“沉默变异(突变)”。本说明书中所有的编码多肽的核酸序列都记载有该核酸的所有可能的沉默突变。本领域中,可理解为核酸中的各密码子(除了通常甲硫氨酸的唯一的密码子AUG,以及通常色氨酸的唯一的密码子TGG以外)都可为产生机能性相同的分子而改变。因此,编码多肽的核酸的各沉默突变暗含在所述各序列中。优选这样的改变避免了半胱氨酸的取代,这是因为半胱氨酸是对多肽的高级结构产生较大影响的氨基酸。上述碱基序列的修饰方法有通过限制酶等切断,通过DNA聚合酶、Klenow片段、DNA连接酶等进行连接等处理,使用合成寡核苷酸等进行的定点碱基取代法(特定位点定点突变法;Mark Zoller and Michael Smith,Methods inEnzymology,100,468-500(1983))。也可以通过其它通常的分子生物学领域所使用的方法进行修饰。
本说明书中,为了制备功能性等价的多肽,除氨基酸取代外,还可以进行氨基酸的附加、缺失或修饰。氨基酸的取代是指将原有的多肽用1个或以上,例如1-10个、优选1-5个、更优选1-3个氨基酸取代。氨基酸的附加是指在原有的多肽链上附加1个或以上,例如1-10个、优选1-5个、更优选1-3个氨基酸。氨基酸的缺失是指从原有的多肽中缺失1个或以上,例如1-10个、优选1-5个、更优选1-3个氨基酸。氨基酸修饰包括酰胺化、羧基化、硫酸化、卤化、烷基化、糖化、磷酸化、氢氧化、酰基化(例如乙酰化)等,但并不限于此。取代或附加的氨基酸可以是天然的氨基酸,也可以是非天然的氨基酸,或者还可以是氨基酸类似物。优选天然氨基酸。
本说明书中使用的术语“肽类似物”或者“肽衍生物”是与肽不同的化合物,但至少一种化学机能或生物学机能与肽等价。因此,肽类似物中也包括相对于原有的肽,有1个或以上的氨基酸类似物或氨基酸衍生物附加或取代。肽类似物可以进行附加或取代,使其机能与原有肽的机能(例如pKa值类似、官能团类似、与其它分子的结合方式类似、水溶性类似等)基本上同样。所述肽类似物可使用本领域中周知的技术来制备。因此肽类似物可以是含有氨基酸类似物的聚合物。
本说明书中,“多核苷酸类似物”、“核酸类似物”可以互换使用,是与多核苷酸或核酸不同的化合物,但至少一种化学机能或生物学机能与多核苷酸或核酸等价。因此多核苷酸类似物或核酸类似物包含相对于原有的肽,附加或取代有1个或以上的核苷酸类似物或核苷酸衍生物的物质。
本说明书中使用的核酸分子只要所表达的多肽与天然型多肽具有基本上相同的活性,则如上所述,该核酸序列的一部分可缺失或被其它碱基取代,或者也可以插入一部分其它的核酸序列。或者可以在5’末端和/或3’末端结合有其它核酸。另外还可以是与编码多肽的基因在严谨条件下杂交,编码与该多肽具有基本上相同的机能的多肽的核酸分子,这样的基因在本领域是公知的,可用于本发明中。
所述核酸可通过周知的PCR法得到,也可化学合成。这些方法中还可以组合定点诱变法、杂交法等。
本说明书中,多肽或多核苷酸的“取代、附加和/或缺失”是指相对于原有多肽或多核苷酸,分别取代、附加或去除氨基酸或其替代物,或者核苷酸或其替代物。上述取代、附加或缺失技术在本领域是周知的,该技术的例子有定点诱变技术等。取代、附加或缺失可以是一个或以上的任意数,只要可以在具有取代、附加或缺失的变异体中保持目标机能(例如激素、细胞因子的信息传递机能等),这样的数目可以是很大。例如这样的数目可以是1或数个,优选为全长的20%以内、10%以内,或者100个或以下、50个或以下、20个或以下等。
本说明书中,基因“特异性表达”是指该基因在植物的特定部位或时期,以不同于其它部位或时期(优选高)的水平表达。特异性表达可以是指只在某一部位(特异性部位)表达,也可以在除此以外的部位表达。优选特异性表达是只在某一部位表达。
本说明书中,基因“特异性抑制”是指该基因在植物的特定部位或时期,以不同于该部位或时期(优选高)的水平抑制。特异性表达可以是指只在某一部位(特异性部位)受到抑制,也可以在除此以外的部位受到抑制。优选特异性抑制是只在某一部位抑制。
本说明书中提及基因时,“载体”是指可以将目标多核苷酸序列移入目标细胞的物质。所述载体例如在原核生物细胞、酵母、动物细胞、植物细胞、昆虫细胞、动物个体和植物个体等宿主细胞中可自主复制,或可整合到染色体中,在适合本发明的多核苷酸转录的位置含有启动子的物质。本说明书中,载体可以是表达载体、重组载体等。
本说明书中,载体有在基因试验所采用的通常细菌(代表性的有来自大肠杆菌K12菌株的的大肠杆菌菌株)中可复制且可分离纯化的物质。这是构建导入植物的目标基因所必需的。具体来说,例如有大肠杆菌的pBR322质粒或pUC18、pUC19、pBluescript、pGEM-T等市售的构建质粒。电穿孔法、聚乙二醇法、基因枪法等将基因片段直接导入植物细胞进行转化时,可以使用上述市售的通常的质粒进行导入基因的构建。另外,载体的特殊例子有采用经由农杆菌的基因导入法转化植物细胞时,必须使用被称为“双元载体”的质粒,其中所述双元载体质粒具有相当于大肠杆菌和农杆菌两者的复制起始点、和表示可导入植物的边界区、来自T-DNA的边界序列(左边界和右边界)的核苷酸序列。例如有pBI101(Clontech公司售)、pBIN(Bevan,N.,Nucleic Acid Research 12,8711-8721,1984)、pBINPlus(van Engelen,FA等.,Tranegenic Research 4,288-290、1995)、pTN或pTH(FukuokaH等.,Plant Cell Reports 19,2000)、pPZP(Hajidukiewicz P等.,PlantMolecular Biology 25,989-994,1994)等,但并不限于此。除此之外,可在植物中利用的载体例如有烟草花叶病毒载体,但该类型的载体并不是将目标基因导入植物染色体,因此其用途被限定于无需将导入了基因的植物经由种子增殖的情况,不过也可以在本发明中使用。
本说明书中,“表达盒”表示人工构建基因的一个单位,该人工构建基因的单位是将某结构基因、调控其表达的启动子序列以及各种调控元件、使mRNA转录终止的终止子序列在宿主细胞中以结构基因可操作的状态连接而成的。代表性的有用于只选择导入了基因的宿主细胞的选择性标记(例如潮霉素抗性基因)表达盒,或者希望在宿主细胞内表达的有用蛋白基因的表达盒。要准备的表达盒的种类、结构和数量根据生物、宿主细胞、目的分别使用,其组合也是本领域技术人员所周知的。
本说明书中,“表达载体”定义为可含有一个或以上上述“表达盒”的“载体”。可以将要进行导入植物中的目标基因表达盒分别设置在各个载体上,也可以在一个载体上连接全部表达盒。本发明中使用的植物用表达载体可以是双元载体类型。并且该载体可以在含有要导入的目标基因表达盒的同时,还含有适合宿主植物的选择性标记(例如潮霉素抗性基因)表达盒。
本说明书中使用的选择性标记例如有潮霉素磷酸转移酶、突变型乙酰丁酸合成酶等,但并不限于这些。可在选择性标记表达盒的中使用的启动子有CaMV35S启动子及其变异启动子、遍在蛋白启动子等,终止子有Nos终止子、Tml终止子、10kDa谷醇溶蛋白终止子、13kDa谷醇溶蛋白终止子、16kDa谷醇溶蛋白终止子,但不限定于这些。
本说明书中,“终止子”是位于基因编码蛋白质的区的下游,与DNA转录成mRNA时的终止、Poly A序列的附加有关的序列。终止子有CaMV35S终止子、胭脂氨酸合成酶基因的终止子(Tnos)、烟草PR1a基因的终止子,但不限于这些。本发明中,只要可在植物中显示终止子活性,可以使用任何序列。
本说明书中,“启动子”是决定基因转录的起始位点,是DNA上直接调控转录频度的区域,是RNA聚合酶与其结合,起始转录的碱基序列。启动子的区通常大多在推定为蛋白质编码区的第一外显子上游约2kbp以内的区中被发现,因此如果使用DNA分析软件预测出基因组碱基序列中的蛋白质编码区,即可推定出启动子区。推定启动子区随结构基因而变化,通常位于结构基因的上游,但也不限定于此,也可存在于结构基因的中或下游。优选推定启动子区存在于第一外显子翻译起始点上游约2kbp以内,但不限于此,这之外也有启动子存在。优选本发明中使用可特异性表达的启动子。所述特异性启动子优选驱动贮藏蛋白的特异性表达的启动子,但不限定于此。更优选本发明中,启动子可使用来自贮藏蛋白(例如谷醇溶蛋白)的启动子,但不限定于此。在一个优选的实施方案中,可使用来自16kDa谷醇溶蛋白的启动子、来自13kDa谷醇溶蛋白的启动子、来自10kDa谷醇溶蛋白的启动子。有时终止子的选择会对表达强度产生影响,但通常根据以往的使用经验,即使所用启动子不同,也几乎都是使用NOS终止子。但是,在一个优选的实施方案中,本发明使用了来自谷醇溶蛋白(特别是10kDa谷醇溶蛋白)的终止子。该终止子的碱基序列长度短,没有象存在于多克隆位点上那样的限制酶切位点,可以与各种贮藏蛋白启动子、遍在蛋白启动子、肌动蛋白启动子、CaMV35S启动子组合使用,可获得可替代NOS终止子的来自新型植物(水稻)的通用终止子,在这点上值得留意。
本说明书中,提及基因的表达时,通常“部位特异性”是指生物(例如植物)的部位(例如为植物时的蛋白体、根、茎、干、叶、花、种子、胚乳、胚芽、胚、果实等)中的基因的表达的特异性。“时期特异性”是指生物(例如植物)的发育阶段(例如根据植物的生长阶段(例如形成蛋白体的特定时期、发芽后芽生长天数)),其基因表达的特异性,这样的特异性可通过选择适当的启动子来导入所希望的生物中。
本说明书中,本发明的启动子的表达为“组成型”的,这是指在生物的所有组织中,在该生物的生长幼年期或成熟期的任何一个时期,都以大致一定的量表达的性质。具体来说,在与本说明书的实施例同样的条件下进行RNA印迹分析时,例如在任意的时刻(例如两个时刻或以上(例如第5天和第15天))、在任何相同或对应的部位都可见表达,此时即是本发明中表达为组成型的定义。可以认为组成型启动子对于维持通常的生长环境中的生物稳定性发挥作用。本发明的启动子的表达是“应激(或刺激)应答性”是指施用生物体至少一个应激(或刺激)时,其表达量发生变化的性质。特别是,表达量增加的性质称为“应激(或刺激)诱导性”,表达量减少的性质称为“应激(或刺激)减少性”。“应激(或刺激)减少性”的表达是以正常时可见表达为前提的,是与“组成型”的表达相重复的概念。这些性质可如下确定从生物的任意部分提取RNA,通过RNA印迹分析来分析表达量,或者通过蛋白质印迹分析对所表达的蛋白质进行定量。通过使用具有该启动子诱导活性的刺激因子,用整合了应激(或刺激)诱导性启动子与编码本发明的多肽的核酸的载体转化的植物或植物的部分(特定的细胞、组织等)可以只在某种条件下降低贮藏蛋白,并同时伴随目标蛋白的表达。
本说明书中,“增强子”可以用于提高目标基因的表达效率。在植物中使用时,增强子例如优选含有CaMV35S启动子内上游一侧的序列的增强子区。增强子可以使用多个,也可以使用1个,或不使用。
本说明书中,“沉默子”是指具有抑制基因表达并使其静止的功能的序列。本发明中,沉默子只要具有其机能即可,可以使用任何沉默子,也可以不使用。
本说明书中,“可操作地连接”是指所需序列的表达于某种转录翻译调控序列(例如启动子、增强子等)或翻译调控序列的控制下。为了使启动子与基因可操作地连接,通常在紧邻该基因的上游设置启动子,但无需一定是相邻地设置。
本说明书中,将核酸分子导入细胞的技术可以是任何的技术,例如转化、转导、转染等。上述核酸分子导入技术是本领域周知且惯用的,例如刊登于Ausubel F.A等编著(1988)、Current protocols inMolecular Biology、Wiley、New York、NY;Sambrook J等(1987)Molecular CloningA Laboratory Manual,第二版和第三版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY、别册实验医学“基因导入&表达分析实验法”羊土社、1997等中。基因的导入可以采用RNA印迹分析、蛋白质印迹分析等本说明书中记载的方法或其它周知的惯用技术进行验证。
载体的导入方法只要是向细胞中导入DNA的上述方法即可,可以采用任何方法,例如有转染、转导、转化等(例如采用磷酸钙法、脂质体法、DEAE葡聚糖法、电穿孔法、基因枪法的方法等)、脂转染法、原生质球法[Proc.Natl.Acad.Sci.USA,84,1929(1978)]、醋酸锂法[J.Bacteriol.,153,163(1983)]、Proc.Natl.Acad.Sci.USA,75,1929(1978)中记载的方法。
本说明书中,“基因导入试剂”是指在基因导入方法中为了促进导入效率而使用的试剂。所述基因导入试剂例如有阳离子高分子、阳离子脂质、多胺系试剂、聚酰亚胺系试剂、磷酸钙等,但不限于此。转染时所使用的试剂的具体例子有由各种来源销售的试剂,例如有Effectene Transfection Reagent(cat.No.301425,Qiagen,CA),TransFastTM Transfection Reagent(E2431,Promega,WI),TfxTM-20Reagent(E2391,Promega,WI),Superfect Transfection Reagent(301305,Qiagen,CA),PolyFect Transfection Reagent(301105,Qiagen,CA),LipofectAMINE 2000 Reagent(11668-019,Invitrogencorporation,CA),JetPEI(×4)cone.(101-30,Polyplus-transfection,France)和ExGen 500(R0511,Fermentas Inc.,MD)等,但不限于此。
将本发明在植物中利用时,向植物细胞导入植物表达载体时可以采用本领域技术人员周知的方法,例如经由农杆菌的方法和直接导入细胞的方法。经由农杆菌的方法例如可使用Nagel等人的方法(Nagel等(1990)、Microbiol.Lett.,67,325)。该方法如下首先通过电穿孔法用适合植物的载体转化农杆菌,然后通过Gelvin等人(Gelvin等编著(1994)、Plant Molecular Biology Manual(Kluwer Academic PressPublishers))的方法向植物细胞中导入转化的脓杆菌。将植物表达载体直接导入细胞的方法有电穿孔法(参照Shimamoto等(1989)、Nature、338274-276;以及Rhodes等(1989)、Science、240204-207)、基因枪法(参照Christou等(1991)、Bio/Technology 9957-962)以及聚乙二醇(PEG)法(参照Datta等(1990)、Bio/Technology 8736-740)。这些方法是本领域周知的,可由本领域技术人员适当选择适合所转化的植物的方法。
导入了植物表达载体的细胞首先通过潮霉素抗性、卡那霉素抗性等抗药性来选择。然后通过本领域周知的方法再分化为植物组织、植物器官和/或植物体。还可由植物体获得种子。导入的基因的表达可通过RNA印迹法或PCR法来检测。还可根据需要,例如通过蛋白质印迹法来验证基因产物蛋白质的表达。
本发明在植物中特别有用,不过也可以利用在其它生物中。本发明所使用的分子生物学技术是本领域所周知且惯用的,例如在AusubelF.A等编著(1988)、Current protocols in Molecular Biology、Wiley、New York、NY;Sambrook J等(1987)Molecular CloningALaboratory Manual,第二版及其第三版,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY、别册实验医学“基因导入&表达分析实验法”羊土社、1997等中刊载。
本说明书中,“转化体”是指通过转化而制备的细胞等生命体的全部或一部分。转化体的例子有原核细胞、酵母、动物细胞、植物细胞、昆虫细胞等。转化体根据其对象的不同,也被称为转化细胞、转化组织、转化宿主等,本说明书中含有它们的所有形式,在特定的说明中特指特定的形式。
在进行转化的方法中,物理性方法有聚乙二醇法(PEG法)、电穿孔法、显微注射法、基因枪法。这些方法可适用于单子叶、双子叶两种植物体,有用性高。但是,聚乙二醇法和电穿孔法中,细胞壁成为障碍,因此必须使用原生质体,并且所导入的基因整合到植物细胞的染色体DNA中的频率低。另外,不使用原生质体而采用使用愈伤组织或组织的显微注射法则涉及到针的粗细、组织的固定等,困难较大。使用组织的基因枪法也有突变以嵌合体的形式出现等的问题。另外,通常这些物理方法所导入的外源基因容易以不完全的状态作为多拷贝的基因整合到核基因组中。已知外源基因以多拷贝导入,则该基因容易失活。
另一方面,利用生物导入分离基因的方法有农杆菌法、病毒载体法和近年来开发的使用花粉作为载体的方法。这些方法具有以下优势不使用原生质体而使用植物的愈伤组织、组织或植物体进行基因导入,因此无需长时间培养,另外不会受到体细胞克隆突变等的障碍。这其中,使用花粉作为载体的方法的实验例尚少,作为植物的转化方法,其未知的部分还有很多。病毒载体法具有所导入的基因在感染了病毒的植物体全体中扩散的优点,但只是在各细胞内扩增表达,不能保证传递给下代,以及无法导入长DNA片段。农杆菌法有无需将约20kbp或以上的DNA大幅重组即可导入染色体;导入的基因的拷贝数只有几个拷贝,较少;以及再现性高等很多优点。对于禾本科植物等的单子叶植物来说,它不是农杆菌的寄主,因此,外源基因导入禾本科植物时,以往是通过前述的物理性方法进行的。但是,近年来在单子叶植物水稻等已建立了培养系的植物中,也适用农杆菌法,因此目前当然优选使用农杆菌法。
由农杆菌法导入外源基因时,植物合成的乙酰丁香酮等低分子苯酚化合物与Ti质粒Vir区作用,T-DNA被从Ti质粒中切出,经过几个过程后整合到植物细胞的核染色体DNA中。双子叶植物中,植物本身具备合成上述苯酚化合物的合成机制,因此可通过叶片法等容易导入外源基因,再现性也高。而与此相对,单子叶植物中,植物本身不合成上述苯酚化合物,因此难以制备农杆菌的转化植物。但是,通过在农杆菌感染时添加乙酰丁香酮,现在也可以向单子叶植物导入外源基因了。
本发明中,转化体中,目标核酸分子(导入基因)可以导入也可以不导入染色体。优选目标核酸分子(导入基因)被导入染色体,更优选导入等位染色体双方中。
植物细胞有在以下本说明书中记载的细胞,例如有水稻、马铃薯、烟草、玉米、油菜、大豆、番茄、胡萝卜、小麦、大麦、黑麦、苜蓿、亚麻,除此之外还有木本植物(例如杨树)的细胞等。更优选植物细胞为水稻。水稻有粳稻种、籼稻种,但不限于此。一个优选的实施方案中,水稻可以是粳稻种。本说明书中,水稻品种例如有Nipponbare、Nihonmasari、金南风、农林22号、中生旭、Koshihikari、Akitakomachi、Dontokoi、Hinohikari、Mangetsumochi、Kaguramochi、Hakuchomochi、LGC-1、春阳、Hosetsuwaisei、Tetep、Basmati、IR8、Hyokumochi、Himenomochi、Koganemochi、Kazenokomochi等,但并不限定于此。另外的优选实施方案中,水稻可以是籼稻种。籼稻种的品种有Tetep、Basmati、IR8、湖南早等,但并不限定于此。重组载体导入植物细胞的方法只要是向植物细胞导入DNA的方法即可,如本说明书中在其它部分所述,可以使用任何方法,例如农杆菌(Agrobacterium)(日本特开昭59-140885、日本特开昭60-70080、WO94/00977)、电穿孔法(日本特开昭60-251887)、使用基因枪的方法(日本特许第2606856、日本特许第2517813)等。
本说明书中,“植物”是属于植物界的生物的总称,其特征是具有叶绿素、坚硬的细胞壁、丰富的永久性胚性组织的存在以及没有运动能力。代表性的植物是具有细胞壁的形成、叶绿素的同化作用的显花植物。“植物”包括单子叶植物和双子叶植物的任意种。优选的植物例如有水稻、小麦、玉米、大麦、高粱等属于禾本科的单子叶植物。更优选的植物是水稻。水稻有粳稻种、籼稻种,但不限于此。更优选水稻是粳稻种。本说明书中,水稻的品种例如有Nipponbare、Nihonmasari、金南风、农林22号、中生旭、Koshihikari、Akitakomachi、Dontokoi、Hinohikari、Mangetsumochi、Kaguramochi、Hakuchomochi、LGC-1、春阳、Hosetsuwaisei、Tetep、Basmati、IR8、Hyokumochi、Himenomochi、Koganemochi、Kazenokomochi等,但并不限定于此。籼稻种的品种有Tetep、Basmati、IR8、湖南早、Kasalath等,但并不限定于此。最优选例如象LGC-1那样改变为其它贮藏蛋白(例如谷蛋白、谷醇溶蛋白等)的表达降低的水稻在本发明中使用。优选的植物不限于作物,也包括花、树木、草、杂草等。如无其它特别标明,植物也指植物体、植物器官、植物组织、植物细胞和种子的任何一种。植物器官例如有根、叶、茎和花等。植物细胞的例子有愈伤组织和悬浮培养细胞。
禾本科植物的例子有属于稻(Oryza)、大麦(Hordenum)、黑麦(Secale)、甘蔗(Scccharum)、稗(Echinochloa)、或者玉米(Zea)的植物,例如包括水稻、大麦、黑麦、稗草、高粱、玉米等。
本发明的生产方法中所用的植物优选单子叶植物,更优选禾本科植物。进一步优选水稻。更进一步优选本发明的生产方法中所使用的植物为Nipponbare、Dontokoi、LGC-1、Hosetsuwaisei品种、Tetep、Basmati、Koshihikari、五百万石、Koganemochi、Kasalath。Nipponbare的基因组序列已经公开,因此可容易地把握基因所导入的染色体位置,因而优选。Dontokoi口感好,比Koshihikari矮,容易生产,因而优选。LGC-1对于谷溶醇蛋白反义操作更有效,因而优选。Hosetsuwaisei的植物体非常小(20cm左右),但种子是正常大小,可在培养室内生产,因而优选。Koshihikari是日本的主力品种,通过低蛋白化使口感等品质提高,因而优选。五百万石作为酿酒用米,需求低蛋白,因而优选。Koganemochi用作米饼点心等米加工制品,需求低蛋白,因而优选。Tetep、Basmati、Kasalath可在日本本州北陆地方以南的温带地区普遍栽培并获得种子,在一些实施方案中优选。
本说明书中,生物的“组织”是细胞的集合,并在该集合中具有一定的同样的作用。因此,组织可以是器官的一部分。器官内大多是具有同样功能的细胞,但也有具有微妙功能差异的细胞混在其中,本说明书中,组织只要是共有一定的特性即可,可以使各种细胞混杂。
本说明书中,“器官”具有一个独立的形态,1种或以上的组织组合,形成行使特定机能的结构体。植物中有愈伤组织、根、茎、干、叶、花、种子、胚芽、胚、果实、胚乳等,但不限于此。
本说明书中,“生物体”(或者当为植物时的“植物体”)是指在该领域内最广义地应用、且具有生命现象物体(或植物),具有以下代表性的特征具有细胞结构、增殖(自我再生产)、生长、调控性、物质代谢、修复能力等各种特性,通常以核酸担当的遗传和蛋白质担当的代谢有关的生长为基本属性。生物包括原核生物、真核生物(植物、动物等)等。本发明中生物优选为植物。本说明书中,优选所述植物体是育性。更优选所述植物体可产生种子。
本发明的结构基因构建体、因子(介质)、组合物和方法不仅在单子叶植物中,也有望在包括双子叶植物和动物的其它生物中发挥机能。
本说明书中,“转基因”是指特定的基因整合某生物中或者该被整合的生物(例如包括植物(水稻等))。
本说明书中,植物的栽培可通过本领域中公知的任意的方法进行。植物的栽培方法例如有“模型植物的实验说明——水稻·拟南芥编”细胞工学别册植物细胞工学系列4;水稻的栽培法(奥野员敏)28-32页、以及拟南芥的栽培法(丹羽康夫)33-40页(监修岛本功、冈田清孝),本领域技术人员都可容易地实施,因而本说明书中无需详述。例如拟南芥的栽培可以进行土培、岩棉培、水培的任何一种。在白色荧光灯(6000勒克斯左右)下,在长明条件下栽培,播种后约4周左右即最初开花,开花后16天左右种子成熟。每株可得40-50粒种子。种子的休眠期短,成熟种子干燥一周左右,在吸水后2-3天即可发芽。吸水、播种后在4℃低温处理2-4天,则发芽整齐统一。水稻的栽培只要是以土培进行,在10000勒克斯获以上的光照条件下生长。播种40天左右之后,通过短日照条件诱导抽穗,诱导抽穗后30天左右开花,开花后40天左右得到成熟种子。
植物细胞、植物组织和植物体的培养、分化和再生可采用本领域公知的方法和培养基。所述培养基例如包括Murashige-Skoog(MS)培养基、GaMborg B5(B)培养基、White培养基、Nitsch& Nitsch(Nitsch)培养基等,但并不是限定于此。这些培养基通常添加适量的植物生长调节剂(植物激素)来使用。
本说明书中,对于植物来说,使该植物“再分化”是指由个体的一部分复原为个体整体的现象。例如通过再分化,由细胞(叶、根等)等组织片形成器官或植物体。
将转化体再分化为植物体的方法是本领域周知的。所述方法有Rogers等.,Methods in Enzymology 118627-640(1986);Tabata等.,Plant Cell Physiol.,2873-82(1987);Shaw,Plant Molecular BiologyA practical approach.IRL press(1988);Shimamoto等.,Nature 338274(1989);Maliga等.,Methods in Plant Molecular BiologyAlaboratory course.Cold Spring Harbor Laboratory press(1995)等中记载的方法,但不限定于此。因此本领域技术人员可以根据目标转基因植物适当使用上述周知的方法进行再分化。这样得到的转基因植物中导入了目标基因,所述基因的导入可使用RNA印迹、蛋白质印迹分析等本说明书中记载的方法或其它周知的惯用技术确认。
本发明的贮藏蛋白等表达调控分析可通过使用DNA矩阵的基因分析方法进行。DNA矩阵在(秀润社编、细胞工学别册“DNA微矩阵和最新PCR法”)中有详尽的总结。另外最近使用DNA矩阵的植物分析也有了进展(Schenk PM等(2000)Proc.Natl.Acad.Sci.(USA)9711655-11660)。
DNA矩阵技术中所用的精细加工例如在Campbell,S.A.(1996.The Science and Engineering of Microelectronic Fabrication,OxfordUniversity Press;Zaut,P.V.(1996).Micromicroaraay FabricationaPractical Guideto Semiconductor Processing,Semiconductor Services;Madou,M.J.(1997).Fundamentals of Microfabrication,CRC 15Press;Rai-Choudhury,P.(1997).Handbook of Microlithography,Micromachining,& MicrofabricationMicrolithography)等,援引它们作为本说明书中相关部分的参考。
本发明的贮藏蛋白基因及其下游基因等的表达的调控也可以通过使用差异显示技术的基因分析来分析。
本说明书中,“差异显示(技术)”是用于检测或鉴定表达发生变化的基因的方法。该方法中,分别由2个或以上的样品制备cDNA,使用任意的引物对通过PCR进行扩增,然后通过凝胶电泳将生成的多个PCR产物进行分离,制图,然后根据各条带的相对信号强度变化来克隆表达发生变化的基因。
本发明中,根据本发明公开的内容,有望通过计算机建模提供药物。
在其它实施方案中,本发明包括作为对本发明的反义构建体调控活性有效性的筛选工具使用计算机定量构效关系(quantitativestructure activity relationship=QSAR)模型技术得到的化合物。这里,计算机技术包括由一些计算机制备的底物模板、药效基团以及本发明的活性部位的同源模型的制备等。最近,采用了CATALYSTTM药效基团法(Ekins等、Pharmacogenetics,9477-489,1999;Ekins等.、J.Pharmacol.&Exp.Ther.,28821-29,1999;Ekins等.、J.Pharmacol.&Exp.Ther.,290429-438,1999;Ekins等.、J.Pharmacol.&Exp.Ther.,291424-433,1999)和比较分子力场分析(comparative molecular fieldanalysis;CoMFA)(Jones等、Drug Metabolism & Disposition,241-6,1996)等,来表示通过体外得到的数据,将与某种物质相互作用的物质的通常的特性基团模型化的方法。本发明中计算机建模可使用分子建模软件(例如CATALYSTTM第4版(Molecular simulations,Inc.,SanDiega,CA)等)来进行。
在另一方面,本发明提供含有本发明的反义构建体的组合物。所述组合物可是农业用组合物。所述农业用组合物以满足日本农林水产省或其它国家监督机构所规定的规则的形式提供。所述农业用组合物还以解决了伦理问题的形式提供。
本发明作为农业用组合物提供配方时,该组合物中可含有农学上可接受的载体。所述载体可以使本领域公知的任意的物质。
所述适当的农学上可接受的因子有以下,但并不限于此抗氧化剂、防腐剂、着色剂、风味剂、稀释剂、乳化剂、悬浮剂、溶剂、填料、增容剂、缓冲剂、递药载体、稀释剂、赋型剂和/或农学佐剂。代表性的例子是本发明的农药组合物可以是将本发明的因子与1个或以上的生理学可接受的载体、赋型剂或稀释剂一起以组合物的形式施用。农药组合物中,所述载体可以是施用农药时的适当的水等。
适当的载体的例子有中性缓冲生理盐水、或者与血清白蛋白混合的生理盐水。优选该产物的配方是使用适当的赋型剂(例如蔗糖)制成冻干剂。可以根据需要含有其它标准的载体、稀释剂和赋型剂。其它组合物的例子含有pH7.0-8.5的tris缓冲剂或pH4.0-5.5的乙酸缓冲剂,它们还可含有山梨糖醇或其适当的替代物。还可以根据本发明的因子的相对溶解度选择该溶液的pH。
组合物中的溶剂可以具有水性或非水性的任何一种性质。并且其载体可以含有用于改变或保持配方的pH、容量渗透压摩尔浓度、粘性、澄明性、颜色、灭菌性、稳定性、等渗性、崩解速度或气味的配方材料。同样,为了改变或保持有效成分的释放速度,或者促进有效成分的吸收或渗透,本发明的组合物可以含有其它配方材料。
实施发明的最佳方式以下对本发明的优选实施方案进行说明。以下提供的实施方案是为了更好地理解本发明而提供的,应理解为本发明的范围并不限定为以下内容。因此本领域技术人员应当明白可参照本说明书的记载,在本发明的范围内进行适当改变。
第一方面,本发明提供编码谷醇溶蛋白多肽的核酸序列的反义分子。更具体地说,本发明提供一种核酸分子,该核酸分子含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少10个核苷酸长度、优选15个核苷酸长度的连续的核酸序列,或者与该核酸序列至少约70%、优选至少约80%、进一步优选至少约90%同源的核酸序列。所述序列可以含有1个或以上核苷酸的取代、附加或缺失。所述变异型序列只要可以发挥反义活性,可以比上述数值低。本发明人意外地发现通过提供所述核酸分子,可以抑制包括贮藏在植物种子中的贮藏蛋白的多基因族——谷醇溶蛋白基因群全体的表达,且不影响其它贮藏蛋白的表达,由此可实现种子蛋白质的降低。虽然并不希望受到现有理论的束缚,但通常某种种子蛋白的表达减少时,通过保持体内稳态的机构使其它蛋白的表达增加,以弥补该部分,从而使种子蛋白质总量不发生变化,这已是定论,在事实上谷蛋白表达受到抑制的品系中已证实该部分被分配给谷醇溶蛋白,其表达量显著增加,结果种子蛋白质总量几乎未变化。但是,本发明中,即使在低谷蛋白的品系中进行谷醇溶蛋白表达抑制,仍可保持低谷蛋白的特征,且球蛋白也没有显著增加,因此可以说是预想外的令人惊讶的成果。
在其它实施方案中,反义分子可以具有单纯逆向的部分序列,但也可以利用RNAi现象,利用两个类似的反向的部分序列,制成类似发夹的RNA结构。这样的序列可以完全相同,也可以是部分不一致的序列。为了促进反义分子的表达,优选使用10kDa谷醇溶蛋白启动子、13kDa谷醇溶蛋白启动子、谷蛋白B1启动子、遍在蛋白启动子等。另外,为了进行反义分子的表达控制,可以使用Nos终止子、13kDa谷醇溶蛋白终止子、10kDa谷醇溶蛋白终止子等。
在一个实施方案中,上述核酸分子具有反义活性。具体来说,所述反义活性例如表现在谷醇溶蛋白mRNA表达量的减少、谷醇溶蛋白多肽的表达量减少等,但不限于此。本发明中意外地发现通过将本发明的核酸分子提供给植物,不仅谷醇溶蛋白多肽的表达量减少,在种子中表达的蛋白质量也减少。该现象以往并未被发现过,并且也未见提示,可以说本发明取得了显著的成果。
在一个实施方案中含有上述与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个核苷酸长度的连续的核酸序列。更优选所述核酸序列是至少20个核苷酸长度的连续的、且具有至少25个核苷酸长度的连续的、且具有至少30个核苷酸长度的连续的、且具有至少40个核苷酸长度的连续的、且具有至少50个核苷酸长度的连续的、且具有至少60个核苷酸长度的连续的、且具有至少70个核苷酸长度的连续的、且具有至少80个核苷酸长度的连续的、且具有至少90个核苷酸长度的连续的、且具有至少100个核苷酸长度的连续的核酸序列。更优选所述核酸序列可以含有编码谷醇溶蛋白多肽的全长序列的互补序列。要发挥反义活性,通常提供15个核苷酸长度的连续的互补核酸序列即足够,为了更确实地发挥反义活性,优选提供更长的序列,例如至少20个核苷酸长度的或者至少30个核苷酸长度的连续的核酸序列。
在另一个实施方案中,本发明的核酸分子中所含的上述核酸序列可以是与编码谷醇溶蛋白多肽的核酸序列的5’末端互补的核酸序列。这是由于谷醇溶蛋白大多是与5’末端的同源性高的序列。另外,通过提供与所述5’末端的序列互补的核酸序列,从反应初期即阻碍基因的转录和/或翻译,这比提供非上述序列更可有效地阻碍基因的表达。不过,本发明中,只要具有反义效果,也可以使用与编码目标多肽的核酸序列的5’末端互补的核酸序列以外的序列。
本发明的核酸分子中所含的上述核酸序列只要来自谷醇溶蛋白即可,可以使用任何序列,优选使用水稻13kDa谷醇溶蛋白或来自与其对应的其它种的直向同源的序列。本发明中使用的谷醇溶蛋白可以是水稻的谷醇溶蛋白。优选上述谷醇溶蛋白是粳稻种水稻的谷醇溶蛋白。进一步优选上述谷醇溶蛋白是粳稻种的13kDa谷醇溶蛋白。最优选上述谷醇溶蛋白是RM9或RM1的谷醇溶蛋白。优选13kDa谷醇溶蛋白的理由是水稻种子所含的谷醇溶蛋白中,相当于13kDa谷醇溶蛋白的蛋白质的含量最多,因此使表达降低的效果更高。
在其它优选的实施方案中,本发明的核酸分子可含有与下述多核苷酸互补、且具有至少15个核苷酸长度的连续的核酸序列
(a)具有选自SEQ ID NO.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43和45所示的核酸序列或其片段序列的多核苷酸;(b)编码具有选自SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44和46所示的氨基酸序列的多肽或其片段的多核苷酸;(c)编码具有生物学活性的变异体多肽的多核苷酸,其中所述变异体多肽在选自SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44和46所示的氨基酸序列中,1或几个氨基酸具有选自取代、附加或缺失至少一种突变;(d)为含有选自SEQ ID NO.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43和45所示的核酸序列的DNA等位基因突变体的多核苷酸;(e)编码含有选自SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44和46所示的氨基酸序列的多肽的物种同系物或直向同系物的多核苷酸;(f)与(a)-(e)的任意一个多核苷酸在严谨条件下杂交、且编码具有生物学活性的多肽的多核苷酸;或者(g)含有与(a)-(e)的任意一个多核苷酸或其互补序列的同源性至少为70%的碱基序列,且编码具有生物学活性的多肽的多核苷酸。
更优选该核酸序列含有至少20个核苷酸长度、进一步优选至少30个核苷酸长度、最优选至少50个核苷酸长度的连续的互补部分。
优选的实施方案中,上述序列可以是SEQ ID NO.1或3、以及SEQID NO.2或4(分别对应RM9和RM10)。
第二方面,本发明提供一种核酸分子,该核酸分子含有来自编码谷醇溶蛋白多肽、且具有至少15个连续的核苷酸长度的核酸序列,或者与该具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。所述序列是有义序列,可用作担负RNAi的一部分的因子。所述序列以具有15个核苷酸长度这样短的链即可发挥表达抑制效果。
第三方面,本发明提供一种核酸分子,该核酸分子含有(A)核酸序列A,该核酸序列A含有来自编码谷醇溶蛋白多肽、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列;以及(B)核酸序列B,该核酸序列B含有具有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个连续的核苷酸长度的核酸序列,或者与该互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。在本说明书中,所述核酸分子也被称为RNAi核酸分子。这里,核酸序列A和核酸序列B也可以分别称为有义序列和反义序列。具有上述两种序列的核酸分子作为引起RNAi的因子发挥作用,结果,作为靶的谷醇溶蛋白的表达受到整体抑制,继而使种子蛋白质的表达量减少。对于其它的种子蛋白质没有发生这种情况,抑制谷醇溶蛋白的效果可以说是预想之外的。为什么这样说呢?因为以往在谷蛋白中,即使抑制其表达,其它的种子蛋白质或其它蛋白质在种子中的表达会相应增加,总蛋白质量不变化。因此,本发明带来的效果可以说是本领域技术人员预想外的效果。本发明的RNAi核酸分子中,相当于反义和有义序列相对于作为靶的谷醇溶蛋白的序列即使有15bp、优选23bp那样短的长度也可奏效。
优选的实施方案中,本发明的RNAi核酸分子中所含的核酸序列A和核酸序列B含有互相基本上互补的部分。通过A和B中含有这样互补的部分,使得RNAi的效果容易发挥。更优选该核酸序列A和核酸序列B互相基本上互补,进一步优选完全互补。虽然不希望用现有理论来束缚本发明,但基本上完全互补可提高RNAi的效果。
在一个实施方案中,本发明的RNAi核酸分子含有间隔序列,优选本发明的RNAi核酸分子中,核酸序列A和核酸序列B之间插入间隔序列。虽然不希望用现有理论来束缚本发明,但通过适当设置间隔序列可提高RNAi的效果。
优选的实施方案中,优选该间隔序列为内含子序列。内含子序列例如有γ珠蛋白、β肌动蛋白的内含子序列,但并不限于此。虽然不希望用现有理论来束缚本发明,但已知植物中,向基因的编码区中插入内含子,表达增强,另外可能在切除mRNA前体的内含子部分时,可促进立体结构的双链RNA的形成。
第四方面,本发明提供引起针对编码谷醇溶蛋白多肽的基因序列的RNAi因子。本发明的对谷醇溶蛋白的RNAi与其它RNAi相比,起到了使种子蛋白质显著减少和/或外源蛋白质显著强制表达的效果。RNAi因子可以是siRNA、shRNA等形式,本发明优选在核酸构建体中含有互补链的形式。虽然不希望用现有理论来束缚本发明,但这是由于在植物中,核酸构建体中含有互补链的形式比siRNA、shRNA更常用。
第五方面,本发明提供核酸盒,该核酸盒含有核酸序列B,所述核酸序列B含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少有15个连续核苷酸长度的核酸序列,或者与该互补的具有至少15个连续核苷酸长度的核酸序列至少约70%同源的核酸序列。
一个优选的实施方案中,本发明的核酸盒还含有编码外源基因的核酸序列。
外源基因只要是在使用本发明的核酸盒改变植物等时可以替代谷醇溶蛋白或种子蛋白质表达的基因即可,可以使用任何外源基因。
所述外源基因的例子有标记物(荧光物质、磷光物质等)、且具有医药活性的肽(例如细胞因子类(白细胞介素类、趋化因子类、GM-CSF、M-CSF、G-CSF、multi-CSF(IL-3)、EPO、LIF、SCF等造血因子、TNF、干扰素类、PDGF、EGF、FGF、HGF、VEG等)、激素类(胰岛素、生长激素、甲状腺激素等))、抗原疫苗、血液制剂、农业生产上有用的肽(例如抗细菌、抗虫、抗菌蛋白)、合成具有生理作用·药理作用的二次代谢产物的酶、调节酶促反应的抑制物、受体、受体配体、人工合成蛋白质、且具有营养学意义的物质(例如酪蛋白、豆类的白蛋白、球蛋白、维生素类·糖·脂质的合成酶)、与加工特性有关的蛋白质(例如小麦麦谷蛋白(面包加工)、大豆球蛋白群(豆腐)、乳酪蛋白群(干酪)等)、还有强化食品的适口性或功能性的蛋白质(例如环糊精、寡糖、γ氨基乙酸等特殊的糖·氨基酸类的合成酶类、改善外观的色素合成酶类、呈味蛋白质群以及味觉成分合成有关的蛋白质群、或其它人工蛋白质等),但不限于这些。
优选的实施方案中,本发明的核酸盒还含有核酸序列A,其中所述核酸序列A含有来自编码谷醇溶蛋白多肽、且具有至少15个连续核苷酸长度的核酸序列,或者与上述具有至少15个连续核苷酸长度的核酸序列至少约70%同源的互补的核酸序列。通过具有所述两种核酸序列A和核酸序列B,本发明的核酸盒可发挥RNAi作用。
本发明的核酸盒除核酸序列A和核酸序列B外,还可以含有间隔序列。虽然不希望用现有理论来束缚本发明,但通过含有间隔序列,使RNAi作用增强。关于所述间隔序列的选定,本领域技术人员可适当选择,可优选使用内含子。在核酸序列A和核酸序列B之间含有所述间隔序列、优选内含子序列则比较有利。虽然不希望用现有理论来束缚本发明,但这可能是在细胞内切除mRNA前体的内含子部分时,内含子序列的适当设置可以更有效地转换成引起RNAi作用的分子结构。
在另一优选的实施方案中,本发明的核酸盒可以含有信号序列。所述信号序列设置于外源基因的上游,优选设置在框内。所述设置进一步优选所述设置是在外源基因的翻译起始位点紧前边,这比较有利。通过含有信号序列,可以更有效地实现在所希望部位进行的外源基因的表达。
优选的实施方案中,本发明所使用的信号序列为贮藏蛋白的信号序列,这比较有利。根据信号序列的作用,贮藏蛋白被运送到内质网,由这里运往适当的蛋白体中,稳定且大量地蓄积。通过模仿该过程,设置于贮藏蛋白信号序列的下游的外源基因所编码的蛋白质可更高效地蓄积在种子中。
更优选该信号序列为谷醇溶蛋白信号序列,这比较有利。通过本说明书的实施例,可知在外源基因的表达中使用谷醇溶蛋白启动子更有效,因此结合使用该启动子时,更适合选用谷醇溶蛋白信号序列。谷醇溶蛋白信号序列例如有10kDa谷醇溶蛋白、13kDa谷醇溶蛋白、16kDa谷醇溶蛋白的信号序列,但不限于此。
所述信号序列的设置可以采用本领域中周知的技术来实现。例如信号序列的序列为公知的时,可含有所述序列进行PCR反应;当已经具有含有该信号序列的核酸分子时,通过切出目标序列,连接到所需位置,可以设置在所需位置上。
在其它实施方案中,本发明的核酸载体进一步含有启动子序列。通过具有所述启动子序列,可实现以下效果使本发明的谷醇溶蛋白抑制效果更有效,和/或使外源基因的表达更有效,或者可具有所需的特异性。启动子的设置也可以采用本领域周知的技术,本领域技术人员可任意进行。
优选启动子序列与外源基因和上述核酸序列B两者可操作地连接。这可以驱动或者诱导·增强两者的基因(外源基因和反义基因)的表达。优选分别与外源基因和核酸序列B两者可操作地连接,这比较有利。通过含有所述启动子,可以分别进行表达控制。
更优选的实施方案中,与本发明的核酸盒所使用的外源基因可操作地连接的启动子序列(启动子序列A)和与核酸序列B可操作地连接的启动子序列(启动子序列B)互相不同,这比较有利。通过这样的构成,可以避免一个启动子的基因表达能力被分散于谷醇溶蛋白的表达抑制和外源基因的高表达,使效率降低的风险。并且,可在进行谷醇溶蛋白的表达控制并确认后,再驱动外源基因的表达等,增加了控制方法的变化,可构建更有效的外源基因表达系统。
在另一实施方案中,本发明所使用的启动子序列B是在种子中表达的启动子序列,更优选在种子中以高水平表达的启动子序列。可以认为表达水平高的启动子可以更高效·有效地抑制谷醇溶蛋白的表达。所述在种子中以高水平表达的启动子序列例如来自贮藏蛋白质群(例如谷蛋白、球蛋白、谷醇溶蛋白)启动子、细胞的生命活动所必需的基因(多遍在蛋白、肌动蛋白等)启动子。为了实现对作为贮藏蛋白的一种的谷醇溶蛋白的有效的抑制,利用谷醇溶蛋白本身的启动子并不是必须条件,使用上述特定启动子也可以实现,这显示了本发明超出最初预想的结果。
更优选的实施方案中,本发明的启动子序列B来自贮藏蛋白启动子,与上述启动子A不同,这会更加有利。虽然不希望用现有理论来束缚本发明,但通过采取上述构成,本发明的核酸盒可有效控制外源基因和谷醇溶蛋白的抑制,使表达达到最佳。
本发明中使用的启动子序列B有多遍在蛋白、26kDa球蛋白启动子、谷蛋白A启动子、谷蛋白B启动子、16kDa谷醇溶蛋白启动子、13kDa谷醇溶蛋白启动子和10kDa谷醇溶蛋白启动子以及他们的变异体或融合物等,但不限于此。
在其它实施方案中,本发明中使用的启动子序列A来自贮藏蛋白启动子。贮藏蛋白启动子的表达特异地限定在种子且表达水平高。因而,通过使用特定的贮藏蛋白启动子(例如谷蛋白、球蛋白、谷醇溶蛋白)作为与外源基因连接的启动子,既可以避免外源蛋白质在植物体的其它部位随意表达,消耗能量的风险,也可以在种子内高效且高度表达。并且,与外源基因连接的启动子优选使用来自与作为抑制目标的贮藏蛋白(例如13kDa谷醇溶蛋白)相同种类的贮藏蛋白的启动子(例如SEQ ID NO.60)。其理由是有时为了打破表达抑制,目标贮藏蛋白的mRNA水平上升,因此可将该波及效果利用在外源基因的表达上。因此,启动子序列A可以是天然伴随核酸序列B的启动子。可优选使用来自13kDa谷醇溶蛋白以及10kDa谷醇溶蛋白的启动子作为启动子。虽然不希望用现有理论来束缚本发明,13kDa谷醇溶蛋白是多基因群,在谷醇溶蛋白中含量最多,另外在低谷蛋白品系等蛋白质突变水稻中具有表达最显著上升的特征。另一方面,10kDa谷醇溶蛋白是单基因在电泳图谱中得以证实,保证平常状态下的高表达量,另外在低谷蛋白品系等蛋白质突变水稻中具有表达最显著上升的特征。由以上可以认为来自上述的任何启动子活性都非常高,更有用。关于13kDa谷醇溶蛋白和10kDa谷醇溶蛋白的哪一种启动子更有利的判断,可以通过导入的原品种的特征和所表达的外源基因的特征来判断。
与本发明所使用的外源基因连接的启动子序列A有26K球蛋白启动子、谷蛋白A启动子、谷蛋白B启动子、16kDa谷醇溶蛋白启动子、10kDa谷醇溶蛋白启动子和13kDa谷醇溶蛋白启动子等,但不限于此。优选启动子序列A可使用谷醇溶蛋白启动子,更优选使用13kDa谷醇溶蛋白启动子以及10kDa谷醇溶蛋白启动子。
在一个实施方案中,本发明的核酸盒中,启动子序列A来自谷醇溶蛋白启动子,启动子序列B来自该谷醇溶蛋白启动子以外的启动子。所述组合的例子有13kDa启动子和10kDa启动子,但不限于此。
一个优选的实施方案中,本发明的核酸盒中,外源基因和启动子序列之间框内含有信号序列。
在另外的优选实施方案中,本发明的核酸盒含有终止子序列。通过终止子的适当设置,可适当控制表达。终止子序列优选为10kDa谷醇溶蛋白的终止子序列。关于10kDa谷醇溶蛋白的终止子序列至今尚未有实际利用数据,但与各种启动子组合,用于基因表达控制是由本发明首次公开的突出的成果。其为来自植物(水稻)的序列、且来自在适合本发明的主要对象器官种子中表达的基因,因此可以说比来自细菌的NOS终止子更优选。
在一个实施方案中,含有本发明的核酸盒中含有的外源基因,优选该外源基因存在于核酸序列A和核酸序列B的上游。虽然不希望用现有理论来束缚本发明,但可以认为具有通过采取所述设置,可以在确认谷醇溶蛋白的抑制后进行外源基因的表达等,但不限于此。
因此,本发明的优选的实施方案中,本发明的核酸盒在核酸序列A和核酸序列B之间含有间隔序列、优选含有内含子序列,这比较有利。这样可促进RNAi效果。
第六方面,本发明提供用于制备核酸盒的方法。该方法包括以下步骤A)提供核酸盒的步骤,该核酸盒是在含有核酸序列B和核酸序列A的一组核酸的上游具有可操作连接的启动子序列B,其中所述核酸序列B含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个连续的核苷酸长度的核酸序列,或者与与该互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列;所述核酸序列A含有来自编码谷醇溶蛋白多肽的核酸序列、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述具有至少15个连续互补的核苷酸长度的核酸序列至少约70%同源的核酸序列;外源基因设置于上述启动子序列B的上游或下游(优选上游但不限于此);启动子A与上述外源基因可操作地连接;B)使用上述核酸盒转化植物的步骤;以及C)在上述被转化的植物中选择谷醇溶蛋白表达量部分减少的植物的步骤。
所述制备方法中,优先选择具有使谷醇溶蛋白表达量更有效减少的活性的植物,因此本发明的核酸盒的制备效率以及利用本发明的便利性非常提高。
第七方面,本发明提供含有本发明的核酸分子的载体。因此,本发明的载体可以以含有上述核酸盒的载体的形式提供。
优选该载体可含有启动子序列等调控序列(元件)。调控序列例如有增强子、启动子、转录终止序列、转录起点、内含子序列等,但不限于这些。优选该载体还含有具有启动子活性的序列。
该具有启动子活性的序列优选是贮藏蛋白的启动子。如果是贮藏蛋白的启动子,则有望促进在种子中的转录活性。本发明并不拘泥贮藏蛋白的形式,任何的来自贮藏蛋白的启动子的序列都显示可用于表达谷醇溶蛋白的反义序列的活性。同时,来自谷醇溶蛋白的启动子序列比来自其它贮藏蛋白的启动子序列显示在反义序列活性方面更为有用。这是由本发明首次证明的突出成果。
更优选上述具有启动子活性的序列是可操作地连接的反义序列的来源结构基因的启动子。
优选的实施方案中,启动子与反义序列的来源植物为相同植物种起源。这是由于使用相同植物种起源的启动子有望更好地发挥机能。
本发明的载体优选进一步含有终止子。在另一实施方案中,本发明的载体进一步含有选择性标记。所述选择性标记可以是任何的标记,但从简便性考虑,优选赋予抗生素抗性的基因(例如潮霉素磷酸转移酶等)。使用含有选择性标记的载体时,极容易对使用本发明的反义构建体转化的植物细胞进行选择,但这并不是说必须有该选择性标记。
在另一实施方案中,本发明的载体可含有编码与反义序列不同的外源基因(例如GFP基因等标记基因或有用基因)的序列。所述外源基因可以是结构基因。所述外源基因可以表达期望大量表达的蛋白质。所述蛋白质例如有具有药物活性的肽(例如细胞因子类(白细胞介素类、趋化因子类、粒细胞-巨噬细胞集落刺激因子(GM-CSF)、巨噬细胞集落刺激因子(M-CSF)、粒细胞集落刺激因子(G-CSF)、multi-CSF(IL-3)、促红细胞生成素(EPO)、白血病抑制因子(LIF)、c-kit配体(SCF)等造血因子、肿瘤坏死因子(TNF)、干扰素类、血小板衍生生长因子(PDGF)、表皮生长因子(EGF)、成纤维细胞生长因子(FGF)、肝细胞生长因子(HGF)、血管内皮生长因子(VEG)等)、激素类(胰岛素、生长激素、甲状腺激素等))、抗原疫苗、血液制剂、农业生产上有用的肽例如抗菌蛋白、合成具有生理作用·药理作用的二次代谢产物的酶或水解酶、调节酶促反应的抑制物、被认为具有降血压效果作用的大豆球蛋白、或者在消化管内通过酶解、切取生理活性肽而设计的人工蛋白质,但不限于这些。另外还有具有营养学意义的物质,例如酪蛋白、豆类的白蛋白或球蛋白、或者维生素类·糖·脂质的合成酶,但不限于这些。以及作为各种加工食品的原料的与加工特性有关的蛋白质,例如小麦麦谷蛋白(面包加工)、大豆球蛋白群(豆腐)、乳酪蛋白群(干酪)等;还有强化食品的适口性或功能性的蛋白质,例如环糊精或寡糖、γ氨基乙酸等特殊的糖·氨基酸类的合成酶类;改善外观的色素合成酶或与味觉成分合成有关的蛋白质群、或在消化管内通过酶解、切取具生理活性肽(具有降血压效果作用的血管紧张肽转换酶抑制肽等)而设计的人工蛋白质等,但不限于这些。
优选所述外源基因与启动子可操作地连接。此时,可以使用任何启动子,优选来自贮藏蛋白的启动子。更优选所述启动子使用来自谷醇溶蛋白的启动子(10kDa谷醇溶蛋白启动子、13kDa谷醇溶蛋白启动子和16kDa谷醇溶蛋白启动子等)。
第八方面,本发明提供含有本发明的核酸分子的植物细胞。或者本发明还提供由本发明的载体转化的植物细胞。所述植物细胞可以由本发明的载体瞬时转导,也可以永久性地转化。本发明的植物细胞还可含有编码与本发明的反义构建体不同的外源基因的核酸分子。所述外源基因的例子如上所述。
优选本发明所利用的谷醇溶蛋白的来源植物种与本发明的植物细胞的植物种可以是同种或不同种。优选两者的植物种是同种。两者植物的品种可以是同一品种也可以是不同品种。优选两者的植物品种是同一品种。优选本发明的谷醇溶蛋白的来源植物种和/或植物细胞的来源植物种是水稻。更优选本发明的谷醇溶蛋白的来源植物种和/或植物细胞的来源植物种是粳稻种或者籼稻种的水稻。
优选的实施方案中,本发明的植物细胞中,本发明的核酸分子可导入等位染色体,只导入一侧的核酸分子也有用。
第九方面,本发明提供含有本发明的多核苷酸或载体的植物组织。本发明还提供含有本发明的核酸分子的植物组织。所述植物组织或核酸分子可以是上述优选的形式。
因此,本发明提供含有本发明的多核苷酸或载体的植物组织(或者生物体的一部分、部位等)。所述植物的组织例如有种子或来自种子的部分。因此,只要是可形成的组织蛋白体则可使用任何组织。优选本发明的组织可以是由本发明的多核苷酸或载体转化的组织。本发明的组织可以由本发明的多核苷酸或载体瞬时转化,也可以永久性转化。通过所述转化倒入的本发明的多核苷酸可组成型或特异性表达。
第十方面,本发明提供含有本发明的核酸分子的植物体。通过提供所述植物体,可以生产含低蛋白质的种子。该植物体优选为水稻。该植物体还可含有编码与本发明的反义构建体不同的外源基因的核酸分子。所述植物在本说明书中也被称为转基因植物,可以采用本领域周知的技术,从本发明的植物细胞或组织中再分化(再生)得到。
如果得到了由所需多核苷酸(例如本发明的多核苷酸或载体)转化的细胞(例如植物细胞),则可以以一定的比例或以上从所述转化细胞获得含有所需多核苷酸的转基因生物(例如植物),这是本领域所周知的。因此,只要其细胞可用于转化的生物,都可用作生产本发明的含有多核苷酸或载体的转基因生物。
所述转基因生物的制备方法是本领域所周知的。本发明的生物为植物时,转基因植物可如下制备例如使由本发明的多核苷酸或载体转化的细胞增殖,形成组织或器官,将其再分化,即可形成植物体。所述组织或器官可以是任何的组织或器官,例如有愈伤组织、根、茎等,但不限于此。植物的任何器官基本上都具有全能性,因此只要是含有本发明的多核苷酸或载体的器官或组织,任何组织或器官都可用于进行植物体的再分化。本发明为木本植物时,利用本说明书中记载的内容即可制备转基因植物。
本发明的植物体中,谷醇溶蛋白的来源植物种与上述植物体的中可以为同种也可以为不同种。优选两者为同种。此时,该两种可以是同一品种也可以是不同品种。优选两者为同一品种。
优选的实施方案中,本发明的植物体的植物种和/或谷醇溶蛋白的来源植物种为水稻。更优选两者的植物种都为粳稻种水稻。该水稻优选LGC-1。
优选的实施方案中,本发明的植物体中,本发明的核酸分子可导入两侧的等位染色体,只导入一侧的核酸分子也有用。
第十一方面,本发明提供由本发明的植物体生产的种子。此时,本发明的植物体含有本发明的反义构建体时,该种子的蛋白质含量(特别是谷醇溶蛋白)显著降低。因此,可以理解将所述种子用于食用时,在优选的蛋白质的用途中,本发明的种子特别有用。本发明的植物体还含有编码外源基因的核酸分子时,可见所述外源基因所编码的多肽的表达明显。因此本发明的种子可用作有用蛋白质的生产装置(生物反应器)。
本法明还提供由本发明的种子制备的淀粉制备物。所述淀粉制备物中,包括谷醇溶蛋白等贮藏蛋白的蛋白质含量显著减少。因此,所述淀粉制备物可在优选低蛋白的用途中利用。
当生产本发明的种子的植物含有编码外源基因的核酸分子时,本发明的淀粉制备物含有钙外源基因所编码的多肽。所述多肽可以是有用蛋白质,因此,所述淀粉制备物优选作为该有用蛋白质的原料,或者用于提供添加有该有用蛋白或来自该有用蛋白的机能的二次代谢产物的食品。
本发明提供一种组合物,该组合物含有由本发明的植物体或本发明的种子生产的外源基因的基因产物。通过使用本发明的系统,可以在食用部分中高效生产所述外源基因的基因产物,因此非常优选作为食用,作为营养辅助剂、农药、化妆品、药物或作为其它用途使用。
第十二方面,本发明提供在植物中减少种子中的蛋白质表达量的方法。该方法包括以下步骤A)提供本发明的核酸分子的步骤;B)将上述核酸分子导入上述植物细胞的步骤;C)将上述细胞再分化,制备转基因植物的步骤;以及D)由上述转基因植物获得种子的步骤。这里,提供本发明的核酸分子的技术是本领域所周知的,可理解为使用任何技术都可以提供本发明的核酸分子。将核酸分子导入植物细胞的技术也是本领域所周知的,该技术在本发明援引的文献等中有充分的记载。核酸分子向植物细胞的导入可以是瞬时也可以是永久性。瞬时或永久性的基因导入技术分别是本领域所周知的。使本发明所使用的细胞分化,制备转基因植物的技术也是本领域所周知的。该技术在本发明援引的文献等中有充分的记载。由转基因植物获得种子的技术也是本领域所周知的,该技术在本发明援引的文献等中有充分的记载。
因此,如上所述,可以采用周知的技术实施使本发明的种子中的蛋白质的表达量减少的方法。
本发明所使用的基因导入技术只要是本领域的公知技术,可以采用任何的技术。优选的实施方案中,本发明所使用的基因导入步骤采用了农杆菌法。
优选的实施方案中,本发明的植物中,使种子中的蛋白质表达量减少的方法还包含E)选择导入了本发明的核酸分子的植物细胞的步骤。通过包含该步骤,可以更有效地使基因导入植物生长,但本发明的实施中,不一定必须选择。所述选择方法根据所导入的核酸分子的特性变化,例如导入抗生素(例如潮霉素、卡那霉素等)抗性基因时,可以使用该特定的抗生素来选择目标细胞。或者使用标记基因(例如绿色荧光蛋白等),以该标记为参照,可以选择目标细胞。
第十三方面,本发明提供外源基因在植物种子中表达的方法。该方法包括以下步骤A)提供本发明的核酸分子的步骤;B)提供编码上述外源基因的核酸分子的步骤;C)将上述核酸分子和编码上述外源基因的核酸分子导入上述植物细胞的步骤;D)将上述细胞再分化,制备转基因植物的步骤;以及E)由上述转基因植物获得种子的步骤。这里,提供本发明的核酸分子和编码外源基因的核酸分子的技术是本领域所周知的,可理解为使用任何技术都可以提供本发明的核酸分子。这两种核酸分子可以一起提供,也可以分别提供。优选可在同一载体中提供两者。通过在同一载体中提供两者,可以将该核酸分子一次性导入植物细胞。
将核酸分子导入植物细胞的技术也是本领域所周知的,该技术在本发明援引的文献等中有充分的记载。核酸分子向植物细胞的导入可以是瞬时也可以是永久性。瞬时或永久性的基因导入技术分别是本领域所周知的。使本发明所使用的细胞分化,制备转基因植物的技术也是本领域所周知的。该技术在本发明援引的文献等中有充分的记载。由转基因植物获得种子的技术也是本领域所周知的,该技术在本发明援引的文献等中有充分的记载。
在本发明的外源基因的表达方法中使用的基因导入技术只要是本领域公知的技术,可以使用任何技术。优选的实施方案中,本发明所使用的基因导入步骤采用了农杆菌法。本发明的反义构建体和编码外源基因的核酸分子分别被导入所提供的细胞时,向细胞的导入可以分别采用相同的方法,也可以以不同的方法进行。
优选的实施方案中,本发明的植物中,使种子中的蛋白质表达量减少的方法还包含F)选择导入了本发明的核酸分子的植物细胞的步骤。通过包含该步骤,可以更有效地使基因导入植物生长,但本发明的实施中,不一定必须选择。所述选择方法根据所导入的核酸分子的特性变化,例如导入抗生素(例如潮霉素、卡那霉素等)抗性基因时,可以使用该特定的抗生素来选择目标细胞。或者使用标记基因(例如绿色荧光蛋白等),以该标记为参照,可以选择目标细胞。或者当外源基因本身在表现型上产生有可识别的差异时,也可以以该差异为参照选择基因导入细胞。所述可识别的差异例如有无色素表现等,但不限于此。
本发明的外源基因的表现方法还进一步优选包括G)由上述种子分离上外源基因的基因产物的步骤。
所述基因产物的分离技术使本领域所周知的,只要是可分离基因产物(蛋白质或mRNA等)的技术即可,可以采用任何技术。因此,为了从本发明的转化体的培养物中分离或纯化象本发明的外源基因的基因产物这样的多肽,可以采用本领域周知常用的蛋白质分离或纯化方法。例如本发明的多肽被分泌到本发明的转化体的细胞外时,通过离心等方法处理该培养物,获得可溶性组分。通过溶剂萃取法、硫酸铵等的盐析法脱盐法、有机溶剂沉淀法、二乙基氨基乙基(DEAE)-琼脂糖、使用DIAION HPA-75(三菱化学)等树脂的阴离子交换色谱法、使用S-Sepharose FF(Pharmacia)等树脂的阳离子交换色谱法、使用丁基琼脂糖、苯基琼脂糖等树脂的疏水层析法、使用分子筛的凝胶过滤法、亲和层析法、层析聚焦法、等电点电泳等电泳法等方法,可由该可溶性组分中获得纯化标准品。
本发明的外源基因的基因产物等多肽在本发明的转化体的细胞内以溶解状态蓄积时,通过对培养物离心,可以收集培养物中的细胞,将该细胞洗涤,然后通过超声波粉碎机、弗氏细胞破碎仪、Manton-Gaulin匀浆器、dieno磨等破碎细胞,得到无细胞提取液。将该无细胞提取液离心,得到上清,通过溶剂萃取法、硫酸铵等的盐析法脱盐法、有机溶剂沉淀法、二乙基氨基乙基(DEAE)-琼脂糖、使用DIAIONHPA-75(三菱化学)等树脂的阴离子交换色谱法、使用S-SepharoseFF(Pharmacia)等树脂的阳离子交换色谱法、使用丁基琼脂糖、苯基琼脂糖等树脂的疏水层析法、使用分子筛的凝胶过滤法、亲和层析法、层析聚焦法、等电点电泳等电泳法等方法,可由上述上清中获得纯化标准品。
本发明的外源基因的基因产物等多肽在细胞内形成不溶物并表达时,同样地回收细胞,然后破碎,进行离心,从由此得到的沉淀组分中按照通常的方法回收该多肽,将该多肽的不溶解物用多肽改性剂使其可溶解。将该溶解液稀释成不含多肽改性剂或者多肽改性剂的浓度为不会使多肽改性的程度,制成稀薄的溶液,或者进行透析,使本发明的多肽构成正常的立体结构,然后可通过与上述同样的分离纯化方法得到纯化标准品。另外,当蓄积在细胞内特定的细胞器例如蛋白体时,可以将该细胞器分离,然后纯化蛋白质。
可以按照通常的蛋白质的纯化方法(J.Evan.Sadler等Methods inEnzumology,83,458)进行纯化。例如以与其它蛋白质融合形成融合蛋白的形式生产如本发明的外源基因的基因产物的多肽,使用与融合的蛋白具有亲和性的物质,利用亲和层析进行纯化[山川彰夫,实验医学(Experimental Medicine),13,469-474(1975)]。例如按照Lowe等人的方法(Larsen等.,Proc.Natl.Acad.Sci.,USA,86,8227(1989)、Kukowska-Latallo JF、Genes Dev.,4,1288(1990)),以与蛋白A形成融合蛋白的形式生产本发明的多肽,可用过使用免疫球蛋白G的亲和层析纯化。
还可以以与FLAG肽形成融合蛋白的形式生产本发明的多肽,可通过使用抗FLAG抗体的亲和层析纯化(Larsen等.,Proc.Natl.Acad.Sci.,USA,86,8227(1989)、Kukowska-Latallo JF、Genes Dev.,4,1288(1990))。
还可以使用抗本发明的多肽自身的抗体,通过亲和层析纯化。本发明的多肽可按照公知的方法[J.Biomolecular NMR,6,129-134、Science,242,1162-1164、J.Biochem.,110,166-168(1991)],用体外转录·翻译系统进行生产。
本发明提供由本发明的方法生产的含有外源基因的基因产物的组合物。所述组合物所含有的基因产物根据所使用的外源基因而变化,优选为蛋白质。
第十四方面,本发明涉及本发明的核酸分子在减少植物的种子中的蛋白质表达量的过程中的应用。
第十五方面,本发明涉及本发明的核酸分子在使外源基因在植物种子中表达过程中的应用。这里,优选在外源基因表达的植物种子中,植物的天然蛋白质表达降低。天然蛋白质表达降低,则目标外源基因的基因产物(特别是蛋白质)的表达变得明显高效。
在上述各应用中,应理解关于各要素,本说明书中详细说明的优选实施方案可以直接适用。
以下根据实施例对本发明进行说明,但以下实施例仅供例示。因此,本发明的范围并不受上述发明的详细说明或下述实施例限定,只受专利的权项范围限定。
实施例(实施例1反义构建体的制备)本实施例中,作为本发明的示例,构建了以下的反义构建体,即,将以下所示的反义序列与以下所示的启动子组合的反义构建体。以后如无特别说明,将以降低谷醇溶蛋白为目的的反义构建体称为“LP基因或LP盒”,将导入该“LP基因或LP盒”的重组水稻品系称为“LP品系”,将含量最大的13kDa谷醇溶蛋白得以降低的品系称为“LP13K品系”。关于导入品种,将Nipponbare标记为H,将LGC-1标记为LG,其它品种直接标记。例如“H-LP13K”表示“导入LP基因,谷醇溶蛋白低的Nipponbare”。
启动子序列A)来自水稻10kDa谷醇溶蛋白基因的序列(SEQ ID NO.47)B)来自水稻谷蛋白B1基因的序列(SEQ ID NO.48)C)来自CaMV35S基因的序列(SEQ ID NO.49)反义序列A)编码13kDa谷醇溶蛋白的全长cDNA(SEQ ID NO.1)的反义序列(SEQ ID NO.50)B)编码13kDa谷醇溶蛋白的cDNA的N末端67bp的反义序列(SEQ ID NO.51)C)编码13kDa谷醇溶蛋白的cDNA的N末端15bp的反义序列(SEQ ID NO.52)D)对照序列(SEQ ID NO.52)反义构建体的构建如下进行。
使用含有CaMV35S启动子(SEQ ID NO.49)、潮霉素碱性磷酸酶(SEQ ID NO.54)和Nos终止子(SEQ ID NO.55)盒作为具有潮霉素抗性的盒,用于筛选上述组合的序列和转化水稻。
由此以下的表达载体构建都使用大肠杆菌JM109,按照分子生物学实验的常规方法进行。
在一系列的基因构建操作之前,为了使构建过程高效进行,进行了为了提高构建过程的效率的突变载体的构建。
图1所示的是使用pUC19作为双元载体pPZP202(Plant Molecular Biology 25,989-994,1994)、用于构建的支持质粒,但也可以将其它的双元载体或质粒进行同样的改变。过程总结如下以两个原始的载体pUC19和双元载体pPZP202(Plant Molecular Biology 25,989-994,1994)为基础,参考本领域公知的(Transgenic Research 4,288-290页,1995)方法,构建导入了8碱基识别位点AscI和PacI的突变载体pUC198AP、pUC198AA、pUC198PP和pPZP2028。用同样的方法,又构建了具有各1个Asc I和可与其连接的6碱基识别酶MluI的位点的pUC198AM。另外,由筛选标记基因HPT基因制备了通过指定位点转换使其内部的EcoRI、PstI、NcoI位点消除的变异基因mHPT(氨基酸SEQ ID NO.56),并与CaMV35S启动子和nos终止子以不被限制酶切断的方式连接,构建筛选标记表达盒(碱基SEQ ID NO.57)。依然以不被限制酶切断的方式将其导入pPZP2028,构建pZH2B。另外,对于水稻多遍在蛋白启动子片段,依然通过指定位点转换使存在于序列中的XbaI、EcoRI、PacI、XhoI消除,构建变异水稻多遍在蛋白启动子(mRUbiP、SEQ IDNO.58)。以后的实施例均使用这些质粒进行。
具体的表达载体结构的例子如图2所示。首先将终止子与pZH2B载体的SacI-EcoRI连接,接着将启动子与HindIII-XbaI连接。反义基因片段连接在XbaI-SacI位点之间。RNAi型的双链RNA表达载体如下构建SacI-EcoRI上连接nos终止子,HindIII-XbaI上连接突变水稻多遍在蛋白启动子,然后将两侧附加有图2所示的限制酶切位点(5’一侧XbaI和BglII,3’一侧为SpeI和BamHI)的GUS基因片段(SEQID NO.59)或水稻天冬氨酸蛋白酶基因内含子序列(SEQ ID NO.97)与XbaI-BamHI连接,构建基本的RNAi表达载体。然后选择1种要进行抑制的适当的谷醇溶蛋白,与XbaI或BglII其中之一、SpeI或BamHI其中之一逆向连接,由此完成RNAi型的双链RNA表达载体的构建。
是否构建了目标反义表达载体,这可使用使各片段扩增的PCR引物,进行PCR和/或DNA序列的确定,由此确认。
载体在-20℃保存,直至在以下实施例中使用。
(实施例2使用反义构建体进行水稻转化)使用实施例1中制备的含有反义构建体的载体,转化水稻的2个品种(Nipponbare和LGC-1),生产转基因水稻。Nipponbare作为水稻的代表性品种使用。LGC-1是Nihonmasari的放射线诱变的水稻品种,种子中的谷蛋白量大幅降低,谷醇溶蛋白增加,因此用于更明确地确认本发明对谷醇溶蛋白的影响。
其具体顺序如下。
首先将图2所示的各反义谷醇溶蛋白基因表达载体通过电穿孔导入农杆菌EHA101中,将保有载体的菌在含有100mg/L壮观霉素的LB琼脂培养基上筛选。农杆菌感染之前,将Raineri等人的方法(Raineri DM.,Bio/Technology 8,33-38,1990)进行部分改变并实施,感染后的培养操作和培养基按照Toki等人的方法(Toki.S.,PlantMoleular Biology Reporter 15,159-164,1997)。关于用Toki等人的方法不能获得转化水稻的品种,可按照Fukuoka H等人的方法(FukuokaH等.,Plant Ceu Reports 19,915-820,2000)所述的培养基组成进行。
简单地描述顺序。如无特别说明,水稻细胞在28℃下培养。另外,培养基的基体采用0.4%浓度的gellite(和光纯药)。将脱壳的水稻种子置于70%乙醇中,接着浸泡于氯有效浓度为2%左右的次氯酸中进行灭菌,用足够多的无菌水洗涤后,播于含有2mg/L 2,4-D的愈伤组织诱导培养基(2830mg/L KNO3、460mg(NH4)2SO4、166mg/LCaCl2·2H2O、185mg/L MgSO4·7H2O、400mg/L KH2PO4、27.8mg/LFeSO4·7H2O、37.3mg/L EDTA-2Na、4.4mg/L MnSO4·4H2O、1.5mg/LZnSO4·7H2O、0.8mg/L KI、1.6mg/L H3BO3、0.5mg/L烟酸、1.0mg/L盐酸硫胺素、0.5mg/L盐酸吡哆素、2mg/L甘氨酸、100mg/L肌醇、2.88g/L脯氨酸、300mg/L水解酪蛋白氨基酸、30g/L蔗糖、pH=5.8)上并培养。5天后,直接回收所播种子,将保有导入目标基因的农杆菌悬浮于AAM培养基(10mg/L MnSO4·4H2O、3mg/L H3BO3、2mg/LZnSO4·7H2O、0.25mg/L Na2MoO4·5H2O、0.025mg/L CuSO4·5H2O、0.025mg/L CoCl2·6H2O、150mg/L CaCl2·2H2O、250mg/LMgSO4·7H2O、40mg/L Fe-EDTA、150mg/L NaH2PO4·2H2O、1mg/L烟酸、10mg/L盐酸硫胺素、1mg/L盐酸吡哆素、100mg/L肌醇、174mg/L L-天冬酰胺、7.5mg/L甘氨酸、pH=5.2),形成菌液(浓度调节为OD 600=0.03左右),将上述种子置于其中2分钟,用灭菌纸巾吸去水分,播于含有2mg/L 2,4-D的共存培养基(2830mg/L KNO3、460mg(NH4)2SO4、166mg/L CaCl2·2H2O、185mg/L MgSO4·7H2O、400mg/LKH2PO4、27.8mg/L FeSO4·7H2O、37.3mg/L EDTA-2Na、4.4mg/LMnSO4·4H2O、1.5mg/L ZnSO4·7H2O、0.8mg/L KI、1.6mg/L H3BO3、0.5mg/L烟酸、1.0mg/L盐酸硫胺素、0.5mg/L盐酸吡哆素、2mg/L甘氨酸、100mg/L肌醇、10g/L葡萄糖、300mg/L水解酪蛋白氨基酸、30g/L蔗糖、pH=5.2)。在25℃暗处培养3天后,用足够多的无菌水洗涤,最后置于含有500mg/L的羧苄青霉素的无菌水中5分钟。这样,将完全除去了农杆菌的种子在以50mg/L的浓度含有潮霉素的筛选培养基(2830mg/L KNO3、460mg(NH4)2SO4、166mg/LCaCl2·2H2O、185mg/L MgSO4·7H2O、400mg/L KH2PO4、27.8mg/LFeSO4·7H2O、37.3mg/L EDTA-2Na、4.4mg/L MnSO4·4H2O、1.5mg/LZnSO4·7H2O、0.8mg/L KI、1.6mg/L H3BO3、0.5mg/L烟酸、1.0mg/L盐酸硫胺素、0.5mg/L盐酸吡哆素、2mg/L甘氨酸、100mg/L肌醇、2.88g/L脯氨酸、300mg/L水解酪蛋白氨基酸、30g/L蔗糖、pH=5.8)上培养2周。然后将摘除了胚乳和芽的细胞团换成依然以50mg/L的浓度含有潮霉素,并且含有2mg/L激动素、0.02mg/LNAA的再分化培养基(1650mg NH4NO3、1900mg/L KNO3、440mg/L CaCl2·2H2O、370mg/L MgSO4·7H2O、1700mg/L KH2PO4、27.8mg/L FeSO4·7H2O、37.3mg/L EDTA-2Na、22.3mg/L MnSO4·4H2O、8.6mg/LZnSO4·7H2O、0.025mg/L CuSO4·5H2O、0.25mg/L Na2MoO4·5H2O、0.025mg/L CoCl2·6H2O、0.83mg/L KI、6.2mg/L H3BO3、0.5mg/L烟酸、1.0mg/L盐酸硫胺素、0.5mg/L盐酸吡哆素、2mg/L甘氨酸、100mg/L肌醇、2g/L水解酪蛋白氨基酸、30g/L蔗糖、30g/L山梨糖醇、pH=5.8),每周更换3次同样的培养基。培养过程中,将绿化产生茎芽的细胞集团汇成一个,选2个生长旺盛的茎芽,移入含有50mg/L潮霉素的无激素培养基(1650mg NH4NO3、1900mg/L KNO3、440mg/L CaCl2·2H2O、370mg/L MgSO4·7H2O、170mg/L KH2PO4、27.8mg/L FeSO4·7H2O、37.3mg/L EDTA-2Na、22.3mg/L MnSO4·4H2O、8.6mg/L ZnSO4·7H2O、0.025mg/L CuSO4·5H2O、0.25mg/LNa2MoO4·5H2O、0.025mg/L CoCl2·6H2O、0.83mg/L KI、6.2mg/LH3BO3、0.5mg/L烟酸、0.1mg/L盐酸硫胺素、0.5mg/L盐酸吡哆素、2mg/L甘氨酸、30g/L蔗糖、pH=5.8)。约一个月后,将2支中发育充分的茎芽栽盆,在隔离温室或阳光温室内培育,收获种子。由每个细胞集团再分化的茎芽作为独立的重组品系处理。
如上得到的转化体通过在该载体中编码潮霉素的基因,具有了潮霉素抗性。
(实施例3转化体的生长)将市售的培养土(含有微量营养元素的Honensu培养土)装入乙烯盆(直径15cm),将移入无激素培养基经过1个月培养的水稻植物体移植到该盆中。通常,在隔离温室、自然光照下使其结籽。根据情况,可以在人工气候箱(日本医化FH301等)内以16小时光照期(15000勒克斯或以上、30℃)-8小时黑暗期(25℃)的循环周期培养2个月,再以以12小时光照期(15000勒克斯或以上、30℃)-12小时黑暗期(25℃)的循环周期培养2-3个月,使其结籽。
(实施例4重组当代种子蛋白的电泳分析)使用实施例3收获的种子,存在于种子内蛋白质的状态进行分析。其详细的顺序如下所示。
使用本领域周知的技术——SDS-PAGE方法,通过18%浓度的丙烯酰胺凝胶对种子蛋白的组成进行分析。对于独立的一个重组水稻品系,任意选取12粒种子,对每粒进行编号,每粒分成两半,使其对应关系清晰。将带有胚的一半播于含有50mg/L潮霉素的无激素培养基上。剩余的半粒夹在折叠的铝箔中,用锤子充分粉碎,加入200μl种子蛋白质提取缓冲液(25mM Tris、pH 6.8、含有8M尿素、5% 2-巯基乙醇、4% SDS),施加电压,提取蛋白质。取8μl离心操作后的上清,与2μl染料溶液(含有25mM Tris、pH 6.8、含有10%甘油、0.02%溴酚蓝、5% 2-巯基乙醇),然后进行凝胶电泳,用考马斯亮蓝进行检测。通过OneD/ZeroD Scan(Analysistics Inc.)测定上述凝胶条带的浓度,以此对蛋白质进行简易定量。
(系统筛选)对通过上述分析得知13kDa谷醇溶蛋白质约占50%或以下的品系进行筛选。收获次代种子,再次将其播种于含有潮霉素的无激素培养基(1650mg NH4NO3、1900mg/L KNO3、440mg/L CaCl2·2H2O、370mg/L MgSO4·7H2O、170mg/L KH2PO4、27.8mg/L FeSO4·7H2O、37.3mg/L EDTA-2Na、22.3mg/L MnSO4·4H2O、8.6mg/L ZnSO4·7H2O、0.025mg/L CuSO4·5H2O、0.25mg/L Na2MoO4·2H2O、0.025mg/LCoCl2·6H2O、0.83mg/L KI、6.2mg/L H3BO3、0.5mg/L烟酸、0.1mg/L盐酸硫胺素、0.5mg/L盐酸吡哆素、2mg/L甘氨酸、30g/L蔗糖、pH=5.8),通过电泳进行确认。重复培育第三代,随机选取的10粒种子全部都是13kDa谷醇溶蛋白占50%或以下,将5粒种子用乳钵粉碎,装入15ml的管中,加入5ml二乙醚,剧烈搅拌进行脱脂,离心后除去醚,将残余的种子粉末在通风室内干燥。接着加入5ml25mMTris缓冲液(pH6.8),剧烈搅拌,提取水溶性蛋白质,再次离心,回收种子粉末。向其中加入2.5ml种子蛋白质提取缓冲液,剧烈搅拌,将离心处理后的溶液层作为种子蛋白质提取液。
以上结果如图3所示。主要的贮藏蛋白质在凝胶电泳照片的右侧标示。泳道1、2和7的常规品种(Nipponbare、Nihonmasari)中,谷蛋白(D和F)最多,13kDa谷醇溶蛋白(B)次多。向其中导入谷醇溶蛋白反义基因后,泳道4、5的13kDa谷醇溶蛋白(B)显著减少,另外10kDa或16kDa谷醇溶蛋白稍减少。谷蛋白或球蛋白的表达没有变化。
另外,如泳道3、8所示,Nihonmasari的放射线突变产生的低谷蛋白含量水稻(LGC-1)中,相反谷醇溶蛋白(A-C)和球蛋白(E)显著增加,抵消了谷蛋白含量降低的大部分。但是,向其中导入谷醇溶蛋白反义基因后,如泳道6所示,谷醇溶蛋白(A-C)的含量显著降低,一方面保持了低谷蛋白含量的特征,且球蛋白也未增加。由此可知本发明的基因导入任何品种中,都可使醇溶蛋白降低,种子蛋白质也大致减少了这部分的量,对于制备低蛋白质米非常有效。
另外,图4中表示了对导入了各种构建基因的品系的种子进行分析的结果,可知具有潮霉素抗性的特征的种子中发生谷醇溶蛋白降低,由此确认谷醇溶蛋白降低的效果来自导入基因。
(通过密度仪的测定)下面,为了将蛋白质量相对数值化进行比较,通过密度仪对SDS-PAGE的凝胶进行测定。用适量的上述提取液(例如5μl、15μl、30μl)进行SDS-PAGE,同样地对条带浓度进行定量,推测蛋白质量。另外,电泳后转印PVDF膜,根据蛋白质印迹试剂盒(BioRad公司等),使用抗13kDa多克隆抗体检测13kDa谷醇溶蛋白。对于检测的条带,与SDS-PAGE同样地进行定量,推测蛋白质量。密度仪的结果如下表所示,从贮藏蛋白的总吸光值可知导入了谷醇溶蛋白反义基因的品系明显减少。先是可以实现低蛋白化。另外,图5表示了蛋白质印迹的结果,与原品种比较,识别为13kDa谷醇溶蛋白的条带的吸光值降低至10%-28%,SDS-PAGE测定结果显示13kDa谷醇溶蛋白具有进一步降低的可能性。
密度仪测定的主要的贮藏蛋白的条带浓度结果如下表所示。
(表1)

由上表可知本发明的反义构建体不仅使谷醇溶蛋白的表达减少,对于其它贮藏蛋白也具有抑制或无关的效果。该结果与低谷蛋白植物中谷醇溶蛋白增加、结果种子蛋白质总量几乎不变化的以往结果完全不同。这是预想外的结果。
(含氮量测定)粗蛋白含量是如何变化的?这通过测定玄米含氮量来验证。简单地阐述如下。方法采用含氮量化学分析的常规方法——凯氏定氮法。将10粒种子装入专用试管,向其中加入分解促进剂和2mL水、5mL硫酸,在370℃加热分解,冷却至可手持,然后静静地加入蒸馏水至试管标线进行稀释。在该状态下,种子的氮形成氨-铵,保持在硫酸中,向10mL该分解液中添加等量的30%氢氧化钠,水蒸气蒸馏,将产生的氨通入饱和硼酸溶液。向该硼酸溶液中加入pH指示剂,用盐酸滴定,由中和点对氨量进行定量,由此计算含氮量。结果如下表所示。
(表2)

在两个隔离温室中栽培水稻进行分析。广泛已知各温室的环境差异对含氮量有影响,Nipponbare的含氮量也在2个温室中显示不同的值。但是导入LP基因的品系中,在两个温室都显示粗蛋白含量的减少。很明确这是由于贮藏蛋白的减少。
由上述表可知本发明的反义构建体使种子蛋白质的含氮量、即种子蛋白质量显著减少,也就是说实现了低蛋白化。
(结果)总结以上,使用本发明的上述构建体,则13k谷醇溶蛋白的表达量显著减少。其它谷醇溶蛋白(10k、16k)显示同等或稍有减少。谷蛋白和球蛋白的表达与导入上述构建体之前的原品种同等。因此,该结果可以说本发明的构建体使种子蛋白的总表达量显著减少。
(实施例5由独立的品系得到的种子的电泳图谱)下面,对于在一个穗上结的种子取出多个种子,如实施例4所述,通过电泳进行分析。结果如图4所示,结果显示显示潮霉素抗性特性的种子中可见谷醇溶蛋白降低的特性,由此表明只要将本发明的反义构建体插入一侧的染色体,谷醇溶蛋白抑制即很充分。
(实施例6反义效果)接下来,为了确认本发明的反义构建体的反义效果,制备多个独立的重组水稻进行分析。其顺序和结果如下所示。
对于本发明的谷醇溶蛋白反义基因的结构以及它所带来的谷醇溶蛋白降低效果的关系,用各种构建基因制备重组水稻。对每一种均取10里或以上的独立品系的种子,按照系统筛选方法各分析10粒,结果汇总如下。
(表3)

按照1)结有1粒或以上13kDa谷醇溶蛋白量降低的种子的品系数、2)结有13kDa谷醇溶蛋白量为非转化体的50%或以下的种子的品系数、3)显示潮霉素抗性的全部种子中13kDa谷醇溶蛋白量降低的品系数,对上述转化水稻进行分析。
在1)结有1粒或以上13kDa谷醇溶蛋白量低的种子的品系数中,对13kDa谷醇溶蛋白表达量减少了20%的种子进行计数。
在2)结有13kDa谷醇溶蛋白量为非转化体的50%或以下的种子的品系数中,将非转化体的种子提取物和比较对照的种子提取物进行了电泳凝胶的比较。
在3)潮霉素抗性中,对在含有潮霉素的培养基上存活的个体进行选择。关于谷醇溶蛋白量的降低,采用与1)同样的判断基准。
实际的比较是通过凝胶读取仪读取电泳后的凝胶,以非转化体为100%,计算比较对照的指数绝对值。
以下表示结果。
(表4)

*结有1粒或以上13kDa谷醇溶蛋白量降低的种子的品系数**结有13kDa谷醇溶蛋白量为非转化体的50%或以下的种子的品系数***显示潮霉素抗性的全部种子中13kDa谷醇溶蛋白量降低的品系数上述项目1和2的结果是测定构建体中抑制13kDa谷醇溶蛋白表达的力有多大的指标,在各项目中,数字越大表示越高效。本发明的反义构建体虽然都可以有效抑制备为对象的13kDa谷醇溶蛋白的表达,但根据构建体的结构(特别是启动子)不同,也显示出效率差异。项目3的结果中,显示出现了潮霉素抗性和反义表现型不完全一致的例子。这显示2对染色体的其中之一插入了导入基因,则可能无法充分发挥对13kDa谷醇溶蛋白的抑制效果。因此,本发明优选在两个染色体的双方插入导入基因。已知通常在重组水稻中,导入的基因被随机地整合到染色体中,根据其插入的位置等,其表达的程度会出现差异。制备导入了相同基因的100个个体,会出现导入基因充分表达的个体乃至完全不表达的个体,表达程度参差不齐,这是本领域的常识。另外还已知,在几乎没有基因表达的个体中,也会出现整合到一侧的染色体上的个体、整合到两侧染色体上的个体、还有插入了一个导入基因和插入了两个导入基因的个体,表现型出现差异。本来,如图4所示,如果1个反义构建体插入到一条染色体上,则可发挥反义效果,但例如在染色体上的插入位置不好,则因插入的反义构建体的个数而使表现型出现不同,这是常有的。
如上所述,1、2和该项目3所示的数字越大,则可以称为是可高概率稳定地发挥反义效果的优异的构建体。从该意义上讲,10kDa谷醇溶蛋白启动子与其它启动子相比较,容易获得反义效果强的品系,另外使反义中使用的基因片段缩短时(67-15bp),也可以发挥效果。因此本发明显示了非常高的有用性。
(实施例7使用RNAi型表达盒的反义)作为反义基因的另一方案,将使用与目标基因互补的两个片段的RNAi型LP基因导入,同样地进行效果的验证。参考现有文献nature407319-320(2000),构建的基因的结构如图2所示。其中,使用表3、4中未使用的水稻多遍在蛋白启动子构建的基因如表5所示,进行比较。表6表示其结果,方法按照表4进行。
(表5)

(表6)

*结有1粒或以上13kDa谷醇溶蛋白量降低的种子的品系数**结有13kDa谷醇溶蛋白量为非转化体的50%或以下的种子的品系数***显示潮霉素抗性的全部种子中13kDa谷醇溶蛋白量降低的品系数观察结果RNAi型的LP基因中,所分析的品系数与1)和3)的数字一致,显示如果导入基因则确实可以降低谷醇溶蛋白。将作为间隔序列的GUS片段和天冬氨酸蛋白酶内含子进行比较,则天冬氨酸蛋白酶内含子的2)的数字高,显示明显出现反义效果的概率高。另外可知使用45bp、23bp等短片段时,可得到反义效果显著表现的品系。片段进一步短时(15bp),也可以发挥反义效果。
另外,使用来自16kDa谷醇溶蛋白的序列(SEQ ID NO.31、32)作为抑制谷醇溶蛋白的序列时,表现的概率低,但得到了16kDa谷醇溶蛋白和13kDa谷醇溶蛋白同时受到抑制的品系。16kDa谷醇溶蛋白和13kDa谷醇溶蛋白有一部分氨基酸序列的相似性高的部分,可能是该部分对两者引起了反义作用。将该情况与前述的结果结合考虑,则在总结性地抑制多基因族的表达时,显示氨基酸序列的局部相似性是很重要的,显示本发明的构建体对抑制其它作物的贮藏蛋白也有效。
实际的SDS-PAGE结果如
图10所示。
已知通常RNAi型的反义基因比使用一个逆向片段的反义基因更能有效且强力地抑制目标基因的表达。比较表4和6,在谷醇溶蛋白抑制中也可见同样的倾向,特别是RNAi型的反义基因获得谷醇溶蛋白显著降低的品系的概率明显高。但是也显示既是是一个逆向片段,也足可以获得谷醇溶蛋白显著降低的品系,可以得出以下结论任何结构的反义基因在有用性高这点上都是相同的。
(实施例8透射电子显微镜对蛋白体的观察)下面,观察实施例6中制备的种子的蛋白体。蛋白体的观察按照以下顺序进行。
在开花的稻壳上做标记,7天、10天、14天、21天后取样。立即在种子的上下用剃刀片切出切痕,然后置于3%戊二醛溶液中,在冰上、减压条件下放置15分钟,然后在4℃放置12小时,进行固定处理。将种子切成3份,用LR-White树脂(应研商事)包埋,使其固化,然后用金刚石刀切成90nm的切片。一下按照常规的透射电子显微镜样品处理方法处理切片,用日本电子的透射电子显微镜对胚乳表层的细胞进行观察。
对开花后第14天的种子观察的结果如图6所示。6a中直接复印了观察照片。显示稍薄、灰色、圆滑球形的是蓄积谷醇溶蛋白的蛋白体1,比它色深、大型、形状稍不规则的是蓄积谷蛋白和球蛋白的蛋白体2。常见蛋白质颗粒密密相连的图像。6b是在6a的照片上将蛋白体的类型标记表示。用相同面积的视野观察,则LP13K品系(6b-1)与常规品种(6b-2)比较,可见蛋白体1的数量明显少。这显示在蛋白体1的形成中,13kDa谷醇溶蛋白起到了重要的作用,通过控制其表达,可以控制蛋白体的形成数量。另一方面,在具有低谷蛋白且高谷醇溶蛋白的LGC-1(6b-3)中,蛋白体2的数目和大小大幅减少,而蛋白体1的数目大幅增加,可充分见到谷蛋白减少的量被分配给谷醇溶蛋白的情况。在LG-LP13K(LGC-1中导入谷醇溶蛋白反义基因)的品系中,可观察到两种蛋白均减少的情况。已知胚乳细胞的表层蛋白质非常丰富,虽然不能象稻糠层那样去除,但使用、加工都优选尽量除去该蛋白质,如果通过谷醇溶蛋白反义基因的效果,使表层的蛋白质大幅减少,则即使将该除去过程简略,也可得到同等品质的产品。另外,根据种子的homeo机制,降低的蛋白质应被补充为其它的蛋白,如果使有用蛋白质的基因在这里强制表达,则氨基酸被优先分配,有望蓄积在该表层细胞。
(实施例9其它反义构建体的制备)下面验证其它谷醇溶蛋白基因的反义序列和启动子以及根据需要含有的信号序列也可以产生同样的效果。该实施例中制备的启动子序列和反义序列表示在SEQ ID NO.63-72(反义)、102-105(反义)、47和58(启动子)、106-107(启动子)、108-113(信号序列)。
使用该序列,按照实施例1-8所示的顺序进行效果分析,结果观察到这些反义序列也具有同样的抑制谷醇溶蛋白和种子蛋白质的效果。
这显示不仅对该谷醇溶蛋白,对其它也具有反义效果。
下面如实施例6和7记载,进一步对反义效果进行分析,同样证实了具有反义效果,以及特别是用RNAi型测试时,象15bp的碱基对或20bp的碱基对这样短的序列也有效果。
(实施例10在其它品种中的效果)该实施例中,使用本发明的反义构建体,验证对其它品种是否可得到同样的效果。对象为上述实施例中未使用过的粳稻(通常米饭用米、米饼用米、酿酒米、矮化等形态变异水稻)或者籼稻。选择有TeTep、Basmati、IR8、湖南早和Kasalath。转化以后的操作完全与实施例2-4同样地进行。图7是对这些品种中的几种进行种子蛋白质的电泳,以及将Nipponbare谷醇溶蛋白对兔免疫得到抗13kDa谷醇溶蛋白多克隆抗体,使用该抗体进行蛋白质印迹分析的结果。一见即可知任何品种的电泳都极为类似,与抗体良好反应,表明谷醇溶蛋白基因在品种间高度保守。
导入本发明的反义谷醇溶蛋白(LP)基因时,在所有的品种中均观察到谷醇溶蛋白表达显著降低。几个品种的SDS-PAGE结果如
图10所示,在导入了LP基因的水稻中,都是相当于谷醇溶蛋白的条带比现有品种显著变浅,这反映了谷醇溶蛋白含量的降低。有上述结果可得到如下结论不管是杂交品种还是基因导入品种,含有本发明的构建体的水稻,其谷醇溶蛋白降低,实现低蛋白化,证明在水稻全体中本发明的有用性。图7中,米饼品种与其它品种比较,条带变浅是由于其淀粉在提取操作中显著膨胀,是蛋白质的回收效率大幅降低,并不是所含蛋白质少。
(实施例11使用低谷醇溶蛋白水稻的外源基因的表达例)可以采用向上述实施例中所得的一系列LP13K的种子及其原品种双方导入有用蛋白质表达盒进行比较的方法,但希望验证各品种的效果时,需要用各品种一个一个制备LP13K型,效率不高。如本实施例,最大限度地发挥预先构建的
图1的质粒的特性,在效率方面很优异。
本实施例中,如图8所例示,采用了以下的方法构建用pUC198AM或pUC198AA导入的有用蛋白质表达盒,将其插入双元载体的AscI位点。这样,同一质粒上连接的有用蛋白质表达盒和谷醇溶蛋白反义盒可以确实地同时导入水稻中。特别是将用pUC198AM构建的有用蛋白质表达盒插入时,插入盒的终止子一侧的MluI与载体的AscI连接,位点消失,而启动子一侧的AscI则还存在,因此可以向该AscI再追加插入表达盒。
以下,制备有用蛋白表达用的构建基因系列,验证作为低谷醇溶蛋白的种子(低蛋白质种子)的双元载体的有用性。
构建如
图11所示的基因1-4,导入Nipponbare,观察GFP发光,同时与实施例2-4和7同样地进行SDS-PAGE和蛋白质印迹分析。发光强度使用LEICA制显微镜的荧光观察系统,通过比较亮度来进行。基因1与2比较时,插入有LP和的2中可观察到明显强的发光。象基因3那样,将基因2的LP盒的部分与GUS互换,结果与基因1是同水平的发光强度,由此判断发光增强效果来自LP盒。另外,在将基因2的GFP部分与GUS互换的4中,完全未观察到荧光,由此判断发光归根到底来自GFP。使用抗GFP抗体的蛋白质印迹分析中,基因2的情况下,GFP表达量为1的情况下的2倍或以上。以上的结果表明在低谷醇溶蛋白种子中,外源蛋白质的表达增加。但是,导入任何基因,都难以在SDS-PAGE上判定GFP蛋白,无法充分发挥作为生物反应器的潜能。
因此,如
图12那样,构建基因5、6进行了同样的分析,其中所述基因5、6具有将10kDa谷醇溶蛋白的信号序列插入GFP之前的结构。结果,这些种子的GFP发光强度增大至难以进行表达量比较的水平。如
图13A的SDS-PAGE所示,导入了基因5的水稻(泳道2)中达到可检测到明确条带的水平,推定为GFP、其在原品种中不存在。另外,与基因5比较时,插入有LP盒的基因6(泳道3)的表达量进一步提高到1.2倍或以上,可见每粒种子蓄积了50μg或以上。这样,可以说通过结合使用信号序列,进一步明确显示了作为低谷醇溶蛋白种子的双元载体的有用性。
通过使用抗GFP抗体进行蛋白质印迹分析,确认
图13中所见的原品种没有的条带确实是GFP。另外,通过氨基酸序列验证了是否制备了正确结构的蛋白质。
图14A中,导入的GFP基因的结构是在10kDa谷醇溶蛋白信号序列后夹有连接序列的GFP基因本身,推定的氨基酸序列在碱基序列下表示。
图14B中,与原品种(泳道1)比较,导入了基因6的重组水稻(泳道3)中,谷醇溶蛋白位置的条带浓度(*)减少,用方框围住的位置上出现了明确的条带。将该条带转印PVDF膜,确定N末端序列时,得到SerArgAlaMetValSerLysGly(SEQ ID NO.118)的序列,与推定氨基酸序列中连接部分以后的序列100%一致。这样,只有10kDa谷醇溶蛋白信号序列被按计划切除,使GFP蛋白正常表达,证明本发明的导入基因的结构与目标极为一致。
为了进一步提高有用性,将基因6导入LGC-1进行了效果验证。其结果如
图13B所示,观察到导入LGC-1(泳道5)比导入Nipponbare(泳道3)时,GFP的表达量增大,并且,谷醇溶蛋白更减少的品系(泳道6),其GFP表达量增高。
泳道3中,可见每粒种子蓄积了150μg或以上的GFP,外源蛋白质是种子胚乳中最大量存在的蛋白质。与泳道1的NipponbareSDS-PAGE图谱比较,仿佛另外一种植物似的,足可以理解为这是远远超过预想的划时代的发明。通过应用本发明,可大大加速具有与现有米完全不同的特性的重组水稻品种的创造研究。
(实施例12使用低谷醇溶蛋白水稻的有用外源基因的表达例-采用抑半胱氨酸蛋白酶蛋白作为外源基因)该实施例中,使用抑半胱氨酸蛋白酶蛋白尝试外源基因的表达。
上面,将使用GFP进行研究的品系实际用于有用蛋白质生产的是
图15的例子。这里所使用的抑半胱氨酸蛋白酶蛋白具有特异性抑制半胱氨酸蛋白酶的机能。半胱氨酸蛋白酶作为鞘翅目、半翅目害虫的消化酶,或者各种病毒繁殖的必须因子,发挥着重要的作用。因此增强作物中的抑半胱氨酸蛋白酶蛋白,抑制上述半胱氨酸蛋白酶的活动,这可以产生害虫抗性或病毒抗性。
抑半胱氨酸蛋白酶蛋白原本含在作物可食部分,因此有漫长的被食用的历史,可认为利用风险极低。因此可采用使其在难以用药物处理的可食用部分表达的利用方法。例如在米中表达时,对于防治贮粮害虫谷蠢或破坏成熟中的稻壳的蝽起作用,同时可用于抑制消化道感染病毒的功能性米。
上述有效利用中非常值得期待的是抑半胱氨酸蛋白酶蛋白基因,但以往尚未达到实用化的地步。其最大原因就是无法在作物中以高水平蓄积。已知作物本身的半胱氨酸含量处于非常低的水平,有人认为这是由于存在抑制为低表达的调节机制,或者存在蛋白质的稳定性低(容易分解)的可能性。也有报告提出使其在米中表达,使米具有谷蠢抗性,但表达水平依然低,仅仅实现了生长延迟,尚未达到实用的水平。
这里,将本发明应用于玉米抑半胱氨酸蛋白酶蛋白,尝试制备并评价抑半胱氨酸蛋白酶蛋白蓄积米。将基因5和6的GFP部分分别与玉米抑半胱氨酸蛋白酶蛋白基因交换,构建基因7和8,导入Nipponbare。本实施例的方法是去掉由种子提取蛋白质的部分,按照实施例2-4进行。方法的不同之处在于用于评价的种子蛋白提取液如下制备将种子粉碎后,用含有200mM氯化钠的pH6.0的磷酸缓冲液提取,然后将上清在沸水中处理1分钟。
结果如
图15所示。关于表达量的大小,显示了与在GFP中所观察到的完全相同的图谱,说明将谷醇溶蛋白启动子+信号序列+抑半胱氨酸蛋白酶蛋白基因与谷醇溶蛋白反义盒连接(基因8)同时导入的系统,使抑半胱氨酸蛋白酶蛋白最大量蓄积。特别是附有谷醇溶蛋白反义盒时的增强效果比GFP的情况大很多。将抑半胱氨酸蛋白酶蛋白导入植物种子,通过SDS-PAGE检测蛋白质的例子还是首次,可以说更明确地显示出本发明的有用性。
(实施例13本发明的基因构建体对于其它贮藏蛋白质的应用)使用本发明所使用的RNAi型表达抑制盒,根据实施例7和9构建股蛋白和球蛋白RNAi基因并导入,按照实施例2-4进行分析评价。结果,谷蛋白、球蛋白的表达均被显著抑制。将该结果结合
图1所示的载品系统,构建将分别的谷蛋白、球蛋白、谷醇溶蛋白表达抑制和与外源基因表达盒全部连接的载体并导入,此时,在各品种中,全部贮藏蛋白受到抑制,可使外源蛋白质高效表达。同样,预先使谷蛋白、球蛋白、谷醇溶蛋白三种基因片段连接,制成人工片段,将其在RNAi型表达抑制盒中使用时(
图17例示),全部贮藏蛋白受到抑制,可使外源蛋白质高效表达。
另外有报告指出使有用蛋白质在水稻种子中表达的启动子常常使用谷蛋白B1启动子或球蛋白启动子,另外这些信号序列对于使表达增加有效。对于基因5和6的有用蛋白质盒部分,将启动子(SEQ IDNO.47、48、60、62、106、107)或信号序列(SEQ ID NO.108-117)进行各种组合、取代,进行研究,结果依然是基因6型比5型的表达增强。这可能是由于因谷醇溶蛋白减少而产生的细胞内空间被充分利用的结果。
以上显示,本发明的基因构建体及其结构可以在实现种子的生物反应器化的目的中广泛使用,可以获得前所未有的特别的成果。
本发明的过程中,已明确的水稻种子中贮藏蛋白质组成的调控模式(
图16)是根据恒定性,种子蛋白质生产能力的剩余的大部分最终转向谷醇溶蛋白的生产。另外还已知谷醇溶蛋白是在种子成熟的后半期表达的。考虑到以上情况,可以理解为使有用蛋白质通过谷醇溶蛋白启动子表达的本发明构建体尽量抑制全部水稻种子贮藏蛋白的量,并将剩余生产能力有效地转用在有用蛋白质表达上,这更进一步符合本发明的目的。并且本实施例中,如
图14所示,已经将实际表达的蛋白质的N末端序列进行了确认,验证到这一部的,至今尚未有先例报道。总结这些结果,则基因6的结构是目前最优异的水稻种子有用蛋白质表达盒。
本发明的技术思想对于其他作物种子、尤其是单子叶作物种子具有十分普遍性和可理解性,关于这一点,本领域技术人员可以容易地理解。即,通过基因重组或突变来抑制某种种子贮藏蛋白A,通过导入该贮藏蛋白A的基因启动子或其替代启动子+信号系列+有用蛋白质这样的构建基因,使有用蛋白质大量蓄积,除造出划时代的新作物。如以下的表和
图17所总结的,本发明的突出成果是对目前只是处于想象阶段的生物反应器化技术,提出了甚至是具体的导入基因的结构这样的实证例子。
(表7)以种子作为生物反应器时所预想的最佳导入基因的结构例

(实施例14本发明在米制造加工食品中的应用)米加工食品制造中重要的作业过程是精米后(或粉碎制成米粉后),在水中充分浸泡使其吸水,通过加热使淀粉充分糊化。通常,蛋白质(尤其是谷醇溶蛋白)较多的米吸水差,淀粉糊化不充分,加热后米的膨化性或粘性、米饼的溶胀性、伸展性差,导致产品品质降低。因此,在上述内容中,使用在上述实施例中得到的低蛋白米(在Nipponbare和Koganemochi中导入谷醇溶蛋白反义基因而得),这与原品种比较,低谷醇溶蛋白米可以缩短浸泡时间,可得到粘性或溶胀性同等或胜于原品种的主食米、蒸米、原料。这些结果显示,本发明在高压蒸米饭等餐饮产业需要大量蒸饭的情形,以及煎饼、米饼块、米团等加工食品中有用。
(实施例15本发明在日本酒酿造中的应用)米的另外一个利用场所是日本酒的酿造。这里,使用在上述实施例中得到的低蛋白米LG-LP13K(在LGC-1中导入谷醇溶蛋白反义基因所得),尝试日本酒的酿造试验。LGC-1不是造酒用的米,但一般的食用品种也是可以制造日本酒的。可以确认作为酿造米,LGC-1本身与通常的品种相同。
在日本酒的酿造中,原料米的蛋白质会产生各种杂味或不希望的味道,因此希望其尽量低。米粒外侧糠层的油脂、矿物质、蛋白质极为丰富,将该部分去除的操作被称为捣精(或精米)。使用由捣精前和后的重量比得到的捣精率指标来表示捣精的程度,将白米蒸饭食用时的捣精率为90%左右。但是,通过图6的电子显微镜可知,白米表层细胞富含蛋白质,酿造日本酒时,通常需要进一步去除表面,使捣精率为70%或以下,用于酒品评会的最高级的米甚至被去除至30%或以下。
使用本发明的种子,则即使原料的捣精率高也可以得到低蛋白,因此可作为可使上述过程简略的原料米。另外在洗米过程中,原本蛋白质就少,因此该过程也可简略。蛋白质少,则淀粉的溶胀糊化良好,这也是利用的优势。
将精米过程简略化的LG-LP13K和通常精米的LGC-1进行比较,风味未见显著差异,因此本发明的低蛋白质植物在食品产业中也显示有用性。
如上所述,使用本发明的优选实施方案例举了本发明,但不应解释为本发明限于该实施方案。应理解为本发明只应根据权利要求范围解释其范围。本领域人员可以理解,可以从本发明的具体优选的实施方案,根据本发明的内容和技术常识实施等价的范围。本说明书中援引的专利、专利申请和问安,其内容本身具体与本说明书记载的同样,其内容应作为本说明书的参考而援引。
(发明效果)通过本发明的谷醇溶蛋白表达抑制基因,可得到种子中的总蛋白质含量低的水稻及其种子。一个方面的效果是减少了营养价不好的谷醇溶蛋白的量,从而相对地提高了氨基酸营养价,可强化作为蛋白质源的米的机能。另外,特别是在日本,需求低蛋白米的情况很多,可应用于通常食用、米加工品、日本酒酿造、肾脏病等氨基酸摄取量受限的疾病的治疗食品等用途中。并且,作为可高效表达外源有用蛋白质的生物反应器也具有高潜能。这样,本发明取得了以往的技术未实现的、对多方面具有冲击性的突出的效果。
产业实用性减少了营养价不好的谷醇溶蛋白的量,从而相对地提高了氨基酸营养价,可提供作为蛋白质源的米的机能得到强化的米。或者在需求低蛋白米的情况中,可应用于一般食用、米加工制品、日本酒酿造、肾脏病等氨基酸摄取量受限的疾病的治疗食品等用途中。并且,作为可高效表达外源有用蛋白质的生物反应器也具有高潜能,通过创造来自外源有用蛋白质的机能的新型作物(具有新特性的米),可对米产业用途的扩大发挥很大的贡献。这样,本发明取得了以往的技术未实现的、对多方面具有冲击性的突出的效果。
序列表<110>National Agricultural Research Organization<120>种子中蛋白质含量降低的植物及其制备方法和利用方法<130>NG004PCT<150>JP 2002亅369700<151>2002亅12亅20<160>96<170>PatentIn Ver.3.1<210>1<211>617<212>DNA<213>稻<220>
<223>发明人Kuroda,Masaharu<220>
<223>13kD谷醇溶蛋白RM9<400>1gcaaaagcat aagaactaga aacccaccac aatgaagatc attttcttct ttgctctcct 60tgctattgct gcatgcagtg cctctgcgca gtttgatgct gttactcaag tttacaggca 120atatcagctg cagccgcatc tcatgctgca gcaacagatg cttagcccat gcggtgagtt 180cgtaaggcag cagtgcagca cagtggcaac ccccttcttc caatcacccg tgtttcaact 240gagaaactgc caagtcatgc agcagcagtg ctgccaacag ctcaggatga tcgcacaaca 300gtctcactgc caggccatta gcagtgttca ggctattgtg cagcagctac ggctacaaca 360gtttgctagc gtctacttcg atcagagtca agctcaagcc caagctatgt tggccctaaa 420catgccgtca atatgcggta tctacccaag ctacaacact gctccctgta gcattcccac 480cgtcggtggt atctggtatt gaattgtagc agtatagtag tacaggagag aaaaataaag 540tcatgcatca tcgtgtgtga caagttgaaa catcggggtg atacaaatct gaataaaaat 600gtcatgcaag tttaaac617<210>2<211>156<212>PRT
<213>稻<220>
<223>13kD谷醇溶蛋白RM9<400>2Met Lys Ile Ile Phe Phe Phe Ala Leu Leu Ala Ile Ala Ala Cys Ser1 5 10 15Ala Ser Ala Gln Phe Asp Ala Val Thr Gln Val Tyr Arg Gln Tyr Gln20 25 30Leu Gln Pro His Leu Met Leu Gln Gln Gln Met Leu Ser Pro Cys Gly35 40 45Glu Phe Val Arg Gln Gln Cys Ser Thr Val Ala Thr Pro Phe Phe Gln50 55 60Ser Pro Val Phe Gln Leu Arg Asn Cys Gln Val Met Gln Gln Gln Cys65 70 75 80Cys Gln Gln Leu Arg Met Ile Ala Gln Gln Ser His Cys Gln Ala Ile85 90 95Ser Ser Val Gln Ala Ile Val Gln Gln Leu Arg Leu Gln Gln Phe Ala100 105 110Ser Val Tyr Phe Asp Gln Ser Gln Ala Gln Ala Gln Ala Met Leu Ala115 120 125Leu Asn Met Pro Ser Ile Cys Gly Ile Tyr Pro Ser Tyr Asn Thr Ala130 135 140Pro Cys Ser Ile Pro Thr Val Gly Gly Ile Trp Tyr145 150 155<210>3<211>601<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白RM1
<400>3aggaagcata gtagtagaat cctacaaaaa tgaagatcat tttcgtattt gctctccttg 60ctattgttgc atgcaacgct tctgcacggt ttgatgctct tagtcaaagt tatagacaat 120atcaactaca atcgcatctc ctgctacagc aacaagtgct cagcccatgc agtgagttcg 180taaggcaaca gcatagcata gtggcaaccc ccttctggca accagctacg tttcaattga 240taaacaacca agtcatgcag caacagtgtt gccaacagct caggctggta gcgcaacaat 300ctcactacca ggccattagt agcgttcagg cgattgtgca gcaactacag ctgcagcagg 360tcggtgttgt ctactttgat cagactcaag ctcaagctca agctttgctg gccttaaact 420tgccatccat atgtggtatc tatcctaact actacattgc tccgaggagc attcccaccg 480ttggtggtgt ctggtactga attgtaatag tataatggtt caaatgttaa aaataaagtc 540atgcatcatc atgcgtgaca gttgaaactt gatgtcatat aaatctaaat aaactcgtgc 600c 601<210>4<211>156<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白RM1<400>4Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys Asn1 5 10 15Ala Ser Ala Arg Phe Asp Ala Leu Ser Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln Ser His Leu Leu Leu Gln Gln Gln Val Leu Ser Pro Cys Ser35 40 45Glu Phe Val Arg Gln Gln His Ser Ile Val Ala Thr Pro Phe Trp Gln50 55 60Pro Ala Thr Phe Gln Leu Ile Asn Asn Gln Val Met Gln Gln Gln Cys65 70 75 80Cys Gln Gln Leu Arg Leu Val Ala Gln Gln Ser His Tyr Gln Ala Ile85 90 95Ser Ser Val Gln Ala Ile Val Gln Gln Leu Gln Leu Gln Gln Val Gly100 105 110
Val Val Tyr Phe Asp Gln Thr Gln Ala Gln Ala Gln Ala Leu Leu Ala115 120 125Leu Asn Leu Pro Ser Ile Cys Gly Ile Tyr Pro Asn Tyr Tyr Ile Ala130 135 140Pro Arg Ser Ile Pro Thr Val Gly Gly Val Trp Tyr145 150 155<210>5<211>766<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>5ttgcttcttc ccgtcctccc cgcttgggct cttgggcgcc cgttccgggc gccccctccc 60tcctccctcc gcggtacccg gccgcctcac tcctctgctg gacccccggc cgccccgggc 120cgcgccccat cccggtgcgc gacccatcgt tcacacagtt caagcattat acagaaaaat 180agaaagatct agtgtcccgc agcaatgaag atcattttcg tctttgctct ccttgctatt 240gctgcatgca ggcctctgcc gagtttgatg tttttaggtc aaagttatag gcaatatcag 300ctgcagtcgc ctgtcctgct acagcaacag gtgcttagcc catataatga gttcgtaagg 360cagcagtatg gcatagcggc aagccccttc ttgcaatcag ctgcatttca actgagaaat 420aaccaagtct ggcaacatca ggctggtggc caacaatctc gctatcagga cattaacatt 480gttcaggcca tagcgtacga gctacaactc cagcaatttg gtgatctcta ctttgatcgg 540aatcaggctc aagctcaagc tctattggct tttaacgtgc catctagata tggtatctac 600cctaggtact atggtgcacc cagtaccatt accacccttg gcggtgtctt gtaatgtgtt 660ttaacagtat agtggttcgg aagttaaaaa taagctcaga tatcatcata tgtgacatgt 720gaaactttgg gtgatataaa tagaaataaa gttgcctttc atattt766<210>6<211>149<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白
<400>6Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Arg1 5 10 15Pro Leu Pro Ser Leu Met Phe Leu Gly Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln Ser Pro Val Leu Leu Gln Gln Gln Val Leu Ser Pro Tyr Asn35 40 45Glu Phe Val Arg Gln Gln Tyr Gly Ile Ala Ala Ser Pro Phe Leu Gln50 55 60Ser Ala Ala Phe Gln Leu Arg Asn Asn Gln Val Trp Gln His Gln Ala65 70 75 80Gly Gly Gln Gln Ser Arg Tyr Gln Asp Ile Asn Ile Val Gln Ala Ile85 90 95Ala Tyr Glu Leu Gln Leu Gln Gln Phe Gly Asp Leu Tyr Phe Asp Arg100 105 110Asn Gln Ala Gln Ala Gln Ala Leu Leu Ala Phe Asn Val Pro Ser Arg115 120 125Tyr Gly Ile Tyr Pro Arg Tyr Tyr Gly Ala Pro Ser Thr Ile Thr Thr130 135 140Leu Gly Gly Val Leu145<210>7<211>717<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>7gttccgggcg cccccctccc tcctccctcc gcggtacccg gccgcctcac tcctctgctg 60gacccccggc cgccccgggc cgcgccccat cccggtgcgc gccccatcgt tcacacagtt 120caagtattat acagaaaaat agaaagatct agtgtcccgc agcaatgaag atcattttcg 180
tctttgct ctccttgctatt gctgcatgca gcgcctctgc gcagtttgat gttttaggac 240aaagttatag gcaatatcag ctgcagtcgc ctgtcctgct acagcaacag gtgcttagcc 300catataatga gttcgtaagg cagcagtatg gcatagcggc aagccccttc ttgcaatcag 360ctgcatttca actgagaaac aaccaagtct ggcaacagct cgcgctggtg gcgcaacaat 420ctcactatca ggacattaac attgttcagg ccatagcgca gcagctacaa ctccagcagt 480ttggtgatct ctactttgat cggaatctgg ctcaagctca gttggctttt aacgtgccat 540ctagatatgg tatctaccct aggtactatg gtgcacccag taccattacc acccttggcg 600gtgtcttgta atgtgtttta acaaggtata gtggttcgga agttaaaaat aagctcagat 660atcatcatat gtgacatgtg aaactttggg tgatataaat agaaataaag ttgtctt717<210>8<211>148<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白<400>8Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Ser1 5 10 15Ala Ser Ala Gln Phe Asp Val Leu Gly Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln Ser Pro Val Leu Leu Gln Gln Gln Val Leu Ser Pro Tyr Asn35 40 45Glu Phe Val Arg Gln Gln Tyr Gly Ile Ala Ala Ser Pro Phe Leu Gln50 55 60Ser Ala Ala Phe Gln Leu Arg Asn Asn Gln Val Trp Gln Gln Leu Ala65 70 75 80Leu Val Ala Gln Gln Ser His Tyr Gln Asp Ile Asn Ile Val Gln Ala85 90 95Ile Ala Gln Gln Leu Gln Leu Gln Gln Phe Gly Asp Leu Tyr Phe Asp100 105 110Arg Asn Leu Ala Gln Ala Gln Leu Ala Phe Asn Val Pro Ser Arg Tyr115 120 125
Gly Ile Tyr Pro Arg Tyr Tyr Gly Ala Pro Ser Thr Ile Thr Thr Leu130 135 140Gly Gly Val Leu145<210>9<211>650<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>9cttccccgtc gggcccggcc ccggccctcg cctatccgcc tcctcccccc gcgcccttca 60ccactcccaa cccagctccc tttctccacc taccggcccc atccttctca caactcaaac 120attacagcga aagcataaca actagaatcc taccacaatg aagatcattt tcttctttgc 180tctccttgct gaagctgcat gtagcgcctc tgcgcagttt gatgctgtta ctcaagttta 240caggcaatat cagctgcagc aacagatgct tagcccatgc ggtgagttcg taaggcagca 300gtgcagcaca gtggcaaccc ccttcttcca atcacccgtg tttcaactga gaaactgcca 360agtcatgcag cagcagtgct gccaacagct caggatgatc gcgcaacagt ctcactgcca 420ggccattagc agtgttcagg cgattgtgca gcagctacag ctacaacagt tttctggcgt 480ctacttcgat caggctcaag ctcaagccca agctatgttg ggcctaaact tgccgtcaat 540atgcggtatc tacccaagct acaacactgt ccctgagatt cctaccgtcg gtggtatctg 600gtactgattg acgagataga gacagggaaa taagcatgat catcggggct650<210>10<211>149<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白<400>10Met Lys Ile Ile Phe Phe Phe Ala Leu Leu Ala Glu Ala Ala Cys Ser1 5 10 15Ala Ser Ala Gln Phe Asp Ala Val Thr Gln Val Tyr Arg Gln Tyr Gln20 25 30
Leu Gln Gln Gln Met Leu Ser Pro Cys Gly Glu Phe Val Arg Gln Gln35 40 45Cys Ser Thr Val Ala Thr Pro Phe Phe Gln Ser Pro Val Phe Gln Leu50 55 60Arg Asn Cys Gln Val Met Gln Gln Gln Cys Cys Gln Gln Leu Arg Met65 70 75 80Ile Ala Gln Gln Ser His Cys Gln Ala Ile Ser Ser Val Gln Ala Ile85 90 95Val Gln Gln Leu Gln Leu Gln Gln Phe Ser Gly Val Tyr Phe Asp Gln100 105 110Ala Gln Ala Gln Ala Gln Ala Met Leu Gly Leu Asn Leu Pro Ser Ile115 120 125Cys Gly Ile Tyr Pro Ser Tyr Asn Thr Val Pro Glu Ile Pro Thr Val130 135 140Gly Gly Ile Trp Tyr145<210>11<211>629<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>11cgttgaagca tagtagtaga atcctacaaa aatgaagatc attttcgtat ttgctctcct 60tgctattgtt gcatgcaacg cttctgcacg gtttgatgct cttagtcaaa gttatagaca 120atatcaacta caatcgcatc tccagctaca gcaacaagtg ctcagcccat gcagtgagtt 180cgtaaggcaa cagcatagca tagtggcaac ccccttctgg caaccagcta cgtttcaatt 240gataaacaac caagtcatgc agcaacagtgt tgccaacag ctcaggctgg tagcgcaaca 300atctcactac caggccatta gtagcgttca ggcgattgtg cagcaactac agctgcagca 360ggtcggtgtt gtctactttg atcagactca agctcaagct caagctttgc tggccttaaa 420cttgccatcc atatgtggta tctatcctaa ctactacatt gctccgagga gcattcccac 480cgttggtgtg tctggtactg aattgtaata gtataatggt tcaaatgtta aaaataaagt 540catgcatcat catgcgtgac agttgaaact tgatgtcata taaatctaaa taaaatcacc 600
tatttaaata gcaaaaaaaa aaaaaaaaa 629<210>12<211>158<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白<400>12Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys Asn1 5 10 15Ala Ser Ala Arg Phe Asp Ala Leu Ser Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln Ser His Leu Gln Leu Gln Gln Gln Val Leu Ser Pro Cys Ser35 40 45Glu Phe Val Arg Gln Gln His Ser Ile Val Ala Thr Pro Phe Trp Gln50 55 60Pro Ala Thr Phe Gln Leu Ile Asn Asn Gln Val Met Gln Gln Gln Cys65 70 75 80Cys Gln Gln Leu Arg Leu Val Ala Gln Gln Ser His Tyr Gln Ala Ile85 90 95Ser Ser Val Gln Ala Ile Val Gln Gln Leu Gln Leu Gln Gln Val Gly100 105 110Val Val Tyr Phe Asp Gln Thr Gln Ala Gln Ala Gln Ala Leu Leu Ala115 120 125Leu Asn Leu Pro Ser Ile Cys Gly Ile Tyr Pro Asn Tyr Tyr Ile Ala130 135 140Pro Arg Ser Ile Pro Thr Val Gly Val Ser Gly Thr Glu Leu145 150 155<210>13
<211>603<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>13gaagcatagt agtagaatcc aacaacaatg aagatcattt tcgtatttgc tctccttgct 60attgttgcat gcaatcgctc tgcgcggttt gatcctctta gtcaaagtta taggcaatat 120caactacagt cgcatctcct actacagcaa caagtgctca gcccatgcag tgagttcgta 180aggcaacagt atagcatagt ggcaaccccc ttctggcaac cagctacgtt tcaattgata 240aacaaccaag tcatgcagca gcagtgttgc caacagctca ggctggtagc acaacaatct 300cactaccagg ccattagtat tgttcaagcg attgtgcaac agctacaact gcagcaattt 360agtggtgtct actttgatca gactcaagct caagcccaaa ctctgttgac cttcaacttg 420ccatccatat gtggtatcta ccctaactac tatagtgctc ccaggagcat tgccactgtt 480ggtggtgtct ggtactgaat tgtaacaata taatagttcg tatgttaaaa ataaagtcat 540acatcatcat gtgtgactgt tgaaacttag ggtcatataa atctaaataa aatcatctta 600cct 603<210>14<211>156<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白<400>14Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys Asn1 5 10 15Arg Ser Ala Arg Phe Asp Pro Leu Ser Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln Ser His Leu Leu Leu Gln Gln Gln Val Leu Ser Pro Cys Ser35 40 45Glu Phe Val Arg Gln Gln Tyr Ser Ile Val Ala Thr Pro Phe Trp Gln50 55 60Pro Ala Thr Phe Gln Leu Ile Asn Asn Gln Val Met Gln Gln Gln Cys65 70 75 80
Cys Gln Gln Leu Arg Leu Val Ala Gln Gln Ser His Tyr Gln Ala Ile85 90 95Ser Ile Val Gln Ala Ile Val Gln Gln Leu Gln Leu Gln Gln Phe Ser100 105 110Gly Val Tyr Phe Asp Gln Thr Gln Ala Gln Ala Gln Thr Leu Leu Thr115 120 125Phe Asn Leu Pro Ser Ile Cys Gly Ile Tyr Pro Asn Tyr Tyr Ser Ala130 135 140Pro Arg Ser Ile Ala Thr Val Gly Gly Val Trp Tyr145 150 155<210>15<211>601<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>15attatacaac aaaaatttaa aagaactagt gtcctgcaac aatgaagatc attttcgtct 60ttgctctcct tgctattgct gcatgcagcg ccactgcgca gtttgatgtt ttaggtcaaa 120atattaggca atatcaggtg cagtcgcctc tcctgctaca gcaacaggtg cttagcccat 180ataatgagtt cgtaaggcag cagtatagca ttgcggcaag caccttcttg caatcagctg 240cgtttcaact gagaaacaac caagtcttgc aacagctcag gctggtggcg caacaatctc 300actaccagga cattaacgtt gtccaggcca tagcgcacca gctacacctc cagcagtttg 360gcaatctcta cattgaccgg aatctggctc aagctcaagc actgttggct tttaacttgc 420catctacata tggtatctac ccttggtcct atagtgcacc cgatagcatt accacccttg 480gcggtgtctt gtactgaatt ttcacaatat tgtagttcgg aagtgaaaat ataagctcag 540gtatcatcgt atgtgacatg tgaaacttga ggtgatataa atagaaataa aattatcttt 600c 601<210>16<211>151<212>PRT<213>稻
<220>
<223>13kD谷醇溶蛋白<400>16Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Ser1 5 10 15Ala Thr Ala Gln Phe Asp Val Leu Gly Gln Asn Ile Arg Gln Tyr Gln20 25 30Val Gln Ser Pro Leu Leu Leu Gln Gln Gln Val Leu Ser Pro Tyr Asn35 40 45Glu Phe Val Arg Gln Gln Tyr Ser Ile Ala Ala Ser Thr Phe Leu Gln50 55 60Ser Ala Ala Phe Gln Leu Arg Asn Asn Gln Val Leu Gln Gln Leu Arg65 70 75 80Leu Val Ala Gln Gln Ser His Tyr Gln Asp Ile Asn Val Val Gln Ala85 90 95Ile Ala His Gln Leu His Leu Gln Gln Phe Gly Asn Leu Tyr Ile Asp100 105 110Arg Asn Leu Ala Gln Ala Gln Ala Leu Leu Ala Phe Asn Leu Pro Ser115 120 125Thr Tyr Gly Ile Tyr Pro Trp Ser Tyr Ser Ala Pro Asp Ser Ile Thr130 135 140Thr Leu Gly Gly Val Leu Tyr145 150<210>17<211>596<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>17
gcaaaataga aagatctagt gtcccgcagc aatgaagatcatt ttcgtct ttgctctcct 60tgctattgct gcatgcagcg cctctgcgca gtttgatgtt ttaggtcaaa gttataggca 120atatcagctg cagtcgcctg tcctgctaca gcaacaggtg cttagcccat ataatgagtt 180cgtaaggcag cagtatggca tagcggcaag ccccttcttg caatcagctg cgtttcaact 240gagaaacaac caagtctggc aacagctcgc gctggtggcg caacaatctc actatcagga 300cattaacatt gttcaggcca tagcgcagca gctacaactc cagcagtttg gtgatctcta 360ctttgatcgg aatctggctc aagctcaagc tctgttggct tttaacgtgc catctagata 420tggtatctac cctaggtact atggtgcacc cagtaccatt accacccttg gcggtgtctt 480gtaatgagtt ttaacagtat agtggttcgg aagttaaaaa taagctcaga tatcatatat 540gtgacatgtg aaactttggg tgatataaat agaaaaaaag ttgtctttca tattta 596<210>18<211>150<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白<400>18Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Ser1 5 10 15Ala Ser Ala Gln Phe Asp Val Leu Gly Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln Ser Pro Val Leu Leu Gln Gln Gln Val Leu Ser Pro Tyr Asn35 40 45Glu Phe Val Arg Gln Gln Tyr Gly Ile Ala Ala Ser Pro Phe Leu Gln50 55 60Ser Ala Ala Phe Gln Leu Arg Asn Asn Gln Val Trp Gln Gln Leu Ala65 70 75 80Leu Val Ala Gln Gln Ser His Tyr Gln Asp Ile Asn Ile Val Gln Ala85 90 95Ile Ala Gln Gln Leu Gln Leu Gln Gln Phe Gly Asp Leu Tyr Phe Asp100 105 110Arg Asn Leu Ala Gln Ala Gln Ala Leu Leu Ala Phe Asn Val Pro Ser115 120 125
Arg Tyr Gly Ile Tyr Pro Arg Tyr Tyr Gly Ala Pro Ser Thr Ile Thr130 135 140Thr Leu Gly Gly Val Leu145 150<210>19<211>616<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>19cagttcaagc attatacagc aaaatagaaa gatctagtgt cccgcagcaa tgaagatcat 60tttcgtcttt gctctccttg ctattgctgc atgcagcgcc tctcgcagtt tgattttagg 120tcaaagttat aggcaatatc agctgcagtc gcctgtcctg ctacagcaac aggtgcttag 180cccatataat gagttcgtaa gcagcagtat ggcatacggc aaccccttct tgcaatcagc 240tgcgtttcaa ctgagaaaca accaagtctg gcaacagctc gcgctggtgg cgcaacaatc 300tcactatcag gacattaaca ttgttcaggc catagcgcag cagctacaac tccagcagtt 360tggtgatctc tactttgatc ggaatctggc tcaagctcaa gctctgttgg cttttaacgt 420gccacctaaa tatggtatct accctaggta ctatggtgca cccagtacca ttaccaccct 480tggcggtgtc ttgtaatgaa tttaacagta taatggtcgg aagttaaaaa taagctcaga 540tatcctcata tgtgacatgt gaaactttgg gtgatataaa taaaaaaaaa attgtctttc 600ctatttaaaa aaaaaa 616<210>20<211>148<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白<400>20Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Ser1 5 10 15Ala Ser Arg Ser Leu Ile Leu Gly Gln Ser Tyr Arg Gln Tyr Gln Leu20 25 30
Gln Ser Pro Val Leu Leu Gln Gln Gln Val Leu Ser Pro Tyr Asn Glu35 40 45Phe Val Ser Ser Ser Met Ala Tyr Gly Asn Pro Phe Leu Gln Ser Ala50 55 60Ala Phe Gln Leu Arg Asn Asn Gln Val Trp Gln Gln Leu Ala Leu Val65 70 75 80Ala Gln Gln Ser His Tyr Gln Asp Ile Asn Ile Val Gln Ala Ile Ala85 90 95Gln Gln Leu Gln Leu Gln Gln Phe Gly Asp Leu Tyr Phe Asp Arg Asn100 105 110Leu Ala Gln Ala Gln Ala Leu Leu Ala Phe Asn Val Pro Pro Lys Tyr115 120 125Gly Ile Tyr Pro Arg Tyr Tyr Gly Ala Pro Ser Thr Ile Thr Thr Leu130 135 140Gly Gly Val Leu145<210>21<211>769<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>21ttgctccttc nccgtcctcc ccgcttgggc tcttgggcgc ccgttccggg cgccccctcc 60ctcctccctc cgcggtaccc ggccgcctca ctcctctgct ggacccccng gccgccccgg 120gccgcgcccc atcccggtgc gcgacccatc gttcacacag ttcaagcatt atacagaaaa 180atagaaagat ctagtgtccc gcagcanatg aagatcattt tcgtctttgc tctccttgct 240attgctgcat gcaggcctct gccgagtttg atgtttttag gtcaaagtta taggcaatat 300cagctgcagt cgcctgtcct gctacagcaa caggtgctta gcccatataa tgagttcgta 360aggcagcagt atggcatagc ggcaagcccc ttcttgcaat cagctgcatt tcaactgaga 420aataaccaag tctggcaaca tcaggctggt ggccaacaat ctcgctatca ggacattaac 480attgttcagg ccatagcgta cgagctacaa ctccagcaat ttggtgatct ctactttgat 540
cggaatcagg ctcaagctca agctctattg gcttttaacg tgccatctag atatggtatc 600taccctaggt actatggtgc acccagtacc attaccaccc ttggcggtgt cttgtaatgt 660gttttaacag tatagtggtt cggaagttaa aaataagctc agatatcatc atatgtgaca 720tgtgaaactt tgggtgatat aaatagaaat aaagttgcct ttcatattt 769<210>22<211>149<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白<400>22Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Arg1 5 10 15Pro Leu Pro Ser Leu Met Phe Leu Gly Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln Ser Pro Val Leu Leu Gln Gln Gln Val Leu Ser Pro Tyr Asn35 40 45Glu Phe Val Arg Gln Gln Tyr Gly Ile Ala Ala Ser Pro Phe Leu Gln50 55 60Ser Ala Ala Phe Gln Leu Arg Asn Asn Gln Val Trp Gln His Gln Ala65 70 75 80Gly Gly Gln Gln Ser Arg Tyr Gln Asp Ile Asn Ile Val Gln Ala Ile85 90 95Ala Tyr Glu Leu Gln Leu Gln Gln Phe Gly Asp Leu Tyr Phe Asp Arg100 105 110Asn Gln Ala Gln Ala Gln Ala Leu Leu Ala Phe Asn Val Pro Ser Arg115 120 125Tyr Gly Ile Tyr Pro Arg Tyr Tyr Gly Ala Pro Ser Thr Ile Thr Thr130 135 140Leu Gly Gly Val Leu145
<210>23<211>609<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>23aagcattata caacaaaaat ttaaaagaac tagtgtcctg caacaatgaa gatcattttc 60gtctttgctc tccttgctat tgctgcatgc gccacagcgc agtttgatgt tttaggtcaa 120aatattaggc aatatcaggt gcagtcgcct ctcctgctac agcaacaggt gcttagccta 180tataatgagt tcgtaaggca gcagtatagc attgcggcaa gccccttctt gcaatcagct 240gtgtttcaac tgagaaacaa ccaagtcttg caacagctca ggctggtggc gcaacaatct 300cactaccagg acattaacgt tgtccaggcc atagcgcagc agctacacct ccagcagttt 360ggcgatctct acattgaccg gaatctggct caagcgcaac gactgttggc ttttaacttg 420ccatctacat atggtatcta ccctaggtac tatagagcac cgggtagtat taccaccctt 480ggcggtgtct tgtactgaat tttcacaata ttgtagttcg gaagtgaaaa tataagcctc 540aggtatcatc gtatgtgaca tgtgaaactt aaggtgatat aaatagaaat aaaattatct 600ttcatattt 609<210>24<211>150<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白<400>24Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Ala1 5 10 15Thr Ala Gln Phe Asp Val Leu Gly Gln Asn Ile Arg Gln Tyr Gln Val20 25 30Gln Ser Pro Leu Leu Leu Gln Gln Gln Val Leu Ser Leu Tyr Asn Glu35 40 45Phe Val Arg Gln Gln Tyr Ser Ile Ala Ala Ser Pro Phe Leu Gln Ser50 55 60
Ala Val Phe Gln Leu Arg Asn Asn Gln Val Leu Gln Gln Leu Arg Leu65 70 75 80Val Ala Gln Gln Ser His Tyr Gln Asp Ile Asn Val Val Gln Ala Ile85 90 95Ala Gln Gln Leu His Leu Gln Gln Phe Gly Asp Leu Tyr Ile Asp Arg100 105 110Asn Leu Ala Gln Ala Gln Arg Leu Leu Ala Phe Asn Leu Pro Ser Thr115 120 125Tyr Gly Ile Tyr Pro Arg Tyr Tyr Arg Ala Pro Gly Ser Ile Thr Thr130 135 140Leu Gly Gly Val Leu Tyr145 150<210>25<211>596<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白<400>25ccagcaaaat agaaagatct agtgtcccgc agcaatgaag atcattttcg tctttgctct 60ccttgctatt gctgcatgca ggcctctgca gtttgatgtt ttaggtcaaa gttataggca 120atatcagctg cagtcgcctg tcctgctaca gcaacatgtg cttagcccat ataatgagtt 180cgtaaggcag cagtatggca tagcggcaag ccccttcttg caatcagctg cgtttcaact 240gagaaacaac caagtctggc aacagctcgc gctggtggcg caacaatctc actatcagga 300cattaacatt gttcaggcca tagcgcagca gctacaactc cagcagtttg gtgatctcta 360ctttgatcgg aatctggctc aagctcaagc tctgttggct tttaacgtgc catctagata 420tggtatctac cctaggtact atggtgcacc cagtaccatt accacccttg gcggtgtctt 480gtaatgagtt ttaacagtat agtggttcgg aagataaaaa taagctcaga tatcatcata 540tgtgacatgt gaaactttgg gtgatataaa tagaaaaaaa gttgtctttc atattt 596<210>26<211>149<212>PRT
<213>稻<220>
<223>13kD谷醇溶蛋白<400>26Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Arg1 5 10 15Pro Leu Gln Phe Asp Val Leu Gly Gln Ser Tyr Arg Gln Tyr Gln Leu20 25 30Gln Ser Pro Val Leu Leu Gln Gln His Val Leu Ser Pro Tyr Asn Glu35 40 45Phe Val Arg Gln Gln Tyr Gly Ile Ala Ala Ser Pro Phe Leu Gln Ser50 55 60Ala Ala Phe Gln Leu Arg Asn Asn Gln Val Trp Gln Gln Leu Ala Leu65 70 75 80Val Ala Gln Gln Ser His Tyr Gln Asp Ile Asn Ile Val Gln Ala Ile85 90 95Ala Gln Gln Leu Gln Leu Gln Gln Phe Gly Asp Leu Tyr Phe Asp Arg100 105 110Asn Leu Ala Gln Ala Gln Ala Leu Leu Ala Phe Asn Val Pro Ser Arg115 120 125Tyr Gly Ile Tyr Pro Arg Tyr Tyr Gly Ala Pro Ser Thr Ile Thr Thr130 135 140Leu Gly Gly Val Leu145<210>27<211>285<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白
<400>27gttcgtaagg caacagtata gcatagtggc aacccccttc tggcaaccag ctacgtttca 60tttgataaac aaccaagtca tgcagcagca gttttgccaa cagctcaggc tggtagcaca 120acattctcac taccaggcca ttagtattgt tcaagcgatt gtgcaacagc tacaactgca 180gcattttagt ggtgtctact ttgatcagac tcaagctcaa gcccaaactt ttttgacctt 240caactt tccc atccatatgt ggtatctacc ttaacttact attgt285<210>28<211>94<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白<400>28Phe Val Arg Gln Gln Tyr Ser Ile Val Ala Thr Pro Phe Trp Gln Pro1 5 10 15Ala Thr Phe His Leu Ile Asn Asn Gln Val Met Gln Gln Gln Phe Cys20 25 30Gln Gln Leu Arg Leu Val Ala Gln His Ser His Tyr Gln Ala Ile Ser35 40 45Ile Val Gln Ala Ile Val Gln Gln Leu Gln Leu Gln His Phe Ser Gly50 55 60Val Tyr Phe Asp Gln Thr Gln Ala Gln Ala Gln Thr Phe Leu Thr Phe65 70 75 80Asn Phe Pro Ser Ile Cys Gly Ile Tyr Leu Asn Leu Leu Leu85 90<210>29<211>1836<212>DNA<213>稻<220>
<223>13kD谷醇溶蛋白
<400>29tccacatggg acggggccaa ggtgaggaaa gcaagctgca caaaggatta aagttcttgt 60aaacttgaaa ctcaatttga gtgtttatcc tagctaatat gatcccttca tcctagaata 120taacaatcta gaattagatg tgctatctaa acacattgta gtaggtaatg tgtcatctaa 180tcttagatat aatctaaaac ggaaggtgaa acggagggag tacctacata gtaatggcat 240gcctatgttg cttaatttga cccgtgcagc tgagtatatg tgatggagac aaaagttact 300ttcatgatgg caccaaagga gatttgttgg ggtgcctaat agaacatcga tccaaatgac 360acgacacact tagattctaa taggacatcc aagcaaaaca acacttagat cctaatagga 420catccaagca aaactaacac tctagagcaa ccgataagga attgaaaaag tttgtccatc 480attcttgaca agaggtagtg tacaaaaaaa atatttagtt gagctctcgc tcactacgca 540tcacagaagt ataacctaga tataattaat tcagtataga agcaaaaatt cagcagcaac 600aatgagggta aaaactagaa agaaggattt atgatgttcc tcagtttatt cagtcgcaaa 660agatagttta ctgtaaacaa aatggataat aaacctgatg tttcaacaaa actagaggaa 720ctctgtaaat tgtccaggtt catccctaga agttggtttc tccttacggg aggagggagt 780atatgtgatg gacacaaaag ttactttcat gatgaaacca aagggtattt gttggggcac 840ctaacagaac atctatctaa atgacatgac tcacttagat cctaatagga catccaagca 900aaactaacac tctaaagcaa ccgatgagga attgaaagaa aatatatgcc atcgcatcta 960taaatagaca agcccaatga aaaccctcct catcgtttac acagttcaag cattatacag 1020aaaagaagat ctagtgtccc gcagcaatga agatcatttt ccgtctttgc tctccttgct 1080attgctgcat gcaacacctc tgcgtagttg atgttttagg tcaaagttat aggcaatatc 1140agctacagtc gcctctccta caacaacaac aggtgcttag cccatataat gacttcgtaa 1200ggcagcgata tggcatagcg gcaagcccct tcttgcaatc agctgcgttt aaactgagaa 1260ataaccaagt ctggcaacag ctcgggctgg tggcgcaaca atctcactat caggacatta 1320acattgttca ggccatagcg cagcagctat aactccagca gtttggtgat ctctactttg 1380atcggaatcc ggctcaagct caagctctgt tggcttttaa cgtgccatct agatatggta 1440tctaccctag gtactatagt acacccagta ccattaccac ccttggcggt gtcttgtaat 1500gagttttaac agtatagtgg ttcggaagtt aaaaataagc tcatatatta tcatatgtga 1560catgtgaaat ttggggtgaa ataaatcgaa ataaagttgt ctttcatatt taaataccat 1620gcctctataa ggatatatcc tagtacattg tcgtaactaa ttaccatcat cggtactcta 1680caattttact gtgttcttac attcgatccg aagctacttt gtttttaaga tataaatgga 1740gcgtataaag gatgtccgtc ctttcattcc aataagaaca atgtaacatc ctgaaaatgt 1800gtcattttct aatcctgcat catgccgact cttatg1836<210>30<211>101<212>PRT<213>稻<220>
<223>13kD谷醇溶蛋白<400>30
Met Lys Ile Ile Phe Arg Leu Cys Ser Pro Cys Tyr Cys Cys Met Gln1 5 10 15His Leu Cys Val Val Asp Val Leu Gly Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln Ser Pro Leu Leu Gln Gln Gln Gln Val Leu Ser Pro Tyr Asn35 40 45Asp Phe Val Arg Gln Arg Tyr Gly Ile Ala Ala Ser Pro Phe Leu Gln50 55 60Ser Ala Ala Phe Lys Leu Arg Asn Asn Gln Val Trp Gln Gln Leu Gly65 70 75 80Leu Val Ala Gln Gln Ser His Tyr Gln Asp Ile Asn Ile Val Gln Ala85 90 95Ile Ala Gln Gln Leu100<210>31<211>622<212>DNA<213>稻<220>
<223>16kD谷醇溶蛋白<400>31aaacatcaaa acgttataag agttctctag catccatcac atagccatga agatctttgt 60catcctctct ctcctcgccc tcgcagcgag cagcgcctcg gcacagtttg atgcttgcac 120ctatgggcaa tgccagcagc agccgtttat gcaaccgatc atgaacccgt gcaatgagtt 180cgtgaggcaa cagtgcagcc cgatgagcct accttggaag cagtcacgca ggctacaact 240gagcagctgc caggtgatgc ggcagcaatg ctgtcagcag atgaggttga tggcgcaaca 300atatcattgc caggctattt gcaccatggt gcagtctatc atgcagcaag tgcagtttga 360tgctggcttt gttggcgagc cccaagctca ggcccaggcc caggtggctc tcaatttgcc 420ctccatgtgt ggagtctacc ctaggtactg cagcactcca tgcaaagttg ctactggtca 480ttgcggttct tggtagtgtg taccatcata tatatatagt tggataaata aagtgtcaca 540catcatcgtg tgtgtcatgt aataaaattt ggaatagtct ttggctgttc gtatgaataa 600atgaaaatta taacaaaaaa aa 622
<210>32<211>149<212>PRT<213>稻<220>
<223>16kD谷醇溶蛋白<400>32Met Lys Ile Phe Val Ile Leu Ser Leu Leu Ala Leu Ala Ala Ser Ser1 5 10 15Ala Ser Ala Gln Phe Asp Ala Cys Thr Tyr Gly Gln Cys Gln Gln Gln20 25 30Pro Phe Met Gln Pro Ile Met Asn Pro Cys Asn Glu Phe Val Arg Gln35 40 45Gln Cys Ser Pro Met Ser Leu Pro Trp Lys Gln Ser Arg Arg Leu Gln50 55 60Leu Ser Ser Cys Gln Val Met Arg Gln Gln Cys Cys Gln Gln Met Arg65 70 75 80Leu Met Ala Gln Gln Tyr His Cys Gln Ala Ile Cys Thr Met Val Gln85 90 95Ser Ile Met Gln Gln Val Gln Phe Asp Ala Gly Phe Val Gly Glu Pro100 105 110Gln Ala Gln Ala Gln Ala Gln Val Ala Leu Asn Leu Pro Ser Met Cys115 120 125Gly Val Tyr Pro Arg Tyr Cys Ser Thr Pro Cys Lys Val Ala Thr Gly130 135 140His Cys Gly Ser Trp145<210>33<211>562<212>DNA<213>稻
<220>
<223>10kD谷醇溶蛋白<400>33cgtctacacc atctggaatc ttgtttaaca ctagtattgt agaatcagca atggcagcat 60acaccagcaa gatctttgcc ctgtttgcct taattgctct ttctgcaagt gccactactg 120caatcaccac tatgcagtat ttcccaccaa cattagccat gggcaccatg gatccgtgta 180ggcagtacat gatgcaaacg ttgggcatgg gtagctccac agccatgttc atgtcgcagc 240caatggcgct cctgcagcag caatgttgca tgcagctaca aggcatgatg cctcagtgcc 300actgtggcac cagttgccag atgatgcaga gcatgcaaca agttatttgt gctggactcg 360ggcagcagca gatgatgaag atggcgatgc agatgccata catgtgcaac atggcccctg 420tcaacttcca actctcttcc tgtggttgtt gttgatcaaa cgttggttac atgtactcta 480gtaataaggt gttgcatact atcgtgtgca aacactagaa ataagaacca ttgaataaaa 540tatcaatcat tttcagactt gc 562<210>34<211>134<212>PRT<213>稻<220>
<223>10kD谷醇溶蛋白<400>34Met Ala Ala Tyr Thr Ser Lys Ile Phe Ala Leu Phe Ala Leu Ile Ala1 5 10 15Leu Ser Ala Ser Ala Thr Thr Ala Ile Thr Thr Met Gln Tyr Phe Pro20 25 30Pro Thr Leu Ala Met Gly Thr Met Asp Pro Cys Arg Gln Tyr Met Met35 40 45Gln Thr Leu Gly Met Gly Ser Ser Thr Ala Met Phe Met Ser Gln Pro50 55 60Met Ala Leu Leu Gln Gln Gln Cys Cys Met Gln Leu Gln Gly Met Met65 70 75 80Pro Gln Cys His Cys Gly Thr Ser Cys Gln Met Met Gln Ser Met Gln85 90 95
Gln Val Ile Cys Ala Gly Leu Gly Gln Gln Gln Met Met Lys Met Ala100 105 110Met Gln Met Pro Tyr Met Cys Asn Met Ala Pro Val Asn Phe Gln Leu115120 125Ser Ser Cys Gly Cys Cys130<210>35<211>332<212>DNA<213>红芒稻<220>
<223>10kD谷醇溶蛋白<400>35aattgctctt tctgcaagtg ccactactgc aatcaccact atgcagtatt tcccaccaac 60attagccatg ggcaccatgg atccgtgtag gcagtacatg atgcaaacgt tgggcatggg 120tagctccaca gccatgttca tgtcgcagcc aatggcgctc ctgcagcagc aatgttgcat 180gcagctacaa ggcatgatgc ctcagtgcca ctgtggcacc agttgccaga tgatgcagag 240catgcaacaa gttatttgtg ctggactcgg gcagcagcag atgatgaaga tggcgatgca 300gatgccatac atgtgcaaca tggcccctgt ca 332<210>36<211>110<212>PRT<213>红芒稻<220>
<223>10kD谷醇溶蛋白<400>36Ile Ala Leu Ser Ala Ser Ala Thr Thr Ala Ile Thr Thr Met Gln Tyr15 10 15Phe Pro Pro Thr Leu Ala Met Gly Thr Met Asp Pro Cys Arg Gln Tyr20 25 30Met Met Gln Thr Leu Gly Met Gly Ser Ser Thr Ala Met Phe Met Ser35 40 45
Gln Pro Met Ala Leu Leu Gln Gln Gln Cys Cys Met Gln Leu Gln Gly50 55 60Met Met Pro Gln Cys His Cys Gly Thr Ser Cys Gln Met Met Gln Ser65 70 75 80Met Gln Gln Val Ile Cys Ala Gly Leu Gly Gln Gln Gln Met Met Lys85 90 95Met Ala Met Gln Met Pro Tyr Met Cys Asn Met Ala Pro Val100 105 110<210>37<211>349<212>DNA<213>长秆稻<220>
<223>10kD谷醇溶蛋白<400>37ccctgtttgc cttaattnnt cttctttctg caagtgccac tactgcaatc actactatgc 60agtatttccc accaacatta gccatgggca ccatggatcc gtgtaggcag tacatgatgc 120aaacgttggg catgggtagc tccacaacca tgttcatgtc gcagccaatg gcgctcctgc 180agcagcaatg ttgcatgcag ctacaaggca tgatgcctca gtgccactgt ggcaccagtt 240gccagatgat gcagagcatg caacaagttg tttgtgctgg actcgggcag cagcagatga 300tgatgaagat ggcaatgcag atgccataca tgtgcaacat ggcccctgt 349<210>38<211>116<212>PRT<213>长秆稻<220>
<223>10kD谷醇溶蛋白<400>38Leu Phe Ala Leu Ile Xaa Leu Leu Ser Ala Ser Ala Thr Thr Ala Ile15 10 15Thr Thr Met Gln Tyr Phe Pro Pro Thr Leu Ala Met Gly Thr Met Asp
20 25 30Pro Cys Arg Gln Tyr Met Met Gln Thr Leu Gly Met Gly Ser Ser Thr35 40 45Thr Met Phe Met Ser Gln Pro Met Ala Leu Leu Gln Gln Gln Cys Cys50 55 60Met Gln Leu Gln Gly Met Met Pro Gln Cys His Cys Gly Thr Ser Cys65 70 75 80Gln Met Met Gln Ser Met Gln Gln Val Val Cys Ala Gly Leu Gly Gln85 90 95Gln Gln Met Met Met Lys Met Ala Met Gln Met Pro Tyr Met Cys Asn100 105 110Met Ala Pro Val115<210>39<211>343<212>DNA<213>红芒稻<220>
<223>10kD谷醇溶蛋白<400>39ctgtttgcct taattgctct ttctgcaagt gccactactg caatcaccac tatgcagtat 60ttcccaccaa cattagccat gggcaccatg gatccgtgta ggcagtacat gatgcaaacg 120ttgggcatgg gtagctccac agccatgttc atgtcgcagc caatggcgct cctgcagcag 180caatgttgca tgcagctaca aggcatgatg cctcagtgcc actgtggcac cagttgccag 240atgatgcaga gcatgcaaca agttatttgt gctggactcg ggcagcagca gatgatgaag 300atggcgatgc agatgccata catgtgcaac atggcccctg tca 343<210>40<211>113<212>PRT<213>红芒稻<220>
<223>10kD谷醇溶蛋白<400>40Leu Phe Ala Leu Ile Ala Leu Ser Ala Ser Ala Thr Thr Ala Ile Thr1 5 10 15Thr Met Gln Tyr Phe Pro Pro Thr Leu Ala Met Gly Thr Met Asp Pro20 25 30Cys Arg Gln Tyr Met Met Gln Thr Leu Gly Met Gly Ser Ser Thr Ala35 40 45Met Phe Met Ser Gln Pro Met Ala Leu Leu Gln Gln Gln Cys Cys Met50 55 60Gln Leu Gln Gly Met Met Pro Gln Cys His Cys Gly Thr Ser Cys Gln65 70 75 80Met Met Gln Ser Met Gln Gln Val Ile Cys Ala Gly Leu Gly Gln Gln85 90 95Gln Met Met Lys Met Ala Met Gln Met Pro Tyr Met Cys Asn Met Ala100 105 110Pro<210>41<211>339<212>DNA<213>红芒稻<220>
<223>10kD谷醇溶蛋白<400>41tttgccttaa ttgctctttc tgcaagtgcc actactgcaa tcaccactat gcagtatttc 60ccaccaacat tagccatggg caccatggat ccgtgtaggc agtacatgat gcaaacgttg 120ggcatgggta gctccacagc catgttcatg tcgcagccaa tggcgctcct gcagcagcaa 180tgttgcatgc agctacaagg catgatgcct cagtgccact gtggcaccag ttgccagatg 240atgcagagca tgcaacaagt tatttgtgct ggactcgggc agcagcagat gatgaagatg 300gcgatgcaga tgccatacat gtgcaacatg gcccctgtc339
<210>42<211>113<212>PRT<213>红芒稻<220>
<223>10kD谷醇溶蛋白<400>42Phe Ala Leu Ile Ala Leu Ser Ala Ser Ala Thr Thr Ala Ile Thr Thr1 5 10 15Met Gln Tyr Phe Pro Pro Thr Leu Ala Met Gly Thr Met Asp Pro Cys20 25 30Arg Gln Tyr Met Met Gln Thr Leu Gly Met Gly Ser Ser Thr Ala Met35 40 45Phe Met Ser Gln Pro Met Ala Leu Leu Gln Gln Gln Cys Cys Met Gln50 55 60Leu Gln Gly Met Met Pro Gln Cys His Cys Gly Thr Ser Cys Gln Met65 70 75 80Met Gln Ser Met Gln Gln Val Ile Cys Ala Gly Leu Gly Gln Gln Gln85 90 95Met Met Lys Met Ala Met Gln Met Pro Tyr Met Cys Asn Met Ala Pro100 105 110Val<210>43<211>343<212>DNA<213>红芒稻<220>
<223>10kD谷醇溶蛋白<400>43
ccctgtttgc cttaattgnt ctttctgcaa gtgccactac tgcaatcacc actatgcagt 60atttcccacc aacattagcc atgggcacca tggatccgtg taggcagtac atgatgcaaa 120cgttgggcat gggtagctcc acagccatgt tcatgtcgca gccaatggcg ctcctgcagc 180agcaatgttg catgcagcta caaggcatga tgcctcagtg ccactgtggc accagttgcc 240agatgatgca gagcatgcaa caagttattt gtgctggact cgggcagcag cagatgatga 300agatggcgat gcagatgcca tacatgtgca acatggcccc tgt 343<210>44<211>114<212>PRT<213>红芒稻<220>
<223>10kD谷醇溶蛋白<400>44Leu Phe Ala Leu Ile Xaa Leu Ser Ala Ser Ala Thr Thr Ala Ile Thr1 5 10 15Thr Met Gln Tyr Phe Pro Pro Thr Leu Ala Met Gly Thr Met Asp Pro20 25 30Cys Arg Gln Tyr Met Met Gln Thr Leu Gly Met Gly Ser Ser Thr Ala35 40 45Met Phe Met Ser Gln Pro Met Ala Leu Leu Gln Gln Gln Cys Cys Met50 55 60Gln Leu Gln Gly Met Met Pro Gln Cys His Cys Gly Thr Ser Cys Gln65 70 75 80Met Met Gln Ser Met Gln Gln Val Ile Cys Ala Gly Leu Gly Gln Gln85 90 95Gln Met Met Lys Met Ala Met Gln Met Pro Tyr Met Cys Asn Met Ala100 105 110Pro Val<210>45<211>533
<212>DNA<213>稻<220>
<223>10kD谷醇溶蛋白<400>45atggcagcat acaccagcaa gatctttgcc ctgtttgcct taattgctct ttctgcaagt 60gccactactg caatcaccac tatgcagtat ttcccaccaa cattagccat gggcaccatg 120gatccgtgta ggcagtacat gatgcaaacg ttgggcatgg gtagctccac agccatgttc 180atgtcgcagc caatggcgct cctgctgcag caatgttgca tgcagctaca aggcatgatg 240cctcagtgcc actgtggcac cagttgccag atgatgcaga gcatgcaaca agttatttgt 300gctggactcg ggcagcagca gatgatgaag atggcgatgc agatgccata catgtgcaac 360atggcccctg tcaacttcca actctcttcc tgtggttgtt gttgatgaaa cgttggttac 420atgtactcta gtaataaggt gttgcatact atcgtgtgca aacactagaa ataagtacca 480ttgaataaaa tatcaaacat tttcagactt gcaaaaaaaa aaaaaaaaaa aaa533<210>46<211>134<212>PRT<213>稻<220>
<223>10kD谷醇溶蛋白<400>46Met Ala Ala Tyr Thr Ser Lys Ile Phe Ala Leu Phe Ala Leu Ile Ala1 5 10 15Leu Ser Ala Ser Ala Thr Thr Ala Ile Thr Thr Met Gln Tyr Phe Pro20 25 30Pro Thr Leu Ala Met Gly Thr Met Asp Pro Cys Arg Gln Tyr Met Met35 40 45Gln Thr Leu Gly Met Gly Ser Ser Thr Ala Met Phe Met Ser Gln Pro50 55 60Met Ala Leu Leu Leu Gln Gln Cys Cys Met Gln Leu Gln Gly Met Met65 70 75 80Pro Gln Cys His Cys Gly Thr Ser Cys Gln Met Met Gln Ser Met Gln85 90 95
Gln Val Ile Cys Ala Gly Leu Gly Gln Gln Gln Met Met Lys Met Ala100 105 110Met Gln Met Pro Tyr Met Cys Asn Met Ala Pro Val Asn Phe Gln Leu115 120 125Ser Ser Cys Gly Cys Cys130<210>47<211>940<212>DNA<213>稻<220>
<223>10kDa谷醇溶蛋白启动子<400>47aatttagatc tatacatccg ttggtacatc tctactactc tagtactaaa aacatgagat 60ctgaacatgg ctgcataggt tctccatccc aattcaccct gcagtgatcg ctgcactgga 120taattataat atcagttaaa attgaaaata atgcaacttc atacttgcat ggtgtcagta 180gtgcctgcct aagaaatgtg tcttgtcata atatgattac atgaaatatg tttacttcct 240tcgtttctct ttatttgtaa gataaagaac tagatatgtg gaaagtagga tagcaaagag 300tatggccaaa ctctaatctt tgctttattt tttgggatgg acccaaaatt tgtttctcct 360ttacttcttt ccctttacaa caatgttctt tacttccaat tcttattaac aaaactccaa 420atacatgcca aactgcatat gtatgtatgc tattaaggca catttacaaa gctccaagtt 480tacctactca atcattcaca tatggcgatg actcaaactc ttaattgtta tctgtgtaag 540ctgtgacttg tgtaacacat tctacaagtc ccatacgaat tctgttcaca aaagtttctt 600tgtccagctc ataatttaca aaactgcaaa atgccaaagc aatctggcac aaccttatca 660tcatattttc tttccacgca ttaaagcact ggcagaatta tctttgtgta gatattccaa 720aagtattggt tgaataaatg tccaaataaa ttccatgcct catgatttcc agcttatgtg 780gcctccacta ggtggttttg caaaggccaa actctttcct ggcttacaca gctaccagca 840tgtataaata ggcccctagg caaccattat tccatcatcc tcaacaatat tgtctacacc 900atctggaatc ttgtttaaca ctagtattgt agaatcagca 940<210>48<211>1351<212>DNA<213>稻<220>
<223>GLUTELIN 亅B1启动子<400>48gatctcgatt tttgaggaat tttagaagtt gaacagagtc aatcgaacag acagttgaag 60agatatggat tttctaagat taattgattc tctgtctaaa gaaaaaaagt attattgaat 120taaatggaaa aagaaaaagg aaaaagggga tggcttctgc tttttgggct gaaggcggcg 180tgtggccagc gtgctgcgtg cggacagcga gcgaacacac gacggagcag ctacgacgaa 240cgggggaccg agtggaccgg acgaggatgt ggcctaggac gagtgcacaa ggctagtgga 300ctcggtcccc gcgcggtatc ccgagtggtc cactgtctgc aaacacgatt cacatagagc 360gggcagacgc gggagccgtc ctaggtgcac cggaagcaaa tccgtcgcct gggtggattt 420gagtgacacg gcccacgtgt agcctcacag ctctccgtgg tcagatgtgt aaaattatca 480taatatgtgt ttttcaaata gttaaataat atatataggc aagttatatg ggtcaataag 540cagtaaaaag gcttatgaca tggtaaaatt acttacacca atatgcctta ctgtctgata 600tattttacat gacaacaaag ttacaagtac gtcatttaaa aatacaagtt acttatcaat 660tgtagtgtat caagtaaatg acaacaaacc tacaaatttg ctattttgaa ggaacactta 720aaaaaatcaa taggcaagtt atatagtcaa taaactgcaa gaaggcttat gacatggaaa 780aattacatac accaatatgc tttattgtcc ggtatatttt acaagacaac aaagttataa 840gtatgtcatt taaaaataca agttacttat caattgtcaa gtaaatgaaa acaaacctac 900aaatttgtta ttttgaagga acacctaaat tatcaaatat agcttgctac gcaaaatgac 960aacatgctta caagttatta tcatcttaaa gttagactca tcttctcaag cataagagct 1020ttatggtgca aaaacaaata taatgacaag gcaaagatac atacatatta agagtatgga 1080cagacatttc tttaacaaac tccatttgta ttactccaaa agcaccagaa gtttgtcatg 1140gctgagtcat gaaatgtata gttcaatctt gcaaagttgc ctttcctttt gtactgtgtt 1200ttaacactac aagccatata ttgtctgtac gtgcaacaaa ctatatcacc atgtatccca 1260agatgctttt ttattgctat ataaactagc ttggtctgtc tttgaactca catcaattag 1320cttaagtttc cataagcaag tacaaatagc t 1351<210>49<211>24<212>DNA<213>未知生物<220>
<223>未知生物的描述CaMV 35S基因启动子<400>49ccccagatta gccttttcaa tttcagaaag aatgctaacc cacagatggt tagagaggct 60tacgcagcag gtctcatcaa gacgatctac ccgagcaata atctccagga aatcaaatac120cttcccaaga aggttaaaga tgcagtcaaa agattcagga ctaactgcat caagaacaca180gagaaagata tatttctcaa gatcagaagt actattccag tatggacgat tcaaggcttg240cttcacaaac caaggcaagt aatagagatt ggagtctcta aaaaggtagt tcccactgaa300tcaaaggcca tggagtcaaa gattcaaata gaggacctaa cagaactcgc cgtaaagact360
ggcgaacagt tcatacagag tctcttacga ctcaatgaca agaagaaaat cttcgtcaac420atggtggagc acgacacact tgtctactcc aaaaatatca aagatacagt ctcagaagac480caaagggcaa ttgagacttt tcaacaaagg gtaatatccg gaaacctcct cggattccat540tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg ctcctacaaa600tgccatcatt gcgataaagg aaaggccatc gttgaagatg cctctgccga cagtggtccc660aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc aaccacgtct720tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacgc acaatcccac780tatccttcgc aagacccttc ctctatataa ggaagttcat ttcatttgga gagaacacgg840gggactgtcg ag852<210>50<211>24<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>50actagacggt cggcatctac tctattcctt tgccctcgga cgagtgctgg ggcgtcggtt 60tccactatcg gcgagtactt ctacacagcc atcggtccag acggccgcgc ttctgcgggc120gatttgtgta cgcccgacag tcccggctcc ggatcggacg attgcgtcgc atcgaccctg180cgcccaagct gcatcatcga aattgccgtc aaccaagctc tgatagagtt ggtcaagacc240aatgcggagc atatacgccc ggagccgcgg cgatcctgca agctccggat gcctccgctc300gaagtagcgc gtctgctgct ccatacaagc caaccacggc ctccagaaga agatgttggc360gacctcgtat tgggaatccc cgaacatcgc ctcgctccag tcaatgaccg ctgttatgcg420gccattgtcc gtcaggacat tgttggagcc gaaatccgcg tgcacgaggt gccggacttc480ggggcagtcc tcggcccaaa gcatcagctc atcgagagcc tgcgcgacgg acgcactgac540ggtgtcgtcc atcacagttt gccagtgata cacatgggga tcagcaatcg cgcatatgaa600atcacgccat gtagtgtatt gaccgattcc ttgcggtccg aatgggccga acccgctcgt660ctggctaaga tcggccgcag cgatcgcatc catgacctcc gcgaccggct gaagaacagc720gggcagttcg gtttcaggca ggtcttgcaa cgtgacaccc tgtgcacggc gggagatgca780ataggtcagg ctctcgctga actccccaat gtcaagcact tccggaatcg ggagcgcggc840cgatgcaaag tgccgataaa cataacgatc tttgtagaaa ccatcggcgc agctatttac900ccgcaggaca tatccacgcc ctcctacatc gaagctgaaa gcacgagatt cttcgccctc960cgagagctgc atcaggtcgg agacgctgtc gaacttttcg atcagaaact tctcgacaga 1020cgtcgcggtg agttcaggct ttttcat 1047<210>51<211>67<212>DNA<213>人工序列
<220>
<223>人工序列的描述反义<400>51aatgaagatc attttcgtat ttgctctcct tgctattgtt gcatgcaacg cttctgcacg 60gtttgat 67<210>52<211>15<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>52atgaagatca ttttc 15<210>53<211>15<212>DNA<213>人工序列<220>
<223>人工序列的描述控制序列sequence<400>53ggatcccggg gtacc 15<210>54<211>20<212>DNA<213>未知生物<220>
<223>未知生物的描述潮霉素磷酸转移酶基因<400>54
atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat120gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat180cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt240ggggagttca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg300caagacctgc ctgaaaccga actgcccgct gttcttcagc cggtcgcgga ggtcatggat360gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga420atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat480cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag540ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc600tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg660atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct720tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg780cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac840ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga900gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc960tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020gaatagagta gatgccgacc gtctagt 1047<210>55<211>265<212>DNA<213>未知生物<220>
<223>未知生物的描述Nos终止子<400>55gaatttcccc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 60cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 120catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 180catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 240ggtgtcatct atgttactag atcgg 265<210>56<211>341<212>PRT<213>人工序列<220>
<223>人工序列的描述经修饰的HPT
<400>56Met Lys Lys Pro Glu Leu Thr Ala Thr Ser Val Glu Lys Phe Leu Ile1 5 10 15Glu Lys Phe Asp Ser Val Ser Asp Leu Met Gln Leu Ser Glu Gly Glu20 25 30Glu Ser Arg Ala Phe Ser Phe Asp Val Gly Gly Arg Gly Tyr Val Leu35 40 45Arg Val Asn Ser Cys Ala Asp Gly Phe Tyr Lys Asp Arg Tyr Val Tyr50 55 60Arg His Phe Ala Ser Ala Ala Leu Pro Ile Pro Glu Val Leu Asp Ile65 70 75 80Gly Glu Phe Ser Glu Ser Leu Thr Tyr Cys Ile Ser Arg Arg Ala Gln85 90 95Gly Val Thr Leu Gln Asp Leu Pro Glu Thr Glu Leu Pro Ala Val Leu100 105 110Gln Pro Val Ala Glu Val Met Asp Ala Ile Ala Ala Ala Asp Leu Ser115 120 125Gln Thr Ser Gly Phe Gly Pro Phe Gly Pro Gln Gly Ile Gly Gln Tyr130 135 140Thr Thr Trp Arg Asp Phe Ile Cys Ala Ile Ala Asp Pro His Val Tyr145 150 155 160His Trp Gln Thr Val Met Asp Asp Thr Val Ser Ala Ser Val Ala Gln165 170 175Ala Leu Asp Glu Leu Met Leu Trp Ala Glu Asp Cys Pro Glu Val Arg180 185 190His Leu Val His Ala Asp Phe Gly Ser Asn Asn Val Leu Thr Asp Asn195 200 205Gly Arg Ile Thr Ala Val Ile Asp Trp Ser Glu Ala Met Phe Gly Asp210 215 220Ser Gln Tyr Glu Val Ala Asn Ile Phe Phe Trp Arg Pro Trp Leu Ala
225 230 235 240Cys Met Glu Gln Gln Thr Arg Tyr Phe Glu Arg Arg His Pro Glu Leu245 250 255Ala Gly Ser Pro Arg Leu Arg Ala Tyr Met Leu Arg Ile Gly Leu Asp260 265 270Gln Leu Tyr Gln Ser Leu Val Asp Gly Asn Phe Asp Asp Ala Ala Trp275 280 285Ala Gln Gly Arg Cys Asp Ala Ile Val Arg Ser Gly Ala Gly Thr Val290 295 300Gly Arg Thr Gln Ile Ala Arg Arg Ser Ala Ala Val Trp Thr Asp Gly305 310 315 320Cys Val Glu Val Leu Ala Asp Ser Gly Asn Arg Arg Pro Ser Thr Arg325 330 335Pro Arg Ala Lys Glu340<210>57<211>2158<212>DNA<213>人工序列<220>
<223>人工序列的描述CAMV35S 亅经修饰的HPT 亅NOS<400>57ccccagatta gccttttcaa tttcagaaag aatgctaacc cacagatggt tagagaggct 60tacgcagcag gtctcatcaa gacgatctac ccgagcaata atctccagga aatcaaatac 120cttcccaaga aggttaaaga tgcagtcaaa agattcagga ctaactgcat caagaacaca 180gagaaagata tatttctcaa gatcagaagt actattccag tatggacgat tcaaggcttg 240cttcacaaac caaggcaagt aatagagatt ggagtctcta aaaaggtagt tcccactgaa 300tcaaaggcca tggagtcaaa gattcaaata gaggacctaa cagaactcgc cgtaaagact 360ggcgaacagt tcatacagag tctcttacga ctcaatgaca agaagaaaat cttcgtcaac 420atggtggagc acgacacact tgtctactcc aaaaatatca aagatacagt ctcagaagac 480caaagggcaa ttgagacttt tcaacaaagg gtaatatccg gaaacctcct cggattccat 540tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg ctcctacaaa 600tgccatcatt gcgataaagg aaaggccatc gttgaagatg cctctgccga cagtggtccc 660
aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc aaccacgtct 720tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacgc acaatcccac 780tatccttcgc aagacccttc ctctatataa ggaagttcat ttcatttgga gagaacacgg 840gggactgtcg agatgaaaaa gcctgaactc accgcgacgt ctgtcgagaa gtttctgatc 900gaaaagttcg acagcgtctc cgacctgatg cagctctcgg agggcgaaga atctcgtgct 960ttcagcttcg atgtaggagg gcgtggatat gtcctgcggg taaatagctg cgccgatggt 1020ttctacaaag atcgttatgt ttatcggcac tttgcatcgg ccgcgctccc gattccggaa 1080gtgcttgaca ttggggagtt cagcgagagc ctgacctatt gcatctcccg ccgtgcacag 1140ggtgtcacgt tgcaagacct gcctgaaacc gaactgcccg ctgttcttca gccggtcgcg 1200gaggtcatgg atgcgatcgc tgcggccgat cttagccaga cgagcgggtt cggcccattc 1260ggaccgcaag gaatcggtca atacactaca tggcgtgatt tcatatgcgc gattgctgat 1320ccccatgtgt atcactggca aactgtgatg gacgacaccg tcagtgcgtc cgtcgcgcag 1380gctctcgatg agctgatgct ttgggccgag gactgccccg aagtccggca cctcgtgcac 1440gcggatttcg gctccaacaa tgtcctgacg gacaatggcc gcataacagc ggtcattgac 1500tggagcgagg cgatgttcgg ggattcccaa tacgaggtcg ccaacatctt cttctggagg 1560ccgtggttgg cttgtatgga gcagcagacg cgctacttcg agcggaggca tccggagctt 1620gcaggatcgc cgcggctccg ggcgtatatg ctccgcattg gtcttgacca actctatcag 1680agcttggttg acggcaattt cgatgatgca gcttgggcgc agggtcgatg cgacgcaatc 1740gtccgatccg gagccgggac tgtcgggcgt acacaaatcg cccgcagaag cgcggccgtc 1800tggaccgatg gctgtgtaga agtactcgcc gatagtggaa accgacgccc cagcactcgt 1860ccgagggcaa aggaatagag tagatgccga ccgtctagtg aatttccccg atcgttcaaa 1920catttggcaa taaagtttct taagattgaa tcctgttgcc ggtcttgcga tgattatcat 1980ataatttctg ttgaattacg ttaagcatgt aataattaac atgtaatgca tgacgttatt 2040tatgagatgg gtttttatga ttagagtccc gcaattatac atttaatacg cgatagaaaa 2100caaaatatag cgcgcaaact aggataaatt atcgcgcgcg gtgtcatcta tgttacta 2158<210>58<211>1757<212>DNA<213>人工序列<220>
<223>人工序列的描述启动子<400>58ctgatgatta ttttgttgat catgattttc ttttggctat ttgatttttt gaaagatatt 60tttttccctg ggaagacacc tatgggacga agatattatg tttcttatat agcaccaaac 120aaatttaata tatatatata tatatatata tatatatata tatatatata tatatatata 180tatatatata tatatatata tatatatata tatcacatca gtctctgcac aaagtgcatc 240ctgggctgct tcaattataa agccccattc accacatttg ctagatagtc gaaaagcacc 300atcaatattg agcttcaggt atttttggtt gtgttgtggt tggattgatt ctaatatata 360ccaaatcaat ataattcact accaaaatat accatagcca tcacaacttt attaattttg 420gtagcttaag atggtatata taataaccaa ttaacaactg attctaattt tactacggcc 480
cagtatgtac caatacaaaa caacgagtat gttttcttcc atcgtaatcg tacacagtac 540aaaaaaacct ggccagcctt tcttgggctg gggctctctt tcgaaaggtc acaaaacgta 600cacggcagta acgccgcttc gctgcgtgtt aacggccacc aaccccgccg tgagcaaacg 660gcatcagctt tccacctcct cgatatctcc gcggcgccgt ctggacccgc cccctttccg 720ttcctttctt tccttctcgc gtttgcgtgg tggggacgga ctccccaaac cgcctctccc 780tctctccttt ctttatttgt ctatattctc actgggcccc acccaccgca cccctgggcc 840cactcacgag tccccccctc cccacctata aataccccac cccctcctcg cctcttcctc 900cgtcaatcga accccaaaat cgcagagaaa aaaaaatctc ccctcgaagc gaagcgtcga 960atcgccttct caaggtatgc gattttctga tcctctccgt tcctcgcgtt tgatttgatt 1020tcccggcctg ttcgtgattg tgagatgttg tggttagtct ccgttttgcg atctgtggta 1080gatttgaaca ggtttagatg gggttcgcgt ggtatgctgg atctgtgatt atgagcgatg 1140ctgttcgtgg tccaagtatt gattggttcg gatctagtag tagaactgtg ctagggttgt 1200gattcgttcc gatctgttca attagtagga tttagtctct gtttttctcg ttgatccaag 1260tagcagcttc aggtatattt tgcttaggtt gtttttgatt cagtccctct agttgcatag 1320attctactct gttcatgttt aatctaaggg ctgcgtcttg ttgattagtg attacatagc 1380atagctttca ggatatttta cttgcttatg cctatcttat caactgttgc acctgtaaat 1440tctagcctat gttataacct gccttatgtg ctctcgggat agtgctagta gttattgaat 1500cagtttgccg atggatttct agtagttcat agacctgcat attatttttg tgaacacgag 1560cacggtgcgt ctctctattt tgttaggtca ctgttggtgt tgataggtac actgatgtta 1620ttgtggttta ggtcgtgtat ctaacatatt ggaataattt gattgactga tttctgctgt 1680acttgcttgg tattgttata atttcatgtt catagttgct gaccatgctt cggtaattgt 1740gtgtgcagat ctctaga 1757<210>59<211>926<212>DNA<213>未知生物<220>
<223>未知生物的描述GUS基因partialfragment<400>59gatatctacc cgcttcgcgt cggcatccgg tcagtggcag tgaagggcga acagttcctg 60attaaccaca aaccgttcta ctttactggc tttggtcgtc atgaagatgc ggacttacgt 120ggcaaaggat tcgataacgt gctgatggtg cacgaccacg cattaatgga ctggattggg 180gccaactcct accgtacctc gcattaccct tacgctgaag agatgctcga ctgggcagat 240gaacatggca tcgtggtgat tgatgaaact gctgctgtcg gctttaacct ctctttaggc 300attggtttcg aagcgggcaa caagccgaaa gaactgtaca gcgaagaggc agtcaacggg 360gaaactcagc aagcgcactt acaggcgatt aaagagctga tagcgcgtga caaaaaccac 420ccaagcgtgg tgatgtggag tattgccaac gaaccggata cccgtccgca agtgcacggg 480aatatttcgc cactggcgga agcaacgcgt aaactcgacc cgacgcgtcc gatcacctgc 540gtcaatgtaa tgttctgcga cgctcacacc gataccatca gcgatctctt tgatgtgctg 600
tgcctgaacc gttattacgg atggtatgtc caaagcggcg atttggaaac ggcagagaag 660gtactggaaa aagaacttct ggcctggcag gagaaactgc atcagccgat tatcatcacc 720gaatacggcg tggatacgtt agccgggctg cactcaatgt acaccgacat gtggagtgaa 780gagtatcagt gtgcatggct ggatatgtat caccgcgtct ttgatcgcgt cagcgccgtc 840gtcggtgaac aggtatggaa tttcgccgat tttgcgacct cgcaaggcat attgcgcgtt 900ggcggtaaca agaaagggat cttcac 926<210>60<211>1198<212>DNA<213>稻<400>60cctctagctc atggcttgaa tgtgtgagaa tcatagatta tttatttcta atctataaca 60tgatggcttt agtctaaaat gatcacccta attctaatgc ggaattggat aatggacggt 120gttttgttga cagacatgga gatgttgttg atgctatgaa tagtcgatag ttttaagttg 180gttatttaat ttggatatag actgacaaat gattatattc ttctaattga ttaaattcta 240cttttggatg gttgatagga ttatttacaa gttattggaa gaacttgcag catgtggggt 300atatggttat actacgtgac atatattcat gagtggagtt cagagttttg gcttgtctcc 360aggcatacat atacctaggc acaagtccag cgcaaaagca tacaaggaag atcataacaa 420catgtttccc cttctctgga aaattttgtt ggcaacagat gccttctcct tctttcagct 480tctgcttctt tagtcagttt ggaggaagca gcagatagtt gatgatatga gaatcctcta 540catcggctag gtgtaccaca cgactttatt attattatta ttattattat tattatttta 600caaaatataa atagatcagt ccctcaccaa caagtagagc aagttggtga gttattgtaa 660agttctacaa agctaattta aaagttattg cattaactta tttcatatta caaacaagag 720tgtcaatgga acaatgaaaa ccatatgaca tactataatt ttgtttttat tattgaaatt 780atataattca aagagaataa atccacatag ccgtaaagtt ctacatgtgg tgcattacca 840aaatatatat agcttacaaa acatgacaag cttagtttga aaaattgcaa tccttatcac 900attgacacat aaagtgagtg atgagtcata atattatttt tcttgctacc catcatgtat 960
atatgatagc cacaaagtta ctttgatgat gataccaaag aacattttta ggtgcaccta 1020acagaatatc caaataatat gactcactta gatcataata gagcatcaag taaaactaac 1080actctaaagc aaccgatggg aaagcatcta taaatagaca agcacaatga aaatcctcat 1140catccttcac cacaattcaa atattatagt tgaagcatag tagtagaatc caacaaca1198<210>61<211>163<212>DNA<213>稻<220>
<223>10kDa谷醇溶蛋白 终止子<400>61tcaaacgttg gttacatgta ctctagtaat aaggtgttgc atactatcgt gtgcaaacac 60tagaaataag aaccattgaa taaaatatca atcattttca gacttgcaaa tattgggtat 120ttggatttct gtcccatgtc cctcttgaaa gccatgctgt aca 163<210>62<211>984<212>DNA<213>稻<220>
<223>GLUTELIN 亅A3启动子<400>62agaagaaaga taaataaccg aaactatttg gagagcattc aggttacatg gttagtccat 60ggtgctagat attgctatat aatactcaat gcaatgctca atagatataa gtttcaaagc 120tgtataagaa ttttaggtta gtgtgcaatg taagtgtagc ttcttatagc ttagtgcttt 180actatcttca caagcacatg ctatagtatt gttccaagat gaaagaataa ttcatccttg 240ctaccaactt gcatgatatt atatttgtga atatcctatc tcttggctta taatgaaatg 300tgctgctggg ttatacctga ccatggtatt tgagagacct ttgtatagct gaaaccaacg 360tatatgcgag catggaacaa gagaacaaaa tgcaaggatt tttttatact ggttcatgcc 420cctggatggg ttaatatcgt gatcatcaaa aaagatatgc ataaaattaa agtaataaat 480ttgctcataa gaaaccaaaa ccaaaagcac atatgtccta aacaaactgc attttgtttg 540tcatgtagca atacaagaga taatatatga cgtggttatg acttattcac tttttgtgac 600tccaaaatgt agtaggtcta actgattgtt taaagtgatg tgcttactgt agaagtttca 660tcccaaaagc aatcactaaa gcaacacaca acgtatagtc caccttgcac gtaattcttt 720gtggaagata acaagaaggc tcactgaaaa ataaaagcaa agaaaaggat atcaaacaga 780
ccattgtgta tcccattgat acttgtatgt ctatttatct atccaccttt tgtgtacctt 840acttctatct agtgagtcac ttcatatgtg gacattaaca aactctatct taacatctag 900tcgatcacta ctttacttca ctataaaagg accaacatat atcaccattt ctcacaaaag 960cattgagttc agtcccacaa aaac984<210>63<211>30<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>63atgaagatca ttttcgtatt tgctctcctt 30<210>64<211>45<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>64atgaagatca ttttcgtatt tgctctcctt gctattgttg catgc 45<210>65<211>30<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>65caaagttata gacaatatca actacaatcg 30<210>66<211>15
<2l2>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>66gagttcgtaa ttcaa 15<210>67<211>45<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>67gagttcgtaa ttcaacagca tagcatagtg gcaaccccct tctgg45<210>68<211>45<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>68caacaatctc actaccaggc cattagtagc gttcaggcga ttgtg45<210>69<211>15<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>69gctcaagctc aagct 15
<210>70<211>30<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>70tactttgatc agactcaagc tcaagctcaa 30<210>71<211>16<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>71tgcagcagca gtgttg 16<210>72<211>23<212>DNA<213>人工序列<220>
<223>人工序列的描述反义<400>72tgcagcagca gtgttgccaa cag 23<210>73<211>22<212>PRT<213>人工序列<220>
<223>人工序列的描述反义<400>73Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys Asn1 5 10 15Ala Ser Ala Arg Phe Asp20<210>74<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述反义<400>74Met Lys Ile Ile Phe15<210>75<211>10<212>PRT<213>人工序列<220>
<223>人工序列的描述反义<400>75Met Lys Ile Ile Phe Val Phe Ala Leu Leu1 5 10<210>76<211>14<212>PRT<213>人工序列<220>
<223>人工序列的描述反义
<400>76Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala1 5 10<210>77<211>10<212>PRT<213>人工序列<220>
<223>人工序列的描述反义<400>77Gln Ser Tyr Arg Gln Tyr Gln Leu Gln Ser1 5 10<210>78<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述反义<400>78Glu Phe Val Arg Gln1 5<210>79<211>15<212>PRT<213>人工序列<220>
<223>人工序列的描述反义<400>79Glu Phe Val Arg Gln Gln His Ser Ile Val Ala Thr Pro Phe Trp1 5 10 15
<210>80<211>15<212>PRT<213>人工序列<220>
<223>人工序列的描述反义<400>80Gln Gln Ser His Tyr Gln Ala Ile Ser Ser Val Gln Ala Ile Val1 5 10 15<210>81<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述反义<400>81Ala Gln Ala Gln Ala1 5<210>82<211>10<212>PRT<213>人工序列<220>
<223>人工序列的描述反义<400>82Tyr Phe Asp Gln Thr Gln Ala Gln Ala Gln1 5 10<210>83<211>5<212>PRT<213>人工序列
<220>
<223>人工序列的描述反义<400>83Gln Gln Gln Cys Cys1 5<210>84<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述反义<400>84Gln Gln Gln Cys Cys Gln Gln1 5<210>85<211>9<212>PRT<213>人工序列<220>
<223>人工序列的描述基元<400>85Glu Phe Val Arg Gln Gln Cys Ser Pro1 5<210>86<211>11<212>PRT<213>人工序列<220>
<223>人工序列的描述基元<400>86Cys Gln Val Met Gln Gln Gln Cys Cys Gln Gln
1 5 10<210>87<211>6<212>PRT<213>人工序列<220>
<223>人工序列的描述基元<400>87Gln Gln Cys Cys Gln Gln1 5<210>88<211>6<212>PRT<213>人工序列<220>
<223>人工序列的描述基元<400>88Glu Phe Val Arg Gln Gln1 5<210>89<211>144<212>PRT<213>稻<220>
<223>RM4<400>89Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Ser1 5 10 15Ala Ser Ala Gln Phe Asp Val Leu Gly Gln Ser Tyr Arg Gln Tyr Gln20 25 30
Leu Gln Ser Pro Val Leu Leu Gln Gln Gln Val Leu Ser Pro Tyr Asn35 40 45Glu Phe Val Arg Gln Gln Tyr Gly Ile Ala Ala Ser Pro Phe Leu Gln50 55 60Ser Ala Ala Phe Gln Leu Gln Gln Leu Ala Leu Val Ala Gln Gln Ser65 70 75 80His Tyr Gln Asp Ile Asn Ile Val Gln Ala Ile Ala Gln Gln Leu Gln85 90 95Leu Gln Gln Phe Gly Asp Leu Tyr Phe Asp Arg Asn Leu Ala Gln Ala100 105 110Gln Ala Leu Leu Ala Phe Asn Val Pro Ser Arg Tyr Gly Ile Tyr Pro115 120 125Arg Tyr Tyr Gly Ala Pro Ser Thr Ile Thr Thr Leu Gly Gly Val Leu130 135 140<210>90<211>156<212>PRT<213>稻<220>
<223>RM5<400>90Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys Asn1 5 10 15Ala Ser Ala Arg Phe Asp Ala Leu Ser Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln Ser His Leu Leu Leu Gln Gln Gln Val Leu Ser Pro Cys Ser35 40 45Glu Phe Val Arg Gln Gln His Ser Ile Val Ala Thr Pro Phe Trp Gln50 55 60Pro Ala Thr Phe Gln Leu Ile Asn Asn Gln Val Met Gln Gln Gln Cys
65 70 75 80Cys Gln Gln Leu Arg Leu Val Ala Gln Gln Ser His Tyr Gln Ala Ile85 90 95Ser Ser Val Gln Ala Ile Val Gln Gln Leu Gln Leu Gln Gln Val Gly100 105 110Val Val Tyr Phe Asp Gln Thr Gln Ala Gln Ala Gln Ala Leu Leu Ala115 120 125Leu Asn Leu Pro Ser Ile Cys Gly Ile Tyr Pro Asn Tyr Tyr Ile Ala130 135 140Pro Arg Ser Ile Pro Thr Val Gly Gly Val Trp Tyr145 150 155<210>91<211>158<212>PRT<213>稻<220>
<223>RM7<400>91Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys Asn1 5 10 15Arg Ser Ala Arg Phe Asp Pro Leu Ser Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln Ser His Leu Leu Leu Gln Gln Gln Val Leu Ser Pro Cys Ser35 40 45Glu Phe Val Arg Gln Gln Tyr Ser Ile Val Ala Thr Pro Phe Trp Gln50 55 60Pro Ala Thr Phe Gln Leu Ile Asn Asn Gln Val Met Gln Gln Gln Arg65 70 75 80Met Cys Cys Gln Gln Leu Arg Leu Val Ala Gln Gln Ser His Tyr Gln85 90 95
Ala Ile Ser Ile Val Gln Ala Ile Val Gln Gln Leu Gln Leu Gln Gln100 105 110Phe Ser Gly Val Tyr Phe Asp Gln Thr Gln Ala Gln Ala Gln Thr Leu115 120 125Leu Thr Phe Asn Leu Pro Ser Ile Cys Gly Ile Tyr Pro Asn Tyr Tyr130 135 140Ser Ala Pro Arg Ser Ile Ala Thr Val Gly Gly Val Trp Tyr145 150 155<210>92<211>134<212>PRT<213>稻<220>
<223>RM10<400>92Met Ala Ala Tyr Thr Ser Lys Ile Phe Ala Leu Phe Ala Leu Ile Ala1 5 10 15Leu Ser Ala Ser Ala Thr Thr Ala Ile Thr Thr Met Gln Tyr Phe Pro20 25 30Pro Thr Leu Ala Met Gly Thr Met Asp Pro Cys Arg Gln Tyr Met Met35 40 45Gln Thr Leu Gly Met Gly Ser Ser Thr Ala Met Phe Met Ser Gln Pro50 55 60Met Ala Leu Leu Gln Gln Gln Cys Cys Met Gln Leu Gln Gly Met Met65 70 75 80Pro Gln Cys His Cys Gly Thr Ser Cys Gln Met Met Gln Ser Met Gln85 90 95Gln Val Ile Cys Ala Gly Leu Gly Gln Gln Gln Met Met Lys Met Ala100 105 110
Met Gln Met Pro Tyr Met Cys Asn Met Ala Pro Val Asn Phe Gln Leu115 120 125Ser Ser Cys Gly Cys Cys130<210>93<211>149<212>PRT<213>稻<220>
<223>RM16<400>93Met Lys Ile Phe Val Ile Leu Ser Leu Leu Ala Leu Ala Ala Ser Ser1 5 10 15Ala Ser Ala Gln Phe Asp Ala Cys Thr Tyr Gly Gln Cys Gln Gln Gln20 25 30Pro Phe Met Gln Pro Ile Met Asn Pro Cys Asn Glu Phe Val Arg Gln35 40 45Gln Cys Ser Pro Met Ser Leu Pro Trp Lys Gln Ser Arg Arg Leu Gln50 55 60Leu Ser Ser Cys Gln Val Met Arg Gln Gln Cys Cys Gln Gln Met Arg65 70 75 80Leu Met Ala Gln Gln Tyr His Cys Gln Ala Ile Cys Thr Met Val Gln85 90 95Ser Ile Met Gln Gln Val Gln Phe Asp Ala Gly Phe Val Gly Glu Pro100 105 110Gln Ala Gln Ala Gln Ala Gln Val Ala Leu Asn Leu Pro Ser Met Cys115 120 125Gly Val Tyr Pro Arg Tyr Cys Ser Thr Pro Cys Lys Val Ala Thr Gly130 135 140His Cys Gly Ser Trp
145<210>94<211>596<212>DNA<213>稻<220>
<223>RM4<400>94gcaaaataga aagatctagt gtcccgcagc aatgaagatc attttcgtct ttgctctcct 60tgctattgct gcatgcagcg cctctgcgca gtttgatgtt ttaggtcaaa gttataggca 120atatcagctg cagtcgcctg tcctgctaca gcaacaggtg cttagcccat ataatgagtt 180cgtaaggcag cagtatggca tagcggcaag ccccttcttg caatcagctg cgtttcaact 240gagaaacaac caagtctggc aacagctcgc gctggtggcg caacaatctc actatcagga 300cattaacatt gttcaggcca tagcgcagca gctacaactc cagcagtttg gtgatctcta 360ctttgatcgg aatctggctc aagctcaagc tctgttggct tttaacgtgc catctagata 420tggtatctac cctaggtact atggtgcacc cagtaccatt accacccttg gcggtgtctt 480gtaatgagtt ttaacagtat agtggttcgg aagttaaaaa taagctcaga tatcatatat 540gtgacatgtg aaactttggg tgatataaat agaaaaaaag ttgtctttca tattta 596<210>95<211>597<212>DNA<213>稻<220>
<223>RM5<400>95caattcaaac attatagttg aagcatagta gtagaatcct acaaaaatga agatcatttt 60cgtatttgct ctccttgcta ttgttgcatg caacgcttct gcacggtttg atgctcttag 120tcaaagttat agacaatatc aactacaatc gcatctcctg ctacagcaac aagtgctcag 180cccatgcagt gagttcgtaa ggcaacagca tagcatagtg gcaaccccct tctggcaacc 240agctacgttt caattgataa acaaccaagt catgcagcaa cagtgttgcc aacagctcag 300gctggtagcg caacaatctc actaccaggc cattagtagc gttcaggcga ttgtgcagca 360actacagctg cagcaggtcg gtgttgtcta ctttgatcag actcaagctc aagctcaagc 420tttgctggcc ttaaacttgc catccatatg tggtatctat cctaactact acattgctcc 480gaggagcatt cccaccgttg gtggtgtctg gtactgaatt gtaatagtat aatggttcaa 540atgttaaaaa taaagtcatg catcatcatg cgtgacagtt gaaaaaaaaa aaaaaaa597
<210>96<211>609<212>DNA<213>稻<220>
<223>RM7<400>96gaagcatagt agtagaatcc aacaacaatg aagatcattt tcgtatttgc tctccttgct 60attgttgcat gcaatcgctc tgcgcggttt gatcctctta gtcaaagtta taggcaatat 120caactacagt cgcatctcct actacagcaa caagtgctca gcccatgcag tgagttcgta 180aggcaacagt atagcatagt ggcaaccccc ttctggcaac cagctacgtt tcaattgata 240aacaaccaag tcatgcagca gcagtgttgc caacagctca ggctggtagc acaacaatct 300cactaccagg ccattagtat tgttcaagcg attgtgcaac agctacaact gcagcaattt 360agtggtgtct actttgatca gactcaagct caagcccaaa ctctgttgac cttcaacttg 420ccatccatat gtggtatcta ccctaactac tatagtgctc ccaggagcat tgccactgtt 480ggtggtgtct ggtactgaat tgtaacaata taatagttcg tatgttaaaa ataaagtcat 540acatcatcat gtgtgactgt tgaaacttag ggtcatataa atctaaataa aatcatctta 600cctaaaaaa 609<210>97<211>1002<212>DNA<213>稻<220>
<223>内含子序列<400>97tctagatcta agaatggtcc gtgccttaaa actttcccca accgtgctag tttatgttgt 60gactgtctgc ctctctcagt ttacttggat gcattgacaa catccttttt tgctattact 120cgtatttgct ctatagctgg tggcatatct catgttgaaa tttgcccttt taatccaaaa 180ttggatgtaa ttgaaagaat cctacgtggt agttatttgg attttggtgt gaaaaaaaat 240agccttgtta gaagaagcaa aattggattt agttaaaagg atactagatg gtgttatttg 300gattttggtg caaatcaaat taggaggttg gttttattca agttaaagtt tgttttaaaa 360aaattctcct aaaaagatag atactagatt tgcatatatg cattgaaaat tacatcttcg 420cttggcggtt atacttttag tccctctaaa ttgttcaatc atttatgatg aaaaggaaaa 480tcattttata tcacaaagta tttatgatga aaggggaaaa atattctgca tgggtttgaa 540caaaatacgt ggattggtgt agccttaaca tacttgaaaa gggtatgatg ttgatgtagt 600gcccacatgg tgtcgcttga cattaaaacg atatgcagtc aggattgagg aacattgctg 660acaatttact atcgctgtct gtgttgacca caataattca gatgtaccat cctatcttct 720aactagaaag atgcatggaa gtttcttaca ttatttccag cacttgaaat tttagtgaaa 780
tatcattaaa acataaccac ttactttgct gtgatatgaa ataaatgttt tatttcttgg 840aaagtggtat attcatatat tcttacagta aatttattga ttttcttttc atttatttct 900aaattttaac cacccttttg gtagcttaag gaaaattgta tgtttgacag tcctgttttc 960tgttgtttca tccctccagg aaaaccagct actagtggat cc 1002<210>98<211>37<212>PRT<213>稻<400>98Gln Val Met Gln Gln Gln Cys Cys Gln Gln Leu Arg Leu Val Ala Gln1 5 10 15Gln Ser His Tyr Gln Ala Ile Ser Ser Val Gln Ala Ile Val Gln Gln20 25 30Leu Gln Leu Gln Gln35<210>99<211>34<212>PRT<213>稻<400>99Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys Asn1 5 10 15Ala Ser Ala Arg Phe Asp Ala Leu Ser Gln Ser Tyr Arg Gln Tyr Gln20 25 30Leu Gln<210>100<211>26<212>PRT<213>稻<400>100Glu Phe Val Arg Gln Gln His Ser Ile Val Ala Thr Pro Phe Trp Gln1 5 10 15
Pro Ala Thr Phe Gln Leu Ile Asn Asn Gln20 25<210>101<211>31<212>PRT<213>稻<400>101Tyr Phe Asp Gln Thr Gln Ala Gln Ala Gln Ala Leu Leu Ala Leu Asn1 5 10 15Leu Gln Ser Ile Cys Gly Ile Tyr Pro Asn Tyr Tyr Ile Ala Pro20 25 30<210>102<211>111<212>DNA<213>稻<220>
<221>CDS<222>(1)..(111)<220>
<221>misc_feature<222>(6)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(31)..(39)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(45)
<223>n是a,c,g,或t<220>
<221>misc_feature<222>(52)..(54)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(66)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(70)..(75)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(78)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(84)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(90)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(97)..(99)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(103)..(105)<223>n是a,c,g,或t<400>102car gtn atg car car car tgy tgy car car nnn nnn nnn gtn gcn car48
1 5 10 15Gln Val Met Gln Gln Gln Cys Cys Gln Gln Leu Arg Leu Val Ala Glncar nnn cay tay car gcn atg nnn nnn gtn car gcn atg gtn car car 9620 25 30Gln Ser His Tyr Gln Ala Ile Ser Ser Val Gln Ala Ile Val Gln Glnnnn car nnn car car 11135Leu Gln Leu Gln Gln<210>103<211>102<212>DNA<213>稻<220>
<221>CDS<222>(1)..(111)<220>
<221>misc_feature<222>(18)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(24)..(30)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(33)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(39)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(42)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(51)..(54)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(57)..(60)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(69)..(75)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(79)..(81)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(85)..(87)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(97)..(99)<223>n是a,c,g,或t<400>103atg aar atg atg tty gtn tty gcn nnn nnn gcn atg gtn gcn tgy aay481 5 10 15Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys Asngcn nnn gcn nnn tty gay gcn nnn nnn car nnn tay nnn car tay car9620 25 30Ala Ser Ala Arg Phe Asp Ala Leu Ser Gln Ser Tyr Arg Gln Tyr Gln
nnn carLeu Gln<210>104<211>78<212>DNA<213>稻<220>
<221>CDS<222>(1)..(111)<220>
<221>misc_feature<222>(9)..(12)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(22)..(24)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(30)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(33)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(36)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(39)<223>n是a,c,g,或t
<220>
<221>misc_feature<222>(51)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(54)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(57)<223>n是a,c,g,或t<220>
<221>misc_feature<222>(64)..(66)<223>n是a,c,g,或t<400>104gar tty gtn nnn car car cay nnn atg gtn gcn acn ccn tty tgg car481 5 10 15Glu Phe Val Arg Gln Gln His Ser Ile Val Ala Thr Pro Phe Trp Glnccn gcn acn tty car nnn atg aay aay car7820 25Pro Ala Thr Phe Gln Leu Ile Asn Asn Gln<210>105<211>93<212>DNA<213>稻<220>
<221>CDS<222>(1)..(93)<400>105tac ttt gat cag act caa gct caa gct caa gct ttg ctg gcc tta aac48Tyr Phe Asp Gln Thr Gln Ala Gln Ala Gln Ala Leu Leu Ala Leu Asn
1 5 10 15ttg caa tcc ata tgt ggt atc tat cct aac tac tac att gct ccg93Leu Gln Ser Ile Cys Gly Ile Tyr Pro Asn Tyr Tyr Ile Ala Pro20 25 30<210>106<211>1426<212>DNA<213>稻<400>106ttagcattaa tatttataga gtgataaagt catactacaa taaatcctta tatattaatt 60gggggtcata ctagaagccc catattaatc ctacgagagg tagaaaacta gaaattatcg120cactagtcaa gttgcacttg gcctagagtc tcaattgtag tataaatgat ataataattc180taaaattaaa attagcaaat aacaagttca attaggtttg aagccgtaat tctattttta240taatttaatc attcttaaat ttagaattac taaaaaataa ttattaatac agcgttgtac300ttgctgtaga gactcatata gtttttacga cgatttaata atttcaaaaa taaatacagg360aaattgctaa gtttgtaatc taaaatataa tattgtcata atataataat tctaaaattc420aaattaataa ataccaagtt gatgttttat ttaaaatata tagtatgtgc cgcacagctt480gatgcttagt ctagatcttt taaccgtgct acgctgggtt aattagcgat ggtgcaggtc540acgtacccaa atttcttcac tgttggatca actagagtag ttaaacgagg gcatgtgatg600aaggctagct atttgaaatt ttccaattat ccctgcataa gtcaggctac aatagcacct660ggactacatg cagggattac aaaataggtg gtaaccacat ttaccgcgtt aaccctatca720aattcaaata aattttaaaa gtaatttgat ttttttaata aattttgtat ggtttctcaa780gctttatttt ggttaccgtg cttactgccg gaggcaatgg gaaaccctca ctagaagttg840cacctgttct tgtctgtgca ccatatcatg ttgaatcatg tgcgttgtgt cctttcggaa900gaaccgattt actacatgac tcatcaattc cactttacgt atcaaaaggt ttgttatggg960
ggcaatgctt ttgtgaaatt aaatttttat tttgcgtcac gttgtatcta gttaaacact1020acctacctac cattacaaaa cctcattcca caaaacgatg catctagata aaaaatatga1080catgtaaagt gagtaatgac tcatgtttat tatcaaaaat cgataacaat caaatgatat1140aggtagtaaa gtacctttga aatggcatgt ccaagtatgt gtagctccac ctagcacaat1200atcccaagtg atcatcataa aaggcataca aatacaagca gccgatgatg cacacaagaa1260acaacacaaa ttgcacaaaa ccaaaagcaa ccgatgcctt gagcatagag atcatgctat1320tcccactata aatacaaatg caccatatca agatgctcct cacccttact gaaaaatcac1380aaacatcaaa acgttataag agttctctag catccatcac atagcc 1426<210>107<211>1008<212>DNA<213>稻<400>107gccccccgcc ggacctcccg tgcccgtggc gcctggaggg aggagagggg agagatggtg 60agagaggagg aagaagagga ggggtgacaa tgatatgtgg gccatgtggc ccccaccatt120ttttaattca ttcttttgtt gaaactgaca tgtgggtccc atgagaatta ttatttttcg180gatcgaattg ccacgtaagc gctacgtcaa tgctacgtca gatgaagacc gagtcaaatt240agccacgtaa gcgccacgtc agccaaaacc accatccaaa ccgccgaggg acctcatctg300cactggtttt gatagttgag ggacccgttg tatctggttt ttcgattgaa ggacgaaaat360caaatttgtt gacaagttaa gggaccttaa atgaacttat tccatttcaa aatattctgt420gagccatata tccgtgggct tccaatcctc ctcaaattaa agggcctttt taaaatagat480aattgccttc tttcagtcac ccataaaagt acaaaactac taccaacaag caacatgcgc540agttacacac attttctgca catttccacc acgtcacaaa gagctaagag ttatccctag600
gacaatctca ttagtgtaga tacatccatt aatcttttat cagaggcaaa cgtaaagccg660ctctttatga caaaaatagg tgacacaaaa gtgttatctg ccacatacat aacttcagaa720attacccaac accaagagaa aaataaaaaa aaatcttttt gcaagctcca aatcttggaa780acctttttca ctctttgcag cattgtactc ttgctctttt tccaaccgat ccatgtcacc840ctcaagcttc tacttgatct acacgaagct caccgtgcac acaaccatgg ccacaaaaac900cctataaaac cccatccgat cgccatcatc tcatcatcag ttcatcacca acaaacaaaa960gaggaaaaaa aacatataca cttctagtga ttgtctgatt gatcatca1008<210>108<211>72<212>DNA<213>稻<220>
<221>CDS<222>(1)..(72)<400>108atg gca gca tac acc agc aag atc ttt gcc ctg ttt gcc tta att gct48Met Ala Ala Tyr Thr Ser Lys Ile Phe Ala Leu Phe Ala Leu Ile Ala1 5 10 15ctt tct gca agt gcc act act gca72Leu Ser Ala Ser Ala Thr Thr Ala20<210>109<211>24<212>PRT<213>稻<400>109Met Ala Ala Tyr Thr Ser Lys Ile Phe Ala Leu Phe Ala Leu Ile Ala1 5 10 15
Leu Ser Ala Ser Ala Thr Thr Ala20<210>110<211>66<212>DNA<213>稻<220>
<221>CDS<222>(1)..(66)<400>110atg aag atc att ttc gta ttt gct ctc ctt gct att gtt gca tgc aat48Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys Asn1 5 10 15gct tct gca cgg ttt gat66Ala Ser Ala Arg Phe Asp20<210>111<211>22<212>PRT<213>稻<400>111Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Val Ala Cys Asn1 5 10 15Ala Ser Ala Arg Phe Asp20<210>112<211>57<212>DNA
<213>稻<220>
<221>CDS<222>(1)..(57)<400>112atg aag atc ttt gtc atc ctc tct ctc ctc gcc ctc gca gcg agc agc48Met Lys Ile Phe Val Ile Leu Ser Leu Leu Ala Leu Ala Ala Ser Ser1 5 10 15gcc tcg gca57Ala Ser Ala<210>113<211>19<212>PRT<213>稻<400>113Met Lys Ile Phe Val Ile Leu Ser Leu Leu Ala Leu Ala Ala Ser Ser1 5 10 15Ala Ser Ala<210>114<211>72<212>DNA<213>稻<220>
<221>CDS<222>(1)..(72)<400>114atg gcg agt tcc gtt ttc tct cgg ttt tct ata tac ttt tgt gtt ctt48
Met Ala Ser Ser Val Phe Ser Arg Phe Ser Ile Tyr Phe Cys Val Leu1 5 10 15cta tta tgc cat ggt tct atg gcc72Leu LeuCys His Gly Ser Met Ala20<210>115<211>24<212>PRT<213>稻<400>115Met Ala Ser Ser Val Phe Ser Arg Phe Ser Ile Tyr Phe Cys Val Leu1 5 10 15Leu Leu Cys His Gly Ser Met Ala20<210>116<211>66<212>DNA<213>稻<220>
<221>CDS<222>(1)..(66)<400>116atg gct agc aag gtc gtc ttc ttc gcg gcg gcg ctc atg gcg gcc atg48Met Ala Ser Lys Val Val Phe Phe Ala Ala Ala Leu Met Ala Ala Met1 5 10 15gtg gcc atc tcc ggc gcg66Val Ala Ile Ser Gly Ala20<210>117
<211>22<212>PRT<213>稻<400>117Met Ala Ser Lys Val Val Phe Phe Ala Ala Ala Leu Met Ala Ala Met1 5 10 15Val Ala Ile Ser Gly Ala20<210>118<211>8<212>PRT<213>稻<400>118Ser Arg Ala Met Val Ser Leu Gly1 权利要求
1.一种核酸分子,该核酸分子含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。
2.权利要求1的核酸分子,该核酸分子含有与编码谷醇溶蛋白多肽的基因序列互补、且具有至少15个连续的核苷酸长度的核酸序列。
3.权利要求1的核酸分子,其中上述谷醇溶蛋白是水稻的谷醇溶蛋白。
4.权利要求1的核酸分子,其中上述谷醇溶蛋白是粳稻种水稻的谷醇溶蛋白。
5.权利要求1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度是至少50个连续的核苷酸长度。
6.权利要求1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度的核酸序列含有上述编码谷醇溶蛋白多肽的全长序列的互补序列。
7.权利要求1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度的核酸序列是上述编码谷醇溶蛋白多肽的核酸序列的5’末端的序列。
8.权利要求1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度是50个核苷酸或以下的核苷酸长度。
9.权利要求1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度是30个核苷酸或以下的核苷酸长度。
10.权利要求1的核酸分子,其中上述互补、且具有至少15个连续的核苷酸长度含有编码选自SEQ ID NO.98-101的氨基酸的核酸序列中至少15个核苷酸长度的序列。
11.权利要求1的核酸分子,其中上述谷醇溶蛋白是13kDa谷醇溶蛋白。
12.权利要求1的核酸分子,该核酸分子含有与下述多核苷酸互补、且具有至少15个连续的核苷酸长度的核酸序列(a)具有选自SEQ ID NO.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43和45所示的核酸序列或其片段序列的多核苷酸;(b)编码具有选自SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44和46所示的氨基酸序列的多肽或其片段的多核苷酸;(c)编码具有生物学活性、带有至少一种突变的变异体多肽的多核苷酸,其中所述多肽在选自SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44和46所示的氨基酸序列中的1或几个氨基酸被取代、附加或缺失;(d)为含有选自SEQ ID NO.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43和45所示的核酸序列的DNA等位基因突变体的多核苷酸;(e)编码含有选自SEQ ID NO.2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44和46所示的氨基酸序列的多肽的物种同系物或直向同系物的多核苷酸;(f)与(a)-(e)的任意一个多核苷酸在严谨条件下杂交、且编码具有生物学活性的多肽的多核苷酸;或者(g)含有与(a)-(e)的任意一个多核苷酸或其互补序列的同源性至少为70%的碱基序列、且编码具有生物学活性的多肽的多核苷酸。
13.权利要求1的核酸分子,该核酸分子具有反义活性。
14.权利要求13的核酸分子,其中所述反义活性是使上述谷醇溶蛋白多肽的表达减少。
15.核酸分子,该核酸分子含有来自编码谷醇溶蛋白多肽的核酸序列、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。
16.核酸分子,该核酸分子含有(A)核酸序列A,该核酸序列A含有来自编码谷醇溶蛋白多肽的核酸序列、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列;以及(B)核酸序列B,该核酸序列B含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。
17.权利要求16的核酸分子,其中,上述核酸序列A和核酸序列B含有互相基本上互补的部分。
18.权利要求16的核酸分子,其中上述核酸序列A和核酸序列B互相基本上互补。
19.权利要求16的核酸分子,该核酸分子还含有间隔序列。
20.权利要求19的核酸分子,其中上述间隔序列包含内含子序列。
21.权利要求19的核酸分子,其中上述间隔序列在上述核酸序列A和上述核酸序列B之间。
22.一种因子,该因子引发针对编码谷醇溶蛋白多肽的基因序列的RNAi。
23.核酸盒,该核酸盒含有核酸序列B,所述核酸序列B含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个连续的核苷酸长度的核酸序列或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。
24.权利要求23的核酸盒,其中,还含有编码外源基因的核酸序列。
25.权利要求23的核酸盒,其中,还含有核酸序列A,其中所述核酸序列A含有来自编码谷醇溶蛋白多肽的核酸序列、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列。
26.权利要求25的核酸盒,其中,还含有间隔序列。
27.权利要求26的核酸盒,其中所述间隔序列包含内含子序列。
28.权利要求26的核酸盒,其中所述间隔序列在上述核酸序列A和核酸序列B之间。
29.权利要求25的核酸盒,其中,还含有信号序列。
30.权利要求29的核酸盒,其中上述信号序列设置于上述外源基因的上游。
31.权利要求29的核酸盒,其中上述信号序列为贮藏蛋白的信号序列。
32.权利要求29的核酸盒,其中上述信号序列为谷醇溶蛋白信号序列。
33.权利要求24的核酸盒,其中,还含有启动子序列。
34.权利要求33的核酸盒,其中上述启动子序列与上述外源基因和上述核酸序列B两者可操作地连接。
35.权利要求24的核酸盒,其中,启动子序列分别、独立地与上述外源基因和上述核酸序列B两者可操作地连接。
36.权利要求35的核酸盒,其中,与上述外源基因可操作地连接的启动子序列(启动子序列A)、以及与上述核酸序列B可操作地连接的启动子序列(启动子序列B)互相不同。
37.权利要求36的核酸盒,其中上述启动子序列B是可使基因在种子中高表达的启动子序列。
38.权利要求36的核酸盒,其中上述启动子序列B来自贮藏蛋白的启动子。
39.权利要求36的核酸盒,其中上述启动子序列B来自贮藏蛋白的启动子,并与上述启动子序列A不同。
40.权利要求36的核酸盒,其中上述启动子序列B来自选自多遍在蛋白启动子、26k球蛋白启动子、谷蛋白A启动子、谷蛋白B启动子、16kDa谷醇溶蛋白启动子、13kDa谷醇溶蛋白启动子和10kDa谷醇溶蛋白启动子的启动子。
41.权利要求36的核酸盒,其中上述启动子序列A来自贮藏蛋白启动子。
42.权利要求36的核酸盒,其中上述启动子序列A是天然伴随于上述核酸序列B的启动子。
43.权利要求36的核酸盒,其中上述启动子序列A来自选自26kDa球蛋白启动子、谷蛋白A启动子、谷蛋白B启动子、16kDa谷醇溶蛋白启动子、10kDa谷醇溶蛋白启动子和13kDa谷醇溶蛋白启动子的启动子。
44.权利要求36的核酸盒,其中上述启动子序列A是谷醇溶蛋白启动子。
45.权利要求36的核酸盒,其中上述启动子序列A来自谷醇溶蛋白启动子,上述启动子序列B来自上述谷醇溶蛋白启动子以外的启动子。
46.权利要求33的核酸盒,该核酸盒在上述外源基因和上述启动子序列之间含有框内信号序列。
47.权利要求25的核酸盒,该核酸盒进一步含有终止子序列。
48.权利要求47的核酸盒,其中上述终止子序列为10kDa谷醇溶蛋白的终止子序列。
49.权利要求25的核酸盒,其中,还含有外源基因,上述外源基因存在于上述核酸序列A和上述核酸序列B的上游处。
50.权利要求49的核酸盒,该核酸盒在上述核酸序列A和上述核酸序列B之间含有间隔序列。
51.权利要求49的核酸盒,其中,在上述核酸序列A和上述核酸序列B之间含有内含子序列。
52.用于制备核酸盒的方法,该方法包括以下步骤A)提供核酸盒的步骤,该核酸盒是在含有核酸序列B和核酸序列A的上游具有可操作的启动子序列B,其中所述核酸序列B含有与编码谷醇溶蛋白多肽的核酸序列互补、且具有至少15个连续的核苷酸长度的核酸序列或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列;所述核酸序列A含有来自编码谷醇溶蛋白多肽的核酸序列、且具有至少15个连续的核苷酸长度的核酸序列,或者与上述互补的具有至少15个连续的核苷酸长度的核酸序列至少约70%同源的核酸序列,外源基因设置于上述启动子序列B的上游或下游;启动子A与上述外源基因可操作地连接;B)用上述核酸盒转化植物的步骤;以及C)在上述被转化的植物中筛选谷醇溶蛋白表达量部分减少的植物的步骤。
53.载体,该载体含有权利要求1的核酸分子。
54.权利要求53的载体,该载体还含有具有启动子活性的序列。
55.权利要求54的载体,其中上述具有启动子活性的序列是贮藏蛋白的启动子。
56.权利要求53的载体,其中上述具有启动子活性的序列是上述谷醇溶蛋白的启动子。
57.权利要求53的载体,该载体还含有终止子。
58.权利要求53的载体,该载体还含有编码选择性标记的序列。
59.权利要求53的载体,该载体还含有编码与权利要求1的核酸分子不同的外源基因的序列。
60.植物细胞,该植物细胞含有权利要求1的核酸分子。
61.权利要求60的植物细胞,该植物细胞还含有编码与权利要求1的核酸分子不同的外源基因的核酸分子。
62.权利要求60的植物细胞,其中上述谷醇溶蛋白的来源植物种与上述植物的种为同种。
63.权利要求60的植物细胞,其中上述谷醇溶蛋白的来源植物种与上述植物的种为同一品种。
64.权利要求60的植物细胞,其中上述谷醇溶蛋白的来源植物种与上述植物的种都为水稻。
65.权利要求60的植物细胞,其中上述谷醇溶蛋白的来源植物种与上述植物的种都为粳稻种的水稻。
66.权利要求60的植物细胞,该植物细胞是向等位染色体双方导入权利要求1的上述核酸分子得到的。
67.植物组织,该植物组织含有权利要求60的植物细胞。
68.植物体,该植物体含有权利要求1的核酸分子。
69.权利要求68的植物体,该植物体还含有与权利要求1的核酸分子不同的、编码外源基因的核酸分子。
70.权利要求68的植物体,其中上述谷醇溶蛋白的来源植物种与上述植物的种为同种。
71.权利要求68的植物体,其中上述谷醇溶蛋白的来源植物种与上述植物的种为同一品种。
72.权利要求68的植物体,其中上述谷醇溶蛋白的来源植物种与上述植物的种都为水稻。
73.权利要求68的植物体,其中上述谷醇溶蛋白的来源植物种与上述植物的种都为粳稻品种水稻。
74.权利要求68的植物体,该植物体是向等位染色体双方导入权利要求1的上述核酸分子而成的。
75.种子,该种子由权利要求68的植物体生产。
76.种子,该种子由权利要求69的植物体生产。
77.淀粉制备物,该淀粉制备物由权利要求68的植物体或权利要求75的种子生产。
78.组合物,该组合物含有由权利要求69的植物体或权利要求76的种子生产的上述外源基因的基因产物。
79.植物中使种子中的蛋白质表达量减少的方法,该方法包括A)提供权利要求1的核酸分子的步骤;B)将上述核酸分子导入上述植物细胞的步骤;C)使上述细胞再分化,制备转基因植物的步骤;以及D)由上述转基因植物获得种子的步骤。
80.权利要求79的方法,其中上述导入步骤通过农杆菌法进行。
81.权利要求79的方法,该方法还包含E)对导入了上述核酸分子的植物细胞进行选择的步骤。
82.权利要求81的方法,其中上述选择步骤通过判定抗生素抗性来进行。
83.使外源基因在植物种子中表达的方法,该方法包含A)提供权利要求1的核酸分子的步骤;B)提供上述编码外源基因的核酸分子的步骤;C)将上述权利要求1的核酸分子和上述编码外源基因的核酸分子导入上述植物的细胞的步骤;D)使上述细胞再分化,制备转基因植物的步骤;以及E)由上述转基因植物获得种子的步骤。
84.权利要求83的方法,其中上述导入步骤通过农杆菌法进行。
85.权利要求83的方法,该方法还包含F)对导入了上述核酸分子的植物细胞进行选择的步骤。
86.权利要求85的方法,其中上述选择步骤通过判定抗生素抗性来进行。
87.权利要求83的方法,该方法还包含G)由上述种子分离上述外源基因的基因产物的步骤。
88.组合物,该组合物含有由权利要求83的方法生产的上述外源基因的基因产物。
89.权利要求1的核酸分子在使植物种子中的蛋白质表达量减少中的应用。
90.权利要求1的核酸分子在使植物种子中外源基因表达中的应用。
91.权利要求90的应用,该应用是在使上述种子中的上述植物天然蛋白质表达降低中的应用。
全文摘要
本发明提供使贮藏蛋白总量减少的方法及其所需技术的开发、通过该方法开发的植物及其种子、以及该植物和种子的应用方法。具体来说,本发明提供一种核酸分子,该核酸分子含有与编码谷醇溶蛋白多肽的核酸序列互补的至少以15个连续核苷酸的核酸序列或者与该互补的至少具有15个连续的核苷酸长度的核酸序列至少约70%同源的序列。本发明还提供植物中使种子蛋白质的表达量减少的方法,该方法包括A)提供上述核酸分子的步骤;B)将该核酸分子导入该植物细胞的步骤;C)使该细胞再分化,制备转基因植物的步骤;以及D)由该转基因植物获得种子的步骤。
文档编号A01H5/00GK1753992SQ20038010987
公开日2006年3月29日 申请日期2003年12月9日 优先权日2002年12月20日
发明者黑田昌治 申请人:独立行政法人农业·生物系统特定产业技术研究机构
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1