岩藻糖基化降低的免疫球蛋白的植物生产的制作方法

文档序号:152606阅读:1208来源:国知局
专利名称:岩藻糖基化降低的免疫球蛋白的植物生产的制作方法
技术领域
本申请一般涉及在植物中产生免疫球蛋白组合物,其中连接到植物产生的免疫球蛋白上的聚糖的至少一部分缺少岩藻糖。本发明还一般涉及在植物中产生单体抗体组合物,其中至少一部分连接到植物产生的单体抗体上的聚糖缺少岩藻糖。通过本发明的方法产生的免疫球蛋白可以是任何类型(IgG、IgA、IgM、IgE、IgD等)或者同种型。此外,本发明还涉及在植物中产生单体免疫球蛋白A(单体IgA)抗体组合物,其中单体IgA抗体由于缺少抗体尾片(tail piece)而缺少岩藻糖,其中所述尾片具有通常被岩藻糖基化的唯一糖基化位点。本发明还涉及在植物中产生抗-单纯疱疹病毒(HSV)单体免疫球蛋白A(抗-HSV单体IgA)的抗体组合物,其中由于缺少具有唯一通常被岩藻糖基化的糖基化位点的抗体尾片,连接在抗-HSV单体IgA抗体上的至少一部分聚糖缺少岩藻糖。此外,本发明还涉及在植物中产生单体免疫球蛋白G(单体IgG)抗体组合物。本发明还涉及在植物中产生抗-α-v-β3,α-v-β5(即,αVβ3和αVβ5)双整联蛋白IgG抗体组合物,其中连接到植物产生的抗体组合物上的聚糖的至少一部分缺少岩藻糖。本发明还提供了构建体;质粒;载体;用于产生所有这些免疫球蛋白和抗体的经转化的植物细胞、植物愈伤组织、植物组织、小植株、种子和全株植物;产生这些免疫球蛋白和抗体的方法;通过所公开的方法产生的免疫球蛋白和抗体;和这些免疫球蛋白和抗体的用途。
背景技术
本文所有参考的出版物和专利申请都被并入作为参考,就像每一单独的出版物或者专利申请都被明确和单独地指出并入作为参考一样。
下面的描述包括可用于理解本发明的信息。但这并不是承认本文提供的任何信息都是现有技术或者与本发明有关,或者明确或隐含地参考的任何出版物都是现有技术。
越来越多的注意力正集中于生产和使用更大和更复杂的蛋白质分子作为治疗剂。这些治疗性蛋白的实例包括用于接种以诱导免疫应答和抗体的抗原。
植物具有作为宿主用于生产哺乳动物治疗性蛋白,包括多聚体蛋白,如抗体的巨大潜力。见,例如,Hiatt,A.等人,Nature 342(6245)76-78(1989);Hein等人,Biotechnol.Prog.7(5)455-461(1991);Hiatt,A.,和Ma,J.K.,FEBS Lett 307(1)71-5(1992);Ma等人,Eur. J.Immunol.24131-138(1994);Ma等人,TIBTECH 13522-527(1995);Zeitlin等人,Nature Biotechnology 16(1361-1364(1998);Ma,H.K.-C等人,NatureMedicine 4(5)601-606(1998);Miele,L,Trends Biotechnol.1545-50(1997);Khoudi等人,Biotechnology and Bioengineering 64(2)135-143(1999);和Hood,E.E.&Jilka,J.M.,Curr.Opin.Biotechnol.10382-386(1999)。使用植物生产抗体的益处包括大规模生产,生产、维持和递送的成本降低,以及消除所得产物含有可能的有害污染物的危险,所述有害污染物为诸如对人和其他哺乳动物具致病性的病毒或者朊病毒。植物,像其他异源表达系统(包括哺乳动物细胞、细菌、酵母和昆虫)一样,在糖基化方面显示出差异。见,例如,Ma等人,Science 268716-719(1995);Jenkins等人,Nat.Biotechnol.14975-981(1996);和Lerouge等人,Plant Mol.Biol.3831-48(1998)。
在植物中,和在其他真核生物中一样,在与内质网(ER)结合的多聚核糖体上合成的可溶性和膜结合蛋白质的大多数都是糖蛋白,包括后来将运输至高尔基体、溶酶体、质膜或者细胞外基质的那些蛋白质。与糖蛋白连接的聚糖含有多种糖残基,它们以线性或分枝结构相连,这些结构可采取许多不同的构象。这些聚糖可能在促进正确的蛋白质折叠和装配中起基本作用并且,由此,增强蛋白质稳定性。所述聚糖也可以含有靶定信息,或者可以直接参与蛋白质识别(Maia等人,Genetics and Molecular Biology 24231-234(2001))。涉及到糖的蛋白质的三种主要翻译后修饰为N-和O-连接的糖基化和糖基磷脂酰肌醇锚的插入。
在进化过程中哺乳动物和植物系统中的N-连接的糖基化机制被保存。然而,在高尔基体中寡糖修剪和聚糖修饰的最后步骤中观察到差异。细菌没有N-连接的聚糖,酵母有聚甘露糖聚糖,与细菌和酵母不同,植物产生糖蛋白多聚体,其具有复杂的N-连接的聚糖,该聚糖的核心被两个N-乙酰葡糖胺(GlcNAc)残基取代。在哺乳动物中也观察到这些糖蛋白多聚体。见,例如,Kornfeld和Kornfeld,Ann.Rev.Biochem.54631(1985)。植物和动物糖多肽多聚体含有不同的末端糖类,其直接地与所存在的寡糖外部分枝连接。动物糖多肽多聚体,包括哺乳动物糖多肽多聚体,具有作为末端糖残基存在的唾液酸,而植物糖多肽多聚体则没有。所述末端核心被β1,2-连接的木糖(Xyl)和α1,3-连接的核心岩藻糖(Fuc)取代,而在哺乳动物中发生的是α1,6-连接的核心岩藻糖取代。此外,植物糖蛋白多聚体缺少在哺乳动物中发现的特征性含有半乳糖(Gal)和唾液酸的复杂N-聚糖(N-乙酰神经氨酸-α2-6/3Galβ1-4)。见,例如,Sturm等人,J.Biol.Chem26213392(1987)。发现在转基因植物中产生的具有植物-特异聚糖的鼠单克隆抗体在小鼠中不具免疫原性(Chargelegue等人,Transgenic Research 9187-194(2000))。
抗体在两条重链的每一条的Fc区具有保守的N-连接的糖基化。人IgA抗体在它们的铰链部分中具有O-连接的寡糖,此外,人IgA抗体还具有两条N-连接的糖链;一条发生在重链的CH2区域中的天冬酰胺(Asn)残基上,另一条在尾片区中的Asn残基上。见,例如,Baenzinger,J.和Kornfield,S.J.,Biol.Chem.2497260-7269(1974);和Torano等人,PNAS 742301-2305(1997)。从人血清分离的IgA的岩藻糖基化仅在尾片区中的Asn上发生(Tanaka等人,Glycoconj.J.10995-1000(1998))。
Hiatt等人已经产生了转基因植物,其表达编码单独的或装配的免疫球蛋白重链和轻链免疫球蛋白多肽的核苷酸序列。每种免疫球蛋白产物表达为含有前导序列的蛋白原,该前导序列形成指导该蛋白质进入内分泌途径的序列,从而允许该抗体分子的正确装配和糖基化。前导序列从成熟蛋白质切除。见,例如,美国专利号5,202,422;5,639,947和6,417,429。已经公开了协同表达和产生分泌性免疫球蛋白的方法,所述免疫球蛋白具有重链、轻链、J链和分泌性组分多肽,它们装配成功能抗体。见,例如,美国专利号5,959,177;6,046,037和6,303,341。此处引用的每一篇美国专利都被完整并入作为参考。鼠免疫球蛋白跨膜序列用于植物中重组免疫球蛋白链的质膜靶定(Vine等人,Plant Molecular Biology 45159-167(2001))。
发明概述本发明的重点围绕针对植物中生产免疫球蛋白组合物,简化免疫球蛋白谱。一方面,本发明提供了在植物中产生免疫球蛋白的材料和方法,其中至少某些附着到免疫球蛋白上的聚糖不被岩藻糖基化(即,至少一种聚糖缺少岩藻糖和/或免疫球蛋白至少部分地未被岩藻糖基化)。另一方面,本发明提供了在植物中产生单体免疫球蛋白的材料和方法,其中至少某些免疫球蛋白含有未被岩藻糖基化的聚糖。从而,一方面,本发明提供了在植物中产生IgA、IgD、IgE、IgG和IgM组合物的材料和方法,其中该组合物含有至少一种缺少岩藻糖的聚糖结构。在另一方面,本发明提供了在植物中产生免疫球蛋白的材料和方法,其中免疫球蛋白的重链缺少尾片(tailpiece)。
一方面,可以说通过本发明的材料和方法产生的免疫球蛋白的混合物是少量-岩藻糖基化或者极小(deminimus)岩藻糖基化的,这表明如此产生的一些、多数或者所有免疫球蛋白缺少岩藻糖基化。另一方面,通过本发明的材料和方法产生的免疫球蛋白的混合物可直接使用或者,备选地,无岩藻糖基化的免疫球蛋白可以与免疫球蛋白混合物分离并单独使用。
另一方面,本发明还产生了通过施用植物产生的免疫球蛋白治疗单纯疱疹病毒(“HSV”)或者肿瘤血管生成的材料和方法,其中该免疫球蛋白的至少一种聚糖结构缺少岩藻糖。
在本发明的另一方面,使用含有编码轻链和重链的核酸的单一载体完成免疫球蛋白的表达。
一方面,本发明提供了植物产生的免疫球蛋白,其中所述免疫球蛋白的糖肽谱含有至少一种缺少岩藻糖的糖肽。另一方面,本发明提供了这样的免疫球蛋白,其中至少一种糖肽含有天冬酰胺(Asn)残基。
另一方面,本发明提供了植物-产生的免疫球蛋白的重链(HC)或者轻链(LC),其中HC或者LC的糖肽谱含有至少一种缺少岩藻糖的糖肽。另一方面,HC具有至少一种糖肽,其含有CH2区中的天冬酰胺(Asn)残基。
一方面,本发明提供了植物产生的免疫球蛋白,其中该免疫球蛋白具有如下游离的聚糖谱,该聚糖谱含有至少一种缺乏岩藻糖的聚糖。另一方面,本发明提供了这样的免疫球蛋白,其含有天冬酰胺(Asn)残基。
再一方面,聚糖谱与


图12中提供的相同或者基本上相同。一方面,聚糖选自3Man,2GlcNAc,1Xyl;2Man,2GlcNAc,1Xyl;3Man,3GlcNAc,1Xyl;3Man,2GlcNAc;3Man,3GlcNAc;4Man,2GlcNAc;5Man,2GlcNAc;和6Man,2GlcNAc,其中Man=甘露糖,GlcNAc=N-乙酰葡糖胺,Xyl=木糖。在另一方面,聚糖选自3Man,2GlcNAc,1Xyl或2Man,2GlcNAc,1Xyl,其中Man=甘露糖,GlcNAc=N-乙酰葡糖胺,Xyl=木糖。
另一方面,聚糖谱和
图16中提供的聚糖谱之一相同或者基本上相同。另一方面,聚糖选自H2N2X;H3N2;和H3N2X,其中H=己糖,N=HexNAc=N-乙酰己糖,X=木糖。在再一方面,聚糖选自N2H8;N2H3X;N2H3X;N2H4X;N2H5;N2H6;N2H7;N2H8;N3H3X;N2H4;和N2H5,其中H=己糖,N=HexNAc=N-乙酰己糖,X=木糖。在本发明的一方面,对于这些免疫球蛋白的每一种,己糖为甘露糖并且N-乙酰己糖为N-乙酰葡糖胺。
在本发明的一方面,此处详述的免疫球蛋白可以是选自IgG、IgA、IgM、IgE和IgD的任一免疫球蛋白。一方面,目标免疫球蛋白是IgA或者IgG。例如,在本发明的一方面,免疫球蛋白是具有重链和轻链的IgA抗体。这种IgA的一个特定实例是抗-单纯疱疹病毒抗体。在另一实施方案中,免疫球蛋白是具有重链和轻链的IgG抗体。这种IgG的一个特定实施是抗-双整联蛋白抗体,如抗-αVβ3,αVβ5双整联蛋白抗体。
一方面,本发明的免疫球蛋白的聚糖谱与
图19、或图21或图23中提供的聚糖谱相同或者基本上相同。
一方面,本发明提供了植物产生的免疫球蛋白,其含有至少一种没有末端岩藻糖的附着聚糖。另一方面,这种免疫球蛋白在CH2区含有天冬酰胺(Asn)残基。
一方面,本发明提供了植物产生的免疫球蛋白,其聚糖谱含有至少一种缺少岩藻糖的聚糖,其中使用基质-辅助的激光解吸/电离飞行时间质谱(MALDI-Tof MS)分析从该免疫球蛋白酶促释放的游离N-连接的聚糖来确定聚糖谱。这种免疫球蛋白的一个实例是IgA,如抗-单纯疱疹病毒抗体。另一方面,这种免疫球蛋白的一个实例是IgG,如抗-双整联蛋白抗体。这种抗-双整联蛋白抗体的一个实例是抗-αVβ3,αVβ5双整联蛋白抗体。
一方面,本发明提供了含有本文中描述和公开的免疫球蛋白的植物细胞、植物组织、植物愈伤组织、小植株、全株植物或者种子。一方面,所述植物细胞、植物组织、植物愈伤组织或者种子是单子叶植物的。另一方面,本发明提供了植物细胞、植物组织、植物愈伤组织或者种子,其中单子叶植物是玉米植物。另一方面,本发明提供了小植株和全株植物,其中小植株或全株植物是单子叶植物的。例如,本发明的植物细胞、植物组织、植物愈伤组织或者种子可以是玉米植物的植物细胞、植物组织、植物愈伤组织或者种子。
一方面,本发明的免疫球蛋白可以位于种子的胚乳中。
一方面,本发明的免疫球蛋白可以是人免疫球蛋白。
一方面,本发明的免疫球蛋白具有缺少尾片的重链。一方面,这些免疫球蛋白是IgA抗体,如抗-单纯疱疹病毒抗体。
一方面,本发明提供的免疫球蛋白从用于产生该免疫球蛋白的植物分离。
一方面,本发明提供了单体抗体组合物,其含有至少一种如
图12中提供的具有1号结构(3Man,2GlcNAc,1Xyl)的聚糖,其中Man=甘露糖,GlcNAc=N-乙酰葡糖胺,Xyl=木糖。
另一方面,本发明提供了单体抗体组合物,其含有至少一种如
图12中提供的具有2号结构(2Man,2GlcNAc,1Xyl)的聚糖,其中Man=甘露糖,GlcNAc=N-乙酰葡糖胺,Xyl=木糖。
一方面,本发明提供了植物产生的免疫球蛋白,其含有如下氨基酸片段,该氨基酸片段缺少具有岩藻糖的附着聚糖,其中当该免疫球蛋白是哺乳动物产生的时候,该免疫球蛋白在相同的氨基酸片段或者基本上相同的氨基酸片段上具有带岩藻糖的附着聚糖。
一方面,本发明提供了植物产生的免疫球蛋白,其针对特定氨基酸片段含有聚糖谱,其中当该免疫球蛋白是哺乳动物产生的时候,该免疫球蛋白对于相同的氨基酸序列或者基本上相同的氨基酸片段具有相同或者基本上相同的聚糖谱。
一方面,本发明提供了植物产生的免疫球蛋白,其含有具有缺少岩藻糖的附着聚糖的氨基酸片段,其中当该免疫球蛋白是哺乳动物产生的时候,该免疫球蛋白在相同的氨基酸片段或者基本上相同的氨基酸片段上也缺少具有岩藻糖的附着聚糖。
一方面,本发明提供了植物产生的免疫球蛋白,其中该免疫球蛋白具有如下游离聚糖谱,该聚糖谱含有缺少岩藻糖的聚糖,其中当该免疫球蛋白是哺乳动物产生的时候,该免疫球蛋白的游离聚糖谱含有也缺少岩藻糖的相同聚糖。
一方面,本发明提供了这样的免疫球蛋白,其中由哺乳动物产生的该免疫球蛋白在CHO细胞中产生。
一方面,本发明提供了这样的免疫球蛋白,其中植物产生的该免疫球蛋白在玉米细胞中产生并且哺乳动物产生的该免疫球蛋白在CHO细胞中产生。
一方面,本发明提供了产生经转化的植物细胞的方法,其中该转化植物细胞表达具有至少一种没有岩藻糖的附着聚糖的免疫球蛋白,所述方法包括通过向植物细胞导入含有编码该免疫球蛋白的重链和轻链的核酸序列的单一载体,转化植物细胞,其中每种核酸有效连接启动子,并培养经转化的植物细胞以产生表达免疫球蛋白的植物细胞,该免疫球蛋白具有至少一种缺少岩藻糖的附着聚糖。再一方面,本发明还提供了从经转化的植物细胞分离免疫球蛋白的方法。另一方面,本发明提供了从经转化的植物细胞再生经转化的植物愈伤组织或者经转化的全株植物的方法。再一方面,本发明提供了从经转化的植物愈伤组织或者经转化的全株植物分离免疫球蛋白的方法。再一方面,本发明提供了这样的方法,其中重链和轻链的序列有效连接到相同启动子上。再一方面,本发明提供了这样的方法,其中重链和轻链的序列有效连接到不同启动子上。一方面,本发明提供了这样的方法,其中启动子是组成性启动子。例如,35S CaMV启动子或者玉米泛素-1启动子可用于本发明的方法中。再一方面,本发明的方法利用种子-特异的启动子。再一方面,本发明利用胚乳-特异的启动子。
一方面,本发明提供了这样的方法,其中载体选自pDAB8505、pDAB1472、pDAB1473、pDAB1474、和pDAB1475。
一方面,本发明提供了载体pDAB8505、pDAB1472、pDAB1473、pDAB1474、和pDAB1475。
一方面,本发明提供了这样的方法,其中用农杆菌-介导的转化方法或者WHISKERSTM转化方法转化植物细胞。
一方面,本发明提供了产生分离的单体抗-单纯疱疹病毒抗体的方法,该方法包括(i)向植物细胞导入具有SEQ ID NO1或SEQ ID NO5和SEQ ID NO9或SEQ ID NO13的核酸,每种核酸与启动子有效连接,以产生经转化的植物细胞;(ii)培养该经转化的植物细胞以表达所导入的核酸;和(iii)分离该植物细胞产生的单体抗-单纯疱疹病毒抗体。一方面,本发明还提供了这样的方法,其包括从经转化的植物细胞再生转化的植物。
一方面,本发明提供了核酸分子,其含有选自SEQ ID NO15(pDAB635)、SEQ ID NO16(pDAB16)、SEQ ID NO17(pDAB637)、SEQID NO84(pDAB3014)、和SEQ ID NO85(pDAB8505)的核酸序列。
一方面,本发明提供了经分离的核酸分子,其含有编码SEQ ID NO10或SEQ ID NO14所编码的氨基酸的核酸序列。
一方面,本发明提供了经分离的核酸分子,其含有SEQ ID NO1或SEQ ID NO5。
一方面,本发明提供了经分离的核酸分子,其含有SEQ ID NO9或SEQ ID NO13。
一方面,本发明提供了经分离的载体或者质粒,其含有SEQ ID NO1或SEQ ID NO5。
一方面,本发明提供了经分离的核酸分子,其含有编码SEQ ID NO2或SEQ ID NO6所编码的氨基酸的核酸序列。
另一方面,本发明的免疫球蛋白具有含有SEQ ID NO6的氨基酸序列的重链。另一方面,本发明的免疫球蛋白具有含有SEQ ID NO14的氨基酸序列的轻链。
一方面,本发明提供了经分离的载体或者质粒,其含有SEQ ID NO9或SEQ ID NO13。
从上面的内容将理解本发明的工具和方法可应用于产生配子的所有植物。这些植物包括,但不限于,双子叶植物和单子叶植物,包括草本植物、饲草、草皮草、豆科牧草(例如,紫花苜蓿)、蔬菜、农作物植物(例如,玉米和大豆)、树和装饰用花。
在阅读了本文提供了说明书和附图后,本发明的其他目的、优点和特征将对于本领域技术人员是显而易见的。
附图简述前面的概述以及下面的发明详述与附图一起阅读后将可以更好地理解。对了阐明本发明,在附图中显示了本发明优选的实施方案。然而,应该理解本发明不限于所示的精确安排和手段。
在附图中
图1.pDAB635(ubiH)的质粒。(SEQ ID NO15)。
SAR核苷酸424-1589玉米泛素启动子/内含子 核苷酸1717-3730抗-HSV重链 核苷酸3732-5240(带有大麦α淀粉酶前导序列)玉米per53′UTR 核苷酸5248-5612SAR核苷酸5720-6885图2pDAB636(ubiL)的质粒。(SEQ ID NO16)SAR核苷酸424-1589玉米泛素启动子/内含子 核苷酸1717-3730抗-HSV轻链 核苷酸3732-4448
(带有大麦α淀粉酶前导序列)玉米per53′UTR 核苷酸4456-4820SAR 核苷酸4928-6093图3pDAB637(ubiH+L)的质粒。(SEQ ID NO17)SAR 核苷酸424-1589玉米泛素启动子/内含子核苷酸1709-3722抗-HSV重链 核苷酸724-5232(带有大麦α淀粉酶前导序列)玉米per53′UTR 核苷酸5240-5604玉米泛素启动子/内含子核苷酸5745-7758抗-HSV轻链 核苷酸7760-8476(带有大麦α淀粉酶前导序列)玉米per53′UTR 核苷酸8484-8848SAR 核苷酸8956-10121图4.非变性蛋白质印迹,使用IgAκ链作为检测抗体,检测转基因玉米愈伤组织产生的泛素HSV-IgA(HC/LC)抗体的蛋白质表达。通过PCR分析了从二方转化(pDAB637(SEQ ID NO17)和pDAB3014(SEQ IDNO84))得到的共53个转基因愈伤组织和从三方转化(pDAB635(SEQ IDNO15)和pDAB3014(SEQ ID NO84))得到的23个转基因愈伤组织以检测转基因的PTUs的存在。对PTU阳性和阴性的愈伤组织事件进行蛋白质印迹和ELISA分析。用上面描述的来自泛素/HC,LC转化的事件,产生蛋白质分析数据。实验的目的是比较单个质粒上HC和LC的表达效能和两个分开的质粒上HC和LC的表达效能。收集愈伤组织材料并在-70℃冰冻后运输以用于蛋白质分析。使用IgA重链捕获抗体和IgAκ链检测抗体在捕获ELISA试验中实施事件的最初筛选。仅对ELISA阳性样品用非变性蛋白质印迹评估,此时也使用IgAκ链作为检测抗体。在通过ELISA筛选的54个事件中,26个是阳性的(表1)。泳道1分子量标准;泳道2重链IgA;泳道3来自转基因植物的愈伤组织材料;泳道4从样品3-006检测的IgA(表1);泳道5从样品4-008检测的IgA(表1);泳道6-10分别从样品21、24、25、28和29检测的IgA(表1)。蛋白质印迹分析条件为4-12%GEL非还原样品缓冲液,每孔62ng总蛋白质;1∶5000山羊抗-人κ-HRP,室温下1小时;和5分钟曝光时间。
图5.pDAB8505片段(11398bp)的线性质粒。(SEQ ID NO85)。
图6.经还原和烷基化的IgA-HX8(事件193self)的胰蛋白酶消化物的代表性C18-HPLC层析图。峰的安排基于基质-辅助的激光解析/电离飞行时间质谱(“MALDI-Tof MS”)对HPLC级分的分析。用“L”标记的峰相应于从IgA-HX8的轻链得到的肽。用“H”标记的峰相应于从IgA-HX8的重链得到的肽。详情参见表1和表2以及所附文本。用肽-N-糖苷酶-A(PNGase-A)进一步处理含有糖肽的级分并通过MALDI-Tof MS分别分析所得脱糖基化的肽和释放的聚糖。HPLCMagic C18,2×150mm。对所收集的级分实施离线MALDI MS。
图7.通过胰蛋白酶消化经还原和烷基化的IgA-HX8(事件193self)而产生的IgA-HX8重链的H-T13肽的糖型(glycoforms)的代表性MALDI-Tof MS。指出了糖肽的单种同位素质量。峰上面的大个数字相应于表8中总结的聚糖种类。单糖单位的短的缩写如下H,己糖;N,N-乙酰葡糖胺(GlcNAc);X,戊糖(木糖)。
图8.通过聚糖的酶促释放(PNGase-A)除去了IgA-HX8重链的H-T13肽的糖型(glycoforms)的异质性。用PNGase-A处理后,相应于H-T13肽的糖型的信号消失并且在质谱中出现相应于脱糖基化的肽H-T13的强信号。注意,在脱糖基化反应期间PNGase-A将Asn(N)转化成Asp(D);相应地,出现脱糖基化H-T13肽,伴有~+IDa的质量迁移。糖肽(PNGase-A处理前)的质谱中峰上面的大号数字相应于表8中所列的聚糖种类。
图9.观察到玉米表达的IgA-HX8重链的H-T13肽的两种额外的糖型附着到N269上的单和双GlcNAc残基。糖肽(PNGase-A处理前)的质谱中峰上面的大号数字相应于表8中所列的聚糖种类。用PNGase-A处理导致除去(GlcNAc)2和部分除去单GlcNAc残基。用PNGase-A处理样品后质谱中出现相应于脱糖基化的肽H-T13的峰(数据未显示)。
图10.从单体IgA-HX8(事件193self)酶促释放的游离的N-连接的聚糖的代表性MALDI-Tof MS谱。峰上面的大号数字相应于表8中概述的聚糖种类。单糖单位的短的缩写如下H,己糖;N,N-乙酰葡糖胺(GlcNAc);X,戊糖(木糖)。由于MALDI MS难以达到低于500道尔顿(Da)的分子量区域,所以没有检测到作为游离聚糖的单和双GlcNAc种类(表8中的结构11和12)。以钠离子形式观察到聚糖种类。
图11.使用胚乳来源的HX8中和HSV-2。
图12.从植物分离的IgA聚糖的结构。由于MALDI MS不能达到低于500道尔顿(Da)的分子量区域,所以没有检测到作为游离聚糖的单和双GlcNAc种类(结构11和12)。
图13.单体、二聚体和分泌性抗体的图示。
图14.pDAB3014质粒。(SEQ ID NO84)。
稻肌动蛋白启动子 核苷酸1172-1724;PAT(膦丝菌素酰基转移酶基因) 核苷酸1727-2281;玉米脂肪酶3’UTR 核苷酸2296-6652。
图15.pDAB8505环状质粒。(SEQ ID NO85)。
SAR 核苷酸424-1589;玉米γ玉米醇溶蛋白启动子 核苷酸1673-3175;抗-HSV重链基因 核苷酸3178-4668;玉米per53′UTR 核苷酸4678-5045;玉米γ玉米醇溶蛋白启动子 核苷酸5157-6659;抗-HSV轻链基因 核苷酸6662-7360;玉米per53′UTR 核苷酸7370-7737;稻肌动蛋白启动子及内含子 核苷酸7889-9258;PAT编码区核苷酸9260-9820;玉米脂肪酶3′UTR 核苷酸9831-10162;
SAR 核苷酸10229-11394。
注意抗-HSV重链基因和抗-HSV轻链都包括小鼠前导序列。
图16A到16G对在转基因玉米中表达的IgA-HX8(不同事件)的聚糖谱的总结。还包括所建议的聚糖结构的图示,其中“H”或者圆形=己糖(Man,Gal,Glc);“N”或者长方形=HexNAc(GlcNAc或GalNAc);“X”或叉形=木糖;“F”或三角形=岩藻糖;“P”=磷酸(PO3)。注释基于MALDI-质谱中峰高度的聚糖百分数(%)仅用于参考而不能用于准确定量。
图17A.质粒pDAB1472(
图17A)和pDAB1473(
图17B)。
图18.质粒pDAB1474(
图18A)和pDAB1475(
图18B)。
图19.就事件660对IgG观察到的糖型。通过PNGase-A处理从糖肽除去所有聚糖。对于单个N,除去是不完全的。代码“H”=己糖(Man,Gal,Glc);“N”=HexNAc(GlcNAc或GalNAc);“X”=木糖;“F”=岩藻糖。
信号强度*=S/N>3-5,但是<10;**=S/N>10;***=强信号,但是小于“次要的”;“显著信号”=“次要”和“主要”之间的强度。
图20A.事件660的H-T27肽(重链的N299位点)的糖型的代表性MALDI-TOF MS谱。
图20B.对于事件660在m/z2360.06(主要糖型,N2H3XF)的放大。
图21.对IgG就事件661观察到的糖型。通过PNGase-A处理从糖肽除去所有聚糖。对于单个N,除去是不完全的。代码“H”或图形=己糖(Man,Gal,Glc);“N”或长方形=HexNAc(GlcNAc或GalNAc);“X”或叉形=木糖;“F”或三角形=岩藻糖。
信号强度*=S/N>3-5,但是<10;**=S/N>10;***=强信号,但是小于“次要的”;
“显著信号”=“次要”和“主要”之间的强度。
图22A.事件661的H-T27肽(重链的N299位点)的糖型的代表性MALDI-TOF MS谱。HPLC级分16。
图22B.对于事件661在m/z2360.06(主要糖型,N2H3XF)的放大。注释同位素分辨(isotopic resolution)。
图22C.事件611的H-T27肽的糖型(在m/z1189.65未糖基化,在m/z1392.76为单一HexNAc,加上在更高m/z处H-T26-27肽上一些N-糖型)的代表性MALDI-TOF MS谱。HPLC级分17。
图22D.从H-T27糖肽释放的N-聚糖。游离聚糖的MALDI MS。该MALDI质谱中的强度与中性N-聚糖的丰度大约成比例。注释没有计算单和双GlcNAc。
图23.对IgG就事件663观察到的糖型。通过PNGase-A处理从糖肽除去所有聚糖。对于单个N,除去是不完全的。代码“H”=己糖(Man,Gal,Glc);“N”=HexNAc(GlcNAc或GalNAc);“X”=木糖;“F”=岩藻糖。
信号强度*=S/N>3-5,但是<10;**=S/N>10;***=强信号,但是小于“次要的”;“显著信号”=“次要”和“主要”之间的强度。
图24A.事件663的H-T27肽(重链的N299位点)的糖型的代表性MALDI-TOF MS谱。
图24B.对于事件663在m/z2360.07(主要糖型,N2H3XF)的放大。注释同位素分辨率。
图25.对CHO-表达的IgG所观察到的糖型。通过PNGase-A处理从糖肽除去所有聚糖。对于单个N,除去是不完全的。代码“H”=己糖(Man,Gal,Glc);“N”=HexNAc(GlcNAc或GalNAc);“X”=木糖;“F”=岩藻糖。
信号强度
*=S/N>3-5,但是<10;**=S/N>10;***=强信号,但是小于“次要的”;“显著信号”=“次要”和“主要”之间的强度。
图26A.CHO-表达的IgG的H-T27肽(重链的N299位点)的糖型的代表性MALDI-TOF MS谱。
图26B.CHO-表达的IgG在m/z2633.61(主要糖型,N4H3F)的放大。注释同位素分辨率。
发明详述除非另外定义,本文中所用的所有技术和科学术语具有与本发明所属领域中普通技术人员通常理解的相同的含义。尽管与本文中所描述的相似或者等价的任何方法和材料都可用于实施或者检验本发明,但是此处描述优选的方法和材料。
I.定义本文中,术语“无岩藻糖基化的”或者“无岩藻糖基化”指如下情况,其中附着到免疫球蛋白、免疫球蛋白的部分、抗体或者抗体的部分上的特定聚糖、聚糖级分、糖肽或者糖肽级分缺乏岩藻糖。此处术语“无岩藻糖基化的”和“无岩藻糖基化”的使用不意在暗示导致岩藻糖不能附着或者附着后被除去的任何特定机制、分子或者其他因素。从而,此处术语的使用不意在暗示岩藻糖通过下面的机制中任何特定的一种被除去转录地、翻译地或者翻译后地。
本文中,术语“农作物植物”指以生产规模栽培的、最通常为收获种子、青贮料或者干草饲料而栽培的任何作物植物。实例包括,但不限于玉米、大豆、黑麦、小麦、燕麦、大麦、小扁豆(lentil)、干豌豆、油菜、高梁、紫花苜蓿、黑小麦、三叶草,等等。
本文中,术语“等位基因”指基因的几种可变形式中的任一种。
本文中,术语“氨基酸”指作为蛋白质和肽的组分的氨基羧酸。表6和7中和本文别处所用的氨基酸的缩写如下A(Ala) C(Cys) D(Asp) E(Glu) F(Phe)G(Gly)H(His) I(Iso) K(Lys) L(Leu) M(Met)N(Asn)P(Pro) Q(Gln) R(Arg) S(Ser) T(Thr)V(Val)W(Trp) Y(Tyr)本文中,“抗-α-v-β 3,α-v-β5双整联蛋白抗体”、“抗-双整联蛋白抗体”、“抗-双整联蛋白抗体部分”、“抗αvβ3,抗αvβ5”、“抗αvβ3,抗αvβ5”或者“抗-双整联蛋白抗体片段”和/或“抗-双整联蛋白抗体变体”等等包括含有如下分子的任何蛋白质或肽,该分子含有免疫球蛋白的至少一部分,如但不限于重或者轻链的至少一个互补决定区(CDR)或者其配体结合部分、重链或轻链可变区、重链或轻链恒定区、构架区,或者其任何部分,或者可以掺入本发明的抗体中的双整联蛋白受体或者结合蛋白的至少一部分。
本文中,术语“抗体”指对接触识别为“非己”的病原体或者部分作出应答而在身体(人或动物)中正常产生的蛋白质。抗体(如IgG和sIgA)和抗体片段(如,Fab和ScFv)具有中和病原体,从而造成对该病原体的免疫力的特异能力。抗体分子由四条多肽链组成两条相同的重链(HC)和两条相同的轻链(LC)。Y抗体构型的每个“臂”含有一条轻链和一条重链的部分;铰链区允许臂移动;两条重链的剩余部分形成“茎干”(见
图13)。Y的每个臂区作为抗原结合部位,这些结合部位与该多肽的可变区相关。HC和LC通过二硫键保持在一起。分泌性抗体还含有连接链(JC)和分泌组分(SC)。
本文中,术语“抗原”指能够诱导特异免疫应答并且能与通过该应答产生的所得抗体反应的任何物质。
本文中,术语“抗病毒剂”指干扰病毒复制的物质。
本文中,术语“主链质粒”或者“主链载体”指含有表达目的基因所需的所有必要元件的质粒,这些必要元件包括MAR序列、启动子、3’UTR、选择标记基因盒和用于抗体编码区的一步加入的独特限制位点。主链载体的另一特征是存在用于有效除去抗生素抗性基因的独特限制位点。
本文中,术语“β-葡糖醛酸糖苷酶”或者“GUS”指通常用于植物转化研究中的来自大肠杆菌(Escherichia coli)的可筛选的标记基因。见,例如,Jefferson,R.,等人,Proc.Nat.Acad.Sci.USA 838447-8451(1986);Jefferson,R.,等人,EMBO J.63901-3907(1987);Jefferson,R.,PlantMol.Biol.Rep.5387-405(1987);和Jefferson,R.,Plant Mol.Biol.Rep.5387-405(1988)。
本文中,术语“作物植物”指为任何商业目的而栽培的任何植物,该目的包括,但不限于下面的目的种子生产、干草饲料生产、装饰用途、水果生产、浆果生产、蔬菜生产、油生产、蛋白质生产、饲料生产、动物放牧、高尔夫球场、草坪、花生产、美化环境、控制侵蚀、绿肥、改善土壤适耕性/健康、生产药物产品/药物、生产食品添加剂、烟草产品、纸浆生产和木材生产。
本文中,术语“异花传粉”或者“杂交育种”当涉及植物时指将一株植物上的一朵花的花粉(人工或天然地)应用于另一株植物上的花的胚珠(柱头)的方法。
本文中,术语“栽培品种”当指植物时表示通过园艺或农艺技术产生的正常不存在于野生群体中的植物变种、株系或品种。
本文中,术语“双子叶植物”和“双子叶的”指开花植物,其胚胎含有两个种子半片或者子叶。实例包括烟草;番茄;豆类,包括豌豆、紫花苜蓿、三叶草和大豆;橡树;枫树;玫瑰;薄荷;南瓜;雏菊;胡桃;仙人掌;紫罗兰和毛茛。
本文中,术语“二聚体抗体”或者“dIgA”指含有通过J链连接的两个单体抗体的抗体。从而,“二聚体IgA”或者“dIgA”含有通过J链连接的两个单体IgA抗体(见
图13B);“二聚体抗-HSV IgA”或者“抗-HSVdIgA”含有通过J链连接的针对单纯疱疹病毒的两个单体IgA抗体。
本文中,术语“胚乳”指在许多植物种子中发现的三倍体结构,其由胚囊的两个极核和来自花粉的一个精核融合并发育产生。胚乳常常储存养料物质,其在萌芽期间分解。
本文中,术语“子代”指特定亲代后的任何一代植物细胞、组织或者生物体。亲本植物交配所得的世代是子一代(称为“F1”或“F1”),而F1植物杂交所得的世代是子二代(称为“F2”或“F2”)。
术语“配子”指生殖细胞,其核(以及常常细胞质)与具有相似起源但是相反性别的另一配子融合形成合子,合子具有发育成新的单个植物的潜力。配子通常是单倍体并且区分成雄性和雌性。
术语“基因”指与生物学功能相关的任何DNA片段。从而,基因包括,但不限于,编码序列和/或它们的表达所需的调节序列。基因还可以包括非表达的DNA片段,其例如,形成其他蛋白质的识别序列。可以从多种来源得到基因,包括从目标来源克隆或者从已知的或者经预测的序列信息合成,并且基因可以包括经设计而具有所希望的参数的序列。
本文中,术语“基因型”指细胞、细胞培养物、组织、完整生物体(例如,完整植物或动物)、或者一群完整生物体(例如,一群植物或动物)的基因组成。
本文中,术语“聚糖”与“多糖”同义,指由通过糖苷键相互连接的单糖(例如,葡萄糖)残基组成的任何线性或者分枝的聚合物。聚糖的实例包括糖原、淀粉、透明质酸、和纤维素。
本文中,术语“糖苷”指含有糖分子(糖)的任何化合物,尤其是植物中的任何这种天然产物,其可以通过水解切割转化成糖和非糖组分。
本文中,术语“糖肽”指化合物或者组合物,其中糖共价连接到肽或者寡肽上。
本文中,术语“糖蛋白”指化合物或者组合物,其中糖共价连接到蛋白质上。
本文中,术语“糖基化”指将寡糖加到蛋白质的特定残基上。该修饰可以共翻译地和翻译后地发生在内质网和高尔基体中。可以区分三种不同形式的糖基化N-连接的寡糖、O-连接的寡糖和糖基-磷脂酰肌醇(GPI-)锚。
本文中,术语“半合子”指某一基因在基因型中仅出现一次的细胞、组织或者生物体,像单倍体细胞或者生物体中的基因,在异配性别中的性连锁基因,或者在二倍体细胞或者生物中的染色体片段中的基因,其中该染色体片段的配偶体片段已经缺失。
本文中,术语“疱疹”指由单纯疱疹病毒或者水痘-带状疱疹病毒导致的炎性皮肤病。
本文中,术语“单纯疱疹”指由“单纯疱疹病毒1”(也称作“HSV1”和“1型单纯疱疹病毒”)和“单纯疱疹病毒2”(也称作“HSV2”和“2型单纯疱疹病毒”)导致的各种感染,所有这些感染均涉及几种急性、炎性病毒疾病之任一种。这些疾病的特征是通常在嘴、唇、脸和生殖器上的小水疱出疹。HSV1和HSV2导致的水疱的位置不是位置特异的。
本文中,术语“疱疹病毒”指属于疱疹病毒科(Herpes viridae)的任何病毒。
本文中,术语“杂聚糖”或者“杂多糖”指由两种或多种不同类型的单糖残基组成的聚糖。
“异源多核苷酸”或者“异源核酸”或者“外源DNA片段”指多核苷酸、核酸或者DNA片段,其来自相对于具体宿主细胞而言外来的来源,或者如果来自相同的来源,则已被修饰而不同于其最初的形式。从而,宿主细胞中的异源基因包括此具体宿主细胞内源的基因,但是该基因已经被修饰。从而,该术语指这样的DNA片段,其(i)对该细胞是外来的或者异源的,或者(ii)与该细胞同源但是其处于该宿主细胞核酸内的位置非该元件通常所在的位置。外源DNA片段可以表达而产生外源多肽。
“异源性状”指外源DNA片段、异源多核苷酸或者异源核酸赋予经转化的宿主细胞或者转基因生物的表型。
本文中,术语“杂合子”指在至少一个基因座上具有不同等位基因(给定基因的形式)的二倍体或者多倍体个体植物细胞或者植物。
本文中,术语“杂合的”指在特定基因座位存在不同的等位基因(给定基因的形式)。
本文中,术语“HPLC”指高效液相层析。
本文中,术语“纯合子”指在一个或多个基因座上具有相同等位基因的个体植物细胞或者植物。
本文中,术语“纯合的”指同源染色体片段中一个或多个基因座上存在相同的等位基因。
本文中,术语“杂种”指由一个或多个基因不同的亲本之间杂交产生的任何细胞、组织或者完整生物体(例如,完整植物或者动物)。
本文中,术语“HX8”或者“HX-8”指IgA抗体的标识码,其中H=疱疹,X=单纯的,8=样品号。HX8是人单克隆抗体(样品号8),其中和1型和2型单纯疱疹病毒(HSV)并结合糖蛋白D上存在的表位,具有ATCC69522产生的Fab片段的结合特异性,并且其重链具有如美国专利号6,156,313中提出的SEQ ID NO1的CDR3,该此处引用该完整专利作为参考。HX8抗体的重链和轻链的完整核苷酸分别如SEQ ID Nos1和9所示。
本文中,术语“免疫球蛋白”或者“Ig”指在血浆或者其他体液中发现的一类结构上相关的蛋白质产物或者这些蛋白质的部分,它们具有免疫学活性并且能够特异结合抗原。每种Ig由两对免疫学活性部分免疫球蛋白轻链(LC)(κ,λ)和免疫球蛋白重链(HC)(γ、α、μ、δ和ε)组成(见
图13A)。基于结构和生物学活性,有5大类抗体蛋白质或者免疫球蛋白IgM、IgG、IgA、IgD、和IgE。尽管多数抗体类别作为单个分子分泌,但是IgA和IgM抗体缔合成更大的聚合物,其部分地通过其他蛋白质链稳定化。
本文中,术语“免疫球蛋白产物”或者“Ig产物”指能够与抗原特异结合的多肽、蛋白质或者多聚体蛋白质。示例性免疫球蛋白产物是免疫球蛋白重链、免疫球蛋白分子、基本上完整的免疫球蛋白分子、含有抗原互补位的免疫球蛋白的任何部分,包括本领域公知的那些部分,如Fab片段。
本文中,术语“近亲交配”或者“近交系”指相对不分离的品系。
本文中,术语“整联蛋白”指作为细胞粘着分子的受体的一个跨膜蛋白质大家族的任何成员。整联蛋白是异二聚体分子,其中α和β亚基非共价结合。
本文中,术语“连接链”、“J链”或者“JC”指参与免疫球蛋白的聚合和所聚合的免疫球蛋白通过上皮细胞的运输的多肽。见,例如,TheImmunoglobulin HelperThe J Chain in Immunoglobulin Genes,345页,Academic Press(1989)。JC在五聚体IgM和二聚体IgA(见
图13B)中发现并且通常通过二硫键连接。
本文中,术语“基因座”指任何已经被遗传确定的位点。基因座可以是基因、或者基因的部分,或者具有一定的调节作用的DNA序列,并且可以被不同的序列占据。
本文中,术语“MALDI”指基质-辅助的激光解吸电离。
本文中,术语“MALDI-Tof质谱”或者“MALDI-Tof MS”指基质-辅助的激光解吸/电离飞行时间质谱。用于确定MALDI-Tof质谱的设备的一个实例是Applied Biosystems Voyager DE-STR MALDI飞行时间(MALDI-Tof)质谱仪。
本文中,术语“基质附着区”(matrix attachment region)或者“MAR”,也称作“支架附着区”(scaffold attachment region)或者“SAR”,指特定DNA序列,在该序列处发生与核支架网络的附着。关于本发明所用MAR序列的信息可在美国专利号5,773,689和6,239,328中得到,此处完整引用所述专利作为参考。
本文中,术语“混合选择”当用于描述植物育种方法时指一种选择形式,其中选择多个植物个体并从它们的种子的集合繁殖下一代。
本文中,术语“单克隆抗体”或者“Mab”指从识别特定抗原的单个抗体产生细胞得到的抗体。通过杂交瘤细胞产生MAb,杂交瘤细胞是产生该抗体的细胞和多发性骨髓瘤细胞的融合物。该骨髓瘤细胞可以持续产生该抗体。
本文中,术语“单子叶植物”或“单子叶的”指开花植物的一个亚类(单子叶植物纲),该亚类中的所有植物均具有仅含有一片子叶的胚并且通常具有平行叶脉的叶子,其花瓣为三的倍数,并且在茎干和根中没有次生生长。实例包括百合、兰花、稻、玉米、草,如苇状羊茅、山羊草和草地早熟禾;谷物,如小麦、燕麦和大麦;鸢尾;洋葱和棕榈。
本文中,术语“单体抗体”指含有通过二硫键相互连接的两条轻链和两条重链的抗体(见
图13A)。从而,“单体IgA”或“mIgA”含有IgA抗体的两条轻链和两条重链;“单体HSVIgA”或者“HSVmIgA”含有针对单纯疱疹病毒的IgA抗体的两条轻链和两条重链。
本文中,术语“多聚体蛋白质”指球状蛋白质,其含有一条以上的分开的多肽或者蛋白质链,这些链相互缔合而形成一个球状蛋白质。异二聚体和同二聚体蛋白质都是多聚体蛋白质。
本文中,术语“核酸”或者“多核苷酸”指脱氧核糖核苷酸或者核糖核苷酸和它们的单链或者双链形式的聚合物。除非特别限制,该术语包括含有天然核苷酸的公知类似物的核酸,所述类似物具有与参比核酸相似的结合性质并且以与天然发生的核苷酸相似的方式被代谢。特别地,通过将一个或多个所选(或者所有)密码子的第三个位置用混合碱基和/或脱氧次黄苷残基置换产生序列,可以实现简并密码子置换。见,例如,Batzer等人,Nucleic Acid Res.195081(1991);Ohtsuka等人,J.Biol.Chem.2602605-2608(1985);Rossolini等人,Mol.Cell.Probes 891-98(1994)。术语核酸与基因、cDNA和基因编码的mRNA可互换使用。
本文中,术语“寡糖”指含有少数(2到约20个)通过糖苷键连接的单糖残基的任何分子。
本文中,DNA片段当与另一DNA片段具有功能相关性时称为“有效连接”。例如,如果编码信号序列的DNA表达为参与多肽的分泌的前蛋白时,那么该编码信号序列的DNA与编码该多肽的DNA有效连接;如果启动子或者增强子刺激编码序列的转录,那么该启动子或者增强子与该编码序列有效连接。通常,有效连接的DNA序列是相邻的,并且对于信号序列,既是相邻的又是相同阅读相的。然而,当启动子和增强子控制编码序列的转录时,该启动子和增强子不必与该编码序列相邻。连接可以利用方便的限制位点实现或者利用插入以代替所述限制位点的连接物或者接头而实现。
本文中,术语“开放传粉”当涉及植物时指自由暴露于一定的基因流的植物群体,与近亲授粉不同,在近亲授粉中,存在对基因流的有效屏障。
本文中,术语“开发传粉群体”或者“开放传粉品种”当涉及植物时指根据一个标准选择的正常能够进行至少一定的异花受精的植物,所述植物可以表现出变异但是也具有一种或多种基因型或者表型特征,通过所述特征该群体或者品种可以与其他群体或品种区分开来。对异花传粉没有屏障的杂种是开放传粉群体或者开放传粉品种。
本文中,术语“胚珠”指雌性配子体,而术语“花粉”指雄性配子体。
本文中,术语“胚珠-特异的启动子”广义上指这样的核酸序列,其调节核酸序列选择性地在对胚珠形成和/或功能必需的植物细胞或组织中表达和/或使核酸序列的表达限制在植物的胚珠形成时期内。
本文中,术语“肽”指一类低分子量化合物,这些化合物在水解时产生两个或更多个氨基酸并且这些化合物形成蛋白质的组成部分。本文中,“寡肽”指含有少数(2到约20个)通过肽键连接的氨基酸残基的任何分子。
本文中,术语“肽键”指连接氨基酸之间COOH和NH2基团的酰胺键;肽键是具有一定的双键特征的平面键,因此不能自由旋转。
本文中,术语“表型”指细胞、细胞培养物、组织、完整生物(例如,完整植物或动物),或者一群完整生物(例如,一群完整植物或者动物)的可观察到的特征,该特征由细胞、细胞培养物、组织或生物的遗传组成(即,基因型)与环境的相互作用导致。
本文中,术语“植物”指全株植物和其后代、植物细胞、植物组织、植物愈伤组织、种子和花粉。可用于本发明方法中的植物的类别通常和适于接受实施转化技术的高等植物的类别一样宽,包括单子叶植物和双子叶植物。
本文中,术语“植物品系”按广义使用,包括,但不限于,通过组织培养技术从单个亲本植物无性繁殖的一群植物,或者一群近亲交配植物,它们由于从共同的亲本遗传下来而在遗传上非常相似。如果一种植物被说成“属于”一个特定品系,则该植物(a)是从该品系的材料再生的原代转化(T0)植物;(b)具有含有该品系的T0植物的系谱;或者(c)由于共同祖先(例如,通过近交或者自交)而在遗传上非常相似。在本上下文中,术语“系谱”(pedigree)指按照例如以下有性杂交而言的植物谱系,其中该有性杂交导致基因或者基因的组合在杂合(半合子的)或者纯合条件下对该植物赋予所希望的性状。
本文中,术语“植物器官”指植物的任何部分。植物器官的实例包括,但不限于叶、茎、根、块茎、种子、枝条、短柔毛、结节、叶腋、花、花粉、雄蕊、雌蕊、花瓣、花序梗、杆、柱头、花柱、苞片、果实、树干、心皮、萼片、花药、胚珠、花梗、针叶、球果、根茎、匍匐茎、芽、果皮、胚乳、胎座、浆果、雄蕊,和叶鞘。
本文中,“plantibodyTM”指植物、植物器官或者植物细胞产生的抗体,包括单个抗体链、单体、二体或分泌抗体或者抗体片段。
本文中,术语“植物转录单位”或者“PTU”指编码启动子序列、编码序列和3’末端序列的核酸序列。
本文中,术语“多肽”指通过肽键连接的氨基酸的线性聚合物。多肽可以短至2个氨基酸到实质上任何长度。
本文中,术语“启动子”指DNA序列或者一组DNA序列上的识别部位,其提供了基因的表达控制元件并且与RNA聚合酶特异结合由此启动该基因的RNA合成(转录)。
本文中,术语“重组体”指经历重组DNA转化的细胞、细胞培养物、组织或者生物体。最初的重组体被称为“R0”或者“R0”。自交R0产生转化的第一代,其被称为“R1”或者“R1”。
本文中,术语“分泌组分”或者“SC”指存在于嵌合免疫球蛋白链的N-末端的多肽,其可用于帮助所述链分泌到宿主体外。
本文中,术语“分泌性IgA抗体”和(“sIg”)指由10个蛋白质链组成的抗体,其中所述链由如下四种基因编码重链(“HC”)和轻链(“LC”),它们结合而形成单体IgA(“mIgA”)(见
图13A);连接链(“JC”),其连接两个单体的IgA单体形成二聚体IgA(“dIgA”)(见
图13B);和分泌组分(“SC”),其缠绕dIgA分子(见
图13C)。
本文中,术语“自花授粉的”或者“自花授粉”当用于植物时指一株植物上的一朵花的花粉应用(人工或天然地)于相同植物上相同或不同花的胚珠(柱头)。
本文中,术语“性传播感染”或者“STI”指一类疾病和感染,它们通过性交或者性接触从一个人传递到下一个人;也称作STDs或者性传播疾病。
本文中,术语“信号序列”指与多肽连接的氨基酸序列(信号肽),其使该多肽结合到内质网并且对于蛋白质分泌是必需的。
本文中,术语“综合品种”(synthetic variety)当指植物时表示通过将特定的一组克隆或者种子繁殖品系杂交而产生的一组后代。综合品种可以含有从异花受精、自花受精、同胞受精所得的种子的混合物。
本文中,术语“尾片”指重链的一部分,其含有通常被岩藻糖基化的Asn残基。例如,在IgA HX8抗体中,尾片含有SEQ ID NO1的氨基酸残基476-497。Asn残基在HX8抗体中的484位。
本文中,术语“转录物”指转录过程的产物。
本文中,术语“转化”指将核酸(即,核苷酸聚合物)转移到细胞中。本文中,术语“遗传转化”指将DNA,特别是重组DNA转移和掺入到细胞中。
本文中,术语“转化体”指已经经历转化的细胞、组织或生物。最初的转化体被称为“T0”或者“T0”。自交T0产生转化的第一代,其被称为“T1”或者“T1”。
本文中,术语“转基因”指核酸,其以确保功能的方式插入生物体、宿主细胞或载体中。
本文中,术语“转基因的”指已经通过多种转化方法之一接受了外来或者经修饰的基因的细胞、细胞培养物、组织、生物(例如,植物或动物)和它们的子代,其中该外来或者经修饰的基因来自与接受该外来或者经修饰的基因的细胞、细胞培养物、组织、或生物相同或者不同的物种。
本文中,术语“非翻译区”或者“UTR”指mRNA分子中不编码蛋白质的任一部分(例如,在真核生物中多聚(A)尾)。
本文中,术语“载体”在广义上指编码外源核酸的任何质粒或者病毒。该术语也应理解为包括促进核酸向病毒体或者细胞转移的非质粒和非病毒化合物,如聚赖氨酸化合物等等。所述载体可以是适于作为递送运载工具递送核酸或者其突变体至细胞的病毒载体,或者该载体可以是适于相同的目的的非病毒载体。用于将DNA递送到细胞和组织的病毒和非病毒载体的实例是本领域中众所周知的并且在例如,Ma等人,Proc.Natl.Acad.Sci.U.S.A.9412744-12746(1997)中描述。病毒载体的实例包括,但不限于,重组痘苗病毒、重组腺病毒、重组逆转录病毒、重组腺-相关病毒、重组禽痘病毒,等等。见,例如,Cranage等人,EMBO J.53057-3063(1986);1994年8月18日出版的国际专利申请号WO94/17810;和1994年10月27日出版的国际专利申请号WO94/23744。非病毒载体的实例包括,但不限于,DNA的聚胺衍生物、脂质体等等。
术语“病毒”指在动物中导致各种疾病,如麻疹、腮腺炎等等或者在植物中导致各种疾病,如花叶病的超显微或者亚显微感染物;病毒仅能依赖于活细胞而繁殖并且被认为是活的生物和核酸的包装物(有时涉及复杂蛋白质、酶,等等)。
本发明包括含有无岩藻糖基化的单体抗体的植物细胞、植物愈伤组织、小植株、全株植物或者种子。在一个实施方案中,该植物是玉米植物。在另一实施方案中,该抗体位于种子的胚乳中。在不同的实施方案中,该抗体是人抗体。在优选实施方案中,该抗体含有包含SEQ ID NO6的氨基酸序列的重链。在另一优选实施方案中,该抗体含有包含SEQ ID NO14的氨基酸序列的轻链。在高度优选的实施方案中,重链缺少尾片。在另一优选实施方案中,该抗体是IgA抗体。在高度优选的实施方案中,该抗体是抗-单纯疱疹病毒抗体。
本发明的另一方面还包括经分离的核酸分子,其含有编码SEQ ID NO2或SEQ ID NO6所编码的氨基酸序列的核酸序列;经分离的核酸分子,其含有编码SEQ ID NO10或SEQ ID NO14所编码的氨基酸序列的核酸序列;含有SEQ ID NO1或SEQ ID NO5的经分离的核酸分子;和含有SEQ ID NO9或SEQ ID NO13的经分离的核酸分子。
本发明的另一方面包括含有SEQ ID NO1或SEQ ID NO5的分离的载体或者质粒;和含有SEQ ID NO9或SEQ ID NO13的分离的载体或者质粒。
本发明还包括抗体组合物,其含有选自
图12中的结构的两种或多种不同的聚糖结构,其中至少一种来自
图12的所选的聚糖结构无岩藻糖基化。
本发明还包括含有抗体组合物的植物材料,所述组合物含有选自
图12中的结构的两种或多种不同的聚糖结构,其中至少一种来自
图12的所选聚糖结构无岩藻糖基化。在一个实施方案中,该组合物从植物材料分离。在另一实施方案中,植物材料来自玉米。
本发明还包括含有至少一种具有
图12中所列结构1的结构的聚糖的单体抗体组合物;含有至少一种具有
图12中所列结构2的结构的聚糖的单体抗体组合物;和含有至少一种具有
图16中所列结构1的结构的聚糖和至少一种具有
图16中所列结构2的结构的聚糖的单体抗体组合物。
本发明还包括含有单体抗体组合物的植物愈伤组织、小植株、全株植物或者种子,其中该单体抗体组合物是含有至少一种具有
图12中所列结构1的结构的聚糖的单体抗体组合物;含有至少一种具有
图12中所列结构2的结构的聚糖的单体抗体组合物;或者含有至少一种具有
图16中所列结构1的结构的聚糖和至少一种具有
图16中所列结构2的结构的聚糖的单体抗体组合物。
本发明还包括通过如下方法产生的经分离的无岩藻糖基化单体抗-单纯疱疹病毒抗体,所述方法包括(i)向植物细胞导入具有SEQ ID NO1或SEQ ID NO5和SEQ ID NO9或SEQ ID NO13的核酸,其中每一核酸都与启动子有效连接;(ii)培养该植物细胞以表达所导入的核酸;和(iii)分离该植物细胞产生的无岩藻糖基化单体抗-单纯疱疹病毒抗体。本发明还包括产生分离的无岩藻糖基化单体抗-单纯疱疹病毒抗体的方法,该方法包括(i)向植物细胞导入具有SEQ ID NO1或SEQ ID NO5和SEQ ID NO9或SEQ ID NO13的核酸,其中每一核酸都与启动子有效连接;(ii)培养该植物细胞以表达所导入的核酸;和(iii)分离该植物细胞产生的无岩藻糖基化单体抗-单纯疱疹病毒抗体。
本发明的优选实施方案包括含有选自SEQ ID NO15(pDAB635)、SEQ ID NO16(pDAB16)、SEQ ID NO17(pDAB637)、SEQ ID NO84(pDAB3014)和SEQ ID NO85(pDAB8505)的核酸序列的核酸分子。
本发明还涉及产生表达无岩藻糖基化的抗体的经转化的植物细胞的方法,该方法包括向植物细胞导入含有编码免疫球蛋白重链和免疫球蛋白轻链的核酸序列的单一载体,并培养所转化的植物细胞以产生表达无岩藻糖基化的抗体的植物。在一个实施方案中,从经转化的植物细胞再生经转化的植物。在优选实施方案中,载体是pDAB8505。
II.在植物中产生IgA的背景A.适于应用的IgA的实例本发明的方法中可以使用任何IgA抗体。IgA是在人血浆中发现的免疫球蛋白。其是浆粘液分泌物中的主要免疫球蛋白并且与外部身体表面抵抗微生物侵袭的防御作用有关。
免疫球蛋白A(IgA)是众所周知的并且已被表征,包括它们的核酸和氨基酸序列。可用于本发明的组合物和方法中的IgA免疫球蛋白的实例包括但不限于下面的识别溶组织内阿米巴(Entamoeba histolytiea)抗原的人分泌性IgA抗体(Carrero等人,Parasitol Res.86(4)330-4(2000));转化生长因子-β-可诱导的小鼠种系Igα恒定区基因(Zhang等人,J Biol Chem.275(22)16979-85(2000));实体器官移植物受者中针对人巨细胞病毒的免疫球蛋白A(IgA)和IgM抗体(Eing等人,Clin Diagn Lab Immunol.6(4)621-3(1999));缺血后肾排出的分泌性IgA(Rice等人,Am J Physiol.276(5Pt 2)F666-73(1999));Calu-3气道上皮细胞释放的分泌性免疫球蛋白A(Loman等人,Immunology.96(4)537-43(1999));HBsAg慢性携带者的血清中特异IgA(Elsana等人,J Hum Virol.1(1)52-7(1997));抗鼠弓形体(Toxoplasma gondii)IgA抗体(Ronday等人,Am J Ophthalmol.127(3)294-300(1999));来自人奶的分泌性免疫球蛋白A(Kit等人,Biochemistry(Mosc).64(1)40-6(1999));活动性结核病的诊断中的抗-Kp 90 IgA抗体(Arikan等人,Chest.114(5)1253-7(1998));从有袋动物鼠形短尾负鼠(Monodelphis domestica)克隆的IgA(Aveskogh等人,EurJ Immunol.28(9)2738-50(1998));腹膜B-1细胞中种系和全长IgA RNA转录物(deWaard等人,Dev Immunol.6(1-2)81-7(1998));和来自有袋动物刷尾负鼠(Trichosurus vulpecula)(通常为brushtail possum)的免疫球蛋白A重链的恒定区(Cα)(Belov等人,Immunol Lett.60(2-3)165-70(1998).Erratum inImmunol Lett 63(3)175-6(1998))。
B.单纯疱疹病毒(HSV)单纯疱疹指1型(HSV1)和2型(HSV2)疱疹病毒导致的各种感染。单纯疱疹病毒亚型1和2(HSV-1,HSV-2)是人类遇到的最通常的感染物中的疱疹病毒。1型感染最通常的标记是在唇的唇红缘上或者外鼻孔处长出一组或多组小疱,在生殖器上也发生损伤。2型的特征是生殖器上的这些损伤,而在唇的唇红缘上或者外鼻孔处常常发生损伤。所述病毒常潜伏并且可以数年不表达。
这些病毒导致多种疾病,这些疾病从相对无关紧要的令人讨厌的感染,如复发型单纯疱疹唇疱疹,到严重的和威胁生命的疾病,如较大儿童和成年人的单纯疱疹脑炎(HSE),或者新生儿的弥散性感染。疱疹感染的临床结果取决于早期诊断和抗病毒治疗的快速启动。然而,尽管有一些成功的治疗,但是真皮和表皮病变复发,并且新生儿的HSV感染和脑的感染与高发病率和死亡率相关。非常需要改进的治疗。
单纯疱疹病毒-1的示例性株系包括,但不限于HSV-1716、HSV-3410、HSV-3616、HSV-R3616、HSV-R47、HSV-G207、HSV-7020、HSV-NVR10、HSV-G92A、HSV-3616-IL-4、和HSV-hrR3。单纯疱疹病毒-2的示例性株系包括,但不限于株系2701、株系2616、株系2604。美国专利号6,156,313提供了靶定并中和1型和2型单纯疱疹病毒的抗体的重链可变区序列的氨基酸残基序列(’313专利的SEQ ID NO2)以及编码重链CDR3氨基酸序列的核酸序列(’313专利的SEQ ID NO1)。
C.抗-HSV抗体的制剂本发明的抗-HSV抗体在植物中产生,至少经部分纯化,并且可以制备成局部应用制剂。本发明的抗-HSV抗体可用于治疗陆生哺乳动物的皮肤,所述哺乳动物包括例如人、驯养的宠物、牲畜和其他农场动物。本发明的抗-HSV抗体的优选用途是防止HSV的传播。
对于这种治疗,可以将本发明的化合物配制以用于多种施用途径,包括全身性和局部或者局域施用。技术和制剂通常可以在Remington′sPharmaceutical Sciences,Meade Publishing Co.,Easton,PA中发现,此处将完整引用该文献。对于全身性施用,优选注射,包括肌内、静脉内、腹膜内,和皮下。对于注射,本发明的化合物可以在液体溶液,优选在生理学相容的缓冲剂如Hank氏溶液中配制(Hank氏溶液磷酸钾0.44mM,氯化钾5.37mM,磷酸氢二钠0.34mM 136.89,氯化钠mM,D-葡萄糖5.55mM。该试剂备用。经稀释的Hank氏盐溶液的pH为6.7±0.2。可向该溶液加入碳酸氢钠(0.35g/L),可以用1N HCl或者1N NaOH调节该溶液的pH)。此外,该化合物可以配制为固体形式并且在临使用前再溶解或者悬浮。还包括冻干的形式。
在本发明的优选实践中,本发明的抗-HSV抗体可以作为药学上可接受的局部施用制剂中的活性成分施用。局部制剂(包括用于透皮药物释放的那些局部制剂)是本领域技术人员众所周知的并且适于在本发明中应用于皮肤。适于局部或者鼻内应用的制剂包括含有活性成分和多种载体和赋形剂的软膏剂、滴剂、霜剂、溶液剂、酊剂、洗剂、糊剂、凝胶剂、喷雾剂、气溶胶和油。这些制剂可以含有或者不含有赋形剂或载体,尽管赋形剂或载体的使用是优选的。用于这些制剂的适宜的载体包括石油凝胶、羊毛脂、聚乙二醇、醇和它们的组合。优选的赋形剂是非-脂质赋形剂,特别是水-可混溶的液体或者液体的混合物。实例为甲醇、乙醇、异丙醇、乙二醇、丙二醇,和丁二醇,和这些化合物的两种或多种的混合物。活性成分通常以0.1到15%w/w的浓度存在于这些制剂中。
可以通过任何适宜的方法制备诸如此处讨论的制剂,通常通过将活性化合物与液体或者细分的固体载体或者两者以所需要的比例均匀并紧密混合,然后,如果需要,将所得混合物成型成所希望的性状进行制备。
例如,通过将含有活性成分的粉末或颗粒和一种或多种任选成分,如粘合剂、润滑剂、惰性稀释剂,或者表面活性分散剂压制成紧密混合物或者通过将粉状活性成分和惰性液体稀释剂的紧密混合物成型,可以制备片剂。
局部半固体软膏制剂通常含有载体如药用霜剂基质中的浓度为约1到20%,例如5到10%的活性成分,但是该浓度可以在该范围外变动。任何给定情况中的最佳量将对于本领域技术人员是显而易见的或者能够通过常规实验确定。
含有本发明的抗-HSV抗体的局部制剂可以被配制成洗剂、溶液剂、凝胶剂、霜剂、润滑霜剂、油膏剂、喷雾剂或者允许局部应用的任何其他形式。该制剂可以还含有一种或多种促进制剂在受影响的区域扩散但是是生物学上无活性的药剂。这些药剂的实例为表面活性剂、保湿剂、湿润剂、乳化剂或者抛射剂。
本发明的抗-HSV抗体还可以与其他分子、分子结构或者化合物的混合物混合、包囊化、缀合或者结合,例如,形成脂质体、受体靶定分子、口服、直肠、局部制剂或者其他制剂,以帮助摄入、分布和/或吸收。教导这种摄入、分布和/或吸收辅助制剂的制备的代表性美国专利包括,但不限于,美国专利号5,108,921、5,354,844、5,416,016、5,459,127、5,521,291、5,543,158、5,547,932、5,583,020、5,591,721、4,426,330、4,534,899、5,013,556、5,108,921、5,213,804、5,227,170、5,264,221、5,356,633、5,395,619、5,416,016、5,417,978、5,462,854、5,469,854、5,512,295、5,527,528、5,534,259、5,543,152、5,556,948、5,580,575、和5,595,756,这些专利的每一篇都在这里完整引用作为参考。
施用的最佳方法和频率将对于本领域技术人员是显而易见的或者能够通过常规实验确定。通过在受侵袭的部位,或者希望实现所希望的效果的部位局部应用一薄层可以在多数情况下实现有效结果。根据所处理的病症、其阶段或者程度,和是否为了治疗或者预防原因而应用,使用每2或3天应用一次至每天应用4或更多次的施用速率可以实现有效结果。
如果希望,组合物可以存在于包装或者分配装置中,其中可以含有一个或多个含有活性成分的单位剂型。该包装可以例如含有金属或者塑料箔,如.泡罩包装。该包装或者分配装置可以附带使用说明书。
D.抗-HSV抗体的SEQ ID Nos总结表
E.从植物分离的抗-HSV重链、轻链和单体IgA抗体的氨基酸序列本发明提供了抗-HSV抗体的重链、轻链和单体IgA的多肽,其中这些多肽从植物分离。
本文中,“蛋白质”或者“多肽”部分地指具有SEQ ID NOs2、4、6、8、10、12、和14中描述的氨基酸序列的氨基酸。该术语还指具有与SEQID NOs2、4、6、8、10、12、和14中具体提供的氨基酸序列稍微不同的氨基酸序列的天然等位变体和蛋白质。等位变体尽管具有与此处所述的氨基酸序列稍微不同的氨基酸序列,但是仍然具有与这些蛋白质相同或者相似的生物学功能。
本文中,与具有SEQ ID NOs2、4、6、8、10、12、和14的氨基酸序列相关的蛋白质家族指从人及其它生物分离的蛋白质。
本发明的抗-HSV抗体多肽优选为分离的形式。本文中,当用物理的、机械的或者化学方法将蛋白质从通常与该蛋白质相关的细胞组分中分离出来时,说该多肽是分离的。技术人员可以容易地使用标准纯化方法得到分离的蛋白质。
本发明的蛋白质还包括SEQ ID NOs2、4、6、8、10、12、和14的插入、缺失或者保守氨基酸置换变体。本文中,保守变体指氨基酸序列中不会不利地影响该蛋白质的生物学功能的改变。当经改变的序列防止或者破坏与蛋白质相关的生物学功能时,即认为置换、插入或者缺失不利地影响该蛋白质。例如,在某些情况中,可以改变蛋白质的总体电荷、结构或者疏水/亲水性质而不会不利地影响生物学活性。因此,例如,可以改变氨基酸序列以使得该肽更疏水或者亲水,而不会不利地影响蛋白质的生物学活性。
通常,等位变体、保守置换变体、和蛋白质家族的成员的氨基酸序列与SEQ ID NOs2、4、6、8、10、12、和14中所示序列具有至少约50%、60%、70%、或75%氨基酸序列同一性;更优选地,至少约80%;甚至更优选至少约90-95%;最优选至少约99或99.5%序列同一性。关于这些序列的同一性或者同源性在本文中被定义为候选序列中与SEQ ID NOs2、4、6、8、10、12、和14相同的氨基酸残基的百分数,该百分数是通过比对序列和导入缺口(如果需要)以实现最大百分数同源性后获得的,此时不将任何保守置换考虑为序列同一性的部分。融合蛋白、或者肽序列的N-末端、C-末端或者内部延伸、缺失或者插入将不应理解为影响同源性。
从而,本发明的蛋白质包括具有SEQ ID NOs2、4、6、8、10、12、和14中公开的氨基酸序列的分子;具有这些蛋白质的至少约3、4、5、6、10、15、20、25、30、35或更多个氨基酸残基的连续序列片段;氨基酸序列变体,其中一个或多个氨基酸残基已经被插入所公开的编码序列的N-或C-末端或者内部;和已经发生至少一个残基的置换的所公开序列的氨基酸序列变体,或者它们的如上定义的片段。这些片段,也称作肽或者多肽,可以含有抗原区,蛋白质的功能区(被鉴定为相应于已知蛋白质域的氨基酸序列区域),以及具有明显的亲水性的区域。这些区域都可以通过使用通常可得到的蛋白质序列分析软件,如Mac Vector(Oxford Molecular)容易地鉴定。可用于本发明的实践中的其他蛋白质分析软件是本领域中公知的。
预期的变体还包括含有通过例如同源重组、定点诱变或者PCR诱变产生的预定突变的那些变体,和其他动物物种的相应蛋白质(所述物种包括但不限于兔、小鼠、大鼠、猪、牛、绵羊、马和非人-灵长类物种),以及HSV-相关蛋白质家族的等位变体或者其他天然发生的变体;和衍生物,其中蛋白质通过用非天然氨基酸的部分(例如,可检测的部分,如酶或者放射性同位素)以取代方式、化学的、酶的或其它适宜的方式进行共价修饰。
本发明还提供了含有本发明的蛋白质或多肽和稀释剂的组合物。适宜的稀释剂可以是水性或非水性溶剂或者它们的组合,并且可以含有有助于该蛋白质或者多肽的稳定性、溶解性、活性和/或保存的额外组分,例如,水可溶的盐或者甘油。
E.抗-HSV重链、轻链和单体IgA抗体的核酸序列本发明利用编码抗-HSV抗体的重链(SEQID NOs.1和5)和轻链(SEQID NOs.9和13)和此处描述的相关多肽的核酸分子,该核酸分子优选为分离的形式。
本文中,“核酸”被定义为RNA或者DNA,其编码此处定义的蛋白质或肽,与编码这些肽的核酸序列互补,与SEQ ID NOs1、3、5、7、9、11和13的核酸杂交并在适宜的严格条件下保持与其稳定杂交,编码与SEQID NOs1、3、5、7、9、11和13的肽序列具有至少约50%、60%、70%或75%,优选至少约80%,更优选至少约85%,最优选至少约90%、95%、98%、99%、99.5%或以上的同一性的多肽,或者显示出与SEQ ID NOs1、3、5、7、9、11和13的可读框有至少约50%、60%、70%或75%,优选至少约80%,更优选至少约85%,甚至更优选至少约90%、95%、98%、99%、99.5%或以上的核苷酸序列同一性。
本发明还包括经分离的核酸分子,其与SEQ ID NOs1、3、5、7、9、11和13的互补序列特异杂交,尤其是与可读框特异杂交。与SEQ ID NOs1、3、5、7、9、11和13的互补序列特异杂交的这些分子通常在严格杂交条件下杂交,这些条件在下面描述。
特别考虑基因组DNA、cDNA、mRNA和反义分子,以及基于可选主链或者包括可选碱基的核酸,而不论它们是来自天然来源的或者是合成的。
通过BLAST(基本局部比对搜索工具)分析,使用程序blastp、blastn、blastx、tblastn和tblastx所用的算法,确定核苷酸或者氨基酸序列水平上的同源性或者同一性。见,例如,Altschul等人,Nucleic Acids Res.253389-3402(1997)和Karlin等人,Proc.Natl.Acad.Sci.USA 872264-2268(1990),引用这两篇文献的全文作为参考,它们适用于序列相似性搜索。BLAST程序所用的方法首先考虑查询序列和数据库序列之间的相似片段(有和没有缺口),然后评估所鉴定的所有匹配的统计学显著性,最后仅总结满足预先选择的显著性阈值的那些匹配。关于序列数据库的相似性搜索的基本问题的讨论,见,例如,Altschul等人,Nat.Genet.6119-129(1994),将其完整引用作为参考。用于直方图、描述、比对、期望值(即,用于报导相对于数据库序列的匹配的统计学显著性阈值)、截断值、矩阵和过滤器(filter)(低复杂性)的检索参数都为默认设置。Blastp、blastx、tblastn、和tblastx的默认得分矩阵是BLOSUM62矩阵(见,例如,Henikoff等人,Proc.Natl.Acad.Sci.USA 8910915-10919(1992),将其完整并入作为参考),BLOSUM62矩阵是对于长度超过85个核苷酸或者氨基酸的查询序列所推荐的矩阵。
对于blastn,得分矩阵由M(即,一对匹配残基的奖励得分)与N(即,错配残基的罚分)的比值设定,其中M和N的默认值分别是5和-4。如下调节四种blastn参数Q=10(缺口产生罚分);R=10(缺口延伸罚分);wink=1(沿着查询序列,每第winkth个位置产生字命中);和gapw=16(设定窗口宽度,在该窗口宽度内产生带缺口的比对)。等价Blastp参数设置为Q=9;R=2;wink=1;和gapw=32。序列之间的Bestfit比较(可以在GCG包版本10.0中得到)使用DNA参数GAP=50(缺口产生罚分)和LEN=3(缺口延伸罚分)并且蛋白质比较中的等价设置为GAP=8和LEN=2。
“严格条件”为(1)用低离子强度和高温进行洗涤,例如,0.015MNaCl/0.0015 M柠檬酸钠/0.1%SDS(十二烷基硫酸钠),50℃,或者(2)在杂交期间使用变性剂如甲酰胺,例如,50%(体积/体积)甲酰胺与0.1%牛血清白蛋白/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/50mM磷酸钠缓冲液,pH6.5与750mM NaCl,75mM柠檬酸钠,42℃。另一实例是在50%甲酰胺,5x SSC溶液(0.75M NaCl,0.075M柠檬酸钠),50mM磷酸钠(pH6.8),0.1%焦磷酸钠,5x Denhardt溶液(50X Denhards试剂1%(w/v)Ficoll400,1%(w/V)聚乙烯吡咯烷酮,1%(w/v)牛血清白蛋白(Sigma,FractionV)),超声处理的鲑精DNA(50μg/ml),0.1%SDS,和10%硫酸葡聚糖,42℃下杂交,42℃下在0.2×SSC溶液和0.1%SDS中洗涤。技术人员可容易地确定并适当改变严格条件以得到清晰并且可以检测的杂交信号。优选的分子是在上面的条件下与SEQ ID NOs1、3、5、7、9、11和13的互补序列杂交并且编码功能或者全长蛋白质的分子。甚至更优选的杂交分子是在上面的条件下与SEQ ID NOs1、3、5、7、9、11和13的可读框的互补链杂交的那些分子。
本文中,当核酸分子基本上与编码其他多肽的污染性核酸分子分离时,说该核酸分子是“分离的”。
本发明还利用所公开的核酸分子的片段。本文中,核酸分子的片段指编码或者非-编码序列的小部分。由预期的用途确定该片段的大小。如果该片段将用作核酸探针或者PCR引物,那么选择片段长度以在探测/引发期间得到相对小数目的假阳性。如果选择片段以编码所述蛋白质的活性部分,那么该片段将足够大以编码该蛋白质的功能区。例如,可以制备编码相应于所预测的抗原区的肽的片段。例如,本发明利用编码(美国专利号6,156,313的SEQ ID NO1所提供的)克隆FabHSV8的重链CDR3区氨基酸序列的片段(本文中示为SEQ ID NO18)。此外,本发明利用如下人单克隆抗体,其能中和1型和2型HSV,结合糖蛋白D上存在的表位,具有ATCC69522产生的Fab片段的结合特异性,具有含美国专利号6,156,313提供的SEQ ID NO2的CDR3的重链(此处为SEQ ID NO19)。
用作聚合酶链式反应(PCR)的特异引物或者探针或者用于合成编码本发明蛋白质的基因序列的本发明核酸分子的片段(即,合成的寡核苷酸)可以通过化学技术,例如,Matteucci等人(J.Am.Chem.Soc.1033185-3191(1981)的亚磷酰胺方法或者使用自动化合成方法容易地合成。此外,通过众所周知的方法,如合成一组寡核苷酸--它们分别限定基因的多个不同模块片段,然后连接寡核苷酸以构建完整的经修饰的基因,可以容易的制备更大的DNA片段。
可以进一步修饰本发明的核酸分子以便含有用于诊断和探测目的的可检测标记。多种这样的标记是本领域中公知的并且可容易地用于此处描述的编码分子。适宜的标记包括,但不限于,生物素、放射标记或者荧光标记的核苷酸,等等。技术人员可以容易地使用任一种这样的标记以得到本发明的核酸分子的经标记的变体。
II.在植物中产生IgG的背景A.可利用的适宜的IgG的实例本发明的方法中可以使用任何IgG抗体。IgG是人血浆和其他内部体液中的主要免疫球蛋白。其还是最通常见到的骨髓瘤蛋白质。来自人蛋白质的一种称作Eu的骨髓瘤蛋白质是被完全测序的第一个免疫球蛋白(Edelman等人,Proc.Natl.Acad.Sci.USA 6378(1969))。
免疫球蛋白G(IgG)蛋白质是众所周知的并且已被表征,包括它们的核酸和氨基酸序列。可用于本发明的组合物和方法中的IgG免疫球蛋白的实例包括但不限于下面的与血小板和内皮细胞的整联蛋白β3上的不同表位反应的人抗体(Jallu等人,Eur J Biochem.222(3)743-51(1994));高亲和性重组人IgG1抗-RhD抗体(Miescher等人,Br J Haematol.111(1)157-66(2000));针对结核分枝杆菌(M.tuberculosis)的EF-Tu的滑液IgG(Adachi等人,J Dent Res.79(10)1752-7(2000));结合到HIV-1感染者的内源逆转录病毒抗原(Lawoko等人,J Med Virol.62(4)435-44(2000));1型人免疫缺陷病毒的免疫球蛋白G抗体(Hashinaka等人,ClinDiagn Lab Immunol.(6)967-76(2000));重组人CCR5-特异抗体(Steinberger等人,J Biol Chem.275(46)36073-8(2000));编码南极硬骨鱼Trematomus berncchii的免疫球蛋白重链的cDNA序列(Coscia等人,Fish Shellfish Immunol.10(4)343-57(2000));转染到淋巴样细胞中的免疫球蛋白重链基因的表达和调节(Neuberger,EMBO J.2(8)1373-8(1983));参与Androctonus australis Hector蝎子毒液的中和的鼠单克隆IgG(Devaux等人,Eur J Biochem.268(3)694-702(2001));人源化L243IgG1的截断形式(Lund等人,Eur J Biochem.267(24)7246-57.(2000));毕赤巴斯德酵母(Pichia pastoris)中单链Fv-Fc融合物(Powers等人,JImmunol Methods.1;251(1-2)123-35(2001));CRMP-5特异的免疫球蛋白G(IgG)自身抗体(Yu等人,Ann Neurol.49(2)146-54(2001));马来布鲁线虫(Brugia malayi)感染的恒河猴中对Wolbachia表面蛋白质特异的IgG抗体(Punkosdy等人,J Infect Dis.184(3)385-9.Epub 2001 Jul 03(2001));人IgG单克隆抗-α(IIb)β(3)-结合片段(Jacobin等人,J.Immunol.168(4),2035-2045(2002));系统性硬化症免疫球蛋白G自身抗体(Lunardi等人,Nat Med.6(10)1183-6(2000));对亮氨酸-33(P1A1,HPA-la)特异的人单克隆抗体(Griffin等人,Blood.15;86(12)4430-6(1995));人源化抗-CD18鼠免疫球蛋白G(Ipp等人,Arch BiochemBiophys.308(2)387-99(1994);和针对GPIIbα(300-312)的抗体(Taylor等人,Proc Soc Exp Biol Med.205(1)35-43(1994))。
B.整联蛋白整联蛋白受体(也称作整联蛋白)是介导多种生理背景中细胞粘着细胞外基质、细胞识别和跨膜应答的一类分子(Clarke等人,Science 2851028-1032(1995))。已经证明整联蛋白αVβ3和αVβ5与新血管生长密切相关。这些整联蛋白的每一种结合细胞外基质中的特定分子αVβ3结合玻连蛋白加上其他细胞外基质蛋白质,包括血纤蛋白原;αVβ5是玻连蛋白受体。抗-整联蛋白αVβ3/αVβ5抗体的主要医学靶标是肿瘤的血管募集(“肿瘤血管生成”)。在血管生成期间,血管内皮细胞离开原来的血管并形成新的小管,其将发育成毛细管。当该过程正常前进时,结合血管内皮细胞中表达的αVβ5的玻连蛋白诱导αVβ3表达并通过信号级联和相互作用促进血管生成。结合内皮αVβ3的玻连蛋白也抑制蛋白激酶A。当抗-αVβ3阻断了与玻连蛋白的结合时,蛋白激酶A干扰细胞从而血管发育、肿瘤细胞迁移和转移被抑制。在这些被抗体-阻断的血管生成系统细胞中将发生细胞死亡。
针对αVβ3产生的抗体阻断由碱性成纤维细胞生长因子(bFGF)诱导的血管生成,而对αVβ5特异的抗体抑制血管内皮生长因子(VEGF)诱导的血管生成(Eliceiri,等人,J.Clin.Invest.1031227-1230(1999);Friedlander等人,Science 2701500-1502(1995))。除了上面讨论的那些,可以用于本发明的组合物和方法中的整联蛋白-相关免疫球蛋白的其他实例包括但不限于下面的针对整联蛋白αIIbβ3(糖蛋白IIb-IHa)的配体-占据的构象异构体的单克隆抗体(Frelinger等人,J Biol Chem.266(26)17106-11(1991));对血小板整联蛋白IIb重链特异的人自身抗体2E7(Kunicki等人,J Autoimmun.(3)433-46(1991));针对白细胞整联蛋白的CD18组分的鼠单克隆抗体(Daugherty等人,Nucleic Acids Res.19(9)2471-6(1991));抗整联蛋白(α5β1)抗体(Fogerty等人,J Cell Biol.111(2)699-708(1990));针对血小板GPIIb的单克隆抗体(Golino等人,JBiol Chem.265(16)9575-81(1990));对人血小板糖蛋白IIb(整联蛋白αIIb)特异的人单克隆自身抗体重链(Kunicki等人,Hum AntibodiesHybridomas1(2)83-95(1990));对人血小板整联蛋白gpHb/IIIa特异的人源化抗体(Co等人,J Immunol.15;152(6)2968-76(1994));抗-整联蛋白GPIIb-IIIa抗体中生物活性Arg-Gly-Asp构象体(Prammer等人,Receptor.4(2)93-108(1994));人源化抗-β1整联蛋白链mAb(Poul等人,Mol Immunol.32(2)101-16(1995));白细胞整联蛋白淋巴细胞功能相关的抗原1(Holness等人,J Biol Chem.270(2)877-84(1995));作为整联蛋白的粘着配体的合成抗体(Smith等人,J Biol Chem.269(52)32788-95(1994));血小板整联蛋白αIIbβ3的单克隆抗体(Yano等人,J Biochem(Tokyo).116(4)778-86(1994));对整联蛋白αIIbβ特异的重组鼠Fab片段(Kunicki等人,J Biol Chem.270(28)16660-5(1995));IgG抗-磷脂抗体与血小板糖蛋白IIIa(Tokita等人,Thromb Haemost.75(1)168-74(1996));和特异结合糖蛋白IIb-IIIa上血小板HPA-1a同种抗原的人单克隆抗体Fab片段(Proulx等人,Vox Sang.72(1)52-60(1997))。
可用于本发明的组合物和方法中的抗-双整联蛋白抗体的实例包括但不限于美国专利申请号2003/0040044和国际公开的专利申请号WO02/12501中公开的那些抗体。还见ATCC保藏号AX472604、AX472605、AX472606、AX472607、AX472608、和AX47209。
III.植物中产生IgA和IgG的一般背景A.含有核酸分子的重组DNA(rDNA)分子本发明还提供了含有编码序列的重组DNA分子(rDNAs)。本文中,rDNA分子是已接受分子操作的DNA分子。产生rDNA分子的方法是本领域中众所周知的,例如,见Sambrook等人,Molecular Cloning-ALaboratory Manual,第三版,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,2001。在优选的rDNA分子中,编码DNA序列与表达控制序列和/或载体序列有效连接。
如本领域中众所周知的,与本发明的蛋白质家族编码序列有效连接的载体和/或表达控制序列的选择直接取决于所希望的功能性质,例如,蛋白质表达,和所要转化的宿主细胞。本发明所考虑的载体至少能够指导rDNA分子中所包括的结构基因进行复制或者插入宿主染色体中,和优选地表达。
用于调节有效连接的蛋白质编码序列的表达的表达控制元件是本领域中公知的并且包括,但不限于诱导型启动子、组成性启动子、分泌信号,和其他调节元件。优选地,诱导型启动子容易受到控制,如对宿主细胞的培养基中的营养物产生应答。
B.使用rDNA分子产生重组蛋白质本发明还提供了使用此处描述的核酸分子产生本发明的蛋白质的方法。概括地,重组形式的蛋白质的产生通常包括下面的步骤首先,得到编码本发明的蛋白质的核酸分子,如含有、组成基本为,或者组成为SEQ ID NO1或SEQ ID NO9的核酸分子。
如果编码序列不被内含子中断,如这些可读框一样,那么该编码序列直接适于在任何宿主中表达。
然后优选将核酸分子与如上描述的适宜的控制序列有效连接,以形成含有蛋白质可读框的表达单位。用该表达单位转化适宜的宿主并在允许产生重组蛋白质的条件下培养所转化的宿主。任选地,从培养基或者细胞分离重组蛋白质;在可以忍受一些杂质的情况下,该蛋白质的回收和纯化可能是不必要的。
前面步骤的每一步都可以以多种方法进行。例如,所希望的编码序列可以从基因组片段得到并且直接用于适宜的宿主中。使用如上面提出的适宜的复制子和控制序列可以构建在多种宿主中有效的表达载体。控制序列、表达载体、和转化方法取决于用于表达基因的宿主细胞的类型并且在前面已详细讨论。适宜的限制位点如果不能正常得到,可以添加编码序列的末端以便提供可切出的基因以便插入这些载体中。技术人员可容易的改造本领域中公知的任何宿主/表达系统以便适用于本发明的核酸分子以产生重组蛋白质。
C.启动子诱导型启动子是这样一种启动子,其中RNA聚合酶结合和启始的速度受到外部刺激的调节。这些刺激包括光、热、无氧胁迫、营养条件的改变、代谢物的存在或不存在、配体的存在、微生物侵袭、创伤,等等。
病毒启动子是具有与在病毒的5’末端发现的启动子基本上相似的DNA序列的启动子。例如,典型的病毒启动子在编码Huang等人,Cell27245(1981)描述的MMTV的p2I蛋白质的基因的5’末端发现。
合成启动子是化学合成而不是生物来源的启动子。通常合成启动子掺入序列改变,这些改变可以优化RNA聚合酶启动的效率。
组成性启动子是在整个生物,如植物中启动基因产物表达的启动子。组成性启动子的实例包括花椰菜花叶病毒35S和19S启动子(例如,Poszkowski等人,EMBO J.32719(1989);Odell等人,Nature 313810(1985));和玉米泛素-1启动子(例如,美国专利号5,510,474、5,614,399、6,020,190和6,054,574)。
时间上受调节的启动子是这样一种启动子,其中RNA聚合酶结合和启动的速度在发育期间的特定时间受到调节。时间上受调节的启动子的实例在例如,Chua等人,Science,244174-181(1989)中给出。
空间上受调节的启动子是这样一种启动子,其中RNA聚合酶结合和启动的速度在生物的特定结构,如叶子、茎、种子或者根中受到调节。空间上受调节的启动子的实例在Chua等人,Science,244174-181(1989)中给出。这些组织特异的或者器官特异的启动子是本领域中众所周知的并且包括但不限于种子特异的启动子、器官-原基特异的启动子、茎-特异的启动子、叶特异启动子、叶肉-特异的启动子(如光-可诱导的Rubisco启动子)、根-特异的启动子、块茎-特异的启动子、脉管组织特异的启动子、雄蕊-选择性启动子、开裂区(dehiscence zone)特异的启动子,等等。用于本发明的最优选的启动子将在种子、果实和块茎中最具活性。
时空上受调节的启动子是这样一种启动子,其中RNA聚合酶结合和启动的速度在发育期间的特定时间在生物的特定结构中受到调节。典型的时空上受调节的启动子的实例是Chua等人,Science 244174-181(1989)描述的EPSP合酶-35S启动子。
对于本发明,确定玉米胚乳是基因表达的靶标组织,但本发明可用于在全株植物或者该植物的任何特定组织中表达所选的sIgA。玉米胚乳中基因表达确保了积累高水平的靶蛋白质并简化了蛋白质的保存、运输、提取和纯化。在本发明的一个实施方案中,用胚乳-特异的启动子驱动抗-HSV抗体的HC和LC的表达。
已经详细研究了种子-特异的基因的表达(见,例如,Goldberg等人,Cell 56149-160(1989)和Higgins等人,Ann.Rev.Plant Physiol.35191-221(1984)的综述)。在Goldberg等人,Cell 56149-160(1989)和Thomas,Plant Cell 51401-1410(1993)中综述了种子-特异的基因的启动子分析。研究表明没有其它植物基因比编码种子贮藏蛋白的那些基因在空间表达上受到更密切的调节。
已经从多种植物物种克隆了许多种子贮藏蛋白基因,并且详细分析了它们的启动子(Thomas,Plant Cell 51401-1410(1993))。当前有种子贮藏蛋白基因在转基因植物中种子-特异性表达的许多实例。见,例如,b-菜豆蛋白(Sengupta-Gopalan等人,Proc.Natl.Acad,Sci.USA 823320-3324(1985);Hoffman等人,Plant Mol.Biol.11,717-729(1988));蚕豆凝集素(Voelker等人,EMBO J.63571-3577(1987));大豆凝集素(Okamuro等人,Proc.Natl.Acad.Sci.USA 838240-8244(1986));大豆Kunitz胰蛋白酶抑制剂(Perez-Grau等人,Plant Cell 1095-1109(1989));大豆b-conglycinin(Beachy等人,EMBO J.43047-3053(1985);豌豆球蛋白(Higgins等人,Plant Mol.Biol.11683-695(1988));豌豆convicilin(Newbigin等人,Planta 180461-470(1990));豌豆豆球蛋白(Shirsat等人,Mol.Gen.Genetics 215326-331(1989));油籽油菜napin(Radke等人,Theor.Appl.Genet.75685-694(1988));玉米18kD油质蛋白(Lee等人,Proc Natl.Acad.Sci.USA 8886181-6185(1991));大麦b-大麦醇溶蛋白(Marris等人,Plant Mol.Biol.10359-366(1988);小麦麦谷蛋白(Colot等人,EMBO J.63559-3564(1987))。关于种子特异的启动子的其他来源,见,例如,美国专利号5,623,067;6,100,450;6,177,613;6,225,529;6,342,657和6,403,371;Knutzon等人,Proc.Natl.Acad.Sci.USA 892624(1992);Bustos等人,EMBO J.101469(1991),Lam和Chua,Science 248471(1991);Stayton等人,Aust.J.Plant.Physiol.18507(1991),完整引用这些文献作为参考。此外,在嵌合基因构建体中与异源编码序列有效连接的种子特异的启动子基因也在转基因植物中保持它们的时间和空间表达模式。这些实例包括使用拟南芥(Arabidopsis thaliana)2S种子贮藏蛋白基因启动子在拟南芥(Arabidopsis)和欧洲油菜(B.napus)种子中表达脑啡肽(见,例如,Vandekerckhove等人,Bio/Technology 7929-932(1989));使用蚕豆凝集素和蚕豆b-菜豆蛋白启动子表达萤光素酶(见,例如,Riggs等人,Plant Sci.6347-57(1989));和使用小麦麦谷蛋白启动子表达氯霉素乙酰基转移酶(见,例如,Colot等人,EMBO J.63559-3564(1987))。
D.载体如本文别处提供的,本发明的一些实施方案使用表达单位(或者表达载体或者系统)在植物中表达外源提供的核酸序列。产生用于植物中的表达单位/系统/载体的方法是本领域中众所周知的并且可易于改造用于本发明。技术人员按照本文中提供的概述可以容易地在本发明方法中使用任何适宜的植物/载体/表达系统。
使用本领域中公知的标准方法典型地将配子-特异启动子、组成性启动子(如CaMV或者Nos启动子)、器官-特异启动子(如来自番茄的E8启动子)或者诱导型启动子连接到蛋白质或者反义编码区。使用补充元件,如转录终止子和/或增强子元件可以进一步优化表达单位。
用于调节蛋白质表达的表达控制元件可以是通常发现与编码序列相关的表达控制元件(同源表达元件)或者可以是异源表达控制元件。多种同源和异源表达控制元件是本领域中公知的并且可容易用于制备用于本发明的表达单位。
例如,转录起始区可以包括多种冠瘿碱的起始区之一,如在根癌农杆菌(Agrobacterium tumefacians)的Ti质粒中发现的章鱼碱、甘露碱、胭脂碱等等。
也可以使用植物病毒启动子,如花椰菜花叶病毒35S(CaMV 35S)启动子,以控制植物中的基因表达。
还可以使用植物启动子,如prolifera启动子、果实-特异的启动子、Ap3启动子、热休克启动子、种子-特异的启动子,等等。用于本发明的最优选的启动子将在种子、果实和块茎中最具有活性。
从而,对于植物中的表达,表达单位除了含有蛋白质序列将通常还含有植物启动子区域、转录起始位点和转录终止序列。通常在表达单位的5’和3’末端处包括独特限制酶位点以允许容易插入现有的载体。
在异源启动子/结构基因或翻译组合的构建中,启动子距离异源转录起始位点的距离优选与其在天然环境中距离转录起始位点的距离大约相同。然而,如本领域中公知的,该距离可以容许一定的变化而不造成启动子功能丧失。
除了启动子序列,表达盒还可以在结构基因下游含有转录终止区以提供有效终止。终止区可以与启动子序列从相同的基因得到或者可以从不同的基因得到。如果结构基因编码的mRNA将被有效加工,那么也通常将指导RNA多腺苷酸化的DNA序列加入载体构建体中。多腺苷酸化序列包括,但不限于农杆菌章鱼碱信号(Gielen等,EMBO J 3835-846(1984))或胭脂碱合酶信号(Depicker等人,Mol.and Appl.Genet.1561-573(1982))。
所得表达单位连接到载体中或者经构建而包括在载体中,所述载体适于高等植物转化。该载体典型地还含有可选择的标记基因,通过该标记基因可以在培养中鉴定被转化的植物细胞。可以使用抗生素抗性标记。这些标记包括,但不限于,对G418、潮霉素、博来霉素、卡那霉素和庆大霉素的抗性。更优选地,使用除草剂抗性标记。见,例如,美国专利号5,879,903、5,637,489和5,276,268关于对膦丝菌素-丙氨酰-丙氨酸(PTT)的膦丝菌素(PTC)抗性。还见例如,美国专利号5,767,361、5,928,937和6,444,875关于对咪唑啉酮除草剂的乙酰羟酸合成酶(AHAS)抗性。转化植物细胞后,含有载体的那些细胞将通过它们能够在含有特定抗生素的培养基上生长的能力来鉴定。载体通常还包括但不限于细菌或者病毒来源的复制序列以允许载体在细菌或者噬菌体宿主中克隆,优选包括宽宿主范围的原核复制起点。还应该包括用于细菌的选择标记以允许选择具有所希望的构建体的细菌细胞。适宜的原核选择标记还包括,但不限于,对抗生素如氨苄青霉素、卡那霉素或者四环素的抗性。
如本领域中公知的,载体中还可以存在编码其它功能的其它DNA序列。例如,对于农杆菌转化,将还包括T-DNA序列以用于随后转移到植物染色体中。
本发明的序列也可以与各种其他核酸分子如已表达序列标志(ESTs)、表位或者荧光蛋白标记融合。
ESTs是基因片段,通常长300到400个核苷酸,从互补-DNA(cDNA)克隆的3’或者5’末端测序得到。通过法国和美国合作已经产生了约30,000种拟南芥ESTs(Delseny等人,FEBS Lett.405(2)129-132(1997);拟南芥数据库,http://genome.www.stanford.edu/Arabidopsis)。关于分析从大EST数据库获得的基因表达模式,见,例如,M.R.Fannon,TIBTECH 14294-298(1996)的讨论。
生物相容的荧光蛋白探针,尤其来自水母Aequorea victoria的自组装绿色荧光蛋白(GFP),已经使细胞、分子和发育生物学中的研究发生了革命性变化,因为这些荧光蛋白探针使得可以观察活细胞中的生物化学事件(见,例如,Murphy等人,Curr.Biol.7(11)870-876(1997);Grebenok等人,Plant J.11(3)573-586(1997);Chiu等人,Curr.Biol.6(3)325-330(1996);和Plautz等人,Gene 173(1)83-87(1996);和Sheen等人,Plant J.8(5)777-784(1995))。
已经用定点诱变开发了经密码子修饰的更可溶的GFP形式,其被称作可溶性-修饰的GFP(smGFP)。当导入拟南芥属植物中时,当与经密码子修饰的GFP相比时观察到更强的荧光,暗示smGFP由于可以以更多的可溶性功能形式存在而更“明亮”(Davis等人,Plant Mol.Biol.36(4)521-528(1998))。通过融合编码GFP和β-葡糖醛酸酶(GUS)的基因,研究人员能够产生一组双功能报道分子构建体,其经优化而用于植物(包括拟南芥)中的瞬时和稳定的表达系统中。见,例如,Quaedvlieg等人,Plant Mol.Biol.37(4)715-727(1998)。
Berger等人(Dev.Biol.194(2)226-234(1998))报导了用于拟南芥下胚轴表皮细胞的GFP标记系的分离。已经用GFP-融合蛋白定位和表征了许多拟南芥基因,包括牻牛儿基牻牛儿基焦磷酸(GGPP)(Zhu等人,Plant Mol.Biol.35(3)331-341(1997))。
E.使基因丧失能力可能希望使某些植物基因失效以便实现转基因的表达和/或通过该转基因的表达而产生所希望的蛋白质。例如,在本发明中,可能希望使转基因植物天然的某些酶,例如,一种或多种特异植物转移酶丧失能力。使基因丧失能力的方法是本领域中技术人员众所周知的。
例如,一种有效的造成基因失效的修饰是在基因的开始导入单个核苷酸缺失,这将产生翻译读框移位。这种移码将使该基因失效,导致不可表达的基因产物并从而通过该基因破坏功能蛋白质生产。例如,如果未经修饰的基因编码蛋白酶,那么当该蛋白酶基因的调节区或者编码区被破坏时,则可以破坏通过该基因的蛋白酶产生。
除了通过缺失核苷酸导致转变的读框移位而使基因丧失能力外,通过技术人员众所周知的其他技术也可以实现失效修饰,所述技术包括插入、置换、倒位或者颠换该基因DNA内的核苷酸从而有效防止DNA所编码的蛋白质的形成。
本领域技术人员使用较不特异的方法也可以使基因丧失能力。较不特异的方法的实例是使用化学诱变剂,如羟胺或者亚硝基胍,或者使用辐射诱变剂,如γ辐射或者紫外辐射以随机突变基因。这些突变株系偶然可含有失效的基因,从而,因任何一个或多个结构域,这些基因不再能够产生功能蛋白质。通过常规筛选技术可以鉴定所希望的失效基因的存在。关于进一步指导,见,例如,美国专利号5,759,538。
F.反义编码载体如上面所讨论的,可能希望抑制某些天然植物基因,如特异植物转移酶的表达,以便得到转基因的表达和/或得到该转基因所编码的希望的蛋白质。使用反义构建体,包括原位产生反义序列用于抑制植物中表达的方法是本领域中普通技术人员众所周知的并且在例如美国专利号5,107,065、5,254,800、5,356,799、5,728,926、和6,184,439中描述。
可用于抑制植物中内源基因的表达的其他方法也可以用于本方法中。例如,在双链体基因的必需区域形成三螺旋可以用于该目的。允许设计适当的单链参与者的三链体密码也是本领域中公知的(见,例如,H.E.Moser等人,Science 238645-650(1987)和M.Cooney等人,Science 241456-459(1988))。控制序列中含有一段嘌呤碱基的区域是尤其有吸引力的靶标。在例如D.Praseuth等人,Proc.Nat′l Acad.Sci.USA 851349-1353(1988)中描述了三螺旋形成以及光交联。
G转化为了通过常规方法导入所希望的基因或者一组基因,需要两种品系之间的有性杂交,然后在杂种后代和亲本之一间反复回交,直到得到具有所希望的特征的植物。然而,该方法局限于可以有性杂交的植物,并且除了所希望的基因之外的基因也将被转移。
重组DNA技术通过使植物遗传学家可以鉴定并克隆编码所希望的性状,如对昆虫害虫的抗性的特定基因,并将这些基因导入已经有用的植物品种,而允许植物研究人员绕过上述的限制。一旦外来基因导入植物中,该植物就可以用于常规植物育种方案(例如,系谱育种、单籽后裔(single-seed-descent)育种方案、正反反复选择(reciprocal recurrentselection))以产生也含有目的基因的后代。
使用同源重组,可以将基因以定点方式导入。同源重组允许在内源基因中进行位点-特异修饰,从而可以纠正所遗传或者获得的突变,和/或可以工程化地将新的改变引入基因组中。植物中同源重组和定点整合在例如,美国专利号5,451,513、5,501,967和5,527,695中讨论。
产生转基因植物的方法是本领域中普通技术人员众所周知的。现在通过多种不同转化方法可以产生转基因植物,这些方法包括,但不限于,电穿孔;显微注射;微粒轰击,也称作微粒加速或者生物轰击;病毒-介导的转化;和农杆菌-介导的转化。见,例如,美国专利号5,405,765;5,472,869;5,538,877;5,538,880;5,550,318;5,641,664;5,736,369和5,736369;Watson等人,Recombinant DNA,Scientific American Books(1992);Hinchee等人,Bio/Tech.6915-922(1988);McCabe等人,Bio/Tech.6923-926(1988);Toriyama等人,Bio/Tech.61072-1074(1988);Fromm等人,Bio/Tech.8833-839(1990);Mullins等人,Bio/Tech.8833-839(1990);Hiei等人,Plant Molecular Biology 35205-218(1997);Ishida等人,Nature Biotechnology 14745-750(1996);Zhang等人,MolecularBiotechnology 8223-231(1997);Ku等人,Nature Biotechnology 1776-80(1999);和,Raineri等人,Bio/Tech.833-38(1990)),这里特别将这些文献的每一篇完整并入作为参考。
根癌农杆菌是天然发生的细菌,其能够将其DNA(遗传信息)插入植物中,导致对该植物的一种称作冠瘿的损伤。现在使用该方法可以转化大多数植物物种,包括紫花苜蓿。见,例如,Wang等人,Australian Journalof Plant Physiology 23(3)265-270(1996);Hoffman等人,MolecularPlant-Microbe Interactions 10(3)307-315(1997);和,Trieu等人,PlantCell Reports 166-11(1996)。
微粒轰击也称作微粒加速、生物轰击,和基因枪(BiolisticGene Gun)。基因枪用于将基因(例如,编码所希望的性状)包被的小粒射击到植物种子或者植物组织中以便使得该植物细胞随后能表达该新基因。基因枪使用真实的炸药(.22口径空弹(blank))推动所述材料。经压缩的气体或者蒸汽也可用作发射剂。Biolistic基因枪在1983-1984年由John Sanford,EdwardWolf,和Nelson Allen在Cornell Universtty发明。其和其注册商标现在由E.I.du Pont de Nemours and Company拥有。用该方法已经转化了大多数植物物种,包括紫花苜蓿(美国专利号5,324,646)和三叶草(Voisey等人,Biocontrol Science and Technology 4(4)475-481(1994);Quesbenberry等人,Crop Science 36(4)1045-1048(1996);Khan等人,Plant Physiology105(1)81-88(1994);和,Voisey等人,Plant Cell Reports 13(6)309-314(1994))。
WHISKERSTM由ICI Seeds Inc.(Garst Seed Company)在1993年开发,是将DNA插入植物细胞的其他方法(例如,Biolistic基因枪、根癌农杆菌、“鸟枪”(shotgun)法,等等)的替代方法;其由碳化硅的针状晶体(“须晶(whiskers)”)组成。将这些纤维与植物细胞置于容器中,然后高速混合,导致晶体刺穿植物细胞壁,形成显微“孔”(通道)。然后加入新DNA(基因),这导致DNA流入植物细胞。然后植物细胞掺入新基因;从而它们被基因工程化。
WHISKERSTM技术的本质是小的针状碳化硅“须晶”(直径0.6微米,长5-80微米),其以下面的方式使用。将容纳“转化鸡尾酒”的容器在牙科用汞齐混合器(dental amalgam mixer)或者颜料振荡器(paint shaker)上剧烈混合或振荡,该转化鸡尾酒由DNA(例如,农艺学基因加可选择的标记基因)、胚性(embryogenic)玉米组织,和碳化硅“须晶”组成。胚性玉米细胞和尖锐的碳化硅“须晶”之间的随后碰撞导致在植物细胞壁中产生小孔,推测DNA(农艺学基因)将通过小孔进入细胞。然后诱导接受和掺入新基因的那些细胞生长并最终发育成能育的转基因植物。
碳化硅“须晶”转化已经在多种植物物种如玉米(Zea mays)中产生了稳定转化的愈伤组织和/或植物。见,例如,美国专利号5,302,523和5,464,765,在这里将它们完整并入作为参考;Frame等人,The Plant Journal 6941-948(1994);Kaeppler等人,Plant Cell Reports 9415-418(1990);Kaeppler等人,Theoretical and Applied Genetics 84560-566(1992);Petolino等人,Plant Cell Reports 19(8)781-786(2000);Thompson等人,Euphytica 8575-80(1995);Wang等人,In Vitro Cellular andDevelopmental Biology 31101-104(1995);Song等人,Plant Cell Reporter20948-954(2002);Petolino等人,Molecular Methods of Plant Analysis,In Genetic Transformation of Plants,卷23,147-158页,Springer-Verlag,Berlin(2003)。其他实例包括多花冬麦草(Lolium multiflorum)、Loliumperenne、苇状羊茅(Festuca arundinacea)、葡茎剪股颖(Agrostisstolonifra)(Dalton等人,Plant Science 13231-43(1997))、稻(Oryzasativa)(Nagatani等人,Biotechnology Techniques 11471-473(1997)),和普通小麦(Triticum aestivum)和烟草(Nicotiana tobacum)(Kaeppler等人,Theoretical and Applied Genetics 84560-566(1992))。甚至衣藻(见,例如,Dunahay,T.G,Biotechniques 15452-460(1993))也可以用“须晶”方法转化。随着其当前应用于高等植物,“须晶”系统是转化某些植物细胞的最简单的方法之一。
用重组DNA方法学成功导入植物中的基因包括但不限于,编码下面性状的那些基因种子贮藏蛋白,包括经修饰的7S豆类种子贮藏蛋白(见,例如,美国专利号5,508,468、5,559,223和5,576,203);除草剂耐受性或者抗性(见,例如,De Greef等人,Bio/Technology 761(1989);美国专利号4,940,835;美国专利号4,769,061;美国专利号4,975,374;Marshall等人(1992)Theor.Appl.Genet.83,435;美国专利号5,489,520;美国专利号5,498,544;美国专利号5,554,798;Powell等人,Science 232738-743(1986);Kaniewski等人,Bio/Tech.8750-754(1990));Day等人,Proc.Natl.Acad.Sci.USA 886721-6725(1991));肌醇六磷酸酶(见,例如,美国专利号5,593,963);对细菌、真菌、线虫和昆虫害虫的抗性,包括Bt基因赋予的对鳞翅目昆虫的抗性(见,例如,美国专利号5,597,945和5,597,946;Johnson等人,Proc.Natl.Acad.Sci.USA,869871-9875(1989);Perlak等人,BiolTech.8939-943(1990));凝集素(美国专利号5,276,269);花颜色(Meyer等人,Nature 330677-678(1987);Napoli等人,Plant Cell 2279-289(1990);van der Krol等人,Plant Cell 2291-299(1990));Bt基因(Voisey等人,如前引文);新霉素磷酸转移酶II(Quesbenberry等人,如前引文);豌豆凝集素基因(Diaz等人,Plant Physiology 109(4)1167-1177(1995);Eijsden等人,Plant Molecular Biology 29(3)431-439(1995));生长素-应答启动子GH3(Larkin等人,Transgenic Research 5(5)325-335(1996));向日葵的种子白蛋白基因(Khan等人,Transgenic Research 5(3)179-185(1996));和编码膦丝菌素乙酰基转移酶、赋予Basta除草剂抗性的β-葡糖醛酸酶(GUS)、新霉素磷酸转移酶和α-淀粉酶抑制剂的基因(Khan等人,如前引文),这些文献的每一篇都被完整并入本文作为参考。
对于某些目的,可能优选不同的抗生素或者除草剂选择标记。常规用于转化的选择性标记包括nptII基因,其赋予对卡那霉素和相关抗生素的抗性(见,例如,Messing&Vierra,Gene 19259-268(1982);Bevan等人,Nature 304184-187(1983));bar基因,其赋予对除草剂膦丝菌素的抗性(White等人,Nucl Acids Res 181062(1990),Spencer等人,Theor ApplGenet 79625-631(1990));和dhfr基因,其赋予氨甲蝶呤抗性(Bourouis等人,EMBO J.2(7)1099-1104(1983))。
使用从紫花苜蓿和非紫花苜蓿物种分离的许多不同的基因已经产生了转基因紫花苜蓿植物,所述基因包括,但不限于下面的与报道基因gusA融合的早期结瘤素基因的启动子(Bauer等人,The Plant Journal 10(1)91-105(1996));早期结瘤素基因(Charon等人,Proc.Natl.Acad.of Sci.USA 94(16)8901-8906(1997);Bauer等人,Molecular Plant-MicrobeInteractions 10(1)39-49(1997));依赖NADH的谷氨酸合酶(Gantt,ThePlant Journal 8(3)345-358(1995));三种凝集素基因的每一种的启动子-gusA融合(Bauchrowitz等人,The Plant Journal 9(1)31-43(1996));与CaMV启动子融合的海洋软珊瑚Renilla reniforms的萤光素酶(Mayerhofer等人,The Plant Journal 7(6)1031-1038(1995));Mn-超氧化物歧化酶cDNA(McKersie等人,Plant Physiology 111(4)1177-1181(1996));编码苏云金芽孢杆菌(Bacillus thuringiensis)δ-内毒素的合成的cryIC基因(Strizhov等人,Proc.Natl.Acad.Sci.USA 93(26)15012-15017(1996));glucanse(Dixon等人,Gene 179(1)61-71(1996);和叶衰老基因(leaf senescence gene)(美国专利号5,689,042)。
在多种饲料和草皮草物种中也报导了遗传转化(Conger B.V.,GeneticTransformation of Forage Grasses in Molecular and Cellular Technologiesfor Forage Improvement,CSSA Special Publication No.26,Crop ScienceSociety of America,Inc.E.C.Brummer等人编著1998,49-58页)。这些草包括但不限于,鸭茅(Dactylis glomerata L.)、苇状羊茅(Festucaarundinacea Schreb.)、紫羊茅(Festuca rubra L.)、草地羊茅(Festucapratensis Huds.)、黑麦草(Lolium perenne L.)、匍匐剪股颖(Agrostispalustris Huds.)和小糠草(Agrostis alba L.)。
转基因植物已经用于工业蛋白质的分子养殖(“pharming”)。例如,已经从转基因玉米商业化生产了重组卵白抗生物素蛋白和细菌B-葡糖醛酸酶(GUS),通过使用来自玉米的泛素启动子在种子中得到了高水平表达(Hood等人,Adv Exp Med Biol 464127-147(1999))。
H.半合子性用农杆菌转化方法形成的转基因植物通常在一条染色体上含有单个基因,尽管多个拷贝是可能的。这些转基因植物可以称为所加入基因的半合子。这种植物的更准确的名称是自由分离子,因为每一经转化的植物代表一种独特的T-DNA整合事件(见,例如,美国专利号6,156,953)。转基因基因座通常由存在和/或不存在转基因来表征。其中一个等位基因相应于缺少转基因的杂合基因型也被称为半合子的(见,例如,美国专利号6,008,437)。
假定正常的半合子性,自交将在第一个自交重组代中导致最大基因型分离,该代也称作R1或R1代。通过最初的重组系,也称作R0或R0代的自交产生R1代。因为每个插入片段作为显性等位基因起作用,在没有连锁和假定对于耐受性表达仅需要一个半合子插入片段时,一个插入片段将以3∶1分离,两个插入片段将以15∶1分离,三个插入片段将以63∶1分离,等等。因此,为了找到至少一个抗性表型,需要培养相对少的R1植物(见,例如,美国专利号5,436,175和5,776,760)。
如上面提到的,半合子转基因再生植物的自花授粉将产生等价于F2的后代,其中约25%将是纯合的转基因植物。F2子代的自花授粉和与未转化的对照植物的测交(test cross)可用于鉴定纯合转基因植物和保持该品系。如果对于再生植物,最初得到的子代来自异花授粉,那么纯合转基因植物的鉴定将需要额外的自花授粉代(见,例如,美国专利号5,545,545)。
I.育种方法开放传粉群体。作物诸如黑麦,许多玉米和甜菜,草本草(herbagegrass),豆类如紫花苜蓿和三叶草,和热带树作物如可可树、椰树、油棕和某些橡胶树的开放传粉群体的改进基本上依赖于改变基因频率以达到有利的等位基因的固定并同时保持高(但是远未到达最大)程度的杂合性。这些群体中的一致性是不可能的,开放传粉品种中的典型性(trueness-to-type)是作为一个整体的群体的统计学特征,而不是单个植物个体的特征。从而,开放传粉群体的异质性与近交品系、克隆和杂种的同质性(实质上的同质性)对立。
群体改进方法自然地分成两组,基于纯表型选择的方法,通常称为混合选择,和基于利用子代检验进行的选择的那些方法。群体间改进利用了开放育种群体的概念;允许基因从一个群体流到另一个群体。
一个群体中的植物(栽培品种、品系、生态型,或者任何种质来源)天然地(例如通过风)或者手工地或者通过蜜蜂(通常意大利蜜蜂(Apismellifera L.)或苜蓿切叶蜂(Megachile rotundata F.))与来自其他群体的植物杂交。通过分离具有来自两个来源的期望性状的植物,进行选择以改进一个(有时两个)群体。
基本上有两种主要的开放传粉群体改进方法。其一情况是,通过所选的选择方案整体地改变群体。结果是经改良的群体,其通过在隔离情况下自己内部的随机交配而可以无限繁殖。其次,综合品种达到和群体改良相同的最终结果但是其不能就此自我繁殖;其必须从亲本品系或克隆重新构建。用于改良开放传粉群体的这些植物育种方法是本领域中技术人员众所周知的并且在许多教材和文章中提供了常规用于改良异花传粉植物的育种方法的全面综述,所述教材和文章包括但不限于Allard,Principles ofPlant Breeding,John Wiley&Sons,Inc.(1960);Simmonds,Principles ofCrop Improvement,Longman Group Limited(1979);Hallauer和Miranda,Quantitative Genetics in Maize Breeding,Iowa State University Press(1981);和,Jensen,Plant Breeding Methodology,John Wiley&Sons,Inc.(1988)。
混合选择。在混合选择中,选择所希望的个体植物,将其收获,混种而不检验子代以产生后代。因为选择仅基于母本亲代,而且对传粉没有控制,故混合选择等于伴有选择的随机交配形式。如上面所陈述,混合选择的目的是增加群体中优良基因型的比例。
综合品种。在所有可能的杂种组合中选择具有良好的配合力(combining ability)的多个基因型,通过群内杂交产生综合品种,随后通过开放传粉维持该品种。不管亲代是(或多或少近交的)种子-繁殖品系(如一些甜菜和蚕豆(Vicia))还是克隆(如草本草、三叶草和紫花苜蓿)在原则上没有差别。根据一般配合力,有时通过测交或者顶交,更通常通过多系天然杂交,选择亲代。亲代种子系可以有意地进行近交(例如,通过自交或者同胞杂交)。然而,即使亲代不有意近交,在品系保持期间在品系内的选择也将确保发生一定程度的近交。克隆亲本当然将保持不变和高度杂合。
综合品种可以从亲代种子生产场地直接到农民手中或者必须首先经历一轮或两轮繁殖,这取决于种子生产和种子所需的规模。实际上,草和三叶草通常繁殖一次或两次并从而相当大地脱离最初的综合品种。
尽管有时使用混合选择,但是对于多系天然杂交,子代检验通常是优选的,因为它们操作简单并且与目标--即在综合品种中开发一般配合力--明显相关。
进入综合品种中的亲代品系或克隆的数目变化很大。实际上,亲代品系的数目从10到数百,平均100-200。预计从100或更多克隆形成的、基础广泛的综合品种在种子繁殖期间比基础窄的综合系更稳定。
杂种。杂种是不同基因型的亲代之间杂交所得的个体植物。商业化杂种现在广泛用于许多农作物中,包括玉米、高梁、甜菜、向日葵、嫩茎花椰菜。可以以不同的方法形成杂种,这些方法包括两个亲本直接杂交(单杂交杂种),另一亲本与单杂交杂种杂交(三方或三重杂交杂种),或者两个不同的杂种杂交(四方或者双杂交杂种)。
严格说来,在远交(即,开放传粉)群体中的多数植物个体是杂种,但是该术语通常被保留用于如下情况亲代个体的基因组相互足够不同而被识别为不同的物种或者亚种。根据两个亲本的基因组在质和/或量上的不同,杂种可以是可育的或者不育的。杂种优势通常与增加的杂合性有关,该杂合性导致与用于形成杂种的亲代品系相比,杂种的生长、生存和可育性具有增加的优势。通常通过将两种遗传上不同的、高度近亲交配的品系杂交实现最大杂种优势。
杂种的生产是成熟的工业,包括两亲本品系和从这些品系的杂交所得的杂种的独立生产。关于杂种生产方法的详细讨论,见,例如,Wright,H.,Commercial Hybrid Seed Production,卷8,161-176页,《Hybridization ofCrop Plants》,如前。
实施例I.在植物中产生IgA的实例用两种基本策略在玉米中产生抗-HSV单体IgA
IgA的组成性表达;和IgA的胚乳-特异表达。
实验还比较了重链(“HC”)和轻链(“LC”)在单个质粒上与HC和LC在两个分开的质粒上的表达效率。
实施例1.泛素/HC,LC质粒的构建选择抗-HSV抗体基因的组成性表达以便能够在愈伤组织上快速分析蛋白质生产。更具体地,产生玉米泛素-1启动子驱动的HSV重链HC和LC质粒构建体和转基因事件以证明来自某些质粒构型的重链和轻链基因的正确装配和积累。
例如,在美国专利号5,510,474、5,614,399、6,020,190、和6,054,574中描述了玉米泛素-1(’ubi'),这里完整引用这些专利。在美国专利号5,773,689和6,239,328中描述了MAR(基质附着区),这里完整引用这些专利。玉米per5 UTR在美国专利号6,384,207中描述,这里将该专利完整并入。用于本实验中的基因没有就植物密码子偏爱进行重建,并且它们含有大麦-α淀粉酶前导序列以将蛋白质靶向内质网。
装配了下面的载体pDAB635(MAR∷ubi/HC/per5∷MAR)(
图1;SEQ ID NO15);pDAB636(MAR∷ubi/LC/per5∷MAR)(图2;SEQ ID NO16);和pDAB637(MAR∷ubi/HC/per5∷ubi/LC/per5∷MAR)(图3;SEQ IDNO17)。
抗体基因从来源载体上以NcoI-HpaI片段释放并克隆到载体pDAB4005的NcoI-PmeI位点中,处于玉米泛素启动子和玉米per53′UTR之间,置换GUS编码区。然后以NotI片段释放完整ubi启动子/抗体基因/per5盒并将其插入反向MAR载体252-4的NotI位点。通过从中间载体释放NotI片段上的ubi/HC/per5盒,并用T4聚合酶使所述片段的末端钝化以插入到pDAB636的唯一Srf I位点中,构建质粒pDAB637。大量产生所有三种质粒,以准备与pDAB3014一起转化玉米,pDAB3014含有选择标记盒稻肌动蛋白/pat/脂肪酶。
实施例2递送多种质粒的备选方法因为PAT质粒(pDAB3014)和抗体质粒之间大小的极端不同,所以所关心的问题是,使用等质量的DNA用于共转化将导致每种质粒向玉米细胞的低效率递送。在评估将多种质粒递送到玉米细胞的某些参数时,比较摩尔相等量的DNA的使用与质量相等量的DNA的使用,以确定对于细胞接受所有必要质粒的效率是否产生影响。
共106个事件可用于PCR,并且再生了经分析为阳性的10个事件。
对于用泛素/HC,LC质粒转化的转基因愈伤组织事件的分析以两个阶段进行1)PCR鉴定含有完整目标基因的那些事件;和2)对PCR阳性事件实施蛋白质印迹和ELISA分析以检测蛋白质表达和IgA装配。图4显示了非变性蛋白质印迹,其中使用IgAκ链作为检测抗体以检测转基因玉米愈伤组织产生的泛素HSV-IgA(HC/LC)单体抗体的蛋白质表达。
完整PTU(植物转录单位启动子/编码区/3’UTR)的PCR鉴定尤其具有挑战性,这是因为三种质粒内含有重复调节元件而这又导致要设计能特异和准确地扩增所希望的PTU的引物是困难的。试验了几种扩增策略、PCR系统和扩增条件,包括8个不同的引物组。已确定在单个PCR反应中用单一一组引物就可以扩增HC PTU(ubi/HC/per5)和LCPTU(ubi/LC/per5)。通过在HC和LC侧翼区域中利用不同的几个碱基对,还发现了分别能够识别和特异扩增HC或者LC PTU的第二和第三组引物。
对来自二方转化(pDAB637(SEQ ID NO17)和pDAB3014(SEQ IDNO84))的共53个转基因愈伤组织和来自三方转化(pDAB635(SEQ IDNO15)和pDAB3014(SEQ ID NO84))的23个转基因愈伤组织进行PCR分析以检测转基因PUTs的存在。使用在单一PCR反应中扩增HC和LC的策略。在来自二方的愈伤组织品系中,79%是PCR阳性,而来自3-方的78%的愈伤组织品系是PCR阳性的。为了验证来自第一种扩增策略的结果,使用备选策略分析了16个样品组成的子集,该策略可以分别扩增HC和LC的PTU。结果与在相同的PCR反应中检测HC和LC PTU的第一种PCR分析一致。用引物进一步分析这16个子集样品以仅扩增HC和LC的编码区。尽管该扩增是成功的,但是结果未与PTU分析完全匹配。该差异可能是片段化PTU造成的,所述片段化PTUs可以通过编码区特异的引物但不是PTU-特异的引物检测。对PTU阳性和阴性的愈伤组织事件进行蛋白质印迹和ELISA分析。
使用来自上述泛素/HC,LC转化的事件,产生蛋白质分析数据。该实验的目的是比较HC和LC在单个质粒上和HC和LC在两个分开的质粒上的表达效率。收集愈伤组织材料并在-70℃冰冻后转运以进行蛋白质分析。用捕获ELISA试验使用IgA重链捕获抗体和IgAκ链检测抗体实施事件的初步筛选。用非变性蛋白质印迹评估了仅ELISA阳性样品,该非变性蛋白质印迹也使用IgAκ链作为检测抗体。
在通过ELISA筛选的54个事件中,26个是阳性(表1)。所有这些26个阳性样品产生了分子量约为160,000kd的经装配的IgA单体。这些事件中的18个事件还包括一些未装配的IgA。
两种转化方法二质粒和三质粒方法都产生了经装配的IgA,三方策略产生60%阳性,二方策略产生38%阳性。表达品系的频率的不同被认为不是质粒构型所致,而是由于提交用于分析的小数据组所致。
表1.Ubi/HC,LC事件的蛋白质和PCR结果
这些实验表明当HC和LC在单个质粒上或者在两个分开的质粒上时,在蛋白质表达和装配上没有显著差异。对于每种策略产生平均相同数目的事件而不管以质量相等量还是以摩尔相等量加入DNA。此外,两种DNA递送策略都导致相同数目的含有所有目的基因的事件。基于这些结果,对于随后的工作以质量相等量加入DNA。
实施例3.用于植物中胚乳-特异的抗-HSV抗体表达的载体构建下面的实施例涉及用于控制单纯疱疹病毒(HSV)的单体IgA抗体。将编码HC和LC的两种基因在一种载体中导入植物以种子特异性表达具有抗HSV功能性的单体抗体。
使用类似于美国专利号5,380,831中教导的方法重新设计两种抗体基因(HC和LC)以便在植物中获得最优表达,所述专利被完整并入本文作为参考。从而,两种人HSV抗体基因HC(SEQ ID NO1)和LC(SEQ ID NO9),以及核苷酸序列SEQ ID NOs3、5、7、9、11和13具有密码子偏倚性,为了在玉米中增强基因表达,所述密码子偏倚性更接近植物密码子而不是人密码子。
抗-HSY项目的质粒构建需要四种复杂质粒的装配,每种质粒均含有MAR序列位于两个抗体植物转录单位(PTU)侧翼。为了胚乳特异表达,抗体基因处于玉米γ-玉米醇溶蛋白(“gz”或者“γ-玉米醇溶蛋白”)启动子的控制下(Ueda,T.等人,Mol.Cell.Biol.14(7)4350-9(1994))并以玉米过氧化物酶3′UTR(per5)终止。
主链载体构建。质粒构建的第一阶段涉及制备主链载体。主链质粒含有目标基因表达必需的所有元件,这些元件包括MAR序列、启动子、3′UTR、可选择标记基因盒和用于抗体编码区的一步加入的独特限制性位点。主链载体的另一特征是存在用于有效除去抗生素抗性基因的独特限制性位点。抗体-特异的主链载体的另一特征是缺少可能干扰抗体基因片段克隆的位点,以备将来产生概念载体。
以两个阶段实施抗体载体构建步骤1=在γ-玉米醇溶蛋白启动子和per53′UTR之间插入抗体基因;和步骤2=向反向MAR载体插入γ-玉米醇溶蛋白抗体基因per5盒。对两种主链载体进行几个修饰,以促进可变区基序的亚克隆、使得能够纯化无氨苄青霉素的片段和支持DNA印迹分析和PTU鉴定。通过用T4聚合酶除去核苷酸的方式,从“步骤1”载体除去AvrII位点。此外,通过将现有的per5片段用已去除PmeI位点的类似片段置换从“步骤1”载体除去PmeI位点。通过向唯一的SapI位点中加入合成的衔接子,向“步骤2”MAR载体加入FspI位点。最后,通过从pDAB4005除去泛素启动子并将其用从W22基因组DNA PCR扩增的γ-玉米醇溶蛋白启动子置换,将γ-玉米醇溶蛋白启动子插入“步骤1”载体。对经修饰的主链载体测序以验证这些改变。此外,完成对γ-玉米醇溶蛋白启动子的完全测序以确保没有PCR导致的错误。
表2列出了已经构建的主链载体和为了容纳抗体基因而实施的修饰。
表2主链载体
主链载体的更详细的描述和用于构建它们的策略如下。
pDAB8506是经修饰的pDAB4005载体(pDAB4005被设计为标准检验载体)。其含有玉米ubi/GUS/per5盒并且是随后的主链载体的基础。使用T4 DNA聚合酶从pDAB4005除去AvrII位点。
pDAB634含有玉米γ-玉米醇溶蛋白-启动子/GUS/per5(′gz/GUS/per5′)盒。通过用HindIII-NcoI片段上的γ-玉米醇溶蛋白启动子置换DAB 8506的泛素启动子产生该质粒。使用基于GenBank登录号#MZEZEIN27设计的引物从W22基因组DNA PCR扩增γ-玉米醇溶蛋白启动子。
pDAB1416是pDAB634的修饰,其中通过从SacI-FseI片段除去现有的per53′UTR以缺失PmeI位点。使用经设计以除去PmeI位点的引物通过PCR扩增从per53′UTR除去PmeI位点。PmeI位于per5功能序列的外部,因此除去该位点将不会干扰该元件的功能性。
pDAB8504是MAR载体p254-3的修饰载体,p254-3含有相互反向的Rb7MAR,位于稻肌动蛋白/PAT/脂肪酶3′UTR盒的侧翼,并且还含有多克隆区用于插入目标基因。质粒pDAB8504基本上为p254-3,只是在该质粒的主链中加入FspI位点。将含有FspI位点的一个9-bp衔接子插入MAR载体中的SapI位点中并导致在MAR载体的主链区中加入三个FspI位点。这些FspI位点将用于在转化前从大量质粒制备物中除去氨苄青霉素抗性基因。
pDAB1414是pDAB8504的经修饰的形式,其中通过用PmeI消化,已经除去了稻肌动蛋白/PAT/脂肪酶盒以缺失此PTU。
抗体载体构建。为了完成最终抗体质粒的装配,需要三个克隆步骤和制备两种中间载体。三个克隆步骤如下1.在γ-玉米醇溶蛋白启动子和per53′UTR之间亚克隆抗体基因以产生“γ-玉米醇溶蛋白/抗体盒”(步骤1载体)。
2.将含有抗体基因#1的“γ-玉米醇溶蛋白/抗体盒”亚克隆到含有MAR序列的载体(步骤2载体)中。
3.将含有抗体基因#2的“γ-玉米醇溶蛋白盒”亚克隆到步骤#2中产生的MAR载体内。(步骤3载体=最终载体)。
如前面讨论的,抗体装配起始于产生HC和LC的密码子-优化的基因。大量制备所有这些载体并独立地克隆到主链质粒pDAB1416中。向这些中间载体的每一种分配新的质粒编号(表3)。
表3.中间和最终抗体构建体
质粒pDAB8505(
图15)含有gz/HC/per5::gz/LC/per5表达盒,该盒侧翼是反向MAR序列(Rb7),质粒pDAB2101含有MAR::gz/LC/per5::gz/HC/perS::MAR。质粒pDAB8505用于共转化和杂交策略中。载体构建的细节如下描述pDAB1415具有含有gz/LC/per5的盒。为了构建该构建体,将pDAB1416中的GUS基因用NcoI和SacI切除并用LC基因置换,LC基因是用NcoI和SacI从其供体载体切出的。
pDAB1417具有含gz/LC/nosA的盒。为了构建该构建体,将pDAB1416中的GUS基因用NcoI和SacI切除并用LC基因置换,该LC基因也是用NcoI和SacI从其供体载体切出的。
pDAB8501具有含gz/HC/per5的盒。为了构建该构建体,将pDAB1416中的GUS基因用NcoI和SacI切除并用HC基因置换,该HC基因也是用NcoI和SacI从其供体载体切出的。
pDAB8502具有含gz/HC/nosA的盒。为了构建该构建体,将pDAB1417中的LC基因用NcoI和SacI切除并用HC基因置换,该HC基因也是用NcoI和SacI从其供体载体切出的。
pDAB8503具有含MAR/gz/LC/per5::稻肌动蛋白/PAT/脂肪酶::MAR的盒。为了构建该构建体,将来自pDAB1415的gz/LC/per5盒用NotI切出并插入到pDAB8504的NotI位点中。
pDAB8505(图5)是两种最终载体之一。其具有含MAR::gz/HC/per5::gz/LC/per5::稻肌动蛋白/PAT/脂肪酶::MAR的盒。为了构建该构建体,将pDAB8501的gz/HC/per5盒用NotI切出,然后用T4 DNA聚合酶处理产生钝端并最终连接到pDAB8503的SrfI位点中。
最终质粒经历大规模DNA纯化和片段纯化以除去氨苄青霉素基因。获得约15mg每种最终质粒(没有amp片段)用于转化。
通过制备不包括尾部的编码区的载体也可以得到无尾重链抗体。
实施例4.植物转化载体的大规模DNA片段纯化以除去氨苄青霉素抗性基因如前面描述的,从植物转化载体除去质粒主链序列,对于确保经转化的植物材料没有任何污染性抗生素抗性基因是必要的。用于大规模除去DNA片段的基于凝胶的策略是产生转化-质量的片段的有效方法,然而,该方法不仅费力而且耗时。
分离中的第一步是使用限制酶从所述载体切除基因构建片段并使不想要的DNA片段降低为可能的最小单位。用Fsp除去Amp片段。使用该策略,可以将含有氨苄青霉素抗性基因的区域降解成分别为1023和1236bp的两个片段。
总共产生了34.8mg以上的无amp的pDAB8505。对所产生的每批DNA片段进行限制性消化以实施质量控制来确保在制备物中没有剩余亲本质粒或者部分消化的片段。递送前用PCR扩增确定所处理的DNA片段的纯度。总的纯度为约98%到约99.5%。在多数情况中,实现了约99%或者更高的纯度。基于FPLC的技术比凝胶纯化方案更划算。
使用FPLC-Sephacryl S-1000填充柱的大规模DNA片段分离方法。使用FPLC系统以恒定速度用Sephacryl S-1000填充2.6/100cm柱。补加150mM NaCl的TE缓冲液用于过滤介质的预洗涤和柱填充以及DNA洗脱。将2毫克(1mg/mL)FspI-消化的pDAB3016 DNA加至柱子。以8mL/收集管共收集了500mL洗脱液。在260、280和320nm监视洗脱过程。为了检查分离结果,将来自每个收集管的20μL等分试样加至琼脂糖凝胶后电泳。
试验了1kb plus DNA序列梯,其含有大小为100bp到12kb的DNA片段。结果表明用当前的方法可以将7kb或者更大的DNA片段与1.0和1.2kb氨苄青霉素抗性片段分离。
为了提高可重复性和进一步增强分离效率,研究了几种因素,包括DNA预热温度和持续时间,每次加样的DNA的量和连续使用后柱性能的稳定性。发现在55℃预处理15-20分钟是最佳分辨(即,最佳分离效率)所最希望的。此外,确定柱子在连续使用3-4次后应该被重调节。尽管可以向柱子加载高达25ml(25mg),但是随着DNA上样量的增加,片段回收效率降低。用2mg DNA上样量可以回收约95%以上的DNA片段。然而,当上样的DNA的量增加到5mg时该回收率下降到约70%(表4)。3mg上样水平是通常所用的规模,其在第一轮柱纯化中具有约85%的平均回收率。结果表明FPLC柱层析是在玉米转化前从质粒除去氨苄青霉素基因片段的有效技术。
表4.使用基于FPCL-的柱纯化的平均DNA片段回收率
实施例5.通过定量实时PCR(qRT-PCR)估计转基因拷贝数大多数通过直接-DNA递送方法产生的转基因事件显示出复杂的插入模式。这些多拷贝插入使得育种日益困难并且还导致沉默事件频率的增加。从而,应该在转化过程的早期阶段消除这些多拷贝插入。通常通过Southern印迹分析确定转基因插入模式。然而,该方法相当费力、费时并且不可能适用于高通量分析方法。为了克服这些问题,用可以快速估计拷贝数的技术在转化过程的早期辨别待丢弃的事件。已经开发并实施了定量实时PCR(qRT-PCR)以预测HSV构建体的转基因拷贝数。
定量实时PCR(qRT-PCR)。已经证明定量实时PCR(qRT-PCR)是估计转基因玉米愈伤组织的转基因拷贝数的有效方法。
用AO和IMT基因对该技术的验证表明通过qRT-PCR估计的拷贝数和通过DNA印迹分析确定的插入带非常接近并且高度相关。
用pDAB8505(HC+LC+PAT)验证qRT-PCR分析。为两种基因,即HC和LC的每一种,设计了两对引物并用常规PCR和qRT-PCR检验。为了估计HSV转基因玉米愈伤组织中转基因拷贝数,对于pDAB8505事件仅分析了LC。
还研究了qRT-PCR的可重复性。发现该方法是高度可重复的。由不同研究人员或者由一名研究人员在不同时间所得的估计拷贝数非常接近并且高度相关。因此,除非观察到不寻常的数据,没有发现重复分析的必要性。此外,观察到具有低拷贝数和高拷贝数的事件的不均匀分布。在一些行中(in some orders)发现简单事件区与复杂事件区。这表明克隆的事件可能以多种分离物形式存在。
实施例6.为了在玉米种子中产生单体IgA的转化通过pDAB8505的直接DNA递送使用WHISKERSTM转化方法(Song等人,Plant Cell Reporter 20948-954(2002))处理玉米近交系“HiII”的植物细胞。所用的“小规模”WHISKERSTM方法能够一次处理约2ml压紧的植物细胞。在所分析的541个愈伤组织事件中,约67%(360/541)具有5份以上的转录物拷贝;约5%(29/541)具有5份拷贝;约5%(27/541)具有4份拷贝;约6%(33/541)具有3份拷贝;约8%(45/541)具有2份拷贝;约7%(36/541)具有1份拷贝;约2%(11/541)具有0份拷贝。再生了代表126个事件的共871株植物并将其转移到温室,生长到成熟。
种子生产。将抗-HSV转化的植物种植在5加仑盆中并通过近交玉米系“OQ414”传粉以产生子代种子,在该种子上分析抗体产生。
除草剂抗性,作为体外选择性标记,是大田研究和植物中(in planta)性状渐渗活动的重要工具。植物种植在5-加仑盆中后,对每株植物和阳性对照(4XH753)和阴性对照(Hi II F1)进行除草剂耐受性的叶子涂抹试验。该方案包括自叶尖向上20cm应用10μL 2.0%Finale溶液(1”平方)于每株植物。结果表明4XH753植物明显敏感而HiIIF1植物表现出对该除草剂的耐受性。除了一株之外,所有抗-HSV转化的植物都具有抗性。
总之,用2%Finale涂抹被认为已转化的植物并且选择具有该除草剂抗性的植物用于进一步繁殖和表征。还收集每株抗-HSV植物的叶子样品以用于DNA印迹分析。
实施例7.玉米胚乳中蛋白质分析HC/LC转化体。通过ELISA和SDS非还原蛋白质印迹,分析T1种子的γ-玉米醇溶蛋白/HC/LC构建体(pDAB8505)。该方法还需要确定样品重量和提取物中的总的可提取的蛋白质。如果事件产生了至少25粒种子则选择该事件用于分析--对于低和高种子计数事件,分别检测10和20粒玉米粒。从一个或两个穗系(ear family)选择玉米粒用于试验。穗系是单个授粉的穗的子代。
非破坏性地从种子削下样品,保留萌发阳性种子的可能性。设计ELISA用以捕获重链和检测IgA单体的轻链。用于所有这些事件的标准是sIgA抗体(来自U.S.Biological的I1890-10)。
蛋白质印迹分析表明所有表达事件均产生了装配的IgA单体以及未装配的或者降解的重链和轻链。如果ELISA和蛋白质印迹分析都产生阳性结果,则认为种子是阳性的。基于蛋白质表达和在受试的玉米粒内观察到的分离比例,推荐事件进入大田。
对于pDAB8505构建体共分析了930粒单独的种子,代表具有足够高的种子数而用于试验的66个事件。总之,基于有利的表达和分离数据提出33个事件(50%);对另外8个事件(12%)发现表达存在问题,如不好的分离数据;发现25个事件(38%)不表达IgA。
实施例8.通过MALDI-TOF MS确定玉米中表达的单体IgA-HX8的Asn-269(α重链的CH2区)的寡糖谱下面描述用于单体IgA-HX8的聚糖分析的典型方法。
还原/烷基化的IgA-HX8的胰蛋白酶消化。将100μg亲和-纯化的IgA-HX8置于微量离心管(0.6mL,低蛋白质结合)中在离心蒸发器中干燥。将沉淀重悬浮在100μL蛋白质溶解缓冲液中,该缓冲液含有6M盐酸胍和0.4M碳酸氢铵。通过加入10μL 0.1M DTT并在65℃孵育1小时还原样品。还原后,通过加入20μL 0.2M碘乙酰胺并在室温黑暗中孵育2小时使蛋白质样品烷基化。通过加入40μL 0.1M DTT并在室温孵育30分钟淬灭烷基化反应。然后用反相柱体(Protein Macro Trap,MichromBioresources)根据生产商的方法将蛋白质脱盐并用150μL 80%乙腈/0.2%TFA,然后用100%乙腈/0.2%TFA洗脱,并将洗脱的蛋白质在离心蒸发器中干燥。将经脱盐的还原/烷基化蛋白质重悬浮在50μL消化缓冲液(100mM Tris-HCl,pH8.5)中并以1∶100的胰蛋白酶∶蛋白质比例加入胰蛋白酶(测序级,Roche)溶液。将样品在37℃孵育16小时。然后在实施进一步步骤前将胰蛋白酶消化液在-20℃保存。
(备选地)通过SDS-PAGE分离的IgA-HX8重链的凝胶中胰蛋白酶消化。将70-100μg IgA-HX8在离心蒸发器中干燥,将沉淀重悬浮在含有1∶19v/vμ-巯基乙醇的120μL Laemmli样品缓冲液(Bio-Rad)中并将所得溶液在95℃加热10分钟。将所得经还原和变性的IgA-HX8样品加至4-20%SDS-PAGE凝胶(Bio-Rad)(6泳道,20μg/泳道)并将凝胶在60mA恒定电流下运行约1小时。用考马斯蓝染料对凝胶染色。将相应于~50kDa的IgA-HX8重链的带从凝胶中切下并用脱色缓冲液(50%乙腈,50%碳酸氢铵缓冲液,pH8.5)脱色。经脱色的凝胶块在离心蒸发器中干燥并用胰蛋白酶(溶于25mM碳酸氢铵中,31.25μg/mL,pH8.5)溶液再水合。样品在37℃孵育16小时。用400μL 50%乙腈/1%TFA,然后用400μl的70%乙腈/25%25mM碳酸氢铵缓冲液/5%甲酸从凝胶提取经胰蛋白酶解的肽。将提取液合并、过滤并在离心蒸发器中干燥。所得经分离的胰蛋白解肽经C18柱体(Peptide Macro Trap,Michrom Bioresources)脱盐并在用肽-N-聚糖酶A(PNGase A)消化前在离心蒸发器中干燥。
(备选地)用胃蛋白酶消化IgA-HX8。将25μg亲和-纯化的IgA-HX8重悬浮在200μL 20mM乙酸铵缓冲液,pH3.5中。向蛋白质样品加入10μL胃蛋白酶(Roche)溶液(2mg/mL,溶于10mM HCl)并将样品在37℃孵育16小时。通过加入5μL 1M NaOH淬灭反应并将样品在95℃加热30分钟使胃蛋白酶完全失活。样品在离心蒸发器中干燥并在加入PNGase A之前重新溶解在50μL 20mM乙酸铵缓冲液(pH5.0)中。
N-连接的寡糖的酶促释放。将蛋白水解肽(用胰蛋白酶或胃蛋白酶消化后的整个消化液,或者通过RP-HPLC分离的经胰蛋白酶解的糖肽)溶解在5-50μL 20mM乙酸铵缓冲液(pH5.0)中,并加入5-10μL肽-N-糖苷酶A溶液(PNGase A,Roche)。样品在37℃孵育16小时。
从蛋白水解肽分离释放的寡糖。使蛋白水解/PNGase-A消化液通过C18柱体(Peptide Macro Trap,Michrom Bioresources;根据生产商的方法预先调节(recondition)),并收集直流级分(flow-through fraction)。用0.5mL0.1%水性TFA洗涤柱体并将洗出液与第一直流级分合并。这些级分(含有释放的寡糖)用多孔石墨炭柱体(PGC)(GlycoClean-H,Glyko)根据生产商的方法进一步纯化。用50%乙腈/0.1%TFA从PGC柱体洗脱寡糖并将其在离心蒸发器中完全干燥。将聚糖样品重新溶解在2.5μL高纯度水中并通过C18 Zip Tips(Millipore)。该C18 Zip Tips根据生产商的方法预先调节。然后经纯化的聚糖样品可用于MALDI-Tof MS分析。
胰蛋白酶解肽的液相层析分离。通过反相C18层析分离从约100μg亲和-纯化的IgA-HX8得到的胰蛋白酶解肽。Magic C18,2mmID×150mm长(Michrom Bioresources)和Perkin Elmer 200 LC系统用于分离。分离使用0.5ml/分钟的恒定流速。注射100-120μL胰蛋白酶消化混合物。用下面的梯度完成肽的分离100%溶剂A(3%乙腈/0.06%TFA)等度10分钟,0到50%溶剂B(80%乙腈/0.05%TFA)165分钟,50到100%溶剂B10分钟。之后将柱子用100%溶剂B洗涤2分钟,然后在100%溶剂A中重新平衡并用100%溶剂A洗涤5分钟。在室温下实施分离。通过205nm下的紫外吸收监视肽的洗脱。在经硅化的微量离心管中收集2-ml级分并且分离后将级分在离心蒸发器中干燥。通过MALDI-Tof MS分析前,用C18Zip Tips(Millipore)根据生产商的方法对头四个级分脱盐。将剩下的级分重新溶解在2μL 50%乙腈/0.1%TFA中并通过MALDI-Tof MS检查每个级分中的1μL物质。
所释放的N-连接的寡糖的MALDI-Tof MS。使用以reflectron模式操作的Voyager DE-STR(Applied BioSystems)MALDI-Tof质谱仪。加速电压设为20kV。栅压设为加速电压的69%。延迟时间设为215nsec。激光设置(laser setting)为约3000。每个光谱中对500个采集的数据进行平均。用下面的标准寡糖校准质量标度(GlcNAc)2(Man)5,m/z(MNa+)=1257.46;(GlcNAc)4(Man)3(Fuc),m/z(MNa+)=1485.56;(Gal)(GlcNAc)4(Man)3(Fuc),m/z(MNa+)=1647.62;(Gal)2(GlcNAc)4(Man)3(Fuc),m/z(MNa+)=1809.68。将1μL经纯化的聚糖沉积在MALDI样品板上,用1μL sDHB基质(66%乙腈中的18mg/mL 2,5-二羟基苯甲酸和66%乙腈中的15mg/mL 2-羟基-5-甲氧基苯甲酸的9∶1 v/v混合物)覆盖并空气干燥。
肽的MALDI-Tof MS。使用以reflectron模式操作的Voyager DE-STR(Applied BioSystems)MALDI-Tof质谱仪。加速电压设为20kV。栅压设为加速电压的66%。延迟时间在215到350nsec之间变动。激光设置(lasersetting)在2200到2500之间变动。每个光谱中对500个采集的数据进行平均。用下面的标准肽(Applied BioSystems)校准质量标度脱-Arg1-缓激肽,m/z904.4;血管紧张肽I,m/z1,296.6;Glu1-血-纤肽B,m/z1570.6;神经降压肽,m/z1672.9;ACTH(clip 1-17),m/z2093.0;ACTH(clip 18-39),m/z2465.1;ACTH(clip 7-38),m/z5730.6。将1μL经纯化的肽样品沉积在MALDI样品板上,用1μL CHCA基质(α-氰基-羟基肉桂酸)覆盖并空气干燥。
MALDI-Tof MS数据的分析。用Data Explorer v4.0软件(AppliedBioSystems)分析MS数据。肽和糖肽使用MassLynx v3.4软件(Micromass)将分子量和氨基酸序列归于IgA-HX8的序列。寡糖用自编软件(The DowChemical Company)解释寡糖的质谱。
实施例9.通过ESI-MS确定玉米HX8事件81(self) N269(IgAα重链的CH2区域)的聚糖谱玉米HX8的纯化。
步骤1.得到玉米胚乳的粉末产物1.玉米胚乳粉末步骤2.1×PBS,室温下搅拌1小时产物2.提取浆液步骤3.离心,5000×g,15分钟产物3.粗玉米提取物步骤4.0.22μm CA微滤产物4.经过滤的玉米提取液步骤5.亲和纯化(检查溢流(overflow),如果没有,那么丢弃)产物5.经纯化的HX8-IgA抗体亲和柱制备-抗体固定在POROS基质上。
通过在15ml锥形管中混合2ml POROS 20树脂(Applied Biosystems)制备柱子。将树脂用缓冲液(10mM磷酸盐,0.15M NaCl,pH7.2)洗并加入多克隆IgG山羊抗人IgA和多克隆IgG山羊抗人κ(都来自SouthernBiotech)各8mg并允许在室温反应30分钟。然后用15ml 1×PBS(磷酸缓冲盐溶液137mM NaCl;2.7mM KCl;10mM Na2HPO4;2mM KH2PO4;pH7.4))洗涤Ab-树脂混合物。通过加入15ml交联溶液(10ml 100mM三乙醇胺,pH8.5和117mg庚二亚氨酸二甲酯(dimethyl pimelimidate))并且缓慢摇动下孵育1小时,将抗-IgA抗体与树脂交联。通过离心除去交联溶液。通过加入5ml单乙醇胺(100mM,pH9.0)然后轻柔摇动下在室温孵育30分钟,淬灭反应。然后用15ml 1×PBS反复洗涤浆液。然后将亲和树脂通过重力填充到柱子(2.1×75mM)中。
转基因玉米的提取。将去胚(degermed)并碾磨成平均颗粒大小150μm的5克玉米粒加入50ml 1×PBS中。在室温下缓慢搅拌提取浆液1小时。然后离心(5000×g,15分钟)浆液并回收上清液。亲和纯化前过滤(0.22μm)上清液。
亲和柱纯化条件。用1×PBS(pH7.4)以1ml/分钟预平衡抗-α/抗-β亲和柱直到观察到在紫外280nm处监测到稳定的基线。将含有抗体的上清液(45ml)以0.5ml/分钟的流速应用于柱子。然后用10个柱体积的1×PBS洗涤柱子,其中再次观察到稳定的基线。用12柱体积甘氨酸(100mM,pH2.5)从柱子洗脱IgA,收集5ml级分。洗脱步骤前,每个级分管含有500μl中和缓冲液(1M TRIS-HCL,pH9.0)。然后用10个柱体积1×PBS再平衡柱子。通过280nm处的紫外吸收定量含有IgA的级分。
HX8的顺次胰蛋白酶和天冬氨酸-N消化。将250μl中的50μg亲和纯化的IgA在离心管(1.7ml低蛋白质结合缓冲液)中离心真空干燥。将沉淀重悬浮在35μl蛋白质溶解缓冲液(7.5ml 8M盐酸胍,316mg碳酸氢铵,调节到pH7.8,用水稀释到10ml终体积)中。通过加入1.75μl DTT(1M)并在75℃孵育40分钟还原重悬浮的样品。还原后,让管冷却到室温。通过加入4.2μl碘乙酸(1M,在1N NaOH中制备)烷基化样品。烷基化反应在黑暗中室温进行40分钟。通过加入1μl DDT(1M)淬灭烷基化反应。样品在C18柱体(Michrom Protein Macro Trap,Michrom Bioresources,Inc.)上脱盐并用250μl洗脱缓冲液(乙腈,0.1%TFA)洗脱。所洗脱的还原-烷基化样品通过离心真空干燥。将所得沉淀重悬浮在20μl胰蛋白酶消化缓冲液(100mM TRIS-HCL,pH8.1,10mM CaCl2)中。以1∶100(胰蛋白酶∶样品)的比例加入胰蛋白酶(测序级,Promega)并在37℃孵育16小时。将混合物在95℃加热3分钟终止反应。取10微升胰蛋白酶消化液用于随后以天冬氨酸-N蛋白酶(1∶100比例,酶∶底物,Roche)消化。将Asp-N反应混合物在30℃孵育20小时。
胰蛋白酶和胰蛋白酶+Asp-N消化的肽的液相层析和纳米电喷雾电离离子阱质谱。通过反向C18层析(Magic C18,0.02ID×150mm长,Michrom Bioresources)分离约16pmol(1μl)胰蛋白酶或者胰蛋白酶+Asp-N肽片段。使用毛细管HPLC(Agilent)进行分离,该毛细管HPLC应用50μm ID垂直管并且以流速0.3μl/分钟运行。用0%溶剂A(0.05%TFA)等度洗脱10分钟,然后使用165分钟梯度至40%溶剂B(乙腈+0.04%TFA),实施肽的分离。然后在15分钟内将梯度增加到50%溶剂B并保持在50%20分钟进行柱清洁。柱温度保持在35℃并通过215nm处的吸收和电喷雾电离质谱仪监测肽。
在安装纳米喷雾离子源(New Obiective Jnc.,Woburn,MA)的FinniganLCQTMDeca离子阱质谱仪(San Jose,CA)上进行纳米喷雾离子质谱(NESI)。针对流速3μl/分钟,电喷雾离子源以1.3-1.8kV的电势差运行。NSI源以毛细管温度135℃运行,毛细管电压为42伏特,管透镜偏置(tubelens offset)在10伏特。自动增益控制设为全MS靶8×107,Msn靶6×107,放大靶(zoom target)3×107。LC NESI-MS和LC NESI-MS/MS以自动LC/MS-LC/MS/MS模式运行,监视信号阈值并且当超过阈值标准时在基峰上进行MS/MS。如下使用离子阱参数。对所有实验使用自动增益控制运行离子阱。在该模式中,系统自动选择捕获参数以保持阱中存在的离子为恒定的预设值。对于全MS和MS/MS,所收集的“微扫描”(microscans)的数目分别为3和2。对于MS/MS信号,标准化的碰撞能力设为35%,活化Q(activation Q)为0.250。
肽和糖肽分配。使用GPMAW(Light House Data,版本5.01),和BioWorks软件(随LCQ Deca提供)将分子量和氨基酸序列归于HX8 IgA的序列。
N269(单一同位素的)的胰蛋白酶+Asp-N肽的序列。
MH+ 1948.01M2H+974.51M3H+650.01
序列DLLLGSEANLTCTLTGLR(SEQID NO20)表5.糖肽的单一同位素质量与理论质量
实施例10.植物中产生的IgA抗-HSV抗体的聚糖结构图6提供了经还原和烷基化的IgA-HX8的胰蛋白酶消化液的代表性C18-HPLC层析图。图7提供了通过胰蛋白酶消化经还原和烷基化的IgA-HX8产生的IgA-HX8 HC的HC-T13肽的糖型的代表性MALDI-Tof质谱。通过聚糖的酶促释放(PNGase-A)除去了IgA-HX8 HC的HC-T13肽的糖型的异质性(图8)。如图9中所示,观察到玉米表达的IgA-HX8 HC的HC-T13肽的两种额外的糖型。
图10提供了从IgA-HX8酶促释放的游离N-连接的聚糖的代表性MALDI-Tof MS谱。
表6提供了利用MALDI-Tof MS对玉米中表达的IgA-HX8的轻链所观察到的肽胰蛋白酶片段。总的肽质量覆盖率为100%。“L”=LC。
表6.所观察的IgA-HX8轻链的肽胰蛋白酶片段(IgA-HX8LC,事件193,的代表性肽图)
表7提供了通过MALDI-Tof质谱对玉米(事件193self)中表达的IgA-HX8的重链所观察到的肽胰蛋白酶解片段。总的肽质量覆盖率为93.8%。包括所观察的糖肽。“ND”=未检测到,“H”=HC。
表7.所观察的IgA-HX8重链的肽胰蛋白酶解片段(IgA-HX8HC,事件193,的代表性肽图)
ND=未检测
图12提供了基于MALDI-Tof质谱结果提出的、在转基因玉米表达的IgA-HX8上鉴定到的推定聚糖结构。用从IgA-HX8酶促还原的游离聚糖的MALDI-Tof质谱中相应离子的强度,估计了聚糖种类的丰度。
图16总结了转基因玉米(不同的事件)中表达的IgA-HX8的聚糖谱。
实施例11.通过胚乳来源的HX8中和HSV-2碾磨转基因玉米种子以分离胚乳。将胚乳碾磨成细小粉末并将抗体溶解于0.15MPBS中。通过低速离心使含有HX8的粗胚乳提取物澄清并且用山羊抗-人IgA亲和柱进行亲和纯化。试验胚乳提取物中和HSV-2的能力。
以96孔形式将190噬斑形成单位/孔HSV-2病毒原液与胚乳来源的人单克隆抗体HX8的连续稀释液在37℃,5%CO2中孵育1小时。用pre-CPE测定法,使用可以通过商业途径从Diagnostic Hybrids,Inc.,Athens,Ohio得到的ELVIS HSV细胞,测量HX8抗体的中和活性。该细胞系来源于幼仓鼠肾细胞(BHK),所述细胞经含有G418抗生素抗性标记的质粒和另一质粒共转染,所述另一质粒含有置于来自HSV-1UL39基因的诱导型HSV启动子后面的大肠杆菌lacZ基因,HSV-1UL39基因编码ICP6,其是HSV核糖核苷酸还原酶的大亚基(E.C.Stabell和P.D.Olivo,“分离细胞系用于检测单纯疱疹病毒的快速和灵敏的组织化学测定法中”,J.VirologicalMethods 38195-204(1992))。将ELVIS HSV细胞单层以96孔形式铺板并用抗体-病毒接种物在37℃,5%CO2中感染24小时。除去上清液并用从Diagnostic Hybrids,Inc.,Athens,Ohio购买的ELVIRA裂解缓冲液裂解细胞。通过加入从Diagnostic Hybrids,Inc.,Athens,Ohio购买的ELVIRA检测缓冲液检测β-半乳糖苷酶活性。通过分光光度计在OD570检测β-半乳糖苷酶浓度,其相应于HSV感染水平。将HX8中和的病毒百分数计算为抗体减去阴性对照的百分数。用该测定法所得的结果也包括在
图11中,该结果表明在给定病毒浓度下,该抗体在1μg/ml下完全中和该病毒。
II.抗-双整联蛋白抗体的植物生产的实例除了此处描述的,使用上面详述的所有基本实验方案,包括与质粒构建(实施例1和2)、载体构建(实施例3和4)和转化和再生(实施例6)有关的那些方案,在植物细胞、植物愈伤组织和全株植物中产生IgG抗体。使用这些方法产生的IgG抗体根据实施例5和7-11中提供的基本方案进行分子和生物化学分析。
实施例12.用于产生IgG的质粒和载体用于这些实验中的特异IgG是针对整联蛋白受体αVβ3和αVβ5的IgG(也称作抗-αVβ3,αVβ5双整联蛋白抗体)。
使用下面的质粒(“HC”=重链;“LC”=轻链)
实施例13.IgG的植物细胞转化和再生使用WHISKERSTM转化方法通过pDAB1472、pDAB1473、pDAB1474或pDAB1475直接-DNA递送,处理玉米近交系“HiII”的植物细胞。这些质粒在用于驱动编码抗体的基因表达的调节元件上不同,以作为一项“试验”来了解哪种元件组合将导致抗体的最高表达水平和积累。
“大规模”WHISKERSTM方法每次利用约18ml压紧的植物细胞(Petolino等人,植物分析的分子方法,Genetic Transformation of Plants,卷23,147-158页,Springer-Verlag,Berlin(2003))。种植抗-双整联蛋白转化植物并通过近交玉米系“5XH751”传粉以便产生子代种子,分析子代种子的抗体生产。
实施例14.估计IgG的转基因拷贝数用Third Wave Molecular Diagnostics的Invader试验平台预测抗-双整联蛋白构建体的转基因拷贝数。该方法不像用于上面讨论的IgA方案的方法,是基于杂交试验而不是聚合酶的方法。将具有转录物的1-2份拷贝的植物细胞再生用于进一步试验。
实施例15.经纯化的IgG的还原和羧甲基化,然后蛋白水解取25μL样品等分,通过MALDI MS测量“完整”蛋白质的质量。使用离心蒸发器将剩余的蛋白质溶液在硅化微量离心管中完全干燥。向干燥蛋白质加入180μL蛋白质溶解缓冲液(6M盐酸胍/0.4M碳酸氢铵,pH7.8)并通过抽吸动作混合样品以实现充分溶解。向管中加入20μL 100mMDTT(还原试剂)。
将管密封、涡旋,并在65℃孵育1小时。然后让管冷却到室温,离心30秒,并向管中加入40μL 200mM IAA(烷基化剂)溶液。将管在黑暗中室温下孵育1小时。加入60μL DTT溶液以消耗未反应的IAA,并允许管在室温静置30分钟。
如下进行经还原/烷基化的蛋白质样品的脱盐。将蛋白质捕获柱体(Michrom BioResources,目录号004-25108-53)用2×500μL 100%乙腈(“ACN”)/0.1%TFA洗涤并用500μL 2%ACN/0.1%TFA平衡。向还原/烷基化的蛋白质溶液加入4μL ACN和0.25μL TFA(至终浓度为2%ACN和0.2%TFA)并将该溶液上样至蛋白质捕获柱体。将含有还原/烷基化的蛋白质的管用100μL 2%ACN/0.1%TFA冲洗并将冲洗液上样至柱体。用500μL 2%ACN/0.1%TFA洗涤结合蛋白质的蛋白质捕获柱体。将经脱盐的蛋白质用400μL 80%ACN/0.1%TFA洗脱到0.6mL硅化微量离心管中。
如下用胰蛋白酶消化经脱盐的蛋白质样品。将样品在离心蒸发器中完全干燥,并重新溶解在100μL 100mM Tris缓冲液(pH8-8.5)中。向管中加入50μL胰蛋白酶溶液(Roche,目录号1-418-025;临消化步骤前将25μg溶于0.5ml 25mM碳酸氢铵缓冲液中),并将样品在37℃孵育16小时。消化后,在HPLC分离和/或MALDI MS分析前将样品在-20℃保存。
实施例16.IgG胰蛋白酶消化物的HPLC分级分离系统设置
HPLC系统Hitachi LC(L-7100泵,L-7200自动进样器,L-7420UV/Vis检测器)。
柱Magic C18,2.0mm(ID)×150mm(Michrom BioResources,目录号901-61221-00)。
紫外检测205nm。
自动注射使用200μL样品环;注射体积100μL流速0.5mL/分钟,恒速。
反压读数应该为约2050-2100psi(在100%A)。
流动相A3%ACN,97%Milli-Q水,0.06%TFA。
B80%ACN,20%Milli-Q水,0.05%TFA。
方法
在硅化的微量离心管中收集1ml级分并将级分于分离后在离心蒸发器中干燥。用Gilson FC-203级分收集器收集级分。
实施例17.酶促去糖基化(PNGase-A步骤)在经分离的胰蛋白酶消化液中,通过MALDI MS鉴定含有糖肽的级分。将这些级分中的剩余物质(~50%)合并,在离心蒸发器中干燥,并重新溶解在10μL 20mM乙酸铵缓冲液(pH5.0)中。加入10μL肽-N-糖苷酶A(PNGase-A)溶液(Roche,目录号1-642-995),并将管在37℃孵育16小时。
实施例18.释放的N-聚糖的纯化使蛋白水解/PNGase-A消化液通过C18柱体(Peptide Macro Trap,Michrom Bioresources(目录号004-25108-52),根据生产商的方法预先调节)并收集直流级分。用0.5mL 0.1%水性TFA洗涤柱体并将洗涤液与第一直流级分合并。这些级分含有释放的寡糖,用E-柱体(QA-Bio,目录号CE001,批号A2AA-01)根据生产商的方法进一步纯化这些级分。用50%乙腈/0.1%TFA从E-柱体洗脱寡糖并将其在离心蒸发器中完全干燥。将聚糖样品重新溶解在2.5μL高纯度Milli-Q水中并根据生产商的方法通过C18 Zip Tips(Millipore)。经纯化的聚糖样品可用于MALDI MS分析。
用100%ACN/0.1%TFA洗脱C18柱体上捕获的脱糖基化的肽,将其在离心蒸发器中浓缩,并通过MALDI MS检查。
实施例19.MALDI MS和PSD以正reflectron模式运行的Voyager DE-STR(Applied BioSystems,serial no.4260)MALDI-Tof质谱仪被用于得到肽和寡糖(聚糖)的数据。仪器以正线性模式运行以得到完整蛋白质的数据。
将分离的胰蛋白酶消化液的头4个HPLC级分(在层析图前面洗脱并含有盐的级分)溶解在10μL 0.1%TFA中并合并;根据标准方案用C18 ziptips对肽脱盐。将剩余的HPLC级分溶解在3μL 50%ACN/0.1%TFA中,并合并一些级分。将每种级分(合并后)之50%沉积在MALDI板(1.5μL)上,用1μL CHCA基质溶液覆盖并空气干燥。对发现含有糖肽的级分,剩余的50%用上面描述的PNGase-A进一步处理。
用于得到肽的MALDI谱的设置。加速电压设为20kV。栅压设为加速电压的66%。延迟时间在215到350nsec之间变动。激光设置在2200到3000之间变动。每个光谱中对500个采集的数据进行平均。用下面的标准肽(Applied BioSystems)校准质量标度脱-Arg1-缓激肽,m/z904.4;血管紧张肽I,m/z1,296.6;Glu1-血纤肽B,m/z1570.6;神经降压肽,m/z1672.9;ACTH(clip1-17),m/z2093.0;ACTH(clip18-39),m/z2465.1;ACTH(clip7-38),m/z5730.6。
用镜面电压比(mirror voltage ratio)1.12记录MALDI-PSD谱;使用下面的镜面比(mirror ratio)1、0.85、0.75、0.65、0.55、0.4、0.3、0.2、0.1、0.05。
用于得到寡糖(聚糖)的MALDI谱的设置。加速电压设为20kV。栅压设为加速电压的69%。延迟时间设为215nsec。激光设置为约3000。每个光谱中对500个采集的数据进行平均。用下面的标准寡糖校准质量标度(GlcNAc)2(Man)5,m/z(MNa+)=1257.46;(GlcNAc)4(Man)3(Fuc),m/z(MNa+)=1485.56;(Gal)(GlcNAc)4(Man)3(Fuc),m/z(MNa+)=1647.62;(Gal)2(GlcNAc)4(Man)3(Fuc),m/z(MNa+)=1809.68。将1μL经纯化的聚糖样品沉积在MALDI样品板上,用1μL sDHB基质(66%乙腈中的18mg/mL2,5-二羟基苯甲酸和66%乙腈中的15mg/mL2-羟基-5-甲氧基苯甲酸的9∶1 v/v混合物)覆盖并空气干燥。
用于得到完整蛋白质的MALDI谱的条件。仪器以正线性模式运行。加速电压设为25kV。栅压设为加速电压的89%。延迟时间为750到1500nsec。激光设置为约3300。低质量阈(mass gate)设为5000Da。在每一光谱中对两组各500个采集数据进行平均。用下面的标准(Sequazyme IgG1,APPlied BioSystems,目录号GEN602151)校准质量标度m/z74249,双带电的Sequazyme IgG1单体;m/z148500,单带电的Sequazyme IgG1单体。
用下面的方法进行质谱前的蛋白质样品脱盐。将C4 zip-tip(Millipore)先用50%CAN处理,然后用0.1%TFA平衡;使蛋白质样品的等分试样通过zip-tip 10次,然后用过的溶液返回到最初的小瓶中;将结合蛋白质的zip-tip用0.1%TFA洗涤并用3μL 80%ACN/0.1%TFA将蛋白质直接洗脱到MALDI板上(逐滴地)。将经脱盐的蛋白质样品用1μL基质(芥子酸,来自Sequazyme试剂盒,Applied BioSystems,目录号P2-3143-00)覆盖并空气干燥。
MALDI MS数据的分析。用Data Explorer v4.0软件(AppliedBioSystems)分析MALDI MS和MALDI-PSD数据。使用MassLynx v3.4软件(Micromass)将肽和糖肽的分子量和氨基酸序列归于IgG样品的序列。
实施例20.完整IgG的MALDI MS针对三个独立转化事件(即,事件660、661和663)(从玉米表达的IgG)和CHO-表达的IgG(数据未显示),用“完整”亲和-纯化的IgG蛋白质的样品进行MALDI MS实验。
测定的抗体轻链(LC)质量在理论平均质量(M=23486 Da)的~1.0%以内。完整装配的抗体的测定质量比预计的理论平均质量(对于未糖基化蛋白质,M=145612 Da)高约1.7到2.0%。该差异可能通过重链的糖基化来解释。
总的说来,所有四个“完整”抗体样品(三个玉米表达的和一个CHO-表达的)的MALDI质谱是装配的IgG的典型质谱。
实施例21.肽作图结果针对所有三种玉米表达的IgG样品和一种CHO-表达的IgG样品(数据未显示)得到肽作图结果。针对所有样品还得到了序列质量覆盖度(组合的胰蛋白酶和Asp-N肽图)和胰蛋白酶肽图(数据未显示)。简言之,对于所有抗体样品中的重链和轻链,总体序列质量覆盖度为约90%到约100%。检测了所有重链和轻链的N-末端片段。在所有样品中,重链的N-末端片段含有pyro-Glu作为N-末端残基,其是抗体中典型的翻译后修饰。还检测到与痕量未加工的N-末端重链片段(含有Gln作为N-末端残基)一致的弱信号。在所有样品中检测了轻链的C-末端片段。在事件660和663的玉米-表达的抗体样品中,重链的C-末端片段由完全大小的C-末端片段(以Lys449作为C-末端残基)和Lys449缺失的C-末端片段(“无K”)的混合物代表。在C1-661样品中仅检测到C-末端重链片段的截断(“无K”,即没有Lys 449)的形式。在CHO-表达的抗体中仅检测到C-末端重链片段的截断(“无K”,即没有Lys 449)的形式。通过MALDI-PSD实验证实了所有N-末端胰蛋白酶消化片段和重链C-末端片段的序列。
实施例22.糖基化谱制作检查了三种玉米表达的和一种CHO-表达的IgG抗体的一级结构和糖基化并相互比较。在
图19(事件660)、图21(事件661)、图23(事件663)和图25(CHO-表达)中提供了抗体样品中观察到的N-连接的聚糖(作为糖肽)的完整谱。如上面讨论的,岩藻糖基化对于哺乳动物产生的糖蛋白为α1,6,对于植物产生的糖蛋白是α1,3。
在图20A-B中(为事件660),图22A-C中(为事件661),图24A-B中(为事件663),图26A-B中(为CHO表达)提供了代表性MALDI-TOF MS谱。图22D提供了从H-T27糖肽释放的N-聚糖的质谱结果。该MALDI质谱中的强度与中性N-聚糖的丰度基本上成比例。所有的完整抗体样品的MALDI质谱均是装配的IgG的典型质谱。
在玉米表达的重链样品的Asn299上观察到的两种最丰富的聚糖具有组成HexNAc2-Hex2-Xyl-Fuc(或N2H2XF)和HexNAc2-Hex3-XyI-Fuc(或N2H3XF),而CHO-表达的重链样品中最丰富的聚糖具有组成HexNAc4-Hex3-Fuc(或N4H3F)和HexNAc4-Hex4-Fuc(或N4H4F)。由单一HexNAc单糖修饰的重链的水平看起来在玉米表达的抗体样品中比在CHO-表达的抗体样品中更高。CHO-表达的样品中的N-糖基化似乎比玉米表达的抗体样品中的糖基化具有更大异质性(多样性)。
通过对该工作中检查的所有抗体样品的MALDI-PSD实验,证实了H-T27重链胰蛋白酶解片段(即,含有Asn299糖基化位点的片段)和其变体(用单一HexNac单糖修饰的变体)的序列。然而,作为游离N-聚糖观察到的糖型的信号强度与作为糖肽观察到的信号强度稍有不同。在H-T27肽糖型的MALDI质谱中,具有聚糖HexNAc2-Hex2-Xyl-Fuc(或N2H2XF)和HexNAc2-Hex3-Xyl-Fuc(或N2H3XF)的糖肽产生最强的信号。相比,在酶促释放的游离寡糖的MALDI质谱中,聚糖HexNAc2-Hex3-Xyl(或N2H3X)、HexNAc2-Hex3-Xyl-Fuc(或N2H3XF)和HexNAc2-Hex5(或N2H5)表现为主要种类。根据文献报导(D.Harvey,Mass Spectrometry Reviews 18349-451(1999))和我们自己的发现,游离聚糖的MALDI MS应该给出N-聚糖的相对量的通常更准确的估计。在任一情况中,通过两种方法(即,糖肽和游离聚糖),均观察到N-聚糖HexNAc2-Hex3-Xyl-Fuc(或N2H3XF)是最丰富的种类。
在本工作中检查的抗体样品中没有发现O-连接的糖基化证据。
仅仅为了清楚地理解而给出了前面的详细描述,并且不应将所述描述理解为不必要的限制,因为修饰对于本领域技术人员是显而易见的。
尽管本发明已经联系其特定实施方案进行了描述,但是应该理解能够进行其它修饰并且本申请旨在覆盖一般性地按照本发明的原则对本发明作出的任何改变、应用或者改编,并且所述改变、应用或者改编包括与本公开的偏离,所述偏离在本发明所属领域的公知和或者常规实践的范围内并且可应用于此前提出的基本特征并且落入所附权利要求的范围之内。
序列表<110>陶氏化学公司(The Dow Chemical Company)美国陶氏益农公司(Dow Agrosciences,LLC)<120>岩藻糖基化降低的免疫球蛋白的植物生产<130>038136-5001-CA<150>US60/429,385<151>2002-11-27<150>PCT/US03/037905<151>2003-11-28<160>85<170>PatentIn version3.1<210>1<211>1494<212>DNA<213>单纯疱疹病毒<220>
<221>CDS<222>(1)..(1494)<220>
<221>misc_feature<223>HSV重链序列<400>1atg gga tgg agc tgg atc ttt ctc ttc ctc ctg tca gga gct gca ggt 48Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly1 5 10 15gtc cat tgc cag gtt cag ctc gtg cag tca ggt gct gag gtg aag aag 96Val His Cys Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys20 25 30cct ggc tcc tcg gtg aag gtc tcc tgc aag gct tct gga ggt tcc ttc144Pro Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Ser Phe35 40 45agc tcc tat gct atc aac tgg gtg agg caa gct cct gga caa ggg crt192Ser Ser Tyr Ala Ile Asn Trp Val Arg Gln Ala Pro Gly Gln Gly Leu50 55 60gag tgg atg gga ggg ctc atg cct atc ttt ggg aca aca aac tac gcg240Glu Trp Met Gly Gly Leu Met Pro Ile Phe Gly Thr Thr Asn Tyr Ala65 70 75 80cag aag ttc cag gac agg ctc acg att acc gcg gac gta tcc acg agt288Gln Lys Phe Gln Asp Arg Leu Thr Ile Thr Ala Asp Val Ser Thr Ser85 90 95aca gcc tac atg caa ctg agc ggc ctg aca tat gaa gac acg gcc atg336Thr Ala Tyr Met Gln Leu Ser Gly Leu Thr Tyr Glu Asp Thr Ala Met
100 105 110tat tac tgt gcg aga gtt gcc tac atg ctt gaa cct acc gtc act gca 384Tyr Tyr Cys Ala Arg Val Ala Tyr Met Leu Glu Pro Thr Val Thr Ala115 120 125ggt ggt ttg gac gtc tgg ggc caa ggg acc ttg gtc acc gtc tcc tcc 432Gly Gly Leu Asp Val Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser130 135 140gca tcc ccg acc agc ccg aag gtc ttc ccg ctg agc ctc tgt agc acc 480Ala Ser Pro Thr Ser Pro Lys Val Phe Pro Leu Ser Leu Cys Ser Thr145 150 155 160cag cca gat ggg aac gtg gtc atc gcc tgc ctg gtc cag ggc ttc ttc 528Gln Pro Asp Gly Asn Val Val Ile Ala Cys Leu Val Gln Gly Phe Phe165 170 175cct cag gag cca ctc agt gtg acc tgg agc gaa agc gga cag ggc gtg 576Pro Gln Glu Pro Leu Ser Val Thr Trp Ser Glu Ser Gly Gln Gly Val180 185 190acc gcc agg aac ttc cca ccc agc cag gat gcc tcc gga gac ctg tac 624Thr Ala Arg Asn Phe Pro Pro Ser Gln Asp Ala Ser Gly Asp Leu Tyr195 200 205acc acg tcc agc cag ctg acc ctt ccg gcc aca cag tgc cta gcg ggc 672Thr Thr Ser Ser Gln Leu Thr Leu Pro Ala Thr Gln Cys Leu Ala Gly210 215 220aag tcc gtg aca tgc cac gtg aag cac tac acg aat ccc agc cag gat 720Lys Ser Val Thr Cys His Val Lys His Tyr Thr Asn Pro Ser Gln Asp225 230 235 240gtg act gtg ccc tgc cca gtt ccc tca act cca cct acc cca tct ccc 768Val Thr Val Pro Cys Pro Val Pro Ser Thr Pro Pro Thr Pro Ser Pro245 250 255tcg act cca cct acc cca tct ccc tca tgc tgc cac ccc agg ctg tca 816Ser Thr Pro Pro Thr Pro Ser Pro Ser Cys Cys His Pro Arg Leu Ser260 265 270ctg cac agg cct gcc ctc gag gac ctg ctc tta ggt tcg gaa gcg aac 864Leu His Arg Pro Ala Leu Glu Asp Leu Leu Leu Gly Ser Glu Ala Asn275 280 285ctc acg tgc aca ctc acc ggc ctg aga gat gcg tca ggt gtc acc ttc 912Leu Thr Cys Thr Leu Thr Gly Leu Arg Asp Ala Ser Gly Val Thr Phe290 295 300acc tgg acg ccc tca agt ggt aag agc gct gtt caa ggc cca cct gag 960Thr Trp Thr Pro Ser Ser Gly Lys Ser Ala Val Gln Gly Pro Pro Glu305 310 315 320cgt gac ctc tgt ggc tgc tac agc gtg tcc agt gtc ctt ccg ggc tgt 1008Arg Asp Leu Cys Gly Cys Tyr Ser Val Ser Ser Val Leu Pro Gly Cys325 330 335gcc gag cct tgg aat cat ggg aag acc ttc act tgc act gct gcc tac 1056Ala Glu Pro Trp Asn His Gly Lys Thr Phe Thr Cys Thr Ala Ala Tyr340 345 350
ccc gag agc aag acc ccg cta acc gcc acc ctc tcg aaa tcc ggc aac 1104Pro Glu Ser Lys Thr Pro Leu Thr Ala Thr Leu Ser Lys Ser Gly Asn355 360 365aca ttc cgg ccc gag gtc cac ctg ctg ccg ccg ccg tcg gag gag ctg 1152Thr Phe Arg Pro Glu Val His Leu Leu Pro Pro Pro Ser Glu Glu Leu370 375 380gcc ctg aac gag ctg gtg acg ctg acg tgc ctg gcg cgc ggc ttc agc 1200Ala Leu Asn Glu Leu Val Thr Leu Thr Cys Leu Ala Arg Gly Phe Ser385 390 395 400ccc aag gac gtg ctg gtt cgc tgg ctg cag ggc tca cag gag ctg cct 1248Pro Lys Asp Val Leu Val Arg Trp Leu Gln Gly Ser Gln Glu Leu Pro405 410 415agg gag aag tac ctg act tgg gca tcc cgg cag gag ccc agc caa ggc 1296Arg Glu Lys Tyr Leu Thr Trp Ala Ser Arg Gln Glu Pro Ser Gln Gly420 425 430acc acc acc ttc gct gtg acc tcg ata ctg cgc gtg gca gcc gag gac 1344Thr Thr Thr Phe Ala Val Thr Ser Ile Leu Arg Val Ala Ala Glu Asp435 440 445tgg aag aag ggt gac acc ttc tcc tgc atg gtg ggc cac gag gcc ctt 1392Trp Lys Lys Gly Asp Thr Phe Ser Cys Met Val Gly His Glu Ala Leu450 455 460ccg ctg gcc ttc aca cag aag acc atc gac cgc ttg gcg ggt aaa ccc 1440Pro Leu Ala Phe Thr Gln Lys Thr Ile Asp Arg Leu Ala Gly Lys Pro465 470 475 480acc cat gtc aat gtg tct gtt gtc atg gcg gag gtg gac ggc acc tgc 1488Thr His Val Asn Val Ser Val Val Met Ala Glu Val Asp Gly Thr Cys485 490 495tac tga 1494Tyr<210>2<211>497<212>PRT<213>单纯疱疹病毒<400>2Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly1 5 10 15Val His Cys Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys20 25 30Pro Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Ser Phe35 40 45Ser Ser Tyr Ala Ile Asn Trp Val Arg Gln Ala Pro Gly Gln Gly Leu50 55 60
Glu Trp Met Gly Gly Leu Met Pro Ile Phe Gly Thr Thr Asn Tyr Ala65 70 75 80Gln Lys Phe Gln Asp Arg Leu Thr Ile Thr Ala Asp Val Ser Thr Ser85 90 95Thr Ala Tyr Met Gln Leu Ser Gly Leu Thr Tyr Glu Asp Thr Ala Met100 105 110Tyr Tyr Cys Ala Arg Val Ala Tyr Met Leu Glu Pro Thr Val Thr Ala115 120 125Gly Gly Leu Asp Val Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser130 135 140Ala Ser Pro Thr Ser Pro Lys Val Phe Pro Leu Ser Leu Cys Ser Thr145 150 155 160Gln Pro Asp Gly Asn Val Val Ile Ala Cys Leu Val Gln Gly Phe Phe165 170 175Pro Gln Glu Pro Leu Ser Val Thr Trp Ser Glu Ser Gly Gln Gly Val180 185 190Thr Ala Arg Asn Phe Pro Pro Ser Gln Asp Ala Ser Gly Asp Leu Tyr195 200 205Thr Thr Ser Ser Gln Leu Thr Leu Pro Ala Thr Gln Cys Leu Ala Gly210 215 220Lys Ser Val Thr Cys His Val Lys His Tyr Thr Asn Pro Ser Gln Asp225 230 235 240Val Thr Val Pro Cys Pro Val Pro Ser Thr Pro Pro Thr Pro Ser Pro245 250 255Ser Thr Pro Pro Thr Pro Ser Pro Ser Cys Cys His Pro Arg Leu Ser260 265 270Leu His Arg Pro Ala Leu Glu Asp Leu Leu Leu Gly Ser Glu Ala Asn275 280 285Leu Thr Cys Thr Leu Thr Gly Leu Arg Asp Ala Ser Gly Val Thr Phe290 295 300
Thr Trp Thr Pro Ser Ser Gly Lys Ser Ala Val Gln Gly Pro Pro Glu305 310 315 320Arg Asp Leu Cys Gly Cys Tyr Ser Val Ser Ser Val Leu Pro Gly Cys325 330 335Ala Glu Pro Trp Asn His Gly Lys Thr Phe Thr Cys Thr Ala Ala Tyr340 345 350Pro Glu Ser Lys Thr Pro Leu Thr Ala Thr Leu Ser Lys Ser Gly Asn355 360 365Thr Phe Arg Pro Glu Val His Leu Leu Pro Pro Pro Ser Glu Glu Leu370 375 380Ala Leu Asn Glu Leu Val Thr Leu Thr Cys Leu Ala Arg Gly Phe Ser385 390 395 400Pro Lys Asp Val Leu Val Arg Trp Leu Gln Gly Ser Gln Glu Leu Pro405 410 415Arg Glu Lys Tyr Leu Thr Trp Ala Ser Arg Gln Glu Pro Ser Gln Gly420 425 430Thr Thr Thr Phe Ala Val Thr Ser Ile Leu Arg Val Ala Ala Glu Asp435 440 445Trp Lys Lys Gly Asp Thr Phe Ser Cys Met Val Gly His Glu Ala Leu450 455 460Pro Leu Ala Phe Thr Gln Lys Thr Ile Asp Arg Leu Ala Gly Lys Pro465 470 475 480Thr His Val Asn Val Ser Val Val Met Ala Glu Val Asp Gly Thr Cys485 490 495Tyr<210>3<211>57<212>DNA<213>人工序列<220>
<223>重链信号肽<220>
<221>CDS<222>(1)..(57)<400>3atg gga tgg agc tgg atc ttt ctc ttc ctc ctg tca gga gct gca ggt 48Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly1 5 10 15gtc cat tgc 57Val His Cys<210>4<211>19<212>PRT<213>人工序列<220>
<223>重链信号肽<400>4Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly1 5 10 15Val His Cys<210>5<211>1368<212>DNA<213>人工序列<220>
<223>成熟重链序列<220>
<221>CDS<222>(1)..(1368)<400>5cag gtt cag ctc gtg cag tca ggt gct gag gtg aag aag cct ggc tcc 48Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser1 5 10 15tcg gtg aag gtc tcc tgc aag gct tct gga ggt tcc ttc agc tcc tat 96Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Ser Phe Ser Ser Tyr20 25 30gct atc aac tgg gtg agg caa gct cct gga caa ggg ctt gag tgg atg144Ala Ile Asn Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met35 40 45gga ggg ctc atg cct atc ttt ggg aca aca aac tac gcg cag aag ttc192Gly Gly Leu Met Pro Ile Phe Gly Thr Thr Asn Tyr Ala Gln Lys Phe50 55 60cag gac agg ctc acg att acc gcg gac gta tcc acg agt aca gcc tac240
Gln Asp Arg Leu Thr Ile Thr Ala Asp Val Ser Thr Ser Thr Ala Tyr65 70 75 80atg caa ctg agc ggc ctg aca tat gaa gac acg gcc atg tat tac tgt 288Met Gln Leu Ser Gly Leu Thr Tyr Glu Asp Thr Ala Met Tyr Tyr Cys85 90 95gcg aga gtt gcc tac atg ctt gaa cct acc gtc act gca ggt ggt ttg 336Ala Arg Val Ala Tyr Met Leu Glu Pro Thr Val Thr Ala Gly Gly Leu100 105 110gac gtc tgg ggc caa ggg acc ttg gtc acc gtc tcc tcc gca tcc ccg 384Asp Val Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Pro115 120 125acc agc ccg aag gtc ttc ccg ctg agc ctc tgt agc acc cag cca gat 432Thr Ser Pro Lys Val Phe Pro Leu Ser Leu Cys Ser Thr Gln Pro Asp130 135 140ggg aac gtg gtc atc gcc tgc ctg gtc cag ggc ttc ttc cct cag gag 480Gly Asn Val Val Ile Ala Cys Leu Val Gln Gly Phe Phe Pro Gln Glu145 150 155 160cca ctc agt gtg acc tgg agc gaa agc gga cag ggc gtg acc gcc agg 528Pro Leu Ser Val Thr Trp Ser Glu Ser Gly Gln Gly Val Thr Ala Arg165 170 175aac ttc cca ccc agc cag gat gcc tcc gga gac ctg tac acc acg tcc 576Asn Phe Pro Pro Ser Gln Asp Ala Ser Gly Asp Leu Tyr Thr Thr Ser180 185 190agc cag ctg acc ctt ccg gcc aca cag tgc cta gcg ggc aag tcc gtg 624Ser Gln Leu Thr Leu Pro Ala Thr Gln Cys Leu Ala Gly Lys Ser Val195 200 205aca tgc cac gtg aag cac tac acg aat ccc agc cag gat gtg act gtg 672Thr Cys His Val Lys His Tyr Thr Asn Pro Ser Gln Asp Val Thr Val210 215 220ccc tgc cca gtt ccc tca act cca cct acc cca tct ccc tcg act cca 720Pro Cys Pro Val Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro225 230 235 240cct acc cca tct ccc tca tgc tgc cac ccc agg ctg tca ctg cac agg 768Pro Thr Pro Ser Pro Ser Cys Cys His Pro Arg Leu Ser Leu His Arg245 250 255cct gcc ctc gag gac ctg ctc tta ggt tcg gaa gcg aac ctc acg tgc 816Pro Ala Leu Glu Asp Leu Leu Leu Gly Ser Glu Ala Asn Leu Thr Cys260 265 270aca ctc acc ggc ctg aga gat gcg tca ggt gtc acc ttc acc tgg acg 864Thr Leu Thr Gly Leu Arg Asp Ala Ser Gly Val Thr Phe Thr Trp Thr275 280 285ccc tca agt ggt aag agc gct gtt caa ggc cca cct gag cgt gac ctc 912Pro Ser Ser Gly Lys Ser Ala Val Gln Gly Pro Pro Glu Arg Asp Leu290 295 300tgt ggc tgc tac agc gtg tcc agt gtc ctt ccg ggc tgt gcc gag cct 960Cys Gly Cys Tyr Ser Val Ser Ser Val Leu Pro Gly Cys Ala Glu Pro305 310 315 320
tgg aat cat ggg aag acc ttc act tgc act gct gcc tac ccc gag agc 1008Trp Asn His Gly Lys Thr Phe Thr Cys Thr Ala Ala Tyr Pro Glu Ser325 330 335aag acc ccg cta acc gcc acc ctc tcg aaa tcc ggc aac aca ttc cgg 1056Lys Thr Pro Leu Thr Ala Thr Leu Ser Lys Ser Gly Asn Thr Phe Arg340 345 350ccc gag gtc cac ctg ctg ccg ccg ccg tcg gag gag ctg gcc ctg aac 1104Pro Glu Val His Leu Leu Pro Pro Pro Ser Glu Glu Leu Ala Leu Asn355 360 365gag ctg gtg acg ctg acg tgc ctg gcg cgc ggc ttc agc ccc aag gac 1152Glu Leu Val Thr Leu Thr Cys Leu Ala Arg Gly Phe Ser Pro Lys Asp370 375 380gtg ctg gtt cgc tgg ctg cag ggc tca cag gag ctg cct agg gag aag 1200Val Leu Val Arg Trp Leu Gln Gly Ser Gln Glu Leu Pro Arg Glu Lys385 390 395 400tac ctg act tgg gca tcc cgg cag gag ccc agc caa ggc acc acc acc 1248Tyr Leu Thr Trp Ala Ser Arg Gln Glu Pro Ser Gln Gly Thr Thr Thr405 410 415ttc gct gtg acc tcg ata ctg cgc gtg gca gcc gag gac tgg aag aag 1296Phe Ala Val Thr Ser Ile Leu Arg Val Ala Ala Glu Asp Trp Lys Lys420 425 430ggt gac acc ttc tcc tgc atg gtg ggc cac gag gcc ctt ccg ctg gcc 1344Gly Asp Thr Phe Ser Cys Met Val Gly His Glu Ala Leu Pro Leu Ala435 440 445ttc aca cag aag acc atc gac cgc 1368Phe Thr Gln Lys Thr Ile Asp Arg450 455<210>6<211>456<212>PRT<213>人工序列<220>
<223>成熟重链序列<400>6Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser1 5 10 15Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Ser Phe Ser Ser Tyr20 25 30Ala Ile Asn Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met35 40 45Gly Gly Leu Met Pro Ile Phe Gly Thr Thr Asn Tyr Ala Gln Lys Phe
50 55 60Gln Asp Arg Leu Thr Ile Thr Ala Asp Val Ser Thr Ser Thr Ala Tyr65 70 75 80Met Gln Leu Ser Gly Leu Thr Tyr Glu Asp Thr Ala Met Tyr Tyr Cys85 90 95Ala Arg Val Ala Tyr Met Leu Glu Pro Thr Val Thr Ala Gly Gly Leu100 105 110Asp Val Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Pro115 120 125Thr Ser Pro Lys Val Phe Pro Leu Ser Leu Cys Ser Thr Gln Pro Asp130 135 140Gly Asn Val Val Ile Ala Cys Leu Val Gln Gly Phe Phe Pro Gln Glu145 150 155 160Pro Leu Ser Val Thr Trp Ser Glu Ser Gly Gln Gly Val Thr Ala Arg165 170 175Asn Phe Pro Pro Ser Gln Asp Ala Ser Gly Asp Leu Tyr Thr Thr Ser180 185 190Ser Gln Leu Thr Leu Pro Ala Thr Gln Cys Leu Ala Gly Lys Ser Val195 200 205Thr Cys His Val Lys His Tyr Thr Asn Pro Ser Gln Asp Val Thr Val210 215 220Pro Cys Pro Val Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro225 230 235 240Pro Thr Pro Ser Pro Ser Cys Cys His Pro Arg Leu Ser Leu His Arg245 250 255Pro Ala Leu Glu Asp Leu Leu Leu Gly Ser Glu Ala Asn Leu Thr Cys260 265 270Thr Leu Thr Gly Leu Arg Asp Ala Ser Gly Val Thr Phe Thr Trp Thr275 280 285Pro Ser Ser Gly Lys Ser Ala Val Gln Gly Pro Pro Glu Arg Asp Leu290 295 300
Cys Gly Cys Tyr Ser Val Ser Ser Val Leu Pro Gly Cys Ala Glu Pro305 310 315 320Trp Asn His Gly Lys Thr Phe Thr Cys Thr Ala Ala Tyr Pro Glu Ser325 330 335Lys Thr Pro Leu Thr Ala Thr Leu Ser Lys Ser Gly Asn Thr Phe Arg340 345 350Pro Glu Val His Leu Leu Pro Pro Pro Ser Glu Glu Leu Ala Leu Asn355 360 365Glu Leu Val Thr Leu Thr Cys Leu Ala Arg Gly Phe Ser Pro Lys Asp370 375 380Val Leu Val Arg Trp Leu Gln Gly Ser Gln Glu Leu Pro Arg Glu Lys385 390 395 400Tyr Leu Thr Trp Ala Ser Arg Gln Glu Pro Ser Gln Gly Thr Thr Thr405 410 415Phe Ala Val Thr Ser Ile Leu Arg Val Ala Ala Glu Asp Trp Lys Lys420 425 430Gly Asp Thr Phe Ser Cys Met Val Gly His Glu Ala Leu Pro Leu Ala435 440 445Phe Thr Gln Lys Thr Ile Asp Arg450 455<210>7<211>69<212>DNA<213>人工序列<220>
<223>重链尾片<220>
<221>CDS<222>(1)..(69)<400>7ttg gcg ggt aaa ccc acc cat gtc aat gtg tct gtt gtc atg gcg gag 48Leu Ala Gly Lys Pro Thr His Val Asn Val Ser Val Val Met Ala Glu1 5 10 15gtg gac ggc acc tgc tac tga 69Val Asp Gly Thr Cys Tyr20
<2l0>8<211>22<212>PRT<213>人工序列<220>
<223>重链尾片<400>8Leu Ala Gly Lys Pro Thr His Val Asn Val Ser Val Val Met Ala Glu1 5 10 15Val Asp Gly Thr Cys Tyr20<210>9<211>702<212>DNA<213>单纯疱疹病毒<220>
<221>CDS<222>(1)..(702)<220>
<221>misc_feature<223>HSV轻链序列<400>9atg gga tgg tcc tgg atc ttt ctc ttc ctt ctg tca gga gct gca ggt48Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly1 5 10 15gtc cac tgc gag atc gtg ctc acg cag tct cca ggc acc ctg tct ttg96Val His Cys Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu20 25 30tcg cca ggg gaa cgt gcc acc ctc tcc tgc cgg gcc agt cag tcc gtt 144Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val35 40 45tcc agc gcg tac ctt gcc tgg tac cag cag aag cct ggc caa gct ccc 192Ser Ser Ala Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro50 55 60agg ctc ctc atc tat ggt gcg tcc agc agg gct act ggc att cca gac 240Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp65 70 75 80cgc ttc tca ggc agt ggg tct ggg aca gac ttc acg ctc acc att agc 288Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser85 90 95agg ctg gaa cct gag gat ttt gca gtg tac tac tgt cag cag tat ggt 336Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly
100 105 110cgc tca ccc acg ttc ggc cag ggg acc aag gtg gag atc aag cgc act 384Arg Ser Pro Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr115 120 125gtg gct gca ccg tcg gtc ttc ata ttc ccg cca tcc gat gag cag ctg 432Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu130 135 140aag tct ggc act gcc tct gtt gtg tgc ctg ctg aat aac ttc tat ccg 480Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro145 150 155 160aga gag gcg aag gta cag tgg aag gtg gat aac gcc ctc caa tcg ggt 528Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly165 170 175aac tcc caa gag tcc gtt aca gag cag gac agc aag gac agc acc tac 576Ash Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr180 185 190agc ctc agc aac acc ttg acg ctg agc aaa gcg gac tac gag aaa cac 624Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His195 200 205aag gtc tac gcc tgc gaa gtc acc cat caa ggc ctg cgc tcg ccc gtc 672Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro Val210 215 220aca aag agc ttc aac cgg gga gag tgt tga 702Thr Lys Ser Phe Asn Arg Gly Glu Cys225 230<210>10<211>233<212>PRT<213>单纯疱疹病毒<400>10Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly1 5 10 15Val His Cys Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu20 25 30Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val35 40 45Ser Ser Ala Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro50 55 60Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp65 70 75 80
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser85 90 95Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly100 105 110Arg Ser Pro Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr115 120 125Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu130 135 140Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro145 150 155 160Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly165 170 175Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr180 185 190Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His195 200 205Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro Val210 215 220Thr Lys Ser Phe Asn Arg Gly Glu Cys225 230<210>11<211>57<212>DNA<213>人工序列<220>
<223>轻链信号肽<220>
<221>CDS<222>(1)..(57)<400>11atg gga tgg tcc tgg atc ttt ctc ttc ctt ctg tca gga gct gca ggt 48Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly1 5 10 15gtc cac tgc 57Val His Cys
<210>12<211>19<212>PRT<213>人工序列<220>
<223>轻链信号肽<400>12Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly1 5 10 15Val His Cys<2l0>13<211>642<212>DNA<213>人工序列<220>
<223>成熟轻链序列<220>
<221>CDS<222>(1)..(642)<400>13gag atc gtg ctc acg cag tct cca ggc acc ctg tct ttg tcg cca ggg 48Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly1 5 10 15gaa cgt gcc acc ctc tcc tgc cgg gcc agt cag tcc gtt tcc agc gcg 96Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ala20 25 30tac ctt gcc tgg tac cag cag aag cct ggc caa gct ccc agg ctc ctc144Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu35 40 45atc tat ggt gcg tcc agc agg gct act ggc att cca gac cgc ttc tca192Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser50 55 60ggc agt ggg tct ggg aca gac ttc acg ctc acc att agc agg ctg gaa240Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu65 70 75 80cct gag gat ttt gca gtg tac tac tgt cag cag tat ggt cgc tca ccc288Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Pro85 90 95acg ttc ggc cag ggg acc aag gtg gag atc aag cgc act gtg gct gca336Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala100 105 110ccg tcg gtc ttc ata ttc ccg cca tcc gat gag cag ctg aag tct ggc384
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly115 120 125act gcc tct gtt gtg tgc ctg ctg aat aac ttc tat ccg aga gag gcg 432Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala130 135 140aag gta cag tgg aag gtg gat aac gcc ctc caa tcg ggt aac tcc caa 480Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln145 150 155 160gag tcc gtt aca gag cag gac agc aag gac agc acc tac agc ctc agc 528Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser165 170 175aac acc ttg acg ctg agc aaa gcg gac tac gag aaa cac aag gtc tac 576Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr180 185 190gcc tgc gaa gtc acc cat caa ggc ctg cgc tcg ccc gtc aca aag agc 624Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro Val Thr Lys Ser195 200 205ttc aac cgg gga gag tgt 642Phe Asn Arg Gly Glu Cys210<210>14<211>214<212>PRT<213>人工序列<220>
<223>成熟轻链序列<400>14Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly1 5 10 15Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ala20 25 30Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu35 40 45Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser50 55 60Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu65 70 75 80Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Pro85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala100 105 110Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly115 120 125Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala130 135 140Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln145 150 155 160Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser165 170 175Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr180 185 190Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro Val Thr Lys Ser195 200 205Phe Asn Arg Gly Glu Cys210<210>15<211>9144<212>DNA<213>人工序列<220>
<223>pDAB635(ubiH)序列<400>15tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca60cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt acaccggtgt gatcatgggc 420cgcgattaaa aatcccaatt atatttggtc taatttagtt tggtattgag taaaacaaat 480tcgaaccaaa ccaaaatata aatatatagt ttttatatat atgcctttaa gactttttat 540agaattttct ttaaaaaata tctagaaata tttgcgactc ttctggcatg taatatttcg 600
ttaaatatga agtgctccat ttttattaac tttaaataat tggttgtacg atcactttct660tatcaagtgt tactaaaatg cgtcaatctc tttgttcttc catattcata tgtcaaaatc720tatcaaaatt cttatatatc tttttcgaat ttgaagtgaa atttcgataa tttaaaatta780aatagaacat atcattattt aggtatcata ttgattttta tacttaatta ctaaatttgg840ttaactttga aagtgtacat caacgaaaaa ttagtcaaac gactaaaata aataaatatc900atgtgttatt aagaaaattc tcctataaga atattttaat agatcatatg tttgtaaaaa960aaattaattt ttactaacac atatatttac ttatcaaaaa tttgacaaag taagattaaa 1020ataatattca tctaacaaaa aaaaaaccag aaaatgctga aaacccggca aaaccgaacc 1080aatccaaacc gatatagttg gtttggtttg attttgatat aaaccgaacc aactcggtcc 1140atttgcaccc ctaatcataa tagctttaat atttcaagat attattaagt taacgttgtc 1200aatatcctgg aaattttgca aaatgaatca agcctatatg gctgtaatat gaatttaaaa 1260gcagctcgat gtggtggtaa tatgtaattt acttgattct aaaaaaatat cccaagtatt 1320aataatttct gctaggaaga aggttagcta cgatttacag caaagccaga atacaaagaa 1380ccataaagtg attgaagctc gaaatatacg aaggaacaaa tatttttaaa aaaatacgca 1440atgacttgga acaaaagaaa gtgatatatt ttttgttctt aaacaagcat cccctctaaa 1500gaatggcagt tttcctttgc atgtaactat tatgctccct tcgttacaaa aattttggac 1560tactattggg aacttcttct gaaaatagtg gccaccgctt aattaacacc ggtggcccgg 1620gcaagcggcc gcattcccgg gaagctaggc caccgtggcc cgcctgcagg ggaagcttgc 1680atgcctgcag atccccgggg atcctctaga gtcgacctgc agtgcagcgt gacccggtcg 1740tgcccctctc tagagataat gagcattgca tgtctaagtt ataaaaaatt accacatatt 1800ttttttgtca cacttgtttg aagtgcagtt tatctatctt tatacatata tttaaacttt 1860aatctacgaa taatataatc tatagtacta caataatatc agtgttttag agaatcatat 1920aaatgaacag ttagacatgg tctaaaggac aattgagtat tttgacaaca ggactctaca 1980gttttatctt tttagtgtgc atgtgttctc cttttttttt gcaaatagct tcacctatat 2040aatacttcat ccattttatt agtacatcca tttagggttt agggttaatg gtttttatag 2100actaattttt ttagtacatc tattttattc tattttagcc tctaaattaa gaaaactaaa 2160actctatttt agttttttta tttaataatt tagatataaa atagaataaa ataaagtgac 2220taaaaattaa acaaataccc tttaagaaat taaaaaaact aaggaaacat ttttcttgtt 2280tcgagtagat aatgccagcc tgttaaacgc cgtcgacgag tctaacggac accaaccagc 2340gaaccagcag cgtcgcgtcg ggccaagcga agcagacggc acggcatctc tgtcgctgcc 2400tctggacccc tctcgagagt tccgctccac cgttggactt gctccgctgt cggcatccag 2460
aaattgcgtg gcggagcggc agacgtgagc cggcacggca ggcggcctcc tcctcctctc2520acggcacggc agctacgggg gattcctttc ccaccgctcc ttcgctttcc cttcctcgcc2580cgccgtaata aatagacacc ccctccacac cctctttccc caacctcgtg ttgttcggag2640cgcacacaca cacaaccaga tctcccccaa atccacccgt cggcacctcc gcttcaaggt2700acgccgctcg tcctcccccc ccccccctct ctaccttctc tagatcggcg ttccggtcca2760tgcatggtta gggcccggta gttctacttc tgttcatgtt tgtgttagat ccgtgtttgt2820gttagatccg tgctgctagc gttcgtacac ggatgcgacc tgtacgtcag acacgttctg2880attgctaact tgccagtgtt tctctttggg gaatcctggg atggctctag ccgttccgca2940gacgggatcg atttcatgat tttttttgtt tcgttgcata gggtttggtt tgcccttttc3000ctttatttca atatatgccg tgcacttgtt tgtcgggtca tcttttcatg cttttttttg3060tcttggttgt gatgatgtgg tctggttggg cggtcgttct agatcggagt agaattctgt3120ttcaaactac ctggtggatt tattaatttt ggatctgtat gtgtgtgcca tacatattca3180tagttacgaa ttgaagatga tggatggaaa tatcgatcta ggataggtat acatgttgat3240gcgggtttta ctgatgcata tacagagatg ctttttgttc gcttggttgt gatgatgtgg3300tgtggttggg cggtcgttca ttcgttctag atcggagtag aatactgttt caaactacct3360ggtgtattta ttaattttgg aactgtatgt gtgtgtcata catcttcata gttacgagtt3420taagatggat ggaaatatcg atctaggata ggtatacatg ttgatgtggg ttttactgat3480gcatatacat gatggcatat gcagcatcta ttcatatgct ctaaccttga gtacctatct3540attataataa acaagtatgt tttataatta ttttgatctt gatatacttg gatgatggca3600tatgcagcag ctatatgtgg atttttttag ccctgccttc atacgctatt tatttgcttg3660gtactgtttc ttttgtcgat gctcaccctg ttgtttggtg ttacttctgc agggtacccc3720cggggtcgac catggccaac aagcacctga gcctctccct cttcctcgtg ctcctcggcc3780tctccgcctc cctcgccagc ggccaggttc agctcgtgca gtcaggggct gaggtgaaga3840agcctgggtc ctcggtgaag gtctcctgca aggcttctgg aggttccttc agcagctatg3900ctatcaactg ggtgcgacag gcccctggac aagggcttga gtggatggga gggctcatgc3960ctatctttgg gacaacaaac tacgcacaga agttccagga cagactcacg attaccgcgg4020acgtatccac gagtacagcc tacatgcagc tgagcggcct gacatatgaa gacacggcca4080tgtattactg tgcgagagtt gcctatatgt tggaacctac cgtcactgca gggggtttgg4140acgtctgggg caaagggacc acggtcaccg tctccccagc atccccgacc agccccaagg4200tcttcccgct gagcctctgc agcacccagc cagatgggaa cgtggtcatc gcctgcctgg4260tccagggctt cttcccccag gagccactca gtgtgacctg gagcgaaagc ggacagggcg4320
tgaccgccag aaacttccca cccagccagg atgcctccgg ggacctgtac accacgagca4380gccagctgac cctgccggcc acacagtgcc tagccggcaa gtccgtgaca tgccacgtga4440agcactacac gaatcccagc caggatgtga ctgtgccctg cccagttccc tcaactccac4500ctaccccatc tccctcaact ccacctaccc catctccctc atgctgccac ccccgactgt4560cactgcaccg accggccctc gaggacctgc tcttaggttc agaagcgaac ctcacgtgca4620cactgaccgg cctgagagat gcctcaggtg tcaccttcac ctggacgccc tcaagtggga4680agagcgctgt tcaaggacca cctgagcgtg acctctgtgg ctgctacagc gtgtccagtg4740tcctgccggg ctgtgccgag ccttggaatc atgggaagac cttcacttgc actgctgcct4800accccgagtc caagaccccg ctaaccgcca ccctctcaaa atccggaaac acattccggc4860ccgaggtcca cctgctgccg ccgccgtcgg aggagctggc cctgaacgag ctggtgacgc4920tgacgtgcct ggcacgtggc ttcagcccca aggacgtgct ggttcgctgg ctgcaggggt4980cacaggagct gccccgcgag aagtacctga cttgggcatc ccggcaggag cccagccagg5040gcaccaccac cttcgctgtg accagcatac tgcgcgtggc agccgaggac tggaagaagg5100gggacacctt ctcctgcatg gtgggccacg aggccctgcc gctggccttc acacagaaga5160ccatcgaccg cttggcgggt aaacccaccc atgtcaatgt gtctgttgtc atggcggagg5220tggacggcac ctgctactga gttaaactga gggcactgaa gtcgcttgat gtgctgaatt5280gtttgtgatg ttggtggcgt attttgttta aataagtaag catggctgtg attttatcat5340atgatcgatc tttggggttt tatttaacac attgtaaaat gtgtatctat taataactca5400atgtataaga tgtgttcatt cttcggttgc catagatctg cttatttgac ctgtgatgtt5460ttgactccaa aaaccaaaat cacaactcaa taaactcatg gaatatgtcc acctgtttct5520tgaagagttc atctaccatt ccagttggca tttatcagtg ttgcagcggc gctgtgcttt5580gtaacataac aattgttacg gcatatatcc aacggccggc ctaggccacg gtggccagat5640ccactagttc tagagcggcc gcttaattaa atttaaatgt ttaaactagg cctcctgcag5700ggtttaaact tgccgtggcc tattttcaga agaagttccc aatagtagtc caaaattttt5760gtaacgaagg gagcataata gttacatgca aaggaaaact gccattcttt agaggggatg5820cttgtttaag aacaaaaaat atatcacttt cttttgttcc aagtcattgc gtattttttt5880aaaaatattt gttccttcgt atatttcgag cttcaatcac tttatggttc tttgtattct5940ggctttgctg taaatcgtag ctaaccttct tcctagcaga aattattaat acttgggata6000tttttttaga atcaagtaaa ttacatatta ccaccacatc gagctgcttt taaattcata6060ttacagccat ataggcttga ttcattttgc aaaatttcca ggatattgac aacgttaact6120taataatatc ttgaaatatt aaagctatta tgattagggg tgcaaatgga ccgagttggt6180
tcggtttata tcaaaatcaa accaaaccaa ctatatcggt ttggattggt tcggttttgc6240cgggttttca gcattttctg gttttttttt tgttagatga atattatttt aatcttactt6300tgtcaaattt ttgataagta aatatatgtg ttagtaaaaa ttaatttttt ttacaaacat6360atgatctatt aaaatattct tataggagaa ttttcttaat aacacatgat atttatttat6420tttagtcgtt tgactaattt ttcgttgatg tacactttca aagttaacca aatttagtaa6480ttaagtataa aaatcaatat gatacctaaa taatgatatg ttctatttaa ttttaaatta6540tcgaaatttc acttcaaatt cgaaaaagat atataagaat tttgatagat tttgacatat6600gaatatggaa gaacaaagag attgacgcat tttagtaaca cttgataaga aagtgatcgt6660acaaccaatt atttaaagtt aataaaaatg gagcacttca tatttaacga aatattacat6720gccagaagag tcgcaaatat ttctagatat tttttaaaga aaattctata aaaagtctta6780aaggcatata tataaaaact atatatttat attttggttt ggttcgaatt tgttttactc6840aataccaaac taaattagac caaatataat tgggattttt aatcgcggcc cactagtcac6900cggtgtgctt ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca6960caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag7020tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt7080cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc7140gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg7200tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa7260agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg7320cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga7380ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg7440tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg7500gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc7560gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg7620gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca7680ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt7740ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag7800ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg7860gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc7920ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt7980tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt8040
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca8100gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg8160tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac8220cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg8280ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc8340gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta8400caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac8460gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc8520ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac8580tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact8640caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa8700tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt8760cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca8820ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa8880aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac8940tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg9000gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc9060gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc tataaaaata9120ggcgtatcac gaggcccttt cgtc 9144<210>16<211>8352<212>DNA<213>人工序列<220>
<223>pDAB636(ubiL)序列<400>16tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt acaccggtgt gatcatgggc420cgcgattaaa aatcccaatt atatttggtc taatttagtt tggtattgag taaaacaaat480tcgaaccaaa ccaaaatata aatatatagt ttttatatat atgcctttaa gactttttat540agaattttct ttaaaaaata tctagaaata tttgcgactc ttctggcatg taatatttcg600ttaaatatga agtgctccat ttttattaac tttaaataat tggttgtacg atcactttct660tatcaagtgt tactaaaatg cgtcaatctc tttgttcttc catattcata tgtcaaaatc720tatcaaaatt cttatatatc tttttcgaat ttgaagtgaa atttcgataa tttaaaatta780aatagaacat atcattattt aggtatcata ttgattttta tacttaatta ctaaatttgg840ttaactttga aagtgtacat caacgaaaaa ttagtcaaac gactaaaata aataaatatc900atgtgttatt aagaaaattc tcctataaga atattttaat agatcatatg tttgtaaaaa960aaattaattt ttactaacac atatatttac ttatcaaaaa tttgacaaag taagattaaa 1020ataatattca tctaacaaaa aaaaaaccag aaaatgctga aaacccggca aaaccgaacc 1080aatccaaacc gatatagttg gtttggtttg attttgatat aaaccgaacc aactcggtcc 1140atttgcaccc ctaatcataa tagctttaat atttcaagat attattaagt taacgttgtc 1200aatatcctgg aaattttgca aaatgaatca agcctatatg gctgtaatat gaatttaaaa 1260gcagctcgat gtggtggtaa tatgtaattt acttgattct aaaaaaatat cccaagtatt 1320aataatttct gctaggaaga aggttagcta cgatttacag caaagccaga atacaaagaa 1380ccataaagtg attgaagctc gaaatatacg aaggaacaaa tatttttaaa aaaatacgca 1440atgacttgga acaaaagaaa gtgatatatt ttttgttctt aaacaagcat cccctctaaa 1500gaatggcagt tttcctttgc atgtaactat tatgctccct tcgttacaaa aattttggac 1560tactattggg aacttcttct gaaaatagtg gccaccgctt aattaacacc ggtggcccgg 1620gcaagcggcc gcattcccgg gaagctaggc caccgtggcc cgcctgcagg ggaagcttgc 1680atgcctgcag atccccgggg atcctctaga gtcgacctgc agtgcagcgt gacccggtcg 1740tgcccctctc tagagataat gagcattgca tgtctaagtt ataaaaaatt accacatatt 1800ttttttgtca cacttgtttg aagtgcagtt tatctatctt tatacatata tttaaacttt 1860aatctacgaa taatataatc tatagtacta caataatatc agtgttttag agaatcatat 1920aaatgaacag ttagacatgg tctaaaggac aattgagtat tttgacaaca ggactctaca 1980gttttatctt tttagtgtgc atgtgttctc cttttttttt gcaaatagct tcacctatat 2040aatacttcat ccattttatt agtacatcca tttagggttt agggttaatg gtttttatag 2100actaattttt ttagtacatc tattttattc tattttagcc tctaaattaa gaaaactaaa 2160actctatttt agttttttta tttaataatt tagatataaa atagaataaa ataaagtgac 2220
taaaaattaa acaaataccc tttaagaaat taaaaaaact aaggaaacat ttttcttgtt2280tcgagtagat aatgccagcc tgttaaacgc cgtcgacgag tctaacggac accaaccagc2340gaaccagcag cgtcgcgtcg ggccaagcga agcagacggc acggcatctc tgtcgctgcc2400tctggacccc tctcgagagt tccgctccac cgttggactt gctccgctgt cggcatccag2460aaattgcgtg gcggagcggc agacgtgagc cggcacggca ggcggcctcc tcctcctctc2520acggcacggc agctacgggg gattcctttc ccaccgctcc ttcgctttcc cttcctcgcc2580cgccgtaata aatagacacc ccctccacac cctctttccc caacctcgtg ttgttcggag2640cgcacacaca cacaaccaga tctcccccaa atccacccgt cggcacctcc gcttcaaggt2700acgccgctcg tcctcccccc ccccccctct ctaccttctc tagatcggcg ttccggtcca2760tgcatggtta gggcccggta gttctacttc tgttcatgtt tgtgttagat ccgtgtttgt2820gttagatccg tgctgctagc gttcgtacac ggatgcgacc tgtacgtcag acacgttctg2880attgctaact tgccagtgtt tctctttggg gaatcctggg atggctctag ccgttccgca2940gacgggatcg atttcatgat tttttttgtt tcgttgcata gggtttggtt tgcccttttc3000ctttatttca atatatgccg tgcacttgtt tgtcgggtca tcttttcatg cttttttttg3060tcttggttgt gatgatgtgg tctggttggg cggtcgttct agatcggagt agaattctgt3120ttcaaactac ctggtggatt tattaatttt ggatctgtat gtgtgtgcca tacatattca3180tagttacgaa ttgaagatga tggatggaaa tatcgatcta ggataggtat acatgttgat3240gcgggtttta ctgatgcata tacagagatg ctttttgttc gcttggttgt gatgatgtgg3300tgtggttggg cggtcgttca ttcgttctag atcggagtag aatactgttt caaactacct3360ggtgtattta ttaattttgg aactgtatgt gtgtgtcata catcttcata gttacgagtt3420taagatggat ggaaatatcg atctaggata ggtatacatg ttgatgtggg ttttactgat3480gcatatacat gatggcatat gcagcatcta ttcatatgct ctaaccttga gtacctatct3540attataataa acaagtatgt tttataatta ttttgatctt gatatacttg gatgatggca3600tatgcagcag ctatatgtgg atttttttag ccctgccttc atacgctatt tatttgcttg3660gtactgtttc ttttgtcgat gctcaccctg ttgtttggtg ttacttctgc agggtacccc3720cggggtcgac catggccaac aagcacctga gcctctccct cttcctcgtg ctcctcggcc3780tctccgcctc cctcgccagc ggcgaaattg tgctcacgca gtctccaggc accctgtctt3840tgtctccagg ggaaaaagcc accctctcct gcagggccag tcagagtgtt agtagcgcct3900acttagcctg gtaccagcag aaacctggcc aggctcccag gctcctcatc tatggtgcat3960ccagcagggc cactggcatc ccagacaggt tcagtggcag tgggtctggg acagacttca4020ctctcaccat cagcagactg gaacctgaag attttgcagt gtattactgt cagcagtatg4080
gtaggtcacc cactttcggc ggagggacca aggtggagat caaacgaact gtggctgcac4140catctgtctt catcttcccg ccatctgatg agcagttgaa atctggaact gcctctgttg4200tgtgcctgct gaataacttc tatcccagag aggccaaagt acagtggaag gtggataacg4260ccctccaatc gggtaactcc caggagagtg tcacagagca ggacagcaag gacagcacct4320acagcctcag caacaccctg acgctgagca aagcagacta cgagaaacac aaagtctacg4380cctgcgaagt cacccatcag ggcctgagat cgcccgtcac aaagagcttc aacaggggag4440agtgttgagt taaactgagg gcactgaagt cgcttgatgt gctgaattgt ttgtgatgtt4500ggtggcgtat tttgtttaaa taagtaagca tggctgtgat tttatcatat gatcgatctt4560tggggtttta tttaacacat tgtaaaatgt gtatctatta ataactcaat gtataagatg4620tgttcattct tcggttgcca tagatctgct tatttgacct gtgatgtttt gactccaaaa4680accaaaatca caactcaata aactcatgga atatgtccac ctgtttcttg aagagttcat4740ctaccattcc agttggcatt tatcagtgtt gcagcggcgc tgtgctttgt aacataacaa4800ttgttacggc atatatccaa cggccggcct aggccacggt ggccagatcc actagttcta4860gagcggccgc ttaattaaat ttaaatgttt aaactaggcc tcctgcaggg tttaaacttg4920ccgtggccta ttttcagaag aagttcccaa tagtagtcca aaatttttgt aacgaaggga4980gcataatagt tacatgcaaa ggaaaactgc cattctttag aggggatgct tgtttaagaa5040caaaaaatat atcactttct tttgttccaa gtcattgcgt atttttttaa aaatatttgt5100tccttcgtat atttcgagct tcaatcactt tatggttctt tgtattctgg ctttgctgta5160aatcgtagct aaccttcttc ctagcagaaa ttattaatac ttgggatatt tttttagaat5220caagtaaatt acatattacc accacatcga gctgctttta aattcatatt acagccatat5280aggcttgatt cattttgcaa aatttccagg atattgacaa cgttaactta ataatatctt5340gaaatattaa agctattatg attaggggtg caaatggacc gagttggttc ggtttatatc5400aaaatcaaac caaaccaact atatcggttt ggattggttc ggttttgccg ggttttcagc5460attttctggt tttttttttg ttagatgaat attattttaa tcttactttg tcaaattttt5520gataagtaaa tatatgtgtt agtaaaaatt aatttttttt acaaacatat gatctattaa5580aatattctta taggagaatt ttcttaataa cacatgatat ttatttattt tagtcgtttg5640actaattttt cgttgatgta cactttcaaa gttaaccaaa tttagtaatt aagtataaaa5700atcaatatga tacctaaata atgatatgtt ctatttaatt ttaaattatc gaaatttcac5760ttcaaattcg aaaaagatat ataagaattt tgatagattt tgacatatga atatggaaga5820acaaagagat tgacgcattt tagtaacact tgataagaaa gtgatcgtac aaccaattat5880ttaaagttaa taaaaatgga gcacttcata tttaacgaaa tattacatgc cagaagagtc5940
gcaaatattt ctagatattt tttaaagaaa attctataaa aagtcttaaa ggcatatata6000taaaaactat atatttatat tttggtttgg ttcgaatttg ttttactcaa taccaaacta6060aattagacca aatataattg ggatttttaa tcgcggccca ctagtcaccg gtgtgcttgg6120cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca6180acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca6240cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc6300attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt6360cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact6420caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag6480caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata6540ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc6600cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg6660ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc6720tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg6780gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc6840ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga6900ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg6960gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa7020aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg7080tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt7140ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat7200tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct7260aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta7320tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa7380ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac7440gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa7500gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag7560taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg7620tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag7680ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg7740tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc7800
ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat7860tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata7920ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa7980aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca8040actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc8100aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc8160tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg8220aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac8280ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga8340ggccctttcg tc8352<210>17<211>12380<212>DNA<213>人工序列<220>
<223>pDAB637(ubiH+L)序列<400>17tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt acaccggtgt gatcatgggc 420cgcgattaaa aatcccaatt atatttggtc taatttagtt tggtattgag taaaacaaat 480tcgaaccaaa ccaaaatata aatatatagt ttttatatat atgcctttaa gactttttat 540agaattttct ttaaaaaata tctagaaata tttgcgactc ttctggcatg taatatttcg 600ttaaatatga agtgctccat ttttattaac tttaaataat tggttgtacg atcactttct 660tatcaagtgt tactaaaatg cgtcaatctc tttgttcttc catattcata tgtcaaaatc 720tatcaaaatt cttatatatc tttttcgaat ttgaagtgaa atttcgataa tttaaaatta 780aatagaacat atcattattt aggtatcata ttgattttta tacttaatta ctaaatttgg 840ttaactttga aagtgtacat caacgaaaaa ttagtcaaac gactaaaata aataaatatc 900atgtgttatt aagaaaattc tcctataaga atattttaat agatcatatg tttgtaaaaa 960
aaattaattt ttactaacac atatatttac ttatcaaaaa tttgacaaag taagattaaa1020ataatattca tctaacaaaa aaaaaaccag aaaatgctga aaacccggca aaaccgaacc1080aatccaaacc gatatagttg gtttggtttg attttgatat aaaccgaacc aactcggtcc1140atttgcaccc ctaatcataa tagctttaat atttcaagat attattaagt taacgttgtc1200aatatcctgg aaattttgca aaatgaatca agcctatatg gctgtaatat gaatttaaaa1260gcagctcgat gtggtggtaa tatgtaattt acttgattct aaaaaaatat cccaagtatt1320aataatttct gctaggaaga aggttagcta cgatttacag caaagccaga atacaaagaa1380ccataaagtg attgaagctc gaaatatacg aaggaacaaa tatttttaaa aaaatacgca1440atgacttgga acaaaagaaa gtgatatatt ttttgttctt aaacaagcat cccctctaaa1500gaatggcagt tttcctttgc atgtaactat tatgctccct tcgttacaaa aattttggac1560tactattggg aacttcttct gaaaatagtg gccaccgctt aattaacacc ggtggcccgg1620ccgcattccc gggaagctag gccaccgtgg cccgcctgca ggggaagctt gcatgcctgc1680agatccccgg ggatcctcta gagtcgacct gcagtgcagc gtgacccggt cgtgcccctc1740tctagagata atgagcattg catgtctaag ttataaaaaa ttaccacata ttttttttgt1800cacacttgtt tgaagtgcag tttatctatc tttatacata tatttaaact ttaatctacg1860aataatataa tctatagtac tacaataata tcagtgtttt agagaatcat ataaatgaac1920agttagacat ggtctaaagg acaattgagt attttgacaa caggactcta cagttttatc1980tttttagtgt gcatgtgttc tccttttttt ttgcaaatag cttcacctat ataatacttc2040atccatttta ttagtacatc catttagggt ttagggttaa tggtttttat agactaattt2100ttttagtaca tctattttat tctattttag cctctaaatt aagaaaacta aaactctatt2160ttagtttttt tatttaataa tttagatata aaatagaata aaataaagtg actaaaaatt2220aaacaaatac cctttaagaa attaaaaaaa ctaaggaaac atttttcttg tttcgagtag2280ataatgccag cctgttaaac gccgtcgacg agtctaacgg acaccaacca gcgaaccagc2340agcgtcgcgt cgggccaagc gaagcagacg gcacggcatc tctgtcgctg cctctggacc2400cctctcgaga gttccgctcc accgttggac ttgctccgct gtcggcatcc agaaattgcg2460tggcggagcg gcagacgtga gccggcacgg caggcggcct cctcctcctc tcacggcacg2520gcagctacgg gggattcctt tcccaccgct ccttcgcttt cccttcctcg cccgccgtaa2580taaatagaca ccccctccac accctctttc cccaacctcg tgttgttcgg agcgcacaca2640cacacaacca gatctccccc aaatccaccc gtcggcacct ccgcttcaag gtacgccgct2700cgtcctcccc ccccccccct ctctaccttc tctagatcgg cgttccggtc catgcatggt2760tagggcccgg tagttctact tctgttcatg tttgtgttag atccgtgttt gtgttagatc2820
cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc agacacgttc tgattgctaa2880cttgccagtg tttctctttg gggaatcctg ggatggctct agccgttccg cagacgggat2940cgatttcatg attttttttg tttcgttgca tagggtttgg tttgcccttt tcctttattt3000caatatatgc cgtgcacttg tttgtcgggt catcttttca tgcttttttt tgtcttggtt3060gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga gtagaattct gtttcaaact3120acctggtgga tttattaatt ttggatctgt atgtgtgtgc catacatatt catagttacg3180aattgaagat gatggatgga aatatcgatc taggataggt atacatgttg atgcgggttt3240tactgatgca tatacagaga tgctttttgt tcgcttggtt gtgatgatgt ggtgtggttg3300ggcggtcgtt cattcgttct agatcggagt agaatactgt ttcaaactac ctggtgtatt3360tattaatttt ggaactgtat gtgtgtgtca tacatcttca tagttacgag tttaagatgg3420atggaaatat cgatctagga taggtataca tgttgatgtg ggttttactg atgcatatac3480atgatggcat atgcagcatc tattcatatg ctctaacctt gagtacctat ctattataat3540aaacaagtat gttttataat tattttgatc ttgatatact tggatgatgg catatgcagc3600agctatatgt ggattttttt agccctgcct tcatacgcta tttatttgct tggtactgtt3660tcttttgtcg atgctcaccc tgttgtttgg tgttacttct gcagggtacc cccggggtcg3720accatggcca acaagcacct gagcctctcc ctcttcctcg tgctcctcgg cctctccgcc3780tccctcgcca gcggccaggt tcagctcgtg cagtcagggg ctgaggtgaa gaagcctggg3840tcctcggtga aggtctcctg caaggcttct ggaggttcct tcagcagcta tgctatcaac3900tgggtgcgac aggcccctgg acaagggctt gagtggatgg gagggctcat gcctatcttt3960gggacaacaa actacgcaca gaagttccag gacagactca cgattaccgc ggacgtatcc4020acgagtacag cctacatgca gctgagcggc ctgacatatg aagacacggc catgtattac4080tgtgcgagag ttgcctatat gttggaacct accgtcactg cagggggttt ggacgtctgg4140ggcaaaggga ccacggtcac cgtctcccca gcatccccga ccagccccaa ggtcttcccg4200ctgagcctct gcagcaccca gccagatggg aacgtggtca tcgcctgcct ggtccagggc4260ttcttccccc aggagccact cagtgtgacc tggagcgaaa gcggacaggg cgtgaccgcc4320agaaacttcc cacccagcca ggatgcctcc ggggacctgt acaccacgag cagccagctg4380accctgccgg ccacacagtg cctagccggc aagtccgtga catgccacgt gaagcactac4440acgaatccca gccaggatgt gactgtgccc tgcccagttc cctcaactcc acctacccca4500tctccctcaa ctccacctac cccatctccc tcatgctgcc acccccgact gtcactgcac4560cgaccggccc tcgaggacct gctcttaggt tcagaagcga acctcacgtg cacactgacc4620ggcctgagag atgcctcagg tgtcaccttc acctggacgc cctcaagtgg gaagagcgct4680
gttcaaggac cacctgagcg tgacctctgt ggctgctaca gcgtgtccag tgtcctgccg4740ggctgtgccg agccttggaa tcatgggaag accttcactt gcactgctgc ctaccccgag4800tccaagaccc cgctaaccgc caccctctca aaatccggaa acacattccg gcccgaggtc4860cacctgctgc cgccgccgtc ggaggagctg gccctgaacg agctggtgac gctgacgtgc4920ctggcacgtg gcttcagccc caaggacgtg ctggttcgct ggctgcaggg gtcacaggag4980ctgccccgcg agaagtacct gacttgggca tcccggcagg agcccagcca gggcaccacc5040accttcgctg tgaccagcat actgcgcgtg gcagccgagg actggaagaa gggggacacc5100ttctcctgca tggtgggcca cgaggccctg ccgctggcct tcacacagaa gaccatcgac5160cgcttggcgg gtaaacccac ccatgtcaat gtgtctgttg tcatggcgga ggtggacggc5220acctgctact gagttaaact gagggcactg aagtcgcttg atgtgctgaa ttgtttgtga5280tgttggtggc gtattttgtt taaataagta agcatggctg tgattttatc atatgatcga5340tctttggggt tttatttaac acattgtaaa atgtgtatct attaataact caatgtataa5400gatgtgttca ttcttcggtt gccatagatc tgcttatttg acctgtgatg ttttgactcc5460aaaaaccaaa atcacaactc aataaactca tggaatatgt ccacctgttt cttgaagagt5520tcatctacca ttccagttgg catttatcag tgttgcagcg gcgctgtgct ttgtaacata5580acaattgtta cggcatatat ccaacggccg gcctaggcca cggtggccag atccactagt5640tctagagcgg ccgcgggcaa attcccggga agctaggcca ccgtggcccg cctgcagggg5700aagcttgcat gcctgcagat ccccggggat cctctagagt cgacctgcag tgcagcgtga5760cccggtcgtg cccctctcta gagataatga gcattgcatg tctaagttat aaaaaattac5820cacatatttt ttttgtcaca cttgtttgaa gtgcagttta tctatcttta tacatatatt5880taaactttaa tctacgaata atataatcta tagtactaca ataatatcag tgttttagag5940aatcatataa atgaacagtt agacatggtc taaaggacaa ttgagtattt tgacaacagg6000actctacagt tttatctttt tagtgtgcat gtgttctcct ttttttttgc aaatagcttc6060acctatataa tacttcatcc attttattag tacatccatt tagggtttag ggttaatggt6120ttttatagac taattttttt agtacatcta ttttattcta ttttagcctc taaattaaga6180aaactaaaac tctattttag tttttttatt taataattta gatataaaat agaataaaat6240aaagtgacta aaaattaaac aaataccctt taagaaatta aaaaaactaa ggaaacattt6300ttcttgtttc gagtagataa tgccagcctg ttaaacgccg tcgacgagtc taacggacac6360caaccagcga accagcagcg tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg6420tcgctgcctc tggacccctc tcgagagttc cgctccaccg ttggacttgc tccgctgtcg6480gcatccagaa attgcgtggc ggagcggcag acgtgagccg gcacggcagg cggcctcctc6540
ctcctctcac ggcacggcag ctacggggga ttcctttccc accgctcctt cgctttccct6600tcctcgcccg ccgtaataaa tagacacccc ctccacaccc tctttcccca acctcgtgtt6660gttcggagcg cacacacaca caaccagatc tcccccaaat ccacccgtcg gcacctccgc6720ttcaaggtac gccgctcgtc ctcccccccc ccccctctct accttctcta gatcggcgtt6780ccggtccatg catggttagg gcccggtagt tctacttctg ttcatgtttg tgttagatcc6840gtgtttgtgt tagatccgtg ctgctagcgt tcgtacacgg atgcgacctg tacgtcagac6900acgttctgat tgctaacttg ccagtgtttc tctttgggga atcctgggat ggctctagcc6960gttccgcaga cgggatcgat ttcatgattt tttttgtttc gttgcatagg gtttggtttg7020cccttttcct ttatttcaat atatgccgtg cacttgtttg tcgggtcatc ttttcatgct7080tttttttgtc ttggttgtga tgatgtggtc tggttgggcg gtcgttctag atcggagtag7140aattctgttt caaactacct ggtggattta ttaattttgg atctgtatgt gtgtgccata7200catattcata gttacgaatt gaagatgatg gatggaaata tcgatctagg ataggtatac7260atgttgatgc gggttttact gatgcatata cagagatgct ttttgttcgc ttggttgtga7320tgatgtggtg tggttgggcg gtcgttcatt cgttctagat cggagtagaa tactgtttca7380aactacctgg tgtatttatt aattttggaa ctgtatgtgt gtgtcataca tcttcatagt7440tacgagttta agatggatgg aaatatcgat ctaggatagg tatacatgtt gatgtgggtt7500ttactgatgc atatacatga tggcatatgc agcatctatt catatgctct aaccttgagt7560acctatctat tataataaac aagtatgttt tataattatt ttgatcttga tatacttgga7620tgatggcata tgcagcagct atatgtggat ttttttagcc ctgccttcat acgctattta7680tttgcttggt actgtttctt ttgtcgatgc tcaccctgtt gtttggtgtt acttctgcag7740ggtacccccg gggtcgacca tggccaacaa gcacctgagc ctctccctct tcctcgtgct7800cctcggcctc tccgcctccc tcgccagcgg cgaaattgtg ctcacgcagt ctccaggcac7860cctgtctttg tctccagggg aaaaagccac cctctcctgc agggccagtc agagtgttag7920tagcgcctac ttagcctggt accagcagaa acctggccag gctcccaggc tcctcatcta7980tggtgcatcc agcagggcca ctggcatccc agacaggttc agtggcagtg ggtctgggac8040agacttcact ctcaccatca gcagactgga acctgaagat tttgcagtgt attactgtca8100gcagtatggt aggtcaccca ctttcggcgg agggaccaag gtggagatca aacgaactgt8160ggctgcacca tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc8220ctctgttgtg tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt8280ggataacgcc ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga8340cagcacctac agcctcagca acaccctgac gctgagcaaa gcagactacg agaaacacaa8400
agtctacgcc tgcgaagtca cccatcaggg cctgagatcg cccgtcacaa agagcttcaa8460caggggagag tgttgagtta aactgagggc actgaagtcg cttgatgtgc tgaattgttt8520gtgatgttgg tggcgtattt tgtttaaata agtaagcatg gctgtgattt tatcatatga8580tcgatctttg gggttttatt taacacattg taaaatgtgt atctattaat aactcaatgt8640ataagatgtg ttcattcttc ggttgccata gatctgctta tttgacctgt gatgttttga8700ctccaaaaac caaaatcaca actcaataaa ctcatggaat atgtccacct gtttcttgaa8760gagttcatct accattccag ttggcattta tcagtgttgc agcggcgctg tgctttgtaa8820cataacaatt gttacggcat atatccaacg gccggcctag gccacggtgg ccagatccac8880tagttctaga gcggccgctt aattaaattt aaatgtttaa actaggcctc ctgcagggtt8940taaacttgcc gtggcctatt ttcagaagaa gttcccaata gtagtccaaa atttttgtaa9000cgaagggagc ataatagtta catgcaaagg aaaactgcca ttctttagag gggatgcttg9060tttaagaaca aaaaatatat cactttcttt tgttccaagt cattgcgtat ttttttaaaa9120atatttgttc cttcgtatat ttcgagcttc aatcacttta tggttctttg tattctggct9180ttgctgtaaa tcgtagctaa ccttcttcct agcagaaatt attaatactt gggatatttt9240tttagaatca agtaaattac atattaccac cacatcgagc tgcttttaaa ttcatattac9300agccatatag gcttgattca ttttgcaaaa tttccaggat attgacaacg ttaacttaat9360aatatcttga aatattaaag ctattatgat taggggtgca aatggaccga gttggttcgg9420tttatatcaa aatcaaacca aaccaactat atcggtttgg attggttcgg ttttgccggg9480ttttcagcat tttctggttt tttttttgtt agatgaatat tattttaatc ttactttgtc9540aaatttttga taagtaaata tatgtgttag taaaaattaa ttttttttac aaacatatga9600tctattaaaa tattcttata ggagaatttt cttaataaca catgatattt atttatttta9660gtcgtttgac taatttttcg ttgatgtaca ctttcaaagt taaccaaatt tagtaattaa9720gtataaaaat caatatgata cctaaataat gatatgttct atttaatttt aaattatcga9780aatttcactt caaattcgaa aaagatatat aagaattttg atagattttg acatatgaat9840atggaagaac aaagagattg acgcatttta gtaacacttg ataagaaagt gatcgtacaa9900ccaattattt aaagttaata aaaatggagc acttcatatt taacgaaata ttacatgcca9960gaagagtcgc aaatatttct agatattttt taaagaaaat tctataaaaa gtcttaaagg 10020catatatata aaaactatat atttatattt tggtttggtt cgaatttgtt ttactcaata 10080ccaaactaaa ttagaccaaa tataattggg atttttaatc gcggcccact agtcaccggt 10140gtgcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 10200tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 10260
ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg10320ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc10380ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc10440agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa10500catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt10560tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg10620gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg10680ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag10740cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc10800caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa10860ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg10920taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc10980taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac11040cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg11100tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt11160gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt11220catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa11280atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga11340ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt11400gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg11460agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga11520gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga11580agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg11640catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc11700aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc11760gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca11820taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac11880caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg11940ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc12000ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg12060tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac12120
aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat12180actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata12240catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa12300agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata aaaataggcg12360tatcacgagg ccctttcgtc12380<210>18<211>16<212>PRT<213>人工序列<220>
<223>重链FabHSV8-cDR3的cDR3区<400>18Val Ala Tyr Met Leu Glu Pro Thr Val Thr Ala Gly Gly Leu Asp Val1 5 10 15<210>19<211>122<212>PRT<213>人工序列<220>
<223>重链V区FabSHV8<400>19Leu Glu Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser Ser Val Lys1 5 10 15Val Ser Cys Lys Ala Ser Gly Gly Ser Phe Ser Ser Tyr Ala Ile Asn20 25 30Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met Gly Gly Leu35 40 45Met Pro Ile Phe Gly Thr Thr Asn Tyr Ala Gln Lys Phe Gln Asp Arg50 55 60Leu Thr Ile Thr Ala Asp Val Ser Thr Ser Thr Ala Tyr Met Gln Leu65 70 75 80Ser Gly Leu Thr Tyr Glu Asp Thr Ala Met Tyr Tyr Cys Ala Arg Val85 90 95Ala Tyr Met Leu Glu Pro Thr Val Thr Ala Gly Gly Leu Asp Val Trp
100 105 110Gly Gln Gly Thr Thr Val Thr Val Ala Ser115 120<210>20<211>18<212>PRT<213>人工序列<220>
<223>N269的胰蛋白酶+Asp-N肽<400>20Asp Leu Leu Leu Gly Ser Glu Ala Asn Leu Thr Cys Thr Leu Thr Gly1 5 10 15Leu Arg<210>21<211>18<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T1<400>21Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly1 5 10 15Glu Arg<210>22<211>6<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T2<400>22Ala Thr Leu Ser Cys Arg1 5<210>23<211>22<212>PRT
<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T3<400>23Ala Ser Gln Ser Val Ser Ser Ala Tyr Leu Ala Trp Tyr Gln Gln Lys1 5 10 15Pro Gly Gln Ala Pro Arg20<210>24<211>9<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T4<400>24Leu Leu Ile Tyr Gly Ala Ser Ser Arg1 5<210>25<211>7<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T5<400>25Ala Thr Gly Ile Pro Asp Arg1 5<210>26<211>16<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T6<400>26Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg1 5 10 15<210>27<211>16<212>PRT
<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T7<400>27Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg1 5 10 15<210>28<211>9<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T8<400>28Ser Pro Thr Phe Gly Gln Gly Thr Lys1 5<210>29<211>18<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T11<400>29Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln1 5 10 15Leu Lys<210>30<211>16<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T12<400>30Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg1 5 10 15<210>31<211>4<212>PRT
<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T14<400>31Val Gln Trp Lys1<210>32<211>20<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T15<400>32Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu1 5 10 15Gln Asp Ser Lys20<210>33<211>14<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T16<400>33Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys1 5 10<210>34<211>5<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T17<400>34Ala Asp Tyr Glu Lys1 5<210>35<211>12<212>PRT
<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T19<400>35Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Arg1 5 10<210>36<211>5<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T20<400>36Ser Pro Val Thr Lysl 5<210>37<211>4<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T21<400>37Ser Phe Asn Arg1<210>38<211>23<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T5-6<400>38Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp1 5 10 15Phe Thr Leu Thr Ile Ser Arg20<210>39<211>32<212>PRT
<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T6-7<400>39Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Argl 5 10 15Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg20 25 30<210>40<211>13<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T8-9<400>40Ser Pro Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys1 5 10<210>41<211>19<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T10-11<400>41Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu1 5 10 15Gln Leu Lys<210>42<211>19<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T12-13<400>42Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg1 5 10 15
Glu Ala Lys<210>43<211>7<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T13-14<400>43Glu Ala Lys Val Gln Trp Lys1 5<210>44<211>24<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T14-15<400>44Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu1 5 10 15Ser Val Thr Glu Gln Asp Ser Lys20<210>45<211>7<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T17-18<400>45Ala Asp Tyr Glu Lys His Lys1 5<210>46<211>14<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T18-19<400>46
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Arg1 5 10<210>47<211>9<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T20-21<400>47Ser Pro Val Thr Lys Ser Phe Asn Arg1 5<210>48<211>7<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段L-T21-22<400>48Ser Phe Asn Arg Gly Glu Cys1 5<210>49<211>12<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T1<400>49Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys1 5 10<210>50<211>7<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T2<400>50Lys Pro Gly Ser Ser Val Lys1 5
<210>51<211>15<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T4<400>51Ala Ser Gly Gly Ser Phe Ser Ser Tyr Ala Ile Asn Trp Val Arg1 5 10 15<210>52<211>25<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T5<400>52Gln Ala Pro Gly Gln Gly Leu Glu Trp Met Gly Gly Leu Met Pro Ile1 5 10 15Phe Gly Thr Thr Asn Tyr Ala Gln Lys20 25<210>53<211>4<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T6<400>53Phe Gln Asp Arg1<210>54<211>31<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T7<400>54Leu Thr Ile Thr Ala Asp Val Ser Thr Ser Thr Ala Tyr Met Gln Leu1 5 10 15
Ser Gly Leu Thr Tyr Glu Asp Thr Ala Met Tyr Tyr Cys Ala Arg20 25 30<210>55<211>34<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T8<400>55Val Ala Tyr Met Leu Glu Pro Thr Val Thr Ala Gly Gly Leu Asp Val1 5 10 15Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Pro Thr Ser20 25 30Pro Lys<210>56<211>44<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T9<400>56Val Phe Pro Leu Ser Leu Cys Ser Thr Gln Pro Asp Gly Asn Val Vall 5 10 15Ile Ala Cys Leu Val Gln Gly Phe Phe Pro Gln Glu Pro Leu Ser Val20 25 30Thr Trp Ser Glu Ser Gly Gln Gly Val Thr Ala Arg35 40<210>57<211>30<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T10<400>57Asn Phe Pro Pro Ser Gln Asp Ala Ser Gly Asp Leu Tyr Thr Thr Ser
1 5 10 15Ser Gln Leu Thr Leu Pro Ala Thr Gln Cys Leu Ala Gly Lys20 25 30<210>58<211>7<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T11<400>58Ser Val Thr Cys His Val Lys1 5<210>59<211>38<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T12<400>59His Tyr Thr Asn Pro Ser Gln Asp Val Thr Val Pro Cys Pro Val Pro1 5 10 15Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro Ser Pro20 25 30Ser Cys Cys His Pro Arg35<210>60<211>27<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T13<400>60Leu Ser Leu His Arg Pro Ala Leu Glu Asp Leu Leu Leu Gly Ser Glu1 5 10 15Ala Asn Leu Thr Cys Thr Leu Thr Gly Leu Arg20 25
<210>61<211>15<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T14<400>61Asp Ala Ser Gly Val Thr Phe Thr Trp Thr Pro Ser Ser Gly Lys1 5 10 15<210>62<211>9<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T15<400>62Ser Ala Val Gln Gly Pro Pro Glu Arg1 5<210>63<211>23<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T16<400>63Asp Leu Cys Gly Cys Tyr Ser Val Ser Ser Val Leu Pro Gly Cys Ala1 5 10 15Glu Pro Trp Asn His Gly Lys20<210>64<211>12<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T17<400>64Thr Phe Thr Cys Thr Ala Ala Tyr Pro Glu Ser Lys1 5 10
<210>65<211>9<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T18<400>65Thr Pro Leu Thr Ala Thr Leu Ser Lys1 5<210>66<211>32<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T19<400>66Ser Gly Asn Thr Phe Arg Pro Glu Val His Leu Leu Pro Pro Pro Ser1 5 10 15Glu Glu Leu Ala Leu Asn Glu Leu Val Thr Leu Thr Cys Leu Ala Arg20 25 30<210>67<211>5<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T20<400>67Gly Phe Ser Pro Lys1 5<210>68<211>5<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T21<400>68Asp Val Leu Val Arg1 5
<210>69<211>10<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T22<400>69Trp Leu Gln Gly Ser Gln Glu Leu Pro Arg1 5 10<210>70<211>7<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T24<400>70Tyr Leu Thr Trp Ala Ser Arg1 5<210>71<211>17<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T25<400>71Gln Glu Pro Ser Gln Gly Thr Thr Thr Phe Ala Val Thr Ser Ile Leu1 5 10 15Arg<210>72<211>7<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T26<400>72Val Ala Ala Glu Asp Trp Lys1 5
<210>73<211>20<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T28<400>73Gly Asp Thr Phe Ser Cys Met Val Gly His Glu Ala Leu Pro Leu Ala1 5 10 15Phe Thr Gln Lys20<210>74<211>4<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T29<400>74Thr Ile Asp Arg1<210>75<211>22<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T30<400>75Leu Ala Gly Lys Pro Thr His Val Asn Val Ser Val Val Met Ala Glu1 5 10 15Val Asp Gly Thr Cys Tyr20<210>76<211>19<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T1-2<400>76
Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser1 5 10 15Ser Val Lys<210>77<211>11<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T2-3<400>77Lys Pro Gly Ser Ser Val Lys Val Ser Cys Lys1 5 10<210>78<211>19<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T3-4<400>78Val Ser Cys Lys Ala Ser Gly Gly Ser Phe Ser Ser Tyr Ala Ile Asn1 5 10 15Trp Val Arg<210>79<211>21<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T17-18<400>79Thr Phe Thr Cys Thr Ala Ala Tyr Pro Glu Ser Lys Thr Pro Leu Thr1 5 10 15Ala Thr Leu Ser Lys20<210>80
<211>10<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T20-21<400>80Gly Phe Ser Pro Lys Asp Val Leu Val Arg1 5 10<210>81<211>15<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T21-22<400>81Asp Val Leu Val Arg Trp Leu Gln Gly Ser Gln Glu Leu Pro Arg1 5 10 15<210>82<211>12<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T22-23<400>82Trp Leu Gln Gly Ser Gln Glu Leu Pro Arg Glu Lys1 5 10<210>83<211>21<212>PRT<213>人工序列<220>
<223>胰蛋白酶解肽片段H-T27-28<400>83Lys Gly Asp Thr Phe Ser Cys Met Val Gly His Glu Ala Leu Pro Leu1 5 10 15Ala Phe Thr Gln Lys20<210>84
<211>5118<212>DNA<213>人工序列<220>
<223>pDAB3014序列<400>84ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag 60ttagctcact cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg120tggaattgtg agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa180gcttcccggg aatgcggccg ctagctagcg gccgcattcc cgggaagcta gcggccgcat240tcccgggaag ctagcggccg cttcccggga agcttgggct gcaggtcaat cccattgctt300ttgaagcagc tcaacattga tctctttctc gaggtcattc atatgcttga gaagagagtc360gggatagtcc aaaataaaac aaaggtaaga ttacctggtc aaaagtgaaa acatcagtta420aaaggtggta taaagtaaaa tatcggtaat aaaaggtggc ccaaagtgaa atttactctt480ttctactatt ataaaaattg aggatgtttt tgtcggtact ttgatacgtc atttttgtat540gaattggttt ttaagtttat tcgcttttgg aaatgcatat ctgtatttga gtcgggtttt600aagttcgttt gcttttgtaa atacagaggg atttgtataa gaaatatctt taaaaaaacc660catatgctaa tttgacataa tttttgagaa aaatatatat tcaggcgaat tctcacaatg720aacaataata agattaaaat agctttcccc cgttgcagcg catgggtatt ttttctagta780aaaataaaag ataaacttag actcaaaaca tttacaaaaa caacccctaa agttcctaaa840gcccaaagtg ctatccacga tccatagcaa gcccagccca acccaaccca acccaaccca900ccccagtcca gccaactgga caatagtctc cacacccccc cactatcacc gtgagttgtc960cgcacgcacc gcacgtctcg cagccaaaaa aaaaaaaaga aagaaaaaaa agaaaaagaa 1020aaaacagcag gtgggtccgg gtcgtggggg ccggaaacgc gaggaggatc gcgagccagc 1080gacgaggccg gccctccctc cgcttccaaa gaaacgcccc ccatcgccac tatatacata 1140cccccccctc tcctcccatc cccccaaccc taccaccacc accaccacca cctccacctc 1200ctcccccctc gctgccggac gacgcctccc ccctccccct ccgccgccgc cgcgccggta 1260accaccccgc ccctctcctc tttctttctc cgtttttttt ttccgtctcg gtctcgatct 1320ttggccttgg tagtttgggt gggcgagagg cggcttcgtg cgcgcccaga tcggtgcgcg 1380ggaggggcgg gatctcgcgg ctggggctct cgccggcgtg gatccggccc ggatctcgcg 1440gggaatgggg ctctcggatg tagatctgcg atccgccgtt gttgggggag atgatggggg 1500gtttaaaatt tccgccatgc taaacaagat caggaagagg ggaaaagggc actatggttt 1560atatttttat atatttctgc tgcttcgtca ggcttagatg tgctagatct ttctttcttc 1620
tttttgtggg tagaatttga atccctcagc attgttcatc ggtagttttt cttttcatga1680tttgtgacaa atgcagcctc gtgcggagct tttttgtagg tagaccatgg cttctccgga1740gaggagacca gttgagatta ggccagctac agcagctgat atggccgcgg tttgtgatat1800cgttaaccat tacattgaga cgtctacagt gaactttagg acagagccac aaacaccaca1860agagtggatt gatgatctag agaggttgca agatagatac ccttggttgg ttgctgaggt1920tgagggtgtt gtggctggta ttgcttacgc tgggccctgg aaggctagga acgcttacga1980ttggacagtt gagagtactg tttacgtgtc acataggcat caaaggttgg gcctaggatc2040cacattgtac acacatttgc ttaagtctat ggaggcgcaa ggttttaagt ctgtggttgc2100tgttataggc cttccaaacg atccatctgt taggttgcat gaggctttgg gatacacagc2160ccggggtaca ttgcgcgcag ctggatacaa gcatggtgga tggcatgatg ttggtttttg2220gcaaagggat tttgagttgc cagctcctcc aaggccagtt aggccagtta cccagatctg2280aggtaccctg agctcggtcg cagcgtgtgc gtgtccgtcg tacgttctgg ccggccgggc2340cttgggcgcg cgatcagaag cgttgcgttg gcgtgtgtgt gcttctggtt tgctttaatt2400ttaccaagtt tgtttcaagg tggatcgcgt ggtcaaggcc cgtgtgcttt aaagacccac2460cggcactggc agtgagtgtt gctgcttgtg taggctttgg tacgtatggg ctttatttgc2520ttctggatgt tgtgtactac ttgggtttgt tgaattatta tgagcagttg cgtattgtaa2580ttcagctggg ctacctggac attgttatgt attaataaat gctttgcttt cttctaaaga2640tctttaagtg ctgaattcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg2700cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga2760agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct2820gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct2880cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc2940tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt3000ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa3060gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac3120gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat3180acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg3240aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc3300attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga3360tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga3420gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg3480
cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc3540tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac3600agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact3660tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca3720tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg3780tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact3840acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg3900accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg3960tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat4020cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc4080tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat4140actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt4200tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc4260cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt4320gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac4380tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt4440gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct4500gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga4560ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac4620acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg4680agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt4740cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc4800tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg4860gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc4920ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc4980ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag5040cgaggaagcg tgcgcagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg5100gccgattcat taatgcag 5118<210>85<211>l3680<212>DNA<213>人工序列
<220>
<223>pDAB8505序列<220>
<221>misc_feature<222>(1)..(13680)<223>n=a或c或g或t<400>85tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg120ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc180accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc240attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat300tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt360tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt acaccggtgt gatcatgggc420cgcgattaaa aatcccaatt atatttggtc taatttagtt tggtattgag taaaacaaat480tcgaaccaaa ccaaaatata aatatatagt ttttatatat atgcctttaa gactttttat540agaattttct ttaaaaaata tctagaaata tttgcgactc ttctggcatg taatatttcg600ttaaatatga agtgctccat ttttattaac tttaaataat tggttgtacg atcactttct660tatcaagtgt tactaaaatg cgtcaatctc tttgttcttc catattcata tgtcaaaatc720tatcaaaatt cttatatatc tttttcgaat ttgaagtgaa atttcgataa tttaaaatta780aatagaacat atcattattt aggtatcata ttgattttta tacttaatta ctaaatttgg840ttaactttga aagtgtacat caacgaaaaa ttagtcaaac gactaaaata aataaatatc900atgtgttatt aagaaaattc tcctataaga atattttaat agatcatatg tttgtaaaaa960aaattaattt ttactaacac atatatttac ttatcaaaaa tttgacaaag taagattaaa 1020ataatattca tctaacaaaa aaaaaaccag aaaatgctga aaacccggca aaaccgaacc 1080aatccaaacc gatatagttg gtttggtttg attttgatat aaaccgaacc aactcggtcc 1140atttgcaccc ctaatcataa tagctttaat atttcaagat attattaagt taacgttgtc 1200aatatcctgg aaattttgca aaatgaatca agcctatatg gctgtaatat gaatttaaaa 1260gcagctcgat gtggtggtaa tatgtaattt acttgattct aaaaaaatat cccaagtatt 1320aataatttct gctaggaaga aggttagcta cgatttacag caaagccaga atacaaagaa 1380ccataaagtg attgaagctc gaaatatacg aaggaacaaa tatttttaaa aaaatacgca 1440atgacttgga acaaaagaaa gtgatatatt ttttgttctt aaacaagcat cccctctaaa 1500
gaatggcagt tttcctttgc atgtaactat tatgctccct tcgttacaaa aattttggac1560tactattggg aacttcttct gaaaatagtg gccaccgctt aattaaggcg cgccatgccc1620ggccgcattc ccgggaagct aggccaccgt ggcccgcctg caggggaagc ttagctgaaa1680caacccggcc ctaaagcact atcgtatcac ctatctgaaa taagtcacgg gtttcgaacg1740tccacttgcg tcgcacggaa ttgcatgttt cttgttggaa gcatattcac gcaatctcca1800cacataaagg tttatgtata aacttacatt tagctcagtt taattacagt cttatttgga1860tgcatatgta tggttctcaa tccatataag ttagagtaaa aaataagttt aaattttatc1920ttaattcact ccaacatata tggattgagt acaatactca tgtgcatcca aacaaactac1980ttatattgag gtgaatttgg atagaaatta aactaactta cacactaagc caatctttac2040tatattaaag caccagtttc aacgatcgtc ccgcgtcaat attattaaaa aactcctaca2100tttctttata atcaacccgc actcttataa tctcttctct actactataa taagagagtt2160tatgtacaaa ataaggtgaa attatgtata agtgttctgg atattggttg ttggctccat2220attcacacaa cctaatcaat agaaaacata tgttttatta aaacaaaatt tatcatatat2280catatatata tatatacata tatatatata tatatataaa ccgtagcaat gcacgggcat2340ataactagtg caacttaata catgtgtgta ttaagatgaa taagagggta tccaaataaa2400aaacttgttc gcttacgtct ggatcgaaag gggttggaaa cgattaaatc tcttcctagt2460caaaattgaa tagaaggaga tttaatctct cccaatcccc ttcgatcatc caggtgcaac2520cgtataagtc ctaaagtggt gaggaacacg aaacaaccat gcattggcat gtaaagctcc2580aagaatttgt tgtatcctta acaactcaca gaacatcaac caaaattgca cgtcaagggt2640attgggtaag aaacaatcaa acaaatcctc tctgtgtgca aagaaacacg gtgagtcatg2700ccgagatcat actcatctga tatacatgct tacagctcac aagacattac aaacaactca2760tattgcatta caaagatcgt ttcatgaaaa ataaaatagg ccggacagga caaaaatcct2820tgacgtgtaa agtaaattta caacaaaaaa aaagccatat gtcaagctaa atctaattcg2880ttttacgtag atcaacaacc tgtagaaggc aacaaaactg agccacgcag aagtacagaa2940tgattccaga tgaaccatcg acgtgctacg taaagagagt gacgagtcat atacatttgg3000caagaaacca tgaagctgcc tacagccgtc tcggtggcat agaacacaag aaattgtgtt3060aattaatcaa agctataaat aacgctcgca tgcctgtgca cttctccatc accaccactg3120ggtcttcaga ccattagctt tatctactcc agagcgcaga agaacccgat cgacaccatg3180ggatggagct ggatctttct cttcctcctg tcaggagctg caggtgtcca ttgccaggtt3240cagctcgtgc agtcaggtgc tgaggtgaag aagcctggct cctcggtgaa ggtctcctgc3300aaggcttctg gaggttcctt cagctcctat gctatcaact gggtgaggca agctcctgga3360
caagggcttg agtggatggg agggctcatg cctatctttg ggacaacaaa ctacgcgcag3420aagttccagg acaggctcac gattaccgcg gacgtatcca cgagtacagc ctacatgcaa3480ctgagcggcc tgacatatga agacacggcc atgtattact gtgcgagagt tgcctacatg3540cttgaaccta ccgtcactgc aggtggtttg gacgtctggg gccaagggac cttggtcacc3600gtctcctccg catccccgac cagcccgaag gtcttcccgc tgagcctctg tagcacccag3660ccagatggga acgtggtcat cgcctgcctg gtccagggct tcttccctca ggagccactc3720agtgtgacct ggagcgaaag cggacagggc gtgaccgcca ggaacttccc acccagccag3780gatgcctccg gagacctgta caccacgtcc agccagctga cccttccggc cacacagtgc3840ctagcgggca agtccgtgac atgccacgtg aagcactaca cgaatcccag ccaggatgtg3900actgtgccct gcccagttcc ctcaactcca cctaccccat ctccctcgac tccacctacc3960ccatctccct catgctgcca ccccaggctg tcactgcaca ggcctgccct cgaggacctg4020ctcttaggtt cggaagcgaa cctcacgtgc acactcaccg gcctgagaga tgcgtcaggt4080gtcaccttca cctggacgcc ctcaagtggt aagagcgctg ttcaaggccc acctgagcgt4140gacctctgtg gctgctacag cgtgtccagt gtccttccgg gctgtgccga gccttggaat4200catgggaaga ccttcacttg cactgctgcc taccccgaga gcaagacccc gctaaccgcc4260accctctcga aatccggcaa cacattccgg cccgaggtcc acctgctgcc gccgccgtcg4320gaggagctgg ccctgaacga gctggtgacg ctgacgtgcc tggcgcgcgg cttcagcccc4380aaggacgtgc tggttcgctg gctgcagggc tcacaggagc tgcctaggga gaagtacctg4440acttgggcat cccggcagga gcccagccaa ggcaccacca ccttcgctgt gacctcgata4500ctgcgcgtgg cagccgagga ctggaagaag ggtgacacct tctcctgcat ggtgggccac4560gaggcccttc cgctggcctt cacacagaag accatcgacc gcttggcggg taaacccacc4620catgtcaatg tgtctgttgt catggcggag gtggacggca cctgctactg agagctcgct4680gagggcactg aagtcgcttg atgtgctgaa ttgtttgtga tgttggtggc gtattttgtt4740taaataagta agcatggctg tgattttatc atatgatcga tctttggggt tttatttaac4800acattgtaaa atgtgtatct attaataact caatgtataa gatgtgttca ttcttcggtt4860gccatagatc tgcttatttg acctgtgatg ttttgactcc aaaaaccaaa atcacaactc4920aataaactca tggaatatgt ccacctgttt cttgaagagt tcatctacca ttccagttgg4980catttatcag tgttgcagcg gcgctgtgct ttgtaacata acaattgtta cggcatatat5040ccaacggccg gcctagctag gccacggtgg ccagatccac tagttctaga gcggccgggc5100aagcggccgc attcccggga agctaggcca ccgtggcccg cctgcagggg aagcttagct5160gaaacaaccc ggccctaaag cactatcgta tcacctatct gaaataagtc acgggtttcg5220
aacgtccact tgcgtcgcac ggaattgcat gtttcttgtt ggaagcatat tcacgcaatc5280tccacacata aaggtttatg tataaactta catttagctc agtttaatta cagtcttatt5340tggatgcata tgtatggttc tcaatccata taagttagag taaaaaataa gtttaaattt5400tatcttaatt cactccaaca tatatggatt gagtacaata ctcatgtgca tccaaacaaa5460ctacttatat tgaggtgaat ttggatagaa attaaactaa cttacacact aagccaatct5520ttactatatt aaagcaccag tttcaacgat cgtcccgcgt caatattatt aaaaaactcc5580tacatttctt tataatcaac ccgcactctt ataatctctt ctctactact ataataagag5640agtttatgta caaaataagg tgaaattatg tataagtgtt ctggatattg gttgttggct5700ccatattcac acaacctaat caatagaaaa catatgtttt attaaaacaa aatttatcat5760atatcatata tatatatata catatatata tatatatata taaaccgtag caatgcacgg5820gcatataact agtgcaactt aatacatgtg tgtattaaga tgaataagag ggtatccaaa5880taaaaaactt gttcgcttac gtctggatcg aaaggggttg gaaacgatta aatctcttcc5940tagtcaaaat tgaatagaag gagatttaat ctctcccaat ccccttcgat catccaggtg6000caaccgtata agtcctaaag tggtgaggaa cacgaaacaa ccatgcattg gcatgtaaag6060ctccaagaat ttgttgtatc cttaacaact cacagaacat caaccaaaat tgcacgtcaa6120gggtattggg taagaaacaa tcaaacaaat cctctctgtg tgcaaagaaa cacggtgagt6180catgccgaga tcatactcat ctgatataca tgcttacagc tcacaagaca ttacaaacaa6240ctcatattgc attacaaaga tcgtttcatg aaaaataaaa taggccggac aggacaaaaa6300tccttgacgt gtaaagtaaa tttacaacaa aaaaaaagcc atatgtcaag ctaaatctaa6360ttcgttttac gtagatcaac aacctgtaga aggcaacaaa actgagccac gcagaagtac6420agaatgattc cagatgaacc atcgacgtgc tacgtaaaga gagtgacgag tcatatacat6480ttggcaagaa accatgaagc tgcctacagc cgtctcggtg gcatagaaca caagaaattg6540tgttaattaa tcaaagctat aaataacgct cgcatgcctg tgcacttctc catcaccacc6600actgggtctt cagaccatta gctttatcta ctccagagcg cagaagaacc cgatcgacac6660catgggatgg tcctggatct ttctcttcct tctgtcagga gctgcaggtg tccactgcga6720gatcgtgctc acgcagtctc caggcaccct gtctttgtcg ccaggggaac gtgccaccct6780ctcctgccgg gccagtcagt ccgtttccag cgcgtacctt gcctggtacc agcagaagcc6840tggccaagct cccaggctcc tcatctatgg tgcgtccagc agggctactg gcattccaga6900ccgcttctca ggcagtgggt ctgggacaga cttcacgctc accattagca ggctggaacc6960tgaggatttt gcagtgtact actgtcagca gtatggtcgc tcacccacgt tcggccaggg7020gaccaaggtg gagatcaagc gcactgtggc tgcaccgtcg gtcttcatat tcccgccatc7080
cgatgagcag ctgaagtctg gcactgcctc tgttgtgtgc ctgctgaata acttctatcc7140gagagaggcg aaggtacagt ggaaggtgga taacgccctc caatcgggta actcccaaga7200gtccgttaca gagcaggaca gcaaggacag cacctacagc ctcagcaaca ccttgacgct7260gagcaaagcg gactacgaga aacacaaggt ctacgcctgc gaagtcaccc atcaaggcct7320gcgctcgccc gtcacaaaga gcttcaaccg gggagagtgt tgagagctcg ctgagggcac7380tgaagtcgct tgatgtgctg aattgtttgt gatgttggtg gcgtattttg tttaaataag7440taagcatggc tgtgatttta tcatatgatc gatctttggg gttttattta acacattgta7500aaatgtgtat ctattaataa ctcaatgtat aagatgtgtt cattcttcgg ttgccataga7560tctgcttatt tgacctgtga tgttttgact ccaaaaacca aaatcacaac tcaataaact7620catggaatat gtccacctgt ttcttgaaga gttcatctac cattccagtt ggcatttatc7680agtgttgcag cggcgctgtg ctttgtaaca taacaattgt tacggcatat atccaacggc7740cggcctagct aggccacggt ggccagatcc actagttcta gagcggccgc ttaattaaat7800ttaaatgttt aaactaggaa atccaagctt gggctgcagg tcaatcccat tgcttttgaa7860gcagctcaac attgatctct ttctcgaggt cattcatatg cttgagaaga gagtcgggat7920agtccaaaat aaaacaaagg taagattacc tggtcaaaag tgaaaacatc agttaaaagg7980tggtataagt aaaatatcgg taataaaagg tggcccaaag tgaaatttac tcttttctac8040tattataaaa attgaggatg ttttgtcggt actttgatac gtcatttttg tatgaattgg8100tttttaagtt tattcgcgat tttggaaatg catatctgta tttgagtcgg gttttaagtt8160cgtttgcttt tgtaaataca gagggatttg tataagaaat atctttaaaa aaaccatatg8220ctaatttgac ataatttttg agaaaaatat atattcaggc gaattctcac aatgaacaat8280aataagatta aaatagcttg cccccgttgc agcgatgggt attttttcta gtaaaataaa8340agataaactt agactcaaaa catttacaaa aacaacccct aaagtcctaa agcccaaagt8400gctatgcacg atccatagca agcccagccc aacccaaccc aacccaaccc accccagtgc8460agccaactgg caaatagtct ccacaccccg gcactatcac cgtgagttgt ccgcaccacc8520gcacgtctcg cagccaaaaa aaaaaaaaga aagaaaaaaa agaaaaagaa aaaacagcag8580gtgggtccgg gtcgtggggg ccggaaaagc gaggaggatc gcgagcagcg acgaggccgg8640ccctccctcc gcttccaaag aaacgccccc catcgccact atatacatac ccccccctct8700cctcccatcc ccccaaccct accaccacca ccaccaccac ctcctccccc ctcgctgccg8760gacgacgcct cccccctccc cctccgccgc cgccggtaac caccccgccc ctctcctctt8820tctttctccg tttttttttt cgtctcggtc tcgatctttg gccttggtag tttgggtggg8880cgagagcggc ttcgtcgccc agatcggtgc gcgggagggg cgggatctcg cggctggcgt8940
ctccgggcgt gagtcggccc ggatcctcgc ggggaatggg gctctcggat gtagatctgc9000gatccgccgt tgttggggga gatgatgggg ggtttaaaat ttccgccatg ctaaacaaga9060tcaggaagag gggaaaaggg cactatggtt tatattttta tatatttctg ctgcttcgtc9120aggcttagat gtgctagatc ttctttcttt cttctttttg tgggtagaat ttgaatccct9180cagcattgtt catcggtagt ttttcttttc atgatttgtg acaaatgcag cctcgtgcgg9240agcttttttg taggtagacc atggcttctc cggagaggag accagttgag attaggccag9300ctacagcagc tgatatggcc gcggtttgtg atatcgttaa ccattacatt gagacgtcta9360cagtgaactt taggacagag ccacaaacac cacaagagtg gattgatgat ctagagaggt9420tgcaagatag atacccttgg ttggttgctg aggttgaggg tgttgtggct ggtattgctt9480acgctgggcc ctggaaggct aggaacgctt acgattggac agttgagagt actgtttacg9540tgtcacatag gcatcaaagg ttgggcctag gatccacatt gtacacacat ttgcttaagt9600ctatggaggc gcaaggtttt aagtctgtgg ttgctgttat aggccttcca aacgatccat9660ctgttaggtt gcatgaggct ttgggataca cagcccgggg tacattgcgc gcagctggat9720acaagcatgg tggatggcat gatgttggtt tttggcaaag ggattttgag ttgccagctc9780ctccaaggcc agttaggcca gttacccaga tctgaggtac caatgagctc ggtcgcagcg9840tgtgcgtgtc cgtcgtacgt tctggccggc cgggccttgg gcgcgcgatc agaancgttg9900cgttggcgtg tgtgtgcttc tggtttgctt taattttacc aagtttgttt caaggtggat9960cgcgtggtca aggcccgtgt gctttaaana cccaccggca ctggcagtga gtgttgctgc 10020ttgtgtaggc tttggtacgt atgggcttta tttgcttctg gatgttgtgt actacttggg 10080tttgttgaat tattatganc agttgcgtat tgtaattcag ctgggctacc tggacattgt 10140tatgtattaa taaatgcttt gctttcttct aaagatcttt aagtgctgaa ttcatatttc 10200ctcctgcagg gtttaaactt gccgtggcct attttcagaa gaagttccca atagtagtcc 10260aaaatttttg taacgaaggg agcataatag ttacatgcaa aggaaaactg ccattcttta 10320gaggggatgc ttgtttaaga acaaaaaata tatcactttc ttttgttcca agtcattgcg 10380tattttttta aaaatatttg ttccttcgta tatttcgagc ttcaatcact ttatggttct 10440ttgtattctg gctttgctgt aaatcgtagc taaccttctt cctagcagaa attattaata 10500cttgggatat ttttttagaa tcaagtaaat tacatattac caccacatcg agctgctttt 10560aaattcatat tacagccata taggcttgat tcattttgca aaatttccag gatattgaca 10620acgttaactt aataatatct tgaaatatta aagctattat gattaggggt gcaaatggac 10680cgagttggtt cggtttatat caaaatcaaa ccaaaccaac tatatcggtt tggattggtt 10740cggttttgcc gggttttcag cattttctgg tttttttttt gttagatgaa tattatttta 10800
atcttacttt gtcaaatttt tgataagtaa atatatgtgt tagtaaaaat taattttttt 10860tacaaacata tgatctatta aaatattctt ataggagaat tttcttaata acacatgata 10920tttatttatt ttagtcgttt gactaatttt tcgttgatgt acactttcaa agttaaccaa 10980atttagtaat taagtataaa aatcaatatg atacctaaat aatgatatgt tctatttaat 11040tttaaattat cgaaatttca cttcaaattc gaaaaagata tataagaatt ttgatagatt 11100ttgacatatg aatatggaag aacaaagaga ttgacgcatt ttagtaacac ttgataagaa 11160agtgatcgta caaccaatta tttaaagtta ataaaaatgg agcacttcat atttaacgaa 11220atattacatg ccagaagagt cgcaaatatt tctagatatt ttttaaagaa aattctataa 11280aaagtcttaa aggcatatat ataaaaacta tatatttata ttttggtttg gttcgaattt 11340gttttactca ataccaaact aaattagacc aaatataatt gggattttta atcgcggccc 11400actagtcacc ggtgtgcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 11460atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 11520cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 11580gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 11640gtattgggcg ctcttccgct gcgcacgctg cgcacgctgc gcacgcttcc tcgctcactg 11700actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 11760tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 11820aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 11880ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 11940aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 12000cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 12060cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 12120aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 12180cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 12240ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 12300ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 12360gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 12420agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 12480acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 12540tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 12600agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 12660
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 12720agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 12780cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 12840ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 12900cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 12960cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 13020ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 13080tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 13140catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 13200gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 13260gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 13320tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 13380catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 13440aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 13500attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 13560aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag 13620aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 13680
权利要求
1.植物产生的免疫球蛋白,其中该免疫球蛋白具有含至少一种缺少岩藻糖的糖肽的糖肽谱。
2.权利要求1的免疫球蛋白,其中所述至少一种糖肽含有天冬酰胺(Asn)残基。
3.植物产生的免疫球蛋白的重链(HC)或者轻链(LC),其中HC或者LC具有含至少一种缺少岩藻糖的糖肽的糖肽谱。
4.权利要求3的HC,其中所述至少一种糖肽含有CH2区域中的天冬酰胺(Asn)残基。
5.植物产生的免疫球蛋白,其中该免疫球蛋白具有含至少一种缺少岩藻糖的聚糖的游离聚糖谱。
6.权利要求5的免疫球蛋白,其中该免疫球蛋白含有天冬酰胺(Asn)残基。
7.权利要求5的免疫球蛋白,其中所述聚糖谱与
图12中提供的聚糖谱相同或者基本上相同。
8.权利要求5的免疫球蛋白,其中所述聚糖选自3Man,2GlcNAc,1Xyl;2Man,2GlcNAc,1Xyl;3Man,3GlcNAc,1Xyl;3Man,2GlcNAc;3Man,3GlcNAc;4Man,2GlcNAc;5Man,2GlcNAc;和6Man,2GlcNAc,其中Man=甘露糖,GlcNAc=N-乙酰葡糖胺,Xyl=木糖。
9.权利要求5的免疫球蛋白,其中所述聚糖为3Man,2GlcNAc,1Xyl或2Man,2GlcNAc,1Xyl,其中Man=甘露糖,GlcNAc=N-乙酰葡糖胺,Xyl=木糖。
10.权利要求5的免疫球蛋白,其中所述聚糖谱与
图16中提供的聚糖谱之一相同或者基本上相同。
11.权利要求5的免疫球蛋白,其中所述聚糖选自H2N2X;H3N2;和H3N2X,其中H=己糖,N=HexNAc=N-乙酰己糖,X=木糖。
12.权利要求5的免疫球蛋白,其中所述聚糖选自N2H8;N2H3X;N2H3X;N2H4X;N2H5;N2H6;N2H7;N2H8;N3H3X;N2H4;和N2H5,其中H=己糖,N=HexNAc=N-乙酰己糖,X=木糖。
13.权利要求11或权利要求12的免疫球蛋白,其中己糖为甘露糖,N-乙酰己糖为N-乙酰葡糖胺。
14.权利要求1或权利要求5的免疫球蛋白,其中该免疫球蛋白选自IgG、IgA、IgM、IgE和IgD。
15.权利要求14的免疫球蛋白,其中该免疫球蛋白是IgA或者IgG。
16.权利要求14的免疫球蛋白,其中该免疫球蛋白是具有重链和轻链的IgA抗体。
17.权利要求16的免疫球蛋白,其中该免疫球蛋白是抗单纯疱疹病毒抗体。
18.权利要求14的免疫球蛋白,其中该免疫球蛋白是具有重链和轻链的IgG抗体。
19.权利要求18的免疫球蛋白,其中该免疫球蛋白是抗-双整联蛋白抗体。
20.权利要求19的免疫球蛋白,其中该免疫球蛋白是抗-αVβ3,αVβ5双整联蛋白抗体。
21.权利要求5的免疫球蛋白,其中所述聚糖谱与
图19中提供的聚糖谱相同或者基本上相同。
22.权利要求5的免疫球蛋白,其中所述聚糖谱与图21中提供的聚糖谱相同或者基本上相同。
23.权利要求5的免疫球蛋白,其中所述聚糖谱与图23中提供的聚糖谱相同或者基本上相同。
24.植物产生的免疫球蛋白,其含有至少一种没有末端岩藻糖的附着聚糖。
25.权利要求24的免疫球蛋白,其中该免疫球蛋白在CH2区域中含有天冬酰胺(Asn)残基。
26.植物产生的免疫球蛋白,其具有含至少一种缺少岩藻糖的聚糖的聚糖谱,其中使用基质-辅助的激光解吸/电离飞行时间质谱(MALDI-TofMS)分析从该免疫球蛋白酶促释放的游离N-连接的聚糖来确定该聚糖谱。
27.权利要求26的免疫球蛋白,其中该免疫球蛋白是IgA。
28.权利要求27的免疫球蛋白,其中该免疫球蛋白是抗-单纯疱疹病毒抗体。
29.权利要求26的免疫球蛋白,其中该免疫球蛋白是IgG。
30.权利要求29的免疫球蛋白,其中该免疫球蛋白是抗-双整联蛋白抗体。
31.权利要求30的免疫球蛋白,其中该免疫球蛋白是抗-αVβ3,αVβ5双整联蛋白抗体。
32.含有权利要求1或权利要求5的免疫球蛋白的植物细胞、植物组织、植物愈伤组织、小植株、全株植物或者种子。
33.权利要求32的植物细胞、植物组织、植物愈伤组织、或者种子,其中该细胞、组织、愈伤组织或者种子是单子叶植物的细胞、组织、愈伤组织或者种子。
34.权利要求33的植物细胞、植物组织、植物愈伤组织、或者种子,其中该单子叶植物是玉米植物。
35.权利要求32的小植株或者全株植物,其中该小植株或者全株植物是单子叶植物的。
36.权利要求35的植物细胞、植物组织、植物愈伤组织、或者种子,其中该单子叶植物是玉米植物。
37.权利要求32的种子,其中免疫球蛋白位于种子的胚乳中。
38.权利要求1或权利要求5的免疫球蛋白,其中该免疫球蛋白是人免疫球蛋白。
39.权利要求1或权利要求5的免疫球蛋白,其中该免疫球蛋白含有缺少尾片的重链。
40.权利要求39的免疫球蛋白,其中该免疫球蛋白是IgA抗体。
41.权利要求39的免疫球蛋白,其中该免疫球蛋白是抗-单纯疱疹病毒抗体。
42.权利要求3的免疫球蛋白,其中该免疫球蛋白的重链缺少尾片。
43.权利要求42的免疫球蛋白,其中该免疫球蛋白是IgA抗体。
44.权利要求43的免疫球蛋白,其中该免疫球蛋白是抗-单纯疱疹病毒抗体。
45.权利要求1或权利要求5的免疫球蛋白,其中该免疫球蛋白从用于生产该免疫球蛋白的植物分离。
46.单体抗体组合物,其含有至少一种具有如
图12中提供的结构1(3Man,2GlcNAc,1Xyl)的聚糖,其中Man=甘露糖,GlcNAc=乙酰葡糖胺,Xyl=木糖。
47.单体抗体组合物,其含有至少一种具有如
图12中提供的结构2(2Man,2GlcNAc,1Xyl)的聚糖,其中Man=甘露糖,GlcNAc=乙酰葡糖胺,Xyl=木糖。
48.植物产生的免疫球蛋白,其含有缺少附着的具有岩藻糖的聚糖的氨基酸片段,其中当该免疫球蛋白是哺乳动物产生的时候,该免疫球蛋白在相同的氨基酸片段或者基本上相同的氨基酸片段上具有附着的带岩藻糖的聚糖。
49.植物产生的免疫球蛋白,其中对于特定氨基酸片段,其含有聚糖谱,其中当该免疫球蛋白是哺乳动物产生的时候,对于相同的氨基酸序列或者基本上相同的氨基酸片段,该免疫球蛋白具有相同或者基本上相同的聚糖谱。
50.植物产生的免疫球蛋白,其包含具有缺少岩藻糖的附着聚糖的氨基酸片段,其中当该免疫球蛋白是哺乳动物产生的时候,该免疫球蛋白在相同的氨基酸片段或者基本上相同的氨基酸片段上也缺少具有岩藻糖的附着聚糖。
51.植物产生的免疫球蛋白,其中该免疫球蛋白具有游离聚糖谱,该聚糖谱含有缺少岩藻糖的聚糖,其中当该免疫球蛋白是哺乳动物产生的时候,该免疫球蛋白具有含相同的也缺少岩藻糖的聚糖的游离聚糖谱。
52.权利要求48、权利要求49、权利要求50、或权利要求51的免疫球蛋白,其中所述哺乳动物产生的免疫球蛋白在CHO细胞中产生。
53.权利要求48、权利要求49、权利要求50、或权利要求51的免疫球蛋白,其中所述植物产生的免疫球蛋白在玉米细胞中产生并且所述哺乳动物产生的免疫球蛋白在CHO细胞中产生。
54.产生表达免疫球蛋白的转化植物细胞的方法,其中所述免疫球蛋白具有至少一种没有岩藻糖的附着聚糖,所述方法包括通过向植物细胞导入含有编码该免疫球蛋白的重链和轻链的核酸序列的单一载体,转化植物细胞,其中每种核酸有效连接启动子;和培养经转化的植物细胞以产生表达免疫球蛋白的植物细胞,其中该免疫球蛋白具有至少一种没有岩藻糖的附着聚糖。
55.权利要求54的方法,其还包括从经转化的植物细胞分离免疫球蛋白。
56.权利要求54的方法,其还包括从经转化的植物细胞再生转化的植物愈伤组织或者转化的全株植物。
57.权利要求56的方法,其还包括从转化的植物愈伤组织或者转化的全株植物分离免疫球蛋白。
58.权利要求54的方法,其中重链和轻链的序列有效连接到相同启动子上。
59.权利要求54的方法,其中重链和轻链的序列有效连接到不同启动子上。
60.权利要求54的方法,其中启动子是组成性启动子。
61.权利要求60的方法,其中组成性启动子是35S CaMV启动子或者玉米泛素-1启动子。
62.权利要求54的方法,其中启动子是种子-特异启动子。
63.权利要求54的方法,其中启动子是胚乳-特异的启动子。
64.权利要求54的方法,其中载体选自pDAB8505、pDAB1472、pDAB1473、pDAB1474、和pDAB1475。
65.选自pDAB8505、pDAB1472、pDAB1473、pDAB1474、和pDAB1475的载体。
66.权利要求54的方法,其中用农杆菌-介导的转化方法或者WHISKERSTM转化方法转化植物细胞。
67.产生分离的单体抗-单纯疱疹病毒抗体的方法,该方法包括(i)向植物细胞中导入具有SEQ ID NO1或SEQ ID NO5和SEQ ID NO9或SEQ ID NO13的核酸--每种核酸均与启动子有效连接,以产生转化的植物细胞;(ii)培养该转化的植物细胞以表达所导入的核酸;和(iii)分离该植物细胞产生的单体抗-单纯疱疹病毒抗体。
68.权利要求67的方法,其还包括从转化的植物细胞再生转化的植物。
69.含有选自SEQ ID NO15(pDAB635)、SEQ ID NO16(pDAB16)、SEQ ID NO17(pDAB637)、SEQ ID NO84(pDAB3014)、和SEQ ID NO85(pDAB8505)的核酸序列的核酸分子。
70.含有编码SEQ ID NO10或SEQ ID NO14所编码的氨基酸的核酸序列的经分离的核酸分子。
71.含有SEQ ID NO1或SEQ ID NO5的经分离的核酸分子。
72.含有SEQ ID NO9或SEQ ID NO13的经分离的核酸分子。
73.含有SEQ ID NO1或SEQ ID NO5的经分离的载体或者质粒。
74.含有编码SEQ ID NO2或SEQ ID NO6所编码的氨基酸的核酸序列的经分离的核酸分子。
75.权利要求1的免疫球蛋白,其中该免疫球蛋白含有包含SEQ IDNO6的氨基酸序列的重链。
76.权利要求1的免疫球蛋白,其中该免疫球蛋白含有包含SEQ IDNO14的氨基酸序列的轻链。
77.含有SEQ ID NO9或SEQ ID NO13的分离的载体或者质粒。
全文摘要
本发明涉及免疫球蛋白的植物生产,其中附着到该免疫球蛋白上的至少一部分聚糖缺少岩藻糖。本发明还提供了用于产生这些免疫球蛋白的构建体、质粒、载体、经转化的植物细胞、经转化的植物愈伤组织、经转化的植物组织(例如,叶子、种子、块茎,等等)和经转化的全株植物;还提供了产生免疫球蛋白的方法、通过所公开的方法产生的免疫球蛋白,和这些免疫球蛋白的用途。
文档编号A01H1/00GK1984993SQ200380109232
公开日2007年6月20日 申请日期2003年11月28日 优先权日2002年11月27日
发明者K·布里格斯, T·格兰茨, M·B·海因, A·C·希亚特, A·S·卡诺乌普, W·H·K·安德逊, D·帕雷蒂, J·佩托利洛, B·鲁宾-威尔逊, D·泰勒, J·L·罗伯茨 申请人:陶氏化学公司, 美国陶氏益农公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1