免疫原性多肽表层表达双歧杆菌的制作方法_3

文档序号:9354524阅读:来源:国知局
精氨酸)取代为Q(谷氨酰 胺:1144位)、L(亮氨酸:114 5位))(图10)
[0116] TGSVVIVGRIILSGITAYSQQTRGLLGCIITSLTGRDKNQVEGEVQVVSTATQSFLATCINGVCWTVYH GAGSKTLAGPKGPITQMYTNVDQDLVGWPAPPGARSMTPCTCGSSDLYLVTRHADVIPVRQLGDSRGSLLSPRPISY LKGSSGGPLLCPSGHVVGIFRAAVCTRGVAKAVD(序列号 19 :图 10 中的 TGSVVIVGRIILSG(序列号 20)源自NS4A区域)。
[0117] 双歧杆菌表层表达的丙型肝炎病毒(HCV)免疫原性多肽能够将上述基础结构域 (1)~⑷中的1个以上作为基础结构域含有。例如,基础结构域⑴~⑷可以单独使用 或与其它1个以上的基础结构域组合使用。
[0118] 基础结构域(1),例如,含有 ETTMRSPVFTDNSTPPAVP(1202 位~1220 位,CD4 表位 2 : 序列号 13)、ITYSTYGK(1291 位~1298 位,CD8 表位 3 :序列号 6)和 GGCSGGAYDIIICDECHST DSTSILGIG(1303 位~1330 位,CD4 表位 3 :序列号 14)。
[0119] 基础结构域(2),例如,含有 TPAETSVRLRAYLNTPG(1531 位~1547 位,CD4 表位 4 : 序列号15)和GAVQNEVTL(1629位~1637位,CD8表位8 :序列号11)。
[0120] 基础结构域(3),例如,含有EIPFYGKAI (1372位~1380位,⑶8表位4 :序列号7)、 LIFCHSKQL(1391 位~1399 位,将 CD8 表位 5 的 KK 取代为 QL :序列号 21)、KLSALGVNA(1406 位~1414 位,CD8 表位 6 :序列号 9)和 VATDALMTGYTCDFDSVIDC(1435 位~1454 位,CD8 表 位7 :序列号10)。
[0121] 基础结构域(4),例如,含有 QSFLATCINGVCWTVYHGAG(1067 位~1086 位,CD8 表位 1 :序列号4)、LYLVTRHADVIPVRQL⑶SR(1130位~1149位,将CD4表位1中的RR取代为QL : 序列号22)和LLCPSGHVV(1169位~1177位,CD8表位2 :序列号5)。
[0122] 在基础结构域的N末端侧和/或C末端侧连结HCV抗原肽的至少一个。该抗原肽 包含例如含有选自以下的氨基酸序列的肽:
[0123] QSFLATCINGVCWTVYHGAG (序列号 4)、
[0124] LYLVTRHADVIPVRRRGDSR(序列号 12)、
[0125] LLCPSGHVV (序列号 5)、
[0126] ETTMRSPVFTDNSTPPAVP (序列号 13)、
[0127] ITYSTYGK (序列号 6)、
[0128] GGCSGGAYDIIICDECHSTDSTSILGIG(序列号 14)、
[0129] EIPFYGKAI (序列号 7)、
[0130] LIFCHSKKK (序列号 8)、
[0131] KLSALGVNA (序列号 9)、
[0132] VATDALMTGYTCDFDSVIDC (序列号 10)、
[0133] TPAETSVRLRAYLNTPG(序列号 15)、和
[0134] GAVQNEVTL (序列号 11)。
[0135] 上述肽是源自HCV-lb型抗原多肽的NS3蛋白的⑶4表位或⑶8表位。⑶4表位和 CDS表位如图1所示配置,但与基础结构域连结的抗原肽的表位的种类和个数、相对于基础 结构域的连结位置(N末端侧还是C末端侧)和在末端连结多个时的连结顺序无关。作为 抗原肽,也能够使用上述基础结构域(1)~(4)这样的含有表位的区域。抗原肽也可以与 配置于基础结构域的表位重复。例如,可以选择所连结的抗原肽,以使得能够通过该抗原肽 的表位与基础结构域内的表位发挥免疫原性。
[0136] 抗原肽内的上述CD4表位或CD8表位只要具有发挥抗原性的能力,则也可以在氨 基酸中具有1个以上(例如,1个或数个)的取代、插入和/或缺失。例如,抗原肽可以包 含:进一步添加上述表位所来源(即,本来存在)的蛋白质内的该表位的N末端和/或C末 端延伸的区域所来源的1个以上的氨基酸(优选为1~5个氨基酸)所构成的氨基酸序列、 从该表位的氨基酸序列的N末端或C末端的任一个末端缺失1个以上的氨基酸(优选为3 个氨基酸以内)、或取代该表位的氨基酸序列中的1个以上的氨基酸(优选为3个氨基酸以 内)、或这些的组合。双歧杆菌表层表达用HCV抗原多肽中所使用的抗原肽只要具有发挥 抗原性的能力,则也可以具有相对于上述CD4表位或CD8表位的肽的氨基酸序列具有至少 90 %、更优选至少95 %、更加优选至少99 %的序列同一性%的氨基酸序列。
[0137] 在作为基础结构域选择的本来的NS3蛋白所对应的区域的氨基酸序列内,同种或 不同种的碱性氨基酸(组氨酸、赖氨酸和精氨酸)连续2个氨基酸以上时,可以取代为其它 的氨基酸,以实现所期望的作用(基础结构域的立体结构和分泌能力)。取代后的氨基酸为 碱性氨基酸以外即可,例如,为丙氨酸、蛋氨酸、谷氨酸、谷氨酰胺和亮氨酸,优选为谷氨酸、 谷氨酰胺和亮氨酸,更优选为以谷氨酰胺和亮氨酸的顺序形成序列取代。
[0138] 基础结构域只要能保持其结构域的立体结构且具有细胞分泌能力,则也可以在氨 基酸中具有1个以上(例如,1个或数个)的取代、插入和/或缺失。基础结构域可以包含: 进一步添加基础结构域所来源(即,本来存在)的NS3蛋白内的该基础结构域所对应的区 域的N末端和/或C末端延伸的区域所来源的1个以上的氨基酸(优选为1~5个氨基 酸)所构成的氨基酸序列、从该基础结构域的氨基酸序列的N末端或C末端的任一个末端 缺失1个以上的氨基酸(优选为3个氨基酸以内)、或取代该基础结构域的氨基酸序列中的 1个以上的氨基酸(优选为3个氨基酸以内)、或这些的组合。双歧杆菌表层表达用HCV抗 原多肽中所使用的基础结构域只要能够保持结构域的立体结构且具有用于表层表达的细 胞分泌能力,则也可以具有相对于上述基础结构域(1)~(4)的氨基酸序列具有至少90%、 更优选至少95 %、更加优选至少99 %的序列同一性%的氨基酸序列。
[0139] 在基础结构域⑴的情况下,优选在基础结构域的N末端侧可连结含有 QSFLATCINGVCWTVYHGAG(1067位~1086位,CD8表位1 :序列号4)的区域,并且在C末 端侧可连结以不同顺序含有EIPFYGKAI (1372位~1380位,⑶8表位4 :序列号7)、 KLSALGVNA(1406 位~1414 位,CD8 表位 6 :序列号 9)和 VATDALMTGYTCDFDSVIDC(1435 位~ 1454位,⑶8表位7:序列号10)的至少一个的区域;更优选可连结含有EIPFYGKAI (1372 位~1380位,CD8表位4 :序列号7)的区域、或(优选以该顺序)含有(EIPFYGKAI (1372 位~1380位,CD8表位4:序列号7)、KLSALGVNA(1406位~1414位,CD8表位6:序列号9) 和VATDALMTGYTCDFDSVIDC(1435位~1454位,⑶8表位7:序列号10)的区域(这些只要具 有发挥抗原性的能力,则也可以含有具有相对于明示的序列号所记载的氨基酸序列具有至 少90 %、更优选至少95 %、更加优选至少99 %的序列同一性%的氨基酸序列的肽)。基础 结构域⑴时的合成蛋白质的例子,例如,如图2的氨基酸序列1和2所示(图2中,用大 文字表示基础结构域的序列,用小文字表示抗原肽区域的序列,并且,分别用下划线、双下 划线表示CD8表位和CD4表位)。
[0140] 在基础结构域⑵的情况下,优选在基础结构域的N末端侧可连结含有 QSFLATCINGVCWTVYHGAG(1067位~1086位,CD8表位1 :序列号4)的区域。在C末端侧可连 结以不同顺序含有EIPFYGKAI (1372位~1380位,CD8表位4 :序列号7)、KLSALGVNA(1406 位~1414 位,CD8 表位 6 :序列号 9)和 VATDALMTGYTCDFDSVIDC(1435 位~1454 位,CD8 表 位7 :序列号10)的至少一个的区域;更优选可连结(优选以该顺序)含有EIPFYGKAI (1372 位~1380位,CD8表位4 :序列号7)、KLSALGVNA(1406位~1414位,CD8表位6 :序列号9) 和VATDALMTGYTCDFDSVIDC(1435位~1454位,⑶8表位7 :序列号10)的区域(这些只要具 有发挥抗原性的能力,则也可以含有具有相对于明示的序列号所记载的氨基酸序列具有至 少90 %、更优选至少95 %、更加优选至少99 %的序列同一性%的氨基酸序列的肽)。基础 结构域(2)时的合成蛋白质的例子,例如,如图8的氨基酸序列所示(图8中,用大文字表 示基础结构域的序列,用小文字表示抗原肽区域的序列,并且,分别用下划线、双下划线表 示CD8表位和CD4表位)。
[0141] 在基础结构域(3)的情况下,优选在基础结构域的N末端侧可连结含有 QSFLATCINGVCWTVYHGAG(1067位~1086位,CD8表位1 :序列号4)的区域。在C末端侧可连 结含有TPAETSVRLRAYLNTPG(1531位~1547位,⑶4表位4 :序列号15)的区域(这些只要 具有发挥抗原性的能力,则也可以含有具有相对于明示的序列号所记载的氨基酸序列具有 至少90%、更优选至少95 %、更加优选至少99%的序列同一性%的氨基酸序列的肽)。基 础结构域(3)时的合成蛋白质的例子,例如,如图9的氨基酸序列所示(图9中,用大文字 表示基础结构域的序列,用小文字表示抗原肽区域的序列,并且,分别用下划线、双下划线 表示CD8表位和CD4表位,粗体字的"QL"表示取代后氨基酸)。
[0142] 在基础结构域(4)的情况下,优选在基础结构域的N末端侧不连结抗原肽,在C 末端侧可连结含有ETTMRSPVFIDNSTPPAVP(1202位~1220位,CD4表位2 :序列号13)、 ITYSTYGK(1291 位~1298 位,CD8 表位 3 :序列号 6)和 GGCSGGAYDIIICDECHSTDSTSILG IG (1303位~1330位,⑶4表位3 :序列号14)的基础结构域(1)(或者只要能够保持该结构 域的立体结构且具有用于表层表达的细胞分泌能力,具有相对于上述基础结构域(1)的氨 基酸序列具有至少90%、更优选至少95%、更加优选至少99 %的序列同一性%的氨基酸序 列)的区域,进一步可连结以不同顺序含有EIPFYGKAI (1372位~1380位,CD8表位4 :序列 号 7)、KLSALGVNA(1406 位~1414 位,CD8 表位 6 :序列号 9)和 VATDALMTGYTCDFDSVIDC(1435 位~1454位,CD8表位7 :序列号10)的至少一个的区域;优选可连接(优选以该顺序)含 有 EIPFYGKAI (1372 位~1380 位,CD8 表位 4 :序列号 7)、KLSALGVNA (1406 位~1414 位,CD8 表位6 :序列号9)和VATDALMTGYTCDFDSVIDC(1435位~1454位,CD8表位7 :序列号10)的 区域(这些只要具有发挥抗原性的能力,则也可以含有具有相对于明示的序列号所记载的 氨基酸序列具有至少90 %、更优选至少95 %、更加优选至少99 %的序列同一性%的氨基酸 序列的肽)。基础结构域(4)时的合成蛋白质的例子,例如,如图10的氨基酸序列所示(图 10中,用大文字表示基础结构域的序列,用小文字表示抗原肽区域的序列,并且,分别用下 划线、双下划线表示CD8表位和CD4表位;粗体字的"QL"表示取代后氨基酸)。
[0143] (双歧杆菌表层提呈融合蛋白)
[0144] 本发明中,在双歧杆菌的表层所表达?提呈的免疫原性多肽作为与GLBP的融合蛋 白表达。该融合蛋白从N末端以GLBP和目的免疫原性多肽的顺序连结。
[0145] 用于表达该融合蛋白的基因含有编码目的免疫原性多肽的基因和编码GLBP的基 因(也称为免疫原性多肽表层表达框基因)。
[0146] 编码目的免疫原性多肽的基因位于编码GLBP的基因的3'末端侧。免疫原性多肽 表层表达框基因可以是将编码目的免疫原性多肽的基因与编码GLBP的基因的3'末端侧连 结的融合基因,或者也可以在编码GLBP的基因与编码目的免疫原性多肽的基因之间配置 编码适当长度的接头的基因。
[0147](转化双歧杆菌的制备)
[0148] 以下,对将目的免疫原性多肽在双歧杆菌表层作为融合蛋白而表达?提呈的转化 双歧杆菌的制备步骤的一例进行说明。
[0149] 1?基因的获得
[0150] 编码GLBP的基因和编码目的免疫原性多肽的基因能够分别基于公知的基因序列 或氨基酸序列信息得到。例如,以从任意的双歧杆菌制备的基因组DNA或cDNA为模板,使 用基于该双歧杆菌的GLBP的结构基因的序列信息制作的引物对,以聚合酶链式反应(PCR) 进行扩增得到。通常而言,由于对于1个氨基酸存在多种密码子,因此,也可以是具有与公 知碱基序列或基于公知氨基酸序列的碱基序列不同的碱基序列的基因。
[0151] 例如,编码长双歧杆菌(B. longum)的GLBP的基因能够从Acta Crystallographica Section F.,F63卷,751页,2007年中记载的长双歧杆菌的GLBP的结 构基因序列得到。例如,能够以长双歧杆菌的染色体DNA或cDNA为模板,使用基于序列信 息制作的引物对,以PCR进行扩增来得到。
[0152] 编码目的免疫原性多肽的基因能够从设计的氨基酸序列基于公知的或推定的基 因序列信息确定编码目的免疫原性多肽的基因序列,进一步根据需要考虑宿主的密码子频 率而得到优化的基因序列。
[0153] 例如,分别编码作为基于基础结构域(1)的合成蛋白质的例子的图2的氨基酸序 列1和2的基因序列1和2由基于双歧杆菌的密码子频率优化的碱基序列构成。基因序列 1和2的碱基序列分别如序列号25和27所示(将其对应的氨基酸序列分别以序列号26和 28表示)。
[0154] 编码作为基于基础结构域(2)的合成蛋白质的例子的图8的氨基酸序列、且基于 双歧杆菌的密码子频率优化的基因的碱基序列如序列号33所示
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1