免疫原性多肽表层表达双歧杆菌的制作方法_2

文档序号:9354524阅读:来源:国知局
alis)、动物双歧杆菌乳亚种(B.animalis subsp.lactis)、星状双歧杆菌(B.asteroides)、两歧双歧杆菌(B.bifidum)、牛双歧 杆菌(B. bourn)、短双歧杆菌(B. breve)、链状双歧杆菌(B.catenulatum)、猪双歧杆菌 (B. choerinum)、棒状双歧杆菌(B. coryneforme)、家兔双歧杆菌(B. cuniculi)、離齿双歧 杆菌(B. denticolens)、齿双歧杆菌(B. dentium)、高卢双歧杆菌(B. gallicum)、鸡胚双 歧杆菌(B. gallinarum)、球状双歧杆菌(B. globosum)、印度双歧杆菌(B. indicum)、婴儿 双歧杆菌(B.infantis)、奇异双歧杆菌(B.inopinatum)、乳双歧杆菌(B.lactis)、长双 歧杆菌(B.longum)、大双歧杆菌magnum)、瘤胃双歧杆菌(B.merycicum)、最小双歧杆菌 (B. minimum)、短小双歧杆菌(B. parvulorum)、假链状双歧杆菌(B. pseudocatenulatum)、 假长双歧杆菌球形亚种(B. pseudolongum subsp. globosum)、假长双歧杆菌假长亚种 (B. pseudolongum subsp. pseudolongum)、小鸡双歧杆菌(B. pullorum)、瘤胃双歧杆菌 (B. ruminale)、反会双歧杆菌(B. ruminantium)、世纪双歧杆菌(B. saeculare)、苏卡鲁道 维伊双歧杆菌(B. scardovii)、细长双歧杆菌(B. subtile)、猪双歧杆菌(B. suis)、热嗜酸 性双岐杆菌(B. thermacidophilum)、和嗜热双歧杆菌(B. thermophilum)。另外,也可以使 用这些双歧杆菌的耐性株或突变株。
[0070] 这些菌株均有市售或者能够从保藏机构容易地得到。例如,可以列举长双歧杆 菌(B. longum)JCM1217(ATCC15707)、两歧双歧杆菌(B. bifidum)ATCC11863、长双歧杆菌 105-A 株(Biosci. Biotechnol. Biochem.,61 卷,1211-1212 页,1997 年)等。
[0071] (GNB/LNB基质结合膜蛋白)
[0072] GNB/LNB基质结合膜蛋白(GLBP)是属于输送双歧杆菌所具有 的lact〇-N-biose( 即,N-乙酰-3-〇-(0-D-半乳吡喃糖基)-D-葡糖胺)和 galacto-N-biose (即,N-乙酰-3_〇-(0 -D-半乳吡喃糖基)-D-半乳糖胺)的ABC蛋白质 (ATP Binding Cassette protein)家族的膜蛋白。ABC蛋白质是使用ATP(三磷酸腺苷) 这样的能源在所有生物的细胞膜上能动地进行特异性物质输送的重要膜蛋白,在细胞膜上 存在多种ABC蛋白质。因此,作为ABC蛋白质的GLBP,在具备用于GLBP表层表达的细胞机 能的双歧杆菌属细菌(双歧杆菌)中,如果利用适当的启动子,就能够在双歧杆菌中普遍地 表达。例如,源自长双歧杆菌JCM1217(ATCC15707)株的GLBP具有序列表的序列号2所述 的氨基酸序列(对应的碱基序列在序列号1中表示)。
[0073] GLBP的构造不限于天然存在的GLBP,只要具有在双歧杆菌的细胞表层表达的能 力即可,也可以在构成该GLBP的氨基酸中具有1个以上(例如,1个或数个)的取代、插入 或缺失。
[0074](免疫原性多肽)
[0075] 在本发明中,用于在双歧杆菌的表层表达的免疫原性多肽以保持立体结构并且具 有细胞分泌能力的基础结构域和至少一个抗原肽构成。该至少一个抗原肽与该基础结构域 的N末端侧和C末端侧的任一侧连结。
[0076] "免疫原性"是指抗原能够诱导抗原特有的T细胞应答(CD4+和/或CD8+)的意 思。
[0077] 作为基础结构域(base domain),能够使用保持立体结构(例如,在结晶结构上形 成二级结构(例如,片层或a-螺旋))并且具有细胞分泌能力的(例如,不含有连续 的碱性氨基酸残基,或改变为不含连续的碱性氨基酸残基)区域。作为保持立体结构的结 构域,可以列举a-0-a结构域、折叠桶结构域、a-螺旋结构域等。蛋白质的立体结 构例如能够通过本领域技术人员通常使用的X射线结晶构造解析来确定,基础结构域能够 根据公知或推定的X射线构造解析信息来选择(例如,Protein Data Bank(http://www. rcsb.org/pdb/home/home. do) ;Bioinformatics,22 卷,195-201 页,2006 年;和 Protein Science,2卷,305-314页,1993年)。基础结构域优选在结构域内含有至少一个⑶4表位 和/或CD8表位。
[0078] "细胞分泌能力"是指多肽(蛋白质)能够具有通过双歧杆菌的细胞膜上的输送装 置分泌到细胞外的能力的意思。为了具有细胞分泌能力,期望区域不含连续2个氨基酸以 上的碱性氨基酸(组氨酸、赖氨酸和精氨酸)(即,区域中的碱性氨基酸之前和之后的氨基 酸为碱性氨基酸以外的氨基酸)。在区域中含有2个氨基酸以上连续的碱性氨基酸时,如以 下所说明的那样,也能够通过取代为其它的氨基酸改变该区域。
[0079] "抗原肽"是指发挥抗原性的任意的肽。发挥抗原性的肽含有CD4表位(辅助性T 细胞识别表位)和CD8表位(细胞毒性T细胞识别表位)。这样的肽例如能够通过本领域 技术人员通常使用的表位定位(epitope mapping)来确定并得到。
[0080] 抗原肽只要具有发挥所期望的特性(特别是抗原性)的能力,则也可以在构成表 位的氨基酸中具有1个以上(例如,1个或数个)的取代、插入和/或缺失。例如,抗原肽 可以包含:进一步添加表位所来源(即,本来存在)的蛋白质内的该表位的N末端和/或C 末端延伸的区域所来源的1个以上的氨基酸(优选为1~5个氨基酸)所构成的氨基酸序 列、从该表位的氨基酸序列的N末端或C末端的任一个末端缺失1个以上的氨基酸(优选 为3个氨基酸以内)、或取代该表位的氨基酸序列中的1个以上的氨基酸(优选为3个氨基 酸以内)、或这些的组合。
[0081] 在基础结构域所来源的本来的蛋白质的对应的立体结构区域的氨基酸序列内,同 种或不同种的碱性氨基酸(组氨酸、赖氨酸和精氨酸)连续2个氨基酸以上时,可以取代为 其它的氨基酸,以实现所期望的作用(基础结构域的立体结构和分泌能力)。连续2个氨基 酸以上的碱性氨基酸不需要被全部取代,取代除了其中的1个碱性氨基酸以外的氨基酸即 可。取代后的氨基酸为碱性氨基酸以外即可,例如,为丙氨酸、蛋氨酸、谷氨酸、谷氨酰胺和 亮氨酸,优选为谷氨酸、谷氨酰胺和亮氨酸,更优选为以谷氨酰胺和亮氨酸的顺序形成序列 取代。基础结构域只要能够保持其结构域的立体结构且具有细胞分泌能力,则也可以在氨 基酸中具有1个以上(例如,1个或数个)的取代、插入和/或缺失。另外,可以使用多种基 础结构域。可以包含进一步添加基础结构域所来源(即,本来存在)的蛋白质内的基础结 构域的N末端和/或C末端的区域所来源的1个以上的氨基酸(优选为1~5个氨基酸) 所构成的氨基酸序列、从该基础结构域的氨基酸序列的N末端或C末端的任一个末端缺失 1个以上的氨基酸(优选为3个氨基酸以内)、或取代该基础结构域的氨基酸序列中的1个 以上的氨基酸(优选为3个氨基酸以内)、或这些的组合。
[0082] 上述具有1个以上的氨基酸的取代、插入和/或缺失的突变体优选为保守性改变 的突变体。"保守性改变的突变体"适用于氨基酸和核酸序列双方。关于特定的核酸序列, 保守性改变的突变体包含编码同一氨基酸序列的核酸、和具有1个以上的同类取代的氨基 酸序列。同类取代的例子为以下的组中的一个氨基酸与同组的其它氨基酸的交换:
[0083] (1)疏水性:异亮氨酸、缬氨酸、亮氨酸、苯丙氨酸、蛋氨酸、丙氨酸、色氨酸、甘氨 酸;
[0084] (2)中性亲水性:半胱氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、酪氨酸;
[0085] (3)酸性:天冬胺酸、谷氨酸;
[0086] (4)碱性:组氨酸、赖氨酸、精氨酸;
[0087] (5)对链取向有影响的残基:甘氨酸、脯氨酸;
[0088] (6)芳香族:色氨酸、酪氨酸、苯丙氨酸;和
[0089] (7)小的氨基酸:甘氨酸、丙氨酸、丝氨酸。
[0090] 这样的突变体的氨基酸序列具有至少90%、更优选至少95%、更加优选至少99% 的序列同一性%。"序列同一性百分比"和"序列同一性% "这样的词语是指由2个以上的氨 基酸或核酸序列的比较或比对所得到的序列同一性的比例。同一性百分比可以通过将序列 并列、计算2个整列序列间一致的准确的数,除以短序列的长度,将该结果乘以100,从而直 接比较2个分子间的序列信息来确定。用于同一 ,性百分比的计算的算法为Smith-Waterman 序列同源性搜索算法(例如,Proteins,48卷,367-376页,2002年;Bioinformatics,17卷, 327-337 页,2001 年)。
[0091] 抗原肽通过与基础结构域组合并在双歧杆菌细胞表层表达和提呈,能够发挥免疫 原性。至少一个抗原肽可以添加在基础结构域的N末端侧和C末端侧的一侧或两侧。例如, 添加的抗原肽多于1个时,可以将各抗原肽添加在基础结构域的一侧或两侧。基础结构域 具有表位区域时,例如,可以选择所连结的抗原肽,以使得能够通过该抗原肽的表位和该基 础结构域内的表位能够发挥免疫原性。
[0092] 以下,列举丙型肝炎病毒(HCV)免疫原性多肽的例子进行说明。
[0093] 图1表示包含HCV-lb型的多肽(GenBank :BAA08120. 1)的NS3蛋白全长区域的 氨基酸序列(序列号3)。图1中的1027位~1657位的氨基酸序列是NS3的全长(本说 明书中,只要对氨基酸的位置序号没有特别记载,则为基于HCV-lb型多肽全长中的位置)。 NS3蛋白由0 -折叠桶结构域(1027位~1195位)、接头部位(1196位~1215位)、2个 0-a-0-结构域(N末端侧结构域1216位~1350位和C末端侧结构域1351位~1509 位)和a -螺旋结构域(1510位~1657位)形成(非专利文献1)。
[0094] 图1也表示NS3蛋白区域中的⑶8表位(图1中以下划线表示)和⑶4表位(图 1中以双下划线表不)的分布。图1中,⑶8表位为:
[0095] 1067 位~1086 位:QSFLATCINGVCWTVYHGAG (CD8 表位 1 :序列号 4)、
[0096] 1169 位~1177 位:LLCPSGHW(CD8 表位 2:序列号 5)、
[0097] 1291 位~1298 位:ITYSTYGK(CD8 表位 3:序列号 6)、
[0098] 1372 位~1380 位:EIPFYGKAI (CD8 表位 4:序列号 7)、
[0099] 1391 位~1399 位:LIFCHSKKK(CD8 表位 5:序列号 8)、
[0100] 1406 位~1414 位:KLSALGVNA(CD8 表位 6 :序列号 9)、
[0101] 1435 位~1454 位:VATDALMTGYTCDFDSVIDC (CD8 表位 7 :序列号 10)、和
[0102] 1629 位~1637 位:GAVQNEVTL (CD8 表位 8 :序列号 11),
[0103] CD4 表位为:
[0104] 1130 位~1149 位:LYLVTRHADVIPVRRRGDSR(CD4 表位 1 :序列号 12)、
[0105] 1202 位~1220 位:EITMRSPVFTDNSTPPAVP (CD4 表位 2 :序列号 13)、
[0106] 1303 位~1330 位:GGCSGGAYDIIICDECHSTDSTSILGIG(CD4 表位 3 :序列号 14)、和
[0107] 1531 位~1547 位:TPAETSVRLRAYLNTPG(CD4 表位 4 :序列号 15)。
[0108] 作为丙型肝炎病毒(HCV)免疫原性多肽的基础结构域,例如,以下列举:
[0109] (1)基于HCV-lb型抗原多肽的NS3蛋白的接头部位(1196位~1215位)和N末 端侧0 _ a - 0结构域(1216位~1350位)的基础结构域(图2)
[0110] VPVESMETTMRSPVFTDNSTPPAVPQSFQVAHLHAPTGSGKSTKVPAAYAAQGYKVLVLNPSVAATL GFGAYMSKAHGVDPNIRTGVRTITTGAPITYSTYGKFLADGGCSGGAYDIIICDECHSTDSTSILGIGTVLDQAE TAGARLVVLATAT(序列号 16);
[0111] (2)基于HCV-lb型抗原多肽的NS3蛋白的a -螺旋结构域(1510位~1657位) 的基础结构域(图8)
[0112] GMFDSSVLCECYDAGCAWYELTPAETSVRLRAYLNTPGLPVCQDHLEFWESVFTGLTHIDAHFLSQT KQA⑶NFPYLVAYQATVCARAKAPPPSWDQMWKCLIRLKPTLHGPTPLLYRLGAVQNEVTLTHPITKFMACMSA DLEVVT(序列号 17);
[0113] (3)基于HCV-lb型多肽的NS3蛋白的C末端侧结构域(1510位~ 1657位)的基础结构域(其中,1351位~1353位的3个氨基酸缺失,并且将NS3的下游 侧- a - -结构域的1398~1399位的2个K (赖氨酸)取代为Q (谷氨酰胺:1398位)、 L(亮氨酸:1399位))(图9)
[0114] SVTVPHPNIEEVALSNTGEIPFYGKAIPLEAIKGGRHLIFCHSKQLCDELAAKLSALGVNAVAYYRG LDVSIIPTSGDVVVVATDALMTGYT⑶FDSVIDCNTCVTQTVDFSLDPTFTIETTTVPQDAVSRSQMQGRTGRGR GGHRFVTPGERPS(序列号 18);和
[0115] (4)基于将NS4A区域的一部(例如,1677位~1690位)与N末端连结的NS3蛋 白的0 -折叠桶结构域(1027位~1195位)的基础结构域(其中,1027~1028位的2个 氨基酸和1195位的氨基酸缺失,并且1144~1145位的2个R(
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1