通过改变CpG含量来调节基因表达的方法

文档序号:440168阅读:985来源:国知局
专利名称:通过改变CpG含量来调节基因表达的方法
技术领域
本发明涉及经修饰的多核苷酸,它们来源于天然存在和合成的基因或其他编码序列,并且其在编码区中的CpG二核苷酸数目与原始序列相比有所减少或增加。这些多核苷酸可以用于研究、增加或减少基因表达,并且在特殊情况下,用于改进生物分子的生产、DNA疫苗或基因治疗构建物的有效性以及转基因动物或植物的品质。
背景技术
以肽、蛋白质或RNA分子形式提供生物分子是生物技术和药物领域中的重要组成部分。通过重组技术制备或在体内表达的蛋白质和RNA不仅用于研究基础机制和关系,而且用于生产生物技术试剂、制备转基因动物或植物,或者用于在开发疗法和疫苗中的医疗应用。取决于应用,相应分子的表达水平应当能够被调节。
在大多数情况下,超过标准生产水平的增加是所希望的。每种表达系统或载体构建物都有局限性,这决定了实际生产效能。本发明涉及适于调节真核细胞中任意基因的表达水平的方法和用途。该方法特别适合于如此调节任意基因,从而使得可达到的基因表达超过迄今为止已知用于增加表达的方法所能够达到的水平。
现有技术CpG二核苷酸在真核生物基因组中占据着特殊的位置。它们不像其他二核苷酸那样按统计学分布,而是在基因组的广泛区段之内具有低出现率。此外,在这些区域中的CpG二核苷酸大多数是甲基化的。
这种情况的一个例外是这样的区域,其CpG二核苷酸的密度高得多,并且由于这些特性而被称为CpG岛。这些CpG岛的一个特有性质以及对于这些CpG二核苷酸的进一步界线是岛内的CpG二核苷酸通常不以甲基化形式存在。
CpG二核苷酸的低出现率通过相应核苷酸的化学修饰来解释。在脊椎动物基因组中,CpG二核苷酸中约60-90%的胞嘧啶以甲基化形式存在,并且这些甲基化的胞嘧啶通常通过脱氨基成胸腺嘧啶而进行修饰(Shen等人,1994)。这个过程导致胞嘧啶和鸟苷的频率低于预期的统计学分布,为约40%,并且CpG二核苷酸的份额甚至只有预期频率的约20%(Bird,1980;Sved等人,1990;Takai等人,2002)。
CpG岛成为CpG二核苷酸的这种不寻常分布的一个例外(Antequera等人,1993)。CpG岛主要位于启动子附近,并且可以延伸进入转录区或者甚至位于外显子内。
它们的特征是CpG频率比基因平均区高大约10倍(大约60-70%的C+G含量),并且其特征尤其在于它们通常不含有甲基化的CpG(Wise等人,1999)。所有人类基因的约60%,特别是所有管家基因以及大约一半的组织特异性基因与CpG岛有关(Antequera等人,1993;Larsen等人,1992)。CpG岛尤其在Gardiner-Garden M. & Frommer M(1997)J.Mol.Biol.196,261-282和TakaiD. & Jones P.A.(2002)PNAS 99,3740-3745的公开出版物中得到描述并进行了定义。由于在现有技术中存在各种不同的定义,因此为了本发明的目的,CpG岛被如下定义CpG岛包括至少500个连续碱基对的序列,CpG含量为至少55%并且(实际CpG/预期CpG)的商为至少0.65,以及它与启动子相关(与启动子完全或部分重叠)。
CpG二核苷酸的不均匀分布和修饰,即i)一方面低频率出现且甲基化,和ii)另一方面在岛内集中且非甲基化,在基因表达调节方面具有重要的控制功能(在

图1中进行了示意性的描绘)。
CpG二核苷酸参与了早期发育阶段的基因表达调节,与细胞分化、遗传印记及其他过程有关。在真核生物中,许多研究显示出,5’CpG3’二核苷酸的甲基化(mCpG)在脊椎动物和显花植物中对基因表达有抑制作用(Hsieh,1994;Kudo,1998;Jones等人,1998;Deng等人,2001;Hisano等人,2003;Li等人,2004)(图1A)。
此外,在肿瘤研究中也有着众多数据证明i)某些基因(通常为抑制基因)的表达的关闭由CpG的甲基化过度引起(Li等人,2004;Kang等人,2004;Ivanova等人,2004;Wu等人,2003),而且,ii)其他基因的不受控制的表达与甲基化不足有关(Akiyama等人,2003;Yoshida等人,2003)。
通过甲基化而关闭基因的过程可由最终导致染色质结构改变的一系列级联事件来解释,所述染色质结构改变造成弱转录状态。基因内的5’-CpG-3’二核苷酸的甲基化产生蛋白质复合物(主要来自MeCP(甲基-CpG-结合蛋白)和MBD(甲基-CpG-结合结构域蛋白)蛋白质家族)的潜在结合位点,所述蛋白质复合物结合甲基化的DNA序列并且同时与组蛋白脱乙酰酶(MBD-HDAC)以及转录阻抑蛋白相关联(Jones等人,1998;Nan等人,1998;Hendrich等人,1998)。这些复合物通常涉及染色质结构改变,它们导致转录活性的关闭(Wade等人,1999)。启动子区中的甲基化还可以直接导致基因表达的关闭,这是通过必需转录因子的结合被所引入的甲基基团阻止而实现的(Deng等人,2001)。
肿瘤细胞中的上述表达失调一般与上述CpG岛内的甲基化状态改变有关。在正常细胞中,活跃表达的基因大多数与CpG岛相关,所述CpG岛是非甲基化的或者低甲基化的(图1B)。这些岛中CpG二核苷酸的甲基化导致这些基因(通常为肿瘤抑制基因或细胞周期调节基因)的表达的关闭(图1C),并且从而导致这些细胞不受控制的增殖。相反地,由于CpG岛中CpG二核苷酸甲基化而失活的基因通过脱甲基化而激活。
上述在CpG岛中的脱甲基化通过染色质结构的改变而导致转录活跃状态,类似于在甲基化情况下的基因关闭。除了结构改变之外,还可出现通过激活蛋白的表达激活。一种此类细胞激活蛋白为人CpG结合蛋白(hCGBP)。HCGBP特异性结合启动子范围内非甲基化的CpG二核苷酸,其中它作为反式激活蛋白导致转录增加(Voo等人,2000)。
迄今为止,基因内CpG序列的甲基化下调转录的知识已用于通过甲基化来阻止过度表达或其表达是所不希望的基因表达(Choi等人,2004;Yao等人,2003)(参见图1A)。
这种知识的另一种应用是靶向消除此类CpG二核苷酸以便改善基因表达(Chevalier-Mariette等人,2003)。通过消除,同样可阻止甲基化以及与之相关的染色质结构改变至转录失活状态(图1D)。在这个公开出版物中,研究了在转基因小鼠的生殖系细胞和由此形成的胚胎中,与位于CpG岛内的启动子有效连接的具有各种不同CpG二核苷酸含量的转基因的表达。在这种特殊情况下,CpG二核苷酸的消除阻止了报道基因的转录关闭(图1D,无CpG的转基因),否则正如所预期的,其在胚胎发育过程中将会通过存在的CpG二核苷酸的从新甲基化而出现(图1D,CpG高的转基因)。Chevalier-Mariette的公开出版物中的机制的更详细研究显示,基因表达的阻止不仅与基因内CpG二核苷酸的甲基化有关,而且并尤其与随后发生的与启动子相关联的CpG岛的甲基化有关(图1D,CpG高的转基因)。对于没有这些基因内CpG二核苷酸并有效表达的报道基因,显示CpG岛是非甲基化的(图1D,无CpG的转基因)。作者因此得出结论,为了持久的体内表达,必须减少在紧邻启动子的附近区域内及在CpG岛内的CpG二核苷酸含量。
基因表达的增加同样可以通过在相应载体构建物中在启动子5’整合完整CpG岛来完成(WO 02081677)(参见图1B)。在鉴定hCGBP中,同样地将CpG二核苷酸整合到报道基因的相应启动子区中,并确定报道物活性增加。然而,在这些短暂的细胞培养测试中,hCGBP同样是过度表达的,并且因此以非生理性的升高的浓度存在(Voo,等人,2000)。
已知C/G含量对mRNA稳定性有影响。因此,例如Duan和Antezana(2003)显示了,CH0细胞中三种不同的人类基因变体的表达导致mRNA浓度的差异。在第一个变体中,人类基因序列经如此改变,即使得C/G二核苷酸数目最大化。与之不同,在第二个变体中,T/A二核苷酸数目被最大化。稳态水平的差异,即mRNA的量的差异,在实验上可以归因于mRNA分解的差异。由于在C/G含量增加的情况下稳定了二级结构,因而与野生型相比相应的mRNA以较低的程度分解,并且相应地富含T/A的mRNA与野生型相比以高得多的程度分解。没有在蛋白质水平上进行分析,并且也预期蛋白质产生没有通过CpG二核苷酸的增加而增加,因为mRNA二级结构的稳定化不利地影响了翻译。
Deml等人公开了对于在哺乳动物细胞中表达而经密码子优化的HIV-I Gag基因的序列。没有公开CpG二核苷酸的特异性增加。
本发明的目的是开发出靶向调节基因表达的方法,所述方法至少部分排除了现有技术的缺点。
这个目的通过靶向调节基因表达的方法来实现,所述方法包括下列步骤i.提供待表达的靶核酸序列,ii.修饰所述靶核酸序列,其中利用遗传密码简并性来增加所述靶核酸序列中存在的CpG二核苷酸数目以增加基因表达,或减少CpG二核苷酸数目以减少基因表达,iii.将如此修饰的、含修饰数目的CpG二核苷酸的所述靶核酸序列以与合适的转录控制序列有效连接的方式克隆到合适的表达载体中,iv.在合适的表达系统中表达所述经修饰的靶核酸序列。
非常惊讶地证实,当利用本发明的方法时,正好可以达到与根据现有技术知识所预期的相比相反的作用。也就是说,利用本发明的方法,通过增加靶核酸序列中的CpG二核苷酸数目可以增加这个靶核酸序列的表达,而通过减少该靶核酸序列中的CpG二核苷酸数目可以阻止其表达。在此,根据本发明,阅读框内CpG二核苷酸数目的增加并不等同于CpG岛的引入。根据定义,阅读框内CpG二核苷酸数目的增加与CpG岛的差异在于i)可能的较少的碱基数目(<500),以及ii)缺少与启动子区的重叠。
表达系统一方面可以是细胞,或另一方面可以是无细胞的系统或体外系统。可以使用原核或真核表达系统,优选使用真核表达系统。合适的表达系统包括例如细菌细胞,昆虫细胞,例如杆状病毒表达系统、SF9细胞、果蝇-Schneider-细胞,植物细胞,酵母,例如酿酒酵母(Saccharomyces cerevisiae)、Pichia angusta、巴斯德毕赤酵母(Pichia pastoris)等,以及藻类,例如衣藻(Chlamydomonas)。可能的植物表达系统的实例包括拟南芥(Arabidopsis thaliana)、玉蜀黍(Zea mays)、烟草(Nicotiana tobacco)、稻(Oryza sativa)、大麦(Hordeum vulgare)、大豆(Glicine max)、芥属植物(Brassicasp.)等。优选地使用脊椎动物细胞,特别是哺乳动物细胞,尤其是人类细胞,特别是体细胞,但不使用生殖系细胞。特别优选地,表达系统是低甲基化水平的系统或细胞,即,基本上不发生从新甲基化。另一方面,还可以利用这个方法来生产转基因的非人生物,特别是植物和动物。
因此本发明特别涉及特别是在真核细胞内靶向改变转录物表达水平和/或靶向改变蛋白质产生的方法。该方法的特征在于待转录的DNA序列的阅读框的修饰。
所述修饰涉及CpG二核苷酸份额的变化,所述CpG二核苷酸与表达水平的改变相关。
人工合成基因的技术使得能够合成选自这些可能性的任意一种核苷酸序列。通过改变与表达水平相关的基因编码区内的基序,可以利用这个技术通过选择相应的核酸序列而靶向地调节蛋白质产生。在本发明的范围内,CpG二核苷酸被鉴别为此类对表达水平有直接影响的基序。
令人惊讶地发现,与一般公认的观点相反,以根据本发明的方式方法引入CpG二核苷酸导致基因表达增加而不是表达减少。相反地,CpG的消除导致基因表达减少。
在本发明的范围内,术语“基因表达”包括转录和翻译,并且特别地理解此概念包括蛋白质产生。
在本发明的范围内,核酸水平的这些改变优选通过经从新基因合成来制备人工基因而引入,其中相应基因编码的氨基酸序列优选保持不变。从新基因合成方法是本领域技术人员已知的。优选通过沉默突变或通过不破坏基因产物活性的突变来实现CpG含量的改变。如实施例中所述,经修饰的靶核酸序列可以例如通过分段PCR从长寡核苷酸制得,或者在常规基因合成的情况下,可以从供应厂商(例如GeneartGmbH,Qiagen AG)定购。
令人惊讶地,通过选择CpG二核苷酸的数目可以负地(CpG数目减少)或正地(CpG数目增加)影响相应基因的表达,并且甚至可以超过用密码子优化基因可达到的表达率。如果CpG二核苷酸数目的增加以有损于RNA和密码子优化的方式发生,那么表达甚至可以被出乎意料地增加。优选地在修饰靶核酸序列时不导入CpG岛,并且经修饰的靶核酸序列优选地与CpG岛无关。通过对于所定义的其对表达的影响以全或无原则起作用的CpG岛进行界定,在本发明中,发现了表达水平和CpG二核苷酸数目之间的关联。
为了表达基因,优选如此导入这些修饰,从而使得编码的氨基酸序列不被改变。在理想的情况下,只有相应基因的核酸序列会影响其表达水平。因为遗传密码具有简并性,所以对于特定氨基酸序列存在可以选择大量相应核酸序列的可能性。
通过对于迄今所述方法进行界定,1)编码转录物的区域应当被修饰,由此该方法的使用可以不依赖于载体和其他基因技术先决条件,以及2)为了增加表达,应当增加CpG二核苷酸的数目。在此,另外导入的CpG是非甲基化的。
取决于所需表达水平,与待表达的靶核酸的序列相比,CpG二核苷酸的数目优选增加或减少至少2个,优选至少3个,更优选至少5个,更优选至少8个,更优选至少10个,更加优选至少15个,和高达20个或更多,特别是30-50个或者甚至高达100个或更多,这取决于待表达的靶核酸序列的长度。
与待表达的靶核酸的序列相比,CpG二核苷酸的数目优选增加至少10%、优选至少20%、优选至少50%、优选至少100%、优选至少200%,或者5或10倍。
如果清除CpG,则优选消除在遗传密码范围内可以被消除的所有CpG。然而,也可以消除较少的CpG,例如10%、50%或75%,其中在此消除再次取决于所需表达水平。
在本发明的范围内,意外地证实,CpG二核苷酸数目的增加或减少使得能够逐级地调节基因表达。意外地观察到剂量效应。也就是说,基因表达的程度可以通过添加或消除或多或少的CpG二核苷酸进行调节。
如已陈述的,可以并优选如此利用遗传密码的简并性,从而使得优选地无需改变待表达的靶核酸序列的氨基酸序列即可导入或消除最大数目的CpG二核苷酸。被导入的CpG二核苷酸的最大数目优选地由预定氨基酸序列的简并密码子的变化可能性限制。
另一方面,CpG二核苷酸的数目任选地可以再进一步地增加,即使相应的氨基酸序列因此而改变。在这种情况下,应当考虑确保肽或蛋白质的功能不受损害。
根据遗传密码简并性的类型,可以在密码子内或也可以以使密码子搭接的方式(übergreifend)去除或添加CpG二核苷酸。
除了改变待表达的靶核酸中CpG二核苷酸数目之外,根据所需的基因表达程度,所述靶核酸还可以在核酸水平上被进一步改变。如果例如目标是增加基因表达,那么CpG二核苷酸的数目优选以这样的方式增加,即通过引入另外的CpG二核苷酸,没有出现不利作用,例如可对翻译产生不利影响的更加显著的mRNA二级结构,负面影响表达的其他基序,例如,RNA不稳定性基序,剪接激活基序、核酸内切酶识别位点等。另一方面,如果减少CpG二核苷酸的数目以便减少基因表达,则当然也可以消除正好在那些位点上的CpG二核苷酸,所述位点在核酸序列改变后正好导致这些基序。
当然,除了增加或减少CpG二核苷酸数目外,此外还可以并且优选如此进行核酸优化,从而使得基因表达被促进或者被抑制或减少。
因此,此类优化是插入或去除能够影响基因表达的基序,例如稳定二级结构的序列,自身同源性增加的区域、与天然基因的同源性增加的区域、RNA不稳定性基序、剪接激活基序、多腺苷酸化基序、富含腺嘌呤的序列区段、核酸内切酶识别位点等。还有,另一优化可能性在于,各自对于所需的表达系统进行密码子选择的优化。
也就是说,在本发明的范围内,除了插入CpG二核苷酸之外,通过使得密码子选择被优化或变得更差,也可以增加或减少表达。根据本发明的经表达优化的构建物例如可以通过如此来产生,即选择与其在所使用的表达系统中一样的密码子分布。优选地,真核表达系统是哺乳动物系统,优选人类系统。因此,优选地,密码子优化与人类基因的密码子选择相匹配。在此,优选使用与其在哺乳动物细胞中最常见或次最常见地使用的一样的密码子选择(Ausubel等人,1994),以便确保RNA的一般稳定化和最佳的密码子选择。更加优选地,通过使用基因优化技术(DE 102 60 805.9或PCT/EPO3/14850)来修饰核酸序列以达到最佳表达。
然而,与密码子优化相反,也可采用表达系统很少使用的“差的”密码子,以便增加CpG二核苷酸数目。
在根据本发明的方法中,还可使用异源靶核酸序列。术语“异源靶核酸序列”涉及靶核酸序列的来源和表达系统的来源。因此,靶核酸序列和表达系统优选地是互相异源的,即它们来源于不同物种,和/或野生型靶核酸序列的密码子选择是不同于表达系统的另一种。因此,在本发明的范围内,术语“异源的”还包括在密码子选择方面的差异。密码子选择指在遗传密码简并性范围内对各物种来说优选的密码子使用。
作为表达载体,可以使用任何合适的表达载体。此类载体优选适合于在真核细胞中的表达。将经修饰的待表达的靶核酸如此克隆到载体中,从而使得它以与合适的转录控制序列以及任选地其他调节元件有效连接的方式存在。此类转录控制序列可以为合适的启动子,其可以是组成型的或诱导型的。
以组成型方式起作用的启动子优选选自,但不限于,CMV(巨细胞病毒)启动子和猿猴病毒40(SV40)。诱导型启动子包括,但不限于,四环素依赖性启动子。本领域技术人员可以毫不困难地根据应用来选择其他合适的启动子,例如还有细胞来源的启动子。
在此,原则上本领域已知的任何诱导型启动子系统均适合。例如,可以使用天然或人工的诱导型启动子,例如由四环素诱导的启动子(Tet on/Tet off系统)。但此外还可使用诱导型病毒启动子。
优选地,诱导型启动子可以被反式激活因子诱导。可以被病毒反式激活因子诱导的病毒诱导型启动子可以来源于任意病毒。对此优选使用逆转录病毒、HCV(丙型肝炎病毒)、HBV(乙型肝炎病毒)、HSV(单纯疱疹病毒)、EBV(EB病毒)、SV40(猿猴病毒40)、AAV(腺伴随病毒)、腺病毒、乳头瘤病毒或埃博拉病毒的序列。因此,在此使用的反式激活因子例如选自下列病毒因子,但不限于这些NS5A(HCV)、HB X(HBV)、VP16/ICP4(EBV)、EBNA1/Rta(EBV)、ART(HHV8)、大T抗原(SV40)、Rep78/68(AAV)、E1A(腺病毒)、E2(乳头瘤病毒)合VP 30(埃博拉病毒)。
作为可以被病毒的反式激活因子诱导的诱导型启动子,优选使用逆转录病毒的LTR启动子或其功能性部分序列。因此,优选地,反式激活因子是逆转录病毒的Tat或Tax蛋白。LTR启动子可以选自HIV-1、HIV-2、SIV、HTLV和具有LTR启动子的其他近似逆转录病毒的LTR。特别优选的是慢病毒的启动子,尤其是HIV的启动子。
优选地,在本发明范围内使用的转录控制序列,即例如启动子和/或增强子等,与CpG岛无关。
除了增加待表达的靶核酸中的CpG二核苷酸数目之外,还可以减少在其余的存在于载体上的序列或其部分中的CpG二核苷酸数目。在此,在这些其余的载体序列或其部分中,CpG二核苷酸被完全消除。优选地,通过使用遗传密码的简并性,在保持氨基酸序列的情况下再此进行这一过程。还可以在这些序列中只发生CpG二核苷酸的部分消除,例如消除至少5%、优选至少1O%、优选至少15%、优选至少25%、优选至少50%、优选至少75%或更多。优选地,尽可能地去除所有的CpG。
因此,根据应用(沉默或表达增加),CpG二核苷酸的数目可以不依赖于所选择的密码子优化而改变。
在大多数情况下,可以从阅读框中完全清除CpG。向上,即在增加CpG的数目的情况下,所编码的氨基酸序列是有限的。
靶核酸序列可以编码RNA、其衍生物或模拟物,肽或多肽,经修饰的肽或多肽,蛋白质或经修饰的蛋白质。
靶核酸序列还可以是不同野生型序列的嵌合型和/或组合型序列,并且例如它可以编码融合蛋白或以镶嵌方式构建的多基因构建物。靶核酸序列还可编码合成序列。在此,还可以以合成的方式模建核酸序列,例如通过计算机模型的帮助。
待表达的靶核酸优选为任意蛋白的基因序列,例如重组蛋白、人工多肽、融合蛋白等。优选的是诊断性和/或治疗性的肽、多肽和蛋白质。肽/蛋白质例如可以用于i)生产治疗性产品,例如人的酶(例如天冬酰胺酶、腺苷脱氨酶、胰岛素、tPA、凝血因子、维生素K-环氧化物还原酶)、激素(例如促红细胞生成素、促卵泡激素、雌激素)和其他人类来源的蛋白质(例如骨形成蛋白、抗凝血酶),ii)病毒的、细菌的或来源于寄生虫的蛋白质,其可以用作疫苗(来源于HIV、HBV、HCV、流感、疏螺旋体、嗜血杆菌、脑膜炎球菌、炭疽、肉毒杆菌毒素、白喉毒素、破伤风毒素、疟原虫等),或iii)可用于生产诊断测试系统的蛋白质(例如血型抗原、HLA蛋白)。
作为进一步的可能性,可以选择产生信使物质(细胞因子/趋化因子)或其结构域、片段或变体的基因,所述信使物质例如为G-CSF、GM-CSF、白细胞介素、干扰素、PDGF、TNF、RANTES或MIP1α,它们适合于激活邻近细胞的天然防御机制或者与合适的抗原组合在一起来增强特异性免疫应答。
另一个可能用途是生产生物技术学应用的蛋白质,例如酶(聚合酶、蛋白酶等)。
待表达的靶核酸还可以是调节基因,其在细胞中表达后作为分子型开关分子来开启或关闭其他基因的表达。作为此类调节基因,例如可以使用信号转导途径的组分或转录因子。术语“表达”在本文中包括靶核酸的转录以及任选地包括通过转录而获得的RNA的翻译。
最后,待表达的靶核酸可以是功能性RNA(例如核酶、诱饵(Decoy)或siRNA),它可以优选用于治疗或酶的目的。
本发明进一步涉及含可转录区域的经修饰的核酸,它来源于野生型序列,其中所述可转录区域是如此修饰的,从而使得它相对于所采用的表达系统来说是密码子优化的,并且使得与野生型序列相比,CpG二核苷酸数目通过使用遗传密码简并性而增加。经修饰的核酸可以在如上所述的表达系统中表达,并且所述可转录区域是如此修饰的,从而使得它相对于所采用的表达系统来说是密码子优化的,并且使得与密码子优化的、来源于野生型序列的序列相比,CpG二核苷酸数目通过使用遗传密码简并性而增加。
在本发明的范围内,野生型序列是天然存在的核酸序列。
如上文中已经陈述的,但是靶核酸序列也可以编码组合型基因序列,其可以由不同的野生型序列组合而成。在这种情况下,野生型序列涉及还没有在本发明的范围内进行修饰(增加或减少CpG二核苷酸的数目)的序列。
如上所述,在根据本发明的核酸中的CpG二核苷酸数目可以增加数个CpG二核苷酸。优选地,数目增加至在遗传密码简并性范围内可能的最大数目。
本发明还提供了表达载体,它包括与合适的转录控制序列有效连接的根据本发明的上述经修饰的核酸。载体优选用于增加任意DNA序列在真核细胞中的表达。载体优选来源于已知的载体。在与根据本发明的经修饰的核酸序列不同的载体序列区中,CpG二核苷酸数目优选减少。优选地,在这些其余的载体序列或其部分中CpG二核苷酸数目减少至少5%、优选至少10%、优选至少15%、优选至少25%、优选至少50%、优选至少75%或更多。
CpG的减少优选通过如上所述的单个载体模件(抗生素抗性基因、选择标记、多克隆位点等)的人工基因合成来完成。利用单一限制性位点将这些单个组件与必需的、不可改变的模件(复制起点、多腺苷酸化位点、病毒启动子等)的相应DNA片段组合形成功能性载体。载体可以具有病毒(例如来源于腺病毒、逆转录病毒、疱疹病毒、甲病毒等)或细菌的来源,或为裸露的DNA(表达质粒)。
此外,载体的模件式构建允许快速而简便地实现关于单个模件的改变。模件的数目可以改变并且适应相应的应用。
对于稳定整合入细胞中,可以利用元件例如真核选择标记(例如针对潮霉素、Zeocin等的抗性基因;选择报告基因,例如GFP、LNGFR等;或用于定向重组的重组序列),其中相应的基因序列同样也可以尽可能地减少CpG含量。对于在基因治疗中的应用,可以导入与免疫刺激基序具有抵抗作用的序列(例如免疫抑制性CpG基序)。相应地,对于在免疫例如疫苗接种中的应用,或用于生产抗体,可以整合包含免疫刺激因子(例如免疫刺激性CpG基序)的序列。
对于本发明的一个优选载体是SEQ ID NO.27中所示的载体。
本发明的另一个目标是包含如上所述的靶核酸或载体(优选以DNA构建物的形式)的真核细胞,更优选哺乳动物细胞,最优选人类细胞,其中所述核酸或载体以可转录的形式存在。细胞优选为体细胞,或优选为基本上不进行从新甲基化的那些细胞。
DNA构建物可以例如游离地存在或稳定地整合到染色体中。在此,细胞中可以存在一个或多个拷贝。为了引入所述DNA构建物,可以利用病毒(例如腺病毒、逆转录病毒、疱疹病毒、甲病毒等)或细菌来源的基因渡船(Genfhren)或裸露的DNA(表达质粒)。
本发明的另一个目标是表达系统,其包括a)与转录控制序列有效连接的含可转录区域的经修饰的核酸序列,其来源于野生型序列,其中所述经修饰的核酸序列与野生型序列相比具有增加或减少的CpG二核苷酸数目,和b)表达环境,选自在其中可以表达(a)的细胞和无细胞的表达环境,其中在表达CpG二核苷酸数目增加的经修饰的核酸序列时,所述表达系统显示出表达增加,和在表达CpG二核苷酸数目减少的经修饰的核酸序列时,所述表达系统显示出表达减少。
因此,可以使用本发明来增加或减少靶核酸序列的表达。如果表达增加,那么优选地应当达到表达增加至少5%、优选至少10%、优选至少20%、更优选至少30%、更加优选至少50%、更为优选至少100-400%或更多。根据待表达的靶核酸序列的长度以及可以导入的CpG二核苷酸数目,还可以达到2、3、5或甚至10-20倍,或者甚至高达100-200倍的表达增加。
如果希望减少表达,那么优选地应当实现表达减少,即例如转录物量减少至少10%、优选至少20%、更优选至少30%、更加优选至少50%、更为优选至少75%。优选地,表达应当接近检测极限。
如上文已详细解释的,转录水平取决于基因中的CpG二核苷酸数目。也就是说,在基因更长的情况下,或在基因具有更多可能性导入CpG二核苷酸的情况下,应当达到表达的更高的增加。相反地,借助于本发明可以通过靶向消除尽可能所有的CpG二核苷酸而显著减少表达,取决于应用甚至还可以减少至检测极限。
本发明的另一个目标是基于根据本发明的经修饰的核酸和/或载体的药物和诊断试剂。所述经修饰的核酸和载体可以用于诊断、治疗和/或基因治疗应用,特别是还可以用于生产疫苗。
特别地,根据本发明的方法以及根据本发明的表达系统、核酸序列、载体和细胞可以用于生产DNA疫苗。作为常规死疫苗和活疫苗的替代物,开发基于裸露的质粒DNA的疫苗变得越来越重要。DNA疫苗的优点在于DNA被摄入细胞中,其与抗原的可靠产生(包括修饰)以及细胞和体液免疫应答的有效激活相联系。在此,诱导的免疫应答水平与所产生的抗原量相关,并因此与DNA构建物的表达效能有关。如果通过在编码序列中积聚CpG二核苷酸可以增加任意抗原的表达,那么结果是改善了免疫系统的激活并因此提高了保护作用。
附图描述图1通过甲基化调节基因表达(现有技术)ACpG二核苷酸的甲基化导致基因表达的关闭。
BCpG岛防止遭受甲基化及与之相关的关闭。
CCpG岛的次级低水平甲基化导致基因关闭。
D通过减少阅读框中的CpG二核苷酸可以阻止次级低水平甲基化。
图2稳定转染的细胞中的GFP表达分析。
A和B稳定转染的Flp-In 293T和CHO细胞的长时间流式细胞术分析。Y轴给出了GFP引起的荧光强度(MFI,“平均荧光强度”),和X轴给出了以转染后的周数表示的测量时间点。
AhuGFP和ΔCpG-GFP重组293T细胞的FACS分析。
BhuGFP和ΔCpG-GFP重组CHO细胞的FACS分析。
C稳定的细胞系的荧光显微镜照片。
图3稳定转染的细胞中的GFP蛋白检测。GFP阅读框的表达分析。裂解重组Flp-In CHO细胞,所述细胞在细胞基因组中稳定整合了huGFP或ΔCpG-GFP基因,并通过常规免疫印迹分析检测基因表达。给出了huGFP、CpG-GFP和模拟物样品的印迹图。由两种多克隆细胞培养物(poly.)建立单克隆细胞系(对于ΔCpG-GFP为mono.14和7,和对于huGFP为mono.10和9)。模拟物-细胞相应于未改变的起始细胞群。
图4稳定细胞的特定转录物的定量测定。来自胞质RNA制备物的特定潮霉素抗性基因和gfp RNA的实时PCR分析。显示了关于CHO细胞(潮霉素抗性A和gfp B)以及关于293T细胞(潮霉素抗性C和gfp D)的LC分析的实时PCR评价。显示了PCR循环数(X轴)和荧光强度(Y轴)。显示了关于huGFP产物和ΔCpG-GFP产物,以及关于引物二聚体的特定动力学。
图5瞬时转染后的MIP1α表达分析。转染的H1299细胞的细胞裂解物和上清液的代表性ELISA分析。H1299细胞各用15μg野生型和优化的鼠MIP1α构建物转染。通过常规ELISA测试借助于相应的标准曲线在细胞上清液和细胞裂解物中定量各自的蛋白质浓度。柱代表每次两个独立批次的总蛋白质浓度的平均值,而误差条对应于标准差。开放阅读框中的CpG二核苷酸数目标示在X轴上,和总蛋白质浓度以pg/ml为单位标示在Y轴上。Wt对应于各个野生型基因的表达构建物。
图6瞬时转染后的MIP1α和GM-CSF表达分析。转染的H1299细胞的上清液的代表性ELISA分析。H1299细胞各用15μg野生型和优化的人MIP1α(A)和GM-CSF(B)构建物转染。通过常规ELISA测试借助于相应的标准曲线在转染后48小时的细胞培养物上清液中定量各自的蛋白质浓度。柱代表每次两个独立批次的平均值,而误差条对应于标准差。开放阅读框中的CpG二核苷酸数目标示在X轴上,和上清液中的蛋白质浓度以pg/ml为单位标示在Y轴上。Wt对应于各个野生型基因的表达构建物。
图7所使用的表达质粒的图解说明。
AP-smallsyn质粒的质粒图。
BPC-ref的质粒图。说明了序列的模件和来源(黑色为野生型“Wt”,灰色为合成的)。
图8瞬时转染后的HIV-1p24检测。P-smallsyn和PC-ref载体的表达分析。用给定的构建物转染H1299细胞,并且通过常规免疫印迹分析检测蛋白质产生。分析经HIV-1p24转染的H1299细胞的细胞裂解物。显示了分子量(精确度,加上蛋白质标准,Bio-Rad),以及经R/p24、s/p24和模拟物转染的样品的印迹图。模拟物转染对应于用原始pcDNA3.1质粒的转染。
图9各种表达构建物的HIV-1 p24表达分析。H1299细胞以独立双批次的形式各用15μg R/p24、R/24ΔCpG、s/p24和s/p24ΔCpG构建物以及用pcDNA3.1(模拟物对照)转染。通过常规的免疫印迹分析(A)和ELISA测试(B)借助于相应的标准曲线定量细胞裂解物中各自的p24蛋白质浓度。柱代表每次两个独立批次的在细胞裂解物中p24浓度的平均值(以μg/ml表示)。
实施例实施例1具有不同CpG含量的GFP报道基因的制备制备了绿色荧光蛋白(GFP)基因的两种变体,其不同之处在于CpG二核苷酸的数目。huGFP基因有60个CpG,ΔCpG-GFP基因不含CpG。人工构建删除了CpG的基因ΔCpG-GFP。在ΔCpG-GFP的设计中,要注意没有导入稀有密码子或起负作用的顺式激活元件例如剪接位点或poly(A)信号位点。通过删除CpG,密码子适应指数(CAI)只有轻微的改变(CAI(huGFP)=0.95;CAI(ΔCpG-GFP)=0.94),所述密码子适应指数是密码子选择质量的量度。在此,GFP的编码氨基酸序列没有改变。引入其他切割位点以用于亚克隆。SEQ ID NO.1/2中给出了核苷酸和氨基酸序列。
所述序列作为完全合成的基因而制得(Geneart GmbH),使用切割位点HindIII和BamHI将其克隆到表达载体pcDNA/5FRT(Invitrogen)中,并且置于巨细胞病毒(CMV)早期启动子/增强子的转录控制之下(“pcΔCpG-GFP”)。
为了制备类似的、但其CpG分布不改变的GFP表达质粒,通过聚合酶链式反应(PCR)利用寡核苷酸huGFP-1和huGFP-2从商购可得的载体中扩增出人源化GFP基因(huGFP)的编码区,并同样使用切割位点HindIII和BamHI克隆到表达载体pcDNA/5FRT中(“pc-huGFP,SEQ ID NO.3/4)。
含GFP基因变体的稳定细胞系的制备Invitrogen的Flp-In系统用于快速建立和选择稳定的重组细胞。这个系统的另一主要优点是将转基因的一个拷贝定向整合到靶细胞的指定位置。因此,这种技术为任意转基因表达的定量比较提供了最佳先决条件,因为靶细胞的生理和遗传因素很大程度上是相同的。为了获得额外的确认,选择两种不同的哺乳动物细胞用于这些比较分析。细胞系Flp-In CHO和Flp-In 293T从Invitrogen获得,并在37℃和5%CO2下进行培养。这些细胞系在高葡萄糖Dulbecco改良的Eagle培养基(DMEM)中(293T),和在含L-谷氨酰胺、10%灭活的胎牛血清、青霉素(100U/ml)和链霉素(100μg/ml)的HAMs F12中(CHO)进行培养。在达到汇合后,将细胞以1∶10的比例进行传代培养。
根据厂商的说明进行稳定转染的细胞的建立。将2.5×105细胞播种在6孔培养皿中,并在24小时后通过磷酸钙共沉淀法(Graham和Eb,1973)用1.5μg转移质粒和13.5μg pOG44进行转染。对于293T用100μg/ml潮霉素,和对于CHO细胞用500μg/ml潮霉素来选择细胞,直至比率高达>90%的GFP阳性细胞。通过常规流式细胞术分析对所有细胞系进行GFP阳性细胞数目的测定。
GFP表达的测定在16个月的时期内通过在流式细胞仪(Becton-Dickinson)中常规测量GFP介导的绿色自身荧光来测定报道构建物的表达。平均荧光强度的数据总结于图2A(293T细胞)和2B(CHO细胞)中。发现在整个测量期间内,两种细胞系中的huGFP表达相对恒定,平均荧光强度分别为800(293T)和700(CHO)。CpG数目减少的ΔCpG-GFP报道构建物在整个测量期间内同样也显示出恒定的荧光强度。然而,与huGFP相比,平均荧光强度分别减少10-20倍(293T)和6-9倍(CHO)。在荧光显微镜中也可检测到GFP介导的荧光减少(图2C)。
因为GFP介导的荧光下降可以涉及各种原因(蛋白质的不稳定性、RNA核输出减少、转录率较低等),所以进行额外的蛋白质印迹分析和定量实时PCR。
为了通过免疫印迹检测蛋白质,将稳定转染的CHO细胞用冰冷的PBS(10mM Na2HPO4、1.8mM KH2PO4、137mM NaCl、2.7mM KCl)洗涤两次,在冰冷的PBS中刮下来,在300×g下离心10分钟,并在冰上于裂解缓冲液(50mM Tris-HCl,pH8.0,0.5%Triton X-100(w/v))中裂解30分钟。细胞裂解物的不溶解的组成成分在10000×g下于4℃离心30分钟。根据厂商说明通过Bio-Rad Protein Assay(Bio-Rad,München)测定上清液中的总蛋白量。向样品中掺入等体积的两倍样品缓冲液(Laemmli,1970),并在95℃加热5分钟。来自细胞裂解物的40μg总蛋白质通过12.5%的SDS/聚丙烯酰胺凝胶进行分离(Laemmli,1970),电转移至硝化纤维素膜上,并用单克隆GFP特异性抗体(BD-Bioscience)和第二种偶联了HRP(辣根过氧化物酶)的抗体进行检测,并借助于生色性染色法进行检验。通过Western印迹的蛋白质检测确认了来自FACS测量法的数据。对于两种基因变体,在稳定转染的CHO细胞中检测到全长GFP蛋白;在加工或蛋白水解降解中没有检测到不同(图3)。
为了阐明转录活性,对稳定转染的CHO细胞进行定量实时PCR(Light Cycler,Roche)。从细胞中制备胞质RNA(RNeasy,Quiagen),并用DNA酶进行处理(500U无RNA酶的DNA酶/20μg RNA)。将1μg经DNA酶处理的RNA用作逆转录的模板(Random Primed,p(dN)6,第1链C-DNA合成试剂盒,用于RT-PCR,Roche),随后为PCR(RT-oligo1和RT-oligo2)。所得到的PCR产物进行稀释,并用于light cycler(LC)分析(SYBR,Roche)。作为内部对照,测量了同样整合到细胞基因组中的潮霉素抗性基因的RNA量。结果总结于图4中。潮霉素抗性的RNA量在所有被测量的构建物中没有显示出差异(图4A为CHO细胞,和4C为293T细胞)。然而,GFP RNA的结果与蛋白质表达的结果(GFP荧光强度)具有极好的关联性。对于删除了CpG的构建物,在Light Cycler数据的量化后,与起始构建物相比,在CHO细胞中检测到大约少7倍的胞质RNA量(图4B),和在293T细胞中检测到大约少30倍的RNA量(图4D)。
实施例2具有不同CpG含量的鼠Mip1α基因的制备在这个实施例中,如此改变鼠MIP1α基因的核酸序列,从而形成一系列CpG二核苷酸数目不同但编码氨基酸序列没有改变的构建物。为此,利用人细胞的密码子选择将鼠MIP1α基因产物的氨基酸序列往回翻译成合成的编码MIP1α的阅读框。在第一个系列的构建物中,再次从序列中逐步去除偶然形成的CpG二核苷酸,但没有导入预期将使得表达变差的稀有密码子。此外,制备CpG二核苷酸优化的MIP1α基因构建物,它含有的CpG二核苷酸是密码子优化的构建物的两倍这么多。在这种情况下,有意地忍受密码子选择的变差,以便导入尽可能多的CpG二核苷酸。根据现有技术,预期与密码子优化的基因构建物相比,这种基因构建物由于其较较差的密码子选择而将会具有更低的表达。
这些基因变体通过利用长寡核苷酸和分段PCR而构建为完全合成的阅读框,并克隆到表达载体中。所制备的MIP1α载体变体经证明在鼠MIP1α的表达水平方面是完全不同的。对于本领域技术人员来说,不能预见CpG最少的变体将表达最差,和CpG的增加将伴随着哺乳动物细胞中MIP1α表达的增加。特别是本领域技术人员不能预见,含最大可能数目的CpG二核苷酸的构建物具有比密码子优化的基因明显更强的表达,所述最大可能数目的CpG二核苷酸是以有损于密码子选择变差的方式而引入的。
如实施例1中所述,人工构建CpG二核苷酸数目不同的鼠Mip1α基因的变体,并利用切割位点HindIII和NotI亚克隆到表达载体pcDNA3.1中。人工制备的基因在其密码子选择方面各与哺乳动物系统的相匹配。当去除CpG二核苷酸时没有使用稀有的哺乳动物密码子,而当插入的CpG二核苷酸超过用正常密码子适应所达到的二核苷酸数目时,还是有意地采用稀有密码子。
密码子优化的、但具有不同CpG二核苷酸数目的构建物全都具有超过0.9的CAI值,并且只有非实质的不同。与之相反,野生型基因以及CpG二核苷酸优化的基因(42个CpG)的CAI值具有极低的CAI值(小于0.8)。因此,根据现有技术将预期密码子优化的基因具有相当的表达,但野生型基因和CpG二核苷酸优化的基因的表达明显较低。表1中给出了构建物的标号、CpG的数目以及CAI值。在SEQ ID NO.5/6-SEQ ID NO.13/14中给出了核苷酸和氨基酸序列。类似的、相应于野生型序列的表达构建物(野生型参照构建物)在其CpG分布方面没有改变。通过聚合酶链式反应(PCR)利用寡核苷酸mamip-1和mamip-2从cDNA克隆(从RZPD获得)中扩增出编码区,并同样也利用切割位点HindIII和NotI克隆到表达载体pcDNA3.1中(“pc-mamip-wt”,SEQ ID NO.15,GenBank登录号AA071899)。
Mip1α表达的检查为了定量趋化因子的表达,用各个表达构建物转染人H1299细胞并且通过商业ELISA测试试剂盒测量细胞和细胞培养物上清液中的蛋白量。
将1.5×105人肺癌细胞(H1299)播种在6孔培养皿中,并在24小时后通过磷酸钙沉淀法用15μg相应的表达质粒转染。转染之后48小时收获细胞和细胞培养物上清液。如实施例1中所述裂解转染的细胞,并用Bio-Rad Protein Assay测定细胞裂解物的总蛋白量。通过在4℃以10000×g离心15分钟从细胞培养物上清液中去除不溶的细胞组成成分。
从1-5μg来自细胞裂解物以及来自稀释的细胞培养物上清液的总蛋白质开始,各在商业上可获得的ELISA Assay(R & D Systems)中,根据厂商说明检查Mip1α的表达。与GFP-和p24-表达构建物的数据相当地,可检测的Mip1α的总量与阅读框中的CpG数目有关。数据总结于表1中。构建物的数目允许第一次详细评价表达水平与编码区内CpG数目的关联性。
图5中显示了通过细胞因子ELISA的评价的代表性结果。柱对应于两个独立转染批次的平均值,而误差条代表各自的标准差。
表1中列出了相对于野生型构建物的两次独立瞬时转染实验(以两批次)的相对蛋白量。这些结果证实,随着CpG二核苷酸的减少蛋白表达显著减少,并且与此类基序的额外引入相关而且尽管密码子适宜度变差,与野生型基因和密码子优化的基因相比显著增加。
表1鼠MIP1α基因的表达比较

*相对于野生型构建物(maMIP wt)的总蛋白量,来自两次实验(以两批次)的蛋白量百分比平均值**标准差***密码子适应指数实施例3具有不同CpG含量的人和鼠细胞因子基因的制备为了能够进一步确认迄今为止获得的结果和解释,类似于实施例2人工构建与野生型基因在CpG二核苷酸数目方面不同的人MIP1α基因、人GM-CSF基因、人IL-15基因和鼠GM-CSF基因的变体,并利用切割位点HindIII和NotI亚克隆到表达载体pcDNA3.1中。表2中给出了构建物的标号、CpG数目以及CAI值。SEQ ID NO.17/18-SEQ IDNO.23/24和SEQ ID NO.48/49-SEQ ID NO.54/55中给出了野生型序列(wt)和CpG二核苷酸数目改变的序列的核苷酸和氨基酸序列。通过聚合酶链式反应(PCR)利用寡核苷酸humip-1和humip-2、hugm-1和hugm-2、huil-1和huil-2、magm-1和magm-2从相应的cDNA克隆(从RZPD获得)扩增出表达构建物,并同样也利用切割位点HindIII和NotI克隆到表达载体pcDNA3.1中(“pc-huMIP-wt”,GenBank登录号NM_021006,“pc-huGM-wt”,GenBank登录号M11220,“pc-huIL-wt”,GenBank登录号BC018149,“pc-muGM-wt”,GenBank登录号NM_049969,具有偏差)。
细胞因子表达的检查为了定量细胞因子的表达,用各个表达构建物转染人细胞,并且通过商业ELISA测试试剂盒测量细胞培养物上清液中的蛋白量。
如实施例2中所述,用15μg相应的表达质粒瞬时转染H1299细胞。转染之后48小时收获细胞培养物上清液。通过离心从细胞培养物上清液中去除不溶的细胞组成成分。
从稀释的细胞培养物上清液开始,各在商业上可获得的ELISAAssay(R & D Systems,对于MIP1α;BD Pharmingen,对于GM-CSF和IL-15)中,检查人MIP1α、人GM-CSF、人IL-15和鼠GM-CSF的表达。与上述表达构建物的数据相当地,培养物上清液中可检测的细胞因子的总量与阅读框中的CpG数目相关。数据总结于表2中。图6中显示了通过细胞因子ELISA的评价的代表性结果。柱对应于两个独立转染批次的平均值,而误差条代表各自的标准差。表2中列出了相对于野生型构建物的各瞬时转染实验(以两批次)的相对蛋白量。类似于实施例2中的结果,这些结果也证实,与此类基序的额外引入相关,与野生型基因相比蛋白质产生显著增加。
表2人细胞因子基因/趋化因子基因的表达比较

*相对于相应的野生型构建物(标示为wt)的总蛋白量,各来自一次实验(以两批次)的蛋白量百分比平均值**密码子适应指数实施例4制备CpG二核苷酸数目减少以增加表达的质粒使用质粒pcDNA5(Invitrogen)的核酸序列作为制备以模件方式构建的、在其中CpG二核苷酸数目已尽可能地减少的质粒的基础。如实施例1中所述,合成制备编码氨苄青霉素抗性基因(b1a)的DNA序列,并利用限制性切割位点C1aI和BglII进行亚克隆。在此,CpG的数目从72减少为2。同样地,多克隆位点被重新设计,合成地构建,并利用限制性切割位点SacI和PmeI进行亚克隆,由此CpG数目从11减少为1。CMV启动子(31个CpG)、BGH多腺苷酸化位点(3个CpG)和pUC复制起点(45个CpG)不变地整合到质粒中。删除潮霉素抗性盒。用寡核苷酸CMV-1和CMV-2通过PCR扩增来克隆CMV启动子,所述寡核苷酸CMV-1和CMV-2另外在3’和5’分别附加了C1aI和SacI限制性切割位点。类似地,通过PCR,用寡核苷酸ori-1(包含XmaI切割位点)和ori-2(包含BglII切割位点)扩增pUC ori,和用寡核苷酸pa-1(PmeI)和pa-2(XmaI)扩增BGH多腺苷酸化位点,并利用相应的限制性酶进行亚克隆。在所有PCR反应中使用质粒pcDNA5作为模板。图7A中图解显示了这种质粒的结构(“P-smallsyn”),并且在SEQ ID NO.25中给出了完整序列。
为了研究载体中的CpG数目对转录物的表达水平的影响,对参照载体进行如此修饰,从而使得它能够用作对照。通过使用各在5’端引入NsiI限制性切割位点的寡核苷酸ref-del-1和ref-del-2进行PCR扩增,用NsiI裂解,并连接,从而从质粒pcDNA5中去除潮霉素抗性盒(参见图6B,“Pc-ref”)。
使用来源于HIV-1的p24衣壳蛋白作为测试转录物。利用寡核苷酸p24-1和p24-2通过PCR从HIV-1syngag构建物(Graf等人,2000)中扩增出先前已经就在人类细胞中的表达进行优化的p24的编码区(Graf等人,2000),并利用切割位点HindIII和BamHI克隆到两个比较载体中(“R/p24”和“s/p24”)。
检查不同载体背景中HIV-1 p24的表达为了检查载体中的CpG数目对转录物的表达的影响,将构建物R/p24和s/p24瞬时转染到人类细胞中并分析p24的表达。
如实施例2中所述,用15μg相应的表达质粒瞬时转染H1299细胞。转染之后48小时收获细胞。如实施例1中所述裂解转染的细胞,并用Bio-Rad Protein Assay测定上清液中的总蛋白量。
如实施例1中所述,在Western印迹分析中使用单克隆p24特异性抗体13-5(Wolf等人,1990)就p24的表达对来自细胞裂解物的50μg总蛋白质进行检查(图8)。在两个独立的转染批次中,在用smallsyn构建物(s/p24)转染后检测到显著增高的p24表达。具有不同CpG含量的HIV p24基因的制备制备了来源于HIV-1的衣壳蛋白基因p24的两种变体,其不同之处在于CpG二核苷酸数目。syn p24基因有38个CpG,而p24ΔCpG不含CpG。如实施例1中所述,人工构建删除了CpG的基因p24ΔCpG,并利用切割位点HindIII和BamHI克隆到表达载体P-smallsyn(实施例4中所述)(“s/p24ΔCpG)和参照载体Pc-ref(“R/p24ΔCpG”)中。SEQ ID NO.26/27中给出了p24ΔCpG的核苷酸和氨基酸序列。实施例4中所述的质粒R/p24和s/p24用作参照构建物。
检查HIV-1 p24的表达为了检查载体和插入物(转录物)中的CpG数目的影响,将构建物R/p24、R/p24ΔCpG、s/p24和s/p24ΔCpG瞬时转染到人类细胞中,并分析p24的表达。
如实施例2中所述,用15μg相应的表达质粒瞬时转染H1299细胞。转染之后48小时收获细胞。如实施例1中所述裂解转染的细胞,并用Bio-Rad Protein Assay测定裂解物中的总蛋白量。
如实施例1中所述,在Western印迹分析中使用单克隆p24特异性抗体13-5就p24的表达对来自细胞裂解物的50μg总蛋白质进行检查(图9A)。如实施例4中已显示的,在相同的转基因的情况下,使用删除了CpG的载体P-smallsyn导致p24产生的明显增加(比较R/p24和s/p24)。与GFP-和细胞因子/趋化因子-表达构建物的数据相当地,在使用相同载体背景的情况下,细胞裂解物中可检测的p24的量与阅读框中的CpG数目相关(比较R/p24和R/-p24ΔCpG,以及s/p24和s/p24ΔCpG)。这些数据在p24特异性ELISA中得到证实(图9B)。含38个CpG的构建物(p24)具有比不含CpG的构建物高大约2.5倍(Pc-ref)或大约25%(P/smallsyn)的p24量。图9中显示了这些结果。
蛋白质产生与CpG二核苷酸数目的关联性可以在本文所述实施例中得到证实。所选择的基因来源于如此不同的生物,例如水母、人致病性病毒和哺乳动物。因此,很容易想到将这种机制视为普遍有效。实施例进一步证实,体外的这种关联性不仅在瞬时转染的情况下而且在稳定的重组细胞的情况下都是有效的。因此,本文所描述的方法,即通过靶向调节编码区以及载体背景中的CpG二核苷酸而靶向地改变真核生物中的基因表达,可以用于生产用于生物技术、诊断或医疗应用的生物分子。
序列描述1.寡核苷酸


2.编码多肽的序列和载体序列SEQ ID NO.1+2ΔcpG-GFP(核酸+多肽)ATGGTGTCCAAGGGGGAGGAGCTGTTCACAGGGGTGGTGCCCATCCTGGTGGAGCTGGATGGGGATGTGAATGGCCACAAGTTCTCTGTGTCTGGGGAGGGGGAGGGGGATGCCACCTATGGCAAGCTCACCCTGAAGTTCATCTGCACCACAGGCAAGCTGCCAGTGCCCTGGCCCACCCTGGTGACCACCTTCACCTATGGGGTGCAGTGCTTCAGCAGATACCCAGACCACATGAAGCAGCATGACTTCTTCAAGTCTGCCATGCCTGAGGGCTATGTGCAGGAGAGGACCATCTTCTTCAAGGATGATGGCAACTACAAGACCAGGGCTGAGGTGAAGTTTGAGGGGGATACCCTGGTGAACAGGATTGAGCTGAAGGGCATTGACTTTAAGGAGGATGGCAATATCCTGGGCCACAAGCTGGAGTACAACTACAACAGCCACAATGTGTACATCATGGCAGACAAGCAGAAGAATGGCATCAAGGTGAACTTCAAGATCAGGCACAACATTGAGGATGGCTCTGTGCAGCTGGCAGACCACTACCAGCAGAACACCCCCATTGGAGATGGCCCTGTCCTGCTGCCAGACAACCACTACCTGAGCACCCAGTCTGCCCTGAGCAAGGACCCCAATGAGAAGAGGGACCACATGGTGCTGCTGGAGTTTGTGACAGCTGCTGGCATCACCCTGGGCATGGATGAGCTGTACAAGTGASEQ ID NO.3+4huGFP(核酸+多肽)ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCTTCACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAA
GGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAASEQ ID NO.5+6鼠MIP1α-0CpG(核酸+多肽)ATGAAGGTGAGCACAACAGCTCTGGCTGTGCTGCTGTGTACCATGACCCTGTGCAACCAGGTGTTCTCTGCCCCTTATGGAGCAGATACCCCTACAGCCTGCTGTTTCAGCTACAGCAGGAAGATCCCCAGGCAGTTCATTGTGGACTACTTTGAGACCAGCAGCCTGTGTTCTCAGCCTGGGGTGATCTTTCTGACCAAGAGGAACAGGCAGATCTGTGCAGACAGCAAGGAGACATGGGTGCAGGAGTACATCACAGACCTGGAGCTGAATGCCTAGSEQ ID NO.7+8鼠MIP1α-2CpG(核酸+多肽)ATGAAGGTGAGCACAACAGCTCTGGCCGTGCTGCTGTGTACCATGACCCTGTGCAACCAGGTGTTCTCTGCCCCTTATGGAGCAGATACCCCTACAGCCTGCTGTTTCAGCTACAGCAGGAAGATCCCCAGGCAGTTCATCGTGGACTACTTTGAGACCAGCAGCCTGTGTTCTCAGCCTGGGGTGATCTTTCTGACCAAGAGGAACAGGCAGATCTGTGCAGACAGCAAGGAGACATGGGTGCAGGAGTACATCACAGACCTGGAGCTGAATGCCTAGSEQ ID NO.9+10鼠MIP1α-4CpG(核酸+多肽)ATGAAGGTGAGCACAACAGCTCTGGCCGTGCTGCTGTGTACCATGACCCTGTGCAACCAGGTGTTCTCTGCCCCTTACGGAGCAGATACCCCTACAGCCTGCTGTTTCAGCTACAGCAGGAAGATCCCCAGGCAGTTCATCGTG
GACTACTTTGAGACCAGCAGCCTGTGTTCTCAGCCTGGGGTGATCTTTCTGACCAAGAGGAACCGCCAGATCTGTGCAGACAGCAAGGAGACATGGGTGCAGGAGTACATCACAGACCTGGAGCTGAATGCCTAGSEQ ID NO.11+12鼠MIP1α-13CpG(核酸+多肽)ATGAAGGTGAGCACCACAGCTCTGGCTGTGCTGCTGTGCACCATGACCCTGTGCAACCAGGTGTTCAGCGCTCCTTACGGCGCCGATACCCCTACAGCCTGCTGCTTCAGCTACAGCAGGAAGATCCCCAGGCAGTTCATCGTGGACTACTTCGAGACCAGCAGCCTGTGTTCTCAGCCCGGCGTGATCTTCCTGACCAAGCGGAACAGACAGATCTGCGCCGACAGCAAGGAGACATGGGTGCAGGAGTACATCACCGACCTGGAGCTGAACGCCTAGSEQ ID NO.13+14鼠MIP1α-42CpG(核酸+多肽)ATGAAGGTGTCGACGACCGCGCTCGCCGTGCTGCTGTGCACGATGACGCTGTGCAACCAGGTGTTCAGCGCCCCGTACGGCGCCGACACGCCGACCGCGTGCTGCTTCTCGTACTCGCGGAAGATCCCGCGGCAGTTCATCGTCGACTACTTCGAAACGTCGTCGCTGTGCTCGCAGCCCGGCGTGATCTTCCTCACGAAGCGGAACCGGCAGATCTGCGCCGACTCGAAGGAAACGTGGGTGCAGGAGTACATCACCGACCTCGAACTGAACGCGTAGSEQ ID NO.15+16鼠MIP1α野生型(7CpG)(核酸+多肽)ATGAAGGTCTCCACCACTGCCCTTGCTGTTCTTCTCTGTACCATGACACTCTGCAACCAAGTCTTCTCAGCGCCATATGGAGCTGACACCCCGACTGCCTGCTGCTTCTCCTACAGCCGGAAGATTCCACGCCAATTCATCGTTGACTATTTTGAAACCAGCAGCCTTTGCTCCCAGCCAGGTGTCATTTTCCTGACTAAGAGAAACCGGCAGATCTGCGCTGACTCCAAAGAGACCTGGGTCCAAGAATACATCACTGACCTGGAACTGAATGCCTAGSEQ ID NO.17+18人MIP1α-43CpG(核酸+多肽)
ATGCAAGTGTCGACCGCCGCTCTCGCCGTGCTGCTGTGCACGATGGCGCTGTGCAACCAAGTGCTGAGCGCGCCTCTCGCCGCCGACACGCCGACCGCGTGCTGCTTCTCGTACACGTCGCGGCAGATCCCGCAGAACTTCATCGCCGACTACTTCGAGACGTCGTCGCAGTGCTCGAAGCCGAGCGTGATCTTCCTGACGAAGCGCGGACGGCAAGTGTGCGCCGACCCGAGCGAGGAGTGGGTGCAGAAGTACGTGAGCGACCTCGAACTGAGCGCGTAGSEQ ID NO.19+20人GM-CSF-63CpG(核酸+多肽)ATGTGGCTGCAGTCGCTGCTGCTGCTCGGAACCGTCGCGTGTTCGATCAGCGCGCCTGCGCGGTCGCCGTCGCCGTCGACGCAGCCGTGGGAGCACGTGAACGCGATCCAGGAGGCGCGACGGCTGCTGAACCTGTCGCGCGATACAGCCGCCGAGATGAACGAGACCGTCGAGGTGATCAGCGAGATGTTCGACCTGCAGGAGCCGACGTGCCTGCAGACGCGGCTCGAACTGTATAAGCAGGGCCTCCGCGGCTCGCTCACGAAGCTGAAGGGCCCGCTCACGATGATGGCGTCGCACTACAAGCAGCACTGCCCGCCGACGCCCGAAACGTCGTGCGCGACGCAGATCATCACGTTCGAGTCGTTCAAGGAGAACCTGAAGGACTTCCTGCTCGTGATCCCGTTCGATTGCTGGGAGCCCGTGCAGGAGTAGSEQ ID NO.21+22人MIP1α野生型(8CpG)(核酸+多肽)ATGCAGGTCTCCACTGCTGCCCTTGCCGTCCTCCTCTGCACCATGGCTCTCTGCAACCAGGTCCTCTCTGCACCACTTGCTGCTGACACGCCGACCGCCTGCTGCTTCAGCTACACCTCCCGACAGATTCCACAGAATTTCATAGCTGACTACTTTGAGACGAGCAGCCAGTGCTCCAAGCCCAGTGTCATCTTCCTAACCAAGAGAGGCCGGCAGGTCTGTGCTGACCCCAGTGAGGAGTGGGTCCAGAAATACGTCAGTGACCTGGAGCTGAGTGCCTAGSEQ ID NO.23+24人GM-CSF野生型(10CpG)(核酸+多肽)ATGTGGCTGCAGAGCCTGCTGCTCTTGGGCACTGTGGCCTGCAGCATC
TCTGCACCCGCCCGCTCGCCCAGCCCCAGCACGCAGCCCTGGGAGCATGTGAATGCCATCCAGGAGGCCCGGCGTCTCCTGAACCTGAGTAGAGACACTGCTGCTGAGATGAATGAAACAGTAGAAGTCATCTCAGAAATGTTTGACCTCCAGGAGCCGACCTGCCTACAGACCCGCCTGGAGCTGTACAAGCAGGGCCTGCGGGGCAGCCTCACCAAGCTCAAGGGCCCCTTGACCATGATGGCCAGCCACTACAAGCAGCACTGCCCTCCAACCCCGGAAACTTCCTGTGCAACCCAGATTATCACCTTTGAAAGTTTCAAAGAGAACCTGAAGGACTTTCTGCTTGTCATCCCCTTTGACTGCTGGGAGCCAGTCCAGGAGTAGSEQ ID NO.25P-smallsyn(质粒的核酸序列)ATCGATGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCTAAATTAATACGACTCACTATAGGGAGACCCAAGCTGTTAAGCTTGGTAGATATCAGGGATCCACTCAGCTGATCAGCCTCCAGTTTAAACCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCCCGGGTAGTGAATTCATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACG
CTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGAGATCTGTCTGACTCTCAGTGGAACCAAAACTCATGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGGTTAACTTACCAATGCTTAATCAATGAGGCACCAATCTCTGCAATCTGCCTATTTCTCTCATCCATGGTTGCCTGACTGCCTGTGGTGTAGATAACTACAATCCTGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCTCTAGACCCTCTCTCACCTGCTCCAGATTTATCTGCAATGAACCAGCCAGCTGGAAGGGCAGACCTCAGAAGTGGTCCTGCAACTTTATCTGCCTCCATCCAGTCTATTAATTGTTGTCTGGAAGCTAGAGTAAGCAGTTCACCAGTTAATAGTTTCCTCAAGGTTGTTGCCATTGCTACAGGCATGGTGGTGTCCCTCTCATCATTTGGTATGGCTTCATTCAGCTCTGGTTCCCATCTATCAAGCCTAGTTACATGATCACCCATGTTGTGCAAAAAAGCAGTCAACTCCTTTGGTCCTCCAATGGTTGTCAAAAGTAAGTTGGCAGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCTGTAAGATGCTTTTCTGTGACTGGACTGTACTCAACCAAGTCATTCTGAGAATAGTGTATTCTTCTACCCAGTTGCTCTTGCCCAGCATCAATTCTGGATAATACTGCACCACATAGCAGAACTTTAAAGGTGCTCATCATTGGAAATCTTTCTTCTGGTCTAAAACTCTCAAGGATCTTACCAGAGTTGAGATCCAGTTCAATGTAACCCACTCTTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGGGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAAGGCAGCAAAAAAGGGAATAAGGGCAACTCTGAAATGTTGAATACTCATAGTACTACTCTTCCTTTTTCAAT
ATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTATGCATTCAGCTCACATTTCCCTGAAAAGTGCCACCTGAAATTGACTGATAGGGAGTTCTCCCAATCCCCTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCTCATAGTTAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCACTGAGTAGTGGGCTAGCAAAATTTAAGCTACAACAAGGCAAGGCTTGACCTACAATTGCATGAAGAATCTGCTTAGGGTTAGGCCTTTTGCACTGCTTGGAGATGTACTGGCCAGATATACTASEQ ID NO.26+27p24ΔCpG(核酸+多肽)ATGGTGCACCAGGCCATCAGCCCCAGGACCCTGAATGCCTGGGTGAAGGTGGTGGAGGAGAAGGCCTTCAGCCCTGAGGTGATCCCCATGTTCTCTGCCCTGTCTGAGGGGGCCACCCCCCAGGACCTGAACACCATGCTGAACACAGTGGGGGGCCACCAGGCTGCCATGCAGATGCTGAAGGAAACCATCAATGAGGAGGCTGCTGAGTGGGACAGAGTGCACCCTGTGCATGCTGGCCCCATTGCCCCTGGCCAGATGAGGGAGCCCAGGGGCTCTGACATTGCTGGCACCACCTCCACCCTGCAGGAGCAGATTGGCTGGATGACCAACAACCCCCCCATCCCTGTGGGGGAGATCTACAAGAGATGGATCATCCTGGGCCTGAACAAGATTGTGAGGATGTACAGCCCCACCTCCATCCTGGACATCAGGCAGGGCCCCAAGGAGCCCTTCAGGGACTATGTGGACAGGTTCTACAAGACCCTGAGGGCTGAGCAGGCCAGCCAGGAGGTGAAGAACTGGATGACAGAGACCCTGCTGGTGCAGAATGCCAACCCTGACTGCAAGACCATCCTGAAGGCCCTGGGCCCAGCTGCCACCCTGGAGGAGATGATGACAGCCTGCCAGGGGGTGGGAGGCCCTGGCCACAAGGCCAGGGTGCTGTAASEQ ID NO.52+53人IL-15-21CpGATGCGGATCAGCAAGCCCCACCTGAGGAGCATCAGCATCCAGTGCTACCTGTGCCTGCTGCTGAACAGCCACTTCCTGACAGAGGCCGGCATCCACGTGTTTATCCTGGGCTGCTTCTCTGCCGGCCTGCCTAAGACAGAGGCCAACTGGGTGAACGTGATCAGCGACCTGAAGAAGATCGAGGACCTGATCCAGAGCATGCACATCGACGCCACCCTGTACACAGAGAGCGACGTGCACCCTAGCTGTAAGGTGACCGCCATGAAGTGCTTCCTGCTGGAGCTGCAG
GTGATCAGCCTGGAGAGCGGCGATGCCAGCATCCACGACACCGTGGAGAACCTGATCATCCTGGCCAACAACAGCCTGAGCAGCAACGGCAATGTGACCGAGAGCGGCTGCAAGGAGTGTGAGGAGCTGGAGGAGAAGAACATCAAGGAGTTCCTGCAGAGCTTCGTGCACATCGTGCAGATGTTCATCAACACCAGCTAGSEQ ID NO.54+55鼠GM-CSF-62CpGATGTGGCTGCAGAACCTGCTGTTCCTCGGCATCGTCGTGTACTCGCTGAGCGCGCCGACGCGCTCGCCGATCACCGTGACGCGGCCGTGGAAGCACGTCGAGGCGATCAAGGAGGCGCTGAACCTGCTCGACGACATGCCCGTGACGCTGAACGAGGAGGTCGAGGTCGTGTCGAACGAGTTCTCGTTCAAGAAGCTGACGTGCGTGCAGACGCGGCTGAAGATCTTCGAGCAGGGCCTGCGCGGCAACTTCACGAAGCTGAAGGGCGCGCTGAACATGACCGCGTCGTACTACCAGACGTACTGCCCGCCGACGCCCGAGACCGATTGCGAGACGCAGGTGACGACGTACGCCGACTTCATCGACTCGCTGAAGACGTTCCTGACCGACATCCCGTTCGAGTGCAAGAAGCCCGGCCAGAAGTAGSEQ ID NO.56+57人IL-15-野生型(3CpG)ATGAGAATTTCGAAACCACATTTGAGAAGTATTTCCATCCAGTGCTACTTGTGTTTACTTCTAAACAGTCATTTTCTAACTGAAGCTGGCATTCATGTCTTCATTTTGGGCTGTTTCAGTGCAGGGCTTCCTAAAACAGAAGCCAACTGGGTGAATGTAATAAGTGATTTGAAAAAAATTGAAGATCTTATTCAATCTATGCATATTGATGCTACTTTATATACGGAAAGTGATGTTCACCCCAGTTGCAAAGTAACAGCAATGAAGTGCTTTCTCTTGGAGTTACAAGTTATTTCACTTGAGTCCGGAGATGCAAGTATTCATGATACAGTAGAAAATCTGATCATCCTAGCAAACAACAGTTTGTCTTCTAATGGGAATGTAACAGAATCTGGATGCAAAGAATGTGAGGAACTGGAGGAAAAAAATATTAAAGAATTTTTGCAGAGTTTTGTACATATTGTCCAAATGTTCATCAACACTTCTTAGSEQ ID NO.58+59鼠GM-CSF-野生型(11CpG)ATGTGGCTGCAGAATTTACTTTTCCTGGGCATTGTGGTCTACAGCCTCTCAGCACCCACCCGCTCACCCATCACTGTCACCCGGCCTTGGAAGCATGTAGAGGCCATCAAAGAAGCCCTGAACCTCCTGGATGACATGCCTGTCA
CATTGAATGAAGAGGTAGAAGTCGTCTCTAACGAGTTCTCCTTCAAGAAGCTAACATGTGTGCAGACCCGCCTGAAGATATTCGAGCAGGGTCTACGGGGCAATTTCACCAAACTCAAGGGCGCCTTGAACATGACAGCCAGCTACTACCAGACATACTGCCCCCCAACTCCGGAAACGGACTGTGAAACACAAGTTACCACCTATGCGGATTTCATAGACAGCCTTAAAACCTTTCTGACTGATATCCCCTTTGAATGCAAAAAACCAGGCCAAAAATAG
参考文献Akiyama,Y.,Maesawa,C.,Ogasawara,S.,Terashima,M.and Masuda,T.(2003)Cell-type-specific repression of the maspin gene is disruptedfrequently by demethylation at the promoter region in gastric intestinalmetaplasia and cancer cells,Am.J.Pathol.163,1911-1919.
Antequera,F.and Bird,A.(1993)Number of CpG islands and genes inhuman and mouse,Proc.Natl.Acad.Sci.U.S.A 90,11995-11999.
Ausubel,F.M.,Brent,R.,Kingston,R.E.,Moore,d.d.,Seidman,J.G.,Smith,J.A.and Struhl,K.(1994)Percentage of Kodon Synonomous Usageand Frequency of Kodon Occurrence in Various Organisms,CurrentProtocols in Molecular Biology 2,A1.8-A1.9.
Bird,A.P.(1980)DNA methylation and the frequency of CpG in animalDNA,Nucleic Acids Res.8,1499-1504.
Chevalier-Mariette,C.,Henry,I.,Montfort,L.,Capgras,S.,Forlani,S.,Muschler,J.and Nicolas,J.F.(2003)CpG content affects gene silencing inmiceevidence from noveltransgenes,Genome Biol.4,R53.
Choi,Y.S.,Kim,S.,Kyu,L.H.,Lee,K.U.and Pak,Y.K.(2004)In vitromethylation of nuclear respiratory factor-1 binding site suppresses thepromoter activity of mitochondrial transcription factor A,Biochem.Biophys.Res.Commun.314,118-122.
Deml L.,Bojak A.,Steck S.,Graf M.,Wild J.,Schirmbeck R.,Wolf H.,Wagner R.(2003)Multiple Effects of Codon Usage Optimization onExpression and Immunognicity of DNA Candidate Vaccines Encoding theHuman Immunodeficiency Virus Type 1 Gag Gene,J.Virol.75 No.22,10999-11001.
Deng,G.,Chen,A.,Pong,E.and Kim,Y.S.(2001)Methylation in hMLH1promoter interferes with its binding to transcription factor CBF and inhibitsgene expression,Oncogene 20,7120-7127.
Duan J.und Antezana A.(2003)Mammalian Mutation Pressure,Synonymous Codon Choice,and mRNA Degradation,J.Mol.Evol.57,694-701Hendrich,B.and Bird,A.(1998)Identification and characterization of afamily of mammalian methyl-CpG binding proteins,Mol.Cell Biol.18,6538-6547.
Hisano,M.,Ohta,H.,Nishimune,Y.and Nozaki,M.(2003)Methylation ofCpG dinucleotides in the open reading frame of a testicular germ cell-specific intronless gene,Tact1/Actl7b,represses its expression in somaticcells,Nucleic Acids Res.31,4797-4804.
Hsieh,C.L.(1994)Dependence of transcriptional repression on CpGmethylation density,Mol.Cell Biol.14,5487-5494.
Ivanova,T.,Vinokurova,S.,Petrenko,A.,Eshilev,E.,Solovyova,N.,Kisseljov,F.and Kisseljova,N.(2004)Frequent hypermethylation of 5′flanking region of TIMP-2gene in cervical cancer,Int.J.Cancer 108,882-886.
Jones,P.L.,Veenstra,G.J.,Wade,P.A.,Vermaak,D.,Kass,S.U.,Landsberger,N.,Strouboulis,J.and Wolffe,A.P.(1998)Methylated DNAand MeCP2 recruit histone deacetylase to repress transcription,Nat.Genet.19,187-191.
Kang,G.H.,Lee,S.,Lee,H.J.and Hwang,K.S.(2004)Aberrant CpGisland hypermethylation of multiple genes in prostate cancer and prostaticintraepithelial neoplasia,J.Pathol.202,233-240.
Kudo,S.(1998)Methyl-CpG-binding protein MeCP2 represses Sp1-activated transcription of the human leukosialin gene when the promoter ismethylated,Mol.Cell Biol.18,5492-54g9.
Laemmli,U.K.(1970)Cleavage of structural proteins during the assembly ofthe head of bacteriophage T4,.Nature 227,680-685.
Larsen,F.,Gundersen,G.,Lopez,R.and Prydz,H.(1992)CpG islands asgene markers in the human genome,Genomics 13,1095-1107.
Li,Q.L.,Kim,H.R.,Kim,W.J.,Choi,J.K.,Lee,Y.H.,Kim,H.M.,Li,L.S.,Kim,H.,Chang,J.,Ito,Y.,Youl,L.K.and Bae,S.C.(2004)Transcriptionalsilencing of the RUNX3gene by CpG hypermethylation is associated withlung cancer,Biochem.Biophys.Res.Commun.314,223-228.
Nan,X.,Ng,H.H.,Johnson,C.A.,Laherty,C.D.,Turner,B.M.,Eisenman,R.N.and Bird,A.(1998)Transcriptional repression by the methyl-CpG-binding protein MeCP2 involves a histone deacetylase complex,Nature 393,386-389.
Shen ,J.C.,Rideout,W.M.,III and Jones,P.A.(1994)The rate of hydrolyticdeamination of 5-methylcytosine in double-stranded DNA,Nucleic AcidsRes.22,972-976.
Sved,J.and Bird,A.(1990)The expected equilibrium of the CpGdinucleotide in vertebrate genomes under a mutation model,Proc.Natl.Acad.Sci.U.S.A 87,4692-4696.
Takai,D.and Jones,P.A.(2002)Comprehensive analysis of CpG islands inhuman chromosomes 21 and 22,Proc.Natl.Acad.Sci.U.S.A 99,3740-3745.
Voo,K.S.,Carlone,D.L.,Jacobsen,B.U.,Flodin,A.,und Skalnik,D.(2000)Cloning of a Mammalian Transcriptional Activator That Binds UnmethylatedCpG motifs and Shares a CXXC Domain with DNA Mathyltransferase,Human Trithorax,and Methyl-CpG Binding Domain Protein I,Mol.And Cell.Biol.Mar.2000,2108-2121.
Wade,P.A.,Gegonne,A.,Jones,P.L.,Ballestar,E.,Aubry,F.and Wolffe,A.P.(1999)Mi-2 complex couples DNA methylation to chromatinremodelling and histone deacetylation,Nat.Genet.23,62-66.
Wise,T.L.and Pravtcheva,D.D.(1999)The undermethylated state of aCpG island region in igf2 transgenes is dependent on the H19 enhancers,Genomics 60,258-271.
Wolf,H.,Modrow,S.,Soutschek,E.,Motz,M.,Grunow,R.and Dbl,H.(1990)Production,mapping and biological characterisation of monoclonalantibodies to the core protein(p24)of the human immunodeficiency virustype 1.,AIFO 1,24-29.
Wu,Q.,Shi,H.,Suo,Z.and Nesland,J.M.(2003)5′-CpG island methylationof the FHIT gene is associated with reduced protein expression and higherclinical stage in cervical carcinomas,Ultrastruct.Pathol.27,417-422.
Yao,X.,Hu,J.F.,Daniels,M.,Shiran,H.,Zhou,X.,Yan,H.,Lu,H.,Zeng,Z.,Wang,Q.,Li,T.and Hoffman,A.R.(2003)A methylated oligonucleotideinhibits IGF2 expression and enhances survival in a model of hepatocellularcarcinoma,J.Clin.Invest 111,265-273.
Yoshida,M.,Nosaka,K.,Yasunaga,J.I.,Nishikata,I.,Morishita,K.andMatsuoka,M.(2003)Aberrant expression of the MEL1S gene identified inassociation with hypomethylation in adult T-cell leukemia cells,Blood.
序列表<110>Geneart GmbH<120>通过改变CpG含量来调节基因表达的方法<130>33252-DH<140>
<141>
<160>59<170>PatentIn Ver.2.1<210>1<211>720<212>DNA<213>人工序列<220>
<223>人工序列的描述不含CpG的Δ绿色荧光蛋白(GFP)基因<220>
<221>CDS<222>(1)..(720)<400>1atg gtg tcc aag ggg gag gag ctg ttc aca ggg gtg gtg ccc atc ctg48Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu1 5 10 15gtg gag ctg gat ggg gat gtg aat ggc cac aag ttc tct gtg tct ggg96Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly20 25 30gag ggg gag ggg gat gcc acc tat ggc aag ctc acc ctg aag ttc atc144Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile35 40 45tgc acc aca ggc aag ctg cca gtg ccc tgg ccc acc ctg gtg acc acc192Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr50 55 60
ttc acc tat ggg gtg cag tgc ttc agc aga tac cca gac cac atg aag240Phe Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys65 70 75 80cag cat gac ttc ttc aag tct gcc atg cct gag ggc tat gtg cag gag288Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu85 90 95agg acc atc ttc ttc aag gat gat ggc aac tac aag acc agg gct gag336Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu100 105 110gtg aag ttt gag ggg gat acc ctg gtg aac agg att gag ctg aag ggc384Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly115 120 125att gac ttt aag gag gat ggc aat atc ctg ggc cac aag ctg gag tac432Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr130 135 140aac tac aac agc cac aat gtg tac atc atg gca gac aag cag aag aat480Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn145 150 155 160ggc atc aag gtg aac ttc aag atc agg cac aac att gag gat ggc tct528Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser165 170 175gtg cag ctg gca gac cac tac cag cag aac acc ccc att gga gat ggc576Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly180 185 190cct gtc ctg ctg cca gac aac cac tac ctg agc acc cag tct gcc ctg624Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu195 200 205agc aag gac ccc aat gag aag agg gac cac atg gtg ctg ctg gag ttt672Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe210 215 220gtg aca gct gct ggc atc acc ctg ggc atg gat gag ctg tac aag tga720Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys225 230 235 240
<210>2<211>239<212>PRT<213>人工序列<223>人工序列的描述不含CpG的Δ绿色荧光蛋白(GFP)基因<400>2Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu1 5 10 15Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly20 25 30Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile35 40 45Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr50 55 60Phe Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys65 70 75 80Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu85 90 95Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu100 105 110Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly115 120 125Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr130 135 140Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn145 150 155 160Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser165 170 175Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu195 200 205Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe210 215 220Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys225 230 235<210>3<211>720<212>DNA<213>人工序列<220>
<223>人工序列的描述人绿色荧光蛋白(huGFP)基因<220>
<221>CDS<222>(1)..(720)<400>3atg gtg agc aag ggc gag gag ctg ttc acc ggg gtg gtg ccc atc ctg48Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu1 5 10 15gtc gag ctg gac ggc gac gta aac ggc cac aag ttc agc gtg tcc ggc96Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly20 25 30gag ggc gag ggc gat gcc acc tac ggc aag ctg acc ctg aag ttc atc144Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile35 40 45tgc acc acc ggc aag ctg ccc gtg ccc tgg ccc acc ctc gtg acc acc192Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr50 55 60ttc acc tac ggc gtg cag tgc ttc agc cgc tac ccc gac cac atg aag240Phe Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys65 70 75 80
cag cac gac ttc ttc aag tcc gcc atg ccc gaa ggc tac gtc cag gag288Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu85 90 95cgc acc atc ttc ttc aag gac gac ggc aac tac aag acc cgc gcc gag336Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu100 105 110gtg aag ttc gag ggc gac acc ctg gtg aac cgc atc gag ctg aag ggc384Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly115 120 125atc gac ttc aag gag gac ggc aac atc ctg ggg cac aag ctg gag tac432Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr130 135 140aac tac aac agc cac aac gtc tat atc atg gcc gac aag cag aag aac480Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn145 150 155 160ggc atc aag gtg aac ttc aag atc cgc cac aac atc gag gac ggc agc528Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser165 170 175gtg cag ctc gcc gac cac tac cag cag aac acc ccc atc ggc gac ggc576Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly180 185 190ccc gtg ctg ctg ccc gac aac cac tac ctg agc acc cag tcc gcc ctg624Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu195 200 205agc aaa gac ccc aac gag aag cgc gat cac atg gtc ctg ctg gag ttc672Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe210 215 220gtg acc gcc gcc ggg atc act ctc ggc atg gac gag ctg tac aag taa720Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys225 230 235 240<210>4<211>239<212>PRT
<213>人工序列<223>人工序列的描述人绿色荧光蛋白(huGFP)基因<400>4Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu1 5 10 15Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly20 25 30Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile35 40 45Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr50 55 60Phe Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys65 70 75 80Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu85 90 95Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu100 105 110Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly115 120 125Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr130 135 140Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn145 150 155 160Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser165 170 175Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly180 185 190Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu195 200 205Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys225 230 235<210>5<211>279<212>DNA<213>人工序列<220>
<223>人工序列的描述鼠MIP1α-0CpG(具有0个CpG二核苷酸的鼠MIP1α基因)<220>
<221>CDS<222>(1)..(279)<400>5atg aag gtg agc aca aca gct ctg gct gtg ctg ctg tgt acc atg acc48Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15ctg tgc aac cag gtg ttc tct gcc cct tat gga gca gat acc cct aca96Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30gcc tgc tgt ttc agc tac agc agg aag atc ccc agg cag ttc att gtg144Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45gac tac ttt gag acc agc agc ctg tgt tct cag cct ggg gtg atc ttt192Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60ctg acc aag agg aac agg cag atc tgt gca gac agc aag gag aca tgg240Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80gtg cag gag tac atc aca gac ctg gag ctg aat gcc tag279Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90
<210>6<211>92<212>PRT<213>人工序列<223>人工序列的描述鼠MIP1α-0CpG(具有0个CpG二核苷酸的鼠MIP1α基因)<400>6Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90<210>7<211>279<212>DNA<213>人工序列<220>
<223>人工序列的描述鼠MIP1α-2CpG(具有2个CpG二核苷酸的鼠MIP1α基因)<220>
<221>CDS<222>(1)..(279)<400>7atg aag gtg agc aca aca gct ctg gcc gtg ctg ctg tgt acc atg acc48Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15
ctg tgc aac cag gtg ttc tct gcc cct tat gga gca gat acc cct aca96Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30gcc tgc tgt ttc agc tac agc agg aag atc ccc agg cag ttc atc gtg144Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45gac tac ttt gag acc agc agc ctg tgt tct cag cct ggg gtg atc ttt192Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60ctg acc aag agg aac agg cag atc tgt gca gac agc aag gag aca tgg240Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80gtg cag gag tac atc aca gac ctg gag ctg aat gcc tag279Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90<210>8<211>92<212>PRT<213>人工序列<223>人工序列的描述鼠MIP1α-2CpG(具有2个CpG二核苷酸的鼠MIP1α基因)<400>8Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80
Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90<210>9<211>279<212>DNA<213>人工序列<220>
<223>人工序列的描述鼠MIP1α-4CpG(具有4个CpG二核苷酸的鼠MIP1α基因)<220>
<221>CDS<222>(1)..(279)<400>9atg aag gtg agc aca aca gct ctg gcc gtg ctg ctg tgt acc atg acc48Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15ctg tgc aac cag gtg ttc tct gcc cct tac gga gca gat acc cct aca96Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30gcc tgc tgt ttc agc tac agc agg aag atc ccc agg cag ttc atc gtg144Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45gac tac ttt gag acc agc agc ctg tgt tct cag cct ggg gtg atc ttt192Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60ctg acc aag agg aac cgc cag atc tgt gca gac agc aag gag aca tgg240Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80gtg cag gag tac atc aca gac ctg gag ctg aat gcc tag279Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90<210>10
<211>92<212>PRT<213>人工序列<223>人工序列的描述鼠MIP1α-4CpG(具有4个CpG二核苷酸的鼠MIP1α基因)<400>10Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90<210>11<211>279<212>DNA<213>人工序列<220>
<223>人工序列的描述鼠MIP1α-13CpG(具有13个CpG二核苷酸的鼠MIP1α基因)<220>
<221>CDS<222>(1)..(279)<400>11atg aag gtg agc acc aca gct ctg gct gtg ctg ctg tgc acc atg acc48Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15ctg tgc aac cag gtg ttc agc gct cct tac ggc gcc gat acc cct aca96
Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30gcc tgc tgc ttc agc tac agc agg aag atc ccc agg cag ttc atc gtg144Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45gac tac ttc gag acc agc agc ctg tgt tct cag ccc ggc gtg atc ttc192Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60ctg acc aag cgg aac aga cag atc tgc gcc gac agc aag gag aca tgg240Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80gtg cag gag tac atc acc gac ctg gag ctg aac gcc tag279Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90<210>12<211>92<212>PRT<213>人工序列<223>人工序列的描述鼠MIP1α-13CpG(具有13个CpG二核苷酸的鼠MIP1α基因)<400>12Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90
<210>13<211>279<212>DNA<213>人工序列<220>
<223>人工序列的描述鼠MIP1α-42CpG(具有42个CpG二核苷酸的鼠MIP1α基因)<220>
<221>CDS<222>(1)..(279)<400>13atg aag gtg tcg acg acc gcg ctc gcc gtg ctg ctg tgc acg atg acg48Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15ctg tgc aac cag gtg ttc agc gcc ccg tac ggc gcc gac acg ccg acc96Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30gcg tgc tgc ttc tcg tac tcg cgg aag atc ccg cgg cag ttc atc gtc144Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45gac tac ttc gaa acg tcg tcg ctg tgc tcg cag ccc ggc gtg atc ttc192Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60ctc acg aag cgg aac cgg cag atc tgc gcc gac tcg aag gaa acg tgg240Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80gtg cag gag tac atc acc gac ctc gaa ctg aac gcg tag279Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90<210>14<211>92<212>PRT
<213>人工序列<223>人工序列的描述鼠MIP1α-42CpG(具有42个CpG二核苷酸的鼠MIP1α基因)<400>14Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90<210>15<211>279<212>DNA<213>鼠<220>
<223>具有7个CpG二核苷酸的鼠MIP1α野生型<220>
<221>CDS<222>(1)..(279)<400>15atg aag gtc tcc acc act gcc ctt gct gtt ctt ctc tgt acc atg aca48Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15ctc tgc aac caa gtc ttc tca gcg cca tat gga gct gac acc ccg act96Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30
gcc tgc tgc ttc tcc tac agc cgg aag att cca cgc caa ttc atc gtt144Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45gac tat ttt gaa acc agc agc ctt tgc tcc cag cca ggt gtc att ttc192Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60ctg act aag aga aac cgg cag atc tgc gct gac tcc aaa gag acc tgg240Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80gtc caa gaa tac atc act gac ctg gaa ctg aat gcc tag279Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90<210>16<211>92<212>PRT<213>鼠<223>具有7个CpG二核苷酸的鼠MIP1α野生型<400>16Met Lys Val Ser Thr Thr Ala Leu Ala Val Leu Leu Cys Thr Met Thr1 5 10 15Leu Cys Asn Gln Val Phe Ser Ala Pro Tyr Gly Ala Asp Thr Pro Thr20 25 30Ala Cys Cys Phe Ser Tyr Ser Arg Lys Ile Pro Arg Gln Phe Ile Val35 40 45Asp Tyr Phe Glu Thr Ser Ser Leu Cys Ser Gln Pro Gly Val Ile Phe50 55 60Leu Thr Lys Arg Asn Arg Gln Ile Cys Ala Asp Ser Lys Glu Thr Trp65 70 75 80Val Gln Glu Tyr Ile Thr Asp Leu Glu Leu Asn Ala85 90
<210>17<211>282<212>DNA<213>人工序列<220>
<223>人工序列的描述人MIP1α-43CpG(具有43个CpG的人MIP1α基因)<220>
<221>CDS<222>(1)..(282)<400>17atg caa gtg tcg acc gcc gct ctc gcc gtg ctg ctg tgc acg atg gcg48Met Gln Val Ser Thr Ala Ala Leu Ala Val Leu Leu Cys Thr Met Ala1 5 10 15ctg tgc aac caa gtg ctg agc gcg cct ctc gcc gcc gac acg ccg acc96Leu Cys Asn Gln Val Leu Ser Ala Pro Leu Ala Ala Asp Thr Pro Thr20 25 30gcg tgc tgc ttc tcg tac acg tcg cgg cag atc ccg cag aac ttc atc144Ala Cys Cys Phe Ser Tyr Thr Ser Arg Gln Ile Pro Gln Asn Phe Ile35 40 45gcc gac tac ttc gag acg tcg tcg cag tgc tcg aag ccg agc gtg atc192Ala Asp Tyr Phe Glu Thr Ser Ser Gln Cys Ser Lys Pro Ser Val Ile50 55 60ttc ctg acg aag cgc gga cgg caa gtg tgc gcc gac ccg agc gag gag240Phe Leu Thr Lys Arg Gly Arg Gln Val Cys Ala Asp Pro Ser Glu Glu65 70 75 80tgg gtg cag aag tac gtg agc gac ctc gaa ctg agc gcg tag282Trp Val Gln Lys Tyr Val Ser Asp Leu Glu Leu Ser Ala85 90<210>18<211>93<212>PRT<213>人工序列<223>人工序列的描述人MIP1α-43CpG(具有43个CpG的人MIP1α基因)
<400>18Met Gln Val Ser Thr Ala Ala Leu Ala Val Leu Leu Cys Thr Met Ala1 5 10 15Leu Cys Asn Gln Val Leu Ser Ala Pro Leu Ala Ala Asp Thr Pro Thr20 25 30Ala Cys Cys Phe Ser Tyr Thr Ser Arg Gln Ile Pro Gln Asn Phe Ile35 40 45Ala Asp Tyr Phe Glu Thr Ser Ser Gln Cys Ser Lys Pro Ser Val Ile50 55 60Phe Leu Thr Lys Arg Gly Arg Gln Val Cys Ala Asp Pro Ser Glu Glu65 70 75 80Trp Val Gln Lys Tyr Val Ser Asp Leu Glu Leu Ser Ala85 90<210>19<211>435<212>DNA<213>人工序列<220>
<223>人工序列的描述合成基因<220>
<223>人es GM-CSF-63CpG<220>
<221>CDS<222>(1)..(435)<400>19atg tgg ctg cag tcg ctg ctg ctg ctc gga acc gtc gcg tgt tcg atc48Met Trp Leu Gln Ser Leu Leu Leu Leu Gly Thr Val Ala Cys Ser Ile1 5 10 15agc gcg cct gcg cgg tcg ccg tcg ccg tcg acg cag ccg tgg gag cac96
Ser Ala Pro Ala Arg Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His20 25 30gtg aac gcg atc cag gag gcg cga cgg ctg ctg aac ctg tcg cgc gat144Val Asn Ala Ile Gln Glu Ala Arg Arg Leu Leu Asn Leu Ser Arg Asp35 40 45aca gcc gcc gag atg aac gag acc gtc gag gtg atc agc gag atg ttc192Thr Ala Ala Glu Met Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe50 55 60gac ctg cag gag ccg acg tgc ctg cag acg cgg ctc gaa ctg tat aag240Asp Leu Gln Glu Pro Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys65 70 75 80cag ggc ctc cgc ggc tcg ctc acg aag ctg aag ggc ccg ctc acg atg288Gln Gly Leu Arg Gly Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met85 90 95atg gcg tcg cac tac aag cag cac tgc ccg ccg acg ccc gaa acg tcg336Met Ala Ser His Tyr Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser100 105 110tgc gcg acg cag atc atc acg ttc gag tcg ttc aag gag aac ctg aag384Cys Ala Thr Gln Ile Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys115 120 125gac ttc ctg ctc gtg atc ccg ttc gat tgc tgg gag ccc gtg cag gag432Asp Phe Leu Leu Val Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu130 135 140tag435
145<210>20<211>144<212>PRT<213>人工序列<223>人GM-CSF-63CpG<400>20Met Trp Leu Gln Ser Leu Leu Leu Leu Gly Thr Val Ala Cys Ser Ile
1 5 10 15Ser Ala Pro Ala Arg Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His20 25 30Val Asn Ala Ile Gln Glu Ala Arg Arg Leu Leu Asn Leu Ser Arg Asp35 40 45Thr Ala Ala Glu Met Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe50 55 60Asp Leu Gln Glu Pro Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys65 70 75 80Gln Gly Leu Arg Gly Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met85 90 95Met Ala Ser His Tyr Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser100 105 110Cys Ala Thr Gln Ile Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys115 120 125Asp Phe Leu Leu Val Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu130 135 140<210>21<211>282<212>DNA<213>人<220>
<223>人MIP1α基因野生型(8CpG)<220>
<221>CDS<222>(1)..(282)<400>21atg cag gtc tcc act gct gcc ctt gcc gtc ctc ctc tgc acc atg gct48Met Gln Val Ser Thr Ala Ala Leu Ala Val Leu Leu Cys Thr Met Ala1 5 10 15
ctc tgc aac cag gtc ctc tct gca cca ctt gct gct gac acg ccg acc96Leu Cys Asn Gln Val Leu Ser Ala Pro Leu Ala Ala Asp Thr Pro Thr20 25 30gcc tgc tgc ttc agc tac acc tcc cga cag att cca cag aat ttc ata144Ala Cys Cys Phe Ser Tyr Thr Ser Arg Gln Ile Pro Gln Asn Phe Ile35 40 45gct gac tac ttt gag acg agc agc cag tgc tcc aag ccc agt gtc atc192Ala Asp Tyr Phe Glu Thr Ser Ser Gln Cys Ser Lys Pro Ser Val Ile50 55 60ttc cta acc aag aga ggc cgg cag gtc tgt gct gac ccc agt gag gag240Phe Leu Thr Lys Arg Gly Arg Gln Val Cys Ala Asp Pro Ser Glu Glu65 70 75 80tgg gtc cag aaa tac gtc agt gac ctg gag ctg agt gcc tag282Trp Val Gln Lys Tyr Val Ser Asp Leu Glu Leu Ser Ala85 90<210>22<211>93<212>PRT<213>人<223>人MIP1α基因野生型(8CpG)<400>22Met Gln Val Ser Thr Ala Ala Leu Ala Val Leu Leu Cys Thr Met Ala1 5 10 15Leu Cys Asn Gln Val Leu Ser Ala Pro Leu Ala Ala Asp Thr Pro Thr20 25 30Ala Cys Cys Phe Ser Tyr Thr Ser Arg Gln Ile Pro Gln Asn Phe Ile35 40 45Ala Asp Tyr Phe Glu Thr Ser Ser Gln Cys Ser Lys Pro Ser Val Ile50 55 60Phe Leu Thr Lys Arg Gly Arg Gln Val Cys Ala Asp Pro Ser Glu Glu65 70 75 80
Trp Val Gln Lys Tyr Val Ser Asp Leu Glu Leu Ser Ala85 90<210>23<211>435<212>DNA<213>人<220>
<223>人GM-CSF基因野生型(10CpG)<220>
<221>CDS<222>(1)..(435)<400>23atg tgg ctg cag agc ctg ctg ctc ttg ggc act gtg gcc tgc agc atc48Met Trp Leu Gln Ser Leu Leu Leu Leu Gly Thr Val Ala Cys Ser Ile1 5 10 15tct gca ccc gcc cgc tcg ccc agc ccc agc acg cag ccc tgg gag cat96Ser Ala Pro Ala Arg Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His20 25 30gtg aat gcc atc cag gag gcc cgg cgt ctc ctg aac ctg agt aga gac144Val Asn Ala Ile Gln Glu Ala Arg Arg Leu Leu Asn Leu Ser Arg Asp35 40 45act gct gct gag atg aat gaa aca gta gaa gtc atc tca gaa atg ttt192Thr Ala Ala Glu Met Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe50 55 60gac ctc cag gag ccg acc tgc cta cag acc cgc ctg gag ctg tac aag240Asp Leu Gln Glu Pro Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys65 70 75 80cag ggc ctg cgg ggc agc ctc acc aag ctc aag ggc ccc ttg acc atg288Gln Gly Leu Arg Gly Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met85 90 95atg gcc agc cac tac aag cag cac tgc cct cca acc ccg gaa act tcc336Met Ala Ser His Tyr Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser
100 105 110tgt gca acc cag att atc acc ttt gaa agt ttc aaa gag aac ctg aag384Cys Ala Thr Gln Ile Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys115 120 125gac ttt ctg ctt gtc atc ccc ttt gac tgc tgg gag cca gtc cag gag432Asp Phe Leu Leu Val Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu130 135 140tag435
145<210>24<211>144<212>PRT<213>人<223>人GM-CSF基因野生型(10CpG)<400>24Met Trp Leu Gln Ser Leu Leu Leu Leu Gly Thr Val Ala Cys Ser Ile1 5 10 15Ser Ala Pro Ala Arg Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His20 25 30Val Asn Ala Ile Gln Glu Ala Arg Arg Leu Leu Asn Leu Ser Arg Asp35 40 45Thr Ala Ala Glu Met Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe50 55 60Asp Leu Gln Glu Pro Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys65 70 75 80Gln Gly Leu Arg Gly Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met85 90 95Met Ala Ser His Tyr Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser100 105 110Cys Ala Thr Gln Ile Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys
115 120 125Asp Phe Leu Leu Val Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu130 135 140<210>25<211>3034<212>DNA<213>人工序列<220>
<223>人工序列的描述p smallsyn载体<400>25atcgatgttg acattgatta ttgactagtt attaatagta atcaattacg gggtcattag 60ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 120gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 180caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 240cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 300ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 360tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 420gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 480gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 540tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctctggc 600taactagaga acccactgct tactggctta tctaaattaa tacgactcac tatagggaga 660cccaagctgt taagcttggt agatatcagg gatccactca gctgatcagc ctccagttta 720aacctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 780ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 840gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 900attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggcc cgggtagtga 960attcatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 1020gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 1080gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 1140gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 1200aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 1260ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 1320taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 1380tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 1440gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt 1500taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 1560tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 1620tttgatcttt tctacgggag atctgtctga ctctcagtgg aaccaaaact catgttaagg 1680
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 1740aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacaggt taacttacca 1800atgcttaatc aatgaggcac caatctctgc aatctgccta tttctctcat ccatggttgc 1860ctgactgcct gtggtgtaga taactacaat cctggagggc ttaccatctg gccccagtgc 1920tgcaatgata cctctagacc ctctctcacc tgctccagat ttatctgcaa tgaaccagcc 1980agctggaagg gcagacctca gaagtggtcc tgcaacttta tctgcctcca tccagtctat 2040taattgttgt ctggaagcta gagtaagcag ttcaccagtt aatagtttcc tcaaggttgt 2100tgccattgct acaggcatgg tggtgtccct ctcatcattt ggtatggctt cattcagctc 2160tggttcccat ctatcaagcc tagttacatg atcacccatg ttgtgcaaaa aagcagtcaa 2220ctcctttggt cctccaatgg ttgtcaaaag taagttggca gcagtgttat cactcatggt 2280tatggcagca ctgcataatt ctcttactgt catgccatct gtaagatgct tttctgtgac 2340tggactgtac tcaaccaagt cattctgaga atagtgtatt cttctaccca gttgctcttg 2400cccagcatca attctggata atactgcacc acatagcaga actttaaagg tgctcatcat 2460tggaaatctt tcttctggtc taaaactctc aaggatctta ccagagttga gatccagttc 2520aatgtaaccc actcttgcac ccaactgatc ttcagcatct tttactttca ccagggtttc 2580tgggtgagca aaaacaggaa ggcaaaaggc agcaaaaaag ggaataaggg caactctgaa 2640atgttgaata ctcatagtac tactcttcct ttttcaatat tattgaagca tttatcaggg 2700ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 2760atgcattcag ctcacatttc cctgaaaagt gccacctgaa attgactgat agggagttct 2820cccaatcccc tatggtgcac tctcagtaca atctgctctg atgcctcata gttaagccag 2880tatctgctcc ctgcttgtgt gttggaggtc actgagtagt gggctagcaa aatttaagct 2940acaacaaggc aaggcttgac ctacaattgc atgaagaatc tgcttagggt taggcctttt 3000gcactgcttg gagatgtact ggccagatat acta 3034<210>26<211>669<212>DNA<213>人工序列<220>
<223>人工序列的描述p24ΔCpG基因(不含CpG二核苷酸的HIV-1质粒p24(衣壳蛋白)基因)<220>
<221>CDS<222>(1)..(696)<400>26atg gtg cac cag gcc atc agc ccc agg acc ctg aat gcc tgg gtg aag48Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys1 5 10 15gtg gtg gag gag aag gcc ttc agc cct gag gtg atc ccc atg ttc tct96
Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser20 25 30gcc ctg tct gag ggg gcc acc ccc cag gac ctg aac acc atg ctg aac144Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn35 40 45aca gtg ggg ggc cac cag gct gcc atg cag atg ctg aag gaa acc atc192Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile50 55 60aat gag gag gct gct gag tgg gac aga gtg cac cct gtg cat gct ggc240Asn Glu Glu Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala Gly65 70 75 80ccc att gcc cct ggc cag atg agg gag ccc agg ggc tct gac att gct288Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala85 90 95ggc acc acc tcc acc ctg cag gag cag att ggc tgg atg acc aac aac336Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn100 105 110ccc ccc atc cct gtg ggg gag atc tac aag aga tgg atc atc ctg ggc384Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly115 120 125ctg aac aag att gtg agg atg tac agc ccc acc tcc atc ctg gac atc432Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile130 135 140agg cag ggc ccc aag gag ccc ttc agg gac tat gtg gac agg ttc tac480Arg Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr145 150 155 160aag acc ctg agg gct gag cag gcc agc cag gag gtg aag aac tgg atg528Lys Thr Leu Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met165 170 175aca gag acc ctg ctg gtg cag aat gcc aac cct gac tgc aag acc atc576Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile180 185 190ctg aag gcc ctg ggc cca gct gcc acc ctg gag gag atg atg aca gcc624
Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala195 200 205tgc cag ggg gtg gga ggc cct ggc cac aag gcc agg gtg ctg taa669Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala Arg Val Leu210 215 220<210>27<211>222<212>PRT<213>人工序列<223>人工序列的描述p24ΔCpG基因(不含CpG二核苷酸的HIV-1质粒p24(衣壳蛋白)基因)<400>27Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys1 5 10 15Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser20 25 30Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn35 40 45Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile50 55 60Asn Glu Glu Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala Gly65 70 75 80Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala85 90 95Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn100 105 110Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly115 120 125Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile130 135 140Arg Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr
145 150 155 160Lys Thr Leu Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met165 170 175Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile180 185 190Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala195 200 205Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala Arg Val Leu210 215 220<210>28<211>34<212>DNA<213>人工序列<220>
<223>人工序列的描述引物huGFP-1<400>28caataagctt gccaccatgg tgagcaaggg cgag 34<210>29<211>29<212>DNA<213>人工序列<220>
<223>人工序列的描述引物huGFP-2<400>29agtaggatcc tattacttgt acagctcgt29<210>30<211>20<212>DNA<213>人工序列
<220>
<223>人工序列的描述引物RT-oligo1<400>30ccctgaagtt catctgcacc 20<210>31<211>22<212>DNA<213>人工序列<220>
<223>人工序列的描述引物oligo2<400>31gatcttgaag ttcaccttga tg 22<210>32<211>34<212>DNA<213>人工序列<220>
<223>人工序列的描述引物mamip-1<400>32caggtaccaa gcttatgaag gtctccacca ctgc 34<210>33<211>43<212>DNA<213>人工序列<220>
<223>人工序列的描述引物mamip-2<400>33cagagctcga gtcatgaaga ctaggcattc agttccaggt cag43
<210>34<211>33<212>DNA<213>人工序列<220>
<223>人工序列的描述引物hugm-1<400>34caggtaccaa gcttatgtgg ctgcagagcc tgc 33<210>35<211>43<212>DNA<213>人工序列<220>
<223>人工序列的描述引物hugm-2<400>35cagagctcga gtcatgaaga ctactcctgg actggctccc agc43<210>36<211>33<212>DNA<213>人工序列<220>
<223>人工序列的描述引物humip-1<400>36cagtaccaag cttatgcagg tctccactgc tgc 33<210>37<211>45<212>DNA<213>人工序列<220>
<223>人工序列的描述引物humip-2
<400>37cagagctcga gtcatgaaga ctaggcactc agctccaggt cactg 45<210>38<211>43<212>DNA<213>人工序列<220>
<223>人工序列的描述引物p24-1<400>38actaggtacc atctaagctt atgcccatcg tgcagaacat cca43<210>39<211>45<212>DNA<213>人工序列<220>
<223>人工序列的描述引物p24-2<400>39tcaagagctc gactggatcc tattacagca ccctggcctt gtggc 45<210>40<211>41<212>DNA<213>人工序列<220>
<223>人工序列的描述引物CMV-1<400>40caaaggtacc gttaatcgat gttgacattg attattgact a 41<210>41<211>24<212>DNA<213>人工序列
<220>
<223>人工序列的描述引物CMV-2<400>41gaatgagctc tgcttatata gacc 24<210>42<211>35<212>DNA<213>人工序列<220>
<223>人工序列的描述引物ori-1<400>42gtcacccggg tagtgaattc atgtgagcaa aaggc 35<210>43<211>35<212>DNA<213>人工序列<220>
<223>人工序列的描述引物ori-2<400>43gatcttttct acgggagatc tgtcaatcga tagct 35<210>44<211>42<212>DNA<213>人工序列<220>
<223>人工序列的描述引物pa-1<400>44gttagagctc cagtgtttaa acctgtgcct tctagttgcc ag 42
<210>45<211>39<212>DNA<213>人工序列<220>
<223>人工序列的描述引物pa-2<400>45caaacctacc gatacccggg ccatagagcc caccgcatc 39<210>46<211>42<212>DNA<213>人工序列<220>
<223>人工序列的描述引物ref-del-1<400>46tcagatgcat ccgtacgtta acatgtgagc aaaaggccag ca 42<210>47<211>33<212>DNA<213>人工序列<220>
<223>人工序列的描述引物ref-del-2<400>47agtcatgcat ccatagagcc caccgcatcc cca 33<210>48<211>33<212>DNA<213>人工序列<220>
<223>人工序列的描述引物5`-3
<220>
<223>huil-1<400>48caggtaccaa gcttatgaga atttcgaaac cac 33<210>49<211>45<212>DNA<213>人工序列<220>
<223>人工序列的描述引物5`-3<220>
<223>huil-2<400>49cagagctcga gtcatgaaga ctaagaagtg ttgatgaaca tttgg 45<210>50<211>34<212>DNA<213>人工序列<220>
<223>人工序列的描述引物5`-3<220>
<223>magm-1<400>50caggtaccaa gcttatggcc cacgagagaa aggc 34<210>51<211>43<212>DNA<213>人工序列<220>
<223>人工序列的描述引物5`-3
<220>
<223>magm-2<400>51cagagctcga gtcatgaaga ctatttttgg cctggttttt tgc43<210>52<211>489<212>DNA<213>人工序列<220>
<223>人工序列的描述合成基因<220>
<223>人IL-15-21CpG<220>
<221>CDS<222>(1)..(489)<400>52atg cgg atc agc aag ccc cac ctg agg agc atc agc atc cag tgc tac48Met Arg Ile Ser Lys Pro His Leu Arg Ser Ile Ser Ile Gln Cys Tyr1 5 10 15ctg tgc ctg ctg ctg aac agc cac ttc ctg aca gag gcc ggc atc cac96Leu Cys Leu Leu Leu Asn Ser His Phe Leu Thr Glu Ala Gly Ile His20 25 30gtg ttt atc ctg ggc tgc ttc tct gcc ggc ctg cct aag aca gag gcc144Val Phe Ile Leu Gly Cys Phe Ser Ala Gly Leu Pro Lys Thr Glu Ala35 40 45aac tgg gtg aac gtg atc agc gac ctg aag aag atc gag gac ctg atc192Asn Trp Val Asn Val Ile Ser Asp Leu Lys Lys Ile Glu Asp Leu Ile50 55 60cag agc atg cac atc gac gcc acc ctg tac aca gag agc gac gtg cac240Gln Ser Met His Ile Asp Ala Thr Leu Tyr Thr Glu Ser Asp Val His65 70 75 80
cct agc tgt aag gtg acc gcc atg aag tgc ttc ctg ctg gag ctg cag288Pro Ser Cys Lys Val Thr Ala Met Lys Cys Phe Leu Leu Glu Leu Gln85 90 95gtg atc agc ctg gag agc ggc gat gcc agc atc cac gac acc gtg gag336Val Ile Ser Leu Glu Ser Gly Asp Ala Ser Ile His Asp Thr Val Glu100 105 110aac ctg atc atc ctg gcc aac aac agc ctg agc agc aac ggc aat gtg384Asn Leu Ile Ile Leu Ala Asn Asn Ser Leu Ser Ser Asn Gly Asn Val115 120 125acc gag agc ggc tgc aag gag tgt gag gag ctg gag gag aag aac atc432Thr Glu Ser Gly Cys Lys Glu Cys Glu Glu Leu Glu Glu Lys Asn Ile130 135 140aag gag ttc ctg cag agc ttc gtg cac atc gtg cag atg ttc atc aac480Lys Glu Phe Leu Gln Ser Phe Val His Ile Val Gln Met Phe Ile Asn145 150 155 160acc agc tag489Thr Ser<210>53<211>162<212>PRT<213>人工序列<223>人IL-15-21CpG<400>53Met Arg Ile Ser Lys Pro His Leu Arg Ser Ile Ser Ile Gln Cys Tyr1 5 10 15Leu Cys Leu Leu Leu Asn Ser His Phe Leu Thr Glu Ala Gly Ile His20 25 30Val Phe Ile Leu Gly Cys Phe Ser Ala Gly Leu Pro Lys Thr Glu Ala35 40 45Asn Trp Val Asn Val Ile Ser Asp Leu Lys Lys Ile Glu Asp Leu Ile50 55 60Gln Ser Met His Ile Asp Ala Thr Leu Tyr Thr Glu Ser Asp Val His
65 70 75 80Pro Ser Cys Lys Val Thr Ala Met Lys Cys Phe Leu Leu Glu Leu Gln85 90 95Val Ile Ser Leu Glu Ser Gly Asp Ala Ser Ile His Asp Thr Val Glu100 105 110Asn Leu Ile Ile Leu Ala Asn Asn Ser Leu Ser Ser Asn Gly Asn Val115 120 125Thr Glu Ser Gly Cys Lys Glu Cys Glu Glu Leu Glu Glu Lys Asn Ile130 135 140Lys Glu Phe Leu Gln Ser Phe Val His Ile Val Gln Met Phe Ile Asn145 150 155 160Thr Ser<210>54<211>426<212>DNA<213>人工序列<220>
<223>人工序列的描述合成基因<220>
<223>鼠GM-CSF-62CpG<220>
<221>CDS<222>(1)..(426)<400>54atg tgg ctg cag aac ctg ctg ttc ctc ggc atc gtc gtg tac tcg ctg48Met Trp Leu Gln Asn Leu Leu Phe Leu Gly Ile Val Val Tyr Ser Leu1 5 10 15agc gcg ccg acg cgc tcg ccg atc acc gtg acg cgg ccg tgg aag cac96Ser Ala Pro Thr Arg Ser Pro Ile Thr Val Thr Arg Pro Trp Lys His20 25 30
gtc gag gcg atc aag gag gcg ctg aac ctg ctc gac gac atg ccc gtg144Val Glu Ala Ile Lys Glu Ala Leu Asn Leu Leu Asp Asp Met Pro Val35 40 45acg ctg aac gag gag gtc gag gtc gtg tcg aac gag ttc tcg ttc aag192Thr Leu Asn Glu Glu Val Glu Val Val Ser Asn Glu Phe Ser Phe Lys50 55 60aag ctg acg tgc gtg cag acg cgg ctg aag atc ttc gag cag ggc ctg240Lys Leu Thr Cys Val Gln Thr Arg Leu Lys Ile Phe Glu Gln Gly Leu65 70 75 80cgc ggc aac ttc acg aag ctg aag ggc gcg ctg aac atg acc gcg tcg288Arg Gly Asn Phe Thr Lys Leu Lys Gly Ala Leu Asn Met Thr Ala Ser85 90 95tac tac cag acg tac tgc ccg ccg acg ccc gag acc gat tgc gag acg336Tyr Tyr Gln Thr Tyr Cys Pro Pro Thr Pro Glu Thr Asp Cys Glu Thr100 105 110cag gtg acg acg tac gcc gac ttc atc gac tcg ctg aag acg ttc ctg384Gln Val Thr Thr Tyr Ala Asp Phe Ile Asp Ser Leu Lys Thr Phe Leu115 120 125acc gac atc ccg ttc gag tgc aag aag ccc ggc cag aag tag426Thr Asp Ile Pro Phe Glu Cys Lys Lys Pro Gly Gln Lys130 135 140<210>55<211>141<212>PRT<213>人工序列<223>鼠GM-CSF-62CpG<400>55Met Trp Leu Gln Asn Leu Leu Phe Leu Gly Ile Val Val Tyr Ser Leu1 5 10 15Ser Ala Pro Thr Arg Ser Pro Ile Thr Val Thr Arg Pro Trp Lys His20 25 30Val Glu Ala Ile Lys Glu Ala Leu Asn Leu Leu Asp Asp Met Pro Val
35 40 45Thr Leu Asn Glu Glu Val Glu Val Val Ser Asn Glu Phe Ser Phe Lys50 55 60Lys Leu Thr Cys Val Gln Thr Arg Leu Lys Ile Phe Glu Gln Gly Leu65 70 75 80Arg Gly Asn Phe Thr Lys Leu Lys Gly Ala Leu Asn Met Thr Ala Ser85 90 95Tyr Tyr Gln Thr Tyr Cys Pro Pro Thr Pro Glu Thr Asp Cys Glu Thr100 105 110Gln Val Thr Thr Tyr Ala Asp Phe Ile Asp Ser Leu Lys Thr Phe Leu115 120 125Thr Asp Ile Pro Phe Glu Cys Lys Lys Pro Gly Gln Lys130 135 140<210>56<211>489<212>DNA<213>人<220>
<223>人IL-15-野生型(3CpG)<220>
<221>CDS<222>(1)..(489)<400>56atg aga att tcg aaa cca cat ttg aga agt att tcc atc cag tgc tac48Met Arg Ile Ser Lys Pro His Leu Arg Ser Ile Ser Ile Gln Cys Tyr1 5 10 15ttg tgt tta ctt cta aac agt cat ttt cta act gaa gct ggc att cat96Leu Cys Leu Leu Leu Asn Ser His Phe Leu Thr Glu Ala Gly Ile His20 25 30gtc ttc att ttg ggc tgt ttc agt gca ggg ctt cct aaa aca gaa gcc144
Val Phe Ile Leu Gly Cys Phe Ser Ala Gly Leu Pro Lys Thr Glu Ala35 40 45aac tgg gtg aat gta ata agt gat ttg aaa aaa att gaa gat ctt att192Asn Trp Val Asn Val Ile Ser Asp Leu Lys Lys Ile Glu Asp Leu Ile50 55 60caa tct atg cat att gat gct act tta tat acg gaa agt gat gtt cac240Gln Ser Met His Ile Asp Ala Thr Leu Tyr Thr Glu Ser Asp Val His65 70 75 80ccc agt tgc aaa gta aca gca atg aag tgc ttt ctc ttg gag tta caa288Pro Ser Cys Lys Val Thr Ala Met Lys Cys Phe Leu Leu Glu Leu Gln85 90 95gtt att tca ctt gag tcc gga gat gca agt att cat gat aca gta gaa336Val Ile Ser Leu Glu Ser Gly Asp Ala Ser Ile His Asp Thr Val Glu100 105 110aat ctg atc atc cta gca aac aac agt ttg tct tct aat ggg aat gta384Asn Leu Ile Ile Leu Ala Asn Asn Ser Leu Ser Ser Asn Gly Asn Val115 120 125aca gaa tct gga tgc aaa gaa tgt gag gaa ctg gag gaa aaa aat att432Thr Glu Ser Gly Cys Lys Glu Cys Glu Glu Leu Glu Glu Lys Asn Ile130 135 140aaa gaa ttt ttg cag agt ttt gta cat att gtc caa atg ttc atc aac480Lys Glu Phe Leu Gln Ser Phe Val His Ile Val Gln Met Phe Ile Asn145 150 155 160act tct tag489Thr Ser<210>57<211>162<212>PRT<213>人<223>人IL-15-野生型(3CpG)<400>57Met Arg Ile Ser Lys Pro His Leu Arg Ser Ile Ser Ile Gln Cys Tyr1 5 10 15
Leu Cys Leu Leu Leu Asn Ser His Phe Leu Thr Glu Ala Gly Ile His20 25 30Val Phe Ile Leu Gly Cys Phe Ser Ala Gly Leu Pro Lys Thr Glu Ala35 40 45Asn Trp Val Asn Val Ile Ser Asp Leu Lys Lys Ile Glu Asp Leu Ile50 55 60Gln Ser Met His Ile Asp Ala Thr Leu Tyr Thr Glu Ser Asp Val His65 70 75 80Pro Ser Cys Lys Val Thr Ala Met Lys Cys Phe Leu Leu Glu Leu Gln85 90 95Val Ile Ser Leu Glu Ser Gly Asp Ala Ser Ile His Asp Thr Val Glu100 105 110Asn Leu Ile Ile Leu Ala Asn Asn Ser Leu Ser Ser Asn Gly Asn Val115 120 125Thr Glu Ser Gly Cys Lys Glu Cys Glu Glu Leu Glu Glu Lys Asn Ile130 135 140Lys Glu Phe Leu Gln Ser Phe Val His Ile Val Gln Met Phe Ile Asn145 150 155 160Thr Ser<210>58<211>426<212>DNA<213>鼠<220>
<223>鼠GM-CSF-野生型(11 CpG)<220>
<221>CDS<222>(1)..(426)
<400>58atg tgg ctg cag aat tta ctt ttc ctg ggc att gtg gtc tac agc ctc48Met Trp Leu Gln Asn Leu Leu Phe Leu Gly Ile Val Val Tyr Ser Leu1 5 10 15tca gca ccc acc cgc tca ccc atc act gtc acc cgg cct tgg aag cat96Ser Ala Pro Thr Arg Ser Pro Ile Thr Val Thr Arg Pro Trp Lys His20 25 30gta gag gcc atc aaa gaa gcc ctg aac ctc ctg gat gac atg cct gtc144Val Glu Ala Ile Lys Glu Ala Leu Asn Leu Leu Asp Asp Met Pro Val35 40 45aca ttg aat gaa gag gta gaa gtc gtc tct aac gag ttc tcc ttc aag192Thr Leu Asn Glu Glu Val Glu Val Val Ser Asn Glu Phe Ser Phe Lys50 55 60aag cta aca tgt gtg cag acc cgc ctg aag ata ttc gag cag ggt cta240Lys Leu Thr Cys Val Gln Thr Arg Leu Lys Ile Phe Glu Gln Gly Leu65 70 75 80cgg ggc aat ttc acc aaa ctc aag ggc gcc ttg aac atg aca gcc agc288Arg Gly Asn Phe Thr Lys Leu Lys Gly Ala Leu Asn Met Thr Ala Ser85 90 95tac tac cag aca tac tgc ccc cca act ccg gaa acg gac tgt gaa aca336Tyr Tyr Gln Thr Tyr Cys Pro Pro Thr Pro Glu Thr Asp Cys Glu Thr100 105 110caa gtt acc acc tat gcg gat ttc ata gac agc ctt aaa acc ttt ctg384Gln Val Thr Thr Tyr Ala Asp Phe Ile Asp Ser Leu Lys Thr Phe Leu115 120 125act gat atc ccc ttt gaa tgc aaa aaa cca ggc caa aaa tag426Thr Asp Ile Pro Phe Glu Cys Lys Lys Pro Gly Gln Lys130 135 140<210>59<211>141<212>PRT<213>鼠<223>鼠GM-CSF-野生型(11CpG)
<400>59Met Trp Leu Gln Asn Leu Leu Phe Leu Gly Ile Val Val Tyr Ser Leu1 5 10 15Ser Ala Pro Thr Arg Ser Pro Ile Thr Val Thr Arg Pro Trp Lys His20 25 30Val Glu Ala Ile Lys Glu Ala Leu Asn Leu Leu Asp Asp Met Pro Val35 40 45Thr Leu Asn Glu Glu Val Glu Val Val Ser Asn Glu Phe Ser Phe Lys50 55 60Lys Leu Thr Cys Val Gln Thr Arg Leu Lys Ile Phe Glu Gln Gly Leu65 70 75 80Arg Gly Asn Phe Thr Lys Leu Lys Gly Ala Leu Asn Met Thr Ala Ser85 90 95Tyr Tyr Gln Thr Tyr Cys Pro Pro Thr Pro Glu Thr Asp Cys Glu Thr100 105 110Gln Val Thr Thr Tyr Ala Asp Phe Ile Asp Ser Leu Lys Thr Phe Leu115 120 125Thr Asp Ile Pro Phe Glu Cys Lys Lys Pro Gly Gln Lys130 135 140
权利要求
1.靶向调节基因表达的方法,其包括(i)提供待表达的靶核酸序列,(ii)修饰所述靶核酸序列,其中利用遗传密码简并性来增加所述靶核酸序列中存在的CpG二核苷酸数目以增加基因表达,或减少CpG二核苷酸数目以减少基因表达,(iii)将如此修饰的、含修饰数目的CpG二核苷酸的所述靶核酸序列以与合适的转录控制序列有效连接的方式克隆到合适的表达载体中,(iv)在合适的表达系统中表达所述经修饰的靶核酸序列。
2.根据权利要求1的方法,其中在步骤(ii)中进行所述靶核酸序列的修饰,从而使得除了增加或减少所述CpG二核苷酸数目外,还在核酸水平上进行一种或多种另外的修饰。
3.根据权利要求2的方法,其中所述核酸水平上的另外修饰选自改变密码子选择,插入或消除稳定RNA二级结构的序列、自身同源性增加的区域、与天然基因的同源性增加的区域、RNA不稳定性基序、剪接激活基序、多腺苷酸化基序、富含腺嘌呤的基序、核酸内切酶识别位点。
4.根据前述权利要求中任何一项的方法,其中在考虑对于所述表达系统来说优化的密码子选择的情况下,通过增加或减少CpG二核苷酸的数目来进行所述的靶核酸序列修饰。
5.根据前述权利要求中任何一项的方法,其中在考虑对于哺乳动物来说优化的密码子选择的情况下,进行所述CpG二核苷酸数目的修饰。
6.根据权利要求1-5中任何一项的方法,其中所述基因表达是增加的。
7.根据权利要求1-5中任何一项的方法,其中所述基因表达是减少的。
8.根据前述权利要求中任何一项的方法,其中所述待表达的靶核酸序列与所述表达系统是异源的。
9.根据前述权利要求中任何一项的方法,其中使用真核或原核表达系统作为表达系统。
10.根据前述权利要求中任何一项的方法,其中使用细胞或无细胞的表达环境作为表达系统,所述细胞选自原核细胞和真核细胞,选自细菌、酵母、单细胞、寄生虫细胞、植物细胞、昆虫细胞、哺乳动物细胞、人类细胞和体细胞。
11.根据前述权利要求中任何一项的方法,其中所述待表达的靶核酸序列具有真核、原核、病毒或合成的来源。
12.根据前述权利要求中任何一项的方法,其中使用低甲基化系统作为表达系统。
13.根据前述权利要求中任何一项的方法,其中所述经修饰的靶核酸序列和所述转录控制序列与CpG岛无关。
14.根据前述权利要求中任何一项的方法,其中所述CpG二核苷酸的数目增加或减少至少2个。
15.根据前述权利要求中任何一项的方法,其中所述CpG二核苷酸的数目增加或减少至少10%、优选至少50%、更优选至少100%。
16.根据前述权利要求中任何一项的方法,其中利用遗传密码简并性来去除所有的CpG二核苷酸。
17.根据前述权利要求中任何一项的方法,其中所述靶核酸序列编码RNA、其衍生物或模拟物,肽或多肽,经修饰的肽或多肽,蛋白质或经修饰的蛋白质。
18.根据权利要求17的方法,其中所述靶核酸序列编码治疗性和/或诊断性的蛋白质。
19.根据权利要求18的方法,其中所述靶核酸序列编码的蛋白质选自人、寄生虫、病毒或细菌的蛋白质、酶、激素、疫苗、信使物质和调节蛋白。
20.根据权利要求18或19的方法,其中所述靶核酸序列编码的蛋白质选自天冬酰胺酶,腺苷脱氨酶,胰岛素,tPA,凝血因子,维生素L-环氧化物还原酶,促红细胞生成素,促卵泡激素,雌激素,骨形成蛋白,抗凝血酶,从HIV、HBV、HCV、流感、疏螺旋体、嗜血杆菌、脑膜炎球菌、炭疽来源的蛋白质,肉毒杆菌毒素,白喉毒素,破伤风毒素,疟原虫蛋白,血型抗原,HLA蛋白,细胞因子,趋化因子,G-CSF,GM-CSF,白细胞介素,干扰素,PDGF,TNF,RANTES,MIP1α和转录因子。
21.根据权利要求17的方法,其中所述靶核酸序列编码功能性RNA。
22.根据权利要求21的方法,其中所述靶核酸序列是siRNA、核酶、反义RNA或诱饵。
23.含可转录区域的经修饰的核酸,其能够在表达系统中表达并且来源于野生型序列,其中所述可转录区域是如此修饰的,从而使得它相对于所采用的表达系统来说是密码子优化的,并且使得与密码子优化的、来源于野生型序列的序列相比,CpG二核苷酸数目通过使用遗传密码简并性而增加。
24.根据权利要求23的核酸,其中与野生型序列相比,CpG二核苷酸的数目增加至少10%、优选至少25%、更优选至少50%、优选至少100%、优选至少200%、优选5倍、优选10倍或更多。
25.根据前述权利要求23-24中任何一项的核酸,其中所述核酸与CpG岛无关。
26.根据权利要求23-25中任何一项的核酸,其包含选自SEQ IDNO.1、5、7、9、11、13、17、19、26、52和54的序列。
27.包含根据权利要求23-26中任何一项的核酸的载体,所述核酸与合适的转录控制序列有效连接。
28.根据权利要求27的载体,其中所述转录控制序列包括启动子。
29.根据权利要求28的载体,其中所述启动子是以组成型方式起作用的启动子。
30.根据权利要求29的载体,其中所述以组成型方式起作用的启动子选自(巨细胞病毒)CMV启动子和猿猴病毒40(SV40)启动子。
31.根据权利要求28的载体,其中所述启动子是诱导型启动子。
32.根据权利要求31的载体,其中所述诱导型启动子是四环素依赖性启动子。
33.根据权利要求27-32中任何一项的载体,其中所述启动子与CpG岛无关。
34.根据权利要求27-33中任何一项的载体,其中与根据权利要求23-26中任何一项所述的核酸不同的、存在于所述载体上的序列或其部分具有减少的CpG二核苷酸数目。
35.根据权利要求27-34中任何一项的载体,其中与根据权利要求23-26中任何一项所述的核酸不同的序列或其部分的CpG二核苷酸数目减少约25%、优选50%、更优选75%、更加优选100%。
36.根据权利要求27-35中任何一项的载体,其具有SEQ ID NO.25所示核酸序列。
37.细胞,其包含根据权利要求23-36中任何一项的核酸或载体。
38.表达系统,其包括a)与转录控制序列有效连接的含可转录区域的经修饰的核酸序列,其来源于野生型序列,其中所述经修饰的核酸序列与野生型序列相比具有增加或减少的CpG二核苷酸数目,和b)表达环境,选自在其中可以表达(a)的细胞和无细胞的表达环境,其中在表达CpG二核苷酸数目增加的经修饰的核酸序列时,所述表达系统显示出表达增加,和在表达CpG二核苷酸数目减少的经修饰的核酸序列时,所述表达系统显示出表达减少。
39.药物,其包含根据权利要求23-38中任何一项的核酸和/或载体和/或细胞和/或表达系统作为活性物质。
40.根据权利要求23-38中任何一项的核酸和/或载体和/或细胞和/或表达系统在制备用于诊断性和/或治疗性处理的药物中的用途。
41.根据权利要求40的用途,用于基因治疗处理。
42.根据权利要求23-38中任何一项的核酸、载体和/或细胞和/或表达系统用于制备疫苗的用途。
全文摘要
本发明涉及用于通过靶向插入或去除CpG二核苷酸来定向调节表达的核酸修饰。本发明还涉及经修饰的核酸和表达载体。
文档编号C12N15/63GK101035899SQ200580026625
公开日2007年9月12日 申请日期2005年8月3日 优先权日2004年8月3日
发明者F·诺特卡, M·格拉夫, D·莱卡姆, R·瓦戈纳, D·拉布 申请人:基因技术股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1