诱导肿瘤特异性细胞毒性的方法和组合物的制作方法

文档序号:3552289阅读:631来源:国知局
专利名称:诱导肿瘤特异性细胞毒性的方法和组合物的制作方法
1.发明领域本发明属于肿瘤细胞生物学和癌症治疗领域。更具体而言,本发明涉及病毒载体在肿瘤细胞中的选择性特异表达。
2.背景技术2.1 H19基因H19基因是少数已知的人类印记基因之一(Hurst等,1996,自然遗传学12234-237)。在胚胎发生的最早期,H19在2个染色体等位基因上都表达(DeGroof等,1994,滋养层8285-302)。自此不久,出现父系等位基因沉默,而仅母系遗传的等位基因被转录。
H19在胚胎发生期广泛表达,并首先被鉴定为通过反式作用基因座raf在肝中和甲胎蛋白协同调节的基因(Pachnis等,1984,美国国家科学院院报815523-5527)。另外,H19已被许多研究组用目的是分离在组织分化期表达的基因的筛选方法独立克隆。例如,Davis等(1987,细胞51987-1000)在筛选C3H19T1/2细胞的分化过程中早期活性基因时鉴定了H19的小鼠同源物。Pourier等(1991,发育 1131105-1114)发现鼠H19在干细胞分化期间和植入期表达。在人胎盘滋养层细胞分化中也发现了人H19基因的转录(Rachmilewitz等1992,分子生殖发育32196-202)。
尽管H19 RNA的转录在整个胎儿期和胎盘发育期许多不同的胚胎组织中发生,H19表达在出生后下调。然而,已有报道H19转录在鼠成年肌肉和肝中为相对低水平(Brunkow和Tilghman,1991,基因和发育51092-1101)。在癌细胞中H19也在出生后活化。Ariel等人(1997,分子病理学5034-44)表明来源于出生前H19表达的组织的许多肿瘤中H19表达升高。另外,这些作者发现来源于神经组织的肿瘤尤其是星形细胞瘤和成神经节胶质细胞瘤中有H19 RNA,其中这被已知与H19的表达无关。鉴于大量癌细胞表达H19 RNA,这些作者推测H19是一种癌胚RNA并建议研究作为人恶性肿瘤的肿瘤标志的H19。
已经克隆和测序了人和鼠H19基因(Brannan等,1990,分子细胞生物学1028-36)。比较人和小鼠H19基因显示全长77%的核苷酸序列一致性。尽管种间核苷酸同源性的保守性,根据两种基因的开放读框可预测非常低的氨基酸序列一致性(同上)。而且,虽然H19 RNA被RNA聚合酶II转录,然后拼接和聚腺苷化,但似乎它不被翻译。反之,发现H19 RNA和28S细胞质RNA有关,导致人们推测H19 RNA可能作为核糖核苷酸蛋白的RNA组分起作用(同上)。
H19的真正生理作用还没有完全了解。H19能作为一种显性致死基因起作用;H19转基因的高异位表达引起小鼠将要出生前的致死性(Brunkow等,上文)。该致死期恰与H19的表达被抑制的时间相一致。另一个方面,在携带H19敲除等位基因的杂合或纯合的小鼠中,没有观察到缺陷(Leighton等,1995,自然37534-39)。敲除母系遗传的等位基因确实干扰遗传连锁和相反印记IGF-2基因的印记过程;由于增加的出生前IGF-2的表达,得到的小鼠出生时比同窝鼠更大(同上)。因为这2个相反印记基因具有顺式作用的调节序列,Leighton和同事们推测H19可能涉及IGF-2基因的印记。
提出的H19基因产物的另一个功能是肿瘤抑制RNA。Hao等人(1993,自然365764-767)报道用H19表达构建体转染的2种胚胎性肿瘤细胞系,RD和G401,导致在裸鼠中细胞生长阻滞,形态改变和降低致癌性。已注意到上述肿瘤抑制活性与小鼠中观察到的异位表达的致死性(Hao等,同上)以及敲除母系H19等位基因的小鼠增加体积(Leighton等,同上)的结果一致。然而,H19是肿瘤抑制因子的建议存在争议。某些结果被报道不能重复,可能存在另一种与H19紧密连锁的候选肿瘤抑制基因(Areil等,同上)。建议的H19作为肿瘤抑制因子的作用还与以下实验数据相抵触,即H19在广泛种类的肿瘤细胞中活化(如见例如Lustig-Yariv等,1997,癌基因23169-177)。
2.2 条件复制型病毒正常情况下,病毒编码病毒基因组复制、包装和释放(即从感染宿主细胞中产生子代病毒)所需的全部核酸和肽因子。条件复制型病毒是一种仅在特定条件下复制的病毒。
可被制为条件复制的病毒的一个说明性的实例为腺病毒。腺病毒是无包膜的,规则的二十面体。该蛋白外壳(衣壳)由252个壳粒组成,其中240个为六邻体,12个为五邻体。已经使用2和5型腺病毒实施了大多数针对腺病毒多肽的详尽的研究。病毒DNA在2型腺病毒中为23.85×106道尔顿,其大小在不同血清型之间有轻微变化。所述DNA具有末端反向重复,其在各血清型之间具有不同的长度。
复制周期分为早(E)期和晚(L)期。晚期确定病毒DNA复制开始。腺病毒结构蛋白通常在晚期合成。腺病毒感染后,在被大多数血清型感染的细胞中宿主DNA和蛋白的合成受到抑制。2型腺病毒和5型腺病毒的腺病毒裂解周期非常有效,结果导致大约10,000病毒体/每个感染细胞,以及过量病毒蛋白和未整合至病毒体中的DNA。腺病毒早期转录是一系列复杂的相关生物化学事件,但实质上必须有病毒DNA复制开始前的病毒RNA的合成过程。
腺病毒家族中全部成员的腺病毒基因组的结构相似,且对于已研究的每一血清型而言,其特异性功能通常定位于同样的位置。早期胞质信使RNA与四种已确定的,病毒DNA上的非邻接区互补。这些区域命名为E1-E4。早期转录本被分为即早(immediate early)期(ELa),延迟早期(ELb,E2a,E2b,E3和E4)和中期(IVA2.IX)区。
E1a区参与病毒和细胞性基因以及转录性再表达序列的转录性转活(transactivation)。E1a基因具有对全部其它早期腺病毒信使RNA重要的控制功能。在正常组织中,为了有效转录E1b、E2a、E2b、E3、或E4,需要活化的E1a产物。病毒感染后事件的正常进展中需要E1b区。E1b产物在宿主核内发挥作用。E1b序列内出现的突变表现为后期病毒mRNA的积累的降低以及可在腺病毒感染后正常观察到的宿主细胞输送抑制中的损害。E1b是宿主细胞功能改变所需要的,从而加工和传送移向病毒后期基因产物。然后这些产物导致病毒包装和病毒体的释放。E1b生成的19kD蛋白可以阻止细胞调亡。E1b还生成与p53结合的55kD蛋白。
2.3 肿瘤特异的基因治疗来自肿瘤有关的基因的调节序列被用于选择地导向表达在衍生于肿瘤细胞中的自杀基因。例如,在肝细胞癌中诱导甲胎蛋白的表达。Huber等(1991,美国国家科学院院报888039-8043)用来自白蛋白基因或胎儿蛋白基因的控制序列将水痘带状疱疹胸腺嘧啶激酶(VZV TK)基因编码序列在肝癌细胞中导向表达。用含有这些表达构建体之一的逆转录病毒载体感染的肝癌细胞表达VZV TK而变得对正常无毒性的药物原6-甲基嘌呤阿拉伯核苷(araM)敏感。Kaneko等,(1995,癌症研究555283-5287)构建了在甲胎蛋白控调序列控制下表达HSV TK的腺病毒载体。含有该载体的重组腺病毒颗粒被直接注射到在无胸腺裸鼠中产生的衍生于肝细胞癌的肿瘤。接着用更昔洛韦(ganciclovir)腹膜内注射引起衍生于肝细胞癌的肿瘤消退。
Osaki等(1994,癌症研究545258-5261)把一种表达构建体转染到A549肺癌细胞中,该表达构建体含有连接负责简单疱疹病毒胸腺嘧啶激酶(HSV TK)的编码序列的肺癌胚抗原基因的控制序列。所转染的细胞对更昔洛韦敏感。另外,在裸鼠中来自皮下注射转染细胞的肿瘤生长被重复的腹膜内注射更昔洛韦所抑制。不过,最近描述该癌胚抗原基因在正常结肠粘膜中表达,因而限制了这些控制序列作为肿瘤特异调节区的有用性(Osaka等,同上)。
美国专利6,087,164和6,306,833(Hochberg等)公开了一种使用H19启动子来诱导细胞毒性和/或细胞抑制基因产物在癌细胞中的选择性、癌细胞特异性表达。细胞毒性基因产物一般为毒素(如白喉毒素)、细胞凋亡诱导因子、药物代谢酶(如胸苷激酶)、反义、核酶和一直特定基因表达的单链RNA。
Alemany等(2000,自然生物工程学18723-727)的综述文章中讨论了在用于治疗癌症的具有复制能力的病毒工程学上的进步。美国专利5,998,205(Hallenbech等)描述了含有受组织特异性转录调节元件调控的基因(如E1a、E1b、E2和E4)的复制所需基因的条件复制型腺病毒载体。由于对于每一组织需要使用另一启动子,因此腺病毒载体需要针对其将要在其中表达的各自和每一组织进行重新构建。
可以通过很多方法将病毒载体施用于肿瘤。脂质体载体已通过全身给药途径而用于治疗肺癌(Ramesh等,2001,分子治疗3(3)337-350)。含有肿瘤抑制基因的腺病毒载体可通过膀胱内的施用方式用于治疗膀胱癌(Lance C.Pagliaro,2000,World J.Uncol.18148-151)。另一项关于膀胱癌的研究报道了疱疹载体的静脉内施用(OYAMA等,2000,人类基因治疗111683-1693)。在美国基因治疗协会第4次年会上,报道了一些如下成功的实验,如腺病毒经动脉内途径用于结直肠肿瘤(871号摘要),经肌肉内递送途径用于糖尿病患者(205号摘要)以及采用基于IL-2的质粒通过全身给药途径的基因治疗(分子治疗3(5),2001,学术出版社)。
本节或本申请任一节中任何参考文件的引用和标志(identification)均不应理解为承认所属参考文件可用作本发明的现有技术。
3.发明概述本发明提供了条件复制型病毒载体,所述载体能够在癌和/或高增殖性细胞中选择性复制,而基本上不在非癌或高增殖性细胞中复制。所述载体含有操作性与H19转录调节序列,更特别为H19启动子、H19增强子(且启动子或增强子的亚序列(subsequences)仍然具有转录活性)或它们的组合相连的核酸,所述核酸的基因产物为病毒复制所必需。该条件复制型病毒的复制依赖于存在与H19调节序列结合的癌症特异性活化转录调节因子,由此使得编码病毒复制必需基因产物的核酸能在H19表达控制下进行表达。本文使用的病毒复制是指包含病毒基因组的复制、子代病毒颗粒的产生和/或从感染细胞中释放子代病毒颗粒。
由于癌细胞中存在H19活化转录因子,且其基本上不存在于非癌细胞中,编码病毒复制所必需基因产物的核酸在癌细胞中选择性表达,导致病毒选择性复制,由此,选择性抑制增殖或生长,或导致癌细胞裂解。初始时用所述载体转染的癌细胞中释放出来子代能随后感染邻近细胞。在邻近细胞为癌性的且含有H19活化转录因子时,病毒将再次复制,抑制或杀死邻近细胞,并由于肿瘤破坏过程的“旁向(lateral)扩散”而进一步在邻近癌细胞中扩散以及复制。对非病毒初始转染的癌细胞破坏性过程的该旁向扩散导致治疗性过程的收益增加。本发明的载体以及将其用于选择性破坏或抑制癌细胞增殖或生长的方法可用于治疗多种癌症和高增殖性疾病。
用于本发明的H19调节序列包括但不局限于H19启动子和增强子的序列,这些序列的转录活性片段、以及这些序列的组合。参见,例如

图1A-1C、3、4、5A-5B和6A-6C(SEQ ID NOS1-6),其为H19启动子和增强子的序列。H19增强子及其活性部分可与H19启动子或启动子的活性部分任意联合使用。本发明还包括含有所述载体的宿主细胞。本发明的另一个方面是通过施用本发明的载体治疗癌症或高增殖性疾病。
根据本发明,可以使用一种或多种编码病毒复制必需产物的核酸。当使用多于一种必需核酸时,它们的表达可置于单个异源调节序列的控制之下,或分别置于异源调节序列的控制之下。异源调节序列可以是两个相同的H19调节序列,两个不同的H19调节序列或一个H19调节序列和另一个非H19调节序列。所述非H19调节序列可以是组织特异性启动子,或其它癌或肿瘤特异性启动子,如端粒酶启动子。
本发明的一个方面涉及治疗个体中癌症的方法,包括对需要治疗的个体施用条件复制型病毒载体,其中至少一种编码其复制必需产物的病毒核酸操作性连接于H19调节序列。
本发明的另一个方面涉及条件复制型病毒载体,其中至少一种编码其复制必需产物的病毒核酸操作性连接于H19调节序列。
而本发明的另一个方面涉及降低癌细胞生长的方法,包括将细胞与有效量的条件复制型病毒载体接触,其中至少一种编码其复制必需产物的病毒基因操作性连接于H19调节序列。
本发明的另一个方面还涉及条件复制型病毒载体在制备治疗癌症的药物中的用途,所述载体中至少一种编码其复制必需产物的病毒基因操作性连接于H19调节序列。
本发明的另一个方面还涉及治疗癌症的药物组合物,包括药学可接受载体和作为活性成分的条件复制型病毒载体,其中至少一种编码其复制必需产物的病毒基因操作性连接于H19调节序列。
3.1 定义此处使用的“条件复制型病毒或病毒载体”是指仅能在细胞中表达病毒复制必需产物时在细胞中复制的病毒或病毒载体。在一个示例性实施例中,病毒可通过如下方法而制备为条件复制型病毒灭活编码复制必需产物基因的天然转录调节序列。所述灭活可例如,通过用外源调节序列完全置换天然调节序列、通过全部或部分删除天然调节序列,通过其它突变,如碱基置换、插入、反转或缺失,能够使得天然调节序列失去活性的方法得以实施。为重新获得复制能力,将必需基因产物置于异源转录调节序列的表达控制下,从而使病毒根据外源转录调节序列的活性而发生条件性复制。
此处使用的“治疗”并非必须仅指疾病或病情的恢复,还可以指至少症状进展的抑制、患者病情的好转和改善、或疾病或病情的症状的好转。关于治疗癌或高增殖性病情的治疗,症状进展的抑制、患者病情的好转和改善、或疾病或病情的症状的好转可联合或涉及至少下述之一肿瘤大小或体积的减小;肿瘤生长率的降低;肿瘤大小或体积停滞;转移灶或继发肿瘤数量的减少;癌的侵袭性(转移能力)降低;肿瘤从一个阶段进展到下一阶段速率的降低;或由癌症或高增殖性疾病所诱导的血管生成的降低。
此处使用的“降低癌细胞的生长”是指降低至少下述之一与对照相比的癌细胞的数量(由可以是坏死、凋亡或其二者组合的细胞死亡所致的);细胞生长率的降低,例如细胞的全部数量可以增加但以与对照未处理的细胞的增加相比较低的水平或较低的速率增加;与对照相比,细胞对周围环境的侵袭力降低(可通过例如软琼脂法测定)即使其全部数量没有转变;以及未分化癌细胞向更分化的表型的进展。
为了本发明此处描述的目的,术语“操作性连接于”是指核苷酸序列以能受控于调节序列而得以表达的方式连接于调节序列。
此处使用的“基因产物”是指有能够由核酸编码的任何分子,包括但不限于蛋白或其它核酸例如,DNA、RNA、dsRNAi、核酶、DNA酶等。病毒复制必需的基因产物为病毒基因组的天然产物,没有所述产物该病毒无法复制。下文中所述的基因产物将指“必需基因产物”。
此处使用的“表达”是指编码兴趣物的核苷酸序列的转录和相应转录本的剪接、加工、稳定化和可选地,翻译。根据载体的结构表达可以是瞬时的或连续的。
此处使用的“病毒复制”是指包括病毒基因组的复制、子代病毒颗粒的生成和/或从感染细胞中释放子代病毒颗粒。
3.2 发明目的本发明的一个目的是提供治疗个体中癌症或高增殖性疾病的方法,包括按照所述治疗所需对个体施以条件复制型病毒载体,其中至少一个编码其复制必需产物的病毒核酸操作性连接于H19调节序列。本发明的另一目的是提供条件复制型病毒载体,其中至少一个编码其复制必需产物的病毒核酸操作性连接于H19调节序列。本发明的另一目的是提供降低癌细胞生长的方法,包括将细胞与有效量的条件复制型病毒载体接触,其中至少一个编码其复制必需产物的病毒核酸操作性连接于H19调节序列。
本发明的另一目的是提供条件复制型病毒载体在制备治疗癌症或高增殖性疾病的药物中的用途,所述载体中至少一个编码其复制必需产物的病毒基因操作性连接于H19调节序列。本发明的另一个方面还涉及治疗癌症或高增殖性疾病的药物组合物,包括药学可接受载体和作为活性成分的条件复制型病毒载体,其中至少一个编码其复制必需产物的病毒基因操作性连接于H19调节序列。
可参照下面的详细描述、具体实施方案的示例性实施例和附图更全面地理解本发明。
4.附图简述图1A-1C.人H19启动子区的核苷酸序列。显示从核苷酸位置-837至-7(相对于转录起始点)的启动子区(SEQ ID NO1)。
图2.用于在H19调节序列控制下表达E1基因产物地条件复制型病毒载体地结构简图。基因产物,例如操作性连接于H19调节序列的腺病毒E1a首先被克隆至穿梭载体。得到的质粒被线性化然后与病毒骨架质粒共转化至细菌细胞例如大肠杆菌。利用抗生素抗性选择重组体,通过限制性核酸内切酶分析来证实重组。线性化的重组质粒被转染至适用的细胞系中,来进行病毒包装,重组病毒通常在7~12日内生成。在这一特定图中,病毒载体为腺病毒。“左臂”和“右臂”表示穿梭载体和病毒骨架之间的连接同源重组的区域。BmBamHI;RIEcoRI;LITR左手ITR和包装信号;RITR右手ITR;SpSpeI。
图3.人H19启动子片段的核苷酸序列(SEQ ID NO2)。
图4.0.9kb的H19增强子片段的核苷酸序列(SEQ ID NO3)。
图5A和5B.2kb的H19增强子片段的核苷酸序列(SEQ ID NO4)。
图6A-6C.4kb的H19增强子片段的核苷酸序列(SEQ ID NO5)。
图7.5型腺病毒的基因产物E1a(SEQ ID NO6)、E1b(SEQ IDNO8)、E2a(SEQ ID NO9)和E4(SEQ ID NO10)的编码核苷酸序列和/或氨基酸序列。
图8.2型腺病毒的核苷酸序列(SEQ ID NO11)。
图9.2型腺病毒的基因产物E1a(SEQ ID NO12)、E1b(SEQ IDNO13)、E2a(SEQ ID NO14)和E4(SEQ ID NO15)的氨基酸序列。
图10.1a型人乳头瘤病毒基因产物E6(SEQ ID NO16)和E7(SEQID NO18,19)的编码核苷酸序列和/或氨基酸序列。
图11.巨细胞病毒即早期区转录本的核苷酸序列(SEQ ID NO20)。
图12.猿猴病毒40的大T抗原的氨基酸序列(SEQ ID NO21)。
5.发明详述本发明部分基于如下的发现,可以使用在多数肿瘤细胞中活化而基本上不在非肿瘤细胞中活化的H19启动子使得裂解病毒在肿瘤细胞中复制,从而选择性杀死癌细胞或减少癌细胞的生长。具体而言,已经发现H19的表达在各种类型的癌瘤中活化,这些肿瘤包括但不局限于膀胱癌、肝细胞癌、成肝细胞癌、成横纹肌细胞瘤、卵巢癌、颈部癌、肺癌、乳腺癌、头颈部扁平细胞癌、食管癌、类胸腺癌、星形细胞瘤、成神经节胶质神经瘤和成神经细胞瘤。
因此,在本发明的一个方面中,本发明提供选择性杀死癌细胞或减少癌细胞的生长的方法和组合物,所述癌细胞优选为在个体体内。本目的通过把一种载体输送到所述的细胞来完成,所述载体为条件复制型病毒载体,其能在必需基因产物在H19调节元件的表达控制下进行表达时而得以复制。必需基因产物表达时发生的病毒复制倒是癌宿主细胞的死亡或,最小化减少癌宿主细胞的生长。复制的病毒(子代病毒)从被杀死或被感染的细胞释放至其附近,感染其它邻近细胞,再次选择型复制,由此选择性杀死或减少邻近癌细胞的生长。“扩散”现象有助于破坏肿瘤。在本发明中,由于H19调节序列的肿瘤特异性活化使得病毒具有复制性,其又可以至少导致癌细胞生长的减少。
H19调节序列包括但不局限于H19启动子和增强子的全长序列,仍然保持转录调节活性的上述二者的亚序列、以及上述任何序列的组合。参见,例如图1、3和4,5A-5B和6A-6C(SEQ ID NOS1-6),其为H19启动子和增强子的序列。
下面将描述病毒的示例性实例和可被置于H19调节序列下表达的适用的必需基因产物。
根据本发明,可以使用一个或多个编码病毒复制必需产物的核酸。当使用多个基本核酸时,例如,腺病毒的E1a和E1b,二者可置于单个异源调节序列下,或分别置于异源调节序列下进行同时表达。异源调节序列可以是两个相同的H19调节序列,两个不同的H19调节序列或一个H19调节序列和另一个非H19调节序列。所述非H19调节序列可以是组织特异性启动子,或其它癌或肿瘤特异性启动子,如端粒酶启动子。
5.1 H19基因的调节序列在此描述的是H19调节序列,该调节序列能用于指导异源编码序列在肿瘤细胞中特异性表达。这些H19的调节序列包括上游H19启动子区和/或下游H19增强子区。一种H19启动子区的核苷酸序列在图1A-1C显示(SEQ ID NO1)。该830个核苷酸的序列从-837延长到帽部位点的-7(如Brannan等的描述,上文)。一个共有的TATA序列出现在核苷酸-27~-35处。2个共有的AP2结合位点(8/9匹配)出现在转录起始位点上游大约-500和-40的核苷酸处。当如在下面更详细讨论的那样被置于异源基因编码区的上游时,大约830个碱基对的调节区足以指导操作性连接的异源基因在也表达内源H19的癌细胞中表达。另外,另一个位于核苷酸-819至+14位核苷酸的H19启动子区(图5,SEQ IDNO2)也足以指导操作性连接的异源基因在癌细胞中表达。对于上述而言,很明显全长H19启动子序列的亚序列即片段也具有足够的H19的调节序列,因此不需要使用全长启动子序列。
为了提供增强水平的肿瘤细胞特异性的表达,可任选将人H19基因的下游增强子区加到H19启动子/异源基因的构建体上。如在第6节以实施例的形式更详细描述和阐明的,下游增强子区包含在相对于转录起始位点从+6kb延长到+11kb的SacI限制性片段上。根据增强子序列预计,当在H19启动子控制之下,以反向或正向(相对于内源H19基因中的H19增强子的方向)置于异源基因编码区的下游时,该下游增强子能发挥其作用。另外,含有在图4、5A-5B和6A-6C(SEQ ID NOS3-5)所示的序列的该增强子片段也可用于促进基因表达。
这些在癌细胞中活化的H19调节序列可被进一步描述(delineated)以获得所希望肿瘤特异性表达所需的最短序列,以找到仍能保持特异性转录调节活性的H19调节元件的最短亚序列。例如,通过添加、替换或缺失可改变启动子区,然后分析其保留的特异于肿瘤的表达功能。可逐个检测H19下游增强子的各个部分增强从H19启动子转录的能力。
用各种化学和酶方法能引起调节序列中的各种改变,这些方法在本领域的技术人员中众所周知。例如,由限制性位点确定的序列区能被缺失。能用寡核苷酸定点诱变方法以确定的方式改变序列和/或把限制性位点导入到序列特定区中。另外,用诸如Bal 31或ExoIII和S1核酸酶的DNA核酸酶能产生缺失突变体。通过把所述的DNA与核酸酶温育更长的时间逐步产生调节序列中更大的缺失(见Ausubel等,1989,分子生物学现代技术,见诱变技术综述)。
评价改变的序列在合适的宿主细胞,尤其是表达H19衍生于癌的细胞(例如膀胱癌细胞,作为一个实例)中指导编码病毒复制必需产物序列的特异于肿瘤的表达的能力。为进一步用途保留其指导肿瘤特异表达能力并结合到重组表达载体中的任何改变的H19调节序列在本发明的范围之中。
此处使用的肿瘤特应性或肿瘤选择性复制是指病毒在癌细胞中的复制是在非癌性相似细胞中复制的至少两倍。更优选地,在癌细胞中的复制是在非癌性相似细胞中复制的至少5倍、至少10倍、至少25倍、至少50倍、至少100倍、至少500倍、至少1000倍、至少5000倍、至少10,000倍、至少50,000倍、至少100,000倍。可采用本领域技术人员众所周知的方法测定选择性复制的水平。一个示例性实例为采用如下数学公式 (见Alemany等,2000,自然生物技术)。
5.2 条件复制型病毒载体和必需基因产物本发明提供了能够在癌和/或高增殖性细胞中选择性复制,而在非癌和/或非高增殖性细胞中基本不复制的条件复制型病毒载体。所述载体含有操作性连接于H19转录调节序列的核酸,所述核酸的表达产物为病毒复制所必需的。
病毒的示例性实例和可被置于H19调节序列下表达的适用的必需基因产物包括但不局限于,DNA肿瘤病毒和RNA肿瘤病毒。DNA肿瘤病毒的示例性实例通常包括但不局限于,腺病毒、乳头瘤病毒、巨细胞病毒、疱疹病毒(如Epstein-Barr病毒、带状疱疹和单纯疱疹)、乳多空病毒(如多瘤和SV40)和肝炎病毒。在另一个实施例方案中,病毒载体为RNA病毒载体,优选为逆转录病毒载体。对本领域技术人员来说,将任何潜在的复制性病毒载体制备为条件复制型并根据本说明书所公开的内容进行使用是可显而易见的。
在一个优选实施方案中,条件复制型病毒腺病毒。腺病毒的核苷酸和氨基酸序列是本领域已知的且是可以获得的,例如获自GenBank。例如,GenBank记录号J01917中公开了来自腺病毒2完整基因组的核苷酸和氨基酸序列。还可以参见图8,其中描述了腺病毒2的核苷酸序列(SEQID NO11)。Chroboczek等(1992,病毒学186(1)280-285)中公开了来自腺病毒5完整基因组的核苷酸和氨基酸序列。示例性腺病毒必需基因产物包括但不限于E1a、E1b、E2a和E4。图7、8和9(SEQ ID NOS6-15)中描述了这些基因产物的核苷酸和/或氨基酸序列。
而且,工程化(engineering)条件复制型腺病毒的方法是本领域公知的,包含众所周知的分子生物学克隆技术。例如,可工程化腺病毒载体以便任意一个或多个E1a、E1b、E2a或E4的调节序列控制的表达可置于此处所述的H19调节序列的控制下。图2是插入含有操作性连接于E1A的编码序列的H19调节序列的核酸的简图。在该特定实施方案中,腺病毒载体缺失了天然E1a区从而在将该载体引入细胞中时,病毒不会发生复制。将操作性连接于H19调节序列的E1a的编码序列克隆入穿梭载体,例如,PadTractk-CMV。穿梭载体被线性化,然后与腺病毒骨架质粒例如,pAdEasy-1共转染,所述质粒不含必需基因产物(该实施方案中具体为E1a)的编码序列。利用适宜的抗生素抗性选择重组体,通过限制性分析来证实重组。将重组质粒转染至适用的腺病毒包装细胞系中,重组病毒通常在7~12日内生成。示例性载体,pAdTrack-CMV和PAdEasy-1,可商业上获自Stratagene,LaJolla California。
在另一个实施方案中,条件复制型病毒是人乳头瘤病毒。人乳头瘤病毒的核苷酸和氨基酸序列是本领域已知的且是可以获得的,例如获自GenBank。例如,GenBank记录号NC_001356中公开了来自1a型人乳头瘤病毒完整基因组的核苷酸和氨基酸序列。示例性人乳头瘤病毒必需基因产物包括但不限于E6和E7区基因产物。图10(SEQ ID NOS16-19)中描述了这些基因产物的核苷酸和/或氨基酸序列。
而且,工程化条件复制型乳头瘤病毒的方法是本领域公知的,包含众所周知的分子生物学克隆技术。例如,可工程化乳头瘤病毒载体以便任任意一个E6或E7的调节序列控制的表达可置于此处所述的H19调节序列的控制下。与图2所示相似,乳头瘤病毒载体缺失了天然E6区从而在将该载体引入细胞中时,病毒不会发生复制。将操作性连接于H19调节序列的E6的编码序列克隆入穿梭载体。穿梭载体被线性化,然后与乳头瘤病毒骨架质粒共转染,所述质粒不含必需基因产物(该实施方案中具体为E6)的编码序列。利用适宜的抗生素抗性选择重组体,通过限制性分析来证实重组。将重组质粒转染至适用的细胞系中,生成病毒子代,即H19调节序列活化的细胞系。
在另一个实施方案中,条件复制型病毒是巨细胞病毒(CMV)。巨细胞病毒的核苷酸和氨基酸序列是本领域已知的且是可以获得的,例如获自GenBank。例如,GenBank记录号X17403中公开了来自1a型巨细胞病毒完整基因组的核苷酸和氨基酸序列。示例性巨细胞病毒必需基因产物包括但不限于即早区基因产物。图11(SEQ ID NOS20)中描述了所述即早区基因产物的核苷酸和/或氨基酸序列。
而且,工程化条件复制型巨细胞病毒的方法是本领域公知的,包含众所周知的分子生物学克隆技术。例如,可工程化巨细胞病毒载体以便任任意一个即早期区基因的调节序列控制的表达可置于此处所述的H19调节序列的控制下。与图2所示相似,巨细胞病毒载体缺失了天然即早期区从而在将该载体引入细胞中时,病毒不会发生复制。将操作性连接于H19调节序列的即早期编码序列克隆入穿梭载体。穿梭载体被线性化,然后与巨细胞病毒骨架质共转化,所述质粒不含即早区。利用适宜的抗生素抗性选择重组体,通过限制性分析来证实重组。将重组质粒转染至适用的细胞系中,生成病毒子代,即H19调节序列活化的细胞系。
条件复制型病毒的其它示例性实例包括但不局限于,其它DNA肿瘤病毒和RNA肿瘤病毒。DNA肿瘤病毒的示例性实例通常包括但不局限于,疱疹病毒(如Epstein-Barr病毒、带状疱疹和单纯疱疹)、PAPOVA病毒(如多瘤和SV40)和肝炎病毒。在另一个实施例方案中,病毒载体为RNA病毒载体,优选为逆转录病毒载体。对本领域技术人员来说,将任何潜在的复制性病毒载体制备为条件复制型并根据本说明书所公开的内容进行使用是可显而易见的。
这些示例性病毒的核苷酸和氨基酸序列可获自GenBank。例如,GenBank记录号NC_001489,NC_003977和NC_004102中分别公开了A型、B型和C型肝炎病毒完整基因组的核苷酸和氨基酸序列。示例性巨细胞病毒必需基因产物包括但不限于即早区基因产物。图11(SEQ IDNOS209)中描述了所述即早区基因产物的核苷酸和/或氨基酸序列。GenBank记录号NC_001806、NC_001798、NC_001348、NC_001345、NC_001347、NC_001664、NC_000898和NC_001716中分别公开了1、2、3、4、5、6、6B和7型人疱疹病毒完整基因组的核苷酸和氨基酸序列。GenBank记录号V01555中公开了来自Epstein-Barr病毒完整基因组的核苷酸和氨基酸序列。GenBank记录号NC_001538中公开了来自BK多瘤病毒完整基因组的核苷酸和氨基酸序列。GenBank记录号NC_001515中公开了来自多瘤病毒完整基因组的核苷酸和氨基酸序列。GenBank记录号NC_001669中公开了来自猿猴病毒40完整基因组的核苷酸和氨基酸序列。上述GenBank条目中的核苷酸和氨基酸序列全文引入此处作为参考。
相关病毒核酸的实例为编码病毒载体或病毒复制必需产物的核酸。示例性所述必需基因产物包括但不限于即早区基因产物PAPOVA病毒的T抗原(图12,SEQ ID NO21)、逆转录病毒的聚合酶等。这些基本上包括任何病毒生命周期中必需的基因。
根据本发明,可以使用一个或多个编码病毒复制必需产物的核酸。当使用多个基本核酸时,例如,腺病毒的E1a和E1b,二者可置于单个异源调节序列下,或分别置于异源调节序列下进行同时表达。异源调节序列可以是两个相同的H19调节序列,两个不同的H19调节序列或一个H19调节序列和另一个非H19调节序列。所述非H19调节序列可以是组织特异性启动子,或其它癌或肿瘤特异性启动子,如端粒酶启动子。
根据本发明,虽然病毒的自我复制有时足以选择性抑制癌细胞的生长或破坏癌细胞,仍需要通过在病毒载体中引入编码细胞毒或细胞生长抑制产物的核酸来增加破坏过程。因此,在另一实施方案中,编码细胞毒或细胞生长抑制产物的核酸可与编码必需基因产物一起置于单H19调节基因的控制下。通过另一实施方案,必需基因产物和编码细胞毒或细胞生长抑制产物的核酸可分别置于异源转录调节序列的表达控制下。所述异源转录调节序列可以是两个相同的H19调节序列,两个不同的H19调节序列或将编码必需基因产物的核酸置于一个H19调节序列表达控制之下,而将编码细胞毒或细胞生长抑制产物的核酸置于非H19调节序列表达控制之下。所述非H19调节序列可以是来自另一组织特异性启动子,或其它癌或肿瘤特异性启动子,如端粒酶启动子的异源序列。或者,启动子可以是仅在必需基因产物表达后才活化的病毒启动子。
广义来说,细胞毒基因产物定义为包括毒素和诱导凋亡剂。此外,针对本发明的目的,细胞毒基因产物包括把前药转变成细胞毒产物的药物代谢酶类。用在本发明方法中的细胞毒基因产物的实施例包括白喉毒素、假单胞菌毒素、蓖麻毒蛋白霍乱毒素、PE 40和肿瘤抑制子基因如视网膜成细胞瘤和p53。此外,也可用编码诱导细胞凋亡的凋亡肽的序列。上述凋亡肽包括阿尔茨海默Aβ肽(见LaFerla等,1995,自然遗传学921-30)、前房钠尿肽(见Wu等,1997,生物化学杂志27214860-14866)、降钙素基因相关肽(见Sakuta等,1996,神经免疫学杂志67103-109)、以及其他已知的或待发现的凋亡肽。
把前药转变成细胞毒产物的药物代谢酶包括胸腺嘧啶激酶(来自单纯疱疹病毒或水痘带状疱疹病毒)、胞嘧啶脱氨酶、硝酸还原酶、细胞色素p-450 2B1、胸腺嘧啶磷酸化酶、嘌呤核苷磷酸化酶、碱性磷酸酶、羧肽酶A和G2、亚麻苦苷酶(linamarase)、 内酰胺酶、黄嘌呤氧化酶(见Rigg和Sikora,1997年8月,今日分子医学,pp359-366的有关背景资料)。
此外,用本发明描述的表达构建体可把反义、反基因(antigene)或aptameric寡核苷酸传递到癌细胞中。核酶或单链RNA也能在癌细胞中表达以抑制特殊的目的基因的表达。这些反义或核酶分子作用的靶基因应该是那些对细胞维持或维持癌细胞表型所必需的编码基因产物。上述靶基因包括但不局限于cdk2、cdk8、cdk21、cdc25A、周期蛋白D1、周期蛋白E、周期蛋白A和cdk4。
例如,为了下调内源基因的表达,把下列载体、反义RNAS或核酶导入到细胞中,其中所述的载体在来源于在癌细胞中表达的印记基因或IGF-1启动子的调节序列控制下;而反义RNAS或核酶对癌基因形式的p53、c-fos、c-jun、Kr-ras和/或Her2/neu的转录体具有特异性。表达H19和能活化H19调节序列的肿瘤细胞能特异地被导向用于表达反义RNA或核酶RNA。
反义方法包括设计与靶mRNA互补的寡核苷酸(在此情况下,mRNA)。该反义寡核苷酸将结合到互补的靶mRNA转录体,然后阻止翻译。绝对的互补性,尽管是优选的,并不需要。在此所指的对部分RNA的序列“互补性”意味着一种具有能和RNA杂交,形成稳定的双链体的足够互补性的序列。杂交能力将依赖于互补性的程度和反义核酸的长度。一般来说,所杂交的核酸越长,它可能含有的与RNA形成的碱基错配就越多,但仍能形成稳定的双链体(或三联体,视具体情况而定)。本领域的技术人员可使用标准方法确定错配的可容许程度,以确定杂交复合体的熔点。
与靶信使RNA的5′末端互补的寡核苷酸,例如直到并包括AUG起始密码子的5′非翻译序列,应最有效地起抑制翻译的作用。然而,最近研究表明,与mRNAs的3′非翻译序列互补的序列也有效地抑制mRNAs的翻译。一般性地参见,Wagner R,1994,自然372333-335。因此,与靶基因转录体的5′-或3′-非翻译、非编码区互补的寡核苷酸可用于反义方法,以抑制内源基因的翻译。与mRNA的5′非翻译区互补的寡核苷酸应包括AUG起始密码子的互补部分。与mRNA编码区互补的反义寡核苷酸是不太有效地翻译抑制剂,但根据本发明可以使用。不管被设计成与靶mRNA的5′、3′或与编码区杂交,反义核酸至少长为6个核苷酸,优选地为长6-约50个核苷酸范围的寡核苷酸。具体来说,该寡核苷酸至少有10个核苷酸、至少17个核苷酸、至少25个核苷酸或至少50个核苷酸。
不管如何选择靶序列,首先进行体外研究以定量确定反义寡核苷酸抑制基因表达的能力是优选。这些研究应该使用对照组,该对照组区分寡核苷酸的反义基因抑制和非特异的生物学效应。将所述的靶RNA或蛋白水平与内部对照RNA或蛋白的水平进行比较的这些研究方法,也是优选的。
设计催化性裂解必需靶基因的核酶分子也能用于阻止靶mRNA的翻译。(如见,PCT国际公开WO 90/11364,1990年10月4日公开;Sarver等,1990,科学2471222-1255)。当该核酶特异于一种编码对癌细胞生长必需的基因转录体时,上述核酶能引起癌细胞表型的逆转。虽然在特异识别序列的位点裂解mRNA的核酶可被用于摧毁靶mRNAs时,但优选地使用锤头核酶。锤头核酶在与靶mRNA形成互补碱基对的侧翼区所示的位置裂解mRNAs。唯一的要求是靶mRNA具有下列2个碱基的序列5′-UG-3′。锤头核酶的构建和产生在本领域众所周知,并且在Haseloff和Gerlach,1988,自然,334585-591的方法中更完整地描述。优选工程化核酶,这样裂解识别位点位于靶mRNA的5′末端附近;即能增加有效性并使细胞内非功能性mRNA转录体的积累最少。
用于本发明的核酶也包括RNA内切核糖核酸酶(下文被称为“Cech型核酶”),例如在嗜温四膜虫中天然产生的核酶(称之为IVS,或L-19 IVS RNA),该酶由Thomas Cech和合作者进行了深入的描述(Zaug等,1984,科学224574-578;Zaug和Cech,1986,科学,231470-475;Zaug等,1986,自然,324429-433;大学专利公司出版的公开的国际专利申请号WO 88/04300;Been和Cech,1986,细胞,47207-216)。Cech型核酶拥有一个8碱基对的活性位点,该位点与靶RNA序列杂交,然后出现靶RNA的裂解。本发明设想使用靶定存在于靶基因中的8个碱基对活性位点序列的那些Cech类型的核酶。
在另一实施方案中,条件复制型病毒载体还包含标记基因的编码序列,例如荧光素酶、 -半乳糖苷酶、绿色荧光蛋白等。这些构建体可用于研究构建体的分布、定位和稳定性的研究或体内实验中和/或有助于测定适宜的施用模式和/或施用所述载体的治疗方案。
5.3 基因产物在肿瘤细胞中的H19-依赖性表达活化内源H19基因产物表达的细胞也能特异地活化表达必需基因产物,因此导致条件复制型病毒载体的复制。上述细胞,尤其是肿瘤(癌,癌性)细胞和/或高增殖性细胞,是本发明基因治疗方法的合适靶物。应用RNA分析、原位杂交和报道基因构建体技术,可以测定肿瘤和非肿瘤细胞系中的H19依赖性特异表达。
对于大部分RNA分析应用,用本领域熟知的任何技术制备特异与目的基因转录体杂交的标记探针。该标记探针可含有至少15-30个与H19核苷酸序列互补的碱基,更优选地含有与H19转录体互补的50-150个碱基。针对H19表达的特别优选的杂交探针是一种与H19信使RNA的3′末端互补,从聚A位点上游大约800个碱基对到聚A位点的多核苷酸。
在以下由实施例方式说明的本发明具体实施方案中,用T7或T3表达质粒体外产生标记过的反义RNA探针。在标记核苷酸的存在下通过随机引物法,例如用Prime-It试剂盒(Stratagene,La Jolla,CA;商品名号300392),也能标记H19探针。另外,标记探针也能用PCR反应或标准缺刻翻译反应的方法产生,其中在PCR反应中,用H19编码区的cDNA克隆和被设计用来扩增编码区的某一区域的探针。
适于多核苷酸探针的标记物包括掺入了放射性同位素(如35S和32P)、荧光素、发光和显色标签分子和酶组分的核苷酸。
用标准技术原位把标记探针与细胞或组织样品杂交,例如用以下实施例描述的方法及本文引作参考的未决美国专利5,955,273的方法。另外,如果能获得足够量的合适细胞,可进行标准RNA分析(如Northern分析、RNA酶保护法或RNA酶引物延伸法),测定目的基因mRNA的表达水平。
另外,有可能“原位”进行上述基因表达分析,即直接从活检或切除物获得的病人组织的组织切片(固定和/或冷冻)上进行,这样没有必要纯化核酸。诸如上面描述的那些核酸试剂可在这些原位方法中用作探针和/或引物(例如见,Nuovo,1992,“原位杂交的PCR法方法和应用”,Raven出版社,纽约)。
确定一种细胞类型或肿瘤能特异地活化含有操作性与H19调节序列相连的编码病毒复制必需的基因产物的核酸的条件复制型病毒载体的一种替代方法事实上是把上述条件复制型病毒载体转染到细胞中。为这些目的,可以将编码标价基因的如荧光素酶导入病毒载体中,为了鉴别适用细胞的目的。在一次对标记基因产物分析中的阳性结果显示细胞或细胞系能从该调节区活化表达。
5.4 使用方法和药物组合物本发明还涉及用含有与H19调节序列操作性连接的编码病毒复制必需基因产物的核苷酸序列的条件复制型病毒载体转染的宿主细胞。所述宿主细胞可维持在培养基中,或者可以是动物优选哺乳动物,更优选人类的一部分。所述载体可以通过如下文6节中所述方法制备。
5.4.1 培养细胞用条件复制型病毒载体转染的宿主细胞可以是任一种原核或真核细胞。可以采用微生物或组织培养技术中已知且广泛使用的标准方法将载体转染到真核(酵母、鸟类、昆虫或哺乳动物)或原核(细菌细胞)的宿主细胞中。
5.4.2 条件复制型病毒载体和组合物的输送本发明还涉及含有与H19调节序列操作性连接的编码病毒复制必需基因产物的核苷酸序列的条件复制型病毒载体的在治疗癌症和高增殖性疾病例如特征为细胞生长不受控的疾病中的用途。对于本发明的方法,本发明的载体可用任何生物学上有效的载体如任何能在体内有效地将载体输送至细胞的制剂或组合物进行施用。病毒载体直接转染细胞,因此不需要复杂的转染技术如那些需要通过质粒转染的技术。在《病毒载体基因治疗和神经科学应用》(Caplitl和Loewy编著,学术出版社,圣迭哥(1995)中Cooper(1996,肿瘤学研讨会23172-187)报道了用于癌症治疗的基因转化和表达的近期综述。
已经表明通过修饰病毒颗粒表面的病毒包装蛋白(例如见PCT公开WO 93/25234和WO 94/06920),有可能限制病毒和接着基于病毒的载体的感染谱。例如,修饰逆转录病毒载体的感染谱的策略包括将特异于细胞表面抗原的抗体偶联至病毒env蛋白中(Roux等,1989,美国国家科学院院报869079-9083;Julan等,1992,普通病毒学杂志,u33251-3255;和Goud等,1983,病毒学163251-254);或将细胞表面受体配体偶联至病毒env蛋白中(Neda等,1991,生物化学杂志;26614143-14146)。偶联方法可以是和蛋白或其他种类的分子化学交联的形式(如把env蛋白转化成脱唾液酸糖蛋白的乳糖),以及产生融合蛋白(如单链抗体/env融合蛋白)。例如,使用该技术,例如通过将抗肿瘤有关分子的抗体或癌细胞表面蛋白的抗体偶联至重组病毒表面可靶定癌细胞。该技术,在用于限制或另外指导对某些组织类型的感染的同时,也能用于把外向载体转变成兼嗜性载体。更优选的方法是在病毒基因组中插入编码在病毒包膜上表达的蛋白,从而导致病毒载体优选地被摄取或进入癌细胞或特定组织的细胞中。
通过使用所述方法,能够保证双重安全性,即不仅条件复制型病毒可在癌细胞中复制,而且其开始即可以优选地输送至肿瘤细胞的位点。
如优选的实施方案中所述,优选的用于本发明的病毒载体为腺病毒条件复制型载体,关于腺病毒的信息可参见Berkner等,1988,生物技术6616;Rosenfeld等,1991,科学252431-434;和Rosenfeld等,1992,细胞68143-155。合适的来源于腺病毒株AD型5 d1324或其他腺病毒株(如Ad2、Ad3、Ad7等)的腺病毒载体在本领域的技术人员中众所周知。应当注意的是,当条件复制型病毒载体是腺病毒载体时,其是特别有利的,因为其可用于感染各种类型的细胞类型,这些细胞包括气管表皮(Rosenfeld等,1992,见上文的引用)、内皮细胞(Lemarchand等,1992,美国国家科学院院报896482-6486)、肝细胞(Herz和Gerard,1993,美国国家科学院院报902812-2816)和肌肉细胞(Quantin等,1992,美国国家科学院院报892581-2584)。而且,病毒颗粒相对稳定,容易纯化和浓缩,并可被修饰以影响感染谱。此外,导入的腺病毒DNA(和含在其中的外源DNA)不整合到宿主细胞的基因组中但以附加体形式存在,因而避免可能出现的插入诱变的潜在问题,在插入诱变的情形中,导入的DNA成为整合到宿主基因组中(如逆病毒DNA)。再者,相对于其他基因传递载体,腺病毒基因组携带外源DNA的能力大(高达8个碱基对)(Berkner等,见上文的引用,Haj-Ahmand和Graham,1986,病毒学杂志57267)。
普遍使用并因此受本发明推崇的大部分条件复制型腺病毒载体,被缺失所有或部分病毒的E1和E3基因,但仍保留多达80%的腺病毒遗传物质(如见,Jones等,1979,细胞16683;Berkner等,同上;和Graham等,分子生物学方法,E.J.Murray编著(Humana,Clifton NJ,1991)7卷,109-127页)。
在临床应用方面,所述条件复制型病毒载体可由众多方法之任一种导入到病人中,其中每一种方法在本领域众所周知。多种输送系统是已知的,可用于施用含有条件复制型载体和药学上可接受载体的药物组合物。导入的方法包括但不限于如,皮内、肌内、腹膜内、静脉内、皮下、鼻内、硬膜外和口腔等途径。病毒载体或组合物的施用可通过任何便利的途径,例如通过融合或输液或单次快速静脉注射、通过经上皮或皮肤粘膜层的吸收(例如,口腔粘膜、直肠或结肠粘膜等),还可以与其它生物活性物一起施用。可以采用全身或局部的施用。另外,可以通过任何适用的途径包括脑心室内或鞘内注射将本发明的病毒载体或组合物导入至中枢神经系统,可采用脑室内导管辅助脑室内注射,例如附加贮器,如奥马耶贮器(Ommaya reservoir)。也可采用肺施用方式,例如,通过使用吸入剂或雾化器,以及雾化剂的组合。
在一个具体的实施方案中,可将本发明的病毒载体或组合物局部施用于需要治疗的区域,可以采用但不限于手术期间的局部输液、通过注射、通过导管的方法、或通过植入的方法,所述植入为多空、无孔或胶状物质,包括膜,如唾液酸盐膜或纤维膜。在一个实施方案中,可通过肿瘤或瘤性或瘤前性组织位点(或前位点)直接注射施用。
在一个具体的实施方案中,术语“药学可接受”是指由联邦或州政府管理机构认可的或记载于美国药典或其它一般公认的用于动物更优选用于人的药典中。术语“载体”稀释剂、佐剂、赋形剂或可施用于治疗的载体。所述药学载体可以是无菌液,如水和油,其来源包括石油、动物、植物或合成,如花生油、豆油、矿物油、芝麻油等。当药物组合物通过静脉内施用时,水是优选的载体。盐水溶液和葡萄糖和甘油水溶液也可以用作液体载体,特别时用于注射性溶液。适用的药物赋形剂包括淀粉、葡萄糖、乳糖、蔗糖、凝胶、麦芽、米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠,脱脂奶粉、丙三醇、丙烯、乙二醇、水、乙醇等。组合物,如有需要,还可包含少量湿润剂和乳化剂,或pH缓冲剂。这些组合物可制成溶液、悬液、乳液、片剂、胶囊、粉末、持续释放剂型等。口服剂型可包括标准载体如药物级甘露醇、乳糖、淀粉、硬脂酸镁、钠糖精、纤维素、碳酸镁等。E.W.Martin在“Remington药物学”中记载了适用的药物载体的实例。制剂应适用于施用途径。
在另一实施方案中,病毒载体可通过控释系统进行递送。在一个实施方案中,可以使用泵(参见Langer,如前;Sefton,CRC Crit.Ref.Biomed.ENG.14201(1987);Buchwald等,Surgery 88507(1980);Saudek等,N.Engl.J.Med.321574(1989))。在另一实施方案中,可使用多聚材料(参见Medical Applicants of controlled Release,Langer和Wise(编),CRC出版社,Boca Raton,Florida(1974);Controlled DrugBioavailability,Drug Product Design and Performance,Smolen和Ball(编),Wiley,NEW YORK(1984);Ranger和Peppas,J.Macromol.Sci.Rev.Macromol.Chem.2361(1983);还可以参见Levy等,科学228190(1985);During等,Ann.Neurol.25351(1989);Howard等,J.Neurosurg.71105(1989))。在另一实施方案中,可将控释系统置于治疗部位即脑附近,因此仅需要全身剂量的部分(参见,例如,Goodson,in Medical Applicationsof Controlled Release,如前,2卷,115-138(1984))。Langer在综述中(SCIENCE 2491527-1533(1990))记载了其它控释系统。在一个实施方案中,可将病毒载体置于缓释介质中。
在一个优选的实施方案中,组合物根据使用途径过程进行制备为适于对人类静脉内注射的剂型。通常,用于静脉施用的组合物为无菌等渗水缓冲液中的溶液。需要时,组合物还可以含有溶解剂和局部麻醉剂如利多卡因以便减轻注射位点的疼痛。一般而言,可以按单位剂量形式例如,熔封容器如标明活性物量的安瓿或小袋中的低压冻干的粉末或无水浓缩物分开或混合提供成分。在通过输液施用组合物时,其可以在含有无菌药物级水或盐溶液的输液瓶中配制。在通过注射施用组合物时,用于注射的无菌水或盐溶液的安瓿可被提供以便在施用前混合成分。在优选的实施方案中,病毒载体的药物制剂可全身导入,例如通过如静脉注射、动脉内注射(例如肝血管),靶细胞中发生的病毒的特异性复制主要来自编码病毒复制必需产物的基因的表达的特异性。在另一具体实施方案中,伴随着导入相当局限的动物中,重组表达构建体的初始传递更受限制。例如,基因传递载体可直接注射至肿瘤位点(肿瘤内注射),或用导管(见美国专利5,328,470)导入身体的任何腔内如膀胱内的方法将其导入身体的腔室内,或立体注射法(例如,Chen等,1994,美国国家科学院院报913054-3057)。或者,药物制剂可包含一种或多种生成条件复制型病毒载体和向环境中分泌感染性病毒细胞。
5.4.3 治疗终点和剂量普通技术人员应当懂得,从医生或病人的角度来看,任何基本上缓解或预防和癌症病情有关的非所希望的症状(如,疼痛、敏感性和体重减轻等)是合乎要求的。另外,任何肿瘤重量或生长率的降低以及改善肿瘤组织病理图像是所希望的。特定病毒载体对癌或高增殖病的治疗作用的能力可用任意本领域已知的体外或体内方法来评估与对照相比的癌(癌性)细胞由于细胞死亡(由可以是坏死、凋亡或其二者组合的细胞死亡所致的)导致的数量下降;细胞生长率的降低,例如细胞的全部数量可以增加但以与对照未处理的细胞的增加相比较低的水平或较低的速率增加;与对照相比,细胞对周围环境的侵袭力降低(可通过例如软琼脂法测定)即使其全部数量没有转变;或未分化癌细胞向更分化的表型的进展等。
具有活化H19表达的示例肿瘤类型如下癌、肉瘤、腺瘤、肝细胞癌、肝胚细胞瘤、横纹肌肉瘤、食管癌、甲状腺癌、恶性神经节瘤、纤维肉瘤、粘液肉瘤、脂肪肉瘤、cohndrosarcoma、骨肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、lymphagiosarcoma、滑膜瘤、尤因氏瘤、平滑肌肉瘤、rhabdotheliosarcoma、结肠癌、胰腺癌、乳癌、卵巢癌、前列腺癌、鳞状细胞癌、基底细胞癌、腺癌、肾细胞癌、血肿(hematoma)、胆管癌、黑色素瘤、绒毛膜瘤、精原细胞瘤、胚胎性癌、维尔姆斯氏肿瘤、子宫颈癌、睾丸肿瘤、肺癌、小肺癌、膀胱癌、胃肠道间质瘤、上皮癌、胶质瘤、星形细胞瘤(glioma astrocyoma)、髓母细胞瘤、颅咽管瘤、ependynoma、松果体瘤、视网膜母细胞瘤、多发性骨髓瘤、直肠癌、甲状腺癌、头颈癌、子宫内膜癌(cancer of the edometrium)、以及它们的转移灶(metastases)。由此,本发明包含治疗上述全部癌症的方法。在一特别实施方案中,所述方法包含治疗如下肿瘤的方法膀胱癌、肝细胞癌、肝胚细胞癌、横纹肌肉瘤、卵巢癌、子宫颈癌、肺癌、乳癌、头颈部鳞状细胞癌、食管癌、甲状腺癌、星形细胞瘤、恶性神经节瘤或成神经细胞瘤。
有效剂量和治疗方案可通过常规方法确定,在实验室动物中用低剂量开始,然后增加剂量并同时监测作用效果,并也可以用全身性地改变剂量方案。动物研究,优选地哺乳动物研究通常被用来确定每公斤体重生物活性剂的最大可耐受剂量,或MTD。本领域的技术人员通常外推有效剂量并避免对其他物种,包括人类的毒性。
进行对人的效能研究前,在正常个体中的I期临床研究有助于确立安全剂量。当确定对给定个体的最佳剂量时,临床医生可能考虑许多因素。这些因素中最主要的是所选择的异源基因产物的毒性和半衰期。其他因素包括病人的个体大小、病人的年龄、病人的一般情况、被治疗的具体癌症、疾病的严重度、病人所用的其他药物、基因产物的体内活性等。考虑动物研究的结果和临床文献后,选择实验剂量。
例如,含有操作性连接于H19调节序列的编码病毒复制所需产物的核酸的条件复制腺病毒载体的直接注射到肿瘤块内的一般人用剂量为1×107pfu-1×1012pfu/天。更优选地,依据肿瘤大小,上述腺病毒载体直接注射到肿瘤内的每日剂量为1×108pfu-1×1010pfu。尤其是考虑体内使用时,本发明的各种生化组分优选地具有高纯度并且基本上无潜在的有害污染物(例如,至少国家食品(NF)级、通常至少分析级和优选地至少药用级)。由于所确定的化合物必须使用前合成,上述合成或随后的纯化优选产生这样的产物,该产物在合成或纯化方法中基本上无任何潜在的所用的毒性剂。
对于用于治疗个体的癌症病情,本发明在其一个方面还提供了以无菌分装的小瓶或安瓿形式的一种试剂盒或试剂包,其中含有条件复制型病毒载体,所述病毒载体包含编码病毒复制所需产物的操作性连接于H19调节序列的核酸。在一实施方案中,试剂盒实质上包含以适用的载体或其它任何稳定的形式的上述病毒载体。另外,根据本发明的另一个实施方案,该试剂包提供一种无菌分装的含有上述释放载体的细胞或细胞系的小瓶或安瓿。为了贮存和运输,应该冷冻载体释放细胞或细胞系。另外,该试剂包也可以含有用于培养所述释放载体的细胞或细胞系的培养基和试剂。另外,试剂包中含有试剂盒的使用说明书。
描述本发明后,提供下列实施例用以说明而不是限制本发明。
6.实施例制备条件复制腺病毒载体的一般方法通常,可以使用标准分子生物学技术构建此处描述的载体。构建所述载体的标准技术是本领域技术人员所众所周知的,并可以参阅如Sambrook等,分子克隆实验室手册,冷泉港,纽约(1989)或任一种关于重组DNA技术的种类繁多的能够广泛得到的实验室手册。多种策略可用于连接DNA片段,根据DNA片段末端的性质选择策略,且本领域技术人员可以很容易地确定。
在一个实施方案种,可采用根据标准技术构建含有,开始于5’末端,“关键性左末端元件”的穿梭载体来构建腺病毒载体,所述“关键性左末端元件”含有腺病毒5’ITR;腺病毒包装信号和E1a增强子序列;H19调节序列如H19启动子或其亚序列;三联前导序列;多克隆位点(可以是此处所描述的);poly A信号;和相应于腺病毒基因组片段的DNA片段。所述DNA片段作为与修饰或突变腺病毒同源重组的底物。质粒还可用包括选择性标记和复制起点。复制起点可以是细菌性复制起点。所述穿梭载体的代表性实例包括pAVS6,如此处所述以及参阅Trapnell等,1994,Adv.Drug Deliv.Rev 12185-189。含有异源基因的所需DNA序列可被插入至多克隆位点以制备质粒载体。
然后用将该构建体制备腺病毒载体。然后用修饰或突变的腺病毒进行同源重组,所述腺病毒中一个或多个天然转录调节序列被删除和用H19转录调节序列取代,如用H19启动子取代。所述同源重组可通过采用CaPO4沉淀的方法将质粒和修饰腺病毒共转染至辅助细胞系来实现。
通过所述同源重组,构建了含有不含一个或多个天然转录调节序列的腺病毒DNA的载体。然后可将该载体转染至辅助细胞系中以进行病毒复制以及产生感染性病毒颗粒。转染可采用电穿孔、磷酸钙沉淀、显微注射或通过脂蛋白体(proteoliposomes)实施。
所述载体可包含便于将含有H19调节序列的DNA序列插入载体的多克隆位点。通常,多克隆位点包括“罕见”限制性酶位点,即在真核生物基因中发现的概率为每10,000个碱基对中约有1个至每100,000个碱基对中约有1个的位点。因此通过标准技术在多克隆位点中的合适限制性位点剪切克隆载体来构建适用的载体,然后将含有外源基因的DNA序列连接至克隆载体中。
在一个实施方案中,可采用含有根据Ketner等,1994,Proc.Nat.Acad.Sci.916186-6190中所描述的腺病毒基因组的酵母人工染色体并结合此处所包含的方法来构建腺病毒。在该实施方案中,采用腺病毒DNA和携带腺病毒左和右基因组末端片段的酵母人工染色体之间的体内同源重组来制备所述腺病毒酵母人工染色体。然后将含有外源基因的DNA序列克隆至腺病毒DNA中。然后从腺病毒酵母人工染色体中切断修饰的腺病毒基因组以便将其用于生成感染性腺病毒颗粒。
6.1 材料和方法6.1.1 细胞系和转染方法膀胱癌细胞系HT-1376、EJ28、T24P、1197和UM-UC-3从美国典型培养物保藏中心(ATCC)获得,并按照ATCC推荐的方法维持。
6.1.2 病毒传代实验为确定腺病毒变体是否在膀胱癌细胞中优先复制,实施了针对释放数量的病毒产量实验。测定前述膀胱癌细胞系、人胚肾细胞系(293)和正常膀胱癌中的病毒复制效率。293细胞作为复制效率的阳性对照,由于该细胞构成性表达5型腺病毒E1a和E1b蛋白。为测定病毒子代的生成,将1.5×104细胞铺于24孔板上,然后用200μl含有2%FBS的生长介质中的腺病毒以MOI 2(2PFU/细胞)进行感染。次日,用HBSS冲洗细胞三次,再培育在含有10%FBS的生长介质中。感染三日后,收获细胞和介质,冻/融三次,然后采用针对293细胞的标准噬菌斑测定法测定病毒滴度。
6.1.3 表达载体的构建方法将优化的H19转录调节序列整合至腺病毒基因组中,来驱动必需病毒基因主要是E1A基因的定向表达。
按下述方法构建腺病毒基因组引入相应的Pshuttle限制性位点含有XhoI限制性位点的片段,然后从522位核苷酸至3924位的Mfe4I限制性位点(核苷酸位是指GenBank中编号AD5001所示序列)Ad5基因组序列。用H19启动子(SEQ ID NO1中所示核苷酸-810至+14)或作为对照的遍在表达的CMV增强子/启动子置换含有腺病毒E1启动子Ad5核苷酸346-521。另外,这些启动子上游的合成poly A位点(来自Luc-PH19)也要整合。该元件显示出可以避免非特异性的基因表达,由于Ad5左ITR的转录起始。然后采用PmeI酶切消化将这些穿梭载体线性化,并用于与pAdEasy-1的同源重组来生成分别含有重组腺病毒基因组的pAdCMV和pAdH19。质粒用PCR和限制性酶切消化进行证实。使用Lipofectamine(Life Technologies,Inc),按照用户操作手册将PacI酶切的pAd质粒转染至293细胞中,来制备腺病毒。按照AdEasy系统的操作方法中所述(如下)扩增病毒。病毒基因组的证实和野生型污染排除用PCR和限制性酶切消化进行。
出于多种监测目的,也可将报告基因(绿色荧光蛋白(GFP)或荧光素酶)整合至腺病毒载体中。作为该方法的扩展,表达HSVtk的腺病毒或胞嘧啶脱氨酶基因也可以发展使用。在这些构建体中,由H19启动子驱动的含有HSVtk、E1a基因的表达盒整合至穿梭质粒中。HSVtk转录本借助内核糖体进入位点(IRES)与E1a相连。
6.1.4 H-19启动子的构建方法为构建H19启动子,用下列引物,从人胎盘DNA扩增含有H19启动子序列的多核苷酸。
ESPCR21CGGTTCCCCACTTCCCCAGTTT(SEQ ID NO22)ESPCR22CGGAAGTCGACAACCCTCACCAAAGGCCAAGGT(SEQ ID NO23)用Klenow酶把该PCR产物的末端抹平并克隆到pBluescriptIISK+的EcoRV位点上。所插入的DNA用内切酶PvuII、EcoRI和ApaI消化证实。该启动子的方向与载体的lacZ编码区的方向相反。然后用HindIII和PstI切割法切下该启动子区,所得到的大约0.9kb的片段插入到pCAT基本质粒HindIII-PstI位点中以产生pH19E。
6.1.5 AdEasyTM系统AdEasyTM系统用于快速构建重组腺病毒载体,而无需噬斑纯化的时间。AdEasyTM系统由He等建立,该系统利用了强壮(robust)、有效的大肠杆菌重组结构,从而避免了难以处理的(36kb)腺病毒基因组的限制-连接。该技术必需的细菌性以及293细胞包括在每个试剂盒,每个试剂盒均提供生成至多5重组腺病毒的足够的试剂。高度详尽的用户手册是初学者以及本领域有经验技术人员的重要资源。
一般方案第1步如SEQ ID NO6中所示的操作性连接于上述H19调节序列的E1a腺病毒必需基因的cDNA首先克隆至传递载体。
第2步用PmeI将得到的质粒线性化,然后与pAdEasy-1,病毒DNA质粒一同共转染至大肠杆菌BJ5183株。用对卡那霉素的耐药性选择重组体,并用限制性酶分析筛选。
STEP 3然后用PacI将该重组腺病毒构建体剪切,以暴露其ITR(末端反向重复),并转染至QBI-293A细胞来制备病毒颗粒。
在细菌细胞中生成重组1.采用本领域已知的技术在20微升/管等份中制备电活性BJ5183细胞。
2.用PmeI将穿梭质粒线性化。通常五分之一的小量制品(一般为100-500ng)即是足够的。在酶切消化后,用酚-氯仿提取DNA,乙醇沉淀,然后用6.0微升DDH20中重悬。
3.该PmeI-酶切消化的穿梭质粒1.0微升腺病毒骨架载体(100ng/ul)共转化。加入20微升的电感受态大肠杆菌BJ5183细胞,电穿孔在2.0mm管中,以2,500V,200Ohms和25微-FD在Bio-Rad GenePulser电穿孔仪中实施。转化混合物在500微升L-培养基(可选择地,在37EC中孵育10~20分钟,依赖环境)中重悬。将混合物置于3~5LB/Kan培养板上,于37EC过夜生长(16-20小时)。
4.挑起10~20个极小的克隆,然后使其在含有25微克/ml卡那霉素的2ml L-培养基生长10-15小时。
5.采用普通的碱性分离法实施小量制备,通过将五分之一的小量制品在0.8%琼脂糖凝胶上泳动来检查超螺旋质粒的大小。
6.来自克隆的DNA用PacI进行限制性酶切消化。候选克隆产出大量(接近30kb),加3.0kb或4.5Kb的较小片段。
7.将2微升正确重组miniprep DNA再转化至DH10B(或任意质粒繁殖株)。采用CSCL-BANDING或采用商业可获得的纯化试剂盒纯化质粒以用于转染293细胞。
V293或911细胞中的病毒生成1.在转染前,将293细胞(E1a-转化的人胚肾细胞)或911细胞(E1-转化的人胚视网膜细胞)置于一个或两个T-25瓶内约24小时,每瓶2×106细胞。转染时的融合为约50%~70%。
2.转染当日,用Pad(通常一个T-25瓶需要转染4μg DNA)酶切消化重组腺病毒质粒。用乙醇沉淀该质粒,在20μl无菌水中重悬。
3.根据厂商手册实施标准Lipofectamine转染。4μg的PacI-酶切消化的质粒和20μl的Lipofectamine(GIBCO BRL)在含500μl OptiMem I培养基的每一T-25中混合,然后于室温下孵育15~30分钟。
4.等待期间,从用4ml无血清培养基(例如,普通DMEM,或Hank′s)冲洗一次的受体细胞中去除再生长培养基。每个T-25瓶中加入2.5mlOptiMemI。将其再置于37EC CO2培养箱中约10分钟。
5.将Lipofectamine-DNA混合物加入瓶中,然后将瓶返回37EC CO2培养箱。
6.四小时后,除去含有Lipofectamin-DNA混合物的培养基,加入6ml新的完全DMEM(10%FBS,1%Pen/Strep)。次日早晨更换培养基。
7.如果使用基于pAdTrack的载体,即可以采用GFP表达的方法来监测转染和病毒生成。
8.在转染后7~10日,用橡皮细胞帚从瓶中刮取细胞,转移至50ml锥形管。细胞在benchtop离心机中离心,然后在2.0ml HBSS或无菌PBS中重悬片状沉淀物。然后在干冰/甲醇浴中冷冻细胞,然后在37摄氏度的水浴中融化,然后强烈离心涡旋。冻/融/涡旋重复超过3个循环(一共4个循环)。将样品简单离心,将上清保藏于-20EC。
9.在每瓶中使用30-50%上述病毒上清感染两个50%~70%融合的T-25瓶的911或293细胞。应在感染后2~3日出现明显的CPE或细胞溶解。使用AdTrack载体易于观察到有效感染。
10.在三分之一至半数细胞分离时,通常在感染后3~5日收集病毒。可通过Western blot或PCR(对于PCR,去5μl病毒样品,加入10μl PCR级蛋白酶K,于55EC下1小时,然后煮沸样品5分钟,简单离心,取1~2μl用于证实重组腺病毒的存在。
11.刮去细胞,并按上述第8步中所述制备病毒上清。在这一阶段,至少107个感染性颗粒/ml是可用的,通常会更多。每一轮扩增的病毒应比前一轮中的病毒至少高10倍。
12.为进一步扩增,细胞感染步骤可以用来自11步中的30-50%的病毒上清重复,用T75瓶替换T25瓶。可以任意时间检测滴度,使用AD-Track载体使得该检测特别容易。用多种稀释度的病毒上清感染293细胞,然后在18小时后检测多少细胞为绿色。
高滴度病毒株的制备1.将911或293细胞置于T-75瓶中,在感染时90%的融合(大约1×107细胞/T-75)。通常,15~20个T-75瓶足以制备高滴度原种。
2.以5~10PFU/每细胞的复合感染(MOI),用病毒上清感染细胞。当全部细胞聚集和约半数细胞分离时(通常在感染后3~4日),在全部瓶中收集并集中。将内容物在benchtop离心机中离心(约500g)5分钟,除去上清。
3.将片状沉淀物在8.0ml无菌PBS中重悬。实施4次冻/融/涡旋循环。溶胞产物在Sorvall HS4转子,6000rpm(7000g)4℃离心5分钟。
4.在50ml锥形管中称重CSCI的克数,然后将8.0ml的澄清病毒上清转移至该管,通过离心使之完全混合。将CSCI溶液(约10ml,密度为1.35g/ml)转移至12ml用于SW41转子的polyallomer聚合物管,并覆盖2ml液体石蜡。制备平衡管,在SW41转子以32,000rpm,10EC,离心18~24小时。
5.病毒级分(约0.5~1.0ml)用3cc注射器和18g针头收集,用等体积的2×储存缓冲液混合(2×储存缓冲液=10mM Tris,pH8.0,100mMNaCl,0.1%BSA和50%丙三醇,灭菌滤器)。病毒保存在-20EC。
6.通过噬菌斑测定的GFP(优选)或免疫组织化学染色或与260nm直接读取OD来检测病毒滴度。为了读取OD,在加入了100μl TE/0.1%SDS的15μl空白溶液中(空白溶液=1.35g/ml CSCI与等体积的2×储存缓冲液混合)加入15μl病毒;搅动30秒,离心5分钟,检测A260。一个A260单位包含大约1012个病毒颗粒(颗粒∶感染性颗粒=大约20∶1)。
7.实施例条件复制病毒对膀胱癌细胞的影响-体外实验在体外测定H19调节的腺病毒的细胞毒性。1.5×104表达不同水平H19RNA的肿瘤细胞如HT-1376、EJ28、T24P、1197和UM-UC-3,和原代细胞被置于24孔板上,然后用200μl含有2%FBS的生长介质中的腺病毒以多种MOI2(0.1-10)或模拟进行感染。将E1-缺失AdCMVLuc构建体用作阴性对照。次日用生长培养基替换感染培养基。细胞裂解后,将细胞固定并用1%结晶紫染色。干燥培养板,采用Olympus数字照像机拍摄图像来确定由本发明的载体所导致的细胞裂解的程度/水平。
8.实施例条件复制病毒对膀胱癌细胞的影响-xenographic模型中的体内实验在第6节(如前)中制备的载体的效能被用来研究在SCID小鼠皮下生长的人膀胱癌细胞系。这一更复杂的动物模型是研究腺病毒癌细胞溶解所需要的,因为条件复制型腺病毒通常不在小鼠和大鼠细胞中生长。用荧光素酶表达载体稳定转染用于这些实验的人膀胱癌肿瘤系(UM-UC-3)以便在体内对肿瘤退化成像。或者,将GFP报告子整合至条件复制载体,如上述,以便对切除的肿瘤中的表达进行成像。
更具体地,对SCID小鼠皮下注射5×106的稳定表达荧光素酶的人UM-UC-3膀胱肿瘤细胞。对测得肿瘤体积大约为100-120mm3的小鼠组(n=8)将用不同剂量的如第6节(如前)中制备的条件复制型H19-腺病毒载体进行瘤内注射,所述剂量为200μl的培养液中107~109pfu。对照动物组仅接受介质(PBS)。
采用测径器和通过体内荧光素酶(由于肿瘤细胞自身发出荧光)检测来检测皮下注射的肿瘤的生长率,并在处死动物后,称重剖开的肿瘤以便确定本发明条件复制型病毒载体的治疗效果。通过在接种后1、3、5、7和14日收获肿瘤组织并评测腺病毒复制来测定作为时间函数的病毒扩散的实验,实验中改变是使用抗-腺病毒抗血清以及用标记基因如3-半乳糖苷酶,绿色荧光蛋白(GFP)或荧光素酶作为检测的腺病毒。治疗效果,以及病毒在肿瘤中的扩散度,每一含有H19-启动子的细胞溶解性腺病毒与启动子的外源活性相关(如用肿瘤细胞中的相应RNA水平来评测)。还检测了肿瘤-选择性溶细胞病毒在种群种杀死阴性表现型(例如,H19-阴性)肿瘤细胞的能力,显示了条件复制型病毒载体仅在表达活化H19调节序列的转录因子的肿瘤细胞中活化。
9.实施例H19条件复制病毒系统在膀胱癌的直立(orthotropic)模型中的用途该动物模型由人膀胱肿瘤细胞系UM-UC-3,RT-112和5637组成,植入严重联合免疫缺陷病(SCID)小鼠的膀胱。在雌性CD-1无胸腺裸鼠中建立膀胱内(进入肿瘤)生成的直立人膀胱癌。在植入后4和7日将按照6节中所述(如前)制备的本发明的载体通过导管注入膀胱内。采用腺病毒载体(1×107pfu/100μl PBS)单或多重滴注处理动物。生长率可通过两种方式中的一种进行测定通过体内检测荧光素酶(由于肿瘤细胞自身发出荧光,如8节中所述),以及在处理开始后的不同时间处死动物后,称重剖开的肿瘤以便确定本发明条件复制型病毒载体的治疗效果。
10.克隆的保藏根据用于专利程序的微生物保藏的国际承认的布达佩斯条约的有关规定,将下述质粒保藏于美国典型培养物保藏中心(ATCC)、Manassas,VA。
克隆ATCC登记号保藏日期pH19EH192093221997年10月2日本发明的范围并不限于前面描述的具体实施方案。的确,对本领域技术人员来说根据前述内容和附图可以显而易见地作出上述方案的各种修改方案。所述修改方案被认为在下列权利要求的范围之内。
在此引用的各种专利、出版物和GenBank记录其全文引入本文作为参考。
序列表<110>Yissum Research and Development Company of the Hebrew University of JerusalemHochberg,Abraham Ayesh,Suhail<120>诱导肿瘤特异性细胞毒性的方法和组合物<130>1413111<140>PCT/IL02/00843<141>2002-10-22<150>10/012,131<151>2001-10-22<160>21<170>PatentIn version 3.0<210>1<211>830<212>DNA<213>人<400>1ctgcagggcc ccaacaaccc tcaccaaagg ccaaggtggt gaccgacgga cccacagcgg 60ggtggctggg ggagtcgaaa ctcgccagtc tccactccac tcccaaccgt ggtgccccac120gcgggcctgg gagagtctgt gaggccgccc accgcttgtc agtagagtgc gcccgcgagc180cgtaagcaca gcccggcaac atgcggtctt cagacaggaa agtggccgcg aatgggaccg240gggtgcccag cggctgtggg gactctgtcc tgcggaaacc gcggtgacga gcacaagctc300ggtcaactgg atgggaatcg gcctgggggg ctggcaccgc gcccaccagg gggtttgcgg360cacttccctc tgcccctcag caccccaccc ctactctcca ggaacgtgag gtctgagccg420tgatggtggc aggaaggggc cctctgtgcc atccgagtcc ccagggaccc gcagctggcc480cccagccatg tgcaaagtat gtgcagggcg ctggcaggca gggagcagca ggcatggtgt540cccctgaggg gagacagtgg tctgggaggg agaggtcctg gaccctgagg gaggtgatgg600ggcaatgctc agccctgtct ccggatgcca aaggaggggt gcggggaggc cgtctttgga660gaattccagg atgggtgctg ggtgagagag acgtgtgctg gaactgtcca gggcggaggt720gggccctgcg ggggccctcg ggagggccct gctctgattg gccggcaggg caggggcggg780aattctggcg ggccacccca gttagaaaaa gcccgggcta ggaccgagga 830<210>2<211>833<212>DNA<213>人
<400>2gacaaccctc accaagggcc aaggtggtga ccgacggacc cacagcgggg tggctggggg 60agtcgaaact cgccagtctc cactccactc ccaaccgtgg tgccccacgc gggcctggga120gagtctgtga ggccgcccac cgcttgtcag tagagtgcgc ccgcgagccg taagcacagc180ccggcaacat gcggtcttca gacaggaaag tggccgcgaa tgggaccggg gtgcccagcg240gctgtgggga ctctgtcctg cggaaaccgc ggtgacgagc acaagctcgg tcaactggat300gggaatcggc ctggggggct ggcaccgcgc ccaccagggg gtttgcggca cttccctctg360cccctcagca ccccacccct actctccagg aacgtgagtt ctgagccgtg atggtggcag420gaaggggccc tctgtgccat ccgagtcccc agggacccgc agctggcccc cagccatgtg480caaagtatgt gcagggcgct ggcaggcagg gagcagcagg catggtgtcc cctgagggga540gacagtggtc tgggagggag aagtcctggc cctgagggag gtgatggggc aatgctcagc600cctgtctccg gatgccaaag gaggggtgcg gggaggccgt ctttggagaa ttccaggatg660ggtgctgggt gagagagacg tgtgctggaa ctgtccaggg cggaggtggg ccctgcgggg720gccctcggga gggccctgct ctgattggcc ggcagggcag gggcgggaat tctgggcggg780gccaccccag ttagaaaaag cccgggctag gaccgaggag cagggtgagg gag 833<210>3<211>877<212>DNA<213>人<400>3caaggacatg gaatttcgga ccttctgtcc ccaccctctc tgctgagcct aggaacctct 60gagcagcagg aaggccttgg gtctagagcc tagaaatgga cccccacgtc cacctgccca120gcctagaccc ccagcattga agggtggtca gacttcctgt gagaggaagc cactaagcgg180gatggacacc atcgcccact ccacccggcc ctgcccagcc ctgcccagtc cagcccagtc240cagcccagcc ctgcccttcc cagccctgcc cagcccagct catccctgcc ctacccagcc300cagccctgtc ctgccctgcc cagcccagcc cagcccagcc ctgccctgcc ctgccctgcc360cttcccagcc ctgaccttcc cagccctgcc cagcccagct catccctgcc ctacccagct420cagccctgcc ctgccctgcc ctgccctgcc cagccctacc cagcccagcc ctgccctgcc480ctgcccagct cagccctgcc caccccagcc cagcccagcc cagcatgcgt tctctggatg540gtgagcacag gcttgacctt agaaagaggc tggcaacgag ggctgaggcc accaggccac600tgggtgctca cgggtcagac aagcccagag cctgctcccc tgccacgggt cggggctgtc660accgccagca tgctgtggat gtgcatggcc tcagggctgc tggctccagg ctgcccccgc720cctggctccc gaggccaccc ctcttatgcc atgaaccctg tgccacaccc acctctgagc780tgtccccgct cctgccgcct gcaccccctg agcagccccc tgtgtgtttc atgggagtct840tagcaaggaa ggggagctcg aattcctgca gcccggg 877<210>4<211>2010<212>DNA<213>人
<220>
<221>misc_feature<222>(1026)..(1126)<223>n=a,t,c,或g<400>4ccgggtaccg agctcccagg aagataaatg atttcctcct ctctagagat gggggtggga 60tctgagcact cagagccaag ggcgcagtgg gtccgggcgg gggccctcct cggccctccc 120aacatggggg ccaggaggtc agcccctcaa cctggacccc ggctgggtct cagggaatgg 180tctcccccag tggcccagct tgcttgtgtt ttcagatggg tgtgcatggg tgtgtgtgtg 240tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgatgcct gacaagcccc agagagccaa 300agacctgagt ggagatcttg tgacttctca aaagggggat tggaaggttc gagaaagagc 360tgtggtcagc cttgctctcc cttaaggctg tggtaaccac actaggcata gcataggcct 420gcgccccgtc cctccttccc tcctccgcgc ctctcctttc tctttctccc ccctctaccc 480cgctccctgg cctgctcctg gtgacaccgt tggccccctt ccagggctga gggaagccag 540cgggggcccc ttcctgaaag cccacctgca ggccggcttg ctgggaaggg gctgctctcg 600cagaggctcc cgcccgccct gcagccgttt cctggaagca gtcgctgtgg gtattctgtt 660ccttgtcagc actgtgcttg caaagaaagc agacactgtg ctccttgtcc ttagggagcc 720ccgctccatc acccaacacc tggctggaca caggcgggag gccgggtccg cggggagcgg 780cgcggggctg gggccggacc attaaacaca cacgggcgcc aggcactgca ggctcctcct 840cctcctcctg cccagcgcct ctgctcacag gcacgtgcca agcccctagg ccaggaggcc 900agcagtgggt gcagaacaag ctcctgggaa gggggtgcag ggcggacccc cggggagaag 960ggctggcagg gctgtggggg acgctgaccg tgggccccac gttgcagaaa actggntgcc1020tggctggaag atgggggaga tgccaagcct ctgaggcagc acgagcaggg tgcatggagg1080ccggggcgcg gggaggctgc actgcagcat gcaccccaaa gcccanaggg agtggagacc1140aggccctgga atcgagaagt agaaaggcgg cttggaggcc tcggaaccgg ctgacctcca1200acagagtggg tctccagcct ggctctgccc tgccgcaggt cccctcccct cattaccagg1260cctagagcct ccagtcccgg tggcccccag cccgagggtg aacggcctca ccctgggtcg1320tgggacagag ggcacgttca tcaagagtgg ctcccaaggg acacgtggct gtttgcagtt1380cacaggaagc attcgagata aggagcttgt tttcccagtg ggcacggagc cagcaggggg1440gctgtggggc agcccagggt gcaaggccag gctgtggggc tgcagctgcc ttgggcccca1500ctcccaggcc tttgcgggag gtgggaggcg ggaggcggca gctgcacagt ggccccaggc1560gaggctctca gccccagtcg ctctccgggt gggcagccca agagggtctg gctgagcctc1620ccacatctgg gactccatca cccaacaact taattaaggc tgaatttcac gtgtcctgtg1680acttgggtag acaaagcccc tgtccaaagg ggcagccagc ctaaggcagt ggggacggcg1740tgggtggcgg gcgacggggg agatggacaa caggaccgag ggtgtgcggg cgatggggga1800gatggacaac aggaccgagg gtgtgcgggc gatgggggag atggacaaca ggaccgaggg1860tgtgcgggac acgcatgtca ctcatgcacg ccaatggggg gcgtgggagg ctggggagca1920gacagactgg gctgggctgg gcgggaagga cgggcagatg aattctggcg ggccacccca1980gttagaaaaa gcccgggcta ggaccgagga 2010<210>5<211>4085<212>DNA
<213>人<220>
<221>misc_feature<222>(2194)..(3235)<223>n=a,t,c,或g<400>5ccgggtaccg agctcccagg aagataaatg atttcctcct ctctagagat gggggtggga 60tctgagcact cagagccaag ggcgcagtgg gtccgggcgg gggccctcct cggccctccc 120aacatggggg ccaggaggtc agcccctcaa cctggacccc ggctgggtct cagggaatgg 180tctcccccag tggcccagct tgcttgtgtt ttcagatggg tgtgcatggg tgtgtgtgtg 240tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgatgcct gacaagcccc agagagccaa 300agacctgagt ggagatcttg tgacttctca aaagggggat tggaaggttc gagaaagagc 360tgtggtcagc cttgctctcc cttaaggctg tggtaaccac actaggcata gcataggcct 420gcgccccgtc cctccttccc tcctccgcgc ctctcctttc tctttctccc ccctctaccc 480cgctccctgg cctgctcctg gtgacaccgt tggccccctt ccagggctga gggaagccag 540cgggggcccc ttcctgaaag cccacctgca ggccggcttg ctgggaaggg gctgctctcg 600cagaggctcc cgcccgccct gcagccgttt cctggaagca gtcgctgtgg gtattctgtt 660ccttgtcagc actgtgcttg caaagaaagc agacactgtg ctccttgtcc ttagggagcc 720ccgctccatc acccaacacc tggctggaca caggcgggag gccgggtccg cggggagcgg 780cgcggggctg gggccggacc attaaacaca cacgggcgcc aggcactgca ggctcctcct 840cctcctcctg cccagcgcct ctgctcacag gcacgtgcca agcccctagg ccaggaggcc 900agcagtgggt gcagaacaag ctcctgggaa gggggtgcag ggcggacccc cggggagaag 960ggctggcagg gctgtggggg acgctgaccg tgggccccac gttgcagaaa actggntgcc1020tggctggaag atgggggaga tgccaagcct ctgaggcagc acgagcaggg tgcatggagg1080ccggggcgcg gggaggctgc actgcagcat gcaccccaaa gcccanaggg agtggagacc1140aggccctgga atcgagaagt agaaaggcgg cttggaggcc tcggaaccgg ctgacctcca1200acagagtggg gccggccctg gaggcaaaga ggtgcccggg gtccggccct gcctggggga1260gctatgtgtc atgggcaagc cacaggatat gtagcccgct ctgagcctat ggacccaggg1320cagggctgca aggcagggca ggggagacag cacgggggag caaggagcag agagggggcc1380tcaggctctc ccaggaggaa cattctcccg acaggaggaa gagacggccc aggggtgact1440gtggggagcc atggtggcag ctggggtcgt ggcagatggg agagaggctg gcgaggtgaa1500ggtgcagggg tcagggctct ggggcccaca tgcctgtggg agcaggcagg cccagggctc1560tccgccactc cccactcccg cttggctcat aggctgggcc caagggtggg gtgggatgag1620caggagatgg ggcccagggg gcaagcaggg ccccaaagac atttagaaaa accggtttat1680gcaggcagca ttcagagcag gcggcgtgcg tggcgggggc cctgggagca cagagaggca1740cacgtagggc ccccgagggg ctccccattg gccggcagtg acatcacccc tgtgtcaaca1800gtgatgtctg cagctccggc cagccagggt ttatggagcg agacccagcc cggcctgggc1860cctcactccc caggcccaca cactagccca ctgttcaggg tccggggtgg cggcatggcc1920tgggggtcct ggcaccgctg ctcctctgcc caccctaact tcccggcatc gcggctgccc1980cctctgagcg tccccaacca gtaagtgtgg ggcccagcag gcctgccgtc ctcctcctct2040tcccctctag agagaaacgt ggaggtcctg gggctggggg cgctcatagc cctgtgacac2100aggtgcatgg ggtcaggggt cccagaatgg cccctgggaa ggacctcagc tgggccggcg2160
gctctaggct tcaggggtct gtctgcacag gggntagccc ctcccagacc tctgtgaagc2220cagtacgggc ctcccctccc tgccccgtgc tctgtccggt gcttcctgga ctgcactgcg2280ggccactggt gagagggtgg acagggaagg gccgccgtgg tgcctgttcc tgcccacctg2340gctgtgtggt cccctccaag tagggacaac ccttctgagg gcttgggggc accctggggt2400tgccagggcc tcccagagcc ctgtgagccc ctggggggtc tggcctgatg cccccctcca2460cgtccagggc cggctgtggc ccagaacccc agcttcccag caggccggtg tgcggtggtg2520acccaggaga ggcctcgcct ccactgaggg gccaccgacc tctgtcagac cacagagacc2580cccaaggagt ctgaaggctg gagacccggg gctgggacca ggtgggactt tcccacggag2640ccgtccccag gcccagctgg ggacacgtcc cccttctctc cagacacacc ctgcctgcca2700ccaggacaca ccggcctgtt gggggtctct tttaagtgct tgccactctg aggtgactgt2760ccctttccaa agaggtttct ggggcccagg tgggatgcgt cggcctgagc aggaggatct2820gggccgccag gggctgggga ctgtctcctg gggaaggaag cgcctgggag cgtgtgtgct2880gacccaggac catccaggga ggcccgtctg tggggcaagc gggaagggag cggctggaga2940ggcttggccg cccccgccct gcctcccatt ccttagctcc atgcctgtca acctctgtca3000cccagtgagt gatgtccagg ggccctggaa aggtcacagc atgtttgagc ggggtgagag3060agaggggaaa ggcgggggcg gggaaaagta cgtggaggaa gctttaggcc caaggaagga3120gacagggttc tgggagggag ggagccactg gggccgccgg gaaggtccct gcttgctgct3180gccacccaga accctcgcct cttagctagc ccccgcagcc ccagcctttc tggcntgtgg3240ccctctcccc catccccagg tgtcctgtgc aaccaggcct tggacccaaa ccctcctgcc3300ccctcctctc cctcctcacc ctcccaatgc agtggtctcc agcctggctc tgccctgccg3360caggtcccct cccctcatta ccaggcctag agcctccagt cccggtggcc cccagcccga3420gggtgaacgg cctcaccctg ggtcgtggga cagagggcac gttcatcaag agtggctccc3480aagggacacg tggctgtttg cagttcacag gaagcattcg agataaggag cttgttttcc3540cagtgggcac ggagccagca ggggggctgt ggggcagccc agggtgcaag gccaggctgt3600ggggctgcag ctgccttggg ccccactccc aggcctttgc gggaggtggg aggcgggagg3660cggcagctgc acagtggccc caggcgaggc tctcagcccc agtcgctctc cgggtgggca3720gcccaagagg gtctggctga gcctcccaca tctgggactc catcacccaa caacttaatt3780aaggctgaat ttcacgtgtc ctgtgacttg ggtagacaaa gcccctgtcc aaaggggcag3840ccagcctaag gcagtgggga cggcgtgggt ggcgggcgac gggggagatg gacaacagga3900ccgagggtgt gcgggcgatg ggggagatgg acaacaggac cgagggtgtg cgggcgatgg3960gggagatgga caacaggacc gagggtgtgc gggacacgca tgtcactcat gcacgccaat4020ggggggcgtg ggaggctggg gagcagacag actgggctgg gctgggcggg aaggacgggc4080agatg4085<210>6<211>3408<212>DNA<213>人腺病毒5型<220>
<221>CDS<222>(44)..(598)<220>
<221>CDS<222>(715)..(1026)<400>6gtagagtttt ctcctccgag ccgctccgac accgggactg aaa atg aga cat att 55Met Arg His Ile1atc tgc cac gga ggt gtt att acc gaa gaa atg gcc gcc agt ctt ttg 103Ile Cys His Gly Gly Val Ile Thr Glu Glu Met Ala Ala Ser Leu Leu5 10 15 20gac cag ctg atc gaa gag gta ctg gct gat aat ctt cca cct cct agc 151Asp Gln Leu Ile Glu Glu Val Leu Ala Asp Asn Leu Pro Pro Pro Ser25 30 35cat ttt gaa cca cct acc ctt cac gaa ctg tat gat tta gac gtg acg 199His Phe Glu Pro Pro Thr Leu His Glu Leu Tyr Asp Leu Asp Val Thr40 45 50gcc ccc gaa gat ccc aac gag gag gcg gtt tcg cag att ttt ccc gac 247Ala Pro Glu Asp Pro Asn Glu Glu Ala Val Ser Gln Ile Phe Pro Asp55 60 65tct gta atg ttg gcg gtg cag gaa ggg att gac tta ctc act ttt ccg 295Ser Val Met Leu Ala Val Gln Glu Gly Ile Asp Leu Leu Thr Phe Pro70 75 80ccg gcg ccc ggt tct ccg gag ccg cct cac ctt tcc cgg cag ccc gag 343Pro Ala Pro Gly Ser Pro Glu Pro Pro His Leu Ser Arg Gln Pro Glu85 90 95 100cag ccg gag cag aga gcc ttg ggt ccg gtt tct atg cca aac ctt gta 391Gln Pro Glu Gln Arg Ala Leu Gly Pro Val Ser Met Pro Asn Leu Val105 110 115ccg gag gtg atc gat ctt acc tgc cac gag gct ggc ttt cca ccc agt 439Pro Glu Val Ile Asp Leu Thr Cys His Glu Ala Gly Phe Pro Pro Ser120 125 130gac gac gag gat gaa gag ggt gag gag ttt gtg tta gat tat gtg gag 487Asp Asp Glu Asp Glu Glu Gly Glu Glu Phe Val Leu Asp Tyr Val Glu135 140 145cac ccc ggg cac ggt tgc agg tct tgt cat tat cac cgg agg aat acg 535His Pro Gly His Gly Cys Arg Ser Cys His Tyr His Arg Arg Asn Thr150 155 160ggg gac cca gat att atg tgt tcg ctt tgc tat atg agg acc tgt ggc 583Gly Asp Pro Asp Ile Met Cys Ser Leu Cys Tyr Met Arg Thr Cys Gly165 170 175 180atg ttt gtc tac agt aagtgaaaat tatgggcagt gggtgataga gtggtgggtt 638Met Phe Val Tyr Ser185tggtgtggta attttttttt taatttttac agttttgtgg tttaaagaat tttgtattgt698
gattttttta aaaggt cct gtg tct gaa cct gag cct gag ccc gag cca gaa 750Pro Val Ser Glu Pro Glu Pro Glu Pro Glu Pro Glu190 195ccg gag cct gca aga cct acc cgc cgt cct aaa atg gcg cct gct atc 798Pro Glu Pro Ala Arg Pro Thr Arg Arg Pro Lys Met Ala Pro Ala Ile200 205 210ctg aga cgc ccg aca tca cct gtg tct aga gaa tgc aat agt agt acg 846Leu Arg Arg Pro Thr Ser Pro Val Ser Arg Glu Cys Asn Ser Ser Thr215 220 225gat agc tgt gac tcc ggt cct tct aac aca cct cct gag ata cac ccg 894Asp Ser Cys Asp Ser Gly Pro Ser Asn Thr Pro Pro Glu Ile His Pro230 235 240 245gtg gtc ccg ctg tgc ccc att aaa cca gtt gcc gtg aga gtt ggt ggg 942Val Val Pro Leu Cys Pro Ile Lys Pro Val Ala Val Arg Val Gly Gly250 255 260cgt cgc cag gct gtg gaa tgt atc gag gac ttg ctt aac gag cct ggg 990Arg Arg Gln Ala Val Glu Cys Ile Glu Asp Leu Leu Asn Glu Pro Gly265 270 275caa cct ttg gac ttg agc tgt aaa cgc ccc agg cca taaggtgtaa 1036Gln Pro Leu Asp Leu Ser Cys Lys Arg Pro Arg Pro280 285acctgtgatt gcgtgtgtgg ttaacgcctt tgtttgctga atgagttgat gtaagtttaa1096taaagggtga gataatgttt aacttgcatg gcgtgttaaa tggggcgggg cttaaagggt1156atataatgcg ccgtgggcta atcttggtta catctgacct catggaggct tgggagtgtt1216tggaagattt ttctgctgtg cgtaacttgc tggaacagag ctctaacagt acctcttggt1276tttggaggtt tctgtggggc tcatcccagg caaagttagt ctgcagaatt aaggaggatt1336acaagtggga atttgaagag cttttgaaat cctgtggtga gctgtttgat tctttgaatc1396tgggtcacca ggcgcttttc caagagaagg tcatcaagac tttggatttt tccacaccgg1456ggcgcgctgc ggctgctgtt gcttttttga gttttataaa ggataaatgg agcgaagaaa1516cccatctgag cggggggtac ctgctggatt ttctggccat gcatctgtgg agagcggttg1576tgagacacaa gaatcgcctg ctactgttgt cttccgtccg cccggcgata ataccgacgg1636aggagcagca gcagcagcag gaggaagcca ggcggcggcg gcaggagcag agcccatgga1696acccgagagc cggcctggac cctcgggaat gaatgttgta caggtggctg aactgtatcc1756agaactgaga cgcattttga caattacaga ggatgggcag gggctaaagg gggtaaagag1816ggagcggggg gcttgtgagg ctacagagga ggctaggaat ctagctttta gcttaatgac1876cagacaccgt cctgagtgta ttacttttca acagatcaag gataattgcg ctaatgagct1936tgatctgctg gcgcagaagt attccataga gcagctgacc acttactggc tgcagccagg1996ggatgatttt gaggaggcta ttagggtata tgcaaaggtg gcacttaggc cagattgcaa2056gtacaagatc agcaaacttg taaatatcag gaattgttgc tacatttctg ggaacggggc2116cgaggtggag atagatacgg aggatagggt ggcctttaga tgtagcatga taaatatgtg2176gccgggggtg cttggcatgg acggggtggt tattatgaat gtaaggttta ctggccccaa2236ttttagcggt acggttttcc tggccaatac caaccttatc ctacacggtg taagcttcta2296tgggtttaac aatacctgtg tggaagcctg gaccgatgta agggttcggg gctgtgcctt2356ttactgctgc tggaaggggg tggtgtgtcg ccccaaaagc agggcttcaa ttaagaaatg2416
cctctttgaa aggtgtacct tgggtatcct gtctgagggt aactccaggg tgcgccacaa2476tgtggcctcc gactgtggtt gcttcatgct agtgaaaagc gtggctgtga ttaagcataa2536catggtatgt ggcaactgcg aggacagggc ctctcagatg ctgacctgct cggacggcaa2596ctgtcacctg ctgaagacca ttcacgtagc cagccactct cgcaaggcct ggccagtgtt2656tgagcataac atactgaccc gctgttcctt gcatttgggt aacaggaggg gggtgttcct2716accttaccaa tgcaatttga gtcacactaa gatattgctt gagcccgaga gcatgtccaa2776ggtgaacctg aacggggtgt ttgacatgac catgaagatc tggaaggtgc tgaggtacga2836tgagacccgc accaggtgca gaccctgcga gtgtggcggt aaacatatta ggaaccagcc2896tgtgatgctg gatgtgaccg aggagctgag gcccgatcac ttggtgctgg cctgcacccg2956cgctgagttt ggctctagcg atgaagatac agattgaggt actgaaatgt gtgggcgtgg3016cttaagggtg ggaaagaata tataaggtgg gggtcttatg tagttttgta tctgttttgc3076agcagccgcc gccgccatga gcaccaactc gtttgatgga agcattgtga gctcatattt3136gacaacgcgc atgcccccat gggccggggt gcgtcagaat gtgatgggct ccagcattga3196tggtcgcccc gtcctgcccg caaactctac taccttgacc tacgagaccg tgtctggaac3256gccgttggag actgcagcct ccgccgccgc ttcagccgct gcagccaccg cccgcgggat3316tgtgactgac tttgctttcc tgagcccgct tgcaagcagt gcagcttccc gttcatccgc3376ccgcgatgac aagttgacgg ctcttttggc ac 3408<210>7<211>289<212>PRT<213>人腺病毒5型<400>7Met Arg His Ile Ile Cys His Gly Gly Val Ile Thr Glu Glu Met Ala1 5 10 15Ala Ser Leu Leu Asp Gln Leu Ile Glu Glu Val Leu Ala Asp Asn Leu20 25 30Pro Pro Pro Ser His Phe Glu Pro Pro Thr Leu His Glu Leu Tyr Asp35 40 45Leu Asp Val Thr Ala Pro Glu Asp Pro Asn Glu Glu Ala Val Ser Gln50 55 60Ile Phe Pro Asp Ser Val Met Leu Ala Val Gln Glu Gly Ile Asp Leu65 70 75 80Leu Thr Phe Pro Pro Ala Pro Gly Ser Pro Glu Pro Pro His Leu Ser85 90 95Arg Gln Pro Glu Gln Pro Glu Gln Arg Ala Leu Gly Pro Val Ser Met100 105 110
Pro Asn Leu Val Pro Glu Val Ile Asp Leu Thr Cys His Glu Ala Gly115 120 125Phe Pro Pro Ser Asp Asp Glu Asp Glu Glu Gly Glu Glu Phe Val Leu130 135 140Asp Tyr Val Glu His Pro Gly His Gly Gys Arg Ser Cys His Tyr His145 150 155 160Arg Arg Asn Thr Gly Asp Pro Asp Ile Met Cys Ser Leu Cys Tyr Met165 170 175Arg Thr Cys Gly Met Phe Val Tyr Ser Pro Val Ser Glu Pro Glu Pro180 185 190Glu Pro Glu Pro Glu Pro Glu Pro Ala Arg Pro Thr Arg Arg Pro Lys195 200 205Met Ala Pro Ala Ile Leu Arg Arg Pro Thr Ser Pro Val Ser Arg Glu210 215 220Cys Asn Ser Ser Thr Asp Ser Cys Asp Ser Gly Pro Ser Asn Thr Pro225 230 235 240Pro Glu Ile His Pro Val Val Pro Leu Cys Pro Ile Lys Pro Val Ala245 250 255Val Arg Val Gly Gly Arg Arg Gln Ala Val Glu Cys Ile Glu Asp Leu260 265 270Leu Asn Glu Pro Gly Gln Pro Leu Asp Leu Ser Cys Lys Arg Pro Arg275 280 285Pro<210>8<211>496<212>PRT<213>人腺病毒5型<400>8Met Glu Arg Arg Asn Pro Ser Glu Arg Gly Val Pro Ala Gly Phe Ser
1 5 10 15Gly His Ala Ser Val Glu Ser Gly Cys Glu Thr Gln Glu Ser Pro Ala20 25 30Thr Val Val Phe Arg Pro Pro Gly Asp Asn Thr Asp Gly Gly Ala Ala35 40 45Ala Ala Ala Gly Gly Ser Gln Ala Ala Ala Ala Gly Ala Glu Pro Met50 55 60Glu Pro Glu Ser Arg Pro Gly Pro Ser Gly Met Asn Val Val Gln Val65 70 75 80Ala Glu Leu Tyr Pro Glu Leu Arg Arg Ile Leu Thr Ile Thr Glu Asp85 90 95Gly Gln Gly Leu Lys Gly Val Lys Arg Glu Arg Gly Ala Cys Glu Ala100 105 110Thr Glu Glu Ala Arg Asn Leu Ala Phe Ser Leu Met Thr Arg His Arg115 120 125Pro Glu Cys Ile Thr Phe Gln Gln Ile Lys Asp Asn Cys Ala Asn Glu130 135 140Leu Asp Leu Leu Ala Gln Lys Tyr Ser Ile Glu Gln Leu Thr Thr Tyr145 150 155 160Trp Leu Gln Pro Gly Asp Asp Phe Glu Glu Ala Ile Arg Val Tyr Ala165 170 175Lys Val Ala Leu Arg Pro Asp Cys Lys Tyr Lys Ile Ser Lys Leu Val180 185 190Asn Ile Arg Asn Cys Cys Tyr Ile Ser Gly Asn Gly Ala Glu Val Glu195 200 205Ile Asp Thr Glu Asp Arg Val Ala Phe Arg Cys Ser Met Ile Asn Met210 215 220Trp Pro Gly Val Leu Gly Met Asp Gly Val Val Ile Met Asn Val Arg225 230 235 240Phe Thr Gly Pro Asn Phe Ser Gly Thr Val Phe Leu Ala Asn Thr Asn245 250 255Leu Ile Leu His Gly Val Ser Phe Tyr Gly Phe Asn Asn Thr Cys Val260 265 270Glu Ala Trp Thr Asp Val Arg Val Arg Gly Cys Ala Phe Tyr Cys Cys275 280 285Trp Lys Gly Val Val Cys Arg Pro Lys Ser Arg Ala Ser Ile Lys Lys290 295 300Cys Leu Phe Glu Arg Cys Thr Leu Gly Ile Leu Ser Glu Gly Asn Ser305 310 315 320Arg Val Arg His Asn Val Ala Ser Asp Cys Gly Cys Phe Met Leu Val325 330 335Lys Ser Val Ala Val Ile Lys His Asn Met Val Cys Gly Asn Cys Glu340 345 350Asp Arg Ala Ser Gln Met Leu Thr Cys Ser Asp Gly Asn Cys His Leu
355 360 365Leu Lys Thr Ile His Val Ala Ser His Ser Arg Lys Ala Trp Pro Val370 375 380Phe Glu His Asn Ile Leu Thr Arg Cys Ser Leu His Leu Gly Asn Arg385 390 395 400Arg Gly Val Phe Leu Pro Tyr Gln Cys Asn Leu Ser His Thr Lys Ile405 410 415Leu Leu Glu Pro Glu Ser Met Ser Lys Val Asn Leu Asn Gly Val Phe420 425 430Asp Met Thr Met Lys Ile Trp Lys Val Leu Arg Tyr Asp Glu Thr Arg435 440 445Thr Arg Cys Arg Pro Cys Glu Cys Gly Gly Lys His Ile Arg Asn Gln450 455 460Pro Val Met Leu Asp Val Thr Glu Glu Leu Arg Pro Asp His Leu Val465 470 475 480Leu Ala Cys Thr Arg Ala Glu Phe Gly Ser Ser Asp Glu Asp Thr Asp485 490 495<210>9<211>529<212>PRT<213>人腺病毒5型<400>9Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly1 5 10 15Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro20 25 30Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Met Arg35 40 45Arg Arg Ile Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu50 55 60Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Ala Ala Asp Leu65 70 75 80Ala Ile Ala Pro Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu85 90 95Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu100 105 110Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile115 120 125Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp130 135 140Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Glu Glu Glu Pro145 150 155 160Ser Glu Ala Glu Ser Glu Ile Thr Val Met Asn Pro Leu Ser Val Pro
165 170 175Ile Val Ser Ala Trp Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met180 185 190Asp Lys Tyr His Val Asp Asn Asp Leu Lys Ala Ash Phe Lys Leu Leu195 200 205Pro Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn210 215 220Glu Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Lys Lys Thr Phe225 230 235 240Val Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala245 250 255Glu Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu260 265 270His Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser275 280 285Ile Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu290 295 300Asn Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val305 310 315 320Lys Asn Arg Trp Gly Arg Asn Val Val Gln Ile Ser Asn Thr Asp Ala325 330 335Arg Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly340 345 350Lys Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala355 360 365Phe Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln370 375 380Thr Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser385 390 395 400Lys Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr405 410 415Pro Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser420 425 430Asp Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe435 440 445Gln Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly450 455 460Pro Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu465 470 475 480Val Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg485 490 495Met Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn500 505 510Val Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp
515520 525Phe<210>10<211>116<212>PRT<213>人腺病毒5型<400>10Met Ile Arg Cys Leu Arg Leu Lys Val Glu Gly Ala Leu Glu Gln Ile1 5 10 15Phe Thr Met Ala Gly Leu Asn Ile Arg Asp Leu Leu Arg Asp Ile Leu20 25 30Arg Arg Trp Arg Asp Glu Asn Tyr Leu Gly Met Val Glu Gly Ala Gly35 40 45Met Phe Ile Glu Glu Ile His Pro Glu Gly Phe Ser Leu Tyr Val His50 55 60Leu Asp Val Arg Ala Val Cys Leu Leu Glu Ala Ile Val Gln His Leu65 70 75 80Thr Asn Ala Ile Ile Cys Ser Leu Ala Val Glu Phe Asp His Ala Thr85 90 95Gly Gly Glu Arg Val His Leu Ile Asp Leu His Phe Glu Val Leu Asp100 105 110Asn Leu Leu Glu115<210>11<211>35937<212>DNA<213>人腺病毒2型<400>11catcatcata atatacctta ttttggattg aagccaatat gataatgagg gggtggagtt 60tgtgacgtgg cgcggggcgt gggaacgggg cgggtgacgt agtagtgtgg cggaagtgtg120atgttgcaag tgtggcggaa cacatgtaag cgccggatgt ggtaaaagtg acgtttttgg180tgtgcgccgg tgtatacggg aagtgacaat tttcgcgcgg ttttaggcgg atgttgtagt240aaatttgggc gtaaccaagt aatgtttggc cattttcgcg ggaaaactga ataagaggaa300gtgaaatctg aataattctg tgttactcat agcgcgtaat atttgtctag ggccgcgggg360actttgaccg tttacgtgga gactcgccca ggtgtttttc tcaggtgttt tccgcgttcc420gggtcaaagt tggcgtttta ttattatagt cagctgacgc gcagtgtatt tatacccggt480gagttcctca agaggccact cttgagtgcc agcgagtaga gttttctcct ccgagccgct540ccgacaccgg gactgaaaat gagacatatt atctgccacg gaggtgttat taccgaagaa600atggccgcca gtcttttgga ccagctgatc gaagaggtac tggctgataa tcttccacct660cctagccatt ttgaaccacc tacccttcac gaactgtatg atttagacgt gacggccccc720gaagatccca acgaggaggc ggtttcgcag atttttcccg agtctgtaat gttggcggtg780
caggaaggga ttgacttatt cacttttccg ccggcgcccg gttctccgga gccgcctcac 840ctttcccggc agcccgagca gccggagcag agagccttgg gtccggtttc tatgccaaac 900cttgtgccgg aggtgatcga tcttacctgc cacgaggctg gctttccacc cagtgacgac 960gaggatgaag agggtgagga gtttgtgtta gattatgtgg agcaccccgg gcacggttgc1020aggtcttgtc attatcaccg gaggaatacg ggggacccag atattatgtg ttcgctttgc1080tatatgagga cctgtggcat gtttgtctac agtaagtgaa aattatgggc agtcggtgat1140agagtggtgg gtttggtgtg gtaatttttt tttaattttt acagttttgt ggtttaaaga1200attttgtatt gtgatttttt aaaaggtcct gtgtctgaac ctgagcctga gcccgagcca1260gaaccggagc ctgcaagacc tacccggcgt cctaaattgg tgcctgctat cctgagacgc1320ccgacatcac ctgtgtctag agaatgcaat agtagtacgg atagctgtga ctccggtcct1380tctaacacac ctcctgagat acacccggtg gtcccgctgt gccccattaa accagttgcc1440gtgagagttg gtgggcgtcg ccaggctgtg gaatgtatcg aggacttgct taacgagtct1500gggcaacctt tggacttgag ctgtaaacgc cccaggccat aaggtgtaaa cctgtgattg1560cgtgtgtggt taacgccttt gtttgctgaa tgagttgatg taagtttaat aaagggtgag1620ataatgttta acttgcatgg cgtgttaaat ggggcggggc ttaaagggta tataatgcgc1680cgtgggctaa tcttggttac atctgacctc atggaggctt gggagtgttt ggaagatttt1740tctgctgtgc gtaacttgct ggaacagagc tctaacagta cctcttggtt ttggaggttt1800ctgtggggct cctcccaggc aaagttagtc tgcagaatta aggaggatta caagtgggaa1860tttgaagagc ttttgaaatc ctgtggtgag ctgtttgatt ctttgaatct gggtcaccag1920gcgcttttcc aagagaaggt catcaagact ttggattttt ccacaccggg gcgcgctgcg1980gctgctgttg cttttttgag ttttataaag gataaatgga gcgaagaaac ccatctgagc2040ggggggtacc tgctggattt tctggccatg catctgtgga gagcggtggt gagacacaag2100aatcgcctgc tactgttgtc ttccgtccgc ccggcaataa taccgacgga ggagcaacag2160caggaggaag ccaggcggcg gcggcggcag gagcagagcc catggaaccc gagagccggc2220ctggaccctc gggaatgaat gttgtacagg tggctgaact gtttccagaa ctgagacgca2280ttttaaccat taacgaggat gggcaggggc taaagggggt aaagagggag cggggggctt2340ctgaggctac agaggaggct aggaatctaa cttttagctt aatgaccaga caccgtcctg2400agtgtgttac ttttcagcag attaaggata attgcgctaa tgagcttgat ctgctggcgc2460agaagtattc catagagcag ctgaccactt actggctgca gccaggggat gattttgagg2520aggctattag ggtatatgca aaggtggcac ttaggccaga ttgcaagtac aagattagca2580aacttgtaaa tatcaggaat tgttgctaca tttctgggaa cggggccgag gtggagatag2640atacggagga tagggtggcc tttagatgta gcatgataaa tatgtggccg ggggtgcttg2700gcatggacgg ggtggttatt atgaatgtga ggtttactgg tcccaatttt agcggtacgg2760ttttcctggc caataccaat cttatcctac acggtgtaag cttctatggg tttaacaata2820cctgtgtgga agcctggacc gatgtaaggg ttcggggctg tgccttttac tgctgctgga2880agggggtggt gtgtcgcccc aaaagcaggg cttcaattaa gaaatgcctg tttgaaaggt2940gtaccttggg tatcctgtct gagggtaact ccagggtgcg ccacaatgtg gcctccgact3000gtggttgctt catgctagtg aaaagcgtgg ctgtgattaa gcataacatg gtgtgtggca3060actgcgagga cagggcctct cagatgctga cctgctcgga cggcaactgt cacttgctga3120agaccattca cgtagccagc cactctcgca aggcctggcc agtgtttgag cacaacatac3180tgacccgctg ttccttgcat ttgggtaaca ggaggggggt gttcctacct taccaatgca3240atttgagtca cactaagata ttgcttgagc ccgagagcat gtccaaggtg aacctgaacg3300gggtgtttga catgaccatg aagatctgga aggtgctgag gtacgatgag acccgcacca3360ggtgcagacc ctgcgagtgt ggcggtaaac atattaggaa ccagcctgtg atgctggatg3420
tgaccgagga gctgaggccc gatcacttgg tgctggcctg cacccgcgct gagtttggct3480ctagcgatga agatacagat tgaggtactg aaatgtgtgg gcgtggctta agggtgggaa3540agaatatata aggtgggggt ctcatgtagt tttgtatctg ttttgcagca gccgccgcca3600tgagcgccaa ctcgtttgat ggaagcattg tgagctcata tttgacaacg cgcatgcccc3660catgggccgg ggtgcgtcag aatgtgatgg gctccagcat tgatggtcgc cccgtcctgc3720ccgcaaactc tactaccttg acctacgaga ccgtgtctgg aacgccgttg gagactgcag3780cctccgccgc cgcttcagcc gctgcagcca ccgcccgcgg gattgtgact gactttgctt3840tcctgagccc gcttgcaagc agtgcagctt cccgttcatc cgcccgcgat gacaagttga3900cggctctttt ggcacaattg gattctttga cccgggaact taatgtcgtt tctcagcagc3960tgttggatct gcgccagcag gtttctgccc tgaaggcttc ctcccctccc aatgcggttt4020aaaacataaa taaaaaccag actctgtttg gattttgatc aagcaagtgt cttgctgtct4080ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt cgttgagggt4140cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat acatgggcat4200aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg gggtggtgtt4260gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt ctttcagtag4320caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt taagctggga4380tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt tggctatgtt4440cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag tgtatccggt4500gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact tggagacgcc4560cttgtgacct ccgagatttt ccatgcattc gtccataatg atggcaatgg gcccacgggc4620ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt ccaggatgag4680atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg gtataatggt4740tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg ctttgagttc4800agatgggggg atcatgtcta cctgcggggc gatgaagaaa accgtttccg gggtagggga4860gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc cggtgggccc4920gtaaatcaca cctattaccg gctgcaactg gtagttaaga gagctgcagc tgccgtcatc4980cctgagcagg ggggccactt cgttaagcat gtccctgact tgcatgtttt ccctgaccaa5040atgcgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag caaagttttt5100caacggtttg aggccgtccg ccgtaggcat gcttttgagc gtttgaccaa gcagttccag5160gcggtcccac agctcggtca cgtgctctac ggcatctcga tccagcatat ctcctcgttt5220cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag acgggccagg5280gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac ggtgaagggg5340tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct ggtgctgaag5400cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt gtcatagtcc5460agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc gccgcacgag5520gggcagtgca gacttttaag ggcgtagagc ttgggcgcga gaaataccga ttccggggag5580taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca ggtgagctct5640ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt cttacctctg5700gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc cccgtataca5760gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag aaactcggac5820cactctgaga cgaaggctcg cgtccaggcc agcacgaagg aggctaagtg ggaggggtag5880cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat gtcgccctct5940tcggcatcaa ggaaggtgat tggtttatag gtgtaggcca cgtgaccggg tgttcctgaa6000ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc atcgctgtct6060
gcgagggcca gctgttgggg tgagtactcc ctctcaaaag cgggcatgac ttctgcgcta6120agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc ggtgatgcct6180ttgagggtgg ccgcgtccat ctggtcagaa aagacaatct ttttgttgtc aagcttggtg6240gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag ggtttggttt6300ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc gcgcgcaacg6360caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac gcgccaaccg6420cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag gcgctcgttg6480gtccagcaga ggcggccgcc cttgcgcgaa cagaatggcg gtagtgggtc tagctgcgtc6540tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc gtcgaagtag6600tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc aagcgcgcgc6660tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga ggcgtacatg6720ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt agggtagcat6780cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg agcgaggagg6840tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg cctgaagatg6900gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc gtctgtgaga6960cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac cagctcggcg7020gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc atacttatcc7080tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc tttccagtac7140tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta gaactggttg7200acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg cgcggccttc7260cggagcgagg tgtgggtgag cgcaaaggtg tccctaacca tgactttgag gtactggtat7320ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt gcgctttttg7380gaacgcgggt ttggcagggc gaaggtgaca tcgttgaaaa gtatctttcc cgcgcgaggc7440ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt aattacctgg7500gcggcgagca cgatctcgtc gaagccgttg atgttgtggc ccacgatgta aagttccaag7560aagcgcgggg tgcccttgat ggagggcaat tttttaagtt cctcgtaggt gagctcctca7620ggggagctga gcccgtgttc tgacagggcc cagtctgcaa gatgagggtt ggaagcgacg7680aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa ggtcctaaac7740tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg gtcttgttcc7800cagcggtccc atccaaggtc cacggctagg tctcgcgcgg cggtcaccag aggctcatct7860ccgccgaact tcataaccag catgaagggc acgagctgct tcccaaaggc ccccatccaa7920gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg cgagccgatc7980gggaagaact ggatctcccg ccaccagttg gaggagtggc tgttgatgtg gtgaaagtag8040aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc gcagtactgg8100cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg cacaaggaag8160cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc tacttcggct8220gcttgtcctt gaccgtctgg ctgctcgagg ggagttatgg tggatcggac caccacgccg8280cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac aacatcgcgc8340agatgggagc tgtccatggt ctggagctcc cgcggcgaca ggtcaggcgg gagctcctgc8400aggtttacct cgcatagccg ggtcagggcg cgggctaggt ccaggtgata cctgatttcc8460aggggctggt tggtggcggc gtcgatgact tgcaagaggc cgcatccccg cggcgcgact8520acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc atctaaaagc8580ggtgacgcgg gcgggccccc ggaggtaggg ggggctcggg acccgccggg agagggggca8640ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcggagg ttgctggcga8700
acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag acgacgggcc 8760cggtgagctt gaacctgaaa gagagttcga cagaatcaat ttcggtgtcg ttgacggcgg 8820cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatt tcggccatga 8880actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg gtggcggcga 8940ggtcgttgga gatgcgggcc atgagctgcg agaaggcgtt gaggcctccc tcgttccaga 9000cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc tgcgcgagat 9060tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag aggtagttga 9120gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc aacgtggatt 9180cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc acggcgaagt 9240tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga cggatgagct 9300cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct tcttcaatct 9360cctcttccat aagggcctcc ccttcttctt cttcttctgg cggcggtggg ggagggggga 9420cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc atctccccgc 9480ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc agttggaaga 9540cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccgtgcggc agggatacgg 9600cgctaacgat gcatctcaac aattgttgtg taggtactcc gccaccgagg gacctgagcg 9660agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag tcacagtcgc 9720aaggtaggct gagcaccgtg gcgggcggca gcgggtggcg gtcggggttg tttctggcgg 9780aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg gtcgacagaa 9840gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg ccccaggctt 9900cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct accggcactt 9960cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctacggcg gcggcggagt10020ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc ctcatcggct10080gaagcagggc caggtcggcg acaacgcgct cggctaatat ggcctgctgc acctgcgtga10140gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg ttgatggtgt10200aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc gagagctcgg10260tgtacctgag acgcgagtaa gcccttgagt caaagacgta gtcgttgcaa gtccgcacca10320ggtactgata tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc cagcgtaggg10380tggccggggc tccgggggcg aggtcttcca acataaggcg atgatatccg tagatgtacc10440tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg cggacgcggt10500tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg ccggtgaggc10560gtgcgcagtc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg ggcactcttc10620cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt tcgaaccccg10680gatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc caggtgtgcg10740acgtcagaca acgggggagc gctccttttg gcttccttcc aggcgcggcg gctgctgcgc10800tagctttttt ggccactggc cgcgcgcggc gtaagcggtt aggctggaaa gcgaaagcat10860taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc gcaggacccc10920cggttcgagt ctcgggccgg ccggactgcg gcgaacgggg gtttgcctcc ccgtcatgca10980agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc ttttcccaga11040tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag caagagcagc11100ggcagacatg cagggcaccc tccccttctc ctaccgcgtc aggaggggca acatccgcgg11160ctgacgcggc ggcagatggt gattacgaac ccccgcggcg ccgggcccgg cactacctgg11220acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag cgacacccaa11280gggtgcagct gaagcgtgac acgcgcgagg cgtacgtgcc gcggcagaac ctgtttcgcg11340
accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca gggcgcgagt11400tgcggcatgg cctgaaccgc gagcggttgc tgcgcgagga ggactttgag cccgacgcgc11460ggaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta accgcgtacg11520agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac gtgcgcacgc11580ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt gtaagcgcgc11640tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata gtgcagcaca11700gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc gagggccgct11760ggctgctcga tttgataaac attctgcaga gcatagtggt gcaggagcgc agcttgagcc11820tggctgacaa ggtggccgcc attaactatt ccatgctcag tctgggcaag ttttacgccc11880gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc gaggggttct11940acatgcgcat ggcgttgaag gtgcttacct tgagcgacga cctgggcgtt tatcgcaacg12000agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac cgcgagctga12060tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag gccgagtcct12120actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg gaggcagctg12180gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc ggcgtggagg12240aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg gtgatgtttc12300tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc agagccagcc12360gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca tgtcgctgac12420tgcgcgtaac cctgacgcgt tccggcagca gccgcaggcc aaccggctct ccgcaattct12480ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg cgatcgtaaa12540cgcgctggcc gaaaacaggg ccatccggcc cgatgaggcc ggcctggtct acgacgcgct12600gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg accggctggt12660gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg gcaacctggg12720ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc cgcggggaca12780ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga caccgcaaag12840tgaggtgtac cagtccgggc cagactattt tttccagacc agtagacaag gcctgcagac12900cgtaaacctg agccaggctt tcaagaactt gcaggggctg tggggggtgc gggctcccac12960aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt tgctgctgct13020aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag gtcacttgct13080gacactgtac cgcgaggcca taggtcaggc gcatgtgggc gagcatactt tccaggagat13140tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg caaccctgaa13200ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa acagcgagga13260ggagcgcatc ttgcgctatg tgcagcagag cgtgagcctt aacctgatgc gcgacggggt13320aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca tgtatgcctc13380aaaccggccg tttatcaatc gcctaatgga ctacttgcat cgcgcggccg ccgtgaaccc13440cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg gtttctacac13500cgggggattt gaggtgcccg agggtaacga tggattcctc tgggacgaca tagacgacag13560cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc aggcagaggc13620ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag gcgctgcggc13680cccgcggtca gatgcgagta gcccatttcc aagcttgata gggtctttta ccagcactcg13740caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc tgctgcagcc13800gcagcgcgaa aagaacctgc ctccggcatt tcccaacaac gggatagaga gcctagtgga13860caagatgagt agatggaaga cgtatgcgca ggagcacagg gatgtgcccg gcccgcgccc13920gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg acgatgactc13980
ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg cgcaccttcg14040ccccaggctg gggagaatgt tttaaaaaaa aaaaaaaaaa gcatgatgca aaataaaaaa14100ctcaccaagg ccatggcacc gagcgttggt tttcttgtat tccccttagt atgcagcgcg14160cggcgatgta tgaggaaggt cctcctccct cctacgagag cgtggtgagc gcggcgccag14220tggcggcggc gctgggttcc cccttcgatg ctcccctgga cccgccgttt gtgcctccgc14280ggtacctgcg gcctaccggg gggagaaaca gcatccgtta ctctgagttg gcacccctat14340tcgacaccac ccgtgtgtac cttgtggaca acaagtcaac ggatgtggca tccctgaact14400accagaacga ccacagcaac tttctaacca cggtcattca aaacaatgac tacagcccgg14460gggaggcaag cacacagacc atcaatcttg acgaccgttc gcactggggc ggcgacctga14520aaaccatcct gcataccaac atgccaaatg tgaacgagtt catgtttacc aataagttta14580aggcgcgggt gatggtgtcg cgctcgctta ctaaggacaa acaggtggag ctgaaatatg14640agtgggtgga gttcacgctg cccgagggca actactccga gaccatgacc atagacctta14700tgaacaacgc gatcgtggag cactacttga aagtgggcag gcagaacggg gttctggaaa14760gcgacatcgg ggtaaagttt gacacccgca acttcagact ggggtttgac ccagtcactg14820gtcttgtcat gcctggggta tatacaaacg aagccttcca tccagacatc attttgctgc14880caggatgcgg ggtggacttc acccacagcc gcctgagcaa cttgttgggc atccgcaagc14940ggcaaccctt ccaggagggc tttaggatca cctacgatga cctggagggt ggtaacattc15000ccgcactgtt ggatgtggac gcctaccagg caagcttaaa agatgacacc gaacagggcg15060gggatggcgc aggcggcggc aacaacagtg gcagcggcgc ggaagagaac tccaacgcgg15120cagccgcggc aatgcagccg gtggaggaca tgaacgatca tgccattcgc ggcgacacct15180ttgccacacg ggcggaggag aagcgcgctg aggccgaggc agcggcagaa gctgccgccc15240ccgctgcgca acccgaggtc gagaagcctc agaagaaacc ggtgatcaaa cccctgacag15300aggacagcaa gaaacgcagt tacaacctaa taagcaatga cagcaccttc acccagtacc15360gcagctggta ccttgcatac aactacggcg accctcagac cgggatccgc tcatggaccc15420tcctttgcac tcctgacgta acctgcggct cggagcaggt ctactggtcg ttgccagaca15480tgatgcaaga ccccgtgacc ttccgctcca cgagccagat cagcaacttt ccggtggtgg15540gcgccgagct gttgcccgtg cactccaaga gcttctacaa cgaccaggcc gtctactccc15600agctcatccg ccagtttacc tctctgaccc acgtgttcaa tcgctttccc gagaaccaga15660ttttggcgcg cccgccagcc cccaccatca ccaccgtcag tgaaaacgtt cctgctctca15720cagatcacgg gacgctaccg ctgcgcaaca gcatcggagg agtccagcga gtgaccatta15780ctgacgccag acgccgcacc tgcccctacg tttacaaggc cctgggcata gtctcgccgc15840gcgtcctatc gagccgcact ttttgagcaa acatgtccat ccttatatcg cccagcaata15900acacaggctg gggcctgcgc ttcccaagca agatgtttgg cggggcaaag aagcgctccg15960accaacaccc agtgcgcgtg cgcgggcact accgcgcgcc ctggggcgcg cacaaacgcg16020gccgcactgg gcgcaccacc gtcgatgacg ccattgacgc ggtggtggag gaggcgcgca16080actacacgcc cacgccgcca ccagtgtcca cagtggacgc ggccattcag accgtggtgc16140gcggagcccg gcgttatgct aaaatgaaga gacggcggag gcgcgtagca cgtcgccacc16200gccgccgacc cggcactgcc gcccaacgcg cggcggcggc cctgcttaac cgcgcacgtc16260gcaccggccg acgggcggcc atgcgggccg ctcgaaggct ggccgcgggt attgtcactg16320tgccccccag gtccaggcga cgagcggccg ccgcagcagc cgcggccatt agtgctatga16380ctcagggtcg caggggcaac gtgtactggg tgcgcgactc ggttagcggc ctgcgcgtgc16440ccgtgcgcac ccgccccccg cgcaactaga ttgcaagaaa aaactactta gactcgtact16500gttgtatgta tccagcggcg gcggcgcgca acgaagctat gtccaagcgc aaaatcaaag16560aagagatgct ccaggtcatc gcgccggaga tctatggccc cccgaagaag gaagagcagg16620
attacaagcc ccgaaagcta aagcgggtca aaaagaaaaa gaaagatgat gatgatgatg16680aacttgacga cgaggtggaa ctgctgcacg caaccgcgcc caggcggcgg gtacagtgga16740aaggtcgacg cgtaagacgt gttttgcgac ccggcaccac cgtagttttt acgcccggtg16800agcgctccac ccgcacctac aagcgcgtgt atgatgaggt gtacggcgac gaggacctgc16860ttgagcaggc caacgagcgc ctcggggagt ttgcctacgg aaagcggcat aaggacatgt16920tggcgttgcc gctggacgag ggcaacccaa cacctagcct aaagcccgtg acactgcagc16980aggtgctgcc cacgcttgca ccgtccgaag aaaagcgcgg cctaaagcgc gagtctggtg17040acttggcacc caccgtgcag ctgatggtac ccaagcgcca gcgactggaa gatgtcttgg17100aaaaaatgac cgtggagcct gggctggagc ccgaggtccg cgtgcggcca atcaagcagg17160tggcaccggg actgggcgtg cagaccgtgg acgttcagat acccaccacc agtagcacta17220gtattgccac tgccacagag ggcatggaga cacaaacgtc cccggttgcc tcggcggtgg17280cagatgccgc ggtgcaggcg gccgctgcgg ccgcgtccaa aacctctacg gaggtgcaaa17340cggacccgtg gatgtttcgc gtttcagccc cccggcgccc gcgccgttcc aggaagtacg17400gcaccgccag cgcactactg cccgaatatg ccctacatcc ttccatcgcg cctacccccg17460gctatcgtgg ctacacctac cgccccagaa gacgagcgac tacccgacgc cgaaccacca17520ctggaacccg ccgccgccgt cgccgtcgcc agcccgtgct ggccccgatt tccgtgcgca17580gggtggctcg cgaaggaggc aggaccctgg tgctgccaac agcgcgctac caccccagca17640tcgtttaaaa gccggtcttt gtggttcttg cagatatggc cctcacctgc cgcctccgtt17700tcccggtgcc gggattccga ggaagaatgc accgtaggag gggcatggcc ggccacggcc17760tgacgggcgg catgcgtcgt gcgcaccacc ggcggcggcg cgcgtcgcac cgtcgcatgc17820gcggcggtat cctgcccctc cttattccac tgatcgccgc ggcgattggc gccgtgcccg17880gaattgcatc cgtggccttg caggcgcaga gacactgatt aaaaacaagt tgcatgtgga17940aaaatcaaaa taaaaagtct ggagtctcac gctcgcttgg tcctgtaact attttgtaga18000atggaagaca tcaactttgc gtctctggcc ccgcgacacg gctcgcgccc gttcatggga18060aactggcaag atatcggcac cagcaatatg agcggtggcg ccttcagctg gggctcgctg18120tggagcggca ttaaaaattt cggttccacc attaagaact atggcagcaa ggcctggaac18180agcagcacag gccagatgct gagggacaag ttgaaagagc aaaatttcca acaaaaggtg18240gtagatggcc tggcctctgg cattagcggg gtggtggacc tggccaacca ggcagtgcaa18300aataagatta acagtaagct tgatccccgc cctcccgtag aggagcctcc accggccgtg18360gagacagtgt ctccagaggg gcgtggcgaa aagcgtccgc ggcccgacag ggaagaaact18420ctggtgacgc aaatagatga gcctccctcg tacgaggagg cactaaagca aggcctgccc18480accacccgtc ccatcgcgcc catggctacc ggagtgctgg gccagcacac acctgtaacg18540ctggacctgc ctccccccgc tgacacccag cagaaacctg tgctgccagg gccgtccgcc18600gttgttgtaa cccgccctag ccgcgcgtcc ctgcgccgtg ccgccagcgg tccgcgatcg18660atgcggcccg tagccagtgg caactggcaa agcacactga acagcatcgt gggtctgggg18720gtgcaatccc tgaagcgccg acgatgcttc taaatagcta acgtgtcgta tgtgtcatgt18780atgcgtccat gtcgccgcca gaggagctgc tgagccgccg tgcgcccgct ttccaagatg18840gctacccctt cgatgatgcc gcagtggtct tacatgcaca tctcgggcca ggacgcctcg18900gagtacctga gccccgggct ggtgcagttt gcccgcgcca ccgagacgta cttcagcctg18960aataacaagt ttagaaaccc cacggtggca cctacgcacg acgtaaccac agaccggtcc19020cagcgtttga cgctgcggtt catccctgtg gaccgcgagg ataccgcgta ctcgtacaaa19080gcgcggttca ccctggctgt gggtgacaac cgtgtgcttg atatggcttc cacgtacttt19140gacatccgcg gcgtgctgga cagggggcct acttttaagc cctactccgg cactgcctac19200aacgctctag ctcccaaggg cgctcctaac tcctgtgagt gggaacaaac cgaagatagc19260
ggccgggcag ttgccgagga tgaagaagag gaagatgaag atgaagaaga ggaagaagaa19320gagcaaaacg ctcgagatca ggctactaag aaaacacatg tctatgccca ggctcctttg19380tctggagaaa caattacaaa aagcgggcta caaataggat cagacaatgc agaaacacaa19440gctaaacctg tatacgcaga tccttcctat caaccagaac ctcaaattgg cgaatctcag19500tggaacgaag ctgatgctaa tgcggcagga gggagagtgc ttaaaaaaac aactcccatg19560aaaccatgct atggatctta tgccaggcct acaaatcctt ttggtggtca atccgttctg19620gttccggatg aaaaaggggt gcctcttcca aaggttgact tgcaattctt ctcaaatact19680acctctttga acgaccggca aggcaatgct actaaaccaa aagtggtttt gtacagtgaa19740gatgtaaata tggaaacccc agacacacat ctgtcttaca aacctggaaa aggtgatgaa19800aattctaaag ctatgttggg tcaacaatct atgccaaaca gacccaatta cattgctttc19860agggacaatt ttattggcct aatgtattat aacagcactg gcaacatggg tgttcttgct19920ggtcaggcat cgcagctaaa tgccgtggta gatttgcaag acagaaacac agagctgtcc19980tatcaactct tgcttgattc cataggtgat agaaccagat atttttctat gtggaatcag20040gctgtagaca gctatgatcc agatgttaga atcattgaaa accatggaac tgaggatgaa20100ttgccaaatt attgttttcc tcttgggggt attggggtaa ctgacaccta tcaagctatt20160aaggctaatg gcaatggctc aggcgataat ggagatacta catggacaaa agatgaaact20220tttgcaacac gtaatgaaat aggagtgggt aacaactttg ccatggaaat taacctaaat20280gccaacctat ggagaaattt cctttactcc aatattgcgc tgtacctgcc agacaagcta20340aaatacaacc ccaccaatgt ggaaatatct gacaacccca acacctacga ctacatgaac20400aagcgagtgg tggctcccgg gcttgtagac tgctacatta accttggggc gcgctggtct20460ctggactaca tggacaacgt taatcccttt aaccaccacc gcaatgcggg cctccgttat20520cgctccatgt tgttgggaaa cggccgctac gtgccctttc acattcaggt gccccaaaag20580ttttttgcca ttaaaaacct cctcctcctg ccaggctcat atacatatga atggaacttc20640aggaaggatg ttaacatggt tctgcagagc tctctgggaa acgatcttag agttgacggg20700gctagcatta agtttgacag catttgtctt tacgccacct tcttccccat ggcccacaac20760acggcctcca cgctggaagc catgctcaga aatgacacca acgaccagtc ctttaatgac20820tacctttccg ccgccaacat gctatacccc atacccgcca acgccaccaa cgtgcccatc20880tccatcccat cgcgcaactg ggcagcattt cgcggttggg ccttcacacg cttgaagaca20940aaggaaaccc cttccctggg atcaggctac gacccttact acacctactc tggctccata21000ccataccttg acggaacctt ctatcttaat cacaccttta agaaggtggc cattaccttt21060gactcttctg ttagctggcc gggcaacgac cgcctgctta ctcccaatga gtttgagatt21120aaacgctcag ttgacgggga gggctacaac gtagctcagt gcaacatgac caaggactgg21180ttcctggtgc agatgttggc caactacaat attggctacc agggcttcta cattccagaa21240agctacaagg accgcatgta ctcgttcttc agaaacttcc agcccatgag ccggcaagtg21300gttgacgata ctaaatacaa ggagtatcag caggttggaa ttcttcacca gcataacaac21360tcaggattcg taggctacct cgctcccacc atgcgcgagg gacaggctta ccccgccaac21420gtgccctacc cactaatagg caaaaccgcg gttgacagta ttacccagaa aaagtttctt21480tgcgatcgca ccctttggcg catcccattc tccagtaact ttatgtccat gggcgcactc21540acagacctgg gccaaaacct tctctacgcc aactccgccc acgcgctaga catgactttt21600gaggtggatc ccatggacga gcccaccctt ctttatgttt tgtttgaagt ctttgacgtg21660gtccgtgtgc accagccgca ccgcggcgtc atcgagaccg tgtacctgcg cacgcccttc21720tcggccggca acgccacaac ataaaagaag caagcaacat caacaacagc tgccgccatg21780ggctccagtg agcaggaact gaaagccatt gtcaaagatc ttggttgtgg gccatatttt21840ttgggcacct atgacaagcg ctttccaggc tttgtttctc cacacaagct cgcctgcgcc21900
atagtcaata cggccggtcg cgagactggg ggcgtacact ggatggcctt tgcctggaac21960ccgcgctcaa aaacatgcta cctctttgag ccctttggct tttctgacca acgactcaag22020caggtttacc agtttgagta cgagtcactc ctgcgccgta gcgccattgc ttcttccccc22080gaccgctgta taacgctgga aaagtccacc caaagcgtgc aggggcccaa ctcggccgcc22140tgtggactat tctgctgcat gtttctccac gcctttgcca actggcccca aactcccatg22200gatcacaacc ccaccatgaa ccttattacc ggggtaccca actccatgct taacagtccc22260caggtacagc ccaccctgcg tcgcaaccag gaacagctct acagcttcct ggagcgccac22320tcgccctact tccgcagcca cagtgcgcag attaggagcg ccacttcttt ttgtcacttg22380aaaaacatgt aaaaataatg tactaggaga cactttcaat aaaggcaaat gtttttattt22440gtacactctc gggtgattat ttacccccca cccttgccgt ctgcgccgtt taaaaatcaa22500aggggttctg ccgcgcatcg ctatgcgcca ctggcaggga cacgttgcga tactggtgtt22560tagtgctcca cttaaactca ggcacaacca tccgcggcag ctcggtgaag ttttcactcc22620acaggctgcg caccatcacc aacgcgttta gcaggtcggg cgccgatatc ttgaagtcgc22680agttggggcc tccgccctgc gcgcgcgagt tgcgatacac agggttgcag cactggaaca22740ctatcagcgc cgggtggtgc acgctggcca gcacgctctt gtcggagatc agatccgcgt22800ccaggtcctc cgcgttgctc agggcgaacg gagtcaactt tggtagctgc cttcccaaaa22860agggtgcatg cccaggcttt gagttgcact cgcaccgtag tggcatcaga aggtgaccgt22920gcccggtctg ggcgttagga tacagcgcct gcatgaaagc cttgatctgc ttaaaagcca22980cctgagcctt tgcgccttca gagaagaaca tgccgcaaga cttgccggaa aactgattgg23040ccggacaggc cgcgtcatgc acgcagcacc ttgcgtcggt gttggagatc tgcaccacat23100ttcggcccca ccggttcttc acgatcttgg ccttgctaga ctgctccttc agcgcgcgct23160gcccgttttc gctcgtcaca tccatttcaa tcacgtgctc cttatttatc ataatgctcc23220cgtgtagaca cttaagctcg ccttcgatct cagcgcagcg gtgcagccac aacgcgcagc23280ccgtgggctc gtggtgcttg taggttacct ctgcaaacga ctgcaggtac gcctgcagga23340atcgccccat catcgtcaca aaggtcttgt tgctggtgaa ggtcagctgc aacccgcggt23400gctcctcgtt tagccaggtc ttgcatacgg ccgccagagc ttccacttgg tcaggcagta23460gcttgaagtt tgcctttaga tcgttatcca cgtggtactt gtccatcaac gcgcgcgcag23520cctccatgcc cttctcccac gcagacacga tcggcaggct cagcgggttt atcaccgtgc23580tttcactttc cgcttcactg gactcttcct tttcctcttg cgtccgcata ccccgcgcca23640ctgggtcgtc ttcattcagc cgccgcaccg tgcgcttacc tcccttgccg tgcttgatta23700gcaccggtgg gttgctgaaa cccaccattt gtagcgccac atcttctctt tcttcctcgc23760tgtccacgat cacctctggg gatggcgggc gctcgggctt gggagagggg cgcttctttt23820tctttttgga cgcaatggcc aaatccgccg tcgaggtcga tggccgcggg ctgggtgtgc23880gcggcaccag cgcatcttgt gacgagtctt cttcgtcctc ggactcgaga cgccgcctca23940gccgcttttt tgggggcgcg cggggaggcg gcggcgacgg cgacggggac gacacgtcct24000ccatggttgg tggacgtcgc gccgcaccgc gtccgcgctc gggggtggtt tcgcgctgct24060cctcttcccg actggccatt tccttctcct ataggcagaa aaagatcatg gagtcagtcg24120agaaggagga cagcctaacc gccccctttg agttcgccac caccgcctcc accgatgccg24180ccaacgcgcc taccaccttc cccgtcgagg cacccccgct tgaggaggag gaagtgatta24240tcgagcagga cccaggtttt gtaagcgaag acgacgagga tcgctcagta ccaacagagg24300ataaaaagca agaccaggac gacgcagagg caaacgagga acaagtcggg cggggggacc24360aaaggcatgg cgactaccta gatgtgggag acgacgtgct gttgaagcat ctgcagcgcc24420agtgcgccat tatctgcgac gcgttgcaag agcgcagcga tgtgcccctc gccatagcgg24480atgtcagcct tgcctacgaa cgccacctgt tctcaccgcg cgtacccccc aaacgccaag24540
aaaacggcac atgcgagccc aacccgcgcc tcaacttcta ccccgtattt gccgtgccag24600aggtgcttgc cacctatcac atctttttcc aaaactgcaa gataccccta tcctgccgtg24660ccaaccgcag ccgagcggac aagcagctgg ccttgcggca gggcgctgtc atacctgata24720tcgcctcgct cgacgaagtg ccaaaaatct ttgagggtct tggacgcgac gagaaacgcg24780cggcaaacgc tctgcaacaa gaaaacagcg aaaatgaaag tcactgtgga gtgctggtgg24840aacttgaggg tgacaacgcg cgcctagccg tgctgaaacg cagcatcgag gtcacccact24900ttgcctaccc ggcacttaac ctacccccca aggttatgag cacagtcatg agcgagctga24960tcgtgcgccg tgcacgaccc ctggagaggg atgcaaactt gcaagaacaa accgaggagg25020gcctacccgc agttggcgat gagcagctgg cgcgctggct tgagacgcgc gagcctgccg25080acttggagga gcgacgcaag ctaatgatgg ccgcagtgct tgttaccgtg gagcttgagt25140gcatgcagcg gttctttgct gacccggaga tgcagcgcaa gctagaggaa acgttgcact25200acacctttcg ccagggctac gtgcgccagg cctgcaaaat ttccaacgtg gagctctgca25260acctggtctc ctaccttgga attttgcacg aaaaccgcct cgggcaaaac gtgcttcatt25320ccacgctcaa gggcgaggcg cgccgcgact acgtccgcga ctgcgtttac ttatttctgt25380gctacacctg gcaaacggcc atgggcgtgt ggcagcaatg cctggaggag cgcaacctaa25440aggagctgca gaagctgcta aagcaaaact tgaaggacct atggacggcc ttcaacgagc25500gctccgtggc cgcgcacctg gcggacatta tcttccccga acgcctgctt aaaaccctgc25560aacagggtct gccagacttc accagtcaaa gcatgttgca aaactttagg aactttatcc25620tagagcgttc aggaattctg cccgccacct gctgtgcgct tcctagcgac tttgtgccca25680ttaagtaccg tgaatgccct ccgccgcttt ggggtcactg ctaccttctg cagctagcca25740actaccttgc ctaccactcc gacatcatgg aagacgtgag cggtgacggc ctactggagt25800gtcactgtcg ctgcaaccta tgcaccccgc accgctccct ggtctgcaat tcgcaactgc25860ttagcgaaag tcaaattatc ggtacctttg agctgcaggg tccctcgcct gacgaaaagt25920ccgcggctcc ggggttgaaa ctcactccgg ggctgtggac gtcggcttac cttcgcaaat25980ttgtacctga ggactaccac gcccacgaga ttaggttcta cgaagaccaa tcccgcccgc26040caaatgcgga gcttaccgcc tgcgtcatta cccagggcca catccttggc caattgcaag26100ccatcaacaa agcccgccaa gagtttctgc tacgaaaggg acggggggtt tacctggacc26160cccagtccgg cgaggagctc aacccaatcc ccccgccgcc gcagccctat cagcagccgc26220gggcccttgc ttcccaggat ggcacccaaa aagaagctgc agctgccgcc gccgccaccc26280acggacgagg aggaatactg ggacagtcag gcagaggagg ttttggacga ggaggaggag26340atgatggaag actgggacag cctagacgaa gcttccgagg ccgaagaggt gtcagacgaa26400acaccgtcac cctcggtcgc attcccctcg ccggcgcccc agaaattggc aaccgttccc26460agcatcgcta caacctccgc tcctcaggcg ccgccggcac tgcctgttcg ccgacccaac26520cgtagatggg acaccactgg aaccagggcc ggtaagtcta agcagccgcc gccgttagcc26580caagagcaac aacagcgcca aggctaccgc tcgtggcgcg ggcacaagaa cgccatagtt26640gcttgcttgc aagactgtgg gggcaacatc tccttcgccc gccgctttct tctctaccat26700cacggcgtgg ccttcccccg taacatcctg cattactacc gtcatctcta cagcccctac26760tgcaccggcg gcagcggcag cggcagcaac agcagcggtc acacagaagc aaaggcgacc26820ggatagcaag actctgacaa agcccaagaa atccacagcg gcggcagcag caggaggagg26880agcgctgcgt ctggcgccca acgaacccgt atcgacccgc gagcttagaa ataggatttt26940tcccactctg tatgctatat ttcaacaaag caggggccaa gaacaagagc tgaaaataaa27000aaacaggtct ctgcgctccc tcacccgcag ctgcctgtat cacaaaagcg aagatcagct27060tcggcgcacg ctggaagacg cggaggctct cttcagcaaa tactgcgcgc tgactcttaa27120ggactagttt cgcgcccttt ctcaaattta agcgcgaaaa ctacgtcatc tccagcggcc27180
acacccggcg ccagcacctg tcgtcagcgc cattatgagc aaggaaattc ccacgcccta27240catgtggagt taccagccac aaatgggact tgcggctgga gctgcccaag actactcaac27300ccgaataaac tacatgagcg cgggacccca catgatatcc cgggtcaacg gaatccgcgc27360ccaccgaaac cgaattctcc tcgaacaggc ggctattacc accacacctc gtaataacct27420taatccccgt agttggcccg ctgccctggt gtaccaggaa agtcccgctc ccaccactgt27480ggtacttccc agagacgccc aggccgaagt tcagatgact aactcagggg cgcagcttgc27540gggcggcttt cgtcacaggg tgcggtcgcc cgggcagggt ataactcacc tgaaaatcag27600agggcgaggt attcagctca acgacgagtc ggtgagctcc tctcttggtc tccgtccgga27660cgggacattt cagatcggcg gcgctggccg ctcttcattt acgccccgtc aggcgatcct27720aactctgcag acctcgtcct cggagccgcg ctccggaggc attggaactc tacaatttat27780tgaggagttc gtgccttcgg tttacttcaa ccccttttct ggacctcccg gccactaccc27840ggaccagttt attcccaact ttgacgcggt gaaagactcg gcggacggct acgactgaat27900gaccagtgga gaggcagagc gactgcgcct gacacacctc gaccactgcc gccgccacaa27960gtgctttgcc cgcggctccg gtgagttttg ttactttgaa ttgcccgaag agcatatcga28020gggcccggcg cacggcgtcc ggctcaccac ccaggtagag cttacacgta gcctgattcg28080ggagtttacc aagcgccccc tgctagtgga gcgggagcgg ggtccctgtg ttctgaccgt28140ggtttgcaac tgtcctaacc ctggattaca tcaagatctt tgttgtcatc tctgtgctga28200gtataataaa tacagaaatt agaatctact ggggctcctg tcgccatcct gtgaacgcca28260ccgtttttac ccacccaaag cagaccaaag caaacctcac ctccggtttg cacaagcggg28320ccaataagta ccttacctgg tactttaacg gctcttcatt tgtaatttac aacagtttcc28380agcgagacga agtaagtttg ccacacaacc ttctcggctt caactacacc gtcaagaaaa28440acaccaccac caccaccctc ctcacctgcc gggaacgtac gagtgcgtca ccggttgctg28500cgcccacacc tacagcctga gcgtaaccag acattactcc catttttcca aaacaggagg28560tgagctcaac tcccggaact caggtcaaaa aagcattttg cggggtgctg ggatttttta28620attaagtata tgagcaattc aagtaactct acaagcttgt ctaatttttc tggaattggg28680gtcggggtta tccttactct tgtaattctg tttattctta tactagcact tctgtgcctt28740agggttgccg cctgctgcac gcacgtttgt acctattgtc agctttttaa acgctggggg28800caacatccaa gatgaggtac atgattttag gcttgctcgc ccttgcggca gtctgcagcg28860ctgccaaaaa ggttgagttt aaggaaccag cttgcaatgt tacatttaaa tcagaagcta28920atgaatgcac tactcttata aaatgcacca cagaacatga aaagcttatt attcgccaca28980aagacaaaat tggcaagtat gctgtatatg ctatttggca gccaggtgac actaacgact29040ataatgtcac agtcttccaa ggtgaaaatc gtaaaacttt tatgtataaa tttccatttt29100atgaaatgtg cgatattacc atgtacatga gcaaacagta caagttgtgg cccccacaaa29160agtgtttaga gaacactggc accttttgtt ccaccgctct gcttattaca gcgcttgctt29220tggtatgtac cttactttat ctcaaataca aaagcagacg cagttttatt gatgaaaaga29280aaatgccttg attttccgct tgcttgtatt cccctggaca atttactcta tgtgggatat29340gctccaggcg ggcaagatta tacccacaac cttcaaatca aactttcctg gacgttagcg29400cctgatttct gccagcgcct gcactgcaaa tttgatcaaa cccagcttca gcttgcctgc29460tccagagatg accggctcaa ccatcgcgcc cacaacggac tatcgcaaca ccactgctac29520cggactaaca tctgccctaa atttacccca agttcatgcc tttgtcaatg actgggcgag29580cttggacatg tggtggtttt ccatagcgct tatgtttgtt tgccttatta ttatgtggct29640tatttgttgc ctaaagcgca gacgcgccag accccccatc tataggccta tcattgtgct29700caacccacac aatgaaaaaa ttcatagatt ggacggtctg aaaccatgtt ctcttctttt29760acagtatgat taaatgagac atgattcctc gagttcttat attattgacc cttgttgcgc29820
ttttctgtgc gtgctctaca ttggccgcgg tcgctcacat cgaagtagat tgcatcccac29880ctttcacagt ttacctgctt tacggatttg tcacccttat cctcatctgc agcctcgtca29940ctgtagtcat cgccttcatt cagttcattg actgggtttg tgtgcgcatt gcgtacctca30000ggcaccatcc gcaatacaga gacaggacta tagctgatct tctcagaatt ctttaattat30060gaaacggagt gtcatttttg ttttgctgat tttttgcgcc ctacctgtgc tttgctccca30120aacctcagcg cctcccaaaa gacatatttc ctgcagattc actcaaatat ggaacattcc30180cagctgctac aacaaacaga gcgatttgtc agaagcctgg ttatacgcca tcatctctgt30240catggttttt tgcagtacca tttttgccct agccatatat ccataccttg acattggctg30300gaatgccata gatgccatga accaccctac tttcccagtg cccgctgtca taccactgca30360acaggttatt gccccaatca atcagcctcg ccccccttct cccaccccca ctgagattag30420ctactttaat ttgacaggtg gagatgactg aatctctaga tctagaattg gatggaatta30480acaccgaaca gcgcctacta gaaaggcgca aggcggcgtc cgagcgagaa cgcctaaaac30540aagaagttga agacatggtt aacctacacc agtgtaaaag aggtatcttt tgtgtggtca30600agcaggccaa acttacctac gaaaaaacca ctaccggcaa ccgcctcagc tacaagctac30660ccacccagcg ccaaaaactg gtgcttatgg tgggagaaaa acctatcacc gtcacccagc30720actcggcaga aacagagggc tgcctgcact tcccctatca gggtccagag gacctctgca30780ctcttattaa aaccatgtgt ggtattagag atcttattcc attcaactaa cataaacaca30840caataaatta cttacttaaa atcagtcagc aaatctttgt ccagcttatt cagcatcacc30900tcctttcctt cctcccaact ctggtatctc agccgccttt tagctgcaaa ctttctccaa30960agtttaaatg ggatgtcaaa ttcctcatgt tcttgtccct ccgcacccac tatcttcata31020ttgttgcaga tgaaacgcgc cagaccgtct gaagacacct tcaaccccgt gtatccatat31080gacacagaaa ccgggcctcc aactgtgccc tttcttaccc ctccatttgt ttcacccaat31140ggtttccaag aaagtccccc tggagttctc tctctacgcg tctccgaacc tttggacacc31200tcccacggca tgcttgcgct taaaatgggc agcggtctta ccctagacaa ggccggaaac31260ctcacctccc aaaatgtaac cactgttact cagccactta aaaaaacaaa gtcaaacata31320agtttggaca cctccgcacc acttacaatt acctcaggcg ccctaacagt ggcaaccacc31380gctcctctga tagttactag cggcgctctt agcgtacagt cacaagcccc actgaccgtg31440caagactcca aactaagcat tgctactaaa gggcccatta cagtgtcaga tggaaagcta31500gccctgcaaa catcagcccc cctctctggc agtgacagcg acacccttac tgtaactgca31560tcacccccgc taactactgc cacgggtagc ttgggcatta acatggaaga tcctatttat31620gtaaataatg gaaaaatagg aattaaaata agcggtcctt tgcaagtagc acaaaactcc31680gatacactaa cagtagttac tggaccaggt gtcaccgttg aacaaaactc ccttagaacc31740aaagttgcag gagctattgg ttatgattca tcaaacaaca tggaaattaa aacgggcggt31800ggcatgcgta taaataacaa cttgttaatt ctagatgtgg attacccatt tgatgctcaa31860acaaaactac gtcttaaact ggggcaggga cccctgtata ttaatgcatc tcataacttg31920gacataaact ataacagagg cctatacctt tttaatgcat caaacaatac taaaaaactg31980gaagttagca taaaaaaatc cagtggacta aactttgata atactgccat agctataaat32040gcaggaaagg gtctggagtt tgatacaaac acatctgagt ctccagatat caacccaata32100aaaactaaaa ttggctctgg cattgattac aatgaaaacg gtgccatgat tactaaactt32160ggagcgggtt taagctttga caactcaggg gccattacaa taggaaacaa aaatgatgac32220aaacttaccc tgtggacaac cccagaccca tctcctaact gcagaattca ttcagataat32280gactgcaaat ttactttggt tcttacaaaa tgtgggagtc aagtactagc tactgtagct32340gctttggctg tatctggaga tctttcatcc atgacaggca ccgttgcaag tgttagtata32400ttccttagat ttgaccaaaa cggtgttcta atggagaact cctcacttaa aaaacattac32460
tggaacttta gaaatgggaa ctcaactaat gcaaatccat acacaaatgc agttggattt32520atgcctaacc ttctagccta tccaaaaacc caaagtcaaa ctgctaaaaa taacattgtc32580agtcaagttt acttgcatgg tgataaaact aaacctatga tacttaccat tacacttaat32640ggcactagtg aatccacaga aactagcgag gtaagcactt actctatgtc ttttacatgg32700tcctgggaaa gtggaaaata caccactgaa acttttgcta ccaactctta caccttctcc32760tacattgccc aggaataaag aatcgtgaac ctgttgcatg ttatgtttca acgtgtttat32820ttttcaattg cagaaaattt caagtcattt ttcattcagt agtatagccc caccaccaca32880tagcttatat tgatcaccgt accttaatca aactcacaga accctagtat tcaacctgcc32940acctccctcc caacacacag agtacacagt cctttctccc cggctggcct taaaaagcat33000catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc33060caaacgctca tcagtgatat taataaactc cccgggcagc tcgcttaagt tcatgtcgct33120gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgctcaacgg gcggcgaagg33180ggaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg33240ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat33300ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc atgagacgcc ttgtcctccg33360ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac33420aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac33480agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa33540cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca33600tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac33660ctgcccgccg gctatgcact gcagggaacc gggactggaa caatgacagt ggagagccca33720ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca33780cacgtgcata cacttcctca ggattacaag ctcctcccgc gtcagaacca tatcccaggg33840aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact33900cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt33960agcgcgggtc tctgtctcaa aaggaggtag gcgatcccta ctgtacggag tgcgccgaga34020caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt34080tcctgaagca aaaccaggtg cgggcgtgac aaacagatct gcgtctccgg tctcgtcgct34140tagctcgctc tgtgtagtag ttgtagtata tccactctct caaagcatcc aggcgccccc34200tggcttcggg ttctatgtaa actccttcat gcgccgctgc cctgataaca tccaccaccg34260cagaataagc cacacccagc cagcctacac attcgttctg cgagtcacac acgggaggag34320cgggaagagc tggaagaacc atgttttttt tttttttatt ccaaaagatt atccaaaacc34380tcaaaatgaa gatctattaa gtgaacgcgc tcccctccgg tggcgtggtc aaactctaca34440gccaaagaac agataatggc atttgtaaga tgttgcacaa tggcttccaa aaggcaaact34500gccctcacgt ccaagtggac gtaaaggcta aacccttcag ggtgaatctc ctctataaac34560attccagcac cttcaaccat gcccaaataa ttttcatctc gccaccttat caatatgtct34620ctaagcaaat cccgaatatt aagtccggcc attgtaaaaa tctgctccag agcgccctcc34680accttcagcc tcaagcagcg aatcatgatt gcaaaaattc aggttcctca cagacctgta34740taagattcga aagcggaaca ttaacaaaaa taccgcgatc ccgtaggtcc cttcgcaggg34800ccagctgaac ataatcgtgc aggtctgcac ggaccagcgc ggccacttcc ccgccaggaa34860ccatgacaaa agaacccaca ctgattatga cacgcatact cggagctatg ctaaccagcg34920tagcccctat gtaagcttgt tgcatgggcg gcgatataaa atgcaaggtg ctgctcaaaa34980aatcaggcaa agcctcgcgc aaaaaagcaa gcacatcgta gtcatgctca tgcagataaa35040ggcaggtaag ttccggaacc accacagaaa aagacaccat ttttctctca aacatgtctg35100
cgggttcctg cattaaacac aaaataaaat aacaaaaaaa aacatttaaa cattagaagc35160ctgtcttaca acaggaaaaa caacccttat aagcatagga cggactacgg ccatgccggc35220gtgaccgtaa aaaaactggt caccgtgatt aaaaagcacc accgacagtt cctcggtcat35280gtccggagtc ataatgtaag actcggtaaa cacatcaggt tggttaacat cggtcagtgc35340taaaaagcga ccgaaatagc ccgggggaat acatacccgc aggcgtagag acaacattac35400agcccccata ggaggtataa caaaattaat aggagagaaa aacacataaa cacctgaaaa35460accctcctgc ctaggcaaaa tagcaccctc ccgctccaga acaacataca gcgcttccac35520agcggcagcc ataacagtca gccttaccag taaaaaaacc tattaaaaaa caccactcga35580cacggcacca gctcaatcag tcacagtgta aaaagggcca agtacagagc gagtatatat35640aggactaaaa aatgacgtaa cggttaaagt ccacaaaaaa cacccagaaa accgcacgcg35700aacctacgcc cagaaacgaa agccaaaaaa cccacaactt cctcaaatct tcacttccgt35760tttcccacga tacgtcactt cccattttaa aaaaactaca attcccaata catgcaagtt35820actccgccct aaaacctacg tcacccgccc cgttcccacg ccccgcgcca cgtcacaaac35880tccaccccct cattatcata ttggcttcaa tccaaaataa ggtatattat gatgatg 35937<210>12<211>289<212>PRT<213>人腺病毒2型<400>12Met Arg His Ile Ile Cys His Gly Gly Val Ile Thr Glu Glu Met Ala1 5 10 15Ala Ser Leu Leu Asp Gln Leu Ile Glu Glu Val Leu Ala Asp Asn Leu20 25 30Pro Pro Pro Ser His Phe Glu Pro Pro Thr Leu His Glu Leu Tyr Asp35 40 45Leu Asp Val Thr Ala Pro Glu Asp Pro Asn Glu Glu Ala Val Ser Gln50 55 60Ile Phe Pro Asp Ser Val Met Leu Ala Val Gln Glu Gly Ile Asp Leu65 70 75 80Leu Thr Phe Pro Pro Ala Pro Gly Ser Pro Glu Pro Pro His Leu Ser85 90 95Arg Gln Pro Glu Gln Pro Glu Gln Arg Ala Leu Gly Pro Val Ser Met100 105 110Pro Asn Leu Val Pro Glu Val Ile Asp Leu Thr Cys His Glu Ala Gly115 120 125Phe Pro Pro Ser Asp Asp Glu Asp Glu Glu Gly Glu Glu Phe Val Leu130 135 140Asp Tyr Val Glu His Pro Gly His Gly Cys Arg Ser Cys His Tyr His145 150 155 160Arg Arg Asn Thr Gly Asp Pro Asp Ile Met Cys Ser Leu Cys Tyr Met165 170 175Arg Thr Cys Gly Met Phe Val Tyr Ser Pro Val Ser Glu Pro Glu Pro
180 185 190Glu Pro Glu Pro Glu Pro Glu Pro Ala Arg Pro Thr Arg Arg Pro Lys195 200 205Leu Val Pro Ala Ile Leu Arg Arg Pro Thr Ser Pro Val Ser Arg Glu210 215 220Cys Asn Ser Ser Thr Asp Ser Cys Asp Ser Gly Pro Ser Asn Thr Pro225 230 235 240Pro Glu Ile His Pro Val Val Pro Leu Cys Pro Ile Lys Pro Val Ala245 250 255Val Arg Val Gly Gly Arg Arg Gln Ala Val Glu Cys Ile Glu Asp Leu260 265 270Leu Asn Glu Ser Gly Gln Pro Leu Asp Leu Ser Cys Lys Arg Pro Arg275 280 285Pro<210>13<211>495<212>PRT<213>人腺病毒2型<400>13Met Glu Arg Arg Asn Pro Ser Glu Arg Gly Val Pro Ala Gly Phe Ser1 5 10 15Gly His Ala Ser Val Glu Ser Gly Gly Glu Thr Gln Glu Ser Pro Ala20 25 30Thr Val Val Phe Arg Pro Pro Gly Asn Asn Thr Asp Gly Gly Ala Thr35 40 45Ala Gly Gly Ser Gln Ala Ala Ala Ala Ala Gly Ala Glu Pro Met Glu50 55 60Pro Glu Ser Arg Pro Gly Pro Ser Gly Met Asn Val Val Gln Val Ala65 70 75 80Glu Leu Phe Pro Glu Leu Arg Arg Ile Leu Thr Ile Thr Glu Asp Gly85 90 95Gln Gly Leu Lys Gly Val Lys Arg Glu Arg Gly Ala Ser Glu Ala Thr100 105 110Glu Glu Ala Arg Asn Leu Thr Phe Ser Leu Met Thr Arg His Arg Pro115 120 125Glu Cys Val Thr Phe Gln Gln Ile Lys Asp Asn Cys Ala Asn Glu Leu130 135 140Asp Leu Leu Ala Gln Lys Tyr Ser Ile Glu Gln Leu Thr Thr Tyr Trp145 150 155 160Leu Gln Pro Gly Asp Asp Phe Glu Glu Ala Ile Arg Val Tyr Ala Lys165 170 175Val Ala Leu Arg Pro Asp Cys Lys Tyr Lys Ile Ser Lys Leu Val Asn
180 185 190Ile Arg Asn Cys Cys Tyr Ile Ser Gly Asn Gly Ala Glu Val Glu Ile195 200 205Asp Thr Glu Asp Arg Val Ala Phe Arg Gys Ser Met Ile Asn Met Trp210 215 220Pro Gly Val Leu Gly Met Asp Gly Val Val Ile Met Asn Val Arg Phe225 230 235 240Thr Gly Pro Asn Phe Ser Gly Thr Val Phe Leu Ala Asn Thr Asn Leu245 250 255Ile Leu His Gly Val Ser Phe Tyr Gly Phe Asn Asn Thr Cys Val Glu260 265 270Ala Trp Thr Asp Val Arg Val Arg Gly Cys Ala Phe Tyr Cys Cys Trp275 280 285Lys Gly Val Val Cys Arg Pro Lys Ser Arg Ala Ser Ile Lys Lys Cys290 295 300Leu Phe Glu Arg Cys Thr Leu Gly Ile Leu Ser Glu Gly Asn Ser Arg305 310 315 320Val Arg His Asn Val Ala Ser Asp Cys Gly Cys Phe Met Leu Val Lys325 330 335Ser Val Ala Val Ile Lys His Asn Met Val Cys Gly Asn Cys Glu Asp340 345 350Arg Ala Ser Gln Met Leu Thr Cys Ser Asp Gly Asn Cys His Leu Leu355 360 365Lys Thr Ile His Val Ala Ser His Ser Arg Lys Ala Trp Pro Val Phe370 375 380Glu His Asn Ile Leu Thr Arg Cys Ser Leu His Leu Gly Asn Arg Arg385 390 395 400Gly Val Phe Leu Pro Tyr Gln Cys Asn Leu Ser His Thr Lys Ile Leu405 410 415Leu Glu Pro Glu Ser Met Ser Lys Val Asn Leu Asn Gly Val Phe Asp420 425 430Met Thr Met Lys Ile Trp Lys Val Leu Arg Tyr Asp Glu Thr Arg Thr435 440 445Arg Cys Arg Pro Cys Glu Cys Gly Gly Lys His Ile Arg Asn Gln Pro450 455 460Val Met Leu Asp Val Thr Glu Glu Leu Arg Pro Asp His Leu Val Leu465 470 475 480Ala Cys Thr Arg Ala Glu Phe Gly Ser Ser Asp Glu Asp Thr Asp485 490 495<210>14<211>529<212>PRT<213>人腺病毒2型
<400>14Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly1 5 10 15Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro20 25 30Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg35 40 45Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu50 55 60Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu65 70 75 80Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu85 90 95Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu100 105 110Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile115 120 125Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp130 135 140Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser145 150 155 160Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro165 170 175Ile Val Ser Ala Trp Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met180 185 190Asp Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu195 200 205Pro Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn210 215 220Glu Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe225 230 235 240Val Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala245 250 255Glu Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu260 265 270His Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser275 280 285Ile Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu290 295 300Asn Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val305 310 315 320Lys Asn Arg Trp Gly Arg Asn Val Val Gln Ile Ser Asn Thr Asp Ala325 330 335Arg Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly
340 345 350Lys Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala355 360 365Phe Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln370 375 380Thr Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser385 390 395 400Lys Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr405 410 415Pro Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser420 425 430Asp Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe435 440 445Gln Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly450 455 460Pro Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu465 470 475 480Val Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg485 490 495Met Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn500 505 510Val Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp515 520 525Phe<210>15<211>114<212>PRT<213>人腺病毒2型<400>15Met Val Leu Pro Ala Leu Pro Ala Pro Pro Val Cys Asp Ser Gln Asn1 5 10 15Glu Cys Val Gly Trp Leu Gly Val Ala Tyr Ser Ala Val Val Asp Val20 25 30Ile Arg Ala Ala Ala His Glu Gly Val Tyr Ile Glu Pro Glu Ala Arg35 40 45Gly Arg Leu Asp Ala Leu Arg Glu Trp Ile Tyr Tyr Asn Tyr Tyr Thr50 55 60Glu Arg Ala Lys Arg Arg Asp Arg Arg Arg Arg Ser Val Cys His Ala65 70 75 80Arg Thr Trp Phe Cys Phe Arg Lys Tyr Asp Tyr Val Arg Arg Ser Ile85 90 95Trp His Asp Thr Thr Thr Asn Thr Ile Ser Val Val Ser Ala His Ser
100 105 110Val Gln<210>16<211>540<212>DNA<213>人乳头瘤病毒1a型<220>
<221>CDS<222>(104)..(526)<400>16gttaactacc atcattcatt attcaagtta caacaagaac ctaggagtta tatgccagaa 60gtaagcctat aaaatacaca ggtaagacac tgcacaggac cag atg gcg aca cca 115Met Ala Thr Pro1atc cgg acc gtc aga cag ctt tcc gaa agc ctc tgt atc cca tat att 163Ile Arg Thr Val Arg Gln Leu Ser Glu Ser Leu Cys Ile Pro Tyr Ile5 10 15 20gat gtt tta ttg cct tgt aat ttt tgt aat tat ttt ttg tct aat gct 211Asp Val Leu Leu Pro Cys Asn Phe Cys Asn Tyr Phe Leu Ser Asn Ala25 30 35gag aag ctg ctt ttt gat cat ttt gat ttg cat ctt gtc tgg aga gac 259Glu Lys Leu Leu Phe Asp His Phe Asp Leu His Leu Val Trp Arg Asp40 45 50aat ttg gtg ttt gga tgc tgt caa ggg tgt gct aga act gtt agc cta 307Asn Leu Val Phe Gly Cys Cys Gln Gly Cys Ala Arg Thr Val Ser Leu55 60 65ttg gag ttt gtt tta tat tat cag gag tct tat gag gta ccg gaa ata 355Leu Glu Phe Val Leu Tyr Tyr Gln Glu Ser Tyr Glu Val Pro Glu Ile70 75 80gaa gaa att ttg gac aga cct tta ttg caa att gaa ctc cgt tgt gtt 403Glu Glu Ile Leu Asp Arg Pro Leu Leu Gln Ile Glu Leu Arg Cys Val85 90 95 100aca tgc ata aaa aaa atg agt gtt gct gaa aaa ttg gag gtt gtg tca 451Thr Cys Ile Lys Lys Met Ser Val Ala Glu Lys Leu Glu Val Val Ser105 110 115aac gga gaa aga gtg cat aga gtt aga aac aga ctt aaa gca aag tgt 499Asn Gly Glu Arg Val His Arg Val Arg Asn Arg Leu Lys Ala Lys Cys120 125 130agt ttg tgt cgc ttg tat gca ata taa caatggtggg cgaa 540Ser Leu Cys Arg Leu Tyr Ala Ile135 140
<210>17<211>140<212>PRT<213>人乳头瘤病毒1a型<400>17Met Ala Thr Pro Ile Arg Thr Val Arg Gln Leu Ser Glu Ser Leu Cys1 5 10 15Ile Pro Tyr Ile Asp Val Leu Leu Pro Cys Asn Phe Cys Asn Tyr Phe20 25 30Leu Ser Asn Ala Glu Lys Leu Leu Phe Asp His Phe Asp Leu His Leu35 40 45Val Trp Arg Asp Asn Leu Val Phe Gly Cys Cys Gln Gly Cys Ala Arg50 55 60Thr Val Ser Leu Leu Glu Phe Val Leu Tyr Tyr Gln Glu Ser Tyr Glu65 70 75 80Val Pro Glu Ile Glu Glu Ile Leu Asp Arg Pro Leu Leu Gln Ile Glu85 90 95Leu Arg Cys Val Thr Cys Ile Lys Lys Met Ser Val Ala Glu Lys Leu100 105 110Glu Val Val Ser Asn Gly Glu Arg Val His Arg Val Arg Asn Arg Leu115 120 125Lys Ala Lys Cys Ser Leu Cys Arg Leu Tyr Ala Ile130 135 140<210>18<211>192<212>DNA<213>人乳头瘤病毒1a型<220>
<221>CDS<222>(1)..(189)<400>18
atg ttt tat tgc ctt gta att ttt gta att att ttt tgt cta atg ctg 48Met Phe Tyr Cys Leu Val Ile Phe Val Ile Ile Phe Cys Leu Met Leu1 5 10 15aga agc tgc ttt ttg atc att ttg att tgc atc ttg tct gga gag aca 96Arg Ser Cys Phe Leu Ile Ile Leu Ile Cys Ile Leu Ser Gly Glu Thr20 25 30att tgg tgt ttg gat gct gtc aag ggt gtg cta gaa ctg tta gcc tat144Ile Trp Cys Leu Asp Ala Val Lys Gly Val Leu Glu Leu Leu Ala Tyr35 40 45tgg agt ttg ttt tat att atc agg agt ctt atg agg tac cgg aaa tag192Trp Ser Leu Phe Tyr Ile Ile Arg Ser Leu Met Arg Tyr Arg Lys50 55 60<210>19<211>63<212>PRT<213>人乳头瘤病毒1a型<400>19Met Phe Tyr Cys Leu Val Ile Phe Val Ile Ile Phe Cys Leu Met Leu1 5 10 15Arg Ser Cys Phe Leu Ile Ile Leu Ile Cys Ile Leu Ser Gly Glu Thr20 25 30Ile Trp Cys Leu Asp Ala Val Lys Gly Val Leu Glu Leu Leu Ala Tyr35 40 45Trp Ser Leu Phe Tyr Ile Ile Arg Ser Leu Met Arg Tyr Arg Lys50 55 60<210>20<211>5290<212>DNA<213>CMV<400>20ctgtctagtg aaatccgtat ggacctccag cacgccgcgg atcatcaggg cctccatttc 60gaaatcggcc gacacgctct gggccgcgcc gctcctcgtc tgccgtgatc aagcggcgcg120gcgcggacct ttcaagtgtt cctgggccgc cgctcgaggc agttcccctt tctggcactc180cgcccgccgc ttcgcggctc atttggcgcc gacgcgcctt ctcgcggctg caaatcagct240ccacgtatcg gcaaaacttg ctgtcgtcgt aggcggcggc cacgatctcg ccgaaggaga300gctgcaggta ggcctcgggt acggggtcca gcgtgcccag cgccaggatg tgacacagat360agggcagggt cacgcgctct accgtgtaat tggagtagac gatggcctct tcggcccctt420
gatgcgtgac cagacgccgt aggcgaaagg tacggaaata ctcgttttcc cacaactgcg 480tgaggaagcg ttccagcgac tcggtgccgg gcacgaactg cgagaagaag ctgttggcca 540ccaggcggtt gtcttccacc gccagcggac ggaagggcgc cgcgtcgcgc gccttgcgca 600cggcctccaa cacgggcagg tggtagagtt cggcgtcgcg cgcgcccagg ctcatggagt 660cctcgcgccg cgaggcgtag cgcgtgagca ggtcgcgcag ttcgcgcacg cgattctccc 720aggtctggtt aagcgtgcgc aggtcctgga tctcgtccac ctgcgactgg atctgctcct 780ccaggcactt gataacctgc ttcttaaaca ggtcgcggat gtcccgctcg ggcgccgccg 840ggccgggtgg cggcggcagc agcccgacgt ggcccgcggg tcctcccacc acggcgccgc 900cgggtcccac cacgccgggt ccgcccggac cacgcgcggg tagtagacgg ttttggtcca 960ccagcgaggg ggtcaggtcc tgcagaaagg actcgacgct gtcctcgatg ccgatgcgcg1020atttgctgtc cgagacgtta agcaaaaact tcataatgga ctttttggcg tcgctgcccc1080ggtcgtgctg ctccatcatc tccaccagct tcttgcagtt gagctcgtgg cggctggcgg1140tcaccacttt cacaggaaag gtattgagca actggcagat cttttggtgg cggcagagcc1200cgtcgtagcg cagaatctcc tcgtgcaggt gtgccaccgg cgtggtgaac agcagcttgt1260cgcgctcata agccagcggt tcggccgcca cgtacaagcg gatgtgcttg ccgcgcagct1320gcgcctccag ccgctccgag cgcaccttct tgaagacgcg tacctcgggc gcgttggcta1380cgcgcacggc gcccaggcgc tcggccacct gcagcagcag cgccaggtta gcctgcagca1440ggtcctgcgc cagcgggtgt gtctcggtgg cccgctgcac ggccgcgcgt acaaattgcg1500cccgctcggc cgcctcgctc ggcttggtct tcacgtccag cagcggtacc agtcccaccg1560ttacgcacca atccacgtag agaccatagt cgtcgttatc ggcgtactga tataaaatgt1620cgcggaggcc gcccagcacg cccgtttgca cgctctggcg caacgaggcg ctccacacca1680acagatactg ctccaggtcc tcttcgtcca gcgcgcggta gggaaatagc gccgcgtgca1740acttccactc ctcggccacg cgccgcaccg tgatggtgtc aaagagcgtt ttgcacactc1800cgtagagcag ctgcttgcgc agcacgcacg ggtcgcgcag cacctggtgc atgctttggc1860cgcgacacgt ccccagaaag ccgtgcagca accgcaggaa gctcatcgtc tgccccgtgg1920ggaaaatgtc gatgacggcc tcgtcatcca cgccgcggcc cacgcccaag tacgacgacg1980ccttgatcct caacctctcg tcggccgcca agatcgaacg gatcgtcgac aaggtcaagt2040ccctctcgcg cgagcgcttt gcgcccgagg atttttcgtt ccagtggttt cgctccatca2100gtcgcgttga acgaacgaca gataacaacc cctctgccgc aactaccgcc gcggcaacga2160cgaccgttca ctcctccgcc tcctcttctg ccgccgctgc cgcttcgtcc gaggccggcg2220gcacgcgcgt gccctgcgtc gaccgttggc ccttctttcc cttccgcgcg ctgctcgtca2280ccggcacggc gggcgccggc aagacttcca gcatccaggt gctggcggcc aatctagatt2340gcgtgatcac cggtaccacg gtgatcgccg cgcagaacct cagcgcgatc ctcaaccgca2400ctcgctcggc gcaggtcaag accatctacc gcgtcttcgg cttcgtcagc aagcacgtgc2460cgctggctga cagcgccgtt agccacgaga cgctggaacg ctaccgcgtg tgcgagccgc2520acgaggagac caccatccag cgcctgcaga tcaacgatct gctcgcctac tggccggtca2580tcgccgacat cgtggacaaa tgcttaaata tgtgggagcg caaggccgct tcggcctccg2640ccgcggccgc agccgccgcc tgcgaggacc tctcggagct gtgcgagagc aatatcatcg2700tcatcgacga gtgcggcctt atgctgcgct acatgctgca ggtggtggtg tttttttact2760acttttacaa cgccctgggc gacacgcgac tttaccgcga acgccgcgtg ccctgcatca2820tctgcgtcgg ttcgcccacg cagaccgagg cgctggagag ccgctacgac cactacacgc2880aaaacaagag cgtgcgcaag ggcgttgacg tgctctcggc gctgattcag aacgaggtgc2940tcatcaacta ctgcgacatc gccgacaact gggtcatgtt tattcacaac aagcgttgca3000ccgacctgga ctttggcgac ctgctcaagt acatggagtt cggtatcccg ctcaaggagg3060
agcacgtggc ctacgtggat cgcttcgtgc ggccgcccag ctccatccgc aacccctcgt3120acgccgccga gatgacgcgg ctttttctct cacacgtcga ggtgcaggct tacttcaagc3180ggctgcacga gcagatccgc ctgagcgagc gccaccgtct ctttgatctg cccgtctact3240gcgtggtcaa caaccgcgcg taccaggagc tctgcgagct ggccgacccg ctgggcgact3300cgccgcagcc cgtcgagctc tggttccgcc agaacttggc gcgcatcatt aactactcgc3360agtttgtcga ccacaacctc tccagcgaga tcaccaagga ggcgctgcgc cccgcggccg3420acgtcgttgc caccaacaac tcctccgtcc aggctcacgg agggggagga tctgtaatcg3480ggagcaccgg cggcaacgac gagacggcgt ttttccagga cgatgatacc accactgcgc3540ccgatagccg tgagacgctg ctcaccttgc gcattaccta catcaagggc agttcggtgg3600gagtcaactc taaggtgcgg gcctgtgtta tcggatacca gggcacggtc gaacgtttcg3660tggacatctt gcaaaaggac acgtttatcg aacgcacgcc ctgcgagcag gcggcctacg3720cctactcgtt agtttcgggc ctgctcttct cggccatgta ctacttctac gtgtcgccct3780acacgaccga ggagatgttg cgtgagctgg cgcgcgttga gctgcccgac gtgagttcgc3840tctgcgccgc tgccgccgcc acggccgccg ctcccgcttg gagcggggga gagaatccga3900taaataatca cgtcgacgcg gattcttctc agggcggcca gagcgtgccg gtatctcaac3960ggatggaaca tggccaagag gagacccacg acatcccctg cctgtccaac caccatgacg4020actcggacgc catcacggac gccgaactca tggatcacac cagtctgtac gcggatccct4080tttttctcaa atacgtcaag ccacctagcc tggcgctgct ttctttcgag gagacggtgc4140acatgtacac taccttccgc gacatttttc tcaagcgcta ccagctcatg cagcgtctca4200cgggcggtcg cttcgccacg ttgccgctcg ttacctacaa tcgccgtaac gtggtgttca4260aggccaactg tcagatcagc tcgcagaccg gctccttcgt gggcatgctt tcgcatgtgt4320cgccggcgca gacgtacacg ctcgagggct acaccagcga caacgtgctc agtctgccca4380gtgaccgcca ccgcatccac cccgaggtgg tgcagcgcgg cctttcgcgg ctggtgctac4440gcgatgcgct tgggttcctc tttgtgctcg acgttaacgt ttcgcgcttc gtcgagtcgg4500cgcagggcaa gagtctgcac gtgtgcacca ccgtggacta cggcctcact tcgcgcacgg4560ccatgaccat cgccaagagt cagggcctgt cgctcgagaa ggtggccgtg gactttgggg4620accatcccaa gaacctcaag atgagccaca tctacgtggc catgtcgcga gtcacggacc4680ccgaacacct catgatgaac gttaacccgt tgcgactgcc ctatgagaag aacaccgcta4740tcacccccta tatctgtcgc gcgctcaaag acaaacgcac cacgcttatt ttttgacaca4800acaccgtgta aggaaaacgt gactttattg agcagggtaa aaaccacgta caagaaccac4860gttgtctatc cccaaaaaaa cacacaccgt cagggaacac atcgcctata gatagcggca4920ctttacataa aaccaccgta cctgcatcac ggtggctcga tacactggaa attcaataaa4980aaccaccgtg tctccgtgac ggtacttatc gggtcagcgt cttttgagat ttctgttcgt5040aaacttatcc gtttccccgg tccgcggtgt ctcctcgcga ggctgacagt cgacgggtgg5100tacctgcaag agaagaaacc cgggtgggag cgacgccgtc gctgggtatc aaccccgcgg5160ctgaccgtcg tccggtaaag gaacaacccg tcgtcgcaag ccgggttcga ccaagagaaa5220aaacccgggt gcggggggag acgggtcgtc ctttggttgt tcgcggacgg cgtacatgcc5280gcgtgggtca 5290<210>21<211>708<212>PRT<213>猿猴病毒40
<400>21Met Asp Lys Val Leu Asn Arg Glu Glu Ser Leu Gln Leu Met Asp Leu1 5 10 15Leu Gly Leu Glu Arg Ser Ala Trp Gly Asn Ile Pro Leu Met Arg Lys20 25 30Ala Tyr Leu Lys Lys Cys Lys Glu Phe His Pro Asp Lys Gly Gly Asp35 40 45Glu Glu Lys Met Lys Lys Met Asn Thr Leu Tyr Lys Lys Met Glu Asp50 55 60Gly Val Lys Tyr Ala His Gln Pro Asp Phe Gly Gly Phe Trp Asp Ala65 70 75 80Thr Glu Ile Pro Thr Tyr Gly Thr Asp Glu Trp Glu Gln Trp Trp Asn85 90 95Ala Phe Asn Glu Glu Asn Leu Phe Cys Ser Glu Glu Met Pro Ser Ser100 105 110Asp Asp Glu Ala Thr Ala Asp Ser Gln His Ser Thr Pro Pro Lys Lys115 120 125Lys Arg Lys Val Glu Asp Pro Lys Asp Phe Pro Ser Glu Leu Leu Ser130 135 140Phe Leu Ser His Ala Val Phe Ser Asn Arg Thr Leu Ala Cys Phe Ala145 150 155 160Ile Tyr Thr Thr Lys Glu Lys Ala Ala Leu Leu Tyr Lys Lys Ile Met165 170 175Glu Lys Tyr Ser Val Thr Phe Ile Ser Arg His Asn Ser Tyr Asn His180 185 190Asn Ile Leu Phe Phe Leu Thr Pro His Arg His Arg Val Ser Ala Ile195 200 205Asn Asn Tyr Ala Gln Lys Leu Cys Thr Phe Ser Phe Leu Ile Cys Lys210 215 220Gly Val Asn Lys Glu Tyr Leu Met Tyr Ser Ala Leu Thr Arg Asp Pro225 230 235 240Phe Ser Val Ile Glu Glu Ser Leu Pro Gly Gly Leu Lys Glu His Asp245 250 255Phe Asn Pro Glu Glu Ala Glu Glu Thr Lys Gln Val Ser Trp Lys Leu260 265 270Val Thr Glu Tyr Ala Met Glu Thr Lys Cys Asp Asp Val Leu Leu Leu275 280 285Leu Gly Met Tyr Leu Glu Phe Gln Tyr Ser Phe Glu Met Cys Leu Lys290 295 300Cys Ile Lys Lys Glu Gln Pro Ser His Tyr Lys Tyr His Glu Lys His305 310 315 320Tyr Ala Asn Ala Ala Ile Phe Ala Asp Ser Lys Asn Gln Lys Thr Ile325 330 335Cys Gln Gln Ala Val Asp Thr Val Leu Ala Lys Lys Arg Val Asp Ser
340 345 350Leu Gln Leu Thr Arg Glu Gln Met Leu Thr Asn Arg Phe Asn Asp Leu355 360 365Leu Asp Arg Met Asp Ile Met Phe Gly Ser Thr Gly Ser Ala Asp Ile370 375 380Glu Glu Trp Met Ala Gly Val Ala Trp Leu His Cys Leu Leu Pro Lys385 390 395 400Met Asp Ser Val Val Tyr Asp Phe Leu Lys Cys Met Val Tyr Asn Ile405 410 415Pro Lys Lys Arg Tyr Trp Leu Phe Lys Gly Pro Ile Asp Ser Gly Lys420 425 430Thr Thr Leu Ala Ala Ala Leu Leu Glu Leu Cys Gly Gly Lys Ala Leu435 440 445Asn Val Asn Leu Pro Leu Asp Arg Leu Asn Phe Glu Leu Gly Val Ala450 455 460Ile Asp Gln Phe Leu Val Val Phe Glu Asp Val Lys Gly Thr Gly Gly465 470 475 480Glu Ser Arg Asp Leu Pro Ser Gly Gln Gly Ile Asn Asn Leu Asp Asn485 490 495Leu Arg Asp Tyr Leu Asp Gly Ser Val Lys Val Asn Leu Glu Lys Lys500 505 510His Leu Asn Lys Arg Thr Gln Ile Phe Pro Pro Gly Ile Val Thr Met515 520 525Asn Glu Tyr Ser Val Pro Lys Thr Leu Gln Ala Arg Phe Val Lys Gln530 535 540Ile Asp Phe Arg Pro Lys Asp Tyr Leu Lys His Cys Leu Glu Arg Ser545 550 555 560Glu Phe Leu Leu Glu Lys Arg Ile Ile Gln Ser Gly Ile Ala Leu Leu565 570 575Leu Met Leu Ile Trp Tyr Arg Pro Val Ala Glu Phe Ala Gln Ser Ile580 585 590Gln Ser Arg Ile Val Glu Trp Lys Glu Arg Leu Asp Lys Glu Phe Ser595 600 605Leu Ser Val Tyr Gln Lys Met Lys Phe Asn Val Ala Met Gly Ile Gly610 615 620Val Leu Asp Trp Leu Arg Asn Ser Asp Asp Asp Asp Glu Asp Ser Gln625 630 635 640Glu Asn Ala Asp Lys Asn Glu Asp Gly Gly Glu Lys Asn Met Glu Asp645 650 655Ser Gly His Glu Thr Gly Ile Asp Ser Gln Ser Gln Gly Ser Phe Gln660 665 670Ala Pro Gln Ser Ser Gln Ser Val His Asp His Asn Gln Pro Tyr His675 680 685Ile Cys Arg Gly Phe Thr Cys Phe Lys Lys Pro Pro Thr Pro Pro Pro
690 695 700Glu Pro Glu Thr70权利要求
1.一种治疗癌或高增殖性疾病患者的方法,该方法包括给需要治疗患者施用一种条件复制型病毒载体,其中至少一种编码其复制必需产物的病毒核酸操作性连接于H19调节序列。
2.权利要求1的方法,其中H19调节序列选自H19启动子、H19增强子、仍保持转录调节活性的H19启动子或H19增强子的亚序列和它们的组合。
3.权利要求2的方法,其中H19启动子包含SEQ ID NO1的1-830位核苷酸。
4.权利要求2的方法,其中H19启动子包含SEQ ID NO2的序列。
5.权利要求2的方法,其中H19增强子包含克隆至质粒pH19EH19(ATCC保藏号209322)的H19增强子的序列。
6.权利要求2的方法,其中H19增强子包含SEQ ID NO3的序列。
7.权利要求2的方法,其中H19增强子包含SEQ ID NO4的序列。
8.权利要求2的方法,其中H19增强子包含SEQ ID NO5的序列。
9.权利要求2的方法,其中H19增强子被置于病毒复制必需病毒基因序列的3′侧。
10.权利要求1的方法,其中所述的癌症选自癌、肉瘤、腺瘤、肝细胞癌、肝胚细胞瘤、横纹肌肉瘤、食管癌、甲状腺癌、恶性神经节瘤、纤维肉瘤、粘液肉瘤、脂肪肉瘤、cohndrosarcoma、骨肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、lymphagiosarcoma、滑膜瘤、尤因氏瘤、平滑肌肉瘤、rhabdotheliosarcoma、结肠癌、胰腺癌、乳癌、卵巢癌、前列腺癌、鳞状细胞癌、基底细胞癌、腺癌、肾细胞癌、血肿、胆管癌、黑色素瘤、绒毛膜瘤、精原细胞瘤、胚胎性癌、维尔姆斯氏肿瘤、子宫颈癌、睾丸肿瘤、肺癌、小肺癌、膀胱癌、胃肠道间质瘤、上皮癌、胶质瘤、星形细胞瘤、髓母细胞瘤、颅咽管瘤、ependynoma、松果体瘤、视网膜母细胞瘤、多发性骨髓瘤、直肠癌、甲状腺癌、头颈癌、子宫内膜癌、以及它们的转移灶。
11.权利要求10的方法,其中癌是膀胱癌且施用途径为腔内。
12.权利要求1的方法,其中条件复制型病毒为腺病毒。
13.权利要求12的方法,其中至少一种编码病毒复制必需产物的核酸选自腺病毒的E1a、E1b、E2a和E4基因。
14.一种条件复制型病毒载体,其中至少一种编码其复制必需产物的病毒核酸操作性连接于H19调节序列。
15.权利要求14的载体,其中H19调节序列选自H19启动子、H19增强子、仍保持转录调节活性的H19启动子或H19增强子的亚序列和它们的组合。
16.权利要求15的载体,其中H19启动子包含SEQ ID NO1的1-830位核苷酸。
17.权利要求15的载体,其中H19启动子包含SEQ ID NO2的序列。
18.权利要求15的载体,其中H19增强子包含克隆至质粒pH19EH19(ATCC保藏号209322)的H19增强子的序列。
19.权利要求15的载体,其中H19增强子包含SEQ ID NO3的序列。
20.权利要求15的载体,其中H19增强子包含SEQ ID NO4的序列。
21.权利要求15的载体,其中H19增强子包含SEQ ID NO5的序列。
22.权利要求15的载体,其中H19增强子被置于病毒复制必需病毒基因序列的3′侧。
23.权利要求14的载体,其中条件复制型病毒为腺病毒。
24.权利要求23的载体,其中至少一种编码病毒复制必需产物的核酸选自腺病毒的E1a、E1b、E2a和E4基因。
25.一种降低癌或高增殖性细胞生长的方法,该方法包括将细胞与有效量的条件复制型病毒载体接触,所述病毒载体中至少一种编码其复制必需产物的病毒核酸操作性连接于H19调节序列。
26.权利要求25的方法,其中H19调节序列选自H19启动子、H19增强子、仍保持转录调节活性的H19启动子或H19增强子的亚序列和它们的组合。
27.权利要求26的方法,其中H19启动子包含SEQ ID NO1的1-830位核苷酸。
28.权利要求26的方法,其中H19启动子包含SEQ ID NO2的序列。
29.权利要求26的方法,其中H19增强子包含克隆至质粒pH19EH19(ATCC保藏号209322)的H19增强子的序列。
30.权利要求26的方法,其中H19增强子包含SEQ ID NO3的序列。
31.权利要求26的方法,其中H19增强子包含SEQ ID NO4的序列。
32.权利要求26的方法,其中H19增强子包含SEQ ID NO5的序列。
33.权利要求26的方法,其中H19增强子被置于病毒复制必需病毒基因序列的3′侧。
34.权利要求25的方法,其中所述的癌症选自癌、肉瘤、腺瘤、肝细胞癌、肝胚细胞瘤、横纹肌肉瘤、食管癌、甲状腺癌、恶性神经节瘤、纤维肉瘤、粘液肉瘤、脂肪肉瘤、cohndrosarcoma、骨肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、lymphagiosarcoma、滑膜瘤、尤因氏瘤、平滑肌肉瘤、rhabdotheliosarcoma、结肠癌、胰腺癌、乳癌、卵巢癌、前列腺癌、鳞状细胞癌、基底细胞癌、腺癌、肾细胞癌、血肿、胆管癌、黑色素瘤、绒毛膜瘤、精原细胞瘤、胚胎性癌、维尔姆斯氏肿瘤、子宫颈癌、睾丸肿瘤、肺癌、小肺癌、膀胱癌、胃肠道间质瘤、上皮癌、胶质瘤、星形细胞瘤、髓母细胞瘤、颅咽管瘤、ependynoma、松果体瘤、视网膜母细胞瘤、多发性骨髓瘤、直肠癌、甲状腺癌、头颈癌、子宫内膜癌、以及它们的转移灶。
35.权利要求25的方法,其中条件复制型病毒为腺病毒。
36.权利要求35的方法,其中至少一种编码病毒复制必需产物的基因选自腺病毒的E1a、E1b、E2a和E4基因。
37.条件复制型病毒载体在制备治疗癌或高增殖性疾病的药物中的用途,所述载体中至少一种编码其复制必需产物的病毒基因操作性连接于H19调节序列。
38.权利要求37的用途,其中H19调节序列选自H19启动子、H19增强子、仍保持转录调节活性的H19启动子或H19增强子的亚序列和它们的组合。
39.权利要求38的用途,其中H19启动子包含SEQ ID NO1的1-830位核苷酸。
40.权利要求38的用途,其中H19启动子包含SEQ ID NO2的序列。
41.权利要求38的用途,其中H19增强子包含克隆至质粒pH19EH19(ATCC保藏号209322)的H19增强子的序列。
42.权利要求38的用途,其中H19增强子包含SEQ ID NO3的序列。
43.权利要求38的用途,其中H19增强子包含SEQ ID NO4的序列。
44.权利要求38的用途,其中H19增强子包含SEQ ID NO5的序列。
45.权利要求38的用途,其中H19增强子被置于病毒复制必需病毒基因序列的3′侧。
46.权利要求37的用途,其中所述的癌症选自癌、肉瘤、腺瘤、肝细胞癌、肝胚细胞瘤、横纹肌肉瘤、食管癌、甲状腺癌、恶性神经节瘤、纤维肉瘤、粘液肉瘤、脂肪肉瘤、cohndrosarcoma、骨肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、lymphagiosarcoma、滑膜瘤、尤因氏瘤、平滑肌肉瘤、rhabdotheliosarcoma、结肠癌、胰腺癌、乳癌、卵巢癌、前列腺癌、鳞状细胞癌、基底细胞癌、腺癌、肾细胞癌、血肿、胆管癌、黑色素瘤、绒毛膜瘤、精原细胞瘤、胚胎性癌、维尔姆斯氏肿瘤、子宫颈癌、睾丸肿瘤、肺癌、小肺癌、膀胱癌、胃肠道间质瘤、上皮癌、胶质瘤、星形细胞瘤、髓母细胞瘤、颅咽管瘤、ependynoma、松果体瘤、视网膜母细胞瘤、多发性骨髓瘤、直肠癌、甲状腺癌、头颈癌、子宫内膜癌、以及它们的转移灶。
47.权利要求37的用途,其中条件复制型病毒为腺病毒。
48.权利要求47的用途,其中至少一种编码病毒复制必需产物的基因选自腺病毒的E1a、E1b、E2a和E4基因。
49.一种治疗癌或高增殖性疾病的药物组合物,该组合物包括药学可接受的载体和作为活性成分的条件复制型病毒载体,所述病毒载体中至少一种编码其复制必需产物的病毒基因操作性连接于H19调节序列。
50.权利要求49的组合物,其中H19调节序列选自H19启动子、H19增强子、仍保持转录调节活性的H19启动子或H19增强子的亚序列和它们的组合。
51.权利要求50的组合物,其中H19启动子包含SEQ ID NO1的1-830位核苷酸。
52.权利要求50的组合物,其中H19启动子包含SEQ ID NO2的序列。
53.权利要求50的组合物,其中H19增强子包含克隆至质粒pH19EH19(ATCC保藏号209322)的H19增强子的序列。
54.权利要求50的组合物,其中H19增强子包含SEQ ID NO3的序列。
55.权利要求50的组合物,其中H19增强子包含SEQ ID NO4的序列。
56.权利要求50的组合物,其中H19增强子包含SEQ ID NO5的序列。
57.权利要求50的组合物,其中H19增强子被置于病毒复制必需病毒基因序列的3′侧。
58.权利要求49的组合物,其中所述的癌症选自癌、肉瘤、腺瘤、肝细胞癌、肝胚细胞瘤、横纹肌肉瘤、食管癌、甲状腺癌、恶性神经节瘤、纤维肉瘤、粘液肉瘤、脂肪肉瘤、cohndrosarcoma、骨肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、lymphagiosarcoma、滑膜瘤、尤因氏瘤、平滑肌肉瘤、rhabdotheliosarcoma、结肠癌、胰腺癌、乳癌、卵巢癌、前列腺癌、鳞状细胞癌、基底细胞癌、腺癌、肾细胞癌、血肿、胆管癌、黑色素瘤、绒毛膜瘤、精原细胞瘤、胚胎性癌、维尔姆斯氏肿瘤、子宫颈癌、睾丸肿瘤、肺癌、小肺癌、膀胱癌、胃肠道间质瘤、上皮癌、胶质瘤、星形细胞瘤、髓母细胞瘤、颅咽管瘤、ependynoma、松果体瘤、视网膜母细胞瘤、多发性骨髓瘤、直肠癌、甲状腺癌、头颈癌、子宫内膜癌、以及它们的转移灶。
59.权利要求49的组合物,其中条件复制型病毒为腺病毒。
60.权利要求49的组合物,其中至少一种编码病毒复制必需产物的基因选自腺病毒的E1a、E1b、E2a和E4基因。
全文摘要
本发明涉及使用条件复制型病毒载体的肿瘤特异性病毒复制和/或表达,所述病毒载体中病毒复制必需基因产物在H19调节序列的控制下表达。本发明提供了所述病毒载体,制备所述载体的方法和所述载体的施用方法。本发明的组合物和方法可用于治疗癌症和高增殖性疾病。
文档编号C07K14/65GK1608135SQ02825940
公开日2005年4月20日 申请日期2002年10月22日 优先权日2001年10月22日
发明者A·霍克伯格, S·亚野斯 申请人:耶路撒冷希伯来大学伊森姆研究发展公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1