利用球状载体将第八因子/第九因子进行肝脏基因转移治疗血友病的方法

文档序号:3519278阅读:650来源:国知局
专利名称:利用球状载体将第八因子/第九因子进行肝脏基因转移治疗血友病的方法
技术领域
本发明是指利用球状载体将第八因子/第九因子进行肝脏基因转移治疗血友病的方法。
背景技术
血友病是最常见的遗传疾病之一,因第八因子缺失引起的A型血友病发病率为每5,000个新生男婴中有1名;而因第九因子缺失导致的B型血友病发病率为每30,000个新生男婴中有一名发病,而且在所有研究过的人种中,发病率都很一致。长期以来,富集的凝血因子被用来治疗血友病,这种疗法的目的是控制出血而且需要终生重复的静脉注射。由于对血浆制品风险意识的提高,开发新的有效治疗方法的重要性也在不断提升。
人们已经在开发基因治疗的方法来治疗血友病。因其特性,血友病是很适于用基因治疗方法的一种疾病相关的蛋白已被很好地研究,相关的基因已被克隆因而易于获得,大型和小型的相关动物模型也已建立,更重要的是,基因产品不需要器官特异性的表达,而且,由于蛋白的功能是通过蛋白激活来调控的,所以蛋白表达的水平不需要严格的调控。另外,很低的蛋白表达水平就可以在功能上改善疾病。血友病基因治疗最主要的障碍是基因表达的产品需要对病人终身维持。因而,有效的疗法可能需要将基因治疗载体重复导入。
利用逆转录病毒和腺病毒相关病毒(AAV)作为载体的血友病基因治疗的临床试验正在进行,以腺病毒和慢性病毒(LENTIVIRUS)为载体的基因治疗实验也有人偿试过。但是以病毒为载体的基因治疗的通病是它的装载核酸的容量有限,并可导致免疫反应。使用DNA或RNA,在有或没有合成脂质体的条件下,都只有低效的基因转移,非病毒方法只能产生短期、非靶向性的基因表达。
Yamada等人(2001a)最近描述了一种新的对肝有特异性的、表达修饰乙肝病毒表面蛋白的球状载体。产生这种包含乙肝膜蛋白球体的方法为同行所熟知(Kuroda等人1992年和Yamada等人,2001b,在此引用全文)。简述如下通过将鸡溶菌酶基因的信号序列在框地(inframe)接入乙肝表面env L蛋白(SEQ ID I)基因之前,包含pre-S1加pre-S2加S肽的修饰的乙肝表面env L蛋白就可在酵母中有效地表达出来,信号序列在翻译的过程中将蛋白导入内质网,饱含蛋白的球体从内质网中分裂出来,聚集在酵母的细胞质中,这些球体由内质网的脂双层和修饰的env L蛋白为主要蛋白成份组成。通过上述方法形成的颗粒非常稳定,并可通过重复使用氧化铯和蔗糖梯度离心的方法纯化,而这些纯化方法为同业所熟知。
质粒DNA可以通过电极通导(electroporation)法加入含env L蛋白的颗粒,这些包含DNA的颗粒被证实可以促进DNA特异地进入肝细胞(通过在细胞培养水平和直接注射进移植人肝癌细胞的裸鼠的实验)。Yamada等人(2001a)建议这样的球状载体可用于将核酸或其它分子特异性地导入肝脏。

发明内容
本发明的主要目的是提供一种用于血友病治疗的非病毒球状载体,该球状载体,由包含修饰的乙肝病毒env L蛋白的双脂层构成,这样的结构既减弱或消除了S肽引起的免疫反应,又保证了肝靶向性的信号仍暴露在球体的表面。本发明的另一目的是提供一种用于治疗A型和B型血友病的第八因子或第九因子的表达结构,该表达结构可以是单链或双链DNA。含有但不限于下列启动子非组织特异,如细胞肥大病毒(cytomegalovirus),Rous肉瘤,和组织特异的启动子,如α-胚胎蛋白、球蛋白、白蛋白和α1-微球蛋白,该表达结构还可以包含其它的基因表达调控因子,包括但不限于强化因子(enhancers),基因内区(introns),多聚A序列和RNA靶向顺序,促进质粒复制的因子,如SV40复制起始因子也可包括在内,来自AAV的末端重复片断(ITR)序列也可包括在表达结构里,用来促进表达结构的稳定性或用于通过AAV Rep蛋白促进与宿主DNA的嵌合。另外,类似ITR顺序的真核DNA转座子/转座子酶(transposon/transposases)系统也可用来促进与宿主DNA的嵌合。
本发明的再一目的是提供一种注射非病毒球载状体治疗血友病的方法,包含恰当表达顺序核酸结构的球状载体通过静脉或动脉注射入体内,通过观察病人体内蛋白质或RNA的表达或疾病表征的改善了解植入基因产品的表达情况。
对本发明的技术方案详细叙述如下本发明一个非病毒的球状载体,它由下列部份组成一个在球状体表面暴露着乙肝病毒外壳(envelope)env蛋白的球状膜和;一个核酸表达结构,包含完整的第八因子或第九因子的表达序列和在肝细胞中有功能的启动子序列。
其中的env蛋白含有突变以降低其抗原性。
其中的表达结构为DNA。
其中的表达结构为双链质粒DNA。
其中的表达结构为RNA。
其中的启动子为非组织特异的启动子。
其中的非组织特异启动子可来自以下来源细胞肥大病毒(cytomegalovirus)启动子,Rous肉瘤启动子,辅酶Q(Ubiquitin)启动子,鸡β-肌动蛋白(β-actin)启动子和延长因子(elongation factor)(EF)-1α启动子。
其中的启动子为肝脏特异的启动子。
其中的肝脏特异启动子来自以下来源α-胚胎蛋白启动子,球蛋白启动子,α1-微球蛋白和白蛋白。
其中的表达结构包括来自腺病毒相关病毒的反向(Inverted)末端序列(AAV-ITR)。
其中的表达结构包括真核细胞的转座子(transposon)和转座子酶(transposase)序列。
其中的表达结构包括第八因子的表达序列。
其中的第八因子包含无意(silent)突变以增加其表达能力。
其中的表达结构包括第九因子的表达序列。
本发明一个非病毒的球状载体,它由以下部份组成一个在球状体表面暴露着乙肝病毒外壳(envelope)env蛋白的球状膜和;一个包含了完整第八因子或第九因子的蛋白质。
其中的env蛋白包含了突变以降低其抗原性。
本发明一个治疗血友病的方法,它由以下部份组成将由表面暴露着乙肝病毒env蛋白球状膜的非病毒球状载体输入具有血友病的个体的血循环中以及;一个由完整的第八因子或第九因子表达序列和在肝细胞中有功能的启动子序列组成的核酸表达结构,以及,监测该病人疾病改善的情况。
其中输入血循环的方法通过静脉注射。
其中输入血循环的方法通过注射入肝动脉或腹腔动脉(hepatic orportal artery)。
本发明一种利用球状载体将第八因子/第九因子进行肝脏基因转移治疗血友病的方法,其优点和达到的功效是該球状载体结构既减弱或消除了S肽引起的免疫反应,又保证了肝靶向性的信号仍暴露在球体的表面。該注射非病毒球载状体治疗血友病的方法,改善了解植入基因產品的表连情况。疗效好,无副作用。
具体实施例方式
血友病是最常见的遗传疾病之一,可由任何一个凝血因子的突变或缺失引起。最常见的为第八因子或第九因子的缺损。目前的治疗方法需要终身补充凝血因子,涉及重复的静脉输入,同时也使病人承受血制品带来的危险。
基於下列原因,血友病很适于基因治疗。第一,相关基因已克隆并易获得;第二,相关蛋白特性了解清楚,它们的激活是通过蛋白的裂解来调控而不是在转录或转译水平来调控,因而蛋白表达水平不需要严密的控制;第三,低水平的蛋白表达已被证明足以引起表征的恢复;第四,虽然肝脏是产生大多数第八、第九因子的生理器官,在身体哪个部位产生这些因子相对并不重要;第五,不少动物模型可用于分析各种治疗方法的效果。即便如此,到目前为止,还没有一个有效的基因转移载体或治疗血友病的方法被开发出来。
本发明为治疗血友病的球状载体,由天然脂球体和在球体内表达第八或第九因子的表达结构组成。该脂球体最好用酵母或昆虫细胞,如Sf9细胞产生,并将修饰的乙肝病毒dnv L蛋白整合于膜层中。球体的产生根据Kuroda(1992)疫苗的产生方法加上Yamada(2001b)的改进,简述如下乙肝病毒env L蛋白由三个区域组成有108或119个残基的pre-S1区域涉及与肝细胞的直接作用;有55个残基的pre-S2区域涉及白蛋白协调的聚合反应以及主要的有226个残基的S蛋白区域。试图在各种真核细胞里产生L蛋白的尝试都没有成功。可能是由于N端出现的pre-S1短蛋白链。为克服这一问题,我们将L蛋白N端的表达序列用鸡溶菌酶信号序列取代,以将N端导入内质网。这一杂合的序列被嵌入酵母(S.cerevisiae)表达载体,然后通过常用的转化方法导入酵母。杂合的L蛋白被大量地生产出来(可达整个酵母蛋白的42%),并被准确地插入膜层。球状体从内质网上分裂出来,形成23纳米的圆球或线状颗粒,并将蛋白包含在颗粒的膜层中。酵母细胞用玻璃球破碎以释放出这些球体,然后这些球体通过数轮不连续的氯化铯和蔗糖梯度离心纯化。从昆虫细胞生产和纯化球状体也通过类似的过程。通过匀浆(homogenization)和差速(differential)离心,一个粗的膜组分可以象从酵母中一样从昆虫细胞中得到。这个粗的膜组分可以象处理酵母细胞一样,通过氯化铯和蔗糖梯度离心分离出纯化的球状体。上述方法可廉价、大量地生产球状体以适应基因转移的需要。这些球状体在低温保存情况下长期稳定,但在重复融解、冷冻情况下会变得不稳定。
球状载体可用来将任何核酸结构,单、双链DNA或RNA或其他基因产品导入肝脏。本发明的一个优选具体化例(preferred embodiment)中,核酸为一双链DNA质粒。该结构至少含有人第八因子(SEQ1 D2)或第九因子(SEQ1 D3)来治疗A型或B型血友病,并含有促进血友病基因转录的启动子。这一结构还可含有其他的调控因子或强化因子(enhancer)来调节基因表达,基因内区(intron)或多聚A序列以促进RNA加工(processing)和基因表达,RNA靶向序列,AAV-ITR或真核转座子(transposon)序列以促进表达盘(cassettes)的稳定和与宿主基因组的整合,以及病毒复制起始序列以促进质粒在宿主中的扩增,这些序列为同业人士所熟知。球状体核酸结构中可包含的序列不象基于病毒基因组的其它基因转移方法那样受限制,因为球状体可容纳相当大量的核酸。
相当数量的启动子(promoter)序列可在肝脏中起作用,这些包括非组织专一的启动子(promoter)如CMV、RSV、辅酶Q(Ubiquitin)、鸡β-肌动蛋白(β-actin)和延长因子(elongation factor)(EF)-1α;也包括组织特异性启动子(promoter)如α-胚胎蛋白,球蛋白α1-微球蛋白及白蛋白。
AAV-ITR序列可被置于所有除了复制起始点以外所有表达和调控序列的两端,这些AAV-ITR序列被证实可以增加基因治疗方法里转入结构的稳定性。另外,这些AAV-ITR序列在AAV-Rep蛋白的帮助下可促进与人类基因组定点的整合,而AAV-Rep蛋白的提供可通过直接将蛋白整合入含核酸结构的球状体或将其表达盘(cassettes)包入同一球状体。
与AAV-ITR序列相似,真核转座子(transposon)序列可结合于所有表达和调控序列之外,促进整合的转座子酶(transposase)可从同一表达盘(cassette)中表达,也可用位于同一球状体中的独立表达盘(cassette)中加以表达。
表达第八因子时需特别注意以下这点。研究表明人类第八因子包含一序列(核甘酸1741到1771,SEQ1 D2)能降低异源(heterologous)蛋白的表达(Fallaux等人,1996),该序列AT含量高,被证实与一细胞核因子结合,并抑制细胞中报告结构(reporterconstruct)的表达。切除该序列或将该序列随机突变产生的是没有活性的第八因子。但是,在基因产品中引入不导致氨基酸顺序变化的silent突变的方法是为同行所熟知可以促进第八因子的表达的。
在一个优选具体化例(preferred embodiment),本发明的核酸结构是通过电极通导(electroporation)的过程进入球状体的。核酸结构与球状体充分混合,加上水达到最终所需体积,然后转入一电极通导糟(electroporation curette)电压和电阻因curette(糟)的大小(空隙长度)和糟(curette)中物质的体积而有很大差异。行业中人士熟知如何调节这些参数以达到最大程度地转移核酸进入球状体并将球状体的损伤降到最低。
另外,核酸可以通过同业中熟知的用包含核酸脂质体与球状体融合的方法将核酸导入球状体(Dzau等人,1996)发明中的核酸结构通过混合(vortexing)包埋入脂质体,脂质体的组成可是已知的磷脂和膜组分(如磷酸胆碱,胆固醇)或市场上可买到的特有的膜组分混合物(如Gibco BRL生成的Lipofectamine)。包埋了核酸的脂质体与来源于酵母或昆虫细胞的球状体在37℃下共同培育10-30分钟后将自行融合。
此外,第八因子或第九因子蛋白本身可以直接包入本发明中的球状体。第八(SEQ ID4)或第九(SEQ ID5)因子蛋白可以通过多种为同业人士所熟知的方法获得。含有这些蛋白的高浓度溶液可与纯化的球状体混合,通过渗透压冲击(Osmotic shock)或超声(sonication)的方法促进蛋白进入球体。蛋白也可通过混合(Vortexing)或超声(sonication)先包入人工膜,这些包含蛋白的人工膜然后可以与源于乙肝病毒的球状体融合。
本发明包含核酸或蛋白的非病毒球状载体可由静脉或动脉注射进入人体。为增加输送效率,球状载体可以直接注射进肝动脉或腹腔动脉(hepatic or portal artery)。病人被定期观测第八或第九因子的出现或体征的改善。注射非病毒球状体的量因启动子的强弱、整合序列、每个球状体包含质粒的量以及许多为同业所熟知的其它因素而改变。由于检测病人健康状况的方法为人熟知,有效的剂量很容易被确定。
序列表<110>肯尼斯·R·.陈星岛雅彦<120>利用球状载体将第八因子/第九因子进行肝脏基因转移治疗血友病的方法<130>6627-PA1170<150>60/286,314<151>2001-04-25<160>5<170>PatentIn version 3.1<210>1<211>9029<212>DNA<213>Homo sapiens<400>1gcttagtgct gagcacatcc agtgggtaaa gttccttaaa atgctctgca aagaaattgg 60gacttttcat taaatcagaa attttacttt tttcccctcc tgggagctaa agatatttta120gagaagaatt aaccttttgc ttctccagtt gaacatttgt agcaataagt catgcaaata180gagctctcca cctgcttctt tctgtgcctt ttgcgattct gctttagtgc caccagaaga240tactacctgg gtgcagtgga actgtcatgg gactatatgc aaagtgatct cggtgagctg300cctgtggacg caagatttcc tcctagagtg ccaaaatctt ttccattcaa cacctcagtc360gtgtacaaaa agactctgtt tgtagaattc acggatcacc ttttcaacat cgctaagcca420aggccaccct ggatgggtct gctaggtcct accatccagg ctgaggttta tgatacagtg480gtcattacac ttaagaacat ggcttcccat cctgtcagtc ttcatgctgt tggtgtatcc540tactggaaag cttctgaggg agctgaatat gatgatcaga ccagtcaaag ggagaaagaa600gatgataaag tcttccctgg tggaagccat acatatgtct ggcaggtcct gaaagagaat660ggtccaatgg cctctgaccc actgtgcctt acctactcat atctttctca tgtggacctg720gtaaaagact tgaattcagg cctcattgga gccctactag tatgtagaga agggagtctg780gccaaggaaa agacacagac cttgcacaaa tttatactac tttttgctgt atttgatgaa840gggaaaagtt ggcactcaga aacaaagaac tccttgatgc aggataggga tgctgcatct900gctcgggcct ggcctaaaat gcacacagtc aatggttatg taaacaggtc tctgccaggt960ctgattggat gccacaggaa atcagtctat tggcatgtga ttggaatggg caccactcct 1020
gaagtgcact caatattcct cgaaggtcac acatttcttg tgaggaacca tcgccaggcg 1080tccttggaaa tctcgccaat aactttcctt actgctcaaa cactcttgat ggaccttgga 1140cagtttctac tgttttgtca tatctcttcc caccaacatg atggcatgga agcttatgtc 1200aaagtagaca gctgtccaga ggaaccccaa ctacgaatga aaaataatga agaagcggaa 1260gactatgatg atgatcttac tgattctgaa atggatgtgg tcaggtttga tgatgacaac 1320tctccttcct ttatccaaat tcgctcagtt gccaagaagc atcctaaaac ttgggtacat 1380tacattgctg ctgaagagga ggactgggac tatgctccct tagtcctcgc ccccgatgac 1440agaagttata aaagtcaata tttgaacaat ggccctcagc ggattggtag gaagtacaaa 1500aaagtccgat ttatggcata cacagatgaa acctttaaga ctcgtgaagc tattcagcat 1560gaatcaggaa tcttgggacc tttactttat ggggaagttg gagacacact gttgattata 1620tttaagaatc aagcaagcag accatataac atctaccctc acggaatcac tgatgtccgt 1680cctttgtatt caaggagatt accaaaaggt gtaaaacatt tgaaggattt tccaattctg 1740ccaggagaaa tattcaaata taaatggaca gtgactgtag aagatgggcc aactaaatca 1800gatcctcggt gcctgacccg ctattactct agtttcgtta atatggagag agatctagct 1860tcaggactca ttggccctct cctcatctgc tacaaagaat ctgtagatca aagaggaaac 1920cagataatgt cagacaagag gaatgtcatc ctgttttctg tatttgatga gaaccgaagc 1980tggtacctca cagagaatat acaacgcttt ctccccaatc cagctggagt gcagcttgag 2040gatccagagt tccaagcctc caacatcatg cacagcatca atggctatgt ttttgatagt 2100ttgcagttgt cagtttgttt gcatgaggtg gcatactggt acattctaag cattggagca 2160cagactgact tcctttctgt cttcttctct ggatatacct tcaaacacaa aatggtctat 2220gaagacacac tcaccctatt cccattctca ggagaaactg tcttcatgtc gatggaaaac 2280ccaggtctat ggattctggg gtgccacaac tcagactttc ggaacagagg catgaccgcc 2340ttactgaagg tttctagttg tgacaagaac actggtgatt attacgagga cagttatgaa 2400gatatttcag catacttgct gagtaaaaac aatgccattg aaccaagaag cttctcccag 2460aattcaagac accctagcac taggcaaaag caatttaatg ccaccacaat tccagaaaat 2520gacatagaga agactgaccc ttggtttgca cacagaacac ctatgcctaa aatacaaaat 2580gtctcctcta gtgatttgtt gatgctcttg cgacagagtc ctactccaca tgggctatcc 2640ttatctgatc tccaagaagc caaatatgag actttttctg atgatccatc acctggagca 2700atagacagta ataacagcct gtctgaaatg acacacttca ggccacagct ccatcacagt 2760
ggggacatgg tatttacccc tgagtcaggc ctccaattaa gattaaatga gaaactgggg 2820acaactgcag caacagagtt gaagaaactt gatttcaaag tttctagtac atcaaataat 2880ctgatttcaa caattccatc agacaatttg gcagcaggta ctgataatac aagttcctta 2940ggacccccaa gtatgccagt tcattatgat agtcaattag ataccactct atttggcaaa 3000aagtcatctc cccttactga gtctggtgga cctctgagct tgagtgaaga aaataatgat 3060tcaaagttgt tagaatcagg tttaatgaat agccaagaaa gttcatgggg aaaaaatgta 3120tcgtcaacag agagtggtag gttatttaaa gggaaaagag ctcatggacc tgctttgttg 3180actaaagata atgccttatt caaagttagc atctctttgt taaagacaaa caaaacttcc 3240aataattcag caactaatag aaagactcac attgatggcc catcattatt aattgagaat 3300agtccatcag tctggcaaaa tatattagaa agtgacactg agtttaaaaa agtgacacct 3360ttgattcatg acagaatgct tatggacaaa aatgctacag ctttgaggct aaatcatatg 3420tcaaataaaa ctacttcatc aaaaaacatg gaaatggtcc aacagaaaaa agagggcccc 3480attccaccag atgcacaaaa tccagatatg tcgttcttta agatgctatt cttgccagaa 3540tcagcaaggt ggatacaaag gactcatgga aagaactctc tgaactctgg gcaaggcccc 3600agtccaaagc aattagtatc cttaggacca gaaaaatctg tggaaggtca gaatttcttg 3660tctgagaaaa acaaagtggt agtaggaaag ggtgaattta caaaggacgt aggactcaaa 3720gagatggttt ttccaagcag cagaaaccta tttcttacta acttggataa tttacatgaa 3780aataatacac acaatcaaga aaaaaaaatt caggaagaaa tagaaaagaa ggaaacatta 3840atccaagaga atgtagtttt gcctcagata catacagtga ctggcactaa gaatttcatg 3900aagaaccttt tcttactgag cactaggcaa aatgtagaag gttcatatga cggggcatat 3960gctccagtac ttcaagattt taggtcatta aatgattcaa caaatagaac aaagaaacac 4020acagctcatt tctcaaaaaa aggggaggaa gaaaacttgg aaggcttggg aaatcaaacc 4080aagcaaattg tagagaaata tgcatgcacc acaaggatat ctcctaatac aagccagcag 4140aattttgtca cgcaacgtag taagagagct ttgaaacaat tcagactccc actagaagaa 4200acagaacttg aaaaaaggat aattgtggat gacacctcaa cccagtggtc caaaaacatg 4260aaacatttga ccccgagcac cctcacacag atagactaca atgagaagga gaaaggggcc 4320attactcagt ctcccttatc agattgcctt acgaggagtc atagcatccc tcaagcaaat 4380agatctccat tacccattgc aaaggtatca tcatttccat ctattagacc tatatatctg 4440accagggtcc tattccaaga caactcttct catcttccag cagcatctta tagaaagaaa 4500
gattctgggg tccaagaaag cagtcatttc ttacaaggag ccaaaaaaaa taacctttct 4560ttagccattc taaccttgga gatgactggt gatcaaagag aggttggctc cctggggaca 4620agtgccacaa attcagtcac atacaagaaa gttgagaaca ctgttctccc gaaaccagac 4680ttgcccaaaa catctggcaa agttgaattg cttccaaaag ttcacattta tcagaaggac 4740ctattcccta cggaaactag caatgggtct cctggccatc tggatctcgt ggaagggagc 4800cttcttcagg gaacagaggg agcgattaag tggaatgaag caaacagacc tggaaaagtt 4860ccctttctga gagtagcaac agaaagctct gcaaagactc cctccaagct attggatcct 4920cttgcttggg ataaccacta tggtactcag ataccaaaag aagagtggaa atcccaagag 4980aagtcaccag aaaaaacagc ttttaagaaa aaggatacca ttttgtccct gaacgcttgt 5040gaaagcaatc atgcaatagc agcaataaat gagggacaaa ataagcccga aatagaagtc 5100acctgggcaa agcaaggtag gactgaaagg ctgtgctctc aaaacccacc agtcttgaaa 5160cgccatcaac gggaaataac tcgtactact cttcagtcag atcaagagga aattgactat 5220gatgatacca tatcagttga aatgaagaag gaagattttg acatttatga tgaggatgaa 5280aatcagagcc cccgcagctt tcaaaagaaa acacgacact attttattgc tgcagtggag 5340aggctctggg attatgggat gagtagctcc ccacatgttc taagaaacag ggctcagagt 5400ggcagtgtcc ctcagttcaa gaaagttgtt ttccaggaat ttactgatgg ctcctttact 5460cagcccttat accgtggaga actaaatgaa catttgggac tcctggggcc atatataaga 5520gcagaagttg aagataatat catggtaact ttcagaaatc aggcctctcg tccctattcc 5580ttctattcta gccttatttc ttatgaggaa gatcagaggc aaggagcaga acctagaaaa 5640aactttgtca agcctaatga aaccaaaact tacttttgga aagtgcaaca tcatatggca 5700cccactaaag atgagtttga ctgcaaagcc tgggcttatt tctctgatgt tgacctggaa 5760aaagatgtgc actcaggcct gattggaccc cttctggtct gccacactaa cacactgaac 5820cctgctcatg ggagacaagt gacagtacag gaatttgctc tgtttttcac catctttgat 5880gagaccaaaa gctggtactt cactgaaaat atggaaagaa actgcagggc tccctgcaat 5940atccagatgg aagatcccac ttttaaagag aattatcgct tccatgcaat caatggctac 6000ataatggata cactacctgg cttagtaatg gctcaggatc aaaggattcg atggtatctg 6060ctcagcatgg gcagcaatga aaacatccat tctattcatt tcagtggaca tgtgttcact 6120gtacgaaaaa aagaggagta taaaatggca ctgtacaatc tctatccagg tgtttttgag 6180acagtggaaa tgttaccatc caaagctgga atttggcggg tggaatgcct tattggcgag 6240
catctacatg ctgggatgag cacacttttt ctggtgtaca gcaataagtg tcagactccc 6300ctgggaatgg cttctggaca cattagagat tttcagatta cagcttcagg acaatatgga 6360cagtgggccc caaagctggc cagacttcat tattccggat caatcaatgc ctggagcacc 6420aaggagccct tttcttggat caaggtggat ctgttggcac caatgattat tcacggcatc 6480aagacccagg gtgcccgtca gaagttctcc agcctctaca tctctcagtt tatcatcatg 6540tatagtcttg atgggaagaa gtggcagact tatcgaggaa attccactgg aaccttaatg 6600gtcttctttg gcaatgtgga ttcatctggg ataaaacaca atatttttaa ccctccaatt 6660attgctcgat acatccgttt gcacccaact cattatagca ttcgcagcac tcttcgcatg 6720gagttgatgg gctgtgattt aaatagttgc agcatgccat tgggaatgga gagtaaagca 6780atatcagatg cacagattac tgcttcatcc tactttacca atatgtttgc cacctggtct 6840ccttcaaaag ctcgacttca cctccaaggg aggagtaatg cctggagacc tcaggtgaat 6900aatccaaaag agtggctgca agtggacttc cagaagacaa tgaaagtcac aggagtaact 6960actcagggag taaaatctct gcttaccagc atgtatgtga aggagttcct catctccagc 7020agtcaagatg gccatcagtg gactctcttt tttcagaatg gcaaagtaaa ggtttttcag 7080ggaaatcaag actccttcac acctgtggtg aactctctag acccaccgtt actgactcgc 7140taccttcgaa ttcaccccca gagttgggtg caccagattg ccctgaggat ggaggttctg 7200ggctgcgagg cacaggacct ctactgaggg tggccactgc agcacctgcc actgccgtca 7260cctctccctc ctcagctcca gggcagtgtc cctccctggc ttgccttcta cctttgtgct 7320aaatcctagc agacactgcc ttgaagcctc ctgaattaac tatcatcagt cctgcatttc 7380tttggtgggg ggccaggagg gtgcatccaa tttaacttaa ctcttaccta ttttctgcag 7440ctgctcccag attactcctt ccttccaata taactaggca aaaagaagtg aggagaaacc 7500tgcatgaaag cattcttccc tgaaaagtta ggcctctcag agtcaccact tcctctgttg 7560tagaaaaact atgtgatgaa actttgaaaa agatatttat gatgttaaca tttcaggtta 7620agcctcatac gtttaaaata aaactctcag ttgtttatta tcctgatcaa gcatggaaca 7680aagcatgttt caggatcaga tcaatacaat cttggagtca aaaggcaaat catttggaca 7740atctgcaaaa tggagagaat acaataacta ctacagtaaa gtctgtttct gcttccttac 7800acatagatat aattatgtta tttagtcatt atgaggggca cattcttatc tccaaaacta 7860gcattcttaa actgagaatt atagatgggg ttcaagaatc cctaagtccc ctgaaattat 7920ataaggcatt ctgtataaat gcaaatgtgc atttttctga cgagtgtcca tagatataaa 7980
gccatttggt cttaattctg accaataaaa aaataagtca ggaggatgca attgttgaaa 8040gctttgaaat aaaataacaa tgtcttcttg aaatttgtga tggccaagaa agaaaatgat 8100gatgacatta ggcttctaaa ggacatacat ttaatatttc tgtggaaata tgaggaaaat 8160ccatggttat ctgagatagg agatacaaac tttgtaattc taataatgca ctcagtttac 8220tctctccctc tactaatttc ctgctgaaaa taacacaaca aaaatgtaac aggggaaatt 8280atataccgtg actgaaaact agagtcctac ttacatagtt gaaatatcaa ggaggtcaga 8340agaaaattgg actggtgaaa acagaaaaaa cactccagtc tgccatatca ccacacaata 8400ggatccccct tcttgccctc cacccccata agattgtgaa gggtttactg ctccttccat 8460ctgcctgacc ccttcactat gactacacag aatctcctga tagtaaaggg ggctggaggc 8520aaggataagt tatagagcag ttggaggaag catccaaaga ttgcaaccca gggcaaatgg 8580aaaacaggag atcctaatat gaaagaaaaa tggatcccaa tctgagaaaa ggcaaaagaa 8640tggctacttt tttctatgct ggagtatttt ctaataatcc tgcttgaccc ttatctgacc 8700tctttggaaa ctataacata gctgtcacag tatagtcaca atccacaaat gatgcaggtg 8760caaatggttt atagccctgt gaagttctta aagtttagag gctaacttac agaaatgaat 8820aagttgtttt gttttatagc ccggtagagg agttaacccc aaaggtgata tggttttatt 8880tcctgttatg tttaacttga taatcttatt ttggcattct tttcccattg actatataca 8940tctctatttc tcaaatgttc atggaactag ctcttttatt ttcctgctgg tttcttcagt 9000aatgagttaa ataaaacatt gacacatac 9029<210>2<211>2804<212>DNA<213>Homo sapiens<400>2accactttca caatctgcta gcaaaggtta tgcagcgcgt gaacatgatc atggcagaat 60caccaggcct catcaccatc tgccttttag gatatctact cagtgctgaa tgtacagttt120ttcttgatca tgaaaacgcc aacaaaattc tgaatcggcc aaagaggtat aattcaggta180aattggaaga gtttgttcaa gggaaccttg agagagaatg tatggaagaa aagtgtagtt240ttgaagaagc acgagaagtt tttgaaaaca ctgaaagaac aactgaattt tggaagcagt300atgttgatgg agatcagtgt gagtccaatc catgtttaaa tggcggcagt tgcaaggatg360acattaattc ctatgaatgt tggtgtccct ttggatttga aggaaagaac tgtgaattag420atgtaacatg taacattaag aatggcagat gcgagcagtt ttgtaaaaat agtgctgata480
acaaggtggt ttgctcctgt actgagggat atcgacttgc agaaaaccag aagtcctgtg540aaccagcagt gccatttcca tgtggaagag tttctgtttc acaaacttct aagctcaccc600gtgctgagac tgtttttcct gatgtggact atgtaaattc tactgaagct gaaaccattt660tggataacat cactcaaagc acccaatcat ttaatgactt cactcgggtt gttggtggag720aagatgccaa accaggtcaa ttcccttggc aggttgtttt gaatggtaaa gttgatgcat780tctgtggagg ctctatcgtt aatgaaaaat ggattgtaac tgctgcccac tgtgttgaaa840ctggtgttaa aattacagtt gtcgcaggtg aacataatat tgaggagaca gaacatacag900agcaaaagcg aaatgtgatt cgaattattc ctcaccacaa ctacaatgca gctattaata960agtacaacca tgacattgcc cttctggaac tggacgaacc cttagtgcta aacagctacg 1020ttacacctat ttgcattgct gacaaggaat acacgaacat cttcctcaaa tttggatctg 1080gctatgtaag tggctgggga agagtcttcc acaaagggag atcagcttta gttcttcagt 1140accttagagt tccacttgtt gaccgagcca catgtcttcg atctacaaag ttcaccatct 1200ataacaacat gttctgtgct ggcttccatg aaggaggtag agattcatgt caaggagata 1260gtgggggacc ccatgttact gaagtggaag ggaccagttt cttaactgga attattagct 1320ggggtgaaga gtgtgcaatg aaaggcaaat atggaatata taccaaggta tcccggtatg 1380tcaactggat taaggaaaaa acaaagctca cttaatgaaa gatggatttc caaggttaat 1440tcattggaat tgaaaattaa cagggcctct cactaactaa tcactttccc atcttttgtt 1500agatttgaat atatacattc tatgatcatt gctttttctc tttacagggg agaatttcat 1560attttacctg agcaaattga ttagaaaatg gaaccactag aggaatataa tgtgttagga 1620aattacagtc atttctaagg gcccagccct tgacaaaatt gtgaagttaa attctccact 1680ctgtccatca gatactatgg ttctccacta tggcaactaa ctcactcaat tttccctcct 1740tagcagcatt ccatcttccc gatcttcttt gcttctccaa ccaaaacatc aatgtttatt 1800agttctgtat acagtacagg atctttggtc tactctatca caaggccagt accacactca 1860tgaagaaaga acacaggagt agctgagagg ctaaaactca tcaaaaacac tactcctttt 1920cctctaccct attcctcaat cttttacctt ttccaaatcc caatccccaa atcagttttt 1980ctctttctta ctccctctct cccttttacc ctccatggtc gttaaaggag agatggggag 2040catcattctg ttatacttct gtacacagtt atacatgtct atcaaaccca gacttgcttc 2100catagtggag acttgctttt cagaacatag ggatgaagta aggtgcctga aaagtttggg 2160ggaaaagttt ctttcagaga gttaagttat tttatatata taatatatat ataaaatata 2220
taatatacaa tataaatata tagtgtgtgt gtgtatgcgt gtgtgtagac acacacgcat 2280acacacatat aatggaagca ataagccatt ctaagagctt gtatggttat ggaggtctga 2340ctaggcatga tttcacgaag gcaagattgg catatcattg taactaaaaa agctgacatt 2400gacccagaca tattgtactc tttctaaaaa taataataat aatgctaaca gaaagaagag 2460aaccgttcgt ttgcaatcta cagctagtag agactttgag gaagaattca acagtgtgtc 2520ttcagcagtg ttcagagcca agcaagaagt tgaagttgcc tagaccagag gacataagta 2580tcatgtctcc rttaactagc ataccccgaa gtggagaagg gtgcagcagg ctcaaaggca 2640taagtcattc caatcagcca actaagttgt ccttttctgg tttcgtgttc accatggaac 2700attttgatta tagttaatcc ttctatcttg aatcttctag agagttgctg accaactgac 2760gtatgtttcc ctttgtgaat taataaactg gtgttctggt tcat2804<210>3<211>1286<212>DNA<213>Hepatitis B virus<400>3gtcgagtata aaaacaatga gatctttgtt gatcttggtt ttgtgtttct tgccattggc 60tgctttgggt aaggttcgac aaggcatggg aggttggtct tccaaacctc gataaggcat120ggggacgaat ctttctgttc ccaatcctct gggattcttt cccgatcacc agttggaccc180tgcgttcgga gccaactcaa acaatccaga ttgggacttc aaccccaaca aggatcaatg240gccagaggca aatcaggtag gagcgggagc attcgggcca gggttcaccc caccacacgg300cggtcttttg gggtggagcc ctcaggctca gggcatattg acaacagtgc cagcagcacc360tcctcctgcc tccaccaatc ggcagtcagg aagacagcct actcccatct ctccacctct420aagagacagt catcctcagg ccatgcagtg gaattccaca acattccacc aagctctgct480agatcccaga gtgaggggcc tatattttcc tgctggtggc tccagttccg gaacagtaaa540ccctgttccg actactgcct cacccatatc tggggaccct gcaccgaaca tggagaacac600aacatcagga ttcctaggac ccctgctcgt gttacaggcg gggtttttct tgttgacaag660aatcctcaca ataccacaga gtctagactc gtggtggact tctctcaatt ttctaggggg720agcacccacg tgtcctggcc aaaattcgca gtccccaacc tccaatcact caccaacctc780ttgtcctcca atttgtcctg gctatcgctg gatgtgtctg cggcgtttta tcatattcct840cttcatcctg ctgctatgcc tcatcttctt gttggttctt ctggactacc aaggtatgtt900
gcccgtttgt cctctacttc caggaacatc aaccaccagc acggggccat gcaagacctg960cacgattcct gctcaaggaa cctctatgtt tccctcttgt tgctgtacaa aaccttcgga 1020cggaaactgc acttgtattc ccatcccatc atcctgggct ttcgcaagat tcctatggga 1080gtgggcctca gtccgtttct cctggctcag tttactagtg ccatttgttc agtggttcgt 1140agggctttcc cccactgttt ggctttcagt tatatggatg atgtggtatt gggggccaag 1200tctgtacaac atcttgagtc cctttttacc tctattacca attttctttt gtctttgggt 1260atacatttaa attgaattga attgaa1286<210>4<211>2351<212>PRT<213>Homo sapiens<400>4Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe1 5 10 15Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser20 25 30Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg35 40 45Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val50 55 60Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile65 70 75 80Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln85 90 95Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser100 105 110His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser115 120 125Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu145 150 155 160Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser165 170 175Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile180 185 190Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr195 200 205Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly210 215 220Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp225 230 235 240Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr245 250 255Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val260 265 270Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile275 280 285Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser290 295 300Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met305 310 315 320Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His325 330 335Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro340 345 350Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp355 360 365Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr385 390 395 400Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro405 410 415Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn420 425 430Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met435 440 445Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu450 455 460Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu465 470 475 480Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro485 490 495His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys500 505 510Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe515 520 525Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp530 535 540Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg545 550 555 560Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu565 570 575Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val580 585 590Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp610 615 620Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val625 630 635 640Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp645 650 655Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe660 665 670Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr675 680 685Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro690 695 700Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly705 710 715 720Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp725 730 735Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys740 745 750Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro755 760 765Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp770 775 780Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys785 790 795 800Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser805 810 815Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr820 825 830Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn835 840 845
Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly850 855 860Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu865 870 875 880Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lya Lys Leu Asp Phe Lys885 890 895Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn900 905 910Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met915 920 925Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys930 935 940Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu945 950 955 960Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu965 970 975Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe980 985 990Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala995 10001005Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser101010151020Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser102510301035Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu104010451050Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg105510601065Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met
107010751080Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln108510901095Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met110011051110Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile111511201125Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro113011351140Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu114511501155Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys116011651170Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro117511801185Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu119011951200Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu120512101215Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile122012251230His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu123512401245Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr125012551260Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn126512701275Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu128012851290
Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu129513001305Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln131013151320Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg132513301335Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp134013451350Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro135513601365Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala137013751380Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser138513901395Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser140014051410Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe141514201425Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys143014351440Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys144514501455Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly146014651470Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser147514801485Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp149014951500Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His150515101515
Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser152015251530Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr153515401545Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val155015551560Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser156515701575Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln158015851590Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys159516001605Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys161016151620Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys162516301635Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg164016451650Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu165516601665Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr167016751680Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile168516901695Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys170017051710Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr171517201725Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser
173017351740Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr174517501755Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu176017651770His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp177517801785Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser179017951800Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly180518101815Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr182018251830Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu1835l8401845Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu185018551860Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His186518701875Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln188018851890Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp189519001905Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn191019151920Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His192519301935Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met194019451950
Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser195519601965Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr197019751980Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr198519901995Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly200020052010Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly201520202025Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro203020352040Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala204520502055Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His206020652070Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser207520802085Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile20902095 2100Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser210521102115Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr212021252130Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn213521402145Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile215021552160Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg216521702175
Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys218021852190Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln219522002205Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser221022152220Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp222522302235Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe224022452250Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys225522602265Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser227022752280Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys228522902295Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val230023052310Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His231523202325Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu233023352340Gly Cys Glu Ala Gln Asp Leu Tyr23452350<210>5<211>461<212>PRT<213>Homo sapiens<400>5Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu20 25 30Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn35 40 45Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys50 55 60Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn65 70 75 80Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln85 90 95Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile100 105 110Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys115 120 125Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe130 135 140Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly145 150 155 160Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe165 170 175Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala180 185 190Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu195 200 205Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe210 215 220Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp225 230 235 240Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly260 265 270Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu275 280 285His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn290 295 300Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu305 310 315 320Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile325 330 335Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr340 345 350Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val355 360 365Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg370 375 380Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His385 390 395 400Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val405 410 415Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly420 425 430Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser435 440 445Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr450 455 460
权利要求
1.一个非病毒的球状载体,其特征在于它由下列部份组成一个在球状体表面暴露着乙肝病毒外壳(envelope)env蛋白的球状膜和;一个核酸表达结构,包含完整的第八因子或第九因子的表达序列和在肝细胞中有功能的启动子序列。
2.依据权利要求1所述之该球状载体,其中的env蛋白含有突变以降低其抗原性。
3.依据权利要求1所述之该球状载体,其中的表达结构为DNA。
4.依据权利要求1所述之该球状载体,其中的表达结构为双链质粒DNA。
5.依据权利要求1所述之该球状载体,其中的表达结构为RNA。
6.依据权利要求1所述之该球状载体,其中的启动子为非组织特异的启动子。
7.依据权利要求6所述之该球状载体,其中的非组织特异启动子可来自以下来源细胞肥大病毒(cytomegalovirus)启动子,Rous肉瘤启动子,辅酶Q(Ubiquitin)启动子,鸡β-肌动蛋白(β-actin)启动子和延长因子(elongation factor)(EF)-1α启动子。
8.依据权利要求1所述之该球状载体,其中的启动子为肝脏特异的启动子。
9.依据权利要求8所述之该球状载体,其中的肝脏特异启动子来自以下来源α-胚胎蛋白启动子,球蛋白启动子,α1-微球蛋白和白蛋白。
10.依据权利要求1所述之该球状载体,其中的表达结构包括来自腺病毒相关病毒的反向(Inverted)末端序列(AAV-ITR)。
11.依据权利要求1所述之该球状载体,其中的表达结构包括真核细胞的转座子(transposon)和转座子酶(transposase)序列。
12.依据权利要求1所述之该球状载体,其中的表达结构包括第八因子的表达序列。
13.依据权利要求12所述之该球状载体,其中的第八因子包含无意(silent)突变以增加其表达能力。
14.依据权利要求1所述之该球状载体,其中的表达结构包括第九因子的表达序列。
15.一个非病毒的球状载体,其特征在于它由以下部份组成一个在球状体表面暴露着乙肝病毒外壳(envelope)env蛋白的球状膜和;一个包含了完整第八因子或第九因子的蛋白质。
16.依据权利要求15所述之该球状载体,其中的env蛋白包含了突变以降低其抗原性。
17.一个治疗血友病的方法,其特征在于它由以下部份组成将由表面暴露着乙肝病毒env蛋白球状膜的非病毒球状载体输入具有血友病的个体的血循环中以及;一个由完整的第八因子或第九因子表达序列和在肝细胞中有功能的启动子序列组成的核酸表达结构,以及;监测该病人疾病改善的情况。
18.依据权利要求17所述之该方法,其中输入血循环的方法通过静脉注射。
19.依据权利要求17所述之该方法,其中输入血循环的方法通过注射入肝动脉或腹腔动脉(hepatic or portal artery)。
全文摘要
本发明是利用球状载体将第八因子/第九因子进行肝脏基因转移治疗血友病的方法,用于血友病治疗的非病毒球状载体,由包含修饰的乙肝病毒env L蛋白的双脂层构成,这样的结构既减弱或消除了S肽引起的免疫反应,又保证了肝靶向性的信号仍暴露在球体的表面。本发明还包括用于治疗A型和B型血友病的第八因子或第九因子的表达结构,该表达结构可以是单链或双链DNA。本发明还包括注射非病毒球状载体治疗血友病的方法,包含恰当表达顺序核酸结构的球状载体通过静脉或动脉注射入体内,通过观察病人体内蛋白质或RNA的表达或疾病表征的改善了解植入基因产品的表达情况。
文档编号C07K14/02GK1520259SQ02810734
公开日2004年8月11日 申请日期2002年4月25日 优先权日2001年4月25日
发明者肯尼斯·R·陈, 肯尼斯 R 陈, 彦, 星岛雅彦 申请人:加州大学校务委员会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1