表观修饰酶SETD2的抗病毒作用及其应用的制作方法

文档序号:11570331阅读:557来源:国知局
表观修饰酶SETD2的抗病毒作用及其应用的制造方法与工艺

本发明涉及生物技术和医学领域,具体地说,是一种表观修饰酶setd2,即含有set结构域的蛋白2(setdomaincontaining2,setd2)在预防或治疗与病毒感染相关的疾病或征状、控制病毒感染导致损伤中的效应、作用机制、实施方法和用途。



背景技术:

感染尤其是病毒感染是一种危害极大的临床常见疾病。人们最初对于机体抗病毒感染的分子机制并不完全了解,随着一类细胞因子——干扰素的发现,机体针对病毒感染所产生的天然免疫细胞和继发的获得性免疫细胞和及其作用的分子生物学基础逐步得到了认识。干扰素(interferon,ifn)是一类具有强大抗病毒功能的细胞因子家族的总称。1957年,alickisaacs和jeanlindenmann教授在研究流感病毒感染鸡胚的过程中发现了一种成分,这种成分能显著地阻止流感病毒的增殖,他们将这种成分命名为干扰素(isaacs,a.等,procrsoclondbbiolsci.1957;927:258-267.)。此后,干扰素家族的细胞因子被陆续发现具有十分广谱且有效的抗病毒效应。目前,干扰素已被广泛应用于临床上防御病毒感染及治疗病毒感染引起的各种疾病。

干扰素家族主要分为三个亚家族:即i型干扰素(ifn-i)、ii型干扰素(ifn-ii)、iii型干扰素(ifn-iii)。i型干扰素是其中种类最多、功能最全的亚家族细胞因子,包含13种ifnα亚型、ifnβ、ifnε、ifnτ、ifnκ、ifnω、ifnδ和ifnζ等。目前研究发现,i型干扰素不仅具有强大的抗病毒功能,还具有抗细菌感染、调节免疫应答及抗肿瘤进展等多种功能。ii型干扰素仅含有一种基因编码的细胞因子产物——ifnγ,它主要由t细胞核自然杀伤性细胞(nk细胞)产生,具有很强的细胞毒性,起细胞杀伤作用。iii型干扰素主要包含ifnλ1、ifnλ2和ifnλ3等,也分别称作白细胞介素(interleukin,il)-29、il-28a和il-28b。iii型干扰素和i型干扰素具有相似的抗病毒功能,但是其抗病毒的活性受到一定程度的限制。其原因为:iii型干扰素的识别受体il-28r仅在表皮细胞中有表达,多数免疫细胞中均不表达iii型干扰素的受体(pestka,s.等,immunol.rev.2004;202,8-32;schoenborn,j.r.等,adv.immunol.2007;96,41-101;o’brien,t.r.等,j.interferoncytokineres.2014;34,829-838.)。

感染机体的不同病原体中一般含有相似的结构或分子特征,或为病毒相对保守的序列特征,或为病原微生物所共有的组成型表达分子等。这些相似的结构、特征被统称为病原体相关分子模式(pathogenassociatedmolecularpatterns,pamps);而与之相互识别的细胞表面受体则被称为模式识别受体(patternrecognitionreceptors,prrs)。例如:特异性识别rna病毒的ppr有rnahelicasesretinoicacid-induciblegenei(rig-i,也叫ddx58)和melanomadifferentiation-associatedgene5(mda5,也叫ifih1)等,它们主要识别感染在细胞内的rna病毒中富含at元件的部分。特异性识别dna病毒的prr有dna-dependentactivatorofifn-regulatoryfactors(dai,也称作zbp1)和cytosolicgampsynthase(cgas,也称作mb21d1)等(goubau,d.等;immunity,2013;38,855-869.)。这些ppr识别病毒后,通过激发宿主内的免疫应答信号通路,诱导产生大量的i型干扰素,从而迅速的建立起机体抗感染的第一道防线,抵御病原体的感染。

当机体产生大量的ifn-i后,ifn-i便以自分泌或旁分泌的方式作用于自身或临近细胞,与细胞表面受体ifnar1和ifnar2结合激活细胞内信号通路。识别了ifn-i的受体ifnar1和ifnar2分别磷酸化激活其下游底物januskinase1(jak1)和non-receptortyrosinekinase2(tyk2)。活化的jak1和tyk2进一步催化下游的转录因子signaltransducerandactivatoroftranscription1(stat1)和stat2发生磷酸化修饰,激活其转录因子的活性。活化的stat1和stat2进而招募ifn-regulatoryfactor9(irf9),形成活化型的stat1-stat2-irf9三聚体复合物——theinterferon-stimulatedgenefactor3(isgf3)。复合物isgf3转位入核,识别含有高度保守dna序列的“tttcnntttc”的ifn刺激应答元件,诱导一系列ifn刺激基因(ifn-stimulatedgene,isg)的表达。除此之外,ifn-i信号活化后还能诱导stat1形成同源二聚体复合物,在不需要irf9和stat2的参与的情况下,识别序列为“ttcnnngaa”的保守dna基序(γ活化的序列,gamma-activatedsequence,gas),诱导启动子区含有该基序的isg基因表达(stark,g.r.等,immunity,2012;36,503-514.)。ifn-i同样可以通过诱导其他的stat蛋白(包括stat3、stat4、stat5a和stat5b)激活isg基因的表达。除了stat蛋白依赖的信号外,ifn-i也可诱导phosphoinositide3-kinase(pi3k)-mammaliantargetofrapamycin(mtor)信号通路和multiplemitogen-activatedproteinkinase(mapk)信号通路的活化,刺激另一些isg基因的表达。isg基因所编码的蛋白在各个方面发挥着抗病毒功能,如促进病毒的降解、抑制病毒的复制、破坏病毒从细胞中释放以及抵抗病毒的二次感染等。总而言之,ifn-i通过诱导细胞内多条信号通路的活化,最大化地发挥其抗病毒的效应(ivashkiv,l.b.等,naturerev.immunol.2014;14,36-49.)。

此外,ifn-i还具有免疫调节功能。如促进cd4阳性t细胞和cd8阳性t细胞的增殖和其细胞杀伤能力(havenar-daughton,c.等,j.immunol.2006;176,3315-3319;marshall,h.d.等,j.virol.2011;85,5929-5939.);增强nk细胞的免疫反应(martinez,j.等,j.immunol.2008;180,1592-1597.);激活b细胞、增强b细胞的抗体识别和类别转换(classswithing)(lebon,a.等,immunity;2001,14,461-470.)等。

临床上,ifn-i已经应用于治疗多种疾病。例如,ifnα2a以及聚乙二醇缓释过的ifn(peglated-ifnα)已经被美国食品及药物管理局批准用于治疗乙型肝炎病毒(hepatitisbvirus,hbv)和丙型肝炎病毒(hepatitiscvirus,hcv)感染所引起的肝炎(lau,g.k.等.nengljmed,2005;352,2682-2695.)。ifn-α2a和2b也被应用到多毛细胞白血病(golomb,h.m.等,jclinoncol.1986;4,900-905.),及黑色素瘤(bart,r.s.等,cancerres.1980;40,614-619.)卡波济肉瘤(real,f.x.等,jclinoncol.1986;4,544-551.)等实体瘤的治疗中。最近,ifnβ在治疗多发性硬化症(multiplesclerosis,ms)——一种中枢神经系统白质炎性脱髓鞘病变的自身免疫性疾病的应用中也取得良好的效果(annibali,v.等,cytokinegrowthfactorrev.2015;26,221-228.)。

然而,尽管ifn已经取得了诸多的治疗效果,但也产生了一些临床不良反应,如可能导致患者甲状腺功能异常(goischke,h.k.等,verdauungskrankheiten,2004;22,275-283.)、肾功能降低乃至衰竭等(stein,d.f.等,digestivediseases&sciences,2001;46,530-534.),部分患者还出现了系统性红斑性狼疮等自身性免疫疾病症状(crowm.k.等,autoimmunity,2003;36,481-490.)。并且,ifn对一些病毒慢性感染疾病的疗效也不显著。例如,干扰素对hbve抗原(hepatitisbeantigen,hbeag)阳性的乙肝病人治疗有效率较高,为33%,而在hbeag阴性的乙肝病人中ifn治疗的有效率仅有25%(scaglione,s.j.等,gastroenterology.2012;142,1360-1368.)。由于ifn通过激活细胞内免疫应答信号和诱导大量抗病毒蛋白发挥其抗病毒机制(lucifora,j.等,science.2014;343,1221-1228;yan,r.等,j.virol.2015;89,9200-9212.),因此,开发出一种有效增强ifn抗病毒效应的治疗方案是目前迫切需要解决的问题。

含有set结构域的蛋白2(setdomaincontaining2,setd2),又名亨廷顿结合蛋白b(huntingtininteractingproteinb,hypb),是一种含有set结构域的组蛋白甲基转移酶,主要负责催化组蛋白h3第36位赖氨酸的三甲基化修饰(h3k36me3)(edmunds,j.w.等,emboj.2008;27,406-420.)。目前研究发现了setd2在很多生命活动中的重要功能。例如:setd2可以促进蛋白质翻译过程中的选择性剪切(luco,r.f.等,science,2010;327,996-1000.)、维持转录的延伸(carvalho;s.等,nucleicacidsres.2013;41,2881-2893.)、参与dna损伤后修复(carvalho;s.等,elife.2014,3,e02482;pfister;s.x.等,cellrep.2014;7,2006-2018.)、促进胚胎发育(zhang,,y.等,cellrep.2014,;8,1989-2002.)等。此外,setd2的突变与多种肿瘤的疾病进展相关,包括急性淋巴细胞白血病(zhu,x.等,nat.genet.2014;46,287-293.),肾透明细胞癌(dalgliesh,g.l.等,nature.2010;463,360-363.)等。然而到目前为止,setd2蛋白在免疫应答及抗病毒感染中的作用尚不明确。

综上所述,本领域迫切需要开发出一种可调控干扰素活性、增强抗病毒效应、有效抵抗病毒感染、控制病毒感染引起损伤的免疫学活性物质。



技术实现要素:

本发明的目的在于提供setd2、其编码序列、其促进剂或其抑制剂在调控ifn信号活化和抗病毒能力中的用途,并进一步提供它们在治疗或预防病毒感染相关的疾病或征状中的用途。本发明的药物、药物组合物或试剂盒可用于有效抵抗病毒感染、控制病毒感染性疾病的产生。

本发明的第一方面,提供含有set结构域的蛋白2,即setd2或setd2编码序列、其促进剂在制备用于抑制病毒感染的药物或试剂盒中的用途。

优选的,所述setd2选自:

(a)seqidno:2或seqidno:4所示的氨基酸序列;或

(b)与seqidno:2或seqidno:4所示的氨基酸序列同源,且具有抑制病毒感染的蛋白质或多肽;或

(c)(a)或(b)的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸、且具有抑制病毒感染的由(a)或(b)衍生的蛋白质或多肽。

更优选的,所述setd2选自:seqidno:2或seqidno:4所示的氨基酸序列。

所述setd2编码序列选自:

(i)seqidno:1或seqidno:1的第2889-5267位序列、seqidno:3或seqidno:3的第2861-5218位序列所示的核苷酸序列;或

(ii)在严格条件下与(i)限定的核苷酸序列杂交的分子;或

(iii)(i)或(ii)的核苷酸序列中经过取代、缺失或添加一个或几个核苷酸、且编码具有抑制病毒感染的蛋白质或多肽的分子。

更优选的,所述setd2编码序列选自:seqidno:1或seqidno:1的第2889-5267位序列、seqidno:3或seqidno:3的第2861-5218位序列所示的核苷酸序列。

优选的,所述setd2或setd2编码序列的所述促进剂选自:setd2或setd2编码序列的过表达载体、外源性setd2、setd2或setd2编码序列的裸dna、setd2或setd2编码序列的脂质体包裹dna、setd2蛋白;

优选的,所述setd2是:天然纯化的蛋白、化学合成的产物、或使用重组技术从原核或真核宿主中产生。所述宿主选自:细菌、酵母、高等动物和哺乳动物细胞。更优选为人setd2。

在本发明的一个实施例中,所述setd2或setd2编码序列、或其促进剂抑制病毒感染。所述setd2、setd2编码序列或其促进剂促进ifnα的抗病毒效应。

在本发明的一个实施例中,setd2或setd2编码序列的抑制剂抑制细胞抗病毒感染的能力,对病毒在细胞中的复制具有促进作用。setd2或setd2编码序列的所述抑制剂选自针对setd2或其编码序列的:抗体、sirna、mirna、反义寡核苷酸、拮抗剂、阻断剂。

优选的,所述药物或试剂盒包含setd2或setd2编码序列、或其促进剂,并通过抑制病毒感染进一步用于预防或治疗与病毒感染相关的疾病和/或其征状、病毒感染导致的慢性炎症性疾病(特别是自身免疫性疾病)和/或其征状。

优选的,所述与病毒感染相关的疾病和/或其征状为选自下组的一种或两种以上因病毒感染引起的疾病和/或征状:病毒感染后引起的组织损伤;器官的炎症损伤;多器官功能衰竭。

优选的,所述病毒感染是由选自下组的一种或两种以上病毒引起的:乙型肝炎病毒、丙型肝炎病毒、单纯疱疹病毒、仙台病毒、水疱性口炎病毒等多数dna病毒和rna病毒。更优选乙型肝炎病毒(hbv)。

优选的,所述器官选自:肝脏、肺脏、脾脏、肾、肠道。

在本发明的一个优选实施例中,所述病毒感染相关的疾病和/或其征状为乙型肝炎病毒感染引起的肝脏损伤。

在一些实例中,所述肝组织活性标志选自:谷丙转氨酶和谷草转氨酶。这两种转氨酶是肝脏代谢过程中必需的“催化剂”,主要存在肝细胞中发挥作用。肝细胞发生炎症、坏死等造成肝细胞受损的病变后,转氨酶便会进入血液中,使血清中的转氨酶含量升高。

优选的,所述病毒感染导致的慢性炎症性疾病和/或其征状包括:自身免疫性疾病如炎症性肠病、类风湿性关节炎、系统性红斑狼疮、慢性肾炎、结核病、慢性胃肠道疾病。

优选的,所述药物的给药方法选自:给予setd2编码序列,例如直接裸dna注射法、脂质体包裹dna直接注射法、金包被dna基因枪轰击法、繁殖缺陷细菌携带质粒dna法、复制缺陷腺病毒携带目的dna法;给予setd2蛋白,例如注射给药(如直接注射setd2蛋白或用脂质体包埋的setd2蛋白)、鼻腔给药、肺部给药、口服给药、透皮给药(如离子导入)、瘤内给药。

本发明的第二方面,提供一种抑制病毒感染的药物组合物,其包含:

(a)治疗有效量的setd2或setd2编码序列、其促进剂;以及

(b)药学上或免疫学上可接受的载体或赋形剂。

优选的,所述药物组合物中setd2或setd2编码序列、其促进剂占药物组合物总重量的0.001~99.9wt%。

优选的,所述药物组合物中setd2或setd2编码序列、其促进剂占药物组合物总重量的1~95wt%,优选为5~90wt%,更优选10~80wt%。余量为药学上可接受的载体以及其它添加剂等物质。

优选的,在给予本发明的药物组合物之前、同时或之后,给予调控抗病毒感染的其它活性物质。所述其它活性物质具有预防或治疗与病毒感染相关的疾病、感染导致的损伤、感染导致的慢性炎症性疾病和/或其征状的活性。所述病毒感染为选自下组中的一种或两种以上:乙肝病毒感染、丙肝病毒感染、单纯疱疹病毒、仙台病毒感染、水疱性口炎病毒。

更优选的,所述药物组合物还包含抑制病毒感染的其它活性物质。所述其它活性物质具有预防或治疗与病毒感染相关的疾病、感染导致的损伤、感染导致的慢性炎症性疾病和/或其征状的活性。

在本发明的优选实施方式中,所述其它活性物质选自:临床常用抗生素,包括β-内酰胺类(青霉素类和头孢菌素类)、氨基糖甙类、四环素类、氯霉素类、大环内脂类、抗真菌抗生素、抗结核类抗生素中的一种或两种以上;临床常用抗病毒药物(三环胺类、焦磷酸类、蛋白酶抑制药、核苷类药物及干扰素、反义寡核苷酸类等)中的一种或两种以上;临床常用免疫抑制剂(包括糖皮质激素、环磷酰胺、氯喹、环孢霉素a、雷公藤、中药制剂、抗tnf单克隆抗体)中的一种或两种以上。

本发明的第三方面,提供一种预防或治疗病毒感染、病毒感染导致的慢性炎症性疾病和/或其征状的方法,所述方法包括:给予需要预防或治疗的对象有效量的setd2或setd2编码序列、和/或其促进剂、或本发明的药物组合物。

优选的,所述病毒感染为选自下组中的一种或两种以上:乙肝病毒感染、丙肝病毒感染、单纯疱疹病毒感染、仙台病毒感染、水疱性口炎病毒感染。

优选的,所述病毒感染导致的慢性炎症性疾病和/或其征状为选自下组的一种或两种以上因病毒感染引起的疾病和/或征状:病毒感染后组织损伤;器官的炎症损伤;多器官功能衰竭。

优选的,所述器官选自:肝脏、肺脏、脾脏、肾、肠道。

本领域的技术人员可对前述的技术方案和技术特征进行任意组合而不脱离本发明的发明构思和保护范围。本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。

本发明优点在于:

1、本发明揭示了setd2、其编码序列、促进剂的新功能,即促进ifnα的抗病毒效应;

2、基于上述新功能,本发明的setd2、其编码序列或其促进剂可进一步用于预防或治疗病毒感染,例如直接抑制病毒在细胞内的拷贝数、保护病毒感染所引起的肝损伤;

3、本发明提供了一种可有效抑制病毒感染、提高感染个体的生存率的新型药物,可用于预防和抑制病毒感染,提高干扰素抗病毒感染的疗效,具有广泛的应用前景。

附图说明

图1:针对setd2的干扰rna转染hepg2细胞导致hbv感染增加。图为荧光定量检测hbv-dna拷贝数(*,p<0.05)。

图2:针对setd2的干扰rna转染hepg2细胞导致hbsag分泌增加。图为elisa分析(*,p<0.05)。

图3:setd2表达载体抑制hbsag分泌。图为elisa分析(*,p<0.05)。

图4:setd2-f2表达载体抑制hbv感染小鼠肝脏。图为免疫荧光结果。

图5:setd2-f2表达载体降低小鼠病毒感染后的肝脏损伤。图为elisa分析(*,p<0.05)。

具体实施方式

本发明通过大量的研究和动物模型试验,发现setd2在感染性疾病中,能有效抑制病毒感染、改善器官功能状态、提高患者的生存率。在此基础上完成了本发明。

具体而言,针对抗病毒相关基因进行应用研究是天然免疫分子生物学和细胞生物学研究的热点,将抗病毒基因的核苷酸和蛋白质应用于病毒感染的预防和治疗是人工干预感染的有效技术,因此无论是在功能基因组研究,还是病毒感染相关的基因治疗方面均具有广阔地应用前景。

本发明针对具有抗病毒作用的新型免疫调节分子setd2,对其在抗病毒感染方面的功能和作用进行了研究,并且验证了应用该分子对病毒感染动物的治疗和保护作用。实验证明:1)干扰setd2表达可以增加病毒的感染;2)过表达setd2可以抑制病毒感染;3)setd2过表达可以抑制小鼠肝脏中hbv的感染;4)setd2过表达可以降低病毒感染引起的肝脏损伤,提高生存率。这些实验结果提示setd2具备治疗病毒感染性(如hbv的感染等)疾病的应用前景。由此,本发明提供了将抗病毒分子setd2应用于抑制病毒感染,或用于病毒感染性疾病的预防和治疗中的方法和策略,特别是用于控制病毒感染所导致的肝脏损伤。

本文中提供的所有数值范围旨在清楚地包括落在范围端点之间的所有数值及它们之间的数值范围。可对本发明提到的特征或实施例提到的特征进行组合。本说明书所揭示的所有特征可与任何组合物形式并用,说明书中所揭示的各个特征,可以任何可提供相同、均等或相似目的的替代性特征取代。因此除有特别说明,所揭示的特征仅为均等或相似特征的一般性例子。

如本文所用,“含有”、“具有”或“包括”包括了“包含”、“主要由……构成”、“基本上由……构成”、和“由……构成”;“主要由……构成”、“基本上由……构成”和“由……构成”属于“含有”、“具有”或“包括”的下位概念。

setd2蛋白(多肽)

如本文所用,术语“setd2(多肽)”、“setd2蛋白(多肽)”、“setd2”可互换使用,是指一类含有set结构域的setd2蛋白,其是在结构上高度保守的组蛋白h3k36me3甲基转移酶。本发明的setd2蛋白可为由seqidno:1的序列(人cdna全长序列)或seqidno:1的第2889-5267位序列(人cds序列)或seqidno:3(小鼠全长序列)或seqidno:3的第2861-5218位序列(小鼠cds序列)所编码的蛋白质或这些蛋白质具有抗炎作用的同源序列(例如可通过本领域已知的数据库或比对软件获得setd2的同源序列)、变异体或修饰形式。例如,所述setd2蛋白可选自:(a)seqidno:2或seqidno:4所示的氨基酸序列;或(b)在(a)限定的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有抑制炎症因子的活性的由(a)衍生的蛋白质或多肽。

本发明的蛋白质或多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等动物、昆虫和哺乳动物细胞)中产生。本发明中setd2蛋白或多肽优选由人setd2基因或其同源基因或家族基因编码。

本发明蛋白质或多肽的变异形式包括(但并不限于):一个或多个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个,例如1、2、3、4、5、6、7、8、9或10个)氨基酸的缺失、插入和/或取代,以及在c末端和/或n末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质或多肽的功能。又比如,在c末端和/或n末端添加一个或数个氨基酸通常也不会改变蛋白质或多肽的功能,例如本发明的setd2蛋白质或多肽可包括或不包括起始的甲硫氨酸残基而仍然具有抑制病毒感染的活性。

可采用辐射或暴露于诱变剂下来产生随机诱变,也可通过定点诱变法或其它已知的分子生物学技术来获得上述(b)中的蛋白质或多肽。可利用编码所述蛋白质或多肽的编码序列来构建转基因动物,并观察该转基因动物对病毒感染是否具有抵抗作用或对病毒的抵抗性是否有所改良来筛选和鉴别所得蛋白质或多肽。

根据重组生产方案所用的宿主,本发明的蛋白质或多肽可以是糖基化的,或可以是非糖基化的。该术语还包括setd2蛋白的活性片段和活性衍生物。

该多肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧度条件下能与setd2蛋白编码序列杂交的序列所编码的蛋白、以及利用抗setd2蛋白的抗血清获得的多肽或蛋白。本发明还可使用其它多肽,如包含setd2蛋白或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括了setd2蛋白的可溶性片段。通常,该片段具有setd2蛋白序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。

setd2编码序列

如本文所用,术语“setd2基因”、“setd2编码基因”、“setd2蛋白编码基因”或“setd2蛋白编码序列”可互换使用,均是指一种编码本发明所述的setd2蛋白或多肽的序列,其可为seqidno:1(人全长)或seqidno:1的第2889-5267位(人cds)序列、seqidno:3(小鼠全长)或seqidno:3的第2861-5218位(小鼠cds)序列所示的核苷酸序列、在严格条件下与这些序列杂交的分子、或与上述分子高度同源的家族基因分子,所述基因的表达对炎症因子的产生和影响具有一定的抑制作用。本发明的setd2基因可选自:(i)seqidno:1或seqidno:1的第2889-5267位序列、seqidno:3或seqidno:3的第2861-5218位序列所示的核苷酸序列;或(ii)在严格条件下与(i)限定的序列杂交且具有抑制炎症因子活性的分子。

如本文所用,术语“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×ssc,0.1%sds,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在50%,优选55%以上、60%以上、65%以上、70%以上、75%以上、80%以上、85%以上或90%以上,更优选是95%以上时才发生杂交。例如,所述序列可为(a)中所限定序列的互补序列。

本发明的setd2基因核苷酸全长序列或其片段通常可以用pcr扩增法、重组法或人工合成的方法获得。对于pcr扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cdna库或按本领域技术人员已知的常规方法所制备的cdna库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次pcr扩增,然后再将各次扩增出的片段按正确次序拼接在一起。

应理解,本发明的setd2基因优选获自人,获自其它动物的与人setd2基因高度同源(如具有50%以上,优选55%以上、60%以上、65%以上、70%以上、75%以上、80%以上,更优选85%以上如85%、90%、95%、98%甚至99%或以上的序列相同性)的其它基因也在本发明优选考虑的等同范围之内。比对序列相同性的方法和工具也是本领域周知的,如blast。

setd2或setd2编码序列的促进剂

本发明中还涉及setd2或setd2编码序列的“促进剂”。术语“促进剂”或“setd2或其编码序列的促进剂”可互换使用,是指可提高setd2或其编码序列的水平或活性的物质。可用于本发明中的促进剂包括但不限于:setd2表达载体、外源性setd2、setd2或其编码序列的裸dna、setd2或其编码序列的脂质体包裹dna、setd2蛋白。

本发明的setd2或setd2编码序列或其促进剂可抑制病毒感染,从而可进一步用于预防或治疗与病毒感染相关的疾病、和/或病毒感染引发的相关征状,以及感染导致的慢性炎症性疾病、和/或其征状。

载体、宿主及转基因动物

本发明还涉及包含setd2基因的载体,以及用该载体经基因工程产生的宿主细胞,以及通过转基因获得高表达setd2的转基因动物。

通过常规的重组dna技术(science,1984;224:1431),可利用本发明的编码序列可用来表达或生产重组的setd2蛋白。一般来说有以下步骤:

(1)用本发明的编码setd2蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;

(2)在合适的培养基中培养的宿主细胞;

(3)从培养基或细胞中分离、纯化蛋白质或多肽。

本发明中,术语“载体”与“重组表达载体”可互换使用,指本领域熟知的细菌质粒、噬菌体、酵母质粒、动物细胞病毒、哺乳动物细胞病毒或其它载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。

本领域的技术人员熟知的方法能用于构建含setd2编码序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组dna技术、dna合成技术、体内重组技术等。所述的dna序列可有效连接到表达载体中的适当启动子上,以指导mrna合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。本发明中优选使用pcdna3.1载体表达系统。

此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(gfp),或用于大肠杆菌的四环素或氨苄青霉素抗性。

包含上述的适当dna序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质或多肽。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如动物细胞。代表性例子有:大肠杆菌,链霉菌属、农杆菌;真菌细胞如酵母;动物细胞等。在本发明中,优选采用大肠杆菌细菌细胞、人的肝脏细胞作为宿主细胞。

本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是dna的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。

本发明中术语“转基因动物”、或“转化动物”可互换使用,均指通过常规转基因的方法获得的转入本发明setd2基因并稳定高表达setd2蛋白或多肽的细胞、器官、组织或个体。

在上面的方法中的重组多肽可在细胞内或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析和其它各种液相层析技术及这些方法的结合。

药物、药物组合物或试剂盒

本发明还提供了一种药物、药物组合物或试剂盒,其中含有有效量的本发明的setd2或setd2编码序列、其促进剂,以及药学上或免疫学上可接受的载体。如本文所用,术语“活性物质”或“本发明的活性物质”可互换使用,是指setd2或setd2编码序列、其促进剂。

在较佳的实施方案中,所述药物组合物可用于预防或治疗与病毒感染相关的疾病、病毒感染导致的慢性炎症性疾病、和/或其征状;例如,本发明的药物组合物可用于预防或治疗与现有技术中已知可治疗或预防病毒感染性疾病,例如病毒感染引起的组织损伤;器官的炎性损伤;多器官功能衰竭。

如本文所用,术语“含有”或“包括”包括了“包含”、“基本上由……构成”、和“由……构成”。如本文所用,术语“药学上可接受的”成分是适用于人和/或动物而无过度不良反应(如毒性、刺激和变态反应)的,即有合理的效益/风险比的物质。如本文所用,术语“有效量”是指可对人和/或动物产生功能或活性的且可被人和/或动物所接受的量。

如本文所用,术语“药学上可接受的载体”指用于治疗剂给药的载体,包括各种赋形剂和稀释剂。该术语指这样一些药剂载体:它们本身并不是必要的活性成分,且施用后没有过分的毒性。合适的载体是本领域普通技术人员所熟知的,在《雷明顿药物科学》(remington’spharmaceuticalsciences,mackpub.co.,n.j.1991)中可找到关于药学上可接受的赋形剂的充分讨论。

在组合物中药学上可接受的载体可含有液体,如水、盐水、甘油和乙醇。另外,这些载体中还可能存在辅助性的物质,如填充剂、崩解剂、润滑剂、助流剂、泡腾剂、润湿剂或乳化剂、矫味剂、ph缓冲物质等。通常,可将这些物质配制于无毒的、惰性的和药学上可接受的水性载体介质中,其中ph通常约为5-8,较佳地,ph约为6-8。

本发明的组合物中的活性物质占组合物总重量的0.001~99.9wt%;优选为组合物总重量的1~95wt%,较优选为5~90wt%,更优选10~80wt%。余量为药学上可接受的载体以及其它添加剂等物质。

如本文所用,术语“单位剂型”是指为了服用方便,将本发明的组合物制备成单次服用所需的剂型,包括但不限于各种固体剂(如片剂)、液体剂、胶囊剂、缓释剂。

在本发明的另一优选实施方式中,所述组合物为单位剂型或多剂型,且其中活性物质的含量为0.01~2000mg/剂,优选0.1~1500mg/剂,更优选1~1000mg/剂。在本发明的另一个优选例中,每天施用1~6剂本发明的组合物,优选施用1~3剂;最优选的,每天服用的剂量为1剂。

应理解,所用setd2蛋白或其编码序列等活性物质的有效剂量可随待施用或治疗的对象的严重程度而变化。具体情况根据对象的个体情况(例如对象体重、年龄、身体状况、所需达到的效果)来决定,这在熟练医师可以判断的范围内。

本发明的组合物,可以为固态(如颗粒剂、片剂、冻干粉、栓剂、胶囊、舌下含片)或液态(如口服液)或其它合适的形状。给药途径可采用:(1)直接裸dna或者蛋白质注射法;(2)将setd2的cdna、mrna和蛋白质与转铁蛋白/多聚l-赖氨酸复合物连接,以增强其生物效应;(3)cdna、mrna和蛋白质与带正电荷的脂类形成复合物,以克服磷酸骨架负电荷所致的穿越细胞膜的困难;(4)用脂质体包裹cdna、mrna和蛋白质后介导进入细胞,既有利于大分子的顺利进入又免受细胞外各种酶的水解作用;(5)cdna、mrna和蛋白质与胆固醇结合使其胞浆保持时间增加10倍;(6)用免疫脂质体转运cdna、mrna和蛋白质可使其特异性转运至靶组织和靶细胞;(7)将cdna、mrna和蛋白质体外转染给转载细胞(如成纤维细胞)也可较好地将setd2相关药物载入靶细胞内;(8)电打孔(electroporation),即借助于电流将cdna、mrna和蛋白质导入靶细胞。

此外,本发明的组合物中还可含有用于改善和治疗病毒感染性疾病的其它活性物质,所述的其它活性物质选自下组:临床常用抗生素,包括β-内酰胺类(青霉素类和头孢菌素类)、氨基糖甙类、四环素类、氯霉素类、大环内脂类、抗真菌抗生素、抗结核类抗生素中的一种或多种。

本发明的setd2相关的核苷酸和蛋白质药物相互间可以联合应用,还可以与其它药物和治疗手段联合,用于细菌性感染疾病的预防和治疗。

实施例

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。本领域技术人员可对本发明做出适当的修改、变动,这些修改和变动都在本发明的范围之内。

下列实施例中未注明具体条件的实验方法,可采用本领域中的常规方法,例如参考《分子克隆实验指南》(第三版,纽约,冷泉港实验室出版社,newyork:coldspringharborlaboratorypress,1989)或按照供应商所建议的条件。dna的测序方法为本领域常规的方法,也可由商业公司提供测试。

除非另外说明,否则百分比和份数按重量计算。除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明方法中。文中所述的较佳实施方法与材料仅作示范之用。

实施例1:干扰setd2表达对hbv在细胞中的复制具有促进作用

hepg2细胞(购自atcc)用dmem培养基培养,细胞用基于phbv1.3的框架的hbv表达质粒转染,模拟细胞感染hbv的环境。接着用针对setd2的小干扰rna(si-setd2)及模拟物对照(si-模拟物)转染细胞(转染试剂interferin购自polyplus公司)。

针对setd2的干扰rna(si-setd2)及模拟物对照(si-模拟物)购自genephama公司,si-setd2的序列如seqidno:5和seqidno:6所示,si-模拟物的序列如seqidno:7和seqidno:8所示,合成时在3'增加2个dt使序列更加稳定。具体序列如下:

si-setd2序列:

5'-gguguaacuuaugcauuaatt-3'(顺义);

5'-uuaaugcauaaguuacacctt-3'(反义)。

si-模拟物序列:

5'-uucuccgaacgugucacgutt-3'(顺义);

5'-acgugacacguucggagaatt-3′(反义)。

转染24小时后的hepg2细胞(5×105个细胞/ml),用1000u/ml的ifnα(购自pestkabiomedicallaboratories公司)处理细胞12小时。收集贴壁的hepg2细胞,提取细胞的dna,检测hbv的复制情况;同时收取细胞培养上清,使用酶联免疫标记elisa试剂盒检测细胞培养上清中hbv病毒表面抗原hbsag的分泌情况。

hbv拷贝数分析的结果如图1所示,hbsag分泌情况如图2所示。

结果显示:针对setd2的小干扰rna转染hepg2细胞可显著促进hbv的复制,并且显著促进hbv分泌hbsag到细胞外。

该结果表明:干扰setd2表达导致hbv在细胞中的复制增加。

实施例2:过表达setd2对抑制细胞中hbsag分泌

首先将setd2(nm_014159.6)的cdna分成3段分别导入真核表达载体pcdna3.1质粒中,分别构建setd2-f1、setd2-f2、setd2-f3表达载体。

其中,setd2-f1包含的核苷酸序列为seqidno:1第54-2888位,编码人setd2蛋白seqidno:2第1-945位;

setd2-f2包含的核苷酸序列为seqidno:1第2889-5267位,编码人setd2蛋白seqidno:2第946-1738位,此截短体含有set结构域;

setd2-f3包含的核苷酸序列为seqidno:1第5268-7748位,编码人setd2蛋白seqidno:2第1739-2564位,此截短体含有ww结构域。

将setd2-f1、setd2-f2、setd2-f3分别以1ng/ml的密度转染hepg2细胞,并同时转染phbv1.3质粒。48小时后更换新鲜dmem培养基。

将hbv感染后的hepg2细胞,5×105个细胞/ml,用1000u/ml的ifnα处理细胞12小时,收集细胞培养上清,用elisa试剂盒细胞培养上清中hbv病毒表面抗原hbsag的分泌情况。

hbsag分泌情况如图3所示。

结果显示:setd2-f2转染细胞可抑制hbv分泌hbsag到细胞外。

该结果表明:过表达setd2-f2(含有set结构域)可以抑制hbv的hbsag的分泌。

实施例3:过表达setd2对抑制hbv在小鼠肝脏中的感染

构建setd2-f2表达载体(同实施例2)。将20ngsetd2-f2通过尾静脉高压注射入小鼠(8周雄性sdf级c57bl6小鼠,购自sipperbk公司),同时尾静脉高压注射10ngphbv1.3的质粒,模拟小鼠hbv感染。72小时后腹腔内注射ifnα(15mg/kg)。24小时后解剖,取小鼠肝脏组织,使用免疫荧光的方法检测小鼠肝脏上hbv核心抗原(hbcag)表达情况,以指示小鼠hbv感染的情况。

肝脏hbv感染小鼠检测结果如图4所示。

结果显示:setd2-f2在小鼠中过表达可以抑制hbv在小鼠肝脏中的感染。

该结果表明:过表达setd2可以抑制病毒在体内的感染。

实施例4:过表达setd2降低病毒感染引起的肝脏损伤

将20ngsetd2-f2通过尾静脉高压注射入小鼠,同时尾静脉高压注射10ngphbv1.3的质粒,模拟小鼠hbv感染(同实施例2)。72小时后腹腔内注射ifnα(15mg/kg)。24小时后眼球取血,收集小鼠血清,使用elisa试剂盒检测谷丙转氨酶活性和谷草转氨酶活性。

elisa结果如图5所示。

结果显示:setd2-f2表达载体降低小鼠血清中的谷丙转氨酶活性和谷草转氨酶活性。

该结果表明:过表达setd2可以降低病毒感染引起的肝脏损伤。

以上已对本发明创造的较佳实施例进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明创造精神的前提下还可做出种种的等同的变型或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

sequencelisting

<110>中国人民解放军第二军医大学

<120>表观修饰酶setd2的抗病毒作用及其应用

<130>/

<160>8

<170>patentinversion3.3

<210>1

<211>8452

<212>dna

<213>智人(homosapiens)

<400>1

gcgtcgccctgctgcggggagggggctcgcgtcgccgtctccagccgctcccgatgaagc60

agctgcagccgcagccgcctccgaagatgggggatttctacgacccggagcacccgaccc120

ctgaagaagaagaaaatgaggcaaagattgaaaatgtgcagaaaacaggtttcatcaaag180

gaccaatgttcaaaggtgttgcttctagtcgatttttgcccaaaggcaccaaaacaaaag240

ttaatttggaagaacagggacgacagaaggtgtcattcagcttcagccttacaaagaaaa300

ctttgcagaataggtttctcactgcacttggcaatgaaaagcaaagtgatactccaaacc360

ctccagctgtacctcttcaggtagactcgactcctaaaatgaaaatggaaattggtgata420

ccttatctactgcagaagaatcttccccaccaaagtcaagggtggaattgggcaaaattc480

attttaagaaacatctgcttcatgtaacatccaggccactgctggctactaccacagcag540

tagcatctccacctactcatgcagcaccattaccagcagtgatagcagaatcaacaactg600

tagactcaccgccctcatctccgcctccaccgcctccacctgcccaagccacaacactct660

catcaccagcaccagtaacagagccagtggccttgccacatacaccaataacagttctaa720

tggcagcaccagtacccttaccagtagatgtagcagttagatctctgaaagaaccaccaa780

ttataattgtaccagaatctttagaagcagatactaagcaggacactatatctaatagtt840

tagaagaacacgtaactcaaatattgaatgagcaagcagatatttcctcaaaaaaagaag900

attcccatattgggaaggatgaagaaattccagatagttctaagattagtctgagctgta960

aaaaaacaggttctaagaagaaatcctcacaatctgaaggcatctttcttggttcagaat1020

ctgatgaagattctgtacggacttcttcaagtcaaagatcacatgatttaaaattttcag1080

caagcattgaaaaggaaagagattttaaaaagagctcagcacctttaaaaagtgaggatc1140

tagggaaaccttcacgatctaaaacagacagagatgataaatattttagctattcaaaac1200

ttgaaagagatactcggtatgtatcttcccgatgtagatcagaaagagagcgacggcgga1260

gcagatctcactctaggtctgagagaggctctagaactaatttatcctattccaggtcag1320

aacgatctcattattatgactctgatcgtcgctaccataggagctccccttatcgagaga1380

ggacgcgctattctcggccatacacagataacagagcacgagagagttctgactcagaag1440

aagagtataagaagacatactcaaggcgtacctcatctcattcctcttcttacagagacc1500

taaggacatcatcctattctaaatctgatcgggactgtaaaactgagacctcttacttag1560

agatggaaagaagaggcaagtattcttcaaaactagaaagagaatctaaaaggacttcag1620

aaaatgaagcaattaaaagatgttgttctccccctaatgaactgggattccgacgagggt1680

catcatattctaagcatgacagtagtgcttcccgttataaatctaccctttcaaaaccta1740

tacccaagtctgataaatttaaaaattctttctgttgtacagaattaaatgaagaaatca1800

aacagtctcattcttttagtttacagacaccttgttcaaaaggtagtgaattaagaatga1860

ttaataaaaatcctgaaagagaaaaggctgggtctccagctccatcaaatcgattaaatg1920

attcacctactttaaaaaagctagatgaattgcctatttttaagtccgaatttataacac1980

atgatagccatgatagtattaaggaattagactctttatctaaagtgaagaatgatcaat2040

taagaagtttttgtcccatagaattaaatataaatggatctcctggggcagaatctgatt2100

tggcaacattttgcacttctaaaactgatgctgttttaatgacttctgatgatagtgtga2160

ctggatcggaattatcccctttggtcaaagcatgcatgctttcatcaaatggatttcaga2220

atattagtaggtgcaaagaaaaagacttggatgatacctgcatgctgcataagaagtcag2280

aaagcccatttagagaaacagaacctctggtgtcaccacaccaagataaactcatgtcta2340

tgccagttatgactgtggattattccaaaacagtagttaaagaaccagttgatacgaggg2400

tttcttgctgcaaaaccaaagattcagacatatactgtactttgaacgatagcaaccctt2460

ctttgtgtaactctgaagctgaaaatattgagccttcagttatgaagatttcttcaaata2520

gctttatgaatgtgcatttggaatcaaaaccagttatatgtgatagtagaaatttgacag2580

atcactcaaaatttgcatgtgaagaatataagcagagcatcggtagcactagttcagctt2640

ctgttaatcattttgatgatttatatcaacctattgggagttcaggtattgcttcatctc2700

ttcagagtcttccaccaggaataaaggtggacagtctaactctcttgaaatgcggagaga2760

acacatctccagttctggatgcagtgctaaagagtaaaaaaagttcagagtttttaaagc2820

atgcagggaaagaaacaatagtagaagtaggtagtgaccttcctgattcaggaaagggat2880

ttgcttccagggagaacaggcgtaataatgggttatctgggaaatgtttgcaagaggctc2940

aagaagaagggaattccatattgcctgaaagaagaggaagaccagaaatctctttagatg3000

aaagaggagaaggaggacatgtgcatacttctgatgactcagaagttgtattttcttctt3060

gtgatttgaatttaaccatggaagacagtgatggtgtaacttatgcattaaagtgtgaca3120

gtagtggtcatgccccagaaattgtgtctacagttcatgaagattattctggctcttctg3180

aaagttcaaatgatgaaagtgattcagaagatacagattcggatgatagcagtattccaa3240

gaaaccgtctccagtctgttgtggttgtgccaaagaattctactttgcccatggaagaaa3300

caagtccttgttcttctcggagcagtcaaagttatagacactattctgaccattgggaag3360

atgagagattggagtcaaggagacatttgtatgaggaaaaatttgaaagtatagcaagta3420

aagcctgtcctcaaactgataagtttttccttcataaaggaacagagaagaatccggaaa3480

tttcttttacacagtccagtagaaaacaaatagataatcgcctgcctgaactttctcatc3540

ctcagagtgatggggttgatagtacaagtcatacagatgtgaaatctgaccctctgggtc3600

acccaaattcagaggaaaccgtgaaagccaaaataccttctaggcagcaagaagagctgc3660

caatttattcttctgattttgaagatgtcccaaataagtcttggcaacagaccactttcc3720

aaaacaggccagatagtagactgggaaaaacagaattgagtttttcttcctcttgtgaga3780

taccacatgtggatggcttgcactcatcagaagagctcagaaacttaggttgggacttct3840

ctcaagaaaagccttctaccacgtatcagcaacctgacagtagctatggagcttgtggtg3900

gacacaagtatcagcaaaatgcagaacagtatggtgggacacgtgattactggcaaggca3960

atggttactgggatccaagatcaggtagacctcctggaactggggttgtgtatgatcgaa4020

ctcaaggacaagtaccagattccctaacagatgatcgtgaagaagaggagaattgggatc4080

aacaggatggatcccatttttcagaccagtccgataaatttcttctatcccttcagaaag4140

acaaggggtcagtgcaagcacctgaaataagcagcaattccattaaggacactttagctg4200

tgaatgaaaagaaagatttttcaaaaaacttagaaaaaaatgatatcaaagatagagggc4260

ctcttaaaaaaaggaggcaggaaatagagagtgattctgaaagtgatggtgagcttcagg4320

acagaaagaaagttagagtggaggtagagcagggagagacatcagtgcccccaggttcag4380

cactggttgggccctcctgtgtcatggatgacttcagggacccacagcgatggaaggaat4440

gtgccaagcaagggaaaatgccatgttactttgatcttattgaagaaaatgtttatttaa4500

cagaaagaaagaagaataaatctcatcgagatattaagcgaatgcagtgtgagtgtacac4560

ctctttctaaagatgaaagagctcaaggtgaaatagcatgtggggaagattgtcttaatc4620

gtcttctcatgattgaatgttcttctcggtgtccaaatggggattattgttccaatagac4680

ggtttcagagaaaacagcatgcagatgtggaagtcatactcacagaaaagaaaggctggg4740

gcttgagagctgccaaagaccttccttcgaacacctttgtcctagaatattgtggagagg4800

tactcgatcataaagagtttaaagctcgagtgaaggagtatgcacgaaacaaaaacatcc4860

attactatttcatggccctgaagaatgatgagataatagatgccactcaaaaaggaaatt4920

gctctcgtttcatgaatcacagctgtgaaccaaattgtgaaacccaaaaatggactgtga4980

acggacaactgagggttgggttttttaccaccaaactggttccttcaggctcagagttaa5040

cgtttgactatcagttccagagatatggaaaagaagcccagaaatgtttctgcggatcag5100

ccaattgccggggttacctgggaggagaaaacagagtcagcatcagagcagcaggaggga5160

aaatgaagaaggaacgatctcgtaagaaggattcagtggatggagagctagaagctctga5220

tggaaaatggtgagggtctctctgataaaaaccaggtgctcagcttatcccggctaatgg5280

ttagaattgaaactttggagcagaaacttacctgtctggaactcatacagaacacacact5340

cacagtcctgcctgaagtcctttctggaacgtcatgggctgtctttgttgtggatctgga5400

tggcagagctaggtgacggccgggaaagtaaccagaagcttcaggaagagattataaaga5460

ctttggaacacttgcccattcctactaaaaatatgttggaggaaagcaaagtacttccaa5520

ttattcaacgctggtctcagactaagactgctgtccctccgttgagtgaaggagatgggt5580

attctagtgagaatacatcgcgtgctcatacaccactcaacacacctgatccttccacca5640

agctgagcacagaagctgacacagacactcccaagaaactaatgtttcgcagactgaaaa5700

ttataagtgaaaatagcatggacagtgcaatctctgatgcaaccagtgagctagaaggca5760

aggatggcaaagaggatcttgatcaattagaaaatgtccctgtagaggaagaggaagaat5820

tgcagtcacaacagctactcccacaacagctgcctgaatgcaaagttgatagtgaaacca5880

acatagaagctagtaagctacctacatctgaaccagaagctgacgctgaaatagagccca5940

aagagagcaacggcacaaaactagaagaacctattaatgaagaaacaccatcccaagatg6000

aagaggagggtgtgtctgatgtggagagtgaaaggagccaagaacagccagataaaacag6060

tggatataagtgatttggccaccaaactcctggacagttggaaagacctaaaggaggtat6120

atcgaattccaaagaaaagtcaaactgaaaaggaaaacacaacaactgaacgaggaaggg6180

atgctgttggcttcagagatcaaacacctgccccgaagactcctaataggtcaagagaga6240

gagacccagacaagcaaactcaaaataaagagaaaaggaaacgaagaagctccctctcac6300

caccctcttctgcctatgagcggggaacaaaaaggccagatgacagatatgatacaccaa6360

cttctaaaaagaaagtacgaattaaagaccgcaataaactttctacagaggaacgccgga6420

agttgtttgagcaagaggtggctcaacgggaggctcagaaacaacagcaacagatgcaga6480

acctgggaatgacatcaccactgccctatgactctcttggttataatgccccgcatcatc6540

cctttgctggttacccaccaggttatcccatgcaggcctatgtggatcccagcaacccta6600

atgctggaaaggtgctcctgcccacacccagcatggacccagtgtgttctcctgctcctt6660

atgatcatgctcagcccttggtgggacattctacagaacccctttctgcccctccaccag6720

taccagtggtgccacatgtggcagctcctgtggaagtttccagttcccagtatgtggccc6780

agagtgatggtgtagtacaccaagactccagcgttgctgtcttgccagtgccggcccccg6840

gcccagttcagggacagaattatagtgtttgggattcaaaccaacagtctgtcagtgtac6900

agcagcagtactctcctgcacagtctcaagcaaccatatattatcaaggacagacatgtc6960

caacagtctatggtgtgacatcaccttattcacagacaactccaccaattgtacagagtt7020

atgcccagccaagtcttcagtatatccaggggcaacagattttcacagctcatccacaag7080

gagtggtggtacagccagccgcagcagtgactacaatagttgcaccagggcagcctcagc7140

ccttgcagccatctgaaatggttgtgacaaataatctcttggatctgccgcccccctctc7200

ctcccaaaccaaaaaccattgtcttacctcccaactggaagacagctcgagatccagaag7260

ggaagatttattactaccatgtgatcacaaggcagactcagtgggatcctcctacttggg7320

aaagcccaggagatgatgccagccttgagcatgaagctgagatggacctgggaactccaa7380

catatgatgaaaaccccatgaaggcctcgaaaaagcccaagacagcagaagcagacacct7440

ccagtgaactagcaaagaaaagcaaagaagtattcagaaaagagatgtcccagttcatcg7500

tccagtgcctgaacccttaccggaaacctgactgcaaagtgggaagaattaccacaactg7560

aagactttaaacatctggctcgcaagctgactcacggtgttatgaataaggagctgaagt7620

actgtaagaatcctgaggacctggagtgcaatgagaatgtgaaacacaaaaccaaggagt7680

acattaagaagtacatgcagaagtttggggctgtttacaaacccaaagaggacactgaat7740

tagagtgactgttgggccagggtgggaggatgggtggtcaggtaagacagactctaggga7800

gaggaaatcctgtgggcctttctgtcccacccctgtcagcactgtgctactgatgataca7860

tcaccctggggaattcaaccctgcagatgtcaactgaaggccacaaaaatgaactccatc7920

tacaagtgattacctagttgtgagctgttggcatgtggttagaagccatcagaggtgcaa7980

gggcttagaaaagaccctggccagacctgactccactcttaaacctgggtcttctccttg8040

gcggtgctgtcagcgcacagacccatgcgcatccccacccacaaccctttaccctgatga8100

tctgtattatattttaatgtatatgtgaatatattgaaaataatttgttttttcctggtt8160

tttgtttggttttcgttttgcttttagcctctacatgctaggatcacaggaagactttgt8220

aaggacagtttaagttctcctgcaaggtttaatttgttatcatgtaaatattccaaagca8280

ggctgccttgtggttttggccagccttgtgctatgttgataagattgatttactgcttaa8340

aatcactttactttatccaatttttactgaactttttatgtaaaaaaataaaatcaatta8400

aagaacttggcatgtgtgttccctaaaagttaaaaaaaaaaaaaaaaaaaaa8452

<210>2

<211>2564

<212>prt

<213>智人(homosapiens)

<400>2

metlysglnleuglnproglnproproprolysmetglyaspphetyr

151015

aspprogluhisprothrproglugluglugluasnglualalysile

202530

gluasnvalglnlysthrglypheilelysglyprometphelysgly

354045

valalaserserargpheleuprolysglythrlysthrlysvalasn

505560

leuglugluglnglyargglnlysvalserpheserpheserleuthr

65707580

lyslysthrleuglnasnargpheleuthralaleuglyasnglulys

859095

glnseraspthrproasnproproalavalproleuglnvalaspser

100105110

thrprolysmetlysmetgluileglyaspthrleuserthralaglu

115120125

gluserserproprolysserargvalgluleuglylysilehisphe

130135140

lyslyshisleuleuhisvalthrserargproleuleualathrthr

145150155160

thralavalalaserproprothrhisalaalaproleuproalaval

165170175

ilealagluserthrthrvalaspserproproserserpropropro

180185190

proproproproalaglnalathrthrleuserserproalaproval

195200205

thrgluprovalalaleuprohisthrproilethrvalleumetala

210215220

alaprovalproleuprovalaspvalalavalargserleulysglu

225230235240

proproileileilevalprogluserleuglualaaspthrlysgln

245250255

aspthrileserasnserleuglugluhisvalthrglnileleuasn

260265270

gluglnalaaspileserserlyslysgluaspserhisileglylys

275280285

aspglugluileproaspserserlysileserleusercyslyslys

290295300

thrglyserlyslyslysserserglnsergluglyilepheleugly

305310315320

sergluseraspgluaspservalargthrserserserglnargser

325330335

hisaspleulyspheseralaserileglulysgluargaspphelys

340345350

lysserseralaproleulyssergluaspleuglylysproserarg

355360365

serlysthraspargaspasplystyrphesertyrserlysleuglu

370375380

argaspthrargtyrvalserserargcysargsergluarggluarg

385390395400

argargserargserhisserargsergluargglyserargthrasn

405410415

leusertyrserargsergluargserhistyrtyraspserasparg

420425430

argtyrhisargserserprotyrarggluargthrargtyrserarg

435440445

protyrthraspasnargalaarggluserseraspserglugluglu

450455460

tyrlyslysthrtyrserargargthrserserhissersersertyr

465470475480

argaspleuargthrsersertyrserlysseraspargaspcyslys

485490495

thrgluthrsertyrleuglumetgluargargglylystyrserser

500505510

lysleugluarggluserlysargthrsergluasnglualailelys

515520525

argcyscysserproproasngluleuglypheargargglyserser

530535540

tyrserlyshisaspserseralaserargtyrlysserthrleuser

545550555560

lysproileprolysserasplysphelysasnserphecyscysthr

565570575

gluleuasnglugluilelysglnserhisserpheserleuglnthr

580585590

procysserlysglysergluleuargmetileasnlysasnproglu

595600605

argglulysalaglyserproalaproserasnargleuasnaspser

610615620

prothrleulyslysleuaspgluleuproilephelyssergluphe

625630635640

ilethrhisaspserhisaspserilelysgluleuaspserleuser

645650655

lysvallysasnaspglnleuargserphecysproilegluleuasn

660665670

ileasnglyserproglyalagluseraspleualathrphecysthr

675680685

serlysthraspalavalleumetthrseraspaspservalthrgly

690695700

sergluleuserproleuvallysalacysmetleuserserasngly

705710715720

pheglnasnileserargcyslysglulysaspleuaspaspthrcys

725730735

metleuhislyslyssergluserprophearggluthrgluproleu

740745750

valserprohisglnasplysleumetsermetprovalmetthrval

755760765

asptyrserlysthrvalvallysgluprovalaspthrargvalser

770775780

cyscyslysthrlysaspseraspiletyrcysthrleuasnaspser

785790795800

asnproserleucysasnserglualagluasnilegluproserval

805810815

metlysileserserasnserphemetasnvalhisleugluserlys

820825830

provalilecysaspserargasnleuthrasphisserlyspheala

835840845

cysgluglutyrlysglnserileglyserthrserseralaserval

850855860

asnhispheaspaspleutyrglnproileglyserserglyileala

865870875880

serserleuglnserleuproproglyilelysvalaspserleuthr

885890895

leuleulyscysglygluasnthrserprovalleuaspalavalleu

900905910

lysserlyslysserserglupheleulyshisalaglylysgluthr

915920925

ilevalgluvalglyseraspleuproaspserglylysglypheala

930935940

serarggluasnargargasnasnglyleuserglylyscysleugln

945950955960

glualaglnglugluglyasnserileleuprogluargargglyarg

965970975

progluileserleuaspgluargglygluglyglyhisvalhisthr

980985990

seraspaspsergluvalvalphesersercysaspleuasnleuthr

99510001005

metgluaspseraspglyvalthrtyralaleulyscysaspser

101010151020

serglyhisalaprogluilevalserthrvalhisgluasptyr

102510301035

serglysersergluserserasnaspgluseraspsergluasp

104010451050

thraspseraspaspserserileproargasnargleuglnser

105510601065

valvalvalvalprolysasnserthrleuprometglugluthr

107010751080

serprocysserserargserserglnsertyrarghistyrser

108510901095

asphistrpgluaspgluargleugluserargarghisleutyr

110011051110

gluglulysphegluserilealaserlysalacysproglnthr

111511201125

asplysphepheleuhislysglythrglulysasnprogluile

113011351140

serphethrglnserserarglysglnileaspasnargleupro

114511501155

gluleuserhisproglnseraspglyvalaspserthrserhis

116011651170

thraspvallysseraspproleuglyhisproasnsergluglu

117511801185

thrvallysalalysileproserargglnglnglugluleupro

119011951200

iletyrserseraspphegluaspvalproasnlyssertrpgln

120512101215

glnthrthrpheglnasnargproaspserargleuglylysthr

122012251230

gluleuserphesersersercysgluileprohisvalaspgly

123512401245

leuhisserserglugluleuargasnleuglytrpasppheser

125012551260

glnglulysproserthrthrtyrglnglnproaspsersertyr

126512701275

glyalacysglyglyhislystyrglnglnasnalagluglntyr

128012851290

glyglythrargasptyrtrpglnglyasnglytyrtrpasppro

129513001305

argserglyargproproglythrglyvalvaltyraspargthr

131013151320

glnglyglnvalproaspserleuthraspaspargglugluglu

132513301335

gluasntrpaspglnglnaspglyserhispheseraspglnser

134013451350

asplyspheleuleuserleuglnlysasplysglyservalgln

135513601365

alaprogluileserserasnserilelysaspthrleualaval

137013751380

asnglulyslysasppheserlysasnleuglulysasnaspile

138513901395

lysaspargglyproleulyslysargargglngluilegluser

140014051410

aspsergluseraspglygluleuglnasparglyslysvalarg

141514201425

valgluvalgluglnglygluthrservalproproglyserala

143014351440

leuvalglyprosercysvalmetaspasppheargaspprogln

144514501455

argtrplysglucysalalysglnglylysmetprocystyrphe

146014651470

aspleuileglugluasnvaltyrleuthrgluarglyslysasn

147514801485

lysserhisargaspilelysargmetglncysglucysthrpro

149014951500

leuserlysaspgluargalaglnglygluilealacysglyglu

150515101515

aspcysleuasnargleuleumetileglucysserserargcys

152015251530

proasnglyasptyrcysserasnargargpheglnarglysgln

153515401545

hisalaaspvalgluvalileleuthrglulyslysglytrpgly

155015551560

leuargalaalalysaspleuproserasnthrphevalleuglu

156515701575

tyrcysglygluvalleuasphislysgluphelysalaargval

158015851590

lysglutyralaargasnlysasnilehistyrtyrphemetala

159516001605

leulysasnaspgluileileaspalathrglnlysglyasncys

161016151620

serargphemetasnhissercysgluproasncysgluthrgln

162516301635

lystrpthrvalasnglyglnleuargvalglyphephethrthr

164016451650

lysleuvalproserglysergluleuthrpheasptyrglnphe

165516601665

glnargtyrglylysglualaglnlyscysphecysglyserala

167016751680

asncysargglytyrleuglyglygluasnargvalserilearg

168516901695

alaalaglyglylysmetlyslysgluargserarglyslysasp

170017051710

servalaspglygluleuglualaleumetgluasnglyglugly

171517201725

leuserasplysasnglnvalleuserleuserargleumetval

173017351740

argilegluthrleugluglnlysleuthrcysleugluleuile

174517501755

glnasnthrhisserglnsercysleulysserpheleugluarg

176017651770

hisglyleuserleuleutrpiletrpmetalagluleuglyasp

177517801785

glyarggluserasnglnlysleuglnglugluileilelysthr

179017951800

leugluhisleuproileprothrlysasnmetleuglugluser

180518101815

lysvalleuproileileglnargtrpserglnthrlysthrala

182018251830

valproproleusergluglyaspglytyrsersergluasnthr

183518401845

serargalahisthrproleuasnthrproaspproserthrlys

185018551860

leuserthrglualaaspthraspthrprolyslysleumetphe

186518701875

argargleulysileilesergluasnsermetaspseralaile

188018851890

seraspalathrsergluleugluglylysaspglylysgluasp

189519001905

leuaspglnleugluasnvalprovalgluglugluglugluleu

191019151920

glnserglnglnleuleuproglnglnleuproglucyslysval

192519301935

aspsergluthrasnileglualaserlysleuprothrserglu

194019451950

proglualaaspalagluilegluprolysgluserasnglythr

195519601965

lysleuglugluproileasnglugluthrproserglnaspglu

197019751980

glugluglyvalseraspvalglusergluargserglnglugln

198519901995

proasplysthrvalaspileseraspleualathrlysleuleu

200020052010

aspsertrplysaspleulysgluvaltyrargileprolyslys

201520202025

serglnthrglulysgluasnthrthrthrgluargglyargasp

203020352040

alavalglypheargaspglnthrproalaprolysthrproasn

204520502055

argserarggluargaspproasplysglnthrglnasnlysglu

206020652070

lysarglysargargserserleuserproproserseralatyr

207520802085

gluargglythrlysargproaspaspargtyraspthrprothr

209020952100

serlyslyslysvalargilelysaspargasnlysleuserthr

210521102115

glugluargarglysleuphegluglngluvalalaglnargglu

212021252130

alaglnlysglnglnglnglnmetglnasnleuglymetthrser

213521402145

proleuprotyraspserleuglytyrasnalaprohishispro

215021552160

phealaglytyrproproglytyrprometglnalatyrvalasp

216521702175

proserasnproasnalaglylysvalleuleuprothrproser

218021852190

metaspprovalcysserproalaprotyrasphisalaglnpro

219522002205

leuvalglyhisserthrgluproleuseralaproproproval

221022152220

provalvalprohisvalalaalaprovalgluvalserserser

222522302235

glntyrvalalaglnseraspglyvalvalhisglnaspserser

224022452250

valalavalleuprovalproalaproglyprovalglnglygln

225522602265

asntyrservaltrpaspserasnglnglnservalservalgln

227022752280

glnglntyrserproalaglnserglnalathriletyrtyrgln

228522902295

glyglnthrcysprothrvaltyrglyvalthrserprotyrser

230023052310

glnthrthrproproilevalglnsertyralaglnproserleu

231523202325

glntyrileglnglyglnglnilephethralahisproglngly

233023352340

valvalvalglnproalaalaalavalthrthrilevalalapro

234523502355

glyglnproglnproleuglnproserglumetvalvalthrasn

236023652370

asnleuleuaspleuproproproserproprolysprolysthr

237523802385

ilevalleuproproasntrplysthralaargaspproglugly

239023952400

lysiletyrtyrtyrhisvalilethrargglnthrglntrpasp

240524102415

proprothrtrpgluserproglyaspaspalaserleugluhis

242024252430

glualaglumetaspleuglythrprothrtyraspgluasnpro

243524402445

metlysalaserlyslysprolysthralaglualaaspthrser

245024552460

sergluleualalyslysserlysgluvalphearglysglumet

246524702475

serglnpheilevalglncysleuasnprotyrarglysproasp

248024852490

cyslysvalglyargilethrthrthrgluaspphelyshisleu

249525002505

alaarglysleuthrhisglyvalmetasnlysgluleulystyr

251025152520

cyslysasnprogluaspleuglucysasngluasnvallyshis

252525302535

lysthrlysglutyrilelyslystyrmetglnlyspheglyala

254025452550

valtyrlysprolysgluaspthrgluleuglu

25552560

<210>3

<211>8350

<212>dna

<213>小鼠(musmusculus)

<400>3

cggccgcctcccctccggtcccctcccccgcatcggcctgccgcggggagggggctagcg60

tcgccgcctccagccgctcctcatgaagccgctgccgtcgcagcagccgccaccgaagat120

gggggatttctacgatcccgagcacccgacccctgaagaagaagaaaatgaggcaaagat180

tgaaaatgtgcagaaaacaggtttcatcaaaggaccagtgttcaaaggtgttgcttcaag240

tcgatttttgcccaaaggcacgaagacaaaagttaatttggaggaacagggacggcaaaa300

ggtgtcattcagcttcagttttacaaagaaaactttacagaatagatttctcactgcgct360

tagcaatgaaaagcaaagtgattctccaaactccccagctccccctcttcaagtagactc420

aaaccctaaagttaaaatggacgctggagatacttttcctgctacagaagaatcttcgcc480

accaaaatcgagagtggaattgggcagaattcattttaagaaacatttgcttcatgtgac540

atctaggccacagctggctgcaagtacaacagcagcatctccccttcctcctacaacaca600

gttaccagcagtcttagcagagtcgatgatagactcaccaccttcatctccacccccacc660

tcctccacctccccaggcctcatcaccctcaccaccagcacagatatcagagccagtggc720

cttgccgcaacccccagcaacagcactaatgacatcaccaccaggacctttaccaggaga780

cgtagccgtgagagctcagaaagaatcaccagttaaaagtggacccgaagttttagaggt840

ggatacaaagcaagatattgtatctaatagtttggaagaacacacagttcaaactttgaa900

ggaacaagcagatcatctcctgcaaaaagaagattcccatattgggaaggaagaagaggt960

ttcagatggctctaagataagcctcagttctaaaaaagcaagttctaagaagaaatcttc1020

acaatttgaaggcacatttcttggttcagagtctgatgaagattctgtacggacttcttc1080

cagtcaaagatcacatgatttaaaatcttcaacaagcattgacaaggaaagagattttaa1140

gaagagctcagcaccttcaaaaagtgaggatttggggaaatcatcaagatcgaaaacaga1200

gagagatgatagatattgtagctactcaaaacttgaacgagatactcggtatgtatcttc1260

ccgatgtcggtccgaaagagatcgaaggcgaagccgatctcgttctagatctgacagagc1320

ctctagaactagtttgtcttattctcgctcagaaagatctcattattatgattctgaacg1380

gcgctaccataggagttccccttatcgtgagaggacacgctattctcggccatatactga1440

taacagggcacgggagagctcagactctgaagatgagtataagaagacatacccacggcg1500

tacctcagcccattcctacagagacctaaggacatcatcatcttactctaaatttgatcg1560

ggactgtaaaactgagacctcttacttagagatggagagaagaggaaagtatacttcaaa1620

actagaaagagaatccaaacggacttcagagcatgaaaccataaaaagatgttgttctcc1680

cccaaatgaactgggattccgacgggggtcatcatattccaagcatgataacagtacttc1740

ccgttataaatctgccctttcaaaatctatatccaagaatgataaatttaaaaattcttt1800

ctgttgtacagaattaaatgaggaaaacaaacaatctcattcgtttagtttgcagactcc1860

ttgttcaaaaggtagtgaattaagaacaattaataagatttctgaaagagaaaagactgg1920

gtctccaactccatcaaatcaattaaacgattcacctacttttaaaaagctagatgaatc1980

tcctgttcttaagcctgaatttataggacacgatggccgtgaaagtattaaagaattgga2040

gttatcaaaagtgaaaaatgatcaattaagaaatttttgttccattgaattaaatgtaaa2100

cggatctccagagacagaagctgatgtggcaacattttgtacttctaagacagatgctat2160

atcaatgacttctgatgatagtgtgactggatcagaggtatcccctttgatcaaggcttg2220

catgctttcatcaaatggatttcagaatgttggtagatgcagagaaagggactcagatga2280

tacttgtaggcagcataatacgtcaaaaagtccatttagggaaatggaacctttgttgtc2340

accacaccatgataaactcatgtctttgccagttaagactatagattatcccaaaacatt2400

aattaaagaaccagttgataagagacattcttgctgcaaaaccaaagattcagatatata2460

ctgttctccaaatgaaaaccctgaagctgagaacgctgaaccttcagctatgacgatttc2520

ttcacatagctttgtgaatgtgcatttggaatccaagacagttatatgtgataataggga2580

gccgacagaccggcactcagagaatacatgtgatgaatataagcagagcattggtagcac2640

tagttcagcttctcataaccattttgatggtttgtatgagcctatagggagttcaggtat2700

ttcatctctccagagtcctccgtcaggaataagatgtgaagaaaacacatctccaactct2760

agatgcagtggagagtaaaaaaggcatagattttttaaagtatgcacggaaagaaacaga2820

tgttggtagtgcccttcctgattcaggaaaaggattttcttgggaaaacaggcataataa2880

tgtgttatctgggcagtctttgcaagaggctcaagaagaagggaattccatattgcatga2940

gagaagaggaagaccagaaatccccttagatgaggaacaaagaggccatacacatatttc3000

tgatgattcagaagtggtatttccttatgatttgaacttgaccatggaagacagtgatgg3060

tataacctacaccttaaaatgtgatagtagtggaaatgctccagagattgtatctactgt3120

ccatgaagactattctggatcttctgcaagttcaagcgatgaaagtgattctgaagatac3180

agagtctgatgatagcagtattccaagaaaccgactccagtctgttgtggttgtgccaaa3240

gaattctactttgcccatggaagagacaagtccctgttcttctcggagcagtcagagcta3300

caaacattattctgaccgctgggaagatggattagagaccaggagacatgcatatgagga3360

agagtatgagagtaaaggctgttctcaaactgaaaaatacttccttcataaaggaacaga3420

gagaagtgcagaaagttgttattcacagtttggcaggaaagcagataatcacctgcctga3480

cattgctcatgctcagagtgacggggttgatagtacaagtcagacagactcgagatctga3540

ccatctaggtcacctgaatccagaggacacattaagagccaaaacatctaggccacaaga3600

gctaccagtttattctgacgattttgaagatctcccaaataagtctcggcagcagatgat3660

tttctctaatcggccagatagtagtagactaggaaaaacagagctgagtttttcttcctc3720

ttgtgacatttcccgaatggatggcttgcactcatcagaagagctcagaaacctagggtg3780

ggacttttcccaacaggaaaggcccaccaccacataccagcagcctgacagcagctatgg3840

aacctgtggtacacataagtatcaacaaagtactgaacactatggtgggacccataatta3900

ctggcaaggcaatggctattgggatccaagatcagcaggtagacctccaggaactgggct3960

tgcttatgatcgaatccaagggcaagtaccagattctctaacagacgatcgtgaagaaga4020

ggaacattgggatcaacgaagtggatcacatttttcaagcccgtccaataaatttttctt4080

ccatcagaaggacaagggatcagtgcaagcaccggaaataagcagcaattcaattaaaga4140

cgctttagttatgaacgaaaggaaagatttttcgaaaaactttgaaaaaaatgatataaa4200

agagagagggcctcctaaaaaacgaaggcaagagttggagagtgattctgaaagtgatgg4260

tgaactacaggctagaaagaaagttagagtggagatggagcagggagaatcatctgtgcc4320

ccagcactcagaactgatggggccttcgtgtgctatggatgacttcagggacccacagcg4380

gtggaaagaatttgccaagctggggaagatgccatgttactttgatcttattgaagaaaa4440

tgtttatttaacagaaaggaagaagaacaaatcccaccgggatattaagcgaatgcagtg4500

tgagtgtacacctctttctaaggatgaaagagctcaaggtgaagtagcatgtggagaaga4560

ttgccttaatcgtctcctcatgattgaatgttcctctcgatgtccaaatggagattactg4620

ttcaaacagacggtttcagagaaaacagcatgcagatgtagaagtcatacttacagaaaa4680

gaaaggctggggcttaagggctgctaaggatcttccttcgaacacctttgtcctggaata4740

ctgtggagaggtacttgatcataaagagtttaaagctcgggtgaaagaatatgcacggaa4800

caaaaacatccactactacttcatggccctgaaaaatgacgagataatagatgccactca4860

aaaagggaattgctctcgtttcatgaatcatagctgtgaaccaaactgtgaaacccagaa4920

atggactgtgaatggacagctgagggttggattttttaccaccaaactagttccttcagg4980

ctcagaattaacttttgactaccagttccaaagatatggcaaagaagctcagaagtgttt5040

ctgtgggtcagccaactgccggggctacttgggaggagaaaacagagtcagtatcagagc5100

tgcaggagggaagatgaaaaaggaacgctctcgaaagaaggattcagtggatggagaact5160

tgaagcactgatggaaaatggtgaaggcctctctgataagaaccaggttcttagtttatc5220

ccggctcatggttagaattgaaactttggaacagaaacttacctgtcttaagctcattca5280

gaacacacactcacagtcctgcctcaagtcatttctggaacgtcatgggttgtcactgtt5340

gtggatctggatggcagagcttggcgacggccgggaaagtaaccagaagcttcaggaaga5400

gattataaagactttggagcatttgcccattcctactaaaaatatgttggaagaaagcaa5460

agtacttccaattattcagcgctggtctcaaactaagactgctgttcctcagttaagtga5520

aggagacgggtattctagtgagaatacatcacgtgctcacacaccgcttaatacaccgga5580

cccttctgccaagccgagcacggaaatggatacagatactcccaagaaactcatattccg5640

cagactgaagattataagtgaaaatagcatggacagtgcagtctcggacgtcactagtga5700

gctagaatgcaaggatggcaaagaggaccttgatcagttagagactgtcactgtggaaga5760

ggatgaagagctgcagtcccagcagctcctcccacagcagctgtgcgagtccaaagttga5820

gagtgaagccactattgaagtcagtaagttacccacatctgaaccggaggcagacacgga5880

gacagagcccaaagacagcaatggcacaaaactagaagaaactattgctgaggaaacacc5940

atcccaagatgaagaagagggagtgtctgatgttgaaagtgagagaagccaggagccacc6000

agataaaacagtggatataagtgatttggctaccaagttactagacagttggaaagatct6060

aaaggaggtgtatcggattccaaagaaaagtcaaactgaaaaggagagcacagtagctga6120

acgaggaagagatgctgctgccttcagagatcaaacagctccaaagactcctaacaggtc6180

tagagagagagacccagacaagcagtctcaaaataaagagaaaaggaaacgacggggctc6240

tctgtcaccaccctcttctgcatatgagcggggaacaaaaaggccagatgacagatatga6300

tacaccaacttctaaaaagaaagtacgaattaaagaccgaaacaaactttctacagagga6360

gcgcaggaagttgtttgaacaagaggtggcacagagggaagctcagaagcaacagcaaca6420

gatgcagaacttggggatgacatcaccactcccctttgactctctgggatataatgcctc6480

tcatcacccctttgctgggtacccaccaggttaccccatgcaagcctatgtggatcccag6540

caaccctaatgctggaaaggtgcttctgcccacacctagcatggaccctgtgtgctcccc6600

tgctccttatgatcacgctcagcccttggtaggacattctacagaatcccttgctgctcc6660

cccatctgtgccagtggtgccgcatgtggcagcctctgtggaagtttccagttctcagta6720

tgtagctcagaatgaaagtgttgtacaccaagactccaatgttcctgtaatgccagtaca6780

agctccaggcccagtccaaggacagaattacaatgtctgggagtcaaaccaacagtctgt6840

cagtgtacaacagcagtattctcctgcacaatctcaaacaaccatatattatcaaggaca6900

gacatgttcaactgtctatagtgtgacctcgccttattcacagacaactcctccaattgt6960

gcagagttatgcccagccaagtcttcagtatatccagggacagcagattttcacagctca7020

cccacaaggagtggtggtacagccaactgcagccgtgacttcaatagttgcaccagggca7080

gcctcagtccttacagccacctgaaatggttgtaacaaataatctactggacctgccacc7140

accctcccctccaaaaccaaaaacgattgttttacctcccaactggaagacagcccgaga7200

ccctgaggggaagatctactactaccacgtgatcacaagacagactcagtgggatcctcc7260

tacttgggaaagcccaggagatgatgccagccttgagcatgaagctgaaatggacctggg7320

aaccccaacctatgatgaaaaccccatgaagacatcaaaaaagcccaagacagcagaagc7380

agacacctccagtgagctggcaaagaaaagcaaagaagtattcagaaaagagatgtctca7440

gttcattgtccagtgcctgaatccttaccggaaacctgactgcaaggtgggcaggatcac7500

caccactgaagatttcaagcacctcgcccgaaagctgactcatggagttatgaataagga7560

gctgaagtactgtaagaaccccgaggacctggagtgcaatgagaatgtgaaacacaaaac7620

caaggagtacatcaagaagtacatgcagaagtttggggctgtttacaaacctaaagagga7680

cactgaactagagtgacctcaggccagagtggagtatgagcggaaaggatgaatcctgtg7740

gcttctgccctaccccacggccaaggctgtgctactgatgtgatgacccaccatcctgag7800

cagttcaaacctgcaggtgtcagctgtaagctgcaaaagtgagctctgtctccaaatgac7860

ccctagttgtgagctgttggtgtaacagttacaggccatcagaggcagtagcctagggaa7920

gaccttggccacacgaccccattctcaaatctgggtctcccccttggcggtgctgtcagc7980

gcacagacccatgcgcacctcccccagatcctttaccctgacaatatgtattatatttta8040

atgtatatgtgaagatattgaaaataatttgtttttcctggtttttgttctgtttttgtt8100

tgctgttagcatctatgtgctggaatcaaggaaagactttgtgaggatagtataaattct8160

cctgcaaggttggatttgttatcatgtaaatatcccaacgcaggctgccttgtggtttgg8220

ccgccttgtgctatgttgataagattgatttactgcttcagatcactttactttatccaa8280

tttttactgaactttttatgtaaaaaataaaatcaattaaagaacttggaatgtgtgctc8340

cctcaaaatt8350

<210>4

<211>2537

<212>prt

<213>小鼠(musmusculus)

<400>4

metlysproleuproserglnglnproproprolysmetglyaspphe

151015

tyraspprogluhisprothrproglugluglugluasnglualalys

202530

ilegluasnvalglnlysthrglypheilelysglyprovalphelys

354045

glyvalalaserserargpheleuprolysglythrlysthrlysval

505560

asnleuglugluglnglyargglnlysvalserpheserpheserphe

65707580

thrlyslysthrleuglnasnargpheleuthralaleuserasnglu

859095

lysglnseraspserproasnserproalaproproleuglnvalasp

100105110

serasnprolysvallysmetaspalaglyaspthrpheproalathr

115120125

glugluserserproprolysserargvalgluleuglyargilehis

130135140

phelyslyshisleuleuhisvalthrserargproglnleualaala

145150155160

serthrthralaalaserproleuproprothrthrglnleuproala

165170175

valleualaglusermetileaspserproproserserpropropro

180185190

proproproproproglnalaserserproserproproalaglnile

195200205

sergluprovalalaleuproglnproproalathralaleumetthr

210215220

serproproglyproleuproglyaspvalalavalargalaglnlys

225230235240

gluserprovallysserglyprogluvalleugluvalaspthrlys

245250255

glnaspilevalserasnserleuglugluhisthrvalglnthrleu

260265270

lysgluglnalaasphisleuleuglnlysgluaspserhisilegly

275280285

lysgluglugluvalseraspglyserlysileserleuserserlys

290295300

lysalaserserlyslyslysserserglnphegluglythrpheleu

305310315320

glysergluseraspgluaspservalargthrserserserglnarg

325330335

serhisaspleulysserserthrserileasplysgluargaspphe

340345350

lyslysserseralaproserlyssergluaspleuglylysserser

355360365

argserlysthrgluargaspaspargtyrcyssertyrserlysleu

370375380

gluargaspthrargtyrvalserserargcysargsergluargasp

385390395400

argargargserargserargserargseraspargalaserargthr

405410415

serleusertyrserargsergluargserhistyrtyraspserglu

420425430

argargtyrhisargserserprotyrarggluargthrargtyrser

435440445

argprotyrthraspasnargalaarggluserseraspsergluasp

450455460

glutyrlyslysthrtyrproargargthrseralahissertyrarg

465470475480

aspleuargthrsersersertyrserlyspheaspargaspcyslys

485490495

thrgluthrsertyrleuglumetgluargargglylystyrthrser

500505510

lysleugluarggluserlysargthrsergluhisgluthrilelys

515520525

argcyscysserproproasngluleuglypheargargglyserser

530535540

tyrserlyshisaspasnserthrserargtyrlysseralaleuser

545550555560

lysserileserlysasnasplysphelysasnserphecyscysthr

565570575

gluleuasnglugluasnlysglnserhisserpheserleuglnthr

580585590

procysserlysglysergluleuargthrileasnlysileserglu

595600605

argglulysthrglyserprothrproserasnglnleuasnaspser

610615620

prothrphelyslysleuaspgluserprovalleulysprogluphe

625630635640

ileglyhisaspglyarggluserilelysgluleugluleuserlys

645650655

vallysasnaspglnleuargasnphecysserilegluleuasnval

660665670

asnglyserprogluthrglualaaspvalalathrphecysthrser

675680685

lysthraspalailesermetthrseraspaspservalthrglyser

690695700

gluvalserproleuilelysalacysmetleuserserasnglyphe

705710715720

glnasnvalglyargcysarggluargaspseraspaspthrcysarg

725730735

glnhisasnthrserlysserpropheargglumetgluproleuleu

740745750

serprohishisasplysleumetserleuprovallysthrileasp

755760765

tyrprolysthrleuilelysgluprovalasplysarghissercys

770775780

cyslysthrlysaspseraspiletyrcysserproasngluasnpro

785790795800

glualagluasnalagluproseralametthrileserserhisser

805810815

phevalasnvalhisleugluserlysthrvalilecysaspasnarg

820825830

gluprothrasparghissergluasnthrcysaspglutyrlysgln

835840845

serileglyserthrserseralaserhisasnhispheaspglyleu

850855860

tyrgluproileglyserserglyileserserleuglnserpropro

865870875880

serglyileargcysglugluasnthrserprothrleuaspalaval

885890895

gluserlyslysglyileasppheleulystyralaarglysgluthr

900905910

aspvalglyseralaleuproaspserglylysglyphesertrpglu

915920925

asnarghisasnasnvalleuserglyglnserleuglnglualagln

930935940

glugluglyasnserileleuhisgluargargglyargprogluile

945950955960

proleuaspglugluglnargglyhisthrhisileseraspaspser

965970975

gluvalvalpheprotyraspleuasnleuthrmetgluaspserasp

980985990

glyilethrtyrthrleulyscysaspserserglyasnalaproglu

99510001005

ilevalserthrvalhisgluasptyrserglyserseralaser

101010151020

serseraspgluseraspsergluaspthrgluseraspaspser

102510301035

serileproargasnargleuglnservalvalvalvalprolys

104010451050

asnserthrleuprometglugluthrserprocysserserarg

105510601065

serserglnsertyrlyshistyrseraspargtrpgluaspgly

107010751080

leugluthrargarghisalatyrglugluglutyrgluserlys

108510901095

glycysserglnthrglulystyrpheleuhislysglythrglu

110011051110

argseralaglusercystyrserglnpheglyarglysalaasp

111511201125

asnhisleuproaspilealahisalaglnseraspglyvalasp

113011351140

serthrserglnthraspserargserasphisleuglyhisleu

114511501155

asnprogluaspthrleuargalalysthrserargproglnglu

116011651170

leuprovaltyrseraspaspphegluaspleuproasnlysser

117511801185

argglnglnmetilepheserasnargproaspserserargleu

119011951200

glylysthrgluleuserphesersersercysaspileserarg

120512101215

metaspglyleuhisserserglugluleuargasnleuglytrp

122012251230

asppheserglnglngluargprothrthrthrtyrglnglnpro

123512401245

aspsersertyrglythrcysglythrhislystyrglnglnser

125012551260

thrgluhistyrglyglythrhisasntyrtrpglnglyasngly

126512701275

tyrtrpaspproargseralaglyargproproglythrglyleu

128012851290

alatyraspargileglnglyglnvalproaspserleuthrasp

129513001305

aspargglugluglugluhistrpaspglnargserglyserhis

131013151320

pheserserproserasnlysphephephehisglnlysasplys

132513301335

glyservalglnalaprogluileserserasnserilelysasp

134013451350

alaleuvalmetasngluarglysasppheserlysasnpheglu

135513601365

lysasnaspilelysgluargglyproprolyslysargarggln

137013751380

gluleugluseraspsergluseraspglygluleuglnalaarg

138513901395

lyslysvalargvalglumetgluglnglygluserservalpro

140014051410

glnhissergluleumetglyprosercysalametaspaspphe

141514201425

argaspproglnargtrplysgluphealalysleuglylysmet

143014351440

procystyrpheaspleuileglugluasnvaltyrleuthrglu

144514501455

arglyslysasnlysserhisargaspilelysargmetglncys

146014651470

glucysthrproleuserlysaspgluargalaglnglygluval

147514801485

alacysglygluaspcysleuasnargleuleumetileglucys

149014951500

serserargcysproasnglyasptyrcysserasnargargphe

150515101515

glnarglysglnhisalaaspvalgluvalileleuthrglulys

152015251530

lysglytrpglyleuargalaalalysaspleuproserasnthr

153515401545

phevalleuglutyrcysglygluvalleuasphislysgluphe

155015551560

lysalaargvallysglutyralaargasnlysasnilehistyr

156515701575

tyrphemetalaleulysasnaspgluileileaspalathrgln

158015851590

lysglyasncysserargphemetasnhissercysgluproasn

159516001605

cysgluthrglnlystrpthrvalasnglyglnleuargvalgly

161016151620

phephethrthrlysleuvalproserglysergluleuthrphe

162516301635

asptyrglnpheglnargtyrglylysglualaglnlyscysphe

164016451650

cysglyseralaasncysargglytyrleuglyglygluasnarg

165516601665

valserileargalaalaglyglylysmetlyslysgluargser

167016751680

arglyslysaspservalaspglygluleuglualaleumetglu

168516901695

asnglygluglyleuserasplysasnglnvalleuserleuser

170017051710

argleumetvalargilegluthrleugluglnlysleuthrcys

171517201725

leulysleuileglnasnthrhisserglnsercysleulysser

173017351740

pheleugluarghisglyleuserleuleutrpiletrpmetala

174517501755

gluleuglyaspglyarggluserasnglnlysleuglngluglu

176017651770

ileilelysthrleugluhisleuproileprothrlysasnmet

177517801785

leuglugluserlysvalleuproileileglnargtrpsergln

179017951800

thrlysthralavalproglnleusergluglyaspglytyrser

180518101815

sergluasnthrserargalahisthrproleuasnthrproasp

182018251830

proseralalysproserthrglumetaspthraspthrprolys

183518401845

lysleuilepheargargleulysileilesergluasnsermet

185018551860

aspseralavalseraspvalthrsergluleuglucyslysasp

186518701875

glylysgluaspleuaspglnleugluthrvalthrvalgluglu

188018851890

aspglugluleuglnserglnglnleuleuproglnglnleucys

189519001905

gluserlysvalgluserglualathrilegluvalserlysleu

191019151920

prothrsergluproglualaaspthrgluthrgluprolysasp

192519301935

serasnglythrlysleuglugluthrilealaglugluthrpro

194019451950

serglnaspgluglugluglyvalseraspvalglusergluarg

195519601965

serglngluproproasplysthrvalaspileseraspleuala

197019751980

thrlysleuleuaspsertrplysaspleulysgluvaltyrarg

198519901995

ileprolyslysserglnthrglulysgluserthrvalalaglu

200020052010

argglyargaspalaalaalapheargaspglnthralaprolys

201520202025

thrproasnargserarggluargaspproasplysglnsergln

203020352040

asnlysglulysarglysargargglyserleuserproproser

204520502055

seralatyrgluargglythrlysargproaspaspargtyrasp

206020652070

thrprothrserlyslyslysvalargilelysaspargasnlys

207520802085

leuserthrglugluargarglysleuphegluglngluvalala

209020952100

glnargglualaglnlysglnglnglnglnmetglnasnleugly

210521102115

metthrserproleupropheaspserleuglytyrasnalaser

212021252130

hishisprophealaglytyrproproglytyrprometglnala

213521402145

tyrvalaspproserasnproasnalaglylysvalleuleupro

215021552160

thrprosermetaspprovalcysserproalaprotyrasphis

216521702175

alaglnproleuvalglyhisserthrgluserleualaalapro

218021852190

proservalprovalvalprohisvalalaalaservalgluval

219522002205

serserserglntyrvalalaglnasngluservalvalhisgln

221022152220

aspserasnvalprovalmetprovalglnalaproglyproval

222522302235

glnglyglnasntyrasnvaltrpgluserasnglnglnserval

224022452250

servalglnglnglntyrserproalaglnserglnthrthrile

225522602265

tyrtyrglnglyglnthrcysserthrvaltyrservalthrser

227022752280

protyrserglnthrthrproproilevalglnsertyralagln

228522902295

proserleuglntyrileglnglyglnglnilephethralahis

230023052310

proglnglyvalvalvalglnprothralaalavalthrserile

231523202325

valalaproglyglnproglnserleuglnproproglumetval

233023352340

valthrasnasnleuleuaspleuproproproserproprolys

234523502355

prolysthrilevalleuproproasntrplysthralaargasp

236023652370

progluglylysiletyrtyrtyrhisvalilethrargglnthr

237523802385

glntrpaspproprothrtrpgluserproglyaspaspalaser

239023952400

leugluhisglualaglumetaspleuglythrprothrtyrasp

240524102415

gluasnprometlysthrserlyslysprolysthralagluala

242024252430

aspthrsersergluleualalyslysserlysgluvalphearg

243524402445

lysglumetserglnpheilevalglncysleuasnprotyrarg

245024552460

lysproaspcyslysvalglyargilethrthrthrgluaspphe

246524702475

lyshisleualaarglysleuthrhisglyvalmetasnlysglu

248024852490

leulystyrcyslysasnprogluaspleuglucysasngluasn

249525002505

vallyshislysthrlysglutyrilelyslystyrmetglnlys

251025152520

pheglyalavaltyrlysprolysgluaspthrgluleuglu

252525302535

<210>5

<211>19

<212>rna

<213>人工序列

<400>5

gguguaacuuaugcauuaa19

<210>6

<211>19

<212>rna

<213>人工序列

<400>6

uuaaugcauaaguuacacc19

<210>7

<211>19

<212>rna

<213>人工序列

<400>7

uucuccgaacgugucacgu19

<210>8

<211>19

<212>rna

<213>人工序列

<400>8

acgugacacguucggagaa19

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1