本发明涉及生物技术和医学领域,具体地说,是一种表观修饰酶setd2,即含有set结构域的蛋白2(setdomaincontaining2,setd2)在预防或治疗与病毒感染相关的疾病或征状、控制病毒感染导致损伤中的效应、作用机制、实施方法和用途。
背景技术:
感染尤其是病毒感染是一种危害极大的临床常见疾病。人们最初对于机体抗病毒感染的分子机制并不完全了解,随着一类细胞因子——干扰素的发现,机体针对病毒感染所产生的天然免疫细胞和继发的获得性免疫细胞和及其作用的分子生物学基础逐步得到了认识。干扰素(interferon,ifn)是一类具有强大抗病毒功能的细胞因子家族的总称。1957年,alickisaacs和jeanlindenmann教授在研究流感病毒感染鸡胚的过程中发现了一种成分,这种成分能显著地阻止流感病毒的增殖,他们将这种成分命名为干扰素(isaacs,a.等,procrsoclondbbiolsci.1957;927:258-267.)。此后,干扰素家族的细胞因子被陆续发现具有十分广谱且有效的抗病毒效应。目前,干扰素已被广泛应用于临床上防御病毒感染及治疗病毒感染引起的各种疾病。
干扰素家族主要分为三个亚家族:即i型干扰素(ifn-i)、ii型干扰素(ifn-ii)、iii型干扰素(ifn-iii)。i型干扰素是其中种类最多、功能最全的亚家族细胞因子,包含13种ifnα亚型、ifnβ、ifnε、ifnτ、ifnκ、ifnω、ifnδ和ifnζ等。目前研究发现,i型干扰素不仅具有强大的抗病毒功能,还具有抗细菌感染、调节免疫应答及抗肿瘤进展等多种功能。ii型干扰素仅含有一种基因编码的细胞因子产物——ifnγ,它主要由t细胞核自然杀伤性细胞(nk细胞)产生,具有很强的细胞毒性,起细胞杀伤作用。iii型干扰素主要包含ifnλ1、ifnλ2和ifnλ3等,也分别称作白细胞介素(interleukin,il)-29、il-28a和il-28b。iii型干扰素和i型干扰素具有相似的抗病毒功能,但是其抗病毒的活性受到一定程度的限制。其原因为:iii型干扰素的识别受体il-28r仅在表皮细胞中有表达,多数免疫细胞中均不表达iii型干扰素的受体(pestka,s.等,immunol.rev.2004;202,8-32;schoenborn,j.r.等,adv.immunol.2007;96,41-101;o’brien,t.r.等,j.interferoncytokineres.2014;34,829-838.)。
感染机体的不同病原体中一般含有相似的结构或分子特征,或为病毒相对保守的序列特征,或为病原微生物所共有的组成型表达分子等。这些相似的结构、特征被统称为病原体相关分子模式(pathogenassociatedmolecularpatterns,pamps);而与之相互识别的细胞表面受体则被称为模式识别受体(patternrecognitionreceptors,prrs)。例如:特异性识别rna病毒的ppr有rnahelicasesretinoicacid-induciblegenei(rig-i,也叫ddx58)和melanomadifferentiation-associatedgene5(mda5,也叫ifih1)等,它们主要识别感染在细胞内的rna病毒中富含at元件的部分。特异性识别dna病毒的prr有dna-dependentactivatorofifn-regulatoryfactors(dai,也称作zbp1)和cytosolicgampsynthase(cgas,也称作mb21d1)等(goubau,d.等;immunity,2013;38,855-869.)。这些ppr识别病毒后,通过激发宿主内的免疫应答信号通路,诱导产生大量的i型干扰素,从而迅速的建立起机体抗感染的第一道防线,抵御病原体的感染。
当机体产生大量的ifn-i后,ifn-i便以自分泌或旁分泌的方式作用于自身或临近细胞,与细胞表面受体ifnar1和ifnar2结合激活细胞内信号通路。识别了ifn-i的受体ifnar1和ifnar2分别磷酸化激活其下游底物januskinase1(jak1)和non-receptortyrosinekinase2(tyk2)。活化的jak1和tyk2进一步催化下游的转录因子signaltransducerandactivatoroftranscription1(stat1)和stat2发生磷酸化修饰,激活其转录因子的活性。活化的stat1和stat2进而招募ifn-regulatoryfactor9(irf9),形成活化型的stat1-stat2-irf9三聚体复合物——theinterferon-stimulatedgenefactor3(isgf3)。复合物isgf3转位入核,识别含有高度保守dna序列的“tttcnntttc”的ifn刺激应答元件,诱导一系列ifn刺激基因(ifn-stimulatedgene,isg)的表达。除此之外,ifn-i信号活化后还能诱导stat1形成同源二聚体复合物,在不需要irf9和stat2的参与的情况下,识别序列为“ttcnnngaa”的保守dna基序(γ活化的序列,gamma-activatedsequence,gas),诱导启动子区含有该基序的isg基因表达(stark,g.r.等,immunity,2012;36,503-514.)。ifn-i同样可以通过诱导其他的stat蛋白(包括stat3、stat4、stat5a和stat5b)激活isg基因的表达。除了stat蛋白依赖的信号外,ifn-i也可诱导phosphoinositide3-kinase(pi3k)-mammaliantargetofrapamycin(mtor)信号通路和multiplemitogen-activatedproteinkinase(mapk)信号通路的活化,刺激另一些isg基因的表达。isg基因所编码的蛋白在各个方面发挥着抗病毒功能,如促进病毒的降解、抑制病毒的复制、破坏病毒从细胞中释放以及抵抗病毒的二次感染等。总而言之,ifn-i通过诱导细胞内多条信号通路的活化,最大化地发挥其抗病毒的效应(ivashkiv,l.b.等,naturerev.immunol.2014;14,36-49.)。
此外,ifn-i还具有免疫调节功能。如促进cd4阳性t细胞和cd8阳性t细胞的增殖和其细胞杀伤能力(havenar-daughton,c.等,j.immunol.2006;176,3315-3319;marshall,h.d.等,j.virol.2011;85,5929-5939.);增强nk细胞的免疫反应(martinez,j.等,j.immunol.2008;180,1592-1597.);激活b细胞、增强b细胞的抗体识别和类别转换(classswithing)(lebon,a.等,immunity;2001,14,461-470.)等。
临床上,ifn-i已经应用于治疗多种疾病。例如,ifnα2a以及聚乙二醇缓释过的ifn(peglated-ifnα)已经被美国食品及药物管理局批准用于治疗乙型肝炎病毒(hepatitisbvirus,hbv)和丙型肝炎病毒(hepatitiscvirus,hcv)感染所引起的肝炎(lau,g.k.等.nengljmed,2005;352,2682-2695.)。ifn-α2a和2b也被应用到多毛细胞白血病(golomb,h.m.等,jclinoncol.1986;4,900-905.),及黑色素瘤(bart,r.s.等,cancerres.1980;40,614-619.)卡波济肉瘤(real,f.x.等,jclinoncol.1986;4,544-551.)等实体瘤的治疗中。最近,ifnβ在治疗多发性硬化症(multiplesclerosis,ms)——一种中枢神经系统白质炎性脱髓鞘病变的自身免疫性疾病的应用中也取得良好的效果(annibali,v.等,cytokinegrowthfactorrev.2015;26,221-228.)。
然而,尽管ifn已经取得了诸多的治疗效果,但也产生了一些临床不良反应,如可能导致患者甲状腺功能异常(goischke,h.k.等,verdauungskrankheiten,2004;22,275-283.)、肾功能降低乃至衰竭等(stein,d.f.等,digestivediseases&sciences,2001;46,530-534.),部分患者还出现了系统性红斑性狼疮等自身性免疫疾病症状(crowm.k.等,autoimmunity,2003;36,481-490.)。并且,ifn对一些病毒慢性感染疾病的疗效也不显著。例如,干扰素对hbve抗原(hepatitisbeantigen,hbeag)阳性的乙肝病人治疗有效率较高,为33%,而在hbeag阴性的乙肝病人中ifn治疗的有效率仅有25%(scaglione,s.j.等,gastroenterology.2012;142,1360-1368.)。由于ifn通过激活细胞内免疫应答信号和诱导大量抗病毒蛋白发挥其抗病毒机制(lucifora,j.等,science.2014;343,1221-1228;yan,r.等,j.virol.2015;89,9200-9212.),因此,开发出一种有效增强ifn抗病毒效应的治疗方案是目前迫切需要解决的问题。
含有set结构域的蛋白2(setdomaincontaining2,setd2),又名亨廷顿结合蛋白b(huntingtininteractingproteinb,hypb),是一种含有set结构域的组蛋白甲基转移酶,主要负责催化组蛋白h3第36位赖氨酸的三甲基化修饰(h3k36me3)(edmunds,j.w.等,emboj.2008;27,406-420.)。目前研究发现了setd2在很多生命活动中的重要功能。例如:setd2可以促进蛋白质翻译过程中的选择性剪切(luco,r.f.等,science,2010;327,996-1000.)、维持转录的延伸(carvalho;s.等,nucleicacidsres.2013;41,2881-2893.)、参与dna损伤后修复(carvalho;s.等,elife.2014,3,e02482;pfister;s.x.等,cellrep.2014;7,2006-2018.)、促进胚胎发育(zhang,,y.等,cellrep.2014,;8,1989-2002.)等。此外,setd2的突变与多种肿瘤的疾病进展相关,包括急性淋巴细胞白血病(zhu,x.等,nat.genet.2014;46,287-293.),肾透明细胞癌(dalgliesh,g.l.等,nature.2010;463,360-363.)等。然而到目前为止,setd2蛋白在免疫应答及抗病毒感染中的作用尚不明确。
综上所述,本领域迫切需要开发出一种可调控干扰素活性、增强抗病毒效应、有效抵抗病毒感染、控制病毒感染引起损伤的免疫学活性物质。
技术实现要素:
本发明的目的在于提供setd2、其编码序列、其促进剂或其抑制剂在调控ifn信号活化和抗病毒能力中的用途,并进一步提供它们在治疗或预防病毒感染相关的疾病或征状中的用途。本发明的药物、药物组合物或试剂盒可用于有效抵抗病毒感染、控制病毒感染性疾病的产生。
本发明的第一方面,提供含有set结构域的蛋白2,即setd2或setd2编码序列、其促进剂在制备用于抑制病毒感染的药物或试剂盒中的用途。
优选的,所述setd2选自:
(a)seqidno:2或seqidno:4所示的氨基酸序列;或
(b)与seqidno:2或seqidno:4所示的氨基酸序列同源,且具有抑制病毒感染的蛋白质或多肽;或
(c)(a)或(b)的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸、且具有抑制病毒感染的由(a)或(b)衍生的蛋白质或多肽。
更优选的,所述setd2选自:seqidno:2或seqidno:4所示的氨基酸序列。
所述setd2编码序列选自:
(i)seqidno:1或seqidno:1的第2889-5267位序列、seqidno:3或seqidno:3的第2861-5218位序列所示的核苷酸序列;或
(ii)在严格条件下与(i)限定的核苷酸序列杂交的分子;或
(iii)(i)或(ii)的核苷酸序列中经过取代、缺失或添加一个或几个核苷酸、且编码具有抑制病毒感染的蛋白质或多肽的分子。
更优选的,所述setd2编码序列选自:seqidno:1或seqidno:1的第2889-5267位序列、seqidno:3或seqidno:3的第2861-5218位序列所示的核苷酸序列。
优选的,所述setd2或setd2编码序列的所述促进剂选自:setd2或setd2编码序列的过表达载体、外源性setd2、setd2或setd2编码序列的裸dna、setd2或setd2编码序列的脂质体包裹dna、setd2蛋白;
优选的,所述setd2是:天然纯化的蛋白、化学合成的产物、或使用重组技术从原核或真核宿主中产生。所述宿主选自:细菌、酵母、高等动物和哺乳动物细胞。更优选为人setd2。
在本发明的一个实施例中,所述setd2或setd2编码序列、或其促进剂抑制病毒感染。所述setd2、setd2编码序列或其促进剂促进ifnα的抗病毒效应。
在本发明的一个实施例中,setd2或setd2编码序列的抑制剂抑制细胞抗病毒感染的能力,对病毒在细胞中的复制具有促进作用。setd2或setd2编码序列的所述抑制剂选自针对setd2或其编码序列的:抗体、sirna、mirna、反义寡核苷酸、拮抗剂、阻断剂。
优选的,所述药物或试剂盒包含setd2或setd2编码序列、或其促进剂,并通过抑制病毒感染进一步用于预防或治疗与病毒感染相关的疾病和/或其征状、病毒感染导致的慢性炎症性疾病(特别是自身免疫性疾病)和/或其征状。
优选的,所述与病毒感染相关的疾病和/或其征状为选自下组的一种或两种以上因病毒感染引起的疾病和/或征状:病毒感染后引起的组织损伤;器官的炎症损伤;多器官功能衰竭。
优选的,所述病毒感染是由选自下组的一种或两种以上病毒引起的:乙型肝炎病毒、丙型肝炎病毒、单纯疱疹病毒、仙台病毒、水疱性口炎病毒等多数dna病毒和rna病毒。更优选乙型肝炎病毒(hbv)。
优选的,所述器官选自:肝脏、肺脏、脾脏、肾、肠道。
在本发明的一个优选实施例中,所述病毒感染相关的疾病和/或其征状为乙型肝炎病毒感染引起的肝脏损伤。
在一些实例中,所述肝组织活性标志选自:谷丙转氨酶和谷草转氨酶。这两种转氨酶是肝脏代谢过程中必需的“催化剂”,主要存在肝细胞中发挥作用。肝细胞发生炎症、坏死等造成肝细胞受损的病变后,转氨酶便会进入血液中,使血清中的转氨酶含量升高。
优选的,所述病毒感染导致的慢性炎症性疾病和/或其征状包括:自身免疫性疾病如炎症性肠病、类风湿性关节炎、系统性红斑狼疮、慢性肾炎、结核病、慢性胃肠道疾病。
优选的,所述药物的给药方法选自:给予setd2编码序列,例如直接裸dna注射法、脂质体包裹dna直接注射法、金包被dna基因枪轰击法、繁殖缺陷细菌携带质粒dna法、复制缺陷腺病毒携带目的dna法;给予setd2蛋白,例如注射给药(如直接注射setd2蛋白或用脂质体包埋的setd2蛋白)、鼻腔给药、肺部给药、口服给药、透皮给药(如离子导入)、瘤内给药。
本发明的第二方面,提供一种抑制病毒感染的药物组合物,其包含:
(a)治疗有效量的setd2或setd2编码序列、其促进剂;以及
(b)药学上或免疫学上可接受的载体或赋形剂。
优选的,所述药物组合物中setd2或setd2编码序列、其促进剂占药物组合物总重量的0.001~99.9wt%。
优选的,所述药物组合物中setd2或setd2编码序列、其促进剂占药物组合物总重量的1~95wt%,优选为5~90wt%,更优选10~80wt%。余量为药学上可接受的载体以及其它添加剂等物质。
优选的,在给予本发明的药物组合物之前、同时或之后,给予调控抗病毒感染的其它活性物质。所述其它活性物质具有预防或治疗与病毒感染相关的疾病、感染导致的损伤、感染导致的慢性炎症性疾病和/或其征状的活性。所述病毒感染为选自下组中的一种或两种以上:乙肝病毒感染、丙肝病毒感染、单纯疱疹病毒、仙台病毒感染、水疱性口炎病毒。
更优选的,所述药物组合物还包含抑制病毒感染的其它活性物质。所述其它活性物质具有预防或治疗与病毒感染相关的疾病、感染导致的损伤、感染导致的慢性炎症性疾病和/或其征状的活性。
在本发明的优选实施方式中,所述其它活性物质选自:临床常用抗生素,包括β-内酰胺类(青霉素类和头孢菌素类)、氨基糖甙类、四环素类、氯霉素类、大环内脂类、抗真菌抗生素、抗结核类抗生素中的一种或两种以上;临床常用抗病毒药物(三环胺类、焦磷酸类、蛋白酶抑制药、核苷类药物及干扰素、反义寡核苷酸类等)中的一种或两种以上;临床常用免疫抑制剂(包括糖皮质激素、环磷酰胺、氯喹、环孢霉素a、雷公藤、中药制剂、抗tnf单克隆抗体)中的一种或两种以上。
本发明的第三方面,提供一种预防或治疗病毒感染、病毒感染导致的慢性炎症性疾病和/或其征状的方法,所述方法包括:给予需要预防或治疗的对象有效量的setd2或setd2编码序列、和/或其促进剂、或本发明的药物组合物。
优选的,所述病毒感染为选自下组中的一种或两种以上:乙肝病毒感染、丙肝病毒感染、单纯疱疹病毒感染、仙台病毒感染、水疱性口炎病毒感染。
优选的,所述病毒感染导致的慢性炎症性疾病和/或其征状为选自下组的一种或两种以上因病毒感染引起的疾病和/或征状:病毒感染后组织损伤;器官的炎症损伤;多器官功能衰竭。
优选的,所述器官选自:肝脏、肺脏、脾脏、肾、肠道。
本领域的技术人员可对前述的技术方案和技术特征进行任意组合而不脱离本发明的发明构思和保护范围。本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
本发明优点在于:
1、本发明揭示了setd2、其编码序列、促进剂的新功能,即促进ifnα的抗病毒效应;
2、基于上述新功能,本发明的setd2、其编码序列或其促进剂可进一步用于预防或治疗病毒感染,例如直接抑制病毒在细胞内的拷贝数、保护病毒感染所引起的肝损伤;
3、本发明提供了一种可有效抑制病毒感染、提高感染个体的生存率的新型药物,可用于预防和抑制病毒感染,提高干扰素抗病毒感染的疗效,具有广泛的应用前景。
附图说明
图1:针对setd2的干扰rna转染hepg2细胞导致hbv感染增加。图为荧光定量检测hbv-dna拷贝数(*,p<0.05)。
图2:针对setd2的干扰rna转染hepg2细胞导致hbsag分泌增加。图为elisa分析(*,p<0.05)。
图3:setd2表达载体抑制hbsag分泌。图为elisa分析(*,p<0.05)。
图4:setd2-f2表达载体抑制hbv感染小鼠肝脏。图为免疫荧光结果。
图5:setd2-f2表达载体降低小鼠病毒感染后的肝脏损伤。图为elisa分析(*,p<0.05)。
具体实施方式
本发明通过大量的研究和动物模型试验,发现setd2在感染性疾病中,能有效抑制病毒感染、改善器官功能状态、提高患者的生存率。在此基础上完成了本发明。
具体而言,针对抗病毒相关基因进行应用研究是天然免疫分子生物学和细胞生物学研究的热点,将抗病毒基因的核苷酸和蛋白质应用于病毒感染的预防和治疗是人工干预感染的有效技术,因此无论是在功能基因组研究,还是病毒感染相关的基因治疗方面均具有广阔地应用前景。
本发明针对具有抗病毒作用的新型免疫调节分子setd2,对其在抗病毒感染方面的功能和作用进行了研究,并且验证了应用该分子对病毒感染动物的治疗和保护作用。实验证明:1)干扰setd2表达可以增加病毒的感染;2)过表达setd2可以抑制病毒感染;3)setd2过表达可以抑制小鼠肝脏中hbv的感染;4)setd2过表达可以降低病毒感染引起的肝脏损伤,提高生存率。这些实验结果提示setd2具备治疗病毒感染性(如hbv的感染等)疾病的应用前景。由此,本发明提供了将抗病毒分子setd2应用于抑制病毒感染,或用于病毒感染性疾病的预防和治疗中的方法和策略,特别是用于控制病毒感染所导致的肝脏损伤。
本文中提供的所有数值范围旨在清楚地包括落在范围端点之间的所有数值及它们之间的数值范围。可对本发明提到的特征或实施例提到的特征进行组合。本说明书所揭示的所有特征可与任何组合物形式并用,说明书中所揭示的各个特征,可以任何可提供相同、均等或相似目的的替代性特征取代。因此除有特别说明,所揭示的特征仅为均等或相似特征的一般性例子。
如本文所用,“含有”、“具有”或“包括”包括了“包含”、“主要由……构成”、“基本上由……构成”、和“由……构成”;“主要由……构成”、“基本上由……构成”和“由……构成”属于“含有”、“具有”或“包括”的下位概念。
setd2蛋白(多肽)
如本文所用,术语“setd2(多肽)”、“setd2蛋白(多肽)”、“setd2”可互换使用,是指一类含有set结构域的setd2蛋白,其是在结构上高度保守的组蛋白h3k36me3甲基转移酶。本发明的setd2蛋白可为由seqidno:1的序列(人cdna全长序列)或seqidno:1的第2889-5267位序列(人cds序列)或seqidno:3(小鼠全长序列)或seqidno:3的第2861-5218位序列(小鼠cds序列)所编码的蛋白质或这些蛋白质具有抗炎作用的同源序列(例如可通过本领域已知的数据库或比对软件获得setd2的同源序列)、变异体或修饰形式。例如,所述setd2蛋白可选自:(a)seqidno:2或seqidno:4所示的氨基酸序列;或(b)在(a)限定的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有抑制炎症因子的活性的由(a)衍生的蛋白质或多肽。
本发明的蛋白质或多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等动物、昆虫和哺乳动物细胞)中产生。本发明中setd2蛋白或多肽优选由人setd2基因或其同源基因或家族基因编码。
本发明蛋白质或多肽的变异形式包括(但并不限于):一个或多个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个,例如1、2、3、4、5、6、7、8、9或10个)氨基酸的缺失、插入和/或取代,以及在c末端和/或n末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质或多肽的功能。又比如,在c末端和/或n末端添加一个或数个氨基酸通常也不会改变蛋白质或多肽的功能,例如本发明的setd2蛋白质或多肽可包括或不包括起始的甲硫氨酸残基而仍然具有抑制病毒感染的活性。
可采用辐射或暴露于诱变剂下来产生随机诱变,也可通过定点诱变法或其它已知的分子生物学技术来获得上述(b)中的蛋白质或多肽。可利用编码所述蛋白质或多肽的编码序列来构建转基因动物,并观察该转基因动物对病毒感染是否具有抵抗作用或对病毒的抵抗性是否有所改良来筛选和鉴别所得蛋白质或多肽。
根据重组生产方案所用的宿主,本发明的蛋白质或多肽可以是糖基化的,或可以是非糖基化的。该术语还包括setd2蛋白的活性片段和活性衍生物。
该多肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧度条件下能与setd2蛋白编码序列杂交的序列所编码的蛋白、以及利用抗setd2蛋白的抗血清获得的多肽或蛋白。本发明还可使用其它多肽,如包含setd2蛋白或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括了setd2蛋白的可溶性片段。通常,该片段具有setd2蛋白序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
setd2编码序列
如本文所用,术语“setd2基因”、“setd2编码基因”、“setd2蛋白编码基因”或“setd2蛋白编码序列”可互换使用,均是指一种编码本发明所述的setd2蛋白或多肽的序列,其可为seqidno:1(人全长)或seqidno:1的第2889-5267位(人cds)序列、seqidno:3(小鼠全长)或seqidno:3的第2861-5218位(小鼠cds)序列所示的核苷酸序列、在严格条件下与这些序列杂交的分子、或与上述分子高度同源的家族基因分子,所述基因的表达对炎症因子的产生和影响具有一定的抑制作用。本发明的setd2基因可选自:(i)seqidno:1或seqidno:1的第2889-5267位序列、seqidno:3或seqidno:3的第2861-5218位序列所示的核苷酸序列;或(ii)在严格条件下与(i)限定的序列杂交且具有抑制炎症因子活性的分子。
如本文所用,术语“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×ssc,0.1%sds,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在50%,优选55%以上、60%以上、65%以上、70%以上、75%以上、80%以上、85%以上或90%以上,更优选是95%以上时才发生杂交。例如,所述序列可为(a)中所限定序列的互补序列。
本发明的setd2基因核苷酸全长序列或其片段通常可以用pcr扩增法、重组法或人工合成的方法获得。对于pcr扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cdna库或按本领域技术人员已知的常规方法所制备的cdna库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次pcr扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
应理解,本发明的setd2基因优选获自人,获自其它动物的与人setd2基因高度同源(如具有50%以上,优选55%以上、60%以上、65%以上、70%以上、75%以上、80%以上,更优选85%以上如85%、90%、95%、98%甚至99%或以上的序列相同性)的其它基因也在本发明优选考虑的等同范围之内。比对序列相同性的方法和工具也是本领域周知的,如blast。
setd2或setd2编码序列的促进剂
本发明中还涉及setd2或setd2编码序列的“促进剂”。术语“促进剂”或“setd2或其编码序列的促进剂”可互换使用,是指可提高setd2或其编码序列的水平或活性的物质。可用于本发明中的促进剂包括但不限于:setd2表达载体、外源性setd2、setd2或其编码序列的裸dna、setd2或其编码序列的脂质体包裹dna、setd2蛋白。
本发明的setd2或setd2编码序列或其促进剂可抑制病毒感染,从而可进一步用于预防或治疗与病毒感染相关的疾病、和/或病毒感染引发的相关征状,以及感染导致的慢性炎症性疾病、和/或其征状。
载体、宿主及转基因动物
本发明还涉及包含setd2基因的载体,以及用该载体经基因工程产生的宿主细胞,以及通过转基因获得高表达setd2的转基因动物。
通过常规的重组dna技术(science,1984;224:1431),可利用本发明的编码序列可用来表达或生产重组的setd2蛋白。一般来说有以下步骤:
(1)用本发明的编码setd2蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2)在合适的培养基中培养的宿主细胞;
(3)从培养基或细胞中分离、纯化蛋白质或多肽。
本发明中,术语“载体”与“重组表达载体”可互换使用,指本领域熟知的细菌质粒、噬菌体、酵母质粒、动物细胞病毒、哺乳动物细胞病毒或其它载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含setd2编码序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组dna技术、dna合成技术、体内重组技术等。所述的dna序列可有效连接到表达载体中的适当启动子上,以指导mrna合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。本发明中优选使用pcdna3.1载体表达系统。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(gfp),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当dna序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质或多肽。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如动物细胞。代表性例子有:大肠杆菌,链霉菌属、农杆菌;真菌细胞如酵母;动物细胞等。在本发明中,优选采用大肠杆菌细菌细胞、人的肝脏细胞作为宿主细胞。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是dna的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
本发明中术语“转基因动物”、或“转化动物”可互换使用,均指通过常规转基因的方法获得的转入本发明setd2基因并稳定高表达setd2蛋白或多肽的细胞、器官、组织或个体。
在上面的方法中的重组多肽可在细胞内或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析和其它各种液相层析技术及这些方法的结合。
药物、药物组合物或试剂盒
本发明还提供了一种药物、药物组合物或试剂盒,其中含有有效量的本发明的setd2或setd2编码序列、其促进剂,以及药学上或免疫学上可接受的载体。如本文所用,术语“活性物质”或“本发明的活性物质”可互换使用,是指setd2或setd2编码序列、其促进剂。
在较佳的实施方案中,所述药物组合物可用于预防或治疗与病毒感染相关的疾病、病毒感染导致的慢性炎症性疾病、和/或其征状;例如,本发明的药物组合物可用于预防或治疗与现有技术中已知可治疗或预防病毒感染性疾病,例如病毒感染引起的组织损伤;器官的炎性损伤;多器官功能衰竭。
如本文所用,术语“含有”或“包括”包括了“包含”、“基本上由……构成”、和“由……构成”。如本文所用,术语“药学上可接受的”成分是适用于人和/或动物而无过度不良反应(如毒性、刺激和变态反应)的,即有合理的效益/风险比的物质。如本文所用,术语“有效量”是指可对人和/或动物产生功能或活性的且可被人和/或动物所接受的量。
如本文所用,术语“药学上可接受的载体”指用于治疗剂给药的载体,包括各种赋形剂和稀释剂。该术语指这样一些药剂载体:它们本身并不是必要的活性成分,且施用后没有过分的毒性。合适的载体是本领域普通技术人员所熟知的,在《雷明顿药物科学》(remington’spharmaceuticalsciences,mackpub.co.,n.j.1991)中可找到关于药学上可接受的赋形剂的充分讨论。
在组合物中药学上可接受的载体可含有液体,如水、盐水、甘油和乙醇。另外,这些载体中还可能存在辅助性的物质,如填充剂、崩解剂、润滑剂、助流剂、泡腾剂、润湿剂或乳化剂、矫味剂、ph缓冲物质等。通常,可将这些物质配制于无毒的、惰性的和药学上可接受的水性载体介质中,其中ph通常约为5-8,较佳地,ph约为6-8。
本发明的组合物中的活性物质占组合物总重量的0.001~99.9wt%;优选为组合物总重量的1~95wt%,较优选为5~90wt%,更优选10~80wt%。余量为药学上可接受的载体以及其它添加剂等物质。
如本文所用,术语“单位剂型”是指为了服用方便,将本发明的组合物制备成单次服用所需的剂型,包括但不限于各种固体剂(如片剂)、液体剂、胶囊剂、缓释剂。
在本发明的另一优选实施方式中,所述组合物为单位剂型或多剂型,且其中活性物质的含量为0.01~2000mg/剂,优选0.1~1500mg/剂,更优选1~1000mg/剂。在本发明的另一个优选例中,每天施用1~6剂本发明的组合物,优选施用1~3剂;最优选的,每天服用的剂量为1剂。
应理解,所用setd2蛋白或其编码序列等活性物质的有效剂量可随待施用或治疗的对象的严重程度而变化。具体情况根据对象的个体情况(例如对象体重、年龄、身体状况、所需达到的效果)来决定,这在熟练医师可以判断的范围内。
本发明的组合物,可以为固态(如颗粒剂、片剂、冻干粉、栓剂、胶囊、舌下含片)或液态(如口服液)或其它合适的形状。给药途径可采用:(1)直接裸dna或者蛋白质注射法;(2)将setd2的cdna、mrna和蛋白质与转铁蛋白/多聚l-赖氨酸复合物连接,以增强其生物效应;(3)cdna、mrna和蛋白质与带正电荷的脂类形成复合物,以克服磷酸骨架负电荷所致的穿越细胞膜的困难;(4)用脂质体包裹cdna、mrna和蛋白质后介导进入细胞,既有利于大分子的顺利进入又免受细胞外各种酶的水解作用;(5)cdna、mrna和蛋白质与胆固醇结合使其胞浆保持时间增加10倍;(6)用免疫脂质体转运cdna、mrna和蛋白质可使其特异性转运至靶组织和靶细胞;(7)将cdna、mrna和蛋白质体外转染给转载细胞(如成纤维细胞)也可较好地将setd2相关药物载入靶细胞内;(8)电打孔(electroporation),即借助于电流将cdna、mrna和蛋白质导入靶细胞。
此外,本发明的组合物中还可含有用于改善和治疗病毒感染性疾病的其它活性物质,所述的其它活性物质选自下组:临床常用抗生素,包括β-内酰胺类(青霉素类和头孢菌素类)、氨基糖甙类、四环素类、氯霉素类、大环内脂类、抗真菌抗生素、抗结核类抗生素中的一种或多种。
本发明的setd2相关的核苷酸和蛋白质药物相互间可以联合应用,还可以与其它药物和治疗手段联合,用于细菌性感染疾病的预防和治疗。
实施例
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。本领域技术人员可对本发明做出适当的修改、变动,这些修改和变动都在本发明的范围之内。
下列实施例中未注明具体条件的实验方法,可采用本领域中的常规方法,例如参考《分子克隆实验指南》(第三版,纽约,冷泉港实验室出版社,newyork:coldspringharborlaboratorypress,1989)或按照供应商所建议的条件。dna的测序方法为本领域常规的方法,也可由商业公司提供测试。
除非另外说明,否则百分比和份数按重量计算。除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明方法中。文中所述的较佳实施方法与材料仅作示范之用。
实施例1:干扰setd2表达对hbv在细胞中的复制具有促进作用
hepg2细胞(购自atcc)用dmem培养基培养,细胞用基于phbv1.3的框架的hbv表达质粒转染,模拟细胞感染hbv的环境。接着用针对setd2的小干扰rna(si-setd2)及模拟物对照(si-模拟物)转染细胞(转染试剂interferin购自polyplus公司)。
针对setd2的干扰rna(si-setd2)及模拟物对照(si-模拟物)购自genephama公司,si-setd2的序列如seqidno:5和seqidno:6所示,si-模拟物的序列如seqidno:7和seqidno:8所示,合成时在3'增加2个dt使序列更加稳定。具体序列如下:
si-setd2序列:
5'-gguguaacuuaugcauuaatt-3'(顺义);
5'-uuaaugcauaaguuacacctt-3'(反义)。
si-模拟物序列:
5'-uucuccgaacgugucacgutt-3'(顺义);
5'-acgugacacguucggagaatt-3′(反义)。
转染24小时后的hepg2细胞(5×105个细胞/ml),用1000u/ml的ifnα(购自pestkabiomedicallaboratories公司)处理细胞12小时。收集贴壁的hepg2细胞,提取细胞的dna,检测hbv的复制情况;同时收取细胞培养上清,使用酶联免疫标记elisa试剂盒检测细胞培养上清中hbv病毒表面抗原hbsag的分泌情况。
hbv拷贝数分析的结果如图1所示,hbsag分泌情况如图2所示。
结果显示:针对setd2的小干扰rna转染hepg2细胞可显著促进hbv的复制,并且显著促进hbv分泌hbsag到细胞外。
该结果表明:干扰setd2表达导致hbv在细胞中的复制增加。
实施例2:过表达setd2对抑制细胞中hbsag分泌
首先将setd2(nm_014159.6)的cdna分成3段分别导入真核表达载体pcdna3.1质粒中,分别构建setd2-f1、setd2-f2、setd2-f3表达载体。
其中,setd2-f1包含的核苷酸序列为seqidno:1第54-2888位,编码人setd2蛋白seqidno:2第1-945位;
setd2-f2包含的核苷酸序列为seqidno:1第2889-5267位,编码人setd2蛋白seqidno:2第946-1738位,此截短体含有set结构域;
setd2-f3包含的核苷酸序列为seqidno:1第5268-7748位,编码人setd2蛋白seqidno:2第1739-2564位,此截短体含有ww结构域。
将setd2-f1、setd2-f2、setd2-f3分别以1ng/ml的密度转染hepg2细胞,并同时转染phbv1.3质粒。48小时后更换新鲜dmem培养基。
将hbv感染后的hepg2细胞,5×105个细胞/ml,用1000u/ml的ifnα处理细胞12小时,收集细胞培养上清,用elisa试剂盒细胞培养上清中hbv病毒表面抗原hbsag的分泌情况。
hbsag分泌情况如图3所示。
结果显示:setd2-f2转染细胞可抑制hbv分泌hbsag到细胞外。
该结果表明:过表达setd2-f2(含有set结构域)可以抑制hbv的hbsag的分泌。
实施例3:过表达setd2对抑制hbv在小鼠肝脏中的感染
构建setd2-f2表达载体(同实施例2)。将20ngsetd2-f2通过尾静脉高压注射入小鼠(8周雄性sdf级c57bl6小鼠,购自sipperbk公司),同时尾静脉高压注射10ngphbv1.3的质粒,模拟小鼠hbv感染。72小时后腹腔内注射ifnα(15mg/kg)。24小时后解剖,取小鼠肝脏组织,使用免疫荧光的方法检测小鼠肝脏上hbv核心抗原(hbcag)表达情况,以指示小鼠hbv感染的情况。
肝脏hbv感染小鼠检测结果如图4所示。
结果显示:setd2-f2在小鼠中过表达可以抑制hbv在小鼠肝脏中的感染。
该结果表明:过表达setd2可以抑制病毒在体内的感染。
实施例4:过表达setd2降低病毒感染引起的肝脏损伤
将20ngsetd2-f2通过尾静脉高压注射入小鼠,同时尾静脉高压注射10ngphbv1.3的质粒,模拟小鼠hbv感染(同实施例2)。72小时后腹腔内注射ifnα(15mg/kg)。24小时后眼球取血,收集小鼠血清,使用elisa试剂盒检测谷丙转氨酶活性和谷草转氨酶活性。
elisa结果如图5所示。
结果显示:setd2-f2表达载体降低小鼠血清中的谷丙转氨酶活性和谷草转氨酶活性。
该结果表明:过表达setd2可以降低病毒感染引起的肝脏损伤。
以上已对本发明创造的较佳实施例进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明创造精神的前提下还可做出种种的等同的变型或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。
sequencelisting
<110>中国人民解放军第二军医大学
<120>表观修饰酶setd2的抗病毒作用及其应用
<130>/
<160>8
<170>patentinversion3.3
<210>1
<211>8452
<212>dna
<213>智人(homosapiens)
<400>1
gcgtcgccctgctgcggggagggggctcgcgtcgccgtctccagccgctcccgatgaagc60
agctgcagccgcagccgcctccgaagatgggggatttctacgacccggagcacccgaccc120
ctgaagaagaagaaaatgaggcaaagattgaaaatgtgcagaaaacaggtttcatcaaag180
gaccaatgttcaaaggtgttgcttctagtcgatttttgcccaaaggcaccaaaacaaaag240
ttaatttggaagaacagggacgacagaaggtgtcattcagcttcagccttacaaagaaaa300
ctttgcagaataggtttctcactgcacttggcaatgaaaagcaaagtgatactccaaacc360
ctccagctgtacctcttcaggtagactcgactcctaaaatgaaaatggaaattggtgata420
ccttatctactgcagaagaatcttccccaccaaagtcaagggtggaattgggcaaaattc480
attttaagaaacatctgcttcatgtaacatccaggccactgctggctactaccacagcag540
tagcatctccacctactcatgcagcaccattaccagcagtgatagcagaatcaacaactg600
tagactcaccgccctcatctccgcctccaccgcctccacctgcccaagccacaacactct660
catcaccagcaccagtaacagagccagtggccttgccacatacaccaataacagttctaa720
tggcagcaccagtacccttaccagtagatgtagcagttagatctctgaaagaaccaccaa780
ttataattgtaccagaatctttagaagcagatactaagcaggacactatatctaatagtt840
tagaagaacacgtaactcaaatattgaatgagcaagcagatatttcctcaaaaaaagaag900
attcccatattgggaaggatgaagaaattccagatagttctaagattagtctgagctgta960
aaaaaacaggttctaagaagaaatcctcacaatctgaaggcatctttcttggttcagaat1020
ctgatgaagattctgtacggacttcttcaagtcaaagatcacatgatttaaaattttcag1080
caagcattgaaaaggaaagagattttaaaaagagctcagcacctttaaaaagtgaggatc1140
tagggaaaccttcacgatctaaaacagacagagatgataaatattttagctattcaaaac1200
ttgaaagagatactcggtatgtatcttcccgatgtagatcagaaagagagcgacggcgga1260
gcagatctcactctaggtctgagagaggctctagaactaatttatcctattccaggtcag1320
aacgatctcattattatgactctgatcgtcgctaccataggagctccccttatcgagaga1380
ggacgcgctattctcggccatacacagataacagagcacgagagagttctgactcagaag1440
aagagtataagaagacatactcaaggcgtacctcatctcattcctcttcttacagagacc1500
taaggacatcatcctattctaaatctgatcgggactgtaaaactgagacctcttacttag1560
agatggaaagaagaggcaagtattcttcaaaactagaaagagaatctaaaaggacttcag1620
aaaatgaagcaattaaaagatgttgttctccccctaatgaactgggattccgacgagggt1680
catcatattctaagcatgacagtagtgcttcccgttataaatctaccctttcaaaaccta1740
tacccaagtctgataaatttaaaaattctttctgttgtacagaattaaatgaagaaatca1800
aacagtctcattcttttagtttacagacaccttgttcaaaaggtagtgaattaagaatga1860
ttaataaaaatcctgaaagagaaaaggctgggtctccagctccatcaaatcgattaaatg1920
attcacctactttaaaaaagctagatgaattgcctatttttaagtccgaatttataacac1980
atgatagccatgatagtattaaggaattagactctttatctaaagtgaagaatgatcaat2040
taagaagtttttgtcccatagaattaaatataaatggatctcctggggcagaatctgatt2100
tggcaacattttgcacttctaaaactgatgctgttttaatgacttctgatgatagtgtga2160
ctggatcggaattatcccctttggtcaaagcatgcatgctttcatcaaatggatttcaga2220
atattagtaggtgcaaagaaaaagacttggatgatacctgcatgctgcataagaagtcag2280
aaagcccatttagagaaacagaacctctggtgtcaccacaccaagataaactcatgtcta2340
tgccagttatgactgtggattattccaaaacagtagttaaagaaccagttgatacgaggg2400
tttcttgctgcaaaaccaaagattcagacatatactgtactttgaacgatagcaaccctt2460
ctttgtgtaactctgaagctgaaaatattgagccttcagttatgaagatttcttcaaata2520
gctttatgaatgtgcatttggaatcaaaaccagttatatgtgatagtagaaatttgacag2580
atcactcaaaatttgcatgtgaagaatataagcagagcatcggtagcactagttcagctt2640
ctgttaatcattttgatgatttatatcaacctattgggagttcaggtattgcttcatctc2700
ttcagagtcttccaccaggaataaaggtggacagtctaactctcttgaaatgcggagaga2760
acacatctccagttctggatgcagtgctaaagagtaaaaaaagttcagagtttttaaagc2820
atgcagggaaagaaacaatagtagaagtaggtagtgaccttcctgattcaggaaagggat2880
ttgcttccagggagaacaggcgtaataatgggttatctgggaaatgtttgcaagaggctc2940
aagaagaagggaattccatattgcctgaaagaagaggaagaccagaaatctctttagatg3000
aaagaggagaaggaggacatgtgcatacttctgatgactcagaagttgtattttcttctt3060
gtgatttgaatttaaccatggaagacagtgatggtgtaacttatgcattaaagtgtgaca3120
gtagtggtcatgccccagaaattgtgtctacagttcatgaagattattctggctcttctg3180
aaagttcaaatgatgaaagtgattcagaagatacagattcggatgatagcagtattccaa3240
gaaaccgtctccagtctgttgtggttgtgccaaagaattctactttgcccatggaagaaa3300
caagtccttgttcttctcggagcagtcaaagttatagacactattctgaccattgggaag3360
atgagagattggagtcaaggagacatttgtatgaggaaaaatttgaaagtatagcaagta3420
aagcctgtcctcaaactgataagtttttccttcataaaggaacagagaagaatccggaaa3480
tttcttttacacagtccagtagaaaacaaatagataatcgcctgcctgaactttctcatc3540
ctcagagtgatggggttgatagtacaagtcatacagatgtgaaatctgaccctctgggtc3600
acccaaattcagaggaaaccgtgaaagccaaaataccttctaggcagcaagaagagctgc3660
caatttattcttctgattttgaagatgtcccaaataagtcttggcaacagaccactttcc3720
aaaacaggccagatagtagactgggaaaaacagaattgagtttttcttcctcttgtgaga3780
taccacatgtggatggcttgcactcatcagaagagctcagaaacttaggttgggacttct3840
ctcaagaaaagccttctaccacgtatcagcaacctgacagtagctatggagcttgtggtg3900
gacacaagtatcagcaaaatgcagaacagtatggtgggacacgtgattactggcaaggca3960
atggttactgggatccaagatcaggtagacctcctggaactggggttgtgtatgatcgaa4020
ctcaaggacaagtaccagattccctaacagatgatcgtgaagaagaggagaattgggatc4080
aacaggatggatcccatttttcagaccagtccgataaatttcttctatcccttcagaaag4140
acaaggggtcagtgcaagcacctgaaataagcagcaattccattaaggacactttagctg4200
tgaatgaaaagaaagatttttcaaaaaacttagaaaaaaatgatatcaaagatagagggc4260
ctcttaaaaaaaggaggcaggaaatagagagtgattctgaaagtgatggtgagcttcagg4320
acagaaagaaagttagagtggaggtagagcagggagagacatcagtgcccccaggttcag4380
cactggttgggccctcctgtgtcatggatgacttcagggacccacagcgatggaaggaat4440
gtgccaagcaagggaaaatgccatgttactttgatcttattgaagaaaatgtttatttaa4500
cagaaagaaagaagaataaatctcatcgagatattaagcgaatgcagtgtgagtgtacac4560
ctctttctaaagatgaaagagctcaaggtgaaatagcatgtggggaagattgtcttaatc4620
gtcttctcatgattgaatgttcttctcggtgtccaaatggggattattgttccaatagac4680
ggtttcagagaaaacagcatgcagatgtggaagtcatactcacagaaaagaaaggctggg4740
gcttgagagctgccaaagaccttccttcgaacacctttgtcctagaatattgtggagagg4800
tactcgatcataaagagtttaaagctcgagtgaaggagtatgcacgaaacaaaaacatcc4860
attactatttcatggccctgaagaatgatgagataatagatgccactcaaaaaggaaatt4920
gctctcgtttcatgaatcacagctgtgaaccaaattgtgaaacccaaaaatggactgtga4980
acggacaactgagggttgggttttttaccaccaaactggttccttcaggctcagagttaa5040
cgtttgactatcagttccagagatatggaaaagaagcccagaaatgtttctgcggatcag5100
ccaattgccggggttacctgggaggagaaaacagagtcagcatcagagcagcaggaggga5160
aaatgaagaaggaacgatctcgtaagaaggattcagtggatggagagctagaagctctga5220
tggaaaatggtgagggtctctctgataaaaaccaggtgctcagcttatcccggctaatgg5280
ttagaattgaaactttggagcagaaacttacctgtctggaactcatacagaacacacact5340
cacagtcctgcctgaagtcctttctggaacgtcatgggctgtctttgttgtggatctgga5400
tggcagagctaggtgacggccgggaaagtaaccagaagcttcaggaagagattataaaga5460
ctttggaacacttgcccattcctactaaaaatatgttggaggaaagcaaagtacttccaa5520
ttattcaacgctggtctcagactaagactgctgtccctccgttgagtgaaggagatgggt5580
attctagtgagaatacatcgcgtgctcatacaccactcaacacacctgatccttccacca5640
agctgagcacagaagctgacacagacactcccaagaaactaatgtttcgcagactgaaaa5700
ttataagtgaaaatagcatggacagtgcaatctctgatgcaaccagtgagctagaaggca5760
aggatggcaaagaggatcttgatcaattagaaaatgtccctgtagaggaagaggaagaat5820
tgcagtcacaacagctactcccacaacagctgcctgaatgcaaagttgatagtgaaacca5880
acatagaagctagtaagctacctacatctgaaccagaagctgacgctgaaatagagccca5940
aagagagcaacggcacaaaactagaagaacctattaatgaagaaacaccatcccaagatg6000
aagaggagggtgtgtctgatgtggagagtgaaaggagccaagaacagccagataaaacag6060
tggatataagtgatttggccaccaaactcctggacagttggaaagacctaaaggaggtat6120
atcgaattccaaagaaaagtcaaactgaaaaggaaaacacaacaactgaacgaggaaggg6180
atgctgttggcttcagagatcaaacacctgccccgaagactcctaataggtcaagagaga6240
gagacccagacaagcaaactcaaaataaagagaaaaggaaacgaagaagctccctctcac6300
caccctcttctgcctatgagcggggaacaaaaaggccagatgacagatatgatacaccaa6360
cttctaaaaagaaagtacgaattaaagaccgcaataaactttctacagaggaacgccgga6420
agttgtttgagcaagaggtggctcaacgggaggctcagaaacaacagcaacagatgcaga6480
acctgggaatgacatcaccactgccctatgactctcttggttataatgccccgcatcatc6540
cctttgctggttacccaccaggttatcccatgcaggcctatgtggatcccagcaacccta6600
atgctggaaaggtgctcctgcccacacccagcatggacccagtgtgttctcctgctcctt6660
atgatcatgctcagcccttggtgggacattctacagaacccctttctgcccctccaccag6720
taccagtggtgccacatgtggcagctcctgtggaagtttccagttcccagtatgtggccc6780
agagtgatggtgtagtacaccaagactccagcgttgctgtcttgccagtgccggcccccg6840
gcccagttcagggacagaattatagtgtttgggattcaaaccaacagtctgtcagtgtac6900
agcagcagtactctcctgcacagtctcaagcaaccatatattatcaaggacagacatgtc6960
caacagtctatggtgtgacatcaccttattcacagacaactccaccaattgtacagagtt7020
atgcccagccaagtcttcagtatatccaggggcaacagattttcacagctcatccacaag7080
gagtggtggtacagccagccgcagcagtgactacaatagttgcaccagggcagcctcagc7140
ccttgcagccatctgaaatggttgtgacaaataatctcttggatctgccgcccccctctc7200
ctcccaaaccaaaaaccattgtcttacctcccaactggaagacagctcgagatccagaag7260
ggaagatttattactaccatgtgatcacaaggcagactcagtgggatcctcctacttggg7320
aaagcccaggagatgatgccagccttgagcatgaagctgagatggacctgggaactccaa7380
catatgatgaaaaccccatgaaggcctcgaaaaagcccaagacagcagaagcagacacct7440
ccagtgaactagcaaagaaaagcaaagaagtattcagaaaagagatgtcccagttcatcg7500
tccagtgcctgaacccttaccggaaacctgactgcaaagtgggaagaattaccacaactg7560
aagactttaaacatctggctcgcaagctgactcacggtgttatgaataaggagctgaagt7620
actgtaagaatcctgaggacctggagtgcaatgagaatgtgaaacacaaaaccaaggagt7680
acattaagaagtacatgcagaagtttggggctgtttacaaacccaaagaggacactgaat7740
tagagtgactgttgggccagggtgggaggatgggtggtcaggtaagacagactctaggga7800
gaggaaatcctgtgggcctttctgtcccacccctgtcagcactgtgctactgatgataca7860
tcaccctggggaattcaaccctgcagatgtcaactgaaggccacaaaaatgaactccatc7920
tacaagtgattacctagttgtgagctgttggcatgtggttagaagccatcagaggtgcaa7980
gggcttagaaaagaccctggccagacctgactccactcttaaacctgggtcttctccttg8040
gcggtgctgtcagcgcacagacccatgcgcatccccacccacaaccctttaccctgatga8100
tctgtattatattttaatgtatatgtgaatatattgaaaataatttgttttttcctggtt8160
tttgtttggttttcgttttgcttttagcctctacatgctaggatcacaggaagactttgt8220
aaggacagtttaagttctcctgcaaggtttaatttgttatcatgtaaatattccaaagca8280
ggctgccttgtggttttggccagccttgtgctatgttgataagattgatttactgcttaa8340
aatcactttactttatccaatttttactgaactttttatgtaaaaaaataaaatcaatta8400
aagaacttggcatgtgtgttccctaaaagttaaaaaaaaaaaaaaaaaaaaa8452
<210>2
<211>2564
<212>prt
<213>智人(homosapiens)
<400>2
metlysglnleuglnproglnproproprolysmetglyaspphetyr
151015
aspprogluhisprothrproglugluglugluasnglualalysile
202530
gluasnvalglnlysthrglypheilelysglyprometphelysgly
354045
valalaserserargpheleuprolysglythrlysthrlysvalasn
505560
leuglugluglnglyargglnlysvalserpheserpheserleuthr
65707580
lyslysthrleuglnasnargpheleuthralaleuglyasnglulys
859095
glnseraspthrproasnproproalavalproleuglnvalaspser
100105110
thrprolysmetlysmetgluileglyaspthrleuserthralaglu
115120125
gluserserproprolysserargvalgluleuglylysilehisphe
130135140
lyslyshisleuleuhisvalthrserargproleuleualathrthr
145150155160
thralavalalaserproprothrhisalaalaproleuproalaval
165170175
ilealagluserthrthrvalaspserproproserserpropropro
180185190
proproproproalaglnalathrthrleuserserproalaproval
195200205
thrgluprovalalaleuprohisthrproilethrvalleumetala
210215220
alaprovalproleuprovalaspvalalavalargserleulysglu
225230235240
proproileileilevalprogluserleuglualaaspthrlysgln
245250255
aspthrileserasnserleuglugluhisvalthrglnileleuasn
260265270
gluglnalaaspileserserlyslysgluaspserhisileglylys
275280285
aspglugluileproaspserserlysileserleusercyslyslys
290295300
thrglyserlyslyslysserserglnsergluglyilepheleugly
305310315320
sergluseraspgluaspservalargthrserserserglnargser
325330335
hisaspleulyspheseralaserileglulysgluargaspphelys
340345350
lysserseralaproleulyssergluaspleuglylysproserarg
355360365
serlysthraspargaspasplystyrphesertyrserlysleuglu
370375380
argaspthrargtyrvalserserargcysargsergluarggluarg
385390395400
argargserargserhisserargsergluargglyserargthrasn
405410415
leusertyrserargsergluargserhistyrtyraspserasparg
420425430
argtyrhisargserserprotyrarggluargthrargtyrserarg
435440445
protyrthraspasnargalaarggluserseraspserglugluglu
450455460
tyrlyslysthrtyrserargargthrserserhissersersertyr
465470475480
argaspleuargthrsersertyrserlysseraspargaspcyslys
485490495
thrgluthrsertyrleuglumetgluargargglylystyrserser
500505510
lysleugluarggluserlysargthrsergluasnglualailelys
515520525
argcyscysserproproasngluleuglypheargargglyserser
530535540
tyrserlyshisaspserseralaserargtyrlysserthrleuser
545550555560
lysproileprolysserasplysphelysasnserphecyscysthr
565570575
gluleuasnglugluilelysglnserhisserpheserleuglnthr
580585590
procysserlysglysergluleuargmetileasnlysasnproglu
595600605
argglulysalaglyserproalaproserasnargleuasnaspser
610615620
prothrleulyslysleuaspgluleuproilephelyssergluphe
625630635640
ilethrhisaspserhisaspserilelysgluleuaspserleuser
645650655
lysvallysasnaspglnleuargserphecysproilegluleuasn
660665670
ileasnglyserproglyalagluseraspleualathrphecysthr
675680685
serlysthraspalavalleumetthrseraspaspservalthrgly
690695700
sergluleuserproleuvallysalacysmetleuserserasngly
705710715720
pheglnasnileserargcyslysglulysaspleuaspaspthrcys
725730735
metleuhislyslyssergluserprophearggluthrgluproleu
740745750
valserprohisglnasplysleumetsermetprovalmetthrval
755760765
asptyrserlysthrvalvallysgluprovalaspthrargvalser
770775780
cyscyslysthrlysaspseraspiletyrcysthrleuasnaspser
785790795800
asnproserleucysasnserglualagluasnilegluproserval
805810815
metlysileserserasnserphemetasnvalhisleugluserlys
820825830
provalilecysaspserargasnleuthrasphisserlyspheala
835840845
cysgluglutyrlysglnserileglyserthrserseralaserval
850855860
asnhispheaspaspleutyrglnproileglyserserglyileala
865870875880
serserleuglnserleuproproglyilelysvalaspserleuthr
885890895
leuleulyscysglygluasnthrserprovalleuaspalavalleu
900905910
lysserlyslysserserglupheleulyshisalaglylysgluthr
915920925
ilevalgluvalglyseraspleuproaspserglylysglypheala
930935940
serarggluasnargargasnasnglyleuserglylyscysleugln
945950955960
glualaglnglugluglyasnserileleuprogluargargglyarg
965970975
progluileserleuaspgluargglygluglyglyhisvalhisthr
980985990
seraspaspsergluvalvalphesersercysaspleuasnleuthr
99510001005
metgluaspseraspglyvalthrtyralaleulyscysaspser
101010151020
serglyhisalaprogluilevalserthrvalhisgluasptyr
102510301035
serglysersergluserserasnaspgluseraspsergluasp
104010451050
thraspseraspaspserserileproargasnargleuglnser
105510601065
valvalvalvalprolysasnserthrleuprometglugluthr
107010751080
serprocysserserargserserglnsertyrarghistyrser
108510901095
asphistrpgluaspgluargleugluserargarghisleutyr
110011051110
gluglulysphegluserilealaserlysalacysproglnthr
111511201125
asplysphepheleuhislysglythrglulysasnprogluile
113011351140
serphethrglnserserarglysglnileaspasnargleupro
114511501155
gluleuserhisproglnseraspglyvalaspserthrserhis
116011651170
thraspvallysseraspproleuglyhisproasnsergluglu
117511801185
thrvallysalalysileproserargglnglnglugluleupro
119011951200
iletyrserseraspphegluaspvalproasnlyssertrpgln
120512101215
glnthrthrpheglnasnargproaspserargleuglylysthr
122012251230
gluleuserphesersersercysgluileprohisvalaspgly
123512401245
leuhisserserglugluleuargasnleuglytrpasppheser
125012551260
glnglulysproserthrthrtyrglnglnproaspsersertyr
126512701275
glyalacysglyglyhislystyrglnglnasnalagluglntyr
128012851290
glyglythrargasptyrtrpglnglyasnglytyrtrpasppro
129513001305
argserglyargproproglythrglyvalvaltyraspargthr
131013151320
glnglyglnvalproaspserleuthraspaspargglugluglu
132513301335
gluasntrpaspglnglnaspglyserhispheseraspglnser
134013451350
asplyspheleuleuserleuglnlysasplysglyservalgln
135513601365
alaprogluileserserasnserilelysaspthrleualaval
137013751380
asnglulyslysasppheserlysasnleuglulysasnaspile
138513901395
lysaspargglyproleulyslysargargglngluilegluser
140014051410
aspsergluseraspglygluleuglnasparglyslysvalarg
141514201425
valgluvalgluglnglygluthrservalproproglyserala
143014351440
leuvalglyprosercysvalmetaspasppheargaspprogln
144514501455
argtrplysglucysalalysglnglylysmetprocystyrphe
146014651470
aspleuileglugluasnvaltyrleuthrgluarglyslysasn
147514801485
lysserhisargaspilelysargmetglncysglucysthrpro
149014951500
leuserlysaspgluargalaglnglygluilealacysglyglu
150515101515
aspcysleuasnargleuleumetileglucysserserargcys
152015251530
proasnglyasptyrcysserasnargargpheglnarglysgln
153515401545
hisalaaspvalgluvalileleuthrglulyslysglytrpgly
155015551560
leuargalaalalysaspleuproserasnthrphevalleuglu
156515701575
tyrcysglygluvalleuasphislysgluphelysalaargval
158015851590
lysglutyralaargasnlysasnilehistyrtyrphemetala
159516001605
leulysasnaspgluileileaspalathrglnlysglyasncys
161016151620
serargphemetasnhissercysgluproasncysgluthrgln
162516301635
lystrpthrvalasnglyglnleuargvalglyphephethrthr
164016451650
lysleuvalproserglysergluleuthrpheasptyrglnphe
165516601665
glnargtyrglylysglualaglnlyscysphecysglyserala
167016751680
asncysargglytyrleuglyglygluasnargvalserilearg
168516901695
alaalaglyglylysmetlyslysgluargserarglyslysasp
170017051710
servalaspglygluleuglualaleumetgluasnglyglugly
171517201725
leuserasplysasnglnvalleuserleuserargleumetval
173017351740
argilegluthrleugluglnlysleuthrcysleugluleuile
174517501755
glnasnthrhisserglnsercysleulysserpheleugluarg
176017651770
hisglyleuserleuleutrpiletrpmetalagluleuglyasp
177517801785
glyarggluserasnglnlysleuglnglugluileilelysthr
179017951800
leugluhisleuproileprothrlysasnmetleuglugluser
180518101815
lysvalleuproileileglnargtrpserglnthrlysthrala
182018251830
valproproleusergluglyaspglytyrsersergluasnthr
183518401845
serargalahisthrproleuasnthrproaspproserthrlys
185018551860
leuserthrglualaaspthraspthrprolyslysleumetphe
186518701875
argargleulysileilesergluasnsermetaspseralaile
188018851890
seraspalathrsergluleugluglylysaspglylysgluasp
189519001905
leuaspglnleugluasnvalprovalgluglugluglugluleu
191019151920
glnserglnglnleuleuproglnglnleuproglucyslysval
192519301935
aspsergluthrasnileglualaserlysleuprothrserglu
194019451950
proglualaaspalagluilegluprolysgluserasnglythr
195519601965
lysleuglugluproileasnglugluthrproserglnaspglu
197019751980
glugluglyvalseraspvalglusergluargserglnglugln
198519901995
proasplysthrvalaspileseraspleualathrlysleuleu
200020052010
aspsertrplysaspleulysgluvaltyrargileprolyslys
201520202025
serglnthrglulysgluasnthrthrthrgluargglyargasp
203020352040
alavalglypheargaspglnthrproalaprolysthrproasn
204520502055
argserarggluargaspproasplysglnthrglnasnlysglu
206020652070
lysarglysargargserserleuserproproserseralatyr
207520802085
gluargglythrlysargproaspaspargtyraspthrprothr
209020952100
serlyslyslysvalargilelysaspargasnlysleuserthr
210521102115
glugluargarglysleuphegluglngluvalalaglnargglu
212021252130
alaglnlysglnglnglnglnmetglnasnleuglymetthrser
213521402145
proleuprotyraspserleuglytyrasnalaprohishispro
215021552160
phealaglytyrproproglytyrprometglnalatyrvalasp
216521702175
proserasnproasnalaglylysvalleuleuprothrproser
218021852190
metaspprovalcysserproalaprotyrasphisalaglnpro
219522002205
leuvalglyhisserthrgluproleuseralaproproproval
221022152220
provalvalprohisvalalaalaprovalgluvalserserser
222522302235
glntyrvalalaglnseraspglyvalvalhisglnaspserser
224022452250
valalavalleuprovalproalaproglyprovalglnglygln
225522602265
asntyrservaltrpaspserasnglnglnservalservalgln
227022752280
glnglntyrserproalaglnserglnalathriletyrtyrgln
228522902295
glyglnthrcysprothrvaltyrglyvalthrserprotyrser
230023052310
glnthrthrproproilevalglnsertyralaglnproserleu
231523202325
glntyrileglnglyglnglnilephethralahisproglngly
233023352340
valvalvalglnproalaalaalavalthrthrilevalalapro
234523502355
glyglnproglnproleuglnproserglumetvalvalthrasn
236023652370
asnleuleuaspleuproproproserproprolysprolysthr
237523802385
ilevalleuproproasntrplysthralaargaspproglugly
239023952400
lysiletyrtyrtyrhisvalilethrargglnthrglntrpasp
240524102415
proprothrtrpgluserproglyaspaspalaserleugluhis
242024252430
glualaglumetaspleuglythrprothrtyraspgluasnpro
243524402445
metlysalaserlyslysprolysthralaglualaaspthrser
245024552460
sergluleualalyslysserlysgluvalphearglysglumet
246524702475
serglnpheilevalglncysleuasnprotyrarglysproasp
248024852490
cyslysvalglyargilethrthrthrgluaspphelyshisleu
249525002505
alaarglysleuthrhisglyvalmetasnlysgluleulystyr
251025152520
cyslysasnprogluaspleuglucysasngluasnvallyshis
252525302535
lysthrlysglutyrilelyslystyrmetglnlyspheglyala
254025452550
valtyrlysprolysgluaspthrgluleuglu
25552560
<210>3
<211>8350
<212>dna
<213>小鼠(musmusculus)
<400>3
cggccgcctcccctccggtcccctcccccgcatcggcctgccgcggggagggggctagcg60
tcgccgcctccagccgctcctcatgaagccgctgccgtcgcagcagccgccaccgaagat120
gggggatttctacgatcccgagcacccgacccctgaagaagaagaaaatgaggcaaagat180
tgaaaatgtgcagaaaacaggtttcatcaaaggaccagtgttcaaaggtgttgcttcaag240
tcgatttttgcccaaaggcacgaagacaaaagttaatttggaggaacagggacggcaaaa300
ggtgtcattcagcttcagttttacaaagaaaactttacagaatagatttctcactgcgct360
tagcaatgaaaagcaaagtgattctccaaactccccagctccccctcttcaagtagactc420
aaaccctaaagttaaaatggacgctggagatacttttcctgctacagaagaatcttcgcc480
accaaaatcgagagtggaattgggcagaattcattttaagaaacatttgcttcatgtgac540
atctaggccacagctggctgcaagtacaacagcagcatctccccttcctcctacaacaca600
gttaccagcagtcttagcagagtcgatgatagactcaccaccttcatctccacccccacc660
tcctccacctccccaggcctcatcaccctcaccaccagcacagatatcagagccagtggc720
cttgccgcaacccccagcaacagcactaatgacatcaccaccaggacctttaccaggaga780
cgtagccgtgagagctcagaaagaatcaccagttaaaagtggacccgaagttttagaggt840
ggatacaaagcaagatattgtatctaatagtttggaagaacacacagttcaaactttgaa900
ggaacaagcagatcatctcctgcaaaaagaagattcccatattgggaaggaagaagaggt960
ttcagatggctctaagataagcctcagttctaaaaaagcaagttctaagaagaaatcttc1020
acaatttgaaggcacatttcttggttcagagtctgatgaagattctgtacggacttcttc1080
cagtcaaagatcacatgatttaaaatcttcaacaagcattgacaaggaaagagattttaa1140
gaagagctcagcaccttcaaaaagtgaggatttggggaaatcatcaagatcgaaaacaga1200
gagagatgatagatattgtagctactcaaaacttgaacgagatactcggtatgtatcttc1260
ccgatgtcggtccgaaagagatcgaaggcgaagccgatctcgttctagatctgacagagc1320
ctctagaactagtttgtcttattctcgctcagaaagatctcattattatgattctgaacg1380
gcgctaccataggagttccccttatcgtgagaggacacgctattctcggccatatactga1440
taacagggcacgggagagctcagactctgaagatgagtataagaagacatacccacggcg1500
tacctcagcccattcctacagagacctaaggacatcatcatcttactctaaatttgatcg1560
ggactgtaaaactgagacctcttacttagagatggagagaagaggaaagtatacttcaaa1620
actagaaagagaatccaaacggacttcagagcatgaaaccataaaaagatgttgttctcc1680
cccaaatgaactgggattccgacgggggtcatcatattccaagcatgataacagtacttc1740
ccgttataaatctgccctttcaaaatctatatccaagaatgataaatttaaaaattcttt1800
ctgttgtacagaattaaatgaggaaaacaaacaatctcattcgtttagtttgcagactcc1860
ttgttcaaaaggtagtgaattaagaacaattaataagatttctgaaagagaaaagactgg1920
gtctccaactccatcaaatcaattaaacgattcacctacttttaaaaagctagatgaatc1980
tcctgttcttaagcctgaatttataggacacgatggccgtgaaagtattaaagaattgga2040
gttatcaaaagtgaaaaatgatcaattaagaaatttttgttccattgaattaaatgtaaa2100
cggatctccagagacagaagctgatgtggcaacattttgtacttctaagacagatgctat2160
atcaatgacttctgatgatagtgtgactggatcagaggtatcccctttgatcaaggcttg2220
catgctttcatcaaatggatttcagaatgttggtagatgcagagaaagggactcagatga2280
tacttgtaggcagcataatacgtcaaaaagtccatttagggaaatggaacctttgttgtc2340
accacaccatgataaactcatgtctttgccagttaagactatagattatcccaaaacatt2400
aattaaagaaccagttgataagagacattcttgctgcaaaaccaaagattcagatatata2460
ctgttctccaaatgaaaaccctgaagctgagaacgctgaaccttcagctatgacgatttc2520
ttcacatagctttgtgaatgtgcatttggaatccaagacagttatatgtgataataggga2580
gccgacagaccggcactcagagaatacatgtgatgaatataagcagagcattggtagcac2640
tagttcagcttctcataaccattttgatggtttgtatgagcctatagggagttcaggtat2700
ttcatctctccagagtcctccgtcaggaataagatgtgaagaaaacacatctccaactct2760
agatgcagtggagagtaaaaaaggcatagattttttaaagtatgcacggaaagaaacaga2820
tgttggtagtgcccttcctgattcaggaaaaggattttcttgggaaaacaggcataataa2880
tgtgttatctgggcagtctttgcaagaggctcaagaagaagggaattccatattgcatga2940
gagaagaggaagaccagaaatccccttagatgaggaacaaagaggccatacacatatttc3000
tgatgattcagaagtggtatttccttatgatttgaacttgaccatggaagacagtgatgg3060
tataacctacaccttaaaatgtgatagtagtggaaatgctccagagattgtatctactgt3120
ccatgaagactattctggatcttctgcaagttcaagcgatgaaagtgattctgaagatac3180
agagtctgatgatagcagtattccaagaaaccgactccagtctgttgtggttgtgccaaa3240
gaattctactttgcccatggaagagacaagtccctgttcttctcggagcagtcagagcta3300
caaacattattctgaccgctgggaagatggattagagaccaggagacatgcatatgagga3360
agagtatgagagtaaaggctgttctcaaactgaaaaatacttccttcataaaggaacaga3420
gagaagtgcagaaagttgttattcacagtttggcaggaaagcagataatcacctgcctga3480
cattgctcatgctcagagtgacggggttgatagtacaagtcagacagactcgagatctga3540
ccatctaggtcacctgaatccagaggacacattaagagccaaaacatctaggccacaaga3600
gctaccagtttattctgacgattttgaagatctcccaaataagtctcggcagcagatgat3660
tttctctaatcggccagatagtagtagactaggaaaaacagagctgagtttttcttcctc3720
ttgtgacatttcccgaatggatggcttgcactcatcagaagagctcagaaacctagggtg3780
ggacttttcccaacaggaaaggcccaccaccacataccagcagcctgacagcagctatgg3840
aacctgtggtacacataagtatcaacaaagtactgaacactatggtgggacccataatta3900
ctggcaaggcaatggctattgggatccaagatcagcaggtagacctccaggaactgggct3960
tgcttatgatcgaatccaagggcaagtaccagattctctaacagacgatcgtgaagaaga4020
ggaacattgggatcaacgaagtggatcacatttttcaagcccgtccaataaatttttctt4080
ccatcagaaggacaagggatcagtgcaagcaccggaaataagcagcaattcaattaaaga4140
cgctttagttatgaacgaaaggaaagatttttcgaaaaactttgaaaaaaatgatataaa4200
agagagagggcctcctaaaaaacgaaggcaagagttggagagtgattctgaaagtgatgg4260
tgaactacaggctagaaagaaagttagagtggagatggagcagggagaatcatctgtgcc4320
ccagcactcagaactgatggggccttcgtgtgctatggatgacttcagggacccacagcg4380
gtggaaagaatttgccaagctggggaagatgccatgttactttgatcttattgaagaaaa4440
tgtttatttaacagaaaggaagaagaacaaatcccaccgggatattaagcgaatgcagtg4500
tgagtgtacacctctttctaaggatgaaagagctcaaggtgaagtagcatgtggagaaga4560
ttgccttaatcgtctcctcatgattgaatgttcctctcgatgtccaaatggagattactg4620
ttcaaacagacggtttcagagaaaacagcatgcagatgtagaagtcatacttacagaaaa4680
gaaaggctggggcttaagggctgctaaggatcttccttcgaacacctttgtcctggaata4740
ctgtggagaggtacttgatcataaagagtttaaagctcgggtgaaagaatatgcacggaa4800
caaaaacatccactactacttcatggccctgaaaaatgacgagataatagatgccactca4860
aaaagggaattgctctcgtttcatgaatcatagctgtgaaccaaactgtgaaacccagaa4920
atggactgtgaatggacagctgagggttggattttttaccaccaaactagttccttcagg4980
ctcagaattaacttttgactaccagttccaaagatatggcaaagaagctcagaagtgttt5040
ctgtgggtcagccaactgccggggctacttgggaggagaaaacagagtcagtatcagagc5100
tgcaggagggaagatgaaaaaggaacgctctcgaaagaaggattcagtggatggagaact5160
tgaagcactgatggaaaatggtgaaggcctctctgataagaaccaggttcttagtttatc5220
ccggctcatggttagaattgaaactttggaacagaaacttacctgtcttaagctcattca5280
gaacacacactcacagtcctgcctcaagtcatttctggaacgtcatgggttgtcactgtt5340
gtggatctggatggcagagcttggcgacggccgggaaagtaaccagaagcttcaggaaga5400
gattataaagactttggagcatttgcccattcctactaaaaatatgttggaagaaagcaa5460
agtacttccaattattcagcgctggtctcaaactaagactgctgttcctcagttaagtga5520
aggagacgggtattctagtgagaatacatcacgtgctcacacaccgcttaatacaccgga5580
cccttctgccaagccgagcacggaaatggatacagatactcccaagaaactcatattccg5640
cagactgaagattataagtgaaaatagcatggacagtgcagtctcggacgtcactagtga5700
gctagaatgcaaggatggcaaagaggaccttgatcagttagagactgtcactgtggaaga5760
ggatgaagagctgcagtcccagcagctcctcccacagcagctgtgcgagtccaaagttga5820
gagtgaagccactattgaagtcagtaagttacccacatctgaaccggaggcagacacgga5880
gacagagcccaaagacagcaatggcacaaaactagaagaaactattgctgaggaaacacc5940
atcccaagatgaagaagagggagtgtctgatgttgaaagtgagagaagccaggagccacc6000
agataaaacagtggatataagtgatttggctaccaagttactagacagttggaaagatct6060
aaaggaggtgtatcggattccaaagaaaagtcaaactgaaaaggagagcacagtagctga6120
acgaggaagagatgctgctgccttcagagatcaaacagctccaaagactcctaacaggtc6180
tagagagagagacccagacaagcagtctcaaaataaagagaaaaggaaacgacggggctc6240
tctgtcaccaccctcttctgcatatgagcggggaacaaaaaggccagatgacagatatga6300
tacaccaacttctaaaaagaaagtacgaattaaagaccgaaacaaactttctacagagga6360
gcgcaggaagttgtttgaacaagaggtggcacagagggaagctcagaagcaacagcaaca6420
gatgcagaacttggggatgacatcaccactcccctttgactctctgggatataatgcctc6480
tcatcacccctttgctgggtacccaccaggttaccccatgcaagcctatgtggatcccag6540
caaccctaatgctggaaaggtgcttctgcccacacctagcatggaccctgtgtgctcccc6600
tgctccttatgatcacgctcagcccttggtaggacattctacagaatcccttgctgctcc6660
cccatctgtgccagtggtgccgcatgtggcagcctctgtggaagtttccagttctcagta6720
tgtagctcagaatgaaagtgttgtacaccaagactccaatgttcctgtaatgccagtaca6780
agctccaggcccagtccaaggacagaattacaatgtctgggagtcaaaccaacagtctgt6840
cagtgtacaacagcagtattctcctgcacaatctcaaacaaccatatattatcaaggaca6900
gacatgttcaactgtctatagtgtgacctcgccttattcacagacaactcctccaattgt6960
gcagagttatgcccagccaagtcttcagtatatccagggacagcagattttcacagctca7020
cccacaaggagtggtggtacagccaactgcagccgtgacttcaatagttgcaccagggca7080
gcctcagtccttacagccacctgaaatggttgtaacaaataatctactggacctgccacc7140
accctcccctccaaaaccaaaaacgattgttttacctcccaactggaagacagcccgaga7200
ccctgaggggaagatctactactaccacgtgatcacaagacagactcagtgggatcctcc7260
tacttgggaaagcccaggagatgatgccagccttgagcatgaagctgaaatggacctggg7320
aaccccaacctatgatgaaaaccccatgaagacatcaaaaaagcccaagacagcagaagc7380
agacacctccagtgagctggcaaagaaaagcaaagaagtattcagaaaagagatgtctca7440
gttcattgtccagtgcctgaatccttaccggaaacctgactgcaaggtgggcaggatcac7500
caccactgaagatttcaagcacctcgcccgaaagctgactcatggagttatgaataagga7560
gctgaagtactgtaagaaccccgaggacctggagtgcaatgagaatgtgaaacacaaaac7620
caaggagtacatcaagaagtacatgcagaagtttggggctgtttacaaacctaaagagga7680
cactgaactagagtgacctcaggccagagtggagtatgagcggaaaggatgaatcctgtg7740
gcttctgccctaccccacggccaaggctgtgctactgatgtgatgacccaccatcctgag7800
cagttcaaacctgcaggtgtcagctgtaagctgcaaaagtgagctctgtctccaaatgac7860
ccctagttgtgagctgttggtgtaacagttacaggccatcagaggcagtagcctagggaa7920
gaccttggccacacgaccccattctcaaatctgggtctcccccttggcggtgctgtcagc7980
gcacagacccatgcgcacctcccccagatcctttaccctgacaatatgtattatatttta8040
atgtatatgtgaagatattgaaaataatttgtttttcctggtttttgttctgtttttgtt8100
tgctgttagcatctatgtgctggaatcaaggaaagactttgtgaggatagtataaattct8160
cctgcaaggttggatttgttatcatgtaaatatcccaacgcaggctgccttgtggtttgg8220
ccgccttgtgctatgttgataagattgatttactgcttcagatcactttactttatccaa8280
tttttactgaactttttatgtaaaaaataaaatcaattaaagaacttggaatgtgtgctc8340
cctcaaaatt8350
<210>4
<211>2537
<212>prt
<213>小鼠(musmusculus)
<400>4
metlysproleuproserglnglnproproprolysmetglyaspphe
151015
tyraspprogluhisprothrproglugluglugluasnglualalys
202530
ilegluasnvalglnlysthrglypheilelysglyprovalphelys
354045
glyvalalaserserargpheleuprolysglythrlysthrlysval
505560
asnleuglugluglnglyargglnlysvalserpheserpheserphe
65707580
thrlyslysthrleuglnasnargpheleuthralaleuserasnglu
859095
lysglnseraspserproasnserproalaproproleuglnvalasp
100105110
serasnprolysvallysmetaspalaglyaspthrpheproalathr
115120125
glugluserserproprolysserargvalgluleuglyargilehis
130135140
phelyslyshisleuleuhisvalthrserargproglnleualaala
145150155160
serthrthralaalaserproleuproprothrthrglnleuproala
165170175
valleualaglusermetileaspserproproserserpropropro
180185190
proproproproproglnalaserserproserproproalaglnile
195200205
sergluprovalalaleuproglnproproalathralaleumetthr
210215220
serproproglyproleuproglyaspvalalavalargalaglnlys
225230235240
gluserprovallysserglyprogluvalleugluvalaspthrlys
245250255
glnaspilevalserasnserleuglugluhisthrvalglnthrleu
260265270
lysgluglnalaasphisleuleuglnlysgluaspserhisilegly
275280285
lysgluglugluvalseraspglyserlysileserleuserserlys
290295300
lysalaserserlyslyslysserserglnphegluglythrpheleu
305310315320
glysergluseraspgluaspservalargthrserserserglnarg
325330335
serhisaspleulysserserthrserileasplysgluargaspphe
340345350
lyslysserseralaproserlyssergluaspleuglylysserser
355360365
argserlysthrgluargaspaspargtyrcyssertyrserlysleu
370375380
gluargaspthrargtyrvalserserargcysargsergluargasp
385390395400
argargargserargserargserargseraspargalaserargthr
405410415
serleusertyrserargsergluargserhistyrtyraspserglu
420425430
argargtyrhisargserserprotyrarggluargthrargtyrser
435440445
argprotyrthraspasnargalaarggluserseraspsergluasp
450455460
glutyrlyslysthrtyrproargargthrseralahissertyrarg
465470475480
aspleuargthrsersersertyrserlyspheaspargaspcyslys
485490495
thrgluthrsertyrleuglumetgluargargglylystyrthrser
500505510
lysleugluarggluserlysargthrsergluhisgluthrilelys
515520525
argcyscysserproproasngluleuglypheargargglyserser
530535540
tyrserlyshisaspasnserthrserargtyrlysseralaleuser
545550555560
lysserileserlysasnasplysphelysasnserphecyscysthr
565570575
gluleuasnglugluasnlysglnserhisserpheserleuglnthr
580585590
procysserlysglysergluleuargthrileasnlysileserglu
595600605
argglulysthrglyserprothrproserasnglnleuasnaspser
610615620
prothrphelyslysleuaspgluserprovalleulysprogluphe
625630635640
ileglyhisaspglyarggluserilelysgluleugluleuserlys
645650655
vallysasnaspglnleuargasnphecysserilegluleuasnval
660665670
asnglyserprogluthrglualaaspvalalathrphecysthrser
675680685
lysthraspalailesermetthrseraspaspservalthrglyser
690695700
gluvalserproleuilelysalacysmetleuserserasnglyphe
705710715720
glnasnvalglyargcysarggluargaspseraspaspthrcysarg
725730735
glnhisasnthrserlysserpropheargglumetgluproleuleu
740745750
serprohishisasplysleumetserleuprovallysthrileasp
755760765
tyrprolysthrleuilelysgluprovalasplysarghissercys
770775780
cyslysthrlysaspseraspiletyrcysserproasngluasnpro
785790795800
glualagluasnalagluproseralametthrileserserhisser
805810815
phevalasnvalhisleugluserlysthrvalilecysaspasnarg
820825830
gluprothrasparghissergluasnthrcysaspglutyrlysgln
835840845
serileglyserthrserseralaserhisasnhispheaspglyleu
850855860
tyrgluproileglyserserglyileserserleuglnserpropro
865870875880
serglyileargcysglugluasnthrserprothrleuaspalaval
885890895
gluserlyslysglyileasppheleulystyralaarglysgluthr
900905910
aspvalglyseralaleuproaspserglylysglyphesertrpglu
915920925
asnarghisasnasnvalleuserglyglnserleuglnglualagln
930935940
glugluglyasnserileleuhisgluargargglyargprogluile
945950955960
proleuaspglugluglnargglyhisthrhisileseraspaspser
965970975
gluvalvalpheprotyraspleuasnleuthrmetgluaspserasp
980985990
glyilethrtyrthrleulyscysaspserserglyasnalaproglu
99510001005
ilevalserthrvalhisgluasptyrserglyserseralaser
101010151020
serseraspgluseraspsergluaspthrgluseraspaspser
102510301035
serileproargasnargleuglnservalvalvalvalprolys
104010451050
asnserthrleuprometglugluthrserprocysserserarg
105510601065
serserglnsertyrlyshistyrseraspargtrpgluaspgly
107010751080
leugluthrargarghisalatyrglugluglutyrgluserlys
108510901095
glycysserglnthrglulystyrpheleuhislysglythrglu
110011051110
argseralaglusercystyrserglnpheglyarglysalaasp
111511201125
asnhisleuproaspilealahisalaglnseraspglyvalasp
113011351140
serthrserglnthraspserargserasphisleuglyhisleu
114511501155
asnprogluaspthrleuargalalysthrserargproglnglu
116011651170
leuprovaltyrseraspaspphegluaspleuproasnlysser
117511801185
argglnglnmetilepheserasnargproaspserserargleu
119011951200
glylysthrgluleuserphesersersercysaspileserarg
120512101215
metaspglyleuhisserserglugluleuargasnleuglytrp
122012251230
asppheserglnglngluargprothrthrthrtyrglnglnpro
123512401245
aspsersertyrglythrcysglythrhislystyrglnglnser
125012551260
thrgluhistyrglyglythrhisasntyrtrpglnglyasngly
126512701275
tyrtrpaspproargseralaglyargproproglythrglyleu
128012851290
alatyraspargileglnglyglnvalproaspserleuthrasp
129513001305
aspargglugluglugluhistrpaspglnargserglyserhis
131013151320
pheserserproserasnlysphephephehisglnlysasplys
132513301335
glyservalglnalaprogluileserserasnserilelysasp
134013451350
alaleuvalmetasngluarglysasppheserlysasnpheglu
135513601365
lysasnaspilelysgluargglyproprolyslysargarggln
137013751380
gluleugluseraspsergluseraspglygluleuglnalaarg
138513901395
lyslysvalargvalglumetgluglnglygluserservalpro
140014051410
glnhissergluleumetglyprosercysalametaspaspphe
141514201425
argaspproglnargtrplysgluphealalysleuglylysmet
143014351440
procystyrpheaspleuileglugluasnvaltyrleuthrglu
144514501455
arglyslysasnlysserhisargaspilelysargmetglncys
146014651470
glucysthrproleuserlysaspgluargalaglnglygluval
147514801485
alacysglygluaspcysleuasnargleuleumetileglucys
149014951500
serserargcysproasnglyasptyrcysserasnargargphe
150515101515
glnarglysglnhisalaaspvalgluvalileleuthrglulys
152015251530
lysglytrpglyleuargalaalalysaspleuproserasnthr
153515401545
phevalleuglutyrcysglygluvalleuasphislysgluphe
155015551560
lysalaargvallysglutyralaargasnlysasnilehistyr
156515701575
tyrphemetalaleulysasnaspgluileileaspalathrgln
158015851590
lysglyasncysserargphemetasnhissercysgluproasn
159516001605
cysgluthrglnlystrpthrvalasnglyglnleuargvalgly
161016151620
phephethrthrlysleuvalproserglysergluleuthrphe
162516301635
asptyrglnpheglnargtyrglylysglualaglnlyscysphe
164016451650
cysglyseralaasncysargglytyrleuglyglygluasnarg
165516601665
valserileargalaalaglyglylysmetlyslysgluargser
167016751680
arglyslysaspservalaspglygluleuglualaleumetglu
168516901695
asnglygluglyleuserasplysasnglnvalleuserleuser
170017051710
argleumetvalargilegluthrleugluglnlysleuthrcys
171517201725
leulysleuileglnasnthrhisserglnsercysleulysser
173017351740
pheleugluarghisglyleuserleuleutrpiletrpmetala
174517501755
gluleuglyaspglyarggluserasnglnlysleuglngluglu
176017651770
ileilelysthrleugluhisleuproileprothrlysasnmet
177517801785
leuglugluserlysvalleuproileileglnargtrpsergln
179017951800
thrlysthralavalproglnleusergluglyaspglytyrser
180518101815
sergluasnthrserargalahisthrproleuasnthrproasp
182018251830
proseralalysproserthrglumetaspthraspthrprolys
183518401845
lysleuilepheargargleulysileilesergluasnsermet
185018551860
aspseralavalseraspvalthrsergluleuglucyslysasp
186518701875
glylysgluaspleuaspglnleugluthrvalthrvalgluglu
188018851890
aspglugluleuglnserglnglnleuleuproglnglnleucys
189519001905
gluserlysvalgluserglualathrilegluvalserlysleu
191019151920
prothrsergluproglualaaspthrgluthrgluprolysasp
192519301935
serasnglythrlysleuglugluthrilealaglugluthrpro
194019451950
serglnaspgluglugluglyvalseraspvalglusergluarg
195519601965
serglngluproproasplysthrvalaspileseraspleuala
197019751980
thrlysleuleuaspsertrplysaspleulysgluvaltyrarg
198519901995
ileprolyslysserglnthrglulysgluserthrvalalaglu
200020052010
argglyargaspalaalaalapheargaspglnthralaprolys
201520202025
thrproasnargserarggluargaspproasplysglnsergln
203020352040
asnlysglulysarglysargargglyserleuserproproser
204520502055
seralatyrgluargglythrlysargproaspaspargtyrasp
206020652070
thrprothrserlyslyslysvalargilelysaspargasnlys
207520802085
leuserthrglugluargarglysleuphegluglngluvalala
209020952100
glnargglualaglnlysglnglnglnglnmetglnasnleugly
210521102115
metthrserproleupropheaspserleuglytyrasnalaser
212021252130
hishisprophealaglytyrproproglytyrprometglnala
213521402145
tyrvalaspproserasnproasnalaglylysvalleuleupro
215021552160
thrprosermetaspprovalcysserproalaprotyrasphis
216521702175
alaglnproleuvalglyhisserthrgluserleualaalapro
218021852190
proservalprovalvalprohisvalalaalaservalgluval
219522002205
serserserglntyrvalalaglnasngluservalvalhisgln
221022152220
aspserasnvalprovalmetprovalglnalaproglyproval
222522302235
glnglyglnasntyrasnvaltrpgluserasnglnglnserval
224022452250
servalglnglnglntyrserproalaglnserglnthrthrile
225522602265
tyrtyrglnglyglnthrcysserthrvaltyrservalthrser
227022752280
protyrserglnthrthrproproilevalglnsertyralagln
228522902295
proserleuglntyrileglnglyglnglnilephethralahis
230023052310
proglnglyvalvalvalglnprothralaalavalthrserile
231523202325
valalaproglyglnproglnserleuglnproproglumetval
233023352340
valthrasnasnleuleuaspleuproproproserproprolys
234523502355
prolysthrilevalleuproproasntrplysthralaargasp
236023652370
progluglylysiletyrtyrtyrhisvalilethrargglnthr
237523802385
glntrpaspproprothrtrpgluserproglyaspaspalaser
239023952400
leugluhisglualaglumetaspleuglythrprothrtyrasp
240524102415
gluasnprometlysthrserlyslysprolysthralagluala
242024252430
aspthrsersergluleualalyslysserlysgluvalphearg
243524402445
lysglumetserglnpheilevalglncysleuasnprotyrarg
245024552460
lysproaspcyslysvalglyargilethrthrthrgluaspphe
246524702475
lyshisleualaarglysleuthrhisglyvalmetasnlysglu
248024852490
leulystyrcyslysasnprogluaspleuglucysasngluasn
249525002505
vallyshislysthrlysglutyrilelyslystyrmetglnlys
251025152520
pheglyalavaltyrlysprolysgluaspthrgluleuglu
252525302535
<210>5
<211>19
<212>rna
<213>人工序列
<400>5
gguguaacuuaugcauuaa19
<210>6
<211>19
<212>rna
<213>人工序列
<400>6
uuaaugcauaaguuacacc19
<210>7
<211>19
<212>rna
<213>人工序列
<400>7
uucuccgaacgugucacgu19
<210>8
<211>19
<212>rna
<213>人工序列
<400>8
acgugacacguucggagaa19