遍在蛋白特异性蛋白酶的制作方法

文档序号：426547阅读：2340来源：国知局

专利名称：遍在蛋白特异性蛋白酶的制作方法
技术领域：
本发明涉及遍在蛋白特异性蛋白酶(USP)，尤其涉及脱遍在蛋白酶(DUB)家族的新成员。
背景技术：
遍在蛋白是在所有真核细胞中发现且其序列在原生动物至脊椎动物中极端保守的76个氨基酸残基的蛋白质。这种蛋白质在多种细胞过程如细胞蛋白质的依赖ATP的选择性降解、染色质结构维持、基因表达调节、应激反应和核糖体生物发生中发挥重要作用。与所述小的真核蛋白即遍在蛋白的缀合可以功能性地修饰或靶向蛋白质，用于通过蛋白酶体降解。类似于蛋白质磷酸化，蛋白质遍在蛋白化是动态的，涉及添加遍在蛋白的酶(遍在蛋白缀合酶)和去除遍在蛋白的酶。遍在蛋白修饰的去除或者脱遍在蛋白作用由名为遍在蛋白特异性蛋白酶(USP)或遍在蛋白羧基端水解酶(UCH)执行并且是调节这个途径的重要机制。这些酶能切割作为前体融合蛋白的一部分的遍在蛋白的连接肽键，释放游离遍在蛋白部分或者切割缀合遍在蛋白和蛋白质的键(翻译后)。
脱遍在蛋白酶是识别和水解位于遍在蛋白羧基端的甘氨酸肽键的半胱氨酸蛋白酶。存在两个不同脱遍在蛋白酶(DUBs)家族。第一个家族由大约25Kd的酶组成并且目前以人类中的UCHL1、UCHL3、Bap1和UCH37为代表。这类蛋白质属于肽酶分类中的C12家族。第二个家族由较大的(800至2000个残基)蛋白质组成，这些蛋白质之间有两个相似的区域，其中一个区域包含可能在催化机制中所涉及的保守半胱氨酸(半胱氨酸盒)并且另一个区域包含了两个保守的组氨酸残基，其中一个组氨酸残基也可能在催化机制中涉及(组氨酸盒)。这些蛋白质首先在酵母中描述其特征并且属于MEROPS的C19家族并且以USP为代表。
脱遍在蛋白酶在细胞中发挥多种作用，包括稳定与遍在蛋白缀合的某些底物、降解经Ub缀合(Ub)的另外一些底物和细胞内游离单体Ub库的循环。某些脱遍在蛋白酶自细胞的靶蛋白除去Ub并且因此阻止了蛋白酶体介导性降解(UBP2)。另一些脱遍在蛋白酶将Ub从蛋白酶体所产生的Ub-肽降解产物中除去并且因此促进了蛋白酶体介导性降解(Doa-4)最近对不同基因组测序探索的努力已经增加了显示出脱遍在蛋白酶家族的保守性特征的序列量。例如在酿酒酵母(S.cerevisiae)中，可以鉴定这种酵母已测序的完整基因组中的一个17DUB酶家族。也已经鉴定了高等真核生物来源的包含保守序列基序(半胱氨酸盒和组氨酸盒)的几种其它蛋白质。然而，这些新序列中的大多数代表了截短的成员并且因此将这些蛋白质真正划分为一种脱遍在蛋白家族成员是困难的。
发明概述本发明在第一个方面中提供了包含编码遍在蛋白特异性蛋白酶的核苷酸序列的经分离DNA，选自(a)SEQ ID No.2、SEQ ID No.6、SEQ.ID No.10(b)SEQ ID No.2、SEQ ID No.6、SEQ.ID No.10的片段(c)SEQ ID No.2、SEQ ID No.6、SEQ.ID No.10的衍生物(d)与SEQ ID No.2、SEQ ID No.6、SEQ.ID No.10基本同源的序列。
本发明的一个方面中，所述DNA选自SEQ ID No.2、SEQ ID No.6或SEQ.ID No.10。
本发明另一个方面中，所述片段是SEQ ID No.2、SEQ ID No.6或SEQ.ID No.10的片段并且保留了遍在蛋白特异的功能活性。所述片段可以至少是长50个的连续核苷酸，任选地为长至少75个或至少100个的连续核苷酸。
仍在本发明的另一个方面中，提供了SEQ ID No.2、SEQ ID No.6或SEQ.ID No.10的衍生物，其中在所述氨基酸序列中氨基酸残基的缺失、添加或替代产生了保留遍在蛋白特异的功能活性的功能等同的氨基酸序列。
在本发明的再一个方面中，提供了与选自SEQ.ID No.2、SEQ ID No.6或SEQ.ID No.10的核苷酸序列基本同源的并且保留遍在蛋白特异的功能活性的核苷酸序列。基本同源的序列与序列SEQ.ID No.2、SEQ ID No.6或SEQ.ID No.10之间的同源性百分率希望为至少80％，更希望为至少85％，优选地为至少90％，更优选地为至少95％，进一步更优选地为至少99％。
仍在本发明的另一个方面中，提供了在高度严格条件下与任一SEQ IDNo.2、SEQ ID No.6、SEQ.ID No.10或其片段、衍生物或基本同源序列的经分离DNA杂交的互补核酸序列。
在本发明的第二个方面中，提供了遍在蛋白特异性蛋白酶的经分离的多肽，所述多肽包含选自如下的氨基酸序列(a)SEQ.ID.No.1、SEQ.ID.No.5、SEQ.ID No.9(b)SEQ.ID.No.1、SEQ.ID.No.5、SEQ.ID No.9的片段(c)SEQ.ID.No.1、SEQ.ID.No.5、SEQ.ID No.9的衍生物(d)与SEQ.ID.No.1、SEQ.ID.No.5、SEQ.ID No.9基本同源的序列。
本发明一个优选的方面提供了具有如SEQ ID NO1所示氨基酸序列的经分离的多肽。较之非乳腺癌患者的乳腺组织，在乳腺癌患者的乳腺组织中极大量地存在所述多肽或其片段。根据本发明的这方面，提供了人类来源的新多肽以及这种新多肽在生物学上、诊断上、治疗上有用的片段、衍生物和同源物。
本发明的另一个优选方面提供了具有如SEQ ID NO5所示氨基酸序列的经分离的多肽。较之非白血病患者的外周血细胞，所述多肽或其片段在白血病患者的外周血细胞中，尤其淋巴样细胞中极大量地存在。根据本发明的这方面，提供了人类来源的新多肽以及这种新多肽在生物学上、诊断上、治疗上有用的片段、衍生物和同源物。
本发明的另一个优选方面提供了具有如SEQ ID NO9所示氨基酸序列的经分离的多肽。较之非脑功能紊乱患者的脑组织，在脑功能紊乱患者的脑组织，尤其杏仁核、脊髓和嗅球组织中极大量地存在所述多肽或其片段。根据本发明的这方面，提供了人类来源的新多肽以及这种新多肽在生物学上、诊断上、治疗上有用的片段、衍生物和同源物。
本发明的第三个方面涉及用于在人类中诊断的方法，这种方法需要测量来自人类的选自SEQ ID.No.1，SEQ ID.No.5或SEQ ID No.9的多肽、所述多肽的片段、衍生物或基本同源序列的量，如果与正常组织中所述多肽或其片段的量比较，所述多肽或其片段存在升高的量则对人类患有某种疾病具有诊断意义。
在一个优选的方面中，用于诊断人类乳腺癌的方法包括在人的乳腺组织中测量来自人类的根据SEQ ID.No.1的多肽、所述多肽的片段、衍生物或基本同源的序列的量，其中与正常组织中所述多肽的量比较，所述多肽存在升高的量则对人类患有乳腺癌具有诊断意义。
在另一个优选的方面中，用于诊断人类白血病的方法包括在人外周血细胞，尤其淋巴样细胞中测量来自人类的根据SEQ ID.No.5的多肽、所述多肽的片段、衍生物或基本同源的序列的量，其中与正常外周血细胞尤其淋巴样细胞中所述多肽的量比较，所述多肽存在升高的量则对人类患有白血病具有诊断意义。
在又一个优选的方面中，用于诊断人类脑功能紊乱的方法包括在人杏仁核、脊髓和嗅球组织中测量人类来源的根据SEQ ID.No.9的多肽、所述多肽的片段、衍生物或基本同源的序列的量，其中与正常杏仁核、脊髓和嗅球组织中所述多肽或其片段的量比较，所述多肽存在升高的量则对人类患有脑功能紊乱具有诊断意义。
本发明的另一个方面提供了用于产生前述的多肽、多肽片段、衍生物、同源物、变体和衍生物的片段以及它们的同系物的方法。在本发明这个方面的一个优选实施方案中，提供了用于产生前述人类多肽的方法，包括于足以在宿主中表达遍在蛋白特异性多肽的条件下培养已整合包含了外源性衍生的遍在蛋白特异性多核苷酸的表达载体的宿主细胞；以及回收所表达的多肽。
根据本发明的另一个方面，尤其为研究、生物学、临床和治疗目的提供了利用前述的多肽和多核苷酸的产物、组合物和方法。
在本发明的这个方面某些额外优选的实施方案中，提供了与包含如SEQ ID NO1、SEQ ID.No.5或SEQ ID.No.9所示氨基酸序列的多肽特异性结合的抗体或其片段。在某些尤其优选的实施方案中就此而言，所述抗体对人遍在蛋白特异性多肽或其部分高度选择。在进一步的方面中，提供了与如SEQ ID NO1、SEQ ID.No.5或SEQ ID.No.9所示氨基酸序列的片段结合的抗体或其片段。在一个相关的方面中，提供了包含这种抗体的药物组合物。
在另一个方面，提供了通过向受试者施用有效量的抗体而治疗受试者疾病的方法，其中所述抗体结合具有SEQ ID NO1、SEQ ID.No.5或SEQID.No.9所示氨基酸序列的多肽或者其片段或部分，其中所述疾病分别是由乳腺组织、外周血细胞或脑组织中多肽SEQ ID NO1、SEQ ID.No.5或SEQ ID.No.9的存在增加所介导或与之有关。还提供了用于受试者中与多肽的存在增加有关的疾病或症状的诊断方法，所述方法包括在免疫鉴定法中使用结合具有SEQ ID NO1、SEQ ID.No.5或SEQ ID.No.9所示氨基酸序列的多肽或者其片段或部分的抗体。
仍在另一个方面中，本发明提供了可以体外繁殖的细胞，优选为哺乳动物细胞，更为优选地为脊椎动物细胞，所述细胞能够在产生包含具有SEQ ID NO1、SEQ ID.No.5或SEQ ID.No.9所示氨基酸序列的多肽或者其片段、衍生物或基本同源的序列的培养中生长，其中所述细胞任选地包含非人类转录控制序列的转录控制DNA序列，其中这种转录控制序列控制编码具有所述氨基酸序列的多肽的DNA转录。
在另一个方面，本发明提供了用于产生多肽的方法，所述方法包括在足以在宿主细胞中表达此类多肽的条件下培养这样的宿主细胞，因此引起了所表达多肽的产生以及回收所表达的多肽，其中所述宿主细胞在细胞内整合了包含本发明的外源衍生的遍在蛋白特异性多核苷酸的表达载体。
仍在本发明的另一个方面中，提供了鉴定方法和试剂盒，包括在患者来源的身体组织中检测本发明遍在蛋白特异性多核苷酸的上述正常表达或多肽或者其片段的必需组分，所述试剂盒包含例如抗体或可与本发明多核苷酸杂交的寡核苷酸探针。在一个优选的实施方案中，此类试剂盒还包含详述此类试剂盒中组分应当遵循使用的程序的说明书。
另一个方面涉及包含SEQ ID NO1、SEQ ID.No.5或SEQ ID.No.9的核苷酸序列或其片段、衍生物或者同源物的药物组合物。
在另一个方面，本发明涉及用于鉴定分子的方法，其中所述分子能够结合本发明的遍在蛋白特异性蛋白酶和/或调节遍在蛋白活性或调节可结合调节遍在蛋白转录或翻译的核酸序列的分子的活性。这类方法在例如美国专利号5,541,070；5,567,317；5,593,853；5,670,326；5,679,582；5,856,083；5,858,657；5,866,341；5,876,946；5,989,814；6,010,861；6,020,141；6,030,779和6,043,024中公开。所有这些专利此处完整引用作为参考。通过这些方法所鉴定的分子同样落入本发明的范围内。
仍在另一个方面，本发明涉及用于向需要治疗的受试者的一种或多种组织中导入本发明的核酸并导致一种或多种所述核酸编码的蛋白质由所述组织中的细胞表达和/或分泌的方法。
根据以下的描述，本发明的其它方面、特征、优点和方面对于本领域技术人员而言是显而易见的。然而应理解以下的描述和具体实施例在说明本发明的优选实施方案的同时，仅仅用做说明。在所公开的本发明精神和范围内的多种改变和变化对于那些本领域技术人员而言通过阅读如下描述和阅读本发明内容的其他部分而很快变得显而易见。
表格的描述表1(a)USP_N01新剪接变体-氨基酸序列表1(a)描述了遍在蛋白特异性蛋白酶的新剪接形式的SEQ ID.No.1。这种新剪接形式的特征是位于Pos1-Pos11，Pos267-Pos300，Pos361-Pos384和Pos1243-Pos1437的4个插入。
表1(b)USP_N01新剪接变体-核苷酸序列表1(b)描述了对应于表1(a)的核苷酸序列的SEQ ID.No.2。
表1(c)DERWENT参考氨基酸序列AAU82706表1(c)描述作为已与表1(a)的新剪接形式比较过的参考氨基酸序列SEQ ID.No.3。
表1(d)参考核苷酸序列表1(d)描述了作为对应于表1(c)的参考核苷酸序列SEQ ID.No.4。
表2(a)USP_N07新剪接变体-氨基酸序列表2(a)描述了作为遍在蛋白特异性蛋白酶的新剪接形式的SEQ ID.No.5。这种新剪接形式的特征是位于Pos14-Pos81的1个插入。
表2(b)USP_N07新剪接变体-核苷酸序列表2(b)描述了作为对应于表2(a)的核苷酸序列SEQ ID.No.6。
表2(c)DERWENT参考氨基酸序列AAU82714表2(c)描述了作为已与表2(a)的新剪接形式比较过的参考氨基酸序列SEQ ID.No.7。
表2(d)参考核苷酸序列表2(d)描述了对应于表2(c)的参考核苷酸序列SEQ ID.No.8。
表3(a)USP_N11新剪接变体-氨基酸序列表3(a)描述了作为遍在蛋白特异性蛋白酶的新剪接形式的SEQ ID.No.9。这种新剪接形式的特征是位于Pos12-Pos48的1个插入。
表3(b)USP_N11新剪接变体-核苷酸序列表3(b)描述了作为对应于表3(a)的核苷酸序列SEQ ID.No.10。
表3(c)DERWENT参考氨基酸序列AAU82713表3(c)描述了作为已与表3(a)的新剪接形式比较过的参考氨基酸序列SEQ ID.No.11。
表3(d)参考核苷酸序列表3(d)描述了作为对应于表3(c)的参考核苷酸序列SEQ ID.No.12。
发明详述文中引用的所有专利申请、专利和参考文献这里完整引入作为参考。
在实施本发明时，使用了分子生物学、微生物学、重组DNA中的多种常规技术。这些技术为众所周知并且在例如1997年F.M.Ausubel编辑的《Current Protocols in Molecular Biology》第I、II和III卷；1989年纽约冷泉港的冷泉港实验室出版社Sambrook等的《Molecular CloningALaboratory Manual》第二版；1985年D.N.Glover编辑的《DNA CloningA Practical Approach》第I和II卷；1984年M.L.Gait编辑的《Oligonucleotide Synthesis》；1985年Hames和Higgins的《Nucleic AcidHybridization》；1984年Hames和Higgins编辑的《Transcription andTranslation》；1986年R.I.Freshney编辑的《Animal Cell Culture》；1986年IRL出版社的《Immobilized Cells and Enzymes》；1984年Perbal的《A Practical Guide to Molecular Cloning》；Academic Press，Inc.出版社的《Methods in Enzymology》系列丛书；1987年冷泉港实验室J.H.Miller和M.P.Calos编辑的《Gene Transfer Vectors for Mammalian Cells》和分别由Wu和Grossman以及Wu编辑的《Methods in Enzymology》第154和155卷中详细解释。
本发明涉及鉴定称作DUB或脱遍在蛋白酶的人类遍在蛋白特异性蛋白酶的新剪接变体。本发明的新剪接变体在表1(a)、2(a)和3(a)中提供，分别对应氨基酸序列SEQ ID.No.1、SEQ ID No.5和SEQ ID.No.9。相应的核苷酸序列SEQ ID No.2、SEQ ID No.6和SEQ ID No.10在表1(b)，2(b)和3(b)中提供。这些序列分别是DERWENT参考序列AAU82706、AAU82714和AAU82713的剪接变体。
本发明包含了与表1、2和3中所提供的序列基本同源的核酸序列和氨基酸序列。
然而，应当理解先于本发明所公开的任何氨基酸序列是排除在外的。当在此处就序列而言使用时，术语″基本同源的″意指某个序列当与其参考序列比较时具有基本相同的结构和功能。当参考序列中的某个位置为相同的氨基酸或核苷酸占据时，分子在这个位置处同源(即在此位置处存在同一性)。在核酸序列比较中，同源性仍存在于这样的位置处，在所述位置处包含核苷酸的三联密码子在进行比较的两个分子中由于遗传密码的简并性编码了相同的氨基酸。
基本同源的序列和参考序列之间的同源性百分率希望为至少80％，更希望为至少85％，优选地是至少90％，更优选地是至少95％，进一步更优选地是至少99％。
序列比较使用Smith-Waterman序列比对算法实施(见例如1995年伦敦Chapman & Hall出版社Waterman，M.S的《Introduction toComputational BiologyMaps，sequences and genomes》ISBN0-412-99391-0或http://www-to.usc.edu/software/seqaln/index.html)。
本发明的核酸序列还包括在严格的杂交条件下与本发明的核酸序列杂交的序列。严格的杂交条件定义为在7％十二烷基硫酸钠(SDS)、0.5MNaPO4、1mM EDTA中50℃洗涤并且在2X SSC、0.1％SDS中50℃洗涤后，更希望地在7％十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中50℃洗涤并且1X SSC、0.1％SDS中50℃洗涤后，更希望地在7％十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中50℃洗涤并且在0.5X SSC、0.1％SDS中50℃洗涤后，优选地在7％十二烷基硫酸钠(SDS)，0.5M NaPO4，1mM EDTA中50℃洗涤并且在0.1X SSC，0.1％SDS中50℃洗涤后，更为优选地在7％十二烷基硫酸钠(SDS)，0.5M NaPO4，1mM EDTA中50℃洗涤并且在0.1X SSC，0.1％SDS中65℃洗涤后观察到了阳性杂交信号。
本发明的核酸序列可以包含可读框(Open Reading Frame，ORF)并且还包含5’非翻译区域(UTR)或其部分。本发明还可以包含任何启动子、增强子、调节子、终止子和定位元件以及这些元件与异源基因连接的用途。
以上所提供的同源序列的定义包含了本发明的核酸或氨基酸序列的新剪接变体的片段。“片段”意指具有所述新剪接变体的至少5、10、15或者任选地具有至少25、35或45个连续氨基酸的任意肽分子。核酸序列的片段包含至少50个，任选地包含至少75个或至少100个连续的核苷酸。
然而本发明涉及的片段将不得解释为包含了已先于本发明所公开的片段。本发明所述片段能够保留蛋白质的一种或多种活性例如结合遍在蛋白或水解肽键的能力，以及能够用作免疫原产生遍在蛋白蛋白酶抗体的片段。生物活性片段可包含结构域或基序例如催化位点、UBP或UCH标记、膜结合的区域和用于糖基化作用、依赖cAMP和cGMP的蛋白激酶磷酸化作用、蛋白激酶C磷酸化作用、酪蛋白激酶II磷酸化作用、酪氨酸激酶磷酸化作用，N-豆蔻酰化作用和酰胺化作用的位点。
其它可能的片段包含催化位点或含有半胱氨酸或组氨酸遍在蛋白识别位点、遍在蛋白结合位点、对于亚基的相互作用重要的位点以及对执行这种蛋白酶的其它功能重要的位点在内的结构域。这类结构域或基序可通过常规的计算机化的同源性搜索程序鉴定，这类片段可以例如在功能性位点的两个方向上延伸以包含5、10、15、20、30、40、50个氨基酸或多达100个氨基酸。
这些片段进一步可以包含上述特定结构域的亚片段，其中这些亚片段保留了这些亚片段所来源的结构域的功能。这些区域可通过涉及计算机化同源性分析的熟知方法鉴定。本发明还提供了具有免疫原性特征的片段。这些片段包含遍在蛋白蛋白酶和变体中携带表位部分。携带表位的这些肽对于产生特异性结合遍在蛋白蛋白酶的多肽或区域或片段的抗体有用。这类肽可包含至少10、12个，至少14个，或至少大约15至大约30个氨基酸之间。可用于产生抗体的抗原性多肽的非限定性实例包括但不限于衍生自细胞外位点的肽，其中所述的细胞外位点包含了具有高的抗原性指数的区域(见图3，US 6,451,994)。然而，本发明也包含识别胞内肽区域的细胞内产生的抗体(″细胞内抗体″)。这些携带表位的遍在蛋白蛋白酶的多肽可以通过任何常规手段产生(Houghten，R.A.(1985)Proc.Natl.Acad.Sci.USA 825131-5135)。多个肽的同时合成在美国专利号4,631,211中描述。
片段可以是独立的(未与其它氨基酸或多肽融合)或者可以处于更大的多肽内。几个片段进一步可以在一个较大的多肽内包含。在一个实施方案中，设计用于在宿主中表达的片段可以具有融合于遍在蛋白蛋白酶片段氨基端的异源性前多肽区域和原多肽区域以及融合于这个片段羧基端的额外区域。
片段可用作cDNA文库的杂交探针以便分离全长的基因和具有高度序列相似性以及类似生物学活性的其它基因。这类探针优选地具有至少大约30个碱基并且可以包含例如约30至约50个碱基，约50至约100个碱基，约100至约200个碱基或超过200个碱基。这种探针还可以用于鉴定对应于全长转录物和基因组克隆的cDNA克隆或鉴定含有包括调节区域和启动子区域、外显子和内含子在内的全长基因的克隆。筛选的实例包括通过使用已知DNA序列合成寡核苷酸探针来分离基因的编码区域。具有与本发明基因序列互补的序列的经标记寡核苷酸用于筛选人cDNA、基因组DNA或mRNA的文库以确定文库中与这种探针杂交的成员。
本发明还包含氨基酸序列的“衍生物”。“衍生物”是与所述氨基酸序列在氨基酸水平相关的序列(如同源序列，其中某些天然存在的氨基酸由合成的氨基酸替代物替代)或者在空间水平相关的序列(例如其中分子具有与所述氨基酸序列基本相同的形状和构象)。因此衍生物包括突变体、模拟物、模拟位物(mimotopes)、类似物、单体形式和功能等同物。
引起氨基酸序列内沉默变化的氨基酸残基缺失、添加或替代产生了功能等同的差异表达基因产物。氨基酸的替代可基于所涉及残基的极性、电荷、溶解性、疏水性、亲水性和/或兼性特征的相似性。例如非极性(疏水性)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸；极性中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺；正电荷(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸；且负电荷(酸性)氨基酸包括天冬氨酸和谷氨酸。
衍生物可以包括这样的氨基酸序列，在其氨基酸序列中所替代的氨基酸残基不是那种由遗传密码编码的氨基酸残基；在其氨基酸序列中包含替代物；其中成熟的肽与另一化合物如提高所述多肽半寿期的化合物(如聚乙二醇)或其中融合额外的氨基酸如前导序列或者分泌序列或者用于纯化这种成熟多肽的序列或者前蛋白的序列至成熟多肽。
已知的修饰包括但不限于乙酰化作用、酰化作用、ADP核糖基化作用、酰胺化、黄素的共价连接、血红素分子的共价连接、核苷酸或核苷酸衍生物的共价连接、脂类或脂类衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化作用、二硫键形成、去甲基化作用、共价交联的形成、胱氨酸的形成、焦谷氨酸的形成、甲酰化作用、γ-羧化作用、糖基化作用、GPI锚的形成、羟化作用、碘化作用、甲基化作用、豆蔻酰化作用、氧化作用、蛋白酶解加工，磷酸化作用、异戊烯化作用、外消旋作用、硒酰基作用、硫酸化作用、转移RNA介导的氨基酸至蛋白质的添加例如精氨酰化作用以及遍在蛋白化。
这类修饰为本领域技术人员熟知并且在科学文献中更详细地描述。几种尤其常见的修饰例如糖基化作用、脂连接、硫酸盐化作用、谷氨酸残基的γ-羧化作用、羟化作用和ADP核糖基化作用在最为基础的教材中描述，如1993年纽约W.H.Freeman and Company出版社T.E.Creighton编辑的《Proteins-Structure and Molecular Properties》第2版。众多关于这个主题的更详细综述可以例如在1983年纽约Academic Press出版社B.C.Johnson编辑的《Posttranslational Covalent Modification of Proteins》第1-12页；Seifter等，(1990)Meth.Enzymol.182626-646和Rattan等(1992)Ann.N.Y.Acad.Sci.66348-62中获得。
同样众所周知，多肽并不总是完全线状的，例如多肽可因为遍在蛋白化呈分枝状并且多肽可为具备分枝或没有分枝的环状，这通常是翻译后加工事件的结果，包括天然加工事件和天然不发生的由人类操作所致的事件。环状的、分枝的和分枝环状的多肽可以通过非翻译的天然方法和通过合成方法合成。
修饰可在多肽内的任意位置包括肽主链、氨基酸侧链和氨基端或羧基端进行。共价修饰封闭多肽内的氨基或羧基或者这两种基团在天然存在多肽和人工合成多肽中常见。例如大肠杆菌(E.Coli)中所产生的多肽氨基端残基在蛋白酶解加工之前几乎总是N-甲酰甲硫氨酸。
修饰可与这种蛋白质是如何产生的有关。例如对于重组多肽，修饰由宿主细胞的翻译后修饰能力和多肽氨基酸序列内的修饰信号决定。因此当需要糖基化作用时，应将多肽在可进行糖基化的宿主通常是真核细胞中进行。昆虫细胞常可进行与哺乳动物细胞相同的翻译后糖基化作用，因此，已经研发出可高效表达具有天然类型糖基化作用的哺乳动物蛋白质的昆虫细胞表达系统。类似的思路也适用于其它的修饰。同类型的修饰可在给定多肽内数个位点处相同或不同程度地出现。给定多肽还可以包含超过一种类型的修饰。
“功能等同物”如此处所用是指能够显示与由上述差异表达基因序列编码的内源差异表达基因产物基本相似的体内或体外活性的蛋白质或多肽。“功能等同物”还可以指以基本类似于内源差异表达基因产物的相应部分与其它细胞或胞外分子相互作用的方式而与其它细胞或胞外分子相互作用的蛋白质或多肽。例如“功能等同的”肽能够在免疫鉴定法中降低抗体对内源性蛋白质相应肽的结合(即具有已经修饰的氨基酸序列的肽以获得“功能等同的”肽)或者对内源性蛋白质本身的结合，其中这种抗体针对这种内源性蛋白质的相应肽产生。等摩尔浓度的功能等同的肽将降低结合前述的相应肽至少约5％，优选地约5％至10％之间，更为优选地约10％至25％之间，甚为优选地约25％至50％之间，并且最优选地约40％至50％之间。
例如功能等同的肽可以具备全部功能或可缺乏一种或多种活性功能。因此在本发明中变异可影响例如遍在蛋白结合功能、遍在蛋白识别功能、与已经遍在蛋白化的底物蛋白的相互作用如结合或蛋白水解作用、亚基相互作用尤其在蛋白酶体内的相互作用、通过ATP的激活或结合、发育性表达、时序表达、组织特异性表达、与细胞的成分如转录调节因子，尤其反式作用转录调节因子的相互作用、蛋白酶水解切割多聚遍在蛋白内的肽键和遍在蛋白或多聚遍在蛋白与蛋白质底物之间的肽键，以及蛋白酶水解切割遍在蛋白或多聚遍在蛋白与肽或氨基酸之间的肽键。
完全的功能性变体一般仅包含保守性变异或在非关键残基处或非关键区域内的变异。功能性变体还可包含相似氨基酸的替代，所述替代没有引起功能的变化或引起功能的不显著变化。备选地，此类替代可对功能产生某种程度的积极或消极影响。
非功能性变体一般包含一种或多种非保守性氨基酸的替代、缺失、插入、倒位或截短或者在关键残基处或关键区域内的替代、插入、倒位、缺失。变体如所描述可为天然存在或通过重组手段或化学合成产生的，以赋予遍在蛋白蛋白酶多肽有用的和新的特点。这包括通过阻止蛋白质聚集防止来自药物制剂的免疫原性。有用的变异进一步包括催化活性的改变。例如一个实施方案涉及在结合位点处导致肽键结合的变异而非肽键水解或减慢水解的变异。其它的有用变异导致肽键水解速率的提高。相同位点处的又一个有用变异可导致对底物更高或更低的亲和性。
有用的变异还包括给予不同于正常所识别的已遍在蛋白化的蛋白质底物亲和力的改变。涉及已改变的识别作用的其它有用变异影响了正常所识别的底物类型。例如，一种变异可能导致识别已遍在蛋白化的完整底物但是不识别底物的残余物(remnants)，如作为蛋白酶水解作用产物的已遍在蛋白化氨基酸或肽，其是水解已遍在蛋白化的完整底物的结果。或者可将这种蛋白酶变异以致它可以识别一种或多种残余产物而不能识别完整的蛋白质底物。另一种变异将影响这种蛋白酶拯救已遍在蛋白化的蛋白质。因此通常可从蛋白酶水解作用中拯救的蛋白质底物将受到降解。更为有用的变异影响这种蛋白酶受激活物如细胞因子诱导的能力，所述的激活物包括但不限于那些此处所公开的激活物。另一个有用的变异将影响遍在蛋白底物的识别以致这种酶不能识别一种或多种线状的多聚遍在蛋白、支链的多聚遍在蛋白、线状的已多聚遍在蛋白化的底物或支链多聚遍在蛋白底物。特定的变异包括截短例如缺失HIS结构域，这种变异导致了脱遍在蛋白作用活性的降低或丧失。另一种有用的变异包括阻止通过ATP的激活作用的变异。
另一种有用的变异提供了融合蛋白，在这种融合蛋白中一种或多种结构域或亚区域有效地与来自另一种UBP或来自UCH的一种或多种结构域或亚区域融合。具体地，可以导入赋予正常不具备拯救功能的酶拯救功能或识别特定底物的功能的结构域或亚区域，其中原来的酶并不具有识别功能。其它的变异包括可影响遍在蛋白识别作用或识别已遍在蛋白化的蛋白质底物的变异。其它变异可影响特定亚基尤其是在蛋白酶体内的相互作用。其它变异将影响发育性、时序性或组织特异性的表达。其它变异将影响细胞内组分例如转录调节因子间的相互作用。对功能关键的氨基酸可通过本领域所知的方法鉴定，如定点诱变或丙氨酸扫描诱变(Cunningham等，(1985)Science 2441081-1085)。丙氨酸扫描诱变方法在分子中每个残基处导入单个丙氨酸突变。然后检测所得到的突变分子的生物学活性，如肽的体外水解或依赖遍在蛋白的体外活性如增殖活性、受体介导的信号传导以及其它的细胞过程，包括但不限于此处所公开的那些与遍在蛋白系统有关的活性。对于结合或识别关键的位点也可以通过结构分析确定，如结晶、核磁共振或光亲和性标记(Smith等(1992)J.Mol.Biol.224899-904；de Vos等(1992)Science 255306-312)。
脱遍在蛋白酶活性的鉴定法为本领域众知并且可在例如Zhu等(1997)Journal of Biological Chemistry 27251-57、Mitch等(1999)AmericanJournal of Physiology 276C1132-C1138、Liu等(1999)Molecular and CellBiology 193029-3038中并且在多种综述里所引用的那些文献如Ciechanover等(1994)The FASEB Journal 8182-192、Chiechanover(1994)Biol.Chem.Hoppe-Seyler 375565-581、Hershko等(1998)Annual Reviewof Biochemistry 67425-479、Swartz(1999)Annual Review of Medicine5057-74、Ciechanover(1998)EMBO Journal 177151-7160和D′Andrea等(1998)Critical Reviews in Biochemistry and Molecular Biology33337-352中找到。这些鉴定法包括但不限于底物的消失，包括多聚遍在蛋白或已遍在蛋白化的蛋白质底物或蛋白质残余物数量的减少、中间体和终产物的出现例如游离遍在蛋白单体的出现、总蛋白质周转、特定蛋白的周转、遍在蛋白结合、对已遍在蛋白化的蛋白质底物的结合、亚基的相互作用、与ATP的相互作用、与细胞成分如反式作用调节因子的相互作用、特定蛋白质的稳定化及其它。
“宿主细胞”如此处所用指包含了通过任何方法如电穿孔、磷酸钙沉淀、微注射、转化、病毒感染等导入了异源DNA的原核或真核细胞。
“异源的”如此处所用意指“属于不同的天然来源”或代表了非天然的状态。例如若宿主细胞用来源于另一种生物尤其来源于另一个物种的DNA或基因转化，对于这种宿主细胞和携带了这种基因的此宿主细胞的后代而言这种基因是异源的。类似地，异源指来源于相同的天然、原始的细胞类型并插入至所述细胞类型的核苷酸序列，但是这种核苷酸序列以非天然的状态出现，例如具有不同拷贝数或受不同调控元件的控制。
“载体”是异源的核酸可以插入其中的核酸分子，随后这种核酸分子可导入至适合的宿主细胞内。载体优选地具有一个或多个复制起点和一个或多个重组DNA可以插入的位点。载体常常具有从那些不具备这些载体的细胞中选择含有这些载体的细胞的便利方法，例如这些载体编码了药物抗性基因。常见的载体包括质粒、病毒基因组和(主要在酵母和细菌中)“人工染色体”。
“质粒”通常此处命名为小写p在前和/或后为大写字母和/或数字，与本领域技术人员所熟悉的标准命名习惯一致。此处所公开的起始质粒或者是可商业获得，以非限制性的基础可公开获得或能够从可获得的质粒通过常规运用众知的已发表方法构建。众多能够根据本发明使用的质粒以及其它克隆和表达载体为众所周知并且易于为本领域技术人员获得。此外，技术人员易于构建适用于本发明的任何数量的其它质粒。本发明中这类质粒和其它载体的特征、构建和用途对于技术人员而言因为本公开将是容易理解的。
术语″经分离的″意指将物质从该物质原有环境中移走(例如天然环境，若这种物质是天然存在的)。例如，存在于活的动物中的天然存在多核苷酸或多肽未经过分离，但是从天然系统的某些或者全部共存物质中分离的相同多核苷酸或多肽为经分离的，即便随后这种多核苷酸或多肽再次导入了这个天然系统内。这类多核苷酸可为载体的一部分和/或这类多核苷酸或多肽可为组合物的一部分，并且仍然为经分离的，因为这种载体和组合物并不是其天然环境的一部分。
如此处所用，术语“转录控制序列”指DNA序列如起始序列、增强子序列和启动子序列，这种DNA序列包括诱导、抑制或控制与其有效连接的编码蛋白质的核酸序列的转录。“人转录控制序列”是天然存在在人基因组中的任意转录控制序列而“非人转录控制序列”是在人基因组内不存在的任意转录控制序列。
多种宿主-表达载体系统可用于表达本发明的基因编码序列。这类宿主-表达系统以可产生并且随后纯化编码目的序列的载体为代表，而且还以这样的细胞为代表，其中这种细胞在以合适的核苷酸编码序列转化或转染后原位(in situ)展示本发明差异表达基因的蛋白质。这些宿主-表达系统包括但不限于经包含了差异性表达基因的蛋白质编码序列的重组噬菌体DNA、质粒DNA或粘粒DNA表达载体转化的微生物如细菌(例如大肠杆菌、枯草芽孢杆菌(B.subtilis))；经包含了差异性表达基因的蛋白质编码序列的重组酵母表达载体转化的酵母(例如酿酒酵母(Saccharomyces)、毕赤酵母(Pichia))、以含有差异性表达基因的蛋白质编码序列的重组病毒表达载体(例如杆状病毒)感染的昆虫细胞系统；经含有差异性表达基因的蛋白质编码序列的重组病毒表达载体(例如花椰菜花叶病毒，CaMV；烟草花叶病毒，TMV)感染或经含有差异性表达基因的蛋白质编码序列的重组质粒转化载体(如Ti质粒)转化的植物细胞系统；或哺乳动物细胞系统(例如COS、CHO、BHK、293、3T3)，这种哺乳动物细胞系统携带了含有来源于哺乳动物细胞基因组的启动子(例如金属硫蛋白启动子)或来自哺乳动物病毒的启动子(例如腺病毒晚期启动子；痘苗病毒7.5K启动子)的重组表达构建体。
在细菌系统中，众多表达载体可根据所表达的差异性表达基因的蛋白质的预期用途有利地加以选择。例如当这种蛋白将大量地产生以生成抗体或筛选肽文库时，可能需要指导高水平易于纯化的融合蛋白表达的载体。这类载体包括但不限于大肠杆菌表达载体pUR278(Ruther等，1983，EMBO J.21791)，其中差异性表达基因的蛋白质编码序列可单个地连接至这种载体内并与lac Z编码区域可读框一致以便产生融合蛋白；pIN载体(Inouye和Inouye，1985，Nucleic Acid Res.133101-3109；Van Heeke &Schuster，1989，J.Biol.Chem.2645503-5509)及其它载体。PGEX载体还可以用于表达作为与谷胱甘肽S-转移酶(GST)融合蛋白的外源多肽。通常这类融合蛋白是可溶的并且易于从经裂解的细胞中通过吸附于谷胱甘肽琼脂糖珠并且随后在存在游离谷胱甘肽时洗脱而纯化。这种PGEX载体设计为包含了凝血酶或因子Xa的蛋白酶切割位点以便能从GST部分中释放经克隆的靶基因的蛋白质。
启动子区域可从任何所需基因使用的载体中选择，其中所述载体包含了缺乏启动子区域的报告基因转录单元如氯霉素乙酰基转移酶(“cat”)转录单元，这种转录单元位于用来引入候选启动子片段即包含启动子的片段的限制性位点下游。如所众知的，向载体中位于CAT基因上游的限制性位点引入含有启动子的片段产生了CAT活性，这种CAT活性可通过标准的CAT鉴定法检测。适于此目的的载体众所周知并且易于得到。pKK232-8和pCM7是这样的两种载体。因此，用于表达本发明多核苷酸的启动子不但包括了众知的易于得到的启动子而且还包括可通过前述技术利用报告基因易于获得的启动子。
适合本发明多核苷酸和多肽表达的已知细菌启动子为大肠杆菌lacI和lacZ启动子、T3和T7启动子、T5 tac启动子、λPR、PL启动子以及trp启动子。适合这个目的的已知真核启动子为CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒LTR启动子如劳氏肉瘤病毒(″RSV″)LTR启动子以及金属硫蛋白启动子如小鼠金属硫蛋白-I启动子。
在昆虫系统中，苜蓿银纹夜蛾(Autographa californica)核型多角体病毒(AcNPV)是用作表达外来基因的载体的几种昆虫系统之一。病毒在草地贪夜蛾(Spodoptera frugiperda)细胞中生长。差异性表达基因的编码序列可以分别克隆入病毒的非必需区域(例如多角体蛋白基因)并且置于AcNPV启动子的控制下(例如多角体蛋白启动子)。成功插入差异性表达基因的编码序列将引起多角体蛋白基因的失活和产生非包含体型重组病毒(即病毒缺少由多角体蛋白基因编码的蛋白质外壳的病毒)。然后这些重组病毒用于感染草地贪夜蛾细胞，在这些细胞中表达插入的基因(例如参见Smith等1983，J.Virol.46584，Smith，美国专利号4,215,051)。
众多基于病毒的表达系统可以在哺乳动物宿主细胞中使用。在使用腺病毒作为表达载体时，差异性表达基因的目的编码序列可与腺病毒转录/翻译控制复合体如晚期启动子和三联前导序列连接。然后这种嵌合基因可通过体内或体外重组插入腺病毒基因组。这种病毒基因组中非必需区域内的插入(如区域E1或E3)将产生具有活力并且能够在已感染的宿主中表达差异性表达基因的蛋白质的重组病毒(例如见Logan和Shenk，1984，Proc.Natl.Acad.Sci.USA 813655-3659)。也可能需要用于所插入的差异性表达基因编码序列高效翻译的特异性起始信号。这些信号包括ATG起始密码子和临近的序列。在包括基因自身的起始密码子和临近序列在内的完整差异性表达基因插入至合适的表达载体时，可以不再需要额外的翻译控制信号。然而当仅仅部分的差异性表达基因的编码序列插入时，必须提供外源的翻译控制信号，可能包括ATG起始密码子。而且这种起始密码子必须与目的阅读框定相(in phase)以确保全部插入物的翻译。这些外源的翻译控制信号和起始密码子可为多种来源，即可为天然的也可为合成的。表达的效率可通过包括合适的转录增强子元件、转录终止子等等增强(见Bittner等1987，Methods in Enzymol。153516-544)。
用于宿主细胞中表达的合适载体和启动子的选择是众知的方法并且用于表达载体构建、载体导入宿主细胞内和在宿主内表达所需的技术本身就是本领域内的常规技术。
一般，重组表达载体包括复制起点、衍生自高表达基因以便指导下游结构序列转录的启动子和选择性标记以便分离暴露于这种载体后含有此载体的细胞。
此外可以选择调节所插入序列的表达或以所需要的特定方式修饰和加工基因产物的宿主细胞株。蛋白质产物的此类修饰(例如糖基化作用)和加工(例如切割)可能对蛋白质的功能重要。不同宿主细胞具有特征性和特定的蛋白质翻译后加工和修饰机制。可以选择合适的细胞系或宿主系统以确保所表达的外源蛋白质的正确修饰和加工。为此目的，可使用具有用于初级转录物正确加工、基因产物糖基化作用和磷酸化作用的细胞机构的真核宿主细胞。此类哺乳动物宿主细胞包括但不限于CHO、VERO、BHK、HeLa、COS、MDCK、293、3T3、WI38等。
为了长期大量地产生重组蛋白质，优选稳定表达。例如可设计稳定表达差异性表达基因的蛋白质的细胞系。宿主细胞可以受适合的表达控制元件(例如启动子、增强子、序列、转录终止子、多聚腺苷酸化位点等)和选择性标记控制的DNA而非包含病毒复制起点的表达载体转化。在导入外源DNA后，已工程化的细胞可在丰富培养基中生长1-2天，然后转为选择性培养基。重组质粒中的选择性标记为选择过程提供了抗性并且使细胞在细胞的染色体内稳定整合这种质粒从而使细胞生长形成转化灶，这种转化灶接下来又可经过克隆并且扩展为细胞系。可有利地使用这种方法以人工设计差异性表达基因的蛋白质的表达细胞系。这种已工程化的细胞系尤其在筛选和评估影响差异性表达基因的蛋白质的内源性活性的化合物方面有用。
可以使用多种选择系统，包括但不限于单纯疱疹病毒胸苷激酶(Wigler等，1977，Cell 11223)，次黄嘌呤鸟嘌呤磷酸核糖转移酶(Szybalska和Szybalski，1962，Proc.Natl.Acad.Sci.USA 482026)，以及腺嘌呤磷酸核糖转移酶(Lowy等，1980，Cell 22817)基因可分别应用于tk-、hgprt-或aprt-细胞。此外抗代谢物抗性可作为选择dhfr、gpt、neo和hygro的基础，其中所述dhfr提供氨甲蝶呤抗性(Wigler等，1980，Natl.Acad.Sci.USA773567；O′Hare等，1981，Proc.Natl.Acad.Sci.USA 781527)；gpt提供霉酚酸抗性(Mulligan & Berg，1981，Proc.Natl.Acad.Sci.USA 782072)；neo提供氨基糖苷G-418抗性(Colberre-Garapin等，1981，J.Mol.Biol.1501)；以及hygro提供潮霉素抗性(Santerre等，1984，Gene30147)。
另一种备选的融合蛋白系统可使人细胞系中表达的非变性融合蛋白易于纯化(Janknecht等，1991，Proc.Natl.Acad.Sci.USA 888972-8976)。在这种系统中，将目的基因亚克隆至牛痘重组质粒中以便通过翻译使这种基因的可读框与由六个组氨酸残基组成的氨基端标签融合。将来源于已感染重组痘苗病毒的细胞的提取物上载至Ni2+氮川乙酸-琼脂糖柱，随后以含有咪唑的缓冲液选择性洗脱已添加组氨酸标签的蛋白质。
当用作如下描述的鉴定法系统中的组分时，差异性表达基因的蛋白质可以经过直接或间接标记以方便由差异性表达基因的蛋白质和测试底物间所形成复合体的检测。可使用多种合适的标记系统中的任意一种，包括但不限于放射性同位素如125I；酶标记系统，其中这种酶标记系统在暴露于底物时产生可检测的量热信号或光；以及荧光标记物。
在使用重组DNA技术以产生用于这类鉴定法系统的差异性表达基因的蛋白质时，有利地将融合蛋白设计为能够便于标记、固定和/或检测。
间接标记涉及蛋白质如已标记抗体的使用，其特异性结合至差异性表达基因的产物。这类抗体包括但不限于多克隆的、单克隆的、嵌合的、单链的抗体、Fab片段和由Fab表达文库所产生的片段。
另一个方面，本发明遍在蛋白特异性蛋白酶的多肽在与遍在蛋白蛋白酶功能有关的生物学鉴定法中有用。这类鉴定法包括对诊断和治疗与遍在蛋白或遍在蛋白蛋白酶相关的疾病有用的任意已知的功能或任意已知的活性或特性。有潜力的鉴定法已经在此公开并且通常包括底物消失、终产物出现和总蛋白质或特定蛋白质周转。
遍在蛋白特异性蛋白酶多肽还用于基于细胞或无细胞系统中药物筛选的鉴定法。基于细胞的系统可以是天然的系统如作为活组织检查或在细胞培养中增殖的遍在蛋白蛋白酶正常表达的细胞。然而在一个实施方案中，基于细胞的鉴定法涉及表达遍在蛋白蛋白酶的重组宿主细胞。测定试验化合物与遍在蛋白蛋白酶相互作用的能力还可包括测定与已知的结合分子(如遍在蛋白)结合多肽的能力比较时试验化合物优先地结合所述多肽的能力。所述多肽可用于鉴定调节遍在蛋白蛋白酶活性的化合物。这类化合物例如能提高或降低对线状或支链的多聚遍在蛋白、已遍在蛋白化的蛋白质底物或已遍在蛋白化的蛋白质底物的残余物的亲和性。这类化合物也能例如提高或降低与这些组分的结合速率。这类化合物还可以与这些组分竞争对遍在蛋白蛋白酶的结合或替代这些已结合至遍在蛋白蛋白酶的组分。这类化合物还可以影响与其它组分的相互作用如与ATP、19S复合物中的其它亚基以及转录调节因子的相互作用。因此应当理解此类化合物不仅可以通过遍在蛋白而且还可以通过与所公开的蛋白酶发生功能性相互作用的任何组分鉴定。这包括但不限于此处所公开的任一这些组分。
遍在蛋白特异性蛋白酶、衍生物和片段可用于高通量筛选以便鉴定候选化合物结合遍在蛋白蛋白酶的能力。这些化合物可进一步用功能性遍在蛋白蛋白酶筛选以便测定化合物对遍在蛋白蛋白酶活性的影响。可以鉴定使遍在蛋白蛋白酶激活(激动剂)或失活(拮抗剂)至目的程度的化合物。调节方法可体外实施(例如通过将这种试剂与细胞一起培养)或者体内实施(例如通过向受试者施用这种试剂)。
本发明的遍在蛋白特异性蛋白酶多肽能够用于筛选化合物刺激或抑制遍在蛋白蛋白酶蛋白与通常相互作用于遍在蛋白蛋白酶蛋白的靶分子间的相互作用。靶分子可为遍在蛋白、已遍在蛋白化的底物或多聚遍在蛋白或遍在蛋白蛋白酶蛋白正常相互作用途径中的另一组分(例如ATP)。鉴定法包括步骤遍在蛋白蛋白酶蛋白与候选化合物在允许遍在蛋白蛋白酶蛋白或片段与靶标分子相互作用的条件下组合；以及检测遍在蛋白蛋白酶蛋白和靶标分子之间复合体的形成或检测遍在蛋白蛋白酶和靶标分子间相互作用的生物化学后果。可以鉴定任何与蛋白酶功能相关的活性。这包括产生水解产物如游离末端的肽底物、来自经水解底物的游离末端氨基酸、游离的遍在蛋白、经水解的多聚遍在蛋白的低分子量物质、由于自蛋白酶解作用拯救所释放的完整底物蛋白质、从完整底物中水解多聚遍在蛋白形成的游离多聚遍在蛋白、以及底物残余物如从底物蛋白质蛋白酶解作用或遍在蛋白途径的生物学终点产生的氨基酸和肽。
测定遍在蛋白蛋白酶结合至靶标分子的能力也可以通过使用如实时双分子相互作用分析法的技术(BIA)完成(Sjolander等，(1991)Anal.Chem.632338-2345和Szabo等，(1995)Curr.Opin.Struct.Biol.5699-705)。如此处所用，“BIA”是一种用于研究实时生物特异性相互作用而不必标记任何相互作用物的技术(如BIAcore)。表面胞质共振(SPR)中的光学现象变化可以用于指示生物分子之间的实时反应。本发明的试验化合物可使用本领域所知的组合文库方法中的多种方法之任一方法获得，包括生物文库；空间可寻址的平行固相或液相文库；需要去褶合的合成文库法；“一珠一化合物”文库法；以及使用亲和层析选择的合成文库法。生物文库法限于多肽文库而其它四种方法适用于多肽、非肽寡聚物或化合物的小分子文库(Lam，K.S.(1997)Anticancer Drug Des.12145)。
合成分子文库的方法的实例可在本领域中找到，如在DeWitt等，(1993)Proc.Natl.Acad.Sci.USA 906909；Erb等，(1994)Proc.Natl.Acad.Sci.USA 9111422；Zuckermann等，(1994).J.Med.Chem.372678；Cho等，(1993)Science 2611303；Carell等，(1994)Angew.Chem.Int.Ed.Engl.332059；Carell等，(1994)Angew.Chem.Int.Ed.Engl.332061；以及在Gallop等，(1994)J.Med.Chem.371233中找到。化合物的文库可以在溶液中存在(例如Houghten(1992)Biotechniques13412-421)、或在珠子上(Lam(1991)Nature 35482-84)、芯片(Fodor(1993)Nature 364555-556)、细菌(Ladner美国专利号5,223,409)、孢子(Ladner美国专利号5,223,409)、质粒(Cull等，(1992)Proc.Natl.Acad.Sci.USA891865-1869)或在噬菌体上(Scott和Smith(1990)Science 249386-390)；(Devlin(1990)Science 249404-406)；(Cwirla等，(1990)Proc.Natl.Acad.Sci.976378-6382)；(Felici(1991)J.Mol.Biol.222301-310)；(Ladner supra)呈现。候选化合物包括例如1)肽如可溶性肽，包括尾部连接Ig的融合肽和随机肽文库的成员(见例如Lam等，(1991)Nature 35482-84；Houghten等，(1991)Nature 35484-86)和由D-和/或L-构象氨基酸组成的组合化学衍生性分子文库；2)磷酰肽(例如随机和部分简并、定向磷酰肽文库的成员，见例如Songyang等，(1993)Cell 72767-778)；3)抗体(例如多克隆的、单克隆的、人源化、抗独特型的、嵌合和单链抗体以及Fab、F(ab′)2、Fab表达文库片段和抗体的表位结合片段)；以及4)小的有机和无机分子(例如从组合的和天然产物的文库中获得的分子)。
一种候选化合物是可竞争结合底物的全长可溶性遍在蛋白特异性蛋白酶或其片段。其它候选化合物包括遍在蛋白蛋白酶突变体或其相应片段，其中所述遍在蛋白蛋白酶突变体或其相应片段含有影响遍在蛋白蛋白酶的功能并且对底物竞争的突变。因此本发明包含例如以较高亲和性竞争底物的片段或结合了底物但不水解肽键的片段。其它候选化合物包括结合这种蛋白酶但是不释放或释放缓慢的已遍在蛋白化的蛋白质或蛋白质类似物。其它候选化合物包括其它天然底物的类似物，如结合但没有得以释放或释放缓慢的底物残余物。另外的候选化合物包括蛋白酶的激活物如细胞因子，包括但不限于此处所公开的那些。
本发明提供鉴定调节(刺激或抑制)遍在蛋白蛋白酶活性的化合物的其它终点。这类鉴定法一般涉及途径中指示遍在蛋白蛋白酶活性的事件的鉴定。这可包括来自脱遍在蛋白作用的细胞事件，例如细胞周期进程、程序性细胞死亡、生长因子介导的信号传导、或任一细胞过程(包括但不限于那些此处所公开的来自脱遍在蛋白作用的细胞过程)。特定的表型包括在应激反应、DNA复制、受体内化作用、细胞转化或转化的逆转以及转录沉默方面的变化。这些鉴定法基于脱遍在蛋白酶的多种细胞性功能。这些酶在多个不同水平上作用于蛋白质遍在蛋白化的调节。
脱遍在蛋白酶能将线状的多聚遍在蛋白链降解为单体遍在蛋白分子。脱遍在蛋白酶如异肽酶T能使分枝状多遍在蛋白链降解为单体的遍在蛋白分子。脱遍在蛋白酶能从缀合有遍在蛋白的靶标蛋白质中移去遍在蛋白。脱遍在蛋白酶如FAF或PA700异肽酶能够从已遍在蛋白化的靶标蛋白质中移去多聚遍在蛋白并且因此从26S蛋白酶体的降解中拯救靶标。脱遍在蛋白酶如Doa-4能够从蛋白酶体降解产物中移去多聚遍在蛋白。所有这些作用的结果是细胞中游离单体的遍在蛋白库受到调节。因此，鉴定法可基于检测经水解/脱遍在蛋白作用所产生的任意产物。进一步可以鉴定受遍在蛋白蛋白酶作用而上调或下调的基因的表达。在一个实施方案中，这类基因的调节区域可以有效地连接至容易检测的标记如萤光素酶。因此任何通过遍在蛋白蛋白酶介导的生物学或生物化学功能可用作终点鉴定法。这些功能包括此处所描述、所引用作为参考的，参考所包括作为这些终点鉴定法靶标的全部生物/生物化学事件，以及为本领域普通技术人员所知的其他功能。
结合和/或激活化合物也可通过使用嵌合的遍在蛋白蛋白酶蛋白筛选，其中如此处所公开所述嵌合的遍在蛋白蛋白酶蛋白中一个或多个结构域、位点等或者它们的部分可由源自其它遍在蛋白蛋白酶的异源对应物替换。可使用例如以不同于天然遍在蛋白蛋白酶的不同底物专一性和/或亲和性相互作用的识别或结合区域。因此一套不同的途径组分可作为对激活的终点鉴定法。进一步，负责发育性、时序性或组织特异性的位点可由异源位点替换以便这种蛋白酶能够在特异的发育性、时序性或组织性表达的条件下检测。
遍在蛋白蛋白酶多肽还用于竞争性结合鉴定法中，在设计用来发现与遍在蛋白蛋白酶相互作用的化合物的方法中。因此化合物在该化合物与遍在蛋白蛋白酶多肽结合或相互作用的条件下暴露于遍在蛋白蛋白酶多肽。可溶性遍在蛋白蛋白酶多肽也可以加至这种混合物中。若试验化合物与这种可溶性遍在蛋白蛋白酶多肽相互作用，则该化合物减少了所形成的复合体的量或遍在蛋白蛋白酶靶标的活性。此类型的鉴定法尤其用于寻找与遍在蛋白蛋白酶特定区域相互作用的化合物。因此与遍在蛋白蛋白酶靶标区域竞争的可溶性多肽设计为包含对应于目的区域的肽序列。
另一种类型的竞争结合鉴定法可用于发现与特定的功能性位点相互作用的化合物。例如，可将遍在蛋白和候选化合物加至遍在蛋白蛋白酶的样品。与遍在蛋白蛋白酶相互作用于遍在蛋白同一位点的化合物将减少遍在蛋白蛋白酶和遍在蛋白之间所形成的复合体的量。因此有可能发现特异性阻止遍在蛋白蛋白酶和遍在蛋白间相互作用的化合物。
另一个实例涉及了向遍在蛋白蛋白酶和多聚遍在蛋白的样品中添加候选化合物。与多聚遍在蛋白竞争的化合物将减少水解的量或多聚遍在蛋白对遍在蛋白蛋白酶的结合。因此可以发现直接与遍在蛋白蛋白酶相互作用并且与多聚遍在蛋白竞争的化合物。这类鉴定法可涉及与遍在蛋白蛋白酶相互作用的任何其它组分，例如已遍在蛋白化的底物蛋白质、已遍在蛋白化的底物残余物和与这种蛋白酶相互作用的细胞组分如转录调节因子。为实施无细胞的药物筛选鉴定法，希望固定遍在蛋白蛋白酶或其片段或者固定其靶标分子以便利于复合物从一种或两种蛋白质的非复合形式中分离，以及适应鉴定法的自动化。在基质上固定蛋白质的技术可用于药物筛选鉴定法。
在一个实施方案中，可以提供融合蛋白，这种融合蛋白添加了以便使这种蛋白质结合基质的结构域。例如谷胱甘肽-S-转移酶/遍在蛋白蛋白酶融合蛋白可吸附于谷胱甘肽琼脂糖珠(Sigma Chemical，St.Louis，Mo.)或谷胱甘肽衍生的微量滴定板，随后这种融合蛋白与细胞裂解物(例如经35S-标记的)及候选化合物混合并且将混合物在利于复合物形成的条件(例如生理条件的盐和pH)温育。温育后将这种琼脂糖珠洗涤以除去任何未结合的标记物并且使基质固定并且放射性标记物直接得以测定或者自复合物解离后在上清中测定。
备选地，复合物可自基质解离，通过SDS-PAGE分离并且使用标准电泳技术从凝胶中定量发现于琼脂糖珠内的遍在蛋白蛋白酶-结合蛋白质水平。例如多肽或此肽的靶标分子可利用生物素和链亲和素的缀合使用本领域众知的技术固定。备选地，与蛋白质反应但不干扰这种蛋白质结合靶标分子的抗体可衍生至平板孔内，并且这种蛋白质可通过孔内的抗体偶联作用捕获。结合遍在蛋白蛋白酶的靶标成分制备物如遍在蛋白、多聚遍在蛋白、已遍在蛋白化的蛋白质底物、已遍在蛋白化的蛋白质底物残余物或已遍在蛋白化残余物的氨基酸和候选化合物在存有遍在蛋白蛋白酶的孔内温育并且可以定量孔中所捕获的复合物的量。
检测这类复合物的方法，除了那些如上所述用于固定GST复合物的方法以外，还包括使用抗体复合物的免疫检测，其中抗体与遍在蛋白蛋白酶靶标分子反应或者与遍在蛋白蛋白酶反应并且与靶标分子竞争；以及依赖检测与此靶标分子有关的酶活性的酶联鉴定法。
根据这些药物筛选鉴定法所鉴定的遍在蛋白蛋白酶活性的调节物可通过处理表达遍在蛋白蛋白酶的细胞用于治疗患有遍在蛋白蛋白酶途径介导的疾病的受试者。
在一个方面，本发明涉及基因表达的调节物，其中所述基因包含如SEQ ID No.2、SEQ ID No.6或SEQ.ID No.10所示的核酸序列。这类调节物优选地是抑制性核酸如反义寡核苷酸、三联体螺旋DNA、siRNA、核酶、RNA适体(aptamer)或双链或单链的RNA。设计抑制基因表达的核酸是本领域技术人员已知的，其中所述基因包含如SEQ ID No.2、SEQ ID No.6或SEQ.ID No.10所示的核酸序列。在一个尤其优选的实施方案中这种抑制性核酸是siRNA。优选的siRNA分子长度一般在18至30个核苷酸之间，虽然更长的长度也适于抑制靶基因表达。在一个优选的实施方案中，siRNA分子的长度在19至25个核苷酸之间。
根据本发明，已发现在乳腺癌组织中存在含量升高的含有选自SEQID No.1、SEQ ID No.5或SEQ.ID No.9的氨基酸序列的多肽。因此本发明在一个方面提供了用于治疗乳腺癌的方法，包括向乳腺癌患者施与有效量的抑制性核酸，其中这种抑制性核酸适于抑制含有选自SEQ ID No.2、SEQID No.6或SEQ.ID No.10所示核酸序列的基因的表达。在一个优选的实施方案中，抑制性核酸是siRNA。在另一个优选的实施方案中，核酸序列是SEQ.ID.No.2。在另一个实施方案中，本发明提供了抑制性核酸的用途、优选地提供了siRNA的用途，以用于制备治疗乳腺癌的药物，其中所述抑制性核酸适于抑制含有选自SEQ ID No.2、SEQ ID No.6或SEQ.ID No.10所示核酸序列的基因的表达，优选抑制含有SEQ ID No.2所示核酸序列的基因的表达。
根据本发明，已发现在外周血细胞尤其在淋巴样细胞中存在含量升高的含有选自SEQ ID No.1、SEQ ID No.5或SEQ.ID No.9的氨基酸序列的多肽。因此本发明在一个方面提供了用于治疗白血病的方法，包括向白血病患者施用有效量的抑制性核酸，其中所述抑制性核酸适于抑制含有选自SEQ ID No.2、SEQ ID No.6或SEQ.ID No.10所示核酸序列的基因的表达。在一个优选的实施方案中，这种抑制性核酸是siRNA。在另一个优选的实施方案中，核酸序列是SEQ.ID.No.6。在另一个实施方案中，本发明提供了抑制性核酸的用途、优选地提供了siRNA的用途，用于制备治疗白血病的药物，其中所述抑制性核酸适于抑制含有选自SEQ ID No.2、SEQ IDNo.6或SEQ.ID No.10所示核酸序列的基因的表达，优选抑制含有SEQ IDNo.6所示核酸序列的基因的表达。
根据本发明的另一方面，提供了含有抑制性核酸尤其是siRNA和可药用载体的药物组合物，其中所述的抑制性核酸适于抑制含有选自SEQ IDNo.2、SEQ ID No.6或SEQ.ID No.10所示核酸序列的基因的表达。
在本发明的一个方面，提供了涉及遍在蛋白特异性蛋白酶的疾病的诊断方法，这种方法包括在人源组织中测量本发明的多核苷酸或多肽的量，其中所述多核苷酸或多肽的量相对于正常对照组织中这种核苷酸或多肽的量升高对患有与遍在蛋白特异性蛋白酶有关的人类疾病具有诊断意义。术语“正常”在本发明诊断方法所用的组织的上下文中意指来源于未患待诊断的疾病的人类组织。在此方面的一个优选的实施方案中，这类方法在体外或离体(ex vivo)实施。
在本发明的一个优选方面，用于诊断涉及遍在蛋白特异性蛋白酶的疾病的方法包括涉及将抗体与组织接触的检测步骤，其中所述抗体特异性结合含有任一SEQ ID No.1、SEQ ID No.5或SEQ.ID No.9所示氨基酸序列的多肽，以及检测所述抗体与在所述组织中的多肽的特异性结合，其中对特异性结合的多肽的检测指示了存在含有任一SEQ ID No.1、SEQ ID No.5或SEQ.ID No.9中所示氨基酸序列的多肽。
在本发明的一个实施方案中，受诊断的细胞是乳腺细胞并且所涉及的疾病包括但不限于乳房发育紊乱、炎症包括但不限于急性乳腺炎、腺管周围乳腺炎(重发性乳晕下脓肿、输乳管鳞状化生)、乳腺导管扩张、脂肪坏死、肉芽肿乳腺炎和与硅氧烷乳房埋植物有关的病理；纤维囊性变化；增殖性乳房疾病包括但不限于上皮细胞增生、硬化性腺病和小导管乳头状瘤；肿瘤包括但不限于间质瘤例如纤维腺瘤、叶状肿瘤和内瘤，以及上皮瘤如大导管乳头状瘤；乳房癌包括原位癌(非侵袭性)包含原位管癌(包括Paget′s病)和原位小叶癌和侵袭性癌(浸润)，包括但不限于非特异性浸润性导管癌、浸润性小叶癌、髓样癌、胶质(粘液)癌、管状癌和浸润性乳头状癌和多种恶性肿瘤。男性乳房疾病包括但不限于男子女性型乳房和癌。
在本发明的另一个实施方案种，受诊断的细胞是外周血细胞，尤其是淋巴样细胞。疾病包括但不限于白血病。
又在本发明的另一个实施方案中，受诊断的细胞位于脑并且参与脑疾病，所述脑疾病包括但不限于涉及神经元的疾病和涉及神经胶质例如星状细胞、少突胶质细胞、室管膜细胞和小胶质细胞的疾病；脑水肿，颅内压升高和成疝，和脑积水；畸形和发育性疾病如神经管缺陷，前脑异常，后窝异常，和脊髓空洞症和脊髓积水；围产期脑损伤；脑血管疾病疾病如那些与有关的脑血管疾病缺氧、局部缺血和梗塞包括低血压、血流灌注不足和低流量状态—整体脑缺血和局部脑缺血-来源于局部血液供应阻塞的梗塞、颅内出血包括大脑内出血、蛛网膜下出血和浆果状动脉瘤破裂和血管畸形，高血压性心脑血管疾病包括腔隙性梗塞，缝隙出血和高血压性脑病；感染如畸形脑膜炎包括急性化脓性(细菌性)脑膜炎和极性无菌性(病毒性)脑膜炎、急性局灶性化脓性感染包括脑脓肿、硬膜下积脓和硬膜外脓肿，慢性细菌性脑膜脑炎包括结核菌病和分枝分支杆菌菌、神经梅毒和神经伯勒疏病(莱姆病)、病毒性脑膜脑炎包括节肢动物传播的(Arbo)病毒性脑炎、单纯疱疹病毒1型、单纯疱疹病毒2型、带状疱疹病毒(Herpes zoster)、巨细胞病毒，脊髓灰质炎，狂犬病，和人类免疫缺陷病毒1包括HIV-1脑膜脑炎(亚急性脑炎)，空泡脊髓病，AIDS相关的肌病，外周神经病和儿童AIDS，进行性多灶白质脑病、亚急性硬化性全脑炎、真菌性脑膜脑炎、神经系统的其它感染性疾病；传染性海绵状脑病(朊蛋白病)；脱髓鞘的疾病包括多发性硬化症、多发性硬化症变体、急性散播性脑脊髓炎和急性坏死性出血性脑脊髓炎及其它具有脱髓鞘作用的疾病；退行性疾病如影响大脑皮质的退行性疾病包括阿尔茨海默病和Pick疾病、基底核和脑干的退行性疾病，包括帕金森综合征、原发性帕金森综合征(震颤麻痹)、进行性核上性麻痹、皮质延髓变性、多系统萎缩包括纹黑突变性、夏德综合征和橄榄体脑桥小脑萎缩及亨廷顿病；脊髓小脑变性包括脊髓小脑共济失调，包括弗里德赖西共济失调及共济失调ataxia-telanglectasia，影响运动神经元的退行性疾病包括肌萎缩性侧索硬化(运动神经元病)、延髓脊髓萎缩(肯尼迪氏综合征)和脊髓性肌萎缩；先天性代谢缺陷如脑白质营养不足，包括Krabbe病、异染性脑白质营养不良、脑白质肾上腺萎缩症、Pelizaeus-Merzbacher病和刀豆氨酸酶病，线粒体脑肌病包括Leigh和其它线粒体脑肌病；中毒性和获得性代谢疾病，包括维生素缺乏症硫胺素(维生素B1)不足和维生素B12不足，代谢紊乱所致神经系统的后遗症，包括低血糖症、高血糖症和肝性脑病，中毒疾病包括一氧化碳、甲醇、乙醇和辐射，包括组合性氨甲蝶呤和放射性诱导的损伤；肿瘤如神经胶质瘤，包括星形细胞瘤，包括纤丝性(弥散性)星形细胞瘤和多形性成胶质细胞瘤、毛细胞性星形细胞瘤、多形性黄色星形细胞瘤，和脑干神经胶质瘤、少突神经胶质瘤、和室管膜细胞瘤及相关的室旁大量损伤，神经元肿瘤、低分化的肿瘤包括成神经管细胞瘤，其它实质肿瘤，包括初级脑淋巴瘤、生殖细胞瘤、和松果体实质瘤、硬脑膜肉瘤、转移性肿瘤、瘤外综合征，外周神经鞘瘤包括神经鞘瘤、神经纤维瘤和恶性外周神经鞘瘤(恶性神经鞘瘤)，和神经皮肤综合征(癜痣症)，包括神经纤维粘液瘤，其包括神经纤维瘤病1型(NF1)和神经纤维瘤病1型(NF2)、结节性硬化症和Von Hippel-Lindau病。
本发明还涉及本发明多肽的用途以提供用于诊断疾病或对遍在蛋白特异性蛋白酶所介导疾病的易感性的靶标，其中所述疾病包括但不限于涉及如此处所公开的表达遍在蛋白蛋白酶的组织的疾病，例如乳腺癌。由此，提供了用于检测细胞、组织或生物体中遍在蛋白蛋白酶的存在或水平的方法。所述方法包括使生物学样本接触能够同遍在蛋白蛋白酶相互作用的化合物以便能够检测这种相互作用。所述多肽还用于治疗以这类成分的量减少为特征的疾病。因此，增加或减少这种蛋白酶的活性对治疗有益。所述多肽还对提供靶标用于诊断以过多底物或底物水平降低为特征的疾病。由此在底物过多的情况下，使用这种蛋白酶的多肽可提供一种诊断性鉴定法。
而且例如具有降低了活性的蛋白酶可用于诊断疾病，其中底物的减少是这种疾病的原因。一种用于检测遍在蛋白蛋白酶的试剂是能够选择性结合遍在蛋白蛋白酶的抗体。生物学样本包括自受试者分离的组织、细胞和生物体液以及在受试者体内存在的组织、细胞和体液。遍在蛋白蛋白酶还提供了靶标用于诊断活跃的疾病或具有遍在蛋白蛋白酶变体的患者对疾病的易感性。因此遍在蛋白蛋白酶可从生物样本中分离并且鉴定是否存在导致异常蛋白质的遗传性突变。所述突变包括氨基酸替代、缺失、插入、重排(作为异常剪接事件的结果)和不合适的翻译后修饰。分析方法包括改变的电泳迁移性、胰蛋白酶对肽消化的改变、在基于细胞或无细胞的鉴定法中改变的遍在蛋白蛋白酶活性、结合或水解多聚遍在蛋白的改变、结合已遍在蛋白化的底物蛋白质或从这种蛋白质中水解遍在蛋白的改变、结合已遍在蛋白化的蛋白质残余物包括肽或氨基酸和从这类残余物中水解遍在蛋白的改变、总蛋白周转的改变、特定蛋白质周转的改变、抗体结合方式的改变、改变的等电点、直接测序氨基酸和任一其它一般性地用于蛋白质中或特异性地用于遍在蛋白蛋白酶中检测突变的已知鉴定技术，包括此处所讨论的鉴定法。用于检测遍在蛋白蛋白酶的体外技术包括酶联免疫鉴定法(ELISA)、蛋白质印迹、免疫沉淀和免疫荧光。
备选地，可通过向受试者导入经标记的抗遍在蛋白蛋白酶抗体而体内检测受试者中的这种蛋白质。例如抗体可用放射活性标志加以标记，可通过标准成像技术检测受试者中这种放射活性标志的存在和位置。尤其有用的是检测受试者表达的遍在蛋白蛋白酶等位变体的方法和检测样品中遍在蛋白蛋白酶片段的方法。遍在蛋白蛋白酶多肽也用于药物基因组学分析。药物基因组学涉及药物反应的临床显著的遗传性变异，这种遗传性变异归咎于受累患者中药物倾向的改变或异常作用。参见例如Eichelbaum，M.(1996)Clin.Exp.Pharmacol.Physiol.23(10-11)983-985和Linder，M.W.(1997)Clin.Chem.43(2)254-266。这些变异的临床结果是由于代谢的个体性差异导致某些个体中治疗药物的严重毒性或某些个体中药物治疗的失败。因此个体的基因型可决定治疗性化合物对机体的作用方式或机体代谢这种化合物的方式。而且药物代谢酶的活性既影响药物作用的强度也影响药物作用的持续期。因此个体的药物基因组学允许选择有效的化合物和此类化合物用于基于个体基因型的预防性或治疗性治疗的有效量。遗传多态性在某些药物代谢酶中的发现解释了为什么某些患者经过使用标准药物剂量未获得预期的药物效应、表现出过度的药物效应或者经历了严重中毒。多态性可以强代谢者表型或弱代谢者表型表述。因此，遗传多态性可产生遍在蛋白蛋白酶等位蛋白质变体，所述蛋白质变体的一种或多种遍在蛋白蛋白酶功能在一个群体中不同于另一个群体中所述蛋白质变体的对应功能。因此所述多肽允许靶向确定可影响治疗方式的遗传性倾向。因此在基于遍在蛋白的治疗中，多态性可产生更为活跃或更不活跃的催化区域。因此，对剂量进行必要调整以便使存在多态性的给定人群中的治疗效果最大化。作为基因型的备选，可以鉴定特定多态性多肽。
遍在蛋白蛋白酶多肽还用于临床试验和其它治疗中监测治疗效果。因此可在整个使用作为终点靶标的遍在蛋白蛋白酶多肽的治疗期间监测所设计用于增加或减少基因表达、蛋白质水平或遍在蛋白蛋白酶活性的试剂的治疗效果。监测可如下进行(i)在试剂施用前从受试者中获得施用前的样本；(ii)检测施用前样本中蛋白质的表达水平或活性；(iii)从该受试者中获得一个或多个施用后的样本；(iv)检测施用后样本中蛋白质的表达水平或活性；(v)比较施用前样本中蛋白质的表达水平或活性和施用后样本中所述蛋白质的表达水平和活性；以及(vi)据此增加或减少这种试剂的施用。
在本发明的另一方面中，用于治疗的方法包括但不限于利用竞争包括那些此处所公开的底物在内的可溶性遍在蛋白特异性蛋白酶或遍在蛋白特异性蛋白酶的片段。这类遍在蛋白蛋白酶或片段可以具有对靶标较高的亲和力，从而提供有效的竞争作用。当非正常地下调和/或增加这种蛋白质活性可产生有益影响时，活性的刺激为所需。类似的，当非正常地下调和/或增加这种蛋白质活性可产生有益影响时，活性的抑制为所需。在一个这种情况的例子中，患者身患以异常发育或异常细胞分化为特征的疾病。在另一个例子中，患者身患以增殖性疾病(如癌)或以异常造血反应为特征的疾病。在另一个例子中，受试者中组织再生的完成为所需(如在受试者已经遭受脑或脊髓损伤并且以受调节的方式再生神经元组织是所需要的)。
在本发明的另一方面中，提供了用于产生抗体的方法，其中所述抗体可识别差异性表达基因的一种或多种表位。这类抗体可包括但不限于多克隆抗体、单克隆抗体(mAbs)、人源化或嵌合抗体、单链抗体、Fab片段、F(ab′)2片段、由Fab表达文库所产生的片段、抗独特性型(anti-Id)抗体和任何上述抗体的表位结合片段。这类抗体可用于例如检测指纹图谱、靶标、生物样品中的基因或用作抑制异常基因活性的工具。
为产生针对差异性表达基因的抗体，可以通过注射差异性表达基因的蛋白质或其部分免疫多种宿主动物。这类宿主动物可包括但不限于仅仅提到的兔、小鼠和大鼠。多种佐剂可以根据宿主种属使用以提高免疫反应，这类佐剂包括但不限于弗氏(完全和不完全)佐剂、矿物胶如氢氧化铝、表面活性物质如溶血卵磷脂、普卢兰尼克多元醇、多聚阴离子、肽、油乳胶、匙孔血蓝蛋白、二硝基酚和潜在有用的人类佐剂如BCG(卡介苗)和短小棒状杆菌。
多克隆抗体是来源于经抗原如靶基因产物或其具有抗原性的功能性衍生物免疫的动物血清的异源抗体分子群体。为了产生多克隆抗体，如上所述的宿主动物可通过注射添加了如上所述佐剂的差异性表达基因产物进行免疫。
作为针对特定抗原的均质抗体群的单克隆抗体可通过任何用于在培养的连续细胞系内产生抗体分子的技术获得。这些技术包括但不限于Kohler和Milstein(1975，Nature 256495-497；和美国专利号4,376,110)的杂交瘤技术、人B-细胞杂交瘤技术(Kosbo等，1983，Immunology Today 472；Cole等，1983，Proc.Natl.Acad.Sci.USA 802026-2030)和EBV-杂交瘤技术(1985年Alan R.Liss，Inc出版社Cole等《Monoclonal Antibody AndCancer Therapy》第77-96页)。这类抗体可属于任一免疫球蛋白类包括IgG、IgM、IgE、IgA、IgD和其任一亚类。产生本发明mAb的杂交瘤可以体外或体内培养。mAb体内高滴度产生使体内培养成为目前优选的生产方法。
此外可以使用研发的用于产生“嵌合抗体”的技术(Morrison 1984，Proc.Natl.Acad.Sci.，816851-6855；Neuberger等，1984，Nature，312604-608；Takeda等，1985，Nature，314452-454)，这种技术通过使具有合适抗原特异性的小鼠抗体分子来源的基因与具有合适生物学活性的人类抗体分子来源的基因剪接。嵌合抗体是一种分子中不同部分源于不同动物种属的分子，如那些具有来源于鼠mAb可变区或超变区和具有人免疫球蛋白恒定区的分子。
备选地，所描述用产生单链抗体的技术(美国专利号4,946,778；Bird，1988，Science 242423-426；Huston等，1988，Proc.Natl.Acad.Sci.USA855879-5883和Ward等，1989，Nature 334544-546)可经过调整以产生差异性表达基因-单链抗体。单链抗体通过氨基酸桥连接Fv区域的重链和轻链片段，产生了单链多肽而形成。
最为优选地，用于产生“人源化抗体”的技术可经过调整以产生针对此处所公开的多肽、片段、衍生物和功能等同物的抗体。这类技术在美国专利号5,932，448；5,693,762；5,693,761；5,585,089；5,530,101；5,910,771；5,569,825；5,625,126；5,633,425；5,789,650；5,545,580；5,661,016和5,770,429中公开，所有这些专利此处完整地引用作为参考。
识别特异性表位的抗体片段可通过已知技术产生。例如此类片段包括但不限于可通过抗体分子的胃蛋白酶消化作用产生的F(ab′)2片段和通过F(ab′)2片段的二硫桥还原作用产生的Fab。备选地可构建Fab表达文库(Huse等，1989，Science，2461275-1281)以快速和简单地鉴定具有所需特异性的单克隆Fab片段。
为了检测方便尤其优选夹心鉴定法，这种鉴定法存在众多改变形式，它们均为本发明所包括。
例如在典型的正向鉴定法中，未标记的抗体在固体基底上固定并且将待检测的样本与已固定的抗体分子接触。在一段合适的温育时间后，所述时间期间足以允许形成抗原抗体二元复合物。然后在此时加入能够导入可探测信号的用报告分子标记的第二抗体并且温育足量时间以形成三原复合物抗原-抗体-经标记的抗体。将任何未反应的物质洗去并且通过信号观察确定抗原的存在或通过与含有已知量抗原的对照样本比较进行定量。正向鉴定法的改变形式包括同时鉴定法，在该方法中样本和抗体同时加至已固定的抗体，或者包括反向鉴定法，在这种方法中经标记的抗体与待测试的样本首先结合、温育并且加至未标记的表面结合抗体。这些技术对于本领域技术人员是众知的并且细微改变的可能性将是显而易见的。如此处所用，“夹心鉴定法”旨在包含所有基础双位点技术的改变形式。
此类鉴定法中最常用的报告分子是酶或含有荧光团或放射性核素的分子。在酶免疫鉴定法中，酶与第二抗体通常经戊二醛或高碘酸盐方法缀合。然而易于认识到存在广泛类型不同的连接技术，这些技术为熟练技术人员众所周知。常用的酶包括辣根过氧化物、葡萄糖氧化酶、β半乳糖苷酶和碱性磷酸酶等。与特定酶共同使用的底物通常选择为经相应酶水解产生可检测颜色变化的底物。备选地，荧光化合物如荧光素和罗丹明可与抗体化学性偶联而不改变抗体的结合能力。当通过经特定波长的光照射激活时，经荧光标记的抗体吸收光能，在分子中诱导激发态，随后以特征性较长波长发射光。发射表现为光学显微镜可视地检测到的特征性颜色。免疫荧光和EIA技术都在本领域内充分地建立并且尤其优选用于本方法。然而其它报告分子如放射性同位素、化学发光或生物发光分子也可以应用。对于技术人员而言如何调整这种方法以适合所需用途是显而易见的。因此在另一个方面，本发明涉及诊断试剂盒，其包含至少一种如下组分(a)适于检测包含如SEQ ID No.2、SEQ ID.No.6或SEQ ID No.10所示核苷酸序列或其部分的核酸的寡核苷酸；(b)适于检测包含如SEQ ID No.1、SEQ ID.No.5或SEQ ID No.9所示氨基酸序列或其部分的多肽的抗体；(c)这种试剂盒的使用说明书。
本发明的核苷酸序列对于染色体的定位有价值。这种序列特异性靶向于个体人类染色体上的特定位置并能够与这个位置杂交。相关序列对染色体的基因绘图根据本发明是将这些序列与基因相关疾病建立联系的第一个重要步骤。一旦某序列在染色体的精确位置上定位，则这个序列在染色体上的物理位置可与遗传图谱数据建立联系。此类数据可在例如V.McKusick，人类孟德尔遗传(可通过约翰霍普金斯大学Welch医学图书馆在线获得)内找到。已经在相同染色体区域内定位的基因和疾病的关系然后通过连锁分析得到鉴定(物理性邻近基因的共同遗传)。
患病和未患病的个体之间在cDNA或基因组序列的差异也可以测定。如果在一些或所有患病个体中观察到了某种突变而在任何正常个体中未观察到此突变，则这种突变有可能是这种疾病的致病因素。
本发明的额外方面涉及为了任何如上所讨论的治疗性效应施用含有可药用载体的药物组合物。这类药物组合物可由本发明的遍在蛋白特异性蛋白酶的抗体、模拟物、激动剂、拮抗剂或抑制剂组成。这类组合物可单独施用或者与至少一种其它试剂如稳定化合物联合施用，其可以在任何无菌、生物相容性药学载体中施用，所述无菌、生物相容性药学载体包括但不限于盐水、缓冲盐水、葡萄糖和水。这类组合物可向患者单独施用，或者与其它试剂、药物或激素联合施用。
本发明所包含的药物组合物可通过任何的途径施用，包括但不限于经口的、静脉内的、肌内的、关节内的、动脉内的、髓内的、鞘内的、心室内的、经皮的、皮下的、腹膜内的、鼻内的、肠的、局部的、舌下的或经直肠的施用方法。
除了活性成分之外，这些药物组合物可包含合适的可药用载体，包含利于将活性化合物加工为可作药用的制剂的赋形剂和辅料。制剂和施用的其它技术细节可在最新版Remington′s Pharmaceutical Sciences(MaackPublishing Co.，Easton，Pa.)中找到。
用于经口施用的药物组合物可使用本领域公知的可药用载体以适于经口施用的剂量制剂。这类载体能使药物组合物制剂为片剂、丸剂、糖衣片、胶囊剂、液体剂、凝胶剂、糖浆剂、膏剂、混悬液等以便病人摄取。
经口施用的药物制品可通过活性化合物与固体赋形剂组合获得，任选地研磨得到的混合物并且根据需要在加入合适的辅料后将混合物颗粒加工以获得片剂或糖衣片核。合适的赋形剂是碳水化合物或蛋白质填充物如糖，包括乳糖、蔗糖、甘露糖醇、山梨糖醇；来自谷物、麦、稻、马铃薯或其它植物的淀粉；纤维素如甲基纤维素、羟丙基甲基纤维素或羧甲基纤维素钠；树胶包括阿拉伯树胶和黄蓍树胶；和蛋白质如明胶和胶原。根据需要，可添加分散剂和增溶剂如交联的聚乙烯吡咯烷酮、琼脂、褐藻酸或其盐如褐藻酸钠。
糖衣片核可用于与合适的包衣如浓缩的糖溶液结合，所述包衣还可以包含阿拉伯树胶、滑石粉、聚乙烯吡咯烷酮、carbopol凝胶、聚乙二醇和/或二氧化钛、紫胶漆溶液和合适的有机溶剂或溶剂混合物。可向片剂或糖衣片包衣内加入染料和色素以便于产物鉴定或描述活性化合物的质量特征即剂量。
可经口施用的药物制品包括由明胶制成的推入配合的胶囊，以及由明胶和包衣如甘油或山梨糖醇制成的软的密封胶囊。推入配合的胶囊可包含与填充物或粘合剂如乳糖或淀粉、润滑剂如滑石粉或硬脂酸镁以及任选地与稳定剂混合的活性成分。在软胶囊中，可将活性化合物溶解或悬浮于具有或不具有稳定剂的合适液体中如脂肪油、液体或液态聚乙二醇中。
适于肠胃外施用的药物制品可以在水溶液中制剂，优选地在生理可相容的缓冲液如Hanks液、林格液或生理缓冲盐水中制剂。含水注射悬液可包含增加悬液粘度的物质，如羧甲基纤维素钠、山梨糖醇或葡聚糖。此外活性化合物的悬液可以制备为合适的油性注射悬液。合适的亲脂性溶剂或载体包括脂肪油如芝麻油或合成的脂肪酸酯如油酸乙酯或甘油三酯或脂质体。非脂的多聚阳离子的氨基聚合物也可用于递送。任选地，悬液也可包含合适的稳定剂或增强化合物溶解的试剂以允许制备高度浓缩的溶液。
对于局部或鼻施用，在制剂中使用了适于渗透特定屏障的渗透剂。这类渗透剂通常为本领域所知。
本发明的药物组合物可以按照本领域所知的方式制造，例如通过常规混合、溶解、造粒、制造糖衣丸、研碎、乳化、装入胶囊、包封或冻干方法。
药物组合物可以作为盐提供并且可以与多种酸形成盐，所述的酸包括但不限于盐酸、硫酸、乙酸、乳酸、酒石酸、苹果酸、琥珀酸等。盐比相应的游离碱形式在水溶剂或其它质子性溶剂中更为可溶。在其它情况下，优选的制品可以是冻干粉末，这种冻干粉末可以包含任意或全部的如下物质1-50mM组氨酸、0.1％-2％蔗糖和2-7％甘露糖醇、4.5至5.5的pH范围，这些物质在使用前与缓冲剂组合。
药物组合物在制备后可置于合适的容器中并且标记用于治疗所指示的疾病。对于施用而言，标记包括施用量、施用频率和施用方法。
适用于本发明的药物组合物包括这样的组合物，所述组合物中含有有效量的活性成分以实现预期的目的。有效量的确定为本领域技术人员能力所及。
对于任一化合物，治疗有效量可首先在细胞培养鉴定法中评估，如在瘤细胞中，或在动物模型通常在小鼠、兔、狗或猪中评估。动物模型还可以用于确定施用的合适浓度范围和途径。此类信息然后可用于确定施用于人的有用剂量和途径。
治疗有效量意指遍在蛋白特异性蛋白酶的活性成分或其片段、抗体、激动剂、拮抗剂或抑制剂的量，所述量改善症状或疾病。治疗效果和毒性可通过标准的药学方法在细胞培养物或实验动物中测定，如ED50(在50％群体中治疗有效的剂量)和LD50(对50％的群体致死的剂量)。毒性效果和治疗效果之间的剂量比是治疗指数并且能够表述为比率LD50/ED50。优选表现出大治疗指数的药物组合物。从细胞培养鉴定法和动物研究中获得的数据可用于形成人用的剂量范围。这类组合物中含有的剂量优选地处于包括ED50并具有极少或没有毒性的循环浓度范围内。根据所用的剂型、患者的敏感性和施用途径，剂量可在此范围内变动。
确切剂量将由开业医生决定，考虑与需要治疗的受试者有关的因素。剂量和施用经过调整以提供足够水平的活性分子或以维持所需的效果。可考虑的因素包括疾病状态的严重性、受试者的总体健康、受试者年龄、体重和性别、饮食、施用的时间和频率、药物联用、反应敏感性和对治疗的耐受/反应。长效药物组合物可以根据特定制剂的半寿期和清除率每3至4天、每星期、或每两个星期施用一次。
通常剂量可以根据施用途径在0.1至100,000微克至总剂量多至约1克之间变动。对特定剂量和递送方法的指导在文献中提供并且通常为本领域的开业医生可获得的。本领域技术人员将对核苷酸采用不同于蛋白质或其抑制剂的制剂。类似地，递送多核苷酸或多肽对特定细胞、疾病、位置等而言是特定的。适用于蛋白质经口施用的药物制剂在例如美国专利5,008,114；5,505,962；5,641,515；5,681,811；5,700,486；5,766,633；5,792,451；5,853,748；5,972,387；5,976,569和6,051,561中描述。
如下的实施例和表格说明了本发明，但无论如何不限制本发明的范围。
表表1(a)-USP_N01新剪接变体-氨基酸序列基因座USP_N013370aaPRT登录号BAA25496GeneSeq AAU82706来源人以4个插入表征的剪接形式Pos 1-Pos 11Pos 267-Pos 300Pos 361-Pos 384Pos 1243-Pos 14371MRRKNSYYVW QKIFQIQFPL YTAYKHNTHP TIEDISTQES NILGAFCDMN DVEVPLHLLR61 YVCLFCGKNG LSLMKDCFEY GTPETLPFLI AHAFITVVSN IRIWLHIPAV MQHIIPFRTY121 VIRYLCKLSD QELRQSAARN MADLMWSTVK EPLDTTLCFD KESLDLAFKY FMSPTLTMRL181 AGLSQITNQL HTFNDVCNNE SLVSDTETSI AKELADWLIS NNVVEHIFGP NLHIEIIKQC241 QVILNFLAAE GRLSTQHIDC IWAAAQRKKS LEEQLHHLGH LQLVLKAVII AIHIKVEVVT301 EPSVHTEQTL YLASMLIKAL WNNALAAKAQ LSKQSSFASL LNTNIPIGNK KEEEELRRTA361 LKWMSNLLIE PNMCNNDFQT QKESMQGSSD ETANSGEDGS SGPGSSSGHS DGSSNEVNSS421 HASQSAGSPG SEVQSEDIAD IEALKEEDED DDHGHNPPKS SCGTDLRNRK LESQAGICLG481 DSQGTSERNG TSSGTGKDLV FNTESLPSVD NRMRMLDACS HSEDPEHDIS GEMNATHIAQ541 GSQESCITRT GDFLGETIGN ELFNCRQFIG PQHHHHHHHH HHHHDGHMVD DMLSADDVSC601 SSSQVSAKSE KNMADFDGEE SGCEEELVQI NSHAELTSHL QQHLPNLASI YHEHLSQGPV661 VHKHQFNSNA VTDINLDNVC KKGNTLLWDI VQDEDAVNLS EGLINEAEKL LCSLVCWFTD721 RQIRMRFIEG CLENLGNNRS VVISLRLLPK LFGTFQQFGS SYDTHWITMW AEKELNMMKL781 FFDNLVYYIQ TVREGRQKHA LYSHSAEVQV RLQFLTCVFS TLGSPDHFRL SLEQVDILWH841 CLVEDSECYD DALHWFLNQV RSKDQHAMGM ETYKHLFLEK MPQLKPETIS MTGLNLFQHL901 CNLARLATSA YDGCSNSELC GMDQFWGIAL RAQSGDVSRA AIQYINSYYI NGKTGLEKEQ961 EFISKCMESL MIASSSLEQE SHSSLMVIER GLLMLKTHLE AFRRRFAYHL RQWQIEGTGI1021 SSHLKALSDK QSLPLRVVCQ PAGLPDKMTI EMYPSDQVAD LRAEVTHWYE NLQKEQINQQ1081 AQLQEFGQSN RKGEFPGGLM GPVRMISSGH ELTTDYDEKA LHELGFKDMQ MVFVSLGAPR1141 RERKGEGVQL PASCLPPPQK DNIPMLLLLQ EPHLTTLFDL LEMLASFKPP SGKVAVDDSE1201 SLRCEELHLH AENLSRRVWE LLMLLPTCPN MLMAFQNISD EQSNDGFNWK ELLKIKSAHK1261 LLYALEIIEA LGKPNRRIRR ESTGSYSDLY PDSDDSSEDQ VENSKNSWSC KFVAAGGLQQ1321 LLEIFNSGIL EPKEQESWTV WQLDCLACLL KLICQFAVDP SDLDLAYHDV FAWSGIAESH1381 RKRTWPGKSR KAAGDHAKGL HIPRLTEVFL VLVQGTSLIQ RLMSVAYTYD NLAPRVLKAQ1441 SDHRSRHEVS HYSMWLLVSW AHCCSLVKSS LADSDHLQDW LKKLTLLIPE TAVRHESCSG1501 LYKLSLSGLD GGDSINRSFL LLAASTLLKF LPDAQALKPI RIDDYEEEPI LKPGCKEYFW1561 LLCKLVDNIH IKDASQTTLL DLDALARHLA DCIRSREILD HQDGNVEDDG LTGLLRLATS1621 VVKHKPPFKF SREGQEFLRD IFNLLFLLPS LKDRQQPKCK SHSSRAAAYD LLVEMVKGSV1681 ENYRLIHNWV MAQHMQSHAP YKWDYWPHED VRAECRFVGL TNLGATCYLA STIQQLYMIP1741 EARQAVFTAK YSEDMKHKTT LLELQKMFTY LMESECKAYN PRPFCKTYTM DKQPLNTGEQ1801 KDMTEFFTDL ITKIEEMSPE LKNTVKSLFG GVITNNVVSL DCEHVSQTAE EFYTVRCQVA1861 DMKNIYESLD EVTIKDTLEG DNMYTCSHCG KKVRAEKRAC FKKLPRILSF NTMRYTFNMV1921 TMMKEKVNTH FSFPLRLDMT PYTEDFLMGK SERKEGFKEV SDHSKDSESY EYDLIGVTVH1981 TGTADGGHYY SFIRDIVNPH AYKNNKWYLF NDAEVKPFDS AQLASECFGG EMTTKTYDSV2041 TDKFMDFSFE KTHSAYMLFY KRMEPEEENG REYKFDVSSE LLEWIWHDNM QFLQDKNIFE2101 HTYFGFMWQL CSCIPSTLPD PKAVSLMTAK LSTSFVLETF IHSKEKPTML QWIELLTKQF2161 NNSQAACEWF LDRMADDDWW PMQILIKCPN QIVRQMFQRL CIHVIQRLRP VHAHLYLQPG
2221 MEDGSDDMDT SVEDIGGRSC VTRFVRTLLL IMEHGVKPHS KHLTEYFAFL YEFAKMGEEE2281 SQFLLSLQAI STMVHFYMGT KGPENPQVEV LSEEEGEEEE EEEDILSLAE EKYRPAALEK2341 MIALVALLVE QSRSERHLTL SQTDMAALTG GKGFPFLFQH IRDGINIRQT CNLIFSLCRY2401 NNRLAEHIVS MLFTSIAKLT PEAANPFFKL LTMLMEFAGG PPGMPPFASY ILQRIWEVIE2461 YNPSQCLDWL AVQTPRNKLA HSWVLQNMEN WVERFLLAHN YPRVRTSAAY LLVSLIPSNS2521 FRQMFRSTRS LHIPTRDLPL SPDTTVVLHQ VYNVLLGLLS RAKLYVDAAV HGTTKLVPYF2581 SFMTYCLISK TEKLMFSTYF MDLWNLFQPK LSEPAIATNH NKQALLSFWY NVCADCPENI2641 RLIVQNPVVT KNIAFNYILA DHDDQDVVLF NRGMLPAYYG ILRLCCEQSP AFTRQLASHQ2701 NIQWAFKNLT PHASQYPGAV EELFNLMQLF IAQRPDMREE ELEDIKQFKK TTISCYLRCL2761 DGRSCWTTLI SAFRILLESD EDRLLVVFNR GLILMTESFN TLHMMYHEAT ACHVTGDLVE2821 LLSIFLSVLK STRPYLQRKD VKQALIQWQE RIEFAHKLLT LLNSYSPPEL RNACIDVLKE2881 LVLLSPHDFL HTLVPFLQHN HCTYHHSNIP MSLGPYFPCR ENIKLIGGKS NIRPPRPELN2941 MCLLPTMVET SKGKDDVYDR MLLDYFFSYH QFIHLLCRVA INCEKFTETL VKLSVLVAYE3001 GLPLHLALFP KLWTELCQTQ SAMSKNCIKL LCEDPVFAEY IKCILMDERT FLNNNIVYTF3061 MTHFLLKVQS QVFSEANCAN LISTLITNLI SQYQNLQSDF SNRVEISKAS ASLNGDLRAL3121 ALLLSVHTPK QLNPALIPTL QELLSKCRTC LQQRNSLQEQ EAKERKTKDD EGATPIKRRR3181 VSSDEEHTVD SCISDMKTET REVLTPTSTS DNETRDSSII DPGTEQDLPS PENSSVKEYR3241 MEVPSSFSED MSNIRSQHAE EQSNNGRYDD CKEFKDLHCS KDSTLAEEES EFPSTSISAV3301 LSDLADLRSC DGQALPSQDP EVALSLSCGH SRGLFSHMQQ HDILDTLCRT IESTIHVVTR3361 ISGKGNQAAS表1(b)-USP_N01新剪接变体-核苷酸序列1atgagaagga aaaactctta ctatgtgtgg caaaaaattt ttcaaattca gtttccctta61 tatactgctt acaagcataa tactcaccct actattgagg atatatcaac tcaagaaagt121 aacatattag gggcattctg tgatatgaat gatgtagaag taccattgca tttgcttcgt181 tatgtatgtt tgttttgtgg gaaaaatggc ctttctctca tgaaggattg ctttgaatat241 ggaactcctg aaactttgcc atttcttata gcacatgcgt ttattacagt tgtgtctaat301 attagaatat ggctacatat tcccgctgtc atgcagcaca ttataccttt taggacctat361 gttattaggt atttatgcaa gctctcggat caggagttac gacagagtgc agctcgtaac421 atggctgact taatgtggag cacagtcaaa gaaccattgg atacaacatt atgctttgat481 aaagaaagcc tagatcttgc atttaagtac tttatgtcac ctactttgac tatgaggttg541 gctggattga gtcagataac aaatcaactc cataccttca atgatgtgtg caataatgaa601 tcattagtat cggacacaga aacgtccatt gcaaaagaac ttgcagactg gcttattagc661 aacaatgtgg tggagcatat atttggacca aatttacata ttgagattat caaacagtgc721 caagtgattt tgaatttttt ggcagcagaa gggcgactga gtactcaaca tattgactgt781 atttgggctg cagcacagag gaagaagagc ttagaagaac agctccatca ccttggtcac841 ctgcagctag tcctcaaagc agtgataata gcgatacaca tcaaagtgga ggtagtgaca901 ttgaaatgga tgagcaactt attaatagaa ccaaacatgt gcaacaacga ctttcagaca961 cagaaggaat ccatgcaggg aagttctgac gaaactgcca acagtggtga agatggaagc1021 agtggtcctg gtagcagtag tgggcatagt gatggatcta gcaatgaggt taattctagc1081 cacgcaagcc agtcagctgg gagccctggc agtgaggtac agtcagaaga cattgcagat1141 attgaagccc tcaaagagga agatgaagac gatgatcatg gtcataatcc tcccaaaagc1201 agttgtggta cagatcttcg gaatagaaag ttagagagtc aagcaggcat ttgcctgggg1261 gactcccaag gcacgtcaga aagaaatggg acaagcagcg gaacaggaaa ggacctggtt
1321 tttaacactg aatcattgcc atcagtagat aatcgaatgc gaatgctgga tgcttgttca1381 cactctgaag acccagaaca tgatatttca ggggaaatga atgctactca tatagcacaa1441 gggtctcagg agtcttgtat cacacgaact ggggacttcc ttggggagac tattgggaat1501 gaattattta attgtcgaca atttattggt ccacagcatc accaccacca ccaccaccat1561 caccaccacc acgatgggca tatggttgat gatatgctaa gtgcagatga tgtcagttgt1621 agtagctccc aggttagtgc aaaatcagaa aaaaatatgg ctgattttga tggtgaagaa1681 tctggatgtg aagaggagct agttcagatt aattcacatg cggaactgac atctcacctc1741 caacaacatc ttcccaattt agcttccatt taccatgaac atcttagtca aggacctgta1801 gttcataaac atcaattcaa cagtaatgct gttacagaca ttaatttgga taatgtttgc1861 aagaaaggaa atactttgtt gtgggatata gtccaagatg aagatgcagt taatctttct1921 gaaggattaa taaatgaagc agagaaactt ctttgttcgt tagtatgttg gtttacagat1981 agacaaattc gaatgagatt cattgaaggt tgccttgaaa acttgggaaa caacagatca2041 gtagtaattt cacttcgtct tcttccaaaa ctatttggta cttttcagca gtttgggagc2101 agttacgata cacactggat aacaatgtgg gcagaaaaag aactgaacat gatgaagctt2161 ttctttgata atttggtata ctacattcaa actgtgagag aaggaagaca aaaacatgca2221 ctgtacagcc atagtgctga agttcaagtt cgtcttcaat tcttgacttg tgtattttca2281 actctgggat cacctgatca tttcaggtta agtttagagc aagttgacat cttatggcat2341 tgtttagtag aagattctga atgttatgat gatgcactcc attggttttt aaatcaagtt2401 cgaagtaaag atcaacatgc tatgggtatg gaaacctaca aacatctttt cctggagaag2461 atgccccagc taaaacctga aacaattagc atgactggct taaacctgtt tcagcatctc2521 tgtaacttgg ctcgattggc taccagtgcc tatgatggtt gttcaaattc tgagctgtgt2581 ggtatggacc aattttgggg cattgcttta agagcacaat ctggtgatgt cagtcgagca2641 gctatccagt atattaactc ctattatatt aatggtaaaa caggtttgga gaaggagcaa2701 gaatttatta gtaagtgcat ggagagtctt atgatagctt ctagcagtct tgaacaggaa2761 tcacactcaa gtctcatggt tatagaaaga ggactcctta tgctgaagac acatctggaa2821 gcgtttagga gaaggtttgc atatcatctg agacagtggc aaattgaagg cactggtatt2881 agtagtcatt tgaaagcact gagtgacaaa cagtctctgc cgctaagggt tgtatgccag2941 ccagctggac ttcctgacaa gatgactatt gaaatgtatc ctagtgacca ggtagcagat3001 cttagggctg aagtaactca ttggtatgaa aatttacaga aagaacaaat aaatcaacaa3061 gctcagcttc aggagtttgg tcaaagcaac cgaaaaggag agtttcctgg aggcctcatg3121 ggacctgtca ggatgatttc atctggacac gagttaacaa cagattatga tgaaaaagca3181 cttcatgagc ttggttttaa ggatatgcag atggtatttg tatctttggg tgcaccaagg3241 agagagcgga aaggggaagg tgttcagctg ccagcatctt gcctcccacc ccctcagaag3301 gacaacattc caatgctttt gcttttacaa gagcctcatt taactactct ttttgattta3361 ttagagatgc ttgcatcatt taaaccaccc tcaggaaaag tggcagtgga tgatagtgag3421 agcttacgat gtgaagaact tcatcttcat gcagaaaatc tgtctaggcg ggtctgggag3481 ctactgatgc ttcttcctac atgtcctaat atgttgatgg cattccagaa tatctcagat3541 gagcagagta atgatggatt taattggaaa gaacttctca aaattaagag cgcccacaag3601 ctattgtatg ctctggaaat tattgaagca ctgggaaaac ctaatagaag aataaggagg3661 gagtctacgg gaagttacag tgatctttat ccagattcag atgattcaag tgaggatcaa3721 gtggaaaata gtaaaaattc ctggagttgc aagtttgttg ctgctggagg gcttcaacag3781 ttattagaaa tttttaattc tggaattcta gagcctaaag agcaggaatc atggactgtg3841 tggcagctag actgtcttgc ttgcttgctg aagttaatat gccagtttgc agtagatcca3901 tccgatttgg atttagctta tcatgatgtc tttgcctggt ctggtatagc ggaaagccat3961 aggaaaagaa cctggcctgg caaatcaagg aaggctgctg gtgatcatgc taagggtctt
4021 catataccac gattaacaga ggtatttctt gttcttgtcc aaggaaccag tttgattcag4081 cgacttatgt ctgttgctta tacgtatgat aatctggctc ctagagtttt aaaagctcag4141 tctgatcaca ggtctagaca tgaagtttca cattattcaa tgtggctctt ggtgagttgg4201 gctcattgct gttctttagt gaaatctagc cttgctgata gcgatcattt acaagattgg4261 ctaaagaaat tgactctcct tattcctgag actgcagttc gtcatgaatc atgcagtggt4321 ctctataagt tatccctgtc agggctggat ggaggagact caatcaatcg ttcttttctg4381 ctattggctg cctcaacatt attgaaattt cttcctgatg ctcaagcact caaacctatt4441 aggatagatg attatgagga agaaccaata ttaaaaccag gatgtaaaga gtatttttgg4501 ttgttatgca aattagttga caacatacat ataaaggacg ctagtcagac aacgctcctc4561 gacttagatg ccttggcaag acatttggct gactgtattc gaagtaggga gatccttgat4621 catcaggatg gtaatgtaga agatgatggg cttacaggac tcctaaggct tgcaacaagt4681 gttgttaaac acaaaccacc ctttaaattt tcaagggaag gacaggaatt tttgagagat4741 atcttcaatc tcctgttttt gttgccaagt ctaaaggacc gacaacagcc aaagtgcaaa4801 tcacattctt caagagctgc cgcttacgat ttgttagtag agatggtaaa ggggtctgtt4861 gagaactaca ggctaataca caactgggtt atggcacaac acatgcagtc ccatgcacct4921 tataaatggg attactggcc tcatgaagat gtccgtgctg aatgtagatt tgttggcctt4981 actaaccttg gagctacttg ttacttagct tctactattc agcaacttta tatgatacct5041 gaggcaagac aggctgtctt cactgccaag tattcagagg atatgaagca caagaccact5101 cttctggagc ttcagaaaat gtttacatat ttaatggaga gtgaatgcaa agcatataat5161 cctagacctt tctgtaaaac atacaccatg gataagcagc ctctgaatac tggggaacag5221 aaagatatga cagagttttt tactgatcta attaccaaaa tcgaagaaat gtctcccgaa5281 ctgaaaaata ccgtcaaaag tttatttgga ggtgtaatta caaacaatgt tgtatccttg5341 gattgtgaac atgttagtca aactgctgaa gagttttata ctgtgaggtg ccaagtggct5401 gatatgaaga acatttatga atctcttgat gaagttacta taaaagacac tttggaaggt5461 gataacatgt atacttgttc tcattgtggg aagaaagtac gagctgaaaa aagggcatgt5521 tttaagaaat tgcctcgcat tttgagtttc aatactatga gatacacatt taatatggtc5581 acgatgatga aagagaaagt gaatacacac ttttccttcc cattacgttt ggacatgacg5641 ccctatacag aagattttct tatgggaaag agtgagagga aagaaggttt taaagaagtc5701 agtgatcatt caaaagactc agagagctat gaatatgact tgataggagt gactgttcac5761 acaggaacgg cagatggtgg acactattat agctttatca gagatatagt aaatccccat5821 gcttataaaa acaataaatg gtatcttttt aatgatgctg aggtaaaacc ttttgattct5881 gctcaacttg catctgaatg ttttggtgga gagatgacga ccaagaccta tgattctgtt5941 acagataaat ttatggactt ctcttttgaa aagacacaca gtgcatatat gctgttttac6001 aaacgcatgg aaccagagga agaaaatggc agagaataca aatttgatgt ttcgtcagag6061 ttactagagt ggatttggca tgataacatg cagtttcttc aagacaaaaa catttttgaa6121 catacatatt ttggatttat gtggcaattg tgtagttgta ttcccagtac attaccagat6181 cctaaagctg tgtccttaat gacagcaaag ttaagcactt cctttgtcct agagacattt6241 attcattcta aagaaaagcc cacgatgctt cagtggattg aactgttgac gaaacagttt6301 aataatagtc aggcagcttg tgagtggttt ttagatcgta tggctgatga cgactggtgg6361 ccaatgcaga tactaattaa gtgccctaat caaattgtga gacagatgtt tcagcgtttg6421 tgtatccatg tgattcagag gctgagacct gtgcatgctc atctctattt gcagccagga6481 atggaagatg ggtcagatga tatggatacc tcagtagaag atattggtgg tcgttcatgt6541 gtcactcgct ttgtgagaac cctgttatta attatggaac atggtgtaaa acctcacagt6601 aaacatctta cagagtattt tgccttcctt tacgaatttg caaaaatggg tgaagaagag6661 agccaatttt tgctttcatt gcaagctata tctacaatgg tacattttta catgggaaca
6721 aaaggacctg aaaatcctca agttgaagtg ttatcagagg aagaagggga agaagaagag6781 gaggaagaag atatcctctc tctggcagaa gaaaaataca ggccagctgc ccttgaaaag6841 atgatagctt tagttgctct tttggttgaa cagtctcgat cagaaaggca tttgacatta6901 tcacagactg acatggcagc attaacagga ggaaagggat ttcccttctt gtttcaacat6961 attcgtgatg gcatcaatat aagacaaact tgtaatctga ttttcagcct gtgtcgatac7021 aataatcgac ttgcagaaca tattgtatct atgcttttca catcaatagc aaagttgact7081 cctgaggcag ccaatccttt ctttaagttg ttgactatgc taatggagtt tgctggtgga7141 cctccaggaa tgcctccctt tgcatcttat attctgcaga ggatatggga ggtgattgaa7201 tacaatcctt ctcagtgtct agattggttg gcagtgcaga caccccgaaa taaactggca7261 cacagctggg tcttacagaa tatggaaaac tgggtcgagc ggtttctttt ggctcacaat7321 tatcctagag tgaggacttc tgcagcttat cttctggtgt cccttatacc aagcaattca7381 ttccgtcaga tgttccggtc aacaaggtct ttgcacatcc caacccgtga ccttccactc7441 agtccagaca caacagtagt cctacatcag gtctacaacg tgctccttgg tttgctctca7501 agagccaaac tttatgttga tgctgctgtt catggcacta caaagctagt gccctatttt7561 agctttatga cttactgttt aatttccaaa actgagaagc tgatgttttc cacatatttc7621 atggatttgt ggaacctttt ccagcctaaa ctttctgagc cagcaatagc tacaaatcac7681 aataaacagg ctttgctttc attttggtac aatgtctgtg ctgactgtcc agagaatatc7741 cgccttattg ttcagaaccc agtggtaacc aagaacattg ccttcaatta catccttgct7801 gaccatgatg atcaggatgt ggtgcttttt aaccgtggga tgctgccagc gtactatggc7861 attctgaggc tctgctgtga gcagtctcct gcattcacac gacaactggc ttctcaccag7921 aacatccagt gggcctttaa gaatcttaca ccacatgcca gccaataccc tggagcagta7981 gaagaactgt ttaacctgat gcagctgttt atagctcaga ggccagatat gagagaagaa8041 gaattagaag atattaaaca gttcaagaaa acaaccataa gttgttactt acgttgctta8101 gatggccgct cctgctggac tactttaata agtgccttca gaatactatt agaatctgat8161 gaagacagac ttcttgttgt atttaatcga ggattgattc taatgacaga gtctttcaac8221 actttgcaca tgatgtatca cgaagctaca gcttgccatg tgactggaga tttagtagaa8281 cttctgtcaa tatttctttc ggttttgaag tctacacgcc cttatcttca gagaaaagat8341 gtgaaacaag cattaatcca gtggcaggag cgaattgaat ttgcccataa actgttaact8401 cttcttaatt cctatagtcc tccagaactt agaaatgcct gtatagatgt cctcaaggaa8461 cttgtacttt tgagtcccca tgattttctt catactctgg ttccctttct acaacacaac8521 cattgtactt accatcacag taatatacca atgtctcttg gaccttattt cccttgtcga8581 gaaaatatca agctaatagg agggaaaagc aatattcggc ctccgcgccc tgaactcaat8641 atgtgcctct tgcccacaat ggtggaaacc agtaagggca aagatgacgt ttatgatcgt8701 atgctgctag actacttctt ttcttatcat cagttcatcc atctattatg ccgagttgca8761 atcaactgtg aaaaatttac tgaaacatta gttaagctga gtgtcctagt tgcctatgaa8821 ggtttgccac ttcatcttgc actgttcccc aaactttgga ctgagctatg ccagactcag8881 tctgctatgt caaaaaactg catcaagctt ttgtgtgaag atcctgtttt cgcagaatat8941 attaaatgta tcctaatgga tgaaagaact tttttaaaca acaacattgt ctacacgttc9001 atgacacatt tccttctaaa ggttcaaagt caagtgtttt ctgaagcaaa ctgtgccaat9061 ttgatcagca ctcttattac aaacttgata agccagtatc agaacctaca gtctgatttc9121 tccaaccgag ttgaaatttc caaagcaagt gcttctttaa atggggacct gagggcactc9181 gctttgctcc tgtcagtaca cactcccaaa cagttaaacc cagctctaat tccaactctg9241 caagagcttt taagcaaatg caggacttgt ctgcaacaga gaaactcact ccaagagcaa9301 gaagccaaag aaagaaaaac taaagatgat gaaggagcaa ctcccattaa aaggcggcgt9361 gttagcagtg atgaggagca cactgtagac agctgcatca gtgacatgaa aacagaaacc
9421 agggaggtcc tgaccccaac gagcacttct gacaatgaga ccagagactc ctcaattatt9481 gatccaggaa ctgagcaaga tcttccttcc cctgaaaata gttctgttaa agaataccga9541 atggaagttc catcttcgtt ttcagaagac atgtcaaata tcaggtcaca gcatgcagaa9601 gaacagtcca acaatggtag atatgacgat tgtaaagaat ttaaagacct ccactgttcc9661 aaggattcta ccctagctga ggaagaatct gagttccctt ctacttctat ctctgcagtt9721 ctgtctgact tagctgactt gagaagctgt gatggccaag ctttgccctc ccaggaccct9781 gaggttgctt tatctctcag ttgtggccat tccagaggac tctttagtca tatgcagcaa9841 catgacattt tagataccct gtgtaggacc attgaatcta caatccatgt cgtcacaagg9901 atatctggca aaggaaacca agctgcttct tga表1(c)-USP_N01参考序列(Derwent AAU82706)氨基酸序列1mcencadlve vlneisdveg gdglqlrkeh tlkiftyins wtqrqclccf keykhleifn61 qvvcalinlv iaqvqvlrdq lckhcttini dstwqdesnq aeeplnidre cnegsterqk121 siekksnstr icnlteeess kssdpfslws tdekeklllc vakifqiqfp lytaykhnth181 ptiedistqe snilgafcdm ndvevplhll ryvclfcgkn glslmkdcfe ygtpetlpfl241 iahafitvvs niriwlhipa vmqhiipfrt yvirylckls dqelrqsaar nmadlmwstv301 kepldttlcf dkesldlafk yfmsptltmr laglsqitnq lhtfndvcnn eslvsdtets361 iakeladwli snnvvehifg pnlhieiikq cqvilnflaa egrlstqhid ciwaaaqlkh421 csryihdlfp sliknldpvp lrhllnlvsa lepsvhteqt lylasmlika lwnnalaaka481 qlskqssfas llntnipign kkeeeelrrt apspwspaas pqssdnsdth qsggsdiemd541 eqlinrtkhv qqrlsdtees mqgssdetan sgedgssgpg sssghsdgss nevnsshasq601 sagspgsevq sediadieal keededddhg hnppksscgt dlrnrklesq agiclgdsqg661 tserngtssg tgkdlvfnte slpsvdnrmr mldacshsed pehdisgemn athiaqgsqe721 scitrtgdfl getignelfn crqfigpqhh hhhhhhhhhh dghmvddmls addvscsssq781 vsakseknma dfdgeesgce eelvqinsha eltshlqqhl pnlasiyheh lsqgpvvhkh841 qfnsnavtdi nldnvckkgn tllwdivqde davnlsegli neaekllcsl vcwftdrqir901 mrfiegclen lgnnrsvvis lrllpklfgt fqqfgssydt hwitmwaeke lnmmklffdn961 lvyyiqtvre grqkhalysh saevqvrlqf ltcvfstlgs pdhfrlsleq vdilwhclve1021 dsecyddalh wflnqvrskd qhamgmetyk hlflekmpql kpetismtgl nlfqhlcnla1081 rlatsaydgc snselcgmdq fwgialraqs gdvsraaiqy insyyingkt glekeqefis1141 kcmeslmias ssleqeshss lmviergllm lkthleafrr rfayhlrqwq iegtgisshl1201 kalsdkqslp lrvvcqpagl pdkmtiemyp sdqvadlrae vthwyenlqk eqinqqaqlq1261 efgqsnrkge fPgglmgpvr missgheltt dydekalhel gfkdmqmvfv slgaprrerk1321 gegvqlpasc lpppqkdnip mllllqephl ttlfdlleml asfkppsgkv avddseslrc1381 eelhlhaenl srrvwellml lptcpnmlma fqnisdeqsf kaqsdhrsrh evshysmwll1441 vswahccslv kssladsdhl qdwlkkltll ipetavrhes csglyklsls gldggdsinr1501 sflllaastl lkflpdaqal kpiriddyee epilkpgcke yfwllcklvd nihikdasqt1561 tlldldalar hladcirsre ildhqdgnve ddgltgllrl atsvvkhkpp fkfsregqef1621 lrdifnllfl lpslkdrqqp kckshssraa aydllvemvk gsvenyrlih nwvmaqhmqs1681 hapykwdywp hedvraecrf vgltnlgatc ylastiqqly mipearqavf takysedmkh1741 kttllelqkm ftylmeseck aynprpfckt ytmdkqplnt geqkdmteff tdlitkieem1801 spelkntvks lfggvitnnv vsldcehvsq taeefytvrc qvadmkniye sldevtikdt
1861 legdnmytcs qcgkkvraek racfkklpri xsfntmrytf nmvtmmkekv nthfsfplrl1921 dmtpytedfl mgkserkegf kevsdhskds esyeydligv tvhtgtadgg hyysfirdiv1981 nphayknnkw ylfndaevkp fdsaqlasec fgqemttkty dsvtdkfmdf sfekthsaym2041 lfykrmepee engreykfdv ssellewiwh dnmqflqdkn ifehtyfgfm wqlcscipst2101 lpdpkavslm taklstsfvl etfihskekp tmlqwiellt kqfnnsqaac ewfldrmadd2161 dwwpmqilik cpnqivrqmf qrlcihviqr lrpvhahlyl qpgmedgsdd mdtsvedigg2221 rscvtrfvrt lllimehgvk phskhlteyf aflyefakmg eeesqfllsl qaistmvhfy2281 mgtkgpenpq vevlseeegg eeeeeedils laeekyrpaa lekmialval lveqsrserh2341 ltlsqtdmaa ltggkgfpfl fqhirdgini rqtcnlifsl crynnrlaeh ivsmlftsia2401 kltpeaanpf fklltmlmef aggppgmppf asyilqriwe vieynpsqcl dwlavqtprn2461 klahswvlqn menwverfll ahnyprvrts aayllvslip snsfrqmfrs trslhiptrd2521 lplspdttvv lhqvynvllg llsraklyvd aavhgttklv pyfsfmtycl iskteklmfs2581 tyfmdlwnlf qpklsepaia tnhnkqalls fwynvcadcp enirlivqnp vvtkniafny2641 iladhddqdv vlfnrgmlpa yygilrlcce qspaftrqla shqniqwafk nltphasqyp2701 gaveelfnlm qlfiaqrpdm reeeledikq fkkttiscyl rcldgrscwt tlisafrill2761 esdedrllvv fnrglilmte sfntlhmmyh eatachvtgd lvellsifls vlkstrpylq2821 rkdvkqaliq wqeriefahk lltllnsysp pelrnacidv lkelvllsph dflhtlvpfl2881 qhnhctyhhs nipmslgpyf pcreniklig gksnirpprp elnmcllptm vetskgkddv2941 ydrmlldyff syhqfihllc rvaincekft etlvklsvlv ayeglplhla lfpklwtelc3001 qtqsamsknc ikllcedpvf aeyikcilmd ertflnnniv ytfmthfllk vqsqvfsean3061 canlistlit nlisqyqnlq sdfsnrveis kasaslngdl ralalllsvh tpkqlnpali3121 ptlqellskc rtclqqrnsl qeqeakerkt kddegatpik rrrvssdeeh tvdscisdmk3181 tetrevltpt stsdnetrds siidpgteqd lpspenssvk eyrmevpssf sedmsnirsq3241 haeeqsnngr yddckefkdl hcskdstlas eesefpstsi savlsdladl rscdgqalps3301 qdpevalsls cghsrglfsh mqqhdildtl crtiestihv vtrisgkgnq aas表1(d)-USP_N01参考序列(Derwent AAU82706)核苷酸序列atgtgcgaga actgcgcaga cctggtggag gtgttaaatg aaatatcaga tgtagaaggt60ggtgatggac tgcagctcag aaaggaacat actctcaaaa tatttactta catcaattcc120tggacacaga ggcaatgtct atgctgcttc aaggaatata agcatttgga gatttttaat180caagtagtgt gtgcacttat taacttagtg attgcccaag ttcaagtgct ccgggaccag240ctttgtaaac attgtactac cattaacata gattccacgt ggcaagatga gagtaatcaa300gcagaagaac cactgaatat agatagagag tgtaatgaag gaagtacaga aagacaaaaa360tcaatagaaa aaaaatcaaa ctctacaaga atttgtaatc tgactgagga ggaatcttca420aagagttctg atccttttag tttatggagt acagatgaga aggaaaaact cttactatgt480gtggcaaaaa tttttcaaat tcagtttccc ttatatactg cttacaagca taatactcac540cctactattg aggatatatc aactcaagaa agtaacatat taggggcatt ctgtgatatg600aatgatgtag aagtaccatt gcatttgctt cgttatgtat gtttgttttg tgggaaaaat660ggcctttctc tcatgaagga ttgctttgaa tatggaactc ctgaaacttt gccatttctt720atagcacatg cgtttattac agttgtgtct aatattagaa tatggctaca tattcccgct780gtcatgcagc acattatacc ttttaggacc tatgttatta ggtatttatg caagctctcg840gatcaggagt tacgacagag tgcagctcgt aacatggctg acttaatgtg gagcacagtc900aaagaaccat tggatacaac attatgcttt gataaagaaa gcctagatct tgcatttaag960tactttatgt cacctacttt gactatgagg ttggctggat tgagtcagat aacaaatcaa1020ctccatacct tcaatgatgt gtgcaataat gaatcattag tatcggacac agaaacgtcc1080attgcaaaag aacttgcaga ctggcttatt agcaacaatg tggtggagca tatatttgga1140ccaaatttac atattgagat tatcaaacag tgccaagtga ttttgaattt tttggcagca1200gaagggcgac tgagtactca acatattgac tgtatttggg ctgcagcaca gttgaaacat1260tgtagtcggt atatacatga cttatttcct tcactcatca agaatttgga tcccgtacca1320cttagacatc tacttaatct ggtctcagct cttgagccaa gtgttcatac tgaacagaca1380ctgtacttgg catccatgtt aattaaagca ctgtggaata acgcactagc agctaaggct1440cagttatcta aacagagttc ttttgcatct ttattaaata ctaatattcc cattggaaat1500aagaaagagg aagaagagct tagaagaaca gctccatcac cttggtcacc tgcagctagt1560cctcaaagca gtgataatag cgatacacat caaagtggag gtagtgacat tgaaatggat1620
gagcaactta ttaatagaac caaacatgtg caacaacgac tttcagacac agaggaatcc1680atgcagggaa gttctgacga aactgccaac agtggtgaag atggaagcag tggtcctggt1740agcagtagtg ggcatagtga tggatctagc aatgaggtta attctagcca cgcaagccag1800tcagctggga gccctggcag tgaggtacag tcagaagaca ttgcagatat tgaagccctc1860aaagaggaag atgaagacga tgatcatggt cataatcctc ccaaaagcag ttgtggtaca1920gatcttcgga atagaaagtt agagagtcaa gcaggcattt gcctggggga ctcccaaggc1980acgtcagaaa gaaatgggac aagcagcgga acaggaaagg acctggtttt taacactgaa2040tcattgccat cagtagataa tcgaatgcga atgctggatg cttgttcaca ctctgaagac2100ccagaacatg atatttcagg ggaaatgaat gctactcata tagcacaagg gtctcaggag2160tcttgtatca cacgaactgg ggacttcctt ggggagacta ttgggaatga attatttaat2220tgtcgacaat ttattggtcc acagcatcac caccaccacc accaccatca ccaccaccac2280gatgggcata tggttgatga tatgctaagt gcagatgatg tcagttgtag tagctcccag2340gttagtgcaa aatcagaaaa aaatatggct gattttgatg gtgaagaatc tggatgtgaa2400gaggagctag ttcagattaa ttcacatgcg gaactgacat ctcacctcca acaacatctt2460cccaatttag cttccattta ccatgaacat cttagtcaag gacctgtagt tcataaacat2520caattcaaca gtaatgctgt tacagacatt aatttggata atgtttgcaa gaaaggaaat2580actttgttgt gggatatagt ccaagatgaa gatgcagtta atctttctga aggattaata2640aatgaagcag agaaacttct ttgttcgtta gtatgttggt ttacagatag acaaattcga2700atgagattca ttgaaggttg ccttgaaaac ttgggaaaca acagatcagt agtaatttca2760cttcgtcttc ttccaaaact atttggtact tttcagcagt ttgggagcag ttacgataca2820cactggataa caatgtgggc agaaaaagaa ctgaacatga tgaagctttt ctttgataat2880ttggtatact acattcaaac tgtgagagaa ggaagacaaa aacatgcact gtacagccat2940agtgctgaag ttcaagttcg tcttcaattc ttgacttgtg tattttcaac tctgggatca3000cctgatcatt tcaggttaag tttagagcaa gttgacatct tatggcattg tttagtagaa3060gattctgaat gttatgatga tgcactccat tggtttttaa atcaagttcg aagtaaagat3120caacatgcta tgggtatgga aacctacaaa catcttttcc tggagaagat gccccagcta3180aaacctgaaa caattagcat gactggctta aacctgtttt cagcatctct gtaacttggc3240tcgattggct accagtgcct atgatggttg ttcaaattct gagctgtgtg gtatggacca3300attttggggc attgctttaa gagcacaatc tggtgatgtc agtcgagcag ctatccagta3360tattaactcc tattatatta atggtaaaac aggtttggag aaggagcaag aatttattag3420taagtgcatg gagagtctta tgatagcttc tagcagtctt gaacaggaat cacactcaag3480tctcatggtt atagaaagag gactccttat gctgaagaca catctggaag cgtttaggag3540aaggtttgca tatcatctga gacagtggca aattgaaggc actggtatta gtagtcattt3600gaaagcactg agtgacaaac agtctctgcc gctaagggtt gtatgccagc cagctggact3660tcctgacaag atgactattg aaatgtatcc tagtgaccag gtagcagatc ttagggctga3720agtaactcat tggtatgaaa atttacagaa agaacaaata aatcaacaag ctcagcttca3780ggagtttggt caaagcaacc gaaaaggaga gtttcctgga ggcctcatgg gacctgtcag3840gatgatttca tctggacacg agttaacaac agattatgat gaaaaagcac ttcatgagct3900tggttttaag gatatgcaga tggtatttgt atctttgggt gcaccaagga gagagcggaa3960aggggaaggt gttcagctgc cagcatcttg cctcccaccc cctcagaagg acaacattcc4020aatgcttttg cttttacaag agcctcattt aactactctt tttgatttat tagagatgct4080tgcatcattt aaaccaccct caggaaaagt ggcagtggat gatagtgaga gcttacgatg4140tgaagaactt catcttcatg cagaaaatct gtctaggcgg gtctgggagc tactgatgct4200tcttcctaca tgtcctaata tgttgatggc attccagaat atctcagatg agcagagttt4260taaagctcag tctgatcaca ggtctagaca tgaagtttca cattattcaa tgtggctctt4320ggtgagttgg gctcattgct gttctttagt gaaatctagc cttgctgata gcgatcattt4380acaagattgg ctaaagaaat tgactctcct tattcctgag actgcagttc gtcatgaatc4440atgcagtggt ctctataagt tatccctgtc agggctggat ggaggagact caatcaatcg4500ttcttttctg ctattggctg cctcaacatt attgaaattt cttcctgatg ctcaagcact4560caaacctatt aggatagatg attatgagga agaaccaata ttaaaaccag gatgtaaaga4620gtatttttgg ttgttatgca aattagttga caacatacat ataaaggacg ctagtcagac4680aacgctcctc gacttagatg ccttggcaag acatttggct gactgtattc gaagtaggga4740gatccttgat catcaggatg gtaatgtaga agatgatggg cttacaggac tcctaaggct4800tgcaacaagt gttgttaaac acaaaccacc ctttaaattt tcaagggaag gacaggaatt4860tttgagagat atcttcaatc tcctgttttt gttgccaagt ctaaaggacc gacaacagcc4920aaagtgcaaa tcacattctt caagagctgc cgcttacgat ttgttagtag agatggtaaa4980ggggtctgtt gagaactaca ggctaataca caactgggtt atggcacaac acatgcagtc5040ccatgcacct tataaatggg attactggcc tcatgaagat gtccgtgctg aatgtagatt5100tgttggcctt actaaccttg gagctacttg ttacttagct tctactattc agcaacttta5160tatgatacct gaggcaagac aggctgtctt cactgccaag tattcagagg atatgaagca5220caagaccact cttctggagc ttcagaaaat gtttacatat ttaatggaga gtgaatgcaa5280agcatataat cctagacctt tctgtaaaac atacaccatg gataagcagc ctctgaatac5340tggggaacag aaagatatga cagagttttt tactgatcta attaccaaaa tcgaagaaat5400gtctcccgaa ctgaaaaata ccgtcaaaag tttatttgga ggtgtaatta caaacaatgt5460tgtatccttg gattgtgaac atgttagtca aactgctgaa gagttttata ctgtgaggtg5520ccaagtggct gatatgaaga acatttatga atctcttgat gaagttacta taaaagacac5580tttggaaggt gataacatgt atacttgttc tcaatgtggg aagaaagtac gagctgaaaa5640aagggcatgt tttaagaaat tgcctcgcat tttnagtttc aatactatga gatacacatt5700taatatggtc acgatgatga aagagaaagt gaatacacac ttttccttcc cattacgttt5760ggacatgacg ccctatacag aagattttct tatgggaaag agtgagagga aagaaggttt5820taaagaagtc agtgatcatt caaaagactc agagagctat gaatatgact tgataggagt5880gactgttcac acaggaacgg cagatggtgg acactattat agctttatca gagatatagt5940aaatccccat gcttataaaa acaataaatg gtatcttttt aatgatgctg aggtaaaacc6000ttttgattct gctcaacttg catctgaatg ttttggtgga gagatgacga ccaagaccta6060tgattctgtt acagataaat ttatggactt ctcttttgaa aagacacaca gtgcatatat6120gctgttttac aaacgcatgg aaccagagga agaaaatggc agagaataca aatttgatgt6180ttcgtcagag ttactagagt ggatttggca tgataacatg cagtttcttc aagacaaaaa6240catttttgaa catacatatt ttggatttat gtggcaattg tgtagttgta ttcccagtac6300
attaccagat cctaaagctg tgtccttaat gacagcaaag ttaagcactt cctttgtcct6360agagacattt attcattcta aagaaaagcc cacgatgctt cagtggattg aactgttgac6420gaaacagttt aataatagtc aggcagcttg tgagtggttt ttagatcgta tggctgatga6480cgactggtgg ccaatgcaga tactaattaa gtgccctaat caaattgtga gacagatgtt6540tcagcgtttg tgtatccatg tgattcagag gctgagacct gtgcatgctc atctctattt6600gcagccagga atggaagatg ggtcagatga tatggatacc tcagtagaag atattggtgg6660tcgttcatgt gtcactcgct ttgtgagaac cctgttatta attatggaac atggtgtaaa6720acctcacagt aaacatctta cagagtattt tgccttcctt tacgaatttg caaaaatggg6780tgaagaagag agccaatttt tgctttcatt gcaagctata tctacaatgg tacattttta6840catgggaaca aaaggacctg aaaatcctca agttgaagtg ttatcagagg aagaaggggg6900agaagaagag gaggaagaag atatcctctc tctggcagaa gaaaaataca ggccagctgc6960ccttgaaaag atgatagctt tagttgctct tttggttgaa cagtctcgat cagaaaggca7020tttgacatta tcacagactg acatggcagc attaacagga ggaaagggat ttcccttctt7080gtttcaacat attcgtgatg gcatcaatat aagacaaact tgtaatctga ttttcagcct7140gtgtcgatac aataatcgac ttgcagaaca tattgtatct atgcttttca catcaatagc7200aaagttgact cctgaggcag ccaatccttt ctttaagttg ttgactatgc taatggagtt7260tgctggtgga cctccaggaa tgcctccctt tgcatcttat attctgcaga ggatatggga7320ggtgattgaa tacaatcctt ctcagtgtct agattggttg gcagtgcaga caccccgaaa7380taaactggca cacagctggg tcttacagaa tatggaaaac tgggtcgagc ggtttctttt7440ggctcacaat tatcctagag tgaggacttc tgcagcttat cttctggtgt cccttatacc7500aagcaattca ttccgtcaga tgttccggtc aacaaggtct ttgcacatcc caacccgtga7560ccttccactc agtccagaca caacagtagt cctacatcag gtctacaacg tgctccttgg7620tttgctctca agagccaaac tttatgttga tgctgctgtt catggcacta caaagctagt7680gccctatttt agctttatga cttactgttt aatttccaaa actgagaagc tgatgttttc7740cacatatttc atggatttgt ggaacctttt ccagcctaaa ctttctgagc cagcaatagc7800tacaaatcac aataaacagg ctttgctttc attttggtac aatgtctgtg ctgactgtcc7860agagaatatc cgccttattg ttcagaaccc agtggtaacc aagaacattg ccttcaatta7920catccttgct gaccatgatg atcaggatgt ggtgcttttt aaccgtggga tgctgccagc7980gtactatggc attctgaggc tctgctgtga gcagtctcct gcattcacac gacaactggc8040ttctcaccag aacatccagt gggcctttaa gaatcttaca ccacatgcca gccaataccc8100tggagcagta gaagaactgt ttaacctgat gcagctgttt atagctcaga ggccagatat8160gagagaagaa gaattagaag atattaaaca gttcaagaaa acaaccataa gttgttactt8220acgttgctta gatggccgct cctgctggac tactttaata agtgccttca gaatactatt8280agaatctgat gaagacagac ttcttgttgt atttaatcga ggattgattc taatgacaga8340gtctttcaac actttgcaca tgatgtatca cgaagctaca gcttgccatg tgactggaga8400tttagtagaa cttctgtcaa tatttctttc ggttttgaag tctacacgcc cttatcttca8460gagaaaagat gtgaaacaag cattaatcca gtggcaggag cgaattgaat ttgcccataa8520actgttaact cttcttaatt cctatagtcc tccagaactt agaaatgcct gtatagatgt8580cctcaaggaa cttgtacttt tgagtcccca tgattttctt catactctgg ttccctttct8640acaacacaac cattgtactt accatcacag taatatacca atgtctcttg gaccttattt8700cccttgtcga gaaaatatca agctaatagg agggaaaagc aatattcggc ctccgcgccc8760tgaactcaat atgtgcctct tgcccacaat ggtggaaacc agtaagggca aagatgacgt8820ttatgatcgt atgctgctag actacttctt ttcttatcat cagttcatcc atctattatg8880ccgagttgca atcaactgtg aaaaatttac tgaaacatta gttaagctga gtgtcctagt8940tgcctatgaa ggtttgccac ttcatcttgc actgttcccc aaactttgga ctgagctatg9000ccagactcag tctgctatgt caaaaaactg catcaagctt ttgtgtgaag atcctgtttt9060cgcagaatat attaaatgta tcctaatgga tgaaagaact tttttaaaca acaacattgt9120ctacacgttc atgacacatt tccttctaaa ggttcaaagt caagtgtttt ctgaagcaaa9180ctgtgccaat ttgatcagca ctcttattac aaacttgata agccagtatc agaacctaca9240gtctgatttc tccaaccgag ttgaaatttc caaagcaagt gcttctttaa atggggacct9300gagggcactc gctttgctcc tgtcagtaca cactcccaaa cagttaaacc cagctctaat9360tccaactctg caagagcttt taagcaaatg caggacttgt ctgcaacaga gaaactcact9420ccaagagcaa gaagccaaag aaagaaaaac taaagatgat gaaggagcaa ctcccattaa9480aaggcggcgt gttagcagtg atgaggagca cactgtagac agctgcatca gtgacatgaa9540aacagaaacc agggaggtcc tgaccccaac gagcacttct gacaatgaga ccagagactc9600ctcaattatt gatccaggaa ctgagcaaga tcttccttcc cctgaaaata gttctgttaa9660agaataccga atggaagttc catcttcgtt ttcagaagac atgtcaaata tcaggtcaca9720gcatgcagaa gaacagtcca acaatggtag atatgacgat tgtaaagaat ttaaagacct9780ccactgttcc aaggattcta ccctagctga ggaagaatct gagttccctt ctacttctat9840ctctgcagtt ctgtctgact tagctgactt gagaagctgt gatggccaag ctttgccctc9900ccaggaccct gaggttgctt tatctctcag ttgtggccat tccagaggac tctttagtca9960tatgcagcaa catgacattt tagataccct gtgtaggacc attgaatcta caatccatgt10020cgtcacaagg atatctggca aaggaaacca agctgcttct tga 10063表2(a)USP_N07新剪接变体-氨基酸序列基因座USP_N07 1355aaPRT登录号NP_060414GeneSeq AAU82714来源人以1个插入表征的剪接形式P0s 14-Pos 811MVPGEENQLV PKEIENAAEE PRVLCIIQDT TNSKTVNERI TLNLPASTPV RKLFEDVANK61 VGYINGTFDL VWGNGINTAD MAPLDHTSDK SLLDANFEPG KKNFLHLTDK DGEQPQILLE121 DSSAGEDSVH DRFIGPLPRE GSVGSTSDYV SQSYSYSSIL NKSETGYVGL VNQAMTCYLN181 SLLQTLFMTP EFRNALYKWE FEESEEDPVT SIPYQLQRLF VLLQTSKKRA IETTDVTRSF241 GWDSSEAWQQ HDVQELCRVM FDALEQKWKQ TEQADLINEL YQGKLKDYVR CLECGYEGWR301 IDTYLDIPLV IRPYGSSQAF ASVEEALHAF IQPEILDGPN QYFCERCKKK CDARKGLRFL361 HFPYLLTLQL KRFDFDYTTM HRIKLNDRMT FPEELDMSTF IDVEDEKSPQ TESCTDSGAE421 NEGSCHSDQM SNDFSNDDGV DEGICLETNS GTEKISKSGL EKNSLIYELF SVMVHSGSAA481 GGHYYACIKS FSDEQWYSFN DQHVSRITQE DIKKTHGGSS GSRGYYSSAF ASSTNAYMLI541 YRLKDPARNA KFLEVDEYPE HIKNLVQKER ELEEQEKRQR EIERNTCKIK LFCLHPTKQV601 MMENKLEVHK DKTLKEAVEM AYKMMDLEEV IPLDCCRLVK YDEFHDYLER SYEGEEDTPM661 GLLLGGVKST YMFDLLLETR KPDQVFQSYK PGEVMVKVHV VDLKAESVAA PITVRAYLNQ721 TVTEFKQLIS KAIHLPAETM RIVLERCYND LRLLSVSSKT LKAEGFFRSN KVFVESSETL781 DYQMAFADSH LWKLLDRHAN TIRLFVLLPE QSPVSYSKRT AYQKAGGDSG NVDDDCERVK841 GPVGSLKSVE AILEESTEKL KSLSLQQQQD GDNGDSSKST ETSDFENIES PLNERDSSAS901 VDNRELEQHI QTSDPENFQS EERSDSDVNN DRSTSSVDSD ILSSSHSSDT LCNADNAQIP961 LANGLDSHSI TSSRRTKANE GKKETWDTAE EDSGTDSEYD ESGKSRGEMQ YMYFKAEPYA1021 ADEGSGEGHK WLMVHVDKRI TLAAFKQHLE PFVGVLSSHF KVFRVYASNQ EFESVRLNET1081 LSSFSDDNKI TIRLGRALKK GEYRVKVYQL LVNEQEPCKF LLDAVFAKGM TVRQSKEELI1141 PQLREQCGLE LSIDRFRLRK KTWKNPGTVF LDYHIYEEDI NISSNWEVFL EVLDGVEKMK1201 SMSQLAVLSR RWKPSEMKLD PFQEVVLESS SVDELREKLS EISGIPLDDI EFAKGRGTFP1261 CDISVLDIHQ DLDWNPKVST LNVWPLYICD DGAVIFYRDK TEELMELTDE QRNELMKKES1321 SRLQKTGHRV TYSPRKEKAL KIYLDGAPNK DLTQD表2(b)USP_N07新剪接变体-核苷酸序列1atggtgcccg gcgaggagaa ccaactggtc ccgaaagaga tagaaaatgc tgctgaagaa61 cctagagtct tatgtattat acaagatact actaattcaa agacagtgaa tgaacggatc121 actttaaatt taccagcatc tactccagtc agaaagctct ttgaagatgt ggccaacaaa181 gtaggctaca taaatggaac ctttgacttg gtgtggggaa atggaatcaa tactgctgat241 atggcaccac tggatcatac cagtgacaag tcacttctcg acgctaattt tgagccagga301 aagaagaact ttctgcattt gacagataaa gatggtgaac aacctcaaat actgctggag361 gattccagtg ctggggaaga cagtgttcat gacaggttta taggtccgct tccaagagaa421 ggttctgtgg gttctaccag tgattatgtc agccaaagct actcctactc atctattttg481 aataaatcag aaactggata tgtgggacta gtaaaccaag caatgacttg ctatttgaat541 agccttttgc aaacactttt tatgactcct gaatttagga atgcattata taagtgggaa601 tttgaagaat ctgaagaaga tccagtgaca agtattccat accaacttca aaggcttttt661 gttttgttac aaaccagcaa aaagagagca attgaaacca cagatgttac aaggagcttt721 ggatgggata gtagtgaggc ttggcagcag catgatgtac aagaactatg cagagtcatg781 tttgatgctt tggaacagaa atggaagcaa acagaacagg ctgatcttat aaatgagcta841 tatcaaggca agctgaagga ctacgtgaga tgtctggaat gtggttatga gggctggcga901 atcgacacat atcttgatat tccattggtc atccgacctt atgggtccag ccaagcattt
961 gctagtgtgg aagaagcatt gcatgcattt attcagccag agattctgga tggcccaaat1021 cagtattttt gtgaacgttg taagaagaag tgtgatgcac ggaagggcct tcggtttttg1081 cattttcctt atctgctgac cttacagctg aaaagattcg attttgatta tacaaccatg1141 cataggatta aactgaatga tcgaatgaca tttcccgagg aactagatat gagtactttt1201 attgatgttg aagatgagaa atctcctcag actgaaagtt gcactgacag tggagcagaa1261 aatgaaggta gttgtcacag tgatcagatg agcaacgatt tctccaatga tgatggtgtt1321 gatgaaggaa tctgtcttga aaccaatagt ggaactgaaa agatctcaaa atctggactt1381 gaaaagaatt ccttgatcta tgaacttttc tctgttatgg ttcattctgg gagcgctgct1441 ggtggtcatt attatgcatg tataaagtca ttcagtgatg agcagtggta cagcttcaat1501 gatcaacatg tcagcaggat aacacaagag gacattaaga aaacacatgg tggatcttca1561 ggaagcagag gatattattc tagtgctttc gcaagttcca caaatgcata tatgctgatc1621 tatagactga aggatccagc cagaaatgca aaatttctag aagtggatga atacccagaa1681 catattaaaa acttggtgca gaaagagaga gagttggaag aacaagaaaa gagacaacga1741 gaaattgagc gcaatacatg caagataaaa ttattctgtt tgcatcctac aaaacaagta1801 atgatggaaa ataaattgga ggttcataag gataagacat taaaggaagc agtagaaatg1861 gcttataaga tgatggattt agaagaggta atacccctgg attgctgtcg ccttgttaaa1921 tatgatgagt ttcatgatta tctagaacgg tcatatgaag gagaagaaga tacaccaatg1981 gggcttctac taggtggcgt caagtcaaca tatatgtttg atctgctgtt ggagacgaga2041 aagcctgatc aggttttcca atcttataaa cctggagaag tgatggtgaa agttcatgtt2101 gttgatctaa aggcagaatc tgtagctgct cctataactg ttcgtgctta cttaaatcag2161 acagttacag aattcaaaca actgatttca aaggccatcc atttacctgc tgaaacaatg2221 agaatagtgc tggaacgctg ctacaatgat ttgcgtcttc tcagtgtctc cagtaaaacc2281 ctgaaagctg aaggattttt tagaagtaac aaggtgtttg ttgaaagctc cgagactttg2341 gattaccaga tggcctttgc agactctcat ttatggaaac tcctggatcg gcatgcaaat2401 acaatcagat tatttgtttt gctacctgaa caatccccag tatcttattc caaaaggaca2461 gcataccaga aagctggagg cgattctggt aatgtggatg atgactgtga aagagtcaaa2521 ggacctgtag gaagcctaaa gtctgtggaa gctattctag aagaaagcac tgaaaaactc2581 aaaagcttgt cactgcagca acagcaggat ggagataatg gggacagcag caaaagtact2641 gagacaagtg actttgaaaa catcgaatca cctctcaatg agagggactc ttcagcatca2701 gtggataata gagaacttga acagcatatt cagacttctg atccagaaaa ttttcagtct2761 gaagaacgat cagactcaga tgtgaataat gacaggagta caagttcagt ggacagtgat2821 attcttagct ccagtcatag cagtgatact ttgtgcaatg cagacaatgc tcagatccct2881 ttggctaatg gacttgactc tcacagtatc acaagtagta gaagaacgaa agcaaatgaa2941 gggaaaaaag aaacatggga tacagcagaa gaagactctg gaactgatag tgaatatgat3001 gagagtggca agagtagggg agaaatgcag tacatgtatt tcaaagctga accttatgct3061 gcagatgaag gttctgggga aggacataaa tggttgatgg tgcatgttga taaaagaatt3121 actctggcag ctttcaaaca acatttagag ccctttgttg gagttttgtc ctctcacttc3181 aaggtctttc gagtgtatgc cagcaatcaa gagtttgaga gcgtccggct gaatgagaca3241 ctttcatcat tttctgatga caataagatt acaattagac tggggagagc acttaaaaaa3301 ggagaataca gagttaaagt ataccagctt ttggtcaatg aacaagagcc atgcaagttt3361 ctgctagatg ctgtgtttgc taaaggaatg actgtacggc aatcaaaaga ggaattaatt3421 cctcagctca gggagcaatg tggtttagag ctcagtattg acaggtttcg tctaaggaaa3481 aaaacatgga agaatcctgg cactgtcttt ttggattatc atatttatga agaagatatt3541 aatatttcca gcaactggga ggttttcctt gaagttcttg atggggtaga gaagatgaag3601 tccatgtcac agcttgcagt tttgtcaaga cggtggaagc cttcagagat gaagttggat
3661 cccttccagg aggttgtatt ggaaagcagt agtgtggacg aattgcgaga gaagcttagt3721 gaaatcagtg ggattccttt ggatgatatt gaatttgcta agggtagagg aacatttccc3781 tgtgatattt ctgtccttga tattcatcaa gatttagact ggaatcctaa agtttctacc3841 ctgaatgtct ggcctcttta tatctgtgat gatggtgcgg tcatatttta tagggataaa3901 acagaagaat taatggaatt gacagatgag caaagaaatg aactgatgaa aaaagaaagc3961 agtcgactcc agaagactgg acatcgtgta acatactcac ctcgtaaaga gaaagcacta4021 aaaatatatc tggatggagc accaaataaa gatctgactc aagactga表2(c)-USP_N07参考序列(Derwent AAU82714)氨基酸序列1mvpgeenqlv pkeapldhts dkslldanfe pgkknflhlt dkdgeqpqil ledssageds61 vhdrfigplp regsvgstsd yvsqsysyss ilnksetgyv glvnqamtcy lnsllqtlfm121 tpefrnalyk wefeeseedp vtsipyqlqr lfvllqtskk raiettdvtr sfgwdsseaw181 qqhdvqelcr vmfdaleqkw kqteqadlin elyqgklkdy vrclecgyeg wridtyldip241 lvirpygssq afasveealh afiqpeildg pnqyfcerck kkcdarkglr flhfpylltl301 qlkrfdfdyt tmhriklndr mtfpeeldms tfidvedeks pqtesctdsg aenegschsd36l qmsndfsndd gvdegiclet nsgtekisks gleknsliye lfsvmahsgs aagghyyaci421 ksfsdeqwys fddqhvsrit qedikkthgg ssgsrgyyss afasstnaym liyrlkdpar481 nakflevgey pehiknlvqk ereleeqekr qreierntck iklfclhptk qvmmenklev541 hkdktlkeav emaykmmdle evipldccrl vkydefhdyl ersyegeedt pmglllggvk601 stymfdllle trkpdqvfqs ykpgevmvkv hvvdlkaesv aapitvrayl nqtvtefkql661 iskaihlpae tmrivlercy ndlrllsvss ktlkaegffr snkvfvesse tldyqmafad721 shlwklldrh antirlfvll peqspvsysk rtayqkaggd sgnvdddcer vkgpvgslks781 veaileeste klkslslqqq qdgdngdssk stetsdfeni esplnerdss asvdnreleq841 hiqtsdpenf qseersdsdv nndrstssvd sdilssshss dtlcnadnaq iplangldsh901 sitssrrtka negkketwdt aeedsgtdse ydesgksrge mqymyfkaep yaadegsgeg961 hkwlmvhvdk ritlaafkqh lepfvgvlss hfkvfrvyas nqefesvrln etlssfsddn1021 kitirlgral kkgeyrvkvy qllvneqepc kflldavfak gmtvrqskee lipqlreqcg1081 lelsidrfrl rkktwknpgt vfldyhiyee dinissnwev flevldgvek mksmsqlavl1141 srrwkpsemk ldpfqevvle sssvdelrek lseisgipld diefakgrgt fpcdisvldi1201 hqdldwnpkv stlnvwplyi cddgavifyr dkteelmelt deqrnelmkk essrlqktgh1261 rvtysprkek alkiyldgap nkdltqd表2(d)-USP_N07参考序列(Derwent AAU82714)核苷酸序列atggtgcccg gcgaggagaa ccaactggtc ccgaaagagg caccactgga tcataccagt60gacaagtcac ttctcgacgc taattttgag ccaggaaaga agaactttct gcatttgaca120gataaagatg gtgaacaacc tcaaatactg ctggaggatt ccagtgctgg ggaagacagt180gttcatgaca ggtttatagg tccgcttcca agagaaggtt ctgtgggttc taccagtgat240tatgtcagcc aaagctactc ctactcatct attttgaata aatcagaaac tggatatgtg300ggactagtaa accaagcaat gacttgctat ttgaatagcc ttttgcaaac actttttatg360actcctgaat ttaggaatgc attatataag tgggaatttg aagaatctga agaagatcca420gtgacaagta ttccatacca acttcaaagg ctttttgttt tgttacaaac cagcaaaaag480agagcaattg aaaccacaga tgttacaagg agctttggat gggatagtag tgaggcttgg540cagcagcatg atgtacaaga actatgcaga gtcatgtttg atgctttgga acagaaatgg600aagcaaacag aacaggctga tcttataaat gagctatatc aaggcaagct gaaggactac660
gtgagatgtc tggaatgtgg ttatgagggc tggcgaatcg acacatatct tgatatccca720ttggtcatcc gaccttatgg gtccagccaa gcatttgcta gtgtggaaga agcattgcat780gcatttattc agccagagat tctggatggc ccaaatcagt atttttgtga acgttgtaag840aagaagtgtg atgcacggaa gggccttcgg tttttgcatt ttccttatct gctgacctta900cagctgaaaa gattcgattt tgattataca accatgcata ggattaaact gaatgatcga960atgacatttc ccgaggaact agatatgagt acttttattg atgttgaaga tgagaaatct1020cctcagactg aaagttgcac tgacagtgga gcagaaaatg aaggtagttg tcacagtgat1080cagatgagca acgatttctc caatgatgat ggtgttgatg aaggaatctg tcttgaaacc1140aatagtggaa ctgaaaagat ctcaaaatct ggacttgaaa agaattcctt gatctatgaa1200cttttctctg ttatggctca ttctgggagc gctgctggtg gtcattatta tgcatgtata1260aagtcattca gtgatgagca gtggtacagc ttcgatgatc aacatgtcag caggataaca1320caagaggaca ttaagaaaac acatggtgga tcttcaggaa gcagaggata ttattctagt1380gctttcgcaa gttccacaaa tgcatatatg ctgatctata gactgaagga tccagccaga1440aatgcaaaat ttctagaagt gggtgaatac ccagaacata ttaaaaactt ggtgcagaaa1500gagagagagt tggaagaaca agaaaagaga caacgagaaa ttgagcgcaa tacatgcaag1560ataaaattat tctgtttgca tcctacaaaa caagtaatga tggaaaataa attggaggtt1620cataaggata agacattaaa ggaagcagta gaaatggctt ataagatgat ggatttagaa1680gaggtaatac ccctggattg ctgtcgcctt gttaaatatg atgagtttca tgattatcta1740gaacggtcat atgaaggaga agaagataca ccaatggggc ttctactagg tggcgtcaag1800tcaacatata tgtttgatct gctgttggag acgagaaagc ctgatcaggt tttccaatct1860tataaacctg gagaagtgat ggtgaaagtt catgttgttg atctaaaggc agaatctgta1920gctgctccta taactgttcg tgcttactta aatcagacag ttacagaatt caaacaactg1980atttcaaagg ccatccattt acctgctgaa acaatgagaa tagtgctgga acgctgctac2040aatgatttgc gtcttctcag tgtctccagt aaaaccctga aagctgaagg attttttaga2100agtaacaagg tgtttgttga aagctccgag actttggatt accagatggc ctttgcagac2160tctcatttat ggaaactcct ggatcggcat gcaaatacaa tcagattatt tgttttgcta2220cctgaacaat ccccagtatc ttattccaaa aggacagcat accagaaagc tggaggcgat2280tctggtaatg tggatgatga ctgtgaaaga gtcaaaggac ctgtaggaag cctaaagtct2340gtggaagcta ttctagaaga aagcactgaa aaactcaaaa gcttgtcact gcagcaacag2400caggatggag ataatgggga cagcagcaaa agtactgaga caagtgactt tgaaaacatc2460gaatcacctc tcaatgagag ggactcttca gcatcagtgg ataatagaga acttgaacag2520catattcaga cttctgatcc agaaaatttt cagtctgaag aacgatcaga ctcagatgtg2580aataatgaca ggagtacaag ttcagtggac agtgatattc ttagctccag tcatagcagt2640gatactttgt gcaatgcaga caatgctcag atccctttgg ctaatggact tgactctcac2700agtatcacaa gtagtagaag aacgaaagca aatgaaggga aaaaagaaac atgggataca2760gcagaagaag actctggaac tgatagtgaa tatgatgaga gtggcaagag taggggagaa2820atgcagtaca tgtatttcaa agctgaacct tatgctgcag atgaaggttc tggggaagga2880cataaatggt tgatggtgca tgttgataaa agaattactc tggcagcttt caaacaacat2940ttagagccct ttgttggagt tttgtcctct cacttcaagg tctttcgagt gtatgccagc3000aatcaagagt ttgagagcgt ccggctgaat gagacacttt catcattttc tgatgacaat3060aagattacaa ttagactggg gagagcactt aaaaaaggag aatacagagt taaagtatac3120cagcttttgg tcaatgaaca agagccatgc aagtttctgc tagatgctgt gtttgctaaa3180ggaatgactg tacggcaatc aaaagaggaa ttaattcctc agctcaggga gcaatgtggt3240ttagagctca gtattgacag gtttcgtcta aggaaaaaaa catggaagaa tcctggcact3300gtctttttgg attatcatat ttatgaagaa gatattaata tttccagcaa ctgggaggtt3360ttccttgaag ttcttgatgg ggtagagaag atgaagtcca tgtcacagct tgcagttttg3420tcaagacggt ggaagccttc agagatgaag ttggatccct tccaggaggt tgtattggaa3480agcagtagtg tggacgaatt gcgagagaag cttagtgaaa tcagtgggat tcctttggat3540gatattgaat ttgctaaggg tagaggaaca tttccctgtg atatttctgt ccttgatatt3600catcaggatt tagactggaa tcctaaagtt tctaccctga atgtctggcc tctttatatc3660tgtgatgatg gtgcggtcat attttatagg gataaaacag aagaattaat ggaattgaca3720gatgagcaaa gaaatgaact gatgaaaaaa gaaagcagtc gactccagaa gactggacat3780cgtgtaacat actcacctcg taaagagaaa gcactaaaaa tatatctgga tggagcacca3840aataaagatc tgactcaaga ctga 3864表3(a)-USP_N11新剪接变体氨基酸序列基因座USP_N11 402aaPRT登录号AK022614GeneSeq AAU82713来源人以1个插入表征的剪接形式Pos 12-Pos 481MTVRNIASIC NMEEPPALGS PGWTLLAPPL VRAFGELRLE EGIAVPCRGT NASALEKDIG61 PEQFPINEHY FGLVNFGNTC YCNSVLQALY FCRPFRENVL AYKAQQKKKE NLLTCLADLF
121 HSIATQKKKV GVIPPKKFIS RLRKENDLFD NYMQQDAHEF LNYLLNTIAD ILQEEKKQEK181 QNGKLKNGNM NEPAENNKPE LTWVHEIFQG TLTNETRCLN CETVSSKDED FLDLSVDVEQ241 NTSITHCLRD FSNTETLCSE QKYYCETCCS KQEAQKRMRV KKLPMILALH LKRFKYMEQL301 HRYTKLSYRV VFPLELRLFN TSSDAVNLDR MYDLVAVVVH CGSGPNRGHY ITIVKSHGFW361 LLFDDDIVEK IDAQAIEEFY GLTSDISKNS ESGYILFYQS RE表3(b)-USP_N11新剪接变体核苷酸序列1atgactgtcc gaaacatcgc ctccatctgt aatatgggca ccaatgcctc tgctctggaa61 aaagacattg gtccagagca gtttccaatc aatgaacact atttcggatt ggtcaatttt121 ggaaacacat gctactgtaa ctccgtgctt caggcattgt acttctgccg tccattccgg181 gagaatgtgt tggcatacaa ggcccagcaa aagaagaagg aaaacttgct gacgtgcctg241 gcggaccttt tccacagcat tgccacacag aagaagaagg ttggcgtcat cccaccaaag301 aagttcattt caaggctgag aaaagagaat gatctctttg ataactacat gcagcaggat361 gctcatgaat ttttaaatta tttgctaaac actattgcgg acatccttca ggaggagaag421 aaacaggaaa aacaaaatgg aaaattaaaa aatggcaaca tgaacgaacc tgcggaaaat481 aataaaccag aactcacctg ggtccatgag atttttcagg gaacgcttac caatgaaact541 cgatgcttga actgtgaaac tgttagtagc aaagatgaag attttcttga cctttctgtt601 gatgtggagc agaatacatc cattacccac tgtctaagag acttcagcaa cacagaaaca661 ctgtgtagtg aacaaaaata ttattgtgaa acatgctgca gcaaacaaga agcccagaaa721 aggatgaggg taaaaaagct gcccatgatc ttggccctgc acctaaagcg gttcaagtac781 atggagcagc tgcacagata caccaagctg tcttaccgtg tggtcttccc tctggaactc841 cggctcttca acacctccag tgatgcagtg aacctggacc gcatgtatga cttggttgcg901 gtggtcgttc actgtggcag tggtcctaat cgtgggcatt atatcactat tgtgaaaagt961 cacggcttct ggcttttgtt tgatgatgac attgtagaga aaatagatgc tcaagctatt1021 gaagaattct atggcctgac gtcagatata tcaaaaaatt cagaatctgg atatatttta1081 ttctatcagt caagagagta a表3(c)-USP_N11参考序列(Derwent AAU82713)氨基酸序列1mtvrniasic nmgtnasale kdigpeqfpi nehyfglvnf gntcycnsvl qalyfcrpfr61 envlaykaqq kkkenlltcl adlfhsiatq kkkvgvippk kfisrlrken dlfdnymqqd121 aheflnylln tiadilqeek kqekqngklk ngnmnepaen nkpeltwvhe ifqgtltnet181 rclncetvss kdedfldlsv dveqntsith clrdfsntet lcseqkyyce tccskqeaqk241 rmrvkklpmv lalhlkrfky meqlrrytkl syrvvfplel rlfntssdav nldrmydlva301 vvvhcgsgpn rghyitivks hgfwllfddd ivekidaqai eefygltsdi sknsesgyil361 fyqsre表3(d)-USP_N11参考序列(Derwent AAU82713)核苷酸序列atgactgtcc gaaacatcgc ctccatctgt aatatgggca ccaatgcctc tgctctggaa60aaagacattg gtccagagca gtttccaatc aatgaacact atttcggatt ggtcaatttt120ggaaacacat gctactgtaa ctccgtgctt caggcattgt acttctgccg tccattccgg180gagaatgtgt tggcatacaa ggcccagcaa aagaagaagg aaaacttgct gacgtgcctg240
gcggaccttt tccacagcat tgccacacag aagaagaagg ttggcgtcat cccaccaaag300aagttcattt caaggctgag aaaagagaat gatctctttg ataactacat gcagcaggat360gctcatgaat ttttaaatta tttgctaaac actattgcgg acatccttca ggaggagaag420aaacaggaaa aacaaaatgg aaaattaaaa aatggcaaca tgaacgaacc tgcggaaaat480aataaaccag aactcacctg ggtccatgag atttttcagg gaacgcttac caatgaaact540cgatgcttga actgtgaaac tgttagtagc aaagatgaag attttcttga cctttctgtt600gatgtggagc agaatacatc cattacccac tgtctaagag acttcagcaa cacagaaaca660ctgtgtagtg aacaaaaata ttattgtgaa acatgctgca gcaaacaaga agcccagaaa720aggatgaggg taaaaaagct gcccatggtc ttggccctgc acctaaagcg gttcaagtac780atggagcagc tgcgcagata caccaagctg tcttaccgtg tggtcttccc tctggaactc840cggctcttca acacctccag tgatgcagtg aacctggacc gcatgtatga cttggttgcg900gtggtcgttc actgtggcag tggtcctaat cgtgggcatt atatcactat tgtgaaaagt960cacggcttct ggcttttgtt tgatgatgac attgtagaga aaatagatgc tcaagctatt1020gaagaattct atggcctgac gtcagatata tcaaaaaatt cagaatctgg atatatttta1080ttctatcagt caagagagta a 1101实施例家族CA/家族C12/C19(脱遍在蛋白酶)明确已知的家族成员自MEROPS检索到(C12共有9个肽序列并且C19共有76个肽序列)并且将它们进行PSI-BLAST和Smith-Waterman搜索。搜索数据库包括从Celera和公共(NCBI)人类基因组序列翻译而来的可读框序列、Celera预测的蛋白质、基于Celera人类基因组的Celera基因扫描预测和来自所有权数据库的预测序列。此外两个家族(C12和C19)的成员经过Interproscan搜索以鉴定它们的Interpro基序。所有来自C12家族(遍在蛋白羧基端水解酶，家族1)的蛋白质通过IPR001578和相关Prints、Prosite和PFAM模式(PR00707，PS00140和PF01088)鉴定。类似地，家族C19通过IPR001394基序(遍在蛋白硫酯酶)和相应的Prints和PFAM标签(PS00972，PS00973，PS50235，PF00443)定义。将来自Prosite、Prints和PFAM数据库的模型下载并用于适当的搜索中。来自多种搜索的结果汇总并且通过三种过滤程序加工以减少重复。将初级符合结果按照低复杂性筛选并且与含有来自GenBank、SwissProt和Refseq的人类蛋白质序列的蛋白质参考数据库匹配。移出与参考数据库中的蛋白质在至少50个氨基酸中具有大于95％同一性的符合结果。此外，将这些符合结果的对应DNA序列与含有Refseq人类cDNA序列的DNA参考数据库匹配。移出与参考数据库中的DNA序列在至少150个核苷酸中具有大于95％同一性的序列。并且最后使用95％同一性界限使得从过滤方法中剩余的符合结果相互去除以产生由高度同源性的符合结果组成的群体。USP_N01是来自这种群体的代表性符合序列。
对家族C12/C19的所有人类成员进行第二轮分析即基因表达谱和电子Northern分析。C12/C19家族成员的公共序列用于鉴定相应的UniGene群体和相关的标准化组织类型表达分布。这些分析与通过查找人类组织图谱和肿瘤样本上相应的探针设置所获得的基因芯片数据比较。
实施例1对应于SEQ ID.No.1和SEQ ID.No.2的USP_N01的基因表达谱在

图1显示。
实施例2对应于SEQ ID.No.5和SEQ ID.No.6的USP_N07的基因表达谱在图2显示。
实施例3对应于SEQ ID.No.9和SEQ ID.No.10的USP_N11的基因表达谱在图3显示。
权利要求
1.经分离的DNA，其包含选自以下的编码遍在蛋白特异性蛋白酶的核苷酸序列(a)SEQ ID No.2、SEQ ID No.6、SEQ.ID No.10；(b)SEQ ID No.2、SEQ ID No.6、SEQ.ID No.10的片段；(c)SEQ ID No.2、SEQ ID No.6、SEQ.ID No.10的衍生物；(d)与SEQ ID No.2、SEQ ID No.6、SEQ.ID No.10基本同源的序列。
2.根据权利要求1所述的经分离的DNA，其由选自SEQ ID No.2、SEQ ID No.6或SEQ.ID No.10的核苷酸序列组成。
3.根据权利要求1所述的经分离的DNA，其中所述片段包含选自SEQID No.2、SEQ ID No.6或SEQ.ID No.10的核苷酸序列中的至少50个核苷酸并且保留了遍在蛋白特异性功能活性。
4.根据权利要求1所述的经分离的DNA，其包含与选自SEQ ID No.2、SEQ ID No.6或SEQ.ID No.10的核苷酸序列至少80％同源并且保留了遍在蛋白特异性功能活性的核苷酸序列。
5.经分离的DNA，其包含在高严格条件下与权利要求1-4中任意一项所述的经分离DNA杂交的约30-50个核苷酸的核酸序列。
6.遍在蛋白特异性蛋白酶的经分离的多肽，其包含选自以下的氨基酸序列(a)SEQ.ID.No.1、SEQ.ID.No.5、SEQ.ID No.9；(b)SEQ.ID.No.1、SEQ.ID.No.5、SEQ.ID No.9的片段；(c)SEQ.ID.No.1、SEQ.ID.No.5、SEQ.ID No.9的衍生物；(d)与SEQ.ID.No.1、SEQ.ID.No.5、SEQ.ID No.9基本同源的序列。
7.根据权利要求6所述的经分离的多肽，其由选自SEQ ID No.1、SEQ ID No.5或SEQ.ID No.9的氨基酸序列组成。
8.根据权利要求6所述的经分离的多肽，其中所述片段包含选自SEQID No.1、SEQ ID No.5或SEQ.ID No.9的氨基酸序列中的至少5个连续的氨基酸。
9.根据权利要求6所述的经分离的多肽，其与选自SEQ ID No.1、SEQ ID No.5或SEQ.ID No.9的氨基酸序列至少80％同源并且保留了遍在蛋白特异性功能活性。
10.根据权利要求6所述的经分离的多肽，其中所述衍生物是遍在蛋白特异性蛋白酶的功能等同物。
11.宿主细胞，其包含根据权利要求1-5中任意一项所述的经分离的DNA。
12.载体，其包含根据权利要求1-5中任意一项所述的经分离的DNA。
13.根据权利要求12所述的载体，其包含转录控制序列。
14.宿主细胞，其包含根据权利要求12或13所述的载体。
15.用于诊断人类乳腺癌的方法，其包括测定来自人乳腺组织中的包含根据权利要求6-10中任意一项所述多肽的多肽量，其中相对于正常乳腺组织中所述多肽的量而言，所述多肽升高的量对于所述人患有乳腺癌具有诊断意义。
16.根据权利要求15的诊断方法，其中所述检测步骤包括将所述乳腺组织与这样的抗体接触，所述抗体与包含权利要求6-10中任意一项所述氨基酸序列的多肽特异性结合；以及检测在所述乳腺组织中所述抗体与多肽的特异性结合，其中检测到对多肽的特异性结合表明存在包含权利要求6-10中任意一项所述氨基酸序列的多肽。
17.根据权利要求15或权利要求16的诊断方法，其中所述氨基酸序列包含SEQ ID.No.1、其片段、其衍生物或其同源物。
18.用于诊断人白血病的方法，其包括测定外周血细胞尤其是淋巴样细胞中的包含根据权利要求6-10中任意一项所述多肽的多肽量，其中相对于正常外周血细胞尤其是淋巴样细胞中所述多肽的量而言，所述多肽升高的量对于所述人患有白血病具有诊断意义。
19.权利要求18所述的方法，其中所述检测步骤包括将所述外周血细胞尤其是淋巴样细胞与这样的抗体接触，所述抗体与包含权利要求6-10中任意一项所述氨基酸序列的多肽特异性结合；以及检测在所述外周血细胞尤其是淋巴样细胞中所述抗体与多肽的特异性结合，其中检测到对多肽的特异性结合表明存在包含权利要求6-10中任意一项所述氨基酸序列的多肽。
20.根据权利要求18或权利要求19的诊断方法，其中所述氨基酸序列包含SEQ ID.No.5、其片段、其衍生物或其同源物。
21.用于诊断人类脑功能紊乱的方法，其包括测定杏仁核、脊髓或嗅球组织中的包含根据权利要求6-10中任意一项所述多肽的多肽量，其中相对于杏仁核、脊髓和嗅球组织中所述多肽的量而言，所述多肽升高的量对于所述人患有脑功能紊乱具有诊断意义。
22.权利要求21所述的方法，其中所述检测步骤包括将所述杏仁核、脊髓或嗅球组织与这样的抗体接触，所述抗体与包含权利要求6-10中任意一项所述氨基酸序列的多肽特异性结合；以及检测在所述脑组织中所述抗体与多肽的特异性结合，其中检测到对多肽的特异性结合表明存在包含权利要求6-10中任意一项所述氨基酸序列的多肽。
23.根据权利要求21或权利要求22的诊断方法，其中所述氨基酸序列包含SEQ ID.No.9、其片段、其衍生物或其同源物。
24.抗体，其特异性结合包含权利要求6-10中任意一项所述氨基酸序列的多肽。
25.根据权利要求24所述的抗体，其为Fab或(Fab’)2片段。
26.根据权利要求24所述的抗体，其为多克隆抗体。
27.根据权利要求24所述的抗体，其为单克隆抗体。
28.药物组合物，其包含根据权利要求24-27所述的抗体。
29.用于治疗乳腺癌的方法，其包括向乳腺癌患者施用有效量的适于抑制这样的基因表达的抑制性核酸，所述基因包含选自SEQ ID No.2、SEQID No.6、SEQ.ID No.10的核酸序列。
30.用于治疗白血病的方法，其包括向白血病患者施用有效量的适于抑制这样的基因表达的抑制性核酸，所述基因包含选自SEQ ID No.2、SEQID No.6、SEQ.ID No.10的核酸序列。
31.药物组合物，其包含适于抑制这样的基因表达的抑制性核酸和可药用载体，其中所述基因包含选自SEQ ID No.2、SEQ ID No.6、SEQ.IDNo.10的核酸序列。
32.用于涉及遍在蛋白特异性蛋白酶的疾病的诊断试剂盒，其包含至少一种如下组分(a)寡核苷酸，其适于检测包含如SEQ ID No.2、SEQ ID.No.6或SEQID No.10所示核苷酸序列或其部分的核酸，(b)抗体，其适于检测包含如SEQ ID No.1、SEQ ID.No.5或SEQ IDNo.9所示氨基酸序列或其部分的多肽，(c)所述试剂盒的使用说明书。
全文摘要
本发明提供了用于研究、生物学、临床、治疗目的和预防和诊断目的的脱遍在蛋白酶(DUB)家族的新成员及其生物学、诊断或治疗有用的片段、衍生物和同源物。进一步地，本发明提供的多核苷酸或多肽用于治疗和诊断乳腺癌、白血病或或脑功能障碍。
文档编号C12N9/64GK1845994SQ200480025654
公开日2006年10月11日申请日期2004年8月5日优先权日2003年8月6日
发明者A·布林格尔, R·L·蔡, S·克西达, B·皮埃拉, N·R·尼尔马拉申请人:诺瓦提斯公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：A.布林格尔;R.L.蔡;S.克西达;B.皮埃拉;N.R.尼尔马拉
技术所有人：诺瓦提斯公司
我是此专利的发明人

上一篇：回收植物脂质组合物的方法
上一篇：用于检测靶物质的桥接元件的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。