新的人核受体协阻抑物编码序列、其编码的多肽及制法的制作方法

文档序号:3550424阅读:597来源:国知局
专利名称:新的人核受体协阻抑物编码序列、其编码的多肽及制法的制作方法
技术领域
本发明涉及基因工程领域,具体地,本发明涉及一种新的人基因核苷酸序列。更具体地说,本发明涉及人HNRCR的cDNA序列,该蛋白是核受体协阻抑物(nuclear receptor coreceptor,简称NRCR)的同系物。本发明还涉及由该核苷酸序列编码的多肽,这些多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产方法。
核受体协阻抑物是一种能和核受体共同作用,调节靶基因转录的蛋白分子。类固醇、类视黄醇、甲状腺素能够通过对细胞内相应的受体调节,开启特异基因的表达。这些激素的受体组成了一个称作核调节蛋白的超家族,其成员都是具有高度特异性和选择性的,依赖于配体作用的转录因子。这些受体结合于基因的上游调控区,当它们未和相应配体结合时,能通过和核受体协阻抑物的作用,抑制这些基因的表达(Gene Dev.11835-846,1997)。
1995年Howard Hughes医学院的Horlein等人用结合分析法率先从CV-1细胞中分离得到一个分子量为270kD的人核受体协阻抑物蛋白(N-CoR)。他们的方法是将CV-1全细胞的抽提物经聚丙烯酰胺凝胶电泳后转移至硝纤膜上,用32P标记甲状腺素受体C末端与之进行杂交。随后他们又用酵母双杂交法获得了编码该蛋白的部分cDNA顺序,并且在鼠的垂体cDNA库中筛选到了该cDNA的全长序列(Nature377397-404,1995)。同年,该医学院的Chen等人用相似的方法得到了另一个转录协阻抑物——类视黄醇和甲状腺素受体沉默中介体(silencing mediator for retinoidand thyroid hormone receptor,SMRT)的cDNA全长序列(Nature 377454-457,1995)。近年来又有一些270kD核受体协阻抑物蛋白的不同剪切的形式的产物被报道发现(Mol.Endocrinol.10(12)1646-1655,1996)。1997年,Zamir等人克隆了一个和已知N-CoR、SMRT无同源关系的协阻抑物SUN-CoR(P.A.N.S.9414400-14405,1997)。
在本发明之前,尚没有任何人公开过本申请中涉及的另一种人类核受体协阻抑物成员HNRCR。
本发明的一个目的是提供一种新的多核苷酸序列,该多核苷酸序列编码人的核受体协阻抑物同源蛋白,本发明的核受体协阻抑物同源基因被命名为HNRCR。
本发明的另一个目的是提供一种新的蛋白,该蛋白被命名为HNRCR蛋白。
本发明的再一个目的是提供一种利用重组技术生产所述的新的人HNRCR蛋白的方法。
本发明还提供了这种人HNRCR编码序列和多肽的应用。
在本发明的一个方面,提供了一种分离出的DNA分子,它包括编码具有人HNRCR蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.19中从核苷酸75-7106位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.19中从核苷酸75-7106位的核苷酸序列杂交。较佳地,所述的序列编码一多肽,该多肽具有SEQ ID NO.20所示的序列。更佳地,该序列具有SEQ ID NO.19中从核苷酸75-7106位的核苷酸序列。
在本发明的另一方面,提供了一种分离的HNRCR蛋白多肽,它包括具有SEQ ID NO.20氨基酸序列的多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.20序列的多肽。
在本发明的另一方面,提供了一种载体,它含有上述分离出的DNA。
在本发明的另一方面,提供了一种所述载体转化的宿主细胞。
在本发明的另一方面,提供了一种产生具有HNRCR蛋白活性的多肽的方法,该方法包括(a)将编码具有HNRCR蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成HNRCR蛋白表达载体,所述的核苷酸序列与SEQ ID NO.19中从核苷酸75-7106位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成HNRCR蛋白的重组细胞;(c)在适合表达HNRCR蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有HNRCR蛋白活性的多肽。
在本发明的一个具体实施方案中,本发明的分离的多核苷酸全长为7900个核苷酸,其详细序列见SEQ ID NO.19,其中开放读框位于75-7106位核苷酸。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“HNRCR蛋白(或多肽)编码序列”指编码具有HNRCR蛋白活性的多肽的核苷酸序列,如SEQ ID NO.19中75-7106位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.19序列的编码框75-7106位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.19中75-7106位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.20所述的序列。该术语还包括能在中度严紧条件下,更佳地,在高度严紧条件下与SEQ ID NO.19中从核苷酸75-7106位的核苷酸序列杂交的核苷酸序列。此外,该术语还包括与SEQ ID NO.19中从核苷酸75-7106位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%的核苷酸序列。
该术语还包括能编码具有与人HNRCR相同功能的蛋白的、SEQ ID NO.19中开放读框序列的变异形式。这些变异形式包括(但并不限于)若干个核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“HNRCR蛋白多肽”指具有HNRCR蛋白活性的SEQ IDNO.20序列的多肽。该术语还包括具有与人HNRCR相同功能的、SEQ ID NO.20序列的变异形式。这些变异形式包括(但并不限于)若干个氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括HNRCR蛋白的活性片段和活性衍生物。
该多肽的变异形式包括同源序列、等位变异体、天然突变体、诱导突变体、在高或低的严谨度条件下能与HNRCR DNA杂交的DNA所编码的蛋白、以及利用抗HNRCR多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含HNRCR多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括了HNRCR多肽的可溶性片段。通常,该片段具有HNRCR多肽序列的至少约10个连续氨基酸,通常至少约50个连续氨基酸,较佳地至少约100个连续氨基酸,更佳地至少约200个连续氨基酸,最佳地至少约400个连续氨基酸。
发明还提供HNRCR蛋白或多肽的类似物。这些类似物与天然HNRCR多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
本发明还包括HNRCR多肽编码序列的反义序列。这种反义序列可用于抑制细胞内HNRCR的表达。
本发明还包括一种探针分子,该分子通常具有HNRCR多肽编码序列的8-1000个,较佳地15-800个连续核苷酸,最佳地50-500个连续核苷酸。该探针可用于检测样品中是否存在编码HNRCR的核酸分子。
本发明还包括检测HNRCR核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于HNRCR多肽的编码序列,并可位于该编码序列的两侧或中间。引物长度一般为20-50个核苷酸,或更长。
在本发明中,可选用本领域已知的各种载体,如市售的载体。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞,昆虫细胞、和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
另一方面,本发明还包括对HNRCRDNA或是其片段编码的多肽具有特异性的多克隆抗体和单克隆抗体,尤其是单克隆抗体。这里,“特异性”是指抗体能结合于HNRCR基因产物或片段。较佳地,指那些能与HNRCR基因产物或片段结合但不识别和结合于其它非相关抗原分子的抗体。本发明中抗体包括那些能够结合并抑制HNRCR蛋白的分子,也包括那些并不影响HNRCR蛋白功能的抗体。本发明还包括那些能与修饰或未经修饰形式的HNRCR基因产物结合的抗体。
本发明不仅包括完整的单克隆或多克隆抗体,而且还包括具有免疫活性的抗体片段,如Fab′或(Fab)2片段;抗体重链;抗体轻链;遗传工程改造的单链Fv分子(Ladner等人,美国专利No.4,946,778);或嵌合抗体,如具有鼠抗体结合特异性但仍保留来自人的抗体部分的抗体。
本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。例如,纯化的HNRCR基因产物或者其具有抗原性的片段,可被施用于动物以诱导多克隆抗体的产生。与之相似的,表达HNRCR或其具有抗原性的片段的细胞可用来免疫动物来生产抗体。本发明的抗体也可以是单克隆抗体。此类单克隆抗体可以利用杂交瘤技术来制备(见Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6511,1976;Kohler等人,Eur.J.Immunol.6292,1976;Hammerling等人,In Monoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.,1981)。本发明的抗体包括能阻断HNRCR功能的抗体以及不影响HNRCR功能的抗体。本发明的各类抗体可以利用HNRCR基因产物的片段或功能区,通过常规免疫技术获得。这些片段或功能区可以利用重组方法制备或利用多肽合成仪合成。与HNRCR基因产物的未修饰形式结合的抗体可以用原核细胞(例如E.Coli)中生产的基因产物来免疫动物而产生;与翻译后修饰形式结合的抗体(如糖基化或磷酸化的蛋白或多肽),可以用真核细胞(例如酵母或昆虫细胞)中产生的基因产物来免疫动物而获得。
本发明的HNRCR核苷酸序列全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的SEQ ID NO.19序列,尤其是开放阅读框序列来设计引物,并用各种市售的cDNA库或按已知方法制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。当然,通过先合成多个小片段,然后再进行连接而获得序列很长的片段。
在本发明的一个实施例中,人HNRCR的cDNA核苷酸序列是如此获得的,以人睾丸入gtllcDNA文库(购自Clontech公司)为模板,合成正向引物和反向引物九对,进行PCR,获得的目的片段经测序、拼接后得到SEQ ID NO.19的全长cDNA序列。
研究已表明,类固醇、类视黄醇、甲状腺素能够通过细胞内相应的受体调节,开启特异基因的表达。这些激素的受体组成了一个称作核调节蛋白的超家族。它们结合于基因的上游调控区。而当它们未和相应配体结合时,能通过和核受体协阻抑物的作用,抑制这些基因的表达(Gene Dev.11835-846,1997)。
近年来的研究还表明,核受体协阻抑物还和一类孤儿受体家族成员作用(Nucleic Acids Research 24(22)4379-4386,1996)。该研究提示不同受体可通过不同的抑制域和核受体协阻抑物作用,而核受体协阻抑物提供了一个通用的转录调节的下游途径(Mol.Cell.Bio.16(10)5458-5465,1996)。
核受体协阻抑物是核受体蛋白发挥抑制作用的关键分子。研究表明降低核受体协阻抑物水平或者干扰协阻抑物和核受体的结合,都能有效提高核受体拮抗物在某些特殊细胞中,如乳腺癌晚期细胞中激活基因表达的作用(P.N.A.S.952920-2925,1998)。本发明的多肽可以为研究基因转录调节机制及抗肿瘤机制提供一条新途径。
荧光免疫分析表明,在低水平表达时核受体协阻抑物在细胞核中任意分布,而在高水平表达时就会形成许多点状结构的亚群。过表达的核受体协阻抑物会表现出去除抑制作用的功能,而不是增强抑制作用。研究表明,核受体协阻抑物mRNA在发育过程中显示下降趋势(Mol.Endo.11(6)682-692,1997)。本发明的多核苷酸及多肽可以为进一步研究核受体协阻抑物参与生理功能的普遍原理提供新的研究材料。
另外,已有报道,一种非典型的急性早幼粒细胞的白血病和核受体协阻抑物直接相关(Blood 91(8)2634-3642,1998)。本发明可为深入研究该疾病的分之机制及寻找有效的治疗方法提供可能。例如,本发明HNRCR核酸(编码序列或反义序列)可以被引入细胞,以提高HNRCR的表达水平或者抑制HNRCR的过度表达。本发明的HNRCR蛋白或其活性多肽片段可以施用于病人,以治疗或减轻因HNRCR缺失、无功能或异常而导致的有关病症。此外,还可以用基于本发明的核酸序列或抗体进行有关的诊断或预后判断。
在附图中,

图1为本发明的人HNRCR与鼠HNRCR的核酸序列的同源比较图。其中,相同的核苷酸用“|”标出。
图2为本发明的人HNRCR与鼠HNRCR蛋白的氨基酸序列的同源比较图。其中,相同的氨基酸在两个序列之间用“|”标出,相似的氨基酸用“.”标出。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆实验室手册(New YorkColdSpring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1HNRCR的cDNA序列的克隆和测定1.引物扩增以人睾丸λgtllcDNA文库(购自Clontech公司)为模板,用九对寡核苷酸为引物——A15’-GTAGATGGTTTCCTAGACACATG-3′(SEQ ID NO.1)、A25′-CCATTGCTAGGAGTGAGCATGAG-3’(SEQ ID NO.2)、A35’-TCTTGACAACCTCTTACAGC AGC-3’(SEQ ID NO.3)、A45’-GCTATGCTCTCTACCAGCGACAC-3’(SEQ ID NO.4)、A55’-GATGTCAATGAGGGAGTCTCCTG-3’(SEQ ID NO.5)、A65’-ATCGGAGCCACCTGCCCA CGCAC-3’(SEQ ID NO. 6)、A75’-GTGAACAGCAGCAGCTAGAGCAG-3’(SEQ ID NO. 7)、A85’-CAGGACAGCTTGCTGCTCTTGTC-3’(SEQ ID NO. 8)和A95’-AGAACAGGATCTGG GAGCGAGAG-3’(SEQ ID NO.9)为正向引物,寡核苷酸B15′-CATTACTTTCCTGCTCAG AGAGC-3′(SEQ ID NO.10)、B25′-TGAGCAGAAACAGTGGAAGCGAC-3’(SEQ ID NO.11)、B35’-TCTGTTCTTGTCTCTGCCGCTGC-3’(SEQ ID NO.12)、B45’-TTGTTGCTCTTGGTGTCCCCTGC-3’(SEQ ID NO.13)、B55’-ACTTGGGTAACCTGGAGTTGGTG-3’(SEQ ID NO.14)、B65’-ACAGATCTCTTCTCCACCTCCAG-3’(SEQ ID NO.15)、B75’-GGTGAAGAATGAAGGCAAGTAGC-3’(SEQ ID NO.16)、B85’-ACTTCCATCATTTCTT CATCATC-3’(SEQ ID NO.17)和B95’-AGTGTGCGTAACAGTGAGGTATG-3’(SEQ ID NO.18)为反向引物,进行PCR。A1/B1的PCR条件为93℃4分钟,随之以93℃1分钟、66℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟;A2/B2的PCR条件为93℃4分钟,随之以93℃1分钟、68℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟;A3/B3的PCR条件为93℃4分钟,随之以93℃1分钟、68℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟;A4/B4的PCR条件为93℃4分钟,随之以93℃1分钟、70℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟;A5/B5的PCR条件为93℃4分钟,随之以93℃1分钟、68℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟;A6/B6的PCR条件为93℃4分钟,随之以93℃1分钟、70℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟;A7/B7的PCR条件为93℃4分钟,随之以93℃1分钟、68℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟;A8/B8的PCR条件为93℃4分钟,随之以93℃1分钟、63℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟;A9/B9的PCR条件为93℃4分钟,随之以93℃1分钟、68℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟;电泳检测得到的PCR片段,A1/B1为905bp的目的片段,A2/B2为990bp的目的片段,A3/B3为952bp的目的片段,A4/B4为1025bp的目的片段,A5/B5为996bp的目的片段,A6/B6为930bp的目的片段,A7/B7为985bp的目的片段,A8/B8为970bp的目的片段,A9/B9为849bp的目的片段。
2.PCR产物的测序将这九段PCR扩增产物A1/B1、A2/B2、A3/B3、A4/B4、A5/B5、A6/B6、A7/B7、A8/B8和A9/B9分别与pGEM-T载体(Promega)连接,转化大肠杆菌JM103,用QIAprep Plasmid试剂盒(QIAGEN)提取质粒,用双链嵌套式缺失试剂盒(Pharmacia)对插入片段进行定向系列缺失,然后用PCR对缺失子进行快速鉴定及排序。用SequiTherm EXCELTMDNA测序试剂盒(Epicentre Technologies)对依次截短的缺失子进行测序,最后用电脑软件拼接顺序,获得全长cDNA序列,共7900bp,详细序列见SEQ ID NO.19,其中开放读框位于75-7106位核苷酸。
根据得到的全长cDNA序列推导出HNRCR的氨基酸序列,共2343个氨基酸残基,其氨基酸序列详见SEQ ID NO.20。
实施例2同源比较用HNRCR的全长cDNA序列及其编码蛋白在Non-redundantGenBank+EMBL+DDBJ+PDB数据库及Non-redundant GenBank CDStranslations+PDB+SwissProt+Spupdate+PIR数据库中用BLAST进行核酸和蛋白同源检索。结果发现它们与鼠核受体协阻抑物基因及其编码蛋白具有极高同源性,用PCGENE软件比较发现在核酸水平上的同一性达到了77.9%(图1),在蛋白水平上的同一性达到92.2%,并且另有3.4%的氨基酸相似(图2)。因此,可以确定它们构成一个家族,并可以从该家族基因或蛋白的功能来推测HNRCR的功能。
基因表达的调控对细胞分化、发育和内环境稳定有着决定作用。类固醇、类视黄醇、甲状腺素能够通过细胞内相应的受体调节,开启特异基因的表达。这些激素的受体组成了一个称作核调节蛋白的超家族,其成员都是具有高度特异性和选择性的依赖于配体作用的转录因子。这些受体结合于基因的上游调控区,当它们未和相应配体结合时,能通过和核受体协阻抑物的作用,抑制这些基因的表达(Gene Dev.11835-846,1997)。核受体协阻抑物能够结合一些组氨酸去乙酰基酶,这些酶可去除染色体上组蛋白的乙酰基,使染色体结构更为紧密,从而实现转录抑制作用(Nature 38716-17;43-48,1997)。
一个蛋白是否是核受体协阻抑物,可通过以下原则进行判断1)它和转录因子的抑制域相互作用;2)当它和异源DNA结合域融合时,能够抑制转录;3)当转录因子的抑制域发生失活突变时,它的结合也变得敏感;4)它以浓度相关的方式实现转录因子的抑制作用(Mol.Cell Bio.16(10)5458-5465,1996)。
近年来的研究表明,核受体协阻抑物也和一类孤儿受体家族成员作用(Nucleic Acids Research 24(22)4379-4386,1996)。孤儿受体是一种无已知配体的转录因子,可能是激素受体家族的祖先。研究最深入的是RevErb,其与核受体分别同核受体协阻抑物结合的抑制域的一级氨基酸顺序是不同的,提示不同受体可通过不同的抑制域和核受体协阻抑物作用,而核受体协阻抑物提供了一个通用的转录调节的下游途径(Mol.Cell Bio.16(10)5458-5465,1996)。
核受体协阻抑物是核受体蛋白发挥抑制作用的关键分子。核受体蛋白开启或抑制靶基因的表达取决于细胞内共活化物和协阻抑物之间的比例,而这个比例与核受体蛋白种类、靶基因启动子结构及这些内源共活化物和协阻抑物的组织特异性表达相关(Endocrinology 139(5)2493-2500,1998)。这个比例可能是不同组织对激素有着不同敏感性的决定因素。研究表明降低核受体协阻抑物水平或者干扰协阻抑物和核受体的结合,都能有效提高核受体拮抗物在某些特殊细胞中,如乳腺癌晚期细胞的活化基因表达的作用(P.N.A.S.952920-2925,1998)。本发明的多肽可以为研究基因转录调节机制及抗肿瘤机制提供一条新途径。
荧光免疫分析表明,在低水平表达时核受体协阻抑物在细胞核中任意分布,而在高水平表达时就会形成许多点状结构的亚群。其低水平时的分布情况和组蛋白去乙酰基酶分布部分重合,提示两者在功能上有联系。过表达的核受体协阻抑物能表现出去抑制作用的功能,而不是增强抑制作用(Mol.Endo.11(6)682-692,1997)。研究表明,核受体协阻抑物mRNA在胚胎组织中水平很高,在发育的较晚阶段中显著下降,而在成熟组织中达到极低水平(Mol.Endo.11(6)682-692,1997)。本发明的多核苷酸及多肽可以为进一步研究核受体协阻抑物参与生理功能的分子机理及抑癌基因的作用机理提供新的研究材料。
另外,一种非典型的急性早幼粒细胞的白血病和核受体协阻抑物直接相关。该病变细胞产生一种融合蛋白,可和核受体协阻抑物作用产生病理性的抑制作用,并且不和典型治疗药物反全视黄酸响应(Blood 91(8)2634-3642,1998)。这提示本发明的HNRCR的缺失、无功能或表达异常会导致人们患病或死亡。本发明可为深入研究该疾病的分子机制及寻找有效的治疗方法提供可能。
本发明的人HNRCR除了可作为该家族一员用于进一步的功能研究,还可用于与其他蛋白一起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明人HNRCR还可以与该家族的其他成员进行融合或交换片段,以产生新的蛋白。例如将本发明人HNRCR的N端与鼠的HNRCR的N端进行交换,以产生新的活性更高或具有新特性的蛋白。
针对本发明人HNRCR的抗体,用于筛选该家族的其他成员,或者用于亲和纯化相关蛋白(如该家族的其他成员)。
实施例3HNRCR在大肠杆菌中的表达在该实施例中,分别表达HNRCR的四个片段。将实施例1中获得的cDNA序列A1/B1、A2/B2、A5/B5和A8/B8用对应于该DNA序列的5′和3′端的PCR寡核苷酸引物进行扩增,获得的cDNA作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为A1/B15’-TGTAGTCGACATGTCAAGTTCAGTTATCC-3′(SEQ ID NO.21),该引物含有SalI内切酶的酶切位点,在该酶切位点之后是由起始密码子开始的A1/B1编码序列的19个核苷酸;A2/B25’-TGTAGTCGACATGATTGCTAGGAGTGAGCATG-3′(SEQ IDNO.22),该引物含有SalI内切酶的酶切位点,在该酶切位点之后是起始密码子以及A2/B2编码序列的19个核苷酸;A5/B55’-TGTAGTCGACATGTCAATGAGGGAGTCTCCTG-3′(SEQ IDNO.23),该引物含有SalI内切酶的酶切位点,在该酶切位点之后是由起始密码子开始的A5/B5编码序列的19个核苷酸;A8/B85’-TGTAGGATCCATGCAGGACAGCTTGCTGCTCT-3′(SEQ IDNO.24),该引物含有BamHI内切酶的酶切位点,在该酶切位点之后是起始密码子以及A8/B8编码序列的19个核苷酸;3′端引物序列为A1/B15’-CCTCAAGCTTTTAATTACTTTCCTGCTCA-3’(SEQ ID NO.25),该引物含有HindIII内切酶的酶切位点、翻译终止子和A1/B1的部分编码序列;A2/B25’-CCTCAAGCTTTTAAGCAGAAACAGTGGAAGCG-3’(SEQ IDNO.26),该引物含有HindIII内切酶的酶切位点、翻译终止子和A2/B2的部分编码序列;A5/B55’-CCTCGTCGACTTAACTTGGGTAACCTGGAGTT-3’(SEQ IDNO.27),该引物含有SalI内切酶的酶切位点、翻译终止子和A5/B5的部分编码序列;A8/B85’-CCTCGTCGACTTATTCCATCATTTCTTCATCA-3’(SEQ IDNO.28),该引物含有SalI内切酶的酶切位点、翻译终止子和A8/B8的部分编码序列。
引物上的限制性内切酶的酶切位点对应于细菌表达载体pQE-9(Qiagen Inc.,Chatsworth,CA)上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr)、一个细菌复制起点(ori)、一个IPTG-可调启动子/操纵子(P/O)、一个核糖体结合位点(RBS)、一个6-组氨酸标记物(6-His)以及限制性内切酶克隆位点。
分别用各片段引物对应的限制性内切酶消化pQE-9载体及插入片段,随后分别将插入片段连接到pQE-9载体并保持开放读框在细菌RBS起始。随后用连接混合物转化购自Qiagen,商品名为M15/rep4的E.coli菌株,M15/rep4含有多拷贝的质粒pREP4,其表达lacI阻遏物并携带卡那霉素抗性(Kanr)。在含有Amp和Kan的LB培养皿上筛选转化子,抽提质粒,分别用BamHI(A1/B1、A2/B2)和PstI(A5/B5、A8/B8)酶切鉴定插入片段大小及方向,并测序验证各cDNA片段已正确插入了载体。
在补加Amp(100μg/ml)和Kan(25μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的阳性转化子克隆。过夜(O/N)培养物以1∶100-1∶250的稀释率稀释,然后接种到大体积培养基中,培养细胞生长至600光密度(OD600)为0.4-0.6时,加入IPTG(“异丙基硫代-β-D-半乳糖苷”)至终浓度为1mM。通过使lacI阻遏物失活,IPTG诱导启动P/O导致基因表达水平提高。继续培养细胞3-4小时,随后离心(6000×g,20分钟)。超声裂解包涵体,收集细胞并将细胞沉淀溶于6M的盐酸胍中。澄清后,通过在能使含6-His标记物蛋白紧密结合的条件下,用镍-螯合柱层析从溶液中纯化溶解的HNRCR片段。用6M盐酸胍(pH5.0)从柱中洗脱HNRCR。可用几种方法从盐酸胍中变性沉淀蛋白。或者使用透析步骤除去盐酸胍,或者从镍-螯合柱中分离出纯化多肽,纯化后的多肽可以结合到第二个柱中,该柱中具有递减的线性盐酸胍梯度。在结合到该柱时多肽变性,随后用盐酸胍(pH5.0)洗脱。最后,将可溶的多肽对含PBS进行透析,然后将多肽保存在终浓度为10%(w/v)甘油的贮存液中。
用12%的SDS-PAGE胶进行电泳检测,发现有与预计大小相近的条带。
此外,用常规方法对各表达多肽的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与预计的序列一致。
实施例4HNRCR在真核细胞(CHO细胞株)中的表达在该实施例中,分别表达HNRCR的四个片段。将实施例1中获得的cDNA序列A2/B2、A3/B3、A4/B4和A6/B6用对应于该DNA序列的5′和3′端的PCR寡核苷酸引物进行扩增,获得的cDNA作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为A2/B25’-TGTAAAGCTTATGATTGCTAGGAGTGAGCATG-3′(SEQ IDNO.29),该引物含有HindIII内切酶的酶切位点,在该酶切位点之后是起始密码子以及A2/B2编码序列的19个核苷酸;A3/B35’-TGTAAAGCTTATGCTTGACAACCTCTTACAGC-3′(SEQ IDNO.30),该引物含有HindIII内切酶的酶切位点,在该酶切位点之后是起始密码子以及A3/B3编码序列的19个核苷酸;A4/B45’-TGTAAAGCTTATGTATGCTCTCTACCAGCGAC-3′(SEQ IDNO.31),该引物含有HindIII内切酶的酶切位点,在该酶切位点之后是起始密码子以及A4/B4编码序列的19个核苷酸;A6/B65’-TGTAAAGCTTATGCGGAGCCACCTGCCCACGC-3′(SEQ IDNO.32),该引物含有HindIII限制性内切酶的酶切位点,在该酶切位点之后是起始密码子以及A6/B6编码序列的19个核苷酸;3′端引物序列为A2/B25’-CCTCGAGCTCTTAAGCAGAAACAGTGGAAGCG-3’(SEQ IDNO.33),该引物含有SacI限制性内切酶的酶切位点、翻译终止子和A2/B2的部分编码序列;
A3/B35’-CCTCGAGCTCTTACTGTTCTTGTCTCTGCCGC-3’(SEQ IDNO.34),该引物含有SacI限制性内切酶的酶切位点、翻译终止子和A3/B3的部分编码序列;A4/B45’-CCTCGAGCTCTTATGTTGCTCTTGGTGTCCCC-3’(SEQ IDNO.35),该引物含有SacI限制性内切酶的酶切位点、翻译终止子和A4/B4的部分编码序列;A6/B65’-CCTCGAGCTCTTAAGATCTCTTCTCCACCTCC-3’(SEQ IDNO.36),该引物含有SacI限制性内切酶的酶切位点、翻译终止子和A6/B6的部分编码序列;引物上的限制性内切酶的酶切位点对应于CHO细胞表达载体pcDNA3上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr和Neor)、一个噬菌体复制起点(fl ori)、一个病毒复制起点(SV40 ori)、一个T7启动子、一个病毒启动子(P-CMV)、一个Sp6启动子、一个SV40启动子、一个SV40加尾信号和相应的polyA顺序、一个BGH加尾信号和相应的polyA顺序。
分别用各片段引物对应的限制性内切酶消化pcDNA3载体及插入片段,随后分别将插入片段连接到pcDNA3载体。随后用连接混合物转化E.coli DH5α菌株。在含有Amp的LB培养皿上筛选转化子,在补加Amp(100μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的克隆。抽提质粒,分别用BamHI(A2/B2)、XhoI(A3/B3)和ApaI(A4/B4、A6/B6)酶切鉴定插入片段大小及方向,并测序验证各cDNA片段已正确插入了载体。
质粒转染CHO细胞是用脂转染法,用Lipofectin试剂盒(GiBco Life)进行,转染48小时后,经2-3周的持续G418加压筛选,收集细胞及细胞上清测定表达蛋白酶活力。去G418,连续传代培养;对混合克隆细胞极限稀释,选择具有较高蛋白活性的细胞亚克隆。按常规方法大量培养上述阳性亚克隆。48小时后,开始收集细胞及上清,用超声裂解方法破碎细胞。以含0.05%Triton的50mMTris·HCl(pH7.6)溶液为平衡液及洗脱液,用经预平衡的Superdex G-75柱收集上述多肽的活性峰。再用50mMTris·HCl(pH8.0)平衡的DEAE-Sepharose柱,以含0-1M NaCl的50mMTris·HCl(pH8.0)溶液为洗脱液进行梯度洗脱,收集上述多肽的活性峰。然后以PBS(pH7.4)为透析液对表达多肽溶液进行透析。最后冻干保存。
用12%的SDS-PAGE胶进行电泳检测,发现有与预计大小相近的条带。
此外,用常规方法对各表达多肽的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与预计的序列一致。
实施例5制备抗体将实施例3和4获得的蛋白片段用来免疫动物以产生抗体,具体如下。如上获得的多肽片段用层析法进行分离后备用。也可用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中切下,并用等体积的完全Freund’s佐剂乳化。用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原,对小鼠以50-100μg/0.2ml的剂量进行腹膜内注射以加强免疫。每隔14天进行一次加强免疫,至少进行三次。获得的抗血清的特异反应活性用它在体外沉淀各对应翻译产物的能力加以评估。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表(1)一般信息(i)申请人上海新黄浦复旦基因工程有限公司(ii)发明名称新的人核受体协阻抑物编码序列、其编码的多肽及制法(iii)序列数目36(2)SEQ ID NO.1的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.1GTAGATGGTT TCCTAGACAC ATG23(2)SEQ ID NO.2的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.2CCATTGCTA GGAGTGAGCAT GAG23(2)SEQ ID NO.3的信息(i)序列特征
(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.3TCTTGACAAC CTCTTACAGC AGC23(2)SEQ ID NO.4的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.4GCTATGCTCT CTACCAGCGA CAC23(2)SEQ ID NO.5的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.5GATGTCAATG AGGGAGTCTC CTG23(2)SEQ ID NO.6的信息(i)序列特征(A)长度23碱基(B)类型核酸
(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.6ATCGGAGCCA CCTGCCCACG CAC23(2)SEQ ID NO.7的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.7GTGAACAGCA GCAGCTAGAG CAG23(2)SEQ ID NO.8的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.8CAGGACAGCT TGCTGCTCTT GTC23(2)SEQ ID NO.9的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.9AGAACAGGAT CTGGGAGCGA GAG23(2)SEQ ID NO.10的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.10CATTACTTTC CTGCTCAGAG AGC23(2)SEQ ID NO.11的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.11TGAGCAGAAA CAGTGGAAGC GAC23(2)SEQ ID NO.12的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.12TCTGTTCTTG TCTCTGCCGC TGC23(2)SEQ ID NO.13的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.13TTGTTGCTCT TGGTGTCCCC TGC23(2)SEQ ID NO.14的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.14ACTTGGGTAA CCTGGAGTTG GTG23(2)SEQ ID NO.15的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.15ACAGATCTCT TCTCCACCTC CAG23(2)SEQ ID NO.16的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.16GGTGAAGAAT GAAGGCAAGT AGC23(2)SEQ ID NO.17的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.17ACTTCCATCA TTTCTTCATC ATC23(2)SEQ ID NO.18的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.18AGTGTGCGTA ACAGTGAGGT ATG23(2)SEQ ID NO.19的信息(i)序列特征
(A)长度7900bp(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO.191GTAGATGGTT TCCTAGACAC ATGATTGTTT ATTGGCGTTG ATCTCGCAGT CTGGTGAGAA61 CTTCTTTACT GATAATGTCA AGTTCAGTTT ATCCTCCCAA CCAAGGAGCA TTCAGCACAG121 AACAAAGTCG TTCTCCTCCT CACTCTGTAA AGTATACGTT TCCCAGCACC CACCACCAGC181 AGGATCCAGC ATTCGGAGGC AAACATGAAG CTCCATCCTC TCCAATTTCG GGGCAACCAT241 GTGGAGATGA TCAAAATGCT TCACCTTCAA AACTCTCAAA GGAAGAGTTA ATACAGAGTA301 TGGATCGTGT AGATCGAGAA ATTGCAAAAG TAGAACAGCA GATCCTTAAA CTGAAAAAGA361 AACAACAACA GCTTGAAGAA GAGGCAGCTA AACCTCCTGA GCCTGAGAAG CCCGTGTCCC421 CTCCTCCTGT GGAGCAGAAA CACCGCAGTA TTGTCCAAAT TATTTATGAT GAGAATCGGA481 AAAAAGCAGA AGAAGCTCAT AAAATTTTTG AAGGTCTTGG CCCAAAAGTT GAACTGCCAC541 TGTATAACCA GCCATCAGAT ACCAAGGTGT ACCATGAGAA CATCAAGACA AACCAGGTGA601 TGAGGAAAAA ACTCATTTTA TTTTTTAAAA GAAGAAATCA TGCAAGAAAA CAAAGGGAAC661 AAAAAATCTG CCAGCGTTAT GATCAGCTCA TGGAGGCATG GGAGAAAAAA GTGGACAGAA721 TAGAAAATAA TCCTCGGAGG AAAGCTAAAG AAAGCAAAAC AAGGGAATAC TATGAAAAGC781 AGTTTCCAGA AATTCGAAAA CAAAGAGAAC AGCAAGAAAG ATTTCAGCGA GTTGGGCAGA841 GGGGAGCTGG TCTTTCAGCC ACCATTGCTA GGAGTGAGCA TGAGATTTCT GAAATTATTG901 ATGGGCTCTC TGAGCAGGAA AGTAATGAGA AACAAATGCG GCAGCTCTCT GTGATTCCAC961 CTATGATGTT TGATGCAGAA CAAAGACGAG TCAAGTTCAT TAACATGAAT GGGCTTATGG1021 AGGACCCTAT GAAAGTGTAT AAAGATAGGC AGTTTATGAA TGTTTGGACT GACCATGAAA1081 AGGAGATCTT TAAGGACAAG TTTATCCAGC ATCCAAAAAA CTTTGGACTA ATTGCATCAT1141 ACTTGGAGAG GAAGAGTGTT CCTGATTGTG TTTTGTATTA CTATTTAACC AAGAAAAATG1201 AGAATTATAA AGCCCTCGTC AGAAGGAATT ATGGGAAACG CAGAGGCAGA AACCAGCAAA1261 TTGCTCGACC CTCGCAAGAA GAAAAAGTAG AAGAAAAAGA AGAGGATAAA GCAGAAAAAA1321 CAGAAAAAAA AGAAGAAGAA AAGAAAGATG AAGAGGAAAA AGATGAAAAA GAAGACTCCA1381 AAGAAAATAC CAAGGAAAAG GACAAGATAG ATGGTACAGC AGAAGAAACT GAGGAAAGAG1441 AGCAAGCCAC ACCCCGGGGG CGAAAGACTG CCAACAGTCA GGGCCGCCGT AAGGGCCGGA1501 TCACCAGGTC CATGACAAAC GAAGCTGCAG CTGCCAGTGC TGCAGCCGCA GCGGCTACTG1561 AAGAGCCCCC ACCACCTCTG CCACCGCCAC CAGAACCCAT TTCTACAGAG CCTGTGGAGA1621 CCTCTCGATG GACAGAAGAA GAAATGGAAG TTGCTAAAAA AGGTCTAGTA GAACATGGTC1681 GTAACTGGGC AGCAATTGCT AAAATGGTGG GAACGAAAAG TGAAGCTCAA TGTAAAAACT1741 TCTATTTTAA CTATAAAAGG CGACACAATC TTGACAACCT CTTACAGCAG CATAAACAGA1801 AAACTTCACG AAAACCTCGT GAAGAGCGAG ATGTGTCTCA ATGTGAAAGT GTCGCTTCCA1861 CTGTTTCTGC TCAGGAGGAT GAAGATATTG AAGCCTCCAA TGAAGAAGAA AATCCAGAAG1921 ACAGCGAAGG TGCAGAAAAT AGTTCTGATA CAGAAAGTGC TCCTTCTCCT TCACCAGTTG1981 AAGCTGTCAA GCCCAGCGAG GACAGTCCTG AAAATGCTAC TTCTCGAGGA AACACAGAAC2041 CTGCGGTTGA GCTTGAGCCC ACCACGGAAA CTGCACCCAG TACATCTCCC TCCTTAGCAG2101 TTCCAAGTAC AAAACCAGCT GAAGATGAAA GTGTGGAGAC CCAGGTGAAT GACAGCATCA2161 GTGCTGAGAC AGCAGAGCAG ATGGATGTAG ATCAGCAGGA GCACAGTGCT GAAGAGGGTT2221 CTGTTTGTGA TCCCCCACCC GCTACCAAAG CTGACTCTGT GGACGTTGAA GTGAGGGTGC2281 CAGAAAACCA TGCATCTAAA GTTGAAGGTG ATAATACCAA AGAAAGAGAC TTGGATAGAG2341 CCAGTGAGAA GGTGGAACCT AGAGATGAAG ATTTGGTGGT AGCTCAGCAA ATAAATGCCC2401 AAAGGCCCGA GCCCCAGTCA GACAATGATT CCAGTGCCAC GTGCAGCGCT GATGAGGATG2461 TGGATGGAGA GCCAGAGAGG CAGAGAATGT TTCCTATGGA CTCAAAGCCT TCACTGTTAA2521 ACCCCACTGG ATCTATACTC GTCTCATCTC CGTTAAAACC AAATCCACTG GATCTGCCAC2581 AGCTTCAGCA TCGAGCTGCT GTTATCCCAC CAATGGTATC CTGCACCCCA TGTAACATAC2641 CAATTGGAAC CCCAGTGAGC GGCTATGCTC TCTACCAGCG ACACATTAAA GCAATGCATG2701 AGTCAGCACT CCTGGAGGAG CAGCGGCAGA GACAAGAACA GATAGATTTG GAATGTAGAA2761 GTTCTACAAG TCCATGTGGC ACATCCAAGA GTCCAAACAG AGAGTGGGAA GTCCTTCAGC2821 CTGCTCCACA TCAAGTGATA ACTAATCTCC CTGAAGGCGT TCGGCTTCCG ACAACTCGAC2881 CAACCAGGCC ACCGCCCCCT CTCATCCCGT CATCCAAAAC CACAGTGGCT TCAGAAAAAC2941 CATCTTTTAT AATGGGAGGC TCCATCTCAC AGGGAACACC AGGCACTTAT TTGACTTCTC3001 ATAATCAGGC TTCCTACACT CAAGAAACAC CCAAGCCGTC AGTGGGATCT ATCTCTCTTG3061 GACTGCCACG GCAACAGGAA TCTGCCAAAT CAGCTACTTT GCCCTACATC AAGCAGGAAG3121 AATTTTCTCC CCGAAGCCAA AACTCACAAC CTGAGGGTCT GTTGGTCAGG GCCCAACATG3181 AAGGTGTAGT CAGAGGTACC GCAGGAGCCA TACAAGAAGG AAGTATAACT CGGGGAACTC3241 CAACCAGCAA AATTTCAGTG GAGAGCATTC CATCCCTACG GGGCTCTATC ACTCAGGGCA3301 CCCCGGCTCT GCCCCAGACT GGCATACCAA CAGAGGCTTT GGTGAAGGGG TCCATTTCGA3361 GAATGCCCAT TGAAGACAGC AGTCCTGAGA AAGGCAGAGA GGAAGCTGCA TCCAAAGGCC3421 ATGTTATTTA TGAAGGCAAA AGTGGACATA TCTTGTCATA TGATAATATT AAGAATGCCC3481 GAGAAGGGAC TAGGAGTCCA AGAACAGCTC ATGAAATCAG TTTAAAGAGA AGCTATGAAT3541 CAGTGGAAGG AAATATAAAG CAAGGGATGT CAATGAGGGA GTCTCCTGTA TCAGCACCGT3601 TAGAGGGGCT GATATGCCGA GCATTACCCA GGGGGAGTCC TCATTCTGAC CTCAAAGAAA3661 GGACTGTATT GTCTGGCTCC ATAATGCAGG GGACACCAAG AGCAACAACT GAAAGCTTTG3721 AAGATGGCCT TAAATATCCC AAACAAATTA AAAGGGAAAG TCCTCCCATA CGAGCATTTG3781 AAGGTGCCAT TACCAAAGGA AAACCATATG ATGGCATCAC CACCATCAAA GAAATGGGGC3841 GTTCCATTCA TGAGATTCCA AGGCAAGATA TTTTAACTCA GGAAAGTCGG AAAACTCCAG3901 AAGTGGTCCA GAGCACACGG CCGATAATTG AGGGTTCCAT TTCCCAGGGC ACACCAATAA3961 AGTTTGACAA CAACTCAGGT CAATCTGCCA TCAAACACAA TGTCAAATCC TTAATCACGG4021 GGCCTAGCAA ACTATCCCGT GGAATGCCTC CGCTGGAAAT TGTGCCAGAG AACATAAAAG4081 TGGTAGAACG GGGAAAATAT GAGGATGTGA AAGCAGGCGA GACCGTGCGT TCCCGGCACA4141 CGTCAGTGGT AAGCTCTGGC CCCTCCGTTC TTAGGTCCAC ACTGCATGAA GCTCCCAAAG4201 CACAACTGAG CCCTGGGATT TATGATGACA CCAGTGCACG GAGGACCCCT GTGAGTTATC4261 AAAACACCAT GTCCAGAGGC TCACCCATGA TGAACAGAAC TTCTGATGTT TCTTCTAACA4321 AGTCTACCAA TCATGAAAGG AAATCGACAC TGACCCCTAC CCAGAGGGAA AGTATCCCAG4381 CGAAGTCTCC AGTGCCTGGG GTGGACCCTG TCGTGAGCCA CAGTCCGTTT GATCCCCATC4441 ACAGAGGCAG CACTGCAGGC GAGGTTTATC GGAGCCACCT GCCCACGCAC TTGGATCCAG4501 CCATGCCTTT TCACAGGGCT TTGGATCCTG CGGCTGCTTA CCTGTTTCAG AGACAGCTTT4561 CACCAACTCC AGGTTACCCA AGTCAGTATC AGCTTTACGC AATGGAGAAC ACAAGACAGA4621 CAATCTTAAA TGATTACATT ACCTCACAAC AGATGCAAGT GAACTTGCGT CCAGATGTGG4681 CCAGAGGACT CTCCCCAAGA GAGCAGCCAC TGGGTCTCCC ATACCCAGCA ACGAGAGGAA4741 TCATTGACCT GACCAATATG CCTCCAACAA TTTTAGTGCC TCATCCAGGG GGAACAAGCA4801 CTCCTCCCAT GGACAGAATC ACTTATATTC CTGGTACACA GATTACTTTC CCTCCCAGGC4861 CGTACAACTC TGCTTCCATG TCTCCAGGAC ACCCAACACA CCTTGCAGCT GCTGCAAGTG4921 CTGAGAGGGA ACGGGAACGG GAGCGGGAGA AGGAGCGGGA GCGGGAACGG ATTGCTGCAG4981 CTTCCTCCGA CCTCTACCTG CGGCCAGGCT CAGAACAGCC TGGCCGACCT GGCAGTCATG5041 GATATGTTCG CTCCCCTTCC CCTTCAGTAA GAACTCAGGA GACCATGTTG CAACAGAGAC5101 CCAGTGTTTT CCAAGGAACC AATGGAACCA GTGTAATCAC ACCTTTGGAT CCAACTGCTC5161 AGCTACGAAT CATGCCACTG CCTGCTGGGG GCCCTTCAAT AAGCCAAGGC CTGCCAGCCT5221 CCCGTTACAA CACTGCTGCG GATGCCCTGG CTGCTCTTGT GGATGCTGCA GCTTCTGCAC5281 CCCAGATGGA TGTGTCCAAA ACAAAAGAGA GTAAGCATGA AGCTGCCAGG TTAGAAGAAA5341 ATTTGAGAAG CAGGTCAGCA GCAGTTAGTG AACAGCAGCA GCTAGAGCAG AAAACCCTGG5401 AGGTGGAGAA GAGATCTGTT CAGTGTTTAT ACACTTCTTC AGCCTTTCCA AGTGGCAAGC5461 CCCAGCCTCA TTCTTCAGTA GTTTATTCTG AGGCTGGGAA AGATAAAGGG CCTCCTCCAA5521 AATCCAGATA TGAGGAAGAG CTAAGGACCA GAGGGAAGAC TACCATTACT GCAGCTAACT5581 TCATAGACGT GATCATCACC CGGCAAATTG CCTCGGACAA GGATGCGAGG GAACGTGGCT5641 CTCAAAGTTC AGACTCTTCT AGTAGCTTAT CTTCTCACAG GTATGAAACA CCTAGCGATG5701 CTATTGAGGT GATAAGTCCT GCCAGCTCAC CTGCGCCACC CCAGGAGAAA CTGCAGACCT5761 ATCAGCCAGA GGTTGTTAAG GCAAATCAAG CGGAAAATGA TCCTACCAGA CAATATGAAG5821 GACCATTACA TCACTATCGA CCACAGCAGG AATCACCATC TCCCCAACAA CAGCTGCCCC5881 CTTCTTCACA GGCAGAGGGA ATGGGGCAAG TGCCCAGGAC CCATCGGCTG ATCACACTTG5941 CTGATCACAT CTGTCAAATT ATCACACAAG ATTTTGCTAG AAATCAAGTT TCCTCGCAGA6001 CTCCCCAGCA GCCTCCTACT TCTACATTCC AGAACTCACC TTCTGCTTTG GTATCTACAC6061 CTGTGAGGAC TAAAACATCA AACCGTTACA GCCCAGAATC CCAGGCTCAG TCTGTCCATC6121 ATCAAAGACC AGGTTCAAGG GTCTCTCCAG AAAATCTTGT GGACAAATCC AGGGGAAGTA6181 GGCCTGGAAA ATCCCCAGAG AGGAGTCACG TCTCTTCGGA GCCCTACGAG CCCATCTCCC6241 CACCCCAGGT TCCGGTTGTG CATGAGAAAC AGGACAGCTT GCTGCTCTTG TCTCAGAGGG6301 GCGCAGAGCC TGCAGAGCAG AGGAATGATG CCCGCTCACC AGGGAGTATA AGCTACTTGC6361 CTTCATTCTT CACCAAGCTT GAAAATACAT CACCCATGGT TAAATCAAAG AAGCAGGAGA6421 TTTTTCGTAA GTTGAACTCC TCTGGTGGAG GTGACTCTGA TATGGCAGCT GCTCAGCCAG6481 GAACTGAGAT CTTTAATCTG CCAGCAGTTA CTACGTCAGG CTCAGTTAGC TCTAGAGGCC6541 ATTCTTTTGC TGATCCTGCC AGTAATCTTG GGCTGGAAGA CATTATCAGG AAGGCTCTCA6601 TGGGAAGCTT TGATGACAAA GTTGAGGATC ATGGAGTTGT CATGTCCCAG CCTATGGGAG6661 TAGTGCCTGG TACTGCCAAC ACCTCAGTTG TGACCAGTGG TGAGACACGA AGAGAGGAAG6721 GGGACCCATC ACCTCATTCA GGAGTTTGCA AACCAAAGCT GATCAGCAAG TCAAACAGCA6781 GGAAATCTAA GTCTCCTATA CCTGGGCAAG GCTACTTAGG AACGGAACGG CCCTCTTCAG6841 TCTCCTCTGT ACATTCAGAA GGGGATTACC ATAGGCAGAC GCCAGGGTGG GCCTGGGAAG6901 ACAGGCCCTC TTCAACAGGC TCAACTCAGT TTCCTTATAA CCCTCTGACT ATGCGGATGC6961 TCAGCAGTAC TCCACCAACA CCGATTGCAT GTGCTCCCTC TGCGGTGAAC CAAGCAGCTC7021 CTCACCAACA GAACAGGATC TGGGAGCGAG AGCCTGCCCC ACTGCTCTCA GCACAGTACG7081 AGACCCTGTC GGATAGTGAT GACTGAACTG CACAAAGTGA GGGGAACAGG GTGCAGGAGA7141 GGGATCTCTA GTTTTTGTGG TTTAATTTTT AGTAGCAGGT CAAAAACCTG CCCTCCTGTG7201 ACTTATTCCC TGAGACTTTT CAGGAGAGCC AGCCCACAGA TGATGAAGAA ATGATGGAAG7261 TTCATTTGGA GAGTCAAATG GGAAAAAAAC AAACAAAAAA CTGCCTTTGA TACAGGCAAT7321 TCAGTGGACT ATAATAATAG TGGAGGGTTG AGATGTAGAG TTTTTAAAAA GTGAACAGTT7381 GCTGTTCTTA CATCTGTAAA GAAAACCATA ATGTCTTTAA ATCACTCTTC TGTAAATAGA7441 TGACCTTTTT GCAGTGTATA TCCCCTTGCT GTAGTATCTG GTGTACTTAT GTTCAAATCA7501 GCGCATCAAC TTTGGGGGTG ATTTTTAAAA ATCTTTTTGT CTATCTATCT TTTTAACCCT7561 AGCCTTCTAA ACAACCTCAT ACAGCCCAGT TACATAATGT TGGCTGTCAC GGGCATTGTA7621 CTTTTATCTG ATATTGTTTC CTCTAAATTC AGCTTTCCAG TGATGTTTAA AATCTTGTGA7681 AAATGTTTAG ATTTTTAACA CAGACCCTGT CATAAAATCT GTACATTAGG GTCAAAAGGT7741 AAAAGTAACA AATTCTGCCA TATTGTAAAT TTCCAGTGCA GGCTTTAATT TTTTTTTTTC7801 ATTAGTAGCA CTGAAAAAAT ATTACTGCAT GGGTATGTTC TAGTTCAGTT TATAAAGTTT7861 TAAAGGCTTA TTTGAGGCAT ACCTCACTGT TACGCACACT(2)SEQ ID NO.20的信息(i)序列特征(A)长度2343个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型多肽(xi)序列描述SEQ ID NO.201 Met Ser Ser Ser Val Tyr Pro Pro Asn Gln Gly Ala Phe Ser Thr16 Glu Gln Ser Arg Ser Pro Pro His Ser Val Lys Tyr Thr Phe Pro31 Ser Thr His His Gln Gln Asp Pro Ala Phe Gly Gly Lys His Glu46 Ala Pro Ser Ser Pro Ile Ser Gly Gln Pro Cys Gly Asp Asp Gln61 Asn Ala Ser Pro Ser Lys Leu Ser Lys Glu Glu Leu Ile Gln Ser76 Met Asp Arg Val Asp Arg Glu Ile Ala Lys Val Glu Gln Gln Ile91 Leu Lys Leu Lys Lys Lys Gln Gln Gln Leu Glu Glu Glu Ala Ala106 Lys Pro Pro Glu Pro Glu Lys Pro Val Ser Pro Pro Pro Val Glu121 Gln Lys His Arg Ser Ile Val Gln Ile Ile Tyr Asp Glu Asn Arg136 Lys Lys Ala Glu Glu Ala His Lys Ile Phe Glu Gly Leu Gly Pro151 Lys Val Glu Leu Pro Leu Tyr Asn Gln Pro Ser Asp Thr Lys Val166 Tyr His Glu Asn Ile Lys Thr Asn Gln Val Met Arg Lys Lys Leu181 Ile Leu Phe Phe Lys Arg Arg Asn His Ala Arg Lys Gln Arg Glu196 Gln Lys Ile Cys Gln Arg Tyr Asp Gln Leu Met Glu Ala Trp Glu211 Lys Lys Val Asp Arg Ile Glu Asn Asn Pro Arg Arg Lys Ala Lys226 Glu Ser Lys Thr Arg Glu Tyr Tyr Glu Lys Gln Phe Pro Glu Ile241 Arg Lys Gln Arg Glu Gln Gln Glu Arg Phe Gln Arg Val Gly Gln256 Arg Gly Ala Gly Leu Ser Ala Thr Ile Ala Arg Ser Glu His Glu271 Ile Ser Glu Ile Ile Asp Gly Leu Ser Glu Gln Glu Ser Asn Glu286 Lys Gln Met Arg Gln Leu Ser Val Ile Pro Pro Met Met Phe Asp301 Ala Glu Gln Arg Arg Val Lys Phe Ile Asn Met Asn Gly Leu Met316 Glu Asp Pro Met Lys Val Tyr Lys Asp Arg Gln Phe Met Asn Val331 Trp Thr Asp His Glu Lys Glu Ile Phe Lys Asp Lys Phe Ile Gln346 His Pro Lys Asn Phe Gly Leu Ile Ala Ser Tyr Leu Glu Arg Lys361 Ser Val Pro Asp Cys Val Leu Tyr Tyr Tyr Leu Thr Lys Lys Asn376 Glu Asn Tyr Lys Ala Leu Val Arg Arg Asn Tyr Gly Lys Arg Arg391 Gly Arg Asn Gln Gln Ile Ala Arg Pro Ser Gln Glu Glu Lys Val406 Glu Glu Lys Glu Glu Asp Lys Ala Glu Lys Thr Glu Lys Lys Glu421 Glu Glu Lys Lys Asp Glu Glu Glu Lys Asp Glu Lys Glu Asp Ser436 Lys Glu Asn Thr Lys Glu Lys Asp Lys Ile Asp Gly Thr Ala Glu451 Glu Thr Glu Glu Arg Glu Gln Ala Thr Pro Arg Gly Arg Lys Thr466 Ala Asn Ser Gln Gly Arg Arg Lys Gly Arg Ile Thr Arg Ser Met481 Thr Asn Glu Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala Ala Thr496 Glu Glu Pro Pro Pro Pro Leu Pro Pro Pro Pro Glu Pro Ile Ser511 Thr Glu Pro Val Glu Thr Ser Arg Trp Thr Glu Glu Glu Met Glu526 Val Ala Lys Lys Gly Leu Val Glu His Gly Arg Asn Trp Ala Ala541 Ile Ala Lys Met Val Gly Thr Lys Ser Glu Ala Gln Cys Lys Asn556 Phe Tyr Phe Asn Tyr Lys Arg Arg His Asn Leu Asp Asn Leu Leu571 Gln Gln His Lys Gln Lys Thr Ser Arg Lys Pro Arg Glu Glu Arg586 Asp Val Ser Gln Cys Glu Ser Val Ala Ser Thr Val Ser Ala Gln601 Glu Asp Glu Asp Ile Glu Ala Ser Asn Glu Glu Glu Asn Pro Glu616 Asp Ser Glu Gly Ala Glu Asn Ser Ser Asp Thr Glu Ser Ala Pro631 Ser Pro Ser Pro Val Glu Ala Val Lys Pro Ser Glu Asp Ser Pro646 Glu Asn Ala Thr Ser Arg Gly Asn Thr Glu Pro Ala Val Glu Leu661 Glu Pro Thr Thr Glu Thr Ala Pro Ser Thr Ser Pro Ser Leu Ala676 Val Pro Ser Thr Lys Pro Ala Glu Asp Glu Ser Val Glu Thr Gln691 Val Asn Asp Ser Ile Ser Ala Glu Thr Ala Glu Gln Met Asp Val706 Asp Gln Gln Glu His Ser Ala Glu Glu Gly Ser Val Cys Asp Pro721 Pro Pro Ala Thr Lys Ala Asp Ser Val Asp Val Glu Val Arg Val736 Pro Glu Asn His Ala Ser Lys Val Glu Gly Asp Asn Thr Lys Glu751 Arg Asp Leu Asp Arg Ala Ser Glu Lys Val Glu Pro Arg Asp Glu766 Asp Leu Val Val Ala Gln Gln Ile Asn Ala Gln Arg Pro Glu Pro781 Gln Ser Asp Asn Asp Ser Ser Ala Thr Cys Ser Ala Asp Glu Asp796 Val Asp Gly Glu Pro Glu Arg Gln Arg Met Phe Pro Met Asp Ser811 Lys Pro Ser Leu Leu Asn Pro Thr Gly Ser Ile Leu Val Ser Ser826 Pro Leu Lys Pro Asn Pro Leu Asp Leu Pro Gln Leu Gln His Arg841 Ala Ala Val Ile Pro Pro Met Val Ser Cys Thr Pro Cys Asn Ile856 Pro Ile Gly Thr Pro Val Ser Gly Tyr Ala Leu Tyr Gln Arg His871 Ile Lys Ala Met His Glu Ser Ala Leu Leu Glu Glu Gln Arg Gln886 Arg Gln Glu Gln Ile Asp Leu Glu Cys Arg Ser Ser Thr Ser Pro901 Cys Gly Thr Ser Lys Ser Pro Asn Arg Glu Trp Glu Val Leu Gln916 Pro Ala Pro His Gln Val Ile Thr Asn Leu Pro Glu Gly Val Arg931 Leu Pro Thr Thr Arg Pro Thr Arg Pro Pro Pro Pro Leu Ile Pro946 Ser Ser Lys Thr Thr Val Ala Ser Glu Lys Pro Ser Phe Ile Met961 Gly Gly Ser Ile Ser Gln Gly Thr Pro Gly Thr Tyr Leu Thr Ser976 His Asn Gln Ala Ser Tyr Thr Gln Glu Thr Pro Lys Pro Ser Val991 Gly Ser Ile Ser Leu Gly Leu Pro Arg Gln Gln Glu Ser Ala Lys1006 Ser Ala Thr Leu Pro Tyr Ile Lys Gln Glu Glu Phe Ser Pro Arg1021 Ser Gln Asn Ser Gln Pro Glu Gly Leu Leu Val Arg Ala Gln His1036 Glu Gly Val Val Arg Gly Thr Ala Gly Ala Ile Gln Glu Gly Ser1051 Ile Thr Arg Gly Thr Pro Thr Ser Lys Ile Ser Val Glu Ser Ile1066 Pro Ser Leu Arg Gly Ser Ile Thr Gln Gly Thr Pro Ala Leu Pro1081 Gln Thr Gly Ile Pro Thr Glu Ala Leu Val Lys Gly Ser Ile Ser1096 Arg Met Pro Ile Glu Asp Ser Ser Pro Glu Lys Gly Arg Glu Glu1111 Ala Ala Ser Lys Gly His Val Ile Tyr Glu Gly Lys Ser Gly His1126 Ile Leu Ser Tyr Asp Asn Ile Lys Asn Ala Arg Glu Gly Thr Arg1141 Ser Pro Arg Thr Ala His Glu Ile Ser Leu Lys Arg Ser Tyr Glu1156 Ser Val Glu Gly Asn Ile Lys Gln Gly Met Ser Met Arg Glu Ser1171 Pro Val Ser Ala Pro Leu Glu Gly Leu Ile Cys Arg Ala Leu Pro1186 Arg Gly Ser Pro His Ser Asp Leu Lys Glu Arg Thr Val Leu Ser1201 Gly Ser Ile Met Gln Gly Thr Pro Arg Ala Thr Thr Glu Ser Phe1216 Glu Asp Gly Leu Lys Tyr Pro Lys Gln Ile Lys Arg Glu Ser Pro1231 Pro Ile Arg Ala Phe Glu Gly Ala Ile Thr Lys Gly Lys Pro Tyr1246 Asp Gly Ile Thr Thr Ile Lys Glu Met Gly Arg Ser Ile His Glu1261 Ile Pro Arg Gln Asp Ile Leu Thr Gln Glu Ser Arg Lys Thr Pro1276 Glu Val Val Gln Ser Thr Arg Pro Ile Ile Glu Gly Ser Ile Ser1291 Gln Gly Thr Pro Ile Lys Phe Asp Asn Asn Ser Gly Gln Ser Ala1306 Ile Lys His Asn Val Lys Ser Leu Ile Thr Gly Pro Ser Lys Leu1321 Ser Arg Gly Met Pro Pro Leu Glu Ile Val Pro Glu Asn Ile Lys1336 Val Val Glu Arg Gly Lys Tyr Glu Asp Val Lys Ala Gly Glu Thr1351 Val Arg Ser Arg His Thr Ser Val Val Ser Ser Gly Pro Ser Val1366 Leu Arg Ser Thr Leu His Glu Ala Pro Lys Ala Gln Leu Ser Pro1381 Gly Ile Tyr Asp Asp Thr Ser Ala Arg Arg Thr Pro Val Ser Tyr1396 Gln Asn Thr Met Ser Arg Gly Ser Pro Met Met Asn Arg Thr Ser1411 Asp Val Ser Ser Asn Lys Ser Thr Asn His Glu Arg Lys Ser Thr1426 Leu Thr Pro Thr Gln Arg Glu Ser Ile Pro Ala Lys Ser Pro Val1441 Pro Gly Val Asp Pro Val Val Ser His Ser Pro Phe Asp Pro His1456 His Arg Gly Ser Thr Ala Gly Glu Val Tyr Arg Ser His Leu Pro1471 Thr His Leu Asp Pro Ala Met Pro Phe His Arg Ala Leu Asp Pro1486 Ala Ala Ala Tyr Leu Phe Gln Arg Gln Leu Ser Pro Thr Pro Gly1501 Tyr Pro Ser Gln Tyr Gln Leu Tyr Ala Met Glu Asn Thr Arg Gln1516 Thr Ile Leu Asn Asp Tyr Ile Thr Ser Gln Gln Met Gln Val Asn1531 Leu Arg Pro Asp Val Ala Arg Gly Leu Ser Pro Arg Glu Gln Pro1546 Leu Gly Leu Pro Tyr Pro Ala Thr Arg Gly Ile Ile Asp Leu Thr1561 Asn Met Pro Pro Thr Ile Leu Val Pro His Pro Gly Gly Thr Ser1576 Thr Pro Pro Met Asp Arg Ile Thr Tyr Ile Pro Gly Thr Gln Ile1591 Thr Phe Pro Pro Arg Pro Tyr Asn Ser Ala Ser Met Ser Pro Gly1606 His Pro Thr His Leu Ala Ala Ala Ala Ser Ala Glu Arg Glu Arg1621 Glu Arg Glu Arg Glu Lys Glu Arg Glu Arg Glu Arg Ile Ala Ala1636 Ala Ser Ser Asp Leu Tyr Leu Arg Pro Gly Ser Glu Gln Pro Gly1651 Arg Pro Gly Ser His Gly Tyr Val Arg Ser Pro Ser Pro Ser Val1666 Arg Thr Gln Glu Thr Met Leu Gln Gln Arg Pro Ser Val Phe Gln1681 Gly Thr Asn Gly Thr Ser Val Ile Thr Pro Leu Asp Pro Thr Ala1696 Gln Leu Arg Ile Met Pro Leu Pro Ala Gly Gly Pro Ser Ile Ser1711 Gln Gly Leu Pro Ala Ser Arg Tyr Asn Thr Ala Ala Asp Ala Leu1726 Ala Ala Leu Val Asp Ala Ala Ala Ser Ala Pro Gln Met Asp Val1741 Ser Lys Thr Lys Glu Ser Lys His Glu Ala Ala Arg Leu Glu Glu1756 Asn Leu Arg Ser Arg Ser Ala Ala Val Ser Glu Gln Gln Gln Leu1771 Glu Gln Lys Thr Leu Glu Val Glu Lys Arg Ser Val Gln Cys Leu1786 Tyr Thr Ser Ser Ala Phe Pro Ser Gly Lys Pro Gln Pro His Ser1801 Ser Val Val Tyr Ser Glu Ala Gly Lys Asp Lys Gly Pro Pro Pro1816 Lys Ser Arg Tyr Glu Glu Glu Leu Arg Thr Arg Gly Lys Thr Thr1831 Ile Thr Ala Ala Asn Phe Ile Asp Val Ile Ile Thr Arg Gln Ile1846 Ala Ser Asp Lys Asp Ala Arg Glu Arg Gly Ser Gln Ser Ser Asp1861 Ser Ser Ser Ser Leu Ser Ser His Arg Tyr Glu Thr Pro Ser Asp1876 Ala Ile Glu Val Ile Ser Pro Ala Ser Ser Pro Ala Pro Pro Gln1891 Glu Lys Leu Gln Thr Tyr Gln Pro Glu Val Val Lys Ala Asn Gln1906 Ala Glu Asn Asp Pro Thr Arg Gln Tyr Glu Gly Pro Leu His His1921 Tyr Arg Pro Gln Gln Glu Ser Pro Ser Pro Gln Gln Gln Leu Pro1936 Pro Ser Ser Gln Ala Glu Gly Met Gly Gln Val Pro Arg Thr His1951 Arg Leu Ile Thr Leu Ala Asp His Ile Cys Gln Ile Ile Thr Gln1966 Asp Phe Ala Arg Asn Gln Val Ser Ser Gln Thr Pro Gln Gln Pro1981 Pro Thr Ser Thr Phe Gln Asn Ser Pro Ser Ala Leu Val Ser Thr1996 Pro Val Arg Thr Lys Thr Ser Asn Arg Tyr Ser Pro Glu Ser Gln2011 Ala Gln Ser Val His His Gln Arg Pro Gly Ser Arg Val Ser Pro2026 Glu Asn Leu Val Asp Lys Ser Arg Gly Ser Arg Pro Gly Lys Ser2041 Pro Glu Arg Ser His Val Ser Ser Glu Pro Tyr Glu Pro Ile Ser2056 Pro Pro Gln Val Pro Val Val His Glu Lys Gln Asp Ser Leu Leu2071 Leu Leu Ser Gln Arg Gly Ala Glu Pro Ala Glu Gln Arg Asn Asp2086 Ala Arg Ser Pro Gly Ser Ile Ser Tyr Leu Pro Ser Phe Phe Thr2101 Lys Leu Glu Asn Thr Ser Pro Met Val Lys Ser Lys Lys Gln Glu2116 Ile Phe Arg Lys Leu Asn Ser Ser Gly Gly Gly Asp Ser Asp Met2131 Ala Ala Ala Gln Pro Gly Thr Glu Ile Phe Asn Leu Pro Ala Val2146 Thr Thr Ser Gly Ser Val Ser Ser Arg Gly His Ser Phe Ala Asp2161 Pro Ala Ser Ash Leu Gly Leu Glu Asp Ile Ile Arg Lys Ala Leu2176 Met Gly Ser Phe Asp Asp Lys Val Glu Asp His Gly Val Val Met2191 Ser Gln Pro Met Gly Val Val Pro Gly Thr Ala Asn Thr Ser Val2206 Val Thr Ser Gly Glu Thr Arg Arg Glu Glu Gly Asp Pro Ser Pro2221 His Ser Gly Val Cys Lys Pro Lys Leu Ile Ser Lys Ser Asn Ser2236 Arg Lys Ser Lys Ser Pro Ile Pro Gly Gln Gly Tyr Leu Gly Thr2251 Glu Arg Pro Ser Ser Val Ser Ser Val His Ser Glu Gly Asp Tyr2266 His Arg Gln Thr Pro Gly Trp Ala Trp Glu Asp Arg Pro Ser Ser2281 Thr Gly Ser Thr Gln Phe Pro Tyr Asn Pro Leu Thr Met Arg Met2296 Leu Ser Ser Thr Pro Pro Thr Pro Ile Ala Cys Ala Pro Ser Ala2311 Val Asn Gln Ala Ala Pro His Gln Gln Asn Arg Ile Trp Glu Arg2326 Glu Pro Ala Pro Leu Leu Ser Ala Gln Tyr Glu Thr Leu Ser Asp2341 Ser Asp Asp(2)SEQ ID NO.21的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.21TGTAGTCGAC ATGTCAAGTT CAGTTATCC 29(2)SEQ ID NO.22的信息(i)序列特征(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.22TGTAGTCGAC ATGATTGCTA GGAGTGAGCA TG 32(2)SEQ ID NO.23的信息(i)序列特征(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.23TGTAGTCGAC ATGTCAATGA GGGAGTCTCC TG 32(2)SEQ ID NO.24的信息(i)序列特征(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.24TGTAGGATCC ATGCAGGACA GCTTGCTGCT CT 32(2)SEQ ID NO.25的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.25CCTCAAGCTT TTAATTACTT TCCTGCTCA 29(2)SEQ ID NO.26的信息(i)序列特征(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.26CCTCAAGCTT TTAAGCAGAA ACAGTGGAAG CG 32(2)SEQ ID NO.27的信息(i)序列特征(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.27CCTCGTCGAC TTAACTTGGG TAACCTGGAG TT 32(2)SEQ ID NO.28的信息(i)序列特征(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.28CCTCGTCGAC TTATTCCATC ATTTCTTCAT CA 32(2)SEQ ID NO.29的信息(i)序列特征(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.29TGTAAAGCTT ATGATTGCTA GGAGTGAGCA TG 32(2)SEQ ID NO.30的信息(i)序列特征(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.30TGTAAAGCTT ATGCTTGACA ACCTCTTACA GC 32(2)SEQ ID NO.31的信息(i)序列特征(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.31TGTAAAGCTT ATGTATGCTC TCTACCAGCG AC 32(2)SEQ ID NO.32的信息(i)序列特征
(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.32TGTAAAGCTT ATGCGGAGCC ACCTGCCCAC GC 32(2)SEQ ID NO.33的信息(i)序列特征(A)长度32碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.33CCTCGAGCTC TTAAGCAGAA ACAGTGGAAG CG 32(2)SEQ ID NO.34的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.34CCTCGAGCTC TTACTGTTCT TGTCTCTGCC GC 32(2)SEQ ID NO.35的信息(i)序列特征(A)长度32碱基(B)类型核酸
(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.35CCTCGAGCTC TTATGTTGCT CTTGGTGTCC CC 32(2)SEQ ID NO.36的信息(i)序列特征(A)长度32.碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.36CCTCGAGCTC TTAAGATCTC TTCTCCACCT CC 3权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人HNRCR蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.19中从核苷酸75-7106位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.19中从核苷酸75-7106位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码一多肽,该多肽具有SEQ ID NO.20所示的序列。
3.如权利要求1所述的DNA分子,其特征在于,该序列是SEQ ID NO.19中核苷酸75-7106位的序列。
4.一种分离的HNRCR蛋白多肽,其特征在于,它包括具有SEQ ID NO.20氨基酸序列的多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.20序列的多肽。
6.一种载体,其特征在于,它含有权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞。
8.如权利要求7所述的宿主细胞,其特征在于,该细胞是大肠杆菌。
9.如权利要求7所述的宿主细胞,其特征在于,该细胞是真核细胞。
10.一种产生具有HNRCR蛋白活性的多肽的方法,其特征在于,该方法包括(a)将编码具有HNRCR蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成HNRCR蛋白表达载体,所述的核苷酸序列与SEQ ID NO.19中从核苷酸75-7106位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成HNRCR蛋白的重组细胞;(c)在适合表达HNRCR蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有HNRCR蛋白活性的多肽。
11.如权利要求10所述的方法,其特征在于,该序列为SEQ ID NO.19中从核苷酸75-7106位。
12.一种能与权利要求4所述的HNRCR蛋白多肽特异性结合的抗体。
13.一种核苷酸分子,其特征在于,它是权利要求1所述DNA分子的反义序列。
14.一种探针分子,其特征在于,它含有权利要求1所述的DNA分子中约8-1000个连续核苷酸。
全文摘要
本发明提供了一种新的人基因核苷酸序列。更具体地说,本发明涉及人HNRCR的cDNA序列,该序列编码的蛋白是核受体协阻抑物(nuclear receptorcoreceptor,简称NRCR)的同系物。本发明还涉及由该核苷酸序列编码的多肽,这些多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产方法。
文档编号C07K16/18GK1250094SQ98120919
公开日2000年4月12日 申请日期1998年10月6日 优先权日1998年10月6日
发明者余龙, 屠强, 赵勇, 张宏来, 赵寿元 申请人:上海新黄浦复旦基因工程有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1