用于视锥细胞中增强的基因表达的组合物和方法与流程

文档序号:11141204阅读:1787来源:国知局
用于视锥细胞中增强的基因表达的组合物和方法与制造工艺

根据35U.S.C.§119(e),本申请要求2014年3月17日提交美国临时专利申请序列号61/954,330和在2015年3月2日提交的美国临时专利申请序列号62/127,185的申请日的优先权,将其完整公开内容通过引用并入本文。

关于序列表的陈述

以文本格式提供与本申请相关的序列表以代替纸件,并且在此通过引用并入本说明书。含序列表的文本文件的名称是AVBI_005_02WO_ST25.txt。该文本文件为308KB,于2015年3月17日创建,并通过EFS-Web电子提交。

发明领域

本发明涉及视网膜疾病的基因疗法。

发明背景

眼睛的视觉病症常常涉及到视锥细胞中已知的主要缺陷。这些包括黄斑营养不良如斯塔加特黄斑营养不良,锥体营养不良,锥体-视杆营养不良,脊髓小脑性共济失调7型和巴尔得-别德尔综合征-1,以及色觉病症,包括全色盲,蓝色锥体单色视觉,和红色觉异常,绿色觉异常,和蓝色色觉缺陷。

除了其中已知的原因是锥体光感受器固有的那些病症外,存在可以通过靶向锥细胞被治疗的中心黄斑视觉病症(灵长类内)。这些病症包括年龄相关性黄斑退化症,黄斑毛细血管扩张,色素性视网膜炎,糖尿病性视网膜病,视网膜静脉闭塞,青光眼,索斯比眼底营养不良,成人卵黄状黄斑营养不良,贝斯特病,和X连锁视网膜劈裂症。

治疗和预防眼科疾病以解决现有的治疗的限制的有希望的方法是用基因治疗载体如腺伴随病毒(AAV)将治疗剂递送至眼。AAV是一个4.7kb的单链DNA病毒。基于AAV的重组载体与优异的临床安全性有关,因为野生型AAV是非致病性,并且与任何已知的疾病无病因学关联。此外,AAV提供了在许多组织,包括眼,肌肉,肺,脑中高效的基因递送和持续的转基因表达的能力。此外,AAV已经显示出在人类临床试验的希望。一个实例是利伯先天性黑蒙,其中用通过rAAV载体的单个视网膜下施用递送治疗剂治疗的患者经历了来自治疗剂的表达的持续临床益处,从治疗的起始日期起超过四年。

在设计用于基因疗法以一般性地治疗眼病且特别治疗视锥细胞的核苷酸盒和表达载体中仍然存在许多挑战。一个显著挑战是获得在靶细胞中,尤其是在视网膜的视锥细胞中转基因的足够表达。在本领域中一个长期未能满足的需要是基因转移后转基因的充分有力的表达。在某些情况下,对于某些载体,例如质粒DNA载体的功效需要更有效的表达。在其它情况下,更有效的基因表达盒是期望的,以允许具有更有利的安全性或的更少侵入的施用途径(例如,玻璃体内对视网膜下)的较低治疗剂量。在一些设置中,已使用强的,遍在的启动子实现有效表达,但通常希望使用仅在靶细胞类型中表达的核酸表达盒而具有高的转基因表达。

以前在视锥细胞中表达转基因所作的努力(例如如美国专利申请US 2012/0172419所公开的)显示出一些希望,但经常表达水平低于最佳或不是细胞特异性的。鉴于多种视觉病症由视锥细胞中的主要缺陷引起,转基因在视锥细胞中以高表达水平特异性表达将代表在本领域中一个有意义的进步。因此,仍然需要用于在视锥细胞中表达基因的改进的方法和优化的核酸盒和载体。

发明概述

本公开提供用于在视锥细胞中表达基因的多核苷酸盒,表达载体和方法。

在本发明的一些方面,提供了用于在哺乳动物视网膜视锥细胞中表达转基因的多核苷酸盒。在一些实施方案中,转基因的表达是被增强的表达。在某些实施方案中,编码序列的表达大于可操作地连接到SEQ ID NO:1的转基因的表达。在一些实施方案中,转基因的表达是视锥特异性的(cone-specific)。

在一些实施方案中,多核苷酸盒包含启动子区和多聚腺苷酸化位点,其中所述启动子区促进基因在视网膜视锥细胞中的表达。在一些实施方案中,表达特异性在视锥细胞中。在一些这样的实施方案中,启动子区包括多核苷酸序列,其与选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:79,SEQ ID NO:80,SEQ ID NO:81,SEQ ID NO:82,SEQ ID NO:83的序列或其功能性片段具有85%或更多的序列同一性。在一些实施方案中,启动子区的长度小于492个核苷酸。在一些实施方案中,启动子区基本上由与SEQ ID NO:55的全长或其功能性片段具有85%或更多的序列同一性的多核苷酸组成。

在一些实施方案中,多核苷酸盒包含编码用于编码序列的5’非翻译区的多核苷酸序列,在本文中称为5’UTR。在一些这样的实施方案中,5’UTR包括与选自SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:84,SEQ ID NO:85,SEQ ID NO:86,SEQ ID NO:87,SEQ ID NO:88,和SEQ ID NO:89的序列或其片段具有85%或更多的序列同一性的序列。在一些实施方案中,一些或所有的5’UTR序列包含在如例如SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,或SEQ ID NO:79所公开的启动子区中。在一些实施方案中,5’UTR序列是与启动子序列异源的。在一些实施方案中,5’UTR基本上由与SEQ ID NO:85或SEQ ID NO:86的全长或其片段具有85%或更多的序列同一性的序列组成。在一些实施方案中,5’UTR不包含多核苷酸ATG。

在一些实施方案中,多核苷酸盒包含内含子。在一些这样的实施方案中,内含子包括与选自SEQ ID NO:5,SEQ ID NO:59,和SEQ ID NO:60的序列或具有85%或更多的序列同一性的序列。在某些实施方案中,内含子位于编码5’UTR的多核苷酸序列内。

在一些实施方案中,多核苷酸盒包含翻译起始序列。在一些这样的实施方案中,翻译起始序列包含基本上由SEQ ID NO:72或SEQ ID NO:73组成的多核苷酸序列。

在一些实施方案中,多核苷酸盒包括增强子序列。在一些这样的实施方案中,增强子序列包括与SEQ ID NO:52或其功能性片段具有85%或更多的序列同一性的多核苷酸序列。在某些实施方案中,增强子序列基本上由与SEQ ID NO:51的全长具有85%或更多的序列同一性的序列组成。

在一些实施方案中,多核苷酸盒包含可操作地连接于启动子的编码序列。在一些实施方案中,编码序列是与启动子区和/或5’UTR序列异源的。在一些实施方案中,编码序列编码多肽,其与SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49和SEQ ID NO:11的同质多象变体具有至少85%,90%,或95%的序列同一性,所述SEQ ID NO:11的同质多象变体选自(i)Thr65Ile(ii)Ile111Val(iii)Ser116Tyr(iv)Leu153Met(v)Ile171Val(vi)Ala174Val(vii)Ile178Val(viii)Ser180Ala(ix)Ile230Thr(x)Ala233Ser(xi)Val236Met(xii)Ile274Val(xiii)Phe275Leu(xiv)Tyr277Phe(xv)Val279Phe(xvi)Thr285Ala(xvii)Pro298Ala;和(xviii)Tyr309Phe。在一些实施方案中,编码序列与SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:61,SEQ ID NO:62,SEQ ID NO:63,SEQ ID NO:64,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:67,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,或SEQ ID NO:71具有至少85%,90%,或95%的序列同一性。在一些实施方案中,转录起始位点和编码序列的末端之间的序列不含除转基因的可读框外的长度超过500个核苷酸的可读框。在一些实施方案中,转录起始位点和编码序列的末端之间的序列不含除转基因的可读框外的长度超过273个核苷酸的可读框。在一些实施方案中,转录起始位点和编码序列的末端之间的序列不含除转基因的可读框外的长度超过250个核苷酸的可读框。在一些实施方案中,编码序列中的至少一个可读框已被去除。

在一些实施方案中,多核苷酸包含启动子区,其中该启动子区促进基因在视网膜视锥细胞中的表达;5’非翻译区;内含子;翻译起始序列;可操作地连接至启动子区的编码序列;和多聚腺苷酸化位点。在一些实施方案中,多核苷酸包含启动子区,其中该启动子区促进了在视锥细胞中特异性的基因表达;5’非翻译区;内含子;翻译起始序列;可操作地连接至启动子区的编码序列;和多聚腺苷酸化位点。

在本发明的一些方面中,提供了基因递送载体,其包括本发明的多核苷酸盒。在一些实施方案中,基因递送载体是重组腺伴随病毒,其中所述重组腺伴随病毒包括AAV壳体蛋白。在一些实施方案中,所述AAV壳体蛋白是野生型的AAV壳体蛋白。在其它实施方案中,所述AAV壳体蛋白是AAV壳体蛋白变体。在某些实施方案中,AAV壳体蛋白变体包含插入到AAV GH环的肽,其选自LGETTRP(SEQ ID NO:96),NETITRP(SEQ ID NO:97),KAGQANN(SEQ ID NO:98),KDPKTTN(SEQ ID NO:99),KDTDTTR(SEQ ID NO:100),RAGGSVG(SEQ ID NO:101),AVDTTKF(SEQ ID NO:102),和STGKVPN(SEQ ID NO:103)。

在本发明的一些方面中,提供了包含本发明的多核苷酸盒和药用赋形剂的药物组合物。在一些实施方案中,药物组合物包含本发明的基因递送载体和药用赋形剂。

在本发明的一些方面,提供了用于在视锥细胞中表达转基因的方法。在一些实施方案中,该方法包括使一种或多种视锥细胞与有效量的本发明的多核苷酸盒或本发明的基因递送载体接触,其中所述转基因在一个或多个视锥细胞中以可检测的水平表达。在一些实施方案中,该方法是体外的。在其它实施方案中,该方法是体内的。在某些这样的实施方案中,接触包括将多核苷酸盒或基因递送载体注射到哺乳动物眼玻璃体中。在其它这类实施方案中,该方法包括将多核苷酸盒或基因递送载体注射到哺乳动物眼的视网膜下间隙中。在一些实施方案中,该方法还包括检测转基因在视锥细胞中的表达,其中在80%或更多的视锥细胞中检测到表达。在一些实施方案中,表达是视锥细胞特异性的。

在本发明的一些方面,提供了用于在需要治疗或预防视锥细胞病症的哺乳动物中治疗或预防视锥细胞病症的方法。在一些实施方案中,该方法包括将有效量的本发明的药物组合物施用于哺乳动物的眼,其中编码序列编码治疗性基因产物。在一些实施方案中,施用包括将药物组合物注射到哺乳动物眼玻璃体中。在其它这类实施方案中,该方法包括将药物组合物注射到哺乳动物眼睛的视网膜下间隙中。

在一些实施方案中,视锥细胞病症是色觉病症。在某些实施方案中,色觉病症选自下组:全色盲,蓝锥单色视(blue cone monochromacy),红色觉异常缺陷,绿色觉异常缺陷和蓝色色觉缺陷。在一些这样的实施方案中,该方法还包括检测在所述疾病症状的变化,其中所述变化包括哺乳动物感知颜色的能力的增加。在一些实施方案中,视锥细胞病症是黄斑营养不良。在某些实施方案中,黄斑营养不良选自:斯塔加特黄斑营养不良,锥体营养不良,锥体-视杆营养不良,脊髓小脑性共济失调7型和巴尔得-别德尔综合征-1。在一些实施方案中,视锥细胞病症是中央黄斑视觉病症。在某些实施方案中,中央黄斑视觉病症选自年龄相关性黄斑退化症,黄斑毛细血管扩张,色素性视网膜炎,糖尿病性视网膜病,视网膜静脉闭塞,青光眼,索斯比眼底营养不良,成人卵黄状黄斑营养不良,贝斯特病,锥体营养不良,利伯先天性黑蒙,和X连锁视网膜劈裂症。在一些这样的实施方案中,该方法还包括检测所述疾病的症状的变化。在一些这样的实施方案中,变化包括在视锥细胞的健康的稳定化和/或哺乳动物视敏度丧失的速率降低。在某些这样的实施方案中,变化包括视锥细胞健康的改善和/或哺乳动物视敏度的改善。

附图简述

本公开的新的特征在所附权利要求书中具体阐述。通过参考以下详细描述和附图将更好的理解本发明的特征和优点,所述详细描述给出了其中利用了本发明的原理的说明性实施方案。

图1A描述用于在视锥细胞中增强的转基因表达的多核苷酸盒的示意性概述。

图1B描述包括用于在视锥细胞中增强的转基因表达的多核苷酸盒的病毒载体的示意性概述。

图2描述含有标准特征的内含子实例,所述标准特征包括用于剪接供体的共有序列(A/C)A G G T Pu A G U;分支位点C T Pu A Py;Py-富集区;和受体N C A G G。

图3A示出了5’UTR mRNA结构(SEQ ID NO:56)的实例,所述5’UTR mRNA结构来自pR2.1(Mancuso et al.)。该5’UTR具有两个上游AUG和可读框(ORF),高水平的碱基配对和发夹结构,和较短的Kozak序列。

图3B描述了来自本公开的一个优化的盒的5’UTR mRNA和结构(SEQ ID NO:57)的实例。5’UTR不包含上游AUG和ORF。此外,相比于图3A的5’UTR,图3B的5’UTR更短,具有更少的碱基配对,而Kozak序列更长。

图4A描绘密码子优化前的多核苷酸盒。长度超过250个核苷酸的可读框(ORF)在序列的下方显示为灰色。

图4B描述了密码子优化后,但在除去非转基因ORF前的多核苷酸盒。超过250个核苷酸的ORF在序列的下方显示为灰色。注意,在相反方向引入新的ORF,从SV40多聚A开始并延伸1365个碱基。

图4C描述了密码子优化并除去ORF后的多核苷酸盒。超过250个核苷酸的ORF在序列的下方显示为灰色。注意,该序列已被优化,以缩短或除去新引入的ORF。

图5显示经玻璃体递送的AAV2变体AAV2-7m8如何比经玻璃体内递送的AAV2更有效地转导灵长类的中央凹和旁中心凹中的视网膜细胞。将在50uL的体积中的5x1011AAV2.CMV.GFP(左上);AAV-2.5T.CMV.GFP(右上)(Excoffon K.J.,et al.2009.Proc.Natl.Acad.Sci.U.S.A.106:3865–3870);(左下)AAV2-7.8.CMV.GFP(Dalkara D,et al.Sci Transl Med.2013Jun 12;5(189):189ra76);或AAV-ShH10.CMV.GFP(右下)(Klimczak RR et al.PLoS One.2009Oct 14;4(10):e7467)的载体基因组注射到非洲绿猴的玻璃体中,并且8周后通过OCT体内荧光成像观察到GFP表达。

图6显示pMNT调节盒如何强烈地促进在灵长类的中心凹锥中的基因表达。(a-b)将AAV2-7m8.MNTC.GFP注入狒狒的中央玻璃体中并且在(a)5周和(b)8周后通过眼底荧光观察表达,(c和d)在注射AAV2-7m8.MNTC.GFP后大约6个月,在低放大倍数(c)和高放大倍率(d)下小凹(fovea)的15微米切片中的天然GFP荧光。

图7显示在玻璃体内注射AAV递送的MNTC.GFP后,在小鼠视网膜的视锥中强烈和锥体特异性的基因表达。(a-b)在通过玻璃体注射使小鼠接受经玻璃体内注射的5.04x 1010载体基因组后11周,GFP荧光的实例。(c-e)在注射后14周,收获视网膜用于组织学,并且用针对L/M视蛋白(红色)的抗体标记锥视细胞外节段。在(c)中,红色通道关闭,因此只有天然的GFP是可见的,(d)相同的图像,其中红色通道开启以允许锥视细胞外节段可见。(c)和(d)的比较表明,大多数(如果不是全部)锥体被病毒转导。(e)从不同角度看与在c和d中来自相同视网膜的图像,显示锥体光感受器的概貌。

图8显示通过pMNTC调节盒指导的在蒙古沙土鼠(Mongolian gerbil)视网膜锥体中的基因表达。将在5uL的体积中的1x 1010-2x 1010携带在CMV,pR2.1或MNTC启动子控制下的GFP的病毒载体基因组注射到蒙古沙土鼠的玻璃体中,并由眼底荧光成像在指定的时间点目视GFP表达。(a)在玻璃体内施用后4周后目视的由AAV2-7m8.CMV.GFP和AAV2-7m8.MNTC.GFP指导的GFP表达。用AAV2-7m8.CMV.GFP注射沙土鼠12-10,12-11和12-12,而用AAV2-7m8.MNTC.GFP注射沙土鼠12-13,12-14,12-15。OD,右眼(oculus dexter)(右眼)。OS,左眼(oculus sinister)(左眼)。(b)在4和8周后AAV2-7m8.pR2.1.GFP和AAV2-7m8.MNTC.GFP指导的GFP表达,如通过眼底荧光成像检测。

图9A-9D表明pMNT调节盒在灵长类的中心凹锥中提供了比锥体启动子pR2.1更强烈的基因表达。如所指示,将5x 1011的AAV2-7m8.MNTC.GFP或AAV2-7m8.pR2.1.GFP载体基因组在50uL的体积中注射到非洲绿猴的玻璃体中(AAV2-7m8.MNTC.GFP注射到动物271和472;AAV2-7m8.pR2.1.GFP注射到动物500和509)。在(a)2周,(b)4周,(c)8周,和(d)12周时,使用眼底荧光照相机(a,b,c,d)或在Heidelberg Spectralis OCT上的自体荧光(a,b;未显示8和12周的数据)体内显现视网膜的GFP。OD,右眼(右眼)。OS,左眼(左眼)。

图10A-10D表明每一经优化的pMNTC元件对观察到的更强健的表达的贡献。(a)pMNTC和pR2.1表达盒,(b)实验的表达盒,其中在pMNTC中的每个元件被逐一替换为pR2.1中相应的元件。(c,d)在用每一测试制品(n=每个构建体6-8只眼睛)玻璃体内注射的沙土鼠的视网膜中的萤光素酶转基因表达,如在注射(c)4周和(d)8周后通过IVIS成像检测的。“7m8.CMV”充当阳性对照。

定义

如本文中使用的,“载体”是指包含多核苷酸或与多核苷酸联合,并且可用于介导多核苷酸至细胞中的递送的大分子或大分子联合。示例性载体包括,例如,质粒,病毒载体,脂质体和其它基因递送载体。

术语“AAV”是腺伴随病毒的缩写,并且可以用来指代病毒本身或其衍生物。除非另外要求,该术语涵盖所有亚型以及天然存在的和重组的形式两者。术语“AAV”包括AAV 1型(AAV-1),AAV2型(AAV-2),AAV3型(AAV-3),AAV4型(AAV-4),AAV5型(AAV-5)病毒,AAV 6型(AAV-6),AAV7型(AAV-7),AAV 8型(AAV-8),禽AAV,牛AAV,犬AAV,马AAV,灵长类AAV,非灵长类AAV,和羊AAV。“灵长类AAV”是指感染灵长类的AAV,“非灵长类AAV”是指感染非灵长类哺乳动物的AAV,“牛AAV”是指感染牛哺乳动物的AAV,等。

“AAV病毒”或“AAV病毒颗粒”或“rAAV载体颗粒”指的是由至少一种AAV壳体蛋白(通常由野生型AAV的所有壳体蛋白)构成的病毒颗粒和壳体化的多核苷酸rAAV载体。如果颗粒包含异源多核苷酸(即除野生型AAV基因组之外的多核苷酸,如待递送到哺乳动物细胞中的转基因),那么它通常被称为“rAAV载体颗粒”或简称为“rAAV载体“。因此,产生rAAV颗粒必然包括产生rAAV载体,因为这种载体被包含在rAAV颗粒内。

如本文使用的术语“复制缺陷型”相对于本发明的AAV的病毒载体指的是不能独立复制和包装其基因组的AAV载体。例如,当受试者的细胞感染了rAAV病毒体,异源基因在感染的细胞中表达,但是,由于被感染的细胞缺乏AAV rep和cap基因和附属的功能基因的事实,rAAV不能够进一步复制。

如本文中使用的,“AAV变体”或“AAV突变体”是指由以下构成的病毒颗粒:a)变体AAV壳体蛋白,其中该变体AAV壳体蛋白相对于相应的亲本AAV壳体蛋白包含至少一个氨基酸差异(例如,氨基酸取代,氨基酸插入,氨基酸缺失),并且其中相比于包含相应的亲本AAV壳体蛋白的AAV病毒体对视网膜细胞的感染性,变体壳体蛋白赋予增加的视网膜细胞的感染性,其中所述AAV壳体蛋白不包含存在于天然存在的AAV壳体蛋白中的氨基酸序列;和b)异源核酸,其包含编码异源基因产物的核苷酸序列。

缩写“rAAV”指的是重组腺伴随病毒,也称为重组AAV载体(或“rAAV载体”)。如本文中使用的,“rAAV载体”是指包含不是AAV起源的多核苷酸序列的AAV载体(即,与AAV异源的多核苷酸),所述多核苷酸序列通常是对于细胞的遗传转化感兴趣的序列。在一般情况下,异源多核苷酸旁侧是至少一个,并且通常两个AAV反向末端重复序列(ITR)。术语rAAV载体包括rAAV载体颗粒和rAAV载体质粒二者。

如本文中使用的,术语“基因”或“编码序列”是指编码基因产物的体外或体内的核苷酸序列。在一些情况下,基因由或基本上由编码序列组成,即,编码基因产物的序列。在其它情况中,基因包括附加的非编码序列。例如,基因可以或可以不包括编码区之前和之后的区域,例如5’非翻译(5’UTR)或“前导”序列和3’UTR或“非转录尾区(trailer)”序列,以及各个编码区段(外显子)之间的插入序列(内含子)。

如本文中使用的,“治疗性基因”是指下述基因,该基因在表达时赋予其存在的细胞或组织,或在表达该基因的哺乳动物以有益效应。有益效应的实例包括状况或疾病的体征或症状的改善,状况或疾病的预防或抑制,或赋予期望的特征。治疗性基因包括校正细胞或哺乳动物中的基因缺陷的基因。

如本文中使用的,转基因是通过载体递送至细胞中的基因。

如本文中使用的,术语“基因产物”是指多核苷酸序列的希望表达的产物,如多肽,肽,蛋白质或干扰RNA,包括短干扰RNA(siRNA),miRNA或小发夹RNA(shRNA)。

如本文中使用的,术语“多肽”,“肽”和“蛋白质”是指任何长度的氨基酸的聚合物。该术语还包括已被修饰的氨基酸聚合物;例如,二硫键形成,糖基化,脂质化,磷酸化,或与标记组分缀合。

“包含”是指例如在组合物,方法,试剂盒等中需要的所记叙的元件,但可包括其它元件以形成例如权利要求的范围中的组合物,方法,试剂盒等。例如,除基因和启动子外,在“包含”可操作地连接到启动子的编码治疗性多肽的基因的表达盒可以包括其它元件,如多聚腺苷酸化序列,增强子元件,其它基因,接头域,等。

“基本上由...组成指的是例如所描述的组合物,方法,试剂盒等的范围限于指定的材料或步骤,其不实质上影响例如组合物,方法,试剂盒等的基本和新颖的特征。例如,“基本上由可操作地连接到启动子和多聚腺苷酸化序列的编码治疗性多肽的基因组成”的表达盒可包括附加的序列,例如接头序列,只要它们不实质上影响该基因的转录或翻译。作为另一实例,“基本上由所记叙的序列组成”的变体,或突变体,多肽片段具有所记叙的氨基酸序列和基于其来源的全长未处理多肽在所述序列的边界处加或减约10个氨基酸残基,如比所记叙的限制(bounding)氨基酸残基少10,9,8,7,6,5,4,3,2或1个残基,或比所记叙的限制氨基酸残基多1,2,3,4,5,6,7,8,9,或10个残基。

“由......组成是指排除未在权利要求中指定的组合物,方法或试剂盒的任何元件,步骤或成分。例如,“由可操作连接到启动子和多腺苷酸化序列的编码治疗性多肽的基因组成”的表达盒仅由启动子,编码治疗性多肽的多核苷酸序列和多聚腺苷酸化序列组成。作为另一实例,“由所记叙的序列组成的多肽”仅包含所记叙的序列。

如本文中使用的,术语“序列同一性”,例如“%序列同一性”,是指当使用核苷酸序列比对程序比对时,两个或更多个多核苷酸之间的同一性程度;或当使用氨基酸序列比对程序比对时,两个或更多个多肽序列之间的同一性程度。相似地,在两个或更多个核苷酸或氨基酸序列的上下文中使用时,术语“相同的”或百分比“同一性”指的是当为最大对应而比较和比对(例如使用序列比较算法测量,例如Smith-Waterman算法等,或者通过目视检查)时,两个序列是相同的或具有氨基酸残基或核苷酸的指定百分比。例如,可以使用已被掺入GCG软件包中的GAP程序中的Needleman和Wunsch算法(1970,J.Mol.Biol.48:444-453),使用Blossum 62矩阵或PAM250矩阵,16,14,12,10,8,6,4的缺口权重,和1,2,3,4,5,或6的长度权重,来测定两个氨基酸序列之间的同一性百分比。作为另一个实例,使用GCG软件包中的GAP程序,使用NWSgapdna CMP矩阵和40,50,60,70,或80的缺口权重和1,2,3,4,5,或6的长度权重,也可以确定两个核苷酸序列之间的同一性百分比。特别优选的参数组(和除非另有规定应当使用的参数)是Blossum 62评分矩阵,其具有12的缺口罚分,4的缺口延伸罚分,和5的移码缺口罚分。还可以使用已被掺入ALIGN程序(2.0版)的E.Meyers和W.Miller的算法(1989,Cabios,4:11-17),使用PAM120权重残基表,12的缺口长度罚分和4的缺口罚分,确定两个氨基酸或核苷酸序列之间的同一性百分比。可以将本文描述的核酸和蛋白质序列用作“查询序列”以针对公共数据库进行搜索,以例如鉴定其它家族成员或相关的序列。可以使用Altschul,et al.,(1990,J.Mol.Biol,215:403-10)的NBLAST和XBLAST程序(第2.0版)进行这样的搜索。BLAST核苷酸搜索可以用NBLAST程序进行,其中得分=100,字长=12,以获得与本发明的核酸分子同源的核苷酸序列。BLAST蛋白质检索可以用XBLAST程序进行,得分=50,字长=3,以获得与本发明的蛋白质分子同源的氨基酸序列。为获得用于比较目的的缺口比对,可如在Altschul等人,(1997,Nucleic Acids Res,25:3389-3402)中描述的那样利用Gapped BLAST。当使用BLAST和Gapped BLAST程序时,可以使用各自程序(例如XBLAST和NBLAST)的默认参数。

术语“%同源性”在本文中可与“%同一性”互换使用,指的是当使用序列比对程序比对时,两个或更多个比对的序列之间的核酸或氨基酸序列同一性的水平。例如,如本文中使用的,80%的同源性与由限定的算法确定的80%的序列同一性的含义相同,并且相应地给定的序列的同源性具有在给定序列的长度上大于80%序列同一性。

如本文中使用的,术语“互补”和“互补的”是指能够通过在反向平行核苷酸序列中的互补碱基残基之间形成氢键后彼此配对的两个反向平行的核苷酸序列。例如,shRNA可能与靶序列是互补的,即,100%互补或基本上互补的,例如80%互补的,85%互补的,90%互补的,95%互补的,98%互补的,或更多。如本文中使用的,术语“表达”包括细胞中的内源基因,转基因或编码序列的转录和/或翻译。

如本文中使用的,“表达载体”包括包含编码感兴趣的基因产物的多核苷酸的如上文讨论的或本领域中已知的载体,例如质粒,小环(minicircle),病毒载体,脂质体等,并用于实现基因产物在预期的靶细胞中的表达。表达载体还包括可操作地连接到编码区,以促进基因产物在靶标中表达的控制元件。控制元件,例如启动子,增强子,UTR,miRNA靶向序列等,以及与其可操作地连接以用于表达的一个或多个基因的组合有时称为“表达盒”。许多这样的控制元件是本领域已知的和可获得的或者可以从本领域可获得的组分容易地构建。

如本文中使用的,“启动子”包括指导RNA聚合酶的结合,从而促进RNA的合成的DNA序列,即,足以指导转录的最小序列。启动子和相应的蛋白质或多肽表达可以是普遍存在的,意味着在宽范围的细胞,组织和物种或细胞类型特异性,组织特异性,或特定物种中有强活性。启动子可以是“组成型”,意味着连续活性,或是“诱导型”,意味着该启动子可通过生物或非生物因子的存在或不存在而被激活或失活。在本发明的核酸构建体或载体中也包括增强子序列,其可以或不可以与启动子序列连续。增强子序列影响启动子依赖的基因表达,并且可以位于天然基因的5’或3'区域。

如本文中使用的,“增强子”包括刺激或抑制相邻基因转录的顺式作用元件。抑制转录的增强子也被称为“沉默基因”。增强子可以在任一方位上,如与编码序列和与转录区下游的位置的多达几千碱基对(kb)的距离里起作用(即,可以与编码序列相关联)。

如本文中使用的,“终止信号序列”包括导致RNA聚合酶终止转录的任何遗传元件,诸如例如多聚腺苷酸化信号序列。

如本文中使用的,“多聚腺苷酸化信号序列”包括对于RNA转录物的内切核酸酶切割必需的识别区域,在其之后是多聚腺苷酸化共有序列AATAAA。多聚腺苷酸化信号序列提供了“聚A”位点,即在RNA转录物上将通过转录后多聚腺苷酸化而添加有腺嘌呤残基的位点。

如本文中使用的,术语“可操作地连接”指的是遗传元件,例如启动子,增强子,终止信号序列,多聚腺苷酸化序列等的并排,其中所述元件处于允许它们以期望的方式操作的关系中。例如,如果启动子有助于起始编码序列的转录,那么启动子可操作地连接到编码区。在启动子和编码区之间可以存在插入的残基,只要维持这种功能关系。如本文中使用的,术语“异源”意味着与同其比较的实体的剩余部分来源于在基因型上截然不同的实体。例如,通过遗传工程技术导入源自不同物种的质粒或载体中的多核苷酸是异源多核苷酸。作为另一实例,从其天然编码序列中取出并可操作地连接到与其不天然连接的编码序列的启动子是异源启动子。因此,例如,包括编码异源基因产物的异源核酸的rAAV是包括通常在天然存在的野生型AAV中不包括在内的核酸的rAAV,并且所编码的异源基因产物是通常不被天然存在的野生型AAV编码的基因产物。

如本文中使用的,术语“内源性”就核苷酸分子或基因产物而言是指天然存在于宿主病毒或细胞中或与宿主病毒或细胞相关联的核酸序列,例如基因或遗传元件或基因产物,例如RNA,蛋白质。

如本文中使用的,术语“天然”是指存在于野生型病毒或细胞中的核苷酸序列,例如基因,或基因产物,例如RNA,蛋白质。如本文中使用的,术语“变体”是指参考多核苷酸或多肽序列,例如天然多核苷酸或多肽序列的突变体,即其与参考多核苷酸或多肽序列具有小于100%的序列同一性。换句话说,相对于参考多核苷酸序列,例如天然多核苷酸或多肽序列,变体包含至少一种氨基酸差异(例如,氨基酸取代,氨基酸插入,氨基酸缺失)。例如,变体可以是与全长天然多核苷酸序列具有70%或更高的序列同一性的多核苷酸,例如与全长天然多核苷酸序列的75%或80%以上的同一性,诸如85%,90%,或95%或更多,例如,98%或99%的同一性。作为另一实例,变体可以是与全长天然多肽序列具有70%或更高的序列同一性的多肽,例如与全长天然多肽序列的75%或80%以上的同一性,诸如85%,90%,或95%或更多,例如,98%或99%的同一性。变体还可以包括参考序列,例如天然序列的变体片段,其与参考序列,例如天然序列的片段共享70%或更高的同一性,例如与天然序列的75%或80%以上的同一性,诸如85%,90%,或95%或更多,例如,98%或99%的同一性。

如本文中使用的,术语“生物活性”和“生物学活性”是指归因于细胞中的特定生物元件的活性。例如,“免疫球蛋白”,“抗体”或其片段或变体的“生物活性”是指结合抗原决定簇,从而促进免疫功能的能力。作为另一实例,多肽或功能性片段或其变体的生物活性是指该多肽或功能性片段或其变体来进行其天然功能,例如,结合,酶活性等的能力。作为第三个实例,基因调控元件,例如启动子,增强子,Kozak序列等的生物活性,是指调控元件或功能片段或其变体调节,即分别促进,增强,或激活与其可操作地连接的基因表达的能力。

如本文中使用的,术语“施用”或“引入”,指将用于重组蛋白表达的载体递送至受试者的细胞,和/或器官,或受试者。这样的施用或引入可发生在体内,体外或离体。可通过转染将用于表达基因产物的载体引入到细胞中,其通常意味着通过以下方式将异源DNA插入到细胞中:物理手段(例如,磷酸钙转染,电穿孔,显微注射或脂转染);感染,其通常是指通过病原体即病毒的方式引入;或转导,其通常是指用病毒稳定感染细胞或通过病毒媒介物(例如,噬菌体)将遗传物质从一种微生物转移到另一种微生物。

“转化”通常用于指包含异源DNA的细菌或表达癌基因并因此已经被转换成连续的生长模式的细胞,例如肿瘤细胞。用于“转化”细胞的载体可以是质粒,病毒或其它媒介物。

通常情况下,细胞被称为“转导”,“感染”;“转染”或“转化”,这取决于用于将异源DNA(即,载体)施用,引入或插入到细胞中的手段。不管引入异源DNA的方法如何,术语“转导”,“转染”和“转化”可以互换使用。

如本文中使用的,术语“宿主细胞”,指的是已用载体转导,感染,转染或转化的细胞。该载体可以是质粒,病毒颗粒,噬菌体等。培养条件,如温度,pH等,是先前与选择用于表达的宿主细胞一起使用的那些培养条件,并且对于本领域技术人员将是显而易见的。应当理解的是,术语“宿主细胞”是指原始转导的,感染,转染的或转化的细胞和其后代。

在本文中使用术语“治疗/处理”等,一般意指获得希望的药理学和/或生理学效应。效应可以是预防性的,就完全或部分地预防疾病或其症状而言,例如减少疾病或其症状在受试者中发生的可能性,和/或可以是治疗性的,就部分或完全治愈疾病和/或可归因于该疾病的不良反应而言。如本文使用的,“治疗/处理”覆盖在哺乳动物中疾病的任何治疗,并且包括:(1)预防疾病在可以具有疾病素因,但尚未诊断为患有它的受试者中发生;(b)抑制疾病,即,阻止其发展;或(c)缓解疾病,即,引起疾病的消退。治疗剂可以在疾病或损伤的发作前,发作期间或发作后施用。治疗进行中的疾病(其中治疗稳定或减少患者的不希望的临床症状)是特别感兴趣的。期望地,这种治疗在受影响的组织功能完全丧失之前进行。希望在疾病的症状阶段(symptomatic stage)施用主题治疗,并且在一些情况下在疾病的症状阶段之后施用。

术语“个体”,“宿主”,“受试者”和“患者”在本文可互换使用,并且是指哺乳动物,包括,但不限于,人类和非人类灵长类,包括猿和人类;哺乳动物运动动物(sport animal)(例如,马);哺乳动物农场动物(例如,绵羊,山羊等);哺乳动物宠物(犬,猫等);和啮齿动物(例如,小鼠,大鼠等)。

本发明的多种组合物和方法如下所述。虽然在本文中举例说明了特定的组合物和方法,可以理解许多备选组合物和方法中的任一种适用和适合于实践本发明。也可以理解,可以使用本领域的标准方法进行本发明的表达构建体和方法的评估。

除非另有说明,本发明的实践将采用细胞生物学,分子生物学(包括重组技术),微生物学,生物化学和免疫学的常规技术,这是本领域的技术人员的范围之内。这些技术在文献中充分解释,诸如"Molecular Cloning:A Laboratory Manual",second edition(Sambrook et al.,1989);"Oligonucleotide Synthesis"(M.J.Gait,ed.,1984);"Animal Cell Culture"(R.I.Freshney,ed.,1987);"Methods in Enzymology"(Academic Press,Inc.);"Handbook of Experimental Immunology"(D.M.Weir&C.C.Blackwell,eds.);"Gene Transfer Vectors for Mammalian Cells"(J.M.Miller&M.P.Calos,eds.,1987);"Current Protocols in Molecular Biology"(F.M.Ausubel et al.,eds.,1987);"PCR:The Polymerase Chain Reaction",(Mullis et al.,eds.,1994);和"Current Protocols in Immunology"(J.E.Coligan et al.,eds.,1991),将每一篇文献通过引用明确并入本文。.

以下参照用于说明的实例应用描述了本发明的几个方面。应当理解的是,给出了许多具体的细节,关系和方法以提供对本发明的充分理解。然而,相关领域的普通技术人员将容易认识到可以在没有一个或多个具体细节的情况下或用其它方法实施本发明。本发明不受动作(act)或事件的所示顺序的限制,因为一些动作可以以不同的次序发生和/或与其它动作或事件同时进行。此外,并非需要所示的全部作用或事件来实现根据本发明的方法。

本文所使用的术语仅用于描述具体实施方案的目的,并非意在限制本发明。除非上下文另外明确指出,如本文中使用的,单数形式“一”,“一个”和“该”也意图包括复数形式。此外,就在详细描述中和/或权利要求书中使用术语“包括”,“具有”,“有”,或其变型而言,此类术语意图以与术语“包含”相似的方式包括在内。

术语“约”或“大约”意味着对于如通过本领域的普通技术人员测定的特定值的可接受误差范围内,所述范围将部分地取决于该值是如何测量或测定的,即测量系统的限制。例如,根据本领域中的实践,“约”可以意味着在1或大于1的标准差内。备选地,“约”可以指给定值的的多达20%,优选多达10%,更优选多达5%,并且更优选地多达1%的范围。备选地,特别是对于生物系统或过程,该术语可以意味着在数值的一个数量级之内,优选5倍内,更优选在2倍内。在本申请和权利要求书中描述了特定值的情况下,除非另有说明,意味着假定特定值的可接受误差范围之内的术语“约”意义。

本文提及的所有出版物通过引用并入本文以公开和描述与所引用的出版物有关的方法和/或材料。可以理解的是,就存在矛盾而言,用本公开内容取代并入的出版物的任何公开内容。

进一步指出,可以撰写权利要求以排除任何任选的元素。因此,该叙述旨在充当结合权利要求要素的叙述的排他性术语,诸如“仅仅”,“唯一”等,以及使用“负面”限制的在前基础。

仅提供本文所讨论的出版物的其在本申请的申请日之前的公开内容。问的任何内容不应解释为承认凭借在先发明,本发明没有资格早于此类出版物。此外,所提供的出版物的日期可能不同于其实际出版日期,这需要独立地确认。

除非另外指出,本文中使用的所有术语具有与它们对于本领域技术人员而言相同的意义,并且本发明将采用微生物学的常规技术和重组DNA技术,这在本领域技术人员的知识范围内。

发明详述

本公开提供用于在视锥细胞中表达基因的多核苷酸盒和表达载体。也提供使用这些组合物在促进基因例如在个体的视锥细胞中表达,例如以用于治疗或预防视锥细胞病症的方法。在阅读下面更充分地描述的组合物和方法的细节后,本发明的这些和其它的目的,优点,以及特征将对于本领域技术人员是显而易见的。

组合物

在本公开的一些方面中,提供了用于在视锥细胞中表达转基因的组合物。“视锥细胞”,在本文中也称为“锥光感受器”或“锥体”,是指在眼的视网膜上的感光细胞的亚型,其在相对亮的光下最好地发挥作用。锥体对特定波长的光敏感,并因此支持颜色的感知。此外,锥体比杆光感受器更快响应刺激物,感知更精细的细节,并且比杆感知更迅速的图像变化,并因此支持活动的高敏度视力,其中视觉细节有首要的意义,如阅读和驾驶。在视网膜横截面,锥体通过其外节段的锥样形状是容易可鉴定的。它们也可以通过在视网膜上的位置容易可鉴定,位于视网膜的黄斑中心的1.5mm凹陷的锥体的密度最高,被称为“中央凹”或“中心凹坑(foveal pit)”。

在本公开的一些实施方案中,提供在视锥细胞中的转基因表达的组合物是多核苷酸盒。“多核苷酸盒”是指多核苷酸序列,其包括通常可操作地彼此连接的两个或多个多核苷酸序列,例如调控元件,翻译起始序列,编码序列,终止序列等。同样地,“用于在视锥细胞中表达转基因的多核苷酸盒”是指两个或更多个多核苷酸序列,例如启动子,增强子,5’UTR,翻译起始序列,编码序列,终止序列等的组合,其促进转基因在视锥细胞中的表达。

例如,在一些实施方案中,多核苷酸盒包括:

(a)启动子区,其中所述启动子区促进编码序列在视锥细胞中的表达;和

(b)编码序列,其可操作地连接于启动子区。

作为另一实例,在一些实施方案中,多核苷酸盒包括:

(a)启动子区,其中该启动子区促进编码序列在视网膜视锥细胞的表达;

(b)在翻译起始序列;和

(c)编码序列,其可操作地连接于启动子区。

作为第三个实例,在一些实施方案中,多核苷酸盒包括:

(a)启动子区,其中所述启动子区促进编码序列在视网膜视锥细胞中的表达;

(b)5’非翻译区;

(c)翻译起始序列;和

(d)编码序列,其可操作地连接于启动子区。

作为第四个实例,在一些实施方案中,多核苷酸盒包括:

(a)启动子区,其中所述启动子区促进编码序列在视锥细胞中的表达;

(b)5’非翻译区;

(c)内含子;

(d)翻译起始序列;和

(e)编码序列,其可操作地连接于启动子区。

作为第五个实例,在一些实施方案中,多核苷酸盒包括:

(a)启动子区,其中所述启动子区促进编码序列在视锥细胞中的表达;

(b)5’非翻译区;

(c)内含子;

(d)翻译起始序列;和

(e)多聚腺苷酸化序列。

在一些实施方案中,本公开的多核苷酸盒提供在视锥细胞中的转基因的增强表达。如在本公开的工作实施例中所显示的,本发明人已经发现了多种多核苷酸元件,即与本领域中已知的那些元件相比改进的元件,其单独地和协同地提供了转基因在视锥细胞中的增强表达。“增强”是指相对于在携带可操作地连接到可比较的调控元件,例如本领域中已知的调控元件的的转基因的视锥细胞中,在携带本公开的多核苷酸盒的视锥细胞中,转基因的表达增加,增强,或更强。换句话说,相对于来自不包含本公开的一个或多个优化的元件的多核苷酸盒的表达,即参考对照,来自本公开的多核苷酸盒的转基因的表达增加,增强,或更强。例如,在包含多核苷酸盒(其包含本文公开的启动子)的视锥细胞中转基因的表达比携带可操作地连接到不同的启动子,例如如本领域中已知的启动子的转基因的视锥细胞中增加,增强,或更强。作为另一实例,在包含多核苷酸盒(其包含本文公开的增强子)的视锥细胞中转基因的表达比携带可操作地连接到不同的增强子的转基因的视锥细胞中增加,增强,或更强。作为另一实例,在包含多核苷酸盒(其编码本文公开的5’UTR)的视锥细胞中转基因的表达比携带可操作地连接到不同的5’UTR的转基因的视锥细胞中提高,增加,增强,或更强。作为另一实例,在包含多核苷酸盒(其编码本文公开的内含子)的视锥细胞中转基因的表达比携带可操作地连接到本领域已知的不同的内含子序列的视锥细胞中提高,或增加,增强,或更强。可用作用于比较的参考的包含元件(例如,启动子,增强子序列,5’UTRs,和内含子)的示例性序列包括包含天然的L-视蛋白启动子(SEQ ID NO:l)和其变体的序列,由例如美国申请号2013/0317091中所公开的合成启动子pR2.1(SEQ ID NO:50)及其变体(如pR1.7,pR1.5,pR1.1)涵盖的序列,以及由IRBP/GNAT2启动子涵盖的序列(美国申请号2014/0275231)。

不希望受理论的束缚,在细胞中的转基因的表达增强被认为是由于基因产物在细胞中更快的积累或在细胞中更稳定的基因产物所致。因此,通过本主题公开的多核苷酸盒增强的转基因的表达可以通过许多方式观察到。例如,增强的表达可以通过检测多核苷酸盒接触视锥细胞之后转基因的表达,例如比如果转基因被可操作地连接到可比较的调控元件,例如如本领域中公知的调控元件时可检测到的表达早7天,早2周,早3周,早4周,早8周,早12周,或更多。增强的表达也可以观察为在表达可检测水平的由多核苷酸盒所携带的转基因的视锥细胞的数目的增加。例如,表达可检测水平的转基因的视锥细胞的数目增加有可能增加2倍或更多,例如增加3倍或更多,增加4倍或更多,增加5倍或更多,或增加10倍或更多。作为另一实例,相比于常规的多核苷酸盒,本发明的多核苷酸可以促进在较大百分比的细胞中的可检测水平的转基因;例如,在常规盒可以促进在某一区域中在例如低于5%的视锥细胞中的可检测水平的转基因表达的情况中,本发明的多核苷酸促进在该区域的5%或更多的视锥细胞中的可检测水平的表达;例如10%或更多,15%或更多,20%或更多,25%或更多,30%或更多,35%或更多,40%或更多,或45%或更多,在某些情况下50%或更多,55%或者更多;60%或更多,65%或更多,70%或更多,或75%或更多,例如80%或更多,85%或更多,90%或更多,或者95%或更多的被接触的视锥细胞将表达可检测水平的基因产物。增强的表达也可以观察为视锥细胞存活力和/或功能的改变,例如如使用如本领域中已知的和如本文所描述的评估工具,诸如眼底照相术,OCT,自适应光学,cERG,色觉试验,视敏度测试等测量的。

本公开的多核苷酸盒通常包括启动子区。任何合适的启动子区或其中的启动子序列可以用于本公开主题的多核苷酸盒,只要该启动子区促进编码序列在视锥细胞中的表达。在一些实施方案中,启动子特异性地促进基因在哺乳动物的视网膜视锥细胞,更优选灵长类的视网膜视锥细胞,更优选在狭鼻动物(Catarrhini)视网膜视锥细胞;甚至更优选地在人视网膜视锥细胞中的表达。“特异性”,意味着与其它类型的细胞相比,该启动子主要促进基因在靶细胞中的表达。因此,例如,当采用特异性地促进视锥细胞中表达的启动子区时,在将主题多核苷酸盒递送至眼后,多于50%的表达,例如,在60%,65%,70%或75%中的至少任一种或更多,例如至少80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,97%,98%,99%,99.5%中的至少任一种或更多的基因表达将在视锥细胞中。

示例性的合适的启动子区包括用于任何锥体特异性基因的启动子区,如492L-视蛋白启动子区(SEQ ID NO:1),491L-视蛋白启动子区(SEQ ID NO:53),496L-视蛋白启动子区(SEQ ID NO:79),M-视蛋白启动子区(SEQ ID NO:2,SEQ ID NO:54),最小的M-视蛋白启动子区(SEQ ID NO:55,SEQ ID NO:93),如本文首次公开的核心M-视蛋白启动子序列(SEQ ID NO:80),S视蛋白启动子区(SEQ ID NO:3),hRK启动子区,和锥体抑制蛋白启动子区;或保留促进基因在视锥细胞中表达的活性的它们的部分或变体。发现的用于主题多核苷酸盒的启动子区的部分或片段的非限制性实例包括紧邻5’UTR的上游的启动子序列,并且如本领域中已知的用于转录因子的典型结合序列。可以使用如本领域已知的或本文描述的任何方便的方法容易地确定这样的部分,或其片段。例如,使用可公开获得的工具,例如UCSC基因组BLAT浏览器通过序列的计算机评估,或通过可操作地与报告基因连接并导入到视锥细胞的经验测试(例如在本文的工作实例所描述的)可以容易地将紧邻在SEQ ID NO:54和SEQ ID NO:55中的5’UTR上游的启动子序列确定为基本上由SEQ ID NO:54的核苷酸1-406或SEQ ID NO:55的核苷酸1-154组成。在一些实施方案中,较短的启动子序列相对于较长的启动子序列是优选的,因为它们在载体中为其它核苷酸元件提供了更多的空间。在一些实施方案中,启动子区的长度小于492个碱基对。例如,在一些实施方案中,功能性片段不包含SEQ ID NO:1的核苷酸1-10或更多,例如,功能性片段不包含SEQ ID NO:1的核苷酸1-20或更多,核苷酸1-30或更多,核苷酸1-40或更多,核苷酸1-50或更多,例如SEQ ID NO:1的核苷酸1-60或更多,核苷酸1-70或更多,核苷酸1-80或更多,核苷酸1-90或更多,核苷酸1-100或更多,在某些情况下,SEQ ID NO:1的核苷酸1-120或更多,核苷酸1-140或更多,核苷酸1-160或更多,核苷酸1-180或更多,核苷酸1-200或更多,核苷酸1-220或更多,核苷酸1-240或更多,或约核苷酸1-260。用于鉴定能够在哺乳动物或灵长类视锥细胞中驱动表达的启动子区的任何合适的方法可用于鉴定发现的用于本公开的多核苷酸盒的启动子区和其中的启动子序列。

在一些实施方案中,主题多核苷酸盒的启动子区包含本文所公开的启动子区中的一个,例如492L-视蛋白启动子区(SEQ ID NO:1),491L-视蛋白启动子区(SEQ ID NO:53),496L-视蛋白启动子区(SEQ ID NO:79),M-视蛋白启动子区(SEQ ID NO:2,SEQ ID NO:54),最小的M-视蛋白启动子区(SEQ ID NO:55,SEQ ID NO:93),如本文公开的核心M-视蛋白启动子序列(SEQ ID NO:80),S视蛋白启动子区(SEQ ID NO:3),或它们的部分或变体,例如具有与上述序列或其功能性片段的75%或更多,例如80%或更多,85%或更多,90%或更多,95%或更多(例如,80%,85%,90%或95%)的同一性的序列。在一些实施方案中,主题多核苷酸盒的启动子序列基本上由本文所公开的启动子区中的一个组成,即SEQ ID NO:1,SEQ ID NO:53,SEQ ID NO:79,SEQ ID NO:2,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:93,SEQ ID NO:80,或SEQ ID NO:3,或其功能性片段或变体,例如具有与上述序列的全长加或减1,2,3,4,5,6,7,8,9,或10个核苷酸,或其功能性片段的75%或更多,例如80%或更多,85%或更多,90%或更多,或95%或更多(例如,80%,85%,90%或95%)的同一性的序列。在一些实施方案中,主题多核苷酸盒的启动子区由本文所公开的启动子区中的一个组成,即SEQ ID NO:1,SEQ ID NO:53,SEQ ID NO:79,SEQ ID NO:2,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:93,SEQ ID NO:80,或SEQ ID NO:3,或其功能性片段或变体,例如具有与上述序列的全长或其功能性片段的75%或更多,例如,80%,85%,90%,95%或更多的同一性的序列。在某些实施方案中,启动子区基本上由SEQ ID NO:74组成。在一些这样的实施方案中,启动子序列基本上由SEQ ID NO:80组成。在一些实施方案中,与本领域中已知的其它启动子,例如,合成启动子pR2.1,pR1.7,pR1.1和IRBP/GNAT2相比,启动子导致在视锥细胞中增强的表达。

在一些实施方案中,多核苷酸盒进一步包括增强子元件。增强子是本领域中已知的增强转录的核酸元件,并且可以位于与它们调节基因相关的任何地方,例如上游,下游,内含子内,等。任何增强子元件可以用于本公开的多核苷酸盒和基因递送载体中,只要在与启动子组合使用时,它增强了基因的表达。在一个优选的实施方案中,增强子元件是对视网膜视锥细胞特异性的;更优选地,它是对灵长类的视网膜视锥细胞特异性的;更优选在狭鼻视网膜视锥细胞中特异性的;甚至更优选地在人视网膜视锥细胞中特异性的。“特异性”,意味着与其它类型的细胞相比,该增强子主要增强基因在靶细胞中的表达。因此,例如,当采用特异性地增强视锥细胞中表达的增强子时,在将载体递送至眼中后,多于50%的表达,例如,在60%,65%,70%或75%中的至少任一种,或更多的表达,例如至少80%,并且优选地85%,90%,91%,92%,93%,94%,95%,96%,97%,97%,98%,99%,99.5%,或更多的基因表达将在视锥细胞中。

发现的用于本公开的多核苷酸盒的示例性增强子区包括如下那些增强子区域,其包括针对任何锥体特异性基因的增强子区域或保留增强子活性的其片段或变体,基本上由或由针对任何锥体特异性基因的增强子区域或保留增强子活性的其片段或变体组成。例如,L/M最小视蛋白增强子,称为基因座控制区(Locus Control Region)(LCR)(Wang et al.,1992.Neuron 9:429-440)(SEQ ID NO:52)可用于增强基因在视锥细胞中的表达;它的缺失导致蓝锥单色视(Nathans et al.,1989;Science,245:831-838)。已显示LCR可用于用例如AAV载体的基因疗法(Li et al.,Vision Research 48(2008):332-338)。此外,基本上由36bp的“核心”LCR序列组成的功能片段已被鉴定对于在视锥细胞中从视蛋白启动子进行的表达是必要的和足够的(Komaromy et al.Targeting gene expression to cones with human cone opsin promoters in recombinant AAV.Gene Ther.2008;15(14):1049-55)(SEQ ID NO:51)。在一些实施方案中,多核苷酸盒的增强子包含SEQ ID NO:51或SEQ ID NO:52。在某些实施方案中,多核苷酸盒的增强子基本上由SEQ ID NO:51或SEQ ID NO:52组成。

100,100,200,300,400,500,600,700,800,900,1000,1100,1200,1300,1400,1500,1600,1700,1800,1900,2000或更多个核苷酸的L/M增强子元件在本组合物中得到应用,所述L/M增强子元件包括一个或多个拷贝的L/M最小视蛋白增强子,和全L/M视蛋白增强子,或它们的保留以椎体特异性的方式增强基因表达的活性的其它部分或变体。本领域的技术人员基于这里的教导可以理解,用于鉴定能够在灵长类视锥细胞驱动表达的增强子序列的任何合适的方法可用于鉴定此种增强子。

启动子和增强子区域的长度可以是用于其预期目的任何合适的长度,并且所述启动子和增强子区域之间的间隔可以是促进基因产物的椎体特异性表达的任何合适的间隔。在多种优选的实施方案中,增强子位于启动子上游的0-1500;0-1250;0-1000;0-750;0-600;0-500;0-400;0-300;0-200;0-100;0-90;0-80;0-70;0-60;0-50;0-40;0-30;0-20;或0-10个核苷酸。启动子可以位于所编码基因上游的任何合适的距离。

在一些实施方案中,主题多核苷酸盒包括编码5’非翻译区的序列,即编码编码序列5’的非翻译区的多核苷酸序列,也称为5’UTR。在表达盒中,在本领域已知5’UTR是转录起始位点和蛋白质翻译起始的Kozak序列之间的序列。已知5’UTR的二级mRNA结构会影响转录水平。具体地,对于增强的基因表达,选择本发明中的5’UTR区域的序列以最小化或避免二级结构和上游AUG(uAUG)密码子,已知其由于无效的核糖体扫描和错误翻译起始而降低翻译效率(Kozak,1995.PNAS 92:2662)。参见Davuluri et al.,Genome Research,2000:10(11);1807-18166。例如,已鉴定来自人基因的HSP70的5’UTR序列(SEQ ID NO:58),其具有增强mRNA翻译的不寻常的能力,这可能由于IRES机制(Rubtsova et al.,2003.PNAS 278(25):22350-22356;Vivinus et al,2001.Eur J Biochem.268:1908-1917)。可以使用任何5’UTR,但理想地,5’UTR的序列具有最小的二级mRNA结构和上游AUG序列。换句话说,在一些实施方案中,多核苷酸盒的转录起始位点和翻译起始位点之间的序列不包含多核苷酸ATG。在一些实施方案中,5’UTR包括,组成基本上为(consist essentially of),或组成为(consist of)SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:84,SEQ ID NO:85,SEQ ID NO:86,SEQ ID NO:87,SEQ ID NO:88,或SEQ ID NO:89,或它们的功能片段或变体,例如具有与选自SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:84,SEQ ID NO:85,SEQ ID NO:86,SEQ ID NO:87,SEQ ID NO:88,和SEQ ID NO:89的序列的85%或更多的序列同一性的多核苷酸序列或其片段。在一些实施方案中,5’UTR序列的一些或全部包含在例如SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,或SEQ ID NO:79中公开的启动子区中。在其它实施方案中,5’UTR不包含在启动子区中;参见,例如核心启动子序列SEQ ID NO:84,其不编码5’UTR序列。在一些实施方案中,5’UTR序列是与启动子序列异源的。在多种优选的实施方案中,UTR的3’端是在编码序列的上游0-20;0-15;0-10;0-9;0-8;0-7;0-6;或0-5个核苷酸,其5’末端是在近端启动子区下游的0-20;0-15;0-10;0-9;0-8;0-7;0-6;或0-5个核苷酸处。在一些实施方案中,与本领域中已知的其它5’UTR,例如,在合成启动子pR2.1,pR1.7,pRl.l和IRBP/GNAT2中包含的5’UTR相比,5’UTR元件导致在视锥细胞中增强的表达。

在一些实施方案中,主题多核苷酸盒进一步包括内含子,其包含剪接供体/接受体区域。在一些实施方案中,内含子位于启动子区的下游并位于基因的翻译起始序列的上游,即内含子位于5’UTR内。在其它实施方案中,内含子位于基因的翻译起始序列的下游,即内含子位于编码序列内。如本领域中通常已知的,内含子是转录到RNA中并在mRNA加工过程中通过内含子剪接除去的DNA多核苷酸。含有内含子的多核苷酸盒通常比无内含子的那些多核苷酸盒具有更高的表达。内含子可以刺激2至500-倍之间的表达(Buchman and Berg,1988.Mol Cel Bio,8(10):4395)。有效剪接内含子包含预剪接(pre-splice)供体,分支点,以及Py富集区(Senapathy et al,1990;Meth.Enzymol.183,252–78;Wu and Krainer,1999;Mol Cell Biol 19(5):3225-36)。与3’端内含子相比,5’内含子通常更有效(Huang and Gorman,1990;Mol Cell Bio,10:1805)。虽然一般已知内含子增加基因表达的水平,但给定cDNA的具体的增加(若有的话)是经验性的,并且必须进行测试;例如在pSI载体中的嵌合内含子使CAT的表达增加21倍,但使萤光素酶的表达增加仅3倍。

任何内含子可以在主题多核苷酸盒中使用,只要其包含在哺乳动物或在灵长类视锥细胞中被识别的剪接供体/接受体区域,使得内含子可从所得的mRNA产物剪接出来。在一个实施方案中,内含子包括根据SEQ ID NO:5的SV40内含子,基本上由或由根据SEQ ID NO:5的SV40内含子组成。在另一个实施方案中,内含子包括来自PSI的嵌合内含子(SEQ ID NO:60)或其变体,基本上由或由来自PSI的嵌合内含子(SEQ ID NO:60)或其变体组成。在另一个实施方案中,内含子包括CMV内含子A或其变体,基本上由或由CMV内含子A或其变体组成。在又一个实施方案中,内含子包括pR2.1内含子(SEQ ID NO:59)或其变体,基本上由或由pR2.1内含子(SEQ ID NO:59)或其变体组成,或备选地,包括兔或人β-珠蛋白内含子或其变体,基本上由或由兔或人β-珠蛋白内含子或其变体组成(Xu et al,2001,Gene 272:149;Xu et al.2002;J Control Rel 81:155)。在一些这样的实施方案中,内含子包括具有与选自SEQ ID NO:5,SEQ ID NO:59,和SEQ ID NO:60的序列的85%或更多的序列同一性的序列。典型地,该内含子对启动子区和/或5’UTR是异源的。

在一些实施方案中,内含子驻留在5’UTR内。换句话说,编码5’UTR的DNA序列是由内含子DNA序列所中断的。例如,作为SEQ ID NO:84的5’UTR的编码序列可被编码在两个部分,例如SEQ ID NO:85和SEQ ID NO:86中,在它们之间具有内含子序列。作为另一个实例,SEQ ID NO:88的5’UTR的编码序列可被编码在两个部分,例如SEQ ID NO:89和SEQ ID NO:73中,在它们之间具有内含子序列。在多种实施方案中,内含子的3’端是在基因的上游0-20;0-15;0-10;0-9;0-8;0-7;0-6;或0-5个核苷酸,并且其5’末端是在近端启动子区的下游0-20;0-15;0-10;0-9;0-8;0-7;0-6;或0-5个核苷酸。在其它实施方案中,内含子驻留在基因的编码序列内。

在一些实施方案中,本公开的多核苷酸盒包含翻译起始序列,也称为“Kozak序列”或“Kozak翻译起始序列”。这是核糖体附着和翻译开始的核酸序列。实例包括ACCATGG(Kozak,1986.Cell,44:283-292)和(GCC)GCC(A/G)CCATGG(Kozak,1987.Nucl Acid Res;15(20):8125)(SEQ ID NO:73)。任何合适的Kozak序列可以在多核苷酸盒中使用,优选地选择增加在视网膜的视锥细胞中编码序列表达的那些Kozak序列。在一个实施方案中,翻译起始序列包含SEQ ID NO:72。在备选的实施方案中,翻译起始序列包含SEQ ID NO:73。在一些实施方案中,与本领域中已知的其它的Kozak序列,例如由合成启动子pR2.1,pR1.7,pR1.1,和IRBP/GNAT2包含的Kozak序列相比,Kozak元件导致在视锥细胞中增强的表达。

在本发明的一些方面中,将主题核苷酸盒用于递送基因到动物的视锥细胞中,例如以确定该基因对细胞存活力和/或功能的影响,从而治疗视锥细胞病症(cone cell disorder)等。因此,在一些实施方案中,本公开的多核苷酸盒进一步包括待作为转基因在体外或体内递送到动物的视锥细胞中的基因。基因编码序列通常可操作地连接到主题多核苷酸盒的启动子区,并且在增强子元件存在的一些情况中,可操作地连接到主题多核苷酸盒的增强子元件,使得启动子和任选的增强子元件增强在受试者的视锥细胞中编码序列或cDNA的表达。

要在视锥细胞中表达的编码序列可以是任何多核苷酸序列,例如编码基因产物,例如多肽或基于RNA的治疗剂(siRNA,反义RNA,核酶,shRNA,等)的基因或cDNA。编码序列可以是对其可操作连接的启动子序列和/或5’UTR序列异源的,即不是天然可操作地与其相关联。备选地,编码序列可以是对其可操作连接的启动子序列和/或5’UTR序列内源的,即天然地与启动子或5’UTR相关联。基因产物可以实质上在视锥细胞中发挥作用,或者它可以外在地发挥作用,例如它可以是分泌性的。例如,当转基因是治疗基因时,编码序列可以是编码希望基因产物或其功能片段或变体的任何基因,所述希望基因产物或其功能片段或变体可以用作治疗视锥细胞疾病或病症的治疗剂,或作为以其它方式增强视力,包括但不限于促进四色视觉的手段。在多种优选的实施方案中,转基因编码选自下组的治疗性蛋白质或其功能片段或变体:

(a)SEQ ID NO:7(SEQ ID NO:6)人类视蛋白1(椎体色素),短波敏感(OPN1SW),mRNA NCBI参考序列:NM_001708.2;

(b)SEQ ID NO:9(SEQ ID NO:8)人类视蛋白1(椎体色素),中波敏感(OPN1MW),mRNA NCBI参考序列:NM_000513.2;

(c)SEQ ID NO:11(SEQ ID NO:10)人类视蛋白1(椎体色素),长波敏感(OPN1LW),mRNA NCBI参考序列:NM_020061.4;

(d)SEQ ID NO:13(SEQ ID NO:12)ATP结合盒视网膜基因(ABCR)基因(NM_000350);

(e)SEQ ID NO:15(SEQ ID NO:14)视网膜色素特异性上皮-65kD蛋白基因(RPE65)(NM._000329);

(f)SEQ ID NO:17(SEQ ID NO:16)视黄醇结合蛋白1基因(RLBP1)(NM._000326);

(g)SEQ ID NO:19(SEQ ID NO:18)外周蛋白/视网膜变性慢基因,(NM_000322);

(h)SEQ ID NO:21(SEQ ID NO:20)抑制蛋白(SAG)(NM_000541);

(i)SEQ ID NO:23(SEQ ID NO:22)α-转导素(GNAT1)(NM_000172);

(j)SEQ ID NO:24鸟苷酸环化酶激活剂1A(GUCA1A)(NP_000400.2);

(k)SEQ ID NO:25视网膜特异性鸟苷酸环化酶(GUCY2D),(NP_000171.1);

(l)SEQ ID NO:26和27锥体环核苷酸门控阳离子通道α亚基(CNGA3)(NP_001073347.1或NP_001289.1);

(m)SEQ ID NO:28人锥体转导素α亚基(不完全全色盲);

(n)SEQ ID NO:29锥体cGMP特异性3’,5’-环磷酸亚基的α’,蛋白质(锥体营养不良4型);

(o)SEQ ID NO:30视网膜锥体视紫红质敏感性cGMP 3’,5’-环亚磷酸二酯酶γ蛋白(锥体营养不良3A型);

(p)SEQ ID NO:31锥杆同源盒,蛋白质(锥-视杆营养不良);

(q)SEQ ID NO:32锥体光感受器环核苷酸门控通道β亚基蛋白质(全色盲);

(r)SEQ ID NO:33锥体光感受器cGMP门控阳离子通道β-亚基,蛋白质(全色盲,例如,在Pingelapese岛民中);

(s)SEQ ID NO:35(SEQ ID NO:34)色素性视网膜炎1(autosomal dominant)(RP 1);SEQ ID NO:32锥体光感受器环核苷酸门控通道β亚基蛋白质(全色盲);

(t)SEQ ID NO:37(SEQ ID NO:36)色素性视网膜炎GTP酶调节相互作用蛋白1(RPGRIP 1);

(u)SEQ ID NO:39(SEQ ID NO:38)PRP8;

(v)SEQ ID NO:41(SEQ ID NO:40)中心体蛋白(centrosomal protein)290kDa(CEP290);

(w)SEQ ID NO:43(SEQ ID NO:42)IMP(肌苷5’单磷酸)脱氢酶1(IMPDH1),转录物变体1

(x)SEQ ID NO:45(SEQ ID NO:44)芳烃受体相互作用蛋白样1(AIPL1),转录物变体1;

(y)SEQ ID NO:47(SEQ ID NO:46)r视黄醇脱氢酶12(全反式/9-顺式/l1-顺式)(RDH12);

(z)SEQ ID NO:49(SEQ ID NO:48)利伯先天性黑朦5(LCA5),转录物变体1;和

(aa)示例性OPN1LW/OPN1MW2多型变体(polymorph)(相比于OPN1LW(L视蛋白))的多肽序列;编号左边的氨基酸是存在于L视蛋白序列中的残基;编号是L视蛋白的残基数目,并且编号右侧的残基是L-视蛋白的变异。根据这些实施方案的多型变体可以包括选自以下的一个或多个氨基酸取代:Thr65Ile;Ile111Val;Ser116Tyr;Leu153Met;Ile171Val;Ala174Val;Ile178Val;Ser180Ala;Ile230Thr;Ala233Ser;Val236Met;Ile274Val;Phe275Leu;Tyr277Phe;Val279Phe;Thr285Ala;Pro298Ala;Tyr309Phe

(ab)其它的视蛋白序列变异1(SEQ ID NO:61);

(ac)其它的视蛋白序列变异2(SEQ ID NO:62);

(ad)其它的视蛋白序列变异3(SEQ ID NO:63);

(ae)其它的视蛋白序列变异4(SEQ ID NO:64);

(af)其它的视蛋白序列变异5(SEQ ID NO:65);

(ag)其它的视蛋白序列变异6(SEQ ID NO:65);

(ah)其它的视蛋白序列变异7(SEQ ID NO:66);

(ai)其它的视蛋白序列变异8(SEQ ID NO:67);

(aj)其它的视蛋白序列变异9(SEQ ID NO:68);

(ak)hCHR2(通道视紫红质)(SEQ ID NO:69);

(al)NpHR(盐细菌视紫红质)(SEQ ID NO:70);和

(am)eGFP(SEQ ID NO:71)。

在一些实施方案中,通过转基因编码的编码序列编码的多肽具有与上文或本文公开的序列编码的多肽至少85%的序列同一性,例如至少90%的序列同一性,例如至少95%的序列同一性,至少98%的序列同一性,或至少99%的序列同一性。因此,例如,编码锥体视蛋白的编码序列具有与OPN1LW,OPNIMW或OPN1SW编码的多肽至少85%,至少90%,至少95%的同一性,至少98%的序列同一性,或至少99%的序列同一性。在一些实施方案中,编码序列具有与SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:61,SEQ ID NO:62,SEQ ID NO:63,SEQ ID NO:64,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:67,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,或SEQ ID NO:71至少85%,90%,95%,98%或至少99%的序列同一性。

在(a)-(c)和(aa-aj)中记叙的蛋白质都参与色觉。示例性多型变体包括在位置65,116,180,230,233,277,285,和309中的一个,其影响在表达它们的视锥细胞中的色素谱。位置274,275,277,279,285,298和309一起区分L视蛋白和M视蛋白。

在(d)-(z)中记叙的蛋白质是示范性眼疾病相关基因,如在色素性视网膜炎中(多肽“e”-“l”,“s”-“y”),不完全全色盲(多肽“m”),斯塔加特氏(多肽“d”);利伯先天性黑朦(多肽“z”);锥体营养不良,如锥体营养不良4型(多肽“n”);视锥营养不良;例如,锥体营养不良型3A(多肽“o”);锥体-视杆营养不良(多肽“p”);色盲(多肽“q”);以及全色盲,例如,在Pingelapese岛民中(多肽“r”)。

在本发明的一个实施方案中,编码序列的转基因是通过用更频繁地出现的密码子替换不经常出现的密码子进行修饰的,或“经密码子优化的”以增强表达。编码序列是编码用于翻译的氨基酸的mRNA序列的部分。在翻译过程中,61种三核苷酸密码子中的每一个被翻译成20种氨基酸中的一个,这导致在遗传密码种的简并性或冗余。然而,不同类型的细胞,和不同的动物物种以不同频率利用编码相同氨基酸的tRNA(每个具有反密码子)。当基因序列通过由相应的tRNA不经常呈现的密码子时,核糖体翻译机器可能减慢,阻碍有效的翻译。表达可以通过针对特定物种进行“密码子优化”来改进,其中的编码序列被改变为编码相同的蛋白质序列,但利用频繁呈现的密码子,和/或被高表达的人类蛋白质利用(Cid-Arregui et al.,2003;J.Virol.77:4928)。在本发明的一个方面,转基因的编码序列被修饰以将在哺乳动物或在灵长类中不经常表达的密码子替换为在灵长类中频繁表达的密码子。例如,在一些实施方案中,通过转基因编码的编码序列编码的多肽具有与上文或本文公开的序列编码的多肽至少85%的序列同一性,例如至少90%的序列同一性,例如至少95%的序列同一性,至少98%的同一性,至少99%的同一性,其中该编码序列中的至少一种密码子在人类中具有比上述或本文所公开的序列中的相应密码子更高的tRNA频率。

在本发明的其它的实施方案中,编码转基因的序列通过终止或去除不编码希望的基因的可读框(ORF)进行修饰以增强表达。可读框(ORF)是起始密码子之后并且不含有终止密码子的核酸序列。与感兴趣的基因相比,ORF可以是正向或反向,并可以是在“框内”或“框外”。这样的可读框具有在表达盒中与感兴趣的基因一起表达的可能性,并可能导致不希望的不利影响。在本发明的一个方面,转基因的编码序列通过进一步改变密码子选择已经被修饰从而除去可读框。这是如下完成的,即通过消除起始密码子(ATG),并以相反的方向或在框外ORF引入终止密码子(TAG,TAA,或TGA),同时在感兴趣的基因中保持氨基酸序列和维持高度利用的密码子(即,避免了频率<20%的密码子)。在本发明中,转基因编码序列可以通过密码子优化和除去非转基因的ORF之任一种或使用这两种技术来优化。如对于本领域的普通技术人员将是显而易见的,在密码子优化后优选去除或最小化非转基因ORF以除去在密码子优化中引入的ORF是优选的。密码子优化和去除ORF的实例显示于图3A-3C。

在一些实施方案中,本发明的多核苷酸盒进一步包括多聚腺苷酸化区。如本领域中所理解的,RNA聚合酶II转录物通过切割并添加多聚腺苷酸化区,也被称为多聚A信号,多聚A区域或者多聚A尾终止。多聚A区包含多个连续的单磷酸腺苷,通常具有基序AAUAAA的重复。多种有效的多聚腺苷酸化位点已被确定,包括那些来自SV40,牛生长激素,人生长激素和兔β珠蛋白的多聚腺苷酸化位点(Xu et al,2001;Gene 272:149;Xu et al.,2002;J Control Rel.81:155)。用于在视锥细胞表达转基因的最有效的多聚A信号可取决于感兴趣的细胞类型和物种以及所使用的特定载体。在本发明的一些实施方案中,多核苷酸盒包含选自SEQ ID NO:74,SEQ ID NO:75,SEQ ID NO:76,SEQ ID NO:77,SEQ ID NO:78,SEQ ID NO:90,SEQ ID NO:91,或任何前述序列的功能性片段或变体的多聚A区,基本上由或由选自SEQ ID NO:74,SEQ ID NO:75,SEQ ID NO:76,SEQ ID NO:77,SEQ ID NO:78,SEQ ID NO:90,SEQ ID NO:91,或任何前述序列的功能性片段或变体的多聚A区组成。在某些实施方案中,多聚A区包含SEQ ID NO:90或其变体。在一些这样的实施方案中,多聚A区基本上由SEQ ID NO:90或其变体组成。

本领域普通技术人员将理解,可以组合两种或多种上述多核苷酸元件以创建本发明的多核苷酸盒。因此,例如,主题多核苷酸盒可以包含与改进的5’UTR序列的可操作连接的启动子区,其包含改进的启动子序列,例如SEQ ID NO:80与SEQ ID NO:84或SEQ ID NO:85可操作的组合,参见,例如SEQ ID NO:2,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:93,SEQ ID NO:94,或SEQ ID NO:95。作为另一实例,主题多核苷酸盒可以包含与改进的启动子序列或区域可操作连接的改进的增强子序列或区域,例如SEQ ID NO:51或SEQ ID NO:52与SEQ ID NO:80,SEQ ID NO:2,SEQ ID NO:54,SEQ ID NO:55,或SEQ ID NO:93可操作的组合;参见,例如SEQ ID NO:92或SEQ ID NO:95。作为另一实例,主题多核苷酸盒可以与改进的内含子序列可操作连接的包含改进的5’UTR序列,例如SEQ ID NO:84或SEQ ID NO:86与SEQ ID NO:60的可操作组合;参见,例如SEQ ID NO:94或SEQ ID NO:95。作为另一实例,主题多核苷酸盒可以包含与改进的内含子序列和改进的Kozak序列可操作连接的改进的5’UTR序列,例如SEQ ID NO:84或SEQ ID NO:86与SEQ ID NO:60,以及与SEQ ID NO:73可操作地组合;参见,例如SEQ ID NO:95。作为另一实例,主题多核苷酸盒可以包含可操作地连接的改进的增强子,改进的启动子,改进的5’UTR,改进的内含子,改进的Kozak和改进的多聚A区;参见,例如SEQ ID NO:95。如本文中所公开的或本领域中已知的元件的其它组合将是本领域普通技术人员容易理解的。

此外,如本领域的普通技术人员所公认的,多核苷酸盒可以任选地含有其它元件,包括但不限于有利于克隆的限制性位点和用于特定基因表达载体的调控元件。调节序列的实例包括用于AAV载体的ITR,用于质粒载体的细菌序列,用于噬菌体整合酶载体的attP位或attB位点,以及用于转座子的转座元件。

基因疗法载体

如上面提到的,在本发明的一些方面中,主题核苷酸盒用于将基因递送到动物的视锥细胞中,例如以确定该基因对细胞存活力和/或功能的效应,从而治疗视锥细胞病症等。因此,在本发明的一些方面,提供在视锥细胞中表达转基因的组合物是基因递送载体,其中所述基因递送载体包含本公开的多核苷酸盒。

在将多核苷酸序列递送至视锥细胞中得到应用的任何方便的基因疗法载体由本公开的基因递送载体涵盖。例如,所述载体可以包含单链或双链核酸,例如单链或双链DNA。例如,所述基因递送载体可以是裸露的DNA,例如质粒,小环等。作为另一个实例,所述基因递送载体可以是病毒,例如腺病毒,腺伴随病毒或逆转录病毒,例如Moloney鼠白血病病毒(M-MuLV),Moloney鼠肉瘤病毒(MoMSV),Harvey鼠肉瘤病毒(HaMuSV),鼠乳腺肿瘤病毒(MuMTV),长臂猿白血病病毒(GaLV),猫白血病病毒(FLV),泡沫病毒,Friend鼠白血病病毒,鼠干细胞病毒(MSCV)和Rous肉瘤病毒(RSV),或慢病毒。尽管涵盖使用腺伴随病毒的实施方案在下文中更详细地描述,但预期本领域普通技术人员将了解,在本领域中的相似的知识和技能也可以达到在非AAV的基因递送载体上携带。参见,例如,在美国专利号7,585,676和美国专利号8,900,858中的逆转录病毒载体的讨论,和例如在美国专利号7,858,367中的腺病毒载体的讨论,将这些专利的全部公开通过引用并入本文。

在一些实施方案中,基因递送载体是重组腺伴随病毒(rAAV)。在这样的实施方案中,主题多核苷酸盒的5’和3’端的侧翼是功能性AAV反向末端重复(ITR)序列。“功能性AAV ITR序列”是指该ITR序列旨在发挥功能以用于挽救(rescue),复制和包装AAV病毒体。因此,用于本发明的基因递送载体的AAV ITR不必具有野生型的核苷酸序列,并且可以通过插入,缺失或取代核苷酸而改变或AAV ITR可以来源于几种AAV血清型,例如:AAV1,AAV2,AAV3,AAV4,AAV5,AAV6,AAV7,AAV8,AAV9,AAV 10中的任一种。优选的AAV载体缺失全部或部分的野生型REP和CAP基因,但保留功能性的侧翼ITR序列。

在这样的实施方案中,主题多核苷酸盒被包囊在AAV壳体中,所述AAV壳体可来源于任何腺伴随病毒血清型,包括但不限于AAV1,AAV2,AAV3,AAV4,AAV5,AAV6,AAV7,AAV8,AAV9,AAV 10等。例如,所述AAV壳体可以是野生型或天然的壳体。特别感兴趣的野生型AAV壳体包括AAV2,AAV5和AAV9。然而,与ITR相似,壳体不需要具有野生型的核苷酸序列,而是可以通过在VP1,VP2或VP3序列的核苷酸中进行插入,缺失或在取代而改变,只要壳体能够转导视锥细胞。换句话说,所述AAV壳体可以是AAV壳体变体。特别令人感兴趣的AAV壳体变体包括在AAV2的残基580-600或另一种AAV中的相应残基中包含肽插入的那些AAV壳体变体,例如,如在美国申请号US 2014/0294771所公开的LGETTRP,NETITRP,KAGQANN,KDPKTTN,KDTDTTR,RAGGSVG,AVDTTKF,或STGKVPN,其中将所述美国申请的全部公开通过引用并入本文。在一些实施方案中,AAV载体是通过使用一种AAV的壳体(cap)基因和来自不同的AAV的rep基因和ITR产生的“假型化”AAV,例如通过使用来自AAV2的rep和来自AAV1,AAV3,AAV4,AAV5,AAV6,AAV7,AAV8或AAV9的cap,与含有基于AAV2的载体的质粒一起产生的假型化的AAV2。例如,AAV载体可以是rAAV2/1,rAAV2/3,rAAV2/4,rAAV2/5,rAAV2/6,rAAV2/7,rAAV2/8,rAAV2/9等。优选地,rAAV是复制缺陷型,即该AAV载体不能独立地进一步复制和包装它的基因组。例如,当用rAAV病毒体转导视锥细胞时,该基因在经转导的视锥细胞中表达,但是,由于在经转导的视锥细胞中缺乏AAV rep和cap基因和附加的功能基因的事实,该rAAV不能够复制。

基因疗法载体,例如包封在本公开的多核苷酸盒中的rAAV病毒体,可以使用标准方法来产生。例如,在rAAV病毒体的情况下,可以将根据本发明的AAV表达载体引入到生产细胞中,随后引入AAV辅助构建体,其中所述辅助构建体包括能够在生产细胞中被表达的AAV编码区,其互补AAV载体中缺乏的AAV辅助功能。这之后将辅助病毒和/或其它的载体引入到生产细胞中,其中所述辅助病毒和/或其它的载体提供能够支持有效的rAAV病毒生产的附属功能。然后培养生产细胞,以产生rAAV。使用标准方法进行了这些步骤。包囊本发明的重组AAV载体的复制缺陷的AAV病毒体是通过本领域中已知的标准技术使用AAV包装细胞和包装技术来制备的。这些方法的实例例如,可以在美国专利号5,436,146;5,753,500,6,040,183,6,093,570和6,548,286中找到,通过引用明确地将所述美国专利以其全文并入本文。其它的组合物和包装的方法在Wang等人(US 2002/0168342)中进行了描述,也通过引用将其整体并入本文。

可使用用于生产递送主题多核苷酸盒的病毒颗粒的任何适当的方法,包括但不限于在以下实施例中描述的那些。适合于有效转导视锥细胞的任何浓度的病毒颗粒可以在体外或体内制备以用于接触视锥细胞。例如,病毒颗粒可以以以下浓度配制:每mL 108载体基因组或更多,例如,每mL载体5x108基因组;每mL 109载体基因组;每mL 5x 109载体基因组,每mL 1010载体基因组,每mL 5x1010载体基因组;每mL1011载体基因组;每mL5x1011载体基因组;每mL1012载体基因组;每mL5x1012载体基因组;每mL1013载体基因组;每mL 1.5x1013载体基因组;每mL 3x1013载体基因组;每mL5x1013载体基因组;每mL7.5x1013载体基因组;每mL9x1013载体基因组;每mL 1x 1014载体基因组,每mL5x 1014载体基因组或更多,但通常不超过每mL1x 1015载体基因组。类似地,可以将适合于提供视网膜视锥细胞的适当转导以赋予所期望的效应或治疗该疾病的任何总数目的病毒颗粒施用于哺乳动物或灵长类的眼。在多种优选的实施方案中,将至少108;5x108;109;5x 109,1010,5x1010;1011;5x1011;1012;5x1012;1013;1.5x1013;3x1013;5x1013;7.5x1013;9x1013,1x 1014的病毒颗粒,或5x 1014的病毒颗粒或更多,但通常不超过1x 1015的病毒颗粒注入到每只眼睛中。可以在哺乳动物或灵长类眼中进行载体施用的任何合适的次数。在一个实施方案中,该方法包括单次施用;在其它实施方案中,如主治医生认为合适的,可以在一段时间内进行多次施用。

可将主题病毒载体配制成任何合适的单位剂量,包括但不限于,1x108载体基因组或更多,例如1x109,1x1010,1x1011,1x1012,或1x1013载体基因组或更多,在某些情况下,1x1014载体基因组,但通常不超过4x1015载体基因组。在一些情况下,单位剂量是至多约5x1015载体基因组,例如1x1014载体基因组或更低,例如1x1013,1x1012,1x1011,1x1010,或1x109载体基因组或更低,在某些情况下1x108载体基因组或更低,但通常不超过1x108载体基因组。在某些情况下,单位剂量是1x1010至1x1011载体基因组。在某些情况下,单位剂量是1x1010至3x1012载体基因组。在某些情况下,单位剂量是1×109 3x1013载体基因组。在某些情况下,单位剂量是1x108至3x1014载体基因组。

在某些情况下,药物组合物的单位剂量可使用感染复数(MOI)测定。MOI是指载体或病毒基因组与核酸可以被递送的细胞的比例,或倍数。在一些情况下,MOI可以是1x106。在一些情况下,MOI可以是1x105-1x107。在一些情况下,MOI可以是1x104-1x108。在某些情况下,本公开的重组病毒是至少约1x101,1x102,1x103,1x104,1x105,1x106,1x107,1x108,1x109,1x1010,1x1011,1x1012,1x1013,1x1014,1x1015,1x1016,1x1017,和1x1018MOI。在某些情况下,本公开的重组病毒是1x108至3x1014MOI。在一些情况下,本公开的重组病毒是至少约1x101,1x102,1x103,1x104,1x105,1x106,1x107,1x108,1x109,1x1010,1x1011,1x1012,1x1013,1x1014,1x1015,1x1016,1x1017,和1x1018MOI。

在一些方面中,药物组合物的量包括约1×108至约1×1015的重组病毒,约1×109约1×1014的重组病毒,约1×1010至约1×1013的重组病毒,或约1×1011至约3×1012的重组病毒。

在制备主题的rAAV组合物中,可以使用用于生产rAAV病毒体的任何宿主细胞,包括,例如,哺乳动物细胞(例如293细胞),昆虫细胞(例如SF9细胞),微生物和酵母。宿主细胞还可以是包装细胞,其中AAV rep和cap基因被稳定地保持在宿主细胞中,或生产细胞,其中AAV载体基因组被稳定地保持和包装。示例性的包装和生产细胞来源于SF-9,293,A549或HeLa细胞。使用本领域中已知的标准技术纯化并配制AAV载体。

对于要在体内接触视锥细胞的情况,可以处理主题核苷酸盒或包含主题多核苷酸盒的基因递送载体以适合于递送至眼。特别是,本发明包括药物组合物,其包含本文所述的多核苷酸盒或基因递送载体以及药学上可接受的载体,稀释剂或赋形剂。主题多核苷酸盒或基因递送载体可以与药学上可接受的载体,稀释剂和用于制备通常是安全,无毒的,并且所希望的配制剂的试剂组合使用,并且包括对于灵长类使用可接受的赋形剂。这样的赋形剂可以是固体,液体,半固体,或者在气雾剂组合物的情况下,是气体。这样的载体或稀释剂的实例包括但不限于,水,盐水,Ringer溶液,右旋糖溶液和5%人血清白蛋白。也可以将补充的活性化合物掺入到配制剂中。用于配制剂的溶液或悬浮液可以包括无菌稀释剂,如注射用水,盐水溶液,不挥发油,聚乙二醇,甘油,丙二醇或其它合成溶剂;抗菌化合物如苄醇或对羟基苯甲酸甲酯;抗氧化剂如抗坏血酸或亚硫酸氢钠;螯合化合物如乙二胺四乙酸(EDTA);缓冲剂如乙酸盐,柠檬酸盐或磷酸盐;洗涤剂如Tween 20,以防止聚集;和用于调节张力的化合物,如氯化钠或右旋糖。可以用酸或碱,如盐酸或氢氧化钠调节pH。

在本发明中适合用于内部使用的药物组合物还包括无菌水溶液或分散体和用于临时制备无菌可注射溶液或分散体(dispersion)的无菌粉末。对于静脉内施用,合适的载体包括生理盐水,抑菌水,或磷酸缓冲盐水(PBS)。在一些情况下,该组合物是无菌的,并且应该是以易注射程度存在的流体。在某些实施方案中,它是在制造和储存的条件下是稳定的,并防止微生物如细菌和真菌的污染作用。载体可以是例如含有例如水,乙醇,多元醇(例如,甘油,丙二醇,和液体聚乙二醇等),及其合适的混合物的溶剂或分散介质。例如,通过使用包衣如卵磷脂,在分散体的情况下通过维持希望的颗粒大小和通过使用表面活性剂,可以保持合适的流动性。微生物作用的预防可通过多种抗菌剂和抗真菌剂来实现,例如对羟苯甲酸酯,氯丁醇,苯酚,抗坏血酸,硫柳汞等。在许多情况下,在组合物中包括等渗剂,例如糖,多元醇如甘露醇,山梨醇,氯化钠将是优选的。内部的组合物的延长吸收可以通过在组合物中包含延迟吸收的试剂,例如,单硬脂酸铝和明胶来实现。

通过在合适的溶剂中将根据需要的上述列举成分中的一种或组合以所需要的量掺入到活性化合物,然后过滤灭菌可以制备无菌溶液。一般地,通过将活性化合物掺入到含有基本分散介质和所需要的来自上述列举的其它成分的无菌载体中制备分散体。在用于制备无菌注射溶液的无菌粉末的情况下,制备方法是真空干燥和冷冻干燥,以产生来自其先前无菌过滤的溶液的活性成分加上任何其它希望成分的粉末。在一个实施方案中,制备具有载体的活性化合物,所述载体将保护化合物免受机体快速清除,如控释配制剂,包括植入物和微囊化递送系统。可以使用可生物降解的,生物相容的聚合物,如乙烯乙酸乙烯酯,聚酐,聚乙醇酸,胶原,聚原酸酯,和聚乳酸。对于本领域技术人员,用于制备此类配制剂的方法将是显而易见的。该材料还可以商购获得。脂质体悬浮液(包括靶向受感染细胞的单克隆抗体和针对病毒抗原的脂质体)也可以用作药学上可接受的载体。可以根据那些本领域技术人员已知的那些方法,例如美国专利号4,522,811中描述的方法制备这些配制剂。

特别有利的是配制成剂量单位形式的口服或肠胃外组合物以易于施用和保持剂量的均一性。此处使用的剂量单位形式是指适合作为用于待治疗受试者的单一剂量的物理上离散的单位;每一单位含有计算的与需要的药物载体联合产生期望的治疗效应的活性化合物的预定的量。对于本发明的剂量单位形式的规格决定于和直接取决于活性化合物的独特特性和待实现的特定治疗效应,和配药法领域的内在限制,如用于治疗个体的活性化合物。

药物组合物可以与用于施用的说明书一起包括在容器,包装或分配器,例如注射器,如预装注射器中。

本发明的药物组合物包括任何药学上可接受的盐,酯,或这些酯的盐,或当施用于包括人类的动物时,能够提供(直接或间接)生物活性的代谢物或其残余物的任何其它化合物。因此,例如,本公开还涉及前药和本发明的化合物的药学上可接受的盐,此种前药的药学上可接受的盐和其它生物等同物。

术语“前药”表示治疗剂,其制备为非活性形式,在机体内或其细胞内通过内源性酶或其它化学品和/或条件的作用转化成活性形式(即,药物)。

术语“药学上可接受的盐”是指本发明化合物的生理上和药学上可接受的盐:即,保留了亲本化合物的希望生物活性并且不赋予不希望的毒理学效应的盐。多种药学上可接受的盐在本领域中是已知的,并且描述于,例如,“Remington’s Pharmaceutical Sciences”,17th edition,Alfonso R.Gennaro(Ed.),Mark Publishing Company,Easton,PA,USA,1985(和其最近的版本),“Encyclopaedia of Pharmaceutical Technology”,3rd edition,James Swarbrick(Ed.),Informa Healthcare USA(Inc.),NY,USA,2007,和J.Pharm.Sci.66:2(1977)。此外,对于合适的盐的综述,参见Handbook of Pharmaceutical Salts:Properties,Selection,and Use by Stahl and Wermuth(Wiley-VCH,2002)。

药学上可接受的碱加成盐是与金属或胺,例如碱金属和碱土金属或有机胺一起形成的。用作阳离子的金属包括钠,钾,镁,钙,等等。胺包括N-N’-二苄基乙二胺,氯普鲁卡因,胆碱,二乙醇胺,二环己胺,乙二胺,N-甲基葡糖胺和普鲁卡因(参见,例如,Berge等人,“Pharmaceutical Salts,”J.Pharma Sci.,1977,66,119)。所述酸性化合物的碱加成盐通过游离酸形式与足够量的所希望的碱接触以常规方式产生该盐来制备。游离酸形式通过盐形式与酸接触,并以常规方式分离游离酸而再生。游离酸形式与其各自的盐形式在某些物理性质上,例如在极性溶剂中的溶解度稍微不同,但对于本发明的目的,在其它方面,盐等同于它们各自的游离酸。

可将主题多核苷酸盒或基因递送载体,例如重组病毒(病毒体),掺入到用于施用到哺乳动物患者,特别是灵长类,更特别是人的药物组合物中。主题多核苷酸盒或基因递送载体,例如病毒体可以在无毒,惰性的,药学上可接受的水性载体中,优选在pH 3至8,更优选pH 6到8下配制。这样的无菌组合物将包含载体或病毒体,其含有编码溶解在含水缓冲液中在重构(reconstitution)后具有可接受的pH的治疗性分子的核酸。

在一些实施方案中,本文提供的药物组合物包含治疗有效量的载体或病毒体与药学上可接受的载体和/或赋形剂的混合物,所述载体和/或赋形剂例如盐水,磷酸缓冲盐水,磷酸盐和氨基酸,聚合物,多元醇,糖,缓冲剂,防腐剂和其它蛋白质。示例性氨基酸,聚合物和糖等是辛基苯氧基聚乙氧基乙醇化合物,聚乙二醇单硬脂酸酯化合物,聚氧乙烯脱水山梨醇脂肪酸酯,蔗糖,果糖,右旋糖,麦芽糖,葡萄糖,甘露醇,葡聚糖,山梨糖醇,肌醇,半乳糖醇,木糖醇,乳糖,海藻糖,牛或人血清白蛋白,柠檬酸盐,乙酸盐,Ringer和Hank溶液,半胱氨酸,精氨酸,肉碱,丙氨酸,甘氨酸,赖氨酸,缬氨酸,亮氨酸,聚乙烯吡咯烷酮,聚乙烯和乙二醇。优选地,该配制剂在4℃至少稳定六个月。

在一些实施方案中,本文提供的药物组合物包含缓冲液,诸如磷酸缓冲盐水(PBS)或磷酸钠/硫酸钠,tris缓冲液,甘氨酸缓冲液,无菌水和本领域普通技术人员已知的,如Good et al.(1966)Biochemistry 5:467等人描述的其它缓冲液等。其中药物组合物包括肿瘤抑制基因(包含在腺病毒载体递送系统中)的缓冲液的pH,可以是在6.5至7.75,优选为7至7.5,最优选7.2至7.4的范围内。

方法

如上文所提到,发现主题多核苷酸盒和基因递送载体,在此统称为“主题组合物”,用于在动物的视锥细胞中表达转基因。例如,主题组合物可用于研究中,例如以确定该基因对视锥细胞活力和/或功能的影响。作为另一实例,主题组合物可以用于,例如治疗视锥细胞病症的药物。因此,在本发明的一些方面,提供了用于在视锥细胞中表达基因的方法,该方法包括使视锥细胞接触本公开的组合物。在一些实施方案中,接触发生在体外。在一些实施方案中,接触发生在体内,即将主题组合物施用于受试者。

例如其中视锥细胞在体外与多核苷酸盒或包含主题多核苷酸盒的主题基因递送载体接触,所述细胞可以来自任何哺乳动物物种,例如啮齿动物(例如小鼠,大鼠,沙土鼠,松鼠),兔,猫,犬,山羊,绵羊,猪,马,牛,灵长类,人类。细胞可以来自已建立的细胞系,例如WERI细胞,661W的细胞,或者它们可以是原代细胞,其中“原原代细胞”,“原代细胞系”,和“原代培养物”在本文中可互换使用,指已经来源于受试者,并允许在体外生长,以用于有限数目的传代,即培养物的分裂的细胞和细胞培养物。例如,原代培养物可以是已传代0次,1次,2次,4次,5次,10次或15次,但并没有足够的时间经历危机阶段(crisis stage)的培养物。通常情况下,本发明的原代细胞系被维持在体外少于10次传代。

如果细胞是原代细胞,它们可通过任何方便的方法,例如,整个外植体,活检等收获自哺乳动物。可以将合适的溶液用于分散或悬浮收获的细胞。这样的溶液通常是平衡盐溶液,例如生理盐水,PBS,Hank平衡盐溶液等,所述溶液方便地补充有胎牛血清或其它天然存在的因子,并结合使用低浓度的一般5-25mM的可接受的缓冲液。方便的缓冲液包括HEPES,磷酸缓冲液,乳酸盐缓冲液等。细胞可以立即使用,或者它们可以被长时间储存,冷冻,并且被解冻后能够重新使用。在这种情况下,细胞通常冷冻在10%的DMSO,50%血清,40%缓冲培养基中,或者在本领域中常用于在此种冷冻温度下保存细胞的一些其它这样的溶液中,并且以本领域中公知的用于解冻冷冻的培养细胞的方式解冻细胞。

为促进转基因的表达,主题多核苷酸盒或包括主题多核苷酸盒的基因递送载体将与细胞接触约30分钟至24小时或更长时间,例如,1小时,1.5小时,2小时,2.5小时,3小时后,3.5小时4小时,5小时,6小时,7小时,8小时,12小时,16小时,18个小时,20小时,24小时,等。可以将主题多核苷酸盒或包括主题多核苷酸盒的基因递送载体提供给受试者的细胞一次或多次,例如一次,两次,三次,或三次以上,并且在每个接触事件后,允许所述细胞与试剂温育一定的时间,例如16-24小时,在此之后将培养基替换为新鲜培养基,并进一步培养细胞。接触细胞可以在任何培养基中和促进细胞存活的任何培养条件下发生。例如,细胞可以悬浮在方便的任何合适的营养培养基,如Iscove改良的DMEM或RPMI 1640中,其中补充有胎牛血清或热灭活的山羊血清(约5-10%),L-谷氨酰胺,硫醇,特别是2-巯基乙醇和抗生素,例如青霉素和链霉素。培养物可以含有细胞对其反应的生长因子。如本文所定义的生长因子,是无论是在培养或在完整组织中,通过对跨膜受体的特定效应能够促进细胞存活,生长和/或分化的分子。生长因子包括多肽和非多肽因子。

通常,提供有效量的主题多核苷酸盒或包含主题多核苷酸盒的基因递送载体,以产生转基因在细胞中的表达。如本文别处所讨论的,有效量可以容易地凭经验确定,例如通过检测转基因的基因产物的存在或水平,通过检测对视锥细胞的存活力或功能的效应等确定。通常,有效量的主题多核苷酸盒或包含主题多核苷酸盒的基因递送载体比相同量的本领域已知的多核苷酸盒如pR2.1(SEQ ID NO:50的核苷酸1-2274),pR1.7,pR1.5,pR1.1,或IRBP/GNAT2盒促进转基因在视锥细胞中的更大表达。通常,相对于如本领域中已知的参照或对照多核苷酸盒,表达将提高2倍或更多,例如3倍,4倍或5倍或更多,在某些情况下10倍,20倍或50倍或更多,例如100倍。

在一些实施方案中,当转基因是选择标记,可以通过从剩余群体分离经修饰的细胞富集针对包括主题多核苷酸盒的那些细胞群。分离可以是由适合使用的可选择标记的任何方便的分离技术。例如,如果转基因是荧光标记,细胞可以通过荧光激活细胞分选(fluorescence activated cell sorting)分离,如果转基因是细胞表面标记,可以通过亲和分离技术,例如磁分离,亲和层析,用附着到固体基质的亲和试剂“淘选”,或其它便利的技术从异质群体分离细胞。提供精确分离的技术包括荧光活化细胞分选仪(fluorescence activated cell sorter),其可具有不同程度的掺杂,如多颜色通道,低角度和钝光散射检测通道,阻抗通道等。可以通过采用与死细胞相关联的染料(例如碘化丙啶)选择死细胞。可以采用不会不合适地损害细胞的活力的任何技术。以这种方式实现高度富集的细胞组合物,其包括主题多核苷酸的细胞。“高度富集”,是指经遗传修饰的细胞将是细胞组合物的70%或更多,75%或更多,80%或更多,85%或更多,90%或更多,例如约95%或更多,或细胞组合物的98%或更多。换言之,该组合物可以是经遗传修饰的细胞的基本上纯的组合物。

例如,其中视锥细胞在体内与主题多核苷酸盒或包含主题多核苷酸盒的基因递送载体接触的情况下,受试者可以是任何哺乳动物,例如啮齿动物(例如小鼠,大鼠,沙土鼠),兔,猫,犬,山羊,绵羊,猪,马,牛,或灵长类。在某些实施方案中,受试者是Parvorder狭鼻类(Parvorder Catarrhini)灵长类。如本领域中已知的,狭鼻动物是高等灵长类的两个亚组之一(另一个是新大陆猴),并且包括旧大陆猴和猿,后者又进一步分成较小的猿或长臂猿,和巨猿(great ape),其由猩猩,大猩猩,黑猩猩,倭黑猩猩和人类组成。在进一步优选的实施方案中,灵长类是人类。

主题组合物可通过任何合适的方法施用到受试者的视网膜。例如,主题组合物可通过玻璃体内注射或视网膜下注射施用至眼内。通过玻璃体内注射或通过视网膜下注射递送载体的一般方法可以通过以下简要概述来说明。这些实施例仅仅是用于说明方法的某些特征,并且绝不用于限制。

对于视网膜下施用,可以在使用手术显微镜进行的直接观察下,以视网膜下注射悬浮液的形式递送载体。通常,将通过这样的方法施用1至200uL,例如50uL,100uL,150uL,或200uL,但通常不超过200uL体积的主题组合物。这个过程涉及玻璃体切除术,之后使用细插管通过1个或多个小视网膜切开术将载体悬浮液注射到视网膜下间隙。简言之,可以将输注插管缝合到合适的位置,以通过输注(例如盐水)维持整个操作中的正常球体积。玻璃体切割术使用合适的孔尺寸的插管(例如20到27规格)进行,其中通过输注来自输液插管的盐水或其它等渗溶液替换去除的玻璃体凝胶的体积。有利的是进行玻璃体切割术,因为(1)除去它的皮层(玻璃体后界膜)便于插管穿透视网膜;(2)用流体(例如盐水)除去和替换它产生了适应载体的眼内注射的空间,和(3)它受控的去除减少了视网膜撕裂和计划外的视网膜脱离的可能性。

对于玻璃体内施用,可以以悬浮液的形式递送载体。最初,将局部麻醉剂应用到眼睛表面,之后应用局部消毒溶液。用或者不用仪器使眼睛保持打开,并且在直接观察下,用短而窄的,例如用30计量注射针通过巩膜将载体注射到受试者的眼睛的玻璃体腔中。通常,通过玻璃体内注射而不除去玻璃体将1至100uL,例如25uL,50uL,或100uL,且通常不超过100ul体积的主题组合物递送至眼。备选地,可以执行玻璃体切除术,并且通过输注本主题组合物替换玻璃体凝胶的整个体积。在这样的情况下,可以将最多约4mL的主题组合物递送至,例如人的眼睛。玻璃体内施用一般耐受性良好。在操作结束时,在注射部位有时轻微发红。有偶尔的压痛,但大多数患者没有报告任何疼痛。在此操作后无眼贴或眼罩是必要的,并且活动不受限。有时,开了数天的抗生素滴眼剂的处方,以帮助防止感染。

本公开的方法和组合物在治疗任何状况中得到应用,所述状况可以至少部分通过锥感光细胞基因疗法解决。因此,发现本公开的组合物和方法用于治疗需要视锥细胞治疗的个体。需要视锥细胞治疗的个体是指具有或处于发展视锥细胞病症的风险的个体。视锥细胞病症是指影响视网膜视锥细胞的任何病症,包括但不限于与视锥细胞内缺陷相关联的眼睛的视觉病症,即即锥体内在缺陷(cone-instrinsic defect),例如黄斑营养不良,如斯塔加特黄斑营养不良,锥体营养不良,锥体-视杆营养不良,脊髓小脑性共济失调7型和巴尔得-别德尔综合征-1;以及色觉病症,包括色盲,不完全全色盲,蓝色锥体单色视觉,和红色觉异常,绿色觉异常和蓝色色觉缺陷;以及中央黄斑色觉病症(灵长类中),其可以通过靶向视锥细胞进行治疗,例如年龄相关性黄斑退化症,黄斑毛细血管扩张,色素性视网膜炎,糖尿病性视网膜病,视网膜静脉闭塞,青光眼,索斯比眼底营养不良,成人卵黄状黄斑营养不良,贝斯特病,棒锥体营养不良,利伯先天性黑蒙,和X连锁视网膜劈裂症。

斯塔加特黄斑营养不良。斯塔加特黄斑营养不良,也被称为斯塔加特病和眼底flavimaculatus,是青少年黄斑变性的一种遗传形式,通常导致进行性视力减退至法定盲点。出现症状通常是6至30多岁(平均约16-18岁)岁之间。在几个基因,包括ABCA4,CNGB3,ELOVL4,PROM1中的突变,与该病症相关联。症状通常到二十岁时发展,并且包括波状视觉,盲点,模糊(blurriness),色觉受损,而难以适应暗光。斯塔加特病的主要症状是视敏度范围为20/50至20/200的损失。此外,具有斯塔加特病的那些患者对眩光敏感;阴天出现一些缓解。当黄斑损坏,视觉最显著受损,这可以通过眼底检查来观察。

锥体营养不良。锥体营养不良(COD)是一种遗传性眼部病症,其特征在于视锥细胞的损失。锥体营养不良的最常见的症状是视力减退(发病年龄的范围从十八九岁至六十岁),对亮光敏感,色觉较差。视敏度通常逐渐恶化,但它可以迅速恶化至20/200;之后,在更严重的情况下,它下降到“数指”的视觉。使用显色试验板(HRR系列)进行的色盲检验测试在红-绿和蓝-黄两个板中发现许多错误。据认为,营养不良是主要的,因为在用检眼镜检查可以看出变化之前发现了锥体功能的主观和客观异常。然而,视网膜色素上皮(RPE)迅速参与此病症,导致视网膜营养不良主要涉及黄斑。在锥体营养不良早期,通过检眼镜眼底检查基本正常,并且通常在视力丧失后出现明确的黄斑改变。检眼镜检查时可见的黄斑病变(macular lesion)的最常见的类型具有靶心外观并且由围绕中央较暗区域的萎缩性色素上皮的甜甜圈样区组成。在锥体营养不良的另一种较不频繁的形式中,在黄斑区存在后极的弥散性萎缩,且具有斑点色素团集。罕见地,在早期阶段的患者中可见脉络膜血管层和较大的脉络膜血管的萎缩。荧光素血管造影术(Fluorescein angiography)(FA)是在具有锥体营养不良的人的后处理中有用的辅助手段,因为它可以检测视网膜中的早期变化,其太微弱通过检眼镜看不出来。由于在早期阶段中眼底改变的宽谱与进行诊断中的困难,视网膜电描记术(ERG)仍然是用于进行诊断的最好测试。当测试在光线充足的房间(光适应ERG)下进行时,在ERG上异常椎体功能是通过降低单闪光和闪烁的反应指示的。在几个基因,包括GUCA1A,PDE6C,PDE6H和RPGR中的突变,与该病症相关联。

锥体-视杆营养不良。锥体-视杆营养不良(CRD,或CORD)是属于一组色素视网膜病的遗传性视网膜营养性萎缩。CRD的特征在于在眼底检查中可见视网膜色素沉积,主要定位于黄斑区,并且损失视锥细胞和视杆细胞。与由杆光感受器中的主要损失,之后是锥体光感受器的二次损失所导致的杆锥体营养不良相反(RCD),CRD反映事件的相反顺序:主要涉及椎体,或有时有椎体和视杆的同时损失。症状包括视敏度下降,色觉缺陷,光厌恶(photoaversion)并在中心视野灵敏度下降,之后在周边视觉的渐进性丧失和夜盲症。在几个基因,包括ADAM9,PCDH21,CRX,GUCY2D,PITPNM3,PROM1,PRPH2,RAX2,RIMS1,RPGR,和RPGRIP1中的突变与该病症相关。

脊髓小脑性共济失调7型。脊髓小脑性共济失调是渐进的,退化的遗传性疾病,其特征在于是步态缓慢渐进的动作失调,并且经常与手,讲话和眼球运动的协调性差有关。有多种类型的SCA,其中脊髓小脑性共济失调7型(SCA-7)与大多数其它SCA不同之处在于除了协调性差之外,可以发生视觉问题。SCA-7与在ATXN7/SCA7基因中的automosmal显性突变相关联。当在40岁之前发病时,视力问题,而不是协调性差通常是疾病的早期迹象。早期症状包括难以区分颜色和减少是中央色觉。此外,可检测到共济失调(动作失调,眼球缓慢运动,和在感觉或反射中的轻度改变)的症状。运动控制的丧失,言语不清,和吞咽困难随着病情的发展变得突出。

巴尔得-别德尔综合征-1。(BBS-1)是具有表现变异性和在家族内和之间观察到的广泛临床变异性的多向性病症。其主要临床特征是视杆锥体营养不良,具有在夜盲症之前儿童期发病的视力丧失;轴后性多指症;婴儿期表现为躯干性肥胖,并在整个成年期仍存在此问题;在一些但不是所有的个体中特定的学习困难;男性生殖腺发育不全和复杂的女性泌尿生殖畸形;和肾功能病症,所述病症是发病率和死亡率的主要原因。视力丧失是巴尔得-别德尔综合征的主要特征之一。到童年中期夜间视力问题变得明显,之后,在周边视觉发展盲点。随着时间的推移,这些盲点扩大并合以产生视野收缩。具有巴尔得-别德尔综合征的大多数人还发展了模糊的中央视觉(视敏度差),并在青春期或成年早期失明。巴尔得-别德尔综合征可由已知或怀疑在纤毛功能中发挥关键作用的至少14种不同的基因(通常称为BBS基因)中的突变导致,其中BBS1和BBS10是最常见的突变。

全色盲。全色盲或杆体全色盲是其中受试者经历颜色感知的完全缺乏,使得受试者只能看到黑色,白色和灰色阴影的病症。其它症状包括降低的视敏度,畏光,眼球震颤,小中心暗点和偏注视。这种病症经常首先发现于六个月左右的适龄儿童,通过他们的畏光活动和/或眼球震颤发现。视敏度和眼球运动的稳定通常在生命的第一个6-7年普遍提高(但仍接近20/200)。在CNGB3,CNGA3,GNAT2,PDE6C,和PDE6HI中的突变已与该病症相关。

不完全全色盲。不完全全色盲类似于全色盲但具有较少的外显率。在不完全的色盲中的症状与全色盲是相似,除了症状处于减弱的形式。具有不完全全色盲的个体已经具有降低的视敏度,同时有或无眼球震颤或畏光。此外,这些个体表现出视锥细胞功能的部分损伤但仍然保留了视杆细胞的功能。

蓝锥单色视。蓝锥(S锥)全色盲(BCM)是一种罕见的X连锁先天性静止锥体功能性不良综合征,影响大约10万个体中的1个。影响的具有BCM的男性在视网膜中不含有功能性长波长敏感的(L)或中等波长敏感(M)的锥体,这是由于在针对L和M-视蛋白基因的遗传基因座处的突变。色辨别从出生严重受损,并且视力来源于剩余的保留的S椎体和杆光感受器。BCM通常呈现下降的视敏度(6/24到6/60),摆动性眼球震颤,畏光,并且患者常具有近视。视杆特异性和最大视网膜电流图(ERG),通常显示没有明确的异常,而且检测不到30Hz的锥体ERG。单闪光适应ERG往往是可记录的,虽然小,但在晚期,S锥ERG保存完好。

色觉缺陷。色觉缺陷或色盲,是在正常照明条件下不能看颜色或感知颜色的差异,或看颜色或感知颜色的差异的能力下降。患色盲的个体可以使用任意数量的色觉测试来鉴定,例如颜色ERG(cERG),假同色表板(Ishihara板,Hardy-Rand-Ritter多色板),法-孟二氏100色度试验(Farnsworth-Munsell 100hue test),香港城市大学测试(City University test),Kollner规则,等。色觉缺陷的实例包括红色觉异常缺陷,绿色觉异常缺陷和蓝色色觉缺陷。红色觉异常缺陷包括红色盲(对红光不敏感)和红色弱视(对红光敏感性降低),并与L视蛋白基因(OPN1LW)中的突变有关。绿色觉异常缺陷包括绿色盲(对绿光不敏感)和绿色弱视(对绿光敏感性降低),并与M-视蛋白基因(OPN1MW)中的突变有关。蓝色色觉缺陷包括蓝色盲(对蓝光不敏感)和蓝色弱视(对蓝光敏感性降低),并与S-视蛋白基因(OPN1SW)中的突变有关。

年龄相关性黄斑退化症。年龄相关性黄斑退化症(AMD)是导致50岁以上的人视力丧失的主要原因之一。AMD主要影响中心视觉,这对于具体工作,如阅读,驾驶,和认识面孔是需要的。在此条件下的视力丧失是黄斑的光感受器逐渐恶化的结果。侧(外周)视力和夜视一般都不会受到影响。

研究人员已经描述两种主要类型的年龄相关性黄斑退化症,称为干,或“非渗出性”形式,和湿,或“渗出性”或“新生血管性”形式,这两者都可以通过递送在主题核苷酸盒的背景下的转基因来治疗。

干性AMD的特征在于在视网膜色素上皮和黄斑的底层脉络膜之间黄色沉积物称为玻璃疣的积累,其可以通过眼底照相术观察到。这导致视力缓慢的逐渐丧失。该病症通常会影响双眼视觉,虽然视力减退通常先发生在一只眼睛中,之后是另一只眼睛。其它变化包括色素改变和RPE萎缩。例如,在某些情况下观察到所称作的中心地理萎缩,或“GA”,即视网膜色素上皮的萎缩和在眼的中心部分的光感受器的后续损失。干性AMD已与CD59和在补体级联中的基因突变相关联。

湿性AMD是干性AMD的进展状态,发生在约10%的干性AMD患者中。病理变化包括在黄斑区视网膜色素上皮细胞(RPE)功能病症,在RPE下可收集流体,和脉络膜新生血管形成(CNV)。在严重的情况下可发生液体泄漏,RPE或神经视网膜脱离和血管破裂出血。湿性AMD的症状可以包括视觉扭曲(visual distortion),如直线出现波浪状或弯曲,门道或街道标志看着偏向一方,或物体看起来比它们实际小或更远;中心视觉下降;降低的颜色强度或亮度;在视野中界限清楚的模糊点或盲点。发作可以是突然的和迅速恶化的。诊断可包括使用阿姆斯勒方格表(Amsler grid)测试在受试者的中心视觉中的缺陷(黄斑变性可以导致在网格中的直线看起来是褪色,破碎或扭曲的),使用荧光素血管造影观察血管或视网膜异常,和使用光学相干断层扫描检测视网膜肿胀或血管渗漏。在CNV的产生中已牵涉多种细胞因子,其中有血管内皮细胞生长因子(VEGF),血小板衍生的生长因子(PDGF),色素上皮衍生因子(PEDF),缺氧诱导因子(HIF),血管生成素(Ang),和其它细胞因子,丝裂原活化蛋白激酶(MAPK)和其它。

黄斑毛细血管扩张。黄斑毛细血管扩张症(MacTel)是在黄斑的旁中心凹区域的病理扩张血管(毛细血管扩张)形式。由于充满液体的囊肿的发展,导致组织恶化和视网膜结构变得瘢痕性的,这损伤了感光细胞的营养并永久破坏视力。有两种类型的Mactel,1型和2型。黄斑毛细血管扩张2型是双向性疾病,其发病率最近已显示在40岁及以上的人中高达0.1%。生物显微镜检查可显示降低视网膜透明度,结晶沉积,轻度扩张的毛细血管,变钝的小静脉,视网膜色素斑,中心凹萎缩,和新生血管性复合体。荧光素血管造影术显示在早期毛细血管主要暂时地扩张至中心凹,并在后期是弥漫性强荧光。高分辨率光学相干断层扫描(OCT)可以揭示在后期的光感受器内段-外段边界的破坏,在内部或外部视网膜水平上的高反射(hyporeflective)空腔,和视网膜萎缩。在1型黄斑毛细血管扩张中,这种疾病几乎总是发生在一只眼睛中,这使其与2型相区别。虽然MacTel通常不会引起完全失明,它通常会导致中央视觉(这是阅读和驾驶视觉需要的)在10-20年的时间中的损失。

色素性视网膜炎。色素性视网膜炎(RP)是一组特征在于渐进性周边视觉丧失和夜视困难(夜盲症)的一组遗传性疾病,其可导致中心视觉丧失。呈现的RP的体征和症状有所不同,但经典的那些包括夜盲(夜盲症,RP中最常见的最早症状);视力丧失(通常是外周,但是在发展的情况下,中心视觉丧失);和闪光感(看到光的闪烁)。因为RP为许多遗传疾病的集合,生理发现中存在显著变化。眼部检查涉及视敏度及瞳孔反应的评,以及前段,视网膜,和眼底评估。在一些情况下,RP是综合症的一个方面,例如也与听力损失相关的综合征(Usher综合症,Waardenburg综合症,Alport综合症,Refsum病);Kearns-Sayre综合症(眼外肌麻痹,眼睑下垂,心脏传导阻滞和色素性视网膜病);无β脂蛋白血症(脂肪吸收不良,脂溶性维生素缺乏,脊髓小脑变性和色素性视网膜炎);黏多糖病(例如,Hurler综合症,Scheie综合症,Sanfilippo综合症);巴尔得-别德尔综合症(多趾,躯干性肥胖,肾功能不全,身材矮小,和色素性视网膜病);和神经元蜡样脂褐质症(痴呆,癫痫发作,和色素性视网膜病;婴儿形式被称为Jansky-Bielschowsky病,青少年形式是Vogt-Spielmeyer-Batten病和成人形式是Kufs综合征)。色素性视网膜炎最常见的与在RHO,RP2,RPGR,RPGRIP1,PDE6A,PDE6B,MERTK,PRPH2,CNGB1,USH2A,ABCA4,BBS基因中的突变相关。

糖尿病性视网膜病。糖尿病性视网膜病(DR)是由糖尿病的并发症引起的对视网膜的损伤,这最终可导致失明。不希望受理论的束缚,相信高血糖症诱导的壁间周细胞死亡和基底膜增厚导致血管壁的无功能。这些损害改变血液-视网膜屏障的形成,也使视网膜血管变得更具有渗透性。

存在糖尿病性视网膜病的两个阶段:非增殖性糖尿病性视网膜病(NPDR)和增殖性糖尿病性视网膜病(PDR)。非增殖性糖尿病性视网膜病是糖尿病性视网膜病的第一阶段,通过眼底检查和共存糖尿病诊断。在视力下降的情况下,可以进行荧光素血管造影术以可视化眼睛后边的血管和可能存在的任何视网膜缺血。具有糖尿病的所有人都处于发展成NPDR的风险中,因此,将是用主体载体进行预防性治疗的候选人。增殖性糖尿病视网膜病变是糖尿病性视网膜病的第二阶段,其特征在于视网膜新生血管形成,玻璃体出血,和视力模糊。在一些情况下,纤维血管增殖导致牵引性视网膜脱离。在一些情况下,血管也可以长在眼前房的角度,并引起新生血管性青光眼。具有NPDR的个体处于发展PDR的增加的风险,因此,将是用主体载体进行预防性治疗的候选人。

糖尿病性黄斑水肿。糖尿病性黄斑水肿(DME)是糖尿病视网膜病的进展的,视力不佳限制性并发症,会影响近30%的具有至少20年的糖尿病的患者,并由DR导致大部分的视力丧失。它由视网膜微血管的改变引起,所述改变破坏血-视网膜屏障,导致血浆成分泄漏到周围视网膜,并因此导致视网膜水肿。不希望受理论的束缚,相信高血糖症,在细胞信号通路中的持续改变,具有白细胞介导的损伤的慢性微血管炎症导致慢性视网膜微血管损伤,这会触发VEGF的眼内水平的增加,而这又增加了血管的渗透性。

处于发展DME风险的患者包括那些患者:较长时间患糖尿病的患者,经历严重高血压(血压高),液体潴留,低白蛋白血症,或高脂血症中的一个或多个的患者。DME的常见症状是视力模糊,漂浮物(floater),复视,并且如果允许病症进展而未经处理,最终会导致失明。DME是通过眼底检查诊断为黄斑中心的2视盘直径中的视网膜增厚。可使用的其它方法包括光学相干断层扫描(OCT),以检测视网膜肿胀,囊样水肿,和浆液性视网膜脱离;荧光素血管造影术,如果激光光凝固法被用于治疗水肿,荧光素血管造影术区别和定位病灶相对于弥漫泄漏的区域,从而引导激光光凝固的位置;和彩色立体眼底照相,其可用于评估视网膜的长期变化。也可测量视敏度,特别是追踪黄斑水肿的进展,并在施用主体药物组合物后观察它的治疗。

视网膜静脉闭塞。视网膜静脉闭塞(RVO)是排放视网膜血液的循环部分的堵塞。堵塞可导致毛细血管的后备压力(back-up pressure),这可以导致出血和血液流体和其它成分的泄漏。

青光眼。青光眼是描述一组导致视神经损伤的眼部(眼)病症的术语,经常与在眼中增加的流体压(眼内压)(IOP)相关联。该病症可以大致分为两大类,“开角”和“闭角”(或“角闭”)青光眼。开角型青光眼占美国90%以上青光眼病例。它是无痛的,没有急性发作。唯一的迹象是逐步渐进的视野缺损和视神经的变化(在眼底检查中增加的杯与盘比例)。闭角型青光眼占美国低于10%青光眼病例,但在其它国家(特别是亚洲国家)多达青光眼病例的一半。约10%的闭角型患者存在急性闭角危机,其特征在于是突然眼痛,看灯光周围有色圈,红眼,非常高眼压(30mm汞柱),恶心,呕吐,视力突然下降,以及固定的,中间扩大的瞳孔。在某些情况下它也与椭圆形瞳孔相关联。调节DLK,NMDA,INOS,CASP-3,Bcl-2,或Bcl-xl编码的蛋白质可以治疗该病症。

索斯比眼底营养不良。索斯比眼底营养不良是与TIMP3基因突变相关联的常染色体显性遗传的视网膜疾病。临床上,发现早期,中间-周边玻璃疣和色觉缺陷。有些患者抱怨患夜盲症。最常见地,在生命的第三到第四十年中,由于未治疗的黄斑新生血管形成所表现的,呈现的症状是视力突然丧失。组织学上,存在汇合脂质积累,所述汇合脂质含有30μm厚的Bruch膜的水平的材料。

卵黄状黄斑营养不良。卵黄状黄斑营养不良是一种遗传性眼部疾病,可导致渐进的视力丧失。卵黄状黄斑营养不良与在黄斑底层细胞中的脂肪酸黄色色素(脂褐素)的积累相关联。随着时间的推移,这种物质的异常积累会损害对清晰的中央视觉关键的细胞。其结果是,具有这种病症的人往往失去了其中央视觉,他们的视力可能会变得模糊或扭曲。卵黄状黄斑营养不良通常不影响副(周边)视力或在夜晚观看的能力。

研究人员描述了两种形式的卵黄状黄斑营养不良,它们具有类似的功能。早发形式(被称为贝斯特病)通常出现在儿童期;症状发作和视力丧失的严重性有很大的不同。它与VMD2/贝斯特1基因中的突变有关。成人发病形式(成人卵黄状黄斑营养不良)起始得较晚,通常在中期成年期,并趋向于导致视力损失,并随着时间缓慢恶化。它已与在PRPH2基因中的突变有关。这两种形式的卵黄状黄斑营养不良的均具有在眼科检查过程中能够被检测的黄斑特征的变化。

杆锥体营养不良。杆锥体营养不良是渐进性疾病的家族,其中视杆功能病症,这导致夜盲症和周边视野广度的损失。杆锥体营养不良是普遍存在的问题或至少与锥体功能不良一样严重地发生。可以在视网膜的赤道部看到扇贝-边界的腔隙萎缩。通过临床检查仅轻度地涉及黄斑,虽然在所有情况下看到中央视网膜变薄。色觉病症在早期是轻度的,并通常变得更加严重。视野是中度至严重地收缩,尽管在较年轻的个体中存在典型的环形暗点。外围视网膜中含有“白点”,并且通常类似于在视网膜炎punctate albescen中看到的眼底改变。色素性视网膜炎是这种定义下包括的疾病的主要组,并且估计整个影响大约每3500人中的一个。取决于所使用的分类标准,约60-80%的全部色素性视网膜炎患者具有视网膜疾病的明确的杆锥体营养不良模式,并且一旦考虑到其它综合征形式,约50-60%的全部色素性视网膜炎落在杆锥体营养不良非综合征性类别。

利伯先天性黑蒙。利伯先天性黑蒙(LCA)是视网膜的严重营养不良,通常在出生后的第一年就变得明显。视觉功能通常较差且常伴有眼球震颤,呆滞或近无瞳孔反应,畏光,高度远视,和圆锥角膜。视敏度很少超过20/400。特征性发现是Franceschetti眼-数字标志,包括戳,按,和揉眼睛。眼底的外观变化非常多。虽然视网膜最初看起来是正常的,在儿童后期通常观察到色素性视网膜病暗示着色素性视网膜炎。视网膜电图(ERG)的特点是“检测不到”或严重不正常的。已知在17个基因中的突变导致LCA:GUCY2D(基因座名称:LCA1),RPE65(LCA2),SPATA7(LCA3),AIPL1(LCA4),LCA5(LCA5),RPGRIP1(LCA6),CRX(LCA7),CRB1(LCA8),NMNAT1(LCA9),CEP290(LCA10),IMPDH1(LCA11),RD3(LCA12),RDH12(LCA13),LRAT(LCA14),TULP1(LCA15),KCNJ13(LCA16),和IQCB1。

X连锁视网膜劈裂症。X连锁视网膜劈裂症(XLRS)的特征在于涉及对称双边黄斑,在生命的最初十年发病,在一些情况下早至3个月发病。眼底检查显示在黄斑劈裂的区域(视网膜神经纤维层的分裂),有时产生辐条车轮图像的印象。周边视网膜的劈裂,主要是颞下(inferotemporally),发生在约50%的个体中。受影响的男性通常有20/60至20/120的视觉。视敏度通常在第一和第二个十年的生活中降低,但然后保持相对稳定,直到第五或第六个十年。青少年X连锁视网膜劈裂的诊断是基于眼底的发现,电生理测试和分子遗传学测试的结果。RSI是已知与青少年X连锁视网膜劈裂相关的基因。

受视锥细胞病症影响或处于发展视锥细胞病症的风险中的个体可通过使用技术来检测病症的症状容易地鉴定,所述技术如本领域中已知的,包括但不限于,眼底照相;光学相干断层扫描(OCT);自适应光学(AO);视网膜电描记术,例如ERG,颜色ERG(cERG);色觉测试,如颜色ERG(cERG),假同色表板(Ishihara板,Hardy-Rand-Ritter多色板),法-孟二氏100色度试验(Farnsworth-Munsell 100hue test),Farnsworth板D-15,香港城市大学测试(City University test),Kollner规则等;和视敏度测试,如ETDRS字母测试,Snellen视敏度测试,视野检查,对比敏感度测试等;这些技术是本领域普通技术人员已知的。另外地或备选地,受视锥细胞病症影响或处于发展视锥细胞病症的风险中的个体可通过使用技术来检测本领域中已知的与视锥细胞病症有关的基因突变容易地鉴定,所述技术包括但不限于PCR,DNA序列分析,限制性消化,Southern印迹杂交,质谱法等。在一些实施方案中,所述方法包括鉴定需要视锥细胞治疗的个体的步骤。在这种情况下,用于确定个体是否具有视锥细胞病症的症状或处于发展成视锥细胞病症的风险中的任何方便的方法可以用来鉴定需要视锥细胞治疗的个体,所述方法例如检测本文描述的或本领域已知的症状,检测本文描述的或本领域已知的基因中的突变。

在实施主题方法时,主题组合物通常以有效地导致在视锥细胞中表达转基因的量递送到受试者的视网膜中。在一些实施方案中,该方法包括检测在视锥细胞中的转基因表达的步骤。

有检测转基因的表达的许多方式,其中任何一种可以用于主题实施方案。例如,例如通过测定基因产物的量可以直接检测表达,所述表达例如检测RNA水平,例如,其通过RT-PCR,Northern杂交,RNA酶保护检测;或所述表达例如检蛋白质水平,其例如通过Western印迹,酶联免疫吸附,免疫组织化学等检测。作为另一实例,可以通过检测基因产物对受试者中锥光感受器的生存力或功能的影响间接地检测表达。例如,如果由转基因编码的基因产物改进了视锥细胞的生存力,那么转基因的表达可以通过检测视锥细胞的生存力的改进来检测,所述改进例如通过眼底照相,光学相干断层扫描(OCT),自适应光学(AO)等检测。如果由转基因编码的基因产物改变视锥细胞的活性,那么转基因的表达可以通过作为检测递送多核苷酸存在的方法的以下方法检测视锥细胞的活性的改变来检测:功能性自适应光学(AO);色觉测试,假同色表板(Ishihara板,Hardy-Rand-Ritter多色板),法-孟二氏100色度试验(Farnsworth-Munsell 100hue test),Farnsworth板D-15,香港城市大学测试(City University test),Kollner规则等;和视敏度测试,如ETDRS字母测试,Snellen视敏度测试,视野检查,对比敏感度测试等。在一些情况下,可以检测到存活力提高和视锥细胞功能中的修饰两种。

在一些实施方案中,主题方法导致治疗益处,例如预防病症的发展,阻止病症的进展,逆转病症的进展等。在一些实施方案中,主题方法包括检测已经实现的治疗益处的步骤。本领域普通技术人员将理解,将治疗功效的这种测量应用于特定的疾病时会修改,并且将认识到使用合适的检测方法来测量治疗功效。例如,治疗黄斑变性的治疗功效可以观察为在黄斑变性的速率降低或黄斑变性进展的停止,该效应例如,通过眼底照相,OCT,或AO,通过比较施用主题组合物后的测试结果与主题组合物的施用之前的结果来观察。作为另一个实例,在治疗渐进性锥体功能不良中的治疗功效可以观察为在锥体功能不良进展的速率的降低,如锥体功能不良的进展的停止,或在锥体功能的改进,该效应可通过,例如,ERG和/或cERG;色觉测试;功能自适应光学;和/或视敏度测试,例如,通过比较施用主题组合物后的测试结果与主题组合物的施用之前的结果并检测锥体活性和/或功能的改变来观察。作为第三个实例,在治疗色觉缺陷中的治疗功效,可以观察为个体颜色感知的改变,例如感知红色波长,感知绿色波长,感知蓝色波长中的改变,该效应可通过cERG和色觉试验,例如,通过比较施用主题组合物后的测试结果与主题组合物的施用之前的结果并检测在锥体活性和/或功能的改变来观察。

使用主题转基因进行的转基因表达预期是强健的。因此,在一些情况下,转基因的表达,例如通过测定基因产物的水平,通过测量治疗功效等检测到,所述表达可在施用后两个月或更短的时间后,例如4,3周或2周或施用后更短的时间,例如,主题组合物施用1周后观察到。还预期随着时间转基因的表达将持续。因此,在一些情况下,转基因的表达,例如通过测定基因产物的水平,通过测量治疗功效等检测,所述表达可可以在主题组合物的施用后2个月或更长的时间,例如,4,6,8,或10个月,或更长的时间可以观察到,在一些情况下1年或长的时间,例如2,3,4或5年内,在某些情况下,超过5年以上可以观察到。

在某些实施方案中,该方法包括检测在视锥细胞中转基因表达的步骤,其中所述表达相对于来自不包括本公开的一个或多个改进的元件的多核苷酸盒,即参考对照的表达是增强的,所述参考对照例如例如,美国申请号2013/0317091所公开的,pR2.1启动子或其变体(如pR1.7,pR1.5,pR1.1等)中,或美国申请号2014/0275231公开的合成IRBP/GNAT2启动子;将所述美国申请的全部公开通过引用并入本文。典型地,相对于来自参考,即例如如本领域中已知的对照多核苷酸盒的表达,表达会增强2倍或更多的,例如3倍,4倍或5倍或更多,在某些情况下10倍,20倍或50倍或更多,例如100倍,这通过例如早期检测得到的基因产物的更高水平,对细胞更强的功能性影响等证明。

通常,如果主题组合物是包含本公开的主题多核苷酸盒的rAAV,实现改变的有效量将是大约1×108载体基因组或更多,在某些情况下,1×109,1×1010,1×1011,1×1012,或1×1013载体基因组或更多,在某些情况下,1×1014载体基因组或更多,且通常不超过1×1015载体基因组。在某些情况下,被递送的载体基因组的量为至多约1×1015载体基因组,例如1×1014载体基因组或更少,例如1×1013,1×1012,1×1011,1×1010,或1×109载体基因组或更少,在某些情况下1×108载体基因组,通常不超过1×108载体基因组。在某些情况下,被递送的载体基因组的量为1×1010至1×1011载体基因组。在某些情况下,被递送的载体基因组的量为1x1010至3x1012载体基因组。在某些情况下,被递送的载体基因组的量为1×109至3xl013载体基因组。在某些情况下,被递送的载体基因组的量为1×108到3xl014载体基因组。

在某些情况下,药物组合物的量可使用感染复数(MOI)测定。在一些情况下,MOI是指载体或病毒基因组与核酸可以被递送的细胞的比例,或倍数。在一些情况下,MOI可以是1x106。在一些情况下,MOI可以是1x105-1x107。在某些情况下,本公开的重组病毒是至少约1x101,1x102,1x103,1x104,1x105,1x106,1x107,1x108,1x109,1x1010,1x1011,1x1012,1x1013,1x1014,1x1015,1x1016,1x1017,和1x1018MOI。在某些情况下,本公开的重组病毒是1x108至3x1014MOI。在一些情况下,本公开的重组病毒是至少约1x101,1x102,1x103,1x104,1x105,1x106,1x107,1x108,1x109,1x1010,1x1011,1x1012,1x1013,1x1014,1x1015,1x1016,1x1017,和1x1018MOI。

在一些方面中,药物组合物的量包括约1×108至约1×1015的重组病毒,约1×109约1×1014的重组病毒,约1×1010至约1×1013的重组病毒,或约1×1011至约3×1012的重组病毒。

单个剂量通常不少于产在受试者上产生可测量效应所需要的量,并且可基于针对主题组合物或其副产物的吸收,分布,代谢和排泄(“ADME”)的药物动力学和药理学,从而基于在受试者内组合物的分布来确定。这包括考虑施用途径,以及剂量,其可以针对视网膜下(直接应用到希望该作用是主要的局部效应的位置),玻璃体内(应用到玻璃体以用于全视网膜效应),或肠胃外应用(通过全身途径,例如静脉内,肌内等应用)进行调整。有效剂量和/或剂量方案可以容易地从临床前测定,从安全性及扩大和剂量范围试验,个体医生与患者的关系,以及在如本文描述和实验部分说明的体外和体内测定法凭经验确定。

将在本说明书引用的和/或在申请数据表,包括但不限于[插入列表]中列出的所有上述美国专利,美国专利申请出版物,美国专利申请,外国专利,外国专利申请和非专利出版物,通过引用它们的整体并入本文。

从前述内容,可以理解的是,虽然为了说明性目的,在此已经描述本发明的具体实施方案中,可以在不脱离本发明的精神和范围的情况下作出多种修改。因此,除所附权利要求之外,本发明并不局限于说明书。

实施例

提出下面的实施例,以便为本领域的技术人员提供如何进行和使用本发明的完整的公开和描述,并且不旨在限制发明人所认为的其发明的范围,也不旨在表示下面的实验是进行的全部或唯一实验。已努力确保所用数字(例如量,温度等)的准确性,但应具有一些实验误差和偏差。除非另外指出,否则,份数是重量份数,分子量是平均分子量,温度是摄氏度,压力为大气压或接近大气压。

分子和细胞生物化学中的一般方法可以在以下的标准教科书中发现,如Molecular Cloning:A Laboratory Manual,3rd Ed.(Sambrook et al.,HaRBor Laboratory Press 2001);Short Protocols in Molecular Biology,4th Ed.(Ausubel et al.eds.,John Wiley&Sons 1999);Protein Methods(Bollag et al.,John Wiley&Sons 1996);Nonviral Vectors for Gene Therapy(Wagner et al.eds.,Academic Press 1999);Viral Vectors(Kaplift&Loewy eds.,Academic Press 1995);Immunology Methods Manual(I.Lefkovits ed.,Academic Press 1997);and Celland Tissue Culture:Laboratory Procedures in Biotechnology(Doyle&Griffiths,John Wiley&Sons 1998),将所述教科书公开的内容通过引用并入本文。在本公开中提到的用于基因操作的试剂,克隆载体,和试剂盒从供应商如BioRad,Stratagene,Invitrogen,Sigma-Aldrich,和ClonTech获得。

背景

需要用于治疗许多锥光感受器相关病症的新疗法,所述锥光感受器相关病症包括黄斑营养不良如锥体-视杆营养不良,锥体营养不良,斯塔加特黄斑营养不良,以及全色盲;色觉病症,如红色觉异常,绿色觉异常和蓝色色觉缺陷;和中央黄斑视觉病症,如年龄相关性黄斑退化症,黄斑毛细血管扩张,色素性视网膜炎,糖尿病性视网膜病,视网膜静脉闭塞,青光眼,索斯比眼底营养不良,成人卵黄状黄斑营养不良,贝斯特病,和X连锁视网膜劈裂症。因为这些视觉病症与锥体光感受器的功能损失和/或存活力相关联,所以猜测这些疾病是可以通过将治疗性基因递送至锥体光感受器来恢复锥体活力和功能治疗的。

为此,设计了多核苷酸盒“pMNTC”,其中将增强子,启动子,5’UTR,内含子,Kozak,和聚腺苷酸化序列设计为用于锥体特异性表达(图10a)。盒包括来自L-和M-视蛋白基因座的LCR增强子序列,和来自M视蛋白基因的截短的启动子序列,其包含转录起始位点上游约140个核苷酸。此外,盒包括基于M-视蛋白5’UTR但修改成具有最小的二级结构的5’非编码区(5’UTR)(参见图3),并在其3’端包括其中插入内含子的另外的序列。所使用的内含子序列是pSI嵌合内含子,其具有来自人β珠蛋白基因的第一内含子的5’端供体位点,和来自免疫球蛋白基因重链可变区的前导序列和主体之间的内含子的分支和3’端受体位点(Bothwell,A.L.et al.(1981)Heavy chain variable region contribution to the NPb family of antibodies:Somatic mutation evident in a gamma 2a variable region.Cell 24,625–37)。改变供体和受体位点,以及分支点位点以匹配用于剪接的共有序列(Senapathy,P.,Shapiro,M.B.and Harris,N.L.(1990)Meth.Enzymol.183,252–78)。在pMNTC多核苷酸盒中也包括强Kozak序列和SV40多腺苷酸化序列。

也进行了实验以鉴定最佳AAV,以将转基因递送至视锥细胞。已经使用病毒载体,如AAV和慢病毒来实现将多核苷酸成功递送至视网膜细胞以用于基因疗法的目的。但是,这些病毒必须经视网膜下注射到非人灵长类(NHP)的视网膜,该操作具有视网膜损伤的风险。较小破坏性的方法是通过玻璃体内注射施用。然而,从未证实在玻璃体内递送AAV或慢病毒后有效地转导了锥体光感受器,尽管报道了存在具有以高效率转导视网膜视锥细胞的能力的AAV(Merigan et al.IOVS 2008,49E-abstract 4514),later reports have questioned the efficacy of these vectors(Yin et al.IOVS 2011,52(5):2775-2783)。

结果

AAV2的定向进化导致病毒变体“7m8”的鉴定,“7m8”能够比野生型AAV2更好地转导光感受器(Dalkara et al.Sci Transl Med 2013)。然而,视网膜包含两种类型光感受器-视杆和视锥-并且没有存在的报道表明AAV2-7m8是否可以转导锥体光感受器本身,并且更具体的,在小凹的锥体高度富集区中的锥体光感受器。为了测试这种可能性,我们通过玻璃体内注射将AAV2-7m8递送至非洲绿猴的视网膜,所述AAV2-7m8携带可操作地连接于GFP的遍在启动子CMV的表达盒。相比于比经玻璃体内递送的AAV2或在本领域中先前显示转导视网膜细胞的其它的AAV变体,经玻璃体递送的AAV2-7m8.CMV.GFP看起来更有效地转导灵长类的中央凹(fovea centralis)(在中心凹坑的中心的视网膜的0.35mm直径的无锥杆区域)和旁中心凹(凹陷的唇)的视网膜细胞。AAV2-7m8或其它经测试的AAV似乎均不能够转导灵长类的小凹(fovea),即视网膜的1.5mm直径的锥富集区域,其围绕中心凹并形成坑的斜坡(图5)。

我们接下来将包括可操作地连接于GFP的pMNTC的基因组包装到AAV2-7m8壳体内,并评估经玻璃体内注射时该载体组合物在体内的视锥细胞中表达GFP转基因的能力。评价了在许多物种中的表达,所述物种在总的光感受器中具有不同数目的视锥细胞,包括鼠(3%锥体),大鼠(1%锥体),沙土鼠(13%锥体)和非人灵长类(5%锥体)。与我们在图5中的结果相反,可以在整个非人灵长类小凹检测到强的基因表达(图6)。这些数据表明,经玻璃体内递送的AAV2-7m8实际上可以转导视网膜锥体,并且pMNTC充当视锥细胞中的强表达盒。强的报告基因表达也可见于经玻璃体内递送的大鼠(数据未显示)和沙土鼠(图8A)的视网膜中,其中在所有物种的表达水平和解剖位置与锥体的丰度和位置相关。

为确定pMNTC指导表达的细胞特异性,使用特异地针对锥体L和M视蛋白的抗体通过免疫组织化学分析经转导的小鼠视网膜的整个量。实际上,在所有的表达来自AAV2-7m8.MNTC.GFP载体的GFP的小鼠视网膜的视锥细胞中观察到L/M视蛋白的表达,其仅标记锥体光感受器的外段(图7),这表明MNTC指导的转基因的表达是锥体高度特异性的。另外,通过L/M视蛋白特异性抗体标记的80%或更多的锥体外段也表达GFP转基因,这指示AAV2-7m8高效地转导锥体(图7)。

接下来,我们比较了pMNTC与pR2.1促进在视锥细胞中表达的能力。pR2.1包含人L/M视蛋白增强子(“LCR”)和来自人L-视蛋白基因的启动子区。此外,pR2.1包括在其3’端融合至其它5’UTR序列的L视蛋白5’UTR,其中已经插入经修饰的SV40晚期16s内含子序列。这之后是L-视蛋白Kozak序列,然后通常将其在框内连接到转基因。在盒的末端是SV40聚腺苷酸尾。

将AAV2-7m8.MNTC.GFP和AAV2-7m8.pR2.1.GFP的病毒制备物在体内经玻璃体内递送至沙土鼠和非人灵长类的视网膜中,并且在2周,4周,8周和12周后通过眼底自体荧光和OCT在体内对视网膜成像。用携带pMNTC.GFP表达盒的rAAV转导的沙土鼠视网膜中比携带pR2.1.GFP表达盒的沙土鼠视网膜中GFP报道基因的表达更早地,更强地和在更多的椎体中检测到(图8B)。同样地,用携带pMNTC.GFP表达盒的rAAV转导的非人灵长类视网膜中比用pR2.1.GFP表达盒转达的NHP视网膜中GFP报道基因的表达更早地,和在更多的椎体中检测到(图9,n=4只眼)。在整个研究期间,在沙土鼠和NHP两者中,一致地观察到来自pMNTC的GFP比来自pR2.1的GFP更强。

为确定在pMNTC表达盒中的每个元件对表达的整体改进的贡献,克隆了一系列的表达构建体,其中,在pMNTC中的每个元件被逐一取代为来自pR2.1表达盒的相应元件。然后,将这些构建体包装到AAV2-7m8并通过玻璃体内注射递送至沙土鼠视网膜。在4和8周后在体内通过体内生物发光(IVIS imaging system,PerkinElmer)评价沙土鼠视网膜,所述体内生物发光提供报告基因在整个眼睛中表达的定量读数。

正如所预期的,pMNTC控制下的萤光素酶报道基因的表达比pR2.1控制下的萤光素酶报道基因的表达高。将pMNTC启动子序列替换为与它具有最多的序列同源性的pR2.1启动子序列(SEQ ID NO:83)使表达降低(pMNTC_pR2.1L3’P构建体),这与包括位于pR2.1的5’UTR的更远端的pR2.1启动子序列(SEQ ID NO:82)(构建体pMNTC_pR2.1-L5’P)是一样的。通过将在pR2.1 5’UTR中观察到的两个假起始序列(“AUG1”和“AUG2”)引入到pMNTC 5’UTR(构建体pMNTC_2.1-AUG1/2)也使表达降低。有趣的是,当pMNTC 5’UTR替换为修饰pR2.1 5’UTR序列,其中已除去了这些假起始(SEQ ID NO:87,将核苷酸17改变为C,nt 61和62改变为CA)(pMNTC_pR2.1-5’UTR)未使表达降低,这表明除pR2.1 5’UTR元件中的假AUGs外,pR2.1 5’UTR将促进在视锥细胞中的强力表达。还有趣的是,pR2.1内含子(SEQ ID NO:59)看起来比pMNTC的PSI嵌合内含子提供更强健的表达,这表明在本公开的多核苷酸盒中包括的pR2.1内含子可用于进一步改进视锥细胞中的表达。最后,去除L/M增强子(在pR2.1和pMNTC两者中找到的)也使表达降低。虽然加尾的polyA看起来也首先显著地影响表达,包含这种pR2.1元件的pMNTC构建体体的重新测序揭示了该polyA尾没有可操作地连接于转基因,从而解释了为什么从该构建体只观察到背景水平的表达。因此,L/M视蛋白LCR,包括M视蛋白核心启动子而不是第L视蛋白启动子,并且在5’UTR排除假起始全部对使用pMNTC启动子来实现基因表达的增强具有贡献。

总之,我们已经鉴定了AAV变体,所述AAV变体包括GH环中的7m8肽,其可用于将多核苷酸经玻璃体内递送至视网膜锥体。同样,我们已经鉴定多种多核苷酸盒元件,其可用于促进在锥体光感受器中的强力表达。总之,这些发现表示这些改进可以促进针对锥体相关病症的治疗剂的发展。

材料和方法

在WERI-RB-1细胞的体外转基因表达。用本公开的多核苷酸盒,根据Shaaban and Deeb,1998;IOVS 39(6)885-896描述的方法转染表达锥体感光色素细胞的WERI-RB-1视网膜母细胞瘤细胞。利用分子生物学的建立的良好技术,如克隆(Maniatis et al.),或从头DNA合成以质粒DNA的形式进行多核苷酸盒的转染。所有调节元件被放置在盒中并用于驱动增强的GFP蛋白。然后使用已建立的用于非病毒转染的技术将质粒DNA引入到细胞中,例如使用基于脂质的转染试剂((Altogen Biosystems,NV)或脂质体LTX(Life Technologies)。细胞然后培养72小时并且eGFP的表达是使用流式细胞仪和荧光显微镜进行测定的。将在用本公开的多核苷酸盒转染的细胞中的转基因表达(即,为锥体光感受器表达设计的构建体)与未优化的对应物(即,基于pR2.1的那些)比较,并且发现来自携带改进元件的盒中的表达更强。

还评估了使用表达锥体视蛋白的其它哺乳动物细胞系,例如661W细胞(Tan et al.,IOVS 2004;45(3)764-768)进行的体外表达。

相似地,使用已改造为表达锥体光感受器特异性蛋白的非感光细胞系评估了体外表达。已经描述了用于这样的系统的HEK293细胞,其已被遗传改造以表达CRX/Sp1(Khani et al.,IOVS 2007;48:3954)。也使用标记基因(eGFP,dsRed,mCherry,萤光素酶)以及生理基因(视蛋白,ACHR基因)。生理基因通过检查mRNA水平(例如,通过RT-PCR)或蛋白质水平(例如,通过ELISA或Western印迹)进行测试。

动物管理。所有实验符合由美国生理学会和神经科学学会(American Physiological Society and the Society for Neuroscience)采用的,并由Institutional Animal Care and Use Committee(IACUC)批准的关于动物的管理和使用的原则,。

小动物研究。由表达盒的编码序列编码的基因产物的表达在小鼠,大鼠,和沙土鼠体内进行了评估。这是通过在体内经玻璃体内注射包含表达盒的rAAV配制剂来完成(Li et al.,2008;Mol Vis 48:332-338)。注意:可以进行质粒DNA的电穿孔代替(Matsuda/Cepko)。

小鼠研究。在这项研究中使用的小鼠是C57BL/6。用氯胺酮/赛拉嗪(110mg/kg腹膜内)麻醉动物。将装载有测试制品的斜面34号一次性针头插入到眼睛的玻璃体中,并且将在1.5μ1体积中的rAAV的5.04×1010载体基因组注射到玻璃体中。

沙土鼠和大鼠研究。将蒙古沙土鼠(Mongolian gerbils)(长爪沙土鼠(Meriones unguiculatus))和棕色挪威大鼠(brown Norway rat)用于本研究中。用10%苯福林和0.5%托吡卡胺扩张瞳孔。用腹膜内或肌内注射0.1-0.2mL氯胺酮/赛拉嗪溶液麻醉动物(对于大鼠,70mg/mL氯胺酮和10mg/mL的赛拉嗪;对于沙土鼠,25mg/mL氯胺酮和0.3mg/mL赛拉嗪)。将在100μL Hamilton注射器中的装载有测试物品的斜面34号一次性针头从角膜缘约1mm的优化的优越点穿过巩膜插入到眼的玻璃质中。用显微注射泵将5uL体积中的测试物品的1×1010-2×10个载体基因组(2x 1010vg rAAV.GFP的,或1.15x 1010vg AAV萤光素酶)缓慢注入到玻璃体,在此之后针尖在注入的眼中在注射位置保持10秒,以确保分配了足够的测试物品。然后,将针头撤回。

非人类灵长类(NHP)研究。在大型动物也测试了多核苷酸盒和表达载体。这是通过使用AAV,例如Mancuso et al的技术完成的。简言之,制备了AAV盒,制备了经AAV包囊的表达盒,并且将病毒配制剂注射到非人灵长类的玻璃体内(在玻璃体高达170uL)或视网膜下(在不同的位置高达3100uL;在注射之前可以进行玻璃体切割)。通过报道基因(GFP),颜色ERG,和/或使用剑桥颜色测试或训练的当靶标进入视野时进行扫视(眼球运动)的动物进行行为测试来评价表达。扫视使用眼动仪(eye tracker)进行监测。在处理前,对动物进行训练,以执行色觉测试或当它看到彩色的目标时进行扫视。执行ERG以估计存在的锥体的光谱灵敏度。来自色觉测试表现和ERG的数据提供证据表明,动物是双色(色盲)。对于接受携带GFP基因的载体的动物,用RetCam II或类似的设备使用眼底成像在产生了GFP的激发的光下监控表达。对于接受相对于动物的内源色素在光谱灵敏度上不同于感光色素基因的动物,表达是使用多焦点颜色ERG测量在高达106不同的视网膜位置处的光谱灵敏度,并且通过行为测试进行监测的。

用10-15mg/kg氯胺酮之后是sevofluorane使狒狒镇静。用5:1氯胺酮:赛拉嗪混合物(100mg/mL氯胺酮和20mg赛拉嗪,以0.2ml/kg注射)肌肉注射使非洲绿猴镇静。局部10%苯福林实现瞳孔散大。将开睑器放入眼睛,以方便注射。应用一滴0.5%的盐酸丙美卡因,然后是5%聚维酮碘溶液,接着用无菌盐水漂洗。狒狒(图6)通过玻璃体内(ITV)注射接受3.4x 1013vg的rAAV配制剂以产生每只眼2.02×1012vg的最终剂量。非洲绿猴通过ITV注射接受50uL 1x1013的rAAV载体配制剂以产生每只眼5x 1011vg的最终剂量。施用了ITV到中央玻璃体的注射,这是使用31号0.375英寸针头(Terumo),在外科放大下以距角膜缘之后锯齿缘~2.5mm的水平插入到颞下进行的,以允许眼外的完全可视化和眼内针的放置。中央玻璃体放置通过在注射时针尖的直接观察证实。在ITV注射后,局部施用了三倍的抗生素软膏。

裂隙灯生物显微镜。在基线筛选期间,并在注射后4周(28天),第8周(56天)和第12周(84天)通过裂隙灯生物显微镜检查每只猴眼的前段以监测炎症。没有观察到异常。

眼底检查和照相。使用Phoenix Micron IV眼底显微镜下进行大鼠和沙土鼠视网膜的眼睛检查和眼底照相。所有动物接受基线筛选/照相确认眼部健康,然后在指定的时间点照相以监测GFP转基因的表达。通过彩色眼底照相记录视神经和视网膜或肉眼损伤的外观的任何变化,并且使用具有荧光素滤波器的眼底荧光成像可视化GFP的表达。

使用Topcon TRC-50EX视网膜相机进行眼底检查,眼底彩色和荧光照相,NHP的自发荧光OCT,所述视网膜相机具有佳能6D数字成像硬件,新视觉眼底图像分析系统软件和Spectralis OCT Plus。所有动物接受基线成像。在玻璃体内载体注射后第2周,第4,第8,和12周也记载了GFP的表达。

IVIS成像系统。在递送rAAV萤光素酶后,在玻璃体内注射2,4和8周后使用IVIS成像系统在体内定量了视网膜萤光素酶的表达。用150mg/kg萤光素(PerkinElmer)(15mg/mL荧光素以15ml/千克的剂量)经皮下注射沙土鼠。约22分钟后,通过吸入4%异氟烷3-5分钟使动物镇静。紧接着,将动物成对地放置在成像平台上,并定量每只动物的一只眼睛的发光,之后立即对对侧眼成像。天然的沙土鼠用作阴性标准,其具有通常登记为1×104光子/秒的发光的背景水平。在成像前使用仿真小鼠(用于生物发光成像的XPM-2Perkin Elmer仿真小鼠)进行生物发光验证以确保成像系统的校准。

免疫组织化学。用致死剂量的戊巴比妥钠安乐死小鼠,并且通过心脏灌注固定组织:首先用每mL含有2个单位肝素的0.13M pH值7.2-7.4的磷酸缓冲盐水(PBS),之后是PBS中的4%的多聚甲醛(PFA),之后是PBS中的4%的多聚甲醛加1%的戊二醛固定。戊二醛有助于保持附着到RPE上的神经视网膜使得锥体外段保持不变。仅在施用之前将各溶液温热至~37℃,并且在每个阶段递送35-40mL灌注液。一旦灌注停止,将小鼠包裹在湿纸巾并留下以进一步固定2-3小时,之后进行摘出术和解剖。

使用永久油墨来标记眼睛的方向,除去前面部分,将洗眼杯在4℃固定在4%PFA中过夜,然后于4℃下储存于PBS中。通过压扁在4%PFA中浸泡两小时的在组织之间切割的视网膜制备视网膜全标本包埋(Retinal whole-mount),然后将它们转移到培养板上,固定6小时。随后,用含有0.03%叠氮化钠(Sigma)的PBS替换PFA。

抗体的标记在旋转台振荡器上进行。为阻断非特异性标记,在4℃下用溶液温育全标本包埋过夜,所述溶液含有5%驴血清(Jackson ImmunoResearch,Cat#004-000-120),1mg/ml BSA(Jackson ImmunoResearch,Cat#001-000-161),和PBS(pH 7.4)中的0.03%Triton X-100。在这项研究中所用的一级抗体是以1:200稀释的兔抗红-绿(L/M)视蛋白(Millipore,Cat#AB5405)。在PBS中洗涤样本3次,每次30分钟,然后在4℃与加了二级抗体的DAPI(4’,6-二脒基-2-苯吲哚,卡匹帕明1:10,000;Invitrogen,Cat#D-21490)温育过夜。针对L/M-视蛋白的二级抗体是在抗体稀释缓冲液中以1:200稀释的经Alexa Fluor 488标记的驴抗兔IgG(H+L)(Invitrogen,Cat#A21206)。与二级抗体温育之后是三个30分钟的PBS洗涤,30分钟用4%多聚甲醛固定,和三个30分钟的PBS洗涤。最后,视网膜切片放在具有甘油中的2%DABCO的载玻片上并盖上盖玻片。

显微镜检查。小鼠视网膜全标本包埋的宽视野图像使用具有20X(户外)物镜,相机设置为1.5倍的光学变焦的Nikon Eclipse E1000获得。对于每个样本,取0.5μm分开的50个光学切片,并且在ImageJ中重建M视蛋白Z-堆。调整Z堆叠的方向使得外段的长度在平面内,并且将抗体染色的开始和结束之间的距离测量为外段长度的估计。此外,产生Z堆的3D投影,并且可以定量具有在外段中可见的M-视蛋白的锥体的数目。

使用Olympus FluoViewTM FV1000获得共聚焦图像切片。切片用20倍油浸镜头成象(取0.5μm分开的40个相片),并且在ImageJ中重建Z-堆。使用Adobe Photoshop平衡图像中和图像之间的通道暴露水平。对于视网膜全标本包埋,使用10×户外镜头进行成像,并且使用Adobe Photoshop的原生马赛克构建软件照相的图像构建了马赛克。

测试多核苷酸盒的组织特异性的实验。在这种情况下,经由一种或多种施用途径,如玻璃体内,视网膜下,或静脉内注射了编码GFP的构建体。然后将动物处死并通过qPCR分析组织-以检测指示所述构建体的存在的DNA序列-以及GFP表达–以检测构建体正在活跃表达的区域。而缺乏DNA序列指示在给定组织中缺乏生物分布,DNA序列的存在同时缺少转基因表达(mRNA或蛋白质水平)指示载体的存在,但在该组织中不表达。以这种方式,可以建立针对锥体光感受器的特异性水平,并用于确定本发明在以下方面的效用:限制表达以靶向锥体感光细胞,而在非靶组织如视神经,肝,脾方面,或脑组织中不表达。已知生物分布到大脑(Provost et al)的玻璃体内AAV如此高度地表达,用于靶向锥体感光细胞的改进构建体将可用于将表达限制于视网膜靶细胞,并限制与脱靶转基因表达相关的潜在不良事件。

前述仅仅说明了本发明的原理。应当理解,本领域技术人员将能够设计多种排列(尽管未在本文明确描述或显示)来体现本发明的原理,所述排列也包括在本发明的精神和范围之内。此外,所有实施例和本文列举条件语言主要旨在帮助读者理解本发明的原理,并促进现有技术贡献的本发明的概念,并且应当被解释为不限于这些具体记述的实例和条件。此外,本文记述本发明的原理,方面,和实施方案及其具体实施例的所有陈述,意在涵盖它们的结构和功能等效物。此外,预期这种等同物包括当前已知的等同物以及将来开发的等同物,即与结构无关执行相同的功能的任何元件。因此本发明的范围内并不意在限于本文所示和描述的示例性实施方案。相反,本发明的范围和精神由所附的权利要求书体现。

序列表

<110> 阿德夫拉姆生物技术股份有限公司

Chalberg, Thomas W. Jr.

Neitz, Jay

Neitz, Maureen

<120> 用于视锥细胞中增强的基因表达的组合物和方法

<130> AVBI-005/02WO

<150> US 61/954,330

<151> 2014-03-17

<150> US 62/127,185

<151> 2015-03-02

<160> 103

<170> PatentIn版本3.5

<210> 1

<211> 494

<212> DNA

<213> 智人

<400> 1

ggatccggtt ccaggcctcg gccctaaata gtctccctgg gctttcaaga gaaccacatg 60

agaaaggagg attcgggctc tgagcagttt caccacccac cccccagtct gcaaatcctg 120

acccgtgggt ccacctgccc caaaggcgga cgcaggacag tagaagggaa cagagaacac 180

ataaacacag agagggccac agcggctccc acagtcaccg ccaccttcct ggcggggatg 240

ggtggggcgt ctgagtttgg ttcccagcaa atccctctga gccgcccttg cgggctcgcc 300

tcaggagcag gggagcaaga ggtgggagga ggaggtctaa gtcccaggcc caattaagag 360

atcaggtagt gtagggtttg ggagctttta aggtgaagag gcccgggctg atcccacagg 420

ccagtataaa gcgccgtgac cctcaggtga tgcgccaggg ccggctgccg tcggggacag 480

ggctttccat agcc 494

<210> 2

<211> 494

<212> DNA

<213> 智人

<400> 2

ttatttagta gaaacggggt ttcaccatgt tagtcaggct ggtcgggaac tcctgacctc 60

aggagatcta cccgccttgg cctcccaaag tgctgggatt acaggcgtgt gccactgtgc 120

ccagccactt ttttttagac agagtcttgg tctgttgccc aggctagagt tcagtggcgc 180

catctcagct cactgcaacc tccgcctccc agattcaagc gattctcctg cctcgacctc 240

ccagtagctg ggattacagg tttccagcaa atccctctga gccgcccccg ggggctcgcc 300

tcaggagcaa ggaagcaagg ggtgggagga ggaggtctaa gtcccaggcc caattaagag 360

atcagatggt gtaggatttg ggagctttta aggtgaagag gcccgggctg atcccactgg 420

ccggtataaa gcaccgtgac cctcaggtga cgcaccaggg ccggctgccg tcggggacag 480

ggctttccat agcc 494

<210> 3

<211> 568

<212> DNA

<213> 智人

<400> 3

ctaggcattg tcaagttgcc taagtcctgt tccatcaagg ctgtttactg atgtgcttcc 60

agggcactcc ccactcccag ccctttcctg cagcccaggg ctggttccta gcctctcagc 120

agacttaaga tgggcacctt ccacaaaggg gcagatgagt tgaggaaaac ttaactgata 180

cagttgtgcc agaagccaaa ataagaggcg tgccctttct atagccccat taaaagaaca 240

aaaaagtgga agcatcttca gtgaatatgg gtcagcacct cccagacctc agggagtcca 300

cttctgttca tcccagcacc cagcattgca tatccagatt atttgagccc aatctcttat 360

cctctgaaga acacaatcgg ctttggggcc acaaaaggtt taggtagtgg tttagggatt 420

tctaatccca aactttgtcc ttgggaggtt taggattagt attgatcatt cacagagccc 480

aagtgttttt agaggagggg ttttgtgggg tgggaggatc acctataaga ggactcagag 540

gggggtgtgg ggcatccatg agaaaaat 568

<210> 4

<211> 1555

<212> DNA

<213> 智人

<400> 4

ccagggtgag attatgaggc tgagctgaga atatcaagac tgtaccgagt agggggcctt 60

ggcaagtgtg gagagcccgg cagctggggc agagggcgga gtacggtgtg cgtttacgga 120

cctcttcaaa cgaggtagga aggtcagaag tcaaaaaggg aacaaatgat gtttaaccac 180

acaaaaatga aaatccaatg gttggatatc cattccaaat acacaaaggc aacggataag 240

tgatccgggc caggcacaga aggccatgca cccgtaggat tgcactcaga gctcccaaat 300

gcataggaat agaagggtgg gtgcaggagg ctgaggggtg gggaaagggc atgggtgttt 360

catgaggaca gagcttccgt ttcatgcaat gaaaagagtt tggagacgga tggtggtgac 420

tggactatac acttacacac ggtagcgatg gtacactttg tattatgtat attttaccac 480

gatcttttta aagtgtcaaa ggcaaatggc caaatggttc cttgtcctat agctgtagca 540

gccatcggct gttagtgaca aagcccctga gtcaagatga cagcagcccc cataactcct 600

aatcggctct cccgcgtgga gtcatttagg agtagtcgca ttagagacaa gtccaacatc 660

taatcttcca ccctggccag ggccccagct ggcagcgagg gtgggagact ccgggcagag 720

cagagggcgc tgacattggg gcccggcctg gcttgggtcc ctctggcctt tccccagggg 780

ccctctttcc ttggggcttt cttgggccgc cactgctccc gctcctctcc ccccatccca 840

ccccctcacc ccctcgttct tcatatcctt ctctagtgct ccctccactt tcatccaccc 900

ttctgcaaga gtgtgggacc acaaatgagt tttcacctgg cctggggaca cacgtgcccc 960

cacaggtgct gagtgacttt ctaggacagt aatctgcttt aggctaaaat gggacttgat 1020

cttctgttag ccctaatcat caattagcag agccggtgaa ggtgcagaac ctaccgcctt 1080

tccaggcctc ctcccacctc tgccacctcc actctccttc ctgggatgtg ggggctggca 1140

cacgtgtggc ccagggcatt ggtgggattg cactgagctg ggtcattagc gtaatcctgg 1200

acaagggcag acagggcgag cggagggcca gctccggggc tcaggcaagg ctgggggctt 1260

cccccagaca ccccactcct cctctgctgg acccccactt catagggcac ttcgtgttct 1320

caaagggctt ccaaatagca tggtggcctt ggatgcccag ggaagcctca gagttgctta 1380

tctccctcta gacagaaggg gaatctcggt caagagggag aggtcgccct gttcaaggcc 1440

acccagccag ctcatggcgg taatgggaca aggctggcca gccatcccac cctcagaagg 1500

gacccggtgg ggcaggtgat ctcagaggag gctcacttct gggtctcaca ttctt 1555

<210> 5

<211> 189

<212> DNA

<213> 人工序列

<220>

<223> 经修饰的SV40 内含子

<400> 5

gatccggtac tcgaggaact gaaaaaccag aaagttaact ggtaagttta gtctttttgt 60

cttttatttc aggtcccgga tccggtggtg gtgcaaatca aagaactgct cctcagtgga 120

tgttgccttt acttctaggc ctgtacggaa gtgttacttc tgctctaaaa gctgcggaat 180

tgtacccgc 189

<210> 6

<211> 1114

<212> DNA

<213> 智人

<400> 6

atgagaaaaa tgtcggagga agagttttat ctgttcaaaa atatctcttc agtggggccg 60

tgggatgggc ctcagtacca cattgcccct gtctgggcct tctacctcca ggcagctttc 120

atgggcactg tcttccttat agggttccca ctcaatgcca tggtgctggt ggccacactg 180

cgctacaaaa agttgcggca gcccctcaac tacattctgg tcaacgtgtc cttcggaggc 240

ttcctcctct gcatcttctc tgtcttccct gtcttcgtcg ccagctgtaa cggatacttc 300

gtcttcggtc gccatgtttg tgctttggag ggcttcctgg gcactgtagc aggtctggtt 360

acaggatggt cactggcctt cctggccttt gagcgctaca ttgtcatctg taagcccttc 420

ggcaacttcc gcttcagctc caagcatgca ctgacggtgg tcctggctac ctggaccatt 480

ggtattggcg tctccatccc acccttcttt ggctggagcc ggttcatccc tgagggcctg 540

cagtgttcct gtggccctga ctggtacacc gtgggcacca aataccgcag cgagtcctat 600

acgtggttcc tcttcatctt ctgcttcatt gtgcctctct ccctcatctg cttctcctac 660

actcagctgc tgagggccct gaaagctgtt gcagctcagc agcaggagtc agctacgacc 720

cagaaggctg aacgggaggt gagccgcatg gtggttgtga tggtaggatc cttctgtgtc 780

tgctacgtgc cctacgcggc cttcgccatg tacatggtca acaaccgtaa ccatgggctg 840

gacttacggc ttgtcaccat tccttcattc ttctccaaga gtgcttgcat ctacaatccc 900

atcatctact gcttcatgaa taagcagttc caagcttgca tcatgaagat ggtgtgtggg 960

aaggccatga cagatgaatc cgacacatgc agctcccaga aaacagaagt ttctactgtc 1020

tcgtctaccc aagttggccc caactgagga cccaatattg gcctgtttgc aacagctaga 1080

attaaatttt acttttaaaa aaaaaaaaaa aaaa 1114

<210> 7

<211> 348

<212> PRT

<213> 智人

<400> 7

Met Arg Lys Met Ser Glu Glu Glu Phe Tyr Leu Phe Lys Asn Ile Ser

1 5 10 15

Ser Val Gly Pro Trp Asp Gly Pro Gln Tyr His Ile Ala Pro Val Trp

20 25 30

Ala Phe Tyr Leu Gln Ala Ala Phe Met Gly Thr Val Phe Leu Ile Gly

35 40 45

Phe Pro Leu Asn Ala Met Val Leu Val Ala Thr Leu Arg Tyr Lys Lys

50 55 60

Leu Arg Gln Pro Leu Asn Tyr Ile Leu Val Asn Val Ser Phe Gly Gly

65 70 75 80

Phe Leu Leu Cys Ile Phe Ser Val Phe Pro Val Phe Val Ala Ser Cys

85 90 95

Asn Gly Tyr Phe Val Phe Gly Arg His Val Cys Ala Leu Glu Gly Phe

100 105 110

Leu Gly Thr Val Ala Gly Leu Val Thr Gly Trp Ser Leu Ala Phe Leu

115 120 125

Ala Phe Glu Arg Tyr Ile Val Ile Cys Lys Pro Phe Gly Asn Phe Arg

130 135 140

Phe Ser Ser Lys His Ala Leu Thr Val Val Leu Ala Thr Trp Thr Ile

145 150 155 160

Gly Ile Gly Val Ser Ile Pro Pro Phe Phe Gly Trp Ser Arg Phe Ile

165 170 175

Pro Glu Gly Leu Gln Cys Ser Cys Gly Pro Asp Trp Tyr Thr Val Gly

180 185 190

Thr Lys Tyr Arg Ser Glu Ser Tyr Thr Trp Phe Leu Phe Ile Phe Cys

195 200 205

Phe Ile Val Pro Leu Ser Leu Ile Cys Phe Ser Tyr Thr Gln Leu Leu

210 215 220

Arg Ala Leu Lys Ala Val Ala Ala Gln Gln Gln Glu Ser Ala Thr Thr

225 230 235 240

Gln Lys Ala Glu Arg Glu Val Ser Arg Met Val Val Val Met Val Gly

245 250 255

Ser Phe Cys Val Cys Tyr Val Pro Tyr Ala Ala Phe Ala Met Tyr Met

260 265 270

Val Asn Asn Arg Asn His Gly Leu Asp Leu Arg Leu Val Thr Ile Pro

275 280 285

Ser Phe Phe Ser Lys Ser Ala Cys Ile Tyr Asn Pro Ile Ile Tyr Cys

290 295 300

Phe Met Asn Lys Gln Phe Gln Ala Cys Ile Met Lys Met Val Cys Gly

305 310 315 320

Lys Ala Met Thr Asp Glu Ser Asp Thr Cys Ser Ser Gln Lys Thr Glu

325 330 335

Val Ser Thr Val Ser Ser Thr Gln Val Gly Pro Asn

340 345

<210> 8

<211> 1998

<212> DNA

<213> 智人

<400> 8

cccactggcc ggtataaagc accgtgaccc tcaggtgacg caccagggcc ggctgccgtc 60

ggggacaggg ctttccatag ccatggccca gcagtggagc ctccaaaggc tcgcaggccg 120

ccatccgcag gacagctatg aggacagcac ccagtccagc atcttcacct acaccaacag 180

caactccacc agaggcccct tcgaaggccc gaattaccac atcgctccca gatgggtgta 240

ccacctcacc agtgtctgga tgatctttgt ggtcattgca tccgtcttca caaatgggct 300

tgtgctggcg gccaccatga agttcaagaa gctgcgccac ccgctgaact ggatcctggt 360

gaacctggcg gtcgctgacc tggcagagac cgtcatcgcc agcactatca gcgttgtgaa 420

ccaggtctat ggctacttcg tgctgggcca ccctatgtgt gtcctggagg gctacaccgt 480

ctccctgtgt gggatcacag gtctctggtc tctggccatc atttcctggg agagatggat 540

ggtggtctgc aagccctttg gcaatgtgag atttgatgcc aagctggcca tcgtgggcat 600

tgccttctcc tggatctggg ctgctgtgtg gacagccccg cccatctttg gttggagcag 660

gtactggccc cacggcctga agacttcatg cggcccagac gtgttcagcg gcagctcgta 720

ccccggggtg cagtcttaca tgattgtcct catggtcacc tgctgcatca ccccactcag 780

catcatcgtg ctctgctacc tccaagtgtg gctggccatc cgagcggtgg caaagcagca 840

gaaagagtct gaatccaccc agaaggcaga gaaggaagtg acgcgcatgg tggtggtgat 900

ggtcctggca ttctgcttct gctggggacc atacgccttc ttcgcatgct ttgctgctgc 960

caaccctggc taccccttcc accctttgat ggctgccctg ccggccttct ttgccaaaag 1020

tgccactatc tacaaccccg ttatctatgt ctttatgaac cggcagtttc gaaactgcat 1080

cttgcagctt ttcgggaaga aggttgacga tggctctgaa ctctccagcg cctccaaaac 1140

ggaggtctca tctgtgtcct cggtatcgcc tgcatgaggt ctgcctccta cccatcccgc 1200

ccaccggggc tttggccacc tctcctttcc ccctccttct ccatccctgt aaaataaatg 1260

taatttatct ttgccaaaac caacaaagtc acagaggctt tcactgcagt gtgggaccac 1320

ctgagcctct gcgtgtgcag gcactgggtc tcgagagggt gcaaggggga taaagaggag 1380

agagcgcttc atagacttta agttttcccg agcctcatgt ctaccgatgg cgtgaaagga 1440

tcctggcaaa acagaagtgt gaggcaggtg ggcgtctata tccatttcac caggctggtg 1500

gttacataat cggcaagcaa gagctgtgga ggggcttgct ggatgccctc agcacccagg 1560

aggagggagg gagctagcaa gctaaggcag gtggccctcc tggcccctta aggtccatct 1620

gctggaggcc cagagtcctt ggagtacagt ctacacctgg aggggaccca ttcctgccag 1680

tctgtggcag ggatggcgcg ccacctctgc caggccagga ccccaagccc gatcagcatc 1740

agcatggtgc aggtgcacag gcgtgagctg atcagtgacg aggggcaggc acacaaggtg 1800

gagacaaaga ccaagaggac ggttgccagt gagaggcgcg gactcaggaa cttgaacaac 1860

atctgcgggg gacggctttg gaggtgctcc gctgcctcca gttgggtgac ttgctgtagc 1920

atctccagct tggatattcg gctcttgaag gtctccgtga tctcctgcag gagacgaaaa 1980

tgcacgcacc agaagtca 1998

<210> 9

<211> 364

<212> PRT

<213> 智人

<400> 9

Met Ala Gln Gln Trp Ser Leu Gln Arg Leu Ala Gly Arg His Pro Gln

1 5 10 15

Asp Ser Tyr Glu Asp Ser Thr Gln Ser Ser Ile Phe Thr Tyr Thr Asn

20 25 30

Ser Asn Ser Thr Arg Gly Pro Phe Glu Gly Pro Asn Tyr His Ile Ala

35 40 45

Pro Arg Trp Val Tyr His Leu Thr Ser Val Trp Met Ile Phe Val Val

50 55 60

Ile Ala Ser Val Phe Thr Asn Gly Leu Val Leu Ala Ala Thr Met Lys

65 70 75 80

Phe Lys Lys Leu Arg His Pro Leu Asn Trp Ile Leu Val Asn Leu Ala

85 90 95

Val Ala Asp Leu Ala Glu Thr Val Ile Ala Ser Thr Ile Ser Val Val

100 105 110

Asn Gln Val Tyr Gly Tyr Phe Val Leu Gly His Pro Met Cys Val Leu

115 120 125

Glu Gly Tyr Thr Val Ser Leu Cys Gly Ile Thr Gly Leu Trp Ser Leu

130 135 140

Ala Ile Ile Ser Trp Glu Arg Trp Met Val Val Cys Lys Pro Phe Gly

145 150 155 160

Asn Val Arg Phe Asp Ala Lys Leu Ala Ile Val Gly Ile Ala Phe Ser

165 170 175

Trp Ile Trp Ala Ala Val Trp Thr Ala Pro Pro Ile Phe Gly Trp Ser

180 185 190

Arg Tyr Trp Pro His Gly Leu Lys Thr Ser Cys Gly Pro Asp Val Phe

195 200 205

Ser Gly Ser Ser Tyr Pro Gly Val Gln Ser Tyr Met Ile Val Leu Met

210 215 220

Val Thr Cys Cys Ile Thr Pro Leu Ser Ile Ile Val Leu Cys Tyr Leu

225 230 235 240

Gln Val Trp Leu Ala Ile Arg Ala Val Ala Lys Gln Gln Lys Glu Ser

245 250 255

Glu Ser Thr Gln Lys Ala Glu Lys Glu Val Thr Arg Met Val Val Val

260 265 270

Met Val Leu Ala Phe Cys Phe Cys Trp Gly Pro Tyr Ala Phe Phe Ala

275 280 285

Cys Phe Ala Ala Ala Asn Pro Gly Tyr Pro Phe His Pro Leu Met Ala

290 295 300

Ala Leu Pro Ala Phe Phe Ala Lys Ser Ala Thr Ile Tyr Asn Pro Val

305 310 315 320

Ile Tyr Val Phe Met Asn Arg Gln Phe Arg Asn Cys Ile Leu Gln Leu

325 330 335

Phe Gly Lys Lys Val Asp Asp Gly Ser Glu Leu Ser Ser Ala Ser Lys

340 345 350

Thr Glu Val Ser Ser Val Ser Ser Val Ser Pro Ala

355 360

<210> 10

<211> 1234

<212> DNA

<213> 智人

<400> 10

cggctgccgt cggggacagg gctttccata gccatggccc agcagtggag cctccaaagg 60

ctcgcaggcc gccatccgca ggacagctat gaggacagca cccagtccag catcttcacc 120

tacaccaaca gcaactccac cagaggcccc ttcgaaggcc cgaattacca catcgctccc 180

agatgggtgt accacctcac cagtgtctgg atgatctttg tggtcactgc atccgtcttc 240

acaaatgggc ttgtgctggc ggccaccatg aagttcaaga agctgcgcca cccgctgaac 300

tggatcctgg tgaacctggc ggtcgctgac ctagcagaga ccgtcatcgc cagcactatc 360

agcattgtga accaggtctc tggctacttc gtgctgggcc accctatgtg tgtcctggag 420

ggctacaccg tctccctgtg tgggatcaca ggtctctggt ctctggccat catttcctgg 480

gagaggtggc tggtggtgtg caagcccttt ggcaatgtga gatttgatgc caagctggcc 540

atcgtgggca ttgccttctc ctggatctgg tctgctgtgt ggacagcccc gcccatcttt 600

ggttggagca ggtactggcc ccacggcctg aagacttcat gcggcccaga cgtgttcagc 660

ggcagctcgt accccggggt gcagtcttac atgattgtcc tcatggtcac ctgctgcatc 720

atcccactcg ctatcatcat gctctgctac ctccaagtgt ggctggccat ccgagcggtg 780

gcaaagcagc agaaagagtc tgaatccacc cagaaggcag agaaggaagt gacgcgcatg 840

gtggtggtga tgatctttgc gtactgcgtc tgctggggac cctacacctt cttcgcatgc 900

tttgctgctg ccaaccctgg ttacgccttc caccctttga tggctgccct gccggcctac 960

tttgccaaaa gtgccactat ctacaacccc gttatctatg tctttatgaa ccggcagttt 1020

cgaaactgca tcttgcagct tttcgggaag aaggttgacg atggctctga actctccagc 1080

gcctccaaaa cggaggtctc atctgtgtcc tcggtatcgc ctgcatgagg tctgcctcct 1140

acccatcccg cccaccgggg ctttggccac ctctcctttc cccctccttc tccatccctg 1200

taaaataaat gtaatttatc tttgccaaaa ccaa 1234

<210> 11

<211> 364

<212> PRT

<213> 智人

<400> 11

Met Ala Gln Gln Trp Ser Leu Gln Arg Leu Ala Gly Arg His Pro Gln

1 5 10 15

Asp Ser Tyr Glu Asp Ser Thr Gln Ser Ser Ile Phe Thr Tyr Thr Asn

20 25 30

Ser Asn Ser Thr Arg Gly Pro Phe Glu Gly Pro Asn Tyr His Ile Ala

35 40 45

Pro Arg Trp Val Tyr His Leu Thr Ser Val Trp Met Ile Phe Val Val

50 55 60

Thr Ala Ser Val Phe Thr Asn Gly Leu Val Leu Ala Ala Thr Met Lys

65 70 75 80

Phe Lys Lys Leu Arg His Pro Leu Asn Trp Ile Leu Val Asn Leu Ala

85 90 95

Val Ala Asp Leu Ala Glu Thr Val Ile Ala Ser Thr Ile Ser Ile Val

100 105 110

Asn Gln Val Ser Gly Tyr Phe Val Leu Gly His Pro Met Cys Val Leu

115 120 125

Glu Gly Tyr Thr Val Ser Leu Cys Gly Ile Thr Gly Leu Trp Ser Leu

130 135 140

Ala Ile Ile Ser Trp Glu Arg Trp Leu Val Val Cys Lys Pro Phe Gly

145 150 155 160

Asn Val Arg Phe Asp Ala Lys Leu Ala Ile Val Gly Ile Ala Phe Ser

165 170 175

Trp Ile Trp Ser Ala Val Trp Thr Ala Pro Pro Ile Phe Gly Trp Ser

180 185 190

Arg Tyr Trp Pro His Gly Leu Lys Thr Ser Cys Gly Pro Asp Val Phe

195 200 205

Ser Gly Ser Ser Tyr Pro Gly Val Gln Ser Tyr Met Ile Val Leu Met

210 215 220

Val Thr Cys Cys Ile Ile Pro Leu Ala Ile Ile Met Leu Cys Tyr Leu

225 230 235 240

Gln Val Trp Leu Ala Ile Arg Ala Val Ala Lys Gln Gln Lys Glu Ser

245 250 255

Glu Ser Thr Gln Lys Ala Glu Lys Glu Val Thr Arg Met Val Val Val

260 265 270

Met Ile Phe Ala Tyr Cys Val Cys Trp Gly Pro Tyr Thr Phe Phe Ala

275 280 285

Cys Phe Ala Ala Ala Asn Pro Gly Tyr Ala Phe His Pro Leu Met Ala

290 295 300

Ala Leu Pro Ala Tyr Phe Ala Lys Ser Ala Thr Ile Tyr Asn Pro Val

305 310 315 320

Ile Tyr Val Phe Met Asn Arg Gln Phe Arg Asn Cys Ile Leu Gln Leu

325 330 335

Phe Gly Lys Lys Val Asp Asp Gly Ser Glu Leu Ser Ser Ala Ser Lys

340 345 350

Thr Glu Val Ser Ser Val Ser Ser Val Ser Pro Ala

355 360

<210> 12

<211> 7326

<212> DNA

<213> 智人

<400> 12

aggacacagc gtccggagcc agaggcgctc ttaacggcgt ttatgtcctt tgctgtctga 60

ggggcctcag ctctgaccaa tctggtcttc gtgtggtcat tagcatgggc ttcgtgagac 120

agatacagct tttgctctgg aagaactgga ccctgcggaa aaggcaaaag attcgctttg 180

tggtggaact cgtgtggcct ttatctttat ttctggtctt gatctggtta aggaatgcca 240

acccgctcta cagccatcat gaatgccatt tccccaacaa ggcgatgccc tcagcaggaa 300

tgctgccgtg gctccagggg atcttctgca atgtgaacaa tccctgtttt caaagcccca 360

ccccaggaga atctcctgga attgtgtcaa actataacaa ctccatcttg gcaagggtat 420

atcgagattt tcaagaactc ctcatgaatg caccagagag ccagcacctt ggccgtattt 480

ggacagagct acacatcttg tcccaattca tggacaccct ccggactcac ccggagagaa 540

ttgcaggaag aggaatacga ataagggata tcttgaaaga tgaagaaaca ctgacactat 600

ttctcattaa aaacatcggc ctgtctgact cagtggtcta ccttctgatc aactctcaag 660

tccgtccaga gcagttcgct catggagtcc cggacctggc gctgaaggac atcgcctgca 720

gcgaggccct cctggagcgc ttcatcatct tcagccagag acgcggggca aagacggtgc 780

gctatgccct gtgctccctc tcccagggca ccctacagtg gatagaagac actctgtatg 840

ccaacgtgga cttcttcaag ctcttccgtg tgcttcccac actcctagac agccgttctc 900

aaggtatcaa tctgagatct tggggaggaa tattatctga tatgtcacca agaattcaag 960

agtttatcca tcggccgagt atgcaggact tgctgtgggt gaccaggccc ctcatgcaga 1020

atggtggtcc agagaccttt acaaagctga tgggcatcct gtctgacctc ctgtgtggct 1080

accccgaggg aggtggctct cgggtgctct ccttcaactg gtatgaagac aataactata 1140

aggcctttct ggggattgac tccacaagga aggatcctat ctattcttat gacagaagaa 1200

caacatcctt ttgtaatgca ttgatccaga gcctggagtc aaatccttta accaaaatcg 1260

cttggagggc ggcaaagcct ttgctgatgg gaaaaatcct gtacactcct gattcacctg 1320

cagcacgaag gatactgaag aatgccaact caacttttga agaactggaa cacgttagga 1380

agttggtcaa agcctgggaa gaagtagggc cccagatctg gtacttcttt gacaacagca 1440

cacagatgaa catgatcaga gataccctgg ggaacccaac agtaaaagac tttttgaata 1500

ggcagcttgg tgaagaaggt attactgctg aagccatcct aaacttcctc tacaagggcc 1560

ctcgggaaag ccaggctgac gacatggcca acttcgactg gagggacata tttaacatca 1620

ctgatcgcac cctccgcctg gtcaatcaat acctggagtg cttggtcctg gataagtttg 1680

aaagctacaa tgatgaaact cagctcaccc aacgtgccct ctctctactg gaggaaaaca 1740

tgttctgggc cggagtggta ttccctgaca tgtatccctg gaccagctct ctaccacccc 1800

acgtgaagta taagatccga atggacatag acgtggtgga gaaaaccaat aagattaaag 1860

acaggtattg ggattctggt cccagagctg atcccgtgga agatttccgg tacatctggg 1920

gcgggtttgc ctatctgcag gacatggttg aacaggggat cacaaggagc caggtgcagg 1980

cggaggctcc agttggaatc tacctccagc agatgcccta cccctgcttc gtggacgatt 2040

ctttcatgat catcctgaac cgctgtttcc ctatcttcat ggtgctggca tggatctact 2100

ctgtctccat gactgtgaag agcatcgtct tggagaagga gttgcgactg aaggagacct 2160

tgaaaaatca gggtgtctcc aatgcagtga tttggtgtac ctggttcctg gacagcttct 2220

ccatcatgtc gatgagcatc ttcctcctga cgatattcat catgcatgga agaatcctac 2280

attacagcga cccattcatc ctcttcctgt tcttgttggc tttctccact gccaccatca 2340

tgctgtgctt tctgctcagc accttcttct ccaaggccag tctggcagca gcctgtagtg 2400

gtgtcatcta tttcaccctc tacctgccac acatcctgtg cttcgcctgg caggaccgca 2460

tgaccgctga gctgaagaag gctgtgagct tactgtctcc ggtggcattt ggatttggca 2520

ctgagtacct ggttcgcttt gaagagcaag gcctggggct gcagtggagc aacatcggga 2580

acagtcccac ggaaggggac gaattcagct tcctgctgtc catgcagatg atgctccttg 2640

atgctgctgt ctatggctta ctcgcttggt accttgatca ggtgtttcca ggagactatg 2700

gaaccccact tccttggtac tttcttctac aagagtcgta ttggcttggc ggtgaagggt 2760

gttcaaccag agaagaaaga gccctggaaa agaccgagcc cctaacagag gaaacggagg 2820

atccagagca cccagaagga atacacgact ccttctttga acgtgagcat ccagggtggg 2880

ttcctggggt atgcgtgaag aatctggtaa agatttttga gccctgtggc cggccagctg 2940

tggaccgtct gaacatcacc ttctacgaga accagatcac cgcattcctg ggccacaatg 3000

gagctgggaa aaccaccacc ttgtccatcc tgacgggtct gttgccacca acctctggga 3060

ctgtgctcgt tgggggaagg gacattgaaa ccagcctgga tgcagtccgg cagagccttg 3120

gcatgtgtcc acagcacaac atcctgttcc accacctcac ggtggctgag cacatgctgt 3180

tctatgccca gctgaaagga aagtcccagg aggaggccca gctggagatg gaagccatgt 3240

tggaggacac aggcctccac cacaagcgga atgaagaggc tcaggaccta tcaggtggca 3300

tgcagagaaa gctgtcggtt gccattgcct ttgtgggaga tgccaaggtg gtgattctgg 3360

acgaacccac ctctggggtg gacccttact cgagacgctc aatctgggat ctgctcctga 3420

agtatcgctc aggcagaacc atcatcatgt ccactcacca catggacgag gccgacctcc 3480

ttggggaccg cattgccatc attgcccagg gaaggctcta ctgctcaggc accccactct 3540

tcctgaagaa ctgctttggc acaggcttgt acttaacctt ggtgcgcaag atgaaaaaca 3600

tccagagcca aaggaaaggc agtgagggga cctgcagctg ctcgtctaag ggtttctcca 3660

ccacgtgtcc agcccacgtc gatgacctaa ctccagaaca agtcctggat ggggatgtaa 3720

atgagctgat ggatgtagtt ctccaccatg ttccagaggc aaagctggtg gagtgcattg 3780

gtcaagaact tatcttcctt cttccaaata agaacttcaa gcacagagca tatgccagcc 3840

ttttcagaga gctggaggag acgctggctg accttggtct cagcagtttt ggaatttctg 3900

acactcccct ggaagagatt tttctgaagg tcacggagga ttctgattca ggacctctgt 3960

ttgcgggtgg cgctcagcag aaaagagaaa acgtcaaccc ccgacacccc tgcttgggtc 4020

ccagagagaa ggctggacag acaccccagg actccaatgt ctgctcccca ggggcgccgg 4080

ctgctcaccc agagggccag cctcccccag agccagagtg cccaggcccg cagctcaaca 4140

cggggacaca gctggtcctc cagcatgtgc aggcgctgct ggtcaagaga ttccaacaca 4200

ccatccgcag ccacaaggac ttcctggcgc agatcgtgct cccggctacc tttgtgtttt 4260

tggctctgat gctttctatt gttatccctc cttttggcga ataccccgct ttgacccttc 4320

acccctggat atatgggcag cagtacacct tcttcagcat ggatgaacca ggcagtgagc 4380

agttcacggt acttgcagac gtcctcctga ataagccagg ctttggcaac cgctgcctga 4440

aggaagggtg gcttccggag tacccctgtg gcaactcaac accctggaag actccttctg 4500

tgtccccaaa catcacccag ctgttccaga agcagaaatg gacacaggtc aacccttcac 4560

catcctgcag gtgcagcacc agggagaagc tcaccatgct gccagagtgc cccgagggtg 4620

ccgggggcct cccgcccccc cagagaacac agcgcagcac ggaaattcta caagacctga 4680

cggacaggaa catctccgac ttcttggtaa aaacgtatcc tgctcttata agaagcagct 4740

taaagagcaa attctgggtc aatgaacaga ggtatggagg aatttccatt ggaggaaagc 4800

tcccagtcgt ccccatcacg ggggaagcac ttgttgggtt tttaagcgac cttggccgga 4860

tcatgaatgt gagcgggggc cctatcacta gagaggcctc taaagaaata cctgatttcc 4920

ttaaacatct agaaactgaa gacaacatta aggtgtggtt taataacaaa ggctggcatg 4980

ccctggtcag ctttctcaat gtggcccaca acgccatctt acgggccagc ctgcctaagg 5040

acaggagccc cgaggagtat ggaatcaccg tcattagcca acccctgaac ctgaccaagg 5100

agcagctctc agagattaca gtgctgacca cttcagtgga tgctgtggtt gccatctgcg 5160

tgattttctc catgtccttc gtcccagcca gctttgtcct ttatttgatc caggagcggg 5220

tgaacaaatc caagcacctc cagtttatca gtggagtgag ccccaccacc tactgggtga 5280

ccaacttcct ctgggacatc atgaattatt ccgtgagtgc tgggctggtg gtgggcatct 5340

tcatcgggtt tcagaagaaa gcctacactt ctccagaaaa ccttcctgcc cttgtggcac 5400

tgctcctgct gtatggatgg gcggtcattc ccatgatgta cccagcatcc ttcctgtttg 5460

atgtccccag cacagcctat gtggctttat cttgtgctaa tctgttcatc ggcatcaaca 5520

gcagtgctat taccttcatc ttggaattat ttgagaataa ccggacgctg ctcaggttca 5580

acgccgtgct gaggaagctg ctcattgtct tcccccactt ctgcctgggc cggggcctca 5640

ttgaccttgc actgagccag gctgtgacag atgtctatgc ccggtttggt gaggagcact 5700

ctgcaaatcc gttccactgg gacctgattg ggaagaacct gtttgccatg gtggtggaag 5760

gggtggtgta cttcctcctg accctgctgg tccagcgcca cttcttcctc tcccaatgga 5820

ttgccgagcc cactaaggag cccattgttg atgaagatga tgatgtggct gaagaaagac 5880

aaagaattat tactggtgga aataaaactg acatcttaag gctacatgaa ctaaccaaga 5940

tttatccagg cacctccagc ccagcagtgg acaggctgtg tgtcggagtt cgccctggag 6000

agtgctttgg cctcctggga gtgaatggtg ccggcaaaac aaccacattc aagatgctca 6060

ctggggacac cacagtgacc tcaggggatg ccaccgtagc aggcaagagt attttaacca 6120

atatttctga agtccatcaa aatatgggct actgtcctca gtttgatgca attgatgagc 6180

tgctcacagg acgagaacat ctttaccttt atgcccggct tcgaggtgta ccagcagaag 6240

aaatcgaaaa ggttgcaaac tggagtatta agagcctggg cctgactgtc tacgccgact 6300

gcctggctgg cacgtacagt gggggcaaca agcggaaact ctccacagcc atcgcactca 6360

ttggctgccc accgctggtg ctgctggatg agcccaccac agggatggac ccccaggcac 6420

gccgcatgct gtggaacgtc atcgtgagca tcatcagaga agggagggct gtggtcctca 6480

catcccacag catggaagaa tgtgaggcac tgtgtacccg gctggccatc atggtaaagg 6540

gcgcctttcg atgtatgggc accattcagc atctcaagtc caaatttgga gatggctata 6600

tcgtcacaat gaagatcaaa tccccgaagg acgacctgct tcctgacctg aaccctgtgg 6660

agcagttctt ccaggggaac ttcccaggca gtgtgcagag ggagaggcac tacaacatgc 6720

tccagttcca ggtctcctcc tcctccctgg cgaggatctt ccagctcctc ctctcccaca 6780

aggacagcct gctcatcgag gagtactcag tcacacagac cacactggac caggtgtttg 6840

taaattttgc taaacagcag actgaaagtc atgacctccc tctgcaccct cgagctgctg 6900

gagccagtcg acaagcccag gactgatctt tcacaccgct cgttcctgca gccagaaagg 6960

aactctgggc agctggaggc gcaggagcct gtgcccatat ggtcatccaa atggactggc 7020

cagcgtaaat gaccccactg cagcagaaaa caaacacacg aggagcatgc agcgaattca 7080

gaaagaggtc tttcagaagg aaaccgaaac tgacttgctc acctggaaca cctgatggtg 7140

aaaccaaaca aatacaaaat ccttctccag accccagaac tagaaacccc gggccatccc 7200

actagcagct ttggcctcca tattgctctc atttcaagca gatctgcttt tctgcatgtt 7260

tgtctgtgtg tctgcgttgt gtgtgatttt catggaaaaa taaaatgcaa atgcactcat 7320

cacaaa 7326

<210> 13

<211> 2273

<212> PRT

<213> 智人

<400> 13

Met Gly Phe Val Arg Gln Ile Gln Leu Leu Leu Trp Lys Asn Trp Thr

1 5 10 15

Leu Arg Lys Arg Gln Lys Ile Arg Phe Val Val Glu Leu Val Trp Pro

20 25 30

Leu Ser Leu Phe Leu Val Leu Ile Trp Leu Arg Asn Ala Asn Pro Leu

35 40 45

Tyr Ser His His Glu Cys His Phe Pro Asn Lys Ala Met Pro Ser Ala

50 55 60

Gly Met Leu Pro Trp Leu Gln Gly Ile Phe Cys Asn Val Asn Asn Pro

65 70 75 80

Cys Phe Gln Ser Pro Thr Pro Gly Glu Ser Pro Gly Ile Val Ser Asn

85 90 95

Tyr Asn Asn Ser Ile Leu Ala Arg Val Tyr Arg Asp Phe Gln Glu Leu

100 105 110

Leu Met Asn Ala Pro Glu Ser Gln His Leu Gly Arg Ile Trp Thr Glu

115 120 125

Leu His Ile Leu Ser Gln Phe Met Asp Thr Leu Arg Thr His Pro Glu

130 135 140

Arg Ile Ala Gly Arg Gly Ile Arg Ile Arg Asp Ile Leu Lys Asp Glu

145 150 155 160

Glu Thr Leu Thr Leu Phe Leu Ile Lys Asn Ile Gly Leu Ser Asp Ser

165 170 175

Val Val Tyr Leu Leu Ile Asn Ser Gln Val Arg Pro Glu Gln Phe Ala

180 185 190

His Gly Val Pro Asp Leu Ala Leu Lys Asp Ile Ala Cys Ser Glu Ala

195 200 205

Leu Leu Glu Arg Phe Ile Ile Phe Ser Gln Arg Arg Gly Ala Lys Thr

210 215 220

Val Arg Tyr Ala Leu Cys Ser Leu Ser Gln Gly Thr Leu Gln Trp Ile

225 230 235 240

Glu Asp Thr Leu Tyr Ala Asn Val Asp Phe Phe Lys Leu Phe Arg Val

245 250 255

Leu Pro Thr Leu Leu Asp Ser Arg Ser Gln Gly Ile Asn Leu Arg Ser

260 265 270

Trp Gly Gly Ile Leu Ser Asp Met Ser Pro Arg Ile Gln Glu Phe Ile

275 280 285

His Arg Pro Ser Met Gln Asp Leu Leu Trp Val Thr Arg Pro Leu Met

290 295 300

Gln Asn Gly Gly Pro Glu Thr Phe Thr Lys Leu Met Gly Ile Leu Ser

305 310 315 320

Asp Leu Leu Cys Gly Tyr Pro Glu Gly Gly Gly Ser Arg Val Leu Ser

325 330 335

Phe Asn Trp Tyr Glu Asp Asn Asn Tyr Lys Ala Phe Leu Gly Ile Asp

340 345 350

Ser Thr Arg Lys Asp Pro Ile Tyr Ser Tyr Asp Arg Arg Thr Thr Ser

355 360 365

Phe Cys Asn Ala Leu Ile Gln Ser Leu Glu Ser Asn Pro Leu Thr Lys

370 375 380

Ile Ala Trp Arg Ala Ala Lys Pro Leu Leu Met Gly Lys Ile Leu Tyr

385 390 395 400

Thr Pro Asp Ser Pro Ala Ala Arg Arg Ile Leu Lys Asn Ala Asn Ser

405 410 415

Thr Phe Glu Glu Leu Glu His Val Arg Lys Leu Val Lys Ala Trp Glu

420 425 430

Glu Val Gly Pro Gln Ile Trp Tyr Phe Phe Asp Asn Ser Thr Gln Met

435 440 445

Asn Met Ile Arg Asp Thr Leu Gly Asn Pro Thr Val Lys Asp Phe Leu

450 455 460

Asn Arg Gln Leu Gly Glu Glu Gly Ile Thr Ala Glu Ala Ile Leu Asn

465 470 475 480

Phe Leu Tyr Lys Gly Pro Arg Glu Ser Gln Ala Asp Asp Met Ala Asn

485 490 495

Phe Asp Trp Arg Asp Ile Phe Asn Ile Thr Asp Arg Thr Leu Arg Leu

500 505 510

Val Asn Gln Tyr Leu Glu Cys Leu Val Leu Asp Lys Phe Glu Ser Tyr

515 520 525

Asn Asp Glu Thr Gln Leu Thr Gln Arg Ala Leu Ser Leu Leu Glu Glu

530 535 540

Asn Met Phe Trp Ala Gly Val Val Phe Pro Asp Met Tyr Pro Trp Thr

545 550 555 560

Ser Ser Leu Pro Pro His Val Lys Tyr Lys Ile Arg Met Asp Ile Asp

565 570 575

Val Val Glu Lys Thr Asn Lys Ile Lys Asp Arg Tyr Trp Asp Ser Gly

580 585 590

Pro Arg Ala Asp Pro Val Glu Asp Phe Arg Tyr Ile Trp Gly Gly Phe

595 600 605

Ala Tyr Leu Gln Asp Met Val Glu Gln Gly Ile Thr Arg Ser Gln Val

610 615 620

Gln Ala Glu Ala Pro Val Gly Ile Tyr Leu Gln Gln Met Pro Tyr Pro

625 630 635 640

Cys Phe Val Asp Asp Ser Phe Met Ile Ile Leu Asn Arg Cys Phe Pro

645 650 655

Ile Phe Met Val Leu Ala Trp Ile Tyr Ser Val Ser Met Thr Val Lys

660 665 670

Ser Ile Val Leu Glu Lys Glu Leu Arg Leu Lys Glu Thr Leu Lys Asn

675 680 685

Gln Gly Val Ser Asn Ala Val Ile Trp Cys Thr Trp Phe Leu Asp Ser

690 695 700

Phe Ser Ile Met Ser Met Ser Ile Phe Leu Leu Thr Ile Phe Ile Met

705 710 715 720

His Gly Arg Ile Leu His Tyr Ser Asp Pro Phe Ile Leu Phe Leu Phe

725 730 735

Leu Leu Ala Phe Ser Thr Ala Thr Ile Met Leu Cys Phe Leu Leu Ser

740 745 750

Thr Phe Phe Ser Lys Ala Ser Leu Ala Ala Ala Cys Ser Gly Val Ile

755 760 765

Tyr Phe Thr Leu Tyr Leu Pro His Ile Leu Cys Phe Ala Trp Gln Asp

770 775 780

Arg Met Thr Ala Glu Leu Lys Lys Ala Val Ser Leu Leu Ser Pro Val

785 790 795 800

Ala Phe Gly Phe Gly Thr Glu Tyr Leu Val Arg Phe Glu Glu Gln Gly

805 810 815

Leu Gly Leu Gln Trp Ser Asn Ile Gly Asn Ser Pro Thr Glu Gly Asp

820 825 830

Glu Phe Ser Phe Leu Leu Ser Met Gln Met Met Leu Leu Asp Ala Ala

835 840 845

Val Tyr Gly Leu Leu Ala Trp Tyr Leu Asp Gln Val Phe Pro Gly Asp

850 855 860

Tyr Gly Thr Pro Leu Pro Trp Tyr Phe Leu Leu Gln Glu Ser Tyr Trp

865 870 875 880

Leu Gly Gly Glu Gly Cys Ser Thr Arg Glu Glu Arg Ala Leu Glu Lys

885 890 895

Thr Glu Pro Leu Thr Glu Glu Thr Glu Asp Pro Glu His Pro Glu Gly

900 905 910

Ile His Asp Ser Phe Phe Glu Arg Glu His Pro Gly Trp Val Pro Gly

915 920 925

Val Cys Val Lys Asn Leu Val Lys Ile Phe Glu Pro Cys Gly Arg Pro

930 935 940

Ala Val Asp Arg Leu Asn Ile Thr Phe Tyr Glu Asn Gln Ile Thr Ala

945 950 955 960

Phe Leu Gly His Asn Gly Ala Gly Lys Thr Thr Thr Leu Ser Ile Leu

965 970 975

Thr Gly Leu Leu Pro Pro Thr Ser Gly Thr Val Leu Val Gly Gly Arg

980 985 990

Asp Ile Glu Thr Ser Leu Asp Ala Val Arg Gln Ser Leu Gly Met Cys

995 1000 1005

Pro Gln His Asn Ile Leu Phe His His Leu Thr Val Ala Glu His

1010 1015 1020

Met Leu Phe Tyr Ala Gln Leu Lys Gly Lys Ser Gln Glu Glu Ala

1025 1030 1035

Gln Leu Glu Met Glu Ala Met Leu Glu Asp Thr Gly Leu His His

1040 1045 1050

Lys Arg Asn Glu Glu Ala Gln Asp Leu Ser Gly Gly Met Gln Arg

1055 1060 1065

Lys Leu Ser Val Ala Ile Ala Phe Val Gly Asp Ala Lys Val Val

1070 1075 1080

Ile Leu Asp Glu Pro Thr Ser Gly Val Asp Pro Tyr Ser Arg Arg

1085 1090 1095

Ser Ile Trp Asp Leu Leu Leu Lys Tyr Arg Ser Gly Arg Thr Ile

1100 1105 1110

Ile Met Ser Thr His His Met Asp Glu Ala Asp Leu Leu Gly Asp

1115 1120 1125

Arg Ile Ala Ile Ile Ala Gln Gly Arg Leu Tyr Cys Ser Gly Thr

1130 1135 1140

Pro Leu Phe Leu Lys Asn Cys Phe Gly Thr Gly Leu Tyr Leu Thr

1145 1150 1155

Leu Val Arg Lys Met Lys Asn Ile Gln Ser Gln Arg Lys Gly Ser

1160 1165 1170

Glu Gly Thr Cys Ser Cys Ser Ser Lys Gly Phe Ser Thr Thr Cys

1175 1180 1185

Pro Ala His Val Asp Asp Leu Thr Pro Glu Gln Val Leu Asp Gly

1190 1195 1200

Asp Val Asn Glu Leu Met Asp Val Val Leu His His Val Pro Glu

1205 1210 1215

Ala Lys Leu Val Glu Cys Ile Gly Gln Glu Leu Ile Phe Leu Leu

1220 1225 1230

Pro Asn Lys Asn Phe Lys His Arg Ala Tyr Ala Ser Leu Phe Arg

1235 1240 1245

Glu Leu Glu Glu Thr Leu Ala Asp Leu Gly Leu Ser Ser Phe Gly

1250 1255 1260

Ile Ser Asp Thr Pro Leu Glu Glu Ile Phe Leu Lys Val Thr Glu

1265 1270 1275

Asp Ser Asp Ser Gly Pro Leu Phe Ala Gly Gly Ala Gln Gln Lys

1280 1285 1290

Arg Glu Asn Val Asn Pro Arg His Pro Cys Leu Gly Pro Arg Glu

1295 1300 1305

Lys Ala Gly Gln Thr Pro Gln Asp Ser Asn Val Cys Ser Pro Gly

1310 1315 1320

Ala Pro Ala Ala His Pro Glu Gly Gln Pro Pro Pro Glu Pro Glu

1325 1330 1335

Cys Pro Gly Pro Gln Leu Asn Thr Gly Thr Gln Leu Val Leu Gln

1340 1345 1350

His Val Gln Ala Leu Leu Val Lys Arg Phe Gln His Thr Ile Arg

1355 1360 1365

Ser His Lys Asp Phe Leu Ala Gln Ile Val Leu Pro Ala Thr Phe

1370 1375 1380

Val Phe Leu Ala Leu Met Leu Ser Ile Val Ile Pro Pro Phe Gly

1385 1390 1395

Glu Tyr Pro Ala Leu Thr Leu His Pro Trp Ile Tyr Gly Gln Gln

1400 1405 1410

Tyr Thr Phe Phe Ser Met Asp Glu Pro Gly Ser Glu Gln Phe Thr

1415 1420 1425

Val Leu Ala Asp Val Leu Leu Asn Lys Pro Gly Phe Gly Asn Arg

1430 1435 1440

Cys Leu Lys Glu Gly Trp Leu Pro Glu Tyr Pro Cys Gly Asn Ser

1445 1450 1455

Thr Pro Trp Lys Thr Pro Ser Val Ser Pro Asn Ile Thr Gln Leu

1460 1465 1470

Phe Gln Lys Gln Lys Trp Thr Gln Val Asn Pro Ser Pro Ser Cys

1475 1480 1485

Arg Cys Ser Thr Arg Glu Lys Leu Thr Met Leu Pro Glu Cys Pro

1490 1495 1500

Glu Gly Ala Gly Gly Leu Pro Pro Pro Gln Arg Thr Gln Arg Ser

1505 1510 1515

Thr Glu Ile Leu Gln Asp Leu Thr Asp Arg Asn Ile Ser Asp Phe

1520 1525 1530

Leu Val Lys Thr Tyr Pro Ala Leu Ile Arg Ser Ser Leu Lys Ser

1535 1540 1545

Lys Phe Trp Val Asn Glu Gln Arg Tyr Gly Gly Ile Ser Ile Gly

1550 1555 1560

Gly Lys Leu Pro Val Val Pro Ile Thr Gly Glu Ala Leu Val Gly

1565 1570 1575

Phe Leu Ser Asp Leu Gly Arg Ile Met Asn Val Ser Gly Gly Pro

1580 1585 1590

Ile Thr Arg Glu Ala Ser Lys Glu Ile Pro Asp Phe Leu Lys His

1595 1600 1605

Leu Glu Thr Glu Asp Asn Ile Lys Val Trp Phe Asn Asn Lys Gly

1610 1615 1620

Trp His Ala Leu Val Ser Phe Leu Asn Val Ala His Asn Ala Ile

1625 1630 1635

Leu Arg Ala Ser Leu Pro Lys Asp Arg Ser Pro Glu Glu Tyr Gly

1640 1645 1650

Ile Thr Val Ile Ser Gln Pro Leu Asn Leu Thr Lys Glu Gln Leu

1655 1660 1665

Ser Glu Ile Thr Val Leu Thr Thr Ser Val Asp Ala Val Val Ala

1670 1675 1680

Ile Cys Val Ile Phe Ser Met Ser Phe Val Pro Ala Ser Phe Val

1685 1690 1695

Leu Tyr Leu Ile Gln Glu Arg Val Asn Lys Ser Lys His Leu Gln

1700 1705 1710

Phe Ile Ser Gly Val Ser Pro Thr Thr Tyr Trp Val Thr Asn Phe

1715 1720 1725

Leu Trp Asp Ile Met Asn Tyr Ser Val Ser Ala Gly Leu Val Val

1730 1735 1740

Gly Ile Phe Ile Gly Phe Gln Lys Lys Ala Tyr Thr Ser Pro Glu

1745 1750 1755

Asn Leu Pro Ala Leu Val Ala Leu Leu Leu Leu Tyr Gly Trp Ala

1760 1765 1770

Val Ile Pro Met Met Tyr Pro Ala Ser Phe Leu Phe Asp Val Pro

1775 1780 1785

Ser Thr Ala Tyr Val Ala Leu Ser Cys Ala Asn Leu Phe Ile Gly

1790 1795 1800

Ile Asn Ser Ser Ala Ile Thr Phe Ile Leu Glu Leu Phe Glu Asn

1805 1810 1815

Asn Arg Thr Leu Leu Arg Phe Asn Ala Val Leu Arg Lys Leu Leu

1820 1825 1830

Ile Val Phe Pro His Phe Cys Leu Gly Arg Gly Leu Ile Asp Leu

1835 1840 1845

Ala Leu Ser Gln Ala Val Thr Asp Val Tyr Ala Arg Phe Gly Glu

1850 1855 1860

Glu His Ser Ala Asn Pro Phe His Trp Asp Leu Ile Gly Lys Asn

1865 1870 1875

Leu Phe Ala Met Val Val Glu Gly Val Val Tyr Phe Leu Leu Thr

1880 1885 1890

Leu Leu Val Gln Arg His Phe Phe Leu Ser Gln Trp Ile Ala Glu

1895 1900 1905

Pro Thr Lys Glu Pro Ile Val Asp Glu Asp Asp Asp Val Ala Glu

1910 1915 1920

Glu Arg Gln Arg Ile Ile Thr Gly Gly Asn Lys Thr Asp Ile Leu

1925 1930 1935

Arg Leu His Glu Leu Thr Lys Ile Tyr Pro Gly Thr Ser Ser Pro

1940 1945 1950

Ala Val Asp Arg Leu Cys Val Gly Val Arg Pro Gly Glu Cys Phe

1955 1960 1965

Gly Leu Leu Gly Val Asn Gly Ala Gly Lys Thr Thr Thr Phe Lys

1970 1975 1980

Met Leu Thr Gly Asp Thr Thr Val Thr Ser Gly Asp Ala Thr Val

1985 1990 1995

Ala Gly Lys Ser Ile Leu Thr Asn Ile Ser Glu Val His Gln Asn

2000 2005 2010

Met Gly Tyr Cys Pro Gln Phe Asp Ala Ile Asp Glu Leu Leu Thr

2015 2020 2025

Gly Arg Glu His Leu Tyr Leu Tyr Ala Arg Leu Arg Gly Val Pro

2030 2035 2040

Ala Glu Glu Ile Glu Lys Val Ala Asn Trp Ser Ile Lys Ser Leu

2045 2050 2055

Gly Leu Thr Val Tyr Ala Asp Cys Leu Ala Gly Thr Tyr Ser Gly

2060 2065 2070

Gly Asn Lys Arg Lys Leu Ser Thr Ala Ile Ala Leu Ile Gly Cys

2075 2080 2085

Pro Pro Leu Val Leu Leu Asp Glu Pro Thr Thr Gly Met Asp Pro

2090 2095 2100

Gln Ala Arg Arg Met Leu Trp Asn Val Ile Val Ser Ile Ile Arg

2105 2110 2115

Glu Gly Arg Ala Val Val Leu Thr Ser His Ser Met Glu Glu Cys

2120 2125 2130

Glu Ala Leu Cys Thr Arg Leu Ala Ile Met Val Lys Gly Ala Phe

2135 2140 2145

Arg Cys Met Gly Thr Ile Gln His Leu Lys Ser Lys Phe Gly Asp

2150 2155 2160

Gly Tyr Ile Val Thr Met Lys Ile Lys Ser Pro Lys Asp Asp Leu

2165 2170 2175

Leu Pro Asp Leu Asn Pro Val Glu Gln Phe Phe Gln Gly Asn Phe

2180 2185 2190

Pro Gly Ser Val Gln Arg Glu Arg His Tyr Asn Met Leu Gln Phe

2195 2200 2205

Gln Val Ser Ser Ser Ser Leu Ala Arg Ile Phe Gln Leu Leu Leu

2210 2215 2220

Ser His Lys Asp Ser Leu Leu Ile Glu Glu Tyr Ser Val Thr Gln

2225 2230 2235

Thr Thr Leu Asp Gln Val Phe Val Asn Phe Ala Lys Gln Gln Thr

2240 2245 2250

Glu Ser His Asp Leu Pro Leu His Pro Arg Ala Ala Gly Ala Ser

2255 2260 2265

Arg Gln Ala Gln Asp

2270

<210> 14

<211> 2608

<212> DNA

<213> 智人

<400> 14

tccttcttca ttctgcagtt ggtgccagaa ctctggatcc tgaactggaa gaaaatgtct 60

atccaggttg agcatcctgc tggtggttac aagaaactgt ttgaaactgt ggaggaactg 120

tcctcgccgc tcacagctca tgtaacaggc aggatccccc tctggctcac cggcagtctc 180

cttcgatgtg ggccaggact ctttgaagtt ggatctgagc cattttacca cctgtttgat 240

gggcaagccc tcctgcacaa gtttgacttt aaagaaggac atgtcacata ccacagaagg 300

ttcatccgca ctgatgctta cgtacgggca atgactgaga aaaggatcgt cataacagaa 360

tttggcacct gtgctttccc agatccctgc aagaatatat tttccaggtt tttttcttac 420

tttcgaggag tagaggttac tgacaatgcc cttgttaatg tctacccagt gggggaagat 480

tactacgctt gcacagagac caactttatt acaaagatta atccagagac cttggagaca 540

attaagcagg ttgatctttg caactatgtc tctgtcaatg gggccactgc tcacccccac 600

attgaaaatg atggaaccgt ttacaatatt ggtaattgct ttggaaaaaa tttttcaatt 660

gcctacaaca ttgtaaagat cccaccactg caagcagaca aggaagatcc aataagcaag 720

tcagagatcg ttgtacaatt cccctgcagt gaccgattca agccatctta cgttcatagt 780

tttggtctga ctcccaacta tatcgttttt gtggagacac cagtcaaaat taacctgttc 840

aagttccttt cttcatggag tctttgggga gccaactaca tggattgttt tgagtccaat 900

gaaaccatgg gggtttggct tcatattgct gacaaaaaaa ggaaaaagta cctcaataat 960

aaatacagaa cttctccttt caacctcttc catcacatca acacctatga agacaatggg 1020

tttctgattg tggatctctg ctgctggaaa ggatttgagt ttgtttataa ttacttatat 1080

ttagccaatt tacgtgagaa ctgggaagag gtgaaaaaaa atgccagaaa ggctccccaa 1140

cctgaagtta ggagatatgt acttcctttg aatattgaca aggctgacac aggcaagaat 1200

ttagtcacgc tccccaatac aactgccact gcaattctgt gcagtgacga gactatctgg 1260

ctggagcctg aagttctctt ttcagggcct cgtcaagcat ttgagtttcc tcaaatcaat 1320

taccagaagt attgtgggaa accttacaca tatgcgtatg gacttggctt gaatcacttt 1380

gttccagata ggctctgtaa gctgaatgtc aaaactaaag aaacttgggt ttggcaagag 1440

cctgattcat acccatcaga acccatcttt gtttctcacc cagatgcctt ggaagaagat 1500

gatggtgtag ttctgagtgt ggtggtgagc ccaggagcag gacaaaagcc tgcttatctc 1560

ctgattctga atgccaagga cttaagtgaa gttgcccggg ctgaagtgga gattaacatc 1620

cctgtcacct ttcatggact gttcaaaaaa tcttgagcat actccagcaa gatatgtttt 1680

tggtagcaaa actgagaaaa tcagcttcag gtctgcaatc aaattctgtt caattttagc 1740

ctgctatatg tcatggtttt aacttgcaga tgcgcacaat tttgcaatgt tttacagaaa 1800

gcactgagtt gagcaagcaa ttcctttatt taaaaaaaaa agtacgtatt tagataatca 1860

tacttcctct gtgagacagg ccataactga aaaactctta aatatttagc aatcaaatag 1920

gaaatgaatg tggacttact aaatggcttt taattcctat tataagagca tattttaggt 1980

acctatctgc tccaattata tttttaacat ttaaaaacca aagtcctcta cacttgattt 2040

atattatatg tggctttgct gagtcaagga agtatcatgc aataaggctt aattactaaa 2100

tgtcaaacca aactttttct caaaccaggg actatcatct aagattaatt acagtaatta 2160

ttttgcgtat acgtaactgc tcaaagatta tgaatcttat gaatgttaac ctttccgttt 2220

attacaagca agtactatta tttctgattt tataataaga aaatctgtgt ttaatcaact 2280

gaggcctctc aaccaaataa catctcagag attaagttat atattaaaag cttatgtaac 2340

ataaaagcaa gtacatatag tagtgactat atttaaaaaa acagcataaa atgcttaaaa 2400

atgtaatatt tactaaaatc agattatggg ataatgttgc aggattatac tttattgcat 2460

cttttttgtt taattgtatt taagcattgt gcaatcactt gggaaaaata ttaaattatt 2520

aacattgagg tattaataca ttttaagcct tttgttttta aatttctttt cttccagaga 2580

ttgtttaaaa ataaatattg acaaaaat 2608

<210> 15

<211> 533

<212> PRT

<213> 智人

<400> 15

Met Ser Ile Gln Val Glu His Pro Ala Gly Gly Tyr Lys Lys Leu Phe

1 5 10 15

Glu Thr Val Glu Glu Leu Ser Ser Pro Leu Thr Ala His Val Thr Gly

20 25 30

Arg Ile Pro Leu Trp Leu Thr Gly Ser Leu Leu Arg Cys Gly Pro Gly

35 40 45

Leu Phe Glu Val Gly Ser Glu Pro Phe Tyr His Leu Phe Asp Gly Gln

50 55 60

Ala Leu Leu His Lys Phe Asp Phe Lys Glu Gly His Val Thr Tyr His

65 70 75 80

Arg Arg Phe Ile Arg Thr Asp Ala Tyr Val Arg Ala Met Thr Glu Lys

85 90 95

Arg Ile Val Ile Thr Glu Phe Gly Thr Cys Ala Phe Pro Asp Pro Cys

100 105 110

Lys Asn Ile Phe Ser Arg Phe Phe Ser Tyr Phe Arg Gly Val Glu Val

115 120 125

Thr Asp Asn Ala Leu Val Asn Val Tyr Pro Val Gly Glu Asp Tyr Tyr

130 135 140

Ala Cys Thr Glu Thr Asn Phe Ile Thr Lys Ile Asn Pro Glu Thr Leu

145 150 155 160

Glu Thr Ile Lys Gln Val Asp Leu Cys Asn Tyr Val Ser Val Asn Gly

165 170 175

Ala Thr Ala His Pro His Ile Glu Asn Asp Gly Thr Val Tyr Asn Ile

180 185 190

Gly Asn Cys Phe Gly Lys Asn Phe Ser Ile Ala Tyr Asn Ile Val Lys

195 200 205

Ile Pro Pro Leu Gln Ala Asp Lys Glu Asp Pro Ile Ser Lys Ser Glu

210 215 220

Ile Val Val Gln Phe Pro Cys Ser Asp Arg Phe Lys Pro Ser Tyr Val

225 230 235 240

His Ser Phe Gly Leu Thr Pro Asn Tyr Ile Val Phe Val Glu Thr Pro

245 250 255

Val Lys Ile Asn Leu Phe Lys Phe Leu Ser Ser Trp Ser Leu Trp Gly

260 265 270

Ala Asn Tyr Met Asp Cys Phe Glu Ser Asn Glu Thr Met Gly Val Trp

275 280 285

Leu His Ile Ala Asp Lys Lys Arg Lys Lys Tyr Leu Asn Asn Lys Tyr

290 295 300

Arg Thr Ser Pro Phe Asn Leu Phe His His Ile Asn Thr Tyr Glu Asp

305 310 315 320

Asn Gly Phe Leu Ile Val Asp Leu Cys Cys Trp Lys Gly Phe Glu Phe

325 330 335

Val Tyr Asn Tyr Leu Tyr Leu Ala Asn Leu Arg Glu Asn Trp Glu Glu

340 345 350

Val Lys Lys Asn Ala Arg Lys Ala Pro Gln Pro Glu Val Arg Arg Tyr

355 360 365

Val Leu Pro Leu Asn Ile Asp Lys Ala Asp Thr Gly Lys Asn Leu Val

370 375 380

Thr Leu Pro Asn Thr Thr Ala Thr Ala Ile Leu Cys Ser Asp Glu Thr

385 390 395 400

Ile Trp Leu Glu Pro Glu Val Leu Phe Ser Gly Pro Arg Gln Ala Phe

405 410 415

Glu Phe Pro Gln Ile Asn Tyr Gln Lys Tyr Cys Gly Lys Pro Tyr Thr

420 425 430

Tyr Ala Tyr Gly Leu Gly Leu Asn His Phe Val Pro Asp Arg Leu Cys

435 440 445

Lys Leu Asn Val Lys Thr Lys Glu Thr Trp Val Trp Gln Glu Pro Asp

450 455 460

Ser Tyr Pro Ser Glu Pro Ile Phe Val Ser His Pro Asp Ala Leu Glu

465 470 475 480

Glu Asp Asp Gly Val Val Leu Ser Val Val Val Ser Pro Gly Ala Gly

485 490 495

Gln Lys Pro Ala Tyr Leu Leu Ile Leu Asn Ala Lys Asp Leu Ser Glu

500 505 510

Val Ala Arg Ala Glu Val Glu Ile Asn Ile Pro Val Thr Phe His Gly

515 520 525

Leu Phe Lys Lys Ser

530

<210> 16

<211> 1752

<212> DNA

<213> 智人

<400> 16

gagcccgatt taacggaaac tgtgggcggt gagaagttcc ttatgacaca ctaatcccaa 60

cctgctgacc ggaccacgcc tccagcggag ggaacctcta gagctccagg acattcaggt 120

accaggtagc cccaaggagg agctgccgac ctggcaggga acaaccaaga ctggggttaa 180

atctcacagc ctgcaagtgg aagagaagaa cttgaaccca ggtccaactt ttgcgccaca 240

gcaggctgcc tcttggtcct gacaggaagt cacaacttgg ccctgacttc ctatcctagg 300

gaaggggccg gctggagagg ccaggacaga gaaagcagat cccttctttt tccaaggact 360

ctgtgtcttc cataggcaac atgtcagaag gggtgggcac gttccgcatg gtacctgaag 420

aggaacagga gctccgtgcc caactggagc agctcacaac caaggaccat ggacctgtct 480

ttggcccgtg cagccagctg ccccgccaca ccttgcagaa ggccaaggat gagctgaacg 540

agagagagga gacccgggag gaggcagtgc gagagctgca ggagatggtg caggcgcagg 600

cggcctcggg ggaggagctg gcggtggccg tggcggagag ggtgcaagag aaggacagcg 660

gcttcttcct gcgcttcatc cgcgcacgga agttcaacgt gggccgtgcc tatgagctgc 720

tcagaggcta tgtgaatttc cggctgcagt accctgagct ctttgacagc ctgtccccag 780

aggctgtccg ctgcaccatt gaagctggct accctggtgt cctctctagt cgggacaagt 840

atggccgagt ggtcatgctc ttcaacattg agaactggca aagtcaagaa atcacctttg 900

atgagatctt gcaggcatat tgcttcatcc tggagaagct gctggagaat gaggaaactc 960

aaatcaatgg cttctgcatc attgagaact tcaagggctt taccatgcag caggctgcta 1020

gtctccggac ttcagatctc aggaagatgg tggacatgct ccaggattcc ttcccagccc 1080

ggttcaaagc catccacttc atccaccagc catggtactt caccacgacc tacaatgtgg 1140

tcaagccctt cttgaagagc aagctgcttg agagggtctt tgtccacggg gatgaccttt 1200

ctggtttcta ccaggagatc gatgagaaca tcctgccctc tgacttcggg ggcacgctgc 1260

ccaagtatga tggcaaggcc gttgctgagc agctctttgg cccccaggcc caagctgaga 1320

acacagcctt ctgaaaacat ctcctgccag ctgaactgta gttagaatct ctgggcctct 1380

cctcaactgt cctggaccca aggctaggaa agggctgctt gagatgactg tggtcccccc 1440

ttagactccc taagcccgag tgagctcagg tgtcaccctg ttctcaagtt gggggatggg 1500

taataaagga gggggaattc ccttgaacaa gaagaactgg ggatagttat atttccacct 1560

gcccttgaag ctttaagaca gtgatttttg tgtaaggttg tatttcaaag actcgaattc 1620

attttctcag tcatttcctt tgtaacagag ttttacgact tagagtctgt gaaaacaggc 1680

aaggagcccg ggttaaaata tccccctatt cgcccccaaa atgcaataaa agaagataaa 1740

agagagagga ta 1752

<210> 17

<211> 317

<212> PRT

<213> 智人

<400> 17

Met Ser Glu Gly Val Gly Thr Phe Arg Met Val Pro Glu Glu Glu Gln

1 5 10 15

Glu Leu Arg Ala Gln Leu Glu Gln Leu Thr Thr Lys Asp His Gly Pro

20 25 30

Val Phe Gly Pro Cys Ser Gln Leu Pro Arg His Thr Leu Gln Lys Ala

35 40 45

Lys Asp Glu Leu Asn Glu Arg Glu Glu Thr Arg Glu Glu Ala Val Arg

50 55 60

Glu Leu Gln Glu Met Val Gln Ala Gln Ala Ala Ser Gly Glu Glu Leu

65 70 75 80

Ala Val Ala Val Ala Glu Arg Val Gln Glu Lys Asp Ser Gly Phe Phe

85 90 95

Leu Arg Phe Ile Arg Ala Arg Lys Phe Asn Val Gly Arg Ala Tyr Glu

100 105 110

Leu Leu Arg Gly Tyr Val Asn Phe Arg Leu Gln Tyr Pro Glu Leu Phe

115 120 125

Asp Ser Leu Ser Pro Glu Ala Val Arg Cys Thr Ile Glu Ala Gly Tyr

130 135 140

Pro Gly Val Leu Ser Ser Arg Asp Lys Tyr Gly Arg Val Val Met Leu

145 150 155 160

Phe Asn Ile Glu Asn Trp Gln Ser Gln Glu Ile Thr Phe Asp Glu Ile

165 170 175

Leu Gln Ala Tyr Cys Phe Ile Leu Glu Lys Leu Leu Glu Asn Glu Glu

180 185 190

Thr Gln Ile Asn Gly Phe Cys Ile Ile Glu Asn Phe Lys Gly Phe Thr

195 200 205

Met Gln Gln Ala Ala Ser Leu Arg Thr Ser Asp Leu Arg Lys Met Val

210 215 220

Asp Met Leu Gln Asp Ser Phe Pro Ala Arg Phe Lys Ala Ile His Phe

225 230 235 240

Ile His Gln Pro Trp Tyr Phe Thr Thr Thr Tyr Asn Val Val Lys Pro

245 250 255

Phe Leu Lys Ser Lys Leu Leu Glu Arg Val Phe Val His Gly Asp Asp

260 265 270

Leu Ser Gly Phe Tyr Gln Glu Ile Asp Glu Asn Ile Leu Pro Ser Asp

275 280 285

Phe Gly Gly Thr Leu Pro Lys Tyr Asp Gly Lys Ala Val Ala Glu Gln

290 295 300

Leu Phe Gly Pro Gln Ala Gln Ala Glu Asn Thr Ala Phe

305 310 315

<210> 18

<211> 3027

<212> DNA

<213> 智人

<400> 18

cagcgttcag gctgcccctt cttggctggg aagggcgctg aagaaacaac gcccaggacc 60

aggactatcc cctgctcaag ctgtgattcc gagacccctg ccaccactac tgcattcacg 120

gggatcccag gctagtggga ctcgacatgg gtagccccca gggcagctcc ctacagcttg 180

ggccatctgc acttttccca aggccctaag tctccgcctc tgggctcgtt aaggtttggg 240

gtgggagctg tgctgtggga agcaacccgg actacacttg gcaagcatgg cgctactgaa 300

agtcaagttt gaccagaaga agcgggtcaa gttggcccaa gggctctggc tcatgaactg 360

gttctccgtg ttggctggca tcatcatctt cagcctagga ctgttcctga agattgaact 420

ccgaaagagg agcgatgtga tgaataattc tgagagccat tttgtgccca actcattgat 480

agggatgggg gtgctatcct gtgtcttcaa ctcgctggct gggaagatct gctacgacgc 540

cctggaccca gccaagtatg ccagatggaa gccctggctg aagccgtacc tggctatctg 600

tgttctcttc aacatcatcc tcttccttgt ggctctctgc tgctttctgc ttcggggctc 660

gctggagaac accctgggcc aagggctcaa gaacggcatg aagtactacc gggacacaga 720

cacccctggc aggtgtttca tgaagaagac catcgacatg ctgcagatcg agttcaaatg 780

ctgcggcaac aacggttttc gggactggtt tgagattcag tggatcagca atcgctacct 840

ggacttttcc tccaaagaag tcaaagatcg aatcaagagc aacgtggatg ggcggtacct 900

ggtggacggc gtccctttca gctgctgcaa tcctagctcg ccacggccct gcatccagta 960

tcagatcacc aacaactcag cacactacag ttacgaccac cagacggagg agctcaacct 1020

gtgggtgcgt ggctgcaggg ctgccctgct gagctactac agcagcctca tgaactccat 1080

gggtgtcgtc acgctcctca tttggctctt cgaggtgacc attacaattg ggctgcgcta 1140

cctacagacg tcgctggatg gtgtgtccaa ccccgaggaa tctgagagcg agagccaggg 1200

ctggctgctg gagaggagcg tgccggagac ctggaaggcc tttctggaga gtgtgaagaa 1260

gctgggcaag ggcaaccagg tggaagccga gggcgcagac gcaggccagg ccccagaggc 1320

tggctgaggg ccctggggcc cctcccctcc cgaacactga gaaatagtgc actccaagaa 1380

acgtggatct ccccctcatc caactccgaa agtctgaatc tcccaaggag ggcaccatct 1440

tacagagact ctccctgacg gtggaattta agtttagggt ccctaaaagc atttgacaca 1500

cagttgttga atgactgacc caaaatgtga atgaagctaa tgtgaatgtg agtgaagctc 1560

ccttcaggcc cgctgcccta ggatatgccc tcctggtgac tcgggggctg tctcagacga 1620

ctagcccagg acccatcttt ctcacacgga tttagtccca ccctatggcc actggccgta 1680

tctgagggct gctccccttt tagaatttac ctcttatgag ctccatgttg cttcactcta 1740

tccaaagtgt cacttggtgc ataagcacag aaatctgaaa aatggccatg ttgtcttttt 1800

tttttttttt taatgccaag attgacaggt tggccgtttg cttaatgcca gaagttgggg 1860

gaaagttacg cttttctaag aataatggac tcttaaggca ttgagggctc taaacaggat 1920

tctttaatca tggagcaaga gaatttcaag gcaggggatt ttatccccca ccaaaaacac 1980

agtgaaaggc ctgcttttgt gtcccattca catgccctcg gtcactgagt ctggagtgaa 2040

ccacgggttg aggaagtcag gctgttggcg tgtcccagca ccacaccacc cctaaagtgc 2100

caggtgatct cctgtggctc atcggtggaa gcagtggggt aggctgctgc cctgctgtgg 2160

aagaggagca acaatcagac atgagtccac cctttggaga ccaggcctca gctcttggtg 2220

ggcccaggga cacccacaca ggtggccatc acagccccat ggacaacact aattgtccac 2280

agcaaagggc aaggaatcct ctgggagctt cttccgtttc ttccccccag atacccatct 2340

tgaaaaacac tatttctgga atgcttctgc atcaaaggag attctttgag atagcccatc 2400

ttcctgagct agcaaataca ggagttttca ctttctttag gaaagagaag ctttcagggg 2460

aaggagagaa tgattttgct gacttcccaa gccctggtga ccagaccaag gcagggccca 2520

gcataattcc tccagttgga tgaacattca agagagctcg ttcctacctg gctggagacc 2580

gaggccagaa ggcaaaaacc agaaagggaa cagtccataa cttacctctg cttctgaccg 2640

atggtgtttg ggaataggtt actttggact gagtttgggt tctctgctgt cctaagaact 2700

tcagtgtaga gaaaataaga cttctggtgc tgctggggta tgttctgggc ttaattcccc 2760

caagcagaag accagatcca agatgtttgg acaccctgtc agacgttggt cccaagttta 2820

attagatttc tgaatctcgt tgaggccaag gaatgatcca tactgaaaaa atgctgagcc 2880

agccatcttt ggcaaaggtc cctgagctct tgctatctct caagagtgct gagaaccacg 2940

gtgaaagtgc tgctctaggc ccacaagtgt aactatgctg ttaacagctg tcaatagata 3000

attaaaattc atactgtatg aaaatca 3027

<210> 19

<211> 346

<212> PRT

<213> 智人

<400> 19

Met Ala Leu Leu Lys Val Lys Phe Asp Gln Lys Lys Arg Val Lys Leu

1 5 10 15

Ala Gln Gly Leu Trp Leu Met Asn Trp Phe Ser Val Leu Ala Gly Ile

20 25 30

Ile Ile Phe Ser Leu Gly Leu Phe Leu Lys Ile Glu Leu Arg Lys Arg

35 40 45

Ser Asp Val Met Asn Asn Ser Glu Ser His Phe Val Pro Asn Ser Leu

50 55 60

Ile Gly Met Gly Val Leu Ser Cys Val Phe Asn Ser Leu Ala Gly Lys

65 70 75 80

Ile Cys Tyr Asp Ala Leu Asp Pro Ala Lys Tyr Ala Arg Trp Lys Pro

85 90 95

Trp Leu Lys Pro Tyr Leu Ala Ile Cys Val Leu Phe Asn Ile Ile Leu

100 105 110

Phe Leu Val Ala Leu Cys Cys Phe Leu Leu Arg Gly Ser Leu Glu Asn

115 120 125

Thr Leu Gly Gln Gly Leu Lys Asn Gly Met Lys Tyr Tyr Arg Asp Thr

130 135 140

Asp Thr Pro Gly Arg Cys Phe Met Lys Lys Thr Ile Asp Met Leu Gln

145 150 155 160

Ile Glu Phe Lys Cys Cys Gly Asn Asn Gly Phe Arg Asp Trp Phe Glu

165 170 175

Ile Gln Trp Ile Ser Asn Arg Tyr Leu Asp Phe Ser Ser Lys Glu Val

180 185 190

Lys Asp Arg Ile Lys Ser Asn Val Asp Gly Arg Tyr Leu Val Asp Gly

195 200 205

Val Pro Phe Ser Cys Cys Asn Pro Ser Ser Pro Arg Pro Cys Ile Gln

210 215 220

Tyr Gln Ile Thr Asn Asn Ser Ala His Tyr Ser Tyr Asp His Gln Thr

225 230 235 240

Glu Glu Leu Asn Leu Trp Val Arg Gly Cys Arg Ala Ala Leu Leu Ser

245 250 255

Tyr Tyr Ser Ser Leu Met Asn Ser Met Gly Val Val Thr Leu Leu Ile

260 265 270

Trp Leu Phe Glu Val Thr Ile Thr Ile Gly Leu Arg Tyr Leu Gln Thr

275 280 285

Ser Leu Asp Gly Val Ser Asn Pro Glu Glu Ser Glu Ser Glu Ser Gln

290 295 300

Gly Trp Leu Leu Glu Arg Ser Val Pro Glu Thr Trp Lys Ala Phe Leu

305 310 315 320

Glu Ser Val Lys Lys Leu Gly Lys Gly Asn Gln Val Glu Ala Glu Gly

325 330 335

Ala Asp Ala Gly Gln Ala Pro Glu Ala Gly

340 345

<210> 20

<211> 1767

<212> DNA

<213> 智人

<400> 20

gtcagctggg tgactcatac atctgtgaga ccctccgtat ggagaccggg gcggggggtg 60

ttgcttaatg cttagaactg ctgaaactac cagttcactg tctcagcact aatccaactc 120

tgctccttaa gtgggatttg gcttttagac attgagacct ggatgctggg catcctcgct 180

agatccccta caaattcccc acatacgtag gccaggagcc tcagcggtgc cccttcaggc 240

tcatctggca agacggtacc agcttgctca gaacaggggc tggctattca tcatctcaga 300

gcatagagac cctctccttg ccacccggcc cttcccacct ggttggtgac aaatcacaag 360

gtggtagaag ttgccaggga cagataacat ggcagccagc gggaagacca gcaagtccga 420

accgaaccat gttatcttca agaagatctc ccgggacaaa tcggtgacca tctacctggg 480

gaacagagac tacatagacc atgtcagcca agtccagcct gtggatggtg tcgtgttggt 540

tgatcctgat cttgtgaagg gaaagaaagt gtatgtcact ctgacctgcg ccttccgcta 600

tggccaagag gacattgacg tgatcggctt gaccttccgc agggacctgt acttctcccg 660

ggtccaggtg tatcctcctg tgggggccgc gagcaccccc acaaaactgc aagagagcct 720

gcttaaaaag ctggggagca acacgtaccc ctttctcctg acgtttcctg actacttgcc 780

ctgttcagtg atgttgcagc cagctccaca agattcaggg aagtcctgtg gggttgactt 840

tgaggtcaaa gcattcgcca cagacagcac cgatgccgaa gaggacaaaa tccccaagaa 900

gagctccgtg cgattactga tccgcaaagt acagcatgcc ccacttgaga tgggtcccca 960

gccccgagct gaggcggcct ggcagttctt catgtctgac aagcccctgc accttgcggt 1020

ctctctcaac aaagagatct atttccatgg ggagcccatc cctgtgaccg tgactgtcac 1080

caataacaca gagaagaccg tgaagaagat taaagcattc gtggaacagg tggccaatgt 1140

ggttctctac tcgagtgatt attacgtcaa gcccgtggct atggaggaag cgcaagaaaa 1200

agtgccacca aacagcactt tgaccaagac gctgacgctg ctgcccttgc tggctaacaa 1260

tcgagaaagg agaggcattg ccctggatgg gaaaatcaag cacgaggaca caaaccttgc 1320

ctccagcacc atcattaagg agggcataga ccggaccgtc ctgggaatcc tggtgtctta 1380

ccagatcaag gtgaagctca cagtgtcagg ctttctggga gagctcacct ccagtgaagt 1440

cgccactgag gtcccattcc gcctcatgca ccctcagcct gaggacccag ctaaggaaag 1500

ttatcaggat gcaaatttag tttttgagga gtttgctcgc cataatctga aagatgcagg 1560

agaagctgag gaggggaaga gagacaagaa tgacgttgat gagtgaagat gtcggctcag 1620

gatgccggaa aatgacctgt agttaccagt gcaacgagca aagccccaca gtttagtcct 1680

ttggagttat gctgcgtatg aaaggatgag tcttcttccg agaaataaag cttgtttgtt 1740

ctcccctgga aaaaaaaaaa aaaaaaa 1767

<210> 21

<211> 405

<212> PRT

<213> 智人

<400> 21

Met Ala Ala Ser Gly Lys Thr Ser Lys Ser Glu Pro Asn His Val Ile

1 5 10 15

Phe Lys Lys Ile Ser Arg Asp Lys Ser Val Thr Ile Tyr Leu Gly Asn

20 25 30

Arg Asp Tyr Ile Asp His Val Ser Gln Val Gln Pro Val Asp Gly Val

35 40 45

Val Leu Val Asp Pro Asp Leu Val Lys Gly Lys Lys Val Tyr Val Thr

50 55 60

Leu Thr Cys Ala Phe Arg Tyr Gly Gln Glu Asp Ile Asp Val Ile Gly

65 70 75 80

Leu Thr Phe Arg Arg Asp Leu Tyr Phe Ser Arg Val Gln Val Tyr Pro

85 90 95

Pro Val Gly Ala Ala Ser Thr Pro Thr Lys Leu Gln Glu Ser Leu Leu

100 105 110

Lys Lys Leu Gly Ser Asn Thr Tyr Pro Phe Leu Leu Thr Phe Pro Asp

115 120 125

Tyr Leu Pro Cys Ser Val Met Leu Gln Pro Ala Pro Gln Asp Ser Gly

130 135 140

Lys Ser Cys Gly Val Asp Phe Glu Val Lys Ala Phe Ala Thr Asp Ser

145 150 155 160

Thr Asp Ala Glu Glu Asp Lys Ile Pro Lys Lys Ser Ser Val Arg Leu

165 170 175

Leu Ile Arg Lys Val Gln His Ala Pro Leu Glu Met Gly Pro Gln Pro

180 185 190

Arg Ala Glu Ala Ala Trp Gln Phe Phe Met Ser Asp Lys Pro Leu His

195 200 205

Leu Ala Val Ser Leu Asn Lys Glu Ile Tyr Phe His Gly Glu Pro Ile

210 215 220

Pro Val Thr Val Thr Val Thr Asn Asn Thr Glu Lys Thr Val Lys Lys

225 230 235 240

Ile Lys Ala Phe Val Glu Gln Val Ala Asn Val Val Leu Tyr Ser Ser

245 250 255

Asp Tyr Tyr Val Lys Pro Val Ala Met Glu Glu Ala Gln Glu Lys Val

260 265 270

Pro Pro Asn Ser Thr Leu Thr Lys Thr Leu Thr Leu Leu Pro Leu Leu

275 280 285

Ala Asn Asn Arg Glu Arg Arg Gly Ile Ala Leu Asp Gly Lys Ile Lys

290 295 300

His Glu Asp Thr Asn Leu Ala Ser Ser Thr Ile Ile Lys Glu Gly Ile

305 310 315 320

Asp Arg Thr Val Leu Gly Ile Leu Val Ser Tyr Gln Ile Lys Val Lys

325 330 335

Leu Thr Val Ser Gly Phe Leu Gly Glu Leu Thr Ser Ser Glu Val Ala

340 345 350

Thr Glu Val Pro Phe Arg Leu Met His Pro Gln Pro Glu Asp Pro Ala

355 360 365

Lys Glu Ser Tyr Gln Asp Ala Asn Leu Val Phe Glu Glu Phe Ala Arg

370 375 380

His Asn Leu Lys Asp Ala Gly Glu Ala Glu Glu Gly Lys Arg Asp Lys

385 390 395 400

Asn Asp Val Asp Glu

405

<210> 22

<211> 2483

<212> DNA

<213> 智人

<400> 22

agttgattgc aggtcctcct ggggccagaa gggtgcctgg gaggccaggt tctggggatc 60

ccctccatcc agaagaacca cctgctcact ctgtcccttc gcctgctgct gggaccatgg 120

gggctggggc cagtgctgag gagaagcact ccagggagct ggaaaagaag ctgaaagagg 180

acgctgagaa ggatgctcga accgtgaagc tgctgcttct gggtgccggt gagtccggga 240

agagcaccat cgtcaagcag atgaagatta tccaccagga cgggtactcg ctggaagagt 300

gcctcgagtt tatcgccatc atctacggca acacgttgca gtccatcctg gccatcgtac 360

gcgccatgac cacactcaac atccagtacg gagactctgc acgccaggac gacgcccgga 420

agctgatgca catggcagac actatcgagg agggcacgat gcccaaggag atgtcggaca 480

tcatccagcg gctgtggaag gactccggta tccaggcctg ttttgagcgc gcctcggagt 540

accagctcaa cgactcggcg ggctactacc tctccgacct ggagcgcctg gtaaccccgg 600

gctacgtgcc caccgagcag gacgtgctgc gctcgcgagt caagaccact ggcatcatcg 660

agacgcagtt ctccttcaag gatctcaact tccggatgtt cgatgtgggc gggcagcgct 720

cggagcgcaa gaagtggatc cactgcttcg agggcgtgac ctgcatcatc ttcatcgcgg 780

cgctgagcgc ctacgacatg gtgctagtgg aggacgacga agtgaaccgc atgcacgaga 840

gcctgcacct gttcaacagc atctgcaacc accgctactt cgccacgacg tccatcgtgc 900

tcttccttaa caagaaggac gtcttcttcg agaagatcaa gaaggcgcac ctcagcatct 960

gtttcccgga ctacgatgga cccaacacct acgaggacgc cggcaactac atcaaggtgc 1020

agttcctcga gctcaacatg cggcgcgacg tgaaggagat ctattcccac atgacgtgcg 1080

ccaccgacac gcagaacgtc aaatttgtct tcgacgctgt caccgacatc atcatcaagg 1140

agaacctcaa agactgtggc ctcttctgag gccagggcct gtgctgcagt cggggacaag 1200

gagcttccgt ctggcaaggc cggggcacaa tttgcactcc cctcagctag acgcacagac 1260

tcagcaataa acctttgcat caggctccag ctgtcctttc ttggtggagg acttaattat 1320

cacaagtcat gggcatttat taagtgccca gtgctgggtt gggcatgaag tgggaagatg 1380

gcccctccca ggaagaagta cctggcctga caaggtgggg cactcttggg ggtatgggac 1440

caactcatgg cttttcacgg gagttgagga gagaggagct gtggaaaata ttcactggga 1500

cagtcttgga tcaagaggga gttttgaggt ggaggctcat tctggcaggg accgtagtgt 1560

ctaccagccc cagaaacatg ggcttatggc cacaggagtt cagtggagca agagcagggg 1620

aggagagacg tggacaggtg cccaaagcca gtcggagggc ctgggctttc tcagaaggtg 1680

atggagagtc ttggaagccc tcgaggcagg aacataattg cagggctggg attagggtga 1740

gggaagtgag gcacactcac cttgggtgca acatttaagg cgatgccaaa aaatttagta 1800

accaaggtaa ataatattag gataatattt ttaaaaatca aatgaatgca aaaccccaca 1860

atgaatgaaa tatcaaaatc caacagagga tcaaacagag gcatgctaag atatattggg 1920

gcttgaagca aagggaaaac tatttgttgc tatatgtttg tagggatttt ttgccagttt 1980

taaaaataca tgtatcataa agtttactat ctcagccact tgccggtgta tagtttggtg 2040

gtgttaagta cattcataat gttgtacaac caccgcaact gttcatctcc agaactcctt 2100

tcctcttgta aaactgtaac tctgtaccca tgaaaaaata accccccatt cctgccttcc 2160

cccggctcct ggcatccacc attctacttt ccatctctat gaatgtgact gctctaagtg 2220

cctcagatgt gtgggtccat gaagtctttg tctttttgca actggcttat ttcacttagc 2280

atcatgtctt caaggtttat tcatgtgtag catatggcag aatctccttc ctttttaagg 2340

ttgaataata ttccattgta tatattccac actttgttta tttattcatc tattgatgaa 2400

tggttacatc tgccttttgg ctattgtgaa taatgctgct atgaacatgg gtgtacaaat 2460

ctctcaaaaa aaaaaaaaaa aaa 2483

<210> 23

<211> 350

<212> PRT

<213> 智人

<400> 23

Met Gly Ala Gly Ala Ser Ala Glu Glu Lys His Ser Arg Glu Leu Glu

1 5 10 15

Lys Lys Leu Lys Glu Asp Ala Glu Lys Asp Ala Arg Thr Val Lys Leu

20 25 30

Leu Leu Leu Gly Ala Gly Glu Ser Gly Lys Ser Thr Ile Val Lys Gln

35 40 45

Met Lys Ile Ile His Gln Asp Gly Tyr Ser Leu Glu Glu Cys Leu Glu

50 55 60

Phe Ile Ala Ile Ile Tyr Gly Asn Thr Leu Gln Ser Ile Leu Ala Ile

65 70 75 80

Val Arg Ala Met Thr Thr Leu Asn Ile Gln Tyr Gly Asp Ser Ala Arg

85 90 95

Gln Asp Asp Ala Arg Lys Leu Met His Met Ala Asp Thr Ile Glu Glu

100 105 110

Gly Thr Met Pro Lys Glu Met Ser Asp Ile Ile Gln Arg Leu Trp Lys

115 120 125

Asp Ser Gly Ile Gln Ala Cys Phe Glu Arg Ala Ser Glu Tyr Gln Leu

130 135 140

Asn Asp Ser Ala Gly Tyr Tyr Leu Ser Asp Leu Glu Arg Leu Val Thr

145 150 155 160

Pro Gly Tyr Val Pro Thr Glu Gln Asp Val Leu Arg Ser Arg Val Lys

165 170 175

Thr Thr Gly Ile Ile Glu Thr Gln Phe Ser Phe Lys Asp Leu Asn Phe

180 185 190

Arg Met Phe Asp Val Gly Gly Gln Arg Ser Glu Arg Lys Lys Trp Ile

195 200 205

His Cys Phe Glu Gly Val Thr Cys Ile Ile Phe Ile Ala Ala Leu Ser

210 215 220

Ala Tyr Asp Met Val Leu Val Glu Asp Asp Glu Val Asn Arg Met His

225 230 235 240

Glu Ser Leu His Leu Phe Asn Ser Ile Cys Asn His Arg Tyr Phe Ala

245 250 255

Thr Thr Ser Ile Val Leu Phe Leu Asn Lys Lys Asp Val Phe Phe Glu

260 265 270

Lys Ile Lys Lys Ala His Leu Ser Ile Cys Phe Pro Asp Tyr Asp Gly

275 280 285

Pro Asn Thr Tyr Glu Asp Ala Gly Asn Tyr Ile Lys Val Gln Phe Leu

290 295 300

Glu Leu Asn Met Arg Arg Asp Val Lys Glu Ile Tyr Ser His Met Thr

305 310 315 320

Cys Ala Thr Asp Thr Gln Asn Val Lys Phe Val Phe Asp Ala Val Thr

325 330 335

Asp Ile Ile Ile Lys Glu Asn Leu Lys Asp Cys Gly Leu Phe

340 345 350

<210> 24

<211> 201

<212> PRT

<213> 智人

<400> 24

Met Gly Asn Val Met Glu Gly Lys Ser Val Glu Glu Leu Ser Ser Thr

1 5 10 15

Glu Cys His Gln Trp Tyr Lys Lys Phe Met Thr Glu Cys Pro Ser Gly

20 25 30

Gln Leu Thr Leu Tyr Glu Phe Arg Gln Phe Phe Gly Leu Lys Asn Leu

35 40 45

Ser Pro Ser Ala Ser Gln Tyr Val Glu Gln Met Phe Glu Thr Phe Asp

50 55 60

Phe Asn Lys Asp Gly Tyr Ile Asp Phe Met Glu Tyr Val Ala Ala Leu

65 70 75 80

Ser Leu Val Leu Lys Gly Lys Val Glu Gln Lys Leu Arg Trp Tyr Phe

85 90 95

Lys Leu Tyr Asp Val Asp Gly Asn Gly Cys Ile Asp Arg Asp Glu Leu

100 105 110

Leu Thr Ile Ile Gln Ala Ile Arg Ala Ile Asn Pro Cys Ser Asp Thr

115 120 125

Thr Met Thr Ala Glu Glu Phe Thr Asp Thr Val Phe Ser Lys Ile Asp

130 135 140

Val Asn Gly Asp Gly Glu Leu Ser Leu Glu Glu Phe Ile Glu Gly Val

145 150 155 160

Gln Lys Asp Gln Met Leu Leu Asp Thr Leu Thr Arg Ser Leu Asp Leu

165 170 175

Thr Arg Ile Val Arg Arg Leu Gln Asn Gly Glu Gln Asp Glu Glu Gly

180 185 190

Ala Asp Glu Ala Ala Glu Ala Ala Gly

195 200

<210> 25

<211> 1103

<212> PRT

<213> 智人

<400> 25

Met Thr Ala Cys Ala Arg Arg Ala Gly Gly Leu Pro Asp Pro Gly Leu

1 5 10 15

Cys Gly Pro Ala Trp Trp Ala Pro Ser Leu Pro Arg Leu Pro Arg Ala

20 25 30

Leu Pro Arg Leu Pro Leu Leu Leu Leu Leu Leu Leu Leu Gln Pro Pro

35 40 45

Ala Leu Ser Ala Val Phe Thr Val Gly Val Leu Gly Pro Trp Ala Cys

50 55 60

Asp Pro Ile Phe Ser Arg Ala Arg Pro Asp Leu Ala Ala Arg Leu Ala

65 70 75 80

Ala Ala Arg Leu Asn Arg Asp Pro Gly Leu Ala Gly Gly Pro Arg Phe

85 90 95

Glu Val Ala Leu Leu Pro Glu Pro Cys Arg Thr Pro Gly Ser Leu Gly

100 105 110

Ala Val Ser Ser Ala Leu Ala Arg Val Ser Gly Leu Val Gly Pro Val

115 120 125

Asn Pro Ala Ala Cys Arg Pro Ala Glu Leu Leu Ala Glu Glu Ala Gly

130 135 140

Ile Ala Leu Val Pro Trp Gly Cys Pro Trp Thr Gln Ala Glu Gly Thr

145 150 155 160

Thr Ala Pro Ala Val Thr Pro Ala Ala Asp Ala Leu Tyr Ala Leu Leu

165 170 175

Arg Ala Phe Gly Trp Ala Arg Val Ala Leu Val Thr Ala Pro Gln Asp

180 185 190

Leu Trp Val Glu Ala Gly Arg Ser Leu Ser Thr Ala Leu Arg Ala Arg

195 200 205

Gly Leu Pro Val Ala Ser Val Thr Ser Met Glu Pro Leu Asp Leu Ser

210 215 220

Gly Ala Arg Glu Ala Leu Arg Lys Val Arg Asp Gly Pro Arg Val Thr

225 230 235 240

Ala Val Ile Met Val Met His Ser Val Leu Leu Gly Gly Glu Glu Gln

245 250 255

Arg Tyr Leu Leu Glu Ala Ala Glu Glu Leu Gly Leu Thr Asp Gly Ser

260 265 270

Leu Val Phe Leu Pro Phe Asp Thr Ile His Tyr Ala Leu Ser Pro Gly

275 280 285

Pro Glu Ala Leu Ala Ala Leu Ala Asn Ser Ser Gln Leu Arg Arg Ala

290 295 300

His Asp Ala Val Leu Thr Leu Thr Arg His Cys Pro Ser Glu Gly Ser

305 310 315 320

Val Leu Asp Ser Leu Arg Arg Ala Gln Glu Arg Arg Glu Leu Pro Ser

325 330 335

Asp Leu Asn Leu Gln Gln Val Ser Pro Leu Phe Gly Thr Ile Tyr Asp

340 345 350

Ala Val Phe Leu Leu Ala Arg Gly Val Ala Glu Ala Arg Ala Ala Ala

355 360 365

Gly Gly Arg Trp Val Ser Gly Ala Ala Val Ala Arg His Ile Arg Asp

370 375 380

Ala Gln Val Pro Gly Phe Cys Gly Asp Leu Gly Gly Asp Glu Glu Pro

385 390 395 400

Pro Phe Val Leu Leu Asp Thr Asp Ala Ala Gly Asp Arg Leu Phe Ala

405 410 415

Thr Tyr Met Leu Asp Pro Ala Arg Gly Ser Phe Leu Ser Ala Gly Thr

420 425 430

Arg Met His Phe Pro Arg Gly Gly Ser Ala Pro Gly Pro Asp Pro Ser

435 440 445

Cys Trp Phe Asp Pro Asn Asn Ile Cys Gly Gly Gly Leu Glu Pro Gly

450 455 460

Leu Val Phe Leu Gly Phe Leu Leu Val Val Gly Met Gly Leu Ala Gly

465 470 475 480

Ala Phe Leu Ala His Tyr Val Arg His Arg Leu Leu His Met Gln Met

485 490 495

Val Ser Gly Pro Asn Lys Ile Ile Leu Thr Val Asp Asp Ile Thr Phe

500 505 510

Leu His Pro His Gly Gly Thr Ser Arg Lys Val Ala Gln Gly Ser Arg

515 520 525

Ser Ser Leu Gly Ala Arg Ser Met Ser Asp Ile Arg Ser Gly Pro Ser

530 535 540

Gln His Leu Asp Ser Pro Asn Ile Gly Val Tyr Glu Gly Asp Arg Val

545 550 555 560

Trp Leu Lys Lys Phe Pro Gly Asp Gln His Ile Ala Ile Arg Pro Ala

565 570 575

Thr Lys Thr Ala Phe Ser Lys Leu Gln Glu Leu Arg His Glu Asn Val

580 585 590

Ala Leu Tyr Leu Gly Leu Phe Leu Ala Arg Gly Ala Glu Gly Pro Ala

595 600 605

Ala Leu Trp Glu Gly Asn Leu Ala Val Val Ser Glu His Cys Thr Arg

610 615 620

Gly Ser Leu Gln Asp Leu Leu Ala Gln Arg Glu Ile Lys Leu Asp Trp

625 630 635 640

Met Phe Lys Ser Ser Leu Leu Leu Asp Leu Ile Lys Gly Ile Arg Tyr

645 650 655

Leu His His Arg Gly Val Ala His Gly Arg Leu Lys Ser Arg Asn Cys

660 665 670

Ile Val Asp Gly Arg Phe Val Leu Lys Ile Thr Asp His Gly His Gly

675 680 685

Arg Leu Leu Glu Ala Gln Lys Val Leu Pro Glu Pro Pro Arg Ala Glu

690 695 700

Asp Gln Leu Trp Thr Ala Pro Glu Leu Leu Arg Asp Pro Ala Leu Glu

705 710 715 720

Arg Arg Gly Thr Leu Ala Gly Asp Val Phe Ser Leu Ala Ile Ile Met

725 730 735

Gln Glu Val Val Cys Arg Ser Ala Pro Tyr Ala Met Leu Glu Leu Thr

740 745 750

Pro Glu Glu Val Val Gln Arg Val Arg Ser Pro Pro Pro Leu Cys Arg

755 760 765

Pro Leu Val Ser Met Asp Gln Ala Pro Val Glu Cys Ile Leu Leu Met

770 775 780

Lys Gln Cys Trp Ala Glu Gln Pro Glu Leu Arg Pro Ser Met Asp His

785 790 795 800

Thr Phe Asp Leu Phe Lys Asn Ile Asn Lys Gly Arg Lys Thr Asn Ile

805 810 815

Ile Asp Ser Met Leu Arg Met Leu Glu Gln Tyr Ser Ser Asn Leu Glu

820 825 830

Asp Leu Ile Arg Glu Arg Thr Glu Glu Leu Glu Leu Glu Lys Gln Lys

835 840 845

Thr Asp Arg Leu Leu Thr Gln Met Leu Pro Pro Ser Val Ala Glu Ala

850 855 860

Leu Lys Thr Gly Thr Pro Val Glu Pro Glu Tyr Phe Glu Gln Val Thr

865 870 875 880

Leu Tyr Phe Ser Asp Ile Val Gly Phe Thr Thr Ile Ser Ala Met Ser

885 890 895

Glu Pro Ile Glu Val Val Asp Leu Leu Asn Asp Leu Tyr Thr Leu Phe

900 905 910

Asp Ala Ile Ile Gly Ser His Asp Val Tyr Lys Val Glu Thr Ile Gly

915 920 925

Asp Ala Tyr Met Val Ala Ser Gly Leu Pro Gln Arg Asn Gly Gln Arg

930 935 940

His Ala Ala Glu Ile Ala Asn Met Ser Leu Asp Ile Leu Ser Ala Val

945 950 955 960

Gly Thr Phe Arg Met Arg His Met Pro Glu Val Pro Val Arg Ile Arg

965 970 975

Ile Gly Leu His Ser Gly Pro Cys Val Ala Gly Val Val Gly Leu Thr

980 985 990

Met Pro Arg Tyr Cys Leu Phe Gly Asp Thr Val Asn Thr Ala Ser Arg

995 1000 1005

Met Glu Ser Thr Gly Leu Pro Tyr Arg Ile His Val Asn Leu Ser

1010 1015 1020

Thr Val Gly Ile Leu Arg Ala Leu Asp Ser Gly Tyr Gln Val Glu

1025 1030 1035

Leu Arg Gly Arg Thr Glu Leu Lys Gly Lys Gly Ala Glu Asp Thr

1040 1045 1050

Phe Trp Leu Val Gly Arg Arg Gly Phe Asn Lys Pro Ile Pro Lys

1055 1060 1065

Pro Pro Asp Leu Gln Pro Gly Ser Ser Asn His Gly Ile Ser Leu

1070 1075 1080

Gln Glu Ile Pro Pro Glu Arg Arg Arg Lys Leu Glu Lys Ala Arg

1085 1090 1095

Pro Gly Gln Phe Ser

1100

<210> 26

<211> 676

<212> PRT

<213> 智人

<400> 26

Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu

1 5 10 15

Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu

20 25 30

Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro

35 40 45

Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser

50 55 60

Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu

65 70 75 80

Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp

85 90 95

Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser

100 105 110

Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp

115 120 125

Arg Gly Arg Arg Lys Lys Thr Lys Lys Lys Asp Ala Ile Val Val Asp

130 135 140

Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala Leu Pro

145 150 155 160

Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe Asp Glu

165 170 175

Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr Ser Ala

180 185 190

Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr Gly Phe

195 200 205

Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp Gln His

210 215 220

Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu Val Pro

225 230 235 240

Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu Val Arg

245 250 255

Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe Asp Arg

260 265 270

Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly Asn Leu

275 280 285

Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile Tyr Phe

290 295 300

Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val Tyr Pro

305 310 315 320

Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr Ile Tyr

325 330 335

Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu Thr Pro

340 345 350

Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp Phe Leu

355 360 365

Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly Ser Met

370 375 380

Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys Ile Asp

385 390 395 400

Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp Leu Glu

405 410 415

Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys Lys Thr

420 425 430

Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu Lys Ala

435 440 445

Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val Arg Ile

450 455 460

Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu Lys Leu

465 470 475 480

Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys Gly Asp

485 490 495

Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala Val Val

500 505 510

Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly Ser Tyr

515 520 525

Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser Gly Asn

530 535 540

Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu Phe Cys

545 550 555 560

Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro Glu Ala

565 570 575

Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys Asp Asn

580 585 590

Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys Asp Leu

595 600 605

Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu Gln Thr

610 615 620

Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met Lys Met

625 630 635 640

Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly Gly Asp

645 650 655

Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys Thr Glu

660 665 670

Asp Lys Gln Gln

675

<210> 27

<211> 694

<212> PRT

<213> 智人

<400> 27

Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu

1 5 10 15

Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu

20 25 30

Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro

35 40 45

Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser

50 55 60

Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu

65 70 75 80

Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp

85 90 95

Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser

100 105 110

Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp

115 120 125

Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser

130 135 140

Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val

145 150 155 160

Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala

165 170 175

Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe

180 185 190

Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr

195 200 205

Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr

210 215 220

Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp

225 230 235 240

Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu

245 250 255

Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu

260 265 270

Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe

275 280 285

Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly

290 295 300

Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile

305 310 315 320

Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val

325 330 335

Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr

340 345 350

Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu

355 360 365

Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp

370 375 380

Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly

385 390 395 400

Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys

405 410 415

Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp

420 425 430

Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys

435 440 445

Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu

450 455 460

Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val

465 470 475 480

Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu

485 490 495

Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys

500 505 510

Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala

515 520 525

Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly

530 535 540

Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser

545 550 555 560

Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu

565 570 575

Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro

580 585 590

Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys

595 600 605

Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys

610 615 620

Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu

625 630 635 640

Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met

645 650 655

Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly

660 665 670

Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys

675 680 685

Thr Glu Asp Lys Gln Gln

690

<210> 28

<211> 354

<212> PRT

<213> 智人

<400> 28

Met Gly Ser Gly Ala Ser Ala Glu Asp Lys Glu Leu Ala Lys Arg Ser

1 5 10 15

Lys Glu Leu Glu Lys Lys Leu Gln Glu Asp Ala Asp Lys Glu Ala Lys

20 25 30

Thr Val Lys Leu Leu Leu Leu Gly Ala Gly Glu Ser Gly Lys Ser Thr

35 40 45

Ile Val Lys Gln Met Lys Ile Ile His Gln Asp Gly Tyr Ser Pro Glu

50 55 60

Glu Cys Leu Glu Phe Lys Ala Ile Ile Tyr Gly Asn Val Leu Gln Ser

65 70 75 80

Ile Leu Ala Ile Ile Arg Ala Met Thr Thr Leu Gly Ile Asp Tyr Ala

85 90 95

Glu Pro Ser Cys Ala Asp Asp Gly Arg Gln Leu Asn Asn Leu Ala Asp

100 105 110

Ser Ile Glu Glu Gly Thr Met Pro Pro Glu Leu Val Glu Val Ile Arg

115 120 125

Arg Leu Trp Lys Asp Gly Gly Val Gln Ala Cys Phe Glu Arg Ala Ala

130 135 140

Glu Tyr Gln Leu Asn Asp Ser Ala Ser Tyr Tyr Leu Asn Gln Leu Glu

145 150 155 160

Arg Ile Thr Asp Pro Glu Tyr Leu Pro Ser Glu Gln Asp Val Leu Arg

165 170 175

Ser Arg Val Lys Thr Thr Gly Ile Ile Glu Thr Lys Phe Ser Val Lys

180 185 190

Asp Leu Asn Phe Arg Met Phe Asp Val Gly Gly Gln Arg Ser Glu Arg

195 200 205

Lys Lys Trp Ile His Cys Phe Glu Gly Val Thr Cys Ile Ile Phe Cys

210 215 220

Ala Ala Leu Ser Ala Tyr Asp Met Val Leu Val Glu Asp Asp Glu Val

225 230 235 240

Asn Arg Met His Glu Ser Leu His Leu Phe Asn Ser Ile Cys Asn His

245 250 255

Lys Phe Phe Ala Ala Thr Ser Ile Val Leu Phe Leu Asn Lys Lys Asp

260 265 270

Leu Phe Glu Glu Lys Ile Lys Lys Val His Leu Ser Ile Cys Phe Pro

275 280 285

Glu Tyr Asp Gly Asn Asn Ser Tyr Asp Asp Ala Gly Asn Tyr Ile Lys

290 295 300

Ser Gln Phe Leu Asp Leu Asn Met Arg Lys Asp Val Lys Glu Ile Tyr

305 310 315 320

Ser His Met Thr Cys Ala Thr Asp Thr Gln Asn Val Lys Phe Val Phe

325 330 335

Asp Ala Val Thr Asp Ile Ile Ile Lys Glu Asn Leu Lys Asp Cys Gly

340 345 350

Leu Phe

<210> 29

<211> 858

<212> PRT

<213> 智人

<400> 29

Met Gly Glu Ile Asn Gln Val Ala Val Glu Lys Tyr Leu Glu Glu Asn

1 5 10 15

Pro Gln Phe Ala Lys Glu Tyr Phe Asp Arg Lys Leu Arg Val Glu Val

20 25 30

Leu Gly Glu Ile Phe Lys Asn Ser Gln Val Pro Val Gln Ser Ser Met

35 40 45

Ser Phe Ser Glu Leu Thr Gln Val Glu Glu Ser Ala Leu Cys Leu Glu

50 55 60

Leu Leu Trp Thr Val Gln Glu Glu Gly Gly Thr Pro Glu Gln Gly Val

65 70 75 80

His Arg Ala Leu Gln Arg Leu Ala His Leu Leu Gln Ala Asp Arg Cys

85 90 95

Ser Met Phe Leu Cys Arg Ser Arg Asn Gly Ile Pro Glu Val Ala Ser

100 105 110

Arg Leu Leu Asp Val Thr Pro Thr Ser Lys Phe Glu Asp Asn Leu Val

115 120 125

Gly Pro Asp Lys Glu Val Val Phe Pro Leu Asp Ile Gly Ile Val Gly

130 135 140

Trp Ala Ala His Thr Lys Lys Thr His Asn Val Pro Asp Val Lys Lys

145 150 155 160

Asn Ser His Phe Ser Asp Phe Met Asp Lys Gln Thr Gly Tyr Val Thr

165 170 175

Lys Asn Leu Leu Ala Thr Pro Ile Val Val Gly Lys Glu Val Leu Ala

180 185 190

Val Ile Met Ala Val Asn Lys Val Asn Ala Ser Glu Phe Ser Lys Gln

195 200 205

Asp Glu Glu Val Phe Ser Lys Tyr Leu Asn Phe Val Ser Ile Ile Leu

210 215 220

Arg Leu His His Thr Ser Tyr Met Tyr Asn Ile Glu Ser Arg Arg Ser

225 230 235 240

Gln Ile Leu Met Trp Ser Ala Asn Lys Val Phe Glu Glu Leu Thr Asp

245 250 255

Val Glu Arg Gln Phe His Lys Ala Leu Tyr Thr Val Arg Ser Tyr Leu

260 265 270

Asn Cys Glu Arg Tyr Ser Ile Gly Leu Leu Asp Met Thr Lys Glu Lys

275 280 285

Glu Phe Tyr Asp Glu Trp Pro Ile Lys Leu Gly Glu Val Glu Pro Tyr

290 295 300

Lys Gly Pro Lys Thr Pro Asp Gly Arg Glu Val Asn Phe Tyr Lys Ile

305 310 315 320

Ile Asp Tyr Ile Leu His Gly Lys Glu Glu Ile Lys Val Ile Pro Thr

325 330 335

Pro Pro Ala Asp His Trp Thr Leu Ile Ser Gly Leu Pro Thr Tyr Val

340 345 350

Ala Glu Asn Gly Phe Ile Cys Asn Met Met Asn Ala Pro Ala Asp Glu

355 360 365

Tyr Phe Thr Phe Gln Lys Gly Pro Val Asp Glu Thr Gly Trp Val Ile

370 375 380

Lys Asn Val Leu Ser Leu Pro Ile Val Asn Lys Lys Glu Asp Ile Val

385 390 395 400

Gly Val Ala Thr Phe Tyr Asn Arg Lys Asp Gly Lys Pro Phe Asp Glu

405 410 415

His Asp Glu Tyr Ile Thr Glu Thr Leu Thr Gln Phe Leu Gly Trp Ser

420 425 430

Leu Leu Asn Thr Asp Thr Tyr Asp Lys Met Asn Lys Leu Glu Asn Arg

435 440 445

Lys Asp Ile Ala Gln Glu Met Leu Met Asn Gln Thr Lys Ala Thr Pro

450 455 460

Glu Glu Ile Lys Ser Ile Leu Lys Phe Gln Glu Lys Leu Asn Val Asp

465 470 475 480

Val Ile Asp Asp Cys Glu Glu Lys Gln Leu Val Ala Ile Leu Lys Glu

485 490 495

Asp Leu Pro Asp Pro Arg Ser Ala Glu Leu Tyr Glu Phe Arg Phe Ser

500 505 510

Asp Phe Pro Leu Thr Glu His Gly Leu Ile Lys Cys Gly Ile Arg Leu

515 520 525

Phe Phe Glu Ile Asn Val Val Glu Lys Phe Lys Val Pro Val Glu Val

530 535 540

Leu Thr Arg Trp Met Tyr Thr Val Arg Lys Gly Tyr Arg Ala Val Thr

545 550 555 560

Tyr His Asn Trp Arg His Gly Phe Asn Val Gly Gln Thr Met Phe Thr

565 570 575

Leu Leu Met Thr Gly Arg Leu Lys Lys Tyr Tyr Thr Asp Leu Glu Ala

580 585 590

Phe Ala Met Leu Ala Ala Ala Phe Cys His Asp Ile Asp His Arg Gly

595 600 605

Thr Asn Asn Leu Tyr Gln Met Lys Ser Thr Ser Pro Leu Ala Arg Leu

610 615 620

His Gly Ser Ser Ile Leu Glu Arg His His Leu Glu Tyr Ser Lys Thr

625 630 635 640

Leu Leu Gln Asp Glu Ser Leu Asn Ile Phe Gln Asn Leu Asn Lys Arg

645 650 655

Gln Phe Glu Thr Val Ile His Leu Phe Glu Val Ala Ile Ile Ala Thr

660 665 670

Asp Leu Ala Leu Tyr Phe Lys Lys Arg Thr Met Phe Gln Lys Ile Val

675 680 685

Asp Ala Cys Glu Gln Met Gln Thr Glu Glu Glu Ala Ile Lys Tyr Val

690 695 700

Thr Val Asp Pro Thr Lys Lys Glu Ile Ile Met Ala Met Met Met Thr

705 710 715 720

Ala Cys Asp Leu Ser Ala Ile Thr Lys Pro Trp Glu Val Gln Ser Gln

725 730 735

Val Ala Leu Met Val Ala Asn Glu Phe Trp Glu Gln Gly Asp Leu Glu

740 745 750

Arg Thr Val Leu Gln Gln Gln Pro Ile Pro Met Met Asp Arg Asn Lys

755 760 765

Arg Asp Glu Leu Pro Lys Leu Gln Val Gly Phe Ile Asp Phe Val Cys

770 775 780

Thr Phe Val Tyr Lys Glu Phe Ser Arg Phe His Lys Glu Ile Thr Pro

785 790 795 800

Met Leu Ser Gly Leu Gln Asn Asn Arg Val Glu Trp Lys Ser Leu Ala

805 810 815

Asp Glu Tyr Asp Ala Lys Met Lys Val Ile Glu Glu Glu Ala Lys Lys

820 825 830

Gln Glu Gly Gly Ala Glu Lys Ala Ala Glu Asp Ser Gly Gly Gly Asp

835 840 845

Asp Lys Lys Ser Lys Thr Cys Leu Met Leu

850 855

<210> 30

<211> 83

<212> PRT

<213> 智人

<400> 30

Met Ser Asp Asn Thr Thr Leu Pro Ala Pro Ala Ser Asn Gln Gly Pro

1 5 10 15

Thr Thr Pro Arg Lys Gly Pro Pro Lys Phe Lys Gln Arg Gln Thr Arg

20 25 30

Gln Phe Lys Ser Lys Pro Pro Lys Lys Gly Val Lys Gly Phe Gly Asp

35 40 45

Asp Ile Pro Gly Met Glu Gly Leu Gly Thr Asp Ile Thr Val Ile Cys

50 55 60

Pro Trp Glu Ala Phe Ser His Leu Glu Leu His Glu Leu Ala Gln Phe

65 70 75 80

Gly Ile Ile

<210> 31

<211> 299

<212> PRT

<213> 智人

<400> 31

Met Met Ala Tyr Met Asn Pro Gly Pro His Tyr Ser Val Asn Ala Leu

1 5 10 15

Ala Leu Ser Gly Pro Ser Val Asp Leu Met His Gln Ala Val Pro Tyr

20 25 30

Pro Ser Ala Pro Arg Lys Gln Arg Arg Glu Arg Thr Thr Phe Thr Arg

35 40 45

Ser Gln Leu Glu Glu Leu Glu Ala Leu Phe Ala Lys Thr Gln Tyr Pro

50 55 60

Asp Val Tyr Ala Arg Glu Glu Val Ala Leu Lys Ile Asn Leu Pro Glu

65 70 75 80

Ser Arg Val Gln Val Trp Phe Lys Asn Arg Arg Ala Lys Cys Arg Gln

85 90 95

Gln Arg Gln Gln Gln Lys Gln Gln Gln Gln Pro Pro Gly Gly Gln Ala

100 105 110

Lys Ala Arg Pro Ala Lys Arg Lys Ala Gly Thr Ser Pro Arg Pro Ser

115 120 125

Thr Asp Val Cys Pro Asp Pro Leu Gly Ile Ser Asp Ser Tyr Ser Pro

130 135 140

Pro Leu Pro Gly Pro Ser Gly Ser Pro Thr Thr Ala Val Ala Thr Val

145 150 155 160

Ser Ile Trp Ser Pro Ala Ser Glu Ser Pro Leu Pro Glu Ala Gln Arg

165 170 175

Ala Gly Leu Val Ala Ser Gly Pro Ser Leu Thr Ser Ala Pro Tyr Ala

180 185 190

Met Thr Tyr Ala Pro Ala Ser Ala Phe Cys Ser Ser Pro Ser Ala Tyr

195 200 205

Gly Ser Pro Ser Ser Tyr Phe Ser Gly Leu Asp Pro Tyr Leu Ser Pro

210 215 220

Met Val Pro Gln Leu Gly Gly Pro Ala Leu Ser Pro Leu Ser Gly Pro

225 230 235 240

Ser Val Gly Pro Ser Leu Ala Gln Ser Pro Thr Ser Leu Ser Gly Gln

245 250 255

Ser Tyr Gly Ala Tyr Ser Pro Val Asp Ser Leu Glu Phe Lys Asp Pro

260 265 270

Thr Gly Thr Trp Lys Phe Thr Tyr Asn Pro Met Asp Pro Leu Asp Tyr

275 280 285

Lys Asp Gln Ser Ala Trp Lys Phe Gln Ile Leu

290 295

<210> 32

<211> 809

<212> PRT

<213> 智人

<400> 32

Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu

1 5 10 15

Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His

20 25 30

Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly

35 40 45

Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu

50 55 60

Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly

65 70 75 80

Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly

85 90 95

Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn

100 105 110

Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala

115 120 125

Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala

130 135 140

Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala

145 150 155 160

Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser

165 170 175

Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val

180 185 190

Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn

195 200 205

Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu

210 215 220

Val Thr Leu Ala Tyr Asn Trp Asn Cys Trp Phe Ile Pro Leu Arg Leu

225 230 235 240

Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala

245 250 255

Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln

260 265 270

Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn

275 280 285

Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val

290 295 300

Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn

305 310 315 320

Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu

325 330 335

Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg

340 345 350

Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala

355 360 365

Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg

370 375 380

Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp

385 390 395 400

Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr

405 410 415

Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe

420 425 430

Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala

435 440 445

Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala

450 455 460

Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg

465 470 475 480

Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser

485 490 495

Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile

500 505 510

Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys

515 520 525

Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu

530 535 540

Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu

545 550 555 560

Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp

565 570 575

Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu

580 585 590

Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val

595 600 605

Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu

610 615 620

Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys

625 630 635 640

Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr

645 650 655

Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr

660 665 670

Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu

675 680 685

Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu

690 695 700

Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln

705 710 715 720

Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu

725 730 735

Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp

740 745 750

Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His

755 760 765

Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu

770 775 780

Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr

785 790 795 800

Ile Glu Val Lys Glu Lys Ala Lys Gln

805

<210> 33

<211> 610

<212> PRT

<213> 智人

<400> 33

Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn Ser Ile

1 5 10 15

Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu Val Thr

20 25 30

Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu Val Phe

35 40 45

Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala Asp Ile

50 55 60

Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln Pro Arg

65 70 75 80

Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn Glu Leu

85 90 95

Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val Ala Ser

100 105 110

Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn Pro Met

115 120 125

Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu Phe Asn

130 135 140

His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg Val Ile

145 150 155 160

Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala Cys Val

165 170 175

Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg Trp Val

180 185 190

Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp Ala Val

195 200 205

Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr Leu Phe

210 215 220

Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe Val Phe

225 230 235 240

Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala Thr Ala

245 250 255

Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala Tyr Met

260 265 270

Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg Thr Trp

275 280 285

Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser Asp Leu

290 295 300

Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile Asp Val

305 310 315 320

Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys Asp Thr

325 330 335

Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu Tyr Leu

340 345 350

Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu Met Tyr

355 360 365

Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp Gly Thr

370 375 380

Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Leu Leu Ala Ala Gly

385 390 395 400

Gly Gly Asn Arg Arg Thr Ala Asn Val Val Ala His Gly Phe Ala Asn

405 410 415

Leu Leu Thr Leu Asp Lys Lys Thr Leu Gln Glu Ile Leu Val His Tyr

420 425 430

Pro Asp Ser Glu Arg Ile Leu Met Lys Lys Ala Arg Val Leu Leu Lys

435 440 445

Gln Lys Ala Lys Thr Ala Glu Ala Thr Pro Pro Arg Lys Asp Leu Ala

450 455 460

Leu Leu Phe Pro Pro Lys Glu Glu Thr Pro Lys Leu Phe Lys Thr Leu

465 470 475 480

Leu Gly Gly Thr Gly Lys Ala Ser Leu Ala Arg Leu Leu Lys Leu Lys

485 490 495

Arg Glu Gln Ala Ala Gln Lys Lys Glu Asn Ser Glu Gly Gly Glu Glu

500 505 510

Glu Gly Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gln

515 520 525

Lys Glu Asn Glu Asp Lys Gly Lys Glu Asn Glu Asp Lys Asp Lys Gly

530 535 540

Arg Glu Pro Glu Glu Lys Pro Leu Asp Arg Pro Glu Cys Thr Ala Ser

545 550 555 560

Pro Ile Ala Val Glu Glu Glu Pro His Ser Val Arg Arg Thr Val Leu

565 570 575

Pro Arg Gly Thr Ser Arg Gln Ser Leu Ile Ile Ser Met Ala Pro Ser

580 585 590

Ala Glu Gly Gly Glu Glu Val Leu Thr Ile Glu Val Lys Glu Lys Ala

595 600 605

Lys Gln

610

<210> 34

<211> 7100

<212> DNA

<213> 智人

<400> 34

gacatactga gaataaatcc aaagacatta gtttctttgc acgaaatgag gttacatatc 60

cagtgacatt tatttgagct atttaaacaa cttaaacatc tttttctttt cttaataagg 120

gacgtttcaa gttgtggtct cagccaaaat gagtgatacc ccttctactg gtttttccat 180

cattcatcct acgtcttctg aaggtcaagt tccaccccct cgccatttga gcctcactca 240

tcctgttgtg gccaagcgaa tcagtttcta caagagcgga gacccccaat tcggcggggt 300

cagggtggtg gtcaaccctc gctcctttaa gtcctttgat gctctgctgg ataacttgtc 360

caggaaggtg cccctccctt ttggagtgag gaacatcagc acccctcggg gcaggcacag 420

catcacgcgc ctggaggagc tggaggacgg cgagtcctac ctatgttccc acggcaggaa 480

ggtgcagcct gtagacctgg acaaagcccg tcggcgcccg cggccctggc tcagcagccg 540

ggccattagc gcgcactcac cgccccaccc cgtagccgtc gctgctcccg gcatgccccg 600

ccccccacgg agcctagtgg tcttcaggaa tggcgacccg aagacgaggc gtgcggttct 660

tctgagcagg agggtcaccc agagcttcga ggcatttcta cagcacctga cagaggtcat 720

gcagcgccct gtggtcaagc tgtacgctac ggacggaagg agggttccca gcctccaggc 780

agtgatcctg agctctggag ctgtggtggc ggcaggaagg gagccattta aaccaggaaa 840

ttatgacatc caaaaatact tgcttcctgc tagattacca gggatctctc agcgtgtgta 900

ccccaaggga aatgcaaagt cagaaagcag aaagataagc acacatatgt cttcaagctc 960

aaggtcccag atttattctg tttcttctga gaaaacacat aataatgatt gctacttaga 1020

ctattctttt gttcctgaaa agtacttggc cttagaaaag aatgattctc agaatttacc 1080

aatatatcct tctgaagatg atattgagaa atcaattatt tttaatcaag acggcactat 1140

gacagttgag atgaaagttc gattcagaat aaaagaggaa gaaaccataa aatggacaac 1200

tactgtcagt aaaactggtc cttctaataa tgatgaaaag agtgagatga gttttccagg 1260

aagaacagaa agtcgatcat ctggtttaaa gcttgcagca tgttcattct ctgcagatgt 1320

gtcacctatg gagcgaagca gtaatcaaga gggcagtttg gcagaggaga taaacattca 1380

aatgacagat caagtggctg aaacttgcag ttctgctagt tgggagaatg ctactgtgga 1440

cacagatatc atccagggaa ctcaagacca agcaaagcat cgtttttata ggccccctac 1500

acctggacta agaagagtga gacaaaagaa atctgtgatt ggcagtgtga ccttagtatc 1560

tgaaactgag gttcaagaga aaatgattgg acagttttca tatagtgaag aaagggaaag 1620

tggggaaaac aagtctgagt atcacatgtt tacacattct tgcagtaaaa tgtcatcagt 1680

atctaacaaa ccagtacttg ttcagatcaa taacaatgat caaatggagg agtcatcatt 1740

agaaagaaaa aaggaaaaca gtctgcttaa gtcaagtgca ataagtgctg gtgttataga 1800

aattacaagt cagaagatgt tagagatgtc acataataat ggtttgccat caactatatc 1860

aaataactca attgtggagg aagatgtagt tgattgtgtg gtattggaca acaaaactgg 1920

tatcaagaac ttcaaaactt atggtaacac caatgatagg ttcagtccta tttcagcaga 1980

tgcaacccat ttttcaagta ataactctgg aactgacaaa aatatttctg aggctccagc 2040

ttcagaagca tcctctactg tcactgcaag aattgacaga ctaattaatg aatttgctca 2100

gtgtggttta acaaaacttc caaaaaatga aaagaagatt ttgtcatctg ttgccagcaa 2160

aaagaagaaa aaatctcgac agcaagcaat aaattccagg tatcaagatg gacagcttgc 2220

aaccaaagga attcttaata agaatgagag aataaacaca aaaggtagaa ttacaaagga 2280

aatgatagtg caagattcag atagtcccct taaaggaggg atactttgtg aggaagacct 2340

ccagaaaagt gatactgtaa ttgaatcaaa tactttttgt tccaaaagta atctcaattc 2400

cacgatttcc aagaatttcc atagaaataa attaaatact actcaaaatt ccaaggttca 2460

aggactttta accaaaagaa aatctagatc actaaataaa ataagcttag gagcacctaa 2520

aaaaagagaa atcggtcaaa gagataaagt gtttcctcac aatgaatcta aatattgcaa 2580

aagtactttt gaaaacaaaa gtttatttca tgtatttaac atccttgagc aaaaacccaa 2640

agatttttat gcaccgcaat ctcaagcaga agtggcatct gggtatttga gaggaatggc 2700

aaagaagagt ttagtttcaa aagttactga ttcacacata actttaaaaa gccagaaaaa 2760

acgtaaaggg gataaagtga aagcaagtgc tattttaagt aaacaacatg ctacaaccag 2820

ggcaaattct ttagcttctt tgaaaaaacc tgattttcct gaggctattg ctcatcattc 2880

aattcaaaat tatatacaga gttggttgca gaacataaat ccatatccaa ctttaaagcc 2940

tataaaatca gctccagtat gtagaaatga aacgagtgtg gtaaattgta gcaataatag 3000

tttttcaggg aatgatcccc atacaaattc tggaaaaata agtaattttg ttatggaaag 3060

taataagcac ataactaaaa ttgccggttt gacaggagat aatctatgta aagagggaga 3120

taagtctttt attgccaatg acactggtga agaagatctc catgagacac aggttggatc 3180

tctgaatgat gcttatttgg ttcccctgca tgaacactgt actttgtcac agtcagctat 3240

taatgatcat aatactaaaa gtcatatagc tgctgaaaaa tcaggaccag agaaaaaact 3300

tgtttaccag gaaataaacc tagctagaaa aaggcaaagt gtagaggctg ccattcaagt 3360

agatcctata gaagaggaaa ctccaaaaga cctcttacca gtcctgatgc ttcaccaatt 3420

gcaagcttca gttcctggta ttcacaagac tcagaatgga gttgttcaaa tgccaggttc 3480

acttgcaggt gttccctttc attctgcaat atgtaattca tccactaatc tccttctagc 3540

ttggctcttg gtgctaaacc taaagggaag tatgaatagc ttctgtcaag ttgatgctca 3600

caaggctacc aacaaatctt cagaaacact tgcattgttg gagattctaa agcacatagc 3660

tatcacagag gaagctgatg acttgaaagc tgctgttgcc aatttagtgg agtcaactac 3720

aagccacttt ggactcagtg agaaagaaca agacatggtt ccaatagatc tttctgcaaa 3780

ttgttccacg gtcaacattc agagtgttcc taagtgcagt gaaaatgaaa gaacacaagg 3840

aatctcctct ttggatggag gttgctctgc cagtgaggca tgtgcccctg aagtctgtgt 3900

tttggaagtg acttgctctc catgtgagat gtgcactgta aataaggctt attctccaaa 3960

agagacatgt aaccccagtg acactttttt tcctagtgat ggttatggtg tggatcagac 4020

ttctatgaat aaggcttgtt tcctaggaga ggtctgttca cttactgata ctgtgttttc 4080

tgataaggct tgtgctcaaa aggagaacca tacctatgag ggagcttgcc caattgatga 4140

gacctacgtt cctgtcaatg tctgcaatac cattgacttt ttaaactcca aagaaaacac 4200

atatactgat aacttggatt caactgaaga gttagaaaga ggtgatgaca ttcagaaaga 4260

tctaaatatt ttgacagacc ctgaatataa aaatggattt aatacattgg tgtcacatca 4320

aaatgtcagt aatttaagct cctgtggcct ttgcctaagt gaaaaagaag cagaacttga 4380

taagaaacat agttctctag atgattttga aaattgttca ctaaggaagt ttcaggatga 4440

aaatgcatat acttcctttg atatggaaga accacggact tctgaagaac caggctcaat 4500

aaccaacagc atgacatcaa gtgaaagaaa catttcagaa ttggaatctt ttgaagaatt 4560

agaaaaccat gacactgata tctttaatac agtggtaaat ggaggagagc aagccactga 4620

agaattaatc caagaagagg tagaggctag taaaacttta gaattgatag acatctctag 4680

taagaatatt atggaagaaa aaagaatgaa cggtataatt tatgaaataa tcagtaagag 4740

gctggcaaca ccaccatctt tagatttttg ctatgattct aagcaaaata gtgaaaagga 4800

gaccaatgaa ggagaaacta agatggtaaa aatgatggtg aaaactatgg aaactggaag 4860

ttattcagag tcctctcctg atttaaaaaa atgcatcaaa agtccagtga cttctgattg 4920

gtcagactat cggcctgaca gtgacagtga gcagccatat aaaacatcca gtgatgatcc 4980

caatgacagt ggcgaactta cccaagagaa agaatataac ataggatttg ttaaaagggc 5040

aatagaaaaa ctgtacggta aagcagatat tatcaaacca tctttttttc ctgggtctac 5100

ccgcaaatct caggtttgtc cttataattc tgtggaattt cagtgttcca ggaaagcaag 5160

tctttatgat tctgaagggc agtcatttgg ctcttctgaa caggtatcta gtagttcatc 5220

tatgttgcag gaattccagg aggaaagaca agataagtgt gatgttagtg ctgtgaggga 5280

caattattgt aggggtgaca ttgtagaacc tggtacaaaa caaaatgatg atagcagaat 5340

cctcacagac atagaggaag gagtactgat tgacaaaggc aaatggcttc tgaaagaaaa 5400

tcatttgcta aggatgtcat ctgaaaatcc tggcatgtgt ggcaatgcag acaccacatc 5460

agtggacacc ctacttgata ataacagcag tgaggtacca tattcacatt ttggtaattt 5520

ggccccaggc ccaacgatgg atgaactctc ctcttcagaa ctcgaggaac tgactcaacc 5580

ccttgaacta aaatgcaatt actttaacat gcctcatggt agtgactcag aaccttttca 5640

tgaggacttg ctggatgttc gcaatgaaac ctgtgccaag gaaagaatag caaatcatca 5700

tacagaggag aagggtagtc atcagtcaga aagagtatgc acatctgtca ctcattcctt 5760

tatttctgct ggtaacaaag tctaccctgt ctctgatgat gctattaaaa accaaccatt 5820

gcctggcagt aatatgattc atggtacact tcaggaagct gactctttgg ataaactgta 5880

tgctctttgt ggtcaacatt gcccaatact aactgttatt atccaaccca tgaatgagga 5940

agaccgagga tttgcatatc gcaaagaatc tgatattgaa aatttcttgg gtttttattt 6000

atggatgaaa atacacccat atttacttca gacagacaaa aatgtgttca gggaagagaa 6060

caataaagca agtatgagac aaaatcttat tgataatgcc attggtgata tatttgatca 6120

gttttatttc agtaacacat ttgacttgat gggtaaaaga agaaaacaaa aaagaattaa 6180

cttcttgggg ttagaggaag aaggtaattt aaagaaattt caaccagatt tgaaggaaag 6240

gttttgtatg aatttcttgc acacatcatt gttagttgtg ggtaatgtgg attcaaatac 6300

acaagacctc agcggtcaga caaatgaaat ctttaaagca gtcgatgaga ataacaactt 6360

attaaataac agattccagg gctcaagaac aaatctcaac caagtagtaa gagaaaatat 6420

caactgtcat tacttctttg aaatgcttgg tcaagcttgc ctcttagata tttgccaagt 6480

tgagacctcc ttaaatatta gcaacagaaa tattttagaa ctttgtatgt ttgagggtga 6540

aaatcttttc atttgggaag aggaagacat attaaattta actgatcttg aaagcagtag 6600

agaacaagaa gatttataat ttcaatatca gcacactcat tctttgtcaa ttcatttttt 6660

cccatgagat gaagcacatg tgacgaatac ggactagata acctctaaga attttccact 6720

tcttcaaaat gaacttactc tagaaagctt acccttggat aaccagtttg actttcataa 6780

tgtctctgtt ttttgttttt ccaacaatta cagactcagg ttctcttatt ttggaagttt 6840

ctatctggtt ttgttctgaa cttacatttt tttttttttt ggtatctatg attttttttg 6900

ctcagggcat caaaatgtgc taaggacaag aattatatcc tttttaaaaa atgttgttag 6960

cttggtgtaa aatgtatatt gactgtattg gtgaataaat tgaatagaca taacctcaaa 7020

gtacttcact tattcttttt aactactgat ttgataaaaa gtatgattat aagatatcca 7080

cgacaatctc atagtttctt 7100

<210> 35

<211> 2156

<212> PRT

<213> 智人

<400> 35

Met Ser Asp Thr Pro Ser Thr Gly Phe Ser Ile Ile His Pro Thr Ser

1 5 10 15

Ser Glu Gly Gln Val Pro Pro Pro Arg His Leu Ser Leu Thr His Pro

20 25 30

Val Val Ala Lys Arg Ile Ser Phe Tyr Lys Ser Gly Asp Pro Gln Phe

35 40 45

Gly Gly Val Arg Val Val Val Asn Pro Arg Ser Phe Lys Ser Phe Asp

50 55 60

Ala Leu Leu Asp Asn Leu Ser Arg Lys Val Pro Leu Pro Phe Gly Val

65 70 75 80

Arg Asn Ile Ser Thr Pro Arg Gly Arg His Ser Ile Thr Arg Leu Glu

85 90 95

Glu Leu Glu Asp Gly Glu Ser Tyr Leu Cys Ser His Gly Arg Lys Val

100 105 110

Gln Pro Val Asp Leu Asp Lys Ala Arg Arg Arg Pro Arg Pro Trp Leu

115 120 125

Ser Ser Arg Ala Ile Ser Ala His Ser Pro Pro His Pro Val Ala Val

130 135 140

Ala Ala Pro Gly Met Pro Arg Pro Pro Arg Ser Leu Val Val Phe Arg

145 150 155 160

Asn Gly Asp Pro Lys Thr Arg Arg Ala Val Leu Leu Ser Arg Arg Val

165 170 175

Thr Gln Ser Phe Glu Ala Phe Leu Gln His Leu Thr Glu Val Met Gln

180 185 190

Arg Pro Val Val Lys Leu Tyr Ala Thr Asp Gly Arg Arg Val Pro Ser

195 200 205

Leu Gln Ala Val Ile Leu Ser Ser Gly Ala Val Val Ala Ala Gly Arg

210 215 220

Glu Pro Phe Lys Pro Gly Asn Tyr Asp Ile Gln Lys Tyr Leu Leu Pro

225 230 235 240

Ala Arg Leu Pro Gly Ile Ser Gln Arg Val Tyr Pro Lys Gly Asn Ala

245 250 255

Lys Ser Glu Ser Arg Lys Ile Ser Thr His Met Ser Ser Ser Ser Arg

260 265 270

Ser Gln Ile Tyr Ser Val Ser Ser Glu Lys Thr His Asn Asn Asp Cys

275 280 285

Tyr Leu Asp Tyr Ser Phe Val Pro Glu Lys Tyr Leu Ala Leu Glu Lys

290 295 300

Asn Asp Ser Gln Asn Leu Pro Ile Tyr Pro Ser Glu Asp Asp Ile Glu

305 310 315 320

Lys Ser Ile Ile Phe Asn Gln Asp Gly Thr Met Thr Val Glu Met Lys

325 330 335

Val Arg Phe Arg Ile Lys Glu Glu Glu Thr Ile Lys Trp Thr Thr Thr

340 345 350

Val Ser Lys Thr Gly Pro Ser Asn Asn Asp Glu Lys Ser Glu Met Ser

355 360 365

Phe Pro Gly Arg Thr Glu Ser Arg Ser Ser Gly Leu Lys Leu Ala Ala

370 375 380

Cys Ser Phe Ser Ala Asp Val Ser Pro Met Glu Arg Ser Ser Asn Gln

385 390 395 400

Glu Gly Ser Leu Ala Glu Glu Ile Asn Ile Gln Met Thr Asp Gln Val

405 410 415

Ala Glu Thr Cys Ser Ser Ala Ser Trp Glu Asn Ala Thr Val Asp Thr

420 425 430

Asp Ile Ile Gln Gly Thr Gln Asp Gln Ala Lys His Arg Phe Tyr Arg

435 440 445

Pro Pro Thr Pro Gly Leu Arg Arg Val Arg Gln Lys Lys Ser Val Ile

450 455 460

Gly Ser Val Thr Leu Val Ser Glu Thr Glu Val Gln Glu Lys Met Ile

465 470 475 480

Gly Gln Phe Ser Tyr Ser Glu Glu Arg Glu Ser Gly Glu Asn Lys Ser

485 490 495

Glu Tyr His Met Phe Thr His Ser Cys Ser Lys Met Ser Ser Val Ser

500 505 510

Asn Lys Pro Val Leu Val Gln Ile Asn Asn Asn Asp Gln Met Glu Glu

515 520 525

Ser Ser Leu Glu Arg Lys Lys Glu Asn Ser Leu Leu Lys Ser Ser Ala

530 535 540

Ile Ser Ala Gly Val Ile Glu Ile Thr Ser Gln Lys Met Leu Glu Met

545 550 555 560

Ser His Asn Asn Gly Leu Pro Ser Thr Ile Ser Asn Asn Ser Ile Val

565 570 575

Glu Glu Asp Val Val Asp Cys Val Val Leu Asp Asn Lys Thr Gly Ile

580 585 590

Lys Asn Phe Lys Thr Tyr Gly Asn Thr Asn Asp Arg Phe Ser Pro Ile

595 600 605

Ser Ala Asp Ala Thr His Phe Ser Ser Asn Asn Ser Gly Thr Asp Lys

610 615 620

Asn Ile Ser Glu Ala Pro Ala Ser Glu Ala Ser Ser Thr Val Thr Ala

625 630 635 640

Arg Ile Asp Arg Leu Ile Asn Glu Phe Ala Gln Cys Gly Leu Thr Lys

645 650 655

Leu Pro Lys Asn Glu Lys Lys Ile Leu Ser Ser Val Ala Ser Lys Lys

660 665 670

Lys Lys Lys Ser Arg Gln Gln Ala Ile Asn Ser Arg Tyr Gln Asp Gly

675 680 685

Gln Leu Ala Thr Lys Gly Ile Leu Asn Lys Asn Glu Arg Ile Asn Thr

690 695 700

Lys Gly Arg Ile Thr Lys Glu Met Ile Val Gln Asp Ser Asp Ser Pro

705 710 715 720

Leu Lys Gly Gly Ile Leu Cys Glu Glu Asp Leu Gln Lys Ser Asp Thr

725 730 735

Val Ile Glu Ser Asn Thr Phe Cys Ser Lys Ser Asn Leu Asn Ser Thr

740 745 750

Ile Ser Lys Asn Phe His Arg Asn Lys Leu Asn Thr Thr Gln Asn Ser

755 760 765

Lys Val Gln Gly Leu Leu Thr Lys Arg Lys Ser Arg Ser Leu Asn Lys

770 775 780

Ile Ser Leu Gly Ala Pro Lys Lys Arg Glu Ile Gly Gln Arg Asp Lys

785 790 795 800

Val Phe Pro His Asn Glu Ser Lys Tyr Cys Lys Ser Thr Phe Glu Asn

805 810 815

Lys Ser Leu Phe His Val Phe Asn Ile Leu Glu Gln Lys Pro Lys Asp

820 825 830

Phe Tyr Ala Pro Gln Ser Gln Ala Glu Val Ala Ser Gly Tyr Leu Arg

835 840 845

Gly Met Ala Lys Lys Ser Leu Val Ser Lys Val Thr Asp Ser His Ile

850 855 860

Thr Leu Lys Ser Gln Lys Lys Arg Lys Gly Asp Lys Val Lys Ala Ser

865 870 875 880

Ala Ile Leu Ser Lys Gln His Ala Thr Thr Arg Ala Asn Ser Leu Ala

885 890 895

Ser Leu Lys Lys Pro Asp Phe Pro Glu Ala Ile Ala His His Ser Ile

900 905 910

Gln Asn Tyr Ile Gln Ser Trp Leu Gln Asn Ile Asn Pro Tyr Pro Thr

915 920 925

Leu Lys Pro Ile Lys Ser Ala Pro Val Cys Arg Asn Glu Thr Ser Val

930 935 940

Val Asn Cys Ser Asn Asn Ser Phe Ser Gly Asn Asp Pro His Thr Asn

945 950 955 960

Ser Gly Lys Ile Ser Asn Phe Val Met Glu Ser Asn Lys His Ile Thr

965 970 975

Lys Ile Ala Gly Leu Thr Gly Asp Asn Leu Cys Lys Glu Gly Asp Lys

980 985 990

Ser Phe Ile Ala Asn Asp Thr Gly Glu Glu Asp Leu His Glu Thr Gln

995 1000 1005

Val Gly Ser Leu Asn Asp Ala Tyr Leu Val Pro Leu His Glu His

1010 1015 1020

Cys Thr Leu Ser Gln Ser Ala Ile Asn Asp His Asn Thr Lys Ser

1025 1030 1035

His Ile Ala Ala Glu Lys Ser Gly Pro Glu Lys Lys Leu Val Tyr

1040 1045 1050

Gln Glu Ile Asn Leu Ala Arg Lys Arg Gln Ser Val Glu Ala Ala

1055 1060 1065

Ile Gln Val Asp Pro Ile Glu Glu Glu Thr Pro Lys Asp Leu Leu

1070 1075 1080

Pro Val Leu Met Leu His Gln Leu Gln Ala Ser Val Pro Gly Ile

1085 1090 1095

His Lys Thr Gln Asn Gly Val Val Gln Met Pro Gly Ser Leu Ala

1100 1105 1110

Gly Val Pro Phe His Ser Ala Ile Cys Asn Ser Ser Thr Asn Leu

1115 1120 1125

Leu Leu Ala Trp Leu Leu Val Leu Asn Leu Lys Gly Ser Met Asn

1130 1135 1140

Ser Phe Cys Gln Val Asp Ala His Lys Ala Thr Asn Lys Ser Ser

1145 1150 1155

Glu Thr Leu Ala Leu Leu Glu Ile Leu Lys His Ile Ala Ile Thr

1160 1165 1170

Glu Glu Ala Asp Asp Leu Lys Ala Ala Val Ala Asn Leu Val Glu

1175 1180 1185

Ser Thr Thr Ser His Phe Gly Leu Ser Glu Lys Glu Gln Asp Met

1190 1195 1200

Val Pro Ile Asp Leu Ser Ala Asn Cys Ser Thr Val Asn Ile Gln

1205 1210 1215

Ser Val Pro Lys Cys Ser Glu Asn Glu Arg Thr Gln Gly Ile Ser

1220 1225 1230

Ser Leu Asp Gly Gly Cys Ser Ala Ser Glu Ala Cys Ala Pro Glu

1235 1240 1245

Val Cys Val Leu Glu Val Thr Cys Ser Pro Cys Glu Met Cys Thr

1250 1255 1260

Val Asn Lys Ala Tyr Ser Pro Lys Glu Thr Cys Asn Pro Ser Asp

1265 1270 1275

Thr Phe Phe Pro Ser Asp Gly Tyr Gly Val Asp Gln Thr Ser Met

1280 1285 1290

Asn Lys Ala Cys Phe Leu Gly Glu Val Cys Ser Leu Thr Asp Thr

1295 1300 1305

Val Phe Ser Asp Lys Ala Cys Ala Gln Lys Glu Asn His Thr Tyr

1310 1315 1320

Glu Gly Ala Cys Pro Ile Asp Glu Thr Tyr Val Pro Val Asn Val

1325 1330 1335

Cys Asn Thr Ile Asp Phe Leu Asn Ser Lys Glu Asn Thr Tyr Thr

1340 1345 1350

Asp Asn Leu Asp Ser Thr Glu Glu Leu Glu Arg Gly Asp Asp Ile

1355 1360 1365

Gln Lys Asp Leu Asn Ile Leu Thr Asp Pro Glu Tyr Lys Asn Gly

1370 1375 1380

Phe Asn Thr Leu Val Ser His Gln Asn Val Ser Asn Leu Ser Ser

1385 1390 1395

Cys Gly Leu Cys Leu Ser Glu Lys Glu Ala Glu Leu Asp Lys Lys

1400 1405 1410

His Ser Ser Leu Asp Asp Phe Glu Asn Cys Ser Leu Arg Lys Phe

1415 1420 1425

Gln Asp Glu Asn Ala Tyr Thr Ser Phe Asp Met Glu Glu Pro Arg

1430 1435 1440

Thr Ser Glu Glu Pro Gly Ser Ile Thr Asn Ser Met Thr Ser Ser

1445 1450 1455

Glu Arg Asn Ile Ser Glu Leu Glu Ser Phe Glu Glu Leu Glu Asn

1460 1465 1470

His Asp Thr Asp Ile Phe Asn Thr Val Val Asn Gly Gly Glu Gln

1475 1480 1485

Ala Thr Glu Glu Leu Ile Gln Glu Glu Val Glu Ala Ser Lys Thr

1490 1495 1500

Leu Glu Leu Ile Asp Ile Ser Ser Lys Asn Ile Met Glu Glu Lys

1505 1510 1515

Arg Met Asn Gly Ile Ile Tyr Glu Ile Ile Ser Lys Arg Leu Ala

1520 1525 1530

Thr Pro Pro Ser Leu Asp Phe Cys Tyr Asp Ser Lys Gln Asn Ser

1535 1540 1545

Glu Lys Glu Thr Asn Glu Gly Glu Thr Lys Met Val Lys Met Met

1550 1555 1560

Val Lys Thr Met Glu Thr Gly Ser Tyr Ser Glu Ser Ser Pro Asp

1565 1570 1575

Leu Lys Lys Cys Ile Lys Ser Pro Val Thr Ser Asp Trp Ser Asp

1580 1585 1590

Tyr Arg Pro Asp Ser Asp Ser Glu Gln Pro Tyr Lys Thr Ser Ser

1595 1600 1605

Asp Asp Pro Asn Asp Ser Gly Glu Leu Thr Gln Glu Lys Glu Tyr

1610 1615 1620

Asn Ile Gly Phe Val Lys Arg Ala Ile Glu Lys Leu Tyr Gly Lys

1625 1630 1635

Ala Asp Ile Ile Lys Pro Ser Phe Phe Pro Gly Ser Thr Arg Lys

1640 1645 1650

Ser Gln Val Cys Pro Tyr Asn Ser Val Glu Phe Gln Cys Ser Arg

1655 1660 1665

Lys Ala Ser Leu Tyr Asp Ser Glu Gly Gln Ser Phe Gly Ser Ser

1670 1675 1680

Glu Gln Val Ser Ser Ser Ser Ser Met Leu Gln Glu Phe Gln Glu

1685 1690 1695

Glu Arg Gln Asp Lys Cys Asp Val Ser Ala Val Arg Asp Asn Tyr

1700 1705 1710

Cys Arg Gly Asp Ile Val Glu Pro Gly Thr Lys Gln Asn Asp Asp

1715 1720 1725

Ser Arg Ile Leu Thr Asp Ile Glu Glu Gly Val Leu Ile Asp Lys

1730 1735 1740

Gly Lys Trp Leu Leu Lys Glu Asn His Leu Leu Arg Met Ser Ser

1745 1750 1755

Glu Asn Pro Gly Met Cys Gly Asn Ala Asp Thr Thr Ser Val Asp

1760 1765 1770

Thr Leu Leu Asp Asn Asn Ser Ser Glu Val Pro Tyr Ser His Phe

1775 1780 1785

Gly Asn Leu Ala Pro Gly Pro Thr Met Asp Glu Leu Ser Ser Ser

1790 1795 1800

Glu Leu Glu Glu Leu Thr Gln Pro Leu Glu Leu Lys Cys Asn Tyr

1805 1810 1815

Phe Asn Met Pro His Gly Ser Asp Ser Glu Pro Phe His Glu Asp

1820 1825 1830

Leu Leu Asp Val Arg Asn Glu Thr Cys Ala Lys Glu Arg Ile Ala

1835 1840 1845

Asn His His Thr Glu Glu Lys Gly Ser His Gln Ser Glu Arg Val

1850 1855 1860

Cys Thr Ser Val Thr His Ser Phe Ile Ser Ala Gly Asn Lys Val

1865 1870 1875

Tyr Pro Val Ser Asp Asp Ala Ile Lys Asn Gln Pro Leu Pro Gly

1880 1885 1890

Ser Asn Met Ile His Gly Thr Leu Gln Glu Ala Asp Ser Leu Asp

1895 1900 1905

Lys Leu Tyr Ala Leu Cys Gly Gln His Cys Pro Ile Leu Thr Val

1910 1915 1920

Ile Ile Gln Pro Met Asn Glu Glu Asp Arg Gly Phe Ala Tyr Arg

1925 1930 1935

Lys Glu Ser Asp Ile Glu Asn Phe Leu Gly Phe Tyr Leu Trp Met

1940 1945 1950

Lys Ile His Pro Tyr Leu Leu Gln Thr Asp Lys Asn Val Phe Arg

1955 1960 1965

Glu Glu Asn Asn Lys Ala Ser Met Arg Gln Asn Leu Ile Asp Asn

1970 1975 1980

Ala Ile Gly Asp Ile Phe Asp Gln Phe Tyr Phe Ser Asn Thr Phe

1985 1990 1995

Asp Leu Met Gly Lys Arg Arg Lys Gln Lys Arg Ile Asn Phe Leu

2000 2005 2010

Gly Leu Glu Glu Glu Gly Asn Leu Lys Lys Phe Gln Pro Asp Leu

2015 2020 2025

Lys Glu Arg Phe Cys Met Asn Phe Leu His Thr Ser Leu Leu Val

2030 2035 2040

Val Gly Asn Val Asp Ser Asn Thr Gln Asp Leu Ser Gly Gln Thr

2045 2050 2055

Asn Glu Ile Phe Lys Ala Val Asp Glu Asn Asn Asn Leu Leu Asn

2060 2065 2070

Asn Arg Phe Gln Gly Ser Arg Thr Asn Leu Asn Gln Val Val Arg

2075 2080 2085

Glu Asn Ile Asn Cys His Tyr Phe Phe Glu Met Leu Gly Gln Ala

2090 2095 2100

Cys Leu Leu Asp Ile Cys Gln Val Glu Thr Ser Leu Asn Ile Ser

2105 2110 2115

Asn Arg Asn Ile Leu Glu Leu Cys Met Phe Glu Gly Glu Asn Leu

2120 2125 2130

Phe Ile Trp Glu Glu Glu Asp Ile Leu Asn Leu Thr Asp Leu Glu

2135 2140 2145

Ser Ser Arg Glu Gln Glu Asp Leu

2150 2155

<210> 36

<211> 3950

<212> DNA

<213> 智人

<400> 36

atgtcacatc tggtggaccc tacatcagga gacttgccag ttagagacat agatgctata 60

cctctggtgc taccagcctc aaaaggtaag aatatgaaaa ctcaaccacc cttgagcagg 120

atgaaccggg aggaattgga ggacagtttc tttcgacttc gcgaagatca catgttggtg 180

aaggagcttt cttggaagca acaggatgag atcaaaaggc tgaggaccac cttgctgcgg 240

ttgaccgctg ctggccggga cctgcgggtc gcggaggagg cggcgccgct ctcggagacc 300

gcaaggcgcg ggcagaaggc gggatggcgg cagcgcctct ccatgcacca gcgcccccag 360

atgcaccgac tgcaagggca tttccactgc gtcggccctg ccagcccccg ccgcgcccag 420

cctcgcgtcc aagtgggaca cagacagctc cacacagccg gtgcaccggt gccggagaaa 480

cccaagaggg ggccaaggga caggctgagc tacacagccc ctccatcgtt taaggagcat 540

gcgacaaatg aaaacagagg tgaagtagcc agtaaaccca gtgaacttgt ttctggttct 600

aacagcataa tttctttcag cagtgtcata agtatggcta aacccattgg tctatgcatg 660

cctaacagtg cccacatcat ggccagcaat accatgcaag tggaagagcc acccaagtct 720

cctgagaaaa tgtggcctaa agatgaaaat tttgaacaga gaagctcatt ggagtgtgct 780

cagaaggctg cagagcttcg agcttccatt aaagagaagg tagagctgat tcgacttaag 840

aagctcttac atgaaagaaa tgcttcattg gttatgacaa aagcacaatt aacagaagtt 900

caagaggcat acgaaacctt gctccagaag aatcagggaa tcctgagtgc agcccatgag 960

gccctcctca agcaagtgaa tgagctcagg gcagagctga aggaagaaag caagaaggct 1020

gtgagcttga agagccaact ggaagatgtg tctatcttgc agatgactct gaaggagttt 1080

caggagagag ttgaagattt ggaaaaagaa cgaaaattgc tgaatgacaa ttatgacaaa 1140

ctcttagaaa gcatgctgga cagcagtgac agctccagtc agccccactg gagcaacgag 1200

ctcatagcgg aacagctaca gcagcaagtc tctcagctgc aggatcagct ggatgctgag 1260

ctggaggaca agagaaaagt tttacttgag ctgtccaggg agaaagccca aaatgaggat 1320

ctgaagcttg aagtcaccaa catacttcag aagcataaac aggaagtaga gctcctccaa 1380

aatgcagcca caatttccca acctcctgac aggcaatctg aaccagccac tcacccagct 1440

gtattgcaag agaacactca gatcgagcca agtgaaccca aaaaccaaga agaaaagaaa 1500

ctgtcccagg tgctaaatga gttgcaagta tcacacgcag agaccacatt ggaactagaa 1560

aagaccaggg acatgcttat tctgcagcgc aaaatcaacg tgtgttatca ggaggaactg 1620

gaggcaatga tgacaaaagc tgacaatgat aatagagatc acaaagaaaa gctggagagg 1680

ttgactcgac tactagacct caagaataac cgtatcaagc agctggaagg tattttaaga 1740

agccatgacc ttccaacatc tgaacagctc aaagatgttg cttatggcac ccgaccgttg 1800

tcgttatgtt tggaaacact gccagcccat ggagatgagg ataaagtgga tatttctctg 1860

ctgcatcagg gtgagaatct ttttgaactg cacatccacc aggccttcct gacatctgcc 1920

gccctagctc aggctggaga tacccaacct accactttct gcacctattc cttctatgac 1980

tttgaaaccc actgtacccc attatctgtg gggccacagc ccctctatga cttcacctcc 2040

cagtatgtga tggagacaga ttcgcttttc ttacactacc ttcaagaggc ttcagcccgg 2100

cttgacatac accaggccat ggccagtgaa cacagcactc ttgctgcagg atggatttgc 2160

tttgacaggg tgctagagac tgtggagaaa gtccatggct tggccacact gattggagct 2220

ggtggagaag agttcggggt tctagagtac tggatgaggc tgcgtttccc cataaaaccc 2280

agcctacagg cgtgcaataa acgaaagaaa gcccaggtct acctgtcaac cgatgtgctt 2340

ggaggccgga aggcccagga agaggagttc agatcggagt cttgggaacc tcagaacgag 2400

ctgtggattg aaatcaccaa gtgctgtggc ctccggagtc gatggctggg aactcaaccc 2460

agtccatatg ctgtgtaccg cttcttcacc ttttctgacc atgacactgc catcattcca 2520

gccagtaaca acccctactt tagagaccag gctcgattcc cagtgcttgt gacctctgac 2580

ctggaccatt atctgagacg ggaggccttg tctatacatg tttttgatga tgaagactta 2640

gagcctggct cgtatcttgg ccgagcccga gtgcctttac tgcctcttgc aaaaaatgaa 2700

tctatcaaag gtgattttaa cctcactgac cctgcagaga aacccaacgg atctattcaa 2760

gtgcaactgg attggaagtt tccctacata ccccctgaga gcttcctgaa accagaagct 2820

cagactaagg ggaaggatac caaggacagt tcaaagatct catctgaaga ggaaaaggct 2880

tcatttcctt cccaggatca gatggcatct cctgaggttc ccattgaagc tggccagtat 2940

cgatctaaga gaaaacctcc tcatggggga gaaagaaagg agaaggagca ccaggttgtg 3000

agctactcaa gaagaaaaca tggcaaaaga ataggtgttc aaggaaagaa tagaatggag 3060

tatcttagcc ttaacatctt aaatggaaat acaccagagc aggtgaatta cactgagtgg 3120

aagttctcag agactaacag cttcataggt gatggcttta aaaatcagca cgaggaagag 3180

gaaatgacat tatcccattc agcactgaaa cagaaggaac ctctacatcc tgtaaatgac 3240

aaagaatcct ctgaacaagg ttctgaagtc agtgaagcac aaactaccga cagtgatgat 3300

gtcatagtgc cacccatgtc tcagaaatat cctaaggcag attcagagaa gatgtgcatt 3360

gaaattgtct ccctggcctt ctacccagag gcagaagtga tgtctgatga gaacataaaa 3420

caggtgtatg tggagtacaa attctacgac ctacccttgt cggagacaga gactccagtg 3480

tccctaagga agcctagggc aggagaagaa atccactttc actttagcaa ggtaatagac 3540

ctggacccac aggagcagca aggccgaagg cggtttctgt tcgacatgct gaatggacaa 3600

gatcctgatc aaggacattt aaagtttaca gtggtaagtg atcctctgga tgaagaaaag 3660

aaagaatgtg aagaagtggg atatgcatat cttcaactgt ggcagatcct ggagtcagga 3720

agagatattc tagagcaaga gctagacatt gttagccctg aagatctggc taccccaata 3780

ggaaggctga aggtttccct tcaagcagct gctgtcctcc atgctattta caaggagatg 3840

actgaagatt tgttttcatg aaggaacaag tgctattcca atctaaaagt ctctgaggga 3900

accatagtaa aaagtctctt ataaagttag cttgctataa catgaaaaaa 3950

<210> 37

<211> 1286

<212> PRT

<213> 智人

<400> 37

Met Ser His Leu Val Asp Pro Thr Ser Gly Asp Leu Pro Val Arg Asp

1 5 10 15

Ile Asp Ala Ile Pro Leu Val Leu Pro Ala Ser Lys Gly Lys Asn Met

20 25 30

Lys Thr Gln Pro Pro Leu Ser Arg Met Asn Arg Glu Glu Leu Glu Asp

35 40 45

Ser Phe Phe Arg Leu Arg Glu Asp His Met Leu Val Lys Glu Leu Ser

50 55 60

Trp Lys Gln Gln Asp Glu Ile Lys Arg Leu Arg Thr Thr Leu Leu Arg

65 70 75 80

Leu Thr Ala Ala Gly Arg Asp Leu Arg Val Ala Glu Glu Ala Ala Pro

85 90 95

Leu Ser Glu Thr Ala Arg Arg Gly Gln Lys Ala Gly Trp Arg Gln Arg

100 105 110

Leu Ser Met His Gln Arg Pro Gln Met His Arg Leu Gln Gly His Phe

115 120 125

His Cys Val Gly Pro Ala Ser Pro Arg Arg Ala Gln Pro Arg Val Gln

130 135 140

Val Gly His Arg Gln Leu His Thr Ala Gly Ala Pro Val Pro Glu Lys

145 150 155 160

Pro Lys Arg Gly Pro Arg Asp Arg Leu Ser Tyr Thr Ala Pro Pro Ser

165 170 175

Phe Lys Glu His Ala Thr Asn Glu Asn Arg Gly Glu Val Ala Ser Lys

180 185 190

Pro Ser Glu Leu Val Ser Gly Ser Asn Ser Ile Ile Ser Phe Ser Ser

195 200 205

Val Ile Ser Met Ala Lys Pro Ile Gly Leu Cys Met Pro Asn Ser Ala

210 215 220

His Ile Met Ala Ser Asn Thr Met Gln Val Glu Glu Pro Pro Lys Ser

225 230 235 240

Pro Glu Lys Met Trp Pro Lys Asp Glu Asn Phe Glu Gln Arg Ser Ser

245 250 255

Leu Glu Cys Ala Gln Lys Ala Ala Glu Leu Arg Ala Ser Ile Lys Glu

260 265 270

Lys Val Glu Leu Ile Arg Leu Lys Lys Leu Leu His Glu Arg Asn Ala

275 280 285

Ser Leu Val Met Thr Lys Ala Gln Leu Thr Glu Val Gln Glu Ala Tyr

290 295 300

Glu Thr Leu Leu Gln Lys Asn Gln Gly Ile Leu Ser Ala Ala His Glu

305 310 315 320

Ala Leu Leu Lys Gln Val Asn Glu Leu Arg Ala Glu Leu Lys Glu Glu

325 330 335

Ser Lys Lys Ala Val Ser Leu Lys Ser Gln Leu Glu Asp Val Ser Ile

340 345 350

Leu Gln Met Thr Leu Lys Glu Phe Gln Glu Arg Val Glu Asp Leu Glu

355 360 365

Lys Glu Arg Lys Leu Leu Asn Asp Asn Tyr Asp Lys Leu Leu Glu Ser

370 375 380

Met Leu Asp Ser Ser Asp Ser Ser Ser Gln Pro His Trp Ser Asn Glu

385 390 395 400

Leu Ile Ala Glu Gln Leu Gln Gln Gln Val Ser Gln Leu Gln Asp Gln

405 410 415

Leu Asp Ala Glu Leu Glu Asp Lys Arg Lys Val Leu Leu Glu Leu Ser

420 425 430

Arg Glu Lys Ala Gln Asn Glu Asp Leu Lys Leu Glu Val Thr Asn Ile

435 440 445

Leu Gln Lys His Lys Gln Glu Val Glu Leu Leu Gln Asn Ala Ala Thr

450 455 460

Ile Ser Gln Pro Pro Asp Arg Gln Ser Glu Pro Ala Thr His Pro Ala

465 470 475 480

Val Leu Gln Glu Asn Thr Gln Ile Glu Pro Ser Glu Pro Lys Asn Gln

485 490 495

Glu Glu Lys Lys Leu Ser Gln Val Leu Asn Glu Leu Gln Val Ser His

500 505 510

Ala Glu Thr Thr Leu Glu Leu Glu Lys Thr Arg Asp Met Leu Ile Leu

515 520 525

Gln Arg Lys Ile Asn Val Cys Tyr Gln Glu Glu Leu Glu Ala Met Met

530 535 540

Thr Lys Ala Asp Asn Asp Asn Arg Asp His Lys Glu Lys Leu Glu Arg

545 550 555 560

Leu Thr Arg Leu Leu Asp Leu Lys Asn Asn Arg Ile Lys Gln Leu Glu

565 570 575

Gly Ile Leu Arg Ser His Asp Leu Pro Thr Ser Glu Gln Leu Lys Asp

580 585 590

Val Ala Tyr Gly Thr Arg Pro Leu Ser Leu Cys Leu Glu Thr Leu Pro

595 600 605

Ala His Gly Asp Glu Asp Lys Val Asp Ile Ser Leu Leu His Gln Gly

610 615 620

Glu Asn Leu Phe Glu Leu His Ile His Gln Ala Phe Leu Thr Ser Ala

625 630 635 640

Ala Leu Ala Gln Ala Gly Asp Thr Gln Pro Thr Thr Phe Cys Thr Tyr

645 650 655

Ser Phe Tyr Asp Phe Glu Thr His Cys Thr Pro Leu Ser Val Gly Pro

660 665 670

Gln Pro Leu Tyr Asp Phe Thr Ser Gln Tyr Val Met Glu Thr Asp Ser

675 680 685

Leu Phe Leu His Tyr Leu Gln Glu Ala Ser Ala Arg Leu Asp Ile His

690 695 700

Gln Ala Met Ala Ser Glu His Ser Thr Leu Ala Ala Gly Trp Ile Cys

705 710 715 720

Phe Asp Arg Val Leu Glu Thr Val Glu Lys Val His Gly Leu Ala Thr

725 730 735

Leu Ile Gly Ala Gly Gly Glu Glu Phe Gly Val Leu Glu Tyr Trp Met

740 745 750

Arg Leu Arg Phe Pro Ile Lys Pro Ser Leu Gln Ala Cys Asn Lys Arg

755 760 765

Lys Lys Ala Gln Val Tyr Leu Ser Thr Asp Val Leu Gly Gly Arg Lys

770 775 780

Ala Gln Glu Glu Glu Phe Arg Ser Glu Ser Trp Glu Pro Gln Asn Glu

785 790 795 800

Leu Trp Ile Glu Ile Thr Lys Cys Cys Gly Leu Arg Ser Arg Trp Leu

805 810 815

Gly Thr Gln Pro Ser Pro Tyr Ala Val Tyr Arg Phe Phe Thr Phe Ser

820 825 830

Asp His Asp Thr Ala Ile Ile Pro Ala Ser Asn Asn Pro Tyr Phe Arg

835 840 845

Asp Gln Ala Arg Phe Pro Val Leu Val Thr Ser Asp Leu Asp His Tyr

850 855 860

Leu Arg Arg Glu Ala Leu Ser Ile His Val Phe Asp Asp Glu Asp Leu

865 870 875 880

Glu Pro Gly Ser Tyr Leu Gly Arg Ala Arg Val Pro Leu Leu Pro Leu

885 890 895

Ala Lys Asn Glu Ser Ile Lys Gly Asp Phe Asn Leu Thr Asp Pro Ala

900 905 910

Glu Lys Pro Asn Gly Ser Ile Gln Val Gln Leu Asp Trp Lys Phe Pro

915 920 925

Tyr Ile Pro Pro Glu Ser Phe Leu Lys Pro Glu Ala Gln Thr Lys Gly

930 935 940

Lys Asp Thr Lys Asp Ser Ser Lys Ile Ser Ser Glu Glu Glu Lys Ala

945 950 955 960

Ser Phe Pro Ser Gln Asp Gln Met Ala Ser Pro Glu Val Pro Ile Glu

965 970 975

Ala Gly Gln Tyr Arg Ser Lys Arg Lys Pro Pro His Gly Gly Glu Arg

980 985 990

Lys Glu Lys Glu His Gln Val Val Ser Tyr Ser Arg Arg Lys His Gly

995 1000 1005

Lys Arg Ile Gly Val Gln Gly Lys Asn Arg Met Glu Tyr Leu Ser

1010 1015 1020

Leu Asn Ile Leu Asn Gly Asn Thr Pro Glu Gln Val Asn Tyr Thr

1025 1030 1035

Glu Trp Lys Phe Ser Glu Thr Asn Ser Phe Ile Gly Asp Gly Phe

1040 1045 1050

Lys Asn Gln His Glu Glu Glu Glu Met Thr Leu Ser His Ser Ala

1055 1060 1065

Leu Lys Gln Lys Glu Pro Leu His Pro Val Asn Asp Lys Glu Ser

1070 1075 1080

Ser Glu Gln Gly Ser Glu Val Ser Glu Ala Gln Thr Thr Asp Ser

1085 1090 1095

Asp Asp Val Ile Val Pro Pro Met Ser Gln Lys Tyr Pro Lys Ala

1100 1105 1110

Asp Ser Glu Lys Met Cys Ile Glu Ile Val Ser Leu Ala Phe Tyr

1115 1120 1125

Pro Glu Ala Glu Val Met Ser Asp Glu Asn Ile Lys Gln Val Tyr

1130 1135 1140

Val Glu Tyr Lys Phe Tyr Asp Leu Pro Leu Ser Glu Thr Glu Thr

1145 1150 1155

Pro Val Ser Leu Arg Lys Pro Arg Ala Gly Glu Glu Ile His Phe

1160 1165 1170

His Phe Ser Lys Val Ile Asp Leu Asp Pro Gln Glu Gln Gln Gly

1175 1180 1185

Arg Arg Arg Phe Leu Phe Asp Met Leu Asn Gly Gln Asp Pro Asp

1190 1195 1200

Gln Gly His Leu Lys Phe Thr Val Val Ser Asp Pro Leu Asp Glu

1205 1210 1215

Glu Lys Lys Glu Cys Glu Glu Val Gly Tyr Ala Tyr Leu Gln Leu

1220 1225 1230

Trp Gln Ile Leu Glu Ser Gly Arg Asp Ile Leu Glu Gln Glu Leu

1235 1240 1245

Asp Ile Val Ser Pro Glu Asp Leu Ala Thr Pro Ile Gly Arg Leu

1250 1255 1260

Lys Val Ser Leu Gln Ala Ala Ala Val Leu His Ala Ile Tyr Lys

1265 1270 1275

Glu Met Thr Glu Asp Leu Phe Ser

1280 1285

<210> 38

<211> 7221

<212> DNA

<213> 智人

<400> 38

cgggcggcct cttgtgtgag ggcctgtggg attctccgga tatggccgga gtgtttcctt 60

atcgagggcc gggtaacccg gtgcctggcc ctctagcccc gctaccggac tacatgtcgg 120

aggagaagct gcaggagaaa gctcgaaaat ggcagcaatt gcaggccaag cgctatgcag 180

aaaagcggaa gtttgggttt gtggatgccc agaaggaaga catgccccca gaacatgtca 240

gggagatcat tcgagaccat ggagacatga ccaacaggaa gttccgccat gacaaaaggg 300

tttacttggg tgccctaaag tacatgcccc acgcagtcct caaactcctg gagaacatgc 360

ctatgccttg ggagcagatt cgggatgtgc ccgtgctgta ccacatcact ggagccattt 420

ccttcgtcaa tgagattccc tgggtcattg aacctgtcta catctcccag tgggggtcaa 480

tgtggattat gatgcgccga gaaaaaagag ataggaggca tttcaagaga atgcgttttc 540

ccccttttga tgatgaggag ccgcccttgg actatgctga caacatccta aatgttgagc 600

cactggaggc cattcagcta gagctggacc ctgaggagga cgcccctgtg ttggactggt 660

tctatgacca ccagccgttg agggacagca ggaagtatgt aaatggctcc acttaccagc 720

gctggcagtt cacactacct atgatgtcaa ctctctaccg cctggctaat cagctcctga 780

cagacttggt ggatgacaac tacttctacc tgtttgattt gaaggccttc tttacgtcca 840

aggcactcaa tatggccatt cctggaggcc ccaaatttga acctcttgtt cgagacatca 900

acctacagga tgaagactgg aatgaattca atgatattaa caagattatc atccggcagc 960

ctatccggac tgagtacaag attgcttttc cttacttgta caacaatctt ccacaccatg 1020

tccacctcac ctggtaccat actcccaatg ttgtattcat caaaactgaa gatcctgact 1080

tgccagcttt ctactttgac cctttgatca acccaatctc ccataggcac tcagtcaaga 1140

gccaggaacc attgccggat gatgatgagg aatttgagct cccggagttt gtggagccct 1200

tcctgaagga cacacccctc tatacagaca atacagccaa tggcattgcc ctgctctggg 1260

ccccgcggcc cttcaaccta cgctctggtc gcacccgtcg ggccctggac ataccccttg 1320

tcaagaactg gtatcgggag cattgtcctg ccgggcagcc tgtgaaagtg agggtctcct 1380

accagaagct gcttaagtac tatgtgctga atgccctgaa gcatcggccc cctaaggctc 1440

aaaagaagag gtatttgttc cgctccttca aagccaccaa attctttcag tccacaaagc 1500

tggactgggt ggagggttgg ctccaggttt gccgccaggg ctacaacatg ctcaaccttc 1560

tcattcaccg caaaaacctc aactacctgc acctggacta caacttcaac ctcaagcctg 1620

tgaaaacgct caccaccaag gaaagaaaga aatctcgttt tgggaatgct ttccacctgt 1680

gtcgggaagt tctgcgtttg actaagctgg tggtggatag tcacgtgcag tatcggctgg 1740

gcaatgtgga tgccttccag ctggcagatg gattgcagta tatatttgcc catgttgggc 1800

agttgacggg catgtatcga tacaaataca agctgatgcg acagattcgc gtgtgcaagg 1860

acctgaagca tctcatctat tatcgtttca acacaggccc tgtagggaag ggtcctggct 1920

gtggcttctg ggctgccggt tggcgagtct ggctcttttt catgcgtggc attacccctt 1980

tattagagcg atggcttggc aacctcctgg cccggcagtt tgaaggtcga cactcaaagg 2040

gggtggcaaa gacagtaaca aagcagcgag tggagtcaca ttttgacctt gagctgcggg 2100

cagctgtgat gcatgatatt ctggacatga tgcctgaggg gatcaagcag aacaaggccc 2160

ggacaatcct gcagcacctc agtgaagcct ggcgctgctg gaaagccaac attccctgga 2220

aggtccctgg gctgccgacg cccatagaga atatgatcct tcgatacgtg aaggccaagg 2280

ctgactggtg gaccaacact gcccactaca accgagaacg gatccgccga ggggccactg 2340

tggacaagac tgtttgtaaa aagaatctgg gccgcctcac ccggctctat ctgaaggcag 2400

aacaggagcg gcagcacaac tacctgaagg acgggcctta catcacagcg gaggaaacag 2460

tggcagtata taccaccaca gtgcattggt tggaaagccg caggttttca cccatcccat 2520

tccccccact ctcctataag catgacacca agttgctcat cttggcattg gagcggctca 2580

aggaagctta tagtgtgaag tctcggttga accagtctca gagggaggag ctaggtctga 2640

tcgagcaggc ctacgataac ctccacgagg cgctgtcccg cataaagcgt cacctcctca 2700

cacagagagc cttcaaagag gtgggcattg agttcatgga tctgtatagc cacctcgttc 2760

cagtatatga tgttgagccc ctggagaaga taactgatgc ttacctggac cagtacctgt 2820

ggtatgaagc cgacaagcgc cgcctgttcc caccctggat taagcctgca gacacagaac 2880

cacctccact gcttgtttac aagtggtgtc aaggcatcaa taacctgcag gacgtgtggg 2940

agacgagtga aggcgagtgc aatgtcatgc tggaatcccg ctttgagaag atgtatgaga 3000

agatcgactt gactctgctc aacaggctcg tgcgcctcat cgtggaccac aacatagccg 3060

actacatgac agccaagaac aacgtcgtca tcaactataa ggacatgaac catacgaatt 3120

catatgggat catcagaggc ctgcagtttg cctcattcat agtgcagtat tatggcctgg 3180

tgatggattt gcttgtattg ggattgcacc gggccagtga gatggctggg ccccctcaga 3240

tgccaaatga ctttctcagt ttccaggaca tagccactga ggctgcccac cccatccgtc 3300

tcttctgcag atacattgat cgcatccata tttttttcag gttcacagca gatgaggctc 3360

gggacctgat tcaacgttac ctgacagagc accctgaccc caataatgaa aacatcgttg 3420

gctataataa caagaagtgc tggccccgag atgcccgcat gcgcctcatg aaacatgatg 3480

ttaacttagg ccgggcggta ttctgggaca tcaagaaccg cttgccacgg tcagtgacta 3540

cagttcagtg ggagaacagc ttcgtgtctg tgtacagtaa ggacaacccc aacctgctgt 3600

tcaacatgtg tggcttcgag tgccgcatcc tgcctaagtg ccgcaccagc tatgaggagt 3660

tcacccacaa ggacggggtc tggaacctgc agaatgaggt tactaaggag cgcacagctc 3720

agtgtttcct gcgtgtggac gatgagtcaa tgcagcgctt ccacaaccgc gtgcgtcaga 3780

ttctcatggc ctctgggtcc accaccttca ccaagattgt gaataagtgg aatacagctc 3840

tcattggcct tatgacatac tttcgggagg ctgtggtgaa cacccaagag ctcttggact 3900

tactggtgaa gtgtgagcac aaaatccaga cacgtatcaa gattggactc aactccaaga 3960

tgccaagtcg gttccccccg gttgtgttct acacccctaa ggagttgggt ggactcggca 4020

tgctctcaat gggccatgtg ctcatccccc aatccgacct caggtggtcc aaacagacag 4080

atgtaggtat cacacacttt cgttcaggaa tgagccatga agaagaccag ctcattccca 4140

acttgtaccg ctacatacag ccatgggaga gcgagttcat tgattctcag cgggtctggg 4200

ctgagtactc actcaagaga caagaggcca ttgctcagaa cagacgcctg actttagaag 4260

acctagaaga ttcatgggat cgtggcattc ctcgaatcaa taccctcttc cagaaggacc 4320

ggcacacact ggcttatgat aagggctggc gtgtcagaac tgactttaag cagtatcagg 4380

ttttgaagca gaatccgttc tggtggacac accagcggca tgatgggaag ctctggaacc 4440

tgaacaacta ccgtacagac atgatccagg ccctgggcgg tgtggaaggc attctggaac 4500

acacactctt taagggcact tacttcccta cctgggaggg gcttttctgg gagaaggcca 4560

gtggctttga ggaatctatg aagtggaaga agctaactaa tgctcagcga tcaggactga 4620

accagattcc caatcgtaga ttcaccctct ggtggtcccc gaccattaat cgagccaatg 4680

tatatgtagg ctttcaggtg cagctagacc tgacgggtat cttcatgcac ggcaagatcc 4740

ccacgctgaa gatctctctc atccagatct tccgagctca cttgtggcag aagatccatg 4800

agagcattgt tatggactta tgtcaggtgt ttgaccagga acttgatgca ctggaaattg 4860

agacagtaca aaaggagaca atccatcccc gaaagtcata taagatgaac tcttcctgtg 4920

cagatatcct gctctttgcc tcctataagt ggaatgtctc ccggccctca ttgctggctg 4980

actccaagga tgtgatggac agcaccacca cccagaaata ctggattgac atccagttgc 5040

gctgggggga ctatgattcc cacgacattg agcgctacgc ccgggccaag ttcctggact 5100

acaccaccga caacatgagt atctaccctt cgcccacagg tgtactcatc gccattgacc 5160

tggcctataa cttgcacagt gcctatggaa actggttccc aggcagcaag cctctcatac 5220

aacaggccat ggccaagatc atgaaggcaa accctgccct gtatgtgtta cgtgaacgga 5280

tccgcaaggg gctacagctc tattcatctg aacccactga gccttatttg tcttctcaga 5340

actatggtga gctcttctcc aaccagatta tctggtttgt ggatgacacc aacgtctaca 5400

gagtgactat tcacaagacc tttgaaggga acttgacaac caagcccatc aacggagcca 5460

tcttcatctt caacccacgc acagggcagc tgttcctcaa gataatccac acgtccgtgt 5520

gggcgggaca gaagcgtttg gggcagttgg ctaagtggaa gacagctgag gaggtggccg 5580

ccctgatccg atctctgcct gtggaggagc agcccaagca gatcattgtc accaggaagg 5640

acatgctgga cccactggag gtgcacttac tggacttccc caatattgtc atcaaaggat 5700

cggagctcca actccctttc caggcgtgtc tcaaggtgga aaaattcggg gatctcatcc 5760

ttaaagccac tgagccccag atggttctct tcaacctcta tgacgactgg ctcaagacta 5820

tttcatctta cacggccttc tcccgtctca tcctgattct gcgtgcccta catgtgaaca 5880

acgatcgggc aaaagtgatc ctgaagccag acaagactac tattacagaa ccacaccaca 5940

tctggcccac tctgactgac gaagaatgga tcaaggtcga ggtgcagctc aaggatctga 6000

tcttggctga ctacggcaag aaaaacaatg tgaacgtggc atcactgaca caatcagaaa 6060

ttcgagacat catcctgggt atggagatct cggcaccgtc acagcagcgg cagcagatcg 6120

ctgagatcga gaagcagacc aaggaacaat cgcagctgac ggcaacacag actcgcactg 6180

tcaacaagca tggcgatgag atcatcacct ccaccaccag caactatgag acccagactt 6240

tctcatccaa gactgagtgg agggtcaggg ccatctctgc tgccaacctg cacctaagga 6300

ccaatcacat ctatgtttca tctgacgaca tcaaggagac tggctacacc tacatccttc 6360

ccaagaatgt gcttaagaag ttcatctgca tatctgacct tcgggcccaa attgcaggat 6420

acctatatgg ggtgagccca ccagataacc cccaggtgaa ggagatccgc tgcattgtga 6480

tggtgccgca gtggggcact caccagaccg tgcacctgcc tggccagctg ccccagcatg 6540

agtacctcaa ggagatggaa cccttaggtt ggatccacac tcagcccaat gagtccccgc 6600

agttatcacc ccaggatgtc accacccatg ccaagatcat ggctgacaac ccatcttggg 6660

atggcgagaa gaccattatc atcacatgca gcttcacgcc aggctcctgt acactgacgg 6720

cctacaagct gacccctagt ggctacgaat ggggccgcca gaacacagac aagggcaaca 6780

accccaaggg ctacctgcct tcacactatg agagggtgca gatgctgctg tcggaccgtt 6840

tccttggctt cttcatggtc cctgcccagt cctcgtggaa ctacaacttc atgggtgttc 6900

ggcatgaccc caacatgaaa tatgagctac agctggcgaa ccccaaagag ttctaccacg 6960

aggtgcacag gccctctcac ttcctcaact ttgctctcct gcaggagggg gaggtttact 7020

ctgcggatcg ggaggacctg tatgcctgac cgtttccctg cctcctgctt cagcctcccg 7080

aggccgaagc ctcagcccct ccagacaggc cgctgacatt cagcagtttg gcctctttcc 7140

ctctgtctgt gcttgtgttg ttgacctcct gatggcttgt catcctgaat aaaatataat 7200

aataaatttt gtataaatag g 7221

<210> 39

<211> 2335

<212> PRT

<213> 智人

<400> 39

Met Ala Gly Val Phe Pro Tyr Arg Gly Pro Gly Asn Pro Val Pro Gly

1 5 10 15

Pro Leu Ala Pro Leu Pro Asp Tyr Met Ser Glu Glu Lys Leu Gln Glu

20 25 30

Lys Ala Arg Lys Trp Gln Gln Leu Gln Ala Lys Arg Tyr Ala Glu Lys

35 40 45

Arg Lys Phe Gly Phe Val Asp Ala Gln Lys Glu Asp Met Pro Pro Glu

50 55 60

His Val Arg Glu Ile Ile Arg Asp His Gly Asp Met Thr Asn Arg Lys

65 70 75 80

Phe Arg His Asp Lys Arg Val Tyr Leu Gly Ala Leu Lys Tyr Met Pro

85 90 95

His Ala Val Leu Lys Leu Leu Glu Asn Met Pro Met Pro Trp Glu Gln

100 105 110

Ile Arg Asp Val Pro Val Leu Tyr His Ile Thr Gly Ala Ile Ser Phe

115 120 125

Val Asn Glu Ile Pro Trp Val Ile Glu Pro Val Tyr Ile Ser Gln Trp

130 135 140

Gly Ser Met Trp Ile Met Met Arg Arg Glu Lys Arg Asp Arg Arg His

145 150 155 160

Phe Lys Arg Met Arg Phe Pro Pro Phe Asp Asp Glu Glu Pro Pro Leu

165 170 175

Asp Tyr Ala Asp Asn Ile Leu Asn Val Glu Pro Leu Glu Ala Ile Gln

180 185 190

Leu Glu Leu Asp Pro Glu Glu Asp Ala Pro Val Leu Asp Trp Phe Tyr

195 200 205

Asp His Gln Pro Leu Arg Asp Ser Arg Lys Tyr Val Asn Gly Ser Thr

210 215 220

Tyr Gln Arg Trp Gln Phe Thr Leu Pro Met Met Ser Thr Leu Tyr Arg

225 230 235 240

Leu Ala Asn Gln Leu Leu Thr Asp Leu Val Asp Asp Asn Tyr Phe Tyr

245 250 255

Leu Phe Asp Leu Lys Ala Phe Phe Thr Ser Lys Ala Leu Asn Met Ala

260 265 270

Ile Pro Gly Gly Pro Lys Phe Glu Pro Leu Val Arg Asp Ile Asn Leu

275 280 285

Gln Asp Glu Asp Trp Asn Glu Phe Asn Asp Ile Asn Lys Ile Ile Ile

290 295 300

Arg Gln Pro Ile Arg Thr Glu Tyr Lys Ile Ala Phe Pro Tyr Leu Tyr

305 310 315 320

Asn Asn Leu Pro His His Val His Leu Thr Trp Tyr His Thr Pro Asn

325 330 335

Val Val Phe Ile Lys Thr Glu Asp Pro Asp Leu Pro Ala Phe Tyr Phe

340 345 350

Asp Pro Leu Ile Asn Pro Ile Ser His Arg His Ser Val Lys Ser Gln

355 360 365

Glu Pro Leu Pro Asp Asp Asp Glu Glu Phe Glu Leu Pro Glu Phe Val

370 375 380

Glu Pro Phe Leu Lys Asp Thr Pro Leu Tyr Thr Asp Asn Thr Ala Asn

385 390 395 400

Gly Ile Ala Leu Leu Trp Ala Pro Arg Pro Phe Asn Leu Arg Ser Gly

405 410 415

Arg Thr Arg Arg Ala Leu Asp Ile Pro Leu Val Lys Asn Trp Tyr Arg

420 425 430

Glu His Cys Pro Ala Gly Gln Pro Val Lys Val Arg Val Ser Tyr Gln

435 440 445

Lys Leu Leu Lys Tyr Tyr Val Leu Asn Ala Leu Lys His Arg Pro Pro

450 455 460

Lys Ala Gln Lys Lys Arg Tyr Leu Phe Arg Ser Phe Lys Ala Thr Lys

465 470 475 480

Phe Phe Gln Ser Thr Lys Leu Asp Trp Val Glu Gly Trp Leu Gln Val

485 490 495

Cys Arg Gln Gly Tyr Asn Met Leu Asn Leu Leu Ile His Arg Lys Asn

500 505 510

Leu Asn Tyr Leu His Leu Asp Tyr Asn Phe Asn Leu Lys Pro Val Lys

515 520 525

Thr Leu Thr Thr Lys Glu Arg Lys Lys Ser Arg Phe Gly Asn Ala Phe

530 535 540

His Leu Cys Arg Glu Val Leu Arg Leu Thr Lys Leu Val Val Asp Ser

545 550 555 560

His Val Gln Tyr Arg Leu Gly Asn Val Asp Ala Phe Gln Leu Ala Asp

565 570 575

Gly Leu Gln Tyr Ile Phe Ala His Val Gly Gln Leu Thr Gly Met Tyr

580 585 590

Arg Tyr Lys Tyr Lys Leu Met Arg Gln Ile Arg Val Cys Lys Asp Leu

595 600 605

Lys His Leu Ile Tyr Tyr Arg Phe Asn Thr Gly Pro Val Gly Lys Gly

610 615 620

Pro Gly Cys Gly Phe Trp Ala Ala Gly Trp Arg Val Trp Leu Phe Phe

625 630 635 640

Met Arg Gly Ile Thr Pro Leu Leu Glu Arg Trp Leu Gly Asn Leu Leu

645 650 655

Ala Arg Gln Phe Glu Gly Arg His Ser Lys Gly Val Ala Lys Thr Val

660 665 670

Thr Lys Gln Arg Val Glu Ser His Phe Asp Leu Glu Leu Arg Ala Ala

675 680 685

Val Met His Asp Ile Leu Asp Met Met Pro Glu Gly Ile Lys Gln Asn

690 695 700

Lys Ala Arg Thr Ile Leu Gln His Leu Ser Glu Ala Trp Arg Cys Trp

705 710 715 720

Lys Ala Asn Ile Pro Trp Lys Val Pro Gly Leu Pro Thr Pro Ile Glu

725 730 735

Asn Met Ile Leu Arg Tyr Val Lys Ala Lys Ala Asp Trp Trp Thr Asn

740 745 750

Thr Ala His Tyr Asn Arg Glu Arg Ile Arg Arg Gly Ala Thr Val Asp

755 760 765

Lys Thr Val Cys Lys Lys Asn Leu Gly Arg Leu Thr Arg Leu Tyr Leu

770 775 780

Lys Ala Glu Gln Glu Arg Gln His Asn Tyr Leu Lys Asp Gly Pro Tyr

785 790 795 800

Ile Thr Ala Glu Glu Thr Val Ala Val Tyr Thr Thr Thr Val His Trp

805 810 815

Leu Glu Ser Arg Arg Phe Ser Pro Ile Pro Phe Pro Pro Leu Ser Tyr

820 825 830

Lys His Asp Thr Lys Leu Leu Ile Leu Ala Leu Glu Arg Leu Lys Glu

835 840 845

Ala Tyr Ser Val Lys Ser Arg Leu Asn Gln Ser Gln Arg Glu Glu Leu

850 855 860

Gly Leu Ile Glu Gln Ala Tyr Asp Asn Leu His Glu Ala Leu Ser Arg

865 870 875 880

Ile Lys Arg His Leu Leu Thr Gln Arg Ala Phe Lys Glu Val Gly Ile

885 890 895

Glu Phe Met Asp Leu Tyr Ser His Leu Val Pro Val Tyr Asp Val Glu

900 905 910

Pro Leu Glu Lys Ile Thr Asp Ala Tyr Leu Asp Gln Tyr Leu Trp Tyr

915 920 925

Glu Ala Asp Lys Arg Arg Leu Phe Pro Pro Trp Ile Lys Pro Ala Asp

930 935 940

Thr Glu Pro Pro Pro Leu Leu Val Tyr Lys Trp Cys Gln Gly Ile Asn

945 950 955 960

Asn Leu Gln Asp Val Trp Glu Thr Ser Glu Gly Glu Cys Asn Val Met

965 970 975

Leu Glu Ser Arg Phe Glu Lys Met Tyr Glu Lys Ile Asp Leu Thr Leu

980 985 990

Leu Asn Arg Leu Val Arg Leu Ile Val Asp His Asn Ile Ala Asp Tyr

995 1000 1005

Met Thr Ala Lys Asn Asn Val Val Ile Asn Tyr Lys Asp Met Asn

1010 1015 1020

His Thr Asn Ser Tyr Gly Ile Ile Arg Gly Leu Gln Phe Ala Ser

1025 1030 1035

Phe Ile Val Gln Tyr Tyr Gly Leu Val Met Asp Leu Leu Val Leu

1040 1045 1050

Gly Leu His Arg Ala Ser Glu Met Ala Gly Pro Pro Gln Met Pro

1055 1060 1065

Asn Asp Phe Leu Ser Phe Gln Asp Ile Ala Thr Glu Ala Ala His

1070 1075 1080

Pro Ile Arg Leu Phe Cys Arg Tyr Ile Asp Arg Ile His Ile Phe

1085 1090 1095

Phe Arg Phe Thr Ala Asp Glu Ala Arg Asp Leu Ile Gln Arg Tyr

1100 1105 1110

Leu Thr Glu His Pro Asp Pro Asn Asn Glu Asn Ile Val Gly Tyr

1115 1120 1125

Asn Asn Lys Lys Cys Trp Pro Arg Asp Ala Arg Met Arg Leu Met

1130 1135 1140

Lys His Asp Val Asn Leu Gly Arg Ala Val Phe Trp Asp Ile Lys

1145 1150 1155

Asn Arg Leu Pro Arg Ser Val Thr Thr Val Gln Trp Glu Asn Ser

1160 1165 1170

Phe Val Ser Val Tyr Ser Lys Asp Asn Pro Asn Leu Leu Phe Asn

1175 1180 1185

Met Cys Gly Phe Glu Cys Arg Ile Leu Pro Lys Cys Arg Thr Ser

1190 1195 1200

Tyr Glu Glu Phe Thr His Lys Asp Gly Val Trp Asn Leu Gln Asn

1205 1210 1215

Glu Val Thr Lys Glu Arg Thr Ala Gln Cys Phe Leu Arg Val Asp

1220 1225 1230

Asp Glu Ser Met Gln Arg Phe His Asn Arg Val Arg Gln Ile Leu

1235 1240 1245

Met Ala Ser Gly Ser Thr Thr Phe Thr Lys Ile Val Asn Lys Trp

1250 1255 1260

Asn Thr Ala Leu Ile Gly Leu Met Thr Tyr Phe Arg Glu Ala Val

1265 1270 1275

Val Asn Thr Gln Glu Leu Leu Asp Leu Leu Val Lys Cys Glu His

1280 1285 1290

Lys Ile Gln Thr Arg Ile Lys Ile Gly Leu Asn Ser Lys Met Pro

1295 1300 1305

Ser Arg Phe Pro Pro Val Val Phe Tyr Thr Pro Lys Glu Leu Gly

1310 1315 1320

Gly Leu Gly Met Leu Ser Met Gly His Val Leu Ile Pro Gln Ser

1325 1330 1335

Asp Leu Arg Trp Ser Lys Gln Thr Asp Val Gly Ile Thr His Phe

1340 1345 1350

Arg Ser Gly Met Ser His Glu Glu Asp Gln Leu Ile Pro Asn Leu

1355 1360 1365

Tyr Arg Tyr Ile Gln Pro Trp Glu Ser Glu Phe Ile Asp Ser Gln

1370 1375 1380

Arg Val Trp Ala Glu Tyr Ser Leu Lys Arg Gln Glu Ala Ile Ala

1385 1390 1395

Gln Asn Arg Arg Leu Thr Leu Glu Asp Leu Glu Asp Ser Trp Asp

1400 1405 1410

Arg Gly Ile Pro Arg Ile Asn Thr Leu Phe Gln Lys Asp Arg His

1415 1420 1425

Thr Leu Ala Tyr Asp Lys Gly Trp Arg Val Arg Thr Asp Phe Lys

1430 1435 1440

Gln Tyr Gln Val Leu Lys Gln Asn Pro Phe Trp Trp Thr His Gln

1445 1450 1455

Arg His Asp Gly Lys Leu Trp Asn Leu Asn Asn Tyr Arg Thr Asp

1460 1465 1470

Met Ile Gln Ala Leu Gly Gly Val Glu Gly Ile Leu Glu His Thr

1475 1480 1485

Leu Phe Lys Gly Thr Tyr Phe Pro Thr Trp Glu Gly Leu Phe Trp

1490 1495 1500

Glu Lys Ala Ser Gly Phe Glu Glu Ser Met Lys Trp Lys Lys Leu

1505 1510 1515

Thr Asn Ala Gln Arg Ser Gly Leu Asn Gln Ile Pro Asn Arg Arg

1520 1525 1530

Phe Thr Leu Trp Trp Ser Pro Thr Ile Asn Arg Ala Asn Val Tyr

1535 1540 1545

Val Gly Phe Gln Val Gln Leu Asp Leu Thr Gly Ile Phe Met His

1550 1555 1560

Gly Lys Ile Pro Thr Leu Lys Ile Ser Leu Ile Gln Ile Phe Arg

1565 1570 1575

Ala His Leu Trp Gln Lys Ile His Glu Ser Ile Val Met Asp Leu

1580 1585 1590

Cys Gln Val Phe Asp Gln Glu Leu Asp Ala Leu Glu Ile Glu Thr

1595 1600 1605

Val Gln Lys Glu Thr Ile His Pro Arg Lys Ser Tyr Lys Met Asn

1610 1615 1620

Ser Ser Cys Ala Asp Ile Leu Leu Phe Ala Ser Tyr Lys Trp Asn

1625 1630 1635

Val Ser Arg Pro Ser Leu Leu Ala Asp Ser Lys Asp Val Met Asp

1640 1645 1650

Ser Thr Thr Thr Gln Lys Tyr Trp Ile Asp Ile Gln Leu Arg Trp

1655 1660 1665

Gly Asp Tyr Asp Ser His Asp Ile Glu Arg Tyr Ala Arg Ala Lys

1670 1675 1680

Phe Leu Asp Tyr Thr Thr Asp Asn Met Ser Ile Tyr Pro Ser Pro

1685 1690 1695

Thr Gly Val Leu Ile Ala Ile Asp Leu Ala Tyr Asn Leu His Ser

1700 1705 1710

Ala Tyr Gly Asn Trp Phe Pro Gly Ser Lys Pro Leu Ile Gln Gln

1715 1720 1725

Ala Met Ala Lys Ile Met Lys Ala Asn Pro Ala Leu Tyr Val Leu

1730 1735 1740

Arg Glu Arg Ile Arg Lys Gly Leu Gln Leu Tyr Ser Ser Glu Pro

1745 1750 1755

Thr Glu Pro Tyr Leu Ser Ser Gln Asn Tyr Gly Glu Leu Phe Ser

1760 1765 1770

Asn Gln Ile Ile Trp Phe Val Asp Asp Thr Asn Val Tyr Arg Val

1775 1780 1785

Thr Ile His Lys Thr Phe Glu Gly Asn Leu Thr Thr Lys Pro Ile

1790 1795 1800

Asn Gly Ala Ile Phe Ile Phe Asn Pro Arg Thr Gly Gln Leu Phe

1805 1810 1815

Leu Lys Ile Ile His Thr Ser Val Trp Ala Gly Gln Lys Arg Leu

1820 1825 1830

Gly Gln Leu Ala Lys Trp Lys Thr Ala Glu Glu Val Ala Ala Leu

1835 1840 1845

Ile Arg Ser Leu Pro Val Glu Glu Gln Pro Lys Gln Ile Ile Val

1850 1855 1860

Thr Arg Lys Asp Met Leu Asp Pro Leu Glu Val His Leu Leu Asp

1865 1870 1875

Phe Pro Asn Ile Val Ile Lys Gly Ser Glu Leu Gln Leu Pro Phe

1880 1885 1890

Gln Ala Cys Leu Lys Val Glu Lys Phe Gly Asp Leu Ile Leu Lys

1895 1900 1905

Ala Thr Glu Pro Gln Met Val Leu Phe Asn Leu Tyr Asp Asp Trp

1910 1915 1920

Leu Lys Thr Ile Ser Ser Tyr Thr Ala Phe Ser Arg Leu Ile Leu

1925 1930 1935

Ile Leu Arg Ala Leu His Val Asn Asn Asp Arg Ala Lys Val Ile

1940 1945 1950

Leu Lys Pro Asp Lys Thr Thr Ile Thr Glu Pro His His Ile Trp

1955 1960 1965

Pro Thr Leu Thr Asp Glu Glu Trp Ile Lys Val Glu Val Gln Leu

1970 1975 1980

Lys Asp Leu Ile Leu Ala Asp Tyr Gly Lys Lys Asn Asn Val Asn

1985 1990 1995

Val Ala Ser Leu Thr Gln Ser Glu Ile Arg Asp Ile Ile Leu Gly

2000 2005 2010

Met Glu Ile Ser Ala Pro Ser Gln Gln Arg Gln Gln Ile Ala Glu

2015 2020 2025

Ile Glu Lys Gln Thr Lys Glu Gln Ser Gln Leu Thr Ala Thr Gln

2030 2035 2040

Thr Arg Thr Val Asn Lys His Gly Asp Glu Ile Ile Thr Ser Thr

2045 2050 2055

Thr Ser Asn Tyr Glu Thr Gln Thr Phe Ser Ser Lys Thr Glu Trp

2060 2065 2070

Arg Val Arg Ala Ile Ser Ala Ala Asn Leu His Leu Arg Thr Asn

2075 2080 2085

His Ile Tyr Val Ser Ser Asp Asp Ile Lys Glu Thr Gly Tyr Thr

2090 2095 2100

Tyr Ile Leu Pro Lys Asn Val Leu Lys Lys Phe Ile Cys Ile Ser

2105 2110 2115

Asp Leu Arg Ala Gln Ile Ala Gly Tyr Leu Tyr Gly Val Ser Pro

2120 2125 2130

Pro Asp Asn Pro Gln Val Lys Glu Ile Arg Cys Ile Val Met Val

2135 2140 2145

Pro Gln Trp Gly Thr His Gln Thr Val His Leu Pro Gly Gln Leu

2150 2155 2160

Pro Gln His Glu Tyr Leu Lys Glu Met Glu Pro Leu Gly Trp Ile

2165 2170 2175

His Thr Gln Pro Asn Glu Ser Pro Gln Leu Ser Pro Gln Asp Val

2180 2185 2190

Thr Thr His Ala Lys Ile Met Ala Asp Asn Pro Ser Trp Asp Gly

2195 2200 2205

Glu Lys Thr Ile Ile Ile Thr Cys Ser Phe Thr Pro Gly Ser Cys

2210 2215 2220

Thr Leu Thr Ala Tyr Lys Leu Thr Pro Ser Gly Tyr Glu Trp Gly

2225 2230 2235

Arg Gln Asn Thr Asp Lys Gly Asn Asn Pro Lys Gly Tyr Leu Pro

2240 2245 2250

Ser His Tyr Glu Arg Val Gln Met Leu Leu Ser Asp Arg Phe Leu

2255 2260 2265

Gly Phe Phe Met Val Pro Ala Gln Ser Ser Trp Asn Tyr Asn Phe

2270 2275 2280

Met Gly Val Arg His Asp Pro Asn Met Lys Tyr Glu Leu Gln Leu

2285 2290 2295

Ala Asn Pro Lys Glu Phe Tyr His Glu Val His Arg Pro Ser His

2300 2305 2310

Phe Leu Asn Phe Ala Leu Leu Gln Glu Gly Glu Val Tyr Ser Ala

2315 2320 2325

Asp Arg Glu Asp Leu Tyr Ala

2330 2335

<210> 40

<211> 7972

<212> DNA

<213> 智人

<400> 40

atttgaagtc ctcgttccac gccttctcat catcctgaac accgagctct gggactccgg 60

cggagaatct aaacgtaaag catcacccac ggtcgtgaac tgtaggctct cctggcatcc 120

gggatcttat tctggccttg gcggagttgg ggatggtgtc gcctagcagc cgctgccgct 180

ttggcttgct cgggaccatt tggctggacc cagagtccgc gtggaaccgc gatagggatc 240

tgtcagggcc cgcggccggg tccagcttgg tggttgcggt agtgagaggc ctccgctggt 300

tgccaggctt ggtctagagg tggagcacag tgaaagaatt caagatgcca cctaatataa 360

actggaaaga aataatgaaa gttgacccag atgacctgcc ccgtcaagaa gaactggcag 420

ataatttatt gatttcctta tccaaggtgg aagtaaatga gctaaaaagt gaaaagcaag 480

aaaatgtgat acaccttttc agaattactc agtcactaat gaagatgaaa gctcaagaag 540

tggagctggc tttggaagaa gtagaaaaag ctggagaaga acaagcaaaa tttgaaaatc 600

aattaaaaac taaagtaatg aaactggaaa atgaactgga gatggctcag cagtctgcag 660

gtggacgaga tactcggttt ttacgtaatg aaatttgcca acttgaaaaa caattagaac 720

aaaaagatag agaattggag gacatggaaa aggagttgga gaaagagaag aaagttaatg 780

agcaattggc tcttcgaaat gaggaggcag aaaatgaaaa cagcaaatta agaagagaga 840

acaaacgtct aaagaaaaag aatgaacaac tttgtcagga tattattgac taccagaaac 900

aaatagattc acagaaagaa acacttttat caagaagagg ggaagacagt gactaccgat 960

cacagttgtc taaaaaaaac tatgagctta tccaatatct tgatgaaatt cagactttaa 1020

cagaagctaa tgagaaaatt gaagttcaga atcaagaaat gagaaaaaat ttagaagagt 1080

ctgtacagga aatggagaag atgactgatg aatataatag aatgaaagct attgtgcatc 1140

agacagataa tgtaatagat cagttaaaaa aagaaaacga tcattatcaa cttcaagtgc 1200

aggagcttac agatcttctg aaatcaaaaa atgaagaaga tgatccaatt atggtagctg 1260

tcaatgcaaa agtagaagaa tggaagctaa ttttgtcttc taaagatgat gaaattattg 1320

agtatcagca aatgttacat aacctaaggg agaaacttaa gaatgctcag cttgatgctg 1380

ataaaagtaa tgttatggct ctacagcagg gtatacagga acgagacagt caaattaaga 1440

tgctcaccga acaagtagaa caatatacaa aagaaatgga aaagaatact tgtattattg 1500

aagatttgaa aaatgagctc caaagaaaca aaggtgcttc aaccctttct caacagactc 1560

atatgaaaat tcagtcaacg ttagacattt taaaagagaa aactaaagag gctgagagaa 1620

cagctgaact ggctgaggct gatgctaggg aaaaggataa agaattagtt gaggctctga 1680

agaggttaaa agattatgaa tcgggagtat atggtttaga agatgctgtc gttgaaataa 1740

agaattgtaa aaaccaaatt aaaataagag atcgagagat tgaaatatta acaaaggaaa 1800

tcaataaact tgaattgaag atcagtgatt tccttgatga aaatgaggca cttagagagc 1860

gtgtgggcct tgaaccaaag acaatgattg atttaactga atttagaaat agcaaacact 1920

taaaacagca gcagtacaga gctgaaaacc agattctttt gaaagagatt gaaagtctag 1980

aggaagaacg acttgatctg aaaaaaaaaa ttcgtcaaat ggctcaagaa agaggaaaaa 2040

gaagtgcaac ttcaggatta accactgagg acctgaacct aactgaaaac atttctcaag 2100

gagatagaat aagtgaaaga aaattggatt tattgagcct caaaaatatg agtgaagcac 2160

aatcaaagaa tgaatttctt tcaagagaac taattgaaaa agaaagagat ttagaaagga 2220

gtaggacagt gatagccaaa tttcagaata aattaaaaga attagttgaa gaaaataagc 2280

aacttgaaga aggtatgaaa gaaatattgc aagcaattaa ggaaatgcag aaagatcctg 2340

atgttaaagg aggagaaaca tctctaatta tccctagcct tgaaagacta gttaatgcta 2400

tagaatcaaa gaatgcagaa ggaatctttg atgcgagtct gcatttgaaa gcccaagttg 2460

atcagcttac cggaagaaat gaagaattaa gacaggagct cagggaatct cggaaagagg 2520

ctataaatta ttcacagcag ttggcaaaag ctaatttaaa gatagaccat cttgaaaaag 2580

aaactagtct tttacgacaa tcagaaggat cgaatgttgt ttttaaagga attgacttac 2640

ctgatgggat agcaccatct agtgccagta tcattaattc tcagaatgaa tatttaatac 2700

atttgttaca ggaactagaa aataaagaaa aaaagttaaa gaatttagaa gattctcttg 2760

aagattacaa cagaaaattt gctgtaattc gtcatcaaca aagtttgttg tataaagaat 2820

acctaagtga aaaggagacc tggaaaacag aatctaaaac aataaaagag gaaaagagaa 2880

aacttgagga tcaagtccaa caagatgcta taaaagtaaa agaatataat aatttgctca 2940

atgctcttca gatggattcg gatgaaatga aaaaaatact tgcagaaaat agtaggaaaa 3000

ttactgtttt gcaagtgaat gaaaaatcac ttataaggca atatacaacc ttagtagaat 3060

tggagcgaca acttagaaaa gaaaatgaga agcaaaagaa tgaattgttg tcaatggagg 3120

ctgaagtttg tgaaaaaatt gggtgtttgc aaagatttaa ggaaatggcc attttcaaga 3180

ttgcagctct ccaaaaagtt gtagataata gtgtttcttt gtctgaacta gaactggcta 3240

ataaacagta caatgaactg actgctaagt acagggacat cttgcaaaaa gataatatgc 3300

ttgttcaaag aacaagtaac ttggaacacc tggagtgtga aaacatctcc ttaaaagaac 3360

aagtggagtc tataaataaa gaactggaga ttaccaagga aaaacttcac actattgaac 3420

aagcctggga acaggaaact aaattaggta atgaatctag catggataag gcaaagaaat 3480

caataaccaa cagtgacatt gtttccattt caaaaaaaat aactatgctg gaaatgaagg 3540

aattaaatga aaggcagcgg gctgaacatt gtcaaaaaat gtatgaacac ttacggactt 3600

cgttaaagca aatggaggaa cgtaattttg aattggaaac caaatttgct gagcttacca 3660

aaatcaattt ggatgcacag aaggtggaac agatgttaag agatgaatta gctgatagtg 3720

tgagcaaggc agtaagtgat gctgataggc aacggattct agaattagag aagaatgaaa 3780

tggaactaaa agttgaagtg tcaaaactga gagagatttc tgatattgcc agaagacaag 3840

ttgaaatttt gaatgcacaa caacaatcta gggacaagga agtagagtcc ctcagaatgc 3900

aactgctaga ctatcaggca cagtctgatg aaaagtcgct cattgccaag ttgcaccaac 3960

ataatgtctc tcttcaactg agtgaggcta ctgctcttgg taagttggag tcaattacat 4020

ctaaactgca gaagatggag gcctacaact tgcgcttaga gcagaaactt gatgaaaaag 4080

aacaggctct ctattatgct cgtttggagg gaagaaacag agcaaaacat ctgcgccaaa 4140

caattcagtc tctacgacga cagtttagtg gagctttacc cttggcacaa caggaaaagt 4200

tctccaaaac aatgattcaa ctacaaaatg acaaacttaa gataatgcaa gaaatgaaaa 4260

attctcaaca agaacataga aatatggaga acaaaacatt ggagatggaa ttaaaattaa 4320

agggcctgga agagttaata agcactttaa aggataccaa aggagcccaa aaggtaatca 4380

actggcatat gaaaatagaa gaacttcgtc ttcaagaact taaactaaat cgggaattag 4440

tcaaggataa agaagaaata aaatatttga ataacataat ttctgaatat gaacgtacaa 4500

tcagcagtct tgaagaagaa attgtgcaac agaacaagtt tcatgaagaa agacaaatgg 4560

cctgggatca aagagaagtt gacctggaac gccaactaga catttttgac cgtcagcaaa 4620

atgaaatact aaatgcggca caaaagtttg aagaagctac aggatcaatc cctgacccta 4680

gtttgcccct tccaaatcaa cttgagatcg ctctaaggaa aattaaggag aacattcgaa 4740

taattctaga aacacgggca acttgcaaat cactagaaga gaaactaaaa gagaaagaat 4800

ctgctttaag gttagcagaa caaaatatac tgtcaagaga caaagtaatc aatgaactga 4860

ggcttcgatt gcctgccact gcagaaagag aaaagctcat agctgagcta ggcagaaaag 4920

agatggaacc aaaatctcac cacacattga aaattgctca tcaaaccatt gcaaacatgc 4980

aagcaaggtt aaatcaaaaa gaagaagtat taaagaagta tcaacgtctt ctagaaaaag 5040

ccagagagga gcaaagagaa attgtgaaga aacatgagga agaccttcat attcttcatc 5100

acagattaga actacaggct gatagttcac taaataaatt caaacaaacg gcttgggatt 5160

taatgaaaca gtctcccact ccagttccta ccaacaagca ttttattcgt ctggctgaga 5220

tggaacagac agtagcagaa caagatgact ctctttcctc actcttggtc aaactaaaga 5280

aagtatcaca agatttggag agacaaagag aaatcactga attaaaagta aaagaatttg 5340

aaaatatcaa attacagctt caagaaaacc atgaagatga agtgaaaaaa gtaaaagcgg 5400

aagtagagga tttaaagtat cttctggacc agtcacaaaa ggagtcacag tgtttaaaat 5460

ctgaacttca ggctcaaaaa gaagcaaatt caagagctcc aacaactaca atgagaaatc 5520

tagtagaacg gctaaagagc caattagcct tgaaggagaa acaacagaaa gcacttagtc 5580

gggcactttt agaactccgg gcagaaatga cagcagctgc tgaagaacgt attatttctg 5640

caacttctca aaaagaggcc catctcaatg ttcaacaaat cgttgatcga catactagag 5700

agctaaagac acaagttgaa gatttaaatg aaaatctttt aaaattgaaa gaagcactta 5760

aaacaagtaa aaacagagaa aactcactaa ctgataattt gaatgactta aataatgaac 5820

tgcaaaagaa acaaaaagcc tataataaaa tacttagaga gaaagaggaa attgatcaag 5880

agaatgatga actgaaaagg caaattaaaa gactaaccag tggattacag ggcaaacccc 5940

tgacagataa taaacaaagt ctaattgaag aactccaaag gaaagttaaa aaactagaga 6000

accaattaga gggaaaggtg gaggaagtag acctaaaacc tatgaaagaa aagaatgcta 6060

aagaagaatt aattaggtgg gaagaaggta aaaagtggca agccaaaata gaaggaattc 6120

gaaacaagtt aaaagagaaa gagggggaag tctttacttt aacaaagcag ttgaatactt 6180

tgaaggatct ttttgccaaa gccgataaag agaaacttac tttgcagagg aaactaaaaa 6240

caactggcat gactgttgat caggttttgg gaatacgagc tttggagtca gaaaaagaat 6300

tggaagaatt aaaaaagaga aatcttgact tagaaaatga tatattgtat atgagggccc 6360

accaagctct tcctcgagat tctgttgtag aagatttaca tttacaaaat agatacctcc 6420

aagaaaaact tcatgcttta gaaaaacagt tttcaaagga tacatattct aagccttcaa 6480

tttcaggaat agagtcagat gatcattgtc agagagaaca ggagcttcag aaggaaaact 6540

tgaagttgtc atctgaaaat attgaactga aatttcagct tgaacaagca aataaagatt 6600

tgccaagatt aaagaatcaa gtcagagatt tgaaggaaat gtgtgaattt cttaagaaag 6660

aaaaagcaga agttcagcgg aaacttggcc atgttagagg gtctggtaga agtggaaaga 6720

caatcccaga actggaaaaa accattggtt taatgaaaaa agtagttgaa aaagtccaga 6780

gagaaaatga acagttgaaa aaagcatcag gaatattgac tagtgaaaaa atggctaata 6840

ttgagcagga aaatgaaaaa ttgaaggctg aattagaaaa acttaaagct catcttgggc 6900

atcagttgag catgcactat gaatccaaga ccaaaggcac agaaaaaatt attgctgaaa 6960

atgaaaggct tcgtaaagaa cttaaaaaag aaactgatgc tgcagagaaa ttacggatag 7020

caaagaataa tttagagata ttaaatgaga agatgacagt tcaactagaa gagactggta 7080

agagattgca gtttgcagaa agcagaggtc cacagcttga aggtgctgac agtaagagct 7140

ggaaatccat tgtggttaca agaatgtatg aaaccaagtt aaaagaattg gaaactgata 7200

ttgccaaaaa aaatcaaagc attactgacc ttaaacagct tgtaaaagaa gcaacagaga 7260

gagaacaaaa agttaacaaa tacaatgaag accttgaaca acagattaag attcttaaac 7320

atgttcctga aggtgctgag acagagcaag gccttaaacg ggagcttcaa gttcttagat 7380

tagctaatca tcagctggat aaagagaaag cagaattaat ccatcagata gaagctaaca 7440

aggaccaaag tggagctgaa agcaccatac ctgatgctga tcaactaaag gaaaaaataa 7500

aagatctaga gacacagctc aaaatgtcag atctagaaaa gcagcatttg aaggaggaaa 7560

taaagaagct gaaaaaagaa ctggaaaatt ttgatccttc attttttgaa gaaattgaag 7620

atcttaagta taattacaag gaagaagtga agaagaatat tctcttagaa gagaaggtaa 7680

aaaaactttc agaacaattg ggagttgaat taactagccc tgttgctgct tctgaagagt 7740

ttgaagatga agaagaaagt cctgttaatt tccccattta ctaaaggtca cctataaact 7800

ttgtttcatt taactattta ttaactttat aagttaaata tacttggaaa taagcagttc 7860

tccgaactgt agtatttcct tctcactacc ttgtaccttt atacttagat tggaattctt 7920

aataaataaa attatatgaa attttcaact tattaaaaaa aaaaaaaaaa aa 7972

<210> 41

<211> 2479

<212> PRT

<213> 智人

<400> 41

Met Pro Pro Asn Ile Asn Trp Lys Glu Ile Met Lys Val Asp Pro Asp

1 5 10 15

Asp Leu Pro Arg Gln Glu Glu Leu Ala Asp Asn Leu Leu Ile Ser Leu

20 25 30

Ser Lys Val Glu Val Asn Glu Leu Lys Ser Glu Lys Gln Glu Asn Val

35 40 45

Ile His Leu Phe Arg Ile Thr Gln Ser Leu Met Lys Met Lys Ala Gln

50 55 60

Glu Val Glu Leu Ala Leu Glu Glu Val Glu Lys Ala Gly Glu Glu Gln

65 70 75 80

Ala Lys Phe Glu Asn Gln Leu Lys Thr Lys Val Met Lys Leu Glu Asn

85 90 95

Glu Leu Glu Met Ala Gln Gln Ser Ala Gly Gly Arg Asp Thr Arg Phe

100 105 110

Leu Arg Asn Glu Ile Cys Gln Leu Glu Lys Gln Leu Glu Gln Lys Asp

115 120 125

Arg Glu Leu Glu Asp Met Glu Lys Glu Leu Glu Lys Glu Lys Lys Val

130 135 140

Asn Glu Gln Leu Ala Leu Arg Asn Glu Glu Ala Glu Asn Glu Asn Ser

145 150 155 160

Lys Leu Arg Arg Glu Asn Lys Arg Leu Lys Lys Lys Asn Glu Gln Leu

165 170 175

Cys Gln Asp Ile Ile Asp Tyr Gln Lys Gln Ile Asp Ser Gln Lys Glu

180 185 190

Thr Leu Leu Ser Arg Arg Gly Glu Asp Ser Asp Tyr Arg Ser Gln Leu

195 200 205

Ser Lys Lys Asn Tyr Glu Leu Ile Gln Tyr Leu Asp Glu Ile Gln Thr

210 215 220

Leu Thr Glu Ala Asn Glu Lys Ile Glu Val Gln Asn Gln Glu Met Arg

225 230 235 240

Lys Asn Leu Glu Glu Ser Val Gln Glu Met Glu Lys Met Thr Asp Glu

245 250 255

Tyr Asn Arg Met Lys Ala Ile Val His Gln Thr Asp Asn Val Ile Asp

260 265 270

Gln Leu Lys Lys Glu Asn Asp His Tyr Gln Leu Gln Val Gln Glu Leu

275 280 285

Thr Asp Leu Leu Lys Ser Lys Asn Glu Glu Asp Asp Pro Ile Met Val

290 295 300

Ala Val Asn Ala Lys Val Glu Glu Trp Lys Leu Ile Leu Ser Ser Lys

305 310 315 320

Asp Asp Glu Ile Ile Glu Tyr Gln Gln Met Leu His Asn Leu Arg Glu

325 330 335

Lys Leu Lys Asn Ala Gln Leu Asp Ala Asp Lys Ser Asn Val Met Ala

340 345 350

Leu Gln Gln Gly Ile Gln Glu Arg Asp Ser Gln Ile Lys Met Leu Thr

355 360 365

Glu Gln Val Glu Gln Tyr Thr Lys Glu Met Glu Lys Asn Thr Cys Ile

370 375 380

Ile Glu Asp Leu Lys Asn Glu Leu Gln Arg Asn Lys Gly Ala Ser Thr

385 390 395 400

Leu Ser Gln Gln Thr His Met Lys Ile Gln Ser Thr Leu Asp Ile Leu

405 410 415

Lys Glu Lys Thr Lys Glu Ala Glu Arg Thr Ala Glu Leu Ala Glu Ala

420 425 430

Asp Ala Arg Glu Lys Asp Lys Glu Leu Val Glu Ala Leu Lys Arg Leu

435 440 445

Lys Asp Tyr Glu Ser Gly Val Tyr Gly Leu Glu Asp Ala Val Val Glu

450 455 460

Ile Lys Asn Cys Lys Asn Gln Ile Lys Ile Arg Asp Arg Glu Ile Glu

465 470 475 480

Ile Leu Thr Lys Glu Ile Asn Lys Leu Glu Leu Lys Ile Ser Asp Phe

485 490 495

Leu Asp Glu Asn Glu Ala Leu Arg Glu Arg Val Gly Leu Glu Pro Lys

500 50 5 510

Thr Met Ile Asp Leu Thr Glu Phe Arg Asn Ser Lys His Leu Lys Gln

515 52 0 525

Gln Gln Tyr Arg Ala Glu Asn Gln Ile Leu Leu Lys Glu Ile Glu Ser

530 535 540

Leu Glu Glu Glu Arg Leu Asp Leu Lys Lys Lys Ile Arg Gln Met Ala

545 550 555 560

Gln Glu Arg Gly Lys Arg Ser Ala Thr Ser Gly Leu Thr Thr Glu Asp

565 570 575

Leu Asn Leu Thr Glu Asn Ile Ser Gln Gly Asp Arg Ile Ser Glu Arg

580 585 590

Lys Leu Asp Leu Leu Ser Leu Lys Asn Met Ser Glu Ala Gln Ser Lys

595 600 605

Asn Glu Phe Leu Ser Arg Glu Leu Ile Glu Lys Glu Arg Asp Leu Glu

610 615 620

Arg Ser Arg Thr Val Ile Ala Lys Phe Gln Asn Lys Leu Lys Glu Leu

625 630 635 640

Val Glu Glu Asn Lys Gln Leu Glu Glu Gly Met Lys Glu Ile Leu Gln

645 650 655

Ala Ile Lys Glu Met Gln Lys Asp Pro Asp Val Lys Gly Gly Glu Thr

660 665 670

Ser Leu Ile Ile Pro Ser Leu Glu Arg Leu Val Asn Ala Ile Glu Ser

675 680 685

Lys Asn Ala Glu Gly Ile Phe Asp Ala Ser Leu His Leu Lys Ala Gln

690 695 700

Val Asp Gln Leu Thr Gly Arg Asn Glu Glu Leu Arg Gln Glu Leu Arg

705 710 715 720

Glu Ser Arg Lys Glu Ala Ile Asn Tyr Ser Gln Gln Leu Ala Lys Ala

725 730 735

Asn Leu Lys Ile Asp His Leu Glu Lys Glu Thr Ser Leu Leu Arg Gln

740 745 750

Ser Glu Gly Ser Asn Val Val Phe Lys Gly Ile Asp Leu Pro Asp Gly

755 760 765

Ile Ala Pro Ser Ser Ala Ser Ile Ile Asn Ser Gln Asn Glu Tyr Leu

770 775 780

Ile His Leu Leu Gln Glu Leu Glu Asn Lys Glu Lys Lys Leu Lys Asn

785 790 795 800

Leu Glu Asp Ser Leu Glu Asp Tyr Asn Arg Lys Phe Ala Val Ile Arg

805 810 815

His Gln Gln Ser Leu Leu Tyr Lys Glu Tyr Leu Ser Glu Lys Glu Thr

820 825 830

Trp Lys Thr Glu Ser Lys Thr Ile Lys Glu Glu Lys Arg Lys Leu Glu

835 840 845

Asp Gln Val Gln Gln Asp Ala Ile Lys Val Lys Glu Tyr Asn Asn Leu

850 855 860

Leu Asn Ala Leu Gln Met Asp Ser Asp Glu Met Lys Lys Ile Leu Ala

865 870 875 880

Glu Asn Ser Arg Lys Ile Thr Val Leu Gln Val Asn Glu Lys Ser Leu

885 890 895

Ile Arg Gln Tyr Thr Thr Leu Val Glu Leu Glu Arg Gln Leu Arg Lys

900 905 910

Glu Asn Glu Lys Gln Lys Asn Glu Leu Leu Ser Met Glu Ala Glu Val

915 920 925

Cys Glu Lys Ile Gly Cys Leu Gln Arg Phe Lys Glu Met Ala Ile Phe

930 935 940

Lys Ile Ala Ala Leu Gln Lys Val Val Asp Asn Ser Val Ser Leu Ser

945 950 955 960

Glu Leu Glu Leu Ala Asn Lys Gln Tyr Asn Glu Leu Thr Ala Lys Tyr

965 970 975

Arg Asp Ile Leu Gln Lys Asp Asn Met Leu Val Gln Arg Thr Ser Asn

980 985 990

Leu Glu His Leu Glu Cys Glu Asn Ile Ser Leu Lys Glu Gln Val Glu

995 1000 1005

Ser Ile Asn Lys Glu Leu Glu Ile Thr Lys Glu Lys Leu His Thr

1010 1015 1020

Ile Glu Gln Ala Trp Glu Gln Glu Thr Lys Leu Gly Asn Glu Ser

1025 1030 1035

Ser Met Asp Lys Ala Lys Lys Ser Ile Thr Asn Ser Asp Ile Val

1040 1045 1050

Ser Ile Ser Lys Lys Ile Thr Met Leu Glu Met Lys Glu Leu Asn

1055 1060 1065

Glu Arg Gln Arg Ala Glu His Cys Gln Lys Met Tyr Glu His Leu

1070 1075 1080

Arg Thr Ser Leu Lys Gln Met Glu Glu Arg Asn Phe Glu Leu Glu

1085 1090 1095

Thr Lys Phe Ala Glu Leu Thr Lys Ile Asn Leu Asp Ala Gln Lys

1100 1105 1110

Val Glu Gln Met Leu Arg Asp Glu Leu Ala Asp Ser Val Ser Lys

1115 1120 1125

Ala Val Ser Asp Ala Asp Arg Gln Arg Ile Leu Glu Leu Glu Lys

1130 1135 1140

Asn Glu Met Glu Leu Lys Val Glu Val Ser Lys Leu Arg Glu Ile

1145 1150 1155

Ser Asp Ile Ala Arg Arg Gln Val Glu Ile Leu Asn Ala Gln Gln

1160 1165 1170

Gln Ser Arg Asp Lys Glu Val Glu Ser Leu Arg Met Gln Leu Leu

1175 1180 1185

Asp Tyr Gln Ala Gln Ser Asp Glu Lys Ser Leu Ile Ala Lys Leu

1190 1195 1200

His Gln His Asn Val Ser Leu Gln Leu Ser Glu Ala Thr Ala Leu

1205 1210 1215

Gly Lys Leu Glu Ser Ile Thr Ser Lys Leu Gln Lys Met Glu Ala

1220 1225 1230

Tyr Asn Leu Arg Leu Glu Gln Lys Leu Asp Glu Lys Glu Gln Ala

1235 1240 1245

Leu Tyr Tyr Ala Arg Leu Glu Gly Arg Asn Arg Ala Lys His Leu

1250 1255 1260

Arg Gln Thr Ile Gln Ser Leu Arg Arg Gln Phe Ser Gly Ala Leu

1265 1270 1275

Pro Leu Ala Gln Gln Glu Lys Phe Ser Lys Thr Met Ile Gln Leu

1280 1285 1290

Gln Asn Asp Lys Leu Lys Ile Met Gln Glu Met Lys Asn Ser Gln

1295 1300 1305

Gln Glu His Arg Asn Met Glu Asn Lys Thr Leu Glu Met Glu Leu

1310 1315 1320

Lys Leu Lys Gly Leu Glu Glu Leu Ile Ser Thr Leu Lys Asp Thr

1325 1330 1335

Lys Gly Ala Gln Lys Val Ile Asn Trp His Met Lys Ile Glu Glu

1340 1345 1350

Leu Arg Leu Gln Glu Leu Lys Leu Asn Arg Glu Leu Val Lys Asp

1355 1360 1365

Lys Glu Glu Ile Lys Tyr Leu Asn Asn Ile Ile Ser Glu Tyr Glu

1370 1375 1380

Arg Thr Ile Ser Ser Leu Glu Glu Glu Ile Val Gln Gln Asn Lys

1385 1390 1395

Phe His Glu Glu Arg Gln Met Ala Trp Asp Gln Arg Glu Val Asp

1400 1405 1410

Leu Glu Arg Gln Leu Asp Ile Phe Asp Arg Gln Gln Asn Glu Ile

1415 1420 1425

Leu Asn Ala Ala Gln Lys Phe Glu Glu Ala Thr Gly Ser Ile Pro

1430 1435 1440

Asp Pro Ser Leu Pro Leu Pro Asn Gln Leu Glu Ile Ala Leu Arg

1445 1450 1455

Lys Ile Lys Glu Asn Ile Arg Ile Ile Leu Glu Thr Arg Ala Thr

1460 1465 1470

Cys Lys Ser Leu Glu Glu Lys Leu Lys Glu Lys Glu Ser Ala Leu

1475 1480 1485

Arg Leu Ala Glu Gln Asn Ile Leu Ser Arg Asp Lys Val Ile Asn

1490 1495 1500

Glu Leu Arg Leu Arg Leu Pro Ala Thr Ala Glu Arg Glu Lys Leu

1505 1510 1515

Ile Ala Glu Leu Gly Arg Lys Glu Met Glu Pro Lys Ser His His

1520 1525 1530

Thr Leu Lys Ile Ala His Gln Thr Ile Ala Asn Met Gln Ala Arg

1535 1540 1545

Leu Asn Gln Lys Glu Glu Val Leu Lys Lys Tyr Gln Arg Leu Leu

1550 1555 1560

Glu Lys Ala Arg Glu Glu Gln Arg Glu Ile Val Lys Lys His Glu

1565 1570 1575

Glu Asp Leu His Ile Leu His His Arg Leu Glu Leu Gln Ala Asp

1580 1585 1590

Ser Ser Leu Asn Lys Phe Lys Gln Thr Ala Trp Asp Leu Met Lys

1595 1600 1605

Gln Ser Pro Thr Pro Val Pro Thr Asn Lys His Phe Ile Arg Leu

1610 1615 1620

Ala Glu Met Glu Gln Thr Val Ala Glu Gln Asp Asp Ser Leu Ser

1625 1630 1635

Ser Leu Leu Val Lys Leu Lys Lys Val Ser Gln Asp Leu Glu Arg

1640 1645 1650

Gln Arg Glu Ile Thr Glu Leu Lys Val Lys Glu Phe Glu Asn Ile

1655 1660 1665

Lys Leu Gln Leu Gln Glu Asn His Glu Asp Glu Val Lys Lys Val

1670 1675 1680

Lys Ala Glu Val Glu Asp Leu Lys Tyr Leu Leu Asp Gln Ser Gln

1685 1690 1695

Lys Glu Ser Gln Cys Leu Lys Ser Glu Leu Gln Ala Gln Lys Glu

1700 1705 1710

Ala Asn Ser Arg Ala Pro Thr Thr Thr Met Arg Asn Leu Val Glu

1715 1720 1725

Arg Leu Lys Ser Gln Leu Ala Leu Lys Glu Lys Gln Gln Lys Ala

1730 1735 1740

Leu Ser Arg Ala Leu Leu Glu Leu Arg Ala Glu Met Thr Ala Ala

1745 1750 1755

Ala Glu Glu Arg Ile Ile Ser Ala Thr Ser Gln Lys Glu Ala His

1760 1765 1770

Leu Asn Val Gln Gln Ile Val Asp Arg His Thr Arg Glu Leu Lys

1775 1780 1785

Thr Gln Val Glu Asp Leu Asn Glu Asn Leu Leu Lys Leu Lys Glu

1790 1795 1800

Ala Leu Lys Thr Ser Lys Asn Arg Glu Asn Ser Leu Thr Asp Asn

1805 1810 1815

Leu Asn Asp Leu Asn Asn Glu Leu Gln Lys Lys Gln Lys Ala Tyr

1820 1825 1830

Asn Lys Ile Leu Arg Glu Lys Glu Glu Ile Asp Gln Glu Asn Asp

1835 1840 1845

Glu Leu Lys Arg Gln Ile Lys Arg Leu Thr Ser Gly Leu Gln Gly

1850 1855 1860

Lys Pro Leu Thr Asp Asn Lys Gln Ser Leu Ile Glu Glu Leu Gln

1865 1870 1875

Arg Lys Val Lys Lys Leu Glu Asn Gln Leu Glu Gly Lys Val Glu

1880 1885 1890

Glu Val Asp Leu Lys Pro Met Lys Glu Lys Asn Ala Lys Glu Glu

1895 1900 1905

Leu Ile Arg Trp Glu Glu Gly Lys Lys Trp Gln Ala Lys Ile Glu

1910 1915 1920

Gly Ile Arg Asn Lys Leu Lys Glu Lys Glu Gly Glu Val Phe Thr

1925 1930 1935

Leu Thr Lys Gln Leu Asn Thr Leu Lys Asp Leu Phe Ala Lys Ala

1940 1945 1950

Asp Lys Glu Lys Leu Thr Leu Gln Arg Lys Leu Lys Thr Thr Gly

1955 1960 1965

Met Thr Val Asp Gln Val Leu Gly Ile Arg Ala Leu Glu Ser Glu

1970 1975 1980

Lys Glu Leu Glu Glu Leu Lys Lys Arg Asn Leu Asp Leu Glu Asn

1985 1990 1995

Asp Ile Leu Tyr Met Arg Ala His Gln Ala Leu Pro Arg Asp Ser

2000 2005 2010

Val Val Glu Asp Leu His Leu Gln Asn Arg Tyr Leu Gln Glu Lys

2015 2020 2025

Leu His Ala Leu Glu Lys Gln Phe Ser Lys Asp Thr Tyr Ser Lys

2030 2035 2040

Pro Ser Ile Ser Gly Ile Glu Ser Asp Asp His Cys Gln Arg Glu

2045 2050 2055

Gln Glu Leu Gln Lys Glu Asn Leu Lys Leu Ser Ser Glu Asn Ile

2060 2065 2070

Glu Leu Lys Phe Gln Leu Glu Gln Ala Asn Lys Asp Leu Pro Arg

2075 2080 2085

Leu Lys Asn Gln Val Arg Asp Leu Lys Glu Met Cys Glu Phe Leu

2090 2095 2100

Lys Lys Glu Lys Ala Glu Val Gln Arg Lys Leu Gly His Val Arg

2105 2110 2115

Gly Ser Gly Arg Ser Gly Lys Thr Ile Pro Glu Leu Glu Lys Thr

2120 2125 2130

Ile Gly Leu Met Lys Lys Val Val Glu Lys Val Gln Arg Glu Asn

2135 2140 2145

Glu Gln Leu Lys Lys Ala Ser Gly Ile Leu Thr Ser Glu Lys Met

2150 2155 2160

Ala Asn Ile Glu Gln Glu Asn Glu Lys Leu Lys Ala Glu Leu Glu

2165 2170 2175

Lys Leu Lys Ala His Leu Gly His Gln Leu Ser Met His Tyr Glu

2180 2185 2190

Ser Lys Thr Lys Gly Thr Glu Lys Ile Ile Ala Glu Asn Glu Arg

2195 2200 2205

Leu Arg Lys Glu Leu Lys Lys Glu Thr Asp Ala Ala Glu Lys Leu

2210 2215 2220

Arg Ile Ala Lys Asn Asn Leu Glu Ile Leu Asn Glu Lys Met Thr

2225 2230 2235

Val Gln Leu Glu Glu Thr Gly Lys Arg Leu Gln Phe Ala Glu Ser

2240 2245 2250

Arg Gly Pro Gln Leu Glu Gly Ala Asp Ser Lys Ser Trp Lys Ser

2255 2260 2265

Ile Val Val Thr Arg Met Tyr Glu Thr Lys Leu Lys Glu Leu Glu

2270 2275 2280

Thr Asp Ile Ala Lys Lys Asn Gln Ser Ile Thr Asp Leu Lys Gln

2285 2290 2295

Leu Val Lys Glu Ala Thr Glu Arg Glu Gln Lys Val Asn Lys Tyr

2300 2305 2310

Asn Glu Asp Leu Glu Gln Gln Ile Lys Ile Leu Lys His Val Pro

2315 2320 2325

Glu Gly Ala Glu Thr Glu Gln Gly Leu Lys Arg Glu Leu Gln Val

2330 2335 2340

Leu Arg Leu Ala Asn His Gln Leu Asp Lys Glu Lys Ala Glu Leu

2345 2350 2355

Ile His Gln Ile Glu Ala Asn Lys Asp Gln Ser Gly Ala Glu Ser

2360 2365 2370

Thr Ile Pro Asp Ala Asp Gln Leu Lys Glu Lys Ile Lys Asp Leu

2375 2380 2385

Glu Thr Gln Leu Lys Met Ser Asp Leu Glu Lys Gln His Leu Lys

2390 2395 2400

Glu Glu Ile Lys Lys Leu Lys Lys Glu Leu Glu Asn Phe Asp Pro

2405 2410 2415

Ser Phe Phe Glu Glu Ile Glu Asp Leu Lys Tyr Asn Tyr Lys Glu

2420 2425 2430

Glu Val Lys Lys Asn Ile Leu Leu Glu Glu Lys Val Lys Lys Leu

2435 2440 2445

Ser Glu Gln Leu Gly Val Glu Leu Thr Ser Pro Val Ala Ala Ser

2450 2455 2460

Glu Glu Phe Glu Asp Glu Glu Glu Ser Pro Val Asn Phe Pro Ile

2465 2470 2475

Tyr

<210> 42

<211> 2625

<212> DNA

<213> 智人

<400> 42

actcgaccgg gctgcgctca ctgcccagcc ggggccccgg gagcctccag gctcccgccc 60

gccctgagct gcggcctccg catggagggg ccactcactc caccaccgct gcagggaggc 120

ggagccgccg ctgttccgga gcccggagcc cggcaacacc cgggacacga gacggcggcg 180

cagcggtaca gcgcccgact gctgcaggcc ggctacgagc ccgagagccc tagattggac 240

ctcgctacac acccgacgac accccgttca gaactatctt cagtggtctt actggcaggt 300

gttggtgtcc agatggatcg ccttcgcagg gctagcatgg cggactacct gatcagcggc 360

ggcaccggct acgtgcccga ggatgggctc accgcgcagc agctcttcgc cagcgccgac 420

ggcctcacct acaacgactt cctgattctc ccaggattca tagacttcat agctgatgag 480

gtggacctga cctcagccct gacccggaag atcacgctga agacgccact gatctcctcc 540

cccatggaca ctgtgacaga ggctgacatg gccattgcca tggctctgat gggaggtatt 600

ggtttcattc accacaactg caccccagag ttccaggcca acgaggtgcg gaaggtcaag 660

aagtttgaac agggcttcat cacggaccct gtggtgctga gcccctcgca cactgtgggc 720

gatgtgctgg aggccaagat gcggcatggc ttctctggca tccccatcac tgagacgggc 780

accatgggca gcaagctggt gggcatcgtc acctcccgag acatcgactt tcttgctgag 840

aaggaccaca ccaccctcct cagtgaggtg atgacgccaa ggattgaact ggtggtggct 900

ccagcaggtg tgacgttgaa agaggcaaat gagatcctgc agcgtagcaa gaaagggaag 960

ctgcctatcg tcaatgattg cgatgagctg gtggccatca tcgcccgcac cgacctgaag 1020

aagaaccgag actaccctct ggcctccaag gattcccaga agcagctgct ctgtggggca 1080

gctgtgggca cccgtgagga tgacaaatac cgtctggacc tgctcaccca ggcgggcgtc 1140

gacgtcatag tcttggactc gtcccaaggg aattcggtgt atcagatcgc catggtgcat 1200

tacatcaaac agaagtaccc ccacctccag gtgattgggg ggaacgtggt gacagcagcc 1260

caggccaaga acctgattga tgctggtgtg gacgggctgc gcgtgggcat gggctgcggc 1320

tccatctgca tcacccagga agtgatggcc tgtggtcggc cccagggcac tgctgtgtac 1380

aaggtggctg agtatgcccg gcgctttggt gtgcccatca tagccgatgg cggcatccag 1440

accgtgggac acgtggtcaa ggccctggcc cttggagcct ccacagtgat gatgggctcc 1500

ctgctggccg ccactacgga ggcccctggc gagtacttct tctcagacgg ggtgcggctc 1560

aagaagtacc ggggcatggg ctcactggat gccatggaga agagcagcag cagccagaaa 1620

cgatacttca gcgaggggga taaagtgaag atcgcgcagg gtgtctcggg ctccatccag 1680

gacaaaggat ccattcagaa gttcgtgccc tacctcatag caggcatcca acacggctgc 1740

caggatatcg gggcccgcag cctgtctgtc cttcggtcca tgatgtactc aggagagctc 1800

aagtttgaga agcggaccat gtcggcccag attgagggtg gtgtccatgg cctgcactct 1860

tacgaaaagc ggctgtactg aggacagcgg tggaggccga ggtggtggag gggatgcacc 1920

ccagtgtcca cttttgggca cagcctccct ccataactga gtggtccaca gatttgcact 1980

acgggttctc cagctccttt ccaggcagag aggaggggag gtcctgaggg gactgctgcc 2040

cctcactcgg catcccctgc agagtcagga ctgctcccgg ggccaggctg ccctgggagc 2100

ccccctccga gcccagccag ccaggctctc aggccctgcg cctgcctcag gtctttcttg 2160

ctgcagcctg ctccagcctg gcccccaccc caggggcagg cggcccctcc tggcttctcc 2220

tgtagggcac ctccctgccc ctagcctccc aggaaatggt gctctcctgg ccctgcctct 2280

ggcccttccc gggccgctgc ccctcagcca tgtggcactt ctgagctcct gacctaggcc 2340

aaggggaggt ctctgccccc ttccccggcc ctgggctacc cttgggtcct gctcctcagg 2400

ccgctcccct gtccctggcc atgggtagga gactgccctg gtcatggccg cctgcctgtc 2460

attcctgact caccaccgtc cccaggtgaa ccattcctcc cttctcctca gctgcagtcg 2520

aaggctttaa ctttgcacac ttgggatcac agttgcgtca ttgtgtatta aatacttgga 2580

ataaatcaag caggtctcaa cgcctccact aaaaaaaaaa aaaaa 2625

<210> 43

<211> 599

<212> PRT

<213> 智人

<400> 43

Met Glu Gly Pro Leu Thr Pro Pro Pro Leu Gln Gly Gly Gly Ala Ala

1 5 10 15

Ala Val Pro Glu Pro Gly Ala Arg Gln His Pro Gly His Glu Thr Ala

20 25 30

Ala Gln Arg Tyr Ser Ala Arg Leu Leu Gln Ala Gly Tyr Glu Pro Glu

35 40 45

Ser Pro Arg Leu Asp Leu Ala Thr His Pro Thr Thr Pro Arg Ser Glu

50 55 60

Leu Ser Ser Val Val Leu Leu Ala Gly Val Gly Val Gln Met Asp Arg

65 70 75 80

Leu Arg Arg Ala Ser Met Ala Asp Tyr Leu Ile Ser Gly Gly Thr Gly

85 90 95

Tyr Val Pro Glu Asp Gly Leu Thr Ala Gln Gln Leu Phe Ala Ser Ala

100 105 110

Asp Gly Leu Thr Tyr Asn Asp Phe Leu Ile Leu Pro Gly Phe Ile Asp

115 120 125

Phe Ile Ala Asp Glu Val Asp Leu Thr Ser Ala Leu Thr Arg Lys Ile

130 135 140

Thr Leu Lys Thr Pro Leu Ile Ser Ser Pro Met Asp Thr Val Thr Glu

145 150 155 160

Ala Asp Met Ala Ile Ala Met Ala Leu Met Gly Gly Ile Gly Phe Ile

165 170 175

His His Asn Cys Thr Pro Glu Phe Gln Ala Asn Glu Val Arg Lys Val

180 185 190

Lys Lys Phe Glu Gln Gly Phe Ile Thr Asp Pro Val Val Leu Ser Pro

195 200 205

Ser His Thr Val Gly Asp Val Leu Glu Ala Lys Met Arg His Gly Phe

210 215 220

Ser Gly Ile Pro Ile Thr Glu Thr Gly Thr Met Gly Ser Lys Leu Val

225 230 235 240

Gly Ile Val Thr Ser Arg Asp Ile Asp Phe Leu Ala Glu Lys Asp His

245 250 255

Thr Thr Leu Leu Ser Glu Val Met Thr Pro Arg Ile Glu Leu Val Val

260 265 270

Ala Pro Ala Gly Val Thr Leu Lys Glu Ala Asn Glu Ile Leu Gln Arg

275 280 285

Ser Lys Lys Gly Lys Leu Pro Ile Val Asn Asp Cys Asp Glu Leu Val

290 295 300

Ala Ile Ile Ala Arg Thr Asp Leu Lys Lys Asn Arg Asp Tyr Pro Leu

305 310 315 320

Ala Ser Lys Asp Ser Gln Lys Gln Leu Leu Cys Gly Ala Ala Val Gly

325 330 335

Thr Arg Glu Asp Asp Lys Tyr Arg Leu Asp Leu Leu Thr Gln Ala Gly

340 345 350

Val Asp Val Ile Val Leu Asp Ser Ser Gln Gly Asn Ser Val Tyr Gln

355 360 365

Ile Ala Met Val His Tyr Ile Lys Gln Lys Tyr Pro His Leu Gln Val

370 375 380

Ile Gly Gly Asn Val Val Thr Ala Ala Gln Ala Lys Asn Leu Ile Asp

385 390 395 400

Ala Gly Val Asp Gly Leu Arg Val Gly Met Gly Cys Gly Ser Ile Cys

405 410 415

Ile Thr Gln Glu Val Met Ala Cys Gly Arg Pro Gln Gly Thr Ala Val

420 425 430

Tyr Lys Val Ala Glu Tyr Ala Arg Arg Phe Gly Val Pro Ile Ile Ala

435 440 445

Asp Gly Gly Ile Gln Thr Val Gly His Val Val Lys Ala Leu Ala Leu

450 455 460

Gly Ala Ser Thr Val Met Met Gly Ser Leu Leu Ala Ala Thr Thr Glu

465 470 475 480

Ala Pro Gly Glu Tyr Phe Phe Ser Asp Gly Val Arg Leu Lys Lys Tyr

485 490 495

Arg Gly Met Gly Ser Leu Asp Ala Met Glu Lys Ser Ser Ser Ser Gln

500 505 510

Lys Arg Tyr Phe Ser Glu Gly Asp Lys Val Lys Ile Ala Gln Gly Val

515 520 525

Ser Gly Ser Ile Gln Asp Lys Gly Ser Ile Gln Lys Phe Val Pro Tyr

530 535 540

Leu Ile Ala Gly Ile Gln His Gly Cys Gln Asp Ile Gly Ala Arg Ser

545 550 555 560

Leu Ser Val Leu Arg Ser Met Met Tyr Ser Gly Glu Leu Lys Phe Glu

565 570 575

Lys Arg Thr Met Ser Ala Gln Ile Glu Gly Gly Val His Gly Leu His

580 585 590

Ser Tyr Glu Lys Arg Leu Tyr

595

<210> 44

<211> 2981

<212> DNA

<213> 智人

<400> 44

gctgggtaaa tcccagagtc tcagccgcct aagtgtcttc cccggaggtg agattatctc 60

cgcctgtgct ggacacctcc ctttctcctg cagccatgga tgccgctctg ctcctgaacg 120

tggaaggggt caagaaaacc attctgcacg ggggcacggg cgagctccca aacttcatca 180

ccggatcccg agtgatcttt catttccgca ccatgaaatg tgatgaggag cggacagtca 240

ttgacgacag tcggcaggtg ggccagccca tgcacatcat catcggaaac atgttcaagc 300

tcgaggtctg ggagatcctg cttacctcca tgcgggtgca cgaggtggcc gagttctggt 360

gcgacaccat ccacacgggg gtctacccca tcctatcccg gagcctgagg cagatggccc 420

agggcaagga ccccacagag tggcacgtgc acacgtgcgg gctggccaac atgttcgcct 480

accacacgct gggctacgag gacctggacg agctgcagaa ggagcctcag cctctggtct 540

ttgtgatcga gctgctgcag gttgatgccc cgagtgatta ccagagggag acctggaacc 600

tgagcaatca tgagaagatg aaggcggtgc ccgtcctcca cggagaggga aatcggctct 660

tcaagctggg ccgctacgag gaggcctctt ccaagtacca ggaggccatc atctgcctaa 720

ggaacctgca gaccaaggag aagccatggg aggtgcagtg gctgaagctg gagaagatga 780

tcaatactct gatcctcaac tactgccagt gcctgctgaa gaaggaggag tactatgagg 840

tgctggagca caccagtgat attctccggc accacccagg catcgtgaag gcctactacg 900

tgcgtgcccg ggctcacgca gaggtgtgga atgaggccga ggccaaggcg gacctccaga 960

aagtgctgga gctggagccg tccatgcaga aggcggtgcg cagggagctg aggctgctgg 1020

agaaccgcat ggcggagaag caggaggagg agcggctgcg ctgccggaac atgctgagcc 1080

agggtgccac gcagcctccc gcagagccac ccacagagcc acccgcacag tcatccacag 1140

agccacctgc agagccaccc acagcaccat ctgcagagct gtccgcaggg ccccctgcag 1200

agccagccac agagccaccc ccgtccccag ggcactcgct gcagcactga gccccctgag 1260

gcccacagcc acccaggcag ggagcaagtg gcctggtcac ttctggttcg attgaccagg 1320

atcgtggtgt cactttttaa aatttaaaat taatttttga aatcaaagtc agacacaccc 1380

atggtaaaaa aaaaaaaaaa aacaatccca agggtacaga agagcttatg aataaaagta 1440

gttttctcct ctacccctct cattccttcc gtgccatggt tttaattgac cctgttttta 1500

attcttctgg tagttttctc tatttccaag taatctgttt aaatcagttt ctagatttta 1560

ccccatgtca atgacaaatg aggatttgat gctctgatcc tttctcatgc ctgatacccc 1620

tccctgtctc cccattttgg atagttacat ttgggggtca tctcggtgat ttttgtaact 1680

ttacgcagga cacttagagc tctctagaat cccactgact ttagtgggtc ttgatgtagg 1740

gtgggcaagc cccgacactg gagcttagcc tgagagggtt cttggcctcc cccaggaaag 1800

atttcaaagg caagcgccag tggtagggta gaagaaaaca gctgtggtcg ggcacggtgg 1860

ctcacgccta taatcccagc actttgggag gccgaggcgg gtggatcacc tgaggtcagg 1920

agttccagac cagcctggcc aacatggtga aacctcatct ctactaaaaa tacaaaaaaa 1980

ctagctgggc gtggtggcgg gcgcctataa tcccagctac ttgggaggct gaggcaggag 2040

aattgattga acctgggagg cggaggttgc agtgagccaa gatcacgtca ttgcactcca 2100

gcctggtcaa caagagtaaa acttcatctc aaaaaacaaa acaaaacaaa aacaacaaca 2160

aaaaacaaaa gaaaaacaaa caaaaccaaa accaaaacag ctgtattgaa gctgcagtgt 2220

tgcagctctg tgactgccct gcagagcagg gctaccccat aggcagcgag cagcagctca 2280

gggcagttct gcagtcagat ttatacccac ttttaattac atgtagatta aggagctgca 2340

tatacaaaga tttctaggga aggagtagta acttctgggt cctggggtct ttgccacgga 2400

acagggcagt atgccagggt gttgccacgg caatggtaaa ctgacatggc accctggggg 2460

tcatgcctta gggaaagccg cttccactcg cccctgtttt agctcatctt caagttagtc 2520

tggtgtccaa gctccaccgc ctgcctcagt ctggtgacct ccttctgtgt ctgatgagca 2580

tggcagcgtt gggaccttcc ccttccaact ctctccctcc tcttcgtcct ccctaaagga 2640

cgggtacgag gaggggctat cacgccagcg acatcctcta gcaccaccca ggtgtgtggg 2700

gtggggcagg ggggcgacga agtatccagc ccagggccac gtagtcaact gccaagggct 2760

tcctgggctt ctcttctgcc ccagagcttg tctccaccca gcaggggttc ccccagcgct 2820

aactgtatcc ctaaagttct gatgtacttt acttttccat cttccttgtt gttaacatct 2880

accttctgct ctgtaagcaa aactaaatct tctgtgcttt gtccataggt tgattctaca 2940

atctgaaaat caataaacag catttgcatg aaaaaaaaaa a 2981

<210> 45

<211> 384

<212> PRT

<213> 智人

<400> 45

Met Asp Ala Ala Leu Leu Leu Asn Val Glu Gly Val Lys Lys Thr Ile

1 5 10 15

Leu His Gly Gly Thr Gly Glu Leu Pro Asn Phe Ile Thr Gly Ser Arg

20 25 30

Val Ile Phe His Phe Arg Thr Met Lys Cys Asp Glu Glu Arg Thr Val

35 40 45

Ile Asp Asp Ser Arg Gln Val Gly Gln Pro Met His Ile Ile Ile Gly

50 55 60

Asn Met Phe Lys Leu Glu Val Trp Glu Ile Leu Leu Thr Ser Met Arg

65 70 75 80

Val His Glu Val Ala Glu Phe Trp Cys Asp Thr Ile His Thr Gly Val

85 90 95

Tyr Pro Ile Leu Ser Arg Ser Leu Arg Gln Met Ala Gln Gly Lys Asp

100 105 110

Pro Thr Glu Trp His Val His Thr Cys Gly Leu Ala Asn Met Phe Ala

115 120 125

Tyr His Thr Leu Gly Tyr Glu Asp Leu Asp Glu Leu Gln Lys Glu Pro

130 135 140

Gln Pro Leu Val Phe Val Ile Glu Leu Leu Gln Val Asp Ala Pro Ser

145 150 155 160

Asp Tyr Gln Arg Glu Thr Trp Asn Leu Ser Asn His Glu Lys Met Lys

165 170 175

Ala Val Pro Val Leu His Gly Glu Gly Asn Arg Leu Phe Lys Leu Gly

180 185 190

Arg Tyr Glu Glu Ala Ser Ser Lys Tyr Gln Glu Ala Ile Ile Cys Leu

195 200 205

Arg Asn Leu Gln Thr Lys Glu Lys Pro Trp Glu Val Gln Trp Leu Lys

210 215 220

Leu Glu Lys Met Ile Asn Thr Leu Ile Leu Asn Tyr Cys Gln Cys Leu

225 230 235 240

Leu Lys Lys Glu Glu Tyr Tyr Glu Val Leu Glu His Thr Ser Asp Ile

245 250 255

Leu Arg His His Pro Gly Ile Val Lys Ala Tyr Tyr Val Arg Ala Arg

260 265 270

Ala His Ala Glu Val Trp Asn Glu Ala Glu Ala Lys Ala Asp Leu Gln

275 280 285

Lys Val Leu Glu Leu Glu Pro Ser Met Gln Lys Ala Val Arg Arg Glu

290 295 300

Leu Arg Leu Leu Glu Asn Arg Met Ala Glu Lys Gln Glu Glu Glu Arg

305 310 315 320

Leu Arg Cys Arg Asn Met Leu Ser Gln Gly Ala Thr Gln Pro Pro Ala

325 330 335

Glu Pro Pro Thr Glu Pro Pro Ala Gln Ser Ser Thr Glu Pro Pro Ala

340 345 350

Glu Pro Pro Thr Ala Pro Ser Ala Glu Leu Ser Ala Gly Pro Pro Ala

355 360 365

Glu Pro Ala Thr Glu Pro Pro Pro Ser Pro Gly His Ser Leu Gln His

370 375 380

<210> 46

<211> 1934

<212> DNA

<213> 智人

<400> 46

gggcacaagc aatcctccct tctcagcttc ctgagtggcc aggactacag aggactgtat 60

gctgttctta aggactctct gcttcctgga caagctcaag ctaaggacta catctcccag 120

caggctgtgc tctgacagct cttggattta aataggattc tgggctctgc tcagagtcag 180

gctgctgctc agcacccagg acggagagga gcagagaagc agcagaagca gccaagagct 240

ggagccagac caggaacctg agccagagct ggggttgaag ctggagcagc agcaaaagca 300

acagcagcta cagaagttgg aacgatgctg gtcaccttgg gactgctcac ctccttcttc 360

tcgttcctgt atatggtagc tccatccatc aggaagttct ttgctggtgg agtgtgtaga 420

acaaatgtgc agcttcctgg caaggtagtg gtgatcactg gcgccaacac gggcattggc 480

aaggagacgg ccagagagct cgctagccga ggagcccgag tctatattgc ctgcagagat 540

gtactgaagg gggagtctgc tgccagtgaa atccgagtgg atacaaagaa ctcccaggtg 600

ctggtgcgga aattggacct atccgacacc aaatctatcc gagcctttgc tgagggcttt 660

ctggcagagg aaaagcagct ccatattctg atcaacaatg cgggagtaat gatgtgtcca 720

tattccaaga cagctgatgg ctttgaaacc cacctgggag tcaaccacct gggccacttc 780

ctcctcacct acctgctcct ggagcggcta aaggtgtctg cccctgcacg ggtggttaat 840

gtgtcctcgg tggctcacca cattggcaag attcccttcc acgacctcca gagcgagaag 900

cgctacagca ggggttttgc ctattgccac agcaagctgg ccaatgtgct ttttactcgt 960

gagctggcca agaggctcca aggcaccggg gtcaccacct acgcagtgca cccaggcgtc 1020

gtccgctctg agctggtccg gcactcctcc ctgctctgcc tgctctggcg gctcttctcc 1080

ccctttgtca agacggcacg ggagggggcg cagaccagcc tgcactgcgc cctggctgag 1140

ggcctggagc ccctgagtgg caagtacttc agtgactgca agaggacctg ggtgtctcca 1200

agggcccgaa ataacaaaac agctgagcgc ctatggaatg tcagctgtga gcttctagga 1260

atccggtggg agtagctggt ggaagagctg cagctttatc aggcccaatc catgccataa 1320

tgaacaggga ccaaggagaa ggccaaccct aaaggattgt cctcttggcc agctggtgct 1380

gcgaatcctg cctgctctga tcctcttgac ccttctggga atgtttgcac acctgacact 1440

cttgtgagac tggcttatgg catgagttgt ggacacctat agagtgttct tctctaagac 1500

ctggaaagtc agcaaccctc tgggggcagc aggactgggc agatcccagg ctgggcatgg 1560

gggtggcaga agagcccgag aaattgggtc agttccctca tcagcaccag aggctcagct 1620

gaggcaagaa gagcaccatc actgcctatt tctaggggct atacactcca actcttggtt 1680

gatctctttc tttttaaaaa tatttgccac caccctggag tctagaccaa cacacaaaga 1740

tcctggctaa ccctggccta tttagattcc ttcctctcac ctggaccttc ccatttcaat 1800

catgcagatg gtttcttttt gtaaagagtt ccgtttgcct ttcaattttt agagaaaata 1860

aagactgcat tcatctcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920

aaaaaaaaaa aaaa 1934

<210> 47

<211> 316

<212> PRT

<213> 智人

<400> 47

Met Leu Val Thr Leu Gly Leu Leu Thr Ser Phe Phe Ser Phe Leu Tyr

1 5 10 15

Met Val Ala Pro Ser Ile Arg Lys Phe Phe Ala Gly Gly Val Cys Arg

20 25 30

Thr Asn Val Gln Leu Pro Gly Lys Val Val Val Ile Thr Gly Ala Asn

35 40 45

Thr Gly Ile Gly Lys Glu Thr Ala Arg Glu Leu Ala Ser Arg Gly Ala

50 55 60

Arg Val Tyr Ile Ala Cys Arg Asp Val Leu Lys Gly Glu Ser Ala Ala

65 70 75 80

Ser Glu Ile Arg Val Asp Thr Lys Asn Ser Gln Val Leu Val Arg Lys

85 90 95

Leu Asp Leu Ser Asp Thr Lys Ser Ile Arg Ala Phe Ala Glu Gly Phe

100 105 110

Leu Ala Glu Glu Lys Gln Leu His Ile Leu Ile Asn Asn Ala Gly Val

115 120 125

Met Met Cys Pro Tyr Ser Lys Thr Ala Asp Gly Phe Glu Thr His Leu

130 135 140

Gly Val Asn His Leu Gly His Phe Leu Leu Thr Tyr Leu Leu Leu Glu

145 150 155 160

Arg Leu Lys Val Ser Ala Pro Ala Arg Val Val Asn Val Ser Ser Val

165 170 175

Ala His His Ile Gly Lys Ile Pro Phe His Asp Leu Gln Ser Glu Lys

180 185 190

Arg Tyr Ser Arg Gly Phe Ala Tyr Cys His Ser Lys Leu Ala Asn Val

195 200 205

Leu Phe Thr Arg Glu Leu Ala Lys Arg Leu Gln Gly Thr Gly Val Thr

210 215 220

Thr Tyr Ala Val His Pro Gly Val Val Arg Ser Glu Leu Val Arg His

225 230 235 240

Ser Ser Leu Leu Cys Leu Leu Trp Arg Leu Phe Ser Pro Phe Val Lys

245 250 255

Thr Ala Arg Glu Gly Ala Gln Thr Ser Leu His Cys Ala Leu Ala Glu

260 265 270

Gly Leu Glu Pro Leu Ser Gly Lys Tyr Phe Ser Asp Cys Lys Arg Thr

275 280 285

Trp Val Ser Pro Arg Ala Arg Asn Asn Lys Thr Ala Glu Arg Leu Trp

290 295 300

Asn Val Ser Cys Glu Leu Leu Gly Ile Arg Trp Glu

305 310 315

<210> 48

<211> 4729

<212> DNA

<213> 智人

<400> 48

agtctaggcc tccgcctccg ttaccctgga gcccaggtta ccgccgctgc cacccaggag 60

ccccgatcct cgcctctgtc ccatccttgt gttcaaacct cccgcatctc ggcaacctcg 120

gcacccgccc ggcagcctcc gcaggaacca ggcacccgct ctttggcggt cagacgccga 180

ggccccagct gggagtttgg tcctaagagg gaaggcaagg aggcgggacg ccgcatcggc 240

tctgctgaag agcctgcggg ttggaggtgg gctttgaagt gggcgtggag acggcggggg 300

aggtggaggt gcgagtataa atgatcaacc agaaattatc ttcaaaggaa taaaaccaga 360

agtatgtaaa taaaaagccc aagataaaga aacagaaaag ctgacactac atgaagcaga 420

gggcaaaaaa gtttatcttc tggatgccaa tgtgaattgt ggtctacaaa tacattgtgg 480

agaaaataga ttgcacagaa atgaatatta tcaggatctg aagactgtga aaatgttttt 540

cagtattgtc atagtctcct ctggagaaaa taatctgtga aattatgtga atagagacca 600

tttttcaaaa caatggggga aagagcagga agtccaggta ctgatcaaga aagaaaggca 660

ggcaaacacc attattctta cttatctgat tttgaaacgc cacagtcttc tggccgatca 720

tcgctggtca gttcttcacc tgcaagtgtt aggagaaaaa atcctaaaag acaaacttca 780

gatggccaag tacatcacca agcccctcgg aaaccaagcc ctaagggtct accaaacaga 840

aagggagtcc gagtgggatt tcgctcccag agcctcaata gagagccact tcggaaagat 900

actgatcttg ttacaaaacg gattctgtct gcaagactgc taaaaatcaa tgagttgcag 960

aatgaagtat ctgaactcca ggtcaagtta gctgagctgc taaaagaaaa taaatctttg 1020

aaaaggcttc agtacagaca ggagaaagcc ctgaataagt ttgaagatgc cgaaaatgaa 1080

atctcacaac ttatatttcg tcataacaat gagattacag cactcaaaga acgcttaaga 1140

aaatctcaag agaaagaacg ggcaactgag aaaagggtaa aagatacaga aagtgaacta 1200

tttaggacaa aattttcctt acagaaactg aaagagatct ctgaagctag acacctacct 1260

gaacgagatg atttggcaaa gaaactagtt tcagcagagt taaagttaga tgacaccgag 1320

agaagaatta aggagctatc gaaaaacctt gaactgagta ctaacagttt ccaacgacag 1380

ttgcttgctg aaaggaaaag ggcatatgag gctcatgatg aaaataaagt tcttcaaaag 1440

gaggtacagc gactatatca caaattaaag gaaaaggaga gagaactgga tataaaaaat 1500

atatattcta atcgtctgcc aaagtcctct ccaaataaag agaaagaact tgcattaaga 1560

aaaaatgctg catgccagag tgattttgca gacctgtgta caaaaggagt acaaaccatg 1620

gaagacttca agccagaaga atatccttta actccagaaa caattatgtg ttacgaaaac 1680

aaatgggaag aaccaggaca tcttactttg gacttgcaat ctcaaaagca agacaggcat 1740

ggagaagcag ggattctaaa cccaattatg gaaagagaag aaaaatttgt tacagatgaa 1800

gaactccatg tcgtaaaaca ggaggttgaa aagctggagg atgaatggga aagagaagaa 1860

cttgataaaa agcaaaaaga aaaggcatct ttactggaaa gagaagaaaa gccagagtgg 1920

gaaactggaa ggtaccaact aggaatgtat ccaattcaga atatggataa attgcaagga 1980

gaggaagaag aaagactgaa gagagaaatg ctacttgcta aactgaatga aattgacaga 2040

gaactccaag attctcgaaa tctaaaatac cctgttttgc cattgttacc tgattttgaa 2100

tcaaaactac actccccaga gagaagcccc aaaacataca ggttctctga atcctcagag 2160

agattattta atgggcatca tttgcaagac atcagtttct caactccaaa aggagaaggt 2220

cagaattcag gaaatgttag aagtccagcc tcccctaatg agttcgcatt tggtagctac 2280

gtgccttcgt ttgcaaaaac atcagagagg tcaaatccat ttagtcaaaa aagtagtttt 2340

ttggatttcc aaagaaacag tatggaaaaa cttagtaaag atggtgtaga tttaattaca 2400

agaaaagaga aaaaagctaa tttgatggaa cagttatttg gtgccagtgg tagcagcacc 2460

atttcctcca aaagcagtga cccaaattct gtggcttcca gtaaaggaga cattgaccct 2520

ctaaattttc tccctgggaa taaaggcagc agagatcaag aacatgatga agatgaaggc 2580

tttttcctca gtgaaggaag aagttttaat ccaaataggc accgattaaa acatgcagac 2640

gataaaccag cagtaaaagc agctgattct gtagaagatg aaattgaaga agtagcactg 2700

agatgactga ctagagtata cattttttct aattgtaaat attgaaatat tttaatacag 2760

tatttattat aaacatttag actttttaat gctaaaatgt ccttattaag gaatgatttt 2820

taatagctaa atacaatgca gttaaaaaga agtagatcat acatacacca catagatagt 2880

ttgccaagaa tgaaggaggc ttttttgaat gaaaccaaaa ataaaaatat gtcttgaaaa 2940

atgaaataga ttttaactct tcatccagtg ctatggcaag tttaactgca ctggaggtgg 3000

tattcctttt ctacttttat tcctatttat gtatttattt ttaatcatat tctcactgtg 3060

ctaaatacag tcttcccact aattgttgaa tgaaaattaa gggtgaaagt ctgtgttggg 3120

aagtgtagct ccggatggtg gagaaccagt gcttcttagg agcccttccc tttatggata 3180

gggccagggg tccctatctt acgtggcagt cctaagctac tcttgagtga tagcagtcac 3240

aacattggga tttcccattc ctctgaaagt acccacagct aaacactact catttcccaa 3300

tttcagtatt tactgaaatc acttacctac aattctgtta gaatattatg ttgagttcgg 3360

aagacatttc tctgtttgca aggacagtta gttgctctct gtcatagccc gcagaagctt 3420

ggctacagtg taattcctct ccttgttctc ctacactctt tgtatctcag tgactgggtg 3480

taagatttca tgccaaatgc aaggaatagt ggaaatacat accaactgca aagaatagaa 3540

aaactttatc ccaatatatt atagaaagat cttcagttca attatgtcca gagtaatata 3600

atttggcaat gttaatgctt ttaagatttg aacttgtcct caaaccaagg agacaacaat 3660

agtgtaatac tattggactt acaggattag ttttaaagca actttgaata gaagtgtttc 3720

agacatagga cttctgcctt gttgactaga gtggatagtt ttctgtttaa atgcattggt 3780

cttttggctg tttgtaattc acttcagctt atagagaagt tgatgacctt ggatcatgct 3840

gggtatgatt ggtctttaaa aagcagtaat ataccaccag cccaaggaga aaacattgtt 3900

aaaatgaaga gtggtggaaa tagtgtgttg ggaagaataa aaaatttaga ttggcactta 3960

ttctaaagtg agctgttttt ttcaagaatt tactagcatt tgctcgtagt atgatttctg 4020

acgccagtca tatatactga tgaggggaag gagttactgt gttattctga gttcttataa 4080

atgcatatta ttgaatttca ttgcatgact atttgtcaag acttacctgg ttaggtctcc 4140

aattaaaaga tgtaccacct gtcatcttct aaattgtgtt cctttcattt attgggaaca 4200

gaatctctca aaagtgctaa actatattaa aaagttttct taatagattt gtatgtctga 4260

tatgtataac catttactat aatatgttgc aaatcattct aatatatgta aaacaatatt 4320

atttgtaatg cagttattgg taaaatatta tgtaatgtta attttgttcc tagctgctaa 4380

tttttctgcc aaaagtattc taattttcag gttgttttaa aggcttttaa aactttttag 4440

ttaagttttt tattcacgtc atttaaatta gttttttgct ttttttctac ctgataatct 4500

ctttaacaag atgcaacaag acagaattat taaaattaaa cctaaagtta agttacagat 4560

ttaaaggcat tatgatatta agcattaaaa ttggagatta aaatgtacaa aacagggttt 4620

tccttatgaa caaaccttac agggtaaatt gttttttttt ctaaatgtca ttaaatttat 4680

ttgtactcag aactgttact aataaaaatt aaaaatgcaa aaaaaaaaa 4729

<210> 49

<211> 697

<212> PRT

<213> 智人

<400> 49

Met Gly Glu Arg Ala Gly Ser Pro Gly Thr Asp Gln Glu Arg Lys Ala

1 5 10 15

Gly Lys His His Tyr Ser Tyr Leu Ser Asp Phe Glu Thr Pro Gln Ser

20 25 30

Ser Gly Arg Ser Ser Leu Val Ser Ser Ser Pro Ala Ser Val Arg Arg

35 40 45

Lys Asn Pro Lys Arg Gln Thr Ser Asp Gly Gln Val His His Gln Ala

50 55 60

Pro Arg Lys Pro Ser Pro Lys Gly Leu Pro Asn Arg Lys Gly Val Arg

65 70 75 80

Val Gly Phe Arg Ser Gln Ser Leu Asn Arg Glu Pro Leu Arg Lys Asp

85 90 95

Thr Asp Leu Val Thr Lys Arg Ile Leu Ser Ala Arg Leu Leu Lys Ile

100 105 110

Asn Glu Leu Gln Asn Glu Val Ser Glu Leu Gln Val Lys Leu Ala Glu

115 120 125

Leu Leu Lys Glu Asn Lys Ser Leu Lys Arg Leu Gln Tyr Arg Gln Glu

130 135 140

Lys Ala Leu Asn Lys Phe Glu Asp Ala Glu Asn Glu Ile Ser Gln Leu

145 150 155 160

Ile Phe Arg His Asn Asn Glu Ile Thr Ala Leu Lys Glu Arg Leu Arg

165 170 175

Lys Ser Gln Glu Lys Glu Arg Ala Thr Glu Lys Arg Val Lys Asp Thr

180 185 190

Glu Ser Glu Leu Phe Arg Thr Lys Phe Ser Leu Gln Lys Leu Lys Glu

195 200 205

Ile Ser Glu Ala Arg His Leu Pro Glu Arg Asp Asp Leu Ala Lys Lys

210 215 220

Leu Val Ser Ala Glu Leu Lys Leu Asp Asp Thr Glu Arg Arg Ile Lys

225 230 235 240

Glu Leu Ser Lys Asn Leu Glu Leu Ser Thr Asn Ser Phe Gln Arg Gln

245 250 255

Leu Leu Ala Glu Arg Lys Arg Ala Tyr Glu Ala His Asp Glu Asn Lys

260 265 270

Val Leu Gln Lys Glu Val Gln Arg Leu Tyr His Lys Leu Lys Glu Lys

275 280 285

Glu Arg Glu Leu Asp Ile Lys Asn Ile Tyr Ser Asn Arg Leu Pro Lys

290 295 300

Ser Ser Pro Asn Lys Glu Lys Glu Leu Ala Leu Arg Lys Asn Ala Ala

305 310 315 320

Cys Gln Ser Asp Phe Ala Asp Leu Cys Thr Lys Gly Val Gln Thr Met

325 330 335

Glu Asp Phe Lys Pro Glu Glu Tyr Pro Leu Thr Pro Glu Thr Ile Met

340 345 350

Cys Tyr Glu Asn Lys Trp Glu Glu Pro Gly His Leu Thr Leu Asp Leu

355 360 365

Gln Ser Gln Lys Gln Asp Arg His Gly Glu Ala Gly Ile Leu Asn Pro

370 375 380

Ile Met Glu Arg Glu Glu Lys Phe Val Thr Asp Glu Glu Leu His Val

385 390 395 400

Val Lys Gln Glu Val Glu Lys Leu Glu Asp Glu Trp Glu Arg Glu Glu

405 410 415

Leu Asp Lys Lys Gln Lys Glu Lys Ala Ser Leu Leu Glu Arg Glu Glu

420 425 430

Lys Pro Glu Trp Glu Thr Gly Arg Tyr Gln Leu Gly Met Tyr Pro Ile

435 440 445

Gln Asn Met Asp Lys Leu Gln Gly Glu Glu Glu Glu Arg Leu Lys Arg

450 455 460

Glu Met Leu Leu Ala Lys Leu Asn Glu Ile Asp Arg Glu Leu Gln Asp

465 470 475 480

Ser Arg Asn Leu Lys Tyr Pro Val Leu Pro Leu Leu Pro Asp Phe Glu

485 490 495

Ser Lys Leu His Ser Pro Glu Arg Ser Pro Lys Thr Tyr Arg Phe Ser

500 505 510

Glu Ser Ser Glu Arg Leu Phe Asn Gly His His Leu Gln Asp Ile Ser

515 520 525

Phe Ser Thr Pro Lys Gly Glu Gly Gln Asn Ser Gly Asn Val Arg Ser

530 535 540

Pro Ala Ser Pro Asn Glu Phe Ala Phe Gly Ser Tyr Val Pro Ser Phe

545 550 555 560

Ala Lys Thr Ser Glu Arg Ser Asn Pro Phe Ser Gln Lys Ser Ser Phe

565 570 575

Leu Asp Phe Gln Arg Asn Ser Met Glu Lys Leu Ser Lys Asp Gly Val

580 585 590

Asp Leu Ile Thr Arg Lys Glu Lys Lys Ala Asn Leu Met Glu Gln Leu

595 600 605

Phe Gly Ala Ser Gly Ser Ser Thr Ile Ser Ser Lys Ser Ser Asp Pro

610 615 620

Asn Ser Val Ala Ser Ser Lys Gly Asp Ile Asp Pro Leu Asn Phe Leu

625 630 635 640

Pro Gly Asn Lys Gly Ser Arg Asp Gln Glu His Asp Glu Asp Glu Gly

645 650 655

Phe Phe Leu Ser Glu Gly Arg Ser Phe Asn Pro Asn Arg His Arg Leu

660 665 670

Lys His Ala Asp Asp Lys Pro Ala Val Lys Ala Ala Asp Ser Val Glu

675 680 685

Asp Glu Ile Glu Glu Val Ala Leu Arg

690 695

<210> 50

<211> 3771

<212> DNA

<213> 人工序列

<220>

<223> pR2.1 from ATG to L-opsin gene

<400> 50

ccagggtgag attatgaggc tgagctgaga atatcaagac tgtaccgagt agggggcctt 60

ggcaagtgtg gagagcccgg cagctggggc agagggcgga gtacggtgtg cgtttacgga 120

cctcttcaaa cgaggtagga aggtcagaag tcaaaaaggg aacaaatgat gtttaaccac 180

acaaaaatga aaatccaatg gttggatatc cattccaaat acacaaaggc aacggataag 240

tgatccgggc caggcacaga aggccatgca cccgtaggat tgcactcaga gctcccaaat 300

gcataggaat agaagggtgg gtgcaggagg ctgaggggtg gggaaagggc atgggtgttt 360

catgaggaca gagcttccgt ttcatgcaat gaaaagagtt tggagacgga tggtggtgac 420

tggactatac acttacacac ggtagcgatg gtacactttg tattatgtat attttaccac 480

gatcttttta aagtgtcaaa ggcaaatggc caaatggttc cttgtcctat agctgtagca 540

gccatcggct gttagtgaca aagcccctga gtcaagatga cagcagcccc cataactcct 600

aatcggctct cccgcgtgga gtcatttagg agtagtcgca ttagagacaa gtccaacatc 660

taatcttcca ccctggccag ggccccagct ggcagcgagg gtgggagact ccgggcagag 720

cagagggcgc tgacattggg gcccggcctg gcttgggtcc ctctggcctt tccccagggg 780

ccctctttcc ttggggcttt cttgggccgc cactgctccc gctcctctcc ccccatccca 840

ccccctcacc ccctcgttct tcatatcctt ctctagtgct ccctccactt tcatccaccc 900

ttctgcaaga gtgtgggacc acaaatgagt tttcacctgg cctggggaca cacgtgcccc 960

cacaggtgct gagtgacttt ctaggacagt aatctgcttt aggctaaaat gggacttgat 1020

cttctgttag ccctaatcat caattagcag agccggtgaa ggtgcagaac ctaccgcctt 1080

tccaggcctc ctcccacctc tgccacctcc actctccttc ctgggatgtg ggggctggca 1140

cacgtgtggc ccagggcatt ggtgggattg cactgagctg ggtcattagc gtaatcctgg 1200

acaagggcag acagggcgag cggagggcca gctccggggc tcaggcaagg ctgggggctt 1260

cccccagaca ccccactcct cctctgctgg acccccactt catagggcac ttcgtgttct 1320

caaagggctt ccaaatagca tggtggcctt ggatgcccag ggaagcctca gagttgctta 1380

tctccctcta gacagaaggg gaatctcggt caagagggag aggtcgccct gttcaaggcc 1440

acccagccag ctcatggcgg taatgggaca aggctggcca gccatcccac cctcagaagg 1500

gacccggtgg ggcaggtgat ctcagaggag gctcacttct gggtctcaca ttcttggatc 1560

cggttccagg cctcggccct aaatagtctc cctgggcttt caagagaacc acatgagaaa 1620

ggaggattcg ggctctgagc agtttcacca cccacccccc agtctgcaaa tcctgacccg 1680

tgggtccacc tgccccaaag gcggacgcag gacagtagaa gggaacagag aacacataaa 1740

cacagagagg gccacagcgg ctcccacagt caccgccacc ttcctggcgg ggatgggtgg 1800

ggcgtctgag tttggttccc agcaaatccc tctgagccgc ccttgcgggc tcgcctcagg 1860

agcaggggag caagaggtgg gaggaggagg tctaagtccc aggcccaatt aagagatcag 1920

gtagtgtagg gtttgggagc ttttaaggtg aagaggcccg ggctgatccc acaggccagt 1980

ataaagcgcc gtgaccctca ggtgatgcgc cagggccggc tgccgtcggg gacagggctt 2040

tccatagcca tgctagagga tccggtactc gaggaactga aaaaccagaa agttaactgg 2100

taagtttagt ctttttgtct tttatttcag gtcccggatc cggtggtggt gcaaatcaaa 2160

gaactgctcc tcagtggatg ttgcctttac ttctaggcct gtacggaagt gttacttctg 2220

ctctaaaagc tgcggaattg tacccgcggc cgcgggacag ggctttccat agccatggcc 2280

cagcagtgga gcctccaaag gctcgcaggc cgccatccgc aggacagcta tgaggacagc 2340

acccagtcca gcatcttcac ctacaccaac agcaactcca ccagaggccc cttcgaaggc 2400

ccgaattacc acatcgctcc cagatgggtg taccacctca ccagtgtctg gatgatcttt 2460

gtggtcactg catccgtctt cacaaatggg cttgtgctgg cggccaccat gaagttcaag 2520

aagctgcgcc acccgctgaa ctggatcctg gtgaacctgg cggtcgctga cctagcagag 2580

accgtcatcg ccagcactat cagcattgtg aaccaggtct ctggctactt cgtgctgggc 2640

caccctatgt gtgtcctgga gggctacacc gtctccctgt gtgggatcac aggtctctgg 2700

tctctggcca tcatttcctg ggagagatgg atggtggtct gcaagccctt tggcaatgtg 2760

agatttgatg ccaagctggc catcgtgggc attgccttct cctggatctg gtctgctgtg 2820

tggacagccc cgcccatctt tggttggagc aggtactggc cccacggcct gaagacttca 2880

tgcggcccag acgtgttcag cggcagctcg taccccgggg tgcagtctta catgattgtc 2940

ctcatggtca cctgctgcat catcccactc gctatcatca tgctctgcta cctccaagtg 3000

tggctggcca tccgagcggt ggcaaagcag cagaaagagt ctgaatccac ccagaaggca 3060

gagaaggaag tgacgcgcat ggtggtggtg atgatctttg cgtactgcgt ctgctgggga 3120

ccctacacct tcttcgcatg ctttgctgct gccaaccctg gttacgcctt ccaccctttg 3180

atggctgccc tgccggccta ctttgccaaa agtgccacta tctacaaccc cgttatctat 3240

gtctttatga accggcagtt tcgaaactgc atcttgcagc ttttcgggaa gaaggttgac 3300

gatggctctg aactctccag cgcctccaaa acggaggtct caactgtgtc ctcgacccag 3360

gtagggccta actgaggtct gcctcctacc catcccgccc accggggctt tggccacctc 3420

tcctttcccc ctccttctcc atccctgtaa aataaatgta atttatcttt gccaaaacca 3480

aaaaaaacgg aattcgtaat catgtcatag ctgtttcctg tgtgaaattg ttatccgctc 3540

acaattccac acaacatacg aggcggccgc gcggatccag acatgataag atacattgat 3600

gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt 3660

gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat 3720

tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta g 3771

<210> 51

<211> 36

<212> DNA

<213> 智人

<400> 51

gacttgatct tctgttagcc ctaatcatca attagc 36

<210> 52

<211> 1565

<212> DNA

<213> 智人

<400> 52

cctacagcag ccagggtgag attatgaggc tgagctgaga atatcaagac tgtaccgagt 60

agggggcctt ggcaagtgtg gagagcccgg cagctggggc agagggcgga gtacggtgtg 120

cgtttacgga cctcttcaaa cgaggtagga aggtcagaag tcaaaaaggg aacaaatgat 180

gtttaaccac acaaaaatga aaatccaatg gttggatatc cattccaaat acacaaaggc 240

aacggataag tgatccgggc caggcacaga aggccatgca cccgtaggat tgcactcaga 300

gctcccaaat gcataggaat agaagggtgg gtgcaggagg ctgaggggtg gggaaagggc 360

atgggtgttt catgaggaca gagcttccgt ttcatgcaat gaaaagagtt tggagacgga 420

tggtggtgac tggactatac acttacacac ggtagcgatg gtacactttg tattatgtat 480

attttaccac gatcttttta aagtgtcaaa ggcaaatggc caaatggttc cttgtcctat 540

agctgtagca gccatcggct gttagtgaca aagcccctga gtcaagatga cagcagcccc 600

cataactcct aatcggctct cccgcgtgga gtcatttagg agtagtcgca ttagagacaa 660

gtccaacatc taatcttcca ccctggccag ggccccagct ggcagcgagg gtgggagact 720

ccgggcagag cagagggcgc tgacattggg gcccggcctg gcttgggtcc ctctggcctt 780

tccccagggg ccctctttcc ttggggcttt cttgggccgc cactgctccc gctcctctcc 840

ccccatccca ccccctcacc ccctcgttct tcatatcctt ctctagtgct ccctccactt 900

tcatccaccc ttctgcaaga gtgtgggacc acaaatgagt tttcacctgg cctggggaca 960

cacgtgcccc cacaggtgct gagtgacttt ctaggacagt aatctgcttt aggctaaaat 1020

gggacttgat cttctgttag ccctaatcat caattagcag agccggtgaa ggtgcagaac 1080

ctaccgcctt tccaggcctc ctcccacctc tgccacctcc actctccttc ctgggatgtg 1140

ggggctggca cacgtgtggc ccagggcatt ggtgggattg cactgagctg ggtcattagc 1200

gtaatcctgg acaagggcag acagggcgag cggagggcca gctccggggc tcaggcaagg 1260

ctgggggctt cccccagaca ccccactcct cctctgctgg acccccactt catagggcac 1320

ttcgtgttct caaagggctt ccaaatagca tggtggcctt ggatgcccag ggaagcctca 1380

gagttgctta tctccctcta gacagaaggg gaatctcggt caagagggag aggtcgccct 1440

gttcaaggcc acccagccag ctcatggcgg taatgggaca aggctggcca gccatcccac 1500

cctcagaagg gacccggtgg ggcaggtgat ctcagaggag gctcacttct gggtctcaca 1560

ttctt 1565

<210> 53

<211> 491

<212> DNA

<213> 智人

<400> 53

ggttccaggc ctcggcccta aatagtctcc ctgggctttc aagagaacca catgagaaag 60

gaggattcgg gctctgagca gtttcaccac ccacccccca gtctgcaaat cctgacccgt 120

gggtccacct gccccaaagg cggacgcagg acagtagaag ggaacagaga acacataaac 180

acagagaggg ccacagcggc tcccacagtc accgccacct tcctggcggg gatgggtggg 240

gcgtctgagt ttggttccca gcaaatccct ctgagccgcc cttgcgggct cgcctcagga 300

gcaggggagc aagaggtggg aggaggaggt ctaagtccca ggcccaatta agagatcagg 360

tagtgtaggg tttgggagct tttaaggtga agaggcccgg gctgatccca caggccagta 420

taaagcgccg tgaccctcag gtgatgcgcc agggccggct gccgtcgggg acagggcttt 480

ccatagccat g 491

<210> 54

<211> 491

<212> DNA

<213> 智人

<400> 54

agtagaaacg gggtttcacc atgttagtca ggctggtcgg gaactcctga cctcaggaga 60

tctacccgcc ttggcctccc aaagtgctgg gattacaggc gtgtgccact gtgcccagcc 120

actttttttt agacagagtc ttggtctgtt gcccaggcta gagttcagtg gcgccatctc 180

agctcactgc aacctccgcc tcccagattc aagcgattct cctgcctcga cctcccagta 240

gctgggatta caggtttcca gcaaatccct ctgagccgcc cccgggggct cgcctcagga 300

gcaaggaagc aaggggtggg aggaggaggt ctaagtccca ggcccaatta agagatcaga 360

tggtgtagga tttgggagct tttaaggtga agaggcccgg gctgatccca ctggccggta 420

taaagcaccg tgaccctcag gtgacgcacc agggccggct gccgtcgggg acagggcttt 480

ccatagccat g 491

<210> 55

<211> 239

<212> DNA

<213> 智人

<400> 55

ggtttccagc aaatccctct gagccgcccc cgggggctcg cctcaggagc aaggaagcaa 60

ggggtgggag gaggaggtct aagtcccagg cccaattaag agatcagatg gtgtaggatt 120

tgggagcttt taaggtgaag aggcccgggc tgatcccact ggccggtata aagcaccgtg 180

accctcaggt gacgcaccag ggccggctgc cgtcggggac agggctttcc atagccatg 239

<210> 56

<211> 169

<212> RNA

<213> 人工序列

<220>

<223> 合成的5'UTR

<400> 56

gccagggccg gcugccgucg gggacagggc uuuccauagc caugcuagag gauccgguac 60

ucgaggaacu gaaaaaccag aaaguuaacu ggccuguacg gaaguguuac uucugcucua 120

aaagcugcgg aauuguaccc gcggccgcgg gacagggcuu uccauagcc 169

<210> 57

<211> 77

<212> RNA

<213> 人工序列

<220>

<223> 合成的5'UTR

<400> 57

gcaccagggc cggcugccgu cggggacagg gcuuuccaua gcccaggccu cuagagagga 60

guaucagugc cgccacc 77

<210> 58

<211> 213

<212> DNA

<213> 智人

<400> 58

aacggctagc ctgaggagct gctgcgacag tccactacct ttttcgagag tgactcccgt 60

tgtcccaagg cttcccagag cgaacctgtg cggctgcagg caccggcgcg tcgagtttcc 120

ggcgtccgga aggaccgagc tcttctcgcg gatccagtgt tccgtttcca gcccccaatc 180

tcagagccga gccgacagag agcagggaac cgc 213

<210> 59

<211> 97

<212> DNA

<213> 人工序列

<220>

<223> pR2.1 内含子 序列

<400> 59

gtaagtttag tctttttgtc ttttatttca ggtcccggat ccggtggtgg tgcaaatcaa 60

agaactgctc ctcagtggat gttgccttta cttctag 97

<210> 60

<211> 133

<212> DNA

<213> 人工序列

<220>

<223> MNTC 内含子 序列

<400> 60

gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60

cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120

tttctctcca cag 133

<210> 61

<211> 1095

<212> DNA

<213> 智人

<400> 61

atggcccagc agtggagcct ccaaaggctc gcaggccgcc atccgcagga cagctatgag 60

gacagcaccc agtccagcat cttcacctac accaacagca actccaccag aggccccttc 120

gaaggcccga attaccacat cgctcccaga tgggtgtacc acctcaccag tgtctggatg 180

atctttgtgg tcactgcatc cgtcttcaca aatgggcttg tgctggcggc caccatgaag 240

ttcaagaagc tgcgccaccc gctgaactgg atcctggtga acctggcggt cgctgaccta 300

gcagagaccg tcatcgccag cactatcagc attgtgaacc aggtctctgg ctacttcgtg 360

ctgggccacc ctatgtgtgt cctggagggc tacaccgtct ccctgtgtgg gatcacaggt 420

ctctggtctc tggccatcat ttcctgggag aggtggctgg tggtgtgcaa gccctttggc 480

aatgtgagat ttgatgccaa gctggccatc gtgggcattg ccttctcctg gatctggtct 540

gctgtgtgga cagccccgcc catctttggt tggagcaggt actggcccca cggcctgaag 600

acttcatgcg gcccagacgt gttcagcggc agctcgtacc ccggggtgca gtcttacatg 660

attgtcctca tggtcacctg ctgcatcatc ccactcgcta tcatcatgct ctgctacctc 720

caagtgtggc tggccatccg agcggtggca aagcagcaga aagagtctga atccacccag 780

aaggcagaga aggaagtgac gcgcatggtg gtggtgatga tctttgcgta ctgcgtctgc 840

tggggaccct acaccttctt cgcatgcttt gctgctgcca accctggtta cgccttccac 900

cctttgatgg ctgccctgcc ggcctacttt gccaaaagtg ccactatcta caaccccgtt 960

atctatgtct ttatgaaccg gcagtttcga aactgcatct tgcagctttt cgggaagaag 1020

gttgacgatg gctctgaact ctccagcgcc tccaaaacgg aggtctcatc tgtgtcctcg 1080

gtatcgcctg catga 1095

<210> 62

<211> 1095

<212> DNA

<213> 智人

<400> 62

atggcccagc agtggagcct ccaaaggctc gcaggccgcc atccgcagga cagctatgag 60

gacagcaccc agtccagcat cttcacctac accaacagca actccaccag aggccccttc 120

gaaggcccga attaccacat cgctcccaga tgggtgtacc acctcaccag tgtctggatg 180

atctttgtgg tcattgcatc cgtcttcaca aatgggcttg tgctggcggc caccatgaag 240

ttcaagaagc tgcgccaccc gctgaactgg atcctggtga acctggcggt cgctgacctg 300

gcagagaccg tcatcgccag cactatcagc gttgtgaacc aggtctatgg ctacttcgtg 360

ctgggccacc ctatgtgtgt cctggagggc tacaccgtct ccctgtgtgg gatcacaggt 420

ctctggtctc tggccatcat ttcctgggag agatggatgg tggtctgcaa gccctttggc 480

aatgtgagat ttgatgccaa gctggccatc gtgggcattg ccttctcctg gatctgggct 540

gctgtgtgga cagccccgcc catctttggt tggagcaggt actggcccca cggcctgaag 600

acttcatgcg gcccagacgt gttcagcggc agctcgtacc ccggggtgca gtcttacatg 660

attgtcctca tggtcacctg ctgcatcacc ccactcagca tcatcgtgct ctgctacctc 720

caagtgtggc tggccatccg agcggtggca aagcagcaga aagagtctga atccacccag 780

aaggcagaga aggaagtgac gcgcatggtg gtggtgatgg tcctggcatt ctgcttctgc 840

tggggaccat acgccttctt cgcatgcttt gctgctgcca accctggcta ccccttccac 900

cctttgatgg ctgccctgcc ggccttcttt gccaaaagtg ccactatcta caaccccgtt 960

atctatgtct ttatgaaccg gcagtttcga aactgcatct tgcagctttt cgggaagaag 1020

gttgacgatg gctctgaact ctccagcgcc tccaaaacgg aggtctcatc tgtgtcctcg 1080

gtatcgcctg catga 1095

<210> 63

<211> 1092

<212> DNA

<213> 智人

<400> 63

atggcccagc agtggagcct ccaaaggctc gcaggccgcc atccgcagga cagctatgag 60

gacagcaccc agtccagcat cttcacctac accaacagca actccaccag aggccccttc 120

gaaggcccga attaccacat cgctcccaga tgggtgtacc acctcaccag tgtctggatg 180

atctttgtgg tcattgcatc cgtcttcaca aatgggcttg tgctggcggc caccatgaag 240

ttcaagaagc tgcgccaccc gctgaactgg atcctggtga acctggcggt cgctgacctg 300

gcagagaccg tcatcgccag cactatcagc gttgtgaacc aggtctatgg ctacttcgtg 360

ctgggccacc ctatgtgtgt cctggagggc tacaccgtct ccctgtgtgg gatcacaggt 420

ctctggtctc tggccatcat ttcctgggag agatggctgg tggtctgcaa gccctttggc 480

aatgtgagat ttgatgccaa gctggccatc gtgggcattg ccttctcctg gatctgggct 540

gctgtgtgga cagccccgcc catctttggt tggagcaggt actggcccta cggcctgaag 600

acttcatgcg gcccagacgt gttcagcggc agctcgtacc ccggggtgca gtcttacatg 660

attgtcctca tggtcacctg ctgcatcacc ccactcagca tcatcgtgct ctgctacctc 720

caagtgtggc tggccatccg agcggtggca aagcagcaga aagagtctga atccacccag 780

aaggcagaga aggaagtgac gcgcatggtg gtggtgatgg tcctggcatt ctgcttctgc 840

tggggaccat acgccttctt cgcatgcttt gctgctgcca accctggcta ccccttccac 900

cctttgatgg ctgccctgcc gtcctacttt gccaaaagtg ccactatcta caaccccgtt 960

atctatgtct ttatgaaccg gcagtttcga aactgcatct tgcagctttt cgggaagaag 1020

gttgacgatg gctctgaact ctccagcgcc tccaaaacgg aggtctcatc tgtgtcctcg 1080

gtatcgcctg ca 1092

<210> 64

<211> 1092

<212> DNA

<213> 智人

<400> 64

atggcccagc agtggagcct gcagcggctg gccggccggc acccccagga cagctacgag 60

gacagcaccc agagcagcat cttcacctac accaacagca acagcacccg gggccccttc 120

gagggcccca actaccacat cgccccccgg tgggtgtacc acctgaccag cgtgtggatg 180

atcttcgtgg tgatcgccag cgtgttcacc aacggcctgg tgctggccgc caccatgaag 240

ttcaagaagc tgcggcaccc cctgaactgg atcctggtga acctggccgt ggccgacctg 300

gccgagaccg tgatcgccag caccatcagc gtggtgaacc aggtgtacgg ctacttcgtg 360

ctgggccacc ccatgtgcgt gctggagggc tacaccgtga gcctgtgcgg catcaccggc 420

ctgtggagcc tggccatcat cagctgggag cggtggctgg tggtgtgcaa gcccttcggc 480

aacgtgcggt tcgacgccaa gctggccatc gtgggcatcg ccttcagctg gatctgggcc 540

gccgtgtgga ccgccccccc catcttcggc tggagccggt actggcccta cggcctgaag 600

accagctgcg gccccgacgt gttcagcggc agcagctacc ccggcgtgca gagctacatg 660

atcgtgctga tggtgacctg ctgcatcacc cccctgagca tcatcgtgct gtgctacctg 720

caggtgtggc tggccatccg ggccgtggcc aagcagcaga aggagagcga gagcacccag 780

aaggccgaga aggaggtgac ccggatggtg gtggtgatgg tgctggcctt ctgcttctgc 840

tggggcccct acgccttctt cgcctgcttc gccgccgcca accccggcta ccccttccac 900

cccctgatgg ccgccctgcc cagctacttc gccaagagcg ccaccatcta caaccccgtg 960

atctacgtgt tcatgaaccg gcagttccgg aactgcatcc tgcagctgtt cggcaagaag 1020

gtggacgacg gcagcgagct gagcagcgcc agcaagaccg aggtgagcag cgtgagcagc 1080

gtgagccccg cc 1092

<210> 65

<211> 1092

<212> DNA

<213> 智人

<400> 65

atggcccagc agtggagcct gcagcggctg gccggccggc acccccagga cagctacgag 60

gacagcaccc agagcagcat cttcacctac accaacagca acagcacccg gggccccttc 120

gagggcccca actaccacat cgccccccgg tgggtgtacc acctgaccag cgtgtggatg 180

atcttcgtgg tgatcgccag cgtgttcacc aacggcctgg tgctggccgc cacaatgaag 240

ttcaagaagc tgcggcaccc cctgaactgg atcctggtga acctggccgt ggccgacctg 300

gccgagaccg tgatcgccag cacaatcagc gtggtgaacc aggtgtacgg ctacttcgtg 360

ctgggccacc ccatgtgcgt gctggagggc tacaccgtga gcctgtgcgg catcaccggc 420

ctgtggagcc tggccatcat cagctgggag cggtggctgg tggtgtgcaa gcccttcggc 480

aacgtgcggt tcgacgccaa gctggctatc gtgggaatcg ccttcagctg gatctgggcc 540

gccgtgtgga ccgccccccc tatcttcggc tggagccggt actggcccta cggcctgaag 600

accagctgcg gccccgacgt gttcagcggc agcagctacc ccggcgtgca gagctacatg 660

atcgtgctga tggtgacctg ctgcatcacc cccctgagca tcatcgtgct gtgctacctg 720

caggtgtggc tggccatccg ggccgtggcc aagcagcaga aggagagcga gagcacccag 780

aaggccgaga aggaggtgac ccggatggtg gtggtgatgg tgctggcctt ctgcttctgc 840

tggggcccct acgccttctt cgcctgcttc gccgccgcca accccggcta ccccttccac 900

cccctgatgg ccgccctgcc cagctacttc gccaagagcg ccaccatcta caaccccgtg 960

atctacgtgt tcatgaaccg gcagttccgg aactgcatcc tgcagctgtt cggcaagaag 1020

gtggacgacg gcagcgagct gagcagcgcc agcaagaccg aggtgtcaag cgtgagcagc 1080

gtgagccccg cc 1092

<210> 66

<211> 1047

<212> DNA

<213> 智人

<400> 66

atgagaaaaa tgtcggagga agagttttat ctgttcaaaa atatctcttc agtggggccg 60

tgggatgggc ctcagtacca cattgcccct gtctgggcct tctacctcca ggcagctttc 120

atgggcactg tcttccttat agggttccca ctcaatgcca tggtgctggt ggccacactg 180

cgctacaaaa agttgcggca gcccctcaac tacattctgg tcaacgtgtc cttcggaggc 240

ttcctcctct gcatcttctc tgtcttccct gtcttcgtcg ccagctgtaa cggatacttc 300

gtcttcggtc gccatgtttg tgctttggag ggcttcctgg gcactgtagc aggtctggtt 360

acaggatggt cactggcctt cctggccttt gagcgctaca ttgtcatctg taagcccttc 420

ggcaacttcc gcttcagctc caagcatgca ctgacggtgg tcctggctac ctggaccatt 480

ggtattggcg tctccatccc acccttcttt ggctggagcc ggttcatccc tgagggcctg 540

cagtgttcct gtggccctga ctggtacacc gtgggcacca aataccgcag cgagtcctat 600

acgtggttcc tcttcatctt ctgcttcatt gtgcctctct ccctcatctg cttctcctac 660

actcagctgc tgagggccct gaaagctgtt gcagctcagc agcaggagtc agctacgacc 720

cagaaggctg aacgggaggt gagccgcatg gtggttgtga tggtaggatc cttctgtgtc 780

tgctacgtgc cctacgcggc cttcgccatg tacatggtca acaaccgtaa ccatgggctg 840

gacttacggc ttgtcaccat tccttcattc ttctccaaga gtgcttgcat ctacaatccc 900

atcatctact gcttcatgaa taagcagttc caagcttgca tcatgaagat ggtgtgtggg 960

aaggccatga cagatgaatc cgacacatgc agctcccaga aaacagaagt ttctactgtc 1020

tcgtctaccc aagttggccc caactga 1047

<210> 67

<211> 1064

<212> DNA

<213> 智人

<400> 67

acccagtcga gcatcttcac ctataccaac agcaacagta ccagaggtcc ctttgaaggc 60

cccaattatc acattgctcc caggtgggtg taccacctca ccagcgcctg gatgatcttt 120

gtggtcattg catcagtctt cactaatggg cttgtgctgg cagccaccat acggttcaag 180

aagctgcgcc atcctctgaa ttggattctg gtgaacttgg caattgctga cctaatagag 240

accatcattg ctggcactat cagtgttgtg aaccaaatct atggctactt cgtactaggc 300

caccctctgt gcgtcgtgga aggctacatt gtcgccctgt gtggcatcac aggcctctgg 360

tccctggccg ttatttcctg ggagaggtgg ctggtggtct gcaagccctt tggcaatatg 420

agatttgatg ctaagctggc cactgtggga atcatctttt cttgggtctg ggctgctgtg 480

tggacagccc caccaatctt tggttggagc aggtactggc cttatggcct gaagacatcc 540

tgtggtccag acgtgttcag cggcacttcg tatcctgggg ttcagtctta tatgatggtt 600

ctcatggtca cgtgctgcat cttcccactt agcatcatcg tgctctgcta cctccaagtg 660

tggctggcca tccgagcagt agcaaagcaa caaaaagaat ctgagtctac ccagaaggct 720

gagaaggagg tgacacgcat ggtgcttgtg atgatcttcg catactgcat ctgctggggc 780

ccctacgctg tctttgcatg ctttgctact gcccaccctg gctatgcatt ccacccactt 840

gtggcctccc taccatctta ctttgcgaaa agtgccacta tctacaaccc cattatctat 900

gtctttatga accgacagtt tcaaaactgc atcttacagc tctttggaaa gaaggttgat 960

gatagctctg aacttgccag tacctccaaa acagaaacct catctgaagc cgaattccag 1020

cacactggcg gccgtactag tgatccgagt cgtagcctgg accc 1064

<210> 68

<211> 1041

<212> DNA

<213> 智人

<400> 68

atgtcaggag aggatgactt ttacctgttt cagaatatct cttcggtggg gccctgggat 60

gggcctcagt accaccttgc tcctgtctgg gccttccgcc tccaggcagc cttcatggga 120

tttgtcttct ttgtggggac cccactcaat gccatagtgc tggtggccac actgcattac 180

aaaaagttgc gacagcccct caactatatt ctggtcaatg tatccctcgg gggcttcctc 240

ttctgcatct tctctgtctt cacagtcttc atcgccagct gtcacggata cttcctcttt 300

ggtcgccatg tttgtgctct ggaggccttc ttgggctctg tagcaggtct agtgacagga 360

tggtcattgg ctttcctggc ttttgaacgc tacgttgtca tctgtaaacc cttcggcagc 420

atccgcttca actccaagca tgcactgatg gtggtcctgg ctacttggat tattggtatc 480

ggggtgtcca tcccaccctt ttttggctgg agcaggttca tccctgaggg cctgcagtgc 540

tcctgtggcc cagactggta cactgtgggc accaagtatc gaagcgagta ctacacctgg 600

ttcctcttca tcttctgttt catcattcct ctttccctca tctgcttctc ctactcccag 660

ttgctgagga ctctcagagc tgtggcagct cagcagcaag agtctgctac gacacaaaag 720

gctgaacggg aggtgagtca tatggtggtg gtgatggtgg gatccttctg tctctgctac 780

gtgccctatg ctgccctggc catgtacatg gtcaacaatc ggaaccacgg gctggactta 840

cggcttgtca ccatccccgc cttcttttcc aagagctcct gtgtctacaa ccccatcatc 900

tactgcttca tgaataagca gttccgggct tgcattctgg agatggtgtg caggaagccc 960

atggcagacg aatctgacgt gtctggctct cagaaaacag aagtttctac tgtctcttct 1020

agcaaagttg gccctcactg a 1041

<210> 69

<211> 930

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体 通道视紫红质

<400> 69

atggactatg gcggcgcttt gtctgccgtc ggacgcgaac ttttgttcgt tactaatcct 60

gtggtggtga acgggtccgt cctggtccct gaggatcaat gttactgtgc cggatggatt 120

gaatctcgcg gcacgaacgg cgctcagacc gcgtcaaatg tcctgcagtg gcttgcagca 180

ggattcagca ttttgctgct gatgttctat gcctaccaaa cctggaaatc tacatgcggc 240

tgggaggaga tctatgtgtg cgccattgaa atggttaagg tgattctcga gttctttttt 300

gagtttaaga atccctctat gctctacctt gccacaggac accgggtgca gtggctgcgc 360

tatgcagagt ggctgctcac ttgtcctgtc atccttatcc acctgagcaa cctcaccggc 420

ctgagcaacg actacagcag gagaaccatg ggactccttg tctcagacat cgggactatc 480

gtgtgggggg ctaccagcgc catggcaacc ggctatgtta aagtcatctt cttttgtctt 540

ggattgtgct atggcgcgaa cacatttttt cacgccgcca aagcatatat cgagggttat 600

catactgtgc caaagggtcg gtgccgccag gtcgtgaccg gcatggcatg gctgtttttc 660

gtgagctggg gtatgttccc aattctcttc attttggggc ccgaaggttt tggcgtcctg 720

agcgtctatg gctccaccgt aggtcacacg attattgatc tgatgagtaa aaattgttgg 780

gggttgttgg gacactacct gcgcgtcctg atccacgagc acatattgat tcacggagat 840

atccgcaaaa ccaccaaact gaacatcggc ggaacggaga tcgaggtcga gactctcgtc 900

gaagacgaag ccgaggccgg agccgtgcca 930

<210> 70

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体 halorodopsin

<400> 70

atgaggggta cgcccctgct cctcgtcgtc tctctgttct ctctgcttca ggacacagag 60

accctgcctc ccgtgaccga gagtgccgtg gcccttcaag ccgaggttac ccaaagggag 120

ttgttcgagt tcgtgctgaa cgaccctttg cttgcaagca gtctctatat caacatcgca 180

cttgcaggac tgagtatact gctgttcgtt tttatgaccc gaggactcga tgatccacgg 240

gcaaaactta ttgctgtgtc aaccatcctt gtgcctgtcg tcagcattgc ctcctacact 300

ggattggcga gcggcctgac aatttccgtt cttgaaatgc cagcgggcca ttttgcagaa 360

ggcagctcag tgatgctggg aggagaagag gtagatggtg tagtcaccat gtggggacgg 420

tatctcacct gggcactttc cacgcccatg attctcctcg ctctgggtct cctggccgga 480

agcaatgcta caaagctctt cacagctatc actttcgata tcgctatgtg cgtgactggc 540

cttgccgcgg ccctgactac ctcctcccac ctcatgagat ggttctggta cgctatcagt 600

tgtgcatgct ttctggtggt cttgtatatc ctgctggtgg agtgggcaca ggacgccaaa 660

gccgcgggaa ccgctgacat gttcaatacc ctgaagctgt tgacagtagt gatgtggctg 720

gggtatccaa ttgtgtgggc tcttggagtc gagggtatcg cggtgttgcc cgttggggtg 780

acgagctggg gatattcttt cctggatatc gtggcaaagt acattttcgc attcttgctc 840

ctgaactatc tgacgtcaaa cgaatctgtc gtgtccggca gcattttgga tgttccatct 900

gcttctggga ccccggctga tgat 924

<210> 71

<211> 717

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体 增强的绿色荧光蛋白

<400> 71

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480

ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaag 717

<210> 72

<211> 7

<212> DNA

<213> 人工序列

<220>

<223> 翻译起始序列

<400> 72

accatgg 7

<210> 73

<211> 13

<212> DNA

<213> 人工序列

<220>

<223> 翻译起始序列

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is A or G

<400> 73

gccgccncca tgg 13

<210> 74

<211> 221

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体 pR2.1 poly A

<400> 74

agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa 60

atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 120

taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggagatgtg 180

ggaggttttt taaagcaagt aaaacctcta caaatgtggt a 221

<210> 75

<211> 85

<212> DNA

<213> 智人

<400> 75

tgaggtctgc ctcctaccca tcccgcccac cggggctttg gccacctctc ctttccccct 60

ccttctccat ccctgtaaaa taaat 85

<210> 76

<211> 103

<212> DNA

<213> 智人

<400> 76

cccgggtggc atccctgtga cccctcccca gtgcctctcc tggccttgga agttgccact 60

ccagtgccca ccagccttgt cctaataaaa ttaagttgca tca 103

<210> 77

<211> 225

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体 poly A 区

<400> 77

tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 60

ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 120

gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 180

ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc 225

<210> 78

<211> 502

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体 poly A 区

<400> 78

gtgcaggctg cctatcagaa ggtggtggct ggtgtggcca atgccctggc tcacaaatac 60

cactgagatc tttttccctc tgccaaaaat tatggggaca tcatgaagcc ccttgagcat 120

ctgacttctg gctaataaag gaaatttatt ttcattgcaa tagtgtgttg gaattttttg 180

tgtctctcac tcggaaggac atatgggagg gcaaatcatt taaaacatca gaatgagtat 240

ttggtttaga gtttggcaac atatgccata tgctggctgc catgaacaaa ggtggctata 300

aagaggtcat cagtatatga aacagccccc tgctgtccat tccttattcc atagaaaagc 360

cttgacttga ggttagattt tttttatatt ttgttttgtg ttattttttt ctttaacatc 420

cctaaaattt tccttacatg ttttactagc cagatttttc ctcctctcct gactactccc 480

agtcatagct gtccctcttc tc 502

<210> 79

<211> 496

<212> DNA

<213> 智人

<400> 79

ggatccggtt ccaggcctcg gccctaaata gtctccctgg gctttcaaga gaaccacatg 60

agaaaggagg attcgggctc tgagcagttt caccacccac cccccagtct gcaaatcctg 120

acccgtgggt ccacctgccc caaaggcgga cgcaggacag tagaagggaa cagagaacac 180

ataaacacag agagggccac agcggctccc acagtcaccg ccaccttcct ggcggggatg 240

ggtggggcgt ctgagtttgg ttcccagcaa atccctctga gccgcccttg cgggctcgcc 300

tcaggagcag gggagcaaga ggtgggagga ggaggtctaa gtcccaggcc caattaagag 360

atcaggtagt gtagggtttg ggagctttta aggtgaagag gcccgggctg atcccacagg 420

ccagtataaa gcgccgtgac cctcaggtga tgccagggcc ggctgccgtc ggggacaggg 480

ctttccatag ccatgg 496

<210> 80

<211> 149

<212> DNA

<213> 智人

<400> 80

ccagcaaatc cctctgagcc gcccccgggg gctcgcctca ggagcaagga agcaaggggt 60

gggaggagga ggtctaagtc ccaggcccaa ttaagagatc agatggtgta ggatttggga 120

gcttttaagg tgaagaggcc cgggctgat 149

<210> 81

<211> 434

<212> DNA

<213> 智人

<400> 81

ggatccggtt ccaggcctcg gccctaaata gtctccctgg gctttcaaga gaaccacatg 60

agaaaggagg attcgggctc tgagcagttt caccacccac cccccagtct gcaaatcctg 120

acccgtgggt ccacctgccc caaaggcgga cgcaggacag tagaagggaa cagagaacac 180

ataaacacag agagggccac agcggctccc acagtcaccg ccaccttcct ggcggggatg 240

ggtggggcgt ctgagtttgg ttcccagcaa atccctctga gccgcccttg cgggctcgcc 300

tcaggagcag gggagcaaga ggtgggagga ggaggtctaa gtcccaggcc caattaagag 360

atcaggtagt gtagggtttg ggagctttta aggtgaagag gcccgggctg atcccacagg 420

ccagtataaa gcgc 434

<210> 82

<211> 263

<212> DNA

<213> 智人

<400> 82

ggatccggtt ccaggcctcg gccctaaata gtctccctgg gctttcaaga gaaccacatg 60

agaaaggagg attcgggctc tgagcagttt caccacccac cccccagtct gcaaatcctg 120

acccgtgggt ccacctgccc caaaggcgga cgcaggacag tagaagggaa cagagaacac 180

ataaacacag agagggccac agcggctccc acagtcaccg ccaccttcct ggcggggatg 240

ggtggggcgt ctgagtttgg ttc 263

<210> 83

<211> 171

<212> DNA

<213> 智人

<400> 83

ccagcaaatc cctctgagcc gcccttgcgg gctcgcctca ggagcagggg agcaagaggt 60

gggaggagga ggtctaagtc ccaggcccaa ttaagagatc aggtagtgta gggtttggga 120

gcttttaagg tgaagaggcc cgggctgatc ccacaggcca gtataaagcg c 171

<210> 84

<211> 102

<212> DNA

<213> 人工序列

<220>

<223> 合成的5'UTR

<400> 84

cccactggcc ggtataaagc accgtgaccc tcaggtgacg caccagggcc ggctgccgtc 60

ggggacaggg ctttccatag cccaggccca gagaggagac ag 102

<210> 85

<211> 85

<212> DNA

<213> 人工序列

<220>

<223> 合成的5'UTR

<400> 85

cccactggcc ggtataaagc accgtgaccc tcaggtgacg caccagggcc ggctgccgtc 60

ggggacaggg ctttccatag cccag 85

<210> 86

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 合成的5'UTR

<400> 86

gcccagagag gagacag 17

<210> 87

<211> 185

<212> DNA

<213> 人工序列

<220>

<223> 合成的5’UTR构建体

<400> 87

cgtgaccctc aggtgatgcg ccagggccgg ctgccgtcgg ggacagggct ttccatagcc 60

atgctagagg atccggtact cgaggaactg aaaaaccaga aagttaactg gcctgtacgg 120

aagtgttact tctgctctaa aagctgcgga attgtacccg cggccgcggg acagggcttt 180

ccata 185

<210> 88

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> 合成的5’UTR构建体

<400> 88

cgtgaccctc aggtgatgcg ccagggccgg ctgccgtcgg ggacagggct ttccatagcc 60

atgctagagg atccggtact cgaggaactg aaaaaccaga aagttaactg 110

<210> 89

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> 合成的5'UTR 合成的构建体

<400> 89

gcctgtacgg aagtgttact tctgctctaa aagctgcgga attgtacccg cggccgcggg 60

acagggcttt ccata 75

<210> 90

<211> 235

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体 poly A 区

<400> 90

ggccgcgggg atccagacat gataagatac attgatgagt ttggacaaac cacaactaga 60

atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 120

attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 180

cagggggaga tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggta 235

<210> 91

<211> 152

<212> DNA

<213> 人工序列

<220>

<223> 合成的构建体 poly A 区

<400> 91

ggccgcgggg atccagacat gataagatac attgatgagt ttggacaaac cacaactaga 60

atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 120

attataagct gcaataaaca agttaacaac aa 152

<210> 92

<211> 1714

<212> DNA

<213> 智人

<400> 92

cctacagcag ccagggtgag attatgaggc tgagctgaga atatcaagac tgtaccgagt 60

agggggcctt ggcaagtgtg gagagcccgg cagctggggc agagggcgga gtacggtgtg 120

cgtttacgga cctcttcaaa cgaggtagga aggtcagaag tcaaaaaggg aacaaatgat 180

gtttaaccac acaaaaatga aaatccaatg gttggatatc cattccaaat acacaaaggc 240

aacggataag tgatccgggc caggcacaga aggccatgca cccgtaggat tgcactcaga 300

gctcccaaat gcataggaat agaagggtgg gtgcaggagg ctgaggggtg gggaaagggc 360

atgggtgttt catgaggaca gagcttccgt ttcatgcaat gaaaagagtt tggagacgga 420

tggtggtgac tggactatac acttacacac ggtagcgatg gtacactttg tattatgtat 480

attttaccac gatcttttta aagtgtcaaa ggcaaatggc caaatggttc cttgtcctat 540

agctgtagca gccatcggct gttagtgaca aagcccctga gtcaagatga cagcagcccc 600

cataactcct aatcggctct cccgcgtgga gtcatttagg agtagtcgca ttagagacaa 660

gtccaacatc taatcttcca ccctggccag ggccccagct ggcagcgagg gtgggagact 720

ccgggcagag cagagggcgc tgacattggg gcccggcctg gcttgggtcc ctctggcctt 780

tccccagggg ccctctttcc ttggggcttt cttgggccgc cactgctccc gctcctctcc 840

ccccatccca ccccctcacc ccctcgttct tcatatcctt ctctagtgct ccctccactt 900

tcatccaccc ttctgcaaga gtgtgggacc acaaatgagt tttcacctgg cctggggaca 960

cacgtgcccc cacaggtgct gagtgacttt ctaggacagt aatctgcttt aggctaaaat 1020

gggacttgat cttctgttag ccctaatcat caattagcag agccggtgaa ggtgcagaac 1080

ctaccgcctt tccaggcctc ctcccacctc tgccacctcc actctccttc ctgggatgtg 1140

ggggctggca cacgtgtggc ccagggcatt ggtgggattg cactgagctg ggtcattagc 1200

gtaatcctgg acaagggcag acagggcgag cggagggcca gctccggggc tcaggcaagg 1260

ctgggggctt cccccagaca ccccactcct cctctgctgg acccccactt catagggcac 1320

ttcgtgttct caaagggctt ccaaatagca tggtggcctt ggatgcccag ggaagcctca 1380

gagttgctta tctccctcta gacagaaggg gaatctcggt caagagggag aggtcgccct 1440

gttcaaggcc acccagccag ctcatggcgg taatgggaca aggctggcca gccatcccac 1500

cctcagaagg gacccggtgg ggcaggtgat ctcagaggag gctcacttct gggtctcaca 1560

ttcttccagc aaatccctct gagccgcccc cgggggctcg cctcaggagc aaggaagcaa 1620

ggggtgggag gaggaggtct aagtcccagg cccaattaag agatcagatg gtgtaggatt 1680

tgggagcttt taaggtgaag aggcccgggc tgat 1714

<210> 93

<211> 234

<212> DNA

<213> 人工序列

<220>

<223> 经优化的启动子序列

<400> 93

ccagcaaatc cctctgagcc gcccccgggg gctcgcctca ggagcaagga agcaaggggt 60

gggaggagga ggtctaagtc ccaggcccaa ttaagagatc agatggtgta ggatttggga 120

gcttttaagg tgaagaggcc cgggctgatc ccactggccg gtataaagca ccgtgaccct 180

caggtgacgc accagggccg gctgccgtcg gggacagggc tttccatagc ccag 234

<210> 94

<211> 235

<212> DNA

<213> 人工序列

<220>

<223> 经优化的内含子序列

<400> 94

cccactggcc ggtataaagc accgtgaccc tcaggtgacg caccagggcc ggctgccgtc 60

ggggacaggg ctttccatag cccaggtaag tatcaaggtt acaagacagg tttaaggaga 120

ccaatagaaa ctgggcttgt cgagacagag aagactcttg cgtttctgat aggcacctat 180

tggtcttact gacatccact ttgcctttct ctccacaggc ccagagagga gacag 235

<210> 95

<211> 1958

<212> DNA

<213> 人工序列

<220>

<223> 盒,其包含经优化的增强子, 经优化的启动子,

经优化的5'UTR, 经优化的内含子, 经优化的kozak和经优化的

polyA区

<400> 95

cctacagcag ccagggtgag attatgaggc tgagctgaga atatcaagac tgtaccgagt 60

agggggcctt ggcaagtgtg gagagcccgg cagctggggc agagggcgga gtacggtgtg 120

cgtttacgga cctcttcaaa cgaggtagga aggtcagaag tcaaaaaggg aacaaatgat 180

gtttaaccac acaaaaatga aaatccaatg gttggatatc cattccaaat acacaaaggc 240

aacggataag tgatccgggc caggcacaga aggccatgca cccgtaggat tgcactcaga 300

gctcccaaat gcataggaat agaagggtgg gtgcaggagg ctgaggggtg gggaaagggc 360

atgggtgttt catgaggaca gagcttccgt ttcatgcaat gaaaagagtt tggagacgga 420

tggtggtgac tggactatac acttacacac ggtagcgatg gtacactttg tattatgtat 480

attttaccac gatcttttta aagtgtcaaa ggcaaatggc caaatggttc cttgtcctat 540

agctgtagca gccatcggct gttagtgaca aagcccctga gtcaagatga cagcagcccc 600

cataactcct aatcggctct cccgcgtgga gtcatttagg agtagtcgca ttagagacaa 660

gtccaacatc taatcttcca ccctggccag ggccccagct ggcagcgagg gtgggagact 720

ccgggcagag cagagggcgc tgacattggg gcccggcctg gcttgggtcc ctctggcctt 780

tccccagggg ccctctttcc ttggggcttt cttgggccgc cactgctccc gctcctctcc 840

ccccatccca ccccctcacc ccctcgttct tcatatcctt ctctagtgct ccctccactt 900

tcatccaccc ttctgcaaga gtgtgggacc acaaatgagt tttcacctgg cctggggaca 960

cacgtgcccc cacaggtgct gagtgacttt ctaggacagt aatctgcttt aggctaaaat 1020

gggacttgat cttctgttag ccctaatcat caattagcag agccggtgaa ggtgcagaac 1080

ctaccgcctt tccaggcctc ctcccacctc tgccacctcc actctccttc ctgggatgtg 1140

ggggctggca cacgtgtggc ccagggcatt ggtgggattg cactgagctg ggtcattagc 1200

gtaatcctgg acaagggcag acagggcgag cggagggcca gctccggggc tcaggcaagg 1260

ctgggggctt cccccagaca ccccactcct cctctgctgg acccccactt catagggcac 1320

ttcgtgttct caaagggctt ccaaatagca tggtggcctt ggatgcccag ggaagcctca 1380

gagttgctta tctccctcta gacagaaggg gaatctcggt caagagggag aggtcgccct 1440

gttcaaggcc acccagccag ctcatggcgg taatgggaca aggctggcca gccatcccac 1500

cctcagaagg gacccggtgg ggcaggtgat ctcagaggag gctcacttct gggtctcaca 1560

ttcttccagc aaatccctct gagccgcccc cgggggctcg cctcaggagc aaggaagcaa 1620

ggggtgggag gaggaggtct aagtcccagg cccaattaag agatcagatg gtgtaggatt 1680

tgggagcttt taaggtgaag aggcccgggc tgatcccact ggccggtata aagcaccgtg 1740

accctcaggt gacgcaccag ggccggctgc cgtcggggac agggctttcc atagcccagg 1800

taagtatcaa ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac 1860

agagaagact cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct 1920

ttctctccac aggcccagag aggagacagg ccgccacc 1958

<210> 96

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 插入到AAV GH环的合成肽

<400> 96

Leu Gly Glu Thr Thr Arg Pro

1 5

<210> 97

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 插入到AAV GH环的合成肽

<400> 97

Asn Glu Thr Ile Thr Arg Pro

1 5

<210> 98

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 插入到AAV GH环的合成肽

<400> 98

Lys Ala Gly Gln Ala Asn Asn

1 5

<210> 99

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 插入到AAV GH环的合成肽

<400> 99

Lys Asp Pro Lys Thr Thr Asn

1 5

<210> 100

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 插入到AAV GH环的合成肽

<400> 100

Lys Asp Thr Asp Thr Thr Arg

1 5

<210> 101

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 插入到AAV GH环的合成肽

<400> 101

Arg Ala Gly Gly Ser Val Gly

1 5

<210> 102

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 插入到AAV GH环的合成肽

<400> 102

Ala Val Asp Thr Thr Lys Phe

1 5

<210> 103

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 插入到AAV GH环的合成肽

<400> 103

Ser Thr Gly Lys Val Pro Asn

1 5

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1