本申请是申请日为2012年10月26日、申请号为201280065065.3、发明名称为“对nedd8活化酶(nae)抑制剂的反应的生物标记”的发明专利申请的分案申请。
相关申请案
本申请案要求2011年10月28日提交的美国临时申请案第61/552,686号的优先权。上述申请案的全部内容以引用的方式并入本文中。
本申请涉及对nedd8活化酶(nae)抑制剂的反应的生物标记。
序列表
本申请案包含以电子可读形式与此一起提交的序列表。所述序列表文件创建于2012年10月26日,命名为“序列表.txt”并且其大小是149kb(153,088个字节)。序列表.txt文件中的序列表的全部内容以这种引用的方式并入本文中。
背景技术:
当细胞的基因型或表型以不受正常组织环境限制的不受控制生长的方式改变时,这些细胞发生癌变。一或多个基因突变、扩增、缺失、过度表达或表达不足。染色体部分会丢失或从一个位置移动到另一个。一些癌症具有特征性图案,基因型或表型借此改变。
许多基因具有与癌症相关的突变。一些基因具有可以发生突变的多个位点。许多癌症具有一个以上基因的突变和/或错误表达。基因突变会促进肿瘤进展、肿瘤生长率或肿瘤是否将转移。一些突变会影响肿瘤细胞是否将对疗法起反应。
多种药剂治疗癌症。血液和骨髓的癌症通常用类固醇/糖皮质激素、酰亚胺、蛋白酶体抑制剂和烷基化剂治疗。其它组织的癌症通常用烷基化剂、拓扑异构酶抑制剂、激酶抑制剂、微管抑制剂、血管生成抑制剂或其它药剂治疗。一些患者对一种疗法的反应优于另一种,呈现患者遵从有效疗法的多种治疗途径的潜能。继续进行最终证实对患者无效的疗法会丢失所述患者治疗计划早期的宝贵时间。许多患者承受不起治疗方案的试误选择的时间。有利并准确的治疗决策促成疾病的有效管理。
技术实现要素:
本发明涉及通过测量本文中所提供的标记的量、存在或变化对肿瘤进行预后和计划治疗。这些标记可预测在用nedd8活化酶(nae)抑制剂,例如1-取代的氨基磺酸甲酯治疗之后,是否将存在有利结果(例如良好反应、长进展时间和/或长期存活)。例如体外测定遗传标记的存在、量或变化(例如至少一个标记基因的突变状态)的包含肿瘤细胞的测试样品鉴别特定患者,这些患者预期例如用nae抑制剂,例如1-取代的氨基磺酸甲酯治疗具有有利结果并且其疾病可以进行可管理地标准治疗或较不具有侵袭性的治疗;以及那些患者,这些患者预期具有不利的治疗结果并且可能需要组合治疗和/或用nae抑制剂更具侵袭性的治疗的替代性治疗以确保有利结果和/或成功管理疾病。
在一个方面,本发明提供适用于测定所述标记的特征(例如量、存在或变化)的试剂盒。在另一个方面,本发明提供确定预后和治疗或疾病管理策略的方法。在这些方面,测量包含肿瘤细胞的样品中的标记的特征,例如大小、序列、组成或量。在一个实施例中,所述肿瘤是液体肿瘤,例如血液肿瘤,例如急性骨髓性白血病、骨髓发育不良综合症或多发性骨髓瘤。在另一个实施例中,所述肿瘤是实体肿瘤,例如黑素瘤、非小细胞肺癌、食道癌、膀胱癌、成神经细胞瘤癌、间皮瘤、胰脏癌。
在各种实施例中,测量对应于本文所述的具有一或多个突变(例如体细胞突变)的标记基因的特征,例如dna的大小、序列、组成或量;rna的大小、序列、组成或量和/或蛋白质的大小、序列、组成或量。当分析显示关于标记基因的信息时,例如基因是否突变、突变的一致性和/或突变基因的rna或蛋白质量表明过度表达抑或表达不足,获得促成预后或治疗或疾病管理策略的有用信息。在一个实施例中,确定e1酶抑制,例如nae抑制,例如mln4924疗法策略。
适用于确定预后或治疗或疾病管理策略的测试的标记基因选自由以下组成的群组:神经纤维瘤蛋白2(nf2)、母亲抗dpp同源物4(mothersagainstdecapentaplegichomolog4;smad4)、赖氨酸特异性脱甲基酶6a(kdm6a)、肿瘤蛋白p53(tp53)、周期素依赖性激酶抑制剂2a(cdkn2a)、周期素依赖性激酶抑制剂2ap14变异体(cdkn2a_p14),在一些情况下,f盒和包含7的wd重复结构域(fbxw7)以及在一些情况下,腺瘤性结肠息肉病(apc)。每一标记基因包括突变或改变,所述突变或改变在dna中的存在或例如其对标记rna和/或蛋白质特征(例如量、大小、序列或组成)的影响可以提供关于确定预后或治疗或疾病管理的信息。在一些实施例中,例如在包含肿瘤细胞的样品中适用作标记的基因或突变体或其修饰形式所具有的dna、rna和/或蛋白质特征(例如大小、序列、组成或量)不同于正常的dna、rna和/或蛋白质。本文中描述称为“标记基因”的这些基因的修饰的实例,所述基因的突变或量可以提供此类信息。
本发明标记的突变提供关于例如用nae抑制剂,例如1-取代的氨基磺酸甲酯治疗之后的结果的信息。通过检查肿瘤中所鉴别的标记中的一或多者的特征,例如大小、序列、组成或量,有可能确定何种治疗剂、药剂组合、给药和/或投药方案预期在治疗之后提供有利结果。通过检查癌症中所鉴别的标记或标记组中的一或多者的特征,例如大小、序列、组成或量,还有可能确定何种治疗剂、药剂组合、给药和/或投药方案在治疗之后较不可能提供有利结果。通过检查所鉴别的标记中的一或多者的特征,例如大小、序列、组成或量,有可能因此消除无效或不当的治疗剂或治疗方案。重要地,可以基于逐个患者(patient-by-patient)进行这些确定。因此,可以确定特定治疗方案是否可能有益于特定患者或患者类型,和/或特定方案是否应该开始抑或避免、继续、中断或改变。
本发明是针对鉴别和/或选择癌症患者的方法,所述癌症患者预期在投与治疗方案,例如包含nae抑制剂的治疗方案,例如1-取代的氨基磺酸甲酯治疗之后展现有利结果。此外提供鉴别预期在投与此类治疗方案之后具有不利结果的患者的方法。这些方法通常包括测量、确定、接收、储存或传递关于患者的肿瘤(例如患者的癌细胞,例如血液癌细胞或实体肿瘤细胞)中的一或多个标记或标记基因的突变的特征,例如大小、序列、组成或量的信息,任选地将所述特征与参考标记的特征,例如大小、序列、组成或量进行比较;并且在又一实施例中,鉴别或建议样品的结果是否对应于治疗方案,例如nae抑制剂,例如1-取代的氨基磺酸甲酯治疗方案的有利结果。
此外提供的方法包括治疗方法,其进一步包括以下步骤:当在标记基因中突变的存在或患者标记的特征,例如大小、序列、组成或量表明所述患者预期用疗法,例如nae抑制剂,例如1-取代的氨基磺酸甲酯治疗方案展现有利结果时,相应地开始、继续或启动疗法。另外,所述方法包括治疗方法,其进一步包括以下步骤:例如如相比于经鉴别具有有利结果的接受相同治疗方案的患者,当标记基因中突变的存在或患者标记的特征,例如大小、序列、组成或量表明所述患者预期用治疗,例如用nae抑制剂,例如1-取代的氨基磺酸甲酯方案展现不利结果时,相应地停止、中断、改变或暂停疗法。在另一个方面,提供基于标记基因中突变的存在或本文所述的患者标记中的一或多者的特征,例如、大小、序列、组成或量来分析尚未用疗法,例如nae抑制剂,例如1-取代的氨基磺酸甲酯疗法治疗的患者并且鉴别和预测治疗结果的方法。这些方法可包括不用所述疗法,例如nae抑制剂,例如1-取代的氨基磺酸甲酯疗法治疗,用疗法,例如nae抑制剂治疗或用1-取代的氨基磺酸甲酯疗法与一或多种附加疗法的组合治疗;用nae抑制剂,例如1-取代的氨基磺酸甲酯疗法的替代性疗法治疗;或用更具侵袭性的给药和/或投药方案疗法,例如e1酶抑制剂,例如nae抑制剂治疗,例如如相比于经鉴别具有标准nae抑制剂,例如1-取代的氨基磺酸甲酯疗法的有利结果的患者的给药和/或投药方案。因此,所提供的本发明方法可以消除疗法,例如nae抑制剂,例如1-取代的氨基磺酸甲酯疗法方案的无效或不当的使用。
附加方法包括测定药剂活性、药剂功效或鉴别新治疗剂或组合的方法。这些方法包括基于药剂影响标记基因中突变的存在或本发明标记的特征,例如大小、序列、组成或量的能力,鉴别所述药剂适用作例如nae抑制剂,例如1-取代的氨基磺酸甲酯,用于治疗癌症,例如血液癌症(例如多发性骨髓瘤、白血病、淋巴瘤等)或实体肿瘤癌症(例如黑素瘤、食道癌或膀胱癌)的方法。举例来说,以表明患癌症患者的有利结果的方式减少或增加标记基因中突变的存在或所提供的标记的特征,例如大小、序列、组成或量的抑制剂将是癌症的候选药剂。或者,能够降低肿瘤细胞活力的药剂将是癌症的候选药剂,所述肿瘤细胞包含指示不利结果的标记。
本发明还针对用治疗方案,例如nae抑制剂,例如1-取代的氨基磺酸甲酯疗法方案(例如单独或与附加药剂组合,所述附加药剂例如化学治疗剂,例如糖皮质激素剂、蛋白酶体抑制剂、烷基化剂、激酶抑制剂或拓扑异构酶抑制剂)治疗癌症患者的方法,其包括以下步骤:选择治疗其标记特征,例如大小、序列、组成或量表明所述患者预期具有所述治疗方案的有利结果的患者,并用所述疗法,例如nae抑制,例如1-取代的氨基磺酸甲酯疗法治疗所述患者。在一些实施例中,所述方法可包括以下步骤:选择其标记特征,例如大小、序列、组成或量表明患者预期具有有利结果的患者并且投与除nae抑制剂疗法以外表明与nae抑制剂,例如1-取代的氨基磺酸甲酯疗法类似的预期存活时间的疗法。
治疗癌症患者的附加方法包括选择在用癌症疗法(例如nae抑制剂,例如1-取代的氨基磺酸甲酯疗法)治疗之后不太可能经历有利结果的患者。这些方法可以进一步包括以下一或多者:如相比于经鉴别用标准疗法具有有利结果的患者的剂量或给药时程,投与更高剂量或增加给药时程的疗法,例如nae抑制剂,例如1-取代的氨基磺酸甲酯;投与除nae抑制剂,例如1-取代的氨基磺酸甲酯疗法以外的癌症疗法;投与nae抑制剂,例如1-取代的氨基磺酸甲酯药剂与附加药剂的组合。进一步提供选择具有侵袭性疾病的患者的方法,所述患者预期展现更迅速的进展和死亡时间。
附加方法包括以下方法:通过检查患者的指示癌症疗法(例如nae抑制剂,例如1-取代的氨基磺酸甲酯疗法方案)的结果的标记的量,评估是否治疗癌症抑或支付癌症的治疗,所述癌症例如血液癌症(例如多发性骨髓瘤、白血病、淋巴瘤等)或实体肿瘤癌症(例如黑素瘤、食道癌或膀胱癌);并且作出关于是否应该支付的决策或建议。
本文中所提到的所有公开案、专利申请案、专利和其它参考文献的全部内容都以引用的方式并入文本中。
本发明的其它特征和优势将从以下具体实施方式、图式以及从权利要求书显而易知。
附图说明
图1.1-取代的氨基磺酸甲酯的通式结构。g1是-o-或-ch2-;g2是-h或-oh;g3是-h或-oh;g4是-nh-、-o-或共价键;以及g5是被取代的杂芳基。
图2.用于蛋白质底物的科林-环(cullin-ring)连接酶(crl)泛素化和用于类泛素化修饰的通用路径。在crl中,科林次单位必须通过泛素样蛋白nedd8修饰保守赖氨酸以活化全酶活性。nedd8活化和与科林蛋白的结合是通过酶级联催化的,所述酶级联与涉及nedd8的e1(nae)和e2(ubc12)的泛素化是类似的。从科林去除nedd8是通过cop9信号体催化的。去类泛素化修饰有助于crl组分的解离。科林-环核心通过结合到cand1以非活性状态隔离直到得到补充以形成新crl为止。
图3.第2组细胞系对mln4924的反应。每个点表示一种细胞系。
图4a-b.比较各组细胞系对mln4924的反应。a.通过ec50对第2组细胞系排序。黑线表示存在于第1组中的细胞系。在两个组中存在114个具有相同名称的细胞系。b.比较存在于两个组中的细胞系的对照百分比(poc)活力。重叠细胞系的结果具有0.72的斯皮尔曼等级相关系数,p值<2.2e-16。
图5.在tp53突变的情况下抗性的组织相关性。相比于tp53wt细胞系,tp53突变体结肠癌细胞系对mln4924治疗更具抗性(更高的对照百分比活力)。
图6a-d.在用不同剂量的mln4924处理之后在多个时间点tp53loss对癌细胞系活力的影响。通过atplite,在一系列mln4924浓度和时间点下测量tp53基因剔除对成对的hct-116结肠癌细胞系对mln4924的敏感性的影响。数据表示为平均值±sem,n=3。虚线,p53基因剔除;实线,p53野生型。
具体实施方式
癌症患者疗法的持续问题之一是响应于疗法的个体差异。虽然在开发成功癌症疗法方面有所进展,但是仅一个子集的患者对任一特定疗法起反应。在许多可获得的癌症疗法的窄治疗指数和潜在毒性的情况下,这些差别反应可能造成患者经历不必要的、无效的并且甚至可能有害的疗法方案。如果能够优化所设计的疗法以治疗个别患者,那么可以减少或甚至消除这些情况。此外,目标设计疗法可以提供总体而言更集中的成功患者疗法。因此,需要鉴别预期当投与特定癌症疗法时具有有利结果的特定癌症患者以及使用更具侵袭性的和/或替代性癌症疗法(例如替代向所述患者投与的先前癌症疗法)可以具有有利结果的特定癌症患者。因此提供癌症患者的诊断、分期、预后和监控将是有利的,所述癌症患者包括例如血液癌症患者(例如多发性骨髓瘤、白血病、淋巴瘤等)或实体肿瘤癌症(例如黑素瘤、食道癌或膀胱癌),所述癌症患者将受益于特定癌症抑制疗法以及所述癌症患者将受益于更具侵袭性的和/或替代性癌症抑制疗法,例如替代患者已接受的癌症疗法,从而产生恰当的预防性测量。
本发明部分地基于以下认知:标记基因的突变可以与包含突变基因的细胞对nae抑制剂、例如1-取代的氨基磺酸甲酯的敏感性相关。在一些实施例中,标记基因参与科林-环连接酶(crl)路径,例如所编码的蛋白质与crl或crl相关蛋白质相互作用的基因,或是crl底物。由标记基因编码的蛋白质可以具有作为肿瘤抑制基因的野生型功能。标记基因的实例包括nf2、smad4和/或kdm6a。标记基因的其它实例包括tp53、apc、cdkn2a和/或cdkn2a_p14。标记基因可以展现突变,例如体细胞突变,突变的存在会影响所编码的基因产物的表达或活性。在一些实施例中,在肿瘤细胞或肿瘤中可以在标记基因中存在一种以上突变或可以存在一个以上具有突变的标记基因。在附加实施例中,可以在附加基因中具有突变的细胞中存在标记基因突变,包括可以引起肿瘤发生的突变,但附加突变基因可以不是如本文中所认为的标记基因。在一些实施例中,所述突变是失活性突变。在其它实施例中,所述突变影响标记基因的表达。在其它实施例中,突变可以改变所编码的基因产物与细胞结合伴侣的相互相用。鉴别和/或测量标记基因的突变可以用于确定通过例如用nae抑制剂、例如1-取代的氨基磺酸甲酯疗法处理肿瘤是否可以预期有利结果;或用例如nae抑制剂、例如1-取代的氨基磺酸甲酯抑制剂的替代性疗法和/或更具侵袭性的疗法是否可以延长预期存活时间。举例来说,本文中所提供的组合物和方法可以用于确定是否预期患者对nae抑制剂、例如1-取代的氨基磺酸甲酯治疗剂或nae抑制剂、例如1-取代的氨基磺酸甲酯给药或投药方案具有有利结果。一般来说,本文所述的肿瘤抑制基因标记基因的突变与对nae抑制剂的敏感性或nae抑制剂处理的有利结果相关。可以在与科林-环连接酶相关的路径中充当肿瘤抑制基因并且其突变与对nae抑制的敏感性相关的标记基因的实例包括nf2、smad4、kdm6a、fbxw7、cdkn2a和/或cdkn2a_p14。然而,tp53和apc也是肿瘤抑制基因标记基因。具体来说,tp53路径基因与nae抑制剂作用相关。如本文所述,在许多肿瘤类型的一些实施例中,tp53和apc(在一些情况下)的突变产生对nae抑制的抗性。因此,来自tp53和apc组成的群组的野生型标记基因会与nae敏感性相关。在一些实施例中,选自由tp53和apc组成的群组的标记基因的突变与对nae抑制剂的抗性相关。
基于这些鉴别,本发明提供(但不限于):1)用于确定nae抑制剂、例如1-取代的氨基磺酸甲酯疗法方案是否可有效获得有利结果和/或管理癌症的方法和组合物;2)用于监控用于治疗肿瘤的nae抑制剂、例如1-取代的氨基磺酸甲酯疗法(单独或与药剂组合)和给药与投药的有效性的方法和组合物;3)用于治疗肿瘤的方法和组合物,包含例如nae抑制剂、例如1-取代的氨基磺酸甲酯抑制疗法方案;4)用于鉴别可有效治疗特定患者的肿瘤的特定治疗剂和治疗剂组合以及给药和投药方案的方法和组合物;以及5)用于鉴别疾病管理策略的方法和组合物。
泛素和其它泛素样分子(ubl)是通过特异性酶(e1酶)活化的,所述特异性酶催化形成与ubl的c端甘氨酸的酰基-腺苷酸中间物。活化的ubl然后通过形成硫酯键中间物转移到e1酶内的催化性半胱氨酸残基中。e1-ubl中间物和e2结合,产生硫酯交换,其中ubl转移到e2的活性位点半胱氨酸。ubl然后直接地或连同e3连接酶一起,通过与目标蛋白中的赖氨酸侧链的氨基形成异肽键而结合到目标蛋白。名为神经前体细胞-表达发育下调8(nedd8)的ubl是通过杂二聚体nedd8活化酶(nae,也称为appbp1-uba3、ube1c(泛素活化酶e1c))活化的并且转移到两种e2结合酶(泛素载体蛋白12(ubc12)和ubc17)中的一种,最终通过科林-环亚型泛素连接酶产生nedd8与科林蛋白的连接(参见图2)。类泛素化修饰的功能是活化基于科林的泛素连接酶,所述连接酶参与许多细胞周期和细胞信号传导蛋白、包括p27和i-κb的转换。参见潘(pan)等人,《致癌基因》(oncogene)23:1985-97(2004)。抑制nae可以破坏科林-环连接酶介导的蛋白质转换并且可以在细胞(例如肿瘤细胞或病原性生物体(例如寄生虫)的细胞)中引起细胞凋亡性死亡。参见苏西(soucy)等人(2010)《基因与癌症》(genes&cancer)1:708-716。
如本文所用,术语“e1”、“e1酶”或“e1活化酶”是指参与活化或促进泛素或泛素样(统称为“ubl”)与目标分子的结合的相关atp依赖性活化酶家族中的任一者。e1活化酶通过腺苷酰化作用/硫酯中间物形成起作用以通过转硫醇反应将恰当的ubl转移到相应e2结合酶中。所得活化的ubl-e2促进ubl与目标蛋白的最终结合。在细胞信号传导、细胞周期和蛋白质转换中起作用的各种细胞蛋白是用于ubl结合的底物,所述结合通过e1活化酶(例如nae、uae、sae)进行调节。除非上下文另有指示,否则术语“e1酶”打算是指任何e1活化酶蛋白质,包括(但不限于)nedd8活化酶(nae(appbp1/uba3))、泛素活化酶(uae(uba1))、sumo活化酶(sae(aos1/uba2))、uba4、uba5、uba6、atg7或isg15活化酶(ubell)。
术语“e1酶抑制剂”或“e1酶的抑制剂”是用于表示具有如本文中所定义的结构的化合物,其能够与e1酶相互作用并抑制其酶活性。抑制e1酶活性意指降低e1酶活化泛素(如ubl)与底物肽或蛋白质结合(例如泛素化、类泛素化修饰、苏素化)的能力。在一些实施例中,e1酶抑制剂可以抑制一种以上e1酶。在其它实施例中,e1酶抑制剂对特定的e1酶具有特异性。在各种实施例中,e1酶活性的此类降低是至少约50%,至少约75%,至少约90%,至少约95%或至少约99%。在各种实施例中,降低e1酶活性所需的e1酶抑制剂的浓度小于约1μm,小于约500nm,小于约100nm,小于约50nm或小于约10nm。
如本文所用,术语“nae抑制剂”是指nae杂二聚体的抑制剂。nae抑制剂的实例包括1-取代的氨基磺酸甲酯(参见图1),包括mln4924。兰斯顿(langston)s.等人的美国专利申请案第11/700,614号,其pct申请案公开为wo07/092213、wo06084281和wo2008/019124(上述公开专利申请案中每一个的全部内容在此以引用的方式并入本文中),揭示作为e1活化酶的有效抑制剂的化合物,例如nae。在一些实施例中,nae抑制剂不抑制或极差地抑制其它(非nae)e1酶。所述化合物适用于体外和体内抑制e1活性并且适用于治疗细胞增殖病症,例如癌症;和与e1活性相关的其它病症,例如病原性感染和神经退化性病症。兰斯顿等人所描述的一类化合物是4-取代的氨基磺酸((1s,2s,4r)-2-羟基-4-{7h-吡咯并[2,3-d]嘧啶-7-基}环戊基)甲酯。
mln4924(氨基磺酸((1s,2s,4r)-4-{4-[(1s)-2,3-二氢-1h-茚-1-基氨基]-7h-吡咯并[2,3-d]嘧啶-7-基}-2-羟基环戊基)甲酯)是一种nae特异性e1抑制剂,其通过扰动细胞蛋白质体内平衡破坏科林-环连接酶介导的蛋白质转换,引起人类肿瘤细胞的细胞凋亡性死亡(苏西等人(2009)《自然》(nature)458:732-736)。细胞和肿瘤异种移植研究中的mln4924评估已显示两种不同的作用机制。第一种是通过mln4924介导的crl1skp2和crl4ddb1底物cdt-1的调节异常来诱导dna再复制、dna损伤和细胞死亡(米尔霍林(milhollen)等人(2011)《癌症研究》(cancerres.)71:3042-3051)。已经显示,p53状态不影响诱导dna再复制但会使细胞更易于经历细胞凋亡或衰老,这取决于恰当的遗传背景(米尔霍林等人(2011),同前文献;林(lin)等人(2010)《自然》464:374-379和林等人(2010)《癌症研究》70:10310-20)。第二种机制是主要通过crl1βtrcp介导的磷酸化iκbα转换的调节异常来抑制nf-κb依赖性弥漫性大b细胞淋巴瘤中的nf-κb路径活性(米尔霍林等人(2010)《血液》(blood)116:1515-1523)。另外,急性骨髓性白血病(aml)的临床前模型对在细胞系和原始患者胚细胞两者中通过与cdt-1调节异常、nf-κb抑制和诱导活性氧物质相关的机制进行的mln4924抑制是敏感的(索兹(swords)等人(2010)《血液》115:3796-3800)。
例如nf2(由阿罗诺维茨(ahronowitz)等人(2007)《人类突变》(humanmutation)28:1-2综述)、kdm6a(由凡·哈福坦(vanhaaften)等人(2009)《自然·遗传学》(nat.genet.)41:521-523综述)、fbxw7、tp53、cdkn2a和cdkn2a_p14的基因在许多癌症类型中发生突变。smad4在多种癌症中突变,但许多smad4突变发现于肠癌、胰腺癌(由宫木(miyaki)和黑木(kuroki)(2003)《生物化学与生物物理研究通讯》(biochem.biophys.res.commun.)306:799-804综述)或甲状腺癌中。
如本文所用,“nf2”是指与基因库寄存编号nm_000268,seqidno:1(开放阅读框架是seqidno:2,seqidno:1的核苷酸444到2231)相关的编码基因肽寄存编号np_000259(seqidno:3)的基因的较长同功异型物。nf2的其它名称包括acn、banf、sch和梅林蛋白(merlin)(膜突蛋白-埃兹蛋白-根蛋白样蛋白(moesin-ezrin-radixin-likeprotein))。nf2充当肿瘤抑制基因并且可见于22号染色体上。nf2与细胞骨架、细胞表面蛋白相互作用并且可以参与细胞骨架动力学和调节离子转运。nf2的可以涉及对nae抑制、例如mln4924的敏感性的功能包括其抑制e3泛素连接酶crl4dcaf1的能力(李(li)等人(2010)《细胞》(cell)140:477-490)。nf2突变可以破坏其抑制活性并导致crl4dcaf1的底物不受控制的泛素化和含有突变基因的细胞的增殖。
如本文所用,“smad4”是指与基因库寄存编号nm_005359,seqidno:4(开放阅读框架是seqidno:5,seqidno:4的核苷酸539到2197)相关的编码基因肽寄存编号np_005350,seqidno:6的基因。smad4的其它名称包括胰腺癌缺失基因座4(dpc4)、jip或母亲抗果蝇dpp同源物4(mad4)。smad4是参与转型生长因子(tgf)-β信号传导的一种信号转导蛋白。smad4可以充当肿瘤抑制基因并且可以靶向它以通过skp-科林-f盒蛋白(scf)复合物泛素化进行降解。
如本文所用,“kdm6a”是指与基因库寄存编号nm_021140,seqidno:7(开放阅读框架是seqidno:8,seqidno:7的核苷酸376到4581,或seqidno:9)相关的编码基因肽寄存编号np_066963,seqidno:10或seqidno:11(seqidno:10在位置173处是v而不是l并且在584处是r而不是l,在位置601处是n而不是s和/或在位置629处是k而不是e)的基因。kdm6a的其它名称包括泛转录的三十四肽重复蛋白x连接或x染色体(utx)上的泛转录的tpr基因或ba286n14.2。kdm6a是组蛋白脱甲基酶并且可以充当肿瘤抑制基因。
如本文所用,“fbxw7”是指与基因库寄存编号nm_033632,seqidno:12(开放阅读框架是seqidno:13,seqidno:12的核苷酸150到2273)相关的编码基因肽寄存编号np_361014,seqidno:14的基因。fbxw7的其它名称包括秀丽隐杆线虫sel-10的同源物(sel10)、群岛同源物(ago)、f盒蛋白fbx30(fbxo30)或细胞分裂控制蛋白4(cdc4)。fbxw7可以结合到泛素蛋白连接酶复合物中参与蛋白质的磷酸化依赖性泛素化,包括参与细胞周期和存活的蛋白质。fbxw7可以充当肿瘤抑制基因。使用fbxw7作为标记基因可以是器官特异性的,即,其可以是在一些组织中而不是其它组织中出现肿瘤的敏感性标记。举例来说,fbxw7可以是子宫、子宫颈或肝脏的肿瘤的敏感性标记,但不是消化道肿瘤的敏感性标记,其中其它基因突变可以占主导以引起来自那些肿瘤的细胞对mln4924的不敏感性或抗性。
如本文所用,“tp53”是指与基因库寄存编号nm_000546,seqidno:15(开放阅读框架是seqidno:16,seqidno:15的核苷酸203到1384,或一种变异体,其中在位置417处的核苷酸是鸟嘌呤而不是胞嘧啶)相关的编码基因肽寄存编号np_000537,seqidno:17或一种变异体(其中在位置72处的氨基酸残基是精氨酸r而不是脯氨酸p)的基因。tp53的其它名称包括bcc7、lfs1和p53。tp53结合dna并活化转录因子,而且可以充当肿瘤抑制基因。
如本文所用,“cdkn2a”是指与基因库寄存编号nm_000077,seqidno:18(开放阅读框架是seqidno:19,seqidno:18的核苷酸307到777)相关的编码基因肽寄存编号np_000068,seqidno:20的基因。cdkn2a的其它名称包括交替开放阅读框架(arf)、p16、p16arf、周期素依赖性激酶4的抑制剂(ink4)和多肿瘤抑制基因-1(mts1)。cdkn2a的变异体在第一外显子方面有所不同。一种变异体是“cdkn2a_p14”或“cdkn2a.p14”,也称为p14arf,是与基因库寄存第号nm_058195,seqidno:21(开放阅读框架是seqidno:22,seqidno:21的核苷酸38到559);基因肽np_478102,seqidno:23或始于seqidno:23的氨基酸残基42处的变异体相关。cdkn2a_p14产生于不同于p16arf(p16ink4a,cdkn2a)的阅读框架的转译。cdkn2a和cdkn2a_p14抑制周期素依赖性激酶4,可以稳定p53并且可以调节细胞周期g1进展。cdkn2a和cdkn2a_p14可以充当肿瘤抑制基因。
如本文所用,“apc”是指腺瘤性结肠息肉病,所述基因与基因库寄存编号nm_000038,seqidno:24(开放阅读框架seqidno:25,或在核苷酸1458处具有胸腺嘧啶而不是胞嘧啶的变异体)相关,编码基因肽寄存编号np_000029,seqidno:26。apc的其它名称包括btsp2和dp2。apc结合微管并抑制wnt信号传导路径,而且可以充当肿瘤抑制基因。
对与癌症相关的突变进行公共编目一直受到关注。包括关于与癌症相关的突变的信息的公用数据库的实例是由美国国家生物技术信息中心(马里兰州的贝塞斯达(bethesda,md))维护的基因型和表型的数据库(dbgap)以及由维康信托桑格研究所(wellcometrustsangerinstitute)(英国剑桥(cambridge,uk))维护的癌症体细胞突变目录(cosmic)数据库。
提供测定突变状态,例如鉴别血液肿瘤(例如多发性骨髓瘤、白血病、淋巴瘤等)或实体肿瘤(例如黑素瘤、食道癌、肺癌或膀胱癌)中标记基因的突变以预测对治疗的反应,进展时间和治疗之后的存活的组合物和方法。本文中所提供的组合物和方法也可以鉴别实体肿瘤,例如来自结肠癌、乳癌、头颈癌或中枢神经系统癌的标记基因的突变。
标记是基于展现对mln4924治疗的敏感性的肿瘤细胞的遗传概况来鉴别的。tp53标记也是基于在tp53基因的缺失方面有所不同的同基因细胞系的行为来鉴别的。所观察到的敏感性可以在通过一种以上方法测试的肿瘤细胞中取得一致。
除非另外定义,否则本文中所使用的所有技术和科技术语具有本发明本领域的普通技术人员的通常所理解的含义。一般来讲,本文中所述的与分子生物学以及蛋白质和寡核苷酸或聚核苷酸化学和杂交结合使用的命名法以及其细胞与组织培养技术是本领域中已知的那些。基因库或基因肽寄存编号和有用的核酸和肽序列可见于由马里兰州贝塞斯达的美国国家生物技术信息中心维护的网站。贯穿本申请案(包括表格)所引用的所有数据库寄存记录(例如来自昂飞hg133注释文件(affymetrixhg133annotationfiles)、英特兹(entrez)、基因库、refseq、cosmic)的内容在此以引用的方式并入本文中。使用标准技术进行重组dna、寡核苷酸合成、蛋白质纯化、组织培养和转型以及转染(例如电穿孔、脂质体转染等)。酶促反应是根据制造商的说明书或如此项技术中通常所实现或如本文中所述来进行。以上技术和程序一般可根据本领域中已知的方法,例如如贯穿本发明说明书所引用并论述的各个一般性和较特定的参考文献中所述来进行。参见例如萨姆布鲁克(sambrook)等人(2000)《分子克隆实验手册》(molecularcloning:alaboratorymanual)(第3版,冷泉港实验室出版社(coldspringharborlaboratorypress),冷泉港,纽约)或哈洛(harlow),e.和莱恩(lane),d.(1988)《抗体实验手册》(antibodies:alaboratorymanual)(冷泉港实验室出版社,冷泉港,纽约)。本文中所述的与分析化学、合成有机化学和药物与医药化学结合使用的命名法以及其实验室程序和技术是本领域中已知的。标准技术用于化学合成、化学分析、医药制备、调配和传递以及治疗患者。此外,除非另外为情形所需,否则单数术语应包括复数并且复数术语应包括单数。倘若有冲突,那么将以本说明书(包括定义)为主。
本文中使用冠词“一(a/an)”和“至少一个”来指所述冠词的一个或一个以上语法宾语。举例来说,“一个要素”意指一个或一个以上要素、至少一个要素。倘若有冲突,那么将以本说明书(包括定义)为主。
如本文所用,“有利”结果或预后是指长期存活、长进展时间(ttp)和/或良好反应。反之,“不利”预后是指短期存活、短进展时间(ttp)和/或不良反应。
如本文所用的“标记”包括与标记基因相关的材料,所述标记基因已经被鉴别为具有患者肿瘤细胞的突变并且此外,所述突变是患者用例如nae抑制剂、例如1-取代的氨基磺酸甲酯治疗的结果是有利或不利的表征。标记的实例包括材料,例如染色体基因座、基因的dna、基因的rna或基因的蛋白质。举例来说,标记包括标记基因材料,例如展示指示短期存活患者的特征(例如大小、序列、组成或量)的染色体基因座、dna、rna或蛋白质;或者标记包括标记基因材料,例如展示指示长期存活患者的突变或特征(例如大小、序列、组成或量)的染色体基因座、dna、rna或蛋白质。在另一实例中,标记包括标记基因材料,例如染色体基因座、dna、rna或蛋白质,其突变或特征(例如大小、序列、组成或量)指示患者具有不良的治疗反应;或者标记包括标记基因材料,例如染色体基因座、dna、rna或蛋白质,其突变或特征(例如大小、序列、组成或量)指示患者具有良好反应。在另一实例中,标记包括标记基因材料,例如染色体基因座、dna、rna或蛋白质,其突变或特征(例如大小、序列、组成或量)指示患者的疾病在治疗之后具有短进展时间(ttp);或者标记包括标记基因材料,例如染色体基因座、dna、rna或蛋白质,其突变或特征(例如大小、序列、组成或量)指示患者的疾病具有长ttp。在又另一实例中,标记包括标记基因材料,例如染色体基因座、dna、rna或蛋白质,其突变或特征(例如大小、序列、组成或量)指示患者的疾病在治疗之后具有短期存活;或者标记包括标记基因材料,例如染色体基因座、dna、rna或蛋白质,其突变或特征(例如大小、序列、组成或量)指示患者的疾病具有长期存活。因此,如本文所用,标记是打算包括这些可能性中的每一个,并且可以进一步包括每个单一标记单独地作为标记;或者当提及“标记”或“标记组”时可共同地包括一或多个或所有特征。
适用于测量以确定预后或治疗或疾病管理策略的染色体基因座标记选自由以下组成的群组:染色体22q12.2(nf2),例如从碱基对29999545到30094589;染色体18q21.1-21.2(smad4),例如从碱基对48556583到48611412;染色体xp11.2(kdm6a),例如从碱基对44732423到44971847;染色体4q31.3(fbxw7),例如从碱基对153242410到153456172;染色体17p13.1(tp53),例如从碱基对7571720到7590868;以及9p21(cdkn2a和cdkn2a_p14),例如从碱基对21967751到21994490。染色体基因座编号是基于ncbi基因数据库中的参考人类基因组build37.3(从2011年10月5日至今)。标记dna、标记rna或标记蛋白质可以对应于染色体基因座标记上的碱基对。举例来说,标记dna可以包括来自染色体基因座标记的基因组dna,标记rna可以包括从基因座标记转录的聚核苷酸,并且标记蛋白质可以包括由样品,例如包含肿瘤细胞的样品中的染色体基因座标记处表达产生的多肽。
“标记核酸”是一种由本发明的标记基因编码或对应于本发明的标记基因的核酸(例如基因组dna、mrna、cdna)。这些标记核酸包括dna,例如基因组dna的有义和反义链(例如包括本文中出现的任何内含子),包含完整或部分序列,例如基因组dna的外显子中的一者或多者,最多并包括任何标记基因的开放阅读框架或此类序列的互补序列。标记核酸也包括包含任何标记的完整或部分序列或此类序列的互补序列的rna,其中所有胸苷残基被尿苷残基置换,rna通过基因组dna的转录产生(即在剪接之前),rna通过剪接从基因组dna转录的rna产生,并且蛋白质通过转译所剪接的rna产生(即包括在通常裂解区域(例如跨膜信号序列)的裂解之前和之后的两种蛋白质)。如本文所用,“标记核酸”还可以包括通过反转录通过转录基因组dna产生的rna(包括剪接rna)制得的cdna。标记核酸还包括此类序列,其由于遗传代码的简并而不同于某些核酸的核苷酸序列,所述核酸编码对应于本发明的标记(例如突变标记)的蛋白质,并因此编码相同蛋白质,例如突变蛋白。如本文所用,短语“等位变异体”是指出现在指定基因座或通过核苷酸序列编码的多肽的核苷酸序列。这些天然产生的等位变异通常会在指定基因的核苷酸序列中引起1-5%变化。交互等位基因可以通过对多个不同个体中,例如不患有癌症的个体的细胞中,例如生殖系细胞中的相关基因进行测序来鉴别。此测序可以通过使用杂交探针容易地进行,从而鉴别各种个体中的相同遗传基因座。任何和所有这些核苷酸变异和所得氨基酸多形现象或变异(这是天然产生的等位变异的结果并且不改变野生型标记基因的功能活性)的检测打算属于本文所述标记的野生型形式的范围内。“标记蛋白”是一种通过本发明的标记(例如突变体核酸)编码或与此对应的蛋白质。术语“蛋白质”和“多肽”可互换地使用。标记的蛋白质可以特定地通过其名称或氨基酸序列来提及,但本领域的普通技术人员应了解,突变、缺失和/或转译后修饰会影响蛋白质结构、外观、细胞定位和/或行为。除非另外规定,否则这些差异在本文中不进行区分,并且本文所述的标记打算包括任何或所有此类变种。
如本文所用,“标记基因”是指可以具有突变以使得其dna、rna和/或蛋白质具有能在治疗之后提供关于预后的信息(即“提供信息的”)的特征(例如大小、序列、组成或量)的基因。本文中联系nae抑制剂、例如1-取代的氨基磺酸甲酯(例如mln4924)治疗之后的结果描述的标记基因是上文所述的染色体基因座标记内的基因的实例并且提供在表1中。对应于标记基因的mrna的序列、开放阅读框架和蛋白质也列举在表1中。表1中所列举的标记基因可以具有同功异型物,其或者普遍存在或者表达受限。除了cdkn2a_p14同功异型物的独立清单之外,表1中的dnaseqidno是指编码主要或最长同功异型物的mrna并且蛋白质seqidno至少表示此类同功异型物的前体并且不一定是成熟蛋白质。这些序列并不打算限制与所述同功异型物或前体的标记基因一致性。通过检查在英特兹基因(由马里兰州贝塞斯达的美国国家生物技术信息中心维护的数据库)下所提供,通过表1中列举的id编号鉴别的信息,本领域的普通技术人员可容易地获取并理解附加同功异型物和成熟蛋白质。
表1关于nae抑制剂治疗的标记基因描述
如本文所用,标记的“提供信息的”特征(例如大小、序列、组成或量)是指其值或差异与预后或结果相关的特征,例如大小、序列、组成或量。标记的提供信息的特征(例如大小、序列、组成或量)可以通过分析对应于所述标记基因的核酸(例如dna或rna)或蛋白质来获得。如果标记(例如染色体基因座标记或来自患者的样品中的标记)的特征,例如大小(例如长度或分子量)、序列(例如核酸序列或蛋白质序列)、组成(例如碱基或氨基酸组成或肽消化或基因片段图案)或量(例如复制数量和/或表达水平)不同于所分析的物质的野生型或等位变异体,那么这些特征可以“提供信息”。在一些实施例中,如果标记的特征表明标记基因是野生型,那么所述特征是提供信息的。在测量标记的量的实施例中,如果量大于或小于参考量的程度大于用于评定表达所用分析的标准误差,那么所述量是“提供信息的”。标记的提供信息的表达水平可以在所测量的表达水平与结果的统计相关性之后测定,所述结果例如良好反应、不良反应、长进展时间、短进展时间、短期存活或长期存活。统计分析的结果可以建立用于选择本文所描述方法中使用的标记的临界值。或者,具有不同特征(例如大小、序列、组成或量)的标记(例如染色体基因座标记或标记基因)将具有可预测结果的量的典型范围。提供信息的特征(例如大小、序列、组成或量)是属于针对结果测定的特征(例如大小、序列、组成或量)范围内的特征,例如大小、序列、组成或量。再者,设定为通过本文中所提供的方法测定,如果一组标记的特征(例如尺寸、序列、组合物或量)的组合或者满足或者高于或低于标记(例如染色体基因座标记或标记基因)的预定评分,那么这组标记可以一起“提供信息”。除可以改变标记序列或组成的点突变之外,基因易位、转录物剪接变异、缺失和截短也是可以改变标记大小、序列或组成的事件的实例。仅测量标记基因(即dna、rna或蛋白质)的一个特征(例如标记)即可提供预后,即表明结果。当两个特征的提供信息的量彼此一致,即结果的生物学不矛盾时,测量标记基因的一个以上特征(例如标记)可以提供预后。标记基因的多个特征的一致测量结果的实例可以鉴别dna或rna中的无义突变或缺失和低量或低分子量的所编码的蛋白质,或编码结合袋的区域中的突变或蛋白质的活性位点和所编码蛋白质的低活性。当蛋白质在具有基于其活性水平控制其合成的反馈环路的路径中时,可以发生不同实例。在此实例中,蛋白质的低量或低活性可以与其突变mrna的高量相关,因为组织由于标记基因突变而缺乏蛋白质活性并重复地发信号产生蛋白质。
如本文所用,“基因缺失”是指dna复制数量的量小于2并且“扩增”是指dna复制数量的量大于2。“二倍体”量是指复制数量等于2。术语“二倍体或扩增”可以解释为“不缺失”基因复制。在替代性提供信息的量是基因缺失的标记中,一般不会看到扩增。反之,术语“二倍体或缺失”可以解释为“不扩增”复制数量。在替代性提供信息的量是扩增的标记中,一般不会看到基因缺失。为清楚起见,序列缺失可以由于标记基因突变而发生在基因内并且可以引起转录蛋白质或缩短mrna或蛋白质的缺乏。此类缺失不会影响复制数量。
术语“长期存活”和“短期存活”是指在接受第一剂量治疗之后癌症患者预测存活的时间长度。“长期存活者”是指预期比那些鉴别为短期存活者的患者具有更慢的进展速率或更迟死于肿瘤的患者。“增加的存活”或“更慢的死亡速率”是基于本文所述标记中的一或多者的特征(例如大小、序列、组成或量)的评估寿命决定,例如如相比于参考标准以使得70%、80%、90%或90%以上的群体在接受第一剂量治疗之后将存活足够的时间段。“更快的死亡速率”或“更短的存活时间”是指基于本文所述标记中的一或多者的特征(例如大小、序列、组成或量)的评估寿命决定,例如如相比于参考标准以使得50%、40%、30%、20%、10%或10%以下的群体在接受第一剂量治疗之后将不存活足够的时间段。在一些实施例中,足够的时间段是从接受癌症疗法的第一天测量,至少6、12、18、24或30个月。
如果癌症的生长速率由于与治疗剂接触而相比于其在不与治疗剂接触情况下的生长有所抑制,那么癌症对治疗剂“起反应”或存在对治疗的“良好反应”。癌症的生长能够以多种方式测量,例如可以测量适合于那种肿瘤类型的特征,例如肿瘤的大小或肿瘤标记的表达。举例来说,用于支持鉴别与骨髓瘤相关的标记的反应定义和其对nae抑制剂、例如1-取代的氨基磺酸甲酯疗法的反应,可以使用如布雷德(blade)等人(1998)《英国血液学杂志》(brjhaematol.)102:1115-23中所述的西南肿瘤组(southwesternoncologygroup;swog)准则。这些准则定义了在骨髓瘤中测量的反应的类型以及疾病进展时间的特征,所述疾病进展时间是肿瘤对治疗剂的敏感性的另一种重要度量方式。关于实体肿瘤,实体肿瘤的反应评估准则(recist)指南(艾森豪尔(eisenhauer)等人(2009)《欧洲癌症杂志》(e.j.canc.)45:228-247)可以用于支持与实体肿瘤相关的标记和实体肿瘤对nae抑制剂的反应的鉴别。国际技术工作组周期性地召集起来设定、更新并公开各种类型癌症的反应准则。可以遵循这些公开的报导以支持本发明肿瘤的标记和其对nae抑制剂的反应的鉴别。实例是急性骨髓性白血病(aml,谢森(cheson)等人(2003)《临床肿瘤学杂志》(j.clin.oncol.)21:4642-4649)、淋巴瘤,例如非霍奇金氏(non-hodgkin′s)和霍奇金氏淋巴瘤(谢森等人(2007)《临床肿瘤学杂志》25:579-596)的准则。准则考虑分析方法,例如正电子发射断层摄影法(positronemissiontomography;pet),例如用于鉴别具有可测量的改变的代谢活性的位点(例如在肿瘤位点)或用于体内跟踪特异性标记到肿瘤中;免疫组织化学,例如用于通过检测抗体与特异性肿瘤标记的结合来鉴别肿瘤细胞;以及流动式细胞测量术,例如用于除例如组织学等传统方法之外,通过不同的标记和荧光染色来表征细胞类型,从而鉴别细胞组成(例如血涂片或骨髓生检中的原始细胞计数、有丝分裂象的存在和数量)或组织结构(例如基膜的无序组织架构或细胞浸润)。对nae抑制剂、例如1-取代的氨基磺酸甲酯疗法的反应的质量可以是可变的,其中在不同条件下,不同癌症展现对指定治疗剂的不同“反应”水平。再者,反应性的测量可以使用除肿瘤生长大小之外的附加准则来评定,包括患者生活质量、转移程度等。另外,可以在可适用的情况下评定临床预后标记和变异(例如骨髓瘤中的m蛋白、前列腺癌中的psa水平)。
如果当相比于在不与治疗剂接触情况下癌症的生长时,作为与治疗剂接触的结果,癌症的生长速率不被抑制,或抑制程度极低,那么癌症对治疗剂是“非反应性”或具有“不良反应”或存在对治疗的不良反应。如以上所述,癌症的生长能够以多种方式测量,例如可以测量适合于那种肿瘤类型的肿瘤的大小或肿瘤标记的表达。举例来说,可以使用用于支持与肿瘤对治疗剂的非反应相关的标记的鉴别的反应定义、指南,例如以上所述的那些。对治疗剂的非反应的质量可以是高度可变的,其中在不同条件下,不同癌症展现对指定治疗剂的不同的“非反应”水平。再者,非反应性的测量可以使用除肿瘤生长大小之外的附加准则来评定,包括患者生活质量、转移程度等。另外,可以在可适用的情况下评定临床预后标记和变异(例如骨髓瘤中的m蛋白、前列腺癌中的psa水平)。
如本文所用,“长进展时间”、“长ttp”和“短进展时间”、“短ttp”是指直到通过治疗带来的稳定疾病转化为活性疾病为止的时间量。有时,治疗产生既不是良好也不是不良的反应的稳定疾病,例如mr,所述疾病仅仅在一段时间内不再变糟,例如变成进行性疾病。这段时间可以是至少4-8周、至少3-6个月或6个月以上。
“治疗”应意指使用疗法来预防或抑制进一步肿瘤生长,以及用于促使肿瘤收缩,并且用于提供更长的存活时间。治疗也打算包括预防肿瘤转移。如果癌症或肿瘤的至少一个症状(如通过本领域中已知和本文所述的反应性/非反应性、进展时间或指示剂测定)得到缓解、终止、减缓、最小化或防止,那么肿瘤得到“抑制”或“治疗”。依据使用如本文进一步描述的治疗方案(例如nae抑制剂,例如1-取代的氨基磺酸甲酯方案)治疗,肿瘤的身体方面或其它方面的任何症状的任何改进在本发明的范围内。
如本文所用,术语“药剂”概括地定义为可以使癌细胞(包括肿瘤细胞)暴露于治疗方案中的任何药剂。在本发明的上下文中,这些药剂包括(但不限于)如本领域中已知并在本文中进一步详细描述的nae抑制剂,例如1-取代的氨基磺酸甲酯药剂,以及化学治疗剂。
术语“探针”是指能够选择性地结合到特定地想要的目标分子(例如本发明的标记)的任何分子,例如分离的分子。探针或者可以通过本领域普通技术人员合成,或者衍生自恰当的生物制剂。出于检测目标分子的目的,探针可以特定地设计成被标记,如本文所述。可以用作探针的分子的实例包括(但不限于)rna、dna、蛋白质、抗体和有机单体。
标记的“正常”特征(例如大小、序列、组成或量)可指在“参考样品”中的特征(例如大小、序列、组成或量)。参考样品可以是来自从其获得肿瘤(例如具有体细胞突变的肿瘤)的同一患者的相匹配的正常的(例如生殖系)样品。参考样品可以是来自不患有标记相关疾病的健康个体的样品;或若干健康个体中野生型标记的参考特征,例如平均特征,例如大小、序列、组成或量。参考样品特征(例如大小、序列、组成或量)可以包含来自参考数据库的一或多个标记的特征(例如大小、序列、组成或量)。或者,标记的“正常”特征(例如大小、序列、组成或表现水平)是类似环境或反应情况中来自从其获得肿瘤的同一患者的非肿瘤细胞中的标记(例如标记基因)的特征(例如大小、序列、组成或量)。正常的dna复制数量的量是2或二倍体,但除雄性中的x连接基因之外,其中正常dna复制数量是1。
标记基因的“过度表达”和“表达不足”分别是指例如如通过mrna或蛋白质测量,患者标记基因的表达水平高于或低于(例如超过二分之三倍、至少两倍、至少三倍的更高或更低的水平等)测试样品中标记基因的正常表现水平,所述高出或低出的程度大于用于评定表达的分析的标准误差。“显著”表达水平可指或者满足或者高于或低于如通过本文中提供的方法测定的标记基因设定的预定评分的水平。
“互补序列”是指在两个核酸链的区域之间或在同一核酸链的两个区域之间互补的序列的广义概念。已知第一核酸区的腺嘌呤残基能够与反平行于所述第一区的第二核酸区的残基(如果所述残基是胸腺嘧啶或尿嘧啶)形成特定氢键(“碱基配对”)。类似地,已知第一核酸链的胞嘧啶残基能够与反平行于所述第一链的第二核酸链的残基(如果所述残基是鸟嘌呤)碱基配对。如果在以反平行方式排列核酸的第一区与同一或不同核酸的第二区时,所述第一区的至少一个核苷酸残基能够与所述第二区的残基碱基配对,那么所述第一区与所述第二区互补。在一个实施例中,第一区包含第一部分并且第二区包含第二部分,其中,在以反平行方式排列第一和第二部分时,第一部分的核苷酸残基中至少约50%、至少约75%、至少约90%或至少约95%或所有都能够与所述第二部分中的核苷酸残基碱基配对。
如本文所用的“同源”是指同一核酸链的两个区域之间或两个不同核酸链的区域之间的核苷酸序列类似性。当两个区域中的核苷酸残基位置均被相同核苷酸残基占据时,则所述区域在那个位置是同源的。如果每个区域的至少一个核苷酸残基位置被相同残基占据,那么第一区与第二区同源。两个区域之间的同源性是关于被相同核苷酸残基占据的两个区域的核苷酸残基位置的比例(即通过一致性百分比)来表示的。举例来说,具有核苷酸序列5′-attgcc-3′的区域和具有核苷酸序列5′-tatggc-3′的区域共享50%一致性的同源性。在一个实施例中,第一区包含第一部分并且第二区包含第二部分,其中,每一部分的核苷酸残基位置中至少约50%、至少约75%、至少约90%或至少约95%被相同核苷酸残基占据。在100%一致性的实施例中,每一部分的所有核苷酸残基位置都被相同核苷酸残基占据。
除非在此另外说明,否则术语“抗体”广泛地涵盖天然产生的抗体形式,例如多克隆抗体(例如igg、iga、igm、ige)和单克隆与重组抗体,例如单链抗体、双链和多链蛋白质、嵌合抗体、cdr移植抗体、人类抗体和人类化抗体和多特异性抗体,以及所有上述抗体的片段和衍生物,所述片段(例如dab、scfv、fab、f(ab)′2、fab′)和衍生物具有至少一个抗原结合位点。抗体衍生物可以包含结合到抗体的蛋白质或化学部分。术语“抗体”还包括合成的和基因工程化的变异体。
“试剂盒”是包含用于特异性检测本发明的标记或标记组的至少一种试剂(例如探针)的任何制品(例如包装或容器)。所述制品能够以用于对例如已从患者获得的样品例如体外进行本发明方法的单元形式进行推销、配销、出售或提供出售。此类试剂盒中所包括的反应剂可以包含至少一种核酸探针和任选地一或多种适用于检测标记特征(例如大小、序列、组成或量,例如表达)的引物和/或抗体。另外,本发明的试剂盒可以含有描述合适的检测分析的说明书。此类试剂盒可以方便地用于例如临床或合同测试环境中,用于产生信息,例如关于一或多个标记的表达水平、特征(例如大小、序列或组成)的信息,记录、存储、传播或接受所述信息以诊断、评估或治疗展现癌症症状的患者,尤其是展现可能存在能够用nae抑制疗法治疗的癌症的患者,所述癌症包括例如血液癌症,例如骨髓瘤(例如多发性骨髓瘤)、淋巴瘤(例如非霍奇金氏淋巴瘤)、白血病(例如急性骨髓性白血病);和实体肿瘤(例如皮肤、肺乳房、卵巢等的肿瘤)。
本发明方法和组合物经设计适用于诊断和治疗罹患癌症的患者。根据本发明方法来治疗或诊断癌症或肿瘤。“癌症”或“肿瘤”打算包括患者中的任何赘生性生长,包括初始肿瘤和任何转移。癌症可以是血液型或实体肿瘤型。血液肿瘤包括血液来源的肿瘤,包括例如骨髓瘤(例如多发性骨髓瘤)、白血病(例如瓦尔登斯特伦综合征(waldenstrom′ssyndrome)、慢性淋巴球性白血病、急性骨髓性白血病、慢性骨髓性白血病、其它白血病)、淋巴瘤(例如b细胞淋巴瘤、非霍奇金氏淋巴瘤)和骨髓发育不良综合症。实体肿瘤可以起源于器官中,并且包括以下癌症:例如皮肤癌、肺癌、脑癌、乳癌、前列腺癌、卵巢癌、结肠癌、肾癌、胰脏癌、肝癌、食道癌、胃癌、肠癌、膀胱癌、子宫癌、子宫颈癌、头颈癌、中枢神经系统癌、骨癌、睾丸癌、肾上腺癌等。癌症可以包含其中标记基因具有突变的细胞。如本文所用,癌细胞(包括肿瘤细胞)是指以异常(增加的)速率分裂或其生长或存活控制不同于癌细胞出现或生长的同一组织中的细胞的细胞。癌细胞包括(但不限于)在以下各者中的细胞:癌瘤,例如鳞状细胞癌、基底细胞癌、汗腺癌、皮脂腺癌、腺癌、乳头状癌、乳头状腺癌、囊腺癌、髓性癌、未分化性癌、支气管癌、黑素瘤、肾细胞癌、肝肿瘤-肝细胞癌、胆管癌、胆管上皮癌、乳头状癌、移行细胞癌、绒膜癌、精原细胞瘤、胚胎性癌、乳腺癌、胃肠癌、结肠癌、膀胱癌、前列腺癌和头颈部区域的鳞状细胞癌;肉瘤,例如纤维肉瘤、粘液肉瘤、脂肉瘤、软骨肉瘤、骨原性肉瘤、软骨肉瘤、血管肉瘤、内皮肉瘤、淋巴管肉瘤、滑膜肉瘤和间皮肉瘤;血液学癌症,例如骨髓瘤、白血病(例如急性骨髓性白血病、慢性淋巴球性白血病、粒细胞白血病、单核细胞性白血病、淋巴球性白血病);和淋巴瘤(例如滤泡性淋巴瘤、套细胞淋巴瘤、弥漫性大b细胞淋巴瘤、恶性淋巴瘤、浆细胞瘤、网状细胞肉瘤或霍奇金氏病);以及神经系统肿瘤,包括神经胶质瘤、脑脊膜瘤、神经管胚细胞瘤、神经鞘瘤或室管膜瘤。
如本文所用,术语“非侵袭性”是指对个体造成极小伤害的程序。在临床应用的情况下,非侵袭性取样程序可以迅速进行,例如在步入式环境(walk-insetting)中,通常在无麻醉的情况下和/或在不实施手术或缝合的情况下。非侵袭性样品的实例包括血液、血清、唾液、尿液、腮抹试(buccalswab)、咽喉培养物、大便样品和子宫颈涂片。非侵袭性诊断性分析包括x射线、磁共振成像、正电子发射断层摄影法等。
本文描述了通过测量药物基因组标记的量评定肿瘤治疗结果。还描述了通过非侵袭性、便利的或低成本方式,例如从血液样品评定结果。测定癌症程度或血液肿瘤(例如淋巴瘤、白血病,例如急性骨髓性白血病、骨髓瘤(例如多发性骨髓瘤))结果的典型方法可以采用骨髓生检来收集组织用于基因型或表型,例如组织学分析。本发明提供用于确定、评定、建议或提供治疗患者的肿瘤或管理其疾病的恰当疗法方案的方法。使用本文中所揭示的试剂盒和方法监控治疗可以鉴别不利结果的可能性并且允许其预防,并且因此通过调整治疗方案、停止疗法或使用替代性疗法来节省发病、死亡和治疗成本。
术语“生物样品”打算包括患者样品,例如组织、细胞、生物流体和其自个体分离的分离物,以及存在于个体内的组织、细胞和流体;并且可以从患者或正常个体获得。在骨髓的血液肿瘤(例如骨髓瘤肿瘤)中,可以对骨髓样品进行肿瘤的初级分析。然而,一些肿瘤细胞(例如克隆型肿瘤细胞、循环内皮细胞)是全血中细胞群体的一部分。这些细胞也可以在用粒细胞-群落刺激因子(granulocyte-colonystimulatingfactor;g-csf)治疗患者期间移动到血液中以准备骨髓移植、血液肿瘤(例如白血病、淋巴瘤和骨髓瘤)的标准治疗。在多发性骨髓瘤中的循环肿瘤细胞的实例已经被皮拉斯基(pilarski)等人(2000)《血液》(blood)95:1056-65和里古林(rigolin)等人(2006)《血液》107:2531-5研究。因此,例如用于体外测量标记以测定治疗结果的非侵袭性样品可以包括周边血液样品。因此,可以测试周边血液中的细胞的标记量。关于患有血液肿瘤的患者,对照参考样品的正常特征(例如大小、序列、组成或量)可以从患者的皮肤或腮抹试获得。关于实体肿瘤,典型肿瘤样品是肿瘤的生检并且因此包含实体肿瘤细胞。或者,从肿瘤位点脱落或刮下的肿瘤细胞的样品可以非侵袭性地收集于例如血液、唾液、乳头吸液、尿液、大便、子宫颈涂片等中。关于实体肿瘤,用于正常特征(例如大小、序列、组成或量)的对照参考样品可以从患者的血液中获得。
血液收集容器可以包含抗凝血剂,例如肝素或乙二胺四乙酸(edta)、柠檬酸钠或柠檬酸盐溶液以及用于保护血液完整性的添加剂,例如右旋糖或白蛋白或缓冲液,例如磷酸盐。如果标记的量是通过测量样品中其dna的水平来测量,那么可以向所述样品中添加dna稳定剂,例如抑制dna酶的药剂。如果标记的量是通过测量样品中其rna的水平来测量,那么可以向所述样品中添加rna稳定剂,例如抑制rna酶的药剂。如果标记的量是通过测量样品中其蛋白质的水平来测量,那么可以向所述样品中添加蛋白质稳定剂,例如抑制蛋白酶的药剂。血液收集容器实例是适用于在收集血液时稳定rna的
或者,可以分析肿瘤细胞系,例如oci-ly3、oci-ly10细胞(阿里扎德(alizadeh)等人(2000)《自然》403:503-511)、rpmi6666细胞、sup-b15细胞、kg-1细胞、ccrf-sb细胞、8es细胞、kasumi-1细胞、kasumi-3细胞、bdcm细胞、hl-60细胞、mo-b细胞、jm1细胞、ga-10细胞或b细胞淋巴瘤(例如bc-3)或细胞系或肿瘤细胞系集合(例如,参见麦克德莫特(mcdermott)等人(2007)国家科学院院刊(pnas)104:19936-19941或oncopaneltm抗癌肿瘤细胞剖析筛选(华盛顿州波塞尔的里切尔卡生物科学公司(ricercabiosciences,bothell,wa)))。本领域的技术人员可以容易地选择并获得用于本发明方法中的恰当的细胞(例如来自弗吉尼亚州马纳萨斯(manassas,va)的美国典型培养物保藏中心
在评定样品中标记的量之前,样品(例如肿瘤(例如生检或骨髓)样品、血液或修饰血液(例如包含肿瘤细胞)样品和/或参考(例如匹配对照(例如生殖系))样品)可以经历各种众所周知的收集后制备和储存技术(例如核酸和/或蛋白质萃取、固定、储存、冷冻、超滤、浓缩、蒸发、离心等)。
在一个实施例中,标记基因的突变状态(例如标记的突变)可以通过对与标记基因相关的核酸(例如dna、rna、cdna)或蛋白质进行测序来鉴别。本领域中已知若干测定核酸序列的测序方法。核酸引物可以经设计以结合到包含潜在突变位点的区域或可以经设计以与突变序列而不是野生型序列互补。引物对可以经设计以包围标记基因中包含潜在突变的区域。引物或引物对可以用于对应于标记基因的dna的一条或两条链的测序。引物可以与探针(例如核酸探针,例如杂交探针)结合使用以在测序之前扩增相关区域,从而增加用于检测标记基因中的突变的序列量。可以测序的区域的实例包括完整基因、基因转录物和基因或转录物的片段,例如外显子或非转译区中的一或多者。用于靶向引物选择和序列或组成分析的突变的实例可见于收集突变信息的公用数据库中,例如cosmic和dbgap。标记基因(例如nf2、smad、kdm6a或fbxw7)的一些突变列举在实例中的表8-11中,作为可能与对nae抑制(例如通过氨基磺酸1-甲酯、例如mln4924抑制)的敏感性相关的突变的实例。
测序方法对本领域普通技术人员是已知的。方法的实例包括桑格法(sangermethod)、sequenomtm法和下一代测序(nextgenerationsequencing;ngs)法。桑格法包含使用电泳,例如毛细管电泳来分离引物伸长的标记dna片段,可以自动化用于高通量应用。引物延伸部测序可以在相关区域的pcr扩增之后进行。软件可以帮助序列碱基读出(basecalling)和突变鉴别。sequenomtm
蛋白质和核酸的组成可以通过本领域中已知的许多方式测定,例如通过以分解、降解或消化其之方式对其进行处理并且然后分析组分。质谱、电泳和色谱可以分离并定义组分以便比较。引起缺失或插入的突变可以在这些方法中通过大小或电荷差异来鉴别。在一些突变之后,蛋白质消化或限制酶核酸消化可以显示不同的片段图案。在氨基酸的结构的情况下,识别特定突变体氨基酸的抗体可以鉴别并检测样品中的这些突变(参见下文)。
在一个实施例中,dna(例如对应于野生型或突变标记的基因组dna)可以使用本领域中已知的方法,在生物样品中通过原位和通过体外形式两者来分析。dna可以直接从样品中分离或在分离另一种细胞组分(例如rna或蛋白质)之后分离。试剂盒可用于dna分离,例如
在另一个实施例中,对应于标记的mrna可以使用本领域中已知的方法,在生物样品中通过原位和通过体外形式两者来分析。用于测量表达水平的方法的实例包括在实例中。举例来说,可以使用核酸探针与标记杂交并且可以测量杂交探针的量。许多表达检测方法使用分离rna。关于体外方法,可以采用不选择抵抗mrna分离的任何rna分离技术来从肿瘤细胞纯化rna(例如,参见奥斯贝(ausubel)等人编,《分子生物学最新方案》(currentprotocolsinmolecularbiology),约翰·威利父子公司(johnwiley&sons),纽约1987-1999)。此外,大量组织样品可以使用本领域的普通技术人员众所周知的技术容易地处理,所述技术例如肖姆斯基(chomczynski)(1989,美国专利第4,843,155号)的单一步骤rna分离过程。rna可以使用标准程序分离(例如,参见肖姆斯基和萨基(sacchi)(1987)《分析生物化学》(anal.biochem.)162:156-159)、溶液(例如曲利唑(trizol),tri
可以采用附加步骤以从rna样品中移出dna。细胞溶解可以用非离子洗涤剂,接着微量离心以移出细胞核并由此移出细胞dna块体来实现。接着可以从细胞核中分离dna用于dna分析。在一个实施例中,rna是使用硫氰酸胍溶解,接着cscl离心以从dna分离rna而从各种类型的相关细胞中萃取(彻格温(chirgwin)等人(1979)《生物化学》(biochemistry)18:5294-99)。通过用寡聚-dt纤维素选择来选择聚(a)+rna(参见萨姆布鲁克(sambrook)等人(1989)《分子克隆实验手册》(第2版),冷泉港实验室,冷泉港,纽约)。或者,可以通过有机萃取,例如用热苯酚或苯酚/氯仿/异戊醇萃取实现dna与rna的分离。必要时,可以向溶解缓冲液中添加rna酶抑制剂。类似地,关于某些细胞类型,可能需要向所述方案中添加蛋白质变性/消化步骤。关于许多应用,需要相对于其它细胞rna(例如转运rna(trna)和核糖体rna(rrna))富集mrna。大部分mrna在其3′末端含有聚(a)尾部。此允许其通过亲和色谱法浓缩,例如使用耦合到固体支撑物(例如纤维素或sephadex.rtm介质)的寡聚(dt)或聚(u)(参见奥斯贝等人(1994)《分子生物学最新方案》,第2卷,最新方案出版(currentprotocolspublishing),纽约)。结合之后,使用2mmedta/0.1%sds使聚(a)+mrna从亲和性管柱洗提。
例如在从测试个体获得生物样品(例如骨髓样品、肿瘤生检或参考样品)之后,生物样品中本发明标记的特征可以通过任何各种众所周知的检测或测量例如核酸(例如rna、mrna、基因组dna或cdna)和/或转译蛋白质的特征的方法评定。这类方法的非限制性实例包括检测分泌性、细胞表面、细胞质或细胞核蛋白质的免疫方法、蛋白质纯化方法、蛋白质功能或活性分析、核酸杂交方法、核酸反转录方法和核酸扩增方法。这些方法包括基因阵列/芯片技术、rt-pcr、
用于检测对应于本发明标记的多肽的体外技术包括酶联免疫吸附分析(enzymelinkedimmunosorbentassay;elisa)、西方印迹法、蛋白质阵列、免疫沉淀反应和免疫荧光法。在此些实例中,标记表达使用抗体(例如放射性标记、发色团标记、荧光团标记或酶标记抗体)、抗体衍生物(例如与底物或与蛋白质-配位体对(例如生物素-抗生蛋白链菌素)的蛋白质或配位体结合的抗体)或抗体片段(例如单链抗体、分离抗体高变结构域等)来评定,所述抗体、抗体衍生物或抗体片段与标记蛋白或其片段特异性结合,例如包含可以突变的区域或包含突变序列的部分或在其结构情形中的突变残基的蛋白质或片段,包括已经经历全部或一部分其正常转译后修饰的标记蛋白。抗体可以检测氨基酸序列选自由以下组成的群组的蛋白质:seqidno:3、6、10、11、14、17、20和23。或者,抗体可以检测变异体氨基酸序列选自由以下组成的群组的突变蛋白质:seqidno:3、6、10、11、14、17、20和23的突变体。可以在免疫原性组合物中制备在例如cosmic或dbgap等公用数据库中列举为突变的残基用于产生将特异性识别并结合到所述突变体残基的抗体。另一种方法可以采用抗体对,其中所述对中的一个将标记蛋白上游,即n端结合到预期突变区域,例如无义或缺失,并且所述对中的另一个将结合蛋白下游。野生型蛋白将结合所述对的两个抗体,但具有无义或缺失突变的蛋白质将仅结合所述对的n端抗体。例如夹心elisa分析的分析可以检测肿瘤样品中野生型蛋白质的数量例如相比于参考样品的损失,或标准elisa将比较抗体的结合水平,从而推断在肿瘤样品中存在突变。
测定蛋白质标记的量或功能的间接方法也包括测量蛋白质的活性。举例来说,可以针对标记蛋白活性评定样品或从样品中分离或从核酸表达的蛋白质,所述核酸从样品分离、克隆或扩增。nf2活性可以通过其与结合伴侣结合的能力来测量,例如在无细胞分析中或在基于细胞的分析中。在一个实例中,可以测量nf2与红血细胞膜或p55/mpp1结合的能力(赛欧(seo)等人(2009)《实验生物与医学》(exp.biol.med.)234:255-262)。在另一实例中,smad4活性可以通过其在信号转导中的活性来测量,例如在无细胞分析中或在基于细胞的分析中。在一个实例中,可以测量smad4的磷酸化状态,可以测量smad4与dna在smad-结合元件处的结合,例如在凝胶阻滞分析(gelshiftassay)中或在报告基因分析(reporterassay)中(例如,参见匡(kuang)和陈(chen)(2004)《致癌基因》23:1021-1029),或可以使细胞核与细胞质之间的smad4的易位显色并在细胞图像上定量。在另一实例中,kdm6a活性可以通过其使蛋白质,例如组蛋白脱甲基的能力来测量。举例来说,分析可以测量组蛋白3的赖氨酸27的脱甲基化水平(洪(hong)等人(2007)国家科学院院刊104:18439-18444)。在另一实例中,fbxw7活性可以通过其结合周期素e或结合到skp-科林-f盒泛素连接酶复合物中的能力来测量。在另一实例中,tp53活性可以通过结合dna或形成四聚体的能力来测量。
在一个实施例中,标记的表达通过从患者样品的细胞制备mrna/cdna(即转录聚核苷酸),并且通过使mrna/cdna与参考聚核苷酸杂交来评定,所述参考聚核苷酸例如经分离核酸探针,例如杂交探针,其是标记核酸的互补序列或其片段。cdna可以任选地在与参考聚核苷酸杂交之前使用任何各种聚合酶链式反应方法扩增。一或多个标记的表达类似地可以使用定量pcr检测以评定标记的表达水平。测量mrna水平的用途的实例是标记基因的失活性突变可以引起细胞中mrna水平改变。所述水平可以由于反馈信号传导蛋白质产生,鉴于非功能性蛋白质或缺乏蛋白质而上调或由于经改变的mrna序列的不稳定性下调。或者,可使用检测本发明标记的突变或变异体(例如上文所论述的单一核苷酸多形现象、缺失等)的许多已知方法中的任一种来检测患者标记基因中突变的发生。
直接测量的实例是定量转录物。如本文所用,表达水平或量是指通过标记编码的mrna的绝对表达量或通过标记编码的蛋白质的绝对表达量。作为基于选择标记的绝对表达量做决定的替代方案,可以基于标准化表达量做决定。表达量可以通过在比较标记的表达与不是标记的对照标记(例如起组成性表达的管家作用)的表达之后校正标记的绝对表达水平进行标准化用于标准化的合适的标记也包括管家基因,例如肌动蛋白基因或β-2微球蛋白。用于数据标准化的参考标记包括泛表达的标记和/或其表达不是通过致癌基因调节的标记。组成性表达基因是本领域中已知的并且可以根据患者的相关组织和/或情况和分析方法进行鉴别和选择。这类标准化允许比较一个样品的表达水平与另一个样品的表达水平,例如来自不同时间或不同个体的样品之间的表达水平。此外,表达水平可以按相对表达水平形式提供。基因组dna样品的基线(例如二倍体复制数量)可以通过测量来自未患有肿瘤的个体的细胞或患者的非肿瘤细胞中的量来测定。为了测定标记或标记组的相对量,在测定所讨论样品的表达水平之前,测定至少1或2、3、4、5或5个以上样品,例如7、10、15、20或50或50个以上样品的标记或标记组的量以建立基线。为了建立基线测量,测定更大数量样品中所分析的标记或标记组中每一个的平均量或水平并且将此用作所讨论的生物标记或生物标记组的基线表达水平。所测定的测试样品的标记或标记组的量(例如绝对表达水平)然后除以关于所述标记或标记组获得的基线值。此提供相对量并且辅助鉴别标记蛋白活性的异常水平。
基于本发明的核酸分子的序列的探针可以用于检测对应于一或多个本发明标记的转录物或基因组序列。探针可以包含与其连接的标记基团,例如放射性同位素、荧光化合物、酶或酶辅因子。这类探针可以用作用于鉴别表达蛋白质的细胞或组织的诊断测试试剂盒的一部分,例如通过测量来自个体的细胞样品中编码蛋白质的核酸分子的水平,例如检测mrna水平或测定编码蛋白质的基因是否已经突变或缺失。
除本文所述的数据库记录中所描述的核苷酸序列之外,本领域的普通技术人员还应了解引起氨基酸序列变化的dna序列多形现象可以存在于群体(例如人类群体)中。这类遗传多形现象可以由于天然产生的等位变异而存在于群体内的个体中。等位基因是可替代地出现在指定遗传基因座处的一组基因中的一个。另外,应了解影响rna表达水平的dna多形现象也可以存在,其可以影响所述基因的整体表达水平(例如通过影响调节或降解)。
引物或核酸探针包含与特异性标记或其突变区域互补的核苷酸序列并且其长度足以选择性地杂交标记基因或与标记基因相关的核酸,例如其可以结合具有碱基序列特异性的核酸并且在洗涤之后保持结合。引物和探针可以用于辅助标记核酸的分离和测序。在一个实施例中,引物或核酸探针(例如实质上纯化的寡核苷酸、经分离核酸)包含一个区域,所述区域所具有的核苷酸序列例如在严格条件下与标记基因的约6、8、10、12、15、20、25、30、40、50、60、75、100、200、350、500或500个以上连续核苷酸杂交;或包含标记基因或来自其的转录物或互补序列的突变的区域。在另一个实施例中,引物或核酸探针能够与包含以下核苷酸序列的标记核酸杂交:seqidno:1、2、4、5、7、8、9、12、13、15、16、18、19、21、22、24、25中的任一者所阐述的任何序列,或从碱基对29999545到30094589的染色体22q、从碱基对48556583到48611412的染色体18q、从碱基对44732423到44971847的染色体xp、从碱基对153242410到153456172的染色体4q、从碱基对7571720到7590868的染色体17p、从碱基对21967751到21994490的染色体9p上的序列,或上述任一者的互补序列。举例来说,本发明提供包含核苷酸序列的引物或核酸探针,所述核苷酸序列具有至少约10个连续核苷酸、至少约15个连续核苷酸、至少约25个连续核苷酸、至少约35个连续核苷酸、至少约50个连续核苷酸,或具有seqidno:1、2、4、5、7、8、9、12、13、15、16、18、19、21、22、24到25中的任一者所阐述的约15到约20个核苷酸,或在从碱基对29999545到30094589的染色体22q、从碱基对48556583到48611412的染色体18q、从碱基对44732423到44971847的染色体xp、从碱基对153242410到153456172的染色体4q、从碱基对7571720到7590868的染色体17p、从碱基对21967751到21994490的染色体9p上的序列,或上述任一者的互补序列。具有超过约25、40或50个核苷酸的序列的引物或核酸探针也在本发明的范围内。在另一个实施例中,引物或核酸探针可以具有与任何以下所阐述的任何序列的核苷酸序列至少70%、至少75%、80%或85%或至少90%、95%或97%相同的序列:seqidno:1、2、4、5、7、8、9、12、13、15、16、18、19、21、22、24、25,或在从碱基对29999545到30094589的染色体22q、从碱基对48556583到48611412的染色体18q、从碱基对44732423到44971847的染色体xp、从碱基对153242410到153456172的染色体4q、从碱基对7571720到7590868的染色体17p、从碱基对21967751到21994490的染色体9p上的序列,或上述任一者的互补序列。核酸类似物可以用作杂交的结合位点。合适的核酸类似物的实例是肽核酸(例如,参见埃格霍尔姆(egholm)等人,《自然》363:566568(1993);美国专利第5,539,083号)。
在一些实施例中,核酸探针可以经设计以结合野生型序列,因此在所述区域存在突变可以引起所述探针的结合或杂交降低,例如可测量程度地降低。在另一个实施例中,核酸探针可以经设计以结合突变体序列,因此在所述区域存在突变可以引起所述探针的结合或杂交增加。在其它实施例中,探针和引物组或引物对可以经设计以支托可以具有突变的标记区域,因此基于所述组或对的扩增可以产生可以测序以鉴别突变的核酸。
引物或核酸探针可以使用考虑了结合能量、碱基组成、序列复杂性、交叉杂交结合能量和二级结构的算法进行选择(参见2001年1月25日公开的弗兰德(friend)等人的国际专利公开案wo01/05935;休斯(hughes)等人,《自然·生物技术》19:342-7(2001))。有用的本发明的引物或核酸探针结合针对每个转录物而言独特的序列,例如目标突变区域;并且可以用于仅特定核酸,例如转录物或突变转录物的pcr扩增、检测并测序。标记基因(例如nf2、smad4、kdm6a和fbxw7)的一些突变的实例可见于实例中的表中(表8-11)。其它突变描述于本文中所引用的参考文章中和本文中所述的公用数据库中。本领域的技术人员可以使用在本领域中的技术,例如通过操控引物或核酸探针的简并或gc含量调整引物或核酸探针结合标准序列、突变体或等位变异体的可能性,针对本文中所揭示的标记或具有类似特征(例如在染色体基因座上的标记)或本文所述的相同标记基因的不同区域的突变的相关标记设计引物和核酸探针。在本领域中众所周知的计算机程序适用于设计具有所需特异性和最佳扩增特性的引物,例如欧力多(oligo)5.0版(明尼苏达州普利茅斯的国家生物科学公司(nationalbiosciences,plymouth,mn))。虽然可以使用完全互补的核酸探针和引物来检测本文所述的标记和其突变体、多形现象或等位基因,但是涵盖偏离完全互补,只要此类偏离不阻止分子与目标区域特异性杂交即可。举例来说,寡核苷酸引物可以在其5′末端具有非互补片段,但引物的剩余部分与目标区域互补。或者,非互补核苷酸可以插入到核酸探针或引物中,只要所得探针或引物仍能够与目标区域特异性杂交即可。
治疗结果的指示可以通过研究1个标记、2个标记、3个标记或4个标记或4个标记以上,例如5、6、7、8、9、10、15、20或25个标记,或其突变部分的量来评定,例如参与科林-环连接酶路径或与所述路径相互作用的标记基因,例如肿瘤抑制基因,例如其可以通过癌症中的体细胞突变灭活。标记可以与另一治疗结果的测量结果组合研究,例如生物化学标记(例如骨髓瘤中的m蛋白、肾健康标记,例如蛋白尿,c活性蛋白或细胞角蛋白19的血清水平、nsclc的细胞角蛋白片段21-1(cyfra21-1)、膀胱癌的血纤维蛋白原/血纤维蛋白原降解产物的尿液水平、成神经细胞瘤的儿茶酚胺的尿液或血液水平、碳水化合物抗原19-9(ca19-9)的血清水平或胰脏癌的代谢分析或间皮瘤中可溶性间皮素相关肽(smrp)的血液水平)或组织学评定(例如原始细胞计数、每单位面积有丝分裂象的数量、黑素瘤肿瘤侵袭的深度测量结果、食道肿瘤或膀胱肿瘤)。
统计方法可以帮助在测量标记的量,例如测量dna、rna或蛋白质之后确定治疗结果。可以在多个时间点,例如在用药剂,例如nae抑制剂治疗之前、在治疗期间、在治疗之后测量一个标记的量。为了测定例如随时间推移标记表达距基线的变化的进展,可以通过重复测量线性回归模型(利特尔(littell)、米利肯(miliken)、斯特鲁普(stroup)、沃尔芬格(wolfinger)、斯卡彭贝格尔(schabenberger)(2006)《sas混合模型》(sasformixedmodels),第2版.北卡罗来纳州凯里的sas研究所公司(sasinstitute,inc.,cary,nc))分析表达结果:
等式1
yijk-yij0=yij0+处理i+天k+(处理*天)ik+εijk
其中yijk是ith处理的jth动物的第kth天的log2转换表达式(管家基因标准化),yij0是ith处理的jth动物的定义基线log2转换表达式(管家基因标准化),天k处理为分类变数,并且εijk是残留误差项。可以指定协方差矩阵(例如一阶自我回归、复合对称性、空间幂次法则)对每个动物随时间推移的重复量测结果进行建模。此外,可以比较每个处理时间点与媒剂组的相同时间点,从而测试处理值是否显著不同于媒剂。
可以使用多种其它方法来分析数据。举例来说,可以分析相对表达值而不是周期数量。可以按倍数变化形式或按距基线的绝对差异形式检查这些值。此外,如果所有组和时间点的方差都是相同的,那么可以使用重复测量方差分析(repeated-measuresanalysisofvariance;anova)。可以使用以下来分析在最后一个(或其它)时间点观察到的距基线的变化:配对t检验、费雪精确检验(fisherexacttest)(p值=∑p(x=x),从x=1到情况数量,例如突变,其测试展示对nae抑制的敏感性)以测试小样本数据的显著性,或如果数据不是正态分布,那么使用威氏符号秩次检验(wilcoxonsignedranktest)来比较肿瘤患者是否显著不同于正常个体。
从一个时间点到下一个时间点或从肿瘤样品到正常样品的量的差异可以表明处理结果的预后。可以通过测量在处理之前的1、2、3、4或4个以上时间,例如在处理之前时间零、一天、三天、一周和/或两周或两周以上的表达来测定基线水平。或者,可以从多个个体,例如正常个体或具有相同健康状况或病症并且不经历或尚未经历如上文所讨论的治疗的患者测定基线水平。或者,可以使用在美国国家生物技术信息中心(ncbi,马里兰州贝塞斯达)用基因表达大棚车(geneexpressionomnibus;geo)程序寄存的表达值。举例来说,在蛋白酶体抑制疗法之前取样的骨髓瘤mrna表达量的数据集包括geo寄存编号gse9782,也在马利根(mulligan)等人(2006)《血液》109:3177-88和gse6477中有所分析,也被晨(chng)等人(2007)《癌症研究》67:292-9所分析。为了测试治疗对肿瘤的作用,可以在一些治疗之后,例如在1天、2天、3天、5天、1周、2周、3周、4周、1个月、2个月、3个月和/或6个月或6个月以上治疗之后的任一时间或多个时间测量标记的表达。举例来说,可以在一些治疗之后,或以多个时间间隔,例如在治疗期间1周、2周、4周或2个月、3个月或更长的时间间隔测量一次标记的量。在一些实施例中,在治疗期间标记的测量结果可以与同一标记在基线的测量结果进行对比。在其它实施例中,在治疗期间标记的测量结果可以与同一标记在更早时间点的测量结果进行对比。反之,为了测定在停止投与治疗方案之后进行性疾病的发作,可以在例如最后一次治疗之后1天、2天、3天、5天、1周、2周、3周、4周、1个月、2个月、3个月和/或6个月或6个月以上之后的任何时间或多个时间测量标记的量。在治疗之后标记的测量结果可以与同一标记在治疗结束时的测量结果进行对比。本领域的技术人员将取决于各种因素确定评定标记的量的时间点,所述因素例如治疗的药物动力学、治疗持续时间、治疗的药效动力学、患者年龄、病症性质或治疗的作用机制。沿负方向的趋势或标记对nae抑制疗法的敏感性相对于基线或预定表达标准的量降低,例如表3中所鉴别的敏感性标记减少,可以表明肿瘤对疗法的反应降低,例如抗性增加。治疗结果的朝向相对于标记的基线或预定表达标准的有利结果的趋势表明治疗方案的有效性或疗法的持续效益。朝向抗性标记增加,例如表3中所鉴别的抗性标记增加的趋势可以表明不利结果。
可以在本发明的组合物、试剂盒和方法中使用任何标记,例如标记基因或标记组合,例如本发明的标记基因或其突变以及任何已知标记与标记(例如本发明的标记基因)的组合。一般来说,选择判断标记基因的突变状态的能力尽可能大的标记来预测用nae抑制剂治疗的结果。举例来说,选择包含肿瘤细胞的样品中标记的特征(例如大小、序列、组成或量)与对照细胞中相同标记的特征(例如大小、序列、组成或量)之间的差异尽可能大的标记选择。虽然此差异可以小到评定标记的量的方法的检测限,但是在另一个实施例中,所述差异可以至少大于评定方法的标准误差。在rna或蛋白质量的情况下,差异可以是至少1.5、2、3、4、5、6、7、8、9、10、15、20、25、100、500、1000倍或1000倍以上。“低”rna或蛋白质量可以是相对于整个肿瘤样品(例如血液肿瘤,例如骨髓瘤)的整体平均值而言所述表达量是低的。在dna的量的情况下,例如复制数量,所述量是0、1、2、3、4、5、6或6次以上复制。缺失使得复制数量为0或1;扩增使得复制数量大于2。差异可以通过置信水平,例如p<0.05、p<0.02、p<0.01或更低的p值来限定。
一个以上标记,例如一组2、3、4、5、6、7、8、9、10、12、15、20或25或25个以上标记的测量结果可以提供指示治疗结果的表达图谱或趋势。在一些实施例中,标记组包含不超过2、3、4、5、6、7、8、9、10、12、15、20或25个标记。在一些实施例中,标记组包括多个染色体基因座、多个标记基因或一或多个标记基因的多个标记(例如本文所述的核酸和蛋白质、基因组dna和mrna或各种标记组合)。可以伴随统计方法通过评定一个组中标记的量来分析治疗结果,所述统计方法例如加权投票分析,其解释可以影响所述组中标记的量对治疗结果的类别或趋势的作用的变量,例如测量结果的信噪比或每个标记的杂交效率。标记组,例如一组2、3、4、5、6、7、8、9、10、12、15、20或25或25个以上标记可以包含一个引物、探针或多个引物以分析本文所述的至少一个标记dna或rna,例如在从碱基对29999545到30094589的染色体22q、从碱基对48556583到48611412的染色体18q、从碱基对44732423到44971847的染色体xp、从碱基对153242410到153456172的染色体4q、从碱基对7571720到7590868的染色体17p、从碱基对21967751到21994490的染色体9p上的标记、nf2、smad4、kdm6a、fbxw7、tp53、cdkn2a、cdkn2a_p14或上述任一者的互补序列。标记组,例如一组2、3、4、5、6、7、8、9、10、12、15、20或25或25个以上标记可以包含一个引物、探针或多个引物以检测至少一个或至少两个或两个以上标记,或例如nf2、smad4、kdm6a、tp53、cdkn2a、cdkn2a_p14和/或fbxw7的标记上的至少2、3、4、5、6、7、8、9、10、12、15、20或25或25个以上突变。在另一个实施例中,标记组可以包含用于评定nf2、smad4和/或kdm6a的特征的标记。在一个实施例中,用于子宫癌或子宫颈癌的标记组包含至少一个用于评定fbxw7的至少一个特征的标记。在一个实施例中,用于肠癌、乳癌、肺癌、头颈癌、子宫颈癌或皮肤癌的标记组包含至少一个用于评定tp53的至少一个特征的标记。在一个实施例中,用于肠癌的标记组包含用于评定tp53和apc中的每一者的至少一个特征的标记。在一个实施例中,用于皮肤癌或中枢神经系统癌的标记组包含至少一个用于评定cdkn2a_p14的至少一个特征的标记。在一个实施例中,用于头颈癌或皮肤癌的标记组包含至少一个用于评定cdkn2a的至少一个特征的标记。在一个实施例中,用于头颈癌的标记组包含至少一个用于评定smad4的至少一个特征的标记。所选择的标记组可以使用本文中提供的方法和本领域中已知的类似方法从本文中提供的标记组装或选自这些标记。使新标记具有适用于本发明的分析的资格的方式是使包含肿瘤细胞的样品中的dna复制数量与标记(例如标记基因)的表达(例如距基线的倍数变化)的差异相联系。判断联系的有用方式是计算确定系数r2,在解决了r之后,使用标准统计方法,计算皮尔逊积矩相关系数(pearsonproductmomentcorrelationcoefficient)和/或作出最小二乘法曲线。相关性可以分析dna复制数量对比标记(例如标记基因)的表达水平。如果相关性结果(r2,例如此分析中数据的线性斜率)是至少0.1-0.2,至少0.3-0.5,或至少0.6-0.8或0.8以上,那么可以选择基因产物作为标记。标记可以随着与反应的正相关性、ttp或存活变化(即以与复制数量相同的方式改变表达水平,例如当复制数量减少时降低)。随着与复制数量的负相关性而变化(即以与复制数量水平相反的方式改变表达水平,例如当复制数量减少时增加)的标记提供不一致的结果判定。
使新标记具有适用于所述分析资格的另一种方式将是在用测试药剂处理之前和之后分析多个个体中大量标记的表达。表达结果允许鉴别在处理之后相对于处理前的样品展示出沿指定方向的巨大变化的标记。可以构建重复测量线性回归模型来鉴别展示统计学显著变化或差异的基因。为了然后给这些显著的基因排序,可以计算例如在距基线的变化对比时间的曲线下方的面积。此可以产生将展示最大统计学显著变化的基因清单。然后可以通过使用如下方法将若干标记一起合并在一个组中:主组分分析、聚类分析法(例如k均方聚类(k-means)、分级聚类)、多变量方差分析(multivariateanalysisofvariance;manova)或线性回归技术。为了使用此类基因(或基因组)作为标记,展示与基线的2、2.5、3、3.5、4、4.5、5、7、10倍或10倍以上表达差异的基因将包括在标记组中。表达图谱,例如与聚集的标记组的基线或参考的表达水平差异的复合将表明在某种趋势下,例如如果大部分标记展示特定结果,例如与基线或参考的显著差异,例如60%、70%、80%、90%、95%或95%以上的标记;或更多标记,例如10%以上、20%以上、30%以上、40%以上展示沿一个方向而不是另一个方向的显著结果。
在本发明的组合物、试剂盒和方法用于表征患者的治疗结果的实施例中,本发明的标记或标记组经选择以使得在至少约20%、至少约40%、60%或80%或在实质上所有用测试药剂治疗的患者中获得显著结果。本发明的标记或标记组可以经选择以使得关于总群体获得大于约10%的阳性预测值(ppv)并且当ppv与大于80%的分析特异性耦合时可以推断标记的附加置信度。
治疗剂
本发明的标记和标记组评定患者中疗法(例如对治疗剂的敏感性)有利结果的可能性,例如癌症患者,例如患有血液癌症(例如多发性骨髓瘤、白血病、淋巴瘤等)或实体肿瘤癌症(例如皮肤癌(例如黑素瘤)、头颈癌(例如食道癌)、膀胱癌、肺癌(例如非小细胞肺癌(nsclc))、肺腺癌、中枢神经系统癌(例如脑的肺转移或成神经细胞瘤)、胰脏癌、乳癌、间皮瘤、子宫颈癌或肠道癌,例如结肠或直肠腺癌)的患者,基于其影响本发明的标记的特征(例如组成或量)的能力。使用此预测,可以评估癌症疗法来设计最佳适用于任一类别患者的疗法方案。
具体来说,可以使用所述方法来预测患者对如在先前部分所述的nae抑制剂的敏感性。本发明方法中所测试的药剂可以是单一药剂或药剂组合。本发明方法包括nae抑制疗法与蛋白酶体抑制疗法和/或其它或附加药剂(例如选自由化学治疗剂组成的群组)的组合。举例来说,可以使用本发明方法来确定是否可以使用单一化学治疗剂(例如nae抑制剂(例如mln4924))来治疗癌症或是否应该与nae抑制剂(例如mln4924)组合使用一或多种药剂。有用的组合可以包括具有不同作用机制的药剂,例如与烷基化剂和nae抑制剂组合使用抗有丝分裂剂。
如本文所用,术语“蛋白酶体抑制剂”是指体外或体内直接抑制20s或26s蛋白酶体的酶活性的任何物质。在一些实施例中,蛋白酶体抑制剂是肽基硼酸。适用于本发明方法的肽基硼酸蛋白酶体抑制剂的实例揭示于亚当斯(adams)等人的美国专利第5,780,454号(1998)、第6,066,730号(2000)、第6,083,903号(2000)、第6,297,217号(2001)、第6,465,433号(2002)、第6,548,668号(2003)、第6,617,317号(2003)和第6,747,150号(2004)中,所述专利各自在此以全文引用的方式并入本文中,包括本文中所揭示的所有化合物和化学式。在一些实施例中,肽基硼酸蛋白酶体抑制剂选自由以下组成的群组:n(4吗啉)羰基-β-(1-萘基)-l-丙氨酸-l-白氨酸硼酸;n(8喹啉)磺酰基-β-(1-萘基)-l-丙氨酸-l-丙氨酸-l-白氨酸硼酸;n(吡嗪)羰基-l-苯丙氨酸-l-白氨酸硼酸和n(4吗啉)-羰基-[o-(2-吡啶基甲基)]-l-酪氨酸-l-白氨酸硼酸。在特定实施例中,蛋白酶体抑制剂是n(吡嗪)羰基-l-苯丙氨酸-l-白氨酸硼酸(硼替佐米(bortezomib);
此外,蛋白酶体抑制剂包括肽醛蛋白酶体抑制剂(施泰因(stein)等人的美国专利第5,693,617号(1997);西曼(siman)等人的国际专利公开案wo91/13904;伊克巴尔(iqbal)等人,《医药化学杂志》(j.med.chem.)38:2276-2277(1995);和饭沼(iinuma)等人的国际专利公开案wo05/105826,所述文献各自在此以全文引用的方式并入本文中)、肽基环氧基酮蛋白酶体抑制剂(克鲁斯(crews)等人的美国专利第6,831,099号;史密斯(smyth)等人的国际专利公开案wo05/111008;班尼特(bennett)等人的国际专利公开案wo06/045066;斯巴滕施泰因(spaltenstein)等人《四面体通讯》(tetrahedronlett.)37:1343(1996);孟(meng),《美国国家科学院院刊》(proc.natl.acad.sci.)96:10403(1999);和孟,《癌症研究》59:2798(1999))、α-酮酰胺蛋白酶体抑制剂(查特吉(chatterjee)和马拉莫(mallamo),美国专利第6,310,057号(2001)和第6,096,778号(2000);和王(wang)等人美国专利第6,075,150号(2000)和第6,781,000号(2004))、肽基乙烯基酯蛋白酶体抑制剂(马拉斯托尼(marastoni)等人,《医药化学杂志》48:5038(2005),和肽基乙烯基砜和2-酮基-1,3,4-噁二唑蛋白酶体抑制剂,例如拉德切夫斯基(rydzewski)等人,《医药化学杂志》49:2953(2006);和博焦(bogyo)等人,《美国国家科学院院刊》94:6629(1997)中所揭示的那些)、氮杂拟肽和(布热(bouget)等人,《生物有机化学与医药化学》(bioorg.med.chem.)11:4881(2003);博迪·弗洛克(baudy-floc′h)等人的国际专利公开案wo05/030707;和博纳曼(bonnemains)等人的国际专利公开案wo03/018557)、肽抑制素寡肽(帕帕塔纳休(papathanassiu)的国际专利公开案wo05/115431)、雷克塔西汀(lactacystin)和盐孢菌素(salinosporamide)和其类似物(芬太尼(fenteany)等人的美国专利第5,756,764号(1998)、第6,147,223号(2000)、第6,335,358号(2002)和第6,645,999号(2003);芬太尼等人,《美国国家科学院院刊》(1994)91:3358;凡尼克(fenical)等人的国际专利公开案wo05/003137;帕拉迪诺(palladino)等人的国际专利公开案wo05/002572;斯塔德勒(stadler)等人的国际专利公开案wo04/071382;肖(xiao)和帕特尔(patel)的美国专利公开案2005/023162;和科里(corey)的国际专利公开案wo05/099687)。
适用于在本发明方法中与nae抑制剂(例如mln4924)组合的附加治疗剂可以包含已知类别的包含糖皮质激素类固醇的治疗剂。糖皮质激素疗法一般包含至少一种糖皮质激素剂(例如地塞米松(dexamethasone))。在本发明的某些应用中,本发明方法中所用的药剂是糖皮质激素剂。多发性骨髓瘤患者的治疗以及其它癌症疗法中所采用的糖皮质激素的一个实例是地塞米松。实体肿瘤的血液治疗和组合疗法中所采用的附加糖皮质激素包括氢皮质酮、脱氢皮质醇、泼尼松(prednisone)和曲安西龙(triamcinolone)。
适用于与nae抑制疗法组合的其它治疗剂包括化学治疗剂。“化学治疗剂”打算包括抑制增殖细胞或组织生长的化学试剂,其中这类细胞或组织的生长是不合需要的。化学治疗剂,例如抗代谢剂,例如araac、5-fu和甲氨蝶呤;抗有丝分裂剂,例如紫杉烷、长春碱和长春新碱;烷基化剂,例如美法仑(melphanlan)、卡莫司汀(carmustine)(bcnu)和氮芥;拓扑异构酶ii抑制剂,例如vw-26、拓扑替康和博莱霉素;链断裂剂,例如小红莓和米托蒽醌(dhad);交联剂,例如顺铂和卡铂(cbdca);辐射和紫外光在本领域中是众所周知的(例如,参见希尔曼(gilman)a.g.等人,《治疗学的药理学基础》(thepharmacologicalbasisoftherapeutics.),第8版,第12部分:1202-1263(1990)),并且通常用于治疗赘生性疾病。化学疗法治疗中通常采用的化学治疗剂的实例列举在下表2中。
表2:化学治疗剂
本发明方法中所测试的药剂可以是单一药剂或药剂组合。举例来说,可以使用本发明方法来确定是否可以使用单一化学治疗剂(例如甲氨蝶呤)来治疗癌症或是否可以与nae抑制剂(例如mln4924)组合使用两种或两种以上药剂的组合。有用的组合可以包括具有不同作用机制的药剂,例如与烷基化剂和nae抑制剂组合使用抗有丝分裂剂。
本文中所揭示的药剂可以通过任何途径投与,包括皮内、皮下、经口、动脉内或静脉内。在一个实施例中,投药将是通过静脉内途径。能够以药团形式或通过输注提供非经肠投药。
药学上可接受的混合物中本发明化合物的浓度将取决于若干因素而变化,所述因素包括待投与的化合物的剂量、所用化合物的药物动力学特征和投药途径。药剂能够以单一剂量或以重复剂量形式投与。取决于多种因素,可以每日或更频繁地投与治疗,所述因素包括患者的整体健康和所选择的化合物的配方和投药途径。
筛选nae抑制剂
本发明提供鉴别调节剂,即候选或测试化合物或药剂(例如蛋白质、肽、肽模拟物、拟肽、小分子或其它药物)的方法(在本文中也称为“筛选分析”),所述调节剂结合到nae或其它e1酶变异体蛋白质,对例如nae或其它e1酶表达或酶活性具有刺激或抑制作用,或对例如nae或e1酶路径中(例如在nae路径中)的其它e1酶底物或蛋白质的表达或活性具有刺激或抑制作用,例如与科林-环连接酶的活性相关。因此所鉴别的化合物可以用于调整治疗方案中的目标基因产物(例如nae或其它e1酶基因)的活性,从而完善目标基因产物的生物功能,或从而鉴别破坏nae或其它e1酶路径相互作用的化合物。
在一个实施例中,本发明提供一种鉴别化合物作为nae抑制剂,例如作为调节细胞的药物抗性的药剂的方法,所述方法通过首先使至少一个标记基因中包含至少一种突变的细胞与测试化合物接触并且然后测量所述细胞的活力或细胞生长的抑制情况。在一些实施例中,所述细胞包含表3中所鉴别的抗性基因。在其它实施例中,所述细胞包含表3中所鉴别的敏感性基因。nae抑制剂的作用可以与未暴露于所述化合物的对照细胞进行对比。在一些实施例中,药剂对包含敏感性标记基因的细胞的作用可以与药剂对包含抗性标记基因的细胞的作用进行对比(例如,参见表3)。当细胞活力或细胞生长降低时,所述化合物鉴别为药物抗性的调节剂或nae抑制剂。上述方法中所鉴别的经鉴别为nae抑制剂(例如作为调整抗性)的化合物也包括在本发明内。
检测方法
预后分析的一般原理涉及在适当条件下制备可以含有标记和探针的样品或反应混合物,并且持续足以使所述标记和探针相互作用并结合的时间,因此形成可以在反应混合物中去除和/或检测的复合物。这些分析能够以多种方式进行。
举例来说,执行这类分析的一种方法将涉及将标记或探针锚定到固相支撑物(也称为底物)上,并且在反应结束时检测锚定在固相上的目标标记/探针复合物。在此类方法的一个实施例中,来自个体的待分析标记的存在和/或浓度的样品可以锚定到载体或固相支撑物上。在另一个实施例中,相反的情况是可能的,其中可以将探针锚定到固相并且可以允许来自个体的样品以分析的未锚定组分形式反应。这类实施例的一个实例包括使用包含经锚定用于样品的表达分析的预测标记或标记组的阵列或芯片。
存在许多将分析组分锚定到固相的已建立的方法。这些方法包括(不限于)通过结合生物素和抗生蛋白链菌素固定的标记或探针分子。这类生物素标记分析组分可以使用本领域中已知的技术(例如伊利诺伊州罗克福德的皮尔斯化学品公司(piercechemicals,rockford,il)的生物素化试剂盒)从生物素-nhs(n-羟基-丁二酰亚胺)制备,并且固定在涂有抗生蛋白链菌素的96孔板(皮尔斯化学品公司)的各孔中。在某些实施例中,可以事先制备具有固定分析组分的表面并储存。
用于这类分析的其它合适的载体或固相支撑物包括能够结合标记或探针所属于的分子类别的任何材料。众所周知的支撑物或载体包括(但不限于)玻璃、聚苯乙烯、尼龙、聚丙烯、尼龙、聚乙烯、葡聚糖、淀粉酶、天然和修饰纤维素、聚丙烯酰胺、辉长岩和磁铁矿。本领域普通技术人员将知晓用于结合抗体或抗原的许多其它合适的载体,并且将能够调整这类支撑物以用于本发明。举例来说,从细胞中分离的蛋白质可以进行聚丙烯酰胺凝胶电泳并且固定到例如硝化纤维的固相支撑物上。所述支撑物然后可以用合适的缓冲液洗涤,接着用可检测地标记的抗体处理。固相支撑物然后可以用缓冲液洗涤第二次用以去除未结合的抗体。固体支撑物上所结合的标记的量然后可以通过常规手段检测。
为了用以上所提到的方法执行分析,向上面锚定有第二组分的固相中添加非固定组分。在反应完全之后,可以在所形成的任何复合物将保持固定在固相上的条件下去除(例如通过洗涤)未复合组分。锚定到固相的标记/探针复合物的检测可以用本文中概述的多种方法实现。
在一个实施例中,当探针是未锚定分析组分时,所述探针可以用本文中所论述的可侦测标记进行标记以便直接或间接地检测和读出分析,并且这是本领域普通技术人员众所周知的。关于探针(例如核酸或抗体)的术语“标记”打算涵盖通过耦合(物理连接)可检测物质与探针直接标记探针,以及通过与直接标记的另一试剂反应而间接标记探针。间接标记的实例包括使用荧光标记二级抗体检测初级抗体。也可能直接检测标记/探针复合物形成而不进一步操控或标记任一组分(标记或探针),例如通过使用荧光能量转移技术(fet,参见例如卢科维奇(lakowicz)等人的美国专利第5,631,169号;斯塔夫那普罗(stavrianopoulos)等人的美国专利第4,868,103号)。选择第一‘供体’分子上的荧光团标记以使得在用恰当波长的入射光激发之后,其发射的荧光能量将被第二‘受体’分子上的荧光标记所吸收,所述第二‘受体’分子由于所吸附的能量又能够发荧光。或者,‘供体’蛋白质分子可以简单地利用色氨酸残基的天然荧光能量。选择发射不同波长光的标记,以使得‘受体’分子标记可以与‘供体’的标记区分。因为标记之间能量转移的效率与分子相隔的距离有关,所以可以评定分子之间的空间关系。在结合发生于分子之间的情况下,分析中‘受体’分子标记的荧光发射应该是最大的。fet结合作用可以通过在本领域中众所周知的标准荧光检测手段方便地测量(例如使用荧光计)。
在另一个实施例中,可以在不标记任一分析组分(探针或标记)的情况下,通过使用例如实时生物分子相互相用分析(bia)的技术实现探针识别标记的能力的测定(例如,参见索兰德(sjolander),s和乌尔巴尼扎(urbaniczky),c.(1991)《分析化学》(anal.chem.)63:2338-2345和绍博(szabo)等人(1995)《现代结构生物学评论》(curr.opin.struct.biol.)5:699-705)。如本文所用,“bia”或“表面等离子体共振”是一种用于在不标记任何相互作用物(例如biacoretm)的情况下,实时研究生物特异性相互作用的技术。结合表面处的质量变化(指示结合作用)引起靠近表面的光的折射率改变(表面等离子体共振(spr)的光学现象),产生可检测信号,其可以用作生物分子之间实时反应的指示。
或者,在另一个实施例中,可以用标记和探针作为液相中的溶质进行类似诊断性和预后分析。在此类分析中,复合的标记和探针通过多种标准技术中的任一种与未复合的组分分离,所述标准技术包括(但不限于):差速离心、色谱、电泳和免疫沉淀。在差速离心中,标记/探针复合物可以通过一系列离心步骤与未复合的分析组分分离,由于基于其不同大小和密度,复合物的沉降平衡不同(例如,参见里瓦斯(rivas),g.和明顿(minton),a.p.(1993)《生物化学科学趋势》(trendsbiochemsci.)18:284-7)。也可以采用标准色谱技术用于分离复合分子与未复合的分子。举例来说,凝胶过滤色谱基于大小并且通过在管柱形式中采用恰当的凝胶过滤树脂来分离分子,举例来说,相对较大的复合物可以与相对较小的未复合组分分离。类似地,如相比于未复合组分,标记/探针复合物的相对不同的电荷特性可以用来区分复合物与未复合组分,例如通过采用离子交换色谱树脂。这类树脂和色谱技术对本领域普通技术人员是众所周知的(例如,参见赫加德(heegaard),n.h.(1998)《分子识别杂志》(j.mol.recognit.)11:141-8;哈格(hage),d.s.和特威德(tweed),s.a.(1997)《色谱法杂志b辑:生物医药科学与应用》(j.chromatogr.b.biomed.sci.appl.)699:499-525)。也可以采用凝胶电泳来分离复合分析组分与未结合组分(例如,参见奥斯贝等人编,《分子生物学最新方案》,约翰·威利父子公司,纽约,1987-1999)。在此项技术中,蛋白质或核酸复合物是基于例如大小或电荷分离的。在一些实施例中,使用非变性凝胶基质材料和不存在还原剂的条件以便在电泳过程期间维持结合相互相用。特定分析和其组分的适当条件将是本领域普通技术人员众所周知的。
可以在杂交或扩增分析中使用分离的mrna,所述分析包括(但不限于)南方或北方分析、聚合酶链式反应和
这类引物或探针可以用作用于鉴别表达蛋白质的细胞或组织的诊断测试试剂盒的一部分,例如通过测量来自个体的细胞样品中转录的核酸分子的量,例如检测转录物、mrna水平或测定编码蛋白质的基因是否已经突变或缺失。rna或cdna与核酸探针的杂交可以表明所讨论的标记被表达。本发明进一步涵盖检测由于遗传代码的简并而不同于编码标记蛋白(例如具有序列seqidno:3、6、10、11、14、17、20、23或26的蛋白质)的核酸的核苷酸序列,并且因此编码相同蛋白质的核酸分子。本领域的普通技术人员应了解,引起氨基酸序列变化的dna序列多形现象可以存在于群体(例如人类群体)内。这类遗传多形现象可以由于天然等位变异而存在于群体内的个体中。等位基因是可替代地出现在指定遗传基因座处的一组基因中的一个。这些天然等位变异通常会在指定基因的核苷酸序列中引起1-5%变化。替代性等位基因可以通过对多个不同个体中的相关基因,例如来自个体的正常样品进行测序来鉴别。此测序可以通过使用杂交探针容易地进行,从而鉴别各种个体中的相同遗传基因座。检测任何和所有这类核苷酸变异和所得氨基酸多形现象或变异(这是天然等位变异的结果并且不改变功能活性)打算属于本发明的范围内。另外,应了解影响rna表达水平的dna多形现象也可以存在,其可以影响所述基因的整体表达水平(例如通过影响调节或降解)。
如本文所用,术语“杂交”打算描述杂交和洗涤条件,在所述条件下,彼此显著相同或同源的核苷酸序列保持彼此杂交。在一些实施例中,所述条件使至少约70%、至少约80%、至少约85%、90%或95%彼此相同的序列保持彼此杂交以便后续扩增和/或检测。严格条件根据所涉及的核苷酸序列的长度变化但是本领域的普通技术人员已知的并且可见于《分子生物学最新方案》,奥斯贝等人编,约翰·威利父子公司(1995),第2、4和6部分中或基于其教示来测定。附加严格条件和用于测定这类条件的规则可见于《分子克隆实验手册》,萨姆布鲁克等人,冷泉港出版社,冷泉港,纽约(1989),第7、9和11章。用于杂交长度为至少10个碱基对的严格杂交条件的非限制性实例包括在4×氯化钠/柠檬酸钠(ssc)中,在约65-70℃下杂交(或在4×ssc加50%甲酰胺中,在约42-50℃下杂交),接着在1×ssc中,在约65-70℃下洗涤一或多次。用于这类杂交的高度严格杂交条件的非限制性实例包括在1×ssc中,在约65-70℃下杂交(或在1×ssc加50%甲酰胺中,在约42-50℃下杂交),接着在0.3×ssc中,在约65-70℃下洗涤一或多次。用于这类杂交的严格性降低的杂交条件的非限制性实例包括在4×ssc中,在约50-60℃下杂交(或在6×ssc加50%甲酰胺中,在约40-45℃下杂交),接着在2×ssc中,在约50-60℃下洗涤一或多次。以上所述值的范围中间值,例如在65-70℃下或在42-50℃下也打算由本发明涵盖。严格杂交条件的另一实例是在6×氯化钠/柠檬酸钠(ssc)中,在约45℃下杂交,接着在0.2×ssc、0.1%sds中,在50-65℃下洗涤一或多次。严格杂交缓冲液的另一实例是在1mnacl、50mm2-(n-吗啉基)乙磺酸(mes)缓冲液(ph6.5)、0.5%肌氨酸钠和30%甲酰胺中杂交。在杂交和洗涤缓冲液中,sspe(1×sspe是0.15mnacl、10mmnah2po4和1.25mmedta,ph7.4)可以被ssc(1×ssc是0.15mnacl和15mm柠檬酸钠)替代;在杂交完成之后每次洗涤15分钟。用于预期长度小于50个碱基对的杂交物的杂交温度应该是小于杂交物熔融温度(tm)5-10℃,其中tm根据以下等式测定。关于长度小于18个碱基对的杂交物,tm(℃)=2(a+t碱基的数量)+4(g+c碱基的数量)。关于长度介于18与49个碱基对之间的杂交物,tm(℃)=81.5+16.6(log10[na+])+0.41(%g+c)-(600/n),其中n是杂交物中的碱基数量,并且[na+]是杂交缓冲液中钠离子的浓度(1×ssc的[na+]=0.165m)。熟练的从业者还将认识到,可以向杂交和/或洗涤缓冲液中添加附加试剂以降低核酸分子与膜(例如硝化纤维或尼龙膜)的非特异性杂交,所述试剂包括(但不限于)阻断剂(例如bsa或鲑鱼或鲱鱼精子载体dna)、洗涤剂(例如sds)、螯合剂(例如edta)、聚蔗糖(ficoll)、聚乙烯吡咯烷酮(pvp)等。当使用尼龙膜时,具体来说,严格杂交条件的附加非限制性实例是在0.25-0.5mnah2po4、7%sds中,在约65℃下杂交,接着在0.02mnah2po4、1%sds下,在65℃下洗涤一或多次,参见例如丘奇(church)和吉尔伯特(gilbert)(1984)《美国国家科学院院刊》81:1991-1995,(或者0.2×ssc、1%sds)。可以在检测方法中单独使用引物或核酸探针,或可以在检测方法中与至少一种其它引物或核酸探针一起使用引物。引物也可以用于扩增核酸的至少一部分。本发明的核酸探针是指杂交相关区域并且不进一步延伸的核酸。举例来说,核酸探针是这样的核酸,其特异性杂交生物标记的突变体区域并且通过与患者的dna杂交或不杂交或所形成的杂交类型可以指示生物标记的突变的存在或一致性或标记活性的量。
在一种形式中,将rna固定于固体表面上并且使其与探针接触,例如通过使分离的rna在琼脂糖凝胶上流动并且将rna从凝胶转移到膜(例如硝化纤维)上。在替代性形式中,将核酸探针固定于固体表面上并且使rna与探针接触,例如在
用于测定样品中对应于本发明标记的rna的量的替代性方法涉及核酸扩增过程,例如通过rt-pcr(实验性实施例阐述于穆利斯(mullis),1987,美国专利第4,683,202号中)、连接酶链式反应(巴拉尼(barany),1991,《美国国家科学院院刊》,88:189-193)、自动维持序列复制(瓜特利(guatelli)等人,1990,《美国国家科学院院刊》87:1874-1878)、转录扩增系统(库沃(kwoh)等人,1989,《美国国家科学院院刊》86:1173-1177)、q-β复制酶(李查蒂(lizardi)等人,1988,《生物技术》(bio/technology)6:1197)、滚环式复制(李查蒂等人的美国专利第5,854,033号)或任何其它核酸扩增方法,接着使用本领域的普通技术人员众所周知的技术检测扩增分子。如果核酸分子以极低数量存在,那么这些检测方案尤其适用于检测这类分子。如本文所用,扩增引物定义为一对核酸分子,其可退火到基因的5′或3′区(分别为正链与负链,或反之亦然)并且含有介于其中的短区。一般来说,扩增引物长度为约10到约30个核苷酸并且侧接长度为约50到约200个核苷酸的区域。在适当条件下并且使用适当试剂,这类引物使得包含与引物侧接的核苷酸序列的核酸分子扩增。
关于原位方法,在检测之前,rna不需要从细胞分离。在这类方法中,细胞或组织样品使用已知组织学方法制备/处理。然后将样品固定于支撑物上,通常是玻璃载片,并且然后与可以杂交编码所述标记的rna的探针接触。
在本发明的另一实施例中,检测对应于标记的多肽。在一些实施例中,用于检测本发明多肽的药剂是能够结合对应于本发明标记的多肽的抗体。在相关实施例中,抗体具有可检测标记。抗体可以是多克隆或单克隆抗体。可以使用完整抗体或其片段(例如fab或f(ab′)2)。
可以采用各种形式来确定样品是否包含结合指定抗体的蛋白质。这类形式的实例包括(但不限于)酶免疫分析(eia)、放射免疫分析(ria)、西方印迹分析和酶联免疫吸附分析(elisa)。本领域的技术人员可以容易地调整已知蛋白质/抗体检测方法以用于确定b细胞是否表达本发明标记。
用于测定对应于标记的多肽的水平的另一种方法是质谱法。举例来说,可以分析来自包含一或多种多肽标记的样品,例如血液样品、淋巴样品或其它样品的完整蛋白质或肽,例如胰蛋白酶肽。所述方法可以进一步包括处理样品以降低大量蛋白质(例如血清白蛋白)的量,从而提高所述方法的灵敏度。举例来说,可以使用液相色谱来分级分离样品,因此可以分别通过质谱法分析样品的部分。可以在分离系统中或在组合的液相色谱/质谱系统(lc/ms,参见例如廖(liao)等人(2004)《关节炎与风湿病》(arthritisrheum.)50:3792-3803)中进行各步骤。质谱系统也可以呈串联(ms/ms)模式。蛋白质或肽混合物的电荷状态分布可以经一次或多次扫描获得并且通过统计方法分析,例如使用lc/ms系统中的滞留时间和质荷比(m/z),从而有差异地鉴别来自对nae抑制疗法起反应或不起反应的患者的样品中以统计学显著水平表达的蛋白质。可以使用的质谱仪的实例是离子阱系统(加利福尼亚州圣何塞的热电菲尼根(thermofinnigan,sanjose,ca))或四极杆飞行时间质谱仪(加利福尼亚州福斯特市的应用生物系统公司)。所述方法可以进一步包括肽质量指纹谱分析步骤,例如在基质辅助激光解吸电离与飞行时间(maldi-tof)质谱法中。所述方法可以进一步包括胰蛋白酶肽中的一或多者的测序步骤。此方法的结果可以用于从初级序列数据库鉴别蛋白质,所述数据库例如由马里兰州贝塞斯达的美国国家生物技术信息中心或瑞士日内瓦的瑞士生物信息学研究所(theswissinstituteforbioinformatics,geneva,switzerland)维护,并且基于质谱胰蛋白酶肽m/z基峰。
电子设备可读阵列
还涵盖了与本发明方法结合使用的电子设备,其包括包含至少一种本发明预测标记的可读阵列。如本文所用,“电子设备可读媒体”是指用于储存、保存或容纳数据或信息的任何合适的媒体,所述数据或信息可以通过电子设备直接读取和访问。如本文所用,术语“电子设备”打算包括被配置或适配用于储存数据或信息的任何合适的计算或处理设备或其它装置。适合与本发明一起使用并监控所记录的信息的电子设备的实例包括独立计算设备;网络,包括局域网(lan)、广域网(wan)、互联网、内联网和外联网;电子器械,例如个人数字助理(pda)、蜂窝式电话、寻呼机等;以及本地与分布式处理系统。如本文所用,“记录”是指在电子设备可读媒体上储存或编码信息的过程。本领域的普通技术人员可以容易地采用目前已知的任何方法以在已知媒体上记录信息,从而产生包含本发明标记的制品。
举例来说,微阵列系统在本领域中众所周知并用于例如通过评定基因表达(例如dna检测、rna检测、蛋白质检测)或代谢物产生来评定样品。根据本发明使用的微阵列包括本发明预测标记的一或多个探针,所述标记描绘对如本文所述的治疗方案起反应和/或不起反应的特征。在一个实施例中,所述微阵列包含一或多个对应于患者中的一或多个选自由以下组成的群组的标记的探针:在短期存活者中展现表达增加的标记和在长期存活者中展现表达增加的基因。多种不同微阵列配置和其产生方法是本领域的普通技术人员已知的并且揭示在以下文献中:例如美国专利第5,242,974号、第5,384,261号、第5,405,783号、第5,412,087号、第5,424,186号、第5,429,807号、第5,436,327号、第5,445,934号、第5,556,752号、第5,405,783号、第5,412,087号、第5,424,186号、第5,429,807号、第5,436,327号、第5,472,672号、第5,527,681号、第5,529,756号、第5,545,531号、第5,554,501号、第5,561,071号、第5,571,639号、第5,593,839号、第5,624,711号、第5,700,637号、第5,744,305号、第5,770,456号、第5,770,722号、第5,837,832号、第5,856,101号、第5,874,219号、第5,885,837号、第5,919,523号、第5981185号、第6,022,963号、第6,077,674号、第6,156,501号、第6261776号、第6346413号、第6440677号、第6451536号、第6576424号、第6610482号、第5,143,854号、第5,288,644号、第5,324,633号、第5,432,049号、第5,470,710号、第5,492,806号、第5,503,980号、第5,510,270号、第5,525,464号、第5,547,839号、第5,580,732号、第5,661,028号、第5,848,659号和第5,874,219号;谢娜(shena)等人(1998),《生物技术趋势》(tibtech)16:301;达根(duggan)等人(1999)《自然·遗传学》(nat.genet.)21:10;鲍特尔(bowtell)等人(1999)《自然·遗传学》21:25;利普舒茨(lipshutz)等人(1999)《自然·遗传学》21:20-24,1999;布兰查德(blanchard)等人(1996)《生物传感器与生物电子学》(biosensorsandbioelectronics),11:687-90;马斯科(maskos)等人,(1993)《核酸研究》(nucleicacidsres.)21:4663-69;休斯(hughes)等人(2001)《自然·生物技术》(nat.biotechol.)19:342,2001;所述文献各自以引用的方式并入本文中。组织微阵列可以用于蛋白质鉴别(参见汉斯(hans)等人(2004)《血液》103:275-282)。噬菌体-表位微阵列可以用于基于患者中的蛋白质是否诱导自身抗体来鉴别样品中的一或多种蛋白质(布拉福(bradford)等人(2006)《内分泌肿瘤学》(urol.oncol.)24:237-242)。
因此微阵列包含对应于本文中所鉴别的一或多个标记的一或多个探针,例如那些指示治疗结果的标记,例如从而鉴别野生型标记基因、正常等位变异体和标记基因的突变。微阵列可以包含对应于指示治疗结果的例如至少2个、至少3个、至少4个、至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少75个或至少100个生物标记和/或其突变的探针。微阵列可以包含对应于如本文中所阐述的一或多个生物标记的探针。再者,微阵列可以包含如本文中所阐述并且可以根据本文中所阐述的方法选择和编译的整个标记组。微阵列可以用于分析所述阵列中一或多个预测标记或预测标记组的表达。在一个实例中,所述阵列可以用于分析样品中的一个以上预测标记或标记组表达,从而确定阵列中标记的表达图谱。以此方式,可以同时分析最多约44,000个标记的表达。这允许开发一种显示一或多个样品中的一连串特异性表达的标记的表达图谱。再者,这允许开发一种用于评定治疗结果的表达图谱。
所述阵列也适用于确定正常和异常(例如样品,例如肿瘤)细胞中一或多个标记的不同表达模式。这提供了一连串可以充当便于鉴别患者治疗结果的工具的标记。此外,所述阵列适用于确定参考标记关于参考表达水平的表达。在另一实例中,所述阵列可以用于监控所述阵列中一或多个标记的表达时程。
除这类定性测定之外,本发明还允许标记表达的定量。因此,预测标记可以基于标记组或通过样品中标记的量指示的结果分组。这在例如通过根据本文中所提供的方法对量进行评分确定样品结果是有用的。
所述阵列也适用于确定标记的表达对相同细胞或不同细胞中其它预测标记的表达的影响。如果预测患者具有不利结果,那么这提供了例如候补分子目标用于治疗性干预的选择。
试剂和试剂盒
本发明还涵盖用于检测生物样品(例如骨髓样品、肿瘤生检或参考样品)中对应于本发明标记的多肽或核酸的存在的试剂盒。这类试剂盒可以用于测定至少一种标记基因的突变状态以评定治疗结果,例如确定个体是否能够例如在nae抑制剂治疗之后具有有利结果。举例来说,所述试剂盒可以包含标记化合物或药剂,其能够检测生物样品中对应于本发明标记或标记基因的突变的基因组dna区段、多肽或转录rna;和用于测定所述样品中基因组dna区段、多肽或rna的量的构件。用于与标记蛋白结合的合适的试剂包括抗体、抗体衍生物、抗体片段等。用于与标记核酸(例如基因组dna、mrna、剪接mrna、cdna等)结合的合适的试剂包括互补核酸。所述标记可以直接连接到标记结合剂,例如探针,例如核酸试剂,例如探针或引物或蛋白质试剂,例如特异性结合剂或抗体,或二级试剂可以包含用于间接标记的标记。所述试剂盒还可以含有一种对照或参考样品或一系列对照或参考样品,可以对其进行分析并与测试样品进行对比。举例来说,所述试剂盒可以具有阳性对照样品(例如包括本文所述的一或多个标记或突变)或参考标记(例如来自无肿瘤的个体的例如管家标记,以使各样品或时间点或参考基因组之间的分析标准化),例如从而建立标记的二倍体拷贝数基线或参考表达水平。举例来说,所述试剂盒可以包含适用于使互补核酸退火或用于使抗体与其特异性结合的蛋白质结合的液体(例如缓冲液)和一或多个样品室。本发明的试剂盒可以任选地包含适用于进行本发明方法的附加组件,例如样品收集容器,例如管子;和任选地用于优化所检测的标记的量的构件,例如在取样时间与分析时间之间可能存在时间或不良储存和处理条件的情况下。举例来说,所述试剂盒可以含有如上所述用于增加样品中肿瘤细胞的数量的构件、缓冲剂、防腐剂、稳定剂或用于制备适用于所提供方法中的细胞材料或探针的附加试剂;以及单独或与所提供的探针结合或并入到所述探针中的可检测标记。在一个例示性实施例中,包含样品收集容器的试剂盒可以包含例如管子,其包含如上所述或本领域的普通技术人员已知的抗凝血剂和/或稳定剂,例如rna稳定剂。所述试剂盒可以进一步包含用于检测可检测标记(例如酶或底物)所需的组件。关于标记组,所述试剂盒可以包含适用于检测生物标记的标记组阵列或芯片。试剂盒还可以包含用于解释使用所述试剂盒获得的结果的说明书。所述试剂盒可以含有用于检测本文所述的一或多个生物标记,例如2、3、4、5或5个以上生物标记的试剂。
在一个实施例中,所述试剂盒包含用于检测至少一个生物标记,例如指示治疗结果(例如在nae抑制剂治疗之后)的标记的探针。在示例性实施例中,所述试剂盒包含用于检测选自由以下组成的群组的标记基因的核酸探针:seqidno:1、2、4、5、7、8、9、12、13、15、16、18、19、21、22、24、25;或在从碱基对29999545到30094589的染色体22q、从碱基对48556583到48611412的染色体18q、从碱基对44732423到44971847的染色体xp、从碱基对153242410到153456172的染色体4q、从碱基对7571720到7590868的染色体17p、从碱基对21967751到21994490的染色体9p上的序列;或上述任一项或seqidno:3、6、10、11、14、17、20、23和/或26的互补序列。在一些实施例中,所述试剂盒包含用于检测选自由以下组成的群组的标记的探针:nf2、smad4、kdm6a、fbxw7、tp53、cdkn2a、cdkn2a_p14和apc。在其它实施例中,所述试剂盒包含用于检测选自由以下组成的群组的标记基因的突变的探针:nf2、smad4、kdm6a、fbxw7、tp53、cdkn2a、cdkn2a_p14和apc。在一个实施例中,试剂盒包含用于检测包含两个或两个以上来自由以下组成的群组的标记的标记组的探针:nf2、smad4、kdm6a、fbxw7、tp53、cdkn2a、cdkn2a_p14和apc。在另一个实施例中,试剂盒包含用于检测子宫癌或子宫颈癌中的fbxw7的探针。在一个实施例中,试剂盒包含用于检测肠癌、乳癌、肺癌、头颈癌、子宫颈癌或皮肤癌中的tp53的探针。在一个实施例中,试剂盒包含用于检测肠癌中的tpc和apc的探针。在一个实施例中,试剂盒包含用于检测皮肤癌或中枢神经系统癌中的cdkn2a_p14的探针。在一个实施例中,试剂盒包含用于检测头颈癌或皮肤癌中的cdkn2a的探针。在一个实施例中,试剂盒包含用于检测头颈癌中的smad4的探针。在相关实施例中,所述试剂盒包含核酸探针,所述核酸探针包含或来源于(例如其片段、突变体或变异体(例如同源或互补))选自由以下组成的群组的核酸序列:seqidno:1、2、4、5、7、8、9、12、13、15、16、18、19、21、22、24和25。关于包含核酸探针的试剂盒,例如基于寡核苷酸的试剂盒,所述试剂盒可以包含例如:一或多种核酸试剂,例如寡核苷酸(标记或非标记的),其与对应于任选地固定到底物上的本发明标记的核酸序列杂交;并且可以任选地进一步包含不与底物结合的标记寡核苷酸、引物、一对pcr引物,例如适用于扩增对应于本发明标记的核酸分子,分子信标探针、包含与对应于本发明标记的至少两个核酸序列杂交的寡核苷酸的标记组等。所述试剂盒可以含有rna稳定剂。
关于包含蛋白质探针的试剂盒,例如基于配位体或抗体的试剂盒,所述试剂盒可以包含例如:(1)第一抗体(例如连接到固体支撑物),其结合对应于本发明标记的多肽;和任选地(2)不同的第二抗体,其或者结合所述多肽或者结合所述第一抗体并且结合到可检测标记。所述试剂盒可以含有蛋白质稳定剂。所述试剂盒可以含有用于降低来自样品的非生物标记材料与探针的非特异性结合的量的试剂。用于降低非特异性结合的试剂的实例包括非离子型洗涤剂、含有非特异性蛋白质的溶液,例如那些含有白蛋白或酪蛋白的溶液,或本领域的普通技术人员已知的其它物质。
对应于本发明预测标记或其片段或突变体的分离多肽可以用作免疫原,从而使用多克隆和单克隆抗体的标准制备技术产生抗体。举例来说,免疫原通常用于通过使合适的(即具有免疫能力的)个体免疫来制备抗体,所述个体例如兔、山羊、小鼠或其它哺乳动物或脊椎动物。在又另一方面,本发明提供单克隆抗体或其抗原结合片段,所述抗体或片段特异性地结合包含选自由以下组成的群组的氨基酸序列的多肽:本发明氨基酸序列、由本发明cdna编码的氨基酸序列、本发明氨基酸序列的至少8、10、12、15、20或25个连续氨基酸残基的片段、与本发明氨基酸序列至少95%、96%、97%、98%或99%相同的氨基酸序列(其中一致性百分比使用gcg软件包的align程序测定,所述软件包具有pam120重量残留表,空隙长度处罚是12并且空隙处罚是4)和由核酸分子编码的氨基酸序列,所述核酸分子与由本发明核酸分子或其互补序列组成的核酸分子杂交,在6×ssc下在45℃的杂交条件下并且在0.2×ssc、0.1%sds中,在65℃下洗涤。单克隆抗体可以为人类抗体、人类化抗体、嵌合抗体和/或非人类抗体。恰当的免疫原性制剂可以含有例如重组表达或化学合成的多肽。所述制剂可以进一步包括佐剂,例如弗氏完全或不完全佐剂(freund′scompleteorincompleteadjuvant),或类似的免疫刺激剂。
制造人类抗体的方法是本领域中已知的。制造人类抗体的一种方法使用转基因动物,例如转基因小鼠。这些转基因动物含有插入到其自身基因组中的大量产生人类抗体的基因组并且所述动物自身的内源性抗体产生过程在产生抗体方面变得有缺陷。制造这类转基因动物的方法是本领域中已知的。这类转基因动物可以使用xenomousetm技术或通过使用“微型基因座”方法制得。制造xenomicetm的方法描述在美国专利第6,162,963号、第6,150,584号、第6,114,598号和第6,075,181号中,这些专利以引用的方式并入本文中。使用“微型基因座”方法制造转基因动物的方法描述在美国专利第5,545,807号、第5,545,806号和第5,625,825号中;还参见国际公开案第wo93/12227号,这些专利各自以引用的方式并入本文中。
抗体包括免疫球蛋白分子和免疫球蛋白分子的免疫活性部分,即含有特异性结合抗原的抗原结合位点的分子,例如本发明的多肽,例如本发明多肽的表位。特异性结合指定的本发明多肽的分子是结合所述多肽,但不实质上结合样品(例如生物样品,其自然地包含所述多肽)中的其它分子的分子。举例来说,来源于上述抗体的抗原结合片段以及全长单体、二聚或三聚多肽本身是有用的。这种类型的有用抗体同源物包括(i)fab片段,一种由vl、vh、cl和ch1结构域组成的单价片段;(ii)f(ab′)2片段,一种包含通过铰链区的二硫桥键连接的两个fab片段的二价片段;(iii)由vh和ch1结构域组成的fd片段;(iv)由抗体单臂的vl和vh结构域组成的fv片段;(v)dab片段(沃德(ward)等人,《自然》341:544-546(1989)),其由vh结构域组成;(vii)单一结构域功能重链抗体,其由vhh结构域(称为纳米抗体)组成,参见例如科特斯·雷塔莫佐(cortez-retamozo)等人,《癌症研究》64:2853-2857(2004)和本文中所引用的参考文献;以及(vii)分离的互补决定区(cdr),例如与足以提供抗原结合片段的骨架一起的一或多个分离的cdr。此外,尽管fv片段的两个结构域(vl和vh)是通过独立基因编码的,然而其可以使用重组方法通过合成连接子接合,所述连接子能够使其制造成vl和vh区成对以形成单价分子的单蛋白链(称为单链fv(scfv);参见,例如伯德(bird)等人,《科学》(science)242:423-426(1988);和休斯顿(huston)等人,《美国国家科学院院刊》85:5879-5883(1988)。这类单链抗体也打算涵盖在术语抗体的“抗原结合片段”内。这些抗体片段使用本领域的普通技术人员已知的常规技术获得,并且以与完整抗体相同的方式来就效用对片段进行筛选。抗体片段例如fv、f(ab′)2和fab可以通过裂解完整蛋白质,例如通过蛋白酶或化学裂解来制备。本发明提供多克隆和单克隆抗体。本发明还涵盖上述任一者的合成的和基因工程化的变异体(参见美国专利第6,331,415号)。多克隆和单克隆抗体可以通过各种技术产生,包括常规的鼠类单克隆抗体方法,例如科勒(kohler)和米尔斯坦(milstein),《自然》256:495(1975)的标准体细胞杂交技术、人类b细胞杂交瘤技术(参见科兹博(kozbor)等人,1983,《今日免疫学》(immunol.today)4:72)、ebv-杂交瘤技术(参见科尔(cole)等人,第77-96页,《单克隆抗体和癌症疗法》(monoclonalantibodiesandcancertherapy),艾伦r.利斯公司(alanr.liss,inc.),1985)或三源杂交瘤技术。总体上参见哈洛,e.和莱恩,d.(1988)《抗体实验手册》,冷泉港实验室出版社,冷泉港,纽约;和《免疫学最新方案》(currentprotocolsinimmunology),科利根(coligan)等人编,约翰·威利父子公司,纽约,1994。关于诊断应用,所述抗体可以是单克隆抗体,例如产生于小鼠、大鼠或兔中。此外,为了用于体内应用,本发明抗体可以是人类抗体或人类化抗体。产生本发明单克隆抗体的杂交瘤细胞通过例如使用标准elisa分析,针对结合相关多肽的抗体筛选杂交瘤培养上清液来检测。
必要时,可以采集抗体分子或与个体分离(例如与个体的血液或血清分离)并通过众所周知的技术(例如蛋白质a色谱)进一步纯化以获得igg洗提份。或者,可以选择对本发明蛋白质或多肽具有特异性的抗体或通过例如亲和色谱法纯化(例如部分地纯化)以获得实质上纯化和纯化的抗体。在此上下文中,实质上纯化的抗体组合物意指所述抗体样品包含最多仅30%(以干重计)的针对除所要的本发明蛋白质或多肽的表位以外的表位的污染抗体,并且最多20%、最多10%或最多5%(以干重计)的样品是污染抗体。纯化的抗体组合物意指所述组合物中至少99%的抗体是针对所要的本发明蛋白质或多肽。
针对对应于本发明标记的多肽的抗体(例如单克隆抗体)可以用于检测所述标记(例如在细胞样品中)以便评估所述标记的表达水平和模式。举例来说,抗体也可以诊断性地用于监控组织或体液(例如在血液样品或尿液中)中的蛋白质水平作为临床测试程序的一部分,例如从而测定指定治疗方案的功效。可以通过将所述抗体耦合到可检测物质促进检测。可检测物质的实例包括各种酶、辅基、荧光材料、发光材料、生物发光材料和放射性材料。合适的酶的实例包括辣根过氧化酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶;合适的辅基复合物的实例包括抗生蛋白链菌素/生物素和抗生物素蛋白/生物素;合适的荧光材料的实例包括伞酮、荧光素、异硫氰酸荧光素、若丹明(rhodamine)、二氯三嗪基胺荧光素、丹磺酰氯或藻红素;发光材料的实例包括鲁米诺(luminol);生物发光材料的实例包括荧光素酶、荧光素和发光蛋白质;以及合适的放射性材料的实例包括125i、131i、35s或3h。
因此,在一个方面,本发明提供实质上纯化的抗体或其片段和其非人类抗体或片段,所述抗体或片段特异性地结合包含由本文中所鉴别的标记编码的氨基酸序列的多肽。实质上纯化的本发明抗体或其片段可以是人类抗体、非人类抗体、嵌合抗体和/或人类化抗体。
在另一个方面,本发明提供非人类抗体或其片段,所述抗体或片段特异性地结合包含由本发明的预测标记的核酸分子编码的氨基酸序列的多肽。此些非人类抗体可以是山羊、小鼠、绵羊、马、鸡、兔或大鼠抗体。或者,本发明的非人类抗体可以是嵌合抗体和/或人类化抗体。另外,本发明的非人类抗体可以是多克隆抗体或单克隆抗体。
实质上纯化的抗体或其片段可以特异性地结合于本发明多肽的信号肽、分泌序列、胞外结构域、跨膜或细胞质结构域或细胞质环。本发明的实质上纯化的抗体或其片段、非人类抗体或其片段和/或单克隆抗体或其片段特异性地结合于本发明氨基酸序列的分泌序列或胞外结构域。
本发明还提供了一种试剂盒,所述试剂盒含有结合到可检测物质的本发明抗体和使用说明书。本发明的又另一方面是一种诊断组合物,其包含本发明的探针和药学上可接受的载剂。在一个实施例中,所述诊断组合物包含本发明的抗体、可检测部分和药学上可接受的载剂。
敏感性分析
从患者获得癌细胞样品。测量样品中对应于至少一种本文所述的标记的标记的表达水平。可以采用包含本文所述的所鉴别的标记的标记组,并且使用本文中所描述的方法一起放在标记组中。此些分析用于获得患者的肿瘤的表达图谱。然后使用表达图谱的评估来确定所述患者是否预期具有有利结果并且将受益于治疗,例如nae抑制疗法(例如用单独的或与附加药剂组合的nae抑制剂(例如mln4924)治疗),或预期对存活具有类似作用的替代性药剂。表达图谱的评估也可以用于确定患者是否预期具有不利结果并且将受益于除nae抑制疗法以外的癌症疗法或将受益于改变的nae抑制疗法方案。评估可以包括使用一个标记组,所述标记组是使用所提供的方法或本领域中已知的其它类似评分方法(例如加权投票、临界值特征组合(combinationofthresholdfeatures;ctf)、cox比例风险分析、主成分评分、线性预测评分、k最近邻算法(k-nearestneighbor)等)的中的任一种制备的,例如使用在美国国家生物技术信息中心(ncbi,马里兰州贝塞斯达)用基因表达大棚车(geo)程序寄存的表达值。再者,评估可以包含使用一个以上所制备的标记组。nae抑制疗法将鉴别为当评估结果展示有利结果时适用于治疗癌症或将鉴别侵袭性更大的疗法方案用于具有预期不利结果的患者。
在一个方面,本发明的特征在于一种评估患者,例如患有癌症,例如血液癌症(例如多发性骨髓瘤、白血病、淋巴瘤等)或实体肿瘤癌症(例如黑素瘤、食道癌或膀胱癌)的患者的治疗结果的方法。所述方法包括提供患者标记的标记组中标记的表达的评估,其中所述标记组具有以下特性:其包括多个基因,这些基因各自在具有所鉴别的结果的患者与非患病个体之间有差异地表达,并且其所含有差异地表达的标记的数量足以使个体标记组中每一个标记的不同量(例如如相比于非患病参考样品中的水平)可预测治疗结果,其中不超过约15%、约10%、约5%、约2.5%或约1%假阳性(其中假阳性意指预测患者具有反应性或非反应性而所述个体并不具有);并且提供患者的所述组中每一个标记的量与参考值的比较,由此评估所述患者。
在nae抑制疗法过程期间检查从患者获取的肿瘤样品中所鉴别的标记或标记组中的一或多者的量,还有可能确定所述治疗剂是否继续起作用或所述癌症对所述治疗方案是否已经变成非反应性(难治愈)。举例来说,接受mln4924治疗的患者将去除肿瘤细胞并监控标记或标记组的表达。如果在所述药剂,例如nae抑制剂存在下,本文中所鉴别的一或多个标记的量的概况更具有有利结果的特点,那么所述治疗将继续。然而,如果在所述药剂存在下,本文中所鉴别的一或多个标记的量的概况更具有不利结果的特点,那么所述癌症可能已经对疗法,例如nae抑制疗法产生抗性,并且应该开始另一种治疗方案来治疗所述患者。举例来说,所述癌症可以包含与对nae抑制的抗性相关的标记基因的突变。
重要地,可以基于逐个患者或基于逐一药剂(或药剂组合)做出这些判定。由此可以确定特定nae抑制疗法是否可能使某一特定患者或一组/类患者受益,或特定治疗是否应该继续。
信息的用途
在一种方法中,向第三方,例如医院、诊所、政府实体、赔偿方或保险公司(例如人寿保险公司)提供(例如传达,例如用电子方式传达)信息,例如关于患者肿瘤的突变状态的信息,例如患者的标记特征,例如大小、序列、组成或量(例如本文所述标记或标记组的评估结果),或关于患者是否预期具有有利结果的信息。举例来说,医疗程序的选择、是否支付医疗程序、由赔偿方支付或服务成本或保险可以是所述信息的功能。举例来说,第三方接收信息,至少部分基于所述信息做出决定,并且任选地传达所述信息或基于所述信息选择程序、支付、支付级别、覆盖范围等。在所述方法中,测定标记或标记组的提供信息的表达水平,所述标记或标记组选自或来源于表1和/或描述于本文中。
在一个实施例中,保险(例如人寿保险或医疗保险)的保险费评估为关于一或多个标记的表达水平的信息的功能,例如标记或标记组,例如与治疗结果相关的表达水平(例如提供信息的量)。举例来说,如果本文所述的患者的标记基因或患者的标记组在受保候选人(或寻求保险覆盖范围的候选人)与参考值(例如非患者者)或参考样品(例如匹配的对照)之间具有不同特征,例如大小、序列、组成或量,那么可以增加保险费(例如增加一定百分比)。保险费也可以取决于本文所述标记或标记组的评估结果按比例调整。举例来说,可以依据标记,例如本文所述标记或标记组的评估结果来评定保险费以分散风险。在另一实例中,依据从具有已知治疗结果的患者获得的保险数据评定保险费。
例如在人寿保险的核保过程中,可以使用关于标记特征,例如大小、序列、组成或量的信息,例如本文所述标记或标记组的评估结果(例如提供信息的量)。所述信息可以并入关于个体的简介中。简介中的其它信息可以包括例如出生日期、性别、婚姻状况、银行信息、信用信息、子女等。可以依据关于标记特征,例如大小、序列、组成或量的信息,例如本文所述标记或标记组的评估结果,以及简介中一或多个其它信息项目推荐保险单。也可以依据标记或标记组信息评估保险费或风险评估。在一种实施方式中,基于预期治疗结果指定要点。
在一个实施例中,通过决定是否授权将资金转移至支付为个体提供的服务或治疗(或做出本文中所提到的另一个决策)的功能来分析关于标记特征,例如大小、序列、组成或量的信息,例如本文所述标记或标记组的评估结果。举例来说,本文所述标记或标记组的特征,例如大小、序列、组成或量的分析结果可以表明所述个体预期具有有利结果,表明治疗过程是需要的,由此引发以下结果:表明或致使授权支付为个体提供的服务或治疗。在一个实例中,测定选自或来源于表1和/或本文所述的标记或标记组的提供信息的特征,例如大小、序列、组成或量,并且如果提供信息的量鉴别有利结果,那么授权支付。举例来说,支付或赔偿医疗费用的实体,例如医院、护理者、政府实体或保险公司或其它实体可以使用本文所述方法的结果来决定当事人,例如除个体患者以外的当事人是否将支付为患者提供的服务(例如特定疗法)或治疗。举例来说,第一实体,例如保险公司可以使用本文所述方法的结果来决定是否为患者或代表患者提供财务支付,例如是否赔偿第三方,例如货物或服务的供应商、医院、医师或其它护理者为患者提供的服务或治疗。举例来说,第一实体,例如保险公司可以使用本文所述方法的结果来决定在保险计划或程序,例如健康保险或人寿保险计划或程序中是否继续、中断、招收个体。
在一个方面,本发明的特征是一种提供数据的方法。所述方法包括提供本文所述的数据,例如通过本文所述方法产生的数据,从而为决定是否将提供支付提供记录,例如本文所述的记录。在一些实施例中,通过计算机、光盘、电话、传真、电子邮件或书信提供数据。在一些实施例中,由甲方向乙方提供数据。在一些实施例中,甲方选自个体、医疗提供者、主治医生、健康维护组织(hmo)、医院、政府实体或售卖或供应药物的实体。在一些实施例中,乙方是第三方支付者、保险公司、雇主、雇主赞助的健康计划、hmo或政府实体。在一些实施例中,甲方选自个体、医疗提供者、主治医生、hmo、医院、保险公司或售卖或供应药物的实体并且乙方是政府实体。在一些实施例中,甲方选自个体、医疗提供者、主治医生、hmo、医院、保险公司或售卖或供应药物的实体并且乙方是保险公司。
在另一个方面,本发明的特征是一份记录(例如计算机可读记录),其包括患者的标记或标记组的特征,例如大小、序列、组成或量的清单和值。在一些实施例中,所述记录包括每个标记的一个以上的值。
现将通过以下实例来说明本发明,所述实例并不打算以任何方式限制。
实例
实例1.细胞系小组筛选
为了支持临床开发和鉴别具有肿瘤敏感性或抗性的可能性生物标记,用mln4924处理两大组癌细胞系(第1组,n=653(麦克德莫特(mcdermott)等人(2007)国家科学院院刊104:19936-19941);第2组,n=240(欧黛(o′day)等人(2010)关于癌症治疗开发中分子诊断的第四次aacr国际会议))并且产生细胞活力数据(ic50、ec50和poc-对照百分比)。
第1组(麦克德莫特等人,同前文献)。使细胞系暴露于三个mln4924浓度(20nm、200nm和2μm),持续72小时。通过测量细胞渗透性核酸染色的荧光对活力(即细胞数量)进行定量。获取每个样品一式三份值的平均值并且与dmso对照对比以计算对照百分比。在结果中,对照或无活性值指定是约1的值,敏感性通过小于1的值指示,其中0作为整个细胞群体的死亡并且抗性通过大于1的值指示。获得每个浓度活力值的连续区,因此选择一些值作为最终测定敏感性或抗性的截止点。举例来说,小于小组中记录的所有poc的中间值的中间poc值(<0.34)指示敏感性,0.34到0.75的值指示边界敏感性,大于小组中所有poc的第3四分位数的值(>0.75)指示不敏感性或抗性。一般来说,敏感性细胞系观察到剂量反应关系。最终判断细胞系为敏感性、不敏感性或抗性是通过其在2μm下的活力判定的。
第2组(华盛顿州波塞尔的里切尔卡生物科学公司)。在10个浓度的半对数稀释液中添加mln4924并且处理72小时。通过包括图像分析的荧光显微镜筛选高含量细胞以产生若干类型的数据。结果包括ec50值(在测量细胞数量之后,从对照百分比(poc)与mln4924浓度的对数的曲线的拐点计算ec50浓度)、ic50值(来自poc-logmln4924曲线,ic50是在50%最大可能反应下的浓度)、细胞凋亡(针对mln4924浓度的对数绘制的半胱天冬酶3的活化测量结果,测定为浓度>5倍诱导)以及有丝分裂活性(通过测量磷酸化-组蛋白3的成倍增加测定)。ec50与ic50的对比(图3)允许将细胞系分成敏感性、不敏感性或抗性。细胞系是敏感性或抗性的最终鉴别是基于ec50值。敏感性截止值是小于小组中所记录的所有poc的中间值的中间ec50(<0.36),边界敏感性与0.36到1.67的中间ec50相关并且不敏感性或抗性细胞系通过大于小组中所有poc的第3四分位数的ec50鉴别(>1.67)。
第1组和第2组之间的重叠细胞系(114个重叠)显示一致的生长抑制作用(斯皮尔曼相关系数=0.72)。另外,对每个细胞系组的整体(不仅是重叠细胞系)组织学和突变分析在两个组之间也产生了一致的观察结果(图4a和b)。
使用中间对照百分比值的费雪精确检验用于评估细胞系中个体突变与mln4924敏感性或抗性的相关性。参见表3,关于所选基因p值的汇总。其突变与费雪精确检验中的敏感性相关的基因包括nf2、smad4、kdm6a、cdkn2a和cdkn2a_p14。rb1和tp53与不敏感性相关。
表3.与对mln4924的反应相关的突变标记的置信度
*表示rb1相关的并不是所有细胞类型的结论性表型。一些肿瘤类型相比于其它肿瘤类型与抗性的相关性更大:脑肿瘤、膀胱肿瘤、骨肿瘤和肺肿瘤(nsclc)的p值分别是0.102、0.205、0.226和0.281。rb1不是敏感性标记的结果与吉亚(jia)等人((2011)《瘤形成》(neoplasia)13:561-569)的结果一致,吉亚等人的结果排除了mln4924机制中rb1的参与。
实例2.分析突变相关性
将细胞系中基因突变与对治疗剂的敏感性相互关联的一个困难是许多细胞系具有一个以上突变基因。举例来说,名为8505c的来自甲状腺癌的细胞系具有braf、tp53、nf2和cdkn2a突变。具体来说,tp53和cdkn2a突变与细胞系中的其它突变同时出现。为了获悉细胞系小组中哪种突变体与敏感性或抗性相关,进行了子分析。
apc对比tp53.在第1组细胞系中,23个细胞系具有apc突变。在这些细胞系中,18个细胞系也具有tp53突变。难以确定apc是否是针对mln4924的抗性的驱动因素,或者仅仅是tp53突变体中经常发现的乘客突变。通过扣除具有双重突变体(其包括tp53)的细胞系进行细胞系的进一步分析(表4)。
表4.在第1组中tp53突变体细胞系与apc和其它突变体细胞系的对比
如表4a可见,从细胞系小组中扣除tp53突变体使得数量过少以致于无法得出剩余突变与tp53wt细胞系对mln4924治疗的抗性相关的结论。在去除所有23个apc突变体之后,tp53似乎仍与抗性相关(表4b)。尽管如此,具有apc和tp53突变两者的细胞系展示与抗性强烈相关(表4c)。此外,apc+tp53突变体子组中的大部分细胞系是来自肠道癌肿瘤样品(表5,其还包括来自第2组和六个第1组细胞系的细胞系和数据,其不包括在初始扣除分析中)。
表5.具有apc和tp53突变的细胞系子集
与组织学的相关性.在一些类型的肿瘤中一些tp53突变与抗性的相关性有可能超过其它。通过曼-惠特尼(mann-whitney)(非参数)测试来分析组织类型中的tp53突变体细胞系。如图5中可见,在结肠癌细胞系中,tp53突变与对mln4924的抗性显著相关(p值=0.04022)。
其它组织中的类似的相关性分析表明在乳癌和肺癌(nsclc)细胞系中,tp53突变与mln4924抗性相关。
分析附加突变的肿瘤组织学与对mln4924治疗的抗性或敏感性的可能相关性。表6提供了第1组的分析结果并且表7提供了第2组的分析结果,其更小的大小证明了关于此类分析的挑战。选择p值<0.05的组织相关性截止值。
表6.第1组的突变与组织学的相关性
表7.第2组的突变与组织学的相关性
*cns的p值来源于对照百分比活力。关于皮肤,p值来源于ec50。
相比于tp53与对mln4924的抗性的一般相关性,在头颈癌中,tp53突变与敏感性相关。在皮肤和中枢神经系统(cns)中发现了关于cdkn2a突变的类似对比。在皮肤和cns肿瘤细胞系中,cdkn2a或cdkn2a.p14突变与对mln4924治疗的抗性相关,尽管cdkn2a突变一般与对mln4924治疗的敏感性相关。表6和7也展示了在子宫颈癌和皮肤癌中tp53突变与抗性显著相关;在头颈癌中cdkn2a突变与敏感性显著相关;在头颈癌中,smad4突变与敏感性显著相关;在肺癌中rb1突变与抗性显著相关;以及在骨癌中rb1突变与敏感性显著相关。
实例3.个别细胞系筛选结果
以下各表包括个别细胞系筛选结果,所述结果得出关于标记的结论,所述标记的突变赋予对mln4924的敏感性。
突变符号和突变语法的解释可见于cosmic数据库中。
实例4.tp53缺失与抗性的相关性
确定tp53对mln4924的反应性的作用的另一种方法是缺失tp53基因的研究。在早期研究中,p53对mln4924的复制反应的重要性似乎取决于特异性遗传操控并且预期密切反映cdt1过度表达(cdt1是两种替代性crl复合物的底物并且通过许多细胞系中的mln4924稳定)。在阻断基因表现研究中,p53在早期时间点似乎表现得类似于cdt1阻断基因表现,但在随后的时间点并非如此,除非使用更高浓度的mln4924。西方印记法表明通过sirnasmartpool的有效p53蛋白质阻断基因表现,但是rnai一般不引起蛋白质的完全丢失。因此,残留蛋白质仍会影响对mln4924的反应,尤其是因为mln4924促使p53稳定(廖(liao)等人(2011)《分子细胞蛋白质组学》(mol.cellproteomics)10:10.1074/mcp.m111.009183)。评定mln4924对遗传缺失p53以及其家长控制的hct-116细胞的活力作用。
将用于p53表达的或者野生型(+/+)或者剔除式(-/-)配对的同基因hct-116细胞系(分别是hdpar-018和hd104-001,地平线发现有限公司(horizondiscoveryltd))接种于单独的384孔板中并且然后在第二天用mln4924滴定一式三份地处理,并且培育24、36、48或72小时,其中接种密度分别是每孔1600、1200、800和400个细胞。在化合物培育之后,通过atplite分析(珀金埃尔默(perkinelmer)),根据制造商的说明书使用leadseeker成像系统(通用电气医疗集团)来评定hct-116细胞的活力。
hct-116tp53+/+细胞(mln4924lc50=21±1nm)表明在72小时mln4924敏感性大于hct-116tp53-/-细胞(mln4924lc50=74±5nm;图6a-d)。这些结果表明p53缺乏使hct-116对mln4924的敏感性降低,表明p53在72小时的首要作用是促凋亡。更早的时间点加强了此解释,因为tp53-/-细胞在最高药物浓度下在24、36和48小时的细胞死亡较少。西方印迹法显示p21仍通过tp53-/-hct-116细胞中的mln4924上调。在hct-116细胞中,p21的稳定可以是抑制crl4-cdt2的直接作用(西谷(nishitani)等人,2008;阿巴斯(abbas)等人,2008;金姆(kim)等人,2008)。
此结果与林(lin)等人(2010)《癌症研究》70:10310-10320中使用hct116-/-p53基因剔除细胞的结论相反。在所述研究中,得出以下结论:tp53基因剔除细胞更容易受mln4924影响经历整体细胞死亡或生长抑制。本发明研究得出不同于林等人的结论的原因是用mln4924处理细胞的时间量。在林等人中,在清除之前处理细胞8小时。在本发明研究中和在先前实例的细胞系小组中,用mln4924连续地处理细胞72小时。在清除中,相比于最初受到抑制并引起早期易感性的早期路径,p53水平允许稳定并利用活化替代性路径。
实例5.分离核酸和核酸测序方法
基因组分离和dna测序.使用
桑格测序方法.使用根据基因-外显子优化的循环条件进行pcr扩增。使用应用生物系统公司3.1版bigdye进行引物延伸测序。然后在应用生物系统公司的3730xldna分析仪上进行反应。使用kbtm碱基读出(应用生物系统公司)完成测序碱基读出。通过突变测量器(mutationsurveyor)(软遗传学公司(softgenetics))测定体细胞突变读出并且通过使用seqman(dnastar)比对测序数据与相应参考序列手动确认。
sequenom测序方法.使用
然后设计pcr引物以支托分析设计步骤中所鉴别的区域。在pcr反应中使用引物扩增相关区域。使用纳米分配器rs1000将15nl经扩增和延伸的产物点样在384spectrochipii上。向每个芯片中添加3-点校准物以确保sequenommaldi-tof紧凑型质谱仪的恰当性能。
将spectrochipii放在sequenommaldi-tof紧凑型质谱仪中。将质谱仪点火,在384孔spectrochip上的每个点最多采集9处。遵循制造商推荐的方案使用来自sequenom(10142-2)的typeplexgold试剂盒spectrochipii。使用sequenom分析软件
下一代测序(ngs)方法.使用伊路米那平台(加利福尼亚州圣地亚哥的伊路米那公司)的目标ngs用于证实并鉴别标记中的低频突变。设计引物对来扩增编码外显子。使用picogreen分析对pcr产物定量并且每个样品以相同摩尔比合并。对纯化产物进行末端修复并通过连接级联。级联产物用于hi-seq2000文库制备。剪切级联pcr产物并将其用于制造由每多路复用池12个带条码的样品组成的带条码的hi-seq2000文库。使汇集的hi-seq2000文库通过在hi-seq2000流动细胞的八个通道上簇生成经历克隆扩增并且在hi-seq2000上使用1×100单端测序进行测序。将初始测序读数与人类基因组构建hg18进行匹配,以及使用伊路米那的1.7.1版casava软件进行snp分析。
通用程序
定量rt-pcr
使用abi基因表达分析、试剂和abi
骨髓瘤样品的样品处理
在收集患者骨髓抽吸物之后,通过快速阴性选择浓缩骨髓瘤细胞。浓缩程序采用与结合红血细胞rosettesep(干细胞技术公司(stemcelltechnologies))的抗体耦合的细胞型特异性抗体的混合物。抗体混合物含有具有以下特异性的抗体:cd14(单核细胞)、cd2(t和nk细胞)、cd33(骨髓祖细胞和单核细胞)、cd41(血小板和巨核细胞)、cd45ra(未处理的b和t细胞)和cd66b(粒细胞)。抗体使样品中的非骨髓瘤细胞类型与红血细胞交叉结合。使用修饰的聚蔗糖密度梯度去除结合细胞类型。然后收集并冷冻骨髓瘤细胞。
使用
自通过rna分离方法中所用的管柱的洗提份的流体分离dna。
分析阵列上的骨髓瘤基因表达
通过标准的基于t7的扩增方案(加利福尼亚州圣克拉拉的
每个样品的crna一式三份地与u133a/b阵列杂交;期间控制操作者、芯片批次、临床位点和扫描器(
骨髓瘤纯度评分检查了文献中已知在骨髓瘤细胞(和其正常血浆前体细胞)中高度表达的基因的表达,已知在红细胞系细胞、嗜中性白细胞和t细胞中高度表达的基因的表达(参见以下14个标记的清单)。骨髓瘤评分=骨髓瘤标记(以下1-4号)/红细胞(5-7号)+嗜中性白细胞(8-11号)+t细胞(12-14号)的表达:
1.205692_s_在cd38cd38抗原(p45)骨髓瘤/浆细胞
2.201286_在sdc1多配体蛋白聚糖-1骨髓瘤/浆细胞
3.201891_s_在b2mβ-2微球蛋白骨髓瘤/浆细胞
4.211528_x_在b2mβ-2微球蛋白骨髓瘤/浆细胞
5.37986_在epor促血红细胞生长素受体红细胞系细胞
6.209962_在epor促血红细胞生长素受体红细胞系细胞
7.205838_在gypa血型糖蛋白a红细胞系细胞
8.203948_s_在mpo髓过氧物酶嗜中性白细胞
9.203591_s_在csfr3群落刺激因子3受体(粒细胞)嗜中性白细胞
10.204039_在cebpaccaat/强化子结合蛋白(c/ebp),α嗜中性白细胞
11.214523_在cebpeccaat/强化子结合蛋白(c/ebp),ε嗜中性白细胞
12.209603_在gata3gata结合蛋白3t淋巴细胞
13.209604_s_在gata4gata结合蛋白4t淋巴细胞
14.205456_在cd3ecd3e抗原,ε多肽t淋巴细胞
骨髓瘤纯度评分小于10的样品从进一步分析中排除。
等效物
虽然已经使用特定的术语描述本发明的实施例,但是这类描述仅是出于说明性目的,并且应了解可以在不脱离本发明的精神或范围的情况下作出改变和变化。本领域的普通技术人员顶多使用常规实验即可识别或能够确定本文所述的本发明的特定实施例的许多等效物。这些等效物打算由所附权利要求书涵盖。
序列表
<110>米伦纽姆医药公司
通用医院公司以麻省总医院名义经营
<120>对nedd8活化酶(nae)抑制剂的反应的生物标记
<130>mpi11-009p1rnwo2m
<150>us61/552,686
<151>2011-10-28
<160>26
<170>fastseqforwindowsversion4.0
<210>1
<211>6046
<212>dna
<213>智人
<400>1
tgcgcttcccgcgggcgcgcggagtgaggacggtgacagccacgcgcgcgcgtacgcgcc60
cgatgcagcgcggccccgtgaccctagtcggccgctgagaggcgcgcggagtctgggccg120
ctgccgtctaggggtcccgtcccgaggcgtccccggcatctccggcccgaatcccggagt180
gccgggtcgcgcctgcaccgaaggtcccggctcctgtgccctccctgcagccgtcagggc240
ccgtcccccaactcccctttccgctcaggcagggtcctcgcggcccatgctggccgctgg300
ggacccgcgcagcccagaccgttcccgggccgggcagccggccaccatggtggccctgag360
gcctgtgcagcaactccaggggggctaaagggctcagagtgcaggccgtggggcgcgagg420
gtcccgggcctgagccccgcgccatggccggggccatcgcttcccgcatgagcttcagct480
ctctcaagaggaagcaacccaagacgttcaccgtgaggatcgtcaccatggacgccgaga540
tggagttcaattgcgagatgaagtggaaagggaaggacctctttgatttggtgtgccgga600
ctctggggctccgagaaacctggttctttggactgcagtacacaatcaaggacacagtgg660
cctggctcaaaatggacaagaaggtactggatcatgatgtttcaaaggaagaaccagtca720
cctttcacttcttggccaaattttatcctgagaatgctgaagaggagctggttcaggaga780
tcacacaacatttattcttcttacaggtaaagaagcagattttagatgaaaagatctact840
gccctcctgaggcttctgtgctcctggcttcttacgccgtccaggccaagtatggtgact900
acgaccccagtgttcacaagcggggatttttggcccaagaggaattgcttccaaaaaggg960
taataaatctgtatcagatgactccggaaatgtgggaggagagaattactgcttggtacg1020
cagagcaccgaggccgagccagggatgaagctgaaatggaatatctgaagatagctcagg1080
acctggagatgtacggtgtgaactactttgcaatccggaataaaaagggcacagagctgc1140
tgcttggagtggatgccctggggcttcacatttatgaccctgagaacagactgaccccca1200
agatctccttcccgtggaatgaaatccgaaacatctcgtacagtgacaaggagtttacta1260
ttaaaccactggataagaaaattgatgtcttcaagtttaactcctcaaagcttcgtgtta1320
ataagctgattctccagctatgtatcgggaaccatgatctatttatgaggagaaggaaag1380
ccgattctttggaagttcagcagatgaaagcccaggccagggaggagaaggctagaaagc1440
agatggagcggcagcgcctcgctcgagagaagcagatgagggaggaggctgaacgcacga1500
gggatgagttggagaggaggctgctgcagatgaaagaagaagcaacaatggccaacgaag1560
cactgatgcggtctgaggagacagctgacctgttggctgaaaaggcccagatcaccgagg1620
aggaggcaaaacttctggcccagaaggccgcagaggctgagcaggaaatgcagcgcatca1680
aggccacagcgattcgcacggaggaggagaagcgcctgatggagcagaaggtgctggaag1740
ccgaggtgctggcactgaagatggctgaggagtcagagaggagggccaaagaggcagatc1800
agctgaagcaggacctgcaggaagcacgcgaggcggagcgaagagccaagcagaagctcc1860
tggagattgccaccaagcccacgtacccgcccatgaacccaattccagcaccgttgcctc1920
ctgacataccaagcttcaacctcattggtgacagcctgtctttcgacttcaaagatactg1980
acatgaagcggctttccatggagatagagaaagaaaaagtggaatacatggaaaagagca2040
agcatctgcaggagcagctcaatgaactcaagacagaaatcgaggccttgaaactgaaag2100
agagggagacagctctggatattctgcacaatgagaactccgacaggggtggcagcagca2160
agcacaataccattaaaaagctcaccttgcagagcgccaagtcccgagtggccttctttg2220
aagagctctagcaggtgacccagccaccccaggacctgccacttctcctgctaccgggac2280
cgcgggatggaccagatatcaagagagccatccatagggagctggctgggggtttccgtg2340
ggagctccagaactttccccagctgagtgaagagcccagcccctcttatgtgcaattgcc2400
ttgaactacgaccctgtagagatttctctcatggcgttctagttctctgacctgagtctt2460
tgttttaagaagtatttgtcttcctttgtctaatgtgggattcctgactcccttcgtcca2520
aggcaccggtgtgtgtgtgtcttgcactccagagctgacctccaccgcccagcctgggaa2580
gtcattgtagggagtgagacactgaagccctgagaagccagtgccatcatccccaccccg2640
cccagggttccggaacattcattcccccaccggtgaggacctggcatgcagcgaagcagc2700
ccagcccggcggatcccaggccagcacgcctgccggcttctcatcgtcagggagcccgcc2760
cagagctcgtgacgagcaagtgctgggtccccgccaggcaccccgaggcggcgctctggc2820
tggcagctggtggggaataggcagggcagctgtggctggggagagactttaggcagaagc2880
tgtgatgcaggctgactgccagccgaggggctgggtagtgccgtgcgggagctgatggta2940
cagggcactcgctgtccccctccggccaccctagaccagggtccgagaggcaggcaggag3000
ccactcatgtcttccccattgcccgacgcccatagacgctccttcctgtgtggggctggg3060
gtactccctggtcgtactgcagtcagcacccgtaacccggctatgaccagggatctgtaa3120
gccctgtggctccacaggtgctgcttctcactggcccagactctgagctccaccggccca3180
gtctgcacggcccatctgcttcaccttccctcccagccacgtgccagtggccacagccca3240
cttcccaacccactgttgtacccaggcctcactttgctgttgcccttgtccctcttcggg3300
ccctgaattttctgttccctgggggccagccagggccctttgtgcccctcccagcacagg3360
cctgatgcaggtgtccactcacaggtggcgctcacctaggctgtcacaggacccacctcc3420
atgccaggcaacagagggccacagaaccacccccacggctcactccttggtctggggcca3480
ccttcttgccctttctttttttttttttttttttttttccgagatggagtctctctctgt3540
cacccaggtgggagtgtggtggcacaatctcggctcactgcaacctccacctcctgagtt3600
caagcaattctcctgcctcagcctcccaagtagctgggactacaggcatgcaccaccaca3660
cttggccaatgttctgtatttttaatagggacggggttttgccatgttagctaggctggt3720
ctcaaactcacacctgggattacaggcatgagccactgcacccagccccttcttgccctt3780
tcttttctccatggctgatgctgctgtggccagccagggcccttgagatccttccagttt3840
ggctgttatgcaaagcaggtgatttgtcttaatcagataaaagatagaggctatgggggc3900
ctcaagatttttggagagcagaggtggtctctggcaattccatctggttttgagaaactt3960
agcagctcacagagcacagagatcctgccttcttcctactatcaggctgacctaatgggg4020
ttgggctgctcggcaactgcttgggtcaccttgccccaaggaaaccagccctgggtgcca4080
cccagccacttagggtctacagggtgggactccagacctagagcgtaagtatggatgttg4140
tggccctgtgtcttcctagtgtgacccagccaggagcggaagcttcaggcgtttgtaaag4200
tgaggtctggctctgcctcctccgttttttttttttttctgtttctgtttctgttttttt4260
tttgagatggagtctcgctctgtcgcccaggctggagtgcagtgtcacgatctcagctca4320
ctgcaacctccgcctcccaggtacaagagattctcctgcctcagcctcccgagtagctgg4380
gactacaggcgtgtgccaccatgcctggctaatttttgtatttttagtagagatggggtt4440
tcgccatgttagccagactggtctcgaactcctgacctcaggtgatcctcccaccccggc4500
ttcccaaagttctgggattataggcgtgagccaccatgcccggtctcttctcagtcttga4560
agcccatccctggatttccaccaggagttactttcctcctgacctgtaaatttgttcttt4620
aacaatggctgcaggtgggagcatatggtggtttataaaaacgctgtcgggctttgtttc4680
cttctttagctgccgtgtctacttctgaagtctgggaagtgccaagccacgcggcctcaa4740
gggagctggctggtgtttgagctgtggcagaagcacctggggctccagggagcaggctgg4800
gaactgcaggaccttgctcagccaggagcacttccccctccttgaggcaggaatactgag4860
gtgcctccccacagatggagaaggtggagaggaggatgggcctcaggagcatctcaagcc4920
ccagtagcaggagaaagaaagaaagagatgcctggttttcacagactggttcctgtggct4980
gggatgactgcatccttttttttttttttttgagacggagtttttgcctttgtcgcccag5040
gctggagtgcaatggcgtgatctcggctcaccgcaacctccgcctcccggattcaagcaa5100
ttctcctgcctcagcctcccgagtagctgggattacaggcacgcacctccacgtccggct5160
aattttgtatttttagtggagacggggtttctccatgtcggtcaggctggtctcgaactc5220
ccgacctcaggtgatctgcccacctcggcctcccaaagtgctgggattacaggcatgagc5280
caccgcgcttggccagactgcgtcctttttaagcgaacattttagggcctgggagtttgt5340
caagtaaggaagtctcaagcccaaagagcagcgtcctgaccatggtggtttcattacgag5400
cccttctgctggctctcaggcagaagccccacagcaccgggaccattcatgaggtcactg5460
cccagctcatgatgtccgtgaggctgtccttttggccagtagccgtgtgcagctgtgtgg5520
cacagatggcttcgttcatcctgatcaaggccccacctcagccacagcagtccccccaac5580
ctgtgttgtccaccctattattcatgtacctgccaggccctgctagatagcaccccgtgg5640
cattacataacacttcatgagtggctgtgtcttgtaattttggggacaggtttctctctt5700
tccctctcttttttttgtcaaaagcccagagactgacaaccagctgcagtgtctaagtgt5760
tcctcactgacagggtggggcctcaccacccctggagggagcagcgttggcagggagaca5820
gcctggcccagtgaccctgggcccaagccagcccctccagggctttcagggaagcgccat5880
ccattttcaaagatgtcaaacgtcacttcttcctgtagggcccgagtcctgcctcctatc5940
agggccagatcatagaaggctattttctattctggggaacgattataacttaaatgattg6000
ttttaataaaaattctaagctggaaaataaaaaaaaaaaaaaaaaa6046
<210>2
<211>1788
<212>dna
<213>智人
<400>2
atggccggggccatcgcttcccgcatgagcttcagctctctcaagaggaagcaacccaag60
acgttcaccgtgaggatcgtcaccatggacgccgagatggagttcaattgcgagatgaag120
tggaaagggaaggacctctttgatttggtgtgccggactctggggctccgagaaacctgg180
ttctttggactgcagtacacaatcaaggacacagtggcctggctcaaaatggacaagaag240
gtactggatcatgatgtttcaaaggaagaaccagtcacctttcacttcttggccaaattt300
tatcctgagaatgctgaagaggagctggttcaggagatcacacaacatttattcttctta360
caggtaaagaagcagattttagatgaaaagatctactgccctcctgaggcttctgtgctc420
ctggcttcttacgccgtccaggccaagtatggtgactacgaccccagtgttcacaagcgg480
ggatttttggcccaagaggaattgcttccaaaaagggtaataaatctgtatcagatgact540
ccggaaatgtgggaggagagaattactgcttggtacgcagagcaccgaggccgagccagg600
gatgaagctgaaatggaatatctgaagatagctcaggacctggagatgtacggtgtgaac660
tactttgcaatccggaataaaaagggcacagagctgctgcttggagtggatgccctgggg720
cttcacatttatgaccctgagaacagactgacccccaagatctccttcccgtggaatgaa780
atccgaaacatctcgtacagtgacaaggagtttactattaaaccactggataagaaaatt840
gatgtcttcaagtttaactcctcaaagcttcgtgttaataagctgattctccagctatgt900
atcgggaaccatgatctatttatgaggagaaggaaagccgattctttggaagttcagcag960
atgaaagcccaggccagggaggagaaggctagaaagcagatggagcggcagcgcctcgct1020
cgagagaagcagatgagggaggaggctgaacgcacgagggatgagttggagaggaggctg1080
ctgcagatgaaagaagaagcaacaatggccaacgaagcactgatgcggtctgaggagaca1140
gctgacctgttggctgaaaaggcccagatcaccgaggaggaggcaaaacttctggcccag1200
aaggccgcagaggctgagcaggaaatgcagcgcatcaaggccacagcgattcgcacggag1260
gaggagaagcgcctgatggagcagaaggtgctggaagccgaggtgctggcactgaagatg1320
gctgaggagtcagagaggagggccaaagaggcagatcagctgaagcaggacctgcaggaa1380
gcacgcgaggcggagcgaagagccaagcagaagctcctggagattgccaccaagcccacg1440
tacccgcccatgaacccaattccagcaccgttgcctcctgacataccaagcttcaacctc1500
attggtgacagcctgtctttcgacttcaaagatactgacatgaagcggctttccatggag1560
atagagaaagaaaaagtggaatacatggaaaagagcaagcatctgcaggagcagctcaat1620
gaactcaagacagaaatcgaggccttgaaactgaaagagagggagacagctctggatatt1680
ctgcacaatgagaactccgacaggggtggcagcagcaagcacaataccattaaaaagctc1740
accttgcagagcgccaagtcccgagtggccttctttgaagagctctag1788
<210>3
<211>595
<212>prt
<213>智人
<400>3
metalaglyalailealaserargmetserpheserserleulysarg
151015
lysglnprolysthrphethrvalargilevalthrmetaspalaglu
202530
metglupheasncysglumetlystrplysglylysaspleupheasp
354045
leuvalcysargthrleuglyleuarggluthrtrpphepheglyleu
505560
glntyrthrilelysaspthrvalalatrpleulysmetasplyslys
65707580
valleuasphisaspvalserlysglugluprovalthrphehisphe
859095
leualalysphetyrprogluasnalagluglugluleuvalglnglu
100105110
ilethrglnhisleuphepheleuglnvallyslysglnileleuasp
115120125
glulysiletyrcysproproglualaservalleuleualasertyr
130135140
alavalglnalalystyrglyasptyraspproservalhislysarg
145150155160
glypheleualaglnglugluleuleuprolysargvalileasnleu
165170175
tyrglnmetthrproglumettrpglugluargilethralatrptyr
180185190
alagluhisargglyargalaargaspglualaglumetglutyrleu
195200205
lysilealaglnaspleuglumettyrglyvalasntyrphealaile
210215220
argasnlyslysglythrgluleuleuleuglyvalaspalaleugly
225230235240
leuhisiletyraspprogluasnargleuthrprolysileserphe
245250255
protrpasngluileargasnilesertyrserasplysgluphethr
260265270
ilelysproleuasplyslysileaspvalphelyspheasnserser
275280285
lysleuargvalasnlysleuileleuglnleucysileglyasnhis
290295300
aspleuphemetargargarglysalaaspserleugluvalglngln
305310315320
metlysalaglnalaarggluglulysalaarglysglnmetgluarg
325330335
glnargleualaargglulysglnmetarggluglualagluargthr
340345350
argaspgluleugluargargleuleuglnmetlysgluglualathr
355360365
metalaasnglualaleumetargserglugluthralaaspleuleu
370375380
alaglulysalaglnilethrglugluglualalysleuleualagln
385390395400
lysalaalaglualagluglnglumetglnargilelysalathrala
405410415
ileargthrglugluglulysargleumetgluglnlysvalleuglu
420425430
alagluvalleualaleulysmetalagluglusergluargargala
435440445
lysglualaaspglnleulysglnaspleuglnglualaarggluala
450455460
gluargargalalysglnlysleuleugluilealathrlysprothr
465470475480
tyrproprometasnproileproalaproleuproproaspilepro
485490495
serpheasnleuileglyaspserleuserpheaspphelysaspthr
500505510
aspmetlysargleusermetgluileglulysglulysvalglutyr
515520525
metglulysserlyshisleuglngluglnleuasngluleulysthr
530535540
gluileglualaleulysleulysgluarggluthralaleuaspile
545550555560
leuhisasngluasnseraspargglyglyserserlyshisasnthr
565570575
ilelyslysleuthrleuglnseralalysserargvalalaphephe
580585590
glugluleu
595
<210>4
<211>8789
<212>dna
<213>智人
<400>4
atgctcagtggcttctcgacaagttggcagcaacaacacggccctggtcgtcgtcgccgc60
tgcggtaacggagcggtttgggtggcggagcctgcgttcgcgccttcccgctctcctcgg120
gaggcccttcctgctctcccctaggctccgcggccgcccagggggtgggagcgggtgagg180
ggagccaggcgcccagcgagagaggccccccgccgcagggcggcccgggagctcgaggcg240
gtccggcccgcgcgggcagcggcgcggcgctgaggaggggcggcctggccgggacgcctc300
ggggcgggggccgaggagctctccgggccgccggggaaagctacgggcccggtgcgtccg360
cggaccagcagcgcgggagagcggactcccctcgccaccgcccgagcccaggttatcctg420
aatacatgtctaacaattttccttgcaacgttagctgttgtttttcactgtttccaaagg480
atcaaaattgcttcagaaattggagacatatttgatttaaaaggaaaaacttgaacaaat540
ggacaatatgtctattacgaatacaccaacaagtaatgatgcctgtctgagcattgtgca600
tagtttgatgtgccatagacaaggtggagagagtgaaacatttgcaaaaagagcaattga660
aagtttggtaaagaagctgaaggagaaaaaagatgaattggattctttaataacagctat720
aactacaaatggagctcatcctagtaaatgtgttaccatacagagaacattggatgggag780
gcttcaggtggctggtcggaaaggatttcctcatgtgatctatgcccgtctctggaggtg840
gcctgatcttcacaaaaatgaactaaaacatgttaaatattgtcagtatgcgtttgactt900
aaaatgtgatagtgtctgtgtgaatccatatcactacgaacgagttgtatcacctggaat960
tgatctctcaggattaacactgcagagtaatgctccatcaagtatgatggtgaaggatga1020
atatgtgcatgactttgagggacagccatcgttgtccactgaaggacattcaattcaaac1080
catccagcatccaccaagtaatcgtgcatcgacagagacatacagcaccccagctctgtt1140
agccccatctgagtctaatgctaccagcactgccaactttcccaacattcctgtggcttc1200
cacaagtcagcctgccagtatactggggggcagccatagtgaaggactgttgcagatagc1260
atcagggcctcagccaggacagcagcagaatggatttactggtcagccagctacttacca1320
tcataacagcactaccacctggactggaagtaggactgcaccatacacacctaatttgcc1380
tcaccaccaaaacggccatcttcagcaccacccgcctatgccgccccatcccggacatta1440
ctggcctgttcacaatgagcttgcattccagcctcccatttccaatcatcctgctcctga1500
gtattggtgttccattgcttactttgaaatggatgttcaggtaggagagacatttaaggt1560
tccttcaagctgccctattgttactgttgatggatacgtggacccttctggaggagatcg1620
cttttgtttgggtcaactctccaatgtccacaggacagaagccattgagagagcaaggtt1680
gcacataggcaaaggtgtgcagttggaatgtaaaggtgaaggtgatgtttgggtcaggtg1740
ccttagtgaccacgcggtctttgtacagagttactacttagacagagaagctgggcgtgc1800
acctggagatgctgttcataagatctacccaagtgcatatataaaggtctttgatttgcg1860
tcagtgtcatcgacagatgcagcagcaggcggctactgcacaagctgcagcagctgccca1920
ggcagcagccgtggcaggaaacatccctggcccaggatcagtaggtggaatagctccagc1980
tatcagtctgtcagctgctgctggaattggtgttgatgaccttcgtcgcttatgcatact2040
caggatgagttttgtgaaaggctggggaccggattacccaagacagagcatcaaagaaac2100
accttgctggattgaaattcacttacaccgggccctccagctcctagacgaagtacttca2160
taccatgccgattgcagacccacaacctttagactgaggtcttttaccgttggggccctt2220
aaccttatcaggatggtggactacaaaatacaatcctgtttataatctgaagatatattt2280
cacttttgttctgctttatcttttcataaagggttgaaaatgtgtttgctgccttgctcc2340
tagcagacagaaactggattaaaacaattttttttttcctcttcagaacttgtcaggcat2400
ggctcagagcttgaagattaggagaaacacattcttattaattcttcacctgttatgtat2460
gaaggaatcattccagtgctagaaaatttagccctttaaaacgtcttagagccttttatc2520
tgcagaacatcgatatgtatatcattctacagaataatccagtattgctgattttaaagg2580
cagagaagttctcaaagttaattcacctatgttattttgtgtacaagttgttattgttga2640
acatacttcaaaaataatgtgccatgtgggtgagttaattttaccaagagtaactttact2700
ctgtgtttaaaaagtaagttaataatgtattgtaatctttcatccaaaatattttttgca2760
agttatattagtgaagatggtttcaattcagattgtcttgcaacttcagttttatttttg2820
ccaaggcaaaaaactcttaatctgtgtgtatattgagaatcccttaaaattaccagacaa2880
aaaaatttaaaattacgtttgttattcctagtggatgactgttgatgaagtatacttttc2940
ccctgttaaacagtagttgtattcttctgtatttctaggcacaaggttggttgctaagaa3000
gcctataagaggaatttcttttccttcattcatagggaaaggttttgtattttttaaaac3060
actaaaagcagcgtcactctacctaatgtctcactgttctgcaaaggtggcaatgcttaa3120
actaaataatgaataaactgaatattttggaaactgctaaattctatgttaaatactgtg3180
cagaataatggaaacattacagttcataataggtagtttggatatttttgtacttgattt3240
gatgtgactttttttggtataatgtttaaatcatgtatgttatgatattgtttaaaattc3300
agtttttgtatcttggggcaagactgcaaacttttttatatcttttggttattctaagcc3360
ctttgccatcaatgatcatatcaattggcagtgactttgtatagagaatttaagtagaaa3420
agttgcagatgtattgactgtaccacagacacaatatgtatgctttttacctagctggta3480
gcataaataaaactgaatctcaacatacaaagttgaattctaggtttgatttttaagatt3540
ttttttttcttttgcacttttgagtccaatctcagtgatgaggtaccttctactaaatga3600
caggcaacagccagttctattgggcagctttgtttttttccctcacactctaccgggact3660
tccccatggacattgtgtatcatgtgtagagttggttttttttttttttaatttttattt3720
tactatagcagaaatagacctgattatctacaagatgataaatagattgtctacaggata3780
aatagtatgaaataaaatcaaggattatctttcagatgtgtttacttttgcctggagaac3840
ttttagctatagaaacacttgtgtgatgatagtcctccttatatcacctggaatgaacac3900
agcttctactgccttgctcagaaggtcttttaaatagaccatcctagaaaccactgagtt3960
tgcttatttctgtgatttaaacatagatcttgatccaagctacatgacttttgtctttaa4020
ataacttatctaccacctcatttgtactcttgattacttacaaattctttcagtaaacac4080
ctaattttcttctgtaaaagtttggtgatttaagttttattggcagttttataaaaagac4140
atcttctctagaaattgctaactttaggtccattttactgtgaatgaggaataggagtga4200
gttttagaataacagatttttaaaaatccagatgatttgattaaaaccttaatcatacat4260
tgacataattcattgcttcttttttttgagatatggagtcttgctgtgttgcccaggcag4320
gagtgcagtggtatgatctcagctcactgcaacctctgcctcccgggttcaactgattct4380
cctgcctcagcctccctggtagctaggattacaggtgcccgccaccatgcctggctaact4440
tttgtagttttagtagagacggggttttgcctgttggccaggctggtcttgaactcctga4500
cctcaagtgatccatccaccttggcctcccaaagtgctgggattacgggcgtgagccact4560
gtccctggcctcattgttcccttttctactttaaggaaagttttcatgtttaatcatctg4620
gggaaagtatgtgaaaaatatttgttaagaagtatctctttggagccaagccacctgtct4680
tggtttctttctactaagagccataaagtatagaaatacttctagttgttaagtgcttat4740
atttgtacctagatttagtcacacgcttttgagaaaacatctagtatgttatgatcagct4800
attcctgagagcttggttgttaatctatatttctatttcttagtggtagtcatctttgat4860
gaataagactaaagattctcacaggtttaaaattttatgtctactttaagggtaaaatta4920
tgaggttatggttctgggtgggttttctctagctaattcatatctcaaagagtctcaaaa4980
tgttgaatttcagtgcaagctgaatgagagatgagccatgtacacccaccgtaagacctc5040
attccatgtttgtccagtgcctttcagtgcattatcaaagggaatccttcatggtgttgc5100
ctttattttccggggagtagatcgtgggatatagtctatctcatttttaatagtttaccg5160
cccctggtatacaaagataatgacaataaatcactgccatataaccttgctttttccaga5220
aacatggctgttttgtattgctgtaaccactaaataggttgcctataccattcctcctgt5280
gaacagtgcagatttacaggttgcatggtctggcttaaggagagccatacttgagacatg5340
tgagtaaactgaactcatattagctgtgctgcatttcagacttaaaatccatttttgtgg5400
ggcagggtgtggtgtgtaaaggggggtgtttgtaatacaagttgaaggcaaaataaaatg5460
tcctgtctcccagatgatatacatcttattatttttaaagtttattgctaattgtaggaa5520
ggtgagttgcaggtatctttgactatggtcatctggggaaggaaaattttacattttact5580
attaatgctccttaagtgtctatggaggttaaagaataaaatggtaaatgtttctgtgcc5640
tggtttgatggtaactggttaatagttactcaccattttatgcagagtcacattagttca5700
caccctttctgagagccttttgggagaagcagttttattctctgagtggaacagagttct5760
ttttgttgataatttctagtttgctcccttcgttattgccaactttactggcattttatt5820
taatgatagcagattgggaaaatggcaaatttaggttacggaggtaaatgagtatatgaa5880
agcaattacctctaaagccagttaacaattattttgtaggtggggtacactcagcttaaa5940
gtaatgcatttttttttcccgtaaaggcagaatccatcttgttgcagatagctatctaaa6000
taatctcatatcctcttttgcaaagactacagagaataggctatgacaatcttgttcaag6060
cctttccatttttttccctgataactaagtaatttctttgaacataccaagaagtatgta6120
aaaagtccatggccttattcatccacaaagtggcatcctaggcccagccttatccctagc6180
agttgtcccagtgctgctaggttgcttatcttgtttatctggaatcactgtggagtgaaa6240
ttttccacatcatccagaattgccttatttaagaagtaaaacgttttaatttttagcctt6300
tttttggtggagttatttaatatgtatatcagaggatatactagatggtaacatttcttt6360
ctgtgcttggctatctttgtggacttcaggggcttctaaaacagacaggactgtgttgcc6420
tttactaaatggtctgagacagctatggttttgaatttttagttttttttttttaaccca6480
cttcccctcctggtctcttccctctctgataattaccattcatatgtgagtgttagtgtg6540
cctccttttagcattttcttcttctctttctgattcttcatttctgactgcctaggcaag6600
gaaaccagataaccaaacttactagaacgttctttaaaacacaagtacaaactctgggac6660
aggacccaagacactttcctgtgaagtgctgaaaaagacctcattgtattggcatttgat6720
atcagtttgatgtagcttagagtgcttcctgattcttgctgagtttcaggtagttgagat6780
agagagaagtgagtcatattcatattttcccccttagaataatattttgaaaggtttcat6840
tgcttccacttgaatgctgctcttacaaaaactggggttacaagggttactaaattagca6900
tcagtagccagaggcaataccgttgtctggaggacaccagcaaacaacacacaacaaagc6960
aaaacaaaccttgggaaactaaggccatttgttttgttttggtgtcccctttgaagccct7020
gccttctggccttactcctgtacagatatttttgacctataggtgcctttatgagaattg7080
agggtctgacatcctgccccaaggagtagctaaagtaattgctagtgttttcagggattt7140
taacatcagactggaatgaatgaatgaaactttttgtcctttttttttctgttttttttt7200
ttctaatgtagtaaggactaaggaaaacctttggtgaagacaatcatttctctctgttga7260
tgtggatacttttcacaccgtttatttaaatgctttctcaataggtccagagccagtgtt7320
cttgttcaacctgaaagtaatggctctgggttgggccagacagttgcactctctagtttg7380
ccctctgccacaaatttgatgtgtgacctttgggcaagtcatttatcttctctgggcctt7440
agttgcctcatctgtaaaatgagggagttggagtagattaattattccagctctgaaatt7500
ctaagtgaccttggctaccttgcagcagttttggatttcttccttatctttgttctgctg7560
tttgagggggctttttacttatttccatgttattcaaaggagactaggcttgatatttta7620
ttactgttcttttatggacaaaaggttacatagtatgcccttaagacttaattttaacca7680
aaggcctagcaccaccttaggggctgcaataaacacttaacgcgcgtgcgcacgcgcgcg7740
cgcacacacacacacacacacacacacacacacaggtcagagtttaaggctttcgagtca7800
tgacattctagcttttgaattgcgtgcacacacacacgcacgcacacactctggtcagag7860
tttattaaggctttcgagtcatgacattatagcttttgagttggtgtgtgtgacaccacc7920
ctcctaagtggtgtgtgcttgtaattttttttttcagtgaaaatggattgaaaacctgtt7980
gttaatgcttagtgatattatgctcaaaacaaggaaattcccttgaaccgtgtcaattaa8040
actggtttatatgactcaagaaaacaataccagtagatgattattaactttattcttggc8100
tctttttaggtccattttgattaagtgacttttggctggatcattcagagctctcttcta8160
gcctacccttggatgagtacaattaatgaaattcatattttcaaggacctgggagccttc8220
cttggggctgggttgagggtggggggttggggagtcctggtagaggccagctttgtggta8280
gctggagaggaagggatgaaaccagctgctgttgcaaaggctgcttgtcattgatagaag8340
gactcacgggcttggattgattaagactaaacatggagttggcaaactttcttcaagtat8400
tgagttctgttcaatgcattggacatgtgatttaagggaaaagtgtgaatgcttatagat8460
gatgaaaacctggtgggctgcagagcccagtttagaagaagtgagttgggggttggggac8520
agatttggtggtggtatttcccaactgtttcctcccctaaattcagaggaatgcagctat8580
gccagaagccagagaagagccactcgtagcttctgctttggggacaactggtcagttgaa8640
agtcccaggagttcctttgtggctttctgtatacttttgcctggttaaagtctgtggcta8700
aaaaatagtcgaacctttcttgagaactctgtaacaaagtatgtttttgattaaaagaga8760
aagccaactaaaaaaaaaaaaaaaaaaaa8789
<210>5
<211>1659
<212>dna
<213>智人
<400>5
atggacaatatgtctattacgaatacaccaacaagtaatgatgcctgtctgagcattgtg60
catagtttgatgtgccatagacaaggtggagagagtgaaacatttgcaaaaagagcaatt120
gaaagtttggtaaagaagctgaaggagaaaaaagatgaattggattctttaataacagct180
ataactacaaatggagctcatcctagtaaatgtgttaccatacagagaacattggatggg240
aggcttcaggtggctggtcggaaaggatttcctcatgtgatctatgcccgtctctggagg300
tggcctgatcttcacaaaaatgaactaaaacatgttaaatattgtcagtatgcgtttgac360
ttaaaatgtgatagtgtctgtgtgaatccatatcactacgaacgagttgtatcacctgga420
attgatctctcaggattaacactgcagagtaatgctccatcaagtatgatggtgaaggat480
gaatatgtgcatgactttgagggacagccatcgttgtccactgaaggacattcaattcaa540
accatccagcatccaccaagtaatcgtgcatcgacagagacatacagcaccccagctctg600
ttagccccatctgagtctaatgctaccagcactgccaactttcccaacattcctgtggct660
tccacaagtcagcctgccagtatactggggggcagccatagtgaaggactgttgcagata720
gcatcagggcctcagccaggacagcagcagaatggatttactggtcagccagctacttac780
catcataacagcactaccacctggactggaagtaggactgcaccatacacacctaatttg840
cctcaccaccaaaacggccatcttcagcaccacccgcctatgccgccccatcccggacat900
tactggcctgttcacaatgagcttgcattccagcctcccatttccaatcatcctgctcct960
gagtattggtgttccattgcttactttgaaatggatgttcaggtaggagagacatttaag1020
gttccttcaagctgccctattgttactgttgatggatacgtggacccttctggaggagat1080
cgcttttgtttgggtcaactctccaatgtccacaggacagaagccattgagagagcaagg1140
ttgcacataggcaaaggtgtgcagttggaatgtaaaggtgaaggtgatgtttgggtcagg1200
tgccttagtgaccacgcggtctttgtacagagttactacttagacagagaagctgggcgt1260
gcacctggagatgctgttcataagatctacccaagtgcatatataaaggtctttgatttg1320
cgtcagtgtcatcgacagatgcagcagcaggcggctactgcacaagctgcagcagctgcc1380
caggcagcagccgtggcaggaaacatccctggcccaggatcagtaggtggaatagctcca1440
gctatcagtctgtcagctgctgctggaattggtgttgatgaccttcgtcgcttatgcata1500
ctcaggatgagttttgtgaaaggctggggaccggattacccaagacagagcatcaaagaa1560
acaccttgctggattgaaattcacttacaccgggccctccagctcctagacgaagtactt1620
cataccatgccgattgcagacccacaacctttagactga1659
<210>6
<211>552
<212>prt
<213>智人
<400>6
metaspasnmetserilethrasnthrprothrserasnaspalacys
151015
leuserilevalhisserleumetcyshisargglnglyglygluser
202530
gluthrphealalysargalailegluserleuvallyslysleulys
354045
glulyslysaspgluleuaspserleuilethralailethrthrasn
505560
glyalahisproserlyscysvalthrileglnargthrleuaspgly
65707580
argleuglnvalalaglyarglysglypheprohisvaliletyrala
859095
argleutrpargtrpproaspleuhislysasngluleulyshisval
100105110
lystyrcysglntyralapheaspleulyscysaspservalcysval
115120125
asnprotyrhistyrgluargvalvalserproglyileaspleuser
130135140
glyleuthrleuglnserasnalaprosersermetmetvallysasp
145150155160
glutyrvalhisaspphegluglyglnproserleuserthrglugly
165170175
hisserileglnthrileglnhisproproserasnargalaserthr
180185190
gluthrtyrserthrproalaleuleualaprosergluserasnala
195200205
thrserthralaasnpheproasnileprovalalaserthrsergln
210215220
proalaserileleuglyglyserhissergluglyleuleuglnile
225230235240
alaserglyproglnproglyglnglnglnasnglyphethrglygln
245250255
proalathrtyrhishisasnserthrthrthrtrpthrglyserarg
260265270
thralaprotyrthrproasnleuprohishisglnasnglyhisleu
275280285
glnhishisproprometproprohisproglyhistyrtrpproval
290295300
hisasngluleualapheglnproproileserasnhisproalapro
305310315320
glutyrtrpcysserilealatyrpheglumetaspvalglnvalgly
325330335
gluthrphelysvalprosersercysproilevalthrvalaspgly
340345350
tyrvalaspproserglyglyaspargphecysleuglyglnleuser
355360365
asnvalhisargthrglualailegluargalaargleuhisilegly
370375380
lysglyvalglnleuglucyslysglygluglyaspvaltrpvalarg
385390395400
cysleuserasphisalavalphevalglnsertyrtyrleuasparg
405410415
glualaglyargalaproglyaspalavalhislysiletyrproser
420425430
alatyrilelysvalpheaspleuargglncyshisargglnmetgln
435440445
glnglnalaalathralaglnalaalaalaalaalaglnalaalaala
450455460
valalaglyasnileproglyproglyservalglyglyilealapro
465470475480
alaileserleuseralaalaalaglyileglyvalaspaspleuarg
485490495
argleucysileleuargmetserphevallysglytrpglyproasp
500505510
tyrproargglnserilelysgluthrprocystrpilegluilehis
515520525
leuhisargalaleuglnleuleuaspgluvalleuhisthrmetpro
530535540
ilealaaspproglnproleuasp
545550
<210>7
<211>5778
<212>dna
<213>智人
<400>7
gtgacacaattacaacaactttgtgctggtgccggggaagtttgtgtctccaacgaatcc60
cctcagtgctccccagccccgcgcgctccggccgttcccgccgtccccgcctgtggctgc120
cccctgcccaaccccgcgatgtgaccctacagccgaaagccgccgctgccgacccggggg180
ctccgcagcccctgccgccgccgccgccgccttcaccgccgccgcgttgggatttttcgt240
cgccgccgcccgcggcggaggaggaggcggcgataaagttggtgtgctggtcccgcgcgc300
agattgggggcgtcactgcgggccccggtccgagggggggtgtcggcgttggagttgtga360
attcgctgcgtttccatgaaatcctgcggagtgtcgctcgctaccgccgccgctgccgcc420
gccgctttcggtgatgaggaaaagaaaatggcggcgggaaaagcgagcggcgagagcgag480
gaggcgtcccccagcctgacagccgaggagagggaggcgctcggcggactggacagccgc540
ctctttgggttcgtgagatttcatgaagatggcgccaggacgaaggccctactgggcaag600
gctgttcgctgctatgaatctctaatcttaaaagctgaaggaaaagtggagtctgatttc660
ttttgtcaattaggtcacttcaacctcttattggaagattatccaaaagcattatctgca720
taccagaggtactacagtttacagtctgactactggaagaatgctgcctttttatatggt780
cttggtttggtctacttccattataatgcatttcagtgggcaattaaagcatttcaggag840
gtgctttatgttgatcccagcttttgtcgagccaaggaaattcatttacgacttgggctt900
atgttcaaagtgaacacagactatgagtctagtttaaagcattttcagttagctttggtt960
gactgtaatccctgcactttgtccaatgctgaaattcaatttcacattgcccacttatat1020
gaaacccagaggaaatatcattctgcaaaagaagcttatgaacaacttttgcagacagag1080
aatctttctgcacaagtaaaagcaactgtcttacaacagttaggttggatgcatcacact1140
gtagatctcctgggagataaagccaccaaggaaagctatgctattcagtatctccaaaag1200
tccttggaagcagatcctaattctggccagtcctggtatttcctcggaaggtgctattca1260
agtattgggaaagttcaggatgcctttatatcttacaggcagtctattgataaatcagaa1320
gcaagtgcagatacatggtgttcaataggtgtgctatatcagcagcaaaatcagcccatg1380
gatgctttacaggcctatatttgtgctgtacaattggaccatggccatgctgcagcctgg1440
atggacctaggcactctctatgaatcctgcaaccagcctcaggatgccattaaatgctac1500
ttaaatgcaactagaagcaaaagttgtagtaatacctctgcacttgcagcacgaattaag1560
tatttacaggctcagttgtgtaaccttccacaaggtagtctacagaataaaactaaatta1620
cttcctagtattgaggaggcgtggagcctaccaattcccgcagagcttacctccaggcag1680
ggtgccatgaacacagcacagcagaatacttctgacaattggagtggtggacatgctgtg1740
tcacatcctccagtacagcaacaagctcattcatggtgtttgacaccacagaaattacag1800
catttggaacagctccgcgcaaatagaaataatttaaatccagcacagaaactgatgctg1860
gaacagctggaaagtcagtttgtcttaatgcaacaacaccaaatgagaccaacaggagtt1920
gcacaggtacgatctactggaattcctaatgggccaacagctgactcatcactgcctaca1980
aactcagtctctggccagcagccacagcttgctctgaccagagtgcctagcgtctctcag2040
cctggagtccgtcctgcctgccctgggcagcctttggccaatggacccttttctgcaggc2100
catgttccctgtagcacatcaagaacgctgggaagtacagacactattttgataggcaat2160
aatcatataacaggaagtggaagtaatggaaacgtgccttacctgcagcgaaacgcactc2220
actctacctcataaccgcacaaacctgaccagcagcgcagaggagccgtggaaaaaccaa2280
ctatctaactccactcaggggcttcacaaaggtcagagttcacattcggcaggtcctaat2340
ggtgaacgacctctctcttccactgggccttcccagcatctccaggcagctggctctggt2400
attcagaatcagaacggacatcccaccctgcctagcaattcagtaacacagggggctgct2460
ctcaatcacctctcctctcacactgctacctcaggtggacaacaaggcattaccttaacc2520
aaagagagcaagccttcaggaaacatattgacggtgcctgaaacaagcaggcacactgga2580
gagacacctaacagcactgccagtgtcgagggacttcctaatcatgtccatcagatgacg2640
gcagatgctgtttgcagtcctagccatggagattctaagtcaccaggtttactaagttca2700
gacaatcctcagctctctgccttgttgatgggaaaagccaataacaatgtgggtactgga2760
acctgtgacaaagtcaataacatccacccagctgttcatacaaagactgataactctgtt2820
gcctcttcaccatcttcagccatttcaacagcaacaccttctccaaaatccactgagcag2880
acaaccacaaacagtgttaccagccttaacagccctcacagtgggctacacacaattaat2940
ggagaagggatggaagaatctcagagccccatgaaaacagatctgcttctggttaaccac3000
aaacctagtccacagatcataccatcaatgtctgtgtccatataccccagctcagcagaa3060
gttctgaaggcatgcaggaatctaggtaaaaatggcttatctaacagtagcattttgttg3120
gataaatgtccacctccaagaccaccatcttcaccataccctcccttgccaaaggacaag3180
ttgaatccacctacacctagtatttacttggaaaataaacgtgatgctttctttcctcca3240
ttacatcaattttgtacaaatccgaacaaccctgttacagtaatacgtggccttgctgga3300
gctcttaagttagacctgggacttttctctactaaaactttggtggaagctaacaatgaa3360
catatggtagaagtgaggacacagttgttgcagccagcagatgaaaactgggatcccact3420
ggaacaaagaaaatctggcattgtgaaagtaatagatctcatactacaattgctaaatat3480
gcacagtaccaggcctcctcattccaggaatcattgagagaagaaaatgaaaaaagaagt3540
catcataaagaccactcagatagtgaatctacatcgtcagataattctgggaggaggagg3600
aaaggaccctttaaaaccataaagtttgggaccaatattgacctatctgatgacaaaaag3660
tggaagttgcagctacatgagctgactaaacttcctgcttttgtgcgtgtcgtatcagca3720
ggaaatcttctaagccatgttggtcataccatattgggcatgaacacagttcaactatac3780
atgaaagttccagggagcagaacaccaggtcatcaggaaaataacaacttctgttcagtt3840
aacataaatattggcccaggtgactgtgaatggtttgttgttcctgaaggttactggggt3900
gttctgaatgacttctgtgaaaaaaataatttgaatttcctaatgggttcttggtggccc3960
aatcttgaagatctttatgaagcaaatgttccagtgtataggtttattcagcgacctgga4020
gatttggtctggataaatgcaggcactgttcattgggttcaggctattggctggtgcaac4080
aacattgcttggaatgttggtccacttacagcctgccagtataaattggcagtggaacgg4140
tacgaatggaacaaattgcaaagtgtgaagtcaatagtacccatggttcatctttcctgg4200
aatatggcacgaaatatcaaggtctcagatccaaagctttttgaaatgattaagtattgt4260
cttctaagaactctgaagcaatgtcagacattgagggaagctctcattgctgcaggaaaa4320
gagattatatggcatgggcggacaaaagaagaaccagctcattactgtagcatttgtgaa4380
gtggaggtttttgatctgctttttgtcactaatgagagtaattcacgaaagacctacata4440
gtacattgccaagattgtgcacgaaaaacaagcggaaacttggaaaactttgtggtgcta4500
gaacagtacaaaatggaggacctgatgcaagtctatgaccaatttacattagctcctcca4560
ttaccatccgcctcatcttgatattgttccatggacattaaatgagaccttttctgctat4620
tcaggaaataacccagttctgcaccactggtttttgtagctatctcgtaaggctgctggc4680
tgaaaactgtgtctatgcaaccttccaagtgcggagtgtcaaccaactggacgggagaga4740
gtactgctcctactccaggactctcacaaagctgatgagctgtacttcagaaaaaaataa4800
taatttccatgttttgtatatatctgacaaaactggcaacatcttacagactactgactt4860
gaagacaacctcttttatatttctctatttctgggctgatgaatttgttttcatctgtct4920
tttcccccttcagaattttccttggaaaaaaaatactagcctagctggtcatttctttgt4980
aaggtagttagcaattttaagtctttctttggtcaacttttttttaatgtgaaaagttag5040
gtaagacacttttttactgcttttatgtttttctgtcttgttttgagaccatgatggtta5100
cacttttggttcctaaataaaatttaaaaaattaacagccaagtcacaaaggtaatggat5160
tgcacatagactaaggaataaacttcagatttgtgatttttgtttctaatcttgatgtaa5220
atttacactatttataaatacatatttattgcttgaaaatatttgtgaatggaatgctgt5280
tattttttccagatttacctgccattgaaattttaaggagttctgtaatttcaaacacta5340
ctcctattacattttctatgtgtaaataaaactgcttagcattgtacagaaacttttatt5400
aaaattgtttaatgtttaaagagttttctattgtttgagttttaaaaaagactttatgta5460
cagtgcccagtttttgttcatttttgaaatctgattatatatattttatatatacttatg5520
tatgtatatataatatatatagaaatctggatatatatgtataaatctttagaacttaaa5580
tttttctcgttttaagtttcacatctatggtagatttttgaggtgtctactgtaaagtat5640
tgcttacaaaaagtatgattatttttaaagaaatatatatggtatgtatcctcaagacct5700
aaaatgtcagactggtttattgttaagttgcaattactgcaatgacagaccaataaacaa5760
ttgctgccaaaaaaaaaa5778
<210>8
<211>4206
<212>dna
<213>智人
<400>8
atgaaatcctgcggagtgtcgctcgctaccgccgccgctgccgccgccgctttcggtgat60
gaggaaaagaaaatggcggcgggaaaagcgagcggcgagagcgaggaggcgtcccccagc120
ctgacagccgaggagagggaggcgctcggcggactggacagccgcctctttgggttcgtg180
agatttcatgaagatggcgccaggacgaaggccctactgggcaaggctgttcgctgctat240
gaatctctaatcttaaaagctgaaggaaaagtggagtctgatttcttttgtcaattaggt300
cacttcaacctcttattggaagattatccaaaagcattatctgcataccagaggtactac360
agtttacagtctgactactggaagaatgctgcctttttatatggtcttggtttggtctac420
ttccattataatgcatttcagtgggcaattaaagcatttcaggaggtgctttatgttgat480
cccagcttttgtcgagccaaggaaattcatttacgacttgggcttatgttcaaagtgaac540
acagactatgagtctagtttaaagcattttcagttagctttggttgactgtaatccctgc600
actttgtccaatgctgaaattcaatttcacattgcccacttatatgaaacccagaggaaa660
tatcattctgcaaaagaagcttatgaacaacttttgcagacagagaatctttctgcacaa720
gtaaaagcaactgtcttacaacagttaggttggatgcatcacactgtagatctcctggga780
gataaagccaccaaggaaagctatgctattcagtatctccaaaagtccttggaagcagat840
cctaattctggccagtcctggtatttcctcggaaggtgctattcaagtattgggaaagtt900
caggatgcctttatatcttacaggcagtctattgataaatcagaagcaagtgcagataca960
tggtgttcaataggtgtgctatatcagcagcaaaatcagcccatggatgctttacaggcc1020
tatatttgtgctgtacaattggaccatggccatgctgcagcctggatggacctaggcact1080
ctctatgaatcctgcaaccagcctcaggatgccattaaatgctacttaaatgcaactaga1140
agcaaaagttgtagtaatacctctgcacttgcagcacgaattaagtatttacaggctcag1200
ttgtgtaaccttccacaaggtagtctacagaataaaactaaattacttcctagtattgag1260
gaggcgtggagcctaccaattcccgcagagcttacctccaggcagggtgccatgaacaca1320
gcacagcagaatacttctgacaattggagtggtggacatgctgtgtcacatcctccagta1380
cagcaacaagctcattcatggtgtttgacaccacagaaattacagcatttggaacagctc1440
cgcgcaaatagaaataatttaaatccagcacagaaactgatgctggaacagctggaaagt1500
cagtttgtcttaatgcaacaacaccaaatgagaccaacaggagttgcacaggtacgatct1560
actggaattcctaatgggccaacagctgactcatcactgcctacaaactcagtctctggc1620
cagcagccacagcttgctctgaccagagtgcctagcgtctctcagcctggagtccgtcct1680
gcctgccctgggcagcctttggccaatggacccttttctgcaggccatgttccctgtagc1740
acatcaagaacgctgggaagtacagacactattttgataggcaataatcatataacagga1800
agtggaagtaatggaaacgtgccttacctgcagcgaaacgcactcactctacctcataac1860
cgcacaaacctgaccagcagcgcagaggagccgtggaaaaaccaactatctaactccact1920
caggggcttcacaaaggtcagagttcacattcggcaggtcctaatggtgaacgacctctc1980
tcttccactgggccttcccagcatctccaggcagctggctctggtattcagaatcagaac2040
ggacatcccaccctgcctagcaattcagtaacacagggggctgctctcaatcacctctcc2100
tctcacactgctacctcaggtggacaacaaggcattaccttaaccaaagagagcaagcct2160
tcaggaaacatattgacggtgcctgaaacaagcaggcacactggagagacacctaacagc2220
actgccagtgtcgagggacttcctaatcatgtccatcagatgacggcagatgctgtttgc2280
agtcctagccatggagattctaagtcaccaggtttactaagttcagacaatcctcagctc2340
tctgccttgttgatgggaaaagccaataacaatgtgggtactggaacctgtgacaaagtc2400
aataacatccacccagctgttcatacaaagactgataactctgttgcctcttcaccatct2460
tcagccatttcaacagcaacaccttctccaaaatccactgagcagacaaccacaaacagt2520
gttaccagccttaacagccctcacagtgggctacacacaattaatggagaagggatggaa2580
gaatctcagagccccatgaaaacagatctgcttctggttaaccacaaacctagtccacag2640
atcataccatcaatgtctgtgtccatataccccagctcagcagaagttctgaaggcatgc2700
aggaatctaggtaaaaatggcttatctaacagtagcattttgttggataaatgtccacct2760
ccaagaccaccatcttcaccataccctcccttgccaaaggacaagttgaatccacctaca2820
cctagtatttacttggaaaataaacgtgatgctttctttcctccattacatcaattttgt2880
acaaatccgaacaaccctgttacagtaatacgtggccttgctggagctcttaagttagac2940
ctgggacttttctctactaaaactttggtggaagctaacaatgaacatatggtagaagtg3000
aggacacagttgttgcagccagcagatgaaaactgggatcccactggaacaaagaaaatc3060
tggcattgtgaaagtaatagatctcatactacaattgctaaatatgcacagtaccaggcc3120
tcctcattccaggaatcattgagagaagaaaatgaaaaaagaagtcatcataaagaccac3180
tcagatagtgaatctacatcgtcagataattctgggaggaggaggaaaggaccctttaaa3240
accataaagtttgggaccaatattgacctatctgatgacaaaaagtggaagttgcagcta3300
catgagctgactaaacttcctgcttttgtgcgtgtcgtatcagcaggaaatcttctaagc3360
catgttggtcataccatattgggcatgaacacagttcaactatacatgaaagttccaggg3420
agcagaacaccaggtcatcaggaaaataacaacttctgttcagttaacataaatattggc3480
ccaggtgactgtgaatggtttgttgttcctgaaggttactggggtgttctgaatgacttc3540
tgtgaaaaaaataatttgaatttcctaatgggttcttggtggcccaatcttgaagatctt3600
tatgaagcaaatgttccagtgtataggtttattcagcgacctggagatttggtctggata3660
aatgcaggcactgttcattgggttcaggctattggctggtgcaacaacattgcttggaat3720
gttggtccacttacagcctgccagtataaattggcagtggaacggtacgaatggaacaaa3780
ttgcaaagtgtgaagtcaatagtacccatggttcatctttcctggaatatggcacgaaat3840
atcaaggtctcagatccaaagctttttgaaatgattaagtattgtcttctaagaactctg3900
aagcaatgtcagacattgagggaagctctcattgctgcaggaaaagagattatatggcat3960
gggcggacaaaagaagaaccagctcattactgtagcatttgtgaagtggaggtttttgat4020
ctgctttttgtcactaatgagagtaattcacgaaagacctacatagtacattgccaagat4080
tgtgcacgaaaaacaagcggaaacttggaaaactttgtggtgctagaacagtacaaaatg4140
gaggacctgatgcaagtctatgaccaatttacattagctcctccattaccatccgcctca4200
tcttga4206
<210>9
<211>4206
<212>dna
<213>智人
<400>9
atgaaatcctgcggagtgtcgctcgctaccgccgccgctgccgccgccgctttcggtgat60
gaggaaaagaaaatggcggcgggaaaagcgagcggcgagagcgaggaggcgtcccccagc120
ctgacagccgaggagagggaggcgctcggcggactggacagccgcctctttgggttcgtg180
agatttcatgaagatggcgccaggacgaaggccctactgggcaaggctgttcgctgctat240
gaatctctaatcttaaaagctgaaggaaaagtggagtctgatttcttttgtcaattaggt300
cacttcaacctcttattggaagattatccaaaagcattatctgcataccagaggtactac360
agtttacagtctgactactggaagaatgctgcctttttatatggtcttggtttggtctac420
ttccattataatgcatttcagtgggcaattaaagcatttcaggaggtgctttatgttgat480
cccagcttttgtcgagccaaggaaattcatttacgagttgggcttatgttcaaagtgaac540
acagactatgagtctagtttaaagcattttcagttagctttggttgactgtaatccctgc600
actttgtccaatgctgaaattcaatttcacattgcccacttatatgaaacccagaggaaa660
tatcattctgcaaaagaagcttatgaacaacttttgcagacagagaatctttctgcacaa720
gtaaaagcaactgtcttacaacagttaggttggatgcatcacactgtagatctcctggga780
gataaagccaccaaggaaagctatgctattcagtatctccaaaagtccttggaagcagat840
cctaattctggccagtcctggtatttcctcggaaggtgctattcaagtattgggaaagtt900
caggatgcctttatatcttacaggcagtctattgataaatcagaagcaagtgcagataca960
tggtgttcaataggtgtgctatatcagcagcaaaatcagcccatggatgctttacaggcc1020
tatatttgtgctgtacaattggaccatggccatgctgcagcctggatggacctaggcact1080
ctctatgaatcctgcaaccagcctcaggatgccattaaatgctacttaaatgcaactaga1140
agcaaaagttgtagtaatacctctgcacttgcagcacgaattaagtatttacaggctcag1200
ttgtgtaaccttccacaaggtagtctacagaataaaactaaattacttcctagtattgag1260
gaggcgtggagcctaccaattcccgcagagcttacctccaggcagggtgccatgaacaca1320
gcacagcagaatacttctgacaattggagtggtggacatgctgtgtcacatcctccagta1380
cagcaacaagctcattcatggtgtttgacaccacagaaattacagcatttggaacagctc1440
cgcgcaaatagaaataatttaaatccagcacagaaactgatgctggaacagctggaaagt1500
cagtttgtcttaatgcaacaacaccaaatgagaccaacaggagttgcacaggtacgatct1560
actggaattcctaatgggccaacagctgactcatcactgcctacaaactcagtctctggc1620
cagcagccacagcttgctctgaccagagtgcctagcgtctctcagcctggagtccgtcct1680
gcctgccctgggcagcctttggccaatggacccttttctgcaggccatgttccctgtagc1740
acatcaagaacgcggggaagtacagacactattttgataggcaataatcatataacagga1800
aatggaagtaatggaaacgtgccttacctgcagcgaaacgcactcactctacctcataac1860
cgcacaaacctgaccagcagcgcaaaggagccgtggaaaaaccaactatctaactccact1920
caggggcttcacaaaggtcagagttcacattcggcaggtcctaatggtgaacgacctctc1980
tcttccactgggccttcccagcatctccaggcagctggctctggtattcagaatcagaac2040
ggacatcccaccctgcctagcaattcagtaacacagggggctgctctcaatcacctctcc2100
tctcacactgctacctcaggtggacaacaaggcattaccttaaccaaagagagcaagcct2160
tcaggaaacatattgacggtgcctgaaacaagcaggcacactggagagacacctaacagc2220
actgccagtgtcgagggacttcctaatcatgtccatcagatgacggcagatgctgtttgc2280
agtcctagccatggagattctaagtcaccaggtttactaagttcagacaatcctcagctc2340
tctgccttgttgatgggaaaagccaataacaatgtgggtactggaacctgtgacaaagtc2400
aataacatccacccagctgttcatacaaagactgataactctgttgcctcttcaccatct2460
tcagccatttcaacagcaacaccttctccaaaatccactgagcagacaaccacaaacagt2520
gttaccagccttaacagccctcacagtgggctacacacaattaatggagaagggatggaa2580
gaatctcagagccccatgaaaacagatctgcttctggttaaccacaaacctagtccacag2640
atcataccatcaatgtctgtgtccatataccccagctcagcagaagttctgaaggcatgc2700
aggaatctaggtaaaaatggcttatctaacagtagcattttgttggataaatgtccacct2760
ccaagaccaccatcttcaccataccctcccttgccaaaggacaagttgaatccacctaca2820
cctagtatttacttggaaaataaacgtgatgctttctttcctccattacatcaattttgt2880
acaaatccgaacaaccctgttacagtaatacgtggccttgctggagctcttaagttagac2940
ctgggacttttctctactaaaactttggtggaagctaacaatgaacatatggtagaagtg3000
aggacacagttgttgcagccagcagatgaaaactgggatcccactggaacaaagaaaatc3060
tggcattgtgaaagtaatagatctcatactacaattgctaaatatgcacagtaccaggcc3120
tcctcattccaggaatcattgagagaagaaaatgaaaaaagaagtcatcataaagaccac3180
tcagatagtgaatctacatcgtcagataattctgggaggaggaggaaaggaccctttaaa3240
accataaagtttgggaccaatattgacctatctgatgacaaaaagtggaagttgcagcta3300
catgagctgactaaacttcctgcttttgtgcgtgtcgtatcagcaggaaatcttctaagc3360
catgttggtcataccatattgggcatgaacacagttcaactatacatgaaagttccaggg3420
agcagaacaccaggtcatcaggaaaataacaacttctgttcagttaacataaatattggc3480
ccaggtgactgtgaatggtttgttgttcctgaaggttactggggtgttttgaatgacttc3540
tgtgaaaaaaataatttgaatttcctaatgggttcttggtggcccaatcttgaagatctt3600
tatgaagcaaatgttccagtgtataggtttattcagcgacctggagatttggtctggata3660
aatgcaggcactgttcattgggttcaggctattggctggtgcaacaacattgcttggaat3720
gttggtccacttacagcctgccagtataaattggcagtggaacggtacgaatggaacaaa3780
ttgcaaagtgtgaagtcaatagtacccatggttcatctttcctggaatatggcacgaaat3840
atcaaggtctcagatccaaagctttttgaaatgattaagtattgtcttctaagaactctg3900
aagcaatgtcagacattgagggaagctctcattgctgcaggaaaagagattatatggcat3960
gggcggacaaaagaagaaccagctcattactgtagcatttgtgaagtggaggtttttgat4020
ctgctttttgtcactaatgagagtaattcacgaaagacctacatagtacattgccaagat4080
tgtgcacgaaaaacaagcggaaacttggaaaactttgtggtgctagaacagtacaaaatg4140
gaggacctgatgcaagtctatgaccaatttacattagctcctccattaccatccgcctca4200
tcttga4206
<210>10
<211>1401
<212>prt
<213>智人
<400>10
metlyssercysglyvalserleualathralaalaalaalaalaala
151015
alapheglyaspgluglulyslysmetalaalaglylysalasergly
202530
glusergluglualaserproserleuthralaglugluarggluala
354045
leuglyglyleuaspserargleupheglyphevalargphehisglu
505560
aspglyalaargthrlysalaleuleuglylysalavalargcystyr
65707580
gluserleuileleulysalagluglylysvalgluseraspphephe
859095
cysglnleuglyhispheasnleuleuleugluasptyrprolysala
100105110
leuseralatyrglnargtyrtyrserleuglnserasptyrtrplys
115120125
asnalaalapheleutyrglyleuglyleuvaltyrphehistyrasn
130135140
alapheglntrpalailelysalapheglngluvalleutyrvalasp
145150155160
proserphecysargalalysgluilehisleuargleuglyleumet
165170175
phelysvalasnthrasptyrgluserserleulyshispheglnleu
180185190
alaleuvalaspcysasnprocysthrleuserasnalagluilegln
195200205
phehisilealahisleutyrgluthrglnarglystyrhisserala
210215220
lysglualatyrgluglnleuleuglnthrgluasnleuseralagln
225230235240
vallysalathrvalleuglnglnleuglytrpmethishisthrval
245250255
aspleuleuglyasplysalathrlysglusertyralaileglntyr
260265270
leuglnlysserleuglualaaspproasnserglyglnsertrptyr
275280285
pheleuglyargcystyrserserileglylysvalglnaspalaphe
290295300
ilesertyrargglnserileasplysserglualaseralaaspthr
305310315320
trpcysserileglyvalleutyrglnglnglnasnglnprometasp
325330335
alaleuglnalatyrilecysalavalglnleuasphisglyhisala
340345350
alaalatrpmetaspleuglythrleutyrglusercysasnglnpro
355360365
glnaspalailelyscystyrleuasnalathrargserlyssercys
370375380
serasnthrseralaleualaalaargilelystyrleuglnalagln
385390395400
leucysasnleuproglnglyserleuglnasnlysthrlysleuleu
405410415
proserilegluglualatrpserleuproileproalagluleuthr
420425430
serargglnglyalametasnthralaglnglnasnthrseraspasn
435440445
trpserglyglyhisalavalserhisproprovalglnglnglnala
450455460
hissertrpcysleuthrproglnlysleuglnhisleugluglnleu
465470475480
argalaasnargasnasnleuasnproalaglnlysleumetleuglu
485490495
glnleugluserglnphevalleumetglnglnhisglnmetargpro
500505510
thrglyvalalaglnvalargserthrglyileproasnglyprothr
515520525
alaaspserserleuprothrasnservalserglyglnglnprogln
530535540
leualaleuthrargvalproservalserglnproglyvalargpro
545550555560
alacysproglyglnproleualaasnglypropheseralaglyhis
565570575
valprocysserthrserargthrleuglyserthraspthrileleu
580585590
ileglyasnasnhisilethrglyserglyserasnglyasnvalpro
595600605
tyrleuglnargasnalaleuthrleuprohisasnargthrasnleu
610615620
thrserseralaglugluprotrplysasnglnleuserasnserthr
625630635640
glnglyleuhislysglyglnserserhisseralaglyproasngly
645650655
gluargproleuserserthrglyproserglnhisleuglnalaala
660665670
glyserglyileglnasnglnasnglyhisprothrleuproserasn
675680685
servalthrglnglyalaalaleuasnhisleuserserhisthrala
690695700
thrserglyglyglnglnglyilethrleuthrlysgluserlyspro
705710715720
serglyasnileleuthrvalprogluthrserarghisthrglyglu
725730735
thrproasnserthralaservalgluglyleuproasnhisvalhis
740745750
glnmetthralaaspalavalcysserproserhisglyaspserlys
755760765
serproglyleuleuserseraspasnproglnleuseralaleuleu
770775780
metglylysalaasnasnasnvalglythrglythrcysasplysval
785790795800
asnasnilehisproalavalhisthrlysthraspasnservalala
805810815
serserproserseralaileserthralathrproserprolysser
820825830
thrgluglnthrthrthrasnservalthrserleuasnserprohis
835840845
serglyleuhisthrileasnglygluglymetglugluserglnser
850855860
prometlysthraspleuleuleuvalasnhislysproserprogln
865870875880
ileileprosermetservalseriletyrproserseralagluval
885890895
leulysalacysargasnleuglylysasnglyleuserasnserser
900905910
ileleuleuasplyscysproproproargproproserserprotyr
915920925
proproleuprolysasplysleuasnproprothrproseriletyr
930935940
leugluasnlysargaspalaphepheproproleuhisglnphecys
945950955960
thrasnproasnasnprovalthrvalileargglyleualaglyala
965970975
leulysleuaspleuglyleupheserthrlysthrleuvalgluala
980985990
asnasngluhismetvalgluvalargthrglnleuleuglnproala
99510001005
aspgluasntrpaspprothrglythrlyslysiletrphiscysglu
101010151020
serasnargserhisthrthrilealalystyralaglntyrglnala
1025103010351040
serserpheglngluserleuargglugluasnglulysargserhis
104510501055
hislysasphisseraspsergluserthrserseraspasnsergly
106010651070
argargarglysglyprophelysthrilelyspheglythrasnile
107510801085
aspleuseraspasplyslystrplysleuglnleuhisgluleuthr
109010951100
lysleuproalaphevalargvalvalseralaglyasnleuleuser
1105111011151120
hisvalglyhisthrileleuglymetasnthrvalglnleutyrmet
112511301135
lysvalproglyserargthrproglyhisglngluasnasnasnphe
114011451150
cysservalasnileasnileglyproglyaspcysglutrppheval
115511601165
valprogluglytyrtrpglyvalleuasnaspphecysglulysasn
117011751180
asnleuasnpheleumetglysertrptrpproasnleugluaspleu
1185119011951200
tyrglualaasnvalprovaltyrargpheileglnargproglyasp
120512101215
leuvaltrpileasnalaglythrvalhistrpvalglnalailegly
122012251230
trpcysasnasnilealatrpasnvalglyproleuthralacysgln
123512401245
tyrlysleualavalgluargtyrglutrpasnlysleuglnserval
125012551260
lysserilevalprometvalhisleusertrpasnmetalaargasn
1265127012751280
ilelysvalseraspprolysleupheglumetilelystyrcysleu
128512901295
leuargthrleulysglncysglnthrleuargglualaleuileala
130013051310
alaglylysgluileiletrphisglyargthrlysglugluproala
131513201325
histyrcysserilecysgluvalgluvalpheaspleuleupheval
133013351340
thrasngluserasnserarglysthrtyrilevalhiscysglnasp
1345135013551360
cysalaarglysthrserglyasnleugluasnphevalvalleuglu
136513701375
glntyrlysmetgluaspleumetglnvaltyraspglnphethrleu
138013851390
alaproproleuproseralaserser
13951400
<210>11
<211>1401
<212>prt
<213>智人
<400>11
metlyssercysglyvalserleualathralaalaalaalaalaala
151015
alapheglyaspgluglulyslysmetalaalaglylysalasergly
202530
glusergluglualaserproserleuthralaglugluarggluala
354045
leuglyglyleuaspserargleupheglyphevalargphehisglu
505560
aspglyalaargthrlysalaleuleuglylysalavalargcystyr
65707580
gluserleuileleulysalagluglylysvalgluseraspphephe
859095
cysglnleuglyhispheasnleuleuleugluasptyrprolysala
100105110
leuseralatyrglnargtyrtyrserleuglnserasptyrtrplys
115120125
asnalaalapheleutyrglyleuglyleuvaltyrphehistyrasn
130135140
alapheglntrpalailelysalapheglngluvalleutyrvalasp
145150155160
proserphecysargalalysgluilehisleuargvalglyleumet
165170175
phelysvalasnthrasptyrgluserserleulyshispheglnleu
180185190
alaleuvalaspcysasnprocysthrleuserasnalagluilegln
195200205
phehisilealahisleutyrgluthrglnarglystyrhisserala
210215220
lysglualatyrgluglnleuleuglnthrgluasnleuseralagln
225230235240
vallysalathrvalleuglnglnleuglytrpmethishisthrval
245250255
aspleuleuglyasplysalathrlysglusertyralaileglntyr
260265270
leuglnlysserleuglualaaspproasnserglyglnsertrptyr
275280285
pheleuglyargcystyrserserileglylysvalglnaspalaphe
290295300
ilesertyrargglnserileasplysserglualaseralaaspthr
305310315320
trpcysserileglyvalleutyrglnglnglnasnglnprometasp
325330335
alaleuglnalatyrilecysalavalglnleuasphisglyhisala
340345350
alaalatrpmetaspleuglythrleutyrglusercysasnglnpro
355360365
glnaspalailelyscystyrleuasnalathrargserlyssercys
370375380
serasnthrseralaleualaalaargilelystyrleuglnalagln
385390395400
leucysasnleuproglnglyserleuglnasnlysthrlysleuleu
405410415
proserilegluglualatrpserleuproileproalagluleuthr
420425430
serargglnglyalametasnthralaglnglnasnthrseraspasn
435440445
trpserglyglyhisalavalserhisproprovalglnglnglnala
450455460
hissertrpcysleuthrproglnlysleuglnhisleugluglnleu
465470475480
argalaasnargasnasnleuasnproalaglnlysleumetleuglu
485490495
glnleugluserglnphevalleumetglnglnhisglnmetargpro
500505510
thrglyvalalaglnvalargserthrglyileproasnglyprothr
515520525
alaaspserserleuprothrasnservalserglyglnglnprogln
530535540
leualaleuthrargvalproservalserglnproglyvalargpro
545550555560
alacysproglyglnproleualaasnglypropheseralaglyhis
565570575
valprocysserthrserargthrargglyserthraspthrileleu
580585590
ileglyasnasnhisilethrglyasnglyserasnglyasnvalpro
595600605
tyrleuglnargasnalaleuthrleuprohisasnargthrasnleu
610615620
thrserseralalysgluprotrplysasnglnleuserasnserthr
625630635640
glnglyleuhislysglyglnserserhisseralaglyproasngly
645650655
gluargproleuserserthrglyproserglnhisleuglnalaala
660665670
glyserglyileglnasnglnasnglyhisprothrleuproserasn
675680685
servalthrglnglyalaalaleuasnhisleuserserhisthrala
690695700
thrserglyglyglnglnglyilethrleuthrlysgluserlyspro
705710715720
serglyasnileleuthrvalprogluthrserarghisthrglyglu
725730735
thrproasnserthralaservalgluglyleuproasnhisvalhis
740745750
glnmetthralaaspalavalcysserproserhisglyaspserlys
755760765
serproglyleuleuserseraspasnproglnleuseralaleuleu
770775780
metglylysalaasnasnasnvalglythrglythrcysasplysval
785790795800
asnasnilehisproalavalhisthrlysthraspasnservalala
805810815
serserproserseralaileserthralathrproserprolysser
820825830
thrgluglnthrthrthrasnservalthrserleuasnserprohis
835840845
serglyleuhisthrileasnglygluglymetglugluserglnser
850855860
prometlysthraspleuleuleuvalasnhislysproserprogln
865870875880
ileileprosermetservalseriletyrproserseralagluval
885890895
leulysalacysargasnleuglylysasnglyleuserasnserser
900905910
ileleuleuasplyscysproproproargproproserserprotyr
915920925
proproleuprolysasplysleuasnproprothrproseriletyr
930935940
leugluasnlysargaspalaphepheproproleuhisglnphecys
945950955960
thrasnproasnasnprovalthrvalileargglyleualaglyala
965970975
leulysleuaspleuglyleupheserthrlysthrleuvalgluala
980985990
asnasngluhismetvalgluvalargthrglnleuleuglnproala
99510001005
aspgluasntrpaspprothrglythrlyslysiletrphiscysglu
101010151020
serasnargserhisthrthrilealalystyralaglntyrglnala
1025103010351040
serserpheglngluserleuargglugluasnglulysargserhis
104510501055
hislysasphisseraspsergluserthrserseraspasnsergly
106010651070
argargarglysglyprophelysthrilelyspheglythrasnile
107510801085
aspleuseraspasplyslystrplysleuglnleuhisgluleuthr
109010951100
lysleuproalaphevalargvalvalseralaglyasnleuleuser
1105111011151120
hisvalglyhisthrileleuglymetasnthrvalglnleutyrmet
112511301135
lysvalproglyserargthrproglyhisglngluasnasnasnphe
114011451150
cysservalasnileasnileglyproglyaspcysglutrppheval
115511601165
valprogluglytyrtrpglyvalleuasnaspphecysglulysasn
117011751180
asnleuasnpheleumetglysertrptrpproasnleugluaspleu
1185119011951200
tyrglualaasnvalprovaltyrargpheileglnargproglyasp
120512101215
leuvaltrpileasnalaglythrvalhistrpvalglnalailegly
122012251230
trpcysasnasnilealatrpasnvalglyproleuthralacysgln
123512401245
tyrlysleualavalgluargtyrglutrpasnlysleuglnserval
125012551260
lysserilevalprometvalhisleusertrpasnmetalaargasn
1265127012751280
ilelysvalseraspprolysleupheglumetilelystyrcysleu
128512901295
leuargthrleulysglncysglnthrleuargglualaleuileala
130013051310
alaglylysgluileiletrphisglyargthrlysglugluproala
131513201325
histyrcysserilecysgluvalgluvalpheaspleuleupheval
133013351340
thrasngluserasnserarglysthrtyrilevalhiscysglnasp
1345135013551360
cysalaarglysthrserglyasnleugluasnphevalvalleuglu
136513701375
glntyrlysmetgluaspleumetglnvaltyraspglnphethrleu
138013851390
alaproproleuproseralaserser
13951400
<210>12
<211>3896
<212>dna
<213>智人
<400>12
ccttccgcagctgccgcttcagtccgaaggaggaagggaaccaacccactttctcggcgc60
cgcggctcttttctaaaagtaatgtgaaaacctttgcatcttctgatagtctagccaagg120
tccaagaagtagcaagctggcttttggaaatgaatcaggaactgctctctgtgggcagca180
aaagacgacgaactggaggctctctgagaggtaacccttcctcaagccaggtagatgaag240
aacagatgaatcgtgtggtagaggaggaacagcaacagcaactcagacaacaagaggagg300
agcacactgcaaggaatggtgaagttgttggagtagaacctagacctggaggccaaaatg360
attcccagcaaggacagttggaagaaaacaataatagatttatttcggtagatgaggact420
cctcaggaaaccaagaagaacaagaggaagatgaagaacatgctggtgaacaagatgagg480
aggatgaggaggaggaggagatggaccaggagagtgacgattttgatcagtctgatgata540
gtagcagagaagatgaacatacacatactaacagtgtcacgaactccagtagtattgtgg600
acctgcccgttcaccaactctcctccccattctatacaaaaacaacaaaaatgaaaagaa660
agttggaccatggttctgaggtccgctctttttctttgggaaagaaaccatgcaaagtct720
cagaatatacaagtaccactgggcttgtaccatgttcagcaacaccaacaacttttgggg780
acctcagagcagccaatggccaagggcaacaacgacgccgaattacatctgtccagccac840
ctacaggcctccaggaatggctaaaaatgtttcagagctggagtggaccagagaaattgc900
ttgctttagatgaactcattgatagttgtgaaccaacacaagtaaaacatatgatgcaag960
tgatagaaccccagtttcaacgagacttcatttcattgctccctaaagagttggcactct1020
atgtgctttcattcctggaacccaaagacctgctacaagcagctcagacatgtcgctact1080
ggagaattttggctgaagacaaccttctctggagagagaaatgcaaagaagaggggattg1140
atgaaccattgcacatcaagagaagaaaagtaataaaaccaggtttcatacacagtccat1200
ggaaaagtgcatacatcagacagcacagaattgatactaactggaggcgaggagaactca1260
aatctcctaaggtgctgaaaggacatgatgatcatgtgatcacatgcttacagttttgtg1320
gtaaccgaatagttagtggttctgatgacaacactttaaaagtttggtcagcagtcacag1380
gcaaatgtctgagaacattagtgggacatacaggtggagtatggtcatcacaaatgagag1440
acaacatcatcattagtggatctacagatcggacactcaaagtgtggaatgcagagactg1500
gagaatgtatacacaccttatatgggcatacttccactgtgcgttgtatgcatcttcatg1560
aaaaaagagttgttagcggttctcgagatgccactcttagggtttgggatattgagacag1620
gccagtgtttacatgttttgatgggtcatgttgcagcagtccgctgtgttcaatatgatg1680
gcaggagggttgttagtggagcatatgattttatggtaaaggtgtgggatccagagactg1740
aaacctgtctacacacgttgcaggggcatactaatagagtctattcattacagtttgatg1800
gtatccatgtggtgagtggatctcttgatacatcaatccgtgtttgggatgtggagacag1860
ggaattgcattcacacgttaacagggcaccagtcgttaacaagtggaatggaactcaaag1920
acaatattcttgtctctgggaatgcagattctacagttaaaatctgggatatcaaaacag1980
gacagtgtttacaaacattgcaaggtcccaacaagcatcagagtgctgtgacctgtttac2040
agttcaacaagaactttgtaattaccagctcagatgatggaactgtaaaactatgggact2100
tgaaaacgggtgaatttattcgaaacctagtcacattggagagtggggggagtgggggag2160
ttgtgtggcggatcagagcctcaaacacaaagctggtgtgtgcagttgggagtcggaatg2220
ggactgaagaaaccaagctgctggtgctggactttgatgtggacatgaagtgaagagcag2280
aaaagatgaatttgtccaattgtgtagacgatatactccctgcccttccccctgcaaaaa2340
gaaaaaaagaaaagaaaaagaaaaaaatcccttgttctcagtggtgcaggatgttggctt2400
ggggcaacagattgaaaagacctacagactaagaaggaaaagaagaagagatgacaaacc2460
ataactgacaagagaggcgtctgctgtctcatcacataaaaggcttcacttttgactgag2520
ggcagctttgcaaaatgagactttctaaatcaaaccaggtgcaattatttctttattttc2580
ttctccagtggtcattgggcagtgttaatgctgaaacatcattacagattctgctagcct2640
gttcttttaccactgacagctagacacctagaaaggaactgcaataatatcaaaacaagt2700
actggttgactttctaattagagagcatctgcaacaaaaagtcatttttctggagtggaa2760
aagcttaaaaaaattactgtgaattgtttttgtacagttatcatgaaaagcttttttttt2820
tttttttttgccaaccattgccaatgtcaatcaatcacagtattagcctctgttaatcta2880
tttactgttgcttccatatacattcttcaatgcatatgttgctcaaaggtggcaagttgt2940
cctgggttctgtgagtcctgagatggatttaattcttgatgctggtgctagaagtaggtc3000
ttcaaatatgggattgttgtcccaaccctgtactgtactcccagtggccaaacttattta3060
tgctgctaaatgaaagaaagaaaaaagcaaattatttttttttattttttttctgctgtg3120
acgttttagtcccagactgaattccaaatttgctctagtttggttatggaaaaaagactt3180
tttgccactgaaacttgagccatctgtgcctctaagaggctgagaatggaagagtttcag3240
ataataaagagtgaagtttgcctgcaagtaaagaattgagagtgtgtgcaaagcttattt3300
tcttttatctgggcaaaaattaaaacacattccttggaacagagctattacttgcctgtt3360
ctgtggagaaacttttctttttgagggctgtggtgaatggatgaacgtacatcgtaaaac3420
tgacaaaatattttaaaaatatataaaacacaaaattaaaataaagttgctggtcagtct3480
tagtgttttacagtatttgggaaaacaactgttacagttttattgctctgagtaactgac3540
aaagcagaaactattcagtttttgtagtaaaggcgtcacatgcaaacaaacaaaatgaat3600
gaaacagtcaaatggtttgcctcattctccaagagccacaactcaagctgaactgtgaaa3660
gtggtttaacactgtatcctaggcgatcttttttcctccttctgtttatttttttgtttg3720
ttttatttatagtctgatttaaaacaatcagattcaagttggttaattttagttatgtaa3780
caacctgacatgatggaggaaaacaacctttaaagggattgtgtctatggtttgattcac3840
ttagaaattttattttcttataacttaagtgcaataaaatgtgttttttcatgtta3896
<210>13
<211>2124
<212>dna
<213>智人
<400>13
atgaatcaggaactgctctctgtgggcagcaaaagacgacgaactggaggctctctgaga60
ggtaacccttcctcaagccaggtagatgaagaacagatgaatcgtgtggtagaggaggaa120
cagcaacagcaactcagacaacaagaggaggagcacactgcaaggaatggtgaagttgtt180
ggagtagaacctagacctggaggccaaaatgattcccagcaaggacagttggaagaaaac240
aataatagatttatttcggtagatgaggactcctcaggaaaccaagaagaacaagaggaa300
gatgaagaacatgctggtgaacaagatgaggaggatgaggaggaggaggagatggaccag360
gagagtgacgattttgatcagtctgatgatagtagcagagaagatgaacatacacatact420
aacagtgtcacgaactccagtagtattgtggacctgcccgttcaccaactctcctcccca480
ttctatacaaaaacaacaaaaatgaaaagaaagttggaccatggttctgaggtccgctct540
ttttctttgggaaagaaaccatgcaaagtctcagaatatacaagtaccactgggcttgta600
ccatgttcagcaacaccaacaacttttggggacctcagagcagccaatggccaagggcaa660
caacgacgccgaattacatctgtccagccacctacaggcctccaggaatggctaaaaatg720
tttcagagctggagtggaccagagaaattgcttgctttagatgaactcattgatagttgt780
gaaccaacacaagtaaaacatatgatgcaagtgatagaaccccagtttcaacgagacttc840
atttcattgctccctaaagagttggcactctatgtgctttcattcctggaacccaaagac900
ctgctacaagcagctcagacatgtcgctactggagaattttggctgaagacaaccttctc960
tggagagagaaatgcaaagaagaggggattgatgaaccattgcacatcaagagaagaaaa1020
gtaataaaaccaggtttcatacacagtccatggaaaagtgcatacatcagacagcacaga1080
attgatactaactggaggcgaggagaactcaaatctcctaaggtgctgaaaggacatgat1140
gatcatgtgatcacatgcttacagttttgtggtaaccgaatagttagtggttctgatgac1200
aacactttaaaagtttggtcagcagtcacaggcaaatgtctgagaacattagtgggacat1260
acaggtggagtatggtcatcacaaatgagagacaacatcatcattagtggatctacagat1320
cggacactcaaagtgtggaatgcagagactggagaatgtatacacaccttatatgggcat1380
acttccactgtgcgttgtatgcatcttcatgaaaaaagagttgttagcggttctcgagat1440
gccactcttagggtttgggatattgagacaggccagtgtttacatgttttgatgggtcat1500
gttgcagcagtccgctgtgttcaatatgatggcaggagggttgttagtggagcatatgat1560
tttatggtaaaggtgtgggatccagagactgaaacctgtctacacacgttgcaggggcat1620
actaatagagtctattcattacagtttgatggtatccatgtggtgagtggatctcttgat1680
acatcaatccgtgtttgggatgtggagacagggaattgcattcacacgttaacagggcac1740
cagtcgttaacaagtggaatggaactcaaagacaatattcttgtctctgggaatgcagat1800
tctacagttaaaatctgggatatcaaaacaggacagtgtttacaaacattgcaaggtccc1860
aacaagcatcagagtgctgtgacctgtttacagttcaacaagaactttgtaattaccagc1920
tcagatgatggaactgtaaaactatgggacttgaaaacgggtgaatttattcgaaaccta1980
gtcacattggagagtggggggagtgggggagttgtgtggcggatcagagcctcaaacaca2040
aagctggtgtgtgcagttgggagtcggaatgggactgaagaaaccaagctgctggtgctg2100
gactttgatgtggacatgaagtga2124
<210>14
<211>707
<212>prt
<213>智人
<400>14
metasnglngluleuleuservalglyserlysargargargthrgly
151015
glyserleuargglyasnproserserserglnvalaspgluglugln
202530
metasnargvalvalgluglugluglnglnglnglnleuargglngln
354045
gluglugluhisthralaargasnglygluvalvalglyvalglupro
505560
argproglyglyglnasnaspserglnglnglyglnleuglugluasn
65707580
asnasnargpheileservalaspgluaspserserglyasnglnglu
859095
gluglnglugluaspglugluhisalaglygluglnaspglugluasp
100105110
glugluglugluglumetaspglngluseraspasppheaspglnser
115120125
aspaspserserarggluaspgluhisthrhisthrasnservalthr
130135140
asnserserserilevalaspleuprovalhisglnleuserserpro
145150155160
phetyrthrlysthrthrlysmetlysarglysleuasphisglyser
165170175
gluvalargserpheserleuglylyslysprocyslysvalserglu
180185190
tyrthrserthrthrglyleuvalprocysseralathrprothrthr
195200205
pheglyaspleuargalaalaasnglyglnglyglnglnargargarg
210215220
ilethrservalglnproprothrglyleuglnglutrpleulysmet
225230235240
pheglnsertrpserglyproglulysleuleualaleuaspgluleu
245250255
ileaspsercysgluprothrglnvallyshismetmetglnvalile
260265270
gluproglnpheglnargasppheileserleuleuprolysgluleu
275280285
alaleutyrvalleuserpheleugluprolysaspleuleuglnala
290295300
alaglnthrcysargtyrtrpargileleualagluaspasnleuleu
305310315320
trpargglulyscyslysglugluglyileaspgluproleuhisile
325330335
lysargarglysvalilelysproglypheilehisserprotrplys
340345350
seralatyrileargglnhisargileaspthrasntrpargarggly
355360365
gluleulysserprolysvalleulysglyhisaspasphisvalile
370375380
thrcysleuglnphecysglyasnargilevalserglyseraspasp
385390395400
asnthrleulysvaltrpseralavalthrglylyscysleuargthr
405410415
leuvalglyhisthrglyglyvaltrpserserglnmetargaspasn
420425430
ileileileserglyserthraspargthrleulysvaltrpasnala
435440445
gluthrglyglucysilehisthrleutyrglyhisthrserthrval
450455460
argcysmethisleuhisglulysargvalvalserglyserargasp
465470475480
alathrleuargvaltrpaspilegluthrglyglncysleuhisval
485490495
leumetglyhisvalalaalavalargcysvalglntyraspglyarg
500505510
argvalvalserglyalatyraspphemetvallysvaltrpasppro
515520525
gluthrgluthrcysleuhisthrleuglnglyhisthrasnargval
530535540
tyrserleuglnpheaspglyilehisvalvalserglyserleuasp
545550555560
thrserileargvaltrpaspvalgluthrglyasncysilehisthr
565570575
leuthrglyhisglnserleuthrserglymetgluleulysaspasn
580585590
ileleuvalserglyasnalaaspserthrvallysiletrpaspile
595600605
lysthrglyglncysleuglnthrleuglnglyproasnlyshisgln
610615620
seralavalthrcysleuglnpheasnlysasnphevalilethrser
625630635640
seraspaspglythrvallysleutrpaspleulysthrglygluphe
645650655
ileargasnleuvalthrleugluserglyglyserglyglyvalval
660665670
trpargileargalaserasnthrlysleuvalcysalavalglyser
675680685
argasnglythrglugluthrlysleuleuvalleuasppheaspval
690695700
aspmetlys
705
<210>15
<211>2591
<212>dna
<213>智人
<400>15
gatgggattggggttttcccctcccatgtgctcaagactggcgctaaaagttttgagctt60
ctcaaaagtctagagccaccgtccagggagcaggtagctgctgggctccggggacacttt120
gcgttcgggctgggagcgtgctttccacgacggtgacacgcttccctggattggcagcca180
gactgccttccgggtcactgccatggaggagccgcagtcagatcctagcgtcgagccccc240
tctgagtcaggaaacattttcagacctatggaaactacttcctgaaaacaacgttctgtc300
ccccttgccgtcccaagcaatggatgatttgatgctgtccccggacgatattgaacaatg360
gttcactgaagacccaggtccagatgaagctcccagaatgccagaggctgctccccccgt420
ggcccctgcaccagcagctcctacaccggcggcccctgcaccagccccctcctggcccct480
gtcatcttctgtcccttcccagaaaacctaccagggcagctacggtttccgtctgggctt540
cttgcattctgggacagccaagtctgtgacttgcacgtactcccctgccctcaacaagat600
gttttgccaactggccaagacctgccctgtgcagctgtgggttgattccacacccccgcc660
cggcacccgcgtccgcgccatggccatctacaagcagtcacagcacatgacggaggttgt720
gaggcgctgcccccaccatgagcgctgctcagatagcgatggtctggcccctcctcagca780
tcttatccgagtggaaggaaatttgcgtgtggagtatttggatgacagaaacacttttcg840
acatagtgtggtggtgccctatgagccgcctgaggttggctctgactgtaccaccatcca900
ctacaactacatgtgtaacagttcctgcatgggcggcatgaaccggaggcccatcctcac960
catcatcacactggaagactccagtggtaatctactgggacggaacagctttgaggtgcg1020
tgtttgtgcctgtcctgggagagaccggcgcacagaggaagagaatctccgcaagaaagg1080
ggagcctcaccacgagctgcccccagggagcactaagcgagcactgcccaacaacaccag1140
ctcctctccccagccaaagaagaaaccactggatggagaatatttcacccttcagatccg1200
tgggcgtgagcgcttcgagatgttccgagagctgaatgaggccttggaactcaaggatgc1260
ccaggctgggaaggagccaggggggagcagggctcactccagccacctgaagtccaaaaa1320
gggtcagtctacctcccgccataaaaaactcatgttcaagacagaagggcctgactcaga1380
ctgacattctccacttcttgttccccactgacagcctcccacccccatctctccctcccc1440
tgccattttgggttttgggtctttgaacccttgcttgcaataggtgtgcgtcagaagcac1500
ccaggacttccatttgctttgtcccggggctccactgaacaagttggcctgcactggtgt1560
tttgttgtggggaggaggatggggagtaggacataccagcttagattttaaggtttttac1620
tgtgagggatgtttgggagatgtaagaaatgttcttgcagttaagggttagtttacaatc1680
agccacattctaggtaggggcccacttcaccgtactaaccagggaagctgtccctcactg1740
ttgaattttctctaacttcaaggcccatatctgtgaaatgctggcatttgcacctacctc1800
acagagtgcattgtgagggttaatgaaataatgtacatctggccttgaaaccacctttta1860
ttacatggggtctagaacttgacccccttgagggtgcttgttccctctccctgttggtcg1920
gtgggttggtagtttctacagttgggcagctggttaggtagagggagttgtcaagtctct1980
gctggcccagccaaaccctgtctgacaacctcttggtgaaccttagtacctaaaaggaaa2040
tctcaccccatcccacaccctggaggatttcatctcttgtatatgatgatctggatccac2100
caagacttgttttatgctcagggtcaatttcttttttcttttttttttttttttttcttt2160
ttctttgagactgggtctcgctttgttgcccaggctggagtggagtggcgtgatcttggc2220
ttactgcagcctttgcctccccggctcgagcagtcctgcctcagcctccggagtagctgg2280
gaccacaggttcatgccaccatggccagccaacttttgcatgttttgtagagatggggtc2340
tcacagtgttgcccaggctggtctcaaactcctgggctcaggcgatccacctgtctcagc2400
ctcccagagtgctgggattacaattgtgagccaccacgtccagctggaagggtcaacatc2460
ttttacattctgcaagcacatctgcattttcaccccacccttcccctccttctccctttt2520
tatatcccatttttatatcgatctcttattttacaataaaactttgctgccacctgtgtg2580
tctgaggggtg2591
<210>16
<211>1182
<212>dna
<213>智人
<400>16
atggaggagccgcagtcagatcctagcgtcgagccccctctgagtcaggaaacattttca60
gacctatggaaactacttcctgaaaacaacgttctgtcccccttgccgtcccaagcaatg120
gatgatttgatgctgtccccggacgatattgaacaatggttcactgaagacccaggtcca180
gatgaagctcccagaatgccagaggctgctccccgcgtggcccctgcaccagcagctcct240
acaccggcggcccctgcaccagccccctcctggcccctgtcatcttctgtcccttcccag300
aaaacctaccagggcagctacggtttccgtctgggcttcttgcattctgggacagccaag360
tctgtgacttgcacgtactcccctgccctcaacaagatgttttgccaactggccaagacc420
tgccctgtgcagctgtgggttgattccacacccccgcccggcacccgcgtccgcgccatg480
gccatctacaagcagtcacagcacatgacggaggttgtgaggcgctgcccccaccatgag540
cgctgctcagatagcgatggtctggcccctcctcagcatcttatccgagtggaaggaaat600
ttgcgtgtggagtatttggatgacagaaacacttttcgacatagtgtggtggtgccctat660
gagccgcctgaggttggctctgactgtaccaccatccactacaactacatgtgtaacagt720
tcctgcatgggcggcatgaaccggaggcccatcctcaccatcatcacactggaagactcc780
agtggtaatctactgggacggaacagctttgaggtgcgtgtttgtgcctgtcctgggaga840
gaccggcgcacagaggaagagaatctccgcaagaaaggggagcctcaccacgagctgccc900
ccagggagcactaagcgagcactgcccaacaacaccagctcctctccccagccaaagaag960
aaaccactggatggagaatatttcacccttcagatccgtgggcgtgagcgcttcgagatg1020
ttccgagagctgaatgaggccttggaactcaaggatgcccaggctgggaaggagccaggg1080
gggagcagggctcactccagccacctgaagtccaaaaagggtcagtctacctcccgccat1140
aaaaaactcatgttcaagacagaagggcctgactcagactga1182
<210>17
<211>393
<212>prt
<213>智人
<400>17
metglugluproglnseraspproservalgluproproleusergln
151015
gluthrpheseraspleutrplysleuleuprogluasnasnvalleu
202530
serproleuproserglnalametaspaspleumetleuserproasp
354045
aspilegluglntrpphethrgluaspproglyproaspglualapro
505560
argmetproglualaalaproargvalalaproalaproalaalapro
65707580
thrproalaalaproalaproalaprosertrpproleuserserser
859095
valproserglnlysthrtyrglnglysertyrglypheargleugly
100105110
pheleuhisserglythralalysservalthrcysthrtyrserpro
115120125
alaleuasnlysmetphecysglnleualalysthrcysprovalgln
130135140
leutrpvalaspserthrproproproglythrargvalargalamet
145150155160
alailetyrlysglnserglnhismetthrgluvalvalargargcys
165170175
prohishisgluargcysseraspseraspglyleualaproprogln
180185190
hisleuileargvalgluglyasnleuargvalglutyrleuaspasp
195200205
argasnthrphearghisservalvalvalprotyrgluproproglu
210215220
valglyseraspcysthrthrilehistyrasntyrmetcysasnser
225230235240
sercysmetglyglymetasnargargproileleuthrileilethr
245250255
leugluaspserserglyasnleuleuglyargasnserphegluval
260265270
argvalcysalacysproglyargaspargargthrgluglugluasn
275280285
leuarglyslysglygluprohishisgluleuproproglyserthr
290295300
lysargalaleuproasnasnthrserserserproglnprolyslys
305310315320
lysproleuaspglyglutyrphethrleuglnileargglyargglu
325330335
argpheglumetphearggluleuasnglualaleugluleulysasp
340345350
alaglnalaglylysgluproglyglyserargalahisserserhis
355360365
leulysserlyslysglyglnserthrserarghislyslysleumet
370375380
phelysthrgluglyproaspserasp
385390
<210>18
<211>1267
<212>dna
<213>智人
<400>18
cgagggctgcttccggctggtgcccccgggggagacccaacctggggcgacttcaggggt60
gccacattcgctaagtgctcggagttaatagcacctcctccgagcactcgctcacggcgt120
ccccttgcctggaaagataccgcggtccctccagaggatttgagggacagggtcggaggg180
ggctcttccgccagcaccggaggaagaaagaggaggggctggctggtcaccagagggtgg240
ggcggaccgcgtgcgctcggcggctgcggagagggggagagcaggcagcgggcggcgggg300
agcagcatggagccggcggcggggagcagcatggagccttcggctgactggctggccacg360
gccgcggcccggggtcgggtagaggaggtgcgggcgctgctggaggcgggggcgctgccc420
aacgcaccgaatagttacggtcggaggccgatccaggtcatgatgatgggcagcgcccga480
gtggcggagctgctgctgctccacggcgcggagcccaactgcgccgaccccgccactctc540
acccgacccgtgcacgacgctgcccgggagggcttcctggacacgctggtggtgctgcac600
cgggccggggcgcggctggacgtgcgcgatgcctggggccgtctgcccgtggacctggct660
gaggagctgggccatcgcgatgtcgcacggtacctgcgcgcggctgcggggggcaccaga720
ggcagtaaccatgcccgcatagatgccgcggaaggtccctcagacatccccgattgaaag780
aaccagagaggctctgagaaacctcgggaaacttagatcatcagtcaccgaaggtcctac840
agggccacaactgcccccgccacaacccaccccgctttcgtagttttcatttagaaaata900
gagcttttaaaaatgtcctgccttttaacgtagatatatgccttcccccactaccgtaaa960
tgtccatttatatcattttttatatattcttataaaaatgtaaaaaagaaaaacaccgct1020
tctgccttttcactgtgttggagttttctggagtgagcactcacgccctaagcgcacatt1080
catgtgggcatttcttgcgagcctcgcagcctccggaagctgtcgacttcatgacaagca1140
ttttgtgaactagggaagctcaggggggttactggcttctcttgagtcacactgctagca1200
aatggcagaaccaaagctcaaataaaaataaaataattttcattcattcactcaaaaaaa1260
aaaaaaa1267
<210>19
<211>471
<212>dna
<213>智人
<400>19
atggagccggcggcggggagcagcatggagccttcggctgactggctggccacggccgcg60
gcccggggtcgggtagaggaggtgcgggcgctgctggaggcgggggcgctgcccaacgca120
ccgaatagttacggtcggaggccgatccaggtcatgatgatgggcagcgcccgagtggcg180
gagctgctgctgctccacggcgcggagcccaactgcgccgaccccgccactctcacccga240
cccgtgcacgacgctgcccgggagggcttcctggacacgctggtggtgctgcaccgggcc300
ggggcgcggctggacgtgcgcgatgcctggggccgtctgcccgtggacctggctgaggag360
ctgggccatcgcgatgtcgcacggtacctgcgcgcggctgcggggggcaccagaggcagt420
aaccatgcccgcatagatgccgcggaaggtccctcagacatccccgattga471
<210>20
<211>156
<212>prt
<213>智人
<400>20
metgluproalaalaglysersermetgluproseralaasptrpleu
151015
alathralaalaalaargglyargvalglugluvalargalaleuleu
202530
glualaglyalaleuproasnalaproasnsertyrglyargargpro
354045
ileglnvalmetmetmetglyseralaargvalalagluleuleuleu
505560
leuhisglyalagluproasncysalaaspproalathrleuthrarg
65707580
provalhisaspalaalaarggluglypheleuaspthrleuvalval
859095
leuhisargalaglyalaargleuaspvalargaspalatrpglyarg
100105110
leuprovalaspleualaglugluleuglyhisargaspvalalaarg
115120125
tyrleuargalaalaalaglyglythrargglyserasnhisalaarg
130135140
ileaspalaalagluglyproseraspileproasp
145150155
<210>21
<211>1164
<212>dna
<213>智人
<400>21
cgctcagggaaggcgggtgcgcgcctgcggggcggagatgggcagggggcggtgcgtggg60
tcccagtctgcagttaagggggcaggagtggcgctgctcacctctggtgccaaagggcgg120
cgcagcggctgccgagctcggccctggaggcggcgagaacatggtgcgcaggttcttggt180
gaccctccggattcggcgcgcgtgcggcccgccgcgagtgagggttttcgtggttcacat240
cccgcggctcacgggggagtgggcagcgccaggggcgcccgccgctgtggccctcgtgct300
gatgctactgaggagccagcgtctagggcagcagccgcttcctagaagaccaggtcatga360
tgatgggcagcgcccgagtggcggagctgctgctgctccacggcgcggagcccaactgcg420
ccgaccccgccactctcacccgacccgtgcacgacgctgcccgggagggcttcctggaca480
cgctggtggtgctgcaccgggccggggcgcggctggacgtgcgcgatgcctggggccgtc540
tgcccgtggacctggctgaggagctgggccatcgcgatgtcgcacggtacctgcgcgcgg600
ctgcggggggcaccagaggcagtaaccatgcccgcatagatgccgcggaaggtccctcag660
acatccccgattgaaagaaccagagaggctctgagaaacctcgggaaacttagatcatca720
gtcaccgaaggtcctacagggccacaactgcccccgccacaacccaccccgctttcgtag780
ttttcatttagaaaatagagcttttaaaaatgtcctgccttttaacgtagatatatgcct840
tcccccactaccgtaaatgtccatttatatcattttttatatattcttataaaaatgtaa900
aaaagaaaaacaccgcttctgccttttcactgtgttggagttttctggagtgagcactca960
cgccctaagcgcacattcatgtgggcatttcttgcgagcctcgcagcctccggaagctgt1020
cgacttcatgacaagcattttgtgaactagggaagctcaggggggttactggcttctctt1080
gagtcacactgctagcaaatggcagaaccaaagctcaaataaaaataaaataattttcat1140
tcattcactcaaaaaaaaaaaaaa1164
<210>22
<211>522
<212>dna
<213>智人
<400>22
atgggcagggggcggtgcgtgggtcccagtctgcagttaagggggcaggagtggcgctgc60
tcacctctggtgccaaagggcggcgcagcggctgccgagctcggccctggaggcggcgag120
aacatggtgcgcaggttcttggtgaccctccggattcggcgcgcgtgcggcccgccgcga180
gtgagggttttcgtggttcacatcccgcggctcacgggggagtgggcagcgccaggggcg240
cccgccgctgtggccctcgtgctgatgctactgaggagccagcgtctagggcagcagccg300
cttcctagaagaccaggtcatgatgatgggcagcgcccgagtggcggagctgctgctgct360
ccacggcgcggagcccaactgcgccgaccccgccactctcacccgacccgtgcacgacgc420
tgcccgggagggcttcctggacacgctggtggtgctgcaccgggccggggcgcggctgga480
cgtgcgcgatgcctggggccgtctgcccgtggacctggctga522
<210>23
<211>173
<212>prt
<213>智人
<400>23
metglyargglyargcysvalglyproserleuglnleuargglygln
151015
glutrpargcysserproleuvalprolysglyglyalaalaalaala
202530
gluleuglyproglyglyglygluasnmetvalargargpheleuval
354045
thrleuargileargargalacysglyproproargvalargvalphe
505560
valvalhisileproargleuthrglyglutrpalaalaproglyala
65707580
proalaalavalalaleuvalleumetleuleuargserglnargleu
859095
glyglnglnproleuproargargproglyhisaspaspglyglnarg
100105110
proserglyglyalaalaalaalaproargargglyalaglnleuarg
115120125
argproarghisserhisprothrargalaargargcysproglygly
130135140
leuproglyhisalaglyglyalaalaproglyargglyalaalagly
145150155160
argalaargcysleuglyproseralaargglyprogly
165170
<210>24
<211>10740
<212>dna
<213>智人
<400>24
gtattggtgcagcccgccagggtgtcactggagacagaatggaggtgctgccggactcgg60
aaatggggtccaagggtagccaaggatggctgcagcttcatatgatcagttgttaaagca120
agttgaggcactgaagatggagaactcaaatcttcgacaagagctagaagataattccaa180
tcatcttacaaaactggaaactgaggcatctaatatgaaggaagtacttaaacaactaca240
aggaagtattgaagatgaagctatggcttcttctggacagattgatttattagagcgtct300
taaagagcttaacttagatagcagtaatttccctggagtaaaactgcggtcaaaaatgtc360
cctccgttcttatggaagccgggaaggatctgtatcaagccgttctggagagtgcagtcc420
tgttcctatgggttcatttccaagaagagggtttgtaaatggaagcagagaaagtactgg480
atatttagaagaacttgagaaagagaggtcattgcttcttgctgatcttgacaaagaaga540
aaaggaaaaagactggtattacgctcaacttcagaatctcactaaaagaatagatagtct600
tcctttaactgaaaatttttccttacaaacagatatgaccagaaggcaattggaatatga660
agcaaggcaaatcagagttgcgatggaagaacaactaggtacctgccaggatatggaaaa720
acgagcacagcgaagaatagccagaattcagcaaatcgaaaaggacatacttcgtatacg780
acagcttttacagtcccaagcaacagaagcagagaggtcatctcagaacaagcatgaaac840
cggctcacatgatgctgagcggcagaatgaaggtcaaggagtgggagaaatcaacatggc900
aacttctggtaatggtcagggttcaactacacgaatggaccatgaaacagccagtgtttt960
gagttctagtagcacacactctgcacctcgaaggctgacaagtcatctgggaaccaaggt1020
ggaaatggtgtattcattgttgtcaatgcttggtactcatgataaggatgatatgtcgcg1080
aactttgctagctatgtctagctcccaagacagctgtatatccatgcgacagtctggatg1140
tcttcctctcctcatccagcttttacatggcaatgacaaagactctgtattgttgggaaa1200
ttcccggggcagtaaagaggctcgggccagggccagtgcagcactccacaacatcattca1260
ctcacagcctgatgacaagagaggcaggcgtgaaatccgagtccttcatcttttggaaca1320
gatacgcgcttactgtgaaacctgttgggagtggcaggaagctcatgaaccaggcatgga1380
ccaggacaaaaatccaatgccagctcctgttgaacatcagatctgtcctgctgtgtgtgt1440
tctaatgaaactttcatttgatgaagagcatagacatgcaatgaatgaactagggggact1500
acaggccattgcagaattattgcaagtggactgtgaaatgtatgggcttactaatgacca1560
ctacagtattacactaagacgatatgctggaatggctttgacaaacttgacttttggaga1620
tgtagccaacaaggctacgctatgctctatgaaaggctgcatgagagcacttgtggccca1680
actaaaatctgaaagtgaagacttacagcaggttattgcgagtgttttgaggaatttgtc1740
ttggcgagcagatgtaaatagtaaaaagacgttgcgagaagttggaagtgtgaaagcatt1800
gatggaatgtgctttagaagttaaaaaggaatcaaccctcaaaagcgtattgagtgcctt1860
atggaatttgtcagcacattgcactgagaataaagctgatatatgtgctgtagatggtgc1920
acttgcatttttggttggcactcttacttaccggagccagacaaacactttagccattat1980
tgaaagtggaggtgggatattacggaatgtgtccagcttgatagctacaaatgaggacca2040
caggcaaatcctaagagagaacaactgtctacaaactttattacaacacttaaaatctca2100
tagtttgacaatagtcagtaatgcatgtggaactttgtggaatctctcagcaagaaatcc2160
taaagaccaggaagcattatgggacatgggggcagttagcatgctcaagaacctcattca2220
ttcaaagcacaaaatgattgctatgggaagtgctgcagctttaaggaatctcatggcaaa2280
taggcctgcgaagtacaaggatgccaatattatgtctcctggctcaagcttgccatctct2340
tcatgttaggaaacaaaaagccctagaagcagaattagatgctcagcacttatcagaaac2400
ttttgacaatatagacaatttaagtcccaaggcatctcatcgtagtaagcagagacacaa2460
gcaaagtctctatggtgattatgtttttgacaccaatcgacatgatgataataggtcaga2520
caattttaatactggcaacatgactgtcctttcaccatatttgaatactacagtgttacc2580
cagctcctcttcatcaagaggaagcttagatagttctcgttctgaaaaagatagaagttt2640
ggagagagaacgcggaattggtctaggcaactaccatccagcaacagaaaatccaggaac2700
ttcttcaaagcgaggtttgcagatctccaccactgcagcccagattgccaaagtcatgga2760
agaagtgtcagccattcatacctctcaggaagacagaagttctgggtctaccactgaatt2820
acattgtgtgacagatgagagaaatgcacttagaagaagctctgctgcccatacacattc2880
aaacacttacaatttcactaagtcggaaaattcaaataggacatgttctatgccttatgc2940
caaattagaatacaagagatcttcaaatgatagtttaaatagtgtcagtagtagtgatgg3000
ttatggtaaaagaggtcaaatgaaaccctcgattgaatcctattctgaagatgatgaaag3060
taagttttgcagttatggtcaatacccagccgacctagcccataaaatacatagtgcaaa3120
tcatatggatgataatgatggagaactagatacaccaataaattatagtcttaaatattc3180
agatgagcagttgaactctggaaggcaaagtccttcacagaatgaaagatgggcaagacc3240
caaacacataatagaagatgaaataaaacaaagtgagcaaagacaatcaaggaatcaaag3300
tacaacttatcctgtttatactgagagcactgatgataaacacctcaagttccaaccaca3360
ttttggacagcaggaatgtgtttctccatacaggtcacggggagccaatggttcagaaac3420
aaatcgagtgggttctaatcatggaattaatcaaaatgtaagccagtctttgtgtcaaga3480
agatgactatgaagatgataagcctaccaattatagtgaacgttactctgaagaagaaca3540
gcatgaagaagaagagagaccaacaaattatagcataaaatataatgaagagaaacgtca3600
tgtggatcagcctattgattatagtttaaaatatgccacagatattccttcatcacagaa3660
acagtcattttcattctcaaagagttcatctggacaaagcagtaaaaccgaacatatgtc3720
ttcaagcagtgagaatacgtccacaccttcatctaatgccaagaggcagaatcagctcca3780
tccaagttctgcacagagtagaagtggtcagcctcaaaaggctgccacttgcaaagtttc3840
ttctattaaccaagaaacaatacagacttattgtgtagaagatactccaatatgtttttc3900
aagatgtagttcattatcatctttgtcatcagctgaagatgaaataggatgtaatcagac3960
gacacaggaagcagattctgctaataccctgcaaatagcagaaataaaagaaaagattgg4020
aactaggtcagctgaagatcctgtgagcgaagttccagcagtgtcacagcaccctagaac4080
caaatccagcagactgcagggttctagtttatcttcagaatcagccaggcacaaagctgt4140
tgaattttcttcaggagcgaaatctccctccaaaagtggtgctcagacacccaaaagtcc4200
acctgaacactatgttcaggagaccccactcatgtttagcagatgtacttctgtcagttc4260
acttgatagttttgagagtcgttcgattgccagctccgttcagagtgaaccatgcagtgg4320
aatggtaagtggcattataagccccagtgatcttccagatagccctggacaaaccatgcc4380
accaagcagaagtaaaacacctccaccacctcctcaaacagctcaaaccaagcgagaagt4440
acctaaaaataaagcacctactgctgaaaagagagagagtggacctaagcaagctgcagt4500
aaatgctgcagttcagagggtccaggttcttccagatgctgatactttattacattttgc4560
cacggaaagtactccagatggattttcttgttcatccagcctgagtgctctgagcctcga4620
tgagccatttatacagaaagatgtggaattaagaataatgcctccagttcaggaaaatga4680
caatgggaatgaaacagaatcagagcagcctaaagaatcaaatgaaaaccaagagaaaga4740
ggcagaaaaaactattgattctgaaaaggacctattagatgattcagatgatgatgatat4800
tgaaatactagaagaatgtattatttctgccatgccaacaaagtcatcacgtaaagcaaa4860
aaagccagcccagactgcttcaaaattacctccacctgtggcaaggaaaccaagtcagct4920
gcctgtgtacaaacttctaccatcacaaaacaggttgcaaccccaaaagcatgttagttt4980
tacaccgggggatgatatgccacgggtgtattgtgttgaagggacacctataaacttttc5040
cacagctacatctctaagtgatctaacaatcgaatcccctccaaatgagttagctgctgg5100
agaaggagttagaggaggggcacagtcaggtgaatttgaaaaacgagataccattcctac5160
agaaggcagaagtacagatgaggctcaaggaggaaaaacctcatctgtaaccatacctga5220
attggatgacaataaagcagaggaaggtgatattcttgcagaatgcattaattctgctat5280
gcccaaagggaaaagtcacaagcctttccgtgtgaaaaagataatggaccaggtccagca5340
agcatctgcgtcttcttctgcacccaacaaaaatcagttagatggtaagaaaaagaaacc5400
aacttcaccagtaaaacctataccacaaaatactgaatataggacacgtgtaagaaaaaa5460
tgcagactcaaaaaataatttaaatgctgagagagttttctcagacaacaaagattcaaa5520
gaaacagaatttgaaaaataattccaaggtcttcaatgataagctcccaaataatgaaga5580
tagagtcagaggaagttttgcttttgattcacctcatcattacacgcctattgaaggaac5640
tccttactgtttttcacgaaatgattctttgagttctctagattttgatgatgatgatgt5700
tgacctttccagggaaaaggctgaattaagaaaggcaaaagaaaataaggaatcagaggc5760
taaagttaccagccacacagaactaacctccaaccaacaatcagctaataagacacaagc5820
tattgcaaagcagccaataaatcgaggtcagcctaaacccatacttcagaaacaatccac5880
ttttccccagtcatccaaagacataccagacagaggggcagcaactgatgaaaagttaca5940
gaattttgctattgaaaatactccggtttgcttttctcataattcctctctgagttctct6000
cagtgacattgaccaagaaaacaacaataaagaaaatgaacctatcaaagagactgagcc6060
ccctgactcacagggagaaccaagtaaacctcaagcatcaggctatgctcctaaatcatt6120
tcatgttgaagataccccagtttgtttctcaagaaacagttctctcagttctcttagtat6180
tgactctgaagatgacctgttgcaggaatgtataagctccgcaatgccaaaaaagaaaaa6240
gccttcaagactcaagggtgataatgaaaaacatagtcccagaaatatgggtggcatatt6300
aggtgaagatctgacacttgatttgaaagatatacagagaccagattcagaacatggtct6360
atcccctgattcagaaaattttgattggaaagctattcaggaaggtgcaaattccatagt6420
aagtagtttacatcaagctgctgctgctgcatgtttatctagacaagcttcgtctgattc6480
agattccatcctttccctgaaatcaggaatctctctgggatcaccatttcatcttacacc6540
tgatcaagaagaaaaaccctttacaagtaataaaggcccacgaattctaaaaccagggga6600
gaaaagtacattggaaactaaaaagatagaatctgaaagtaaaggaatcaaaggaggaaa6660
aaaagtttataaaagtttgattactggaaaagttcgatctaattcagaaatttcaggcca6720
aatgaaacagccccttcaagcaaacatgccttcaatctctcgaggcaggacaatgattca6780
tattccaggagttcgaaatagctcctcaagtacaagtcctgtttctaaaaaaggcccacc6840
ccttaagactccagcctccaaaagccctagtgaaggtcaaacagccaccacttctcctag6900
aggagccaagccatctgtgaaatcagaattaagccctgttgccaggcagacatcccaaat6960
aggtgggtcaagtaaagcaccttctagatcaggatctagagattcgaccccttcaagacc7020
tgcccagcaaccattaagtagacctatacagtctcctggccgaaactcaatttcccctgg7080
tagaaatggaataagtcctcctaacaaattatctcaacttccaaggacatcatcccctag7140
tactgcttcaactaagtcctcaggttctggaaaaatgtcatatacatctccaggtagaca7200
gatgagccaacagaaccttaccaaacaaacaggtttatccaagaatgccagtagtattcc7260
aagaagtgagtctgcctccaaaggactaaatcagatgaataatggtaatggagccaataa7320
aaaggtagaactttctagaatgtcttcaactaaatcaagtggaagtgaatctgatagatc7380
agaaagacctgtattagtacgccagtcaactttcatcaaagaagctccaagcccaacctt7440
aagaagaaaattggaggaatctgcttcatttgaatctctttctccatcatctagaccagc7500
ttctcccactaggtcccaggcacaaactccagttttaagtccttcccttcctgatatgtc7560
tctatccacacattcgtctgttcaggctggtggatggcgaaaactcccacctaatctcag7620
tcccactatagagtataatgatggaagaccagcaaagcgccatgatattgcacggtctca7680
ttctgaaagtccttctagacttccaatcaataggtcaggaacctggaaacgtgagcacag7740
caaacattcatcatcccttcctcgagtaagcacttggagaagaactggaagttcatcttc7800
aattctttctgcttcatcagaatccagtgaaaaagcaaaaagtgaggatgaaaaacatgt7860
gaactctatttcaggaaccaaacaaagtaaagaaaaccaagtatccgcaaaaggaacatg7920
gagaaaaataaaagaaaatgaattttctcccacaaatagtacttctcagaccgtttcctc7980
aggtgctacaaatggtgctgaatcaaagactctaatttatcaaatggcacctgctgtttc8040
taaaacagaggatgtttgggtgagaattgaggactgtcccattaacaatcctagatctgg8100
aagatctcccacaggtaatactcccccggtgattgacagtgtttcagaaaaggcaaatcc8160
aaacattaaagattcaaaagataatcaggcaaaacaaaatgtgggtaatggcagtgttcc8220
catgcgtaccgtgggtttggaaaatcgcctgaactcctttattcaggtggatgcccctga8280
ccaaaaaggaactgagataaaaccaggacaaaataatcctgtccctgtatcagagactaa8340
tgaaagttctatagtggaacgtaccccattcagttctagcagctcaagcaaacacagttc8400
acctagtgggactgttgctgccagagtgactccttttaattacaacccaagccctaggaa8460
aagcagcgcagatagcacttcagctcggccatctcagatcccaactccagtgaataacaa8520
cacaaagaagcgagattccaaaactgacagcacagaatccagtggaacccaaagtcctaa8580
gcgccattctgggtcttaccttgtgacatctgtttaaaagagaggaagaatgaaactaag8640
aaaattctatgttaattacaactgctatatagacattttgtttcaaatgaaactttaaaa8700
gactgaaaaattttgtaaataggtttgattcttgttagagggtttttgttctggaagcca8760
tatttgatagtatactttgtcttcactggtcttattttgggaggcactcttgatggttag8820
gaaaaaaatagtaaagccaagtatgtttgtacagtatgttttacatgtatttaaagtagc8880
atcccatcccaacttcctttaattattgcttgtcttaaaataatgaacactacagataga8940
aaatatgatatattgctgttatcaatcatttctagattataaactgactaaacttacatc9000
agggaaaaattggtatttatgcaaaaaaaaatgtttttgtccttgtgagtccatctaaca9060
tcataattaatcatgtggctgtgaaattcacagtaatatggttcccgatgaacaagttta9120
cccagcctgctttgctttactgcatgaatgaaactgatggttcaatttcagaagtaatga9180
ttaacagttatgtggtcacatgatgtgcatagagatagctacagtgtaataatttacact9240
attttgtgctccaaacaaaacaaaaatctgtgtaactgtaaaacattgaatgaaactatt9300
ttacctgaactagattttatctgaaagtaggtagaatttttgctatgctgtaatttgttg9360
tatattctggtatttgaggtgagatggctgctcttttattaatgagacatgaattgtgtc9420
tcaacagaaactaaatgaacatttcagaataaattattgctgtatgtaaactgttactga9480
aattggtatttgtttgaagggtcttgtttcacatttgtattaataattgtttaaaatgcc9540
tcttttaaaagcttatataaatttttttcttcagcttctatgcattaagagtaaaattcc9600
tcttactgtaataaaaacaattgaagaagactgttgccacttaaccattccatgcgttgg9660
cacttatctattcctgaaatttcttttatgtgattagctcatcttgatttttaatatttt9720
tccacttaaacttttttttcttactccactggagctcagtaaaagtaaattcatgtaata9780
gcaatgcaagcagcctagcacagactaagcattgagcataataggcccacataatttcct9840
ctttcttaatattatagaattctgtacttgaaattgattcttagacattgcagtctcttc9900
gaggctttacagtgtaaactgtcttgccccttcatcttcttgttgcaactgggtctgaca9960
tgaacactttttatcaccctgtatgttagggcaagatctcagcagtgaagtataatcagc10020
actttgccatgctcagaaaattcaaatcacatggaactttagaggtagatttaatacgat10080
taagatattcagaagtatattttagaatccctgcctgttaaggaaactttatttgtggta10140
ggtacagttctggggtacatgttaagtgtccccttatacagtggagggaagtcttccttc10200
ctgaaggaaaataaactgacacttattaactaagataatttacttaatatatcttccctg10260
atttgttttaaaagatcagagggtgactgatgatacatgcatacatatttgttgaataaa10320
tgaaaatttatttttagtgataagattcatacactctgtatttggggagggaaaaccttt10380
ttaagcatggtggggcactcagataggagtgaatacacctacctggtgccttgaaaatca10440
catcaagtagttaattatctaccccttacctgtgtttataacttccaggtaatgagaatg10500
attttttttaaagctaaaatgccagtaaataaaagtgctatgacttgagctaagatattt10560
gactccaatgcctgtactgtgtctactgcaccactttgtaaacacttcaatttactatct10620
ttgaaatgattgacctttaaatttttgccaaatgttatctgaaattgtctatgaatacca10680
tctacttctgttgttttcccaggcttccataaacaatggagatacatgcaaaaaaaaaaa10740
<210>25
<211>8532
<212>dna
<213>智人
<400>25
atggctgcagcttcatatgatcagttgttaaagcaagttgaggcactgaagatggagaac60
tcaaatcttcgacaagagctagaagataattccaatcatcttacaaaactggaaactgag120
gcatctaatatgaaggaagtacttaaacaactacaaggaagtattgaagatgaagctatg180
gcttcttctggacagattgatttattagagcgtcttaaagagcttaacttagatagcagt240
aatttccctggagtaaaactgcggtcaaaaatgtccctccgttcttatggaagccgggaa300
ggatctgtatcaagccgttctggagagtgcagtcctgttcctatgggttcatttccaaga360
agagggtttgtaaatggaagcagagaaagtactggatatttagaagaacttgagaaagag420
aggtcattgcttcttgctgatcttgacaaagaagaaaaggaaaaagactggtattacgct480
caacttcagaatctcactaaaagaatagatagtcttcctttaactgaaaatttttcctta540
caaacagatatgaccagaaggcaattggaatatgaagcaaggcaaatcagagttgcgatg600
gaagaacaactaggtacctgccaggatatggaaaaacgagcacagcgaagaatagccaga660
attcagcaaatcgaaaaggacatacttcgtatacgacagcttttacagtcccaagcaaca720
gaagcagagaggtcatctcagaacaagcatgaaaccggctcacatgatgctgagcggcag780
aatgaaggtcaaggagtgggagaaatcaacatggcaacttctggtaatggtcagggttca840
actacacgaatggaccatgaaacagccagtgttttgagttctagtagcacacactctgca900
cctcgaaggctgacaagtcatctgggaaccaaggtggaaatggtgtattcattgttgtca960
atgcttggtactcatgataaggatgatatgtcgcgaactttgctagctatgtctagctcc1020
caagacagctgtatatccatgcgacagtctggatgtcttcctctcctcatccagctttta1080
catggcaatgacaaagactctgtattgttgggaaattcccggggcagtaaagaggctcgg1140
gccagggccagtgcagcactccacaacatcattcactcacagcctgatgacaagagaggc1200
aggcgtgaaatccgagtccttcatcttttggaacagatacgcgcttactgtgaaacctgt1260
tgggagtggcaggaagctcatgaaccaggcatggaccaggacaaaaatccaatgccagct1320
cctgttgaacatcagatctgtcctgctgtgtgtgttctaatgaaactttcatttgatgaa1380
gagcatagacatgcaatgaatgaactagggggactacaggccattgcagaattattgcaa1440
gtggactgtgaaatgtacgggcttactaatgaccactacagtattacactaagacgatat1500
gctggaatggctttgacaaacttgacttttggagatgtagccaacaaggctacgctatgc1560
tctatgaaaggctgcatgagagcacttgtggcccaactaaaatctgaaagtgaagactta1620
cagcaggttattgcaagtgttttgaggaatttgtcttggcgagcagatgtaaatagtaaa1680
aagacgttgcgagaagttggaagtgtgaaagcattgatggaatgtgctttagaagttaaa1740
aaggaatcaaccctcaaaagcgtattgagtgccttatggaatttgtcagcacattgcact1800
gagaataaagctgatatatgtgctgtagatggtgcacttgcatttttggttggcactctt1860
acttaccggagccagacaaacactttagccattattgaaagtggaggtgggatattacgg1920
aatgtgtccagcttgatagctacaaatgaggaccacaggcaaatcctaagagagaacaac1980
tgtctacaaactttattacaacacttaaaatctcatagtttgacaatagtcagtaatgca2040
tgtggaactttgtggaatctctcagcaagaaatcctaaagaccaggaagcattatgggac2100
atgggggcagttagcatgctcaagaacctcattcattcaaagcacaaaatgattgctatg2160
ggaagtgctgcagctttaaggaatctcatggcaaataggcctgcgaagtacaaggatgcc2220
aatattatgtctcctggctcaagcttgccatctcttcatgttaggaaacaaaaagcccta2280
gaagcagaattagatgctcagcacttatcagaaacttttgacaatatagacaatttaagt2340
cccaaggcatctcatcgtagtaagcagagacacaagcaaagtctctatggtgattatgtt2400
tttgacaccaatcgacatgatgataataggtcagacaattttaatactggcaacatgact2460
gtcctttcaccatatttgaatactacagtgttacccagctcctcttcatcaagaggaagc2520
ttagatagttctcgttctgaaaaagatagaagtttggagagagaacgcggaattggtcta2580
ggcaactaccatccagcaacagaaaatccaggaacttcttcaaagcgaggtttgcagatc2640
tccaccactgcagcccagattgccaaagtcatggaagaagtgtcagccattcatacctct2700
caggaagacagaagttctgggtctaccactgaattacattgtgtgacagatgagagaaat2760
gcacttagaagaagctctgctgcccatacacattcaaacacttacaatttcactaagtcg2820
gaaaattcaaataggacatgttctatgccttatgccaaattagaatacaagagatcttca2880
aatgatagtttaaatagtgtcagtagtagtgatggttatggtaaaagaggtcaaatgaaa2940
ccctcgattgaatcctattctgaagatgatgaaagtaagttttgcagttatggtcaatac3000
ccagccgacctagcccataaaatacatagtgcaaatcatatggatgataatgatggagaa3060
ctagatacaccaataaattatagtcttaaatattcagatgagcagttgaactctggaagg3120
caaagtccttcacagaatgaaagatgggcaagacccaaacacataatagaagatgaaata3180
aaacaaagtgagcaaagacaatcaaggaatcaaagtacaacttatcctgtttatactgag3240
agcactgatgataaacacctcaagttccaaccacattttggacagcaggaatgtgtttct3300
ccatacaggtcacggggagccaatggttcagaaacaaatcgagtgggttctaatcatgga3360
attaatcaaaatgtaagccagtctttgtgtcaagaagatgactatgaagatgataagcct3420
accaattatagtgaacgttactctgaagaagaacagcatgaagaagaagagagaccaaca3480
aattatagcataaaatataatgaagagaaacgtcatgtggatcagcctattgattatagt3540
ttaaaatatgccacagatattccttcatcacagaaacagtcattttcattctcaaagagt3600
tcatctggacaaagcagtaaaaccgaacatatgtcttcaagcagtgagaatacgtccaca3660
ccttcatctaatgccaagaggcagaatcagctccatccaagttctgcacagagtagaagt3720
ggtcagcctcaaaaggctgccacttgcaaagtttcttctattaaccaagaaacaatacag3780
acttattgtgtagaagatactccaatatgtttttcaagatgtagttcattatcatctttg3840
tcatcagctgaagatgaaataggatgtaatcagacgacacaggaagcagattctgctaat3900
accctgcaaatagcagaaataaaagaaaagattggaactaggtcagctgaagatcctgtg3960
agcgaagttccagcagtgtcacagcaccctagaaccaaatccagcagactgcagggttct4020
agtttatcttcagaatcagccaggcacaaagctgttgaattttcttcaggagcgaaatct4080
ccctccaaaagtggtgctcagacacccaaaagtccacctgaacactatgttcaggagacc4140
ccactcatgtttagcagatgtacttctgtcagttcacttgatagttttgagagtcgttcg4200
attgccagctccgttcagagtgaaccatgcagtggaatggtaagtggcattataagcccc4260
agtgatcttccagatagccctggacaaaccatgccaccaagcagaagtaaaacacctcca4320
ccacctcctcaaacagctcaaaccaagcgagaagtacctaaaaataaagcacctactgct4380
gaaaagagagagagtggacctaagcaagctgcagtaaatgctgcagttcagagggtccag4440
gttcttccagatgctgatactttattacattttgccacggaaagtactccagatggattt4500
tcttgttcatccagcctgagtgctctgagcctcgatgagccatttatacagaaagatgtg4560
gaattaagaataatgcctccagttcaggaaaatgacaatgggaatgaaacagaatcagag4620
cagcctaaagaatcaaatgaaaaccaagagaaagaggcagaaaaaactattgattctgaa4680
aaggacctattagatgattcagatgatgatgatattgaaatactagaagaatgtattatt4740
tctgccatgccaacaaagtcatcacgtaaagcaaaaaagccagcccagactgcttcaaaa4800
ttacctccacctgtggcaaggaaaccaagtcagctgcctgtgtacaaacttctaccatca4860
caaaacaggttgcaaccccaaaagcatgttagttttacaccgggggatgatatgccacgg4920
gtgtattgtgttgaagggacacctataaacttttccacagctacatctctaagtgatcta4980
acaatcgaatcccctccaaatgagttagctgctggagaaggagttagaggaggagcacag5040
tcaggtgaatttgaaaaacgagataccattcctacagaaggcagaagtacagatgaggct5100
caaggaggaaaaacctcatctgtaaccatacctgaattggatgacaataaagcagaggaa5160
ggtgatattcttgcagaatgcattaattctgctatgcccaaagggaaaagtcacaagcct5220
ttccgtgtgaaaaagataatggaccaggtccagcaagcatctgcgtcgtcttctgcaccc5280
aacaaaaatcagttagatggtaagaaaaagaaaccaacttcaccagtaaaacctatacca5340
caaaatactgaatataggacacgtgtaagaaaaaatgcagactcaaaaaataatttaaat5400
gctgagagagttttctcagacaacaaagattcaaagaaacagaatttgaaaaataattcc5460
aaggacttcaatgataagctcccaaataatgaagatagagtcagaggaagttttgctttt5520
gattcacctcatcattacacgcctattgaaggaactccttactgtttttcacgaaatgat5580
tctttgagttctctagattttgatgatgatgatgttgacctttccagggaaaaggctgaa5640
ttaagaaaggcaaaagaaaataaggaatcagaggctaaagttaccagccacacagaacta5700
acctccaaccaacaatcagctaataagacacaagctattgcaaagcagccaataaatcga5760
ggtcagcctaaacccatacttcagaaacaatccacttttccccagtcatccaaagacata5820
ccagacagaggggcagcaactgatgaaaagttacagaattttgctattgaaaatactcca5880
gtttgcttttctcataattcctctctgagttctctcagtgacattgaccaagaaaacaac5940
aataaagaaaatgaacctatcaaagagactgagccccctgactcacagggagaaccaagt6000
aaacctcaagcatcaggctatgctcctaaatcatttcatgttgaagataccccagtttgt6060
ttctcaagaaacagttctctcagttctcttagtattgactctgaagatgacctgttgcag6120
gaatgtataagctccgcaatgccaaaaaagaaaaagccttcaagactcaagggtgataat6180
gaaaaacatagtcccagaaatatgggtggcatattaggtgaagatctgacacttgatttg6240
aaagatatacagagaccagattcagaacatggtctatcccctgattcagaaaattttgat6300
tggaaagctattcaggaaggtgcaaattccatagtaagtagtttacatcaagctgctgct6360
gctgcatgtttatctagacaagcttcgtctgattcagattccatcctttccctgaaatca6420
ggaatctctctgggatcaccatttcatcttacacctgatcaagaagaaaaaccctttaca6480
agtaataaaggcccacgaattctaaaaccaggggagaaaagtacattggaaactaaaaag6540
atagaatctgaaagtaaaggaatcaaaggaggaaaaaaagtttataaaagtttgattact6600
ggaaaagttcgatctaattcagaaatttcaggccaaatgaaacagccccttcaagcaaac6660
atgccttcaatctctcgaggcaggacaatgattcatattccaggagttcgaaatagctcc6720
tcaagtacaagtcctgtttctaaaaaaggcccaccccttaagactccagcctccaaaagc6780
cctagtgaaggtcaaacagccaccacttctcctagaggagccaagccatctgtgaaatca6840
gaattaagccctgttgccaggcagacatcccaaataggtgggtcaagtaaagcaccttct6900
agatcaggatctagagattcgaccccttcaagacctgcccagcaaccattaagtagacct6960
atacagtctcctggccgaaactcaatttcccctggtagaaatggaataagtcctcctaac7020
aaattatctcaacttccaaggacatcatcccctagtactgcttcaactaagtcctcaggt7080
tctggaaaaatgtcatatacatctccaggtagacagatgagccaacagaaccttaccaaa7140
caaacaggtttatccaagaatgccagtagtattccaagaagtgagtctgcctccaaagga7200
ctaaatcagatgaataatggtaatggagccaataaaaaggtagaactttctagaatgtct7260
tcaactaaatcaagtggaagtgaatctgatagatcagaaagacctgtattagtacgccag7320
tcaactttcatcaaagaagctccaagcccaaccttaagaagaaaattggaggaatctgct7380
tcatttgaatctctttctccatcatctagaccagcttctcccactaggtcccaggcacaa7440
actccagttttaagtccttcccttcctgatatgtctctatccacacattcgtctgttcag7500
gctggtggatggcgaaaactcccacctaatctcagtcccactatagagtataatgatgga7560
agaccagcaaagcgccatgatattgcacggtctcattctgaaagtccttctagacttcca7620
atcaataggtcaggaacctggaaacgtgagcacagcaaacattcatcatcccttcctcga7680
gtaagcacttggagaagaactggaagttcatcttcaattctttctgcttcatcagaatcc7740
agtgaaaaagcaaaaagtgaggatgaaaaacatgtgaactctatttcaggaaccaaacaa7800
agtaaagaaaaccaagtatccgcaaaaggaacatggagaaaaataaaagaaaatgaattt7860
tctcccacaaatagtacttctcagaccgtttcctcaggtgctacaaatggtgctgaatca7920
aagactctaatttatcaaatggcacctgctgtttctaaaacagaggatgtttgggtgaga7980
attgaggactgtcccattaacaatcctagatctggaagatctcccacaggtaatactccc8040
ccggtgattgacagtgtttcagaaaaggcaaatccaaacattaaagattcaaaagataat8100
caggcaaaacaaaatgtgggtaatggcagtgttcccatgcgtaccgtgggtttggaaaat8160
cgcctgaactcctttattcaggtggatgcccctgaccaaaaaggaactgagataaaacca8220
ggacaaaataatcctgtccctgtatcagagactaatgaaagttctatagtggaacgtacc8280
ccattcagttctagcagctcaagcaaacacagttcacctagtgggactgttgctgccaga8340
gtgactccttttaattacaacccaagccctaggaaaagcagcgcagatagcacttcagct8400
cggccatctcagatcccaactccagtgaataacaacacaaagaagcgagattccaaaact8460
gacagcacagaatccagtggaacccaaagtcctaagcgccattctgggtcttaccttgtg8520
acatctgtttaa8532
<210>26
<211>2843
<212>prt
<213>智人
<400>26
metalaalaalasertyraspglnleuleulysglnvalglualaleu
151015
lysmetgluasnserasnleuargglngluleugluaspasnserasn
202530
hisleuthrlysleugluthrglualaserasnmetlysgluvalleu
354045
lysglnleuglnglyserilegluaspglualametalasersergly
505560
glnileaspleuleugluargleulysgluleuasnleuaspserser
65707580
asnpheproglyvallysleuargserlysmetserleuargsertyr
859095
glyserarggluglyservalserserargserglyglucysserpro
100105110
valprometglyserpheproargargglyphevalasnglyserarg
115120125
gluserthrglytyrleuglugluleuglulysgluargserleuleu
130135140
leualaaspleuasplysgluglulysglulysasptrptyrtyrala
145150155160
glnleuglnasnleuthrlysargileaspserleuproleuthrglu
165170175
asnpheserleuglnthraspmetthrargargglnleuglutyrglu
180185190
alaargglnileargvalalametglugluglnleuglythrcysgln
195200205
aspmetglulysargalaglnargargilealaargileglnglnile
210215220
glulysaspileleuargileargglnleuleuglnserglnalathr
225230235240
glualagluargserserglnasnlyshisgluthrglyserhisasp
245250255
alagluargglnasngluglyglnglyvalglygluileasnmetala
260265270
thrserglyasnglyglnglyserthrthrargmetasphisgluthr
275280285
alaservalleuserserserserthrhisseralaproargargleu
290295300
thrserhisleuglythrlysvalglumetvaltyrserleuleuser
305310315320
metleuglythrhisasplysaspaspmetserargthrleuleuala
325330335
metserserserglnaspsercysilesermetargglnserglycys
340345350
leuproleuleuileglnleuleuhisglyasnasplysaspserval
355360365
leuleuglyasnserargglyserlysglualaargalaargalaser
370375380
alaalaleuhisasnileilehisserglnproaspasplysarggly
385390395400
argarggluileargvalleuhisleuleugluglnileargalatyr
405410415
cysgluthrcystrpglutrpglnglualahisgluproglymetasp
420425430
glnasplysasnprometproalaprovalgluhisglnilecyspro
435440445
alavalcysvalleumetlysleuserpheaspglugluhisarghis
450455460
alametasngluleuglyglyleuglnalailealagluleuleugln
465470475480
valaspcysglumettyrglyleuthrasnasphistyrserilethr
485490495
leuargargtyralaglymetalaleuthrasnleuthrpheglyasp
500505510
valalaasnlysalathrleucyssermetlysglycysmetargala
515520525
leuvalalaglnleulysserglusergluaspleuglnglnvalile
530535540
alaservalleuargasnleusertrpargalaaspvalasnserlys
545550555560
lysthrleuarggluvalglyservallysalaleumetglucysala
565570575
leugluvallyslysgluserthrleulysservalleuseralaleu
580585590
trpasnleuseralahiscysthrgluasnlysalaaspilecysala
595600605
valaspglyalaleualapheleuvalglythrleuthrtyrargser
610615620
glnthrasnthrleualaileilegluserglyglyglyileleuarg
625630635640
asnvalserserleuilealathrasngluasphisargglnileleu
645650655
arggluasnasncysleuglnthrleuleuglnhisleulysserhis
660665670
serleuthrilevalserasnalacysglythrleutrpasnleuser
675680685
alaargasnprolysaspglnglualaleutrpaspmetglyalaval
690695700
sermetleulysasnleuilehisserlyshislysmetilealamet
705710715720
glyseralaalaalaleuargasnleumetalaasnargproalalys
725730735
tyrlysaspalaasnilemetserproglyserserleuproserleu
740745750
hisvalarglysglnlysalaleuglualagluleuaspalaglnhis
755760765
leusergluthrpheaspasnileaspasnleuserprolysalaser
770775780
hisargserlysglnarghislysglnserleutyrglyasptyrval
785790795800
pheaspthrasnarghisaspaspasnargseraspasnpheasnthr
805810815
glyasnmetthrvalleuserprotyrleuasnthrthrvalleupro
820825830
serserserserserargglyserleuaspserserargserglulys
835840845
aspargserleugluarggluargglyileglyleuglyasntyrhis
850855860
proalathrgluasnproglythrserserlysargglyleuglnile
865870875880
serthrthralaalaglnilealalysvalmetglugluvalserala
885890895
ilehisthrserglngluaspargserserglyserthrthrgluleu
900905910
hiscysvalthraspgluargasnalaleuargargserseralaala
915920925
histhrhisserasnthrtyrasnphethrlyssergluasnserasn
930935940
argthrcyssermetprotyralalysleuglutyrlysargserser
945950955960
asnaspserleuasnservalserserseraspglytyrglylysarg
965970975
glyglnmetlysproserileglusertyrsergluaspaspgluser
980985990
lysphecyssertyrglyglntyrproalaaspleualahislysile
99510001005
hisseralaasnhismetaspaspasnaspglygluleuaspthrpro
101010151020
ileasntyrserleulystyrseraspgluglnleuasnserglyarg
1025103010351040
glnserproserglnasngluargtrpalaargprolyshisileile
104510501055
gluaspgluilelysglnsergluglnargglnserargasnglnser
106010651070
thrthrtyrprovaltyrthrgluserthraspasplyshisleulys
107510801085
pheglnprohispheglyglnglnglucysvalserprotyrargser
109010951100
argglyalaasnglysergluthrasnargvalglyserasnhisgly
1105111011151120
ileasnglnasnvalserglnserleucysglngluaspasptyrglu
112511301135
aspasplysprothrasntyrsergluargtyrserglugluglugln
114011451150
hisglugluglugluargprothrasntyrserilelystyrasnglu
115511601165
glulysarghisvalaspglnproileasptyrserleulystyrala
117011751180
thraspileproserserglnlysglnserpheserpheserlysser
1185119011951200
serserglyglnserserlysthrgluhismetserserserserglu
120512101215
asnthrserthrproserserasnalalysargglnasnglnleuhis
122012251230
proserseralaglnserargserglyglnproglnlysalaalathr
123512401245
cyslysvalserserileasnglngluthrileglnthrtyrcysval
125012551260
gluaspthrproilecyspheserargcysserserleuserserleu
1265127012751280
serseralagluaspgluileglycysasnglnthrthrglngluala
128512901295
aspseralaasnthrleuglnilealagluilelysglulysilegly
130013051310
thrargseralagluaspprovalsergluvalproalavalsergln
131513201325
hisproargthrlysserserargleuglnglyserserleuserser
133013351340
gluseralaarghislysalavalglupheserserglyalalysser
1345135013551360
proserlysserglyalaglnthrprolysserproprogluhistyr
136513701375
valglngluthrproleumetpheserargcysthrservalserser
138013851390
leuaspserphegluserargserilealaserservalglnserglu
139514001405
procysserglymetvalserglyileileserproseraspleupro
141014151420
aspserproglyglnthrmetproproserargserlysthrpropro
1425143014351440
proproproglnthralaglnthrlysarggluvalprolysasnlys
144514501455
alaprothralaglulysarggluserglyprolysglnalaalaval
146014651470
asnalaalavalglnargvalglnvalleuproaspalaaspthrleu
147514801485
leuhisphealathrgluserthrproaspglyphesercysserser
149014951500
serleuseralaleuserleuaspglupropheileglnlysaspval
1505151015151520
gluleuargilemetproprovalglngluasnaspasnglyasnglu
152515301535
thrglusergluglnprolysgluserasngluasnglnglulysglu
154015451550
alaglulysthrileaspserglulysaspleuleuaspaspserasp
155515601565
aspaspaspilegluileleugluglucysileileseralametpro
157015751580
thrlysserserarglysalalyslysproalaglnthralaserlys
1585159015951600
leuproproprovalalaarglysproserglnleuprovaltyrlys
160516101615
leuleuproserglnasnargleuglnproglnlyshisvalserphe
162016251630
thrproglyaspaspmetproargvaltyrcysvalgluglythrpro
163516401645
ileasnpheserthralathrserleuseraspleuthrilegluser
165016551660
proproasngluleualaalaglygluglyvalargglyglyalagln
1665167016751680
serglyglupheglulysargaspthrileprothrgluglyargser
168516901695
thraspglualaglnglyglylysthrserservalthrileproglu
170017051710
leuaspaspasnlysalaglugluglyaspileleualaglucysile
171517201725
asnseralametprolysglylysserhislyspropheargvallys
173017351740
lysilemetaspglnvalglnglnalaseralaserserseralapro
1745175017551760
asnlysasnglnleuaspglylyslyslyslysprothrserproval
176517701775
lysproileproglnasnthrglutyrargthrargvalarglysasn
178017851790
alaaspserlysasnasnleuasnalagluargvalpheseraspasn
179518001805
lysaspserlyslysglnasnleulysasnasnserlysvalpheasn
181018151820
asplysleuproasnasngluaspargvalargglyserphealaphe
1825183018351840
aspserprohishistyrthrproilegluglythrprotyrcysphe
184518501855
serargasnaspserleuserserleuasppheaspaspaspaspval
186018651870
aspleuserargglulysalagluleuarglysalalysgluasnlys
187518801885
gluserglualalysvalthrserhisthrgluleuthrserasngln
189018951900
glnseralaasnlysthrglnalailealalysglnproileasnarg
1905191019151920
glyglnprolysproileleuglnlysglnserthrpheproglnser
192519301935
serlysaspileproaspargglyalaalathraspglulysleugln
194019451950
asnphealailegluasnthrprovalcyspheserhisasnserser
195519601965
leuserserleuseraspileaspglngluasnasnasnlysgluasn
197019751980
gluproilelysgluthrgluproproaspserglnglygluproser
1985199019952000
lysproglnalaserglytyralaprolysserphehisvalgluasp
200520102015
thrprovalcyspheserargasnserserleuserserleuserile
202020252030
aspsergluaspaspleuleuglnglucysileserseralametpro
203520402045
lyslyslyslysproserargleulysglyaspasnglulyshisser
205020552060
proargasnmetglyglyileleuglygluaspleuthrleuaspleu
2065207020752080
lysaspileglnargproaspsergluhisglyleuserproaspser
208520902095
gluasnpheasptrplysalaileglngluglyalaasnserileval
210021052110
serserleuhisglnalaalaalaalaalacysleuserargglnala
211521202125
serseraspseraspserileleuserleulysserglyileserleu
213021352140
glyserprophehisleuthrproaspglngluglulysprophethr
2145215021552160
serasnlysglyproargileleulysproglyglulysserthrleu
216521702175
gluthrlyslysileglusergluserlysglyilelysglyglylys
218021852190
lysvaltyrlysserleuilethrglylysvalargserasnserglu
219522002205
ileserglyglnmetlysglnproleuglnalaasnmetproserile
221022152220
serargglyargthrmetilehisileproglyvalargasnserser
2225223022352240
serserthrserprovalserlyslysglyproproleulysthrpro
224522502255
alaserlysserprosergluglyglnthralathrthrserproarg
226022652270
glyalalysproservallyssergluleuserprovalalaarggln
227522802285
thrserglnileglyglyserserlysalaproserargserglyser
229022952300
argaspserthrproserargproalaglnglnproleuserargpro
2305231023152320
ileglnserproglyargasnserileserproglyargasnglyile
232523302335
serproproasnlysleuserglnleuproargthrserserproser
234023452350
thralaserthrlysserserglyserglylysmetsertyrthrser
235523602365
proglyargglnmetserglnglnasnleuthrlysglnthrglyleu
237023752380
serlysasnalaserserileproargsergluseralaserlysgly
2385239023952400
leuasnglnmetasnasnglyasnglyalaasnlyslysvalgluleu
240524102415
serargmetserserthrlysserserglysergluseraspargser
242024252430
gluargprovalleuvalargglnserthrpheilelysglualapro
243524402445
serprothrleuargarglysleuglugluseralaserphegluser
245024552460
leuserproserserargproalaserprothrargserglnalagln
2465247024752480
thrprovalleuserproserleuproaspmetserleuserthrhis
248524902495
serservalglnalaglyglytrparglysleuproproasnleuser
250025052510
prothrileglutyrasnaspglyargproalalysarghisaspile
251525202525
alaargserhissergluserproserargleuproileasnargser
253025352540
glythrtrplysarggluhisserlyshisserserserleuproarg
2545255025552560
valserthrtrpargargthrglyserserserserileleuserala
256525702575
sersergluserserglulysalalyssergluaspglulyshisval
258025852590
asnserileserglythrlysglnserlysgluasnglnvalserala
259526002605
lysglythrtrparglysilelysgluasnglupheserprothrasn
261026152620
serthrserglnthrvalserserglyalathrasnglyalagluser
2625263026352640
lysthrleuiletyrglnmetalaproalavalserlysthrgluasp
264526502655
valtrpvalargilegluaspcysproileasnasnproargsergly
266026652670
argserprothrglyasnthrproprovalileaspservalserglu
267526802685
lysalaasnproasnilelysaspserlysaspasnglnalalysgln
269026952700
asnvalglyasnglyservalprometargthrvalglyleugluasn
2705271027152720
argleuasnserpheileglnvalaspalaproaspglnlysglythr
272527302735
gluilelysproglyglnasnasnprovalprovalsergluthrasn
274027452750
gluserserilevalgluargthrpropheserserserserserser
275527602765
lyshisserserproserglythrvalalaalaargvalthrprophe
277027752780
asntyrasnproserproarglysserseralaaspserthrserala
2785279027952800
argproserglnileprothrprovalasnasnasnthrlyslysarg
280528102815
aspserlysthraspserthrgluserserglythrglnserprolys
282028252830
arghisserglysertyrleuvalthrserval
28352840