用于结肠直肠癌早期检测的药物筛选和分子诊断检测试剂、方法及其试剂盒的制作方法

文档序号:3475870阅读:560来源:国知局
专利名称:用于结肠直肠癌早期检测的药物筛选和分子诊断检测试剂、方法及其试剂盒的制作方法
优先权要求美国临时专利申请号60/614,746,题目为MOLECULARDIAGNOSTIC TEST FOR EARLY DETECTION OF COLORECTALCANCERREAGENTS,METHODS,AND KITS THEREOF,由Nancy M.Lee,等.于2004年9月30日提交(Attorney Docket No.NLEE-01001US0);美国临时专利申请号60/651,344,题目为METHODS OF USE OF ABIOMARKER PANEL FOR DRUG SCREENING,由Nancy M.Lee,等.于2005年2月8日提交(Attorney Docket No.NLEE-01002US0);和美国专利申请号1/_,_,题目为DRUG SCREENING ANDMOLECULAR DIAGNOSTIC TEST FOR EARLY DETECTION OFCOLORECTAL CANCERREAGENTS,METHODS,AND KITSTHEREOF,由Nancy M.Lee,等.于2005年9月29日提交(Attorney DocketNo.NLEE-01001US1)。
相关申请的交叉参考本申请与由Nancy M.Lee等于2004年7月14日提交的题目为“Biomarker Panel for Colorectal Cancer”的PCT/US2004/022594相关,它要求由Nancy M.Lee等于2003年7月18日提交的题目为″MolecularBiomarker Panel for Determination of Colorectal Cancer″的美国临时申请号60/488,660(Attorney Docket No.CPMC-01000US0)的优先权,并且还要求由Nancy M.Lee等于2003年10月22日提交的题目为″Biomarker Panel forColorectal Cancer″的美国专利申请号10/690,880(Attorney Docket No.CPMC-01000US1)的优先权,每一申请通过参考完全结合于此。
核苷酸和/或氨基酸序列列表以计算机可读的形式和硬拷贝(hard-copy)包含在本申请中。以计算机可读形式包含的信息通过参考完全结合于此。计算机可读形式的信息还包含在磁盘上,并且在磁盘上提交的这样的信息通过参考完全结合于此。1号压缩磁盘包含下述文件NLEE1001WO0.ST25.txt(9/30/2005产生,96K)。提交的磁盘总数为1。
背景本公开内容的技术领域涉及用于结肠直肠癌(“CRC”)早期检测的试剂、方法和试剂盒,和用于筛选对病理诸如癌症和神经退行性疾病治疗有效的药物的方法,所述癌症例如CRC、肺癌、前列腺癌和乳腺癌,所述神经退行性疾病例如阿尔茨海默病和ALS。这些试剂、方法和试剂盒基于一组生物标记,所述生物标记有效用于CRC和其它这样的病理的危险评估、早期检测、建立预后、干涉评估、复发,以及关于治疗干涉的药物发明。
在医学领域,很久以来就开始探求用于CRC危险评估和早期检测的临床方法。目前,CRC是西方国家中癌症-相关的死亡中的第二主要原因。通过十几年的关于CRC的研究清楚显现出的一幅图像就是,早期检测是增加生存率的关键。
因此,对于CRC早期检测的一种长期探求的途径已经成为对于有效进行CRC早期检测并且因此有效地用于CRC治疗的生物标记的寻求。自从发现了癌胚抗原(“CEA”),对于有效用于CRC早期检测的生物标记的寻求已经持续了四十多年。它还对于在与CRC早期诊断检测联合应用的取样方法成为最低程度侵入性或非侵入性是有利的。非侵入性和最低程度侵入性的取样方法增加了患者的顺应性,并且通常减少了成本。另外,用于分析生物分析典型的复杂的、多变量数据的生物信息学方法,其基于这样的数据设定产生可靠的诊断评估,也是理想的。
对于许多类型癌症诸如CRC、肺癌、前列腺癌和乳腺癌的治疗干涉,包括手术、化学治疗和放射治疗、以及它们的组合。对于CRC,除了寻找早期检测的非侵入性方法之外,继续研究和开发的当前领域在药物开发领域内。
通过十几年的关于CRC的研究已经清楚地显现出这样一副画面,伴随有效的治疗干涉的早期检测是增加存活率的关键。到目前为止,CRC治疗中最常用的药物是5-氟尿嘧啶(“5FU”),其通常与叶酸维生素、亚叶酸组合进行静脉内施用。当转移已经发生,并且癌症已经扩散到机体的不同部分时,使用一种叫作初级化学治疗的策略。对于CRC,初级化学治疗的现有策略是施用口服形式的5FU、卡培他滨,其与下列各项组合盐酸伊立替康和山梨醇注射剂,一种拓扑异构酶I抑制因子,或奥沙利铂,一种抑制DNA合成的有机金属的、含有铂的药物。
目前,对于CRC新药开发的策略包括两个研究领域血管生成抑制剂和信号传导抑制剂。
新的生物药物包括基于蛋白和核糖酶的治疗剂。基于人源化抗体的治疗剂包括实例诸如Erbitux和Avastin。Erbitux,一种信号传导抑制剂,目的是抑制癌细胞表面上的表皮生长因子受体(“EGFR”)。Avastin,一种血管生成抑制剂,目的是抑制已知促进血管生长的血管内皮生长因子(“VEGF”)。另外,血管酶(Angiozyme),一种基于核糖酶治疗的实例,是针对VEGF-R1受体表达的血管生成抑制剂。基于传统小分子的新药包括实例诸如Iressa,其基于喹唑啉模板,并且作用为信号传导抑制剂,和SU11248,其基于吲哚满酮模板,作用为抗血管生成抑制剂。
对于这些CRC治疗的新生药物仍然存在许多潜在的缺点和不确定性。对于许多有希望的候选药物,除了典型的禁忌征候,诸如反胃、呕吐、头痛和腹泻,已经观察到其它更严重的副作用,诸如肠胃穿孔、升高或降低的血压、极度疲劳和内出血。另外,尽管许多基于血管生产抑制或信号传导抑制的药物治疗看起来是有希望的,但是它们处于临床试验的非常早期的阶段。
因此,在本领域中存在对于生物标记和生物信息方法的需要,所述生物标记有效地早期检测CRC,伴随着最低程度或非侵入性的取样方法,所述生物信息方法与生物标记一起为CRC的早期检测产生强有力的诊断检测。本领域中还存在对于药物研发的需要,其可以在诊断患有病状的患者的癌症发展之前提供有效的治疗,同时将严重的副作用最小化,所述病状诸如癌症,例如CRC、肺癌、前列腺癌和乳腺癌,以及神经退行性疾病,例如阿尔茨海默病和ALS。
附图简述

图1是列出本公开的发明的一组生物标记的序列表的实施方案。
图2是用图1生物标记组的一方面以及本公开发明的生物信息学评估的一方面评估的对照受试者相对测试受试者的分布曲线。
图3显示基因PPAR-γ、IL-8、SAA 1和COX-2的log(base2)表达值的分布和它们的截断点。
图4A和4B显示不同基因的表达在患有结肠癌家族病史的个体的MNCM的不同位点改变。
图5显示用于评估数据的生物信息学方法的一方面的流程图。
图6是对于结肠黏膜细胞最低程度侵入性取样的擦拭取样(swabsampling)和转运系统的实施方案。
图7是描述药物筛选内容一方面的流程图。
图8是描述药物筛选内容另一方面的流程图。
详述到目前为止,通过腺瘤性结肠息肉(“APC”)、p53和Ki-ras基因,以及相应的蛋白,及其参与调控的相关途径的研究,已经获得了对CRC生物学的更多的理解。然而,在对于具体的基因、其表达、蛋白产物和调控的研究,与理解什么基因是关键包含在用于CRC分析的组内的之间存在明显的差异,所述用于CRC分析的组有效用于管理疾病患者的护理。对于CRC所建议的组包括APC、p53和Ki-ras以及微卫星不稳定标记基因BAT-26的特异性点突变。
对于CRC,很久以来就开始寻求用于危险评估和CRC早期检测的生物标记。危险评估和早期检测之间的差异是关于获得性CRC确定性的程度。用于危险评估的生物标记在一时间间隔内赋予低于100%的CRC确定性,而用于早期检测的生物标记在特定的时间间隔内赋予疾病发作的几乎100%的确定性。危险因子可以用作未诊断患有癌症的个体的替代终端(surogate endpoint),条件是在所述替代终端和确定的结果之间存在确定的关系。确定的CRC终端的实例是腺瘤性息肉的实例。已经确定的是,对于后来发展CRC的个体,腺瘤性息肉的发生是必要非充分条件。这由这样的事实证明,即,所有侵入前癌症损伤的90%是腺瘤性息肉或先兆,但是不是所有具有腺瘤性息肉的个体后来都继续发展成CRC。
腺瘤性息肉已经被确定为CRC的替代终端,并且腺瘤性息肉是通过结肠镜检或乙状结肠镜肉眼可确认的。在这样的侵入性方法中,组织活检样品可以取自用于组织的组织学评估的息肉或损伤。本文公开的分子诊断方法用于大体上看起来正常的结肠黏膜细胞,其不是来自肉眼可确定的息肉或损伤。然而,正如在本文中进一步公开的那样,侵入性方法不必用来获得患者样品用于组织学评估。非侵入性或最低程度侵入性方法可以用来获得,例如,血液样品、粪便样品、或大体上看起来正常的直肠细胞的擦拭取样,在这些样品上可以进行分子诊断检测以评估CRC的存在或不存在。对于CRC早期检测的早先描述的方法没有公开大体上看起来正常的结肠黏膜细胞(直肠细胞的组织活检或擦拭取样)、血液样品和/或粪便样品的非侵入性或最低程度侵入性的收集,之后进行分子和/或蛋白表达诊断检测,其可以在表明CRC是显而易见的任何不利组织学变化之前检测到组织中的变化。
图1是给出本公开内容中包含的序列表概述的表格。图1的表格列出实施本公开发明所用的一组生物标记。生物标记组的一个实施方案是由SEQ.ID NOs 1-16给出的16个确定的编码序列,而生物标记组的另一个实施方案是由SEQ.ID NOs 17-32给出的16个确定的蛋白序列。这两个实施方案代表为CRC早期检测提供必要的选择性和灵敏性的分子标记组。应该理解,所述序列表中所述的生物标记的片段和变体也是用于CRC早期检测的实施方案组中的有效生物标记。片段意指在序列表中的多聚核苷酸或多肽的任何不完整或分离的片段。此外,应该认识到,几乎每天都要宣布关于基因变体,特别是处于热点研究中的那些基因,诸如参与疾病如癌症的基因的新发现。因此,给出的序列表对于现在报道的基因是示例性的,但是应该认识到,出于分析方法学目的,基因的变体及它们的片段也包含在内。
在图1中,表格中第1-16项是生物标记组的一方面,其为多聚核苷酸编码序列,并且包括基因的命名和缩写。图1的第17-32项是生物标记组的另一个实施方案,其为与第1-16项的编码序列相对应的蛋白或多肽、氨基酸序列。由国家卫生研究院(National Institutes of Health(“NIH”))定义的生物标记是具体的生物特征的分子指示剂;可以用来测定疾病进展或治疗效果的生物化学特征或方面。生物标记组是生物标记的选择,其综合在一起可以用来测定疾病进展或治疗效果。生物标记可以是各种种类的分子。如先前所提到的,存在对于具有有效用于CRC早期检测所需的选择性和灵敏性的CRC生物标记的需求。因此,本文所公开的一个实施方案是选择一套在提供CRC早期检测根据中区分的有效的生物标记。
在本公开内容的一方面,对于CRC的早期检测,从通过非侵入性或最低程度侵入性方法取自患者的样品的细胞而确定由SEQ.ID NOs 1-16显示的多聚核苷酸的表达水平。考虑的方法包括血液取样、粪便取样和直肠细胞擦拭取样或活组织检查。在本领域内,多聚核苷酸表达水平的这样的分析通常叫作基因表达分布作图。对于基因表达分布作图,测定样品中mRNA水平作为生物状态的主要指示因子——在这一情形中,作为CRC的指示因子。对于分析基因表达分布作图的一种最常见的方法是,使用已知为反转录的方法从生物样品(所述样品通过非-或者最低程度侵入性方法取自上文公开的患者)的mRNA产生多个拷贝。在反转录方法中,通过本领域公知的方法,将样品的mRNA从生物样品细胞分离。然后,将所述mRNA用于产生mRNA最初从其转录的对应的DNA序列拷贝。在反转录扩增过程中,产生的DNA拷贝在基因中没有调控区(即,内含子)。因此,这些由mRNA制成的多个拷贝叫作“cDNA”,其代表互补的或复制的DNA。第33-64项是成套的引物,其可以用于在第1-16项列出的每种生物标记的反转录过程。SEQ.ID NOs 1-64中确定的所有核苷酸和氨基酸生物标记序列可以在附上的打印输出中找到,并且包括本申请的主旨,并且可以在磁盘上找到,所述磁盘作为本申请的一部分包含于此并且通过参考结合于此。
由于反转录方法与样品中初始mRNA水平成比例地扩增cDNA拷贝,它已经成为允许鉴定并且量化生物样品中存在的即使低水平的mRNA的标准方法。在任何具体的生物状态,基因可以被增量调控或减量调控,并且因此mRNA水平据此转变。
在本公开内容的一方面,基因表达分布作图的方法包括,在通过非-或最低程度-侵入性方法,诸如血液取样、粪便取样、直肠细胞擦拭取样、和/或直肠细胞组织活检而从患者采取的生物样品中,选自SEQ.ID NOs.1-16的生物标记组的至少2种生物标记的cDNA水平的定量测量。采取的组织不必是明显患病的;实际上,本公开的发明考虑用于评估即使大体上看起来正常(grossly normal-appearing)的细胞而进行CRC检测。这样的基因表达分布作图方法需要使用引物、酶和用于cDNAs制备、检测和定量的其它试剂。从样品mRNA产生cDNA的方法叫作反转录酶聚合酶链式反应(“RT-PCR”)。SEQ.ID NOs 33-64列出的引物特别适用于基于生物标记组中公开的生物标记应用RT-PCR进行基因表达分布作图。应用Primer Express Software(Applied Biosystems,Foster City,CA)设计了一系列引物。选择特殊的候选,然后检测证实只有cDNA得到扩增而没有受到基因组DNA的污染。据此,特别设计、选择并且检测了SEQ.ID NOs 33-64列出的引物。
在后来从分离的细胞RNA产生cDNA的步骤中,SEQ.ID NOs 33-64列出的引物是重要的,用于在实时PCR中定量地扩增目的基因表达产物的拷贝。最理想的引物序列和最理想的引物长度是引物设计的主要考虑。最理想的引物序列可以影响引物与模板结合的特异性和灵敏性。认为18-30个碱基的引物长度是最理想的范围。理论上,18个碱基是代表独特序列的最短长度,其在大多数真核基因组中将在唯一一个位置杂交。SEQ.ID NOs 33-64列出的引物在引物长度上在21-27个碱基范围,并且设计和有效用来扩增选自SEQ.ID NOs 1-16的核苷酸组的cDNA。引物的特异性通过在10%聚丙烯酰胺凝胶电泳(“PAGE”)上的单一产物,和PCR产物的单一解离曲线而证明。
一旦引物已经设计,并且验证了特异性,它们可以大量合成,并且保存以便方便地用于将来应用。由于PCR反应对缓冲液浓度和缓冲液组成敏感,所以引物应该保持在不干扰扩增反应的适宜的稀释剂中。适宜的稀释剂的一个实例是10mM Tris缓冲液,有或无1mM EDTA,这取决于对于EDTA的检测灵敏性。备选地,用于引物的另一适宜的稀释剂的实例是没有核酸酶的去离子水。引物可以等分在适当的容器中,诸如硅化管中,并且如果需要的话将其冻干。液体或冻干的样品优选地保存在定义为生物样品长期保存的冷藏温度,在约-20℃到约-70℃。扩增反应中引物的浓度典型地在0.1-0.5mM。从储液到最终反应混合物的典型的稀释因子约10倍,以便等分的引物储液典型地在约1和5mM之间。
除了SEQ.ID Nos.33-64列出的特别设计的引物外,对于RT-PCR还需要下列试剂,例如含有二核苷酸三磷酸混合物的试剂,其具有全部4种二核苷酸三磷酸(例如,dATP,dGTP,dCTP和dTTP),具有反转录酶的试剂,和具有热稳定性DNA聚合酶的试剂。另外,对于RT-PCR过程还需要缓冲液、抑制剂和激活剂。
图2描述用于CRC早期检测的生物信息学数据减少方法的一方面,其显示17名对照(左)的Mahalanobis距离分布,其与14名具有CRC家族病史的个体(中)和24名患有息肉的个体(右)相比较。使用选自SEQ.ID NOs.1-16的多聚核苷酸的生物标记组,评估从大体上看起来正常的结肠黏膜组织采取的组织样品。对于每一对照和检测受试者,关于由选自SEQ.ID NOs 1-16的多聚核苷酸代表的16种基因的每一种的基因表达水平的平均数在log base 2域计算。然后,基于多变量的正态分布,为对照确定16维空间的多变量平均数,以确定正常表达水平的界限。对于每一对照,测定其它16个对照的多变量平均数的Mahalanobis距离(“M-dist”),而对17个对照的多变量平均数确定每一名检测受试者的M-dist。在图2显示的每一组中,来自单一个体的所有组织活检形成垂直的一排。对于患有息肉的个体,星号标记来自患有增生性息肉的个体的组织活检。水平线表示具有16自由度的-卡方分布的95%ile。在这一线上的所有值(对应约25的M-dist)在p<0.05水平上不同于对照的平均值。所述数据清楚地表明,在检测受试者的大体正常的结肠黏膜组织样品中存在改变的基因表达模式。因此,所述数据证明使用选自SEQ.ID NOs.1-16的多聚核苷酸的生物标记组的诊断检测的增强的灵敏性和选择性。
图3显示使用选自SEQ.ID Nos.1-16的多聚核苷酸的表达分布作图用于评估所分析的样品数据的生物信息学方法的一方面的流程图300。使用选自SEQ.ID Nos.1-16的多聚核苷酸组,用于分析分子诊断检测的基因表达数据的生物信息学分析的目的是使用异常(abnormality)的单一的、易于计算的测定。由于综合看来多变量分析确定所有表达水平变化的显著性,所以需要通过多变量分析对选自SEQ.ID NOs 1-16全体的所有基因的表达模式进行分析。存在一些种类的多变量检测,其可以有效用于生物信息学分析,所述生物信息学分析用于评估使用本文公开的分子诊断检测而检测的患者样品中结肠直肠癌的存在或不存在。用于评估使用选自SEQ.ID NOs 1-16的多聚核苷酸生物标记组而检测的患者样品数据的多变量分析的实例包括ANOVA和Mahalanobis距离(“M-Dist”)检测。
ANOVA是解释表达水平间的相互关系的通用检测。对于多变量ANOVA检测有必要基于Wilks′λ标准,并且在使用选自SEQ.ID NOs 1-16的多聚核苷酸组进行分子诊断检测获得的数据的log(base 2)值上进行,以获得值的正态分布。
M-dist分析是多变量分析的另一实例,考虑到每种基因表达的可变性和基因对之间的相关性,其以单一数字总结了两种基因表达模式之间的不同。M-dist通常以多元数据用作局外人(显著不同于组中所有其它个体病例的个体病例)的检测。M-dist可以通过参考具有等于变量(即,基因)数目的自由度的-卡方分布而转换成p-值。然而,为了避免对于假定的多变量常态的依赖性,需要使用秩和检验,Mann-Whitney检验,比较个体病例(即,患有息肉的那些)和对照的M-dist。通过使用Mann-Whitney分析,关于表达模式的差异的推论不依赖于多变量常态的假设。因此,这一方法允许综合起来的所有试验受试者表达水平的显著性的确定,以及每个个体表达值的显著性的确定。
下文提供了上述公开内容的一个工作实例。Hao,C-Y,等.,Alterationof Gene Expression in Macroscopically Normal Colonic Mucosa fromIndividuals with a Family History of Sporadic Colon Cancer,11 Clin.CancerRes.,1400-07(Feb.15,2005)。提供所述实例作为本领域普通技能的实践者的进一步指导,并且不能以任何方式解释为本发明的限制。
采用这一实例研究,在没有发展结肠癌但是由于CRC家族病史而处于患有结肠癌的高危险中的个体的形态正常的结肠黏膜(“MNCM”)中,一些基因的表达是否改变。
人受试者在访问California Pacific Medical Center(“CPMC”)的个体的常规结肠镜检时,进行直肠和乙状结肠的MNCM组织活检,所述个体没有结肠癌病史或先前的结肠癌,并且在检查时没有腺瘤性息肉、结肠癌或其它结肠性损伤。本研究包括了12名在第一级亲属中具有结肠癌家族病史的个体(表3)和16名没有已知结肠癌家族病史的个体。尽管家族癌症病史的信息通过患者的自我报告获得而没有从医院癌症登记处得到证实,但是,最近的研究已经证实了关于结肠癌的自我报告家族病史的准确性。在具有结肠癌家族病史的12名个体中,2名是母女(表3中的病例#6和7),2名是姐弟(病例#11和12),其余的是不相关的。在具有结肠癌家族病史的组中,研究的受试者年龄在18-64岁范围,对照组在16-83岁(16岁的受试者由于慢性腹痛已经进行了结肠镜检)。获得研究的正常组织活检样品的研究流程得到CPMC Institutional Review Board的认可。对于所有的研究受试者进行获得被告知内容的适当的方法。
RNA和cDNA的提取和制备将从盲肠和肝弯曲部之间的结肠片段获得的组织活检样品分类为升结肠样品;从肝弯曲部和脾弯曲部之间的结肠片段获得的那些样品分类为横结肠样品;从低于脾弯曲部的结肠片段获得的那些样品分类为降结肠;从低于降结肠的结肠蜿蜒部分获得的那些样品分类为直肠乙状结肠样品(从直肠约5-25cm)。从每个患者获得的组织活检样品数目不同。除了从家族病史组的一名受试者的横结肠片段和降结肠片段只获得1份样品外,从每个结肠片段获得2-8份组织活检样品。从12名具有结肠癌家族病史的个体中总共获得39份升结肠样品、37份横结肠样品、45份降结肠样品和77份直肠乙状结肠样品;从16名没有结肠癌家族病史的个体总共获得53份升结肠样品、48份横结肠样品、49份降结肠样品和104份直肠乙状结肠样品。将所有的组织活检样品在干冰上速冻,并且立即拿到实验室进行所述RNA制备和反转录。
基因表达分析通过定量RT-PCR分析下列各项的表达水平癌基因c-myc,CD44抗原(“CD44”),环加氧酶1和2(“COX-1”和“COX-2”),cyclin D1,cyclin-依赖型激酶抑制因子(“p21cip/waf1”),白介素8(“IL-8”),白介素8受体(“CXCR2”),骨桥蛋白(“OPN”),黑素瘤生长刺激活性(“Groα/MGSA”),GRO3癌基因(“Groγ”),巨噬细胞集落刺激因子1(“MCSF-1”),过氧化物增殖性激活受体,α,δ和γ(“PPAR-α,δ和γ”)和血清淀粉样A1(“SAA1”)。进行定量RT-PCR。简要地,当积累的PCR产品超过任意定的阈值时,记录循环数(“CT值”)。为了使这一值标准化,将ΔCT值确定为检测的每种基因的CT值和β-肌动蛋白的CT值之间的差别。计算对照组中每种基因的平均ΔCT值。将ΔΔCT值确定为每份个体样品的ΔCT值和从对照样品获得的这一基因的平均ΔCT值之间的差别。然后,按所述那样,将这些ΔΔCT值用来计算相对基因表达值。(Applied Biosystems,User Bulletin #2,December 11,1997)。当可以得到cDNA样品时,所有的PCR一式两份进行。还应用组氨酰-tRNA合成酶作为内部对照而验证所述结果。应用β-肌动蛋白或his-tRNA合成酶作为参照,相对基因表达值产生相似的结果。这里应用β-肌动蛋白作为标准化对照获得统计学分析。
统计学分析在具有结肠癌家族病史的个体和没有结肠癌家族病史的对照组受试者之间比较基因表达模式。不是独立地检验每种基因的表达和通过减少统计指数(statistical power)的方法调整多重比较,我们通过具有Wilks′λ标准的差异多变量分析(“MANOVA”)而检验所有基因的表达模式。这一检测是用于差异单变量分析的F-检验的多变量类似物,其检验平均值的等同性。这种类型的分析考虑了基因表达水平间的相互关系,并且通过基于子集中的所有基因提供表达模式是否在组与组之间不同的单一检验而控制假阳性率。
通过存在表达模式在组与组之间不同的证据,那么我们应用单一变量t-检验来确定哪些基因对综合差异起作用。由于完成正态分布需要这一转化,所以,所有的MANOVA检验基于Wilks′λ标准,并且在表达水平的log(base 2)上进行。我们的数据由每组(家族病史对没有家族病史)不同数目个体的每名受试者的不同数目的样品组成。分析包括关于组内个体的和关于个体内样品的随机effects terms,以说明取样方案。如果Yijk表示第i组的第j名患者的第k份样品的log2基因表达值,那么统计学模型通过下列方程数学表示Yijk=M+Ai+Bij+eijk,其中Ai是(固定的)组effect,Bij是(随机的)患者effect,和eijk是患者effect内的(随机)样品。
通过用值1定义来自升结肠的样品的变量,值2定义来自横结肠的样品的变量,值3定义来自降结肠的样品的变量,和值4定义来自结肠的直肠乙状结肠部分的样品的变量,我们还检测了微分式的数量级(在式上或式下)是否从升结肠部分到直肠沿着结肠增加。将这一变量添加到模型中,以便可以应用单一变量ANOVA检测到它对某些基因的影响。
截断点的定义将来自对照组所有组织活检样品的表达水平的log(base 2)用来计算每种基因增量调控或减量调控的截断点。正态分布的公差限度表用来定义截断点,以致对于增量调控的基因,不大于P的分布部分将高于截断点,或者对于减量调控的基因低于截断点。通过截断点=平均值+k(SD)定义每个截断点,其中平均值和SD(标准偏差)基于对照组的值。k值在表中找到,并且取决于P值和正常样品的数目。Owen,D.B.,Noncentral t andtolerance limits,in Brimbauim ZW,ed.Handbook of Statistical Tables,Reading,MAAddison-Wesley,1962,108-127。假定每种基因表达水平的高斯分布,人们可以预计少于1%的来自正常群体的活组织切片具有超过99%公差极限(p=0.01)的表达水平。
为了计算在每种情形中高出99%ile观察到的样品数目是由于偶然性的可能性,我们应用二项式分布法,p=0.01和n=每种情形样品数目乘以检测的基因数目。例如,对于病例#1(表3),我们具有2份样品;二者都表现出PPAR-γ和SAA1的异常表达,二者之一对于PPAR-δ表达异常,并且没有一个对于IL-8和COX-2是异常的。因此,对于这一病例,10份检测的样品中有5份超过上限0.01。这是偶然发生的可能性是2.4×10-8。通用公式给出如下Pr{x≥k|p,n}=Σi=k5n(0.01)i(0.99)5n-i,]]>其中k是超过99%ile的数目和n是样品数目(检测的基因数目是5)。
结果在具有结肠癌家族病史的个体的直肠乙状结肠黏膜中的改变的基因表达
12名个体(10名女性和2名男性)组成具有结肠癌家族病史的组;16名个体(9名女性和7名男性)作为对照组。(表1)对于16种基因的表达水平,我们总共分析了92份升结肠样品,85份横结肠样品,94份降结肠组织活检样品和181份直肠乙状结肠组织活检样品。已知这些基因的表达水平在人结肠癌晚期改变。我们还证明这些基因中的一些在结肠癌患者的手术切除的MNCM中改变。
继续参考表1,结果代表来自没有家族病史的16名个体的104份组织活检样品的分析,和来自具有结肠癌家族病史的第一级亲属的12名个体的77份组织活检样品的分析。按照方法中所述分析样品的基因表达。表中的数字代表相对于对照组平均MCT的表达水平。如果在个体间没有变化,对照组的正常基因表达水平应该等于1。应用Wilksλ标准的多变量分析在16种基因的log2表达值上进行,以确定两组之间的差异显著性。从最小到最大的P值将基因列出。
所有16种基因表达值的多变量分析表明,在来自具有和没有散发性结肠癌的那些患者的直肠乙状结肠区域的组织活检样品的显著差异(p=0.01)。在这两组个体之间,在来自降结肠、升结肠和横结肠的组织活检样品的基因表达没有显著地不同(分别地,p=0.06,0.22和0.52)。直肠乙状结肠组织活检样品的大部分差异仅由这些基因的5种(表1)提供PPAR-γ,SAA1,IL-8,COX-2和PPAR-δ。与癌症患者的MNCM中基因表达的改变相似,我们发现,在具有散发性结肠癌家族病史的个体的MNCM中,SAA1、IL-8和COX-2的表达水平得到增量调控,和PPAR-γ与PPAR-δ的表达水平得到减量调控。
大概是由于在具有结肠癌家族病史的组中需要早期进行结肠镜检的增强的意识,家族病史组的平均(±SD)年龄(45±12岁)比对照组的(56±16岁)年轻。另外,在这两组之间存在性别差异(在具有家族病史组中10名女性和2名男性,相对于在对照组中的9名女性和7名男性)。然而,我们发现性别没有影响基因表达水平(p=0.67)。并且,除了PPAR-δ0.01,在年龄和SAA1、IL-8、COX2和PPAR-γ的表达水平(所有的p>0.05)之间没有相关性。然而,PPAR-δ的异常表达(减量调控)随着年龄增加。因此,在年轻的家族病史组和年老的对照之间的比较将倾向于在家族病史组中发现更少的而不是更多的异常表达。换句话说,我们可能低估PPAR-δ在家族病史组中的改变的表达的发生率。
表1.与对照相比,在来自具有结肠癌家族病史的个体的正常直肠乙状结肠组织活检样品中的基因表达水平
对于“正常”基因表达的截断点比较直肠乙状结肠样品中的相对基因表达水平在个体间不同,在从具有结肠癌家族病史的个体获得的样品中比来自对照的对应值多得多(表1)。因此,通过计算每种基因的截断点(p=0.01),我们应用对照组的每种基因的表达水平来定义每种基因的“正常”表达水平。图3显示基因PPAR-γ,IL-8,SAA1和COX-2的log(base2)表达值的分布以及它们的截断点。如预计那样,少于1%的来自对照组的组织活检样品具有高于或低于截断线的这些基因的表达(p=0.01,图3)。然而,21%,12%和8%的来自家族病史组的组织活检样品分别具有高于截断点的SAA1、IL-8和COX-2的表达,并且12%的所述样品具有低于截断点的PPAR-γ表达(表2)。
表2.在正常个体和具有结肠癌家族病史的个体中,具有高于/低于截断点的基因表达的组织活检样品数目(N)
具有低于截断点的基因表达水平*具有高于截断点的基因表达水平具有改变的患者数目在表3中列出。
然后,我们分析了家族病史组中的每一个体(表3)。显示了表现出低于(对于PPAR-γ和δ)或者高于(对于IL-8、SAA1和COX-2)截断点的表达水平的组织活检样品数目。所有组织活检样品都表现出在正常范围内的表达水平的个体用(-)符号表示。在本研究中患有结肠癌的所有祖父母都是母方。当结肠癌得以诊断时家族成员的年龄表示如下***表示结肠癌在50岁之前得到诊断;**表示在60岁之前;和*表示在60岁后。当结肠癌得以诊断时其余家族成员的年龄不可获得。除了病例#10的患者父亲在20世纪70年代患肺癌之外,家族病史组中的12名患者没有一名在家族中报道其它类型的癌症。
如在表3中表示的,对于5种最常改变的基因,具有结肠癌家族病史的12名个体中的9名具有至少一种表达水平低于或者高于截断点的组织活检样品。2名个体(病例#1和2)在显然正常的直肠乙状结肠黏膜中具有3种这样的基因的改变的表达。相反,对照组16名个体中只有1名具有这5种基因中的一种的改变的表达(参见表2)。设定截断值,以便1%的表达将是假阳性。然而,从每个个体获得的组织获奖样品数目是不同的。为了调整样品数目,对于每一病例,我们还计算了在高于99%ile外观察到的样品数目是由于偶然性引起的可能性。这一计算是基于二项式分布。如表3中所示,在12名家族病史组个体中的7名中观察到的改变的基因表达不可能是由于偶然性引起(p<0.01)。在这7个病例中,5种基因至少2种的表达被改变。另外,在分析的16种基因中,PPAR-γ和SAA1是在具有结肠癌家族病史的12名个体的5名中发生的最常改变的基因(表3)。
表3.PPAR-γ,IL-8,SAA1,COX-2和PPAR-δ在具有结肠癌家族病史的个体的直肠乙状结肠组织活检样品中表达的总结
不同基因的表达在具有结肠癌家族病史的个体的MNCM的不同位点而改变。
家族病史组个体病例的分析表明,不同的基因在不同受试者的直肠乙状结肠组织活检样品中改变。例如,在病例#3中SAA1和PPAR-γ被改变,在病例#4中IL-8和SAA1被改变;而在病例#8中COX-2和IL-8而不是SAA1被改变(图4A)。另外,一些基因在同一患者的所有直肠乙状结肠组织活检样品中被改变(诸如病例#4中的SAA和病例#8中的IL-8),而有些只在一些这样的组织活检样品中改变(即,病例#3中的SAA1和PPAR-γ,病例#4中的IL-8和病例#8中的COX-2)。另外,一些这样的改变局限于直肠乙状结肠区域,诸如病例#4中的IL-8;而一些可以扩展到结肠的其它区域,诸如病例#4中的SAA1(图4B)。
我们还观察到,对于PPAR-γ(p=0.001倾向)和SAA1(p<0.001),而不是对于IL-8(p=0.20)、COX2(p=0.58)、也不是PPAR-δ(p=0.54),两组个体之间的基因表达的差异随着结肠的长度而增加。这些结果表明,在两组个体之间从升结肠到直肠部分沿着结肠存在增加的异常性,尽管在本研究中向升结肠部分的样品数目减少了,其仍可以被检测到。
从前述实例中,可以得出下述结论。大约5-10%的结肠直肠癌发生在患有2种常染色体显性遗传形式的结肠癌(家族性腺瘤性息肉病和遗传性非息肉结肠直肠癌)的一种的患者中,或者发生在患有炎性肠病的患者中(Burt R.,Peterson G.M.InYoung G.,Rozen,P.& Levin,B.Saunders,ed.inPrevention and Early Detection of Colorectal Cancer,Philadelphia,171-194(1996))。其余的结肠癌中,大约20%与结肠癌家族病史有关,结肠癌家族病史与发展结肠癌的2倍增加的危险相关(Smith R.A.,von EschenbachA.C.,Wender R.,等.,American Cancer Society guidelines for the earlydetection of cancerupdate of early detection guidelines for prostate,colorectal,and endometrial cancers,and Update 2001--testing for early lungcancer detection,51 CA Cancer J Clin.38-75;quiz 77-80(2001))。尽管在家族性结肠直肠癌患者子集中已经报道了染色体15q13-14和9q22.2-31.2的连锁(Wiesner G.L.,Daley D.,Lewis S.,等.,A subset of familial colorectalneoplasia kindreds linked to chromosome 9g 22.2-31.2,100 Proc Natl Acad SciUSA,12961-5(2003)),但是大多数这些病例的遗传基础是未知的。在本研究中,我们已经证明了PPAR-γ、IL-8和SAA1在具有散发性结肠癌家族病史的患者的直肠乙状结肠MNCM中表达的本质改变,即使这些个体并没有可检测到的结肠异常。我们早先的研究表明,除了PPAR-γ、IL-8和SAA1之外,当与没有结肠癌、息肉和家族病史的正常个体相比时,在结肠癌患者的MNCM中,PPAR-δ、p21、OPN、COX-2、CXCR2、MCSF-1和CD44的表达也显著地改变了。这些观察表明,MNCM中与癌症发展相关的基因的改变的表达可能是一种结果性事件,并且可能比明显的形态学异常的出现发生地更早。例如,PPAR-γ、SAA1和IL-8的改变的表达可能发生在还没有发展结肠癌但是处于发展结肠癌的高对危险中的个体的MNCM中;而其它基因诸如PPAR-δ、p21、OPN、COX-2、CXCR2、MCSF-1和CD44的改变的表达,可能晚一些时候发生在已经发展了结肠癌的个体的MNCM中(Chen L-C,Hao C-Y,Chiu Y.S.Y.,等.,Alteration ofGene Expression in Normal Appearing Colon Mucosa of APCmin Mice andHuman Cancer Patients,64 Cancer Research 3694-3700(2004))。
已经在一些肿瘤的肉眼可见的正常组织中报道了遗传和后生的改变(Tycko B.,Genetic and epigenetic mosaicism in cancer precursor tissues,983Ann N Y Acad Sci.,43-54(2003))。例如,等位基因丢失已经在邻近初级乳腺癌的正常乳腺末端导管小叶中得到了证明。(Deng G.,Lu Y.,Zlotnikov G.,Thor A.D.,Smith H.S.,Loss of heterozygosity in normal tissue adjacent tobreast carcinomas,274 Science,2057-9(1996))。这样的等位基因丢失与局部复发的增加的危险性相关(Li Z.,Moore D.H.,Meng Z.H.,Ljung B.M.,Gray J.W.,Dairkee S.H.,Increased risk of local recurrence is associated withallelic loss in normal lobules of breast cancer patients,62 Cancer Res.,1000-3(2002))。另外,患有前结肠癌(prior colon cancer)个体的看起来正常的结肠黏膜细胞比没有患有前结肠癌的个体的黏膜细胞更能抵抗胆酸诱导的细胞程序性死亡(Bernstein C.,Bernstein H.,Garewal H.,等.,A bileacid-induced apoptosis assay for colon cancer risk and associated qualitycontrol studies,59 Cancer Res.,2353-7(1999);和Bedi A.,Pasricha P.J.,Akhtar A.J.,等.,Inhibition of apoptosis during development of colorectalcancer.,55 Cancer Res.,1811-6(1995))。由于在结肠上皮细胞中细胞程序性死亡对于去除具有未修复的DNA损伤的细胞是重要的(Payne C.M.,Bernstein H.,Bernstein C.,Garewal H.,Role of apoptosis in biology andpathologyresistance to apoptosis in colon carcinogenesis,19 UltrastructPathol.,221-48(1995)),程序性细胞死亡的减少可能导致DNA-损伤细胞的滞留,并且增加致癌突变的危险。
在一些癌症中PPAR-γ受到减量调控。PPAR-γ的配体抑制细胞生长并且诱导细胞分化(Kitamura S.,Miyazaki Y.,Shinomura Y.,Kondo S.,Kanayama S.,Matsuzawa Y.,Peroxisome proliferator-activated receptorgamma induces growth arrest and differentiation markers of human coloncancer cells,90 Jpn J Cancer Res 75-80(1999)),并且在人结肠癌中已经报道了PPAR-γ失去功能的突变(Sarraf P.,Mueller E.,Smith W.M.,等.,Loss-of-function mutations in PPAR gamma associated with human coloncancer,3 Mol.Cell,799-804(1999))。因此,我们观察到的PPAR-γ在MNCM中表达的减量调控可能代表促进结肠上皮细胞生长和抑制细胞分化的早期事件。另外,PPAR-γ还负调控炎性应答(Welch J.S.,Ricote M.,AkiyamaT.E.,Gonzalez F.J.,Glass C.K.,PPAR gamma and PPAR delta negativelyregulate specific subsets of lipopolysaccharide and IFN-gamma target genesin macrophages,100 Proc Natl Acad Sci USA 6712-7(2003))。炎症通过刺激血管生成和细胞增殖而有利于肿瘤发生(Nakajima N.,Kuwayama H.,ItoY.,Iwasaki A.,Arakawa Y.,Helicobacter pylori,neutrophils,interleukins,andgastric epithelial proliferation,25 Suppl.1 J Clin Gastroenterol.,98-202(1997))。类似地,IL-8和急性期蛋白SAAl调控炎症过程(Dhawan P.,Richmond A.,Role of CXCL 1 in tumorigenesis of melanoma,72 J LeukocBiol.,9-18(2002);和Urieli-Shoval S.,Linke R.P.,Matzner Y.,Expressionand function of serum amyloid A,a major acute-phase protein,in normal anddisease states,7 Curr Opin Hematol.,64-9(2000))。在患有炎性肠病个体的结肠黏膜中(Niederau C.,Backmerhoff F.,Schumacher B.,Inflammatorymediators and acute phase proteins in patients with Crohn′s disease andulcerative colitis,44 Hepatogastroenterology,90-107(1997);和KeshavarzianA.,Fusunyan R.D.,Jacyno M.,Winship D.,MacDermott R.P.,Sanderson I.R.,Increased interleukin-8(IL-8)in rectal dialysate from patients with ulcerativecolitisevidence for a biological role for IL-8 in inflammation of the colon,94Am J Gastroenterol.,704-12(1999)),在处于发展结肠癌的高度危险中的个体的结肠黏膜中(Bachwich D.R.,Lichtenstein G.R.,Traber P.G.,Cancer ininflammatory bowel disease,78 Med Clin North Am.,1399-412(1994)),已经报道了促炎细胞因子和急性期蛋白的增量调控。流行病学观察还表明,慢性炎症预先倾向于结肠直肠癌(Rhodes J.M.,Campbell B.J.,Inflammationand colorectal cancerIBD-associated and sporadic cancer compared,8Trends Mol Med.,10-6(2002);和Farrell R.J.,Peppercorn M.A.,Ulcerativecolitis,359 Lancet 331-40(2002))。因此,在具有散发性结肠癌家族病史个体和在患有炎性肠病的个体的正常黏膜中观察到的PPAR-γ的减量调控和IL-8与SAA1的增量调控,可能表明常规途径参与引起这2组的结肠肿瘤发生。
我们在具有结肠癌家族病史的一些个体的正常结肠黏膜中观察到的与癌症和炎症相关基因的改变表达,与最近的报道一致,最近的报道与在发展结肠癌前升高的血清C-活性蛋白(“CRP”)浓度相关(Erlinger T.P.,PlatzE.A.,Rifai N.,Helzlsouer K.J.,C-reactive protein and the risk of incidentcolorectal cancer.,291 JAMA,585-90(2004))。这些发现表明,在平均危险性个体(id.)中,炎症是发展结肠癌的危险因素。然而,CRP是炎症的非特异性标记,期可能指示在除结肠之外的组织中的炎症。在我们的研究中,我们分析了结肠癌发生的组织,并且将更加特异性地评估发展结肠癌的危险。
我们不知道哪种细胞型负责观察到的改变的基因表达。在结肠黏膜中存在许多细胞类型,包括一些类型的黏膜上皮细胞、基质细胞和血源性细胞。我们组和其他组的研究已经证明COX-2蛋白在MNCM中的增量调控主要位于渗透性巨噬细胞和次要地位于APCmin小鼠MNCM中异常隐窝病灶中的上皮细胞(Chen L-C,Hao C-Y,Chiu Y.S.Y.,等.,Alteration of GeneExpression in Normal Appearing Colon Mucosa of APCminMice and HumanCancer Patients,64 Cancer Research 3694-3700(2004);和Hull M.A.,BoothJ.K.,Tisbury A.,等.,Cyclooxygenase 2 is up-regulated and localized tomacrophages in the intestine of Min mice,79 Br J Cancer,1399-405(1999))。从我们关于APCmin小鼠MNCM的早期研究中,可能由于分泌蛋白,诸如IL-8和SAA1,在组织切片上很快就消失(Chen L-C,Hao C-Y,Chiu Y.S.Y.,等.,Alteration of Gene Expression in Normal Appearing Colon Mucosa ofAPCminMice and Human Cancer Patients,64 Cancer Research 3694-3700(2004)),我们发现通过免疫组织化学染色检测在MNCM中增量-或减量-调控的基因产物是有技术难度的。由于有限数量的活体组织解剖样品和技术困难,我们不能进行免疫组织化学染色来证明引起改变的基因表达的细胞类型。如果绝对的RNA量是充分的,那么RNA原位杂交可以是确定改变的细胞位置的更好的方法。备选地,激光显微解剖之后进行RT-PCR可以能够确定包括的细胞类型。不管负责改变的基因表达的细胞类型,我们的结果证明,相对于没有结肠癌家族病史的正常个体,改变的基因表达存在于具有结肠癌家族病史的一些个体的正常结肠黏膜中并且这些个体已知具有形成结肠癌的增加的危险(Burt R.,Peterson G.M.InYoung G.,Rozen,P.& Levin,B.Saunders,ed.in Prevention and Early Detection ofColorectal Cancer,Philadelphia,171-194(1996))。
在直肠乙状结肠组织活检样品中具有改变的基因表达的患者中,一些患者在所有组织活检样品中都表现出改变(即,病例#4和12中SAA1的表达),而有些患者只在一些组织活检样品中表现出改变的表达(即,病例#2和#3中的PPAR-γ,图2)。由于大多数样品用一式两份的多个基因进行评估,以确保cDNA的质量,所以,这样的异质性不可能由技术变化引起。我们推测这种异质性可能反映这些个体中“热点(hot spots)”的频率和/或分布。可能地,在所有直肠乙状结肠组织活检样品中具有改变的基因表达的个体可能在其直肠乙状结肠黏膜中具有广泛扩散的分子异常,而在一些组织活检样品中具有改变的表达的那些个体具有离散的热点。因此,在前组中的个体可能具有发展结肠息肉或结肠癌的综合趋势,而后组中的那些个体可能具有局部趋势。在这2组之间发展结肠癌或息肉的危险性是否不同还不清楚。另外,在具有家族病史组个体的直肠乙状结肠组织活检样品中观察到不同基因组合的改变的表达。这一观察表明,不同的分子途径可能参与结肠癌发生的早期阶段。在某些分子途径中改变的基因表达是否于息肉或癌症的更高的危险性相关还是没有确定。
与在散发性结肠癌患者和致癌物质处理的小鼠的远端结肠中有比在近端结肠中更多的隐窝病灶(前肿瘤结肠损伤)的报道一致(Shpitz B.,Bomstein Y.,Mekori Y.,等.,Aberrant crypt foci in human colonsdistributionand histomorphologic characteristics,29 Hum Pathol.,469-75(1998);和Salim E.I.,Wanibuchi H.,Morimura K.,等.,Induction of tumors in the colonand liver of the immunodeficient(SCID)mouse by2-amino-3-methylimidazo[4,5-f]quinoline(IQ)-modulation by long chain fattyacids,23 Carcinogenesis,1519-29(2002)),我们发现,基因表达中的大多数改变是在家族病史组的个体的远端结肠中发现的。我们推测,当大部分水分在大肠末端被重吸收后,与在其它结肠区域的黏膜相比,敏感个体的远端结肠黏膜可能暴露于更高浓度的存在于粪便中的外源物质,并且这样的暴露可能在这一区域引起更高概率的改变的基因表达。
我们已经证明,结肠癌家族病史,而不是年龄或性别,是为在这2组的直肠乙状结肠黏膜中观察到的基因表达差异负责的因素。可用信息没有显示在这2组患者间的饮食或药物治疗中的任何具体的不同。然而,不经过进一步研究,我们不能排除饮食或药物治疗影响基因表达的可能性。并不是所有具有结肠癌家族病史的个体都将发展结肠癌或结肠腺瘤性息肉(Smith,R.A.,von Eschenbach A.C.,Wender,R.,等.,American Cancer Societyguidelines for the early detection of cancerupdate of early detectionguidelines for prostate,colorectal,and endometrial cancers,and Update2001-testing for early lung cancer detection,51 CA Cancer J.Clin.,38-75;quiz 77-80(2001).)。与这一临床观察一致,我们的分析还表明,不是所有具有结肠癌家族病史的个体都在MNCM中具有改变的基因表达。由于在本研究中分析的基因参与结肠癌的发展,我们猜测在MNCM具有改变的基因表达的个体可能比没有改变的基因表达的那些个体更容易发展息肉或癌症。为了验证这一假说,需要对大量研究受试者的远景调查。如果这样的相关性得到证实,可能通过应用直肠乙状结肠组织活检样品的基因表达分析而确定处于发展结肠癌的增加的危险中的个体。理论上,通过分析随机的MNCM样品,与具有局部改变的个体相比,更容易确定在MNCm具有综合改变的个体。然而,如果为应用多样品的分析选择适宜的基因组,那么它可能有充分的预测力来确定这样的患者。
现在来看图5,应用常规通用目的或专用的数字计算机和/或按照本公开内容的教导编程的处理器,这对于计算机领域的技术人员是显而易见的,可以实现图5的各个方面。基于本公开内容的教导,这对于计算机领域的技术人员是显而易见的,适宜的软件编码可以由熟练的程序员容易地制定。本发明还可以通过制定集成电路和/或通过将适宜的计算机电路网络相互连接而实现,这对于计算机领域的技术人员是非常显而易见的。
各个方面包括一种计算机程序产物,其是一种具有指示和/或存储于其上/其中的信息的存储介质,所述存储介质可以用于编程通用目的的或专用的计算处理器/装置,以完成本文描述的任何特征。存储介质可以包括但不限于,一种或多种的下列各项任何类型的物理介质,包括软盘、光盘、DVDs、CD-ROMs、微驱动(microdrives)、磁光盘、全息照相存储装置、ROMs、RAMs、EPROMs、EEPROMs、DRAMs、PRAMS、VRAMs、闪存装置、磁或光卡、纳米-系统(包括分子记忆ICs);纸或基于纸的介质;以及适用于存储指示和/或信息的任何类型的介质或装置。各个方面包括一种可以全部或部分并且越过一个或多个公共的和/或私人网络而传输的计算机程序产物,其中所述传输包括指示(instruction)和/或信息,其可以由一个或多个处理器用来完成本文所述的任何特征。在各个方面中,传输可以包括多种独立的传输。
保存在一种或多种计算机可读的介质(媒体)上,本公开内容包括控制通用目的/专用计算机和/或处理器的硬件,和使得所述计算机和/或处理器能够同人使用者或应用本发明结果的其它机械装置相互作用的软件。这样的软件可以包括但不限于,装置驱动器、操作系统、执行环境/容器、用户界面和应用软件。
编码的执行可以是直接的或间接的。编码可以包括汇编、翻译和其它类型的语言。除非另外由要求的语言所限定,编码的执行和/或传输和/或功能编码片段可以包括对其它软件或装置,局域的或远程的援引或调用,以行使所述功能。所述援引或调用可以包括对图书馆模块、装置驱动器和远程软件的援引或调用,以行使所述功能。援引或调用可以包括在分布式的和客户/服务器系统的援引或调用。
图6描述本公开内容的一个方面,其具有用于结肠黏膜细胞最低程度侵入性取样的擦拭取样和传送系统400。图6的系统400由药签410和容器420组成。容器420,诸如通过图6所示的这方面内容所描述的一种,被设置以稳定、提取并且保存结肠黏膜细胞样品,直到可以使用公开的生物标记组对样品进行CRC早期检测的诊断检测。
药签410具有从杆414末端延伸出来的头412。头410可以式许多形状,诸如椭圆形的、正方形的、矩形的、圆的等,并且沿着杆的末端具有约0.5cm-1.0cm的最大宽度,和约1.0cm-10.0cm的长度。头412可以由许多材料组成,诸如例如棉花、人造纤维、聚酯、和聚合物泡沫、或者这样的材料的组合。杆414由具有充分的机械强度和充分的弹性的材料制成,所述机械强度足以擦拭直肠区域,充分的弹性足以防止伤害。用于直肠药签的具有强度和弹性的杆材料的实例包括木材、纸和各种聚合物材料,诸如聚酯、聚苯乙烯、和聚氨酯、以及这样的聚合物的组合物。
容器420具有主体412和帽424。主体412可以具有各种长度和直径,以容纳上文所述的具有头412的大小和杆414的长度范围的药签410。容器的主体412可以由许多聚合物材料制成,诸如聚乙烯、聚丙稀、聚碳酸酯、聚碳氟化合物、或玻璃,而帽424典型地由理想的聚合物材料制成,诸如用于主体412给出的实例。容器420在底部具有试剂426,当作为最低程度侵入性取样技术进行直肠区域擦拭取样时,其适于稳定并且提取在药签410上收集的结肠黏膜细胞。另外,可以使用不需要药签410的容器420,其具有适于稳定并且从粪便样品提取结肠黏膜细胞样品的试剂426。
试剂426含有浓度至少约0.4M的缓冲的硫氰酸胍溶液,和浓度约0.1-10%的其它组织变性剂诸如生物表面活性剂。理想的生物表面活性剂可以是两性离子的,诸如CHAPS或CHAPSO,非离子的,诸如TWEEN,或任何烷基糖苷(alkylglucoside)表面活性剂,或离子的,诸如SDS。可以使用各种缓冲液,例如,通常已知为Good’s缓冲液的那些,诸如Tris。为了将试剂426有效地缓冲到约7.0-8.5的pH,缓冲液的浓度可能不同。
还考虑了使用如图6中公开内容的一方面的擦拭取样方式和传送系统400提取的样品可以进行处理,并且数据在使用上文公开的计算机硬件和软件的单一仪器中进行分析。即,从图6公开内容的一方面获得的样品可以按照图5在单一仪器中进行分析。然而,还考虑了患者的血液或粪便样品可以在单一仪器中进行分析。在一个实施方案中,所述仪器的一个方面是第一元件,其用于对患者样品进行RT-PCR,以进行基因表达分布作图,如上文所述那样。基因表达分布作图允许对SEQ.ID Nos 1-16的cDNA定量,所述cDNA是从患者样品细胞制备的mRNA反转录的。SEQ.ID Nos33-64的成套引物用于RT-PCR反应,以引发与SEQ.ID Nos 1-16对应的mRNA链,并且由此合成与SEQ.ID Nos 1-16对应的cDNA。
从RT-PCR获得cDNAs后,数据由所述仪器的第二元件进行比较,以控制已经存储在所述仪器的存储介质上的数据。应用软件使用上文公开的多变量分析,以执行ANOVA、M-Dist或其它多变量分析方式的指示。基于统计学分析,合格的诊断专家可以评估CRC的存在或不存在,CRC的进展,和/或CRC的治疗效果。
在本公开内容的另一方面,对于CRC的早期检测,可以使用单一仪器,进行患者样品的蛋白表达分布作图。术语“多肽(polypeptide)”或“多肽(polypeptides)”在本文中可以与术语“蛋白(protein)”或“蛋白(proteins)”互换地使用。如先前讨论的那样,已经对蛋白研究了很久,研究其作为生物标记的潜力,但是有很少的成功。作为多聚核苷酸生物标记的补充,蛋白生物标记存在有价值。使得信息由两种类型的生物标记提供的原因包括目前这样的观察,即,mRNA表达水平不是蛋白表达水平的良好的预报因子,和mRNA表达水平没有提供任何蛋白翻译后修饰的信息,而蛋白翻译后修饰对于其生物活性是关键的。因此,为了理解蛋白的表达水平,以及它们完整的结构,需要对蛋白进行直接分析。
本文公开的是在SEQ.ID NOs 17-32列出的蛋白,其与SEQ.ID NOs1-16表示的基因相对应。本公开发明的另一方面是确定SEQ.ID NOs.17-32表示的蛋白的表达水平。通过上文公开的非-或者最低程度侵入性方法提取的患者样品可以用来制备固定细胞或者样品细胞的蛋白提取物。用于蛋白表达分布作图的细胞可以通过图6的方法获得,或者备选地例如通过血液样品或粪便样品、或其它非侵入性或最低程度侵入性方法(或者当然通过更常规的侵入性方法,包括例如乙状结肠镜检和其它方法)而获得。
在所述仪器的第一元件中,细胞或蛋白提取物可以用一组针对所申请的全体生物标记的抗体——单克隆的或多克隆的——进行检测,以测定目的多肽的水平。所述检测的目的是检测并且定量与SEQ.ID NOs 1-16中生物标记的基因序列相对应的蛋白,即SEQ.ID NOs 17-32的表达。
在考虑到所述方法的本公开内容的一方面,基于生物标记组的抗体组的抗体可以结合到固体支持物上。用于蛋白表达分布作图的方法可以使用第二抗体,其具有针对某些结合的、目的多肽部分的特异性。这样的第二抗体可以用有效检测并且量化所结合的多肽的分子进行标记,并且因此在与所述多肽结合时,将其标记用于检测和定量。另外,考虑了其它试剂用于标记所结合的多肽以便检测和定量。这样的试剂可以直接标记结合的多肽,或者与第二抗体类似,可以是对具有标记的结合的多肽具有特异性的部分。这样的部分的实例包括但不限于小分子,诸如辅因子、底物、配位剂等,或大分子,诸如凝集素、肽、寡核苷酸等。这样的部分可以是天然存在的或合成的。
关于所公开的方法的检测方式的实例包括但不限于分光镜技术,诸如荧光和UV-Vis分光镜,闪烁计数和质谱。作为这些检测方式的补充,这些方法中应用的检测和量化目的的标记的实例包括但不限于发色团标记、闪烁标记和大量标记(mass labels)。使用这些方法在仪器的第二元件中测定的多聚核苷酸和多肽的表达水平可以相对于为目标确定目的确定的对照进行标准化。对照数据存储在计算机内,其为所述仪器的第三元件。
第四软件元件将从一名或多名患者样品获得的数据与对照数据相比较。比较将包括至少一种多变量分析,并且可以包括ANOVA、MANOVA、M-Dist和本领域的普通技术人员已知的其它方法。一旦统计学分析和比较进行并且完成,医师或其它合格的人员可以为一名或多名患者的CRC状况做出诊断。
现在来看本公开内容的药物筛选方面,应该意识到,本文公开的生物标记组是基因及其表达产物,已知它们参与下述代谢途径和过程1)氧化压力/炎症;2)APC/b-联蛋白途径;3)细胞周期/转录因子;和4)参与细胞/细胞通信、生长、修复和对损伤和外伤应答的细胞因子和其它因子的作用。存在越来越多的证据,这些途径,并且因此本生物标记组的成员还参与除CRC外的许多其它种类的癌症,诸如肺癌、前列腺癌和乳腺癌,以及神经退行性疾病,诸如阿尔茨海默病和肌萎缩性侧索硬化症(“ALS”)。在这样的病理中,参与这些途径的基因及其表达产物对于许多不同类型的细胞的生长、维持和压力应答是基本的。在病理学如癌症和神经退化中,某些改变的基因的改变的表达导致一种或多种病理症状,以致这些基因及其表达产物的改变是所述具体病理的特征性生物标记。在这一方面,表面上不相关的病理,诸如各种癌症和神经退行性疾病,是非常复杂的病理的表现,所述每一种病理包括所述生物标记的离散的成员,所述生物标记是来源于上述途径和过程组的基因及其表达产物。作为这一点的实践证据,现在应该理解,COX-2抑制剂不但对于包括结肠癌和其它癌症的广泛种类的疾病,而且还对神经退行性疾病有治疗价值。
本文公开的是图1的主题生物标记组在药物发明方法中的应用,所述药物发现方法关于病理诸如癌症,例如CRC、肺癌、前列腺癌和乳腺癌,和神经退行性疾病,例如阿尔茨海默病和ALS。如上文提及的,改变的基因及其表达产物的离散模式为每种特殊的疾病提供了唯一的识别标记,所以所述组为各种病理提供了必需的选择性。药物意指用于病理治疗的任何治疗性药剂。这包括常规合成的分子、天然产物、合成修饰的天然产物、和生物制药产物、诸如多肽和多聚核苷酸、以及它们的组合、提取物和制剂。
药物筛选是叫作药物发明期的药物开发的第一阶段。通过药物筛选过程合格的有希望的药物典型地叫作leads,也就是说,当通过筛选过程的标准时,它们是先进的,进一步在通常叫作lead最优化(lead optimization)的药物发明阶段进行检测。如果通过药物发明的lead最优化阶段,所述leads就是合格的候选,并且优先越过药物发明阶段到叫作预临床试验的药物开发的下一阶段,并且被称为研究性新药(“IND”)。如果所述IND是先进的,那么它优先进行临床试验,在这种情形中它在人受试者中进行检验。最后,如果所述IND通过临床试验阶段表现的有希望,那么在FDA正式批准后,它可以被商业化。已知对于单一候选的整个药物开发过程要花费10-15年,和数百万美元的开发费用。由于这一原因,药物开发机构目前的策略是集中在药物发明阶段,有效地找出有希望的药物,并且只将具有高成功潜力的候选进一步通过余下的药物开发周期。
在药物发明的筛选阶段,评估有希望的药物的特异性检测针对合格的生物模型系统进行,为其监测特异性的终端。用作关于病理诸如癌症,例如CRC、肺癌、前列腺癌和乳腺癌,和神经退行性疾病例如阿尔茨海默病和ALS的药物筛选的替代终端的生物标记组,不但是有效用于这样的病理的早期检测的组,而且还表现出这样的调控,即,所述调控通过药物以与病理发生或复发减少相关的方式进行。另外地,有效用于这样的病理的早期检测的生物标记组的一个或多个成员,还可以用作对于这样的病理的药物筛选的目标。随后要讨论,图1所述的生物标记可以用作模式生物系统的替代终端,以及药物筛选的目标。
在筛选阶段,可以评估大文库的有希望的药物,代表在单一筛选方案中数万种化合物的通量。视为低通量筛选(“LTS”)的为约10,000-约50,000种有希望的药物,而中等通量筛选(“MTS”)代表约50,00-约100,00种有希望的药物,并且高通量筛选(“HTS”)是100,000-约500,000种有希望的药物。
筛选方案的意思包括进行筛选的检测流程和分析方法。那么,筛选方案包括下列因素,诸如将要用于所述检测的生物模型的类型;进行检测的条件;要用的有希望的药物候选或有希望的候选的文库的类型;要使用的设备的类型;和数据收集、处理和存储的方式。筛选方案——LTS、MTS或HIS——的规模受到下列因素的影响,诸如检测流程(例如,检测类型)、分析方法(例如,小型化、自动化)、以及计算能力和容量。生物模型系统的意思包括全部生物体、全部细胞、细胞裂解物和目标分子。在考虑治疗应用时,有希望的药物候选的意思是任何类型的分子或分子制剂或混悬液。例如,有希望的药物候选可以是合成的分子、天然产物、合成修饰的天然产物、和生物制药产物、诸如多肽和多聚核苷酸、以及它们的组合、提取物和制剂。
如上文所讨论的那样,图1提供用于实践本公开发明的生物标记组的序列表。本公开内容的一方面是SEQ.ID NOs 1-16给出的16种确定的编码序列的生物标记组,而生物标记组的另一方面是SEQ.ID NOs 17-31给出的16种确定的蛋白。本发明的这两方面提供了病理早期检测所需要的选择性和灵敏性,所述病理诸如癌症,例如CRC、肺癌、前列腺癌和乳腺癌,和神经退行性疾病,例如阿尔茨海默病和ALS。
如先前提及的那样,CRC是关于新药开发的一种典型的病理。对于CRC,还没有确定对于CRC早期检测具有可接受的高度选择性和灵敏性的生物标记或生物标记组。因此,图1所述的是在为CRC早期检测提供基础中分化的生物标记组的方面。临床定义的生物标记的选择性是指正确诊断的患者百分数。临床内容中的生物标记的灵敏性定义为疾病在可治愈阶段被检测出来的可能性。理想地,生物标记将具有100%的临床选择性和100%的临床灵敏性。到目前为止,还没有确定这样的生物标记或生物标记组,其具有有效用于患者护理管理的宽范围需求所需要的可接受的高度的选择性和灵敏性。
进行筛选的分析方法可以包括上文公开的用于CRC早期检测方法,即,从生物样品的mRNA进行基因表达分布作图,以确定生物标记的基因表达,和它们的表达水平怎样受到有希望的药物候选的影响(包括使用RT-PCR),和/或由于应用有希望的药物候选引起的图1多肽生物标记的蛋白表达水平;然后应用多变量统计学分析来确定,使用和不使用所述有希望的药物候选,组中各种标记的表达水平的统计学显著性。
参考图7,药物筛选公开内容的一方面考虑获得组织样品,诸如擦拭样品(见图6)、血液样品或组织活检,所述样品可以通过,例如,最低程度侵入性的、侵入性的或非侵入性的方法提取。可以使用适宜的裂解缓冲液来提取并且保存组织样品中细胞的RNA。然后,可以在提取的RNA上进行RT-PCR,并且转化成cDNA,如上文公开的那样,使用,例如至少2条SEQ.ID NOs 33-64列出的对图1的生物标记组特异的引物,来筛选药物的作用效果。然后,检测的结果可以进行多变量分析和M-dist,如上文所述那样,并且将结果与对照数据进行比较。
图8描述药物筛选公开内容的另一方面,其中制备针对SEQ.ID NOs17-32列出的至少2种生物标记蛋白的抗体,并且将所述抗体用来从例如上文列出的组织活检和其它组织样品中检测生物系统,例如,全细胞、细胞裂解物等。所述抗体用于检测并且量化SEQ.ID NOs 17-32确定的生物标记肽的表达,以致这些生物标记肽的表达可以作为给所述生物系统定量给予潜力药物的函数而进行监测。结果可以进行多变量和单一变量分析和M-dist.,如上文公开的那样,并且与对照数据进行比较。
出于举例说明和描述的目的提供本文公开的内容。不是意欲穷尽或者将公开的内容局限在所述的精确形式上。对于本领域熟练的实践者,许多改进和变化是显而易见的。为了更好地解释所述技术公开的实施方案的原理和实践应用,因而使得本领域的其它技术人员能够理解适于考虑的具体应用的各种实施方案和各种改进,选择并且描述了公开的内容。
上文引用的参考文献通过参考完全结合于此。
序列表<110>南希.M.李<120>用于结肠直肠癌早期检测的药物筛选和分子诊断检测试剂、方法及其试剂盒<130>NLEE-01001WO0 MCF/MLB<150>60/614,746<151>2004-09-30<150>60/651,344<151>2005-02-08<150>Not Assigned<151>2005-09-29<160>64<170>PatentIn version 3.3<210>1<211>1629<212>DNA<213>人<400>1gcagagcaca caagcttcta ggacaagagc caggaagaaa ccaccggaag gaaccatctc60actgtgtgta aacatgactt ccaagctggc cgtggctctc ttggcagcct tcctgatttc120cgcagctctg tgtgaaggtg cagttttgcc aaggagtgct aaagaactta gatgtcagtg180cataaagaca tactccaaac ctttccaccc caaatttatc aaagaactga gagtgattga240gagtggacca cactgcgcca acacagaaat tatgtaaagc tttctgatgg aagagagctc300cgtctggacc ccaaggaaaa ctgggtgcag agggttgtgg agaagttttt gaagagggct360gagaattcag aattcataaa aaaattcatt ctctgtggta tccaagaatc agtgaagatg420ccagtgaaac ttcaagcaaa tctacttcaa cacttcatgt attgtgtggg tctgttgtag480ttgccaga tgcaatacaa gattcctggt taaatttgaa tttcagtaaa caatgaatag540cttttcattg taccatgaaa tatccagaac atacttatat gtaaagtatt atttatttga600atctacaaaa aacaacaaat aatttttaaa tataaggatt ttcctagata ttgcacggga660gaatatacaa atagcaaaat tgaggccaag ggccaagaga atatccgaac tttaatttca720ggaattgaat gggtttgcta gaatgtgata tttgaagcat cacataaaaa tgatgggaca780ataaattttg ccataaagtc aaatttagct ggaaatcctg gatttttttc tgttaaatct840ggcaacccta gtctgctagc caggatccac aagtccttgt tccactgtgc cttggtttct900cctttatttc taagtggaaa aagtattagc caccatctta cctcacagtg atgttgtgag960
gacatgtgga agcactttaa gttttttcat cataacataa attattttca agtgtaactt 1020attaacctat ttattattta tgtatttatt taagcatcaa atatttgtgc aagaatttgg 1080aaaaatagaa gatgaatcat tgattgaata gttataaaga tgttatagta aatttatttt 1140attttagata ttaaatgatg ttttattaga taaatttcaa tcagggtttt tagattaaac 1200aaacaaacaa ttgggtaccc agttaaattt tcatttcaga taaacaacaa ataatttttt 1260agtataagta cattattgtt tatctgaaat tttaattgaa ctaacaatcc tagtttgata 1320ctcccagtct tgtcattgcc agctgtgttg gtagtgctgt gttgaattac ggaataatga 1380gttagaacta ttaaaacagc caaaactcca cagtcaatat tagtaatttc ttgctggttg 1440aaacttgttt attatgtaca aatagattct tataatatta tttaaatgac tgcattttta 1500aatacaaggc tttatatttt taactttaag atgtttttat gtgctctcca aatttttttt 1560actgtttctg attgtatgga aatataaaag taaatatgaa acatttaaaa tataatttgt 1620tgtcaaagt 1629<210>2<211>3356<212>DNA<213>人<400>2gtccaggaac tcctcagcag cgcctccttc agctccacag ccagacgccc tcagacagca60aagcctaccc ccgcgccgcg ccctgcccgc cgctgcgatg ctcgcccgcg ccctgctgct120gtgcgcggtc ctggcgctca gccatacagc aaatccttgc tgttcccacc catgtcaaaa180ccgaggtgta tgtatgagtg tgggatttga ccagtataag tgcgattgta cccggacagg240attctatgga gaaaactgct caacaccgga atttttgaca agaataaaat tatttctgaa300acccactcca aacacagtgc actacatact tacccacttc aagggatttt ggaacgttgt360gaataacatt cccttccttc gaaatgcaat tatgagttat gtgttgacat ccagatcaca420tttgattgac agtccaccaa cttacaatgc tgactatggc tacaaaagct gggaagcctt480ctctaacctc tcctattata ctagagccct tcctcctgtg cctgatgatt gcccgactcc540cttgggtgtc aaaggtaaaa agcagcttcc tgattcaaat gagattgtgg aaaaattgct600tctaagaaga aagttcatcc ctgatcccca gggctcaaac atgatgtttg cattctttgc660ccagcacttc acgcatcagt ttttcaagac agatcataag cgagggccag ctttcaccaa720cgggctgggc catggggtgg acttaaatca tatttacggt gaaactctgg ctagacagcg780taaactgcgc cttttcaagg atggaaaaat gaaatatcag ataattgatg gagagatgta840tcctcccaca gtcaaagata ctcaggcaga gatgatctac cctcctcaag tccctgagca900tctacggttt gctgtggggc aggaggtctt tggtctggtg cctggtctga tgatgtatgc960
cacaatctgg ctgcgggaac acaacagagt atgcgatgtg cttaaacagg agcatcctga1020atggggtgat gagcagttgt tccagacaag caggctaata ctgataggag agactattaa1080gattgtgatt gaagattatg tgcaacactt gagtggctat cacttcaaac tgaaatttga1140cccagaacta cttttcaaca aacaattcca gtaccaaaat cgtattgctg ctgaatttaa1200caccctctat cactggcatc cccttctgcc tgacaccttt caaattcatg accagaaata1260caactatcaa cagtttatct acaacaactc tatattgctg gaacatggaa ttacccagtt1320tgttgaatca ttcaccaggc aaattgctgg cagggttgct ggtggtagga atgttccacc1380cgcagtacag aaagtatcac aggcttccat tgaccagagc aggcagatga aataccagtc1440ttttaatgag taccgcaaac gctttatgct gaagccctat gaatcatttg aagaacttac1500aggagaaaag gaaatgtctg cagagttgga agcactctat ggtgacatcg atgctgtgga1560gctgtatcct gcccttctgg tagaaaagcc tcggccagat gccatctttg gtgaaaccat1620ggtagaagtt ggagcaccat tctccttgaa aggacttatg ggtaatgtta tatgttctcc1680tgcctactgg aagccaagca cttttggtgg agaagtgggt tttcaaatca tcaacactgc1740ctcaattcag tctctcatct gcaataacgt gaagggctgt ccctttactt cattcagtgt1800tccagatcca gagctcatta aaacagtcac catcaatgca agttcttccc gctccggact1860agatgatatc aatcccacag tactactaaa agaacgttcg actgaactgt agaagtctaa1920tgatcatatt tatttattta tatgaaccat gtctattaat ttaattattt aataatattt1980atattaaact ccttatgtta cttaacatct tctgtaacag aagtcagtac tcctgttgcg2040gagaaaggag tcatacttgt gaagactttt atgtcactac tctaaagatt ttgctgttgc2100tgttaagttt ggaaaacagt ttttattctg ttttataaac cagagagaaa tgagttttga2160cgtcttttta cttgaatttc aacttatatt ataagaacga aagtaaagat gtttgaatac2220ttaaacactg tcacaagatg gcaaaatgct gaaagttttt acactgtcga tgtttccaat2280gcatcttcca tgatgcatta gaagtaacta atgtttgaaa ttttaaagta cttttggtta2340tttttctgtc atcaaacaaa aacaggtatc agtgcattat taaatgaata tttaaattag2400acattaccag taatttcatg tctacttttt aaaatcagca atgaaacaat aatttgaaat2460ttctaaattc atagggtaga atcacctgta aaagcttgtt tgatttctta aagttattaa2520acttgtacat ataccaaaaa gaagctgtct tggatttaaa tctgtaaaat cagtagaaat2580tttactacaa ttgcttgtta aaatatttta taagtgatgt tcctttttca ccaagagtat2640aaaccttttt agtgtgactg ttaaaacttc cttttaaatc aaaatgccaa atttattaag2700gtggtggagc cactgcagtg ttatcttaaa ataagaatat tttgttgaga tattccagaa2760tttgtttata tggctggtaa catgtaaaat ctatatcagc aaaagggtct acctttaaaa2820taagcaataa caaagaagaa aaccaaatta ttgttcaaat ttaggtttaa acttttgaag2880
caaacttttt tttatccttg tgcactgcag gcctggtact cagattttgc tatgaggtta2940atgaagtacc aagctgtgct tgaataatga tatgttttct cagattttct gttgtacagt3000ttaatttagc agtccatatc acattgcaaa agtagcaatg acctcataaa atacctcttc3060aaaatgctta aattcatttc acacattaat tttatctcag tcttgaagcc aattcagtag3120gtgcattgga atcaagcctg gctacctgca tgctgttcct tttcttttct tcttttagcc3180attttgctaa gagacacagt cttctcatca cttcgtttct cctattttgt tttactagtt3240ttaagatcag agttcacttt ctttggactc tgcctatatt ttcttacctg aacttttgca3300agttttcagg taaacctcag ctcaggactg ctatttagct cctcttaaga agatta3356<210>3<211>1750<212>DNA<213>人<400>3cctacaggtg aaaagcccag cgacccagtc aggatttaag tttacctcaa aaatggaaga60ttttaacatg gagagtgaca gctttgaaga tttctggaaa ggtgaagatc ttagtaatta120cagttacagc tctaccctgc ccccttttct actagatgcc gccccatgtg aaccagaatc180cctggaaatc aacaagtatt ttgtggtcat tatctatgcc ctggtattcc tgctgagcct240gctgggaaac tccctcgtga tgctggtcat cttatacagc agggtcggcc gctccgtcac300tgatgtctac ctgctgaacc tagccttggc cgacctactc tttgccctga ccttgcccat360ctgggccgcc tccaaggtga atggctggat ttttggcaca ttcctgtgca aggtggtctc420actcctgaag gaagtcaact tctatagtgg catcctgcta ctggcctgca tcagtgtgga480ccgttacctg gccattgtcc atgccacacg cacactgacc cagaagcgct acttggtcaa540attcatatgt ctcagcatct ggggtctgtc cttgctcctg gccctgcctg tcttactttt600ccgaaggacc gtctactcat ccaatgttag cccagcctgc tatgaggaca tgggcaacaa660tacagcaaac tggcggatgc tgttacggat cctgccccag tcctttggct tcatcgtgcc720actgctgatc atgctgttct gctacggatt caccctgcgt acgctgttta aggcccacat780ggggcagaag caccgggcca tgcgggtcat ctttgctgtc gtcctcatct tcctgctttg840ctggctgccc tacaacctgg tcctgctggc agacaccctc atgaggaccc aggtgatcca900ggagacctgt gagcgccgca atcacatcga ccgggctctg gatgccaccg agattctggg960catccttcac agctgcctca accccctcat ctacgccttc attggccaga agtttcgcca1020tggactcctc aagattctag ctatacatgg cttgatcagc aaggactccc tgcccaaaga1080cagcaggcct tcctttgttg gctcttcttc agggcacact tccactactc tctaagacct1140cctgcctaag tgcagccccg tggggttcct cccttctctt cacagtcaca ttccaagcct1200
catgtccact ggttcttctt ggtctcagtg tcaatgcagc ccccattgtg gtcacaggaa1260gcagaggagg ccacgttctt actagtttcc cttgcatggt ttagaaagct tgccctggtg1320cctcacccct tgccataatt actatgtcat ttgctggagc tctgcccatc ctgcccctga1380gcccatggca ctctatgttc taagaagtga aaatctacac tccagtgaga cagctctgca1440tactcattag gatggctagt atcaaaagaa agaaaatcag gctggccaac gggatgaaac1500cctgtctcta ctaaaaatac aaaaaaaaaa aaaaaaatta gccgggcgtg gtggtgagtg1560cctgtaatca cagctacttg ggaggctgag atgggagaat cacttgaacc cgggaggcag1620aggttgcagt gagccgagat tgtgcccctg cactccagcc tgagcgacag tgagactctg1680tctcagtcca tgaagatgta gaggagaaac tggaactctc gagcgttgct gggggggatt1740gtaaaatggt 1750<210>4<211>3939<212>DNA<213>人<400>4cctgggtcct ctcggcgcca gagccgctct ccgcatccca ggacagcggt gcggccctcg60gccggggcgc ccactccgca gcagccagcg agccagctgc cccgtatgac cgcgccgggc120gccgccgggc gctgccctcc cacgacatgg ctgggctccc tgctgttgtt ggtctgtctc180ctggcgagca ggagtatcac cgaggaggtg tcggagtact gtagccacat gattgggagt240ggacacctgc agtctctgca gcggctgatt gacagtcaga tggagacctc gtgccaaatt300acatttgagt ttgtagacca ggaacagttg aaagatccag tgtgctacct taagaaggca360tttctcctgg tacaagacat aatggaggac accatgcgct tcagagataa caccgccaat420cccatcgcca ttgtgcagct gcaggaactc tctttgaggc tgaagagctg cttcaccaag480gattatgaag agcatgacaa ggcctgcgtc cgaactttct atgagacacc tctccagttg540ctggagaagg tcaagaatgt ctttaatgaa acaaagaatc tccttgacaa ggactggaat600attttcagca agaactgcaa caacagcttt gctgaatgct ccagccaaga tgtggtgacc660aagcctgatt gcaactgcct gtaccccaaa gccatcccta gcagtgaccc ggcctctgtc720tcccctcatc agcccctcgc cccctccatg gcccctgtgg ctggcttgac ctgggaggac780tctgagggaa ctgagggcag ctccctcttg cctggtgagc agcccctgca cacagtggat840ccaggcagtg ccaagcagcg gccacccagg agcacctgcc agagctttga gccgccagag900accccagttg tcaaggacag caccatcggt ggctcaccac agcctcgccc ctctgtcggg960gccttcaacc ccgggatgga ggatattctt gactctgcaa tgggcactaa ttgggtccca1020gaagaagcct ctggagaggc cagtgagatt cccgtacccc aagggacaga gctttccccc1080
tccaggccag gagggggcag catgcagaca gagcccgcca gacccagcaa cttcctctca1140gcatcttctc cactccctgc atcagcaaag ggccaacagc cggcagatgt aactgctaca1200gccttgccca gggtgggccc cgtgatgccc actggccagg actggaatca caccccccag1260aagacagacc atccatctgc cctgctcaga gaccccccgg agccaggctc tcccaggatc1320tcatcactgc gcccccaggc cctcagcaac ccctccaccc tctctgctca gccacagctt1380tccagaagcc actcctcggg cagcgtgctg ccccttgggg agctggaggg caggaggagc1440accagggatc ggacgagccc cgcagagcca gaagcagcac cagcaagtga aggggcagcc1500aggcccctgc cccgttttaa ctccgttcct ttgactgaca caggccatga gaggcagtcc1560gagggatcct ccagcccgca gctccaggag tctgtcttcc acctgctggt gcccagtgtc1620atcctggtct tgctggctgt cggaggcctc ttgttctaca ggtggaggcg gcggagccat1680caagagcctc agagagcgga ttctcccttg gagcaaccag agggcagccc cctgactcag1740gatgacagac aggtggaact gccagtgtag agggaattct aagctggacg cacagaacag1800tctcttcgtg ggaggagaca ttatggggcg tccaccacca cccctccctg gccatcctcc1860tggaatgtgg tctgccctcc accagagctc ctgcctgcca ggactggacc agagcagcca1920ggctggggcc cctctgtctc aacccgcaga cccttgactg aatgagagag gccagaggat1980gctccccatg ctgccactat ttattgtgag ccctggaggc tcccatgtgc ttgaggaagg2040ctggtgagcc cggctcagga ccctcttccc tcaggggctg cagcctcctc tcactccctt2100ccatgccgga acccaggcca gggacccacc ggcctgtggt ttgtgggaaa gcagggtgca2160cgctgaggag tgaaacaacc ctgcacccag agggcctgcc tggtgccaag gtatcccagc2220ctggacaggc atggacctgt ctccagacag aggagcctga agttcgtggg gcgggacagc2280ctcggcctga tttcccgtaa aggtgtgcag cctgagagac gggaagagga ggcctctgca2340cctgctggtc tgcactgaca gcctgaaggg tctacaccct cggctcacct aagtccctgt2400gctggttgcc aggcccagag gggaggccag ccctgccctc aggacctgcc tgacctgcca2460gtgatgccaa gagggggatc aagcactggc ctctgcccct cctccttcca gcacctgcca2520gagcttctcc agcaggccaa gcagaggctc ccctcatgaa ggaagccatt gcactgtgaa2580cactgtacct gcctgctgaa cagcctcccc ccgtccatcc atgagccagc atccgtccgt2640cctccactct ccagcctctc cccagcctcc tgcactgagc tggcctcacc agtcgactga2700gggagcccct cagccctgac cttctcctga cctggccttt gactccccgg agtggagtgg2760ggtgggagaa cctcctgggc cgccagccag agccgctctt taggctgtgt tcttcgccca2820ggtttctgca tcttccactt tgacattccc aagagggaag ggactagtgg gagagagcaa2880gggaggggag ggcacagaca gagagcctac agggcgagct ctgactgaag atgggccttt2940
gaaatatagg tatgcacctg aggttggggg agggtctgca ctcccaaacc ccagcgcagt3000gtcctttccc tgctgccgac aggaacctgg ggctgagcag gttatccctg tcaggagccc3060tggactgggc tgcatctcag ccccacctgc atggtatcca gctcccatcc acttctcacc3120cttctttcct cctgaccttg gtcagcagtg atgacctcca actctcaccc accccctcta3180ccatcacctc taaccaggca agccagggtg ggagagcaat caggagagcc aggcctcagc3240ttccaatgcc tggagggcct ccactttgtg gccagcctgt ggtgctggct ctgaggccta3300ggcaacgagc gacagggctg ccagttgccc ctgggttcct ttgtgctgct gtgtgcctcc3360tctcctgccg ccctttgtcc tccgctaaga gaccctgccc tacctggccg ctgggccccg3420tgactttccc ttcctgccca ggaaagtgag ggtcggctgg ccccaccttc cctgtcctga3480tgccgacagc ttagggaagg gcactgaact tgcatatggg gcttagcctt ctagtcacag3540cctctatatt tgatgctaga aaacacatat ttttaaatgg aagaaaaata aaaaggcatt3600cccccttcat ccccctacct taaacatata atattttaaa ggtcaaaaaa gcaatccaac3660ccactgcaga agctcttttt gagcacttgg tggcatcaga gcaggaggag ccccagagcc3720acctctggtg tcccccaggc tacctgctca ggaacccctt ctgttctctg agaactcaac3780agaggacatt ggctcacgca ctgtgagatt ttgtttttat acttgcaact ggtgaattat3840tttttataaa gtcatttaaa tatctattta aaagatagga agctgcttat atatttaata3900ataaaagaag tgcacaagct gccgttgacg tagctcgag 3939<210>5<211>1024<212>DNA<213>人<400>5atggcccgcg ctgctctctc cgccgccccc agcaatcccc ggctcctgcg agtggcactg60ctgctcctgc tcctggtagc cgctggccgg cgcgcagcag gagcgtccgt ggccactgaa120ctgcgctgcc agtgcttgca gaccctgcag ggaattcacc ccaagaacat ccaaagtgtg180aacgtgaagt cccccggacc ccactgcgcc caaaccgaag tcatagccac actcaagaat240gggcggaaag cttgcctcaa tcctgcatcc cccatagtta agaaaatcat cgaaaagatg300ctgaacagtg acaaatccaa ctgaccagaa gggaggagga agctcactgg tggctgttcc360tgaaggaggc cctgccctta taggaacaga agaggaaaga gagacacagc tgcagaggcc420acctggattg tgcctaatgt gtttgagcat cgcttaggag aagtcttcta tttatttatt480tattcattag ttttgaagat tctatgttaa tattttaggt gtaaaataat taagggtatg540attaactcta cctgcacact gtcctattat attcattctt tttgaaatgt caaccccaag600ttagttcaat ctggattcat atttaatttg aaggtagaat gttttcaaat gttctccagt660
cattatgtta atatttctga ggagcctgca acatgccagc cactgtgata gaggctggcg720gatccaagca aatggccaat gagatcattg tgaaggcagg ggaatgtatg tgcacatctg780ttttgtaact gtttagatga atgtcagttg ttatttattg aaatgatttc acagtgtgtg840gtcaacattt ctcatgttga aactttaaga actaaaatgt tctaaatatc ccttggacat900tttatgtctt tcttgtaagg catactgcct tgtttaatgg tagttttaca gtgtttctgg960cttagaacaa aggggcttaa ttattgatgt tttcatagag aatataaaaa taaagcactt1020atag 1024<210>6<211>1064<212>DNA<213>人<220>
<221>misc_feature<222>(27)..(27)<223>n=a,c,g,t<220>
<221>misc_feature<222>(766)..(766)<223>n=a,c,g,t<400>6cacagccggg tcgcaggcac ctccccngcc agctctcccg cattctgcac agcttcccga60cgcgtctgct gagccccatg gcccacgcca cgctctccgc cgcccccagc aatccccggc120tcctgcgggt ggcgctgctg ctcctgctcc tggtgggcag ccggcgcgca gcaggagcgt180ccgtggtcac tgaactgcgc tgccagtgct tgcagacact gcagggaatt cacctcaaga240acatccaaag tgtgaatgta aggtcccccg gaccccactg cgcccaaacc gaagtcatag300ccacactcaa gaatgggaag aaagcttgtc tcaaccccgc atcccccatg gttcagaaaa360tcatcgaaaa gatactgaac aaggggagca ccaactgaca ggagagaagt aagaagctta420tcagcgtatc attgacactt cctgcagggt ggtccctgcc cttaccagag ctgaaaatga480aaaagagaac agcagctttc tagggacagc tggaaaggga cttaatgtgt ttgactattt540cttacgaggg ttctacttat ttatgtattt atttttgaaa gcttgtattt taatatttta600catgctgtta tttaaagatg tgagtgtgtt tcatcaaaca tagctcagtc ctgattattt660aattggaata tgatgggttt taaatgtgtc attaaactaa tatttagtgg gagaccataa720tgtgtcagcc accttgataa atgacagggt ggggaactgg agggtngggg gattgaaatg780caagcaatta gtggatcact gttagggtaa gggaatgtat gtacacatct attttttata840cttttttttt taaaaaagaa tgtcagttgt tatttattca aattatctca cattatgtgt900tcaacatttt tatgctgaag tttcccttag acattttatg tcttgcttgt agggcataat960
gccttgttta atgtccattc tgcagcgttt ctctttccct tggaaaagag aatttatcat1020tactgttaca tttgtacaaa tgacatgata ataaaagttt tatg 1064<210>7<211>1469<212>DNA<213>人<400>7agcagcagga ggaggcagag cacagcatcg tcgggaccag actcgtctca ggccagttgc60agccttctca gccaaacgcc gaccaaggaa aactcactac catgagaatt gcagtgattt120gcttttgcct cctaggcatc acctgtgcca taccagttaa acaggctgat tctggaagtt180ctgaggaaaa gcagctttac aacaaatacc cagatgctgt ggccacatgg ctaaaccctg240acccatctca gaagcagaat ctcctagccc cacagaccct tccaagtaag tccaacgaaa300gccatgacca catggatgat atggatgatg aagatgatga tgaccatgtg gacagccagg360actccattga ctcgaacgac tctgatgatg tagatgacac tgatgattct caccagtctg420atgagtctca ccattctgat gaatctgatg aactggtcac tgattttccc acggacctgc480cagcaaccga agttttcact ccagttgtcc ccacagtaga cacatatgat ggccgaggtg540atagtgtggt ttatggactg aggtcaaaat ctaagaagtt tcgcagacct gacatccagt600accctgatgc tacagacgag gacatcacct cacacatgga aagcgaggag ttgaatggtg660catacaaggc catccccgtt gcccaggacc tgaacgcgcc ttctgattgg gacagccgtg720ggaaggacag ttatgaaacg agtcagctgg atgaccagag tgctgaaacc cacagccaca780agcagtccag attatataag cggaaagcca atgatgagag caatgagcat tccgatgtga840ttgatagtca ggaactttcc aaagtcagcc gtgaattcca cagccatgaa tttcacagcc900atgaagatat gctggttgta gaccccaaaa gtaaggaaga agataaacac ctgaaatttc960gtatttctca tgaattagat agtgcatctt ctgaggtcaa ttaaaaggag aaaaaataca1020atttctcact ttgcatttag tcaaaagaaa aaatgcttta tagcaaaatg aaagagaaca1080tgaaatgctt ctttctcagt ttattggttg aatgtgtatc tatttgagtc tggaaataac1140taatgtgttt gataattagt ttagtttgtg gcttcatgga aactccctgt aaactaaaag1200cttcagggtt atgtctatgt tcattctata gaagaaatgc aaactatcac tgtattttaa1260tatttgttat tctctcatga atagaaattt atgtagaagc aaacaaaata cttttaccca1320cttaaaaaga gaatataaca ttttatgtca ctataatctt ttgtttttta agttagtgta1380tattttgttg tgattatctt tttgtggtgt gaataaatct tttatcttga atgtaataag1440aaaaaaaaaa aaaaaacaaa aaaaaaaaa 1469
<210>8<211>1256<212>DNA<213>人<400>8gcagtagcag cgagcagcag agtccgcacg ctccggcgag gggcagaaga gcgcgaggga60gcgcggggca gcagaagcga gagccgagcg cggacccagc caggacccac agccctcccc120agctgcccag gaagagcccc agccatggaa caccagctcc tgtgctgcga agtggaaacc180atccgccgcg cgtaccccga tgccaacctc ctcaacgacc gggtgctgcg ggccatgctg240aaggcggagg agacctgcgc gccctcggtg tcctacttca aatgtgtgca gaaggaggtc300ctgccgtcca tgcggaagat cgtcgccacc tggatgctgg aggtctgcga ggaacagaag360tgcgaggagg aggtcttccc gctggccatg aactacctgg accgcttcct gtcgctggag420cccgtgaaaa agagccgcct gcagctgctg ggggccactt gcatgttcgt ggcctctaag480atgaaggaga ccatccccct gacggccgag aagctgtgca tctacaccga cggctccatc540cggcccgagg agctgctgca aatggagctg ctcctggtga acaagctcaa gtggaacctg600gccgcaatga ccccgcacga tttcattgaa cacttcctct ccaaaatgcc agaggcggag660gagaacaaac agatcatccg caaacacgcg cagaccttcg ttgcctcttg tgccacagat720gtgaagttca tttccaatcc gccctccatg gtggcagcgg ggagcgtggt ggccgcagtg780caaggcctga acctgaggag ccccaacaac ttcctgtcct actaccgcct cacacgcttc840ctctccagag tgatcaagtg tgacccagac tgcctccggg cctgccagga gcagatcgaa900gccctgctgg agtcaagcct gcgccaggcc cagcagaaca tggaccccaa ggccgccgag960gaggaggaag aggaggagga ggaggtggac ctggcttgca cacccaccga cgtgcgggac1020gtggacatct gaggggccca ggcaggcggg cgccaccgcc acccgcagcg agggcggagc1080cggccccagg tgctccacat gacagtccct cctctccgga gcattttgat accagaaggg1140aaagcttcat tctccttgtt gttggttgtt ttttcctttg ctctttcccc cttccatctc1200tgacttaagc aaaagaaaaa gattacccaa aaactgtctt taaaagagag agagag1256<210>9<211>2121<212>DNA<213>人<400>9ctgctcgcgg ccgccaccgc cgggccccgg ccgtccctgg ctcccctcct gcctcgagaa60gggcagggct tctcagaggc ttggcgggaa aaaagaacgg agggagggat cgcgctgagt120ataaaagccg gttttcgggg ctttatctaa ctcgctgtag taattccagc gagaggcaga180gggagcgagc gggcggccgg ctagggtgga agagccgggc gagcagagct gcgctgcggg240
cgtcctggga agggagatcc ggagcgaata gggggcttcg cctctggccc agccctcccg300cttgatcccc caggccagcg gtccgcaacc cttgccgcat ccacgaaact ttgcccatag360cagcgggcgg gcactttgca ctggaactta caacacccga gcaaggacgc gactctcccg420acgcggggag gctattctgc ccatttgggg acacttcccc gccgctgcca ggacccgctt480ctctgaaagg ctctccttgc agctgcttag acgctggatt tttttcgggt agtggaaaac540cagcagcctc ccgcgacgat gcccctcaac gttagcttca ccaacaggaa ctatgacctc600gactacgact cggtgcagcc gtatttctac tgcgacgagg aggagaactt ctaccagcag660cagcagcaga gcgagctgca gcccccggcg cccagcgagg atatctggaa gaaattcgag720ctgctgccca ccccgcccct gtcccctagc cgccgctccg ggctctgctc gccctcctac780gttgcggtca cacccttctc ccttcgggga gacaacgacg gcggtggcgg gagcttctcc840acggccgacc agctggagat ggtgaccgag ctgctgggag gagacatggt gaaccagagt900ttcatctgcg acccggacga cgagaccttc atcaaaaaca tcatcatcca ggactgtatg960tggagcggct tctcggccgc cgccaagctc gtctcagaga agctggcctc ctaccaggct1020gcgcgcaaag acagcggcag cccgaacccc gcccgcggcc acagcgtctg ctccacctcc1080agcttgtacc tgcaggatct gagcgccgcc gcctcagagt gcatcgaccc ctcggtggtc1140ttcccctacc ctctcaacga cagcagctcg cccaagtcct gcgcctcgca agactccagc1200gccttctctc cgtcctcgga ttctctgctc tcctcgacgg agtcctcccc gcagggcagc1260cccgagcccc tggtgctcca tgaggagaca ccgcccacca ccagcagcga ctctgaggag1320gaacaagaag atgaggaaga aatcgatgtt gtttctgtgg aaaagaggca ggctcctggc1380aaaaggtcag agtctggatc accttctgct ggaggccaca gcaaacctcc tcacagccca1440ctggtcctca agaggtgcca cgtctccaca catcagcaca actacgcagc gcctccctcc1500actcggaagg actatcctgc tgccaagagg gtcaagttgg acagtgtcag agtcctgaga1560cagatcagca acaaccgaaa atgcaccagc cccaggtcct cggacaccga ggagaatgtc1620aagaggcgaa cacacaacgt cttggagcgc cagaggagga acgagctaaa acggagcttt1680tttgccctgc gtgaccagat cccggagttg gaaaacaatg aaaaggcccc caaggtagtt1740atccttaaaa aagccacagc atacatcctg tccgtccaag cagaggagca aaagctcatt1800tctgaagagg acttgttgcg gaaacgacga gaacagttga aacacaaact tgaacagcta1860cggaactctt gtgcgtaagg aaaagtaagg aaaacgattc cttctaacag aaatgtcctg1920agcaatcacc tatgaacttg tttcaaatgc atgatcaaat gcaacctcac aaccttggct1980gagtcttgag actgaaagat ttagccataa tgtaaactgc ctcaaattgg actttgggca2040taaaagaact tttttatgct taccatcttt tttttttctt taacagattt gtatttaaga2100attgttttta aaaaatttta a 2121
<210>10<211>2098<212>DNA<213>人<400>10cctgccgaag tcagttcctt gtggagccgg agctgggcgc ggattcgccg aggcaccgag60gcactcagag gaggcgccat gtcagaaccg gctggggatg tccgtcagaa cccatgcggc120agcaaggcct gccgccgcct cttcggccca gtggacagcg agcagctgag ccgcgactgt180gatgcgctaa tggcgggctg catccaggag gcccgtgagc gatggaactt cgactttgtc240accgagacac cactggaggg tgacttcgcc tgggagcgtg tgcggggcct tggcctgccc300aagctctacc ttcccacggg gccccggcga ggccgggatg agttgggagg aggcaggcgg360cctggcacct cacctgctct gctgcagggg acagcagagg aagaccatgt ggacctgtca420ctgtcttgta cccttgtgcc tcgctcaggg gagcaggctg aagggtcccc aggtggacct480ggagactctc agggtcgaaa acggcggcag accagcatga cagatttcta ccactccaaa540cgccggctga tcttctccaa gaggaagccc taatccgccc acaggaagcc tgcagtcctg600gaagcgcgag ggcctcaaag gcccgctcta catcttctgc cttagtctca gtttgtgtgt660cttaattatt atttgtgttt taatttaaac acctcctcat gtacataccc tggccgcccc720ctgcccccca gcctctggca ttagaattat ttaaacaaaa actaggcggt tgaatgagag780gttcctaaga gtgctgggca tttttatttt atgaaatact atttaaagcc tcctcatccc840gtgttctcct tttcctctct cccggaggtt gggtgggccg gcttcatgcc agctacttcc900tcctccccac ttgtccgctg ggtggtaccc tctggagggg tgtggctcct tcccatcgct960gtcacaggcg gttatgaaat tcaccccctt tcctggacac tcagacctga attctttttc1020atttgagaag taaacagatg gcactttgaa ggggcctcac cgagtggggg catcatcaaa1080aactttggag tcccctcacc tcctctaagg ttgggcaggg tgaccctgaa gtgagcacag1140cctagggctg agctggggac ctggtaccct cctggctctt gatacccccc tctgtcttgt1200gaaggcaggg ggaaggtggg gtcctggagc agaccacccc gcctgccctc atggcccctc1260tgacctgcac tggggagccc gtctcagtgt tgagcctttt ccctctttgg ctcccctgta1320ccttttgagg agccccagct acccttcttc tccagctggg ctctgcaatt cccctctgct1380gctgtccctc ccccttgtcc tttcccttca gtaccctctc agctccaggt ggctctgagg1440tgcctgtccc acccccaccc ccagctcaat ggactggaag gggaagggac acacaagaag1500aagggcaccc tagttctacc tcaggcagct caagcagcga ccgccccctc ctctagctgt1560gggggtgagg gtcccatgtg gtggcacagg cccccttgag tggggttatc tctgtgttag1620gggtatatga tgggggagta gatctttcta ggagggagac actggcccct caaatcgtcc1680
agcgaccttc ctcatccacc ccatccctcc ccagttcatt gcactttgat tagcagcgga1740acaaggagtc agacatttta agatggtggc agtagaggct atggacaggg catgccacgt1800gggctcatat ggggctggga gtagttgtct ttcctggcac taacgttgag cccctggagg1860cactgaagtg cttagtgtac ttggagtatt ggggtctgac cccaaacacc ttccagctcc1920tgtaacatac tggcctggac tgttttctct cggctcccca tgtgtcctgg ttcccgtttc1980tccacctaga ctgtaaacct ctcgagggca gggaccacac cctgtactgt tctgtgtctt2040tcacagctcc tcccacaatg ctgatataca gcaggtgctc aataaacgat tcttagtg 2098<210>11<211>1850<212>DNA<213>人<400>11ggcccaggct gaagctcagg gccctgtctg ctctgtggac tcaacagttt gtggcaagac60aagctcagaa ctgagaagct gtcaccacag ttctggaggc tgggaagttc aagatcaaag120tgccagcaga ttcagtgtca tgtgaggacg tgcttcctgc ttcatagata agagcttgga180gctcggcgca caaccagcac catctggtcg cgatggtgga cacggaaagc ccactctgcc240ccctctcccc actcgaggcc ggcgatctag agagcccgtt atctgaagag ttcctgcaag300aaatgggaaa catccaagag atttcgcaat ccatcggcga ggatagttct ggaagctttg360gctttacgga ataccagtat ttaggaagct gtcctggctc agatggctcg gtcatcacgg420acacgctttc accagcttcg agcccctcct cggtgactta tcctgtggtc cccggcagcg480tggacgagtc tcccagtgga gcattgaaca tcgaatgtag aatctgcggg gacaaggcct540caggctatca ttacggagtc cacgcgtgtg aaggctgcaa gggcttcttt cggcgaacga600ttcgactcaa gctggtgtat gacaagtgcg accgcagctg caagatccag aaaaagaaca660gaaacaaatg ccagtattgt cgatttcaca agtgcctttc tgtcgggatg tcacacaacg720cgattcgttt tggacgaatg ccaagatctg agaaagcaaa actgaaagca gaaattctta780cctgtgaaca tgacatagaa gattctgaaa ctgcagatct caaatctctg gccaagagaa840tctacgaggc ctacttgaag aacttcaaca tgaacaaggt caaagcccgg gtcatcctct900caggaaaggc cagtaacaat ccaccttttg tcatacatga tatggagaca ctgtgtatgg960ctgagaagac gctggtggcc aagctggtgg ccaatggcat ccagaacaag gaggcggagg1020tccgcatctt tcactgctgc cagtgcacgt cagtggagac cgtcacggag ctcacggaat1080tcgccaaggc catcccaggc ttcgcaaact tggacctgaa cgatcaagtg acattgctaa1140aatacggagt ttatgaggcc atattcgcca tgctgtcttc tgtgatgaac aaagacggga1200tgctggtagc gtatggaaat gggtttataa ctcgtgaatt cctaaaaagc ctaaggaaac1260
cgttctgtga tatcatggaa cccaagtttg attttgccat gaagttcaat gcactggaac 1320tggatgacag tgatatctcc ctttttgtgg ctgctatcat ttgctgtgga gatcgtcctg 1380gccttctaaa cgtaggacac attgaaaaaa tgcaggaggg tattgtacat gtgctcagac 1440tccacctgca gagcaaccac ccggacgata tctttctctt cccaaaactt cttcaaaaaa 1500tggcagacct ccggcagctg gtgacggagc atgcgcagct ggtgcagatc atcaagaaga 1560cggagtcgga tgctgcgctg cacccgctac tgcaggagat ctacagggac atgtactgag 1620ttccttcaga tcagccacac cttttccagg agttctgaag ctgacagcac tacaaaggag 1680acgggggagc agcacgattt tgcacaaata tccaccactt taaccttaga gcttggacag 1740tctgagctgt aggtaaccgg catattattc catatctttg ttttaaccag tacttctaag 1800agcatagaac tcaaatgctg ggggaggtgg ctaatctcag gactgggaag 1850<210>12<211>1609<212>DNA<213>人<400>12ttcaagtctt tttcttttaa cggattgatc ttttgctaga tagagacaaa atatcagtgt60gaattacagc aaacccctat tccatgctgt tatgggtgaa actctgggag attctcctat120tgacccagaa agcgattcct tcactgatac actgtctgca aacatatcacaagaaatgac 180catggttgac acagagatgc cattctggcc caccaacttt gggatcagct ccgtggatct240ctccgtaatg gaagaccact cccactcctt tgatatcaag cccttcacta ctgttgactt300ctccagcatt tctactccac attacgaaga cattccattc acaagaacag atccagtggt360tgcagattac aagtatgacc tgaaacttca agagtaccaa agtgcaatca aagtggagcc420tgcatctcca ccttattatt ctgagaagac tcagctctac aataagcctc atgaagagcc480ttccaactcc ctcatggcaa ttgaatgtcg tgtctgtgga gataaagctt ctggatttca540ctatggagtt catgcttgtg aaggatgcaa gggtttcttc cggagaacaa tcagattgaa600gcttatctat gacagatgtg atcttaactg tcggatccac aaaaaaagta gaaataaatg660tcagtactgt cggtttcaga aatgccttgc agtggggatg tctcataatg ccatcaggtt720tgggcggatg ccacaggccg agaaggagaa gctgttggcg gagatctcca gtgatatcga780ccagctgaat ccagagtccg ctgacctccg ggccctggca aaacatttgt atgactcata840cataaagtcc ttcccgctga ccaaagcaaa ggcgagggcg atcttgacag gaaagacaac900agacaaatca ccattcgtta tctatgacat gaattcctta atgatgggag aagataaaat960caagttcaaa cacatcaccc ccctgcagga gcagagcaaa gaggtggcca tccgcatctt1020tcagggctgc cagtttcgct ccgtggaggc tgtgcaggag atcacagagt atgccaaaag1080
cattcctggt tttgtaaatc ttgacttgaa cgaccaagta actctcctca aatatggagt1140ccacgagatc atttacacaa tgctggcctc cttgatgaat aaagatgggg ttctcatatc1200cgagggccaa ggcttcatga caagggagtt tctaaagagc ctgcgaaagc cttttggtga1260ctttatggag cccaagtttg agtttgctgt gaagttcaat gcactggaat tagatgacag1320cgacttggca atatttattg ctgtcattat tctcagtgga gaccgcccag gtttgctgaa1380tgtgaagccc attgaagaca ttcaagacaa cctgctacaa gccctggagc tccagctgaa1440gctgaaccac cctgagtcct cacagctgtt tgccaagctg ctccagaaaa tgacagacct1500cagacagatt gtcacggaac acgtgcagct actgcaggtg atcaagaaga cggagacaga1560catgagtctt cacccgctcc tgcaggagat ctacaaggac ttgtactag1609<210>13<211>3301<212>DNA<213>人<220>
<221>misc_feature<222>(2966)..(2973)<223>n=a,c,g,t<400>13gaattctgcg gagcctgcgg gacggcggcg ggttggcccg taggcagccg ggacagtgtt60gtacagtgtt ttgggcatgc acgtgatact cacacagtgg cttctgctca ccaacagatg120aagacagatg caccaacgag ggtctggaat ggtctggagt ggtctggaaa gcagggtcag180atacccctgg aaaactgaag cccgtggagc aatgatctct acaggactgc ttcaaggctg240atgggaacca ccctgtagag gtccatctgc gttcagaccc agacgatgcc agagctatga300ctgggcctgc aggtgtggcg ccgaggggag atcagccatg gagcagccac aggaggaagc360ccctgaggtc cgggaagagg aggagaaaga ggaagtggca gaggcagaag gagccccaga420gctcaatggg ggaccacagc atgcacttcc ttccagcagc tacacagacc tctcccggag480ctcctcgcca ccctcactgc tggaccaact gcagatgggc tgtgacgggg cctcatgcgg540cagcctcaac atggagtgcc gggtgtgcgg ggacaaggca tcgggcttcc actacggtgt600tcatgcatgt gaggggtgca agggcttctt ccgtcgtacg atccgcatga agctggagta660cgagaagtgt gagcgcagct gcaagattca gaagaagaac cgcaacaagt gccagtactg720ccgcttccag aagtgcctgg cactgggcat gtcacacaac gctatccgtt ttggtcggat780gccggaggct gagaagagga agctggtggc agggctgact gcaaacgagg ggagccagta840caacccacag gtggccgacc tgaaggcctt ctccaagcac atctacaatg cctacctgaa900aaacttcaac atgaccaaaa agaaggcccg cagcatcctc accggcaaag ccagccacac960
ggcgcccttt gtgatccacg acatcgagac attgtggcag gcagagaagg ggctggtgtg1020gaagcagttg gtgaatggcc tgcctcccta caaggagatc agcgtgcacg tcttctaccg1080ctgccagtgc accacagtgg agaccgtgcg ggagctcact gagttcgcca agagcatccc1140cagcttcagc agcctcttcc tcaacgacca ggttaccctt ctcaagtatg gcgtgcacga1200ggccatcttc gccatgctgg cctctatcgt caacaaggac gggctgctgg tagccaacgg1260cagtggcttt gtcacccgtg agttcctgcg cagcctccgc aaacccttca gtgatatcat1320tgagcctaag tttgaatttg ctgtcaagtt caacgccctg gaacttgatg acagtgacct1380ggccctattc attgcggcca tcattctgtg tggagaccgg ccaggcctca tgaacgttcc1440acgggtggag gctatccagg acaccatcct gcgtgccctc gaattccacc tgcaggccaa1500ccaccctgat gcccagtacc tcttccccaa gctgctgcag aagatggctg acctgcggca1560actggtcacc gagcacgccc agatgatgca gcggatcaag aagaccgaaa ccgagacctc1620gctgcaccct ctgctccagg agatctacaa ggacatgtac taacggcggc acccaggcct1680ccctgcagac tccaatgggg ccagcactgg aggggcccac ccacatgact tttccattga1740ccagctctct tcctgtcttt gttgtctccc tctttctcag ttcctctttc ttttctaatt1800cctgttgctc tgtttcttcc tttctgtagg tttctctctt cccttctccc ttctcccttg1860ccctcccttt ctctctccta tccccacgtc tgtcctcctt tcttattctg tgagatgttt1920tgtattattt caccagcagc atagaacagg acctctgctt ttgcacacct tttccccagg1980agcagaagag agtgggcctg ccctctgccc catcattgca cctgcaggct taggtcctca2040cttctgtctc ctgtcttcag agcaaaagac ttgagccatc caaagaaaca ctaagctctc2100tgggcctggg ttccagggaa ggctaagcat ggcctggact gactgcagcc ccctatagtc2160atggggtccc tgctgcaaag gacagtggca gaccccggca gtagagccga gatgcctccc2220caagactgtc attgcccctc cgatcgtgag gccacccact gacccaatga tcctctccag2280cagcacacct cagccccact gacacccagt gtccttccat cttcacactg gtttgccagg2340ccaatgttgc tgatggcccc tccagcacac acacataagc actgaaatca ctttacctgc2400aggcaccatg cacctccctt ccctccctga ggcaggtgag aacccagaga gaggggcctg2460caggtgagca ggcagggctg ggccaggtct ccggggaggc aggggtcctg caggtcctgg2520tgggtcagcc cagcacctcg cccagtggga gcttcccggg ataaactgag cctgttcatt2580ctgatgtcca tttgtcccaa tagctctact gccctcccct tcccctttac tcagcccagc2640tggccaccta gaagtctccc tgcacagcct ctagtgtccg gggaccttgt gggaccagtc2700ccacaccgct ggtccctgcc ctcccctgct cccaggttga ggtgcgctca cctcagagca2760gggccaaagc acagctgggc atgccatgtc tgagcggcgc agagccctcc aggcctgcag2820
gggcaagggg ctggctggag tctcagagca cagaggtagg agaactgggg ttcaagccca2880ggcttcctgg gtcctgcctg gtcctccctc ccaaggagcc attctatgtg actctgggtg2940gaagtgccca gcccctgcct gacggnnnnn nngatcactc tctgctggca ggattcttcc3000cgctccccac ctacccagct gatgggggtt ggggtgcttc tttcagccaa ggctatgaag3060ggacagctgc tgggacccac ctcccccctt ccccggccac atgccgcgtc cctgccccca3120cccgggtctg gtgctgagga tacagctctt ctcagtgtct gaacaatctc caaaattgaa3180atgtatattt ttgctaggag ccccagcttc ctgtgttttt aatataaata gtgtacacag3240actgacgaaa ctttaaataa atgggaatta aatatttaaa aaaaaaagcg gccgcgaatt3300c3301<210>14<211>3083<212>DNA<213>人<400>14aaaaactgca gccaacttcc gaggcagcct cattgcccag cggaccccag cctctgccag60gttcggtccg ccatcctcgt cccgtcctcc gccggcccct gccccgcgcc cagggatcct120ccagctcctt tcgcccgcgc cctccgttcg ctccggacac catggacaag ttttggtggc180acgcagcctg gggactctgc ctcgtgccgc tgagcctggc gcagatcgat ttgaatataa240cctgccgctt tgcaggtgta ttccacgtgg agaaaaatgg tcgctacagc atctctcgga300cggaggccgc tgacctctgc aaggctttca atagcacctt gcccacaatg gcccagatgg360agaaagctct gagcatcgga tttgagacct gcaggtatgg gttcatagaa gggcacgtgg420tgattccccg gatccacccc aactccatct gtgcagcaaa caacacaggg gtgtacatcc480tcacatccaa cacctcccag tatgacacat attgcttcaa tgcttcagct ccacctgaag540aagattgtac atcagtcaca gacctgccca atgcctttga tggaccaatt accataacta600ttgttaaccg tgatggcacc cgctatgtcc agaaaggaga atacagaacg aatcctgaag660acatctaccc cagcaaccct actgatgatg acgtgagcag cggcttttct actgtacacc720ccatcccaga cgaagacagt ccctggatca cctcctccag tgaaaggagc agcacttcag780gaggttacat cttttacacc gacagcacag acagaatccc tgctaccact ttgatgagca840ctagtgctac agcaactgag acagcaacca agaggcaaga aacctgggat tggttttcat900ggttgtttct accatcagag tcaaagaatc atcttcacac aacaacacaa atggctggta960cgtcttcaaa taccatctca gcaggctggg agccaaatga agaaaatgaa gatgaaagag1020acagacacct cagtttttct ggatcaggca ttgatgatga tgaagatttt atctccagca1080ccatttcaac cacaccacgg gcttttgacc acacaaaaca gaaccaggac tggacccagt1140
ggaacccaag ccattcaaat ccggaagtgc tacttcagac aaccacaagg atgactgatg1200tagacagaaa tggcaccact gcttatgaag gaaactggaa cccagaagca caccctcccc1260tcattcacca tgagcatcat gaggaagaag agaccccaca ttctacaagc acaatccagg1320caactcctag tagtacaacg gaagaaacag ctacccagaa ggaacagtgg tttggcaaca1380gatggcatga gggatatcgc caaacaccca aagaagactc ccatttcaac ccaatctcac1440accccatggg acgaggtcat caagcaggaa gatcgacaac agggacagct gcagcctcag1500ctcataccag ccatccaatg caaggaagga caacaccaag cccagaggac agttcctgga1560ctgatttcag gatggatatg gactccagtc atagtataac gcttcagcct actgcaaatc1620caaacacagg tttggtggaa gatttggaca ggacaggacc tctttcaatg acaacgcagc1680agagtaattc tcagagcttc tctacatcac atgaaggctt ggaagaagat aaagaccatc1740caacaacttc tactctgaca tcaagcaata ggaatgatgt cacaggtgga agaagagacc1800caaatcattc tgaaggctca actactttac tggaaggtta tacctctcat tacccacaca1860cgaaggaaag caggaccttc atcccagtga cctcagctaa gactgtcaat cgttccttat1920caggagacca agacacattc caccccagtg gggggtcctt tggagttact gcagttactg1980ttggagattc caactctaat gggtcccata ccactcatgg atctgaatca gatggacact2040cacatgggag tcaagaaggt ggagcaaaca caacctctgg tcctataagg acaccccaaa2100ttccagaatg gctgatcatc ttggcatccc tcttggcctt ggctttgatt cttgcagttt2160gcattgcagt caacagtcga agaaggtgtg ggcagaagaa aaagctagtg atcaacagtg2220gcaatggagc tgtggaggac agaaagccaa gtggactcaa cggagaggcc agcaagtctc2280aggaaatggt gcatttggtg aacaaggagt cgtcagaaac tccagaccag tttatgacag2340ctgatgagac aaggaacctg cagaatgtgg acatgaagat tggggtgtaa cacctacacc2400attatcttgg aaagaaacaa ccgttggaaa cataaccatt acagggagct gggacactta2460acagatgcaa tgtgctactg attgtttcat tgcgaatctt ttttagcata aaattttcta2520ctctttttgt tttttgtgtt ttgttcttta aagtcaggtc caatttgtaa aaacagcatt2580gctttctgaa attagggccc aattaataat cagcaagaat ttgatcgttc cagttcccac2640ttggaggcct ttcatccctc gggtgtgcta tggatggctt ctaacaaaaa ctacacatat2700gtattcctga tcgccaacct ttcccccacc agctaaggac atttcccagg gttaataggg2760cctggtccct gggaggaaat ttgaatgggt ccattttgcc cttccatagc ctaatccctg2820ggcattgctt tccactgagg ttgggggttg gggtgtacta gttacacatc ttcaacagac2880cccctctaga aatttttcag atgcttctgg gagacaccca aagggtgaag ctatttatct2940gtagtaaact atttatctgt gtttttgaaa tattaaaccc tggatcagtc ctttgatcag3000tataattttt taaagttact ttgtcagagg cacaaaaggg tttaaactga ttcataataa3060
atatctgtac ttcttcgatc ttc3083<210>15<211>2539<212>DNA<213>人<400>15ggagtctctt gctctggttc ttgctgttcc tgctcctgct cccgccgctc cccgtcctgc60tcgcggaccc aggggcgccc acgccagtga atccctgttg ttactatcca tgccagcacc120agggcatctg tgtccgcttc ggccttgacc gctaccagtg tgactgcacc cgcacgggct180attccggccc caactgcacc atccctggcc tgtggacctg gctccggaat tcactgcggc240ccagcccctc tttcacccac ttcctgctca ctcacgggcg ctggttctgg gagtttgtca300atgccacctt catccgagag atgctcatgc gcctggtact cacagtgcgc tccaacctta360tccccagtcc ccccacctac aactcagcac atgactacat cagctgggag tctttctcca420acgtgagcta ttacactcgt attctgccct ctgtgcctaa agattgcccc acacccatgg480gaaccaaagg gaagaagcag ttgccagatg cccagctcct ggcccgccgc ttcctgctca540ggaggaagtt catacctgac ccccaaggca ccaacctcat gtttgccttc tttgcacaac600acttcaccca ccagttcttc aaaacttctg gcaagatggg tcctggcttc accaaggcct660tgggccatgg ggtagacctc ggccacattt atggagacaa tctggagcgt cagtatcaac720tgcggctctt taaggatggg aaactcaagt accaggtgct ggatggagaa atgtacccgc780cctcggtaga agaggcgcct gtgttgatgc actacccccg aggcatcccg ccccagagcc840agatggctgt gggccaggag gtgtttgggc tgcttcctgg gctcatgctg tatgccacgc900tctggctacg tgagcacaac cgtgtgtgtg acctgctgaa ggctgagcac cccacctggg960gcgatgagca gcttttccag acgacccgcc tcatcctcat aggggagacc atcaagattg1020tcatcgagga gtacgtgcag cagctgagtg gctatttcct gcagctgaaa tttgacccag1080agctgctgtt cggtgtccag ttccaatacc gcaaccgcat tgccatggag ttcaaccatc1140tctaccactg gcaccccctc atgcctgact ccttcaaggt gggctcccag gagtacagct1200acgagcagtt cttgttcaac acctccatgt tggtggacta tggggttgag gccctggtgg1260atgccttctc tcgccagatt gctggccgga tcggtggggg caggaacatg gaccaccaca1320tcctgcatgt ggctgtggat gtcatcaggg agtctcggga gatgcggctg cagcccttca1380atgagtaccg caagaggttt ggcatgaaac cctacacctc cttccaggag ctcgtaggag1440agaaggagat ggcagcagag ttggaggaat tgtatggaga cattgatgcg ttggagttct1500accctggact gcttcttgaa aagtgccatc caaactctat ctttggggag agtatgatag1560agattggggc tcccttttcc ctcaagggtc tcctagggaa tcccatctgt tctccggagt1620
actggaagcc gagcacattt ggcggcgagg tgggctttaa cattgtcaag acggccacac1680tgaagaagct ggtctgcctc aacaccaaga cctgtcccta cgtttccttc cgtgtgccgg1740atgccagtca ggatgatggg cctgctgtgg agcgaccatc cacagagctc tgaggggcag1800gaaagcagca ttctggaggg gagagctttg tgcttgtcat tccagagtgc tgaggccagg1860gctgatggtc ttaaatgctc attttctggt ttggcatggt gagtgttggg gttgacattt1920agaactttaa gtctcaccca ttatctggaa tattgtgatt ctgtttattc ttccagaatg1980ctgaactcct tgttagccct tcagattgtt aggagtggtt ctcatttggt ctgccagaat2040actgggttct tagttgacaa cctagaatgt cagatttctg gttgatttgt aacacagtca2100ttctaggatg tggagctact gatgaaatct gctagaaagt tagggggttc ttattttgca2160ttccagaatc ttgactttct gattggtgat tcaaagtgtt gtgttcctgg ctgatgatcc2220agaacagtgg ctcgtatccc aaatctgtca gcatctggct gtctagaatg tggatttgat2280tcattttcct gttcagtgag atatcataga gacggagatc ctaaggtcca acaagaatgc2340attccctgaa tctgtgcctg cactgagagg gcaaggaagt ggggtgttct tcttgggacc2400cccactaaga ccctggtctg aggatgtaga gagaacaggt gggctgtatt cacgccattg2460gttggaagct accagagctc tatccccatc caggtcttga ctcatggcag ctgtttctca2520tgaagctaat aaaattcgc 2539<210>16<211>369<212>DNA<213>人<400>16atgaagcttc tcacgggcct ggttttctgc tccttggtcc tgggtgtcag cagccgaagc60ttcttttcgt tccttggcga ggcttttgat ggggctcggg acatgtggag agcctactct120gacatgagag aagccaatta catcggctca gacaaatact tccatgctcg ggggaactat180gatgctgcca aaaggggacc tgggggtgtc tgggctgcag aagcgatcag cgatgccaga240gagaatatcc agagattctt tggccatggt gcggaggact cgctggctga tcaggctgcc300aatgaatggg gcaggagtgg caaagacccc aatcacttcc gacctgctgg cctgcctgag360aaatactga369<210>17<211>67<212>PRT<213>人<400>17Met Thr Ser Lys Leu Ala Val Ala Leu Leu Ala Ala Phe Leu Ile Ser
1 5 10 15Ala Ala Leu Cys Glu Gly Ala Val Leu Pro Arg Ser Ala Lys Glu Leu20 25 30Arg Cys Gln Cys Ile Lys Thr Tyr Ser Lys Pro Phe His Pro Lys Phe35 40 45Ile Lys Glu Leu Arg Val Ile Glu Ser Gly Pro His Cys Ala Asn Thr50 55 60Glu Ile Met65<210>18<211>604<212>PRT<213>人<400>18Met Leu Ala Arg Ala Leu Leu Leu Cys Ala Val Leu Ala Leu Ser His1 5 10 15Thr Ala Asn Pro Cys Cys Ser His Pro Cys Gln Asn Arg Gly Val Cys20 25 30Met Ser Val Gly Phe Asp Gln Tyr Lys Cys Asp Cys Thr Arg Thr Gly35 40 45Phe Tyr Gly Glu Asn Cys Ser Thr Pro Glu Phe Leu Thr Arg Ile Lys50 55 60Leu Phe Leu Lys Pro Thr Pro Asn Thr Val His Tyr Ile Leu Thr His65 70 75 80Phe Lys Gly Phe Trp Asn Val Val Asn Asn Ile Pro Phe Leu Arg Asn85 90 95Ala Ile Met Ser Tyr Val Leu Thr Ser Arg Ser His Leu Ile Asp Ser100 105 110Pro Pro Thr Tyr Asn Ala Asp Tyr Gly Tyr Lys Ser Trp Glu Ala Phe115 120 125Ser Asn Leu Ser Tyr Tyr Thr Arg Ala Leu Pro Pro Val Pro Asp Asp130 135 140Cys Pro Thr Pro Leu Gly Val Lys Gly Lys Lys Gln Leu Pro Asp Ser
145 150 155 160Asn Glu Ile Val Glu Lys Leu Leu Leu Arg Arg Lys Phe Ile Pro Asp165 170 175Pro Gln Gly Ser Asn Met Met Phe Ala Phe Phe Ala Gln His Phe Thr180 185 190His Gln Phe Phe Lys Thr Asp His Lys Arg Gly Pro Ala Phe Thr Asn195 200 205Gly Leu Gly His Gly Val Asp Leu Asn His Ile Tyr Gly Glu Thr Leu210 215 220Ala Arg Gln Arg Lys Leu Arg Leu Phe Lys Asp Gly Lys Met Lys Tyr225 230 235 240Gln Ile Ile Asp Gly Glu Met Tyr Pro Pro Thr Val Lys Asp Thr Gln245 250 255Ala Glu Met Ile Tyr Pro Pro Gln Val Pro Glu His Leu Arg Phe Ala260 265 270Val Gly Gln Glu Val Phe Gly Leu Val Pro Gly Leu Met Met Tyr Ala275 280 285Thr Ile Trp Leu Arg Glu His Asn Arg Val Cys Asp Val Leu Lys Gln290 295 300Glu His Pro Glu Trp Gly Asp Glu Gln Leu Phe Gln Thr Ser Arg Leu305 310 315 320Ile Leu Ile Gly Glu Thr Ile Lys Ile Val Ile Glu Asp Tyr Val Gln325 330 335His Leu Ser Gly Tyr His Phe Lys Leu Lys Phe Asp Pro Glu Leu Leu340 345 350Phe Asn Lys Gln Phe Gln Tyr Gln Asn Arg Ile Ala Ala Glu Phe Asn355 360 365Thr Leu Tyr His Trp His Pro Leu Leu Pro Asp Thr Phe Gln Ile His370 375 380Asp Gln Lys Tyr Asn Tyr Gln Gln Phe Ile Tyr Asn Asn Ser Ile Leu385 390 395 400
Leu Glu His Gly Ile Thr Gln Phe Val Glu Ser Phe Thr Arg Gln Ile405 410 415Ala Gly Arg Val Ala Gly Gly Arg Asn Val Pro Pro Ala Val Gln Lys420 425 430Val Ser Gln Ala Ser Ile Asp Gln Ser Arg Gln Met Lys Tyr Gln Ser435 440 445Phe Asn Glu Tyr Arg Lys Arg Phe Met Leu Lys Pro Tyr Glu Ser Phe450 455 460Glu Glu Leu Thr Gly Glu Lys Glu Met Ser Ala Glu Leu Glu Ala Leu465 470 475 480Tyr Gly Asp Ile Asp Ala Val Glu Leu Tyr Pro Ala Leu Leu Val Glu485 490 495Lys Pro Arg Pro Asp Ala Ile Phe Gly Glu Thr Met Val Glu Val Gly500 505 510Ala Pro Phe Ser Leu Lys Gly Leu Met Gly Asn Val Ile Cys Ser Pro515 520 525Ala Tyr Trp Lys Pro Ser Thr Phe Gly Gly Glu Val Gly Phe Gln Ile530 535 540Ile Asn Thr Ala Ser Ile Gln Ser Leu Ile Cys Asn Asn Val Lys Gly545 550 555 560Cys Pro Phe Thr Ser Phe Ser Val Pro Asp Pro Glu Leu Ile Lys Thr565 570 575Val Thr Ile Asn Ala Ser Ser Ser Arg Ser Gly Leu Asp Asp Ile Asn580 585 590Pro Thr Val Leu Leu Lys Glu Arg Ser Thr Glu Leu595 600<210>19<211>360<212>PRT<213>人<400>19Met Glu Asp Phe Asn Met Glu Ser Asp Ser Phe Glu Asp Phe Trp Lys1 5 10 15
Gly Glu Asp Leu Ser Asn Tyr Ser Tyr Ser Ser Thr Leu Pro Pro Phe20 25 30Leu Leu Asp Ala Ala Pro Cys Glu Pro Glu Ser Leu Glu Ile Asn Lys35 40 45Tyr Phe Val Val Ile Ile Tyr Ala Leu Val Phe Leu Leu Ser Leu Leu50 55 60Gly Asn Ser Leu Val Met Leu Val Ile Leu Tyr Ser Arg Val Gly Arg65 70 75 80Ser Val Thr Asp Val Tyr Leu Leu Asn Leu Ala Leu Ala Asp Leu Leu85 90 95Phe Ala Leu Thr Leu Pro Ile Trp Ala Ala Ser Lys Val Asn Gly Trp100 105 110Ile Phe Gly Thr Phe Leu Cys Lys Val Val Ser Leu Leu Lys Glu Val115 120 125Asn Phe Tyr Ser Gly Ile Leu Leu Leu Ala Cys Ile Ser Val Asp Arg130 135 140Tyr Leu Ala Ile Val His Ala Thr Arg Thr Leu Thr Gln Lys Arg Tyr145 150 155 160Leu Val Lys Phe Ile Cys Leu Ser Ile Trp Gly Leu Ser Leu Leu Leu165 170 175Ala Leu Pro Val Leu Leu Phe Arg Arg Thr Val Tyr Ser Ser Asn Val180 185 190Ser Pro Ala Cys Tyr Glu Asp Met Gly Asn Asn Thr Ala Asn Trp Arg195 200 205Met Leu Leu Arg Ile Leu Pro Gln Ser Phe Gly Phe Ile Val Pro Leu210 215 220Leu Ile Met Leu Phe Cys Tyr Gly Phe Thr Leu Arg Thr Leu Phe Lys225 230 235 240Ala His Met Gly Gln Lys His Arg Ala Met Arg Val Ile Phe Ala Val245 250 255Val Leu Ile Phe Leu Leu Cys Trp Leu Pro Tyr Asn Leu Val Leu Leu260 265 270
Ala Asp Thr Leu Met Arg Thr Gln Val Ile Gln Glu Thr Cys Glu Arg275 280 285Arg Asn His Ile Asp Arg Ala Leu Asp Ala Thr Glu Ile Leu Gly Ile290 295 300Leu His Ser Cys Leu Asn Pro Leu Ile Tyr Ala Phe Ile Gly Gln Lys305 310 315 320Phe Arg His Gly Leu Leu Lys Ile Leu Ala Ile His Gly Leu Ile Ser325 330 335Lys Asp Ser Leu Pro Lys Asp Ser Arg Pro Ser Phe Val Gly Ser Ser340 345 350Ser Gly His Thr Ser Thr Thr Leu355 360<210>20<211>554<212>PRT<213>人<400>20Met Thr Ala Pro Gly Ala Ala Gly Arg Cys Pro Pro Thr Thr Trp Leu1 5 10 15Gly Ser Leu Leu Leu Leu Val Cys Leu Leu Ala Ser Arg Ser Ile Thr20 25 30Glu Glu Val Ser Glu Tyr Cys Ser His Met Ile Gly Ser Gly His Leu35 40 45Gln Ser Leu Gln Arg Leu Ile Asp Ser Gln Met Glu Thr Ser Cys Gln50 55 60Ile Thr Phe Glu Phe Val Asp Gln Glu Gln Leu Lys Asp Pro Val Cys65 70 75 80Tyr Leu Lys Lys Ala Phe Leu Leu Val Gln Asp Ile Met Glu Asp Thr85 90 95Met Arg Phe Arg Asp Asn Thr Ala Asn Pro Ile Ala Ile Val Gln Leu100 105 110Gln Glu Leu Ser Leu Arg Leu Lys Ser Cys Phe Thr Lys Asp Tyr Glu115 120 125
Glu His Asp Lys Ala Cys Val Arg Thr Phe Tyr Glu Thr Pro Leu Gln130 135 140Leu Leu Glu Lys Val Lys Asn Val Phe Asn Glu Thr Lys Asn Leu Leu145 150 155 160Asp Lys Asp Trp Asn Ile Phe Ser Lys Asn Cys Asn Asn Ser Phe Ala165 170 175Glu Cys Ser Ser Gln Asp Val Val Thr Lys Pro Asp Cys Asn Cys Leu180 185 190Tyr Pro Lys Ala Ile Pro Ser Ser Asp Pro Ala Ser Val Ser Pro His195 200 205Gln Pro Leu Ala Pro Ser Met Ala Pro Val Ala Gly Leu Thr Trp Glu210 215 220Asp Ser Glu Gly Thr Glu Gly Ser Ser Leu Leu Pro Gly Glu Gln Pro225 230 235 240Leu His Thr Val Asp Pro Gly Ser Ala Lys Gln Arg Pro Pro Arg Ser245 250 255Thr Cys Gln Ser Phe Glu Pro Pro Glu Thr Pro Val Val Lys Asp Ser260 265 270Thr Ile Gly Gly Ser Pro Gln Pro Arg Pro Ser Val Gly Ala Phe Asn275 280 285Pro Gly Met Glu Asp Ile Leu Asp Ser Ala Met Gly Thr Asn Trp Val290 295 300Pro Glu Glu Ala Ser Gly Glu Ala Ser Glu Ile Pro Val Pro Gln Gly305 310 315 320Thr Glu Leu Ser Pro Ser Arg Pro Gly Gly Gly Ser Met Gln Thr Glu325 330 335Pro Ala Arg Pro Ser Asn Phe Leu Ser Ala Ser Ser Pro Leu Pro Ala340 345 350Ser Ala Lys Gly Gln Gln Pro Ala Asp Val Thr Ala Thr Ala Leu Pro355 360 365Arg Val Gly Pro Val Met Pro Thr Gly Gln Asp Trp Asn His Thr Pro370 375 380
Gln Lys Thr Asp His Pro Ser Ala Leu Leu Arg Asp Pro Pro Glu Pro385 390 395 400Gly Ser Pro Arg Ile Ser Ser Leu Arg Pro Gln Ala Leu Ser Asn Pro405 410 415Ser Thr Leu Ser Ala Gln Pro Gln Leu Ser Arg Ser His Ser Ser Gly420 425 430Ser Val Leu Pro Leu Gly Glu Leu Glu Gly Arg Arg Ser Thr Arg Asp435 440 445Arg Thr Ser Pro Ala Glu Pro Glu Ala Ala Pro Ala Ser Glu Gly Ala450 455 460Ala Arg Pro Leu Pro Arg Phe Asn Ser Val Pro Leu Thr Asp Thr Gly465 470 475 480His Glu Arg Gln Ser Glu Gly Ser Ser Ser Pro Gln Leu Gln Glu Ser485 490 495Val Phe His Leu Leu Val Pro Ser Val Ile Leu Val Leu Leu Ala Val500 505 510Gly Gly Leu Leu Phe Tyr Arg Trp Arg Arg Arg Ser His Gln Glu Pro515 520 525Gln Arg Ala Asp Ser Pro Leu Glu Gln Pro Glu Gly Ser Pro Leu Thr530 535 540Gln Asp Asp Arg Gln Val Glu Leu Pro Val545 550<210>21<211>107<212>PRT<213>人<400>21Met Ala Arg Ala Ala Leu Ser Ala Ala Pro Ser Asn Pro Arg Leu Leu1 5 10 15Arg Val Ala Leu Leu Leu Leu Leu Leu Val Ala Ala Gly Arg Arg Ala20 25 30Ala Gly Ala Ser Val Ala Thr Glu Leu Arg Cys Gln Cys Leu Gln Thr35 40 45
Leu Gln Gly Ile His Pro Lys Asn Ile Gln Ser Val Asn Val Lys Ser50 55 60Pro Gly Pro His Cys Ala Gln Thr Glu Val Ile Ala Thr Leu Lys Asn65 70 75 80Gly Arg Lys Ala Cys Leu Asn Pro Ala Ser Pro Ile Val Lys Lys Ile85 90 95Ile Glu Lys Met Leu Asn Ser Asp Lys Ser Asn100 105<210>22<211>106<212>PRT<213>人<400>22Met Ala His Ala Thr Leu Ser Ala Ala Pro Ser Asn Pro Arg Leu Leu1 5 10 15Arg Val Ala Leu Leu Leu Leu Leu Leu Val Gly Ser Arg Arg Ala Ala20 25 30Gly Ala Ser Val Val Thr Glu Leu Arg Cys Gln Cys Leu Gln Thr Leu35 40 45Gln Gly Ile His Leu Lys Asn Ile Gln Ser Val Asn Val Arg Ser Pro50 55 60Gly Pro His Cys Ala Gln Thr Glu Val Ile Ala Thr Leu Lys Asn Gly65 70 75 80Lys Lys Ala Cys Leu Asn Pro Ala Ser Pro Met Val Gln Lys Ile Ile85 90 95Glu Lys Ile Leu Asn Lys Gly Ser Thr Asn100 105<210>23<211>300<212>PRT<213>人<400>23Met Arg Ile Ala Val Ile Cys Phe Cys Leu Leu Gly Ile Thr Cys Ala1 5 10 15
Ile Pro Val Lys Gln Ala Asp Ser Gly Ser Ser Glu Glu Lys Gln Leu20 25 30Tyr Asn Lys Tyr Pro Asp Ala Val Ala Thr Trp Leu Asn Pro Asp Pro35 40 45Ser Gln Lys Gln Asn Leu Leu Ala Pro Gln Thr Leu Pro Ser Lys Ser50 55 60Asn Glu Ser His Asp His Met Asp Asp Met Asp Asp Glu Asp Asp Asp65 70 75 80Asp His Val Asp Ser Gln Asp Ser Ile Asp Ser Asn Asp Ser Asp Asp85 90 95Val Asp Asp Thr Asp Asp Ser His Gln Ser Asp Glu Ser His His Ser100 105 110Asp Glu Ser Asp Glu Leu Val Thr Asp Phe Pro Thr Asp Leu Pro Ala115 120 125Thr Glu Val Phe Thr Pro Val Val Pro Thr Val Asp Thr Tyr Asp Gly130 135 140Arg Gly Asp Ser Val Val Tyr Gly Leu Arg Ser Lys Ser Lys Lys Phe145 150 155 160Arg Arg Pro Asp Ile Gln Tyr Pro Asp Ala Thr Asp Glu Asp Ile Thr165 170 175Ser His Met Glu Ser Glu Glu Leu Asn Gly Ala Tyr Lys Ala Ile Pro180 185 190Val Ala Gln Asp Leu Asn Ala Pro Ser Asp Trp Asp Ser Arg Gly Lys195 200 205Asp Ser Tyr Glu Thr Ser Gln Leu Asp Asp Gln Ser Ala Glu Thr His210 215 220Ser His Lys Gln Ser Arg Leu Tyr Lys Arg Lys Ala Asn Asp Glu Ser225 230 235 240Asn Glu His Ser Asp Val Ile Asp Ser Gln Glu Leu Ser Lys Val Ser245 250 255Arg Glu Phe His Ser His Glu Phe His Ser His Glu Asp Met Leu Val260 265 270
Val Asp Pro Lys Ser Lys Glu Glu Asp Lys His Leu Lys Phe Arg Ile275 280 285Ser His Glu Leu Asp Ser Ala Ser Ser Glu Val Asn290 295 300<210>24<211>295<212>PRT<213>人<400>24Met Glu His Gln Leu Leu Cys Cys Glu Val Glu Thr Ile Arg Arg Ala1 5 10 15Tyr Pro Asp Ala Asn Leu Leu Asn Asp Arg Val Leu Arg Ala Met Leu20 25 30Lys Ala Glu Glu Thr Cys Ala Pro Ser Val Ser Tyr Phe Lys Cys Val35 40 45Gln Lys Glu Val Leu Pro Ser Met Arg Lys Ile Val Ala Thr Trp Met50 55 60Leu Glu Val Cys Glu Glu Gln Lys Cys Glu Glu Glu Val Phe Pro Leu65 70 75 80Ala Met Asn Tyr Leu Asp Arg Phe Leu Ser Leu Glu Pro Val Lys Lys85 90 95Ser Arg Leu Gln Leu Leu Gly Ala Thr Cys Met Phe Val Ala Ser Lys100 105 110Met Lys Glu Thr Ile Pro Leu Thr Ala Glu Lys Leu Cys Ile Tyr Thr115 120 125Asp Gly Ser Ile Arg Pro Glu Glu Leu Leu Gln Met Glu Leu Leu Leu130 135 140Val Asn Lys Leu Lys Trp Asn Leu Ala Ala Met Thr Pro His Asp Phe145 150 155 160Ile Glu His Phe Leu Ser Lys Met Pro Glu Ala Glu Glu Asn Lys Gln165 170 175Ile Ile Arg Lys His Ala Gln Thr Phe Val Ala Ser Cys Ala Thr Asp180 185 190
Val Lys Phe Ile Ser Asn Pro Pro Ser Met Val Ala Ala Gly Ser Val195 200 205Val Ala Ala Val Gln Gly Leu Asn Leu Arg Ser Pro Asn Asn Phe Leu210 215 220Ser Tyr Tyr Arg Leu Thr Arg Phe Leu Ser Arg Val Ile Lys Cys Asp225 230 235 240Pro Asp Cys Leu Arg Ala Cys Gln Glu Gln Ile Glu Ala Leu Leu Glu245 250 255Ser Ser Leu Arg Gln Ala Gln Gln Asn Met Asp Pro Lys Ala Ala Glu260 265 270Glu Glu Glu Glu Glu Glu Glu Glu Val Asp Leu Ala Cys Thr Pro Thr275 280 285Asp Val Arg Asp Val Asp Ile290 295<210>25<211>439<212>PRT<213>人<400>25Met Pro Leu Asn Val Ser Phe Thr Asn Arg Asn Tyr Asp Leu Asp Tyr1 5 10 15Asp Ser Val Gln Pro Tyr Phe Tyr Cys Asp Glu Glu Glu Asn Phe Tyr20 25 30Gln Gln Gln Gln Gln Ser Glu Leu Gln Pro Pro Ala Pro Ser Glu Asp35 40 45Ile Trp Lys Lys Phe Glu Leu Leu Pro Thr Pro Pro Leu Ser Pro Ser50 55 60Arg Arg Ser Gly Leu Cys Ser Pro Ser Tyr Val Ala Val Thr Pro Phe65 70 75 80Ser Leu Arg Gly Asp Asn Asp Gly Gly Gly Gly Ser Phe Ser Thr Ala85 90 95Asp Gln Leu Glu Met Val Thr Glu Leu Leu Gly Gly Asp Met Val Asn100 105 110
Gln Ser Phe Ile Cys Asp Pro Asp Asp Glu Thr Phe Ile Lys Asn Ile115 120 125Ile Ile Gln Asp Cys Met Trp Ser Gly Phe Ser Ala Ala Ala Lys Leu130 135 140Val Ser Glu Lys Leu Ala Ser Tyr Gln Ala Ala Arg Lys Asp Ser Gly145 150 155 160Ser Pro Asn Pro Ala Arg Gly His Ser Val Cys Ser Thr Ser Ser Leu165 170 175Tyr Leu Gln Asp Leu Ser Ala Ala Ala Ser Glu Cys Ile Asp Pro Ser180 185 190Val Val Phe Pro Tyr Pro Leu Asn Asp Ser Ser Ser Pro Lys Ser Cys195 200 205Ala Ser Gln Asp Ser Ser Ala Phe Ser Pro Ser Ser Asp Ser Leu Leu210 215 220Ser Ser Thr Glu Ser Ser Pro Gln Gly Ser Pro Glu Pro Leu Val Leu225 230 235 240His Glu Glu Thr Pro Pro Thr Thr Ser Ser Asp Ser Glu Glu Glu Gln245 250 255Glu Asp Glu Glu Glu Ile Asp Val Val Ser Val Glu Lys Arg Gln Ala260 265 270Pro Gly Lys Arg Ser Glu Ser Gly Ser Pro Ser Ala Gly Gly His Ser275 280 285Lys Pro Pro His Ser Pro Leu Val Leu Lys Arg Cys His Val Ser Thr290 295 300His Gln His Asn Tyr Ala Ala Pro Pro Ser Thr Arg Lys Asp Tyr Pro305 310 315 320Ala Ala Lys Arg Val Lys Leu Asp Ser Val Arg Val Leu Arg Gln Ile325 330 335Ser Asn Asn Arg Lys Cys Thr Ser Pro Arg Ser Ser Asp Thr Glu Glu340 345 350Asn Val Lys Arg Arg Thr His Asn Val Leu Glu Arg Gln Arg Arg Asn
355 360 365Glu Leu Lys Arg Ser Phe Phe Ala Leu Arg Asp Gln Ile Pro Glu Leu370 375 380Glu Asn Asn Glu Lys Ala Pro Lys Val Val Ile Leu Lys Lys Ala Thr385 390 395 400Ala Tyr Ile Leu Ser Val Gln Ala Glu Glu Gln Lys Leu Ile Ser Glu405 410 415Glu Asp Leu Leu Arg Lys Arg Arg Glu Gln Leu Lys His Lys Leu Glu420 425 430Gln Leu Arg Asn Ser Cys Ala435<210>26<211>164<212>PRT<213>人<400>26Met Ser Glu Pro Ala Gly Asp Val Arg Gln Asn Pro Cys Gly Ser Lys1 5 10 15Ala Cys Arg Arg Leu Phe Gly Pro Val Asp Ser Glu Gln Leu Ser Arg20 25 30Asp Cys Asp Ala Leu Met Ala Gly Cys Ile Gln Glu Ala Arg Glu Arg35 40 45Trp Asn Phe Asp Phe Val Thr Glu Thr Pro Leu Glu Gly Asp Phe Ala50 55 60Trp Glu Arg Val Arg Gly Leu Gly Leu Pro Lys Leu Tyr Leu Pro Thr65 70 75 80Gly Pro Arg Arg Gly Arg Asp Glu Leu Gly Gly Gly Arg Arg Pro Gly85 90 95Thr Ser Pro Ala Leu Leu Gln Gly Thr Ala Glu Glu Asp His Val Asp100 105 110Leu Ser Leu Ser Cys Thr Leu Val Pro Arg Ser Gly Glu Gln Ala Glu115 120 125Gly Ser Pro Gly Gly Pro Gly Asp Ser Gln Gly Arg Lys Arg Arg Gln
130 135 140Thr Ser Met Thr Asp Phe Tyr His Ser Lys Arg Arg Leu Ile Phe Ser145 150 155 160Lys Arg Lys Pro<210>27<211>468<212>PRT<213>人<400>27Met Val Asp Thr Glu Ser Pro Leu Cys Pro Leu Ser Pro Leu Glu Ala1 5 10 15Gly Asp Leu Glu Ser Pro Leu Ser Glu Glu Phe Leu Gln Glu Met Gly20 25 30Asn Ile Gln Glu Ile Ser Gln Ser Ile Gly Glu Asp Ser Ser Gly Ser35 40 45Phe Gly Phe Thr Glu Tyr Gln Tyr Leu Gly Ser Cys Pro Gly Ser Asp50 55 60Gly Ser Val Ile Thr Asp Thr Leu Ser Pro Ala Ser Ser Pro Ser Ser65 70 75 80Val Thr Tyr Pro Val Val Pro Gly Ser Val Asp Glu Ser Pro Ser Gly85 90 95Ala Leu Asn Ile Glu Cys Arg Ile Cys Gly Asp Lys Ala Ser Gly Tyr100 105 110His Tyr Gly Val His Ala Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg115 120 125Thr Ile Arg Leu Lys Leu Val Tyr Asp Lys Cys Asp Arg Ser Cys Lys130 135 140Ile Gln Lys Lys Asn Arg Asn Lys Cys Gln Tyr Cys Arg Phe His Lys145 150 155 160Cys Leu Ser Val Gly Met Ser His Asn Ala Ile Arg Phe Gly Arg Met165 170 175Pro Arg Ser Glu Lys Ala Lys Leu Lys Ala Glu Ile Leu Thr Cys Glu
180 185 190His Asp Ile Glu Asp Ser Glu Thr Ala Asp Leu Lys Ser Leu Ala Lys195 200 205Arg Ile Tyr Glu Ala Tyr Leu Lys Asn Phe Asn Met Asn Lys Val Lys210 215 220Ala Arg Val Ile Leu Ser Gly Lys Ala Ser Asn Asn Pro Pro Phe Val225 230 235 240Ile His Asp Met Glu Thr Leu Cys Met Ala Glu Lys Thr Leu Val Ala245 250 255Lys Leu Val Ala Asn Gly Ile Gln Asn Lys Glu Ala Glu Val Arg Ile260 265 270Phe His Cys Cys Gln Cys Thr Ser Val Glu Thr Val Thr Glu Leu Thr275 280 285Glu Phe Ala Lys Ala Ile Pro Gly Phe Ala Asn Leu Asp Leu Asn Asp290 295 300Gln Val Thr Leu Leu Lys Tyr Gly Val Tyr Glu Ala Ile Phe Ala Met305 310 315 320Leu Ser Ser Val Met Asn Lys Asp Gly Met Leu Val Ala Tyr Gly Asn325 330 335Gly Phe Ile Thr Arg Glu Phe Leu Lys Ser Leu Arg Lys Pro Phe Cys340 345 350Asp Ile Met Glu Pro Lys Phe Asp Phe Ala Met Lys Phe Asn Ala Leu355 360 365Glu Leu Asp Asp Ser Asp Ile Ser Leu Phe Val Ala Ala Ile Ile Cys370 375 380Cys Gly Asp Arg Pro Gly Leu Leu Asn Val Gly His Ile Glu Lys Met385 390 395 400Gln Glu Gly Ile Val His Val Leu Arg Leu His Leu Gln Ser Asn His405 410 415Pro Asp Asp Ile Phe Leu Phe Pro Lys Leu Leu Gln Lys Met Ala Asp420 425 430
Leu Arg Gln Leu Val Thr Glu His Ala Gln Leu Val Gln Ile Ile Lys435 440 445Lys Thr Glu Ser Asp Ala Ala Leu His Pro Leu Leu Gln Glu Ile Tyr450 455 460Arg Asp Met Tyr465<210>28<211>505<212>PRT<213>人<400>28Met Gly Glu Thr Leu Gly Asp Ser Pro Ile Asp Pro Glu Ser Asp Ser1 5 10 15Phe Thr Asp Thr Leu Ser Ala Asn Ile Ser Gln Glu Met Thr Met Val20 25 30Asp Thr Glu Met Pro Phe Trp Pro Thr Asn Phe Gly Ile Ser Ser Val35 40 45Asp Leu Ser Val Met Glu Asp His Ser His Ser Phe Asp Ile Lys Pro50 55 60Phe Thr Thr Val Asp Phe Ser Ser Ile Ser Thr Pro His Tyr Glu Asp65 70 75 80Ile Pro Phe Thr Arg Thr Asp Pro Val Val Ala Asp Tyr Lys Tyr Asp85 90 95Leu Lys Leu Gln Glu Tyr Gln Ser Ala Ile Lys Val Glu Pro Ala Ser100 105 110Pro Pro Tyr Tyr Ser Glu Lys Thr Gln Leu Tyr Asn Lys Pro His Glu115 120 125Glu Pro Ser Asn Ser Leu Met Ala Ile Glu Cys Arg Val Cys Gly Asp130 135 140Lys Ala Ser Gly Phe His Tyr Gly Val His Ala Cys Glu Gly Cys Lys145 150 155 160Gly Phe Phe Arg Arg Thr Ile Arg Leu Lys Leu Ile Tyr Asp Arg Cys165 170 175
Asp Leu Asn Cys Arg Ile His Lys Lys Ser Arg Asn Lys Cys Gln Tyr180 185 190Cys Arg Phe Gln Lys Cys Leu Ala Val Gly Met Ser His Asn Ala Ile195 200 205Arg Phe Gly Arg Met Pro Gln Ala Glu Lys Glu Lys Leu Leu Ala Glu210 215 220Ile Ser Ser Asp Ile Asp Gln Leu Asn Pro Glu Ser Ala Asp Leu Arg225 230 235 240Ala Leu Ala Lys His Leu Tyr Asp Ser Tyr Ile Lys Ser Phe Pro Leu245 250 255Thr Lys Ala Lys Ala Arg Ala Ile Leu Thr Gly Lys Thr Thr Asp Lys260 265 270Ser Pro Phe Val Ile Tyr Asp Met Asn Ser Leu Met Met Gly Glu Asp275 280 285Lys Ile Lys Phe Lys His Ile Thr Pro Leu Gln Glu Gln Ser Lys Glu290 295 300Val Ala Ile Arg Ile Phe Gln Gly Cys Gln Phe Arg Ser Val Glu Ala305 310 315 320Val Gln Glu Ile Thr Glu Tyr Ala Lys Ser Ile Pro Gly Phe Val Asn325 330 335Leu Asp Leu Asn Asp Gln Val Thr Leu Leu Lys Tyr Gly Val His Glu340 345 350Ile Ile Tyr Thr Met Leu Ala Ser Leu Met Asn Lys Asp Gly Val Leu355 360 365Ile Ser Glu Gly Gln Gly Phe Met Thr Arg Glu Phe Leu Lys Ser Leu370 375 380Arg Lys Pro Phe Gly Asp Phe Met Glu Pro Lys Phe Glu Phe Ala Val385 390 395 400Lys Phe Asn Ala Leu Glu Leu Asp Asp Ser Asp Leu Ala Ile Phe Ile405 410 415Ala Val Ile Ile Leu Ser Gly Asp Arg Pro Gly Leu Leu Asn Val Lys420 425 430
Pro Ile Glu Asp Ile Gln Asp Asn Leu Leu Gln Ala Leu Glu Leu Gln435 440 445Leu Lys Leu Asn His Pro Glu Ser Ser Gln Leu Phe Ala Lys Leu Leu450 455 460Gln Lys Met Thr Asp Leu Arg Gln Ile Val Thr Glu His Val Gln Leu465 470 475 480Leu Gln Val Ile Lys Lys Thr Glu Thr Asp Met Ser Leu His Pro Leu485 490 495Leu Gln Glu Ile Tyr Lys Asp Leu Tyr500 505<210>29<211>441<212>PRT<213>人<400>29Met Glu Gln Pro Gln Glu Glu Ala Pro Glu Val Arg Glu Glu Glu Glu1 5 10 15Lys Glu Glu Val Ala Glu Ala Glu Gly Ala Pro Glu Leu Asn Gly Gly20 25 30Pro Gln His Ala Leu Pro Ser Ser Ser Tyr Thr Asp Leu Ser Arg Ser35 40 45Ser Ser Pro Pro Ser Leu Leu Asp Gln Leu Gln Met Gly Cys Asp Gly50 55 60Ala Ser Cys Gly Ser Leu Asn Met Glu Cys Arg Val Cys Gly Asp Lys65 70 75 80Ala Ser Gly Phe His Tyr Gly Val His Ala Cys Glu Gly Cys Lys Gly85 90 95Phe Phe Arg Arg Thr Ile Arg Met Lys Leu Glu Tyr Glu Lys Cys Glu100 105 110Arg Ser Cys Lys Ile Gln Lys Lys Asn Arg Asn Lys Cys Gln Tyr Cys115 120 125Arg Phe Gln Lys Cys Leu Ala Leu Gly Met Ser His Asn Ala Ile Arg130 135 140
Phe Gly Arg Met Pro Glu Ala Glu Lys Arg Lys Leu Val Ala Gly Leu145 150 155 160Thr Ala Asn Glu Gly Ser Gln Tyr Asn Pro Gln Val Ala Asp Leu Lys165 170 175Ala Phe Ser Lys His Ile Tyr Asn Ala Tyr Leu Lys Asn Phe Asn Met180 185 190Thr Lys Lys Lys Ala Arg Ser Ile Leu Thr Gly Lys Ala Ser His Thr195 200 205Ala Pro Phe Val Ile His Asp Ile Glu Thr Leu Trp Gln Ala Glu Lys210 215 220Gly Leu Val Trp Lys Gln Leu Val Asn Gly Leu Pro Pro Tyr Lys Glu225 230 235 240Ile Ser Val His Val Phe Tyr Arg Cys Gln Cys Thr Thr Val Glu Thr245 250 255Val Arg Glu Leu Thr Glu Phe Ala Lys Ser Ile Pro Ser Phe Ser Ser260 265 270Leu Phe Leu Asn Asp Gln Val Thr Leu Leu Lys Tyr Gly Val His Glu275 280 285Ala Ile Phe Ala Met Leu Ala Ser Ile Val Asn Lys Asp Gly Leu Leu290 295 300Val Ala Asn Gly Ser Gly Phe Val Thr Arg Glu Phe Leu Arg Ser Leu305 310 315 320Arg Lys Pro Phe Ser Asp Ile Ile Glu Pro Lys Phe Glu Phe Ala Val325 330 335Lys Phe Asn Ala Leu Glu Leu Asp Asp Ser Asp Leu Ala Leu Phe Ile340 345 350Ala Ala Ile Ile Leu Cys Gly Asp Arg Pro Gly Leu Met Asn Val Pro355 360 365Arg Val Glu Ala Ile Gln Asp Thr Ile Leu Arg Ala Leu Glu Phe His370 375 380Leu Gln Ala Asn His Pro Asp Ala Gln Tyr Leu Phe Pro Lys Leu Leu385 390 395 400
Gln Lys Met Ala Asp Leu Arg Gln Leu Val Thr Glu His Ala Gln Met405 410 415Met Gln Arg Ile Lys Lys Thr Glu Thr Glu Thr Ser Leu His Pro Leu420 425 430Leu Gln Glu Ile Tyr Lys Asp Met Tyr435 440<210>30<211>742<212>PRT<213>人<400>30Met Asp Lys Phe Trp Trp His Ala Ala Trp Gly Leu Cys Leu Val Pro1 5 10 15Leu Ser Leu Ala Gln Ile Asp Leu Asn Ile Thr Cys Arg Phe Ala Gly20 25 30Val Phe His Val Glu Lys Asn Gly Arg Tyr Ser Ile Ser Arg Thr Glu35 40 45Ala Ala Asp Leu Cys Lys Ala Phe Asn Ser Thr Leu Pro Thr Met Ala50 55 60Gln Met Glu Lys Ala Leu Ser Ile Gly Phe Glu Thr Cys Arg Tyr Gly65 70 75 80Phe Ile Glu Gly His Val Val Ile Pro Arg Ile His Pro Asn Ser Ile85 90 95Cys Ala Ala Asn Asn Thr Gly Val Tyr Ile Leu Thr Ser Asn Thr Ser100 105 110Gln Tyr Asp Thr Tyr Cys Phe Asn Ala Ser Ala Pro Pro Glu Glu Asp115 120 125Cys Thr Ser Val Thr Asp Leu Pro Asn Ala Phe Asp Gly Pro Ile Thr130 135 140Ile Thr Ile Val Asn Arg Asp Gly Thr Arg Tyr Val Gln Lys Gly Glu145 150 155 160Tyr Arg Thr Asn Pro Glu Asp Ile Tyr Pro Ser Asn Pro Thr Asp Asp165 170 175
Asp Val Ser Ser Gly Ser Ser Ser Glu Arg Ser Ser Thr Ser Gly Gly180 185 190Tyr Ile Phe Tyr Thr Phe Ser Thr Val His Pro Ile Pro Asp Glu Asp195 200 205Ser Pro Trp Ile Thr Asp Ser Thr Asp Arg Ile Pro Ala Thr Thr Leu210 215 220Met Ser Thr Ser Ala Thr Ala Thr Glu Thr Ala Thr Lys Arg Gln Glu225 230 235 240Thr Trp Asp Trp Phe Ser Trp Leu Phe Leu Pro Ser Glu Ser Lys Asn245 250 255His Leu His Thr Thr Thr Gln Met Ala Gly Thr Ser Ser Asn Thr Ile260 265 270Ser Ala Gly Trp Glu Pro Asn Glu Glu Asn Glu Asp Glu Arg Asp Arg275 280 285His Leu Ser Phe Ser Gly Ser Gly Ile Asp Asp Asp Glu Asp Phe Ile290 295 300Ser Ser Thr Ile Ser Thr Thr Pro Arg Ala Phe Asp His Thr Lys Gln305 310 315 320Asn Gln Asp Trp Thr Gln Trp Asn Pro Ser His Ser Asn Pro Glu Val325 330 335Leu Leu Gln Thr Thr Thr Arg Met Thr Asp Val Asp Arg Asn Gly Thr340 345 350Thr Ala Tyr Glu Gly Asn Trp Asn Pro Glu Ala His Pro Pro Leu Ile355 360 365His His Glu His His Glu Glu Glu Glu Thr Pro His Ser Thr Ser Thr370 375 380Ile Gln Ala Thr Pro Ser Ser Thr Thr Glu Glu Thr Ala Thr Gln Lys385 390 395 400Glu Gln Trp Phe Gly Asn Arg Trp His Glu Gly Tyr Arg Gln Thr Pro405 410 415Lys Glu Asp Ser His Ser Thr Thr Gly Thr Ala Ala Ala Ser Ala His
420 425 430Thr Ser His Pro Met Gln Gly Arg Thr Thr Pro Ser Pro Glu Asp Ser435 440 445Ser Trp Thr Asp Phe Phe Asn Pro Ile Ser His Pro Met Gly Arg Gly450 455 460His Gln Ala Gly Arg Arg Met Asp Met Asp Ser Ser His Ser Ile Thr465 470 475 480Leu Gln Pro Thr Ala Asn Pro Asn Thr Gly Leu Val Glu Asp Leu Asp485 490 495Arg Thr Gly Pro Leu Ser Met Thr Thr Gln Gln Ser Asn Ser Gln Ser500 505 510Phe Ser Thr Ser His Glu Gly Leu Glu Glu Asp Lys Asp His Pro Thr515 520 525Thr Ser Thr Leu Thr Ser Ser Asn Arg Asn Asp Val Thr Gly Gly Arg530 535 540Arg Asp Pro Asn His Ser Glu Gly Ser Thr Thr Leu Leu Glu Gly Tyr545 550 555 560Thr Ser His Tyr Pro His Thr Lys Glu Ser Arg Thr Phe Ile Pro Val565 570 575Thr Ser Ala Lys Thr Gly Ser Phe Gly Val Thr Ala Val Thr Val Gly580 585 590Asp Ser Asn Ser Asn Val Asn Arg Ser Leu Ser Gly Asp Gln Asp Thr595 600 605Phe His Pro Ser Gly Gly Ser His Thr Thr His Gly Ser Glu Ser Asp610 615 620Gly His Ser His Gly Ser Gln Glu Gly Gly Ala Asn Thr Thr Ser Gly625 630 635 640Pro Ile Arg Thr Pro Gln Ile Pro Glu Trp Leu Ile Ile Leu Ala Ser645 650 655Leu Leu Ala Leu Ala Leu Ile Leu Ala Val Cys Ile Ala Val Asn Ser660 665 670
Arg Arg Arg Cys Gly Gln Lys Lys Lys Leu Val Ile Asn Ser Gly Asn675 680 685Gly Ala Val Glu Asp Arg Lys Pro Ser Gly Leu Asn Gly Glu Ala Ser690 695 700Lys Ser Gln Glu Met Val His Leu Val Asn Lys Glu Ser Ser Glu Thr705 710 715 720Pro Asp Gln Phe Met Thr Ala Asp Glu Thr Arg Asn Leu Gln Asn Val725 730 735Asp Met Lys Ile Gly Val740<210>31<211>489<212>PRT<213>人<400>31Met Leu Met Arg Leu Val Leu Thr Val Arg Ser Asn Leu Ile Pro Ser1 5 10 15Pro Pro Thr Tyr Asn Ser Ala His Asp Tyr Ile Ser Trp Glu Ser Phe20 25 30Ser Asn Val Ser Tyr Tyr Thr Arg Ile Leu Pro Ser Val Pro Lys Asp35 40 45Cys Pro Thr Pro Met Gly Thr Lys Gly Lys Lys Gln Leu Pro Asp Ala50 55 60Gln Leu Leu Ala Arg Arg Phe Leu Leu Arg Arg Lys Phe Ile Pro Asp65 70 75 80Pro Gln Gly Thr Asn Leu Met Phe Ala Phe Phe Ala Gln His Phe Thr85 90 95His Gln Phe Phe Lys Thr Ser Gly Lys Met Gly Pro Gly Phe Thr Lys100 105 110Ala Leu Gly His Gly Val Asp Leu Gly His Ile Tyr Gly Asp Asn Leu115 120 125Glu Arg Gln Tyr Gln Leu Arg Leu Phe Lys Asp Gly Lys Leu Lys Tyr130 135 140
Gln Val Leu Asp Gly Glu Met Tyr Pro Pro Ser Val Glu Glu Ala Pro145 150 155 160Val Leu Met His Tyr Pro Arg Gly Ile Pro Pro Gln Ser Gln Met Ala165 170 175Val Gly Gln Glu Val Phe Gly Leu Leu Pro Gly Leu Met Leu Tyr Ala180 185 190Thr Leu Trp Leu Arg Glu His Asn Arg Val Cys Asp Leu Leu Lys Ala195 200 205Glu His Pro Thr Trp Gly Asp Glu Gln Leu Phe Gln Thr Thr Arg Leu210 215 220Ile Leu Ile Gly Glu Thr Ile Lys Ile Val Ile Glu Glu Tyr Val Gln225 230 235 240Gln Leu Ser Gly Tyr Phe Leu Gln Leu Lys Phe Asp Pro Glu Leu Leu245 250 255Phe Gly Val Gln Phe Gln Tyr Arg Asn Arg Ile Ala Met Glu Phe Asn260 265 270His Leu Tyr His Trp His Pro Leu Met Pro Asp Ser Phe Lys Val Gly275 280 285Ser Gln Glu Tyr Ser Tyr Glu Gln Phe Leu Phe Asn Thr Ser Met Leu290 295 300Val Asp Tyr Gly Val Glu Ala Leu Val Asp Ala Phe Ser Arg Gln Ile305 310 315 320Ala Gly Arg Ile Gly Gly Gly Arg Asn Met Asp His His Ile Leu His325 330 335Val Ala Val Asp Val Ile Arg Glu Ser Arg Glu Met Arg Leu Gln Pro340 345 350Phe Asn Glu Tyr Arg Lys Arg Phe Gly Met Lys Pro Tyr Thr Ser Phe355 360 365Gln Glu Leu Val Gly Glu Lys Glu Met Ala Ala Glu Leu Glu Glu Leu370 375 380Tyr Gly Asp Ile Asp Ala Leu Glu Phe Tyr Pro Gly Leu Leu Leu Glu385 390 395 400
Lys Cys His Pro Asn Ser Ile Phe Gly Glu Ser Met Ile Glu Ile Gly405 410 415Ala Pro Phe Ser Leu Lys Gly Leu Leu Gly Asn Pro Ile Cys Ser Pro420 425 430Glu Tyr Trp Lys Pro Ser Thr Phe Gly Gly Glu Val Gly Phe Asn Ile435 440 445Val Lys Thr Ala Thr Leu Lys Lys Leu Val Cys Leu Asn Thr Lys Thr450 455 460Cys Pro Tyr Val Ser Phe Arg Val Pro Asp Ala Ser Gln Asp Asp Gly465 470 475 480Pro Ala Val Glu Arg Pro Ser Thr Glu485<210>32<211>122<212>PRT<213>人<400>32Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val1 5 10 15Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala20 25 30Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile35 40 45Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys50 55 60Arg Gly Pro Gly Gly Val Trp Ala Ala Glu Ala Ile Ser Asp Ala Arg65 70 75 80Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala85 90 95Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His100 105 110Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr115 120
<210>33<211>26<212>DNA<213>人<400>33agatattgca cgggagaata tacaaa 26<210>34<211>27<212>DNA<213>人<400>34tcaattcctg aaattaaagt tcggata 27<210>35<211>23<212>DNA<213>人<400>35tctgcagagt tggaagcact cta 23<210>36<211>21<212>DNA<213>人<400>36gccgaggctt ttctaccaga a21<210>37<211>20<212>DNA<213>人<400>37catggcttga tcagcaagga 20<210>38<211>21<212>DNA<213>人<400>38tggaagtgtg ccctgaagaa g21<210>39<211>21<212>DNA<213>人<400>39aagcagcacc agcaagtgaa g21
<210>40<211>21<212>DNA<213>人<400>40tcatggcctg tgtcagtcaa a21<210>41<211>22<212>DNA<213>人<400>41acatgccagc cactgtgata ga 22<210>42<211>21<212>DNA<213>人<400>42ccctgccttc acaatgatct c21<210>43<211>23<212>DNA<213>人<400>43ggaattcacc tcaagaacat cca 23<210>44<211>23<212>DNA<213>人<400>44agtgtggcta tgacttcggt ttg 23<210>45<211>22<212>DNA<213>人<400>45cagccacaag cagtccagat ta 22<210>46<211>24<212>DNA<213>人<400>46cctgactatc aatcacatcg gaat 24
<210>47<211>21<212>DNA<213>人<400>47ccaggtgctc cacatgacag t21<210>48<211>24<212>DNA<213>人<400>48aaacaaccaa caacaaggag aatg 24<210>49<211>21<212>DNA<213>人<400>49cgtctccaca catcagcaca a21<210>50<211>22<212>DNA<213>人<400>50tcttggcagc aggatagtcc tt 22<210>51<211>22<212>DNA<213>人<400>51gcagaccagc atgacagatt tc 22<210>52<211>20<212>DNA<213>人<400>52gcggattagg gcttcctctt 20<210>53<211>23<212>DNA<213>人<400>53tgaagttcaa tgcactggaa ctg 23
<210>54<211>20<212>DNA<213>人<400>54caggacgatc tccacagcaa 20<210>55<211>23<212>DNA<213>人<400>55tggagtccac gagatcattt aca 23<210>56<211>19<212>DNA<213>人<400>56agccttggcc ctcggatat 19<210>57<211>21<212>DNA<213>人<400>57cactgagttc gccaagagca t 21<210>58<211>23<212>DNA<213>人<400>58cacgccatac ttgagaaggg taa 23<210>59<211>23<212>DNA<213>人<400>59gctagtgatc aacagtggca atg 23<210>60<211>18<212>DNA<213>人<400>60gctggcctct ccgttgag18
<210>61<211>22<212>DNA<213>人<400>61tgttcggtgt ccagttccaa ta 22<210>62<211>22<212>DNA<213>人<400>62tgccagtggt agagatggtt ga 22<210>63<211>22<212>DNA<213>人<400>63gggacatgtg gagagcctac tc 22<210>64<211>21<212>DNA<213>人<400>64catcatagtt cccccgagca t2权利要求
1.一种制备用于早期检测结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS的试剂组合物的方法,所述方法包括合成来自SEQ.ID NOs 33-64的每种多聚核苷酸对的引物对;使用稀释剂,将每种所述引物的多种独立的储液调整到至少一种需要的浓度;将每种所述引物的每份所述储液等分到多个容器中;和将所述多个容器在长期保存条件下保存。
2.权利要求1的方法,其中所述方法还包括将每种所述引物对的等分储液冻干。
3.一种用于结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS早期检测的方法,所述方法包括通过非侵入性的或最低程度侵入性的方法从大体上看起来正常的组织获得组织样品;从所述样品分离RNA;使用选自由SEQ.ID NOs 33-64组成的组的多个引物对,从RNA样品扩增cDNA拷贝,以检测选自SEQ.ID NOs.1-16的多聚核苷酸组;量化扩增的cDNA拷贝;和使用量化的扩增的cDNA拷贝来评估对于结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS的至少一种疾病的疾病进展和治疗功效中的至少一种。
4.权利要求3的方法,其中所述获得步骤还包括取样直肠黏膜细胞。
5.权利要求3的方法,其中所述获得步骤还包括采血、粪便取样和进行直肠组织活检的一种。
6.权利要求3的方法,其中所述使用步骤还包括通过多变量分析进行分析组织样品cDNA的量化水平;将组织样品cDNA量化水平的多变量分析与多种对照数据进行比较,其中所述比较确定与对照数据的差异显著性,从而评估结肠直肠癌的存在。
7.权利要求6的方法,其中所述分析步骤还包括使用ANOVA检测和Mahalanobis距离检测的一种。
8.一种用于结肠直肠癌早期检测和用于评估直肠结肠癌治疗效果的方法,所述方法包括步骤通过非侵入性的或最低程度侵入性的方法获得组织样品,所述组织样品含有大体看起来无癌的细胞;产生具有针对SEQ.ID NOs 17-32确定的每种多肽的不同特异性的多种抗体;用所述多种抗体检测SEQ.ID NOs 17-32确定的多肽组中的多肽表达,其中所述检测步骤允许量化所述抗体与所述多肽的特异性结合;基于所量化的特异性抗体结合,量化多肽组中每种不同多肽的水平;和分析多肽组中每种不同多肽的量化水平,其中所述量化水平用来评估结肠直肠癌的存在、进展和治疗中的至少一种。
9.权利要求8的方法,其中所述获得步骤还包括取样血液、取样粪便、擦拭结肠细胞和进行直肠组织活检的一种。
10.一种用于分析监测结肠直肠癌的早期检测和治疗的数据的方法,所述方法包括下列步骤从患者样品获得选自SEQ.ID Nos.1-16的多聚核苷酸的多种cDNA的量化水平,其中所述样品通过非侵入性的方法或最低程度侵入性的方法采取;应用多变量统计学分析,将患者样品的所述数据与多种存储的对照数据比较;和基于所述比较,做出关于结肠直肠癌的诊断、结肠直肠癌的进展和对于患者的治疗效果的一种的决断。
11.一种具有存储于其上的指示的机器可读介质,当通过一种或多种处理器执行时,其使得系统获得SEQ.ID NOs.1-16列出的多聚核苷酸的量化的cDNA水平的数据,其中所述量化的cDNA水平来自于患者组织样品和对照组织样品;使用至少一种多变量统计学分析,将患者组织样品的量化的cDNA水平与对照组织样品的量化的cDNA水平相比较;和提供所述多变量统计学分析用于由受过评估结肠直肠癌训练的个体进行评估。
12.一种包含在传送介质中的计算机信号,其包括包括用于获得选自SEQ.ID NOs.1-16的多聚核苷酸的量化的cDNA水平的指示的编码部分,其中所述量化的cDNA水平来自于患者组织样品;包括用于使用多变量统计学分析将来自患者组织样品的量化的cDNA水平与多种对照数据相比较的指示的编码部分;和包括用于基于所述比较对患者组织样品做出结肠直肠癌诊断的指示的编码部分。
13.一种包含在传送介质中的计算机信号,其包括包括用于获得选自SEQ.ID NOs.17-33的多肽的量化水平的编码部分,其中所述多肽的量化水平来自于含有结肠黏膜细胞的患者样品;包括用于使用多变量统计学分析将来自患者样品的量化的多肽水平与多种对照数据相比较的指示的编码部分;和包括基于所述比较对于结肠直肠癌诊断、结肠直肠癌进展和结肠直肠癌治疗效果中的至少一种的至少一种指示的编码部分。
14.一种用于结肠直肠癌早期检测的试剂盒,所述试剂盒包括接收通过非侵入性的方法获得的含有直肠黏膜细胞的样品的收集容器,其中所述收集容器被设置以稳定并且保存所述样品;和用于分析多聚核苷酸表达水平的至少一种试剂,其中所述多聚核苷酸选自SEQ.ID Nos.1-16。
15.一种用于检测结肠直肠癌的试剂盒,所述试剂盒包括擦拭取样和样品转移系统,其用于最低程度侵入性地取样直肠黏膜细胞,所述系统包括被设置以从直肠采集结肠黏膜细胞的药签;和当采样后用于接收所述药签的收集容器,其中所述收集容器被设置以稳定、提取和保存所述样品;和用于分析多聚核苷酸表达水平的至少一种试剂,其中所述多聚核苷酸选自SEQ.ID Nos.1-16。
16.一种用于药物筛选的方法,所述方法包括下述步骤为结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS的至少一种选择模式生物系统;应用适当的模式生物系统,选择至少一种有希望的药物进行筛选;从SEQ.ID 1-32确定的生物标记组选择至少2种生物标记;将所述至少一种有希望的药物定量给予所述模式生物系统;和作为所述定量给药步骤的函数,监测模式生物系统种至少2种生物标记的应答。
17.权利要求16的方法,其还包括基于所述监测步骤,确定所述有希望的药物的效果。
全文摘要
本发明公开了一种早期检测结肠直肠癌(“CRC”)的新方法,其使用分子诊断检测来评估用于结肠直肠癌早期检测的大体上看起来正常的结肠组织。所述大体上看起来正常的结肠黏膜细胞可以通过非侵入性的或最低程度侵入性的方法收集。本发明还公开了新型生物标记组用于药物筛选的应用。这样的生物标记组可以完全或部分用作监测有前景的药物在病理干涉中的效用的替代终端,所述病理诸如癌症,例如CRC、肺癌、前列腺癌和乳腺癌,和神经退行性疾病,例如阿尔茨海默病和ALS。
文档编号C07K1/00GK101065393SQ200580033013
公开日2007年10月31日 申请日期2005年9月30日 优先权日2004年9月30日
发明者南希·M·李 申请人:优基谱
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1