轻度骨关节炎生物标志物及其用途
【专利摘要】本发明涉及新生物标志物的鉴定和选择以及新生物标志物组合的鉴定和选择,与未患骨关节炎的个体相比,所述新生物标志物和新生物标志物组合在患轻度骨关节炎的个体中差异表达。与本发明生物标志物的产物特异性和/或选择性杂交的多核苷酸和蛋白质也包括在本发明的范围内,还包括用于诊断轻度骨关节炎的含有所述多核苷酸和蛋白质的试剂盒。本发明还包括多核苷酸和蛋白质用于监测个体中疾病消退和监测治疗方案的效力的用途,所述多核苷酸和蛋白质与本发明生物标志物的产物特异性和/或选择性杂交。本发明还提供了本发明生物标志物的产物用于鉴定骨关节炎中新治疗靶标的方法。
【专利说明】轻度骨关节炎生物标志物及其用途
[0001]本申请是申请号为200680011050.3的中国专利申请的分案申请,原申请是国际申请PCT/US2006/003926的中国国家阶段申请。
1.【技术领域】
[0002]本发明涉及新轻度OA生物标志物的鉴定和选择以及新生物标志物组合的鉴定和选择,与未患骨关节炎的个体相比,所述新生物标志物和新生物标志物组合在患轻度骨关节炎的个体中差异表达。测量本发明生物标志物和组合生物标志物产物的表达在OA疾病早期患者的诊断中展示出特别的优点。应该理解,为了测量本发明生物标志物的产物,与本发明生物标志物的产物特异性和/或选择性杂交/结合的多核苷酸和蛋白质也包括在本发明的范围内,还包括含有所述多核苷酸和蛋白质、用于诊断个体患有轻度骨关节炎(0A, osteoarthritis)的试剂盒。本发明还提供在鉴定结合本发明生物标志物基因和/或调节其活性的化合物中使用本发明生物标志物产物的方法。通过这些方法鉴定的化合物可用于开发研究骨关节炎和骨关节炎进程的分析技术。此外,通过这些方法鉴定的化合物还可用作开发预防和治疗组合物的先导化合物,所述组合物用于预防、治疗、控制和/或改善骨关节炎或其症状。
2.【背景技术】
[0003]骨关节炎(OA)是关节软骨随时间逐渐退化的慢性疾病,所述关节软骨覆盖在骨末端,形成关节的关节面。据信有许多因素使患者易患骨关节炎,包括遗传易感性、肥胖症、 意外或运动创伤、手术、药物和重体力需求。骨关节炎被认为是从关节软骨的损伤开始的。 最普遍的两种对关节的损伤是运动相关损伤和长期“反复使用”关节损伤。最经常受骨关节炎影响的关节是膝、髋和手。在多数情况下,由于膝和髋必要的承重功能,这些关节中的骨关节炎比手骨关节炎更易导致残疾。随着软骨退化的发展,关节中和关节周围的其他组织(包括骨、肌肉、韧带、半月板和滑膜)中发生次级变化。软骨组织初级衰竭和其他组织次级损伤的净效应是患者发生疼痛、肿胀、虚弱和患病关节丧失机能。这些症状经常发展到具有严重影响的程度,即,使患者丧失劳动力和/或生活质量的后果。
[0004]关节软骨主要由软骨细胞、II型胶原、蛋白聚糖和水组成。关节软骨没有血或神经分布,软骨细胞是该组织中仅有的细胞类型。软骨细胞负责制造形成软骨基质的II型胶原和蛋白聚糖。其后该基质又具有允许用水使基质饱和的物理化学特性。这种结构-功能关系的净效应是关节软骨具有特殊的耐磨特征,并且关节软骨面之间发生几乎无摩擦的移动。在未患骨关节炎时,关节软骨经常在甚至高需求的身体条件下提供终生的无痛承重和无限制的关节移动。
[0005]与所有的活组织一样,关节软骨持续地经历更新过程,其中去除(分解代谢活性)“老”细胞和基质组分并产生(合成代谢活性)“新”细胞和分子。相对于多数组织, 关节软骨的合成代谢/分解代谢周转率较低。成熟软骨结构完整性的长期维持依赖于基质合成和降解之间适当的平衡。软骨细胞通过应答于来自其环境中的化学和机械刺激维持基质平衡。软骨细胞对这些刺激合适并有效的应答是软骨动态平衡所必需的。通过合成代谢活性不足或分解代谢活性过剩破坏动态平衡可引起软骨降解和骨关节炎(Adams等,1995, Nature377Suppl:3-174)。多数受到损伤和分解代谢活性提高的组织能够启动增强的合成代谢应答,允许组织复原。不幸的是,关节软骨应答于软骨基质损伤或消耗而上调其合成代谢活性以及提高合成蛋白聚糖和II型胶原的能力非常有限。[0006]目前没有已知的医学治疗能逆转这种软骨损伤的效应。所有目前的骨关节炎疗法都是针对治疗其症状。此外,由于骨关节炎隐匿式发生并且发展缓慢,因此骨关节炎经常在疾病发展的晚期才得到鉴定,而不是潜在治疗可能更有效的疾病发展早期。因此预防、改变或治疗骨关节炎疾病过程中的进一步发展严重依赖于鉴定疾病的早期诊断标志物,从而允许早期干涉。
[0007]“轻度骨关节炎”目前非常难于诊断。医师主要依赖患者的病史和身体检查来进行骨关节炎的诊断,X光不显示特定关节的早期改变。目前没有公认的生化标志物可用于证实轻度骨关节炎的诊断。症状如发作性关节痛是早期骨关节炎的普遍表现。在发作时关节疼痛,疼痛可持续几天至几周并自发缓解。然而这些症状经常不与软骨损伤的病理阶段良好相关。“轻度”骨关节炎更可靠的度量可通过测定关节损伤的程度来获得,然而目前没有测量相对非侵袭性的关节衰退的方法。
3.
【发明内容】
[0008]本发明涉及新轻度OA生物标志物的鉴定和选择、新轻度OA生物标志物组合的鉴定和选择以及选择新生物标志物组合的方法,与未患OA的个体相比,所述新轻度OA生物标志物和新轻度OA生物标志物组合在患轻度骨关节炎的个体中差异表达。测量本发明生物标志物或生物标志物组合的产物的表达在诊断个体为患轻度OA中展示出特定的优势。应该理解,为了测量本发明生物标志物产物的表达,与本发明生物标志物及其衍生物的产物特异性和/或选择性杂交/结合的多核苷酸和蛋白质也包括在本发明的范围内,还包括用于诊断个体为患有轻度OA的含有所述多核苷酸和蛋白质的试剂盒。本发明还包括与本发明生物标志物的产物特异性和/或选择性杂交的多核苷酸和蛋白质用于监测个体中疾病发展和监测治疗方案的效力的用途。本发明还提供鉴定在骨关节炎新治疗靶标的鉴定中使用本发明生物标志物的产物的方法。本发明还提供在与本发明基因结合和/或调节其活性的化合物的鉴定中使用本发明生物标志物产物的方法。通过这些方法鉴定的化合物可用于开发研究骨关节炎和骨关节炎发展的测定技术。此外,通过这些方法鉴定的化合物可在本发明预防和治疗组合物的开发中用作先导化合物,所述组合物用于预防、治疗、控制和/或改善骨关节炎或其症状。
[0009]本发明包括含有至少两种分离多核苷酸的组合物,其中每种分离的多核苷酸与生物标志物选择性杂交,所述生物标志物选自表1或表4列出的生物标志物,并且其中组合物允许测量至少两种所述生物标志物的表达水平。
[0010]分离的多核苷酸可以是单链或双链RNA或DNA。
[0011]本发明还包括含有至少两种分离的多核苷酸的组合物,其中每种分离的多核苷酸与生物标志物的RNA产物和/或RNA产物的互补多核苷酸序列选择性杂交,所述生物标志物选自表1或表4列出的生物标志物,并且其中组合物允许测量至少两种所述生物标志物的RNA表达水平。
[0012]本发明的特征还在于包含两种或更多分离多核苷酸集合的组合物,其中每种分离的多核苷酸与表3或表5中列出的RNA序列和/或该RNA序列的互补多核苷酸序列选择性杂父。
[0013]本发明还包括包含至少两种表6和/或表8中列出的生物标志物特异性引物的组合物。本发明还包括包含至少两种表8中列出的多核苷酸探针的组合物。
[0014]本发明还包括包含两种或更多分离蛋白质集合的组合物,其中每种分离的蛋白质与生物标志物的蛋白质产物选择性结合,所述生物标志物选自表1或表4中列出的生物标志物,并且其中所述组合物用于测量至少两种所述生物标志物的表达水平。表7中列出了本发明范围内的分离蛋白质的实例。
[0015]分离的蛋白质可以是配体,其中所述配体包括抗体及其片段。单克隆抗体和多克隆抗体均在本发明范围内。
[0016]包含至少两种抗体的组合物也涵盖在本发明的范围内,其中每种抗体与生物标志物的蛋白质产物选择性结合,所述生物标志物选自表1或表4中列出的生物标志物,并且其中所述组合物允许测量至少两种所述生物标志物的表达水平。表7列出了本发明包括的抗体实例。
[0017]抗体可包括单克隆抗体和多克隆抗体。
[0018]本发明还涉及诊断或检测个体中轻度OA的方法,其包括:测定来自个体的血样中一种或多种生物标志物(包括表1和/或表4中列出的生物标志物)的RNA产物水平;将来自所述个体的血样中RNA产物的水平与对照中相同RNA产物的水平进行比较,其中相同 RNA产物在个体与对照之间的差异表达指示个体中的轻度0A。血样可以是全血、一滴全血或裂解血。
[0019]所述方法还可包括从血样中分离RNA的步骤。
[0020]测定所述RNA产物水平的步骤可以使用定量RT-PCR(QRT-PCR)进行,任选地包括将与所述一种或多种RNA产物或其互补物杂交的引物与该RNA产物或其互补物杂交的步骤。引物的长度可以在约4-40个、优选8-35个、优选10-30个核苷酸之间,并且更优选引物的长度为15-25个核苷酸。此外,通过将第一组分离多核苷酸(对应于一种或多种RNA 转录物)与包含第二组分离多核苷酸的阵列杂交来进行测定每种RNA产物水平的步骤。第一个多核苷酸群任选地包括RNA、DNA、cDNA、PCR产物或EST。阵列上的第二组分离多核苷酸可包括对应于表1和/或表4中一种或多种生物标志物的多核苷酸。
[0021]在另一实施方案中,可以通过将所述分离RNA与包含多种分离多核苷酸的阵列杂交来进行测定RNA产物水平的步骤。阵列可任选地包括多种分离的多核苷酸,包括RNA、 DNA、cDNA、PCR产物或EST。阵列上的第二组分离多核苷酸可包括对应于表1和/或表4中一种或多种生物标志物的多核苷酸。
[0022]在一个实施方案中,对照来自未患轻度OA的个体。
[0023]本发 明还包括用于诊断或检测轻度OA的试剂盒,其包括任一种上述组合物和使用说明书。 [0024]本发明还包括用于诊断或检测轻度OA的试剂盒,其包括至少两组生物标志物特异性引物,其中每组生物标志物特异性引物与选自表1和/或表4的独特生物标志物产生双链DNA互补性;其中所述组的每种第一引物含有与所述生物标志物之一互补的RNA、cDNA或EST选择性杂交而产生延伸产物,所述组的每一所述第二引物能与所述延伸产物选择性杂交。该试剂盒还可包括具有逆转录酶活性的酶、具有热稳定DNA聚合酶活性的酶或标记手段。
[0025]本发明还涉及诊断或检测个体中轻度OA的方法,其包括:测定来自个体的血样中一种或多种生物标志物的蛋白质产物水平,所述生物标志物选自表1和/或表4中列出的生物标志物;将来自所述个体的血样中蛋白质产物的水平与对照中相同蛋白质产物的水平进行比较,其中相同蛋白质产物在个体与对照之间的差异表达指示个体中的轻度0A。蛋白质产物的水平可以使用抗体或其片段进行检测,包括表7中列出的抗体。抗体可包括单克隆抗体或多克隆抗体。
[0026]本发明还包括包含至少两种分离多核苷酸的组合物,其中每种分离多核苷酸与表
1、表2和/或表4中所示的生物标志物选择性杂交,并且其中组合物允许测量至少两种生物标志物的表达水平,至少一种所述生物标志物选自表1或表4。
[0027]本发明还包括包含至少两种分离多核苷酸的组合物,其中每种分离的多核苷酸与生物标志物的RNA产物和/或RNA产物的互补多核苷酸序列选择性杂交,所述生物标志物选自表1、表2或表4列出的生物标志物,其中组合物允许测量至少两种生物标志物的RNA表达水平,并且其中至少一种所述生物标志物选自表1或表4。
[0028]本发明还包括包含至, 少两种抗体的组合物,其中每种抗体与生物标志物的蛋白质产物选择性杂交,所述生物标志物选自表1、表2或表4列出的生物标志物,其中组合物允许测量至少两种生物标志物的表达水平,并且其中至少一种所述生物标志物选自表1或表4。
[0029]本发明还涉及包含含有两种或更多分离多核苷酸集合的组合物,其中每种分离多核苷酸与选自表1或表4所列生物标志物的生物标志物选择性杂交。该组合物允许测量至少两种生物标志物的表达水平,其中生物标志物能使用ROC曲线分析测定确定个体是否患有轻度0A。优选地,ROC曲线下面积大于0.5,优选大于约0.6,0.7,0.8或大于约0.9。
[0030]本发明还涉及检测个体是否患有轻度OA的方法,包括测定来自患者的血样中一种或多种生物标志物(包括表1、表2和/或表4列出的生物标志物)的RNA产物或蛋白质产物的水平;进行ROC曲线分析和测量ROC曲线下面积,其中如果ROC曲线下面积大于约0.5、优选大于约0.6,0.7,0.8或优选大于约0.9,则结论为在个体中检测到轻度0A。
[0031]本发明提供了待测试其预防、治疗、控制或改善骨关节炎或其症状能力的化合物的鉴定方法。该方法包括以下步骤:使一种或多种本发明生物标志物的蛋白质产物或其片段或者一种或多种本发明生物标志物的RNA产物或其片段与测试化合物接触;检测该测试化合物与蛋白质产物或RNA产物结合的能力,从而如果化合物与蛋白质产物或RNA产物结合,则将该化合物鉴定为待测试其预防、治疗、控制或改善骨关节炎能力的化合物。
[0032]本发明还提供了待测试其预防、治疗、控制或改善骨关节炎或其症状能力的化合物的鉴定方法。该方法包括以下步骤:使表达一种或多种本发明生物标志物的蛋白质或RNA产物的细胞与测试化合物接触;在孵育期后,使用上文所述的任何组合物测定接触测试化合物的细胞中存在的蛋白质或RNA产物的量;与未接触测试化合物的相应对照细胞中存在的蛋白质或RNA产物的量进行比较,从而如果蛋白质或RNA产物的量相对于对照中的量发生改变,则将该化合物鉴定为待测试其预防、治疗、控制或改善骨关节炎能力的化合物。
[0033]本发明还提供了待测试其预防、治疗、控制或改善骨关节炎或其症状能力的化合物的鉴定方法。该方法包括以下步骤:使无细胞提取物(如软骨细胞提取物)与核酸序列和测试化合物接触,所述核酸序列编码一种或多种本发明生物标志物的蛋白质或RNA产物;测定无细胞提取物中存在的蛋白质或RNA产物的量;与未接触测试化合物的相应对照中存在的蛋白质或RNA产物的量进行比较,从而如果蛋白质或RNA产物的量相对于对照中的量发生改变,则将该化合物鉴定为待测试其预防、治疗、控制或改善骨关节炎能力的化合物。
[0034]3.1 定义
[0035]对于以下书面描述中使用的特定术语,提供以下定义。
[0036]本文使用的术语“3’末端”指mRNA的至多后1000个核苷酸或1/3的mRNA末端,其中3’末端核苷酸为与多聚A尾(如果存在)相邻的编码区或非翻译区末端核苷酸。即,mRNA的3’末端不包括多聚A尾(如果存在)。基因的“3’区”指位于基因3’末端中的多核苷酸(双链或单链),包括但不限于3’非翻译区(如果存在)和基因的3’蛋白质编码区。3’区的长度不小于8个核苷酸,长度不大于1000个核苷酸。3’区的其他可能长度包括但不限于10、20、25、50、100、200、400和500个核苷酸。
[0037]本文使用的术语“5’末端”指mRNA的至多前1000个核苷酸或1/3的mRNA末端(其中mRNA的全长不包括多聚A尾),从mRNA的第一个核苷酸开始。基因的“5’区”指位于基因5’末端中的多核苷酸(双链或单链),包括但不限于5’非翻译区(如果存在)和基因的5’蛋白质编码区。5’区的长度不小于8个核苷酸,长度不大于1000个核苷酸。5’区的其他可能长度包括但不限于10、20、25、50、100、200、400和500个核苷酸。[0038]本文使用的术语“扩增”指由模板核酸产生一种或多种核酸序列的一个或多个拷贝的过程,优选通过聚合酶链式反应的方法(Mullis和Faloona, 1987, MethodsEnzymol.155:335)。“聚合酶链式反应”或“PCR”指用于扩增一种或多种模板序列的体外方法。PCR反应包括重复串联的温度循环,一般在50-100 Ul的体积中进行。反应混合物包含dNTP(四种脱氧核苷酸dATP、dCTP、dGTP和dTTP中的每一种)、引物、缓冲液、DNA聚合酶和核酸模板。PCR反应包括提供至少一个多核苷酸引物组,其中第一种引物含有待扩增的核酸模板序列一条链中区域的互补序列,并引发互补DNA链的合成,第二种引物含有待扩增的特定靶核酸序列另一链中区域的互补序列,并引发互补DNA链的合成;使用核酸聚合酶作为模板依赖性聚合剂在允许以下PCR循环步骤的条件下扩增核酸模板序列:(i)使扩增所需引物与模板序列中含有的靶核酸序列退火,(ii)延伸引物,其中核酸聚合酶合成引物延伸产物,以及任选的变性步骤。“多核苷酸引物组”或“PCR引物组”可包含2种、3种、4种或更多种引物。在一个实施方案中,使用外-DNA聚合酶在PCR反应中扩增核酸模板。其他扩增方法包括但不限于连接酶链式反应(LCR)、基于多核苷酸特异性的扩增(NSBA)或任何本领域已知的核酸扩增方法。
[0039]本文使用的术语多肽的“氨基端”区指由位于基因5’末端内的多核苷酸序列(双链或单链)编码的多肽序列,包括但不限于基因的5’蛋白质编码区。本文使用的术语“氨基端”区指由多肽的第一个氨基酸开始、最多为多肽的前300个氨基酸或1/3的多肽氨基末端。多肽的“氨基端”区长度不小于3个氨基酸,长度不大于350个氨基酸。多肽“氨基端”区的其他可能长度包括但不限于5、10、20、25、50、100和200个氨基酸。[0040]本文在蛋白质类物质(如蛋白质、多肽、肽和抗体)的上下文中使用的术语“类似物”指这样的蛋白质类物质:其与第二种蛋白质类物质具有相似或相同的功能,但不一定包含与所述第二种蛋白质类物质相似或相同的氨基酸序列或具有与第二种蛋白质类物质相似或相同的结构。具有相似的氨基酸序列的蛋白质类物质指满足以下至少一项的第二种蛋白质类物质:(a)具有与第二种蛋白质类物质的氨基酸序列至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99% —致性的氨基酸序列的蛋白质类物质;(b)由核苷酸序列编码的蛋白质类物质,所述核苷酸序列在严谨条件下与编码第二种蛋白质类物质的至少5个连续氨基酸残基、至少10个连续氨基酸残基、至少15个连续氨基酸残基、至少20个连续氨基酸残基、至少25个连续氨基酸残基、至少40个连续氢基酸残基、至少50个连续氨基酸残基、至少60个连续氨基酸残基、至少70个连续氨基酸残基、至少80个连续氨基酸残基、至少90个连续氨基酸残基、至少100个连续氨基酸残基、至少125个连续氨基酸残基或至少150个连续氨基酸残基的核苷酸序列杂交;和(c)由核苷酸序列编码的蛋白质类物质,所述核苷酸序列与编码第二种蛋白质类物质的核苷酸序列有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99% —致性。与第二种蛋白质类物质结构相似的蛋白质类物质指具有与第二种蛋白质类物质相似的二级、三级或四级结构的蛋白质类物质。蛋白质类物质的结构可以通过本领域技术人员公知的方法测定,包括但不限于肽测序、X线晶体衍射、核磁共振、圆二色性和晶体电子显微术。[0041]为了测定两个氨基酸序列或两个核酸序列之间的百分比一致性,以最佳比较的目的比对序列(例如为了与一个氨基酸或核酸序列最佳比对,可以在另一氨基酸或核酸序列中引入缺口)。接着比较相应氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸。当第一个序列中的位置被第二个序列中相应位置上的相同氨基酸残基或核苷酸占据时,则所述分子在该位置上是相同的。两序列之间的百分比一致性是序列间共享的相同位置数的函数(即%—致性=相同的重叠位置数/位置总数乘以100%)。在一个实施方案中,两个序列的长度相同。
[0042]也可以使用数学算法实现两序列间百分比一致性的测定。用于比较两个序列的数学算法的优选非限制性实例为 Karlin 和 Altschul, 1993,Proc.Natl.Acad.Sc1.U.S.A.90:5873-5877 改良的 Karlin 和 Altschul, 1990,Proc.Natl.Acad.Sc1.U.S.A.87:2264-2268的算法。这样的算法整合在 Altschul 等,1990,J.Mol.Biol.215:403 的 NBLAST 和 XBLAST程序中。可以使用NBLAST核苷酸程序的参数组(如评分=100,字长=12)进行BLAST核苷酸搜索,以获得与本发明核酸分子同源的核苷酸序列。可以使用XBLAST核苷酸程序的参数组(如评分=50,字长=3)进行BLAST蛋白质搜索,以获得与本发明蛋白质分子同源的氨基酸序列。为了获得用于比较目的的缺口比对,可以使用Altschul等,1997,NucleicAcids Res.25:3389-3402 所述的 Gapped BLAST。或者,可以使用 PS1-BLAST 进行迭代搜索,其检测分子间的远缘关系(Id.)。使用BLAST、Gapped BLAST和PS1-BLAST程序时,可使用各个程序(如XBLAST和NBLAST)的默认参数(参见如NCBI网址)。用于序列比较的另一优选非限制性实例为Myers和Miller,1988,CAB10S4:11-17的算法。这样的算法整合在ALIGN程序(2.0版)中,后者是GCG序列比对软件包的一部分。使用ALIGN程序比较氨基酸序列时,可使用PAMI20的权重残基表、12的缺口长度罚分和4的缺口罚分。可以允许或不允许缺口地使用与上述类似的技术测定两序列之间的百分比一致性。在百分比一致性的计算中一般仅计数准确匹配。
[0043]在非蛋白质类类似物的上下文中,本文使用的术语“类似物”指具有与第一种有机或无机分子相似或相同的功能并在结构上与第一种有机或无机分子相似的另一种有机或无机分子。
[0044]本文使用的术语“生物标志物”指在患轻度OA个体和未患轻度OA的个体之间差异表达的基因。
[0045]本文使用的术语“生物标志物特异性引物”指引发合成本发明生物标志物RNA产物部分的互补DNA的引物。例如,引物可包括第一种引物(它是能与本发明生物标志物区域的互补RNA、cDNA或EST选择性杂交以产生延伸产物的序列)和能与延伸产物选择性杂交的第二种引物,它们用于产生与本发明生物标志物区域互补的双链DNA。本发明包括用于测量本发明生物标志物RNA产物表达的引物。表8提供了引物的代表性种类。
[0046]本文使用的术语“生物标志物特异性探针”指能与本发明生物标志物序列或其互补RNA、cDNA或EST选择性杂交的核酸探针。例如,探针可以附在阵列(包括微阵列)上,或者探针可以与生物标志物特异性引物联合使用,以允许进行定量实时RT-PCR(例如TaqMan (|)或Molecular Beacon 探针)。表8提供了可用于本发明的TaqMan⑩:探针以及相应引物的代表种类。生物标志物特异性探针能与生物标志物序列或其互补物序列的一部分(例如至少约8个连续核酸残基)、最多为(且包括)生物标志物的完整序列选择性杂交。例如生物标志物特异性探针能与生物标志物或其互补物的至少约8、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100或更多、最多为(且包括)完整序列选择性杂父。
[0047]本文使用的术语“数据”或“生物标志物数据”通常指反映血样中可见的生物标志物产物丰度的数据。
[0048]本文使用的术语“患者样品”指来自患者的生物学样品,可以在其中检测轻度OA的生物标志物。患者样品包括但不限于血、血清、唾液、尿、滑液、组织等样品。优选地,患者样品为血样。
[0049]本文使用的术语“血核酸样品”指得自血的核酸,可包括得自全血、离心裂解血、无血清全血或分级血(包括外周血白细胞(PBL)或本文所述的其他血级分)的核酸。全血指未分级血,例如一滴血,其中一滴血包括5ii1、i0ia、i5ia、20ii1、25ia、30ia的体积。离心裂解血或“裂解血”指如本文所述与裂解缓冲液混合并离心的全血(见实施例2)。无血清血指如本文所述通过离心去除了血清或血浆的全血(见实施例2)。优选地,血核酸样品为全血或离心裂解血,并且为总RNA、mRNA或者为对应于mRNA的核酸,例如从所述血中分离的cANA。血核酸样品还可包括得自总RNA、mRNA或cDNA的PCR产物。
[0050]本文使用的术语多肽的“羧基端”区指由位于基因3’末端内的多核苷酸序列(双链或单链)编码的多肽序列,包括但不限于基因的3’蛋白质编码区。本文使用的术语“羧基端”区指从多肽的最后一个氨基酸开始最多为多肽的300个氨基酸或1/3的多肽羧基末端。“3’末端”不包括多聚A尾(如果存在)。
[0051]多肽的“羧基端”区长度不小于3个氨基酸,长度不大于350个氨基酸。多肽“羧基端”区的其他可能长度包括但不限于5、10、20、25、50、100和200个氨基酸。
[0052]本文使用的术语“软骨核酸样品”指来自软骨的核酸。优选地,软骨核酸样品为总RNA、mRNA或者为对应于RNA的核酸,例如cDNA。软骨核酸样品还可包括得自总RNA、mRNA或cDNA的PCR产物。
[0053]本文使用的术语“本发明生物标志物组合”指表1或表4公开的任何一种或多种生物标志物以及表1和/或表2公开的任何两种或更多生物标志物的任何组合,只要所述组合中至少一种生物标志物来自表1。术语“本发明生物标志物组合”指表4和/或表2公开的任何两种或更多生物标志物的任何组合,只要所述组合中至少一种生物标志物来自表4。术语“本发明生物标志物组合”指表1和表4和/或表2公开的任何两种或更多生物标志物的任何组合,只要所述组合中至少一种生物标志物来自表1或表4。
[0054]本文使用的术语“化合物”和“物质”可互换使用。
[0055]本文使用的“基本由......组成”指用于诊断轻度骨关节炎的生物标志物基因的
最大数目。在一个实施方案中,用于诊断轻度骨关节炎的生物标志物基本由表1和/或表4 的生物标志物中最多 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、100、150种中至少任一项或最多全部组成。在另一实施方案中,用于诊断轻度骨关节炎的生物标志物基本由表1和/或表4的生物标志物中最多1、2、3、4、5、6、7、8、
9、10、11、13、15、20、25、30、35、40、45、50、100、150 种中至少任一项与申请号 10/915,680 中公开并在表2中公开的生物标志物中最多1、2、3、4、5、6、7、8、9或10、15、20、30、40、50种中至少任一项或最多全部的组合组成。在一个实施方案中,用于诊断轻度骨关节炎的生物标志物基本由表 4 的生物标志物中最多 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、
19、20、25、30种中至少任一项或最多全部组成。
[0056]在诊断轻度骨关节炎的上下文中,本文使用的术语“对照”或“对照样品”指使用除本发明生物标志物以外的手段从确定未患骨关节炎(即“正常对照”)或确定患轻度骨关节炎(即“轻度OA对照”)的个体或个体组中分离的一种或多种样品。术语对照或对照样品还可指数据的汇编,所述数据来自分类为未患骨关节炎(即“正常对照”)或患轻度骨关节炎(即“轻度OA对照”)的一个或多个个体的样品。在筛选预防或治疗剂的上下文中,本文使用的术语“对照”指用于测定或方法的标准品或参照,可以对其比较其他条件。
[0057]在蛋白质类物质(如蛋白质、多肽、肽和抗体)的上下文中,本文使用的术语“衍生物”指蛋白质类物质,其包含已通过引入一个或多个氨基酸残基的替换、缺失和/或添加进行了改变的氨基酸序列。本文使用的术语“衍生物”还指经修饰的蛋白质类物质,例如通过在该蛋白质类物质上共价附加任何类型的分子进行修饰。例如(但不仅限于)抗体可以通过糖基化、乙酰化、聚乙二醇化、磷酸化、酰胺化、通过已知保护/封闭基团的衍生化、蛋白质水解切割、与细胞配体或其他蛋白质连接等进行修饰。蛋白质类物质的衍生物可以使用本领域技术人员公知的技术通过化学修饰产生,包括但不限于特异性化学切割、乙酰化、甲酰化、衣霉素的代谢合成等。此外,蛋白质类物质的衍生物可含有一种或多种非经典氨基酸。蛋白质类物质的衍生物具有与其衍生自的蛋白质类物质相似或相同的功能。
[0058]本文使用的术语“分类器”用于描述数学模型由其区分两种或更多表型性状(如患或未患轻度OA的个体)的输出。
[0059]在非蛋白质类物质的上下文中,本文使用的术语“衍生物”指基于一种有机或无机分子结构形成的另一种有机或无机分子。有机分子的衍生物包括但不限于经修饰的分子,例如通过添加或缺失羟基、甲基、乙基、羧基或胺基进行修饰。有机分子还可以酯化、烷基化和/或磷酸化。
[0060]根据本发明的一个方面,本文使用的术语“诊断轻度0A”或“轻度OA诊断”指确定个体是否患有轻度OA的方法。在一个具体实施方案中,“诊断轻度OA”或“轻度OA诊断”指在两种选择之间进行确定,即个体患轻度OA或个体未患轻度0A。在另一具体实施方案中,“诊断”指在三种选择之间进行确定,个体患轻度0A、个体未患轻度OA或者不能以充分的确定度确定个体患轻度OA还是未患轻度0A。本领域技术人员会理解,在该上下文中,“充分的确定度”取决于诊断的灵敏度和特异性。更具体地,充分的确定度包括高于50%的灵敏度和域特异性、高于60 %的灵敏度和/或特异性、高于70 %的灵敏度和/或特异性、高于80 %的灵敏度和/或特异性、高于90%的灵敏度和/或特异性和100%的灵敏度和/或特异性。
[0061]本文使用的术语“差异表达”指一种或多种本发明生物标志物的RNA和/或蛋白质产物表达水平的差异,其以RNA或蛋白质的量或水平衡量。对于RNA,它可包括第一种样品中生物标志物的mRNA和/或一种或多种mRNA剪接变体的表达水平与第二种样品中相同的一种或多种本发明生物标志物以RNA (包括mRNA和/或一种或多种mRNA剪接变体)量或水平衡量的表达水平之间的差异。“差异表达的”或“差异表达”还可包括与本发明生物标志物的蛋白质(包括一种或多种蛋白质变体)表达量或水平相比,测量样品或样品群中本发明生物标志物编码的蛋白质或一种或多种蛋白质变体。可以如本文所述和本领域技术人员的理解测定差异表达。术语“差异表达的”或“表达水平的改变”指样品中以RNA量和/或蛋白质量衡量的生物标志物给定产物可测量表达水平与第二种样品中生物标志物给定产物的可测量表达水平相比的提高或降低。所述第一种样品与第二种样品不一定来自不同的患者,而是可以为在不同时间点取自同一患者的样品。术语“差异表达的”或“表达水平的改变”还可以指样品群中给定生物标志物可测量表达水平与第二个样品群中生物标志物的可测量表达水平相比的提高或降低。涉及单个样品时,本文使用的术语“差异表达的”可使用所述样品中给定生物标志物表 达水平与对照样品中给定生物标志物平均表达水平的比例来衡量,其中比例不等于1.0。差异表达的还可用于包括使用表达水平比或使用p值将样品的一个群与样品的另一个群进行比较,或者将单个样品与样品群进行比较。使用P值时,当P值低于0.1、低于0.05、低于0.01、低于0.005、低于0.001等时,将核酸转录物(包括hnRNA和mRNA)鉴定为在第一种和第二种群中差异表达。基于基因产物表达水平的比例测定差异表达时,如果第一个样品中其RNA或蛋白质产物表达水平与第二个样品中相比高于或低于1.0,则RNA或蛋白质基因产物差异表达。例如,基因RNA或蛋白质产物的比例高于1(例如 1.2、1.5、1.7、2、3、4、10、20)或比例低于 I (例如 0.8,0.6,0.4,0.2,0.1.0.05)将指示差异表达。在本发明的另一实施方案中,如果核酸群中第一种转录物的平均表达水平与第二个群的平均表达水平相比比例高于或低于1.0,则核酸转录物(包括hnRNA和mRNA)差异表达。例如,比例高于I (例如1.2、1.5、1.7、2、3、4、10、20)或比例低于I (例如0.8、0.6、
0.4、0.2、0.1.0.05)将指不差异表达。在本发明的另一实施方案中,如果第一种样品中其表达水平与第二个群的平均值相比高于或低于1.0,包括比例高于I (例如1.2、1.5、1.7、2、3、4、10、20)或比例低于I (例如0.8、0.6、0.4、0.2、0.1.0.05),则核酸转录物(包括hnRNA和mRNA)差异表达。“提高的差异表达”指相对于标准品如第二个群中的平均表达水平为1.1倍、1.2倍、1.4倍、1.6倍、1.8倍或更高。“降低的差异表达”指相对于标准品如第二个群中的平均表达水平低于1.0倍、0.8倍、0.6倍、0.4倍、0.2倍、0.1倍或更低。
[0062]本文使用的术语“药物效力”指药物的有效性。“药物效力” 一般通过已经接受或正在接受药物治疗的患者的临床反应来衡量。如果实现了期望的临床结果(例如像本说明书中所述降低了骨关节炎的症状或防止了骨关节炎的发展),则认为药物具有高效力水平。可以使用吸收的药物量来预测患者的反应。一般的规则为随着药物剂量的提高可见患者中更高的效果,直至达到最高的期望效果。如果在达到最高点之后施用更多药物,则副作用一般会提闻。
[0063]本文使用的术语“有效量”指足以降低或改善骨关节炎或其一种或多种症状的发展、严重性和/或持续时间、骨关节炎或其一种或多种症状的复发或发生、防止骨关节炎或其一种或多种症状的进展或者增强或改善其他治疗的预防或治疗效果的化合物的量。
[0064]在蛋白质类物质的上下文中,本文使用的术语“片段”指肽或多肽,其包含多肽或蛋白质的氨基酸序列中至少5个连续氨基酸残基,至少10个连续氨基酸残基、至少15个连续氨基酸残基、至少20个连续氨基酸残基、至少25个连续氨基酸残基、至少40个连续氨基酸残基、至少50个连续氨基酸残基、至少60个连续氨基酸残基、至少70个连续氨基酸残基、至少80个连续氨基酸残基、至少90个连续氨基酸残基、至少100个连续氨基酸残基、至少125个连续氨基酸残基、至少150个连续氨基酸残基、至少175个连续氨基酸残基、至少200个连续氨基酸残基或至少250个连续氨基酸残基的氨基酸序列。在一个具体实施方案中,蛋白质或多肽的片段保留该蛋白质或多肽的至少一种功能。在另一实施方案中,蛋白质或多肽的片段保留该蛋白质或多肽的至少一种、两种、三种、四种或五种功能。优选地,抗体的片段保留与抗原免疫特异性结合的能力。
[0065]本文使用的术语“融合蛋白”指包含第一种蛋白质或多肽或其片段、其功能性片段、其类似物或其衍生物的氨基酸序列和异源蛋白质、多肽或肽(即与第一种蛋白质或其片段、类似物或其衍生物不同的第二种蛋白质或多肽或其片段、类似物或衍生物)的氨基酸序列的多肽。在一个实施方案中,融合蛋白包含与异源蛋白质、多肽或肽融合的预防或治疗剂。根据该实施方案,所述异源蛋白质、多肽或肽是或不是另一种类型的预防或治疗剂均可。
[0066]本文使用的术语“基因表达模式”、“基因表达谱”和“核酸阵列表达谱”可互换使用,包含与非OA个体或正常个体相比,多种靶核酸序列与轻度OA个体阵列上多种核酸探针杂交的杂交模式。“基因表达模式”、“基因表达谱”和“核酸阵列表达谱”还可指对应于两种或更多本发明生物标志物的RNA和/或蛋白质丰度水平的模式,其通过本领域已知用于测量所述RNA和/或蛋白质水平的方法测定。例如,所述模式可以是模式的数学呈现,如数学等式、矢量等。
[0067]本文使用的术语“与......杂交”和“杂交”指与互补核酸的序列特异性非共价
结合相互作用,例如靶核酸序列与阵列上核酸成员之间的相互作用。
[0068]本文使用的术语“免疫球蛋白”指基本由免疫球蛋白基因编码的一种或多种多肽组成的蛋白质或其抗原结合片段。公认的人免疫球蛋白基因包括Ha (IgAl和IgA2)、Y (IgGl、IgG2、IgG3、IgG4)、S、e和y恒定区基因以及众多的免疫球蛋白可变区基因。全长免疫球蛋白“轻链”(约25Kd或214个氨基酸)在NH2-端(约110个氨基酸)由可变区基因编码,在COOH-端由K和\恒定区基因编码。类似地,全长免疫球蛋白“重链”(约50Kd或446个氨基酸)由可变区基因(约116个氨基酸)和其他上述恒定区基因之一(如Y)编码(编码约330个氨基酸)。
[0069]涉及治疗时,本文使用的术语“组合”指使用一种以上的治疗(如一种以上的预防剂和/或治疗剂)。术语“组合”的使用不限制对受试者施用治疗(如预防和/或治疗剂)的顺序。可以在对受试者施用第二种治疗(如第二种预防或治疗剂)之前(如之前5分钟、15分钟、30分钟、45分钟、I小时、2小时、4小时、6小时、12小时、24小时、48小时、72小时、96小时、I周、2周、3周、4周、5周、6周、8周或12周)、同时、或之后(如之后5分钟、15分钟、30分钟、45分钟、I小时、2小时、4小时、6小时、12小时、24小时、48小时、72小时、96小时、I周、2周、3周、4周、5周、6周、8周或12周)施用弟一种治疗(如弟一种预防或治疗剂)。
[0070]涉及表达模式时,本文使用的“疾病或病症的指示”表示这样的表达模式:所述表达模式可诊断疾病或病症(如存在轻度0A)或者指示有轻度OA风险,使得该表达模式在患所述疾病或病症的患者中比在无该疾病或病症的患者中显著更频繁地发现(使用置信水平设置为最低70%、75%、80%、85%、90%、95%等的常规统计学方法测定)。优选地,作为疾病指示的表达模式可见于至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或更多患该疾病的患者,并可见于10%以下、8%以下、5%以下、2.5%以下或1%以下未患该疾病的患者。“疾病指示”还表示这样的表达模式:所述表达模式可诊断疾病,从而与无该疾病个体的对照表达模式相比,用患病个体的对照表达模式可以对该表达模式更适当地进行分类,其中使用本领域技术人员了解的用于分类预测的统计学算法,参阅如以商业提供的程序,如Silicon Genetics提供的程序(如GeneSpring?)。
[0071]本文使用的术语基因的“内部编码区”指位于本文定义的基因5’区与3’区之间的多核苷酸(双链或单链)。“内部编码区”的长度不小于8个核苷酸,长度可达1000个核苷酸或更长。“内部编码区”的其他可能长度包括但不限于10、20、25、50、100、200、400和500个核苷酸。5’、3’和内部区是不重叠的,可以(但不必须)是连续的,可以(但不必须)加在一起成为相应基因的全长。
[0072]本文使用的术语多肽的“内部多肽区”指位于本文定义的多肽氨基端区与羧基端区之间的多肽序列。多肽的“内部多肽区”长度不小于3个氨基酸,长度可达350个氨基酸或更长。多肽“内部多肽区”的其他可能长度包括但不限于5、10、20、25、50、100和200个
氨基酸。
[0073]多肽的氨基端、羧基端和内部多肽区是不重叠的,可以(但不必须)是连续的,可以(但不必须)加在一起成为相应多肽的全长。
[0074]涉及核酸使用时,本文使用的术语“分离的”或“纯化的”指天然存在的序列已从其正常的细胞(如染色体)环境中移出或在非天然环境中合成(如人工合成的)。因此,“分离的”或“纯化的”序列可以在无细胞溶液中或置于不同的细胞环境中。术语“纯化的”不暗示该序列仅存在核苷酸,而是其基本不含(约90-95%纯度)与其天然共存的非核酸物质,由此区别于分离的染色体。
[0075]在蛋白质类物质(如肽、多肽、蛋白质或抗体)的上下文中,本文使用的术语“分离的”和“纯化的”指这样的蛋白质类物质:其基本不含细胞物质,在一些实施方案中基本不含来自其来源细胞或组织源的异源蛋白质类物质(如污染蛋白),或者在化学合成时基本不含化学前体或其他化学品。“基本不含细胞物质”一语包括蛋白质类物质的制备物,其中所述蛋白质类物质与其分离或重组产生的细胞中的细胞组分分开。因此基本不含细胞物质的蛋白质类物质包括含有低于约30%、20%、10%或5% (以干重计)异源蛋白质类物质(如蛋白质、多肽、肽或抗体,也称为“污染蛋白”)的蛋白质类物质制备物。所述蛋白质类物质重组产生时,还优选基本不含培养基,即培养基占低于约20 %、10%或5 %的蛋白质制备物体积。所述蛋白质类物质通过化学合成产生时优选基本不含化学前体或其他化学品,即其与该蛋白质类物质的合成中涉及的化学前体或其他化学品分开。因此,这些蛋白质类物质制备物含有低于约(以干重计)的化学前体或除目的蛋白质类物质以外的化合物。本文公开的蛋白质类物质优选为分离的。
[0076]本文使用的术语“表达水平”指通过本领域技术人员已知和本文所述的方法测定的给定核酸或蛋白质的可测量。涉及本发明生物标志物对应的RNA、hnRNA、mRNA或mRNA剪接变体时,表达水平可以通过杂交或更多定量测量来测定,例如包括使用SYBR⑩绿、TaqMan ?和分子信标技术的定量实时RT PCR0
[0077]本文使用的术语“配体”是与本发明生物标志物基因之一编码的多肽特异性结合的分子。配体可以是核酸(RNA或DNA)、多肽、肽或化合物。本发明的配体可以是肽配体,如分支肽、线性肽或环肽。在一个优选的实施方案中,多肽配体为抗体。抗体可以是人抗体、嵌合抗体、重组抗体、人源化抗体、单克隆抗体或其抗原结合片段或者多克隆抗体。抗体可以是完整的免疫球蛋白,如184、1§6、1§£、1§0、1§11或其亚型。抗体可以与功能性部分(如具有生物或化学功能的化合物)缀合,所述功能性部分可以是另一种不同的多肽、治疗药物、细胞毒剂、可检测部分或固相支持物。本发明的多肽配体(如抗体多肽)以高亲和力和特异性与生物标志物之一编码的多肽相互作用。例如,多肽配体以至少IO7M'优选至少IO8M'IO9IT1或IOkT1的亲和常数与生物标志物之一编码的多肽相互作用。
[0078]本文使用的术语“大多数”指代表组合全部成员的50%以上(如51%、60%、70%、80%、90%或最高100%)的数字。 涉及阵列时,术语“大多数”指稳定结合在阵列固相衬底上的全部核酸成员的50%以上(如51%、60%、70%、80%、90%或最高100% )。
[0079]本文使用的术语“控制”指受试者由治疗(如预防或治疗剂)产生的有益效果,所述效果不引起骨关节炎的治愈。在某些实施方案中,对受试者施用一种或多种治疗以“控制”骨关节炎,从而防止骨关节炎的发展或恶化。
[0080]本文使用的术语“mRNA完整性”指提取自软骨样品或血样的mRNA提取物的质量。使用本领域熟知的方法如RNA琼脂糖凝胶电泳(如Ausubel等,John ffeley&Sons, Inc.,1997, Current Protocols in Molecular Biology)进行检查时,具有良好完整性的 mRNA提取物不显示降解。优选地,mRNA样品具有良好的完整性(如mRNA的10%以下、优选5%以下、更优选1%以下发生降解),以真实代表由其中提取的软骨或血样品中的基因表达水平。
[0081 ] 本文使用的术语“无反应”和“耐受”描述用目前可用的骨关节炎疗法(如预防或治疗剂)进行治疗的患者,所述疗法在临床上不足以缓解其一种或多种相关症状。通常,这些患者承受严重的持续活动的疾病,需要额外的疗法以改善其骨关节炎相关症状。
[0082]本文使用的“正常”指未显示任何OA症状(包括关节痛)并且未诊断为关节损伤或OA的个体或个体组。优选地,所述正常个体未使用影响OA的药物,并且未诊断为患有任何其他疾病。更优选地,正常个体具有与测试样本相比相似的性别、年龄和体重指标(BMI)。根据本发明,“正常”还指分离自正常个体的样品,包括分离自正常个体的总RNA或mRNA。取自正常个体的样品可包括分离自软骨组织的RNA,其中RNA分离自完整软骨或一块软骨,所述软骨分离自组织移除时未诊断为OA并且未显示任何OA症状的个体。在本发明的一个实施方案中,在死后14小时分离“正常”软骨样品并确认所提取mRNA样品的完整性。取自正常个体的样品还可包括分离自血样的RNA,其中血来自在分离血时未诊断为OA并且未显示任何OA症状的个体。
[0083]本文使用的“核酸”可与术语“多核苷酸”互换使用,通常指任何多聚核糖核苷酸和多聚脱氧核糖核苷酸,可以是未修饰的RNA或DNA或经修饰的RNA或DNA或其任何组合。“核酸”包括但不限于单链和双链核酸。本文使用的术语“核酸”还包括如上文所述含有一个或多个修饰碱基的DNA或RNA。因此,为了稳定性或其他原因修饰了骨架的DNA或RNA为“核酸”。本文使用的术语“核酸”包括核酸的这些化学、酶或代谢修饰的形式以及病毒和细胞(包括如简单细胞和复杂细胞)DNA和RNA特征的化学形式。“核酸”或“核酸序列”还可包括单链或双链RNA或DNA的区域或其任何组合,并可包括本发明一些实施方案的表达序列标签(EST)。EST是通过逆转录mRNA区以产生cDNA而产生的基因的一部分表达序列(即序列的“标签”)。
[0084]本文定义的“核酸阵列”指附加在支持物上的多种独特核酸(或“核酸成员”),其中每种核酸成员附加在支持物上独特的预选区域内。在一个实施方案中,附加在支持物表面的核酸成员为DNA。在一个优选的实施方案中,附加在支持物表面的核酸成员为cDNA或寡核苷酸。在另一优选的实施方案中,附加在支持物表面的核酸成员为通过聚合酶链式反应(PCR)合成的cDNA。本文使用的术语“核酸”可与术语“多核苷酸”互换使用。在另一优选的实施方案中,“核酸阵列”指用于Southern和/或Northern印迹技术的附加在硝酸纤维素或其他膜上的多种独特核酸。
[0085]本文使用的“核酸探针”包括能通过一组非共价结合相互作用(包括互补碱基配对相互作用)与阵列上核酸成员的互补序列结合的核酸。本文使用的核酸探针可包含天然(即A、G、C或T)或修饰碱基(7-脱氮鸟苷、肌苷等)。此外,核酸探针中的碱基可以通过磷酸二酯键以外的键结合,只要它不干扰杂交(即该核酸探针仍在标准严谨或选择性杂交条件下与其互补序列特异性结合)。因此,核酸探针可以为肽核酸,其中组成碱基通过肽键而不是磷酸二酯键结合。
[0086]本文使用的“核酸靶标”或“核酸成员”定义为能与阵列结合的核酸。核酸靶标可以是对应于基因或其部分的分离核酸序列,或者核酸靶标可以是分离自样品的总RNA或mRNA。优选地,核酸靶标或核酸标志物来自人软骨、血或滑液提取物。更优选地,核酸靶标为单链或双链DNA、RNA或DNA-RNA杂交体,其来自人软骨、血或滑液总RNA提取物,优选来自mRNA提取物。
[0087]在一个实施方案中,与阵列结合的“靶”序列的常规核酸阵列可代表完整的人基因组,如AfTymetrix芯片,并且常规阵列应用由两种或更多生物标志物特异性探针组成或包含两种或更多生物标志物特异性探针的分离的生物标志物,所述探针对应于表1、表4和/或表2所述基因,只要至少一种生物标志物特异性探针来自表1或表4。[0088]在另一实施方案中,与阵列结合的序列可以是对应于本发明生物标志物的分离寡核苷酸、cDNA、EST或PCR产物,对阵列应用细胞总RNA。
[0089]本文使用的术语“寡核苷酸”定义为包含两个或更多脱氧核糖核苷酸和/或核糖核苷酸(优选三个以上)的分子。其准确的大小取决于许多因素,所述因素又取决于寡核苷酸最终的功能和用途。寡核苷酸的长度可以从约8至约1000个核苷酸。尽管本发明可使用8至100个核苷酸的寡核苷酸,但优选的寡核苷酸范围为长度从约8至约15个碱基、长度从约8至约20个碱基、长度从约8至约25个碱基、长度从约8至约30个碱基、长度从约8至约40个碱基或长度从约8至约50个碱基。
[0090]本文使用的“骨关节炎”指关节炎的特定形式,特别是关节软骨随时间逐渐退化的慢性疾病,所述关节软骨覆盖在形成关节面的骨末端上。
[0091]本文使用的术语“轻度骨关节炎(OA) ”指个体中OA的特定进展或程度,或者根据Marshall 评分系统(Marshall W., 1996, The Journal of Rheumatology, 23:582-584,引入为参考)定义的特定的OA病理学水平。根据该方法,基于特定表面上存在的最严重损伤对6个关节面(髌骨、股骨滑车、股骨内侧踝、胫骨内侧坪、股骨外侧踝和胫骨外侧坪)中的每一个给予软骨分级。轻度OA的命名指示了对每个关节面应用以反映该面的软骨严重性级别的分数的总分。例如,如果股骨内侧踝最严重的软骨损伤为为I级损伤,则给予I的分值。接着由6个关节面分数的总和产生患者的总分。基于总分将每名患者分入4个OA组中:“轻度”(早期)定义为Marshall分数1_6,“中度”定义为Marshall分数7_12,“显著”定义为Marshall分数13_18,“重度”定义为Marshall分数高于18。
[0092]本文使用的术语“可药用盐”包括但不限于使用本发明方法鉴定的化合物中可存在的酸性或碱性基团的盐。碱性性质的化合物能与多种无机和有机酸形成多种盐。可用于制备这些碱性化合物的可药用酸加成盐的酸为形成无毒酸加成盐的酸,所述无毒酸加成盐即含有可药用阴离子的盐,包括但不限于硫酸盐、柠檬酸盐、马来酸盐、乙酸盐、草酸盐、盐酸盐、氢溴酸盐、氢碘酸盐、硝酸盐、硫酸盐、硫酸氢盐、磷酸盐、酸性磷酸盐、异烟酸盐、乙酸盐、乳酸盐、水杨酸盐、柠檬酸盐、酸性柠檬酸盐、酒石酸盐、油酸盐、鞣酸盐、泛酸盐、酒石酸氢盐、抗坏血酸盐、琥珀酸盐、马来酸盐、龙胆酸盐、延胡索酸盐、葡糖酸盐、glucaronate、糖二酸盐、甲酸盐、苯甲酸盐、谷氨酸盐、甲磺酸盐、乙磺酸盐、苯磺酸盐、对甲苯磺酸盐和双羟萘酸(即1,1’ -亚甲基-二(2-羟基-3-萘甲酸))盐。除上述酸以外,包含氨基部分的化合物还可与多种氨基酸形成可药用盐。酸性性质的化合物能与多种可药用阳离子形成碱盐。这些盐的实例包括碱金属或碱土金属,特别是钙、镁、钠、锂、锌、钾和铁盐。
[0093]本文使用的“多核苷酸”包括长度大于8个核苷酸的双链DNA、单链DNA和双链或单链RNA。
[0094]本文使用的“由生物标志物编码的多肽序列”或“生物标志物的蛋白质产物”指本文定义的生物标志物蛋白质编码区翻译后获得的氨基酸序列。每种本发明生物标志物的mRNA核苷酸序列通过其RNA登录号(见表3或表5)识别,相应的多肽序列通过蛋白质登录号(见表3和表5)识别。
[0095]在使用蛋白质或蛋白质片段免疫宿主动物时,蛋白质的多个区域均可诱发产生与蛋白质的给定区域或三维结构特异性结合的抗体,这些区域或结构称为表位或抗原决定簇。本文使用的“抗原片段”指含有一个或多个表位的多肽部分。表位可以是线性的,基本包含来自抗原的线性序列,或者可以是构象的,包含在遗传上被其他序列隔开、但在结构上在多肽配体的结合位点聚一起的序列。“抗原片段”的长度可以最大为5000、1000、500、400、300、200、100、50、25、20、10或5个氨基酸中的任一种。
[0096]本文使用的“预选区域”、“预定区域”或“独特位置”指衬底上的局部区域,所述区域用于或意图用于放置核酸,在本文中也可称为“选定区域”或简单地称为“区域”。预选区域可以是任何方便的性状,如环形、矩形、椭圆形、楔形等。在一些实施方案中,预选区域小于约Icm2,更优选小于Imm2,更优选小于0.5mm2,并且在一些实施方案中小于0.1mm2。“预选区域”、“预定区域”或“独特区域”中的核酸成员是这样的核酸:其身份(如序列)可通过其在区域中的位置或独特位置确定。
[0097]本文使用的“预防”指由施用一种或多种根据本发明方法鉴定的化合物或施用这些化合物与其他治疗的组合而预防轻度骨关节炎或其一种或多种症状的发生、复发或产生。
[0098]本文使用的术语“引物”指存在于纯化的限制性消化物中或合成产生的寡核苷酸,置于诱导合成与核酸链互补的引物延伸产物的条件下时,即存在核苷酸和诱导剂(如DNA聚合酶)以及适当的温度和PH时,所述寡核苷酸能作为合成的起始点。引物可以为单链或双链,并且必须具有足够的长度,以在诱导剂存在下引发所需延伸产物的合成。引物的确切长度会取决于许多因素,包括温度、引物来源和使用的方法。例如,就诊断应用而言,取决于靶序列的复杂性,寡核苷酸引物一般含有15-25或更多的核苷酸,尽管也可以含有更少的核苷酸。引物合适长度的确定中涉及的因素为本领域普通技术人员所公知。一般而言,根据本领域熟知的标准方法设计和选择本发明的引物,参阅Dieffenbach, C.ff., Lowe,T.M.J.,Dveksler,G.S.(1995)General Concepts for PCR Primer Design.《PCR Primer,A Laboratory Manual)) (Dieffenbach, CW 和 Dveksler, G.S.编辑)Cold Spring HarborLaboratory Press,New Yo rk, 133-155 ;Innis,M.A.和 Gelfand,D.H.(1990)Optimizationof PCRs.《PCR protocols, A Guide to Methods and Applications》(Innis, M.A.,Gelfand, D.H.,Sninsky, J.J.和 White, TJ.编辑)Academic Press, San Diego,3-12 ;Sharrocks, A.D.(1994)The design of primers for PCR.《PCR Technology, CurrentInnovations)) (Griffin, H.G.和 Griffin, A.M,编辑)CRC Press, London, 5-11。
[0099]本文使用的术语“探针”表示寡核苷酸及其类似物,指通过与靶序列核苷酸碱基的氢键相互作用识别多核苷酸靶序列的一系列化学物质。探针或靶序列可以为单链或双链RNA、单链或双链DNA或者DNA与RNA碱基的组合。探针的长度至少为8个核苷酸并小于完整基因的长度。探针的长度可以为10、20、30、50、75、100、150、200、250、400、500并多至2000个核苷酸。探针可包含修饰的寡核苷酸,从而含有可通过荧光、化学发光等进行检测的标签。探针还可经修饰以同时具有检测标签和粹灭分子,例如Taqman K和MolecularBeacon 探针。
[0100]寡核苷酸及其类似物可以为RNA或DNA或者RNA或DNA的类似物,通常称为反义寡聚物或反义寡核苷酸。这些RNA或DNA类似物包括但不限于2-' 0-烷基糖修饰、甲基膦酸、硫代磷酸、二硫代磷酸、formacetaU' -thioformacetal、砜、氨基磺酸和硝基氧骨架修饰和碱基部分进行了修饰的类似物。此外,寡聚物的类似物可以为这样的聚合物:其中糖部分经修饰或用其他适当部分进行了替换,产生包括但不限于吗啉代类似物和肽核酸(PNA)类似物的聚合物(Egholm 等《Peptide Nucleic Acids (PNA)~Oligonucleotide Analogueswith an Achiral Peptide Backbone》, (1992))。[0101]探针还可以是任何寡核苷酸类似物类型与天然DNA或RNA在一起或组合的混合物。同时,寡核苷酸及其类似物可以单独使用或与一种或多种其他寡核苷酸或其类似物组合使用。
[0102]本文使用的术语“预防剂”指可用于预防骨关节炎的任何化合物。在某些实施方案中,术语“预防剂”指在本文所述筛选测定中鉴定的化合物。在其他某些实施方案中,术语“预防剂”指除本文所述筛选测定中鉴定的化合物以外的物质,其已知可用于、已经用于或目前正用于预防或阻碍骨关节炎或其一种或多种症状的发病、发生和/或发展。
[0103]本文使用的术语“预防有效量”指足以引起预防骨关节炎或其一种或多种症状的发生、复发或发病的治疗(如预防剂)量。
[0104]本文使用的术语“蛋白质”、“多肽”和“蛋白质类物质”可互换使用,指通过肽键连接在一起的氨基酸链,任选地可包含天然或非天然氨基酸。任选地,蛋白质或多肽可包含除氨基酸以外的其他分子。所述链可以为任何长度。在一个具体实施方案中,蛋白质由通过肽键连接在一起的少于200个、少于175个、少于150个、少于125个、少于100个、少于50个、少于45个、少于40个、少于35个、少于30个、少于25个、少于20个、少于15个、少于10个或少于5个氨基酸组成。在另一实施方案中,蛋白质由通过肽键连接在一起的至少200个、至少250个、至少300个、至少350个、至少400个、至少450个、至少500个或更多氨基酸组成。
[0105]本文使用的“多种”或“一组”指多于2,例如3或更多、10或更多、100或更多、1000或更多或10000或更多。
[0106]在本发明生物标志物RNA产物的上下文中,本文使用的术语“RNA部分”和“其部分”指RNA转录物,其包含本发明生物标志物RNA产物的至少6个、至少9个、至少15个、至少18个、至少21个、至少24个、至少30个、至少60个、至少90个、至少99、至少108个、或
更多的核苷酸。
[0107]本文使用的术语“本发明生物标志物的产物”指本发明生物标志物相应基因表达的RNA和/或蛋白质。“本发明生物标志物的RNA产物”包括一种或多种产物,可包括核不均一 RNA( “hnRNA”)、mRNA和mRNA的全部或一些剪接变体,其表达量度可根据本文公开的教导作为生物标志物使用。“本发明生物标志物的蛋白质产物”包括生物标志物的一种或多种产物,可包括蛋白质、蛋白质变体和任何经转录后修饰的蛋白质。
[0108]本文使用的术语“选择性扩增的”或“选择性扩增”指从模板核酸中选择性产生特定靶核酸序列的一个或多个拷贝的方法。选择性扩增与总体扩增相比较,后者可作为方法与例如随机引物和寡聚T引物组合使用,以扩增核酸序列群(如mRNA)。选择性扩增优选通过聚合酶链式反应进行(Mullis 和 Faloona, 1987, Methods Enzymol.155:335)。
[0109]在本发明包括的蛋白质上下文中,本文使用的术语“选择性结合”指肽、蛋白质、多肽和抗体中任何两种的特异性相互作用,其中与任何其他肽、蛋白质、多肽和抗体相比,该相互作用优先在所述肽、蛋白质、多肽和抗体的任何两种中发生。例如,当两种分子为蛋白质时,第一种分子上的结构识别并结合第二个分子上的结构而不是其他蛋白质。本文使用的术语“选择性结合”指分子与其特异性结合伴侣结合的亲和力比与非特异性分子的结合至少高2倍,优选亲和力至少高10倍、20倍、50倍、100倍或更高。
[0110]在本发明上下文中,本文使用的“选择性杂交”指本发明包括的多核苷酸与本发明生物标志物的RNA及其互补物或蛋白质产物之间发生的杂交,其中相对于目标基因组中其他基因的RNA产物,所述多核苷酸与本发明生物标志物的RNA产物优先杂交。在一个优选的实施方案中,“选择性杂交”的多核苷酸为选择性高于70%、高于80%、高于90%并最优选为100%的多核苷酸(即发生与其他RNA种类的交叉杂交优选低于30%、低于20%、低于10% )。本领域技术人员应该理解,可以考虑长度和组成来确定与本发明生物标志物的RNA产物“选择性杂交”的多核苷酸。
[0111]本文使用的“特异性杂交”指基本互补(在至少为14至25个核苷酸的一段上至少约65%互补,优选至少约75%互补,更优选至少约90%互补)的两核酸序列之间发生的杂交。参阅引入本文为参考的Kanehisa,M.,1984,Nucleic acids Res.,12:203。因此,预计某种程度的错配是可以容忍的。这些错配很小,例如为单核苷酸、双核苷酸或三核苷酸。或者,错配区可以包括环,其定义为其中四个或更多核苷酸的连续串中存在错配的区域。许多因素影响两核酸杂交(例如阵列上的核酸成员与靶核酸序列的杂交)的效率和选择性。这些因素包括核酸成员的长度、核苷酸序列和/或组成、杂交温度、缓冲液组成和需要核酸成员杂交的区域中的位阻。在核酸长度和核酸与靶序列退火的效率和准确度之间均存在正相关。具体地,较长序列具有比较短序列更高的熔链温度(TM),在给定的靶序列内也更不可能重复,从而使非特异杂交最小。杂交温度与核酸成员退火效率的变化相反。类似地,杂交混合物中存在的有机溶剂(如甲酰胺)的浓度与退火效率的变化相反,而杂交混合物中盐浓度的提高可促进退火。在严谨退火条件下,较长的核酸比较短的核酸更高效地发生杂交,较短的核酸在更宽容的条件下是充分的。
[0112]本文使用的术语“特异性杂交”指两分子(如配体与蛋白质或肽或者抗体与蛋白质或肽)的相互作用,其中所述相互作用取决于各自分子上特定结构的存在。例如,当两分子为蛋白质分子时,第一个分子上的结构识别并结合第二个分子上的结构,而不是蛋白质总体。本文使用的术语“特异性结合”指分子与其特异性结合伴侣结合的亲和力比与非特异性分子的结合高至少10倍、20倍、50倍、100倍或更高。
[0113]本文使用的术语“标准严谨条件”和“严谨条件”指仅在序列间存在至少95 %、优选至少97%—致性时才发生杂交,其中一致性区包含至少10个核苷酸。在一个实施方案中,序列在42°C孵育过夜后在严谨条件下杂交,接着进行严谨洗涤(0.2XSSC,65°C )。可以通过改变温度、pH、离子强度、二价阳离子浓度、洗涤体积和持续时间来改变洗涤的严谨程度。例如,可以通过在低于探针熔链温度的不同温度进行杂交来改变杂交的严谨度。探针的熔链温度可使用下式计算:
[0114]对于长度为14至70个核苷酸之间的寡核苷酸探针,可以使用下式计算以摄氏温度计量的熔链温度(Tm) =Tm = 81.5+16.6 (log [Na+])+0.41 (G+C 分数)_ (600/N),其中 N 为寡核苷酸的长度。
[0115]例如,可以在约IM Na+浓度的杂交缓冲液中以5°C的增量从68°C至42°C降低杂交温度。杂交后,可以在杂交温度下用2XSSC、0.5% SDS洗涤滤膜。50°C以上的这些条件认为是“中等严谨”条件,500C以下是“低严谨”条件。“中等严谨”条件的具体实例为在55°C进行上述杂交。“低严谨”杂交条件的具体实例为在45°C进行上述杂交。[0116]如果在含有甲酰胺的溶液中进行杂交,则可使用以下方程计算退火核酸链的熔链温度=Tm = 81.5+16.6 (log[Na+]) +0.41 (G+C 分数)-(0.63% 甲酰胺)-(600/N),其中 N 为探针长度。
[0117]例如,可以在42°C下在含有甲酰胺的缓冲液(如6XSSC)中进行杂交。在这种情况下,可以以5%的增量从50%至0%降低杂交缓冲液中的甲酰胺浓度,以鉴定与探针的同源性水平逐渐下降的克隆。杂交后,可以在50°C用6XSSC、0.5%SDS洗涤滤膜。当杂交液包含25%以上的甲酰胺时,认为杂交条件是“中等严谨”条件,当杂交液包含25%以下的甲酰胺时为“低严谨”条件。“中等严谨”杂交条件的具体实例为在30%甲酰胺中进行上述杂交。“低严谨”杂交条件的具体实例为在10%甲酰胺中进行上述杂交。当条件包括如45°C在6 X SSC中杂夺、其后在65°C在0.2XSSC、0.1% SDS中洗涤时,认为杂夺备件是“高严谨”。
[0118]本文使用的术语“受试者”、“患者”和“个体”可互换使用,指动物(如哺乳动物、鱼、两栖动物、爬行动物、鸟类和昆虫)。在一个具体的实施方案中,受试者为哺乳动物(如非人哺乳动物和人)。在另一实施方案中,受试者为宠物(如狗、猫、豚鼠、猴和禽类)、农场动物(如马、牛、猪、山羊和鸡)或实验室动物(如小鼠和大鼠)。在另一实施方案中,受试者为灵长类(如黑猩猩和人)。在另一实施方案中,受试者为人。
[0119]本文使用的术语“协同”指使用本文所述方法鉴定的化合物与其他治疗(如试剂)的组合,所述组合比该治疗的加和作用更有效。优选地,这些其他治疗已经用于或目前用于预防、治疗、控制或改善骨关节炎或其症状。治疗(如预防或治疗剂)组合的协同效应允许对患骨关节炎的受试者使用以较低剂量的一种或多种治疗和/或较低给药频率的所述治疗。使用较低剂量的治疗(如预防或治疗剂)和/或较低频率地施用所述治疗的能力降低了与对受试者施用所述物质相关的毒性,而不降低所述治疗预防、治疗、控制或改善骨关节炎的效力。此外,协同效应可引起治疗(如物质)在预防、治疗、控制或改善骨关节炎中效力的提高。最后,治疗(如预防或治疗剂)组合的协同效应可避免或降低与单独使用任一治疗相关的不良或不期望的副作用。
[0120]本文使用的“滑液”指每个关节周围的“滑液囊”中分泌的流体。滑液用于保护关节、润滑关节并为关节软骨提供营养。可根据本发明使用的滑液含有细胞,可以根据本文所述领域熟知的方法从所述细胞中分离RNA。
[0121]本文使用的术语“治疗剂”指可用于治疗、控制或改善骨关节炎或其一种或多种症状的任何化合物。在一种具体的实施方案中,术语“治疗剂”指提高或降低多核苷酸序列表达的化合物,所述多核苷酸序列如本文定义在来自轻度骨关节炎的细胞中相对于来自正常个体的软骨细胞差异表达。本发明的治疗剂还指提高或降低软骨细胞合成代谢活性的化合物。本发明提供这样的“治疗剂”,其在对患者施用后,I)预防骨关节炎的发病;2)降低、延缓或消除骨关节炎症状如疼痛、肿胀、虚弱和丧失患病关节的功能性能力;3)降低、延缓或消除软骨退化和/或增强软骨细胞代谢活性和细胞分裂速率;和/或4)将患者的一种或多种疾病指示性核酸的一种或多种表达谱恢复为更接近正常个体的表达谱。在某些实施方案中,术语“治疗剂”指本文所述筛选测定中鉴定的化合物。在其他实施方案中,术语“治疗剂”指本文所述筛选测定中所鉴定化合物以外的物质,其已知可用于或已经用于或目前正用于治疗、控制或改善骨关节炎或其一种或多种症状。
[0122]本文使用的术语“治疗有效量”指足以引起骨关节炎或其一种或多种症状的改善、预防骨关节炎发生、导致骨关节炎消退或者增强或改善另一治疗(如治疗剂)的疗效的治疗(如治疗剂)量。在一种具体的实施方案中,治疗有效量指降低关节痛或关节肿胀的治疗(如治疗剂)量。优选地,相对于对照如磷酸盐缓冲液(“PBS”),治疗(如治疗剂)的治疗有效量降低关节肿胀至少5 %,优选至少10 %、至少15 %、至少20 %、至少25 %、至少30 %、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%。
[0123]本文使用的术语“治疗”指由施用按照本发明方法鉴定的一种或多种化合物或按照本发明鉴定的一种或多种化合物与其他治疗的组合引起的骨关节炎或其一种或多种症状的发展、严重性和/或持续时间的降低或改善。[0124]在本发明上下文中,本文使用的术语“表达水平的上调”或“增加”指对应于所表达基因的序列,其中序列量的测量证明,与从正常个体或从通过骨关节炎分期确定与骨关节炎不同的已鉴定疾病状态的个体中分离的软骨或血中的同一基因相比,所述基因在从患骨关节炎或通过骨关节炎分期确定的骨关节炎已鉴定疾病状态的个体中分离的软骨或血中的表达水平增加。根据本发明,“表达水平的增加”为例如通过本发明方法杂交强度测量的至少 1%、2%、3%、4%、5%、6%、7%、8%、9%、10%或更高的表达增加,例如 20%,30%,40%, or50%、60%、70%、80%、90%或更高或者高于I倍,最高为2倍、3倍、4倍、5倍、10倍、50倍、100-倍或更高。例如,上调序列包括与分离自正常个体的软骨相比,在分离自特征为患轻度、中度、显著或重度OA的个体的软骨或血中表达水平增加的序列。上调序列还可包括与其他骨关节炎阶段相比,在分离自特征为患某个骨关节炎阶段的个体的软骨或血中表达水平增加的序列(如显著OA比重度0A)。
[0125]4.图表说明
【专利附图】
【附图说明】
[0126]图1描述了表4中所列基因所有可能的比例组合的分析结果,其中用于诊断轻度OA的ROC高于0.6。显示的是ROC面积、灵敏度(假设特异性设置为50%阈值)和特异性(假设灵敏度设置为50%阈值)的图形描述。其他细节描述于实施例8。
[0127]参考本说明书实施例部分之后包括的表1、表2、表3、表4、表5、表6、表7和表8以及图1可以更好地理解本发明的目的和特征。
[0128]表1为显示一个实施方案中的本发明基因、特别是基于其Locus Link ID标识基因的表格。
[0129]表2为显不申请号10/915,680所公开的生物标志物的具体实施方案的表格。
[0130]表3为显不一个实施方案中对应于表1标识的生物标志物的RNA产物以及每种RNA产物的核酸参考登录号和蛋白质参考登录号的表格。
[0131]表4为显示一个实施方案中本发明生物标志物的选择集的表格,所述生物标志物各自独立地指示轻度OA并可组合使用作为轻度OA的指示。表4通过基因ID (以前的LocusLink ID)标识每种生物标志物,并包括基因符号、备选基因符号和基因描述作为生物标志物的标识符。此外,还显示了实施例9中进一步描述的特定p值和倍数变化。
[0132]表5为显不一个实施方案中对应于表4生物标志物的RNA和蛋白质变体的代表性实例的表格。[0133]表6为显不一个实施方案中引物的选择集的表格,所述引物用于在选定的表4中列出的RNA种类上进行的定量实时RT-PCR。
[0134]表7为显示一个实施方案中对表4生物标志物的蛋白质产物具有特异性的商品抗体的表格。
[0135]表8提供T 一个实施方案中引物和TaqMan?探针代表性种类的表格,所述引物和TaqMan?探针用于测量表4列出的生物标志物的rna产物。
[0136]5.发明详述
【具体实施方式】
[0137]本发明的实施部分使用分子生物学、微生物学和重组DNA技术的常规技术,所述技术在本领域技术人员的能力之内。这些技术在文献中有完整的解释。参阅如Sambrook,Fritsch&Maniatis, 1989,((Molecular Cloning:A Laboratory Manual》, 第二版;〈〈Oligonucleotide Synthesis)) (MJ.Gait 编辑,1984):《Nucleic Acid Hybridization))(B.D.Harnes&SJ.Higgins 编辑,1984):《A Practical Guide tOMolecular Cloning))(B.Perbal, 1984):和《Methods in Enzymology》丛书(Academic Press, Inc.): ((ShortProtocols In Molecular Biology)), (Ausubel 等编辑,1995)。本文中上文和下文提到的所有专利、专利申请和公开均以其整体引入本文为参考。
[0138]本文公开的发明鉴定了生物标志物和生物标志物组合,其用于诊断轻度和/或用于区分轻度OA和非0A。为了使用这些生物标志物,本发明教导了这些生物标志物产物的鉴定,其中包括RNA产物和蛋白质产物。本发明还公开了与本发明生物标志物的RNA产物特异性和/或选择性杂交的寡核苷酸、cDNA、DNA、RNA、PCR产物、合成DNA、合成RNA及其片段或其他天然存在的修饰核苷酸的组合。本发明还公开了与本发明生物标志物的蛋白质产物特异性和/或选择性杂交的蛋白质、肽、抗体、配体及其片段,包括抗原结合片段。可以使用寡核苷酸进行本发明生物标志物和生物标志物组合的RNA产物的表达测量,所述寡核苷酸对本发明生物标志物的RNA产物具有特异性和/或选择性,以定量RNA产物的表达。在本发明的一个具体实施方案中,对RNA产物具有特异性和/或选择性的多核苷酸为探针或引物。在一个实施方案中,这些多核苷酸的形式为能够与已制造阵列杂交的核酸探针。在另一实施方案中,可以使用商品阵列测量RNA产物的表达,本发明教导了分析哪个基因组合。在另一实施方案中,使用如SYfiH? Green或TaqMtH?或分子信标技术,在比如定量实时RT PCR等技术中以探针和引物的形式使用对本发明生物标志物的RNA产物具有特异性和/或选择性的多核苷酸,其中所使用的多核苷酸以正向引物、反向引物、TaqMan标记探针或分子信标标记探针的形式使用。在一个具体的实施方案中,可以将测量本发明RNA产物的表达水平所产生的结果输入本发明的模型,所述模型用于鉴定生物标志物的组合,以确定模型定义的诊断。在一个优选的实施方案中,使用相同的方法产生用于产生数学模型的表达数据,所述模型用于诊断受试个体。
[0139]本发明还包括本文公开以及本领域技术人员已知的蛋白质或多肽用于测量本发明生物标志物的蛋白质产物的用途。接着可以使用本领域技术人员公知的技术(如Western印迹、免疫沉淀、蛋白质微阵列分析等技术)测量对应于本发明生物标志物的蛋白质产物的水平。本领域技术人员会理解,测量本发明生物标志物蛋白质产物的表达水平需要与对应于每种本发明生物标志物的一种或多种蛋白质产物特异性或选择性结合的蛋白质。接着可以将代表本发明生物标志物的蛋白质产物表达水平的数据输入模型,产生所述模型以鉴定组合,从而确定该模型定义的诊断。在一个优选的实施方案中,使用相同的方法产生用于产生数学模型的表达数据,所述模型用于诊断测试个体。
[0140]5.1用于本发明的样品
[0141]除非本文中另外指明,得自任何受试者的任何组织样品(如软骨、滑液或血样)或细胞样品(如软骨细胞或血细胞样品)均可以根据本发明方法使用。可以从中获得这些样品并根据本发明方法使用这些样品的受试者实例包括但不限于无症状受试者、表现或显示
1、2、3、4种或更多骨关节炎症状的受试者、临床诊断为患有骨关节炎的受试者、易患骨关节炎的受试者(如有骨关节炎家族史的受试者、有骨关节炎遗传易感性的受试者以及生活方式使其易感骨关节炎或提高患骨关节炎可能性的受试者)、怀疑患有骨关节炎的受试者、正接受骨关节炎治疗的受试者、患有骨关节炎和至少一种其它疾病的受试者(如具有2、3、4、5种或更多疾病的受试者)、非接受骨关节炎治疗的受试者、开业医生(如医师)确定为健康或无骨关节炎的受试者(即正常)、已治愈骨关节炎的受试者、正在控制其骨关节炎的受试者和未诊断为骨关节炎的受试者。在一个具体的实施方案中,可获得样品并使用的受试者患手、足、脊柱、膝、髋和/或腕骨关节炎。
[0142]在另一实施方案中,可获得样品并使用的受试者患轻度0A。在另一些实施方案中,可获得样品的受试者为测试个体,所述测试个体是否患有骨关节炎未知和/或该测试个体患何阶段的骨关节炎未知。
[0143]为了将患者按疾病状态分类,可以使用基于软骨的评分系统,其中使关节镜操作者的主观判断最小化。定义本文所述疾病状态的评分系统实例为引入本文作为参考的Marshall, 1996, The Journal of Rheumatology23:582-584 中的系统。根据该方法,基于特定表面上存在的最严重损伤对6个关节面(髌骨、股骨滑车、股骨内侧踝、胫骨内侧坪、股骨外侧踝和胫骨外侧坪)中的每一 个给予软骨分级。接着应用评分系统,其中每个关节面获得反映该面软骨严重性分级的骨关节炎严重性数值,如表9所述。
表9.关节软骨分级系貌__
[0144]分级关节软骨分数
0正常_J_
1表面完整-软化,水肿I
JI_ 表面破坏-部分厚度损伤(未延伸至骨)—I_
[0145]I Iff I完全厚度损伤-延伸至完整的骨I 3
^IV 骨质糜烂或骨质象牙化 4
[0146]例如,如果股骨内侧踝最严重的软骨损伤为为I级损伤,则给予I的分值。接着由6个关节面分数的总和产生患者的总分。基于总分将每名患者分入4个OA组中:“轻度”(早期)定义为Marshall分数1-6,“中度”定义为Marshall分数7_12,“显著”定义为Marshall分数13-18,“重度”定义为Marshall分数高于18。[0147]在某些实施方案中,得自受试者的样品为软骨样品(包括来自软骨的细胞样品)。在另一实施方案中,得自受试者的样品为滑液样品(包括来自滑液的细胞样品)。在另一实施方案中,得自受试者的样品为血样(包括来自血的细胞样品)。
[0148]5.1.1 软骨
[0149]在一个方面中,根据本领域已知并描述于下文的方法从生存的正常个体或死后14小时以内的软骨组织获得软骨样品。使用任何已知方法获得来自成人的正常关节软骨。在一个具体的实施方案中,软骨得自接受关节镜术或全膝置换术的个体,样品在液氮中保存待用。由于伦理考虑,通常不能从活供体中广泛采样真实的正常软骨。因此,优选地,在14小时的死后窗口中在停止对采样关节灌注后从死亡供体获得正常软骨样品,以使窗口过后观察到的RNA降解最小。在另一些实施方案中,“正常”组织在死后14小时内获得,例如少于或等于死后13、12、11、10、9、8、7、6、5、4、3、2或I小时。优选地,正常软骨在死后12小时以内获得。
[0150] 在另一方面中,软骨得自诊断为轻度骨关节炎的受试者。使用任何已知技术获得来自骨关节炎个体的人关节样品。优选地,将关节样品保存在液氮中待用。在一个具体实施方案中,分离至少0.05g软骨样品,以获得2 ii g总RNA提取物。在另一实施方案中,分离至少0.025g软骨样品,以获得IugS RNA提取物。可根据本发明使用的软骨样品为足以检测一种或多种本发明核酸序列或氨基酸序列的量。
[0151]在根据本发明方法使用前,任选地(但优选)将收集的软骨保存在低温如4°C下。在一些实施方案中,在第一时间根据本发明方法使用软骨样品的一部分,而将一个或多个剩余的样品部分保存一段时间以备后用。该段时间可以是I小时或更长、I天或更长、I周或更长、I个月或更长、I年或更长或不确定。就长期保存而言,可以使用本领域熟知的保存方法,例如在冷冻温度(如低于_60°C)保存。在一些实施方案中,作为保存软骨的补充或替代,将分离的核酸或蛋白质保存一段时间(如I小时或更长、I天或更长、I周或更长、I个月或更长、I年或更长或不确定)以备后用。
[0152]在本发明的一些实施方案中,使用本领域已知的技术分离软骨中存在的软骨细胞,并根据本发明方法使用。软骨细胞可得自患轻度0A、未患轻度OA的受试者或测试受试者。在用于本发明方法前,可以通过标准技术冷冻软骨细胞。
[0153]5.1.2 滑液
[0154]在一个方面中,使用本领域熟知的方法从受试者获得滑液样品。例如,可以进行关节穿刺。在关节穿刺中,使用无菌针从关节中移出滑液。可以使用关节穿刺从膝、肘、腕、指、髋、脊柱或任何其他关节收集滑液。在一个具体的实施方案中,滑液收集自患骨关节炎或怀疑患骨关节炎的关节。滑液可得自患轻度0A、未患OA的受试者或得自测试受试者。
[0155]可根据本发明使用的滑液样品为足以检测一种或多种本发明核酸序列或氨基酸序列的量。在一个具体实施方案中,可根据本发明使用的滑液样品的量范围从0.1ml至20ml、0.1ml 至 15m1、0.1ml 至 IOml、0.1ml 至 5ml、0.1 至 2ml、0.5ml 至 20ml、0.5ml 至 15ml、0.5ml至10ml、0.5ml至5ml或0.5ml至2ml。在另一实施方案中,根据本发明使用的滑液样品为0.1ml或更多、0.5ml或更多、Iml或更多、2ml或更多、3ml或更多、4ml或更多、5ml或更多、6ml或更多、7ml或更多、8ml或更多、9ml或更多、IOml或更多、Ilml或更多、12ml或更多、13ml或更多、14ml或更多、15ml或更多、16ml或更多、17ml或更多、18ml或更多、19ml或更多、或20ml或更多。[0156]在根据本发明方法使用前,任选地(但优选)将收集的滑液保存在低温如4°C下。在一些实施方案中,在第一时间根据本发明方法使用滑液样品的一部分,而将一个或多个剩余的样品部分保存一段时间以备后用。该段时间可以是I小时或更长、I天或更长、I周或更长、I个月或更长、I年或更长或不确定。就长期保存而言,可以使用本领域熟知的保存方法,例如在冷冻温度(如低于_60°C)保存。在一些实施方案中,作为保存滑液的补充或替代,将分离的核酸或蛋白质保存一段时间(如I小时或更长、I天或更长、I周或更长、I个月或更长、I年或更长或不确定)以备后用。
[0157]在本发明的一些实施方案中,使用本领域已知的方法分离滑液中存在的细胞,并根据本发明方法使用。通常在滑液中可见以下细胞:淋巴细胞(B和T淋巴细胞)、单核细胞、嗜中性粒细胞、滑膜细胞和巨噬细胞。在来自病理状态(如骨关节炎)的患者的滑液中还可见以下细胞:软骨细胞、成骨细胞和破骨细胞。可以根据本发明的方法分离并使用这些细胞。在一个具体实施方案中,从滑液样品中分离淋巴细胞(B和T淋巴细胞)并根据本发明方法使用。在另一实施方案中,从滑液样品中分离单核细胞或嗜中性粒细胞并根据本发明方法使用。在用于本发明方法前,可以通过标准技术冷冻分离自滑液的细胞。
[0158]5.1.3 血
[0159]在本发明的一个方面中,根据本领域熟知的方法从受试者中获得血样。血样可得自患轻度0A、未患OA的受试者或得自测试个体,所述测试个体是否患有骨关节炎未知和/或该测试个体患何阶段的骨关节炎未知。在一些实施方案中,对受试者皮肤进行简单针刺而收集血滴。在这些实施方案中,由针刺收集的血滴即为全部所需。可以使用本领域技术人员已知的技术(特别是已知的采血方法)从受试者的任何身体部位(如指、手、腕、臂、腿、足、踝、胃和颈)取血。在一个具体的实施方案中,从受试者获得静脉血并根据本发明方法使用。在另一实施方案中,获得动脉血并根据本发明方法使用。静脉血的组成根据其服务的身体部分的代谢需求而变化。相反,动脉血的组成在整个身体中恒定。常规血测试一般使用静脉血。
[0160]静脉血可得自贵要静脉、头静脉或中脉。动脉血可得自桡动脉、肱动脉或股动脉。可以使用真空管、注射器或蝶形针取血。通常清洁针刺部位、在针刺部位上方约3-4英寸处应用止血带、将针以约15-45度角插入,并且如果使用真空管,则在针穿透静脉壁后立即将管推入持针器。完成采血后,移去针并保持针刺部位的压力。通常在收集血的管或瓶中有肝素或其他类型的抗凝血剂,以防止血凝固。收集动脉血时,可以在收集前施用麻醉剂。
[0161]采血量将取决于采血部位、本发明方法需要的量和受试者的舒适度而变化。然而,本发明一个实施方案的优点是实施本发明方法所需要的血量可以很小,使得不需要通过更具侵入性的方法获得样品。例如,在一些实施方案中,全部所需仅为一滴血。这滴血例如可以从简单针刺获得。在一些实施方案中,收集足以检测表1列出的1、2、3、4、5、10或更多种基因表达的任意血量。这样,在一些实施方案中,采血量是Iul或更少、0.5iU或更少、0.1ul或更少或0.01 ill或更少。然而,本发明不仅限于这些实施方案。在一些实施方案中有更多的血可供使用,并且在一些实施方案中,可以使用更多的血来实施本发明的方法。这样,在多个具体的实施方案中,从受试者收集0.0OlmU0.005ml,0.01mU0.05ml,0.1ml、0.15ml、0.2ml、0.25ml、0.5ml、0.75ml、lml、l.5ml、2ml、3ml、4ml、5ml、10ml、15ml 或更多血。在另一实施方案中,从受试者收集 0.001ml-15ml、0.01ml_10ml、0.lml_10ml、0.lml_5ml、lml_5ml 血。
[0162]在本发明的一些实施方案中,将血保存在K3/EDTA管中。在另一实施方案中,可以使用含有例如美国专利N0.6,617,170 (引入本文为参考)公开的稳定剂的血保存管。在另一实施方案中,可使用Qiagen/BD公司PreAnalytiX提供的PAXgeneTM血RNA系统收集血。在另一实施方案中,可以使用Applied Biosystems提供的TempusTM血RNA收集管。TempusTM收集管提供用于收集全血的含RNA稳定剂的密闭真空塑料管。
[0163]在根据本发明方法使用前,任选地(但优选)将收集的血保存在低温如4°C下。在一些实施方案中,在第一时间根据本发明方法使用血样品的一部分,而将一个或多个剩余的样品部分保存一段时间以备后用。该段时间可以是I小时或更长、I天或更长、I周或更长、I个月或更长、I年或更长或不确定。就长期保存而言,可以使用本领域熟知的保存方法,例如在冷冻温度(如低于_60°C)保存。在一些实施方案中,作为保存血的补充或替代,将分离的核酸或蛋白质保存一段时间以备后用。这些分子标志物的保存可以为I小时或更长、I天或更长、I周或更长、I个月或更长、I年或更长或不确定。
[0164]在一个方面中,根据本领域熟知的采血方法从正常个体或者从诊断为患骨关节炎或怀疑患骨关节炎的个体取全血。全血包括可直接使用的血,并包括已经根据本领域熟知的方法(例如优选在300-800 X g温和离心5-10分钟)除去血清或血浆并且已经从剩余血样中分离了 RNA或mRNA的血。在一个具体的实施方案中,将得自受试者的全血(即未分级血)与裂解缓冲液(如裂解缓冲液(IL):0.6g EDTA ;1.0g KHCO2,8.2g NH4Cl,用NaOH调整至到pH7.4)混合,离心样品并保留细胞沉淀,根据本领域熟知的方法提取RNA或mRNA (“裂解血”)(参阅如Samtoook等)。优选使用全血,因为它避免了昂贵耗时的分离血中细胞类型的步骤(Kimoto, 1998,Mol.Gen.Genet258:233-239 ;Chelly J 等,1989,Proc.Nat.Acad.Sc1.USA86:2617-2621 ;Chelly J 等,1988,Nature333:858-860)。
[0165]在本发明的一些实施方案中,将收集自受试者的全血进行分级(即分离成组分)。在本发明的一个具体实施方案中,使用本领域已知技术从收集自受试者的全血分离血细胞。例如,可以对收集自受试者的血进行Ficoll-Hypaque(Pharmacia)梯度离心。这种离心将红细胞(血红细胞)与各种类型的有核细胞和血浆分离开。具体地,Ficoll-Hypaque梯度离心可用于分离外周血白细胞(PBL),它们可根据本发明方法使用。
[0166]用于示例而非限制性地,可以如下获得巨噬细胞。通过用注射器取血其后进行Ficoll-Hypaque梯度离心从受试者的外周血分离单个核细胞。用受试者自身的血清或用AB+人血清预包被组织培养皿并在37°C孵育I小时。吸走未贴壁细胞。向培养皿中存留的贴壁细胞中加入含ImM EDTA的冷(4°C )磷酸盐缓冲液,将培养皿置于室温15分钟。收获细胞,用RPMI缓冲液洗涤,并重悬于RPMI缓冲液。可以通过在37°C下与巨噬细胞集落刺激因子(M-CSF) —起孵育来获得数量更多的巨噬细胞。可以通过将亲合化合物缀合到这些分子来标记针对巨噬细胞特异性表面标志物(如Mac-1)的抗体,以便于检测和分离巨噬细胞。可以使用的亲合化合物包括但不限于生物素、光生物素、荧光素异硫氰酸酯(FITC)或藻红蛋白(PE)或本领域已知的其它化合物。然后使用本领域已知技术将保留标记抗体的细胞与不结合这种抗体的细胞分离开,例如但不仅限于各种细胞分选法、亲合层析和淘选(panning)。[0167]可以用荧光激活细胞分选仪(FACS)分选血细胞。荧光激活细胞分选(FACS)是已知的基于颗粒物的荧光特性分离颗粒物包括细胞的方法。参阅如Kamarch,1987,MethodsEnzymol 151:150_165。单个颗粒上的荧光部分的激光激发产生小电荷,这允许从混合物中电磁分离正电和负电颗粒。用荧光物质如FITC或藻红蛋白标记抗体或配体,所述抗体或配体用于检测特定血细胞的细胞表面上存在的血细胞抗原决定簇。将细胞与荧光标记的抗体或配体充分孵育一段时间,使得标记抗体或配体与细胞结合。通过细胞分选仪处理细胞,使目的细胞与其它细胞分离开。可将FACS分选的颗粒直 接存放在微孔板的单个孔中以便于分离。
[0168]在本发明的一些实施方案中,也可以使用磁珠分离血细胞。例如,可以用磁激活细胞分选(MACS)技术分选血细胞,这是一种基于颗粒结合磁珠(0.5-100m直径)的能力分离颗粒的方法。可以对磁性微球进行多种有用的修饰,包括共价添加特异性识别细胞-固相表面分子或半抗原的抗体。然后施加磁场,以物理操作选定的磁珠。在一个具体实施方案中,针对血细胞表面标志物的抗体与磁珠偶联。然后将磁珠与血细胞培养物混合以使之结合。再将细胞通过磁场以分离具有目的血细胞表面标志物的细胞。然后可以分离这些细胞。
[0169]在一些实施方案中,可以用抗体包被培养皿表面,并用称为淘选的方法分离血细胞。可以使用对特定血细胞具有特异性的抗体包被不同的皿。首先将细胞加入包被目的血细胞特异性抗体的培养皿中。彻底漂洗后,保持结合在皿上的细胞将是表达目的血细胞标志物的细胞。细胞表面抗原决定簇或标志物的实例包括但不限于T淋巴细胞和自然杀伤细胞的⑶2、T淋巴细胞的⑶3、白细胞的⑶11a、T淋巴细胞的⑶28、B淋巴细胞的⑶19、B淋巴细胞的⑶20、B淋巴细胞的⑶21、B淋巴细胞的⑶22、B淋巴细胞的CD23、白细胞的⑶29、单核细胞的⑶14、血小板的⑶41、血小板的⑶61、粒细胞的⑶66、粒细胞的⑶67和单核细胞与巨噬细胞的⑶68。
[0170]全血可以分离成如白细胞、血小板、红细胞等细胞类型,这些细胞类型可根据本发明方法使用。可以使用标准技术将白细胞进一步分离为粒细胞和无粒细胞,这些细胞可根据本发明方法使用。可以使用标准技术将粒细胞分离为如中性粒细胞、嗜酸性粒细胞和嗜碱性粒细胞的细胞类型,这些细胞可根据本发明方法使用。可以使用标准技术将无粒细胞分离为淋巴细胞(如T淋巴细胞和B淋巴细胞)和单核细胞,这些细胞可根据本发明方法使用。可以使用标准技术将T淋巴细胞和B淋巴细胞分离开,并将辅助性T细胞和细胞毒性T细胞分离开,这些细胞可根据本发明方法使用。在用于本发明方法之前,可以使用标准技术冷冻分离的血细胞(如白细胞)。
[0171]可根据本发明使用的血样应为足以检测本发明的一种或多种核酸或氨基酸序列的量。在一个具体实施方案中,可根据本发明使用的血样量为lul-lOOml,优选10 u l-50ml,更优选 10 u l-25ml,最优选 10 u 1-1ml。
[0172]5.1.4RNA 的制各
[0173]在本发明的一个方面中,从个体分离RNA以测量本发明生物标志物的RNA产物。RNA分离自本文所述的软骨样品。样品可来自单个患者,或者可以是来自多个患者的混合。
[0174]在另一方面中,直接从本文所述患骨关节炎的人的滑液分离RNA。样品可来自单个患者,或者可以是来自多个患者的混合。
[0175]在另一方面中,直接从本文所述患骨关节炎的人的血样分离RNA。样品可来自单个患者,或者可以是来自多个患者的混合。
[0176]根据本领域熟知的方法从软骨样品中提取总RNA。在一个实施方案中,根据以下方法在软骨组织中纯化RNA。在从个体或受试者中取出目的组织后,将组织在液氮中速冻以防止RNA降解。加入一定体积的组织胍溶液后,在tissuemizer中以2或3次10秒的脉冲研磨组织样品。为制备组织胍溶液(IL),将590.Sg异硫氰酸胍溶于约400ml DEPC处理的水中。加入 25ml2M Tris-Cl,pH7.5(0.05M 终浓度)和 20ml Na2EDTA (0.01M 终浓度),将溶液搅拌过夜,体积调整为950ml并加入50ml2-ME。
[0177]将匀浆组织样品在12°C以12,OOOXg离心10分钟。在0.1倍体积20%十二烷基肌氨酸钠(Sarcosyl)存在下以65°C孵育所得上清液2分钟,在9ml5.7M CsCl (0.1g CsCl/ml)溶液上分层,22°C以113,OOOXg离心过夜进行分离。仔细地移除上清液后,将管倒置控干。将管底(含有RNA沉淀)置于50ml塑料管中并在3ml组织重悬缓冲液(5mM EDTA,0.5% (体积/体积)十二烷基肌氨酸钠、5% (体积/体积)2-ME)存在下以4°C孵育过夜(或更久),以使RNA沉淀完全重悬。其后连续用25: 24: I的酚/氯仿/异戊醇和之后24: I的氯仿/异戊醇抽提所得RNA溶液,加入3M乙酸钠、pH5.2和2.5倍体积的100 %乙醇进行沉淀,重悬于 DEPC 水(Chirgwin 等,1979, Biochemistry, 18:5294)。
[0178]或者根据以下的一步式方案从软骨组织中提取RNA。通过以每IOOmg组织Iml变性液(4M硫代硫酸胍、25mM柠檬酸钠、pH7.0,0.1M2_ME、0.5% (重量/体积)N-十二烷基肌氨酸)在玻璃特氟龙匀浆器中进行匀浆来制备目的组织。将匀浆转移至5ml聚丙烯管之后,连续加入0.lml2M乙酸钠、pH4的Iml水饱和酚和0.2ml49:1的氯仿/异戊醇。在加入每种组分后均混合样品,并在加入所有组分后在0-4°C孵育15分钟。4°C以10,OOOXg离心20分钟分离样品,加入Iml 100%异丙醇进行沉淀,在-20°C孵育30分钟并在4°C以10,OOOXg离心10分钟进行沉淀。将得到的RNA沉淀溶于0.3ml变性液,转移至微量离心管,在_20°C加入0.3mll00%异丙醇沉淀30分钟并在4°C以10,OOOXg离心10分钟。在70%乙醇中洗涤沉淀、干燥并重悬于100-200 u IDEPC处理的水或DEPC处理的0.5% SDS (Chomczynski和 Sacchi,1987, Anal.Biochem.,162:156)。
[0179]优选地,在液氮中将软骨样品磨成细粉并使用TRlzul;试剂(GIBC0/BRL)提取总 RNA。
[0180]或者使用以下方案从血中分离RNA。按3份裂解缓冲液比1份血的比例向血样中加入裂解缓冲液(裂解缓冲液(IL):0.6g EDTA;1.0g KHCO2,8.2g NH4C1,用NaOH调整至PH7.4)。将样品混合并在冰上放置5-10分钟至透明。在4°C以1000rpm将裂解样品离心10分钟,吸出上清液。将沉淀重悬于5mL裂解缓冲液,并在4°C以1000rpm再离心10分钟。按每IOml起始血样约6ml TRIZOI? (GIBC0/BRL)的比例用TRIzol?匀浆沉淀的细胞并充分振荡。样品在室温放置5分钟。用1.2ml氯仿/lml TRIZOIC珍提取RNA。样品在4°C以12,OOOXg离心5分钟并收集上层。按0.5ml/lml TRIzoJ?的比例向上层中加入异丙醇。样品在_20°C放置过夜或在_20°C放置I小时。根据熟知的方法沉淀RNA,晾干RNA沉淀,并将沉淀重悬于DEPC处理的ddH20中。也可以将RNA样品保存于75%乙醇中,这样的样品在室温下稳定以供运输。
[0181]或者使用上文的TRIzol::丨H式剂(GIBC0/BRL)从滑液中分离RNA。[0182]可以通过260/280nm吸光度和琼脂糖凝胶电泳随后在紫外光下检查来评价RNA的
纯度和完整性。[0183]5.2本发明的牛物标志物
[0184]在一个实施方案中,本发明提供生物标志物和生物标志物组合,其中所述生物标志物产物的表达水平的量值可指示轻度骨关节炎的存在。在另一实施方案中,本发明提供了生物标志物和生物标志物组合,其中测量所述生物标志物产物的表达水平可用于诊断个体患有轻度OA还是未患0A。
[0185]表1提供本发明生物标志物的基因名称和相关locus link ID的列表,其中单独或组合测量所述生物标志物的表达水平可用于诊断个体为患有轻度骨关节炎,或确定个体是否患骨关节炎。本领域技术人员会理解,locus link ID可用于确定对应于本发明生物标志物的所有RNA转录物和所有蛋白质的序列。
[0186]表2提供了申请号10/915,680中公开的生物标志物,所述生物标志物可以如本文的教导与表1公开的一种或多种生物标志物组合使用,以诊断轻度OA或区分轻度OA和非OA。
[0187]表3具体显示了表1列出的生物标志物RNA产物的相应参考登录号以及生物标志物蛋白质产物的相应参考登录号。因此本发明包括出于任一上述目的,使用本领域技术人员公知和本文概述的方法测量这些生物标志物和生物标志物组合的表达的用途。
[0188]表4提供了对应于本发明生物标志物选集的基因名和相关locuslink ID(基因ID),其中单独或组合测量所述生物标志物的表达水平可用于诊断个体患有轻度骨关节炎还是未患骨关节炎。本领域技术人员会理解,locus link ID可用于确定对应于本发明生物标志物的所有RNA转录物和所有蛋白质产物的序列。
[0189]表5具体公开了表1列出的生物标志物RNA产物的相应参考登录号以及生物标志物蛋白质产物的相应参考登录号。因此本发明包括出于任一上述目的,使用本领域技术人员公知和本文概述的方法测量这些生物标志物和生物标志物组合的表达的用途。
[0190]5.3牛物标志物纟目合
[0191]生物标志物组合
[0192]在一个实施方案中,本发明生物标志物的组合包括表1列出的生物标志物中多至
2、3、4、5、6、7、8、10、20、30、40、50、100种的任何数目或全部生物标志物的任何组合。在另一实施方案中,本发明生物标志物的组合包括表2列出的生物标志物中任一种或多至1、2、3、4、5、6、7、8、10、20、30、40、50、100种的任何数目或全部生物标志物与表1列出的生物标志物中任一种或多至1、2、3、4、5、6、7、8、10、20、30、40、50、100种的任何数目或全部生物标志物的组合,其产物表达的测量可用于诊断个体患有轻度骨关节炎还是未患骨关节炎。在另一实施方案中,本发明生物标志物的组合包括表3列出的RNA和/或蛋白质产物中多至2、
3、4、5、6、7、8、10、20、30、40、50、100种的任何数目或全部的任何组合。在另一实施方案中,本发明生物标志物的组合包括表2列出的生物标志物中任一种或多至1、2、3、4、5、6、7、8、10、20、30、40、50、100种的任何数目或全部与表3列出的RNA和/或蛋白质产物中多至1、
2、3、4、5、6、7、8、10、20、30、40、50、100种的任何数目或全部的任何组合。其产物表达的测量可用于诊断个体患有轻度骨关节炎还是未患骨关节炎。在一个实施方案中,本发明生物标志物的组合包括表4列出的生物标志物中多至2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31种的任何数目或全部的任何组合。在另一实施方案中,本发明生物标志物的组合包括表2列出的生物标志物中任一种或多至1、2、3、4、5、6、7、8、10、20、30、40、50、100种的任何数目或全部与表4列出的生物标志物中任一种或任何数目或全部的任何组合。
[0193]例如,n个基因的亚组m的可能组合的数目描述于Feller, Intro to ProbabilityTheory,第三版,第I卷,1968, J.Wiley编辑,使用以下通式:
[0194]m ! / (n) ! (m_n) !
[0195]在一个实施方案中,当n为2,m为19时,则有:
[0196]19 ! = 19X18X17X16X15X14X13X12X11X10X9X8X7X6X5X4X3X2Xl
[0197]2! (19-2) ! (2X I) (19X 18X 17X 16X 15X 14X 13X 12X 11 X 10X9X8X7X6X5X4X3X2X1) = 1.2161017 = 171
[0198]7.1IIOm
[0199]种独特的双基因组合。测定这些双基因组合中每种基因的表达均可以独立地用于确定患者是否有骨关节炎。在m为19、n为3的另一实施方案中,有19 ! /3! (10-3) !种独特的三基因组合。这些独特的三基因组合中每一种均可独立地用作确定患者是否患有骨关节炎的模型。
[0200]5.4特别有用的生物标志物组合
[0201]尽管表1和表4中列出的生物标志物的所有组合均可用于诊断轻度0A,来自表2的选定生物标志物与来自表1和/或表4的至少一种或多种生物标志物的生物标志物组合也是如此,本发明还提供了选择和评估在诊断轻度OA中特别有用的生物标志物组合的方法。
[0202]为了鉴定有用的生物标志物组合,使用本发明的数学模型产生一种或多种分类器,每种分类器使用代表特定生物标志物组合中每种生物标志物的数据将用于输入模型的训练群中患轻度骨关节炎的个体(第一种表型亚组)与未患骨关节炎的个体(第二个表型亚组)分开。
[0203]接着可以如5.9节概述的那样通过测定分类器正确判断5.5节中所述训练群中每一个体的能力对产生的分类器进行评估或评分。还通过测定分类器正确判断“评分群”中一个或多个个体的能力对产生的分类器进行评估或评分。评分群与下文5.5节中所述训练群相似,但评分群由未用于产生分类器的一个或多个个体组成。这样,评分群由已诊断为患轻度骨关节炎的个体(第一种表型亚组)和未患骨关节炎的个体(第二个表型亚组)组成。在一个实施方案中,除了未用于训练群的一个或多个成员以外,评分群还包括训练群的成员。在一些实施方案中,训练群成员中5 %或更少、10 %或更少、20 %或更少、30 %或更少、50 %或更少或90 %或更少与评分群共用。
[0204]本领域技术人员会理解,这使得人们可以预测分类器正确表征表型特征未知的个体的能力。
[0205]输入数学模型的数据可以是代表受评估的生物标志物组合中每种生物标志物产物表达水平的任何数据。在本发明的一个实施方案中,评估了表1中生物标志物的每种可能的组合。在本发明的另一实施方案中,评估了表1中最高为2、3、4、5、10、20、30、等种中任一种的每种可能的组合。在本发明的另一实施方案中,基于个体P值对表1中的生物标志物进行分级,其中P值为每种生物标志物区分患轻度OA成员和未患OA成员的能力的指示,接着评估前40、30、20或10种分级的生物标志物。在本发明的另一实施方案中,评估了表1和表2中可见的生物标志物的每种可能的组合,并选择包括至少一种表1列出的生物标志物的生物标志物组合。在本发明的另一实施方案中,评估了表1和表2中可见的2、3、4、5、10、20、30、等种生物标志物的每种可能的组合,并选择其中包括至少一种表1列出的生物标志物的组合。在本发明的另一实施方案中,基于个体P值对表1和表2中的生物标志物进行分级,其中P值为每种生物标志物区分患轻度OA成员和未患OA成员的能力的指示,接着评估了前40、30、20或10种分级的生物标志物,并选择其中包括至少一种表1列出的生物标志物的组合。在本发明的另一实施方案中,评估了表4中生物标志物的每种可能的组合。在本发明的另一实施方案中,评估了表4中最高为2、3、4、5、10、20、30、等种中任一种的每种可能的组合。在本发明的另一实施方案中,基于个体P值对表4中的生物标志物进行分级,其中P值为每种生物标志物区分患轻度OA成员和未患OA成员的能力的指示,接着评估前40、30、20或10种分级的生物标志物。在本发明的另一实施方案中,评估了表4和表2中可见的生物标志物的每种可能的组合,并选择包括至少一种表4列出的生物标志物的生物标志物组合。在本发明的另一实施方案中,评估了表4和表2中可见的2、3、4、5、10、20、30、等种生物标志物的每种可能的组合,并选择其中包括至少一种表4列出的生物标志物的组合。在本发明的另一实施方案中,基于个体P值对表4和表2中的生物标志物进行分级,其中P值为每种生物标志物区分患轻度OA成员和未患OA成员的能力的指示,接着评估了前40、30、20或10种分级的生物标志物,并选择其中包括至少一种表4列出的生物标志物的组合。在本发明的一个实施方案中,使用的数学模型选自以下:回归模型、逻辑回归模型、神经网络、聚类模型、主成分分析、最近相邻分类器分析、线性判别分析、二次判别分析、支持向量机、决策树、遗传算法、使用bagging的分类器优化、使用boosting的分类器优化、使用随机子空间法的分类器优化、投影寻踪和加权投票。
[0206]得到的分类器可用于诊断未知或测试个体,以确定所述测试个体是否患轻度0A。在一个实施方案中,数学模型(如逻辑回归)产生的一个或多个分类器得到的诊断为两种结果(患或未患轻度0A)之一。在本发明的另一实施方案中,答案可以为不可确定的答案。需要指出的是,每种分类器均使用生物标志物的组合,并且使用代表每种生物标志物表达水平的数据产生该分类器。因此,例如当使用的数学模型为逻辑回归时,得到的分类器使用代表组合的10种基因中每一种的表达水平的含权重因子数据。在一个实施方案中,分类器本身可如上文所述用于诊断。然而在另一实施方案中,鉴定的组合(如所述10种基因)可以独立于鉴定所述基因的分类器使用。例如,可以监测所述10种基因产生的图谱以评估测试个体,其中将测试个体的图谱与来自患轻度OA的个体的10基因图谱以及未患OA的个体中的10基因图谱进行比较。
[0207]5.5输入数学模型以鉴定诊断轻度骨关节炎的生物标志物组合的数据
[0208]例如,为了鉴定用于诊断个体患轻度骨关节炎还是未患骨关节炎的生物标志物,使用反映表1、表2和/或表4生物标志物的一种或多种mRNA产物表达水平的数据,所述数据来自患轻度骨关节炎的个体群和未患骨关节炎的另一个体群(“训练群”)。为了将训练群划分进规定的表型亚组这一目的,可以使用任何OA诊断方法。在优选的实施方案中使用本文所述的Marshall评分法。
[0209]在另一实施方案中,为了鉴定用于诊断个体患轻度骨关节炎还是未患骨关节炎的生物标志物组合,使用反映如表3指出的表1中生物标志物的一种或多种mRNA产物表达水平的数据,所述数据来自训练群中的个体。在另一实施方案中,为了鉴定用于诊断个体患轻度骨关节炎还是未患骨关节炎的生物标志物组合,使用反映如表5指出的表4中生物标志物的一种或多种mRNA产物表达水平的数据,所述数据来自训练群中的个体。
[0210]在另一实施方案中,使用反映表1、表2和/或表4中生物标志物的一种或多种蛋白质产物表达水平的数据,所述数据来自训练群中的个体。表1和表4中生物标志物的蛋白质产物的种类分别在表3和表5中指出。
[0211]5.6训练群
[0212]在一些实施方案中,参照或训练群包括10-30个之间的受试者。在另一实施方案中,训练群含有30-50个之间的受试者。在另一些实施方案中,参照群包括2个或更多个群,其中每个群含有50-100个之间、100-500个、500-1000个之间或超过1000个受试者。
[0213]例如,为了鉴定用于诊断个体患轻度骨关节炎还是未患骨关节炎的生物标志物,使用反映表1 (如表3所不)和/或表4 (如表5所不)中生物标志物的一种或多种mRNA产物表达水平的数据,所示数据来自由第一种表型亚组(患轻度骨关节炎的个体)和第二个表型亚组(未患骨关节炎的个体)组成的训练群。在一些实施方案中,还使用反映表2中生物标志物的一种或多种mRNA产物表达水平的数据。在一个实施方案中,训练群的每个表型亚组中其他表型性状(包括年龄、性别、体重指标、同病状态、医药治疗等)的分布相同或相似。例如,第一和第二个表型亚组中个体年龄的分布相同或相似。在一个优选的实施方案中,除了患或未患OA以外,训练集中使用的两个群的表型特征相似。
[0214]在另一实施方案中,为 了鉴定用于诊断个体患轻度骨关节炎还是未患骨关节炎的生物标志物组合,使用反映表1 (包括表3所示)和/或表4 (包括表5所示)中生物标志物(任选地与表2中一种或多种多至1、2、3、4、5、6、7、8、9、10、20、30、40或全部生物标志物一起)的一种或多种mRNA产物表达水平的数据。
[0215]在另一实施方案中,为了鉴定用于诊断个体患轻度骨关节炎还是未患骨关节炎的生物标志物,使用反映表1 (包括表3所示)和/或表4 (包括表5所示)中任何数目或全部生物标志物的任何数目或全部mRNA产物表达水平的数据,所述mRNA产物在得自患轻度骨关节炎个体的群、和未患骨关节炎个体的第二群的血中表达。
[0216]5.7回归樽型
[0217]在一些实施方案中,将待测试生物标志物每种组合的表达数据用于回归模型,优选逻辑回归模型。这些回归模型会为测试的每种可能的生物标志物组合确定方程,每个方程提供与反映模型展示的每种个体生物标志物表达水平数据相乘的系数。
[0218]一般而言,目标多重回归方程可以写作:
[0219]Y= a + ^1+ 2?+...+ ^ A5+ £
[0220]其中从属变量Y为存在(Y为正数时)或不存在(Y为负数时)第一种表型性状(如患轻度骨关节炎)。该模型说明从属变量Y依赖于k个解释变量(代表来自训练群中第一和第二表型亚组受试者的k个选定基因在目的组织中的基因产物水平的测定值),加上涉及多种不明确的忽略因素的误差项。在上述模型中,参数^表示保持其它解释变量为常数的条件下,第一解释变量X1对从属变量Y的影响。相似地,参数@2表示保持其它解释变量为常数的条件下,解释变量X2对Y的影响
[0221]逻辑回归模型是线性回归的非线性转换。逻辑回归模型被称为“对数单位” (1git)模型,可以表达为:
[0222]In [p/ (l~p) ] = ct + ^ ^1+ 2\+''" + ^ A+ e 或
[0223][p/(l - p)] = exp a exp躺 expAJfj x …x expAJr* ?tp*
[0224]其中,
[0225]Ln 为自然对数 logexp,其中 exp = 2.71828...,
[0226]p为事件Y发生的概率,p (Y = I),
[0227]p/(l-p)为“比值比”(odds ratio),
[0228]ln[p/(l-p)]是比值比的对数,或“对数单位”,并且
[0229]模型的所有其它分量与上述的一般回归方程相同。本领域技术人员会理解,a和£项可以合并(fold)为同一常数。事实上,在一个优选的实施方案中,使用单个项代表a和e。“逻辑”分布是S形分布函数。对数单位分布将估计概率(P)限制在0和I之间。
[0230]在本发明的一些实施方案中,逻辑回归模型用最大可能性估计(MLE)拟合。换言之,系数(如a,@l,@2,...)由最大可能性确定。可能性是条件概率(如P(Y|X),给定X时Y的概率)。可能性函数(L)衡量观察到相同数据集中发生的从属变量值(Yl,Y2,...,Yn)特定集的概率。它写作从属变量乘积的概率:
[0231]L = Prob(YfY2=I==^Yn)
[0232]可能性函数越大,在样品中观察到Ys的概率越高。MLE涉及发现使可能性函数(LL< 0)的对数尽可能大或者可能性函数的对数的-2倍(-2LL)尽可能小的这些系数(a,3 1,0 2,...)。在MLE中,进行参数a,(61,0 2,...的一些初始估计。然后计算给定这些参数估计时的数据可能性。改善参数估计,重新计算数据可能性。重复这一过程,直至参数估计不再有大改变(例如概率的改变小于0.01或0.001)。逻辑回归和拟合逻辑回归模型的实例可见于整体引入本文的 Hastie, The Elements of Statistical Learning, Springer,New York,2001,pp.95-100。
[0233]5.8神经网络
[0234]在另一实施方案中,测定的每种本发明生物标志物的表达可用于训练神经网络。神经网络是两阶段回归或分类模型。神经网络具有分层结构,其中包括输入单元层(和偏置),它经权重层与输出单元层连接。就回归而言,输出单元层通常仅包括一个输出单元。然而,神经网络可以无缝式处理多重定量应答。这样,神经网络可用于鉴定区分两个以上群体的生物标志物。在一个具体实施例中,可以用表1 (包括表3)所示生物标志物产物的表达数据训练神经网络,以与未患骨关节炎的个体相比而鉴定轻度骨关节炎特异性生物标志物组合。结果,经训练的神经网络可用于直接鉴定生物标志物组合,所述组合用于诊断轻度骨关节炎。在一些实施方案中,使用含有十个神经元的单隐藏层(十个隐藏单元)的后向传播神经网络(例如见 Abdi, 1994,“A neural network primer”,J.Biol System.2, 247-283),它们可见于 EasyNN_Plus4.0g 版软件包(Neural Planner Software Inc.)。
[0235]神经网络描述于整体引入本文的Duda等,2001, ((Pattern Classification)),第二版,John ffiley&Sons, New York ;和 Hastie 等,2001, The ElementsOf StatisticalLearning,Springer-Verlag, New York。
[0236]5.9其他数学模型[0237]上述模式分类和统计技术仅为可用于构建轻度OA分类模型的模型类型的实例,例如整体引入本文为参考的Duda和Hart,《Pattern Classification and SceneAnalysis)), 1973, John ffiley&Sons, Inc., New York 中 211-256 页描述的聚类分析、主成分分析(参阅引入本文为参考的Jolliffe, 1986,《Principal Component Analysis)),Springer, New York);最近相邻分类符分析(参阅如 Duda, ((Pattern Classification)),第二版,2001, John Wiley & Sons, Inc ;和 Hastie, 2001,《The Elements of StatisticalLearning》,Springer, New York);
[0238]线性判别分析(参阅如Duda,《Pattern Classification》,第二版,2001, JohnWiley & Sons, Inc ;和 Hastie,2001,《The Elements of Statistical Learning》,Springer, New York ;Venables & Ripley,1997,《Modern Applied Statistics withs-plus)), Springer, New York);支持向量机(参阅如 Cristianini 和 Shawe-Tay I or,2000,《An Introduction to Support Vector Machines》,Cambridge University Press,Cambridge,Boser等,1992," A training algorithm for optimal margin classifiers,《Proceedings of the5th Annual A CM Workshop on Computational Learning Theory》,ACM Press, Pittsburgh, PA, 142-152 页;Vapnik, 1998, ((Statistical Learning Theory)),Wiley, New York,引入本文为参考)。
[0239]5.10分类器的评估
[0240]一旦使用数学模型计算了一个或多个分类器之后,就可以对分类器进行评估,以确定哪些分类器对于所需目的是有效的。例如,就其将训练群中每一个体正确表征为患轻度OA或未患OA的能力对每种分类器进行评估或评分。例如,可以使用以下一种或多种方法评价分类器:交叉验证、留一交叉验证(leave one out cross validation)、n_倍交叉验证、用标准统计学方法和公开的刀切法分析。本文使用的评估分类器的方法称为“评分”。在一些实施方案中,使用训练群进行评分。在另一些实施方案中,使用本文所述的“评分群”进行评分。在一个实施方案中,除了未用于训练群的一个或多个成员以外,评分群还包括训练群中的成员。在一个实施方案中,除了未用于训练群的一个或多个成员以外,评分群还包括训练群的成员。在一些实施方案中,训练群成员中5%或更少、10%或更少、20%或更少、30 %或更少、50 %或更少或90 %或更少与评分群共用。
[0241]在一些实施方案中,使用百分比校正预测统计对每个分类器评分。“百分比校正预测”统计假定若预测的P大于或等于0.5,则期望事件会发生,否则不发生。通过给这些概率指定0和1,可以与训练群中样品的值进行比较,以确定训练群中正确采样的百分比。
[0242]在一个实施方案中,用于评价分类器正确表征训练群体每一个体的能力的方法是评价分类器的灵敏度(TPF、真正分数)和1-特异性(TNF,真负分数)的方法。例如,在一个优选实施方案中,使用接受器工作特性(receiver operating characteristic) ( “ROC”)。ROC提供评价所生成方程的诊断结果灵敏度和特异性的若干参数。例如,在一个特别优选的实施方案中,ROC面积(曲线下面积)用于评价方程。在一个优选实施方案中,优选大于0.5,0.6,0.7,0.8,0.9的ROC面积。1.0的完美ROC面积分数表示分类器具有100%灵敏度和100%特异性[0243]本领域技术人员会理解,曲线下面积将ROC曲线中含有的二维信息转换为一维信息。在另一些实施方案中,直接使用来自ROC曲线二维形状的信息。例如,ROC曲线还提供关于分类器灵敏度和特异性的信息。在一些实施方案中,基于灵敏度或特异性选择分类器。这可以是重要的评分指示。例如,在将个体误诊为患病比将个体误诊为正常更安全的情况下,具有高特异性(即更少的假阴性)的诊断分类器可能是很重要的。因此,在一些实施方案中,可以设置灵敏度或特异性的截止值,并基于剩余的变量对分类器进行分级或评分。在一些实施方案中,使用产生数据的任何已知方法对每个分类器产生ROC曲线。在一些实施方案中,使用微阵列产生数据。在一些实施方案中,使用定量RT-PCR产生数据。
[0244]在一些实施方案中,分类器为加权的逻辑回归模型,其特征为多类别对数单位模型。例如,在一些实施方案中,分类器甄别两个不同的性状组。在另一些实施方案中,分类器甄别两个以上的不同性状组。对数单位模型包括多类别对数单位模型,其描述于Agresti,《An Introduction to Categorical Data Analysis》,John Wiley & Sons,Inc.,1996,NewYork,第7、8章,其引入本文为参考。表10展示了用于基于对数学模型应用的表达数据形成ROC曲线的数据,所述数学模型使用以下的对数单位:
[0245]In [p/ (1-p) ] = a + ^1+ ^ 2X2+ e.[0246]表10:使用数据组44的对数单位ln[p/ (1-p) ] = a + 3 2X, + e的值
[0247]
In|p/(l-p)]存在/不存在性状
【权利要求】
1.用于确定测试个体患有轻度骨关节炎之可能性的试剂盒,其包含:对于选自表1或表4所示基因的两个或更多个基因的组中的每种基因来说,用于特异性扩增所述基因之 cDNA的引物。
2.权利要求1的试剂盒,其中所述试剂盒还包含具有逆转录酶活性的酶。
3.权利要求1或2的试剂盒,其中所述试剂盒还包含具有热稳定DNA聚合酶活性的酶。
4.试剂盒在制备用于确定测试个体患有轻度骨关节炎之可能性的药物中的用途,其中所述试剂盒包含:对于选自表1或表4所示基因的两个或更多个基因的组中的每种基因来说,用于特异性扩增所述基因之cDNA的引物。
5.权利要求4的用途,其中所述试剂盒还包含具有逆转录酶活性的酶。
6.权利要求4或5的用途,其中所述试剂盒还包含具有热稳定DNA聚合酶活性的酶。
【文档编号】C12Q1/68GK103497993SQ201310367166
【公开日】2014年1月8日 申请日期:2006年2月6日 优先权日:2005年2月7日
【发明者】刘宗正, 张宏伟, 亚当·登普西, 托马斯·耶格尔, 承恩 申请人:基因信息公司