选择药物敏感性决定因子的方法和利用所选择的因子预测药物敏感性的方法

文档序号:5871194阅读:955来源:国知局
专利名称:选择药物敏感性决定因子的方法和利用所选择的因子预测药物敏感性的方法
技术领域
本发明涉及利用基因表达数据选择药物敏感性决定因子的方法和利用所选择的决定性因子预测未知样品的药物敏感性的方法。本发明具体涉及通过揭示抗肿瘤效果与微阵列数据之间的相关性来鉴定对抗肿瘤活性大有贡献的基因的技术,和根据基因表达数据预测敏感性未知的样本的抗肿瘤效果的技术。
背景技术
一般而言,已知的抗肿瘤药不是非常有效的,它们的副作用可能非常严重,并且显著降低患者的生活质量(QOL)。为了提高治疗效果和患者的QOL,有必要在给药前预测抗癌药可能会对患者产生的治疗效果,并选择适当的药物。
由于对药物、例如对抗肿瘤药物的敏感性知之甚少,通常是通过经验判断来选择药物的。尽管现在有了药物敏感性实验,所述实验中从患者身上获得一些癌细胞,并在体外检验所述细胞对各种药物的敏感性,但是因为体内与体外环境之间的差异,药动学差异等,难以借助这种方法预测体内敏感性。在制备抗体时,由于在癌组织抗原表达水平与效果之间存在相关性,可以根据根据癌组织中表达水平的定量分析选择敏感性患者。另一方面,在低分子量抑制剂的情况下,因为癌细胞是异种的,并且靶分子不止一种,难以通过分析单一分子预测敏感性。
近几年来,微阵列技术的出现已经使得可利用少量样品进行大量的同时基因表达分析。有一些尝试就是根据这种基因表达模式来预测敏感性的。然而,当利用所有从阵列中获得的数据时,可预测性非常差,因而难以做出有效的预测。
以前报道过的选择决定敏感性的因子的方法包括根据群集(clustering)技术评估一组基因的方法,该组基因的表达水平在照射-敏感性肿瘤与照射-不敏感性肿瘤之间是不一样的,所述群集技术是一种模式识别技术(Hanna等(2001)Cancer Res.612376-2380)。还报道过这样一种方法,包含将样品分为两组,也就是药物-敏感组和药物-不敏感组,再利用一种检验法例如U-检验选择一组基因,该组基因的表达水平在上述两组样品之间是显著不同的(Kihara等(2001)Cancer Res.616474-6479)。在这种方法中,然后根据基因表达水平通过所选择的基因的表达模式评分来预测敏感性。这些方法分别是根据群集和显著性差异检验的,都仅以将样品分为两个组即药物-敏感组和药物不敏感组为目的。因而,难以借助这些方法精确地预测敏感性。另外,这些方法不足以定量地预测敏感性值,也就是有效性的程度。
微阵列上的基因数量远远大于基因表达所分析的样品上的基因的数量,并且各个基因表达事件彼此之间不是独立的。所以,利用标准的多变量分析,例如常用的简单回归分析和多元回归分析,难以成功地预测敏感性。因此,需要建立一种根据微阵列数据精确地预测药物敏感性的方法。

发明内容
本发明提供利用大量基因表达数据、用来检测所选择基因的表达的高密度核酸阵列以及PCR探针和引物来选择药物敏感性决定基因的方法。本发明进一步提供利用借助上述方法选出的基因预测未知样品的药物敏感性的方法和用来预测药物敏感性的计算机设备。本发明的方法可以根据药物敏感性对未知样品进行分类并辅助制定诊断和治疗方法的计划。具体地,本发明提供这样一种方法,其通过揭示抗肿瘤效果与微阵列数据之间的相关性确定对药物抗肿瘤活性大有贡献的基因,进一步根据这些基因的表达数据预测药物敏感性未知的样品的抗肿瘤效果。
尽管在健康护理中有必要开发利用基因表达数据在给药前定量地预测具体药物的抗肿瘤效果的技术,不过这类方法尚未得到开发。利用一种能够克服上述统计学束缚的新的多变量分析技术,本发明人开发了一种模型,其通过定量测定抗肿瘤效果与基因表达模式之间的相关性来精确预测敏感性未知的样品的敏感性。为了达到这一目的,发明人采用了部分最小平方法-1型(partial least squares method type 1)(PLS1),这是一种新的多变量分析方法,已被用于经济计量学和化学计量学领域。这种分析方法包含从大量基因表达数据(例如微阵列数据)和药物敏感性数据(例如抗肿瘤效果)推导出主要组分,并对这两种主要组分再次进行简单回归分析。主要组分的使用能够防止下列统计学上的束缚i)各个基因表达事件彼此之间不是独立的;和ii)基因的数量远远大于样品的数量。部分最小平方法(PLS)的PLS-2型(PLS2)使人们能够根据例如细胞与多种基因表达之间的关系以及细胞与对多种药物的敏感性之间的关系鉴定通常影响对药物的敏感性的重要基因。另一方面,PLS-1型(PLS1)使人们能够根据例如细胞与多种基因表达之间的关系以及细胞与对具体药物的敏感性之间的关系鉴定就对具体药物的敏感性而言重要的基因。正如本文实施例所描述的,本发明人实验性地体外与体内测定了具体的癌细胞系的药物敏感性,这些细胞系来源于结肠癌、肺癌、乳腺癌、前列腺癌、胰腺癌、胃癌、神经母细胞瘤、卵巢癌、黑素瘤、膀胱癌和急性髓细胞性白血病。进而,利用DNA微阵列分析了10,000或更多类型的基因在癌细胞系中的表达。然后,借助PLS1,他们分析这些基因的表达数据和药物敏感性数据,从而构建一种模型,借助该模型,可以从基因的表达预测药物敏感性。这种技术使发明人能够借助各个被分析的基因的系数,来测定参与决定药物敏感性的各个基因的贡献程度。从而,有可能仅选择那些对敏感性具有高度贡献的基因的组。
进而,本发明人利用对敏感性决定具有高度贡献的一组选出的基因,重构了PLS1模型,从而开发了利用少数基因高度精地预测敏感性的系统。为了实现这种系统,首先,本发明人采用了一种序贯的方法,具体为建模能力(MP)法。在MP法中,基因的MP值(Ψ)越大,认为基因的相关性越显著。测定每种基因的表达的MP值,然后选择具有较高MP值的基因,以大大减少用于模型构建的基因数量。因而,发明人仅选择对药物敏感性大有贡献的基因,成功地构建模型。所构建的PLS1模型的预测性相关系数的平方(Q2)显著地增加了。
此外,为了进一步减少基因的数量,本发明人利用一种系统方法重建该模型。具体而言,采用了遗传算法(GA),这是一种最近用在工程领域中的优化方法。利用这种技术,对基因的组合进行彻底的研究,其中PLS1模型中的统计量、即Q2值被最大化,所选择的基因数量被最小化。在GA法中,首先,制备适当的群体;利用一种评价函数评估该群体的每一成员(在这种情况下是使Q2值最大化并使所选择的基因数量最小化的函数);然后选择具有较高评价值的成员。接着,对所选出的多种成员进行选择、交换和突变,以人工生成具有高评价值的新成员。重复这些操作,以最终提供包含具有高评价值的成员的群体。GA的使用成功地实现了Q2值的显著增加和基因数量的减少。
因而,借助本发明的方法能够从微阵列上的基因选择对药物敏感性测定具有高度贡献的一组基因。进而,由于主要组分能够在由PLS1所构建的模型中转化为基因表达的原始水平,该模型定量地给出各个基因表达的系数(贡献的程度),这与典型的多元回归分析相似。利用系数的值,根据具有未知药物敏感性的样品的基因表达模式进行敏感性预测。经过计算的预测值被确认与实验测定的敏感性程度吻合良好。
因而,本发明人利用PLS1根据生物样品中的基因表达数据和药物敏感性数据的分析成功地选出对药物敏感性的决定具有高度贡献的基因,进而,利用这些基因成功地定量预测敏感性程度。本发明方法的使用使人们能够选择决定对药物或任意其它刺激的敏感性的重要基因。因而通过测量所选择的基因的表达水平,能够预测任意样品的敏感性。具体地,在测定利用所构建的模型所鉴定的基因的表达水平时,根据该模型能够从该数值定量计算敏感性的预测值。本发明的敏感性预测方法例如可用于例如预测某一具体药物对靶疾病是否有效。另外,本发明方法也可用于例如,根据敏感性的预测值将未知样品分类。进而,利用患者样品所预测的敏感性使的能够进行疾病的诊断和疗程的选择。例如,能够预测药物治疗对靶疾病的有效性,从而能够实现药物的选择和治疗方法的优化。
也就是说,本发明涉及利用基因表达数据选择药物敏感性-决定基因的方法,和利用所选择的基因预测未知样品的药物敏感性的方法。更具体而言,本发明涉及[1]构建模型的方法,该模型根据基因的表达水平预测对药物的敏感性,所述方法包含下列步骤(a)获得该生物样品的敏感性数据;(b)获得生物样品的基因表达数据;和(c)利用步骤(a)所得的所述敏感性数据和步骤(b)所得的生物样品的所述基因表达数据的至少一部分,借助部分最小平方法-1型构建模型,其中所述模型能够预测生物样品对具体药物的敏感性; 根据[1]的方法,其中在步骤(c)中,该模型是通过借助部分最小平方法-1型构建两套或多套基因组合各自的模型并通过选择其中技术数量较小的那些模型和/或其Q2值较高的那些模型而进行优化的;[3]根据[2]的方法,其中在步骤(c)中,该模型是通过计算代表基因各自的贡献程度的参数和通过选择具有较大的相对参数的基因而构建的;[4]根据[3]的方法,其中代表贡献程度的该参数是建模能力值(Ψ);[5]根据[2]的方法,其中在步骤(c)中,该模型是通过根据遗传算法生成不同的基因组合而构建的;[6]根据[1]的方法,其中该敏感性数据包含生物样品的体外敏感性数据;[7]根据[1]的方法,其中该敏感性数据包含生物样品的动物实验的敏感性数据;[8]根据[1]的方法,其中该敏感性数据包含生物样品的临床敏感性数据;[9]根据[1]的方法,其中该药物选自下列法呢基转移酶抑制物a)6-[氨基-(4-氯-苯基)-(3-甲基-3H-咪唑-4-基)甲基]-4-(3-氯-苯基)-1-甲基-1H-喹啉-2-酮;盐酸盐(代码R115777);b)(R)-2,3,4,5-四氢-1-(1H-咪唑-4-基甲基)-3-(苯基甲基)-4-(2-噻吩基磺酰基)-1H-1,4-苯并二氮杂草(benzodiazepine)-7-甲腈(carbonitrile)(代码BMS214662);c)(+)-(R)-4-[2-[4-(3,10-二溴-8-氯-5,6-二氢-11H-苯并[5,6]芳庚并[1,2-b]吡啶-11-基)哌啶-1-基]-2-氧代乙基]哌啶-1-甲酰胺(代码SCH66336);d)4-[5-[4-(3-氯苯基)-3-氧代哌嗪-1-基甲基]咪唑-1-基甲基]苄腈(代码L778123);和e)4-[羟基-(3-甲基-3H-咪唑-4-基)-(5-硝基-7-苯基-苯并呋喃-2-基)-甲基]苄腈盐酸盐;[10]根据[1]的方法,其中该药物选自下列氟代嘧啶类物质a)[1-(3,4-二羟基-5-甲基-四氢-呋喃-2-基)-5-氟-2-氧代-1,2-二氢-嘧啶-4-基]-氨基甲酸丁基酯(代码capecitabine(Xeloda);b)1-(3,4-二羟基-5-甲基-四氢-呋喃-2-基)-5-氟-1H-嘧啶-2,4-二酮(代码Furtulon);c)5-氟-1H-嘧啶-2,4-二酮(代码5-FU);d)5-氟-1-(四氢-2-呋喃基)-2,4(1H,3H)-嘧啶二酮(代码替加氟);
e)替加氟与2,4(1H,3H)-嘧啶二酮的组合物(代码UFT);f)替加氟、5-氯-2,4-二羟基吡啶与四氢吡喃2羧酸钾(potassium oxonate)的组合物(摩尔比1∶0.4∶1)(代码S-1);和g)5-氟-N-己基-3,4-二氢-2,4-二氧代-1(2H)-嘧啶甲酰胺(代码卡莫氟);[11]根据[1]的方法,其中该药物选自下列紫杉烷类物质a)[2aR-[2aα,4β,4aβ,6β,9α(αR*,βS*),11α,12α,12aα,12bα]]-β-(苯甲酰氨基)-α-羟基苯丙酸6,12b-双(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-4,11-二羟基-4a,8,13,13-四甲基-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码紫杉醇(Taxol));b)[2aR-[2aα,4β,4aβ,6β,9α(αR*,βS*),11α,12α,12aα,12bα]]-β-[[(1,1-二甲基乙氧基)羰基]氨基]-α-羟基苯丙12b-(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-4,6,11-三羟基-4a,8,13,13-四甲基-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码多西他赛(Taxotere));c)(2R,3S)-3-[[(1,1-二甲基乙氧基)羰基]氨基]-2-羟基-5-甲基-4-己烯酸(3aS,4R,7R,8aS,9S,10aR,12aS,12bR,13S,13aS)-7,12a-双(乙酰氧基)-13-(苄氧基)-3a,4,7,8,8a,9,10,10a,12,12a,12b,13-十二氢-9-羟基-5,8a,14,14-四甲基-2,8-二氧代-6,13a-亚甲基-13aH-氧杂环丁烷并[2” 3 ”5’,6’]苯并[1’,2’4,5]芳癸并[1,2-d]-1,3-二氧代-4-基酯(代码IDN 5109);d)(2R,3S)-β-(苯甲酰氨基)-α-羟基苯丙酸(2aR,4S,4aS,6R,9S,11S,12S,12aR,12bS)-6-(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-4,11-二羟基-12b-[(甲氧基羰基)氧基]-4a,8,13,13-四甲基-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码BMS 188797);和e)(2R,3S)-β-(苯甲酰氨基 -α-羟基苯丙酸(2aR,4S,4aS,6R,9S,11S,12S,12aR,12bS)-6,12b-双(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-11-羟基-4a,8,13,13-四甲基-4-[(甲硫基)甲氧基]-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码BMS 184476); 根据[1]的方法,其中该药物选自下列喜树碱类物质a)4(S)-乙基-4-羟基-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮(缩写喜树碱(camptothecin));b)[1,4’-联哌啶]-1’-羧酸,(4S)-4,11-二乙基-3,4,12,14-四氢-4-羟基-3,14-二氧代-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-9-基酯,单盐酸盐(代码CPT-11);c)(4S)-10-[(二甲基氨基)甲基]-4-乙基-4,9-二羟基-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮单盐酸盐(缩写拓扑替康(topotecan));d)(1S,9S)-1-氨基-9-乙基-5-氟-9-羟基-4-甲基-2,3,9,10,13,15-六氢-1H,12H-苯并[de]吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-10,13-二酮(代码DX-8951f);e)5(R)-乙基-9,10-二氟-1,4,5,13-四氢-5-羟基-3H,15H-氧杂卓并(oxipeno)[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,15-二酮(代码BN-80915);f)(S)-10-氨基-4-乙基-4-羟基-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮(代码9-氨基喜树碱);g)4(S)-乙基-4-羟基-10-硝基-1H-吡喃并[3’,4’,6,7]-吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮(代码9-硝基喜树碱);[13]根据[1]的方法,其中该药物选自下列核苷类似物抗肿瘤药a)2’-脱氧-2’,2’-二氟胞苷(代码DFDC);b)2’-脱氧-2’-次甲基胞苷(代码DMDC);c)(E)-2’-脱氧-2’-(氟亚甲基)胞苷(代码FMDC);d)1-(β-D-阿拉伯呋喃糖基)胞嘧啶(代码Ara-C);e)4-氨基-1-(2-脱氧-β-D-赤藓-呋喃戊糖基)-1,3,5-三嗪-2(1H)-酮(缩写地西他滨(decitabien));f)4-氨基-1-[(2S,4S)-2-(羟基甲基)-1,3-二氧戊环-4-基]-2(1H)-嘧啶酮(缩写troxacitabine);g)2-氟-9-(5-O-膦酰基-β-D-阿拉伯呋喃糖基)-9H-嘌呤-6-胺(缩写氟达拉滨(fludarabine));和h)2-氯-2’-脱氧腺苷(缩写克拉屈滨(cladribine));[14]根据[1]的方法,其中该药物选自下列多拉他汀类物质
a)N,N-二甲基-L-缬氨酰-N-[(1S,2R)-2-甲氧基-4-[(2S)-2-[(1R,2R)-1-甲氧基-2-甲基-3-氧代-3-[[(1S)-2-苯基-1-(2-噻唑基)乙基]氨基]丙基]-1-吡咯烷基]-1-[(1S)-1-甲基丙基]-4-氧代丁基]-N-甲基-L-缬氨酰胺(缩写多拉他汀(dolastatin)10);b)环[N-甲基丙氨酰-(2E,4E,10E)-15-羟基-7-甲氧基-2-甲基-2,4,10-十六碳三烯酰基-L-缬氨酰-N-甲基-L-苯基丙氨酰-N-甲基-L-缬氨酰-N-甲基-L-缬氨酰-L-脯氨酰-N2-甲基天冬氨酰](缩写多拉他汀14);c)(1S)-1-[[(2S)-2,5-二氢-3-甲氧基-5-氧代-2-(苯基甲基)-1H-吡咯-1-基]羰基]-2-甲基丙基酯N,N-二甲基-L-缬氨酰-L-缬氨酰-N-甲基-L-缬氨酰-L-脯氨酰-L-脯氨酸(缩写多拉他汀15);d)N,N-二甲基-L-缬氨酰-N-[(1S,2R)-2-甲氧基-4-[(2S)-2-[(1R,2R)-1-甲氧基-2-甲基-3-氧代-3-[(2-苯基乙基)氨基]丙基]-1-吡咯烷基]-1-[(1S)-1-甲基丙基]-4-氧代丁基]-N-甲基-L-缬氨酰胺(代码TZT 1027);和e)N,N-二甲基-L-缬氨酰-L-缬氨酰-N-甲基-L-缬氨酰-L-脯氨酰-N-(苯基甲基)-L-脯氨酰胺(缩写cemadotin);[15]根据[1]的方法,其中该药物选自下列蒽环类物质a)(8S,10S)-10-[(3-氨基-2,3,6-三脱氧-L-来苏-吡喃己糖基)氧基]-7,8,9,10-四氢-6,8,11-三羟基-8-(羟基乙酰基)-1-甲氧基并四苯-5,12-二酮盐酸盐(缩写阿霉素);b)(8S,10S)-10-[(3-氨基-2,3,6-三脱氧-L-阿拉伯-吡喃己糖基)氧基]-7,8,9,10-四氢-6,8,11-三羟基-8-(羟基乙酰基)-1-甲氧基并四苯-5,12-二酮盐酸盐(缩写表柔比星);c)8-乙酰基-10-[(3-氨基-2,3,6-三脱氧-L-来苏-吡喃己糖基)氧基]-7,8,9,10-四氢-6,8,11-三羟基-1-甲氧基并四苯-5,12-二酮,盐酸盐(缩写柔红霉素);和d)(7S,9S)-9-乙酰基-7-[(3-氨基-2,3,6-三脱氧-L-来苏-吡喃己糖基)氧基]-7,8,9,10-四氢-6,9,11-三羟基并四苯-5,12-二酮(缩写伊达比星);[16]根据[1]的方法,其中该药物选自下列蛋白激酶抑制物a)N-(3-氯-4-氟苯基)-7-甲氧基-6-[3-(4-吗啉基)丙氧基]-4-喹唑啉胺(代码ZD 1839);
b)N-(3-乙炔基苯基)-6,7-双(2-甲氧基乙氧基)-4-喹唑啉胺(代码CP358774);c)N4-(3-溴苯基)-N6-甲基吡啶并[3,4-d]嘧啶-4,6-二胺(代码PD158780);d)N-(3-氯-4-((3-氟苄基)氧基)苯基)-6-(5-(((2-甲基磺酰基)乙基)氨基)甲基)-2-呋喃基)-4-喹唑啉胺(代码GW 2016);e)3-[(3,5-二甲基-1H-吡咯-2-基)亚甲基]-1,3-二氢-2H-吲哚-2-酮(代码SU5416);f)(Z)-3-[2,4-二甲基-5-(2-氧代-1,2-二氢-亚吲哚-3-基甲基)-1H-吡咯-3-基]-丙酸(代码SU6668);g)N-(4-氯苯基)-4-(吡啶-4-基甲基)酞嗪-1-胺(代码PTK787);h)(4-溴-2-氟苯基)[6-甲氧基-7-(1-甲基哌啶-4-基甲氧基)喹唑啉-4-基]胺(代码ZD6474);i)N4-(3-甲基-1H-吲唑-6-基)-N2-(3,4,5-三甲氧基苯基)嘧啶-2,4-二胺(代码GW2286);j)4-[(4-甲基-1-哌嗪基)甲基]-N-[4-甲基-3-[[4-(3-吡啶基)-2-嘧啶基]氨基]苯基]苯甲酰胺(代码STI-571);k)(9α,10β,11β,13α)-N-(2,3,10,12,13-六氢-10-甲氧基-9-甲基-1-氧代-9,13-环氧-1H,9H-二吲哚并[1,2,3-gh3’,2’,1’-1m]吡咯并[3,4-j][1,7]benzodiazonin-11-基)-N-甲基苯甲酰胺(代码CGP41251);l)2-[(2-氯-4-碘苯基)氨基]-N-(环丙基甲氧基)-3,4-二氟苯甲酰胺(代码CI1040);和m)N-(4-氯-3-(三氟甲基)苯基)-N’-(4-(2-(N-甲基氨甲酰基)-4-吡啶氧基)苯基)脲(代码BAY439006);[17]根据[1]的方法,其中该药物选自下列铂抗肿瘤药a)顺式-二氨基二氯化铂(II)(缩写顺铂);b)二氨基(1,1-环丁烷联羧基)铂(II)(缩写卡铂);和c)六氨基二氯双[μ-(1,6-己烷二胺-κNκN)]三-,立体异构体,四硝酸铂(4+)(代码BBR3464);[18]根据[1]的方法,其中该药物选自下列epothilones
a)4,8-二羟基-5,5,7,9,13-五甲基-16-[(1E)-1-甲基-2-(2-甲基-4-噻唑基)乙烯基]-(4S,7R,8S,9S,13Z,16S)-氧杂环十六碳-13-烯-2,6-二酮(缩写epothilone D);b)7,11-二羟基-8,8,10,12,16-五甲基-3-[(1E)-1-甲基-2-(2-甲基-4-噻唑基)乙烯基]-,(1S,3S,7S,10R,11S,12S,16R)-4,17-二氧杂二环[14.1.0]十七烷-5,9-二酮6-二酮(缩写epothilone);和c)(1S,3S,7S,10R,11S,12S,16R)-7,11-二羟基-8,8,10,12,16-五甲基-3-[(1E)-1-甲基-2-(2-甲基-4-噻唑基)乙烯基]-17-氧杂-4-氮杂双环[14.1.0]十七烷-5,9-二酮(代码BMS247550);[19]根据[1]的方法,其中该药物选自下列芳化酶抑制物a)α,α,α’,α’-四甲基-5-(1H-1,2,4-三唑-1-基甲基)-1,3-苯二乙腈(代码ZD1033);b)(6-亚甲基雄甾-1,4-二烯-3,17-二酮(代码FCE24304);和c)4,4’-(1H-1,2,4-三唑-1-基亚甲基)双-苄腈(代码CGS20267);[20]根据[1]的方法,其中该药物选自下列激素调节物a)2-[4-[(1Z)-1,2-二苯基-1-丁烯基]苯氧基]-N,N-二甲基乙胺(缩写他莫昔芬(tamoxifen));b)[6-羟基-2-(4-羟基苯基)苯并[b]噻吩-3-基][4-[2-(1-哌啶基)乙氧基]苯基]甲酮盐酸盐(代码LY156758);c)2-(4-甲氧基苯基)-3-[4-[2-(1-哌啶基)乙氧基]苯氧基]苯并[b]噻吩-6-醇盐酸盐(代码LY353381);d)(+)-7-新戊酰氧基-3-(4’-新戊酰氧基苯基)-4-甲基-2-(4″-(2″’-哌啶子基乙氧基)苯基)-2H-苯并吡喃(代码EM800);e)(E)-4-[1-[4-[2-(二甲基氨基)乙氧基]苯基]-2-[4-(1-甲基乙基)苯基]-1-丁烯基]苯酚二氢磷酸盐(酯)(代码TAT59);f)17-(乙酰氧基)-6-氯-2-氧杂孕甾-4,6-二烯-3,20-二酮(代码TZP4238);g)(+,-)-N-[4-氰基-3-(三氟甲基)苯基]-3-[(4-氟苯基)磺酰基]-2-羟基-2-甲基丙酰胺(代码ZD176334);和h)6-D-亮氨酸-9-(N-乙基-L-脯氨酰胺)-10-去甘氨酰胺促黄体生成激素释放因子(pig)(缩写亮丙瑞林(1euprorelin)); 根据[1]的方法,其中该生物样品是癌细胞或癌细胞系;[22]根据[1]的方法,其中所述敏感性包含抗肿瘤效果;[23]根据[1]的方法,其中该基因表达数据包含高密度核酸阵列数据;[24]选择对生物敏感性有高度贡献的基因的方法,所述方法包括在根据[1]或[2]任意一项的方法所构建的模型中选择部分或全部基因组合的步骤;[25]预测供试样品对特定刺激的敏感性的方法,所述方法包含下列步骤(a)从根据[1]的方法所构建的模型样品中获得供试样品的至少一部分基因表达数据;和(b)与敏感性高,模型中具有正系数的基因的表达水平高且模型中具有负系数的基因的表达水平低的事实相关联,并与敏感性低,模型中具有正系数的基因的表达水平低且模型中具有负系数的基因的表达水平高的事实相关联;[26]根据[25]的方法,其中步骤(a)包含获得供试样品模型中的基因表达数据的步骤;和步骤(b)包含通过将表达数据应用于模型来计算敏感性的步骤;[27]预测供试样品对特定刺激的敏感性的计算机设备,所述设备包含(a)储存由根据[1]的方法所构建的模型中代表基因表达数据与敏感性值之间关系的参数(模型系数)的装置;(b)向模型输入基因表达数据的装置;(c)储存表达数据的装置;(d)根据该模型从表达数据和参数(模型系数)预测性计算敏感性值的装置;(e)储存预测性计算的敏感性值的装置;和(f)输出预测性计算的敏感性值或从敏感性值所得结果的装置;[28]产生高密度核酸阵列的方法,所述方法包含在载体上固定或生成包含至少15个核苷酸的核酸的步骤,所述核苷酸包含在根据[24]的方法所选择的各个基因的核苷酸序列中;[29]产生用于由根据[24]的方法所选出的各个基因的定量或半定量的PCR探针或引物的方法,所述方法包括合成包含至少15个核苷酸的核酸的步骤,所述核苷酸包含在各个基因的核苷酸序列中;和 试剂盒,包括(a)高密度核酸阵列,或者用于定量或半定量PCR的探针或引物,其中所述阵列、探针或引物包含含有至少15个核苷酸的核酸,所述核苷酸来自编码根据[24]的方法所选出的各个基因的核苷酸序列;和(b)储存介质,记录利用所述阵列或者所述探针或所述引物预测的对药物的敏感性。
Okamura等人的一项关于对药物或放射的敏感性的决定因子的报道中陈述了一种方法,这种方法以对基因表达和药物敏感性的简单回归分析为基础来估定出对药物敏感性贡献较大的那些基因(Okamura等(2000)Int.J.Oncol.16295-303)。该方法以简单的回归分析为基础,但是难以利用其唯一地选择出仅一组特定的重要的基因,因为基因表达之间是相互关联的。因此一般说来,该方法不能被用于分析多重基因表达和敏感性之间的关系。
Musumarra等人报道了选择一组基因的方法,所述基因组通常显示出与那些通过相同的机制起作用的化合物之间有较强的相关性。使用类别模拟的软独立建模(Soft Independent Modelling of Class Analogy)(SIMCA)(Musumarra等(2001)J.Comp.-Aid.Mol.Design 15219-234)。Hilsenbeck等人也报道了使用主要组分分析法(PCA)来鉴定针对具体药物的抗药性决定因子(Hilsenbeck等(1999)J.Natl.Cancer Inst.91453-459)。这些方法以主要组分分析为基础,因此只能选择那些对药物敏感性贡献大的基因,但是不能用于定量地预测药物敏感性。采用多变量分析技术(PLS 2型)(Musumarra等(2001)Biochem.Pharma.62547-553),Musumarra等人也已报道了选出通常显示与一组具有共同的作用机制的化合物的效果具有强的相关性的一组基因。然而,使用这种方法难以评估出对具体药物的敏感性有较高贡献的一组基因,也难以预测对其它未知样品的敏感性。本发明的方法使人能构建出一个模型,从而根据基因表达的数据上来定量地预测针对所需具体药物的敏感性。本发明对构建用于预测敏感性的系统特别地有用,所述系统是以对具体药物的敏感性与高密度核酸阵列数据之间测定的相关性为基础的。
依照本发明的方法,使用PLS1对对具体药物的敏感性与基因表达数据之间的相互关系进行分析,一个模型就被构建出来。这里“通过PLS1分析,构建模型”意味着获得一个方程,它代表敏感性值通过PLS1分析从基因表达数据中获得的主要组分之间的关系。既然主要组分能被转变成基因表达的初始水平,各个基因表达(贡献程度)的系数就能被定量地估算出来。借助这些系数值,可根据基因表达模式来预测出敏感性未知的样品的敏感性。此外借助PLS1分析所提供的模型,可确定相关系数的平方(R2)以及预测性相关系数的平方(Q2)。这些统计数据将在以后讨论。
这里,术语对药物的“敏感性”的意思是生物样品对药物的反应性。换句话说,就是此药对样品的作用。用本发明中的方法可构建出一个模型,它能预测针对所需药物的敏感性。本发明对构建可用来将抗肿瘤效果预测为敏感性的模型而言特别有用,使用抗肿瘤药物或其它药物候选化合物可预测所述抗肿瘤效果。抗肿瘤效果具体包括抑制肿瘤细胞生长的效果,抑制肿瘤生长的效果,诱使肿瘤细胞死亡的活性等等,基因对决定敏感性的“贡献程度”这一术语意指基因表达和敏感性之间的相关性程度。
术语“生物样品”意指从有机体包括细胞,组织,器官等中获得的样品。在构建用于预测上述抗肿瘤效果的模型中,癌细胞或癌细胞系优选被用作生物样品。为了构建可预测具体具体药物对多种癌症的抗肿瘤效果的模型,优选采用通过使用来自各种癌症的癌细胞或癌细胞系而获得的数据来构建模型。举例来说,优选使用包含至少两种或更多类型,优选五种或更多类型,更优选七种或更多类型,最优选十种或更多类型的癌症的细胞或细胞系的生物样品来获得药物敏感性数据和基因表达数据,所述癌症选自结肠癌,肺癌,乳癌,前列腺癌,胰腺癌,胃癌,神经母细胞瘤,卵巢癌,黑素瘤,膀胱癌,急性髓细胞白血病,子宫癌,子宫内膜癌和肝癌。许多已知的癌细胞系得自上方所列的各种癌症,例如HCT116(ATCC CCL-247),WiDr (ATCC CCL-218),COLO201(ATCC CCL-224),COLO205(ATCCCCL-222),COLO320DM(ATCC CCL-220),LoVo(ATCC CCL-229),HT-29(ATCC HTB-38),DLD-1(ATCC CCL-221),SW480(ATCC CCL-228),LS411N(ATCC CRL-2159),LS513(ATCC CRL-2134),HCT15(ATCC CCL-225),和CX-1(Japanese Foundation for Cancer Research,Japan;Division of CancerTreatment,Tumor Repository,NCI.Osieka,R.,Johnson,R.K.Evaluation ofchemical agents in phase I clinical trial and earlier stages of development againstxenografts of human colon carcinoma.Editor(s)Houchens,D.P.& Ovejera,A.A.Proc.Symp.Use Athymic(Nude)Mice Cancer Res.1978.217-23)(上述细胞系都是结肠癌细胞系);QG56(购自Immuno-Biological Laboratories Co.,Ltd.,Japan(IBL)),Calu-1(ATCC HTB-54),Calu-3(ATCC HTB-55),Calu-6(ATCCHTB-56),PC1(购自Immuno-Biological Laboratories Co.,Ltd.,Japan),PC10(购自Immuno-Biological Laboratories Co.,Ltd.,Japan),PC13(购自Immuno-Biological Laboratories Co.,Ltd.,Japan),NCI-H292(ATCCCRL-1848),NCI-H441(ATCC HTB-174),NCI-H460(ATCC HTB-177),NCI-H596(ATCC HTB-178),PC14(The Institute of Physical and ChemicalResearch(RIKEN),Japan.RCB0446;IBL),NCI-H69(ATCC HTB-119),LXFL529(Dr.H.H.Fiebig,Freiburg Univ.,Germany,Berger,D.P.,Fiebig,H.H.,Winterhalter,B.R.Establishment and characterization of human tumorxenograft models in nude mice.In Fiebig,H.H.and Berger,D.P.,eds.Immunodeficient Mice in Oncology.Basel,Karger,1992,23-46.),LX-1(Japanese Foundation for Cancer Research,Japan;Division of Cancer Treatment,Tumor Repository,NCI.Houchens,D.P.,Ovejera,A.A.and Barker,A.D.;andThe therapy of human tumors in athymic(nude)mice.Proc.Symp.Use Athymic(Nude)Mice Cancer Res.1978.267-80)和A549(ATCC CCL-185)(上述细胞系都是肺癌细胞系);MDA-MB-231(ATCC HTB-26),MDA-MB-435S(ATCCHTB-129),T-47D(ATCC HTB-133),Hs578T(ATCC HTB-126),MCF7(ATCCHTB-22),ZR-75-1(ATCC CRL-1500),MAXF401(Dr.H.H.Fiebig,FreiburgUniv,Germany,Berger,D.P.,Fiebig,H.H.,Winterhalter,B.R.Establishmentand characterization of human tumor xenograft models in nude mice.In Fiebig,H.H.and Berger,D.P.,eds.Immunodeficient Mice in Oncology.Basel,Karger,1992,23-46.)和MX1(Japanese Foundation for Cancer Research,Japan;Divisionof Cancer Treatment,Tumor Repository,NCI.Ovejera,A.A.,Houchens.D.P.and Barker A.D.Chemotherapy of human tumor xenografts in geneticallyathymic mice.Ann.Clin.Lab.Sci.1978.850-56.)(上述细胞系都是乳腺癌细胞系);PC-3(ATCC CRL-1435),DU145(ATCC HTB-81)和LNCaP-FGC(ATCC CRL-1740)(上述细胞系都是前列腺癌细胞系);AsPC-1(ATCCCRL-1682),Capan-1(ATCC HTB-79),Capan-2(ATCC HTB-80),BxPC3(ATCC CRL-1500),PANC-1(ATCC CRL-1469),Hs766T(ATCC HTB-134),MIA PaCa-2(ATCC CRL-1420)和SU.86.86(ATCC CRL-1834)(上述细胞系都是胰腺癌细胞系);MKN-45(购自Immuno-Biological Laboratories Co.,Ltd.,Japan),MKN28(购自Immuno-Biological Laboratories Co.,Ltd.,Japan)和GXF97(Dr.H.H.Fiebig,Freiburg Univ.,Germany,Berger,D.P.,Fiebig,H.H.,Winterhalter,B.R.Establishment and characterization of human tumor xenograftmodels in nude mice.In Fiebig,H.H.and Berger,D.P.,eds.ImmunodeficientMice in Oncology.Basel,Karger,1992,23-46.)(胃癌细胞系);T98G(ATCCCRL-1690)(神经母细胞瘤细胞系);IGROV1(through The Netherlands CancerInstitute,Netherland,Benard,J.,Da Silva,J.,De Blois,M-C.,Boyer,P.,Duvillard,P.,Chiric,E.and Riou,G Characterization of a human ovarianadenocarcinoma line,IGROV1,in tissue culture and in nude mice.Cancer Res.1985 454970-4979),SK-OV-3(ATCC HTB-77)和Nakajima(Faculty ofMedicine,Niigata University,Yanase,T.,Tamura,M.,F ujita,K.,Kodama,S.,Tanaka,K.Inhibitory effect of angiogenesis inhibitor TNP-470 on tumor growthand metastasis of human cell lines in vitro and in vivo.Cancer Res.1993.532566-2570.)(卵巢癌细胞系);C32(ATCC CRL-1585)(黑素瘤细胞系);HT-1197(ATCC CRL-1437),T24(ATCC HTB-4)和Scaber(ATCC HTB-3)(膀胱癌细胞系);KG-1a(ATCC CCL-246.1)(急性髓细胞性白血病细胞系);Yumoto(ChibaCancer Center,Tokita,H.,Tanaka,N.,Sekimoto,K.,Ueno,T.,Okamoto,K.andFujimura,S.Experimental model for combination chemotherapy withmetronidazole using human uterine cervical carcinomas transplanted into nudemice.Cancer Res.1980 404287-4294.)(子宫癌细胞系);ME-180(ATCCHTB-33)(子宫内膜癌细胞系);HepG2(ATCC HB-8065),Huh-1(JapaneseCollection of Research Bioresources,Japan.JCRB0199),Huh7(JapaneseCollection of Research Bioresources,Japan(JCRB),JCRB0403)和PLC/PRF/5(ATCC CRL-8024)(肝癌细胞系);和KB(ATCC CCL-17)(口腔上皮癌)。可预测多种类癌症的敏感性的一个极好的模型能够通过获得药物敏感性数据和基因表达数据并按照本发明进行模型构建而被构建出来,其中所使用的生物样品至少应包括五种或更多类型,优选十种或更多类型,更优选十五种或更多类型,最优选二十种或更多类型的细胞系,所述细胞系选自上述这些癌细胞系。此外,为了构建针对具体类型的癌症的敏感性预测系统,优选使用来自目标类型的癌症的细胞来构建所述模型。
获得生物样品的药物敏感性数据来进行本发明的模型构建。这些敏感性数据可能是在体外环境中获得的数据也可能是在体内环境中获得的。还有,没有对数据类型的限制;此类数据可能是包括有连续数值或离散数值的定量数据。由连续数值组成的敏感性数据是优选的,例如,药品的IC50,肿瘤生长抑制率(TGI%)、肿瘤标志物的血液水平等等。肿瘤生长抑制率能被测量出来,例如使用一个癌细胞的异种移植物模型,而且肿瘤生长抑制率还能作为体内环境中的药物敏感性数据被使用。明确地说,例如,癌细胞物质被皮下移植到一只小鼠身上,然后一种药被用在活体上以确定它对被移植肿瘤生长的抑制效果(TGI%)。
含有离散数值的敏感数据优选是借助敏感程度等进行分类的数据,此分类的达成,举例来说,是通过根据药物敏感性程度而制定一些分类标准,然后依照这个标准来给那些生物样品分类。依上所述,不仅连续数值而且离散数据都能被用在本发明中。通过进行分类,定性的敏感性数据能被定量化。因而,任意的可反映药物敏感性程度的数据都能被用于本发明中。
在本发明中对预测其敏感性的药物的种类没有限制。可使用所需对生物样品(细胞,组织等等)起作用的药物。本发明可用于构建一种模型以预测针对具体具体药物或其侯选化合物的敏感性(通过使用它们或包括它们的组合物)。具体地,抗肿瘤药物,其候选化合物,或类似物都能被合适地使用。
这类药物优选包括例如法呢基转移酶抑制物,具体包括6-[氨基-(4-氯-苯基)-(3-甲基-3H-咪唑-4-基)甲基]-4-(3-氯-苯基)-1-甲基-1H-喹啉-2-酮;盐酸盐(代码R115777);(R)-2,3,4,5-四氢-1-(1H-咪唑-4-基甲基)-3-(苯基甲基)-4-(2-噻吩基磺酰基)-1H-1,4-苯并二氮杂草(benzodiazepine)-7-甲腈(代码BMS214662);(+)-(R)-4-[2-[4-(3,10-二溴-8-氯-5,6-二氢-11H-苯并[5,6]芳庚并[1,2-b]吡啶-11-基)哌啶-1-基]-2-氧代乙基]哌啶-1-甲酰胺(代码SCH66336);4-[5-[4-(3-氯苯基)-3-氧代哌嗪-1-基甲基]咪唑-1-基甲基]苄腈(代码L778123);和4-[羟基-(3-甲基-3H-咪唑-4-基)-(5-硝基-7-苯基-苯并呋喃-2-基)-甲基]苄腈盐酸盐。优选的药物例如还包括嘧啶氟化物,具体包括[1-(3,4-二羟基-5-甲基-四氢-呋喃-2-基)-5-氟-2-氧代-1,2-二氢-嘧啶-4-基]-氨基甲酸丁基酯(代码capecitabine(Xeloda);1-(3,4-二羟基-5-甲基-四氢-呋喃-2-基)-5-氟-1H-嘧啶-2,4-二酮(代码Furtulon);5-氟-1H-嘧啶-2,4-二酮(代码5-FU);5-氟-1-(四氢-2-呋喃基)-2,4(1H,3H)-嘧啶二酮(代码替加氟);替加氟与2,4(1H,3H)-嘧啶二酮的组合物(代码UFT);替加氟、5-氯-2,4-二羟基吡啶与四氢吡喃2羧酸钾(potassium oxonate)的组合物(摩尔比1∶0.4∶1)(代码S-1);和5-氟-N-己基-3,4-二氢-2,4-二氧代-1(2H)-嘧啶甲酰胺(代码卡莫氟)。其它优选的药物例如紫杉烷类,具体包括[2aR-[2aα,4β,4aβ,6β,9α(αR*,βS*,11α,12α,12aα,12bα)]]-β-(苯甲酰氨基)-α-羟基苯丙酸6,12b-双(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-4,11-二羟基-4a,8,13,13-四甲基-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码紫杉醇);[2aR-[2aα,4β,4aβ,6β,9α(αR*,βS*,11α,12α,12aα,12bα)]]-β-[[(1,1-二甲基乙氧基)羰基]氨基]-α-羟基苯丙12b-(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-4,6,11-三羟基-4a,8,13,13-四甲基-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码多西他赛);(2R,3S)-3-[[(1,1-二甲基乙氧基)羰基]氨基]-2-羟基-5-甲基-4-己烯酸(3aS,4R,7R,8aS,9S,10aR,12aS,12bR,13S,13aS)-7,12a-双(乙酰氧基)-13-(苄氧基)-3a,4,7,8,8a,9,10,10a,12,12a,12b,13-十二氢-9-羟基-5,8a,14,14-四甲基-2,8-二氧代-6,13a-亚甲基-13aH-氧杂环丁烷并[2”,3”5’,6’]苯并[1’,2’4,5]芳癸并[1,2-d]-1,3-二氧代-4-基酯(代码IDN 5109);(2R,3S)-β-(苯甲酰氨基)-α-羟基苯丙酸(2aR,4S,4aS,6R,9S,11S,12S,12aR,12bS)-6-(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-4,11-二羟基-12b-[(甲氧基羰基)氧基]-4a,8,13,13-四甲基-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码BMS 188797);和(2R,3S)-β-(苯甲酰氨基)-α-羟基苯丙酸(2aR,4S,4aS,6R,9S,11S,12S,12aR,12bS)-6,12b-双(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-11-羟基-4a,8,13,13-四甲基-4-[(甲硫基)甲氧基]-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码BMS 184476)。优选的药物例如还包括喜树碱类,具体包括4(S)-乙基-4-羟基-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮(缩写喜树碱);[1,4’-联哌啶]-1’-羧酸,(4S)-4,11-二乙基-3,4,12,14-四氢-4-羟基-3,14-二氧代-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-9-基酯,单盐酸盐(代码CPT-11);(4S)-10-[(二甲基氨基)甲基]-4-乙基-4,9-二羟基-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮单盐酸盐(缩写拓扑替康);(1S,9S)-1-氨基-9-乙基-5-氟-9-羟基-4-甲基-2,3,9,10,13,15-六氢-1H,12H-苯并[de]吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-10,13-二酮(代码DX-8951f);5(R)-乙基-9,10-二氟-1,4,5,13-四氢-5-羟基-3H,15H-氧杂卓并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,15-二酮(代码BN-80915);(S)-10-氨基-4-乙基-4-羟基-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮(代码9-氨基喜树碱);4(S)-乙基-4-羟基-10-硝基-1H-吡喃并[3’,4’,6,7]-吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮(代码9-硝基喜树碱)。优选的药物还包括例如核苷类似物抗肿瘤药,具体包括2’-脱氧-2’,2’-二氟胞苷(代码DFDC);2’-脱氧-2’-次甲基胞苷(代码DMDC);(E)-2’-脱氧-2’-(氟亚甲基)胞苷(代码FMDC);1-(β-D-阿拉伯呋喃糖基)胞嘧啶(代码Ara-C);4-氨基-1-(2-脱氧-β-D-赤藓-呋喃戊糖基)-1,3,5-三嗪-2(1H)-酮(缩写地西他滨);4-氨基-1-[(2S,4S)-2-(羟基甲基)-1,3-二氧戊环-4-基]-2(1H)-嘧啶酮(缩写troxacitabine);2-氟-9-(5-O-膦酰基--D-阿拉伯呋喃糖基)-9H-嘌呤-6-胺(缩写氟达拉滨);和2-氯-2’-脱氧腺苷(缩写克拉屈滨)。优选的药物例如还包括多拉他汀,具体包括N,N-二甲基-L-缬氨酰-N-[(1S,2R)-2-甲氧基-4-[(2S)-2-[(1R,2R)-1-甲氧基-2-甲基-3-氧代-3-[[(1S)-2-苯基-1-(2-噻唑基)乙基]氨基]丙基]-1-吡咯烷基]-1-[(1S)-1-甲基丙基]-4-氧代丁基]-N-甲基-L-缬氨酰胺(缩写多拉他汀10);环[N-甲基丙氨酰-(2E,4E,10E)-15-羟基-7-甲氧基-2-甲基-2,4,10-十六碳三烯酰基-L-缬氨酰-N-甲基-L-苯基丙氨酰-N-甲基-L-缬氨酰-N-甲基-L-缬氨酰-L-脯氨酰-N2-甲基天冬氨酰](缩写多拉他汀14);(1S)-1-[[(2S)-2,5-二氢-3-甲氧基-5-氧代-2-(苯基甲基)-1H-吡咯-1-基]羰基]-2-甲基丙基酯N,N-二甲基-L-缬氨酰-L-缬氨酰-N-甲基-L-缬氨酰-L-脯氨酰-L-脯氨酸(缩写多拉他汀15);N,N-二甲基-L-缬氨酰-N-[(1S,2R)-2-甲氧基-4-[(2S)-2-[(1R,2R)-1-甲氧基-2-甲基-3-氧代-3-[(2-苯基乙基)氨基]丙基]-1-吡咯烷基]-1-[(1 S)-1-甲基丙基]-4-氧代丁基]-N-甲基-L-缬氨酰胺(代码TZT1027);和 N,N-二甲基-L-缬氨酰-L-缬氨酰-N-甲基-L-缬氨酰-L-脯氨酰-N-(苯基甲基)-L-脯氨酰胺(缩写cemadotin)。优选的药物例如还包括蒽环,具体包括(8S,10S)-10-[(3-氨基-2,3,6-三脱氧-L-来苏-吡喃己糖基)氧基]-7,8,9,10-四氢-6,8,11-三羟基-8-(羟基乙酰基)-1-甲氧基并四苯-5,12-二酮盐酸盐(编写阿霉素);(8S,10S)-10-[(3-氨基-2,3,6-三脱氧-L-阿拉伯-吡喃己糖基)氧基]-7,8,9,10-四氢-6,8,11-三羟基-8-(羟基乙酰基)-1-甲氧基并四苯-5,12-二酮盐酸盐(缩写表柔比星);8-乙酰基-10-[(3-氨基-2,3,6-三脱氧-L-来苏-吡喃己糖基)氧基]-7,8,9,10-四氢-6,8,11-三羟基-1-甲氧基并四苯-5,12-二酮,盐酸盐(缩写柔红霉素);和 (7S,9S)-9-乙酰基-7-[(3-氨基-2,3,6-三脱氧-L-来苏-吡喃己糖基)氧基]-7,8,9,10-四氢-6,9,11-三羟基并四苯-5,12-二酮(缩写伊达比星)。优选的药物例如还包括蛋白激酶抑制物,具体包括N-(3-氯-4-氟苯基)-7-甲氧基-6-[3-(4-吗啉基)丙氧基]-4-喹唑啉胺(代码ZD1839);N-(3-乙炔基苯基)-6,7-双(2-甲氧基乙氧基)-4-喹唑啉胺(代码CP358774);N4-(3-溴苯基)-N6-甲基吡啶并[3,4-d]嘧啶-4,6-二胺(代码PD158780);N-(3-氯-4-((3-氟苄基)氧基)苯基)-6-(5-(((2-甲基磺酰基)乙基)氨基)甲基)-2-呋喃基)-4-喹唑啉胺(代码GW 2016);3-[(3,5-二甲基-1H-吡咯-2-基)亚甲基]-1,3-二氢-2H-吲哚-2-酮(代码SU5416);(Z)-3-[2,4-二甲基-5-(2-氧代-1,2-二氢-亚吲哚-3-基甲基)-1H-吡咯-3-基]-丙酸(代码SU6668);N-(4-氯苯基)-4-(吡啶-4-基甲基)酞嗪-1-胺(代码PTK787);(4-溴-2-氟苯基)[6-甲氧基-7-(1-甲基哌啶-4-基甲氧基)喹唑啉-4-基]胺(代码ZD6474);N4-(3-甲基-1H-吲唑-6-基)-N2-(3,4,5-三甲氧基苯基)嘧啶-2,4-二胺(代码GW2286);4-[(4-甲基-1-哌嗪基)甲基]-N-[4-甲基-3-[[4-(3-吡啶基)-2-嘧啶基]氨基]苯基]苯甲酰胺(代码STI-571);(9α,10β,11β,13α)-N-(2,3,10,12,13-六氢-10-甲氧基-9-甲基-1-氧代-9,13-环氧-1H,9H-二吲哚并[1,2,3-gh3’,2’,1’-1m]吡咯并[3,4-j][1,7]benzodiazonin-11-基)-N-甲基苯甲酰胺(代码CGP41251);2-[(2-氯-4-碘苯基)氨基]-N-(环丙基甲氧基)-3,4-二氟苯甲酰胺(代码CI1040);和N-(4-氯-3-(三氟甲基)苯基)-N’-(4-(2-(N-甲基氨甲酰基)-4-吡啶氧基)苯基)脲(代码BAY439006)。优选的药物例如还包括铂抗肿瘤药,具体包括顺式-二氨基二氯化铂(I(缩写顺铂);二氨基(1,1-环丁烷联羧基)铂(I(缩写卡铂);和六氨基二氯双[μ-(1,6-己烷二胺-κNκN)]三-,立体异构体,四硝酸铂(4+)(代码BBR3464)。优选的药物例如还包括epothilones,具体包括4,8-二羟基-5,5,7,9,13-五甲基-16-[(1E)-1-甲基-2-(2-甲基-4-噻唑基)乙烯基]-(4S,7R,8S,9S,13Z,16S)-氧杂环十六碳-13-烯-2,6-二酮(缩写epothiloneD);7,11-二羟基-8,8,10,12,16-五甲基-3-[(1E)-1-甲基-2-(2-甲基-4-噻唑基)乙烯基]-,(1S,3S,7S,10R,11S,12S,16R)-4,17-二氧杂二环[14.1.0]十七烷-5,9-二酮6-二酮(缩写epothilone);和(1S,3S,7S,10R,11S,12S,16R)-7,11-二羟基-8,8,10,12,16-五甲基-3-[(1E)-1-甲基-2-(2-甲基-4-噻唑基)乙烯基]-17-氧杂-4-氮杂双环[14.1.0]十七烷-5,9-二酮(代码BMS247550)。优选的药物例如还包括芳化酶抑制物,具体包括α,α,α’,α’-四甲基-5-(1H-1,2,4-三唑-1-基甲基)-1,3-苯二乙腈(代码ZD1033);(6-亚甲基雄甾-1,4-二烯-3,17-二酮(代码FCE24304);和4,4’-(1H-1,2,4-三唑-1-基亚甲基)双-苄腈(代码CGS20267)。优选的药物例如还包括激素调节物,具体包括2-[4-[(1Z)-1,2-二苯基-1-丁烯基]苯氧基]-N,N-二甲基乙胺(缩写他莫昔芬);[6-羟基-2-(4-羟基苯基)苯并[b]噻吩-3-基][4-[2-(1-哌啶基)乙氧基]苯基]甲酮盐酸盐(代码LY156758);2-(4-甲氧基苯基)-3-[4-[2-(1-哌啶基)乙氧基]苯氧基]苯并[b]噻吩-6-醇盐酸盐(代码LY353381);(+)-7-新戊酰氧基-3-(4’-新戊酰氧基苯基)-4-甲基-2-(4″-(2″’-哌啶子基乙氧基)苯基)-2H-苯并吡喃(代码EM800);(E)-4-[1-[4-[2-(二甲基氨基)乙氧基]苯基]-2-[4-(1-甲基乙基)苯基]-1-丁烯基]苯酚二氢磷酸盐(酯)(代码TAT59);17-(乙酰氧基)-6-氯-2-氧杂孕甾-4,6-二烯-3,20-二酮(代码TZP4238);(+,-)-N-[4-氰基-3-(三氟甲基)苯基]-3-[(4-氟苯基)磺酰基]-2-羟基-2-甲基丙酰胺(代码ZD176334);和 6-D-亮氨酸-9-(N-乙基-L-脯氨酰胺)-10-去甘氨酰胺促黄体生成激素释放因子(pig)(缩写亮丙瑞林)。
在本发明的模型构建中,基因表达数据是从这样的生物样品获得的,即它们的药物敏感性数据已经获得。除了已获得其药物敏感性数据的相同样品之外,基因表达数据也可从其它的样品获得,例如,同时收集的其它样品的等分试样或源自相同来源的样品。举例来说,当已确立的细胞系的基因表达模式已经在先前被确定时,药物敏感性数据就能从分开获得的已确立的细胞系获得,而且,利用基因表达模式,这些数据还可用于本发明中的方法。本发明的模型构建是借助使用至少二种或更多种基因优选五种或更多种基因,更优选十种或更多种基因,更优选二十种或更多(例如,三十种或更多,四十种或更多,或五十种或更多)种基因的表达数据来实现的。
基因表达数据能由任何方法来获得,例如,通过测定RNA水平的方法,如Northern杂交,和定量的或半定量的RT(逆转录)-PCR,或者测定蛋白质水平的方法,如ELISA(酶联免疫吸附测定)和Western印迹。优选用这样一种方法来进行的测量,由这方法可广泛地获得大量的基因表达数据。这样的方法包括使用高密度核酸阵列进行的分析。“高密度核酸阵列”指一种基质,在其上许多核酸已被束缚在一个小区域中。所述核酸可能是DNA或RNA,其可包括人工的或修饰的核苷酸。典型的基质是用玻璃做成的,但也可能是用尼龙,硝化纤维或其它类型的树脂做成的。总之,DNA-束缚的高密度核酸阵列也被称为DNA微阵列。“高密度核酸阵列”指的是一种阵列,在其上束缚的核酸分子的密度通常是每平方厘米约六十个或更高,更优选是每平方厘米约100个或更高,更优选每平方厘米约600个或更高,甚至更优选每平方厘米约1,000个,约5,000个,约10,000个,或约40,000个或更高,最优选每平方厘米100,000个或更高。这里没有对核酸分子的长度上的限制;核酸可能是相对较长的多核苷酸,如cDNA或其片段,或者是寡核苷酸。对于cDNA,被束缚在基质上的核酸的长度通常是100到4000个核苷酸,优选200到4000个核苷酸;对于寡核苷酸,所述核酸的长度通常为15到500个核苷酸,优选30到200个核苷酸,甚至更优选50到200个核苷酸。阵列对本发明特别适合,这是因为由于阵列微小的表面积,各个探针(阵列上的核酸)的杂化条件高度类似,而且大量的探针能同时进行杂化。当由高密度核酸阵列得到的基因表达数据被用于模型构建时,所用的表达数据通常包含100个或更多基因的数据,优选为500个或更多的基因的数据,甚至更优选可为1000或更多(例如,2000个或更多,5000个或更多,或10000个或更多)基因的数据。适合于模型构建的基因可以从许多基因中被选出来。
基因表达数据无论药物的存在与否都可以获得。
此外,基因表达数据在体内或体外都可以获得。体内表达数据可以,例如,通过在液氮中快速冰冻从个体中取出的生物样品,并且用已知的方法提取RNA来获得。以本发明中的模型为基础,就可以达成对生理相关敏感性的预测,所述模型是通过结合使用体内基因表达数据和体内药物敏感性数据而被构建出来的。
根据如上所述的获得的药物敏感性数据和基因表达数据,模型借助部分最小平方法1型被构建出来。分析所用的药物敏感性数据的数目(用于模型构建的生物样品的数目)至少应为两个或更多,优选为十个或更多,更优选为十五或更多,最优选为二十或更多。具体具体药物的抗肿瘤效果和高密度核酸阵列数据之间的相关性能够依照本发明通过分析所述数据而被揭示出来。以分析所得的各基因的基因表达系数(贡献程度)为基础,那些重要的基因被可定量地估定。此外,通过使用分析所得的各基因的表达系数,抗肿瘤效果可从未知样品的基因表达数据而被预测出来。
在构建模型时,最好是从大量的基因表达数据中选出数据。用于数据分析的基因可以通过,例如,预处理高密度核酸阵列数据而被选择,下面介绍这种方法。
i)数据的预处理在供试样品的所有基因相对于标准样品的折叠变化(Fold Change)(FC)值被计算出来后,优选使用那些与分析所用的FC有较高的偏差的基因,以及那些在大多数分析所用的样品中被表达的基因。举例来说,如果基因的FC标准差等于2或更大,而且它们的表达见于用于分析的样品的总数的25%或更多的样品中,那么这基因就可能被使用。
当来自Affymetrix的GeneChip被使用的时候,每件样品的FC值对标准值可依照Affymetrix的微阵列套(Microarray Suite)使用说明(358页)根据下面的方程被计算出来 其中Qc=max(Qcxp,Qbase)AvgDiff Change=AvgDiffexp,k-AvgDiffbase,k在这个方程中,FCk表示基因k的FC值;AvgDiffexp,k,k表示一件试验样品中的基因k的表达水平;AvgDiffbase,k,k表示标准样品中基因k的表达水平;Q表示每个实验中的测量值的背景(噪音);而Qexpand Qbase分别表示受试样品和标准样品的Q值。
ii)统计学处理部分最小平方法1型(PLS1)(Geladi等(1986)Anal.Chim.Acta 1851-17)用作统计方法。PLS1分析可在计算机上进行。可依照上面提到的参考文件中所描述的算法来编写分析软件。
如果需要,基因表达数据和药物敏感性数据可被转换成任何适合于统计学处理的数据格式。此转换包括,例如,标准化和对数变换等。举例来说,当基因表达用DNA微阵列进行分析时,优选使用Xik-XI(Xik表示样品i的基因k的FC值;Xi表示样品i的被选基因的平均FC值)来作为样品i中基因k的表达数据。除此之外,当IC50被当作敏感数据使用时,优选使用log(1/IC50)来进行统计学的处理。
PLS模型的表现评估可通过使用两个指标来进行,一是相关系数的平方R2,二是预测性相关系数的平方Q2。相关系数平方R2和预测性相关系数平方Q2由下列方程定义R2=1-S1/S2S1=Σ(yi-y^i)2]]>S2=∑(yi-y)2这里y和 分别表示y(抗肿瘤效果)的平均值和在模型方程中计算出的yi的值,而yi表示样品i的敏感性值。
Q2=1-S1’/S2’S1’=∑(yi-yi,pred)2S2’=∑(yi-y)2这里y和yi,pred分别表示y(抗肿瘤效果)的平均值和通过排一法(leave-one-out method)在模型方程中预测出的yi值。在排一法中,模型从除一件样品以外的所有样品构建,而且被遗留的样品的预测性y值也被获得。重复这一个程序直到确定所有样品的预测性数值。
大体上,Q2值比R2值更常被用于对模型表现的评估。即,Q2值越接近1.0,模型对未知样品的预测就越好。
iii)通过基因选择实现模型最优化优选使用从一个可得的基因库中选出的最少数量的基因来构建模型。因而,敏感预测所需的基因表达数据的数量可被减少,而且可预测度(Q2)可得到改善。本发明提供一种模型优化的方法,其中上述的模型是通过对每一个包括两套或两套以上基因的组合进行部分最小平方法1型而被构建出来的,且模型的优化是由选择具有最小数量基因和/或较高的Q2值的模型实现的。优选选择对于药物敏感性的贡献程度高的基因。这样的选择可由任何可行的方法实现。举例来说,可以通过在第一步中使用的所有基因,接着选择出系数(贡献程度)的绝对值较高的那些基因来进行模型的构建。更优选的选择方法包括了使用建模能力(MP)的方法。因为建模能力(值)是一个表示每个基因对药物敏感性的贡献程度的指标,所以可假定,有较高值的基因在解释药物敏感性方面有较重要的意义。
ψk=1-Sk/Sk,xSk=[Σ(yik-y^ik)2/(n-A-1)]1/2]]>Skx=[∑(Xik-Xk)2/(n-1)]1/2其中n表示样品的数量;A表示PLS1中组分的数量; 表示当只用第k个基因时算出的在样品i上的抗肿瘤效果值。Xk表示第k个基因的表达数据的平均Fc值,而且Xik表示样品i中基因k的表达数据。
例如,通过只选择那些MP值(Ψk)大于特定值(截留值)的基因并使用这些基因的表达数据来构建出模型。确定截留值,从而可选出,例如,基因总数的大约25%或10%,但不限于此。例如,在本文的实施例中,本发明者通过选择那些MP值大于0.3或大于0.1的基因减少了基因的数量,而且由此成功地增加了模型的可预测性(Q2)的程度。这样,本发明中的模型可通过使用MP进行基因选择来进行优化。
基因选择也优选用系统方法来进行。举例来说,不选择有高贡献度的基因,可通过使用另一种方法来预选基因,以通过使用基因构建模型,然后,就可以通过鉴定基因的组合来进行基因选择,从而构建出优化的模型。此种方法包括了使用遗传算法(GA)的方法。
遗传算法是一种优化方法,它已被用于工程领域。举例来说,这技术使人能够彻底地搜寻Q2值(PLS1模型中的统计数值)最大的基因组合并使所选基因的数量最小。根据遗传算法,首先,制备适当的群体,群体中的每个成员是通过使用评估函数来估定的(在本文中是使Q2值最大化,并使所选基因的数量最小化的函数),然后,有较高的评估值的成员被选出。再后,经过选择、交换和突变,选出的多种成员被人工地转换成具有较高评估值的新成员。这些处理被重复进行以至最终产生了包含具有较高评估值的成员的群体。遗传算法可用根据文献资料准备的可执行程序通过计算机来进行(Rogers等(1994)J.Chem.Inf.Comput.Sci.34854-866)。
对于具体的评估函数,例如,优选使用下面的定义性方程
评估函数=Q2-α*K这里Q2表示PLS1模型中的预测性相关系数的平方;K表示被选基因的数量;α*表示适当的罚值。
此外,本发明涉及到选出那些对药物敏感性的决定有高贡献度的基因的方法,它包含了选出如上述构建地模型中地部分或所有基因组合的步骤,例如,为从模型中选出那些来自基因组合的部分基因,优选选择那些对于1敏感性有高贡献度的基因。为实现这种选择,例如,可选出那些在模型中的系数的绝对值较高的基因。系数愈大,与敏感性的相关性是也愈强。当系数是正的时候,相关性也是正的。因而,基因表达水平越高,敏感性就越高。当系数是负的时候,相关性也是负的。因而,基因表达水平越高,敏感性就越低。对被选基因的数量是没有限制的;举例来说,可选择具有高绝对值的系数的前1,5,10,15,20,50个或100个基因。
此外,优选选择所有用于模型构建的基因组合。可以通过将被选基因的表达数据用于所述模型来得到高度精确的预测性敏感性值。此外,例如,当将选出的基因的数量或它的上界已预先决定时,可以将基因的数量或上界固定下来,并且确定上述GA的评估函数,以使Q2值最大化。通过这种处理,就能构建出具有确定的基因数目的优化模型。
那些被选基因对于预测目的生物样品的药物敏感性程度来说是很有用的。除此之外,这些基因还可以作为药物的靶基因的候选物,因而可被作为药物开发的目标。此外,这些基因可被用作疾病的生物标志,因而有可能通过监视那些标志基因的表达来评估疾病的进程或治疗状况。
iv)抗肿瘤效果的预测敏感性预测可通过测量那些从供试样品中选择出的基因的表达水平来实现,而这种选择所依照的是PLS1模型构建或基因选择技术。本发明提供一个预测供试样品相对特定刺激的敏感性的方法,此方法包含下列步骤(a)从根据本发明的方法所构建的模型样品中获得供试样品的至少一部分基因表达数据;和(b)与敏感性高,模型中具有正系数的基因的表达水平高且模型中具有负系数的基因的表达水平低的事实相关联,并与敏感性低,模型中具有正系数的基因的表达水平低且模型中具有负系数的基因的表达水平高的事实相关联。本发明中的方法使定性和定量的药物敏感性预测都成为可能,特别是用于定量地预测敏感性。用于此处的术语“定量的”预测意味着借助至少三种或更多种类来进行敏感度的预测,优选四种或更多种,更优选五种或更多种,甚至更优选六种或更多种来进行敏感度的预测,并且最优选顺次地进行预测。例如,定量预测包括当敏感性是作为一个的连续值被预测的情况,以及当在敏感度的基础上分类的至少三种或更多种的不连续的种类被预测的情况。
由上所述,正系数表示的与敏感性正相关,而负系数表示与敏感性负相关。因此,可检验试验样品中具有正系数的基因表达和/或具有负系数的基因表达。当具有正系数的基因的表达水平比其在其它样品中的表达水平高时和/或当具有负系数的基因的表达水平比其在其它样品中的表达水平低时,此试验样品被评估为有高度药物敏感性。另一种情况是,当具有正系数的基因的表达水平比其在其它样品中的表达水平低时和/或当具有负系数的基因的表达水平比其它样品中的表达水平高时,此试验样品被评估为有低度药物敏感性。当多个基因的表达被检测的时候,优选加大那些有较高的系数绝对值的表达数据的权重(weight)。例如,依据系数绝对值来加权重可得到一个更精确地预测定量敏感性。
更优选地,本发明关于敏感性预测的方法是一种方法,在其中步骤(a)包括在模型中获得供试样品地基因表达数据的步骤;和步骤(b)包括借助将表达数据用于模型来计算出敏感性的步骤。即,本发明提供一个预测供试样品的敏感性的方法,它包含步骤(a)获得模型(由本发明中的方法构建出的)的所有供试样品的基因表达数据;和(b)以模型为基础,从参数(模型系数)来计算出敏感性值,该参数表示的是基因表达数据和模型的敏感性值之间的相关性。根据以下方程,以与每个基因的系数为基础而计算出的药物敏感性值i的计算的活性=∑(系数k×(Xik-Xi)+y)
这里系数k为表示基因k的系数;Xik表示样品i中基因k的FC值;Xi表示样品i中的被选基因的FC的平均值;而y表示y(抗肿瘤效果)的平均值。
根据上述方程而计算出的敏感性预测值定量地表示可预测度。可选地,可以在以下情况下实现预测当预测性数值大于某一特定值时敏感性就被评估为正的,或当预测性数值等于或小于该特定值时敏感性就被评估为负的。这个阈值可由实验性地测定药物敏感性而被确定。此外,可通过使用根据敏感性对范围赋以常数值,来对敏感性进行分类地估计。例如,用TGI%就可得到本文实施例中显示的分类。因此,本发明的预测方法不仅包括获得由上面的方程算出的预测的敏感性性数值,而且还包括从那个预测的敏感性性数值中衍生出第二级的结果。
生物样品可以,如上述的那样,以敏感性预测的结果为基础而被分类。这一方法包含以下步骤(a)对受试生物样品进行分析实验以得到由本发明中的方法选出的基因的表达水平;(b)依照本发明中的方法由基因表达数据来预测药物敏感性;和(c)以此预测为基础对生物样品进行分类。举例来说,根据预测的敏感性值,试验样品可被分成敏感的和非敏感的组,或可选地根据敏感性分成更小的组。此外,试验样品的敏感度不仅可反映药物敏感性,可能还反映其它特性的差别,因而,这种分类方法在各种不同的分类中是有效的。
除此之外,以敏感预测(它是借助使用来自患者的试验样品而进行的)的结果为基础,疾病就能被诊断出来。这个方法包括以下步骤(a)分析从患者身上获取的受试生物样品中通过本发明中的方法所选出的基因的表达水平;(b)依照本发明中的方法从基因表达数据来预测药物敏感性;和(c)以所述预测为基础来诊断疾病。除了如上所述的分类之外,这个方法还可以诊断出该受试者的病对药物是敏感的还是不敏感的,或者诊断出敏感性的程度。通过预测对各种候选治疗药物的敏感性,就可以评定出对那种疾病最有效的治疗,从而选出最适合所述的治疗。
例如,在一个实施方案中,所述方法包括根据通过本发明的方法计算出的预测性药物敏感性值,确定用或不用所述药物,或者估计药物的剂量,。例如,若针对具体药物的药物敏感性预测值(此值已经依照上述方法被计算出来)是高的,则该药就可用。另一方面,当算出的预测性敏感性值是低时,则不用该药,或者可以将该药与其它治疗方法联用。这种治疗选择可用于优化针对每种疾病类型的治疗,或者用于选择适宜每个患者的治疗方法,尽管有时患者所患的疾病相同。
例如,对于具体患者的疾病,当由上述方法计算出的预测性药物敏感性值高时,就可用该药。另一方面,当算出的预测性敏感性值低时,则不用该药,或者可以将该药与其它治疗方法联用。此外,可以与其它试验或诊断的结果相结合,来综合地判断药物敏感性。到目前为止,采用的标准(uniform)医疗不考虑个体之间的差异,即所谓现成(ready-made)医疗。本发明的上述方法能够以在不同的疾病之间或不同的个体之间的基因表达水平的差异为基础来进行精确的敏感性预测,因而它能够精确地选择治疗、用法(包括用剂量)和治疗方法。作为结果,可以预期,那种对于每位患者来说都有增强地效果的治疗,或那种副作用得到减小的治疗(量身订做的(tailor-made)医疗)将得以实现。
本发明的对敏感性的预测能由使用计算机来达成。举例来说,敏感性是通过使用基因表达水平的相关性方程(来自模型)借助基因表达数据以及通过使用计算机借助敏感性而被预测出来的,且随后显示结果。即,本发明提供预测供试样品对特定刺激的敏感性的计算机设备,它包含(a)储存参数(模型系数)的装置,所述参数代表由上述方法所构建的模型的基因表达数据与敏感性值之间的相关性;(b)将基因表达数据输入所述模型的装置;(c)储存表达数据的装置;(d)根据该模型从表达数据和参数(模型系数)预测性地计算敏感性值的装置;(e)储存预测性计算的敏感性值的装置;和(f)输出预测性计算的敏感性值或从敏感性值所得结果的装置。
上述“参数”(模型系数)意指基因表达相关性方程中的常数,所述方程是从PLS1构建出的模型得出的,具体地说就是,用于预测样品i的敏感性的下面方程中的系数k(基因k的系数)i的计算的活性=∑(系数k×(Xik-Xi)+y)
此外,本发明还涉及执行本发明上述预测敏感性的方法的计算机程序。该程序可用于根据基因表达数据来计算出针对某一具体药物的敏感性的预测值。此外,本发明提供了计算机可读的存储介质,上述的程序就被储存在其中。对本发明的存储介质的类型没有限制,只要它是计算机可读的,包括便携式的和固定的。举例来说,存储介质包括只读CD-ROMs,软盘(FD),MO,DVD,硬盘,半导体存储器等等。上述的程序可被储存于便携式储藏介质中以便销售,或存于联网的计算机的存储装置中以便通过网络来传递到另一个计算机中。
在优选的实施方式中,本发明上述计算机设备包括存于辅助存储设备(如硬盘)中的,用来实施敏感性预测方法的可执行程序。计算机装置还可包括另一个程序,它可控制用来施行敏感性预测方法的可执行程序。
本发明的计算机装置的构造的例子如图7所示。在装置中,输入装置1,输出装置2,存储器6,和中央处理器(CPU)3经由总线5彼此连接。存储器6包含用来执行本发明的处理(任务)的各种程序;计算所需的参数也被储存在其中。中央处理器(CPU)3依照由这些程序提供的指令计算各种不同的数据。这些程序包括根据基因表达数据和上述参数对药物敏感性进行预测性计算的程序,以及用于对上述程序进行控制的程序。这些程序可能还包含将由预测性计算而得到的结果加工成图象数据的程序,或包含根据预测性计算的值给样品分类或选择侯选治疗方法的程序。这些程序可以组合成一个程序。基因表达数据由输入装置1输入计算机。除了通过例如键盘的输入装置将基因表达数据直接输入本发明装置以外,还可以将基因表达数据从便携式存储介质,固定介质例如硬盘,或者通讯网络例如因特网,通过接受装置例如调制解调器传输到计算机内。输入的数据能被储存在计算机的主存储器或临时存储装置4中。中央处理器3进行敏感性的预测性计算,该过程以输入的表达数据为基础并依照由上述的程序提供的指令来进行的。计算出的预测性敏感性值被储存在计算机的存储装置或临时存储装置中,然后经由输出装置直接作为输出量被提供,或作为经过程序处理之后的输出量被提供,以显示基于所述预测性敏感性值为基础的结果。这里输出的意思包括输出至存储介质,通讯介质,显示器,打印机等等。
本发明中的计算机装置能被连接到通讯介质上。因此,装置可经由在线通讯接收基因表达数据,并且返回预侧性敏感性值。举例来说,可将此计算机装置连结到英特网上,以通过网上浏览器来进行在线敏感性预测。
本发明还提供制备探针或引物用来对各基因进行定量或半定量PCR的方法,其包括合成核酸的步骤,所述核酸至少包括十五个连续的核苷酸,所述核苷酸来自编码通过本发明的方法所选出的各个基因的核苷酸序列,其中所述方法用来选择对上述药物敏感性的决定有高度贡献的基因。可通过一个已知的方法,如亚磷酰胺(phosphoamidite)法来合成核酸。产生出的探针或引物可用于分析模型结构中的基因表达水平或者本发明敏感性预测。
本发明还提供产生高密度核酸阵列的方法,包括在底物上固定或产生核酸的步骤,所述核酸至少包括十五个连续的核苷酸,所述核苷酸来自编码通过本发明的方法所选出的各个基因的核苷酸序列,其中所述方法用来选择对上述药物敏感性的决定有高度贡献的基因。先前已知的产生高密度核酸阵列的方法包括将核苷酸聚合在底物上的方法和将多核苷酸结合在底物上的方法,而且这些方法之中的任何一个都能用于本发明。产生出的高密度核酸阵列可用于分析模型结构中的基因表达水平以及本发明的敏感性预测。
上述的探针或引物,或高密度核酸阵列可被作为试剂盒提供出来以供预测药物敏感性之用。本发明提供的试剂盒包括(a)上述的探针或引物,或者高密度核酸阵列;和(b)记录可用于进行对药物的敏感性的预测的信息的存储介质。这些存储介质包括便携式存储介质,如纸,只读光盘和软盘。此外,本发明试剂盒还包括一种包含,例如,通过通讯介质向另外一个存储介质咨询(referring)的指令,使得可使用该试剂盒预测对药物的敏感性。
附图简述

图1显示那些在体外环境中的每个癌细胞系对药物的敏感性,该药物是4-[羟基-(3-甲基-3H-咪唑-4-基)-(5-硝基-7-苯基-苯并呋喃-2-基)-甲基]苯基氰盐酸盐。确定抑制细胞繁殖的50%的浓度(IC5的值)并由log10(1/IC50)表示。
图2显示每种癌细胞系在体内的药物敏感性。显示了异种移植物模型中的肿瘤生长抑制率(TGI%)。
图3显示了IC50预测的结果,它是以受试癌细胞系的基因表达数据为基础并依照PLS1模型而得到的,所述PLS1模型是借助每个癌细胞的体外基因表达数据以及体外药物敏感性数据构建的。该图显示了计算出的预测性IC50的值和由实际的实验所确定的值。闭合圆圈表示用于模型构建的癌细胞(学习样品);开放圆圈表示没被用于模型构建的癌细胞(供试样品)。
图4表示TGI%预测的结果,它是以受试癌细胞系的基因表达数据为基础并依照PLS1模型而得到的,所述PLS1模型是借助每个癌细胞的体外基因表达数据以及体外药物敏感性数据构建的(异种移植物模型中的TGI%值)。该图显示了计算出的预测性TGI%值和由实际的实验所确定的TGI%值。闭合圆圈表示用于模型构建的癌细胞(学习样品);开放圆圈表示没被用于模型构建的癌细胞(供试样品)。
图5显示被分类过的癌细胞的药物敏感性,所述分类是以体内环境中每种癌细胞系对Xeloda的敏感性(TGI%在异种移植物模型中的值)为基础的。
图6显示根据以已经分类的敏感性数据为基础构建的PLS1模型,所得的供试癌细胞的药物敏感性预测的结果。该图表明计算出的敏感性预测得分(计算值)和根据实际的实验确定的TG%进行分类的敏感性得分。闭合圆圈表示用于模型构建的癌细胞(学习样品);开放圆圈表示没被用于模型构建的癌细胞(供试样品的)。
图7显示用于根据基因表达数据进行药物敏感性的预测性计算的计算机装置的范例结构图。
实施发明的最佳方式参考以下实施例具体说明本发明,但不应认为本发明仅限于这些例子。所有在此被引用的出版物的全文都并入本文作为参考。
分析和预测4-[羟基-(3-甲基-3H-咪唑-4-基)-(5-硝基-7-苯基-苯并呋喃-2-基)-甲基]苯基氰盐酸盐在体外或异种移植物模型中的抗肿瘤效果药物敏感性试验通过使用MST-8比色分析法在微滴定板中进行细胞增殖实验,进行体外药物敏感性试验。被使用的人类癌细胞是HCT116,WiDr,COLO201,COLO205,COLO320DM,LoVo,HT29,DLD-1,LS411N,LS513和HCT15;(上述细胞系是结肠癌细胞系);A549,OG56,Calu-1,Calu-3,Calu-6,PC1,PC10,PC13,NCI-H292,NCI-H441,NCI-H460,NCI-H596和NCI-H69(上述细胞系都是肺癌细胞系);MDA-MB-231,MDA-MB-435S,T-47D和Hs578T(上述细胞系都是乳腺癌细胞系);PC-3和DU145(上述细胞系都是前列腺癌细胞系);AsPC-1,Capan-1,Capan-2,BxPC3,PANC-1,Hs766T和MIAPaCa2(上述细胞系都是胰腺癌细胞系);HepG2,Huh1,Huh7和PLC/PRF/5(上述细胞系都是肝癌细胞系);T98G(神经母细胞瘤细胞系);IGROV1(卵巢癌细胞系);C32(黑素瘤细胞系);HT-1197和T24(膀胱癌细胞系);和KG-1a(急性髓细胞性白血病细胞系)。细胞依照由ATCC推荐的标准方法被培养。举例来说,结肠癌细胞系HCT116的细胞在存在上述药物的条件下,以2,000个细胞/每孔的细胞密度接种在96孔板中,所述药物存在于在含有10%牛胎儿血清的MaCoy′s培养基中,并在37℃,含有5%CO2的大气中培养四天。各细胞的IC50值显示在图1中。
体内敏感性试验是在Balb/c nu/nu小鼠(裸鼠)模型中进行的,在该小鼠皮下移植了人癌细胞(异种移植物模型)。使用十五种细胞系。即HCT116,LoVo和COLO320DM(上述细胞系都是结肠癌细胞系);LXFL529,LX-1,NCI-H292,NCI-H460,PC13,PC10和QG56(上述细胞系都是非小细胞肺癌的细胞系);AsPC1和Capan-1(上述细胞系都是胰腺癌细胞系);MAXF401和MX1(上述细胞系都是乳腺癌细胞系);和C32(黑素瘤细胞系)。将2×106个细胞(在0.2ml的Hank’s溶液中,以1×107个细胞/毫升的细胞密度)经皮下移植到裸鼠。在肿瘤被允许生长到300-500mm3的体积之后,肿瘤团块被切除而且被切成小片(3×2×1mm)。使用套管针将单个的肿瘤片经皮下移植到一组有六只6星期大的小鼠中的每只小鼠身上。从移植之后第三天起,药物(200mg/kg)以口服的方式给药,一星期五次,共两个星期。以用药第十四天上肿瘤的平均体积为基础,相对于对未经治疗的组肿瘤生长抑制率确定肿瘤生长抑制率(TGI%),并将其作为体内敏感性(图2)。
基因表达分析使用来自Affymetrix的Genechip U95A人阵列来进行基因表达分析。在对体外表达作分析中,使用那些在75-cm2培养瓶中长为分会合(sub-confluent)的相应细胞,该培养瓶中的培养基(不含药物)与在药物敏感性使验中所用的培养基相同。如下获得总RNA。从瓶子里倾去养基,然后将1ml Sepazol(Nacalai Tesque)直接加入瓶中以裂解细胞。细胞裂解物被转移到15ml的管中,并进一步混合以确保细胞的完全裂解。加入0.2ml的氯仿而且将其与裂解物混合,然后通过离心将水性层与有机层分离开。将上层的水性层转移入另一试管内。加入相等体积的异丙醇而且将其与水性层混合之后,通过离心分离法将RNA回收。为了检测在体内的表达,每种细胞系的2×106个细胞经皮下被移植到每只裸鼠体内。在肿瘤被允许生长到500-800mm3的体积时,从皮下组织上被切除肿瘤组织而且将其放入液氮中迅速冷冻。冷冻肿瘤组织在液氮中磨碎,将每克组织与20ml Sepasol相混合,并有力地混合以裂解细胞。0.2ml氯仿/每毫升Sepasol被加入到混合物中,而且有力地混合。然后通过离心将水性层与有机层分离开。将上层的水性层转移入另一试管内。加入相等体积的异丙醇而且将其与水性层混合之后,通过离心分离法将全部RNA回收。依照Affymetrix(GeneChip技术手册)的方案进行一下内容,合成互补DNA,合成互补RNA,所述合成是通过使用T7 RNA聚合酶进行体外转录,杂交,洗涤以及通过使用抗体进行信号放大进行的。通过整体放大(global scaling)法,以300的靶荧光强度,通过使用来自Affymetrix的Microarray Suite 4.0软件对获得的数据进行标准化。如上所述,依照上述来自Affymetrix的Microarray Suite User Guide(Affymetrix Microarray Suite User Guide,第358页),计算每个样品的FC(倍数变化)值对标准值。
首先,体外IC50被当作敏感性数据使用。在体外样品的分析中,标准数据由对下列23种细胞系的值进行平均来确定HCT116,WiDr,COLO205,COLO320DM,LoVo,DLD-1,HCT15,Calu-6,NCI-H460,QG56,AsPC-1,Capanl,MDA-MB-231,MDA-MB-435S,T47D,PC-3,DU145,LNCap-FGC,HepG2,Huh7,PLC/PRF/5,T98G,和KG-1a。在对体内样品进行的分析中,标准数据由对下列10种细胞系的值进行平均来确定LoVo,LXFL529,LX-1,NCI-H292,NCI-H460,QG56,AsPC1,Capan-1,MAXF401和MX1。
统计学处理体外基因表达数据与体外药物敏感性数据(log(1/IC50)之间的相关性是借助部分最小平方法1型(PLS1)进行分析的.
在对基因表达数据的预处理中,如上所述,计算对于每个基因的供试样品对标准样品的FC值。然后,其FC的标准差等于或大于2的基因,或其表达见于所分析的样品的总数的25%以上的基因将被选出。通过预处理,从总数为12,559的基因中选出1,784个基因。对于被选的1,784个基因,它们的表达数据和药物敏感性数据之间的相关性(log(1/IC50))借助PLS1(见上节“ii)统计学处理”)而被估定。PLS1分析软件是依照已公开的报道(Geladi等(1986)Anal.Chim.Acta 1851-17)中的算法用C语言编写的。
所述处理产生出一个由五个组分组成的模型,其中相关系数的平方(R2)为0.99,而预测性相关系数的平方Q2为0.32。对每个基因算出其建模能力值,然后建模能力值大于0.3的基因被作为重要的基因而选出。建模能力值是依照“统计学处理”中所示的已公开的的报道而被计算出来的。使用入选的152个基因的表达数据和药物敏感性数据(log(1/IC50)),再次地进行PLS1分析,从而产生由五个组分组成的模型,其中相关系数的平方(R2)为0.93,而预测性相关系数的平方(Q2)为0.39。标准差的值是0.27。通过简单的基因选择,如建模能力的选择,预测性相关系数的平方(Q2)显示出有所提高。一种含有152个基因的模型被定为最终模型。
敏感性预测如上选出的有代表性的基因在表1中显示。该数与相关程度相对应——绝对值越大,相关性越强。系数为正的基因的表达水平越高,敏感性将会越高。另一方面,系数为负的基因的表达水平越高,敏感性将会越低。如表1所示,根据选出的系数绝对值较大的基因的表达水平,敏感水平就能被预测出来。此外,通过将模型构建中使用的所有基因的表达数据用于模型,就可以从相应基因的系数中计算出预测性敏感性值。理论上的IC50值是通过被最终模型所鉴定的152个基因的表达数据以及由PLS1确定的系数而算出的,然后将其与实验值相比较(图3)。IC50的理论值是在每个基因的系数的基础上依照下列方程计算出来的i的计算的活性=∑(系数k×(Xik-Xi)+y)
这里系数k表示基因k的系数;Xik表示样品i中基因k的FC值;XI表示样品i中被选基因的平均FC值;y表示y(抗肿瘤效果)的平均值。
IC50的理论值是借助细胞系的基因表达数据(这些数据尚未用于统计学分析中),通过使用所述模型而确定的,然后将该理论值与实验值相比较。结果显示,可预测性很好,因而显示该技术是有效的(图3)。
此外,再次用PLS1(R2=0.99 Q2=0.65,SD=3.87)来分析属于异种移植物组织中鉴定的152个基因中的每个基因以及异种移植物模型中的抗肿瘤活性(即TGI%)。然后,每个基因的系数被重新计算出来。TGI%的理论值是根据该系数以及异种移植物组织中的基因表达数据被计算出来的,然后将其与实验值相比较(图4)。通过使用该模型,TGI%的理论值可通过各种不同的异种移植物组织(其药物敏感性未知)的基因表达数据而被确定。用HCT116,C32,COLO320DM,PC10和PC13的异种移植物模型进行治疗实验。实验结果值和理论上的TGI%值之间的比较,显示可预测性是有效的(图4)。
表1GeneB ank登录号 系数说明M16279 -0.0172 由mAb 12E7,F21和O13识别的抗原X76180 0.0158 钠通道,非电压门控的1αM20560 -0.0154 膜联蛋白A3U17077 0.0149 BENE蛋白X78947 -0.0148 结缔组织生长因子A1445461-0.0144 与跨膜4超家族成员1相似M76125 -0.01 17AXL受体酪氨酸激酶AL0343740.0113 酵母长链聚不饱和脂肪酸延长酶2的同源物Y11307 -0.0111 富含半胱氨酸的血管生成诱导物61[实施例2]在药物敏感性未知的细胞系的异种移植物模型中进行针对Xeloda的抗肿瘤效果的分析和实验药物敏感性试验使用26种细胞系在异种移植物模型中测定Xeloda(capecitabine)的抗肿瘤效果,所述细胞系为DLD-1,LoVo,SW480,COLO201,WiDr和CX-1(上述细胞系都是结肠癌细胞系);QG56,Calu-1,NCI-H441和NCI-H596(上述细胞系都是肺癌细胞系);MDA-MB-231,MAXF401,MCF7,ZR-75-1(上述细胞系都是乳腺癌细胞系);AsPC-1,BxPC-3,PANC-1和Capan-1(上述细胞系都是胰腺癌细胞系);MKN28和GXF97(上述细胞系都是胃癌细胞系);SK-OV-3和Nakajima(上述细胞系都是卵巢癌细胞系);Scaber和T-24(膀胱癌细胞系);Yumoto(子宫癌细胞系);和ME-180(子宫内膜癌细胞系)。治疗实验的实行依下所示。举例来说,在LoVo(结肠癌细胞系)的情况中,将5.5×106个细胞经皮下移植到裸鼠体内。从移植之后的第十五天开始,药物以口服形式按2.1毫摩尔/公斤/每日的剂量给药来自每个组的五只小鼠,一星期服五天;口服给药持续四个星期。以在治疗开始(最后用药以后的那天)之后第二十八天的平均肿瘤体积为基础,测定相对于未经治疗组的肿瘤生长抑制率(TGI%),作为体内敏感性。对于其它细胞系,实验依照相同的方法(图5)进行。
基因表达分析使用DNA微阵列,通过和实施例1相同的方法来进行实验。
统计学处理肿瘤生长抑制率(TGI%)的相应值被转换为分类的得分,即,TGI%≥75,得分=2;50≤TGI%<75,得分=1;TGI%<50,得分=0。
使用上述异种移植物获得的体内数据被当作基因表达数据来使用。在基因表达数据的预处理中,如上所述,FC值被计算出来。然后,其FC的标准差等于或大于2的,或者其表达见于用于该分析的样品总数的25%以上的基因被选出。通过预处理,2,929个基因从整个12,559个基因中被选出。2,929个被选基因的表达数据与被评分的肿瘤生长抑制率之间的相关性通过PLS 1进行分析。分析产生了由五个组分组成的模型,其中,相关系数的平方(R2)为1.00,而且预测性相关系数的平方(Q2)为0.47。计算每个基因的建模能力值(Ψ),然后该值大于0.1基因就被当作对药物敏感性有较高贡献的基因而被选出。通过使用选出的821个基因的表达数据和肿瘤生长抑制率,再进行PLS1分析。分析产生了由五个组分组成的模型,其中,相关系数的平方(R2)为1.00,而且预测性相关系数的平方(Q2)为0.77。通过基因选择,预测性相关系数的平方(Q2)被大幅度地提高了。然后,使用遗传算法以便彻底地在821个基因中寻找Q2值最大且所选基因的数量最少的基因组合。所用的评估函数是如下定义的方程评估函数=Q2-α*K这里Q2表示PLS1模型中的预测性相关系数的平方;K表示被选基因的数量;α表示适当的罚值。
依照已公开的报道(Rogers等(1994)J.Chem.Inf.Comput.Sci.34854-866),遗传算法是在下述情况之下进行的,即个体的数量是400,而且世代数是100。以遗传算法为基础的程序是用C语言编写并且与PLS1分析软件连接。
分析产生了由82个基因和五个组分组成的模型,其中,相关系数的平方(R2)为0.98,而预测性相关系数的平方(Q2)为0.84。标准差的值是O.15。因此,通过在PLS1分析中进行的模型优化,就成功的实现了PLS模型中的被选基因数量的减少和预测值(Q2)的提高。由82个基因组成的模型被定为最终模型。
敏感性预测对每个细胞系的评分(根据82个被鉴定的基因的表达数据,通过计算得出)与实验值符合得很好(图6)。根据该模型,在COLO205(结肠癌细胞系)的异种移植物、MIAPaCa-2(胰腺癌细胞系)的异种移植物和MKN-45(胃癌细胞系)的异种移植物的模型中预测抗肿瘤效果。可预测性非常好,如图6所示。PLS1模型中的被选基因的主要组和系数值分别在表2和3中显示。这些表中包括了作为有积极贡献的因素的胸苷磷酸化酶基因(已知它与Xelodaò的抗肿瘤效果正的相关)的数据,且因此所述选择技术和模型显示为是有效的。
表2GeneBank登录号 系数 说明正因子Z35402 0.0257 钙粘着蛋白1,1型,E-钙粘着蛋白(上皮的)L19783 0.0215 磷脂酰肌醇聚糖,H类AF0687060.0186 适配器相关的蛋白配合物1,γ2亚单位AB0078710.0182 K1AA0411基因产物AF0333820.0167 钾电压门控通道,亚家族F,成员1AF0381980.0161 chordin(CHRD)AB0079330.0154 具有羧基末端PDZ结构域的神经元一氧化氮合酶的配体M63193 0.013胸苷磷酸化酶AC0043810.0126 SA(与大鼠高血压有关的)同源物U22376 0.0117 V-myb鸟原粒细胞瘤病病毒致癌基因同源物M76676 0.0112 白细胞血小板活化因子受体mRNA,完整的cdsZ93096 0.0109 manic fringe(果蝇)同源物AF0549980.0107 未知功能表3GeneBank登录号 系数 说明负因子D90278 -0.0375 癌胚抗原相关的细胞粘附分子3AJ237672 -0.0265,10-亚甲基四氢叶酸还原酶(NADPH)AJ010063 -0.0256 titin-cap(telethonin)M20777 -0.0227 α-2(VI)胶原M65066 -0.0185 蛋白激酶,cAMP-依赖型,调节性,1型,βT92248 -0.0174 子宫珠蛋白
M95925-0.0167神经视网膜亮氨酸拉链Y14153-0.0152含β-转导素重复AF014118 -0.0144膜结合的酪氨酸和苏氨酸特异性cdc2-抑制激酶M60052-0.0141富含组氨酸的钙结合蛋白J05213-0.0131整联蛋白结合的涎蛋白(骨涎蛋白,骨涎蛋白II)X95694-0.0123转录因子AP-2β(活化增强子结合的蛋白2β)D50683-0.0116striatin,钙调蛋白结合蛋白L36463-0.0102ras抑制物X74837-0.0101甘露糖苷酶,α,1A类,成员1工业实用性依照本发明,通过对敏感性未知的少量样品中的基因表达进行彻底的分析,就可以在用药前对每位患者进行抗肿瘤药的治疗效果的预测。因而,本发明使得能够选出对每个患者最适宜的药物(所谓的量身订做的医疗),并用来对改善患者的QOL。
权利要求
1.构建模型的方法,所述模型根据基因的表达水平预测对药物的敏感性,所述方法包含下列步骤(a)获得生物样品的敏感性数据;(b)获得该生物样品的基因表达数据;和(c)利用步骤(a)中所得的所述敏感性数据和步骤(b)中所得的生物样品的所述基因表达数据的至少一部分,借助部分最小平方法-1型构建模型,其中所述模型能够预测生物样品对具体药物的敏感性。
2.根据权利要求1的方法,其中在步骤(c)中,所述模型是通过借助部分最小平方法-1型构建两套或多套基因组合的每一套的模型,并通过选择其中基因数量小的那些模型和/或其Q2值高的那些模型而进行优化的。
3.根据权利要求2的方法,其中在步骤(c)中,所述模型是通过计算代表每个基因的贡献程度的参数,和通过选择具有较大的相对参数的基因而构建的。
4.根据权利要求3的方法,其中代表贡献程度的参数是建模能力值(Ψ)。
5.根据权利要求2的方法,其中在步骤(c)中,所述模型是通过根据遗传算法生成不同的基因组合而构建的。
6.根据权利要求1的方法,其中所述敏感性数据包含生物样品的体外敏感性数据。
7.根据权利要求1的方法,其中所述该敏感性数据包含生物样品的动物实验敏感性数据。
8.根据权利要求1的方法,其中所述敏感性数据包含生物样品的临床敏感性数据。
9.根据权利要求1的方法,其中所述药物选自下列法呢基转移酶抑制物a)6-[氨基-(4-氯-苯基)-(3-甲基-3H-咪唑-4-基)甲基]-4-(3-氯-苯基)-1-甲基-1H-喹啉-2-酮;盐酸盐(代码R115777);b)(R)-2,3,4,5-四氢-1-(1H-咪唑-4-基甲基)-3-(苯基甲基)-4-(2-噻吩基磺酰基)-1H-1,4-苯并二氮杂草-7-甲腈(代码BMS214662);c)(+)-(R)-4-[2-[4-(3,10-二溴-8-氯-5,6-二氢-11H-苯并[5,6]芳庚并[1,2-b]吡啶-11-基)哌啶-1-基]-2-氧代乙基]哌啶-1-甲酰胺(代码SCH66336);d)4-[5-[4-(3-氯苯基)-3-氧代哌嗪-1-基甲基]咪唑-1-基甲基]苄腈(代码L778123);和e)4-[羟基-(3-甲基-3H-咪唑-4-基)-(5-硝基-7-苯基-苯并呋喃-2-基)-甲基]苄腈盐酸盐。
10.根据权利要求1的方法,其中该药物选自下列氟代嘧啶类物质a)[1-(3,4-二羟基-5-甲基-四氢-呋喃-2-基)-5-氟-2-氧代-1,2-二氢-嘧啶-4-基]-氨基甲酸丁基酯(代码capecitabine(Xeloda));b)1-(3,4-二羟基-5-甲基-四氢-呋喃-2-基)-5-氟-1H-嘧啶-2,4-二酮(代码Furtulon);c)5-氟-1H-嘧啶-2,4-二酮(代码5-FU);d)5-氟-1-(四氢-2-呋喃基)-2,4(1H,3H)-嘧啶二酮(代码替加氟);e)替加氟与2,4(1H,3H)-嘧啶二酮的组合物(代码UFT);f)替加氟、5-氯-2,4-二羟基吡啶与四氢吡喃2羧酸钾的组合物(摩尔比1∶0.4∶1)(代码S-1);和g)5-氟-N-己基-3,4-二氢-2,4-二氧代-1(2H)-嘧啶甲酰胺(代码卡莫氟)。
11.根据权利要求1的方法,其中该药物选自下列紫杉烷类物质a)[2aR-[2aα,4β,4aβ,6β,9α(αR*,βS*),11α,12α,12aα,12bα]]-β-(苯甲酰氨基)-α-羟基苯丙酸6,12b-双(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-4,11-二羟基-4a,8,13,13-四甲基-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码紫杉醇);b)[2aR-[2aα,4β,4aα,6β,9α(αR*,βS*,11α,12α,12aα,12bα)]]-β-[[(1,1-二甲基乙氧基)羰基]氨基]-α-羟基苯丙酸12b-(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-4,6,11-三羟基-4a,8,13,13-四甲基-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码多西他赛);c)(2R,3S)-3-[[(1,1-二甲基乙氧基)羰基]氨基]-2-羟基-5-甲基-4-己烯酸(3aS,4R,7R,8aS,9S,10aR,12aS,12bR,13S,13aS)-7,12a-双(乙酰氧基)-13-(苄氧基)-3a,4,7,8,8a,9,10,10a,12,12a,12b,13-十二氢-9-羟基-5,8a,14,14-四甲基-2,8-二氧代-6,13a-亚甲基-13aH-氧杂环丁烷并[2”,3”5’,6’]苯并[1’,2’4,5]芳癸并[1,2-d]-1,3-二氧代-4-基酯(代码IDN 5109);d)(2R,3S)-β-(苯甲酰氨基)-α-羟基苯丙酸(2aR,4S,4aS,6R,9S,11S,12S,12aR,12bS)-6-(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-4,11-二羟基-12b-[(甲氧基羰基)氧基]-4a,8,13,13-四甲基-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码BMS 188797);和e)(2R,3S)-β-(苯甲酰氨基)-α-羟基苯丙酸(2aR,4S,4aS,6R,9S,11S,12S,12aR,12bS)-6,12b-双(乙酰氧基)-12-(苯甲酰氧基)-2a,3,4,4a,5,6,9,10,11,12,12a,12b-十二氢-11-羟基-4a,8,13,13-四甲基-4-[(甲硫基)甲氧基]-5-氧代-7,11-亚甲基-1H-芳癸并[3,4]苯并[1,2-b]氧杂环丁烷-9-基酯(代码BMS 184476)。
12.根据权利要求1的方法,其中该药物选自下列喜树碱类物质a)4(S)-乙基-4-羟基-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮(缩写喜树碱);b)[1,4’-联哌啶]-1’-羧酸,(4S)-4,11-二乙基-3,4,12,14-四氢-4-羟基-3,14-二氧代-1H-比喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-9-基酯,单盐酸盐(代码CPT-11);c)(4S)-10-[(二甲基氨基)甲基]-4-乙基-4,9-二羟基-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮单盐酸盐(缩写拓扑替康);d)(1S,9S)-1-氨基-9-乙基-5-氟-9-羟基-4-甲基-2,3,9,10,13,15-六氢-1H,12H-苯并[de]吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-10,13-二酮(代码DX-8951f);e)5(R)-乙基-9,10-二氟-1,4,5,13-四氢-5-羟基-3H,15H-氧杂卓并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,15-二酮(代码BN-80915);f)(S)-10-氨基-4-乙基-4-羟基-1H-吡喃并[3’,4’6,7]吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮(代码9-氨基喜树碱);g)4(S)-乙基-4-羟基-10-硝基-1H-吡喃并[3’,4’,6,7]-吲嗪并[1,2-b]喹啉-3,14(4H,12H)-二酮(代码9-硝基喜树碱)。
13.根据权利要求1的方法,其中该药物选自下列核苷类似物抗肿瘤药a)2’-脱氧-2’,2’-二氟胞苷(代码DFDC);b)2’-脱氧-2’-次甲基胞苷(代码DMDC);c)(E)-2’-脱氧-2’-(氟亚甲基)胞苷(代码FMDC);d)1-(β-D-阿拉伯呋喃糖基)胞嘧啶(代码Ara-C);e)4-氨基-1-(2-脱氧-β-D-赤藓-呋喃戊糖基)-1,3,5-三嗪-2(1H)-酮(缩写地西他滨);f)4-氨基-1-[(2S,4S)-2-(羟基甲基)-1,3-二氧戊环-4-基]-2(1H)-嘧啶酮(缩写troxacitabine);g)2-氟-9-(5-O-膦酰基-β-D-阿拉伯呋喃糖基)-9H-嘌呤-6-胺(缩写氟达拉滨);和h)2-氯-2’-脱氧腺苷(缩写克拉屈滨)。
14.根据权利要求1的方法,其中该药物选自下列多拉他汀类物质a)N,N-二甲基-L-缬氨酰-N-[(1S,2R)-2-甲氧基-4-[(2S)-2-[(1R,2R)-1-甲氧基-2-甲基-3-氧代-3-[[(1S)-2-苯基-1-(2-噻唑基)乙基]氨基]丙基]-1-吡咯烷基]-1-[(1S)-1-甲基丙基]-4-氧代丁基]-N-甲基-L-缬氨酰胺(缩写多拉他汀10);b)环[N-甲基丙氨酰-(2E,4E,10E)-15-羟基-7-甲氧基-2-甲基-2,4,10-十六碳三烯酰基-L-缬氨酰-N-甲基-L-苯基丙氨酰-N-甲基-L-缬氨酰-N-甲基-L-缬氨酰-L-脯氨酰-N2-甲基天冬氨酰](缩写多拉他汀14);c)(1S)-1-[[(2S)-2,5-二氢-3-甲氧基-5-氧代-2-(苯基甲基)-1H-吡咯-1-基]羰基]-2-甲基丙基酯N,N-二甲基-L-缬氨酰-L-缬氨酰-N-甲基-L-缬氨酰-L-脯氨酰-L-脯氨酸(缩写多拉他汀15);d)N,N-二甲基-L-缬氨酰-N-[(1S,2R)-2-甲氧基-4-[(2S)-2-[(1R,2R)-1-甲氧基-2-甲基-3-氧代-3-[(2-苯基乙基)氨基]丙基]-1-吡咯烷基]-1-[(1S)-1-甲基丙基]-4-氧代丁基]-N-甲基-L-缬氨酰胺(代码TZT 1027);和e)N,N-二甲基-L-缬氨酰-L-缬氨酰-N-甲基-L-缬氨酰-L-脯氨酰-N-(苯基甲基)-L-脯氨酰胺(缩写cemadotin)。
15.根据权利要求1的方法,其中该药物选自下列蒽环类物质a)(8S,10S)-10-[(3-氨基-2,3,6-三脱氧-L-来苏-吡喃己糖基)氧基]-7,8,9,10-四氢-6,8,11-三羟基-8-(羟基乙酰基)-1-甲氧基并四苯-5,12-二酮盐酸盐(缩写阿霉素);b)(8S,10S)-10-[(3-氨基-2,3,6-三脱氧-L-阿拉伯-吡喃己糖基)氧基]-7,8,9,10-四氢-6,8,11-三羟基-8-(羟基乙酰基)-1-甲氧基并四苯-5,12-二酮盐酸盐(缩写表柔比星);c)8-乙酰基-10-[(3-氨基-2,3,6-三脱氧-L-来苏-吡喃己糖基)氧基]-7,8,9,10-四氢-6,8,11-三羟基-1-甲氧基并四苯-5,12-二酮,盐酸盐(缩写柔红霉素);和d)(7S,9S)-9-乙酰基-7-[(3-氨基-2,3,6-三脱氧-L-来苏-吡喃己糖基)氧基]-7,8,9,10-四氢-6,9,11-三羟基并四苯-5,12-二酮(缩写伊达比星)。
16.根据权利要求1的方法,其中该药物选自下列蛋白激酶抑制物a)N-(3-氯-4-氟苯基)-7-甲氧基-6-[3-(4-吗啉基)丙氧基]-4-喹唑啉胺(代码ZD 1839);b)N-(3-乙炔基苯基)-6,7-双(2-甲氧基乙氧基)-4-喹唑啉胺(代码CP358774);c)N4-(3-溴苯基)-N6-甲基吡啶并[3,4-d]嘧啶-4,6-二胺(代码PD158780);d)N-(3-氯-4-((3-氟苄基)氧基)苯基)-6-(5-(((2-甲基磺酰基)乙基)氨基)甲基)-2-呋喃基)-4-喹唑啉胺(代码GW 2016);e)3-[(3,5-二甲基-1H-吡咯-2-基)亚甲基]-1,3-二氢-2H-吲哚-2-酮(代码SU5416);f)(Z)-3-[2,4-二甲基-5-(2-氧代-1,2-二氢-亚吲哚-3-基甲基)-1H-吡咯-3-基]-丙酸(代码SU6668);g)N-(4-氯苯基)-4-(吡啶-4-基甲基)酞嗪-1-胺(代码PTK787);h)(4-溴-2-氟苯基)[6-甲氧基-7-(1-甲基哌啶-4-基甲氧基)喹唑啉-4-基]胺(代码ZD6474);i)N4-(3-甲基-1H-吲唑-6-基)-N2-(3,4,5-三甲氧基苯基)嘧啶-2,4-二胺(代码GW2286);j)4-[(4-甲基-1-哌嗪基)甲基]-N-[4-甲基-3-[[4-(3-吡啶基)-2-嘧啶基]氨基]苯基]苯甲酰胺(代码STI-571);k)(9α,10β,11β,13α)-N-(2,3,10,12,13-六氢-10-甲氧基-9-甲基-1-氧代-9,13-环氧-1H,9H-二吲哚并[1,2,3-gh3’,2’,1’-1m]吡咯并[3,4-j][1,7]benzodiazonin-11-基)-N-甲基苯甲酰胺(代码CGP41251);1)2-[(2-氯-4-碘苯基)氨基]-N-(环丙基甲氧基)-3,4-二氟苯甲酰胺(代码CI1040);和m)N-(4-氯-3-(三氟甲基)苯基)-N’-(4-(2-(N-甲基氨甲酰基)-4-吡啶氧基)苯基)脲(代码BAY439006)。
17.根据权利要求1的方法,其中该药物选自下列铂抗肿瘤药a)顺式-二氨基二氯化铂(II)(缩写顺铂);b)二氨基(1,1-环丁烷联羧基)铂(II)(缩写卡铂);和c)六氨基二氯双[μ-(1,6-己烷二胺-κNκN)]三-,立体异构体,四硝酸铂(4+)(代码BBR3464)。
18.根据权利要求1的方法,其中该药物选自下列epothilonesa)4,8-二羟基-5,5,7,9,13-五甲基-16-[(1E)-1-甲基-2-(2-甲基-4-噻唑基)乙烯基]-(4S,7R,8S,9S,13Z,16S)-氧杂环十六碳-13-烯-2,6-二酮(缩写epothilone D);b)7,11-二羟基-8,8,10,12,16-五甲基-3-[(1E)-1-甲基-2-(2-甲基-4-噻唑基)乙烯基]-,(1S,3S,7S,10R,11S,12S,16R)-4,17-二氧杂二环[14.1.0]十七烷-5,9-二酮6-二酮(缩写epothilone);和c)(1S,3S,7S,10R,11S,12S,16R)-7,11-二羟基-8,8,10,12,16-五甲基-3-[(1E)-1-甲基-2-(2-甲基-4-噻唑基)乙烯基]-17-氧杂-4-氮杂双环[14.1.0]十七烷-5,9-二酮(代码BMS247550)。
19.根据权利要求1的方法,其中该药物选自下列芳化酶抑制物a)α,α,α’,α’-四甲基-5-(1H-1,2,4-三唑-1-基甲基)-1,3-苯二乙腈(代码ZD1033);b)(6-亚甲基雄甾-1,4-二烯-3,17-二酮(代码FCE24304);和c)4,4’-(1H-1,2,4-三唑-1-基亚甲基)双-苄腈(代码CGS20267)。
20.根据权利要求1的方法,其中该药物选自下列激素调节物a)2-[4-[(1Z)-1,2-二苯基-1-丁烯基]苯氧基]-N,N-二甲基乙胺(缩写他莫昔芬);b)[6-羟基-2-(4-羟基苯基)苯并[b]噻吩-3-基][4-[2-(1-哌啶基)乙氧基]苯基]甲酮盐酸盐(代码LY156758);c)2-(4-甲氧基苯基)-3-[4-[2-(1-哌啶基)乙氧基]苯氧基]苯并[b]噻吩-6-醇盐酸盐(代码LY353381);d)(+)-7-新戊酰氧基-3-(4’-新戊酰氧基苯基)-4-甲基-2-(4″-(2-哌啶子基乙氧基)苯基)-2H-苯并吡喃(代码EM800);e)(E)-4-[1-[4-[2-(二甲基氨基)乙氧基]苯基]-2-[4-(1-甲基乙基)苯基]-1-丁烯基]苯酚二氢磷酸盐(酯)(代码TAT59);f)17-(乙酰氧基)-6-氯-2-氧杂孕甾-4,6-二烯-3,20-二酮(代码TZP4238);g)(+,-)-N-[4-氰基-3-(三氟甲基)苯基]-3-[(4-氟苯基)磺酰基]-2-羟基-2-甲基丙酰胺(代码ZD176334);和h)6-D-亮氨酸-9-(N-乙基-L-脯氨酰胺)-10-去甘氨酰胺促黄体生成激素释放因子(pig)(缩写亮丙瑞林)。
21.根据权利要求1的方法,其中所述生物样品是癌细胞或癌细胞系。
22.根据权利要求1的方法,其中所述敏感性包含抗肿瘤效果。
23.根据权利要求1的方法,其中所述基因表达数据包含高密度核酸阵列数据。
24.选择对生物敏感性有高度贡献的基因的方法,所述方法包含在由根据权利要求1或2的方法所构建的模型中选择部分或全部基因组合的步骤。
25.预测供试样品对具体的刺激的敏感性的方法,所述方法包含下列步骤(a)从根据权利要求1的方法所构建的模型样品中获得供试样品的至少一部分基因表达数据;和(b)与敏感性高,模型中具有正系数的基因的表达水平高且模型中具有负系数的基因的表达水平低的事实相关联,并与敏感性低,模型中具有正系数的基因的表达水平低且模型中具有负系数的基因的表达水平高的事实相关联。
26.根据权利要求25的方法,其中步骤(a)包含获得供试样品的模型中的基因表达数据的步骤;和步骤(b)包含通过将表达数据应用于该模型来计算敏感性的步骤。
27.预测供试样品对具体刺激的敏感性的计算机设备,所述设备包括(a)将参数储存在根据权利要求1的方法所构建的模型中的装置,所述参数代表基因表达数据与敏感性值之间的关系的参数(模型系数);(b)将基因表达数据输入该模型的装置;(c)储存所述表达数据的装置;(d)根据该模型,从所述表达数据和所述参数(模型系数)预测性地计算敏感性值的装置;(e)储存预测性地计算的敏感性值的装置;和(f)输出预测性地计算的敏感性值或从敏感性值所获得结果的装置。
28.产生高密度核酸阵列的方法,所述方法包括在载体上固定或生成包含至少15个核苷酸的核酸的步骤,所述核苷酸包含在通过权利要求24的方法所选出的各个基因的核苷酸序列中。
29.产生用于根据权利要求24的方法所选出的各个基因的定量或半定量PCR的探针或引物的方法,所述方法包括合成包含至少15个核苷酸的核酸的步骤,所述核苷酸包含在编码各个基因的核苷酸序列中。
30.试剂盒,包括(a)高密度核酸阵列,或者用于定量或半定量PCR的探针或引物,其中所述阵列、探针或引物包含含有至少15个核苷酸的核酸,所述核苷酸来自编码根据权利要求24的方法所选出的各个基因的核苷酸序列;和(b)储存介质,其记录了利用所述阵列或者所述探针或所述引物预测的对药物的敏感性。
全文摘要
根据药物敏感性和大量基因表达数据,利用部分最小平方法-1型借助多变量分析构建模型。进而,利用建模能力和遗传算法优化该模型。因而,测定各个基因对药物敏感性的贡献程度,以选择具有高度贡献的基因。另外,分析样品中的基因表达的水平,然后根据该模型预测药物敏感性。所预测的值与实验性测定的那些药物敏感性值吻合良好。由本发明所提供的药物敏感性预测方法能够利用少量与疾病例如癌症有关的样品,在给药之前评估药物的有效性。由于该方法能够选择最适合于每名患者的药物,本发明对于提高患者的生活质量(QOL)非常有用。
文档编号G01N33/574GK1625602SQ02828958
公开日2005年6月8日 申请日期2002年3月13日 优先权日2002年3月13日
发明者青木裕子, 长谷川清, 石井畅也, 森一茂 申请人:霍夫曼-拉罗奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1