癌症种类的评价方法

文档序号:5863534阅读:351来源:国知局
专利名称:癌症种类的评价方法
技术领域
本发明涉及利用血液(血浆)中的氨基酸浓度的癌症种类的评价方法。
背景技术
在2004年中,日本因癌症而死亡的人数中,男性为193075人,女性为127259人, 为死亡总人数的第1位。早期癌症的5年存活率为80%以上,而进展的癌症的5年存活率 为10%左右,极低,当然这也根据癌症的种类而不同。因此,早期发现对于癌症治愈来说是 很重要的。这里,例如大肠癌的诊断有通过免疫学大便潜血反应进行的诊断、通过大肠内窥 镜进行的大肠活检等。但是,通过便潜血进行的诊断并不能确诊,发现者几乎都为假阳性。另外,在早期 大肠癌中,通过便潜血进行的诊断中,有检出灵敏度和检出特异度均更为降低的担忧。特别 是右侧结肠的早期癌症在通过便潜血进行的诊断中有很多漏检。另外,CT、MRI、PET等的图 像诊断对于大肠癌的诊断不适用。而经大肠内窥镜的大肠活检可以确诊,但是是侵袭度高的检查,在筛查阶段进行 内窥镜检查是不现实的。并且,在象大肠活检这样的侵袭性诊断中,患者有伴随痛苦等的负 担,也可能发生检查导致的出血等的风险。因此,从对患者的身体负担以及费用与效果的角度考虑,优选缩小筛选范围至大 肠癌发病可能性高的被验者,以这些人作为治疗的对象。具体来说,优选用侵袭少的方法选 择被验者,通过对选择的被验者实施大肠内窥镜来缩小被验者范围,以确诊为大肠癌的被 验者作为治疗的对象。例如肺癌的诊断有X射线照相、CT、MRI、PET等的图像诊断、痰细胞诊断、经支气 管镜的肺活检、经皮穿刺的肺活检、试验开胸或经胸腔镜的肺活检等。但是,图像诊断并不能确诊。例如,进行胸部X射线检查(间接拍摄)时,发现率 为20 %,而特异度为0. 1 %,发现者几乎均为假阳性。进行胸部X射线检查时,检出灵敏度 也低,厚生劳动省的研究结果报告称约80%的肺癌发病者被漏检。特别是在早期肺癌中, 图像诊断有检出灵敏度和检出特异度均更为降低的担忧。胸部X射线检查还有被验者暴露 于放射线的问题。在设备或成本方面,CT、MRI、PET等的图像诊断在团体体检中实施时会有 问题。进行痰细胞诊断时,只有2 3成的患者可以确诊。另一方面,支气管镜、经皮穿刺、试验开胸和经胸腔镜肺活检可以确诊,但这是侵 袭度高的检查,对图像诊断怀疑有肺癌的患者全体实行并不现实。并且,在这样的侵袭性诊 断中,患者有伴随痛苦等的负担,也可能发生检查导致的出血等的风险。因此,从对患者的身体负担以及费用与效果的角度考虑,优选缩小筛选范围至肺 癌发病可能性高的被验者,以这些人作为治疗的对象。具体来说,优选用侵袭少的方法选择 被验者,通过对选择的被验者实施肺活检来缩小被验者范围,以确诊为肺癌的被验者作为 治疗的对象。
例如乳癌的诊断有自检、乳房触视诊、乳房X线照相术、CT、MRI、PET等的图像诊断、穿刺活检等。但是自检或触视诊、图像诊断并不能确诊。特别是自检并没有使乳癌死亡率降低 这样的效果。另外,自检并不像乳房X线照相术检查这样的定期性筛查那样可以发现很多 早期癌症。早期的乳癌中,自检或触视诊、图像诊断有检出灵敏度和检出特异度均更为降低 的担忧。通过乳房X线照相术进行的图像诊断也有被验者暴露于放射线或过剩诊断(過剰 診断)的问题。在设备或成本方面,CT、MRI、PET等的图像诊断在团体体检中实施会有问 题。另一方面,穿刺活检可以确诊,但这是侵袭度高的检查,对图像诊断怀疑有乳癌的 患者全体实行并不现实。并且,在穿刺活检这样的侵袭性诊断中,患者有伴随痛苦等的负 担,也可能发生检查导致的出血等的风险。通常乳癌的检查除自检外在很多的情况下都会使被验者感到精神上的痛苦。因此,从对患者的身体负担 精神负担以及费用与效果的角度考虑,优选缩小筛选 范围至乳癌发病可能性高的被验者,以这些人作为治疗的对象。具体来说,优选用精神痛苦 少或侵袭少的方法选择被验者,通过对选择的被验者实施穿刺活检来缩小被验者范围,以 确诊为乳癌的被验者作为治疗的对象。例如胃癌的诊断有胃蛋白酶原检查、X射线检查(间接拍摄)、胃内窥镜检查、肿 瘤标志物诊断等。但是,胃蛋白酶原检查、X射线检查、肿瘤标志物诊断并不能确诊。例如采用胃蛋 白酶原检查时,虽然侵袭性低,但关于灵敏度则是各有不同的报告,大约为40 85 %,特异 度为70 85%。但是,采用胃蛋白酶原检查时,要精密检查率为20%,可以认为漏检多。 另外,采用X射线检查时,关于灵敏度各有不同的报告,大约为70 80%,特异度为85 90%。但是,采用X射线检查时,可能有钡餐带来的副作用或暴露于放射线的可能性。采取 肿瘤标志物诊断时,目前尚未存在对胃癌的存在诊断有效的肿瘤标志物。而胃内窥镜检查可以确诊,但这是侵袭度高的检查,在筛查阶段进行胃内窥镜检 查是不现实的。并且,在象胃内窥镜检查这样的侵袭性诊断中,患者有伴随痛苦等的负担, 也可能发生检查导致的出血等的风险。因此,从对患者的身体负担以及费用与效果的角度考虑,优选缩小筛选范围至胃 癌发病可能性高的被验者,以这些人作为治疗的对象。具体来说,优选用灵敏度和特异度高 的方法选择被验者,通过对选择的被验者实施胃内窥镜检查来缩小被验者范围,以确诊为 胃癌的被验者作为治疗的对象。另外,还有例如象胰腺癌等难以早期发现的癌症。胰腺癌的情形,多是主述自觉症状后经精密检查确诊为胰腺癌,很多情况成为进
展期的癌症。因此,从对患者的身体负担以及费用与效果的角度考虑,优选通过适当的筛查缩 小筛选范围至胰腺癌发病可能性高的被验者,以这些人作为治疗的对象。具体来说,优选用 灵敏度和特异度高的方法选择被验者,通过对选择的被验者实施精密检查来缩小被验者范 围,以确诊为胰腺癌的被验者作为治疗的对象。另外,在实施上述癌症患者的筛查时,目前是针对每种的癌症采用特异性的诊断方法来进行。 已知血液中的氨基酸浓度根据癌症发病而变化。例如根据Cynober的报道(非专 利文献1),例如由于谷氨酰胺主要作为氧化能量源、精氨酸作为氮氧化物或多胺的前体,它 们激活癌细胞摄入甲硫氨酸的能力,甲硫氨酸在各种癌细胞中的消耗量增加。根据Vissers 等人(非专利文献2)或Park (非专利文献3)的报道,大肠癌患者的血浆中氨基酸组成与 健康人不同,根据Proenza等人(非专利文献4)或Cascino (非专利文献5)的报道,乳癌 患者的血浆中氨基酸组成与健康人不同。另外,专利文献1中公开了 通过以血液中氨基酸 浓度为变数的多变量判别式来评价有否肺癌的方法。由此,可以判别肺癌和非肺癌的状态。 专利文献2或专利文献3公开了 氨基酸浓度与生物状态(biologicalstate)相关联的方 法。专利文献1 国际公开第2008/016111号专利文献2 国际公开第2004/052191号专利文献3 国际公开第2006/098192号__专禾Il文献 1 Cynober, L. ed.,Metabolic and therapeutic aspects ofamino acids in clinical nutrition. 2nd ed. , CRC Press非专利文献 2 :Vissers, Y. LJ.等人’ Plasma arginine concentrationare reduced in cancer patients :evidence for arginine deficiency ? , TheAmerican Journal of Clinical Nutrition,2005 81,1142-1146 页非专禾Ij 文献 3:Park,K.G.等人,Arginine metabolism in benign andmaglinant disease of breast and colon :evidence for possible inhibition oftumor-infiltrating macropharges.,Nutrition,19917,185-188 页非专禾丨J文献 4 :Proenza, Α. Μ. , J. Oliver, Α. Palou and P. Roca, Breast and lung cancer are associated with a decrease in blood cell aminoacid content. , J Nutr Biochem,2003. 14(3),133-8 页__ 专禾1J 文 5 Cascino, Α.,Μ. Muscaritoli, C. Cangiano, L. Conversano, Α. Laviano,S. Ariemma,Μ. Μ. Meguid and F. Rossi Fanelli,Plasma amino acid imbalance in patients with lung and breastcancer. , Anticancer Res,1995. 15(2),507-10 页

发明内容
发明所要解决的课题但是,目前为止存在的问题是,以多种氨基酸为变数来诊断癌症种类的技术的开 发从时间和利益的角度考虑并未得到进行,未得到实际应用。具体来说,存在以下的问题 癌症患者的筛查中,同时实施多种检查时,检查成本增高,根据实施内容,有被验者受到限 制的时间或需要饮食限制等的时间较长等。另外,具体来说,存在以下的问题专利文献1 中可以判别肺癌和非肺癌的状态,但对于“非肺癌的状态就是没有罹患癌症吗”或“是否有 另一种癌症发病”无法进行评价。另外,还有以下的问题专利文献2或专利文献3中公开 的指标式无法对于“没有罹患癌症吗”或“是否有另一种癌症发病”进行评价。本发明针对上述问题而设,其目的在于提供利用血液中的氨基酸浓度中与各种癌 症的状态相关的氨基酸浓度可以高精度地评价癌症的种类的癌症种类的评价方法。具体来说,其目的在于提供以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患的可能性高的被验者,结果可以减轻被验者的时间、身体以及金钱方面上的负担的癌症种类的评价 方法。具体来说,其目的在于,根据多种氨基酸的浓度或以该氨基酸的浓度为变数的含有 1个或多个判别式的判别式组,可以高精度地评价某个检体是否有癌症发病,或者有癌症发 病时,该发病部位在哪里,结果,提供可实现检查的高效化或高精度化的癌症种类的评价方 法。解决课题的手段本发明人等为解决上述课题进行了深入的研究,结果发现鉴定对于各种癌症和 非癌症的多组判别有用的氨基酸,同时进一步以含有所鉴定的氨基酸浓度为变数的由1个 或多个多变量判别式构成的多变量判别式组(指标式组、相关式组)与癌症的状态(具体 来说,是癌症的发病部位)具有显著相关,从而完成了本发明。即,为解决上述课题并达到目的,本发明所述的癌症种类的评价方法的特征在于, 该方法包括下述步骤测定步骤,针对从评价对象采集到的血液测定关于氨基酸浓度值的 氨基酸浓度数据;浓度值基准评价步骤,根据在上述测定步骤中测定的上述评价对象的上 述氨基酸浓度数据中所含的6111、484、¥&1、]^1 1~0、?1^、1111~、116、1^11、见8中的至少一种 氨基酸的上述浓度值,对于上述评价对象评价癌症的种类。本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价 方法中,上述浓度值基准评价步骤进一步包括下述浓度值基准判别步骤根据在上述测定 步骤中测定的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、 Thr、Ile、Leu、HiS中的至少一种氨基酸的上述浓度值,对于上述评价对象,从大肠癌、乳癌、 前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种上述癌症中判别其是哪一种上述癌 症。本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价 方法中,上述浓度值基准判别步骤是对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺 癌、肺癌中的至少3种上述癌症中判别其是哪一种上述癌症。本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价 方法中,上述浓度值基准评价步骤进一步包括下述步骤判别值计算步骤,根据在上述测定 步骤中测定的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、 Thr、Ile、LeU、His中的至少一种氨基酸的上述浓度值以及以上述氨基酸的浓度为变数的预 先设定的由1个或多个多变量判别式构成的多变量判别式组,通过构成该多变量判别式组 的每个上述多变量判别式,计算该多变量判别式的值即判别值;判别值基准评价步骤,根据 在上述判别值计算步骤中算出的由1个或多个上述判别值构成的判别值组,对于上述评价 对象评价上述癌症的种类,构成上述多变量判别式组的各上述多变量判别式含有Glu、ABA、 Val、Met、Pro、Phe、Thr, lie、Leu、His中的至少一种氨基酸作为上述变数。本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价 方法中,上述判别值基准评价步骤进一步包括下述判别值基准判别步骤根据上述判别值 组,对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2 种上述癌症中判别其是哪一种上述癌症。本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价方法中,上述判别值基准判别步骤是对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺 癌、肺癌中的至少3种上述癌症中判别其是哪一种上述癌症。本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价 方法中,构成上述多变量判别式组的各上述多变量判别式为分数式、逻辑回归式、线性判 别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析 (Canonical Discriminant Analysis)制作的公式、由决策树制作的公式的任意一种。 本发明所述的癌症种类的评价方法的特征还在于,在上述记载的癌症种类的评价 方法中,上述多变量判别式组为下述的判别式组1 16的任意一组[判别式组 1]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、His、Orn, Lys、Arg作为上述变数的5个线性1次式;[判别式组 2]以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp, Orn, Lys 作为上述变数的4个线性1次式;[判别式组 3]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Leu、Phe、His、Arg 作为上述变数的4个线性1次式;[判别式组4]以年龄、性别、1111~、6111、?1~0、六8六、¥31^6仏116、1^11、?1^、见8作为 上述变数的4个线性1次式;[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线 性1次式;[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 作为上述变数 的3个线性1次式;[判别式组 7]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、Orn、Arg作为上述变数的4个线性1次式;[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线 性1次式;[判别式组9]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe、Arg 作为上述 变数的3个线性1次式;[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为上述变数的3个线 性1次式;[判别式组11]以年龄、Cit、ABA、Val、Met作为上述变数的2个线性1次式;[判别式组12]以年龄、Thr、Glu、Pr0、Met、Phe作为上述变数的2个线性1次式;[判别式组 13]以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、 Tyr, Phe、His、Trp, Orn, Lys、Arg作为上述变数的2个线性1次式;[判别式组14]以Glu、Gin、ABA、Val、lie、Phe、Arg作为上述变数的2个线性1 次式;[判别式组15]以Thr、Glu、Gin、ABA、lie、Leu、Arg作为上述变数的2个线性1
次式;[判别式组16]以 Thr、Gin、Ala、Cit、ABA、lie、His、Orn、Arg 作为上述变数的 2
个分数式。本发明所述的癌症种类评价装置是具备控制装置和存储装置且对于评价对象评价其癌症的种类的癌症种类评价装置,其特征在于,上述控制装置具备下述装置判别值计 算装置,根据以氨基酸的浓度为变数、在上述存储装置中存储的由1个或多个多变量判别 式构成的多变量判别式组以及预先取得的与上述氨基酸的浓度值相关的上述评价对象的 氨基酸浓度数据中所含的6111、484、¥&1、]^仏?1~0、?1^、1111~、116、1^11、见8中的至少一种氨 基酸的上述浓度值,通过构成该多变量判别式组的每个上述多变量判别式,计算该多变量 判别式的值即判别值;判别值基准评价装置,根据在上述判别值计算装置中算出的由1个 或多个上述判别值构成的判别值组,对于上述评价对象评价上述癌症的种类,构成上述多 变量判别式组的各上述多变量判别式含有Glu、ABA、Val、Met、Pro、Phe, Thr, lie、Leu、His 中的至少一种氨基酸作为上述变数。本发明所述的癌症种类评价装置的特征还在于,在上述记载的癌症种类评价装置 中,上述判别值基准评价装置进一步具备下述判别值基准判别装置根据上述判别值组,对 于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种上 述癌症中判别其是哪一种上述癌症。
本发明所述的癌症种类评价装置的特征还在于,在上述记载的癌症种类评价装置 中,上述判别值基准判别装置是对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、 肺癌中的至少3种上述癌症中判别其是哪一种上述癌症。本发明所述的癌症种类评价装置的特征还在于,在上述记载的癌症种类评价装置 中,构成上述多变量判别式组的各上述多变量判别式为分数式、逻辑回归式、线性判别式、 多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的 公式、由决策树制作的公式的任意一种。本发明所述的癌症种类评价装置的特征还在于,在上述记载的癌症种类评价装置 中,上述多变量判别式组为下述的判别式组1 16的任意一组[判别式组 1]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、His、Orn, Lys、Arg作为上述变数的5个线性1次式;[判别式组 2]以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp, Orn, Lys 作为上述变数的4个线性1次式;[判别式组 3]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Leu、Phe、His、Arg 作为上述变数的4个线性1次式;[判别式组4]以年龄、性别、1111~、6111、?1~0、六8六、¥31^6仏116、1^11、?1^、见8作为 上述变数的4个线性1次式;[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线 性1次式;[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 作为上述变数 的3个线性1次式;[判别式组 7]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、Orn、Arg作为上述变数的4个线性1次式;[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线 性1次式;[判别式组9]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe、Arg 作为上述变数的3个线性1次式;
[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为上述变数的3个线 性1次式;[判别式组11]以年龄、Cit,ABA, Val, Met作为上述变数的2个线性1次式;[判别式组12]以年龄、Thr、Glu、Pr0、Met、Phe作为上述变数的2个线性1次式;[判别式组 13]以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、 Tyr, Phe、His、Trp, Orn, Lys、Arg作为上述变数的2个线性1次式;[判别式组14]以Glu、Gin、ABA、Val、lie、Phe、Arg作为上述变数的2个线性1 次式;[判别式组15]以Thr、Glu、Gin、ABA、lie、Leu、Arg作为上述变数的2个线性1
次式;[判别式组16]以 Thr、Gin、Ala、Cit、ABA、lie、His、Orn, Arg 作为上述变数的 2
个分数式。本发明所述的癌症种类评价装置的特征还在于,在上述记载的癌症种类评价装置 中,上述控制装置进一步具备下述多变量判别式组制作装置根据含有上述氨基酸浓度数 据和与表示上述癌症的上述状态的指标相关的癌症状态指标数据、在上述存储装置中存储 的癌症状态信息,制作在上述存储装置中存储的上述多变量判别式;上述多变量判别式组 制作装置进一步具备下述装置候选多变量判别式组制作装置,根据规定的公式制作方法, 由上述癌症状态信息制作上述多变量判别式组的候选即候选多变量判别式组;候选多变量 判别式组验证装置,根据规定的验证方法,验证在上述候选多变量判别式组制作装置中制 作的上述候选多变量判别式组;变数选择装置,根据规定的变数选择方法,从上述候选多变 量判别式组验证装置的验证结果中选择上述候选多变量判别式组的变数,来选择在制作上 述候选多变量判别式组时使用的上述癌症状态信息中所含的上述氨基酸浓度数据的组合, 根据反复运行上述候选多变量判别式组制作装置、上述候选多变量判别式组验证装置以及 上述变数选择装置而累积的上述验证结果,从多个上述候选多变量判别式组中选出用作上 述多变量判别式组的上述候选多变量判别式组,来制作上述多变量判别式组。本发明所述的癌症种类评价方法是在具备控制装置和存储装置的信息处理装置 中实行的对于评价对象评价癌症的种类的癌症种类评价方法,其特征在于,在上述控制装 置中实行以下步骤判别值计算步骤,根据由以氨基酸的浓度为变数、在上述存储装置中存 储的由1个或多个多变量判别式构成的多变量判别式组以及关于上述氨基酸的浓度值的 预先取得的上述评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、 lie、Leu、His中的至少一种氨基酸的上述浓度值,通过构成该多变量判别式组的每个上述 多变量判别式,计算该多变量判别式的值即判别值;判别值基准评价步骤,根据在上述判别 值计算步骤中算出的由1个或多个上述判别值构成的判别值组,对于上述评价对象评价上 述癌症的种类,构成上述多变量判别式组的各上述多变量判别式含有Glu、ABA、Val、Met、 Pro、Phe、Thr、lie、Leu、His中的至少一种氨基酸作为上述变数。本发明所述的癌症种类评价方法的特征还在于,在上述记载的癌症种类评价方法 中,上述判别值基准评价步骤进一步包括下述判别值基准判别步骤根据上述判别值组,对 于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种上述癌中判别其是哪一种上述癌症。 本发明所述的癌症种类评价方法的特征还在于,在上述记载的癌症种类评价方法 中,上述判别值基准判别步骤是对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、 肺癌中的至少3种上述癌中判别其是哪一种上述癌症。本发明所述的癌症种类评价方法的特征还在于,在上述记载的癌症种类评价方法 中,构成上述多变量判别式组的各上述多变量判别式为分数式、逻辑回归式、线性判别式、 多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的 公式、由决策树制作的公式的任意一种。本发明所述的癌症种类评价方法的特征还在于,在上述记载的癌症种类评价方法 中,上述多变量判别式组为下述的判别式组1 16的任意一组[判别式组 1]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]\^仏116、1^11、1又1·、 Phe、His、Orn, Lys、Arg作为上述变数的5个线性1次式;[判别式组 2]以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp, Orn, Lys 作为上述变数的4个线性1次式;[判别式组 3]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Leu、Phe、His、Arg 作为上述变数的4个线性1次式;[判别式组4]以年龄、性别、1111~、6111、?1~0、六8六、¥31^6仏116、1^11、?1^、见8作为 上述变数的4个线性1次式;[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线 性1次式;[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 作为上述变数 的3个线性1次式;[判别式组 7]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、Orn、Arg作为上述变数的4个线性1次式;[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线 性1次式;[判别式组9]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe、Arg 作为上述 变数的3个线性1次式;[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为上述变数的3个线 性1次式;[判别式组11]以年龄、Cit、ABA、Val、Met作为上述变数的2个线性1次式;[判别式组12]以年龄、Thr、Glu、Pr0、Met、Phe作为上述变数的2个线性1次式;[判别式组 13]以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、 Tyr, Phe、His、Trp, Orn, Lys、Arg作为上述变数的2个线性1次式;[判别式组14]以Glu、Gin、ABA、Val、lie、Phe、Arg作为上述变数的2个线性1 次式;[判别式组15]以Thr、Glu、Gin、ABA、lie、Leu、Arg作为上述变数的2个线性1
次式;[判别式组16]以 Thr、Gin、Ala、Cit、ABA、lie、His、Orn, Arg 作为上述变数的 2个分数式。本发明所述的癌症种类评价方法的特征还在于,在上述记载的癌症种类评价方法 中,在上述控制装置进一步实行下述多变量判别式制作步骤根据包含上述氨基酸浓度数 据和与表示上述癌症的上述状态的指标相关的癌症状态指标数据、在上述存储装置中存储 的癌症状态信息,制作在上述存储装置中存储的上述多变量判别式,上述多变量判别式制 作步骤进一步包括下述步骤候选多变量判别式制作步骤,根据规定的公式制作方法,由上 述癌症状态信息制作上述多变量判别式的候选即候选多变量判别式;候选多变量判别式验 证步骤,根据规定的验证方法,验证在上述候选多变量判别式制作步骤中制作的上述候选 多变量判别式;变数选择步骤,根据规定的变数选择方法,从上述候选多变量判别式验证步 骤的验证结果中选择上述候选多变量判别式的变数,来选择在制作上述候选多变量判别式 时使用的上述癌症状态信息中所含的上述氨基酸浓度数据的组合,根据反复运行上述候选 多变量判别式制作步骤、上述候选多变量判别式验证步骤以及上述变数选择步骤而累积的 上述验证结果,从多个上述候选多变量判别式中选出用作上述多变量判别式的上述候选多 变量判别式,来制作上述多变量判别式。本发明所述的癌症种类评价系统是经由网络以可通信的方式将具备控制装置和 存储装置且对于评价对象评价癌症的种类的癌症种类评价装置,以及提供上述评价对象的 关于氨基酸浓度值的氨基酸浓度数据的信息通信终端装置连接在一起而构成的癌症种类 评价系统,其特征在于上述信息通信终端装置具备下述装置氨基酸浓度数据发送装置, 将上述评价对象的上述氨基酸浓度数据发送至上述癌症种类评价装置;评价结果接收装 置,接收由上述癌症种类评价装置发送的针对上述评价对象作出的与上述癌症的种类相关 的评价结果,上述癌症种类评价装置的上述控制装置具备下述装置氨基酸浓度数据接收 装置,接收由上述信息通信终端装置发送的上述评价对象的上述氨基酸浓度数据;判别值 计算装置,根据以上述氨基酸的浓度为变数、在上述存储装置中存储的由1个或多个多变 量判别式构成的多变量判别式组以及在上述氨基酸浓度数据接收装置中接收的上述评价 对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、11 e、Leu、Hi S中的 至少一种氨基酸的上述浓度值,通过构成该多变量判别式组的每个上述多变量判别式,计 算该多变量判别式的值即判别值;判别值组基准评价装置,根据在上述判别值组计算装置 中算出的由1个或多个上述判别值构成的判别值组,对于上述评价对象评价上述癌症的种 类;评价结果发送装置,将上述判别值基准评价装置中作出的对上述评价对象的上述评价 结果发送至上述信息通信终端装置,构成上述多变量判别式组的各上述多变量判别式含有 Glu、ABA、Val、Met、Pro、Phe, Thr, lie、Leu、His中的至少一种氨基酸作为上述变数。本发明所述的癌症种类评价程序是在具备控制装置和存储装置的信息处理装置 中实行的对于评价对象评价癌症的种类的癌症评价程序,其特征在于,在上述控制装置中 实行下述步骤判别值组计算步骤,根据以氨基酸的浓度为变数、在上述存储装置中存储的 由1个或多个多变量判别式构成的多变量判别式组以及关于上述氨基酸的浓度值的预先 取得的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe, Thr, lie、Leu、His中的至少一种氨基酸的上述浓度值,通 过构成该多变量判别式组的每个上述 多变量判别式,计算该多变量判别式的值即判别值;判别值组基准评价步骤,根据在上述判 别值组计算步骤中算出的由1个或多个上述判别值构成的判别值组,对于上述评价对象评价上述癌症的种类,构成上述多变量判别式组的各上述多变量判别式含有Glu、ABA、Val, Met、Pro、Phe、Thr、lie、Leu、His中的至少一种氨基酸作为上述变数。本发明所述的记录介质是计算机可读取的记录介质,其特征在于,该记录介质记录有上述记载的癌症种类评价程序。发明效果根据本发明,针对从评价对象采集到的血液测定关于氨基酸浓度值的氨基酸浓度 数据,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val, Met, Pro、Phe, Thr, lie、Leu、His中的至少一种氨基酸的浓度值,对于评价对象评价癌症的种类,因此,利用血 液中的氨基酸浓度中与各种癌症的状态相关的氨基酸的浓度,发挥可高精度地评价癌症的 种类的效果。具体来说,可以以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患 的可能性高的被验者,结果发挥可以减轻被验者的时间、身体以及金钱方面上的负担的效 果。具体来说,根据多种氨基酸浓度或以该氨基酸浓度为变数的含有1个或多个判别式的 判别式组,可以高精度地评价某个检体是否有癌症发病,有癌症发病时,该发病部位在哪 里,结果发挥可以实现检查的高效化或高精度化的效果。根据本发明,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、 Pro、Phe、Thr、Ile、Leu、HiS中的至少一种氨基酸的浓度值,对于评价对象,从大肠癌、乳癌、 前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症中判别其是哪一种癌症,因此, 利用血液中的氨基酸浓度中对于癌症的多组判别有用的氨基酸的浓度,发挥可以高精度地 进行癌症的多组判别的效果。根据本发明,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、 Pro、Phe, Thr, lie、Leu、His中的至少一种氨基酸的浓度值,对于评价对象,从大肠癌、乳 癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症中判别其是哪一种癌症,因此,利用血液中 的氨基酸浓度中对于癌症的多组判别有用的氨基酸的浓度,发挥可以高精度地进行癌症的 多组判别的效果。根据本发明,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、 Pro、Phe、Thr、Ile、Leu、HiS中的至少一种氨基酸的浓度值以及以氨基酸的浓度为变数、含 有6111、48々、¥31、]^仏?1~0、?1^、1111~、116、1^11、见8中的至少一种氨基酸作为变数的预先设 定的由1个或多个多变量判别式构成的多变量判别式组,通过构成该多变量判别式组的每 个多变量判别式,计算该多变量判别式的值即判别值,根据由算出的1个或多个判别值构 成的判别值组,对于评价对象评价癌症的种类,因此,利用由与各种癌症的状态具有显著相 关的多变量判别式组得到的判别值组,发挥可以高精度地评价癌症种类的效果。具体来说, 可以以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患的可能性高的被验者,结 果发挥可以减轻被验者的时间、身体以及金钱方面上的负担的效果。具体来说,根据多种氨 基酸的浓度或以该氨基酸浓度为变数的含有1个或多个判别式的判别式组,可以高精度地 评价某个检体是否有癌症发病,有癌症发病时,该发病部位在哪里,结果发挥可以实现检查 的高效化或高精度化的效果。根据本发明,根据算出的判别值组,对于评价对象,从大肠癌、乳癌、前列腺癌、甲 状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症中判别其是哪一种癌症,因此,利用由对于癌 症的多组判别有用的多变量判别式组得到的判别值组,发挥可以高精度地进行癌症的多组判别的效果。根据本发明,根据算出的判别值组,对于评价对象,从大肠癌、乳癌、前列腺癌、甲 状腺癌、肺癌中的至少3种癌症中判别其是哪一种癌症,因此,利用由对于癌症的多组判别 有用的多变量判别式组得到的判别值组,发挥可以高精度地进行癌症的多组判别的效果。根据本发明,构成多变量判别式组的各多变量判别式为分数式、逻辑回归式、线性 判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分 析制作的公式、由决策树制作的公式的任意一种,因此,利用由对于癌症的多组判别特别有 用的多变量判别式组得到的判别值组,发挥可以高精度地进行癌症的多组判别的效果。 根据本发明,多变量判别式组为下述的判别式组1 16的任意一组,因此,利用由 对于癌症的多组判别特别有用的多变量判别式组得到的判别值组,发挥可以高精度地进行 癌症的多组判别的效果。[判别式组 1]以年龄、性别、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、 Phe、His、Orn, Lys、Arg作为变数的5个线性1次式;[判别式组 2]以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp, Orn, Lys 作为变数的4个线性1次式;[判别式组 3]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Leu、Phe、His、Arg 作为变数的4个线性1次式;[判别式组4]以年龄、性别、1111~、6111、?1~0^8六、¥31』6仏116、1^11、?1^、见8作为 上述变数的4个线性1次式;[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 作为变数的 3 个线性1次式;[判别式组 7]以年龄、性别、1111~、6111、6111、卩1~0、(^仏六8六、¥&1、]^仏116、1^11、1又1·、 Phe、Orn、Arg作为变数的4个线性1次式;[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组9]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe、Arg 作为变数 的3个线性1次式;[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1 次式;[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;[判别式组 13]以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、 Tyr, Phe、His、Trp, Orn, Lys、Arg作为变数的2个线性1次式;[判别式组14]以Glu、Gin、ABA、Val、lie、Phe、Arg作为变数的2个线性1次式;[判别式组15]以11^、6111、6111、484、116、1^11、4印作为变数的2个线性1次式;[判别式组16]以 Thr、Gin、Ala、Cit、ABA、lie、His、Orn、Arg 作为变数的 2 个分数式。
根据本发明,根据含有氨基酸浓度数据和与表示癌症的状态的指标相关的癌症状 态指标数据、在上述存储装置中存储的癌症状态信息,制作在存储装置中存储的多变量判 别式。具体来说,(1)根据规定的公式制作方法,由癌症状态信息制作候选多变量判别式; (2)根据规定的验证方法,验证制作的候选多变量判别式;(3)根据规定的变数选择方法, 从该验证结果中选择候选多变量判别式的变数,来选择在制作候选多变量判别式时使用的 癌症状态信息中所含的氨基酸浓度数据的组合,⑷根据反复运行(1)、⑵和⑶而累积 的验证结果,从多个候选多变量判别式中选出用作多变量判别式的候选多变量判别式,来 制作多变量判别式。由此,可以制作最适合每种癌症的状态评价的多变量判别式,结果,发 挥可以得到最适合癌症的种类评价的多变量判别式组(具体来说,是对癌症的多组判别有 用的多变量判别式组)的效果。
根据本发明,通过计算机读取并实行记录在该记录介质上的癌症种类评价程序, 在计算机上实行癌症种类评价程序,因此,发挥可以获得与癌症种类评价程序同样的效果 的效果。本发明中,在评价癌症的种类时(具体来说,在判别其是哪一种癌症时),除氨基 酸的浓度以外,可进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验 者的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。另外,本发明中,在评价癌 症的种类时(具体来说,在判别其是哪一种癌症时),作为多变量判别式中的变数,除氨基 酸的浓度之外,还可以进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、 被验者的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。附图简述

图1是表示本发明的基本原理的原理构成图。图2是表示实施方案1所述的癌症种类的评价方法的一个例子的流程图。图3是表示本发明的基本原理的原理构成图。图4是表示本系统的全体构成的一个例子的图。图5是表示本系统的全体构成的又一个例子的图。图6是表示本系统的癌症种类评价装置100的构成的一个例子的框图。图7是表示保存在利用者信息文件106a中的信息的一个例子的图。图8是表示保存在氨基酸浓度数据文件106b中的信息的一个例子的图。图9是表示保存在癌症状态信息文件106c中的信息的一个例子的图。图10是表示保存在指定癌症状态信息文件106d中的信息的一个例子的图。图11是表示保存在候选多变量判别式文件106el中的信息的一个例子的图。图12是表示保存在验证结果文件106e2中的信息的一个例子的图。图13是表示保存在选择癌症状态信息文件106e3中的信息的一个例子的图。图14是表示保存在多变量判别式文件106e4中的信息的一个例子的图。图15是表示保存在判别值文件106f中的信息的一个例子的图。图16是表示保存在评价结果文件106g中的信息的一个例子的图。图17是表示多变量判别式制作部102h的构成的框图。图18是表示判别值基准评价部102j的构成的框图。图19是表示本系统的客户端装置200的构成的一个例子的框图。
图20是表示本系统的数据库装置400的构成的一个例子的框图。图21是表示在本系统中进行的癌症种类评价服务处理的一个例子的流程图。图22是表示在本系统的癌症种类评价装置100中进行的多变量判别式制作处理的一个例子的流程图。图23是与男性的各种癌症患者和非癌症患者的氨基酸变数的分布相关的箱线 图。图24是与女性的各种癌症患者和非癌症患者的氨基酸变数的分布相关的箱线 图。图25是表示一元配置分散分析中的ρ值的图。图26是表示指标式组1的变数及其系数的图。图27是表示各种癌症和非癌症的准确率(正答率)的图。图28是表示与指标式组1具有同等的判别能力的判别式组的一览图。图29是表示与指标式组1具有同等的判别能力的判别式组的一览图。图30是表示指标式组2的变数及其系数的图。图31是表示各种癌症和非癌症的准确率的图。图32是表示与指标式组2具有同等的判别能力的判别式组的一览图。图33是表示与指标式组2具有同等的判别能力的判别式组的一览图。图34是表示指标式组3的变数及其系数的图。图35是表示各种癌症和非癌症的准确率的图。图36是表示与指标式组3具有同等的判别能力的判别式组的一览图。图37是表示与指标式组3具有同等的判别能力的判别式组的一览图。图38是表示指标式组4的变数及其系数的图。图39是表示各种癌症的准确率的图。图40是表示与指标式组4具有同等的判别能力的判别式组的一览图。图41是表示与指标式组4具有同等的判别能力的判别式组的一览图。图42是表示指标式组5的变数及其系数的图。图43是表示各种癌症的准确率的图。图44是表示与指标式组5具有同等的判别能力的判别式组的一览图。图45是表示与指标式组5具有同等的判别能力的判别式组的一览图。图46是表示指标式组6的变数及其系数的图。图47是表示各种癌症的准确率的图。图48是表示与指标式组6具有同等的判别能力的判别式组的一览图。图49是表示与指标式组6具有同等的判别能力的判别式组的一览图。图50是表示指标式组7的变数及其系数的图。图51是表示各种癌症和非癌症的准确率的图。图52是表示与指标式组7具有同等的判别能力的判别式组的一览图。图53是表示与指标式组7具有同等的判别能力的判别式组的一览图。图54是表示指标式组8的变数及其系数的图。图55是表示各种癌症和非癌症的准确率的图。
图56是表示与指标式组8具有同等的判别能力的判别式组的一览图。图57是表示与指标式组8具有同等的判别能力的判别式组的一览图。图58是表示指标式组9的变数及其系数的图。图59是表示各种癌症和非癌症的准确率的图。 图60是表示与指标式组9具有同等的判别能力的判别式组的一览图。图61是表示与指标式组9具有同等的判别能力的判别式组的一览图。图62是表示指标式组10的变数及其系数的图。图63是表示各种癌症的准确率的图。图64是表示与指标式组10具有同等的判别能力的判别式组的一览图。图65是表示与指标式组10具有同等的判别能力的判别式组的一览图。图66是表示指标式组11的变数及其系数的图。图67是表示各种癌症的准确率的图。图68是表示与指标式组11具有同等的判别能力的判别式组的一览图。图69是表示与指标式组11具有同等的判别能力的判别式组的一览图。图70是表示指标式组12的变数及其系数的图。图71是表示各种癌症的准确率的图。图72是表示与指标式组12具有同等的判别能力的判别式组的一览图。图73是表示与指标式组12具有同等的判别能力的判别式组的一览图。图74是与各种癌症患者和非癌症患者的氨基酸变数的分布相关的箱线图。图75是表示一元配置分散分析中的ρ值的图。图76是通过主成分分析得到的主成分3和主成分4的标图。图77是表示指标式组13的变数及其系数的图。图78是表示各种癌症和非癌症的准确率的图。图79是表示指标式组14的变数及其系数的图。图80是表示各种癌症和非癌症的准确率的图。图81是表示与指标式组14具有同等的判别能力的判别式组的一览图。图82是表示与指标式组14具有同等的判别能力的判别式组的一览图。图83是表示指标式组15的变数及其系数的图。图84是表示各种癌症和非癌症的准确率的图。图85是表示与指标式组15具有同等的判别能力的判别式组的一览图。图86是表示与指标式组15具有同等的判别能力的判别式组的一览图。图87是表示指标式组16的变数及其系数的图。图88是表示各种癌症和非癌症的准确率的图。符号说明100 癌症种类评价装置102 控制部102a 要求解释部102b 阅览处理部102c 认证处理部
102d 电子邮件生成部102e 网页生成部102f 接收部102g癌症状态信息指定部102h多变量判别式制作部102hl候选多变量判别式制作部102h2候选多变量判别式验证部102h3变数选择部102 判别值计算部102 j判别值基准评价部102jl判别值基准判别部102k结果输出部102m 发送部104 通信接口部106 存储部106a利用者信息文件106b氨基酸浓度数据文件106c癌症状态信息文件106d指定癌症状态信息文件106e多变量判别式相关信息数据库106el候选多变量判别式文件106e2验证结果文件106e3选择癌症状态信息文件106e4多变量判别式文件106f 判别值文件106g评价结果文件108 输入输出接口部112输入装置114输出装置200客户端装置(信息通信终端装置)300 网络400数据库装置
具体实施例方式以下,根据附图详细说明本发明所述的癌症种类的评价方法的实施方案(实施方 案1)以及本发明所述的癌症种类评价装置、癌症种类评价方法、癌症种类评价系统、癌症 种类评价 程序和记录介质的实施方案(实施方案2)。需要说明的是,本发明并不受本实施 方案限定。[实施方案1]
[1-1.本发明的概要]这里,参照图1对本发明所述的癌症种类的评价方法的概要进行说明。图1是表 示本发明的基本原理的原理构成图首先,本发明中,针对从评价对象(例如动物或人等个体)采集到的血液测定关于 氨基酸浓度值的氨基酸浓度数据(步骤S-11)。这里,血液中氨基酸浓度的分析如下进行。 将采血得到的血样采集到经肝素处理的管中,将采集的血样通过离心从血液中分离血浆。 全部的血浆样品在-70°c下冷冻保存至氨基酸浓度的测定之前。在氨基酸浓度测定时,添加 硫代水杨酸,调节为3%浓度,由此进行除蛋白处理,测定使用氨基酸分析仪,该氨基酸分析 仪是以采用了柱后茚三酮反应的高效液相色谱(HPLC)为原理。氨基酸浓度的单位可以是 例如摩尔浓度或重量浓度、对这些浓度加减乘除任意的常数而得到的浓度。接着,本发明中,根据在步骤S-Il中测定的评价对象的氨基酸浓度数据中所含的 Glu、ABA、Val、Met、Pro、Phe, Thr, lie、Leu、His中的至少一种氨基酸的浓度值,对于评价 对象评价癌症的种类(步骤S-12)。以上,根据本发明,针对从评价对象采集到的血液测定关于氨基酸浓度值的氨基 酸浓度数据,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pr0、Phe、 Thr、Ile、Leu、HiS中的至少一种氨基酸的浓度值,对于评价对象评价癌症的种类。由此,利 用血液中的氨基酸浓度中与各种癌症的状态相关的氨基酸的浓度,可以高精度地评价癌症 的种类。具体来说,可以以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患的可 能性高的被验者,结果可以减轻被验者的时间、身体以及金钱方面上的负担。具体来说,根 据多种氨基酸的浓度或以该氨基酸浓度为变数的含有1个或多个判别式的判别式组,可以 高精度地评价某个检体是否有癌症发病,有癌症发病时,该发病部位在哪里,结果可以实现 检查的高效化或高精度化。 这里,在实行步骤S-12之前,可以从步骤S-11中测定的评价对象的氨基酸浓度数 据中除去缺失值或偏离值等数据。由此,可以进一步高精度地评价癌症的种类。步骤S-12中,根据在步骤S-Il中测定的评价对象的氨基酸浓度数据中所含的 Glu、ABA、Val、Met、Pro、Phe, Thr, lie、Leu、His中的至少一种氨基酸的浓度值,对于评价 对象,可以从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具 体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种 癌症。具体来说,通过对Glu、ABA、Val、Met、Pro、Phe、Thr、lie. Leu, His中的至少一种氨 基酸的浓度值和预先设定的阀值进行比较,对于评价对象,可以从大肠癌、乳癌、前列腺癌、 甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲 状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症。由此,利用血液中的氨基酸浓度 中对癌症的多组判别有用的氨基酸的浓度,可以高精度地进行癌症的多组判别。步骤S-12中,根据在步骤S-Il中测定的评价对象的氨基酸浓度数据中所含的 Glu、ABA、Val、Met、Pro、Phe, Thr, lie、Leu、His中的至少一种氨基酸的浓度值以及以氨基 酸的浓度为变数、含有Glu、ABA、Val、Met、Pro、Phe、Thr, lie、Leu、His中的至少一种氨基 酸作为变数的预先设定的由1个或多个多变量判别式构成的多变量判别式组,通过构成该 多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值,可以根据由算 出的1个或多个判别值构成的判别值组,对于评价对象评价癌症的种类。由此,利用由与各种癌症的状态具有显著相关的多变量判别式组得到的判别值组,可以高精度地评价癌症的 种类。具体来说,可以以1种检体且短时间内即可缩小筛选范围至多种癌症中罹患的可能 性高的被验者,结果可以减轻被验者的时间、身体以及金钱方面上的负担。具体来说,根据 多种氨基酸的浓度或以该氨基酸的浓度为变数的含有1个或多个判别式的判别式组,可以 高精度地评价某个检体是否有癌症发病,有癌症发病时,该发病部位在哪里,结果可以实现 检查的高效化或高精度化。步骤S-12中,根据计算的判别值组,对于评价对象,可以从大肠癌、乳癌、前列腺 癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、 甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症。具体来说,可通过对判别值 和预先设定的阀值进行比较,对于评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃 癌、子宫癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至 少3种癌症)中判别其是哪一种癌症。由此,利用由对于癌症的多组判别有用的多变量判 别式组得到的判别值组,可以高精度地进行癌症的多组判别。构成多变量判别式组的各多变量判别式可以是分数式、逻辑回归式、线性判别式、 多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的 公式、由决策树制作的公式的任意一种。具体来说,多变量判别式组可以是以下的判别式组 1 16的任意一组。由此,利用由对于癌症的多组判别特别有用的多变量判别式组得到的 判别值组,可以进一步高精度地进行癌症的多组判别。[判别式组 1]以年龄、性别、1111~、6111、6111、卩1~0、(行、八8八、¥&1、]^扒116、1^11、1又1·、 Phe、His、Orn, Lys、Arg作为变数的5个线性1次式;[判别式组 2]以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp, Orn, Lys 作为变数的4个线性1次式;[判别式组 3]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Leu、Phe、His、Arg 作为变数的4个线性1次式;[判别式组4]以年龄、性别、1111~、6111、?1~0^8六、¥31』6仏116、1^11、?1^、见8作为 变数的4个线性1次式;[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 作为变数的 3 个线性1次式;[判别式组 7]以年龄、性别、1111~、6111、6111、卩1~0、(^仏六8六、¥31、]^仏116、1^11、1又1·、 Phe、Orn、Arg作为变数的4个线性1次式;[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组9]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe、Arg 作为变数 的3个线性1次式;[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1 次式;[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;
[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;[判别式组 13]以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、 Tyr, Phe、His、Trp, Orn, Lys、Arg作为变数的2个线性1次式;[判别式组14]以6111、6111、484、¥31、116、?1^、4印作为变数的2个线性1次式;[判别式组15]以11^、6111、6111、484、116、1^11、4印作为变数的2个线性1次式;[判别式组16]以 Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg 作为变数的 2 个分数式。这些构成多变量判别式组的各多变量判别式可以按照本申请人的国际申请 即国际公开第2004/052191号中所述的方法、或本申请人的国际申请即国际公开第 2006/098192号中所述的方法(后述的实施方案2中记载的多变量判别式制作处理)制作。 如果是由这些方法得到的多变量判别式,则不管作为输入数据的氨基酸浓度数据中的氨基 酸浓度的单位,该多变量判别式均可适用于癌症的种类的评价。这里,多变量判别式是指通常在多变量分析中使用的公式的形式,包含例如分数 式、多重回归式、多重逻辑回归式、线性判别函数、马氏距离、典型判别函数、支持向量机、决 策树等。还包含由不同形式的多变量判别式之和表示的公式。多重回归式、多重逻辑回归 式、典型判别函数中,各变数可以附加系数和常数项,此时的系数和常数项优选为实数,更 优选为了由数据进行判别而得到的系数和常数项的99%可靠区间的范围的值,还可进一步 优选为了由数据进行判别而得到的系数和常数项的95%可靠区间的范围的值。各系数的值 及其可靠区间可以是将其实数倍所得的值,常数项的值及其可靠区间可以是对其加减乘除 任意的实常数所得的值。分数式是指该分数式的分子由氨基酸A、B、C等的之和表示,且该分数式的分母 由氨基酸a、b、c等的之和表示。分数式也包含上述构成的分数式α、β、Y等的之和(例 如α+β等)。分数式也包含分割的分数式。分子或分母中使用的氨基酸可以分别具有适 当的系数。分子或分母中使用的氨基酸可以重复。各分数式可以具有适当的系数。另外, 各变数的系数的值或常数项的值只要是实数即可。分数式中,将分子的变数和分母的变数 互换的组合中,与目标变数相关的正负符号均颠倒,但它们仍保持相关性,因此,在判别性 中视为同等,因此,分数式也包含将分子的变数与分母的变数互换的组合。本发明中,在评价癌症的种类时(具体来说,在判别其是哪一种癌症时),除氨基 酸的浓度以外,可进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验 者的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。本发明中,在评价癌症的 种类时(具体来说,在判别其是哪一种癌症时),作为多变量判别式中的变数,除氨基酸的 浓度以外,可以进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验者 的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。[1-2.实施方案1所述的癌症种类的评价方法]这里,参照图2对实施方案1所述的癌症种类的评价方法进行说明。图2是表示 实施方案1所述的癌症种类的评价方法的一个例子的流程图。首先,针对从动物或人等个体采集到的血液测定关于氨基酸浓度值的氨基酸浓度 数据(步骤SA-11)。氨基酸浓度值的测定按照上述的方法进行。接着,从在步骤SA-Il中测定的个体的氨基酸浓度数据中除去缺失值或偏离值等的数据(步骤SA-12)。接着,对步骤SA-12中除去了缺失值或偏离值等数据的个体的氨基酸浓度数据中 所含的6111、48々、¥31、]^仏?1~0、?1^、1111~、116、1^11、见8中的至少一种氨基酸的浓度值和预 先设定的阀值进行比较,对于个体,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫 癌中的至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种 癌症)中判别其是哪一种癌症,或者,根据步骤SA-12中除去了缺失值或偏离值等的数据的 个体的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少 一种氨基酸的浓度值以及以氨基酸的浓度为变数、含有Glu、ABA、Val, Met, Pro、Phe, Thr, Ile.Leu.His中的至少一种氨基酸作为变数的预先设定的由1个或多个多变量判别式构成 的多变量判别式组,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别 式的值即判别值,通过对由算出的1个或多个判别值构成的判别值组和预先设定的阀值进 行比较,对于个体,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种 癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其 是哪一种癌症(步骤SA-13)。[1-3.实施方案1的总结、以及其它实施方案]如以上的详细说明,根据实施方案1所述的癌症的评价方法,(1)针对从个体采集 到的血液测定氨基酸浓度数据,(2)从测定的个体的氨基酸浓度数据中除去缺失值或偏离 值等的数据,(3)通过对除去了缺失值或偏离值等数据的个体的氨基酸浓度数据中所含的 Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值和预先设定 的阀值进行比较,对于个体,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的 至少2种癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中 判别其是哪一种癌症,或者,根据除去了缺失值或偏离值等的数据的个体的氨基酸浓度数 据中所含的6111、484、¥31、]^1 1~0、?1^、1111~、116、1^11、见8中的至少一种氨基酸的浓度值 以及以氨基酸的浓度为变数、含有6111、六8六、¥&1、]^仏?1~0、?1^、1111~、116、1^11、见8中的至少 一种氨基酸作为变数的预先设定的由1个或多个多变量判别式构成的多变量判别式组,通 过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值,通过 对由算出的1个或多个判别值构成的判别值组和预先设定的阀值进行比较,对于个体,从 大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(具体来说,是大 肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症)中判别其是哪一种癌症。由此,利 用血液中的氨基酸浓度中对于癌症的多组判别有用的氨基酸的浓度、或者利用由对于癌症 的多组判别有用的多变量判别式组得到的判别值组,可以高精度地进行癌症的多组判别。步骤SA-13中,构成多变量判别式组的各多变量判别式可以是分数式、逻辑回归 式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型 判别分析制作的公式、由决策树制作的公式的任意一种。具体来说,多变量判别式组可以是 以下的判别式组1 16的任意一组。由此,利用由对于癌症的多组判别特别有用的多变量 判别式组得到的判别值组,可以进一步高精度地进行癌症的多组判别。[判别式组 1]以年龄、性别、1111~、6111、6111、卩1~0、(^、六8六、¥&1、]^扒116、1^11、1又1·、 Phe、His、Orn, Lys、Arg作为变数的5个线性1次式;[判别式组 2]以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp, Orn, Lys作为变数的4个线性1次式;[判别式组 3]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Leu、Phe, His、Arg 作为变数的4个线性1次式;[判别式组4]以年龄、性别、1111~、6111、?1~0^8六、¥31』6仏116、1^11、?1^、见8作为 变数的4个线性1次式;[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组 6]以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 作为变数的 3 个线性1次式;[判别式组 7]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、Orn、Arg作为变数的4个线性1次式;[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组9]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe, Arg 作为变数 的3个线性1次式;[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1 次式;[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;[判别式组 13]以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、 Tyr, Phe、His、Trp, Orn, Lys、Arg作为变数的2个线性1次式;[判别式组14]以Glu、Gin、ABA、Val、lie、Phe、Arg作为变数的2个线性1次式;[判别式组15]以11^、6111、6111、484、116、1^11、4印作为变数的2个线性1次式;[判别式组16]以 Thr、Gin、Ala、Cit、ABA、lie、His、Orn、Arg 作为变数的 2 个分数式。这些构成多变量判别式组的各多变量判别式可根据本申请人的国际申请即国际 公开第2004/052191号中所述的方法、或本申请人的国际申请即国际公开第2006/098192 号中所述的方法(后述的实施方案2中记载的多变量判别式制作处理)制作。如果是由这 些方法得到的多变量判别式,则不管作为输入数据的氨基酸浓度数据中的氨基酸浓度的单 位,该多变量判别式均可适用于癌症的种类的评价。[实施方案2][2-1.本发明的概要]这里,参照图3对本发明所述的癌症种类评价装置、癌症种类评价方法、癌症种类 评价系统、癌症种类评价程序和记录介质的概要进行说明。图3是表示本发明的基本原理 的原理构成图。首先,本发明是在控制部,根据以氨基酸的浓度为变数、含有Glu、ABA、Val、Met、 Pro、Phe、Thr、lie、Leu、His中的至少一种氨基酸作为变数、在存储部存储的由1个或多 个多变量判别式构成的多变量判别式组以及预先取得的与氨基酸的浓度值相关的评价对 象(例如动物或人等个体)的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、lie、Leu、His中的至少一种氨基酸的浓度值,通过构成该多变量判别式组的每个多变量判 别式,计算该多变量判别式的值即判别值(步骤S-21)。接着,本发明是在控制部,根据由在步骤S-21中算出的1个或多个判别值构成的 判别值组,对于评价对象评价癌症的种类(步骤S-22)。以上,根据本发明,根据以氨基酸的浓度为变数、含有Glu、ABA、Val、Met、Pr0、Phe、 Thr, lie. Leu, His中的至少一种氨基酸作为变数、在存储部存储的由1个或多个多变量判 别式构成的多变量判别式组以及预先取得的与氨基酸的浓度值相关的评价对象的氨基酸 浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe, Thr, lie、Leu、His中的至少一种氨基酸 的浓度值,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即 判别值,根据由算出的1个或多个判别值构成的判别值组,对于评价对象评价癌症的种类。 由此,利用由与各种癌症的状态具有显著相关的多变量判别式组得到的判别值组,可以高 精度地评价癌症的种类。具体来说,可以以1种检体且短时间内即可缩小筛选范围至多种 癌症中罹患的可能性高的被验者,结果可以减轻被验者的时间、身体以及金钱方面上的负 担。具体来说,根据多种氨基酸的浓度、或以该氨基酸浓度为变数的含有1个或多个判别式 的判别式组,可以高精度地评价某个检体是否有癌症发病,有癌症发病时,该发病部位在哪 里,结果可以实现检查的高效化或高精度化。这里,在步骤S-22中,根据在步骤S-21中算出的判别值组,对于评价对象,可以从 预先设定的多个种类的癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、 子宫癌中的至少2种癌症(更具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至 少3种癌症))中判别其是哪一种癌症。具体来说,通过对判别值组和预先设定的阀值进行 比较,对于评价对象,可以从预先设定的多个种类的癌症(具体来说,是大肠癌、乳癌、前列 腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(更具体来说,是大肠癌、乳癌、前列 腺癌、甲状腺癌、肺癌中的至少3种癌症))中判别其是哪一种癌症。由此,利用由对于癌症 的多组判别有用的多变量判别式组得到的判别值组,可以高精度地进行癌症的多组判别。构成多变量判别式组的各多变量判别式可以是分数式、逻辑回归式、线性判别式、 多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析制作的 公式、由决策树制作的公式的任意一种。具体来说,多变量判别式组可以使以下的判别式组 1 16的任意一组。由此,利用由对于癌症的多组判别特别有用的多变量判别式组得到的 判别值组,可以进一步高精度地进行癌症的多组判别。[判别式组 1]以年龄、性别、1111~、6111、6111、卩1~0、(^仏六8六、¥31、]^仏116、1^11、1又1·、 Phe、His、Orn, Lys、Arg作为变数的5个线性1次式;[判别式组 2]以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp, Orn, Lys 作为变数的4个线性1次式;[判别式组 3]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Leu、Phe、His、Arg 作为变数的4个线性1次式;[判别式组4]以年龄、性别、1111~、6111、?1~0^8六、¥31』6仏116、1^11、?1^、见8作为 变数的4个线性1次式;[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;
[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 作为变数的 3 个线性1次式;[判别式组 7]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、Orn、Arg作为变数的4个线性1次式;[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组9]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe, Arg 作为变数 的3个线性1次式;[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1 次式;[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;[判别式组 13]以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、 Tyr, Phe、His、Trp, Orn, Lys、Arg作为变数的2个线性1次式;[判别式组14]以6111、6111、484、¥£11、116、?1^、4印作为变数的2个线性1次式;[判别式组15]以11^、6111、6111、484、116、1^11、4印作为变数的2个线性1次式;[判别式组16]以 Thr、Gin、Ala、Cit、ABA、lie、His、Orn、Arg 作为变数的 2 个分数式。这些构成多变量判别式组的各多变量判别式可按照本申请人的国际申请即国际 公开第2004/052191号中所述的方法、或本申请人的国际申请即国际公开第2006/098192 号中所述的方法(后述的多变量判别式制作处理)制作。如果是由这些方法得到的多变量 判别式,则不管作为输入数据的氨基酸浓度数据中的氨基酸浓度的单位,该多变量判别式 均可适用于癌症的种类的评价。这里,多变量判别式是指通常在多变量分析中使用的公式的形式,包含例如分数 式、多重回归式、多重逻辑回归式、线性判别函数、马氏距离、典型判别函数、支持向量机、决 策树等。还包含由不同形式的多变量判别式之和表示的公式。多重回归式、多重逻辑回归 式、典型判别函数中,各变数可以附加系数和常数项,此时的系数和常数项优选为实数,更 优选为了由数据进行判别而得到的系数和常数项的99%可靠区间的范围的值,还可进一步 优选为了由数据进行判别而得到的系数和常数项的95%可靠区间范围的值。各系数的值及 其可靠区间可以是将其实数倍所得的值,常数项的值及其可靠区间可以是对其加减乘除任 意的实常数而得到的值。分数式是指该分数式的分子由氨基酸A、B、C等的之和表示,且该分数式的分母 由氨基酸a、b、c等的之和表示。分数式也包含上述构成的分数式α、β、Y等的之和(例 如α+β等)。分数式也包含分割的分数式。分子或分母中使用的氨基酸可以分别具有适 当的系数。分子或分母中使用的氨基酸可以重复。各分数式可以具有适当的系数。另外, 各变数的系数的值或常数项的值只要是实数即可。分数式中,将分子的变数和分母的变数 互换的组合中,与目标变数相关的正负符号均颠倒,但它们仍保持相关性,因此在判别性中 视为同等,因此,分数式也包含将分子的变数与分母的变数互换的组合。本发明中,在评价癌症的种类时(具体来说,在判别其是哪一种癌症时),除氨基酸的浓度以外,可进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验 者的年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。本发明中,在评价癌症的 种类时(具体来说,在判别其是哪一种癌症时),作为多变量判别式的变数,除氨基酸的浓 度以外,可以进一步使用其它的代谢物的浓度或基因的表达量、蛋白质的表达量、被验者的 年龄和性别、是否吸烟、心电图的波形数值化所得的数据等。这里,对多变量判别式制作处理(步骤1 步骤4)的概要进行详细说明。该多变 量判别式制作处理是对将评价癌症的种类时的对象癌症(具体来说,是上述的大肠癌、乳 癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌等)汇总的数据一并实行。首先,本发明是在控制部,根据规定的公式制作方法,由含有氨基酸浓度数据和与 表示癌症的状态的指标相关的癌症状态指标数据、在存储部存储的癌症状态信息制作多变 量判别式组的候选即候选多变量判别式组(例如、y = alXl+a2x2+. . . +anxn,y 癌症状态指标 数据,Xi 氨基酸浓度数据,a,常数,i = 1,2,. . .,η)(步骤1)。可以事先从癌症状态信息 中除去具有缺失值或偏离值等的数据。步骤1中,可以结合使用多个不同的公式制作方法(包括与主成分分析或判别分 析、支持向量机、多重回归分析、逻辑回归分析、k-means法、聚类分析、决策树等的多变量分 析相关的方法),由癌症状态信息制作多个候选的多变量判别式组。具体来说,可以利用多 种不同的算法,对于癌症状态信息同时并行地制作多个候选多变量判别式组,其中,所述癌 症状态信息是由通过分析从许多的健康人和癌症患者获取的血液而得到的氨基酸浓度数 据和癌症状态指标数据构成的多变量数据。例如,可以利用不同的算法,同时进行判别分析 和逻辑回归分析,制作两种不同的候选多变量判别式。还可以利用进行主成分分析来制作 的候选多变量判别式组,变换癌症状态信息,对变换的癌症状态信息进行判别分析,从而制 作候选多变量判别式组。由此,最终可以制作符合诊断条件的适当的变量判别式组。这里,使用主成分分析制作的候选多变量判别式组是含有使全部的氨基酸浓度数 据的离散为最大的各氨基酸变数的一次式。使用判别分析制作的候选多变量判别式组是含 有使各组内离散之和相对于全部氨基酸浓度数据的离散的比为最小的各氨基酸变数的高 次式(包括指数或对数)。另外,使用支持向量机制作的候选多变量判别式组是含有使组间 的分界为最大的各氨基酸变数的高次式(包括核函数)。使用多重回归分析制作的候选多 变量判别式是含有使自全部的氨基酸浓度数据的距离之和为最小的各氨基酸变数的高次 式。使用逻辑回归分析制作的候选多变量判别式是含有使似然率为最大的各氨基酸变数、 项中具有以一次式作为指数的自然对数的分数式。k-means法是探索k个各氨基酸浓度数 据聚类(近傍),在聚类点(近傍点)所属的组中,将最多的数据定义为该数据的所属组, 选择使输入的氨基酸浓度数据所属的组与定义的组最一致的氨基酸变数的方法。聚类分析 是将全部氨基酸浓度数据中位于最近距离的点之间进行聚类(群化)的方法。决策树是给 氨基酸变数排序,由序列上位的氨基酸变数可取得的图案来预测氨基酸浓度数据的组的方 法。返回多变量判别式制作处理的说明,本发明是在控制部,根据规定的验证方法,验 证(相互验证)步骤1中制作的候选多变量判别式组(步骤2)。候选多变量判别式组的验 证是对步骤1中制作的各候选多变量判别式组进行。步骤2中,可以根据自举(bootstrap)法或保持(hold out)法、留一(leave-one-out)法等中的至少一种,验证候选多变量判别式组的判别率或灵敏度、特异 性、信息量基准等中的至少一种。由此,可以制作考虑了癌症状态信息或诊断条件的、预测 性或可靠性高的候选多变量判别式组。这里,判别率是在全部输入数据中,本发明所评价的癌症的状态正确的比例。灵 敏度是在输入数据所记载的癌症的状态为患病的数据中,本发明所评价的癌症的状态正确 的比例。特异性是在输入数据所记载的癌症的状态为正常的数据中,本发明所评价的癌症 的状态正确的比例。信息量基准是将步骤1中制作的候选多变量判别式组的氨基酸变数的 数目、和本发明所评价的癌症的状态以及输入数据所记载的癌症的状态的差异加在一起所 得。预测性是将反复进行候选多变量判别式组的验证得到的判别率或灵敏度、特异性的平 均。可靠性是反复进行候选多变量判别式组的验证得到的判别率或灵敏度、特异性的离散。返回多变量判别式制作处理的说明,本发明是在控制部,根据规定的变数选择方 法,从步骤2的验证结果中选择候选多变量判别式组的变数,来选择在制作候选多变量判 别式组时使用的癌症状态信息中所含的氨基酸浓度数据的组合(步骤3)。氨基酸变数的选 择是对步骤1中制作的各候选多变量判别式组进行。由此可以适当选择候选多变量判别式 组的氨基酸变数。使用包含步骤3中选择的氨基酸浓度数据的癌症状态信息,再次运行步 马聚1 O步骤3中,可以根据逐步法、最优路径法(best path method)、聚类探索法(近傍 探索法,local search method)、遗传算法中的至少一种,从步骤2的验证结果中选择候选 多变量判别式组的氨基酸变数。这里,最优路径法是将候选多变量判别式组中所含的氨基酸变数一个个依次减 少,使候选多变量判别式组带来的评价指标最优化,由此选择氨基酸变数的方法。回到多变量判别式制作处理的说明中,本发明是在控制部,根据反复运行上述的 步骤1、步骤2和步骤3而累积的验证结果,从多个候选多变量判别式组中选出用作多变量 判别式组的候选多变量判别式组,由此制作多变量判别式组(步骤4)。候选多变量判别式 组的选出,例如有从按照相同的公式制作方法制作的候选多变量判别式组中选出最佳的情 况,也有从所有的候选多变量判别式组中选出最佳的情况。如上述说明,在多变量判别式制作处理中,根据癌症状态信息,通过一系列的流程 使与候选多变量判别式组的制作、候选多变量判别式组的验证和候选多变量判别式组的变 数的选择相关的处理体系化(系统化)并运行,由此可以制作最适合评价各癌症的状态的 多变量判别式,结果可以得到最适合评价癌症的种类的多变量判别式组(具体来说,是癌 症的多组判别用的多变量判别式组)。[2_2·系统构成]这里,参照图4 图20对实施方案2所述的癌症种类评价系统(以下可以称为本 系统)的构成进行说明。本系统只是一个举例,本发明并不限于此。首先,参照图4和图5对本系统的全体构成进行说明。图4是表示本系统的全体 构成的一个例子的图。图5是表示本系统的全体构成的又一例子的图。本系统如图4所 示,是经由网络300以可通信的方式将对于评价对象评价癌症的种类的癌症种类评价装置 100和提供评价对象的关于氨基酸浓度值的氨基酸浓度数据的信息通信终端装置即客户端 装置200连接在一起而构成。
本系统如图5所示,除癌症种类评价装置100或客户端装置200之外,还可以将保 存了在癌症种类评价装置100中制作多变量判别式时使用的癌症状态信息或用于评价癌 症状态的多变量判别式等的数据库装置400经由网络300以可通信的方式连接在一起而构 成。由此,经由网络300可以自癌症种类评价装置100向客户端装置200或数据库装置400、 或者自客户端装置200或数据库装置400向癌症种类评价装置100提供与癌症状态相关的 信息等。这里,与癌症状态相关的信息是对与包括人的生物的癌症状态相关的特定项目进 行测定所得的值的相关信息。与癌症状态相关的信息是在癌症种类评价装置100或客户端 装置200或其它装置(例如,各种计测装置等)中生成,主要积累在数据库装置400中。接着,参照图6 图18对本系统的癌症种类评价装置100的构成进行说明。图6 是表示本系统的癌症种类评价装置100的构成的一个例子的框图,只概念性表示了该构成 中与本发明有关的部分。癌症种类评价装置100由下述部分构成综合地控制该癌症种类评价装置100的 CPU(中央处理装置,Central Processing Unit)等的控制部102 ;经由路由器等的通信装 置和专用线等的有线或无线的通信线路,将该癌症种类评价装置与网络300以可通信的方 式连接在一起的通信接口部104 ;保存各种的数据库或表格或文件等的存储部106 ;与输入 装置112或输出装置114连接的输入输出接口部108,这些部分可以经由任意的通信线路以 可通信的方式连接。这里,癌症种类评价装置100可以与各种的分析装置(例如氨基酸分 析仪等)在同一框体中构成。癌症种类评价装置100的分散、综合的具体的形态并不限于 图示,可以将其全部或部分以对应各种负荷等的任意单元进行功能性或物理性地分散、综 合来构成。例如,可以使用CGI (公共网关接口,Common Gateway Interface)实现处理的 一部分。存储部106是存储装置,可以使用例如RAM和ROM等的存储装置、硬盘等的固定 盘装置、软盘、光盘等。存储部106中记录计算机程序,该计算机程序与OS(操作系统, Operating System)协同,对CPU发出指令,进行各种处理。存储部106如图所示,保存利用 者信息文件106a、氨基酸浓度数据文件106b、癌症状态信息文件106c、指定癌症状态信息 文件106d、多变量判别式关联信息数据库106e、判别值文件106f和评价结果文件106g。利用者信息文件106a中保存与利用者相关的利用者信息。图7是表示保存在利用 者信息文件106a中的信息的一个例子的图。保存在利用者信息文件106a中的信息如图7 所示,由用于专门识别利用者利用者ID、用于认证利用者是否为正当的利用者的利用者密 码、利用者姓名、用于专门识别利用者的所属机构的所属机构ID、用于专门识别利用者的所 属机构的部门的部门ID、部门名称和利用者的电子邮件地址相互关联地构成。返回图6,氨基酸浓度数据文件106b中保存关于氨基酸浓度值的氨基酸浓度数 据。图8是表示保存在氨基酸浓度数据文件106b中的信息的一个例子的图。保存在氨基 酸浓度数据文件106b中的信息如图8所示,由用于专门识别评价对象个体(样品)的个体 编号和氨基酸浓度数据相互关联地构成。这里,图8中,将氨基酸浓度数据作为数值即连续 尺度应用,氨基酸浓度数据也可以是名义尺度或顺序尺度。为名义尺度或顺序尺度时,可通 过对各状态赋予任意的数值进行分析。氨基酸浓度数据中还可以组合其它的生物信息(氨 基酸以外的代谢物的浓度或基因表达量、蛋白质表达量、被验者的年龄和性别、有无吸烟、 心电图的波形数值化所得的数据等)。
返回图6,癌症状态信息文件106c中保存制作多变量判别式时使用的癌症状态信 息。图9是表示保存在癌症状态信息文件106c中的信息的一个例子的图。保存在癌症状态 信息文件106c中的信息如图9所示,由个体编号、与表示癌症的状态的指标(指标Tl、指标 T2、指标T3...)相关的癌症状态指标数据(T)和氨基酸浓度数据相互关联地构成。这里, 图9中,癌症状态指标数据和氨基酸浓度数据以数值(即连续尺度)的形式应用,癌症状态 指标数据和氨基酸浓度数据也可以是名义尺度或顺序尺度。为名义尺度或顺序尺度时,可 通过对各状态赋予任意的数值进行分析。癌症状态指标数据是作为癌症的状态的标志物的 已知的单一的状态指标,可以使用数值数据。返回图6,指定癌症状态信息文件106d中保存在后述的癌症状态信息指定部102g 中指定的癌症状态信息。图10是表示保存在指定癌症状态信息文件106d中的信息的一个 例子。保存在指定癌症状态信息文件106d中的信息如图10所示,由个体编号、指定的癌症 状态指标数据和指定的氨基酸浓度数据相互关联地构成。返回图6,多变量判别式关联信息数据库106e由以下文件构成候选多变量判别 式文件106el,保存在后述的候选多变量判别式制作部102hl中制作的候选多变量判别式 组;验证结果文件106e2,保存后述的候选多变量判别式验证部102h2中的验证结果;选 择癌症状态信息文件106e3,保存包括在后述的变数选择部102h3中选择的氨基酸浓度数 据的组合的癌症状态信息;多变量判别式文件106e4,保存在后述的多变量判别式制作部 102h中制作的多变量判别式组。候选多变量判别式文件106el中保存在后述的候选多变量判别式制作部102hl中 制作的候选多变量判别式组。图11是表示保存在候选多变量判别式文件106el中的信息的 一个例子的图。保存在候选多变量判别式文件106el中的信息如图11所示,由顺序(rank) 和候选多变量判别式(图 11 中的 FjGly^ei^Phe,···)或 F2 (Gly,Leu,Phe,· · ·)、F3 (Gly, Leu, Phe,...)等)相互关联地构成。返回图6,验证结果文件106e2中保存后述的候选多变量判别式验证部102h2中的 验证结果。图12是表示保存在验证结果文件106e2中的信息的一个例子的图。保存在验 证结果文件106e2中的信息如图12所示,由顺序、候选多变量判别式(图12中的Fk(Gly, Leu, Phe, . · ·)或 Fm(Gly,Leu, Phe, . . .), Fl (Gly, Leu, Phe, . · ·)等)和各候选多变量判 别式的验证结果(例如各候选多变量判别式的评价值)相互关联地构成。返回图6,选择癌症状态信息文件106e3中保存癌症状态信息,该癌症状态信息包 括与在后述的变数选择部102h3中选择的变数对应的氨基酸浓度数据的组合。图13是表 示保存在选择癌症状态信息文件106e3中的信息的一个例子的图。保存在选择癌症状态信 息文件106e3中的信息如图13所示,由个体编号、在后述的癌症状态信息指定部102g中指 定的癌症状态指标数据和在后述的变数选择部102h3中选择的氨基酸浓度数据相互关联 地构成。返回图6,多变量判别式文件106e4中保存在后述的多变量判别式制作部102h中 制作的多变量判别式组。图14是表示保存在多变量判别式文件106e4中的信息的一个例 子的图。保存在多变量判别式文件106e4中的信息如图14所示,由顺序、多变量判别式(图 14 中的 Fp(Phe,...)或 Fp(Gly,Leu, Phe), Fk (Gly, Leu, Phe,...)等)、与各公式制作方法 对应的阀值和各多变量判别式的验证结果(例如,各多变量判别式的评价值)相互关联地构成。返回图6,判别值文件106f中保存在后述的判别值计算部102i中计算的判别值。 图15是表示保存在判别值文件106f中的信息的一个例子的图。保存在判别值文件106f 中的信息如图15所示,是用于专门识别评价对象个体(样品)的个体编号、顺序(用于专 门识别多变量判别式的编号)和判别值相互关联地构成。返回图6,评价结果文件106g中保存在后述的判别值基准评价部102 j中的评价结 果(具体来说,在后述的判别值基准判别部102jl中的判别结果)。图16是表示保存在评 价结果文件106g中的信息的一个例子的图。保存在评价结果文件106g中的信息由用于专 门识别评价对象个体(样品)的个体编号、预先取得的评价对象的氨基酸浓度数据、由各多 变量判别式计算的1个或多个的判别值和关于癌症的种类的评价结果(具体来说,是关于 是哪一种癌症的判别结果)相互关联地构成。返回图6,在存储部106中,除上述信息之外,作为其它信息,还记录有用于将网站 提供给客户端装置200的各种网站数据、CGI程序等。网站数据有用于表示后述的各种网 页的数据等,这些数据以例如用HTML或XML记述的文本文件的形式形成。用于制作网站数 据的部件用的文件(部品用“τ ””或操作用的文件(作業用Θ 7 τ· O )或其它临 时性的文件等也存储于存储部106中。在存储部106中,根据需要可以将发送给客户端装 置200的声音以如WAVE形式或AIFF形式的声音文件保存,或者将静止图像或动态图像以 如JPEG形式或MPEG2形式的图像文件的形式保存。通信接口部104连通癌症种类评价装置100和网络300 (或路由器等的通信装置) 之间的通信。即,通信接口部104具有经由通信线路与其它终端进行数据通信的功能。输入输出接口部108与输入装置112或输出装置114连接。这里,输出装置114 除了使用监视器(包括家庭用电视)之外,也可以使用扩音器或打印机(以下可以将输出 装置114称为监视器114)。输入装置112除了使用键盘或鼠标或麦克风之外,还可以使用 与鼠标协同、实现指点器(pointing device)功能的监视器。控制部102具有用于保存OS(操作系统)等的控制程序、规定各种处理顺序等的 程序和所需要的数据等的内存,根据这些程序运行各种信息处理。控制部102如图所示,大 致具备要求解释部102a、阅览处理部102b、认证处理部102c、电子邮件生成部102d、网页生 成部102e、接收部102f、癌症状态信息指定部102g、多变量判别式制作部102h、判别值计算 部102i、判别值基准评价部102j、结果输出部102k和发送部102m。控制部102对于由数据 库装置400发送的癌症状态信息或由客户端装置200发送的氨基酸浓度数据进行有缺失值 的数据的除去、偏离值大的数据的除去、除去有缺失值的数据的多个变数等的数据处理。要求解释部102a是解释来自客户端装置200或数据库装置400的要求内容,根据 该解释结果,将处理交付控制部102的各部。阅览处理部102b接受来自客户端装置200的 各种画面的阅览要求,进行这些画面的网站数据的生成或发送。认证处理部102c接受来自 客户端装置200或数据库装置400的认证要求,进行认证判断。电子邮件生成部102d生成 包含各种信息的电子邮件。网页生成部102e生成利用者可在客户端装置200阅览的网页。接收部102f经由网络300,接收由客户端装置200或数据库装置400发送的信息 (具体来说,氨基酸浓度数据或癌症状态信息、多变量判别式组等)。癌症状态信息指定部 102g在制作多变量判别式组时,指定作为对象的癌症状态指标数据和氨基酸浓度数据。
多变量判别式制作部102h根据在接收部102f中接收的癌症状态信息、或在癌症 状态信息指定部102g中指定的癌症状态信息来制作多变量判别式组。具体来说,多变量判 别式制作部102h是根据反复运行候选多变量判别式制作部102hl、候选多变量判别式验证 部102h2和变数选择部102h3而累积的验证结果,根据癌症状态信息,从多个候选多变量判 别式组中选出用作多变量判别式组的候选多变量判别式组,来制作多变量判别式组。多变量判别式组预先保存在存储部106的规定的存储区域时,多变量判别式制作 部102h可以通过从存储部106中选择所需要的多变量判别式组来制作多变量判别式组。多 变量判别式制作部102h通过从预先保存了多变量判别式组的其它的计算机装置(例如数 据库装置400)中选择所需要的多变量判别式组并下载,可以制作多变量判别式组。这里,参照图17对多变量判别式制作部102h的构成进行说明。图17是表示多 变量判别式制作部102h的构成的框图,该构成中只概念性地表示了与本发明有关的部分。 多变量判别式制作部102h进一步具备候选多变量判别式制作部102hl、候选多变量判别式 验证部102h2和变数选择部102h3。候选多变量判别式制作部102hl是根据规定的公式制 作方法,由癌症状态信息制作多变量判别式组的候选即候选多变量判别式组。候选多变量 判别式制作部102hl可以将多种不同的公式制作方法结合使用,根据癌症状态信息制作多 个候选多变量判别式组。候选多变量判别式验证部102h2根据规定的验证方法,验证在候 选多变量判别式制作部102hl中制作的候选多变量判别式组。候选多变量判别式验证部 102h2还可以根据自举法、保持法、留一法中的至少一种,对于候选多变量判别式的判别率、 灵敏度、特异性、信息量基准中的至少一种进行验证。变数选择部102h3根据规定的变数 选择方法,从候选多变量判别式验证部102h2的验证结果中选择候选多变量判别式组的变 数,来选择在制作候选多变量判别式组时使用的癌症状态信息中所含的氨基酸浓度数据的 组合。变数选择部102h3还可根据逐步法、最优路径法、聚类探索法、遗传算法中的至少一 种,从验证结果中选择候选多变量判别式组的变数。返回图6,判别值计算部102i根据在多变量判别式制作部102h中制作的含有 Glu、ABA、Val、Met、Pro、Phe, Thr, lie、Leu、His中的至少一种氨基酸作为变数、由1个或 多个多变量判别式构成的多变量判别式组以及在接收部102f中接收的评价对象的氨基酸 浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的 浓度值,通过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判 别值。这里,构成多变量判别式组的各多变量判别式可以是分数式、逻辑回归式、线性判 别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公式、由典型判别分析 制作的公式、由决策树制作的公式的任意一种。具体来说,多变量判别式组可以是以下的判 别式组1 16的任意一组。[判别式组 1]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、His、Orn, Lys、Arg作为变数的5个线性1次式;[判别式组 2]以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp, Orn, Lys 作为变数的4个线性1次式;[判别式组 3]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Leu、Phe、His、Arg 作为变数的4个线性1次式;
[判别式组4]以年龄、性别、1111~、6111、?1~0^8六、¥31』6仏116、1^11、?1^、见8作为 变数的4个线性1次式;[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组 6]以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 作为变数的 3 个线性1次式;[判别式组 7]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、Orn、Arg作为变数的4个线性1次式;[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组9]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe, Arg 作为变数 的3个线性1次式;[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1 次式;[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;[判别式组 13]以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、 Tyr, Phe、His、Trp, Orn, Lys、Arg作为变数的2个线性1次式;[判别式组14]以6111、6111、484、¥31、116、?1^、4印作为变数的2个线性1次式;[判别式组15]以Thr、Glu、Gin、ABA、Ile、Leu、Arg作为变数的2个线性1次式;[判别式组16]以 Thr、Gin、Ala、Cit、ABA、lie、His、Orn、Arg 作为变数的 2 个分数式。判别值基准评价部102j根据由在判别值计算部102i计算的1个或多个判别值构 成的判别值组,对于评价对象评价癌症的种类。判别值基准评价部102j进一步具备判别值 基准判别部102jl。这里,参照图18对判别值基准评价部102j的构成进行说明。图18是 表示判别值基准评价部102j的构成的框图,只概念性地表示了该构成中与本发明有关的 部分。判别值基准判别部102jl根据判别值组,对于评价对象,从预先设定的多个种类的 癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌 症(更具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症))中判别其 是哪一种癌症。具体来说,判别值基准判别部102jl通过对判别值组和预先设定的阀值进 行比较,对于评价对象,从预先设定的多个种类的癌症(具体来说,是大肠癌、乳癌、前列腺 癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种癌症(更具体来说,是大肠癌、乳癌、前列腺 癌、甲状腺癌、肺癌中的至少3种癌症))中判别其是哪一种癌症。返回图6,结果输出部102k将控制部102的各处理部中的处理结果(包括在判别 值基准评价部102j中的评价结果(具体来说,是在判别值基准判别部102jl中的判别结 果))等输出到输出装置114中。发送部102m对评价对象的氨基酸浓度数据的发送源头的客户端装置200发送评 价结果,或对数据库装置400发送在癌症种类评价装置100中制作的多变量判别式或评价结果。
接着,参照图19对本系统的客户端装置200的构成进行说明。图19是表示本系 统的客户端装置200的构成的一个例子的框图,只概念性地表示该构成中与本发明有关的 部分。客户端装置200由控制部210、R0M220、HD230、RAM240、输入装置250、输出装置 260、输入输出IF270和通信IF280构成,这些各部经由任意的通信线路以可通信的方式连接。控制部210具备网页浏览器211、电子邮箱212、接收部213、发送部214。网页浏 览器211进行解释网站数据、将解释的网站数据显示在后述的监视器261上的浏览处理。 可以在网页浏览器211中插入具备进行影像流的接收、显示、反馈等的功能的流式播放器 等的各种软件。电子邮箱212按照规定的通信协议(例如,SMTP (简单邮件传输协议)或 P0P3(邮局协议的第3个版本)等)进行电子邮件的发送接收。接收部213经由通信IF280, 接收由癌症种类评价装置100发送的评价结果等的各种信息。发送部214经由通信IF280, 将评价对象的氨基酸浓度数据等的各种信息发送至癌症种类评价装置100。输入装置250是键盘或鼠标或麦克风等。后述的监视器261也与鼠标协同,实现 指点器功能。输出装置260是将经由通信IF280接收的信息进行输出的输出装置,包含监 视器(包括家庭用电视机)261和打印机262。除此之外还可以在输出装置260中设置扩音 器等。输入输出IF270与输入装置250或输出装置260连接。通信IF280将客户端装置200与网络300 (或路由器等的通信装置)以可通信的 方式连接。换言之,客户端装置200经由调制解调器或TA或路由器等的通信装置以及电话 线路,或者经由专用线,与网络300连接。由此,客户端装置200按照规定的通信协议与癌 症评价装置100连通(access)。这里,通过在根据需要连接了打印机、监视器、图像扫描仪等的外围装置的信息处 理装置(例如,已知的个人计算机、工作站、家庭用游戏装置、互联网TV、PHS终端、便携终 端、移动通信终端、PDA等的信息处理终端等)上安装可实现网站数据的浏览功能或电子邮 件功能的软件(程序、数据等),也可以实现客户端装置200。客户端装置200的控制部210中,通过CPU和由该CPU解释并运行的程序,也可实 现在控制部210中进行的处理的全部或任意的一部分。R0M220或HD230中记录与OS (操 作系统)协同、对CPU发出指令、用于进行各种处理的计算机程序。该计算机程序通过装载 在RAM240中来运行,与CPU协同,构成控制部210。该计算机程序可以记录在经由任意的网 络与客户端装置200连接的应用程序服务器中,客户端装置200可以根据需要下载其全部 或部分。还可通过布线逻辑等的硬件实现在控制部210中进行的处理的全部或任意的一部 分。接着,参照图4、图5对本系统的网络300进行说明。网络300具有以可通信的方 式将癌症种类评价装置100和客户端装置200和数据库装置400相互连接在一起的功能, 例如互联网或内联网或LAN(包括有线/无线两者)等。网络300可以是VAN、个人计算机 通信网、公众电话网(包括模拟/数字两者)、专用线路网(包括模拟/数字两者)、CATV 网、便携线路交换网或便携网络包交换网(包括IMT2000方式、GSM方式或PDC/PDC-P方式 等)、无线呼出网、Bluetooth(蓝牙)(注册商标)等的局域无线网、PHS网或卫星通信网 (包括CS、BS或ISDB等)等。
接着,参照图20对本系统的数据库装置400的构成进行说明。图20是表示本系 统的数据库装置400的构成的一个例子的框图,只概念性地表示了该构成中与本发明有关 的部分。数据库装置400具有保存在癌症种类评价装置100或该数据库装置400中制作 多变量判别式组时使用的癌症状态信息、在癌症种类评价装置100中制作的多变量判别式 组、癌症种类评价装置100中的评价结果等的功能。如图20所示,数据库装置400由综合 控制该数据库装置400的CPU等的控制部402、经由路由器等的通信装置以及专用线等的有 线或无线通信线路将该数据库装置400与网络300以可通信的方式连接的通信接口部404、 保存各种的数据库或表格或文件(例如网页用文件)等的存储部406、与输入装置412或输 出装置414连接的输入输出接口部408构成,这些各部经由任意的通信线路以可通信的方 式连接。存储部406是存储装置,例如可使用RAM、ROM等的存储装置、或硬盘等的固定盘 装置、或软盘、或光盘等。存储部406中保存各种处理中所使用的各种程序等。通信接口部 404连通数据库装置400与网络300 (或路由器等的通信装置)之间的通信。即,通信接口 部404具有经由通信线路与其它终端进行数据通信的功能。输入输出接口部408与输入装 置412或输出装置414连接。这里,输出装置414除使用监视器(包括家庭用电视机)之 外,还可以使用扩音器或打印机(以下,有时将输出装置414记为监视器414)。输入装置 412除键盘或鼠标或麦克风之外,还可以使用与鼠标协同、实现指点器功能的监视器。控制部402具有用于保存OS(操作系统)等的控制程序、对各种处理顺序等进行 规定的程序、所需数据等的内存,根据这些程序运行各种信息处理。控制部402如图所示, 大体具备要求解释部402a、阅览处理部402b、认证处理部402c、电子邮件生成部402d、网页 生成部402e和发送部402f。要求解释部402a解释来自癌症种类评价装置100的要求内容,根据该解释结果, 将处理交付给控制部402的各部。阅览处理部402b接受来自癌症种类评价装置100的各 种画面的阅览要求,进行这些画面的网站数据的生成或发送。认证处理部402c接受来自癌 症种类评价装置100的认证要求,进行认证判断。电子邮件生成部402d生成包含各种信息 的电子邮件。网页生成部402e生成利用者通过客户端装置200阅览的网页。发送部402f 将癌症状态信息或多变量判别式组等的各种信息发送给癌症种类评价装置100。[2-3.本系统的处理]这里,参照图21对由如上构成的本系统进行的癌症种类评价服务处理的一个例 子进行说明。图21是表示癌症种类评价服务处理的一个例子的流程图。本处理中使用的氨基酸浓度数据是针对从个体预先采集到的血液进行分析而得 到的与氨基酸的浓度值相关的数据。这里,对血液中的氨基酸的分析方法进行简单说明。首 先,将采血得到的血样采集到经肝素处理的管中,然后对该管进行离心,分离血浆。分离的 全部的血浆样品在_70°C下冷冻保存至氨基酸浓度测定之前。测定氨基酸浓度时,在血浆样 品中添加硫代水杨酸调节为3%浓度,由此进行除蛋白处理。氨基酸浓度的测定采用氨基酸 分析仪,该氨基酸分析仪以使用柱后茚三酮反应的高效液相色谱(HPLC)为原理。首先,在显示了网页浏览器211的画面上,利用者经由输入装置250来指定癌症种 类评价装置100所提供的网站的地址(URL等),客户端装置200与癌症种类评价装置100连通。具体来说,利用者指示客户端装置200的网页浏览器211的画面更新,则网页浏览器 211通过规定的通信协议,将癌症种类评价装置100所提供的网站的地址发送给癌症种类 评价装置100,通过基于该地址的路由,对癌症种类评价装置100提出发送与氨基酸浓度数 据发送画面对应的网页的要求。接着,癌症种类评价装置100在要求解释部102a接受来自客户端装置200的发 送,分析该发送的内容,根据分析结果将处理转移至控制部102的各部。具体来说,发送的 内容是要求发送与氨基酸浓度数据发送画面对应的网页时,癌症种类评价装置100主要是 在阅览处理部102b取得保存在存储部106的规定的存储区域、用于显示该网页的网站数 据,将取得的网站数据发送给客户端装置200。更具体地说,利用者要求发送与氨基酸浓度 数据发送画面对应的网页时,癌症种类评价装置100首先在控制部102要求利用者输入利 用者ID或利用者密码。输入利用者ID或密码后,癌症种类评价装置100在认证处理部102c 对输入的利用者ID或密码、和保存在利用者信息文件106a中的利用者ID或利用者密码进 行认证判断。只在可以认证时,癌症种类评价装置100在阅览处理部102b将用于显示与氨 基酸浓度数据发送画面对应的网页的网站数据发送至客户端装置200。客户端装置200的 特定是通过在来自客户端装置200的发送要求的同时发送的IP地址进行。接着,客户端装置200在接收部213接收由癌症种类评价装置100发送的网站数 据(用于显示与氨基酸浓度数据发送画面对应的网页),在网页浏览器211解释所接收的网 站数据,将氨基酸浓度数据发送画面显示在监视器261上。接着,利用者经由输入装置250,对于显示在监视器261上的氨基酸浓度数据发送 画面进行个体的氨基酸浓度数据等的输入、选择,则客户端装置200在发送部214将用于特 定输入信息或选择事项的标识符发送至癌症种类评价装置100,由此将评价对象个体的氨 基酸浓度数据发送至癌症种类评价装置100 (步骤SA-21)。步骤SA-21中的氨基酸浓度数 据的发送可通过FTP等的现有的文件传输技术等来实现。接着,癌症种类评价装置100在要求解释部102a解释由客户端装置200发送的标 识符,由此解释客户端装置200的要求内容,将癌症的种类评价用(具体来说,是多组判别 用,判别是预先设定的多个种类的癌症中的哪一种癌症)的多变量判别式组的发送要求发 送至数据库装置400。接着,数据库装置400在要求解释部402a解释来自癌症种类评价装置100的发送 要求,将保存在存储部406的规定的存储区域的、含有Glu、ABA、Val, Met、Pro、Phe, Thr, Ile、LeU、HiS中的至少一种氨基酸作为变数、由1个或多个多变量判别式(例如,更新的最 新的多变量判别式)构成的多变量判别式组发送至癌症种类评价装置100 (步骤SA-22)。这里,步骤SA-22中,发送至癌症种类评价装置100的构成多变量判别式组的各多 变量判别式可以是分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公 式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任意一 种。具体来说,多变量判别式组可以是以下的判别式组1 16的任意一组。[判别式组 1]以年龄、性别、1111~、6111、6111、卩1~0、(^仏六8六、¥31、]^仏116、1^11、1又1·、 Phe、His、Orn, Lys、Arg作为变数的5个线性1次式;[判别式组 2]以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp, Orn, Lys 作为变数的4个线性1次式;
[判别式组 3]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Leu、Phe, His、Arg 作为变数的4个线性1次式;[判别式组4]以年龄、性别、1111~、6111、?1~0、六8六、¥31^6仏116、1^11、?1^、见8作为 变数的4个线性1次式;[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组6]以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 作为变数的 3 个线性1次式;[判别式组 7]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、Orn、Arg作为变数的4个线性1次式;[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组9]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe, Arg 作为变数 的3个线性1次式;[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1 次式;[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;[判别式组 13]以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、 Tyr, Phe、His、Trp, Orn, Lys、Arg作为变数的2个线性1次式;[判别式组14]以6111、6111、484、¥31、116、?1^、4印作为变数的2个线性1次式;[判别式组15]以11^、6111、6111、484、116、1^11、4印作为变数的2个线性1次式;[判别式组16]以 Thr、Gin、Ala、Cit、ABA、lie、His、Orn、Arg 作为变数的 2 个分数式。接着,癌症种类评价装置100在接收部102f接收由客户端装置200发送的个体的 氨基酸浓度数据和由数据库装置400发送的多变量判别式组,将接收的氨基酸浓度数据保 存在氨基酸浓度数据文件106b的规定的存储区域,同时将构成接收的多变量判别式组的 各多变量判别式保存在多变量判别式文件106e4的规定的存储区域(步骤SA-23)。接着,癌症种类评价装置100在控制部102,从在步骤SA-23接收的个体的氨基酸 浓度数据中除去缺失值或偏离值等的数据(步骤SA-24)。接着,癌症种类评价装置100在判别值计算部102i,根据在步骤SA-24中除去了缺 失值或偏离值等数据的个体的氨基酸浓度数据中所含的6111、484、¥31^讨、?1~0、?1^、1111·、 lie、Leu、His中的至少一种氨基酸的浓度值以及在步骤SA-23接收的多变量判别式组,通 过构成该多变量判别式组的每个多变量判别式,计算该多变量判别式的值即判别值(步骤 SA-25)。接着,癌症种类评价装置100在判别值基准判别部102jl对由在步骤SA-25中计 算的1个或多个判别值构成的判别值组和预先设定的阀值进行比较,对于个体,从预先设 定的多个种类的癌症(具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌 中的至少2种癌症(更具体来说,是大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种癌症))中判别其是哪一种癌症,将该判别结果保存在评价结果文件106g的规定的存储区 域(步骤SA-26)。接着,癌症种类评价装置100在发送部102m将在步骤SA-26中得到的判别结果 (关于是哪一种癌症的判别结果)发送至氨基酸浓度数据的发送源头的客户端装置200和 数据库装置400 (步骤SA-27)。具体来说,首先,癌症种类评价装置100在网页生成部102e 中制作用于显示判别结果的网页,将与制作的网页对应的网站数据保存在存储部106的规 定存储区域。接着,利用者经由输入装置250,向客户端装置200的网页浏览器211输入 规定的URL,通过了上述认证后,客户端装置200将阅览该网页的要求发送给癌症种类评价 装置100。接着,癌症种类评价装置100在阅览处理部102b解释由客户端装置200发送的 阅览要求,由存储部106的规定的存储区域读取与用于显示判别结果的网页对应的网站数 据。癌症种类评价装置100在发送部102m将读取的网站数据发送至客户端装置200,同时 将该网站数据或判别结果发送至数据库装置400。这里,在步骤SA-27中,癌症种类评价装置100可以在控制部102通过电子邮件将 判别结果通知利用者的客户端装置200。具体来说,首先,癌症种类评价装置100在电子邮 件生成部102d,基于利用者ID等,按照发送时间,参照保存在利用者信息文件106a中的利 用者信息,取得利用者的电子邮件地址。接着,癌症种类评价装置100在电子邮件生成部 102d,以获得的电子邮件地址为发送地址,生成包含利用者的姓名和判别结果的电子邮件 相关的数据。接着,癌症种类评价装置100在发送部102m将生成的该数据发送至利用者的 客户端装置200。步骤SA-27中,癌症种类评价装置100可通过FTP等的已有的文件传输技术等,将 判别结果发送至利用者的客户端装置200。返回图21的说明,数据库装置400在控制部402接收由癌症种类评价装置100发 送的判别结果或网站数据,将接收的判别结果或网站数据保存(积累)在存储部406的规 定的存储区域(步骤SA-28)。客户端装置200在接收部213接收由癌症种类评价装置100发送的网站数据,在 网页浏览器211中解释接收的网站数据,将记录有个体的判别结果的网页的画面显示在监 视器261上(步骤SA-29)。判别结果通过电子邮件由癌症种类评价装置100发送时,由于 电子邮箱212的公知的功能,客户端装置200可以在任意的时间接收由癌症种类评价装置 100发送的电子邮件,并将接收的电子邮件显示在监视器261上。以上,利用者通过阅览在监视器261上显示的网页,可以确认关于癌症的多组判 别的个体的判别结果。利用者可以通过打印机262打印显示在监视器261上的网页的显示 内容。判别结果通过电子邮件由癌症种类评价装置100发送时,利用者通过阅览在监视 器261上显示的电子邮件,可以确认关于癌症的多组判别的个体的判别结果。利用者可以 通过打印机262打印显示在监视器261上的电子邮件的显示内容。至此,癌症评价服务处理的说明结束。[2-4.实施方案2的总结、以及其它的实施方案]如上述详细说明,根据癌症种类评价系统,客户端装置200将个体的氨基酸浓度 数据发送至癌症种类评价装置100,数据库装置400接受来自癌症种类评价装置100的要求,将癌症的多组判别用的多变量判别式组(含有Glu、ABA、Val, Met, Pro、Phe, Thr, lie、 LeiuHis中的至少一种氨基酸作为变数的由1个或多个多变量判别式构成的多变量判别式 组)发送至癌症种类评价装置100。癌症种类评价装置100运行以下步骤(1)接收来自 客户端装置200的氨基酸浓度数据,同时由数据库装置400接收多变量判别式组;(2)根据 接收的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe, Thr, lie、Leu、His中的至 少一种氨基酸的浓度值和多变量判别式组,通过构成该多变量判别式组的每个多变量判别 式,计算该多变量判别式的值即判别值;(3)通过对算出的由1个或多个的判别值构成的判 别值组和预先设定的阀值进行比较,对于个体,由预先设定的多个种类的癌症中判别其是 哪一种癌症;(4)将该判别结果发送至客户端装置200或数据库装置400。客户端装置200 接收由癌症种类评价装置100发送的判别结果并显示,数据库装置400接收由癌症种类评 价装置100发送的判别结果并保存。由此,利用由对于癌症的多组判别有用的多变量判别 式组得到的判别值组,可以高精度地进行癌症的多组判别。这里,根据癌症评价系统,构成多变量判别式组的各多变量判别式可以是分数式、 逻辑回归式、线性判别式、多重回归式、由支持向量机制作的公式、由马氏距离法制作的公 式、由典型判别分析制作的公式、由决策树制作的公式的任意一种。具体来说,多变量判别 式组可以是以下的判别式组1 16的任意一组。由此,利用由对于癌症的多组判别特别有 用的多变量判别式组得到的判别值组,可以进一步高精度地进行癌症的多组判别。[判别式组 1]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、His、Orn, Lys、Arg作为变数的5个线性1次式;[判别式组 2]以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp, Orn, Lys 作为变数的4个线性1次式;[判别式组 3]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Leu、Phe、His、Arg 作为变数的4个线性1次式;[判别式组4]以年龄、性别、1111~、6111、?1~0、六8六、¥31^6仏116、1^11、?1^、见8作为 变数的4个线性1次式;[判别式组5]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组 6]以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 作为变数的 3 个线性1次式;[判别式组 7]以年龄、性别、1111~、6111、6111、卩1~0、(^^8六、¥31、]^仏116、1^11、1又1·、 Phe、Orn、Arg作为变数的4个线性1次式;[判别式组8]以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为变数的3个线性1次 式;[判别式组9]以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe、Arg 作为变数 的3个线性1次式;[判别式组10]以年龄、性别、Thr、Glu、Pro、ABA、Val、Met作为变数的3个线性1 次式;[判别式组11]以年龄、Cit、ABA、Val、Met作为变数的2个线性1次式;[判别式组12]以年龄、Thr、Glu、Pro、Met、Phe作为变数的2个线性1次式;
[判别式组 13]以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、Ile、Leu、 Tyr, Phe、His、Trp, Orn, Lys、Arg作为变数的2个线性1次式;[判别式组14]以6111、6111、484、¥31、116、?1^、4印作为变数的2个线性1次式;[判别式组15]以11^、6111、6111、484、116、1^11、4印作为变数的2个线性1次式;[判别式组16]以 Thr、Gln、Ala、Cit、ABA、Ile、His、Orn、Arg 作为变数的 2 个分数式。构成这些多变量判别式组的各多变量判别式可按照本申请人的国际申请即国际 公开第2004/052191号中所述的方法、或本申请人的国际申请即国际公开第2006/098192 号中所述的方法(后述的多变量判别式制作处理)制作。如果是由这些方法得到的多变量 判别式,则不管作为输入数据的氨基酸浓度数据中的氨基酸浓度的单位,该多变量判别式 均可适用于癌症的种类的评价。本发明所述的癌症种类评价装置、癌症评价方法、癌症评价系统、癌症评价程序和 记录介质除了上述的实施方案2以外,可以以各种不同的实施方案实施。例如,在上述的 实施方案2中说明的各处理中,以自动进行的形式说明的处理的全部或一部分可以是手动 进行,以手动进行的形式说明的处理的全部或一部分可以按照公知的方法自动进行。除此 之外,除了特别说明的之外,上述文章中或附图中表示的处理顺序、控制顺序、具体名称、各 种登录数据以及包括检索条件等的参数的信息、画面例、数据库构成均可任意变更。例如关 于癌症种类评价装置100,图示的各构成要素是功能概念性的,物理学上未必是如图示的构 成。另外,关于癌症种类评价装置100的各部或各装置所具备的处理功能(特别是通过控 制部102进行的各处理功能),可通过CPU(中央处理单元)以及由该CPU解释并运行的程 序来实现其全部或任意的一部分,也可以以接线逻辑的硬件的形式实现。这里,“程序”是通过任意的语言或记述方法记述的数据处理方法,不管其源代码 或二进制代码等的形式。“程序”并不限于单一构成,包含多种模块或以库的形式分散构成 的程序、或与以OS(操作系统)为代表的个别程序协同来实现其功能的程序。程序记录在 记录介质上,根据需要,可以机械读取到癌症种类评价装置100中。关于在各装置中读取记 录在记录介质上的程序的具体的构成或读取程序或读取后的安装程序等,可以采用周知的 构成或程序。“记录介质”包含任意的“可移动的物理介质”或任意的“固定的物理介质”或“通 信介质”。“可移动的物理介质”是软盘、光磁盘、R0M、EPR0M、EEPR0M、CD_R0M、M0或DVD等。 “固定的物理介质”是内置于各种计算机系统的ROM、RAM或HD等。“通信介质”如经由LAN 或WAN或互联网等网络发送程序时的通信线路或载波,是短期保有程序的介质。最后,参照图22对于在癌症种类评价装置100中进行的多变量判别式制作处理的 一个例子进行详细说明。图22是表示多变量判别式制作处理的一个例子的流程图。该多 变量判别式制作处理是对于将评价癌症的种类时作为对象的癌症(具体来说,是上述的大 肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌等)汇总得到的数据一并实行。该多变 量判别式制作处理可以在管理癌症状态信息的数据库装置400中进行。本说明中,癌症种类评价装置100是将事先由数据库装置400取得的癌症状态信 息保存在癌症状态信息文件106c的规定的存储区域。癌症种类评价装置100是将事先在 癌症状态信息指定部102g中指定的包含癌症状态指标数据和氨基酸浓度数据的癌症状态信息保存在指定癌症状态信息文件106d的规定的存储区域。首先,多变量判别式制作部102h是在候选多变量判别式制作部102hl中,根据规 定的公式制作方法,由保存在指定癌症状态信息文件106d的规定的存储区域的癌症状态 信息制作候选多变量判别式组,将制作的候选多变量判别式组保存在候选多变量判别式文 件106el的规定的存储区域(步骤SB-21)。具体来说,首先,多变量判别式制作部102h是 在候选多变量判别式制作部102hl中,从多种不同的公式制作方法(包含关于主成分分析 或判别分析、支持向量机、多重回归分析、逻辑回归分析、k-means法、聚类分析、决策树等的 多变量分析的方法)中选择所需的一种,根据所选择的公式制作方法,确定制作的候选多 变量判别式组的形式(公式的形式)。接着,多变量判别式制作部102h是在候选多变量判 别式制作部102hl中,根据癌症状态信息,运行与所选择的公式选择方法对应的各种(例 如平均或分散等)的计算。接着,多变量判别式制作部102h是在候选多变量判别式制作 部102hl中,确定计算结果和所确定的候选多变量判别式组的参数。由此,根据所选择的公 式制作方法来制作候选多变量判别式组。将多种不同的公式制作方法结合使用、同时并行 (并列)地制作候选多变量判别式组时,可以根据每种所选择的公式制作方法,将上述处理 并行运行。另外,将多种不同的公式制作方法结合使用、依次制作候选多变量判别式组时, 例如可以利用进行主成分分析制作的候选多变量判别式组,变换癌症状态信息,对变换的 癌症状态信息进行判别分析,由此制作候选多变量判别式组。接着,多变量判别式制作部102h是在候选多变量判别式验证部102h2中,根据规 定的验证方法,对在步骤SB-21中制作的候选多变量判别式组进行验证(相互验证),将验 证结果保存在验证结果文件106e2的规定的存储区域(步骤SB-22)。具体来说,多变量判 别式制作部102h是在候选多变量判别式验证部102h2中,根据保存在指定癌症状态信息文 件106d的规定的存储区域的癌症状态信息,制作验证候选多变量判别式组时使用的验证 用数据,根据制作的验证用数据来验证候选多变量判别式组。在步骤SB-21中结合使用多 种不同的公式制作方法,制作多种候选多变量判别式组时,多变量判别式制作部102h是在 候选多变量判别式验证部102h2中,对于每种与各公式制作方法对应的候选多变量判别式 组,按照规定的验证方法进行验证。这里,在步骤SB-22中,可以根据自举法或保持法、留一 法等中的至少一种,对候选多变量判别式组的判别率或灵敏度、特异性、信息量基准等中的 至少一种进行验证。由此,可以选择考虑了癌症状态信息或诊断条件的、预测性或可靠性高 的候选指标式组。接着,多变量判别式制作部102h是在变数选择部102h3中,根据规定的变数选择 方法,由步骤SB-22中的验证结果选择候选多变量判别式组的变数,由此选择在制作候选 多变量判别式组时使用的癌症状态信息中所含的氨基酸浓度数据的组合,将包含所选择的 氨基酸浓度数据的组合的癌症状态信息保存在选择癌症状态信息文件106e3的规定的存 储区域(步骤SB-23)。在步骤SB-21中,结合使用多种不同的公式制作方法,制作多种候选 多变量判别式组,在步骤SB-22中,根据规定的验证方法,对于每种与各公式制作方法对应 的候选多变量判别式组进行验证时,在步骤SB-23中,多变量判别式制作部102h是在变数 选择部102h3中,对每种与步骤SB-22的验证结果对应的候选多变量判别式组,根据规定的 变数选择方法选择候选多变量判别式组的变数。这里,步骤SB-23中,可以根据逐步法、最 优路径法、聚类探索法、遗传算法中的至少一种,由验证结果选择候选多变量判别式组的变
40数。最优路径法是将候选多变量判别式组中所含的变数一个个依次减少,使候选多变量判 别式组所赋予的评价指标最佳化,由此选择变数的方法。步骤SB-23中,多变量判别式制作 部102h可以是在变数选择部102h3中,根据保存在指定癌症状态信息文件106d的规定的 存储区域的癌症状态信息,选择氨基酸浓度数据的组合。接着,多变量判别式制作部102h判定保存在指定癌症状态信息文件106d的规定 的存储区域的癌症状态信息中所含的全部氨基酸浓度数据的组合是否结束,判定结果为 “结束”时(步骤SB-24:是),进入下一步骤(步骤SB-25),判定结果为未“结束”时(步骤 SB-24:否),返回步骤SB-21。多变量判别式制作部102h判定预先设定的次数是否结束,判 定结果为“结束”时(步骤SB-24 是),进入下一步骤(步骤SB-25),判定结果为未“结束” 时(步骤SB-24 否),可以返回步骤SB-21。多变量判别式制作部102h判定在步骤SB-23 中选择的氨基酸浓度数据的组合与保存在指定癌症状态信息文件106d的规定的存储区域 的癌症状态信息中所含的氨基酸浓度数据的组合或在上一步骤SB-23中选择的氨基酸浓 度数据的组合是否相同,判定结果为“相同”时(步骤SB-24 是),进入下一步骤(步骤 SB-25),判定结果为不“相同”时(步骤SB-24:否),可以返回步骤SB-21。具体来说,验证 结果为关于各候选多变量判别式组的评价值时,多变量判别式制作部102h可根据该评价 值和与各公式制作方法对应的规定的阀值的比较结果,判定是进入步骤SB-25还是返回步 骤 SB-21。接着,多变量判别式制作部102h根据验证结果,从多种候选多变量判别式组中选 出用作多变量判别式组的候选多变量判别式组,由此确定多变量判别式组,将确定的多变 量判别式组(选出的候选多变量判别式组)保存在多变量判别式文件106e4的规定的存储 区域(步骤SB-25)。这里,在步骤SB-25中,例如有从按照相同的公式制作方法制作的候 选多变量判别式组中选出最佳的情况,也有从全部的候选多变量判别式组中选出最佳的情 况。至此,对多变量判别式制作处理的说明结束。实施例1通过上述的氨基酸分析法,针对确诊为各种癌症患者组的血样以及非癌症组的血 样测定血液中氨基酸浓度。氨基酸浓度的单位是nmol/ml。与各种癌症患者和非癌症患者 的氨基酸变数的分布相关的箱线图如图23、图24所示。图23表示与男性的各种癌症患者 和非癌症患者的氨基酸变数的分布相关的箱线图,图24表示与女性的各种癌症患者和非 癌症患者的氨基酸变数的分布相关的箱线图。图23、图24中,横轴表示非癌症组和各种癌 症组,图中的ABA表示0^8々((1-氨基丁酸)。并且,为了进行各种癌症组和非癌症组的判 别,对于通过各氨基酸变数进行的各种癌症组和非癌症组的判别,通过一元配置分散分析 来进行评价,男性数据中,氨基酸变数Glu、Pro、Val、Leu、Phe、His、Trp、Orn、Lys的ρ值显 示出小于0. 05的值,女性数据中,氨基酸变数Asn、Glu、Pro、Cit、ABA、Met、lie、Leu、Tyr, Phe、His、Arg的ρ值显示出小于0. 05的值(图25)。由此表明,氨基酸变数Asn、Glu、Pro、 Cit、ABA、Val、Met、Ile、Leu、Tyr、Phe、His、Trp、Orn、Lys、Arg 具有各种癌症组和非癌症组 的多组间的判别能力。实施例2使用实施例1中使用的样品数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌)和非癌症组的6组判别 性能最大化的指标,以指标式组1的形式得到由年龄、性别(男性=1、女性=2)、Thr、Glu、 Gin、Pro、Cit、ABA、Val、Met、lie、Leu、Tyr, Phe, His、Orn, Lys, Arg 构成的线性判别式组 (各判别式的年龄、性别、氨基酸变数 Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、Ile、Leu、Tyr、 Phe、His、Orn、Lys、Arg 的系数如图 26 所示)。通过判别结果的准确率来评价指标式组1对各种癌症和非癌症(大肠癌、乳癌、 前列腺癌、甲状腺癌、肺癌)的诊断性能,结果,非癌症的准确率为64.6%,大肠癌的准确 率为44. 6%,乳癌的准确率为76. 3%,前列腺癌的准确率为80. 0%,甲状腺癌的准确率为 50. 0%,肺癌的准确率为51. 6%,关于全体准确率,验前概率分别为16. 7%时,显示58. 6% 的高的判别能力(图27)。图26所示的公式中的各系数的值可以是将其实数倍所得的值, 常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与 图26所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览 如图28和图29所示。实施例3在实施例1中使用的样品数据中,使用了男性数据。关于癌症,通过逐步变数选择 法的线性判别分析,探索使各种癌症组(大肠癌、前列腺癌、甲状腺癌、肺癌)和非癌症组的 5组判别性能最大化的指标,以指标式组2的形式得到由年龄、6111、?1~0、(^484讨、116、 Leu、Phe、His、Trp、OrruLys构成的线性判别式组(各判别式的年龄、氨基酸变数Glu、Pro、 Cit、ABA、Met、lie、Leu、Phe、His、Trp、Orn、Lys 的系数如图 30 所示)。通过判别结果的准确率来评价指标式组2对各种癌症(大肠癌、前列腺癌、甲 状腺癌、肺癌)和非癌症的诊断性能,结果,非癌症的准确率为69.2%,大肠癌的准确率 为52.3%,前列腺癌的准确率为50.0%,甲状腺癌的准确率为75.0%,肺癌的准确率为 55. 7%,关于全体准确率,验前概率分别为20. 0%时,显示60. 4%的高的判别能力(图31)。 图30所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加 减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图30所示的判别式组显示 同等的判别能力的判别式组。这些判别式组中所含的变数一览如图32和图33所示。实施例4在实施例1中使用的样品数据中,使用了女性数据。关于癌症,通过逐步变数选 择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、甲状腺癌、肺癌)和非癌症组的5 组判别性能最大化的指标,以指标式组3的形式得到由年龄、Thr、Glu、Gin、Pro、ABA、Val、 Met、Ile、Leu、Phe、HiS、Arg构成的线性判别式组(各判别式的年龄、氨基酸变数Thr、Glu、 Gin、Pro、ABA、Val、Met、lie、Leu、Phe、His、Arg 的系数如图 34 所示)。通过判别结果的准确率来评价指标式组3对各种癌症(大肠癌、乳癌、甲状腺癌、 肺癌)和非癌症的诊断性能,结果,非癌症的准确率为61. 8%,大肠癌的准确率为66. 7%, 乳癌的准确率为52. 6%,甲状腺癌的准确率为66. 7%,肺癌的准确率为65. 3%,关于全体 准确率,验前概率分别为20.0%时,显示61. 7%的高的判别能力(图35)。图34所示的公 式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实 常数而得到的值。除此之外,还可以得到多个与图34所示的判别式组显示同等的判别能力 的判别式组。这些判别式组中所含的变数一览如图36和图37所示。
实施例5在实施例1中使用的样品数据中,使用了大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌 组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、 乳癌、前列腺癌、甲状腺癌、肺癌)的5组判别性能最大化的指标,以指标式组4的形式得到 由年龄、性别(男性=1、女性=2)、Thr、Glu、Pro、ABA、Val、Met、Ile、Leu、Phe、His 构成的 线性判别式组(各判别式的年龄、性别、氨基酸变数Thr、Glu、Pro、ABA、Val、Met、11 e、Leu、 Phe、His的系数如图38所示)。通过判别结果的准确率来评价指标式组4对各种癌症(大肠癌、乳癌、前列腺癌、 甲状腺癌、肺癌)的诊断性能,结果,大肠癌的准确率为46.2%,乳癌的准确率为73.7%,前 列腺癌的准确率为80. 0%,甲状腺癌的准确率为68. 8%,肺癌的准确率为45. 8%,关于全 体准确率,验前概率分别为20. 0%时,显示52. 的高的判别能力(图39)。图38所示的 公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的 实常数而得到的值。除此之外,还可以得到多个与图38所示的判别式组显示同等的判别能 力的判别式组。这些判别式组中所含的变数一览如图340和图41所示。实施例6在实施例1中使用的样品数据中,使用了男性的大肠癌、前列腺癌、甲状腺癌、肺 癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠 癌、前列腺癌、甲状腺癌、肺癌)的4组判别性能最大化的指标,以指标式组5的形式得到由 年龄、Asn, Glu, ABA、Val, Phe, His、Trp构成的线性判别式组(各判别式的年龄、氨基酸变 Wi Asn, Glu, ABA, Val, Phe, His, Trp 的系数如图 42 所示)。通过判别结果的准确率来评价指标式组5对各种癌症(大肠癌、前列腺癌、甲状 腺癌、肺癌)的诊断性能,结果,大肠癌的准确率为52.3%,前列腺癌的准确率为50.0%, 甲状腺癌的准确率为75. 0 %,肺癌的准确率为55. 7 %,关于全体准确率,验前概率分别为 25.0%时,显示51. 8%的高的判别能力(图43)。图42所示的公式中的各系数的值可以是 将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之 外,还可以得到多个与图42所示的判别式组显示同等的判别能力的判别式组。这些判别式 组中所含的变数一览如图44和图45所示。实施例7在实施例1中使用的样品数据中,使用了女性的大肠癌、乳癌、甲状腺癌、肺癌组 的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳 癌、甲状腺癌、肺癌)的4组判别性能最大化的指标,以指标式组6的形式得到由年龄、Thr、 6111、?1~0、¥£11^讨、116、1^11、见8^印构成的线性判别式组(各判别式的年龄、氨基酸变数 Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg 的系数如图 46 所示)。通过判别结果的准确率来评价指标式组6对各种癌症(大肠癌、乳癌、甲状腺癌、 肺癌)的诊断性能,结果,大肠癌的准确率为71. 4%,乳癌的准确率为52. 6%,甲状腺癌的 准确率为66. 7%,肺癌的准确率为63. 3%,关于全体准确率,验前概率分别为25. 0%时,显 示61. 7%的高的判别能力(图47)。图46所示的公式中的各系数的值可以是将其实数倍 所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得 到多个与图46所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图48和图49所示。实施例8在实施例1中使用的样品数据中,使用了非癌症组、大肠癌、乳癌、前列腺、甲状腺 癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠 癌、乳癌、前列腺癌、甲状腺癌)和非癌症组的5组判别性能最大化的指标,以指标式组7的 形式得到由年龄、性别(男性=1、女性=2)、Thr、Glu、Gln、Pro、Cit、ABA、Val、Met、lie、 Leu、Tyr、Phe、Orn、Arg构成的线性判别式组(各判别式的年龄、性别、氨基酸变数Thr、Glu、 Gln、Pro、Cit、ABA、Val、Met、lie、Leu、Tyr、Phe、Orn、Arg 的系数如图 50 所示)。通过判别结果的准确率来评价指标式组7对各种癌症(大肠癌、乳癌、前列腺 癌、甲状腺癌)和非癌症组的诊断性能,结果,非癌症的准确率为67.0%,大肠癌的准确率 为58.5%,乳癌的准确率为73.7%,前列腺癌的准确率为80.0%,甲状腺癌的准确率为 62. 5%,关于全体准确率,验前概率分别为20. O%时,显示66. 3%的高的判别能力(图51)。 图50所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加 减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图50所示的判别式组显示 同等的判别能力的判别式组。这些判别式组中所含的变数一览如图52和图53所示。实施例9在实施例1中使用的样品数据中,使用了男性的非癌症组、大肠癌、前列腺癌、甲 状腺癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大 肠癌、前列腺癌、甲状腺癌)和非癌症组的4组判别性能最大化的指标,以指标式组8的形 式得到由年龄、Asn, Glu、ABA、Val, Phe, His、Trp构成的线性判别式组(各判别式的年龄、 氨基酸变数々811、6111、484、¥31、?1^、见8、11印的系数如图54所示)。通过判别结果的准确率来评价指标式组8对各种癌症(大肠癌、前列腺癌、甲 状腺癌)和非癌症组的诊断性能,结果,非癌症组的准确率为75.0%,大肠癌的准确率为 68. 2%,前列腺癌的准确率为70. 0%,甲状腺癌的准确率为75. 0%,关于全体准确率,验前 概率分别为25.0%时,显示72.8%的高的判别能力(图55)。图54所示的公式中的各系数 的值可以是将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的 值。除此之外,还可以得到多个与图54所示的判别式组显示同等的判别能力的判别式组。 这些判别式组中所含的变数一览如图56和图57所示。实施例10在实施例1中使用的样品数据中,使用了女性的非癌症组、大肠癌、乳癌、甲状腺 癌组的数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠 癌、乳癌、甲状腺癌)和非癌症的4组判别性能最大化的指标,以指标式组9的形式得到由 年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe、Arg构成的线性判别式组(各判别式的 年龄、氨基酸变数 Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe、Arg 的系数如图 58 所示)。通过判别结果的准确率来评价指标式组9对各种癌症(大肠癌、乳癌、甲状腺癌) 和非癌症组的诊断性能,结果,非癌症组的准确率为68.6%,大肠癌的准确率为71.4%, 乳癌的准确率为57.9%,甲状腺癌的准确率为75.0%,关于全体准确率,验前概率分别为 25.0%时,显示61.7%的高的判别能力(图59)。图58所示的公式中的各系数的值可以是 将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图58所示的判别式组显示同等的判别能力的判别式组。这些判别式 组中所含的变数一览如图60和图61所示。实施例11在实施例1中使用的样品数据中,使用了大肠癌、乳癌、前列腺、甲状腺癌组的数 据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、前 列腺癌、甲状腺癌)的4组判别性能最大化的指标,以指标式组10的形式得到由年龄、性别 (男性=1、女性=2)、Thr、Glu, Pro、ABA、Val, Met构成的线性判别式组(各判别式的年 龄、性别、氨基酸变数TThr、Glu、Pr0、ABA、Val、Met的系数如图62所示)。通过判别结果的准确率来评价指标式组10对各种癌症(大肠癌、乳癌、前列腺癌、 甲状腺癌)的诊断性能,结果,大肠癌的准确率为56.9%,乳癌的准确率为71. 1%,前列 腺癌的准确率为80.0%,甲状腺癌的准确率为75.0%,关于全体准确率,验前概率分别为 25.0%时,显示65. 的高的判别能力(图63)。图62所示的公式中的各系数的值可以是 将其实数倍所得的值,常数项的值可以是对其加减乘除任意的实常数而得到的值。除此之 外,还可以得到多个与图62所示的判别式组显示同等的判别能力的判别式组。这些判别式 组中所含的变数一览如图64和图65所示。实施例12在实施例1中使用的样品数据中,使用了男性的大肠癌、前列腺癌、甲状腺癌组的 数据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、前列 腺癌、甲状腺癌)的3组判别性能最大化的指标,以指标式组11的形式得到由年龄、Cit、 ABA、Val、Met构成的线性判别式组(各判别式的年龄、氨基酸变数Cit、ABA、Val、Met的系 数如图66所示)。通过判别结果的准确率来评价指标式组11对各种癌症(大肠癌、前列腺癌、甲状 腺癌)的诊断性能,结果,大肠癌的准确率为75. 0%,前列腺癌的准确率为80. 0%,甲状腺 癌的准确率为75. 0%,关于全体准确率,验前概率分别为33. 3%时,显示75. 9%的高的判 别能力(图67)。图66所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的 值可以是对其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图66所示 的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图68和 图69所示。实施例13在实施例1中使用的样品数据中,使用了女性的大肠癌、乳癌、甲状腺癌组的数 据。关于癌症,通过逐步变数选择法的线性判别分析,探索使各种癌症组(大肠癌、乳癌、甲 状腺癌)的3组判别性能最大化的指标,以指标式组12的形式得到由年龄、Thr、Glu、Pro、 Met、Phe构成的线性判别式组(各判别式的年龄、氨基酸变数Thr、Glu、Pr0、Met、Phe的系 数如图70所示)。通过判别结果的准确率来评价指标式组12对各种癌症(大肠癌、乳癌、甲状腺癌) 的诊断性能,结果,大肠癌的准确率为71. 4%,乳癌的准确率为60. 5%,甲状腺癌的准确率 为83.3%,关于全体准确率,验前概率分别为33. 3%时,显示67. 6%的高的判别能力(图 71)。图70所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对 其加减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图70所示的判别式组显示同等的判别能力的判别式组。这些判别式组中所含的变数一览如图72和图73所示。实施例14通过上述的氨基酸分析法,针对确诊为大肠癌、乳癌的各种癌症患者组的血样、以 及非癌症组的血样测定血液中氨基酸浓度。氨基酸浓度的单位是nmol/ml。与各种癌症患 者和非癌症患者的氨基酸变数的分布相关的箱线图如图74所示。图74中,横轴表示非癌 症组和各种癌症组,图中的ABA表示α-ΑΒΑ(α-氨基丁酸)。并且,对于通过各氨基酸变数 进行的各种癌症组和非癌症组的判别,通过一元配置分散分析进行评价,氨基酸变数Thr、 Glu、Cit、Val、Met、lie、Leu、Phe的ρ值显示出小于0. 05的值(图75),由此表明,氨基酸 变数Thr、Glu、Cit、Val, Met, lie、Leu、Phe具有大肠癌组、乳癌组和非癌症组的3组间的 判别能力。实施例15使用实施例14中使用的样品数据。进行氨基酸变数的浓度数据基准化。即,得到 了实施下述变换“(各氨基酸变数的浓度数据_各氨基酸变数的浓度平均值)/各氨基酸 变数的浓度标准偏差”后的值。使用所得的基准化数据进行主成分分析,在提取各主成分的 特性值超过1的主成分时,得到了主成分1至主成分5。其中,以主成分3作为X轴、以主 成分4作为y轴制成标图,结果表明,非癌症组和大肠癌组、非癌症组和乳癌组、非癌症组和 (大肠癌+乳癌组)、大肠癌和乳癌组分别分离(图76),表明使用氨基酸变数可以相互判别 大肠癌组、乳癌组和非癌症组。实施例16使用实施例14中使用的样品数据。对氨基酸变数的全部浓度数据、各病例的数值 化的分类数据(大肠癌=1、乳癌和非癌症=0,以及乳癌=1、大肠癌和非癌症=0)进行 典型相关分析,结果得到了由氨基酸变数的浓度数据的合成变数构成的2组指标式组13。 得到的构成典型变数组的各氨基酸变数的系数如图77所示。并且,使用得到的指标式组 13进行马氏距离的判别分析,通过判别结果的准确率对大肠癌、乳癌、和非癌症组的诊断性 能进行评价,结果,非癌症的准确率为71.4%,大肠癌的准确率为70.0%,乳癌的准确率为 80. 0%,关于全体准确率,验前概率分别为33. 3%时,显示72. 6%的高的判别能力(图78)。 图77所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加 减乘除任意的实常数而得到的值。实施例17使用实施例14中使用的样品数据。关于癌症,通过逐步变数选择法的线性判别分 析,探索使大肠癌、乳癌、非癌症组的3组判别性能最大化的指标,以指标式组14的形式得 到由Thr、Glu、Gln、a-ABA、Val、Met、Ile、Phe构成的线性判别式组(各判别式的氨基酸变 Wi Thr, Glu, Gin, a-ABA, Val, Met, lie、Phe 的系数如图 79 所示)。通过判别结果的准确率来评价指标式组14对大肠癌、乳癌、非癌症组的诊断 性能,结果,非癌症组的准确率为69.0%,大肠癌的准确率为72.0%,乳癌的准确率为 70.0%,关于全体准确率,验前概率分别为33. 3%时,显示70. 1 %的高的判别能力(图80)。 图79所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加 减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图79所示的判别式组显示 同等的判别能力的判别式组。这些判别式组中所含的变数一览如图81和图82所示。
实施例18在实施例14中使用的样品数据中,只使用了女性数据。关于癌症,通过逐步变数 选择法的线性判别分析,探索使大肠癌、乳癌、非癌症组的3组判别性能最大化的指标,以 指标式组15的形式得到由11^、6111、6111^84、116、1^11^印构成的线性判别式组(各判别 式的氨基酸变数Thr、Glu、Gin、ABA、lie、Leu、Arg的系数如图83所示)。通过判别结果的准确率来评价指标式组15对大肠癌、乳癌、非癌症组的诊断 性能,结果,非癌症组的准确率为69.6%,大肠癌的准确率为80.0%,乳癌的准确率为 68. 4%,关于全体准确率,验前概率分别为33. 3%时,显示70. 6%的高的判别能力(图84)。 图83所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加 减乘除任意的实常数而得到的值。除此之外,还可以得到多个与图83所示的判别式组显示 同等的判别能力的判别式组。这些判别式组中所含的变数一览如图85和图86所示。实施例19在实施例14中使用的样品数据中,只使用了女性数据。采用本申请人的国际申请 即国际公开第2004/052191号中所述的方法深入研究使大肠癌、乳癌、非癌症组的3组判别 性能最大化的指标,在具有同等性能的多个指标当中,得到了由氨基酸变数Thr、Gin、Ala、 Cit、ABA、lie、His、Orn、Arg 构成的指标式组 16 (图 87)。通过判别结果的准确率来评价指标式组16对大肠癌、乳癌、非癌症组的诊断 性能,结果,非癌症组的准确率为79.4%,大肠癌的准确率为70.0%,乳癌的准确率为 57.4%,关于全体准确率,验前概率分别为33. 3%时,显示73. 1 %的高的判别能力(图88)。 图87所示的公式中的各系数的值可以是将其实数倍所得的值,常数项的值可以是对其加 减乘除任意的实常数而得到的值。产业实用性如上所述,本发明所述的癌症种类的评价方法可在工业上的众多领域、特别是药 物或食品、医疗等的领域广泛实施,特别是在进行癌症的病态预测或疾病风险预测等的领 域极为有用。
权利要求
癌症种类的评价方法,其特征在于,该方法包括下述步骤测定步骤,针对从评价对象采集到的血液测定关于氨基酸浓度值的氨基酸浓度数据;浓度值基准评价步骤,根据在上述测定步骤中测定的上述评价对象的上述氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的上述浓度值,对于上述评价对象评价癌症的种类。
2.权利要求1所述的癌症种类的评价方法,其特征在于,上述浓度值基准评价步骤进 一步包括下述浓度值基准判别步骤根据在上述测定步骤中测定的上述评价对象的上述氨 基酸浓度数据中所含的6111、48々、¥31、]^1 1~0、?1^、1111~、116、1^11、见8中的至少一种氨基 酸的上述浓度值,对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌、胃癌、子 宫癌中的至少2种上述癌症中判别其是哪一种上述癌症。
3.权利要求2所述的癌症种类的评价方法,其特征在于,上述浓度值基准判别步骤是 对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种上述癌症中判 别其是哪一种上述癌症。
4.权利要求1所述的癌症种类的评价方法,其特征在于,上述浓度值基准评价步骤进 一步包括下述步骤判别值计算步骤,根据在上述测定步骤中测定的上述评价对象的上述氨基酸浓度数据 中所含的6111、48々、¥31、]^1 1~0、?1^、1111~、116、1^11、见8中的至少一种氨基酸的上述浓度 值以及以上述氨基酸的浓度为变数的预先设定的由1个或多个多变量判别式构成的多变 量判别式组,通过构成该多变量判别式组的每个上述多变量判别式,计算该多变量判别式 的值即判别值;判别值基准评价步骤,根据由在上述判别值计算步骤中算出的1个或多个上述判别值 构成的判别值组,对于上述评价对象评价上述癌症的种类,构成上述多变量判别式组的各上述多变量判别式含有Glu、ABA、Val、Met、Pro、Phe, Thr, lie、Leu、His中的至少一种氨基酸作为上述变数。
5.权利要求4所述的癌症种类的评价方法,其特征在于,上述判别值基准评价步骤进 一步包括下述判别值基准判别步骤根据上述判别值组,对于上述评价对象,从大肠癌、乳 癌、前列腺癌、甲状腺癌、肺癌、胃癌、子宫癌中的至少2种上述癌症中判别其是哪一种上述 癌症。
6.权利要求5所述的癌症种类的评价方法,其特征在于,上述判别值基准判别步骤是 对于上述评价对象,从大肠癌、乳癌、前列腺癌、甲状腺癌、肺癌中的至少3种上述癌症中判 别其是哪一种上述癌症。
7.权利要求6所述的癌症种类的评价方法,其特征在于,构成上述多变量判别式组的 各上述多变量判别式为分数式、逻辑回归式、线性判别式、多重回归式、由支持向量机制作 的公式、由马氏距离法制作的公式、由典型判别分析制作的公式、由决策树制作的公式的任 意一种。
8.权利要求7所述的癌症种类的评价方法,其特征在于,上述多变量判别式组为下述 的判别式组1 16的任意一组判别式组 1 以年龄、性别、Thr、Glu、Gin、Pro、Cit、ABA、Val、Met、lie、Leu、Tyr, Phe, His、Orn, Lys、Arg作为上述变数的5个线性1次式;判别式组 2 以年龄、Glu、Pro、Cit、ABA、Met、lie、Leu、Phe、His、Trp、Orn、Lys 作为上 述变数的4个线性1次式;判别式组 3 以年龄、Thr、Glu、Gin、Pro、ABA、Val,Met, lie、Leu、Phe、His、Arg 作为上 述变数的4个线性1次式;判别式组 4 以年龄、性别、Thr、Glu、Pro、ABA、Val、Met、lie、Leu、Phe、His 作为上述 变数的4个线性1次式;判别式组5 以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线性1次式;判别式组6 以年龄、Thr、Glu、Pro、Val、Met、lie、Leu、His、Arg作为上述变数的3个 线性1次式;判别式组 7 以年龄、性别、Thr、Glu、Gin、Pro、Cit、ABA、Val、Met、lie、Leu、Tyr、Phe、 OrruArg作为上述变数的4个线性1次式;判别式组8 以年龄、Asn、Glu、ABA、Val、Phe、His、Trp作为上述变数的3个线性1次式;判别式组9 以年龄、Thr、Glu、Gin、Pro、ABA、Val、Met、lie、Phe、Arg作为上述变数的 3个线性1次式;判别式组10 以年龄、性别、Thr、Glu、Pr0、ABA、Val、Met作为上述变数的3个线性1次式;判别式组11 以年龄、Cit、ABA、Val、Met作为上述变数的2个线性1次式; 判别式组12 以年龄、Thr、Glu、Pro、Met、Phe作为上述变数的2个线性1次式; 判别式组 13 以 Thr、Ser、Asn、Glu、Gln、Gly、Ala、Cit、ABA、Val、Met、lie. Leu, Tyr, Phe、His、Trp、Orn、Lys, Arg作为上述变数的2个线性1次式;判别式组14 以Glu、Gin、ABA、Val、lie、Phe、Arg作为上述变数的2个线性1次式; 判别式组15 以Thr、Glu、Gin、ABA、lie、Leu、Arg作为上述变数的2个线性1次式; 判别式组16 以Thr、Gin、Ala、Cit、ABA、lie、His、Orn、Arg作为上述变数的2个分数式。
全文摘要
本发明的课题在于提供利用血液中的氨基酸浓度中与各种癌症的状态相关的氨基酸浓度,可以高精度地评价癌症的种类的癌症种类的评价方法。本发明所述的癌症种类的评价方法是针对从评价对象采集到的血液测定关于氨基酸浓度值的氨基酸浓度数据,根据测定的评价对象的氨基酸浓度数据中所含的Glu、ABA、Val、Met、Pro、Phe、Thr、Ile、Leu、His中的至少一种氨基酸的浓度值,对于评价对象评价癌症的种类。
文档编号G01N33/68GK101960310SQ20098010835
公开日2011年1月26日 申请日期2009年3月4日 优先权日2008年3月4日
发明者东山圣彦, 今村文生, 今泉明, 冈本直幸, 安东敏彥 申请人:味之素株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1