用于复杂网络中的全系统动力学的量化的系统的制作方法

文档序号:6361133阅读:180来源:国知局
专利名称:用于复杂网络中的全系统动力学的量化的系统的制作方法
技术领域
本发明涉及诊断疾病。更具体地,本发明涉及分析生物样本以获得基因表达值从而确定生物样本的健康程度。
背景技术
交互组件的大复杂网络难以作为整体动态系统来描述。在遗传学研究中,检查大量基因或基因网络的科学家通常致力于标识似乎对特定结果或病变很重要的一个基因或一组基因。所需要的是用于大规模地分析基因和基因网络之间的互连以输出患者的健康程度的报告的低成本且有效率的设备、方法和系统。

发明内容
为了解决本领域的需要,根据本发明的一个实施例,提供一种诊断疾病的方法,包括基因表达读取器分析至少一个生物样本并基于分析生物样本输出来自至少两个基因的基因表达值,利用适当编程的计算机计算生物样本的比例因数a,其中该比例因数a是通过以下步骤从基因表达值中计算出的以阈值C对不同时间的各基因表达值的多个组的链数Cn的数量进行计数,或以阈值C对单个时间的基因表达值的多个组的链数Cn的数量进行计数;计算所述链数Cn的平均数C·;计算Cn的最大数M,其中M包括所有的基因表达值组对于给定的所述阈值C的链数Cn的数量中的最大值;对于不同的所述阈值C,重复地施加关系式Cave=M/log(M) JfCave值数据相对于M/log(M)进行比较;以及计算对所比较的数据的拟合以输出比例因数a,其中比例因数a是所述拟合的斜率。该方法还包括利用适当编程的计算机将生物样本的比例因数a的值与数据库中来自经分析的生物样本的其它比例因数a’进行比较;以及利用适当编程的计算机输出报告,其中该报告包括至少一个生物样本的健康程度的评估。根据本方法实施例的一个方面,至少一个生物样本可包括唾液、尿、其它体液、滑液、乳腺导管液、血液和血液组分、组织、瘤、骨髓、干细胞、诱导多能细胞、细胞系、植物物质或有机物质。在本方法实施例的另一个方面中,基因表达读取器包括至少两个基因探针。在本方法实施例的又一个方面中,链数Cn的数量包括N个表达值组中的每组的链数的数量,其中每个所述表达值组包括在表达值组和其它N-I个基因表达值组的基因表达值序列η1; n2, . . . ητ之间的以阈值C的基因表达值序列η” η2,…ητ。根据本方法实施例的另一个方面,比例因数a通过以下步骤计算利用适当编程的计算机对于不同的阈值C重复地施加Cave=M/log(M),以及将Cave值相对于M/log (M)进行比较,并计算该比较的线性拟合以获得比例因数a。在本方法实施例的又一个方面,比较a的值还包括比较比例因数a的副产品,将健康样本相对于疾病样本进行比较,或将未知样本与来自已知条件下的样本的值的数据库进行比较。根据本方法实施例的另一个方面,阈值C在O至I之间的范围中。
在本发明的另一个实施例中,提供一种诊断疾病的系统,包括基因表达读取器,用于分析至少一个生物样本并输出至少两个基因的基因表达值;计算机服务器,用于从基因表达读取器接收基因表达值并管理和向用户传达患者信息;以及主存在计算机服务器上的计算机程序,其中计算机程序分析基因表达值并输出报告,其中该报告包括至少一个生物样本的健康程度的评估,其中评估包括将至少一个生物样本的比例因数a与数据库中来自先前分析的生物样本的其它比例因数a’进行比较,其中比例因数a是利用所述计算机程序通过以下步骤从所述基因表达值计算出的以阈值C对不同时间的各基因表达值的多个组的链数Cn的数量进行计数,或以阈值C对单个时间的基因表达值的多个组的链数Cn的数量进行计数;计算链数Cn的平均数C_ ;计算Cn的最大数M,其中M包括所有的基因表达值组对于给定的阈值C的链数Cn的数 量中的最大值;对于不同的阈值C,重复地施加关系式Cave=M/log(M);将Cave值数据相对于M/log(M)数据进行比较;以及对所比较的数据的施加拟合以输出比例因数a,其中比例因数a是拟合的斜率。在本系统实施例的一个方面,至少一个生物样本可包括唾液、尿、其它体液、滑液、乳腺导管液、血液和血液组分、组织、瘤、骨髓、干细胞、诱导多能细胞、细胞系、植物物质或有机物质。在本系统实施例的另一个方面中,基因表达读取器包括至少两个基因探针。在本系统实施例的又一个方面中,链数Cn的数量包括N个表达值组中的每组的链数的数量,其中每个所述表达值组包括在表达值组和其它N-I个基因表达值组的基因表达值序列η1; n2, . . . ητ之间的以阈值C的基因表达值序列η” η2,…ητ。根据本系统实施例的另一个方面,比例因数a通过以下步骤计算利用适当编程的计算机对于不同的阈值C重复地施加Cave=M/log(M),以及将Cave值相对于M/log (M)进行比较,并计算该比较的线性拟合以获得比例因数a。在本系统实施例的又一个方面,比较a的值还包括比较比例因数a的副产品,将健康样本相对于疾病样本进行比较,或将未知样本与来自已知条件下的样本的值的数据库进行比较。在本系统实施例的又一个方面,阈值C在O和I之间的范围中。在另一个实施例中,本发明包括一种芯片上的实验室装置,包括用于保持生物样本容器、基因表达读取器和微处理器的衬底,其中生物样本容器包括对所述基因表达读取器的样本输入,其中基因表达读取器基于分析至少一个生物样本来输出至少两个基因的基因表达值,其中微处理器包括用于分析至少一个生物学样本中的基因表达的计算机程序,其中计算机程序编译所述基因表达值;以阈值C对不同时间的各基因表达值的多个组的链数Cn的数量进行计数,或以阈值C对单个时间的基因表达值的多个组的链数Cn的数量进行计数;计算所述链数Cn的平均数C·;计算Cn的最大数M,其中M包括所有的基因表达值组对于给定的所述阈值C的链数Cn的数量中的最大值;对于不同的阈值C,重复地施加关系式Cave=M/log(M) JfCave值数据相对于M/log(M)进行比较;以及计算对所比较的数据的拟合以输出比例因数a,其中比例因数a是拟合的斜率;将至少一个生物样本的比例因数a的值与其它存储的来自经分析的生物样本的比例因数a’进行比较;以及输出报告,其中报告包括至少一个生物样本的健康程度的评估。根据本装置实施例的一个方面,至少一个生物样本可包括唾液、尿、其它体液、滑液、乳腺导管液、血液和血液组分、组织、瘤、骨髓、干细胞、诱导多能细胞、细胞系、植物物质或有机物质。在本装置实施例的另一个方面中,基因表达读取器包括至少两个基因探针。在本装置实施例的又一个方面中,链数Cn的数量包括N个表达值组中的每组的链数的数量,其中每个所述表达值组包括在表达值组和其它N-I个基因表达值组的基因表达值序列叫,n2, . . . ητ之间的以阈值C的基因表达值序列Ii1, n2, . . . ητ。根据本装置实施例的一个方面,比例因数a通过以下步骤计算利用适当编程的计算机对于不同的阈值C重复地施加Cave=M/log(M),以及将Cave值相对于M/log (M)进行比较,并计算该比较的线性拟合以获得比例因数a。在本装置实施例的又一个方面,比较a的值还包括比较比例因数a的副产品,将健康样本相对于疾病样本进行比较,或将未知样本与来自已知条件下的样本的值的数据库·进行比较。在本装置实施例的又一个方面,阈值C在O和I之间的范围中。


图I示出本发明的一个实施例的方法的流程图。图2示出根据本发明的一个实施例的由计算机程序用于计算比例因数所使用的进程的图形图像。图3示出本发明的一个实施例的系统的流程图。图4示出本发明的一个实施例的装置的示意图。
具体实施例方式为了解决本领域的需要,根据本发明的一个实施例提供一种诊断疾病的方法。图I示出本发明的一个实施例的方法100的流程图,包括基因表达读取器101分析至少一个生物样本并基于所述分析至少一个生物样本输出来自至少两个基因的基因表达值102,并且利用适当编程的计算机103计算该生物样本的比例因数a,其中所述比例因数a是通过以下步骤从基因表达值中计算出的以阈值C对不同时间的各基因表达值的多个组链数Cn的数量进行计数,或以阈值C对单个时间的基因表达值的多个组的链数Cn的数量进行计数104 ;计算所述链数Cn的平均数Cave106 ;计算Cn的最大数M 108,其中M包括所有的基因表达值组对于给定的所述阈值C的链数Cn的数量中的最大值;对于不同的所述阈值C,重复地施加关系式Cave=M/log(M) 110 ;将所述Cave数据值相对于M/log (M)的进行比较112 ;以及计算对所比较的数据的拟合以输出比例因数a,其中比例因数a是拟合的斜率,并且利用适当编程的计算机将至少一个生物样本的比例因数a的值与数据库中来自经分析的生物样本的其它比例因数a’进行比较114 ;以及利用适当编程的计算机输出报告116,其中该报告包括至少一个生物样本的健康程度的评估。在本发明的一个方面中,基因表达读取器包括至少两个基因探针。根据方法100的一个实施例,本发明利用N个表达值组的例如来自微阵列或基因芯片的基因表达值,该N个表达值组可包括例如给定组织的基因组中的大量(如果不是全部的话)基因。在一个实施例中,N不需要包含微阵列数据的所有可用表达值组,而是仅需要包含该微阵列数据的大子集。在方法100的一个实施例中,可按多个时间间隔T从微阵列读取基因表达值ητ。用于量化的数据集将包括以下形式的N组基因表达值ητ ην η2,· . · · ητ其中η是以T间隔获取的N个基因之一的基因表达值。对于基因表达值组Ni中的基因表达值η」的序列,对基因表达值组Ni和每个其它基因表达值组(其它N-I组)之间的相关性取绝对值。其相关性高于阈值C的其它基因表达值组的总数被称为Cn,且表示将该基因表达值组连接到数据集中具有C或更大值的所有其它基因表达值组的链的数量。然后对于所有的N个基因表达值组,对于给定C,取得Cn的最大值,且称为M。对于给定的C,取得所有的Cn的平均值且称为Cavg。根据本发明的一个实施例,对于不同的C值,M和Cavg的值形成以下关系式Cavg= (M/log (M) )a为了得出比例因数a的值,通过以下步骤重复以上方法对于不同的阈值C施加关系式Cave=M/log(M),将所述Cave数据值相对于M/log (M)数据进行比较;以及施加对所比较的数据的拟合以输出比例因数a,其中比例因数a是拟合的斜率。根据本实施例,阈值C在O至I之间的范围中。在方法100的一个实施例中,图2所示的是示例性图形比例因数表示200,其中截止值C的值的数量是十九,C是相关性的绝对值,例如皮尔森相关性(Pearsoncorrelation),且C的范围是以每个点.05的递减值从.95至.05。然后测量拟合到该数据的对数-对数曲线的线的斜率。在这种情况下,示出a为 I. 74。在图2中,所测量的相关性值在对酵母(酿酒酵母S. cerevisiae)中的3360个基因(N=3360)以7分钟间隔取得的六个基因表达值(T=6)的时间序列之间。尽管在该示例中使用3360个基因,然而在其它示例中使用基因可以是任意数量,但一般为数千。在一个实施例中,可将该方法施加到在单个 时间上测量的基因表达值的多个组,而不是不同时间上的各基因表达值。换言之,相关性值在由单个时间处取得的来自T个基因的基因表达值构成的N个组之间。在该实施例的一个示例中,假设单个时间处5个不同基因的基因表达值标记为1-5,可形成三个基因表达值组(Ν=3 ),每个组包含三个基因表达值(Τ=3 )。例如,基因表达值来自基因1-3、2-4、3-5。本发明计算每个组与其它两个(N-l=2)之间的皮尔森相关性的绝对值。假设所计算的相关性值中的4个>.95。则对于C=. 95和Ν=3的C_=4/3=l. 33。此夕卜,假设对于任何单个基因表达值组的绝对值皮尔森相关性值>.95的最大数量是2。则对于C=. 95的M将为2。单个时间组和时间序列(多个时间组)方法的本质在于,在每种情况下,在一个组和所有其它组之间取得相关性值。然后计算多少相关性值大于阈值C。任意单个组的最大数量是M。所有组的总数除以组数(N)得到C·。尽管根据本发明的一个方面有两种不同的方式计算比例因数a,该比例因数a可能是不同的值,但唯一的要求是用于生成a的任一方法在生物样本之间比较a的值时必须一致。根据方法100的一个方面,至少一个生物样本可包括唾液、尿、其它体液、滑液、乳腺导管液、血液和血液组分、组织、瘤、骨髓、干细胞、诱导多能细胞、细胞系、植物物质或其它有机物质。在方法100的另一个方面,比较a的值还包括比较比例因数a的副产品,将健康样本相对于疾病样本进行比较,或将未知样本与来自已知条件下的样本的值的数据库进行比较。在本发明的另一个实施例中,图3示出一种用于诊断疾病300的系统,包括用户302,其具有生物样本304以输入到基因表达读取器306,该基因表达读取器306用于分析至少一个生物样本304并输出310至少两个基因的基因表达值,并且例如利用因特网将该基因表达值传达310到计算机服务器312,该计算机服务器312用于从基因表达读取器306接收所述基因表达值并管理和传达患者信息,其中该患者信息然后被提供给用户302。计算机程序314主存在所述计算机服务器312上,并分析基因表达值以随后输出可在显示器318上查看的报告316,该报告316包括至少一个生物样本的健康程度的评估。根据本实施例,评估包括将至少一个生物样本的比例因数a与数据库中来自先前分析的生物样本的其 它比例因数a’进行比较,其中比例因数a是利用计算机程序314通过以下步骤从基因表达值计算出的以阈值C对不同时间的各基因表达值的多个组的链数Cn的数量进行计数,或以阈值C对单个时间的基因表达值的多个组的链数Cn的数量进行计数;计算链数Cn的平均数Cave ;计算Cn的最大数M,其中M包括所有的所述基因表达值组对于给定的所述阈值C的链数Cn的数量中的最大值;对于不同的阈值C,重复地施加关系式C_=M/log(M);将Cave数据值相对于M/log(M)的数据进行比较;以及对所比较的数据的施加拟合以输出比例因数a,其中比例因数a是拟合的斜率。根据系统300的一个实施例,至少一个生物样本可包括唾液、尿、其它体液、滑液、乳腺导管液、血液和血液组分、组织、瘤、骨髓、干细胞、诱导多能细胞、细胞系、植物物质或有机物质。在系统300的另一个方面中,基因表达读取器包括至少两个基因探针。在系统300的又一个方面中,链数Cn的数量包括N个表达值组中的每组的链数的数量,其中每个所述表达值组包括在表达值组和其它N-I个基因表达值组的基因表达值序列n” n2, . . . ητ之间的以阈值C的基因表达值序列η” η2,…ητ。根据系统300的另一个方面,比例因数a通过以下步骤计算利用适当编程的计算机对于不同的阈值C重复地施加Cave=M/log(M),以及将Cave值相对于M/log(M)进行比较,并计算该比较的线性拟合以获得比例因数a。在系统300的又一个方面,比较a的值还包括比较比例因数a的副产品,将健康样本相对于疾病样本进行比较,或将未知样本与来自已知条件下的样本的值的数据库进行比较。在系统300的又一个方面,阈值C在O和I之间的范围中。图4示出本发明的另一个实施例,包括芯片上的实验室装置400,其具有用于保持生物样本容器404、基因表达读取器406和微处理器408的衬底402,其中生物样本容器404包括对基因表达读取器的样本输入410,其中基因表达读取器基于分析至少一个生物样本来输出412至少两个基因的基因表达值,其中微处理器408包括用于分析由用户302输入到样本容器404中的生物学样本304中的基因表达的计算机程序314。计算机程序314编译基因表达值,以阈值C对不同时间的各基因表达值的多个组的链数Cn的数量进行计数,或以阈值C对单个时间的基因表达值的多个组的链数Cn的数量进行计数;计算所述链数Cn的平均数Cave ;计算Cn的最大数M,其中M包括所有的基因表达值组对于给定的所述阈值C的链数Cn的数量的最大值;对于不同的阈值C,重复地施加关系式C_=M/log(M);将Cave数据值相对于M/log(M)数据进行比较;以及计算对所比较的数据的拟合以输出比例因数a,其中比例因数a是拟合的斜率;将至少一个生物样本的比例因数a的值与其它存储的来自经分析的生物样本的比例因数a’进行比较,以及输出报告316,其中报告316包括至少一个生物样本的健康程度的评估。该报告可被传达到具有计算机软件416和显示器或打印机418的计算机414。此外,应理解衬底402可以是任何适当的平台、主机或外壳,且计算机414可与衬底402分离或与衬底402集成。根据装置400的一个方面,至少一个生物样本可包括唾液、尿、其它体液、滑液、乳腺导管液、血液和血液组分、组织、瘤、骨髓、干细胞、诱导多能细胞、细胞系、植物物质或有机物质。在装置400的另一个方面中,基因表达读取器包括至少两个基因探针。在装置400的又一个方面中,链数Cn的数量包括N个表达值组中的每组的链数的·数量,其中每个所述表达值组包括在表达值组和其它N-I个基因表达值组的基因表达值序列Ii1, n2, . . . ητ之间的以阈值C的基因表达值序列Ii1, n2, . . . ητ。根据装置400的另一个方面,比例因数a通过以下步骤计算利用适当编程的计算机对于不同的阈值C重复地施加Cave=M/log(M),以及将Cave值相对于M/log(M)进行比较,并计算该比较的线性拟合以获得比例因数a。在装置400的又一个方面,比较a的值还包括比较比例因数a的副产品,将健康样本相对于疾病样本进行比较,或将未知样本与来自已知条件下的样本的值的数据库进行比较。在装置400的又一个方面,阈值C在O和I之间的范围中。现已根据若干示例性实施例描述了本发明,这些实施例在所有方面都旨在是说明性的,而非限制性的。因此,在本发明在具体实施中可以有许多变化,这许多变化可以由本领域普通技术人员从这里所包含的描述中推导出。例如,以类似于基因网络中的单个基因表达值的方式量化其它复杂互连网络,其中网络中的单个网络组件或节点可具有将其切换为“运行”的程度。示例可包括表征蛋白质-蛋白质交互网络中的每个单个蛋白质与网络中的其它蛋白质形成化学键所需的总能量的数,即其它生物化学网络,其中对于每个组件可类似地量化单个组件和其它组件之间的交互;反映去往/来自通信或计算机网络中的每个单个节点的信息流的数;以及反映穿过城市交通网络中的各个交叉点或运输网络中的各个中枢之间的交通流的数。所有这些变化均视为落在由下面的权利要求书及其法律等效方案定义的本发明的范围和精神内。
权利要求
1. 一种诊断疾病的方法,包括 a.基因表达读取器分析至少一个生物样本并基于所述分析所述至少一个生物样本输出来自至少两个基因的基因表达值; b.利用适当编程的计算机计算所述至少一个生物样本的比例因数a,其中所述比例因数a是从所述基因表达值中计算出的,所述计算包括 1.以阈值C对不同时间的各基因表达值的多个组的链数Cn的数量进行计数,或以阈值 C对单个时间的基因表达值的多个组的链数Cn的数量进行计数; 计算所述链数Cn的平均数C·; iii.计算所述Cn的最大数M,其中所述M包括所有的所述基因表达值组对于给定的所述阈值C的所述链数Cn的数量中的最大值; iv.对于不同的所述阈值C,重复地施加关系式CaTC=M/log(M); v.将所述Cave值数据相对于M/log(M)进行比较;以及 vi.计算对所比较的数据的拟合以输出所述比例因数a,其中所述比例因数a是所述拟合的斜率; c.利用所述适当编程的计算机将所述至少一个生物样本的所述比例因数a的值与数据库中来自经分析的生物样本的其它比例因数a’进行比较;以及 d.利用所述适当编程的计算机输出报告,其中所述报告包括所述至少一个生物样本的健康程度的评估。
2.如权利要求I所述的方法,其特征在于,所述至少一个生物样本选自下组唾液、尿、其它体液、滑液、乳腺导管液、血液和血液组分、组织、瘤、骨髓、干细胞、诱导多能细胞、细胞系、植物物质及其它有机物质。
3.权利要求I所述的方法,其特征在于,所述基因表达读取器包括至少两个基因探针。
4.权利要求I所述的方法,其特征在于,所述链数Cn的数量包括N个表达值组中的每组的链数的数量,其中每个所述表达值组包括在所述表达值组和其它N-I个基因表达值组的基因表达值序列Ii1, n2, . . . ητ之间的以阈值C的基因表达值序列Ii1, n2, . . . ητ。
5.权利要求I所述的方法,其特征在于,所述比例因数a通过以下步骤计算利用所述适当编程的计算机对于不同的所述阈值C重复地施加所述Cave=M/log(M),以及将Cave值相对于M/log(M)进行比较,并计算所述比较的线性拟合以获得所述比例因数a。
6.权利要求I所述的方法,其特征在于,所述比较所述a的值还包括比较所述比例因数a的副产品,将健康样本相对于疾病样本进行比较,或将未知样本与来自已知条件下的样本的值的数据库进行比较。
7.权利要求I所述的方法,其特征在于,所述阈值C在O和I之间的范围中。
8.一种用于诊断疾病的系统,包括 a.基因表达读取器,用于分析至少一个生物样本并输出至少两个基因的基因表达值; b.计算机服务器,用于从基因表达读取器接收所述基因表达值并管理和向用户传达患者信息;以及 c.主存在所述计算机服务器上的计算机程序,其中所述计算机程序分析所述基因表达值并输出报告,其中所述报告包括所述至少一个生物样本的健康程度的评估,其中所述评估包括将所述至少一个生物样本的比例因数a与数据库中来自先前分析的生物样本的其它比例因数a’进行比较,其中所述比例因数a是利用所述计算机程序从所述基因表达值计算出的,所述计算包括 i.以阈值C对不同时间的各基因表达值的多个组的链数Cn的数量进行计数,或以阈值C对单个时间的基因表达值的多个组的链数Cn的数量进行计数; 计算所述链数Cn的平均数C·; iii.计算所述Cn的最大数M,其中所述M包括所有的所述基因表达值组对于给定的所述阈值C的所述链数Cn的数量中的最大值; iv.对于不同的所述阈值C,重复地施加关系式CaTC=M/log(M); v.将所述Cave值数据相对于M/log(M)的数据进行比较;以及 vi.对所比较的数据的施加拟合以输出所述比例因数a,其中所述比例因数a是所述拟合的斜率。
9.如权利要求8所述的系统,其特征在于,所述至少一个生物样本选自下组唾液、尿、其它体液、滑液、乳腺导管液、血液和血液组分、组织、瘤、骨髓、干细胞、诱导多能细胞、细胞系、植物物质及有机物质。
10.权利要求8所述的系统,其特征在于,所述基因表达读取器包括至少两个基因探针。
11.权利要求8所述的系统,其特征在于,所述链数Cn的数量包括N个表达值组中的每组的链数的数量,其中每个所述表达值组包括在所述表达值组和其它N-I个基因表达值组的基因表达值序列Ii1, η2, · · · ητ之间的以阈值C的基因表达值序列Ii1, n2, . . . ηΤο
12.权利要求8所述的系统,其特征在于,所述比例因数a通过以下步骤计算利用所述适当编程的计算机对于不同的所述阈值C重复地施加所述Cave=M/log(M),以及将Cave值相对于M/log(M)进行比较,并计算所述比较的线性拟合以获得所述比例因数a。
13.权利要求8所述的系统,其特征在于,所述比较所述a的值还包括比较所述比例因数a的副产品,将健康样本相对于疾病样本进行比较,或将未知样本与来自已知条件下的样本的值的数据库进行比较。
14.权利要求8所述的系统,其特征在于,所述阈值C在O和I之间的范围中。
15.一种芯片上的实验室装置,包括 a.用于保持生物样本容器、基因表达读取器和微处理器的衬底,其中所述生物样本容器包括对所述基因表达读取器的样本输入,其中所述基因表达读取器基于分析至少一个生物样本来输出至少两个基因的基因表达值,其中所述微处理器包括用于分析所述至少一个生物学样本中的基因表达的计算机程序,其中所述计算机程序i.编译所述基因表达值; 以阈值C对不同时间的各基因表达值的多个组的链数Cn的数量进行计数,或以阈值C对单个时间的基因表达值的多个组的链数Cn的数量进行计数; iii.计算所述链数Cn的平均数Cave; iv.计算所述Cn的最大数M,其中所述M包括所有的所述基因表达值组对于给定的所述阈值C的所述链数Cn的数量中的最大值; i.对于不同的所述阈值C,重复地施加关系式CaTC=M/log(M); 将所述Cave值数据相对于M/log (M)进行比较;以及iii.计算对所比较的数据的拟合以输出所述比例因数a,其中所述比例因数a是所述拟合的斜率; iv.将所述至少一个生物样本的所述比例因数a的值与其它存储的来自经分析的生物样本的比例因数a’进行比较;以及 V.输出报告,其中所述报告包括所述至少一个生物样本的健康程度的评估。
16.如权利要求15所述的装置,其特征在于,所述至少一个生物样本选自下组唾液、尿、其它体液、滑液、乳腺导管液、血液和血液组分、组织、瘤、骨髓、干细胞、诱导多能细胞、细胞系、植物物质及有机物质。
17.权利要求15所述的装置,其特征在于,所述基因表达读取器包括至少两个基因探针。
18.权利要求15所述的装置,其特征在于,所述链数Cn的数量包括N个表达值组中的每组的链数的数量,其中每个所述表达值组包括在所述表达值组和其它N-I个基因表达值组的基因表达值序列Ii1, n2, . . . ητ之间的以阈值C的基因表达值序列Ii1, n2, . . . ητ。
19.权利要求15所述的装置,其特征在于,所述比例因数a通过以下步骤计算利用所述适当编程的计算机对于不同的所述阈值C重复地施加所述Cave=M/log(M),以及将Cave值相对于M/log(M)进行比较,并计算所述比较的线性拟合以获得所述比例因数a。
20.权利要求15所述的装置,其特征在于,所述比较所述a的值还包括比较所述比例因数a的副产品,将健康样本相对于疾病样本进行比较,或将未知样本与来自已知条件下的样本的值的数据库进行比较。
21.权利要求15所述的装置,其特征在于,所述阈值C在O和I之间的范围中。
全文摘要
提供了诊断疾病的装置、方法和系统,利用基因表达读取器分析生物样本并输出基因表达值,以利用计算机通过以下步骤计算比例因数以阈值C对不同时间的各基因表达值的多个组的链数Cn的数量进行计数,或以阈值C对单个时间的基因表达值的多个组的链数Cn的数量进行计数;计算链数Cn的平均数Cave;计算Cn的最大数M;对于不同的所述阈值C,重复地施加关系式Cave=M/log(M);将Cave数据值相对于M/log(M)进行比较;以及计算对所比较的数据的拟合以输出比例因数a。将比例因数a与数据库中的其它比例因数a’进行比较以输出健康程度的评估的报告。
文档编号G06F19/10GK102971737SQ201180033710
公开日2013年3月13日 申请日期2011年7月6日 优先权日2010年7月8日
发明者S·C·肖 申请人:第一基因股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1