重叠密度(od)热图及一致性数据显示的制作方法

文档序号:2631077阅读:444来源:国知局
专利名称:重叠密度(od)热图及一致性数据显示的制作方法
重叠密度(OD)热图及一致性数据显示
背景技术
本发明一般涉及数据显示,尤其涉及多个重叠数据集的显示。
在许多领域中,科学家必须了解并找到较大数据量的图案。这种情况 的一个示例是新陈代谢学领域,新陈代谢的研究响应于诸如药物或疾病等 扰动而变化。新陈代谢学融合统计分析和分析化学技术,诸如核磁共振 (NMR)谱学、质谱学(MS)和色谱学。新陈代谢学可导致对许多疾病的 更容易、更快和更准确的诊断,因此被预测将成为药物发现和开发的焦点。
通常,当同时显示较大数据量时,使用传统显示系统显现数据中的趋 势会是十分困难的(如果并非不可能)。例如,

图1示出多个IR光谱的传 统图形表示的示例。对每个光谱任意地指派不同且唯一的颜色。虽然不同 光谱之间存在明显的重叠,但是使用传统层叠数据显示类型来显现所显示 的IR光谱中的最高重叠区是十分困难的(如果并非不可能)。
因此,提供克服以上和其它问题的系统和方法是合需的。此类系统和 方法应当提供对重叠数据的有益显示,以及应当允许灵活操作数据显示以 提供经提升的数据挖掘和趋势显现能力。
发明概述
本发明提供以有益地简化较大数据集中的趋势可视化的方式生成或提 供多个数据集的重叠显示的系统和方法。通常,本发明可应用于期望被显 示的任何数据类型的图形显示。例如,本发明可用于分析来自诸如化学信 息学、分析信息学、新陈代谢学、化学计量学、基因组学、蛋白质组学及 其它的学科的较大量图形数据并适用于包括生命科学和诊断学的科学研究 的所有分支。
根据本发明,2维事件计数阵列是针对多个类似数据集生成的。阵列 中的每个元素的值表示对应的数据值对x、 y在N个数据集中出现的次数,
其中每个阵列元素对应于x与y数据值的离散间隔。在一个方面,事件计 数过程类似于在所有要被处理的数据集的组合显示上放置2维阵列和对于 每个阵列元素计数具有落在相应阵列元素的x-y范围内的数据的数据集的 数目。 一旦生成阵列,就可通过将期望重叠百分比与每个阵列元素的值作 比较来生成重叠密度的图形显示。具有满足期望重叠百分比的值的那些阵 列元素作为显示对象被再现。例如,在一个方面,表示特定重叠百分比或 重叠百分比范围的OD热图对象可被显示为从用于指示所有N个数据集之 间最高重叠区的一种特定色彩、阴影或图案到用于指示所有集之间最低重 叠区的第二色彩、阴影或图案且具有指示中间(intermediate)重叠区的色彩、 阴影或图案的区域的一种或多种色彩、阴影和/或图案的范围。
根据本发明的一个方面,提供用于生成用来显示多个类似数据集的数 据的方法。该方法通常包括接收N个数据集,每个数据集包括表示量x和 y的两对或多对数据值;以及通过对每个阵列元素确定事件计数值M来生成包 括X乘Y个元素的事件计数阵列,其中每个事件计数值M是对应数据值对x、 y在N个数据集中出现的次数,其中每个阵列元素对应于x和y数据值的离散 间隔。该方法还通常包括接收重叠密度的指示,所述指示表示标识数据重
叠百分比的范围;确定落在所标识的重叠百分比范围内的阵列元素;以及生成 用于表示阵列中落在所标识的数据重叠百分比范围内的元素的图形显示的图
形数据。在某些方面,该指示可标识0%与100%之间的数据重叠百分比范 围,其中对应显示表示2个和所有数据集之间的并集。在某些方面,指示 标识等于100%的数据重叠百分比,其中显示表示所有N个数据集的交集。 在某些方面,指示标识等于0%的数据重叠百分比,其中显示表示所有N个 数据集的差异,或所有N个数据集上的唯一值。
根据本发明的另一方面,提供了包括在由处理器执行时控制该处理器 生成用于再现多个类似数据集的显示的图形数据的代码的计算机可读介 质。该代码通常包括用于生成N个数据集的事件计数阵列的指令,每个数 据集包括表示量x和y的两对或多对数据值,阵列通过对每个阵列元素确定 事件计数值M来包括X乘Y个元素,其中每个事件计数值M是对应数据 值对x、 y在该N个数据集中出现的次数,其中每个阵列元素对应于x和y
数据值的离散间隔。该代码通常还包括响应于用户输入重叠密度的指示确 定落在所标识的重叠百分比内的阵列元素的指令,其中该指示标识数据重 叠百分比。该代码通常还包括生成用于表示阵列中落在所标识的数据重叠 百分比内的元素的图形显示的图像数据的指令。在某些方面,指示可标识0%与100%之间的数据重叠百分比范围,其中对应显示表示2个和所有N 个数据集之间的并集。在某些方面,指示可标识等于100%的数据重叠百分 比,其中显示表示所有N个数据集的交集。在某些方面,指示可标识等于 0%的数据重叠百分比,其中显示表示所有N个数据集的差异,或所有N个 数据集上的唯一值。
参看说明书包括附图和权利要求的其余部分将实现本发明的其它特征 和优点。在以下参照附图详细描述本发明的其它特征和优点以及本发明的 各个实施例的结构和操作。在附图中,类似附图标记指示相同或功能上类 似的元素。
附图简述
图1示出传统层叠显示中的25个IR光谱一一所有正垸烃和支链垸烃。
图2示出根据本发明的实施例的用于生成多个数据集或数据对象的重叠显示的过程的结果。
图3示出生成两个数据集的4x4事件计数阵列的简化示例。 图4示出图1中所示的IR光谱按照具有设在0的OD标度值的OD热图的显示。
图5示出图1中所示的IR光谱按照具有设成100的OD标度值的OD热图的显示。
图6示出图1中所示的IR光谱按照具有设成50的OD标度值的OD热图的显示。
图7示出图1中所示的IR光谱按照表示所有光谱区中最大值的单一一 致性(CONSENSUS) IR光谱的OD—致性的显示,其中OD标度值二50, 即其中50%的光谱对象重叠。
图8示出图1中所示的IR光谱按照具有设成-100的OD标度的OD热
图的显示。
图9示出根据一个方面的允许用户选择不同显示类型和参数的滑条。
图IO示出根据一个方面的具有允许用户选择最小值(Min)和最大值 (Max)截至电平两者的各个滑臂的滑条。
发明详细描述
本发明提供以有益地简化较大数据集中的趋势可视化的方式生成或提 供多个数据集的重叠显示的系统和方法。通常,本发明可应用于期望被显 示的任何数据类型的图形显示。
在某些方面,例如,本发明可用于估计和发现较大数据集中的趋势和 公共性,这些数据集包括以下图形对象类型圆二向色性(CD);电导测 定法;电量分析;由凝胶电泳导致的密度图(densitogram)等;差示扫描 量热法(DSC);差示热分析(DTA);电子自旋共振(ESR);由凝胶电 泳导致的电泳图谱等;气相色谱图(GC);高性能液相色谱图(HPLC); 直方图;红外(IR)光谱图;离子迁移率光谱测定法(IMS);液相色谱图 (LC);质谱(MS);核磁共振(NMR);旋光分散(ORD);极谱法; 电势测定法;拉曼光谱;超临界流体(SCF)谱法图;热重量分析(TGA); 紫外-可见光(UV-Vis)光谱图;伏安法;X射线荧光(XRF)光谱图;X 射线粉末衍射(XRPD) ; X-Y线图;X-Y散布图以及其它。
在一方面,本发明可应用于处理数据集,其中每个数据集包括多个数 据点——各自具有一对表示感兴趣的分析量的值。可在具有表示感兴趣的 一个量的一个轴和表示另一感兴趣的量的另一个轴的二维坐标系中表示这 种数据集。例如,在IR光谱的情形中,成对的值可表示频率(或波长)和 强度值。图1示出多个IR光谱的传统图形表示的一个示例,其中x轴表示 波长值而y轴表示强度值(归一化)。对每个光谱任意地指派不同且唯一 的色彩。虽然不同光谱之间存在明显的重叠,但是使用这种传统层叠数据 显示类型来显现所显示对象(所显示的IR光谱)中的最高重叠区是十分困 难的(如果并非不可能)。如以下所讨论的,本发明的技术实现图形对象 的重叠的经提升的可视化程度。
类似地,在另一方面,本发明可应用于处理数据集,其中每个数据集 包括多个数据点——各自具有表示感兴趣的分析量的3个(或更多个)值。 此类数据集可在3 (或更多)维坐标系——并且各个轴表示3种数据值类型
中之一一一中显示。此类数据集也可在二维坐标系中观看,并且3 (或更多 个)数据值中的两个被用于定义2维坐标系。在二维坐标系中观看此类数 据集类似于获取3 (或更多)维图像的横截切片。因此,应当理解,本发明 可应用于表示3 (或更多)维的视觉显示。然而,出于简便的目的,以下讨 论经集中在2维视觉数据显示。
根据本发明, 一般地参照图2描述用于生成多个数据集或数据对象的 重叠显示的过程100的实施例。在步骤110,多个数据集被接收到或被另外 采集。在某些方面,数据集应当包括沿轴连续且以离散间隔等距隔开的数 据。例如,在图1中,IR光谱数据包括以大致4 cm"的离散间隔沿x轴的 连续数据(波数)。
在其中在驻留于数据采集设备——诸如IR光谱仪——内的智能模块 (例如,执行指令的处理器)中实现过程100的情形中,当在收集数据时, 数据集可被实时地提供到智能模块,或者它可被存储在存储器单元或缓冲 器中并在实验完成之后被提供给智能模块。类似地,数据集可经由到采集 设备的网络连接(例如,LAN、 VPN、内联网、因特网等)或直接连接(例 如,USB或其它直接有线或无线连接)被提供给诸如台式计算机系统或其 它计算机系统的单独系统,或者被提供到诸如CD、 DVD、软盘等便携式介 质上。在某些方面,数据集各自包括具有至少一对表示感兴趣的分析量的 值(或2维向量)的数据点。例如,在IR光谱的情形中,此成对的值可表 示频率(或波长)和强度值。在步骤110中已接收到或采集到数据集之后, 数据集可被处理。
在步骤120,数据集任选地可被归一化。例如,在一个方面,数据集 被归一化到相同的x-y分辨率。当被处理的所有数据集是由同一仪器来提 供时,此步骤可能并非必需的,因为所有数据集将很可能具有相同x-y分 辨率。然而,x和/或y值可通过将最大值设置为诸如1或100的任意值或 通过将整个数据集除以最大值并乘以任意值来归一化。另外,应当理解,
数据集可在步骤iio之前被归一化。例如,单独过程或系统可将数据集归 一化并提供经归一化的数据集进行处理以及重叠和一致性显示的生成。
在步骤130,执行事件计数过程。在一个方面,生成事件计数的2维
阵列。在此方面,数据集被分成相同的x轴范围和相同的y轴范围。例如, x轴可分成1000个离散间隔而y轴可分成1000个离散间隔,对应于大小为 1000 x 1000 ( 106个阵列元素)的事件计数阵列,或者x轴可分成1000个 离散间隔而y轴可分成500个离散间隔,对应于大小为1000 x 500 (5xl05 个阵列元素)的事件计数阵列。通常,x轴和y轴间隔可以是相同的或者它 们可以是不同的。而且,事件计数阵列可以是任何大小的,诸如具有最多 达106、 108、 101()或更多数目的阵列元素。事件计数过程类似于在所有要被 处理的数据集的组合显示上放置2维阵列以及对于每个阵列元素计数具有 落在阵列元素的x-y范围内的数据的数据集的数目。
图3示出生成两个数据集的4x4事件计数阵列的简化示例。图3a示 出绘制在x-y坐标系中的两个数据集。如图所示,绘图横跨4个x值间隔 以及4个y值间隔——对应于总共16个阵列元素。图3b示出每个单独数 据集的事件计数阵列;在此示例中,根据数据集是否包括落在阵列元素的 x-y范围内的数据,对4x4阵列中的每个阵列元素指派1或0。图3c示出两 个数据集的组合事件计数阵列。如可看到的,取决于数据集是否包括阵列 元素范围中的数据,每个阵列元素具有值O、 l或2。在一个方面,当生成 事件计数阵列时,每个阵列元素将具有范围为从0到N——应用事件计数 过程的数据集的数目——的值M。事件计数阵列中具有N值的任何阵列元 素表示为所有N个数据集共有的数据点;类似地,具有O值的阵列元素表 示不包括在N个数据集中的数据点。中间值(M4到N-1)表示为N个数 据集中的1个或多个、但并非全部所共有的数据点。具体阵列元素的公共 性程度可通过将特定阵列元素值的值M除以被处理的数据集的数目N来确 定
M/N:公共性程度。
如果M/N二1,被处理的所有数据集包括由阵列元素表示的数据值;在 由阵列元素表示的x-y数据值范围内存在所有数据集的完全重叠。类似地,
如果M/N〈1,则是少于完全重叠。如果M/N-0,则没有数据集包括落在 由阵列元素表示的x-y数据值范围内的数据。最大M值Mmax以及还有由此 的事件计数阵列的最大M/N值(M/N)^x也可用于确定在如将在以下更详细 讨论地再现重叠显示时使用的重叠程度。类似地,事件计数阵列的最小M 值(M/N)n^也可用于确定重叠程度。
在某些方面,可在生成事件计数阵列时使用內插值。例如,在其中数 据集仅包括500个x值——对于1000 x 1000的事件计数阵列——的情形 中,可实现内插过程(例如,使用最小二乘方过程、三次样条插值过程等) 来提供内插数据值。而且,可使用阵列元素附近的2 (或更多)个数据值的 简单平均值。
参看图2,在步骤140,生成重叠显示。在一个方面,用户可选择显示 类型以及要被显示的重叠程度。显示类型包括如将在以下更详细讨论的重 叠密度热图(OD热图)显示和重叠密度一致性(OD—致性)显示。在此 步骤,要求将期望被显示的重叠程度作为输入参数。作为默认,可提供指 示完全重叠的参数。在一个方面,重叠可通过用户使用如图4-9中所示以 及在以下更详细描述的滑块10来选择。
在一个方面,OD热图的显示可在显示设备——例如与处理数据集的智 能模块耦合的显示器——上再现。如本文中所用的,OD热图是表示重叠数 据对象的对象。在一个方面,OD热图被显示为从用于指示所有N个数据对 象(OBJECT)之间最高重叠区的一种特定色彩、阴影或图案到用于指示所 有对象之间最低重叠区的第二色彩、阴影或图案且具有指示中间重叠区的 色彩、阴影或图案的区域的色彩、阴影和/或图案的区域。通常,"对象" 指数据集,无论其是接收到的数据集或经处理的数据集,例如,OD热图对 象或OD —致性对象。任何对象自身可用于后续处理,例如,使用OD — 致性对象作为与其它数据对象比较的标准。
OD热图可被定义成显示定义了所有对象的并集(UNION)的重叠对 象的所有区、为所有对象所共有的重叠对象的区(交集)、或者并集或交 集之间由对象在每个重叠对象的区中的重叠百分比定义的任何区域。在另 一方面,OD热图可被定义成显示唯一或不同的、或者具有极少或没有公共
部分的的对象区,如以下所讨论的。
在一个方面,从I到J以及从J到K的数字OD标度被用于定义OD热 图,其中K表示其中所有N个对象上100%的对象重叠(交集;(M/N)max) 的数据,J表示所有数据(并集;M/N>0),而J与K之间的中间值表示 并集与交集之间的某一区域。类似地,I表示其中没有数据重叠(并集减所
有交集;(M/N)min)的数据,而I与J之间的中间值表示并集与(并集减所 有交集)之间的某些区域。I、 J和K可以是任何任意值,诸如1 = -100, J=0 以及K=100。
为了确定要为OD热图显示的色彩,在一个方面,经归一化的事件计 数值例如通过将每个阵列值M乘以(色彩的数目-1) /Mmax来确定并与色彩 标度相匹配。例如,对于16种色彩(4比特的色彩标度),将每个阵列元 素值乘以15/Mmax。以下给出OD热图显示示例和用于确定热图对象和显示 色彩的样本代码。在某些方面,用户可选择用于再现显示的OD标度值和/ 或色彩标度。
在另一方面,可再现OD—致性的显示。在一个方面,OD—致性是表 示在0D标度值下的所有数据集(对象)上的最大值的对象。可创建0D 一致性,或者用户可通过指定重叠密度的量(例如,在00标度上1=交集 减所有并集、 >并集以及&=交集的任意标度上的)并基于所有对象在给定 0D标度值下的最大密度值创建单个对象来将任何0D热图转换成0D —致 性。OD—致性可用作对象,例如,作为与其它数据对象作比较的标准。以 下给出0D —致性显示示例和用于确定一致性对象的样本代码。
图4-8示出根据本发明的使用具有分别设成任意值-100、 0和100的I、 J和K的0D标度的0D热图和0D—致性显示的示例。图4示出图1中所 示的IR光谱按照具有设在0的OD标度值的OD热图的显示。使用设在0 (并集)的OD标度值,OD热图的所有区域都被显示而不管重叠密度水平 如何。在此示例中,表示所有光谱对象100%重叠(OD标度400)的光谱 区被显示为红色(针对此示例任选的;色彩可以是用户定义的),被单个 光谱覆盖(OD标度=-100)的光谱区被显示为紫色(针对此示例任选的; 色彩可以是用户定义的),而表示中间重叠密度水平的所有光谱区由从红
色到紫色范围内的色彩来表示。
图5示出图1中所示的IR光谱按照具有设在100的OD标度值的OD 热图显示的显示。使用设在100的OD标度,仅存在于被比较的对象集合 中的所有对象中的那些光谱区被显示。换言之,仅图4中显示为纯粹红色 的那些值被显示在图5中。图5清晰地示出为集合中所有光谱所共有的区 域。
图6示出图1中所示的IR光谱按照具有设在50的OD标度值的OD 热图显示的显示。使用设在50的OD标度,其中50%或更多光谱区重叠的 IR光谱区域被显示。即,具有M/M皿x值大于或等于0.5的IR光谱事件计 数阵列的区域被显示。图6清晰地示出光谱集合中最公共的区域。
图7示出表示所有光谱区的最大值的单个一致性IR光谱的OD —致性 显示,其中00标度值=50,即,其中50%的光谱对象重叠。这对应于图6 中所显示的热图对象的最大值。
图8示出图1中所示的IR光谱按照具有设在-100的OD标度值的OD 热图显示的显示。使用设在-100的OD标度,其中0%的光谱区重叠的IR 光谱区域被显示。即,仅没有重叠的数据(并集减所有交集;(M/N)min)) 被显示。
在一个方面,用户能够将OD标度值图形地调节成I与J之间的任何 值——例如-100到0之间的任何小数——以及J与K之间的任何值——例 如0到100之间的任何小数。例如,这可通过用户例如,使用鼠标、键盘 或其它选择设备与在显示的右侧的图形滑块交互来实时地进行,以便与图9 中所示并在图4-8中的右侧的滑块10交互。如图所示,滑块10允许用户 在"公共"、"全部"和"唯一"水平之中或之间进行选择。在一个方面, "全部"水平显示所有OD水平的整体OD热图。在一个方面,选择"公 共"水平,仅显示为100%的对象所共有的那些区域,g卩,具有最高OD水 平的那些对象。向上朝标度的"公共"水平移动滑块将移除越来越多的最 低OD水平的信息。选择"唯一"水平仅显示完全特有并与任何其它对象 没有任何公共部分的那些区域,即,具有最低OD水平的那些对象。向下 朝"唯一"移动滑块将移除越来越多的最高OD水平的信息。例如,对于
图1中所显示的IR光谱,如果用户从滑块10选择"公共",则将显示类 似于图5的显示(交集)。类似地,如果用户从滑块10选择"全部",则
将显示类似于图4的显示(并集)。如果用户从滑块10选择"唯一",则 将显示类似于图8的显示(OD差异;并集减所有交集;(M/N)min)。
以下示出根据一个方面的配置成使用图4-7所示的显示滑块10的J到 K滑块部分对x-y值的光谱(2维)向量的输入阵列执行操作130和140的 代码的示例
〃输入光谱向量阵列,全部被归一化成包含X数目个数据点
〃 heatmap_array (热图J车列)指定成包含乂*丫个元素,其中Y取 决于输入向量的分辨率(256或1024)。
〃spectrurn—vector (光谱—向量)数据向量的输入阵列,被归一化成 从0至lj 1
〃计算热图阵列(事件计数) for int x=l to X
for int y=l to Y
heatmap—array [x][y]= 0
end for
end for
for int i=l to number—of—vectors for int x=l to X
for int y=l to spectrum—vector[i][x]承Y
heatmap—array [x] [y]+=l end for end for end for
〃计算最大热图值以进行归一化
int max—val=0 for int x=l to X
for int y=l to Y
if heatmap—array [x][y]>max_val then max_val=heatmap—array [x][y]
end for end for
〃色彩梯度阵列
COLOR colors[NUM—COLS]
〃截止高于其将绘制热图像素的阈值(范围从0到1)
〃绘制画面 for int x=l to X
for int y=l to Y
if heatmap—array [x] [y]/max—val>cutoff then
DrawPixel(x, y: colors[heatmap_array[x][y]*(NUM—COLS- l)/max—val]) end for end for
〃生成归一化的一致性光谱 int consensusVector[X]
for int x=l to X
consensusVector[x] =0 for int y=Y to 1 step -1
if heatmap—array [x] [y]/max_val>cutoff then consensusVector[x]=y-1 break for
end if end for end for
根据另一方面,对于x-y-z值的光谱(3维)向量的输入阵列——其中 热图阵列被指定成包含X+YfZ个元素——以上的代码部分可类似
//计算热图阵列 for int x=l to X
for int y=l to Y
for int z=l to Z
heatmap—array [x] [y] [z]=0 end for end for end for
for int i=l to number_of_vectors for int x=l to X
for int y=l to Y
for int z-l to spectrum—vector[i][x][y]*Z
heatmap—array [x] [y] [z]+=l end for
end for end for
end for
〃计算最大热图值以进行归一化int max—val=0 for int x=l to X
for int y=l to Y
for int z=l to Z
if heatmap—array[x] [y] [z]>max—val then max—val=heatmap_array [x] [y] [z] end for snd for
end for
在此方面,3维图形OD热图和OD—致性显示可被生成或再现,或者 可通过选择适当的X-Y、 X-Z或Y-Z热图阵列元素(例如,将z、 y或x设 置成特定值)来生成2维显示。
根据一个方面,配置成生成显示和生成用于与图9中所示的整个显示 滑块10—起使用的归一化一致性光谱的代码的示例示出如下
〃minCutoff (最小截止)在高于其将绘制热图像素的阈值(范围可 从0到maxCutoff (最大截止))
〃maxCutoff:低于其将绘制热图像素的阈值(范围可从minCutoff到1)
〃绘制画面 for int x=l to X
int yDraw=l; for int y=l to Y
double val= heatmap_array[x][y]/max_val if val>minCutoff AND val<=maxCutoff then
DrawPixel(x, yDraw, colors[heatmap—array[x][y]*(NUM_COLS- l)/max—val])
yDraw+=l
end if end for
end for
//生成归一化的一致性光谱 int consensusVector[X]
for int x=l to X
consensusVector[x]=0 int maxY=Y for int y=l to Y
if heatmap_array [x] [y]/max—val<=maxCutoff then maxY=y break for
end if end for
for int y=Y to 1 step -1
if heatmap array [x][y]/max—val>minCutoff then consensusVector[x]=y-maxY break for
end if end for cud for
类似地,用于生成3维向量归一化一致性表面的代码的示例可类似: 〃生成归一化的一致性表面区域
int consensusSurface[X][Y]
for int x=l to X
for int y=l to Y
consensusSurface[x][y]=0 int maxZ=Z for int z=l to Z
if heatmap—array [x] [y] [z]/max_val<=maxCutoff then maxZ=z break for
end if end for
for int z=Z to 1 step -1
if heatmap—array[x][y][z]/max—val>minCutoff then consensusSurface[x][y]=z-maxZ break for
end if end for
end for end for
根据又一个方面,如图10中所示,提供了具有用于最小(Min)和最 大(Max)水平的各个滑臂的滑条。对于以上代码,"Min"和"Max"滑 臂允许用户选择"MinCutoff (最小截止)"和"MaxXCutoff (最大截止)" 值。例如,对于图1中所显示的IR光谱,如果用户选择图IO(I)中所示的 配置,则将显示类似于图4的显示(并集)。类似地,如果用户选择图10(2) 中所示的配置,则将显示类似于图5的显示(交集)。如果用户选择图10(3) 中所示的配置,则将显示类似于图8的显示(并集减所有交集)。选择
"MinCutoff"和"MaxCutoff"的中间值将产生所选重叠范围的显示。回顾 图4-9,应当理解,滑块10被配置成允许用户在"MaxCutoff"值被设在100
(或100%)的情况下调节"MinCutoff"。
应当理解,本发明的过程或其部分可在运行于处理器或计算机系统上 的计算机代码中实现。代码包括用于控制一个处理器或多个处理器来实现 过程100的各个方面和步骤的指令。代码可通常被存储在硬盘、ROM、RAM
或诸如CD、 DVD等的便携式介质上。类似地,过程100或其部分可在数
据采集设备——包括执行存储在耦合至处理器的存储器单元中的指令的处 理器——中实现。包括此类指令的代码的部分或全部可以可通过到代码源 的有线和/或无线网络连接或者直接连接传送或下载到数据采集设备存储器 单元、或者可另外使用众所周知的便携式介质提供的载波信号来体现。在
某些方面中,本发明的过程可使用诸如C、 C++、 C#、 Fortran、 VisuaBasic
等各种编程语言以及诸如可提供用于数据可视化和分析的预封装例程、函 数或程序的Mathematk^的应用来编码。后者的一个示例是MATLAB 。
本发明的OD显示系统和方法可在各种科学和统计的实验领域中直接 应用。例如,在新陈代谢学领域中,OD显示系统和方法允许研究人员通过 使用来自所收集的由统计分析中分类的每个疾病状态产生的光谱或色谱的 OD —致性来为统计分析中分类的每个疾病状态自动创建生物标志。 结果OD —致性光谱或色谱允许研究人员通过对照由OD —致性光谱或色 谱设置的标准比较未知光谱或色谱来诊断疾病状态。OD差异显示在例如新 陈代谢学中也是有益的。
虽然已作为示例并根据特定实施例描述了本发明,但是应当理解,本 发明并不限于所公开的实施例。相反,它旨在涵盖各种更改和类似布置, 这对于本领域技术人员是显而易见的。因此,所附权利要求的范围应当被 授予最宽泛的解释以包括所有这些更改和类似布置。
权利要求
1. 一种显示多个类似数据集的方法,所述方法包括接收N个数据集,每个数据集包括表示量x和y的两对或多对数据值;通过对每个阵列元素确定事件计数值M来生成包括X乘Y个元素的事件计数阵列,其中每个事件计数值M是对应数据值对x、y在所述N个数据集中出现的次数,其中每个阵列元素对应于x和y数据值的离散间隔;接收重叠密度的指示,所述指示标识数据重叠百分比;确定落在所标识的重叠百分比内的所述阵列元素;以及生成用于表示所述阵列中落在所标识的数据重叠百分比内的所述元素的图形显示的图形数据。
2. 如权利要求l所述的方法,其特征在于,还包括将所述N个数据集 归一化成相同的X和Y尺度。
3. 如权利要求2所述的方法,其特征在于,归一化是在所述接收步骤 之后执行的。
4. 如权利要求2所述的方法,其特征在于,归一化是在所述接收步骤 之前执行的。
5. 如权利要求l所述的方法,其特征在于,所述图形显示是表示所述 阵列中具有所标识的重叠百分比的所有元素的重叠密度热图显示,其中具 有不同的事件计数值范围的元素以不同色彩、阴影和/或图案来显示。
6. 如权利要求5所述的方法,其特征在于,所述指示标识0%与100% 之间的数据重叠百分比范围,并且其中所述显示表示2个和所有N个数据 集之间的并集。
7. 如权利要求5所述的方法,其特征在于,所述指示标识等于100% 的数据重叠百分比,并且其中所述显示表示所有N个数据集的交集。
8. 如权利要求5所述的方法,其特征在于,所述指示标识等于0%的 数据重叠百分比,并且其中所述显示表示所有N个数据集的差异。
9. 如权利要求l所述的方法,其特征在于,所述图形显示是表示所述 阵列中具有所标识的重叠百分比的所有元素上的最大值的重叠密度一致性 显不。
10. 如权利要求l所述的方法,其特征在于,确定包括 对所述整个阵列确定最大事件计数值Mm^其中Mma^N;以及 对于每个阵列元素,将所述指示与M/Mm^作比较以确定所述元素是否落在所标识的重叠百分比内。
11. 如权利要求1所述的方法,其特征在于,所述指示是由用户输入的。
12. 如权利要求ll所述的方法,其特征在于,所述接收到的指示包括 最小值,并且其中最大值是预置的。
13. 如权利要求ll所述的方法,其特征在于,所述接收到的指示包括 最小值和最大值。
14. 如权利要求ll所述的方法,其特征在于,所述接收到的指示是由 所述用户实时调节的。
15. 如权利要求1所述的方法,其特征在于,是在驻留于或耦合至数 据采集设备中的处理器中实现的。
16. 如权利要求1所述的方法,其特征在于,还包括使用所述图形数 据在显示设备上再现所述图形显示。
17. —种包括用于控制处理器以生成用来再现多个类似数据集的显示 的图形数据的代码的计算机可读介质,所述代码包括用于以下操作的指令生成N个数据集的事件计数阵列,每个数据集包括表示量x和y的两对 或多对数据值,所述阵列通过对每个阵列元素确定事件计数值M来包括X 乘Y个元素,其中每个事件计数值M是对应数据值对x、 y在所述N个数 据集中出现的次数,其中每个阵列元素对应于x和y数据值的离散间隔;响应于用户输入重叠密度的指示确定落在所标识的重叠百分比内的所 述阵列元素;以及生成用于表示所述阵列中落在所标识的数据重叠百分比内的所述元素 的图形显示的图形数据。
18. 如权利要求17所述的计算机可读介质,其特征在于,包括用于将 所述N个数据集归一化成相同的X和Y尺度的指令。
19. 如权利要求17所述的计算机可读介质,其特征在于,所述指示标 识0%与100%之间的数据重叠百分比范围,并且其中所述显示表示2个和 所有N个数据集之间的并集。
20. 如权利要求17所述的计算机可读介质,其特征在于,所述指示标 识等于100%的数据重叠百分比,并且其中所述显示表示所有N个数据集的 交集。
21. 如权利要求17所述的计算机可读介质,其特征在于,所述指示标识等于oy。的数据重叠百分比,并且其中所述显示表示所有N个数据集中的唯一值。
22. 如权利要求17所述的计算机可读介质,其特征在于,所述图形显 示是表示所述阵列中具有所标识的重叠百分比的所有元素上的最大值的重 叠密度一致性显示
23. 如权利要求17所述的计算机可读介质,其特征在于,所述图形显 示是表示所述阵列中具有所标识的重叠百分比的所有元素的重叠密度热图 显示,其中具有不同的事件计数值范围的元素以不同色彩、阴影和/或图案 来显示。
24. 如权利要求17所述的计算机可读介质,其特征在于,所述用于确 定的指令包括用于以下操作的指令对所述整个阵列确定最大事件计数值Mm^其中M^^N;以及 对于每个阵列元素,将所述指示与M/M^x作比较以确定所述元素是否 落在所标识的重叠百分比内。
全文摘要
以有益地简化较大数据集中的趋势可视化的方式生成或提供多个数据集的重叠显示的系统和方法。可对多个类似数据集生成2维事件计数阵列。阵列中的每个元素的值是对应的数据值对x、y在N个数据集中出现的次数,其中每个数据元素对应于x与y数据值的离散间隔。一旦生成阵列,就可通过将期望重叠百分比与每个阵列元素的值作比较来生成重叠密度的图形显示。具有满足期望重叠百分比的值的那些阵列元素作为显示对象使用表示重叠百分比的变化程度的一种或多种色彩、阴影和/或图案来再现。
文档编号G09G1/08GK101385062SQ200780005979
公开日2009年3月11日 申请日期2007年2月21日 优先权日2006年2月21日
发明者G·M·巴尼克, K·奈德伟得, T·阿布什尔 申请人:生物辐射实验室股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1