聚集和使用物理样本的制作方法

文档序号:6454436阅读:200来源:国知局
专利名称:聚集和使用物理样本的制作方法
技术领域
本发明在各种实施例中一般涉及数据分析领域,尤其涉及数字数据中的模 式和对象识别。
背景技术
随着计算机和计算机化技术的增长使用,数字表示的信息量已变得很庞 大。对这些大量数字数据的分析一般涉及已知模式的识别。
在许多情形中,起源于数字形式的信息最终通过人的人工审阅来分析,通 常需要大量的训练。例如,医疗图像分析典型地需要高水平的专家。为了使人 们与大量数据互动,信息典型地被变换成视觉的、听觉的或人类可觉察到的其 它表示形式。然而,在将数字数据从其原始形式变换成方便的输出形式的过程 期间,某些信息可能被丢失。数据通常在分析之前被处理和滤波以便展示,导 致从原始数据丢失有效信息。例如,超声、地震以及声纳信号等数据最初都是 基于声音的。其中每一个的数据被典型地处理成图形形式用于显示,但该处理 通常出于人们的可读性而牺牲了基本的意义和细节。
虽然人们可被训练以分析许多不同类型的数据,但人工手动分析一般比自 动化系统更昂贵。此外,错误通常由于人类感知和注意广度的限制而被引入。 这些数据通常包含比人类感官能辨别的更多的细节,并且重复导致错误是公知 的。
为解决这些人力分析缺点,许多自动模式识别系统已被开发出来。然而,这些解决方案中的大多数都是高度因数据而异的。模式识别系统能够处置的输 入通常被设计为固定和有限的。在多数系统是根据在具体形态上使用来设计的
基础上,许多系统固有地受设计限制。例如,医疗图像分析系统在X光或MR 成像上表现良好,但对地震数据表现很差。反之亦然。评价数据的系统紧密地 与其被设计成要评价的特定数据源相耦合。因此,对宽范围系统的改进是非常
困难的。
在每个系统内,模式和特征识别是处理密集的。例如,图像分析一般使用 复杂的算法以找到形状,要求数千个算法被处理。发现、开发以及实现每个算 法的时间导致在部署和改进该系统方面增加了延迟。
由此,在自动模式识别系统领域中仍有相当大的改进余地。
发明概述
此系统被设计成并不被任何具体形态或被开发该系统的那些人的有限知 识所限定。本发明提供一种自动化模式识别和对象检测系统,该系统能为数据 内容使用最小数目的算法被快速开发和改进以完全地区别数据中的细节,同时 减少对人工分析的需要。本发明包括无需其适应特定应用、环境、或数据内容 就能在数据中识别模式和检测对象的数据分析系统。该系统评价天然形式的数 据,其独立于表示形式或处理后的数据形式。
在本发明的一方面,该系统分析来自全部数据类型内的任何或所有形态的 数据。示例数据形态包括成像、声学、气味、触觉以及尚未发现的形态。在成 像范围内,应用在药学、国土安全、自然资源、农业、食品科学、气象学、空 间、军事、数字版权管理及其他领域中时存在静止和移动图像。在声学范围内, 应用在药学、国土安全、军事、自然资源、地质学、空间、数字版权管理及其 他领域中时存在单个和多个信道音频声音、超声波连续流、地震、声纳。其他 数字数据流的示例包括雷达、气味、触觉、金融市场和统计数据、机械压力、 环境数据、味道、和声学、化学分析、电推动、文本及其他。某些数据形态可 以是其他形态的组合,诸如有声音的视频或诸如对同一样本采纳不同类型的多 个图像的单个形态的多种形式,例如互相关的MRI和CT成像;组合的SAR、 摄影和IR成像。在共同系统中作出的改进使所有形态都受益。在本发明的其他方面,该系统使用相对较小数目的简单算法,这些算法捕 捉数据元素之间更基础的关系以标识数据内的特征和对象。此组有限算法可在 每种形态和多种形态中快速实现。
在本发明的再其他方面,该系统提供在天然数据的全分辨率上操作的自动 化系统。结果以及时方式产生,减轻了初步人工分析的乏味并且提醒操作员检 查需要注意的数据组。
在本发明的又其他方面,该方法包括接收第一物理样本,感测该第一样本 的第一方面以生成第一样本第一方面数据,在数据存储中存储该第一样本第一 方面数据,感测该第一样本的第二方面以生成第一样本第二方面数据,在数据 存储中存储该第一样本第二方面数据,通过使用第一样本第一方面数据和第一 样本第二方面数据中至少一者运行第一系列算法来生成第一样本变换数据,并 且在数据存储中存储第一样本变换数据。
在本发明的进一步方面,感测第二样本的第一方面包括捕捉第二样本的摄 影图像。
在本发明的再其他方面,该系统包括处理器、与处理器进行数据通信的存 储器、与处理器进行数据通信的用户接口、以及用于存储在所述存储器中并由 所述处理器操作的软件模块。在示例实施例中,该软件模块被配置成在存储器 中存储以前生成的与第一物理样本的第一方面相关的数据、在存储器中存储以 前生成的与第一物理样本的第二方面相关的数据、通过使用第一样本第一方面 数据和第一样本第二方面数据中至少一者运行算法来生成第一样本变换数据、 以及在存储器中存储第一样本变换数据。


以下参照下列附图来详细描述本发明的优选和替换实施例。
图1示出本发明的一个实施例的概览;
图2示出用于执行薮据分析和特征识别系统的示例系统;
图3示出用于使用数据分析和特征识别系统的示例方法;
图4示出用于创建数据存储的示例方法;
图5示出用于创建已知特征的示例方法;图6示出用于通过训练或不训练修改突触网络的示例方法; 图7示出用于生成算法值高速缓存的示例方法; 图8示出用于训练已知特征的示例方法;
图9示出用于从正和负训练值组创建训练路径集合的示例方法; 图10示出用于从训练路径集合移除负训练值组的示例方法; 图11示出用于从训练路径创建突触路径的示例方法; 图12示出用于将突触叶与已知特征相关联的示例方法; 图13示出用于不训练已知特征的示例方法;
图14示出用于使用一组算法值来检索突触网络中的突触叶的示例方法;
图15示出用于将突触叶与已知特征断开关联的示例方法;
图16示出用于标识已知特征的示例方法;
图17示出用于确定是否已找到已知特征的示例方法;
图18示出用于评价群集和阈值检测的示例方法;
图19示出用于评价阈值检测的示例方法;
图20示出用于评价群集检测的示例方法;
图21示出用于处理对某区域标识出的己知特征的示例方法; 图22示出用于执行已知特征动作的示例方法; 图23示出灰度图像数据的示例10 X 10像素阵列; 图24示出包含均值算法的输出的示例10 X 10阵列; 图25示出包含中值算法的输出的示例10 X 10阵列;
图26示出包含值展距算法的输出的示例10x 10阵列;
图27示出包含标准偏差算法的输出的示例10x 10阵列;
图28示出包含使用图24-27中计算出的值的单条突触路径的示例突触网
络;
图29示出包含使用图24-27中计算出的值的两条突触路径的示例突触网
络;
图30示出包含使用图24-27中计算出的值的许多突触路径的示例突触网
络;
图31示出来自图30的添加有下一条突触路径的示例突触网络,示出突触网络可如何分支;
图32示出包含所有使用图24-27中计算出的值的突触路径的示例突触网
络;
图33示出结果得到具有多个已知特征的突触叶的突触路径;
图34示出一系列用于6x6灰度图像的阵列;
图35示出在设置数据存储时的介绍屏幕的屏幕截图36示出输入一组初始值的屏幕截图37示出展开的子形态组合框的屏幕截图38示出一系列用于添加可任选的描述性参数的文本框的屏幕截图; 图39示出选择目标数据区域形状和为该形状选择一组算法的屏幕截图; 图40示出以前选择的数据存储性质的概览的屏幕截图; 图41示出图40中显示的概述的延续;
图42示出完成数据存储的创建之后的示例应用的屏幕截图; 图43示出灰毗邻像素目标数据区域的算法的屏幕截图; 图44示出"创建或编辑已知特征"向导的屏幕截图; 图45示出为已知特征选择名称和检测方法的屏幕截图; 图46示出来自图45的展开的组合框的屏幕截图47示出用于已知特征的训练计数值的屏幕截图48示出用于已知特征的群集范围值的屏幕截图49示出已知特征的动作值的屏幕截图50示出以前选择的已知特征性质的概览的屏幕截图51示出具有所选择的感兴趣地区的森林图像的屏幕截图52示出训练向导介绍屏幕的屏幕截图53示出从数据存储中选择森林作为已知特征的屏幕截图54示出选择区域训练选项的屏幕截图55示出以前选择的训练性质的概览的屏幕截图56示出训练结果的屏幕截图57示出有森林区域的图像的屏幕截图58示出训练图57中的图像的结果的屏幕截图;图59示出用于已知特征处理的向导的屏幕截图60示出用户可能想处理的已知特征列表的屏幕截图61示出已知特征的有效性值的屏幕截图62示出对于单个处理运行可任选忽略的训练计数值的屏幕截图; 图63示出对于单个处理运行可任选忽略的群集值的屏幕截图; 图64示出以前选择的处理性质的概览的屏幕截图; 图65示出处理结果的屏幕截图66示出用绿色层显示系统标识为森林的像素的图像的屏幕截图67示出有森林层的复合图像的屏幕截图68示出为森林已知特征处理的第二图像的屏幕截图69示出用绿色层显示系统标识为已知特征森林的像素的图像的屏幕截
图70示出有森林层的复合图像的屏幕截图71示出选择了水面的图像的屏幕截图72示出使用以前选择的水面的训练结果的屏幕截图73示出有森林和水面两者的图像的屏幕截图74示出以前选择的处理性质的概览的屏幕截图75示出处理结果的屏幕截图76示出水面层的屏幕截图77示出有森林层和水面层两者的复合图像的屏幕截图; 图78是根据本发明实施例的方法的框图。 图79是根据本发明实施例形成的虚拟病理学库的框图。 图80是根据本发明实施例形成的系统的框图。
优选实施例的详细描述
虽然参考诸如图像数据和音频数据等的具体数据类型来描述数据分析和 特征识别系统的下列实施例和示例中的几个,但本发明并非被限定于对这些数 据类型的分析。本文中描述的系统和方法可用于识别数据组或可在可量化数据 存储中表示的任何其它信息集合中的离散特征。本文中描述的数据分析和特征识别系统的实施例一般涉及数字数据流的 分析和组织以学习和重复识别数据内的模式和对象。数字数据流可以是模拟源 到数字形式的变换。在某些实施例中,系统使用的数据组织结构涉及用于描述 所定义对象的要素的互连数据字段的网络(本文中称为"突触网络")。
在例如图1中所示的一个实施例中,数据分析和特征识别系统被配置成接
受包含已知和预先标识的特征"X" 81 (例如,已知模式、形状或对象)的源 数据组80。该系统被一般配置成使得用户能够"训练"(82)该系统识别该已 知特征"X"。此训练通过执行多个算法以分析(83)表示特征"X"的数据 从而标识定义该特征的特性的多组值来完成。定义特征"X"的几组值随后存 储(84)在本文中称为"突触网络"85的组织性结构中,其由通过多条"突触 路径"互连的多个"突触叶"组成。
一旦对于已知特征该系统已被训练,可向系统展示包含一组未知特征87 的新数据组86。该系统可被配置成接受用户请求88以使用相同的多个算法来 分析(89)该新数据组的选择部分,并将结果与突触网络85中存储的信息进 行比较(90)以标识该新数据组中包含的任何已知特征(诸如特征"X"、或 任何以前训练过的其他特征)。 一旦在新数据组中找到已知特征,该系统就可 通知(91)用户已知特征已被标识的事实和/或该系统就可向用户展示(92)已 知特征的表示(例如,以图形图像的形式、可听到的声音、或任何其它形式)。
如本文中所使用的,术语"数据存储"表达其本意,并且在本文中一般用 于指至少能够暂时存储数据的任何软件或硬件单元。在几个实施例中,本文所 称的数据存储包含由多个突触网络表示的多个已知特征,每个突触网络包含由 突触路径联结的多个突触叶,如以下进一步例示说明的。
如本文中所使用的,术语"目标数据元素"(TDE)是指被使用算法来评 估特性的给定介质中较大数据组的离散部分。目标数据元素可以是适合特定类 型的数据的任何尺寸。例如,在一组图形数据中,TDE可由单个像素组成,或 其可包括局部化的像素群或任何其它离散像素群。在几个实施例中,不管其大 小,TDE是在移动到下一个TDE之前在单个离散步骤中被评价的"点"。
如本文中所使用的,"目标数据区域"(TDA)是紧围着目标数据元素的 数据的集合。TDA的尺寸和形状取决于被评价的数据或介质的类型可变化。TDA的尺寸和形状定义可用于算法执行的计算的数据点。
如本文中所使用的,使用术语"已知特征"来指表示在训练期间已知在特 定数据组中存在的条目、对象、模式、或其它可离散定义的信息片段的数据元 素。在处理时,系统为一个或以上以前定义过的已知特征搜索新数据组。
如本文中所使用的,术语"突触网络"是指在有根的固定深度树的实现中 用于存储关于离散特征、模式、对象或其他已知数据组的信息的组织性结构。 突触网络有利地允许关于已知特征的信息被很快添加,并允许未知数据组被很 快评价以标识其中包含的任何已知特征。
如本文中所使用的,术语"突触叶" 一般是指表示由用于到达叶的一组算 法值标识出的多个已知特征的突触网络中的终端节点。
如本文中所使用的,术语"突触路径"是指来自所有这些算法的多个值。 突触路径被用于基于对目标数据元素的计算到达突触叶。
如本文中所使用的,"训练事件"是通过创建或更新突触路径和突触叶将 多个算法值与已知特征相关联的过程。
如本文中所使用的,术语"算法"表达其本意,并且不限于指结果得到离 散"值"的任何系列可重复步骤。例如,算法包括任何数学计算。在几个实施 例中,对与以前定义的目标数据区域相关的目标数据元素执行各种算法以产生 单个有意义的值。
如本文中所使用的,术语"命中检测"是指基于将处理期间遭遇的突触路 径与对某已知特征训练过的任何路径相匹配来确定该已知特征是否存在于测 试数据组中的方法。
如本文中所使用的,术语"群集检测"是指基于命中检测和对目标数据元 素的预定义"群集距离"内指定数目的附加命中的检测两者来确定已知特征是 否存在于测试数据组中的方法。
如本文中所使用的,术语"群集距离"是指一个或以上用于评价目标数据 元素的用户定义的距离规格。群集距离可指实际物理距离,或可表示离散数据 元素之间的数学关系。
如本文中所使用的,术语"阈值检测"是指基于命中检测和命中检测中使 用的突触路径作为已知特征已被训练的次数两者来确定该已知特征是否存在于测试数据组中的方法。
如本文中所使用的,术语"正训练值组"是指在被训练成用户定义的已知 特征的数据区域中的几组算法值。
如本文中所使用的,术语"负训练值组"是指在被训练为用户定义的己知 特征的数据的区域外的几组算法值。
如本文中所使用的,术语"区域训练"是指在训练事件中使用的过程,其 中在正训练值组中找到的每组算法值都被用于为该已知特征生成突触路径。
如本文中所使用的,术语"相对调整的训练"是指在训练事件中使用的过 程,其中在负训练值组中找到的每组算法值使正训练值组内找到的一组匹配算 法值无效。随后可使用其余正训练值组为该已知特征生成突触路径。
如本文中所使用的,术语"绝对调整的训练"是指在训练事件中使用的过 程,其中在负训练值组中找到的每组算法值使正训练值组内找到的算法值匹配
的所有组无效。随后可使用其余正训练值组为该已知特征生成突触路径。
如本文中所使用的,术语"形态"以其本意使用,并且一般是指可被处理 的数字数据的各种不同形式或格式中的一种。例如,图像数据表示一种形态, 而音频数据表示另一种形态。除描述符合一种或以上人类感知形态的数据类型 外,该术语还旨在涵盖与人类感知可能只有很少或没有关系的数据类型和格 式。例如,金融数据、人口统计数据和文学数据在本文中使用时也表示该术语 意义内的形态。
如本文中所使用的,术语"子形态"是指形态的子分类。在某些实施例中, 子形态是指用于数据的能够影响如何处理该数据的应用或源之一。例如,x光 和卫星摄像是成像的子形态。来自不同厂商(诸如通用电气或西门子)的用于 产生X光图像的系统在其将被描述成不同子形态的数据格式方面明显不同。
图2示出用于执行数据分析和特征识别系统的示例系统100。在一个实施 例中,系统100包括单个计算机101。在替换实施例中,系统100包括与多个 其它计算机103通信的计算机101。在替换实施例中,计算机101被连接到多 个计算机103、服务器104、数据存储106和/或诸如内联网或因特网等的网络 108。在又一替换实施例中,可使用服务器排、无线设备、蜂窝电话和/或另一 数据输入设备来代替计算机IOI。在一个实施例中,数据存储106存储数据分析和特征识别数据存储。该数据存储可本地存储在计算机101上或存储在任何
远程位置但可被计算机101检索。在一个实施例中,应用程序由服务器104或 计算机101运行,其随后创建该数据存储。计算机101或服务器104可包括训 练已知特征的应用程序。例如,计算机101或服务器104可包括标识数字介质 中以前定义的已知特征的应用程序。在一个实施例中,该介质是图像数据中的 一个或以上像素或声音记录中的一个或以上样本。
图3示出根据本发明的实施例形成的方法。在框112处,创建数据存储, 其将在以下图4和5中更详细地描述。在框114中,训练已知特征。以下关于 图6-15更详细地描述该训练。在框116处,标识出已知特征,其将在图16-20 中更详细地描述。在框118处,执行已知特征动作,其将在图20中进一步例 示说明。
图4示出用于创建数据存储的示例方法(框112)。该方法(框112)在 框120处通过指派多个数据存储性质开始。在一个实施例中,数据存储性质包 括形态和子形态。在每个形态内,有多个子形态。在一个实施例中,在框122 处创建已知特征,其将在图5中进一步例示说明。在一个实施例中,在框124 处指派目标数据区域。在一个实施例中,选择目标数据区域。对于成像形态的 一个示例目标数据区域是围绕目标像素的近邻和远邻像素的模式。在一个实施 例中,在框126处选择目标数据区域算法。在框128处,将数据存储106保存 到计算机101或网络108。框120、 122以及124与126的组合可按任何次序执 行。
图5示出用于创建已知特征的示例方法(框122)。在框140处,用户输 入已知特征的名称。在一个实施例中,在框142处,用户向该已知特征指派一 种用于检测的方法。在一个实施例中,该检测方法可被选择为命中检测。在一 个实施例中,可使用群集检测。在一个实施例中,可使用阈值检测。在一个实 施例中,可使用群集和阈值检测。在一个实施例中,在框144处,可为通知找 到已知特征的方法选取处理动作。在一个实施例中,用户可不选择动作,执行 系统声音、或涂抹多个像素。框140、 142和144可按任何次序执行。
图6示出用于通过训练或不训练修改突触网络的示例方法(框114)。在 一个实施例中,该方法在框150处以生成算法值高速缓存开始,其在图7中进一步描述。在一个实施例中,该方法在框152处当用户选择已知包含要被训练
的特征的数据区域时开始。在框153处,检索正训练值组。在一个实施例中, 在框154处,作出关于用户是否正在执行经调整的训练的判定。如果是,则在 框156处,检索负训练值组。在一个实施例中,在框158处作出关于用户是否 正在训练或不训练已知特征的判定。如果在训练,则在框159处训练该已知特 征,其将在图8中进一步例示说明。在一个实施例中,在框160处,向用户给 出显示被添加和更新的独特突触路径的数目的报告。如果不在训练,则不训练 已知特征,其将在图13中进一步解释。在一个实施例中,在框162处,向用
户报告被移除的独特突触路径的数目。框150和152可按任何次序执行。框153 以及154与156的组合可按任何次序执行。
在某些境况下,用户能够很好地调谐感兴趣地区的限制可能导致某些正训
练值组实际上包含用户知晓其不是他/她希望训练的数据部分。这些情形由经调 整的训练来处置,其可由用户选择。静止图像中感兴趣地区之外的这一区域经 常是用户不想作为已知特征来训练的背景或普通区域。通过标识负训练值组, 来自感兴趣地区(正训练值组)内的实际上不是用户希望作为己知特征来训练 的特征的那些算法值组可被移除。
图7示出用于生成算法值高速缓存的示例方法(框150)。在一个实施例 中,算法值高速缓存由存储以前选择的算法的数字结果的阵列组成。该方法(框 150)在框170处以该方法检索数据中的第一个TDE开始。在框176处,在 TDE的TDA上计算算法值。在框180处,将该算法值存储在该TDE的算法值 高速缓存中。在框174处,作出该数据中是否有更多TDE可用的判定。如果 是假,则在框172处,完成该算法高速缓存。如果为真,则在框178处,检索 下一个TDE并且处理返回到框176。
图8示出用于训练已知特征的示例方法159。方法159在框190处开始, 在此检索已知特征用于训练并且建立训练突触路径阵列。在框192处,从正和 负训练值组发展出训练突触路径阵列。在框194处,—创建并遵循新突触路径。 在框196处,将突触路径与已知特征相关联,其将在图12中进一步解释。在 框202处,作出关于训练路径阵列中是否有更多条目的判定。如果是,则返回 至框194。如果否,则在一个实施例中,更新训练计数。在一个实施例中,在框200处,分序突触叶。在框204处,该方法(框159)完成。框190和192
可按任何次序执行。
图9示出用于从正和负训练值组开发训练突出路径阵列的示例方法(框 192)。在框210处,检索训练类型以及正和负训练值组。在框212处,将正 训练值组指派给训练阵列。在框214处,作出关于用户是否正在执行经调整的 训练的判定。如果是,则在框216处,从训练阵列中移除负训练值组,其将在 图10中进一步解释。在框218处,开发训练突触路径完成。
图10示出用于执行调整训练的示例方法(框216)。在一个实施例中, 相对和/或绝对调整训练都是可用的。在框220处,从各负训练值组之一中选择 突触路径。在框222处,作出训练类型是否是绝对调整训练的判定。如果是, 则在框226处,从训练阵列中移除与当前突触路径匹配的所有突触路径。如果 否,则在框228处,从训练阵列中移除与当前突触路径匹配的一条突触路径。 在框230处,选择下一条突触路径,并且如果不再有突触路径,则在框218处, 该方法返回到图9,即框216。
图11示出用于创建和跟随突触路径的示例方法(框194)。在框240处, 该过程将当前节点设置到突触网络的根节点。在框242处,选择突触路径中的 算法值。在框244处,作出关于当前节点对于当前算法值是否有下一个节点链 接的判定。如果是,则在框248处将当前节点设置到该下一个节点。如果否, 则在框246处创建新节点;用当前算法值将当前节点链接到该新节点。在框248 处,当前节点被设置到该下一个节点。在框250处,选择下一个算法值。在框 252处,结果所得突触叶被返回给图8中的框194。
图12示出用于将突触路径与已知特征相关联的示例方法(框1%)。在 框260处,将当前突触叶设置到从图11返回到图7的框194的突触叶。在框 266处,作出关于当前突触叶是否包含被训练的已知特征的索引值的判定。如 果是,则在框268处更新当前突触叶命中计数。如果否,则在框270处,作出 关于当前突触叶是否具有下一个突触叶的判定。如果是,则在框276处将当前 突触叶设置到该下一个突触叶。如果否,则在框272处,创建包含被训练已知 特征的索引的新突触叶,并将其链接到当前突触叶。在框280处,该过程返回 到图7中的框196。图13示出用于不训练已知特征的示例方法(框161)。在框320处,检 索不训练的已知特征和多个正训练值组。在框322处,选择当前值组。在框324 处,跟随该当前正训练值组的突触路径。在框326处,测试该突触路径看其是 否存在。如果是,则在框328处将该突触路径与已知特征断开关联。如果否, 则在框330处前进到下一组正训练值。 一旦所有正训练值组已被评价,则在框 332处,返回到图6中的框161。
图14示出用于跟随突触路径以基于一组算法值来标识叶的示例方法(框 324)。在框340处,将当前节点设置到突触网络的根节点。在框342处,为 用于当前节点的算法从突触路径中选择算法值。在框344处,作出关于当前节 点对于当前算法值是否有下一个节点链接的判定。如果是,则在框346处将当 前节点设置到该下一个节点。在框348处,选择下一个算法值。如果不再有算 法值,则在框350处,在突触路径结束处返回突触叶。如果否,则在框352处, 该突触路径不存在。该过程返回至图13的框324。
图15示出用于将突触路径与已知特征断开关联的示例方法(框328)。 在框360处,将当前突触叶设置到由图14返回到框324的突触叶。在框362 处作出关于当前突触叶是否包含该已知特征的索引值的判定。如果是,则在框 364处移除该叶。如果否,则在框365处作出关于当前突触叶是否具有下一个 叶的判定。如果是,则将当前突触叶设置到该下一个叶并且该过程被重复。如 果否,则该过程在框370处返回到图13中的框328。
图16示出用于标识已知特征的示例方法(框116)。在一个实施例中, 在框390处生成算法值高速缓存。(参见图7)在框392处,在当前数据中选 择一个区域。在框393处,选择第一个TDE。在框394处,作出该TDE是否 在所选择区域中的判定。如果是,则在框398处,如果可用就从算法值高速缓 存中检索该TDE的算法值;如果不可用,就为该TDE计算算法值。在框400 处,用这些算法值来査询数据存储。(参见图14)在框404处作出对于这些算 法值的路径是否存在的判定。如果是,则在框406处^l定该匹配是否是已知特 征的命中,其在图17中进一步解释。如果否,则在框402处检索下一个TDE。 如果从框394为否,则在框396处返回标识出的已知特征。框390和392可按 任何次序执行。图17示出用于确定已知特征是否是叶命中的示例方法(框406)。在框 420处,对于为该叶找到的已知特征中的每一个执行下列处理。在框426处, 检査该特征看是否有用户选择它用于标识。如果是,则在框428处,检査该特 征看命中方法是否被设置为命中检测。如果在框428处为否,则在框434处, 检查该特征看命中检测方法是否被设置为阈值。如果在框434处为否,则在框 440处,检査该已知特征看己知特征命中方法是否被设置为群集化。如果在框 428处为是,则在框430处,将该已知特征添加到为当前一组算法值标识的特 征列表中。如果从框434为是,则在框436处针对阈值命中检查该已知特征, 其在图19中进一步解释。如果从框400为是,则在框442处执行对群集化命 中的检查,其在图20中进一步解释。如果从框440为否,则在框444处系统 检査群集化和阈值命中,其在图18中进一步解释。在框436、 442和444处, 对于命中返回的数据或为真或为假。在框438处,分析该返回值以确定在此位 置是否有命中。如果是,则在框430处,将该已知特征添加到当前一组算法值 的已标识特征列表中。如果否,则在一个实施例中,在框424处确定该方法是 否仅处理最显著的已知特征。如果是,则该方法完成;如果否,则在框422或 框426处,检査是否有与当前叶相关联的附加已知特征。如果是,则前进到框 420;如果否,则该方法现在完成并且通过框432返回至图16中的框406。
图18示出用于检查群集化和阈值命中的示例方法(框444)。在框450 处,该方法执行对阈值命中的检查。在框452处,检查是否找到阈值命中。如 果否,则该方法前进到框459。如果是,则该方法前进至框454。在框454处, 该方法执行对群集化命中的检查。在框456处,检査是否找到群集化命中。如 果否,则该方法前进到框459。如果是,则该方法前进至框458。在框458处, 在阈值和群集化处理中检测到命中,且因此将真返回给图17中的框444。在框 459处,在阈值或群集化处理之一中未检测到命中,且因此将假返回给图17 中的框444。框450和452以及454与456的组合可按任何次序执行。
图19示出用于检査阈值命中的示例方法(框436)。在框460处,系统 检测看是否设置了处理阈值。如果是,则在框462处,作出对突触叶的已知特 征命中计数是否在处理最小值与最大值之间的判定。如果是,则在框468处返 回真;如果否,则在框466处返回假。如果从框460为否,则在框464处检査该已知特征以确定对突触叶的命中计数是否在已知特征最小值与最大值之间。
如果是,则在框468处返回真;如果否,则在框466处返回假。
图20示出用于检査群集化命中的示例方法(框442)。在框470处,系 统检测看是否设置了处理群集距离。如果否,则在框472处,该方法用已知特 征群集距离执行群集化检査。如果是,则在框474处,用处理群集化距离来执 行群集化检查。随后在框476处,作出检査看是否找到群集。如果是,则在框 478处返回真。如果否,则在框480处返回假。
图21示出用于处理对某区域标识出的已知特征的示例方法(框118)。在框 492处,检索在所选择区域中的第一个TDE。在框496处,检查该TDE以确 定其是否在该所选择区域之内。如果否,则处理动作完成。如果是,则在框500 处检索对该TDE标识出的特征列表。在框501处,对该特征列表执行动作。 这一旦完成,就在框502处检索下一个TDE。
图22示出一个实施例中用于对己知特征列表执行动作的示例方法(框 501)。该方法(框501)在框503处开始。在框503处,将当前已知特征设置 到TDE列表中的第一个巳知特征。在框504处,检査已知特征动作以确定该 动作是否为声音。设置已知特征动作曾在图5中例示说明。如果是,则在框506 处,系统确定该声音以前是否已被播放过至少一次。如果从框506为否,则在 框508处播放由已知特征动作数据指定的声音。如果从框504为否,则在框510 处检查该已知特征动作以确定其是否为涂抹。如果是,则按照该已知特征动作 数据设置该TDE的图像色彩。在框511处,作出检查看TDE列表中是否存在 更多己知特征。如果是,则将当前已知特征设置到下一个巳知特征(框515), 并且该方法在框504处继续。如果否,则该方法在框513处返回。其他实施例 需要的附加动作或动作组合是可能的。这些动作可按任何次序来检査和执行。
图23是10 x 10像素图像的示例阵列600。像素的X坐标由诸行604中的 数字来表示。像素的Y坐标由诸列602中的数字来表示。在一个实施例中,阵 列600内示出的薮字是该10 x 10像素图像的原始灰度值。示—出的数字是使用 包括围绕目标像素的八个像素的毗邻像素TDA使用预先选择的算法来操纵的 数字。在此示例中,选取的算法为均值、中值、值展距和标准偏差。进一步, 图24-34示出图3中描述的训练已知特征的示例。图24示出对毗邻像素TDA使用均值算法的10 x 10像素图像的示例阵列 605。如阵列605中所示,第一行和最后一行609被打上了阴影,并且第一列 和最后一列607被打上了阴影。这些区域被打上阴影是因为它们不包含必要的 划界像素。第一个有效像素——所有侧都被另一像素界定的第一个像素——是 (2, 2),并且该算法结果所得为153。结果153将在图28开始被进一步使用。
图25示出对毗邻像素TDA使用中值算法的该10 x 10像素图像的示例阵 列610。该算法为第一个有效像素结果所得为159。结果159将在图28开始被 进一步使用。
图26示出对毗邻像素TDA使用值展距算法的该10 x 10像素图像的示例 阵列620。该算法为第一个有效像素结果所得为217。结果217将在图28开始
被进一步使用。
图27示出使用标准偏差算法的该10 x 10像素图像的示例阵列630。该算 法为第一个有效像素结果所得为64。结果64将在图28开始被进一步使用。
图28示出在一个实施例中包含根据图24-27中计算出的第一有效像素值 形成的单条突触路径的示例突触网络640。为153的第一值(642)来自第一算 法(縮写为ALG)(图24像素2, 2处)。因此,642显示153,计数l。计 数1表示在训练期间第一算法具有结果153的次数。第二节点644示出第二算 法(图25像素2, 2处)为159的结果。因此,644显示159,计数1。第三节 点646示出第三算法(图26像素2, 2处)为217的结果。因此,646显示217, 计数1。第四节点648示出第四算法(图27像素2, 2处)为64的结果。因此, 648显示64,计数l。随后此突触路径通向包含已知特征(縮写为KF) 1的突 触叶。这是首次此突触路径已被创建,且因此计数也为1,参见框650。在此 示例中,突触叶640是该突触网络中的第一突触叶。
图29示出在一个实施例中包含使用图24-27中计算出的值的两条突触路 径的示例突触网络660。突触叶664曾在图28中示出和描述。突触叶666表示 来自图24-27中所示每个表的像素(2, 3)的算法值。因此,在分析两个像素之后, 有两条不同的标识同一已知特征的突触路径。
图30示出在一个实施例中使用图24-27中计算出的值的示例突触网络 670。从图24-27中所示各表计算出的值表示像素(2, 2)到(3,4)。这些值在各行内从左到右被采纳。在计算中的此时,来自第一算法的值没有重复;因此,对 于每个计算的像素,全新的突触路径和新的突触叶被添加到该突触网络。
图31示出在一个实施例中使用图24-27中计算出的值的示例突触网络 720。在突触网络720中,有在722处示出的重复值。第一算法值151在(2, 8) 和(3,5)两处找到,因此将该位置处的计数增大到等于2。在722处,该突触路 径分裂,因为从第二算法检索到不同值。对该组值生成新突触路径的一部分和 新突触叶。
图32示出在一个实施例中使用图24-27中计算出的值的示例突触网络 730。此示例示出在732、 734和736处第一算法值重复的更被填充的突触网络 730。这些重复显示出在突触网络中的任何节点都可形成新分支并且将形成新 突触路径。如节点732中所示,有三个仍得到同一己知特征的分歧结果。图32 进一步演示训练已知特征之后被完全填充的突触网络可能看起来像什么的图
形表示。
图33示出结果得到具有多个已知特征742的突触叶的突触路径740。当 多个已知特征与突触路径相关联时,这些特征被存储在按特征的命中计数来排 序的分序列表中。最经常与突触模式相关联的已知特征在该列表中首先出现, 后面是按命中计数降序排列的其他已知特征。在平局的情形中,第一个与该突 触路径相关联的已知特征将首先出现。
图34示出一系列对于6 x 6黑白图像的阵列。该页面顶部的阵列示出该图 像中所有像素的亮度值。下一阵列680示出向顶阵列应用毗邻像素TDA的均 值算法的结果。阵列690示出向顶阵列应用毗邻像素TDA之后中值算法的结 果。阵列700示出向顶阵列应用毗邻像素TDA之后值展距算法的结果。阵列 710示出向顶阵列应用毗邻像素TDA之后标准偏差算法的结果。作为示例, 阵列680-710的结果被应用到图32中的突触网络。来自阵列680的(2, 2)中所 示的结果所得值为164。现在参考图32,在图32中的突触网络732处的第一 节点中找到值164。接下来,使用在(2,2)处找到的值——值152,图32中显示 跟随164的下一个节点为152。因此,前两个值沿着已知突触路径。沿着此突 触路径并且阵列700和710中(2, 2)处的值表明在像素(2, 2)处,该突触网络中 被训练的已知特征存在匹配。在图35-37中,屏幕截图表示界面的一个示例;存在无限的替换。 图35是在设置数据存储时的介绍屏幕的屏幕截图800。这显示向导802 的介绍,其将引导用户通过此应用中的各步骤来创建和/或编辑数据存储。此图 中还示出一系列选项卡804。这些选项卡示出用户在该向导内的位置。右上角 是提供关闭和退出向导802的能力的按钮。在该屏幕截图的底部是执行取消的 选项按钮808、执行回退的选项按钮810、执行到下一步的选项按钮812以及 执行完成的选项按钮814。以上描述的一般布局是在大多数屏幕截图中盛行的。 图36是示出输入定义数据存储的初始值的屏幕截图。选择选项卡"必需" 804,示出在此应用中必要的一组值。在此阶段,用户正标识将被处理的数字 数据的类型。形态组合框820包含一系列指定数字数据流的格式的形态。子形 态组合框822包含一系列指定信息的使用或形态的具体应用的子形态。记录由 复选框824表示。
图37示出显示展开的子形态组合框822的屏幕截图。子形态组合框822 已被展开,以在一个实施例中示出当前已对两维图像形态作了设置的子形态的 可配置列表。此组合框822向用户示出之前选择的数字数据形式内的多个子分 类,以使得用户能够处理一个形态内数字数据的差别。
图38是示出此应用中一系列用于添加可任选的描述性参数的文本框的屏 幕截图。"任选"选项卡已被选中。可使用来自此屏幕截图的信息来分类通过 网络接收和存储的数据存储。在文本框830中输入厂商名称。在文本框832中 输入机器类型。在文本框834中输入该机器类型的型号。在文本框836中输入 训练者的姓名。在文本框838中描述数据存储的使用。
图39是允许选择TDA形状和为该形状选择一组算法的屏幕截图。"目标 数据形状"选项卡804被选中。组合框840允许用户选择目标数据形状以确定 如何紧围该TDE收集数据。在一个实施例中,选择"灰毗邻像素"。在一个 实施例中,选择算法的过程通过选取TDA形状开始。在图39的情形中,选取 的TDA形状是中心像素为该TDE的9像素的正方形(此处称为"灰毗邻像素", 因为所有的其余数据元素都接触该TDE)。接下来,选取一组三个算法。在此 示例中,使用算法2、算法3和算法4 (算法可简单或复杂)来提取将在突触 网络内的训练中使用的数据。应注意在此示例中,突触网络用来训练和处理的是这三个算法的结果的组合,而非单个算法。
在此点处,选择该图像中包含其内容将在训练中使用的图像部分的一个区 域(如图51中所示)。此区域被称为选择区域。有了该选取的选择区域,系
统就使TDA移步到该选择区域上,使TDE在该选择区域中的第一像素处。在 此位置,对该TDA运行选取用于训练的该组三个算法。算法2 (各TDA值的 均值)将TDA中全部像素的值相加并将该总和除以像素数目9,结果得到TDA 的均值。此平均值被输入到突触网络中供其在训练会话中使用,如在突触网络 节中所描述的。算法3 (各TDA值的中值)确定该TDA中全部9个像素的中 间值。此中间值被输入到突触网络中供其在训练会话中使用,如在突触网络节 中所描述的。算法4 (TDA值的展距)确定该TDA中全部9个像素的最低像 素值和最高像素值。其随后从最高值中减去最低值,得到该TDA值的展距。 此展距被输入到突触网络中供其在训练会话中使用,如在突触网络节中所描述 的。在此点,系统使TDA形状移步一个位置,在此TDE现在是下一个具有8 个毗邻像素的像素。对此新TDA运行同一组三个算法并且结果输入到突触网 络中供其使用。系统将每次使TDA移步一个位置并运行该组算法,直到该选 择区域中的全部像素都已成为TDE。以上用于训练的过程类似于标识过程。为 标识使用与训练相同的TDA形状和算法。选取选择区域并且TDA在该选择区 域中移位,并在每个新点都运行该组算法。在此点,这些算法的结果并不被突 触网络用于训练,而是与已知特征进行比较以用于标识。
设计用户可用的算法以分析围绕目标像素的区域的可能特性。某些示例是 诸如相加或值展距等的算术算法,或诸如标准偏差等的统计算法。对于某些 TDA形状,可开发考虑该形状的几何的其他算法。例如,可实现用于2D成像 的算法,当围绕目标像素的特定像素在已知值之上时其将位值设为1,由此创 建反映围绕目标像素的相邻像素的从0到255的数字。算法类型和对于给定范 围的输入值返回的值范围是用户考虑对于给定过程选取哪些算法来选择时的 因素。例如,值的展距和总和几乎在任何应用中都是有用的,而相邻像素算法 可能只在期望高对比度并且已知或期望像素的具体定向的图像处理中有用。在 大多数实施例中,单个算法一般不足以标识特征;使用算法值的组合来学习和 /或标识特征。图40是示出以前选择的数据存储性质的概览的屏幕截图。概述选项卡804 已被选中,表示此屏幕向用户显示他/她的全部设置的概述。该屏幕允许用户通 过按下"完成"按钮或通过选择"后退"按钮编辑他/她的特征来确认他/她的 全部选择。此表中显示的是形态被设为2D成像851。子形态被设为X光852。 记录被选择为真854。图41示出显示图40中向下滚动的表850的屏幕截图。 图41中进一步示出的是选择了 "灰毗邻像素"TDA的目标数据形状860以及 选择了7的算法数目862。
图42示出完成数据存储的创建之后的应用的屏幕截图。作为向导(图 35-41)的结论,向用户显示屏幕900。屏幕900包含本领域公知的菜单栏910、 一组图标914以及査阅多个数据存储的区域912。打上阴影的区域926可显示 用户可用来训练这些数据存储并标识不同特征的一组图片。在区域916中,显 示由用户在该点作出的选择的列表。在一个实施例中,有用于2D成像的一个 数据存储918。 一组己知特征若被定义就存储在己知特征文件夹920中。在924 处显示"灰毗邻像素"TDA。
图43是示出TDA 924的展开的屏幕截图。如图43中所示,TDA 924现 在被展开以示出可联合TDA使用的可能算法。在此应用中,被选择的算法具 有表示它们己被选择的填满框。
图44是示出"创建或编辑已知特征"向导950的屏幕截图。向导950中 是一组选项卡952。"开始"选项卡被选中,表示这是对向导的介绍。此向导 将引导用户通过此应用中的步骤来创建和编辑已知特征,参见区域954。
图45是示出"创建或编辑已知特征"向导的"标识"选项卡952的屏幕 截图。文本框960包含该已知特征的名称。在一个实施例中,用户输入描述该 已知特征的名称;在此示例中输入了 "森林"。组合框962示出用户选择的命 中检测的方法。复选框964允许用户确定在已找到该特定特征的首次出现后该 过程是否应该停止。用户可选择复选框964——如果仅为找出该已知特征的实 例,诸如在食物安全应用中食物样本中的杂质。图46是示出来自图45的组合 框962的展开的屏幕截图。标识方法组合框962包含用于确定特征将被如何标 识的方法。
图47是示出"创建或编辑已知特征"向导的"训练计数"选项卡952的屏幕截图。用户可选择表示已知特征在训练期间必须与突触路径相关联的最少 次数的阈值以满足用户需要。通过增大该阈值,用户可确保在处理中只使用具 有比该阈值更高数目的实例的循环路径,由此给予该特征的最终标识更高级别 的置信度。还可选择极限值并且其包含表示已知特征在训练期间已与该突触路 径相关联的最多次数的值。使用滑动标度970来表示阈值数字,并且使用滑动
标度974来表示极限数字。
图48是示出"创建或编辑已知特征"向导的"群集范围"选项卡952的 屏幕截图。此选项卡允许用户选择系统将在每个维度上离已知特征被标识的 TDE多远寻找该相同已知特征的其他出现。在一个实施例中,维度组合框980 包含两维的X和Y选择。滑动标度982表示维度值,而滑动标度984表示群 集计数。为每个维度指定不同的群集范围允许用户说明数据的特性。例如,如 果图像的垂直标度与水平标度不同,则用户可向该范围输入调整值来得到期望 的群集区域。
图49是示出"创建或编辑已知特征"向导的"动作"选项卡952的屏幕 截图。用户可选择已知特征被标识时要执行的动作。组合框990包含动作列表; 在此应用中,可能的动作是播放系统声音、涂抹像素以及无动作。在一个实施 例中,用户可选择声音以在数字数据中找到该已知特征时提醒用户。用户可选 择涂抹以在选择的数字数据中标识该已知特征被标识的那些区域。
图50是示出"创建或编辑已知特征"向导的"概述"选项卡952的屏幕 截图。在此表中,行IOOO中示出已知特征森林的名称被选择。行1002中示出 检测方法是命中检测。在行1004处,阈值被设为l。行1006中示出极限被设 为2,147,483,647。行1008中示出群集范围被设为X: 0, Y: 0,群集计数1。行 1010中示出检测动作被设为涂抹。行1012中示出数据被设为森林绿色。
图51是示出具有所选区域1028的森林的图像1020的屏幕截图。此屏幕 的布局曾在图42中描述过。屏幕卯0还包含加载到系统1030中的其他图片的 较小"缩略图"。基于光标定位示出鼠标位置和色彩值1022,这在本领域中是 常见的。列出图片1020的各层1026。所选区域1028是用户已设为感兴趣地区 的、并且将在图52-56中作为已知特征森林来训练的部分。
图52是示出"已知特征训练"向导的"开始"选项卡1110的屏幕截图。训练向导将引导用户通过各步骤来训练所选择的已知特征。在此点,用户将调 用以前设立的已知特征并且在一段数字数据上标识该已知特征以训练系统。
图53是示出"已知特征训练"向导的"已知特征"选项卡1110的屏幕截
图。有示出第一数据存储的列表1120。该列表包含已知特征水面1124和已知 特征森林1122。水面和森林两者都设立在"创建或编辑已知特征"向导中。在 此示例中,选择森林1122。如果打开了多个数据存储,则用户可选取训练多个 数据存储中的已知特征。
图54是示出"已知特征训练"向导的"方法"选项卡1110的屏幕截图。 训练方法的四个选项旁有一系列单选按钮区域训练1130、不训练1131、绝 对调整训练1134或相对调整训练1136。在此点,用户选择对于所选形态、子 形态和样本质量最佳的训练方法。
图55是示出"已知特征训练"向导的"概述"选项卡1110的屏幕截图。 该表包含已知特征1140的数目,其在此示例中为1。在此示例中,训练方法为 区域训练,参见行1142。
图56是示出训练结果的屏幕截图。在用户选择图55中的完成按钮后,该 数据存储根据用户的选择被训练。表1210示出结果。所选数据存储为 "SyntelliBasel"(应用指派给数据存储并可由用户修改的默认名称),被训练 的已知特征为森林,并且找到的新数据模式的数目为30,150。找到的新数据路 径的数目为0。找到的已更新数据模式的数目为0。用户可选择不查看结果概 述。
新模式和已更新模式是作为使用以上在图23-33中所示的过程对图51中 的图像的所选区域中的像素值执行以上在图39中选择的算法的结果而生成的。 对于每个像素的诸算法值都被计算出来并作为集合采纳;那些值生成与该网络 中的已知特征相关联的数据模式。在该图像的所选区域内,实际区域可能包含 树木、灌木以及其他植被的分类。所找到的30,150个模式反映了来自这些不同 材料的算法值,并且所有这些模式都与已知特征"森林"相关联。
图57是示出有森林区域和水面区域的图像的屏幕截图。森林由较亮的阴 影区域表示,而水面由较暗的阴影区域表示。图57与图51相关,因为加载了 相同的图片。然而,现在选择了不同的图片1252。图片1252示出选择了森林的区域,所选区域用黑色线条示出。这是用户已定义的区域,在此示例中,作 为已知将成为已知特征"森林"的区域。
图58是示出训练图57中所选区域的结果的屏幕截图。该训练事件添加了 8,273个新数据模式并更新了 2,301个数据路径。
对此图像的训练过程使用图23-33中示出的过程对图57中的图像的所选 区域生成诸模式。以前有2,301个模式与该已知特征相关联,并且这些关联被 更新了。以前有8,273个数据模式未与该已知特征相关联,而这些关联被创建 了。
图59是示出"已知特征处理"向导的"开始"选项卡1310的屏幕截图, 其引导用户通过此应用中的各步骤来处理所选择的已知特征。该向导允许用户 使用以前训练过的巳知特征来处理一段新的数字数据以确定该已知特征是否 存在。
图60是示出"已知特征处理"向导的"已知特征"选项卡1310的屏幕截 图。表1320示出包含训练数据的全部数据存储。在此示例中,行1322中示出 的SyntdliBasel是可用的。用户可检查或不检査该特定数据存储内用户想标识 的任何或全部列出的已知特征。在此示例中,选择了森林。
图61是示出"巳知特征处理"向导的"有效性"选项卡1310的屏幕截图。 用户可任选地忽略有效性处理选项。选项按钮1330允许标识对于具体数据点 已训练过的任何已知特征,而选项按钮1332标识最经常训练的已知特征。在 某些情形中,可在任何给定数据点标识多个已知特征。第一选项允许所有那些 已知特征都被标识。第二选项只允许最经常与给定数据模式相关联的特征被标 识。
图62是示出"已知特征处理"向导的"训练计数"选项卡1310的屏幕截 图。用户可任选地忽略用于处理的训练计数值。示为滑动标度1340的阈值值 是已知特征在将被标识的训练期间必须与突触路径相关联的最少次数。示为滑 动标虔—1342 —的极限值是已知特征在将被标识的训练新间可与突触路径相关联 的最多次数。
图63是示出"已知特征处理"向导的"群集范围"选项卡1310的屏幕截 图。用户可任选地忽略群集范围值。组合框1350允许用户选择特定维度。在两维图像中,组合框1350可包含X维和Y维。在滑动标度1352上选择维度 值。在滑动标度1354上选择群集计数。
图64是示出"已知特征处理"向导的"概述"选项卡1310的屏幕截图。 值包括已知特征的数目1360、阈值超控1362、极限超控1364、有效性超控1366 以及群集范围超控1368。
图65是示出处理结果概述的屏幕截图。处理结果概述示出遭遇已知特征 森林的31,556个模式中有一个或以上发生了 131,656次,并且执行了涂抹一个 或以上像素涂抹森林绿色的已知特征动作。这些数据模式是使用以上对图34 讨论的过程并使用图39中用户选择的算法来生成的。这些算法是,并且必须 是在以上图56和58中用于训练的相同算法。当相同的算法组被执行并且返回 相同的一组值时,就产生与训练中产生的一样的数据模式,并且与该数据模式 相关联的已知特征被标识。在图65的处理中,有131,656个像素被标识为己知 特征"森林",因为产生的31,556个数据模式匹配与该已知特征相关联的数据 模式。用于标识出的已知特征森林的层被添加到该图像中。这进一步在图66 中示出。
图67是示出处理结果的屏幕截图。图像1420包含131,656个应被涂抹为 森林绿色的像素,因为它们在处理中被标识为森林。
图68是示出第二图像的处理的屏幕截图,再次寻找已知特征森林。在该 处理中使用的数据存储1402是SyntelliBasel。使用总共17,999个数据模式, 已知特征森林1404被找到89,818次。已知特征动作1406会将森林涂抹为"森 林绿色"。因为这些图像是黑白的,会被涂抹为森林绿色的像素打印成黑色。
图69是示出有已知特征森林层的图像1430的屏幕截图,该已知特征森林 层显示应用已标识为森林的像素。该图像中森林绿色的实心块示出训练在图57 中所选区域上发生的区域。该区域完全被标识为森林,因为用户选择了该区域 并向应用指示该区域为森林。
图70是示出复合图像的屏幕截图,该复合图像包含原始图像图57和图 69中示出的应用标识出森林的层。
图71是示出有所选水面区域的图像1450的屏幕截图。
图72是示出将图71中的选择训练为已知特征水面的结果的屏幕截图。该选择的训练添加了 l个数据模式。在图71中,在所选区域中的像素是统一的。
当对所选区域中的像素执行以上图34中选择的算法时,单个数据模式就是结果。
图73是示出对于某图像的森林和水面两者已知特征的处理的屏幕截图。 通过选择森林和水面两者(1512),用户要求系统在处理期间标识出这两个特征。
图74是示出用户为处理图71中图像己提供或已选择值的概述的屏幕截 图。在此示例中,行1522中示出所选择的已知特征的数目为2。行1524中示 出阈值超越为0。行1526中示出极限超越为100,000。行1528中示出有效性超 越为使用为TDE训练过的任何已知特征。行1530中示出群集范围超控被设为 X:0, Y:0,群集计数0。
图75是示出图74中处理设置的概述的屏幕截图。在此图像中,行1542 中示出使用的数据存储为SyntelliBasel。行1544中示出使用被训练成森林的 17,999个数据模式,已知特征森林被找到89,818次。行1546中示出已知特征 动作会将标识出的像素涂抹为森林绿色。行1548中示出使用被训练成水面的1 个数据模式,已知特征水面被找到45,467次。行1550中示出已知特征动作会 将标识出的像素涂抹为蓝色。在一个实施例中,系统不会移除以前指定的全部 数据,而实际上是其每次处理时都处理"全部"数据。
图76是示出在该图像中找到的水面层的屏幕截图。图像1570示出找出为 水面并涂抹为蓝色的像素;然而在这些图像中,水面表示为黑条纹。
图77是示出显示原始图像、水面和森林的复合图像的屏幕截图。图像1580 示出水面被标识成蓝色的区域和森林被标识成森林绿色的区域。在此图像中, 示出水面、黑色森林区域和未被标识的白色斑点之间的对比。应注意区域1590 并未被标记为水面。该区域在原始图像76中出现为水面,但处理系统已检测 到指示其不是像该图像的其余部分那样的水面的特性。其很可能是浅水或岸线 区域。
在未示出的一个实施例中,任何显示出来的未被标识的反常(以前被训练 过的特征)都被涂抹以将它们与已训练特征区别开来。
在再一个实施例中,视觉或听觉警报可以是与已知特征相关联的功能。由此,在数据组的分析期间,如果找到以前已知的特征就会触发警报。
图78是根据本发明实施例的方法1700的框图。首先,在框1710处,接
收到物理样本。在示例实施例中,该物理样本是诸如恶性肿瘤等生物样本。该 生物样本可包括组织标本、肿瘤、血清、涂片、链球菌、潜血、黏液、和/或泪
腺液样本。该生物样本是在摄影、成像、或以其他方式感测该样本一方面之前
诸如通过对该生物样本染色等任选地制备的。下一步,在框1712处,对该物 理样本摄影以形成被存储为相应的第一数据组的第一图像。在示例实施例中, 该样本是以原始形式通过1:1分辨率的摄影被捕捉的。在第一数据组中感测可 视样本。可使用其他倍率。也可使用附加的照片、照片的扫描、和/或数字图像, 诸如染色细胞的图像、癌的染色和未染色切片的图像、染色切片的图像、以及 从对象移除后的整个癌的图像。
该样本还用至少一种其他捕捉形态被捕捉。捕捉形态包括MR或NMR成 像、CT成像、X光成像、超声成像、分光学、摄影成像、彩色成像、视频、 谐波数据、移动数据、和/或任何其他成像或数据源。在框1714处,感测该样 本的附加方面以生成第二数据组。下一步,在框1716处,以与关于图23到33 所描述的类似的方式对第一数据组和/或第二组运行第一系列算法生成第一突 触网络。第一系列算法包括关于图23到33描述的算法中的一种或以上种。然 后在框1718处,第一数据组、第二数据组、以及第一突触网络被存储在数据 存储中。
方法1700结果得到一组图像并且支持数据被存储供计算机辅助检测系 统、计算机辅助诊断系统、或护理者和/或提供者辅助系统査阅和处理。可出于 其他目的创建虚拟数据库,诸如用于保持和分析安全数据、金融数据、环境数 据、和/或食物安全数据。
在一个实施例中,虚拟的病理学库启用替换的样本材料。该虚拟的病理学 库保持样本和切片的分辨率照片和/或该样本的切片。该虚拟的病理学库也保持 样本的MR或NMR图像、CT图像、X光图像、超声图像、分光学图像、摄 影图像、气味数据、移动数据、和/或任何其他成像或感测数据形式的替换样本。 其进一步启用该原始病理学材料在其存活、活跃和/或自然状态的视频存储。
在一个实施例中,由类似于染色的过程用图像分析算法来修改样本。原始切片的虚拟样本通过对在图像捕捉时已被显微镜放大的切片的计算机化縮放 被更详细地检査。应用计算机辅助检测以标识或识别出疾病、异常、和/或细胞 结构问题。
在一个实施例中,虚拟"类型l"样本被定义为原始样本的照片,而虚拟 "类型2"样本被定义为其他成像形态或数据。以逐侧、覆盖和/或其他比较方 式实时地将虚拟"类型1"样本与虚拟"类型2"样本进行比较。在一个实施 例中,将虚拟样本链接到与类似的虚拟样本以及其他临床和医疗记录数据相同 的患者供专业人员使用。
图79是根据本发明实施例形成的虚拟病理学库1800的框图。库1800可 存储在诸如图2中描绘的系统100等的系统上。系统100存储虚拟病理学库 1800并且包括有多个输入设备、用于自动装备的附加端口、数据存储介质、以 及显示器的计算机。在一个实施例中, 一个或以上数据存储被存储在数据存储 介质上。该系统可被连接到多个其他计算机、服务器、内联网、或因特网。
库1800包括第一数据存储1802和第二数据存储1804。在一个实施例中, 数据存储1802、 1804是单个更大数据存储的一部分。第一数据存储1802包括 被指定为John Doe的第一人的患者信息1806。在示例实施例中,信息1806包 括传记和医疗历史信息。第一数据存储1802包括肿瘤或其他感兴趣的生物项 目的照片或数字图像1808。第一数据存储1802还包括未染色的切片图像文件 1810。在示例实施例中,图像文件1810是使用从照片1808中描绘的肿瘤获取 的未染色细胞的切片制成的。此外,第一数据存储1802包括从图像文件1810 推导出的一阶未染色细胞分析数据文件1812。该一阶分析数据文件1812是通 过对图像文件1810运行第一系列算法来获得的,其是以与关于以前的附图所 描述的示例类似的方式来生成被存储为一阶分析数据文件1812的突触网络。 在示例实施例中,第一系列算法包括关于之前附图所描述的算法中的至少一 种。
在示例实施例中,第一数据存储1802还包括通过其他成像形态收集的多 个其他图像文件。用与为图像文件1810生成一阶未染色细胞分析数据文件 1812的途径类似的方式为每个图像文件生成一阶分析数据文件。第一数据存储 1802包括超声图像文件1814和相应的一阶超声分析数据文件1816。第一数据存储1802还包括计算机断层扫描(CT)图像文件1818和相应的一阶CT分析 数据文件1820,以及磁共振成像(MRI)图像文件1822和相应的一阶MRI分 析数据文件1824。也使用其他类型的成像数据或使用其他形态获得的数据。
与第一数据存储1802类似地构成第二数据存储1804。第二数据存储1804 包括被指定为Jane Doe的第二人的患者信息文件1826。第二数据存储1804也 包括肿瘤或其他感兴趣的生物项目的图像文件1828,以及未染色的细胞切片图 像文件1830和相应的一阶未染色细胞分析数据文件1832。第二数据存储1804 还包括超声图像文件1834和相应的一阶超声分析数据文件1836,以及CT图 像文件1838和相应的一阶CT分析数据文件1840。此外,第二数据存储1804 还包括MRI图像文件1842和相应的一阶MRI分析数据文件1844。在示例实 施例中,这些图像文件中的每一个都是从图像1828中描绘的肿瘤或其他感兴 趣的生物项目取得的。然而,在其他实施例中,通过各种形态取得的图像文件 可以是其他感兴趣的生物项目的或患者的整个身体的,而非单个感兴趣的生物 项目的。在一些实施例中,第一和第二数据存储1802、 1804还包括诸如来自 病理学、放射学、肿瘤学、以及其他医疗报告的定量数据的附加信息。此外, 在一些实施例中,第一和第二数据存储1802、 1804还包括来自其他数据分析 系统的数据和结果。
除通过对每个数据文件运行第一系列算法生成的一阶分析数据外,也可生 成二阶分析数据。在此示例实施例中,第一个二阶分析数据文件1850是使用 来自 一阶CT分析数据文件1820和一阶MRI分析数据文件1824的数据生成的。 二阶分析数据文件1850是通过使用这两个一阶分析数据文件1820、 1824运行 第二系列算法生成的。以类似的方式,还使用一阶分析数据文件的各种组合生 成第二到第六个二阶分析数据文件1852、 1854、 1856、 1858和1860。
例如,肝癌的CT数据(原材料或图像)被处理并且结果在突触网络、突 触叶和其他数据中。MRI数据(原材料或图像)的分开处理也结果得到突触网 络、突触叶和其他数据。定义新的目标数据区域(TDA)用于分析经处理的 CT数据和MRI数据的一阶分析数据(突触网络)。向该TDA应用新的一组 算法以生成新的突触网络(即二阶分析数据)。
在此示例中,第一到第六个二阶分析数据文件是使用来自单个人的一阶分析数据生成的。然而,二阶分析数据文件也可以是使用来自多个人的一阶分析
数据生成的。例如,第七个二阶分析数据文件1862是通过对来自第一数据存 储1802中的John Doe的数据的一阶未染色细胞分析数据1812以及还对来自 第二数据存储1804中的Jane Doe的文件的一阶未染色细胞分析数据1832运行 一系列算法生成的。
虽然在此示例实施例中,二阶分析数据被显示为是仅从可能呈现为突触网 络或算法值高速缓存的一阶分析数据生成的,但二阶分析数据也可使用可能包 括或不包括一阶分析数据的其他类型的数据的组合来生成。例如,二阶分析数 据可以是使用在病理学库1800内的数据存储1802、 1804之一中记录的特征叶 数据、处理输出覆盖、癌体积信息、癌阶段、T细胞计数、白细胞计数、以及 其他因素(全部未示出)来生成的。处理输出覆盖是用于涂抹原始数据的覆盖 的一些信息。其包括该原始数据(图像)中的位置以及在该位置处标识出的特 征列表。
除一阶分析和二阶分析外,也可使用二阶分析数据或其他类型的数据生成 更高级别的数据。此更高级别的分析数据被称为n阶分析数据。例如,第一个 n阶分析数据文件1864是通过使用二阶分析数据文件1854和二阶分析数据文 件1858运行一系列算法生成的。以类似的方式,还使用二阶分析数据文件的 各种组合生成第二到第四个n阶分析数据文件1866、 1868和1870。除单单使 用来自二阶分析数据文件的数据外,n阶分析还可使用不同类型的信息结合虚 拟病理学库1800内的二阶分析数据文件或其他数据文件来运行。例如,分析 可在John Doe和Jane Doe上关于其性别、年龄群、种族、居住区域、或其他 因素来运行。在示例实施例中, 一阶、二阶、和/或n阶数据用于以类似于关于 图16-22所描述的示例的方式来分析未知样本。在示例实施例中,对未知样本 的分析是使用本地系统来执行的。然而,在其他示例中,该分析是使用通过网 络连接到该本地系统的其他系统来执行的。
以下是二阶数据分析的示例。来自肝癌一阶CT分析数据的结果和有一阶 X光分析数据结果的结果依次可对照其性别、居住区域和肝功能测试数据的一 阶类别数据来处理。这些结果可用于展示具体性别内、世界上具体地区内或国 家内的详细具体肝癌属性。图80是根据本发明实施例形成的系统1900的框图。系统1900包括处理 器1902、与处理器1902进行数据通信的存储器1904、以及与处理器1902进 行数据通信的用户接口 1906。数据存储1908和软件模块1910存储在存储器 1904中。系统1900还包括诸如数码相机等第一成像器1912,以及诸如超声成 像设备等第二成像器1914。第一和第二成像器1912、 1914可使用其他成像和 数据采集形态。此外,在实例实施例中,不存在第一和/或第二成像器1912, 其中图像数据是由另一系统获取的并且结果数据由例如移动介质或通过网络 (未示出)传送给系统1900。
在示例实施例中,软件模块1910被配置成将以前生成的与第一物理样本 的第一方面相关的数据存储在存储器l卯4中并且将以前生成的与第一物理样 本的第二方面相关的数据存储在存储器1904中。软件模块1910还被配置成通 过使用诸如对应于数字照片的图像数据等第一样本第一方面数据和诸如对应 于超声图像的图像数据等第一样本第二方面数据中至少一者运行一系列算法 来生成变换数据。软件模块1910被进一步配置成将经变换的数据存储在数据 存储1908中。在示例实施例中,软件模块1910被配置成通过使用对应于物理 样本的感测方面的数据运行算法来生成一阶、二阶、和/或n阶数据。在示例实 施例中, 一阶、二阶、和/或n阶数据用于以类似于关于图16-22所描述的示例 的方式来分析未知样本。在示例实施例中,对未知样本的分析是使用系统1900 来执行的。然而,在其他示例中,该分析是使用通过网络(未示出)连接到系 统1900的其他系统(未示出)来执行的。
虽然出于简明未示出,但是在示例实施例中,处理器1902包括一系列组 件。在示例实施例中,处理器1902包括被配置成将以前生成的与第一物理样 本的第一方面相关的数据存储在存储器1904中并且将以前生成的与第一物理 样本的第二方面相关的数据存储在存储器1904中的第一组件。处理器1902还 包括被配置成通过使用诸如对应于数字照片的图像数据等第一样本第一方面 数据和诸如对应于超声图像的图像数据等第一样本第二方面数据中至少一者 运行一系列算法来生成变换数据的第二组件。处理器1902包括被配置成将经 变换的数据存储在数据存储1908中的第三组件。在示例实施例中,处理器1902 包括被配置成通过使用对应于物理样本的感测方面的数据运行算法来生成一阶、二阶、和/或n阶数据的第四组件。
在一个实施例中,本发明包括虚拟存储、虚拟样本改变/测试、和/或不同 介质中的原始样本的比较。虚拟样本改变包括化学地改变样本、发光、和/或生 物地改变样本的计算机模拟。不同介质中的原始样本的比较包括将原材料与染 色样本、染色的与发光样本、染色的与发光与原样本、照片与X光样本、禾口/ 或照片与谐波样本进行比较。
在一个实施例中,本发明在医疗护理领域中使用。医疗护理领域包括诊断 支持、进行中的监控、法医学组织分析、以及急性检测。诊断支持包括传统的
X光、实验室面板测试、CT扫描、MR或NMR成像、PET扫描和/或切片和 显微镜分析。急性检测包括检测禽流感、埃博拉、AIDS/HIV、和/或紧急服务 分析。在替换实施例中,本发明用于农业、安全、法律强制、以及防御。
在一个实施例中,样本是从活人或动物、从尸体、或通过计算机模拟取得 的。计算机模拟包括使用决策树并且也是基于对过去样本的学习的。在一个实 施例中,样本包括病原体、总样本、组织标本、血液或其他液体样本、粘膜、 原始化合物或材料、和/或其他次级具体病理学。在其他实施例中,总样本包括 肿瘤、肿瘤的一部分、移除的肺炎样本的一部分、移除的骨骼、和/或异物的外 部样本,而组织标本包括致密组织和/或表皮组织。血液样本包括血管内的、血 管外的和/或来自类似的DNA线的样本。其他液体样本包括口腔液体、泪腺液 体、顶泌液体、外分泌腺液体和/或性别具体液体。原始化合物或材料包括麻醉 品、爆炸品、和/或食物原料,而次级具体病理学包括预先存在的医疗历史输入、 种族数据、性别数据、环境数据、个人习惯、和/或行为问题。在一个实施例中, 数据是使用常规光学、常规光学的数字变换扫描、和/或电子信息作为器械的直 接输出而获取的。器械包括捕捉或测量数字图像、视频、光谱、气味、超声、 机械压力、和/或温度的设备。在替换实施例中,使用手动评估和数据输入。
在一个实施例中,数据聚集源包括使用来自疾病控制中心的已知样本、机 构登记、地区登记、州登记、国家登记、常规肿瘤、和/或组织和血清库和/或 其他已知数据或物理样本储备。在一个实施例中,其他数据聚集源包括尸体、 自学习、和/或农业部门。任何包含各种病毒株和疾病指示信息的政府、公共研 究、或私有数据库可在此系统的实现内使用。尽管例示说明和描述了本发明的优选实施例,但是如以上所提到的,可作 出许多修改而不会脱离本发明的精神和范围。相应地,本发明的范围并不被优 选实施例的公开所限定。而是应代之以完全通过参考所附权利要求来确定本发 明。
权利要求
1. 一种方法,包括接收第一物理样本;感测所述第一样本的第一方面以生成第一样本第一方面数据;在数据存储中存储所述第一样本第一方面数据;感测所述第一样本的第二方面以生成第一样本第二方面数据;在所述数据存储中存储所述第一样本第二方面数据;通过使用所述第一样本第一方面数据和所述第一样本第二方面数据中至少一者运行第一系列算法来生成第一样本变换数据;以及在所述数据存储中存储所述第一样本变换数据。
2. 如权利要求l所述的方法,其特征在于,还包括在接收到物理样本后 制备所述第一物理样本。
3. 如权利要求2所述的方法,其特征在于,制备所述第一物理样本包括 对所述第一物理样本染色。
4. 如权利要求1所述的方法,其特征在于,所述第一物理样本是生物样本。
5. 如权利要求4所述的方法,其特征在于,感测所述第一方面包括捕捉 所述样本的摄影图像。
6. 如权利要求5所述的方法,其特征在于,感测所述第二方面包括捕捉 所述第一样本的超声图像。
7. 如权利要求5所述的方法,其特征在于,感测所述第二方面包括使用 磁共振成像(MRI)捕捉所述第一样本的图像。
8. 如权利要求5所述的方法,其特征在于,还包括接收第二物理样本; 感测所述第二样本的第一方面以生成第二样本第一方面数据; 在数据存储中存储所述第二样本第一方面数据; 感测所述第二样本的第二方面以生成第二样本第二方面数据; 在所述数据存储中存储所述第二样本第二方面数据;通过使用所述第二样本第一方面数据和所述第二样本第二方面数据中至 少一者运行第二系列算法来生成第二样本变换数据;以及在所述数据存储中存储所述第二样本变换数据。
9. 如权利要求8所述的方法,其特征在于,感测所述第二样本的第一方 面包括捕捉所述第二样本的摄影图像。
10. 如权利要求9所述的方法,其特征在于,还包括通过对所述第一样本 变换数据和所述第二样本变换数据运行算法来生成二阶变换数据。
11. 如权利要求8所述的方法,其特征在于,生成第一样本变换数据包括 使用所述第一样本第一方面数据运行第一系列算法来生成第一方面突触网络;以及使用所述第一样本第二方面数据运行第二系列算法来生成第二方面突触 网络,其中所述方法进一步包括通过使用所述第一方面突触网络和所述第二方 面突触网络运行算法来生成二阶变换数据。
12. 如权利要求11所述的方法,其特征在于,还包括使用所述二阶变换 数据生成n阶变换数据。
13. —种系统,包括 处理器;与所述处理器进行数据通信的存储器; 与所述处理器进行数据通信的用户接口;以及用于存储在所述存储器中并可由所述处理器操作的软件模块,所述软件模 块被配置成在所述存储器中存储以前生成的与第一物理样本的第一方面相关的数据;在所述存储器中存储以前生成的与第一物理样本的第二方面相关的数据;通过使用所述第一样本第一方面数据和所述第一样本第二方面数据 中至少一者运行算法来生成第一样本变换数据;以及 在所述存储器中存储所述第一样本变换数据。
14. 如权利要求13所述的系统,其特征在于,所述第一物理样本在与所 述样本的第一和第二方面相关的数据被生成之前已被染色。
15. 如权利要求13所述的系统,其特征在于,所述以前生成的与所述第 一样本的第一方面相关的数据包括摄影图像数据。
16. 如权利要求15所述的系统,其特征在于,所述以前生成的与所述第 一样本的第二方面相关的数据包括超声成像数据和磁共振成像(MRI)数据中 至少一者。
17. 如权利要求15所述的系统,其特征在于,所述软件模块被进一步配置成在所述存储器中存储以前生成的与第二物理样本的第一方面相关的数据; 在所述存储器中存储以前生成的与第二物理样本的第二方面相关的数据; 通过使用所述第二样本第一方面数据和所述第二样本第二方面数据中至 少一者运行算法来生成第二样本变换数据;以及 在所述存储器中存储所述第二样本变换数据。
18. 如权利要求17所述的系统,其特征在于,所述软件模块被进一步配置成通过使用所述第一样本变换数据和所述第二样本变换数据运行算法来生成二阶变换数据;以及在所述存储器中存储所述二阶变换数据。
19. 如权利要求13所述的方法,其特征在于,所述软件模块被配置成通 过使用所述第一样本第一方面数据运行第一系列算法生成第一方面突触网络 并且使用第一样本第二方面数据运行第二系列算法生成第二方面突触网络来 生成第一样本变换数据,其中所述软件模块被进一步配置成通过使用所述第 一方面突触网络和所述第二方面突触网络运行算法来生成二阶变换数据。
20. 如权利要求19所述的方法,其特征在于,所述软件模块被进一步配 置成使用所述二阶变换数据生成n阶变换数据。
全文摘要
用于在虚拟环境中聚集和使用对应于物理样本的数据的系统和方法(图1,框85)。该方法包括接收第一物理样本,感测该第一样本的第一方面以生成第一样本第一方面数据,在数据存储中存储该第一样本第一方面数据,感测该第一样本的第二方面以生成第一样本第二方面数据,在数据存储中存储该第一样本第二方面数据,通过使用第一样本第一方面数据和第一样本第二方面数据中至少一者运行第一系列算法来生成第一样本变换数据,并且在数据存储中存储第一样本变换数据(图1,框86-92)。
文档编号G06F15/18GK101421718SQ200780012016
公开日2009年4月29日 申请日期2007年2月14日 优先权日2006年2月14日
发明者B·G·唐纳德森, N·L·米德尔顿, R·M·小布林森 申请人:智能科学股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1