自动特征分析、比较和异常检测的制作方法

文档序号:8449203阅读:314来源:国知局
自动特征分析、比较和异常检测的制作方法
【专利说明】
[0001] 相关申请的交叉引用
[0002] 本申请要求2012年11月9日递交的美国临时专利申请号为61/724, 813的优先 权,其公开内容通过引用以其整体并入本文。
[0003] 利益声明
[0004] 在政府的支持下根据陆军研宄办公室(ARO)授权的资助W81XWH-09-1-0266做出 了本发明。政府对本发明具有一定的权利。
技术领域
[0005] 本公开内容涉及自动数据分析。更具体地,其涉及用于自动特征分析、比较和异常 检测的系统、设备和方法。
[0006] 附图的简要说明
[0007] 并入本说明书中并构成本说明书的一部分的附图示出了本公开内容的一个或多 个实施例,并与示例性实施例的描述一起,用于解释本公开内容的原理和实现。
[0008] 图1示出了 AGFA的一般工作流程。
[0009] 图2示出了作为聚类的示意性实例的一批几何形状。
[0010] 图3不出了不例性感测和分析设备。
[0011] 图4描述了用于实现本公开内容的实施例的目标硬件的示例性实施例。
[0012] 概述
[0013] 在本公开的第一方面中,描述了计算机实现方法,计算机实现方法包括:提供感测 和分析设备,该感测和分析设备包括配置成检测描述多个物理对象的多个物理特征的多个 传感器;基于多个物理特征,由感测和分析设备产生表示多个对象的多个特征向量,其中多 个特征向量包括描述多个物理特征的多个分量,其中多个分量的每个分量具有一个数值范 围,其中多个物理特征中的每个物理特征由在每个特征向量内的至少一个分量表示;由感 测和分析设备将每个分量的数值范围转换为〇到1之间的范围,其中所述转换是通过以下 公式执行的:
【主权项】
1. 一种计算机实施的方法,包括: 提供感测和分析设备,所述感测和分析设备包括配置成检测描述多个物理对象的多个 物理特征的多个传感器; 通过所述感测和分析设备,基于所述多个物理特征产生表示多个对象的多个特征向 量,其中,所述多个特征向量包括描述所述多个物理特征的多个分量,其中,所述多个分量 的每个分量具有数值范围,其中,所述多个物理特征的每个物理特征由每个特征向量中的 至少一个分量表不; 通过所述感测和分析设备,将每个分量的所述数值范围转换至O和1之间的范围,其 中,所述转换通过以下公式执行
其中,Flij是第i个对象和第j个特征分量的归一化的值,OrigF 是第i个对象的第j 个原特征分量值,MinF#P Max^.是第j个特征分量的最小值和最大值,从而获得第一多个 归一化特征向量,其包括第一多个归一化分量,且还包括所述第一多个归一化特征向量的 每个第一归一化特征向量的每个物理特征的全部数量的分量; 对于所述第一多个特征向量的每个第一归一化特征向量,由所述感测和分析设备将每 个第一归一化特征向量的每个物理特征的所述多个归一化分量除以所述第一归一化特征 向量的每个物理特征的分量的总数,从而获得第二多个归一化特征向量; 由所述感测和分析设备通过以下公式归一化所述第二多个归一化特征向量:
其中,?2^_是所述第二多个归一化特征向量的特征向量的分量,且?3。是第三多个归一 化特征向量的每个特征向量的合成分量; 通过所述感测和分析设备,聚类所述第三多个归一化特征向量,从而获得多个聚类的 归一化特征向量; 通过所述感测和分析设备将主分量分析应用到所述多个聚类的归一化特征向量,从而 获得距离标志值和第一评估的多个归一化特征向量; 通过所述感测和分析设备,基于阈值通过计数所述多个聚类的归一化特征向量的每个 特征向量计算数量标志值,从而获得第二评估的多个归一化特征向量; 通过所述感测和分析设备基于所述第一评估的多个归一化特征向量或所述第二评估 的多个归一化特征向量分析所述多个物理对象。
2. 根据权利要求1所述的计算机实施的方法,其中,所述聚类包括: 通过所述感测和分析设备定义第一参数h和第二参数12,其中,所述第二参数大于所 述第一参数; 通过所述感测和分析设备计算聚类h的聚类中心Cr其中,j是第一计数参数; 通过所述感测和分析设备计算所述第三多个归一化特征向量的每个特征向量和所述 聚类中心Cj之间的距离(!(FSi, Cj),其中,每个特征向量称为F3i,且其中,i是第二计数参 数; 通过所述感测和分析设备基于所述第一参数ti和所述第二参数12分配所述第三多个 归一化特征向量的每个特征向量F3i到所述聚类c j,其中,所述分配包括迭代步骤a) -c): a) 如果所述距离(!(FSi, Cj)小于所述第一参数则所述特征向量F3i被分配到具有 所述聚类中心G的聚类Cj; b) 如果所述距离(!(FSi, CP大于所述第二参数t2,则所述特征向量F3i不被分配到具 有所述聚类中心Cj的所述聚类c」,增加j且所述特征向量F3i被分配到具有所述聚类中心 C j的所述聚类Cj; c) 如果所述距离cKFSpCp大于所述第一参数&,但小于所述第二参数t2,则推后所述 分配; 其中,一旦达到所期望的条件,就停止所述迭代,且聚类每个特征向量F3i,从而获得多 个聚类的归一化特征向量。
3. 根据权利要求1所述的计算机实施的方法,其中,所述聚类采用有序聚类、K均值聚 类或水平集分析聚类。
4. 根据权利要求1-3中任一项所述的计算机实施的方法,其中,所述多个物理特征包 括:颜色;反照率;形状;程度;倾斜度;紧密度;大小;材质;多光谱数据;超光谱数据;光 谱数据;生物污染浓度;化学污染浓度;放射性污染。
5. 根据权利要求1-4中任一项所述的计算机实施的方法,其中,所述分析用于感兴趣 区域的划分或划定;异常检测;自主交通工具控制;或勘探设备的指导。
6. 根据权利要求1-5中任一项所述的计算机实施的方法,其中,所述分析用于地质、采 矿、资源分配、或侦察。
7. 根据权利要求1-3中任一项所述的计算机实施的方法,其中,所述分析用于医学诊 断并且所述多个物理特征包括:患者特定数据;血液检查结果;尿液或粪便检查结果;X射 线、CT、MRI、fMRI、或超声图像;多光谱数据;超光谱数据;脉冲;心率;眼压;颅内压;血压; 肺容积。
8. 根据权利要求1-3中任一项所述的计算机实现的方法,其中,所述分析用于金融市 场并且所述多个物理特征包括数据线上感测的电信号,其中,所述电信号描述了数据,所 述数据包括:股票价值;开盘价;收盘价;整个交易期间的出价;黄金价格;股票指数;交易 量。
9. 根据权利要求1-3中任一项所述的计算机实施的方法,其中,所述分析用于视野,并 且所述多个物理特征包括:盲区周界、圆齿、不可见的测试位置的绝对数量、受损视野的面 积、绝对视觉山体积损失、损失的面积等级、保存的面积等级、损失面积等级的倒数、保存面 积等级的倒数。
10. 根据权利要求1-9中任一项所述的计算机实施的方法,其中,MinFj和MaxF j由用户 定义。
11. 根据权利要求2所述的计算机实施的方法,其中,所述距离是欧几里得距离。
12. 根据权利要求1-11中任一项所述的计算机实施的方法,还包括通过所述感测和分 析设备基于时变分析所述多个物理对象。
【专利摘要】公开了用于自动数据分析的新方法和系统。可自动地分析数据以确定在诸如视野分析和比较的不同应用中的特征。可通过对象的聚类检测在成组的对象之间的异常。
【IPC分类】G06F17-00
【公开号】CN104769578
【申请号】CN201380058287
【发明人】沃尔夫冈·芬克
【申请人】加州理工学院
【公开日】2015年7月8日
【申请日】2013年11月11日
【公告号】EP2917848A2, US9122956, US20150262035, WO2014116340A2, WO2014116340A3
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1