用于处理数据的方法和系统的制作方法

文档序号:8319230阅读:157来源:国知局
用于处理数据的方法和系统的制作方法
【技术领域】
[0001]本发明涉及数据分析,并且更具体地,涉及空间和时间分析。
【背景技术】
[0002]空间和时间分析学允许实体与空间和时间数据关联。一些空间和时间分析学将空间和时间一般化,例如,被称为SpaceTimeBox(STB)的从空间和时间到特征的转换。STB以具体粒度反映空间区域和时间间隔。任何事件(即,在由其时间和地点所指定的时空中的任何点)可以被指派给至少一个STB。当实体与事件关联时,占据相同STB的其他实体可以被定位。可以使用具有STB的实体的相应STB以及这些实体的任何其他特征(比如长度、车牌号、颜色等)来比较它们。空间和时间的单位大小是基于各种条件被设置的可配置参数。在STB的情境中,一个密度可以是例如610米的空间和15分钟。
[0003]存在许多如下情况,在这些情况中,确定两个实体检测(跨不同数据源(也被称为“通道”)被分离或者尽管在时间上分离但来自相同数据源)是否实际上是相同实体将是有利的。当在一些密度之时,STB可以本身被用作用于确定两个观察的实体相同的代理,也存在其中无法应用这一技术的情况。例如,可能难于或者甚至不可能单独地根据STB数据确定是否在出租车背面有各自具有其自己的蜂窝电话的两个人或者是否仅有携带两个蜂窝电话的单个人。类似地,可能有从ATM机前面的空间发射的来自两个蜂窝电话的信号,并且STB的粒度可能不足以说明是否有携带两个蜂窝电话的一个人(即,实体)或者正排队等候的各自具有其自己的蜂窝电话的两个人。因此,存在对用于在此类情形中对实体去歧义(断言相同或者不同)的改进的技术的需要。

【发明内容】

[0004]在本发明的一个实施例中,提供了一种实施和使用用于处理数据的技术的包括计算机程序产品的装置和方法。接收第一时空事件观察。接收第二时空事件观察。接收用于与以下各项中的一项或者多项对应的空间的区域和时间的范围的存在的奇特性指示符:第一时空事件观察和第二时空事件观察。使用存在的奇特性指示符来确定第一时空事件观察和第二时空事件观察是否属于相同实体。
[0005]在附图和以下描述中阐明了本发明的一个或者多个实施例的细节。本发明的其他特征和优势将从描述和附图以及从权利要求变得显然。
【附图说明】
[0006]图1示出了根据一个实施例的用于通过使用存在的奇特性来对实体去歧义的实体分析学系统的示例的示意图。
[0007]图2示出了根据一个实施例的计算节点的示意性示例。
[0008]图3示出了根据一个实施例的用于基于存在的奇特性指示符来对实体去歧义的过程的流程图。
[0009]在各个附图中相似标号指示相似元素。
【具体实施方式】
[0010]在此描述的各种实施例归属于用于在其中空间和时间单独地不足以进行这样的确定的情况中对实体去歧义的改进的技术。一些数据源提供具有高度不精确性(有时数千米的潜在误差)的地理空间坐标。其他数据源能够呈现多个审慎实体(例如,红外图像突出显示视野中的仅一个活的热体实体)。通过组合这些类型的数据流,有可能断言各自具有可能的宽泛误差率的两个观察实际上是一个并且相同。以下更详细地说明用于这样做的各种技术。然而,首先将给出几个示例作为引入并且进一步增强对本发明的各种实施例的基本概念的理解以及说明“存在的奇特性”的概念。
[0011]示例1:你听到喷气发动机的噪音(观察I),你往上看天空并且看到仅一个喷气式飞机(观察2)。出于本能,你自动地调和这两个观察(知道喷气机制造噪音)并且推断出仅存在一个实体,引擎噪音与该实体关联。这种知道在这一空间中的单个实体的概念在此将被称为“存在的奇特性”。注意,即使在视野中存在鸟、风筝、热气球和喷气机,实体的类别的奇特性也仍将告知观察者噪音是由喷气式飞机制造,因为鸟、风筝和热气球并不制造任何这一种类的噪音。
[0012]示例2:在海滩,你向外看海洋并且观察到单个帆船(观察I)。你转移目光了 5分钟,并且然后你转回看海洋。在那时你观察到在稍微不同地点的单个帆船(观察2)。由于存在的奇特性,你本能地断言帆船的这两个观察实际上归属于相同帆船(即,单个实体),即使你并未实际看到帆船移动。这是存在的奇特性的另一示例。
[0013]示例3:三个室友住在一个房子里。你知道他们中的两个离开度假并且仅一个仍然在房子里(观察I)。房子里的某人正在按TV遥控器上的频道变换器(观察2)。此时,存在的奇特性将使人想到正在改变频道的人是第三个(在家的)人,因此频道改变事件可以被断目为第二个人的事务。
[0014]示例4:你接收到具有代表ATM的所在位置的玮度/经度坐标集合的代表ATM刷卡的第一数据记录一(观察I)。你接收到代表由ATM在刷卡时由监控像机拍摄的视频的第二数据记录(观察2)。注意到在刷卡时在视频中仅出现了一个人(存在的奇特性),有理由推断出该ATM事务由在捕获的视频帧中的人(S卩,单个实体)执行。在另一方面,如果没有存在的奇特性(例如,如果在事务时在捕获的视频帧中出现了三个人,并且他们一起徘徊在ATM),则将没有存在的奇特性并且没有对帧中的哪个实体是实体事务的断言。
[0015]所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
[0016]可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一一但不限于一一电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPR0M或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0017]计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括一一但不限于一一电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括一一但不限于一一无线、有线、光缆、RF等等,或者上述的任意合适的组合。
[0018]可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言一诸如Java、Smalltalk、C++等,还包
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1