信息处理装置与信息处理方法

文档序号:6603721阅读:218来源:国知局
专利名称:信息处理装置与信息处理方法
技术领域
本发明涉及信息处理装置与信息处理方法,尤其涉及将元数据分配给目标数据的 技术。
背景技术
数码照相机与数码摄像机的普及极大地增加了用户管理的静止图像与运动图像 的数量。为了管理这么大量的图像数据,使用说明图像的信息,例如拍摄时的事件和拍摄地 点的名称,这种信息被称为元数据。例如,用户输入要查找的图像数据的事件名等,就可以 基于该事件名等查找期望的图像数据。传统上,为了分配这种元数据,已知有如下配置,其中利用从外部源获得的信息来 估计与图像相关的信息(日本专利特开第2005-149511号)。在这种配置中,可从外部源 获得的信息是利用代表拍摄时状态的元数据(例如,拍摄日期和时间或者拍摄位置)标识 的。在外部源提供诸如全国天气服务的系统管理的信息的情况下,元数据将是高精度地确 定的。然而,在例如事先已经分配了拍摄地点名称的图像数据块被收集并用作外部源 时,不是总能高精度地确定元数据。例如,诸如拍摄地点名称的数据可能具有层次。因此, 对相同的拍摄地点可能分配不同的元数据值。此外,不考虑事例数据块相对于估计目标数 据块的分布,而对一般的元数据估计方法不加选择的使用不是总能高精度地确定最优的元 数据。因此,仅仅标识具有代表拍摄时状态的相似元数据的那些数据块是不够的。

发明内容
本发明的一个目的是提供如下一种技术,该技术允许高精度地确定适合的元数 据,而与为估计元数据而事先准备的数据的属性无关。根据本发明的一方面,提供了一种信息处理装置,该信息处理装置包括第一位置 获取单元,适于从目标数据块获取一位置元数据块,该位置元数据块指示位置;第二位置获 取单元,适于从与所述目标数据块不同的多个其它数据块获取多个位置元数据块;目标获 取单元,适于从所述其它数据块获取除所述多个位置元数据块之外的目标元数据块;分析 单元,适于根据由从所述其它数据块获取的多个位置元数据块指示的位置来分析所述目标 元数据块的分布;以及分配单元,适于根据由从所述目标数据块获取的位置元数据块指示 的位置与所述分布,来向所述目标数据块分配具有与该目标数据块相关的值的目标元数据 块,该目标元数据块选自经分析的目标元数据块。根据本发明的另一方面,提供了一种信息处理方法,该信息处理方法包括第一位 置获取步骤,用于从目标数据块获取位置元数据块,该位置元数据块指示位置;第二位置获 取步骤,用于从与所述目标数据块不同的多个其它数据块获取位置元数据块;目标获取步 骤,用于从所述其它数据块获取除所述位置元数据块之外的目标元数据块;分析步骤,用于 根据由从所述其它数据块获取的位置元数据块指示的位置来分析所述目标元数据块的分布;以及分配步骤,用于根据由从所述目标数据块获取的位置元数据块指示的位置与所述 分布,来向所述目标数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元 数据块选自经分析的目标元数据块。 根据以下对示例性实施例的描述(参照附图),本发明的进一步特征将变得显而 易见。


图1例示了计算机设备的示例硬件配置。
图2例示了图像数据的示例配置。
图3例示了构成元数据分配设备的示例模块。
图4是示出事例数据块与估计目标数据块的分布的示例的概念图。
图5例示了保持指示层次结构的信息的表的示例。
图6是示出由元数据分配设备所执行的示例过程的流程图。
图7例示了估计规则表的示例。
图8是示出估计处理中的示例过程的流程图。
图9例示了处理选择表的示例。
图10是示出状态分析处理中的示例过程的流程图。
图11是示出简单估计处理中的示例过程的流程图。
图12是示出重复估计处理中的示例过程的流程图。
图13是示出层次性估计处理中的示例过程的流程图。
图14例示了包含附加特征元数据的估计规则表的示例。
图15例示了构成层次结构构造设备的示例模块。
图16是示出由层次结构构造设备所执行的处理的示例过程的流程图。
图17是示出由群集事例数据块所获得的结果的示例的概念图。
图18例示了群集表的示例。
图19例示了层次结构表的示例。
具体实施例方式下面将参照附图详细描述本发明的示例性实施例。硬件配置将参照图1中的框图来描述根据本实施例的构成服务器设备或客户端设备的计 算机设备的硬件配置。根据需要,服务器设备或者客户端设备各自可以由单个计算机设备 来实现或者由具有分布式功能的多个计算机设备来实现。在一个设备由多个计算机设备配 置的情况下,那些设备连接到诸如局域网(LAN)的网络,从而彼此建立通信。每个计算机设 备可以由诸如个人计算机(PC)或者工作站(WS)的信息处理装置来实现。在图1中,标号101指示用于控制整个计算机设备100的中央处理单元(CPU)。标 号102指示存储不需要任何改变的程序和参数的只读存储器(ROM)。标号103指示临时存 储例如从外部设备提供的程序和数据的随机存取存储器(RAM)。标号104指示用于存储数据的外部存储设备。存储设备的示例包括固定安装到计算机设备100的硬盘以及存储卡。外部存储设备104的其它示例包括诸如可以从计算机设 备100拆除的软盘(FD)和紧凑盘(CD)的光盘,以及诸如磁卡或光学卡、IC卡和存储卡的 存储介质。标号105指示与输入设备109的接口,其中的输入设备109例如是通过用户操作 输入数据的指示设备或键盘。标号106指示与监视器110的接口,其中监视器110用于显 示计算机设备100中保持的数据或者提供的数据。标号107指示通信接口,该通信接口用 于提供到诸如互联网的网络线路111或者到诸如数码照相机112或数码摄像机113的成像 设备的连接。标号108指示用以连接单元101至107从而使得能够进行通信的系统总线。 随后要描述的操作是通过CPU 101执行存储在诸如ROM 102的计算机可读存储介质中的程 序来实现的。图像数据的配置将参照图2来描述根据本实施例的图像数据的配置。在图2中,图像数据200或 者是由数码照相机生成的静止图像,或者是由数码摄像机生成的运动图像。图像数据200 包括元数据201和图像主体数据207。元数据201是说明图像数据200的数据。在本实施例中,元数据201是由拍摄日 期和时间202、拍摄位置203、摄影师信息204、地名205和事件名206构成的,每个元数据块 都具有元数据名称和值。拍摄日期和时间202指示数码照相机捕捉图像的日期和时间或者利用数码摄像 机拍摄的起始日期和时间,而且它可以由成像设备分配。拍摄位置203指示由例如全球定 位系统(GPS)分配的拍摄位置信息。摄影师信息204是关于执行拍摄的人的信息,例如成 像设备的所有者的名字,这可以根据成像设备的设置来分配。地名205和事件名206分别指示拍摄时的地点和事件的名称。它们可以由用户分 配或者利用根据本实施例的元数据分配设备来分配。应当指出,所有那些元数据块不是总 被分配,例如,可能存在只分配拍摄日期和时间202以及拍摄位置203的情况。应当指出,元数据201是以例如Exif、XML或XMP (可扩展元数据平台)格式描述 的。在图2中,尽管地名205和事件名206各自具有单个分配的值,但也可以向它们分配多 个值。可选地,可以向它们分配层次性值。例如,可以分配诸如“东京= >东京塔”的值。在 这里,符号“= > ”代表层次关系。图像主体数据207是图像数据200的主体,它是静止图像或运动图像的像素数据。 应当指出,元数据201可以与图像主体数据207相关联地单独存储,而不是嵌入到图像数据 200 中。元数据分配设备的配置将参照图3来描述根据本实施例的元数据分配设备的配置。图3是例示了元数据 分配设备的功能性配置的框图。事例管理单元301管理先前已经分配了元数据的图像数 据。可选地,它可以只管理元数据201,而不保持图像主体数据207。作为另一种可选,可以 管理等同于元数据信息的信息。例如,可以管理处于具有由用户登录的维度和经度的点的 地名。在下文中,由事例管理单元301管理的多种类型的元数据块称为“事例数据块”。如随 后所描述的,事例数据块用于确定分配给要进行元数据分配的目标的元数据值。应当指出, 在元数据具有多个值或者层次性值的情况下,那些值可以被划分并作为单独的事例数据块(元数据块)来管理。在本实施例中,事例数据块从事例管理单元301读取并获得(第二获 取)。在本实施例中,包括由事例管理单元301管理的事例数据块的图像数据存储在外 部存储设备104中。然而,它还可以存储在例如网络上的计算机设备、数码照相机或者数码 摄像机中,并可以通过通信接口 107获取。而且,图像数据的保存位置不限于此。分配目标获取单元302获取要向其分配元数据的图像数据(下文中称为“估计目 标数据”)。有些可能的元数据块事先已经被分配给了估计目标数据。如随后所描述的,利 用这种事先分配给估计目标数据的元数据并利用事例数据来执行估计,由此来确定要分配 给估计目标数据的元数据(下文中称为“估计目标元数据”)。估计目标数据(图像数据)是由外部存储设备104获取的,其中外部存储设备104 获得由输入设备109指定的图像数据。可选地,估计目标数据可以通过通信接口 107从网 络上的计算机设备或者诸如数码照相机的成像设备获取。作为另一种可选,估计目标数据 可以通过成像设备检测其到通信接口 107的连接来自动地获取。作为又一种可选,在根据 本实施例的元数据分配设备配置成服务器设备的情况下,图像数据可以通过通信接口 107 从客户端设备获取。作为还一种可选,分配目标获取单元302可以只获取对应于图像数据 的元数据201作为估计目标数据,而不获取图像主体数据207 (第一获取)。基于预设事例数据和已经分配给所获取的图像数据的元数据根据估计来确定并 获取要分配给估计目标数据的元数据(估计目标元数据)。然而,估计目标元数据可以由输 入设备109指定,或者可以从记录在外部存储设备104中的预定配置文件读取。可选地,估 计目标元数据可以事先保持。作为另一种可选,在根据本实施例的元数据分配设备配置成 服务器设备的情况下,估计目标元数据可以在客户端设备请求时指定。应当指出,用于获取 图像数据和元数据的方法不限于在此所述的示例。现在,将概述本实施例中所使用的估计方法的基本思想及本说明书中所使用的术 语,然后将返回到对图3的示例的描述。在本实施例中,要分配给由分配目标获取单元302 所获取的估计目标数据的估计目标元数据是利用由事例管理单元301管理的事例数据块 来估计的。在这里,k最近邻鉴别器主要地用作鉴别手段。现在将描述这种k最近邻鉴别器。k最近邻鉴别器是一种用于从包括特征向量与标签的集合的训练数据中为不具有 标签的测试数据确定标签的手段。具体而言,从给定的训练数据块中选择与测试数据具有 类似特征向量的k个训练数据块,所选训练数据块中最公用的标签被确定为测试数据的标 签。特征向量之间的相似性可以利用例如向量之间的欧几里得距离来确定。应当指出,根据本实施例的鉴别手段不限于k最近邻鉴别器。例如,可以使用诸如 支持向量机(SVM)的其它鉴别手段。在使用需要先前学习的鉴别手段的情况下,先前学习 可以利用事例管理单元301中的图像数据(事例数据)来执行。为了将这种鉴别手段应用到对元数据的估计中,k最近邻鉴别器中所使用的训练 数据、测试数据、标签和特征向量需要与本实施例中所使用的数据相关联。训练数据可以与 一个事例数据块集合(下文中称为“估计事例数据集”)相关联,测试数据可以与估计目标 数据相关联,而标签可以与估计目标元数据相关联。特征向量需要与估计目标元数据的属 性相对应地配置。例如,在估计“地名”的情况下,可以利用拍摄位置作为特征向量来估计地名。这种用作特征向量的元数据在下文中称为“特征元数据”。返回参照对图3的描述。状态分析单元303在导出要分配给估计目标数据的估计 目标元数据中分析“状态”。在本实施例中,有四种状态,即“层次性的”、“未登录的”、“混合 的”和“确定的”。现在将顺序描述那些状态。有些元数据块具有层次。一个示例是“地名”。例如,地名“东京”在目录“日本” 之下。对于这种层次性的元数据块,仅仅简单应用k最近邻鉴别器是不够的。这是因为不 同的元数据值可以分配给相同的地点。例如,存在这样的情况,即来自国外的游客将“日本” 作为地名分配给他们在观光过程中所捕捉到的图像数据。同时,还存在这样的情况,即日本 人将“东京”作为地名分配给他们在东京观光过程中所捕捉到的图像数据。如由这两种情 况所例示的,依赖于数据在其层次中被看作是什么级别,不同的元数据值可以作为地名分 配给相同的拍摄位置。在这种情况下,需要考虑数据层次来执行估计。接下来,为了解释其它状态,即“未登录的”、“混合的”和“确定的”,参照图4例示 “地名”用作估计目标元数据而“拍摄位置”用作特征元数据的情况。图4例示了如下示例, 其中分别利用其拍摄位置的维度和经度作为垂直轴和水平轴,绘制事例数据块与估计目标 数据块使得它们的分布可视化。在图4中,大写的字母表字母A和B分别代表指示地名A和B的事例数据块。在 这里,字母表字母(A,B)对应于标签,而它们的拍摄位置(垂直轴和水平轴上的坐标)对应 于作为特征向量的特征元数据块。图4中小写的希腊字母α、β和γ代表由分配目标获 取单元302获取的图像数据块(估计目标数据块),而图4中α、β和γ的位置对应于它 们的拍摄位置。参考估计目标数据块α周围的四个事例数据块,发现估计目标数据块α 周围只有事例数据块Α。在这种状态下,通过k最近邻鉴别器,将值明确地确定为“Α”。因 此,这种状态被确定为是“确定的”状态。同时,参考估计目标数据块β周围的四个事例数据块,事例数据块A和B在估计 目标数据块β周围是混合的。因为事例数据块A和B的这种混合,所以这种状态被称为 “混合的”。还参考估计目标数据块Y周围的四个事例数据块,发现每个事例数据块都远离 估计目标数据块Y。在这种情况下,可以认为还没有获取要作为事例数据分配给估计目标 数据块Y的值。因此,这种状态被确定为“未登录的”。应当指出,随后将参照图10中的流 程图来描述这种分布确定方法的具体内容。选择性估计单元304基于由状态分析单元303获得的“状态”选择简单估计单元 305、重复估计单元306和层次性估计单元307中的任何一个,并使所选的单元执行估计。然 后,从这些估计单元305至307中的一个获取估计结果(包括“不可估计的”结果)。例如, 在只有“混合”状态的情况下,选择重复估计单元306。随后将参照图8中的流程图来描述 处理的具体内容。简单估计单元305通过简单地将k最近邻鉴别器应用到估计目标数据(测试数 据)的特征元数据(特征向量)和事例数据(训练数据)的特征元数据来获得结果。随后 将参照图11中的流程图来描述该处理的具体内容。然而,在“混合”状态的情况下,简单估计单元305不是总能选择出合适的元数据。 “混合”状态出现的可能情况将以导出地名的情况作为示例来描述。例如,当事件是在公园 或会议厅发生时,常常提供特定的建筑场所。具体而言,存在这样的情况,即一天在一个场所举行商用车展,而另一天在同一场所举行游艇展。在此类情况下,如果该场所的展台名称 用作地名,则用户将向每天相同的拍摄位置分配不同的地名,作为拍摄地点的名称。在这种 情况下,例如,需要不仅考虑拍摄位置,还要考虑拍摄日期和时间,以鉴别数据。在这种“混 合”状态下,重复估计单元306确定要考虑的新元数据并执行估计。在导出估计目标元数据的过程中,重复估计单元306检测要考虑的新元数据,并 在把要考虑的新元数据添加到特征元数据之后执行估计。例如,在“地名”用作估计目标元 数据的情况下,在上述展厅的示例中,“拍摄时间”作为要考虑的新元数据被检测。然后,利 用“拍摄位置”和“拍摄时间”作为特征元数据来估计“地名”。随后将参照图12中的流程 图来描述该处理的具体内容。层次性估计单元307考虑估计目标元数据的层次来执行估计。在本实施例中,元 数据分配设备保持用于每个估计目标元数据块的层次结构,并从较高的级别确定估计目标 元数据块。图5例示了示出保持在元数据分配设备中的元数据块的层次结构的表的示例。 在图5中,值之间的层次结构是由父元数据和子元数据的集合来指示的。如果最高级别标 志为“开(ON) ”,则指示父元数据没有更高级别的父元数据。利用这个,确定最高级别的元 数据,然后确定其子元数据。随后将参照图13中的流程图来描述该处理的具体内容。
分配目标写单元308将由选择性估计单元304所导出的元数据嵌入到作为估计目 标数据获取的图像数据的元数据中,并输出所得数据。数据输出目的地的示例包括外部存 储设备104,及通过通信接口 107连接的成像设备和客户端设备。应当指出,在分配目标获 取单元302只获取元数据的情况下,与所导出的元数据相关联的图像数据的元数据可以被 重写。应当指出,用于输出图像数据和元数据的手段不限于此。元数据分配处理接下来,将参照图6中的流程图来描述根据本实施例的由元数据分配设备执行的 处理。在S601中,分配目标获取单元302获取(已经对其分配了元数据的)图像数据。这 种图像数据被假定为估计目标数据。在S602中,分配目标获取单元302根据已经分配给图像数据的元数据的种类来 识别可估计的元数据的种类,并将它们组织到要从估计导出的元数据块(估计目标元数据 块)的列表中。可以根据估计目标元数据与在对估计目标元数据进行估计的过程中必需 的特征元数据(下文中称为“必需特征元数据”)之间的对应关系,来识别估计目标元数据 (的种类),其中的对应关系是事先确定并保持的。具体而言,这种对应关系可以保持在如图7所例示的估计规则表中。图7例示了 估计规则表的示例,该估计规则表示出了估计目标元数据701和估计目标数据的在对估计 目标元数据进行估计的过程中必需的特征元数据(必需特征元数据702)之间的对应关系。 例如,为了估计事件名,拍摄日期和时间及拍摄位置需要事先分配给估计目标数据。因此,例如,在只向估计目标数据分配了“拍摄位置”的情况下,可以利用图7中的 估计规则表估计“地名”,因此在S602中列出“地名”。应当指出,可以从列表中排除其值已 经分配给图像数据的元数据,即使根据上述方法其被认为是可估计的。在S603中,确定在S602所创建的列表中是否有任何未处理的估计目标元数据块。 由于在后述步骤S604和S605中已经处理过的估计目标元数据块从初始列表中删除了,因 此如果列表为空,则确定没有未处理的估计目标元数据。可选地,在列表中可以提供处理标志,且可以依赖于是否有任何估计目标元数据的处理标志仍为“关(OFF)”来作出确定。如 果有任何未处理的估计目标元数据块(S603中为“是”),则处理前进到S604。如果没有未 处理的估计目标元数据块(S603中为“否”),则处理前进到S606。在S604中,从列表中选择未处理的估计目标元数据块(或类型),且对估计目标数 据的用于估计的特征元数据和估计事例数据集进行初始化。例如,用于估计的特征元数据 被假定为是与图7中的估计规则表中的估计目标元数据相关联的必需特征元数据。然后, 事例管理单元301中的包括特征元数据和估计目标元数据的事例数据块被假定为估计事 例数据集。在S605中,执行从估计导出估计目标元数据的估计处理。随后将参照图8的流程 图来描述该处理的具体内容。然后,处理返回S603。以这种方式,对每个估计目标元数据块 执行S604和S605的处理。当所有的估计目标元数据块都处理完之后(S603中为“否”), 处理前进到S606。在S606中,分配目标写单元308将从S605中的估计获得的元数据分配给图像数 据。然而,导致“不可估计”的估计目标元数据块不分配给图像数据。应当指出,尽管图6中 的流程图示出了分配目标获取单元302获取并处理单个图像数据块的情况,但也可以获取 并处理多个图像数据块。在获取多个图像数据块的情况下,将从S602到S606的处理应用 到每个图像数据块。估计处理参照图8中的流程图来描述S605中的估计处理。图8是示出估计处理中具体过程 的流程图。在确定估计目标元数据块的值的过程中,要执行什么样的估计处理是依赖于估 计目标元数据块的特征和用于鉴别的事例数据集(估计事例数据集)而变化的。因此,确 定用于导出估计目标元数据的状态,即,估计目标数据的特征元数据和事例数据中所包括 的特征元数据之间的关系。在本实施例中,假定了四种状态,即,“层次性的”、“未登录的”、 “混合的”和“确定的”。在S801中,列出那些状态,从而创建状态列表。随后将参照图10中 的流程图来描述该处理的具体内容。在S802至S805中,从处理选择表中选择对应于S801中所获得的状态的估计处理 并执行该估计处理。处理选择表如图9中所例示。处理选择表包含处理选择规则,每个规 则都以“ID”901、“优先级”902、“状态”903、“处理”904和“无效标志”905的集合表示。利 用这个表,为每种状态选择合适的处理选择规则,并执行与“处理” 904相关联的估计处理。 具体的选择方法按照S802至S805所描述。“处理”904的具体内容随后将单独描述。在S802中,列出了其状态903与在S801中所获得的任何状态匹配且其无效标志 905为“关(OFF)”的处理选择规则。该列出可以通过例如将ID 901保持在诸如RAM 103 的存储设备中来进行。例如,在处理选择表如图9所例示的那样且S801中所获得的状态列 表包括“层次性”和“未登录”的情况下,列出ID号为“ 1 ”和“2”的处理选择规则。在S803中,从S802中所获得的列表中选择具有最高优先级的处理选择规则。然 后,将所选处理选择规则的无效标志设置成“开(ON)”。应当指出,在本实施例中,优先级值 902越高意味着优先级越高。例如,在ID号为“1”和“2”的处理选择规则包括在列表中的 情况下,从列表中选择其中具有最高优先级的处理选择规则,即,最高优先级值为4、ID号 为“1”的规则。然后,将ID号为“1”的处理选择规则的无效标志设置成“开(ON) ”。
在S804中,通过执行与S803中所选的处理选择规则相关联的估计处理来获得结 果。例如,如果在S803中选择了 ID号为“1”的处理选择规则,则获得“不可估计”的结果。 如果在S803中选择了 ID号为“2”的处理选择规则,则通过执行层次性估计处理来获得结 果。估计处理的细节将随后描述。在S805中,将S803中所选的处理选择规则的无效标志设置成“关(OFF) ”。这完 成了估计处理,且处理返回到图6中的S603。应当指出,从S802至S805的处理是由选择性 估计单元304执行的。状态列表创建处理接下来,将参照图10中的流程图来描述在图8的S801中所执行的状态列表创建 处理。首先,在SlOOl中准备空状态列表。例如,准备可变长度阵列,用以存储与状态相关 联的值。在S1002中,确定估计目标元数据块是否具有层次。例如,指示层次的存在或缺 少的信息(层次信息)可以存储在以上提到的图7的估计规则表中,而且可以在进行确定 的时候参考。如果估计目标元数据块被确定为有层次(S1002中为“是”),则处理前进到 S1003。如果估计目标元数据块被确定为没有层次(S1002中为“否”),则处理前进到S1004。在S1003中,将“层次性的”添加到状态列表。然后,处理前进到S1004。在S1004 中,收集估计事例数据集中从最靠近估计目标数据块的特征向量的特征向量起依次的预定 个数(k个)特征向量作为事例数据块。然后,将从估计目标数据块的特征向量到所收集的 事例数据块中最远一个的距离给定为L(最大距离值L)。应当指出,特征元数据块之间的 距离可以假定为作为特征向量的特征元数据块之间的欧几里得距离。例如,在使用“拍摄位 置”作为特征元数据块的情况下,特征元数据块之间的距离可以利用那些元数据块的拍摄 位置的维度和经度来计算。在S1005中,确定在S1004中所获得的距离L是否等于或者大于预定的阈值。如 果距离L等于或者大于阈值,则意味着估计事例数据集不包括要分配给估计目标数据块的 估计目标元数据值的值。如果距离L等于或者大于阈值(S1005中为“是”),则处理前进到 S1006.如果距离L小于阈值(S1005中为“否”),则处理前进到S1007。在S1006中,将“未登录的”添加到状态列表。这完成了状态列表创建处理,且处 理前进到图8中的S802。同时,在S1007中,确定在S1004中所获得的k个事例数据块的估 计目标元数据块是否具有基本上相同的值。例如,这可以依赖于是否有百分之九十或者更 多的事例数据块具有相同的值来确定(如果是这样,则确定它们“基本上相同”)。这确定 是否确定了要分配给估计目标数据块的估计目标元数据块的值。然后,如果确定k个事例 数据块的估计目标元数据块的值基本上相同(S1007中为“是”),则处理前进到S1008。如 果不是(S1007中为“否”),则处理前进到S1009。在S1008中,将“确定的”添加到状态列表。这完成了状态列表创建处理,且处理 前进到图8中的S802。同时,在S1009中,将“混合的”添加到状态列表。这完成了状态列 表创建处理,且处理前进到图8中的S802。以上所述的从S1001至S1009的处理是由状态分析单元303执行的。应当指出,从 S1004至S1008的处理不限于上述手段。例如,还可以假定鉴别器不仅返回鉴别结果,还返 回指示训练数据不包括要鉴别的结果的结果,或者将鉴别结果及其置信因数一起返回。在这个时候,由鉴别器获得的结果可以在S1005或S1007的确定处理中使用。如上所述,要使用的估计方法是通过分析距离L是否等于或者大于分布中的 阈值并在状态列表中设置不同的值来确定的,这有效地防止在实际上难以估计的情况 下以低精度执行估计。而且,在本实施例中,从已经分配的元数据值中具有较小向量间 (intervector)距离的那些起按顺序选择相同类型的k个估计元数据块,然后分析预定比 率或者更多的另一种类型的对应估计元数据块是否具有相同的值。然后,如后面将描述的, 基于分析结果确定估计方法。这允许在元数据值被确定性地估计和这种估计不可行的情况 下都选择合适的估计方法,由此允许对合适元数据值的高精度估计。简单估计处理接下来,将参照图11、12和13中的流程图来描述由简单估计单元305、重复估计单 元306和层次性估计单元307执行的处理。首先,将参照图11的流程图来描述根据本实施 例的由简单估计单元305执行的处理。这个处理对应于在图9的处理选择表中关于ID为 “4”的处理选择规则所描述的简单估计处理。在SllOl中,确定估计事例数据集是否包含事例数据块。例如,确定估计事例数据 集是否包含个数等于或者大于阈值的事例数据块。如果确定存在事例数据块(S1101中为 “是”),则处理前进到S1103。如果不存在(S1101中为“否”),则处理前进到S1102。在S1102中,获得“不可估计”的估计结果,且简单估计处理完成。同时,在S1103 中,计算估计目标数据块的特征元数据块与事例数据块的特征元数据块之间的距离,且从 最靠近估计目标数据块的特征元数据块的事例数据块起依次列出k个事例数据块。然后, 在S1104中,将在S1103中所列出的事例数据块的估计目标元数据块的最公用值确定为估 计结果。然后,简单估计处理完成。重复估计处理接下来,将参照图12中的流程图来描述根据本实施例的由重复估计单元306执行 的处理。这个处理对应于在图9的处理选择表中关于ID为“3”的处理选择规则所描述的
重复估计处理。首先,在S1201中创建附加特征元数据列表。附加特征元数据块是指辅助地与最 低限度必需特征元数据块一起使用以便更适当地执行估计的特征元数据块,而附加特征元 数据列表是指这种附加特征元数据块的列表。在本实施例中,以上提到的估计规则表存储 与估计目标元数据块相关联的候选附加特征元数据块,且这种估计规则表在创建附加特征 元数据列表的过程中被参考。图14例示了估计规则表的示例,其中附加特征元数据块与估 计目标元数据块相关联。例如,在估计规则表如图14所例示的那样配置且“地名”用作估 计目标元数据块1401的情况下,“拍摄日期和时间”与“摄影师信息”在附加特征元数据块 1402的列表中列出。可选地,考虑数据组合,“拍摄日期和时间”、“摄影师信息”和“拍摄日 期和时间与摄影师信息”可以单独列出。最后一个组合即“拍摄日期和时间与摄影师信息” 指示“拍摄日期和时间,,与“摄影师信息”都用作附加特征元数据块。应当指出,用于创建 附加特征元数据列表的方法不限于此,而且例如,可以列出已经固有地分配给特征元数据 块但没有使用的所有元数据块。在S1202中,确定在S1201中所获得的附加特征元数据列表中是否有未处理的附 加特征元数据块。由于在后述步骤中处理过的附加特征元数据块将从初始列表中删除,因此如果列表为空,则确定没有未处理的附加特征元数据块。可选地,在列表中可以提供处 理标志,且可以依赖于是否仍有处理标志保持为“关”的附加特征元数据块来作出确定。如 果存在未处理的附加特征元数据块(S1202中为“是”),则处理前进到S1203。如果不存在 (S1202中为“否”),则处理前进到S1207。在S1203中,从附加特征元数据列表中选择未处理的附加特征元数据块,并将其 添加到要用于估计的特征元数据块。然后,估计事例数据集缩小到包括更新过的特征元数 据块的那些事例数据块。在S1204中,通过状态分析处理来创建状态列表。这个处理类似于以上提到的图 10的流程图中的处理(状态列表创建处理)。应当指出,在将摄影师信息添加到特征元数据 的情况下,可以构想S1004中的估计目标元数据块与事例数据块之间的距离将采取随捕捉 那些数据块的用户之间的人际关系中距离的增加而增大的值,例如按“自己”、“家庭成员”、 “朋友”和“熟人”的次序。在S1205中,确定“确定的”是否包括在状态列表中。这确定估计是否已通过考虑 S1203中所添加的附加特征元数据块确定了。如果“确定的”包括在状态列表中(S1205中 为“是”),则处理前进到S1207。如果不是(S1205中为“否”),则处理前进到S1206。在S1206中,将特征元数据块和估计事例数据集恢复到其原始状况。例如,关于特 征元数据块和估计事例数据集的信息可以在处理开始时事先保持,并用于重写。然后,处理 返回S1202。在S1207中,通过利用特征元数据块以及附加特征元数据块的简单估计处理获得 结果。简单估计处理的内容如图11的上述流程图中的那样。在S1208中,将特征元数据块和估计事例数据集恢复到其原始状况。例如,关于特 征元数据块和估计事例数据集的信息可以在处理开始时事先保持,并用于重写。这完成了 重复估计处理。层次性估计处理接下来,将参照图13的流程图来描述根据本实施例的由层次性估计单元307执行 的处理。这个处理对应于在图9的处理选择表中关于ID为“2”的处理选择规则所描述的 层次性估计处理。在S1301中,从用于估计的特征元数据块中列出在其层次中处于最高级别的特征 元数据块。在本实施例中,由于层次结构事先保持在表中(图5),因此参考该表以列出其最 高级别标志为“开”的父元数据块。在S1302中,确定S1301或S1305中所创建的列表是否为空。空列表指示处理已 经完成。如果列表为空(S1302中为“是”),则处理前进到S1306。如果列表不为空(S1302 中为“否”),则处理前进到S1303。在S1303中,估计事例数据集缩小到属于S1301或S1305中所创建的列表中所包 括的层次的事例数据块。例如,考虑当“地名”用作估计目标元数据块的情况,“日本”和“美 国”都包括在处于其层次中最高级别的元数据块的列表中。在这个时候,当前的估计事例数 据集缩小到其“地名”为“日本”或“美国”的事例数据块,这构成新的估计事例数据集。在S1304中,利用S1303中所获得的估计事例数据集执行估计处理。这种估计处 理对应于图8的上述流程图中的处理。在执行这种估计处理时,图9的处理选择表中的ID号为“2”的处理选择规则的无效标志是“开”。因此,将不选择层次性估计处理。此外,即使 诸如“层次性的”和“混合的”状态包括在S1303中所获得的估计事例数据集中,也按照图8 的流程图选择合适的估计处理(S803),并获得合适的结果(S804)。在S1305中,存储在S1304中所获得的结果。然后,列出层次中下一级别的数据块。 之后,处理返回到S1302。具体而言,从图5中列出其父元数据块与以上结果具有相同值的 子元数据块。例如,如果结果是“日本”,则“东京”和“京都”作为子元数据块列出。在S1306中,在S1305中存储的结果作为这种层次性估计处理的结果给出。然而, 如果没有存储结果,则“不可估计”作为结果给出。然后,层次性估计处理完成。如上所述,在本实施例中,根据和与估计目标数据块的已分配元数据块相同类型 的估计元数据块相对应的其它类型的估计元数据块的值的分布,来确定用于估计要重新分 配的元数据块的估计方法,然后执行估计。即,要重新分配的元数据块是利用对应于数据分 布的最佳估计方法来确定的,这允许高精度地确定适合的元数据块,而不考虑事先为元数 据块估计所准备的数据块的属性。而且,在本实施例中,事先存储对应关系信息(估计规则表),其指示已分配的元 数据块的种类与其值可以从已分配的元数据块的值估计的元数据块的种类之间的对应关 系。然后,参考这种对应关系信息,以指定与目标数据块的已分配的元数据块的种类相对应 的元数据块的种类,作为要重新分配给目标数据块的元数据块的种类。这允许通过简单处 理从事先为元数据估计所准备的数据指定估计所需的数据。应当指出,在本实施例中,为元数据的估计假定了四种状态。然后,已经描述了根 据状态来选择元数据估计方法的元数据分配设备。然而,意在配置本实施例的状态不限于 此。例如,还有其它可能的状态,例如“多值的”,其中假设元数据有多个值。具体而言,有些 地名可以有别名,例如Everest (珠穆朗玛峰)有别名Chomolungma。在这种情况下,上述估 计处理是不够的,且需要另一种使得能够分配多个值的估计方法。例如,以下处理与处理选 择表中优先级值为“3. 5”且状态为“混合的”的情况相关联。这个处理使得事先存储将相 同值与多个元数据块相关联的表,并准备其中用单个值替代被认为具有相同值的元数据块 的估计事例数据集。然后,调用图8的流程图中的估计处理,并且在获得结果以后,根据所 述表用多个元数据值替代以上被替代的内容。由于用于指定状态的方法和用于选择状态的 方法是根据假定的状态配置的,因此它们不限于本实施例中所述的示例。而且,对应于在此 所述的状态的估计方法不限于以上所述的示例。本实施例的以上描述已经给出了事先给出用于层次性估计处理的层次结构的情 况。在本实施例中,以下描述了一种配置(层次结构构造设备),其中层次结构是根据事例 数据块的分布自动构造的。根据这种实施例的配置,四种状态,即“层次性的”、“未登录的”、 “混合的”和“确定的”,是仅仅基于事例数据块的分布来识别的。在本实施例中,执行群集,以便群集和与目标元数据块(为该目标元数据块确定 了层次的存在或缺少)相同种类的特征元数据块相对应的其它种类的特征元数据值的分 布。然后,分析群集之间的包含关系。据此确定目标元数据块的层次。这允许通过简单处 理自动确定元数据的层次。如上所述,诸如“地名”的有些元数据块具有层次。例如,在商用车展的情况下,“客 车区”和“双轮车区”可以在目录“展厅”之下。在这种层次性数据的情况下,其“地名”为“展厅”或者“客车区”的事例数据块是基于其拍摄位置绘制的。所得的事例数据块的分布 常常使得“客车区”包括在“展厅”中。为了从事例数据块获取层次结构,本实施例使用这 种数据属性。层次结构构造设备的配置图15例示了根据本实施例的层次结构构造设备的配置。在图15中,事例管理单 元301与本实施例中以上所述的图3中的事例管理单元301相同。层次性元数据确定单元1501确定从事例数据块为其构造层次结构的元数据块 (下文中称为“层次性元数据块”),以及用于检测层次结构的元数据块(下文中称为“特征 元数据块”)。层次性元数据块和特征元数据块可以由输入设备109指定,或者可以从记录 在外部存储设备104上的预定配置文件读取。然而,用于确定层次性元数据块和特征元数 据块的方法不限于此。事例数据划分单元1502执行如下处理,即单独处理由事例管理单元301管理的事 例数据块中的那些具有相同层次性元数据值但具有不同意义的事例数据块。这是为了以下 目的。例如,在商用车展的情况下,假定在“客车区”或“双轮车区”的目录下还存在参展公 司的展台。在这个时候,即使两个给定事例数据块的地名都是“公司A的展台”,但它们中的 一个可能在目录“客车区”之下,而另一个可能在目录“双轮车区”之下。因此,执行用于单 独处理这种具有相同的层次性元数据值但具有不同意义的数据块的处理。这产生一组具有 相同意义的事例数据块。随后将参照图16中的流程图来描述该处理的具体内容。包含关系确定单元1503获得由事例数据划分单元1502所获得的事例数据集之间 的包含关系。层次结构构造单元1504根据在包含关系确定单元1503中所获得的包含关系 构造层次结构。随后将参照图16中的流程图来描述由那些功能部件执行的处理的具体内 容。层次结构构造处理将参照图16中的流程图来描述根据本实施例的由层次结构构造设备执行的处 理。首先,在S1601中,层次性元数据确定单元1501确定要为其构造层次结构的层次性元 数据块和用于确定层次结构的特征元数据块。在S1602中,创建层次性元数据块的值的列表。具体而言,由事例管理单元301管 理的事例数据块的所有层次性元数据块的值都列出来,然后从中排除重复的,其结果作为 列表获得。在S1603中,确定在S1602中所获得的列表中是否包括未处理的值。由于在随后 所述的步骤S1604至S1606中已经处理过的值从初始列表中删除了,因此如果列表为空,则 确定没有未处理的值。可选地,在列表中可以提供处理标志,且可以依赖于是否还有处理 标志保持为“关”(这意味着“未处理”)的值来作出确定。如果存在未处理的值(S1603中 为“是”),则处理前进到S1604。如果不存在未处理的值(S1603中为“否”),则处理前进到 S1607。在S1604中,从S1602中所获得的列表中选择值。然后,从由事例管理单元301管 理的事例数据块(层次性元数据块)中指定具有所选值的事例数据块。在S1605中,对S1604中所指定的一组事例数据块应用群集。群集是为以下目的 执行的。有些事例数据块可以是不同种类的,即使它们具有相同的元数据值。例如,在商用车展的情况下,假定在“客车区”和“双轮车区”的目录下还存在参展公司的展台。在这个时 候,即使两个给定事例数据块的地名都是“公司A的展台”,但它们中的一个可能是目录“客 车区”之下的公司A的展台,而另一个可能是目录“双轮车区”之下的公司A的展台。在这 种情况下,那些公司A的展台是不同的展台。群集是为分离这种属于层次中不同上级数据 块的事例数据块而执行的。群集是利用基于特征元数据块的相似性执行的,而且结果是从 层次性群集获得的。可选地,通过连接靠近所关注事例数据块的k个事例数据块而获得的 连接部分可以组织到单个群集中。根据本实施例的群集方法不限于此。而且,群集结果不 总是通过划分事例数据块来获得,而且所有数据块都可以组织到单个群集中。在S1606中,存储在S1605中所获得的群集结果。具体而言,将“元数据值”和“群 集ID”彼此关联地存储。而且,将“群集ID”和“事例数据ID”彼此关联地存储。在此所述 的元数据值是指在S1604中所选的值。在此所使用的术语“群集ID”是指为了识别S1605 中所获得的群集而分配的标识符。在此所述的术语“事例数据ID”是指用于与由事例管理 单元301管理的事例数据块关联的标识符。示出了群集与群集ID之间的对应关系的表被 称为群集表。示出了事例数据块与事例数据ID之间的对应关系的表也被称为群集配置表。 那些表在后续处理及随后所述的层次性估计处理中使用。应当指出,从S1602至S1606的 处理是由事例数据划分单元1502执行的。在所描述的示例处理中,重复从S1603至S1606的处理,直到列表为空。例如,假 定事例数据块如图17中所例示的那样基于给定的特征元数据分布。图17中的大写字母表 字母代表事例数据块,而层次性元数据块的值可以是任何那些字母表字母。图17中由虚线 指示的矩形1701至1705示意性地例示了在S1605中获得的群集。从图17可以看到,单独 的群集1702和1705是从相同的事例数据块B获得的。通过关联那些群集和元数据值,创 建如图18中所例示的群集表。在S1607中,包含关系确定单元1503确定S1605中所获得的群集之间的包 含关系。具体而言,创建围绕群集的区域(在图17的示例中是矩形区域),且区域之 间的包含关系用于获得群集之间的包含关系。例如,群集A包含群集B的关系表示为 uAz^Bn。在这个时候,如果事例数据块如图17所例示的那样基于给定的特征元数据块 分布,则获得围绕群集的矩形区域,例如1701至1705。然后,获得它们的包含关系,例如 “1701〕1702”、“1701〕1703”、“ 1702〕1703 ”和“ 1704〕1705 ”。应当指出,在确定包 含关系时,如果群集A在某种程度上覆盖群集B,则确定群集A包含群集B。具体而言,如果 R(AAB)/R(B)超过特定的值(例如,0.95),其中R(B)是矩形区域B的面积,而R(A Λ B) 是A和B之间的重叠区域的面积,则可以确定群集A包含群集B。然而,用于确定包含关系 的方法不限于此。此外,在创建围绕群集的区域之前,可以排除在获得精确区域中可能是噪声的元 数据块。具体而言,包含在群集中的元数据块可以限于其值针对包含在群集中的元数据块 值的平均值或者中间值在预定阈值范围内的那些元数据块。例如,这排除了错误地输入成 “京都”的元数据块“东京”,由此防止从包括具有值“东京”的元数据块的群集创建错误的区 域。在S1608中,层次结构构造单元1504从S1607中所获得的包含关系构造(确定) 层次结构。具体而言,创建如上所述的图5中所例示的保持层次结构的表(下文中称为“层次结构表”)。然而,在本实施例中,由于代替元数据值而使用群集ID,因此表中的项是“最 高级别标志”、“父群集ID”和“子群集ID”。首先,根据在S1607中所获得的包含关系,填充 “父群集ID”和“子群集ID”。然而,该包含关系代表的不是层次结构中的父子关系,而是先 祖子孙关系。因此,将包含关系缩小到父子关系。例如,从图17所获得的包含关系中获得 “1701〕1702”、 “1702〕1703”和“1704 二 1705”,并且将它们存储在表中。然后,将 不作为子群集出现的父群集的“最高级别标志”设成“开”。其它父群集的最高级别标志全 都设成“关”。通过上述处理获得的层次结构表如图19中所例示。应当指出,如果S1607中 没有获得包含关系,则不创建层次结构表。在这种设备与本实施例中以上所述的元数据分配设备一起使用的情况下,在元数 据分配设备的处理之前事先构造层次结构。例如,在图6的流程图中的S604之后,紧接着 可以利用层次性元数据块作为估计目标元数据块来执行上述处理,从而构造层次结构。或 者,在S601之前,估计规则表中所述的所有估计目标元数据块的层次结构可以通过上述处 理事先构造。然而,层次结构的构造时间不限于此。层次性估计处理接下来描述的是本实施例中所构造的层次结构用在本实施例中的上述层次性估 计处理中的情况。这种处理的内容与图13的流程图中所示的基本上相同。不同之处仅仅 在于,该处理采用群集ID而不是元数据值来指定层次。下文中,将参照图13来描述根据本 实施例的层次性估计处理。在S1301中,列出在其层次中处于最高级别的数据块。例如,在如图19所例示的 那样事先给出层次结构表的情况下,列出其最高级别标志为“开”的群集ID。在S1302中,确定在S1301或S1305中所创建的列表是否为空。如果列表为空 (S1302中为“是”),则处理前进到S1306。如果列表不为空(S1302中为“否”),则处理前 进到S1303。在S1303中,估计事例数据集缩小到属于包括在S1301或S1305所创建的列表中 的层次的事例数据块。此外,估计目标元数据块被群集ID替代,这构成新的估计事例数据 集。例如,假定群集“1701”和“1702”包括在列表中。在这个时候,当前的估计事例数据集 进一步缩小到属于群集“1701”或“1702”的事例数据块。具体而言,参考群集配置表,从而 只留下与群集ID “1701”或“1702”关联的事例数据块。然后,估计目标元数据块被群集ID 替代,这产生新的估计事例数据集。在S1304中,利用在S1303中所获得的估计事例数据集来执行估计处理。这种估 计处理对应于参考以上提到的图8的流程图所述的处理。在估计处理之后,处理前进到 S1305。在S1305中,存储在S1304中所获得的结果。然后,列出层次中下一级别的数据块。 其后,处理返回到S1302。具体而言,从图19的层次结构表中列出其父群集ID等于所得群 集ID的子群集ID。例如,如果“1701”作为结果获得,则列出“1702”。应当指出,如果在层 次中的下一级别没有发现数据块,则意味着列表为空。同时,在S1306中,配置处理结果。具体而言,由于在S1305中所存储的结果是群集 ID,因此它们被其对应的元数据值替代。为了更加明确,当所存储的结果是“1701 => 1702 => 1703”时,参考图18中的群集表,以便获得“A = > B => C”。应当指出,如果S1305中没有存储结果,则“不可估计”作为结果给出。应当指出,从S1301至S1306的处理是由 本实施例以上描述中的层次性估计单元307执行的。在本实施例的以上描述中,由分配目标获取单元302获得的图像数据和与该图像 数据相关的元数据用作估计目标数据。在本实施例中,一组图像数据块或者与图像相关联 的一组元数据块用作估计目标元数据块。为了创建这种组,例如在分配目标获取单元302获取在外部存储设备104中以文 件夹管理的图像数据块或者仅仅元数据块的情况下,每个文件夹都可以组织成一组。然后, 可以从构成该组的元数据块获取诸如平均值或者模式值的代表值。然而,用于创建组的方 法和用于获取元数据块的值的方法不限于此。可选地,在用于组的元数据块通过估计获得的情况下,分配目标写单元308写元 数据块,从而将其反映到组中的所有成员。在以上所述的配置中,在利用一组已经事先分配了元数据块的图像数据块的情况 下,估计方法是与状态对应地确定的,这提高了获得元数据块的精度。本发明提供了如下技术,该技术允许高精度地确定适合元数据块,而不管事先为 元数据块估计所准备的数据块的属性如何。其它实施例本发明的各方面还可以通过读出并执行记录在存储器件上的程序以执行上述实 施例的功能的系统或装置(或者例如CPU或MPU的设备)的计算机来实现,本发明的各方 面还可以通过方法来实现,其中该方法的步骤被系统或装置的计算机例如通过读出并执行 记录在存储器件上的程序以执行上述实施例的功能来执行。为此,程序例如通过网络或者 从用作存储器件的各种类型的记录介质(例如,计算机可读介质)提供给计算机。尽管已经参照示例性实施例描述了本发明,但应当理解,本发明不限于所公开的 示例性实施例。以下权利要求的范围是要符合最广泛的解释,从而包括所有这种修改及等 效的结构与功能。
19
权利要求
一种信息处理装置,包括第一位置获取单元,其适于从目标数据块获取位置元数据块,该位置元数据块指示位置;第二位置获取单元,其适于从与所述目标数据块不同的多个其它数据块获取多个位置元数据块;目标获取单元,其适于从所述其它数据块获取除所述多个位置元数据块之外的目标元数据块;分析单元,其适于根据由从所述其它数据块获取的所述多个位置元数据块指示的位置,来分析所述目标元数据块的分布;及分配单元,其适于根据由从所述目标数据块获取的所述位置元数据块指示的位置与所述分布,来向所述目标数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元数据块是从经分析的目标元数据块中选择的。
2.如权利要求1所述的信息处理装置,包括群集单元,其适于针对所述经分析的目标元数据块的每个值,将从所述其它数据块获 取的所述多个位置元数据块组织成多个群集;及区域创建单元,其适于针对所述多个群集中的每一个创建与该群集对应的区域,在该 区域中可能存在由该群集中所包括的每个位置元数据块指示的位置;其中,当由从所述目标数据块获取的所述位置元数据块指示的位置在任何所述区域中 存在时,所述分配单元向所述目标数据块分配目标元数据块,其中该目标元数据块是分配 到具有包括在对应于该区域的群集中的已分配位置元数据块的另一数据块的目标元数据 块。
3.如权利要求2所述的信息处理装置,还包括包含确定单元,其适于当由从所述目标数据块获取的所述位置元数据块指示的位置存 在于作为所述区域之一的第一区域和不同于该第一区域的第二区域中时,确定所述第一区 域是否包含在所述第二区域中,其中,如果确定所述第一区域包含在所述第二区域中,则所 述分配单元向所述目标数据块分配目标元数据块,该目标元数据块是分配到具有包括在对 应于所述第一区域的群集中的已分配位置元数据块的另一数据块的目标元数据块。
4.如权利要求2所述的信息处理装置,还包括层次信息保持单元,其适于保持层次信息,该层次信息指示分配到所述其它数据块的 目标元数据块的值中具有较高级别和较低级别的层次关系的值的组合;及层次确认单元,其适于当由从所述目标数据块获取的所述位置元数据块指示的位置存 在于作为所述区域之一的第一区域和不同于该第一区域的第二区域中时,确认是否保持层 次信息,在该层次信息中,分配到具有包括在对应于所述第一区域的群集中的已分配位置 元数据块的另一数据块的目标元数据块处于层次中较低的级别,而分配到具有包括在对应 于所述第二区域的群集中的已分配位置元数据块的另一数据块的目标元数据块处于所述 层次中较高的级别;其中,如果确认了对所述层次信息的保持,则所述分配单元向所述目标数据块分配目 标元数据块,该目标元数据块是分配到具有包括在对应于所述第一区域的群集中的已分配 位置元数据块的另一数据块的目标元数据块。
5.如权利要求3所述的信息处理装置,还包括层次信息保持单元,其适于保持层次信息,该层次信息指示分配到所述其它数据块的 目标元数据块的值中具有较高级别和较低级别的层次关系的值的组合;及层次确认单元,其适于当由从所述目标数据块获取的所述位置元数据块指示的位置包 括在作为所述区域之一的第一区域和不同于该第一区域的第二区域中时,确认是否保持层 次信息,在该层次信息中,分配到具有包括在对应于所述第一区域的群集中的已分配位置 元数据块的另一数据块的目标元数据块处于层次中较低的级别,而分配到具有包括在对应 于所述第二区域的群集中的已分配位置元数据块的另一数据块的目标元数据块处于所述 层次中较高的级别;其中,如果确认了对所述层次信息的保持,则所述分配单元向所述目标数据块分配目 标元数据块,该目标元数据块是分配到具有包括在对应于所述第一区域的群集中的已分配 位置元数据块的另一数据块的目标元数据块,及如果所述包含确定单元确定所述第一区域包括在所述第二区域中,则所述层次信息保 持单元还保持如下层次信息,该层次信息指示分配到具有包括在对应于所述第一区域的群 集中的已分配位置元数据块的另一数据块的目标元数据块处于层次中较低的级别,而分配 到具有包括在对应于所述第二区域的群集中的已分配位置元数据块的另一数据块的目标 元数据块处于所述层次中较高的级别。
6.如权利要求2所述的信息处理装置,还包括排除单元,其适于从群集中排除指示离代表性位置超出预定距离的位置的位置元数据 块,其中的代表性位置是从由所述群集中所包括的多个位置元数据块指示的位置获得的,其中,所述区域创建单元从排除后获得的群集创建区域。
7.如权利要求6所述的信息处理装置,其中所述代表性位置是从所述位置获得的平均 位置或者中间位置。
8.如权利要求1所述的信息处理装置,还包括第一时间获取单元,其适于从所述目标数据块获取时间元数据块,该时间元数据块指 示时间;及第二时间获取单元,其适于从所述其它数据块获取时间元数据块;其中,当经分析的目标元数据块的值包含多个不同的值时,所述分配单元向所述目标 数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元数据块是被分配到具 有已分配的时间元数据块的所述其它数据块的目标元数据块中的目标元数据块,所述已分 配的时间元数据块指示与由从所述目标数据块所获取的时间元数据块所指示的时间接近 的时间。
9.如权利要求1所述的信息装置,还包括第一人物获取单元,其适于从所述目标数据块获取人物元数据块,人物元数据块指示 人物;第二人物获取单元,其适于从所述其它数据块获取人物元数据块;及关联获取单元,其适于获取关于人物的信息,其中该人物被认为与由从所述目标数据 块获取的人物元数据块所指示的人物相关联,其中,当经分析的目标元数据块的值包含多个不同的值时,所述分配单元向所述目标数据块分配其值与所述目标数据块相关的目标元数据块,该目标元数据块是分配到具有人 物元数据块的所述其它数据块的目标元数据块中的目标元数据块,所述人物元数据块指示 被认为有关联的人物。
10. 一种信息处理方法,包括第一位置获取步骤,从目标数据块获取位置元数据块,该位置元数据块指示位置; 第二位置获取步骤,从与所述目标数据块不同的多个其它数据块获取多个位置元数据块;目标获取步骤,从所述其它数据块获取除所述多个位置元数据块之外的目标元数据块;分析步骤,根据由从所述其它数据块获取的所述多个位置元数据块指示的位置,来分 析所述目标元数据块的分布;及分配步骤,根据由从所述目标数据块获取的所述位置元数据块指示的位置与所述分 布,来向所述目标数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元数 据块是从经分析的目标元数据块中选择的。
全文摘要
公开了一种信息处理装置和方法。该信息处理装置包括适于从目标数据块获取位置元数据块的第一位置获取单元,该位置元数据块指示位置;适于从与目标数据块不同的多个其它数据块获取多个位置元数据块的第二位置获取单元;适于从其它数据块获取除多个位置元数据块之外的目标元数据块的目标获取单元;适于根据由从其它数据块获取的多个位置元数据块所指示的位置来分析目标元数据块的分布的分析单元;及分配单元,适于根据由从目标数据块获取的位置元数据块所指示的位置与所述分布,来向目标数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元数据块是从经分析的目标元数据块中选择的。
文档编号G06F17/30GK101908057SQ20101019444
公开日2010年12月8日 申请日期2010年6月1日 优先权日2009年6月4日
发明者空门日出来 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1