信息处理装置、信息处理方法和信息处理程序的制作方法

文档序号:6439102阅读:174来源:国知局
专利名称:信息处理装置、信息处理方法和信息处理程序的制作方法
技术领域
本公开涉及信息处理装置、信息处理方法和信息处理程序。
背景技术
用于基于数据的位置信息把特征空间中的数据聚类的技术是已知的。可以把作为聚类的结果分组到同一聚类中的数据看作在特征空间中彼此接近的位置处存在的数据。特征空间中接近位置处存在的数据是由特征空间表示的特征彼此类似的数据。此聚类技术的典型示例是日本专利公开No. 2010-140383中公开的技术。按照此公开的技术,向图像数据添加位置信息以及进行基于位置信息的聚类以便根据位置信息把图像数据分类成组。在此情形中,向图像数据添加的位置信息是拍摄由图像数据表示的图像的位置的信息。

发明内容
由于聚类处理计算每个都具有位置信息的多项数据之间的距离,所以然而,距离计算的处理负荷容易增加。另外,聚类处理往往需要存储容量大的存储器。因此,出现了如何增加聚类处理速度的问题。因而解决上述问题的本公开的目的是提供能够高速进行只要求少量处理的聚类处理的新型和改进的信息处理装置和提供信息处理装置要采用的信息处理方法以及实施信息处理方法的信息处理程序。为了解决上述问题,按照本公开的实施方式,提供了信息处理装置,采用N进制数值生成部,其中,N= 2、3等,被配置成通过以下方式生成用于每个数据项的组合N进制数值,所述每个数据项的位置信息表示根据针对特征空间设置的D维坐标系统的D个不同坐标而被规定作为所述数据项在特征空间中的位置的位置,其中,D = 2、3等 逐数位地顺次交替布置表示所有D个不同坐标的值的数位,每个值都用具有预定数位计数的分量N进制数值表示,所述预定数位计数表示代表所述坐标的前述数位的数量;以及聚类部,用于把每个都用满足以下条件的所生成的组合N进制数值表示的所述数据项分组在同一聚类中所述组合N进制数值中的每个都具有为所述数据项共有的k个最闻有效数位,其中,k= 1、2等。另外,可以提供如下这种配置其中,如果关系k = DXm成立,其中,m = 1、2等, 则所述聚类部把每个都用满足以下条件的所生成的N进制数值中的一个表示的数据项分组在聚类的Nd子树结构的第m层上的同一聚类中组合N进制数值中的每个都具有为数据项共有的k个最高有效数位。另外,可以提供如下这种配置其中,聚类部具有面向聚类的内容归类块,用于按每个都由N进制数值生成部针对数据项中的一个生成的所述N进制数值的次序对数据项进行归类。在该配置中,聚类部根据由面向聚类的内容归类块进行的归类的结果来识别要分组在同一聚类中的数据项。另外,可以提供如下这种配置其中,聚类部通过根据聚类中出现的第一数据项的位置和分组在聚类中的数据项的数量创建聚类识别信息,来生成用于针对归类的结果识别聚类的聚类识别信息。另外,可以提供如下这种配置其中,该信息处理装置进一步采用面向合并的聚类归类块,用于根据基于D维坐标系统的D个不同坐标的第一排序确定处理的结果,来在特征空间中的第一方向上把聚类归类;聚类相邻性确定块,用于判断在第一方向上归类的聚类是否在第一方向上彼此相邻;以及聚类合并部,用于把确定为在第一方向上彼此相邻的聚类合并。另外,可以提供如下这种配置,其中面向合并的聚类归类块根据基于D维坐标系统的D个不同坐标的第二排序确定处理的结果,来在特征空间中的第二方向上把聚类归类;聚类相邻性确定块判断在第二方向上归类的聚类是否在第二方向上彼此相邻;以及所述聚类合并部进一步把确定为在第二方向上彼此相邻的聚类合并。另外,可以提供如下这种配置,其中所述特征空间是地球的表面;D维坐标系统的D个不同坐标是用作二维坐标系统的两个坐标的纬度坐标和经度坐标;所述聚类是如下这种区域具有根据二维坐标系统的两个坐标在地球的表面上定义的网格中包括的数据项的位置的信息;以及所述第一排序确定处理是以下处理被执行以在第一方向上把网格归类以便设置网格的归类次序,并向每个都与所归类的网格中的一个相关联的聚类提供网格的归类次序作为聚类的排序。另外,可以提供如下这种配置,其中所述特征空间是三维空间;所述D维坐标系统的D个不同坐标是用作正交坐标系统的三维坐标系统的三个坐标;以及所述聚类是如下这种区域具有依据三维坐标系统的三个坐标在三维空间中定义的块中包括的数据项的位置的信息。为了解决上述问题,按照本公开的另一方式,提供了一种信息处理方法,具有通过以下方式生成用于每个数据项的组合N进制数值,其中,N= 2、3等,所述每个数据项的位置信息表示根据针对特征空间设置的D维坐标系统的D个不同坐标而被规定作为数据项在特征空间中的位置的位置,其中,D = 2、3等逐数位地顺次交替布置表示所有D个不同坐标的值的数位,每个值都用具有预定数位计数的分量N进制数值表示,预定数位计数表示代表坐标的所述数位的数量;以及把每个都用满足以下条件的所生成的组合N进制数值表示的数据项分组在同一聚类中所述组合N进制数值中的每个都具有为数据项共有的k个最高有效数位,其中,k =1、2 等。为了解决上述问题,按照本公开的另一方式,提供了要由计算机执行以进行以下处理的信息处理程序通过以下方式生成用于每个数据项的组合N进制数值,其中,N= 2、3等,所述每个数据项的位置信息表示根据针对特征空间设置的D维坐标系统的D个不同坐标而被规定作为所述数据项在所述特征空间中的位置的位置,其中,D = 2、3等逐数位地顺次交替布置表示所有所述D个不同坐标的值的数位,每个值都用具有预定数位计数的分量N进制数值表示,所述预定数位计数表示代表所述坐标的所述数位的数量;以及把每个都用满足以下条件的所生成的组合N进制数值表示的所述数据项分组在同一聚类中所述组合N进制数值中的每个都具有为所述数据项共有的k个最高有效数位, 其中,k = 1、2等。可以提供如下这种配置其中,所述计算机执行信息处理程序以进一步进行如下处理根据基于D维坐标系统的D个不同坐标的第一排序确定处理的结果,在所述特征空间中的第一方向上把所述聚类归类;判断在所述第一方向上归类的所述聚类是否在第一方向上彼此相邻;以及把确定为在所述第一方向上彼此相邻的聚类合并。可以提供如下这种配置其中,用以把聚类合并的处理包括如下这种处理计算聚类中任何两个聚类之间的距离;以及如果计算出的两个聚类之间的距离不大于预先确定的阈值则把两个聚类彼此合并。可以提供如下这种配置其中,用以把聚类合并的处理包括以下处理计算聚类中任何两个聚类之间的距离;如果计算出的两个聚类之间的距离不大于预先确定的阈值则把任何两个聚类存储在存储器中作为合并候选聚类;以及按以合并候选聚类之间距离小的合并候选聚类开始的次序把从所存储的合并候选聚类中选择的聚类彼此合并。如上所述,可以高速进行量小的聚类处理。


图I是示出了本公开第一实施例中内容、聚类与网格之间的典型关系的图;图2是示出了本公开第一实施例中网格的典型层级结构的图;图3是示出了按照本公开第一实施例进行的聚类的典型结果的图;图4A和4B是按照本公开第一实施例进行的基于网格的位置聚类与普通的基于距离的位置聚类的通常比较的描述中要参照的说明图;图5A和5B是按照本公开第一实施例进行的基于网格的位置聚类与普通的基于距离的位置聚类的其它通常比较的描述中要参照的说明图;图6是示出了根据本公开第一实施例的信息处理装置的配置的方框图;图7是按照本公开第一实施例进行的聚类的描述中要参照的说明图;图8是按照本公开第一实施例用以把聚类彼此合并的处理的描述中要参照的说明图;图9示出了表示按照本公开第一实施例进行的合并处理和聚类处理的流程图10是按照本公开第一实施例进行的聚类处理的描述中要参照的说明图;图11是根据本公开第一实施例的聚类识别信息的描述中要参照的说明图;图12示出了表示按照本公开第一实施例进行的合并相关处理的流程图;图13是根据本公开第一实施例的典型合并设置信息的表;图14示出了表示按照本公开第一实施例进行的合并设置信息选择处理的流程 图;图15示出了表示按照本公开第一实施例进行的查找次序合并处理的流程图;图16示出了表示按照本公开第一实施例进行的完全匹配合并处理的流程图;图17A是示出了按照本公开第一实施例在水平方向上进行网格列表查找的情形 的图;图17B是示出了按照本公开第一实施例在竖直方向上进行网格列表查找的情形的 图;图17C是示出了按照本公开第一实施例在斜右下方向上进行网格列表查找的情形的 图;图17D是示出了按照本公开第一实施例在斜右上方向上进行网格列表查找的情形的 图;图18A是示出了按照本公开第一实施例进行一向查找的情形的图;图18B是示出了按照本公开第一实施例进行两向查找的情形的图;图18C是示出了按照本公开第一实施例进行四向查找的情形的图;图19示出了表示按照本公开第一实施例进行的邻居查找合并处理(在没有上级查找的情况下)的流程图;图20示出了表示按照本公开第一实施例进行的相邻性查找处理(在没有上级查找的情况下)的流程图;图21示出了表示按照本公开第一实施例进行的邻居查找合并处理(在具有上级查找的情况下)的流程图;图22是示出了根据本公开第一实施例的典型上级网格列表的图;图23是示出了根据本公开第一实施例的典型上级网格列表的图;图24是按照本公开第一实施例进行的相邻性查找处理(在具有上级查找的情况下)的描述中要参照的说明图;图25示出了表示按照本公开第一实施例进行的相邻性查找处理(在具有上级查找的情况下)的流程图;图26是按照本公开第一实施例进行的相邻性查找处理(在具有上级查找的情况下)的描述中要参照的说明图;图27是示出了各自作为按照本公开第一实施例进行的邻居查找合并处理(在具有上级查找的情况下)的主题的通常网格的图;图28是按照本公开第一实施例进行的距离次序归类的概况的描述中要参照的说明图;图29示出了表示按照本公开第一实施例进行的距离次序合并处理的流程图;图30A是示出了本公开第二实施例中内容、聚类与网格之间的通常关系的图,图 30B是示出了本公开第二实施例中聚类和内容的通常显示的图;图31是按照本公开第二实施例用以通过利用块划分地球表面的操作的描述中要参照的说明图32是按照本公开第二实施例用以通过利用块划分地球表面的操作的描述中要参照的说明图;图33是按照本公开第二实施例用以通过利用块划分地球表面的操作的描述中要参照的说明图;图34是按照本公开第二实施例进行的聚类的以下描述中参照的说明图;以及图35是示出了根据本公开实施例的信息处理装置的硬件配置的方框图。
具体实施例方式下面通过参照图详细解释本公开的优选实施例。要注意,在图和本公开的说明书中,功能配置实质上相同的配置元件各自用相同的附图标记标注以使得只需要解释一次这种配置元件。因此,可以避免解释的重复。还值得注意,在安排如下的章节中解释实施例。
I :第一实施例
1-1:基于网格的位置聚类的概况
1-2 :信息处理装置的配置
1-3 :合并和聚类的细节
2 :第二实施例
2-1 :基于块的位置聚类的概况
3 :根据本公开实施例的信息处理装置的硬件配置
4 :结论
I :第一实施例
在本公开的第一实施例中,地球的表面对应于之前引述的特征空间。另外,在此实
施例中,依据作为二维坐标系统纬度和经度坐标的两个不同坐标表示地球表面上位置的信息。在此基础上,在此实施例中,与网格相关联的聚类是如下这种区域提供有通过利用两个不同坐标(即,二维坐标系统的纬度和经度坐标)在地球的表面上定义的网格中包括的内容的位置的信息,如将在后面更详细描述的。1-1 :基于网格的位置聚类的概况首先,通过参照图I至5B解释按照本公开第一实施例进行的聚类的概况。按照此实施例进行的聚类是通过把网格作为参考把每个都具有内容位置信息的内容分组到聚类中的处理。如上所述,如将在后面更详细描述的通过利用作为二维坐标系统的纬度和经度坐标的两个不同坐标在地球的表面上定义网格。在以下描述中,也把聚类称作基于网格的位置聚类。网格图I是示出了本公开第一实施例中的内容1011、聚类1021与网格1031之间的典型关系的图。具体地,图I示出了地球表面1001、内容1011、聚类1021和网格1031。地球表面1001是地球整个表面的区域或者表面一部分的区域。在此实施例中,把地球表面1001视为二维平面。依据作为二维坐标系统的纬度和经度坐标的两个不同坐标表示地球表面1001上每个位置的信息。在以下描述中,也把位置的信息称作位置信息。地球表面1001上位置处的内容1011是具有用于识别数据位置的位置信息的数据。内容1011不需要是位置信息本身。因此,内容1011可以是具有向数据添加的位置信息作为用于一些其它信息的额外信息的数据。内容1011的典型示例是包括用于识别拍摄了由图像数据表示的图像的位置的位置信息的图像数据。聚类1021是包括位于地球表面1001上彼此接近位置处的内容1011的区域。在图中,把聚类1021示出为形状像矩形。然而,聚类1021可以具有别的形状。作为替选方案, 聚类1021可以具有围绕聚类1021中包括的内容1011的形状。网格1031是地球表面1001上设置的网格。网格1031可以是通过地球表面1001 上经度和纬度的范围定义的矩形区域。如将在后面更多描述的,按照聚类条件(诸如作为聚类对象的区域的尺寸和内容1011的数量等)恰当设置网格1031的尺寸。如图中所示,在此实施例中,把同一网格1031中包括的内容1011分组在与网格 1031相关联的同一聚类1021中。除了把聚类1021彼此合并的情形以外,包括内容1011的聚类1021的区域被包括在包括相同内容1011的网格1031的区域中。也就是说,在按照此实施例进行的基于等级的位置聚类处理中,基于对于内容1011是否属于包括聚类1021的同一网格1031的确定结果做出对于是否要把内容1011分组在聚类1021中的判断。也就是说,使用这种确定的结果作为聚类的基本准则。普通的基于距离的位置聚类包括用以计算每两个内容之间的距离以及把该距离与预先确定的阈值或两个其它内容之间的距离相比较的处理。在距离运算处理中,要运算的距离的数量等于各自包括两个不同内容的组合的数量。因此,距离运算处理的量大。另外,如果要把两个内容之间的距离与两个其它内容之间的距离相比较,则需要暂时把运算的距离存储在存储器中。因此,期望存储容量大的存储器。在按照此实施例进行的基于网格的位置聚类的情形中,另一方面,内容1011的位置信息本身如根据以下描述明显的还表示包括内容1011的网格1031。内容1011的位置信息依据经度和纬度表示,经度和纬度每个都用由数字阵列组成的N进制数值表示。如将在后面描述的,如果通过对数值进行顺次的数位对数位比较来按N进制数值的次序把内容 1011归类,则获得归类的结果。相同网格1031的区域中包括的内容1011在归类的结果中彼此相邻。可以通过例如以下方式来判断在归类结果中彼此相邻的两个内容1011是否包括在同一网格1031中 确定N进制数值(每个都表不两个内容1011中一个)的k(其中,k = 1、2等)个最闻有效数位是否彼此相同。如前所述,把同一网格1031中包括的内容1011分组在与网格1031相关联的同一聚类1021中。因此,用以把根据内容1011的位置信息生成的数值归类的处理是按照此实施例进行的基于网格的位置聚类的主要处理。归类处理相比于距离运算处理而言作为处理器要承载的小负荷。另外,要进行归类处理的次数小于要进行距离运算处理的次数。因此, 可以高速进行按照此实施例进行的基于网格的位置聚类,可以减少基于网格的位置聚类中存储器的存储容量。网格的层级结构图2是示出了本公开第一实施例中网格的典型层级结构的图。图2示出了 O级网格1032、I级网格1033和2级网格1034。O级网格1032是层级结构中最高级别的网格。O级网格1032的范围是整个地球表面1001。也就是说,在层级结构中的最高级别,在作为O级网格1032的一个网格中包括整个地球表面1001。I级网格1033是通过把O级网格1032划分成纬度方向上的两个网格和经度方向上的两个网格获得的四个网格中的任何一个网格。换言之,把作为O级网格1032区域的整个地球表面1001划分成四个I级网格1033。2级网格1034是通过把每个I级网格1033划分成纬度方向上的两个网格和经度方向上的两个网格获得的16个网格中的任何一个网格。换言之,把每个I级网格1033的区域划分成四个二级网格1034。也就是说,把作为O级网格1032区域的整个地球表面1001 划分成16个二级网格1034。以相同方式把网格的层级结构扩展为进一步较低的级别。具体地,把每个2级网格1034的区域划分成四个三级网格,把每个3级网格的区域划分成四个四级网格等。以此方式,可以定义区域较精细的网格。通过调整聚类处理中使用的网格的级别,可以建立聚类处理的粒度与处理的负荷之间的平衡。如上所述,在此实施例中,通过把特定级别的网格划分成纬度方向上的两个网格和经度方向上的两个网格,可以获得特定级别紧下面的级别的四个网格。换言之,把特定级别的网格区域划分成特定级别紧下面的级别的四个网格。因此,此实施例中网格1031的层级结构具有四子树结构,O级网格1032作为根节点,根节点划分成紧接根节点最高级别下面的级别的四个网格。在四子树结构中,把在根节点最高级别下面每个特定级别的每个网格划分成紧接特定级别下面的级别的四个网格。每个都在网格1031中的一个中定义的聚类1021也具有与网格1031相同的四子树结构。在普通基于距离位置聚类处理中,如果定义聚类的树结构,则在树结构上保持信息需要储存存储器。在按照此实施例进行的基于网格的位置聚类的情形中,另一方面,如上所述唯一确定网格1031的树结构。因此,通过保持表示定义各个网格1031的网格级别的信息,可以基于网格1031的四子树结构容易地知晓聚类1021的树结构。聚类结果图3是示出了按照本公开第一实施例进行的聚类的典型结果的图。图3示出了地图1002、内容图标1012、聚类区域1022、聚类中心1023和网格线1035。地图1002是地球表面1001整个区域或地球表面1001部分区域的图像。示出地图1002以向用户示出聚类1021的区域以及每个内容1011的位置,作为对内容1011进行的聚类结果。可以按照地球表面1001上存在内容1011的范围或按照用户进行的操作来设置由地图1002表示的地球表面1001的区域。在作为与地球表面1001上内容1011的区域对应的位置,在地图1002上存在的位置处显示内容图标1012。内容图标1012显示为具有针形形状的图标。然而,显示的内容图标1012不一定具有针形形状。也就是说,显示的内容图标1012可以具有各种形状中的任何一个形状。另外,内容图标1012还可以显示信息的一部分(诸如内容1011中包括的图像或字符等)或者信息中的所有信息。在作为与地球表面1001上聚类1021的区域对应的位置在地图1002上存在的位置处显示聚类区域1022。聚类区域1022可以显示为具有与聚类1021相同形状的区域,或者作为替选方案,显示为略微大于聚类1021的区域的区域以便通常防止聚类区域1022的显示覆盖内容图标1012的显示,以使得内容图标1012容易看到。
聚类中心1023显示在地图1002上存在的位置处,作为与地球表面1001上的聚类 1021的中心位置或聚类区域1022的中心位置对应的位置。显示聚类中心1023以便通常示出从聚类1021中包括的内容1011中提取的概括性信息。如果内容1011是图像数据,则概括性信息通常是代表性图像或缩略图像。然而,并非总是必定显示聚类中心1023。网格线1035是环绕在聚类中使用的网格1031的线,用以把与网格1031相关联的聚类1021中的内容1011分组。在用于显示聚类结果的地图1002上不显示网格线1035。 然而,例如,当用户改变聚类的粒度设置时,网格线1035可以特意示出作为参考信息。与基于距离的位置聚类的比较基于网格的位置聚类的优点图4A和4B是按照本公开第一实施例进行的基于网格的位置聚类与普通的基于距离的位置聚类的典型比较的以下描述中参照的说明图。更具体而言,图4A是对内容IOlla 至IOllk进行的普通的基于距离的位置聚类的以下描述中参照的说明图。另一方面,图4B 是按照此实施例对相同内容IOlla至IOllk进行的基于网格的位置聚类的以下描述中参照的说明图。如图4A中所示,作为对内容IOlla至IOllk进行的普通的基于距离的位置聚类的结果,把内容IOlla至IOlle分组在聚类1021a中,把内容IOllf至IOllj分组在聚类1021b 中而把内容IOllk放在聚类1021c中。把聚类1021a至1021c的形状各自创建为具有椭圆形状,以使得如图中所示聚类1021a部分覆盖聚类1021b而聚类1021b包括聚类1021c。在基于距离的位置聚类的情形中,用于计算和比较距离的流程通常使得聚类的区域彼此部分覆盖和/或聚类的区域包括另一聚类的区域,如以上在一些情形中所述。作为按照此实施例对相同内容IOlla至IOllk进行的基于网格的位置聚类的结果,另一方面,如图4B中所示,把内容IOlla和IOllb分组在聚类1021d中,把内容IOllc放在聚类1021e中,把内容IOlld至IOllg分组在聚类1021f中而把内容IOllh至IOllk分组在聚类1021g中。如图中所示,聚类1021d至1021g既未彼此部分覆盖也未包括其它聚类。也就是说,聚类1021d至1021g彼此清楚地分开。如上所述,在按照此实施例进行的基于网格的位置聚类的情形中,基于对于内容1011是否属于包括聚类1021的同一网格1031 的判断结果做出对是否要把内容1011分组在聚类1021中的判定。也就是说,使用这种判断的结果作为聚类的基本准则。因此,作为规则,在与聚类1021相关联的网格1031的区域中包括聚类1021的区域。作为结果,按照此实施例进行的基于网格的位置聚类可以不生成聚类1021部分覆盖或包括另一聚类1021的聚类结果。与基于距离的位置聚类的比较基于网格的位置聚类的缺点图5A和5B是按照本公开第一实施例进行的基于网格的位置聚类与普通的基于距离的位置聚类的其它通常比较的以下描述中参照的说明图。更具体而言,图5A是对内容 IOllm至IOllq进行的普通的基于距离的位置聚类的以下描述中参照的说明图。另一方面, 图5B是按照此实施例对相同内容IOllm至IOllq进行的基于网格的位置聚类的以下描述中参照的说明图。如图5A中所示,作为对内容IOllm至IOllq进行的普通的基于距离的位置聚类的结果,把内容IOllm和IOlln分组在聚类1021h中而把内容10110至IOllq分组在聚类 1021 中。在普通的基于距离的位置聚类的情形中,基本上,如图中所示把彼此分开短距离的内容1011分组在相同的聚类1021中。
作为按照此实施例对内容IOllm至IOllq进行的基于网格的位置聚类的结果,另一方面,如图5B中所示,把内容IOllm和IOlln分组在聚类1021j中,把内容IOllo放在聚类1021k中而把内容IOllp和IOllq分组在聚类1021m中。如上所述,在按照此实施例进行的基于网格的位置聚类的情形中,基于对于内容1011是否属于包括聚类1021的同一网格1031的判断结果做出对是否要把内容1011分组在聚类1021中的判定。也就是说,使用这种判断的结果作为聚类的基本准则。因此,即使在内容1011只彼此分开短距离以使得将会在进行普通的基于距离的位置聚类的情况下把内容1011分组在聚类1021中的情况下, 也在一些情形中把不属于包括聚类1021的同一网格1031的内容1011不分组在聚类1021 中。另外,图5B还示出了网格边界1036和上级网格边界1037。网格边界1036是特定级别的网格1031的边界。上级网格边界1037是特定级别的网格1031的边界以及如下这种网格1031的边界在该特定级别再高一级提供以作为包括该特定级别的四个子网格的网格1031。在图中示出的典型配置中,在网格1031a中包括内容IOllm和1011η,在网格 1031e中包括内容IOllo而在网格1031c中包括内容IOllp和lOllq。在以下描述中,把特定级别再高一级的网格1031简单地称作上级网格1031。以下描述解释进行基于高级网格1031的基于网格的位置聚类的情形。如图5B 中所示,同一个高级网格1031包括包括内容IOllm和IOlln的网格1031a以及包括内容 1011的网格1031e。因此,作为基于高级网格1031进行的基于网格的位置聚类的结果,把内容1011m、IOlln和IOllo分组在高级网格1031的聚类1021η中。另一方面,包括内容IOllp和IOllq的网格1031c属于除了高级网格1031以外的上级网格。因此,作为基于其它上级网格进行的基于网格的位置聚类的结果,包括内容 IOllp和IOllq的聚类不改变。也就是说,不做改变地把内容IOllp和IOllq分组在其它上级网格的前述聚类1021m中。如根据以上描述明显的,基于网格的位置聚类的大优点是可以极其快速地进行基于网格的位置聚类。然而建议读者谨记,即使在内容1011只彼此分开短距离以使得如果进行普通的基于距离的位置聚类则把内容1011分组在聚类1021中的情况下,不属于包括聚类1021的同一网格1031的内容1011也在一些情形中不被分组在聚类1021中。具体地, 在例如图5B中示出的通常情形中,即使在内容1011o、1011p和IOllq只彼此分开短距离的情况下,作为基于网格的位置聚类的结果也不把内容1011ο、IOllp和IOllq分组在同一聚类中,这是因为内容IOllo属于上级网格1031而内容IOllp和IOllq属于其它网格。在这种情形中,可以通过进行要在后面描述的合并处理使得基于网格的位置聚类的结果较接近自然形状。要注意,如将在后面描述的,可以通过运用基于网格的位置聚类的属性高速进行此合并处理。1-2 :信息处理装置的配置接下来,通过参照图6至8,以下描述解释根据本公开第一实施例的信息处理装置的配置。图6是示出了根据本公开第一实施例的信息处理装置100的配置的框图。在图6 中,把信息处理装置100示为采用信息处理装置100中主要包括的组件的装置。组件通常包括N进制数值生成部101、聚类部103、合并部107、输入部113、显示控制部115、显示部117和存储部119。信息处理装置100把上述内容1011当作数据。内容1011的典型示例是图像内容、 各类字符信息或各类图像信息。图像内容可以是移动图像内容的停顿图像内容。把各类字符信息和各类图像信息预先注册在服务器等中以允许用户共享存储的信息。内容1011的其它典型示例是邮件、音乐创作、日程、电子货币花费历史、电话呼叫历史、内容查看/聆听历史、观光的信息、辖区的信息、新闻、天气预报和铃声模式历史。在以下描述中,把诸如停顿图像或移动图像内容的图像内容作为示例。然而,信息处理装置100能够操控任意信息和/或任意内容数据,只要为信息和/或内容数据提供通常作为向信息和/或内容数据附加的元数据的表示特征空间中位置的位置信息即可。另外,期望把表示各类信息的这种内容数据和/或数据存储在嵌入信息处理装置 100中的存储器中。然而,因为已把数据本身存储在外界装置(诸如从外界向信息处理装置100提供的服务器等)中,所以信息处理装置100可以用于存储与外界装置中存储的数据相关联的元数据。以下描述解释信息处理装置100中内置的存储器用于存储表示各类信息的内容数据和/或数据以及与它们相关联的元数据的情形。N进制数值生成部N进制数值生成部101被配置成通常采用CPU (中央处理单元)、ROM (只读存储器) 和RAM(随机存取存储器)。在此实施例中,如前所述,每个内容1011的位置信息是地球表面1001上内容位置的信息。依据纬度和经度在二维坐标系统中规定地球表面1001上的位置。N进制数值生成部101生成经度和纬度的组合N进制数值,其中,N = 2。也就是说,N 进制数值生成部101针对经度和纬度生成也称作二值系统数值的2进制数值。也把二值系统数值的技术术语‘数位’称作比特。为此,可以把以下描述中使用的技术术语‘数位’解释成比特。详细地,纬度是由具有表示构建纬度的纬度数位的数量的预定数位计数的字符串表示的分量二值系统数值。同理,经度是由具有表示构建经度的经度数位的数量的预定数位计数的字符串表示的分量二值系统数值。通过逐数位地顺次交替布置纬度数位和经度数位以形成由纬度数位和与纬度数位交替放置的经度数位组成的新数位串,N进制数值生成部101生成表示纬度和经度的组合二值系统数值。如果例如表示经度数位或纬度数位数量的预定数位计数被预先设置在29,则N进制数值生成部101生成纬度数位为29个和经度数位为29个的组合二值系统数值。具体地, 使纬度的分量二值系统数值是29个纬度数位“a28a27a26. . . %”而使经度的分量二值系统数值是29个经度数位“b28b27b26. . . V’。在此情形中,N进制数值生成部101生成通过逐数位地顺次交替布置纬度数位和经度数位获得的58个数位“a28b28a27b27a26. . . I^atl”的组合二值系统数值。生成的组合二值系统数值表示纬度和经度。应该注意,假定地球的半径是20,000km,则具有29个数位的纬度的最小分辨率是约O. 04m( = 20, 000km/229)。另一方面,假定地球的直径是40,OOOkm,则具有29个数位的经度的最小分辨率是约O. 07m( = 40,000km/229)。把预定数位计数设置在通过考虑信息处理装置100使用的数据单元的尺寸和所需最小分辨率得到的恰当值。数据单元尺寸的典型示例是32个数位和64个数位。如上所述,根据纬度的分量二值系统数值和经度的分量二值系统数值,N进制数值生成部101生成组合二值系统数值,允许依据二维坐标系统的两个坐标表示的位置信息被保持为一个组合二值系统数值。另外,由于N进制数值生成部101通过逐数位地顺次交替布置纬度分量二值系统数值的数位和经度分量二值系统数值的数位来生成组合二值系统数值,所以聚类部103可以如将在后面描述的容易地进行聚类。聚类部通常通过CPU、R0M和RAM等实施聚类部103。聚类部103包括要在后面描述的面向聚类的内容归类块105。聚类部103把由N进制数值生成部101生成的二值系统数值(作为具有内容1011共有的k个最高有效数位的值(其中,k = 1、2等))表示的内容1011分组在同一聚类1021中。如果关系k = 2Xm(其中,m = 1、2等)成立,则聚类部103把由N进制数值生成部101生成的二值系统数值(作为具有内容1011共有的k个最高有效数位的值)表示的内容1011分组在聚类的22子树结构(即,聚类1021的四子树结构)的第m层上的同一聚类1021中。如上所述包括在聚类部103中,通常通过CPU、ROM和RAM等实施面向聚类的内容归类块105。面向聚类的内容归类块105按照每个都由N进制数值生成部101生成以表示内容1011中一个的二值系统数值的次序把内容1011归类。由面向聚类的内容归类块105 归类的内容1011随后被聚类部103聚类。如将在后面描述的,聚类部103根据由面向聚类的内容归类块105进行的归类的结果识别要分组在同一聚类1021中的内容1011。接下来,通过参照图7解释聚类部103的功能。图7是按照本公开第一实施例进行的聚类的以下描述中参照的说明图。图7示出了地球表面1001上定义的下级网格1031、 每个都作为在较之网格1031的级别而言较高级别的网格的上级网格1041以及每个都作为聚类主题的内容IOllu至lOllw。应该注意,如先前通过参照图I所解释的,在此实施例中,通过包括内容1011的网格1031定义要把内容1011分组的聚类1021。也就是说,在聚类阶段,如果识别出包括作为聚类主题的内容1011的网格1031,则自动定义要把内容1011分组的聚类1021。因此, 聚类部103进行的用以把内容1011分组在聚类1021中的处理基本上是与用以确定包括内容1011的网格1031相同的处理。因此,参照图7的描述主要解释由聚类部103进行的用以识别包括每个都作为聚类主题的内容1011的网格1031的处理。为了使得图中示出的典型示例的描述简单,用具有三个数位的分量二值系统数值表示构建各个内容1011位置信息的经度和纬度中的每个。在此典型示例中,具有在范围000至111中的三个数位的分量二值系统数值表示经度和纬度中的每个。因此,N进制数值生成部101逐数位地顺次交替布置经度和纬度分量二值系统数值的数位以生成范围 000000至111111中的六数位组合二值系统数值作为表示纬度和经度这二者的值。作为结果,对于经度为000和纬度为111的内容lOllu,N进制数值生成部101生成通过逐数位地按顺序交替布置经度的数位000和纬度的数位111获得的组合二值系统数值010101。另外,对于经度为001和纬度为110的内容1011V,N进制数值生成部101生成通过逐数位地顺次交替布置经度的数位001和纬度的数位110获得的组合二值系统数值010110。在此基础上,对于经度为000和纬度为101的内容101 lw,N进制数值生成部101生成通过逐数位地顺次交替布置经度的数位000和纬度的数位101获得的组合二值系统数值010001。顺带提及,在图中示出的典型示例中,把地球表面1001划分成四个上级网格1041而把上级网格1041中的每个划分成4个下级网格1031。也就是说,在图中示出的典型示例中,网格1031具有四个子树结构。如果把整个地球表面1001作为四个子树结构的第零层上的最高级网格,四个上级网格1041中的每个是树结构第一层上的网格而16个下级网格1041中的每个是结构第二层上的网格。如之前所解释的,也把第零层称作树结构的根节如上所述,在按照此实施例进行的聚类中,聚类1021与网格1031相关联。因此, 在图中示出的典型示例中,聚类1021如网格1031 —样具有四个子树结构。具体地,包括地球表面1001上存在的所有内容1011的聚类2021对应于四子树结构的根节点或四子树结构的第零层。包括上级网格1041中包括的内容1011的聚类1021是第一层上的聚类而包括下级网格1031中包括的内容1011的聚类1021是第二层上的聚类。下面的描述解释聚类部103进行的以下操作把每个都由N进制数值生成部101 生成的二值系统数值中的一个二值系统数值(作为具有内容1011共有的k个最高有效数位的值)表示的内容1011分组在同一聚类1021中。例如,每个都具有在范围000至011中的经度和在范围100至111中纬度的内容 1011属于地球表面1001左上角上的上级网格1041。在这些范围中,经度的最高有效数位是 O而纬度的最高有效数位是I。因此,每个都表示内容1011中的一个的二值系统数值的两个最高有效数位是01。也就是说,每个都表示地球表面1001左上角上的上级网格1041中的内容1011中一个的二值系统数值是Olxxxx。同理,每个都表示地球表面1001三个其它边角中每个边角上的上级网格1041中的内容1011中的一个的二值系统数值分别是llxxxx、 OOxxxx和10XXXX。也就是说,四子树结构的网格包括每个都是第一层上的网格的四个上级网格1041。可以根据表示内容1011的二值系统数值的两个最高有效数位来识别包括内容 1011的上级网格1041。因此,每个都用具有为内容1011共有的两个最高有效数位的二值系统数值中的一个二值系统数值表示的多个内容1011属于同一上级网格1041。也就是说, 把内容1011分组在与上级网格1041相关联的同一聚类1021中。换言之,把内容1011分组在四子树结构的第一层上的同一聚类1021中。地球表面1001左上角上的网格1031包括经度为000和纬度为110的内容1011 以及经度为001和纬度为111的内容1011。在经度的范围中,经度的两个最高有效数位是 00。另一方面,在纟韦度的范围中,纟韦度的两个最闻有效数位是11。因此,表不网格1031中内容1011的二值系统数值的四个最高有效数位是0101。也就是说,表示网格1031中内容 1011的二值系统数值是0101XX。同理,每个都表示其它网格1031中的任何网格中的内容 1011的二值系统数值具有对其它网格1031唯一的四个最高有效数位。也就是说,四子树结构的网格包括每个都是第二层上的网格的16个网格1031。可以根据表示内容1011的二值系统数值的四个最高有效数位来识别包括内容1011的网格1031。因此,每个都用具有为内容1011共有的四个最高有效数位的二值系统数值中的一个二值系统数值表示的多个内容1011属于同一网格1031。也就是说,把内容1011分组在与网格1031相关联的同一聚类中。换言之,把内容1011分组在四子树结构的第二层上的同一聚类中。接下来,通过参照图7,下面解释内容IOllu至IOllw的聚类作为聚类的具体典型示例。首先,用二值系统数值010101表示内容lOllu。因为表示内容IOllu的二值系统数值的四个最高有效数位是0101,所以确定内容IOllu属于作为地球表面1001左上角上的网格1031的由二值系统数值OlOlxx表示的网格1031。随后,用二值系统数值010001表示内容lOllv。因为表示内容IOllv的二值系统数值的四个最高有效数位是0100,所以确定内容IOllv属于作为除了内容IOllu属于的网格1031以外的网格1031的由二值系统数值OlOOxx的四个最高有效数位表示的网格1031。 简言之,确定内容IOllv属于与内容IOllu属于的网格1031不同的网格1031。随后,用二值系统数值010110表示内容lOllw。因为表示内容IOllw的二值系统数值的四个最高有效数位也是0101,所以确定内容IOllw属于作为地球表面1001左上角的网格1031的由二值系统数值OlOlxx的四个最高有效数位表示的网格1031。也就是说,确定内容IOllw属于与内容IOllu —样的网格1031。请读者考虑面向聚类的内容归类块105已按每个都表示内容IOllu至IOllw中一个的二值系统数值的次序把内容101 Iu至IOllw归类的情形。按每个都表示101 Iu至IOllw 中的一个的二值系统数值的升序把内容IOllu至IOllw归类的结果给出如下内容IOllv “010001,,内容IOllu “010101,,内容IOllw “010110,,属于同一网格或者分组在同一聚类中的内容IOllu和IOllw在归类的结果中彼此相邻。因此,聚类部103能够根据由面向聚类的内容归类块105进行的归类的结果来识别分组在同一聚类中的内容1011。应该注意,将在后面详细描述由聚类部103和面向聚类的内容归类块105进行的处理。合并部通过利用包括CPU、ROM和RAM的组件实施合并部107。如图6中所示,合并部107 具有后述面向合并的聚类归类块109和相邻性确定块111。面向合并的聚类归类块109把由聚类部103识别的聚类1021归类而相邻性确定块111判断已由面向合并的聚类归类块 109归类的聚类1021是否彼此相邻。随后,合并部107对已由相邻性确定块111确定在地球表面1001上的某个方向上彼此相邻的聚类1021进行合并处理。如将在后面解释的,合并部107进行的合并处理可以是查找次序合并或距离次序合并。另外,为了确定聚类1021 以作为合并处理的主题,合并部107可以在一些情形中利用面向合并的聚类归类块109和相邻性确定块111进行的处理的结果。在此基础上,为了设置合并处理的条件,合并部107 可以参照存储部119中预先存储的预定合并条件设置信息。通过包括CPU、R0M和RAM的组件实施合并部107中采用的面向合并的聚类归类块 109。面向合并的聚类归类块109如下所述基于纬度和经度以排序确定处理的结果为基础在地球表面1001上的某个方向上把聚类1021归类。面向合并的聚类归类块109把归类的结果提供给相邻性确定块111。在此实施例中,上述排序确定处理是进行的以下处理用以在地球表面1001上的某个方向上把网格1031归类以便设置网格1031的归类次序并且把网格1031的归类次序提供给每个都与经归类的网格1031中的一个相关联的聚类1021作为聚类1021的排序。地球表面1001上某个方向的典型示例是东西方向、南北方向、西北东南方向和西南东北方向。通过包括CPU、R0M和RAM的组件实施合并部107中采用的相邻性确定块111。相邻性确定块111判断由面向合并的聚类归类块109在地球表面1001上的某个方向上已归类的聚类1021是否在该方向上彼此相邻。合并部107在用以把聚类1021彼此合并的处理中使用由相邻性确定块111产生的确定结果。在此实施例中,相邻性确定块111进行的用以判断聚类1021是否彼此相邻的相邻性确定处理可以是用以判断每个都包括聚类1021中一个的网格1031是否彼此相邻的处理。下面通过参照图8解释合并部107的功能。图8是按照本公开第一实施例用以把聚类1021彼此合并的处理的以下描述中参照的说明图。图8示出了经度方向上彼此相邻的网格1031x和1031y以及网格1031x和1031y中分别包括聚类的1021x和1021y。在图中示出的典型示例中,可以把彼此相邻的网格1031x和1031y中分别包括的聚类1021x和1021y当作彼此相邻的聚类1021。在此情形中,合并部107可以计算彼此相邻的聚类1021之间的距离d。彼此相邻的聚类1021之间的距离d通常是聚类1021的中心之间的距离d。如果彼此相邻的聚类1021之间的距离d不大于预先确定的阈值,则合并部 107把聚类1021彼此合并成一个聚类。在图中示出的典型示例的情形中,如果当作彼此相邻聚类1021的聚类1021x和1021y之间的距离d不大于预先确定的阈值,则合并部107把聚类1021x和1021y彼此合并成一个聚类1021z。如上所述,如果聚类1021在纬度或经度方向上彼此相邻,则合并部107可以计算聚类1021之间的距离。另外,合并部107可以在不顾及聚类1021是否彼此相邻的情况下计算聚类1021之间的距离。在此基础上,如果聚类1021之间的距离不大于预先确定的阈值,则合并部107可以把聚类1021存储在存储部119中作为合并候选聚类1021而非立即把聚类1021彼此合并。在此情形中,合并部107稍后按从合并候选聚类之中距离最短的合并候选聚类1021开始的次序(即,按合并候选聚类1021之间距离的升序)把合并候选聚类1021彼此合并。应该注意,将在后面详细描述由合并部107、面向合并的聚类归类块109和相邻性确定块111进行的处理。输入部请读者返回参照图6。输入部113是根据实施例的信息处理装置100中采用的典型输入部。通常通过包括CPU、R0M、RAM和输入单元的组件实施输入部113。信息处理装置 100的输入部113中采用的输入单元通常具有用户操作的触摸面板、鼠标和键盘。输入部 113生成表示用户在输入部113上进行的操作的电信号以及把电信号提供给N进制数值生成部101和显示控制部115。具体地,如果用户例如在输入部113上执行操作以做出执行聚类的请求或者做出改变聚类粒度的请求,则输入部113生成表示请求的信息以及把信息提供给N进制数值生成部101和其它部件。显示控制部通常通过包括CPU、R0M和RAM的组件实施显示控制部115。当输入部113通知显示控制部115例如用户已进行操作以做出显示内容1011聚类结果的请求时,显示控制部 115从存储部119等获取内容1011聚类的结果。这是因为聚类部103和合并部107已把这种结果存储在存储部119中。稍后,显示控制部115可以创建聚类结果的图像以及进行控制以在下面要描述的显示部117上显示图像。聚类结果图像的典型示例是先前通过参照图 3解释的图像。
显示部显示部117是根据实施例的信息处理装置100中采用的典型显示部。显示部117 是用于显示各种应用的执行图像以及信息处理装置100可以处理的各种内容等的部件。另外,显示部117还可以显示对各种内容1011执行操作的过程中要使用的各种对象以及显示各种应用的执行状态。按照显示控制部115进行的控制,显示部117的显示屏幕示出各类信息,诸如如同先前通过参照图3描述的一样的聚类结果图像等。存储部存储部119是根据实施例的信息处理装置100中采用的典型存储器件。存储部 119可以用于存储各类数据。存储部119中存储的数据包括信息处理装置100的各类内容数据和与内容数据相关联的各类元数据。另外,存储部119还可以用于存储由N进制数值生成部101生成的二值系统数值、由聚类部103进行的用以把内容1011分组在聚类1021 中的聚类结果以及由合并部107进行的用以把聚类1021彼此合并的合并结果。在此基础上,存储部119还可以用于存储显示控制部115进行的用以在显示部117上显示各类信息的处理中各种应用要运用的执行数据。此外,存储部119还可以用于恰当存储其它信息诸如各种参数、各种中间结果和各种数据库等。在由信息处理装置100执行的一些处理期间需要参数而在信息处理装置100进行的处理的过程中产生中间结果。根据此实施例的信息处理装置100中采用的各种处理部件能够把信息和/或数据自由写入到存储部119中以及以高自由度从存储部119读取出信息和/或数据。信息处理装置的补充信息应该注意,根据实施例的信息处理装置100可以是任何装置,只要装置具有用以从内容1011本身或额外数据文件获取与内容1011相关联的位置信息即可。信息处理装置 100的典型示例包括图像拍摄装置、内嵌有存储器的多媒体内容查看器、便携式信息终端、 便携式游戏终端、手机、数字家用电器和游戏机。图像拍摄装置的典型示例包括数码相机和数码摄像机。便携式信息终端通常可以用于记录以及保存内容以及通常可以用于浏览记录或保存的内容。便携式游戏终端通常再现提供网络上地图的业务以及管理和浏览联合内容的业务。另外,便携式游戏终端通常还具有用于管理图片数据的功能和个人计算机的应用软件。手机通常具有内嵌的摄像器和存储器。数字家用电器通常具有用于管理图片数据的功能和存储器。以上描述解释了信息处理装置100的典型功能。信息处理装置100中采用的配置元件中的每个配置元件可以是通用构件和/或通用电路或者可以是设计成特别用于配置元件功能的一种硬件。另外,CPU可以进行所有配置元件的功能。因而,可以按照随着用于实现实施例的技术水平不断改进的技术水平恰当修改用于实施信息处理装置100的配置。应该注意,可以通过个人计算机等执行被编写成用于实施根据上述实施例的信息处理装置100的功能的计算机程序。另外,可以为用户提供存储计算机程序的记录介质,以使得个人计算机等能够从介质读取出程序。记录介质的典型示例包括磁盘、光盘、光磁盘和闪存。另外,替代把计算机程序存储在记录介质上,还可以通过网络等把计算机程序分发给用户。1-3:合并和聚类的细节接下来,通过参照图9至29,以下描述解释按照本公开第一实施例进行的合并处理和聚类处理的细节。图9示出了表示按照本公开的第一实施例进行的合并处理和聚类处理的流程图。 如先前通过参照图6所述,在根据实施例的信息处理装置100中,合并部107对作为由聚类部103对内容1011进行的聚类处理的结果获得的聚类1021进行合并处理。因此,表示聚类处理和合并处理的流程图以聚类部103进行聚类处理以把内容 1011分组在聚类1021中的步骤SlOl开始。随后,在接下来的步骤S103,合并部107对聚类1021进行合并相关处理。应该注意,合并相关处理是包括合并处理本身和相关处理(包括参数设置)的处理。将在后面详细描述聚类处理和合并相关处理。表I
权利要求
1.一种信息处理装置,包括N进制数值生成部,其中,N = 2、3等,被配置成通过以下方式生成用于每个数据项的组合N进制数值,所述每个数据项的位置信息表示根据针对特征空间设置的D维坐标系统的 D个不同坐标而被规定作为所述数据项在所述特征空间中的位置的位置,其中,D = 2、3等 逐数位地顺次交替布置表示所有所述D个不同坐标的值的数位,每个值都用具有预定数位计数的分量N进制数值表示,所述预定数位计数表示代表所述坐标的所述数位的数量;以及聚类部,被配置成把每个都用满足以下条件的所生成的组合N进制数值表示的所述数据项分组在同一聚类中所述组合N进制数值中的每个都具有为所述数据项共有的k个最闻有效数位,其中,k = 1、2等。
2.如权利要求I所述的信息处理装置,其中,如果关系k= DXm成立,其中,m = 1、2 等,则所述聚类部把每个都用满足以下条件的所生成的N进制数值中的一个表示的所述数据项分组在聚类的Nd子树结构的第m层上的同一聚类中所述组合N进制数值中的每个都具有为所述数据项共有的k个最高有效数位。
3.如权利要求I所述的信息处理装置,其中,所述聚类部具有面向聚类的内容归类块,被配置成按每个都由所述N进制数值生成部针对所述数据项中的一个生成的所述N进制数值的次序对所述数据项进行归类,所述聚类部根据由所述面向聚类的内容归类块进行的所述归类的结果来识别要分组在同一聚类中的所述数据项。
4.如权利要求3所述的信息处理装置,其中,所述聚类部通过根据所述聚类中出现的所述第一数据项的位置和分组在所述聚类中的数据项的数量创建聚类识别信息,来生成用于针对所述归类的所述结果识别聚类的所述聚类识别信息。
5.如权利要求I所述的信息处理装置,其中,所述信息处理装置进一步包括面向合并的聚类归类块,被配置成根据基于所述D维坐标系统的所述D个不同坐标的第一排序确定处理的结果,来在所述特征空间中的第一方向上把所述聚类归类;聚类相邻性确定块,被配置成判断在所述第一方向上归类的所述聚类是否在所述第一方向上彼此相邻;以及聚类合并部,被配置成把确定为在所述第一方向上彼此相邻的聚类合并。
6.如权利要求5所述的信息处理装置,其中所述面向合并的聚类归类块根据基于所述D维坐标系统的所述D个不同坐标的第二排序确定处理的结果,来在所述特征空间中的第二方向上把所述聚类归类;所述聚类相邻性确定块判断在所述第二方向上归类的所述聚类是否在所述第二方向上彼此相邻;以及所述聚类合并部进一步把确定为在所述第二方向上彼此相邻的聚类合并。
7.如权利要求5所述的信息处理装置,其中所述特征空间是地球的表面;所述D维坐标系统的所述D个不同坐标是用作二维坐标系统的两个坐标的纬度坐标和经度坐标;所述聚类是以下区域具有根据所述二维坐标系统的所述两个坐标在所述地球的所述表面上定义的网格中包括的所述数据项的位置的信息;以及所述第一排序确定处理是以下处理被执行以在所述第一方向上把所述网格归类以便设置所述网格的归类次序,并向每个都与所归类的网格中的一个相关联的聚类提供所述网格的所述归类次序作为所述聚类的排序。
8.如权利要求I所述的信息处理装置,其中所述特征空间是三维空间;所述D维坐标系统的所述D个不同坐标是用作正交坐标系统的三维坐标系统的三个坐标;以及所述聚类是以下区域具有依据所述三维坐标系统的所述三个坐标在所述三维空间中定义的块中包括的所述数据项的位置的信息。
9.一种信息处理方法,包括通过以下方式生成用于每个数据项的组合N进制数值,其中,N = 2、3等,所述每个数据项的位置信息表示根据针对特征空间设置的D维坐标系统的D个不同坐标而被规定作为所述数据项在所述特征空间中的位置的位置,其中,D = 2、3等逐数位地顺次交替布置表示所有所述D个不同坐标的值的数位,每个值都用具有预定数位计数的分量N进制数值表示,所述预定数位计数表示代表所述坐标的所述数位的数量;以及把每个都用满足以下条件的所生成的组合N进制数值表示的所述数据项分组在同一聚类中所述组合N进制数值中的每个都具有为所述数据项共有的k个最高有效数位,其中,k = 1、2 等。
10.一种由计算机执行的信息处理程序,用以执行以下处理通过以下方式生成用于每个数据项的组合N进制数值,其中,N= 2、3等,所述每个数据项的位置信息表示根据针对特征空间设置的D维坐标系统的D个不同坐标而被规定作为所述数据项在所述特征空间中的位置的位置,其中,D = 2、3等逐数位地顺次交替布置表示所有所述D个不同坐标的值的数位,每个值都用具有预定数位计数的分量N进制数值表示,所述预定数位计数表示代表所述坐标的所述数位的数量;以及把每个都用满足以下条件的所生成的组合N进制数值表示的所述数据项分组在同一聚类中所述组合N进制数值中的每个都具有为所述数据项共有的k个最高有效数位,其中,k = 1、2 等。
11.如权利要求10所述的信息处理程序,所述程序被所述计算机执行以进一步执行以下处理根据基于所述D维坐标系统的所述坐标的第一排序确定处理的结果,在所述特征空间中的第一方向上把所述聚类归类;判断在所述第一方向上归类的所述聚类是否在所述第一方向上彼此相邻;以及把确定为在所述第一方向上彼此相邻的聚类合并。
12.如权利要求11所述的信息处理程序,所述程序被执行以执行把聚类合并的所述处理,作为包括如下处理的处理计算所述聚类中任何两个聚类之间的距离;以及如果计算出的所述两个聚类之间的距离不大于预先确定的阈值则把两个聚类彼此合并。
13.如权利要求11所述的信息处理程序,所述程序被执行以执行把聚类合并的所述处理,作为包括如下处理的处理计算所述聚类中任何两个聚类之间的距离;如果计算出的所述两个聚类之间的距离不大于预先确定的阈值则把任何两个聚类存储在存储器中作为合并候选聚类;以及按以所述合并候选聚类之间距离小的所述合并候选聚类开始的次序把从所存储的合并候选聚类中选择的聚类彼此合并。
全文摘要
一种信息处理装置、信息处理方法和信息处理程序,所述信息处理装置包括N进制数值生成部,其中,N=2、3等,被配置成通过以下方式生成用于每个数据项的组合N进制数值,每个数据项的位置信息表示根据针对特征空间设置的D维坐标系统的D个不同坐标而被规定作为数据项在特征空间中的位置的位置,其中,D=2、3等逐数位地顺次交替布置表示所有D个不同坐标的值的数位,每个值都用具有预定数位计数的分量N进制数值表示,预定数位计数表示代表所述坐标的数位的数量;以及聚类部,被配置成把每个都用每一个都具有为数据项共有的k个最高有效数位的所生成的组合N进制数值中的一个表示的数据项分组在同一聚类中,其中,k=1、2等。
文档编号G06K9/62GK102591903SQ20111037632
公开日2012年7月18日 申请日期2011年11月18日 优先权日2010年11月26日
发明者望月大介 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1