用于对数据库中的数据对象进行分类的方法和设备的制作方法

文档序号:6412673阅读:229来源:国知局
专利名称:用于对数据库中的数据对象进行分类的方法和设备的制作方法
技术领域
本发明涉及一种用于对数据库中的数据对象进行分类的方法,所述数据对象具有与其相关联的至少一个源参数。
本发明还涉及一种用于对数据库中的数据对象进行分类的设备,所述数据对象具有与其相关联的至少一个源参数,所述设备包括一个用于存储所述数据库的存储装置,用于接收数据对象的装置,和中央处理单元。
背景技术
这种方法已知于欧洲专利申请EP-A-0 959 418。该文献给出了使用这种方法的数字图像检索系统。所述系统包括其中存储了多个数字图像的图像数据库,所述多个数字图像中的每一个具有与其相关联的多个参数中的至少一个。所述参数可以表示取得所述图片地方的地理位置,取得所述图片的日期和/或所述图像的其它属性。可以通过直接查询,比如给定时间和日期,还可以通过‘映射查询’输入可以被译为时间范围5pm-8pm的像“傍晚”之类的查询来检索所述图像。
同时,可以输入像“纽约的夏天”之类的查询。在这种情况下,将要检查日期和地理位置的参数。对于第一参数,表示所述日期,必须搜索所有的图像所述第一参数值是否在时期六月21-九月23内。对于第二参数,表示所述地理位置,必须搜索所有的图像第二参数值是否匹配‘纽约’。当由坐标表示所述地理位置时,对于它们所处的范围甚至必须检查两个值。
任何所属技术领域的技术人员将认识到这会严重地减慢所述图像检索过程,尤其当输入具有多个变量的查询时。

发明内容
本发明的目标是提供一种能够降低搜索与检索时间的分类方法。
依照本发明的所述方法,通过把分类参数与所述数据对象相关联来实现这一目标,其中当源参数值满足至少一个标准时把所述分类参数与所述数据对象相关联。
用这种方法,可以在查询和搜索之前分类数据对象,并且一次搜索可以只针对一个参数,所述分类参数。这高度地降低了所述搜索时间,在输入具有多个变量的查询之时尤其如此。这与现有技术相比是一个主要优点。
在依照本发明方法的实施例中,所述数据库包括具有至少一个另外源参数的另外数据对象,所述另外源参数与其相关联,并且所述方法包括以下步骤识别具有至少一个另外分类参数的相似的另外数据对象,所述另外分类参数与每个相似的数据对象相关联,其中所述相似的另外数据对象的分类参数具有相等的值;识别具有相等另外分类参数的另外相似数据对象的另外源参数值的相似性;并且当所述数据对象与所述另外数据对象相似时把所述另外分类参数与所述数据对象相关联。
该实施例的优点是使用依照本发明所述方法的实施例,一旦已经分类了几个数据对象,就可以识别用于把具有预先确定值的分类参数与数据对象相关联的标准-相似性标准-,并且可以分类其它数据对象。该实施例的优点是用这种方法可以使分类数据对象自动化。
在依照本发明所述方法的实施例中,在另一数据库中存储所述另外分类参数值和相似性,作为用于把新的数据对象与所述另外分类参数值相关联的标准。
通过存储用于把数据对象与分类参数相关联的标准,所述分类参数具有在像表之类的另一数据库中的预先确定值,每一次必须分类数据对象时不一定非从所述数据库中查找相似性的标准不可。这降低了分类数据对象所需要的时间,在大规模的数据库中尤其如此。
在依照本发明的所述设备中,所述中央处理单元被设计成在所述源参数满足至少一个标准时把分类参数与所述数据对象相关联。
本发明的实施例是一种计算机可读介质,包括可由计算机读取并执行的指令,其中所述指令使计算机能执行在权利要求1中所定义的方法。


现在将借助于附图介绍本发明的实施例,其中图1示出了包括数据对象的数据库,所述数据对象具有与其相关联的源参数;图2示出了包括数据对象的数据库,所述数据对象具有与其相关联的源参数和分类参数;图3示出了包括数据对象分类标准的表;图4示出了描述依照本发明的方法实施例的流程图;图5示出了具有外围设备的依照本发明所述设备的实施例;图6示出了依照本发明的计算机可读介质的实施例。
具体实施例方式
图1示出了包括若干数据对象102、104、106、108、110、112、114、116、118的数据库100。可以把该数据库存储在以下将讨论的设备中。所述数据对象102、104、106、108、110、112、114、116、118可以是静止图片图像、视听数据流或文本文档。那些本领域内技术人员将理解该列表不是限制性的。在这里描述的实施例中,所述数据对象是静止图片图像-特别是照片和视听数据流。在这些图中,把所述照片表示成大的正方形,而把视听数据流表示成大的三角形。
所述照片与源参数相关联,例如所述照片104与第一源参数151、第二源参数152和第三源参数153相关联。所述源参数提供关于所述数据来源的信息。该信息涉及所述数据对象的地理位置、所述数据对象的创建日期、所述数据对象的创建时间、所述数据对象的创建者姓名或所述数据对象的格式,但是源参数还可以提供其它信息。所述数据格式参数可以涉及压缩格式(例如GIF或JPEG)或数据种类(例如照片或视听数据流)。在本发明一个实施例中,所述源数据涉及所述数据对象的内容。例如,通过面部分析程序分析照片来产生图中人的姓名。在分析之后把图片中人姓名的源参数与所述图片相关联。为了简化起见,在图1中只示出了三个源参数。
尽管所述源参数可以很好地描述所述数据对象源,但是单个源参数往往不会给出关于所述照片或流内容的很多情况。然而,大量参数值可以很好地给出关于所述照片内容的指示。例如,由称作Peter的某人在2001年四月在坐标北53°,东4°拍摄的照片可指示“在阿姆斯特丹的假日”。因此,当寻找涉及特殊事件的照片和流时,可以在数据库100上运行对于若干源参数的若干标准的查询。然而,这可能是相当大的任务,在定义具体城市的坐标或指示国家的坐标的范围之时尤其如此。为使所述搜索便于进行提出了几种设想,例如通过令用户在地图上画一区域来定义它或将诸如“夏天”等查询映射到从六月21日至九月22日的时间段上。这使搜索一定的照片便于进行,但是它在查询时需要大量处理,这是由于必须读取并比较所有的数据对象,四个参数格式、日期、位置、创建者。这需要用户相当多的耐心。
因此,建议使用户以及用于存储所述数据库100的系统能通过把照片和流与至少一个分类参数相关联来分类它们。这意味着由称作Peter的某人在2001年四月在坐标北53°,东4°拍摄的所有图片都与所述参数“在阿姆斯特丹的假日”相关联。这高度地简化了在阿姆斯特丹拍摄的假日图片的搜索,这是因为只需读取并比较所有数据对象的一个参数,分类参数。
图2示出了如图1所示的相同数据对象,但是除图1之外,在图2中的一些数据对象具有与它们相关联的一或两个分类参数。第一分类参数202与格式图片的数据对象相关联,所述图片由称作Peter的某人在2001年四月在阿姆斯特丹创建。第二分类参数204与数据对象相关联-不管所述数据格式-,所述数据对象在2001年春天在欧洲创建。这样做的原因是这一与分类的关联提高了搜索所述数据库100的可能性。在所述数据库100中只检查所有数据对象中一个分类参数值比检查多个源参数值更容易。此外,对用户来说以自然语言输入查询而不是输入指定一个或多个源参数值处于一定范围内的查询更方便。
因此,为了提高搜索与检索功能和数据库100的用户友好性,当至少一个源参数匹配至少一个标准时,数据对象与预先确定的分类参数相关联-像在2001年夏天到中国的假日旅行的照片-。在优选实施例中,当把数据对象输入所述数据库100时完成这个以便减少以后阶段的处理。然而,当同时输入多个数据对象时,这会花费很长时间,这是因为大量处理功率由所述关联过程所耗用了。因此,在另一实施例中,在已经输入这些对象后,关联就作为后台任务进行。
可以在另外数据库-像在图3中的表300中存储用于数据对象的一个或多个源参数的一个或多个值的标准,所述标准适宜于把具有一定值的分类参数与所述数据对象相关联。所述表300左边列表示分类参数值。表300的第一行表示源参数的实体。在本发明的这个实施例中,所述实体是所述数据对象创建的位置“loc”,文献创建的时间“tme”,创建的日期“dt”和创建者“crtr”。
在所述关联过程期间,把数据对象的源参数值与在所述表300中的标准相比。当所述数据对象创建的位置在范围R1之内时,所述日期等于值V1并且创建者等于V2,把所述数据对象与具有值C1的分类参数相关联。如前所述,可以把数据对象与一个以上分类参数相关联。当所述数据对象的位置在范围R3之内并且所述时间在范围R4之内时,把所述源参数与具有另外值C3的另外分类参数相关联。
所述表300可以由用户创建。同时它还可以由过程创建,借助于在图4中的流程图400描述了所述过程。该过程是依照本发明方法的实施例。假定具有将要分类的数据对象的数据库已经包含分类的数据对象。可以由用户或设备使用例如在图3中给出的表300来分类这些数据对象。
所述过程从过程步骤401通过选择将要分类的数据对象开始。所述过程步骤401步骤可以通过把所述数据对象输入到所述数据库中开始。随后,在过程步骤402中,搜索已经被分类的数据对象。在过程步骤403中,把已经分类的数据对象按分类参数值以组加以排序。如前所述,数据对象可以具有与其相关联的多个分类参数。在那种情况下,在多个组中排序数据对象。
当所述数据对象已经按至少一个分类参数的每个相等值分组时,在过程步骤404中标识具有所述分类参数相等值的数据对象的相似性。所述过程步骤404包括两个子步骤。对数字源参数执行子步骤405而对字母数字源参数执行子步骤406,在所述子步骤405中,为具有相等的所述分类参数值的数据对象的每个数字源参数确定数值范围。用这种方法确定的范围被认为是相似性的标准。在所述子步骤4 06中,确定每个字母数字源参数的值。当一定的字母数字源参数的所有值具有相等值时,该值被认为是相似性的标准。
下一步骤是过程步骤407,它同样包括两个子步骤。在所述过程步骤407中,检查将要分类的所述对象是否与已经被分类的所述数据对象中的任何一个相似。在子步骤408中,检查所述数字源参数的值是否在为那些相应源参数的相似性定义的范围之内。如已经解释的,在所述子步骤405中已经定义了这些范围。在子步骤409中,检查所述字母数字源参数的值是否等于为这些相应源参数的相似性定义的值。在所述子步骤406中已经定义了这些值。
在进一步的实施例中,所述字母数字源参数的值是字,并且其同义词和以其它语言表述的字,也认为相等并因而相似。
在依照本发明方法的又一实施例中,当字母数字值匹配超过例如90%之类的给定值时,便满足所述相似性标准。
在过程步骤410中,组合所述子步骤408和所述子步骤409的结果。随后,在判定步骤411中,检查对于一个分类参数是否子步骤408和子步骤409的所有测试具有正面结果。这意味着要分类的数据对象的所有源参数的所有值符合相似性的所有标准。当的确是这种情况时,把所述数据对象与分类参数相关联,使所述分类参数的位匹配所有相似性标准。这在过程步骤420中执行。此后,在终止框412中结束所述过程。
当在所述判定步骤411中检测到并不是所有的所述子步骤408和所述子步骤409的测试具有正面结果时,在所述判定步骤411之后在终止框412中结束所述过程。
本发明的其它各个实施例把刚才描述的实施例作为出发点。在进一步的一个实施例中,当检查将要分类的数据对象是否与已经分类的数据对象相似时,只检查一定的预先确定的源参数的值而不是要分类的数据对象的所有源参数的值。
在本发明又一进一步的实施例中,把在流程图400的过程步骤404中得到的相似性的标准存储在表或另一形式的数据库中。可以像在图3中表300那样建立该表。在本发明又一实施例中,用进一步的过程步骤扩展流程图400。该过程步骤可以在所述过程步骤401和所述过程步骤402之间。在进一步过程步骤中,检查具有相似性标准的所述表在要分类的数据对象和具有一定分类参数值的数据对象之间是否具有相似性,所述相似性标准已经存储在所述表中。当没有找到相似性时,继续由流程图400描述的过程。
在本发明的又一更进一步的实施例中,通过只执行所述过程步骤404并且更新如在先前实施例中所描述的表来周期地识别相似性标准。当数据对象被输入到数据库中或被作为另外的分类目标时,只检查在所述表中的相似性标准以便确定是否应该对所述数据对象进行分类并且如果是这样的话应该如何对所述数据对象进行分类。
在依照本发明所述方法的再一个更进一步的实施例中,还可以人工地把分类参数与数据对象相关联。相似地,还可以人工地解除分类参数与数据对象之间的关联。当一个数据对象是在数据库中将要分类的第一个时,人工地把分类参数与该数据对象相关联就可以初始化所述自动分类过程。当解除分类参数与数据对象之间的关联时,这种方法优选地要引起注意,采用该方式使得在将来不把相似的数据对象与所述分类参数相关联。
图5示出了设备500作为依照本发明所述设备的实施例。所述设备500包括中央处理单元、CPU 501、缓冲器503、像硬盘之类的大容量存储装置502和视频处理器504。所述设备500还包括用于接收数据对象的第一连接器511、用于接收用户输入的第二连接器512和用于向电视机540提供视频信号的第三连接器513。
所述设备500按照如下操作。所述缓冲器503接收来自数字照片照相机520的数据对象,所述数字照片照相机520连接到第一连接器511。该数据对象可以是照片或视听数据流。在所述缓冲器503中,读取所述数据对象的源参数。由CPU 501处理所述结果,所述CPU 501检查是否可以分类所述数据对象并且如果是这样的话如何对所述数据对象进行分类。所述分类过程可以是如参考图4描述的、依照本发明的方法中的任何一个实施例。
当可以根据已知的相似性标准对所述数据对象进行分类时,把在所述缓冲器503中的数据对象与分类参数相关联,并且将其存储在大容量存储装置502中。
可以自动地处理借助于数字照片照相机520创建的数据对象的分类和存储。然而,也可以由用户使用包括键盘531和轨迹球532的输入装置530来完成所述分类。所述用户输入装置530还可以用于通过向如在图3中给出的表300中增加数据来创建分类的相似性标准。
可以在电视机540的屏幕541上给出存储在大容量存储装置502中的所述数据对象。用户可以借助于用户输入装置530和在所述屏幕541上示出的图形用户界面GUI(未示出)来选择一个或多个数据对象。当选择存储在大容量存储装置502中的数据对象时,把所述数据对象加载到所述视频处理器504中。所述视频处理器504处理所述数据对象以便在所述电视机540上提供可呈现的信号。用这种方法,借助于所述数字照片照相机520创建的图像或视听流可以在所述电视机540的屏幕541上展示。在进一步的实施例中,所述电视机540可以由远程显示器代替,所述远程显示器经由网络连接到所述设备500。
对存储在大容量存储装置500中的数据对象的查询可能是大量的。例如,用户可以通过输入寻找具有匹配值的分类参数的查询来输入检索2002年夏天在巴黎由她自己所拍摄的所有照片的查询。然而,也可以把所述查询指向源参数,不过不言而喻的是,搜索分类参数的一个值比搜索若干源参数的一定值所花的时间要少。
如所解释的那样,所述设备500是用于执行依照本发明方法的专用设备。在本发明进一步的实施例中,像个人计算机之类的通用计算单元的中央处理单元被编程来执行依照本发明的所述方法。把编程所述中央处理单元的指令存储在记录载体上。
在图6A和图6B中示出了这两者。图6A示出了软盘610作为包括计算机可读和可执行的依照本发明指令的记录载体的实施例。借助于所述软盘驱动器621可以由个人计算机620读取在所述软盘610上的信息。经由所述软盘驱动器621把存储在所述软盘610上的指令发送到中央处理单元,CPU 622,以便使所述CPU 622能执行依照本发明的方法。
所述CPU 622控制输入缓冲器623,数字照片照相机624可以借助于连接器625连接到其上。在给出的实施例中,所述连接器和在所述数字照片照相机624和所述个人计算机620之间的连接均为USB类型。
如所解释的,由所述CPU 622读取的、在所述软盘610上的指令使所述CPU 622能执行依照本发明的方法并且分类在所述输入缓冲器623中的数据对象。关于是否分类以及如果是这样的话如何分类所述数据的信息被存储在由所述个人计算机620包括的硬盘626上。在对所述数据对象进行分类之后或在由于没有找到分类的匹配标准而决定不分类之后,把所述数据对象存储在硬盘系统626中。从所述硬盘系统626中,可以检索到所述数据对象以供更进一步的使用。
本发明概括如下
增大存储介质的容量就能够得到更大规模的数据库。这要求高效的分类方法以便增强对像图片和电影之类的数据对象的检索。图片可以携带与创建的日期、时间和位置相关的元数据。这有助于检索,但是由于必须检查大量的元数据,所以组合式的查询就妨碍了快速的搜索与检索。本发明提出一种通过把所述数据对象与分类参数相关联来分类所述数据对象的方法。当一个或多个元数据参数的值落在一定的范围之内时,把每个分类参数与数据对象相关联。有利的实施例通过从所述数据库本身中提取分类标准来提供自动分类的可能性。通过检查在具有相同值的数据对象之间的、用作分类参数的相似性来完成这些。相似性是基于与例如数据对象的创建相关的元数据的值。
权利要求
1.一种用于对数据库中的数据对象进行分类的方法,通过把分类参数与所述数据对象相关联来进行,所述数据对象具有与其相关联的至少一个源参数,其中当所述源参数值满足至少一个标准时,把分类参数与所述数据对象相关联。
2.如权利要求1所述的方法,其中当把所述对象输入所述数据库中时,把所述分类参数与所述数据对象相关联。
3.如权利要求1所述的方法,其中所述标准是所述源参数值处于预先确定的范围之内。
4.如权利要求3所述的方法,其中所述源参数代表所述数据对象的创建的地理位置,并且所述标准为所述源参数值是诸如所述数据对象的创建已经发生在一个预先确定的区域中。
5.如权利要求1所述的方法,其中所述标准是所述源参数值等于预先确定值。
6.如权利要求1所述的方法,其中所述数据库包括具有至少一个另外源参数的另外数据对象,所述另外源参数与另外数据对象相关联,并且其中所述方法包括以下步骤识别具有至少一个另外分类参数的相似的另外数据对象,所述另外分类参数与每个相似的数据对象相关联,其中所述相似的另外数据对象的另外分类参数具有相等的值;识别具有相等另外分类参数的另外相似数据对象的另外源参数值的相似性;当所述数据对象与所述另外数据对象相似时把所述另外分类参数与所述数据对象相关联。
7.如权利要求6所述的方法,其中在另外数据库中存储所述另外分类参数值和相似性,作为用于把新的数据对象与具有该值的所述另外分类参数相关联的标准。
8.如权利要求7所述的方法,其中所述方法包括搜索所述另外数据库以便检查所述数据对象的源参数是否匹配在所述另外数据库中存储的至少一个标准的步骤。
9.如权利要求6所述的方法,其中所述另外源参数值是字母数字串并且将相似性视为是具有相等值的另外源参数。
10.如权利要求6所述的方法,其中所述另外源参数值是数值,并且将相似性视为是另外源参数,所述另外源参数在预先确定的范围内具有其值。
11.如权利要求3所述的方法,其中所述源参数代表以下实体中的至少一个所述数据对象的创建的地理位置所述数据对象的创建的日期所述数据对象的创建的时间所述数据对象的创建者的名字所述数据对象的数据格式。
12.如权利要求1所述的方法,其中所述分类参数相当于一个事件。
13.如权利要求1所述的方法,其中所述数据对象是静止图片图像。
14.如权利要求1所述的方法,其中所述数据对象是视听信息流。
15.如权利要求1所述的方法,其中由用户把所述分类参数与所述数据对象相关联。
16.如权利要求1所述的方法,其中把所述标准存储在另外数据库中。
17.一种用于对数据库中的数据对象进行分类的设备,所述数据对象具有至少一个源参数,所述源参数与所述数据对象相关联,所述设备包括用于存储所述数据库的存储装置,用于接收数据对象的装置和中央处理单元,其中所述中央处理单元被设计成在所述源参数满足至少一个标准之时能把分类参数与所述数据对象相关联。
18.一种计算机可读介质,包括由计算机可读并可执行的指令,其中所述指令使计算机能执行如权利要求1所述的方法。
全文摘要
增加存储介质的容量就能够得到更大的数据库。这要求高效的分类方法以便增强对像图片和电影之类的数据对象的检索。图片可以携带与创建的日期、时间和位置相关的元数据。这有助于检索,但是由于必须检查大量的元数据,所以组合式查询就妨碍了快速的搜索与检索。本发明提出一种通过把所述数据对象与分类参数相关联来分类所述数据对象的方法。当一个或多个元数据参数的值落在一定的范围之内时,把每个分类参数与数据对象相关联。有利的实施例通过从所述数据库本身中提取分类标准来提供自动分类的可能性。通过检查在具有相同值的数据对象之间的、用作分类参数的相似性来完成这一点。相似性是基于与例如数据对象的创建相关的元数据的值。
文档编号G06F12/00GK1666200SQ03816077
公开日2005年9月7日 申请日期2003年6月27日 优先权日2002年7月9日
发明者M·P·博德拉恩德 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1