检索装置和检索方法

文档序号:6366040阅读:147来源:国知局
专利名称:检索装置和检索方法
技术领域
本发明涉及检索装置和检索方法。
背景技术
日本未审查专利申请公开No. 2006-209431公开了一种用于通过缩小必要相关文档的检索范围来对想要的文档以及与该文档相关的文档进行检索的装置。该公开的装置包括节点指定单元,其从显示器上显示的管理系统中的节点中指定其中将要登记文档的节点;以及信息指定单元,其指定关于与文档相关的相关文档的属性信息并指定用于指示关联的重要性的关联重要性信息。该装置在通过节点指定单元指定的节点中,对将要登记的文档的文档文件进行登记,并且还对关于将要登记的文档的属性信息、以及已经通过信息指定单元指定的相关文件的属性信息和关联重要性信息进行登记。日本未审查专利申请公开No. 2006-209431进一步描述了在接收到作为检索关键字的关于相关文档的属性信息时对与该属性信息匹配的相关文档进行检索。日本未审查专利申请公开No. 2006-209431还描述了对与想要的文档相关的相关文档进行递归检索。日本未审查专利申请公开No. 2006-209431进一步公开了在接收到作为检索关键字的关联重要性信息时缩小检索的相关文档的范围以检索与关联重要性信息相匹配的相关文档。

发明内容
因此,本发明的目的在于提供具有图形数据结构的数据库,其图形数据结构具有表示数据元素的节点以及表示数据元素之间的关系的链路,其中基于由用户指定的根节点对经过具有特定属性的节点的关系的串联路径进行确定。根据本发明的第一个方面,提供了一种检索装置,包括图形存储器、根节点指定接收单元、以及检索单元。图形存储器存储图形的数据,其具有表示数据元素的节点以及表示数据元素之间关系的链路。根节点指定接收单元接收从图形中的节点中指定的根节点。检索单元对与目标节点通过链路相连接并且满足检索条件的相邻节点进行检索,其检索条件为目标节点和相邻节点中的至少一个节点具有预定的属性。检索单元使用根节点作为目标节点对满足检索条件的相邻节点进行检索。进一步地,检索单元迭代地执行处理以检索满足检索条件的相邻节点,其中使用满足检索条件并且已经在前一检索中被确定的前一相邻节点作为接下来的迭代的目标节点,从而获得相邻节点的串联,并输出获得的相邻节点的串联。根据本发明的第二个方面,在检索装置中,检索条件包括其中目标节点和相邻节点中的至少一个节点具有预定的属性的条件,以及其中目标节点和相邻节点之间的链路具有至少一种预定类型中的任意一种类型的条件。根据本发明的第三个方面,在检索装置中,根节点指定接收单元接收第一指定根节点和第二指定根节点,并且检索单元对满足检索条件的相邻节点的串联进行检索,相邻节点的串联将所述第一指定根节点串联到所述第二指定根节点。
根据本发明的第四个方面,在检索装置中,检索单元获得满足检索条件的相邻节点的多个串联,并且按照从相邻节点的多个串联中具有最小的链路数目的串联开始的顺序呈现相邻节点的多个串联。根据本发明的第五个方面,提供了一种检索方法,包括存储图形的数据,其中所述图形具有表示数据元素的节点以及表示数据元素之间关系的链路;接收在图形中的节点中指定的根节点;以及对通过链路与目标节点相连接并且满足检索条件的相邻节点进行检索,其检索条件为目标节点和相邻节点中的至少一个节点具有预定的属性。该检索包括使用根节点作为目标节点对满足检索条件的相邻节点进行检索;迭代地执行处理以检索满足检索条件的相邻节点,其中使用前一相邻节点作为接下来的迭代的目标节点,从而获得相邻节点的串联,前一相邻节点是满足检索条件的节点并且已经在前一检索中被确定;以及输出获得的相邻节点的串联。根据本发明的第一个方面或第五个方面,基于由用户指定的根节点可以对经过具有特定属性的节点的关系的串联的路径进行确定。根据本发明的第二个方面,只有具有经由有限类型的链路的串联的路径能够被检索。根据本发明的第三个方面,可以确定从第一指定根节点到第二指定根节点的路径。根据本发明的第四个方面,可以从与根节点具有最深关系(或者最小链路数目)的串联开始按照顺序对串联进行呈现。


下面基于附图详细描述本发明的示例性实施例,其中图1A图示出其中具有特定属性的节点与目标节点相连接(或相邻)的子图;图1B图示出其中具有特定属性的节点与目标节点相连接(或相邻)的子图;图2图示出其中从目标节点开始具有特定属性的两个相邻节点串联在一起的子图;图3图示出如下路径的示例,其中起点节点和终点节点通过具有特定属性(“人物”)的节点被串联在一起;图4是根据一个示例性实施例的检索装置的示例的功能性框图;图5图示出数据库中包含的数据的示例;图6是图示出检索处理单元的整体处理流程的示例的流程图;图7是图示出由检索处理单元执行的用于相邻节点处理的流程的示例的流程图;图8图示出由检索处理单元确定的路径信息的示例;以及图9是图示出排序单元的处理流程的示例的流程图。
具体实施例方式有许多可用的方法来对定义数据元素之间的关系的图形结构进行描述。一种这样的方法是资源描述框架(Resource Description Framework, RDF),其为用于使用主语、谓语和宾语的集合(称为三元组)对事件(即,资源,包括具体的事件和抽象概念)之间的关系进行描述的框架。在RDF中,将其中作为主语或宾语的事件是节点并且谓语是链路(或边缘)的图形表示为三元组的集合的形式。SPARQL协议和RDF查询语言(SPARQL)是用于对以RDF形式书写的数据进行检索的计算机语言的一个示例。在如下示例性实施例中,通过示例的方式,对具有根据RDF描述事件之间的各种关系的数据的数据库进行了检索。RDF仅仅是表示事件之间的关系的方法的一个示例,并且如下的示例性实施例可以采用任何数据库以使用RDF之外的其他方法来表示这些关系。给出如下的实施例用以帮助对于示例性实施例中公开的技术的理解。假设用户A已经检索了数据库并且找到了电子文档X。但是,用户A无权访问电子文档X,并且没有被授权读取电子文档X。在这种情况下,如果用户A熟悉一个有权访问电子文档X的人,则用户A可以请求这个人将包含在电子 文档X中的内容教导给用户A。如果用户A与有权访问电子文档X的人不是直接相熟,例如,如果人物D是人物C的同事,人物C是人物B的同事,人物B是用户A的直接熟人,而人物D有权访问电子文档X,则用户A可以采取行动,例如通过如用户A通过人物B联系人物C并通过人物C进一步联系人物D这样的熟人网络来联系人物D,以请求人物D将包含在电子文档X中的内容教导给用户A。此外,如果参与了其中人物B (用户A的直接熟人)所参与的会议Y的人物C有权访问电子文档X,则人物B可以通过参与了会议Y的友谊关系来联系人物C而不论人物B和人物C是否为直接的熟人或者同事,因此,用户A可以采取行动,例如通过人物B来联系人物C,以请求人物C将包含在电子文档X中的内容教导给用户A。因此,一旦在数据库中找到上述通过熟人、同事等等网络的用户A和电子文档X之间的关系的串联,其中根据RDF对包括人物和抽象概念的事件之间的、事件之间的、以及抽象概念之间的各种关系进行了描述,用户A可以在沿着串联路径追踪各个人物的同时访问电子文档X。该路径是串联到具有属性“是人物”的事件(例如,人物B)的路径,或者串联到具有与具有属性“是人物”的事件之间的关系的事件(例如,人物C参与的会议Y)的路径。应该注意到,将数据“C是一个人物”表示为主语是“C”、谓语是“具有(宾语)的属性/是(宾语)的类的成员”、以及宾语是“人物”的三元组。在示例性实施例中,在表示事件之间具有一组关系的图形结构的数据库中,对上述涉及到这样特定属性的事件之间的关系的串联路径进行确定。现在将会给出关于确定串联路径的方法的整体上的描述。例如,如果用户A希望知道与电子文档X相关联的“人物”的串联,则用户A将具有属性“人物”的条件设置为用于在检索装置中缩窄路径检索结果的检索条件。可以通过例如,展示存储在检索装置中的一组属性(“人物”、“文档”、“会议”、“组织”等等),并提示用户A选择一个属性以对条件进行设置。将要存储在检索装置中的属性可以是那些属于例如RDF词汇的属性,或者可以是在检索装置中单独定义的那些属性。例如,当使用SPARQL检索具有属性“人物”的节点时,可以使用如下的检索式Select p where{ p rdf: type foaf:Person. }在上述语句中,“rdf:type”意味着用于声明资源的性质的资源是类的成员(实例),并且“rdf: ”指明了在RDF模型中使用的命名空间。在“RDF Vocabulary DescriptionLanguage1. O: RDF Schema,,,World Wide Web Consortium(W3C) Recommendation (参见http://www. w3. org/TR/rdf-schema/)中总结了命名空间的详细规定。
同样地,“foafzPerson”指明了表示“人物”的资源。对“foaf:Person”的定义遵循 “FOAF Vocabulary Specification。· 9” (参见 http://xmlns. com/foaf/0.1/)。在以RDF的方式书写的图形数据库中,当具体的节点(从这里开始被称为“目标节点”)被定义为〈someUri>,可以使用如下的语句对具有目标节点作为对象的节点进行检索Select n where{ η pred<someUri>}上述检索式的结合,例如如下的检索式,允许对具有作为宾语的目标节点并且具有特定属性“人物”的节点(从这里开始表示为“subj-n”)进行检索。节点subj-n是与目标节点〈someUri>相邻的节点。<检索式1>Select subj-n where{ subj-n predl<someUri>. subj-n rdf: type foaf: Person.}检索式I表示具有节点和链路的子图,如图1A所图示出的。在图1A中,通过椭圆形来表示节点,并且通过连接椭圆形的箭头来表示链路。即,在图1A所示的子图中,节点subj-n具有指定为〈someUri〉的资源作为宾语,并且还具有属性“人物”(=foaf:Persontype)。在上述描述的检索式I中,链路(谓语)“predr’是一个变量,并因此任何链路均与“predl”相匹配(即,subj-n和〈someUri〉之间的关系是不受限制的)。另外在上述描述的检索式I中,节点“subj-n”是一个变量,并且与上述描述的子图相匹配的节点“subj-n”是检索结果。例如,如果在RDF数据库中将电子文档X书写为资源〈someUri〉,则资源“subj-n”与电子文档X之间具有表达为性质“predl”(其不受限制;例如,“create”)的关系,并且进一步满足是“人物”的条件。另外,该关系不限于单向关系。例如,如下的检索式2 (检索式2)允许对具有作为主语的目标节点、并且具有特定属性“人物”的节点“subj-n”进行检索<检索式2>Select subj-n where{〈someUri〉 predl subj-n. subj-n rdf: type foaf: Person. }检索式2表示了在图1B中图示出的子图。例如,如果资源〈someUri〉表示电子文档X和“predl”是谓语“uploaded”,则节点“subj-n”表示上传电子文档X的人物。与使用上述检索式I和检索式2中的任何一种所找到的目标节点相邻的节点“subj-n”表示与目标节点〈someUri〉具有指定关系的“人物”。在以上述方式使用检索式I和检索式2执行检索之后,将满足检索式I或检索式2中的任何一个所找到的每一个相邻节点“subj-n”作为用于接下来的迭代的目标节点〈someUri〉进行处理,并重复相似的检索。经过上述迭代过程,生成了具有指定的属性“人物”的节点的串联。例如,图2图示出通过两个迭代确定的节点“subj-n至subj-n2”的串联。具体地,图2图示出与目标节点〈someUri〉(例如,用户想访问的电子文档X)之间具有指定的关系predl的人物subj-n,以及与人物subj-n之间具有指定的关系pred2的人物subj_n2的串联。关系(谓语)pred2表不,例如,人之间的关系(例如,“是同事”)。虽然上述描述的检索式I和检索式2表示与目标节点相邻的相邻节点具有属性“人物”,但是如果目标节点具有属性“人物”,即使相邻节点不具有属性“人物”,也仍然可以扩展串联。这个示例等同于,上面给出的第一个示例,参加了相同的会议Y的人物B和人物C并通过会议Y进行的串联。具体地,在其中人物C(用作目标节点)参加会议Y(对应于目标节点的相邻节点)的情况下,虽然会议Y并不是人物,但是将Y并入到串联中作为人物C的下一个节点。在下一次将会议Y用作目标节点时,作为会议Y的相邻节点的人物B匹配上述描述的检索式1,并被合并到串联中。可以将下面的检索式3和检索式4 (其方向性分别对应于检索式I和检索式2中的方向)用作在目标节点具有属性“人物”的情况下检查相邻节点的检索式<检索式3>
权利要求
1.一种检索装置,包括图形存储器,其存储图形的数据,所述图形具有表示数据元素的节点以及表示数据元素之间关系的链路;根节点指定接收单元,其接收在图形中的节点中指定的根节点;以及检索单元,其对通过链路与目标节点相连接并且满足检索条件的相邻节点进行检索, 所述检索条件为目标节点和该相邻节点中的至少一个节点具有预定的属性,所述检索单元使用根节点作为目标节点来检索满足检索条件的相邻节点,所述检索单元迭代地执行处理以检索满足检索条件的相邻节点,其中使用前一相邻节点作为接下来的迭代的目标节点以获得相邻节点的串联,其中前一相邻节点是满足检索条件的节点并且已经在前一检索中被确定,所述检索单元还输出获得的相邻节点的串联。
2.如权利要求1所述的检索装置,其中检索条件包括其中目标节点和相邻节点中的至少一个节点具有预定的属性的条件,以及其中目标节点和相邻节点之间的链路具有至少一种预定类型中的任意一种类型的条件。
3.如权利要求1所述的检索装置,其中根节点指定接收单元接收第一指定根节点和第二指定根节点,并且检索单元对满足检索条件的相邻节点的串联进行检索,其中相邻节点的串联将所述第一指定根节点串联到所述第二指定根节点。
4.如权利要求2所述的检索装置,其中根节点指定接收单元接收第一指定根节点和第二指定根节点,并且检索单元对满足检索条件的相邻节点的串联进行检索,其中相邻节点的串联将所述第一指定根节点串联到所述第二指定根节点。
5.如权利要求1至4中任一项所述的检索装置,其中检索单元获得满足检索条件的相邻节点的多个串联,并且按照从相邻节点的多个串联中具有最小的链路数目的串联开始的顺序呈现所述相邻节点的多个串联。
6.—种检索方法,包括存储图形的数据,其中所述图形具有表示数据元素的节点以及表示数据元素之间关系的链路;接收在图形中的节点中指定的根节点;以及对通过链路与目标节点相连接并且满足检索条件的相邻节点进行检索,其中所述检索条件为目标节点和相邻节点中的至少一个节点具有预定的属性,所述检索包括使用根节点作为目标节点对满足检索条件的相邻节点进行检索;迭代地执行处理以检索满足检索条件的相邻节点,其中使用前一相邻节点作为接下来的迭代的目标节点以获得相邻节点的串联,前一相邻节点是满足检索条件的节点并且已经在前一检索中被确定;以及输出获得的相邻节点的串联。
全文摘要
提供了检索装置和检索方法。检索装置包括图形存储器、根节点指定接收单元、和检索单元。图形存储器存储图形的数据,图形具有表示数据元素的节点和表示数据元素之间关系的链路。根节点指定接收单元接收从图形中的节点中指定的根节点。检索单元检索与目标节点通过链路相连接且满足检索条件的相邻节点,检索条件为目标节点和相邻节点中的至少一个节点具有预定的属性。检索单元使用根节点作为目标节点检索满足检索条件的相邻节点。检索单元迭代地执行对满足检索条件的相邻节点进行检索的处理,其中使用满足检索条件并且已经在之前的检索中被确定的先前的相邻节点作为接下来的迭代的目标节点,从而获得相邻节点的串联,并输出获得的相邻节点的串联。
文档编号G06F17/30GK103020096SQ20121006202
公开日2013年4月3日 申请日期2012年3月9日 优先权日2011年9月22日
发明者东海研 申请人:富士施乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1