基于组合查询提供搜索结果的制作方法_2

文档序号:9221653阅读:来源:国知局
符。例如,对于给定实体引用ID 1,搜索系统可查找类型2的最近实体(其是ID_bl)以及实体引用ID I与ID_bl之间的距离(其是20英里)。在说明性示例中,让实体引用IDl是特定星巴克餐厅并且让类型2是〃机场〃。搜索系统可确定在星巴克餐厅附近是否存在机场并且还确定是哪个机场。对于类型[机场附近的星巴克]的查询,餐厅限制为星巴克,但是机场没有任何限制。诸如数据结构表示250的引用尤其对响应具有仅一个实体引用的限制的组合查询尤其有用。在一些实现中,可以通过修改数据结构表示200以使在实体中包括实体标识符来生成数据结构表示250。
[0032]上面所描述的可以用于生成表或者提供例如搜索结果的实体引用、实体类型、以及关系信息可以作为数据包括在数据结构中。以下描述和附图3-5描述了本公开的一些实现可以使用的说明性知识图。应当理解的是知识图仅是搜索系统可以使用的数据结构的示例并且可以使用任何适当的数据结构。
[0033]在一些实现中,可以使用任何一个或多个数据结构技术将数据组织在数据库中。例如,可以将数据组织在包含通过边相连的节点的图中。在一些实现中,数据可以包括和事物与概念之间的关系有关的陈述,并且可以将那些陈述表示为图的节点和边。每个节点包含一块或多块数据并且边表示包含在边连接的节点中的数据之间的关系。在一些实现中,图包括通过边相连的一对或多对节点。边并且由此图可以是有向的、无向的、或两者。例如,在同一图中边可以是单向的、双向的,或者一个或多个边可以是无向的并且一个或多个边可以是有向的。节点可以包括任何适当的数据或者数据表示。边可以描述数据之间的任何适当的关系。在一些实现中,对边进行标记或标注以便它包括节点之间的连接以及与该连接有关的描述信息这两者。特定节点可以通过不同边而连接到一个或多个其它节点或者本身以便形成扩展图。为了清楚起见,在这里将基于以上刚刚描述的的结构的图称为知识图。在一些实现中,知识图可以用于表示信息并且用于在搜查中提供信息。
[0034]图3示出了根据本公开的一些实现的包含节点和边的说明性知识图部分300。说明性知识图部分300包括节点302、304、306、308。知识图部分300包括用于连接节点302和节点304的边310。知识图部分300包括用于连接节点302和节点306的边312。知识图部分300包括用于连接节点304和节点308的边314。知识图部分300包括用于连接节点302和节点308的边316和边318。知识图300包括用于使节点308与自身相连的边320。可以将边和一个或两个不同节点的每个上述组称为3元组。如所说明的,节点302通过边与三个其它节点直接相连,而节点304和308通过边与两个其它节点直接相连。节点306通过边与仅一个其它节点相连,并且在一些实现中,将节点306称为终端节点。如所说明的,节点302和308通过两个边相连,指示由多于一个属性来定义节点之间的关系。如所说明的,节点308通过边320与其自身相连,指示节点可以涉及本身。虽然说明性知识图300包含未标记为有向的边,但是应该理解的是每个边可以是单向的或双向的。应该理解的是该图的示例仅仅是示例并且可以采用任何适当的大小或布置的节点和边。
[0035]通常,可将知识图中的节点分组为若干类别。节点可以表示实体引用、诸如实体类型和属性这样的组织数据、文字值、以及其它节点之间的关系模型。
[0036]在一些实现中,可以通过任何适当技术来创建、定义、重新定义、修改、或者另外生成实体引用、实体类型、属性、以及其它适当的内容。例如,可以通过手动用户输入、通过对用户交互的自动响应、通过从外部源导入数据、通过任何其它适当技术、或者其任意组合来生成内容。例如,如果在知识图中没有表示对词语的常用的搜索,那么可以添加用于表示该节点的一个或多个节点。在另一示例中,用户可以手动地添加信息和组织结构。
[0037]知识图的节点可以表示实体。实体是单独的、独特的、定义明确的、且可区分的事物或概念。例如,实体可以是人、地点、项、想法、抽象概念、具体元素、其他适当事物或者其任意组合。应该理解的是在一些实现中知识图包含实体引用而不是实体的物理体现。例如,实体可以是乔治华盛顿的物理体现,而实体引用是指乔治华盛顿的抽象概念。在另一示例中,实体“纽约市”是指物理城市,并且知识图使用如例如由数据结构中的元素、实体的名称、任何其它适当元素、或者其任意组合所表示的物理城市的概念。在适当情况下,基于上下文,应该理解的是如这里所使用的词语实体可以与实体引用相对应,并且这里所使用的词语实体引用可以与实体相对应。
[0038]节点是唯一的,因为没有两个节点是指同一事物或概念。通常,实体包括由名词在语言上表示的事物或概念。例如颜色“蓝色”、城市“旧金山”、以及虚构动物“麒麟”中的每一个可以是实体。实体引用通常是指实体的概念。例如,实体引用“纽约市”是指物理城市,并且知识图使用如例如由数据结构中的元素、实体的名称、任何其它适当元素、或者其任意组合所表示的物理城市的概念。
[0039]表示组织数据的节点可以包括在知识图中。在这里可以将这些称为实体类型节点。如在这里所使用的,实体类型节点可以指知识图中的节点,而实体类型可以指由实体类型节点所表示的概念。实体类型可以是实体的定义特征。例如,实体类型节点Y可以通过下面进一步讨论的"是"边或链接而与实体引用节点X相连,以便该图表示信息“实体X是类型Y”。例如,实体引用节点“乔治华盛顿”可以与实体类型节点“总统”相连。实体引用节点可以与多个实体类型节点相连,例如“乔治华盛顿”还可以与实体类型节点“人”以及实体类型节点“军事指挥官”相连。在另一示例中,实体类型节点“城市”可以与实体引用节点“新纽约市”和“旧金山”相连。在另一示例中,虽然未完全定义概念“高个子的人”,例如知识图不是必须包括"高"的定义,但是概念"高个子的人"可以作为实体类型节点存在。在一些实现中,实体类型节点〃高个子的人〃以及其它实体类型节点的存在可以基于用户的交互。
[0040]在一些实现中,实体类型节点可以包括与下述有关的数据或者与所述数据相连:与实体类型节点相关联的属性列表、实体类型节点所属的域、描述、值、任何其它适当信息、或者其任意组合。域是指有关实体类型的集合。例如,域“影片”可以包括例如实体类型“演员”、“导演”、“拍摄地点”、“电影”、任何其它任何适当实体类型、或者其任意组合。在一些实现中,实体引用与多于一个域中的类型相关联。例如,实体引用节点“本杰明富兰克林”可以与域〃政府〃中的实体类型节点“政治家”以及域“职业”中的实体类型节点〃发明家〃相连。
[0041]在一些实现中,还可以将与实体引用节点或实体类型节点相关联的属性表示为节点。例如,表示属性“人口”或“位置”的节点可以与实体类型节点〃城市〃相连。将实体类型及其属性的组合和/或布置称为模式。在一些实现中,将模式保存在与实体类型节点相关联的表或其它适当数据结构中。在一些实现中,知识图可以是自定义或自举的,以便它包括用于定义节点、边、以及图本身的概念的特定节点和边。例如,知识图可以包含实体引用节点“知识图(Knowledge Graph) ”,该实体引用节点“知识图(Knowledge Graph)”与诸如“具有节点”和“具有边”的用于描述知识图的属性的属性节点相连。
[0042]在一些实现中,称为文字的特定值可以通过用于定义关系的边与终端节点中的特定实体引用相关联。文字可以是指值和/或信息串。例如,文字可以包括日期、名称、和/或数字。在示例中,实体引用节点“旧金山“可以通过标注有属性“具有人口”的边而与包含文字“815000”的终端节点相连。在一些实现中,终端节点可以包含对存储在知识图之外的一个或多个文档中的长文本串以及其它信息的引用或者链接。在一些实现中,将文字存储为知识图中的节点。在一些实现中,将文字存储在知识图中,但是不分配如下所述的唯一识另Ij引用,并且不能与多个实体引用相关联。在一些实现中,文字类型节点可以定义例如“日期/时间”、“数字”、“GPS坐标”的文字的类型。
[0043]在一些实现中,将边和两个节点的组称为三元组。三元组表示节点之间的关系,或者在一些实现中,表示该节点与其本身之间的关系。在一些实现中,建模诸如四元或η元关系的高阶关系,其中η是大于2的整数。在一些实现中,将用于建模关系的信息存储在节点中,该节点可以被称作中介节点。在示例中,将信息“人X向博物馆Z捐赠石器Y”存储在用于使实体引用节点与X、Y、Z相连的中介节点中,其中每个边标识每个相应连接的实体引用节点的角色。在一些实现中,知识图可以包括用于词语和/或实体的区分和消歧的信息。如在这里所使用的,区分是指多个名称与单个实体相关联的多对一情况。如在这里所使用的,消歧是指同一名称与多个实体相关联的一对多情况。在一些实现中,可以向节点分配唯一标识引用。在一些实现中,唯一标识引用可以是字母数字字符串、名称、数字、二进制码、任何其它适当标识符、或者其任意组合。唯一标识引用可以使得搜索系统向具有相同或相似文本标识符的节点分配唯一引用。在一些实现中,在区分、消歧、或者这两者中使用唯一标识符及其它技术。
[0044]在区分的一些实现中,节点可以与多个词语或者词语与同一实体相关联的区分别名相关联。例如,词语“乔治华盛顿”,“乔治?华盛顿”、“华盛顿总统”、以及“总统乔治华盛顿”均可以与知识图中的例如节点的单个实体引用相关联。这可以提供知识图的区分和简单化。在消歧的一些实现中,通过它们的唯一标识引用、通过知识图中的相关联的节点、通过任何其它适当信息、或者其任意组合来定义具有相同或相似名称的多个节点。例如,存在与城市“费城”有关的实体引用节点、与电影"费城"有关的实体引用节点、以及与奶油奶酪品牌"费城"有关的实体引用节点。这些节点中的每一个可以具有例如存储为编号的用于知识图之内的消歧的唯一标识引用。在一些实现中,通过多个节点之间的连接和关系提供了知识图中的消歧。例如,可以区分城市“纽约”与州政府"纽约〃,因为该城市与实体类型〃城市〃相连并且州政府与实体类型“州政府”相连。应该理解更复杂的关系还可以定义节点并且消除节点的歧义。例如,可以由相关联的实体类型、通过特定属性与它相连的其它实体引用、其名称、任何其它适当信息、或者其任意组合来定义节点。这些连接可以在消歧中使用,例如与节点〃美国〃相连的节点“Georgia(佐治亚州)”可以被理解为表示美国的州,而与节点“亚洲”和“东欧”相连的节点“Georgia (格鲁吉亚)”可以被理解为表示东欧的国家。
[0045]在一些实现中,节点可以包括用于定义一个或多个属性的数据或者与所述数据相连。属性可以定义节点的特定特征。节点的特定属性可以取决于节点表示什么。在一些实现中,实体引用节点可以包括或连接到:唯一标识引用、与节点相关联的实体类型列表、节点的区分别名列表、与实体引用相关联的数据、实体引用的文本描述、指向实体引用的文本描述的链接、其它适当信息、或者其任意组合。如上所述,节点可以包含对存储在知识图之外的一个或多个文档之中的长文本串以及其它信息的引用或者链接。在一些实现中,存储技术可以取决于特定信息。例如,可以将唯一标识引用存储在节点之内,可以将短的信息串作为文字存储在终端节点中,并且可以通过知识图中的参考将对实体的长描述存储在所链接到的外部文档中。知识图中的边可以表示用于定义两个节点之间的关系的语义连接。边可以表示诸如“是”、“具有”、“类型是? ”、“具有属性”、“具有值”、任何其它适当陈述、或者其任意组合这样的前置陈述连接。例如,特定人的实体引用节点可以通过“出生日期”边与包含他的或她的特定出生日期的文字的终端节点相连。在一些实现中,由实体引用的边连接所定义的属性可以和与实体引用的类型相连的节点有关。例如,实体类型节点“电影”可以与实体引用节点“演员”和“导演”
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1