实体关系展现方法和系统的制作方法

文档序号:6608780阅读:201来源:国知局
专利名称:实体关系展现方法和系统的制作方法
技术领域
本发明涉及信息检索领域和人机交互领域,尤其涉及信息检索和导 4元的方法和系统。
背景技术
实体是指具有一定特定意义的概念,包括同一个对象的所有名称, 实体可以包括人名、地名、机构名或其它专有名词等。
一般情况下,实 体是绝大多数信息内容的核心描述内容。例如,互联网上的新闻多是以 人物的姓名、事件或作品名为中心内容,因此人物的姓名、事件或作品 可以作为文档中的实体。
目前的信息检索方式并没有去挖掘信息中的实体及其之间的关系, 更无法直观的展现这种关系,只能提供给用户通过关^T建词搜索的结果。 在用户进行关键词搜索之后,系统给用户展现的多是一个扁平的文档视 图。
传统的信息检索方式主要是基于关键词的检索,例如Google等搜索 引擎。基于关键词的检索方式允许用户键入关键词,并返回用户出现此 关键词的所有文档。
但利用上述检索方式,并不能将与检索实体相关的重要实体直观的 展现出来,而且用户在这种视图面前难于直观地发现实体之间是否相关 以及实体之间的相关度,更无法通过实体之间的关系找到自己所关心的
其它实体的信息。
另外,还包括基于层次目录的信息的信息检索方式。基于层次目录
访问到所需要的文档。这种基于层次目录的信息库中目录树的叶节点对 应实际的文档,而中间节点则仅是一类文档集合的入口,其并不能反应 文档中所包含的实体及实体之间的关系。因此,这种层进的目录导航也 不能让用户通过实体概念之间的关系浏览信息。另外,实体之间的联系是网状结构的,而层次目录的关系就限制了用户在其它大类别里面找到 与当前文档有紧密关系的文档。
因此,有必要提供一种能够反应实体间关系的信息展现方法。

发明内容
针对传统技术中无法体现文档中实体相关性的缺陷,本发明的目的 是提供一种清楚简便地展示出实体间关系的展现方法和展现系统。
本发明的实体关系展现方法包括
(1) 根据用户输入,在实体库中查找一个或多个实体;
(2) 在关系库中查找所述一个或多个实体与其他实体之间的关系;
(3) 以图形方式展示所述一个或多个实体与其他实体之间的关系。 所述方法还包4舌
(4) 在文档库中查找与所述实体或实体间关系相关的文档;
(5) 展示与所述实体或实体间关系相关的文档。
其中,步骤(3)是根据实体或实体间关系的属性,以图形方式展 示实体之间的关系。优选地,实体或实体间关系的属性为实体或实体间
关系的热度值。
其中,以图形方式展示实体之间的关系是将所述相关的实体以不重 叠的形式绘制在用户界面上,并通过实体之间的连线展示实体之间的关 系。优选地,所述相关实体分层次地绘制在用户界面上。
所述实体之间的关系通过下列步骤确定如果一个实体和其他实体
在同一文档中共现,则该实体与相应的实体相关。
所述实体之间的关系还可以通过下列步骤确定如果第一实体与第
二实体相关并且第三实体与第二实体相关,则第一实体与第三实体相关。
本发明还提供了一种实体关系展现系统,包括实体库、关系库, 以及用于根据用户输入在实体库中查找一个或多个实体的实体查找单 元;用于在关系库中查找所述一个或多个实体与其他实体之间关系的实 体关系查找单元;用于以图形方式展示所述一个或多个实体与其他实体 之间关系的实体关系展现单元。所述系统还包括文档库,以及用于在文档库中查找与所述实体或 实体间关系相关的文档的文档查找单元;用于展示与所述实体或实体间 关系相关的文档的文档展现单元。
采用本发明的实体关系展现方法和系统,不仅可以显示出实体之间 是否存在关联,而且能够进一步显示实体之间的相关度。由于实体之间 的关系本身就是一种有价值的信息,因此,实体及其实体之间的关系的 获得对信息检索和导航有着极其重要的意义。


图l是本发明实施例的实体关系展现方法的流程图2是本发明实施例的实体关系展现系统的结构示意图3是本发明实施例的实体关系示意图4本发明实施例的实体关系示意图和相关文档列表的示意图。
具体实施例方式
图1是本发明实体展现方法的一个实施例的流程图。如图所示,在 步骤IOI,根据用户输入,在实体库中查找实体,查找的实体可以是一个 实体,也可以是多个实体。用户输入的信息是用户感兴趣的实体的某一 种描述(例如输入一个明星人物的中文名或绰号),也可以是对当前实体 关系导航界面中的某一实体或实体关系的选择(例如对相应实体的鼠标 点击)。根据用户的输入,在实体库的实体列表中检索相应的实体。
实体库中的实体列表可以通过多种方法形成,例如在某些应用情况 下,实体库中的实体列表可以由管理员对文档中的实体进行人工标注、 或者使用预定义的实体集合产生、或者使用合适的算法从一个文档集中 自动发现和抽取,同样,关系库中的关系列表也可以通过人工标注或者 预定义的方法产生或者使用合适的算法从一个文档集中自动发现和抽 取。
在步骤102,根据查找到相应的实体,在关系库中,查找该实体(或 多个实体)与其他实体之间的关系。在所述关系库中存储有实体之间的关系。当两个实体在同一篇文档中共现时,认为这两个实体是相关的, 通过发现两个实体之间的关系,可以找到与 一 个实体相关的所有其他实
体。另外,实体之间的关系也可以通过传递性来扩展定义,即,若A和 B相关且B和C相关,则可以认为A和C相关。
在预先对文档中的实体和实体关系建索引后,实体被记录在实体库 中,实体关系被记录在关系库中。优选地,实体库、关系库中不仅对实 体、实体之间是否相关进行存储,还可以存储实体、实体间的相关程度, 在本发明的实施例中,用热度值来表示实体间的相关程度。
热度值的确定可以采用各种适合的统计量,在本发明的实施例中, 热度值可以是某两个实体关系在不同文档中共现的次数,也可以不是简 单的计数值,例如可以是对计数值的归一化结果,或对计数值的加权求 和结果。
下面示出了 一段互联网娱乐新闻系统中实体及实体关系热度设置的 XML描述。如图3所示,在关系中描述了多个类型的实体,包括"张学 友"、"周迅,,等人名,以及"演唱会"等事件名,还包括以"雪狼湖,,等作品 名。其中每个实体都可以与其它实体存在关系,另外,每个实体还可以 有附加属性,例如实体本身的热度(selfjank域)。实体之间的关系也可 以有附加的属性,例如关系的热度(reljank域)。 <element—rel>
<element id='l' name二'子长学友'self—rank='0.75' type='star,>
<rel id='2' rel—rank='0.25'/>
<rel id='3, rel—rank='0.25'/>
<rel id='10, rel_rank='0.25'/>
<rel id=, 11' rel—rank='0.25'/>
<rel id='13'rel—rank=T/>
<rel i(H14' rel—rank='0.25'/〉 </dem6iit>
<element id='2' name:'周迅'selfrank='0.5' type='star,> <rel id='10, rel rank='0.25'/><rel id='ll' rel—rank^OW/) </6lem6nt>
<element id='3' name二'陈奕迅'self—rank='0.25, type='star'〉
<rel id^lO' rel—rank='0.25'/〉
<rel id='ll, rel_rank='0.25'/> </element>
<element id='10' name二'演唱会'self_rank='l, type='event,>
<rel icN'll' rel—rank='0.25'/>
<rel id='13' rel—rank='0.25'/> </element>
〈element id='ll' name:'视频'self—rank='l' type='event'〉
<rel id='14' rel_rank='0.25'/> </clemcnt>
<element id='13, name-'雪《良湖'self_rank='0.5' type='work'> </element>
<element id='14, name二'在你身边'self—rank='0.25, type='work,> </element> </element—rel>
例如,在上述程序中,描述的实体"张学友"与"雪狼湖",经过建索引 并对文档数进行归一化处理之后,"张学友"实体本身的热度 self—rank=0.75,而与实体"雪狼湖"(id=13 )之间的关系rel_rank=l。而 根据自身属性的不同,实体或关系的视觉效果可以有区别,例如由于 热度不同,实体"张学友"在视觉上大于实体"陈奕迅"。
在步骤103,以图形方式展示上述检索到的实体之间的关系。在图形 化呈现过程中,根据预定的位置分配算法将多个实体以不重叠的方式绘 制在用户界面上,通过相应的图形绘制模块,实体作为独立的图元散布 在显示范围中,多个实体用设定的图形元素(例如直线)连接以表示它 们具有关联。优选地,当需要显示附加属性时,可以直接根据实体关系 数据获取附加属性的值,并显示在用户界面上。例如以预定的线条粗细度描绘实体间关系的热度、以预定大小描绘各个实体的热度等。
更优选地,可以根据所述热度值以图形方式呈现相关实体间的相关 程度,例如用界面元素的一些变化展现实体和关系的不同属性。例如, 实体单元的大小可以用来表现实体本身的热度,可以用实体单元的不同
颜色区别实体的不同类别。可以用实体之间的位置远近关系表现实体关 系的热度,也可以用实体之间连线的粗细表现实体关系的热度。
在图示本发明实施例的图3中,以单个实体为中心的关系图仅是其 一种示例形式,还可以是以多个实体为中心的关系图。另外,所显示的 实体可以有多个层次,例如图中所展示的均是与中心实体相关的所有一 级实体,当然也可以再显示一级实体周边的二级实体,或展现更多层次 的实体关系。
在图形显示界面中,除了实体之间关系及热度的呈现,还可以包括 附加的其它信息,例如可以推荐当前热度最高的实体或实体关系。也可 以通过响应用户操作事件进一 步展现实体或关系的属性的,例如当鼠标 设备放在某个实体(或关系)上时,以弹出提示窗口的方式显示当前实 体(或关系)的热度等属性。
优选地,在本发明中还包括与实体或实体间关系相关的文档展示。 在步骤104,根据用户输入,在文档库中查找与步骤102、 103中查找、 展现出的实体或实体关系相关的文档。
在步骤105,展示步骤104中查找出的文档。图4示出了实体关系图 和文档展示列表共同展现在用户终端上的情况。例如,用户要检索实体A, 则在用户终端左侧显示包含实体A的实体关系图,同时终端右侧显示与 A相关的文档的列表,其可以以简单列表的形式显示。
除了相关文档列表,还可以显示与A相关的其它实体的链接。在图 4所示的界面中,用户可以点击实体关系图中任意一个其关心的实体或关 系,此时文档展示列表显示被选择的实体或关系的相关文档。例如用户 用鼠标在实体关系图中点击实体B的链接,则在相关文档列表中显示与 实体B相关的文档集合。相反,如果用户在相关文档列表中选择其它的 实体或关系,则实体关系图也相应的显示用户选择的实体以及与其相关的实体和关系。
图2是本发明一个实施例的实体关系展现系统200的结构示意图。 实体关系展现系统200包括实体库201、关系库202、文档库203、实体 查找单元204、实体关系查找单元205和实体关系展现单元206,还包括 文档查找单元207和文档展现单元208。上述单元可以通过应用于通用计 算装置(如服务器中的CPU、存储器、串行或并行接口、显示装置等等) 的软件模块或硬件控制逻辑来实现。
实体库201用于存储系统200中用到的实体列表;关系库202用于 存储系统200中用到的实体关系列表;文档库203用于存储系统200中 所有的文档。类似于上述实体关系展现方法中的阐述,实体库201包括 实体列表,关系库202包括关系列表。实体库201中的实体列表、关系 库202中的关系列表均可以通过多种方法形成,例如由管理员对文档中 的实体进行人工标注或者使用预定义的实体集合产生。
实体查找单元204用于根据用户输入在实体库中查找与用户输入信 息相对应的一个或多个实体。通过与实体库201的交互,实体查找单元 204查找到用户输入关4建字所对应的实体。
实体关系查找单元205用于在关系库中查找与用户输入信息相对应 的一个或多个实体与其他实体之间的关系。根据实体查找单元204检索 到的实体,实体关系查找单元205在关系库中记录的实体关系中检索与 用户输入信息相对应的 一个或多个实体与其他实体的关系。
实体关系展现单元206用于以图形方式展示实体之间的关系。在实 体关系查找单元206检索到相应于用户输入信息的一个或多个实体与其 他实体的关系后,实体关系展现单元206对实体关系进行图形化展现。 实体关系展现单元206可以包括任何适合的绘图软件模块和显示装置(如 CRT、 LCD显示器等)。优选地,所述实体关系展现单元206根据所述热 度值以图形方式呈现实体之间的相关程度。
在图形化呈现过程中,实体关系展现单元206根据预定的位置分配 算法将多个实体以不重叠的方式绘制在用户界面上。当需要显示附加属 性时,可以直接根据实体关系数据获取附加属性的值,并显示在用户界面上。例如以预定的线条粗细度描绘实体间的连线、以预定大小描绘各 个实体等。
优选地,实体关系展现单元206还具有与用户进行交互的用户界面, 当发现用户输入某个实体数据或点击了某个实体或关系后,实体关系展 现单元206会将数据或消息发送至实体关系查找单元205,所述实体关系 查找单元205检索新的实体关系数据,在检索到新的实体关系数据后, 实体关系展现单元206再接收来自实体关系查找单元205的实体关系数 据,并进4于显示。
在本发明的实体关系展现系统200中还可以对与实体或实体间关系 相关的文档进行展现,因此,实体关系展现系统200还包括文档查找单 元207和文档展现单元208。其中,文档查找单元207用于4全索与实体或 关系相关的文档。
文档展现单元208用于展示与实体或实体间关系相关的文档。文档 展现单元208与实体关系展现单元206 —样,可以通过任何适合的绘图 软件模块和显示装置实现。相关文档可以展现在与实体关系图相同的显 示界面上。
优选地,在实体关系展现系统中还可以包括从属索引库209,用于存 储每个文档所包含的实体及实体关系,以便快速响应用户的检索请求。 当用户发送检索请求时,系统200可以直接从从属索引库209中检索相 应的实体或实体间关系所对应的文档,从而避免在文档集中再进行基于 关键词的搜索。
以下,再通过一个具体实例来说明本发明实体发现和建索SI的过程 首先查找文档标题中是否存在已知的明星名字,如果存在已知名姓 名,则增加该明星名字的热度,然后对标题中的作品名进行查找和发现。 由于绝大多数作品是用书名号包起来的,因此在本实施例中可以通过书 名号来识别新闻标题中出现的作品名称。当然,这里的用书名号识别只 是识别规则中的一种,针对不同情况可以利用其它有效的识别规则。若 发现了一个作品名,则也要增加作品对应的热度。同样地,也可以发现 对标题中的事件。通过此过程可以发现更多的实体,更新实体的属性(如热度值),并将实体或实体关系与文档的对应关系记录到对应的索引库 中。可以对每一篇文档重复上述的过程,以便实现所有文档的实体发现 和建索引过程。
在本发明中,实体关系检索服务和文档检索服务可以是分离的,但 也可以将二者合并为一个服务,同时提供这两种检索接口。或者可以仅
提供实体关系检索服务,以供用户检索和浏览数据中出现的实体及实体 之间的关系。而且,实体关系检索服务和文档检索服务可以不使用同一 个文档、实体和实体关系数据库,这样文档检索服务就通过客户提供的
关键词或实体的相关属性在另一个库中查询文档。
以上特定实施例仅是在互联网新闻领域的应用,本领域技术人员应
该理解本发明也可以应用在其它的领域中,实体的类型可以是人名、 作品名和事件名以外的任何类型,例如动植物名、地名等等。另外,如
果要全面提取文档集合中的实体,可以在文档的全文中进行揭:作。也可
以仅对文档的标题进行处理,以防止正文中相关度极低的实体对热度统
计等数据的影响。本领域技术人员应该理解在不脱离本发明精神和范 围的情况下,可以对本发明做出不同的变化和修改。
权利要求
1、一种实体关系展现方法,其特征在于,包括(1)根据用户输入,在实体库中查找一个或多个实体;(2)在关系库中查找所述一个或多个实体与其他实体之间的关系;(3)以图形方式展示所述一个或多个实体与其他实体之间的关系。
2、 根据权利要求1所述的实体关系展现方法,其特征在于,还包括(4) 在文档库中查找与所述实体或实体间关系相关的文档;(5) 展示与所述实体或实体间关系相关的文档。
3、 根据权利要求1所述的实体关系展现方法,其特征在于,步骤(3 ) 是根据实体或实体间关系的属性,以图形方式展示实体之间的关系。
4、 根据权利要求3所述的实体关系展现方法,其特征在于,实体或 实体间关系的属性为实体或实体间关系的热度值。
5、 根据权利要求1或3所述的实体关系展现方法,其特征在于,将 所述相关的实体以不重叠的形式绘制在用户界面上,并通过实体之间的 连线展示实体之间的关系。
6、 根据权利要求5所述的实体关系展现方法,其特征在于,所述相 关实体分层次地绘制在用户界面上。
7、 根据权利要求1所述的实体关系展现方法,其特征在于,所述实 体之间的关系通过下列步骤确定如果一个实体和其他实体在同 一文档中共现,则该实体与相应的实 体相关。
8、 根据权利要求1所述的实体关系展现方法,其特征在于,所述实 体之间的关系通过下列步骤确定如果第一实体与第二实体相关并且第三实体与第二实体相关,则第 一实体与第三实体相关。
9、 一种实体关系展现系统,其特征在于,包括实体库、关系库,以及用于根据用户输入在实体库中查找一个或多个实体的实体查找单元;用于在关系库中查找所述一个或多个实体与其他实体之间关系的实体关系查找单元;用于以图形方式展示所述一个或多个实体与其他实体之间关系的实 体关系展现单元。
10、根据权利要求8所述的实体关系展现系统,其特征在于,还包 括文档库,以及用于在文档库中查找与所述实体或实体间关系相关的文档的文档查 找单元;用于展示与所述实体或实体间关系相关的文档的文档展现单元。
全文摘要
本发明公开了一种实体关系展现方法,该方法包括根据用户输入,在实体库中查找一个或多个实体;在关系库中查找所述一个或多个实体与其他实体之间的关系;以图形方式展示所述一个或多个实体与其他实体之间的关系。本发明还公开了一种实体关系展现系统,采用本发明的实体关系展现方法和系统,不仅能够展现出实体之间是否存在关联,还能反映出实体之间的关联程度,对信息检索和导航有重要的意义。
文档编号G06F17/30GK101308493SQ200710099390
公开日2008年11月19日 申请日期2007年5月18日 优先权日2007年5月18日
发明者欣 周, 冰 梁, 敬 田, 辜炜东 申请人:亿览在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1