人物关系分析方法、提供人物信息的方法及装置制造方法

文档序号:6636967阅读:351来源:国知局
人物关系分析方法、提供人物信息的方法及装置制造方法
【专利摘要】本发明提供一种人物关系分析方法、提供人物信息的方法及装置。该方法包括:从与人物相关的内容数据抽取多个语句;分别对所述多个语句进行依存分析,生成多个依存分析树;根据所述多个依存分析树分别对所述多个语句进行语义角色标注,生成多个语义角色标注结果;根据所述多个语义角色标注结果生成人物时间空间关系表;根据所述人物时间空间关系表生成关注人物的人物关系知识库。通过对人物内容数据进行依存分析和语义角色标注,从而准确地获取与人物相关的人物关系知识库,并且向用户提供丰富、准确的人物关系的信息。
【专利说明】人物关系分析方法、提供人物信息的方法及装置

【技术领域】
[0001] 本发明涉及自然语言处理【技术领域】,尤其涉及一种通过计算机实现的人物关系分 析方法、提供人物信息的方法及装置。

【背景技术】
[0002] 以人物为核心的搜索是搜索产品的重要需求之一。需求主要包括:输入的具体人 名、查找该人物的生平简介和最近的活动等信息。当用户输入具体的人名,来查找与人名相 关的信息时,搜索引擎不仅会显示正常的检索结果,而且还会给出一个相关搜索列表。在相 关搜索列表中,会显示与用户搜索的人名具有一定关联度的结果。
[0003] 图1是现有的人物相关搜索列表的示意图。如图1所示,当输入检索语句"张亚 勤"时,在相关搜索列表中出现了 "张馨予"这个人名,而"张馨予"是"张亚勤"的女儿,并 不是众所周知的女明星。
[0004] 在上述搜索过程中,搜索结果导致了人名的重名问题。另外,相关搜索列表中显示 的内容比较散乱,具有很大的随机性,使用户无法获取自己所需的信息。


【发明内容】

[0005] 本发明的实施例提供一种通过计算机实现的人物关系分析方法、提供人物信息的 方法及装置,通过对内容数据进行自然语言分析,以自动地获取准确性较高的人物关系知 识库,并且向用户提供丰富、准确的人物关系的信息。
[0006] 根据本发明的一方面,提供一种通过计算机实现的人物关系分析方法。所述方法 包括:从与人物相关的内容数据抽取多个语句;分别对所述多个语句进行依存分析,生成 多个依存分析树;根据所述多个依存分析树分别对所述多个语句进行语义角色标注,生成 多个语义角色标注结果;根据所述多个语义角色标注结果生成人物时间空间关系表;根据 所述人物时间空间关系表生成关注人物的人物关系知识库。
[0007] 根据本发明的另一方面,提供一种提供人物信息的方法,所述方法包括:接收包括 第一人名的搜索词;根据所述第一人名从预存的人物关系知识库获取与所述第一人名相关 的人物关系信息,所述人物关系信息包括至少一个第二人名及其与所述第一人名的关系数 据;发送所述人物关系信息。
[0008] 根据本发明的另一方面,提供一种提供人物信息的方法,所述方法包括:获取包 括第一人名的搜索词;将所述搜索词发送给服务器;从所述服务器接收与所述第一人名相 关的人物关系信息,所述人物关系信息包括至少一个第二人名及其与所述第一人名的关系 数据;显示所述人物关系信息。根据本发明的另一方面,提供一种人物关系分析装置。所 述装置包括:语句抽取单元,用于从与人物相关的内容数据抽取多个语句;依存分析单元, 用于分别对所述多个语句进行依存分析,生成多个依存分析树;语义角色标注单元,用于根 据所述多个依存分析树分别对所述多个语句进行语义角色标注,生成多个语义角色标注结 果;人物时空关系表生成单元,用于根据所述多个语义角色标注结果生成人物时间空间关 系表;人物关系知识库生成单元,用于根据所述人物时间空间关系表生成关注人物的人物 关系知识库。
[0009] 根据本发明的另一方面,提供一种提供人物信息的装置。所述装置包括:搜索词接 收单元,用于接收包括第一人名的搜索词;人物关系信息获取单元,用于根据所述第一人名 从预存的人物关系知识库获取与所述第一人名相关的人物关系信息,所述人物关系信息包 括至少一个第二人名及其与所述第一人名的关系数据;人物关系信息发送单元,用于发送 所述人物关系信息。
[0010] 根据本发明的另一方面,提供一种提供人物信息的装置,所述装置包括:搜索词获 取单元,用于获取包括第一人名的搜索词;搜索词发送单元,用于将所述搜索词发送给服务 器;人物关系信息接收单元,用于从所述服务器接收与所述第一人名相关的人物关系信息, 所述人物关系信息包括至少一个第二人名及其与所述第一人名的关系数据;人物关系信息 显示单元,用于显示所述人物关系信息。
[0011] 本发明实施例提供的通过计算机实现的人物关系分析方法、提供人物信息方法及 装置,通过对人物内容数据进行依存分析和语义角色标注,从而准确地获取与人物相关的 人物关系知识库,并且向用户提供丰富、准确的人物关系的信息。

【专利附图】

【附图说明】
[0012] 图1是现有的人物相关搜索列表的不意图;
[0013] 图2是本发明实施例提供的人物关系分析方法的流程图;
[0014] 图3是本发明实施例提供的提供人物信息的方法的流程图;
[0015] 图4是本发明另一实施例提供的提供人物信息的方法的流程图;
[0016] 图5是本发明实施例提供的人物关系分析装置的逻辑框图;
[0017] 图6是本发明实施例提供的提供人物信息的装置的逻辑框图;
[0018] 图7是本发明另一实施例提供的提供人物信息的装置的逻辑框图;
[0019] 图8是本发明实施例提供的语义角色标注结果的示意图;
[0020]图9是本发明实施例提供的依存分析和语义角色标注之间的关系的示意图;
[0021] 图10是根据本发明实施例基于多个语句的语义角色标注结果生成的人物时间空 间关系条目的示例;
[0022] 图11是本发明实施例提供的人物关系信息的示意图;
[0023] 图12是本发明实施例提供的另一人物关系信息的示意图。

【具体实施方式】
[0024] 本发明的总体发明构思是,从涉及人物的内容数据抽取语句,对所述语句进行包 括依存关系分析和语义角色标注的自然语言分析,从而准确地获取与人物相关的人物关系 知识库,并且根据所述人物关系知识库来向用户提供与预定人名相关的人物关系信息。
[0025] 下面结合附图对本发明实施例提供的通过计算机实现的人物关系分析、提供人物 信息方法及装置进行详细描述。
[0026] 图2是本发明实施例提供的人物关系分析方法的流程图。
[0027] 参照图2,在步骤S201,从与人物相关的内容数据抽取多个语句。
[0028] 步骤S202,分别对所述多个语句进行依存分析,生成多个依存分析树。
[0029] 这里,所述内容数据可以是关于人物的百科网页、涉及人物的新闻网页或资讯网 页。
[0030] 具体地,根据本发明的示例性实施例,在步骤S201,从所述内容数据识别人名,并 且根据所述人名从所述内容数据提取多个语句。在步骤S202中,根据移近归约算法分别对 所述多个语句进行依存分析,生成多个依存分析树。
[0031] 以"我爱中国"这句话为例,经过依存分析后得到的依存树可以表示为:
[0032]

【权利要求】
1. 一种通过计算机实现的人物关系分析方法,其特征在于,所述方法包括: 从与人物相关的内容数据抽取多个语句; 分别对所述多个语句进行依存分析,生成多个依存分析树; 根据所述多个依存分析树分别对所述多个语句进行语义角色标注,生成多个语义角色 柄注结果; 根据所述多个语义角色标注结果生成人物时间空间关系表; 根据所述人物时间空间关系表生成关注人物的人物关系知识库。
2. 根据权利要求1所述的方法,其特征在于,在所述根据所述多个依存分析树分别对 所述多个语句进行语义角色标注,生成多个语义角色标注结果的处理中, 针对任一所述语句,识别其中的谓词及其论元,并且确定其每个论元的语义角色并对 所述论元进行角色标注。
3. 根据权利要求1或2所述的方法,其特征在于,所述内容数据是关于人物的百科网 页、设及人物的新闻网页或资讯网页。
4. 根据权利要求3所述的方法,其特征在于,所述对所述多个语句进行依存分析,生成 多个依存分析树的处理包括:根据移近归约算法分别对所述多个语句进行依存分析,生成 多个依存分析树。
5. -种提供人物信息的方法,其特征在于,所述方法包括: 接收包括第一人名的捜索词; 根据所述第一人名从预存的人物关系知识库获取与所述第一人名相关的人物关系信 息,所述人物关系信息包括至少一个第二人名及其与所述第一人名的关系数据; 发送所述人物关系信息。
6. 根据权利要求5所述的方法,其特征在于,所述方法还包括;将获取的所述人物关系 信息根据家庭关系和社会关系进行分类。
7. 根据权利要求6所述的方法,其特征在于,所述方法还包括;按照所述第一人名和第 二人名的关系发生的时间先后顺序对分类的所述人物关系信息进行排序。
8. 根据权利要求7所述的方法,其特征在于,所述方法还包括;对相同社会关系的第二 人名按照其用户点击率的高低进行排序。
9. 一种提供人物信息的方法,其特征在于,所述方法包括: 获取包括第一人名的捜索词; 将所述捜索词发送给服务器; 从所述服务器接收与所述第一人名相关的人物关系信息,所述人物关系信息包括至少 一个第二人名及其与所述第一人名的关系数据; 显示所述人物关系信息。
10. 根据权利要求9所述的方法,其特征在于,所述人物关系信息是根据家庭关系和社 会关系被分类的数据,所述显示所述人物关系信息的处理包括:分类显示所述人物关系信 息。
11. 根据权利要求10所述的方法,其特征在于,分类的所述人物关系信息是根据所述 第一人名和第二人名的关系发生的时间先后顺序被排序的数据。
12. -种人物关系分析装置,其特征在于,所述装置包括: 语句抽取单元,用于从与人物相关的内容数据抽取多个语句; 依存分析单元,用于分别对所述多个语句进行依存分析,生成多个依存分析树; 语义角色标注单元,用于根据所述多个依存分析树分别对所述多个语句进行语义角色 标注,生成多个语义角色标注结果; 人物时空关系表生成单元,用于根据所述多个语义角色标注结果生成人物时间空间关 系表; 人物关系知识库生成单元,用于根据所述人物时间空间关系表生成关注人物的人物关 系知识库。
13. 根据权利要求12所述的装置,其特征在于,所述标注单元针对任一所述语句,识别 其中的谓词及其论元,并且确定其每个论元的语义角色并对所述论元进行角色标注。
14. 根据权利要求12或13所述的装置,其特征在于,所述内容数据是关于人物的百科 网页、设及人物的新闻网页或资讯网页。
15. -种提供人物信息的装置,其特征在于,所述装置包括: 捜索词接收单元,用于接收包括第一人名的捜索词; 人物关系信息获取单元,用于根据所述第一人名从预存的人物关系知识库获取与所述 第一人名相关的人物关系信息,所述人物关系信息包括至少一个第二人名及其与所述第一 人名的关系数据; 人物关系信息发送单元,用于发送所述人物关系信息。
16. 根据权利要求15所述的装置,其特征在于,所述装置还包括;分类单元,用于将获 取的所述人物关系信息根据家庭关系和社会关系进行分类。
17. 根据权利要求16所述的装置,其特征在于,所述装置还包括;第一排序单元,用于 按照所述第一人名和第二人名的关系发生的时间先后顺序对分类的所述人物关系信息进 行排序。
18. 根据权利要求17所述的装置,其特征在于,所述装置还包括;第二排序单元,用于 对相同社会关系的第二人名按照其用户点击率的高低进行排序。
19. 一种提供人物信息的装置,其特征在于,所述装置包括: 捜索词获取单元,用于获取包括第一人名的捜索词; 捜索词发送单元,用于将所述捜索词发送给服务器; 人物关系信息接收单元,用于从所述服务器接收与所述第一人名相关的人物关系信 息,所述人物关系信息包括至少一个第二人名及其与所述第一人名的关系数据; 人物关系信息显示单元,用于显示所述人物关系信息。
20. 根据权利要求19所述的装置,其特征在于,所述人物关系信息是根据家庭关系和 社会关系被分类的数据,所述显示单元分类显示所述人物关系信息。
【文档编号】G06F17/30GK104462326SQ201410721415
【公开日】2015年3月25日 申请日期:2014年12月2日 优先权日:2014年12月2日
【发明者】吴先超, 王丽杰, 刘占一 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1