一种事件特征的获取方法和设备的制造方法_5

文档序号:8258778阅读:来源:国知局
机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0183]尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0184]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【主权项】
1.一种事件特征的获取方法,其特征在于,包括: 获取用于描述目标事件的特征词集合,其中,所述特征词集合中包含多个特征词; 从获取的所述特征词集合中,确定用于描述所述目标事件的属性的至少一个特征词; 针对确定的每一个特征词,从所述特征词集合中除用于描述所述目标事件的属性的特征词之外的剩余特征词中,抽取出该特征词所标识的属性的具体内容的至少一个特征词,并建立确定的该特征词与抽取的至少一个特征词之间的对应关系; 根据得到至少一组对应关系,得到所述目标事件的特征。
2.如权利要求1所述的获取方法,其特征在于,所述方法还包括: 建立所述目标事件的特征与得到的至少一组对应关系之间的映射关系。
3.如权利要求1或2所述的获取方法,其特征在于,从获取的所述多个特征词中,确定用于描述所述目标事件的属性的至少一个特征词,包括: 针对获取的所述特征词集合,执行以下操作,直至确定出所述特征词集合中全部用于描述所述目标事件的属性的特征词: 选择任意一个特征词; 确定选择的该特征词在原始文档中的上下文内容;并根据所述上下文内容,判断该特征词是否为用于描述所述目标事件的属性的特征词; 若判断结果是选择的该特征词是用于描述所述目标事件的属性的特征词,则将该特征词标记为用于描述所述目标事件的属性的特征词,并选择下一个特征词,继续执行上述操作; 若判断结果是选择的该特征词不是用于描述所述目标事件的属性的特征词,则选择下一个特征词,继续执行上述操作。
4.如权利要求3所述的获取方法,其特征在于,根据所述上下文内容,判断该特征词是否为用于描述所述目标事件的属性的特征词,包括: 根据所述上下文内容,通过语法分析和句法分析,确定该特征词是否为所述上下文内容的中心词; 若确定该特征词为所述上下文内容的中心词,则确定该特征词为用于描述所述目标事件的属性的特征词; 若确定该特征词不为所述上下文内容的中心词,则确定该特征词不为用于描述所述目标事件的属性的特征词。
5.如权利要求3或4所述的获取方法,其特征在于,在确定出所述特征词集合中全部用于描述所述目标事件的属性的特征词之后,所述方法还包括: 判断确定出所述特征词集合中全部用于描述所述目标事件的属性的特征词中是否存在同义词; 在判断结果存在同义词时,从满足同义词条件的多个用于描述所述目标事件的属性的特征词中选择一个特征词,作为满足同义词条件的多个特征词所描述的所述目标事件的属性的特征词。
6.如权利要求1至5任一所述的获取方法,其特征在于,从所述特征词集合中除用于描述所述目标事件的属性的特征词之外的剩余特征词中,抽取出该特征词所标识的属性的具体内容的至少一个特征词,包括: 从所述特征词集合中除用于描述所述目标事件的属性的特征词之外的剩余特征词中,选择一个特征词; 针对确定的一个用于描述所述目标事件的属性的特征词,根据语义规则,判断选择的该特征词是否为该确定的特征词的下位词; 若为下位词,则确定选择的该特征词为该确定的特征词所描述的所述目标事件的属性的具体内容。
7.如权利要求1至6任一所述的获取方法,其特征在于,获取用于描述目标事件的特征词集合,包括: 在对海量数据进行处理时,通过聚类分析方式从海量数据中获取用于描述目标事件的多个特征词; 将得到的多个特征词组合得到用于描述目标事件的特征词集合。
8.如权利要求1至7任一所述的获取方法,其特征在于,在根据得到至少一组对应关系得到所述目标事件的特征之后,所述方法还包括: 比较得到的所述目标事件的特征与预设的所述目标事件的特征; 根据比较结果,确定出在得到的所述目标事件的特征中包含的用于描述目标事件的属性中,与预设的所述目标事件的特征中包含的用于描述目标事件的属性不相同的属性; 将确定出的不相同的属性作为所述目标事件的新增属性。
9.一种事件特征的获取设备,其特征在于,包括: 获取模块,用于获取用于描述目标事件的特征词集合,其中,所述特征词集合中包含多个特征词; 确定模块,用于从获取的所述特征词集合中,确定用于描述所述目标事件的属性的至少一个特征词; 抽取模块,用于针对确定的每一个特征词,从所述特征词集合中除用于描述所述目标事件的属性的特征词之外的剩余特征词中,抽取出该特征词所标识的属性的具体内容的至少一个特征词,并建立确定的该特征词与抽取的至少一个特征词之间的对应关系;根据得到至少一组对应关系,得到所述目标事件的特征。
10.如权利要求9所述的获取设备,其特征在于,所述获取设备还包括: 建立模块,用于建立所述目标事件的特征与得到的至少一组对应关系之间的映射关系O
11.如权利要求9或10所述的获取设备,其特征在于, 所述确定模块,具体用于针对获取的所述特征词集合,执行以下操作,直至确定出所述特征词集合中全部用于描述所述目标事件的属性的特征词: 选择任意一个特征词; 确定选择的该特征词在原始文档中的上下文内容;并根据所述上下文内容,判断该特征词是否为用于描述所述目标事件的属性的特征词; 若判断结果是选择的该特征词是用于描述所述目标事件的属性的特征词,则将该特征词标记为用于描述所述目标事件的属性的特征词,并选择下一个特征词,继续执行上述操作; 若判断结果是选择的该特征词不是用于描述所述目标事件的属性的特征词,则选择下一个特征词,继续执行上述操作。
12.如权利要求11所述的获取设备,其特征在于, 所述确定模块,具体用于根据所述上下文内容,通过语法分析和句法分析,确定该特征词是否为所述上下文内容的中心词; 若确定该特征词为所述上下文内容的中心词,则确定该特征词为用于描述所述目标事件的属性的特征词; 若确定该特征词不为所述上下文内容的中心词,则确定该特征词不为用于描述所述目标事件的属性的特征词。
13.如权利要求11或12所述的获取设备,其特征在于,所述获取设备还包括:判断模块,其中: 所述判断模块,用于在确定出所述特征词集合中全部用于描述所述目标事件的属性的特征词之后,判断确定出所述特征词集合中全部用于描述所述目标事件的属性的特征词中是否存在同义词; 在判断结果存在同义词时,从满足同义词条件的多个用于描述所述目标事件的属性的特征词中选择一个特征词,作为满足同义词条件的多个特征词所描述的所述目标事件的属性的特征词。
14.如权利要求9至13任一所述的获取设备,其特征在于, 所述抽取模块,具体用于从所述特征词集合中除用于描述所述目标事件的属性的特征词之外的剩余特征词中,选择一个特征词; 针对确定的一个用于描述所述目标事件的属性的特征词,根据语义规则,判断选择的该特征词是否为该确定的特征词的下位词; 若为下位词,则确定选择的该特征词为该确定的特征词所描述的所述目标事件的属性的具体内容。
15.如权利要求9至14任一所述的获取设备,其特征在于, 所述获取模块,具体用于在对海量数据进行处理时,通过聚类分析方式从海量数据中获取用于描述目标事件的多个特征词; 将得到的多个特征词组合得到用于描述目标事件的特征词集合。
16.如权利要求9至15任一所述的获取设备,其特征在于,所述获取设备还包括:比较模块,其中: 所述比较模块,用于在根据得到至少一组对应关系得到所述目标事件的特征之后,比较得到的所述目标事件的特征与预设的所述目标事件的特征; 根据比较结果,确定出在得到的所述目标事件的特征中包含的用于描述目标事件的属性中,与预设的所述目标事件的特征中包含的用于描述目标事件的属性不相同的属性; 将确定出的不相同的属性作为所述目标事件的新增属性。
【专利摘要】本发明公开了一种事件特征的获取方法和设备,包括:获取用于描述目标事件的特征词集合,特征词集合中包含多个特征词;从获取的特征词集合中,确定用于描述目标事件的属性的至少一个特征词;针对确定的每一个特征词,从特征词集合中除用于描述目标事件属性的特征词之外的剩余特征词中,抽取出该特征词所标识的属性的具体内容的至少一个特征词,并建立确定的该特征词与抽取的至少一个特征词之间的对应关系;根据得到至少一组对应关系,得到目标事件的特征,这样,有助于全面了解该目标事件,提升了获取目标事件个性化信息的精度,为后续快速定位该目标事件奠定基础。
【IPC分类】G06F17-30
【公开号】CN104572906
【申请号】CN201410828598
【发明人】贾江涛, 顾翀
【申请人】华为软件技术有限公司
【公开日】2015年4月29日
【申请日】2014年12月26日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1