一种事件特征的获取方法和设备的制造方法_4

文档序号:8258778阅读:来源:国知局
的一个用于描述所述目标事件的属性的特征词,根据语义规则,判断选择的该特征词是否为该确定的特征词的下位词;
[0135]若为下位词,则确定选择的该特征词为该确定的特征词所描述的所述目标事件的属性的具体内容。
[0136]具体地,所述获取模块21,具体用于在对海量数据进行处理时,通过聚类分析方式从海量数据中获取用于描述目标事件的多个特征词;
[0137]将得到的多个特征词组合得到用于描述目标事件的特征词集合。
[0138]可选地,所述获取设备还包括:比较模块26,其中:
[0139]所述比较模块26,用于在根据得到至少一组对应关系得到所述目标事件的特征之后,比较得到的所述目标事件的特征与预设的所述目标事件的特征;
[0140]根据比较结果,确定出在得到的所述目标事件的特征中包含的用于描述目标事件的属性中,与预设的所述目标事件的特征中包含的用于描述目标事件的属性不相同的属性;
[0141]将确定出的不相同的属性作为所述目标事件的新增属性。
[0142]本发明实施例所述的获取设备,可以通过硬件方式实现,也可以通过软件方式实现。对于海量的用于描述任一事件的多个特征词,动态地确定用于描述该事件的属性的特征词以及用于描述该事件的属性的具体内容的特征词,并建立确定用于描述该事件的属性的特征词以及用于描述该事件的属性的具体内容的特征词之间的对应关系,通过得到的多组对应关系,确定目标事件的特征,有助于全面了解该目标事件,提升了获取目标事件个性化信息的精度,为后续快速定位该目标事件奠定基础。
[0143]图3为本发明实施例提供的一种事件特征的获取设备的结构示意图。所述获取设备具备上述描述的功能,可以采用通用计算机结构。所述获取设备包括处理器31、接口 32和存储器33。处理器31和网络接口 32连接,并且和存储器33连接。例如可以通过总线连接处理器31、接口 32和存储器33。其中:
[0144]处理器31可以是中央处理器(英文:central processing unit,缩写:CPU),或者是CPU和硬件芯片的组合。
[0145]接口 32可以为以下一种或多种:提供有线接口的网络接口控制器(英文!networkinterface controller,缩写:NIC),例如以太网NIC,该以太网NIC可以提供铜线和/或光纤接口 ;提供无线接口的NIC,例如无线局域网(英文:wireless local area network,缩写:WLAN)NIC。
[0146]存储器33用于存储程序代码,所述处理器31从存储器中获得存储的程序代码,按照获得的程序代理执行相应地处理。
[0147]存储器33可以是易失性存储器(英文volatile memory),例如随机存取存储器(英文:random_access memory,缩写:RAM);或者非易失性存储器(英文:non_volatilememory),例如只读存储器(英文:read_only memory,缩写:ROM),快闪存储器(英文:flash memory),硬盘(英文:hard disk drive,缩写:HDD)或固态硬盘(英文:solid-statedrive,缩写:SSD);或者上述种类的存储器的组合。存储器33还可以包括内容可寻址存储器(英文 -content-addressable memory,缩写:CAM)。
[0148]具体地,所述处理器31执行所述存储器33中存放的程序,执行以下操作:
[0149]获取用于描述目标事件的特征词集合,其中,所述特征词集合中包含多个特征词;
[0150]从获取的所述特征词集合中,确定用于描述所述目标事件的属性的至少一个特征词;
[0151]针对确定的每一个特征词,从所述特征词集合中除用于描述所述目标事件的属性的特征词之外的剩余特征词中,抽取出该特征词所标识的属性的具体内容的至少一个特征词,并建立确定的该特征词与抽取的至少一个特征词之间的对应关系;
[0152]根据得到至少一组对应关系,得到所述目标事件的特征。
[0153]可选地,所述处理器31,还用于执行:
[0154]建立所述目标事件的特征与得到的至少一组对应关系之间的映射关系。
[0155]具体地,所述处理器31从获取的所述多个特征词中,确定用于描述所述目标事件的属性的至少一个特征词,包括:
[0156]针对获取的所述特征词集合,执行以下操作,直至确定出所述特征词集合中全部用于描述所述目标事件的属性的特征词:
[0157]选择任意一个特征词;
[0158]确定选择的该特征词在原始文档中的上下文内容;并根据所述上下文内容,判断该特征词是否为用于描述所述目标事件的属性的特征词;
[0159]若判断结果是选择的该特征词是用于描述所述目标事件的属性的特征词,则将该特征词标记为用于描述所述目标事件的属性的特征词,并选择下一个特征词,继续执行上述操作;
[0160]若判断结果是选择的该特征词不是用于描述所述目标事件的属性的特征词,则选择下一个特征词,继续执行上述操作。
[0161]具体地,所述处理器31根据所述上下文内容,判断该特征词是否为用于描述所述目标事件的属性的特征词,包括:
[0162]根据所述上下文内容,通过语法分析和句法分析,确定该特征词是否为所述上下文内容的中心词;
[0163]若确定该特征词为所述上下文内容的中心词,则确定该特征词为用于描述所述目标事件的属性的特征词;
[0164]若确定该特征词不为所述上下文内容的中心词,则确定该特征词不为用于描述所述目标事件的属性的特征词。
[0165]具体地,所述处理器31在确定出所述特征词集合中全部用于描述所述目标事件的属性的特征词之后,所述方法还包括:
[0166]判断确定出所述特征词集合中全部用于描述所述目标事件的属性的特征词中是否存在同义词;
[0167]在判断结果存在同义词时,从满足同义词条件的多个用于描述所述目标事件的属性的特征词中选择一个特征词,作为满足同义词条件的多个特征词所描述的所述目标事件的属性的特征词。
[0168]具体地,所述处理器31从所述特征词集合中除用于描述所述目标事件的属性的特征词之外的剩余特征词中,抽取出该特征词所标识的属性的具体内容的至少一个特征词,包括:
[0169]从所述特征词集合中除用于描述所述目标事件的属性的特征词之外的剩余特征词中,选择一个特征词;
[0170]针对确定的一个用于描述所述目标事件的属性的特征词,根据语义规则,判断选择的该特征词是否为该确定的特征词的下位词;
[0171]若为下位词,则确定选择的该特征词为该确定的特征词所描述的所述目标事件的属性的具体内容。
[0172]具体地,所述处理器31获取用于描述目标事件的特征词集合,包括:
[0173]在对海量数据进行处理时,通过聚类分析方式从海量数据中获取用于描述目标事件的多个特征词;
[0174]将得到的多个特征词组合得到用于描述目标事件的特征词集合。
[0175]具体地,所述处理器31在根据得到至少一组对应关系得到所述目标事件的特征之后,所述方法还包括:
[0176]比较得到的所述目标事件的特征与预设的所述目标事件的特征;
[0177]根据比较结果,确定出在得到的所述目标事件的特征中包含的用于描述目标事件的属性中,与预设的所述目标事件的特征中包含的用于描述目标事件的属性不相同的属性;
[0178]将确定出的不相同的属性作为所述目标事件的新增属性。
[0179]本领域的技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0180]本发明是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0181]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0182]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1