信息处理方法、装置、电子设备及计算机可读存储介质与流程

文档序号:16880911发布日期:2019-02-15 22:08阅读:148来源:国知局
信息处理方法、装置、电子设备及计算机可读存储介质与流程

本发明实施例涉及数据处理技术领域,具体涉及一种信息处理方法、装置、电子设备及计算机可读存储介质。



背景技术:

随着互联网技术的发展,购物、交易、查询等很多用户日常行为几乎都通过互联网来完成,用户在实施以上网络行为的过程中,会产生众多需要咨询的问题,因此人工客服的工作变得异常繁重,为了缓解人工客服的工作压力,客服机器人也就是自动应答机器人应运而生。现有的自动应答机器人能够根据用户各种形式的交互内容推测出用户可能想问的问题,并向用户展示相关的标准问题供用户选择,最终根据用户的选择向用户发送答复信息。但目前的自动应答策略存在两个问题:1、标准问题库不能实时更新,导致很多用户的交互内容无法得到准确地识别,进而匹配不到用户想要的答复;2、对于一项新业务,技术人员需要付出大量的时间和精力筹备和维护标准问题库。因此,目前的自动应答策略不仅人工和时间成本高昂,工作效率低下,而且也很难满足用户的需求。



技术实现要素:

本发明实施例提供一种信息处理方法、装置、电子设备及计算机可读存储介质。

第一方面,本发明实施例中提供了一种信息处理方法。

具体的,所述信息处理方法,包括:

获取抽象信息数据库,其中,所述抽象信息数据库中包括多条抽象信息及其相应的类别标签;

获取待处理信息及其类别标签,并将所述待处理信息类别标签与所述抽象信息数据库中的类别标签进行匹配,得到与匹配类别标签相应的目标抽象信息;

将所述待处理信息与所述目标抽象信息进行融合,得到目标信息。

结合第一方面,本发明实施例在第一方面的第一种实现方式中,所述获取抽象信息数据库,包括:

获取历史抽象信息数据库;

获取预设历史时间段内的日志信息,根据所述日志信息生成第一抽象信息及其类别标签;

对所述第一抽象信息及其类别标签进行聚类处理,得到第二抽象信息及其类别标签;

将所述第二抽象信息及其类别标签加入历史抽象信息数据库。

结合第一方面和第一方面的第一种实现方式,本发明实施例在第一方面的第二种实现方式中,所述获取预设历史时间段内的日志信息,根据所述日志信息生成第一抽象信息及其类别标签,包括:

获取预设历史时间段内的日志信息;

确定所述日志信息的目标抽象字段和关键词;

将所述日志信息的目标抽象字段替换为未定抽象字段,得到第一抽象信息;

根据所述关键词生成所述第一抽象信息的类别标签。

结合第一方面、第一方面的第一种实现方式和第一方面的第二种实现方式,本发明实施例在第一方面的第三种实现方式中,所述对所述第一抽象信息及其类别标签进行聚类处理,得到第二抽象信息及其类别标签,包括:

对所述第一抽象信息及其类别标签进行聚类处理,得到聚类抽象信息及其类别标签;

对所述聚类抽象信息及其类别标签进行审核处理,得到第二抽象信息及其类别标签。

结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式和第一方面的第三种实现方式,本发明实施例在第一方面的第四种实现方式中,所述将所述第二抽象信息及其类别标签加入历史抽象信息数据库,包括:

将所述第二抽象信息与所述历史抽象信息数据库中的抽象信息进行匹配;

当所述历史抽象信息数据库中不存在与所述第二抽象信息匹配的抽象信息时,将所述第二抽象信息及其类别标签加入历史抽象信息数据库;

当所述历史抽象信息数据库中存在与所述第二抽象信息匹配的抽象信息时,删除所述第二抽象信息及其类别标签。

结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式和第一方面的第四种实现方式,本发明实施例在第一方面的第五种实现方式中,所述将所述待处理信息与所述目标抽象信息进行融合,得到目标信息,包括:

获取所述待处理信息的目标抽象字段;

确定所述目标抽象信息包含的未定抽象字段位置;

使用所述待处理信息的目标抽象字段替换所述目标抽象信息的未定抽象字段,得到目标信息。

第二方面,本发明实施例中提供了一种信息处理装置。

具体的,所述信息处理装置,包括:

第一获取模块,被配置为获取抽象信息数据库,其中,所述抽象信息数据库中包括多条抽象信息及其相应的类别标签;

第二获取模块,被配置为获取待处理信息及其类别标签,并将所述待处理信息类别标签与所述抽象信息数据库中的类别标签进行匹配,得到与匹配类别标签相应的目标抽象信息;

融合模块,被配置为将所述待处理信息与所述目标抽象信息进行融合,得到目标信息。

结合第二方面,本发明实施例在第二方面的第一种实现方式中,所述第一获取模块包括:

第一获取子模块,被配置为获取历史抽象信息数据库;

第二获取子模块,被配置为获取预设历史时间段内的日志信息,根据所述日志信息生成第一抽象信息及其类别标签;

第一聚类子模块,被配置为对所述第一抽象信息及其类别标签进行聚类处理,得到第二抽象信息及其类别标签;

第一添加子模块,被配置为将所述第二抽象信息及其类别标签加入历史抽象信息数据库。

结合第二方面和第二方面的第一种实现方式,本发明实施例在第二方面的第二种实现方式中,所述第二获取子模块包括:

第三获取子模块,被配置为获取预设历史时间段内的日志信息;

第一确定子模块,被配置为确定所述日志信息的目标抽象字段和关键词;

第一替换子模块,被配置为将所述日志信息的目标抽象字段替换为未定抽象字段,得到第一抽象信息;

生成子模块,被配置为根据所述关键词生成所述第一抽象信息的类别标签。

结合第二方面、第二方面的第一种实现方式和第二方面的第二种实现方式,本发明实施例在第二方面的第三种实现方式中,所述第一聚类子模块包括:

第二聚类子模块,被配置为对所述第一抽象信息及其类别标签进行聚类处理,得到聚类抽象信息及其类别标签;

审核子模块,被配置为对所述聚类抽象信息及其类别标签进行审核处理,得到第二抽象信息及其类别标签。

结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式和第二方面的第三种实现方式,本发明实施例在第二方面的第四种实现方式中,所述第一添加子模块包括:

匹配子模块,被配置为将所述第二抽象信息与所述历史抽象信息数据库中的抽象信息进行匹配;

第二添加子模块,被配置为当所述历史抽象信息数据库中不存在与所述第二抽象信息匹配的抽象信息时,将所述第二抽象信息及其类别标签加入历史抽象信息数据库;

删除子模块,被配置为当所述历史抽象信息数据库中存在与所述第二抽象信息匹配的抽象信息时,删除所述第二抽象信息及其类别标签。

结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式和第二方面的第四种实现方式,本发明实施例在第二方面的第五种实现方式中,所述融合模块包括:

第四获取子模块,被配置为获取所述待处理信息的目标抽象字段;

第二确定子模块,被配置为确定所述目标抽象信息包含的未定抽象字段位置;

第二替换子模块,被配置为使用所述待处理信息的目标抽象字段替换所述目标抽象信息的未定抽象字段,得到目标信息。

第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条支持信息处理装置执行上述第一方面中信息处理方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。所述信息处理装置还可以包括通信接口,用于信息处理装置与其他设备或通信网络通信。

第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储信息处理装置所用的计算机指令,其包含用于执行上述第一方面中信息处理方法为信息处理装置所涉及的计算机指令。

本发明实施例提供的技术方案可以包括以下有益效果:

上述技术方案借助与实时更新的抽象信息数据库的匹配,得到与新业务相关的抽象信息,再通过新业务与抽象信息的融合,得到与新业务相关的具体信息。该技术方案能够大大节省自动应答机制的筹备和维护成本,提高工作效率,同时还能够提高用户的满意度。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明实施例。

附图说明

结合附图,通过以下非限制性实施方式的详细描述,本发明实施例的其它特征、目的和优点将变得更加明显。在附图中:

图1示出根据本发明一实施方式的信息处理方法的流程图;

图2示出根据图1所示实施方式的信息处理方法的步骤s101的流程图;

图3示出根据图2所示实施方式的信息处理方法的步骤s202的流程图;

图4示出根据图2所示实施方式的信息处理方法的步骤s203的流程图;

图5示出根据图2所示实施方式的信息处理方法的步骤s204的流程图;

图6示出根据图1所示实施方式的信息处理方法的步骤s103的流程图;

图7示出根据本发明一实施方式的信息处理装置的结构框图;

图8示出根据图7所示实施方式的信息处理装置的第一获取模块701的结构框图;

图9示出根据图8所示实施方式的信息处理装置的第二获取子模块802的结构框图;

图10示出根据图8所示实施方式的信息处理装置的第一聚类子模块803的结构框图;

图11示出根据图8所示实施方式的信息处理装置的第一添加子模块804的结构框图;

图12示出根据图7所示实施方式的信息处理装置的融合模块703的结构框图;

图13示出根据本发明一实施方式的电子设备的结构框图;

图14是适于用来实现根据本发明一实施方式的信息处理方法的计算机系统的结构示意图。

具体实施方式

下文中,将参考附图详细描述本发明实施例的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。

在本发明实施例中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。

另外还需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明实施例。

本发明实施例提供的技术方案借助与实时更新的抽象信息数据库的匹配,得到与新业务相关的抽象信息,再通过新业务与抽象信息的融合,得到与新业务相关的具体信息。该技术方案能够大大节省自动应答机制的筹备和维护成本,提高工作效率,同时还能够提高用户的满意度。

图1示出根据本发明一实施方式的信息处理方法的流程图,如图1所示,所述信息处理方法包括以下步骤s101-s103:

在步骤s101中,获取抽象信息数据库,其中,所述抽象信息数据库中包括多条抽象信息及其相应的类别标签;

在步骤s102中,获取待处理信息及其类别标签,并将所述待处理信息类别标签与所述抽象信息数据库中的类别标签进行匹配,得到与匹配类别标签相应的目标抽象信息;

在步骤s103中,将所述待处理信息与所述目标抽象信息进行融合,得到目标信息。

上文提及,目前的自动应答策略不仅人工和时间成本高昂,工作效率低下,而且也很难满足用户的需求。考虑到上述问题,在该实施方式中,提出一种信息处理方法,该方法首先获取抽象信息数据库;然后获取待处理信息及其类别标签,并将所述待处理信息类别标签与所述抽象信息数据库中的类别标签进行匹配,得到与匹配类别标签相应的目标抽象信息;最后将所述待处理信息与所述目标抽象信息进行融合,得到目标信息。该技术方案能够大大节省自动应答机制的筹备和维护成本,提高工作效率,同时还能够提高用户的满意度。

其中,所述抽象信息数据库是由众多抽象信息组成的数据库,具体地,所述抽象信息数据库包括多条抽象信息及其相应的类别标签,所述抽象信息包含有一个或多个未定字段,比如所述抽象信息可以为基于一个含有主题字段的具体问题生成的含有未定主题字段的抽象问题,其中,所述主题字段用于表征这个问题所针对的提问对象。所述抽象信息的类别标签用于表征所述抽象信息或者说所述主题字段所属的类别,所述类别标签可以为购物、银行、保险、旅游、政策等等。举例来说,对于一个具体的问题:乐业保能保障多长时间,这个问题所针对的提问对象,即其主题字段为“乐业保”,那么基于这样的具体问题生成的抽象问题可以为:{xx}保障时间,其中,{xx}表示对应于主题字段“乐业保”的未定主题字段,该抽象问题的类别标签就为“乐业保”所属的类别“保险”。

在本实施例的一个可选实现方式中,所述待处理信息可以为待处理的新业务、新项目等待处理对象,其类别标签用于表征所述待处理信息所属的类别,与上文所述类似,所述类别标签比如可以为购物、银行、保险、旅游、政策等等。

在本实施例的一个可选实现方式中,所述待处理信息与目标抽象信息之间的融合指的是基于待处理信息对于所述目标抽象信息的具体化,比如将所述目标抽象问题中的未定主题字段替换为待处理信息中的具体的主题字段,进而生成一个具体的问题。

当然,在进行抽象化生成抽象问题时,还可以基于其他字段或者其他信息进行抽象,进而后续在融合时就可针对所选择的抽象信息进行相应的具体化。应当注意的是,上述基于主题字段的抽象化仅为本发明的示例性说明,而不应当理解为是对于本发明的限制。

在本实施例的一个可选实现方式中,如图2所示,所述步骤s101,即获取抽象信息数据库的步骤,包括以下步骤s201-s204:

在步骤s201中,获取历史抽象信息数据库;

在步骤s202中,获取预设历史时间段内的日志信息,根据所述日志信息生成第一抽象信息及其类别标签;

在步骤s203中,对所述第一抽象信息及其类别标签进行聚类处理,得到第二抽象信息及其类别标签;

在步骤s204中,将所述第二抽象信息及其类别标签加入历史抽象信息数据库。

上文提及,目前的自动应答策略存在标准问题库不能实时更新的问题,从而导致很多用户的交互内容无法得到准确地识别,进而匹配不到用户想要的答复。为了对于标准问题库实时更新,使其尽可能地具备完备性,在该实施方式中,基于实时获取的日志信息对于标准问题库进行更新,具体地,首先获取历史抽象信息数据库;然后获取预设历史时间段内的日志信息,并根据所述日志信息生成初步的第一抽象信息及其类别标签;然后对所述第一抽象信息及其类别标签进行聚类处理,得到第二抽象信息及其类别标签;最后将所述第二抽象信息及其类别标签加入到历史抽象信息数据库中,得到最新的抽象信息数据库。

其中,所述历史抽象信息数据库指的是之前已经存在的一个抽象信息数据库,若之前并不存在这样的抽象信息数据库,则可根据历史抽象信息新建一个抽象信息数据库。

其中,所述预设历史时间段可根据实际应用的需要进行设置,具体可根据历史抽象信息数据库的规模、历史抽象信息数据库的更新时间、日志信息的大小等因素来综合考虑设置。

其中,所述日志信息指的是与信息处理相关的日志信息,比如关于用户问题的日志信息。所述日志信息用于产生抽象信息,以丰富抽象信息数据库。

在本实施例的一个可选实现方式中,如图3所示,所述步骤s202,即获取预设历史时间段内的日志信息,根据所述日志信息生成第一抽象信息及其类别标签的步骤,包括以下步骤s301-s304:

在步骤s301中,获取预设历史时间段内的日志信息;

在步骤s302中,确定所述日志信息的目标抽象字段和关键词;

在步骤s303中,将所述日志信息的目标抽象字段替换为未定抽象字段,得到第一抽象信息;

在步骤s304中,根据所述关键词生成所述第一抽象信息的类别标签。

为了基于日志信息生成准确的抽象信息,在该实施方式中,先确定日志信息的目标抽象字段和日志信息关键词,然后将所述日志信息的目标抽象字段替换为未定抽象字段,得到第一抽象信息,然后再根据日志信息的关键词,结合预设类别数据库生成所述第一抽象信息的类别标签。

以目标抽象字段为主题字段为例,若所述日志信息包括:乐业保为什么会失效呢、乐业保为什么会失效、乐业保保障多长时间、乐业保保障期限是多久、乐业保保障时间、乐业保的保障时间是什么时候、乐业保能保障多长时间、乐业保可以保多长时间、乐业保是即买即生效吗、乐业保要多长时间才能生效、乐业保为什么不赔、乐业保为什么不理赔、乐业保对医院的要求、乐业保报销要在什么医院就诊、乐业保的医院要求、乐业保对医院有什么要求、乐业保要在哪些医院看病才能报,所述主题字段也就是提问的对象为“乐业保”,提取的关键词可为“乐业保”、“理赔”、“医院”、“保障期限”、“生效时间”,那么基于上述日志信息生成的第一抽象信息可以为:{xx}为什么会失效呢、{xx}为什么会失效、{xx}保障多长时间、{xx}保障期限是多久、{xx}保障时间、{xx}的保障时间是什么时候、{xx}能保障多长时间、{xx}可以保多长时间、{xx}是即买即生效吗、{xx}要多长时间才能生效、{xx}为什么不赔、{xx}为什么不理赔、{xx}对医院的要求、{xx}报销要在什么医院就诊、{xx}的医院要求、{xx}对医院有什么要求、{xx}要在哪些医院看病才能报,其相应的类别标签为“保险”。

其中,所述类别数据库可预先根据历史关键词信息和历史类别信息创建,所述类别数据库中包括多个关键词及其与相应类别标签之间的对应关系。

在本实施例的一个可选实现方式中,如图4所示,所述步骤s203,即对所述第一抽象信息及其类别标签进行聚类处理,得到第二抽象信息及其类别标签的步骤,包括以下步骤s401-s402:

在步骤s401中,对所述第一抽象信息及其类别标签进行聚类处理,得到聚类抽象信息及其类别标签;

在步骤s402中,对所述聚类抽象信息及其类别标签进行审核处理,得到第二抽象信息及其类别标签。

为了进一步提高抽象信息的准确性,在该实施方式中,还加入了对于聚类后得到的信息进行审核处理的步骤,即首先对所述第一抽象信息及其类别标签进行聚类处理,得到聚类抽象信息及其类别标签;然后对所述聚类抽象信息及其类别标签进行审核处理,得到可以加入抽象信息数据库的第二抽象信息及其类别标签。

在本实施例的一个可选实现方式中,在对所述第一抽象信息及其类别标签进行聚类处理时,可采用基于文本相似度的聚类方法,当然也可以采用其他聚类方法,本发明对其不作具体限定。比如,对于上文基于日志信息生成的第一抽象信息:{xx}为什么会失效呢、{xx}为什么会失效、{xx}保障多长时间、{xx}保障期限是多久、{xx}保障时间、{xx}的保障时间是什么时候、{xx}能保障多长时间、{xx}可以保多长时间、{xx}是即买即生效吗、{xx}要多长时间才能生效、{xx}为什么不赔、{xx}为什么不理赔、{xx}对医院的要求、{xx}报销要在什么医院就诊、{xx}的医院要求、{xx}对医院有什么要求、{xx}要在哪些医院看病才能报,经过聚类处理后得到的第二抽象信息可以为{xx}的保障期限、{xx}的生效时间、{xx}的理赔条例,{xx}报销对医院的要求等等,其中,第二抽象信息的类别标签保持不变,仍然为“保险”。当然,其他类别标签的第一抽象信息的聚类处理也可以按照上述方式来进行,以生成对应类别标签的第二抽象信息。

其中,所述审核处理的具体方式可根据实际应用的需要进行设置,比如可包括:剔除无效信息,其中,所述无效信息可以为以下类型信息中的一种或多种:存在非法字符的信息、无明显意图的信息、抽象错误的信息、抽象失败的信息、重复信息等等;删除存在不同意图的信息;合并相同或相似的信息;审核类别标签的正确性;为缺失类别标签的信息生成类别标签等等。

在本实施例的一个可选实现方式中,如图5所示,所述步骤s204,即将所述第二抽象信息及其类别标签加入历史抽象信息数据库的步骤,包括以下步骤s501-s503:

在步骤s501中,将所述第二抽象信息与所述历史抽象信息数据库中的抽象信息进行匹配;

在步骤s502中,当所述历史抽象信息数据库中不存在与所述第二抽象信息匹配的抽象信息时,将所述第二抽象信息及其类别标签加入历史抽象信息数据库;

在步骤s503中,当所述历史抽象信息数据库中存在与所述第二抽象信息匹配的抽象信息时,删除所述第二抽象信息及其类别标签。

在将第二抽象信息及其类别标签加入历史抽象信息数据库时,为了避免出现信息重复和冗余的情况,在该实施方式中,首先将第二抽象信息与历史抽象信息数据库中的抽象信息进行匹配,若发现历史抽象信息数据库中不存在与第二抽象信息匹配的抽象信息时,就将所述第二抽象信息及其类别标签加入历史抽象信息数据库,若发现历史抽象信息数据库中存在与第二抽象信息匹配的抽象信息时,就不将所述第二抽象信息及其类别标签加入历史抽象信息数据库中,而是对其作删除处理。

对于所述步骤s102,在本实施例的一个可选实现方式中,在获取待处理信息的类别标签时,可与上文描述类似,先确定所述待处理信息的关键词,然后根据所述待处理信息的关键词,结合所述预设类别数据库生成所述待处理信息的类别标签。比如对于一个保险新业务“一生保”,其关键词为“一生保”,结合所述预设类别数据库可知该业务所属的类别应为“保险”。

对于所述步骤s102,在本实施例的一个可选实现方式中,在将所述待处理信息类别标签与所述抽象信息数据库中的类别标签进行匹配,得到与匹配类别标签相应的目标抽象信息时,可基于文字或字段匹配的方法来实现,对此,本发明不作过多描述。

在本实施例的一个可选实现方式中,如图6所示,所述步骤s103,即将所述待处理信息与所述目标抽象信息进行融合,得到目标信息的步骤,包括以下步骤s601-s603:

在步骤s601中,获取所述待处理信息的目标抽象字段;

在步骤s602中,确定所述目标抽象信息包含的未定抽象字段位置;

在步骤s603中,使用所述待处理信息的目标抽象字段替换所述目标抽象信息的未定抽象字段,得到目标信息。

在该实施方式中,在将待处理信息与目标抽象信息相融合,得到具体的目标信息时,首先获取所述待处理信息的目标抽象字段,然后确定所述目标抽象信息中未定抽象字段所在的位置,最后使用所述待处理信息的目标抽象字段替换所述目标抽象信息的未定抽象字段,即可得到可面向用户显示并供其进行选择的目标信息。

举例来说,对于一个保险新业务“一生保”,若想要基于该业务建立自动应答机制时,首先确定并获取该新业务的目标抽象字段,即“一生保”,然后确定与该新业务的类别标签“保险”相应的目标抽象信息:{xx}的保障期限、{xx}的生效时间、{xx}的理赔条例,{xx}报销对医院的要求等等,以及未定抽象字段在所述目标抽象信息中的位置,最后使用该新业务的目标抽象字段“一生保”替换所述目标抽象信息中的未定抽象字段{xx},即可得到可面向用户显示供其进行选择目标信息:一生保的保障期限、一生保的生效时间、一生保的理赔条例,一生保报销对医院的要求。

下述为本发明装置实施例,可以用于执行本发明方法实施例。

图7示出根据本发明一实施方式的信息处理装置的结构框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图7所示,所述信息处理装置包括:

第一获取模块701,被配置为获取抽象信息数据库,其中,所述抽象信息数据库中包括多条抽象信息及其相应的类别标签;

第二获取模块702,被配置为获取待处理信息及其类别标签,并将所述待处理信息类别标签与所述抽象信息数据库中的类别标签进行匹配,得到与匹配类别标签相应的目标抽象信息;

融合模块703,被配置为将所述待处理信息与所述目标抽象信息进行融合,得到目标信息。

上文提及,目前的自动应答策略不仅人工和时间成本高昂,工作效率低下,而且也很难满足用户的需求。考虑到上述问题,在该实施方式中,提出一种信息处理装置,该装置第一获取模块701获取抽象信息数据库;第二获取模块702获取待处理信息及其类别标签,并将所述待处理信息类别标签与所述抽象信息数据库中的类别标签进行匹配,得到与匹配类别标签相应的目标抽象信息;融合模块703将所述待处理信息与所述目标抽象信息进行融合,得到目标信息。该技术方案能够大大节省自动应答机制的筹备和维护成本,提高工作效率,同时还能够提高用户的满意度。

其中,所述抽象信息数据库是由众多抽象信息组成的数据库,具体地,所述抽象信息数据库包括多条抽象信息及其相应的类别标签,所述抽象信息包含有一个或多个未定字段,比如所述抽象信息可以为基于一个含有主题字段的具体问题生成的含有未定主题字段的抽象问题,其中,所述主题字段用于表征这个问题所针对的提问对象。所述抽象信息的类别标签用于表征所述抽象信息或者说所述主题字段所属的类别,所述类别标签可以为购物、银行、保险、旅游、政策等等。举例来说,对于一个具体的问题:乐业保能保障多长时间,这个问题所针对的提问对象,即其主题字段为“乐业保”,那么基于这样的具体问题生成的抽象问题可以为:{xx}保障时间,其中,{xx}表示对应于主题字段“乐业保”的未定主题字段,该抽象问题的类别标签就为“乐业保”所属的类别“保险”。

在本实施例的一个可选实现方式中,所述待处理信息可以为待处理的新业务、新项目等待处理对象,其类别标签用于表征所述待处理信息所属的类别,与上文所述类似,所述类别标签比如可以为购物、银行、保险、旅游、政策等等。

在本实施例的一个可选实现方式中,所述待处理信息与目标抽象信息之间的融合指的是基于待处理信息对于所述目标抽象信息的具体化,比如将所述目标抽象问题中的未定主题字段替换为待处理信息中的具体的主题字段,进而生成一个具体的问题。

当然,在进行抽象化生成抽象问题时,还可以基于其他字段或者其他信息进行抽象,进而后续在融合时就可针对所选择的抽象信息进行相应的具体化。应当注意的是,上述基于主题字段的抽象化仅为本发明的示例性说明,而不应当理解为是对于本发明的限制。

在本实施例的一个可选实现方式中,如图8所示,所述第一获取模块701包括:

第一获取子模块801,被配置为获取历史抽象信息数据库;

第二获取子模块802,被配置为获取预设历史时间段内的日志信息,根据所述日志信息生成第一抽象信息及其类别标签;

第一聚类子模块803,被配置为对所述第一抽象信息及其类别标签进行聚类处理,得到第二抽象信息及其类别标签;

第一添加子模块804,被配置为将所述第二抽象信息及其类别标签加入历史抽象信息数据库。

上文提及,目前的自动应答策略存在标准问题库不能实时更新的问题,从而导致很多用户的交互内容无法得到准确地识别,进而匹配不到用户想要的答复。为了对于标准问题库实时更新,使其尽可能地具备完备性,在该实施方式中,基于实时获取的日志信息对于标准问题库进行更新,具体地,第一获取子模块801获取历史抽象信息数据库;第二获取子模块802获取预设历史时间段内的日志信息,并根据所述日志信息生成初步的第一抽象信息及其类别标签;第一聚类子模块803对所述第一抽象信息及其类别标签进行聚类处理,得到第二抽象信息及其类别标签;第一添加子模块804将所述第二抽象信息及其类别标签加入到历史抽象信息数据库中,得到最新的抽象信息数据库。

其中,所述历史抽象信息数据库指的是之前已经存在的一个抽象信息数据库,若之前并不存在这样的抽象信息数据库,则可根据历史抽象信息新建一个抽象信息数据库。

其中,所述预设历史时间段可根据实际应用的需要进行设置,具体可根据历史抽象信息数据库的规模、历史抽象信息数据库的更新时间、日志信息的大小等因素来综合考虑设置。

其中,所述日志信息指的是与信息处理相关的日志信息,比如关于用户问题的日志信息。所述日志信息用于产生抽象信息,以丰富抽象信息数据库。

在本实施例的一个可选实现方式中,如图9所示,所述第二获取子模块802包括:

第三获取子模块901,被配置为获取预设历史时间段内的日志信息;

第一确定子模块902,被配置为确定所述日志信息的目标抽象字段和关键词;

第一替换子模块903,被配置为将所述日志信息的目标抽象字段替换为未定抽象字段,得到第一抽象信息;

生成子模块904,被配置为根据所述关键词生成所述第一抽象信息的类别标签。

为了基于日志信息生成准确的抽象信息,在该实施方式中,第一确定子模块902确定第三获取子模块901获取的日志信息的目标抽象字段和日志信息关键词,第一替换子模块903将所述日志信息的目标抽象字段替换为未定抽象字段,得到第一抽象信息,生成子模块904再根据日志信息的关键词,结合预设类别数据库生成所述第一抽象信息的类别标签。

以目标抽象字段为主题字段为例,若所述日志信息包括:乐业保为什么会失效呢、乐业保为什么会失效、乐业保保障多长时间、乐业保保障期限是多久、乐业保保障时间、乐业保的保障时间是什么时候、乐业保能保障多长时间、乐业保可以保多长时间、乐业保是即买即生效吗、乐业保要多长时间才能生效、乐业保为什么不赔、乐业保为什么不理赔、乐业保对医院的要求、乐业保报销要在什么医院就诊、乐业保的医院要求、乐业保对医院有什么要求、乐业保要在哪些医院看病才能报,所述主题字段也就是提问的对象为“乐业保”,提取的关键词可为“乐业保”、“理赔”、“医院”、“保障期限”、“生效时间”,那么基于上述日志信息生成的第一抽象信息可以为:{xx}为什么会失效呢、{xx}为什么会失效、{xx}保障多长时间、{xx}保障期限是多久、{xx}保障时间、{xx}的保障时间是什么时候、{xx}能保障多长时间、{xx}可以保多长时间、{xx}是即买即生效吗、{xx}要多长时间才能生效、{xx}为什么不赔、{xx}为什么不理赔、{xx}对医院的要求、{xx}报销要在什么医院就诊、{xx}的医院要求、{xx}对医院有什么要求、{xx}要在哪些医院看病才能报,其相应的类别标签为“保险”。

其中,所述类别数据库可预先根据历史关键词信息和历史类别信息创建,所述类别数据库中包括多个关键词及其与相应类别标签之间的对应关系。

在本实施例的一个可选实现方式中,如图10所示,所述第一聚类子模块803包括:

第二聚类子模块1001,被配置为对所述第一抽象信息及其类别标签进行聚类处理,得到聚类抽象信息及其类别标签;

审核子模块1002,被配置为对所述聚类抽象信息及其类别标签进行审核处理,得到第二抽象信息及其类别标签。

为了进一步提高抽象信息的准确性,在该实施方式中,还加入了对于聚类后得到的信息进行审核处理的部分,即第二聚类子模块1001对所述第一抽象信息及其类别标签进行聚类处理,得到聚类抽象信息及其类别标签;审核子模块1002对所述聚类抽象信息及其类别标签进行审核处理,得到可以加入抽象信息数据库的第二抽象信息及其类别标签。

在本实施例的一个可选实现方式中,在第二聚类子模块1001对所述第一抽象信息及其类别标签进行聚类处理时,可采用基于文本相似度的聚类方法,当然也可以采用其他聚类方法,本发明对其不作具体限定。比如,对于上文基于日志信息生成的第一抽象信息:{xx}为什么会失效呢、{xx}为什么会失效、{xx}保障多长时间、{xx}保障期限是多久、{xx}保障时间、{xx}的保障时间是什么时候、{xx}能保障多长时间、{xx}可以保多长时间、{xx}是即买即生效吗、{xx}要多长时间才能生效、{xx}为什么不赔、{xx}为什么不理赔、{xx}对医院的要求、{xx}报销要在什么医院就诊、{xx}的医院要求、{xx}对医院有什么要求、{xx}要在哪些医院看病才能报,经过聚类处理后得到的第二抽象信息可以为{xx}的保障期限、{xx}的生效时间、{xx}的理赔条例,{xx}报销对医院的要求等等,其中,第二抽象信息的类别标签保持不变,仍然为“保险”。当然,其他类别标签的第一抽象信息的聚类处理也可以按照上述方式来进行,以生成对应类别标签的第二抽象信息。

其中,所述审核子模块1002的具体实现方式可根据实际应用的需要进行设置,比如可包括:剔除无效信息,其中,所述无效信息可以为以下类型信息中的一种或多种:存在非法字符的信息、无明显意图的信息、抽象错误的信息、抽象失败的信息、重复信息等等;删除存在不同意图的信息;合并相同或相似的信息;审核类别标签的正确性;为缺失类别标签的信息生成类别标签等等。

在本实施例的一个可选实现方式中,如图11所示,所述第一添加子模块804包括:

匹配子模块1101,被配置为将所述第二抽象信息与所述历史抽象信息数据库中的抽象信息进行匹配;

第二添加子模块1102,被配置为当所述历史抽象信息数据库中不存在与所述第二抽象信息匹配的抽象信息时,将所述第二抽象信息及其类别标签加入历史抽象信息数据库;

删除子模块1103,被配置为当所述历史抽象信息数据库中存在与所述第二抽象信息匹配的抽象信息时,删除所述第二抽象信息及其类别标签。

在将第二抽象信息及其类别标签加入历史抽象信息数据库时,为了避免出现信息重复和冗余的情况,在该实施方式中,匹配子模块1101将第二抽象信息与历史抽象信息数据库中的抽象信息进行匹配,若发现历史抽象信息数据库中不存在与第二抽象信息匹配的抽象信息时,第二添加子模块1102就将所述第二抽象信息及其类别标签加入历史抽象信息数据库,若发现历史抽象信息数据库中存在与第二抽象信息匹配的抽象信息时,删除子模块1103就不将所述第二抽象信息及其类别标签加入历史抽象信息数据库中,而是对其作删除处理。

对于所述第二获取模块702,在本实施例的一个可选实现方式中,在第二获取模块702获取待处理信息的类别标签时,可与上文描述类似,先确定所述待处理信息的关键词,然后根据所述待处理信息的关键词,结合所述预设类别数据库生成所述待处理信息的类别标签。比如对于一个保险新业务“一生保”,其关键词为“一生保”,结合所述预设类别数据库可知该业务所属的类别应为“保险”。

对于所述第二获取模块702,在本实施例的一个可选实现方式中,在将所述待处理信息类别标签与所述抽象信息数据库中的类别标签进行匹配,得到与匹配类别标签相应的目标抽象信息时,可基于文字或字段匹配的方法来实现,对此,本发明不作过多描述。

在本实施例的一个可选实现方式中,如图12所示,所述融合模块703包括:

第四获取子模块1201,被配置为获取所述待处理信息的目标抽象字段;

第二确定子模块1202,被配置为确定所述目标抽象信息包含的未定抽象字段位置;

第二替换子模块1203,被配置为使用所述待处理信息的目标抽象字段替换所述目标抽象信息的未定抽象字段,得到目标信息。

在该实施方式中,第四获取子模块1201获取所述待处理信息的目标抽象字段,第二确定子模块1202确定所述目标抽象信息中未定抽象字段所在的位置,第二替换子模块1203使用所述待处理信息的目标抽象字段替换所述目标抽象信息的未定抽象字段,即可得到可面向用户显示并供其进行选择的目标信息。

举例来说,对于一个保险新业务“一生保”,若想要基于该业务建立自动应答机制时,首先确定并获取该新业务的目标抽象字段,即“一生保”,然后确定与该新业务的类别标签“保险”相应的目标抽象信息:{xx}的保障期限、{xx}的生效时间、{xx}的理赔条例,{xx}报销对医院的要求等等,以及未定抽象字段在所述目标抽象信息中的位置,最后使用该新业务的目标抽象字段“一生保”替换所述目标抽象信息中的未定抽象字段{xx},即可得到可面向用户显示供其进行选择目标信息:一生保的保障期限、一生保的生效时间、一生保的理赔条例,一生保报销对医院的要求。

本发明实施例还公开了一种电子设备,图13示出根据本发明一实施方式的电子设备的结构框图,如图13所示,所述电子设备1300包括存储器1301和处理器1302;其中,

所述存储器1301用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器1302执行以实现上述任一方法步骤。

图14适于用来实现根据本发明实施方式的信息处理方法的计算机系统的结构示意图。

如图14所示,计算机系统1400包括中央处理单元(cpu)1401,其可以根据存储在只读存储器(rom)1402中的程序或者从存储部分1408加载到随机访问存储器(ram)1403中的程序而执行上述实施方式中的各种处理。在ram1403中,还存储有系统1400操作所需的各种程序和数据。cpu1401、rom1402以及ram1403通过总线1404彼此相连。输入/输出(i/o)接口1405也连接至总线1404。

以下部件连接至i/o接口1405:包括键盘、鼠标等的输入部分1406;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1407;包括硬盘等的存储部分1408;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1409。通信部分1409经由诸如因特网的网络执行通信处理。驱动器1410也根据需要连接至i/o接口1405。可拆卸介质1411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1410上,以便于从其上读出的计算机程序根据需要被安装入存储部分1408。

特别地,根据本发明的实施方式,上文描述的方法可以被实现为计算机软件程序。例如,本发明的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行所述信息处理方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分1409从网络上被下载和安装,和/或从可拆卸介质1411被安装。

附图中的流程图和框图,图示了按照本发明各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

作为另一方面,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本发明实施例的方法。

以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本发明实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1