一种数据处理方法、装置及电子设备与流程

文档序号:18060269发布日期:2019-07-03 03:02阅读:148来源:国知局
一种数据处理方法、装置及电子设备与流程
本申请涉及智能客服
技术领域
,尤其涉及一种数据处理方法、装置及电子设备。
背景技术
:在智能客服系统中,用户通过客服系统输入想要问的问题,智能客服根据用户的问题进行解答,由于用户的技术水平或产品使用的知识参差不齐,因此可能提出无效的问题,由此客服系统可能会进行多轮无效对话,导致对用户解答问题的效率降低,严重影响用户使用体验。因此,目前亟需一种能够对用户问题进行有效性判定的技术方案。技术实现要素:有鉴于此,本申请提供一种数据处理方法,包括:获取目标问题语句;基于所述目标问题语句,确定目标物体;判断所述目标物体是否满足第一条件,以得到判断结果;基于所述判断结果,输出反馈信息;其中,所述反馈信息包括对所述第一条件的判断信息,或者,所述反馈信息包括所述目标问题语句的答案信息和对所述第一条件的判断信息。上述方法,优选的,基于所述判断结果,输出反馈信息,包括:输出所述目标问题语句的答案信息,之后,输出对所述第一条件的判断信息。上述方法,优选的,所述第一条件基于所述目标物体及所述目标问题语句生成。上述方法,优选的,判断所述目标物体是否满足第一条件,以得到判断结果,包括:基于所述目标物体的物体属性,获得所述目标物体的知识图谱;判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果。上述方法,优选的,还包括:获得所述目标问题语句的问题类型;其中,判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果,包括:如果所述目标问题语句的问题类型属于数值类型,通过第一方式判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果;如果所述目标问题语句的问题类型属于非数值类型,通过第二方式判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果。上述方法,优选的,通过第一方式判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果,包括:基于所述目标物体的知识图谱,生成所述目标物体的属性判定规则;判断所述属性判定规则是否满足第一条件,以得到判断结果。上述方法,优选的,通过第二方式判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果,包括:对所述目标物体的知识图谱及所述第一条件进行联合建模,以得到模型数据;对所述模型数据进行量化处理,得到标量值;判断所述标量值是否大于或等于标量阈值,以得到判断结果。上述方法,优选的,基于所述判断结果,输出反馈信息,包括:如果所述判断结果表征所述目标物体满足所述第一条件,输出所述目标问题语句的答案信息;如果所述判断结果表征所述目标物体不满足所述第一条件,输出对所述第一条件的判断信息和所述目标问题语句的答案信息。本申请还提供了一种数据处理装置,包括:接收单元,用于获得目标问题语句;确定单元,用于基于所述目标问题语句,确定目标物体;判断单元,用于判断所述目标物体是否满足第一条件,以得到判断结果;输出单元,用于基于所述判断结果,输出反馈信息;其中,所述反馈信息包括对所述第一条件的判断信息,或者,所述反馈信息包括所述目标问题语句的答案信息和对所述第一条件的判断信息本申请还提供了一种电子设备,包括:交互设备,用于获取目标问题语句;处理设备,基于所述目标问题语句,确定目标物体;判断所述目标物体是否满足第一条件,以得到判断结果,基于所述判断结果,通过所述交互设备输出反馈信息;其中,所述反馈信息包括对所述第一条件的判断信息,或者,所述反馈信息包括所述目标问题语句的答案信息和对所述第一条件的判断信息。从上述技术方案可以看出,本申请提供的一种数据处理方法、装置及电子设备中,在获取到目标问题语句之后,首先确定对应的目标物体,进而基于该目标问题语句对应的目标物体是否满足第一条件的判断结果来输出相应的反馈信息,而该反馈信息中包括有对第一条件的判断信息或者还包括对目标问题语句的答案信息。可见,本申请中在接收到问题语句之后,并不直接对问题进行答复,而是首先对其进行判断,如判断对应的目标物体是否满足第一条件,从而实现对问题的有效性判断之后,再选择是否回复该问题的答案,进而提高对问题解答的效率,明显改善用户体验。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例一提供的一种数据处理方法的流程图;图2为本申请实施例的应用示例图;图3为本申请实施例一的部分流程图;图4为本申请实施例二提供的一种数据处理装置的结构示意图;图5为本申请实施例三提供的一种电子设备的结构示意图;图6为本申请实施例三提供的一种电子设备的功能架构图;图7及图8分别为本申请实施例的其他应用示例图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。如图1中所示,为本申请实施例一提供的一种数据处理方法的流程图,该方法适用于电子设备中,如笔记本或服务器等,该电子设备能够提供针对某个物体或产品的问答服务,如电子设备中安装有智能客服应用,为用户对产品的使用提供问题答复及技术交流等。具体的,本实施例中可以包括以下步骤:步骤101:获得目标问题语句。其中,目标问题语句可以为电子设备上通过输入输出设备所接收到的通信对方发送的问题语句。如图2中所示,某个用户通过自己的手机与本实施例中服务器的客服系统之间建立有客服连接,如用户在自己手机上打开客服系统的对话框,服务器客服系统对开启的对话框进行响应,建立通信连接。具体的,目标问题语句可以为针对某个物体如产品的问题语句,例如,用户在自己手机的对话框中输入“产品如何使用刷卡功能”或“如何拆卸产品外壳”等问题,这些问题语句通过用户手机与本实施例中服务器之间的连接进行传输,相应的,本实施例中获得这些问题语句。需要说明的是,用户手机与本实施例服务器之间可以通过wifi或移动通信等方式进行数据传输,也可以通过网络有线连接进行数据传输。其中,本实施例中在获得目标问题语句之后,可以对目标问题语句进行预处理,如过滤掉打招呼、寒暄或闲聊等字词,过滤掉长度小于某个阈值的语句,或者,将多个短句合并成一个长句,等等。步骤102:基于目标问题语句,确定目标物体。其中,目标问题语句为针对某个物体如产品或用户的问题语句,本实施例中可以通过对目标问题语句进行字符识别或语义识别等方式,确定目标问题语句所对应的目标物体。例如,目标问题语句为“这个手机怎么刷卡?”,本实施例中可以利用字符识别算法对目标问题语句进行识别,解析出“这个手机”字符,结合历史通信信息、预置信息或者目标问题语句所属用户的配置信息等,可以确定“这个手机”所对应的目标物体为a型号的手机。或者例如,目标问题语句为“那个演员是谁”,本实施例中可以利用字符识别算法对目标问题语句进行识别,解析出“那个演员”字符,结合历史通信信息、预置信息或者目标问题语句所属用户的配置信息等,可以确定“那个演员”所对应的目标物体为穿蓝色衣服的人。步骤103:判断目标物体是否满足第一条件,以得到判断结果。其中,第一条件可以为表征目标问题语句中针对目标物体所具有的特征条件,相应的,本实施例中判断目标物体是否满足第一条件,就可以判断出目标问题语句中对目标物体的描述是否与目标物体相匹配,这样就可以判断出目标问题语句是否为有效问题语句。步骤104:基于判断结果,输出反馈信息。其中,反馈信息可以包括有:对第一条件的判断信息,即目标问题语句中针对目标物体所具有的特征是否与目标物体相匹配,即可表征目标问题语句是否为有效问题语句;或者,反馈信息可以包括有:针对目标问题语句的答案信息和对第一条件的判断信息,也就是说,本实施例中不仅可以输出对第一条件的判断信息,而且不论对第一条件的判断信息中目标问题语句是否为有效问题语句,还会输出针对目标问题语句的答案信息。例如,如果判断结果表明目标物体满足第一条件,即目标问题语句为有效问题语句,那么可以直接对目标问题语句进行答复,即输出目标问题语句的答案信息,进一步的,还可以输出对第一条件的判断信息;而如果判断判断结果表明目标物体不满足第一条件,即目标问题语句不是有效问题语句,那么可以直接输出对第一条件的判断信息,以提示目标问题语句的所属用户所提出的问题并不符合对应的目标物体,如产品或人;或者,如果判断出结果表明目标物体不满足第一条件,那么既可以输出目标问题语句的答案信息,同时输出对第一条件的判断信息,也就是说,即使对目标问题语句进行答复,也会同时提醒目标问题语句的所属用户所提出的问题并不符合对应的目标物体,如产品或人。从上述技术方案可以看出,本申请实施例一提供的一种数据处理方法中,在获取到目标问题语句之后,首先确定对应的目标物体,进而基于该目标问题语句对应的目标物体是否满足第一条件的判断结果来输出相应的反馈信息,而该反馈信息中包括有对第一条件的判断信息或者还包括对目标问题语句的答案信息。可见,本实施例中在接收到问题语句之后,并不直接对问题进行答复,而是首先对其进行判断,如判断对应的目标物体是否满足第一条件,从而实现对问题的有效性判断之后,再选择是否回复该问题的答案,进而提高对问题解答的效率,明显改善用户体验。在一种实现方式中,如果判断出结果表明目标物体不满足第一条件,那么本实施例中具体可以首先输出目标问题语句的答案信息,在输出答案信息之后,再输出对第一条件的判断信息,也就是说,本实施例中可以以问题答复优先,首先对目标问题语句进行答复,而即使对目标问题语句进行答复,也会紧接着输出对第一条件的判断信息,以及时提醒目标问题语句的所属用户所提出的问题并不符合对应的目标物体。在一种实现方式中,第一条件可以是基于目标物体及目标问题语句生成。即,基于目标问题语句中对目标物体的描述信息或特征,生成该第一条件。例如,目标问题语句中“这个手机怎么刷卡?”,相应的,目标物体为a型号的手机,目标问题语句中包含“手机”、“刷卡”及“怎么”的词语,相应的,利用词义识别等算法,可以确定出目标问题语句中对“手机”的描述特征即为:“a型号的手机能够刷卡”。由此,本实施例中基于目标问题语句和目标物体所生成的第一条件为:“a型号的手机能够刷卡””;再如,目标问题语句为“那个演员是谁”,本实施例中可以利用字符识别算法对目标问题语句进行识别,解析出目标物体为穿蓝色衣服的人,目标问题语句中包含“那个”、“演员”及“谁”,相应的,利用词义识别算法,可以确定出目标问题语句中对“穿蓝色衣服的人”的描述特征为:“穿蓝色衣服的人是演员”。相应的,本实施例中判断目标物体是否满足第一条件,具体可以通过以下步骤实现,如图3中所示:步骤301:基于目标物体的物体属性,获得目标物体的知识图谱。其中,目标物体的物体属性是指目标物体本身所具有的属性,如功能属性或者配置属性等,如处理器版本、系统版本、内存、摄像头等属性。本实施例中可以利用预设的图谱构建算法基于目标物体的物体属性构建目标物体的知识图谱。步骤302:判断目标物体的知识图谱是否满足第一条件,以得到判断结果。具体的,本实施例中将第一条件中目标问题语句对目标物体的描述特征与目标物体的知识图谱进行比对,以判断出目标物体的知识图谱是否匹配第一条件,从而得到判断结果。相应的,本实施例中在具体判断目标物体的知识图谱是否满足第一条件时,可以通过获得目标问题语句的问题类型来决定相应的判断方式,具体的有以下几种情况:第一种,如果目标问题语句的问题类型属于数值类型,那么可以通过第一方式判断目标物体的知识图谱是否满足第一条件,以得到判断结果。第二中,如果目标问题语句的问题类型属于非数值类型,如字符类型等,那么可以通过第二方式判断目标物体的知识图谱是否满足第一条件,以得到判断结果。可见,本实施例中基于目标问题语句的问题类型选择不同的方式实现知识图谱与第一条件之间的判断。其中,第一方式中,具体可以为:首先,基于目标物体的知识图谱,生成目标物体的属性判定规则,之后,再判断该目标物体的属性判定规则是否满足第一条件,以得到判断结果。例如,本实施例中基于目标物体的知识图谱,在预设的标准模板基础上预先定判定规则,如“内存小于或等于32gb”的规则或“像素低于200万”的规则等,相应的,本实施例中判断目标物体的这些规则与第一条件是否匹配,得到判断结果,如果这些规则与第一条件中目标问题语句中对目标物体的描述特征相匹配,那么表明目标问题语句为有效语句,相应的可以直接输出目标问题语句的答案信息,而如果这些规则与第一条件中目标问题语句对目标问题的描述特征不匹配,那么表明目标问题语句为无效语句,相应的,可以仍然输出目标问题语句的答案信息,也会输出对该第一条件即目标问题语句相应的判断信息。如,目标问题语句为“这个手机可以使用128g的内存卡吗?”,本实施例中基于该语句及该语句中的目标物体“这个手机”生成第一条件,该第一条件中包含对目标物体的描述特征“使用128g内存”,本实施例中可以通过构建目标物体的知识图谱,并将该知识图谱生成的属性判定规则“内存小于32gb”与第一条件“使用128g内存”进行比对,明显的,“内存小于32gb”与“使用128g内存”无法匹配,此时得到判断结果,输出问题答复“不能使用”,并输出对第一条件的判断信息“无效问题”。在第二种方式中,具体可以为:首先,对目标物体的知识图谱及第一条件进行联合建模,如以目标物体的产品三元组及第一条件中对目标物体的描述特征作为输入数据,建立基于attention机制的lstm模型,并运行模型,以得到模型数据,之后,对模型数据进行量化处理,得到标量值,再判断标量值是否大于或等于标量阈值,得到判断结果,其中,如果标量值大于标量阈值,表明目标问题语句为有效问题,则之后直接输出对目标问题语句的答案信息,如果标量值不大于标量阈值,那么表明目标问题语句为无效问题,则之后输出对第一条件的判断信息,即认为目标问题语句无效的判断信息。例如,目标问题语句中“这个手机怎么刷卡?”,相应的,目标物体为a型号的手机,本实施例中利用a型号手机的知识图谱及第一条件中“a型号的手机刷卡”作为模型输入数据,对建立的基于attention机制的lstm模型进行运行,得到模型数据及其量化后的标量值。由此,如标量值为0.7,其大于标量阈值0.5,那么,得到的判断结果即表明目标问题语句为有效问题,此时输出针对目标问题语句的答案信息:“手机进行刷卡的操作流程”,如果标量值为0.3,明显小于标量阈值0.5,那么此时得到判断结果,相应的,可以在输出对目标问题语句的答案信息“手机进行刷卡的操作流程”之后,输出对第一条件的判断信息“该手机不支持刷卡功能”。如图4中所示,为本申请实施例二提供的一种数据处理装置的结构示意图,该装置可以适用于电子设备中,如笔记本或服务器中,该电子设备能够提供针对某个物体或产品的问答服务,如电子设备中安装有智能客服应用,为用户对产品的使用提供问题答复及技术交流等。在本实施例中,该数据处理装置可以包括以下结构:接收单元401,用于获得目标问题语句。确定单元402,用于基于所述目标问题语句,确定目标物体。判断单元403,用于判断所述目标物体是否满足第一条件,以得到判断结果。其中,第一条件基于所述目标物体及所述目标问题语句生成。具体的,判断单元403判断所述目标物体是否满足第一条件,以得到判断结果,具体可以为:基于所述目标物体的物体属性,获得所述目标物体的知识图谱,之后,判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果。需要说明的是,判断单元403具体可以通过获得目标问题语句的问题类型之后,基于问题类型属于数值类型还是属于非数值类型采用相应的方式进行判断,例如:如果所述目标问题语句的问题类型属于数值类型,通过第一方式判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果,其中,第一方式可以为:基于所述目标物体的知识图谱,生成所述目标物体的属性判定规则,判断所述属性判定规则是否满足第一条件,以得到判断结果。如果所述目标问题语句的问题类型属于非数值类型,通过第二方式判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果,其中,第二方式可以为:对所述目标物体的知识图谱及所述第一条件进行联合建模,以得到模型数据;对所述模型数据进行量化处理,得到标量值;判断所述标量值是否大于或等于标量阈值,以得到判断结果。输出单元404,用于基于所述判断结果,输出反馈信息。其中,所述反馈信息包括对所述第一条件的判断信息,或者,所述反馈信息包括所述目标问题语句的答案信息和对所述第一条件的判断信息。具体的,输出单元404基于所述判断结果,输出反馈信息时具体可以通过以下方式实现:输出所述目标问题语句的答案信息,之后,输出对所述第一条件的判断信息。例如,如果所述判断结果表征所述目标物体满足所述第一条件,输出单元404输出所述目标问题语句的答案信息;如果所述判断结果表征所述目标物体不满足所述第一条件,输出单元404输出所述目标问题语句的答案信息,之后再输出对所述第一条件的判断信息。可见,本申请实施例二提供的一种数据处理装置中,在获取到目标问题语句之后,首先确定对应的目标物体,进而基于该目标问题语句对应的目标物体是否满足第一条件的判断结果来输出相应的反馈信息,而该反馈信息中包括有对第一条件的判断信息或者还包括对目标问题语句的答案信息。可见,本实施例中在接收到问题语句之后,并不直接对问题进行答复,而是首先对其进行判断,如判断对应的目标物体是否满足第一条件,从而实现对问题的有效性判断之后,再选择是否回复该问题的答案,进而提高对问题解答的效率,明显改善用户体验。需要说明的是,本实施例装置中各单元的实现方式及举例说明可以参考前文中相应内容,此处不再详述。参考图5,为本申请实施例三提供的一种电子设备的结构示意图,该电子设备可以为计算机或服务器等能够进行数据处理的设备,该电子设备能够提供针对某个物体或产品的问答服务,如电子设备中安装有智能客服应用,为用户对产品的使用提供问题答复及技术交流等。具体的,本实施例中的电子设备可以包括以下结构:交互设备501,用于获取目标问题语句。其中,交互设备501可以为输入输出设备,或者,可以为与输入输出设备相连接的设备,用以获得目标问题语句,例如,用户在服务器的触控屏上输入目标问题语句,或者,用户通过自己的手机输入目标问题语句后,本实施例中服务器通过交互设备501接收用户手机发送的目标问题语句。处理设备502,基于所述目标问题语句,确定目标物体;判断所述目标物体是否满足第一条件,以得到判断结果,基于所述判断结果,通过所述交互设备501输出反馈信息。其中,所述反馈信息包括对所述第一条件的判断信息,或者,所述反馈信息包括所述目标问题语句的答案信息和对所述第一条件的判断信息。具体的,处理设备502判断所述目标物体是否满足第一条件,以得到判断结果,具体可以为:基于所述目标物体的物体属性,获得所述目标物体的知识图谱,之后,判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果。需要说明的是,处理设备502具体可以通过获得目标问题语句的问题类型之后,基于问题类型属于数值类型还是属于非数值类型采用相应的方式进行判断,例如:如果所述目标问题语句的问题类型属于数值类型,通过第一方式判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果,其中,第一方式可以为:基于所述目标物体的知识图谱,生成所述目标物体的属性判定规则,判断所述属性判定规则是否满足第一条件,以得到判断结果。如果所述目标问题语句的问题类型属于非数值类型,通过第二方式判断所述目标物体的知识图谱是否满足第一条件,以得到判断结果,其中,第二方式可以为:对所述目标物体的知识图谱及所述第一条件进行联合建模,以得到模型数据;对所述模型数据进行量化处理,得到标量值;判断所述标量值是否大于或等于标量阈值,以得到判断结果。具体的,处理设备502基于所述判断结果,输出反馈信息时具体可以通过以下方式实现:输出所述目标问题语句的答案信息,之后,输出对所述第一条件的判断信息。例如,如果所述判断结果表征所述目标物体满足所述第一条件,处理设备502输出所述目标问题语句的答案信息;如果所述判断结果表征所述目标物体不满足所述第一条件,处理设备502输出所述目标问题语句的答案信息,之后再输出对所述第一条件的判断信息。可见,本申请实施例三提供的一种电子设备中,在获取到目标问题语句之后,首先确定对应的目标物体,进而基于该目标问题语句对应的目标物体是否满足第一条件的判断结果来输出相应的反馈信息,而该反馈信息中包括有对第一条件的判断信息或者还包括对目标问题语句的答案信息。可见,本实施例中在接收到问题语句之后,并不直接对问题进行答复,而是首先对其进行判断,如判断对应的目标物体是否满足第一条件,从而实现对问题的有效性判断之后,再选择是否回复该问题的答案,进而提高对问题解答的效率,明显改善用户体验。需要说明的是,本实施例电子设备中各结构的实现方式及举例说明可以参考前文中相应内容,此处不再详述。以下对本实施例中的技术方案在实际中的应用进行举例说明:首先,本实施例要解决的问题在于:对用户提出的问题进行有效性评估。本实施例中,首先从产品知识图谱中抽取能表征产品软硬件能力的特征,例如产品的cpu型号、系统版本、基带频率、感应器等属性三元组作为问题的隐含前提。之后,将用户问题分为数值型问题与非数值型问题两类。其中数值型问题采用模板或规则匹配系统进行处理,而非数值型问题采用基于attention机制的lstm神经网络模型来进行处理。其中,神经网络模型中同时接受产品属性三元组和用户问句作为输入,模型中的attention机制用来自动找出用户问句和产品属性三元组中的词/短语之间的对齐关系。本实施例中实现方案的核心要点在于:1、构建产品知识图谱,重点包括体现产品软硬件能力的特征,包括cpu、系统版本、网络制式、内存、摄像头、感应器等。将这些特征与产品功能构建使能关系图谱,从而辅助后面的用户问句有效性评估;2、对用户问题进行分类,将用户问题分为数值型和非数值型两类,数值型类的问题如手机支持的最大扩展内存、手机支持拍摄的最高分辨率等;3、采用自然语言处理技术将用户问题中包含的产品与产品知识图谱进行链接,从而丰富用户问句语义信息,为后面智能评估打下基础;4、对于非数值型的问题,采用基于attention机制的lstm神经网络,将用户问题与产品属性特征进行联合建模,自动发现用户问句和产品属性特征间的对应关系,比如用户问题是“如何开启5g”,那么用户问句就会与对应产品的通信模块特征进行链接。基于此,本实施例的优势在于:本实施例中对用户提出的问题有效性进行智能评估,可以大大减少用户问题无效时的轮询次数,从而提高问答质量。具体来讲,首先综合考虑用户问题信息和产品属性信息,通过模式匹配与基于attention机制的神经网络来发现用户问句与产品属性间的隐含关系,克服了传统智能客服缺乏问题相关知识信息的缺陷。第二,通过构建产品知识图谱,根据问题的内在语义信息,结合产品属性特征,大大提高了问题有效性判定的准确性。第三,对于无效问题可以尽早结束对话,从而提高客户满意度。第四:本实施例提出的方案能够在系统使用中不断调整,自我学习和完善,对用户问题有效性的评估精度会随着系统的推进而逐步完善;另外,本实施例提出的方案不需要人工进行大量数据标注,自动地从真实数据进行挖掘,具有较高的自动化程度。本方案扩展了智能客服的知识能力,优化了智能客服服务质量,提高了用户满意度,对用户理解和个性化客服等应用具有重要意义。具体的,本实施例中的技术方案可以通过多个功能模块实现,如图6中所示,结合图7中的实现流程图,对各模块的主要功能及工作流进行说明:1、训练语料挖掘模块:从实际的客服历史问句如数据库中存储的历史问题中,首先提取用户提出问句后的客服追问语句,如用户询问“如何用手机乘公交?”,那么客服可能会追问“您的手机支持nfc吗?”。通过此类追问问句可以获取用户问句与产品功能的隐含关联,而用户的回答又可以作为成品功能特征与用户问句有效性与否的学习样本。2、预处理模块:主要包括三种处理,第一,过滤掉打招呼,寒暄,闲聊等;第二,过滤掉长度小于某个阈值的短句;第三,合并多个连续短句,即如果用户的问题多次输入,则合并成一个。3、产品知识图谱构建模块:产品知识图谱应能够体现产品软硬件能力,如cpu、系统版本、网络制式、内存、摄像头、感应器等属性。将这些特征与产品功能构建使能关系图谱,从而辅助后面的用户问句有效性评估。知识图谱中的产品属性信息如表1所示。表1产品属性特征说明4.用户问题处理模块,至少包括分类模块、实体链接模块:首先,利用分类模块对用户问题进行并行化处理,其中分类模块采用常见的分类算法如fasttext将问句分为数值型问题与非数值型两类,如表2中所示,再利用实体链接模块将用户问句中包含的产品与产品属性特征三元组进行链接。进一步的,对于数值型问题可以通过逻辑处理模块进行比较,如用户的问题为如何拍摄4k视频,对应的手机支持的摄像头最多支持1080p视频拍摄,那么经过逻辑处理模块,便可判定用户问题为无效问题。对于非数值型问题,则需要通过基于attention机制的lstm神经网络模型来进行判定。表2用户问句类型示例问题id用户问题问题类型qa1motoz3支持拍摄4k视频吗?数值型qa2motoz3可以使用128g的内存卡吗?数值型qa3motoz3可以刷公交吗?非数值型qa4motoz3支持5g吗?非数值型数值型问题通过预设的标准模板匹配的方法进行处理,标准模板基于正则表达式设置。本实施例中可以首先将数值型问句与标准模板进行匹配,匹配结构为trie树。接着对于标准模板与产品属性预先定义了一组判定规则,如用户问题为“motoz3可以使用128g的内存卡吗?”对应模板为“$product|$support|$num|$memorycard”,通过实体链接查询产品知识图谱可以得到<motoz3,最大存储扩展容量,2tb>,相应的判定规则为“$num≤2tb”,通过单位归一化可以得到比较结果,进而可以得知用户问题为有效问题。5.神经网络模块本实施例中对于数值型问题交由逻辑处理模块进行判定,对于非数值型问题则交由lstm模型的神经网络模块进行判定。其中lstm模型具体操作过程如下:本实施例将用户问句作为假设,将知识图谱中得到的产品属性三元组作为前提,具体来说,就是将产品知识图谱中的属性三元组作为前提。本模型对前面得到的假设与前提进行联合建模,具体流程图如图8的示意图所示:用户问句与产品属性三元组通过两个不同的lstm神经网络进行处理,其中处理用户问句的lstm神经网络的记忆存储由处理产品属性三元组的lstm的最后一个神经元的记忆来初始化(如c5所示)。本实施例中采用神经网络模型来对用户问句和产品属性三元组进行向量化编码,之后通过一个线性投影层得到输入向量x。结合attention机制的lstm神经网络用来实现用户问题与产品属性三元组的具体特征的对齐。也就是说lstm不需要记录产品属性三元组的所有信息,而是只需要保留与用户问句相关的属性特征信息,这样一方面实现了用户问句与产品属性特征的对应,另一方面也减轻了神经网络的存储压力。令y∈rk*l表示第一个lstm神经网络输出向量[h1,h2,..,hl]组成的矩阵,l表示产品属性三元组包含的词的个数,k是一个超参数表示词向量的维度。此外,令el∈rl为全1向量,hn为两个lstm神经网络的最终输出向量。attention机制通过以下公式(1)、(2)、(3)得到权重向量α和产品属性特征的权重向量γ。α=softmax(wtm),α∈rl(2)γ=yαt,γ∈rk(3)其中wy、wh∈rk*k为需要训练的投影矩阵,w∈rk是参数向量,wt表示转置。最终的问句与产品属性三元组表示由非线性函数tanh作用于hn和γ得到,即公司(4):h*=tanh(wprn+wxhn),h*∈rk(4)这样h*再通过逻辑回归处理可以得到一个标量值,当这个值大于等于某个阈值如0.5时认为用户问题有效,否则无效。6.自学习优化模块:本实施例中对用户问题进行有效性评估后,会将该结果反馈给客服人员,客服人员会确定客户问题评估是否正确。如果客服认为评估结果正确,即本实施例中学习到了用户问句与产品属性间的对应关系及判定规则,比如用户问题为“怎么用motoz3作为空调遥控器”,那么本实施例中可以通过学习得到“空调遥控”与产品属性”是否支持红外”这一对应关系。反之,如果客服认为评估错误,那么有可能用户问句与产品属性并不存在对应关系或者学习到了错误的对应关系或者学习到了错误的判定方法。因此,本实施例中通过这样的方式可以获得大量的具备正确映射关系及判定方法的样本和不具备映射关系或者错误映射错误判定的样本,然后重新训练评估模型,实现系统的自学习优化。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或
技术领域
内所公知的任意其它形式的存储介质中。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1