本发明涉及文本处理,尤其是涉及一种银行拒识文本处理方法、装置、介质和设备。
背景技术:
1、为了提高效率,我们将人机交互型呼出业务整合到智能语音机器人中。一旦启用此功能,客户可以通过与机器人进行对话的方式来自主完成线上下单或咨询等操作。
2、尽管这种模式在银行相关业务中得到了广泛应用,但由于得到的文本可能存在数字与汉字交错、句式多变等特点,导致后续的意图识别结果往往存在较多错识或拒识的情况。这可能会使客户无法获得准确和合理的回答,进而导致有意向的客户在线上流失,最终对转化率造成一定的影响。
3、例如,可能存在下述案例:
4、--机器人:“您好,您本期账单金额5832元,其中分期金额5500元可办理12期分期,您看需要吗?”
5、--客户:“五千八百多,不对吧。”
6、其中,对于客户回答的内容“五千八百多,不对吧”。意图识别模型无法分清“五千八百多”具体指代的是“账单金额”,还是“分期金额”,这就会可能导致客户无法获得准确和合理的回答。
技术实现思路
1、基于此,有必要提供银行拒识文本处理方法、装置、介质和设备,以解决意图识别结果往往存在较多错识或拒识的情况的问题。
2、一种银行拒识文本处理方法,所述方法包括:
3、获取包含至少一个变量名和待处理数字文本的银行拒识文本;其中,所述银行拒识文本为无法被正确识别意图的银行文本;
4、识别目标数字文本的文本类型;其中,所述目标数字文本为至少一个待处理数字文本中的任意一个;
5、若所述文本类型为待处理类型,则基于所述银行拒识文本中所述目标数字文本前的变量名对所述目标数字文本进行更新,若所述文本类型为非处理类型,则保留所述目标数字文本;
6、获取对所述银行拒识文本进行更新后得到的银行更新文本。
7、在其中一个实施例中,所述识别目标数字文本的文本类型,包括:
8、当识别的所述目标数字文本的文本类型为日期类型或纯数字类型时,确定所述目标数字文本为待处理类型;其中,日期类型的待处理数字文本至少包含日和月,纯数字类型的待处理数字文本由数字组成;
9、当识别的所述目标数字文本的文本类型为生日类型或次数类型时,确定所述目标数字文本为非处理类型;其中,生日类型的待处理数字文本在前文中包含生日信息,次数类型的待处理数字文本中包含次数单位。
10、在其中一个实施例中,所述基于所述银行拒识文本中所述目标数字文本前的变量名对所述目标数字文本进行更新,包括:
11、若所述目标数字文本为日期类型的待处理数字文本,则基于所述银行拒识文本中所述目标数字文本前的变量名对所述目标数字文本进行替换更新;
12、若所述目标数字文本为纯数字类型的待处理数字文本,则基于所述银行拒识文本中所述目标数字文本前的变量名对所述目标数字文本进行补全更新。
13、在其中一个实施例中,一个变量列表包括多个相同含义的变量名,且每个变量列表设定有标准变量名,所述基于所述银行拒识文本中所述目标数字文本前的变量名对所述目标数字文本进行更新,包括:
14、在所述银行拒识文本中,若所述目标数字文本前的变量名中包括相同含义的变量名,则基于对应变量列表中的标准变量名对所述目标数字文本进行更新。
15、在其中一个实施例中,所述基于所述银行拒识文本中所述目标数字文本前的变量名对所述目标数字文本进行更新,包括:
16、在所述银行拒识文本中,若所述目标数字文本前包含多个不同含义的变量名,且每个变量名包含至少一个关联的相关数字,则使用与所述目标数字文本最接近的相关数字所对应的变量名对所述目标数字文本进行更新。
17、在其中一个实施例中,所述方法还包括:
18、若所述银行拒识文本中还包含待处理姓名文本,则基于所述银行拒识文本中所述待处理姓名文本前的变量名对所述待处理姓名文本进行替换更新。
19、在其中一个实施例中,所述方法还包括:
20、将所述银行更新文本输入意图识别模型,并获取输出的意图识别结果。
21、一种银行拒识文本处理装置,所述装置包括:
22、数据获取模块,用于获取包含至少一个变量名和待处理数字文本的银行拒识文本;其中,所述银行拒识文本为无法被正确识别意图的银行文本;
23、类型识别模块,用于识别目标数字文本的文本类型;其中,所述目标数字文本为至少一个待处理数字文本中的任意一个;
24、更新模块,用于若所述文本类型为待处理类型,则基于所述银行拒识文本中所述目标数字文本前的变量名对所述目标数字文本进行更新,若所述文本类型为非处理类型,则保留所述目标数字文本;获取对所述银行拒识文本进行更新后得到的银行更新文本。
25、一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述银行拒识文本处理方法的步骤。
26、一种银行拒识文本处理设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述银行拒识文本处理方法的步骤。
27、本发明提供了银行拒识文本处理方法、装置、介质和设备,可以根据目标数字文本前的变量名确定客户回答的数字文本具体指代的是哪个变量名并进行更新,从而将待处理数字文本转换为可以被意图识别模型理解和匹配的格式,提高意图识别的准确率。
1.一种银行拒识文本处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述识别目标数字文本的文本类型,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述银行拒识文本中所述目标数字文本前的变量名对所述目标数字文本进行更新,包括:
4.根据权利要求1所述的方法,其特征在于,一个变量列表包括多个相同含义的变量名,且每个变量列表设定有标准变量名,所述基于所述银行拒识文本中所述目标数字文本前的变量名对所述目标数字文本进行更新,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述银行拒识文本中所述目标数字文本前的变量名对所述目标数字文本进行更新,包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种银行拒识文本处理装置,其特征在于,所述装置包括:
9.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种银行拒识文本处理设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。