本申请涉及智能客服领域,尤其涉及一种相似问题的生成方法、装置、设备和介质。
背景技术:
1、在智慧客服场景下,机器人客服能够回答用户的问题,主要是依赖于机器人客服可以查询到的知识库,知识库中存储了大量与问题对应的标准回答。
2、现有技术中,知识库中对于问题场景会存储有一个标准问题描述,通过将用户的问题与知识库中的问题进行比对,从而确定该问题对应的答案。
3、然而,现有技术存在对用户问题和知识库中问题的比对不准确的问题,进而导致输出的问答结果不准确的问题。
技术实现思路
1、本申请提供一种相似问题的生成方法、装置、设备和介质,用以解决现有技术存在对用户问题和知识库中问题的比对不准确的问题,进而导致输出的问答结果不准确的问题。
2、第一方面,本申请提供一种相似问题的生成方法,方法包括:
3、获取初始问题集并对初始问题集中的初始问题进行编码,得到初始问题中字符的位置信息,初始问题集中包括多个问题组,每个问题组中包括一个初始问题及其对应的至少一个相似问题,每个问题组还对应答案信息;
4、根据初始问题的词语分布,对初始问题中的部分词语进行文字隐藏,得到隐藏问题;
5、根据位置信息对隐藏问题中隐藏的文字进行语义补充,得到补充后的问题;
6、将补充后的问题和对应问题组中的相似问题进行语义相似度比对,得到比对结果,并根据比对结果确定初始问题的增补相似问题;
7、根据增补相似问题和对应的答案确定相似问题集。
8、在本申请实施例中,获取初始问题集并对初始问题集中的初始问题进行编码,得到初始问题中字符的位置信息,包括:
9、根据初始问题中各个字符在问题中的字符顺序,确定各个字符的编码;
10、根据各个字符的编码,生成初始问题的编码。
11、在本申请实施例中,根据初始问题的词语分布,对初始问题中的部分词语进行文字隐藏,得到隐藏问题,包括:
12、根据词语分布,确定初始问题对应的隐藏矩阵、预设的隐藏值,隐藏矩阵中的矩阵元素用于表征初始问题中被隐藏的词语数量;
13、根据预设的隐藏值和初始问题的文字数量,确定初始问题的隐藏文字数量;
14、根据隐藏文字数量对隐藏矩阵的矩阵元素进行调整,得到目标隐藏矩阵;
15、根据目标隐藏矩阵,对初始问题的词语进行隐藏,得到隐藏问题。
16、在本申请实施例中,根据位置信息对隐藏问题中隐藏的文字进行语义补充,得到补充后的问题,包括:
17、根据位置信息,确定初始问题的语义信息;
18、根据语义信息,对隐藏的文字进行补充,得到补充后的问题。
19、在本申请实施例中,将补充后的问题和对应问题组中的相似问题进行语义相似度比对,得到比对结果,并根据比对结果确定初始问题的增补相似问题,包括:
20、确定比对结果;
21、若比对结果为补充后的问题与相似问题满足预设的文本相似度阈值,则确定补充后的问题为增补相似问题。
22、在本申请实施例中,在根据增补相似问题和对应的答案确定相似问题集之前,方法还包括:
23、确定预设的同义语词库;
24、对初始问题进行语词划分,得到多个初始问题的语词片段;
25、从预设的同义语词库中确定与语词片段对应的同义语词;
26、根据同义语词对语词片段进行替换,得到初始问题的增补相似问题。
27、在本申请实施例中,在根据增补相似问题和对应的答案确定相似问题集之后,方法还包括:
28、获取用户问题;
29、将用户问题和所有相似问题集中的问题进行文本相似度比对;
30、若比对结果为用户问题和相似问题集中的问题满足预设的文本相似度阈值,则输出相似问题集对应的答案;
31、若比对结果为用户问题和相似问题集中的问题不满足文本相似度阈值,则输出预设提示信息,预设提示信息用于提示当前未获取到对应答案。
32、第二方面,本申请提供一种相似问题的生成装置,装置包括:
33、编码模块,用于获取初始问题集并对初始问题集中的初始问题进行编码,得到初始问题中字符的位置信息,初始问题集中包括多个问题组,每个问题组中包括一个初始问题及其对应的至少一个相似问题,每个问题组还对应答案信息;
34、隐藏模块,用于根据初始问题的词语分布,对初始问题中的部分词语进行文字隐藏,得到隐藏问题;
35、补充模块,用于根据位置信息对隐藏问题中隐藏的文字进行语义补充,得到补充后的问题;
36、比对模块,用于将补充后的问题和对应问题组中的相似问题进行语义相似度比对,得到比对结果,并根据比对结果确定初始问题的增补相似问题;
37、问题集确定模块,用于根据增补相似问题和对应的答案确定相似问题集。
38、第三方面,本申请提供一种设备,包括:处理器,以及与处理器通信连接的存储器;
39、存储器存储计算机执行指令;
40、处理器执行存储器存储的计算机执行指令,以实现本申请的方法。
41、第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现本申请的方法。
42、本申请提供的相似问题的生成方法、装置、设备和介质,通过获取初始问题集并对初始问题集中的初始问题进行编码,得到初始问题中字符的位置信息,初始问题集中包括多个问题组,每个问题组中包括一个初始问题及其对应的至少一个相似问题,每个问题组还对应答案信息;根据初始问题的词语分布,对初始问题中的部分词语进行文字隐藏,得到隐藏问题;根据位置信息对隐藏问题中隐藏的文字进行语义补充,得到补充后的问题;将补充后的问题和对应问题组中的相似问题进行语义相似度比对,得到比对结果,并根据比对结果确定初始问题的增补相似问题;根据增补相似问题和对应的答案确定相似问题集。
43、如此,可以通过根据针对相同应用场景的问题,确定该场景对应问题的多种描述形式,并且将这些不同描述形式的问题与该应用场景的标准答案形成问答对,存储在智慧客服场景的知识库中。当机器人客服为用户回答问题时,机器人会根据用户的问题对知识库中所有问答对的问题进行检索,从而找到与用户问题针对的是同一场景的相似问题,并根据该相似问题对应的问答对的答案,向用户输出回复信息,从而提高了输出信息的准确性,能够更好地帮助用户解决其业务困扰。
1.一种相似问题的生成方法,其特征在于,应用于相似问生成系统,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取初始问题集并对所述初始问题集中的初始问题进行编码,得到所述初始问题中字符的位置信息,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述初始问题的词语分布,对所述初始问题中的部分词语进行文字隐藏,得到隐藏问题,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述位置信息对所述隐藏问题中隐藏的文字进行语义补充,得到补充后的问题,包括:
5.根据权利要求1所述的方法,其特征在于,所述将所述补充后的问题和对应问题组中的相似问题进行语义相似度比对,得到比对结果,并根据所述比对结果确定所述初始问题的增补相似问题,包括:
6.根据权利要求1所述的方法,其特征在于,在所述根据所述增补相似问题和所述对应的答案确定相似问题集之前,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,在所述根据所述增补相似问题和所述对应的答案确定相似问题集之后,所述方法还包括:
8.一种相似问题的生成装置,其特征在于,应用于相似问生成系统,所述装置包括:
9.一种设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令可被处理器调用执行如权利要求1至7任一项所述的方法。