意图识别方法、装置、车辆和存储介质与流程

文档序号:37445276发布日期:2024-03-28 18:28阅读:21来源:国知局
意图识别方法、装置、车辆和存储介质与流程

本技术涉及车辆,并且更具体地,涉及车辆中一种意图识别方法、装置、车辆和存储介质。


背景技术:

1、用户在使用车载语音时,一句话中可能包括多个意图。在相关技术中,使用模板规则匹配的方式完成一句话中多意图的切分功能,模板复杂度会随着句子中意图个数的增长呈现出指数式增长、泛化能力较差,易出现意图丢失的问题。


技术实现思路

1、本技术提供了一种意图识别方法、装置、车辆和存储介质,该方法能够更加准确地切分出车载语音中的每一个意图,即使车载语音中包含多个意图也不会遗漏车载语音中的意图,从而能够提高对车载语音进行意图识别的准确度。

2、第一方面,提供了一种意图识别方法,该方法包括:

3、获取车辆内的车载语音;

4、基于预设概率参数库,确定所述车载语音中相邻词之间的候选概率参数;其中,所述预设概率参数库中包括样本车载语料集合中不同词相邻出现的预设概率参数;

5、基于所述候选概率参数,确定所述车载语音的目标意图切分点集合;

6、基于所述目标意图切分点集合对所述车载语音进行意图识别,得到并输出所述车载语音中的目标意图。

7、上述技术方案中,对于获取的车载语音,通过创建的预设概率参数库确定车载语音中相邻词之间的候选概率参数。由于该预设概率参数库中包括样本语料中不同词相邻的预设概率参数,所以能够快速得到车载语音中任意相邻词前后出现的候选概率参数。之后,按照该候选概率参数,确定车载语音的目标意图切分点集合;并按照基于目标意图切分点集合对车载语音进行意图识别,得到并输出车载语音中的目标意图。这样,通过相邻词之间的候选概率参数对车载语音进行意图切分,能够更加准确地切分出车载语音中的每一个意图,即使车载语音中包含多个意图也不会遗漏车载语音中的意图,从而能够提高对车载语音进行意图识别的准确度。

8、结合第一方面,在某些可能的实现方式中,所述基于预设概率参数库,确定所述车载语音中相邻词之间的候选概率参数之前,所述方法还包括:

9、获取描述至少一个意图的样本车载语料集合;

10、对所述样本车载语料集合进行预处理,得到已处理样本语料集合;

11、在所述已处理样本语料集合的每一已处理样本语料中,确定不同词之间相邻出现的样本概率,得到样本概率集合;

12、基于所述样本概率集合,确定描述相同意图的样本车载语料的样本概率阈值;其中,所述预设概率参数,包括:所述样本概率和所述样本概率阈值;

13、基于所述样本概率集合和所述样本概率阈值,生成所述预设概率参数库。

14、在上述方案中,通过确定每一已处理样本语料中不同词之间相邻出现的样本概率以及同一意图的样本车载语料的样本概率阈值,创建预设概率参数库,使得该预设概率参数库中存储丰富语料的样本概率以及样本概率阈值,便于后续通过该预设概率参数库对车载语音进行意图切分。

15、结合第一方面,在某些可能的实现方式中,所述对所述样本车载语料集合进行预处理,得到已处理样本语料集合,包括:

16、在所述样本车载语料集合的每一样本车载语料中,确定每一词对所述每一样本车载语料所属意图的影响程度;

17、基于所述影响程度对所述每一样本车载语料中的词进行筛选,得到已筛选语料;

18、对所述已筛选语料中的实体词进行掩盖处理,得到所述每一样本车载语料对应的已处理样本语料。

19、在上述方案中,对于每一样本车载语料,过滤掉该语料中对意图影响较小的词,能够减少样本车载语料集合的数据流,通过对该语料中的实体词进行掩盖,能够降低由于实体词的不同对后续计算预设概率参数的影响。

20、结合第一方面,在某些可能的实现方式中,所述基于所述样本概率集合,确定描述相同意图的样本车载语料的样本概率阈值,包括:

21、在所述样本概率集合中,获取所述描述相同意图的每一样本车载语料对应的最小样本概率;

22、在所述描述相同意图的多个样本车载语料对应的最小样本概率中,确定所述样本概率阈值。

23、在上述方案中,通过在相同意图的多个样本车载语料对应的多个最小样本概率中,再从多个最小样本概率中选择最小的样本概率,作为该样本概率阈值;这样,能够通过该样本概率阈值有效的表示相邻词不会前后出现的可能性。

24、结合第一方面,在某些可能的实现方式中,所述在所述已处理样本语料集合的每一已处理样本语料中,确定不同词之间相邻出现的样本概率,得到样本概率集合,包括:

25、对于所述每一已处理样本语料中的任一词,确定所述任一词的至少前一个词在所述已处理样本语料集合中出现的第一次数,以及所述任一词和所述至少前一次词在所述已处理样本语料集合的同一已处理样本语料中出现的第二次数;其中,所述至少前一个词与所述任一词相邻,且出现时刻在所述任一词的出现时刻之前;

26、基于所述第一次数和所述第二次数,确定所述任一词与所述至少前一个词相邻出现的样本概率,以得到所述样本概率集合。

27、在上述方案中,通过分别确定任一词的至少前一个词在已处理样本语料集合中出现的第一次数以及该任一词和至少前一个词同时出现在一个已处理样本语料中的第二次数,能够精确计算出该任一词与至少前一个词之间前后出现的样本概率。

28、结合第一方面,在某些可能的实现方式中,所述基于预设概率参数库,确定所述车载语音中相邻词之间的候选概率参数,包括:

29、对所述车载语音进行预处理,得到已处理数据;

30、在所述预设概率参数库中,查询所述已处理数据中相邻词出现的候选概率,以及所述已处理数据对应的候选概率阈值;其中,所述候选概率参数,包括:所述候选概率和所述候选概率阈值。

31、在上述方案中,通过对车载语音进行预处理,以滤除该车载语音中对目标意图影响程度较低的词,使得已处理数据更加精确,从而按照该已处理数据在预设概率参数库中查询候选概率和候选概率阈值,能够提高查询候选概率和候选概率阈值的效率以及准确率。

32、结合第一方面,在某些可能的实现方式中,所述基于所述候选概率参数,确定所述车载语音的目标意图切分点集合,包括:

33、确定所述候选概率与所述候选概率阈值之间的数值关系;

34、基于所述数值关系对所述已处理数据进行意图切分,得到所述目标意图切分点集合。

35、在上述方案中,由于候选概率阈值表示相同意图下的相邻词前后出现的最小可能性,所以按照候选概率与候选概率阈值之间的数值大小,能够准确地从已处理数据中划分出属于同一意图的词,即实现对已处理数据进行意图切分,使得到的目标意图切分点集合更加精准。

36、结合第一方面,在某些可能的实现方式中,所述基于所述数值关系对所述已处理数据进行意图切分,得到所述目标意图切分点集合,包括:

37、在所述数值关系表征所述候选概率小于所述候选概率阈值的情况下,将所述候选概率对应的相邻词在所述已处理数据中的位置确定为意图切分点;

38、对所述已处理数据中的多个意图切分点进行过滤,得到所述目标意图切分点集合。

39、在上述方案中,通过将候选概率小于候选概率阈值的相邻词在已处理数据中的位置作为意图切分点,既能够快速定位出已处理数据中不是相邻词的位置,还能够提高目标意图切分点集合的准确率。

40、结合第一方面,在某些可能的实现方式中,所述方法还包括:

41、在所述已处理数据中多个相邻词的候选概率中,确定发生骤降的突变候选概率;

42、将所述突变候选概率对应的相邻词在所述已处理数据中的位置,确定为所述意图切分点。

43、在上述方案中,通过在多个相邻词的候选概率中确定发生骤降的突变候选概率,说明该突变候选概率对应的相邻词不会前后出现,进一步说明该相邻词不属于同一个意图,因此将该相邻词在已处理数据中的位置作为意图切分点,既能够高效率的实现意图切分。

44、结合第一方面,在某些可能的实现方式中,所述对所述已处理数据中的多个意图切分点进行过滤,得到所述目标意图切分点集合,包括:

45、在所述已处理数据中,确定与所述多个意图切分点中的任一意图切分点相邻且在位于所述任一意图切分点右侧的目标词;

46、在所述目标词为实体词的情况下,在所述多个意图切分点中删除所述任一意图切分点,得到所述目标意图切分点集合。

47、在上述方案中,对于初次切分的多个意图切分点,通过分析该意图切分点右侧的词是否为实体词,能够确定出该意图切分点与右侧的词是否属于同一意图,从而能够更进一步的精确目标意图切分点集合。

48、结合第一方面,在某些可能的实现方式中,所述基于所述目标意图切分点集合对所述车载语音进行意图识别,得到并输出所述车载语音中的目标意图,包括:

49、在所述目标意图切分点集合不为空的情况下,按照所述目标意图切分点集合中的目标意图切分点对已处理数据进行分段,得到已分段文本;

50、对所述已分段文本进行补全,得到并输出所述目标意图。

51、在上述方案中,对按照目标意图切分点集合进行分段的已处理数据进行补全处理后即可得到目标意图,能够快速且准确地输出目标意图。

52、结合第一方面,在某些可能的实现方式中,所述基于所述目标意图切分点集合对所述车载语音进行意图识别,得到并输出所述车载语音中的目标意图,包括:

53、在所述目标意图切分点集合为空的情况下,对所述已处理数据中的实体词进行补全,得到并输出所述目标意图。

54、在上述方案中,针对没有切分点的已处理数据直接通过对掩盖的实体词进行补全,即可快速输出目标意图,以指示车载终端及时响应该目标意图。

55、第二方面,提供了一种意图识别装置,该装置包括:

56、获取模块,用于获取车辆内的车载语音;

57、第一确定模块,用于基于预设概率参数库,确定所述车载语音中相邻词之间的候选概率参数;其中,所述预设概率参数库中包括样本车载语料集合中不同词相邻出现的预设概率参数;

58、第二确定模块,用于基于所述候选概率参数,确定所述车载语音的目标意图切分点集合;

59、识别模块,用于基于所述目标意图切分点集合对所述车载语音进行意图识别,得到并输出所述车载语音中的目标意图。

60、第三方面,提供了一种车辆,包括存储器和处理器。该存储器用于存储可执行程序代码,该处理器用于从存储器中调用并运行该可执行程序代码,使得该车辆执行上述第一方面或第一方面任意一种可能的实现方式中的方法。

61、第四方面,提供了一种计算机程序产品,该计算机程序产品包括:计算机程序代码,当该计算机程序代码在计算机上运行时,使得该计算机执行上述第一方面或第一方面任意一种可能的实现方式中的方法。

62、第五方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序代码,当该计算机程序代码在计算机上运行时,使得该计算机执行上述第一方面或第一方面任意一种可能的实现方式中的方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1