本技术涉及人工智能,特别是涉及一种对话异常检测方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、随着用户在智能座舱场景下使用场景的丰富,座舱本身就具备很好的音响和传感器系统,语音交互拓展了座舱的使用场景。随着多音区交互的成熟和落地,大量的人机对话数据丰富了语音模型优化,极大地提高了人机交互便利。传统对话系统通过规则模板来匹配用户的意图和回复,但是这种方法需要大量的匹配模板进行用户意图的识别,并且增量的意图需要重新更新匹配的模板,属于一个无边界的方式进行扩展,越来越多的对话检测方式,需要大量的人力进行规则的梳理。目前智能汽车大多使用依赖基于深度学习的方式来识别用户意图,基于数据训练的方式使用小部分的人工标注即可实现高效的意图识别,大模型技术的加入这使得基于深度学习的意图识别有了更好的发挥空间。
2、如何更好对人机对话的效果进行检测,包含对意图的识别和回复的优化,是目前遇到的最大的问题,传统的基于人力的筛选和检测,越来越不能很好的应对海量的对话日志数据,基于深度学习的对话检测服务需要大量的人工进行多轮数据进行标注,在标注的多轮数据数据较少的情况下,如何做好对于人机对话的自动化检测是目前需要解决的问题。
3、随着云端算力的日益提升和模型压缩量化技术的提高,云端算力也能很好的支持相关的检测大模型训练和应用部署,利用人工标注小部分多轮对话样本,基于大模型的日志自动化检测的方式目前是一个很好的落地方式,模型在云端对用户多轮日志进行实时计算,通过输出看板的方式进行问题统计,方便对当前话模型的性能进行实时检测,快速对有问题的对话进行快速响应。针对在语音对话的问题挖掘能力,是显示座舱科技化的一个重要的指标,能极大地提升智能座舱的用户体验。
4、目前对于人机对话的自动化检测的效率不高。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高对人机对话的自动化检测效率的对话异常检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种对话异常检测方法,包括:
3、获取车机系统中的对话日志;对话日志包括座舱语音对话数据;
4、根据对话日志构建prompt;
5、将prompt输入已训练的对话检测模型,获取已训练的对话检测模型输出的对话检测结果;对话检测结果包括异常对话、异常标签和异常对话对应的优化语句。
6、在其中一个实施例中,获取车机系统中的对话日志,包括:
7、获取当前用户的授权信息;
8、在授权信息满足授权要求的情况下,根据当前用户的用户信息,获取车机系统中相应的对话日志。
9、在其中一个实施例中,根据对话日志构建prompt,包括:
10、对对话日志进行意图识别,获得对话日志包括的至少一个对话意图;
11、针对每一个对话意图,在对话日志中获取对应的一组对话语句;
12、根据每一组对话语句进行prompt结构体构建,得到prompt。
13、在其中一个实施例中,已训练的对话检测模型的获取方式,包括:
14、获取训练集;训练集包括多个样本prompt,每个样本prompt包括样本异常对话、样本异常标签和样本优化语句;样本异常标签用于表征样本异常对话的错误类型;
15、根据训练集,采用迁移学习对大模型基座进行训练,得到已训练的对话检测模型。
16、在其中一个实施例中,获取训练集,包括:
17、获取样本对话数据;
18、对样本对话数据进行意图识别,获得样本对话数据的标准对话意图;
19、将标准对话意图,与样本对话数据中车机系统识别的样本对话意图进行比对,判断样本对话意图是否存在异常;
20、在样本对话意图存在异常的情况下,将样本对话数据作为样本异常对话,对样本异常对话添加对应的样本异常标签和样本优化语句;
21、根据样本异常对话、对应的样本异常标签和样本优化语句,获取训练样本数据;
22、根据训练样本数据进行prompt结构体构建,得到样本prompt;
23、根据多个样本prompt,获取训练集。
24、在其中一个实施例中,获取样本对话数据,包括:
25、根据样本对话日志,获取原始对话数据;
26、对原始对话数据进行脱敏处理,得到样本对话数据;脱敏处理用于剔除原始对话数据中的用户隐私数据,用户隐私数据包括用户姓名、身份证号、电话号码和用户地址。
27、第二方面,本技术还提供了一种对话异常检测装置,包括:
28、获取模块,用于获取车机系统中的对话日志;对话日志包括座舱语音对话数据;
29、构建模块,用于根据对话日志构建prompt;
30、检测模块,用于将prompt输入已训练的对话检测模型,获取已训练的对话检测模型输出的对话检测结果;对话检测结果包括异常对话、异常标签和异常对话对应的优化语句。
31、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
32、获取车机系统中的对话日志;对话日志包括座舱语音对话数据;
33、根据对话日志构建prompt;
34、将prompt输入已训练的对话检测模型,获取已训练的对话检测模型输出的对话检测结果;对话检测结果包括异常对话、异常标签和异常对话对应的优化语句。
35、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
36、获取车机系统中的对话日志;对话日志包括座舱语音对话数据;
37、根据对话日志构建prompt;
38、将prompt输入已训练的对话检测模型,获取已训练的对话检测模型输出的对话检测结果;对话检测结果包括异常对话、异常标签和异常对话对应的优化语句。
39、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
40、获取车机系统中的对话日志;对话日志包括座舱语音对话数据;
41、根据对话日志构建prompt;
42、将prompt输入已训练的对话检测模型,获取已训练的对话检测模型输出的对话检测结果;对话检测结果包括异常对话、异常标签和异常对话对应的优化语句。
43、上述对话异常检测方法、装置、计算机设备、存储介质和计算机程序产品,获取车机系统中的对话日志;对话日志包括座舱语音对话数据;根据对话日志构建prompt;将prompt输入已训练的对话检测模型,获取已训练的对话检测模型输出的对话检测结果;对话检测结果包括异常对话、异常标签和异常对话对应的优化语句。通过融合深度学习技术加速对话数据挖掘的落地,增强在智能座舱场景下的人机交互的体验,提高对人机对话的自动化检测效率,实现了自动化的对当前车机对话系统的性能评估,以及后续的具体改进的内容,以提升座舱人机交互的体验。