本发明涉及人工智能和金融科技,尤其揭露了一种用户意图确定方法、装置、计算机设备及存储介质。
背景技术:
1、在保险领域中,对话系统在理赔、客服等场景中发挥着越来越重要的作用。然而,随着保险领域中业务的增加和发展,出现了越来越多的新领域和新问题,这些新领域和新问题需要对话系统进行精准识别,并处理新的用户意图。
2、目前,针对保险领域中的用户新意图挖掘问题有两类方法。其中,一类方法将其看作无监督聚类问题,通过引入有效的弱监督信号提升聚类性能。这些方法通常采用基于深度学习的聚类方法,例如自编码器、变分自编码器等。这些方法主要通过引入重构误差、对比损失等弱监督信号来训练模型,提高聚类的准确性和稳定性。
3、另外一类方法将其看作半监督聚类问题,通过利用少量有标签已知意图先验知识指导聚类过程。这些方法主要包括基于图的半监督聚类方法、基于谱聚类的半监督聚类方法等。这些方法能够有效地利用已知意图的先验知识,指导新意图发现,并在新意图类别数量未知时有效估计意图数量。
4、然而,上述方法存在一些局限性,对于无监督聚类方法来说,常常无法充分利用数据的结构信息,导致聚类结果不够准确。对于半监督聚类方法,需要大量有标签数据来训练模型,而在保险领域中,标注成本往往较高,导致样本数量较少,训练效果不佳,进而影响聚类结果。同时,在新意图类别数量未知时,很难准确地估计意图数量。
5、因此,本领域技术人员亟需寻找一种新的技术方案来解决上述的问题。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种用户意图确定方法、装置、计算机设备及存储介质,提高聚类结果,进而确定新用户意图的数量,提高新用户意图挖掘的精度和可靠性。
2、一种用户意图确定方法,所述方法包括:
3、获取待识别用户意图的用户语言数据;
4、使用预设语言模型提取预设数量的用户语言数据的意图特征;
5、使用预设聚类算法聚类与所述意图特征对应的用户语言数据,得到包含至少一个所述用户语言数据的聚类簇;
6、将所述用户语言数据数量低于预设置信度的聚类簇进行剔除,将剩余的聚类簇对应的意图特征作为除预设数量之外的用户语言数据的用户目标意图。
7、一种用户意图确定装置,所述装置包括:
8、第一获取模块,用于获取待识别用户意图的用户语言数据;
9、提取模块,用于使用预设语言模型提取预设数量的用户语言数据的意图特征;
10、聚类模块,用于使用预设聚类算法聚类与所述意图特征对应的用户语言数据,得到包含至少一个所述用户语言数据的聚类簇;
11、剔除模块,用于将所述用户语言数据数量低于预设置信度的聚类簇进行剔除,将剩余的聚类簇对应的意图特征作为除预设数量之外的用户语言数据的用户目标意图。
12、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种用户意图确定方法。
13、上述用户意图确定方法、装置、计算机设备及存储介质,在人工智能模型中,有效地利用少量的标签数据(用户语言数据)的结构信息(意图特征),改进了聚类效果,进而确定用户目标意图的数量,提高新用户意图挖掘的精度和可靠性;能够更好地适应金融领域(如保险领域)的意图挖掘需求,提高客户满意度;减少意图标注的人力成本和时间成本,提高用户意图确认的工作效率。
1.一种用户意图确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的用户意图确定方法,其特征在于,所述使用预设语言模型提取预设数量的用户语言数据的意图特征之前,还包括:
3.根据权利要求1所述的用户意图确定方法,其特征在于,所述使用预设聚类算法聚类与所述意图特征对应的用户语言数据,包括:
4.根据权利要求3所述的用户意图确定方法,其特征在于,所述获取包含聚类数量的簇数目之前,还包括:
5.根据权利要求1所述的用户意图确定方法,其特征在于,所述获取包含聚类数量的簇数目之前,还包括:
6.根据权利要求1所述的用户意图确定方法,其特征在于,所述使用预设语言模型提取预设数量的所述用户语言数据的意图特征,包括:
7.根据权利要求1所述的用户意图确定方法,其特征在于,所述将剩余的聚类簇对应的意图特征作为除预设数量之外的用户语言数据的用户目标意图之前,还包括:
8.一种用户意图确定装置,其特征在于,包括:
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述一种用户意图确定方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述一种用户意图确定方法。