本公开涉及被配置用于通过与用户的对话掌握用户的意图的对话处理方法和对话系统。
背景技术:
1、对话系统是一种能够通过与用户的对话来识别用户的意图的装置。这种对话系统连接到日常生活中使用的各种电子装置,例如车辆、移动设备、家用电器等,以使得能够执行与用户的话语对应的各种功能。
2、为了使对话系统从用户话语识别出意图,对话系统必须处理用户以自然语言发出的话语。自然语言是指人类在日常生活中用于交流的语言,并且是与人工语言(或构造语言)(例如,计算机编程语言)相对的概念。
3、为了使对话系统处理用户以自然语言发出的话语,可以应用自然语言理解(nlu)技术。此外,最近,可以使用由机器学习或深度学习训练的模型来实现nlu技术。
4、另一方面,当使用训练过的模型对用户话语的域或意图进行分类并对时隙进行标记时,结果可能会根据训练数据而出现偏差。因此,可能出现输出与用户的实际意图不同的结果的情况。
5、本公开的该背景技术中包括的信息仅用于加强对本公开的一般背景的理解,并且不可被视为承认或以任何形式建议该信息形成本领域技术人员已经知道的现有技术。
技术实现思路
1、本公开的各个方面涉及提供一种对话处理方法和对话管理系统,其可以基于每个用户的话语历史修改意图分类模型的输出,从而使与用户的实际意图不同的结果的输出最小化,因为用户话语的意图分类结果偏向于训练数据。
2、本公开的额外方面将在下面的描述中部分地阐述,并且部分地从描述中显而易见,或者可以通过本公开的实践来了解。
3、根据本公开的一个方面,对话处理方法包括:使用训练过的意图分类模型获得用户的语音指令的意图分类结果;获得用户的话语历史信息;以及基于用户的话语历史信息,修改意图分类结果,其中,意图分类结果包括每个预定意图的得分,并且修改意图分类结果包括:基于用户的话语历史信息,修改每个预定意图的得分。
4、用户的话语历史信息可以包括关于用户通过语音命令的话语使用的意图的频度的信息。
5、修改意图分类结果可以包括:将多个预定意图当中,用户通过语音命令使用的频度较高的意图修改为具有较高的得分。
6、修改意图分类结果可以包括:通过将高权重分派给多个预定意图当中,用户通过语音命令的话语使用的频度高的意图的得分,来重新确定得分。
7、修改意图分类结果可以包括:在多个预定意图的得分当中,降低小于阈值的得分,并且增加用户通过语音命令的话语使用的频度高的意图的得分。
8、小于阈值的得分的降低量和用户通过语音命令的话语使用的频度高的意图的得分的增加量可以相互成比例。
9、用户的话语历史信息可以还包括关于用户的语音命令的话语时间或用户的语音命令的话语位置的信息中的至少一个。
10、修改意图分类结果可以包括:通过将高权重分派给多个预定意图当中,在与当前话语时间或当前话语位置匹配的话语时间或话语位置使用的频度高的意图的得分,来重新确定得分。
11、修改意图分类结果可以包括:将修改后的得分当中具有最高得分的意图确定为用户的语音命令的最终意图,并基于该最终意图对用户的语音命令执行时隙标记。
12、对话处理方法可以还包括:基于修改后的意图分类结果,生成系统响应;以及将所生成的系统响应发送到用户终端。
13、根据本公开的另一个方面,存在计算机可读记录介质,其中记录了用于执行根据本公开的示例性实施例的对话处理方法的程序,该对话处理方法包括:使用训练过的意图分类模型获得用户的语音指令的意图分类结果;获得用户的话语历史信息;以及基于用户的话语历史信息,修改意图分类结果,其中,意图分类结果包括每个预定意图的得分,并且修改意图分类结果包括:基于用户的话语历史信息,修改每个预定意图的得分。
14、用户的话语历史信息可以包括关于用户通过语音命令的话语使用的意图的频度的信息。
15、修改意图分类结果可以包括:将多个预定意图当中,用户通过语音命令使用的频度较高的意图修改为具有较高的得分。
16、修改意图分类结果可以包括:通过将高权重分派给多个预定意图当中,用户通过语音命令的话语使用的频度高的意图的得分,来重新确定得分。
17、修改意图分类结果可以包括:在多个预定意图的得分当中,降低小于阈值的得分,并且增加用户通过语音命令的话语使用的频度高的意图的得分。
18、小于阈值的得分的降低量和用户通过语音命令的话语使用的频度高的意图的得分的增加量可以相互成比例。
19、用户的话语历史信息可以还包括关于用户的语音命令的话语时间或用户的语音命令的话语位置的信息中的至少一个。
20、修改意图分类结果可以包括:通过将高权重分派给多个预定意图当中,在与当前话语时间或当前话语位置匹配的话语时间或话语位置使用的频度高的意图的得分,来重新确定得分。
21、修改意图分类结果可以包括:将修改后的得分当中具有最高得分的意图确定为用户的语音命令的最终意图,并基于该最终意图对用户的语音命令执行时隙标记。
22、对话处理方法可以还包括:基于修改后的意图分类结果,生成系统响应;以及将所生成的系统响应发送到用户终端。
23、本公开的方法和设备具有其他特征和优点,这些特征和优点将从并入本文中的附图和下面的详细描述中显而易见或更详细地阐述,这些附图和详细描述一起用于解释本公开的某些原理。
1.一种对话处理方法,包括以下步骤:
2.根据权利要求1所述的对话处理方法,其中,所述用户的话语历史信息包括关于所述用户通过所述语音命令的话语使用的意图的频度的信息。
3.根据权利要求2所述的对话处理方法,其中,修改所述意图分类结果的步骤还包括:
4.根据权利要求2所述的对话处理方法,其中,修改所述意图分类结果的步骤还包括:
5.根据权利要求2所述的对话处理方法,其中,修改所述意图分类结果的步骤还包括:
6.根据权利要求5所述的对话处理方法,其中,小于所述阈值的得分的降低量和所述用户通过所述语音命令的话语使用的频度高的意图的得分的增加量相互成比例。
7.根据权利要求2所述的对话处理方法,其中,所述用户的话语历史信息还包括关于所述用户的语音命令的话语时间或所述用户的语音命令的话语位置的信息中的至少一个。
8.根据权利要求7所述的对话处理方法,其中,修改所述意图分类结果的步骤还包括:
9.根据权利要求1所述的对话处理方法,其中,修改所述意图分类结果的步骤还包括:
10.根据权利要求1所述的对话处理方法,还包括以下步骤:
11.一种存储用于执行对话处理方法的程序的计算机可读介质,所述对话处理方法包括以下步骤:
12.根据权利要求11所述的计算机可读介质,其中,所述用户的话语历史信息包括关于所述用户通过所述语音命令的话语使用的意图的频度的信息。
13.根据权利要求12所述的计算机可读介质,其中,修改所述意图分类结果的步骤还包括:
14.根据权利要求12所述的计算机可读介质,其中,修改所述意图分类结果的步骤还包括:
15.根据权利要求12所述的计算机可读介质,其中,修改所述意图分类结果的步骤还包括:
16.根据权利要求15所述的计算机可读介质,其中,小于所述阈值的得分的降低量和所述用户通过所述语音命令的话语使用的频度高的意图的得分的增加量相互成比例。
17.根据权利要求12所述的计算机可读介质,其中,所述用户的话语历史信息还包括关于所述用户的语音命令的话语时间或所述用户的语音命令的话语位置的信息中的至少一个。
18.根据权利要求17所述的计算机可读介质,其中,修改所述意图分类结果的步骤还包括:
19.根据权利要求11所述的计算机可读介质,其中,修改所述意图分类结果的步骤还包括:
20.根据权利要求11所述的计算机可读介质,还包括以下步骤: