对话模型的训练方法、装置、电子设备及计算机存储介质与流程

文档序号：33035922发布日期：2023-01-24 19:50阅读：42来源：国知局

1.本技术实施例涉及电子信息技术领域，尤其涉及一种对话模型的训练方法、装置、电子设备及计算机存储介质。

背景技术：

2.随着电子信息技术的发展，为了向用户提供更加智能化的服务，许多应用场景下，基于神经网络的对话模型可以智能化地解答用户的提问。在对话模型正式应用之前，需要利用样本数据对对话模型进行训练，但是，对话类型的样本数据很少，也难以获取，没有样本数据，对话模型也难以实现冷启动。

技术实现要素：

3.有鉴于此，本技术实施例提供一种对话模型的训练方法、装置、电子设备及计算机存储介质，以解决上述部分或全部问题。
4.根据本技术实施例的第一方面，提供了一种对话模型的训练方法，包括：获取多个对话流，每个对话流包括多个对话节点；基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径；根据可选对话节点路径获得对话样本数据；根据对话样本数据训练对话模型。
5.根据本技术实施例的第二方面，提供了一种对话模型的训练装置，包括：获取模块，用于获取多个对话流，每个对话流包括多个对话节点；路径模块，用于基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径；样本模块，用于根据可选对话节点路径获得对话样本数据；训练模块，用于根据对话样本数据训练对话模型。
6.根据本技术实施例的第三方面，提供了一种电子设备，包括：处理器、存储器、通信接口和通信总线，处理器、存储器和通信接口通过通信总线完成相互间的通信；存储器用于存放至少一可执行指令，可执行指令使处理器执行如第一方面的对话模型的训练对应的操作。
7.根据本技术实施例的第四方面，提供了一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面的对话模型的训练。
8.本技术实施例提供的对话模型的训练方法、装置、电子设备及计算机存储介质，获取多个对话流，每个对话流包括多个对话节点；基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径；根据可选对话节点路径获得对话样本数据；根据对话样本数据训练对话模型。因为根据多个对话流可以模拟对话，得到对话样本数据，解决了对话模型缺少对话样本数据，难以实现冷启动的问题。而且，进一步地，因为对话节点之间的跳转概率，可以实现对话节点之间的跳转，模拟出的对话并不是完全按照对话流中对话节点的顺序进行，丰富了对话样本数据，提高了模拟出到的对话样本数据的质量。
附图说明
9.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。
10.图1为本技术实施例一提供的一种对话模型的训练的场景示意图；
11.图2为本技术实施例一提供的一种对话模型的训练的流程图；
12.图3为本技术实施例一提供的一种主流程对话流示意图；
13.图4为本技术实施例一提供的一种常见问答对话流示意图；
14.图5为本技术实施例一提供的一种对话模型的训练的另一种场景示意图；
15.图6为本技术实施例一提供的一种对话模型效果示意图；
16.图7为本技术实施例二提供的一种对话模型的训练装置的结构框图；
17.图8为本技术实施例三提供的一种电子设备的结构示意图。
具体实施方式
18.为了使本领域的人员更好地理解本技术实施例中的技术方案，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本技术实施例一部分实施例，而不是全部的实施例。基于本技术实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本技术实施例保护的范围。
19.下面结合本技术实施例附图进一步说明本技术实施例具体实现。
20.实施例一
21.本技术实施例一提供一种对话模型的训练，应用于对话模型的训练装置，该对话模型的训练装置可以是服务器等云端设备，也可以是终端设备。为了便于理解，对本技术实施例一所提供的对话模型的训练的应用场景进行说明，参照图1所示，图1为本技术实施例一提供的一种对话模型的训练的场景示意图。图1所示的场景中包括对话模型的训练装置101。
22.对话模型的训练装置101可以是服务器、中继设备、端到端设备等云端设备，也可以是如智能手机、平板电脑、笔记本电脑等终端设备。需要说明的是，对话模型的训练装置101还可以接入网络，通过网络与云端的设备连接，并进行数据交互。本技术中，网络包括局域网(英文：local area network，lan)、广域网(英文：wide area network，wan)、移动通信网络；如万维网(英文：world wide web，www)、长期演进(英文：long term evolution，lte)网络、2g网络(英文：2th generation mobile network)、3g网络(英文：3th generation mobile network)，5g网络(英文：5th generation mobile network)等。当然，此处只是示例性说明。
23.如图1所示，对话模型的训练装置101可以获取多个对话流，对话流包括多个对话节点；图1中示出了2个对话流，分别为对话流a和对话流b，每个对话流有3个对话节点，对话流a包括对话节点a1、a2、a3、a4，对话流b包括对话节点b1、b2、b3，一个对话节点可以包括至少一个对话语句，例如，一个对话节点可以包含含义相同，表达方式不同的至少一个对话语句。基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选
对话节点路径；根据可选对话节点路径获得对话样本数据。因为对话节点之间的跳转概率，使得任意两个对话节点之间进行跳转都是可能存在的，使得模拟出的对话样本数据更加丰富。图1中，示出了个模拟出的对话，例如，a1-a2-a3，a1-b2-a4，a1-a3，a1-b2-b3，b1-b2-b3等。根据至少一个对话样本数据对基于神经网络的对话模型进行训练，对话样本数据更加丰富，训练得到的对话模型效果更好。
24.结合图1所示的场景，详细说明本技术实施例一提供的对话模型的训练，应用于对话模型的训练装置，需要说明的是，图1只是本技术实施例一提供的对话模型的训练的一种应用场景，并不代表该对话模型的训练必须应用于图1所示的场景，参照图2所示，图2为本技术实施例一提供的一种对话模型的训练的流程图，该方法包括以下步骤：
25.步骤201、获取多个对话流。
26.每个对话流包括多个对话节点。需要说明的是，一个对话流可以是按照对话顺序形成的对话节点的集合，对话流可以表示对话顺序或对话逻辑，例如，一个对话流可以是按照问答顺序形成的完整对话的对话节点的集合。一个对话节点可以包括至少一个对话语句，例如，一个对话节点可以包含含义相同，表达方式不同的至少一个对话语句，一个对话节点可以属于多个对话流。对话流可以有至少一个起始对话节点，和至少一个终止对话节点。示例性地，对话流可以有一个起始对话节点和多个终止对话节点。
27.可选地，获取多个对话流，包括：获取多个原始对话流；按照主流程、常见问答、场景通用这三种类型对多个原始对话流进行规范化处理得到多个对话流。需要说明的是，规范化是将数量较多的原始对话流按照类型进行合并，可以得到数量较少的对话流。例如，通过规范化处理，45个原始对话流可以合并为6个对话流。此处，对主流程、常见问答和场景通用进行详细说明。
28.主流程类型的对话流，可以是表示的对话逻辑或对话顺序的对话语句的集合，以主流程是社保服务为例，如图3所示，图3为本技术实施例一提供的一种主流程对话流示意图，根据图3所示的主流程可以形成对话，此处列举一个具体示例进行说明，以用户和对话模型的系统为例，对话内容如下：
[0029]“用户：我想了解社保服务。
[0030]
系统：请问你想了解社保参保、社保补缴还是社保卡服务？
[0031]
用户：社保参保
[0032]
系统：请问你想了解灵活就业人员参保、企业职工参保还是城乡居民参保？
[0033]
……””
[0034]
常见问答类型的对话流，可以是将常用的一问一答的对话统一划分到一个对话流里，如图4所示，图4为本技术实施例一提供的一种常见问答对话流示意图，例如，“我想查社保信息”“社保大厅在哪”等。
[0035]
场景通用类型的对话流可以包括在各个场景下通用的对话，例如，欢迎语、结束语、转人工等。
[0036]
步骤202、基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径。
[0037]
第一对话节点向第二对话节点的跳转概率可以表示从第一对话节点跳转到第二对话节点的概率，例如，第一对话节点向第二对话节点的跳转概率为0.1，第一对话节点向
下一个对话节点跳转生成对话的过程中，有0.1的概率跳转到第二对话节点，示例性地，在包含第一对话节点的10个对话中，可以有一个对话是从第一对话节点跳转到第二对话节点的。当然，此处只是示例性说明。对于一个对话节点来说，以第一对话节点为例，第一对话节点向多个对话流中任意一个节点跳转都存在一个跳转概率，对于第一对话节点不可能跳转到的对话节点，可以将跳转概率设置为0，例如，第一对话节点向第一对话节点跳转的概率为0，又如，按照对话流中对话节点的顺序，第一对话节点向上一个对话节点跳转的概率可以是0。还需要说明的是，第一对话节点向每一个对话节点跳转的跳转概率之和可以等于1，当然，也可以等于其他数值，此处只是示例性说明。
[0038]
可选地，可以按照对话模拟策略，基于对话节点之间的跳转概率模拟出可选对话节点路径。对话模拟策略可以包括用于进行对话模拟的各种模拟策略，示例性地，对话模拟策略可以包括：按照主流程的模拟策略，跨对话流的对话节点跳转的模拟策略，同一对话流中对话节点跳转的模拟策略，开启新对话的模拟策略等。此处，列举四个示例详细说明得到可选对话节点路径的方式。
[0039]
在第一个示例中，结合图1所示的场景，例如，对话流a可以是一个主流程的对话流，则，a1-a2-a3即为一个按照主流程模拟的可选对话节点路径，a1-a2-a4也是一个按照主流程模拟的可选对话节点路径，当然，此处只是示例性说明。第一个示例可以是按照主流程的模拟策略进行模拟得到可选对话节点路径。
[0040]
在第二个示例中，可选地，基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径，包括：基于同一对话流中对话节点之间的跳转概率，按照同一对话流中对话节点的正向顺序或逆向顺序，跳过至少一个对话节点的对话，得到可选对话节点路径；和/或，基于同一对话流中对话节点之间的跳转概率，按照随机顺序得到可选对话节点路径。例如，结合图1所示的场景，基于同一对话流中对话节点之间的跳转概率，可以生成可选对话节点路径a1-a3，a1-a4，跳过了对话节点a2；又如，还可以生成可选对话节点路径a1-a4-a2，从对话节点a4逆向跳转到对话节点a2；又如，结合图3所示的主流程对话流，如果用户想咨询社保服务的社保卡办理，则按照对话主流程，需要经过：社保-社保卡医保卡相关-社保卡办理，通过第二个示例，可以模拟出用户直接询问社保卡办理这个具体服务的对话，当然，此处只是示例性说明。第二个示例可以是基于同一对话流中对话节点跳转的模拟策略得到可选对话节点路径，同一对话流中对话节点跳转的模拟策略允许对话生成时跳过一个或多个对话节点。
[0041]
在第三个示例中，可选地，在一种实现方式中，基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径，包括：基于不同对话流的对话节点之间的跳转概率，得到跨对话流的可选对话节点路径。结合图1所示的场景，基于不同对话流的对话节点之间的跳转概率，可以模拟出如a1-b2-b3，b1-a2-a4等可选对话节点路径。需要说明的是，本技术中，在不同对话流的对话节点之间跳转(即跨对话流跳转)可以包括从第一对话流中的对话节点跳转到第二对话流中的对话节点，还可以包括从第二对话流中的对话节点回跳到第一对话流中的对话节点。例如，可选对话节点路径a1-b2-a3即为包含回跳的对话，从对话流a中的对话节点a1跨对话流跳转到对话流b中的对话节点b2，又从对话流b中的对话节点b2回跳到对话流a中的对话节点a3，需要说明的是，通常跨对话流跳转可以是向常见问答类型的对话流跳转，也可以是向主流程类型的对话流或者场景通
用类型的对话流跳转。又如，用户一开始问社保服务，基于跨对话流的对话节点之间的跳转概率，可以在咨询社保服务的对话中跳转到咨询公积金的服务，然后再回跳到社保服务，当然，此处只是示例性说明。第三个示例可以是基于跨对话流的对话节点跳转的模拟策略得到跨对话流的可选对话节点路径，跨对话流的对话节点跳转的模拟策略可以生成从一个对话流跨到另一个对话流的可选对话节点路径。
[0042]
在第四个示例中，可选地，在一种实现方式中，基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径，包括：将第一对话流中的第一对话节点与第二对话流中的初始对话节点的跳转概率设置为高于至少一个其他对话节点，以使得可选对话节点路径包括从第一对话节点跳转到初始对话节点的路径。可以将第一对话流中的第一对话节点与第二对话流中的初始对话节点的跳转概率设置为高于其他对话节点。结合图1所示的场景，第四个示例可以模拟出可选对话节点路径：
[0043]
a1-a3-b1-b2-b3，a1-a2-a4-b1-b2-b3，即一个对话样本数据实际上包含了两个对话。需要说明的是，以到达终止对话节点确定对话结束，终止对话节点即为对话流的最后一个节点，当然，一个对话流可以包括多个终止对话节点，图1中对话流a即包括终止对话节点a3和a4。第四个示例可以是基于开启新对话的模拟策略得到可选对话节点路径，开启新对话的模拟策略可以模拟出在完成一个对话后不结束，开启一个新的对话。
[0044]
结合上述第一个示例至第四个示例，可以生成更多的可选对话节点路径，更贴近实际对话场景，提高了生成的对话样本数据的质量。
[0045]
步骤203、根据可选对话节点路径获得对话样本数据。
[0046]
需要说明的是，一个对话节点可以包括至少一个对话语句，按照预先设置的对话模拟策略，基于多个对话流中对话节点之间的跳转概率，进行对话模拟得到至少一个对话样本数据，包括：按照预先设置的对话模拟策略，基于多个对话流中对话节点之间的跳转概率，进行对话模拟得到至少一个对话节点序列，对于对话节点序列中的每一个对话节点，确定对话节点的对话语句，并根据确定的对话语句得到至少一个对话样本数据。例如，结合图1所示的场景，模拟得到的可选对话节点路径为a1-b2-a4，在对话节点a1包含的至少一个对话语句中确定出对话语句a
1-1
，在对话节点b2的至少一个对话语句中确定出对话语句b
2-1
，在对话节点a4的至少一个对话语句a
4-1
，其中，x
n-m
表示对话节点xn的第m个对话语句，n和m为大于0的整数，a
1-1
表示对话节点a1的第1个对话语句，b
2-1
表示对话节点b2的第1个对话语句，a
4-1
表示对话节点a4的第1个对话语句。每一个对话节点包含多个对话语句，在多个对话语句中可以随机选择一个对话语句用于形成对话，使得得到的对话样本数据，对话表达方式更加丰富。
[0047]
可选地，根据可选对话节点路径获得对话样本数据，包括：根据可选对话节点路径，获得可选对话节点路径上每个对话节点对应的对话语句；根据每个对话节点对应的对话语句得到对话样本数据。
[0048]
需要说明的是，在一些应用场景中，在得到对话样本数据时，可以进行省略，以丰富对话样本数据。可选地，在一种实现方式中，该方法还包括：根据预设规则确定可选对话节点路径上每个对话节点对应的对话语句中的关键词；根据关键词对可选对话节点路径上每个对话节点对应的对话语句的非关键词进行省略，得到省略后的对话语句；相应的，根据每个对话节点对应的对话语句得到对话样本数据，包括：根据省略后的对话语句得到对话
样本数据。在实际对话中，用户可能根据对话的上下文省略一些词语，例如在系统问“请问您是要咨询按月对冲办理、按月对冲终止、还是按月对冲的还贷顺序呢？”，用户回答“还贷”，实际上表达的是按月对冲还贷，不是公积金还贷等其他含义。结合上述步骤202的说明中的对话模拟策略，对话模拟策略还可以包括上下文省略的模拟策略。此处的应用场景可以是基于上下文省略的模拟策略得到对话样本数据，可以丰富用户的表达，提高模拟出的对话样本数据的质量。
[0049]
步骤204、根据对话样本数据训练对话模型。
[0050]
对话模型训练好之后，可以用于和真实用户进行对话，回答用户提出的问题。在对话模型的应用过程中，可以记录用户与对话模型的系统之间的对话内容生成对话日志，需要说明的是，对话日志中包含的对话语句是未进行标注的对话语句，此处，列举两个示例分别说明对话日志的作用。
[0051]
可选地，在第一个示例中，对话节点包括至少一个对话语句，该方法还包括：获取对话日志中至少一个对话语句的置信度；将对话日志中置信度大于或等于预设阈值的对话语句添加到对应的对话节点中。示例性地，一个对话节点可以包含含义相同，表达方式不同的至少一个对话语句。在对话模型实际应用过程中，可能产生新的对话语句，将这些新的对话语句中，置信度较大的对话语句添加到对话节点中，可以使得对话节点包含更多的表达方式的对话语句，可以生成更丰富的对话样本数据对对话模型进一步进行训练，提高对话模型的准确度。
[0052]
可选地，在第二个示例中，该方法还包括：获取利用训练后的对话模型响应于用户对话得到的对话日志，对话日志包括用户输入的对话语句，以及对话模型响应用户对话语句而生成的对话语句；根据对话日志调节跳转概率。因为对话日志中的对话是用户真实的对话，利用对话日志中对话语句对应的各个对话节点之间的跳转关系对对话节点之间的跳转概率进行调整，可以在模拟生成对话样本数据时，更符合真实对话。进一步可选地，对于第一对话节点，根据对话日志确定第一对话节点向第二对话节点跳转的实际跳转概率pd，对第一对话节点向第二对话节点的跳转概率p
t
进行调整，可以计算实际跳转概率pd与跳转概率p
t
的加权平均值作为新的跳转概率。例如，新的跳转概率p
t+1
＝0.9p
t
+0.1pd。在对话日志中，如果第一对话节点在5个对话中分别跳转到5个不同的对话节点(包括第二对话节点)，则实际跳转概率pd为0.2，当然，此处只是示例性说明。
[0053]
基于上述步骤201-步骤203所描述的对话模型的训练，此处列举一个具体的应用场景进行说明，如图5所示，图5为本技术实施例一提供的一种对话模型的训练的另一种场景示意图。开发人员为对话模拟器配置至少一个对话流，对话模型的训练装置将至少一个对话流输入对话模拟器，按照对话模拟策略进行对话模拟，得到可选对话节点路径，并得到至少一个对话样本数据，其中，对话模拟器包含对话模拟策略和至少一个对话流中的对话节点之间的跳转概率，对话模拟器可以是用于模拟对话的程序。利用至少一个对话样本数据对基于神经网络的对话模型进行训练，将训练好的对话模型与用户进行线上交互，根据产生的实际对话生成对话日志，将对话日志返回给对话模拟器，调整对话节点之间的跳转概率，对于对话日志中的对话，还可以进行人工标注，人工标注后的对话可以作为对话样本数据对对话模型进行训练。利用对话日志调整对话节点之间的跳转概率，可以提高话模型的准确度。如图6所示，图6为本技术实施例一提供的一种对话模型效果示意图，其中，横坐
标表示输入对话模型的对话数量，纵坐标表示对话模型的准确率，图6中第一曲线表示利用对话模拟器和对话日志训练的对话模型的准确率，第二曲线表示仅利用对话模拟器，不利用对话日志训练的对话模型的准确率，第三曲线表示仅利用标注的对话日志训练的对话模型的准确率，通过图6可以观察得到，在输入相同数量的对话时，第一曲线表示的准确率最高，即利用对话模拟器和对话日志训练的对话模型的准确率最高。
[0054]
本技术实施例提供的对话模型的训练，获取多个对话流，每个对话流包括多个对话节点；基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径；根据可选对话节点路径获得对话样本数据；根据对话样本数据训练对话模型。因为根据多个对话流可以模拟对话，得到对话样本数据，解决了对话模型缺少对话样本数据，难以实现冷启动的问题。而且，进一步地，因为对话节点之间的跳转概率，可以实现对话节点之间的跳转，模拟出的对话并不是完全按照对话流中对话节点的顺序进行，丰富了对话样本数据，提高了模拟出到的对话样本数据的质量。
[0055]
实施例二
[0056]
基于上述实施例一所描述的方法，本技术实施例二提供一种对话模型的训练装置，用于执行上述实施例一所描述的方法，参照图7所示，该对话模型的训练装置70包括：
[0057]
获取模块701，用于多个对话流，每个对话流包括多个对话节点；
[0058]
路径模块702，用于基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径；
[0059]
样本模块703，用于根据可选对话节点路径获得对话样本数据；
[0060]
训练模块704，用于根据至少一个对话样本数据对基于神经网络的对话模型进行训练。
[0061]
可选地，路径模块702，还用于获取利用训练后的对话模型响应于用户对话得到的对话日志，对话日志包括用户输入的对话语句，以及对话模型响应用户对话语句而生成的对话语句；根据对话日志调节跳转概率。
[0062]
可选地，对话节点包括至少一个对话语句，路径模块702，还用于获取对话日志中至少一个对话语句的置信度；将对话日志中置信度大于或等于预设阈值的对话语句添加到对应的对话节点中。
[0063]
可选地，路径模块702，用于基于不同对话流的对话节点之间的跳转概率，得到跨对话流的可选对话节点路径。
[0064]
可选地，路径模块702，用于基于同一对话流中对话节点之间的跳转概率，按照同一对话流中对话节点的正向顺序或逆向顺序，跳过至少一个对话节点的对话，得到可选对话节点路径；和/或，基于同一对话流中对话节点之间的跳转概率，按照随机顺序得到可选对话节点路径。
[0065]
可选地，路径模块702，用于将第一对话流中的第一对话节点与第二对话流中的初始对话节点的跳转概率设置为高于至少一个其他对话节点，以使得可选对话节点路径包括从第一对话节点跳转到初始对话节点的路径。
[0066]
可选地，样本模块703，用于根据可选对话节点路径，获得可选对话节点路径上每个对话节点对应的对话语句；根据每个对话节点对应的对话语句得到对话样本数据。
[0067]
可选地，对话模型的训练装置70还包括省略模块705；省略模块705，用于根据预设
规则确定可选对话节点路径上每个对话节点对应的对话语句中的关键词；根据关键词对可选对话节点路径上每个对话节点对应的对话语句的非关键词进行省略，得到省略后的对话语句；
[0068]
相应的，样本模块703，用于根据省略后的对话语句得到对话样本数据。
[0069]
本技术实施例提供的对话模型的训练装置，获取多个对话流，每个对话流包括多个对话节点；基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径；根据可选对话节点路径获得对话样本数据；根据对话样本数据训练对话模型。因为根据多个对话流可以模拟对话，得到对话样本数据，解决了对话模型缺少对话样本数据，难以实现冷启动的问题。而且，进一步地，因为对话节点之间的跳转概率，可以实现对话节点之间的跳转，模拟出的对话并不是完全按照对话流中对话节点的顺序进行，丰富了对话样本数据，提高了模拟出到的对话样本数据的质量。
[0070]
实施例三
[0071]
基于上述实施例一所描述的方法，本技术实施例三提供一种电子设备，用于执行上述实施例一所描述的方法，参照图8所示，图8为本技术实施例三提供的一种电子设备的结构示意图，本技术具体实施例并不对电子设备的具体实现做限定。
[0072]
如图8所示，该电子设备可以包括：处理器(processor)802、通信接口(communications interface)804、存储器(memory)806、以及通信总线808。
[0073]
其中：
[0074]
处理器802、通信接口804、以及存储器806通过通信总线808完成相互间的通信。
[0075]
通信接口804，用于与其它电子设备如终端设备或服务器进行通信。
[0076]
处理器802，用于执行程序810，具体可以执行上述方法实施例中的相关步骤。
[0077]
具体地，程序810可以包括程序代码，该程序代码包括计算机操作指令。
[0078]
处理器802可能是中央处理器cpu，或者是特定集成电路asic(application specific integrated circuit)，或者是被配置成实施本技术实施例的一个或多个集成电路。电子设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个cpu；也可以是不同类型的处理器，如一个或多个cpu以及一个或多个asic。
[0079]
存储器806，用于存放程序810。存储器806可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。
[0080]
程序810具体可以用于使得处理器802执行前述实施例一中任一方法。
[0081]
程序810中各步骤的具体实现可以参见上述对话模型的训练实施例中的相应步骤和单元中对应的描述，在此不赘述。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程描述，在此不再赘述。
[0082]
本技术实施例提供的电子设备，获取多个对话流，每个对话流包括多个对话节点；基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径；根据可选对话节点路径获得对话样本数据；根据对话样本数据训练对话模型。因为根据多个对话流可以模拟对话，得到对话样本数据，解决了对话模型缺少对话样本数据，难以实现冷启动的问题。而且，进一步地，因为对话节点之间的跳转概率，可以实现对话节点之间的跳转，模拟出的对话并不是完全按照对话流中对话节点的顺序进行，丰富了对话
样本数据，提高了模拟出到的对话样本数据的质量。
[0083]
实施例四
[0084]
基于上述实施例一所描述的方法，本技术实施例四提供一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如实施例一所描述的方法。
[0085]
本技术实施例提供的计算机存储介质，获取多个对话流，每个对话流包括多个对话节点；基于每个对话流中的对话节点与多个对话流中的对话节点之间的跳转概率，得到可选对话节点路径；根据可选对话节点路径获得对话样本数据；根据对话样本数据训练对话模型。因为根据多个对话流可以模拟对话，得到对话样本数据，解决了对话模型缺少对话样本数据，难以实现冷启动的问题。而且，进一步地，因为对话节点之间的跳转概率，可以实现对话节点之间的跳转，模拟出的对话并不是完全按照对话流中对话节点的顺序进行，丰富了对话样本数据，提高了模拟出到的对话样本数据的质量。
[0086]
需要指出，根据实施的需要，可将本技术实施例中描述的各个部件/步骤拆分为更多部件/步骤，也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤，以实现本技术实施例的目的。
[0087]
上述根据本技术实施例的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如cd rom、ram、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如asic或fpga)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，ram、rom、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的对话模型的训练。此外，当通用计算机访问用于实现在此示出的对话模型的训练的代码时，代码的执行将通用计算机转换为用于执行在此示出的对话模型的训练的专用计算机。
[0088]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本技术实施例的范围。
[0089]
以上实施方式仅用于说明本技术实施例，而并非对本技术实施例的限制，有关技术领域的普通技术人员，在不脱离本技术实施例的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本技术实施例的范畴，本技术实施例的专利保护范围应由权利要求限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：戴音培黎航宇唐呈光李永彬孙健
技术所有人：阿里巴巴新加坡控股有限公司
我是此专利的发明人

上一篇：封闭式木塑栈道板模具用智能压印装置的制作方法
上一篇：基于动目标相位编码逆合成孔径激光雷达多普勒补偿方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。