对话处理模型的训练方法、对话处理方法、装置及设备与流程

文档序号:33126688发布日期:2023-02-01 05:32阅读:36来源:国知局
对话处理模型的训练方法、对话处理方法、装置及设备与流程

1.本技术实施例涉及人工智能技术领域,特别涉及一种对话处理模型的训练方法、对话处理方法、装置及设备。


背景技术:

2.随着人工智能技术的发展,人工智能模型广泛应用于各类任务处理中。例如,可以使用对话处理相关的人工智能模型处理对话相关的任务。


技术实现要素:

3.本技术实施例提供了一种对话处理模型的训练方法、对话处理方法、装置及设备,以扩大对话处理模型的适用范围,提高对话处理模型输出的处理结果的准确性。技术方案如下:
4.一方面,本技术实施例提供了一种对话处理模型的训练方法,该方法包括:
5.获取多个客服对话语段,多个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种,分类任务是指任务目标为将客服对话语段划分至多个候选类别中的目标类别的任务,生成任务是指任务目标为生成客服对话语段相关的目标语段的任务;
6.调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果;
7.基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,利用第一目标损失更新初始处理模型,得到对话处理模型,对话处理模型用于对目标客服对话语段进行处理。
8.在一种可能的实现方式中,调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果,包括:对于多个客服对话语段中的任一个客服对话语段,调用初始处理模型输出基于该任一个客服对话语段包括的任务提示预测得到的任务目标,将任务目标作为该任一个客服对话语段的处理结果。
9.在一种可能的实现方式中,获取多个客服对话语段,包括:获取多个初始客服对话语段,任一个初始客服对话语段具有第一标签,第一标签用于指示该任一个初始客服对话语段的任务目标;根据第一标签,为该任一个初始客服对话语段添加任务提示,任务提示包括任务类型提示或任务目标提示中的至少一种;将添加任务提示后的各个初始客服对话语段作为获取到的多个客服对话语段。
10.在一种可能的实现方式中,根据第一标签,为该任一个初始客服对话语段添加任务提示,包括:根据第一标签,查询标签与任务提示的对应关系,得到第一标签对应的任务提示;为该任一个初始客服对话语段添加任务提示。
11.在一种可能的实现方式中,任一个客服对话语段的处理结果包括至少一个字符,基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,包括:对于该任一个客服对话语段,获取该任一个客服对话语段的处理结果包括的各个字符的输出概
率;基于各个字符的输出概率,获取该任一个客服对话语段对应的生成损失;基于多个客服对话语段对应的生成损失,获取第一目标损失。
12.在一种可能的实现方式中,基于各个字符的输出概率,获取该任一个客服对话语段对应的生成损失,包括:将各个字符的输出概率代入生成损失函数,获取该任一个客服对话语段对应的生成损失;其中,对于对应于不同任务类型的多个客服对话语段,获取多个客服对话语段的生成损失时使用的生成损失函数相同。
13.在一种可能的实现方式中,得到对话处理模型之后,该方法还包括:获取至少一个参考客服对话语段,至少一个参考客服对话语段对应目标任务类型,目标任务类型为分类任务或生成任务;根据至少一个参考客服对话语段的第二标签,为至少一个参考客服对话语段添加任务提示,得到多个目标客服对话语段,第二标签用于指示第二标签对应的参考客服对话语段的任务目标;调用对话处理模型对多个目标客服对话语段进行处理,输出目标任务类型对应的多个目标客服对话语段的处理结果;基于多个目标客服对话语段和多个目标客服对话语段的处理结果,获取第二目标损失,利用第二目标损失更新对话处理模型,得到目标任务类型对应的对话处理模型。
14.另一方面,本技术实施例提供了一种对话处理方法,该方法包括:
15.获取至少一个客服对话语段和对话处理模型,至少一个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种,对话处理模型是按照上述任一种对话处理模型的训练方法训练得到的;
16.调用对话处理模型对至少一个客服对话语段进行处理,输出至少一个客服对话语段的处理结果。
17.在一种可能的实现方式中,调用对话处理模型对至少一个客服对话语段进行处理,输出至少一个客服对话语段的处理结果,包括:对于至少一个客服对话语段中的任一个客服对话语段,调用对话处理模型预测该任一个客服对话语段的任务目标,将任务目标作为该任一个客服对话语段的处理结果。
18.另一方面,提供了一种对话处理模型的训练装置,该装置包括:
19.获取模块,用于获取多个客服对话语段,多个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种,分类任务是指任务目标为将客服对话语段划分至多个候选类别中的目标类别的任务,生成任务是指任务目标为生成客服对话语段相关的目标语段的任务;
20.处理模块,用于调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果;
21.更新模块,用于基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,利用第一目标损失更新初始处理模型,得到对话处理模型,对话处理模型用于对目标客服对话语段进行处理。
22.在一种可能的实现方式中,处理模块,用于对于多个客服对话语段中的任一个客服对话语段,调用初始处理模型输出基于该任一个客服对话语段包括的任务提示预测得到的任务目标,将任务目标作为该任一个客服对话语段的处理结果。
23.在一种可能的实现方式中,获取模块,用于获取多个初始客服对话语段,任一个初始客服对话语段具有第一标签,第一标签用于指示该任一个初始客服对话语段的任务目
标;根据第一标签,为该任一个初始客服对话语段添加任务提示,任务提示包括任务类型提示或任务目标提示中的至少一种;将添加任务提示后的各个初始客服对话语段作为获取到的多个客服对话语段。
24.在一种可能的实现方式中,获取模块,用于根据第一标签,查询标签与任务提示的对应关系,得到第一标签对应的任务提示;为该任一个初始客服对话语段添加任务提示。
25.在一种可能的实现方式中,任一个客服对话语段的处理结果包括至少一个字符,更新模块,用于对于该任一个客服对话语段,获取该任一个客服对话语段的处理结果包括的各个字符的输出概率;基于各个字符的输出概率,获取该任一个客服对话语段对应的生成损失;基于多个客服对话语段对应的生成损失,获取第一目标损失。
26.在一种可能的实现方式中,更新模块,用于将各个字符的输出概率代入生成损失函数,获取该任一个客服对话语段对应的生成损失;其中,对于对应于不同任务类型的多个客服对话语段,获取多个客服对话语段的生成损失时使用的生成损失函数相同。
27.在一种可能的实现方式中,更新模块,还用于获取至少一个参考客服对话语段,至少一个参考客服对话语段对应目标任务类型,目标任务类型为分类任务或生成任务;根据至少一个参考客服对话语段的第二标签,为至少一个参考客服对话语段添加任务提示,得到多个目标客服对话语段,第二标签用于指示第二标签对应的参考客服对话语段的任务目标;调用对话处理模型对多个目标客服对话语段进行处理,输出目标任务类型对应的多个目标客服对话语段的处理结果;基于多个目标客服对话语段和多个目标客服对话语段的处理结果,获取第二目标损失,利用第二目标损失更新对话处理模型,得到目标任务类型对应的对话处理模型。
28.另一方面,提供了一种对话处理装置,该装置包括:
29.获取模块,用于获取至少一个客服对话语段和对话处理模型,至少一个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种,对话处理模型是按照上述任一种对话处理模型的训练方法训练得到的;
30.处理模块,用于调用对话处理模型对至少一个客服对话语段进行处理,输出至少一个客服对话语段的处理结果。
31.在一种可能的实现方式中,处理模块,用于对于至少一个客服对话语段中的任一个客服对话语段,调用对话处理模型预测该任一个客服对话语段的任务目标,将任务目标作为该任一个客服对话语段的处理结果。
32.另一方面,提供了一种计算机设备,计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序,至少一条计算机程序由处理器加载并执行,以使计算机设备实现上述任一的对话处理模型的训练方法,或者实现上述任一的对话处理方法。
33.另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质中存储有至少一条计算机程序,至少一条计算机程序由处理器加载并执行,以使计算机实现上述任一的对话处理模型的训练方法,或者实现上述任一的对话处理方法。
34.另一方面,还提供了一种计算机程序产品或计算机程序,计算机程序产品或计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取计算机指令,处理器执行计算机指令,使得计算机设备执行上述任一的对话处理模型的训练方法,或者实现上述任一的对话处理方法。
35.本技术提供的技术方案至少带来如下有益效果:
36.通过使用分类任务或生成任务中的至少一种任务类型对应的客服对话语段对初始处理模型进行训练,训练得到的对话处理模型能够适用于处理分类任务或生成任务中的至少一种任务类型对应的客服对话语段,对话处理模型的适用范围较广。再有,用于训练的多个客服对话语段能够包括客服领域的知识,从而使得训练得到的对话处理模型能够学习到客服领域的知识,调用该对话处理模型处理客服领域的语段时,对话处理模型输出的处理结果的准确性较高。
附图说明
37.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
38.图1是本技术实施例提供的一种实施环境的示意图;
39.图2是本技术实施例提供的一种对话处理模型的训练方法的流程图;
40.图3是本技术实施例提供的一种用户与客服设备的交互过程的示意图;
41.图4是本技术实施例提供的一种参考格式的示意图;
42.图5是本技术实施例提供的一种获取任务目标的过程示意图;
43.图6是本技术实施例提供的一种对话处理方法的流程图;
44.图7是本技术实施例提供的一种对话处理模型的训练装置的结构示意图;
45.图8是本技术实施例提供的一种对话处理装置的结构示意图;
46.图9是本技术实施例提供的一种服务器的结构示意图;
47.图10是本技术实施例提供的一种终端的结构示意图。
具体实施方式
48.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
49.在相关技术中,使用变换器的双向编码表示(bidirectional encoder representation from transformers,bert)模型处理对话相关的自然语言理解(natural language understanding,nlu)任务,使用生成式的预训练(generative pre-training,gpt)模型处理对话相关的自然语言生成(natural language generation,nlg)任务。其中,nlu任务属于分类任务,nlg任务属于生成任务。
50.然而,由于相关技术中bert模型仅用于处理对话相关的分类任务,gpu模型仅用于处理对话相关的生成任务,模型的适用范围较为局限。
51.本技术实施例提出了一种对话处理模型的训练方法和一种对话处理方法,以扩大对话处理模型的适用范围,并提高对话处理模型输出的处理结果的准确性。图1示出了本技术实施例提供的实施环境的示意图。该实施环境可以包括:终端11和服务器12。
52.本技术实施例提供的对话处理模型的训练方法可以由终端11执行,也可以由服务器12执行,还可以由终端11和服务器12共同执行,本技术实施例对此不加以限定。对于本申
请实施例提供的对话处理模型的训练方法由终端11和服务器12共同执行的情况,服务器12承担主要计算工作,终端11承担次要计算工作;或者,服务器12承担次要计算工作,终端11承担主要计算工作;或者,服务器12和终端11二者之间采用分布式计算架构进行协同计算。
53.本技术实施例提供的对话处理方法可以由终端11执行,也可以由服务器12执行,还可以由终端11和服务器12共同执行,本技术实施例对此不加以限定。对于本技术实施例提供的对话处理方法由终端11和服务器12共同执行的情况,服务器12承担主要计算工作,终端11承担次要计算工作;或者,服务器12承担次要计算工作,终端11承担主要计算工作;或者,服务器12和终端11二者之间采用分布式计算架构进行协同计算。
54.需要说明的是,对话处理模型的训练方法的执行设备与对话处理方法的执行设备可以相同,也可以不同,本技术实施例对此不加以限定。
55.在一种可能实现方式中,终端11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如,pc(personal computer,个人计算机)、手机、智能手机、pda(personal digital assistant,个人数字助手)、可穿戴设备、ppc(pocket pc,掌上电脑)、平板电脑、智能车机、智能电视、智能音箱、智能语音交互设备、智能家电、车载终端、飞行器等。服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。
56.本领域技术人员应能理解上述终端11和服务器12仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本技术,也应包含在本技术保护范围以内,并在此以引用方式包含于此。
57.基于上述图1所示的实施环境,本技术实施例提供一种对话处理模型的训练方法,该方法由计算机设备执行,该计算机设备可以为终端11,也可以为服务器12。如图2所示,本技术实施例提供的对话处理模型的训练方法可以包括如下步骤201至步骤203。
58.在步骤201中,获取多个客服对话语段,多个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种,分类任务是指任务目标为将客服对话语段划分至多个候选类别中的目标类别的任务,生成任务是指任务目标为生成客服对话语段相关的目标语段的任务。
59.在一种可能的实现方式中,获取多个客服对话语段,包括:按照任务类型,从客服对话语段库中选取多个客服对话语段,客服对话语段库包括分类任务对应的至少一个客服对话语段以及生成任务对应的至少一个客服对话语段。
60.例如,客服对话语段库中的客服对话语段具有任务类型标签,任务类型标签用于指示该任务类型标签对应的客服对话语段对应的任务类型。从而根据各个客服对话语段的任务类型标签,可以从客服对话语段库中选取多个客服对话语段。又例如,客服对话语段库包括多个子库,一个子库用于存储一个任务类型对应的客服对话语段。从而可以从存储分类任务对应的客服对话语段的子库中获取分类任务对应的客服对话语段,从存储生成任务对应的客服对话语段的子库中获取生成任务对应的客服对话语段。
61.本技术实施例不对客服对话语段库的获取方式进行限定,例如,客服对话语段库为存储在执行对话处理模型的设备中的训练样本库。
62.示例性地,对于多个客服对话语段中的任一个客服对话语段,该任一个客服对话
语段包括任务提示。关于任务提示的说明请详见后文步骤2012中的相关内容,此处暂不展开说明。
63.在另一种可能的实现方式中,获取多个客服对话语段,包括如下步骤2011至步骤2013。
64.在步骤2011中,获取多个初始客服对话语段,任一个初始客服对话语段具有第一标签,第一标签用于指示该任一个初始客服对话语段的任务目标。
65.在本技术实施例中,可以基于客服对话文本获取多个初始客服对话语段。客服对话文本是指用户与运行客服系统的设备的交互过程中产生的对话文本。运行客服系统的设备包括但不限于用户使用的第一终端、人工坐席使用的第二终端以及与第一终端和第二终端通信连接的服务器。为简便说明,后文中将运行客服系统的设备简称为客服设备。
66.图3是本技术实施例提供的一种用户与客服设备的交互过程的示意图。如图3所示,用户向客服设备输入语句,例如图3示出的“我要重置密码”,客服设备获取到该语句后,可以对该语句进行领域分类,将该语句划分至多个候选领域中的目标领域中。其中,将用户输入的语句划分至多个候选领域中的目标领域中可以称为一种任务目标。客服设备还可以对用户输入的语句进行意图识别,从多个候选意图中确定用户的目标意图。从多个候选意图中确定用户的目标意图也可称为一种任务目标。
67.示例性地,客服设备基于该语句确定该语句对应的回复。本技术实施例不对客服设备确定回复的方式进行限定。例如,客服设备通过回复生成模块自动生成回复,回复生成模块可以称为智能机器人。又例如,客服设备获取人工坐席输入的回复,将获取到的回复作为用户输入的语句对应的回复。如图3所示,“我要重置密码”对应的回复为“请提供您的注册手机号”。本技术实施例中,确定用户输入的语句对应的回复也可称为一种任务目标。
68.上述用户输入语句,客服设备确定用户输入的语句对应的回复的过程可以称为一次交互过程,在一次交互过程中的用户输入的语句及其对应的回复可以称为对话文本。
69.参见图3,在用户与客服设备的至少一次交互过程之后,客服设备还可以获取对话摘要,对话摘要包括但不限于用户意图、背景信息和解决方案。其中,用户意图可以为确定出的用户的目标意图,背景信息可以为至少一次交互过程对应的至少一个对话文本中,用户输入的第一个语句,解决方案可以为至少一次交互过程对应的至少一个对话文本中,客服设备确定的最后一个回复。当然,上述用户意图、背景信息和解决方案还可以包括其他内容,本技术实施例对此不加以限定。上述对话摘要也可以称为工单记录。再有,本技术实施例对客服设备获取对话摘要的方式也不加以限定。例如,客服设备可以通过摘要生成模块自动生成对话摘要,也可以获取人工坐席输入的对话摘要。本技术实施例中,获取对话摘要也可称为一种任务目标。
70.根据上述内容可知,任务目标包括但不限于:将用户输入的语句划分至多个候选领域中的目标领域中、从多个候选意图中确定用户的目标意图、确定用户输入的语句对应的回复、以及获取对话摘要称为任务目标。进而通过为各个任务目标相关的语句添加第一标签,能够得到多个初始客服对话语段。例如,为上述“我要重置密码”和“请提供您的注册手机号”添加第一标签,得到任务目标为将用户输入的语句划分至多个候选领域中的目标领域中的初始客服对话语段。
71.在本技术实施例中,各个任务目标相关的语句可以相同或者不同。例如,上述“我
要重置密码”和“请提供您的注册手机号”为将用户输入的语句划分至多个候选领域中的目标领域中的相关语句,也为从多个候选意图中确定用户的目标意图的语句。则可以为“我要重置密码”和“请提供您的注册手机号”添加多个第一标签,得到多个初始客服对话语段。
72.关于为任务目标相关的语句添加第一标签的方式,本技术实施例不加以限定。例如,可以通过人工为各个任务目标相关的语句添加第一标签,或者通过神经网络模型为各个任务目标相关的语句添加第一标签。当然,在通过神经网络模型为各个任务目标相关的语句添加第一标签之后,还可以由人工对第一标签进行调整,保证为各个任务目标相关的语句添加的第一标签的准确性。
73.在步骤2012中,根据第一标签,为该任一个初始客服对话语段添加任务提示,任务提示包括任务类型提示或任务目标提示中的至少一种。
74.在一种可能的实现方式中,根据第一标签,为该任一个初始客服对话语段添加任务提示,包括:根据第一标签,查询标签与任务提示的对应关系,得到第一标签对应的任务提示;为该任一个初始客服对话语段添加任务提示。标签与任务提示的对应关系可以存储在执行该对话模型处理的训练方法的设备中,或者存储在该设备以外的其他设备中。在标签与任务提示的对应关系存储在执行该方法的设备中的情况下,该设备可以直接获取存储的标签与任务提示的对应关系。在标签与任务提示的对应关系存储在其他设备中的情况下,该设备可以向存储有标签与任务提示的对应关系的设备发送第一请求,接收存储有标签与任务提示的对应关系的设备响应于第一请求发送的标签与任务提示的对应关系。
75.示例性地,得到第一标签对应的任务提示之后,按照参考格式为该任一个初始客服对话语段添加任务提示。参考格式用于指示任务提示的添加位置,例如,参考格式用于指示将任务类型提示添加在初始客服对话语段之前,或者,将任务目标提示添加在初始客服对话语段之后。参考格式还可以包括至少一个间隔符,该至少一个间隔符将任务提示和初始客服对话语段间隔开。
76.图4是本技术实施例提供的一种参考格式的示意图,如图4所示,参考格式包括第一间隔符和第二间隔符,第一间隔符用于将任务类型提示和初始客服对话语段间隔开,第二间隔符用于将初始客服对话语段和任务目标提示间隔开。参考格式还可以包括第三间隔符,第三间隔符位于任务类型提示之前。从而对于顺序相邻的两个初始客服对话语段,第三间隔符能够用于将后一个初始客服对话语段对应的任务类型提示与前一个初始客服对话语段或者前一个初始客服对话语段的任务目标提示间隔开。第一间隔符可以表示为[对话(dialogue)],第二间隔符可以表示为[目标(goal)],第三间隔符可以表示为[任务(task)]。
[0077]
在本技术实施例中,任务类型提示可以用于提示初始客服对话语段对应的任务类型,任务目标提示可以用于提示初始客服对话语段的任务目标。通过添加任务提示,得到的客服对话语段对应的任务类型和/或客服对话语段的任务目标能够更加明确,有助于初始处理模型学习客服对话语段包括的客服领域的知识。
[0078]
示例性地,对于任务目标为将用户输入的语句划分至多个候选领域中的目标领域中的初始客服对话语段,该初始客服对话语段对应的任务类型为领域分类任务。对于领域分类任务,任务类型提示为领域分类(domain classification),任务目标提示为这个对话是关于哪个领域的(which domain is this dialogue about)。
[0079]
对于任务目标为从多个候选意图中确定用户的目标意图的初始客服对话语段,该初始客服对话语段对应的任务类型为意图识别任务。对于意图识别任务,任务类型提示为意图识别(intent detection),任务目标提示为用户的意图是(the intent of the user is)。
[0080]
对于任务目标为确定用户输入的语句对应的回复的初始客服对话语段,该初始客服对话语段对应的任务类型为回复生成任务。对于回复生成任务,任务类型提示为对话生成(dialogue generation),任务目标提示为代理应该回复什么(what should the agent reply)。
[0081]
对于任务目标为获取对话摘要的初始客服对话语段,该初始客服对话语段对应的任务类型为摘要生成任务。对于摘要生成任务,任务类型提示为总结(summarization),任务目标提示为总结会话(summarize the conversation)。
[0082]
上述领域分类任务和意图识别任务均可以属于分类任务,回复生成任务和摘要生成任务均可以属于生成任务。
[0083]
在步骤2013中,将添加任务提示后的各个初始客服对话语段作为获取到的多个客服对话语段。
[0084]
通过根据各个初始对话语段的第一标签,为各个初始客服对话语段分别添加任务提示,获取到的各个客服对话语段均可以包括任务提示,任务提示包括但不限于任务类型提示和任务目标提示。示例性地,由于多个初始客服对话语段中可能不包括某些任务类型对应的初始客服对话语段,在本技术实施例中,根据多个初始客服对话语段对应的任务类型的情况,获取到的多个客服对话语段对应的任务类型中可能也不包括某些任务类型。例如,对于对应于分类任务的至少一个客服对话语段,该至少一个客服对话语段对应的任务类型包括但不限于领域分类任务或意图识别任务中的至少一种。对于对应于生成任务的至少一个客服对话语段,该至少一个客服对话语段对应的任务类型包括但不限于回复生成任务或摘要生成任务中的至少一种。
[0085]
在步骤202中,调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果。
[0086]
示例性地,初始处理模型具有对输入的客服对话语段进行处理的功能。例如,在各个客服对话语段包括任务提示的情况下,初始处理模型具有基于各个客服对话语段包括的任务提示对各个客服对话语段进行处理的功能。在一种可能的实现方式中,初始处理模型是编码器(encoder)-解码器(decoder)架构的变换器(transformer)模型。初始处理模型可以是未经过训练的encoder-decoder架构的transformer模型,也可以是基于至少一个参考客服对话语段初始化的encoder-decoder架构的transformer模型。其中,参考客服对话语段是指不包括第一标签和任务提示的客服对话语段。
[0087]
在一种可能的实现方式中,调用初始处理模型对多个客服对话语段进行处理时,可以按照任务类型,对各个任务类型对应的客服对话语段进行处理,得到各个任务类型对应的客服对话语段的处理结果。当然,也可以乱序选取客服对话语段,对乱序选取的客服对话语段进行处理,进而得到各个任务类型对应的客服对话语段的处理结果。本技术实施例不对选择用于处理的客服对话语段的顺序进行限定。
[0088]
示例性地,调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型
对应的客服对话语段的处理结果,包括:对于多个客服对话语段中的任一个客服对话语段,调用初始处理模型输出基于该任一个客服对话语段包括的任务提示预测得到的任务目标,将任务目标作为该任一个客服对话语段的处理结果。
[0089]
在本技术实施例中,可以将包括任务提示的任一个客服对话语段输入初始处理模型,通过初始处理模型对该任一个客服对话语段的任务目标进行预测,进而将预测得到的任务目标作为该任一个客服对话语段的处理结果。处理结果可以包括至少一个字符。
[0090]
图5是本技术实施例提供的一种获取任务目标的过程示意图。如图5所示,初始处理模型为包括encoder和decoder的transformer模型,初始处理模型的输入为客服对话语段,该客服对话语段可以为领域分类任务对应的客服对话语段、意图识别任务对应的客服对话语段、回复生成任务对应的客服对话语段、或者摘要生成任务对应的客服对话语段中的任一种。
[0091]
在输入为领域分类任务对应的客服对话语段的情况下,初始处理模型输出的任务目标为将客服对话语段语句划分至多个候选领域中的目标领域,例如图5示出的领域。在此情况下,多个候选类别为多个候选领域,目标类别为目标领域。
[0092]
在输入为意图识别任务对应的客服对话语段的情况下,初始处理模型输出的任务目标为从多个候选意图中确定目标意图,例如图5示出的意图。在此情况下,多个候选类别为多个候选意图,目标类别为目标意图。
[0093]
在输入为回复生成任务对应的客服对话语段的情况下,初始处理模型输出的任务目标为确定客服对话语段对应的回复,例如图5示出的回复。在此情况下,目标语段为客服对话语段对应的回复。在输入为摘要生成任务对应的客服对话语段的情况下,初始处理模型输出的任务目标为获取对话摘要,例如图5中位于上方的总结。在此情况下,目标语段为对话摘要。
[0094]
示例性地,对于多个客服对话语段中的任一个客服对话语段,该任一个客服对话语段包括多个字符。encoder用于获取各个字符对应的向量,各个字符对应的向量用于指示各个字符之间的关系。decoder用于基于各个字符对应的向量,生成该任一个客服对话语段的处理结果,该处理结果包括至少一个字符。例如,decoder用于基于参考字符获取处理结果的第一个字符,然后基于输入的各个字符对应的向量以及已经获取的处理结果包括的字符的向量,获取处理结果的下一个字符,直到获取到结束字符。在本技术实施例中,由于参考字符可以用于获取处理结果的第一个字符,结束字符可以用于指示处理结果结束,初始处理模型可以不输出参考字符和结束字符。
[0095]
本技术实施例不对通过encoder获取各个字符对应的向量,以及通过decoder基于参考字符获取处理结果的第一个字符、以及基于输入的各个字符的向量以及已经获取的处理结果包括的字符的向量,获取处理结果的下一个字符的方式进行限定。需要说明的是,由于字符可以通过向量进行表示,本技术实施例中,术语“字符”和术语“字符的向量”可以互换。
[0096]
在步骤203中,基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,利用第一目标损失更新初始处理模型,得到对话处理模型,对话处理模型用于对目标客服对话语段进行处理。
[0097]
根据上述步骤202中的内容可知,对于多个客服对话语段中的任一个客服对话语
段,该任一个客服对话语段的处理结果包括至少一个字符。则在一种可能的实现方式中,基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,包括:对于该任一个客服对话语段,获取该任一个客服对话语段的处理结果包括的各个字符的输出概率;基于各个字符的输出概率,获取该任一个客服对话语段对应的生成损失;基于多个客服对话语段对应的生成损失,获取第一目标损失。
[0098]
示例性地,对于任一个客服对话语段的处理结果包括的任一个字符,由于该任一个字符是基于输入的各个字符以及在该任一个字符之前已经获取到的字符得到的,该任一个字符的输出概率可以为基于输入的任一个客服对话语段包括的各个字符和已经获取到的字符输出该任一个字符的概率。处理结果的各个字符的输出概率可以由初始处理模型输出。例如,decoder获取处理结果的各个字符时,也输出各个字符的输出概率。
[0099]
示例性地,基于各个字符的输出概率,获取该任一个客服对话语段对应的生成损失,包括:将各个字符的输出概率代入生成损失函数,获取该任一个客服对话语段对应的生成损失;其中,对于对应于不同任务类型的多个客服对话语段,获取多个客服对话语段的生成损失时使用的生成损失函数相同。
[0100]
在本技术实施例中,对于任一个客服对话语段,该任一个客服对话语段对应的生成损失可以如下述公式1所示:
[0101][0102]
其中,θ表示初始处理模型,表示该任一个客服对话语段对应的生成损失,y
t
表示处理结果的第t个字符,y
<t
表示处理结果的前t-1个字符,x表示该任一个客服对话语段,p
θ
(y
t
|y
<t
,x)表示第t个字符的输出概率,t表示处理结果包括的字符的数量。
[0103]
示例性地,基于多个客服对话语段对应的生成损失,获取第一目标损失,包括:将各个客服对话语段对应的生成损失相加,再取平均数,得到第一目标损失。当然,基于多个客服对话语段对应的生成损失,获取第一目标损失时,也可以先将各个任务类型对应的至少一个客服对话语段对应的生成损失相加,获取各个任务类型分别对应的第一平均数,再将各个任务类型分别对应的第一平均数相加,再取平均数,得到第一目标损失。
[0104]
无论以哪种方式计算第一目标损失,获取各个任务类型对应的客服对话语段的生成损失时使用的生成损失函数相同。也就是说,对于任一个任务类型对应的任一个客服对话语段,该任一个客服对话语段的生成损失均可以由上述公式1表示。由于获取各个任务类型对应的客服对话语段的生成损失的方式相同,初始处理模型能够学习到统一的客服领域的知识,避免不同任务类型之间存在负向的影响,从而保证初始处理模型的训练效果。
[0105]
在本技术实施例中,获取第一目标损失之后,利用第一目标损失更新初始处理模型,得到对话处理模型。对话处理模型可以适用于处理分类任务或生成任务中的至少一种对应的客服对话语段。本技术实施例对利用第一目标损失更新初始处理模型的方式不加以限定。示例性地,利用第一目标损失基于梯度下降法更新初始处理模型。例如,对第一生成损失求导得到梯度,基于梯度更新初始处理模型。基于梯度更新初始处理模型的过程可如下述公式2表示:
[0106]
θ2=θ1-αl
ꢀꢀꢀ
(公式2)
[0107]
其中,θ2表示更新后的初始处理模型,例如对话处理模型,θ1表示更新后的初始处
理模型,α表示学习率,l表示梯度。学习率可以根据经验或实际需求进行设置,本技术实施例对此不加以限定。
[0108]
在一种可能实现方式中,利用第一目标损失更新初始处理模型,得到对话处理模型的实现过程包括:利用第一目标损失更新初始处理模型,得到更新一次的初始处理模型;若当前训练过程满足训练终止条件,则将该更新一次的初始处理模型作为对话处理模型。可选地,若当前训练过程不满足训练终止条件,则在更新一次后的初始处理模型的基础上,获取新的第一目标损失,利用新的第一目标损失更新上述更新一次的初始处理模型,得到更新两次的初始处理模型,以此类推,直至当前训练过程满足训练终止条件,将满足训练终止条件时得到的初始处理模型作为对话处理模型。
[0109]
当前训练过程满足训练终止条件根据经验设置,或者根据应用场景灵活调整,本技术实施例对此不加以限定。示例性地,当前训练过程满足训练终止条件包括但不限于:在当前训练过程下已经执行的迭代过程的次数达到次数阈值、当前训练过程所利用的第一目标损失收敛、当前训练过程所利用的第一目标损失不大于损失阈值等。
[0110]
示例性地,得到对话处理模型之后,该方法还包括步骤s1至步骤s4。
[0111]
s1,获取至少一个参考客服对话语段,至少一个参考客服对话语段对应目标任务类型,目标任务类型为分类任务或生成任务。
[0112]
至少一个参考客服对话语段也可以基于客服对话文本得到。基于客服对话文本得到至少一个参考客服对话语段的方式与上述步骤2011中获取多个初始客服对话语段的方式原理相同,此处不再赘述。示例性地,至少一个参考客服对话语段的内容与多个初始客服对话语段的内容均不同。也就是说,至少一个参考客服对话语段为上述多个初始客服对话语段以外的其他客服对话语段。通过使用上述多个初始客服对话语段以外的至少一个参考客服对话语段训练对话处理模型,能够增加用于训练对话处理模型的样本数量,进而提高得到的目标任务类型对应的对话处理模型处理目标任务类型对应的客服对话语段的泛化能力。
[0113]
s2,根据至少一个参考客服对话语段的第二标签,为至少一个参考客服对话语段添加任务提示,得到多个目标客服对话语段,第二标签用于指示第二标签对应的参考客服对话语段的任务目标。
[0114]
示例性地,根据至少一个参考客服对话语段的第二标签,为至少一个参考客服对话语段添加任务提示的内容与上述步骤2012中根据第一标签,为任一个初始客服对话语段添加任务提示的相关内容原理相同,此处不再赘述。得到多个目标客服对话语段的内容与上述步骤2013中获取多个客服对话语段的相关内容原理相同,此处不再赘述。
[0115]
s3,调用对话处理模型对多个目标客服对话语段进行处理,输出目标任务类型对应的多个目标客服对话语段的处理结果。
[0116]
s3的实现过程可参照上述步骤202中调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果的相关内容,此处不再赘述。
[0117]
s4,基于多个目标客服对话语段和多个目标客服对话语段的处理结果,获取第二目标损失,利用第二目标损失更新对话处理模型,得到目标任务类型对应的对话处理模型。
[0118]
s4的实现过程可参照上述步骤203中基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,利用第一目标损失更新初始处理模型,得到对话处理模型
的相关内容,此处不再赘述。
[0119]
通过基于对应于目标任务类型对应的至少一个参考客服对话语段对对话处理模型进行训练,能够提高对话处理模型对目标任务类型对应的客服对话语段进行处理的准确性。在本技术实施例中,对初始处理模型进行训练得到对话处理模型的过程可以称为预训练过程,预训练得到的对话处理模型可以称为对话处理预训练模型。对对话处理模型进行训练得到目标任务类型对应的对话处理模型的过程可以称为预训练模型的微调过程,微调得到对话处理模型仍可以称为目标任务类型对应的对话处理模型。
[0120]
在本技术实施例中,通过使用分类任务或生成任务中的至少一种任务类型对应的客服对话语段对初始处理模型进行训练,训练得到的对话处理模型能够适用于处理分类任务或生成任务中的至少一种任务类型对应的客服对话语段,对话处理模型的适用范围较广。再有,用于训练的多个客服对话语段能够包括客服领域的知识,从而使得训练得到的对话处理模型能够学习到客服领域的知识,调用该对话处理模型处理客服领域的语段时,对话处理模型输出的处理结果的准确性较高。
[0121]
基于上述图1所示的实施环境,本技术实施例提供一种对话处理方法,该方法由计算机设备执行,该计算机设备可以为终端11,也可以为服务器12。如图6所示,本技术实施例提供的对话处理方法可以包括如下步骤601和步骤602。
[0122]
在步骤601中,获取至少一个客服对话语段和对话处理模型。
[0123]
其中,至少一个客服对话语段对应的任务类型包括但不限于分类任务或生成任务中的至少一种,对话处理模型利用图2所示的对话处理模型的训练方法训练得到的。获取到的至少一个客服对话语段可以为不包括第一标签、第二标签以及任务提示的客服对话语段。也就是说,至少一个客服对话语段可以是客服对话文本中的语段。在本技术实施例中,步骤601中获取的至少一个客服对话语段可以对应于步骤203中的目标客服对话语段。
[0124]
在步骤602中,调用对话处理模型对至少一个客服对话语段进行处理,输出至少一个客服对话语段的处理结果。
[0125]
在一种可能的实现方式中,调用对话处理模型对至少一个客服对话语段进行处理,输出至少一个客服对话语段的处理结果,包括:对于至少一个客服对话语段中的任一个客服对话语段,调用对话处理模型预测该任一个客服对话语段的任务目标,将任务目标作为该任一个客服对话语段的处理结果。
[0126]
例如,将该任一个客服对话语段输入对话处理模型,以通过对话处理模型预测该任一个客服对话语段的任务目标。获取对话处理模型输出的该任一个客服对话语段的任务目标,将该任务目标作为该任一个客服对话语段的处理结果。
[0127]
在本技术实施例中,由于对话处理模型是通过使用分类任务或生成任务中的至少一种任务类型对应的客服对话语段对初始处理模型进行训练得到的,对话处理模型能够适用于处理分类任务或生成任务中的至少一种任务类型对应的客服对话语段,对话处理模型的适用范围较广。再有,用于训练的多个客服对话语段能够包括客服领域的知识,从而使得训练得到的对话处理模型能够学习到客服领域的知识,调用该对话处理模型处理客服领域的语段时,对话处理模型输出的处理结果的准确性较高。
[0128]
上述方法在对各个任务类型对应的客服对话语段进行处理时能有效提升性能。表1中示出了分别使用多种对话处理模型对客服对话语段进行处理时的性能,为简化表1中的
内容表示方式,此处对表1中涉及的英文进行说明:bert、roberta-large以及mt5为三种对话处理模型;acc为准确性(accuracy)的英文缩写;bleu-1、rouge-1、rouge-2以及rouge-3为四种性能评价指标。对于上述acc、bleu-1、rouge-1、rouge-2以及rouge-3中的任一种性能评价指标,其数值越大表示性能越好。m为百万(million)的英文缩写。各个对话处理模型对客服对话语段进行处理时,性能如表1所示:
[0129]
表1
[0130][0131]
从表1的内容可以看出,无论是对于领域分类任务、意图识别任务、对话生成任务还是摘要生成任务,本技术实施例的方案提供的对话处理模型的性能均较高,也即对于各个任务类型的客服对话语段,本技术实施例提供的对话处理模型均能够取得较好的处理效果。
[0132]
再有,上述任务类型提示和任务目标提示均有助于提升对话处理模型的性能。对于任务提示的不同情况,本技术实施例提供的对话处理模型的性能可如表2所示:
[0133]
表2
[0134][0135][0136]
根据表2的内容可以看出,任务类型提示和任务目标提示均有助于提升对话处理模型的性能。
[0137]
参见图7,本技术实施例提供了一种对话处理模型的训练装置,该装置包括:获取模块701、处理模块702和更新模块703。
[0138]
获取模块701,用于获取多个客服对话语段,多个客服对话语段对应的任务类型包括分类任务或生成任务中的至少一种,分类任务是指任务目标为将客服对话语段划分至多个候选类别中的目标类别的任务,生成任务是指任务目标为生成客服对话语段相关的目标
语段的任务;
[0139]
处理模块702,用于调用初始处理模型对多个客服对话语段进行处理,输出各个任务类型对应的客服对话语段的处理结果;
[0140]
更新模块703,用于基于多个客服对话语段和多个客服对话语段的处理结果,获取第一目标损失,利用第一目标损失更新初始处理模型,得到对话处理模型,对话处理模型用于对目标客服对话语段进行处理。
[0141]
在一种可能的实现方式中,处理模块702,用于对于多个客服对话语段中的任一个客服对话语段,调用初始处理模型输出基于该任一个客服对话语段包括的任务提示预测得到的任务目标,将任务目标作为该任一个客服对话语段的处理结果。
[0142]
在一种可能的实现方式中,获取模块701,用于获取多个初始客服对话语段,任一个初始客服对话语段具有第一标签,第一标签用于指示该任一个初始客服对话语段的任务目标;根据第一标签,为该任一个初始客服对话语段添加任务提示,任务提示包括任务类型提示或任务目标提示中的至少一种;将添加任务提示后的各个初始客服对话语段作为获取到的多个客服对话语段。
[0143]
在一种可能的实现方式中,获取模块701,用于根据第一标签,查询标签与任务提示的对应关系,得到第一标签对应的任务提示;为该任一个初始客服对话语段添加任务提示。
[0144]
在一种可能的实现方式中,任一个客服对话语段的处理结果包括至少一个字符,更新模块703,用于对于该任一个客服对话语段,获取该任一个客服对话语段的处理结果包括的各个字符的输出概率;基于各个字符的输出概率,获取该任一个客服对话语段对应的生成损失;基于多个客服对话语段对应的生成损失,获取第一目标损失。
[0145]
在一种可能的实现方式中,更新模块703,用于将各个字符的输出概率代入生成损失函数,获取该任一个客服对话语段对应的生成损失;其中,对于对应于不同任务类型的多个客服对话语段,获取多个客服对话语段的生成损失时使用的生成损失函数相同。
[0146]
在一种可能的实现方式中,更新模块703,还用于获取至少一个参考客服对话语段,至少一个参考客服对话语段对应目标任务类型,目标任务类型为分类任务或生成任务;根据至少一个参考客服对话语段的第二标签,为至少一个参考客服对话语段添加任务提示,得到多个目标客服对话语段,第二标签用于指示第二标签对应的参考客服对话语段的任务目标;调用对话处理模型对多个目标客服对话语段进行处理,输出目标任务类型对应的多个目标客服对话语段的处理结果;基于多个目标客服对话语段和多个目标客服对话语段的处理结果,获取第二目标损失,利用第二目标损失更新对话处理模型,得到目标任务类型对应的对话处理模型。
[0147]
在本技术实施例中,通过使用分类任务或生成任务中的至少一种任务类型对应的客服对话语段对初始处理模型进行训练,训练得到的对话处理模型能够适用于处理分类任务或生成任务中的至少一种任务类型对应的客服对话语段,对话处理模型的适用范围较广。再有,用于训练的多个客服对话语段能够包括客服领域的知识,从而使得训练得到的对话处理模型能够学习到客服领域的知识,调用该对话处理模型处理客服领域的语段时,对话处理模型输出的处理结果的准确性较高。
[0148]
参见图8,本技术实施例提供了一种对话处理装置,该装置包括:获取模块801和处
unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1001可以集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1001还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0158]
存储器1002可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1002还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1002中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1001所执行,以使该终端实现上述图2所示的方法实施例提供的对话处理模型的训练方法,或者实现上述图6所示的方法实施例提供的对话处理方法的流程图。
[0159]
在一些实施例中,终端还可选包括有:外围设备接口1003和至少一个外围设备。处理器1001、存储器1002和外围设备接口1003之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1003相连。具体地,外围设备包括:射频电路1004、显示屏1005、摄像头组件1006、音频电路1007、定位组件1008和电源1009中的至少一种。
[0160]
外围设备接口1003可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器1001和存储器1002。在一些实施例中,处理器1001、存储器1002和外围设备接口1003被集成在同一芯片或电路板上;在一些其他实施例中,处理器1001、存储器1002和外围设备接口1003中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
[0161]
射频电路1004用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路1004通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1004将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1004包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1004可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路1004还可以包括nfc(near field communication,近距离无线通信)有关的电路,本技术对此不加以限定。
[0162]
显示屏1005用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1005是触摸显示屏时,显示屏1005还具有采集在显示屏1005的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1001进行处理。此时,显示屏1005还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1005可以为一个,设置在终端的前面板;在另一些实施例中,显示屏1005可以为至少两个,分别设置在终端的不同表面或呈折叠设计;在另一些实施例中,显示屏1005可以是柔性显示屏,设置在终端的弯曲表面上或折叠面上。甚至,显示屏1005还可以设置成非矩形的不规则图形,也即异形屏。显示屏1005可以采用lcd(liquid crystal display,液晶显示屏)、oled(organic light-emitting diode,有机发
光二极管)等材质制备。
[0163]
摄像头组件1006用于采集图像或视频。可选地,摄像头组件1006包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtual reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1006还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
[0164]
音频电路1007可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1001进行处理,或者输入至射频电路1004以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1001或射频电路1004的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1007还可以包括耳机插孔。
[0165]
定位组件1008用于定位终端的当前地理位置,以实现导航或lbs(location based service,基于位置的服务)。定位组件1008可以是基于美国的gps(global positioning system,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
[0166]
电源1009用于为终端中的各个组件进行供电。电源1009可以是交流电、直流电、一次性电池或可充电电池。当电源1009包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
[0167]
在一些实施例中,终端还包括有一个或多个传感器1010。该一个或多个传感器1010包括但不限于:加速度传感器1011、陀螺仪传感器1012、压力传感器1013、指纹传感器1014、光学传感器1015以及接近传感器1016。
[0168]
加速度传感器1011可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1011可以用于检测重力加速度在三个坐标轴上的分量。处理器1001可以根据加速度传感器1011采集的重力加速度信号,控制显示屏1005以横向视图或纵向视图进行用户界面的显示。加速度传感器1011还可以用于游戏或者用户的运动数据的采集。
[0169]
陀螺仪传感器1012可以检测终端的机体方向及转动角度,陀螺仪传感器1012可以与加速度传感器1011协同采集用户对终端的3d动作。处理器1001根据陀螺仪传感器1012采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。
[0170]
压力传感器1013可以设置在终端的侧边框和/或显示屏1005的下层。当压力传感器1013设置在终端的侧边框时,可以检测用户对终端的握持信号,由处理器1001根据压力传感器1013采集的握持信号进行左右手识别或快捷操作。当压力传感器1013设置在显示屏1005的下层时,由处理器1001根据用户对显示屏1005的压力操作,实现对ui界面上的可操
作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
[0171]
指纹传感器1014用于采集用户的指纹,由处理器1001根据指纹传感器1014采集到的指纹识别用户的身份,或者,由指纹传感器1014根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1001授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1014可以被设置在终端的正面、背面或侧面。当终端上设置有物理按键或厂商logo(商标)时,指纹传感器1014可以与物理按键或厂商logo集成在一起。
[0172]
光学传感器1015用于采集环境光强度。在一个实施例中,处理器1001可以根据光学传感器1015采集的环境光强度,控制显示屏1005的显示亮度。具体地,当环境光强度较高时,调高显示屏1005的显示亮度;当环境光强度较低时,调低显示屏1005的显示亮度。在另一个实施例中,处理器1001还可以根据光学传感器1015采集的环境光强度,动态调整摄像头组件1006的拍摄参数。
[0173]
接近传感器1016,也称距离传感器,通常设置在终端的前面板。接近传感器1016用于采集用户与终端的正面之间的距离。在一个实施例中,当接近传感器1016检测到用户与终端的正面之间的距离逐渐变小时,由处理器1001控制显示屏1005从亮屏状态切换为息屏状态;当接近传感器1016检测到用户与终端的正面之间的距离逐渐变大时,由处理器1001控制显示屏1005从息屏状态切换为亮屏状态。
[0174]
本领域技术人员可以理解,图10中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
[0175]
在示例性实施例中,还提供了一种计算机设备,计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序。至少一条计算机程序由一个或者一个以上处理器加载并执行,以使计算机设备实现上述任一种对话处理模型的训练方法,或者实现上述任一种对话处理方法。
[0176]
在示例性实施例中,还提供了一种计算机可读存储介质,计算机可读存储介质中存储有至少一条计算机程序,至少一条计算机程序由计算机设备的处理器加载并执行,以使计算机实现上述任一种对话处理模型的训练方法,或者实现上述任一种对话处理方法。
[0177]
在一种可能实现方式中,上述计算机可读存储介质可以是只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、只读光盘(compact disc read-only memory,cd-rom)、磁带、软盘和光数据存储设备等。
[0178]
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取计算机指令,处理器执行计算机指令,使得计算机设备执行上述任一种对话处理模型的训练方法,或者执行上述任一种对话处理方法。
[0179]
需要说明的是,本技术所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本技术中涉及到的客服对话语段都是在充分授权的情况下获取的。
[0180]
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0181]
以上所述仅为本技术的示例性实施例,并不用以限制本技术,凡在本技术的原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1