一种报表机器人多轮对话策略预测方法及系统与流程

文档序号:29424234发布日期:2022-03-26 14:48阅读:186来源:国知局
一种报表机器人多轮对话策略预测方法及系统与流程

1.本发明涉及人工智能相关技术领域,具体涉及一种报表机器人多轮对话策略预测方法及系统。


背景技术:

2.人机对话系统能够让机器通过人类语言与人进行交互,是人工智能领域的一项重要工作。报表机器人是一款能够代替或者协助人类在计算机、手机等数字化设备中完成重复性工作与任务,通过先进的人工智能技术,实时的将人交流的自然语言转化为结构化的查询语句,并返回用户所需的报表,其中多轮对话策略预测部分是实现该功能的核心调度模块。
3.目前对于多轮对话策略预测部分主要是通过语义识别技术分析输入信息的语义信息,再结合数据库匹配同类语义环境的回复信息,但是同一种语义的输入在不同的语境下用户的需求可能是不同的,当前技术难以稳定的适应复杂语境下的多轮对话策略预测。
4.但本技术发明人在实现本技术实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
5.现有技术中由于大多数机器人仅通过基于历史数据进行语义检索回复内容,无法适应复杂语境,导致存在对话策略预测稳定性弱的技术问题。


技术实现要素:

6.本技术实施例通过提供了一种报表机器人多轮对话策略预测方法及系统,解决了现有技术中由于大多数机器人仅通过基于历史数据进行语义检索回复内容,无法适应复杂语境,导致存在对话策略预测稳定性弱的技术问题。通过采集和报表机器人交互用户的实时输入信息,通过预设的格式将输入信息标准化,得到再将标准化的文本信息向量化处理得到机器人可识别的当前用户输入信息,继而通过k-bert神经网络预训练模型对当前用户输入信息基于多轮对话上下文进行分析预测,得到表征用户请求信息的向量信息,继而通过对得到向量进行运算,评估向量信息的准确性,将满足要求的向量输入数据库进行检索得到对话预测结果进行回复。通过k-bert神经网络预训练模型基于多轮语境得到的向量信息准确度更高,更能适应于复杂的语境情况,达到了提高多轮对话策略预测结果准确性的技术效果。
7.鉴于上述问题,本技术实施例提供了一种报表机器人多轮对话策略预测方法及系统。
8.第一方面,本技术实施例提供了一种报表机器人多轮对话策略预测方法,其中,所述方法包括:获得第一用户的第一输入信息;获得第一格式标准化指令,根据所述第一格式标准化指令将所述第一输入信息进行格式标准化处理,获得第一文本输入数据;通过词袋模型将所述第一文本输入数据进行向量化处理,获得第一处理结果;将所述第一处理结果输入k-bert神经网络预训练模型,通过所述k-bert神经网络预训练模型进行所述第一处理
结果的特征提取和特征转换,输出第一向量和第二向量;获得第一向量运算规则,基于所述第一向量运算规则进行所述第一向量和所述第二向量的向量运算,获得第一运算结果;基于所述第一运算结果和第一检索数据库获得第一对话预测结果。
9.另一方面,本技术实施例提供了一种报表机器人多轮对话策略预测系统,其中,所述系统包括:第一获得单元,所述第一获得单元用于获得第一用户的第一输入信息;第一处理单元,所述第一处理单元用于获得第一格式标准化指令,根据所述第一格式标准化指令将所述第一输入信息进行格式标准化处理,获得第一文本输入数据;第二处理单元,所述第二处理单元用于通过词袋模型将所述第一文本输入数据进行向量化处理,获得第一处理结果;第三处理单元,所述第三处理单元用于将所述第一处理结果输入k-bert神经网络预训练模型,通过所述k-bert神经网络预训练模型进行所述第一处理结果的特征提取和特征转换,输出第一向量和第二向量;第四处理单元,第四处理单元用于获得第一向量运算规则,基于所述第一向量运算规则进行所述第一向量和所述第二向量的向量运算,获得第一运算结果;第二获得单元,所述第二获得单元用于基于所述第一运算结果和第一检索数据库获得第一对话预测结果。
10.第三方面,本技术实施例提供了一种报表机器人多轮对话策略预测系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现第一方面任一项所述方法的步骤。
11.本技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
12.由于采用了获得第一用户的第一输入信息;获得第一格式标准化指令,根据所述第一格式标准化指令将所述第一输入信息进行格式标准化处理,获得第一文本输入数据;通过词袋模型将所述第一文本输入数据进行向量化处理,获得第一处理结果;将所述第一处理结果输入k-bert神经网络预训练模型,通过所述k-bert神经网络预训练模型进行所述第一处理结果的特征提取和特征转换,输出第一向量和第二向量;获得第一向量运算规则,基于所述第一向量运算规则进行所述第一向量和所述第二向量的向量运算,获得第一运算结果;基于所述第一运算结果和第一检索数据库获得第一对话预测结果的技术方案,通过采集和报表机器人交互用户的实时输入信息,通过预设的格式将输入信息标准化,得到再将标准化的文本信息向量化处理得到机器人可识别的当前用户输入信息,继而通过k-bert神经网络预训练模型对当前用户输入信息基于多轮对话上下文进行分析预测,得到表征用户请求信息的向量信息,继而通过对得到向量进行运算,评估向量信息的准确性,将满足要求的向量输入数据库进行检索得到对话预测结果进行回复。通过k-bert神经网络预训练模型基于多轮语境得到的向量信息准确度更高,更能适应于复杂的语境情况,达到了提高多轮对话策略预测结果准确性的技术效果。
13.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
14.图1为本技术实施例提供了一种报表机器人多轮对话策略预测方法流程示意图;
15.图2为本技术实施例提供了一种报表机器人多轮对话输入信息的处理方法流程示
意图;
16.图3为本技术实施例提供了一种报表机器人多轮对话输出向量运算方法流程示意图;
17.图4为本技术实施例提供了一种报表机器人多轮对话策略预测系统结构示意图;
18.图5为本技术实施例示例性电子设备的结构示意图。
19.附图标记说明:第一获得单元11,第一处理单元12,第二处理单元13,第三处理单元14,第四处理单元15,第二获得单元16,电子设备300,存储器301,处理器302,通信接口303,总线架构304。
具体实施方式
20.本技术实施例通过提供了一种报表机器人多轮对话策略预测方法及系统,解决了现有技术中由于大多数机器人仅通过基于历史数据进行语义检索回复内容,无法适应复杂语境,导致存在对话策略预测稳定性弱的技术问题。通过采集和报表机器人交互用户的实时输入信息,通过预设的格式将输入信息标准化,得到再将标准化的文本信息向量化处理得到机器人可识别的当前用户输入信息,继而通过k-bert神经网络预训练模型对当前用户输入信息基于多轮对话上下文进行分析预测,得到表征用户请求信息的向量信息,继而通过对得到向量进行运算,评估向量信息的准确性,将满足要求的向量输入数据库进行检索得到对话预测结果进行回复。通过k-bert神经网络预训练模型基于多轮语境得到的向量信息准确度更高,更能适应于复杂的语境情况,达到了提高多轮对话策略预测结果准确性的技术效果。
21.申请概述
22.人机对话系统能够让机器通过人类语言与人进行交互,是人工智能领域的一项重要工作。报表机器人是一款能够代替或者协助人类在计算机、手机等数字化设备中完成重复性工作与任务,通过先进的人工智能技术,实时的将人交流的自然语言转化为结构化的查询语句,并返回用户所需的报表,其中多轮对话策略预测部分是实现该功能的核心调度模块。目前对于多轮对话策略预测部分主要是通过语义识别技术分析输入信息的语义信息,再结合数据库匹配同类语义环境的回复信息,但是同一种语义的输入在不同的语境下用户的需求可能是不同的,当前技术难以稳定的适应复杂语境下的多轮对话策略预测。但现有技术中由于大多数机器人仅通过基于历史数据进行语义检索回复内容,无法适应复杂语境,导致存在对话策略预测稳定性弱的技术问题。
23.针对上述技术问题,本技术提供的技术方案总体思路如下:
24.本技术实施例提供了一种报表机器人多轮对话策略预测方法,其中,所述方法包括:获得第一用户的第一输入信息;获得第一格式标准化指令,根据所述第一格式标准化指令将所述第一输入信息进行格式标准化处理,获得第一文本输入数据;通过词袋模型将所述第一文本输入数据进行向量化处理,获得第一处理结果;将所述第一处理结果输入k-bert神经网络预训练模型,通过所述k-bert神经网络预训练模型进行所述第一处理结果的特征提取和特征转换,输出第一向量和第二向量;获得第一向量运算规则,基于所述第一向量运算规则进行所述第一向量和所述第二向量的向量运算,获得第一运算结果;基于所述第一运算结果和第一检索数据库获得第一对话预测结果。
25.在介绍了本技术基本原理后,下面将结合说明书附图来具体介绍本技术的各种非限制性的实施方式。
26.实施例一
27.如图1所示,本技术实施例提供了一种报表机器人多轮对话策略预测方法,其中,所述方法包括:
28.s100:获得第一用户的第一输入信息;
29.具体而言,所述第一用户为和报表机器人进行交互的用户,交互的形式包括但不限于:语音输入、文字输入、汉语输入、外语输入等方式;所述第一输入信息为报表机器人采集的第一用户的多轮输入信息。优选的将第一用户和报表机器人交互的一次对话设定为一轮,进一步的,将最开始接收到第一用户发出请求信息并做出回复的信息记为第一轮交互内容,第一轮中第一用户发出的请求信息记为第一用户的第一轮输入信息,报表机器人做出的回复记为第一轮回复信息,更进一步的,将第一用户基于第一轮回复信息进行的反馈请求信息记为第一用户的第二轮输入信息,报表机器人做出第二次回复记为第二轮回复信息,直到第一用户获得需求的报表信息时,多轮交互信息的采集停止,存储为一组人机交互的历史数据。其中,第一输入信息为实时交互时第一用户输入到报表机器人的输入信息,通过采集第一用户的第一输入信息可以实时的分析甄别第一用户的意图,为进一步匹配到较准确的对话策略预测结果提供信息基础。
30.s200:获得第一格式标准化指令,根据所述第一格式标准化指令将所述第一输入信息进行格式标准化处理,获得第一文本输入数据;
31.具体而言,所述第一格式标准化指令为在采集到第一输入信息之后,为了便于报表机器人对于输入信息的识别及处理,而发出的信息处理指令;所述第一文本输入数据为在接收到第一格式标准化指令后,对第一输入信息按照预设的格式进行标准化处理之后得到的结果。预设的格式标准化示例性的为:{"属性1":"信息1","属性2":"信息2",...."属性n":[{"属性n1":"信息n1",..."属性nk":"信息nk"},"属性n+1":"信息n+1"],"属性n+2":"信息n+2"},其中第一输入信息的标点符号、大小写、数字的处理都需要统一化处理,使得得到报表机器人可以基于统一的标准化格式对输入信息进行处理。其中,属性1到属性n+2为预设的为了表征第一用户第一输入信息的准确意图进而从不同维度的提取的不同属性信息,包括但不限于当前用户输入文本、关键词信息、意图信息、第一用户的历史信息、上一轮交互信息等多个维度。通过将第一输入信息标准化处理之后,一者便于报表机器人快速识别处理,二者可以和多个维度的属性信息联立分析,从而保证预测结果的准确性。
[0032]
s300:通过词袋模型将所述第一文本输入数据进行向量化处理,获得第一处理结果;
[0033]
具体而言,词袋模型指的是信息检索领域常用的文档表示方法。在信息检索中,假定对于一个文档,忽略它的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合,文档中每个单词的出现都是独立的,不依赖于其它单词是否出现。也就是说,文档中任意一个位置出现的任何单词,都不受该文档语意影响而独立选择的。示例性的如:某输入信息为:张三查一下广州的发卡数和李四查一下深圳的发卡数两句话,这两句话共有1:查一下,2:广州,3:深圳,4:的,5:发卡数,6:张三,7:李四,共七种词汇,不同数字标识不同词汇位置,则可以构建两组向量表示两句话分别为[6,1,2,4,5]、[7,1,3,4,5];所述第一处理结
果为通过词袋模型对所述第一文本输入数据进行向量化处理之后得到的结果,进一步,将向量化处理之后的信息作为模型训练的输入数据可以高效处理,得到不同向量的特征信息,进而判断提高对第一输入信息的预测准确度。
[0034]
s400:将所述第一处理结果输入k-bert神经网络预训练模型,通过所述k-bert神经网络预训练模型进行所述第一处理结果的特征提取和特征转换,输出第一向量和第二向量;
[0035]
具体而言,所述k-bert神经网络预训练模型为预训练语言模型,构建过程为通过下载从大规模语料中学习到通用的语言表示的bert神经网络预训练模型,并提取模型参数,再将结合了知识图谱中与句子中的实体相关的三元组信息的所述第一处理结果作为训练数据,训练模型,收敛得到所述k-bert神经网络预训练模型可以对所述第一处理结果进行特征提取,进而得到实际语境化的词嵌入结果,词嵌入的结果有多个,从而得到不同语境下对于第一输入信息的不同回复预测结果,将特征提取结果保存为所述第一向量,将所述第一向量对应的意图预测结果保存为所述第二向量。通过所述k-bert神经网络预训练模型提取的所述第一向量和所述第二向量可以对相应语境下的所述第一向量和所述第二向量之间的匹配程度进行运算,将匹配程度最高的即可以作为预测的结果,由于分析了相同语义时不同语境下不同的预测结果,进而提高了系统在复杂语境下的稳定性。
[0036]
s500:获得第一向量运算规则,基于所述第一向量运算规则进行所述第一向量和所述第二向量的向量运算,获得第一运算结果;
[0037]
进一步的,基于所述获得第一向量运算规则,基于所述第一向量运算规则进行所述第一向量和所述第二向量的向量运算,获得第一运算结果,步骤s500还包括:
[0038]
s510:将所述第一向量和所述第二向量映射至同一向量语义空间,获得第一映射结果;
[0039]
s520:通过所述第一映射结果进行所述第一向量和所述第二向量点乘运算,获得所述第一运算结果。
[0040]
具体而言,所述第一向量运算规则指的是为了计算所述第一向量和所述第二向量之间的匹配度进而预设的运算规则,运算规则举不设限制的一例:
[0041]
将第一向量记为a,将第二向量记为b,将a和b映射至同一向量语义空间e,所述第一向量记为a=e(a),所述第二向量记为b=e(b),即为所述第一映射结果;进一步的,使用向量点乘s
+
=a
ta+
表示和b
+
的最大化相似度,其中,a
+
和b
+
分别表示相互对应的正样本向量;使用s-=a
t
a-表示和b-的最小化相似度,其中,a-和b-分别表示相互对应的负样本向量;更进一步的使用l=-{s
+-log(e
s+

ω-e
s-)}a和b之间的损失函数,其中,e为自然对数的底,ω为蔡廷常数。当l值越小,则损失函数越小,则表示a和b之间的匹配程度越高,当l值越大,则损失函数越大,则表示a和b之间的匹配程度越小,将得到的结果l值从小到大进行排序,将预测问题转化为检索排序问题,降低了预测处理的复杂度。
[0042]
s600:基于所述第一运算结果和第一检索数据库获得第一对话预测结果。
[0043]
具体而言,将报表机器人的历史对话信息进行存储得到所述第一检索数据库,其中用户意图和回复内容一一对应存储;基于所述第一运算结果中的排序结果,将排序最靠前的对应用户的意图预测结果输入所述第一检索数据库就可以匹配到对应的回复内容,由此得到的预测结果更加适用于当前第一用户的输入语境,提高了预测结果稳定性与可靠
性。
[0044]
进一步的,如图2所示,基于所述获得第一用户的第一输入信息,步骤s100还包括:
[0045]
s110:获得所述第一用户的第一输入文本,将所述第一输入文本作为第一维度数据;
[0046]
s120:获得slot词槽信息,将所述slot词槽信息作为第二维度数据;
[0047]
s130:基于所述第一维度数据和所述第二维度数据获得所述第一输入信息。
[0048]
具体而言,所述第一用户的第一输入文本即为第一用户当前输入的实时信息;所述slot词槽信息为结合知识图谱提取到的和所述第一输入文本相关联的上下文信息,每一组所述slot词槽信息都可以和第一输入文本组成相互对应的人机交互内容,不同语义环境下对应于不不同组的所述slot词槽信息;进一步的,将所述第一输入文本作为所述第一维度数据,将所述slot词槽信息作为所述第二维度数据,组合成为所述第一输入信息。通过结合第一维度数据和第二维度数据可以分析同一语义在不同语境下的不同情况,提高了输入信息的全面性,进而为预测结果的准确性奠定信息基础。
[0049]
进一步的,所述方法还包括步骤s700,步骤s700还包括:
[0050]
s710:获得所述第一用户的历史对话信息,将所述历史对话信息作为第三维度数据;
[0051]
s720:对所述历史对话信息进行所述第一用户的意图解析,获得第一意图解析结果,将所述第一意图解析结果作为第四维度数据;
[0052]
s730:基于所述第一维度数据、所述第二维度数据、所述第三维度数据和所述第四维度数据获得所述第一输入信息。
[0053]
具体而言,所述历史对话信息为第一用户和报表机器人交互的历史存储数据,即为多组的多轮交互数据,历史数据的采集来源并不限于当前使用的报表机器人,而是应用报表机器人的企业或者用户范围内的全部报表机器人内存储的和第一用户相关的历史交互信息;所述第一意图解析结果为对所述历史对话信息进行分析,得到表征第一用户意图信息的数据,分析原理为:通过第一用户满意的回复内容匹配对应的输入信息,从中提取和回复内容关联度较高的关键词,将关键词和回复内容对应存储,得到意图解析结果;进一步的,将所述历史对话信息作为所述第三维度数据,将所述第一意图解析结果作为所述第四维度数据;更进一步的,将所述第一维度数据、所述第二维度数据、所述第三维度数据和所述第四维度数据设为所述第一输入信息,格式标准化时,所述第一维度数据、所述第二维度数据、所述第三维度数据和所述第四维度数据分别对应于四个不同的属性,而第一输入文本、slot词槽信息、历史对话信息、第一意图解析结果分别作为四个属性的信息。通过从多个维度对所述第一输入信息进行表征,保证了第一输入信息的全面和完整性,进而达到了保障预测结果准确性的技术效果。
[0054]
进一步的,所述方法步骤s400还包括:
[0055]
s410:获得bert预训参数集合;
[0056]
s420:构建k-bert神经网络预训练模型,通过所述k-bert神经网络预训练模型进行所述bert预训参数集合参数加载,通过进行所述bert预训参数集合参数加载后的所述k-bert神经网络预训练模型进行所述第一处理结果的特征提取和特征转换。
[0057]
具体而言,所述bert预训参数集合即为通过大规模语料中学习构建的进行通用语
言表示的bert神经网络预训练模型的模型参数,可以从开源的信息网站下载也可以自行进行训练;所述k-bert神经网络预训练模型为结合知识图谱处理第一输入信息再基于bert神经网络预训练模型的基础上训练得到模型,其中,处理结果即为所述第二维度的信息,将多组多个维度组成的第一输入信息作为训练数据训练所述k-bert神经网络预训练模型,当所述k-bert神经网络预训练模型收敛时,停止训练,再将第一输入信息输入所述k-bert神经网络预训练模型,就可以得到第一输入文本在不同语境下的不同意图解析结果,依据不同的意图解析结果就可以匹配对应的回复报表,进而提高对于不同语境下相同输入文本的识别能力,达到了提高预测稳定性的技术效果。
[0058]
进一步的,如图3所示,基于所述通过所述第一映射结果进行所述第一向量和所述第二向量点乘运算,获得所述第一运算结果,步骤s520还包括:
[0059]
s521:通过所述第一映射结果进行所述第一向量和所述第二向量点乘运算,获得第一正样本相似度的最大值数据和第一负样本相似度的最小值数据;
[0060]
s522:通过所述最大值数据和所述最小值数据进行损失函数构建,获得第一构建结果;
[0061]
s523:通过所述第一构建结果获得所述第一运算结果。
[0062]
具体而言,运算规则的构建如下:将第一向量记为a,将第二向量记为b,将a和b映射至同一向量语义空间e,所述第一向量记为a=e(a),所述第二向量记为b=e(b),即为所述第一映射结果;进一步的,使用向量点乘s
+
=a
ta+
表示和b
+
的最大化相似度,即为所述第一正样本相似度的最大值数据,其中,a
+
和b
+
分别表示相互对应的正样本向量;使用s-=a
t
a-表示和b-的最小化相似度,即为所述第一负样本相似度的最小值数据,其中,a-和b-分别表示相互对应的负样本向量;更进一步的使用l=-{s
+-log(e
s+

ω-e
s-)}a和b之间的损失函数,即为所述第一构建结果,其中,e为自然对数的底,ω为蔡廷常数。更进一步,使用如上运算规则对所述第一向量和所述第二向量进行处理得到所述第一运算结果。
[0063]
进一步的,所述方法步骤s600还包括:
[0064]
s610:通过历史对话数据库构建所述第一检索数据库;
[0065]
s620:通过所述第一运算结果进行所述第一检索数据库的顺序排序,获得第一顺序检索数据库;
[0066]
s630:通过所述第一顺序检索数据库获得所述第一对话预测结果。
[0067]
具体而言,所述历史对话数据库为通过采集相互通信连接的多个同类型服务报表机器人交互历史信息,并进行意图分析之后将用户意图分析结果和回复内容相互绑定得到多组用户意图-报表回复信息的数据库;将所述历史对话数据库作为所述第一检索数据库,将所述第一运算结果中的排序结果输入所述第一检索数据库,就可以得到不同排序结果下的回复内容,排序靠前的回复内容和所述第一用户的语境匹配程度较高,进而得到不同语境下对相同输入文本的回复内容排序结果,优先的将排序靠前的回复内容作为所述第一对话预测结果。通过知识图谱为输入信息匹配多个不同语境,再基于运算规则将语境和用户意图的匹配度进行分析,进一步基于分析结果,将预测问题转换为排序问题,降低了预测的复杂度且适应于复杂语境下的对话预测,提高了系统的鲁棒性。
[0068]
综上所述,本技术实施例所提供的一种报表机器人多轮对话策略预测方法及系统具有如下技术效果:
[0069]
1.本技术实施例通过提供了一种报表机器人多轮对话策略预测方法及系统,解决了现有技术中由于大多数机器人仅通过基于历史数据进行语义检索回复内容,无法适应复杂语境,导致存在对话策略预测稳定性弱的技术问题。通过采集和报表机器人交互用户的实时输入信息,通过预设的格式将输入信息标准化,得到再将标准化的文本信息向量化处理得到机器人可识别的当前用户输入信息,继而通过k-bert神经网络预训练模型对当前用户输入信息基于多轮对话上下文进行分析预测,得到表征用户请求信息的向量信息,继而通过对得到向量进行运算,评估向量信息的准确性,将满足要求的向量输入数据库进行检索得到对话预测结果进行回复。通过k-bert神经网络预训练模型基于多轮语境得到的向量信息准确度更高,更能适应于复杂的语境情况,达到了提高多轮对话策略预测结果准确性的技术效果。
[0070]
2.通过知识图谱为输入信息匹配多个不同语境,再基于运算规则将语境和用户意图的匹配度进行分析,进一步基于分析结果,将预测问题转换为排序问题,降低了预测的复杂度且适应于复杂语境下的对话预测,提高了系统的鲁棒性。
[0071]
实施例二
[0072]
基于与前述实施例中一种报表机器人多轮对话策略预测方法相同的发明构思,如图4所示,本技术实施例提供了一种报表机器人多轮对话策略预测系统,其中,所述系统包括:
[0073]
第一获得单元11,所述第一获得单元11用于获得第一用户的第一输入信息;
[0074]
第一处理单元12,所述第一处理单元12用于获得第一格式标准化指令,根据所述第一格式标准化指令将所述第一输入信息进行格式标准化处理,获得第一文本输入数据;
[0075]
第二处理单元13,所述第二处理单元13用于通过词袋模型将所述第一文本输入数据进行向量化处理,获得第一处理结果;
[0076]
第三处理单元14,所述第三处理单元14用于将所述第一处理结果输入k-bert神经网络预训练模型,通过所述k-bert神经网络预训练模型进行所述第一处理结果的特征提取和特征转换,输出第一向量和第二向量;
[0077]
第四处理单元15,第四处理单元15用于获得第一向量运算规则,基于所述第一向量运算规则进行所述第一向量和所述第二向量的向量运算,获得第一运算结果;
[0078]
第二获得单元16,所述第二获得单元16用于基于所述第一运算结果和第一检索数据库获得第一对话预测结果。
[0079]
进一步的,所述系统还包括:
[0080]
第三获得单元,所述第三获得单元用于获得所述第一用户的第一输入文本,将所述第一输入文本作为第一维度数据;
[0081]
第四获得单元,所述第四获得单元用于获得slot词槽信息,将所述slot词槽信息作为第二维度数据;
[0082]
第五获得单元,所述第五获得单元用于基于所述第一维度数据和所述第二维度数据获得所述第一输入信息。
[0083]
进一步的,所述系统还包括:
[0084]
第六获得单元,所述第六获得单元用于获得所述第一用户的历史对话信息,将所述历史对话信息作为第三维度数据;
interconnect,简称pci)总线或扩展工业标准结构(extended industry standardarchitecture,简称eisa)总线等。所述总线架构304可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0105]
处理器302可以是一个cpu,微处理器,asic,或一个或多个用于控制本技术方案程序执行的集成电路。
[0106]
通信接口303,使用任何收发器一类的系统,用于与其他设备或通信网络通信,如以太网,无线接入网(radio access network,ran),无线局域网(wireless local areanetworks,wlan),有线接入网等。
[0107]
存储器301可以是rom或可存储静态信息和指令的其他类型的静态存储设备,ram或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasableprogrammable read-only memory,eeprom)、只读光盘(compact discread-only memory,cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线架构304与处理器相连接。存储器也可以和处理器集成在一起。
[0108]
其中,存储器301用于存储执行本技术方案的计算机执行指令,并由处理器302来控制执行。处理器302用于执行存储器301中存储的计算机执行指令,从而实现本技术上述实施例提供的一种报表机器人多轮对话策略预测方法。
[0109]
可选的,本技术实施例中的计算机执行指令也可以称之为应用程序代码,本技术实施例对此不作具体限定。
[0110]
本技术实施例通过提供了一种报表机器人多轮对话策略预测方法及系统,解决了现有技术中由于大多数机器人仅通过基于历史数据进行语义检索回复内容,无法适应复杂语境,导致存在对话策略预测稳定性弱的技术问题。通过采集和报表机器人交互用户的实时输入信息,通过预设的格式将输入信息标准化,得到再将标准化的文本信息向量化处理得到机器人可识别的当前用户输入信息,继而通过k-bert神经网络预训练模型对当前用户输入信息基于多轮对话上下文进行分析预测,得到表征用户请求信息的向量信息,继而通过对得到向量进行运算,评估向量信息的准确性,将满足要求的向量输入数据库进行检索得到对话预测结果进行回复。通过k-bert神经网络预训练模型基于多轮语境得到的向量信息准确度更高,更能适应于复杂的语境情况,达到了提高多轮对话策略预测结果准确性的技术效果。
[0111]
本领域普通技术人员可以理解:本技术中涉及的第一、第二等各种数字编号仅为描述方便进行的区分,并不用来限制本技术实施例的范围,也不表示先后顺序。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“至少一个”是指一个或者多个。至少两个是指两个或者多个。“至少一个”、“任意一个”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个、种),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单
个,也可以是多个。
[0112]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程系统。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
[0113]
本技术实施例中所描述的各种说明性的逻辑单元和电路可以通过通用处理器,数字信号处理器,专用集成电路(asic),现场可编程门阵列(fpga)或其它可编程逻辑系统,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算系统的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
[0114]
本技术实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件单元、或者这两者的结合。软件单元可以存储于ram存储器、闪存、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动磁盘、cd-rom或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于asic中,asic可以设置于终端中。可选地,处理器和存储媒介也可以设置于终端中的不同的部件中。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0115]
尽管结合具体特征及其实施例对本技术进行了描述,显而易见的,在不脱离本技术的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本技术的示例性说明,且视为已覆盖本技术范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术意图包括这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1