一种对话生成方法、装置及计算机设备与流程

文档序号:21363246发布日期:2020-07-04 04:37阅读:125来源:国知局
本申请属于数据处理
技术领域
:,尤其涉及一种对话生成方法、装置及计算机设备。
背景技术
::随着大数据产业的发展,越来越多的企业需要收集用户会话信息,将这些用户会话信息应用于各种下游业务中,例如客服机器人等业务。但是,由于政策的严格管控,不允许各个企业随意交易用户会话信息,导致有的企业采集用户会话信息的渠道少,无法获取到大量的用户会话信息以支撑各种下游业务中,例如,如果只有少量的用户会话信息作为训练样本,会导致客服机器人的回答准确性低。因此,如何合理地得到更多的用户会话信息成为了本领域技术人员亟需解决的技术问题。技术实现要素:有鉴于此,本申请实施例提供了一种对话生成方法、装置及计算机设备,以解决现有技术中难以合理得到用户会话信息的问题。本申请实施例的第一方面提供了一种对话生成方法,包括:s1、获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;s2、将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间;s3、判断所述预设存储空间中记录的答复语句是否符合预设中止条件,若是,则执行步骤s5,若否,则执行步骤s4;s4、根据所述答复语句计算奖励值,根据所述奖励值以及强化学习的损失函数计算所述对话生成模型的损失值,根据所述损失值对所述对话生成模型进行更新,并将所述答复语句作为新的输入语句,返回步骤s2;s5、将所述预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档。本申请实施例的第二方面提供了一种对话生成装置,包括:初始获取模块,用于获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;语句生成模块,用于将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间;条件判断模块,用于判断所述预设存储空间中记录的答复语句是否符合预设中止条件,若是,则触发语句输出模块,若否,则触发更新返回模块;更新返回模块,用于根据所述答复语句计算奖励值,根据所述奖励值以及强化学习的损失函数计算所述对话生成模型的损失值,根据所述损失值对所述对话生成模型进行更新,并将所述答复语句作为新的输入语句输入更新后的对话生成模型,触发语句生成模块;语句输出模块,用于将所述预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档。本申请实施例的第三方面提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法的步骤。本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在计算机设备上运行时,使得计算机设备实现如上述方法的步骤。本申请实施例与现有技术相比存在的有益效果是:本申请的对话生成方法中,将输入语句输入对话生成模型得到答复语句,并模拟人类对话的过程,将得到的答复语句作为新的输入语句重新输入至对话生成模型中,执行下一次对话生成操作,重复生成对话直至已生成的答复语句满足预设中止条件,从而模拟人类对话的过程得到用户会话信息。并且,为了避免对话陷入无意义的死循环,还在将新的输入语句重新输入对话生成模型之前,计算答复语句的奖励值,根据奖励值以及强化学习的损失函数计算对话生成模型的损失值,根据损失值对对话生成模型进行更新,然后再将新的输入语句输入更新后的对话生成模型,以强化学习的方式确保每一次生成的对话都具有较高的质量,可以广泛应用于各类需要使用用户会话信息的下游业务中,解决了现有技术中难以合理得到用户会话信息的问题。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的对话生成方法的流程示意图;图2是本申请实施例提供的对话生成装置的结构示意图;图3是本申请实施例提供的计算机设备的结构示意图;图4是本申请实施例提供的语义分析器的原理示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。实施例一:下面对本申请实施例一提供的一种对话生成方法进行描述,请参阅附图1,本申请实施例一中的对话生成方法包括:步骤s101、获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;当需要进行用户会话模拟时,可以先获取对话生成模型和输入语句。对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型,对话生成模型可以使用已有的用户会话信息进行预训练。输入语句可以从存储有用户会话信息的数据库中随机选取。对话生成模型的结构可以根据实际情况进行设计。在一些可能的实现方式中,可以选用seq2seq模型作为对话生成模型。seq2seq模型中的解码器和编码器的网络结构可以选用transformer模型,使用transformer模型构建seq2seq模型可以提高对话生成模型的并行处理能力。步骤s102、将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间;将输入语句输入对话生成模型后,对话生成模型可以模拟人类对话的形式,反馈答复语句,将答复语句记录在预先设置的存储空间中。。步骤s103、判断所述预设存储空间中记录的答复语句是否符合预设中止条件,若是,则执行步骤s105,若否,则执行步骤s104;得到答复语句后,判断当前预设存储空间中记录的答复语句是否符合预设中止条件。预设中止条件可以根据实际需求进行设置。在一些可能的实现方式中,可以将预设中止条件设置为生成预设数量的答复语句。在另一些可能的实现方式中,预设中止条件可以设置为程序运行时间大于预设时长。如果预设存储空间中记录的答复语句符合预设中止条件,则执行步骤s105;如果预设存储空间中记录的答复语句不符合预设中止条件,则执行步骤s104。步骤s104、根据所述答复语句计算奖励值,根据所述奖励值以及强化学习的损失函数计算所述对话生成模型的损失值,根据所述损失值对所述对话生成模型进行更新,并将所述答复语句作为新的输入语句,返回步骤s102;如果当前尚未符合预设中止条件,则可以将上述答复语句作为新的输入语句输入对话生成模型中,继续执行下一轮对话生成操作。同时,由于现实对话中,有许多语句大量出现,但是可能并非是很好的回答。例如,“我不知道”这句话在现实的对话中大量出现,所以对话生成模型有较高的概率倾向于回复“我不知道”,这种答复语句不利于会话的进展。并且,对话生成模型生成对话时,容易陷入毫无意义的死循环。例如,接收到输入语句后输出“再见”,将“再见”作为输入语句重新输入对话生成模型中,对话生成模型会再次输出“再见”,从而导致会话陷入死循环。为了解决对话生成模型倾向于生成质量不高的答复语句且容易陷入死循环的问题,本实施例的对话生成方法中,引入了强化学习的优化方式。每一次生成答复语句时,会根据预设的奖励值计算方式计算答复语句的奖励值。奖励值表示答复语句的质量,奖励值越高,答复语句的质量越好,奖励值越低,答复语句的质量越低。计算得到奖励值后,根据奖励值以及预设的强化学习的损失函数计算对话生成模型的损失值,根据损失值更新对话生成模型,使得对话生成模型生成答复语句时更倾向于生成符合逻辑且信息丰富的对话,提高答复语句的质量。奖励值的内容和计算方式可以根据实际情况进行设置。在一些可能的实现方式中,奖励值可以包括易答性、信息流动性、语义相关性和情绪系数中的一种或多种。易答性表示生成的答复语句是否容易答复。易答性的计算方式为:其中,r1表示当前答复语句的易答性,a表示当前生成的答复语句,s表示所有可能的用于答复a的语句的集合,s表示集合s中的某一句语句,ns表示集合s中所有语句的词的数量,ns表示语句s的词的数量,p(s|a)表示在以a为输入语句的条件下生成答复语句s的概率。信息流动性表示生成的答复语句是否为会话贡献了新的信息,从而让会话可以进行下去避免陷入死循环。信息流动性的计算方式为:r2=-logcos(hpi,hpi+1)其中,本实施例的对话生成模型可以视为构建两个虚拟角色p和q,两个虚拟角色一人一句地进行对话,因此,可以以两句对话视为一轮对话。r2表示信息流动性,hpi+1表示当前生成的答复语句对应的词向量,hpi表示上一轮对话中相同虚拟角色的答复语句对应的词向量。语义相关性表示生成的答复语句与前文的相关性。语义相关性的计算方式为:其中,r3表示答复语句a的语义相关性,na表示答复语句a的词的数量,qi表示答复语句a对应的输入语句,pi表示答复语句qi对应的输入语句,nqi表示答复语句qi的词的数量,p(a|qi,pi)表示在前一轮生成的语句为qi和pi的条件下,生成语句a的概率,p(qi|a)表示在以语句a为输入语句的条件下,生成的答复语句为qi的概率。情绪系数表示生成的答复语句对应的情绪的系数。在一些实施例中,可以通过bert模型识别答复语句的情绪类别,根据情绪类别得到对应的情绪系数。当奖励值包括易答性、信息流动性、语义相关性和情绪系数中的多种奖励参数时,可以为每种奖励参数设置对应的权重值,计算得到奖励参数的具体数值后,根据各种奖励参数对应的权重值进行加权求和,得到最终的奖励值。计算得到奖励值之后,可以根据奖励值更新对话生成模型。在一些可能的实现方式中,使用奖励值更新对话生成模型的过程如下:1、设置衰减系数γ,γ的值可以根据实际情况进行设置,例如设置为0.9。2、将q矩阵初始化为0,即q1=0。3、在第k次生成答复语句时,计算答复语句的奖励值r。4、计算损失值,损失值的计算方式为:l=f((r+γmaxq'k-qk)2)其中,l表示损失值,f()表示损失函数,maxqk’表示第k次生成答复语句时所有可能生成的答复语句的奖励值的最大值,qk表示第k-1次生成答复语句后更新的q矩阵,k为大于或等于1的正整数。5、根据损失值更新对话生成模型,并更新q矩阵,q矩阵的更新方式为:qk+1=qk+α(r+γmaxq'k-qk)其中,α为预设学习率。更新了对话生成模型后,即可将当前生成的答复语句作为新的输入语句,返回步骤s102,将新的输入语句输入更新后的对话生成模型,执行下一次对话生成操作。步骤s105、将所述预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档。如果符合预设中止条件,则可以输出预设存储空间中记录的所有答复语句,将预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档,完成用户会话信息的生成工作。生成的会话文档可以应用于各种下游业务。在一些可能的实现方式中,所述将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间具体包括:a1、将所述输入语句输入预设的二分类器,根据所述二分类器的分类结果判断所述输入语句是否需要进行sql查询,若是,则执行步骤a2,若否,则执行步骤a4;预设的二分类器用于识别输入语句是否需要进行sql查询。二分类器可以输出两种分类结果,将其中一种分类结果的含义定义为输入语句需要进行sql查询,则另一种分类结果的含义为输出语句不需要进行sql查询。在训练二分类器的过程中,获取样本语句,对样本语句进行标注,标注样本语句对应的分类结果,然后将标注过的样本语句输入二分类器中进行训练,训练完成后,可以使用该分类器识别输入语句是否需要进行sql查询。例如,假设第一分类结果的含义为输入语句需要进行sql查询,第二分类结果的含义为输入语句不需要进行sql查询。将输入语句输入预设的二分类器后,二分类器输出分类结果,根据分类结果判断输入语句需要进行sql查询。若分类结果为第一分类结果,则输入语句需要进行sql查询,执行步骤a2;若分类结果为第二分类结果,则输入语句不需要进行sql查询,执行步骤a4。a2、将所述输入语句输入语义分析器中,得到与所述输入语句对应的sql查询语句;在生成用户会话信息的过程中,部分对话需要查询数据库才能得到较好的答复。例如,假设输入语句为“howmanycflteamsarefromyorkcolleg?”,此时询问有多少cfl队伍来自york大学,如果不查询数据库,直接进行答复,则对话生成模型可能回复“不知道”等信息量较少的回复语句;或者回答错误的答案,比如,有13支cfl队伍来自york大学,对话生成模型可能随机答复“有29支cfl队伍来自york大学”,与实际的答案不符。因此,为了提高对话生成模型生成的答复语句的质量,可以在将输入语句输入对话生成模型之前,检测输入对话是否需要进行数据库查询。如果输入语句需要数据库查询,则可以将通过语义分析器将输入语句转化为sql查询语句。a3、根据所述sql查询语句对预设的数据库进行查询,若查询到与所述sql查询语句对应的查询结果,则将所述输入语句和所述查询结果输入所述对话生成模型中,得到答复语句并记录在预设存储空间;将输入语句转化为sql查询语句后,即可使用sql查询语句对预设的数据库进行查询,如果能够查询到与sql语句对应的查询结果,则将输入语句和数据库查询得到的结果输入对话生成模型中,使得生成的答复语句更真实更准确,提高答复语句的质量。其中,预设的数据库根据实际情况进行设定,用户可以选择将一个或多个数据库设定为预设的数据库,在预设的数据库中进行sql查询。如果数据库中查询不到与sql语句,则直接将输入语句输入对话生成模型中,生成答复语句并记录在预设存储空间。a4、将所述输入语句输入所述对话生成模型中,得到答复语句并记录在预设存储空间。如果检测到输入语句不需要进行sql查询,则可以直接将输入语句输入对话生成模型中,得到答复语句,并将答复语句记录在预设存储空间中。在一些可能的实现方式中,所述将所述输入语句输入语义分析器中,得到与所述输入语句对应的sql查询语句具体包括:b1、将所述输入语句输入语义分析器的编码器,得到输入向量,其中,所述语义分析器包括所述编码器、解码器和通道选择器;语义分析器可以包括编码器、解码器和通道选择器。编码器用于接收输入语句,将输入语句转换成词向量模式,得到输入向量。当输入语句需要进行sql查询时,将输入语句输入语义分析器的编码器,编码器输出输入向量。b2、将所述输入向量输入所述解码器;得到输入向量之后,将输入向量输入解码器中。b3、在每一个查询步长中,获取所述通道选择器生成的通道信息,在所述解码器中选择与所述通道信息对应的查询通道对所述输入向量进行处理,得到所述查询步长对应的sql查询词,其中,所述解码器包括列名查询通道、关键字查询通道和值查询通道,所述通道选择器用于在每一个查询步长中生成相应的通道信息;解码器可以包括列名查询通道、关键字查询通道和值查询通道。在每一个查询步长中,可以使用解码器的其中一个查询通道进行sql查询词的预测。通道选择器为一个门单元,在每个输出步长中,编码器输出的输入向量经过线性变化后输入门单元的softmax函数,得到通道选择概率,根据通道选择概率输出通道信息,通道信息用于选择解码器中一个通道进行sql查询词的预测。因此,在每一个查询步长中,通道选择器生成通道信息,获取到通道信息后,在解码器中选择与上述通道信息对应的查询通道,使用该查询通道对输入向量进行处理,将输入向量与该查询通道对应的候选元素进行相似度计算,并将计算得到相似度归一化后得到各个候选元素的选择概率,将概率最高的候选元素输出为sql查询词。b4、将各个查询步长对应的sql查询词按照生成顺序进行排列,得到与所述输入语句对应的sql查询语句。对输入向量处理完成后,将各个查询步长对应的sql查询词按照生成顺序进行排列,得到与输入语句对应的sql查询语句。以图4为例,图4中的encoder为语义分析器的编码器,decoder为语义分析器的解码器,table为数据库存储的表单。语义分析器会读取数据库中的表单和sql关键字,数据库中的表单和sql词语由语义分析器的编码器编码成向量形式,作为解码器中列名查询通道、关键字查询通道和值查询通道的候选元素。question表示输入语句,输入语句为“howmanycflteamsarefromyorkcolleg?”,编码器将输入语句编码成词向量模式后,输入解码器中。通道选择器每一个查询步长会选择一个通道进行sql语句的预测,通道选择器中的column表示列名,value表示值,sql表示表示关键字。比如,时间t=0时,通道选择器选择了关键字通道,则解码器将编码器输出的向量与关键字通道中的候选元素进行相似度计算,并将计算得到相似度归一化后得到各个关键字候选元素的选择概率。关键字包括“select”、“where”、“count”、“min”、“max”、“and”、“>”、“<”、“=”,经过计算,“select”的选择概率最高,则输出“select”。当t=2时,已经预测了“select”和“count”这两个sql的词汇,则通道选择器进行下一次的通道选择。此时,通道选择器选择了列名通道,则解码器将编码器输出的向量与列名通道中的候选元素进行相似度计算,并将计算得到相似度归一化后得到各个列名候选元素的选择概率。列名包括“pick#”、“cflteam”、“player”、“position”、“college”,经过计算,“cflteam”的输出概率最高,则输出“cflteam”。当t=6时,已经预测了关键字“=”,则通道选择器进行下一次的通道选择。此时,通道选择器选择了值通道,则解码器将编码器输出的向量与值通道中的候选元素进行相似度计算,并将计算得到相似度归一化后得到各个值候选元素的选择概率。值包括“wilfridlaurier”、“york”、“york”,经过计算,“york”的输出概率,则输出“york”。经过多个输出步长的预测之后,得到sql查询语句为“selectcountcflteamwherecollege=york”。在本实施例中采用包含三个通道的语义分析器,与其他逐字查询的语义分析器相比,可以输出准确的sql查询语句,避免由于问题词汇和表内容之间的不匹配,导致生成的sql查询语句不正确或不可执行的问题。本实施例一提供的对话生成方法中,本申请的对话生成方法中,将输入语句输入对话生成模型得到答复语句,并模拟人类对话的过程,将得到的答复语句作为新的输入语句重新输入至对话生成模型中,执行下一次对话生成操作,重复生成对话直至满足预设中止条件,从而模拟人类对话的过程得到用户会话信息。并且,为了避免对话陷入无意义的死循环,还在将新的输入语句重新输入对话生成模型之前,计算答复语句的奖励值,根据奖励值以及强化学习的损失函数计算对话生成模型的损失值,根据损失值对对话生成模型进行更新,然后再将新的输入语句输入更新后的对话生成模型,以强化学习的方式确保每一次生成的对话都具有较高的质量,可以广泛应用于各类需要使用用户会话信息的下游业务中,解决了现有技术中难以合理得到用户会话信息的问题。同时,为了提高对话生成模型生成的答复语句的质量,还可以在检测输入语句是否需要进行sql查询,如果需要进行sql查询,则通过语义分析器将输入语句转化为sql查询语句,通过sql查询语句进行数据库查询,将查询结果和输入语句输入对话生成模型中,避免对话生成模型输出的答复语句答非所问,提高答复语句的质量。语义分析器可以选用设置了列名查询通道、关键字查询通道和值查询通道的语义分析器,其他逐字查询的语义分析器相比,多通道的语义分析器可以输出准确的sql查询语句,避免由于问题词汇和表内容之间的不匹配,导致生成的sql查询语句不正确或不可执行的问题。应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。实施例二:本申请实施例二提供了一种对话生成装置,为便于说明,仅示出与本申请相关的部分,如图2所示,对话生成装置包括,初始获取模块201,用于获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;语句生成模块202,用于将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间;条件判断模块203,用于判断所述预设存储空间中记录的答复语句是否符合预设中止条件,若是,则触发语句输出模块,若否,则触发更新返回模块;更新返回模块204,用于根据所述答复语句计算奖励值,根据所述奖励值以及强化学习的损失函数计算所述对话生成模型的损失值,根据所述损失值对所述对话生成模型进行更新,并将所述答复语句作为新的输入语句输入更新后的对话生成模型,触发语句生成模块;语句输出模块205,用于将所述预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档。在一些可能的实现方式中,所述语句生成模块202包括:查询判断子模块,用于将所述输入语句输入预设的二分类器,根据所述二分类器的分类结果判断所述输入语句是否需要进行sql查询,若是,则触发查询语句子模块,若否,则触发直接生成子模块;查询语句子模块,用于将所述输入语句输入语义分析器中,得到与所述输入语句对应的sql查询语句;综合生成子模块,用于根据所述sql查询语句对预设的数据库进行查询,若查询到与所述sql查询语句对应的查询结果,则将所述输入语句和所述查询结果输入所述对话生成模型中,得到答复语句并记录在预设存储空间;直接生成子模块,用于将所述输入语句输入所述对话生成模型中,得到答复语句并记录在预设存储空间。在一些可能的实现方式中,所述查询语句子模块具体包括:编码子模块,用于将所述输入语句输入语义分析器的编码器,得到输入向量,其中,所述语义分析器包括所述编码器、解码器和通道选择器;解码子模块,用于将所述输入向量输入所述解码器;词汇子模块,用于在每一个查询步长中,获取所述通道选择器生成的通道信息,在所述解码器中选择与所述通道信息对应的查询通道对所述输入向量进行处理,得到所述查询步长对应的sql查询词,其中,所述解码器包括列名查询通道、关键字查询通道和值查询通道,所述通道选择器用于在每一个查询步长中生成相应的通道信息;语句子模块,用于将各个查询步长对应的sql查询词按照生成顺序进行排列,得到与所述输入语句对应的sql查询语句。在一些可能的实现方式中,所述对话生成模型具体为seq2seq模型。需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。实施例三:图3是本申请实施例三提供的计算机设备的示意图。如图3所示,该实施例的计算机设备3包括:处理器30、存储器31以及存储在所述存储器31中并可在所述处理器30上运行的计算机程序32。所述处理器30执行所述计算机程序32时实现上述对话生成方法实施例中的步骤,例如图1所示的步骤s101至s105。或者,所述处理器30执行所述计算机程序32时实现上述各装置实施例中各模块/单元的功能,例如图2所示模块201至205的功能。示例性的,所述计算机程序32可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器30执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序32在所述计算机设备3中的执行过程。例如,所述计算机程序32可以被分割成初始获取模块、语句生成模块、条件判断模块、更新返回模块以及语句输出模块,各模块具体功能如下:初始获取模块,用于获取对话生成模型和输入语句,所述对话生成模型为根据输入的输入语句生成相应的答复语句的神经网络模型;语句生成模块,用于将所述输入语句输入所述对话生成模型,得到答复语句并记录在预设存储空间;条件判断模块,用于判断所述预设存储空间中记录的答复语句是否符合预设中止条件,若是,则触发语句输出模块,若否,则触发更新返回模块;更新返回模块,用于根据所述答复语句计算奖励值,根据所述奖励值以及强化学习的损失函数计算所述对话生成模型的损失值,根据所述损失值对所述对话生成模型进行更新,并将所述答复语句作为新的输入语句输入更新后的对话生成模型,触发语句生成模块;语句输出模块,用于将所述预设存储空间中记录的答复语句按照记录时间的先后顺序进行排列,得到会话文档。所述计算机设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图3仅仅是计算机设备3的示例,并不构成对计算机设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机设备还可以包括输入输出设备、网络接入设备、总线等。所称处理器30可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。所述存储器31可以是所述计算机设备3的内部存储单元,例如计算机设备3的硬盘或内存。所述存储器31也可以是所述计算机设备3的外部存储设备,例如所述计算机设备3上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器31还可以既包括所述计算机设备3的内部存储单元也包括外部存储设备。所述存储器31用于存储所述计算机程序以及所述计算机设备所需的其他程序和数据。所述存储器31还可以用于暂时地存储已经输出或者将要输出的数据。所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。在本申请所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1