智能聊天方法、装置、计算机设备及存储介质与流程

文档序号:17790571发布日期:2019-05-31 20:08阅读:186来源:国知局
智能聊天方法、装置、计算机设备及存储介质与流程
本发明涉及智能交互领域,尤其涉及一种智能聊天方法、装置、计算机设备及存储介质。
背景技术
:聊天机器人(chatterbot)是一个用来模拟人类对话或聊天的程序,它试图建立这样的程序:至少暂时性地让一个真正的人类认为他们正在和另一个人聊天。聊天机器人可用于客户服务或资讯获取等实用场景。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句,造成聊天机器人回答具有相同或者相似关键词的问题时,其回复内容具有重复性。如何提升聊天机器人聊天内容的个性化,以使聊天机器人更加贴近用户成为亟待解决的问题。技术实现要素:本发明实施例提供一种智能聊天的智能聊天方法、装置、计算机设备及存储介质,以解决提升聊天机器人聊天内容的个性化的问题。一种智能聊天方法,包括:接收客户端发送的当前轮次信息,调用信息转化模型对当前轮次信息进行识别,获取文字数据;采用预设的意图识别模型对文字数据进行识别,获取文字数据对应的目标意图;基于目标意图获取对应的目标意图模板,目标意图模板包括至少一个目标参数;基于预置概念知识图谱对目标参数进行匹配处理,获取每一目标参数对应的扩展概念;根据每一扩展概念检索联网知识库,获取扩展概念对应的概念文本;调用信息转化模型对概念文本进行转换以获取当前回复信息,将当前回复信息推送给客户端。一种智能聊天装置,包括:接收当前信息模块,用于接收客户端发送的当前轮次信息,调用信息转化模型对当前轮次信息进行识别,获取文字数据;获取目标意图模块,用于采用预设的意图识别模型对文字数据进行识别,获取文字数据对应的目标意图;获取意图模板模块,用于基于目标意图获取对应的目标意图模板,目标意图模板包括至少一个目标参数;获取扩展概念模块,用于基于预置概念知识图谱对目标参数进行匹配处理,获取每一目标参数对应的扩展概念;获取概念文本模块,用于根据每一扩展概念检索联网知识库,获取扩展概念对应的概念文本;获取回复信息模块,用于调用信息转化模型对概念文本进行转换以获取当前回复信息,将当前回复信息推送给客户端。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述智能聊天方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述智能聊天方法的步骤。上述智能聊天方法、装置、计算机设备及存储介质,通过接收客户端发送的当前轮次信息,对当前轮次信息结合目标意图模块获取目标参数,并将目标参数参考概念知识图谱进行扩展,可得到当前轮次信息对应的当前回复信息推送给客户端。该智能聊天方法、装置、计算机设备及存储介质,可在聊天机器人和用户互动过程中,为用户提供更为精准、有意义和有趣味的回复信息,增强聊天机器人与用户之间的互动黏性。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本发明一实施例中智能聊天方法的应用环境示意图;图2是本发明一实施例中智能聊天方法的流程图;图3是本发明一实施例中获取目标意图的实现过程示意图;图4是本发明一实施例中在lstm模型中设置阀门节点的实现示意图;图5是本发明一实施例中智能聊天方法中的概念知识图谱的一示例图;图6是本发明一实施例中智能聊天方法的另一流程图;图7是本发明一实施例中智能聊天方法的另一流程图;图8是本发明一实施例中智能聊天方法的另一流程图;图9是本发明一实施例中智能聊天方法的另一流程图;图10是本发明一实施例中智能聊天方法的另一流程图;图11是本发明一实施例中智能聊天装置的示意图;图12是本发明一实施例中计算机设备的示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例提供的智能聊天方法,可应用在如图1的应用环境中,该智能聊天方法应用在智能聊天系统中,该智能聊天系统包括客户端和服务器,其中,客户端通过网络与服务器进行通信。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。该客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等计算机设备上。服务器是通过网络连接和控制聊天机器人的独立服务器或者是多个服务器组成的服务器集群。在一实施例中,如图2所示,提供一种智能聊天方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:s10.接收客户端发送的当前轮次信息,调用信息转化模型对当前轮次信息进行识别,获取文字数据。其中,当前轮次信息是用户通过特定表达方式输入客户端用以表达用户意图的信息,其中,特定表达方式包括但不限于文字信息、语音或手势动作等方式。文字数据是将当前轮次信息对应的含义通过文字形式进行表达的信息。信息转化模型是将特定表达方式所表达信息的含义转化为文字信息的模型。于本实施例,信息转化模型可基于不同的表达方式进行转换,因此其包括多个转化模型。比如,将语音信息转化为文字信息的语音转化模型,比如rnn-hmm(recurrentneuralnetwork-hiddenmarkovmodel即循环神经网络-隐马尔科夫)模型或lstm-hmm(longshort-termmemory,长短期记忆网络-隐马尔科夫)模型等机器声学模型,或者将手势信息转化为文字信息的手势转化模型,比如fldcrfs(fuzzybasedlatentdynamicconditionrandomfields,模糊隐动态条件随机场)等机器手势识别模型。应当理解地是,本实施例中rnn-hmm机器声学模型、lstm-hmm机器声学模型和fldcrfs机器手势识别模型等机器学习模型为公知技术,此处不再赘述。举例说明步骤s10,用户通过客户端的麦克风输入当前轮次信息(语音信息):“我最近看了姜文导演的新电影邪不压正”。服务器通过客户端获取麦克风采集的语音格式的当前轮次信息,因此可确定当前轮次信息为语音信息,即可采用rnn-hmm机器声学模型将该语音信息转化为“我最近看了姜文导演的新电影邪不压正”这一文字数据。步骤s10中,服务器通过将接受到的客户端发送的当前轮次信息转换为文字数据,利于服务器后续基于对文字数据进行处理,以获取与当前轮次信息对应的回复信息返回给客户端。s20.采用预设的意图识别模型对文字数据进行识别,获取文字数据对应的目标意图。其中,预设意图识别模型是用于分析文字数据,提取文字数据表达的用户意图的模型。于本实施例,预设意图识别模型可采用lstm(longshort-termmemory,长短期记忆网络)模型和softmax分类器的组合模型。意图是用户在当前轮次信息中表达的目的,可分为“显式意图”和“隐式意图”,它们两者间的差异十分明显:(一)显式意图所谓显式意图,也就是在用户的话语中明确出现了表达意图的一类词汇,比如:“希望”、“想要”和“需要”等等。对于聊天机器人来说这种显示意图的判断难度较低,只需要识别出这些固定的意图词汇,再与句子中的其他成分作联系即可。比如用户输入“我想预定到北京的机票”,聊天机器人可识直接根据意图词汇“想”识别出该句的显式意图为“我想预定到北京的机票”,然后通过预设意图识别模型对该显示意图进行分析得到确切的用户意图:用户预订机票,机票起点为用户所在位置,终点为北京。(二)隐式意图隐式意图与显式意图相反,用户的话语没有出现直接反映意图的词汇,需要聊天机器人根据文字数据来判断用户的目标意图。对于聊天机器人来说隐式意图比较难以判断,目前用得比较多的一种方法是先把隐式意图转化成显式意图再处理——比如用户在表达“我饿了”这种隐式意图时,先转化成携带意图词汇的“我想吃东西”的显式意图句式,然后再让聊天机器人通过预设意图识别模型对该显示意图进行分析得到确切的目标意图。具体地,如图3所示,本实施例中服务器通过文字数据获取目标意图的实现过程如下:1.将文字数据进行预处理,包括去除语料的标点符号,去除停用词(无实际含义的词)等。2.将预处理后的文字数据,采用word2vec工具生成词向量。其中,word2vec工具是一个nlp(naturallanguageprocessing,自然语言处理)工具,它可以将所有的自然语言中的字词向量化,转为计算机可以理解的稠密向量(densevector),用以定量地度量词与词之间的关系,挖掘词与词之间的联系。可以理解地,对于相似的词,其对应的词向量也相近。3.采用lstm模型对词向量进行特征提取。其中,lstm模型可解决自然语言处理统计方法只能考虑最近n个词语而忽略更久前词语的问题,旨在发现词和词之间的相关关系,在数据分析中增加时间文本内容,记住之前发生了什么,然后应用于神经网络,观察与神经网络接下来所发生的事情之间的联系,从而得出目标意图。lstm的特点就是在rnn(recurrentneuralnetwork,循环神经网络)模型以外添加了各层的阀门节点,如图4所示。阀门节点有3类:遗忘阀门(forgetgate),输入阀门(inputgate)和输出阀门(outputgate)。这些阀门节点可以打开或关闭,用于将判断rnn模型的记忆态(之前网络的状态)在上一输出层的结果是否达到阈值从而加入到当前该层的计算中。阀门节点利用sigmoid函数将在rnn模型中该阀门节点对应的上一输出层运算结果作为输入计算;如果计算结果达到阈值则将该阀门节点输出与当前层的计算结果相乘作为下一层的输入;如果没有达到阈值则将该阀门节点对应的上一输出层运算结果遗忘掉。lstm模型的记忆功能就是由这些阀门节点实现的。当阀门节点打开的时候,前面rnn模型的训练结果就会关联到当前的rnn模型进行计算,而当阀门节点关闭的时候之前的计算结果就不再影响当前的计算。因此,通过调节阀门节点的开关可以实现历史意图对最终获取目标意图的影响。当不希望历史意图对之后的意图分析产生影响,比如自然语言处理中开始分析新段落或新章节,则关掉阀门节点即可。4.采用softmax完成意图分类工作。最后,将lstm模型对词向量进行特征提取后,在神经网络中引入softmax分类器可定义一个新的输出层(目标意图概率分布)。基于神经网络的lstm模型的输出层不一定是一个概率分布层,所以可给lstm模型在最后引入softmax分类器,softmax分类器能够作为一个额外的处理层把神经网络的输出(lstm模型的最后输出层)变成一个概率分布,也就是每一个输出都是0至1之间的小数,并且所有输出的结果之和为1。举例说明,若lstm模型的最后输出层为y1,y2,y3和y4,服务器可采用softmax分类器对该lstm模型的最后输出层进行处理,采用如下公式:通过softmax分类器可以计算出y’1y’2y’3y’4的值,其中,y’i是每一目标意图的输出概率。可以理解地,y’i中数值最大的输出对应的目标意图就是当前轮次信息对应的目标意图。比如,步骤s10获得文字数据“我最近看了姜文导演的新电影邪不压正”,经步骤s20中预设的意图识别模型进行识别后获得的目标意图是:用户讨论电影,其中,电影参数包括:电影名为邪不压正。步骤s20中,服务器能够通过预设的意图识别模型识别用户的目标意图,精准地判断出用户的需求,获取与用户需求更贴合的聊天内容,减少聊天机器人和用户之间答非所问的次数,以保障聊天有效性。进一步地,在营销推广的应用场景下,还能实现聊天机器人在不借助人工辅助的情况下对用户进行精准营销或销售转化。s30.基于目标意图获取对应的目标意图模板,目标意图模板包括至少一个目标参数。其中,目标意图模板包括实现每一目标意图的必要参数的模板,每一必要参数即为目标参数(也称slot)。可以理解地,每一目标意图的实现应至少包括动作执行人,执行的动作和动作执行对象,也即动作执行人、执行的动作和动作执行对象就是目标参数。继续以步骤s20中的举例进行说明,当服务器判定文字数据“我最近看了姜文导演的新电影邪不压正”对应的目标意图为:用户讨论电影,电影名为邪不压正,则该目标意图模板中包括的目标参数分别为:目标参数1-动作执行人:用户;目标参数2-执行的动作:讨论;目标参数3-动作执行对象:电影。进一步地,每个动作执行对象还可携带多个参数标签。比如,本实施例的举例中动作执行对象中携带的参数标签为邪不压正。再进一步地,将本实施例结合实际经验,用户聊天时讨论内容的重点在于动作执行对象,也即动作执行对象的关注度一般高于动作执行人和执行的动作。服务器可给目标意图模板中的目标参数设置关注度,比如给执行的动作和动作执行对象设置较高的关注度,若以数字表示关注度,可给动作执行对象携带的参数标签设置关注度为1,给动作执行对象设置关注度为2,给动作执行人设置关注度为3等。给目标参数设置关注度,利于服务器后续基于不同的关注度对目标意图中的目标参数进行逐次扩展,精确地围绕用户的关注点或兴趣点展开聊天。步骤s30中,服务器通过目标意图对应的目标意图模板,可获取至少一个目标参数,利于后续基于该至少一个目标参数扩展聊天范围,精确地围绕用户的关注点或兴趣点展开聊天,以保持聊天机器人和用户之间的聊天黏性和趣味性。s40.基于预置概念知识图谱对目标参数进行匹配处理,获取每一目标参数对应的扩展概念。其中,概念知识图谱是增强搜索引擎功能的知识库,旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,图中包括节点(即本实施例中的一扩展概念)和连接两个节点的若干边。其中,节点表示实体或概念,边则由属性或关系构成。以图5为例,对概念知识图谱进行具体介绍:实体:指的是具有可区别性且独立存在的某种事物,如某一个人、某一个城市、某一种植物等和某一种商品等等。世界万物由具体事物组成,此指实体。如图5的“中国”、“美国”和“日本”等。实体是概念知识图谱中的最基本元素,不同的实体间存在不同的关系。语义类(概念):具有同种特性的实体构成的集合,如国家、民族、书籍和电脑等。概念主要指集合、类别、对象类型和事物的种类,例如人物、地理等。内容:通常作为实体和语义类的名字、描述和解释等,可以由文本、图像和音视频等来表达。属性:从一个实体指向它的属性。不同的属性类型对应于不同类型属性的边。属性值主要指对象指定属性的值。如图5所示的“面积”、“人口”和“首都”是几种不同的属性。属性值主要指对象指定属性的值,例如960万平方公里等。关系:代表概念知识图谱中的三元组集合。三元组的基本形式主要包括(实体1-关系-实体2)和(实体-属性-属性值)等。每个实体(概念的外延)可用一个全局唯一确定的id来标识,每个属性-属性值对(attribute-valuepair,avp)可用来刻画实体的内在特性,而关系可用来连接两个实体,刻画它们之间的关联。如图5的概念知识图谱例子所示,中国是一个实体,北京是一个实体,中国-首都-北京是一个(实体-关系-实体)的三元组样例。北京是一个实体,人口是一种属性,2069.3万是属性值。北京-人口-2069.3万构成一个(实体-属性-属性值)的三元组样例。具体地,服务器可基于步骤s30中可获取目标意图对应的目标参数在预置概念知识图谱中进行匹配,获取每一目标参数在预置概念知识图谱中关联的至少一个相邻节点,该相邻节点即为该目标参数对应的扩展概念。因目标参数对应的每一扩展概念是在实体、语义或属性上与目标参数密切相关的相关概念,而目标参数是用户讨论时提及的话题,可以推断,本步骤获取的每一扩展概念也应该属于用户关注的讨论范围。举例说明将目标参数在预置概念知识图谱中进行匹配的过程:1.步骤s30中服务器获得关注度较高的目标参数为电影,且目标参数“电影”对应的参数标签“邪不压正”的关注度高于目标参数“电影”,也即服务器可先基于邪不压正在预置概念知识图谱中获取扩展概念。2.在预置概念知识图谱中,与实体或节点“邪不压正”关联的其它实体(相邻节点)包括导演姜文、电影类型(动作喜剧)、制片地区(中国)、主演(姜文、彭于晏和廖凡)等,以及相关的其它相邻节点。步骤s40中,服务器可基于预置知识概念图谱获取与每一目标参数对应的扩展概念,也即本步骤是基于用户的关注内容来延伸讨论范围,利于保持聊天机器人与用户之间的聊天黏性。s50.根据每一扩展概念检索联网知识库,获取扩展概念对应的概念文本。其中,联网知识库即为在线检索库,比如,百度、搜狗、谷歌或360搜索等。概念文本就是与扩展概念相关的文本解释,比如,扩展概念为“邪不压正”,服务器通过百度百科可获“邪不压正”对应的词条解释(概念文本)为:《邪不压正》是由姜文编剧并执导,姜文、彭于晏、廖凡、周韵、许晴、泽田谦也、安地等主演的动作喜剧电影。该片是姜文第六部导演作品,改编自张北海小说《侠隐》。故事发生在1937年“七七事变”爆发之前,北平城的“至暗时刻”,一个身负大恨、自美归国的特工李天然,在国难之时涤荡重重阴谋上演一出终极复仇记。该片于2018年7月13日在中国上映。步骤s50中,服务器可通过联网知识库获取每一扩展概念对应的概念文本,给用户提供与当前轮次信息相关的文本信息,在不偏离用户感兴趣的话题范围内保证引导话题的多样性,或者给用户的当前轮次信息增加更多的背景信息,以保障聊天机器人和用户之间的聊天趣味性和可扩展性。s60.调用信息转化模型对概念文本进行转换以获取当前回复信息,将当前回复信息推送给客户端。具体地,与步骤s10中的信息转化模型相对应,本步骤中的信息转化模型是将概念文本(文字信息)转化为传递给用户的回复信息的形式的模型,比如,将文字信息转换合成为语音信息的讯飞语音模型等。进一步地,本步骤可采用语音转化模型将概念文本转化为语音信息输出给用户,或者也可以按客户端的喜好或者情景需要直接以文本形式直接输出给客户端。步骤s60中,服务器可根据场景需要,设置为输出的回复信息的形式与用户输入的当前轮次信息的方式一致,保持聊天习惯一致性;也可根据用户设置,将文本信息输出为指定的输出方式,增强与用户聊天的灵活性。步骤s10至s60提供的实施例中,服务器通过接收客户端发送的当前轮次信息,对当前轮次信息结合目标意图模块获取目标参数,并将目标参数参考概念知识图谱进行扩展,可得到当前轮次信息对应的当前回复信息推送给客户端。该智能聊天方法,可在聊天机器人和用户互动过程中,为用户提供更为精准、有意义和有趣味的回复信息,增强聊天机器人与用户之间的互动黏性。在一实施例中,如图6所示,在步骤s40之后,即在基于预置概念知识图谱对目标参数进行匹配处理的步骤之后,该智能聊天方法还包括如下步骤:s401.若在预置概念知识图谱中未匹配出与目标参数对应的至少一个扩展概念,则基于文字预测模型提取目标意图的意图执行逻辑,预测意图执行逻辑的承载内容,将承载内容作为目标意图对应的回复文本。其中,回复文本是服务器通过文字预测模型分析目标意图后直接获得的回复给用户的文本内容。文字预测模型是对目标意图进行逻辑提取并基于逻辑提取结果预测对应的回复内容的模型。比如,目标意图为:用户讨论电影,电影名为邪不压正,经文字预测模型分析和预测后可获得的回复内容为:“你对电影《邪不压正》有什么看法?”。本实施例中,文字预测模型可采用groovy动态脚本。具体地,目标意图包括意图名词(一般为目标意图句式中的主语和宾语)和意图执行逻辑。groovy动态脚本针对用户的某个目标意图进行回复时,首先要提取目标意图中的意图名词,给意图名词赋值,然后基于意图名词执行groovy动态脚本配置的意图执行逻辑,最终得到groovy动态脚本返回的与目标意图对应的回复文本。groovy是一种脚本语言,完全兼容java语法,并且可在java中动态执行。基于这种特性,groovy动态脚本可以作为目标意图中的意图执行逻辑的承载者以获得承载内容,即意图执行逻辑是可以被配置的,所以意图执行逻辑可以在不需要重新编译或者重启系统的情况下被改写,极大地方便了系统的维护,也增强了系统的可扩展性。步骤s401中,服务器还可基于文字预测模型获取与目标意图对应的回复文本,增强聊天机器人与用户聊天过程中的回复信息的及时性和持续性,避免因预置概念知识图谱中不存在对应的目标参数而造成“无话可说”的情形。s402.调用信息转化模型将回复文本进行转换以获取当前回复信息,将当前回复信息推送给客户端。步骤s402与步骤s60的实现过程和实现目的一致,都是将回复文本或概念文本转化为当前回复信息推送给客户端,为了避免重复,此处不再赘述。步骤s402中,服务器可根据场景需要设置为输出的回复信息的形式与用户输入的当前轮次信息的方式一致,保持聊天习惯一致性;也可根据用户设置,将回复文本转化为指定的输出方式,增强与用户聊天的灵活性。步骤s401至s402中,服务器还可基于文字预测模型获取目标意图对应的回复文本,增强聊天机器人与用户聊天过程中的回复信息的及时性和持续性,避免因预置概念知识图谱中不存在对应的目标参数而造成“无话可说”的情形。服务器可根据场景需要设置为输出的回复信息的形式与用户输入的当前轮次信息的方式一致,保持聊天习惯一致性;也可根据用户设置,将回复文本转化为指定的输出方式,增强与用户聊天的灵活性。在一实施例中,如图7所示,在步骤s60之前,即在调用信息转化模型对概念文本进行转换以获取当前回复信息的步骤之前,智能聊天方法还包括:s611.获取用户个人信息,基于用户个人信息生成用户画像。其中,用户个人信息是服务器收集的静态数据和动态数据,其中,静态数据是用户在服务器注册时主动输入的长时间内不会变化的个人信息,比如,用户的地域、年龄、性别、文化、职业和收入等;动态数据是服务器与用户互动过程中对用户行为进行分析得到的数据,比如,生活习惯或消费习惯等。总体来讲,为了获取用户画像需要用到如下用户个人信息:(1)人口属性:包括性别、年龄等基本信息;(2)兴趣特征:浏览内容、收藏内容、阅读咨询、购买物品偏好等;(3)消费特征:与消费相关的特征;(4)位置特征:用户所处城市、所处居住区域、用户移动轨迹等;(5)设备属性:使用的终端特征等;(6)行为数据:访问时间、浏览路径等用户在网站的行为日志数据;(7)社交数据:用户社交相关数据。用户画像是服务器根据用户个人信息而抽象出来的高度精炼的标签,也即用户特征标识。通过给用户“贴”标签可以利用高度概括、容易理解的特征来描述用户,利于服务器根据标签(标准化信息)进一步处理。具体地,基于用户个人信息生成用户画像的实现过程如下:一、对用户个人信息中的某项特征进行抽象分类和概括形成标签,该标签的标签值具备可分类性。例:将用户个人信息中“男”、“女”这类特征进行抽象概括,统称为“性别”,“性别”即一个标签;二.穷举标签值(tagvalue),以使该标签包括对应的所有可能的情况的值。例:对于标签“性别”,其标签值可分为“男”、“女”和“未知”;对于标签“年龄”,其标签值可分为“0-18”、“18-35”、“35-60”、“60-100”等。三.构建用户画像(userprofile)。根据步骤一和步骤二创造的标签,提取用户个人信息中与每一标签对应的标签值。例:用户画像包括的标签有性别、年龄、手机品牌、居住地和爱好等。小明是用户画像的一个实例,小明的用户画像的输出结果为:“男“、“18-35”、“iphone”、“北京”和“足球”。步骤s611中,服务器可基于用户个人信息构建用户画像,给后续服务器基于该用户画像分析用户的用户性格准备技术基础。s612.分析用户画像,获取与用户画像相对应的用户性格。其中,用户性格是一个人对现实的稳定的态度,以及与这种态度相应的,习惯化了的行为方式中表现出来的人格特征。性格一经形成便比较稳定,但是并非一成不变,而是可塑性的。性格不同于气质,更多体现了人格的社会属性,个体之间的人格差异的核心是性格的差异。具体地,通过对用户画像进行分析和挖掘,还可以揭示用户的内心需求和用户性格等潜在属性。比如,用户画像中有关购物标签包括平均浏览时间和平均对比同类次数,三个用户的网上购物标签记录情况如下:平均浏览时间(分钟)平均对比次数用户a73用户b1512用户c2520购物性格参考模板(基于实际情况统计生成):冲动型:平均浏览时间少于10分钟,平均对比次数少于5次。理性型:平均浏览时间介于10分钟至20分钟,平均对比次数介于5次至20次。犹豫型:平均浏览时间大于20分钟,平均对比次数大于20次。服务器基于三个用户的购物标签和购物性格参考模板进行对比可得如下结果:用户a总在短时间(平均浏览时间少于10分钟)内比较少量的商品(平均对比次数少于5次)下单,则用户a的购物性格为冲动型。用户b总在适量时间内(平均浏览时间介于10分钟至20分钟)比较少量同类商品(平均对比次数介于5次至20次)后下单,则用户b的购物性格为理性型。用户c总在长时间(平均浏览时间大于20分钟)大量地浏览很多商品(平均对比次数大于20次)后下单,则用户c的购物性格为犹豫型。同样地,服务器还可对用户画像进行分析获得用户的聊天性格,聊天性格包括:兴奋、平静或低沉等。需要补充的是,服务器还可通过分析用户输入的当前轮次信息中的声音特质结合聊天性格参考模板来判断用户性格。其中,声音特征的聊天性格参考模板(基于实际情况统计生成)如下:1)掺杂呼吸且脆弱的声音:如果用户是男性,属于年轻艺术家的类型;如果用户是女性,虽性格偏女性化,且集美丽、小巧、开朗于一身,这类女性比较容易兴奋。2)无力的声音:如果用户是男性,无特定性格;如果用户是女性,则具有社交能力强、感性、幽默等特性。3)平淡的声音:用户无论男女,性格特征均为偏男性化、精神状态欠佳、冷淡、畏缩不前,当前状态不太积极。4)声调低且粗犷的声音:如果用户是男性,应该拥有敏锐的观察力,且现实、圆滑、成熟、干练、适应性强;如果用户是女性,性格特质主要表现为喜欢偷懒或病怏怏等。5)爽朗的声音:如果用户是男性,性格干练且自尊心强;如果用户是女性,则性格活泼、善于社交、自尊心强,缺乏幽默感。6)语速快:用户无论男女,该类人群的性格均较活泼,且社交能力强。7)抑扬顿挫且洪亮的声音:用户无论男女,该类人群精力旺盛。步骤s612中,服务器可对步骤s611中获取的用户画像根据实际经验进行分析,获得用户对应的用户性格,为后续服务器基于不同的用户性格采用不同的回复模式准备技术基础。s613.基于用户性格查询预置回复模式库,获取与用户性格对应的目标回复模式。其中,回复模式库是预置于服务器的,针对不同的用户性格的回复信息的模式组成的数据库。目标回复模式是针对用户性格进行回复的聊天模式,本实施例主要应用于语音聊天,因此回复模式即为聊天机器人与用户聊天时的语气回复模式。具体地,根据心理学研究聊天时语气同步的双方,更加容易被对方接受。也就是说如果用户说话语气慢条斯理,若聊天机器人跟着用户的节奏聊天,可增加用户与聊天机器人继续聊天的意愿。基于此,服务器可根据用户性格搭配对应的聊天语气,以进一步增强用户和聊天机器人之间的聊天趣味性和情感交互性。进一步地,服务器可将对每一用户性格配置一种语气回复模式,比如,对于热情、兴奋或积极等用户性格的语气回复模式为快速且热情的语气回复模式;对于冷静、平淡或成熟的用户性格的语气回复模式为中速且平静的语气回复模式等。步骤s613中,服务器可根据用户性格在预置回复模式库中匹配对应的目标回复模式,以进一步增强用户和聊天机器人之间的聊天趣味性和情感交互性。s614.将目标回复模式添加到信息转化模型,以更新信息转化模型,调用更新后的信息转化模型对概念文本进行转换以获取当前回复信息。具体地,服务器将步骤s613获得的目标回复模式(可以为语气回复模式),比如快速且热情的语气回复模式等发送给信息转化模型,以使信息转化模型将概念文本转换为与目标回复模式相匹配的当前回复信息。进一步地,信息转化模型可通过调整语速和说话的音调实现获取与目标回复模式相匹配的当前回复信息。步骤s614中,服务器可将调整与目标回复模式相匹配的当前回复信息发送给客户端,增强聊天机器人和用户之间的情感交互性,提高聊天内容的有效性。步骤s611至s614中,服务器可根据实际经验对用户画像进行分析,获得用户对应的用户性格,并根据用户性格在预置回复模式库中匹配对应的目标回复模式,以进一步增强用户和聊天机器人之间的聊天趣味性和情感交互性。服务器可将调整后与目标回复模式相匹配的当前回复信息发送给客户端,增强聊天机器人和用户之间的情感交互性,提高聊天内容的有效性。在一实施例中,如图8所示,在步骤s611之后,即在基于用户个人信息生成用户画像的步骤之后,智能聊天方法还包括:s6111.分析用户画像,获取与用户画像相对应的用户爱好列表。用户爱好列表是基于用户画像中的爱好标签获得的用户所有的爱好,比如,用户的爱好标签包括:足球、电影、音乐、读书和旅行等。步骤s6111中,服务器可基于用户画像中的爱好标签获取用户爱好列表,从多方面获得用户的关注点和兴趣点,以针对用户的关注点和兴趣点进行扩展提高聊天内容的丰富性和有效性。s6112.基于用户爱好列表中的每一用户爱好,检索联网知识库,获取与用户爱好对应的爱好知识文本。其中,爱好知识文本是与每一爱好相关主题对应的知识文本。比如,对于爱好主题为电影的知识文本如下(检索联网知识库获得):电影,是由活动照相术和幻灯放映术结合发展起来的一种连续的影像画面,是一门视觉和听觉的现代艺术,也是一门可以容纳戏剧、摄影、绘画、音乐、舞蹈、文字、雕塑、建筑等多种艺术的现代科技与艺术的综合体。可以理解地,服务器可基于更详细的用户爱好,比如电影《邪不压正》进行更为针对性检索联网知识库,获得《邪不压正》在联网知识库中对应的爱好知识文本。步骤s6112中,服务器可基于用户的每一用户爱好获得对应的爱好知识文本提供给用户,利于用户在聊天中得到有效收获。s6113.调用信息转化模型对爱好知识文本进行转换,获取附加回复信息,将附加回复信息推送给客户端。步骤s6113与步骤s60的实现过程和实现目的一致,都是将爱好知识文本或概念文本转化为附加回复信息或当前回复信息推送给客户端,为了避免重复,此处不再赘述。步骤s6113中,服务器可根据场景需要设置为输出的附加回复信息的形式与用户输入的当前轮次信息的方式一致,保持聊天习惯一致性;也可根据用户设置,将爱好知识文本转化为指定的输出方式,增强与用户聊天的灵活性。步骤s6111至s6113中,服务器可基于用户画像中的爱好标签获取用户爱好列表,从多方面获得用户的关注点和兴趣点,以针对用户的关注点和兴趣点进行扩展提高聊天内容的丰富性和有效性。服务器可基于用户的每一用户爱好获得对应的爱好知识文本提供给用户,利于用户在聊天中得到有效收获。服务器可根据场景需要设置为输出的回复信息的形式与用户输入的当前轮次信息的方式一致,保持聊天习惯一致性;也可根据用户设置,将爱好知识文本转化为指定的输出方式,增强与用户聊天的灵活性。在一实施例中,如图9所示,在步骤s60之后,即在将当前回复信息推送给客户端的步骤之后,智能聊天方法还包括:s621.基于预置情感分析模型对文字数据进行分析,获取文字数据对应的情感分析结果。其中,预置情感分析模型是提取文字数据中的信息进行分析得到用户情感分析结果的模型,比如,现有成熟的多个情感分析模型:1)基于词典的分析模型;2)基于机器学习的分析模型;3)词典与机器学习的混合分析模型;4)基于弱标注信息的分析模型;5)基于深度学习的分析模型。具体地,情感分类是情感分析技术的核心问题,其目标是判断聊天评论中的情感取向,按情感粒度可分为两种分类问题(也即情感分析结果):1)正/负(positive/negative)二分类或者正面/负面/中立(positive/negative/neutral)三分类。2)多元分类,例如对新闻评论进行“乐观”、“悲伤”、“愤怒”和“惊讶”的四元情感分类,对商品评论进行1星至5星五元情感分类等。本实施例可采用基于词典的分析模型,以获取文字数据对应的情感分析结果。进一步地,基于词典方法的核心模式是“词典+规则”,即以情感词典作为判断文字数据的情感极性的主要依据,同时兼顾评论数据(文字数据)中的句法结构,设计相应的判断规则(如but从句与主句情感极性相反),以获取文字数据对应的情感分析结果:正面、负面或中立等。步骤s621中,服务器可基于预置情感分析模型获取用户输入的文字数据中评论内容的情感分析结果,利于服务器基于该情感分析结果后续查找对应情感分类的评论内容,以增强聊天机器人和用户之间的情感认同感。s622.根据情感分析结果和目标意图,检索联网评论库,获取对应的目标情感评论。其中,联网评论库为与目标意图对应的多个在线论坛,比如,目标意图为用户讨论电影,则该目标意图对应的多个在线论坛为电影论坛。具体地,若步骤s612中,服务器获得的用户的情感分析结果为正面,则本步骤中,服务器可基于预设正面关键词在联网评论库中进行检索,获取检索结果作为目标情感评论。步骤s622中,服务器根据情感分析结果和目标意图可获取与用户的情感分析结果一致的目标情感评论,利于用户和聊天机器人聊天时获得群体感,以保持聊天黏性。s623.调用信息转化模型对目标情感评论进行转换,获取附加回复信息,将附加回复信息推送给客户端。步骤s623与步骤s60的实现过程和实现目的一致,都是将目标情感评论或概念文本转化为附加回复信息或当前回复信息推送给客户端,为了避免重复,此处不再赘述。步骤s623中,服务器可根据场景需要设置为输出的目标情感评论的形式与用户输入的当前轮次信息的方式一致,保持聊天习惯一致性;也可根据用户设置,将目标情感评论转化为指定的输出方式,增强与用户聊天的灵活性。步骤s621至s623中,服务器可基于预置情感分析模型获取用户输入的文字数据中评论内容的情感分析结果,利于服务器基于该情感分析结果后续查找对应情感分类的评论内容,以增强聊天机器人和用户之间的情感认同感。服务器根据情感分析结果和目标意图可获取与用户的情感分析结果一致的目标情感评论,利于用户和聊天机器人聊天时获得群体感,以保持聊天黏性。服务器可根据场景需要设置为输出的目标情感评论的形式与用户输入的当前轮次信息的方式一致,保持聊天习惯一致性;也可根据用户设置,将目标情感评论转化为指定的输出方式,增强与用户聊天的灵活性。在一实施例中,如图10所示,在步骤s60之后,即在将当前回复信息推送给客户端的步骤之后,且将附加回复信息推送给客户端的步骤之前,智能聊天方法还包括:s631.获取与当前回复信息相对应的预设等待时间。其中,预设等待时间是聊天机器人将当前回复信息推送给客户端后等待用户通过客户端回复下一轮次信息的时间。于本实施例,可设置为两分钟。可以理解地,若服务器在预设等待时间之后还未收到用户发送的下一轮次信息,可能出现用户对当前回复信息不感兴趣或其它导致用户没有回复下一轮次信息的情形,为了保持聊天的持续性,服务器可在预设等待时间后更换用户可能感兴趣的其它主题的聊天话题。步骤s631中,服务器可设置预设等待时间,用于评估用户回复当前回复信息的积极性,为后续更换聊天主题准备技术基础。s632.若在预设等待时间内未接收客户端发送的下一轮次信息,则将附加回复信息推送给客户端。其中,下一轮次信息是当前轮次信息(包括当前用户和聊天机器人之间的一问一答)对应的下一轮问答信息。附加回复信息是与步骤s6113和步骤s623中对应的附加回复信息,用以在预设等待时间后未接受客户端发送的下一轮次信息时推送给客户端。步骤s632中,服务器在预设等待时间内未接收客户端发送的下一轮次信息,则更换聊天主题将步骤s6113或步骤s623中对应的附加回复信息附加回复信息推送给客户端,增强用户和聊天机器人之间的聊天内容的灵活性和可扩展性。步骤s631至s632中,服务器可设置预设等待时间,用于评估用户回复当前回复信息的积极性,为后续更换聊天主题准备技术基础。服务器在预设等待时间内未接收客户端发送的下一轮次信息,则更换聊天主题将步骤s6113或步骤s623中对应的附加回复信息附加回复信息推送给客户端,增强用户和聊天机器人之间的聊天内容的灵活性和可扩展性。本实施例提供的智能聊天方法,服务器通过接收客户端发送的当前轮次信息,对当前轮次信息结合目标意图模块获取目标参数,并将目标参数参考概念知识图谱进行扩展,可得到当前轮次信息对应的当前回复信息推送给客户端。该智能聊天方法、装置、计算机设备及存储介质,可在聊天机器人和用户互动过程中,为用户提供更为精准、有意义和有趣味的回复信息,增强聊天机器人与用户之间的互动黏性。进一步地,服务器还可基于文字预测模型获取对应目标意图的回复文本,增强聊天机器人与用户聊天过程中的回复信息的及时性和持续性,避免因预置概念知识图谱中不存在对应的目标参数而造成“无话可说”的情形。服务器可根据场景需要设置为输出的回复信息的形式与用户输入的当前轮次信息的方式一致,保持聊天习惯一致性;也可根据用户设置,将回复文本转化为指定的输出方式,增强与用户聊天的灵活性。进一步地,服务器可对用户画像根据实际经验进行分析,获得用户对应的用户性格,并根据用户性格在预置回复模式库中匹配对应的目标回复模式,以进一步增强用户和聊天机器人之间的聊天趣味性和情感交互性。服务器可将调整与目标回复模式匹配的当前回复信息发送给客户端,增强聊天机器人和用户之间的情感交互性,提高聊天内容的有效性。进一步地,服务器可基于用户画像中的爱好标签获取用户爱好列表,从多方面获得用户的关注点和兴趣点,以针对用户的关注点和兴趣点进行扩展提高聊天内容的丰富性和有效性。服务器可基于用户的每一用户爱好获得对应的爱好知识文本提供给用户,利于用户在聊天中得到有效收获。服务器可根据场景需要设置为输出的回复信息的形式与用户输入的当前轮次信息的方式一致,保持聊天习惯一致性;也可根据用户设置,将爱好知识文本转化为指定的输出方式,增强与用户聊天的灵活性。进一步地,服务器可基于预置情感分析模型获取用户输入的文字数据中评论内容的情感分析结果,利于服务器基于该情感分析结果后续查找对应情感分类的评论内容,以增强聊天机器人和用户之间的情感认同感。服务器根据情感分析结果和目标意图可获取与用户的情感分析结果一致的目标情感评论,利于用户和聊天机器人聊天时获得群体感保持聊天黏性。服务器可根据场景需要设置为输出的目标情感评论的形式与用户输入的当前轮次信息的方式一致,保持聊天习惯一致性;也可根据用户设置,将目标情感评论转化为指定的输出方式,增强与用户聊天的灵活性。进一步地,服务器可设置预设等待时间,用于评估用户回复当前回复信息的积极性,为后续更换聊天主题准备技术基础。服务器在预设等待时间内未接收客户端发送的下一轮次信息,则更换聊天主题将步骤s6113或步骤s623中对应的附加回复信息附加回复信息推送给客户端,增强用户和聊天机器人之间的聊天内容的灵活性和可扩展性。应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。在一实施例中,提供一种智能聊天装置,该智能聊天装置与上述实施例中智能聊天方法一一对应。如图11所示,该智能聊天装置包括接收当前信息模块10、获取目标意图模块20、获取意图模板模块30、获取扩展概念模块40、获取概念文本模块50和获取回复信息模块60。各功能模块详细说明如下:接收当前信息模块10,用于接收客户端发送的当前轮次信息,调用信息转化模型对当前轮次信息进行识别,获取文字数据。获取目标意图模块20,用于采用预设的意图识别模型对文字数据进行识别,获取文字数据对应的目标意图。获取意图模板模块30,用于基于目标意图获取对应的目标意图模板,目标意图模板包括至少一个目标参数。获取扩展概念模块40,用于基于预置概念知识图谱对目标参数进行匹配处理,获取每一目标参数对应的扩展概念。获取概念文本模块50,用于根据每一扩展概念检索联网知识库,获取扩展概念对应的概念文本。获取回复信息模块60,用于调用信息转化模型对概念文本进行转换以获取当前回复信息,将当前回复信息推送给客户端。优选地,该智能聊天装置还包括获取回复文本模块401和获取预测信息模块402。获取回复文本模块401,用于若在预置概念知识图谱中未匹配出与目标参数对应的至少一个扩展概念,则基于文字预测模型提取目标意图的意图执行逻辑,预测意图执行逻辑的承载内容,将承载内容作为目标意图对应的回复文本。获取预测信息模块402,用于调用信息转化模型将回复文本进行转换以获取当前回复信息,将当前回复信息推送给客户端。优选地,该智能聊天装置还包括获取个人信息模块、分析用户画像模块、获取回复模式模块和更新转化模型模块。获取个人信息模块,用于获取用户个人信息,基于用户个人信息生成用户画像。分析用户画像模块,用于分析用户画像,获取与用户画像相对应的用户性格。获取回复模式模块,用于基于用户性格查询预置回复模式库,获取与用户性格对应的目标回复模式。更新转化模型模块,用于将目标回复模式添加到信息转化模型,以更新信息转化模型,调用更新后的信息转化模型对概念文本进行转换以获取当前回复信息。优选地,该智能聊天装置还包括获取爱好列表模块、获取知识文本模块和获取附加信息模块。获取爱好列表模块,用于分析用户画像,获取与用户画像相对应的用户爱好列表。获取知识文本模块,用于基于用户爱好列表中的每一用户爱好,检索联网知识库,获取与用户爱好对应的爱好知识文本。获取附加信息模块,用于调用信息转化模型对爱好知识文本进行转换,获取附加回复信息,将附加回复信息推送给客户端。优选地,该智能聊天装置还包括获取情感结果模块、获取情感评论模块和推送回复信息模块。获取情感结果模块,用于基于预置情感分析模型对文字数据进行分析,获取文字数据对应的情感分析结果。获取情感评论模块,用于根据情感分析结果和目标意图,检索联网评论库,获取对应的目标情感评论。推送回复信息模块,用于调用信息转化模型对目标情感评论进行转换,获取附加回复信息,将附加回复信息推送给客户端。优选地,该智能聊天装置还包括获取等待时间模块和未接受轮次信息模块。获取等待时间模块,用于获取与当前回复信息相对应的预设等待时间。未接受轮次信息模块,用于若在预设等待时间内未接收客户端发送的下一轮次信息,则将附加回复信息推送给客户端。关于智能聊天装置的具体限定可以参见上文中对于智能聊天方法的限定,在此不再赘述。上述智能聊天装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。在一实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于智能聊天方法相关的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种智能聊天方法。在一实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例地图构建方法的步骤,例如图2所示的步骤s10至步骤s60。或者,处理器执行计算机程序时实现上述实施例中地图构建装置的各模块/单元的功能,例如图11所示模块10至模块60的功能。为避免重复,此处不再赘述。在一实施例中,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例地图构建方法,例如图2所示的步骤s10至步骤s60。或者,该计算机程序被处理器执行时实现上述装置实施例中地图构建装置中各模块/单元的功能,例如图11所示模块10至模块60的功能。为避免重复,此处不再赘述。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1