智能问答方法及装置与流程

文档序号:12305464阅读:414来源:国知局
智能问答方法及装置与流程

本发明涉及互联网技术领域,特别涉及一种智能问答方法及装置。



背景技术:

智能问答系统是一种新型的信息服务系统,在知识处理、语义识别等功能的基础上能够分析用户意图,快捷精准地为用户解答问题。由于智能问答系统可以代替真人与用户进行对话,而且具有知识面丰富和答复速度快等特点,因此受到了广大用户的喜爱。

为了更好地满足用户的对话需求,智能问答系统可以收集网络用户在闲聊过程中产生的大量对话语料信息,根据收集的对话语料信息训练问答模型。当接收到用户的问题信息时,即可基于该问答模型生成与该问题信息匹配的答复信息,提供给用户。例如,用户输入问题信息“今天天气怎么样”时,基于该问答模型可以为用户提供匹配的答复信息“除了雾霾,都挺好的”。

在实现本发明的过程中,发明人发现相关技术至少存在以下问题:用户提出的问题信息可能包括多种类别,上述问答方法中根据对话语料信息训练的问答模型适用于对话场景,能够为对话类别的问题信息提供匹配的答复信息,但对于其他类别的问题信息则很难提供匹配的答复信息。因此上述问答方法的应用范围存在局限,不够智能。



技术实现要素:

为了解决相关技术的问题,本发明实施例提供了一种智能问答方法及装置。所述技术方案如下:

第一方面,提供了一种智能问答方法,所述方法包括:

接收终端发送的问答请求,所述问答请求携带问题信息;

基于分类模型确定所述问题信息所属的类别,所述分类模型用于划分出专业类别的问题信息和对话类别的问题信息,所述专业类别的问题信息是指所述问题信息的内容涉及所述专业类别的知识,所述对话类别的问题信息是指所述问题信息的内容不涉及所述专业类别的知识;

当所述问题信息属于所述专业类别时,从专业语料数据库中获取与所述问题信息匹配的答复信息,所述专业语料数据库用于存储所述专业类别的语料信息;

向所述终端发送所述答复信息,所述终端用于展示所述答复信息。

第二方面,提供了一种智能问答方法,所述方法包括:

展示智能问答应用的问答界面;

在所述问答界面中,确定待答复的问题信息;

通过所述智能问答应用,向服务器发送问答请求,所述问答请求携带所述问题信息,所述服务器用于基于分类模型确定所述问题信息所属的类别,当所述问题信息属于所述专业类别时,从专业语料数据库中获取与所述问题信息匹配的答复信息,所述分类模型用于划分出专业类别的问题信息和对话类别的问题信息,所述专业语料数据库用于存储所述专业类别的语料信息,所述专业类别的问题信息是指所述问题信息的内容涉及所述专业类别的知识,所述对话类别的问题信息是指所述问题信息的内容不涉及所述专业类别的知识;

当接收到所述服务器返回的答复信息时,在所述问答界面中展示所述答复信息。

第三方面,提供了一种智能问答装置,所述装置包括:

接收模块,用于接收终端发送的问答请求,所述问答请求携带问题信息;

分类模块,用于基于分类模型确定所述问题信息所属的类别,所述分类模型用于划分出专业类别的问题信息和对话类别的问题信息,所述专业类别的问题信息是指所述问题信息的内容涉及所述专业类别的知识,所述对话类别的问题信息是指所述问题信息的内容不涉及所述专业类别的知识;

第一答复模块,用于当所述问题信息属于所述专业类别时,从专业语料数据库中获取与所述问题信息匹配的答复信息,所述专业语料数据库用于存储所述专业类别的语料信息;

发送模块,用于向所述终端发送所述答复信息,所述终端用于展示所述答复信息。

第四方面,提供了一种智能问答装置,所述装置包括:

展示模块,用于展示智能问答应用的问答界面;

确定模块,用于在所述问答界面中,确定待答复的问题信息;

发送模块,用于通过所述智能问答应用,向服务器发送问答请求,所述问答请求携带所述问题信息,所述服务器用于基于分类模型确定所述问题信息所属的类别,当所述问题信息属于所述专业类别时,从专业语料数据库中获取与所述问题信息匹配的答复信息,所述分类模型用于划分出专业类别的问题信息和对话类别的问题信息,所述专业语料数据库用于存储所述专业类别的语料信息,所述专业类别的问题信息是指所述问题信息的内容涉及所述专业类别的知识,所述对话类别的问题信息是指所述问题信息的内容不涉及所述专业类别的知识;

所述展示模块,还用于当接收到所述服务器返回的答复信息时,在所述问答界面中展示所述答复信息。

第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如第一方面所述的智能问答方法中所执行的操作。

第六方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如第二方面所述的智能问答方法中所执行的操作。

本发明实施例提供的技术方案带来的有益效果是:

本发明实施例提供的方法及装置,通过获取分类模型,分类模型用于划分出专业类别的问题信息和对话类别的问题信息,当接收到终端发送的问答请求时,基于分类模型确定问题信息所属的类别,当问题信息属于专业类别时从专业语料数据库中获取匹配的答复信息,发送给终端,提供了对专业类别的问题信息进行答复的方式,扩展了应用范围,并且基于分类模型确定问题信息所属的类别,可以识别用户提出问题的意图,从而根据用户的意图进行答复,提高了答复的精准度,提升了智能化。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种实施环境的示意图;

图2是本发明实施例提供的一种实施环境的示意图;

图3是本发明实施例提供的一种智能问答方法的流程图;

图4是本发明实施例提供的一种标识列表的示意图;

图5是本发明实施例提供的一种问答界面的示意图;

图6是本发明实施例提供的一种句法结构的示意图;

图7是本发明实施例提供的一种答复信息的示意图;

图8是本发明实施例提供的一种答复信息的示意图;

图9是本发明实施例提供的一种答复信息的示意图;

图10是本发明实施例提供的一种答复信息的示意图;

图11是本发明实施例提供的一种答复信息的示意图;

图12是本发明实施例提供的一种服务器的架构示意图;

图13是本发明实施例提供的一种智能问答装置的结构示意图;

图14是本发明实施例提供的一种智能问答装置的结构示意图;

图15是本发明实施例提供的一种终端的结构示意图;

图16是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

首先,对本发明实施例涉及的一些概念进行如下说明:

1、智能问答应用:用于答复用户提出的问题的应用,可以为在互联网应用中运行的应用,也可以为独立于互联网应用之外的应用客户端。

其中,当智能问答应用在互联网应用中运行时,开发者可以在互联网应用中为智能问答应用注册公共标识,以公共标识来识别该智能问答应用。根据开发者的不同,公共标识可以称为公众号、服务号或者企业号等。在互联网应用中运行智能问答应用后,互联网应用中的普通用户便可关注该智能问答应用的公共标识,或者与该公共标识成为好友关系。之后,互联网应用可以互联网应用中运行的智能问答应用为媒介,为普通用户实现解答问题的功能。

2、互联网应用服务器:是指与互联网应用关联的服务器。

互联网应用服务器提供了开放平台,能够基于原有的互联网应用,向第三方服务器提供接口,通过第三方服务器的接入来增强原有互联网应用的功能或扩展使用该互联网应用资源的平台。互联网应用可以是社交应用、支付应用或者其它相关应用等。

3、智能问答服务器:是指与智能问答应用关联的第三方服务器。

智能问答服务器能够接入到互联网应用服务器,基于互联网应用服务器提供的功能或资源实现解答问题的功能。

图1是本发明实施例提供的一种实施环境的示意图,该实施环境包括:终端101和服务器102,终端101和服务器102之间通过网络连接。

其中,终端101可以为手机、计算机、平板电脑等,服务器102可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。

终端101用于确定待答复的问题信息,发送给服务器102,服务器102用于获取该问题信息的答复信息,返回给终端101,从而实现为用户解答问题的功能。

在一种可能的实现方式中,终端101中运行与服务器102关联的智能问答应用,可以通过该智能问答应用与服务器102进行交互。其中,该智能问答应用可以为终端101上安装的应用客户端,也可以为在互联网应用中运行的应用。

在第一种场景下,该智能问答应用为终端101上独立安装的应用客户端,该智能问答应用为与服务器102关联的前端应用,服务器102可以称为智能问答服务器。

在第二种场景下,该智能问答应用为在互联网应用中运行的应用,参见图2,该服务器102可以包括互联网应用服务器1021和智能问答服务器1022,终端101和互联网应用服务器1021之间通过网络连接,互联网应用服务器1021和智能问答服务器1022之间通过网络连接。

互联网应用是与互联网应用服务器1021关联的前端应用,智能问答应用为智能问答服务器1022关联的前端应用。其中,该互联网应用可以为社交应用、支付应用等,相应地,互联网应用服务器可以为社交应用服务器或者支付应用服务器等。

终端101可以安装互联网应用,基于用户标识登录该互联网应用,从而与该互联网应用服务器1021进行交互,该用户标识可以为用户账号、电话号码等。

互联网应用服务器1021用于向智能问答服务器1022(第三方服务器)提供接口,智能问答服务器1022接入互联网应用服务器1021后,智能问答应用可在互联网应用服务器1021上注册公共标识,从而基于该公共标识与该互联网应用服务器1021进行交互,并使用该互联网应用服务器1021的资源为用户解答问题。

图3是本发明实施例提供的一种智能问答方法的流程图,该智能问答方法应用于上述实施例所示的实施环境中,交互主体为终端和服务器,参见图3,该方法包括:

301、终端展示智能问答应用的问答界面。

其中,该问答界面可以为html5(hypertextmarkuplanguage5,超文本标记语言)形式的页面或者其他形式的页面。

在第一种可能实现方式中,该智能问答应用可以为终端上安装的应用客户端。当用户要解答问题时,在终端上触发启动智能问答应用的操作,终端检测到该启动操作时,启动该智能问答应用,并显示该智能问答应用的问答界面。

在第二种可能实现方式中,终端安装互联网应用,该智能问答应用可以在互联网应用中运行。

开发者可以为智能问答应用注册公共标识,该公共标识作为智能问答应用的入口,用于标识该智能问答应用,并且还作为智能问答应用的媒介,连接着用户与智能问答应用。该公共标识可以为智能问答应用的名称、应用编号等。终端可以通过互联网应用并基于登录的用户标识关注该公共标识,则与该用户标识关联的标识列表中即包括该公共标识,当终端通过该互联网应用显示标识列表时,用户可以查看该公共标识,触发对该公共标识的选择操作,该终端检测到对该标识列表中该公共标识的选择操作时,通过智能问答应用展示该问答界面。

其中,终端关注该公共标识时,具体可以通过在互联网应用中搜索该公共标识来关注该公共标识,或者通过在互联网应用中扫描该公共标识的二维码来关注该公共标识。

其中,该标识列表中可以包括该终端关注的一个或多个公共标识,也可以包括该终端的用户关系链中的一个或多个用户标识,如用户的好友、联系人等,还可以包括服务器为该终端提供的服务标识,如天气预报标识等。

参见图4,该标识列表中包括用户的好友以及关注的公共标识,其中的公共标识“微问答”用于为用户解答问题,当用户点击该公共标识“微问答”时,展示如图5所示的问答界面。

302、终端在问答界面中确定待答复的问题信息,通过智能问答应用向服务器发送问答请求。其中,该问答请求携带问题信息,且该问答请求用于请求服务器对问题信息进行答复。

在第一种可能实现方式中,用户可以在该问答界面中输入问题信息,由终端获取输入的问题信息。

问题信息可以包括多种格式,如文本、图片、视频、音频等。对于不同格式的问题信息,其输入方式也不同。例如,问答界面中包括输入栏,用户可以在输入栏中输入文本格式的问题信息;问答界面中还可以包括音频输入按键,用户在按下音频输入按键时可以输入音频格式的问题信息。

在第二种可能实现方式中,终端在问答界面中展示问题信息列表,该问题信息列表包括已设定的多条问题信息,用户可以从中选择要答复的问题信息,由终端获取用户选择的问题信息。其中,该问题信息列表可以由服务器默认设定,或者在对出现次数较多的问题信息进行统计后确定。

当然,也可以将上述两种可能实现方式进行结合以确定问题信息,即终端在问答界面中展示问题信息列表,此时用户可以从问题信息列表中选择问题信息,或者也可以在问答界面中输入问题信息。

303、服务器接收到问答请求时,基于分类模型确定问题信息所属的类别。

基于上述步骤301的第一种可能实现方式,该智能问答应用为终端上安装的应用客户端时,该服务器为与智能问答应用关联的智能问答服务器。

基于上述步骤301的第二种可能实现方式,该智能问答应用在互联网应用中运行时,该服务器与互联网应用关联,也与智能问答应用关联。例如,该服务器可以包括与互联网应用关联的互联网应用服务器和与智能问答应用关联的智能问答服务器。

本发明实施例中,服务器可以针对专业类别的问题信息和对话类别的问题信息进行答复。其中,专业类别的问题信息是指问题信息的内容属于专业类别的内容,需要根据专业类别的知识进行答复,该专业类别可以为计算机技术类、证券类、化学类等。而对话类别的问题信息是指问题信息的内容属于日常对话内容,不涉及专业类别的知识。

实际应用中,用户可以根据不同的需求确定不同类别的问题信息。例如当用户希望对专业类别的问题进行解答时,输入专业类别的问题信息,当用户希望与智能问答应用闲聊时,输入对话类别的问题信息。相应地,为了满足用户的不同需求,本发明实施例提供了不同的答复方式,当用户提出的问题信息为专业类别的问题信息时,根据专业类别的相关知识为用户提供专业化的答复信息,当用户提出的问题信息为对话类别的问题信息时,与用户进行闲聊式的对话。

因此,当服务器接收到问答请求时,先基于分类模型确定问题信息所属的类别,之后即可按照该问题信息所属的类别对应的答复方式进行答复。

其中,分类模型用于划分出专业类别的问题信息和对话类别的问题信息,根据该分类模型可以确定问题信息是属于专业类别还是属于对话类别。该分类模型可以根据采集的多个样本问题信息及其所属的类别,采用机器学习算法进行训练得到,该机器学习算法可以为支持向量机算法或者其他算法等。

在一种可能实现方式中,在训练分类模型的过程中,可以采集多个样本问题信息及其所属的类别,对每个样本问题信息进行分词后得到每个样本问题信息的多个词组,根据词组的特征构造每个样本问题信息的特征向量,从而根据多个样本问题信息的特征向量和所属的类别训练出该分类模型,该分类模型即可根据问题信息的特征向量确定对应的类别。

相应的,服务器接收到问答请求时,可以先对问题信息进行分词,得到问题信息中的多个词组,根据多个词组中每个词组的特征,构造特征向量,将特征向量输入到分类模型中,即可基于分类模型确定特征向量的类别,该类别即为问题信息所属的类别。

其中,上述分词过程可以基于分词模型进行,该分词模型可以为条件随机场模型、隐马尔科夫模型等。例如,问题信息为“什么是可用资金”,在完成分词之后可以得到多个词组“什么”、“是”、“可用”、“资金”。

其中,考虑到用户输入问题信息时可能会由于输入错误而导致问题信息中包括错误的词组,则为了提高准确性,服务器可以设置同义词数据库,该同义词数据库中设置了一些词组对应的同义词,这些同义词是词组纠错后得到的正确词组。那么,在对问题信息进行分词之前,服务器可以先对问题信息进行同义词替换,根据同义词数据库,将问题信息中包括的词组替换为对应的同义词,之后再进行分词。例如,用户输入的问题信息为“银行估价多少”,此时可以自动地将问题信息纠正为“银行股价多少”。采用同义词替换的方式可以识别用户的错别字,实现纠错功能,将问题信息定位到正确的语义情境中,以便给出符合用户预期的答复。

另外,考虑到问题信息中包含一些没有实际语义的助词,为了避免这些助词的干扰,以进一步提高答复的准确性,在对问题信息进行分词之后,可以保留具有实际语义的词组,去除掉其他词组,根据保留的词组的特征构造特征向量。

本发明实施例采用分类模型对问题信息进行分类,能够识别用户的意图是要针对专业类别的问题进行咨询还是要进行闲聊,以便根据用户的意图给出用户满意的答复。进一步地,采用机器学习算法训练分类模型,可以提高准确度,更加精准地理解用户的意图。

304、当问题信息属于专业类别时,服务器从专业语料数据库中获取与问题信息匹配的答复信息,执行步骤306。

当问题信息属于专业类别时,采用检索模式获取答复信息,检索模式是指设置专业语料数据库,当接收到输入的问题信息后,通过在专业语料数据库中以检索匹配的方式进行答复信息的提取。

专业语料数据库用于存储专业类别的语料信息,该语料信息可以包括文本信息、图片信息、视频信息、音频信息和链接信息等多种类型。该专业语料数据库中的语料信息可以采用爬虫下载技术从互联网中获得,也可以根据该智能问答应用提供的功能可能会涉及的语料信息进行设置,或者也可以采用其他方式获得,并且在应用过程中还可以不断地积累用户提出的问题,扩展专业类别的相关知识,并对专业语料数据库进行更新,以使语料信息越来越全面充分,后续能够更加精准地为用户解答问题。在获得语料信息之后,可以采用人工方式进行审核,以确保语料信息的质量。对于其中错误的语料信息,可以采用人工方式进行编辑纠错,以得到正确的语料信息。

例如,以专业类别为证券类别为例,采用爬虫下载技术获得的语料信息可以如下表1所示。

表1

专业语料数据库中的语料信息可以包括相互匹配的问题语料信息和答复语料信息,也即是可以预先设置问题模板以及对应的答案,作为语料信息存储于专业语料数据库中。那么,服务器确定问题信息属于专业类别时,可以在专业语料数据库中检索出与问题信息匹配的问题语料信息,从而将该问题语料信息匹配的答复语料信息作为该问题信息的答复信息。

例如,以专业类别为证券类别为例,该语料信息中的问题语料信息和答复语料信息可以如下表2所示。

表2

如果从专业语料数据库中检索到与问题信息匹配的多个问题语料信息,可以将任一个问题语料信息匹配的答复语料信息作为该问题信息的答复信息,或者,也可以获取多个问题语料信息中每个问题语料信息与问题信息的关联度,关联度表示问题语料信息与问题信息的相似程度,关联度越大表示问题语料信息与问题信息越相似,越可能是相同的问题。因此,确定多个问题语料信息中与问题信息的关联度最大的问题语料信息,即可认为是与该问题信息最为相似的问题语料信息,将关联度最大的问题语料信息匹配的答复语料信息确定为与问题信息匹配的答复信息。

其中,获取问题语料信息与问题信息的关联度时,可以获取问题语料信息与问题信息的语义关联度、词性关联度和句法结构关联度中的至少一项,根据语义关联度、词性关联度和句法结构关联度中的至少一项,获取问题语料信息与问题信息的关联度。

语义关联度用于表示问题语料信息与问题信息在语义上的相似程度,语义关联度越大表示问题语料信息与问题信息的语义越可能相同。计算语义关联度时,可以对问题语料信息和问题信息进行分词,根据问题语料信息中的词组与问题信息中的词组之间的相似度计算语义关联度。其中任两个词组之间的相似度可以为这两个词组的整体特征向量之间的距离的倒数,词组的整体特征向量是指由词组在多个维度上的特征所组成的向量,如由词组的词性特征、语义特征、出现次数特征构成的向量,两个词组的整体特征向量距离越小表示这两个整体特征向量越相似,则这两个词组越相似。例如“沪市”和“上海”的相似度为0.85,“沪市”和“深市”的相似度为0.8,表示“沪市”和“上海”这两个词组更为相似。

词性关联度用于表示问题语料信息中的词组与问题信息的词组在词性上的相似程度,词性关联度越大表示问题语料信息与问题信息中词组的词性越可能相同,则问题语料信息与问题信息越可能是相同的问题。计算词性关联度时,可以对问题语料信息和问题信息进行分词,获取问题语料信息中各个词组的词性,如各个词组是动词、名词还是形容词等,根据问题语料信息中各个词组的词性构成词性特征向量,并获取问题信息中各个词组的词性,根据问题信息中各个词组的词性构成词性特征向量,通过计算问题语料信息的词性特征向量与问题信息的词性特征向量之间的距离的倒数得到词性关联度。

句法结构关联度用于表示问题语料信息中多个词组构成的句法结构与问题信息中多个词组构成的句法结构的相似程度。句法结构关联度越大表示问题语料信息与问题信息中词组构成的句法结构越可能相同,则问题语料信息与问题信息越可能是相同的问题。计算句法结构关联度时,可以根据问题语料信息中各个词组构成的句法结构构造句法结构特征向量,根据问题信息中各个词组构成的句法结构构造句法结构特征向量,通过计算问题语料信息的句法结构特征向量与问题信息的句法结构特征向量之间的距离的倒数可以得到句法结构关联度。

参见图6,问题信息为“什么是可用资金”,问题语料信息为“可用资金在哪看”,两者分词后得到的各个词组之间构成的句法结构如图6所示,根据确定的句法结构可以计算两者的句法结构相似度。

获取到语义关联度、词性关联度和句法结构关联度中的任一项后,可以将获取的关联度作为问题语料信息与问题信息的关联度。或者,获取到语义关联度、词性关联度和句法结构关联度中的多项后,可以对多项关联度进行统计,如求取和值、进行加权求和或者求取平均值等,将得到的统计值作为问题语料信息与问题信息的关联度。

上述获取关联度的过程,实现了对问题语料信息的打分排序,从而能够将打分最高的问题语料信息匹配的答复语料信息作为答复信息,能够更加精确地答复用户的问题。

考虑到针对不同的用户,一个问题可以有不同的答案,为了更好地满足用户的个性化需求,对于专业语料数据库中的每个问题语料信息,可以针对可能出现的多种用户设置不同的答复语料信息,为用户解答问题时可以根据当前用户的实际情况确定匹配的答复信息。

在一种可能实现方式中,专业语料数据库中的语料信息包括问题语料信息和匹配的多个答复语料信息,多个答复语料信息中每个答复语料信息对应的用户状态信息不同。则服务器可以获取终端的用户状态信息,并从专业语料数据库中检索与问题信息匹配的问题语料信息,确定与问题语料信息匹配的多个答复语料信息,将多个答复语料信息中与用户状态信息对应的答复语料信息确定为与问题信息匹配的答复信息。

其中,检索与问题信息匹配的问题语料信息时,可以获取与问题信息的关联度最大的问题语料信息,具体过程在此不再赘述。

其中,在该专业类别下可以划分多个状态,用户状态信息用于表示在专业类别下用户当前所处的状态,可以根据用户的终端执行的操作确定,而服务器可以根据终端执行的操作确定用户状态信息,并将终端登录的用户标识与终端的用户状态信息对应存储,当终端执行了切换状态的操作时,服务器还可以对终端登录的用户标识对应存储的用户状态信息进行更新。例如,在证券领域中,用户的状态可以包括未开户、已开户等多种状态,当终端执行开户操作成功时,将终端的用户状态信息从未开户状态更新为已开户状态。

专业语料数据库中针对一个问题语料信息,为处于不同状态的用户设定了不同的答复语料信息,则多个答复语料信息中与终端的用户状态信息对应的答复语料信息即可认为是最符合用户预期的答案,因此将与用户状态信息对应的答复语料信息确定为与问题信息匹配的答复信息。

在另一种可能实现方式中,专业语料数据库中的语料信息包括问题语料信息和匹配的多个答复语料信息,多个答复语料信息中每个答复语料信息对应的用户属性信息不同。则服务器可以获取终端的用户属性信息,用户属性信息用于对终端的用户进行描述,从专业语料数据库中检索与问题信息匹配的问题语料信息,确定与问题语料信息匹配的多个答复语料信息,将多个答复语料信息中与用户属性信息对应的答复语料信息确定为与问题信息匹配的答复信息。

其中,检索与问题信息匹配的问题语料信息时,可以获取与问题信息的关联度最大的问题语料信息,具体过程在此不再赘述。

其中,该用户属性信息可以包括用户的年龄、性别、喜好等一项或多项信息,相当于为用户刻画的画像,该用户属性信息可以对用户进行描述,根据用户属性信息可以确定用户所属的用户群体。专业语料数据库中针对一个问题语料信息,为不同的用户群体设定了不同的答复语料信息,能够模拟不同用户群组的性格和答复语气,则多个答复语料信息中与终端的用户属性信息对应的答复语料信息即可认为是最符合用户预期的答案,因此将与用户属性信息对应的答复语料信息确定为与问题信息匹配的答复信息。

需要说明的是,本发明实施例中涉及的专业类别可以为某一种特定的专业类别,则该智能问答应用可以为用户解答特定专业类别的问题,或者该专业类别也可以包括多种专业类别,则该智能问答应用可以作为一个综合型问答应用,为用户解答各种专业类别的问题。

305、当问题信息属于对话类别时,服务器基于问答模型获取问题信息匹配的答复信息,执行步骤306。

当问题信息属于对话类别时,采用生成模式获取答复信息,生成模式是指在接收到输入的问题信息后采用一定的技术手段自动生成匹配的答复信息。

其中,该问答模型用于为输入的问题信息生成匹配的答复信息,可以根据采集的对话语料信息,采用机器学习算法进行训练得到。该机器学习算法可以为torch深度学习算法,或者其他算法等。

torch深度学习算法采用sequencetosequence(语句到语句)的算法模型自动地根据输入语句生成答复语句。例如,输入的问题信息“areyoufreetomorrow?”在进行分词以后就变成“are”、“you”、“free”、“tomorrow”,在将分词结果输入到sequencetosequence模型后,得到输出“yes”、“what’s”、“up”,构成答复信息“yes,what’sup”。

306、服务器向终端发送答复信息。

当服务器执行上述步骤304或者305获取到答复信息时,可以通过该智能问答应用向终端发送答复信息。

307、终端接收到答复信息时,在问答界面中展示答复信息。

终端展示答复信息时,可以将该问题信息与该答复信息以对话的形式进行展示,模拟两个用户之间进行对话的效果。

本发明实施例提供的方法,通过获取分类模型,分类模型用于划分出专业类别的问题信息和对话类别的问题信息,当接收到终端发送的问答请求时,基于分类模型确定问题信息所属的类别,当问题信息属于专业类别时从专业语料数据库中获取匹配的答复信息,发送给终端,当问题信息属于对话类别时基于分类模型获取匹配的答复信息,提供了对专业类别和对话类别的问题信息进行答复的方式,扩展了应用范围,并且基于分类模型确定问题信息所属的类别,可以识别用户提出问题的意图,从而根据用户的意图进行答复,提高了答复的精准度,提升了智能化。

本发明实施例应用于用户与智能问答应用进行问答的场景下,用户提出问题信息后,由智能问答应用为用户提供答复信息。

在用户提出专业类别的问题信息时,可以根据专业类别的相关知识进行解答,对用户进行相关的知识教育和指导。而在用户提出对话类别的问题信息时,可以与用户进行闲聊式的对话。

其中,专业类别为证券类别时,本发明实施例可以根据投资者的状态线上答复投资者提出的问题,并与投资者的知识教育功能相结合,为投资者解答证券行业的相关问题,提示相关入市风险,为投资者提供了一个系统学习知识的环境。同时还能够与投资者进行闲聊式的对话,满足用户的情感诉求。

例如,用户在问答界面中输入问题信息“怎么开户”,如果此时用户还处于未开户的状态,则返回的答复信息如图7所示,该答复信息中不仅包括开户流程介绍,还包括链接地址“立即去开户”,用户点击该链接地址即可发起开户流程。通过在答复信息中包含功能入口,使用户直接通过功能入口触发操作,而无需查找该功能入口,缩短了用户的操作路径。

用户在问答界面中输入问题信息“怎么开户”,如果此时用户处于已开户的状态,则返回的答复信息如图8所示,该答复信息提示用户已经开户成功。

参见图9,用户在问答界面中输入问题信息“什么是价格优先”,返回的答复信息如图9所示,对“价格优先”的概念进行了说明和举例,以便用户了解价格优先的含义,起到了为用户传授证券类专业知识的作用。

参见图10,用户在问答界面中输入问题信息“0xxxx4(股票代码)”,可以返回相应股票的行情信息,供用户查看。

参见图11,用户在问答界面中输入问题信息“我中签啦”,该问题信息不属于证券领域,而是闲聊式的语句,此时返回的答复信息为“恭喜,发个红包庆祝一下吧”,能够与用户闲聊,满足用户的情感诉求。

图12是本发明实施例提供的一种服务器的架构示意图,基于图12所示的架构,整个问答方法的操作流程包括离线流程和在线流程,其中离线流程主要用于加载数据到系统内存中,在线流程主要用于根据系统内存中的数据进行答复。

离线流程包括以下步骤:

1、采用爬虫下载技术或者数据积累构建专业语料数据库,包括专业模板,专业词汇,专业同义词等。

2、利用torch深度学习模块对闲聊时的对话语料进行训练,得到离线的问答模型。

3、离线索引模块将问答模型和专业语料数据库加载到系统内存中,供检索模块在线检索时调用内存中的数据,快速地进行问答服务。

在线流程包括以下步骤:

1、接收用户的问答请求,发送给分词模块。

2、分词模块将用户的问题进行同义词替换后再进行分词,将分词结果发送给用户意图理解模块,由用户意图理解模块识别用户的问题属于普通闲聊的问题还是专业领域咨询的问题。

3、确定用户的意图之后,检索模块检索出候选答案。

4、排序模块依次对每个候选答案进行打分,按照打分进行排序,选择分数最高的候选答案。

本发明实施例提供的智能问答方法,整体上既能够满足用户普通的闲聊时聊天对话、情感倾诉等诉求,又能够满足用户对于专业类别的基础知识的咨询、学习和了解的需求。该智能问答方法同时兼顾了基于检索模式的答复方式和基于生成式的答复方式,既能够将现有的知识库提供给用户,也能够对用户的闲聊式语句进行自动地回答,增强了趣味性。

采用本发明实施例提供的智能问答方法可以使用机器客服有效地替代人工客服,大量节约了人工客服的数量和服务时间。而且,机器客服可以全天候24小时地为用户提供服务,解决了传统人工客服的服务时间的限制,并且机器客服在问答过程中不会产生任何主观情绪,在任何情况下均可提供客观优质的服务,提升了用户体验。

当然,上述智能问答方法也可以与人工问答的方式兼容,根据用户数量和用户特性,合理、智能地分配机器客服和人工客服,既能够让用户享受机器客服带来的实时性和便捷性,又能享受人工客服带来的真实感和个性化的服务。

图13是本发明实施例提供的一种智能问答装置的结构示意图。参见图13,该装置包括:

接收模块1301,用于接收终端发送的问答请求;

分类模块1302,用于执行上述步骤303中的分类过程;

第一答复模块1303,用于执行上述步骤304;

发送模块1304,用于执行上述步骤306。

可选地,装置还包括:

第二答复模块,用于执行上述步骤305。

可选地,第一答复模块1303还用于执行上述图3所示实施例中根据关联度确定答复信息的过程。

可选地,第一答复模块1303还用于执行上述图3所示实施例中根据用户状态信息确定答复信息的过程。

可选地,第一答复模块1303还用于执行上述图3所示实施例中根据用户属性信息确定答复信息的过程。

图14是本发明实施例提供的一种智能问答装置的结构示意图。参见图14,该装置包括:

展示模块1401,用于执行上述步骤301和上述步骤307;

确定模块1402,用于执行上述步骤302中确定问题信息的过程;

发送模块1403,用于执行上述步骤302中发送问答请求的过程。

可选地,展示模块1401,还用于展示上述图3所示实施例中的标识列表,并在检测到对公共标识的选择操作时,展示上述图3所示实施例中的问答界面。

需要说明的是:上述实施例提供的智能问答装置在进行问答时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将终端和服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的智能问答装置与智能问答方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图15是本发明实施例提供的一种终端的结构示意图。该终端可以用于实施上述实施例所示出的智能问答方法中的终端所执行的功能。具体来讲:

终端1500可以包括rf(radiofrequency,射频)电路110、包括有一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、传输模块170、包括有一个或者一个以上处理核心的处理器180、以及电源190等部件。本领域技术人员可以理解,图15中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

rf电路110可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器180处理;另外,将涉及上行的数据发送给基站。通常,rf电路110包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(sim)卡、收发信机、耦合器、lna(lownoiseamplifier,低噪声放大器)、双工器等。此外,rf电路110还可以通过无线通信与网络和其他终端通信。所述无线通信可以使用任一通信标准或协议,包括但不限于gsm(globalsystemofmobilecommunication,全球移动通讯系统)、gprs(generalpacketradioservice,通用分组无线服务)、cdma(codedivisionmultipleaccess,码分多址)、wcdma(widebandcodedivisionmultipleaccess,宽带码分多址)、lte(longtermevolution,长期演进)、电子邮件、sms(shortmessagingservice,短消息服务)等。

存储器120可用于存储软件程序以及模块,如上述示例性实施例所示出的终端所对应的软件程序以及模块,处理器180通过运行存储在存储器120的软件程序以及模块,从而执行各种功能应用以及数据处理,如实现基于视频的交互等。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端1500的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器180和输入单元130对存储器120的访问。

输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131以及其他输入终端132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的链接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入终端132。具体地,其他输入终端132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端1500的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用lcd(liquidcrystaldisplay,液晶显示器)、oled(organiclight-emittingdiode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图15中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。

终端1500还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在终端1500移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端1500还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

音频电路160、扬声器161,传声器162可提供用户与终端1500之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器161,由扬声器161转换为声音信号输出;另一方面,传声器162将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经rf电路110以发送给比如另一终端,或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔,以提供外设耳机与终端1500的通信。

终端1500通过传输模块170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线或有线的宽带互联网访问。虽然图15示出了传输模块170,但是可以理解的是,其并不属于终端1500的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。

处理器180是终端1500的控制中心,利用各种接口和线路链接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行终端1500的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;优选的,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。

终端1500还包括给各个部件供电的电源190(比如电池),优选的,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管未示出,终端1500还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端1500的显示单元是触摸屏显示器,终端1500还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行上述一个或者一个以上程序包含用于实施上述实施例中终端所执行操作的指令。

本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令,该指令由处理器加载并执行以实现上述实施例中终端所执行的操作。

图16是本发明实施例提供的一种服务器的结构示意图,该服务器1600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,cpu)1622(例如,一个或一个以上处理器)和存储器1632,一个或一个以上存储应用程序1642或数据1644的存储介质1630(例如一个或一个以上海量存储设备)。其中,存储器1632和存储介质1630可以是短暂存储或持久存储。存储在存储介质1630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1622可以设置为与存储介质1630通信,在服务器1600上执行存储介质1630中的一系列指令操作。

服务器1600还可以包括一个或一个以上电源1626,一个或一个以上有线或无线网络接口1650,一个或一个以上输入输出接口1658,一个或一个以上键盘1656,和/或,一个或一个以上操作系统1641,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

该服务器1600可以用于执行上述实施例提供的智能问答方法中服务器所执行的步骤。

本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令,该指令由处理器加载并执行以实现上述实施例中服务器所执行的操作。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1