智能应答方法、装置、系统及电子设备的制造方法

文档序号:10534848阅读:360来源:国知局
智能应答方法、装置、系统及电子设备的制造方法
【专利摘要】本发明公开了一种智能应答方法、装置、系统及电子设备。其中所述智能应答方法包括:获取对应特定待回答问题的被提问者评价为不符合要求的原始答案;以所述不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索,以获取所述待回答问题的改进答案。采用本申请提供的方法,使得在查询检索到与待回答问题直接对应的答案后,还能够根据提问者选择的不符合要求的原始答案进行二次检索,获取待回答问题的改进答案。由于提问者对原始答案的选择反映了提问者对答案的需求,可以将其作为新的检索依据。因此,本方法通过引入新的检索依据,能够提高答案的覆盖面以及准确率。
【专利说明】
智能应答方法、装置、系统及电子设备
技术领域
[0001]本申请涉及互联网技术领域,具体涉及一种智能应答方法和装置。本申请同时涉及一种智能应答系统,以及一种电子设备。
【背景技术】
[0002]随着互联网的快速发展,客户获取信息与知识的首选渠道已经由传统电话、短信变换为即时通讯、微博、微信、网站等新渠道。随着新渠道的各种应用增加,面对大量的咨询查询量,如何利用知识点库更好的服务客户成为一个研究热点。
[0003]在线客服系统是一个网页聊天系统,连接“有疑问的客户”和“解决问题的服务人员”,该系统采用“问答机器人”和“人工服务”共同服务客户的方式。客服的“问答机器人”,实现自动化、智能化、人性化、个性化的机器人自助答疑功能,突破时间、人力、地域限制,提供7*24小时不间断咨询服务,分担“人工服务”工作量,节省企业用人成本,提高企业服务质量。当机器人自动回答用户的问题无法满足用户的时候,会转到人工服务。在线客服系统会已经成为网络营销的重要工具,也是提升企业网站形象,加强企业与访客互动的必备工具。
[0004]机器人与知识点库的整合应用使机器人可以从知识点库迅速获取相应答案,快速、准确的响应客户咨询。最终用户通过多种渠道终端,如微信、短信、QQ等进行自然语言提问,问题如果是语音则通过ASR服务转化为文字,提问的文字信息传递给智能机器人引擎进行自然语言理解,分析出关键词定位到知识点,由渠道知识点库返回知识点具体内容。
[0005]目前,机器人根据问题获取匹配知识点通常采用一次检索的方法,即:以“一问一答”的维度,解决用户的问题。在知识点库质量不变的情况下,“问”和“答”之间的关联关系,按照现有文本识别算法的优化程度,已经难以提升机器人解决用户问题的数量。通过一次检索的查询方式解决问题,机器人在优化上已经遇到了提升瓶颈,再优化效果欠佳。
[0006]因此,现有技术存在通过一次检索的方法从知识点库中获取与问题匹配的知识点已经难以提高回答正确率的问题。

【发明内容】

[0007]本申请提供一种智能应答方法和装置,以解决现有技术存在通过一次检索的方法从知识点库中获取与问题匹配的知识点已经难以提高回答正确率的问题。本申请另外提供一种智能应答系统,以及一种电子设备。
[0008]本申请提供一种智能应答方法,其特征在于,包括:
[0009]获取对应特定待回答问题的被提问者评价为不符合要求的原始答案;
[0010]以所述不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索,以获取所述待回答问题的改进答案;所述知识点包括标题和内容。
[0011]可选的,所述不符合要求的原始答案包括标题;
[0012]所述预定的标准包括:与所述不符合要求的原始答案的标题相似度最高。
[0013]可选的,若与所述不符合要求的原始答案的标题相似度最高的知识点有多个,则选择更新时间距离当前时间最近的知识点作为所述改进答案。
[0014]可选的,所述不符合要求的原始答案包括标题;
[0015]所述预定的标准包括:
[0016]找出与所述不符合要求的原始答案的标题相似度最高的知识点作为候选知识占.V,
[0017]判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同;
[0018]若是,则排除该候选知识点,在剩余知识点中找出标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤;
[0019]若否,则将所述候选知识点作为所述改进答案。
[0020]可选的,所述预定的标准包括:与所述不符合要求的原始答案的内容中的段落标题相似度最高。
[0021 ] 可选的,若与所述不符合要求的原始答案的内容中的段落标题相似度最高的知识点有多个,则选择更新时间距离当前时间最近的知识点作为所述改进答案。
[0022]可选的,所述预定的标准包括:
[0023]找出与所述不符合要求的原始答案的内容中的段落标题相似度最高的知识点作为候选知识点;
[0024]判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同;
[0025]若是,则排除该候选知识点,在剩余知识点中找出内容中的段落标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤;
[0026]若否,则将所述候选知识点作为所述改进答案。
[0027]可选的,所述预定的标准包括:根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度,计算整体相似度,以所述整体相似度与所述不符合要求的原始答案最接近的知识点作为改进知识点;所述整体相似度采用如下计算公式:
[0028]W = X*N1+Y*N2 - Z*N3
[0029]其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重。
[0030]可选的,所述预定的标准包括:
[0031]判断当前时间与知识点的最近更新时间的时间间隔是否小于等于第一预设时间间隔;
[0032]若上述判断结果为是,则根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度,以及所述当前时间与所述知识点的最近更新时间的时间间隔,计算整体相似度,以所述整体相似度与所述不符合要求的原始答案最接近的知识点作为改进知识点;所述整体相似度采用如下计算公式:
[0033]W = X*N1+Y*N2 - Z*N 3+N4* (Ts_t)
[0034]其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重,N4为预设的时间权重,Ts为所述第一预设时间间隔,t为所述当前时间与所述知识点的最近更新时间的时间间隔。
[0035]可选的,所述预定的标准包括:仅将规定时间阈值范围内更新的知识点作为检索获取所述改进答案的范围;所述时间阈值为当前时间与所述知识点的最近更新时间的时间间隔长度的预设值。
[0036]可选的,其特征在于,在所述以预定的标准在预存的知识点集合中检索获取所述待回答问题的改进答案之前,还包括:
[0037]计算并存储任意两个知识点的所述标题相似度。
[0038]可选的,根据第二预设时间间隔或者当更新所述知识点时,计算并存储任意两个知识点的所述标题相似度。
[0039]可选的,所述计算任意两个知识点的所述标题相似度包括:
[0040]解析第一知识点和第二知识点的标题,获取所述第一知识点和第二知识点的标题各自包括的预先定义的关键词,分别作为第一标题关键词集合和第二标题关键词集合;
[0041]根据所述第一标题关键词集合和第二标题关键词集合,计算所述第一知识点和第二知识点的标题相似度。
[0042]可选的,所述标题相似度采用下述公式计算获取:
[0043]X(A,B) = IA H B I / IA U B
[0044]其中,A为所述第一标题关键词集合,B为所述第二标题关键词集合,X(A,B)为所述标题相似度。
[0045]可选的,在所述以预定的标准在预存的知识点集合中检索获取所述待回答问题的改进答案之前,还包括:
[0046]计算并存储任意两个知识点的所述内容中的段落标题相似度。
[0047]可选的,根据第二预设时间间隔或者当更新所述知识点时,计算并存储任意两个知识点的所述内容中的段落标题相似度。
[0048]可选的,所述计算任意两个知识点的所述内容中的段落标题相似度包括:
[0049]解析第一知识点与第二知识点的所述段落标题,获取所述第一知识点与第二知识点的所述段落标题各自包括的预先定义的关键词,将所述第一知识点的所述段落标题包括的关键词作为第一段落标题的关键词集合,将所述第二知识点的所述段落标题包括的关键词作为第二段落标题的关键词集合;
[0050]根据所述第一段落标题的关键词集合和第二段落标题的关键词集合,计算所述第一知识点与第二知识点的内容中的段落标题相似度。
[0051]可选的,所述内容中的段落标题相似度采用下述公式计算获取:
[0052]Y (C,D) = I C n D I / I C U D
[0053]其中,C为所述第一段落标题的关键词集合,D为所述第二段落标题的关键词集合,Y(C,D)为所述内容中的段落标题相似度。
[0054]可选的,在所述以预定的标准在预存的知识点集合中检索获取所述待回答问题的改进答案之前,还包括:
[0055]计算并存储任意两个知识点的所述内容中的统一资源定位器相似度。
[0056]可选的,根据第二预设时间间隔或者当更新所述知识点时,计算并存储任意两个知识点的所述内容中的统一资源定位器相似度。
[0057]可选的,所述计算任意两个知识点的所述内容中的统一资源定位器相似度包括:
[0058]解析第一知识点与第二知识点的各个内容,获取所述第一知识点与第二知识点的各自包括的统一资源定位器,分别作为第一统一资源定位器集合和第二统一资源定位器集合;
[0059]根据所述第一统一资源定位器集合和第二统一资源定位器集合,计算所述第一知识点与第二知识点的所述统一资源定位器相似度。
[0060]可选的,所述统一资源定位器相似度采用下述公式计算获取:
[0061]z(e,F) = |e n f|/|e u f
[0062]其中,E为所述第一统一资源定位器集合,F为所述第二统一资源定位器集合,Z(E,F)为所述统一资源定位器相似度。
[0063]可选的,在所述以预定的标准在预存的知识点集合中检索获取所述待回答问题的改进答案之前,还包括:
[0064]计算并存储任意两个知识点的所述整体相似度。
[0065]可选的,根据第二预设时间间隔或者当更新所述知识点时,计算并存储任意两个知识点的所述整体相似度。
[0066]可选的,所述不符合要求的原始答案采用如下步骤生成:
[0067]接收客户端发送的对应所述待回答问题的询问请求;
[0068]根据所述待回答问题和预存的问答关系,获取所述待回答问题的一个或多个原始答案;
[0069]将提问者从所述一个或多个原始答案中选取的一个原始答案,作为所述不符合要求的原始答案。
[0070]可选的,所述根据所述待回答问题和预存的问答关系,获取所述待回答问题的一个或多个原始答案,包括:
[0071]解析所述待回答问题,获取所述待回答问题包括的预先定义的关键词;
[0072]根据所述关键词和所述问答关系,获取与所述关键词匹配的答案,作为所述一个或多个原始答案。
[0073]可选的,所述知识点是结构化文档。
[0074]相应的,本申请还提供一种智能应答装置,其特征在于,包括:
[0075]获取单元,用于获取对应特定待回答问题的被提问者评价为不符合要求的原始答案;
[0076]检索单元,用于以所述不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索,以获取所述待回答问题的改进答案;所述知识点包括标题和内容。
[0077]可选的,所述检索单元包括:
[0078]第一检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,以所述改进答案与所述不符合要求的原始答案的标题相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案。
[0079]可选的,所述检索单元包括:
[0080]第二检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案;
[0081]所述第二检索子单元包括:
[0082]第一查找子单元,用于找出与所述不符合要求的原始答案的标题相似度最高的知识点作为候选知识点;
[0083]判断子单元,用于判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同;
[0084]第二查找子单元,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案相同,则排除该候选知识点,在剩余知识点中找出标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤;
[0085]判定子单元,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案不相同,则将所述候选知识点作为所述改进答案。
[0086]可选的,所述检索单元包括:
[0087]第三检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,以所述改进答案与所述不符合要求的原始答案的内容中的段落标题相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案。
[0088]可选的,所述检索单元包括:
[0089]第四检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案;
[0090]所述第四检索子单元包括:
[0091]第一查找子单元,用于找出与所述不符合要求的原始答案的内容中的段落标题相似度最高的知识点作为候选知识点;
[0092]判断子单元,用于判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同;
[0093]第二查找子单元,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案相同,则排除该候选知识点,在剩余知识点中找出内容中的段落标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤;
[0094]判定子单元,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案不相同,则将所述候选知识点作为所述改进答案。
[0095]可选的,所述检索单元包括:
[0096]第五检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,以原始改进答案与所述不符合要求的原始答案的整体相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案;
[0097]所述整体相似度是根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度计算获取的;所述整体相似度采用如下计算公式:
[0098]W = X*N1+Y*N2 - Z*N3
[0099]其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重。
[0100]可选的,所述检索单元包括:
[0101]第六检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,以所述改进答案与所述不符合要求的原始答案的整体相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案;
[0102]所述整体相似度是根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度,以及所述当前时间与知识点的最近更新时间的时间间隔计算获取的;所述整体相似度采用如下计算公式:
[0103]W = X*N1+Y*N2 - Z*N3+N4*(Ts_t)
[0104]其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重,N4为预设的时间权重,Ts为第一预设时间间隔,t为所述当前时间与所述知识点的最近更新时间的时间间隔。
[0105]可选的,所述装置还包括:
[0106]第一计算子单元,用于计算任意两个知识点的所述标题相似度;
[0107]所述第一计算子单元包括:
[0108]解析子单元,用于解析第一知识点和第二知识点的标题,获取所述第一知识点和第二知识点的标题各自包括的预先定义的关键词,分别作为第一标题关键词集合和第二标题关键词集合;
[0109]计算子单元,用于根据所述第一标题关键词集合和第二标题关键词集合,计算所述第一知识点和第二知识点的标题相似度。
[0110]可选的,所述装置还包括:
[0111]第二计算子单元,用于计算任意两个知识点的所述内容中的段落标题相似度;
[0112]所述第二计算子单元包括:
[0113]解析子单元,用于解析第一知识点和第二知识点的所述段落标题,获取所述第一知识点和第二知识点的所述段落标题各自包括的预先定义的关键词,将所述第一知识点的所述段落标题包括的关键词作为第一段落标题的关键词集合,将所述第二知识点的所述段落标题包括的关键词作为第二段落标题的关键词集合;
[0114]计算子单元,用于根据所述第一段落标题的关键词集合和第二段落标题的关键词集合,计算所述第一知识点和第二知识点的内容中的段落标题相似度。
[0115]可选的,所述装置还包括:
[0116]第三计算子单元,用于计算任意两个知识点的所述内容中的统一资源定位器相似度;
[0117]所述第三计算子单元包括:
[0118]解析子单元,用于解析第一知识点和第二知识点的各个内容,获取所述第一知识点和第二知识点的各自包括的统一资源定位器,分别作为第一统一资源定位器集合和第二统一资源定位器集合;
[0119]计算子单元,用于根据所述第一统一资源定位器集合和第二统一资源定位器集合,计算所述第一知识点和第二知识点的所述统一资源定位器相似度。
[0120]可选的,所述装置还包括:
[0121]第四计算子单元,用于计算任意两个知识点的所述整体相似度。
[0122]可选的,还包括:
[0123]生成单元,用于生成所述不符合要求的原始答案;
[0124]所述生成单元包括:
[0125]接收子单元,用于接收客户端发送的对应所述待回答问题的询问请求;
[0126]获取子单元,用于根据所述待回答问题和预存的问答关系,获取所述待回答问题的一个或多个原始答案;
[0127]选取子单元,用于将提问者从所述一个或多个原始答案中选取的一个原始答案,作为所述不符合要求的原始答案。
[0128]可选的,所述获取子单元包括:
[0129]解析子单元,用于解析所述待回答问题,获取所述待回答问题包括的预先定义的关键词;
[0130]查询子单元,用于根据所述关键词和所述问答关系,获取与所述关键词匹配的答案,作为所述一个或多个原始答案。
[0131]本申请还提供一种智能应答系统,包括:根据上述任一项所述的智能应答装置。
[0132]此外,本申请还提供一种电子设备,所述电子设备包括:
[0133]显示器;
[0134]处理器;以及
[0135]存储器,所述存储器被配置成存储待回答问题,所述待回答问题被所述处理器执行时,在所述显示器显示所述待回答问题的改进答案,所述改进答案是以被提问者评价为不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索获取的,所述原始答案是根据所述待回答问题和预存的问答关系生成的。
[0136]可选的,所述知识点和所述问答关系存储在服务器端。
[0137]可选的,所述电子设备是穿戴式智能设备;所述改进答案存储在该穿戴式智能设备的存储器中。
[0138]与现有技术相比,本申请具有以下优点:
[0139]本申请提供的智能应答方法、装置、系统及电子设备,通过获取对应特定待回答问题的被提问者评价为不符合要求的原始答案,并以所述不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索,以获取所述待回答问题的改进答案,使得在查询检索到与待回答问题直接对应的答案后,还能够根据提问者选择的不符合要求的原始答案进行二次检索,获取待回答问题的改进答案。由于提问者对原始答案的选择反映了提问者对答案的需求,可以将其作为新的检索依据。因此,本方法能够在现有技术已经难以通过待回答问题本身包含的信息提高答案覆盖面和准确率的情况下,通过引入新的检索依据提高答案的覆盖面以及准确率。
【附图说明】
[0140]图1是本申请的智能应答方法实施例的流程图;
[0141]图2是本申请的智能应答方法实施例中知识点的不意图;
[0142]图3是本申请的智能应答方法实施例中计算标题相似度的具体流程图;
[0143]图4是本申请的智能应答方法实施例中步骤S103的一个具体流程图;
[0144]图5是本申请的智能应答装置实施例的示意图;
[0145]图6是本申请的智能应答装置实施例中检索单元103的具体示意图;
[0146]图7是本申请的智能应答装置实施例中第二检索单元1032的具体示意图;
[0147]图8是本申请的智能应答装置实施例的具体示意图;
[0148]图9是本申请的智能应答装置实施例中第一计算单元201的具体示意图;
[0149]图10是本申请的智能应答装置实施例中生成单元205的具体示意图;
[0150]图11是本申请的电子设备实施例的示意图。
【具体实施方式】
[0151]在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0152]在本申请中,提供了一种智能应答方法和装置,以及一种智能应答系统和电子设备。在下面的实施例中逐一进行详细说明。
[0153]本申请提供的智能应答方法,是基于这样一种设计构思,即:采用问答结果二次推荐的方式,在根据“问题”检索获取到“一次结果”后,能够自动通过“一次结果”检索“二次结果”。由于本申请提供的智能应答方法是以“结果-结果”的关联维度补充“问题-结果”的单一维度,因而能够提升解决问题的覆盖面。
[0154]请参考图1,其为本申请的智能应答方法实施例的流程图。所述方法包括如下步骤:
[0155]步骤SlOl:获取对应特定待回答问题的被提问者评价为不符合要求的原始答案。
[0156]本申请实施例所述的原始答案和改进答案均为知识点本申请实施例所述的知识点记录了解决用户某一个或某一类问题的流程、操作步骤、相关系统链接等信息。知识点包括标题和内容。在实际应用中,知识点可以是一个格式化文档,例如:web文档、word文档等;知识点还可以是非格式化文档,例如:文本文件。上述不同的知识点存储格式,都只是【具体实施方式】的变更,都不偏离本申请的核心,因此都在本申请的保护范围之内。
[0157]在本实施例中,每一个知识点均为一个web文档。请参考图2,其为本申请的智能应答方法实施例中知识点的示意图。从图2中可见,一个web文档表示的知识点包括三个部分:知识的标题、内容中的各个段落标题、内容中的统一资源定位器。其中,知识的标题表示该知识点对应的大标题,知识的标题还可以包括副标题;段落标题是一个知识点的各个组成部分的标题,即:小标题;知识点的各个组成部分的具体内容是通过统一资源定位器链接到的具体解决方案等信息。
[0158]要实施本申请提供的方法,首先要在对应特定待回答问题的回答中,获取被提问者评价为不符合要求的原始答案。通常,一个智能应答系统根据提问者提出的问题,在已有的问答关系中检索获取对应问题的“一次结果”,即:原始答案。由于问答关系是一对多的关系,因此对应提问者提出的问题,可以通过智能应答系统获取多个原始答案。“一次结果”可能包括多个原始答案,当提问者浏览完这些原始答案后,发现答案不满意的时候,可以选择将其认为大方向正确的(与提问者设想最接近)原始答案通知智能应答系统,智能应答系统再根据这个提问者指定的解决问题大方向正确的原始答案,获取改进答案。本申请实施例所述的被提问者评价为不符合要求的原始答案,即为上述“提问者指定的解决问题大方向正确的原始答案”,然而该原始答案的具体内容并不能真正解决问题。
[0159]在本实施例中,所述原始答案的生成过程分为两个步骤:1)接收客户端发送的对应所述待回答问题的询问请求;2)根据所述待回答问题和预存的问答关系,获取所述待回答问题的一个或多个原始答案。
[0160]I)接收客户端发送的对应所述待回答问题的询问请求。
[0161]本申请实施例所述的客户端包括个人电脑、PAD、iPad等终端设备,以及移动通讯设备,即:通常所说的手机或者智能手机。本申请提供的智能应答方法,其应用场景也不仅仅局限于在线客服系统中的问答结果二次推荐,在其他需要根据一次结果进行二次推荐的场景下也可以采用本申请所提供的方法,例如:如果某个应用为了提高解决方案的准确性,不仅要求根据问题检索一次结果,还需要根据一次结果推荐具有更高准确性的二次结果,在有类似检索需求的场景下都可以应用本申请提供的方法,进行问答结果二次推荐。
[0162]2)根据所述待回答问题和预存的问答关系,获取所述待回答问题的一个或多个原始答案。
[0163]在接收到客户端发送的对应待回答问题的询问请求后,根据待回答问题和预先存储的问答关系,获取待回答问题的原始答案。原始答案是根据问答关系获取的,因此原始答案实质是从“一问一答”的维度,解决提问者提出的问题。
[0164]本申请实施例所述的问答关系中的“问”是指“问题”中包括的关键词,“答”是指“答案”对应的知识点标识。在本实施例中,根据所述待回答问题和预存的问答关系,获取待回答问题的一个或多个原始答案,包括:1)解析所述待回答问题,获取所述待回答问题包括的预先定义的关键词;2)根据所述关键词和所述问答关系,获取与所述关键词匹配的答案,作为所述一个或多个原始答案。
[0165]I)解析所述待回答问题,获取所述待回答问题包括的预先定义的关键词。
[0166]在实际应用中,待回答问题的特征是由其包含的关键词表征的。因此根据问题获取答案,实质上是根据问题中包含的特征关键词获取答案。关键词是预先定义好的,存储在关键词库中。通过关键词库,可以对待回答问题进行分词处理,找到问题中包含的特征关键词。例如,待回答问题为:“怎么使用支付宝去支付? ”;关键词库中含有“名词:支付宝”、“名词:余额宝”、“动词:使用”、“动词:提现”、“动词:被盗”、“动词:支付”等内容,则对待回答问题进行分词处理后,从中能够提取出的关键词包括“名词:支付宝”、“动词:支付”、“动词:使用”。
[0167]2)根据所述关键词和所述问答关系,获取与所述关键词匹配的答案,作为所述一个或多个原始答案。
[0168]在获取到待回答问题包括的关键词后,根据关键词与答案之间的问答关系,检索获取与关键词匹配的答案。例如:问答关系i为:关键词“名词:支付宝”、“动词:支付”、“动词:使用”对应知识点m,则上述待回答问题:“怎么使用支付宝去支付? ”的原始答案包括“知识点m”。在本实施例中,通过问答关系检索到“问题”对应的知识点标识后,再根据知识点标识获取到知识点的具体内容,具体内容可以为问题的功略、解决方案、操作步骤等信息。
[0169]当用户浏览完某一个原始答案后,发现该答案无法解决问题但该答案是解决问题的大方向时,就可以以该答案为检索依据执行步骤S103,以“结果-结果”的关联维度补充“问题-结果”的单一维度,找到该原始答案的改进答案,从而提升解决问题的覆盖面。
[0170]步骤S103:以所述不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索,以获取所述待回答问题的改进答案;所述知识点包括标题和内容。
[0171]本申请实施例提供的方法,是基于这样一种判断,即:所述原始答案不符合用户的要求,无法解决问题,但原始答案是解决问题的大方向。因此,在通过“一次结果”检索“二次结果”的过程中,可以通过识别原始答案和改进答案的特征,并对二者的特征进行特征相似度计算,在原始答案无法解决用户问题的时候,给用户推荐一个更可能解决问题的改进答案。
[0172]在实际应用中,以所述不符合要求的原始答案中的信息为检索依据,在预存的知识点集合中检索,以获取所述待回答问题的改进答案时,所依据的检索标准可以有很多种具体的实施方式,下面列举本实施例中可选的部分具体标准。
[0173]I)标准一
[0174]标准一是指与所述不符合要求的原始答案的标题相似度最高。采用该标准,是将原始答案和改进答案各自的标题作为各自的特征,并根据该特征,将与原始答案的标题相似度最高的知识点作为待回答问题的改进答案。采用该标准的理论依据是:由于原始答案和改进答案的标题相似度最高,因此它们具有解决问题的最相似的大方向。例如:原始答案对应“知识点i”,改进答案对应“知识点j”,则“知识点i”和“知识点j”的标题相似度是“知识点i”与其它知识点之间的标题相似度最高的。
[0175]在实际应用中,为提高检索效率,可以预先计算并存储任意两个知识点之间的标题相似度。在检索改进答案时,对与原始答案有关联的所有标题相似度进行排序,找到标题相似度最高值对应的知识点,作为改进答案。根据具体应用情况,可以设定根据固定的时间间隔、更新知识点后触发等方式,更新任意两个知识点之间的标题相似度。例如:设定每天的固定闲时时间,更新任意两个知识点之间的标题相似度。
[0176]请参考图3,其为本申请的智能应答方法实施例中计算标题相似度的具体流程图。在本实施例中,任意两个知识点(第一知识点和第二知识点)之间的标题相似度采用如下步骤计算:
[0177]步骤S301:解析第一知识点和第二知识点的标题,获取所述第一知识点和第二知识点的标题各自包括的预先定义的关键词,分别作为第一标题关键词集合和第二标题关键词集合。
[0178]步骤S302:根据所述第一标题关键词集合和第二标题关键词集合,计算所述第一知识点和第二知识点的标题相似度。
[0179]根据所述第一标题关键词集合和第二标题关键词集合,计算第一知识点和第二知识点的标题相似度的过程,实质为衡量两个集合(第一标题关键词集合和第二标题关键词集合)的相似度。杰卡德相似系数是衡量两个集合的相似度的一种指标。在本实施例中,标题相似度采用杰卡德(Jaccard)相似系数。两个集合A和B的交集元素在A和B的并集中所占的比例,称为两个集合的杰卡德相似系数,用符号J(A,B)表示。第一知识点和第二知识点的标题相似度可以采用下述公式计算获取:
[0180]X(A,B) = IA H B I / IA U B
[0181]其中,A为所述第一标题关键词集合,B为所述第二标题关键词集合,X(A,B)为所述标题相似度。
[0182]由于与原始答案的标题相似度最高的改进答案可能为多个,为了获取最新、最相似的知识点,优选的,当与原始答案的标题相似度最高的知识点有多个时,可以选择更新时间距离当前时间最近的知识点作为改进答案。
[0183]2)标准二
[0184]请参考图4,其为本申请的智能应答方法实施例中步骤S103的一个具体流程图。以所述不符合要求的原始答案中的信息为检索依据,以标准二在预存的知识点集合中检索,以获取所述待回答问题的改进答案,包括如下步骤:
[0185]步骤S401:找出与所述不符合要求的原始答案的标题相似度最高的知识点作为候选知识点。
[0186]步骤S402:判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同。
[0187]根据标准二在预存的知识点集合中检索获取待回答问题的改进答案,主要分为两步:通过步骤S401,找出与所述不符合要求的原始答案的标题相似度最高的知识点作为候选知识点;通过步骤S402,判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同。采用该标准的理论依据是:原始答案和改进答案的大方向越近越好,而具体的解决方案越不同越好。原始答案和改进答案的大方向主要是由各自的标题决定的,而具体的解决方案取决于知识点包括的统一资源定位器的链接内容。如果原始答案与某一个知识点的标题相似度最高,但内容也相同,则显然该知识点并不适合作为改进答案。可见,相对于标准一而言,标准二是一个优化的实施方式,能够找到更为准确的改进方案。
[0188]步骤S403:若上述判断结果为是,则排除该候选知识点,在剩余知识点中找出标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤。
[0189]当判定候选知识点中包含的统一资源定位符与原始答案相同时,则将该候选知识点排除,并根据标题相似度的顺序,在剩余知识点中找出标题相似度最高的知识点作为新的候选知识点,判断新的候选知识点中包含的统一资源定位符是否与原始答案相同。例如:原始答案对应“知识点i”,与其标题相似度最高的知识点为“知识点j”,而“知识点i”和“知识点j”的统一资源定位器相同,即:“知识点i”和“知识点j”的具体内容是相同的,则将“知识点j”排除,在剩余知识点中找出标题相似度最高的知识点作为下一个候选知识点,继续查找改进答案。
[0190]步骤S404:若上述判断结果为否,则将所述候选知识点作为所述改进答案。
[0191]当判定候选知识点中包含的统一资源定位符与原始答案不相同时,则说明该候选知识点与原始答案的解决方案不同,而且大方向较为一致,可以将该知识点作为改进答案。
[0192]3)标准三
[0193]标准三是指与所述不符合要求的原始答案的内容中的段落标题相似度最高。采用该标准,是将原始答案和改进答案各自的内容中的段落标题作为各自的特征,并根据该特征,将与原始答案的内容中的段落标题相似度最高的知识点作为待回答问题的改进答案。
[0194]判断原始答案和改进答案的大方向是否近似的依据,既可以为知识点的标题,也可以是知识点的内容中的段落标题。因此,标准三的理论依据与标准一的理论依据类似:由于原始答案和改进答案的内容中的段落标题相似度最高,因此它们具有解决问题的最相似的大方向。相对于标准一而言,标准三仅仅将特征由标准一的“标题”变更为“内容中的段落标题”。标准三与标准一实施例内容相同的部分不再赘述,请参见标准一实施例中的相应部分。
[0195]在实际应用中,为提高检索效率,可以预先计算并存储任意两个知识点之间的内容中的段落标题相似度。在检索改进答案时,对与原始答案有关联的所有内容中的段落标题相似度进行排序,找到内容中的段落标题相似度最高值对应的知识点,作为改进答案。根据具体应用情况,可以设定根据固定的时间间隔、更新知识点后触发等方式,更新任意两个知识点之间的内容中的段落标题相似度。例如:设定每天的固定闲时时间,更新任意两个知识点之间的内容中的段落标题相似度。
[0196]在本实施例中,任意两个知识点(第一知识点和第二知识点)之间的内容中的段落标题相似度采用如下步骤计算:
[0197]步骤S501:解析第一知识点和第二知识点的所述段落标题,获取所述第一知识点和第二知识点的所述段落标题各自包括的预先定义的关键词,将所述第一知识点的所述段落标题包括的关键词作为第一段落标题的关键词集合,将所述第二知识点的所述段落标题包括的关键词作为第二段落标题的关键词集合。
[0198]步骤S502:根据所述第一段落标题的关键词集合和第二段落标题的关键词集合,计算所述第一知识点和第二知识点的内容中的段落标题相似度。
[0199]与标准一相同,根据所述第一段落标题的关键词集合和第二段落标题的关键词集合,计算第一知识点和第二知识点的内容中的段落标题相似度的过程,实质为衡量两个集合(第一段落标题的关键词集合和第二段落标题的关键词集合)的相似度。在本实施例中,内容中的段落标题相似度采用杰卡德相似系数。第一知识点和第二知识点的内容中的段落标题相似度可以采用下述公式计算获取:
[0200]Y (C,D) = I C n D I / I C U D
[0201]其中,C为所述第一段落标题的关键词集合,D为所述第二段落标题的关键词集合,Y(C,D)为所述内容中的段落标题相似度。
[0202]由于与原始答案的内容中的段落标题相似度最高的改进答案可能为多个,为了获取最新、最相似的知识点,优选的,当与原始答案的内容中的段落标题相似度最高的知识点有多个时,选择更新时间距离当前时间最近的知识点作为改进答案。
[0203]4)标准四
[0204]以所述不符合要求的原始答案中的信息为检索依据,以标准四在预存的知识点集合中检索,以获取所述待回答问题的改进答案,包括如下步骤:
[0205]步骤S601:找出与所述不符合要求的原始答案的内容中的段落标题相似度最高的知识点作为候选知识点。
[0206]步骤S602:判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同;若是,则进入步骤S603 ;若否,则进入步骤S604。
[0207]与标准二类似,根据标准四在预存的知识点集合中检索获取待回答问题的改进答案,主要分为两步:通过步骤S601,找出与所述不符合要求的原始答案的内容中的段落标题相似度最高的知识点作为候选知识点;通过步骤S602,判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同。相对于标准二而言,标准四仅仅将特征由标准二的“标题”变更为“内容中的段落标题”,标准四是将原始答案和改进答案各自的内容中的段落标题作为各自的特征,并根据该特征,将与原始答案的内容中的段落标题相似度最高的知识点作为候选知识点。标准四与标准二实施例内容相同的部分不再赘述,请参见标准二实施例中的相应部分。
[0208]采用该标准的理论依据是:原始答案和改进答案的大方向越近越好,而具体的解决方案越不同越好。在标准四中,原始答案和改进答案的大方向主要是由各自的内容中的段落标题决定的,而具体的解决方案取决于知识点包括的统一资源定位器的链接内容。如果原始答案与某一个知识点的内容中的段落标题相似度最高,而内容也相同,则显然该知识点并不适合作为改进答案。可见,相对于标准三而言,标准四是一个优化的实施方式,能够找到更为准确的改进方案。
[0209]步骤S603:若上述判断结果为是,则排除该候选知识点,在剩余知识点中找出内容中的段落标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤。
[0210]步骤S604:若上述判断结果为否,则将所述候选知识点作为所述改进答案。
[0211]5)标准五
[0212]标准五是根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度,计算整体相似度,以整体相似度与所述不符合要求的原始答案最接近的知识点作为改进知识点;所述整体相似度采用如下计算公式:
[0213]W = X*N1+Y*N2 - Z*N3
[0214]其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重。
[0215]标准五综合考虑标题相似度、内容中的段落标题相似度和统一资源定位器相似度,计算获取两个知识点的整体相似度,因此相对于上述四个标准,标准五是一个优选的标准。采用该标准的理论依据是:原始答案和改进答案的大方向越近越好,而具体的解决方案越不同越好。标准五中大方向的判断综合考虑了知识点标题和内容中的段落标题两个部分,因而大方向的判断结果更为准确。
[0216]在本实施例中,通过大量试验计算获取标题相似度的权重、段落标题相似度的权重和统一资源定位器相似度的权重的经验值,分别为:标题相似度的权重值NI为100、段落标题相似度的权重值为10、统一资源定位器相似度的权重值为100。上述各个权重值是一个通过大量试验获取的经验值,权重值还可以通过机器学习的方式自动获取。通过各个权重的经验值可见,本申请实施例中的段落标题相似度的权重值明显小于标题相似度的权重值,可见相对于段落标题相似度而言,标题相似度是决定大方向的主要因素,这与实际情况是相符合的。并且,由于希望两个知识点之间具体的解决方案越不同越好,因此将段落标题相似度与标题相似度之和,减去统一资源定位器相似度,计算获取整体相似度。
[0217]其中,标题相似度和段落标题相似度的计算方法与上述标准内容相同的部分不再赘述,请参见相关标准中的相应部分。任意两个知识点(第一知识点和第二知识点)之间的内容中的统一资源定位器相似度采用如下步骤计算:
[0218]步骤S701:解析第一知识点和第二知识点的各个内容,获取所述第一知识点和第二知识点的各自包括的统一资源定位器,分别作为第一统一资源定位器集合和第二统一资源定位器集合。
[0219]步骤S702:根据所述第一统一资源定位器集合和第二统一资源定位器集合,计算所述第一知识点和第二知识点的所述统一资源定位器相似度。
[0220]在本实施例中,内容中的统一资源定位器相似度采用杰卡德相似系数。第一知识点和第二知识点的内容中的统一资源定位器相似度可以采用下述公式计算获取:
[0221]Z(E,F) = E H F|/|E U F
[0222]其中,E为所述第一统一资源定位器集合,F为所述第二统一资源定位器集合,Z(E,F)为所述统一资源定位器相似度。
[0223]6)标准六
[0224]标准六是标准五的一个优化标准,该标准还考虑了知识点的更新时间因素,对于预设更新时间内的知识点,根据其具体的更新时间,计算整体相似度。更新时间越近的知识点,其整体相似度越高。采用标准六获取改进答案,包括如下步骤:
[0225]步骤S801:判断当前时间与知识点的最近更新时间的时间间隔是否小于等于第一预设时间间隔。
[0226]步骤S802:若上述判断结果为是,则根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度,以及所述当前时间与所述知识点的最近更新时间的时间间隔,计算整体相似度,以所述整体相似度与所述不符合要求的原始答案最接近的知识点作为改进知识点;所述整体相似度采用如下计算公式:
[0227]W = X*N1+Y*N2 - Z*N3+N4*(Ts_t)
[0228]其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重,N4为预设的时间权重,Ts为所述第一预设时间间隔,t为所述当前时间与所述知识点的最近更新时间的时间间隔。
[0229]标准六与标准五内容相同的部分不再赘述,请参见标准五中的相应部分。在标准六的公式中,N4为预设的时间权重,Ts为所述第一预设时间间隔,这两个权重值也是可以通过大量试验获取的经验值,还可以通过机器学习的方式自动获取。例如:N4取值为3、Ts取值为10、t为5,其含义为:两个知识点之间的整体相似度在标准五的基础上,再加上15分,即:更新时间越近的知识点,其整体相似度越高。
[0230]与标准一至标准四同理,对于标准五和标准六而言,在实际应用中,为提高检索效率,可以预先计算并存储任意两个知识点之间的整体相似度。在检索改进答案时,对与原始答案有关联的所有整体相似度进行排序,找到整体相似度最高值对应的知识点,作为改进答案。根据具体应用情况,可以设定根据固定的时间间隔、更新知识点后触发等方式,更新任意两个知识点之间的整体相似度。例如:设定每天的固定闲时时间,更新任意两个知识点之间的整体相似度。
[0231]通过上述六种标准,以所述不符合要求的原始答案中的信息为检索依据,能够在预存的知识点集合中检索获取待回答问题的不同准确程度的改进答案。在实际应用中,可以根据具体需求选择合适的标准,获取原始答案的改进答案。
[0232]在实施本申请提供的方法时,考虑到知识点的新旧因素,对于各种检索改进答案的预定标准,还可以在各个标准的基础上包括:仅将规定时间阈值范围内更新的知识点作为检索获取所述改进答案的范围;所述时间阈值为当前时间与所述知识点的最近更新时间的时间间隔长度的预设值。通过该方法,能够限定改进答案的更新时间,避免较早的知识点,例如:各种网站地址已经过期,或者解决问题的软件已经改版等问题,从而获取到最新的知识点。例如:将时间阈值设定为365天,则该方案获取的改进答案的更新时间一定为365天内更新的知识点。
[0233]在上述的实施例中,提供了一种智能应答方法,与之相对应的,本申请还提供一种智能应答装置。请参看图5,其为本申请的智能应答装置实施例的示意图。该装置是与上述智能应答方法的实施例相对应。
[0234]由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0235]本实施例的一种智能应答装置,包括:获取单元101,用于获取对应特定待回答问题的被提问者评价为不符合要求的原始答案;检索单元103,用于以所述不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索,以获取所述待回答问题的改进答案;所述知识点包括标题和内容。
[0236]请参看图6,其为本申请的智能应答装置实施例中检索单元103的具体示意图。可选的,所述检索单元103包括:
[0237]第一检索子单元1031,用于以所述不符合要求的原始答案中的信息为检索依据,以所述改进答案与所述不符合要求的原始答案的标题相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案。
[0238]可选的,所述检索单元103包括:
[0239]第二检索子单元1032,用于以所述不符合要求的原始答案中的信息为检索依据,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案。
[0240]请参看图7,其为本申请的智能应答装置实施例中第二检索单元1032的具体示意图。可选的,所述第二检索子单元1032包括:
[0241]第一查找子单元10321,用于找出与所述不符合要求的原始答案的标题相似度最高的知识点作为候选知识点;
[0242]判断子单元10322,用于判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同;
[0243]第二查找子单元10323,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案相同,则排除该候选知识点,在剩余知识点中找出标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤;
[0244]判定子单元10324,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案不相同,则将所述候选知识点作为所述改进答案。
[0245]可选的,所述检索单元103包括:
[0246]第三检索子单元1033,用于以所述不符合要求的原始答案中的信息为检索依据,以所述改进答案与所述不符合要求的原始答案的内容中的段落标题相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案。
[0247]可选的,所述检索单元103包括:
[0248]第四检索子单元1034,用于以所述不符合要求的原始答案中的信息为检索依据,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案;
[0249]所述第四检索子单元1034包括:
[0250]第一查找子单元10341,用于找出与所述不符合要求的原始答案的内容中的段落标题相似度最尚的知识点作为候选知识点;
[0251]判断子单元10342,用于判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同;
[0252]第二查找子单元10343,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案相同,则排除该候选知识点,在剩余知识点中找出内容中的段落标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤;
[0253]判定子单元10344,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案不相同,则将所述候选知识点作为所述改进答案。
[0254]可选的,所述检索单元103包括:
[0255]第五检索子单元1035,用于以所述不符合要求的原始答案中的信息为检索依据,以原始改进答案与所述不符合要求的原始答案的整体相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案;
[0256]所述整体相似度是根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度计算获取的;所述整体相似度采用如下计算公式:
[0257]W = X*N1+Y*N2 - Z*N3
[0258]其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重。
[0259]可选的,所述检索单元103包括:
[0260]第六检索子单元1036,用于以所述不符合要求的原始答案中的信息为检索依据,以所述改进答案与所述不符合要求的原始答案的整体相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案;
[0261]所述整体相似度是根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度,以及所述当前时间与知识点的最近更新时间的时间间隔计算获取的;所述整体相似度采用如下计算公式:
[0262]W = X*N1+Y*N2 - Z*N3+N4*(Ts_t)
[0263]其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重,N4为预设的时间权重,Ts为所述预设的时间间隔,t为所述当前时间与所述知识点的最近更新时间的时间间隔。
[0264]请参看图8,其为本申请的智能应答装置实施例的具体示意图。可选的,其特征在于,所述装置还包括:
[0265]第一计算子单元201,用于计算任意两个知识点的所述标题相似度。
[0266]请参看图9,其为本申请的智能应答装置实施例中第一计算单元201的具体示意图。可选的,所述第一计算子单元201包括:
[0267]解析子单元2011,用于解析第一知识点和第二知识点的标题,获取所述第一知识点和第二知识点的标题各自包括的预先定义的关键词,分别作为第一标题关键词集合和第二标题关键词集合;
[0268]计算子单元2012,用于根据所述第一标题关键词集合和第二标题关键词集合,计算所述第一知识点和第二知识点的标题相似度。
[0269]可选的,所述装置还包括:
[0270]第二计算子单元202,用于计算任意两个知识点的所述内容中的段落标题相似度;
[0271 ] 所述第二计算子单元202包括:
[0272]解析子单元2021,用于解析第一知识点和第二知识点的所述段落标题,获取所述第一知识点和第二知识点的所述段落标题各自包括的预先定义的关键词,将所述第一知识点的所述段落标题包括的关键词作为第一段落标题的关键词集合,将所述第二知识点的所述段落标题包括的关键词作为第二段落标题的关键词集合;
[0273]计算子单元10382,用于根据所述第一段落标题的关键词集合和第二段落标题的关键词集合,计算所述第一知识点和第二知识点的内容中的段落标题相似度。
[0274]可选的,所述装置还包括:
[0275]第三计算子单元203,用于计算任意两个知识点的所述内容中的统一资源定位器相似度;
[0276]所述第三计算子单元203包括:
[0277]解析子单元2031,用于解析第一知识点和第二知识点的各个内容,获取所述第一知识点和第二知识点的各自包括的统一资源定位器,分别作为第一统一资源定位器集合和第二统一资源定位器集合;
[0278]计算子单元2032,用于根据所述第一统一资源定位器集合和第二统一资源定位器集合,计算所述第一知识点和第二知识点的所述统一资源定位器相似度。
[0279]可选的,所述装置还包括:
[0280]第四计算子单元204,用于计算任意两个知识点的所述整体相似度。
[0281]可选的,所述装置还包括:
[0282]生成单元205,用于生成所述不符合要求的原始答案。
[0283]请参看图10,其为本申请的智能应答装置实施例中生成单元205的具体示意图。可选的,所述生成单元205包括:
[0284]接收子单元2051,用于接收客户端发送的对应所述待回答问题的询问请求;
[0285]获取子单元2052,用于根据所述待回答问题和预存的问答关系,获取所述待回答问题的所述一个或多个原始答案;
[0286]选取子单元2053,用于将提问者从所述一个或多个原始答案中选取的一个原始答案,作为所述不符合要求的原始答案。
[0287]可选的,所述获取子单元2052包括:
[0288]解析子单元20521,用于解析所述待回答问题,获取所述待回答问题包括的预先定义的关键词;
[0289]查询子单元20522,用于根据所述关键词和所述问答关系,获取与所述关键词匹配的答案,作为所述一个或多个原始答案。
[0290]本申请实施例还提供了一种智能应答系统,包括上述的智能应答装置。
[0291]此外,本申请实施例还提供了一种电子设备,如图11所示,该电子设备包括:显示器1101 ;处理器1102 ;以及存储器1103,所述存储器1103被配置成存储待回答问题,所述待回答问题被所述处理器1102执行时,在所述显示器1101显示所述待回答问题的改进答案,所述改进答案是以被提问者评价为不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索获取的,所述原始答案是根据所述待回答问题和预存的问答关系生成的。
[0292]本申请实施例所述的电子设备包括个人电脑、PAD、iPad等终端设备,以及移动通讯设备,即:通常所说的手机或者智能手机。电子设备还可以是穿戴式智能设备,例如,苹果手表或者谷歌眼镜。
[0293]本申请实施例所述的知识点和问答关系既可以存储在电子设备中,也可以存储在与电子设备联网的服务器中。知识点和问答关系存储在电子设备中的优点在于,回答问题的速度更快;而缺点在于无法统一管理知识点和问答关系。
[0294]在本实施例中,电子设备作为一个联网设备,问题的提问和回答需要和互联网上的服务器交互。因此,所述知识点和所述问答关系存储在服务器端,而非存储在电子设备的存储器中。
[0295]通过将知识点和问答关系存储在服务器端,能够统一管理知识点和问答关系,在更新知识点和问答关系时仅需更新服务器端,避免将知识点和问答关系存储在电子设备中可能导致的数据不一致的问题。
[0296]在实际应用中,当电子设备获取到问题的改进答案后,还可以将改进答案存储在电子设备的存储器中,以便于后续当电子设备离线时,能够随时获取已经回答过的问题的改进答案。
[0297]本申请提供的智能应答方法、装置、系统及电子设备,通过获取对应特定待回答问题的被提问者评价为不符合要求的原始答案,并以所述不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索,以获取所述待回答问题的改进答案,使得在查询检索到与待回答问题直接对应的答案后,还能够根据提问者选择的不符合要求的原始答案进行二次检索,获取待回答问题的改进答案。由于提问者对原始答案的选择反映了提问者对答案的需求,可以将其作为新的检索依据。因此,本方法能够在现有技术已经难以通过待回答问题本身包含的信息提高答案覆盖面和准确率的情况下,通过引入新的检索依据提高答案的覆盖面以及准确率。
[0298]本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
[0299]在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0300]内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0301]1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0302]2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
【主权项】
1.一种智能应答方法,其特征在于,包括: 获取对应特定待回答问题的被提问者评价为不符合要求的原始答案; 以所述不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索,以获取所述待回答问题的改进答案;所述知识点包括标题和内容。2.根据权利要求1所述的智能应答方法,其特征在于,所述不符合要求的原始答案包括标题; 所述预定的标准包括:与所述不符合要求的原始答案的标题相似度最高。3.根据权利要求2所述的智能应答方法,其特征在于,若与所述不符合要求的原始答案的标题相似度最高的知识点有多个,则选择更新时间距离当前时间最近的知识点作为所述改进答案。4.根据权利要求1所述的智能应答方法,其特征在于,所述不符合要求的原始答案包括标题; 所述预定的标准包括: 找出与所述不符合要求的原始答案的标题相似度最高的知识点作为候选知识点; 判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同; 若是,则排除该候选知识点,在剩余知识点中找出标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤; 若否,则将所述候选知识点作为所述改进答案。5.根据权利要求1所述的智能应答方法,其特征在于,所述预定的标准包括:与所述不符合要求的原始答案的内容中的段落标题相似度最高。6.根据权利要求5所述的智能应答方法,其特征在于,若与所述不符合要求的原始答案的内容中的段落标题相似度最高的知识点有多个,则选择更新时间距离当前时间最近的知识点作为所述改进答案。7.根据权利要求1所述的智能应答方法,其特征在于,所述预定的标准包括: 找出与所述不符合要求的原始答案的内容中的段落标题相似度最高的知识点作为候选知识点; 判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同; 若是,则排除该候选知识点,在剩余知识点中找出内容中的段落标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤; 若否,则将所述候选知识点作为所述改进答案。8.根据权利要求1所述的智能应答方法,其特征在于,所述预定的标准包括:根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度,计算整体相似度,以所述整体相似度与所述不符合要求的原始答案最接近的知识点作为改进知识点;所述整体相似度采用如下计算公式:W = X*N1+Y*N2 - Z*N3 其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重。9.根据权利要求1所述的智能应答方法,其特征在于,所述预定的标准包括: 判断当前时间与知识点的最近更新时间的时间间隔是否小于等于第一预设时间间隔; 若上述判断结果为是,则根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度,以及所述当前时间与所述知识点的最近更新时间的时间间隔,计算整体相似度,以所述整体相似度与所述不符合要求的原始答案最接近的知识点作为改进知识点;所述整体相似度采用如下计算公式:W = X*N1+Y*N2 - Z*N 3+N4*(Ts-t) 其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重,N4为预设的时间权重,Ts为所述第一预设时间间隔,t为所述当前时间与所述知识点的最近更新时间的时间间隔。10.根据权利要求1-9任意一项所述的智能应答方法,其特征在于,所述预定的标准包括:仅将规定时间阈值范围内更新的知识点作为检索获取所述改进答案的范围;所述时间阈值为当前时间与所述知识点的最近更新时间的时间间隔长度的预设值。11.根据权利要求2、3、4、8或9任意一项所述的智能应答方法,其特征在于,在所述以预定的标准在预存的知识点集合中检索获取所述待回答问题的改进答案之前,还包括: 计算并存储任意两个知识点的所述标题相似度。12.根据权利要求11所述的智能应答方法,其特征在于,根据第二预设时间间隔或者当更新所述知识点时,计算并存储任意两个知识点的所述标题相似度。13.根据权利要求11所述的智能应答方法,其特征在于,所述计算任意两个知识点的所述标题相似度包括: 解析第一知识点和第二知识点的标题,获取所述第一知识点和第二知识点的标题各自包括的预先定义的关键词,分别作为第一标题关键词集合和第二标题关键词集合; 根据所述第一标题关键词集合和第二标题关键词集合,计算所述第一知识点和第二知识点的标题相似度。14.根据权利要求13所述的智能应答方法,其特征在于,所述标题相似度采用下述公式计算获取:X(A,B) = |Α η B I / IAUB 其中,A为所述第一标题关键词集合,B为所述第二标题关键词集合,X(A,B)为所述标题相似度。15.根据权利要求5、6、7、8或9任意一项所述的智能应答方法,其特征在于,在所述以预定的标准在预存的知识点集合中检索获取所述待回答问题的改进答案之前,还包括: 计算并存储任意两个知识点的所述内容中的段落标题相似度。16.根据权利要求15所述的智能应答方法,其特征在于,根据第二预设时间间隔或者当更新所述知识点时,计算并存储任意两个知识点的所述内容中的段落标题相似度。17.根据权利要求15所述的智能应答方法,其特征在于,所述计算任意两个知识点的所述内容中的段落标题相似度包括: 解析第一知识点与第二知识点的所述段落标题,获取所述第一知识点与第二知识点的所述段落标题各自包括的预先定义的关键词,将所述第一知识点的所述段落标题包括的关键词作为第一段落标题的关键词集合,将所述第二知识点的所述段落标题包括的关键词作为第二段落标题的关键词集合; 根据所述第一段落标题的关键词集合和第二段落标题的关键词集合,计算所述第一知识点与第二知识点的内容中的段落标题相似度。18.根据权利要求17所述的智能应答方法,其特征在于,所述内容中的段落标题相似度采用下述公式计算获取: Y (C,D) = I C n D I / I CUD 其中,C为所述第一段落标题的关键词集合,D为所述第二段落标题的关键词集合,Y(C,D)为所述内容中的段落标题相似度。19.根据权利要求4、7、8或9任意一项所述的智能应答方法,其特征在于,在所述以预定的标准在预存的知识点集合中检索获取所述待回答问题的改进答案之前,还包括: 计算并存储任意两个知识点的所述内容中的统一资源定位器相似度。20.根据权利要求19所述的智能应答方法,其特征在于,根据第二预设时间间隔或者当更新所述知识点时,计算并存储任意两个知识点的所述内容中的统一资源定位器相似度。21.根据权利要求19所述的智能应答方法,其特征在于,所述计算任意两个知识点的所述内容中的统一资源定位器相似度包括: 解析第一知识点与第二知识点的各个内容,获取所述第一知识点与第二知识点的各自包括的统一资源定位器,分别作为第一统一资源定位器集合和第二统一资源定位器集合; 根据所述第一统一资源定位器集合和第二统一资源定位器集合,计算所述第一知识点与第二知识点的所述统一资源定位器相似度。22.根据权利要求21所述的智能应答方法,其特征在于,所述统一资源定位器相似度采用下述公式计算获取:z(e,F) = |e n FI/1euf 其中,E为所述第一统一资源定位器集合,F为所述第二统一资源定位器集合,Z(E,F)为所述统一资源定位器相似度。23.根据权利要求8或9所述的智能应答方法,其特征在于,在所述以预定的标准在预存的知识点集合中检索获取所述待回答问题的改进答案之前,还包括: 计算并存储任意两个知识点的所述整体相似度。24.根据权利要求23所述的智能应答方法,其特征在于,根据第二预设时间间隔或者当更新所述知识点时,计算并存储任意两个知识点的所述整体相似度。25.根据权利要求1所述的智能应答方法,其特征在于,所述不符合要求的原始答案采用如下步骤生成: 接收客户端发送的对应所述待回答问题的询问请求; 根据所述待回答问题和预存的问答关系,获取所述待回答问题的一个或多个原始答案; 将提问者从所述一个或多个原始答案中选取的一个原始答案,作为所述不符合要求的原始答案。26.根据权利要求25所述的智能应答方法,其特征在于,所述根据所述待回答问题和预存的问答关系,获取所述待回答问题的一个或多个原始答案,包括: 解析所述待回答问题,获取所述待回答问题包括的预先定义的关键词; 根据所述关键词和所述问答关系,获取与所述关键词匹配的答案,作为所述一个或多个原始答案。27.根据权利要求1所述的智能应答方法,其特征在于,所述知识点是结构化文档。28.一种智能应答装置,其特征在于,包括: 获取单元,用于获取对应特定待回答问题的被提问者评价为不符合要求的原始答案; 检索单元,用于以所述不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索,以获取所述待回答问题的改进答案;所述知识点包括标题和内容。29.根据权利要求28所述的智能应答装置,其特征在于,所述检索单元包括: 第一检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,以所述改进答案与所述不符合要求的原始答案的标题相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案。30.根据权利要求28所述的智能应答装置,其特征在于,所述检索单元包括: 第二检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案; 所述第二检索子单元包括: 第一查找子单元,用于找出与所述不符合要求的原始答案的标题相似度最高的知识点作为候选知识点; 判断子单元,用于判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同; 第二查找子单元,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案相同,则排除该候选知识点,在剩余知识点中找出标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤; 判定子单元,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案不相同,则将所述候选知识点作为所述改进答案。31.根据权利要求28所述的智能应答装置,其特征在于,所述检索单元包括: 第三检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,以所述改进答案与所述不符合要求的原始答案的内容中的段落标题相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案。32.根据权利要求28所述的智能应答装置,其特征在于,所述检索单元包括: 第四检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案; 所述第四检索子单元包括: 第一查找子单元,用于找出与所述不符合要求的原始答案的内容中的段落标题相似度最尚的知识点作为候选知识点; 判断子单元,用于判断所述候选知识点中包含的统一资源定位符是否与所述不符合要求的原始答案相同; 第二查找子单元,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案相同,则排除该候选知识点,在剩余知识点中找出内容中的段落标题相似度最高的知识点作为所述候选知识点,并返回前一判断步骤; 判定子单元,用于若所述候选知识点中包含的统一资源定位符与所述不符合要求的原始答案不相同,则将所述候选知识点作为所述改进答案。33.根据权利要求28所述的智能应答装置,其特征在于,所述检索单元包括: 第五检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,以原始改进答案与所述不符合要求的原始答案的整体相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案; 所述整体相似度是根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度计算获取的;所述整体相似度采用如下计算公式:W = X*N1+Y*N2 - Z*N3 其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重。34.根据权利要求28所述的智能应答装置,其特征在于,所述检索单元包括: 第六检索子单元,用于以所述不符合要求的原始答案中的信息为检索依据,以所述改进答案与所述不符合要求的原始答案的整体相似度最高为检索标准,在所述预存的知识点集合中检索,以获取所述待回答问题的所述改进答案; 所述整体相似度是根据与所述不符合要求的原始答案的标题相似度、内容中的段落标题相似度和统一资源定位器相似度,以及所述当前时间与知识点的最近更新时间的时间间隔计算获取的;所述整体相似度采用如下计算公式:W = X*N1+Y*N2 - Z*N3+N4*(Ts-t) 其中,W为所述整体相似度,X为所述标题相似度,Y为所述段落标题相似度,Z为所述统一资源定位器相似度,NI为所述标题相似度的权重,N2为所述段落标题相似度的权重,N3为所述统一资源定位器的权重,N4为预设的时间权重,Ts为第一预设时间间隔,t为所述当前时间与所述知识点的最近更新时间的时间间隔。35.根据权利要求29、30、33或34任意一项所述的智能应答装置,其特征在于,所述装置还包括: 第一计算子单元,用于计算任意两个知识点的所述标题相似度; 所述第一计算子单元包括: 解析子单元,用于解析第一知识点和第二知识点的标题,获取所述第一知识点和第二知识点的标题各自包括的预先定义的关键词,分别作为第一标题关键词集合和第二标题关键词集合; 计算子单元,用于根据所述第一标题关键词集合和第二标题关键词集合,计算所述第一知识点和第二知识点的标题相似度。36.根据权利要求31、32、33或34任意一项所述的智能应答装置,其特征在于,所述装置还包括: 第二计算子单元,用于计算任意两个知识点的所述内容中的段落标题相似度; 所述第二计算子单元包括: 解析子单元,用于解析第一知识点和第二知识点的所述段落标题,获取所述第一知识点和第二知识点的所述段落标题各自包括的预先定义的关键词,将所述第一知识点的所述段落标题包括的关键词作为第一段落标题的关键词集合,将所述第二知识点的所述段落标题包括的关键词作为第二段落标题的关键词集合; 计算子单元,用于根据所述第一段落标题的关键词集合和第二段落标题的关键词集合,计算所述第一知识点和第二知识点的内容中的段落标题相似度。37.根据权利要求33或34所述的智能应答装置,其特征在于,其特征在于,所述装置还包括: 第三计算子单元,用于计算任意两个知识点的所述内容中的统一资源定位器相似度; 所述第三计算子单元包括: 解析子单元,用于解析第一知识点和第二知识点的各个内容,获取所述第一知识点和第二知识点的各自包括的统一资源定位器,分别作为第一统一资源定位器集合和第二统一资源定位器集合; 计算子单元,用于根据所述第一统一资源定位器集合和第二统一资源定位器集合,计算所述第一知识点和第二知识点的所述统一资源定位器相似度。38.根据权利要求33或34所述的智能应答装置,其特征在于,其特征在于,所述装置还包括: 第四计算子单元,用于计算任意两个知识点的所述整体相似度。39.根据权利要求28所述的智能应答装置,其特征在于,还包括: 生成单元,用于生成所述不符合要求的原始答案; 所述生成单元包括: 接收子单元,用于接收客户端发送的对应所述待回答问题的询问请求; 获取子单元,用于根据所述待回答问题和预存的问答关系,获取所述待回答问题的一个或多个原始答案; 选取子单元,用于将提问者从所述一个或多个原始答案中选取的一个原始答案,作为所述不符合要求的原始答案。40.根据权利要求39所述的智能应答装置,其特征在于,所述获取子单元包括: 解析子单元,用于解析所述待回答问题,获取所述待回答问题包括的预先定义的关键词; 查询子单元,用于根据所述关键词和所述问答关系,获取与所述关键词匹配的答案,作为所述一个或多个原始答案。41.一种智能应答系统,其特征在于,包括:权利要求28所述的智能应答装置。42.一种电子设备,其特征在于,所述电子设备包括: 显示器; 处理器;以及 存储器,所述存储器被配置成存储待回答问题,所述待回答问题被所述处理器执行时,在所述显示器显示所述待回答问题的改进答案,所述改进答案是以被提问者评价为不符合要求的原始答案中的信息为检索依据,以预定的标准在预存的知识点集合中检索获取的,所述原始答案是根据所述待回答问题和预存的问答关系生成的。43.根据权利要求42所述的电子设备,其特征在于,所述知识点和所述问答关系存储在服务器端。44.根据权利要求42所述的电子设备,其特征在于,所述电子设备是穿戴式智能设备;所述改进答案存储在该穿戴式智能设备的存储器中。
【文档编号】G06F17/30GK105893391SQ201510038536
【公开日】2016年8月24日
【申请日】2015年1月26日
【发明人】张翔
【申请人】阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1