一种对话系统知识库的优化方法及装置的制造方法

文档序号:10553048阅读:222来源:国知局
一种对话系统知识库的优化方法及装置的制造方法
【专利摘要】一种对话系统知识库的优化方法及装置,该包括:目标问答信息获取步骤,判断待分析问答信息的测评参数是否符合优化标准,如符合,则将待分析问答信息作为目标问答信息;更新答案集合生成步骤,基于目标问答信息的问题信息获取对应的答案信息集合,分别计算答案信息集合中各个答案信息的相关度参数,并根据相关度参数生成针对目标问答信息中问题信息的更新答案集合。该方法能够实现对对话系统数据库的主动更新,从而使得对话系统能够输出更加符合用户使用习惯以及期望的答案,进而提高了对话系统的用户体验以及用户粘度。
【专利说明】
一种对话系统知识库的优化方法及装置
技术领域
[0001]本发明涉及人机交互技术领域,具体地说,涉及一种对话系统知识库的优化方法及装置。
【背景技术】
[0002]对于传统的人机交互而言,人机交互主要是由用户通过鼠标、键盘以及触摸屏等装置来与计算机、手机等设备进行交互。而随着人机之间信息交互量正呈现爆炸性的增长,传统的人机交互方式极大地影响了人机交互的效率以及效果。
[0003]人们所习惯的最自然、最便捷的交互方式是自然语言交互,因此通过对话系统来实现高效地人机交互成为了越来越普遍的选择。然而,现有的对话系统对于用户的一些询问问题无法给出令人满意的回答,这也就影响了整个对话系统的用户体验,使得产品的用户粘性较差。

【发明内容】

[0004]为解决上述问题,本发明提供了一种对话系统知识库的优化方法,包括:
[0005]目标问答信息获取步骤,判断待分析问答信息的测评参数是否符合优化标准,如符合,则将所述待分析问答信息作为目标问答信息;
[0006]更新答案集合生成步骤,基于所述目标问答信息的问题信息获取对应的答案信息集合,分别计算所述答案信息集合中各个答案信息的相关度参数,并根据所述相关度参数生成针对所述目标问答信息中问题信息的更新答案集合。
[0007]根据本发明的一个实施例,在所述目标问答信息获取步骤中,判断所述待分析问答信息的测评参数是否小于预设测评阈值,如果小于,则将所述待分析问答信息作为目标问答信息。
[0008]根据本发明的一个实施例,在所述更新答案集合生成步骤中,根据问答信息中问题信息与答案信息是否具有语义相同的中心词来确定答案信息的相关度参数,其中,语义相同的中心词的数量越多,答案信息与问题信息的相关度参数越大。
[0009]根据本发明的一个实施例,在获取所述答案信息集合时,按照预设规则选取目标用户,并向所述目标用户推送所述目标问答信息中的问题信息,获取所述目标用户针对所述问题信息所反馈的答案信息,从而得到所述问答信息集合。
[0010]根据本发明的一个实施例,在选取所述目标用户时,
[0011]获取对话系统不同用户的用户属性,判断用户属性是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户,其中,所述用户属性包括以下所列项中的任一项或几项:
[0012]用户身份信息、用户位置信息、用户年龄信息、用户性别信息;
[0013]或,获取对话系统不同用户的交互场景和/或交互话题,判断所述交互场景和/或交互话题是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户。
[0014]本发明还提供了一种对话系统知识库的优化装置,包括:
[0015]目标问答信息获取模块,其用于判断待分析问答信息的测评参数是否符合优化标准,如符合,则将所述待分析问答信息作为目标问答信息;
[0016]更新答案集合生成模块,其用于基于所述目标问答信息的问题信息获取对应的答案信息集合,分别计算所述答案信息集合中各个答案信息的相关度参数,并根据所述相关度参数生成针对所述目标问答信息中问题信息的更新答案集合。
[0017]根据本发明的一个实施例,所述目标问答信息获取模块配置为判断所述待分析问答信息的测评参数是否小于预设测评阈值,如果小于,则将所述待分析问答信息作为目标问答信息。
[0018]根据本发明的一个实施例,所述更新答案集合生成模块配置为根据问答信息中问题信息与答案信息是否具有语义相同的中心词来确定答案信息的相关度参数,其中,语义相同的中心词的数量越多,答案信息与问题信息的相关度参数越大。
[0019]根据本发明的一个实施例,所述更新答案集合生成模块配置为在获取所述答案信息集合时,按照预设规则选取目标用户,并向所述目标用户推送所述目标问答信息中的问题信息,获取所述目标用户针对所述问题信息所反馈的答案信息,从而得到所述问答信息
口 O
[0020]根据本发明的一个实施例,所述更新答案集合生成模块配置为在选取所述目标用户时,
[0021]获取对话系统不同用户的用户属性,判断用户属性是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户,其中,所述用户属性包括以下所列项中的任一项或几项:
[0022]用户身份信息、用户位置信息、用户年龄信息、用户性别信息;
[0023]或,获取对话系统不同用户的交互场景和/或交互话题,判断所述交互场景和/或交互话题是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户。
[0024]本发明所提供的对话系统知识库优化方法通过对海量用户的用户请求日志进行分析,尽可能找到这些日志中不好的或不合理的问答信息,然后通过各种渠道主动地获取这类问答信息中的问题信息的答案信息,并对答案信息进行合法性的判断,最后将符合要求的答案信息插入或更新到数据库中。通过对对话系统数据库的更新,对话系统能够输出更加符合用户使用习惯以及期望的答案,从而提高了对话系统的用户体验以及用户粘度。
[0025]该方法实现了对话系统知识库的自学习以及闭环反馈。其中,该方法可以使得对话系统能够对知识库中不好的和不合理的问答信息自主地进行合理化改进,从而使得该系统的质量能够有持续性的提升。同时,该方法还能够使得对话系统实现自主学习,这样也就可以脱离必须依赖维护人员的手动学习方式。
[0026]该方法通过将目标问答信息中的问题信息重新推送给用户来获取用户针对该问题信息的答案,这样便实现了“用户-对话系统-用户”的闭环反馈,因此对话系统也就可以在受到外接干扰时保持自身的稳定性。正是基于这种闭环结构,对话系统才能够持续的接收到来自用户感知层面的反馈,并根据用户的反馈来不断优化自身知识库从而调整自身的输出,以使得这种输出能够符合用户的期望。
[0027]此外,本发明所提供的对话系统知识库优化方法还可以通过根据用户的属性来向特定的用户推送目标问答信息中的问题信息。由于这类用户的属性与向对话系统输入目标问答信息中问题信息的用户的属性相同或类似,因此通过这类用户也就可以获得针对于目标问答信息中问题信息的更为准确或契合度更高的答案信息,而根据这类答案信息所确定出的上述问题信息的更新答案集合也将更为准确。
[0028]本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
【附图说明】
[0029]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:
[0030]图1是根据本发明一个实施例的对话系统知识库优化方法的实现流程图;
[0031 ]图2是根据本发明另一个实施例的对话系统知识库优化方法的实现流程图;
[0032]图3是根据本发明又一个实施例的对话系统知识库优化方法的实现流程图;
[0033]图4是根据本发明一个实施例的对话系统知识库优化装置的结构示意图。
【具体实施方式】
[0034]以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
[0035]同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本发明实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本发明可以不用这里的具体细节或者所描述的特定方式来实施。
[0036]另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0037]对于智能机器人中的对话系统来说,从用户的角度来看,越好的用户体验,那么就意味着越高的用户粘性。目前,对于对话机器人来说,最为直观的体验是用户所询问的问题的答案是否满足了用户的期望。例如,当用户向对话机器人发起询问“总自己一个人”时,对于现有的对话机器人来说,其反馈的答案很可能是“我不知道你在说什么耶”。由此可以看出,现有的对话机器人无法很好地满足用户的日常交互需求。
[0038]对话机器人是利用对话系统来实现机器人与用户之间的对话交互的,其中,对话系统利用自身的知识库来根据用户输入的问题来确定出相应的答案。本发明正是利用上述特性,提供了一种新的对话系统知识库的优化方法,以使得对话系统能够利用优化后的知识库更加准确、合理地确定出用户所输入的问题的答案。该优化方法通过不间断地持续学习,以此不断地提升对话系统知识库的质量。
[0039]需要指出的是,本发明所指的对话系统知识库的质量的提升,既可以指知识库中问题信息所对应的答案信息的改善,也可以指知识库中问题信息及其答案信息的扩充。
[0040]为了更加清楚地阐述本发明所提供的对话系统知识库优化方法的实现原理、实现过程以及优点,以下分别结合不同的实施例来对该方法作进一步地说明。
[0041 ] 实施例一:
[0042]图1示出了本实施例所提供的对话系统知识库的优化方法的实现流程图。
[0043]如图1所示,本实施例所提供的方法首先在步骤SlOl中获取待分析问答信息的测评参数。其中,该方法在步骤SlOl中所获取到的测评参数优选地为问答评价系统对待分析问答信息的评分。对于问答信息中的问题信息而言,其答案信息的评分越高,也就说明用户对该答案信息的满意程度越高;反之,如果答案信息的评分越低,也就说明用户对该答案信息的满意程度越低,而这类答案信息也正是需要进行优化的信息。
[0044]因此,本实施例中,该方法在步骤S102中判断步骤SlOl中所获得的测评参数是否满足预设优化标准。如果测评参数满足预设优化标准,该方法则在步骤S103中将步骤SlOl中的待分析问答信息作为目标问答信息。其中,目标问答信息即为待优化的问答信息。
[0045]具体地,本实施例中,由于该方法在步骤SlOl中所获取的测评参数为问答评价系统针对答案信息的评分,因此该方法在步骤S102中通过判断测评参数是否小于预设测评阈值来判断待分析问答信息是否为目标问答信息。
[0046]例如对于用户输入的问题信息“总自己一个人”来说,对话系统所反馈的答案信息“我不知道你在说什么耶”显然无法令用户感到满意,因此其对应的评分也就必然会很低。如果该答案信息所对应的评分小于预设评分阈值的话,那么就表示需要对该答案信息进行优化,以使得用户在输入问题信息时对话系统能够反馈令用户更为满意的答案。
[0047]如图1所示,当确定出目标问答信息后,该方法在步骤S104中基于目标问答信息的问题信息获取对应的回答信息集合。本实施例中,当确定出对话系统数据库中的目标问答信息后,该方法会在特定的场景下把目标问答信息中的问题信息推送给对话系统的用户,并记录用户对该问题信息的反馈,从而得到问题信息所对应的回答信息集合。
[0048]例如,该方法在步骤S103中所确定的目标问答信息包括:问题信息“总自己一个人”和答案信息“我不知道你在说什么耶”,在步骤S104中,该方法会将问题信息“总自己一个人”推送给对话系统的用户(此处的用户可能为输入该问题信息的用户也可能为其他多个不同的用户)。针对所推送的问题信息,用户在对话过程中会将自己的答案反馈给对话系统,这样该方法通过收集用户的反馈答案便可以得到目标问答信息中问题信息所对应的答案信息集合。
[0049]需要指出的是,在本发明的其他实施例中,该方法也可以通过其他合理方式来获取对应于目标问答信息中问题信息的答案信息集合,本发明不限于此。
[0050]当得到答案信息集合后,由于回答信息集合中所包含的答案信息多是由多个不同的用户所反馈的,因此其中既可能包含能够令用户较为满意的答案信息,也可能包含无法令用户满意的答案信息,这样也就需要对答案信息集合进行筛选,以确定能够作为目标问答信息中问题信息的备选答案的信息。
[0051]具体地,如图1所示,在得到答案信息集合后,该方法在步骤S105中分别计算答案信息集合中各个答案信息的相关度参数,并在步骤S106中根据相关度参数生成针对目标问答信息中问题信息的更新答案信息集合。
[0052]本实施例中,相关度参数用于表征答案信息与问题信息之间的联系程度,而判断问题信息与答案信息之间的联系一直是人工智能领域中一个重要的研究课题。为了使得对话系统能够尽可能高效地工作,本实施例中该方法利用预先设定的规则来计算答案信息集合中各个答案信息的相关度参数。
[0053]具体地,本实施例中,该方法利用多个适用于相关度判断的规则来分别计算各个规则下问答信息的相关度,随后利用各个规则的权重对利用各个规则所计算得到的相关度进行加权,从而最终得到某一答案信息总体的相关度参数。
[0054]其中,该方法所利用的预设规则优选地包括中心词规则,该方法根据问答信息中答案信息与问题信息是否具有语义相同的中心词来确定答案信息的相关度参数。如果问题信息与答案信息中语义相同的中心词越多,那么答案信息与问题信息的相关度参数的取值也就越大;反之,如果问题信息与答案信息中语义相同的中心词越少,那么答案信息与问题信息的相关度参数的取值也就越小。
[0055]需要指出的是,在本发明的其他实施例中,该方法在计算答案信息的相关度参数时所使用的预测还可以包含其他合理规则,本发明不限于此。
[0056]本实施例中,当得到答案信息集合中各个答案信息的相关度参数后,该方法会按照相关度参数的取值大小对答案信息集合中的各个答案信息进行排序,并选取排序靠前的N(N的取值可以根据实际需要进行设定)个答案信息来作为更新答案集合,该更新答案集合即为目标问答信息中问题信息的备选答案,由此便实现对对话系统知识库的优化。
[0057]需要指出的是,利用本方法对对话系统知识库的更新周期可以根据实际需要进行设定(例如可以通过对每天收集到的问答信息进行集中处理从而实现每天对对话系统知识库更新一次),本发明不限于此。同时,该方法在执行时,所获取的海量数据不仅包括用户数据,还包括问答评价系统和用户评价系统的数据。具体地,这些数据包括但不限于:用户的问题信息和对话系统的答案信息、对话系统答案信息的来源、用户的相关数据、答案信息的评分数据以及数据生成的时间等。
[0058]从上述描述可以看出,本实施例所提供的对话系统知识库优化方法实现了对话系统知识库的自学习以及闭环反馈。其中,该方法可以使得对话系统能够对知识库中不好的和不合理的问答信息自主地进行合理化改进,从而使得该系统的质量能够有持续性的提升。同时,该方法还能够使得对话系统实现自主学习,这样也就可以脱离必须依赖维护人员的手动学习方式。
[0059]该方法通过将目标问答信息中的问题信息重新推送给用户来获取用户针对该问题信息的答案,这样便实现了“用户-对话系统-用户”的闭环反馈,因此对话系统也就可以在受到外接干扰时保持自身的稳定性。正是基于这种闭环结构,对话系统才能够持续的接收到来自用户感知层面的反馈,并根据用户的反馈来不断优化自身知识库从而调整自身的输出,以使得这种输出能够符合用户的期望。
[0060]例如对于如上所述的目标问答信息中的问题信息“总自己一个人”,现有的对话系统所反馈的答案信息是无法令用户感到满意的“我不知道你在说什么耶”。而利用本实施例所提供的方法对对话系统知识库进行更新后,对话系统则可以输出诸如“我一直陪在你身边呢”的答案信息,该答案信息显然更加符合用户期望。
[0061 ] 实施例二:
[0062]图2示出了本实施例所提供的对话系统知识库的优化方法的实现流程图。
[0063]如图2所示,本实施例所提供的方法首先在步骤S201中获取待分析问答信息的测评参数,并在步骤S202中判断测评参数是否符合预设优化标准,如果符合,则在步骤S203中将步骤S201中所获取的待分析问答信息作为目标问答信息,目标问答信息即为需要进行优化的问答信息。
[0064]需要指出的是,本实施例中,步骤S201至步骤S203的实现原理以及实现过程与实施例一中步骤SlOl至步骤S103的实现原理以及实现过程相同,故在此不再赘述。
[0065]现有的对话系统在进行问题推送时是不区分用户的,这就可能造成对话系统会将问题信息推送给不适合的用户,这类用户所反馈的答案信息很可能会造成答案信息不可靠和不准确。
[0066]例如,当对话系统向一男性用户推送了问题信息“X牌的化妆品怎么样”,男性用户通常无法准确提供该问题信息的答案,因此也就可能向对话系统反馈诸如“我不知道”或“我用不上化妆品”的答案信息。
[0067]针对上述问题,本实施例所提供的方法优选地通过用户的用户属性来确定问题信息推送的目标用户,从而获取更为准确、可靠的答案信息。
[0068]本实施例中,当确定出对话系统数据库中的目标问答信息后,该方法会把目标问答信息中的问题信息推送给对话系统的特定用户,并记录用户对该问题信息的反馈,从而得到问题信息所对应的回答信息集合。
[0069]具体地,如图2所示,当确定出目标问答信息后,该方法在步骤S204中获取对话系统中不同用户的属性,并在步骤S205中判断步骤S204中所获取到的用户属性是否符合预设问题推送要求。如果用户的用户属性符合预设问题推送要求,那么该方法则在步骤S206中将对应的用户确定为目标用户,并向目标用户推送目标问答信息中的问题信息。
[0070]本实施例中,用于确定用户是否为目标用户的用户属性优选地包括:用户身份信息、用户位置信息、用户年龄信息以及用户性别信息等。例如对于用户年龄信息来说,如果目标问答信息中问题信息所涉及的用户年龄与某用户的年龄处于同一年龄段,那么该用户的属性也就符合预设问题推送要求。
[0071]当然,在本发明的不同实施例中,该方法在步骤S205中进行判断时,既可以仅仅使用以上所列项中的某一项或某几项来进行目标用户的判别,也可以利用以上未列出的其他合理项或其他合理项与上述某一项或某几项的结合来进行目标用户的判别,本发明不限于此。
[0072]当向目标用户推送目标问答信息中的问题信息后,该方法在步骤S207中通过对话系统获取目标用户针对问题信息所反馈的答案信息,从而得到答案信息集合。
[0073]在得到答案信息集合后,该方法在步骤S208中分别计算答案信息集合中各个答案信息的相关度参数,并在步骤S209中根据各个答案信息的相关度参数从答案信息结合中确定出更新答案集合。
[0074]需要指出的是,本实施例中,步骤S207至步骤S209的实现原理与实现过程与实施例一中步骤S104至步骤S106的实现原理以及实现过程类似,故在此不再赘述。
[0075]本实施例中,在对目标问答信息中的答案信息进行更新时,更新后的该问题信息的答案信息优选地将包含多个答案信息,这样用户与对话系统进行交互时,对话系统针对同一问题信息可以向用户反馈多个不同的答案信息,从而避免了用户在询问同一问题时对话系统由于总是输出相同的答案而使得用户感到厌倦,这进一步提高了对话系统的用户体验和用户粘度。
[0076]从上述描述可以看出,本实施例所提供的对话系统知识库优化方法在实施例一所提供的方法的基础上,通过根据用户的属性来向特定的用户推送目标问答信息中的问题信息。由于这类用户的属性与向对话系统输入目标问答信息中问题信息的用户的属性相同或类似,因此通过这类用户也就可以获得针对于目标问答信息中问题信息的更为准确或契合度更高的答案信息,而根据这类答案信息所确定出的上述问题信息的更新答案集合也将更为准确。
[0077]需要指出的是,在本发明的其他实施例中,该方法还可以根据其他合理的参数(例如交互场景和/或交互话题)来从对话系统的多个用户中选取目标用户,本发明不限于此。例如在本发明的一个实施例中,对话系统知识库的优化方法的执行步骤S301至S309与实施例二中的步骤S201至步骤S209大致相同,不同的是,在该实施例中,该方法在步骤S304中所获取的为对话系统的不同用户当前的交互话题,并在步骤S305中是利用交互话题来选取目标用户的。
[0078]在具体应用过程中,如果某一用户与对化系统之间的交互话题是“足球”,而目标问答信息中问题信息是针对“AlphaGo”的,那么此时将问题信息推送给该用户显然是十分突兀的,在这种情况下,将无法保证该用户针对所推送的问题信息所反馈的答案信息的可靠性。因此这种问题信息的推送策略会使得被推送的用户感觉到交互过程受到干扰,从而降低对话系统的用户体验。
[0079]而本实施例所提供的方法正是通过交互话题来从对话系统的大量用户中选取目标用户,当用户的当前交互话题与目标问答信息中问题信息所涉及的话题相关时,此时将问题信息推送给该用户不仅不会使用户感到突兀,还能够让用户感觉对话系统是有“思想”的。在这种情况下,用户针对问题信息所反馈的答案信息显然质量更高,其更能够准确地发映出用户对该问题信息真实回答。
[0080]需要指出的是,在本发明的其他实施例中,该对话系统知识库的优化方法可以将多个不同的参量(例如用户的属性、交互话题和交互场景)相结合来更加精确的选取目标用户,本发明同样不限于此。
[0081]同时,还需要指出的是,在上述描述中,在获取待分析问答信息的测评参数前,还可以对获取到的待分析问答信息进行过滤,以此确定问答信息的合法性。
[0082]本发明还提供了一种对话系统知识库的优化装置,图4示出了本实施例中该装置的结构示意图。
[0083]如图4所示,本实施例所提供的对话系统知识库优化装置优选地包括:目标问答信息获取模块401和更新答案集合生成模块402。其中,目标问答信息获取模块401用户判断待分析问答信息的测评参数是否符合预设优化标准。如果符合,目标问答信息获取模块401则将该问答信息作为目标问答信息,其中目标问答信息即为待优化的问答信息。
[0084]本实施例中,目标问答信息获取模块401所获取到的测评参数优选地为问答评价系统对待分析问答信息的评分。对于问答信息中的问题信息而言,其答案信息的评分越高,也就说明用户对该答案信息的满意程度越高;反之,如果答案信息的评分越低,也就说明用户对该答案信息的满意程度越低,而这类答案信息也正是需要进行优化的信息。
[0085]目标问答信息获取模块401如果判断出待分析问答信息的测评参数的取值小于预设测评阈值,那么目标问答信息获取模块401将判定测评参数符合预设优化标准,因此目标问答信息获取模块401也将判定该待分析问答信息为目标问答信息。
[0086]当确定出目标问答信息后,目标问答信息获取模块401会将目标问答信息传输给更新答案集合生成模块402,以由更新答案集合生成模块402根据目标问答信息生成用于更新目标问答信息中问题信息所对应答案的更新答案集合。
[0087]具体地,本实施例中,更新答案集合生成模块402会在特定的场景下把目标问答信息中的问题信息推送给对话系统的用户,并记录用户对该问题信息的反馈,从而得到问题信息所对应的回答信息集合。
[0088]更新答案集合生成模块402优选地通过用户的用户属性来确定问题信息推送的目标用户,从而获取更为准确、可靠的答案信息。因此,本实施例中,更新答案集合生成模块402在进行问题推送前,会获取对话系统中不同用户的属性,并判断所获取到的用户属性是否符合预设问题推送要求。如果用户的用户属性符合预设问题推送要求,那么更新答案集合生成模块402则将对应的用户确定为目标用户,并向目标用户推送目标问答信息中的问题?目息O
[0089]本实施例中,用于确定用户是否为目标用户的用户属性优选地包括:用户身份信息、用户位置信息、用户年龄信息以及用户性别信息等。当然,在本发明的不同实施例中,更新答案集合生成模块402在对目标用户进行选取时,既可以仅仅使用以上所列项中的某一项或某几项来进行目标用户的判别,也可以利用以上未列出的其他合理项或其他合理项与上述某一项或某几项的结合来进行目标用户的判别,本发明不限于此。
[0090]需要指出的是,在本发明的其他实施例中,更新答案集合生成模块402还可以根据其他合理的参数(例如交互场景和/或交互话题)来从对话系统的多个用户中选取目标用户,本发明不限于此。
[0091]例如在本发明的一个实施例中,更新答案集合生成模块402所获取的用于选取目标用户的参数为对话系统的不同用户当前的交互话题。本实施例所提供的方法正是通过交互话题来从对话系统的大量用户中选取目标用户,当用户的当前交互话题与目标问答信息中问题信息所涉及的话题相关时,此时将问题信息推送给该用户不仅不会使用户感到突兀,还能够让用户感觉对话系统是有“思想”的。在这种情况下,用户针对问题信息所反馈的答案信息显然质量更高,其更能够准确地发映出用户对该问题信息真实回答。
[0092]需要指出的是,在本发明的其他实施例中,该对话系统知识库的优化方法可以将多个不同的参量(例如用户的属性、交互话题和交互场景)相结合来更加精确的选取目标用户,本发明同样不限于此。
[0093]同时,还需要指出的是,在上述描述中,在获取待分析问答信息的测评参数前,还可以对获取到的待分析问答信息进行过滤,以此确定问答信息的合法性。
[0094]当得到答案信息集合后,由于回答信息集合中所包含的答案信息多是由多个不同的用户所反馈的,因此其中既可能包含能够令用户较为满意的答案信息,也可能包含无法令用户满意的答案信息,这样也就需要对答案信息集合进行筛选,以确定能够作为目标问答信息中问题信息的备选答案的信息。
[0095]因此,在得到答案信息集合后,更新答案集合生成模块402分别计算回答信息集合中各个答案信息的相关度参数,并根据相关度参数生成针对目标问答信息中问题信息的更新答案信息集合。
[0096]需要指出的是,本实施例中,更新答案集合生成模块402计算各个答案信息的相关度参数的原理与上述对话系统知识库的优化方法中所阐述的原理相同,故在此不再赘述。
[0097]应该理解的是,本发明所公开的实施例不限于这里所公开的特定结构、处理步骤或材料,而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在此使用的术语仅用于描述特定实施例的目的,而并不意味着限制。
[0098]说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
[0099]虽然上述示例用于说明本发明在一个或多个应用中的原理,但对于本领域的技术人员来说,在不背离本发明的原理和思想的情况下,明显可以在形式上、用法及实施的细节上作各种修改而不用付出创造性劳动。因此,本发明由所附的权利要求书来限定。
【主权项】
1.一种对话系统知识库的优化方法,其特征在于,包括: 目标问答信息获取步骤,判断待分析问答信息的测评参数是否符合优化标准,如符合,则将所述待分析问答信息作为目标问答信息; 更新答案集合生成步骤,基于所述目标问答信息的问题信息获取对应的答案信息集合,分别计算所述答案信息集合中各个答案信息的相关度参数,并根据所述相关度参数生成针对所述目标问答信息中问题信息的更新答案集合。2.如权利要求1所述的方法,其特征在于,在所述目标问答信息获取步骤中,判断所述待分析问答信息的测评参数是否小于预设测评阈值,如果小于,则将所述待分析问答信息作为目标问答信息。3.如权利要求1或2所述的方法,其特征在于,在所述更新答案集合生成步骤中,根据问答信息中问题信息与答案信息是否具有语义相同的中心词来确定答案信息的相关度参数,其中,语义相同的中心词的数量越多,答案信息与问题信息的相关度参数越大。4.如权利要求1或2所述的方法,其特征在于,在获取所述答案信息集合时,按照预设规则选取目标用户,并向所述目标用户推送所述目标问答信息中的问题信息,获取所述目标用户针对所述问题信息所反馈的答案信息,从而得到所述问答信息集合。5.如权利要求4所述的方法,其特征在于,在选取所述目标用户时, 获取对话系统不同用户的用户属性,判断用户属性是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户,其中,所述用户属性包括以下所列项中的任一项或几项: 用户身份信息、用户位置信息、用户年龄信息、用户性别信息; 或,获取对话系统不同用户的交互场景和/或交互话题,判断所述交互场景和/或交互话题是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户。6.一种对话系统知识库的优化装置,其特征在于,包括: 目标问答信息获取模块,其用于判断待分析问答信息的测评参数是否符合优化标准,如符合,则将所述待分析问答信息作为目标问答信息; 更新答案集合生成模块,其用于基于所述目标问答信息的问题信息获取对应的答案信息集合,分别计算所述答案信息集合中各个答案信息的相关度参数,并根据所述相关度参数生成针对所述目标问答信息中问题信息的更新答案集合。7.如权利要求6所述的装置,其特征在于,所述目标问答信息获取模块配置为判断所述待分析问答信息的测评参数是否小于预设测评阈值,如果小于,则将所述待分析问答信息作为目标问答信息。8.如权利要求6或7所述的装置,其特征在于,所述更新答案集合生成模块配置为根据问答信息中问题信息与答案信息是否具有语义相同的中心词来确定答案信息的相关度参数,其中,语义相同的中心词的数量越多,答案信息与问题信息的相关度参数越大。9.如权利要求6或7所述的装置,其特征在于,所述更新答案集合生成模块配置为在获取所述答案信息集合时,按照预设规则选取目标用户,并向所述目标用户推送所述目标问答信息中的问题信息,获取所述目标用户针对所述问题信息所反馈的答案信息,从而得到所述问答信息集合。10.如权利要求9所述的装置,其特征在于,所述更新答案集合生成模块配置为在选取所述目标用户时, 获取对话系统不同用户的用户属性,判断用户属性是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户,其中,所述用户属性包括以下所列项中的任一项或几项: 用户身份信息、用户位置信息、用户年龄信息、用户性别信息; 或,获取对话系统不同用户的交互场景和/或交互话题,判断所述交互场景和/或交互话题是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户。
【文档编号】G06F17/30GK105912697SQ201610262475
【公开日】2016年8月31日
【申请日】2016年4月25日
【发明人】孙永超, 邱模武, 包强
【申请人】北京光年无限科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1