自动问答方法及装置的制造方法

文档序号:10725112
自动问答方法及装置的制造方法
【专利摘要】本发明公开了一种自动问答方法及装置。其中一种方法包括:获取用户的请求信息;对请求信息进行自动分词,得到分词信息;基于分词信息进行请求信息与知识点的匹配处理,当匹配成功时,向用户发送答案;否则,根据用户操作对分词信息进行调整,基于调整后的分词信息进行请求信息与知识点的匹配处理,当匹配成功时,向用户发送答案;否则,重复上述调整、以及匹配处理,直到匹配成功或者达到预定的重复次数。借助于本发明实施例的技术方案,能够提高智能机器人语义识别和匹配的准确率,提升用户体验,满足个性化使用需求,更好的完善智能机器人服务质量与水平。
【专利说明】
自动问答方法及装置
技术领域
[0001]本发明涉及信息处理技术领域,特别是涉及一种自动问答方法及装置。
【背景技术】
[0002]在现有技术中,智能问答知识库中包括了多个知识点,每个所述知识点包括问题和答案。可以根据智能问答知识库对用户输入的请求信息(即问题)进行匹配,在进行匹配时,现有技术中采用智能匹配和模糊匹配两种匹配方式,具体地,用户的请求信息输入后,引擎会根据用户的问句进行分词,在进行了分词后,需要根据词类计算该请求信息与智能问答知识库中问题的语义相似度,若语义相似度大于或者等于预先设置的阈值,则进行抽象语义匹配,即智能匹配;若没有达到预先设置的阈值,则进行关键词匹配,即模糊匹配。但是,在现有技术中,模糊匹配后的匹配结果可能不是十分准确,用户无法对匹配结果进行编辑修改,只能选择最接近的系统识别匹配内容作为自定义问句,因此,采用上述方式并不能很好的理解用户提出的问题,识别准确率低,无法满足用户的要求。

【发明内容】

[0003]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的自动问答方法及装置。
[0004]本发明提供一种自动问答方法,包括:
[0005]提供问答知识库,问答知识库包括多个知识点,每个知识点包括问题和答案;
[0006]获取用户的请求信息;
[0007]对请求信息进行自动分词,得到分词信息;
[0008]基于分词信息进行请求信息与知识点的匹配处理,当匹配成功时,向用户发送答案;否则,根据用户操作对分词信息进行调整,基于调整后的分词信息进行请求信息与知识点的匹配处理,当匹配成功时,向用户发送答案;否则,重复上述调整、以及匹配处理,直到匹配成功或者达到预定的重复次数。
[0009 ]本发明还提供了一种自动问答方法,包括:
[0010]提供问答知识库,问答知识库包括多个知识点,每个知识点包括问题和答案;
[0011]获取用户的请求信息;
[0012]对请求信息进行自动分词,得到并显示分词信息;
[0013]根据用户操作对分词信息进行调整;
[0014]基于调整后的分词信息进行请求信息与知识点的匹配处理,当匹配成功时,向用户发送答案;否则,重复上述显示、调整、以及匹配处理,直到匹配成功或者达到预定的重复次数。
[0015]本发明还提供了一种自动问答装置,包括:获取模块、输入模块、分词模块、匹配模块、调整模块、输出模块和控制模块,其中:
[0016]获取模块,用于获取多个知识点,每个知识点包括问题和答案;
[0017]输入模块,用于获取用户的请求信息;
[0018]分词模块,用于对请求信息进行自动分词,得到分词信息;
[0019]匹配模块,用于基于分词信息或调整后的分词信息进行请求信息与知识点的匹配处理;
[0020]调整模块,用于当基于分词信息进行请求信息与知识点的匹配处理失败时,根据用户操作对分词信息进行调整;
[0021]输出模块,用于当匹配成功时,向用户发送答案;
[0022]控制模块,用于在匹配模块匹配成功的情况下,调用输出模块,在匹配模块匹配失败的情况下,调用调整模块、以及匹配模块,直到匹配成功或者达到预定的重复次数。
[0023]本发明还提供了一种自动问答装置,包括:获取模块、输入模块、分词模块、显示模块、调整模块、匹配模块、输出模块和控制模块,其中:
[0024]获取模块,用于获取多个知识点,每个知识点包括问题和答案;
[0025]输入模块,用于获取用户的请求信息;
[0026]分词模块,用于对请求信息进行自动分词,得到分词信息;
[0027]显示模块,用于在分词模块得到分词信息后,且调整模块根据用户操作对分词信息进行调整前,显示分词信息;
[0028]调整模块,用于根据用户操作对分词信息进行调整;
[0029]匹配模块,用于基于调整后的分词信息进行请求信息与知识点的匹配处理;
[0030]输出模块,用于当匹配成功时,向用户发送答案;
[0031]控制模块,用于在所述匹配模块匹配成功的情况下,调用所述输出模块,在所述匹配模块匹配失败的情况下,调用所述显示模块、所述调整模块、以及所述匹配模块,直到匹配成功或者达到预定的重复次数。
[0032]本发明有益效果如下:
[0033]通过让用户对分词进行编辑修改,再根据修改后的分词重新进行知识点的匹配处理,从而得到满足需求的答案,解决了现有技术中采用智能匹配和模糊匹配不能很好的理解用户提出的问题,识别准确率低,无法满足用户的要求的问题,借助于本发明实施例的技术方案,能够提高智能机器人语义识别和匹配的准确率,提升用户体验,满足个性化使用需求,更好的完善智能机器人服务质量与水平。
[0034]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
【附图说明】
[0035]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0036]图1是本发明方法实施例一的实例I的自动问答方法的流程图;
[0037]图2是本发明方法实施例一的自动问答方法的详细处理的流程图;
[0038]图3是本发明方法实施例的获取用户输入的问题的示意图;
[0039]图4是本发明方法实施例的根据用户输入的问句进行智能匹配的示意图;
[0040]图5是本发明方法实施例的显示分词信息的示意图;
[0041]图6是本发明方法实施例的用户根据需求修改分词的示意图;
[0042]图7是本发明方法实施例的修改分词后进行智能匹配的示意图;
[0043]图8是本发明方法实施例的用户最终得到满足需求的问句及答案的示意图;
[0044]图9是本发明方法实施例二的实例I的自动问答方法的流程图;
[0045]图10是本发明方法实施例一的实例2的自动问答方法的流程图;
[0046]图11是本发明方法实施例二的实例2自动问答方法的流程图;
[0047]图12是本发明装置实施例一的自动问答装置的结构示意图;
[0048]图13是本发明装置实施例二的自动问答装置的的结构示意图。
【具体实施方式】
[0049]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0050]为了解决现有技术中采用智能匹配和模糊匹配不能很好的理解用户提出的问题,识别准确率低,无法满足用户要求的问题,本发明提供了一种自动问答方法及装置,当智能匹配和模糊匹配都不能满足用户需求时,用户可根据实际情况对分词进行编辑修改,并根据修改后的分词重新进行知识点的匹配处理,得到更新后的语义推荐结果。
[0051]以下结合附图以及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。
[0052]方法实施例一
[0053]实例I
[0054]根据本发明的实施例,提供了一种自动问答方法,图1是本发明方法实施例一的实例I的自动问答方法的流程图,如图1所示,根据本发明实施例的自动问答方法包括如下处理:
[0055]步骤101,提供问答知识库,问答知识库包括多个知识点,每个知识点包括问题和答案。
[0056]在问答系统中,知识库起着至关重要的作用,知识库包括多个知识点,每个知识点包括问句和答案,所述问句可以包括一个标准问。具体地,知识库中的知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对,其中,该“问”就是标准问,该“答”就是答案。此外,知识库中的每个知识点还可以有对应于一个标准问的一个或多个扩展问,该扩展问与标准问表达形式略有差异,但是表达的含义相同。
[0057]在知识库中,标准问以及扩展问既可以采用普通问题形式,也可以采用语义表达式形式,其与现有技术相同,在此不再赘述。
[0058]步骤102,获取用户的请求信息。
[0059]在本发明实施例中,该请求信息可以通过语音识别、文字识别等多种方式获取。在本发明实施例中,用户的请求信息一般为用户想要获取某个答案所对应的问题信息。例如,用户的请求信息可以是:如何设置彩铃、如何申请宽带等。
[0060]步骤103,对请求信息进行自动分词,得到分词信息。
[0061]在本发明实施例中,进行自动分词时,一般是根据分词词典进行。在实际应用中,自动分词处理可以采用字典双向最大匹配法、viterbi方法、HMM方法和CRF方法中的一种或多种。
[0062 ]例如,请求信息为:如何设置彩铃,则分词信息为:如何、设置、彩铃。
[0063]步骤104,基于所述分词信息进行所述请求信息与所述知识点的匹配处理,当匹配成功时,向用户发送答案;否则,显示所述分词信息,根据用户操作对所述分词信息进行调整,基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理,当匹配成功时,向用户发送答案;否则,重复上述调整、以及匹配处理,直到匹配成功或者达到预定的重复次数。
[0064]在步骤104中,匹配处理可以采用以下任一种方式:
[0065]方式一:通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功;
[0066]其中,通过方式一进行智能匹配成功后,所述向用户发送答案采用以下方式:将最大语义相似度对应问题的答案直接发送给用户;
[0067]方式二:通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功;
[0068]方式三:先通过语义相似度计算进行智能匹配,当存在语义相似度小于所述阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。
[0069]其中,通过方式二和方式三进行模糊匹配成功后,将关键词匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。
[0070]需要说明的是,对于语义相似度等于阈值的情况,既可以认为匹配成功,也可以认为匹配不成功,当匹配结果不同时,后续进行不同的处理,其不限制本发明的保护范围。
[0071]在智能匹配中,语义相似度计算是问答系统中关键的一步,其结果直接影响到整个系统的准确性。参与语义相似度计算的对象必须是对等的,为了计算知识点和用户的请求信息(即用户问句)的语义相似度,定义这个语义相似度为用户问句与知识点中所有问句(包括所有标准问、扩展问及模板)的最大语义相似度。知识点中问句与用户问句在计算语义相似度时可以通过传统向量空间模型中的向量夹角余弦公式计算。
[0072]需要说明的是,在本发明实施例中,通过如下方式确认是采用智能匹配还是采用模糊匹配,具体地,用户的请求信息输入后,引擎会根据用户的问句进行分词,在进行了分词后,需要根据词类计算该请求信息与智能问答知识库中问题的语义相似度,若语义相似度大于或者等于预先设置的阈值,则进行抽象语义匹配,即智能匹配;若没有达到预先设置的阈值,则进行关键词匹配,即模糊匹配。
[0073]在本发明的其它实施例中,还可以仅采用智能匹配或者模糊匹配进行请求信息与知识点的匹配处理,其不限制本发明的保护范围。
[0074]下面对步骤104中基于分词信息计算请求信息与问题之间的语义相似度进行举例说明。
[0075]在本发明实施例中,假设用户问句为“彩铃如何开通”,目标知识点为“开通彩铃”。目标知识点含有下列扩展问及语义模板:“[如何][开通][彩铃]”、“[彩铃]的[开通]方法有哪些”、“[介绍][彩铃]的[开通][方式]”、“[彩铃]是[如何][开通]的”、“你知道怎么样开通彩铃吗”、“我想要彩铃”。
[0076]首先量化用户问句及目标文档中所有的相似问句及语义模板为η维向量。在量化过程中,模板词类与属于该词类的用户问句中的词归为同一特征词,同义的狭义词类及其包含的词具有相同的权值也可归为同一特征词。上述示例中特征词有:{彩铃、[彩铃]},{开通、[开通]M [如何]、怎么样M [方式]、方法},{有哪些M你},{知道},{我M想要}。因此可以将示例中的所有句子及模板转化为9维向量。随后依次对用户问句向量与标准问、扩展问及语义模板对应的向量进行向量夹角余弦的语义相似度计算,得到具体的相似度值。然后对这些语义相似度值求最大值,本示例中的最大值为用户问句与“[如何][开通][彩铃]”的语义相似度值。在求最大值时可以采用边运算边记录局部最大值的方式以降低运算量。最后将求得的这个最大值作为用户问句与目标知识点的相似度值。
[0077]此外,在基于分词信息进行请求信息与知识点的匹配失败时,说明基于该分词信息不能够匹配到合适的答案,在上述情况下,本发明实施例可以显示分词信息,并提供操作接口供用户修改该分词信息,根据用户操作对分词信息进行调整。在本发明实施例中,用户对分词信息进行调整可以包括以下几种形式至少之一:增加新的分词信息、删除原分词信息、替换原分词信息。例如,原分词信息为:如何、设置、彩铃,修改后的分词信息为:如何用手机设置彩铃,在这个例子中,增加了“用手机”这一新的分词信息。又如,在另一例子中,因新词无法识别,导致分词错误,此时通过调整可以对相同的请求信息给出不同的分词结果。
[0078]在分词信息的修改过程中或者得到调整完成的分词信息后,可以基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理,如果匹配成功,则向用户推送答案,否贝IJ,重复上述显示、调整、以及匹配处理,直到匹配成功,或者,达到预定的重复次数,或者,达到其他的终止条件。其中,上述显示操作是指:显示当前使用的分词信息;上述调整操作是指:对当前使用的分词信息进行修改;上述匹配处理是指:基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理。
[0079]在本发明实施例中,根据用户操作对分词信息进行调整之后,还可以根据调整后的分词信息更新分词词典,其中,分词词典用于对后续请求信息进行分词。通过上述处理,可以使后续分词处理更加的准确,扩大用户使用过程中对关键词的选择范围。
[0080]从上述描述可以看出,在本发明实施例中,智能机器人系统针对用户输入的问题会进行相应的知识匹配,可以包括三种匹配方式:智能匹配、模糊匹配、以及分词修改(重新语义推荐)。优选地,执行上述三种匹配方式的顺序为:智能匹配、模糊匹配、分词修改,具体如下:
[0081 ] 1、智能匹配:即语义推荐,首先通过匹配到的抽象语义进行识别,如果匹配成功,则向用户推送相应的匹配结果,执行智能匹配且匹配成功表明匹配结果完全满足用户需求,如果匹配不成功或用户不满意匹配结果,则进行模糊匹配。
[0082]2、模糊匹配:即显示分词,根据分词信息,进行关键词匹配,如果匹配成功,则向用户推送相应的匹配结果,执行模糊匹配且匹配成功表明匹配结果在一定程度上满足用户需求,但存在一部分的误差,如果匹配不成功或用户不满意匹配结果,则修改分词。
[0083]3、修改分词(重新语义推荐):即用户对分词进行编辑修改,表明“智能匹配”和“模糊匹配”的结果都无法满足用户需求且与之存在很大差距,必须通过人工修改后系统重新语义推荐才能得到用户需要的自定义问句。其中,分词修改的过程包括:将问句拆分成若干个分词,用户调整分词后,先与原始问句比照,将用户调整过的词录入到分词词典,之后再重新进行语义推荐和/或模糊匹配,直至得到用户满意的匹配结果或者达到预定的重复次数。
[0084]以下结合附图,对本发明实施例的上述技术方案进行详细说明。
[0085]本发明实施例的上述技术方案可以用于iBotCloud智能云服务平台,下面以用于iBot Cloud智能云服务平台为例进行举例说明。图2是本发明方法实施例一的自动问答方法的详细处理的流程图,如图2所示,具体包括如下处理:
[0086]步骤201,获取用户输入的问题(对应于上述请求信息);如图3所示,获取用户输入的问题:“怎么样可以到达迪士尼乐园”。
[0087]步骤202,对用户输入的问题进行自动分词。
[0088]步骤203,基于分词信息计算用户输入的问题与知识点中问题的语义相似度,如果该语义相似度大于阈值,则执行步骤204,否则,执行步骤205。
[0089]步骤204,至少将最大语义相似度对应问题的答案发送给用户,或者,将大于阈值的语义相似度所对应的部分或全部问题显示给用户,并根据用户的选择,向用户推送所选问题对应的答案,结束操作,如果用户对于推送的答案或者问题不满意,则执行步骤205。
[0090]在本发明实施例中,可以首先采用智能匹配方式,如图4所示,根据用户输入的问句进行语义识别,得到智能匹配的结果为怎么样到达迪士尼乐园?”、“迪士尼乐园到达的方法?”,可以将这两个匹配结果显示给用户,供用户选择。如图5所示,如果用户对智能匹配的问句不满意时,则进行模糊匹配,可以得到模糊匹配的结果。
[0091 ]步骤205,判断是否达到预定调整次数,如果判断为是,结束操作,否则,执行步骤206。
[0092]步骤206,向用户显示该分词信息。
[0093]步骤207,根据用户操作对分词信息进行调整,获取调整后的分词信息,执行步骤203。
[0094]如图6所示,用户根据需求修改分词,得到“坐地铁是否可以到达迪士尼乐园”。如图7所示,在本发明实施例中,会针对用户修改以后的分词重新进行语义相似度计算,智能匹配出问句坐地铁能否到达迪士尼乐园? ”结果与用户需求的问句高度吻合,识别的准确率明显提升。如图8所示,用户最终得到满足需求的问句及答案。
[0095]本发明实施例的技术方案允许用户对系统匹配的结果进行参与介入。当系统进行的“智能匹配”和“模糊匹配”都不能满足用户的需求时,可以根据用户对匹配中的分词信息的修改,即通过编辑关键词获得更新后的语义推荐结果,从而得到满足需求的自定义问句。借助于本发明实施例的技术方案,能够提高智能机器人语义识别和匹配的准确率,提升用户体验,满足个性化使用需求,更好的完善智能机器人服务质量与水平。
[0096]实例2
[0097]根据本发明的实施例,提供了一种自动问答方法,图10是本发明方法实施例一的实例2的自动问答方法的流程图,如图10所示,根据本发明实施例的自动问答方法包括如下处理:
[0098]步骤1001,提供问答知识库,问答知识库包括多个知识点,每个知识点包括问题和答案。
[0099]在问答系统中,知识库起着至关重要的作用,知识库包括多个知识点,每个知识点包括问句和答案,所述问句可以包括一个标准问。具体地,知识库中的知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对,其中,该“问”就是标准问,该“答”就是答案。此外,知识库中的每个知识点还可以有对应于一个标准问的一个或多个扩展问,该扩展问与标准问表达形式略有差异,但是表达的含义相同。
[0100]在知识库中,标准问以及扩展问既可以采用普通问题形式,也可以采用语义表达式形式,其与现有技术相同,在此不再赘述。
[0101]步骤1002,获取用户的请求信息。
[0102]在本发明实施例中,该请求信息可以通过语音识别、文字识别等多种方式获取。在本发明实施例中,用户的请求信息一般为用户想要获取某个答案所对应的问题信息。例如,用户的请求信息可以是:如何设置彩铃、如何申请宽带等。
[0103]步骤1003,对请求信息进行自动分词,得到并显示分词信息。
[0104]在本发明实施例中,进行自动分词时,一般是根据分词词典进行。在实际应用中,自动分词处理可以采用字典双向最大匹配法、viterbi方法、HMM方法和CRF方法中的一种或多种。
[0105]此外,与方法实施例一不同的是,在本发明实施例中,在进行分词操作后,直接将分词信息显示给用户。
[0106]步骤1004,基于所述分词信息进行所述请求信息与所述知识点的匹配处理,当匹配成功时,向用户发送答案;否则,根据用户操作对所述分词信息进行调整,基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理,当匹配成功时,向用户发送答案;否贝1J,重复上述显示、调整、以及匹配处理,直到匹配成功或者达到预定的重复次数。
[0107]在步骤1004中,匹配处理可以采用以下任一种方式:
[0108]方式一:通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功;
[0109]其中,通过方式一进行智能匹配成功后,所述向用户发送答案采用以下方式:将语义相似度大于阈值的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案;
[0110]方式二:通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功;
[0111]方式三:先通过语义相似度计算进行智能匹配,当存在语义相似度小于所述阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。
[0112]其中,通过方式二和方式三进行模糊匹配成功后,将关键词匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。
[0113]在智能匹配中,语义相似度计算是问答系统中关键的一步,其结果直接影响到整个系统的准确性。参与语义相似度计算的对象必须是对等的,为了计算知识点和用户的请求信息(即用户问句)的语义相似度,定义这个语义相似度为用户问句与知识点中所有问句(包括所有标准问、扩展问及模板)的最大语义相似度。知识点中问句与用户问句在计算语义相似度时可以通过传统向量空间模型中的向量夹角余弦公式计算。
[0114]需要说明的是,通过如下方式确认是采用智能匹配还是采用模糊匹配,具体地,用户的请求信息输入后,引擎会根据用户的问句进行分词,在进行了分词后,需要根据词类计算该请求信息与智能问答知识库中问题的语义相似度,若语义相似度大于或者等于预先设置的值,则进行抽象语义匹配,即智能匹配;若没有达到预先设置的值,则进行关键词匹配,即模糊匹配。
[0115]在本发明的其它实施例中,还可以仅采用智能匹配或者模糊匹配进行请求信息与知识点的匹配处理,其不限制本发明的保护范围。
[0116]下面对步骤104中基于分词信息计算请求信息与问题之间的语义相似度进行举例说明。
[0117]在本发明实施例中,假设用户问句为“彩铃如何开通”,目标知识点为“开通彩铃”。目标知识点含有下列扩展问及语义模板[如何][开通][彩铃]”、“[彩铃]的[开通]方法有哪些”、“[介绍][彩铃]的[开通][方式]”、“[彩铃]是[如何][开通]的”、“你知道怎么样开通彩铃吗”、“我想要彩铃”。
[0118]首先量化用户问句及目标文档中所有的相似问句及语义模板为η维向量。在量化过程中,模板词类与属于该词类的用户问句中的词归为同一特征词,同义的狭义词类及其包含的词具有相同的权值也可归为同一特征词。上述示例中特征词有:{彩铃、[彩铃]},{开通、[开通]M [如何]、怎么样M[方式]、方法},{有哪些M你},{知道},{我M想要}。因此可以将示例中的所有句子及模板转化为9维向量。随后依次对用户问句向量与标准问、扩展问及语义模板对应的向量进行向量夹角余弦的语义相似度计算,得到具体的相似度值。然后对这些语义相似度值求最大值,本示例中的最大值为用户问句与“[如何][开通][彩铃]”的语义相似度值。在求最大值时可以采用边运算边记录局部最大值的方式以降低运算量。最后将求得的这个最大值作为用户问句与目标知识点的相似度值。
[0119]在分词信息的修改过程中或者得到调整完成的分词信息后,可以基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理,如果匹配成功,则向用户推送答案,否贝IJ,重复上述显示、调整、以及匹配处理,直到匹配成功,或者,达到预定的重复次数,或者,达到其他的终止条件。其中,上述显示操作是指:显示当前使用的分词信息;上述调整操作是指:对当前使用的分词信息进行修改;上述匹配处理是指:基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理。
[0120]本发明实施例的上述技术方案可以用于iBotCloud智能云服务平台。
[0121]本发明实施例的技术方案允许用户对系统识别的结果进行参与介入。当用户没有选择系统推送的匹配后的问题时,可以根据用户对分词信息的修改,即通过编辑关键词获得更新后的语义推荐结果,从而得到满足需求的自定义问句。借助于本发明实施例的技术方案,能够提高智能机器人语义识别和匹配的准确率,提升用户体验,满足个性化使用需求,更好的完善智能机器人服务质量与水平。
[0122]方法实施例二
[0123]实例I
[0124]根据本发明的实施例,提供了一种自动问答方法,图9是本发明方法实施例二的实例I的自动问答方法的流程图,如图9所示,根据本发明实施例的自动问答方法包括如下处理:
[0125]步骤901,提供问答知识库,问答知识库包括多个知识点,每个知识点包括问题和答案。
[0126]在问答系统中,知识库起着至关重要的作用,知识库包括多个知识点,每个知识点包括问句和答案,所述问句可以包括一个标准问。具体地,知识库中的知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对,其中,该“问”就是标准问,该“答”就是答案。此外,知识库中的每个知识点还可以有对应于一个标准问的一个或多个扩展问,该扩展问与标准问表达形式略有差异,但是表达的含义相同。
[0127]在知识库中,标准问以及扩展问既可以采用普通问题形式,也可以采用语义表达式形式,其与现有技术相同,在此不再赘述。
[0128]步骤902,获取用户的请求信息。
[0129]在本发明实施例中,该请求信息可以通过语音识别、文字识别等多种方式获取。在本发明实施例中,用户的请求信息一般为用户想要获取某个答案所对应的问题信息。例如,用户的请求信息可以是:如何设置彩铃、如何申请宽带等。
[0130]步骤903,对请求信息进行自动分词,得到并显示分词信息。
[0131]在本发明实施例中,进行自动分词时,一般是根据分词词典进行。在实际应用中,自动分词处理可以采用字典双向最大匹配法、viterbi方法、HMM方法和CRF方法中的一种或多种。
[0132]此外,与方法实施例一的实例I不同的是,在本发明实施例中,在进行分词操作后,直接将分词信息显示给用户。
[0133]步骤904,根据用户操作对分词信息进行调整。在本发明实施例中,用户对分词信息进行调整可以包括以下几种形式至少之一:增加新的分词信息、删除原分词信息、替换原分词信息。
[0134]与方法实施例一不同的是,在进行匹配处理前,本发明实施例直接根据用户操作对分词信息进行调整。
[0135]也就是说,如果用户需要修改分词信息,则可以根据用户的调整操作对该分词信息进行调整。
[0136]在本发明实施例中,根据用户操作对分词信息进行调整后,还可以根据调整后的分词信息更新分词词典,其中,分词词典用于对后续请求信息进行分词。通过上述处理,可以使后续分词处理更加的准确,扩大用户使用过程中对关键词的选择范围。
[0137]步骤905,基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理,当匹配成功时,直接向用户发送答案;否则,重复上述显示、调整、以及匹配处理,直到匹配成功或者达到预定的重复次数。
[0138]在步骤905中,匹配处理可以采用以下任一种方式:
[0139]方式一:通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功;
[0140]其中,通过方式一进行智能匹配成功后,所述向用户发送答案采用以下方式:将最大语义相似度对应问题的答案直接发送给用户;
[0141]方式二:通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功;
[0142]方式三:先通过语义相似度计算进行智能匹配,当存在语义相似度小于所述阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。
[0143]其中,通过方式二和方式三进行模糊匹配成功后,将关键词匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。
[0144]在智能匹配中,语义相似度计算是问答系统中关键的一步,其结果直接影响到整个系统的准确性。参与语义相似度计算的对象必须是对等的,为了计算知识点和用户的请求信息(即用户问句)的语义相似度,定义这个语义相似度为用户问句与知识点中所有问句(包括所有标准问、扩展问及模板)的最大语义相似度。知识点中问句与用户问句在计算语义相似度时可以通过传统向量空间模型中的向量夹角余弦公式计算。
[0145]需要说明的是,通过如下方式确认是采用智能匹配还是采用模糊匹配,具体地,用户的请求信息输入后,引擎会根据用户的问句进行分词,在进行了分词后,需要根据词类计算该请求信息与智能问答知识库中问题的语义相似度,若语义相似度大于或者等于预先设置的值,则进行抽象语义匹配,即智能匹配;若没有达到预先设置的值,则进行关键词匹配,即模糊匹配。
[0146]从上述描述可以看出,在本发明实施例中,智能机器人系统针对用户输入的问题会进行相应的知识匹配,可以包括三种匹配方式:分词修改(重新语义推荐)、智能匹配、以及模糊匹配。优选地,执行上述三种匹配方式的顺序为:分词修改、智能匹配、模糊匹配,具体如下:
[0147]1、修改分词(重新语义推荐):即用户对分词进行编辑修改,表明必须通过人工修改后系统重新语义推荐才能得到用户需要的自定义问句。其中,分词修改的过程包括:将问句拆分成若干个分词,用户调整分词后,先与原始问句比照,将用户调整过的词录入到分词词典,之后再进行语义推荐。
[0148]2、智能匹配:即语义推荐,首先通过匹配到的抽象语义进行识别,如果匹配成功,则向用户推送相应的匹配结果,执行智能匹配且匹配成功表明匹配结果完全满足用户需求,如果匹配不成功或用户不满意匹配结果,则进行模糊匹配。
[0149]3、模糊匹配:即显示分词,根据分词信息,进行关键词匹配,如果匹配成功,则向用户推送相应的匹配结果,执行模糊匹配且匹配成功表明匹配结果在一定程度上满足用户需求,但存在一部分的误差,如果匹配不成功或用户不满意匹配结果,则重新修改分词,直至得到用户满意的匹配结果或者达到预定的重复次数。
[0150]需要说明的是,本发明实施例的上述技术方案可以用于iBotCloud智能云服务平台。
[0151]本发明实施例的技术方案允许用户对系统识别的结果进行参与介入。当系统进行分词后,直接将分词信息显示给用户供用户进行修改,即通过编辑关键词获得更新后的语义推荐结果。借助于本发明实施例的技术方案,能够提高智能机器人语义识别和匹配的准确率,提升用户体验,满足个性化使用需求,更好的完善智能机器人服务质量与水平。
[0152]实例2
[0153]根据本发明的实施例,提供了一种自动问答方法,图11是本发明方法实施例二的实例2自动问答方法的流程图,如图11所示,根据本发明实施例的自动问答方法包括如下处理:
[0154]步骤1101,提供问答知识库,问答知识库包括多个知识点,每个知识点包括问题和答案;
[0155]在问答系统中,知识库起着至关重要的作用,知识库包括多个知识点,每个知识点包括问句和答案,所述问句可以包括一个标准问。具体地,知识库中的知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对,其中,该“问”就是标准问,该“答”就是答案。此外,知识库中的每个知识点还可以有对应于一个标准问的一个或多个扩展问,该扩展问与标准问表达形式略有差异,但是表达的含义相同。
[0156]在知识库中,标准问以及扩展问既可以采用普通问题形式,也可以采用语义表达式形式,其与现有技术相同,在此不再赘述。
[0157]步骤1102,获取用户的请求信息;
[0158]在本发明实施例中,该请求信息可以通过语音识别、文字识别等多种方式获取。在本发明实施例中,用户的请求信息一般为用户想要获取某个答案所对应的问题信息。例如,用户的请求信息可以是:如何设置彩铃、如何申请宽带等。
[0159]步骤1103,对请求信息进行自动分词,得到并显示分词信息;
[0160]在本发明实施例中,进行自动分词时,一般是根据分词词典进行。在实际应用中,自动分词处理可以采用字典双向最大匹配法、viterbi方法、HMM方法和CRF方法中的一种或多种。
[0161 ]此外,与方法实施例一的实例I不同的是,在本发明实施例中,在进行分词操作后,直接将分词信息显示给用户。
[0162]步骤1104,根据用户操作对分词信息进行调整;
[0163]也就是说,如果用户需要修改分词信息,则可以根据用户的调整操作对该分词信息进行调整,如果用户认为不需要修改分词信息,则保持分词信息不变。
[0164]在本发明实施例中,根据用户操作对分词信息进行调整后,还可以根据调整后的分词信息更新分词词典,其中,分词词典用于对后续请求信息进行分词。通过上述处理,可以使后续分词处理更加的准确,扩大用户使用过程中对关键词的选择范围。
[0165]步骤1105,基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理,当匹配成功时,向用户发送问题后,根据用户的选择发送对应的答案;否则,重复上述显示、调整、以及匹配处理,直到匹配成功或者达到预定的重复次数。
[0166]具体地,在步骤1105中,匹配处理可以采用以下任一种方式:
[0167]方式一:通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功;其中,通过方式一进行智能匹配成功后,所述向用户发送答案采用以下方式:将语义相似度大于阈值的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案;
[0168]方式二:通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功;
[0169]方式三:先通过语义相似度计算进行智能匹配,当存在语义相似度小于所述阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。
[0170]其中,通过方式二和方式三进行模糊匹配成功后,将关键词匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。
[0171]本发明实施例的技术方案允许用户对系统识别的结果进行参与介入。当系统进行分词后,直接将分词信息显示给用户供用户进行修改,即通过编辑关键词获得更新后的语义推荐结果,随后,根据用户的选择的问题(即语义推荐结果),向用户推送相应的答案。借助于本发明实施例的技术方案,能够提高智能机器人语义识别和匹配的准确率,提升用户体验,满足个性化使用需求,更好的完善智能机器人服务质量与水平。
[0172]装置实施例一
[0173]根据本发明的实施例,提供了一种自动问答装置,图12是本发明装置实施例一的自动问答装置的结构示意图,如图12所示,根据本发明实施例的自动问答装置包括:获取模块120、输入模块121、分词模块12 2、匹配模块123、调整模块124、输出模块125和控制模块126,以下结合附图,对本发明实施例的上述技术方案进行详细说明。
[0174]获取模块120,用于获取多个知识点,每个知识点包括问题和答案;
[0175]在问答系统中,获取模块120需要从知识库获取知识点,知识库起着至关重要的作用,知识库包括多个知识点,每个知识点包括问句和答案,所述问句可以包括一个标准问。具体地,知识库中的知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问_答”对,其中,该“问”就是标准问,该“答”就是答案。此外,知识库中的每个知识点还可以有对应于一个标准问的一个或多个扩展问,该扩展问与标准问表达形式略有差异,但是表达的含义相同。
[0176]在知识库中,标准问以及扩展问既可以采用普通问题形式,也可以采用语义表达式形式,其与现有技术相同,在此不再赘述。
[0177]输入模块121,用于获取用户的请求信息;
[0178]在本发明实施例中,该请求信息可以通过语音识别、文字识别等多种方式获取。在本发明实施例中,用户的请求信息一般为用户想要获取某个答案所对应的问题信息。例如,用户的请求信息可以是:如何设置彩铃、如何申请宽带等。
[0179]分词模块122,用于对请求信息进行自动分词,得到分词信息;
[0180]在本发明实施例中,进行自动分词时,一般是根据分词词典进行。在实际应用中,自动分词处理可以采用字典双向最大匹配法、viterbi方法、HMM方法和CRF方法中的一种或多种。
[0181]例如,请求信息为:如何设置彩铃,则分词信息为:如何、设置、彩铃。
[0182]匹配模块123,用于基于分词信息或调整后的分词信息进行请求信息与知识点的匹配处理;匹配模块123具体用于:
[0183]采用以下任一种方式进行匹配处理:
[0184]方式一:通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功;
[0185]方式二:通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功;
[0186]方式三:先通过语义相似度计算进行智能匹配,当存在语义相似度小于阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。
[0187]在智能匹配中,语义相似度计算是问答系统中关键的一步,其结果直接影响到整个系统的准确性。参与语义相似度计算的对象必须是对等的,为了计算知识点和用户的请求信息(即用户问句)的语义相似度,定义这个语义相似度为用户问句与知识点中所有问句(包括所有标准问、扩展问及模板)的最大语义相似度。知识点中问句与用户问句在计算语义相似度时可以通过传统向量空间模型中的向量夹角余弦公式计算。
[0188]需要说明的是,在本发明实施例中,通过如下方式确认是采用智能匹配还是采用模糊匹配,具体地,用户的请求信息输入后,引擎会根据用户的问句进行分词,在进行了分词后,需要根据词类计算该请求信息与智能问答知识库中问题的语义相似度,若语义相似度大于或者等于预先设置的值,则进行抽象语义匹配,即智能匹配;若没有达到预先设置的值,则进行关键词匹配,即模糊匹配。
[0189]在本发明的其它实施例中,还可以仅采用智能匹配或者模糊匹配进行请求信息与知识点的匹配处理,其不限制本发明的保护范围。
[0190]调整模块124,用于当基于分词信息进行请求信息与知识点的匹配处理失败时,根据用户操作对分词信息进行调整;
[0191]此外,在基于分词信息进行请求信息与知识点的匹配失败时,说明基于该分词信息不能够匹配到合适的答案,在上述情况下,本发明实施例可以显示分词信息,并提供操作接口供用户修改该分词信息,根据用户操作对分词信息进行调整。在本发明实施例中,用户对分词信息进行调整可以包括以下几种形式至少之一:增加新的分词信息、删除原分词信息、替换原分词信息。例如,原分词信息为:如何、设置、彩铃,修改后的分词信息为:如何用手机设置彩铃,在这个例子中,增加了“用手机”这一新的分词信息。又如,在另一例子中,因新词无法识别,导致分词错误,此时通过调整可以对相同的请求信息给出不同的分词结果。
[0192]输出模块125,用于当匹配成功时,向用户发送答案;输出模块125具体用于:
[0193]在匹配模块123通过语义相似度计算进行智能匹配成功后,向用户发送答案采用以下任一种方式:
[0194]将最大语义相似度对应问题的答案直接发送给用户;
[0195]将语义相似度大于阈值的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案;
[0196]在匹配模块123通过关键词搜索进行模糊匹配成功后,向用户发送答案的方式包括:
[0197]将关键词匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。
[0198]控制模块126,用于在匹配模块123匹配成功的情况下,调用输出模块125,在匹配模块123匹配失败的情况下,调用调整模块124、以及匹配模块123,直到匹配成功或者达到预定的重复次数。
[0199 ]优选地,在本发明实施例中,装置还包括:
[0200]显示模块,用于分词模块122对请求信息进行自动分词之后且匹配模块123基于分词信息进行请求信息与知识点的匹配处理之前,显示分词信息;或者,匹配模块123基于分词信息进行请求信息与知识点的匹配处理失败之后且调整模块124根据用户操作对分词信息进行调整之前,显示分词信息。
[0201]更新模块,用于根据调整后的分词信息更新分词词典,其中,分词词典用于对后续请求信息进行分词。
[0202]从上述描述可以看出,在本发明实施例中,智能机器人系统针对用户输入的问题会进行相应的知识匹配,可以包括三种匹配方式:智能匹配、模糊匹配、以及分词修改(重新语义推荐)。优选地,执行上述三种匹配方式的顺序为:智能匹配、模糊匹配、分词修改,具体如下:
[0203]1、智能匹配:即语义推荐,首先通过匹配到的抽象语义进行识别,如果匹配成功,则向用户推送相应的匹配结果,执行智能匹配且匹配成功表明匹配结果完全满足用户需求,如果匹配不成功或用户不满意匹配结果,则进行模糊匹配。
[0204]2、模糊匹配:即显示分词,根据分词信息,进行关键词匹配,如果匹配成功,则向用户推送相应的匹配结果,执行模糊匹配且匹配成功表明匹配结果在一定程度上满足用户需求,但存在一部分的误差,如果匹配不成功或用户不满意匹配结果,则修改分词。
[0205]3、修改分词(重新语义推荐):即用户对分词进行编辑修改,表明“智能匹配”和“模糊匹配”的结果都无法满足用户需求且与之存在很大差距,必须通过人工修改后系统重新语义推荐才能得到用户需要的自定义问句。其中,分词修改的过程包括:将问句拆分成若干个分词,用户调整分词后,先与原始问句比照,将用户调整过的词录入到分词词典,之后再重新进行语义推荐和/或模糊匹配,直至得到用户满意的匹配结果或者达到预定的重复次数。
[0206]本发明实施例的技术方案允许用户对系统识别的结果进行参与介入。当系统进行的“智能匹配”和“模糊匹配”都不能满足用户的需求时,可以根据用户对“模糊匹配”中的分词信息的修改,即通过编辑关键词获得更新后的语义推荐结果,从而得到满足需求的自定义问句。借助于本发明实施例的技术方案,能够提高智能机器人语义识别和匹配的准确率,提升用户体验,满足个性化使用需求,更好的完善智能机器人服务质量与水平。关键词匹配
[0207]装置实施例二
[0208]根据本发明的实施例,提供了一种自动问答装置,图13是本发明装置实施例二的自动问答装置的的结构示意图,如图13所示,根据本发明实施例的自动问答装置包括:获取模块130、输入模块131、分词模块132、显不模块133、调整模块134、匹配模块135、输出模块136和控制模块137,以下结合附图,对本发明实施例的技术方案进行说明。
[0209]获取模块130,用于获取多个知识点,每个知识点包括问题和答案;
[0210]在本发明实施例中,获取模块130从知识库获取知识点,在问答系统中,知识库起着至关重要的作用,知识库包括多个知识点,每个知识点包括问句和答案,所述问句可以包括一个标准问。具体地,知识库中的知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对,其中,该“问”就是标准问,该“答”就是答案。此外,知识库中的每个知识点还可以有对应于一个标准问的一个或多个扩展问,该扩展问与标准问表达形式略有差异,但是表达的含义相同。
[0211]在知识库中,标准问以及扩展问既可以采用普通问题形式,也可以采用语义表达式形式,其与现有技术相同,在此不再赘述。
[0212]输入模块131,用于获取用户的请求信息;在本发明实施例中,该请求信息可以通过语音识别、文字识别等多种方式获取。在本发明实施例中,用户的请求信息一般为用户想要获取某个答案所对应的问题信息。例如,用户的请求信息可以是:如何设置彩铃、如何申请宽带等。
[0213]分词模块132,用于对请求信息进行自动分词,得到分词信息;
[0214]在本发明实施例中,进行自动分词时,一般是根据分词词典进行。在实际应用中,自动分词处理可以采用字典双向最大匹配法、viterbi方法、HMM方法和CRF方法中的一种或多种。
[0215]显示模块133,用于在分词模块132得到分词信息后,且调整模块134根据用户操作对分词信息进行调整前,显示分词信息;
[0216]此外,与装置实施例一不同的是,在本发明实施例中,在进行分词操作后,直接将分词信息显示给用户。
[0217]调整模块134,用于根据用户操作对分词信息进行调整;调整模块134采用以下方式至少之一对所述分词信息进行调整:增加新的分词信息、删除原分词信息、替换原分词信息。
[0218]也就是说,如果用户需要修改分词信息,则可以根据用户的调整操作对该分词信息进行调整。
[0219]匹配模块135,用于基于调整后的分词信息进行请求信息与知识点的匹配处理;匹配模块135具体用于:
[0220]采用以下任一种方式进行匹配处理:
[0221]通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功;
[0222]通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功;
[0223]先通过语义相似度计算进行智能匹配,当存在语义相似度小于阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。
[0224]输出模块136,用于当匹配成功时,向用户发送答案;输出模块136具体用于:
[0225]在匹配模块135通过语义相似度计算进行智能匹配成功后,向用户发送答案采用以下任一种方式:
[0226]将最大语义相似度对应问题的答案直接发送给用户;
[0227]将语义相似度大于阈值的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案;
[0228]在匹配模块135通过关键词搜索进行模糊匹配成功后,向用户发送答案的方式包括:
[0229]将关键词匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。
[0230]匹配处理可以采用以下任一种方式:
[0231 ]方式一:通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功;
[0232]其中,通过方式一进行智能匹配成功后,向用户发送答案采用以下方式:将最大语义相似度对应问题的答案直接发送给用户;
[0233]方式二:通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功;
[0234]方式三:先通过语义相似度计算进行智能匹配,当存在语义相似度小于阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。
[0235]其中,通过方式二和方式三进行模糊匹配成功后,将关键词匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。
[0236]在智能匹配中,语义相似度计算是问答系统中关键的一步,其结果直接影响到整个系统的准确性。参与语义相似度计算的对象必须是对等的,为了计算知识点和用户的请求信息(即用户问句)的语义相似度,定义这个语义相似度为用户问句与知识点中所有问句(包括所有标准问、扩展问及模板)的最大语义相似度。知识点中问句与用户问句在计算语义相似度时可以通过传统向量空间模型中的向量夹角余弦公式计算。
[0237]需要说明的是,通过如下方式确认是采用智能匹配还是采用模糊匹配,具体地,用户的请求信息输入后,引擎会根据用户的问句进行分词,在进行了分词后,需要根据词类计算该请求信息与智能问答知识库中问题的语义相似度,若语义相似度大于或者等于预先设置的值,则进行抽象语义匹配,即智能匹配;若没有达到预先设置的值,则进行关键词匹配,即模糊匹配。
[0238]控制模块137,用于在匹配模块135匹配成功的情况下,调用输出模块136,在匹配模块135匹配失败的情况下,调用显示模块133、调整模块134、以及匹配模块135,直到匹配成功或者达到预定的重复次数。
[0239]优选地,上述装置进一步包括:
[0240]更新模块,用于根据调整后的分词信息更新分词词典,其中,分词词典用于对后续请求信息进行分词。
[0241]从上述描述可以看出,在本发明实施例中,智能机器人系统针对用户输入的问题会进行相应的知识匹配,可以包括三种匹配方式:分词修改(重新语义推荐)、智能匹配、以及模糊匹配。优选地,执行上述三种匹配方式的顺序为:分词修改、智能匹配、模糊匹配,具体如下:
[0242]1、修改分词(重新语义推荐):即用户对分词进行编辑修改,表明必须通过人工修改后系统重新语义推荐才能得到用户需要的自定义问句。其中,分词修改的过程包括:将问句拆分成若干个分词,用户调整分词后,先与原始问句比照,将用户调整过的词录入到分词词典,之后再进行语义推荐。
[0243]2、智能匹配:即语义推荐,首先通过匹配到的抽象语义进行识别,如果匹配成功,则向用户推送相应的匹配结果,执行智能匹配且匹配成功表明匹配结果完全满足用户需求,如果匹配不成功或用户不满意匹配结果,则进行模糊匹配。
[0244]3、模糊匹配:即显示分词,根据分词信息,进行关键词匹配,如果匹配成功,则向用户推送相应的匹配结果,执行模糊匹配且匹配成功表明匹配结果在一定程度上满足用户需求,但存在一部分的误差,如果匹配不成功或用户不满意匹配结果,则重新修改分词,直至得到用户满意的匹配结果或者达到预定的重复次数。
[0245]需要说明的是,本发明实施例的上述技术方案可以用于iBotCloud智能云服务平台。
[0246]关键词匹配关键词匹配本发明实施例的技术方案允许用户对系统识别的结果进行参与介入。当系统进行分词后,直接将分词信息显示给用户供用户进行修改,即通过编辑关键词获得更新后的语义推荐结果,随后,根据用户的选择的问题(即语义推荐结果),向用户推送相应的答案。借助于本发明实施例的技术方案,能够提高智能机器人语义识别和匹配的准确率,提升用户体验,满足个性化使用需求,更好的完善智能机器人服务质量与水平。
[0247]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
[0248]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0249]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0250]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0251]本领域那些技术人员可以理解,可以对实施例中的客户端中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个客户端中。可以把实施例中的模块组合成一个模块,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者客户端的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0252]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0253]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的加载有排序网址的客户端中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0254]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
【主权项】
1.一种自动问答方法,其特征在于,包括: 提供问答知识库,所述问答知识库包括多个知识点,每个所述知识点包括问题和答案; 获取用户的请求信息; 对所述请求信息进行自动分词,得到分词信息; 基于所述分词信息进行所述请求信息与所述知识点的匹配处理,当匹配成功时,向用户发送答案;否则,根据用户操作对所述分词信息进行调整,基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理,当匹配成功时,向用户发送答案;否则,重复上述调整、以及匹配处理,直到匹配成功或者达到预定的重复次数。2.如权利要求1所述的方法,其特征在于,所述方法进一步包括: 对所述请求信息进行自动分词之后且基于所述分词信息进行所述请求信息与所述知识点的匹配处理之前,显示所述分词信息;或者, 基于所述分词信息进行所述请求信息与所述知识点的匹配处理失败之后且根据用户操作对所述分词信息进行调整之前,显示所述分词信息。3.如权利要求1所述的方法,其特征在于,所述匹配处理采用以下任一种方式: 通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功; 通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功; 先通过语义相似度计算进行智能匹配,当存在语义相似度小于所述阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。4.如权利要求3所述的方法,其特征在于,通过语义相似度计算进行智能匹配成功后,所述向用户发送答案采用以下任一种方式: 将最大语义相似度对应问题的答案直接发送给用户; 将语义相似度大于阈值的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案; 通过关键词搜索进行模糊匹配成功后,所述向用户发送答案的方式包括: 将关键字匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。5.如权利要求1所述的方法,其特征在于,根据用户操作对所述分词信息进行调整的方式包括以下至少之一:增加新的分词信息、删除原分词信息、替换原分词信息。6.如权利要求1所述的方法,其特征在于,根据用户操作对所述分词信息进行调整之后,所述方法进一步包括: 根据调整后的分词信息更新分词词典,其中,所述分词词典用于对后续请求信息进行分词。7.—种自动问答方法,其特征在于,包括: 提供问答知识库,所述问答知识库包括多个知识点,每个所述知识点包括问题和答案; 获取用户的请求信息; 对所述请求信息进行自动分词,得到并显示分词信息; 根据用户操作对所述分词信息进行调整;基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理,当匹配成功时,向用户发送答案;否则,重复上述显示、调整、以及匹配处理,直到匹配成功或者达到预定的重复次数。8.如权利要求7所述的方法,其特征在于,所述匹配处理采用以下任一种方式: 通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功; 通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功; 先通过语义相似度计算进行智能匹配,当存在语义相似度小于所述阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。9.如权利要求7所述的方法,其特征在于,通过语义相似度计算进行智能匹配成功后,所述向用户发送答案采用以下任一种方式: 将最大语义相似度对应问题的答案直接发送给用户; 将语义相似度大于阈值的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案; 通过关键词搜索进行模糊匹配成功后,所述向用户发送答案的方式包括: 将关键字匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。10.如权利要求7所述的方法,其特征在于,根据用户操作对所述分词信息进行调整的方式包括以下至少之一:增加新的分词信息、删除原分词信息、替换原分词信息。11.如权利要求7所述的方法,其特征在于,根据用户操作对所述分词信息进行调整之后,所述方法进一步包括: 根据调整后的所述分词信息更新分词词典,其中,所述分词词典用于对后续请求信息进行分词。12.—种自动问答装置,其特征在于,包括:获取模块、输入模块、分词模块、匹配模块、调整模块、输出模块和控制模块,其中: 获取模块,用于获取多个知识点,每个所述知识点包括问题和答案; 输入模块,用于获取用户的请求信息; 分词模块,用于对所述请求信息进行自动分词,得到分词信息; 匹配模块,用于基于所述分词信息或调整后的分词信息进行所述请求信息与所述知识点的匹配处理; 调整模块,用于当基于所述分词信息进行所述请求信息与所述知识点的匹配处理失败时,根据用户操作对所述分词信息进行调整; 输出模块,用于当匹配成功时,向用户发送答案; 控制模块,用于在所述匹配模块匹配成功的情况下,调用所述输出模块,在所述匹配模块匹配失败的情况下,调用所述调整模块、以及所述匹配模块,直到匹配成功或者达到预定的重复次数。13.如权利要求12所述的装置,其特征在于,所述装置还包括: 显示模块,用于所述分词模块对所述请求信息进行自动分词之后且所述匹配模块基于所述分词信息进行所述请求信息与所述知识点的匹配处理之前,显示所述分词信息;或者,所述匹配模块基于所述分词信息进行所述请求信息与所述知识点的匹配处理失败之后且所述调整模块根据用户操作对所述分词信息进行调整之前,显示所述分词信息。14.如权利要求12所述的装置,其特征在于,所述匹配模块具体用于: 采用以下任一种方式进行匹配处理: 通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功; 通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功; 先通过语义相似度计算进行智能匹配,当存在语义相似度小于所述阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。15.如权利要求14所述的装置,其特征在于,所述输出模块具体用于: 在所述匹配模块通过语义相似度计算进行智能匹配成功后,所述向用户发送答案采用以下任一种方式: 将最大语义相似度对应问题的答案直接发送给用户; 将语义相似度大于阈值的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案; 在所述匹配模块通过关键词搜索进行模糊匹配成功后,所述向用户发送答案的方式包括: 将关键字匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。16.如权利要求12所述的装置,其特征在于,所述调整模块具体用于: 采用以下方式至少之一对所述分词信息进行调整:增加新的分词信息、删除原分词信息、替换原分词信息。17.如权利要求12所述的装置,其特征在于,所述装置进一步包括: 更新模块,用于根据调整后的分词信息更新分词词典,其中,所述分词词典用于对后续请求信息进行分词。18.—种自动问答装置,其特征在于,包括:获取模块、输入模块、分词模块、显示模块、调整模块、匹配模块、输出模块和控制模块,其中: 获取模块,用于获取多个知识点,每个所述知识点包括问题和答案; 输入模块,用于获取用户的请求信息; 分词模块,用于对所述请求信息进行自动分词,得到分词信息; 显示模块,用于在所述分词模块得到分词信息后,且调整模块根据用户操作对所述分词信息进行调整前,显示所述分词信息; 调整模块,用于根据用户操作对所述分词信息进行调整; 匹配模块,用于基于调整后的分词信息进行所述请求信息与所述知识点的匹配处理; 输出模块,用于当匹配成功时,向用户发送答案; 控制模块,用于在所述匹配模块匹配成功的情况下,调用所述输出模块,在所述匹配模块匹配失败的情况下,调用所述显示模块、所述调整模块、以及所述匹配模块,直到匹配成功或者达到预定的重复次数。19.如权利要求18所述的装置,其特征在于,所述匹配模块具体用于: 采用以下任一种方式进行匹配处理: 通过语义相似度计算进行智能匹配,当存在语义相似度大于阈值时,匹配成功; 通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功; 先通过语义相似度计算进行智能匹配,当存在语义相似度小于所述阈值时,再通过关键词搜索进行模糊匹配,当匹配结果中有用户选择的问题时,匹配成功。20.如权利要求19所述的装置,其特征在于,所述输出模块具体用于: 在所述匹配模块通过语义相似度计算进行智能匹配成功后,所述向用户发送答案采用以下任一种方式: 将最大语义相似度对应问题的答案直接发送给用户; 将语义相似度大于阈值的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案; 在所述匹配模块通过关键词搜索进行模糊匹配成功后,所述向用户发送答案的方式包括: 将关键字匹配成功的全部或部分问题发送给用户,并根据用户的选择,向用户发送所选问题对应的答案。21.如权利要求18所述的装置,其特征在于,所述调整模块具体用于: 采用以下方式至少之一对所述分词信息进行调整:增加新的分词信息、删除原分词信息、替换原分词信息。22.如权利要求18所述的装置,其特征在于,所述装置进一步包括: 更新模块,用于根据调整后的分词信息更新分词词典,其中,所述分词词典用于对后续请求信息进行分词。
【文档编号】G06F17/30GK106095988SQ201610452735
【公开日】2016年11月9日
【申请日】2016年6月21日
【发明人】刘海瀚, 朱频频
【申请人】上海智臻智能网络科技股份有限公司
再多了解一些
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1