智能问答系统的信息处理方法及信息处理装置的制造方法

文档序号:9911003阅读:400来源:国知局
智能问答系统的信息处理方法及信息处理装置的制造方法
【技术领域】
[0001]本发明涉及人机交互技术领域,尤其涉及智能问答系统的信息处理方法及信息处理装置。
【背景技术】
[0002]人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。
[0003]智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。为此,智能问答系统中有一套知识库,里面有大量的问题和与每个问题相对应的答案。智能问答系统首先需要识别用户所提出的问题,即从知识库中找到与该用户问题所对应的问题,然后找出与该问题相匹配的答案。
[0004]如何提高智能问答系统的答复正确率是一项重要挑战。

【发明内容】

[0005]以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
[0006]根据本发明的一方面,提供了一种智能问答系统的信息处理方法,该智能问答系统包括标准问数据库,该信息处理方法包括:
[0007]执行用户问题与该标准问数据库的语义相似度计算以确定该用户问题是否被定位至该标准问数据库中的标准问;
[0008]响应于该用户问题未被定位至该标准问数据库中的标准问判断该用户问题是否包括口语化表述;
[0009]响应于该用户问题包括口语化表述对该用户问题进行语句调整;以及
[0010]用经语句调整后的用户问题执行与该标准问数据库的相似度计算来定位标准问。
[0011]在一实例中,该判断该用户问题是否包括口语化表述:
[0012]对该用户问题分词以得到多个词;
[0013]对照口语数据库以查找该用户问题是否包括属于口语化表述的词。
[0014]在一实例中,该对用户问题进行语句调整包括:
[0015]对该多个词中属于该口语化表述的词进行口语校正处理,该口语校正处理包括词序颠倒、删除、替换中的任意一者或任意组合。
[0016]在一实例中,该口语化表述包括词序颠倒的连续两个单字词,该对该多个词进行口语校正处理具体包括:
[0017]对该多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个新词。
[0018]在一实例中,该口语化表述包括口语语气词,该对该多个词进行口语校正处理包括:
[0019]将介于第一词和第二词之间的口语语气词删除;以及
[0020]将该第一词和该第二词组合在一起以构成一个新词。
[0021]在一实例中,该口语语气词包括以下一者或多者:的、个、了、一个、一下、下。
[0022]在一实例中,该口语化表述包括口语否定词,该对该多个词进行口语校正处理具体包括:
[0023]用正式否定词来替换该口语否定词;
[0024]将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词;以及
[0025]将该正式否定词放置在所构成的新词之前。
[0026]在一实例中,该口语否定词包括以下一者或多者:不了、不上。
[0027]根据本发明的另一方面,提供了一种智能问答系统的信息处理装置,该智能问答系统包括标准问数据库,该信息处理装置包括:
[0028]语义相似度计算模块,用于执行用户问题与该标准问数据库的语义相似度计算以确定该用户问题是否被定位至该标准问数据库中的标准问;
[0029]口语判断模块,用于响应于该用户问题未被定位至该标准问数据库中的标准问判断该用户问题是否包括口语化表述;以及
[0030]语句调整模块,用于响应于该用户问题包括口语化表述对该用户问题进行语句调整,
[0031]其中该语义相似度计算模块还用经语句调整后的用户问题执行与该标准问数据库的相似度计算来定位标准问。
[0032]在一实例中,该口语判断模块包括:
[0033]分词模块,用于对该用户问题分词以得到多个词;以及
[0034]查找模块,用于对照口语数据库以查找该用户问题是否包括属于口语化表述的
Τ.κ| ο
[0035]在一实例中,该语句调整模块包括:
[0036]口语校正模块,用于对该多个词中属于该口语化表述的词进行口语校正处理,该口语校正处理包括词序颠倒、删除、替换中的任意一者或任意组合。
[0037]在一实例中,该口语化表述包括词序颠倒的连续两个单字词,该口语校正模块包括:
[0038]词序编辑模块,用于对该多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个新词。
[0039]在一实例中,该口语化表述包括口语语气词,该口语校正模块包括:
[0040]删除模块,用于将介于第一词和第二词之间的口语语气词删除;以及
[0041]重组模块,用于将该第一词和该第二词组合在一起以构成一个新词。
[0042]在一实例中,该口语化表述包括口语否定词,该口语校正模块包括:
[0043]替换模块,用于用正式否定词来替换该口语否定词;
[0044]重组模块,用于将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词;以及
[0045]词序编辑模块,用于将该正式否定词放置在所构成的新词之前。
[0046]由于用户问题经过了调整,那些包括口语化表述以致无法识别的用户问题就可以精确定位至对应的标准问,从而可以极大地提高智能问答系统的答复正确率,并且可以加快知识运维效率,降低知识运维的人工成本。
【附图说明】
[0047]在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
[0048]图1是示出了根据本发明的一方面的智能问答系统的信息处理方法的流程图;以及
[0049]图2是示出了根据本发明的一方面的智能问答系统的信息处理装置的框图。
【具体实施方式】
[0050]以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。
[0051]知识库中的基本知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。在本发明中,“标准问”是用来表示某个知识点的文字,主要目标是表达清晰,便于维护。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。
[0052]用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别系统马上能够理解用户的意思。但是,往往用户使用的问题与标准问有一定差异。因此,实践中,会对用户问题与标准问执行语义相似度计算,只要语义相似度达到一定程度,则认为用户所问的问题即对应该标准问,从而提供与该标准问对应的答案。
[0053]由于标准问一般是比较正式规范的问句,因此当用户提出的问题采用比较规范的表述时,比较容易定位到该用户问题所对应的标准问。然而当用户采用非常口语化的问句时,可能难以定位该用户问题所对应的标准问。
[0054]在本发明中,可以对用户的口语化的用户问题进行适当调整,将口语化的用户问题调整为比较规范的问句,从而大大提高了定位该用户问题所对应的标准问的成功率。
[0055]图1是示出了根据本发明的一方面的智能问答系统的信息处理方法100的流程图,智能问答系统包括标准问数据库。
[0056]在步骤102,执行用户问题与标准问数据库的语义相似度计算以确定该用户问题是否被定位至标准问数据库中的标准问。
[0057]该语义相似度计算可以采用任何常用的语义相似度算法。例如,可采用文本聚类分析、LDA分析或序列分析中的任一者或任意组合来执行该语义相似度计算。
[0058]然后,找出与该用户问题具有最高语义相似度的标准问,若该最高的语义相似度高于预设
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1