面向问答机器人的信息处理方法及系统与流程

文档序号:13144225阅读:273来源:国知局
技术领域本发明涉及智能机器人技术领域,尤其涉及一种面向问答机器人的信息处理方法,还涉及一种面向问答机器人的信息处理系统。

背景技术:
问答机器人是信息检索系统的一种高级形式。它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对于快速、准确的获取信息的需求。目前,针对问答机器人的研究仍旧集中在文本信息上,问题和答案的表现形式都是文本信息。具体地,问答机器人通常在传统知识库中提取针对用户输入的问题的文本格式的答案,然后对答案进行输出。可见,现有的问答机器人在输出答案的直观性、丰富性等方面还存在缺陷,严重影响了用户的体验效果。

技术实现要素:
本发明所要解决的技术问题是:传统的问答机器人输出的与问题相关的答案不够直观、内容不够丰富,严重影响了用户的体验效果。为了解决上述技术问题,本发明提供了一种面向问答机器人的信息处理方法及系统。根据本发明的一个方面,提供了一种面向问答机器人的信息处理方法,其包括:接收用户输入的问题信息;对所述问题信息进行语义解析,得到语义解析结果;提取多媒体知识库中的、与所述语义解析结果相匹配的富媒体信息;输出所述富媒体信息。优选的是,所述语义解析结果为与所述问题信息对应的语义集,所述提取多媒体知识库中的、与所述语义解析结果相匹配的富媒体信息,包括:从所述语义集中确定目标语义;从所述多媒体知识库中,查找与所述目标语义相匹配的富媒体标识;提取与所述富媒体标识相关联的富媒体信息。优选的是,上述面向问答机器人的信息处理方法还包括:当查找与所述目标语义相匹配的富媒体标识失败时,提取与所述目标语义相匹配的文本回答信息。优选的是,所述从所述语义集中确定目标语义,包括:计算当前语义集中与所述问题信息相似度最高的语义。优选的是,所述输出所述富媒体信息,包括:抽取所述富媒体信息中包含的内容并输出;其中,所述内容包括链接、显示点击链接指令、富媒体、自动识别链接中的一种或多种的组合。根据本发明的另一个方面,提供了一种面向问答机器人的信息处理系统,其包括:问题信息接收模块,设置为接收用户输入的问题信息;语义解析模块,设置为对所述问题信息进行语义解析,得到语义解析结果;多媒体知识库,设置为存储富媒体信息;富媒体信息提取模块,设置为提取所述多媒体知识库中的、与所述语义解析结果相匹配的富媒体信息;富媒体信息输出模块,设置为输出所述富媒体信息。优选的是,所述语义解析结果为与所述问题信息对应的语义集,所述富媒体信息提取模块包括:目标语义确定单元,设置为从所述语义集中确定目标语义;富媒体标识查找单元,设置为从所述多媒体知识库中,查找与所述目标语义相匹配的富媒体标识;富媒体信息提取单元,设置为提取与所述富媒体标识相关联的富媒体信息。优选的是,上述面向问答机器人的信息处理系统还包括:文本回答信息提取模块,设置为当所述富媒体标识查找单元查找与所述目标语义相匹配的富媒体标识失败时,提取与所述目标语义相匹配的文本回答信息。优选的是,所述目标语义确定单元具体设置为:计算当前语义集中与所述问题信息相似度最高的语义。优选的是,所述富媒体信息输出模块具体设置为:抽取所述富媒体信息中包含的内容并输出;其中,所述内容包括链接、显示点击链接指令、富媒体、自动识别链接中的一种或多种的组合。与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:本发明根据用户输入的问题信息,从多媒体信息中提取并输出相应的富媒体信息,解决了由于现有问答机器人输出的文字回答信息不够直观、内容不够丰富,用户体验效果不够好的问题,使得反馈给用户的富媒体信息更加准确、更加直观、内容更加丰富,大大提高了用户的使用体验,满足了用户对信息获取直观化等的需求。本发明的其它特征和优点将在随后的说明书中阐述,并且部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例共同用于解释本发明,并不构成对本发明的限制。在附图中:图1示出了本发明实施例面向问答机器人的信息处理方法的流程示意图;图2示出了本发明实施例中从多媒体知识库中提取富媒体信息的方法的流程示意图;图3示出了本发明实施例中从语义集中确定目标语义的方法的流程示意图;图4示出了本发明实施例面向问答机器人的信息处理系统的结构示意图;图5示出了本发明实施例中富媒体信息提取模块的结构示意图;以及图6示出了本发明实施例中目标语义确定单元的结构示意图。具体实施方式以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。目前,针对问答机器人的研究仍旧集中在文本信息上,问题和答案的表现形式都是文本信息。具体地,问答机器人通常在传统知识库中提取针对用户输入的问题的文本格式的答案,然后对答案进行输出。举例来说,用户输入的问题为“猫的声音?”,此时问答机器人会在语义分析、领域模型处理后,输出“猫的声音为类似喵喵的声音”的文本回答信息。再例如,用户输入的问题为“猴子长什么样子?”,此时问答机器人会在语义分析、领域模型处理后,输出“猴子是一种灵长类动物。在它桃子形的面孔上,嵌着两颗闪着金光的眼睛;它小小的鼻子又塌又扁,而鼻孔却很大,鼻子下面有一张尖尖的大嘴巴。它还有一身棕色的毛和红红的屁股。”的文本回答信息。可见,由于现有的问答机器人的输出信息(答案信息)属于文本格式信息,因此现有的问答机器人的输出信息的直观性、丰富性等方面还存在缺陷,严重影响了用户的体验效果。为了解决现有的问答机器人存在的上述缺陷,本发明实施例提供了一种面向问答机器人的信息处理方法。实施例一图1示出了本发明实施例面向问答机器人的信息处理方法的流程示意图。如图1所示,本发明实施例面向问答机器人的信息处理方法主要包括步骤101至步骤104。在步骤101中,接收用户输入的问题信息。具体地,首先由前端模块获取用户输入的语音信息或者文本信息,由前端模块对获取到的信息进行预处理(例如,语音识别处理等等),得到文本格式的问题信息。然后前端模块将所得到的问题信息发送给问答机器人。在步骤102中,对问题信息进行语义解析,得到语义解析结果。具体地,问答机器人对接收到的问题信息进行语义解析,得到语义解析结果。这里,本领域的普通技术人员可采用常规的语义解析方法对问题信息进行语义解析,在本文中不再展开说明。特别地,问答机器人还可以获取用户输入问题时的多模态交互数据,结合该多模态交互数据对问题信息进行语义解析,旨在获得与问题信息相似度最高的语义。这里,多模态交互数据一般由前端模块获得。多模态交互数据主要涉及视觉信息、语音信息和触觉信息中的一类或几类。系统接收视觉信息、语音信息、触觉信息后,对各类信息进行相应的处理,得到多模态交互数据。在步骤103中,提取多媒体知识库中的、与语义解析结果相匹配的富媒体信息。在步骤104中,输出富媒体信息。具体地,从多媒体知识库中提取与语义解析结果相匹配的富媒体信息,并将所提取的富媒体信息进行输出。这里,富媒体信息主要指的是图像信息、声音信息或者其结合(即视频信息)以及文字信息与图像信息、声音信息的结合。换言之,富媒体信息主要包括:图像信息、声音信息、视频信息、文字信息与图像信息的结合、文字信息与声音信息的结合、以及文字信息与视频信息的结合。对于用户输入的“我想听爸爸说话”或者“我想听爸爸的声音”的问题,问答机器人在对问题信息进行语义解析后,得到语义解析结果“爸爸的声音”,然后从多媒体知识库中提取与“爸爸的声音”相匹配的声音信息(一种形式的富媒体信息),最后将所提取的声音信息进行输出。相比于现有的问答机器人给出的“爸爸的声音是一种非常低沉的有磁性的声音”来说,本发明输出的富媒体信息——声音信息更加直观,更加丰富,提高了用户的使用体验。对于用户输入的“猴子长什么样子”的问题,问答机器人在对问题信息进行语义解析后,得到语义解析结果“猴子的样子”,然后从多媒体知识库中提取与“猴子的样子”相匹配的图像信息,最后将所提取的图像信息进行输出,同时可以将文字信息“猴子是一种红屁股的动物”或者将该文字信息进行语音合成一并输出。相比于现有的问答机器人给出的文本回答信息来说,本发明输出的富媒体信息——图像信息与文本信息的结合更加直观、更加丰富,提高了用户的使用体验。应用本实施例所述的面向问答机器人的信息处理方法,根据用户输入的问题信息,从多媒体信息中提取并输出相应的富媒体信息,解决了由于现有问答机器人输出的文字回答信息不够直观、内容不够丰富,用户体验效果不够好的问题,使得反馈给用户的富媒体信息更加准确、更加直观、内容更加丰富,大大提高了用户的使用体验,满足了用户对信息获取直观化等的需求。实施例二本实施例在实施例一的基础上,对语义解析结果做了进一步限定,并对从多媒体中提取富媒体信息的步骤(即步骤103)做了进一步优化。在本实施例中,语义解析结果为与问题信息对应的语义集。举例来说,对上述问题“我想听爸爸说话”进行语义解析,得到的语义解析结果为以下语义的集合(即语义集):我想爸爸、爸爸说话、我听爸爸说话、爸爸想说话、以及爸爸的声音。图2示出了本发明实施例中从多媒体知识库中提取富媒体信息的方法的流程示意图。如图2所示,本发明实施例中提取多媒体知识库中的、与语义解析结果相匹配的富媒体信息的方法,主要包括步骤201至步骤205。在步骤201中,从语义集中确定目标语义。具体地,从代表与问题信息相对应的语义解析结果的语义集中选择目标语义。目标语义的优选的确定方法将在下文实施例三中结合图3进行详细的阐述。在步骤202中,从多媒体知识库中,查找与目标语义相匹配的富媒体标识。在步骤203中,判断是否查找到与目标语义相匹配的富媒体标识。在步骤204中,在判断出查找到与目标语义相匹配的富媒体标识的情况下,提取与富媒体标识相关联的富媒体信息。在步骤205中,在判断出未查找到(即查找失败)与目标语义相匹配的富媒体标识的情况下,提取与目标语义相匹配的文本回答信息。具体地,多媒体知识库一般为预先构建而成的。所构建的多媒体知识库中保存有多条富媒体信息以及与各个富媒体信息相关联的富媒体标识。由于富媒体输出需要有明确的指令触发,也就是说,存储在多媒体知识库中的富媒体信息(各个记录)都是有标签的,或者是匹配的依据。使得富媒体信息输出可以与问题和话题相适应。从理论上来讲,富媒体标识作为富媒体信息的标签,每条富媒体信息所关联的富媒体标识应各不相同,以起到区分的作用。在本实施例中,在确定目标语义后,问答机器人从多媒体知识库中查找与该目标语义相匹配的富媒体标识。如果查找到了该富媒体标识,则从多媒体知识库中提取出与该富媒体标识相关联的富媒体信息,以作为用户输入的问题信息的答案。如果查找富媒体标识失败,则例如从调侃知识库或者问答知识库中提取出与目标语义相匹配的文本回答信息,并进行输出。针对基于调侃知识库和问答知识库进行的问答过程,本文不进行展开说明。可以看出,在本实施例中,多媒体知识库的优先级比调侃知识库和问答知识库的优先级高。即,问答机器人首先在多媒体知识库查找富媒体标识,在查找失败后,才在调侃知识库或者问答知识库中提取文本回答信息。对于上述“我想听爸爸说话”的语义集,确定的目标语义为“爸爸的声音”。然后,问答机器人从多媒体知识库中查找与“爸爸的声音”相匹配的富媒体标识“爸爸对孩子说的话”,然后在查找成功时将与富媒体标识“爸爸对孩子说的话”相关联的声音信息或者视频信息进行提取和输出。在查找失败时,将文本回答信息“爸爸的声音是一种非常低沉的有磁性的声音”进行语音合成后进行输出。在本实施例中,多媒体知识库中保存有彼此相关联的富媒体标识和富媒体信息,这样富媒体信息的提取工作就转化成富媒体标识与语义的匹配工作,从而规范了富媒体信息的提取流程,同时提高了富媒体信息提取的准确性,有利于给出合理准确的答案,提高了问答机器人的服务性能。另外,在本发明一优选的实施例中,将多媒体知识库保存在数据库中,有一个管理网页能够对数据库进行管理,例如新增、修改、删除等富媒体信息(及相关联的富媒体标识)等等,极大提高了多媒体知识库的管理灵活性。实施例三本实施例在上述实施例一或者实施例二的基础上,对从语义集中确定目标语义的方法做进一步优化。图3示出了本发明实施例中从语义集中确定目标语义的方法的流程示意图。如图3所示,本发明实施例从语义集中确定目标语义的方法,主要包括步骤301和步骤302。在步骤301中,计算当前语义集中与问题信息相似度最高的语义。在步骤302中,将计算得出的语义确定为目标语义。具体地,本实施例采用语义相似度的方法来从包含多个语义的语义集中确定目标语义,目标语义为与用户输入的问题信息相似度最高的语义。在本实施例中,系统首先根据用户输入的问题信息,对语义集中的语义进行排序。某条语义与问题信息的相似度越高,该条语义的得分(对语义的评分量化)就越高,在语义集中的排序就越靠前。选取语义集中得分最高的语义为目标语义,也就是说,语义排队序列中最靠前的语义为目标语义。在本实施例中,采用基于语义相似度计算的问题匹配方式来确定目标语义,相比于传统的基于完全匹配或者包含匹配的问题匹配方式,本实施例提高了目标语义的准确性,使目标语义更接近用户输入的问题信息,从而有利于输出更准确的富媒体信息,极大地提高了用户的交互体验。实施例四本实施例在上述实施例一至实施例三的基础上,对富媒体信息的输出形式做了进一步优化。本实施例所述的输出富媒体信息的方法,包括:抽取富媒体信息中包含的内容并输出。这里,富媒体信息中包含的内容包括:链接、显示点击链接指令、富媒体、自动识别链接中的一种或多种的组合。对于待输出的富媒体信息“爸爸的声音”,问答机器人可以在用户的终端设备(例如智能手机、平板电脑、电脑等)上显示链接或者显示点击链接指令,通过用户在其终端设备上点击该链接或者该指令时,可在该终端设备上呈现或播放富媒体信息。另外,问答机器人也可以自动识别链接,以在用户的终端设备上呈现或播放富媒体信息。再有,问答机器人直接将富媒体信息发送给用户的终端设备,在该终端设备上呈现或播放富媒体信息。对于“猴子长什么样子”的问题,问答机器人在进行语义相似度计算之后,会从多媒体知识库中提取出与富媒体标识“猴子的样子”相关联的富媒体信息并返回给用户,在用户的终端设备上根据这个链接展示相应的猴子图片,同时可以将文本回答信息进行语音合成,同时念出“猴子是一种红屁股的动物”,这样就能极大的提升用户体验。本实施例提供了输出富媒体信息的多种形式,提高了问答机器人的灵活性。在本发明一优选的实施例中,多媒体知识库中的富媒体信息仅为相应图像信息/声音信息/视频信息的网络链接,这样大大节省了多媒体知识库所需的存储空间,有效降低了问答机器人的开发成本。实施例五对应于上述实施例一至实施例四,本发明实施例提供了一种面向问答机器人的信息处理系统。图4示出了本发明实施例面向问答机器人的信息处理系统的结构示意图。如图4所示,本发明实施例面向问答机器人的信息处理系统主要包括问题信息接收模块401、语义解析模块402、多媒体知识库403、富媒体信息提取模块404和富媒体信息输出模块405。其中,问题信息接收模块401通过语义解析模块402和富媒体信息提取模块404与富媒体信息输出模块405连接。富媒体信息提取模块404与多媒体知识库403相连接。具体地,问题信息接收模块401,设置为接收用户输入的问题信息。语义解析模块402,设置为对问题信息进行语义解析,得到语义解析结果。多媒体知识库403,设置为存储富媒体信息。富媒体信息提取模块404,设置为提取多媒体知识库中的、与语义解析结果相匹配的富媒体信息。富媒体信息输出模块405,设置为输出富媒体信息。应用本实施例所述的面向问答机器人的信息处理系统,根据用户输入的问题信息,从多媒体信息中提取并输出相应的富媒体信息,解决了由于现有问答机器人输出的文字回答信息不够直观、内容不够丰富,用户体验效果不够好的问题,使得反馈给用户的富媒体信息更加准确、更加直观、内容更加丰富,大大提高了用户的使用体验,满足了用户对信息获取直观化等的需求。实施例六本实施例在实施例五的基础上,进一步优化了富媒体信息提取模块404。在本实施例中,语义解析结果为与问题信息对应的语义集。图5示出了本发明实施例中富媒体信息提取模块404的结构示意图。如图5所示,本实施例中的富媒体信息提取模块404包括顺次连接的目标语义确定单元501、富媒体标识查找单元502、判断单元503和富媒体信息提取单元504。其中,富媒体标识查找单元502和富媒体信息提取单元504均与多媒体知识库403连接。判断单元503还通过文本回答信息提取模块505分别与调侃知识库506和问答知识库507相连接。具体地,目标语义确定单元501,设置为从语义集中确定目标语义。富媒体标识查找单元502,设置为从多媒体知识库中,查找与目标语义相匹配的富媒体标识。判断单元503,设置为判断是否查找到与目标语义相匹配的富媒体标识。富媒体信息提取单元504,设置为在判断单元503判断出查找到与目标语义相匹配的富媒体标识的情况下,提取与富媒体标识相关联的富媒体信息。文本回答信息提取模块505,设置为当在判断单元503判断出未查找到与目标语义相匹配的富媒体标识的情况下,例如从调侃知识库506中或者从问答知识库507中提取与目标语义相匹配的文本回答信息。在本实施例中,多媒体知识库中保存有彼此相关联的富媒体标识和富媒体信息,这样富媒体信息的提取工作就转化成富媒体标识与语义的匹配工作,从而规范了富媒体信息的提取流程,同时提高了富媒体信息提取的准确性,有利于给出合理准确的答案,提高了问答机器人的服务性能。实施例七本实施例在实施例五或者实施例六的基础上,进一步优化了目标语义确定单元501。图6示出了本发明实施例中目标语义确定单元501的结构示意图。如图6所示,本实施例的目标语义确定单元501主要包括计算子单元601和确定子单元602。具体地,计算子单元601,设置为计算当前语义集中与问题信息相似度最高的语义。确定子单元602,设置为将语义集中与问题信息相似度最高的语义确定为目标语义。在本实施例中,采用基于语义相似度计算的问题匹配方式来确定目标语义,相比于传统的基于完全匹配或者包含匹配的问题匹配方式,本实施例提高了目标语义的准确性,使目标语义更接近用户输入的问题信息,从而有利于输出更准确的富媒体信息,极大地提高了用户的交互体验。实施例八本实施例在实施例五、实施例六或者实施例七的基础上,进一步优化了富媒体信息输出模块405。本实施例中的富媒体信息输出模块405具体设置为:抽取富媒体信息中包含的内容并输出。其中,富媒体信息中包含的内容包括:链接、显示点击链接指令、富媒体、自动识别链接中的一种或多种的组合。本实施例提供了输出富媒体信息的多种形式,提高了问答机器人的灵活性。在本发明一优选的实施例中,多媒体知识库中的富媒体信息仅为相应图像信息/声音信息/视频信息的网络链接,这样大大节省了多媒体知识库所需的存储空间,有效降低了问答机器人的开发成本。本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的保护范围,仍须以所附的权利要求书所界定的范围为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1