一种用于获得答案信息的方法、装置和设备的制造方法

文档序号:9217225阅读:165来源:国知局
一种用于获得答案信息的方法、装置和设备的制造方法
【技术领域】
[0001]本发明涉及计算机技术领域,尤其涉及一种用于获得答案信息的方法、装置和设备。
【背景技术】
[0002]现有技术中的问答系统,往往直接基于用户提出的问题的文本信息,来向用户提供答案。然而,自然语言十分复杂,现有技术的这种答案提供方式,很容易受到用户提出的问题的表达形式的影响。

【发明内容】

[0003]本发明的目的是提供一种用于获得答案信息的方法、装置和设备。
[0004]根据本发明的一个方面,提供了一种在计算机设备中用于基于预定知识库来获得答案信息的问答装置,其中,所述预定知识库包括多个子库,该问答装置包括:
[0005]第一获取装置,用于获取来自用户设备的待处理的文本序列;
[0006]语义装置,用于对所述文本序列进行分词,并获得其至少一个分词的语义信息;
[0007]查询装置,用于根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息;
[0008]第一提供装置,用于将基于所述初始答案信息的最终答案信息提供给所述用户设备。
[0009]根据本发明的另一个方面,还提供了一种在计算机设备中用于基于预定知识库来获得答案信息的方法,其中,所述预定知识库包括多个子库,该方法包括以下步骤:
[0010]a.获取来自用户设备的待处理的文本序列;
[0011]b.对所述文本序列进行分词,并获得其至少一个分词的语义信息;
[0012]c.根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息;
[0013]d.将基于所述初始答案信息的最终答案信息提供给所述用户设备。
[0014]与现有技术相比,本发明具有以下优点:1)通过对文本序列进行更好的语义理解,能够提供更准确的答案信息;2)通过基于优先级依次在子库中进行查询,能够尽量减少匹配查询带来的资源消耗;3)能够基于来自用户的文本序列获得参数,从而对提供给用户的答案信息进行补充,以使提供给用户的答案信息适应于用户的问题而变化;4)当获得匹配度较高的答案信息时,可直接锁定该答案信息并终止继续匹配查询,从而减少资源消耗,当获得多个匹配度尚可的答案信息时,可通过询问用户,来确定用户希望获得的答案;5)针对不同的语义,子库的优先级可被调整,以使子库的优先级更设定更符合实际的语义情况;6)能够根据用户的历史查询对用户当前需要处理的文本序列进行补充,从而能够在用户给出的文本不完整的情况下,自动实现语义补完和理解;此外,通过对触发获取历史查询信息的条件进行限制,能够使得计算机设备在适当的情况下才启动文本补充的操作,从而防止或减少计算机设备因不断对历史进行查询从而导致崩溃的可能;7)对于具有相似属性的大量本体实例,无需针对每个本体实例重复性地建立属性,而可通过继承本体的所有属性的方式,简便地创建新的本体实例,大大减轻了本体实例创建过程中的资源消耗。
【附图说明】
[0015]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0016]图1为本发明一个优选实施例的获得答案信息的方法流程图;
[0017]图2为本发明一个优选实施例的创建本体实例的方法流程图;
[0018]图3为本发明一个优选实施例的获得答案信息的问答装置的结构示意图;
[0019]图4为本发明一个优选实施例的创建本体实例的问答装置的结构示意图。
[0020]附图中相同或相似的附图标记代表相同或相似的部件。
【具体实施方式】
[0021]下面结合附图对本发明作进一步详细描述。
[0022]图1为本发明一个优选实施例的获得答案信息的方法流程图。其中,本实施例的方法主要通过计算机设备来实现;所述计算机设备包括但不限于网络设备和用户设备。所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;所述用户设备包括但不限于PC机、平板电脑、智能手机、PDA, IPTV等。所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
[0023]需要说明的是,所述计算机设备和网络仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
[0024]根据本实施例的、用于基于预定知识库来获得答案信息的方法包括下述步骤S1、步骤S2、步骤S3和步骤S4。
[0025]在步骤SI中,计算机设备获取来自用户设备的待处理的文本序列。
[0026]其中,该待处理的文本序列可为用户直接输入的文本序列,也可为对用户输入的语音进行识别后所得的文本序列。
[0027]例如,用户在对话框中输入“今天天气如何”,并按下发送按键以指示用户设备将“今天天气如何”发送给计算机设备,则“今天天气如何”即为来自用户设备的待处理的文本序列。
[0028]又例如,用户在某个应用中输入一段语音,该段语音被该应用经由互联网发送给计算机设备,计算机设备识别该语音并获得文本序列“今天天气如何”,则“今天天气如何”即为来自用户设备的待处理的文本序列。
[0029]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取来自用户设备的待处理的文本序列的实现方式,均应包含在本发明的范围内。
[0030]接着,在步骤S2中,计算机设备对待处理的文本序列进行分词,并获得其至少一个分词的语义信息。
[0031]其中,分词的语义信息包括任何能够被计算机识别并用于表示该分词的语义的信息。优选地,分词的语义信息包括但不限于以下至少一项:
[0032]I)分词的同义词和/或同义词组合。
[0033]例如,分词“天气”的语义信息包括其同义词“气候”等。
[0034]2)分词的同类词和/或同类词组合。
[0035]其中,分词的同类词表示与该分词属于同一类别的词汇。如若分词属于地名,则该分词的同类词可包括其他地名。
[0036]例如,分词“上海”的语义信息可包括“北京”、“天津”等。
[0037]3)与分词具有相同或相似结构的实体。
[0038]其中,与分词具有相同或相似结构的实体表示该实体的信息结构与分词相同或相似。优选地,该实体可为特殊语义表达式。
[0039]例如,分词为一个特定时间结构“2013年I月I日10点45分”,则与分词具有相同或相似结构的实体可为一个日期语义表达式“XXXX年XX月XX日XX点XX分”等。该等类似的特殊语义表达式还可包括人名、地址、电话号码等。
[0040]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何能够被计算机识别并用于表示一个分词的语义的信息,均应包含在本发明的该分词的语义信息的范围内。
[0041]具体地,计算机设备可采用多种方式,来对待处理的文本序列进行分词,并获得其至少一个分词的语义信息。
[0042]例如,计算机设备可采用多种方式来对待处理的文本序列进行分词,并将所得分词与预先已获得的语义信息所对应的词汇进行匹配,从而将成功匹配的词汇的语义信息作为分词的语义信息等。
[0043]又例如,在上例中,在将所得分词与预先已获得的语义信息所对应的词汇进行匹配,从而确定成功匹配的词汇对应的语义信息后,还可进一步结合分词在待处理的文本序列中的语境,对成功匹配的词汇对应的语义信息进行处理,从而确定分词的语义信息等。
[0044]需要说明的是,计算机设备可获取待处理的文本序列的所有分词中每个分词的语义信息;或者,计算机设备可仅获取待处理的文本序列的部分分词中每个分词的语义信息。特别是一些无意义的分词,计算机设备可不获取该等分词的语义信息。
[0045]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对待处理的文本序列进行分词,并获得其至少一个分词的语义信息的实现方式,均应包含在本发明的范围内。
[0046]在步骤S3中,计算机设备根据所述语义信息,按照预定知识库中包含的多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。
[0047]其中,所述预定知识库中的子库包括用于与分词的语义信息进行匹配的匹配信息,且匹配信息与初始答案信息具有对应关系。则计算机设备可通过将分词的语义信息与匹配信息进行匹配查询,来确定各个分词的语义信息对应的初始答案信息。需要说明的是,作为一种优选方案,所述匹配信息可以是肯定式匹配信息,也可以是否定式匹配信息;所述肯定式匹配信息表示若分词的语义信息与该肯定式匹配信息相匹配或匹配度越高,则语义信息的初始答案信息为该肯定式匹配信息所对应的初始答案信息的可能性越高;所述否定式匹配信息表示若分词的语义信息与该否定式匹配信息相匹配或匹配度越高,则语义信息的初始答案信息为该否定式匹配信息所对应的初始答案信息的可能性越低。
[0048]其中,所述初始答案信息包括但不限于:
[0049]I)能够被直接提供给用户的答案信息,其可以是完整地、能够直接呈现给用户或者经用户设备运行后呈现给用户的答案信息。
[0050]例如,纯文本、纯多媒体信息、具有扩展标签的多媒体信息、可执行信息等;其中,所述扩展标签表示可供用户选择(如被用户点击)以链接其他信息的标签,所述可执行信息包括任何能够被用户设备运行的信息,如函数和指令等。
[0051]2)不能被直接提供给用户的答案信息,其可以是不完整的、需要进一步补充后才能呈现给用户或经用户设备运行后呈现给用户的答案信息。
[0052]例如,具有缺省项的纯文本、具有缺省项的纯多媒体信息、具有缺省扩展标签的多媒体信息、具有缺省参数的可执行信息等。
[0053]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何通过语义匹配能够获得的答案信息,均应包含在本发明的初始答案信息的范围内。
[0054]其中,所述预定知识库的多个子库的优先级预先已被确定;或者,计算机设备可采用多种方式,根据所述语义信息,确定所述多个子库的优先级。例如,计算机设备可根据分词所属的类别,并结合预先确定的、在不同类别下的子库的优先级,确定步骤S3中使用的子库的优先级。又例如,计算机设备可根据语义信息中是否包含符合特定结构的实体,来调整子库的预定优先级,以获得步骤S3中使用的子库的优先级等。由此,针对不同的语义,子库的优先级可被调整,以使子库的优先级更设定更符合实际的语义情况。
[0055]优选地,计算机设备首先在优先级最高的子库中进行匹配查询,当能够查询到初始答案信息时,则不再进一步查询;当不能获得初始答案信息时,在优先级次高的一个或多个子库中进行查询;如此重复,直至能够查询到初始答案信息。
[0056]优选地,计算机设备根据所述语义信息,按照预定知识库中包含的多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息的实现方式包括但不限于:
[0057]I)子库中的匹配信息包括语句和/或词汇,且多个语句和/或词汇可构成一组来对应一个或多个初始答案信息。计算机设
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1