一种用于获得答案信息的方法、装置和设备的制造方法_2

文档序号:9235433阅读:来源:国知局
信息,均应包含在本发明的该分词的语义信息的范围内。
[0056]具体地,计算机设备根据各个分词的语义信息,在预定知识库中进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息的方式包括但不限于:
[0057]I)预定知识库中的匹配信息包括语句和/或词汇,且多个语句和/或词汇可构成一组来对应一个或多个初始答案信息。计算机设备将各个分词的语义信息与预定知识库中的匹配信息进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息。
[0058]例如,在步骤S2中获得待处理的文本信息“ 10元本地流量包怎么样”的分词“ 10元本地流量包”和“怎么样”以及两者分别对应的语义信息,计算机设备将两者的语义信息与预定知识库中的匹配信息进行匹配,并确定两者的语义信息与三个语句“10元本地流量包提供的服务是什么”、“我想问一下,你知道10元本地流量包吗”、“ 10元本地流量包能给我什么服务”构成的一组匹配信息相匹配,则计算机设备将该组匹配信息对应的纯文本信息“10元本地流量包是针对XX用户推出的流量优惠活动,您只需支付10元月费,即可享受……”,作为与分词“10元本地流量包”以及“怎么样”的语义信息对应的初始答案信息。
[0059]2)预定知识库中的匹配信息包括语义匹配信息,每组语义匹配信息包括一个或多个语义匹配结构。优选地,一个语义匹配结构也可为肯定式语义匹配结构或否定式语义匹配结构;一组语义匹配信息所表达的语义相近。计算机设备将各个分词的语义信息与所述预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
[0060]其中,一个语义匹配结构可表现为一个语义表达式。优选地,该语义匹配结构包括但不限于以下至少一项:a)多个词汇以及该多个词汇中至少一个词汇的语义信息,其中,一个词汇的语义信息与一个分词的语义信息相类似,在此不再赘述;b)所述多个词汇之间的逻辑关系,如该多个词汇之间的先后顺序关系、限定关系(如一个词汇为另一个词汇的修饰词)等。
[0061]例如,一组语义匹配信息包括以下三个语义匹配结构“[日期相关?][雨种类][对于][天气地区名][有没有][影响]”、“[天气地区名][天气相关][还是][雨种类]”和“[查询?][天气地区名][日期相关|@时间?][是否?][需要I可以?][带伞]”。其中,“I”表示逻辑或,每个“[]”中的内容表示一个词汇和/或该词汇的语义信息,如“带伞”为一个词汇,“天气地区名”指代地区类词汇的特殊表达式等。
[0062]优选地,可用一个标准问题来表示与一组语义匹配信息中的所有语义匹配信息相近的自然语言含义,该标准问题可包含在预定知识库中,以便操作人员理解一组语义匹配信息表达的语义。例如,上例中包含该三个语义匹配结构的一组语义匹配信息的标准问题可为“今天会下雨么?”
[0063]具体地,计算机设备将各个分词的语义信息与多组语义匹配信息分别进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
[0064]例如,对于一组语义匹配信息中的每个语义匹配结构,计算机设备将各个分词的语义信息分别与该语义匹配结构中的各个词汇和/或词汇的语义信息进行匹配,并结合语义匹配结构中各个词汇之间的逻辑关系,确定各个分词的语义信息与该语义匹配结构的匹配程度。类似地,计算机设备还确定各个分词的语义信息与该组语义匹配信息中的其他语义匹配结构之间的匹配程度,进而确定各个分词的语义信息与该组语义匹配信息的匹配程度。并且,计算机设备以类似的方式确定各个分词的语义信息与其他多组语义匹配信息之间的匹配程度,从而根据匹配程度来确定一组语义匹配信息,并将其对应的初始答案信息,作为所述语义信息对应的初始答案信息。
[0065]需要说明的是,本实现方式中,匹配信息可同时包括语义匹配信息以及其他匹配信息,如语句等。计算机设备将各个分词的语义信息与所述预定知识库中的多组语义匹配信息以及其他匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
[0066]3)步骤S3进一步包括步骤S31和步骤S32。
[0067]在步骤S31中,当待处理的文本序列符合预定触发条件时,计算机设备获取提供该待处理的文本序列的用户设备的历史查询信息。
[0068]其中,所述预定触发条件可包括任何能够用于触发计算机设备获取用户设备的历史查询信息的条件。例如,待处理的文本序列符合预定格式和/或待处理的文本序列符合预定语义等。
[0069]其中,用户设备的历史查询信息包括但不限于:a)根据用户设备的历史文本序列获得的分词结果和/或历史语义信息等山)用户设备的历史文本序列,如用户设备之前查询过的待处理的文本序列等,其中,可通过对该历史文本序列执行与步骤S2相同或相似的步骤,获得历史分词结果和历史语义信息。
[0070]其中,计算机设备可通过多种方式来识别一个用户设备。例如,根据用户的登录或注册信息来识别用户设备;又例如,根据用户设备中诸如cookie等记录信息来识别用户设备;又例如,根据用户设备的手机号或硬件标识码等,来识别用户设备。
[0071]在步骤S32中,计算机设备结合用户设备的历史查询信息以及所述语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。
[0072]其中,计算机设备可采用多种方式,来结合历史查询信息以及所述语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。
[0073]例如,计算机设备先根据历史查询信息来对语义信息进行补充,如历史查询信息包含用户的历史文本序列,则计算机设备将包含于历史文本序列中但不包含于当前处理的文本序列中的分词的语义信息补充入当前的语义信息中;接着,再根据补充后的语义信息在预定知识库中进行匹配查询,并确定初始答案信息等。
[0074]作为步骤S32的一个优选方案,用户设备的历史查询信息包括来自用户设备的文本序列的历史语义信息,则计算机设备根据所述历史语义信息,对根据当前处理的文本序列的分词的语义信息进行语义补充;并根据语义补充后的语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。优选地,计算机设备还可执行根据历史语义信息以及当前处理的文本序列的分词的语义信息(以下简称“当前语义信息”)来判断是否能够执行所述语义补充操作的步骤。
[0075]例如,计算机设备判断历史语义信息与当前语义信息中是否存在相类似的语义信息(如是否存在同义词、同类词或具有相似结构的实体等);当判断存在相类似的语义信息时,根据包含于历史语义信息且未包含于当前语义信息中的语义信息,对当前语义信息进行补充,从而根据补充后的语义信息,在预定知识库中进行匹配查询,确定初始答案信息。如作为一个更具体的示例,历史文本序列为“上海下雨么?”,其历史语义信息包括分词“上海”、“下雨”和“么”的语义信息,当前处理的文本序列为“北京呢?”,其语义信息包括分词“北京”和“呢”的语义信息;则计算机设备判断分词“上海”和“么”,与分词和“北京”和“呢”的语义信息相类似,并将包含于历史语义信息中且不包含于当前语义信息中的分词“下雨”的语义信息,补充入当前语义信息中。则语义补充后的语义信息包括“北京”、“下雨”和“呢”的语义信息。优选地,计算机设备还可在进一步判断历史语义信息与当前语义信息中是否存在相类似的语义信息,且该等相类似的语义信息之间的逻辑关系也相似的情况下,才执行语义补充的操作。
[0076]需要说明的是,步骤S32可与实现方式2)相结合,也即:计算机设备结合用户设备的历史查询信息,将各个分词的语义信息与所述预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。更优选地,计算机设备可根据所述历史语义信息,对根据当前处理的文本序列的分词的语义信息进行语义补充,并将语义补充后的语义信息与预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息”。
[0077]本优选方案能够根据用户的历史查询对用户当前需要处理的文本序列进行补充,从而能够在用户给出的文本不完整的情况下,自动实现语义补完和理解;此外,通过对触发获取历史查询信息的条件进行限制,能够使得计算机设备在适当的情况下才启动文本补充的操作,从而防止或减少计算机设备因不断对历史进行查询从而导致崩溃的可能。
[0078]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据各个分词的语义信息,在预定知识库中进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息的实现方式,均应包含在本发明的范围内。
[0079]在步骤S4中,当判断获得的初始答案信息不能被直接提供给所述用户设备时,计算机设备从分词的语义信息中获得参数信息。其中,所述参数信息能够对初始答案信息进行补充。
[0080]其中,计算机设备可采用多种方式来判断初始答案信息是否能够被直接提供给用户设备。
[0081]例如,每个初始答案信息可对应一个标识,该标识用于指示初始答案信息是否能够被直接提供给用户设备。则当计算机设备获得初始答案信息后,可直接根据该标识来判断初始答案信息是否能够被直接提供给用户设备。
[0082]又例如,计算机设备通过判断初始答案信息对应的匹配信息的类别是否属于预定类别,或直接判断初始答案信息是否处于预定类别,来判断初始答案信息是否能够被直接提供给用户设备。如若初始答案信息或其对应的匹配信息属于天气类别,则判断其不能被直接提供给所述用户设备等。
[0083]又例如,计算机设备通过解析初始答案信息,并判断其是否具有缺省项,来判断初始答案信息是否能够被直接提供给用户设备。
[0084]其中,计算机设备可采用多种方式,来从分词的语义信息中获得参数信息。
[0085]例如,不能被直接提供给用
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1