用户意图识别方法、系统、移动终端及存储介质与流程

文档序号:20030095发布日期:2020-02-28 10:16阅读:169来源:国知局
用户意图识别方法、系统、移动终端及存储介质与流程

本发明属于计算机技术领域,尤其涉及一种用户意图识别方法、系统、移动终端及存储介质。



背景技术:

随着自然语言处理技术的发展,对话计算机开始越来越多地走进人们的日常生活中。面对各类应用场景,目前的对话计算机主要可以分为三大类,个人助理、客服计算机与聊天计算机。个人助理可以在预设范围内完成用户的指令;客服计算机可以在特定领域为用户回答各种业务问题;聊天计算机可以在泛向场景与用户进行简单交流。在计算机与用户的对话过程中,其针对用户意图的识别将直接影响问题回答的准确性,因此,用户意图识别方法越来越受人们所重视。

现有的意图识别技术多是数据匹配性质,机械化回答用户提问,但由于同一问题提问可以有很多种提问方式,进而使得现有的计算机问题应答过程中,其准确性低下,降低了用户的使用体验。



技术实现要素:

本发明实施例的目的在于提供一种用户意图识别方法、系统、移动终端及存储介质,旨在解决现有的用户意图识别方法中,由于用户意图识别准确性低下所导致的用户体验差的问题。

本发明实施例是这样实现的,一种用户意图识别方法,所述方法包括:

获取用户针对预设固定句式发送的提问句,并对所述提问句进行分词,以得到分词句,所述分词句包括多个提问词;

依序对每个所述提问词进行编码匹配,并根据匹配结果对所述提问词进行编码标记;

将编码标记后的所述分词句与本地问答库进行匹配,并当判断到匹配成功时,将匹配到的目标内容进行显示。

更进一步的,所述对所述提问句进行分词的步骤包括:

获取所述预设固定句式中存储的固定词;

将所述提问句中除去所述固定词后的词语与本地词语库进行匹配,并根据匹配结果对所述提问句进行分词,以得到所述分词句。

更进一步的,所述依序对每个所述提问词进行编码匹配,并根据匹配结果对所述提问词进行编码标记的步骤包括:

将所述提问词与本地存储的编码数据库进行匹配,以得到提问编码;

根据所述提问词的顺序将所述提问编码依序进行连接,以得到编码句。

更进一步的,所述将编码标记后的所述分词句与本地问答库进行匹配的步骤包括:

将所述编码句与所述问答库进行匹配,并判断是否存在匹配结果;

若是,则将匹配到的匹配解和正标题进行显示。

更进一步的,所述预设固定句式中存储的固定词包括如何和/或怎么办。

本发明实施例的另一目的在于提供一种用户意图识别系统,所述系统包括:

分词模块,用于获取用户针对预设固定句式发送的提问句,并对所述提问句进行分词,以得到分词句,所述分词句包括多个提问词;

编码匹配模块,用于依序对每个所述提问词进行编码匹配,并根据匹配结果对所述提问词进行编码标记;

应答显示模块,用于将编码标记后的所述分词句与本地问答库进行匹配,并当判断到匹配成功时,将匹配到的目标内容进行显示。

更进一步的,所述分词模块还用于:

获取所述预设固定句式中存储的固定词;

将所述提问句中除去所述固定词后的词语与本地词语库进行匹配,并根据匹配结果对所述提问句进行分词,以得到所述分词句。

更进一步的,所述分词模块还用于:

将所述提问词与本地存储的编码数据库进行匹配,以得到提问编码;

根据所述提问词的顺序将所述提问编码依序进行连接,以得到编码句。

本发明实施例的另一目的在于提供一种移动终端,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端执行上述的用户意图识别方法。

本发明实施例的另一目的在于提供一种存储介质,其存储有上述的移动终端中所使用的计算机程序,该计算机程序被处理器执行时实现上述的用户意图识别方法的步骤。

本发明实施例,通过预设固定句式的形式,提醒用户总结自己的需要,捋顺思路进行提问,以提高后续针对用户意图的识别效率,通过对所述提问句进行分词的设计,有效的方便了后续针对提问词编码的匹配和标记,通过将编码标记后的所述分词句与本地问答库进行匹配的设计,以准确查询用户的意图,并根据该意图查询回答结果,进而有效的提高了针对用户意图的识别效率。

附图说明

图1是本发明第一实施例提供的用户意图识别方法的流程图;

图2是本发明第二实施例提供的用户意图识别方法的流程图;

图3是本发明第三实施例提供的用户意图识别系统的结构示意图;

图4是本发明第四实施例提供的移动终端的结构示意图。

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示第一特征水平高度小于第二特征。

实施例一

请参阅图1,是本发明第一实施例提供的用户意图识别方法的流程图,包括步骤:

步骤s10,获取用户针对预设固定句式发送的提问句,并对所述提问句进行分词,以得到分词句;

其中,所述分词句包括多个提问词,该预设固定句式为以“如何”开头或以“怎么办”结尾的句子,例如“如何提高孩子的注意力?”、“孩子注意力不高怎么办?”;

具体的,通过预设固定句式的形式,提醒用户总结自己的需要,捋顺思路进行提问,以提高后续针对用户意图的识别效率,且该步骤中,通过对提问句进行分词的设计,有效的方便了后续针对用户意图的识别;

步骤s20,依序对每个所述提问词进行编码匹配,并根据匹配结果对所述提问词进行编码标记;

其中,每个提问词均对应唯一一个编码词,以使将分词句转换为纯编码句,该编码句中的编码词依序与所述分词句中的提问词一一对应,该步骤中,通过依序对每个所述提问词进行编码匹配的设计,以使将分词句转换为编码句,有效的提高了后续数据的处理效率;

步骤s30,将编码标记后的所述分词句与本地问答库进行匹配,并当判断到匹配成功时,将匹配到的目标内容进行显示;

其中,所述问答库中通过语料库和人工编写的方式,设置有多种某一事情的以“如何”开头或以“怎么办”结尾的对方法进行提问的特指问句和所对应的的编码组合,以便增加匹配成功的概率;

优选的,任一事情均有至少1个特指问句编码组合作为此事情以“如何”开头或以“怎么办”结尾的对方法进行提问的特指问句得“正标题”;

此外,本实施例中,上述步骤s10至步骤s30可以作为一个方法来按照顺序使用,也可以按照系统来使用,即在步骤s10检测到用户输入“如何”后或没输入“如何”而输入任意词时,就开始执行步骤s20和步骤s30;

本实施例,通过预设固定句式的形式,提醒用户总结自己的需要,捋顺思路进行提问,以提高后续针对用户意图的识别效率,通过对所述提问句进行分词的设计,有效的方便了后续针对提问词编码的匹配和标记,通过将编码标记后的所述分词句与本地问答库进行匹配的设计,以准确查询用户的意图,并根据该意图查询回答结果,进而有效的提高了针对用户意图的识别效率。

实施例二

请参阅图2,是本发明第二实施例提供的用户意图识别方法的流程图,包括步骤:

步骤s11,获取用户针对预设固定句式发送的提问句,并获取所述预设固定句式中存储的固定词;

其中,所述分词句包括多个提问词,该预设固定句式为以“如何”开头或以“怎么办”结尾的句子,例如“如何提高孩子的注意力?”、“孩子注意力不高怎么办?”,因此,该步骤中固定词为“如何”和“怎么办”;

具体的,通过预设固定句式的形式,提醒用户总结自己的需要,捋顺思路进行提问,以提高后续针对用户意图的识别效率,且该步骤中,通过对提问句进行分词的设计,有效的方便了后续针对用户意图的识别

步骤s21,将所述提问句中除去所述固定词后的词语与本地词语库进行匹配,并根据匹配结果对所述提问句进行分词,以得到所述分词句;

其中,所述分词句包括多个提问词,例如当提问句为“如何提高孩子的注意力?”时,则对应的分词句为“如何/提高/孩子/的/注意力”,且词“如何”是不做分割的句子成分;

步骤s31,将所述提问词与本地存储的编码数据库进行匹配,以得到提问编码;

其中,编码数据库中分词对应的编码为:

提高—tigao1;孩子—haizi1;的—de1;注意力—zhuyili1

步骤s41,根据所述提问词的顺序将所述提问编码依序进行连接,以得到编码句;

其中,对应的编码句为“如何tigao1haizi1de1zhuyili1”;

步骤s51,将所述编码句与所述问答库进行匹配,并判断是否存在匹配结果;

其中,所述问答库中通过语料库和人工编写的方式,设置有多种某一事情的以“如何”开头或以“怎么办”结尾的对方法进行提问的特指问句和所对应的的编码组合,以便增加匹配成功的概率;

优选的,任一事情均有至少1个特指问句编码组合作为此事情以“如何”开头或以“怎么办”结尾的对方法进行提问的特指问句得“正标题”;

例如,所述问答库中针对“如何tigao1haizi1de1zhuyili1”的编码所在的编码组合为语义库a,该语义库a包含的编码有:

一:如何tigao1haizi1de1zhuyili1;如何tigao2haizi2de2zhuyili2;如何tigao3haizi3de3zhuyili3;如何tigaonhaizindenzhuyilin,其中m、n、a代表大于或等于1的正整数,“如何”是句子固定的

tigao2~tigaon编码所对应的词可以是:

(1)“提高”的同音异型字或错别字,如:“体高”;

(2)“提高”的近义词,如:“提升”;

(3)“提高”的同语义词(即替换“提高”后不会对整个句子的句义造成太大影响的词语),如:“加强”、“提升”、“训练”等;

haizi2~haizin编码所对应的词,在“同音异型或错别字、近义词和同语义词”上的道理同提高”一样,如:“小孩”、“儿童”、“女儿”、“儿子”、“闺女”等;

de2~den;

zhuyili2~zhuyilin编码所对应的词,在同音异型或错别字、近义词和同语义词上的道理同提高”一样;

语义库a包含的编码有:

二:haizi1zhuyili1bu1gao1怎么办,编码对应的句子为:孩子注意力不高怎么办?;haizi2zhuyili2bu2gao2;haizinzhuyilinbungaon,其中,原理同上;

语义库a包含的编码有:

三:haizi1de1zhuyili1bujizhong1怎么办,编码对应的句子为:孩子的注意力不集中怎么办?

语义库a包含的编码有:

n:原理同上,句式都是以“如何”开头或以“怎么办”结尾的对方法进行提问的特指问句,语义相同,但词的排列组合不同;

语义库a中,针对“如何提高孩子的注意力?”这句对方法进行提问的特指问句的编码组合中,以“如何快速提升孩子的注意力”对应编码为“如何kuaisu1tigao1haizi1de1zhuyili1”作为正标题,其他均为匹配解;

且该步骤中,事情处理逻辑上任意一步处置方法的以“如何”开头或以“怎么办”结尾的对方法进行提问的特指问句都由人工进行收集并套用“同义词”“近义词”“易混词/字”等进行编码所在的语义库建设,并确定匹配解和正标题;

该步骤中,通过人工设定“正标题”的形式,引导提问者理性对待问题。如:用户搜索“孩子不好好学习要怎么打”时,对应的正标题可以为:“如何帮孩子改掉贪玩不学习的习惯”或“如何培养孩子的学习兴趣”,因此,不但识别了用户的意图,还起到了很好的教导作用,大大提升的用户的办事效率;

当步骤s51的判断结果为是时,执行步骤s61;

步骤s61,将匹配到的匹配解和正标题进行显示;

例如,当用户提问:“昨天在商场买了一双鞋,商家不给开发票,担心售后不能处理怎么办?”现有的计算机技术通过大量算法依然难以给出另用户满意的结果。

本实施例,可以通过引导用户提问:“商家不给开发票怎么办?”和“商场买鞋不给售后怎么办”来解决,提升了用户意图识别的准确性,大大节约了用户的时间;

此外,需要说明的是:

(1)以“如何”开头或以“怎么办”结尾的对方法进行提问的特指问句中,开头的“如何”可以被“怎样”、“怎么”等疑问代词替换

(2)以“如何”开头或以“怎么办”结尾的对方法进行提问的特指问句中,句尾的“怎么办”可能被“怎么做”、“怎么着”,“怎么样办”、“怎么样做”、“如何做”、“如何”等疑问代词替换。

(3)以“如何”开头或以“怎么办”结尾的对方法进行提问的特指问句中,句首的“如何”和句尾的“怎么办”可以被进行句义以外的编码;

本实施例,由于采用了以“如何”开头和“怎么办”结尾的特指问句对提问进行限制,以“如何”开头和“怎么办“结尾的特指问句极大的限制了语义表述范围,使得提问者的思路得到梳理,提问更有“方法”针对性,减少了解答者的工作量,增加回答问题的准确性,整体上降低了信息交流成本,通过对所述提问句进行分词的设计,有效的方便了后续针对提问词编码的匹配和标记,通过将编码标记后的所述分词句与本地问答库进行匹配的设计,以准确查询用户的意图,并根据该意图查询回答结果,进而有效的提高了针对用户意图的识别效率。

实施例三

请参阅图3,是本发明第三实施例提供的用户意图识别系统100的结构示意图,分词模块10、编码匹配模块11和应答显示模块12,其中:

分词模块10,用于获取用户针对预设固定句式发送的提问句,并对所述提问句进行分词,以得到分词句,其中,所述分词句包括多个提问词。

编码匹配模块11,用于依序对每个所述提问词进行编码匹配,并根据匹配结果对所述提问词进行编码标记。

应答显示模块12,用于将编码标记后的所述分词句与本地问答库进行匹配,并当判断到匹配成功时,将匹配到的目标内容进行显示。

本实施例中,所述分词模块10还用于:获取所述预设固定句式中存储的固定词;将所述提问句中除去所述固定词后的词语与本地词语库进行匹配,并根据匹配结果对所述提问句进行分词,以得到所述分词句,其中,所述预设固定句式中存储的固定词包括如何和/或怎么办等。

优选的,所述分词模块10还用于:将所述提问词与本地存储的编码数据库进行匹配,以得到提问编码;根据所述提问词的顺序将所述提问编码依序进行连接,以得到编码句。

进一步地,所述应答显示模块12还用于:将所述编码句与所述问答库进行匹配,并判断是否存在匹配结果;若是,则将匹配到的匹配解和正标题进行显示。

本实施例,通过预设固定句式的形式,提醒用户总结自己的需要,捋顺思路进行提问,以提高后续针对用户意图的识别效率,通过对所述提问句进行分词的设计,有效的方便了后续针对提问词编码的匹配和标记,通过将编码标记后的所述分词句与本地问答库进行匹配的设计,以准确查询用户的意图,并根据该意图查询回答结果,进而有效的提高了针对用户意图的识别效率。

实施例四

请参阅图4,是本发明第四实施例提供的移动终端101,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端101执行上述的用户意图识别方法。

本实施例还提供了一种存储介质,其上存储有上述移动终端101中所使用的计算机程序,该程序在执行时,包括如下步骤:

获取用户针对预设固定句式发送的提问句,并对所述提问句进行分词,以得到分词句,所述分词句包括多个提问词;

依序对每个所述提问词进行编码匹配,并根据匹配结果对所述提问词进行编码标记;

将编码标记后的所述分词句与本地问答库进行匹配,并当判断到匹配成功时,将匹配到的目标内容进行显示。所述的存储介质,如:rom/ram、磁碟、光盘等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元或模块完成,即将存储装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施方式中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。

本领域技术人员可以理解,图3中示出的组成结构并不构成对本发明的用户意图识别系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,而图1-2中的用户意图识别方法亦采用图3中所示的更多或更少的部件,或者组合某些部件,或者不同的部件布置来实现。本发明所称的单元、模块等是指一种能够被所述目标用户意图识别系统中的处理器(图未示)所执行并功能够完成特定功能的一系列计算机程序,其均可存储于所述目标用户意图识别系统的存储设备(图未示)内。

上述实施例描述了本发明的技术原理,这些描述只是为了解释本发明的原理,而不能以任何方式解释为本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其他具体实施方式,这些方式都将落入本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1