对话意图识别方法及装置、设备和存储介质与流程

文档序号:15636872发布日期:2018-10-12 21:35阅读:135来源:国知局

本申请涉及在线通讯技术领域,具体涉及一种对话意图识别方法及装置、设备和存储介质。



背景技术:

当前招聘过程中,特别是校园招聘过程中,hr通常需要人工解答大量重复的招聘相关问题,导致需要耗费较高的人力成本,造成人力浪费;又例如在展览会、招商会等场景,同样存在类似的人力成本较高的问题。



技术实现要素:

鉴于现有技术中的上述缺陷或不足,期望提供一种自动精准识别在线对话的意图类别,以使聊天机器人进行准确智能回复具备可行性的对话意图识别方法及装置、设备和存储介质。

第一方面,本发明提供一种对话意图识别方法,包括:

获取对话信息,对该对话信息进行分词,得到分词信息;

对分词信息进行特征提取,得到第一特征信息;

将第一特征信息分别输入至少两项一级模型进行训练和预测,得到若干一级预测值;

对各一级预测值进行拼接,得到第二特征信息;

将第二特征信息输入二级模型进行训练和预测,得到二级预测值和识别结果。

第二方面,本发明提供一种对话意图识别装置,包括分词单元、特征提取单元、一级预测单元、拼接单元和二级预测单元。

分词单元配置用于获取对话信息,对该对话信息进行分词,得到分词信息;

特征提取单元配置用于对分词信息进行特征提取,得到第一特征信息;

一级预测单元配置用于将第一特征信息分别输入至少两项一级模型进行训练和预测,得到若干一级预测值;

拼接单元配置用于对各一级预测值进行拼接,得到第二特征信息;

二级预测单元配置用于将第二特征信息输入二级模型进行训练和预测,得到二级预测值和识别结果。

第三方面,本发明还提供一种设备,包括一个或多个处理器和存储器,其中存储器包含可由该一个或多个处理器执行的指令以使得该一个或多个处理器执行根据本发明各实施例提供的对话意图识别方法。

第四方面,本发明还提供一种存储有计算机程序的存储介质,该计算机程序使计算机执行根据本发明各实施例提供的对话意图识别方法。

本发明诸多实施例提供的对话意图识别方法及装置、设备和存储介质通过融合至少两个一级模型和一个二级模型,对根据对话信息提取到的特征信息进行对话意图的分类识别,从而使聊天机器人根据识别出的对话意图进行准确智能回复具备可行性,进而实现节约人力成本。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为本发明一实施例提供的一种对话意图识别方法的流程图。

图2为图1所示方法的一种优选实施方式中步骤s50的流程图。

图3为图1所示方法的一种优选实施方式中步骤s90的流程图。

图4为本发明一实施例提供的一种对话意图识别装置的结构示意图。

图5为图4所示装置的一种优选实施方式的结构示意图。

图6为图4所示装置的一种优选实施方式的结构示意图。

图7为本发明一实施例提供的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1为本发明一实施例提供的一种对话意图识别方法的流程图。

如图1所示,在本实施例中,本发明提供一种对话意图识别方法,包括:

s10:获取对话信息,对该对话信息进行分词,得到分词信息;

s30:对分词信息进行特征提取,得到第一特征信息;

s50:将第一特征信息分别输入至少两项一级模型进行训练和预测,得到若干一级预测值;

s70:对各一级预测值进行拼接,得到第二特征信息;

s90:将第二特征信息输入二级模型进行训练和预测,得到二级预测值和识别结果。

具体地,在本实施例中,上述方法的应用场景为校园招聘在线咨询对话,获取的对话信息为招聘对话信息;在更多实施例中,还可以将上述方法应用于展会在线咨询对话、招商会在线咨询对话等不同应用场景,并获取相应的对话信息。

在步骤s10中,获取用户输入的对话信息,并进行分词,例如,用户甲输入对话信息:“笔试结果的通知是通过电话还是短信?”,获取到该对话信息后,进行分词,得到分词信息(笔试,结果,的,通知,是,通过,电话,还是,短信,?);又例如,用户乙输入对话信息:“你是一个图灵机器人吗?”,获取到该对话信息后,进行分词,得到分词信息(你,是,一个,图灵,机器人,吗,?)。

在步骤s30中,对步骤s10生成的分词信息进行特征提取,具体地,在本实施例中,通过tf-idf算法进行特征提取:

tf即词频(termfrequency),某个词在文档中出现的频率;

idf即逆向文件频率(inversedocumentfrequency),某个词的普遍重要性度量结果;

最终将词频tf与逆向文件频率idf的乘积作为衡量该词的权重,最终生成包括分词信息中各词权重的特征向量。

例如,根据上述分词信息(笔试,结果,的,通知,是,通过,电话,还是,短信,?)提取到特征向量a(tfidf101,tfidf102,tfidf103,tfidf104,tfidf105,tfidf106,tfidf107,tfidf108,tfidf109,tfidf110);

又例如,根据上述分词信息(你,是,一个,图灵,机器人,吗,?)提取到特征向量b(tfidf201,tfidf202,tfidf203,tfidf204,tfidf205,tfidf206,tfidf207)。

在更多实施例中,还可采用本领域常用的其它文本特征提取方法进行步骤s30的特征提取。

在步骤s50中,将步骤s30提取出的特征向量输入至少两项一级模型进行训练和预测。具体地,在本实施例中,一级模型包括支持向量机模型(svm),随机森林模型和逻辑回归模型;在更多实施例中,可以将一级模型配置为上述任意两项模型,或更多其它本领域常用的神经网络模型中的至少两项。

例如,将上述特征向量a分别输入svm模型、随机森林模型和逻辑回归模型进行训练和预测,得到三项一级预测值:[0.92],[0.94],[0.95];

又例如,将上述特征向量b分别输入svm模型、随机森林模型和逻辑回归模型进行训练和预测,得到三项一级预测值:[0.12],[0.06],[0.08]。

在步骤s70中,对步骤s50生成的各一级预测值进行拼接,生成作为第二特征信息输入二级模型的特征向量。

例如,将根据特征向量a获得的三项一级预测值[0.92],[0.94],[0.95]进行拼接,得到特征向量c:(0.92,0.94,0.95);

又例如,将根据特征向量b获得的三项一级预测值[0.12],[0.06],[0.08]进行拼接,得到特征向量d:(0.12,0.06,0.08)。

在步骤s90中,将步骤s70生成的第二特征信息输入二级模型进行训练和预测。具体地,在本实施例中,二级模型包括xgboost模型;在更多实施例中,还可将二级模型配置为其它本领域常用的神经网络模型。

例如,将特征向量c输入xgboost模型进行训练和预测,得到二级预测值:[0.99],再根据该二级预测值和预配置的分类规则生成识别结果:用户甲输入的该对话信息的对话意图类别为1(招聘问题);

又例如,将特征向量d输入xgboost模型进行训练和预测,得到二级预测值:[0.02],再根据该二级预测值和预配置的分类规则生成识别结果:用户乙输入的该对话信息的对话意图类别为0(闲聊)。

上述实施例通过融合至少两个一级模型和一个二级模型,对根据对话信息提取到的特征信息进行对话意图的分类识别,从而使聊天机器人根据识别出的对话意图进行准确智能回复具备可行性,进而实现节约人力成本。

图2为图1所示方法的一种优选实施方式中步骤s50的流程图。如图2所示,在一优选实施例中,步骤s50包括:

s51:将第一特征信息分别输入支持向量机模型、随机森林模型和逻辑回归模型进行训练,分别得到第一分类模型、第二分类模型和第三分类模型;

s53:将第一特征信息分别输入第一分类模型、第二分类模型和第三分类模型进行预测,分别得到第一一级预测值、第二一级预测值和第三一级预测值。

具体地,在本实施例中通过利用第一特征信息训练获得的分类模型进行分类,在更多实施例中,还可以通过利用现有样本库预先对各一级模型进行训练获得的分类模型进行预测。

图3为图1所示方法的一种优选实施方式中步骤s90的流程图。如图3所示,在一优选实施例中,步骤s90包括:

s91:将第二特征信息输入xgboost模型进行训练,得到第四分类模型;

s93:将第二特征信息输入第四分类模型进行预测,得到二级预测值;

s95:根据二级预测值生成识别结果并输出。

具体地,在本实施例中通过利用第二特征信息训练获得的分类模型进行分类,在更多实施例中,还可以通过利用现有样本库预先对二级模型进行训练获得的分类模型进行预测。

图4为本发明一实施例提供的一种对话意图识别装置的结构示意图。图4所示的装置可对应执行图1所示的方法。

如图4所示,在本实施例中,本发明提供一种对话意图识别装置,包括分词单元10、特征提取单元30、一级预测单元50、拼接单元70和二级预测单元90。

分词单元10配置用于获取对话信息,对该对话信息进行分词,得到分词信息;

特征提取单元30配置用于对分词信息进行特征提取,得到第一特征信息;

一级预测单元50配置用于将第一特征信息分别输入至少两项一级模型进行训练和预测,得到若干一级预测值;

拼接单元70配置用于对各一级预测值进行拼接,得到第二特征信息;

二级预测单元90配置用于将第二特征信息输入二级模型进行训练和预测,得到二级预测值和识别结果。

优选地,特征提取单元30配置用于通过tfidf算法进行特征提取。

图4所示装置的对话意图识别原理可参照图1所示的方法,此处不再赘述。

图5为图4所示装置的一种优选实施方式的结构示意图。图5所示的装置可对应执行图2所示的方法。

如图5所示,在一优选实施例中,一级预测单元50包括第一训练子单元51和第一预测子单元53。

第一训练子单元51配置用于将第一特征信息分别输入支持向量机模型、随机森林模型和逻辑回归模型进行训练,分别得到第一分类模型、第二分类模型和第三分类模型;

第一预测子单元53配置用于将第一特征信息分别输入第一分类模型、第二分类模型和第三分类模型进行预测,分别得到第一一级预测值、第二一级预测值和第三一级预测值。

图5所示装置的对话意图识别原理可参照图2所示的方法,此处不再赘述。

图6为图4所示装置的一种优选实施方式的结构示意图。图6所示的装置可对应执行图3所示的方法。

如图6所示,在一优选实施例中,二级预测单元90包括第二训练子单元91、第二预测子单元93和识别子单元95。

第二训练子单元91配置用于将第二特征信息输入xgboost模型进行训练,得到第四分类模型;

第二预测子单元93配置用于将第二特征信息输入第四分类模型进行预测,得到二级预测值;

识别子单元95配置用于根据二级预测值生成识别结果并输出。

图6所示装置的对话意图识别原理可参照图3所示的方法,此处不再赘述。

图7为本发明一实施例提供的一种设备的结构示意图。

如图7所示,作为另一方面,本申请还提供了一种设备700,包括一个或多个中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram703中,还存储有设备700操作所需的各种程序和数据。cpu701、rom702以及ram703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。

以下部件连接至i/o接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。

特别地,根据本公开的实施例,上述任一实施例描述的对话意图识别方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行对话意图识别方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。

作为又一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例的装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,该程序被一个或者一个以上的处理器用来执行描述于本申请的对话意图识别方法。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这根据所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以通过执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以通过专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,各所述单元可以是设置在计算机或移动智能设备中的软件程序,也可以是单独配置的硬件装置。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离本申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1