一种家电客服的用户意图引导方法及智能家电与流程

文档序号:24159650发布日期:2021-03-05 14:46阅读:142来源:国知局
一种家电客服的用户意图引导方法及智能家电与流程

[0001]
本文涉及智能家电领域,尤指一种家电客服的用户意图引导方法及智能家电。


背景技术:

[0002]
用户对智能家电咨询(比如售后咨询)时,一般多使用短文本的多意图识别,通过短文本的多意图识别确定用户真正的咨询问题。
[0003]
然而短文本的多意图识别是口语理解(slu)中的难题,与多标签(multi-label)分类类似。因短文本的特征稀疏、字数少但包含信息量大等原因,导致在分类问题中难以提取其有效的特征,以确定用户有多少个意图,及这些意图分别属于什么类别。


技术实现要素:

[0004]
第一方面,本申请提供了一种家电客服的用户意图引导方法,适用于用户对智能家电的咨询,包括:
[0005]
获取待识别的咨询文本;
[0006]
在所述咨询文本有多个意图时,确定所述咨询文本中意图的数量;
[0007]
根据意图的数量确定cnn输入参数的数量,以及基于cnn对确定的多个意图进行分类,得到目标意图;
[0008]
根据所述目标意图,进入到智能家电对应的咨询流程。
[0009]
第二方面,本申请提供了一种智能家电,适用于用户对智能家电的咨询,包括:
[0010]
获取模块,用于获取待识别的咨询文本;
[0011]
多意图个数识别模块,用于在所述咨询文本有多个意图时,确定所述咨询文本中意图的数量;
[0012]
意图分类模块,用于根据意图的数量确定卷积神经网络cnn输入参数的数量,以及基于cnn对确定的多个意图进行分类,得到目标意图;
[0013]
引导模块,用于根据所述目标意图,进入到智能家电对应的咨询流程。
[0014]
本申请至少一实施例提供的家电客服的用户意图引导方法及智能家电,与现有技术相比,具有以下有益效果:在咨询文本有多个意图时,基于cnn对确定的多个意图进行特征提取并分类,能够准确提取用户咨询文本中多个意图的特征,并确定出多个意图的具体分类结果,从而准确识别出用户咨询文本中的多个意图。
[0015]
另外,本申请实施例提供的家电客服的用户意图引导方法,在咨询文本有多个意图时,通过基于词向量进行意图个数识别,可以准确判断用户咨询文本中含有的意图数量。
[0016]
本申请的一些实施方式中,基于词向量进行意图个数识别,还可以达到以下效果:1、基于采用tf-idf可以确定咨询文本中的多个词语。2、通过低维稠密词向量和意图关键词词向量进行加权欧式距离计算,再根据设定的阈值分析咨询文本中含有的意图数量,可以规避词向量各个维度分布不均匀的情况,提高意图数量的识别准确度。
[0017]
本申请的一些实施方式中,基于cnn对确定的多个意图进行特征提取并分类,还可
以达到以下效果:1、基于改进cnn的意图分类,将加权欧式距离矩阵结果dist进行卷积层、池化层、全连接层和softmax归一化处理分析,计算出意图概率值,再由设定的阈值判断,得出意图分类结果,从而能够实现对多意图的识别,且可以突出咨询文本的多意图特征。2、对于多意图识别,依次用dist的均值替换咨询文本中几个和意图分类最相关的词,从而对咨询文本中的多意图进行逐个判断,降低其他意图对待识别意图的影响从而避免意图识别时意图间的影响。
[0018]
本申请的一些实施方式中,还可以达到以下效果:1、利用依存句法分析,分析咨询文本组成成分之间的依存关系来判断咨询文本是否含多个意图,从而发现咨询文本中的多个意图。2、在分析出用户意图分类后,根据依存句法分析结果,判断用户输入的咨询文本中是否存在否定极性情感,从而实现基于情感极性的意图判断,提高用户输入的咨询文本中的意图识别准确率。
[0019]
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。
附图说明
[0020]
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
[0021]
图1为本发明实施例提供的家电客服的用户意图引导方法的流程图;
[0022]
图2为本发明实施例提供的距离计算的框架示意图;
[0023]
图3为本发明实施例提供的cnn模型的框架示意图;
[0024]
图4为本发明实施例提供的依存语义分析结构的示意图;
[0025]
图5为本发明实施例提供的依存语义分析结构的示意图;
[0026]
图6为本发明实施例提供的智能家电识别多意图的框架示意图;
[0027]
图7为本发明实施例提供的智能家电的结构示意图。
具体实施方式
[0028]
本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。
[0029]
本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保
护范围内进行各种修改和改变。
[0030]
此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。
[0031]
本申请提供一种家电客服的用户意图引导方案,通过结合依存句法分析、语义依存分析、词频-逆文档频率算法、词向量、标准欧式距离计算和卷积神经网络等语义模型和算法,实现对用户输入的短文本的意图分类的功能,解决了现有方案数据需求大、计算需求大,以及否定情绪判断难等技术问题。
[0032]
图1为本发明实施例提供的家电客服的用户意图引导方法的流程图,如图1所示,本发明实施例提供的家电客服的用户意图引导方法,适用于用户对智能家电的咨询,其具体步骤可以包括:
[0033]
s101:获取待识别的咨询文本。
[0034]
其中,本实施例的执行主体可以是与售后智能家电绑定的终端,比如,可以是终端中的应用程序,或者也可以是终端中的免安装应用程序,其中,免安装应用程序是一种嵌入在一个第三方应用程序中,无需用户下载安装即可使用的应用程序,如微信小程序(简称小程序)、轻应用、头条号或服务号等。
[0035]
本实施例中,用户需要进行智能家电的咨询时,用户可以向与智能家电绑定的终端语音或文字输入用户所要咨询的信息,所要咨询的信息可以包括售后或购物等信息。其中,咨询文本为短文本,比如,用户想要退款时,用户可以向与智能家电绑定的终端语音或文字输入咨询文本“退款需要提供发票吗”;用户想要查询某款智能家电价格时,用户可以向与智能家电绑定的终端语音或文字输入咨询文本“我想查价格”或“我想查价格,不查材质”。
[0036]
s102:在咨询文本有多个意图时,确定咨询文本中意图的数量。
[0037]
本实施例中,在确定用户输入的咨询文本中有多个意图时,进一步判断用户输入的咨询文本中含有多少个意图。
[0038]
其中,本实施例可以基于词向量进行意图个数识别。可选的,确定咨询文本中意图的数量,可以包括:
[0039]
采用词频-逆文档频率算法(term frequency-inverse document frequency,简称tf-idf)确定咨询文本中的多个词语,一个词语用于表示一种类别的意图;采用加权的相似度距离算法确定每一个词语与预设意图类别关键词之间的距离,得到加权距离矩阵dist;根据加权距离矩阵确定咨询文本中意图的数量。
[0040]
本实施例中,可以通过计算咨询文本中的词语与意图类别关键词之间的距离,距离越小,词语与该意图越相关。通过计算咨询文本中的词语与意图类别关键词之间的距离,即可以对咨询文本中显式的多意图个数进行判别,也可以发现隐式的意图。
[0041]
具体的,可以通过神经网络构建的语言模型,利用咨询文本的上下文信息将词语表示为低维向量,向量中的每一维都表示词语语义,从而可根据向量间的距离来表示词语
的相关性。其中,可以用r
dim
表示词向量空间,dim表示向量空间的维度,r向量空间的基。词语向量之间的距离就是词语的距离,距离越小,两个词语就越相关。
[0042]
本实施例中,可以采用tf-idf确定咨询文本中的多个词语,其实现原理与方法与现有技术相同,本实施例在此不进行限定和赘述。
[0043]
本实施例中,可以用加权的相似度距离算法(如欧氏距离、余弦距离、或马氏距离等)表示预设意图类别关键词与待识别的咨询文本中各个词语的距离。其中,预设意图类别关键词可以为预设意图类别中tf-idf值高的词。
[0044]
其中,本发明实施例以欧氏距离举例,其它距离计算方法与之同理,本实施例在此不进行限定和赘述。本实施例采用加权欧式距离计算距离,可以规避词向量各个维度分布不均匀的情况。加权欧式距离是采用简单欧式距离的改进算法,其标准化向量各个维度数据的公式如下:
[0045]
x
*
=(x-m)/a
[0046]
其中,x和x
*
表示原始值和标准化之后的值;m和a表示向量的均值和标准差。假设有两个n维词向量a={x
1,1
,x
1,2
,

,x
1,n
},b={x
2,1
,x
2,2
,

,x
2,n
},用普通的欧式距离公式计算为:
[0047][0048]
将标准化公式带入得到加权欧式距离公式:
[0049][0050]
可选的,本实施例可以用类卷积操作对待识别的咨询文本进行距离计算。具体的,在上述实施例中,采用加权的相似度距离算法确定每一个词语与预设意图类别关键词之间的距离,得到加权距离矩阵,可以包括:
[0051]
将确定的多个词语表示为标准化向量将确定的多个词语表示为标准化向量将预设意图类别关键词表示为标准化向量将预设意图类别关键词表示为标准化向量将向量s和向量c采用公式作类卷积,计算每一个词语与预设意图类别关键词之间的距离dist
i,k
,得到加权距离矩阵
[0052][0053]
其中,n表示咨询文本中词语的数量,m表示预设意图的类别数量,dim表示向量空间的维度,n和dim均为正整数。i表示向量中的行,j表示向量中的列,w
i
表示标准化向量s中的行向量,w
k
表示标准化向量c中的行向量。
[0054]
可选的,标准化向量s是采用公式标准化的向量,标准化向量c是采用公式标准化的向量;其中,和分别表示多个词语的原始值和标准化之后的值,和分别表示多个预设意图类别关键词的原始值和标准化之后的值,p和a表示向量的预设均值和预设标准差。
[0055]
具体的,图2为本发明实施例提供的距离计算的框架示意图,如图2所示,假设有n个词语的咨询文本表示为词向量有m个意图,这些意图的关键词词向量表示为两者作类卷积的操作计算距离:dist
i,k
=distance(w
i
,w
k
),则可得到上述加权距离矩阵dist。
[0056]
本实施例中,首先计算出待识别咨询文本中的每一个词与每一个类别的距离,也就是相关度,得到加权欧式距离矩阵。然后通过最大池化(max-pooling)操作提取每个词最相关的类别,并设置一个相关度阈值,过滤掉小于该值的类别。经过计算可以识别出咨询文本所含意图的个数。
[0057]
s103:根据意图的数量确定卷积神经网络(convolutional neural network,简称cnn)输入参数的数量,以及基于cnn对确定的多个意图进行分类,得到目标意图。
[0058]
本实施例中,利用改进的cnn模型对上述实施例确定的多个意图进行分类,以得到目标意图。具体的,可以用上述实施例计算的加权距离矩阵dist作为cnn模型的输入,替换一般cnn的输入,以突出意图类别的特征,从未判断用户输入的咨询文本中含有的各个意图分类分别是什么。
[0059]
可选的,本实施例基于cnn对确定的多个意图进行分类,得到目标意图,可以包括:
[0060]
将加权距离矩阵dist作为cnn的输入层;采用公式进行卷积,得到表示意图特征的卷积层计算结果c,flt表示卷积核,大小为n*m,b是偏置量;对每个意图特征采用最大池化进行采样,以及将采样后的意图特征值作为全连接层的输入值;在全连接层对意图特征进行分类,输出包括意图特征类型出现概率的输出向量;对输出向量中的意图特征类型进行判定,在某个意图特征类型出现的概率最大,且超过阈值时,则判定咨询文本中包括该意图,将该意图作为目标意图。
[0061]
具体的,图3为本发明实施例提供的cnn模型的框架示意图,如图3所示,对多意图的识别需要确定咨询文本句子的特征,因此用上述实施例计算的距离矩阵dist作为输入层来替换一般cnn模型中的输入,再通过一个卷积层和池化层,并经过全连接层和softmax层输出意图集合,可确定咨询文本句子中多个意图的特征。
[0062]
本实施例中,对于单意图分类,直接把dist作为cnn模型的输入。对于多意图识别,需要依次用dist的均值替换咨询文本中几个和意图分类最相关的词,也就是对咨询文本中的意图进行一个一个识别。如图3所示,图3中灰色部分表示被均值向量替换后的向量。
[0063]
具体的,cnn模型的训练可以分为如下四步:
[0064]
第一步:卷积层。设置卷积核flt的尺寸为n*m,目的是提取n个上下文词语组合的特征,假设共有m个flt,则计算后会有m个特征映射(feature map):
[0065]
第二步:池化层。对每个尺寸的特征采用最大池化(max-pooling)进行采样,然后将采样后的所有特征值使用flatten函数形成一维数组,将得到的一维数组作为全连接层的输入。其中,flatten函数的实现原理与方法与现有技术相同,本实施例在此不进行赘述。
[0066]
第三步:全连接层和softmax层。将所有特征进行全连接操作后,通过softmax输出m个任务类型的概率。为了防止过拟合,在全连接层使用dropout策略。其中,softmax层和dropout策略的实现原理与现有技术相同,本实施例在此不进行赘述。
[0067]
第四步:对输出向量进行分数判定。设定分数阈值,若某个词语类型出现的概率最大,且超过分数阈值,则判定咨询文本中包括该词语类型的意图。
[0068]
s104:根据目标意图,进入到智能家电对应的咨询流程。
[0069]
本实施例中,根据确定的用户的目标意图,将用户引导到与目标意图对应的咨询流程。比如,确定用户想要退款时,将用户引导到智能家电对应的退款流程。或者,确定用户想要查询某款智能家电价格时,将用户引导到智能家电对应的购物流程。
[0070]
本发明实施例提供的家电客服的用户意图引导方法,在咨询文本有多个意图时,基于cnn对确定的多个意图进行特征提取并分类,能够准确提取用户咨询文本中多个意图的特征,并确定出多个意图的具体分类结果,从而准确识别出用户咨询文本中的多个意图。
[0071]
另外,本发明实施例提供的家电客服的用户意图引导方法,在咨询文本有多个意图时,通过基于词向量进行意图个数识别,可以准确判断用户咨询文本中含有的意图数量。
[0072]
另外,在基于词向量进行意图个数识别,一是基于采用tf-idf确定咨询文本中的多个词语;二是通过低维稠密词向量和意图关键词词向量进行加权欧式距离计算,再根据设定的阈值分析咨询文本中含有的意图数量,可以规避词向量各个维度分布不均匀的情况,提高意图数量的识别准确度。
[0073]
另外,在基于cnn对确定的多个意图进行特征提取并分类时,基于改进cnn的意图分类,将加权欧式距离矩阵结果dist进行卷积层、池化层、全连接层和softmax归一化处理分析,计算出意图概率值,再由设定的阈值判断,得出意图分类结果,从而能够实现对多意图的识别,且可以突出咨询文本的多意图特征。
[0074]
另外,在基于cnn对确定的多个意图进行特征提取并分类时,对于多意图识别,依次用dist的均值替换咨询文本中几个和意图分类最相关的词,从而对咨询文本中的多意图进行逐个判断,降低其他意图对待识别意图的影响从而避免意图识别时意图间的影响。
[0075]
进一步地,在上述实施例中,获取待识别的咨询文本时,本发明实施例提供的家电客服的用户意图引导方法,还可以包括:采用依存句法分析提取咨询文本的句法特征;判断是否存在并列关系的句法特征;在存在并列关系的句法特征时,确定咨询文本有多个意图。
[0076]
本实施例中,基于句法特征判断用户输入的咨询文本中是否含有多个意图。具体的,可以通过依存句法分析,分析咨询文本组成成分之间的依存关系,来判断咨询文本中是否含多个意图。
[0077]
本实施例中,意图的发现可以采用依存句法分析(dependency parsing,简称dp)来提取句法特征。其中,dp是自然语言处理(natural language processing,简称nlp)中的关键技术之一,其基本任务是确定句子的句法结构或者句子中词汇之间的依存关系。目前,现有的成熟开源方案主要包括:stanford corenlp、ltp、thulac和fudan nlp等,主要包括两方面的内容,一是确定语言的语法体系,即对语言中合法的句子的语法结构给与形式化
的定义;另一方面是句法分析技术,即根据给定的语法体系,自动推导出句子的句法结构,分析句子所包含的句法单位和这些句法单位之间的关系。
[0078]
在实际应用中,dp就是识别句子中的“主谓宾”和“定状补”等语法成分,并分析各部分之间的关系。举例来说,以咨询文本是“我想查豆浆机的价格,还想领取优惠券!”为例,图4为本发明实施例提供的依存语义分析结构的示意图,对该咨询文本的dp结构可以如图4所示。基于图4的依存语义分析可以得到表1,其中表1为该咨询文本的语义依存关系。其中,图4中root表示咨询文本的dp结构形成的树形结构的根。
[0079]
表1
[0080][0081]
本实施例中,通过判断咨询文本中是否含有并列关系coo,以确定咨询文本中是否含有多意图。其中,有并列关系coo可以是相互关联的不同事物,也可以是同一事物的不同方面,还可以是同一主体的不同动作。如果咨询文本的dp结构中存在coo,则说明咨询文本中含有多个事物或动作,也就是多个意图。
[0082]
可选的,咨询文本的依存关系集合可以表示为:
[0083]
s
dp
={dp
i
}(i=1,2,

)
[0084]
计算咨询文本是否含有多意图的公式可以为:
[0085][0086]
本实施例中,在m
s
大于或等于2时,确定咨询文本中含有多意图。
[0087]
本发明实施例提供的家电客服的用户意图引导方法,在上述实施例的基础上,利用依存句法分析,分析咨询文本组成成分之间的依存关系来判断咨询文本是否含多个意图,从而发现咨询文本中的多个意图。
[0088]
进一步地,在上述实施例中,获取待识别的咨询文本时,本发明实施例提供的家电客服的用户意图引导方法,还可以包括:
[0089]
采用语义依存分析对咨询文本进行情感极性判断,确定咨询文本中每一个意图的
情感极性,情感极性包括用户的肯定感情和否定感情。
[0090]
相应地,根据目标意图,进入到智能家电对应的咨询流程,可以包括:将目标意图和其对应的情感极性进行关联,根据关联结果进入到智能家电对应的咨询流程。
[0091]
在实际应用中,意图识别中忽略了用户输入的咨询文本的情感极性。比如用户输入的咨询文本为“我想查价格,不查材质”,现有意图识别只能判断得到用户有“查价格”和“查材质”的意图,却忽略了用户的否定意图,因此进行用户情感极性判断是非常重要的。
[0092]
为解决上述问题,本实施例可以基于情感极性准确判断意图分类。具体的,可以采用语义依存分析提取句法特征进行极性判断,以判断用户的肯定情感和否定情感。然后基于上述实施例确定的目标意图和其对应的情感极性的关联结果,进行用户引导。
[0093]
可选的,采用语义依存分析对咨询文本进行情感极性判断,确定咨询文本中每一个意图的情感极性,可以包括:
[0094]
对咨询文本的语义依存分析,提取存在的否定标记mneg;对于每一个意图,判断是否存在对应的否定标记mneg;在存在否定标记mneg时,确定该意图的情感极性为否定感情;在不存在否定标记mneg时,确定该意图的情感极性为肯定感情。
[0095]
本实施例中,通过判断分析结果中是否含有否定标记mneg(negation marker),以确定用户的情感极性。举例来说,以用户输入的咨询文本为“我想查价格,不查材质”为例,图5为本发明实施例提供的依存语义分析结构的示意图,如图5所示,对该咨询文本进行依存语义分析,可以得到该咨询文本包括一个否定标记mneg。其中,图5中root表示咨询文本的dp结构形成的树形结构的根。
[0096]
可选的,将目标意图和其对应的情感极性进行关联,根据关联结果进入到智能家电对应的咨询流程,可以包括:
[0097]
采用公式将目标意图和其对应的情感极性进行关联,得到关联结果y;在目标意图class不包含否定标记mneg时,sp为1;按照关联结果y中的意图进入到智能家电对应的咨询流程。
[0098]
其中,n表示咨询文本中目标意图的数量,r=1,2
……
n;在目标意图class包含否定标记mneg时,sp为0。
[0099]
本实施例中,在将目标意图和其对应的情感极性进行关联时,可以删除存在否定极性情感的意图,只保留存在肯定极性情感的意图,将肯定极性情感的意图作为识别的用户最终意图。具体的,可以采用计算用户最终意图。
[0100]
举例来说,以用户输入的咨询文本使“我想查价格,不查材质”为例,通过上述实施例可确定咨询文本中包含“查价格”的目标意图class1和“查材质”的目标意图class2,经过语义分析可知意图class2含有mneg关系,因此用户的最终意图计算为:class1
×
1+class2
×
0=class1。则可确定咨询文本中用户的意图为“查价格”,可将用于引导到智能家电的价格查询流程或购物流程。
[0101]
本发明实施例提供的家电客服的用户意图引导方法,在上述实施例的基础上,在分析出用户意图分类后,根据依存句法分析结果,判断用户输入的咨询文本中是否存在否定极性情感,从而实现基于情感极性的意图判断,提高用户输入的咨询文本中的意图识别准确率。
[0102]
本发明实施例还提供一种智能家电,适用于用户对智能家电的咨询。图6为本发明实施例提供的智能家电识别多意图的框架示意图,图7为本发明实施例提供的智能家电的结构示意图,如图6和图7所示,本发明实施例提供的智能家电可以包括:获取模块71、多意图个数识别模块(size of multi-intention finding module,简称smfm)72、意图分类模块(multi-intention classification module,简称mcm)73和引导模块74。
[0103]
获取模块71,用于获取待识别的咨询文本;
[0104]
多意图个数识别模块72,用于在所述咨询文本有多个意图时,确定所述咨询文本中意图的数量;
[0105]
意图分类模块73,用于根据意图的数量确定cnn输入参数的数量,以及基于cnn对确定的多个意图进行分类,得到目标意图;
[0106]
引导模块74,用于根据所述目标意图,进入到智能家电对应的咨询流程。
[0107]
本发明实施例提供的智能家电用于执行图1所示方法实施例的技术方案,其实现原理和实现效果类似,此处不再赘述。
[0108]
进一步地,在上述实施例中,本发明实施例提供的智能家电还可以包括:多意图发现模块(multi-intention discovery module,简称mdm)75,用于采用依存句法分析提取所述咨询文本的句法特征;判断是否存在并列关系的句法特征;在存在并列关系的句法特征时,确定所述咨询文本有多个意图。
[0109]
进一步地,在上述实施例中,多意图个数识别模块72确定所述咨询文本中意图的数量,可以包括:
[0110]
采用tf-idf确定所述咨询文本中的多个词语,一个词语用于表示一种类别的意图;采用加权的相似度距离算法确定每一个词语与预设意图类别关键词之间的距离,得到加权距离矩阵dist;根据所述加权距离矩阵确定所述咨询文本中意图的数量。
[0111]
进一步地,在上述实施例中,多意图个数识别模块72采用加权的相似度距离算法确定每一个词语与预设意图类别关键词之间的距离,得到加权距离矩阵,可以包括:
[0112]
将确定的多个词语表示为标准化向量将确定的多个词语表示为标准化向量将预设意图类别关键词表示为标准化向量将预设意图类别关键词表示为标准化向量将向量s和向量c采用公式dist
i,k
=distance(w
i
,w
k
)作类卷积,计算每一个词语与预设意图类别关键词之间的距离dist
i,k
,得到加权距离矩阵
[0113][0114]
其中,n表示所述咨询文本中词语的数量,m表示预设意图的类别数量,dim表示向量空间的维度,n和dim均为正整数。
[0115]
进一步地,在上述实施例中,标准化向量s是采用公式标准化的向量,标准化向量c是采用公式标准化的向量;
[0116]
其中,和分别表示多个词语的原始值和标准化之后的值,和分别表
示多个预设意图类别关键词的原始值和标准化之后的值,p和a表示向量的预设均值和预设标准差。
[0117]
进一步地,在上述实施例中,意图分类模块73基于cnn对确定的多个意图进行分类,得到目标意图,可以包括:
[0118]
将加权距离矩阵dist作为cnn的输入层;
[0119]
采用公式进行卷积,得到表示意图特征的卷积层计算结果c,flt表示卷积核,大小为n*m,b是偏置量;
[0120]
对每个意图特征采用最大池化进行采样,以及将采样后的意图特征值作为全连接层的输入值;
[0121]
在所述全连接层对意图特征进行分类,输出包括意图特征类型出现概率的输出向量;
[0122]
对输出向量中的意图特征类型进行判定,在某个意图特征类型出现的概率最大,且超过阈值时,则判定所述咨询文本中包括该意图,将该意图作为目标意图。
[0123]
进一步地,在上述实施例中,本发明实施例提供的智能家电还可以包括:情感极性判断模块(emotional polarity judgment module,简称epjm)76,用于采用语义依存分析对所述咨询文本进行情感极性判断,确定所述咨询文本中每一个意图的情感极性,所述情感极性包括用户的肯定感情和否定感情。
[0124]
意图分类模块73根据所述目标意图,进入到智能家电对应的咨询流程,可以包括:
[0125]
将所述目标意图和其对应的情感极性进行关联,根据关联结果进入到智能家电对应的咨询流程。
[0126]
进一步地,在上述实施例中,情感极性判断模块76采用语义依存分析对所述咨询文本进行情感极性判断,确定所述咨询文本中每一个意图的情感极性,可以包括:
[0127]
对所述咨询文本的语义依存分析,提取存在的否定标记mneg;对于每一个意图,判断是否存在对应的否定标记mneg;在存在否定标记mneg时,确定该意图的情感极性为否定感情;在不存在否定标记mneg时,确定该意图的情感极性为肯定感情。
[0128]
进一步地,在上述实施例中,意图分类模块73将所述目标意图和其对应的情感极性进行关联,根据关联结果进入到智能家电对应的咨询流程,可以包括:
[0129]
采用公式将所述目标意图和其对应的情感极性进行关联,得到关联结果y;按照关联结果y中的意图进入到智能家电对应的咨询流程。
[0130]
其中,n表示所述咨询文本中目标意图的数量,r=1,2
……
n;在目标意图class包含否定标记mneg时,sp为0;在目标意图class不包含否定标记mneg时,sp为1。
[0131]
本发明实施例提供的智能家电,可以基于图6所示的多意图分类模型框架计算用户意图,各个模块中均需进行依存句法分析、分词和预处理等子操作,模型框架可将子操作统一处理,并利用模块间的并行和串行关系,合理实施系统框架,提升模型处理性能。
[0132]
本发明实施例提供的家电客服的用户意图引导方法及智能家电,对用户输入的咨询文本多意图识别中发现意图、抽取意图和判别意图类型这几个问题,采用了结合句法特征和cnn的多意图识别模型,利用依存句法分析、tf-idf和cnn等技术来解决多意图识别问题。可以解决如“我不是问快递到哪儿了,是我填写错地址了,请问可不可以退钱?”和/或

把我的退款申请处理一下”等多意图和/或单意图的识别和处理。
[0133]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1