多面向语言行为识别方法及系统与流程

文档序号：11964432阅读：244来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及人工智能对话技术领域，具体涉及一种多面向语言行为识别方法及系统。

背景技术：

现有的人工智能对话系统，通常采用断词分句的方式，将语句拆分成词组，进行分析，取得额外的信息，如话题、情绪与关键词等。但是，语句拆分之后就会失去语意上的语言行为，致使人工智能对话系统无法提供恰当的回复。

并且，用户语言行为识别多是基于用户输入的文字信息、声音信息来预测用户的语言行为。由于缺乏用户所在的环境信息，以及用户画像信息，如用户过去的历史信息，导致预测的结果的失真。

如何精准、有效地识别用户的语言行为，降低用户语言行为误判率，是本领域技术人员亟需解决的问题。

技术实现要素：

针对现有技术中的缺陷，本发明提供一种多面向语言行为识别方法及系统，能够精准、有效地识别用户的语言行为，降低用户语言行为误判率。

第一方面，本发明提供一种多面向语言行为识别方法，该方法包括：

获取用户输入的当前信息、用户画像信息和外部信息；

对当前信息进行信息提取，获取特征信息；

根据特征信息、用户画像信息和外部信息，进行语言行为识别，获取用户的语言行为。

进一步地，对当前信息进行信息提取，获取特征信息，具体包括：

对文本信息进行语意信息提取，获取文本特征信息；

对声音信息进行声音特征提取，获取声音特征信息；

对影像信息进行影像特征提取，获取影像特征信息，

当前信息包括文本信息、声音信息和影像信息，

特征信息包括文本特征信息、声音特征信息和影像特征信息；

根据特征信息、用户画像信息和外部信息，进行语言行为识别，获取用户的语言行为，具体包括：

根据文本特征信息、声音特征信息、影像特征信息、用户画像信息和外部信息，进行语言行为识别，并记录语言行为识别次数，若语言行为识别成功，则生成该用户的语言行为，若语言行为识别失败，则再次进行语言行为识别，直至语言行为识别成功，或语言行为识别次数达到预设值。

进一步地，在获取文本特征信息之后，进行语言行为识别之前，该方法还包括：根据文本信息和文本特征信息，修正文本信息。

基于上述任意多面向语言行为识别方法实施例，进一步地，在进行语言行为识别之前，该方法还包括：

获取样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息；

根据样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息，进行语言行为识别，获取样本识别语言行为；

根据预获取的样本真实语言行为和样本识别语言行为的相似度，设置预设值。

第二方面，本发明提供一种多面向语言行为识别系统，该系统包括信息获取子系统、信息提取子系统和语言行为识别子系统，信息获取子系统用于获取用户输入的当前信息、用户画像信息和外部信息；信息提取子系统用于对当前信息进行信息提取，获取特征信息；语言行为识别子系统用于根据特征信息、用户画像信息和外部信息，进行语言行为识别，获取用户的语言行为。

进一步地，信息提取子系统具体用于：对文本信息进行语意信息提取，获取文本特征信息；对声音信息进行声音特征提取，获取声音特征信息；对影像信息进行影像特征提取，获取影像特征信息，当前信息包括文本信息、声音信息和影像信息，特征信息包括文本特征信息、声音特征信息和影像特征信息；

语言行为识别子系统具体用于：根据文本特征信息、声音特征信息、影像特征信息、用户画像信息和外部信息，进行语言行为识别，并记录语言行为识别次数，若语言行为识别成功，则生成该用户的语言行为，若语言行为识别失败，则再次进行语言行为识别，直至语言行为识别成功，或语言行为识别次数达到预设值。

进一步地，本实施例多面向语言行为识别系统还包括文本信息修正子系统，用于根据文本信息和文本特征信息，修正文本信息。

基于上述任意多面向语言行为识别系统实施例，进一步地，该系统还包括预设值确定子系统，用于获取样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息；根据样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息，进行语言行为识别，获取样本识别语言行为；根据预获取的样本真实语言行为和样本识别语言行为的相似度，设置预设值。

由上述技术方案可知，本实施例多面向语言行为识别方法及系统，能够根据用户输入多面向语言行为的当前信息，进行特征信息提取，避免进行语句拆分，以有利于根据当前信息进行对话回复。同时，该方法结合用户画像信息和外部信息，进行语言行为识别，能够减少语言行为识别错误情况，降低语言行为误判率。

因此，本实施例多面向语言行为识别方法及系统，能够精准、有效地识别用户的语言行为，降低用户语言行为误判率，有助于提高沟通效率。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中，类似的元件或部分一般由类似的附图标记标识。附图中，各元件或部分并不一定按照实际的比例绘制。

图1示出了本发明实施例所提供的一种多面向语言行为识别方法流程图；

图2示出了本发明实施例所提供的一种多面向语言行为识别系统的结构示意图；

图3示出了本发明实施例所提供的另一种多面向语言行为识别系统的结构示意图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案，因此只是作为示例，而不能以此来限制本发明的保护范围。

需要注意的是，除非另有说明，本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

第一方面，本发明实施例提供一种多面向语言行为识别方法，结合图1，该方法包括：

步骤S1，获取用户输入的当前信息、用户画像信息和外部信息，当前信息是多面向语言行为的信息，在此，当前信息可以为文本信息、声音信息和影像信息，用户画像信息为用户的习惯、偏好、操作记录等信息，外部信息为使用地点、使用时间和新闻等外部日常信息。

步骤S2，对当前信息进行信息提取，获取特征信息。

步骤S3，根据特征信息、用户画像信息和外部信息，进行语言行为识别，获取用户的语言行为。

由上述技术方案可知，本实施例多面向语言行为识别方法，能够根据用户输入多面向语言行为的当前信息，进行特征信息提取，避免进行语句拆分，以有利于根据当前信息进行对话回复。同时，该方法结合用户画像信息和外部信息，进行语言行为识别，能够减少语言行为识别错误情况，降低语言行为误判率。

因此，本实施例多面向语言行为识别方法，能够精准、有效地识别用户的语言行为，降低用户语言行为误判率，有助于提高沟通效率。

具体地，本实施例多面向语言行为识别方法能够对当前信息进行处理，其实现过程如下：

对文本信息进行语意信息提取，获取文本特征信息；在此，采用语意信息提取方法，提取语意，获取文本特征信息。

对声音信息进行声音特征提取，获取声音特征信息；在此，采用声音特征抽取机制，获取声音特征信息。

对影像信息进行影像特征提取，如采用影像特征抽取机制，获取影像特征信息，当前信息包括文本信息、声音信息和影像信息，特征信息包括文本特征信息、声音特征信息和影像特征信息；

根据特征信息、用户画像信息和外部信息，进行语言行为识别，获取用户的语言行为时，实现过程如下：根据文本特征信息、声音特征信息、影像特征信息、用户画像信息和外部信息，进行语言行为识别，并记录语言行为识别次数，若语言行为识别成功，则生成该用户的语言行为，若语言行为识别失败，则再次进行语言行为识别，直至语言行为识别成功，或语言行为识别次数达到预设值。

在此，本实施例多面向语言行为识别方法能够处理多方面的信息，如文本信息、声音信息和影像信息，根据文本特征信息、声音特征信息、影像特征信息三者中的至少一个，并结合用户画像信息和外部信息，进行语言行为识别，其中，根据文本特征信息、声音特征信息、影像特征信息、用户画像信息和外部信息，进行语言行为识别，获得语言行为的准确度最高。同时，在语言行为识别失败时，该方法还能够进行重复识别，以获得用户的语言行为，有利于提高该方法的稳定性和用户体验。

并且，本实施例多面向语言行为识别方法还能够在样本训练阶段设置迭代次数，即预设值，具体实现过程如下：

获取样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息。根据样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息，进行语言行为识别，获取样本识别语言行为。根据预获取的样本真实语言行为和样本识别语言行为的相似度，设置预设值。

在此，该方法根据训练的样本设置迭代次数，即预设值，以优化参数，有助于提高语言行为识别的准确性和处理效率。

具体地，在获取文本特征信息之后，进行语言行为识别之前，本实施例多面向语言行为识别方法还包括：根据文本信息和文本特征信息，修正文本信息。结合文本信息的原始语句和文本特征信息，将文本信息的原始语句进行修正或改写，以有利于语言行为识别，降低语言行为识别过程的数据处理复杂程度。

同时，在实现上述处理过程中，本实施例多面向语言行为识别方法主要采用算法如下：判定树与规则算法(decision tree&rule-based algorithm)、随机森林算法(random forest)、梯度推进机(gradient boosting machine)、支持向量机算法(support vector machine)、深度学习算法-卷积神经网络(convolutional neural network)、深度学习算法-循环神经网络(recurrent neural network)，将上述算法的进行搭配与调整，以达到更高的辨识准确度。

第二方面，本发明实施例提供一种多面向语言行为识别系统，结合图2或图3，该系统包括信息获取子系统1、信息提取子系统2和语言行为识别子系统3，信息获取子系统1用于获取用户输入的当前信息、用户画像信息和外部信息，当前信息是多面向语言行为的信息；信息提取子系统2用于对当前信息进行信息提取，获取特征信息；语言行为识别子系统3用于根据特征信息、用户画像信息和外部信息，进行语言行为识别，获取用户的语言行为。

由上述技术方案可知，本实施例多面向语言行为识别系统，能够根据用户输入多面向语言行为的当前信息，进行特征信息提取，避免进行语句拆分，以有利于根据当前信息进行对话回复。同时，该系统结合用户画像信息和外部信息，进行语言行为识别，能够减少语言行为识别错误情况，降低语言行为误判率。

因此，本实施例多面向语言行为识别系统，能够精准、有效地识别用户的语言行为，降低用户语言行为误判率，有助于提高沟通效率。

为了进一步提高本实施例多面向语言行为识别系统的准确性和处理效率，结合图3，信息提取子系统2具体用于：对文本信息进行语意信息提取，获取文本特征信息，对声音信息进行声音特征提取，获取声音特征信息，对影像信息进行影像特征提取，获取影像特征信息，当前信息包括文本信息、声音信息和影像信息，特征信息包括文本特征信息、声音特征信息和影像特征信息；语言行为识别子系统3具体用于：根据文本特征信息、声音特征信息、影像特征信息、用户画像信息和外部信息，进行语言行为识别，并记录语言行为识别次数，若语言行为识别成功，则生成该用户的语言行为，若语言行为识别失败，则再次进行语言行为识别，直至语言行为识别成功，或语言行为识别次数达到预设值。

在此，信息提取子系统2能够处理多方面的信息，信息提取子系统2包括文本特征模块、声音特征模块和影像特征模块，其中，文本特征模块能够处理文本信息，声音特征模块能够处理声音信息，影像特征模块能够处理影像信息，语言行为识别子系统3根据文本特征信息、声音特征信息、影像特征信息三者中的至少一个，并结合用户画像信息和外部信息，进行语言行为识别，其中，根据文本特征信息、声音特征信息、影像特征信息、用户画像信息和外部信息，进行语言行为识别，获得语言行为的准确度最高。同时，在语言行为识别失败时，该信息提取子系统2还能够进行重复识别，以获得识别语言行为，有利于提高该系统的稳定性和用户体验。

同时，本实施例多面向语言行为识别系统还包括预设值确定子系统，用于获取样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息；根据样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息，进行语言行为识别，获取样本识别语言行为；根据预获取的样本真实语言行为和样本识别语言行为的相似度，设置预设值。在此，该预设值确定子系统根据训练的样本设置迭代次数，即预设值，以优化参数，有助于提高该系统进行处理的准确性和处理效率。

具体地，本实施例多面向语言行为识别系统还包括文本信息修正子系统，用于根据文本信息和文本特征信息，修正文本信息。文本信息修正子系统结合文本信息的原始语句和文本特征信息，将文本信息的原始语句进行修正或改写，以有利于语言行为识别，降低语言行为识别过程的数据处理的复杂程度。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：简仁贤;许储羽
技术所有人：竹间智能科技（上海）有限公司
我是此专利的发明人

上一篇：用于胶合板的裁边装置的制作方法
上一篇：用于胶合板的转动式裁边装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。