一种用于智能语音交互的文本分类方法与流程

文档序号：18552763发布日期：2019-08-30 22:13阅读：275来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及通信技术领域，尤其涉及一种用于智能语音交互的文本分类方法、智能语音交互方法、计算设备及存储介质。

背景技术：

现有的呼叫中心已成为与企业连为一体的完整综合信息服务系统，采用统一的标准服务模式，能够为用户提供系统化、智能化和人性化的服务。其中，交互式语音应答可以提供自动语音服务，用户通过双音频电话输入信息后，能够向用户播放预先录制好的应答语音。

在语音交互的过程中，通过将语音转换为文字，然后对文字分析处理后执行相应的指令，最后通过语音合成技术将反馈内容转换为语音输出。但是现有的交互式语音应答系统需要用户选择电话按键的方式来完成相应的查询或命令执行。但是这种交互方式不够智能化。

因此，需要一种能够智能语音交互方法，能够根据用户的语音直接反馈相应的应答语音。

技术实现要素：

为此，本发明提供了一种用于智能语音交互的文本分类方法以及智能语音交互方法，以力图解决或者至少缓解上面存在的至少一个问题。

根据本发明的一个方面，提供了一种用于智能语音交互的文本分类方法，该方法适于在计算设备中执行。首先，获取具有标签的训练文本集。然后，对每个标签下的训练文本进行分词处理，得到词序列。随后，对词序列进行词频和逆文档频率统计，得到每个词对应的tf-idf值。接着，将tf-idf值大于预定阈值的词作为该标签下的特征词，以生成每个标签对应的特征词典。随后，基于特征词典对训练文本集进行过滤，以得到训练文本集对应的特征矩阵。最后，将特征矩阵输入预训练的文本分类模型中进行训练，以便基于训练后的文本分类模型对语音文本进行分类。

可选地，在上述方法中，对训练文本集进行数据扩充，以生成每个标签下数量相同的训练文本。

可选地，在上述方法中，将特征词典中的词与词序列中的词进行匹配，以得到训练文本的特征词序列；然后，将特征词序列转换为预定格式的特征向量，得到训练文本集对应的特征矩阵。

可选地，在上述方法中，特征向量由标签值、特征编号和对应的特征值组成，所述特征编号为特征词在特征词典中的维度，所述特征值为该特征词在训练文本中出现的次数。

可选地，在上述方法中，可以将每个标签下的预测分数值通过归一化函数映射为概率矩阵，将概率矩阵中最大的概率值作为预测值。然后，基于标签值与预测值，计算正则化损失值。最后，基于正则化损失值的一阶导数和二阶导数，反向迭代更新文本分类模型的参数，直到满足预定条件时，训练结束。

可选地，在上述方法中，预定条件包括迭代次数达到预定次数或者损失值小于预定阈值。

根据本发明另一个方面，提供了一种智能语音交互方法，该方法适于在计算设备中执行。在该方法中，首先，将接收到的用户语音转换为语音文本。然后，对语音文本进行预处理，得到预定格式的特征向量。将特征向量输入训练后的文本分类模型中获得文本分类结果。最后，基于文本分类结果确定向用户反馈的语音信息。

可选地，在上述方法中，对语音文本进行分词处理，得到对应的词序列；并从数据库中获取已构建的特征词典。然后基于特征词典对语音文本对应的词序列进行过滤，得到语音文本对应的特征词序列。最后，将特征词序列转换为预定格式的特征向量。

可选地，在上述方法中，首先获取预设的匹配规则。然后基于匹配规则对语音文本进行匹配分析，如果匹配成功，则输出文本分类结果。

可选地，在上述方法中，匹配规则包括正则表达式列表、关键字列表和过滤词列表，将语音文本与正则表达式列表中的各项进行匹配，如果匹配成功则输出文本分类结果，否将语音文本与关键字列表中的各项进行匹配，如果匹配成功则输出文本分类结果，否则将语音文本与过滤词列表中的各项进行匹配，如果匹配成功则输出文本分类结果。

可选地，在上述方法中，首先，初始化当前过滤词在过滤词列表中的位置和当前字符串在语音文本中的位置。然后，将当前字符串与过滤词列表中的过滤词进行匹配，并判断当前匹配的过滤词是否是过滤词列表中的最后一个词，如果是，则匹配成功，如果不是，则将当前字符串的位置加1，将当前过滤词的位置加1，继续进行匹配。如果当前匹配的字符串已到达语音文本末端，则匹配失败并停止匹配。

根据本发明另一个方面，提供了一种计算设备，包括一个或多个处理器；存储器；一个或多个程序，这一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行，一个或多个程序用于执行上述方法的指令。

根据本发明另一个方面，提供一种存储一个或多个程序的计算机可读存储介质，这一个或多个程序包括指令，当指令被计算设备执行时，使得计算设备执行上述方法。

根据本发明方案，通过构造特征词典对待分类的文本进行过滤，将生成的特征向量作为模型的训练数据集，能够降低文本分类模型训练的复杂度。进一步地，结合多种文本匹配或分类方法，能够提高文本分类的准确性和效率。在语音交互场景中，能够将用户语音实时转换为文本，并对文本进行分类，根据分类结果和预设的业务逻辑规则确定向用户输出的语音内容，这样可以提高智能语音交互的自动化和智能化，提升用户呼叫体验。

附图说明

为了实现上述以及相关目的，本文结合下面的描述和附图来描述某些说明性方面，这些方面指示了可以实践本文所公开的原理的各种方式，并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述，本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开，相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明的一个实施例的计算设备100的构造示意图；

图2示出了根据本发明的一个实施例的智能语音交互系统200的结构示意图；

图3示出了根据本发明的一个实施例的用于智能语音交互的文本分类方法300的示意性流程图；

图4示出了根据本发明的一个实施例的用于智能语音交互的文本分类方法300的示意性流程图；

图5示出了根据本发明的一个实施例的智能语音交互方法500的示意性流程图；

图6示出了根据本发明的一个实施例的文本匹配方法600的示意性流程图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明的一个实施例的计算设备100的构造示意图。在基本的配置102中，计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。

取决于期望的配置，处理器104可以是任何类型的处理，包括但不限于：微处理器(μp)、微控制器(μc)、数字信息处理器(dsp)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(alu)、浮点数单元(fpu)、数字信号处理核心(dsp核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用，或者在一些实现中，存储器控制器118可以是处理器104的一个内部部分。

取决于期望的配置，系统存储器106可以是任意类型的存储器，包括但不限于：易失性存储器(诸如ram)、非易失性存储器(诸如rom、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个程序122以及程序数据124。在一些实施方式中，程序122可以布置为在操作系统上利用程序数据124进行操作。

计算设备100还可以包括有助于从各种接口设备(例如，输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个a/v端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156，它们可以被配置为有助于经由一个或者多个i/o端口158和诸如输入设备(例如，键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160，其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块，并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号，它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例，通信介质可以包括诸如有线网络或者专线网络之类的有线介质，以及诸如声音、射频(rf)、微波、红外(ir)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

计算设备100可以实现为服务器，例如文件服务器、数据库服务器、应用程序服务器和web服务器等，也可以是小尺寸便携(或者移动)电子设备的一部分，这些电子设备可以是诸如蜂窝电话、个人数字助理(pda)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中，计算设备100可被配置为执行本发明的一种用于智能语音交互的文本分类方法300、智能语音交互方法500以及文本匹配方法600。其中，计算设备100的一个或多个程序122包括用于执行根据本发明的上述各方法的指令。

文本分类就是通过有效的算法或建立有效的模型，实现对文本的自动分类。由于智能语音交互场景对语义分类的实时性要求较高，因此本方案通过对文本分类模型进行优化训练，提供一种用于智能语音交互的文本分类方法，结合多种文本分类算法，以提高智能语音交互过程中文本分类的实时性，提高智能语音交互水平。

图2示出了根据本发明的一个实施例的智能语音交互系统200的结构示意图。如图2所示，智能语音交互系统200包括语音识别模块210、业务逻辑模块220、文本分类模块230和语音播放模块240。其中，语音识别模块220可以将接收到的用户语音实时转换为文字，业务逻辑模块可以是数据库，保存各种模型文件、映射表、预设规则等。文本分类模块可以对语音文本进行分类，其中的模型调度模块可以根据不同的文本标签，通过http接口调用不同的分类模型，得到分类结果。语音播放模块240可以将文本分类对应的应答语音反馈给用户，实现语音自动回复。

智能语音交互中语音回复的实时性关键在于文本分类处理的实时性。现有技术通常采用单一的模型或算法对文本进行分类，但是单个模型应用于短文本分类往往无法取得很好的分类效果。本方案结合多种文本分析方法，对文件进行匹配和分类处理。

图3示出了根据本发明的一个实施例的用于智能语音交互的文本分类方法300的示意性流程图。该方法可以在计算设备100中执行，计算设备100可以驻留在智能语音交互系统200中。如图3所示，首先可以将待预测的文本基于预设的匹配规则进行匹配，如果匹配成功则输出文本分类结果，如果匹配失败则将待预测文本输入通用类分类模型进行分类分析，输出分类结果，进一步地，将待预测文本输入业务类分类模型中进行分类分析，输出分类结果。其中通用类模型和业务类模型可以从预先存储的模型文件中获得，模型文件中保存了标签、特征词典和模型参数。如图3所示，可以根据redis数据库的ip地址、端口号、数据库号从redis数据库中获取训练标签数据和训练文本数据，以及匹配规则。

以下实施例中以基于多分类的文本分类模型和基于匹配规则的文本分类算法为例进行说明本发明的文本分类方法。首先在使用文本分类模型进行文本分类之前，需要对文本分类模型进行训练。图4示出了根据本发明的一个实施例的用于智能语音交互的文本分类方法300的示意性流程图；

在步骤s310中，获取具有标签的训练文本集。

其中，所获取的训练文本集可以是已标注类别标签的短文本，可以包括多个类别标签，在本发明的一个实施例中，可以将训练文本按照通用类和业务类标签进行标注。例如，业务类标签可以是验证码标签、营销标签、通知标签、行业标签等。每个标签的训练文本可以包括多条。

根据本发明的一个实施例，在各个标签下的训练文本数量差别较大时，可以对训练文本集进行数据扩充，以生成每个标签下数据基本相同的训练文本，减少数据不平衡的问题。例如，可以对训练文本数量较少的类别进行重采样，将所有类别标签下的训练文本数量填充到原始训练文本集中最大类别的数量。

随后在步骤s320中，对每个标签下的训练文本进行分词处理，得到词序列。

分词处理可以是基于统计的分词，基于语料库对文本进行分词。可以是基于词典的分词，按照一定的策略将待匹配的字符串和已建立的词典中的词进行匹配，若找到某个词则匹配成功。在本发明的一个实施例中，可以使用结巴分词对训练文本进行分词处理。结巴分词可以基于决策树结构实现高效的词图扫描，生成句子中汉字所有可能的成词情况所构成的有向无环图。其中采用动态规划查找最大概率路径，找出基于词频的最大切分组合。对于未登录的词，采用基于汉字成词能力的隐马尔可夫模型和维特比算法。结巴中文分词支持三种分词模式，包括精确模式：试图将句子最精确地切开，适合文本分析；全模式：把句子中所有的可以成词的词语都扫描出来，速度非常快，但是不能解决歧义问题；搜索引擎模式：在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。此外，结巴分词支持繁体分词和自定义字典方法，可以通过添加自定义词典提高分词的准确性。例如在短信领域，可以加入收集的短信发送领域的常用语，如验证码、温馨提示等；可以加入一些行业或移动应用端标识，如支付宝、工商银行、中国联通等。

接着在步骤s330中，对词序列进行词频和逆文档频率统计，得到每个词对应的tf-ldf值。

词频一逆文档频率可以用来评估一个词对于一个文档集或语料库中某个文档的重要程度。其中，词频tf是指某一个给定的词语在该文件中出现的次数。由于同一个词语在长文件里可能会比短文件里有更高的词频，而不管该词语重要与否。因此，词频通常会做归一化处理，例如将词频除以文章总词数，以防止它偏向长的文件。单一出现频率最高的词如“的”“是”“也”等虚词并不能反映文本的含义，因此西药对每个词加一个权重，最常见的词给予最小的权重，较少见但是能反映文本含义的词给予较大的权重，这个权重就是逆向文件频率idf。即如果包含某一词条的文档越少，idf越大，则说明词条具有很好的类别区分能力。某一特定词语的ldf，可以由总文件数目除以包含该词语的文件的数目，再将得到的商取对数得到。

在本发明的一个实施方式中，可以将同个标签下的所有训练文本组织为一个文档，假设一共有n个标签，利用python中的tf-ldf模块，可以在所有文档中筛选出非停用词m个，得到一个n*m的tf-idf矩阵。

随后在步骤s340中，将tf-idf值大于预定阈值的词作为该标签下的特征词，以生成每个标签对应的特征词典。

由于tf-ldf矩阵中每个数值对应每个词在每个标签下的代表性强弱。在某一标签下，将统计的tf-idf值大于预定阈值的词作为该标签下的特征词。可以将该标签及对应的特征词保存到特征词典中。

在步骤s350中，基于特征词典对训练文本集进行过滤，以得到训练文本集对应的特征矩阵。

根据本发明的一个实施例，可以将特征词典中的词与词序列中的词进行匹配，以得到训练文本的特征词序列。为了便于模型的训练，可以将特征词序列转换为预定格式的特征向量。根据本发明的一个实施例，可以将特征词序列转换为livsvm格式的特征向量，这样可以减少内存的使用，提高模型的计算速度。可以使用宏命令formatdatalibsvm.xls对特征词序列进行格式转换也可以使用自定义的代码程序，本方案对此不做限定。

特征向量可以由标签(标签值)、特征编号和对应的特征值组成，格式如下所示：<labe1><index1>：<value1><index2>：<value2>...其中，label表示训练文本的标签，可以自定义，如果是分类任务则可以是预先定义的标签值，如果是回归任务，则可以是目标值。index表示特征编号，特征编号对应该词语在特征词典中的维度下标。value表示特征值，即该特征词在该标签下的训练文本中出现的次数。

最后，在步骤s360中，将特征矩阵输入预训练的文本分类模型中进行训练，以便基于训练后的文本分类模型对语音文本进行分类。

对于多个标签的训练文本，可以使用梯度提升的决策树算法。该算法由多颗决策树组成，所有树的结论累加起来得出分类结果。其中，决策树可以分为回归树和分类树，回归树用于预测实数值，分类树用于预测分类标签值，文本分类模型中使用的是回归树。

根据本发明的一个实施例，可以使用xgboost极端梯度提升模型，将每个弱分类器的输出看成连续值，使得损失函数值是连续的，通过弱学习器的迭代达到优化模型的目的。xgboost的算法思想就是不断地添加树，不断地进行特征分裂来生长一棵树，每次添加一个树，其实是学习一个新函数，去拟合上次预测的残差。预测一个样本的分数，其实就是根据这个样本的特征，在每棵树中会落到对应的一个叶子节点，每个叶子节点就对应一个分数，最后将每棵树对应的分数加起来就是该样本的预测值。

在本发明的一个实施例中，可以将获取的训练文本集按照一定的比例分为训练集和验证集。xgboost模型对于每个类别训练m个分类器。假设有k个类别，则训练后的模型有m*k颗树。在训练过程中，xgboost采用一对多策略，每次将一个类别做为正样本，其余类别作为负样本。可以首先初始化模型的参数，然后将训练集对应的特征矩阵作为模型的输入。对于每个标签对应的特征向量，得到预测分数值。可以将预测分数值通过归一化函数映射为概率矩阵，并将概率矩阵中最大的概率值作为预测值。最后基于标签值与预测值之间的正则化损失值的一阶导数和二阶导数，反向迭代更新文本分类模型的参数，直到满足预定条件时，训练结束。预定条件可以包括树的最大预设数量、损失值小于预定阈值、迭代次数达到预定次数等。其中，正则化损失值由两部分构成，第一部分用来衡量预测值和标签值之间的误差，例如可以是均方差损失值。另一部分则是正则化项。正则化项就是对参数施加一定的控制，防止模型过拟合。常用的正则化项是l2正则，即所有参数的平方和。以上使用的文本分类模型仅是示例性的，还可以采用基于卷积神经网络的文本分类模型，本方案对此不做限定。

完成上述模型的训练后，可以将训练后的文本分类模型保存为模型文件，模型文件中保存对应的标签、特征词典和模型参数。接着，就可以利用得到训练后的文本分类模型对待分类的语音文本进行分类预测。图5示出了根据本发明的一个实施例的智能语音交互方法500的示意性流程图。如图5所示，在步骤s510中，将接收到的用户语音转换为语音文本。可以使用语音识别算法将语音实时转换为文字，以便进行分类分析。

随后在步骤s520中，对语音文本进行预处理，以得到预定格式的特征向量。例如，可以对文本进行分词处理，得到文本对应的词序列。然后使用预先构建的特征词典对词序列进行过滤，得到特征词序列。接着对特征词序列进行编码，可以是one-hot编码或tf-idf编码，然后将编码后的向量转换为预定的格式。例如可以将向量做libsvm格式的压缩，得到便于模型处理的特征向量。数据格式为标签：特征编号、特征值，其中标签位自动补零。

接着在步骤s530中，将语音文本对应的特征向量输入训练后的文本分类模型中获得文本分类结果。

可以将文本对应的特征向量保存为特征矩阵的格式或者文件格式。例如可以将特征矩阵输入xgboost文本分类模型中进行分类预测。特征矩阵可以通过文本分类模型的k颗树(对应k个标签)得到文本在每个标签下的分数值，并将得到的各个分数值通过softmax损失函数映射为一个k维的概率矩阵。softmax函数可以将模型得到的多个分数值，进行归一化处理，使得到的值在0-1之间，让结果变得可解释。即可以将结果看作是概率，某个类别概率越大，将文本归为该类别的可能性也就越高。最后从概率矩阵中选取最大概率值对应的标签作为文本分类结果。如果概率矩阵中的最大概率值小于预定阈值且当前文本分类模型为最后一个文本分类模块，则返回无法理解，否则进入下一个分类模块继续进行文本分类分析。

根据本发明的一个实施例，在使用文本分类模型对文本进行分类之前，可以首先将语音文本基于预设的规则进行匹配分析，以得到文本分类结果。图6示出了根据本发明的一个实施例的文本匹配方法600的示意性流程图。如图6所示，首先获取预设的匹配规则，然后，基于预设的匹配规则，将待预测的文本进行匹配分析，如果匹配成功则输出文本匹配结果。例如，可以从redis数据库中获取预设的匹配规则，可以包括正则表达式列表、关键字列表、过滤词列表，来进行动态模糊的匹配。其中正则表达式是对字符串和特殊字符操作的一种逻辑公式，可以利用预先定义好的一些特定字符或字符组合，组成一个规则字符串，用来表达对字符串的一种过滤逻辑。关键字是一些具有特殊功能的标识符，例如“false、ture、none、and、if、or等。其中，python的re模块提供了正则表达式匹配操作，正则表达式被编译成一系列的字节码，可以由c语言编写的匹配引擎执行。例如，可以使用compile函数编译正则表达式模式，使用match函数从起始位置开始匹配，使用findali函数遍历匹配，group函数分组匹配等。正则表达式的匹配规则和方法为本领域公知常识，本方案对此不再赘述。

在本发明的一个实施方式中，使用过滤词列表对语音文本进行匹配的过程如下：首先初始化当前过滤词在过滤词列表中的位置和当前字符串在语音文本中的位置，例如初始化过滤词在过滤词列表中的位置i＝0，字符串在语音文本中的位置endpoint＝0。然后将当前字符串与过滤词列表中的第i位词语进行匹配，并判断第i位词语是否是过滤词列表中的最后一个词，如果是则匹配成功；如果不是则令endpoint等于当前匹配的字符串的位置的末尾加1，如果当前匹配的字符串已经到达语音文本末端，则匹配失败。否则，令当前字符串等于当前endpoint位置到语音文本末尾的截取串，i递增加1。继续将当前的截取串与过滤词列表中的第i位词语进行匹配。如果当前字符串与过滤词列表中的第i位词语匹配失败则停止匹配，最终输出匹配结果。

可以直接利用python的re模块，将语音文本与正则表达式列表中的各项逐一匹配，如果匹配成功，则返回文本分分类结果，如果匹配失败，则继续将语音文本与关键字列表中的各项逐一匹配，如果匹配成功则返回文本分类结果，否则继续将语音文本与过滤词列表进行匹配，如果匹配成功则返回文本分类结果，如果匹配失败则继续使用文本分类模型对语音文本进行分类预测。文本分类模型可以包括通用类模型和业务类模型，可以首先调用通用类分类模型对待预测文本进行分类，得到通用分类结果，然后调用业务类分类模型对待预测文本进行分类，得到业务分类结果。

最后在步骤s540中，基于文本分类结果确定向用户反馈的语音信息。

由于图2所示的业务逻辑模块220中预先存储了文本类别与语音回复信息的对应关系，可以通过查找映射表的方式确定语音回复信息，反馈给用户。

根据本发明的方案，通过构造特征词典对待分类的文本进行过滤，将生成的特征向量作为模型的训练数据集，能够降低文本分类模型训练的复杂度。进一步地，结合多种文本匹配或分类方法，能够提高文本分类的准确性和效率。在语音交互场景中，能够将用户语音实时转换为文本，并对文本进行分类，根据分类结果和预设的业务逻辑规则确定向用户输出的语音内容，这样可以提高智能语音交互的自动化和智能化，提升了用户呼叫体验。

a6、如a5所述的方法，其中，所述预定条件包括迭代次数达到预定次数或者损失值小于预定阈值。

b10、如b9所述的方法，其中，所述匹配规则包括正则表达式列表、关键字列表和过滤词列表，所述基于所述匹配规则对语音文本进行匹配分析的步骤包括：

将语音文本与正则表达式列表中的各项进行匹配，如果匹配成功则输出文本分类结果，否则

将语音文本与关键字列表中的各项进行匹配，如果匹配成功则输出文本分类结果，否则

将语音文本与过滤词列表中的各项进行匹配，如果匹配成功则输出文本分类结果。

b11、如b10所述的方法，其中，所述将语音文本与过滤词列表中的各项进行匹配的步骤包括：

初始化当前过滤词在过滤词列表中的位置和当前字符串在语音文本中的位置；

将当前字符串与过滤词列表中的过滤词进行匹配，并判断当前匹配的过滤词是否是过滤词列表中的最后一个词，如果是，则匹配成功，如果不是，则将当前字符串的位置加1，将当前过滤词的位置加1，继续进行匹配；

如果当前匹配的字符串已到达语音文本末端，则匹配失败并停止匹配。

应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中，或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

这里描述的各种技术可结合硬件或软件，或者它们的组合一起实现。从而，本发明的方法和设备，或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介，例如软盘、cd-rom、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式，其中当程序被载入诸如计算机之类的机器，并被所述机器执行时，所述机器变成实践本发明的设备。

在程序代码在可编程计算机上执行的情况下，计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件)，至少一个输入装置，和至少一个输出装置。其中，存储器被配置用于存储程序代码；处理器被配置用于根据该存储器中存储的所述程序代码中的指令，执行本发明所述的方法。

以示例而非限制的方式，计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据，并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。

此外，所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此，具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外，装置实施例的在此所述的元素是如下装置的例子：该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样，除非另行规定，使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例，并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。此外，应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的公开是说明性的，而非限制性的，本发明的范围由所附权利要求书限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王树大;张兆明;安丽娜
技术所有人：北京鸿联九五信息产业有限公司
我是此专利的发明人

上一篇：内燃发动机的制作方法
上一篇：一种三维多孔双交联聚苯胺/石墨烯复合干凝胶制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。