一种基于分类规则的语音识别系统及方法

文档序号：2827583阅读：247来源：国知局

一种基于分类规则的语音识别系统及方法
【专利摘要】本发明公开一种基于分类规则的语音识别系统，其特征在于，包括：一语音数据库，该语音数据库用于记录用户语音数据；一语音转换单元，该语音转换单元用于将该用户语音数据转换为一文本，该文本被存储于一文本数据库里，该文本数据库存储该文本与该语音数据间的关联关系以及相关结构化数据；一业务模型数据库，该业务模型数据库用于存储一业务目标与该业务目标所对应的业务解决方案的数据的关联关系；一匹配模块，该匹配模块根据由该业务目标生成的一关键词及该业务模型数据库中预设的一初始关联关系匹配该用户语音与该业务解决方案的数据；一验证模块，该验证模块从该语音数据库中随机提取若干用户语音数据，并判断该匹配模块中预设的初始关联关系的准确性，根据判断结果调整该匹配模块中该关联关系。
【专利说明】-种基于分类规则的语音识别系统及方法

【技术领域】
[0001] 本发明基于一种语音识别【技术领域】，尤其涉及一种根据用户输入的语音信息，基于自定义分类规则的数据建模与分析方法。

【背景技术】
[0002] 呼叫中心存在大量语音数据，整合、分析、利用语音数据成为呼叫中心管理的关键环节，但实际运营中存在以下情况：第一、语音数据不完整，不是所有通话都记录了相应的类别描述，有些甚至完全没有记录。第二、语音数据不严谨，部分类别描述是由坐席手工操作记录下来的，存在敷衍应付和主观出错的情况。第三、对于自定义类别（如专项调查或突击抽查的类别)无法通过系统提前设置和记录。第四、通话过程管理由于缺少有效工具存在管理盲区。
[0003] 针对上述技术问题，现有技术中没有存在一种按照自定义分类规则设定业务模型从而找到数据类别和自动识别的手段，因此难以在此基础上减少人力资源成本的使用。

【发明内容】

[0004] 本发明的目的在于提供按照自定义分类规则设定业务模型从而找到数据类别和自动识别的手段。
[0005] 为了实现上述发明目的，本发明公开一种基于分类规则的语音识别系统，其特征在于，包括：一语音数据库，该语音数据库用于记录用户语音数据；一语音转换单元，该语音转换单元用于将该用户语音数据转换为一文本，该文本被存储于一文本数据库里，该文本数据库存储该文本与该语音数据间的关联关系；一业务模型数据库，该业务模型数据库用于存储一业务目标与该业务目标所对应的业务解决方案的数据的关联关系；一匹配模块，该匹配模块根据由该业务目标生成的一关键词及该业务模型数据库中预设的一初始关联关系匹配该用户语音与该业务解决方案的数据；一验证模块，该验证模块从该语音数据库中随机提取若干用户语音数据，并判断该匹配模块中预设的初始关联关系的准确性，根据判断结果调整该匹配模块中该关联关系。
[0006] 更进一步地，该验证模块反复从该语音数据库中随机提取若干用户语音数据，并反复判断该匹配模块中预设的初始关联关系的准确性，根据判断结果重复调整该匹配模块中该关联关系，直至使该用户语音与该业务解决方案的数据实现一一对应。
[0007] 更进一步地，该匹配模块中的初始关联关系由该关键词及一经验数据确定。
[0008] 更进一步地，该匹配模块中的初始关联关系至少包括四种逻辑关系。
[0009] 更进一步地，该匹配模块中的初始关联关系包括逻辑与关系、逻辑或关系、逻辑非关系及邻接关系，该逻辑非关系的优先级高于该逻辑与关系、逻辑或关系及邻接关系；该逻辑与关系是指两个关键词必须同时出现在一个用户语音数据的独立片段中，该逻辑或关系是指只要任意一个关键词出现在先该用户语音数据的独立片段中，该逻辑非关系是指关键词不能出现在先该用户语音数据的独立片段中，该邻接关系是指两个关键词必须同时存在且具有前后顺序及满足一定距离关系。
[0010] 本发明同时公开一种基于分类规则的语音识别方法，其特征在于，包括：步骤一、记录用户语音数据于一语音数据库中；步骤二、将该用户语音数据转换为一文本，并将该文本与该语音数据间的关联关系存储一文本数据库中；步骤三、在一业务模型数据库中记录一业务目标与该业务目标所对应的业务解决方案的数据的关联关系；步骤四、根据该业务目标生成的一关键词及预设的一初始关联关系匹配该用户语音与该业务解决方案的数据；步骤五、从该语音数据库中随机提取若干用户语音数据，并判断该步骤四中预设的初始关联关系的准确性，根据判断结果调整该步骤四中该关联关系。
[0011] 更进一步地，该步骤五还包括：重复从该语音数据库中随机提取若干用户语音数据，并多次判断该步骤四中预设的初始关联关系的准确性，根据判断结果重复调整该步骤四中该关联关系，直至使该用户语音与该业务解决方案的数据实现一一对应。
[0012] 更进一步地，该步骤四中预设的初始关联关系由该关键词及一经验数据确定。
[0013] 更进一步地，该步骤四中预设的初始关联关系至少包括四种逻辑关系。
[0014] 更进一步地，该初始关联关系包括逻辑与关系、逻辑或关系、逻辑非关系及邻接关系，该逻辑非关系的优先级高于该逻辑与关系、逻辑或关系及邻接关系；该逻辑与关系是指两个关键词必须同时出现在一个用户语音数据的独立片段中，该逻辑或关系是指只要任意一个关键词出现在先该用户语音数据的独立片段中，该逻辑非关系是指关键词不能出现在先该用户语音数据的独立片段中，该邻接关系是指两个关键词必须同时存在且具有前后顺序及满足一定距离关系。
[0015] 与现有技术相比较，本系统通过从语音数据库中随机地反复地抽取数据，验证原始分类规则的合理性，并根据验证结果自动修改分类规则，利用不同的数据库可以实现业务营销的效果分析、质量管理和监督、销售技能分析、客户行为分析、自动语音应答等后续操作。

【专利附图】

【附图说明】
[0016] 关于本发明的优点与精神可以通过以下的发明详述及所附图式得到进一步的了解。
[0017] 图1是本发明所提供的基于分类规则的语音识别方法的流程图。
[0018] 图2是本发明所提供的基于分类规则的语音识别系统的结构示意图。

【具体实施方式】
[0019] 下面结合附图详细说明本发明的具体实施例。
[0020] 图1是本发明所提供的基于分类规则的语音识别方法的流程图。本发明的目的在于提供一种自动的基于分类规则的语音识别系统及方法，该语音识别系统根据用户的语音数据不断调整分类规则，从而减少了人工操作的步骤，并根据分类规则不断修订和完善的结果实现用户输入的语音数据与业务解决方案的数据之间的一一匹配。
[0021] 以下将结合图1和图2介绍本发明。如图1所示，用户呼叫语音均被统一存储与语音数据库101中，通过转换102,将所述用户语音数据转换为一文本，文本被存储于一文本数据库103里，文本数据库用于存储所述文本与所述语音数据间的关联关系。该语音识别系统还包括业务模型数据库105,业务模型数据库用于存储一业务目标106与业务目标106 所对应的业务解决方案的数据的关联关系及相关结构化数据；匹配模块，匹配模块根据由所述业务目标生成的一关键词及所述业务模型数据库中预设的一初始分类规则104匹配文本数据集107,最终匹配所述用户语音与语音集108。
[0022] 从应用实现上来看，本发明所提供的基于分类规则的语音识别系统，可以纵向被划分为应用层200,实现层300以及数据层400。其中，应用层200包括业务目标201、应用场景202和页面展现203。实现层300包括语音转换单元301、业务模型模块302、分类规则模块303、匹配模块304以及验证模块305。该数据层400包括语音数据库401、文本数据库 402以及业务数据库403。
[0023] 本系统的具体流程如下：第一步，建立"语音数据库"，编写相关工具结构化语音数据并建立"文本数据库"，记录文本与语音数据间的关联关系。
[0024] 这一步工具转换的准确率非常重要，直接关系到后续模型建立的效果。文本与语音数据的关联关系，是为了保证从模型输出结果中反查调取相应的语音数据进行验证及相关后续工作。
[0025] 第二步，按照"业务目标"建立"业务模型"，即建立的业务模型是为了满足某个业务目标或拟解决的业务问题。如营销活动过程及效果监测模型是为了检验和检测某次营销活动的执行过程和效果。
[0026] 这一步与实际生产密切相关，业务模型，源自呼叫中心实际运营管理中遇到的困惑以及需要解决的问题。随着呼叫中心的发展和变迁，业务模型随着业务目标的变化而逐步演变。
[0027] 第三步，搜集与业务模型和业务目标相关联的关键词。如"车险"可能相关联的关键词会有：优惠、购买、保费、服务、理赔等。
[0028] 关键词的搜集，需要相关领域的业务知识和业务实践，为了降低工具转换准确率的影响，建议在文本数据的提示下通过人工方式检查语音数据转换的准确性。
[0029] 第四步，结合关键词和编写人员的自身业务知识，编写业务模型对应的分类规则初型。一个业务模型可以包括一个分类规则，也可以包括多个分类规则。分类规则文本格式如下：业务模型：（分类规则）例如：营销活动过程及效果监测模型：（分类规则1)->保险&购买I (车险#优惠）营销活动过程及效果监测模型：（分类规则2)->保险&办理I (车险#活动）营销活动过程及效果监测模型：（分类规则3)->保险&办理| (车险#促销）自定义分类规则，围绕已经建立的业务模型，用于检验某条通话是否满足该模型设定的规则。规则由描述业务模型和业务目标的关键词组成，这些关键词存在某些逻辑关系，逻辑关系包含以下四种： (1) "与"关系(规则符号"&"）：二元逻辑关系，普通优先级，意指"必须同时出现"，关系的两个部分必须同时存在则认为符合"与"关系，如"我想办理车辆保险"符合"办理&保险"规则，"我想办理与车辆有关的险种"则不符合； (2) "或"关系(规则符号" | 二元逻辑关系，普通优先级，意指"只要出现其中任何一个";如"我想办理车辆保险"符合"办理I保险"规则，"我想办理与车辆有关的险种"也符合"办理I保险"规则； (3) "非"关系(规则符号"！ "):一元逻辑关系，高优先级，意指"不能出现"，关系中的关键词必须不存在；如"我想办理车辆保险"符合"！车险"规则； (4) "邻接"关系(规则符号二元逻辑关系，普通优先级，意指"相继出现"，关系的两个部分必须同时存在且具有前后顺序及较近距离则认为符合"邻接"关系，较近距离定义为两个部分距离5个汉字以内（含5个)，如"我想买一份保险"符合"买#保险"规则。
[0030] 自定义分类规则的格式规定： (1) 关系符号均为半角字符； (2) -条规则以半角符号"（"开始，以"）"结束； (3) 除了"非"和"邻接"关系，其他关系可以连续链接，如"（车险|车辆保险|汽车险）"； (4) 除了 "邻接"关系，其他关系可以互相嵌套； (5) 除了 "非"关系，其他关系的优先级必须显式的以内部括号""标记； (6) "（"和"）"必须成对出现，具有一样的个数，否则认为语法错误； (7) 关系符号前后可以存在若干空格以增强可读性； (8) 可以插入无实际逻辑意义的"（" "）"以增强可读性； (9) 任意两个相邻的关键词之间必须存在关系符号。
[0031] 第五步，从步骤一建立的文本数据库中随机提取一万条以上相关数据，建立与分类规则一一对应的"数据集"，并编写相应工具对分类规则进行验证，获得筛选结果。
[0032] 这一步为保证验证结果，数据建议随意抽取，并保证最低数据量一万条，如有必要，可适当增加数据量。
[0033] 第六步，对筛选结果进行仔细排查，对于已经通过模型分类规则验证但不符合主观判断的数据进行分析，调整该分类规则；从未通过模型验证的数据中发现符合该模型目标的关键词及其逻辑，补充该分类规则。
[0034] 第七步，按照分类规则的个数，重复第五步到第六步，直到每个规则未识别数据数量不再减少，分类规则编写完成。单个业务模型建立完成。
[0035] 第八步，重复第二步到第七步，完成建立多个业务模型。
[0036] 第九步，随机输入一条或多条语音数据，利用已经编写和验证完成的所有业务模型，判断语音数据是否符合业务模型规则或在大量数据中找到符合业务模型规则的语音数据。
[0037] 利用本发明所提供的分类规则下，可以有效地将用户语音数据按照内容、业务模型等进行归类，将现有技术中海量的语音数据进行分类，并分别存储于不同数据库中。利用不同的数据库可以实现业务营销的效果分析、质量管理和监督、销售技能分析、客户行为分析、自动语音应答等后续操作。
[0038] 总之，本发明克服现有技术的不足，提供一种基于自定义分类规则的建模分析方法，提供了一种可以通过识别文本自动判断业务目标的手段，现有技术无法解决准确将识别文本进行分类与匹配。本说明书中所述的只是本发明的较佳具体实施例，以上实施例仅用以说明本发明的技术方案而非对本发明的限制。凡本领域技术人员依本发明的构思通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在本发明的范围之内。
【权利要求】
1. 一种基于分类规则的语音识别系统，其特征在于，包括：一语音数据库，所述语音数据库用于记录用户语音数据；一语音转换单元，所述语音转换单元用于将所述用户语音数据转换为一文本，所述文本被存储于一文本数据库里，所述文本数据库存储所述文本与所述语音数据间的关联关系以及相关结构化数据；一业务模型数据库，所述业务模型数据库用于存储一业务目标与所述业务目标所对应的业务解决方案的数据的关联关系；一匹配模块，所述匹配模块根据由所述业务目标生成的一关键词及所述业务模型数据库中预设的一初始关联关系匹配所述用户语音与所述业务解决方案的数据；一验证模块，所述验证模块从所述语音数据库中随机提取若干用户语音数据，并判断所述匹配模块中预设的初始关联关系的准确性，根据判断结果调整所述匹配模块中所述关联关系。
2. 如权利要求1所述的基于分类规则的语音识别系统，其特征在于，所述验证模块反复从所述语音数据库中随机提取若干用户语音数据，并反复判断所述匹配模块中预设的初始关联关系的准确性，根据判断结果重复调整所述匹配模块中所述关联关系，直至使所述用户语音与所述业务解决方案的数据实现一一对应。
3. 如权利要求1所述的基于分类规则的语音识别系统，其特征在于，所述匹配模块中的初始关联关系由所述关键词及一经验数据确定。
4. 如权利要求1所述的基于分类规则的语音识别系统，其特征在于，所述匹配模块中的初始关联关系至少包括四种逻辑关系。
5. 如权利要求4所述的基于分类规则的语音识别系统，其特征在于，所述匹配模块中的初始关联关系包括逻辑与关系、逻辑或关系、逻辑非关系及邻接关系，所述逻辑非关系的优先级高于所述逻辑与关系、逻辑或关系及邻接关系；所述逻辑与关系是指两个关键词必须同时出现在一个用户语音数据的独立片段中，所述逻辑或关系是指只要任意一个关键词出现在先所述用户语音数据的独立片段中，所述逻辑非关系是指关键词不能出现在先所述用户语音数据的独立片段中，所述邻接关系是指两个关键词必须同时存在且具有前后顺序及满足一定距离关系。
6. -种基于分类规则的语音识别方法，其特征在于，包括：步骤一、记录用户语音数据于一语音数据库中；步骤二、将所述用户语音数据转换为一文本，并将所述文本与所述语音数据间的关联关系存储一文本数据库中；步骤三、在一业务模型数据库中记录一业务目标与所述业务目标所对应的业务解决方案的数据的关联关系；步骤四、根据所述业务目标生成的一关键词及预设的一初始关联关系匹配所述用户语音与所述业务解决方案的数据；步骤五、从所述语音数据库中随机提取若干用户语音数据，并判断所述步骤四中预设的初始关联关系的准确性，根据判断结果调整所述步骤四中所述关联关系。
7. 如权利要求6所述的基于分类规则的语音识别方法，其特征在于，所述步骤五还包括：重复从所述语音数据库中随机提取若干用户语音数据，并多次判断所述步骤四中预设的初始关联关系的准确性，根据判断结果重复调整所述步骤四中所述关联关系，直至使所述用户语音与所述业务解决方案的数据实现一一对应。
8. 如权利要求6所述的基于分类规则的语音识别方法，其特征在于，所述步骤四中预设的初始关联关系由所述关键词及一经验数据确定。
9. 如权利要求6所述的基于分类规则的语音识别方法，其特征在于，所述步骤四中预设的初始关联关系至少包括四种逻辑关系。
10. 如权利要求9所述的基于分类规则的语音识别方法，其特征在于，所述初始关联关系包括逻辑与关系、逻辑或关系、逻辑非关系及邻接关系，所述逻辑非关系的优先级高于所述逻辑与关系、逻辑或关系及邻接关系；所述逻辑与关系是指两个关键词必须同时出现在一个用户语音数据的独立片段中，所述逻辑或关系是指只要任意一个关键词出现在先所述用户语音数据的独立片段中，所述逻辑非关系是指关键词不能出现在先所述用户语音数据的独立片段中，所述邻接关系是指两个关键词必须同时存在且具有前后顺序及满足一定距离关系。
【文档编号】G10L15/06GK104064182SQ201410284404
【公开日】2014年9月24日申请日期:2014年6月24日优先权日:2014年6月24日
【发明者】邵利铎, 孙杰平, 刘晗, 洪大帅申请人:中国人民财产保险股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邵利铎;孙杰平;刘晗;洪大帅
技术所有人：中国人民财产保险股份有限公司
我是此专利的发明人

上一篇：数字音频波形突变的检测方法
上一篇：一种嵌入式音频采集端aac音频编码方法