一种语音识别无限级多轮对话方法与流程

文档序号：19725158发布日期：2020-01-18 03:18阅读：1118来源：国知局

本发明涉及一种语音识别无限级多轮对话方法。

背景技术：

目前语音识别对话方式操控设备的应用范围越来越广，包括导航设备上也开始采用这种方式进行操控和自动应答。而在多轮对话中会出现一个对话不仅与对话本身提出的要求有关，还需要结合前一个对话的内容判断对话对应的正确反馈和应答，相比单个对话这称之为二级对话，前后相关的对话层次越多级数越高，但是目前市面上的语音识别多级对话最多为三级对话，即能做出与之前对话内容连续相关的对话只能包含三级，这是因为现有对话在进行应答或执行匹配时待匹配池中的目标较多，并且涉及相关联多级对话还需要结合之前的对话进行多重匹配，这样大大降低了匹配的效率和可靠性，并且随着关联对话级数的增加导致越是后面的对话，匹配效果越差，从而导致目前相关联的多级对话只能实现三级以内的有限轮对话。

技术实现要素：

本发明的目的在于提供一种语音识别无限级多轮对话方法，以解决现有技术中由相关联的多级对话由于匹配涉及的目标和关联内容较多，匹配效率低，错误率高，限制了多轮对话相关对话级数的问题。

所述的一种语音识别无限级多轮对话方法，制定有功能卡片模型文件，功能卡片模型文件的卡片类型包括主卡片和备选卡片，功能卡片模型文件的内容包括卡片类型id、卡片id、卡片对应语义、卡片指令和卡片下一级对话id，所述备选卡片的卡片id均为主卡片或备选卡片的卡片下一级对话id；待语音输入并解析得到语义后，将语义与所述卡片对应语义一一匹配，匹配到卡片后执行对应的卡片指令并根据对应的下一级对话id中包含的卡片id将相符的备选卡片重新加载到待匹配池中，其中卡片重置后的待匹配池仅包含主卡片作为匹配对象，处第一级外的每轮对话将前一轮对话匹配后重新加载的备选卡片作为匹配对象，当匹配的卡片为没有卡片下一级对话id或出现未定义的异常情况时结束对话。

优选的，系统根据设定的语义理解协议制定所述功能卡片模型文件，功能卡片模型文件按主卡片和备选卡片分组设置，具体包括下列步骤：

步骤一、系统启动后进行初始化，让待匹配池中仅加载有主卡片以实现卡片重置，之后处于空闲状态等待语音输入；

步骤二、本系统接收到对话语音通过语音识别模块解析得到语义；

步骤三、将语义与待匹配池中的各个卡片的卡片对应语义一一匹配，当匹配成功执行步骤五，否则执行步骤四；

步骤四、匹配不成功时检查是否为定义的异常情况，如果是则提示使用者重复对话语音，返回步骤二重新解析语义，如果不是则执行步骤六；

步骤五、语义匹配成功则执行相匹配的卡片的卡片指令，并检查对该卡片是否有卡片下一级对话id，如果有卡片下一级对话id则将对应的下一级备选卡片重新加载到待匹配池，然后进入空闲状态等待语音输入，如果没有卡片下一级对话id则该卡片为对话终结点，执行步骤六；

步骤六、结束对话进行卡片重置，之后处于空闲状态等待语音输入。

优选的，本方法设置有参数异常次数表示发生定义的异常情况的次数，初始值为0，所述步骤四中如果判断为定义的异常情况则异常次数+1，之后检查异常次数，如果异常次数小于3则提示使用者重复对话语音返回步骤二重新解析语义，如果不是则执行步骤六。

优选的，本方法还包括在系统执行卡片指令后，若处于卡片没有重置的状态下则通过计时器开始计时，当系统接收到下一轮对话后将计时器重置，当计时大于设定的第一阈值后系统会判定为定义的异常，如果异常次数小于3则提示使用者提出对话语音，同时重置计数器进行计时，卡片重置时系统将计时器重置并关闭。

优选的，所述备选卡片的下一级对话id可以为空，也可以包含一个到多个备选卡片的卡片id，重新加载备选卡片时先将下一级对话id中包含的所有卡片id分别读取出来，再将各个卡片id对应的备选卡片重新加载到待匹配池中。

优选的，所述定义的异常情况包括解析得到语义正常但无法与卡片相匹配和超时未接收到对话语音；所述未定义的异常情况包括无法将接收的语音解析得到语义和语义中包含非正常字符。

本发明具有如下优点：

本发明通过制定功能卡片模型文件用以与语音识别出的语义进行匹配反馈执行命令，而匹配的卡片分为主卡片和备选卡片，主卡片用于对话开始的第一级对话(也是第一轮对话)，与备选卡片分在不同的待匹配池，这样对话一开始就大大减少了对话匹配的目标数量，提高了匹配效率和准确性。同时对于之后各级对话则采用卡片中设置关联的下一级对话id，来先检索出可能关联的下一级的备选卡片进行重新加载，改变之后对话匹配的目标数量，从而避免无效目标加入一一匹配的对象中，从而在之后各级对话进行匹配时，目标数量只与上一轮对话对应卡片的下一级对话id中包含的卡片id数有关，无论是几级对话都只与上一级对话相关，不会因为关联对话级数的增加而对匹配效率有重大影响，保障了多级无限轮对话的匹配效率和可靠性。

附图说明

图1为本发明一种语音识别无限级多轮对话方法的流程图。

具体实施方式

下面对照附图，通过对实施例的描述，对本发明具体实施方式作进一步详细的说明，以帮助本领域的技术人员对本发明的发明构思、技术方案有更完整、准确和深入的理解。

如图1所示，本发明提供了一种语音识别无限级多轮对话方法，该方法所用的语音识别匹配系统设定的语义理解协议制定有功能卡片模型文件，功能卡片模型文件的卡片类型包括主卡片和备选卡片，功能卡片模型文件的内容包括卡片类型id、卡片id、卡片对应语义、卡片指令和卡片下一级对话id，所述备选卡片的卡片id均为主卡片或备选卡片的卡片下一级对话id，主卡片和备选卡片分组储存。

本语音识别无限级多轮对话方法具体包括下列步骤：

步骤一、系统启动后进行初始化，让待匹配池中仅加载有主卡片以实现卡片重置，之后处于空闲状态等待语音输入；

步骤二、本系统接收到对话语音通过语音识别模块解析得到语义；

步骤三、将语义与待匹配池中的各个卡片的卡片对应语义一一匹配，当匹配成功执行步骤五，否则执行步骤四；

步骤四、匹配不成功时检查是否为定义的异常情况，如果是则提示使用者重复对话语音，返回步骤二重新解析语义，如果不是则执行步骤六；

步骤六、结束对话进行卡片重置，之后处于空闲状态等待语音输入。

其中系统启动后首先初始化，对待匹配池中的卡片进行重置即将其中的卡片均重新加载为主卡片，这样第一轮对话对应的待匹配池仅有主卡片作为匹配对象，而之后每轮对话如果之前的对话没有结束，待匹配池中的卡片没有重置，则会将前一轮对话匹配后重新加载的备选卡片作为匹配对象。

匹配的卡片分为主卡片和备选卡片，主卡片用于对话开始的第一级对话(也是第一轮对话)，与备选卡片分在不同的待匹配池，这样对话一开始就大大减少了对话匹配的目标数量，提高了匹配效率和准确性。而在之后各级对话进行匹配时，匹配的卡片目标数量只与上一轮对话对应卡片的下一级对话id中包含的卡片id数有关，无论是几级对话都只与上一级对话相关，不会因为关联对话级数的增加而对匹配效率有重大影响，保障了多级无限轮对话的匹配效率和可靠性。

更进一步，为了防止出现反复提示使用者重复对话语音进入死循环，本方法设置有参数异常次数表示发生定义的异常情况的次数，初始值为0。所述步骤四中如果判断为定义的异常情况则异常次数+1，之后检查异常次数，如果异常次数小于3则提示使用者重复对话语音返回步骤二重新解析语义，如果不是则执行步骤六，对话结束重置卡片。

这样当接收到的语音不清楚、出现无法正确识别的语音、语义的内容超过系统能应答的范围这些情况，本方法能首先采用重复2次语音再识别匹配，又能在超过3次语音无法匹配时及时结束对话以防止出现重复提示死循环的效果，并反馈使用者令其较快了解语音识别匹配出现错误的情况，从而及时进行补救。

所述定义的异常情况包括解析得到语义正常但无法与卡片相匹配和超时未接收到对话语音；所述未定义的异常情况包括无法将接收的语音解析得到语义和语义中包含非正常字符。解析得到语义正常但无法与卡片相匹配通常属于对话正常，但对话内容超出了系统可执行命令的范围，无法实现；又或者是语音不清楚导致语义解析有少量误差无法匹配。未接收到对话语音通常为第一级对话之后长期没有进行下一级对话，使用者可能离开或者不想进行之后的对话，但也可能只是忘记要进行下一级对话。这些情况需要先提示使用者重复或进行对话，当多次未能解决时再结束对话。而当语音解析得到语义和语义中包含非正常字符，说明输入的语音或者本身就不属于使用者的正常对话，可能是噪音；另一方面出现这种问题也可能是语音识别匹配系统本身发生故障导致信息错误，需要修正，这时应结束对话并反馈问题给使用者。

本方法还包括在系统执行卡片指令后，若处于卡片没有重置的状态下则通过计时器开始计时，当系统接收到下一轮对话后将计时器重置，当计时大于设定的第一阈值后系统会判定为定义的异常，如果异常次数小于3则提示使用者提出对话语音，同时重置计数器进行计时，卡片重置时系统将计时器重置并关闭。这样当多级对话开始后，本方法能及时提醒忘记继续对话的使用者，也可以在使用者离开现场或不想继续对话时，在2次提醒使用者未得到反馈后自动停止对话服务，降低系统的能耗，避免反复提示打扰使用者或他人。

所述备选卡片的下一级对话id可以为空，也可以包含一个到多个备选卡片的卡片id，重新加载备选卡片时先将下一级对话id中包含的所有卡片id分别读取出来，再将各个卡片id对应的备选卡片重新加载到待匹配池中。因此下一级对话有多种选择，可根据实际提出的问题进行一一匹配，而且下一级对话id也允许包含有正在进行匹配的对应备选卡片自身和其更上一级的id，这相比传统的逐级关联和多重匹配能大大提高对话匹配的自由度，并能提高效率。

上面结合附图对本发明进行了示例性描述，显然本发明具体实现并不受上述方式的限制，只要采用了本发明的发明构思和技术方案进行的各种非实质性的改进，或未经改进将本发明构思和技术方案直接应用于其它场合的，均在本发明保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨毅;李秋标;吴恭辉;陈伟德;吴启庭;黄永煌
技术所有人：芜湖盟博科技有限公司
我是此专利的发明人