用于语音对话平台的语音交互异常处理的配置方法及系统与流程

文档序号：17593360发布日期：2019-05-03 22:07阅读：289来源：国知局

本发明涉及智能语音对话领域，尤其涉及一种用于语音对话平台的语音交互异常处理的配置方法及系统。

背景技术：

在智能语音设备的使用中，如果用户说了一些智能语音设备无法解析的话语，智能语音设备通常会向用户反馈，例如“我没听懂，请您换个说法”类似的话语，提示用户刚刚输入的对话无法识别。

为了让智能语音设备实现这样的功能，通常在开发语音产品、语音技能的时候，通过代码或者其他开发方式，在sdk(softwaredevelopmentkit，软件开发工具包)层实现。由于这一操作较为复杂，需要开发者拥有较强的代码开发能力，对无代码基础使用语音对话平台开发语音技能的开发者不友好。

为了顾及这些无代码基础的开发者，有的语音对话平台使用默认配置。当搭载有这类默认配置的智能语音设备无法解析用户的话语时，会从默认配置中选择一条语音进行反馈。

在实现本发明过程中，发明人发现相关技术中至少存在如下问题：

让开发者使用sdk自行开发的话，费时费力，降低了开发效率，而使用默认的配置通常无法表达出无法解析用户话语的原因。例如，用户购买了智能学习机(功能仅有小学学习内容)给小学的小儿子使用，智能学习机可以顺利的帮助小儿子解决日常的学习问题，当在高中的大儿子出现了问题时，也向智能学习机提问，由于智能学习机本身没有高中知识内容，所以无法解析，这时，如果智能学习机还反馈“我没听懂，请您换个说法”、“请你再说一遍”之类的这种不能明确表达“不是没听懂说的什么，而是功能不够无法解析相应的话语”。但是用户在听了“没听懂，请您换个说法”之类的话语，用户会继续的说。进而，得到的还是智能学习机无情的反馈。由于无法提醒用户是由于什么原因“听不懂”，并且，智能语音设备是由多个语音产品构成，而语音产品又包括语音技能，如果无法清楚的向用户表达出具体哪个层面出现的错误，使得用户体验较差。

技术实现要素：

为了至少解决现有技术中使用sdk开发难度较大，效率较低，而使用语音对话平台默认提供的异常反馈方式无法准确的反馈出产品级、技能级的错误，造成的用户体验较差的问题。

第一方面，本发明实施例提供一种用于语音对话平台的语音交互异常处理的配置方法，包括：

在语音对话平台的前端，在产品开发页面和技能开发页面下分别提供相对应的产品级异常处理配置框和技能级异常处理配置框，所述产品级异常处理配置框和技能级异常处理配置框中分别包括产品级异常处理反馈信息和技能级异常处理反馈信息；

在语音对话平台的后台，将语音交互异常处理划分为产品级异常处理和技能级异常处理；

将所述产品级异常处理的判断策略配置成：当经过一轮语音输入后，没有命中任何技能时，则判定为产品级异常处理，其中，所述没有命中任何技能包括：无识别结果或无解析结果；

将所述技能级异常处理的判断策略配置成：当经过第一轮语音交互后命中对应技能时，若第二轮语音交互在该对应技能下无识别结果或解析结果，则判定为技能级异常处理；

其中，所述产品级异常处理配置成：响应于语音交互后的所述产品级异常处理的判定结果，调用所述产品级异常处理配置框中的反馈信息，所述技能级异常处理配置成：响应于语音交互后的所述技能级异常处理的判定结果，调用所述技能级异常处理配置框中的技能级异常处理反馈信息。

第二方面，本发明实施例提供一种用于语音对话平台的语音交互异常处理的配置系统，包括：

反馈信息配置程序模块，用于在语音对话平台的前端，在产品开发页面和技能开发页面下分别提供相对应的产品级异常处理配置框和技能级异常处理配置框，所述产品级异常处理配置框和技能级异常处理配置框中分别包括产品级异常处理反馈信息和技能级异常处理反馈信息；

异常处理划分程序模块，用于在语音对话平台的后台，将语音交互异常处理划分为产品级异常处理和技能级异常处理；

产品级判断策略配置程序模块，用于将所述产品级异常处理的判断策略配置成：当经过一轮语音输入后，没有命中任何技能时，则判定为产品级异常处理，其中，所述没有命中任何技能包括：无识别结果或无解析结果；

技能级判断策略配置程序模块，用于将所述技能级异常处理的判断策略配置成：当经过第一轮语音交互后命中对应技能时，若第二轮语音交互在该对应技能下无识别结果或解析结果，则判定为技能级异常处理；

异常处理配置程序模块，用于所述产品级异常处理配置成：响应于语音交互后的所述产品级异常处理的判定结果，调用所述产品级异常处理配置框中的反馈信息，所述技能级异常处理配置成：响应于语音交互后的所述技能级异常处理的判定结果，调用所述技能级异常处理配置框中的技能级异常处理反馈信息。

第三方面，提供一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例的用于语音对话平台的语音交互异常处理的配置方法的步骤。

第四方面，本发明实施例提供一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现本发明任一实施例的用于语音对话平台的语音交互异常处理的配置方法的步骤。

本发明实施例的有益效果在于：通过对语音对话平台的前端进行调整，使得开发者配置异常处理反馈信息更加简单，易于修改，对于异常情况播报内容的配置可直接在控制台输入完成，即使没有代码基础也可以操作，更改完异常反馈播报内容后仅需发布产品版本即可实时生效。通过划分异常层级，错误情况区分明确，提升了用户的交互体验，明确的区分了语音交互中的异常情况，开发者可以针对不同异常情况、当前对话所处的不同领域配置不同的回复内容，以正确引导用户输入正确的内容，尽快实现交互目的、提升交互体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的一种用于语音对话平台的语音交互异常处理的配置方法的流程图；

图2是本发明一实施例提供的一种用于语音对话平台的语音交互异常处理的配置系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示为本发明一实施例提供的一种用于语音对话平台的语音交互异常处理的配置方法的流程图，包括如下步骤：

s11：在语音对话平台的前端，在产品开发页面和技能开发页面下分别提供相对应的产品级异常处理配置框和技能级异常处理配置框，所述产品级异常处理配置框和技能级异常处理配置框中分别包括产品级异常处理反馈信息和技能级异常处理反馈信息；

s12：在语音对话平台的后台，将语音交互异常处理划分为产品级异常处理和技能级异常处理；

s13：将所述产品级异常处理的判断策略配置成：当经过一轮语音输入后，没有命中任何技能时，则判定为产品级异常处理，其中，所述没有命中任何技能包括：无识别结果或无解析结果；

s14：将所述技能级异常处理的判断策略配置成：当经过第一轮语音交互后命中对应技能时，若第二轮语音交互在该对应技能下无识别结果或解析结果，则判定为技能级异常处理；

s15：所述产品级异常处理配置成：响应于语音交互后的所述产品级异常处理的判定结果，调用所述产品级异常处理配置框中的反馈信息，所述技能级异常处理配置成：响应于语音交互后的所述技能级异常处理的判定结果，调用所述技能级异常处理配置框中的技能级异常处理反馈信息。

在本实施方式中，为了便于开发者的使用，对语音对话平台的前端、后台以及异常层级处理的判断策略进行了多方位的配置，使得开发者在使用语音对话平台配置语音交互异常处理更加便捷。

对于步骤s11，在语音对话平台的web前端，也就是语音对话平台与开发者交互的页面，在开发者开发语音产品时，提供与所述语音产品相对应的产品级的异常处理配置框，所述产品级的异常处理配置框包括产品级异常处理反馈信息，也就是说，当搭载所述语音产品的智能设备，在运行所述语音产品时发生错误、异常等情况时，会将所述产品级异常处理反馈信息向使用智能设备的用户语音播报。产品级的异常通常是由于用户唤醒智能设备后，第一轮语音对话输入时，在解析时出现了错误，会使用产品级错误来回复用户，作为一种实施方式，所述产品级异常处理反馈信息和技能级异常处理反馈信息包括：语音识别异常处理反馈以及语义理解异常处理反馈。

当开发者开发语音技能时，提供与所述语音技能相对应的技能级的异常处理配置框，所述技能级的异常处理配置框包括技能级异常处理反馈信息。技能级的异常通常是由于用户唤醒智能设备后，其输入的语音内容含有解析结果，并且已经命中了某语音技能，当用户再次输入时，如果出现语音识别异常的情况，则播报技能级的错误来回复用户。

对于步骤s12，在步骤s11中配置好了语音对话平台的前端，还需在语音对话平台的前端配置相应的后台处理功能，将所述语音交互异常划分为产品级异常和技能级异常。在此通过划分异常级别来对不同类型的异常确定不同的处理方式。

对于步骤s13，将所述产品级异常处理判断策略配置成，当经过一轮语音输入后，没有命中任何技能时，则判定为产品级异常处理，其中，所述没有命中任何技能包括：无识别结果或无解析结果。由于用户在使用智能设备时，希望智能设备执行某项任务时，都需要通过语音调用语音技能来实现相应的功能，无论是语音识别为空还是语义解析为空，又或者及时识别了，但是没有相应的技能给用户调用，都说明用户的对话输入没有进入到任意对话领域，因此对异常的处理应当由更具普遍性的产品级异常处理来承载。

对于步骤s14，将所述技能级异常处理的判断策略配置成，当经过第一轮语音交互后命中技能时，若第二轮语音交互在该对应技能下无识别结果、无解析结果时，判定为技能级异常处理。由于用户在使用智能设备时，通过第一轮的语音进入了某一语音技能，例如，通过第一轮的对话，进入了“导航”技能，这时就需要用户输入第二轮的目的地，这时，用户由于口齿不清，或者其他原因，在第二轮的语音交互中，没有输出正常的语音，所以智能设备无法确定出相应的解析结果，进而判定为技能级异常处理。

对于步骤s15，在配置异常处理判断策略配置后，就需要配置具体的异常处理的具体实施方法，对于产品级的异常处理配置，响应于语音交互后的所述产品级别的判定结果，调用所述产品级异常处理配置框中的反馈信息。通过所述反馈信息向用户反馈。对于技能级的异常处理配置，响应于所述技能及异常处理配置框中的技能级异常处理判定结果，调用所述技能级异常处理配置框中的技能级异常处理反馈信息。例如，技能级异常，语音技能“英语学习”，所述“英语学习”技能是针对于小学初中的词汇进行编写的。当用户通过所述学习机调用“英语学习”技能，语音输入cet6、雅思等英语词汇时，“英语学习”技能解答不了，开发者在技能级异常处理配置框中的技能级异常处理反馈信息，对于这种情况，开发者预先配置反馈信息为“我的知识解决不了这个词汇”，这样，用户在使用时，出现这种情况，就可以根据反馈信息明确的了解到，输入的语音，智能设备解决不了。而不是“请您再说一遍”、“哼哼、不想回答”、“请您换个说法”这种表达不出具体异常情况的通用反馈。

通过该实施方式可以看出，通过对语音对话平台的前端进行调整，使得开发者配置异常处理反馈信息更加简单，易于修改，对于异常情况播报内容的配置可直接在控制台输入完成，即使没有代码基础也可以操作，更改完异常反馈播报内容后仅需发布产品版本即可实时生效。通过划分异常层级，错误情况区分明确，提升了用户的交互体验，明确的区分了语音交互中的异常情况，开发者可以针对不同异常情况、当前对话所处的不同领域配置不同的回复内容，以正确引导用户输入正确的内容，尽快实现交互目的、提升交互体验。

作为一种实施方式，在本实施例中，所述产品开发页面包括：异常次数配置框；

所述产品级异常处理配置框中包括：超出异常次数反馈信息；

所述产品级异常处理包括：当经过所述异常次数轮语音交互，没有命中任何技能时，退出语音交互状态，调用所述产品级异常处理配置框中的超出异常次数反馈信息。

在本实施方式中，所述产品开发页面包括异常次数配置框，产品级异常处理配置框中包括：超出异常次数反馈信息，为了保障智能设备的资源，当识别或理解为空的时候，记录语音交互中发生的异常次数，如果产出此配置的次数，则会自动退出语音交互，等待用户下次唤醒，进行语音交互。

通过该实施方式可以看出，通过配置异常次数，使得在语音对话交互中超过异常次数退出语音交互，节省智能设备的资源，保障智能设备不会将资源浪费在这种频繁异常的情况。

作为一种实施方式，在本实施例中，所述产品级异常处理配置框中还包括：网络离线反馈信息；

所述产品级异常处理包括：处于离线状态，且语音交互没有识别结果时，调用所述产品级异常中的网络离线反馈信息。

在本实施方式中，由于智能设备中解析语音对话的大部分功能都是由云端处理，需要互联网的支持，所以根据离线的情况，进行针对性的配置。当智能设备处于离线状态时，无法获取云端的帮助，而本机又解析不了用户输入的语音时，调用产品级异常中的网络离线反馈信息，明确的向用户反馈异常原因。

通过该实施方式可以看出，由于部分智能设备是无屏幕的，用户不太能感知这种智能设备是否处于联网状态，而针对于断网的异常情况进行特定针对的反馈，明确的向开发者反馈出异常的原因，提升用户的交互体验。

作为一种实施方式，所述技能级异常处理配置框还包括：重复播报选项；

所述技能级异常处理包括：响应于语音交互后的所述技能级异常处理的判定结果，当所述重复播报选项启用时，重复播放上一轮的语音交互对话。

在本实施方式中，由于技能级的对话通常有很多轮交互，例如：

用户：我要导航。

智能设备：您要导航到哪里？

用户：导航去北山公园。

智能设备：为您找到两条线路，请问使用哪一条线路？

用户：(这时用户由于分心，没有听清，便答道)第五条。

这时语音对话出现异常，根据技能级异常处理看配置的重复播放选项，来重复播放上一轮语音对话。

这时，智能设备会重新向用户问到:为您找到两条线路，请问使用哪一条线路？

通过该实施方式可以看出，由于语音技能的交互是一步一步递进的，当其中的一部语音解析出现异常时，向用户反馈上一轮的语音交互对话可以帮助用户重新明确要输入的话语。而直接通过重复播放选项配置，也使得开发者操作起来更加便捷。

如图2所示为本发明一实施例提供的一种用于语音对话平台的语音交互异常处理的配置系统的结构示意图，该系统可执行上述任意实施例所述的用于语音对话平台的语音交互异常处理的配置方法，并配置在终端中。

本实施例提供的一种用于语音对话平台的语音交互异常处理的配置系统包括：反馈信息配置程序模块11，异常处理划分程序模块12，产品级判断策略配置程序模块13，技能级判断策略配置程序模块14和异常处理配置程序模块15。

其中，反馈信息配置程序模块11用于在语音对话平台的前端，在产品开发页面和技能开发页面下分别提供相对应的产品级异常处理配置框和技能级异常处理配置框，所述产品级异常处理配置框和技能级异常处理配置框中分别包括产品级异常处理反馈信息和技能级异常处理反馈信息；异常处理划分程序模块12用于在语音对话平台的后台，将语音交互异常处理划分为产品级异常处理和技能级异常处理；产品级判断策略配置程序模块13，产品级判断策略配置程序模块，用于将所述产品级异常处理的判断策略配置成：当经过一轮语音输入后，没有命中任何技能时，则判定为产品级异常处理，其中，所述没有命中任何技能包括：无识别结果或无解析结果；技能级判断策略配置程序模块14用于技能级判断策略配置程序模块，用于将所述技能级异常处理的判断策略配置成：当经过第一轮语音交互后命中对应技能时，若第二轮语音交互在该对应技能下无识别结果或解析结果，则判定为技能级异常处理；异常处理配置程序模块15用于所述产品级异常处理配置成：响应于语音交互后的所述产品级异常处理的判定结果，调用所述产品级异常处理配置框中的反馈信息，所述技能级异常处理配置成：响应于语音交互后的所述技能级异常处理的判定结果，调用所述技能级异常处理配置框中的技能级异常处理反馈信息。

进一步地，所述产品开发页面包括：异常次数配置框；

所述产品级异常处理配置框中包括：超出异常次数反馈信息；

进一步地，所述产品级异常处理配置框中还包括：网络离线反馈信息；

所述产品级异常处理包括：处于离线状态，且语音交互没有识别结果时，调用所述产品级异常中的网络离线反馈信息。

进一步地，所述技能级异常处理配置框还包括：重复播报选项；

所述技能级异常处理包括：响应于语音交互后的所述技能级异常处理的判定结果，当所述重复播报选项启用时，重复播放上一轮的语音交互对话。

进一步地，所述产品级异常处理反馈信息和技能级异常处理反馈信息包括：语音识别异常处理反馈以及语义理解异常处理反馈。

本发明实施例还提供了一种非易失性计算机存储介质，计算机存储介质存储有计算机可执行指令，该计算机可执行指令可执行上述任意方法实施例中的用于语音对话平台的语音交互异常处理的配置方法；

作为一种实施方式，本发明的非易失性计算机存储介质存储有计算机可执行指令，计算机可执行指令设置为：

在语音对话平台的后台，将语音交互异常处理划分为产品级异常处理和技能级异常处理；

作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本发明实施例中的测试软件的方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中，当被处理器执行时，执行上述任意方法实施例中的用于语音对话平台的语音交互异常处理的配置方法。

非易失性计算机可读存储介质可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据测试软件的装置的使用所创建的数据等。此外，非易失性计算机可读存储介质可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至测试软件的装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本发明实施例还提供一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例的用于语音对话平台的语音交互异常处理的配置方法的步骤。

本申请实施例的客户端以多种形式存在，包括但不限于：

(1)移动通信设备:这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括:pda、mid和umpc设备等，例如平板电脑。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)其他具有语音交互功能的电子装置。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”，不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王少蓉
技术所有人：苏州思必驰信息科技有限公司
我是此专利的发明人

上一篇：一种煤基碳泡沫-聚氨酯相变复合材料的制备方法与流程
上一篇：一种安全可靠低能耗的燃料气撬的制作方法