一种语音互动控制方法及其装置的制造方法

文档序号:10687103阅读:146来源:国知局
一种语音互动控制方法及其装置的制造方法
【专利摘要】本发明公开了一种语音互动控制方法及其装置,语音互动控制方法包括:A、调取开始提示音并播放,随机调取一条主分类问题并播放;B、采集用户的语音并识别回答类型,根据回答类型判断是跳转至其他同等级问题、还是进入下一级问题;C、判断需提出的问题是否为名称锁定问题:是则播放名称锁定问题,执行D;否则调取该问题对应的问题提示音并播放,返回B;D、判断所采集的语音的回答类型是否为肯定回答,是则播放结束提示音,否则执行E;E、随机调取该名称锁定问题同类的其他名称锁定问题并播放,返回D。能根据用户的回答播放对应的问题和互动的提示音,完成了复杂的语音交互应用,解决了现有儿童语音互动产品只能正向单互动的问题。
【专利说明】
一种语音互动控制方法及其装置
技术领域
[0001]本发明涉及电子技术,特别涉及一种语音互动控制方法及其装置。
【背景技术】
[0002]目前市场上的儿童语音互动产品全部采用“指令”互动方式。例如:用户发出一道语音指令“给我唱条歌吧”,装置通过对语音进行接收识别判断,最终根据程序选择对应的音频或功能控制模块进行相应的反馈(歌曲播放)O这类互动产品(包括初级的智能机器人)可以看作是正向单通道的互动方式。即输入信息4装置获取信息4给出指令相应的反馈。
[0003]互动类儿童产品都设置有预设指令库,用户使用时需要保证指令必须是预设指令库里已有的信息,否则产品不会做出任何反应。假如预设指令库的指令采集不够完善或用户输入的信息与预设指令库内的信息匹配有出入,则产品无法实现互动的效果。因此,市面上现有的互动类产品基本面临着互动灵敏度不高的问题,同时,这种正向单互动的方式存在单调性。
[0004]因此现有技术存在缺陷,有待改进。

【发明内容】

[0005]鉴于上述现有技术的不足之处,本发明的目的在于提供一种语音互动控制方法及其装置,以解决现有儿童语音互动产品只能正向单互动的问题。
[0006]为了达到上述目的,本发明采取了以下技术方案:
一种语音互动控制方法,其包括:
步骤A、调取开始提示音并播放,随机调取一条主分类问题并播放;
步骤B、采集用户的语音并识别回答类型,根据回答类型判断是跳转至其他同等级问题、还是进入下一级问题;
步骤C、判断需提出的问题是否为名称锁定问题:是则播放名称锁定问题,执行步骤D;否则调取该问题对应的问题提示音并播放,返回步骤B;
步骤D、判断所采集的语音的回答类型是否为肯定回答,是则播放结束提示音,否则执行步骤E;
步骤E、随机调取该名称锁定问题同类的其他名称锁定问题并播放,返回步骤D。
[0007]所述的语音互动控制方法中,所述回答类型包括:肯定回答、否定回答和不确定回答;
所述主分类问题有若干条,每一条主分类问题对应若干条细分类问题;细分类问题分为η级,η为正整数;每一条主分类问题对应若干条一级细分类问题,每一条一级细分类问题对应若干条二级细分类问题,以此类推,每一条η-1级细分类问题对应若干条η级细分类问题;每一条η级细分类问题对应若干条名称锁定问题;
主分类问题的等级最高,细分类问题次之,名称锁定问题的等级最低。
[0008]所述的语音互动控制方法中,所述步骤A具体包括: 步骤Al、开机时,调取第一开始提示音并播放;
步骤A2、采集用户的语音并识别回答为肯定回答时,播放第二开始提示音;
步骤A3、在第二开始提示音播放后等待预设时间,随机调取一条主分类问题并播放。
[0009]所述的语音互动控制方法中,所述步骤A2具体包括:
A21、每隔设定时间播放一次重复提示音,直到采集到用户的语音并识别回答为肯定回答时停止,播放第二开始提示音;
A22、当重复提示音连续播放预设次数,则播放关机提示音。
[0010]所述的语音互动控制方法中,在所述步骤B中,识别回答类型为肯定回答时,进入该分类问题的下一级问题;若识别否定回答或不确定回答,则选择该分类问题同等级的其他分类问题;不确定回答还记录该分类问题并标记为空白。
[0011 ]所述的语音互动控制方法中,所述步骤D具体包括:
步骤D1、采集识别用户的语音,判断回答类型是否为肯定回答:是则播放结束提示音,执行步骤D2;否则执行步骤E;
步骤D2、采集识别用户的语音,判断回答类型是否为肯定回答:是则返回步骤A;否则播放退出提示音,自动关机。
[0012]所述的语音互动控制方法中,在所述步骤B?步骤E中,若属于同一分支的所有同等级的分类问题都被标记为空白,或统计到10条以上的空白,则判断为逻辑矛盾或回答模糊,调取警告提示音并播放。
[0013]所述的语音互动控制方法中,在所述步骤B?步骤E中,若统计两条细分类问题下的所有名称锁定问题都否定回答时,调取重来提示音并播放。
[0014]一种实现所述的语音互动控制方法的语音互动控制装置,其包括主控模块、内存、咪头和喇叭;
所述主控模块从内存中调取开始提示音并通过喇叭播放,随机调取一条主分类问题并播放;咪头采集用户的语音并传输给主控模块识别回答类型,根据回答类型判断是跳转至其他同等级问题、还是进入下一级问题;
主控模块判断需提出的问题是否为名称锁定问题:是则从内存中调取名称锁定问题并通过喇叭播放;否则调取该问题对应的问题提示音并播放,继续采集用户的语音并识别回答类型,根据回答类型判断选择问题;
主控模块在播放名称锁定问题后,判断所采集的语音的回答类型是否为肯定回答,是则播放结束提示音;否则随机调取该名称锁定问题同类的其他名称锁定问题并播放,继续判断播放名称锁定问题后的回答类型。
[0015]相较于现有技术,本发明提供的一种语音互动控制方法及其装置,语音互动控制方法包括:步骤A、调取开始提示音并播放,随机调取一条主分类问题并播放;步骤B、采集用户的语音并识别回答类型,根据回答类型判断是跳转至其他同等级问题、还是进入下一级问题;步骤C、判断需提出的问题是否为名称锁定问题:是则播放名称锁定问题,执行步骤D;否则调取该问题对应的问题提示音并播放,返回步骤B;步骤D、判断所采集的语音的回答类型是否为肯定回答,是则播放结束提示音,否则执行步骤E;步骤E、随机调取该名称锁定问题同类的其他名称锁定问题并播放,返回步骤D。能根据用户的回答播放对应的问题和互动的提示音,完成了复杂的语音交互应用,解决了现有儿童语音互动产品只能正向单互动的问题。
【附图说明】
[0016]图1为本发明语音互动控制方法流程图装置的结构框图。
[0017]图2为本发明语音互动控制方法中各问题之间的关系示意图。
[0018]图3为本发明语音互动控制装置的结构框图。
【具体实施方式】
[0019]本发明提供一种语音互动控制方法及其装置,适用于儿童语音互动产品中。为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0020]请参阅图1,本发明提供的语音互动控制方法包括:
SlOO、调取开始提示音并播放,随机调取一条主分类问题并播放;
S200、采集用户的语音并识别回答类型,根据回答类型判断是跳转至其他同等级问题、还是进入下一级问题;
S300、判断需提出的问题是否为名称锁定问题:是则播放名称锁定问题,执行步骤S400;否则调取该问题对应的问题提示音并播放,返回步骤S200;
S400、判断所采集的语音的回答类型是否为肯定回答,是则播放结束提示音,否则执行步骤S500;
S500、随机调取该名称锁定问题同类的其他名称锁定问题并播放,返回步骤S400。
[0021]在步骤SlOO中,当用户通过按键开机时,调取第一开始提示音并播放。所述开始提示音预设录制,提示用户猜动物、食物、或其他物体(如生活日用品、家具家电等),本实施例以猜动物为例,则开始提示音可以为:“小朋友你好,我是你的魔力伙伴,我们一起做猜谜游戏吧。回答我的问题我可以猜出你心理所想的动物哦!如果你准备好了,就告诉我OK吧”。采集用户的语音并识别回答是否为肯定回答的“0K”,是则播放第二开始提示音,提示游戏正式开始,如“请在心理默默想好一条动物,当我开始提问时,你只需回答我yes、no或者不知道,也可以说不一定”。
[0022]在具体实施时,为了增加互动性,本实施例对第一开始提示音、第二开始提示音的内容不作限定,可设置多条随机调用,以避免用户觉得单调。第二开始提示音主要是让用户明白,只需回答“是或yes、不是或no、不知道、不一定”这四种回答,以方便后续语音识别。用户回答后采集其语音并识别回答类型,回答类型包括“是或yes”对应的肯定回答,“不是或no”对应的否定回答,“不知道、不一定”对应的不确定回答。
[0023]第一开始提示音播放后,本产品处于游戏预备状态,可每隔几秒播放重复提示音,如“我没听清楚,可以再说一遍吗?”,直到识别到“0K”语音确认游戏开始为止。当重复提示音连续提示4次以上,则判断用户离开,则自动结束本次游戏(即关机)。游戏结束(关机)时播放关机提示音,如“和你玩的很愉快,我们下次再玩吧”。重复提示音和关机提示音也可多做几条随机播放以避免单调。
[0024]在第二开始提示音播放后等待预设时间(2秒),随机播放一条主分类问题。虽然目前已有较科学的动物分类方法,但其分类方式比较单调且无趣。本语音互动控制方法主要用于儿童语音互动产品中,因此分类问题以儿童便于理解的方式。
[0025]所述主分类问题、细分类问题、名称锁定问题之间的关系如图2所示,其中a、b、c、d、e、f、g、h均为正整数,取值可以相等或不等,表示每条分支上设置的问题的条数可以相等或不想等。即主分类问题有若干条(主分类问题I?主分类问题a,至少为10条),为第一等级,以动物体型、生活环境、外貌特征(如是否有翅膀、鳞片、毛)等显著特点为主进行设置,其等级最高,可以为“它生活在陆地上吗?”、“它生活在海里吗?”、“它能飞吗?”、“它是两栖动物吗?”、“它有鳞片吗?”、“它有毛吗?”等。
[0026]细分类问题以进行区分为主,为动物的细节描述。细分类问题可再分为η级,η为正整数。每一条主分类问题对应(即往下分支为)若干条一级细分类问题,每一条一级细分类问题对应若干条二级细分类问题,以此类推,每一条η-1级细分类问题对应若干条η级细分类问题;每一条η级细分类问题对应若干条名称锁定问题。所述名称锁定问题即动物的名称。主分类问题等级最高,一级细分类问题次之,二级细分类问题再次之,名称锁定问题等级最低。
[0027]图2以两级为例,具体实施时不作限定。如主分类问题I为“它生活在陆地上吗?”,其对应的一级细分类问题可以为“它是两只脚吗?”、“它是四只脚吗?”、“它有脊椎吗?”等。若一级细分类问题I为“它是四只脚吗?”,则对应的二级细分类问题可以为“它是肉食动物吗?”、“它是食草动物吗?”、“它是家禽吗?”、“它是犬科吗?”等。若二级细分类问题I为“它是家畜吗?”,则对应的名称锁定问题为“它是马吗?”、“它是牛吗?”、“它是羊吗?”等。所有问题的设置及其前后关系是出厂前预先编辑设置的,具有一定的逻辑且倾向儿童易懂的语言。
[0028]另外,在具体提问时,可进行分段语音的随机组合,例如:“你想的这个动物”组合“它有翅膀吗”或直接提问“它有翅膀吗”。随机组合的出现可使产品的提问不会过于呆板。
[0029]在步骤S200中,只要得到肯定回答,就进入该分类问题的下一级问题。若是否定回答或不确定回答,则选择该分类问题同等级的其他分类问题。不确定回答还记录该分类问题并标记为空白。若属于同一分支的所有同等级的分类问题都标记为空白,或一共统计到10条以上的空白(来自不同等级问题的空白),则判断为逻辑矛盾或回答模糊,则调取警告提示音并播放,如“小朋友,要用心仔细回答喽,不然我的魔力会被你浪费的”。
[0030]当主分类问题得到肯定回答时,即可进入其对应的一级细分类问题。当主分类问题得到否定回答时,在跳转至其他同等级问题,即随机调取播放另一条主分类问题。当主分类问题得到不确定回答时,记录属性空白,此时可随机播放另一条主分类问题。同理,当一级细分类问题得到肯定回答时,即可进入其对应的二级细分类问题。当一级细分类问题得到否定回答或不确定回答时,在跳转至其他一级细分类问题,不确定回答时还标记该一级细分类问题为空白。
[0031 ]细分类问题是提问的重点,装置默认选择其中答案属性“YES”和“NO”的存在比例尽可能的接近5:5的问题进行提问,也即是说,优先挑选答案为相反属性的细分类问题进行提问。以保证尽可能的排除不符合条件的动物,让答案尽快锁定在一定的小范围内。
[0032]在步骤S300中,选定一条需提出的问题时,需判断其是否为最低等级的名称锁定问题,不是则表示仍需判断,直接调取其对应的问题提示音并播放,然后返回步骤S200继续获取用户的语音并判断。
[0033]若是名称锁定问题,则表示进入最后确定环节,调取该名称锁定问题并播放。接着需执行步骤S400,采集识别用户的语音,判断回答类型是否为肯定回答,是则表示猜对了,播放结束提示音,如“我的魔力很神奇吧,再来一局如何?”。此时继续采集用户的语音并识别回答类型,若是肯定回答,则返回步骤SlOO再来一次。若是否定回答,则等待并播放退出提示音,如“和你玩的很愉快,我们下次再玩吧”,若用户肯定回答,则自动关机;若用户否定回答,则播放结束提示音,再次判断是否继续玩游戏。若根据用户的语音连续4次重复播放结束提不首和退出提不首,则自动关机。
[0034]若用户回答该答案是错的,则执行步骤S500,随机调取该名称锁定问题同类的其他名称锁定问题并播放(即其他名称锁定问题与该名称锁定问题属于同一细分类问题),返回步骤S400继续判断答案是否正确。当该名称锁定问题对应的其他所有名称锁定问题都被否定时,装置调用返回提示音,如“你真厉害,我还需要问你几条有趣的问题”,2秒后播放该名称锁定问题对应的上一级的细分类问题,返回步骤S200继续采集语音判断。
[0035]若对两条细分类问题下的所有名称锁定问题都进行否定,则调取播放重来提示音,如“你是我见过最智慧的朋友,我耗尽了我的魔力,你赢了 !我们重来一次好不?”。否定回答(不同意)则播放退出提示音,肯定回答(同意)则播放第二开始提示音,重新开始。
[0036]在具体实施时,在互动问答游戏中,为提升趣味性,可适当穿插一些语音的互动。如连续播放3条或5条问题后,可播放表扬提示音,如“回答的真棒,我要再努力点才好”。当播放到名称锁定问题时,可插入自语提示音,如“我的魔力充沛,马上就能感应到了”。另外,播放名称锁定问题时,可在原始的名称锁定问题(“它是马吗?”)中增加互动语句,如“我的魔力爆发啦,我猜你想的动物是马,对吗?”。
[0037]当逻辑判断出现绝对矛盾的回答时,如两条答案属性是相反的,但用户均回答是,则调取并播放提醒提示音,如“别闹了,认真点好不好”。并继续提问答案属性相近的问题等待用户回答。上述各分类问题随机播放是为了避免每次都播放相同的问题使儿童感到无趣。
[0038]所述回答类型还包括要求回答,如在上述提问回答过程中,若用户没有听清楚问题,要求再听一次,则用户可回答“没听清楚”或“再说一次”,则语音识别为请求回答,本产品将重复播放当前的问题。
[0039]若在互动游戏中,由于环境杂音或其他原因导致本产品没能获取到用户清晰的回答、无法语音识别判断的情况下,则播放请求提示音,如“你的回答有点模糊,请再说一次好吗?”。
[0040]基于上述的语音互动控制方法,本发明还相应提供一种语音互动控制装置。请参阅图3,本发明提供的语音互动控制装置设置在儿童语音互动产品中,其包括主控模块10、内存20、咪头30和喇叭40。所述主控模块10检测到开机时从内存20中调取开始提示音并通过喇叭40播放,随机调取一条主分类问题并播放;咪头30采集用户的语音并传输给主控模块识别回答类型,根据回答类型判断是跳转至其他同等级问题、还是进入下一级问题。
[0041]主控模块判断需提出的问题是否为名称锁定问题:是则从内存中调取名称锁定问题并通过喇叭播放;否则调取该问题对应的问题提示音并播放,继续采集用户的语音并识别回答类型,根据回答类型判断选择问题。
[0042]主控模块在播放名称锁定问题后,判断所采集的语音的回答类型是否为肯定回答,是则播放结束提示音;否则随机调取该名称锁定问题同类的其他名称锁定问题并播放,继续判断播放名称锁定问题后的回答类型。
[0043]上述所有的问题和提示音均存储在内存20中,采用内存做数据库来进行信息本地化存储。咪头30负责所有的语音采集。主控模块10负载语音识别和逻辑判断,以及从内存20中调取相应的问题和提示音。喇叭40负责所有问题和提示音的播放。在具体实施时,所述主控模块10可采用SX170X系列的单片机及其外围电路组成,如型号为SX170X-B。
[0044]综上所述,本发明提供的一种语音互动控制方法及其装置,无需联网进行大数据运算、语意识别判断和噪音分析处理,无需通过其他模组的加载等复杂操作来实现语音互动的应用,无需联网增加装置运算的稳定性。全部事务逻辑在主控模块上完成,主控模块完成逻辑运算后直接调用内存中的数据即可。最大的优点是在任何终端产品上不用安装任何专门的软件客户端、实现了零安装、零维护。另外,语音互动控制装置还具有扩展可定制化,只要对内存中的数据进行更新即可实现不同物体的猜谜游戏。同时,该语音互动控制装置只需要用户进行简单的语音回答即可完成复杂的语音交互应用,每次互动内容不同,增加了互动应用的趣味性。
[0045]可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。
【主权项】
1.一种语音互动控制方法,其特征在于,包括: 步骤A、调取开始提示音并播放,随机调取一条主分类问题并播放; 步骤B、采集用户的语音并识别回答类型,根据回答类型判断是跳转至其他同等级问题、还是进入下一级问题; 步骤C、判断需提出的问题是否为名称锁定问题:是则播放名称锁定问题,执行步骤D;否则调取该问题对应的问题提示音并播放,返回步骤B; 步骤D、判断所采集的语音的回答类型是否为肯定回答,是则播放结束提示音,否则执行步骤E; 步骤E、随机调取该名称锁定问题同类的其他名称锁定问题并播放,返回步骤D。2.根据权利要求1所述的语音互动控制方法,其特征在于,所述回答类型包括:肯定回答、否定回答和不确定回答; 所述主分类问题有若干条,每一条主分类问题对应若干条细分类问题;细分类问题分为η级,η为正整数;每一条主分类问题对应若干条一级细分类问题,每一条一级细分类问题对应若干条二级细分类问题,以此类推,每一条η-1级细分类问题对应若干条η级细分类问题;每一条η级细分类问题对应若干条名称锁定问题; 主分类问题的等级最高,细分类问题次之,名称锁定问题的等级最低。3.根据权利要求2所述的语音互动控制方法,其特征在于,所述步骤A具体包括: 步骤Al、开机时,调取第一开始提示音并播放; 步骤Α2、采集用户的语音并识别回答为肯定回答时,播放第二开始提示音; 步骤A3、在第二开始提示音播放后等待预设时间,随机调取一条主分类问题并播放。4.根据权利要求2所述的语音互动控制方法,其特征在于,所述步骤Α2具体包括: Α21、每隔设定时间播放一次重复提示音,直到采集到用户的语音并识别回答为肯定回答时停止,播放第二开始提示音; Α22、当重复提示音连续播放预设次数,则播放关机提示音。5.根据权利要求2所述的语音互动控制方法,其特征在于,在所述步骤B中,识别回答类型为肯定回答时,进入该分类问题的下一级问题;若识别否定回答或不确定回答,则选择该分类问题同等级的其他分类问题;不确定回答还记录该分类问题并标记为空白。6.根据权利要求2所述的语音互动控制方法,其特征在于,所述步骤D具体包括: 步骤D1、采集识别用户的语音,判断回答类型是否为肯定回答:是则播放结束提示音,执行步骤D2;否则执行步骤E; 步骤D2、采集识别用户的语音,判断回答类型是否为肯定回答:是则返回步骤Α;否则播放退出提示音,自动关机。7.根据权利要求5所述的语音互动控制方法,其特征在于,在所述步骤B?步骤E中,若属于同一分支的所有同等级的分类问题都被标记为空白,或统计到10条以上的空白,则判断为逻辑矛盾或回答模糊,调取警告提示音并播放。8.根据权利要求5所述的语音互动控制方法,其特征在于,在所述步骤B?步骤E中,若统计两条细分类问题下的所有名称锁定问题都否定回答时,调取重来提示音并播放。9.一种实现权利要求1所述的语音互动控制方法的语音互动控制装置,其特征在于,包括主控模块、内存、咪头和喇叭; 所述主控模块从内存中调取开始提示音并通过喇叭播放,随机调取一条主分类问题并播放;咪头采集用户的语音并传输给主控模块识别回答类型,根据回答类型判断是跳转至其他同等级问题、还是进入下一级问题; 主控模块判断需提出的问题是否为名称锁定问题:是则从内存中调取名称锁定问题并通过喇叭播放;否则调取该问题对应的问题提示音并播放,继续采集用户的语音并识别回答类型,根据回答类型判断选择问题; 主控模块在播放名称锁定问题后,判断所采集的语音的回答类型是否为肯定回答,是则播放结束提示音;否则随机调取该名称锁定问题同类的其他名称锁定问题并播放,继续判断播放名称锁定问题后的回答类型。
【文档编号】G10L15/22GK106055605SQ201610353529
【公开日】2016年10月26日
【申请日】2016年5月25日
【发明人】张军军
【申请人】深圳市童伴互动文化产业发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1