显示器语音辨识的启动方法

文档序号：6509994阅读：255来源：国知局

显示器语音辨识的启动方法
【专利摘要】一种显示器语音辨识的启动方法，显示器包括摄像头、扬声器及麦克风，显示器语音辨识的启动方法包括：当开启语音辨识功能时，开启摄像头采集影像，并进行影像辨识；当辨识到特定的手势时，控制扬声器降低声音音量或静音后，开启麦克风收录语音，并进行语音辨识；当辨识到语音指令时，根据辨识到的语音指令进行相应的控制动作；当辨识到离开语音辨识的语音指令时，或者当一段预定时间内没有辨识到语音指令时，结束语音辨识，并控制扬声器恢复声音音量。本发明可减少显示器本身播放声音的干扰，改善指令输入时间长和使用复杂度高的缺点，且设计符合使用者的使用习惯。
【专利说明】显示器语音辨识的启动方法

【技术领域】
[0001]本发明有关于一种语音辨识的启动方法，且特别是有关于一种显示器语音辨识的启动方法。

【背景技术】
[0002]对于目前的显示器，如计算机屏幕(monitor)或电视而言，语音辨识功能已经越来越普及。而常见的显示器语音辨识的启动方法有三种，分别是“Free Talk (直接输入语音指令)”、“Voice Trigger to Talk (先语音启动输入再输入语音指令)”和“Push to Talk(先按键启动输入再输入语音指令)”。在“Free Talk”方法中，显示器随时进行收录语音和语音辨识。在“Voice Trigger to Talk”方法中，显示器随时进行收录语音并采用两阶段语音辨识，第一阶段只辨识几个预设的语音指令，当辨识到有预设的语音指令出现时，先降低显示器声音音量或静音，再进入第二阶段等候并辨识完整的语音指令。在“Push to Talk”方法中，显示器在辨识到有遥控器特定按键被按压后，先降低显示器声音音量或静音，再进行收录语音和语音辨识。
[0003]在这三种显示器语音辨识的启动方法中，“Free Talk”是使用者最容易接受的方法，但因显示器本身正在播放的影音内容所发出的声音干扰，往往会造成辨识失败而误动作或无动作。“Voice Trigger to Talk”采用两阶段语音辨识,可以减少“Free Talk”方法中显示器本身播放声音的干扰，但因为等于要辨识两次语音指令，使得整个指令输入时间长且使用复杂度高。“Push to Talk”既可以减少“Free Talk”方法中显示器本身播放声音的干扰，也改善了 “Voice Trigger to Talk”方法中指令输入时间长和使用复杂度高的缺点，但这样的设计违反使用者的使用习惯，因为当使用者手持遥控器时，直接使用遥控器来输入指令，又快又直觉，此时使用语音辨识来输入语音指令，相较之下反而反应慢且有时会辨识错误。

【发明内容】

[0004]本发明的目的在提出一种显示器语音辨识的启动方法，可减少显示器本身播放声音的干扰，改善指令输入时间长和使用复杂度高的缺点，且设计符合使用者的使用习惯。
[0005]为达到上述目的，本发明提出一种显示器语音辨识的启动方法，该显示器包括一摄像头、一扬声器及一麦克风，该显示器语音辨识的启动方法包括:
当开启语音辨识功能时，开启该摄像头采集影像，并进行影像辨识；
当辨识到特定的手势时，控制该扬声器降低声音音量或静音后，开启该麦克风收录语音，并进行语音辨识；
当辨识到语音指令时，根据辨识到的语音指令进行相应的控制动作；及当辨识到离开语音辨识的语音指令时，或者当一段预定时间内没有辨识到语音指令时,结束语音辨识,并控制该扬声器恢复声音音量。
[0006]在本发明一示意性实施方案中，该显示器语音辨识的启动方法还包括:当没有辨识到特定的手势时，控制该摄像头继续采集影像，并进行影像辨识。
[0007]在本发明一示意性实施方案中，该显示器语音辨识的启动方法还包括:当还没有结束语音辨识时，控制该麦克风继续收录语音，并进行语音辨识。
[0008]在本发明一示意性实施方案中，该显示器语音辨识的启动方法还包括:当结束语音辨识时，还控制该麦克风停止收录语音。
[0009]在本发明一示意性实施方案中，特定的手势包括挥手或握拳头。
[0010]在本发明一示意性实施方案中，该显示器包括计算机屏幕或电视。
[0011]本发明因采用在显示器辨识到特定的手势时，降低显示器声音音量或静音后，再进行收录语音和语音辨识，可减少显示器本身播放声音的干扰以提高辨识正确率，改善指令输入时间长和使用复杂度高的缺点，且利用手势辨识来启动语音辨识的设计更符合使用者的使用习惯。
[0012]为让本发明上述和其它目的、特征和优点能更明显易懂，下文特举【具体实施方式】，并配合附图，作详细说明如下。

【专利附图】

【附图说明】
[0013]图1为显示器语音辨识的启动方法的一种示意性实施方式的流程图。
[0014]标号说明
S1:摄像头采集影像
52:是否有特定的手势
53:控制扬声器降低声音音量或静音
54:麦克风收录语音，并进行语音辨识
55:是否结束语音辨识
56:控制扬声器恢复声音音量
57:根据语音指令进行相应的控制动作。

【具体实施方式】
[0015]请参见图1，其为显示器语音辨识的启动方法的一种示意性实施方式的流程图。显示器可以是计算机屏幕、电视或其它功能类型的显示器，但其必须内建或外接有摄像头、扬声器及麦克风。在步骤Si，当显示器开启语音辨识功能时，显示器开启摄像头采集影像，并进行影像辨识。在步骤S2，显示器判断是否辨识到特定的手势，特定的手势可以设定是挥手、握拳头或其它类型的手势。
[0016]当显示器在步骤S2判断没有辨识到特定的手势时，显示器返回步骤SI控制摄像头继续采集影像，并进行影像辨识。当显示器在步骤S2判断辨识到特定的手势时，执行步骤S3，显示器先储存本身正在播放的影音内容使扬声器发出的声音的音量值，再控制扬声器降低声音音量或静音；接着，执行步骤S4，显示器开启麦克风收录语音，并进行语音辨识。
[0017]当显示器在步骤S4没有辨识到语音指令时，执行步骤S5，显示器判断是否一段预定时间内没有辨识到语音指令。当显示器在步骤S5判断没有辨识到语音指令的时长还没有达到该预定时间时，表示还没有结束语音辨识，故返回步骤S4，显示器控制麦克风继续收录语音，并进行语音辨识。当显示器在步骤S5判断已一段预定时间内没有辨识到语音指令时，表示要结束语音辨识，故接着执行步骤S6，显示器根据在步骤S3所储存的音量值控制扬声器恢复声音音量，然后返回步骤SI继续本流程。
[0018]当显示器在步骤S4辨识到语音指令时，执行步骤S7，显示器根据辨识到的语音指令进行相应的控制动作；接着，执行步骤S5，显示器判断是否结束语音辨识。显示器辨识到的语音指令例如可以是调整亮度、调整音量、切换频道、离开语音辨识或其它类型的语音指令。在步骤S7，当显示器辨识到的语音指令是离开语音辨识的语音指令时，显示器在接着执行的步骤S5中会因判断有离开语音辨识的语音指令而结束语音辨识，并执行步骤S6。在步骤S7，当显示器辨识到的语音指令是除了离开语音辨识以外的语音指令时，显示器在接着执行的步骤S5中会因判断有语音指令输入而将用于计时该预定时间的定时器重置以重新计时，并返回步骤S4继续进行收录语音和语音辨识。
[0019]换句话说，在步骤S5，当显示器判断辨识到离开语音辨识的语音指令时，或者当一段预定时间内没有辨识到语音指令时，显示器结束语音辨识，并执行步骤S6。在步骤S5，当显示器判断有除了离开语音辨识以外的语音指令时，显示器返回步骤S4继续进行收录语音和语音辨识。
[0020]综上所述，本发明因采用在显示器辨识到特定的手势时，降低显示器声音音量或静音后，再进行收录语音和语音辨识，可减少显示器本身播放声音的干扰以提高辨识正确率，改善指令输入时间长和使用复杂度高的缺点，且利用手势辨识来启动语音辨识的设计更符合使用者的使用习惯。
[0021]虽然本发明已以【具体实施方式】揭露如上，然其并非用以限定本发明，任何熟习此技艺者，在不脱离本发明的精神和范围内，当可作些许更动与润饰，因此本发明的保护范围当视权利要求书所界定者为准。
【权利要求】
1.一种显不器语音辨识的启动方法，该显不器包括一摄像头、一扬声器及一麦克风，该显示器语音辨识的启动方法包括: 当开启语音辨识功能时，开启该摄像头采集影像，并进行影像辨识；当辨识到特定的手势时，控制该扬声器降低声音音量或静音后，开启该麦克风收录语音，并进行语音辨识；当辨识到语音指令时，根据辨识到的语音指令进行相应的控制动作；及当辨识到离开语音辨识的语音指令时，或者当一段预定时间内没有辨识到语音指令时,结束语音辨识,并控制该扬声器恢复声音音量。
2.如权利要求1所述的显示器语音辨识的启动方法，其中，该显示器语音辨识的启动方法还包括: 当没有辨识到特定的手势时，控制该摄像头继续采集影像，并进行影像辨识。
3.如权利要求1所述的显示器语音辨识的启动方法，其中，该显示器语音辨识的启动方法还包括: 当还没有结束语音辨识时，控制该麦克风继续收录语音，并进行语音辨识。
4.如权利要求1所述的显示器语音辨识的启动方法，其中，该显示器语音辨识的启动方法还包括: 当结束语音辨识时，还控制该麦克风停止收录语音。
5.如权利要求1所述的显示器语音辨识的启动方法，其中，特定的手势包括挥手或握拳头。
6.如权利要求1所述的显示器语音辨识的启动方法，其中，该显示器包括计算机屏幕或电视。
【文档编号】G06F9/445GK104423992SQ201310394242
【公开日】2015年3月18日申请日期:2013年9月3日优先权日:2013年9月3日
【发明者】徐鸿旺, 萧士杰, 徐宥宗申请人:冠捷投资有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐鸿旺;萧士杰;徐宥宗;
技术所有人：冠捷投资有限公司;
我是此专利的发明人

上一篇：一种实现网站物品拍卖信息同步到论坛的方法
上一篇：带有便签夹的usb集线器的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。