基于语音识别模块的大屏幕控制系统和方法与流程

文档序号：15198549发布日期：2018-08-19 02:32阅读：370来源：国知局

本发明属于通信技术领域，具体涉及一种基于语音识别模块的大屏幕控制系统和方法。

背景技术：

随着信息时代的到来，计算机多媒体技术的迅猛发展，网络技术的普遍应用，大到指挥监控中心、网管中心的建立，小到临时会议、技术讲座的进行，都渴望获得大画面、多彩色、高亮度、高分辨率的显示效果，而传统的crt显示器很难满足人们这方面的要求。近些年来迅速发展起来的大屏幕投影机技术成为解决彩色大画面显示的有效途径，应用范围进一步拓展，市场也因需求的增长日渐活跃。到目前为止，投影机主要通过三种显示技术实现，即crt投影技术、lcd投影技术以及近些年发展起来的dlp投影技术。

中国专利cn104122979a公开了一种“语音控制大屏幕的方法及装置”，让用户可以使用自己手中的移动设备通过语音控制设备大屏幕，提高用户的使用体验；中国专利cn202512860u公开了一种“利用语音控制大屏幕显示信号源的切换的装置”，不需要用户手动地调节，使用户可以通过语言指令命令主显示窗口的显示画面进行切换；中国专利cn103955149a公开了一种“dsp语音识别用于激光大屏幕拼接控制系统”，用户可以通过语音密码进入该控制系统，然后可进行口述命令，控制大屏幕拼接的启动、调节和关闭等，而非法用户则被语音密码阻拦无法进行控制。

但是目前大部分的大屏幕，由于现有的系统的语音识别系统与控制者的距离需要限制在一定范围内，例如现有的大屏幕控制者一般需要与大屏幕处于同一个房间内，否则会影响语音的采集和识别，对于与大屏幕不处于同一个房间内甚至位于外地的远程控制者来说则无法通过语音来控制大屏幕，不适用于现如今的全球网络化的发展进程；而且在实际使用中由于不同情况下人说话的语速、语气、断句等都会产生变化，而且现有电子设备进行语音采集时会出现不同程度的失真，导致验证不准确甚至造成后续地误操作。

技术实现要素：

为了解决上述问题，本发明提供了一种能够远程操作、提高语音识别效果、减少误操作产生的控制大屏幕的装置和方法，具体方案如下：

一种基于语音识别模块的大屏幕控制系统，其特征在于：包括大屏幕、与大屏幕电连接的控制部、与控制部连接的系统服务器以及与系统服务器数据连接的语音收集端，所述控制部用于接收系统服务器发出的指令然后根据指令调节所述大屏幕的播放信息，所述大屏幕的播放信息为大屏幕开关、播放速度、播放内容、播放模式和播放路径；

所述语音收集端包括：近程语音收集端，用于收集所述大屏幕附近的语音信息，标记为近程语音信息，并发送给所述系统服务器；远程语音收集端，用于收集远程的语音信息，标记为远程语音信息，并发送给所述系统服务器；

所述系统服务器包括：指令储存模块，用于储存各常用的指令信息；处理模块，用于将收集到的近程语音信息或远程语音信息转换成系统可识别的字符串；匹配模块，用于将字符串与所述指令信息比对，找出与字符串对应的指令；指令发送模块，用于向所述控制部发送对应的指令；

进一步地，所述语音收集端还包括登录模块，用于向系统服务器发送登录信息；所述系统服务器还包括用户信息储存模块、收集模块和验证模块；

用户信息储存模块，用于储存用户的身份信息，用户的身份信息包括与口令对应的字符串、密码、图像、指纹、虹膜、面部信息中的一种或多种；

收集模块，用于收集所述语音收集端所发送的登录信息，并提取用户的身份信息；

验证模块，用于将收集到的身份信息与所述用户信息储存模块中的信息进行比对，当对比结果为匹配时，向语音收集端反馈登录成功信息。

进一步地，所述系统服务器还包括手动验证模块，所述验证模块还用于当对比结果为不匹配时，向手动验证模块发送手动验证指令；

所述手动验证模块，用于接收手动验证指令，获取相应的用户身份信息，并提供手动验证页面。

进一步地，所述系统服务器还包括：

第一计算模块，用于计算接收到的语音信息每个音节的平均间隔时间；

插入模块，用于在含有指令信息的第一个音节和最后一个音节前各插入一个标记；

第二计算模块，用于两个标记之间每个音节的平均间隔时间；

差值模块，用于将语音信息每个音节的平均间隔时间与两个标记之间每个音节的平均间隔时间作差；

判断模块，判断差值模块的结果大于零还是小于零，结果大于零时向所述处理模块发送转换指令。

进一步地，所述系统服务器还包括优先级判断模块，所述优先级判断模块包括第一比对子模块和第二比对子模块，

第一比对子模块，用于当所述系统服务器在预设时间段内既收到近程语音信息又收到远程语音信息时，将转换后的字符串进行对比，当对比结果相同时，向所述匹配模块发送对字符串进行匹配的指令；当对比结果不同时，向所述第二比对子模块发送比对指令；

第二比对子模块，用于比对近程的指令信息和远程的指令信息发送的时间，将发送时间优先的指令信息所对应的字符串标记为待匹配字符串；然后向所述匹配模块发送与待匹配字符串进行匹配的指令。

一种基于语音识别模块的控制大屏幕方法，其特征在于，包括以下步骤：

收集用户的登录信息，提取用户的身份信息，然后将收集到的身份信息与用户信息储存模块内的信息进行比对，若匹配成功，则进行下一步；若匹配失败，则终止；

接收用户发出的近程语音信息a或者远程语音信息b，然后将近程语音信息a或者远程语音信息b转换成系统可识别的字符串；

将系统可识别的字符串与系统中储存的相关指令进行匹配，找到匹配的指令信息；

利用大屏幕控制系统执行匹配后的指令信息。

进一步地，所述方法还包括以下步骤：

当收集到的身份信息与用户信息储存模块内的信息匹配失败，向管理员发送手动验证请求，若手动验证通过，则进行下一步；若手动验证未通过，则终止。

进一步地，将可读的字符串与储存模块内储存的相关指令进行匹配前包括以下步骤：

将语音信息里含有指令信息的音节的前面和后面各插入一个标记；

然后分别计算语音信息里每个音节的平均间隔和标记之间音节的平均间隔，语音信息包含n个音节，每个音节之间的间隔为t，字符串的平均间隔时间两个标记之间包含n'个音节，有效指令的音节之间的间隔为t'，标记之间音节的平均间隔时间若则提取该有效指令，若则不提取。

进一步地，所述方法还包括以下步骤：

当在预设时间t内既接收到所述近程语音信息a又接收到所述远程语音信息b，若a和b为同一指令，则任选一个执行一次即可；若a和b为不同指令，则对比两个指令的发出时间τa和τb，执行发送时间在前的那个指令，并在一段时间t'内不再接收另一种语音信息。

本发明提出的基于语音识别模块的控制大屏幕的装置，包括通过网络与服务器连接的操作终端，拥有操作权限的用户不仅可以在近程内直接用语音向大屏幕下达各种操作指令，还可以通过移动终端通过网络将操作指令发送给服务器，响应全球网络化的发展步伐；本发明提出的一种基于语音识别模块的控制大屏幕方法，匹配步骤包括将有效指令的字节平均间隔与整句话的字节平均间隔进行比对判断其是不是真正的指令，从而减少误操作产生的几率；此外学习系统可以将通过验证的新用户的指令信息进行储存，当该新用户多次下达同样指令的时候可以迅速匹配然后直接进行，减少验证步骤，提高工作效率。

附图说明

图1.实施例1的连接示意图；

图2.实施例1工作过程的流程图；

图3.实施例2系统服务器的连接示意图；

图4.实施例2工作过程的流程图；

图5.实施例3系统服务器的连接示意图；

图6.实施例3判断语音信息音节时间间隔的流程图；

图7.实施例4系统服务器的连接示意图；

图8.实施例4优先级判断的流程图。

附图序号及名称：1、大屏幕，2、控制部，3、系统服务器，301、指令储存模块，302、处理模块，303、匹配模块，304、指令发送模块，305、用户信息储存模块，306、收集模块，307、验证模块，308、手动模块，309、第一计算模块，310、插入模块，311、第二计算模块，312、差值模块，313、判断模块，4、语音收集端，401、近程语音收集端，402、远程语音收集端，403、登录模块，5、优先级判断模块，501、第一比对子模块，502、第二比对子模块。

具体实施方式

下面结合附图和实施例对本发明作进一步的描述，下列实施例仅用于解释本发明的发明内容，不用于限定本发明的保护范围。

实施例1

如图1所示，一种基于语音识别模块的大屏幕控制系统，包括大屏幕1、与大屏幕1电连接的控制部2、与控制部2连接的系统服务器3以及与系统服务器3数据连接的语音收集端4，控制部2用于接收系统服务器3发出的指令然后根据指令调节大屏幕1的播放信息，大屏幕1的播放信息为大屏幕开关、播放速度、播放内容、播放模式和播放路径；

语音收集端4包括：近程语音收集端401，用于收集大屏幕1附近的语音信息，标记为近程语音信息，并发送给系统服务器3；远程语音收集端402，用于收集远程的语音信息，标记为远程语音信息，并发送给系统服务器3；

系统服务器3包括：指令储存模块301，用于储存各常用的指令信息；处理模块302，用于将收集到的近程语音信息或远程语音信息转换成系统可识别的字符串；匹配模块303，用于将字符串与指令信息比对，找出与字符串对应的指令；指令发送模块304，用于向控制部2发送对应的指令。

语音收集端4还包括登录模块403，用于向系统服务器3发送登录信息；系统服务器3还包括用户信息储存模块305、收集模块306和验证模块307；

用户信息储存模块305，用于储存用户的身份信息，用户的身份信息包括与口令对应的字符串、密码、图像、指纹、虹膜、面部信息中的一种或多种；

收集模块306，用于收集登录模块403所发送的登录信息，并提取用户的身份信息；

验证模块307，用于将收集到的身份信息与用户信息储存模块305中的信息进行比对，当对比结果为匹配时，向语音收集端4反馈登录成功信息。

如图2，本实施例的工作过程如下：

step1.收集用户的登录信息，提取用户的身份信息；

step2.将收集到的身份信息与用户信息储存模块内的信息进行比对，若匹配成功，则进行下一步；若匹配失败，则终止；

step3.接收用户发出的近程语音信息a或者远程语音信息b，

step4.然后将用户的近程语音信息a或者远程语音信息b转换成系统可识别的字符串；

step5.将系统可识别的字符串与系统中储存的相关指令进行匹配，找到匹配的指令信息；

step6.利用大屏幕控制系统执行匹配后的指令信息。

本实施例用户不仅可以在大屏幕附近通过语音控制大屏幕，还可以通过远程语音收集端，通过网络在远离大屏幕的地方对大屏幕的播放进行控制，尤其适用于远程会议或远程教育等领域。

实施例2

如图3所示，实施例2与实施例1的区别在于：系统服务器3还包括：

系统服务器3还包括手动验证模块308，验证模块307还用于当对比结果为不匹配时，向手动验证模块308发送手动验证指令；

手动验证模块308，用于接收手动验证指令，获取相应的用户身份信息，并提供手动验证页面。

参照图4，本实施例的工作过程还包括：

本实施例，增加了手动验证步骤，管理者可以临时对用户进行手动授权，保证系统工作的灵活性。

实施例3

如图5，本实施例的系统服务器3还包括：

第一计算模块309，用于计算接收到的语音信息每个音节的平均间隔时间；

插入模块310，用于在含有指令信息的第一个音节和最后一个音节前各插入一个标记；

第二计算模块311，用于两个标记之间每个音节的平均间隔时间；

差值模块312，用于将语音信息每个音节的平均间隔时间与两个标记之间每个音节的平均间隔时间作差；

判断模块313，判断差值模块的结果大于零还是小于零，结果大于零时向处理模块发送转换指令。

如图6所示，将可读的字符串与储存模块内储存的相关指令进行匹配前包括以下步骤：

将语音信息里含有指令信息的音节的前面和后面各插入一个标记；

本实施例增加了对语音信息中音节的时间间隔判断的过程，只有当含有指令信息的音节间隔小于等于整个语音信息中的音节间隔，才会将其转换为系统可识别的字符串；当含有指令信息的音节间隔大于整个语音信息中心的音节间隔，则不提取这段语音信息中心的指令信息，提高语音识别效果、减少误操作产生。

实施例4

对照图7，本实施例的系统服务器3还包括优先级判断模块5，所述优先级判断模块5包括第一比对子模块501和第二比对子模块502，

第一比对子模块501，用于当所述系统服务器3在预设时间段内既收到近程语音信息又收到远程语音信息时，将转换后的字符串进行对比，当对比结果相同时，向所述匹配模块303发送对字符串进行匹配的指令；当对比结果不同时，向所述第二比对子模块502发送比对指令；

第二比对子模块502，用于比对近程的指令信息和远程的指令信息发送的时间，将发送时间优先的指令信息所对应的字符串标记为待匹配字符串；然后向所述匹配模块303发送与待匹配字符串进行匹配的指令。

如图8，当在预设时间t内既接收到近程语音信息a又接收到远程语音信息b，若a和b为同一指令，则任选一个执行一次即可；若a和b为不同指令，则对比两个指令的发出时间τa和τb，执行发送时间在前的那个指令，并在一段时间t'内不再接收另一种语音信息。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张灿辉
技术所有人：广州市鼎科信息科技有限公司
我是此专利的发明人

上一篇：天然动植物润肤霜的制作方法
上一篇：一种在超临界CO2中接枝抗氧剂分子的多元醇的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。