监控设备的控制方法和装置的制作方法

文档序号：7925339阅读：91来源：国知局

专利名称：监控设备的控制方法和装置的制作方法
技术领域：
本发明涉及通信领域，尤其涉及一种监控设备的控制方法和装置。
背景技术：
随着网绍技术的发展以及用户安全防范意识的^是高，利用#见频监控进行安全防范已经得到了较为普遍的应用。在视频监控中，通常使用云台来控制摄像头的监控角度，云台是两个交流电机组成的摄像头安装平台，操作人员通过对云台进行操作，使云台做水平或垂直的运动，带动摄像头实现监控角度的变化，进行视频监控。
目前，人们对云台进行控制的实现方法是监控装置客户端通过使用鼠标或键盘，向监控设备发送控制命令，对监控设备进行控制。这种监控设备控制方法操作复杂，只有专业人员才能对监控设备进4亍才喿作，而且对于操作人员来说，该方法不够形象、直7见。

发明内容
考虑到相关技术中存在的监控设备控制方法4喿作复杂的问题而提出本发明，为此，本发明的主要目的在于提供一种监控设备的控制方法及装置，以解决上述问题。
根据本发明的一个方面，提供一种监控设备的控制方法。
根据本发明的监控设备的控制方法包括对4妄收的语音控制指令对应的数字语音信号进行特征提取，获取语音控制指令的语音识别参数序列；在预先设置的一个或多个语音识别参凄t序列中查找与获取的语音识别参数序列匹配最佳的语音识别参凄t序列；确定查找的语音识别参数序列所对应的操作指令，并利用才喿作指令对监控设备进行控制。
其中，在接收到语音控制指令之前，该方法还包括预先接收一个或多个语音控制指令；对于每个语音控制指令，将其对应的数字语音信号进行特征提取，获取并保存每个语音控制指令的语音识别参数序列；配置语音识别参数序列与操作指令之间的对应关系。
进一步地，上述方法还包4舌^t于预先^妻收的每个语音控制指令，保存其对应的数字语音信号。
其中，上述对于预先接收的每个语音控制指令，保存其对应的数字语音信号的操作具体为对于预先接收的每个语音控制信令，压缩其对应的数字语音信号，并保存压缩后的数字语音信号。
优选地，对于每个操作指令，预先设置的语音控制指令的数量可以为一个或多个。
其中，上述利用操作指令对设备进行控制的操作具体为向目标编码器发送操作指令，目标编码器根据操作指令对监控设备进行控制。
其中，上述利用操作指令对设备进行控制的操作具体为向中转服务器发送操作指令，中转服务器将操作指令转发给目标编码器，目标编码器根据操作指令对监控设备进行控制。
优选地，可以利用以下方式之一提取语音控制指令对应的数字
语音信号特征参数共振峰提取法、端点4企测纟是取法、线性预测到普系数提取法、Mel倒语系数提取法、线性频率4是耳又法。
优选地，查找与获取的语音识别参凄t序列匹配最佳的语音识别参数序列的方式包括以下至少之一动态时间归整算法、隐含马可夫模型。
根据本发明的另一个发面，提供一种监控设备的控制装置。
根据本发明的监控设备的控制装置包括获取J模块，用于对接收的语音控制指令对应的数字语音信号进行特征提取，获取语音控制指令的语音识别参数序列；匹S己模块，用于在预先设置的一个或多个语音识别参凄Uf列中查找与获取的语音识别参数序列匹配最佳的语音识别参数序列；控制模块，用于确定查找的语音识别参数序列所对应的操作指令，并利用操作指令对监控^殳备进行控制。
进一步地，该装置还包括接收模块，用于预先接收一个或多个语音控制指令；保存模块，用于对每个语音控制指令对应的数字语音信号进行特征提取，获取并保存每个语音控制指令的语音识别参凄t序列；配置才莫块，用于配置语音识别参^t序列与操作指令之间的3寸应关系。
其中，保存模块还用于保存预先接收的数字语音信号；或者，保存压缩后的每个语音控制指令对应的数字语音信号。
通过本发明的上述至少一个技术方案，利用语音指令对监控设备进行控制，操作人员可以通过直接输入语音控制命令的方式对监控设备进行控制，对于操作人员来说，该方法才乘作简单，且更加形象、直乂见。

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的
限制。在附图中
图1是根据本发明方法实施例的监控设备的控制方法的流程
图2是根据本发明方法实施例的监控设备的控制方法的详细处理流禾呈图3是根据本发明实施例的监控设备控制应用的环境部署图4是根据本发明装置实施例的监控设备的控制装置的结构框架图5是根据本发明装置实施例的监控设备的控制装置的具体结构框架图。
具体实施例方式
功能相无述
如上所述，目前，人们在对监控设备进行控制时，操作较为复杂的问题，本发明针对该问题，提出一种监控设备的控制方案，该方案利用语音控制指令对监控设备进行控制，该方法操作简单，与现有技术相比，更为形象和直观，而且随着科技的快速发展，语音识别技术逐步成为信息技术中人机接口的关键技术。
下面将结合附图详细描述本发明。方法实施例
根据本发明实施例，提供了一种监控设备的控制方法。
在进行本发明实施例时，需要预先配置语音识别参数序列与操作指令之间的对应关系，具体地，可以预先^妄收一个或多个语音控
制指令，对于每个语音控制指令，将模拟语音信号转换为数字语音信号后，对数字语音信号进行特征^是取，获取每个"i吾音控制指令的语音识别参数序列，其中，对数字语音信号进行特征提取的方式有多种，例如，可以采用共振峰提取法、端点检测提取法、线性预测
到普系数提取法、Mel倒谱系数(MFCC )提取法、线性频率(LSF ) 提取法、PLCC提取法、EPOCH提取法等。
获得语音识别参数序列后，可以将获得的语音识别参数序列以文件的形式保存在计算4几的硬盘或内存中，另外，也可以将每个语音控制指令对应的数字语音信号保存在计算机的硬盘或内存中，而且，为了节省硬盘或内存的空间，可以将上述数字语音信号进行压缩，并将压缩后的数字语音信号进行保存。
最后，配置语音识别参数序列与才喿作指令之间的对应关系，而且，为了4是高语音控制指令的识别率，针对每个才喿作指令，可以预先设置一个或多个语音控制指令，即对于每个操作指令，可以输入多个语音控制指令，分别获得该多个语音控制指令对应的语音识别参数序列，并分别建立该操作指令与语音识别参数序列之间的对应关系，即一个操作指令可以对应多个语音识别参凄t序列。
图1是根据本发明实施例的监控设备的控制方法的流程图，如图1所示，该方法包4舌以下步骤
步骤S102，对接收的语音控制指令对应的数字语音信号进行特征提取，获:f又语音控制指令的语音识别参it序列；
步骤SI04，在预先i殳置的一个或多个语音识别参凄史序列中查找与获取的语音识别参数序列匹配最佳的语音识别参凄t序列，例如，可以利用动态时间归整算法、隐含马可夫4莫型进4亍匹配。
步骤S106,确定查找的语音识别参凄t序列所只寸应的纟喿作指令，并利用操作指令对监控设备进行控制，具体地，可以通过向目标编码器发送操作指令，目标编码器根据操作指令对监控设备进行控制。在客户端与监控"i殳备不在同一个网症各中时，可以通过中转服务器向目标编码器发送操作指令，具体地，客户端向中转月艮务器发送操作指令，中转服务器将操作指令转发给目标编码器，目标编码器根据该操作指令对监控设备进行控制。
通过本发明实施例提供的技术方案，利用语音指令对监控设备进行控制，操作人员可以通过直接输入语音控制命令的方式对监控设备进行控制，对于操作人员来说，该方法操作简单，且更加形象、直观。
图2是根据本发明方法实施例的监控设备的控制方法的详细处理流禾呈图，如图2所示，该方法包4舌以下步-骤
步骤S201,针对不同的监控设备，需要不同的操作指令，根据不同的操作指令预先设置相应的语音控制指令，例如分别设置云台向左旋转、向右旋转、向上旋转、向下旋转的语音控制指令。
步骤S202，对于每个操作指令的语音控制指令，对语音信号进行采样，具体地，语音信号的采样频率可以为8KHZ,该8KHZ适合于简单语句的识别，对于复杂的语句，可以选择更高的采样频率，才羊本区间为1OMS ，才羊本区间包含80个采冲羊点，一,殳i吾音包含多个
样本，每隔10MS计算一次短时能量和，当采样-浮到的短时能量和大于一定的阚值时则认为语音采样已经开始，当短时能量和小于平均能量的1/20时认为语音采样已经结束，获得语音采样信号，并利用月永沖编石马调制(Pulse-code Modulation,简称为PCM)才各式^f呆存每个操作指令的语音采样信号(即语音PCM编码)。
步骤S203，对于步骤S202中获得的每个语音采样信号，提取出其对应的特征参H确定语音识别参lt序列，可以共振峰提耳又法、端点检测提取法、线性预测到普系数提取法、MFCC提取法、LSF 提取法、PLCC提取法、EPOCH提取法进行特征参ft的提取，本发明实施例线性预测编码(LPC)算法为例进4亍说明。
具体地，对于每个语音采样信号，计算出语音采样信号所对应的12阶预测倒谱系数(LPCC),并将获得的一系列特征参数构造成特4正矢量序列(形式如A= (al, a2，…，ai})，该特4i矢量序列就是语音识别参数序列，即语音参数模版。
步骤S204、将得到的语音识别参凄t序列和步驶《S202中采样得到的语音PCM编码以文件的形式保存在客户端的计算机硬盘或内存中，其中，文件名称应与控制指令相对应，例才喿作指令为监控设备向右转动，则该文件名称可以为Template_Right。另外，可以保存的文件一次性读入硬盘或内存中，而不必每次识别语音命令时反复读入，以节省识别过程的时间。
通过上述步骤S201至步骤S204，实现了对监控i殳备的操作指令对应的语音识别参数序列的设置，下面对利用语音操作指令控制监控设备进行说明。
步骤S205，输入语音控制命令，并将该语音控制命令进行采样，该实现方法与步骤S202相同，这里不再赘述。步骤S206,获得步骤S205中语音控制命令对应的语音识别参数序歹'JS- (sl， s2,…，sk)，该实现方法与步骤S203相同，这里不再赘述。
步骤S207，将步骤S205中获得的语音识别参凄t序列S与预先设置的多个语音识别参数序列进行匹配，选择最佳匹配的语音识别参数，并根据该最佳匹配的语音识別参数对应的才喿作指令对监控设备进行控制。例如，本地预先设置了四个语音识别参凄t序列A = { al ， a2，…，ai}、 B= (bl， b2，…，bj }、 C- (cl， c2，…，cm}、 D
={dl, d2，…，dn}，分别对应的才喿作指令为向左(Template—Left )、向右 (Template—Right )、向上 (Template—Up )、向下
(Template_Down),使用DTW (动态时间归整)算法，将输入的语音识别参数序列S与模板库中保存的参考模板A、 B、 C、 D依次进行匹配，其中匹配度最高的参考模版即为识别结果，根据识别结果确定其所代表的控制指令，如语音识别参数序列S与参考模板A 最为匹配，则确定对监控设备执4于的4乘作指令为A所对应的向左
(Template—Left )。
步艰A S208，客户端与解码器建立TCP短连4妄，并向远禾呈的编码器发送步骤S206中确定的监控设备控制请求(即，上文所述的操作指令)，例如可以以XML格式发送监控设备控制请求，该监控设备控制请求消息中可以包括消息目的监控设备的ID、控制的方式、控制的方向和控制步长量等，并获取编码器的响应消息，完成对监控设备的控制操作。其中，图3示出了实施该方法的具体实施环境，如图3所述，客户端可以通过网络向目标编码器发送监控i殳备控制消息，编码器提供了实现流媒体数据的设备以响应监控设备控制请求，编码器与监控设备和摄像头直接相连，在收到客户端的监控设备控制请求后，通过485 口向监控设备发送响应的控制指令，完成对监控设备的控制操作。
需要说明的是，在本发明实施例中，向远程的编码器发送监控
设备控制请求时，使用的是TCP短链的连接方式，但并不限于此，客户端可以根据与编码器的协商，采用TCP长链的连4妾方式或UPD 等其它连4妄方式，而且监控设备控制请求也可以采用XML之外的其它才各式来实现。
另夕卜，本发明实施例为使用语音命令控制监控设备向左、向右、向上、向下旋转，但并不限于次，通过本发明提供的技术方案，可以支持控制监控设备和摄像头的其它更多的操作，例如控制摄像头变焦、调整亮度、操纵监控设备的附属设备如灯光和雨刷等。
装置实施例
根据本发明实施例，提供一种监控设备的控制装置。
图4示出了根据本发明实施例的监控设备的控制装置的结构框架图，如图4所示，该装置包括获耳又才莫块10、匹配才莫块20和控制才莫块30。
下面详细描述上述各纟莫块。
获取模块10,用于对接收的语音控制指令对应的数字语音信号进行特征提取，获取语音控制指令的语音识别参凄t序列。
匹配模块20，用于在预先设置的一个或多个语音识别参数序列中查找与获取的语音识别参数序列匹配最佳的语音识别参数序列，该才莫块可以连4妄至获取才莫块10。
控制模块30,用于确定查找的语音识别参数序列所对应的操作指令，并利用操作指令对监控设备进行控制，该才莫块可以连接至匹配模块20。
通过本发明实施例提供的监控设备的控制装置，利用语音指令对监控设备进行控制，操作人员可以通过直接输入语音控制命令的方式对监控设备进行控制，对于操作人员来说，该方法操作筒单，且更加形象、直》见。
图5是根据本发明实施例的监控设备的控制装置的具体结构框
架图，在图4所示的装置的基础上，图5所示的装置还包括接收才莫块40、保存模块50和配置模块60。
对上述各模块进行详细描述。
接收才莫块40，用于预先接收一个或多个语音控制指令。
保存模块50，用于对每个语音控制指令对应的数字语音信号进行特征提取，获取并保存每个语音控制指令的语音识别参数序列，该才莫块可以连4妄至匹配才莫块20和4妄收才莫块40。
配置模块60，用于配置语音识别参数序列与操作指令之间的对应关系，该才莫块可以连接至保存模块50 。
其中，保存模块50还用于保存预先接收的数字语音信号；或者，保存压缩后的每个语音控制指令对应的数字语音信号。
如上所述，借助于本发明提供的监控设备的控制方法和/或装置，利用语音指令对监控设备进行控制，操作人员可以通过直接输入语音控制命令的方式对监控设备进行控制，对于才喿作人员来说，该方法操作简单，且更加形象、直观。
以上所述^f又为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
权利要求
1.一种监控设备的控制方法，其特征在于，包括对接收的语音控制指令对应的数字语音信号进行特征提取，获取所述语音控制指令的语音识别参数序列；在预先设置的一个或多个语音识别参数序列中查找与所述获取的语音识别参数序列匹配最佳的语音识别参数序列；确定所述查找的语音识别参数序列所对应的操作指令，并利用所述操作指令对监控设备进行控制。
2. 根据权利要求1所述的方法，其特征在于，在接收到所述语音控制指令之前，所述方法还包括预先接收一个或多个语音控制指令；对于每个语音控制指令，将其对应的数字语音信号进行特征提取，获取并保存每个语音控制指令的语音识别参数序列；配置语音识别参数序列与所述4乘作指令之间的对应关系。
3. 根据权利要求2所述的方法，其特征在于，所述方法还包括对于预先接收的所述每个语音控制指令，保存其对应的数字语音信号。
4. 根据权利要求3所述的方法，其特征在于，对于预先接收的所述每个语音控制指令，保存其对应的数字语音信号的操作具体为对于预先接收的所述每个语音控制信令，压缩其对应的数字语音信号，并保存压缩后的所述数字语音信号。
5. 根据权利要求2所述的方法，其特征在于，对于每个操作指令，预先设置的语音控制指令的数量为一个或多个。
6. 根据权利要求1所述的方法，其特征在于，利用所述操作指令对设备进行控制的操作具体为向目标编码器发送所述操作指令，所述目标编码器根据所述操作指令对所述监控设备进行控制。
7. 根据权利要求1所述的方法，其特征在于，利用所述操作指令对设备进行控制的操作具体为向中转服务器发送所述操作指令，所述中转服务器将所述操作指令转发给目标编码器，所述目标编码器^艮据所述操作指令对所述监控设备进行控制。
8. 根据权利要求1至7中任一项所述的方法，其特征在于，利用以下方式之一提取所述语音控制指令对应的凄t字语音信号特征参数共振峰提取法、端点检测提取法、线性预测倒谱系数提取法、Mel倒谱系数即MFCC提取法、线性频率即LSF提取法。
9. 根据权利要求1至7中任一项所述的方法，其特征在于，查找与所述获取的语音识别参数序列匹配最佳的语音识别参数序列的方式包括以下至少之一动态时间归整算法、隐含马可夫模型。
10. —种监控设备的控制装置，其特征在于，包括获取模块，用于对接收的语音控制指令对应的数字语音信号进行特征提取，获取所述语音控制指令的语音识别参数序列；匹配才莫块，用于在预先i殳置的一个或多个i吾音识别参凄t序列中查找与所述获取的语音识别参凄t序列匹配最佳的i吾音识别参凄t^列；控制模块，用于确定所述查找的语音识別参数序列所对应的操作指令，并利用所述操作指令对监控设备进行控制。
11. 根据权利要求IO所述的装置，其特征在于，所述装置还包括接收模块，用于预先接收一个或多个语音控制指令；保存模块，用于对每个语音控制指令对应的数字语音信号进行特征提取，获取并保存每个语音控制指令的语音识别参数序列；配置模块，用于配置语音识别参数序列与所述操作指令之间的s于应关系。
12. 根据权利要求10或11所述的装置，其特征在于，所述保存模块还用于保存预先接收的数字语音信号；或者，保存压缩后的所述每个语音控制指令对应的数字语音信号。
全文摘要
本发明公开了一种监控设备的控制方法和装置，其中，该方法包括对接收的语音控制指令对应的数字语音信号进行特征提取，获取语音控制指令的语音识别参数序列；在预先设置的一个或多个语音识别参数序列中查找与获取的语音识别参数序列匹配最佳的语音识别参数序列；确定查找的语音识别参数序列所对应的操作指令，并利用操作指令对监控设备进行控制。通过本发明，利用语音指令对监控设备进行控制，操作人员可以通过直接输入语音控制命令的方式对监控设备进行控制，对于操作人员来说，该方法操作简单，且更加形象、直观。
文档编号H04L29/06GK101345668SQ20081021440
公开日2009年1月14日申请日期2008年8月22日优先权日2008年8月22日
发明者崔志伟申请人:中兴通讯股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：崔志伟
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

上一篇：全速率语音的处理方法和装置的制作方法
上一篇：随机接入信道的发送方法和装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。