一种视频输入实现方法及系统的制作方法

文档序号：6466478阅读：193来源：国知局

专利名称：一种视频输入实现方法及系统的制作方法
技术领域：
本发明涉及多媒体技术领域，特别涉及一种视频输入实现方法及系统。
背景技术：
随着计算机技术的发展，各种输入设备及输入方法应运而生，例如键盘、鼠标、触摸屏、指紋采集器。特别对于移动终端，目前通常的输入方法为通过键盘输入或触摸屏输入。但是，这些输入方法存在以下一些缺点
在进行信息输入时，需要频繁接触键盘或屏幕，对设备有一定损耗；键盘输入方法比较复杂；触摸屏输入方法输入区域有限，通常取决于屏幕大小；触摸屏输入法必须要求输入者与输入设备保持接触。
目前，随着流媒体技术的发展，一些视频采集设备(例如摄像头)也成为计算机或移动终端的常见配置，这也为固定设备或移动终端提供了一种新的信息获取源。因此，可以通过对视频采集设备进行信息输入，但是，目前视频釆集设备还不具备该功能。
为此，需要找到一种解决办法，能够通过对视频采集设备进行信息输入，以变革现有的接触式输入方法。

发明内容
本发明的目的在于，提供一种视频输入系统。本发明的另一目的在于，提供一种视频输入实现方法。本发明的视频输入系统，包括图像釆集模块、运动轨迹提取模块、智能识别模块、联动处理模块，其中，所述图像采集模块，用于实时采集用户发起的连续运动图像，将转换后的连续图像数据传递给运动轨迹提取模块；所述运动轨迹提取模块，用于分析釆集到的连续运动图像数据，采用运动轨迹提取算法提取用户运动轨迹；所述智能识别模块，用于通过智能识别算法识别所述运动轨迹提取模块中提取的用户运动轨迹，并将识别结果传送给联动处理模块；所述联动处理模块，用于根据收到的识别结果执行预定的联动处理操作。
其中，所述图像采集模块包括手机摄像头、或者网络摄像头、或者企业监控摄像头。
其中，所述运动轨迹提取模块中，运动轨迹提取算法包括隐马尔科夫模型
算法、或者神经网络算法、或者OpenCV运动模板算法。
其中，所述智能识别模块采用的智能识别算法通过光学字符识别OCR技术识别接收到的运动轨迹。
其中，所述联动处理模块中预定的联动处理操作，包括显示识别的字母或笔画操作、或者执行手势控制操作。
本发明的视频输入实现方法，包括下列步骤
步骤A:实时采集用户发起的连续运动图像，并分析采集到的连续运动图像数据，采用运动轨迹提取算法提取用户运动轨迹；
步骤B:通过智能识别算法识别所述提取的用户运动轨迹，并根据识别结果执行预定的联动处理操作。
其中，在所述步骤A中，通过手机摄像头、或者网络摄像头、或者企业监控摄像头实时采集用户发起的连续运动图像。
其中，在所述步骤A中，所述运动轨迹提取算法包括隐马尔科夫模型算法、或者神经网络算法、或者OpenCV运动模板算法。
其中，在所述步骤B中，所述智能识别算法通过光学字符识别OCR技术识别接收到的运动轨迹。
其中，在所述步骤B中，所述预定的联动处理操作，包括显示识别的字母或笔画操作、或者执行手势控制操作。
本发明的有益效果是依照本发明的视频输入实现方法及系统，能够在进行信息输入时，不需要接触键盘或屏幕，从而实现对设备的较好维护；另夕卜，进行信息输入时可以不局限于屏幕大小；更大地发挥视频采集设备(例如摄像头)的作用，为固定设备或移动终端提供了一种新的信息获取源，丰富了现有的接触式输入方法。

图1为本发明的视频输入系统的示意图2为本发明的视频输入实现方法的流程图。
具体实施例方式
以下，参考附图1 2详细描述本发明的视频输入实现方法及系统。
如图l所示，本发明的视频输入系统，包括图像采集模块、运动轨迹提取模块、智能识别模块、联动处理模块。
其中，图像采集模块，用于实时釆集用户A发起的连续运动图像，并对采集到的图像进行模数转换，将转换后的连续图像的RGB数据传递给运动轨迹提取模块；其中，图像釆集模块可以为手机摄像头、网络摄像头(IP Camera, IPC)、企业监控摄像头等。
运动轨迹提取模块，用于分析采集到的连续运动图像RGB数据，采用运动侦测算法提取用户的运动轨迹，然后可以将用户的运动轨迹进行保存(例如可以放在内存或存为文件)。
其中，运动轨迹提取模块中采用的运动侦测算法可以如下定时侦测(时间越短精确度越高)图像移动方向与X轴的夹角，则可将图像的移动轨迹抽象为一串移动方向角度的序列。例如可以采用现有的运动轨迹提取算法有隐马尔禾牛夫才莫型(Hidden Markov Model ， HMM )和-申经网纟各(Neural Network, NN)方法，也可用现有的Intel公司的Open CV库"运动模板"(Motion Templates)实现。
智能识别模块，用于通过智能识别算法识别接收到的运动轨迹，并将识别结果(例如，字母"S")传送给联动处理模块。
在本实施例中，因为目标是识别文字，所以可以用现有的光学字符识别技术(Optical Character Recognition, OCR)进行识别。以识别26个字母为例，需构造三个滤波器，将26个字母表示成& U=l, 2...26),任选其中l个为 &， &与每一个&做内积得到Kfc/，即
将Kw按由大到小排列，通过聚4分'为三组。对于已聚类所得到的3类，分别给予码值4 = 1 ，0， - 1 ， MASK (/)是迭代到第t次时所得到的物空间滤波函数表示。以字母"S"为例，按输出能量取阈，其标准码值(3个滤波器) 为"011"。可将待识别的轨迹图像的码值与各字母的标准码值进行比较，完成 26个字母的识别。类似地，也可以实现中文汉字笔画的识别。
联动处理模块，用于对收到的识别结果做相应的联动处理，包括，触发报警等操作，另外，对于手机终端，联动处理包括显示识别的字母或笔画等操作。
对于联动处理模块，在不同的实施环境下，有不同的识别目的，可采用不通智能识别算法。例如，目标是识别"手势"，则可以采用与识别"鼠标手势，，
一样的利用神经网络算法首先从轨迹上取若干采样点，记录相邻釆样点的角度数值，这样就将轨迹转化为一系列数值序列，然后可通过映射到HopfieW 网络等经典神经网络模型与训练得到的标准手势模型库进行匹配，由Hopfield 网络判定当前的"手势"最接近哪种标准手势，从而识别不同手势。
作。例如当识别结果是"手势"时，可原先设定"手势A"对应的联动为"报警操作"，"手势B"对应的联动为"摄像头右转"等。
如图l所示的应用场景中，用户A面对图像采集模块，例如网络摄像头，可实时采集视频图像，用手指临空写字(如图示字母"S"),模块B实时釆集图像，将连续图像的RGB数据传送给运动轨迹提取模块，运动轨迹提取模块通过对这些图像的处理，提取用户A手指的运动轨迹，智能识别模块对这些运动轨迹进行处理，提取出字母"S"，联动处理模块将智能识别模块传递过来的字母"S"显示，这样用户通过不接触输入设备实现了信息输入。
如图2所示，本发明的视频输入实现方法，具体包括下列步骤
步骤100:用户A面对图像采集设备，例如，网络摄像头(IP Camera, IPC), 发起的连续运动图像，例如用手临空写字母、划笔画或者打手势；
步骤200:图像釆集设备实时采集用户连续运动图像，并对采集到的图像进行模数转换；
步骤300:分析采集到的连续运动图像RGB数据，采用运动侦测算法提取用户A的运动轨迹，并将用户A的运动轨迹进行保存(例如可以放在内存或存为文件)；
其中，在步骤300中，可以采用如下的运动侦测算法定时侦测(时间越短精确度越高)图像移动方向与X轴的夹角，则可将图像的移动轨迹抽象为一串移动方向角度的序列。
步骤400:通过智能识别算法识别接收到的运动轨迹；
其中，在步骤400中，可以用现有的光学字符识别技术(Optical Character Recognition, OCR)进行识别。以识别26个字母为例，需构造三个滤波器，将26个字母表示成& (&=1， 2...26)，任选其中l个为&， &与每一个&做内积得到即
将Fw按由大到小排列，通过聚i分'为三组。对于已聚类所得到的3类，分别给予码值4= 1,0， - 1， MASK ("是迭代到第t次时所得到的物空间滤波函数表示。以字母"S"为例，按输出能量耳又阈，其标准码值(3个滤波器) 为"011"。可将待识别的轨迹图像的码值与各字母的标准码值进行比较，完成 26个字母的识別。类似地，也可以实现中文汉字笔画的识别。
另外，在步骤400中，在不同的实施环境下，有不同的识别目的，可采用不通智能识别算法。例如，目标是识别"手势，，，则可以采用与识别"鼠标手势" 一样的利用神经网络算法首先从轨迹上取若干采样点，记录相邻采样点的角度数值，这样就将轨迹转化为一系列数值序列，然后可通过映射到 Hopfield网络等经典神经网络模型与训练得到的标准手势模型库进行匹配，由 Hopfield网络判定当前的"手势"最接近哪种标准手势，从而识别不同手势。
步骤500:根据步骤400中的识别结果执行相应的联动操作。
其中，在步骤500中，可以根据预先定义的联动策略做相应的联动操作。例如当识别结果是"手势"时，可原先设定"手势A"对应的联动为"报警操作"，"手势B"对应的联动为"摄像头右转"等。
以上，仅以举例的形式对本发明在连续运动图像输入的情形进行了详细描述，但是本发明并不仅局限于连续运动图像的输入，对于能提取运动轨迹或轮廓的其他输入方式(例如红外遥感、静态图像轮廓)同样适用。
综上所述，依照本发明的视频输入实现方法及系统，能够在进行信息输入时，不需要接触键盘或屏幕，从而实现对设备的较好维护；另外，进行信息输入时可以不局限于屏幕大小；更大地发挥视频采集设备(例如摄像头)的作用，为固定设备或移动终端提供了一种新的信息获取源，丰富了现有的接触式專俞入方法。
以上是为了使本领域普通技术人员理解本发明，而对本发明所进行的详细
描述，但可以想到，在不脱离本发明的权利要求所涵盖的范围内还可以做出其它的变化和修改,这些变化和修改均在本发明的保护范围内。
权利要求
1.一种视频输入系统，其特征在于，包括图像采集模块、运动轨迹提取模块、智能识别模块、联动处理模块，其中，所述图像采集模块，用于实时采集用户发起的连续运动图像，将转换后的连续图像数据传递给运动轨迹提取模块；所述运动轨迹提取模块，用于分析采集到的连续运动图像数据，采用运动轨迹提取算法提取用户运动轨迹；所述智能识别模块，用于通过智能识别算法识别所述运动轨迹提取模块中提取的用户运动轨迹，并将识别结果传送给联动处理模块；所述联动处理模块，用于根据收到的识别结果执行预定的联动处理操作。
2. 如权利要求1所述的视频输入系统，其特征在于，所述图像采集模块包括手机摄像头、或者网络摄像头、或者企业监控摄像头。
3. 如权利要求1或2所述的视频输入系统，其特征在于，所述运动轨迹提取模块中，运动轨迹提取算法包括隐马尔科夫模型算法、或者神经网络算法、或者Open CV运动模板算法。
4. 如权利要求3所述的视频输入系统，其特征在于，所述智能识别模块采用的智能识别算法通过光学字符识别OCR技术识别接收到的运动轨迹。
5. 如权利要求4所述的视频输入系统，其特征在于，所述联动处理模块中预定的联动处理操作，包括显示识别的字母或笔画操作、或者执行手势控制操作。
6. —种视频输入实现方法，其特征在于，包括下列步骤步骤A:实时采集用户发起的连续运动图像，并分析釆集到的连续运动图像数据，釆用运动轨迹提取算法提取用户运动轨迹；步骤B:通过智能识别算法识别所述提取的用户运动轨迹，并根据识别结果执行预定的联动处理操作。
7. 如权利要求6所述的视频输入实现方法，其特征在于，在所述步骤A 中，通过手机摄像头、或者网络摄像头、或者企业监控摄像头实时采集用户发起的连续运动图像。
8. 如权利6或7所述的视频输入实现方法，其特征在于，在所述步骤A 中，所述运动轨迹提取算法包括隐马尔科夫模型算法、或者神经网络算法、或者Open CV运动模板算法。
9. 如权利8所述的视频输入实现方法，其特征在于，在所述步骤B中，所述智能识别算法通过光学字符识别OCR技术识别接收到的运动轨迹。
10. 如权利9所述的视频输入实现方法，其特征在于，在所述步骤B中，所述预定的联动处理操作，包括显示识别的字母或笔画"t乘作、或者执行手势控制操作。
全文摘要
本发明提供一种视频输入实现方法及系统，其中，该系统包括图像采集模块、运动轨迹提取模块、智能识别模块、联动处理模块，其中，图像采集模块，用于实时采集用户发起的连续运动图像，将转换后的连续图像数据传递给运动轨迹提取模块；运动轨迹提取模块，用于分析采集到的连续运动图像数据，采用运动轨迹提取算法提取用户运动轨迹；智能识别模块，用于通过智能识别算法识别运动轨迹提取模块中提取的用户运动轨迹，并将识别结果传送给联动处理模块；联动处理模块，用于根据收到的识别结果执行预定的联动处理操作。本发明能够在进行信息输入时，不需要接触键盘或屏幕，为固定设备或移动终端提供了一种新的信息获取源，丰富了现有的接触式输入方法。
文档编号G06F3/01GK101354608SQ20081014666
公开日2009年1月28日申请日期2008年9月4日优先权日2008年9月4日
发明者夏正勋申请人:中兴通讯股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：夏正勋
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。