基于图像处理和语音处理的视频设备控制装置及方法_2

文档序号:9582134阅读:来源:国知局
需要先学习识别给定机型的对应光标显示方式。
[0037]在一实施例中,学习的方式可以采用如下方案:按照对应的遥控码,对方向进行使用,比如控制红外发射器26发出向右移动光标的代码,视觉系统22在红外发射器26发出向右移动的代码前后对电视图像进行拍照,对两张照片进行对比分析,从而学习出光标在该电视设备上的显示方式。需要指出的是,对于特定视频源设备而言,这种学习只是在初次或前几次使用时进行,一旦正确识别出了该视频设备的光标显示方式,后续使用时就不会再进行学习,除非该视频源设备因系统升级或其它原因而导致光标显示方式发生改变。
[0038]在步骤S22中,视频设备控制装置10通过语音系统20获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本。
[0039]例如,当电视显示某一视频预览图像时,用户希望观看该视频预览图像上的电影“碟中谍5”,用户可说出如下的观看目标语音指令:“我想看碟中谍5”。语音系统20通过语义解析,识别出目标电影是“碟中谍5”,然后将该观看目标语音指令转换为观看目标文本“碟中谍5”。
[0040]在步骤S23中,处理与运算单元24通过比对观看目标文本与所述视频预览图像上的被识别的文字以确定用户观看目标在所述视频预览图像上的目标位置。
[0041]例如,转化得到的观看目标文本是“碟中谍5”,通过文字比对,找到视频预览图像上的“碟中谍5”的影片位置,就可以确定用户的观看目标在拍摄的视频预览图像上的目标位置。
[0042]在步骤S24中,确定观看目标的目标位置后,处理与运算单元24计算所述光标从所述光标初始位置移动至所述目标位置的移动路径或者移动位移量。
[0043]例如,从光标初始位置,向右移动三步,再向下移动两步,即可到达目标位置。
[0044]在步骤S25中,处理与运算单元24在计算得到光标的移动路径后,触发遥控器,即红外发射器26发射遥控码遥控所述视频设备使所述光标沿所述移动路径移动至所述目标位置并播放位于所述目标位置的视频。
[0045]例如,红外发射器26发射三次向右的移动代码,然后发射两侧向下的移动代码,即可将光标移动至目标位置。
[0046]在此实施例中,用户唯一需要做的就是说出观看目标语音指令,其余动作皆由视频设备控制装置10自动完成,因此极大地简化了用户的操作。
[0047]图3为视频设备控制装置10控制视频设备的另一个实施例,在该实施例中用户有明显的观看目的。此时控制方法包括如下步骤:
[0048]步骤S31:视频设备控制装置10通过语音系统20获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本。
[0049]步骤S32:通过设备内部的搜索系统搜索观看目标。
[0050]步骤S33:播放搜索结果。
[0051]其中,步骤S31可与前述实施例中的步骤S21相同。
[0052]在步骤S32中,对于搜索的实现可有多种方式。在一实施例中,如果获得用户的视频设备后台的授权,可通过后台直接搜索,并将搜索结果通过屏幕展示出来。例如,通过调阅并查阅后台节目表的方式找到观看目标。
[0053]在另一实施例中,可通过视频设备自带的显示于屏幕上的搜索界面。具体步骤为,控制设备10通过其视觉系统22识别出该显示器件14屏幕上的搜索界面的文字输入框,然后在此文字输入框中输入通过语音识别并进行转化的观看目标文本进行搜索,其中搜索结果通过显示器件14的屏幕展示,如此可利用视频设备内部的搜索系统搜索观看目标。以这种语音和视觉系统识别的方式,加之一定时间的学习,可以兼容所有的视频设备。
[0054]在上述实施例中,如果搜索结果有多个,则可以利用图2的实施例的方式,通过与用户的语音交互及视觉系统的图像识别及处理,找到用户想要播放的视频。例如,控制装置10的视觉系统22拍摄所述显示器件14的搜索结果展示页面,通过分割所述搜索结果展示页面以识别该展示页面上的文字,并确定光标在所述搜索结果展示页面上的光标初始位置。控制装置10获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本;此时的观看目标语音指令是针对在搜索结果展示页面上展示的观看目标或视频。通过比对所述观看目标文本与所述搜索结果展示页面上的被识别的文字以确定用户观看目标在所述搜索结果展示页面上的目标位置。通过处理与运算单元24计算所述光标从所述光标初始位置移动至所述目标位置的移动路径。所述处理与运算单元24触发一遥控器遥控所述视频设备使所述光标沿所述移动路径移动至所述目标位置并播放位于所述目标位置的视频。
[0055]以上所述仅为本发明的实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种基于图像处理和语音处理的视频设备控制装置,所述视频设备包括显示器件及视频源设备,其特征在于,所述视频设备控制装置包括: 一语音系统,所述语音系统用以获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本; 一视觉系统,所述视觉系统用以对所述显示器件的一视频预览图像进行拍照以识别该视频预览图像上的文字并确定光标在所述视频预览图像上的光标初始位置; 一处理与运算单元,所述处理与运算单元与所述语音系统及视觉系统通信连接,所述处理与运算单元通过比对所述观看目标文本与所述视频预览图像上的被识别的文字以确定用户观看目标在所述视频预览图像上的目标位置并据此计算所述光标从所述光标初始位置移动至所述目标位置的移动路径;以及 一红外发射器,所述红外发射器与所述处理与运算单元通信连接,用以发出指令指示所述光标沿所述移动路径移动至所述目标位置。2.如权利要求1所述的基于图像处理和语音处理的视频设备控制装置,其特征在于,所述视觉系统构造成用以对所述光标移动前后的两幅视频预览图像进行拍照对比以学习出所述光标在该显示器件上的显示方式。3.如权利要求1所述的基于图像处理和语音处理的视频设备控制装置,其特征在于,包括一存储器,所述存储器存储所述视频设备的遥控器控制代码并与所述处理与运算单元通信连接。4.如权利要求3所述的基于图像处理和语音处理的视频设备控制装置,其特征在于,包括一红外接收器,所述红外接收器与所述处理与运算单元通信连接,所述红外接收器用以通过接收所述视频设备的遥控器的红外线从而学习所述视频设备的遥控器控制代码。5.如权利要求3所述的基于图像处理和语音处理的视频设备控制装置,其特征在于,包括一云端服务器,所述云端服务器与所述处理与运算单元通信连接,所述云端服务器用以存储不同类型的视频设备的遥控器控制代码。6.一种基于图像处理和语音处理的视频设备控制方法,所述视频设备包括显示器件及视频源设备,其特征在于,所述视频设备控制方法包括: 拍摄所述显示器件的一视频预览图像、分割所述视频预览图像以识别该视频预览图像上的文字,并确定光标在所述视频预览图像上的光标初始位置; 获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本; 通过比对所述观看目标文本与所述视频预览图像上的被识别的文字以确定用户观看目标在所述视频预览图像上的目标位置; 通过一处理与运算单元计算所述光标从所述光标初始位置移动至所述目标位置的移动路径;以及 所述处理与运算单元触发一遥控器遥控所述视频设备使所述光标沿所述移动路径移动至所述目标位置并播放位于所述目标位置的视频。7.如权利要求6所述的基于图像处理和语音处理的视频设备控制方法,其特征在于,在确定光标在所述视频预览图像上的位置之前,还包括拍摄并比对所述光标移动前后的两幅视频预览图像以学习出所述光标在该电视上的显示方式。8.如权利要求6所述的基于图像处理和语音处理的视频设备控制方法,其特征在于,所述视频设备具有自带的遥控器,执行所述视频设备控制方法的视频设备控制装置包括一红外接收器,所述视频设备控制方法包括通过一语音系统提醒用户逐一触发所述视频设备自带的遥控器的对应按键以发出对应的控制代码,所述视频设备控制装置的红外接收器接收所述视频设备自带的遥控器发出的控制代码。9.一种基于图像处理和语音处理的视频设备控制方法,所述视频设备包括显示器件及视频源设备,其特征在于,所述视频设备控制方法包括: 视频设备控制装置的语音系统获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本; 在所述视频设备控制装置获得所述视频源设备后台的授权的情况下,通过所述后台直接搜索所述观看目标,其中搜索结果通过所述显示器件的屏幕展示; 所述视频设备控制装置发出指令播放所述搜索结果。10.一种基于图像处理和语音处理的视频设备控制方法,所述视频设备包括显示器件及视频源设备,其特征在于,所述视频设备控制方法包括: 视频设备控制装置的语音系统获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本; 视频设备控制装置的视觉系统识别出该显示器件屏幕上的搜索界面的文字输入框;所述视频设备控制装置在所述文字输入框中输入上述观看目标文本进行搜索,其中搜索结果通过所述显示器件的屏幕展示;以及 所述视频设备控制装置发出指令播放所述搜索结果。
【专利摘要】一种基于图像处理和语音处理的视频设备控制装置包括一语音系统、视觉系统、一处理与运算单元及一红外发射器。语音系统获取用户的观看目标语音指令并将观看目标语音指令转化为观看目标文本。视觉系统对一视频预览图像进行拍照以识别该视频预览图像上的文字并确定光标的光标初始位置。处理与运算单元与语音系统及视觉系统通信连接,处理与运算单元通过比对观看目标文本与所述视频预览图像上的被识别的文字以确定用户观看目标在视频预览图像上的目标位置并据此计算光标的移动路径。红外发射器与所述处理与运算单元通信连接,用以发出指令指示光标沿所述移动路径移动至所述目标位置。也公开了一种视频设备控制方法。
【IPC分类】H04N21/422
【公开号】CN105338386
【申请号】CN201510691382
【发明人】唐志海, 林天麟, 肖杰, 庄礼填, 杨帆, 余刚, 斯美樑
【申请人】深圳创想未来机器人有限公司
【公开日】2016年2月17日
【申请日】2015年10月22日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1