基于图像处理和语音处理的视频设备控制装置及方法

文档序号:9582134阅读:651来源:国知局
基于图像处理和语音处理的视频设备控制装置及方法
【技术领域】
[0001]本发明涉及视频设备的控制装置及方法,特别是基于图像处理和语音处理的视频设备控制装置及方法。
【背景技术】
[0002]现在的电视遥控一般通过按键和红外实现,难以在不同的信号源设备(如机顶盒,智能电视盒子)等相关之间转换使用。用户需要在多个不同的遥控之间依次使用。部分使用语音的智能遥控,一般都局限在对应的型号电视或者信号源,且语音操作未能和视觉图像间直接关联,用户使用不便。

【发明内容】

[0003]有鉴于此,本发明所要解决的技术问题是提供一种语音操作与视觉图像相关联以简化用户操作的视频设备控制装置。
[0004]本发明所要解决的另一技术问题是提供一种语音操作与视觉图像相关联以简化用户操作的视频设备控制方法。
[0005]本发明提供的基于图像处理和语音处理的视频设备控制装置包括一语音系统、视觉系统、一处理与运算单元及一红外发射器。所述语音系统用以获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本。所述视觉系统用以对所述电视的一视频预览图像进行拍照以识别该视频预览图像上的文字并确定光标在所述视频预览图像上的光标初始位置。所述处理与运算单元与所述语音系统及视觉系统通信连接,所述处理与运算单元通过比对所述观看目标文本与所述视频预览图像上的被识别的文字以确定用户观看目标在所述视频预览图像上的目标位置并据此计算所述光标从所述光标初始位置移动至所述目标位置的移动路径。所述红外发射器与所述处理与运算单元通信连接,用以发出指令指示所述光标沿所述移动路径移动至所述目标位置。
[0006]在一实施例中,所述视觉系统构造成用以对所述光标移动前后的两幅视频预览图像进行拍照对比以学习出所述光标在该电视上的显示方式。
[0007]在一实施例中,所述控制装置包括一存储器,所述存储器存储所述视频设备的遥控器控制代码并与所述处理与运算单元通信连接。
[0008]在一实施例中,所述控制装置包括一红外接收器,所述红外接收器与所述处理与运算单元通信连接,所述红外接收器通过接收所述视频设备的遥控器的红外线从而学习所述视频设备的遥控器控制代码。
[0009]在一实施例中,所述控制装置包括一云端服务器,所述云端服务器与所述处理与运算单元通信连接,所述云端服务器用以存储不同类型的视频设备的遥控器控制代码。
[0010]本发明另提出一种基于图像处理和语音处理的视频设备控制方法,包括:拍摄所述电视的一视频预览图像、分割所述视频预览图像以识别该视频预览图像上的文字,并确定光标在所述视频预览图像上的光标初始位置;获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本;通过比对所述观看目标文本与所述视频预览图像上的被识别的文字以确定用户观看目标在所述视频预览图像上的目标位置;通过一处理与运算单元计算所述光标从所述光标初始位置移动至所述目标位置的移动路径;以及所述处理与运算单元触发一遥控器遥控所述视频设备使所述光标沿所述移动路径移动至所述目标位置并播放位于所述目标位置的视频。
[0011]在一实施例中,在确定光标在所述视频预览图像上的位置之前,还包括拍摄并比对所述光标移动前后的两幅视频预览图像以学习出所述光标在该电视上的显示方式。
[0012]在一实施例中,所述视频设备控制方法还包括执行所述视频设备控制方法的视频设备控制装置从一云端服务器下载所述视频设备的遥控器控制代码。
[0013]在一实施例中,所述视频设备具有自带的遥控器,执行所述视频设备控制方法的视频设备控制装置包括一红外接收器,所述视频设备控制方法包括通过一语音系统提醒用户逐一触发所述视频设备自带遥控器对应的按键以发出对应的控制代码,所述视频设备控制装置的红外接收器接收所述视频设备自带遥控器发出的控制代码。
[0014]本发明另提出一种基于图像处理和语音处理的视频设备控制方法,包括:视频设备控制装置的语音系统获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本;在所述视频设备控制装置获得所述视频源设备后台的授权的情况下,通过所述后台直接搜索所述观看目标,其中搜索结果通过所述显示器件的屏幕展示;所述视频设备控制装置发出指令播放所述搜索结果。
[0015]本发明还提出一种基于图像处理和语音处理的视频设备控制方法,包括:视频设备控制装置的语音系统获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本;视频设备控制装置的视觉系统识别出该显示器件屏幕上的搜索界面的文字输入框;所述视频设备控制装置在所述文字输入框中输入上述观看目标文本进行搜索,其中搜索结果通过所述显示器件的屏幕展示;以及所述视频设备控制装置发出指令播放所述搜索结果。
[0016]在上述实施例中,视频设备控制装置基于对语音处理和图像处理,并将语音和图像相关联,用户仅需进行简单的语音交互,其余控制动作完全交由控制装置自动完成,极大地简化了视频设备控制方式。
【附图说明】
[0017]图1是视频设备控制装置一实施例的系统示意图。
[0018]图2是视频设备控制方法一实施例的流程图。
[0019]图3是视频设备控制方法另一实施例的流程图。
【具体实施方式】
[0020]为了使本发明要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅作为例示用途,并不用于限定本发明。
[0021]本发明提出一种基于图像处理和语音处理的视频设备控制装置及方法,其中视频设备一般包括视频源设备及显示器件。视频源设备例如是机顶盒,智能电视盒子等。显示器件例如是电视、投影或能够接收并显示视频源设备的图像的其他显示装置。通常情况下,视频源设备与显示器件是分开的两个单独设备,但在一些实施例中,视频源设备也可以与显示器件整合为一个单一设备,例如目前市面上的智能电视,其整合有电视盒子或机顶盒的功能。
[0022]如图1,视频设备控制装置10用以对一视频设备12进行控制。视频设备12包括一显示器件14、视频设备红外接收器16、以及一视频设备红外遥控器18。视频设备红外遥控器18即视频设备12自带的遥控器,可以对显示器件14的显示内容进行遥控。
[0023]视频设备12除了包括显示器件14外,一般还包括视频源设备,为显示器件14提供视频内容。视频源设备例如是机顶盒,智能电视盒子等。显示器件14例如是电视、投影或能够接收并显示视频源设备的图像的其他显示装置。通常情况下,视频源设备与显示器件是分开的两个单独设备,但在一些实施例中,视频源设备也可以与显示器件整合为一个单一设备,例如目前市面上的智能电视,其整合有电视盒子或机顶盒的功能。
[0024]视频设备控制装置10包括一语音系统20、视觉系统22、一处理与运算单元24、一红外发射器26、一红外接收器28、一存储器30。在一些实施例中,视频设备控制装置10还可以包括一云端服务器32。上述语音系统20、视觉系统22、红外发射器26、红外接收器28、存储器30和云端服务器32皆通信连接至处理与运算单元24。
[0025]在控制视频设备12的过程中,视频设备控制装置10将代替视频设备12自带的遥控器对视频设备12进行自动控制。具体而言,视频设备控制装置10中的存储器30存储有视频设备的遥控器控制代码,这样就可以利用视频设备控制装置10的红外发射器26对视频设备12进行控制。
[0026]遥控器控制代码的获取可以采用三种方法。
[0027]方法一:通过直接读取原遥控器的遥控控制代码
[0028]视频设备控制装置10内部具有红外接收器28,通过视频设备控制装置10的语音系统20提醒用户逐一触发原设备(电视或者视频源提供设备)遥控器对应的按键,视频设备控制装置10的红外接收器28可接收到原设备遥控器的红外光线从而学习到遥控代码并保存到存储器30,供自己后续使用。
[0029]方法二:通过电视机或者电视信号或视频源设备厂商合作取得对应的遥控码,用户通过下载,从服务器得到该代码。
[0030]方法三:通过用户使用方法一获得的代码可以自愿通过网络进行分享或上传到云端服务器。其他用户可以下载该分享的控制代码。
[0031]语音系统用以获取用户的观看目标语音指令并将所获取的观看目标语音指令转化为观看目标文本。所述视觉系统用以对所述电视的一视频预览图像进行拍照以识别该视频预览图像上的文字并确定光标在所述视频预览图像上的光标初始位置。所述处理与运算单元与所述语音系统及视觉系统通信连接,所述处理与运算单元通过比对所述观看目标文本与所述视频预览图像上的被识别的文字以确定用户观看目标在所述视频预览图像上的目标位置并据此计算所述光标从所述光标初始位置移动至所述目标位置的移动路径。所述红外发射器与所述处理与运算单元通信连接,用以发出指令指示所述光标沿所述移动路径移动至所述目标位置。
[0032]以下通过实施例来进一步介绍视频设备控制装置10及其控制方法。在以下实施例中,是以电视为例,但应当理解的是,所介绍的实施例也可以应用于其他显示装置。
[0033]图2是视频设备控制装置10控制视频设备的另一个实施例中,在此实施例中,用户没有明显的观看目标,随着浏览不同的视频源,确认观看目标。此时控制方法包括如下步骤:
[0034]在步骤S21中,当电视显示一视频预览图像时,视频设备控制装置10的视觉系统22拍摄电视的视频预览图像、分割所述视频预览图像以识别该视频预览图像上的文字,并确定光标在所述视频预览图像上的光标初始位置。
[0035]例如,该视频预览图像显示若干部电影。每一部电影的位置包括一电影海报图以及位于海报图下方的文字,文字可能包括电影名以及其他与该电影相关的信息。视觉系统22拍摄该视频预览系统后,将该照片按照每一部电影分割成一个区域,并识别每个区域内的文字。所识别的文字一般至少应该包括电影名。
[0036]由于不同视频源设备的视频预览图像中的光标的显示方式可能不一样,例如光标所到位置的文字或文字区域改变颜色,加下划线或者加粗等等,视频设备控制装置10可能
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1