一种电视信号识别的方法及装置的制造方法_2

文档序号:8475448阅读:来源:国知局
小会进行增大),保证进行声纹提取的音源是良好的。接下来会对语音信号按照预先设定的算法进行声纹信号提取。
[0028]得到声纹信号之后,我们通过网络把声纹信号传送到服务器端,与已经得到的节目主要人物声纹信息进行匹配,比如假设刚才用户采集的是谢娜的声纹信息,那么我们就可以在预先得到的何炅,谢娜,杜海涛,吴昕,李维嘉,邓超,孙個的声纹信息里与谢娜的声纹匹配到。
[0029]最后我们将匹配得到的信息传送回电视端,最终显示到电视端的大屏幕上,完成最终的用户查询。
[0030]基于上述电视信号的识别方法,本发明还提供了一种电视信号识别的装置。此装置可以通过两种方式进行实现,如附图2是装置一,附图3是装置二。
[0031]装置一中:电视端频道语音采集模块Tl是用于采集当前正在播出的语音信号,用户的遥控器可以控制Tl的开始和结束。
[0032]声纹提取模块T2是用于对Tl传送过来的语音信号进行预处理,包括背景消燥和音量提升(设定最小音量阈值,小于阈值进行提升音量)。接着会用模块中预设的算法对语音信号进行声纹提取,得到一段声纹信号。
[0033]服务器声纹库和匹配模块T3是用于对T2传送过来的声纹信号在服务器的声纹库进行匹配,如果匹配成功则返回匹配结果到电视端,如果不成功则返回空值。
[0034]装置二中:遥控器语音采集模块SI用于采集用户所说的命令,包括开始和结束。转化成语音信号并进行消燥处理。
[0035]遥控器与电视的通信模块S2用于将SI采集的语音信号传送到电视端的接收端。
[0036]网络云端语音库和匹配模块S3用于将电视端传送的语音信号与语音库的信号进行匹配,如果匹配成功则返回匹配结果到电视端,如果没有泽返回空值。
[0037]电视端频道语音采集模块S4得到S3的匹配结果后进行当前播放的语音信号的采集,接着对语音信号进行背景消燥和音量提升(设定最小音量阈值,小于阈值进行提升音量)。
[0038]声纹提取模块S5会用模块中预设的算法对语音信号进行声纹提取,得到一段声纹信号。
[0039]服务器声纹库和匹配模块S6用于对T2传送过来的声纹信号在服务器的声纹库进行匹配,如果匹配成功则返回匹配结果到电视端,如果不成功则返回空值。
[0040]以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
【主权项】
1.一种电视信号识别的方法,其特征在于:包括如下步骤, 步骤S1:用户通过控制电视端进行当前频道语音信号录制; 步骤S2:电视端提取步骤SI所录制的频道语音信号的声纹信号,将该声纹信号通过网络上传至网络服务器,并与该网络服务器中的声音声纹库进行匹配; 步骤S3:将声纹信号的匹配结果返回电视端,并显示于电视端的屏幕上。
2.根据权利要求1所述的一种电视信号识别的方法,其特征在于:所述步骤SI的具体实现步骤如下, 步骤Sll:用户通过遥控器上的语音采集模块采集用户语音控制信号; 步骤S12:遥控器将所述用户语音控制信号传送至电视端,并通过电视端传送至网络云端的语音库进行语音匹配; 步骤S13:网络云端发送语音匹配结果至电视端,进而控制当前频道语音信号录制。
3.根据权利要求1所述的一种电视信号识别的方法,其特征在于:所述步骤S2之前,还需对步骤Si录制的频道语音信号进行预处理,包括消除噪声及语音信号放大处理。
4.根据权利要求1所述的一种电视信号识别的方法,其特征在于:所述频道语音信号的录制通过以下方式实现:直接在电视端的机顶盒的语音输入端进行频道语音信号采集或利用电视端外放端进行频道语音信号采集。
5.根据权利要求1所述的一种电视信号识别的方法,其特征在于:在所述步骤S2之前,所述电视端的机顶盒会先发送当前频道号,网络服务器会根据已有的时间和频道节目单对应列出节目主要演员名单,然后网络服务器根据主要演员名单提前搜索出声音声纹库对应的声纹信号。
6.一种电视信号识别的装置,包括电视端和网络服务器端,其特征在于:所述电视端包括用于进行频道语音信号录制的频道语音采集模块和对所录制的频率语音信号进行声纹信号提取的声纹提取模块,所述网络服务器端包括存储有声纹信号的声纹库和用于对声纹提取模块上传的声纹信号进行匹配的声纹匹配模块。
7.根据权利要求6所述的一种电视信号识别的装置,其特征在于:还包括一遥控器和网络云端,所述遥控器包括对用户语音控制信号进行采集语音采集模块和用于实现遥控器与电视端通信的遥控器与电视端通信模块,所述网络云端包括语音库和用于匹配用户语音控制信号的语音匹配模块。
【专利摘要】本发明涉及一种电视信号识别的方法及装置,所述方法:首先,用户通过控制电视端进行当前频道语音信号录制;其次,电视端提取所录制的频道语音信号的声纹信号,将该声纹信号通过网络上传至网络服务器,并与该网络服务器中的声音声纹库进行匹配;最后,将声纹信号的匹配结果返回电视端,并显示于电视端的屏幕上;所述装置包括电视端的频道语音采集模块,电视端的声纹提取模块,服务器端的声纹库和匹配模块。本发明采用智能化语音控制电视的行为,然后通过声纹识别技术帮助识别正在播出电视的语音信号,并实时反馈给用户,是一种非常人性化的用户和电视进行交互行为,结合了互联网云端,声纹识别,语音识别技术的智能化装置,给用户带来更好的使用体验和乐趣。
【IPC分类】H04N21-232, H04N21-439, H04N21-422
【公开号】CN104796751
【申请号】CN201510195507
【发明人】郭太良, 叶芸, 林志贤, 姚剑敏, 林金堂
【申请人】福州大学
【公开日】2015年7月22日
【申请日】2015年4月23日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1