电视播放控制方法、服务器及电视播放控制系统的制作方法

文档序号:9474684阅读:455来源:国知局
电视播放控制方法、服务器及电视播放控制系统的制作方法
【技术领域】
[0001 ] 本发明涉及电视技术领域,尤其涉及一种电视播放控制方法、服务器及电视播放控制系统。
【背景技术】
[0002]目前的电视终端在进行视频文件播放时,通常根据视频文件中音轨及字幕数据来切换人物配音和字幕,以方便不同的用户可以选择自己理解的语言进行播放。然而,这种视频播放方式至少存在以下缺陷:
[0003]大多数视频文件可能只提供了一种语音,但同时提供了两种以上的字幕,这种情况下,用户只能收听视频文件中提供的默认语音,而在用户听不懂该默认语言时,就只能通过观看字幕来了解人物对白和剧情。这样,会降低用户的视听体验效果。
[0004]上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。

【发明内容】

[0005]本发明的主要目的在于提供一种电视播放控制方法、服务器及电视播放控制系统,旨在根据不同用户的语言需求,对应提供可被用户理解的音频,以避免只能借助字幕来了解人物对白及剧情的缺陷,从而提高用户观看电视的体验感。
[0006]为实现上述目的,本发明提供一种电视播放控制方法,所述电视播放控制方法包括以下步骤:
[0007]服务器接收电视终端发送的第一音频数据和字幕数据;
[0008]对所述第一音频数据和字幕数据进行识别处理,生成角色列表和样例音频参数;
[0009]将所述角色列表和样例音频参数发送至所述电视终端,并在接收到所述电视终端根据所述角色列表和样例音频参数反馈的用户设置参数时,将所述第一音频数据合成为第二音频数据;
[0010]将所述第二音频数据发送至所述电视终端,以控制所述第二音频数据以及所述字幕数据在所述电视终端进行播放。
[0011]优选地,所述对所述第一音频数据和字幕数据进行识别处理,生成角色列表和样例音频参数的步骤包括:
[0012]所述服务器从所述字幕数据中提取出字幕时间戳;
[0013]根据所述字幕时间戳,查找出所述第一音频数据出现的时间片段;
[0014]对所述时间片段内的所述第一音频数据进行频谱分析,并进行归类生成角色列表;
[0015]利用语音合成技术,生成与所述角色列表对应的样例音频参数;
[0016]其中,所述电视终端从视频文件中提取出所述第一音频数据和所述字幕数据,并将所述第一音频数据和字幕数据发送至所述服务器。
[0017]优选地,所述利用语音合成技术,生成与所述角色列表对应的样例音频参数的步骤包括:
[0018]针对所述角色列表中的每个角色,从所述字幕数据中提取出预定数量的字幕时间戳;
[0019]通过文本语音引擎,对应所述预定数量的字幕时间戳生成预定数量的样例音频参数,以发至所述电视终端进行预览选择。
[0020]优选地,所述将所述角色列表和样例音频参数发送至所述电视终端,并在接收到所述电视终端根据所述角色列表和样例音频参数反馈的用户设置参数时,将所述第一音频数据合成为第二音频数据的步骤包括:
[0021]将生成的所述角色列表和样例音频参数发送至所述电视终端;
[0022]接收所述电视终端根据所述角色列表和样例音频参数反馈的用户设置参数;
[0023]对所述第一音频数据进行音频过滤,通过文本语音引擎并结合所述用户设置参数,合成与所述角色列表对应的所述第二音频数据;
[0024]其中,所述电视终端接收用户通过用户界面选择的角色列表和样例音频参数,以生成所述用户设置参数,并将所述用户设置参数反馈给所述服务器。
[0025]优选地,所述对所述时间片段内的所述第一音频数据进行频谱分析,并进行归类生成角色列表的步骤包括:
[0026]分别获取第一时间片段和第二时间片段内的第一音频数据;
[0027]判断所述第一时间片段和第二时间片段内的第一音频数据的频谱范围及频谱幅度是否一致;
[0028]若是,则将所述第一时间片段和第二时间片段内的第一音频数据归类为同一角色;
[0029]若否,则将所述第一时间片段和第二时间片段内的第一音频数据归类为不同角色。
[0030]此外,为实现上述目的,本发明还提供一种服务器,所述服务器包括:
[0031]第一接收模块,用于接收电视终端发送的第一音频数据和字幕数据;
[0032]生成处理模块,用于对所述第一音频数据和字幕数据进行识别处理,生成角色列表和样例音频参数;
[0033]合成处理模块,用于将所述角色列表和样例音频参数发送至所述电视终端,并在接收到所述电视终端根据所述角色列表和样例音频参数反馈的用户设置参数时,将所述第一音频数据合成为第二音频数据;
[0034]第一发送模块,用于将所述第二音频数据发送至所述电视终端,以控制所述第二音频数据以及所述字幕数据在所述电视终端进行播放。
[0035]优选地,所述生成处理模块包括:
[0036]获取单元,用于从所述字幕数据中提取出字幕时间戳;
[0037]查找单元,用于根据所述字幕时间戳,查找出所述第一音频数据出现的时间片段;
[0038]归类单元,用于对所述时间片段内的所述第一音频数据进行频谱分析,并进行归类生成角色列表;
[0039]生成单元,用于利用语音合成技术,生成与所述角色列表对应的样例音频参数;
[0040]其中,所述电视终端从视频文件中提取出所述第一音频数据和所述字幕数据,并将所述第一音频数据和字幕数据发送至所述服务器。
[0041]优选地,所述生成单元包括:
[0042]提取子单元,用于针对所述角色列表中的每个角色,从所述字幕数据中提取出预定数量的字幕时间戳;
[0043]生成子单元,用于通过文本语音引擎,对应所述预定数量的字幕时间戳生成预定数量的样例音频参数,以发至所述电视终端进行预览选择。
[0044]优选地,所述合成处理模块包括:
[0045]发送单元,用于将生成的所述角色列表和样例音频参数发送至所述电视终端;
[0046]接收单元,用于接收所述电视终端根据所述角色列表和样例音频参数反馈的用户设置参数;
[0047]合成单元,用于对所述第一音频数据进行音频过滤,通过文本语音引擎并结合所述用户设置参数,合成与所述角色列表对应的所述第二音频数据;
[0048]其中,所述电视终端接收用户通过用户界面选择的角色列表和样例音频参数,以生成所述用户设置参数,并将所述用户设置参数反馈给所述服务器。
[0049]优选地,所述归类单元包括:
[0050]获取子单元,用于分别获取第一时间片段和第二时间片段内的第一音频数据;
[0051]判断子单元,用于判断所述第一时间片段和第二时间片段内的第一音频数据的频谱范围及频谱幅度是否一致;
[0052]第一归类子单元,用于在判断所述第一时间片段和第二时间片段内的第一音频数据的频谱范围及频谱幅度一致时,则将所述第一时间片段和第二时间片段内的第一音频数据归类为同一角色;
[0053]第二归类子单元,用于在判断所述第一时间片段和第二时间片段内的第一音频数据的频谱范围和/或频谱幅度不一致时,则将所述第一时间片段和第二时间片段内的第一音频数据归类为不同角色。
[0054]此外,为实现上述目的,本发明还提供一种电视播放控制系统,所述电视播放控制系统包括电视终端以及如上所述的服务器,所述电视终端包括:
[0055]第二发送模块,用于向服务器发送第一音频数据和字幕数据;
[0056]第二接收模块,用于接收所述服务器对所述第一音频数据和字幕数据进行识别处理后,生成的角色列表和样例音频参数;
[0057]反馈模块,用于根据所述角色列表和样例音频参数生成用户设置参数,并将所述用户设置参数反馈给所述服务器;
[0058]获取模块,用于获取所述服务器在接收到所述用户设置参数时,将所述第一音频数据合成的第二音频数据;
[0059]同步播放模块,用于将所述第二音频数据、视频数据以及字幕数据进行同步播放;
[0060]其中,所述电视终端从视频文件中提取出所述视频数据、所述第一音频数据以及所述字幕数据。
[0061]本发明提供的电视播放控制方法、服务器以及电视播放控制系统,首先通过服务器接收电视终端发送的第一音频数据和字幕数据,并进行识别处理,以生成角色列表和样例音频参数,然后将所述角色列表和样例音频参数发送至所述电视终端,在接收到所述电视终端反馈的用户设置参数时,根据所述用户设置参数将所述第一音频数据合成为第二音频数据,最终将所述第二音频数据发送至所述电视终端,以控制所述第二音频数据以及所述字幕数据在所述电视终端进行播放。这样,可以根据不同用户的语言需求,对应提供可被用户理解的音频,还可以满足用户对人物对白的个性化要求,从而可以避免只能借助字幕来了解人物
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1