一种字幕加载方法及装置制造方法

文档序号：7979558阅读：136来源：国知局

一种字幕加载方法及装置制造方法
【专利摘要】本发明提供了一种字幕加载方法及装置，应用于电子设备，所述方法包括：接收字幕显示指令，依据所述字幕显示指令，获取与所述视频对应的字幕，并将所述字幕以预设的方式加载到所述视频中。所述方法使得视频字幕的加载过程可以在视频播放的同时进行，并且加载字幕无需再进行人工识别或查找，更不会涉及到专业的字幕加载技术，从而提高了字幕加载的效率。
【专利说明】一种字幕加载方法及装置
【技术领域】
[0001]本发明涉及计算机领域，尤其涉及一种字幕加载方法及装置。
【背景技术】
[0002]视频中字幕的加载可以大大扩展视频的观众，例如，中文视频中加载上英文字幕，使用英文的人群也可以观看，或者，在没有字幕的视频中加载上字幕，则聋哑人也可以进行观看并很好地理解其内容。
[0003]但是现有的视频字幕加载方法往往需要专业的软件和专业的技术知识才能够实现，并且现有的字幕加载一般在单独的终端进行，只能人工对其视频内容进行识别或查找，而无法实现字幕的快速加载，因此，现有的字幕加载方法存在实施效率低的问题。

【发明内容】

[0004]有鉴于此，本发明提供了一种字幕加载方法及装置，目的在于解决现有的字幕加载方法实施效率低的问题。
[0005]为了实现上述目的，本发明实施例提供了以下技术方案:
[0006]—种字幕加载方法，应用于电子设备，包括:
[0007]接收字幕显示指令；
[0008]依据所述字幕显示指令，获取与所述视频对应的字幕；
[0009]将所述字幕以预设的方式加载到所述视频中。
[0010]优选地，所述获取与所述视频对应的字幕包括:
[0011]将所述视频中的语音转化为字幕。
[0012]优选地，所述将所述视频中的语音转化为字幕包括:
[0013]向用户播放所述视频；
[0014]识别当前播放的视频中的语音；
[0015]将识别结果生成字幕。
[0016]优选地，所述将所述视频中的语音转化为字幕包括:
[0017]分两路播放所述视频，其中第一路播放向用户显示，第二路播放不向用户显示，且所述第一路播放比所述第二路播放延迟预设的时间，所述预设的时间大于识别所述第二路视频中的语音并生成字幕的时间；
[0018]识别所述第二路播放的视频中的语音；
[0019]将识别结果生成字幕，并将所述字幕作为所述第一路播放的视频中的字幕。
[0020]优选地，所述获取与所述视频对应的字幕包括:
[0021]从预设的数据库中查找与所述视频对应的字幕。
[0022]优选地，所述预设的数据库包括:
[0023]与所述电子设备通过网络相连的服务器中的数据库；或者，
[0024]所述电子设备中存储的据库；或者，[0025]与所述电子设备通过网络相连的服务器中的数据库和所述电子设备中存储的数据库。
[0026]优选地，当所述数据库包括与所述电子设备通过网络相连的服务器中的数据库和所述电子设备中存储的数据库时，所述从预设的数据库中查找与所述视频对应的字幕包括:
[0027]搜索所述电子设备中存储的数据库；
[0028]如果没有搜索到与所述视频对应的字幕，则搜索与所述电子设备通过网络相连的服务器中的数据库。
[0029]优选地，如果没有查找到与所述视频对应的字幕，还包括:
[0030]将所述视频中的语音转换为字幕。
[0031]优选地，在将所述字幕以预设的方式加载到所述视频中之前，还包括:
[0032]判断所述字幕是否满足预设的条件；
[0033]如果所述字幕不满足预设的条件，则将所述字幕进行转换，使其满足所述预设的条件。
[0034]优选地，所述预设的条件包括:
[0035]字幕为预设的第一语言。
[0036]优选地，当所述字幕不是预设的第一语言时，所述将所述字幕进行转换包括:
[0037]将所述字幕翻译为预设的第一语言。
[0038]优选地，还包括:
[0039]将所述字幕存储到所述预设的数据库中。
[0040]一种字幕加载装置，包括:
[0041]接收模块，用于接收字幕显示指令；
[0042]获取模块，用于依据所述字幕显示指令，获取与所述视频对应的字幕；
[0043]字幕加载模块，用于将所述字幕以预设的方式加载到所述视频中。
[0044]优选地，所述获取模块包括:
[0045]语音转换单元，用于将所述视频中的语音转换为字幕；或者，
[0046]查找单元，用于从预设的数据库中查找与所述视频对应的字幕；或者，
[0047]所述语音转换单元和所述查找单元。
[0048]优选地,所述语音转换单元包括:
[0049]第一播放子单元，用于向用户播放所述视频；
[0050]第一识别子单元，用于识别当前播放的视频中的语音；
[0051]第一字幕生成子单元，用于将识别结果生成字幕。
[0052]优选地,所述语音转换单元包括:
[0053]第二播放子单元，用于分两路播放所述视频，其中第一路播放向用户显示，第二路播放不向用户显示，且所述第一路播放比所述第二路播放延迟预设的时间，所述预设的时间大于识别所述第二路视频中的语音并生成字幕的时间；
[0054]第二识别子单元，用于识别所述第二路播放的视频中的语音；
[0055]第二字幕生成子单元，用于并识别结果生成字幕，并将所述字幕作为所述第一路播放的视频中的字幕。[0056]优选地,所述查找单元包括:
[0057]预设的数据库，用于存储与所述视频对应的字幕；
[0058]查找子单元，用于从所述预设的数据库中查找与所述视频对应的字幕。
[0059]第一判断子单元，用于判断是否查找到与所述视频对应的字幕；
[0060]触发子单元，用于如果没有查找到与所述视频对应的字幕，触发所述语音转换单
J Li ο
[0061]优选地，所述获取模块还包括:
[0062]第二判断单元，用于判断所述字幕是否满足预设的条件；
[0063]翻译单元，用于如果所述字幕不满足预设的条件，则将所述字幕进行转换，使其满足所述预设的条件。
[0064]优选地，还包括:
[0065]存储子单元，用于将所述字幕存储到所述预设的数据库中。
[0066]本发明实施例提供的字幕加载方法及装置，能够依据接收的字幕显示指令，获取与所述视频对应的字幕，并将以预设的方法将所述字幕加载到视频中，从而使得视频字幕的加载过程可以在视频播放的同时进行，并且加载字幕无需再进行人工识别或查找，更不会涉及到专业的字幕加载技术，从而提高了字幕加载的效率。
【专利附图】

【附图说明】
[0067]为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0068]图1为本发明实施例公开的一种字幕加载方法的流程图；
[0069]图2为本发明实施例公开的又一种字幕加载方法的流程图；
[0070]图3为本发明实施例公开的一种字幕加载装置的结构示意图。
【具体实施方式】
[0071]本发明公开了一种字幕加载方法及装置，其核心发明点在于，接收字幕显示指令，依据所述字幕显示指令，获取与所述视频对应的字幕，将所述字幕以预设的方式加载到所述视频中，从而使得字幕加载不必依赖于人为操作及专业知识，并且能够实现播放的同时实时加载字幕，提高了字幕加载的普及率及实施效率。
[0072]下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0073]本发明实施例公开的一种字幕加载方法，其应用场景为:电子设备播放视频，但视频中缺少字幕的情况，如图1所示，所述方法包括:
[0074]SlOl:接收字幕显示指令；
[0075]S102:依据所述字幕显示指令，将所述视频中的语音转化为字幕；[0076]本实施例中，包括但并不限于两种将语音转化为字幕的方法，第一种方法为:边向用户播放视频边进行语音识别，包括以下步骤:
[0077]向用户播放视频；
[0078]识别当前播放的视频中的语音；(将识别结果生成字幕加载到当前帧中。
[0079]上述方法简单易行且占用较小的内存资源即可实现，但在实际应用中，上述方法生成的字幕与播放的视频相比，可能会出现时延，从而造成字幕显示跟不上视频播放的问题，为了解决此问题，可以采用第二种方法。
[0080]第二种方法包括:分两路播放所述视频，其中第一路播放向用户显示，第二路播放不向用户显示，且所述第一路播放比所述第二路播放延迟预设的时间，所述预设的时间大于识别所述第二路视频中的语音并依据识别结果生成字幕的时间；
[0081]识别所述第二路播放的视频中的语音；
[0082]将识别结果生成字幕，并将所述字幕作为所述第一路播放的视频中的字幕。
[0083]也就是说，向用户播放视频的同时，在后台也播放所述视频，后台播放视频的进度要快于向用户显示的播放，并且，后台播放的快于前台的播放进度要大于后台识别语音并生成字幕的时间，才能保证有足够的识别时间，从而实现提供给用户的字幕能够与向用户展示的视频同步的目的。
[0084]S103:判断所述字幕是否满足预设的条件；
[0085]其中，预设的条件可以为规定字幕所使用的语言的条件，例如，预设的条件为字幕为中文。预设的条件可以包含在字幕显示指令中，也可以由用户在获取字幕时设置，本实施例不做限定。
[0086]S104:如果所述字幕不满足预设的条件，则将所述字幕进行转换，使其满足预设的条件，并执行S105 ；
[0087]例如，当预设的条件规定字幕用英文显示，而语音识别获取的字幕为中文时，则将中文字幕翻译为英文字幕。
[0088]S105:当所述字幕满足预设的条件时，将所述字幕以预设的方式加载到所述视频中。
[0089]这里预设的方法可以由用户自定义设置，可以包括字幕加载到视频中的位置、字幕的字体大小、颜色等。
[0090]本实施例所述的字幕加载方法，通过识别视频中的语音，将语音转换为字幕文件，从而获得与视频对应的字幕，并将所述字幕加载到视频中，所述方法与现有的字幕设置方法相比，能够在视频播放的同时实现字幕的自动加载，既不需要单独制作字幕，也不需要过多的人为干预，提高了字幕加载的效率。
[0091]本发明实施例公开了又一种字幕加载方法，应用于电子，所述电子设备在播放视频时，视频中缺少字幕，所述方法如图2所示，包括:
[0092]S201:接收字幕显示指令；
[0093]S202:依据所述字幕显示指令，从预设的数据库中查找与所述视频对应的字幕。
[0094]具体的查找方法可以为:根据视频的名称等视频的标识，查找到与视频对应的字幕，并且可以在播放视频的同时，获取视频当前的播放时间，依据所述播放时间查找字幕，只将此时间点后的字幕加载到视频中。[0095]其中，预设的数据库可以为与所述电子设备通过网络相连的服务器中的数据库，或者，所述电子设备中存储的据库，或者，与所述电子设备通过网络相连的服务器中的数据库和所述电子设备中存储的据库。本实施例中，优选数据库为与所述电子设备通过网络相连的服务器中的数据库和所述电子设备中存储的据库。可以先搜索所述电子设备中存储的据库，如果找到与所述视频对应的字幕文件，返回所述字幕文件，如果没有找到，则搜索与电子设备通过网络相连的服务器中的数据库。
[0096]S203:判断是否查找到与所述视频对应的字幕，如果是，则执行S205，如果没有找到，则执行S204 ；
[0097]S204:将所述视频中的语音转换为字幕；
[0098]其中，转换方法与上述实施例中所述的方法相同，这里不再赘述。
[0099]S205:判断所述字幕是否为预设第一语言，如果所述字幕为预设第一语言，则执行S207，如果所述字幕不是预设的第一语言，则执行S206 ；
[0100]S206:将所述字幕翻译为第一语言；
[0101]S207:将所述字幕以预设的方式加载到所述视频中，并将所述字幕存储到所述预设的数据库中，以便于再播放此视频时，可以快速查找到与之对应的字幕，而不必再进行语音识别。
[0102]需要说明的是，本实施例中所述与所述视频对应的字幕可以为字幕文件，将字幕加载到视频中时，通常，字幕文件中包括了字幕文本及与每段字幕文本对应的时间值，因此，可以根据每段字幕文本对应的时间值，将字幕文本依次载入视频中。
[0103]本实施例所述的字幕加载方法，先从预设的数据库中搜索字幕，如果搜索不到，则对视频进行语音识别从而生成字幕，保证了字幕的获取，提高了字幕加载的效率。
[0104]与上述方法实施例相对应的，本发明实施例还公开了一种字幕加载装置，可以设置于电子设备中，如图3所示，包括:
[0105]接收模块301，用于接收字幕显示指令；
[0106]获取模块302，用于依据所述字幕显示指令，获取与所述视频对应的字幕；
[0107]字幕加载模块303，用于将所述字幕以预设的方式加载到所述视频中。
[0108]其中，获取模块中可以进一步包括:语音转换单元，用于将所述视频中的语音转换为字幕；或者，查找单元，用于从预设的数据库中查找与所述视频对应的字幕；或者，用于将所述视频中的语音转换为字幕的语音转换单元和用于从预设的数据库中查找与所述视频对应的字幕的查找单元。
[0109]下面以获取单元包括语音转换单元和查找单元为例，对字幕加载装置加载字幕的过程进行说明:接收单元接收到字幕显示指令后，语音转换单元将视频中的语音转换为字幕，并将字幕加载到视频中，字幕加载过程结束；或者，接收单元接收到字幕显示指令后，查找单元在预设的数据库中查找与视频对应的字幕，如果找到，则将字幕加载到视频中，字幕加载过程结束，如果没有找到，则语音转换单元再将视频中的语音转换为字幕，并将所述字幕加载到所述视频中。也就是说，所述装置中的获取模块中的语音转换单元可以单独作为字幕获取核心设备使用，也可以与查找单元配合使用，当查找单元从预设的数据库中找不到字幕时，语音转换单元再生成字幕。
[0110]进一步地，语音转换单元可以具体包括:[0111]第一播放子单元，用于向用户播放所述视频；
[0112]第一识别子单元，用于识别当前播放的视频帧中的语音；
[0113]第一字幕生成子单元，用于将识别结果生成字幕。
[0114]或者,语音转换单元可以具体包括:
[0115]第二播放子单元，用于分两路播放所述视频，其中第一路播放向用户显示，第二路播放不向用户显示，且所述第一路播放比所述第二路播放延迟预设的时间，所述预设的时间大于识别所述第二路视频中的语音并生成字幕的时间；
[0116]第二识别子单元，用于识别所述第二路播放的视频中的语音；
[0117]第二字幕生成子单元，用于将识别结果生成字幕，并将所述字幕作为所述第一路播放的视频中的字幕。
[0118]上述两种不同的语音转换单元，前一种具有占用内存等资源较少的优点，但是生成的字幕可能会出现与视频播放不同步的问题，尤其在需要进行字幕翻译时，不同步的问题可能更加明显，而后一种虽然因为两路播放占用的资源较多，但是可以很好地保持字幕与视频播放间的同步性，实际应用中，可以根据不同的需求进行选择，这里不再赘述。
[0119]进一步地，所述查找单元可以具体包括:
[0120]预设的数据库，用于存储与所述视频对应的字幕；
[0121]查找子单元，用于从所述预设的数据库中查找与所述视频对应的字幕。
[0122]第一判断子单元，用于判断是否查找到与所述视频对应的字幕；
[0123]触发子单元，用于如果没有查找到与所述视频对应的字幕，触发所述语音转换单元;
[0124]存储子单元，用于将所述字幕存储到所述预设的数据库中。需要说明的是，既可以将所述字幕存储到电子设备中的数据库中，也可以将所述字幕存储到与电子设备相连的网络服务器中的数据库中。
[0125]如上述实施例所述，预设的数据库可以包括电子设备中存储的数据库和与电子设备通过网络相连的服务器中的数据库，查找子单元可以先查找电子设备中存储的数据库，如果没有找到，再查找与电子设备通过网络相连的服务器中的数据库，并返回查找结果，如果第一判断子单元判断出在预设的数据库中没有找到与视频对应的字幕，那么触发子单元则触发语音转换单元通过语音识别输出字幕。同时，存储子单元将语音识别输出的字幕存储在预设的数据库中，优选地，可以存储在电子设备中的数据库中，以便于再次播放视频时可以快速查找到与其对应的字幕。
[0126]进一步地，本实例所述的装置还可以包括:
[0127]第二判断单元，用于判断所述字幕是否满足预设的条件；
[0128]翻译单元，用于如果所述字幕不满足预设的条件，则将所述字幕进行转换，使其满足所述预设的条件。
[0129]本实施所述的字幕加载装置，包括从预设的数据库中查找到字幕和/或通过识别视频的语音进而生成字幕的获取模块，保证了视频能够快速实时地获取字幕，提高了字幕的获取效率。
[0130]本实施例所述的字幕加载装置，可以设置于电子设备中，使得所述电子设备在播放缺少字幕的视频时，能够在播放的同时获取字幕，并将字幕加载到视频中，所述电子设备可以具体为移动通信终端、个人电脑等，本实施例中不做限定。需要说明的是，具体到电子设备中，所述装置可以设置在处理器中，所述处理器可以单独设置，也可以与电子设备用于实现其他功能的处理集成设置。
[0131]本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。
[0132]对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
[0133]本实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算设备可读取存储介质中。基于这样的理解，本发明实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一台计算设备(可以是个人计算机，服务器，移动计算设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM, Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
【权利要求】
1.一种字幕加载方法，应用于电子设备，其特征在于，包括: 接收字幕显示指令；依据所述字幕显示指令，获取与所述视频对应的字幕；将所述字幕以预设的方式加载到所述视频中。
2.根据权利要求1所述的方法，其特征在于，所述获取与所述视频对应的字幕包括: 将所述视频中的语音转化为字幕。
3.根据权利要求2所述的方法，其特征在于，所述将所述视频中的语音转化为字幕包括: 向用户播放所述视频；识别当前播放的视频中的语音；将识别结果生成字幕。
4.根据权利要求2所述的方法，其特征在于，所述将所述视频中的语音转化为字幕包括: 分两路播放所述视频，其中第一路播放向用户显示，第二路播放不向用户显示，且所述第一路播放比所述第二路播放延迟预设的时间，所述预设的时间大于识别所述第二路视频中语音并生成字幕的时间；` 识别所述第二路播放的视频中的语音；将识别结果生成字幕，并将所述字幕作为所述第一路播放的视频中的字幕。
5.根据权利要求1所述的方法，其特征在于，所述获取与所述视频对应的字幕包括: 从预设的数据库中查找与所述视频对应的字幕。
6.根据权利要求5所述的方法，其特征在于，所述预设的数据库包括: 与所述电子设备通过网络相连的服务器中的数据库；或者，所述电子设备中存储的据库；或者，与所述电子设备通过网络相连的服务器中的数据库和所述电子设备中存储的数据库。
7.根据权利要求6所述的方法，其特征在于，当所述数据库包括与所述电子设备通过网络相连的服务器中的数据库和所述电子设备中存储的数据库时，所述从预设的数据库中查找与所述视频对应的字幕包括: 搜索所述电子设备中存储的数据库；如果没有搜索到与所述视频对应的字幕，则搜索与所述电子设备通过网络相连的服务器中的数据库。
8.根据权利要求7所述的方法，其特征在于，如果没有查找到与所述视频对应的字幕，还包括: 将所述视频中的语音转换为字幕。
9.根据权利要求1至8任一项所述的方法，其特征在于，在将所述字幕以预设的方式加载到所述视频中之前，还包括: 判断所述字幕是否满足预设的条件；如果所述字幕不满足预设的条件，则将所述字幕进行转换，使其满足所述预设的条件。
10.根据权利要求9所述的方法，其特征在于，所述预设的条件包括: 字幕为预设的第一语言。
11.根据权利要求10所述的方法，其特征在于，当所述字幕不是预设的第一语言时，所述将所述字幕进行转换包括: 将所述字幕翻译为预设的第一语言。
12.根据权利要求5所述的方法，其特征在于，还包括: 将所述字幕存储到所述预设的数据库中。
13.一种字幕加载装置，其特征在于，包括: 接收模块，用于接收字幕显示指令；获取模块，用于依据所述字幕显示指令，获取与所述视频对应的字幕；字幕加载模块，用于将所述字幕以预设的方式加载到所述视频中。
14.根据权利要求13所述的装置，其特征在于，所述获取模块包括: 语音转换单元，用于将所述视频中的语音转换为字幕；或者，查找单元，用于从预设的数据库中查找与所述视频对应的字幕；或者，所述语音转换单元和所述查找单元。
15.根据权利要求14所述的装置，其特征在于，所述语音转换单元包括: 第一播放子单元，用于向用户播放所述视频；第一识别子单元，用于识别当前播放的视频中的语音；第一字幕生成子单元，用于将识别结果生成字幕。
16.根据权利要求14所述的装置，其特征在于，所述语音转换单元包括: 第二播放子单元，用于分两路播放所述视频，其中第一路播放向用户显示，第二路播放不向用户显示，且所述第一路播放比所述第二路播放延迟预设的时间，所述预设的时间大于识别所述第二路视频中的语音并生成字幕的时间；第二识别子单元，用于识别所述第二路播放的视频中的语音；第二字幕生成子单元，用于并识别结果生成字幕，并将所述字幕作为所述第一路播放的视频中的字幕。
17.根据权利要求14所述的装置，其特征在于，所述查找单元包括: 预设的数据库，用于存储与所述视频对应的字幕；查找子单元，用于从所述预设的数据库中查找与所述视频对应的字幕；第一判断子单元，用于判断是否查找到与所述视频对应的字幕；触发子单元，用于如果没有查找到与所述视频对应的字幕，触发所述语音转换单元。
18.根据权利要求14至17任一项所述的装置，其特征在于，所述获取模块还包括: 第二判断单元，用于判断所述字幕是否满足预设的条件；翻译单元，用于如果所述字幕不满足预设的条件，则将所述字幕进行转换，使其满足所述预设的条件。
19.根据权利要求17所述的装置，其特征在于，还包括:存储子单元，用于将所述字幕存储到所述预设的数据库中。
【文档编号】H04N21/85GK103458321SQ201210181900
【公开日】2013年12月18日申请日期:2012年6月4日优先权日:2012年6月4日
【发明者】张磊申请人:联想(北京)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张磊
技术所有人：联想（北京）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。