字幕处理方法及装置与流程

文档序号:12498882阅读:224来源:国知局
字幕处理方法及装置与流程

本公开涉及终端技术领域,尤其涉及字幕处理方法及装置。



背景技术:

目前,为了满足视觉体验,用户经常会通过不同渠道获取各种各样的视频资源,进而进行观看,但相关技术中的视频资源参差不齐,有的视频有字幕,有的视频没有字幕,而由于用户可能并不了解该视频的音频信息,因而没有字幕的视频常常会给用户带来了很大不便,导致用户看不懂,从而影响用户的观感。



技术实现要素:

本公开实施例提供了字幕处理方法及装置。所述技术方案如下:

根据本公开实施例的第一方面,提供一种字幕处理方法,包括:

接收针对当前视频的字幕获取指令;

根据所述字幕获取指令,确定所述当前视频的目标视频帧,并确定与所述当前视频对应的同步播放的音频中与所述目标视频帧对应的目标音频帧;

获取目标音频片段对应的字幕信息,其中,所述目标音频片段包括所述音频中从所述目标音频帧开始至预设时间段内的音频片段,所述字幕信息包括字幕以及对应的时间戳;

在获取所述目标音频片段对应的字幕信息后,从所述目标视频帧开始自动播放所述当前视频,并按照播放顺序逐步获取所述目标音频片段后续的音频对应的字幕信息,其中,在播放所述当前视频的同时根据时间戳同步显示字幕。

在一个实施例中,所述确定与所述当前视频对应的同步播放的音频中与所述目标视频帧对应的目标音频帧,包括:

根据所述目标视频帧的时间戳,从所述同步播放的音频中确定出所述目标音频帧。

在一个实施例中,所述方法还包括:

在接收到针对所述当前视频的所述字幕获取指令时,暂停播放所述当前视频;

所述确定所述当前视频的目标视频帧,包括:

确定在暂停播放所述当前视频时所定格的视频帧为所述目标视频帧。

在一个实施例中,所述获取目标音频片段对应的字幕信息,包括:

在接收到所述字幕获取指令之后,确定选中的字幕语言;

从本地或网络侧获取预存储的与所述字幕语言匹配的所述目标音频片段对应的字幕信息;

或者

读取所述目标音频片段;

将所述目标音频片段识别为所述字幕语言的字幕信息。

在一个实施例中,所述方法还包括:

在所述根据时间戳同步显示字幕的情况下,当接收到字幕获取停止指令,则中断获取所述字幕信息;

当未接收到所述字幕获取停止指令,则不中断获取所述字幕信息。

在一个实施例中,所述方法还包括:

接收字幕调整指令;

根据所述字幕调整指令,调整所述字幕的显示方式,其中,所述字幕的显示方式包括以下至少一项:

所述字幕在显示屏中的显示位置、所述字幕的字体类型、所述字幕的字体大小、所述字幕的颜色。

根据本公开实施例的第二方面,提供一种字幕处理装置,包括:

第一接收模块,用于接收针对当前视频的字幕获取指令;

确定模块,用于根据所述字幕获取指令,确定所述当前视频的目标视频帧,并确定与所述当前视频对应的同步播放的音频中与所述目标视频帧对应的目标音频帧;

获取模块,用于获取目标音频片段对应的字幕信息,其中,所述目标音频片段包括所述音频中从所述目标音频帧开始至预设时间段内的音频片段,所述字幕信息包括字幕以及对应的时间戳;

第一处理模块,用于在获取所述目标音频片段对应的字幕信息后,从所述目标视频帧开始自动播放所述当前视频,并按照播放顺序逐步获取所述目标音频片段后续的音频对应的字幕信息,其中,在播放所述当前视频的同时根据时间戳同步显示字幕。

在一个实施例中,所述确定模块包括:

第一确定子模块,用于根据所述目标视频帧的时间戳,从所述同步播放的音频中确定出所述目标音频帧。

在一个实施例中,所述装置还包括:

暂停模块,用于在接收到针对所述当前视频的所述字幕获取指令时,暂停播放所述当前视频;

所述确定模块包括:

第二确定子模块,用于确定在暂停播放所述当前视频时所定格的视频帧为所述目标视频帧。

在一个实施例中,所述获取模块包括:

第三确定子模块,用于在接收到所述字幕获取指令之后,确定选中的字幕语言;

获取子模块,用于从本地或网络侧获取预存储的与所述字幕语言匹配的所述目标音频片段对应的字幕信息;

或者

读取子模块,用于读取所述目标音频片段;

识别子模块,用于将所述目标音频片段识别为所述字幕语言的字幕信息。

在一个实施例中,所述装置还包括:

第二处理模块,用于在所述根据时间戳同步显示字幕的情况下,当接收到字幕获取停止指令,则中断获取所述字幕信息;

第三处理模块,用于当未接收到所述字幕获取停止指令,则不中断获取所述字幕信息。

在一个实施例中,所述装置还包括:

第二接收模块,用于接收字幕调整指令;

调整模块,用于根据所述字幕调整指令,调整所述字幕的显示方式,其中,所述字幕的显示方式包括以下至少一项:

所述字幕在显示屏中的显示位置、所述字幕的字体类型、所述字幕的字体大小、所述字幕的颜色。

根据本公开实施例的第三方面,提供了一种字幕处理装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

接收针对当前视频的字幕获取指令;

确定所述当前视频的目标视频帧,并确定与所述当前视频对应的同步播放的音频中与所述目标视频帧对应的目标音频帧;

根据所述字幕获取指令,获取目标音频片段对应的字幕信息,其中,所述目标音频片段包括所述音频中从所述目标音频帧开始至预设时间段内的音频片段,所述字幕信息包括字幕以及对应的时间戳;

在获取所述目标音频片段对应的字幕信息后,从所述目标视频帧开始自动播放所述当前视频,并按照播放顺序逐步获取所述目标音频片段后续的音频对应的字幕信息,其中,在播放所述当前视频的同时根据时间戳同步显示字幕。

本公开的实施例提供的技术方案可以包括以下有益效果:

本公开的实施例提供的技术方案,在接收到字幕获取指令时,说明用户希望为该当前视频添加字幕,因而,可根据字幕获取指令,确定目标视频帧和与目标视频帧对应的目标音频帧,进而获取目标音频片段对应的字幕信息,然后从目标视频帧开始自动播放该当前视频,并按照播放顺序逐步获取该目标音频片段后续的音频对应的字幕信息,且在播放当前视频的同时根据时间戳同步显示字幕,从而实现通过先获取一段字幕,进而在播放该当前视频的过程中逐步获取后续的字幕,使得用户可以观看到能够同步显示字幕的视频,并通过该字幕充分了解该当前视频的内容。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种字幕处理方法的流程图。

图2是根据一示例性实施例示出的另一种字幕处理方法的流程图。

图3A是根据一示例性实施例示出的又一种字幕处理方法的流程图。

图3B是根据一示例性实施例示出的再一种字幕处理方法的流程图。

图4是根据一示例性实施例示出的再一种字幕处理方法的流程图。

图5是根据一示例性实施例示出的再一种字幕处理方法的流程图。

图6是根据一示例性实施例示出的一种字幕处理装置的框图。

图7是根据一示例性实施例示出的另一种字幕处理装置的框图。

图8A是根据一示例性实施例示出的又一种字幕处理装置的框图。

图8B是根据一示例性实施例示出的再一种字幕处理装置的框图。

图9是根据一示例性实施例示出的再一种字幕处理装置的框图。

图10是根据一示例性实施例示出的再一种字幕处理装置的框图。

图11是根据一示例性实施例示出的适用于字幕处理装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

目前,为了满足视觉体验,用户经常会通过不同渠道获取各种各样的视频资源,进而进行观看,但相关技术中的视频资源参差不齐,有的视频有字幕,有的视频没有字幕,而由于用户可能并不了解该视频的音频信息,因而没有字幕的视频常常会给用户带来了很大不便,导致用户看不懂,从而影响用户的观感。

为了解决上述技术问题,本公开实施例提供了一种字幕处理方法,该方法可用于字幕处理程序、系统或装置中,且该方法对应的执行主体可以是能够播放视频的各种终端,如手机、平板电脑、计算机、智能电视等。

图1是根据一示例性实施例示出的一种字幕处理方法的流程图。

如图1所示,该方法包括步骤S101至步骤S104:

在步骤S101中,接收针对当前视频的字幕获取指令;

该当前视频可以是没有字幕的电视剧、电影、综艺视频等。

在步骤S102中,根据字幕获取指令,确定当前视频的目标视频帧,并确定与当前视频对应的同步播放的音频中与目标视频帧对应的目标音频帧;

该当前视频和同步播放的音频的时间戳是相同的。

在步骤S103中,获取目标音频片段对应的字幕信息,其中,目标音频片段包括音频中从目标音频帧开始至预设时间段内的音频片段,字幕信息包括字幕以及对应的时间戳;

其中,字幕对应的时间戳与同步播放的音频和视频的时间戳是相同的,以避免字幕与视频或音频无法同步。

另外,目标音频片段包括音频中从目标音频帧开始至预设时间段内的音频片段表示:如果该目标音频帧对应的时间戳为T0,而预设时间段为t,则目标音频片段为当前视频对应的音频中T0至T0+t这一时间段内的音频片段,其中,预设时间段t可以自由设定,只要能够确保执行主体在从目标视频帧开始自动播放该当前视频时,能够及时地逐步获取目标音频片段后续的音频对应的字幕信息,以实现边播放视频边同步显示字幕即可,例如,该预设时间段可以是30秒等。

在步骤S104中,在获取目标音频片段对应的字幕信息后,从目标视频帧开始自动播放当前视频,并按照播放顺序逐步获取目标音频片段后续的音频对应的字幕信息,其中,在播放当前视频的同时根据时间戳同步显示字幕,而该目标音频片段后续的音频即该目标视频片段之后的视频对应的音频,另外,由于执行主体获取字幕信息需要一定的时间,因而,如果从一开始就边播放视频边获取字幕可能会导致字幕获取不及时,使得字幕无法同步显示在视频上,所以,通过先获取一段目标音频片段对应的字幕信息,再从该目标视频帧开始自动播放该当前视频并按照播放顺序逐步获取后续的音频对应的字幕信息,可以使得执行主体有足够的时间获取后续的字幕信息,进而使得字幕能够同步显示在与音频同步播放的视频上,当然,这也提高了字幕获取效率,使得字幕的获取与视频的播放可以同时进行。

在接收到字幕获取指令时,说明用户希望为该当前视频添加字幕,该当前视频很可能是没有字幕的视频,因而,可根据字幕获取指令,确定目标视频帧和与目标视频帧对应的目标音频帧,进而获取目标音频片段对应的字幕信息,然后从目标视频帧开始自动播放该当前视频,并按照播放顺序逐步自动获取该目标音频片段后续的音频对应的字幕信息,且在播放当前视频的同时根据时间戳同步显示字幕,从而实现通过先获取一段字幕,进而在播放该当前视频的过程中逐步获取后续的字幕,使得用户可以观看到能够同步显示字幕的视频,并通过该字幕充分了解该当前视频的内容。

另外,在按照播放顺序逐步获取完目标音频片段后续的音频对应的字幕信息之后,还可以获取目标音频片段之前的音频对应的字幕信息,从而得到该视频的完整字幕,这样,当该当前视频再次被播放时,在不需要重复获取字幕的基础上,可以直接播放同步显示有字幕的视频,这样也有利于减少执行主体的操作,避免执行主体再次重新获取字幕。

在一个实施例中,上述图1所示的步骤S102中的步骤“确定与当前视频对应的同步播放的音频中与目标视频帧对应的目标音频帧”可被执行为:

根据目标视频帧的时间戳,从同步播放的音频中确定出目标音频帧。

由于当前视频和其音频是同步播放的,因而,当前视频和其音频的时间戳是相同的,所以,根据该目标视频帧的时间戳,可以准确地从同步播放的音频中确定出目标音频帧,例如,当目标视频帧的时间戳为T1,则在获取目标音频帧时,从音频中获取标注有T1时间的音频帧即可。

图2是根据一示例性实施例示出的另一种字幕处理方法的流程图。

如图2所示,在一个实施例中,上述方法还可包括步骤S201:

在步骤S201中,在接收到针对当前视频的字幕获取指令时,暂停播放当前视频;

上述图1所示的步骤S102中的步骤“确定当前视频的目标视频帧”,可以包括步骤A1:

在步骤A1中,确定在暂停播放当前视频时所定格的视频帧为目标视频帧。

在接收到字幕获取指令时,说明用户期望获取字幕,因而,此时,可暂停播放该当前视频,并将暂停播放该当前视频时所定格的那个视频帧确定为目标视频帧,以便于之后可以先获取一段目标音频片段对应的字幕信息,进而在从该目标视频帧开始自动播放该当前视频同时,按照播放顺序逐步获取后续的音频对应的字幕信息,以确保获取到的字幕能够来得及被同步显示在当前视频上,进而使得用户可通过该字幕充分了解该当前视频的内容,以避免给用户带来不便。

图3A是根据一示例性实施例示出的又一种字幕处理方法的流程图。

如图3A所示,在一个实施例中,上述图1所示的步骤S103,即获取目标音频片段对应的字幕信息,可以包括步骤B1和步骤B2:

在步骤B1中,在接收到字幕获取指令之后,确定选中的字幕语言;

在步骤B2中,从本地或网络侧获取预存储的与字幕语言匹配的目标音频片段对应的字幕信息;

在接收到字幕获取指令后,可先确定用户选中的字幕语言,进而如果本地或网络侧预存储有字幕信息,则可从本地或者网络侧获取预存储的与字幕语言匹配的目标音频片段对应的字幕信息,从而使得用户可以自由选择自己期望的字幕语言对应的字幕,进而根据该字幕充分了解该当前视频,这也有利于提高用户的视频观看体验,可以减少用户的视频搜索操作,使用户避免手动查询具有该字幕语言的字幕所对应的当前视频,当然,该目标音频片段之前和后续的音频对应的字幕信息也可采用这种获取方式。

其次,如果该当前视频原来已有字幕(即该当前视频为具有字幕的视频)而该字幕的语言并不符合用户要求,则执行主体也可按照该方式重新获取符合用户需求的字幕语言对应的字幕,同时,执行主体可以使用重新获取的符合用户需求的字幕语言对应的字幕替换该当前视频中原来已有的字幕,或者,在播放该当前视频的同时同步显示这两种语言的字幕。

另外,预先存储在本地或者网络侧(如服务器侧)的字幕信息本身可以携带有时间戳或者未携带时间戳,如果携带有时间戳而该时间戳相对于音频的时间戳滞后或提前,则可对部分音频(如目标音频片段)进行语音识别,得到该部分音频对应的文字信息,进而根据该部分音频对应的文字信息和该部分音频的时间戳,对该字幕信息的时间戳进行修正,从而使得修正后的该字幕的时间戳与音频的时间戳相一致;

而如果未携带时间戳,则可对音频进行语音识别,进而根据该音频的时间戳,为字幕添加相同的时间戳。

或者

图3B是根据一示例性实施例示出的再一种字幕处理方法的流程图。

如图3B所示,在一个实施例中,上述图1所示的步骤S103,即获取目标音频片段对应的字幕信息,可以包括步骤B1、步骤B3和步骤B4:

在步骤B1中,在接收到字幕获取指令之后,确定选中的字幕语言;

其中,如果执行主体为智能电视,则字幕获取指令可以来自用户对智能电视上字幕菜单选项的触发操作,或者来自用户对遥控器上的某个按键或者组合按键的触发操作;

而接收到字幕获取指令之后,可自动显示字幕选择框,进而在接收到用户对字幕选择框中某语言(如中文、英文等)的选中操作时,即可选定选中的字幕语言。

在步骤B3中,读取目标音频片段;

在步骤B4中,将目标音频片段识别为字幕语言的字幕信息。

在接收到字幕获取指令后,可确定用户选中的字幕语言,进而如果本地或网络侧没有预存储字幕信息,则可读取该目标音频片段,进而对该目标音频片段进行语音识别,以将目标音频片段自动识别为字幕语言的字幕信息,从而使得用户可以自由选择自己期望的字幕语言对应的字幕,当然,该目标音频片段之前和后续的音频对应的字幕信息也可采用这种获取方式。

图4是根据一示例性实施例示出的再一种字幕处理方法的流程图。

如图4所示,在一个实施例中,上述方法还可包括步骤S401和步骤S402:

在步骤S401中,在根据时间戳同步显示字幕的情况下,当接收到字幕获取停止指令,则中断获取字幕信息;

另外,如果获取字幕信息时,显示有字幕获取对话框,则接收到该字幕获取停止指令时,该字幕获取对话框就会被关闭。

在步骤S402中,当未接收到字幕获取停止指令,则不中断获取字幕信息。

在根据时间戳同步显示字幕的情况下,当接收到该字幕获取停止指令,说明用户不期望继续获取字幕信息,因而,可中断获取字幕信息,当未接收到字幕获取停止指令,说明用户期望继续获取该字幕信息,因而,可不中断获取字幕信息,直至获取到该当前视频的完整字幕,这样,即便接收到暂停播放该当前视频的指令或者退出该当前视频的指令,也不会中断获取该字幕信息。

图5是根据一示例性实施例示出的再一种字幕处理方法的流程图。

如图5所示,在一个实施例中,上述方法还可包括步骤S501和步骤S502:

在步骤S501中,接收字幕调整指令;

在步骤S502中,根据字幕调整指令,调整字幕的显示方式,其中,字幕的显示方式包括以下至少一项:

字幕在显示屏中的显示位置、字幕的字体类型、字幕的字体大小、字幕的颜色。

在接收到字幕调整指令时,可根据字幕调节指令,调整字幕的显示方式,从而使字幕的显示方式符合用户的个性化要求,例如,当执行主体为智能电视时,用户可以通过遥控器的上/下/左/右键向智能电视发送字幕位置调整指令,这样智能电视在接收到该字幕位置调整指令时,就可根据指令调整字幕在视频中的显示位置。

对应本公开实施例提供的上述字幕处理方法,本公开实施例还提供一种字幕处理装置。

图6是根据一示例性实施例示出的一种字幕处理装置的框图。

如图6所示,该装置包括第一接收模块601、确定模块602、获取模块603和第一处理模块604:

第一接收模块601,被配置为接收针对当前视频的字幕获取指令;

确定模块602,被配置为根据字幕获取指令,确定当前视频的目标视频帧,并确定与当前视频对应的同步播放的音频中与目标视频帧对应的目标音频帧;

获取模块603,被配置为获取目标音频片段对应的字幕信息,其中,目标音频片段包括音频中从目标音频帧开始至预设时间段内的音频片段,字幕信息包括字幕以及对应的时间戳;

第一处理模块604,被配置为在获取目标音频片段对应的字幕信息后,从目标视频帧开始自动播放当前视频,并按照播放顺序逐步获取目标音频片段后续的音频对应的字幕信息,其中,在播放当前视频的同时根据时间戳同步显示字幕。

在接收到字幕获取指令时,说明用户希望为该当前视频添加字幕,该当前视频很可能是没有字幕的视频,因而,可根据字幕获取指令,确定目标视频帧和与目标视频帧对应的目标音频帧,进而获取目标音频片段对应的字幕信息,然后从目标视频帧开始自动播放该当前视频,并按照播放顺序逐步自动获取该目标音频片段后续的音频对应的字幕信息,且在播放当前视频的同时根据时间戳同步显示字幕,从而实现通过先获取一段字幕,进而在播放该当前视频的过程中逐步获取后续的字幕,使得用户可以观看到能够同步显示字幕的视频,并通过该字幕充分了解该当前视频的内容。

在一个实施例中,上述图6所示的确定模块602可以包括第一确定子模块:

第一确定子模块,被配置为根据目标视频帧的时间戳,从同步播放的音频中确定出目标音频帧。

图7是根据一示例性实施例示出的另一种字幕处理装置的框图。

如图7所示,在一个实施例中,上述图6所示的装置还可包括暂停模块701:

暂停模块701,被配置为在接收到针对当前视频的字幕获取指令时,暂停播放当前视频;

上述图6所示的确定模块602可以包括第二确定子模块6021:

第二确定子模块6021,被配置为确定在暂停播放当前视频时所定格的视频帧为目标视频帧。

在接收到字幕获取指令时,说明用户期望获取字幕,因而,此时,可暂停播放该当前视频,并将暂停播放该当前视频时所定格的那个视频帧确定为目标视频帧,以便于之后可以先获取一段目标音频片段对应的字幕信息,进而在从该目标视频帧开始自动播放该当前视频同时,按照播放顺序逐步获取后续的音频对应的字幕信息,以确保获取到的字幕能够来得及被同步显示在当前视频上,进而使得用户可通过该字幕充分了解该当前视频的内容,以避免给用户带来不便。

图8A是根据一示例性实施例示出的又一种字幕处理装置的框图。

如图8A所示,在一个实施例中,上述图6所示的获取模块603可以包括第三确定子模块6031和获取子模块6032:

第三确定子模块6031,被配置为在接收到字幕获取指令之后,确定选中的字幕语言;

获取子模块6032,被配置为从本地或网络侧获取预存储的与字幕语言匹配的目标音频片段对应的字幕信息;

在接收到字幕获取指令后,可先确定用户选中的字幕语言,进而如果本地或网络侧预存储有字幕信息,则可从本地或者网络侧获取预存储的与字幕语言匹配的目标音频片段对应的字幕信息,从而使得用户可以自由选择自己期望的字幕语言对应的字幕,进而根据该字幕充分了解该当前视频,这也有利于提高用户的视频观看体验,可以减少用户的视频搜索操作,使用户避免手动查询具有该字幕语言的字幕所对应的当前视频,当然,该目标音频片段之前和后续的音频对应的字幕信息也可采用这种获取方式。

或者

图8B是根据一示例性实施例示出的再一种字幕处理装置的框图。

如图8B所示,在一个实施例中,上述图6所示的获取模块603可以包括第三确定子模块6031、读取子模块6033和识别子模块6034:

第三确定子模块6031,被配置为在接收到字幕获取指令之后,确定选中的字幕语言;

读取子模块6033,被配置为读取目标音频片段;

识别子模块6034,被配置为将目标音频片段识别为字幕语言的字幕信息。

在接收到字幕获取指令后,可确定用户选中的字幕语言,进而如果本地或网络侧没有预存储字幕信息,则可读取该目标音频片段,进而对该目标音频片段进行语音识别,以将目标音频片段自动识别为字幕语言的字幕信息,从而使得用户可以自由选择自己期望的字幕语言对应的字幕,当然,该目标音频片段之前和后续的音频对应的字幕信息也可采用这种获取方式。

图9是根据一示例性实施例示出的再一种字幕处理装置的框图。

如图9所示,在一个实施例中,上述装置还可包括第二处理模块901和第三处理模块902:

第二处理模块901,被配置为在根据时间戳同步显示字幕的情况下,当接收到字幕获取停止指令,则中断获取字幕信息;

第三处理模块902,被配置为当未接收到字幕获取停止指令,则不中断获取字幕信息。

在根据时间戳同步显示字幕的情况下,当接收到该字幕获取停止指令,说明用户不期望继续获取字幕信息,因而,可中断获取字幕信息,当未接收到字幕获取停止指令,说明用户期望继续获取该字幕信息,因而,可不中断获取字幕信息,直至获取到该当前视频的完整字幕,这样,即便接收到暂停播放该当前视频的指令或者退出该当前视频的指令,也不会中断获取该字幕信息。

图10是根据一示例性实施例示出的再一种字幕处理装置的框图。

如图10所示,在一个实施例中,在一个实施例中,装置还可包括第二接收模块1001和调整模块1002:

第二接收模块1001,被配置为接收字幕调整指令;

调整模块1002,被配置为根据字幕调整指令,调整字幕的显示方式,其中,字幕的显示方式包括以下至少一项:

字幕在显示屏中的显示位置、字幕的字体类型、字幕的字体大小、字幕的颜色。

在接收到字幕调整指令时,可根据字幕调节指令,调整字幕的显示方式,从而使字幕的显示方式符合用户的个性化要求,例如,当执行主体为智能电视时,用户可以通过遥控器的上/下/左/右键向智能电视发送字幕位置调整指令,这样智能电视在接收到该字幕位置调整指令时,就可根据指令调整字幕在视频中的显示位置。

根据本公开实施例的第三方面,提供一种字幕处理装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,处理器被配置为:

接收针对当前视频的字幕获取指令;

根据所述字幕获取指令,确定所述当前视频的目标视频帧,并确定与所述当前视频对应的同步播放的音频中与所述目标视频帧对应的目标音频帧;

获取目标音频片段对应的字幕信息,其中,所述目标音频片段包括所述音频中从所述目标音频帧开始至预设时间段内的音频片段,所述字幕信息包括字幕以及对应的时间戳;

在获取所述目标音频片段对应的字幕信息后,从所述目标视频帧开始自动播放所述当前视频,并按照播放顺序逐步获取所述目标音频片段后续的音频对应的字幕信息,其中,在播放所述当前视频的同时根据时间戳同步显示字幕。

上述处理器还可被配置为:

所述确定与所述当前视频对应的同步播放的音频中与所述目标视频帧对应的目标音频帧,包括:

根据所述目标视频帧的时间戳,从所述同步播放的音频中确定出所述目标音频帧。

上述处理器还可被配置为:

所述方法还包括:

在接收到针对所述当前视频的所述字幕获取指令时,暂停播放所述当前视频;

所述确定所述当前视频的目标视频帧,包括:

确定在暂停播放所述当前视频时所定格的视频帧为所述目标视频帧。

上述处理器还可被配置为:

所述获取目标音频片段对应的字幕信息,包括:

在接收到所述字幕获取指令之后,确定选中的字幕语言;

从本地或网络侧获取预存储的与所述字幕语言匹配的所述目标音频片段对应的字幕信息;

或者

读取所述目标音频片段;

将所述目标音频片段识别为所述字幕语言的字幕信息。

上述处理器还可被配置为:

所述方法还包括:

在所述根据时间戳同步显示字幕的情况下,当接收到字幕获取停止指令,则中断获取所述字幕信息;

当未接收到所述字幕获取停止指令,则不中断获取所述字幕信息。

上述处理器还可被配置为:

所述方法还包括:

接收字幕调整指令;

根据所述字幕调整指令,调整所述字幕的显示方式,其中,所述字幕的显示方式包括以下至少一项:

所述字幕在显示屏中的显示位置、所述字幕的字体类型、所述字幕的字体大小、所述字幕的颜色。

图11是根据一示例性实施例示出的一种用于字幕处理装置1100的框图,该装置适用于终端设备。例如,装置1100可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个用户数字助理等。

参照图11,装置1100可以包括以下一个或至少两个组件:处理组件1102,存储器1104,电源组件1106,多媒体组件1108,音频组件1110,输入/输出(I/O)接口1112,传感器组件1114,以及通信组件1116。

处理组件1102通常控制装置1100的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件1102可以包括一个或至少两个处理器1120来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1102可以包括一个或至少两个模块,便于处理组件1102和其他组件之间的交互。例如,处理组件1102可以包括多媒体模块,以方便多媒体组件1108和处理组件1102之间的交互。

存储器1104被配置为存储各种类型的数据以支持在装置1100的操作。这些数据的示例包括用于在装置1100上操作的任何存储对象或方法的指令,联系用户数据,电话簿数据,消息,图片,视频等。存储器1104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电源组件1106为装置1100的各种组件提供电源。电源组件1106可以包括电源管理系统,一个或至少两个电源,及其他与为装置1100生成、管理和分配电源相关联的组件。

多媒体组件1108包括在所述装置1100和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或至少两个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1108包括一个前置摄像头和/或后置摄像头。当装置1100处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1110被配置为输出和/或输入音频信号。例如,音频组件1110包括一个麦克风(MIC),当装置1100处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1104或经由通信组件1116发送。在一些实施例中,音频组件1110还包括一个扬声器,用于输出音频信号。

I/O接口1112为处理组件1102和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1114包括一个或至少两个传感器,用于为装置1100提供各个方面的状态评估。例如,传感器组件1114可以检测到装置1100的打开/关闭状态,组件的相对定位,例如所述组件为装置1100的显示器和小键盘,传感器组件1114还可以检测装置1100或装置1100一个组件的位置改变,用户与装置1100接触的存在或不存在,装置1100方位或加速/减速和装置1100的温度变化。传感器组件1114可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1114还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1114还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件1116被配置为便于装置1100和其他设备之间有线或无线方式的通信。装置1100可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件1116经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件1116还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

在示例性实施例中,装置1100可以被一个或至少两个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子组件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1104,上述指令可由装置1100的处理器1120执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由上述装置1100的处理器执行时,使得上述装置1100能够执行一种字幕处理方法,包括:

接收针对当前视频的字幕获取指令;

根据所述字幕获取指令,确定所述当前视频的目标视频帧,并确定与所述当前视频对应的同步播放的音频中与所述目标视频帧对应的目标音频帧;

获取目标音频片段对应的字幕信息,其中,所述目标音频片段包括所述音频中从所述目标音频帧开始至预设时间段内的音频片段,所述字幕信息包括字幕以及对应的时间戳;

在获取所述目标音频片段对应的字幕信息后,从所述目标视频帧开始自动播放所述当前视频,并按照播放顺序逐步获取所述目标音频片段后续的音频对应的字幕信息,其中,在播放所述当前视频的同时根据时间戳同步显示字幕。

在一个实施例中,所述确定与所述当前视频对应的同步播放的音频中与所述目标视频帧对应的目标音频帧,包括:

根据所述目标视频帧的时间戳,从所述同步播放的音频中确定出所述目标音频帧。

在一个实施例中,所述方法还包括:

在接收到针对所述当前视频的所述字幕获取指令时,暂停播放所述当前视频;

所述确定所述当前视频的目标视频帧,包括:

确定在暂停播放所述当前视频时所定格的视频帧为所述目标视频帧。

在一个实施例中,所述获取目标音频片段对应的字幕信息,包括:

在接收到所述字幕获取指令之后,确定选中的字幕语言;

从本地或网络侧获取预存储的与所述字幕语言匹配的所述目标音频片段对应的字幕信息;

或者

读取所述目标音频片段;

将所述目标音频片段识别为所述字幕语言的字幕信息。

在一个实施例中,所述方法还包括:

在所述根据时间戳同步显示字幕的情况下,当接收到字幕获取停止指令,则中断获取所述字幕信息;

当未接收到所述字幕获取停止指令,则不中断获取所述字幕信息。

在一个实施例中,所述方法还包括:

接收字幕调整指令;

根据所述字幕调整指令,调整所述字幕的显示方式,其中,所述字幕的显示方式包括以下至少一项:

所述字幕在显示屏中的显示位置、所述字幕的字体类型、所述字幕的字体大小、所述字幕的颜色。

本领域技术用户员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1