多语言字幕显示方法、装置、终端设备及存储介质与流程

文档序号:22478902发布日期:2020-10-09 22:24阅读:78来源:国知局
多语言字幕显示方法、装置、终端设备及存储介质与流程
本发明涉及视频字幕处理领域,尤其涉及一种多语言字幕显示方法、装置、终端设备及存储介质。
背景技术
:视频播放通常需要伴随同步字幕,以便于用户看听结合,实现对视频内容的充分理解。不同语言的用户有不同的字幕语言需求,但一般视频自带的字幕语言只有一种或两种,不可能满足所有用户的需求。为了满足用户的不同字幕语言需求,现有技术中,使用预先在场消隐期数据中加入多种语言的字幕组数据的方法提供给用户进行选择,但由于视频中的场消隐期数据空间较小,在场消隐期数据中能添加的字幕语言种类依然较少,无法支持更全面的多种语言字幕显示。上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。技术实现要素:本发明的主要目的在于提供一种多语言字幕显示方法、装置、终端设备及存储介质,旨在解决视频播放中无法支持更全面的多种语言字幕显示的技术问题。为实现上述目的,本发明提供一种多语言字幕显示方法,所述多语言字幕显示方法用于多媒体终端设备;所述多语言字幕显示方法包括以下步骤:接收字幕语言显示命令;基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备,以使所述语言转换设备将所述第一语言字幕数据转换为与所述字幕语言显示命令对应的第二语言字幕数据;接收所述语言转换设备传输的所述第二语言字幕数据;基于所述第二语言字幕数据,显示第二语言字幕。可选地,所述多媒体终端设备存储有场消隐期数据,所述场消隐期数据中包括所述第一语言字幕数据;所述基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备的步骤包括:基于所述字幕语言显示命令,将所述场消隐期数据中的所述第一语言字幕数据发送给语言转换设备。可选地,所述接收字幕语言显示命令的步骤之前,所述方法还包括:获取当前视频帧对应的第一语言字幕数据;将所述第一语言字幕数据添加到所述场消隐期数据中。可选地,所述基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备的步骤,包括:基于所述字幕语言显示命令,判断所述第一语言字幕数据对应的第一字幕语言种类是否与所述字幕语言显示命令要求显示的第二字幕语言种类一致;若否,执行将当前视频帧对应的第一语言字幕数据发送给语言转换设备。可选地,所述当前视频帧对应视频具有最大字幕延迟时间;将所述第一语言字幕数据发送给语言转换设备至接收到所述语言转换设备传输的所述第二语言字幕数据所用的延迟时间小于所述最大字幕延迟时间。可选地,所述当前视频帧对应视频的分辨率为8k,所述多媒体终端的显示分辨率为8k。此外,为实现上述目的,本发明还提供一种多语言字幕显示装置,所述多语言字幕显示装置用于多媒体终端设备;所述多语言字幕显示装置包括:命令接收模块,用于接收字幕语言显示命令;字幕转换模块,用于基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备,以使所述语言转换设备将所述第一语言字幕数据转换为与所述字幕语言显示命令对应的第二语言字幕数据;字幕接收模块,用于接收所述语言转换设备传输的所述第二语言字幕数据;字幕显示模块,用于基于所述第二语言字幕数据,显示第二语言字幕。此外,为实现上述目的,本发明还提出一种多媒体终端设备,所述多媒体终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的多语言字幕显示程序,所述多语言字幕显示程序配置为实现如上文所述的多语言字幕显示方法的步骤。此外,为实现上述目的,本发明还提出一种8k多媒体终端设备,所述多媒体终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的多语言字幕显示程序,所述多语言字幕显示程序配置为实现如上文所述的多语言字幕显示方法的步骤。此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有多语言字幕显示程序,所述多语言字幕显示程序被处理器执行时实现如上文所述的多语言字幕显示方法的步骤。本发明所能实现的有益效果。本发明实施例提出的一种多语言字幕显示方法、装置、终端设备及存储介质,通过接收字幕语言显示命令;然后基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备,以使所述语言转换设备将所述第一语言字幕数据转换为与所述字幕语言显示命令对应的第二语言字幕数据;接收所述语言转换设备传输的所述第二语言字幕数据;基于所述第二语言字幕数据,显示第二语言字幕。由此可见,由于实时获取第一语言字幕数据,并将第一语言字幕数据发送给语言转换设备进行语言转换后再返回进行显示,不需要对多种语言对应的字幕数据进行本地储存,而通过与语言转换设备的交互,可以实现任意语言的转换,从而实现了支持全面的多种语言字幕显示。附图说明图1为本发明多语言字幕显示方法一实施例的流程示意图;图2为本发明多语言字幕显示装置一实施例的功能模块示意图;图3为本发明实施例中一种多媒体终端设备示意图;图4为本发明实施例中一种8k多媒体终端设备示意图。本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。本发明实施例的主要解决方案是:接收字幕语言显示命令;基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备,以使所述语言转换设备将所述第一语言字幕数据转换为与所述字幕语言显示命令对应的第二语言字幕数据;接收所述语言转换设备传输的所述第二语言字幕数据;基于所述第二语言字幕数据,显示第二语言字幕。由于现有技术为了实现在视频播放时支持多语言的字幕显示,一种方案是在场消隐期数据中加入多种语言的字幕组数据提供给用户进行选择,以在视频播放时根据选择显示所加入的语言种类。这种方式大大增加了字幕所耗费的空间,而且由于普通的视频中没有太多的场消隐期数据空间,这样就导致了有一定的空间进行少数几种多语言字幕的传输,但是也无法满足世界范围的多语言传输,尤其在8k电视视频中,场消隐期可能会被用来做更多的用途这样就进一步压缩了多语言字幕的空间,更是难以实现支持多语言的字幕显示。另外一种是增加多路字幕的单独传输数据,不将多字幕语言组放在视频场消隐期数据中,这种方式不仅耗费了传输带宽,并且需要单独的对这些多语言字幕进行编辑和管理编辑,管理形式繁琐。本发明提供一种解决方案,可实时获取当前视频帧对应的第一语言字幕数据,并将第一语言字幕数据发送给语言转换设备进行语言转换后再返回进行显示,不需要对多种语言对应的字幕数据进行本地储存,而通过与语言转换设备的交互,可以实现任意语言的转换,从而实现了支持全面的多种语言字幕显示;且无需单独的宽带传输,不耗费传输宽带资源,也便于字幕的管理。参照图1,本发明提供一种多语言字幕显示方法的第一实施例,所述多语言字幕显示方法用于多媒体终端设备;其中,多媒体终端设备是指可以播放视频的终端设备,例如智能电视机、计算机、移动终端设备(手机、ipad)等。多语言是指多种语言类型,例如中文、英文、韩文、日文等。本实施例中的多语言字幕显示方法是指实现支持多种语言在视频中的显示,可以是多种语言同时显示,也可以是不同语言的切换显示。如图1所示,本实施例的多语言字幕显示方法包括:步骤s10,接收字幕语言显示命令。在具体实施过程中,字幕语言显示命令是指用户输入的对字幕显示语言种类需求的命令,其输入的方式不限,可以是通过键盘或触屏等操作方式输入,也可以通过语音输入或者手势输入等。相应的,需要在多媒体终端设备添加相应的接收并识别字幕语言显示命令的模块和设备,例如,添加话筒采集语音,并通过语音识别模块识别用户的语音,获得字幕语言显示命令。在一种应用场景中,用户输入语音为“英语”或者“转换为英语”等指令性语音,将用户所输入的“英语”转换成对应的语言编码‘eng’。具体的说,可以在视频播放时或者视频播放前接收字幕语言显示命令。视频可以是播放的离线视频,也可以是在线视频或者直播视频,本实施例并不作具体限制。步骤s20,将当前视频帧对应的第一语言字幕数据发送给语言转换设备,以使所述语言转换设备将所述第一语言字幕数据转换为与所述字幕语言显示命令对应的第二语言字幕数据。在具体实施过程中,当前视频帧是指视频的当前视频帧,如果视频处于播放状态,则当前视频帧指接收到用户的字幕语言显示命令时的视频帧;如果视频处于未播放状态,则当前视频帧可以是视频的第一帧图像。第一语言字幕数据是指当前视频帧所对应的字幕数据,可以理解的是,视频当中可以自带至少一种语言的字幕数据,一般为1-2种语言的字幕数据,例如,中文,或者中英文同时显示,而本实施例中的第一语言字幕数据就是指视频当中自带的字幕数据。字幕数据可以通过宽带单独传输,与视频同步显示;也可以将字幕数据添加到场消隐期,通过接收视频数据得到视频中的场消隐期数据,从而得到字幕数据,以在视频播放中进行同步显示。由于宽带单独传输存在耗费宽带资源的问题,因此,在本实施例中采用将字幕数据添加到场消隐期的方式。在一种实施例中,所述多媒体终端设备存储有场消隐期数据,所述场消隐期数据中包括所述第一语言字幕数据;所述基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备的步骤包括:基于所述字幕语言显示命令,将所述场消隐期数据中的所述第一语言字幕数据发送给语言转换设备。需要说明的是,在视频压缩标准中,场消隐期是一种提供向视频码流中加入额外信息的方法,因此,在本实施例中,可以将第一语言字幕数据添加到场消隐期数据中,通过接收视频数据得到视频中的场消隐期数据,一方面可以在播放视频时同步显示第一语言字幕数据对于的第一语言字幕,从而无需耗费宽带资源,达到节约宽带资源,提高视频传输效率以及视频播放效果的目的;另一方面也可以抓取到第一语言字幕数据,以执行后续步骤。在一种实施例中,为了从所述场消隐期数据中获取所述第一语言字幕数据,所述接收字幕语言显示命令的步骤之前,所述方法还包括:获取当前视频帧对应的第一语言字幕数据;将所述第一语言字幕数据添加到所述场消隐期数据中。需要说明的是,将当前视频帧对应的第一语言字幕数据添加到所述场消隐期数据中的步骤可以在步骤s10之前即开始执行,或是保持一直执行,保证视频的当前字幕数据被添加到所述场消隐期数据中,当接收到用户的字幕语言显示命令,则立即执行本s10~s20,从而保证能在不耗费宽带资源的前提下,从所述场消隐期数据中获取所述第一语言字幕数据。此外,可以理解的是,语言转换设备是指云端的语言转换设备,其可以包括海量的网络资源,也可以存储海量的本地资源,即包括全面的语言资源,可以满足对第一语言字幕数据进行转换的需求即可,例如服务器、在线翻译设备等。此外,第一语言字幕与第二语言字幕是不同的语言类型,在语言转换设备端可以将第一语言字幕翻译为第二语言字幕,从而获得第二语言字幕数据。在一种实施例中,基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备的步骤,包括:基于所述字幕语言显示命令和所述第一语言字幕数据,生成字幕语言转换指令。将所述第一语言字幕数据和所述语言转换指令传输给语言转换设备,以使所述语言转换设备根据所述语言转换指令,将所述第一语言字幕数据转换为与所述字幕语言显示命令对应的第二语言字幕数据。在具体实施过程中,字幕语言转换指令根据字幕语言显示命令和第一语言字幕数据生成的,例如,根据字幕语言显示命令“英语”和第一语言字幕数据“我是中国人”,生成字幕语言转换指令“将中文“我是中国人”转换为英文“iamchinese””。可以理解的是,根据第一语言字幕数据和语言转换指令可准确的获知字幕语言的转换需求,进而使语言转换设备进行准确的字幕转换。在一种实施例中,所述基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备的步骤,包括:基于所述字幕语言显示命令,判断所述第一语言字幕数据对应的第一字幕语言种类是否与所述字幕语言显示命令要求显示的第二字幕语言种类一致;若否,执行将当前视频帧对应的第一语言字幕数据发送给语言转换设备。在具体实施过程中,第一语言字幕数据对应的第一字幕语言种类可能与用户的字幕语言显示命令所要求的第二字幕语言种类一致,例如第一字幕语言种类为中文,而第二字幕语言种类也为中文,此时,就不需要进行字幕转换;当然,第一字幕语言种类也可能与第二字幕语言种类不一致,该种情况下则执行将所述第一语言字幕数据发送给语言转换设备的步骤。可以避免在接收到用户在未看到视频字幕内容情况下输入的字幕语言显示命令后,继续执行后续步骤,造成资源的浪费。步骤s30,接收所述语言转换设备传输的所述第二语言字幕数据。在具体实施过程中,语言转换设备翻译完成,获得第二语言字幕数据后,发送给多媒体终端设备。多媒体终端设备接收所述语言转换设备传输的所述第二语言字幕数据。具体的说,在步骤s30和步骤s20执行的前提是需要多媒体终端设备与语言转换设备建立通信连接,例如5g通信连接,5g的高速率低延时特性可以实现高速率的传输,以避免接收第二语言字幕数据的延迟过大,影响视频与字幕的同步性。实现对视频的多字幕语言的实现。在一种实施例中,所述当前视频帧对应视频具有最大字幕延迟时间;将所述第一语言字幕数据发送给语言转换设备至接收到所述语言转换设备传输的所述第二语言字幕数据所用的延迟时间小于所述最大字幕延迟时间。在具体实施过程中,本实施例中的最大字幕延迟时间是指当前视频帧对应视频的字幕与视频内容同步性的要求中字幕延迟的最大允许时间。可以理解的是,不同的视频类型可以有不同的最大字幕延迟时间,举例来说,对于离线视频(电影),对字幕的同步性要求相对较低,只要字幕延迟的800毫秒以下都可以接受,此时,最大字幕延迟时间可以设置为800毫秒;对于在线的直播视频(例如新闻直播),对字幕的同步性要求相对较高,字幕延迟的500毫秒以下可以接受,此时,最大字幕延迟时间可以设置为500毫秒。与之对应的,为了满足视频的字幕与视频内容同步性的要求,将所述第一语言字幕数据发送给语言转换设备至接收到所述语言转换设备传输的所述第二语言字幕数据所用的延迟时间小于所述最大字幕延迟时间。这就需要高速率低延时特性的通信技术支持,例如5g通信技术,或是满足前述的最大字幕延迟时间要求的4g或未来其他通信技术。步骤s40,基于所述第二语言字幕数据,显示第二语言字幕。在具体实施过程中,在接收到第二语言字幕数据后,多媒体终端设备可以只显示第二语言字幕数据所对应的第二语言字幕,也可以同时显示第二语言字幕和第二语言字幕数据所对应的第一语言字幕,本实施例不做具体限制。此外,可以理解的是,多媒体终端设备可以利用自己的显示器进行显示,也可以利用外设显示器进行显示,本实施例也不做具体限制。以上便是本实施例中步骤s10~s40的具体实施过程,下面列举一个具体的应用场景实例。假设多媒体终端设备为接收机。首先,将当前视频帧对应的字幕数据添加到场消隐期数据中,假设当前的字幕语言是“我是中国人”,那么这个字符串将被编辑到场消隐期信息中并通过视频传播给接收者(接收机)。编辑的格式如下表:语言内容chn我是中国人在此前提下,在视频播放过程中,当接收到用户通过语音输入的字幕语言显示命令,比如用户输入“英语”。则将用户所输入的“英语”转换成对应的语言编码‘eng’。接下来,接收机收到视频数据并通过视频数据得到场消隐期数据,在场消隐期数据中又得到当前视频帧对应的字幕信息。语言是:chn,内容是:“我是中国人”并收集到当前用户需要的语言是:eng。将场消隐期信息收集模块得到的如下信息:原字幕信息:语言chn,内容:“我是中国人”;目的字幕信息:语言eng。发送给语言转换设备进行翻译。利用5g网络的高效低延时的特点,很快就将得到的目的字幕信息:iamchinese返回给接收机。接收机将iamchinese显示给用户完成本次的字幕语言显示。同理,可以执行上述步骤进行任意语言的多字幕显示,大大降低了多字幕的管理成本和提高了视频传输效率。由此可见,在视频播放过程中,在接收到用户的字幕语言显示命令后,对该视频的每帧视频帧都实时执行s20~s40的步骤,则可实现对整个视频的转换后字幕的显示。应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限制,本领域的技术人员在实际应用中可以基于需要进行设置,此处不做限制。通过上述描述不难发现,本实施例提供的多语言字幕显示方法,通过接收字幕语言显示命令;然后基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备,以使所述语言转换设备将所述第一语言字幕数据转换为与所述字幕语言显示命令对应的第二语言字幕数据;接收所述语言转换设备传输的所述第二语言字幕数据;基于所述第二语言字幕数据,显示第二语言字幕。由此可见,由于实时获取第一语言字幕数据,并将第一语言字幕数据发送给语言转换设备进行语言转换后再返回进行显示,不需要对多种语言对应的字幕数据进行本地储存,而通过与语言转换设备的交互,可以实现任意语言的转换,从而实现了支持全面的多种语言字幕显示。在上述实施例的基础上,本发明的多语言字幕显示方法还提供另一种实施例。在本实施例中,当前视频帧对应视频的分辨率为8k,所述多媒体终端的显示分辨率为8k。需要说明的是,8k是数字视频标准,表示视频的分辨率。8k视频的高分辨率以及逼真的成像还原,带给用户近距离观看的舒适感和沉浸式的临场感觉。8k需要视频和显示分辨率均为8k标准才能实现8k体验。但是在8k视频中,场消隐期会被用来做更多的用途,这样就进一步压缩了场消隐期中可用于语言字幕的空间。因此,在8k标准下,要实现不通过宽带单独传输字幕数据,节约宽带资源的前提下,实现8k标准下的多字幕显示的视频播放,则更加依赖于本实施例的多语言字幕显示方法,在场消隐期空间有限的情况下,利用远端语言转换设备进行字幕转换,而在本地不用存储过多的字幕数据,从而在8k的多媒体终端中实现支持全面的多语言字幕。参照图2,本发明提供一种多语言字幕显示装置的第一实施例,所述多语言字幕显示装置用于多媒体终端设备;基于上述图2所示的实施例,所述多语言字幕显示装置包括:命令接收模块2001,用于接收字幕语言显示命令;字幕转换模块2002,用于基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备,以使所述语言转换设备将所述第一语言字幕数据转换为与所述字幕语言显示命令对应的第二语言字幕数据;字幕接收模块2003,用于接收所述语言转换设备传输的所述第二语言字幕数据;字幕显示模块2004,用于基于所述第二语言字幕数据,显示第二语言字幕。应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限制,本领域的技术人员在实际应用中可以基于需要进行设置,此处不做限制。通过上述描述不难发现,本实施例提供的多语言字幕显示装置,通过接收字幕语言显示命令;然后基于所述字幕语言显示命令,将当前视频帧对应的第一语言字幕数据发送给语言转换设备,以使所述语言转换设备将所述第一语言字幕数据转换为与所述字幕语言显示命令对应的第二语言字幕数据;接收所述语言转换设备传输的所述第二语言字幕数据;基于所述第二语言字幕数据,显示第二语言字幕。由此可见,由于实时获取第一语言字幕数据,并将第一语言字幕数据发送给语言转换设备进行语言转换后再返回进行显示,不需要对多种语言对应的字幕数据进行本地储存,而通过与语言转换设备的交互,可以实现任意语言的转换,从而实现了支持全面的多种语言字幕显示。参见图3,本发明的实施例提供一种多媒体终端设备,所述多媒体终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的多语言字幕显示程序,所述多语言字幕显示程序配置为实现如前述实施例所述的多语言字幕显示方法的步骤。参见图4,本发明的实施例提供一种8k多媒体终端设备,所述多媒体终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的多语言字幕显示程序,所述多语言字幕显示程序配置为实现如前述实施例所述的多语言字幕显示方法的步骤。此外,本发明实施例还提出一种存储介质,所述存储介质上存储有多语言字幕显示程序,所述多语言字幕显示程序被处理器执行时实现如前述实施例所述的多语言字幕显示方法的步骤。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台多媒体终端设备(可以是手机,计算机,电视接收机,或者网络设备等)执行本发明各个实施例所述的方法以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的
技术领域
,均同理包括在本发明的专利保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1