一种视频播放终端的字幕翻译方法、系统的制作方法

文档序号:7871348阅读:154来源:国知局
专利名称:一种视频播放终端的字幕翻译方法、系统的制作方法
一种视频播放终端的字幕翻译方法、系统技术领域
本发明属于视频信号处理技术领域,尤其涉及一种视频播放终端的字幕翻译方法、系统。
背景技术
随着网络视频技术的发展,人们可越来越方便的获取到不同国家或地区的视频数据。用户在观看外文视频或者直播时,视频文件虽然提供了字幕,但不一定是用户熟悉的语言,用户由于外文水平有限,很难看懂这些字幕的含义,导致用户无法理解视频内容,降低了用户的观看兴趣。
针对于此,现有技术中,外文视频的制作方或引进方会添加不同语种的字幕。然而该种方式下的制作成本较高,且添加的语种有限,一般仅为英语,不能满足其它语种国家的观看需求,适用性较低。发明内容
本发明实施例的目的在于提供一种视频播放终端的字幕翻译方法,旨在解决现有技术中,由制作方或引进方添加不同语种的字幕的成本较高,适用性较低的问题。
本发明实施例是这样实现的,一种视频播放终端的字幕翻译方法,所述方法包括
识别当前视频帧中待翻译字幕区域是否有字幕输出;
若识别出所述待翻译字幕区域有字幕输出,则将所述待翻译字幕区域的字幕内容翻译成指定语种的文字;
将所述指定语种的文字叠加显示在所述当前视频帧的指定区域。
本发明实施例的另一目的在于提供一种视频播放终端的字幕翻译系统,所述系统包括
图像识别单元,用于识别当前视频帧中待翻译字幕区域是否有字幕输出;
翻译单元,用于当所述图像识别单元识别出所述待翻译字幕区域有字幕输出时, 将所述待翻译字幕区域的字幕内容翻译成指定语种的文字;
叠加显示单元,用于将所述翻译单元翻译成的所述指定语种的文字叠加显示在所述当前视频巾贞的指定区域。
本发明提出的视频播放终端的字幕翻译方法及系统是在待翻译字幕区域有字幕输出时,将待翻译字幕区域的字幕内容翻译成指定语种的文字,并将翻译后的指定语种的文字叠加显示在指定区域,从而实现了对视频文件的本地即时翻译,可以满足不同语种用户的需求,适用性强且成本低。



图1是本发明实施例一提供的视频播放终端的字幕翻译方法的流程图2是本发明中,识别待翻译字幕区域是否有字幕输出的详细流程图3是本发明中,将字幕内容翻译成指定语种的文字的详细流程图4是本发明实施例二提供的视频播放终端的字幕翻译方法的流程图5是本发明实施例三提供的视频播放终端的字幕翻译系统的结构图6是图5中图像识别单元的结构图7是图5中翻译单元的结构图8是本发明实施例四提供的视频播放终端的字幕翻译系统的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提出的视频播放终端的字幕翻译方法及系统可实现对视频文件的本地翻译,以满足不同语种用户的需求,且成本低。以下结合实施例详细说明本发明的实现方式
实施例一
本发明实施例一提供了一种视频播放终端的字幕翻译方法,如图1所示,包括
步骤Sll :识别当前视频帧中待翻译字幕区域是否有字幕输出。
具体地,本发明实施例一基于帧图像序列算法,识别当前视频帧中待翻译字幕区域是否有字幕输出,该帧图像序列算法是利用不同视频帧之间像素亮度的变化值来实现字幕有无的识别。如图2所示,此时,步骤Sll包括
步骤Slll :提取当前视频帧中待翻译字幕区域的图片。
步骤S112 :将提取出的图片转换成灰度图片,并将灰度图片划分为多个子区域。
步骤S113 :计算每一子区域与之前视频帧中待翻译字幕区域的灰度图片上、对应子区域的像素亮度差值。
步骤S114 :将像素亮度差值大于第一阈值的子区域对应检测结果位置1,将像素亮度差值不大于第一阈值的子区域对应检测结果位置O。
步骤S115 :将各子区域分别对应的检测结果位相加,并判断相加结果是否大于第二阈值。
步骤S116 :若相加结果大于第二阈值,则识别当前视频帧中待翻译字幕区域有字幕输出。
举例来说,假设当前视频帧的灰度图片被划分为η个子区域,且η各子区域的像素亮度值分别为ΑΡ··Αη ;η个子区域对应的之前视频帧的灰度图片上η个子区域的像素亮度值分别为ΒΡ··Βη ;第一阈值α为,第二阈值为β。则首先,计算像素亮度差值Si=IA1-BiI, I彡i彡η ;之后,将像素亮度差值Si与第一阈值α进行比较,若δ,α,则认为相应子区域八1的像素亮度变化大,令相应子区域对应的检测结果位μ ^1,否则μ i=0 ;之后,计算各检测结果位Ui的和,若相加结果大于第二阈值为β,则认为当前视频帧中有字幕区域。
步骤S12 :若识别出待翻译字幕区域有字幕输出,则将待翻译字幕区域的字幕内容翻译成指定语种的文字。进一步地,如图3所示,将待翻译字幕区域的字幕内容翻译成指定语种的文字的步骤包括
步骤S121 :利用光学字符识别(Optical Character Recognition, OCR)引擎提取出待翻译字幕区域的灰度图片中的字幕内容。
步骤S122 :识别出字幕内容所属的语种。
步骤S123 :若识别出的语种与指定语种不同,则将字幕内容划分为单词和/或短语。
步骤S124 :查找语言库,得到指定语种下、单词和/或短语对应的文字。
本发明实施例一中,语言库可以是语言词典或平行语料库。为了提高翻译方法的适用性,该语言库可通过互联网或移动网络等无线网络进行在线升级,或通过外设进行更新。
步骤S125 :将得到的文字组合成指定语种的文字。
步骤S13 :将指定语种的文字叠加显示在当前视频帧的指定区域。
本发明实施例一中,指定区域可以是当前视频帧中、待翻译字幕区域的上方或下方。例如,可优先与字幕同样大小的字体显示在待翻译字幕区域的上方或下方,并当上方或下方区域不足以显示指定语种的文字时,以小于字幕大小的字体显示;或者优选在待翻译字幕区域的下方显示指定语种的文字,并当待翻译字幕区域的下方高度不够时,在待翻译字幕区域的上方显示指定语种的文字。
实施例二
本发明实施例二提供了一种视频播放终端的字幕翻译方法,如图4所示。与图1 所示不同,本发明实施例二在步骤Sll之前,还包括
步骤S14 :根据用户操作,选取待翻译字幕区域、指定语种和/或指定区域。
本发明实施例二中,待翻译字幕区域可以是当前视频帧的全部区域,也可以为了提高识别效率,而选取当前视频帧的部分区域作为待翻译字幕区域;当待翻译字幕区域是选取的部分区域时,用户可在显示的视频帧范围内操作。例如,用户可利用触摸面板或鼠标,选定从左上角下拉至右下角的矩形区域为待翻译字幕区域。
本发明实施例二的其它步骤与本发明实施例一相同,在此不赘述。
实施例三
本发明实施例三提供了一种视频播放终端的字幕翻译系统,如图5所示,包括图像识别单元11,用于识别当前视频帧中待翻译字幕区域是否有字幕输出;翻译单元12,用于当图像识别单元11识别出待翻译字幕区域有字幕输出时,则将待翻译字幕区域的字幕内容翻译成指定语种的文字;叠加显示单元13,用于将翻译单元12翻译成的指定语种的文字叠加显示在当前视频帧的指定区域。
进一步地,如 图6所示,图像识别单元11可以包括第一提取模块111,用于提取当前视频帧中待翻译字幕区域的图片;第一划分模块112,用于将第一提取模块111提取出的图片转换成灰度图片,并将灰度图片划分为多个子区域;计算模块113,用于计算第一划分模块112划分后的每一子区域与之前视频帧中待翻译字幕区域的灰度图片上、对应子区域的像素亮度差值;置位模块114,用于将像素亮度差值大于第一阈值的子区域对应检测结果位置1,将像素亮度差值不大于第一阈值的子区域对应检测结果位置O ;判断模块115, 用于将置位模块114置位后、各子区域分别对应的检测结果位相加,并判断相加结果是否大于第二阈值;第一识别模块116,用于当判断模块115判断相加结果大于第二阈值时,识别当如视频巾贞中待翻译子眷区域有子眷输出。
进一步地,如图7所示,翻译单元12可以包括第二提取模块121,用于利用光学字符识别引擎提取出待翻译字幕区域的灰度图片中的字幕内容;第二识别模块122,用于识别出字幕内容所属的语种;第二划分模块123,用于当第二识别模块122识别出的语种与指定语种不同时,将字幕内容划分为单词和/或短语;查找模块124,用于查找语言库,得到指定语种下、单词和/或短语对应的文字;组合模块125,用于将查找模块124得到的文字组合成指定语种的文字。
本发明实施例三中,语言库可以是语言词典或平行语料库。为了提高翻译方法的适用性,该语言库可通过互联网或移动网络等无线网络进行在线升级,或通过外设进行更新。
实施例四
本发明实施例四提供了一种视频播放终端的字幕翻译系统,如图8所示。与图5 所示不同,本发明实施例四中,系统还可以包括选取模块14,用于根据用户操作,选取待翻译字幕区域、指定语种和/或指定区域。该系统的其它部分与本发明实施例三相同,在此不赘述。
本发明提出的视频播放终端的字幕翻译方法及系统是在待翻译字幕区域有字幕输出时,将待翻译字幕区域的字幕内容翻译成指定语种的文字,并将翻译后的指定语种的文字叠加显示在指定区域,从而实现了对视频文件的本地即时翻译,可以满足不同语种用户的需求,适用性强且成本低。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来控制相关的硬件完成,所述的程序可以在存储于一计算机可读取存储介质中, 所述的存储介质,如R0M/RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本`发明的保护范围之内。
权利要求
1.一种视频播放终端的字幕翻译方法,其特征在于,所述方法包括识别当前视频帧中待翻译字幕区域是否有字幕输出;若识别出所述待翻译字幕区域有字幕输出,则将所述待翻译字幕区域的字幕内容翻译成指定语种的文字;将所述指定语种的文字叠加显示在所述当前视频帧的指定区域。
2.如权利要求1所述的视频播放终端的字幕翻译方法,其特征在于,所述识别当前视频帧中待翻译字幕区域是否有字幕输出的步骤包括提取当前视频帧中待翻译字幕区域的图片;将提取出的所述图片转换成灰度图片,并将所述灰度图片划分为多个子区域;计算每一子区域与之前视频帧中所述待翻译字幕区域的灰度图片上、对应子区域的像素亮度差值;将所述像素亮度差值大于第一阈值的子区域对应的检测结果位置1,将所述像素亮度差值不大于第一阈值的子区域对应的检测结果位置O ;将各子区域分别对应的所述检测结果位相加,并判断相加结果是否大于第二阈值;若所述相加结果大于所述第二阈值,则识别所述当前视频帧中所述待翻译字幕区域有字幕输出。
3.如权利要求2所述的视频播放终端的字幕翻译方法,其特征在于,所述将所述待翻译字幕区域的字幕内容翻译成指定语种的文字的步骤包括利用光学字符识别引擎提取出所述待翻译字幕区域的灰度图片中的字幕内容;识别出所述字幕内容所属的语种;若识别出的所述语种与所述指定语种不同,则将所述字幕内容划分为单词和/或短语;查找语言库,得到所述指定语种下、单词和/或短语对应的文字;将得到的所述文字组合成所述指定语种的文字。
4.如权利要求3所述的视频播放终端的字幕翻译方法,其特征在于,所述语言库是语言词典或平行语料库。
5.如权利要求1至4任一项所述的视频播放终端的字幕翻译方法,其特征在于,在所述识别当前视频帧中待翻译字幕区域是否有字幕输出的步骤之前,所述方法还包括根据用户操作,选取所述待翻译字幕区域、所述指定语种和/或所述指定区域。
6.—种视频播放终端的子.翻译系统,其特征在于,所述系统包括图像识别单元,用于识别当前视频帧中待翻译字幕区域是否有字幕输出;翻译单元,用于当所述图像识别单元识别出所述待翻译字幕区域有字幕输出时,将所述待翻译字幕区域的字幕内容翻译成指定语种的文字;叠加显示单元,用于将所述翻译单元翻译成的所述指定语种的文字叠加显示在所述当前视频帧的指定区域。
7.如权利要求6所述的视频播放终端的字幕翻译系统,其特征在于,所述图像识别单元包括第一提取模块,用于提取当前视频帧中待翻译字幕区域的图片;第一划分模块,用于将所述第一提取模块提取出的所述图片转换成灰度图片,并将所述灰度图片划分为多个子区域;计算模块,用于计算所述第一划分模块划分后的每一子区域与之前视频帧中所述待翻译字幕区域的灰度图片上、对应子区域的像素亮度差值;置位模块,用于将所述像素亮度差值大于第一阈值的子区域对应的检测结果位置1,将所述像素亮度差值不大于第一阈值的子区域对应的检测结果位置O ;判断模块,用于将所述置位模块置位后、各子区域分别对应的检测结果位相加,并判断相加结果是否大于第二阈值;第一识别模块,用于当所述判断模块判断所述相加结果大于所述第二阈值时,识别所述当前视频帧中所述待翻译字幕区域有字幕输出。
8.如权利要求7所述的视频播放终端的字幕翻译系统,其特征在于,所述翻译单元包括第二提取模块,用于利用光学字符识别引擎提取出所述待翻译字幕区域的灰度图片中的字眷内容;第二识别模块,用于识别出所述字幕内容所属的语种;第二划分模块,用于当所述第二识别模块识别出的所述语种与所述指定语种不同时,将所述字幕内容划分为单词和/或短语;查找模块,用于查找语言库,得到所述指定语种下、单词和/或短语对应的文字;组合模块,用于将所述查找模块得到的所述文字组合成所述指定语种的文字。
9.如权利要求8所述的视频播放终端的字幕翻译系统,其特征在于,所述语言库是语言词典或平行语料库。
10.如权利要求6至9任一项所述的视频播放终端的字幕翻译系统,其特征在于,所述系统还包括选取模块,用于根据用户操作,选取所述待翻译字幕区域、所述指定语种和/或所述指定区域。
全文摘要
本发明属于视频信号处理技术领域,提供了一种视频播放终端的字幕翻译方法、系统。该方法及系统是在待翻译字幕区域有字幕输出时,将待翻译字幕区域的字幕内容翻译成指定语种的文字,并将翻译后的指定语种的文字叠加显示在指定区域,从而实现了对视频文件的本地即时翻译,可以满足不同语种用户的需求,适用性强且成本低。
文档编号H04N5/278GK103051945SQ20121059455
公开日2013年4月17日 申请日期2012年12月31日 优先权日2012年12月31日
发明者张培凯 申请人:广东欧珀移动通信有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1