一种图像字幕叠加系统与方法

文档序号：7954264阅读：212来源：国知局

专利名称：一种图像字幕叠加系统与方法
技术领域：
本发明涉及一种字幕叠加系统及方法，尤其是一种能在动态或静态图像上叠加字幕的系统及方法。
背景技术：
自从港台及国外影视作品进入中国内地市场，字幕就成了这些作品必不可少的一部分。由于国外作品大都是原声的，普通观众必须借助字幕才能理解片中的内容，因此，对于一部好的作品而言，字幕的清晰度是十分重要的。太暗、太小、和背景图像混作一团的字幕会让观众产生视觉疲劳，往往一部片子还没看完，就需要暂停休息，甚至失去继续观看影片的兴趣。
目前，在图像或视频内容上叠加字幕的方法主要是利用屏上显示(OSD)技术，即在播放影视内容时，对图像和字幕两路信号进行Alpha混合，再经由乘法器输出，以实现背景图像和字幕的叠加。由于该方法需要在播放图像或视频内容时实时地对图像和字幕进行混合运算，因此，所需的运算资源比较大，而且图像和字幕需要分别存储，所需的存储资源也比较大。此外，在内容制作时直接在影视内容上叠加字幕的方法需要在制作影视内容时对颜色分量进行下采样，并在播放时对颜色分量进行上采样恢复，这种方法会导致图像和字幕的色度信息相互污染，造成字幕清晰度降低的不良效果。

发明内容
为了克服现有的在内容制作时直接在影视内容上叠加字幕的方法存在的运算、存储资源消耗大，色度信息相互污染的不足，本发明提供一种图像字幕叠加系统与方法，不仅能节省播放时的运算资源和存储资源，而且能避免字幕和图像内容间的颜色污染现象。
本发明解决其技术问题所采用的技术方案是提供一种图像字幕叠加系统，它包括控制模块、图像字幕混合模块和下采样模块，所述的这些模块两两连接，图像信号从该图像字幕混合模块的一端输入，其中，所述系统还包括一字幕加边模块，字幕信号经由该字幕加边模块从该图像字幕混合模块的另一端输入，混合后的图像和字幕信号经下采样模块输出。
本发明的另一方案是提供一种图像字幕叠加方法，它包括下列步骤在字幕信号中的笔划像素周围加上边框像素；混合图像信号和加边后的字幕信号；以及对混合后的图像进行下采样。
本发明的有益效果是，通过采用事先将字幕叠加到背景图像上，使得播放视频内容时只需要存储字幕叠加后的图像，而无需进行额外运算的方法，有效地节省了运算资源和存储资源。同时，通过对笔划像素加边框，清晰地勾勒出字幕内容，解决了图像和字幕直接混合时出现的颜色污染问题，达到良好的字幕叠加效果。

下面结合附图和实施例对本发明进一步说明。
图1是本发明的图像字幕叠加系统的方框图；图2是本发明的图像字幕叠加方法的流程图；图3是本发明实施例的工作流程图；图4是像素点的空间8邻域示意图；图5是图3所示实施例中字幕加边步骤的分解流程图；图6是图3所示实施例中图像和字幕混合步骤的分解流程图。
具体实施例方式
以下将结合附图对本发明的一种图像字幕叠加系统与方法作进一步的详细描述。
如图1所示，图像字幕叠加系统包括一控制模块1，一字幕加边模块2，一图像字幕混合模块3，和一下采样模块4。控制模块1分别与图像字幕混合模块3和下采样模块4连接，而图像字幕混合模块3又分别与字幕加边模块2和下采样模块4连接。字幕信号经字幕加边模块2从图像字幕混合模块3输入，图像信号也从图像字幕混合模块3输入，混合后的图像和字幕信号经下采样模块4输出。
参阅图2和图3，具体说明本发明的图像字幕叠加方法和系统的工作流程。于本实施例中，图像和字幕输入信号均为YUV444格式。若原始信号是RGB信号，则需经过RGB到YUV格式转换(步骤100)，将图像和字幕信号转换到YUV域后再进入字幕叠加流程。当YUV字幕信号输入字幕加边模块2后，字幕加边模块2对该信号的笔划像素进行加边框处理(步骤120)，经过加边处理的字幕信号和YUV图像信号一起输入图像字幕混合模块3。控制模块1根据最终需要输出的图像格式，例如YUV420或者YUV422格式，确定图像字幕混合模块3的混合逻辑以及下采样模块4的工作模式。图像字幕混合模块3依照控制模块1设定的混合逻辑对图像信号和加边后的字幕信号进行混合(步骤140)，再由下采样模块4对混合后的图像进行相应模式的下采样(步骤160)。最后，从下采样模块4输出的内容经MPEG4编码(步骤180)生成最终压缩后的影视内容。
下面结合图4至图6，详细说明本发明实施例的字幕加边步骤及图像字幕混合步骤。图4显示了一个像素的8邻域示意图，其中，圆点代表当前像素，方点表示空间位置上紧邻圆点(当前像素)的邻域像素，共有8个，所以称为8邻域。在以下叙述中，透明像素是指字幕图片中既非笔划像素又非边框像素的点。透明像素具有透明色，即该点在最终混合图像上显示为背景图像相应点的颜色。
参阅图5，其显示本发明实施例中字幕加边步骤的分解流程图。当字幕信号输入字幕加边模块2后，首先判断当前像素是否为笔划像素(步骤121)。如果不是，则对该像素不作处理(步骤122)，继续判断下一个像素(步骤123)；如果该像素是笔划像素，则由字幕加边模块2对该笔划像素的8邻域像素作进一步判断如下如果该邻域像素是笔划像素即非透明色，则对该邻域像素不作处理(步骤124)，继续判断下一个邻域像素(步骤125)；如果该邻域像素是透明色，则判断当前笔划像素的亮度分量值(步骤126)，若该亮度分量大于等于一阈值，于本实施例中选取亮度范围的中间值128作为阈值，就将该邻域像素的亮度分量设为系统允许的最暗值，否则将该邻域像素的亮度分量设为系统允许的最亮值，然后将该邻域像素的色度分量设为当前笔划像素的色度值(步骤127-129)。当每一个笔划像素的8邻域像素都判断完毕后，退出字幕加边模块2。
参阅图6，其显示本发明实施例中图像和字幕混合步骤的分解流程图，该步骤需要对字幕信号中的每一个像素进行判断。若当前像素是透明像素，则该点采用背景图像相应点的亮度和色度(步骤141)，否则进入下一级判断，即判断该像素是否为字幕加边步骤中生成的边框像素(步骤142)。如果不是，则该点是笔划像素，采用字幕图片相应点的亮度和色度对其进行设置(步骤143)；如果当前像素是边框像素，则需要依照控制模块1根据不同的输出图像格式设定的混合逻辑，对边框像素作进一步判断如下如果最终需要生成YUV420格式的图像，则在图像字幕混合模块3中判断当前点是否在最终图像的(偶，偶)点上(步骤144)。(偶，偶)点是指该点的水平、竖直坐标都为偶数(以图像左上角为起始点，初始坐标为(0，0)，每向右或向下移动一个像素，水平或竖直坐标增加1)。如果不是，则该点采用字幕图片相应点的亮度和色度(步骤143)；如果是，则继续判断该点的右侧、下方和右下方三个相邻点中是否存在笔划像素(步骤145)。如果没有，则该点的亮度采用边框的亮度，色度采用背景图像相应点的色度(步骤146)；如果有，则该点采用字幕图片相应点的亮度和色度(步骤143)。
如果最终需要生成YUV422格式的图像，则在图像字幕混合模块3中判断当前点是否在最终图像的(偶，X)点上(步骤147)。(偶，X)点是指该点的水平坐标为偶数，竖直坐标为任意数。如果不是，则该点采用字幕图片相应点的亮度和色度(步骤143)；如果是，则继续判断该点右侧相邻的像素点是否为笔划像素(步骤148)。如果不是，则该点的亮度采用边框的亮度，色度采用背景图像相应点的色度(步骤146)；如果是，则该点采用字幕图片相应点的亮度和色度(步骤143)。
字幕图片上的每个像素点经过上述逻辑判断，确定了其在最终图像上的亮度和色度。混合完成的图像信号从图像字幕混合模块3输出，并输入到下采样模块4进行YUV444到YUV420或者YUV444到YUV422下采样。下采样后的内容再输入到MPEG4编码模块生成最终压缩后的影视内容。
采用本发明的图像字幕叠加系统及方法生成的图像或视频内容，在播放时，字幕笔划周围会有一个像素宽度的勾边。由于该勾边与笔划本身在亮度上有鲜明的对比，因此不会出现字幕和背景图像混为一团的情形，大大提高了字幕的清晰度。此外，经过字幕叠加的图像在播放时，无需进行额外的运算，只需要存储字幕叠加后的图像即可，与传统的屏上显示技术相比，大大节省了运算资源和存储资源，达到了降低成本的效果。
权利要求
1.一种图像字幕叠加系统，包括控制模块(1)、图像字幕混合模块(3)和下采样模块(4)，所述的这些模块两两连接，图像信号从该图像字幕混合模块(3)的一端输入，其特征在于所述的系统还包括一字幕加边模块(2)，字幕信号经由该字幕加边模块(2)从该图像字幕混合模块(3)的另一端输入，混合后的图像和字幕信号经下采样模块(4)输出。
2.如权利要求1所述的图像字幕叠加系统，其特征在于所述的控制模块(1)根据所要输出的图像格式，确定图像字幕混合模块(3)的混合逻辑以及下采样模块(4)的工作模式。
3.如权利要求2所述的图像字幕叠加系统，其特征在于输出的图像格式包括YUV420和YUV422。
4.如权利要求1或2所述的图像字幕叠加系统，其特征在于所述字幕加边模块(2)根据字幕信号中笔划像素的亮度在该笔划周围加上亮的或暗的边框。
5.如权利要求1或2所述的图像字幕叠加系统，其特征在于所述图像字幕混合模块(3)根据周边像素判断来确定混合后的像素的亮度和色度。
6.一种图像字幕叠加方法，其特征在于，所述的方法包括下列步骤在字幕信号中的笔划像素周围加上边框像素；混合图像信号和加边后的字幕信号；以及对混合后的图像进行下采样。
7.如权利要求6所述的图像字幕叠加方法，其特征在于，所述的方法还包括一格式转换步骤，用于分别对图像信号和字幕信号进行RGB到YUV域的转换。
8.如权利要求6或7所述的图像字幕叠加方法，其特征在于，所述字幕加边步骤进一步包括(1)判断笔划像素的亮度是否达到一阈值，若判断结果为是，则在该笔划像素的周围加上暗的边框像素；(2)若步骤(1)中判断的结果为否，则在该笔划像素的周围加上亮的边框像素。
9.如权利要求8所述的图像字幕叠加方法，其特征在于所述阈值为亮度取值范围的中间值。
10.如权利要求6或7所述的图像字幕叠加方法，其特征在于所述图像和字幕混合步骤进一步包括(1)对加边后的字幕信号中的边框像素进行周边像素判断；(2)根据步骤(1)的判断结果，确定图像和字幕信号混合后该边框像素的亮度和色度。
11.如权利要求10所述的图像字幕叠加方法，其特征在于，所述图像和字幕混合步骤以及下采样步骤由所要输出的图像格式决定。
12.如权利要求11所述的图像字幕叠加方法，其特征在于，输出的图像格式包括YUV420和YUV422。
全文摘要
一种在动态或静态图像上叠加字幕的系统与方法。现有的在内容制作时直接在影视内容上叠加字幕的方法存在图像和字幕的色度信息相互污染的问题。本发明的字幕叠加系统包括控制模块、图像字幕混合模块和下采样模块，所述的这些模块两两连接，图像信号从该图像字幕混合模块的一端输入，所述系统还包括一字幕加边模块，字幕信号经由该字幕加边模块从该图像字幕混合模块的另一端输入，混合后的图像和字幕信号经下采样模块输出。利用本发明的系统和方法可以节省系统的运算资源和存储资源，并能达到良好的字幕叠加效果。本发明的一种图像字幕叠加系统与方法适用于图像或视频内容的字幕叠加。
文档编号H04N5/278GK1905643SQ200610029650
公开日2007年1月31日申请日期2006年8月2日优先权日2006年8月2日
发明者罗巍, 赵建国, 朱嘉峰申请人:智多微电子(上海)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗巍;赵建国;朱嘉峰
技术所有人：智多微电子（上海）有限公司
我是此专利的发明人

上一篇：参数可配置的图像定位叠加模块及方法
上一篇：一种字幕叠加系统和方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。