面向实时音视频流的字幕叠加系统的制作方法

文档序号：7845973阅读：589来源：国知局

专利名称：面向实时音视频流的字幕叠加系统的制作方法
技术领域：
[0001]本实用新型主要涉及到广播电视制作设备领域，特指一种字幕叠加系统。
背景技术：
随着电视技术的发展，电视字幕在电视节目制作中的作用也显得越来越重要。早期的电视字幕是通过人手写、手描，用黑白广告色写在黑纸上，然后用摄像机或飞点扫描幻灯机逐行、逐句拍摄，最后再把所拍的信号经限幅处理叠加在图像上，该种方式由于其步骤繁琐且字幕叠加效果差，已渐渐被淘汰。伴随着计算机技术的迅速发展，字幕叠加技术也得到了进一步发展，变得越来越来自动化，叠加效果也愈来愈好，应用范围也变得广泛。目前，在网络电视的业务应用中，通常会在机顶盒视频播放期间往视频上叠加提示性字幕，这种叠加常采用的方式是把需要显示的字幕通过某种途径发送到机顶盒，然后由机顶盒负责字幕实现的具体叠加过程。该种方法虽然成本不高，但由于需要机顶盒本身支持多种字库、多种语言等，造成其在实现字幕叠加上具有很大的局限性，灵活性不够；且该种方式下的字幕显示方式比较简单，叠加效果差，难以满足用户的实时字幕叠加的需求。有从业者提出以计算机为操作平台的非线性编辑系统，其由于编辑精度高，叠加效果好，不存在预卷、时基误差等优点，受到各大电视台的青睐，被广泛应用于电视节目的制作中。该非线性编辑系统通常由高性能的计算机、视频压缩卡和非编软件等部件组成，其虽然具有编辑精度高、叠加效果好等优点，但由于其在正式编辑前，需要将录像素材经过数字压缩后形成数据流先存储到计算机的硬盘中，编辑时再按编导人员的创作意图运用非编软件对所存储的录像素材进行编辑、添加字幕等处理，最后再输出；整个处理过程占用时间较长，在对实时音视频流进行字幕叠加方面存在一定局限。另一方面，由于非线性编辑系统在进行存储录像素材时，需要对录像素材进行数字压缩，如果采用低压缩比进行压缩后存储，势必需要更多的硬盘空间存储录像素材，增加硬件设备投入；而如果采用高压缩比进行压缩存储，则又会给图像带来一定损耗。由上可知，非线性编辑系统同样也存在着字幕的实时叠加局限性较大、成本较高等不足。

实用新型内容本实用新型要解决的技术问题就在于针对现有技术存在的技术问题，本实用新型提供一种结构简单紧凑、成本低廉、操作简便、可以实现字幕的实时叠加、满足了电视前端在任意时刻对首视频流进行字.置加需求的面向实时首视频流的字.置加系统。为解决上述技术问题，本实用新型采用以下技术方案一种面向实时音视频流的字幕叠加系统，包括字幕内容服务设备，用以对叠加的字幕信息脚本进行制作；字幕机，用以对实时音视频流进行字幕叠加；所述字幕内容服务设备与字幕机相连并将制作好的字幕信息脚本发送给字幕机；[0011]编码模块，与字幕机相连，用以对叠加字幕信息后的视频流数据进行重新编码，并将重新编码后的视频流与其它TS流信息组合成新的混合音视频流输出至终端用户设备。作为本实用新型的进一步改进所述字幕机包括解码模块，用以对音视频流进行解码并获得每帧图像数据；字幕叠加模块，包括解析单元和叠加单元，所述解析单元用以对字幕内容服务设备发送来的字幕信息脚本进行解析，且将获得的字幕信息添加在OSD层上，生成字幕画面；所述叠加单元用以将解析单元生成的字幕画面叠加到视频层上，并输出至编码模块。所述解码模块中还包括一用以对前端传送的音视频流数据进行解码的解码单元。所述解析单元还包括一用以存储字幕信息脚本的存储器。所述解码模块和字幕叠加模块为机顶盒主芯片。与现有技术相比，本实用新型的优点在于I、本实用新型面向实时音视频流的字幕叠加系统，结构简单、成本低廉，不用对音视频流进行压缩和存储，直接在解码后的视频流上叠加字幕并编码输出，实现了字幕的实时叠加，满足了电视前端在任意时刻对音视频流进行字幕叠加的需求；且这种对音视频流不经存储直接实时叠加的方式还避免了存储时造成的视频图像损耗和存储设备投入；2、本实用新型中的字幕机可采用一个具有视频解码和字幕叠加功能的芯片完成子.置加功能，如机顶盒王芯片，成本相对降低；3、本实用新型将字幕信息融合在视频流中，用户端无需升级或更换设备，便可以直接显示叠加字幕后的视频信息，适用范围广。

图I是本实用新型结构的框架示意图。图2是本实用新型的执行原理架构示意图。图3是本实用新型在具体应用实例中的工作流程示意图。图例说明10、字幕内容服务设备；20、字幕机；201、解码模块；202、字幕叠加模块；2021、解析单元；2022、叠加单元；30、编码模块。
具体实施方式
以下将结合说明书附图和具体实施例对本实用新型做进一步详细说明。如图I所示，本实用新型的面向实时音视频流的字幕叠加系统，包括字幕内容服务设备10、字幕机20以及编码模块30。字幕内容服务设备10用以对叠加的字幕信息脚本进行制作，并将其发送给字幕机20。该字幕内容服务设备10可以为具有字幕编辑功能的设备，本实施例中，其为装载有字幕编辑软件的计算机。字幕机20用以对实时音视频流进行字幕叠加，字幕机20包括解码模块201和字幕叠加模块202。其中，解码模块201用以对音视频流进行解码并获得每帧图像数据；字幕叠加模块202包括解析单元2021和叠加单元2022，解析单元2021用以对字幕内容服务设备10发送来的字幕信息脚本进行解析，且将获得的字幕信息添加在OSD层上，生成字幕画面；叠加单元2022用以将解析単元2021生成的字幕画面叠加到视频层上，即视频图像数据上，并输出至编码模块30。编码模块30用以对字幕叠加后的每帧图像数据进行重新编码，该编码模块30可以为码流生成器或编码器；例如本实施例中，其可采用北京世纪鼎点软件有限公司推出的PowerSmart编码器去对字幕叠加后的每帧图像数据进行重新编码。本实施例中，解码模块201中还包括一解码单元(图中未示)，该解码単元用以对前端传送的音视频流数据进行解码。本实施例中，解析单元2021还包括一用以存储字幕信息脚本的存储器(图中未示)。本实施例中，解码模块201和字幕叠加模块202可采用机顶盒主芯片实现，例如，可采用海思的HI3100E芯片去实现对TS流中音视频流数据的解码，从而获取到每帧视频图像数据以及进而对解码后每帧视频图像数据进行字幕叠加等功能。由此可见，本实用新型为ー种通过利用机顶盒的OSD技术，在电视前端实现对实时音视频流进行字幕叠加，且叠加速度快、成本低的字幕叠加系统。本实用新型相比于现有的非线性编辑系统，在达到字幕叠加目的的同时已大大降低了设备成本。參见图2，本实用新型在工作吋，将携带原始音视频信息的TS流送入字幕机20 ;首先字幕机20会对TS流中的视频流数据进行解码，以获取每帧视频图像数据，同时，字幕机20中的字幕叠加模块202对输入的字幕信息脚本进行解析并获得字幕信息，且进ー步将该字幕信息数据添加到OSD层上；其次，字幕叠加模块202将添加字幕信息后的OSD层和视频帧层相互叠加，进ー步形成新的每帧视频图像数据；最后重新将叠加后的每帧图像数据进行重新编码，并将编码后的视频流数据与其他TS流信息通过电视信号混合器等设备组合成新的混合音视频流进行输出。如图3所示，为本实用新型在具体应用过程中的流程示意图，其包括以下步骤步骤401 :字幕内容服务设备10对字幕信息脚本文件进行制作，并通过网ロ(或串ロ)将定义好字幕显示效果的字幕信息脚本文件发送给字幕机20 ;其中，字幕信息脚本定义了显示信息和控制关键字描述信息，上述显示信息包括字幕文本，控制关键字描述信息包括字幕显示位置、字幕语言、字体顔色、背景顔色、字体样式以及滚动方向等。步骤402 :字幕机20将自字幕内容服务设备10处获取的字幕信息脚本保存在存储器中。进一歩，字幕叠加模块202将字幕信息叠加到实时音视频流上，具体实现过程如下步骤403 :解析単元2021实时从存储器中读取字幕信息脚本并对其进行解析，并将解析获得的字幕信息添加到同屏显示层上生成字幕画面；步骤404 :叠加单元2022将解析単元2021生成的字幕画面与经解码模块201解码获得的视频图像数据进行叠加；步骤405 ;编码模块30对叠加字幕信息后的视频流数据进行重新编码，进ー步该重新编码后的视频流与其它TS流信息组合成新的混合音视频流输出至終端用户设备。以上仅是本实用新型的优选实施方式，本实用新型的保护范围并不仅局限于上述实施例，凡属于本实用新型思路下的技术方案均属于本实用新型的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本实用新型原理前提下的若干改进和润饰，应视为本实用新型的保护范围。
权利要求1.一种面向实时首视频流的子.置加系统，其特征在于，包括字幕内容服务设备(10)，用以对叠加的字幕信息脚本进行制作；字幕机(20)，用以对实时音视频流进行字幕叠加；所述字幕内容服务设备(10)与字幕机(20)相连并将制作好的字幕信息脚本发送给字幕机(20)；编码模块(30)，与字幕机(20)相连，用以对叠加字幕信息后的视频流数据进行重新编码，并将重新编码后的视频流与其它TS流信息组合成新的混合音视频流输出至終端用户设备。
2.根据权利要求I所述的面向实时音视频流的字幕叠加系统，其特征在于，所述字幕机(20)包括解码模块(201 )，用以对音视频流进行解码并获得每帧图像数据；字幕叠加模块(202)，包括解析単元(2021)和叠加单元(2022),所述解析単元(2021)用以对字幕内容服务设备(10)发送来的字幕信息脚本进行解析，且将获得的字幕信息添加在OSD层上，生成字幕画面；所述叠加単元(2022)用以将解析単元(2021)生成的字幕画面叠加到视频层上，并输出至编码模块(30)。
3.根据权利要求2所述的面向实时音视频流的字幕叠加系统，其特征在于所述解码模块(201)中还包括一用以对前端传送的音视频流数据进行解码的解码单元。
4.根据权利要求2所述的面向实时音视频流的字幕叠加系统，其特征在于所述解析単元(2021)还包括一用以存储字幕信息脚本的存储器。
5.根据权利要求2所述的面向实时音视频流的字幕叠加系统，其特征在于所述解码丰旲块(201)和子.置加ホ吴块(202)为机顶盒王芯片。
专利摘要本实用新型公开了一种面向实时音视频流的字幕叠加系统，包括字幕内容服务设备，用以对叠加的字幕信息脚本进行制作；字幕机，用以对实时音视频流进行字幕叠加；所述字幕内容服务设备与字幕机相连并将制作好的字幕信息脚本发送给字幕机；编码模块，与字幕机相连，用以对叠加字幕信息后的视频流数据进行重新编码，并将重新编码后的视频流与其它TS流信息组合成新的混合音视频流输出至终端用户设备。本实用新型具有结构简单紧凑、成本低廉、操作简便，可以实现字幕的实时叠加，满足了电视前端在任意时刻对音视频流进行字幕叠加的需求。
文档编号H04N5/278GK202406198SQ201120558388
公开日2012年8月29日申请日期2011年12月28日优先权日2011年12月28日
发明者赵欢, 陈佐申请人:湖南大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵欢;陈佐
技术所有人：湖南大学
我是此专利的发明人

上一篇：一种基于xpon系统的新型光线路终端olt的制作方法
上一篇：一种基于云计算的信息汇集装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。