交互式视频设备及其字幕叠加方法

文档序号：7888814阅读：361来源：国知局

专利名称：交互式视频设备及其字幕叠加方法
技术领域：
本发明涉及一种交互式视频设备及其字幕叠加方法，更确切地说是涉及一种交互式视频设备及其中采用的软件字幕叠加方法，通过本发明的软件字幕叠加方法，可以实现会议电视系统中字幕的简单生成和与图像信号的合而为一发送。
显然这种方式有以下缺陷需要额外的字幕叠加硬件设备，这就增加了系统的复杂程度，增加了系统成本；由于字幕叠加设备串在会议电视设备和电视机之间，叠加的字幕只能在本端的电视机上显示，不能传送至会议电视系统的其他远端电视机显示，使用不甚方便。
本发明的基本思想是采用字幕叠加软件接收控制层传来的欲生成字幕的信息，据此生成透明底色的字幕图像，叠加在图像上，生成合而为一的带字幕图像，送去显示或传输。
根据本发明一个方面，提供了一种用于交互式视频设备的字幕叠加方法，其采用控制层接收用户对欲生成的字幕的设置，其特征在于进一步包含以下步骤A、采用字幕生成模块，接收控制层传来的欲生成字幕的信息，据此生成透明底色的字幕图像；B、采用字幕叠加模块，将所述的字幕图像叠加在数字业务图像上，生成带字幕的图像在本端显示或向远端传输。
较佳地，所述控制层传给所述字幕生成模块的欲生成字幕的信息包含字幕所有字符的区位码、字幕位置信息、字幕大小信息、和字幕颜色信息。
较佳地，所述控制层传给所述字幕生成模块的欲生成字幕的信息包含欲生成字幕所有字符的区位码，这些字符的区位码通过以下步骤生成采用字库生成工具，选用矢量字体，根据要显示的字体大小，用程序将字符一个个在PC屏幕上显示，然后把输出的结果作为图像点阵记录下来，按照特定格式保存成字库文件。
较佳地，所述控制层传来的欲生成字幕的信息包含字幕颜色信息，所述的字幕生成模块根据该字幕颜色信息，设置或改变字符的颜色，并保持字幕图像的底色为透明不变。
较佳地，在步骤A中，字幕生成模块接收控制层传来的欲生成字幕的信息，根据控制层选择的显示位置和内容，读取所有字符的点阵，组合成一幅包含彩色字幕的透明底色的字幕图像。
较佳地，控制层可以选择字幕图像在本端叠加或在远端叠加，并且在控制层选择本端叠加的情况下，字幕图像被叠加到解码之后的本端接收业务图像中，输出至本端显示；在控制层选择远端叠加的情况下，字幕图像被叠加到编码之前的本端发送业务图像中，编码后发送到远端。
根据本发明的另一个方面，提供了一种交互式视频设备，其采用控制层接收用户对欲生成的字幕的设置，其特征在于包含字幕生成模块和字幕叠加模块，其中字幕生成模块，接收控制层传来的欲生成字幕的信息，据此生成透明底色的字幕图像；字幕叠加模块，将所述的字幕图像叠加在数字业务图像上，生成带字幕的图像在本端显示或向远端传输。
较佳地，所述的字幕生成模块接收控制层传来的欲生成字幕的信息，根据控制层选择的显示位置和内容，读取所有字符的点阵，组合成一幅包含彩色字幕的透明底色的字幕图像。
较佳地，所述的字幕叠加模块设置在编解码器中，位于图像编解码模块之前；所述的字幕生成模块设置在该编解码器中，与该字幕叠加模块连接。
较佳地，所述的字幕叠加模块包含第一字幕叠加模块和第二字幕叠加模块，所述的字幕生成模块包含第一字幕生成模块和第二字幕生成模块，其中第一字幕叠加模块，设置在编码器中，位于图像编码模块之前的业务通道上；第一字幕生成模块，设置在编码器中，与该第一字幕叠加模块连接；第二字幕叠加模块，设置在解码器中，位于图像解码模块之后的业务通道上；第二字幕生成模块，设置在解码器中，与该第二字幕叠加模块连接。
本发明具有以下优点1、用字幕叠加软件，取代了原来的字幕叠加设备显然减少了硬件设备、降低了系统成本；2、本发明的方法，只需要在第一帧显示时生成字幕图像，在后面的帧里只需要一个简单的叠加过程，不需要对每帧扫描图像，提高了处理速度，尤其是在全屏字幕的情况下；3、本发明叠加的字幕和图像是组合生成一幅合而为一的带字幕图像进行传送，所以即是使用国外的终端设备也可以显示中文字幕；4、字幕叠加软件置放于会议电视终端的硬件平台上，从而可以自由地选择本端和远端叠加，彻底解决了不能传送远端显示的弊端。
图3示出了本发明的单DSP平台字幕叠加实施例框图；图4示出了本发明的双DSP平台的字幕叠加实施例框图。
如图2所示，字幕叠加软件模块产生的字幕图像，经过一个开关分别接到编码器的字幕叠加或者解码器的字幕叠加；选择本端时，开关接通解码器，字幕图像经开关送到解码器的字幕叠加，与解码器解码后的图像叠加，送至电视机显示；选择远端时，开关接通编码器，字幕图像经开关送至编码器，和摄像机送来的图像叠加，叠加后的带字幕的图像送至编码器编码后，传送道传输信道上，向远端传送。
考虑到字体优美和大字体，不直接采用一般使用的点阵字库，而采用矢量字库来生成的办法。根据需要选择好字体(可以使用控制层WINDOWS使用的任何一种矢量字体)和要显示的字体大小，用程序将字符一个个在PC屏幕上显示，然后把输出的结果作为图像点阵记录下来，存成自定义的格式，保存成字库文件。用此方法只要改变参数就可以生成不同字体，不同大小的字库。
根据控制层选定的颜色，直接改变字幕图像的颜色，并保持底色为透明不变。控制层配置字幕颜色时，可以使用调色板来选取颜色，颜色十分丰富。改变颜色软件的实现也比较简单、灵活。
控制层把设置好的字幕内码和字幕颜色信息传递到该软件模块，该软件模块首先根据要叠加字幕字数和大小，生成一个YUV420格式的图像，大小正好包括字幕，填上透明色，再根据字幕内容的点阵和设置的颜色在该图像上依次打点，生成一幅包含彩色字幕的透明底色的字幕图像。如此生成一幅字幕图像点阵，再叠加到输入或输出的数字图像中。显然只需要在第一帧显示时生成字幕图像，在后面的帧里只需要一个简单的叠加过程，不需要对每帧扫描字幕点阵，提高了处理速度，尤其是在全屏字幕的情况下更显示出此方法的重要。由此叠加过程可以看出，采用本发明叠加的字幕是和图像合而为一的，即使是使用国外的终端设备也可以观看中文字幕(包括中文会场名)。
该软件模块在进行字幕叠加的时候，可以选择叠加在本端还是远端。如果选择本端时，字幕图像传送至解码器，由解码器来完成，字幕图像被叠加在解码后的图像里，再输出到电视机上显示；选择远端时，字幕图像传送至编码器，由编码器完成字幕图像和图像的叠加，然后将合而为一的带字幕图像编码发送到远端，从而使远端能显示字幕。
图3是一个应用软件字幕叠加的单DSP平台的会议电视终端的框图，图4是一个应用软件字幕叠加的双DSP平台的会议电视终端框图，基本原理相同。由于不涉及到本发明，图3和图4的框图中未示出语音处理部分及数据处理部分。
单DSP平台是指编解码共用一个数字信号处理器DSP完成；双DSP平台是指编解码分别各使用一个数字信号处理器DSP。
以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。
权利要求
1.一种用于交互式视频设备的字幕叠加方法，采用控制层接收用户对欲生成的字幕的设置，其特征在于进一步包含以下步骤A、采用字幕生成模块，接收控制层传来的欲生成字幕的信息，据此生成透明底色的字幕图像；B、采用字幕叠加模块，将所述的字幕图像叠加在数字业务图像上，生成带字幕的图像在本端显示或向远端传输。
2.如权利要求1所述的一种用于交互式视频设备的字幕叠加方法，其特征在于所述控制层传给所述字幕生成模块的欲生成字幕的信息包含字幕所有字符的区位码、字幕位置信息、字幕大小信息、和字幕颜色信息。
3.如权利要求1所述的一种用于交互式视频设备的字幕叠加方法，其特征在于，所述控制层传给所述字幕生成模块的欲生成字幕的信息包含欲生成字幕所有字符的区位码，这些字符的区位码通过以下步骤生成采用字库生成工具，选用矢量字体，根据要显示的字体大小，用程序将字符一个个在PC屏幕上显示，然后把输出的结果作为图像点阵记录下来，按照特定格式保存成字库文件。
4.如权利要求1所述的一种用于交互式视频设备的字幕叠加方法，其特征在于所述控制层传来的欲生成字幕的信息包含字幕颜色信息，所述的字幕生成模块根据该字幕颜色信息，设置或改变字符的颜色，并保持字幕图像的底色为透明不变。
5.如权利要求1所述的一种用于交互式视频设备的字幕叠加方法，其特征在于，在步骤A中，字幕生成模块接收控制层传来的欲生成字幕的信息，根据控制层选择的显示位置和内容，读取所有字符的点阵，组合成一幅包含彩色字幕的透明底色的字幕图像。
6.如权利要求1所述的一种用于交互式视频设备的字幕叠加方法，其特征在于，控制层可以选择字幕图像在本端叠加或在远端叠加，并且在控制层选择本端叠加的情况下，字幕图像被叠加到解码之后的本端接收业务图像中，输出至本端显示；在控制层选择远端叠加的情况下，字幕图像被叠加到编码之前的本端发送业务图像中，编码后发送到远端。
7.一种交互式视频设备，采用控制层接收用户对欲生成的字幕的设置，其特征在于包含字幕生成模块和字幕叠加模块，其中字幕生成模块，接收控制层传来的欲生成字幕的信息，据此生成透明底色的字幕图像；字幕叠加模块，将所述的字幕图像叠加在数字业务图像上，生成带字幕的图像在本端显示或向远端传输。
8.如权利要求7所述的一种交互式视频设备，其特征在于所述的字幕生成模块接收控制层传来的欲生成字幕的信息，根据控制层选择的显示位置和内容，读取所有字符的点阵，组合成一幅包含彩色字幕的透明底色的字幕图像。
9.如权利要求7所述的一种交互式视频设备，其特征在于，所述的字幕叠加模块设置在编解码器中，位于图像编解码模块之前；所述的字幕生成模块设置在该编解码器中，与该字幕叠加模块连接。
10.如权利要求7所述的一种交互式视频设备，其特征在于，所述的字幕叠加模块包含第一字幕叠加模块和第二字幕叠加模块，所述的字幕生成模块包含第一字幕生成模块和第二字幕生成模块，其中第一字幕叠加模块，设置在编码器中，位于图像编码模块之前的业务通道上；第一字幕生成模块，设置在编码器中，与该第一字幕叠加模块连接；第二字幕叠加模块，设置在解码器中，位于图像解码模块之后的业务通道上；第二字幕生成模块，设置在解码器中，与该第二字幕叠加模块连接。
全文摘要
本发明公开了一种交互式视频设备及其字幕叠加方法，可以用于会议电视系统实现字幕生成和叠加。其使用字幕软件模块生成需要的字幕图像，并叠加在图像上；该字幕软件根据控制层选定的字幕内容、字体和颜色等字幕信息预先统一组合生成一幅字幕图像点阵，选择性地叠加在本端或远端的图像信号上，并与图像信号融合在一起。该技术可以在减少硬件设备、降低系统成本的同时，更灵活、更方便地实现字幕叠加，并实现了字幕的远端传送。
文档编号H04N7/087GK1413028SQ0113629
公开日2003年4月23日申请日期2001年10月15日优先权日2001年10月15日
发明者汪洪源, 龙彦波, 王静申请人:华为技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪洪源;龙彦波;王静
技术所有人：华为技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。