一种多语种双向混排字幕的编辑系统的制作方法

文档序号:6585058阅读:175来源:国知局
专利名称:一种多语种双向混排字幕的编辑系统的制作方法
技术领域
本发明涉及字幕制作的技术领域,特别是涉及一种多语种双向混排字幕的编辑系 统。
背景技术
目前,随着世界经济的发展,国际交流与合作的扩大,作为最重要的信息载体的文 字必然受到影响。过去几乎都是单一语种的文档,而今的文档往往以某一语种文字为主,同 时混排了其他的语种文字,最常见的莫过于中英文混排,当然还有俄文、法文、日文、阿拉伯 文等其他语种的混排。在广播、电视、电影等领域的国际节目制作中,对多语种混排字幕的 需求也越来越迫切。在视频节目中多语种混排的字幕,不仅要求内容正确,而且要求视觉效果,同时要 求制作的快捷简便。然而,由于各语种的语言结构、文字符号的复杂多样性,多语种的混排 问题仍有很多。尤其是从右至左排列的阿拉伯语、希伯来语、波斯语等文字,与从左至右排 列的中、英等文字的混排中,操作极为复杂。现有技术中,对于既含阿拉伯文等从右至左排列的文本、又含中英文等从左至右 排列的文本的混编字幕的制作,或者是单一小语种字幕(如阿拉伯语、希伯来语、波斯语或 乌尔都语)的制作,制作人员往往需要在不同的文本编辑框内编辑单一语种文字,然后进 行拼接;或者,需要采用不同的文本图像编辑软件制作存成图片使用。并且一旦涉及在两种 排列规则中通用的符号,还需要进一步针对该通用符号进行处理,因此工作量很大,效率很 低,无法满足实际中国际节目的增多、直播节目的需求。

发明内容
本发明所要解决的技术问题是提供一种多语种双向混排字幕的编辑系统,用以简 化多语种字幕的编排,提高多语种字幕的制作效率。为了解决上述技术问题,本发明实施例公开了一种多语种双向混排字幕的编辑系 统,包括文本单元编排模块,用于将一行内连续且属于同一语种的字幕文本字符分割为文 本单元,并在文本单元内将所述字符按其语种的排列规则进行编排;语种排列判断模块,用于判断相邻文本单元的语种是否对应同样的排列规则,若 是,则触发顺序编排模块;若否,则触发定位编排模块;顺序编排模块,用于按照所述排列规则顺序编排所述文本单元;定位编排模块,用于依据所述排列规则将后一文本单元排入前一文本单元的特定 位置;通用字符编排模块,用于在字幕文本中出现的通用符号时,通过关联与其衔接的 前后文本单元进行编排。优选的,所述相邻文本单元分别为中文、英文、数字和/或通用符号,所述顺序编排模块包括从左向右编排子模块,用于将当前文本单元排于相邻前一文本单元的右侧。优选的,所述相邻文本单元分别为阿拉伯文、希伯来文、波斯文和/或乌尔都文, 所述顺序编排模块包括从右向左编排子模块,用于将当前文本单元排于相邻前一文本单元的左侧。优选的,所述通用字符排版模块包括单向编排子模块,用于当前的单向排列规则将该通用符号排于相应的前后文本单 元之间。优选的,所述相邻文本单元的排列规则分别为,前一文本单元为从右向左排列,后 一文本单元为从左向右排列,所述定位编排模块包括右排子模块,用于在本行内将后一文本单元向右排,直至排于前一文本单元的左 侧。优选的,所述相邻文本单元的排列规则分别为,前一文本单元为从左向右排列,后 一文本单元为从右向左排列,所述定位编排模块包括左排子模块,用于在本行内将后一文本单元向左排,直至排于前一文本单元最远 端的左侧。优选的,所述通用字符排版模块包括双向混排子模块,用于在本行内将该符号向左排于前一文本单元最远端的左侧。优选的,所述最远端通过以下规则确定,在所述前一文本单元的前向相邻文本单 元同为从左向右排列的文本单元时,继续向前判定,直到获得前向相邻文本单元为从右向 左排列的文本单元为止,则当前从左向右排列的文本单元为最远端。优选的,所述通用字符排版模块包括成组字符编排子模块,用于在所述通用符号为成对出现的符号时,采用该组符号 内文本单元的排列规则进行排版。优选的,所述字幕文本采用Unicode编码。与现有技术相比,本发明具有以下优点本发明以行为单位,并把一行内的字幕文本按照其连续、同语种的特性分割为多 个文本单元,如一行内的字幕文本为一组中文字符、一组英文字符和一组数字组成,并且, 文本单元内的字符按其语种的排列规则进行编排,在编排相邻的两个文本单元时,若二者 的语种具有一致的排列规则,如同为从左向右,或同为从右向左,则按照相应的排列规则顺 序编排这两个相邻文本单元。若二者的语种对应不同的排列规则,如前一文本单元为从左 向右排列,后一文本单元为从右向左排列,则依据所述排列规则将后一文本单元排入前一 文本单元的特定位置。并且,在字幕文本中出现的通用符号时,还可以通过关联与其衔接的 前后文本单元确定其排版方向。应用本发明在对多语种的文本进行处理时,无需针对各个语种分别编辑后再进行 拼接,也无需处理成图片,用户只需要按照其输入习惯输入文本,就会依据该文本语种的排 列规则对文本进行编排,从而有效简化多语种双向混排字幕的编辑系统,提高多语种双向 混排字幕的编辑系统效率。充分满足了当前国际节目的增多、直播节目的需求。


图1是本发明的一种多语种双向混排字幕的编辑系统的结构框图。
具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本发明作进一步详细的说明。本发明可用于众多通用或专用的计算系统环境或配置中。例如多处理器系统、服 务器、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序 模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组 件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由 通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以 位于包括存储设备在内的本地和远程计算机存储介质中。字幕一般指以文字形式显示电视、电影、舞台作品里面的对话等非影像内容,也泛 指影视作品后期加工的文字。例如,影视作品的对话字幕,一般出现在屏幕下方;而戏剧作 品的字幕,则可能显示于舞台两旁或上方。另外,还可以将节目的语音内容以字幕方式显 示,可以帮助听力较弱的观众理解节目内容。随着电视事业的发展,字幕在电视中的作用越 来越大,日均播出次数增多,字幕播出的形式多样,字幕制作也更加精美。参考图1,示出了本发明的一种多语种双向混排字幕的编辑系统实施例的结构框 图,具体可以包括以下模块文本单元编排模块101,用于将一行内连续且属于同一语种的字幕文本字符分割 为文本单元,并在文本单元内将所述字符按其语种的排列规则进行编排;语种排列判断模块102,用于判断相邻文本单元的语种是否对应同样的排列规则, 若是,则触发顺序编排模块103 ;若否,则触发定位编排模块104 ;顺序编排模块103,用于按照所述排列规则顺序编排所述文本单元;定位编排模块104,用于依据所述排列规则将后一文本单元排入前一文本单元的 特定位置;通用字符编排模块105,用于在字幕文本中出现的通用符号时,通过关联与其衔接 的前后文本单元进行编排。需要说明的是,所述字幕文本可以采用Unicode编码。Unicode是国际组织制定 的可以容纳世界上所有文字和符号的字符编码方案,它为每种语言中的每个字符设定了统 一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。阿拉伯文包 含32个字母,每个字母因其在词中的首中尾位置具有不同排列形式,但其Unicode编码是 不变的。再者,在实际中,每种语言都提供有缺省的默认字体,例如,中文字体包含中文字符 集,缺省黑体。英文缺省字体Arial。阿拉伯文字符也是字母,缺省也是Arial。在本发明的一种相邻文本单元的语种对应同样排列规则的具体应用中,若当前行 内,所述相邻文本单元分别为中文、英文、数字和/或通用符号,由于中文、英文、数字和通 用符号都是采用从左至右的排列规则,则可以依据从左至右的方向顺序编排所述相邻文本 单元,即所述顺序编排模块103可以包括如下子模块
从左向右编排子模块,用于将当前文本单元排于相邻前一文本单元的右侧。例如,假设某一行内的字幕文本包括中文字符为cl c2,英文字符el e2,数字字符nl n2,则其编排结果可以为cl c2 el e2 nl n2上述下划线指示的一组字符即对应一个文本单元,在本例中,文本单元内部的字 符是按其语种从左向右进行排序,对于相邻两个文本单元而言,在编辑后一文本单元时,会 自动将其排入前一文本单元的右侧。在本发明的另一种相邻文本单元的语种对应同样排列规则的具体应用中,若当前 行内,所述相邻文本单元分别为阿拉伯文、希伯来文、波斯文或乌尔都文,由于阿拉伯文、希 伯来文、波斯文或乌尔都文都是采用从右向左的排列规则,则可以依据从右至左的方向顺 序编排所述相邻文本单元,即所述顺序编排模块103可以包括如下子模块从右向左编排子模块,用于将当前文本单元排于相邻前一文本单元的左侧。例如,假设某一行内的字幕文本包括阿拉伯文字符al a2,波斯文字符bl b2,乌尔都文wl w2。则其编排结果可以为w2 wl b2 bl a2 al同样地,上述下划线指示的一组字符即对应一个文本单元,在本例中,文本单元内 部的字符是按其语种从右向左进行排序,对于相邻两个文本单元而言,在编辑后一文本单 元时,会自动将其排入前一文本单元的左侧。相应地,在上述两种相邻文本单元的语种对应同样排列规则的具体应用中,所述 通用字符排版模块105可以包括如下子模块单向编排子模块,用于当前的单向排列规则将该通用符号排于相应的前后文本单 元之间。以中英文混排字幕为例,因为中文和英文均采用从左向右的排列规则,通用符号 如“.”,“ ’”,“(”,“)”等直接按英文字符处理即可。例如,假设某一行内的字幕文本包括中文字符cl c2,通用符号_,英文字符el e2,则其编排结果可以为cl c2~el e2以阿拉伯文为例,公知的是,阿拉伯文在Unicode中有基本阿拉伯语(U+0060 to U+006FF)和扩充阿拉伯语(U+FE70 to U+FEFF)两种格式,包含所有阿拉伯语字符和符号。 在此Unicode范围内的阿文符号直接按阿拉伯文处理,如
权利要求
1.一种多语种双向混排字幕的编辑系统,其特征在于,包括文本单元编排模块,用于将一行内连续且属于同一语种的字幕文本字符分割为文本单 元,并在文本单元内将所述字符按其语种的排列规则进行编排;语种排列判断模块,用于判断相邻文本单元的语种是否对应同样的排列规则,若是,则 触发顺序编排模块;若否,则触发定位编排模块;顺序编排模块,用于按照所述排列规则顺序编排所述文本单元;定位编排模块,用于依据所述排列规则将后一文本单元排入前一文本单元的特定位置;通用字符编排模块,用于在字幕文本中出现的通用符号时,通过关联与其衔接的前后 文本单元进行编排。
2.如权利要求1所述的系统,其特征在于,所述相邻文本单元分别为中文、英文、数字 和/或通用符号,所述顺序编排模块包括从左向右编排子模块,用于将当前文本单元排于相邻前一文本单元的右侧。
3.如权利要求1所述的系统,其特征在于,所述相邻文本单元分别为阿拉伯文、希伯来 文、波斯文和/或乌尔都文,所述顺序编排模块包括从右向左编排子模块,用于将当前文本单元排于相邻前一文本单元的左侧。
4.如权利要求2或3所述的系统,其特征在于,所述通用字符排版模块包括单向编排子模块,用于当前的单向排列规则将该通用符号排于相应的前后文本单元之间。
5.如权利要求1所述的系统,其特征在于,所述相邻文本单元的排列规则分别为,前一 文本单元为从右向左排列,后一文本单元为从左向右排列,所述定位编排模块包括右排子模块,用于在本行内将后一文本单元向右排,直至排于前一文本单元的左侧。
6.如权利要求1所述的系统,其特征在于,所述相邻文本单元的排列规则分别为,前一 文本单元为从左向右排列,后一文本单元为从右向左排列,所述定位编排模块包括左排子模块,用于在本行内将后一文本单元向左排,直至排于前一文本单元最远端的 左侧。
7.如权利要求5或6所述的系统,其特征在于,所述通用字符排版模块包括 双向混排子模块,用于在本行内将该符号向左排于前一文本单元最远端的左侧。
8.如权利要求7所述的系统,其特征在于,所述最远端通过以下规则确定,在所述前一 文本单元的前向相邻文本单元同为从左向右排列的文本单元时,继续向前判定,直到获得 前向相邻文本单元为从右向左排列的文本单元为止,则当前从左向右排列的文本单元为最 远端。
9.如权利要求1所述的系统,其特征在于,所述通用字符排版模块包括成组字符编排子模块,用于在所述通用符号为成对出现的符号时,采用该组符号内文 本单元的排列规则进行排版。
10.如权利要求1所述的系统,其特征在于,所述字幕文本采用Unicode编码。
全文摘要
本发明公开了一种多语种双向混排字幕的编辑系统,包括文本单元编排模块,用于将一行内连续且属于同一语种的字幕文本字符分割为文本单元,并在文本单元内将所述字符按其语种的排列规则进行编排;语种排列判断模块,用于判断相邻文本单元的语种是否对应同样的排列规则,若是,则触发顺序编排模块;若否,则触发定位编排模块;顺序编排模块,用于按照所述排列规则顺序编排所述文本单元;定位编排模块,用于依据所述排列规则将后一文本单元排入前一文本单元的特定位置;通用字符编排模块,用于在字幕文本中出现的通用符号时,通过关联与其衔接的前后文本单元进行编排。本发明可以简化多语种字幕的编排,提高多语种字幕的制作效率。
文档编号G06F17/24GK102103586SQ20091024196
公开日2011年6月22日 申请日期2009年12月16日 优先权日2009年12月16日
发明者冯永, 沈季, 袁慧晶, 陈丽爱 申请人:新奥特(北京)视频技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1