标签保护方法

文档序号:6436015阅读:399来源:国知局
专利名称:标签保护方法
技术领域
本发明涉及一种文字处理技术,具体说,涉及一种标签保护方法。
背景技术
HTML (Hypertext Markup Language,文本标记语言)是用于描述网页文档的一种标记语言。XML(Extensible Markup Language,可扩展标记语言),它与HTML—样,都是 SGML (Standard Generalized Markup Language,标准通用标记语言);Xml 是 Internet 环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。在使用计算机辅助翻译的过程中,有一个环节是修改译文,这就要求准确无误。特别是在携带了标签的译文翻译中极其容易修改到标签和标签里面的内容。目前解决该技术问题的方案大都采取高亮警示或隐藏标签的处理方式,有着多种弊端。高亮警示方式无法避免疲劳删除和误删,隐藏标签彻底排除了标签的同时也破坏了原译文格式的完整性。

发明内容
有鉴于现有技术无法避免高效地翻译过程中译文被误修改或者无法看到整个译文造成翻译失误的问题,本发明提供了一种标签保护方法,彻底消除人为误修改造成翻译译稿质量低下的问题。技术方案如下一种标签保护方法,包括编制识别规则,所述识别规则用于识别网页内容中包含有标签的一段文本内容;读取文本,根据所述识别规则识别输入文本中的标签;获取所述输入文本中所有标签在文本框内的起始索引和长度,所述起始索引和长度记录有保护内容在文本里的地址信息;根据起始索引和长度,对识别出的有效标签进行标记并实现保护。进一步所述标签包括html标签、xml标签或者类似 <> 标签。进一步根据识别规则识别输入文本中的标签过程中,判定为含标签文本后,以从头到尾的顺序找到标签,并记录下每个标签在文本里的起始索引和该标签的长度。进一步采用染色或者高亮显示的方式对有效标签进行标记。技术效果包括1、利用本发明,在翻译译文的过程中能够保证译文格式完整性的同时,高亮标签界定出标签的保护范围,实现高亮保护色块,彻底消除人为误修改造成翻译译稿质量低下的问题。2、使用本发明标签保护,可以兼顾译文内容的完整与翻译的有的放矢,避免误修改,达到提高翻译效率和稿件质量的效果。


图1是本发明中标签保护方法的流程图;图2是本发明中标签保护方法实现的用户界面(User Interface, UI)界面图,其中颜色高亮部分为标签保护范围。
具体实施例方式下面参考附图和优选实施例,对本发明技术方案作详细描述。步骤1 编制识别规则,识别规则用于识别网页内容中包含标签的一段文本内容;本发明所提供的标签保护涉及到的标签包括html标签、xml标签及类似 标签。Uhtml标签识别规则用于识别网页内容和凡包含了 html标签的一段文本内容。以html标签为例,读取了一段文本后,使用正则表达式识别html标签。关于要保护的html标签的识别规则见下表表Ihtml标签识别规则
权利要求
1.一种标签保护方法,包括编制识别规则,所述识别规则用于识别网页内容中包含有标签的一段文本内容; 读取文本,根据所述识别规则识别输入文本中的标签;获取所述输入文本中所有标签在文本框内的起始索引和长度,所述起始索引和长度记录有保护内容在文本里的地址信息;根据起始索引和长度,对识别出的有效标签进行标记并实现保护。
2.如权利要求1所述的标签保护方法,其特征在于所述标签包括html标签、xml标签或者类似 标签。
3.如权利要求2所述的标签保护方法,其特征在于根据识别规则识别输入文本中的标签过程中,判定为含标签文本后,以从头到尾的顺序找到标签,并记录下每个标签在文本里的起始索引和该标签的长度。
4.如权利要求1至3任一项所述的标签保护方法,其特征在于采用染色或者高亮显示的方式对有效标签进行标记。
全文摘要
本发明公开了一种标签保护方法,包括编制识别规则,所述识别规则用于识别网页内容中包含有标签的一段文本内容;读取文本,根据所述识别规则识别输入文本中的标签;获取所述输入文本中所有标签在文本框内的起始索引和长度,所述起始索引和长度记录有保护内容在文本里的地址信息;根据起始索引和长度对识别出的有效标签进行标记并实现保护。本发明技术方案彻底消除了人为误修改所造成翻译译稿质量低下的问题。
文档编号G06F17/28GK102495835SQ20111032164
公开日2012年6月13日 申请日期2011年10月21日 优先权日2011年10月21日
发明者江潮 申请人:传神联合(北京)信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1