一种提高翻译效率的系统及方法

文档序号:6574478阅读:280来源:国知局
专利名称:一种提高翻译效率的系统及方法
技术领域
本发明涉及一种提高翻译效率的系统及方法。
背景技术
随着国际化趋势的日益加剧,国际间交流越来越频繁,有大量的文件需要翻译,翻译量越来越大,需要大量的人力和时间。尤其是其中大量存在、频繁出现的地名、人名、数字、长度、重量等变量信息,极易出现翻译错误,而且不容易校对出来。如何实现翻译的自动化,以降低人力的消耗,减小翻译人员的工作量,同时提高翻译的质量,是一个急待解决的问题。

发明内容
为了降低人力的消耗,减小翻译人员的工作量,本发明提供一种提高翻译效率的系统。
本发明的技术方案如下本发明提供一种提高翻译效率的系统,包括变量信息识别数据库、变量规则数据库、双语对照数据库、变量识别模块、格式化模块、对比模块、变量替换模块、翻译模块和结果输出模块。
变量信息识别数据库中包含有用于变量识别的数据记录;变量规则数据库包含有大量带有变量信息的句子的译文和翻译规则;双语对照数据库中包含有大量信息的双语对照数据记录;变量识别模块调用信息识别数据库中的数据记录识别出语句中的变量信息,输出变量信息定义列表;格式化模块利用变量识别模块输出的变量信息定义列表,将待译句中的变量信息替换成定义的格式,输出变量信息替换成定义的格式的句子;对比模块将变量信息替换成定义的格式的句子格式化模块输出的变量信息替换成定义的格式的句子在变量规则数据库中进行比对,若译句不存在,提示译句不存在并结束对该句的翻译(可改由人工翻译后再继续后续步骤),若译句存在,则输出变量信息替换成定义的格式的译句并进行后边的步骤;变量替换模块根据变量识别模块输出的变量信息定义列表,对对比模块输出的变量信息替换成定义的格式的译句中的定义格式替换为对应的变量;翻译模块调用双语对照数据库的数据,将定义格式已经替换为对应的变量的译句中的变量进行翻译;结果输出模块输出完整的译句。
所述的变量是指表示常用信息的符号,比如表示地址、数字、电话、信箱、尺寸、重量、日期、时间、长度、温度、面积、体积和货币信息的符号。相应的,所述的变量信息识别数据库中包含的用于变量识别的数据记录,是指表示常用信息,比如地址、数字、电话、信箱、尺寸、重量、日期、时间、长度、温度、面积、体积和货币信息,的数据记录。
所述的变量规则数据库包含有大量带有变量信息的句子的译文,是指经过对已经翻译过的双语对的综合分析,找到其中的共同点,然后将可变部分进行类型替换而形成规则记录。变量规则数据库中的主要字段有原文格式化信息,译文格式化信息。
所述的双语对照数据库中包含有大量信息的双语对照数据记录,是指用于翻译时使用的电子词典,词典中含有大部分常用单词及其词义。
所述的变量识别模块调用信息识别数据库中的数据记录识别出语句中的变量信息,输出变量信息定义列表,是指将待识别内容放到识别数据库中去比较,找出待识别内容中包含的在识别数据库中存在的所有类型,按照出现的前后顺序进行排列。被识别为变量的原始内容称为原始变量。
所述的格式化模块利用变量识别模块输出的变量信息定义列表,将待译句中的变量信息替换成定义的格式,输出变量信息替换成定义的格式的句子,是指根据识别模块输出的变量信息列表对待识别内容进行格式化,生成一条与待识别内容相对应的格式化信息。
所述的格式化信息,是指保留识别模块未识别的内容,将已经识别出来的内容按照种类和顺序进行排列而成的与待识别内容相似的内容。
所述的对比模块将变量信息替换成定义的格式的句子,格式化模块输出的变量信息替换成定义的格式的句子(格式化原文)在变量规则数据库中进行比对,输出变量信息替换成定义的格式的译句(格式化译文),是指将格式化模块输出的格式化信息到变量规则数据库中进行查找,找到与格式化信息完全一样的记录,得到这条记录的译文格式化信息。若在数据库中不存在对应的规则记录,则提示译文不存在并放弃对该句的翻译。
所述的变量替换模块根据变量识别模块输出的变量信息定义列表,对对比模块输出的变量信息替换成定义的格式的译句中的定义格式替换为对应的变量,是指分析对比模块输出的译文格式化信息中的变量,按照种类和顺序替换为待识别内容中的对应种类和顺序的原始变量。替换后的内容为准译句。
所述的翻译模块调用双语对照数据库的数据,将定义格式已经替换为对应的变量的译句中的变量进行翻译,是指对准译句中的变量进行翻译,然后将翻译的结果替换回去。
本发明还提供使用上述提高翻译效率的系统的方法,包括步骤如下(1)变量识别模块调用信息识别数据库中的数据记录识别出语句中的变量信息,输出变量信息定义列表;(2)格式化模块利用变量识别模块输出的变量信息定义列表,将待译句中的变量信息替换成定义的格式,输出变量信息替换成定义的格式的句子;(3)对比模块将变量信息替换成定义的格式的句子拼接模块输出的变量信息替换成定义的格式的句子在变量规则数据库中进行比对,找到与格式化信息相同的规则记录,得到这条记录的译文格式化信息并继续后边的步骤,若数据库中不存在匹配的规则记录,则提示译文不存在,放弃对该句的翻译(可改由人工翻译后再继续后续步骤);(4)变量替换模块根据变量识别模块输出的变量信息定义列表,对对比模块输出的变量信息替换成定义的格式的译句中的定义格式替换为对应的变量;(5)翻译模块调用双语对照数据库的数据,将定义格式已经替换为对应的变量的译句中的变量进行翻译;(6)结果输出模块输出完整的译句。
本发明实现的效果如下利用本发明提供的提高翻译效率的系统,可以实现翻译的自动化,尤其是文档中大量存在的常用变量的自动化翻译,可以降低人力的消耗,减小翻译人员的工作量,同时保证了翻译的质量。
采用本发明提供的提高翻译效率的系统,通过将待译句子进行转换后格式化句,提高了待译句子在变量规则数据库中匹配到相应记录的几率,并同时对待译句按照既定的规则进行了语序调整,再对其中发生变化的变量进行简单的翻译即可,从而提高了翻译效率。


附图1提高翻译效率的系统结构示意图;附图2提高翻译效率的方法流程示意图;附图3提高翻译效率的方法流程框图;附图4实施例示例用文档;附图5变量识别模块输出的变量信息定义列表;附图6格式化模块输出的变量信息替换成定义的格式的句子;附图7对比模块得到的译文格式化信息;附图8变量替换模块替换后的信息;附图9翻译模块对变量进行翻译后的信息;附图10结果输出模块输出的译句。
具体实施例方式
本实施例提供一种提高翻译效率的系统,如图1所示,包括变量信息数据库、变量规则数据库、双语对照数据库、变量识别模块、格式化模块、对比模块、变量替换模块、翻译模块和结果输出模块。
变量信息识别数据库中包含有用于变量识别的数据记录;变量规则数据库包含有大量带有变量信息的句子的译文和翻译规则;双语对照数据库中包含有大量信息的双语对照数据记录;变量识别模块调用信息识别数据库中的数据记录识别出语句中的变量信息,输出变量信息定义列表;格式化模块利用变量识别模块输出的变量信息定义列表,将待译句中的变量信息替换成定义的格式,输出变量信息替换成定义的格式的句子;对比模块将变量信息替换成定义的格式的句子格式化模块输出的变量信息替换成定义的格式的句子在变量规则数据库中进行比对,得到这条记录的译文格式化信息并继续后边的步骤,若数据库中不存在匹配的规则记录,则提示译文不存在,放弃对该句的翻译(可改由人工翻译后再继续后续步骤);变量替换模块根据变量识别模块输出的变量信息定义列表,对对比模块输出的变量信息替换成定义的格式的译句中的定义格式替换为对应的变量;翻译模块调用双语对照数据库的数据,将定义格式已经替换为对应的变量的译句中的变量进行翻译;结果输出模块输出完整的译句。
所述的变量是指表示常用信息的符号,比如表示地址、数字、电话、信箱、尺寸、重量、日期、时间、长度、温度、面积、体积和货币信息的符号。相应的,所述的变量信息识别数据库中包含的用于变量识别的数据记录,是指表示常用信息,比如地址、数字、电话、信箱、尺寸、重量、日期、时间、长度、温度、面积、体积和货币信息,的数据记录。
所述的变量规则数据库包含有大量带有变量信息的句子的译文,是指经过对已经翻译过的双语对的综合分析,找到其中的共同点,然后将可变部分进行类型替换而形成规则记录。变量规则数据库中的主要字段有原文格式化信息,译文格式化信息。
所述的双语对照数据库中包含有大量信息的双语对照数据记录,是指用于翻译时使用的电子词典,词典中含有大部分常用单词及其词义。
所述的变量识别模块调用信息识别数据库中的数据记录识别出语句中的变量信息,输出变量信息定义列表,是指将待识别内容放到识别数据库中去比较,找出待识别内容中包含的在识别数据库中存在的所有类型,按照出现的前后顺序进行排列。被识别为变量的原始内容称为原始变量。
所述的格式化模块利用变量识别模块输出的变量信息定义列表,将待译句中的变量信息替换成定义的格式,输出变量信息替换成定义的格式的句子,是指根据识别模块输出的变量信息列表对待识别内容进行格式化,生成一条与待识别内容相对应的格式化信息。
所述的格式化信息,是指保留识别模块未识别的内容,将已经识别出来的内容按照种类和顺序进行排列而成的与待识别内容相似的内容。
所述的对比模块将变量信息替换成定义的格式的句子格式化模块输出的变量信息替换成定义的格式的句子在变量规则数据库中进行比对,输出变量信息替换成定义的格式的译句,是指将格式化模块输出的格式化信息到变量规则数据库中进行查找,找到与格式化信息完全一样的记录,得到这条记录的译文格式化信息。
所述的变量替换模块根据变量识别模块输出的变量信息定义列表,对对比模块输出的变量信息替换成定义的格式的译句中的定义格式替换为对应的变量,是指分析对比模块输出的译文格式化信息中的变量,按照种类和顺序替换为待识别内容中的对应种类和顺序的原始变量。替换后的内容为准译句。
所述的翻译模块调用双语对照数据库的数据,将定义格式已经替换为对应的变量的译句中的变量进行翻译,是指对准译句中的变量进行翻译,然后将翻译的结果替换回去。
以图4所示文档为例,本实施例使用上述提高翻译效率的系统的优选方法,如图2和图3所示,包括步骤如下(1)变量识别模块调用信息识别数据库中的数据记录识别出语句中的变量信息,输出变量信息定义列表,如图5所示。
13901234567、china@163.com为原始变量;TEL1、EMAIL1为种类,后面的1为顺序号。
(2)格式化模块利用变量识别模块输出的变量信息定义列表,将待译句中的变量信息替换成定义的格式,输出变量信息替换成定义的格式的句子,如图6所示;(3)对比模块将变量信息替换成定义的格式的句子拼接模块输出的变量信息替换成定义的格式的句子在变量规则数据库中进行比对,找到与格式化信息相同的规则记录,得到这条记录的译文格式化信息,如图7所示;(4)变量替换模块根据变量识别模块输出的变量信息定义列表,对对比模块输出的变量信息替换成定义的格式的译句中的定义格式替换为对应的变量,如图8所示;(5)翻译模块调用双语对照数据库的数据,将定义格式已经替换为对应的变量的译句中的变量进行翻译,即翻译[]中的两处信息,如图9所示;(6)结果输出模块输出完整的译句,如图10所示。
应当指出,以上所述具体实施方式
可以使本领域的技术人员更全面地理解本发明,但不以任何方式限制本发明。因此,尽管本说明书参照附图和实施例对本发明已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明进行修改或者等同替换;而一切不脱离本发明的精神和范围的技术方案及其改进,其均应涵盖在本发明专利的保护范围当中。
权利要求
1.一种提高翻译效率的系统,包括变量信息识别数据库、变量规则数据库、双语对照数据库、变量识别模块、格式化模块、对比模块、变量替换模块、翻译模块和结果输出模块,其中,变量信息识别数据库中包含有用于变量识别的数据记录;变量规则数据库包含有大量带有变量信息的句子及其译文和翻译规则;双语对照数据库中包含有大量信息的双语对照数据记录;变量识别模块调用信息识别数据库中的数据记录识别出语句中的变量信息,输出变量信息定义列表;格式化模块利用变量识别模块输出的变量信息定义列表,将待译句中的变量信息替换成定义的格式,输出变量信息替换成定义的格式的句子;对比模块将变量信息替换成定义的格式的句子格式化模块输出的变量信息替换成定义的格式的句子在变量规则数据库中进行比对,若匹配的规则不存在,提示译句不存在,若匹配的规则存在,则输出变量信息替换成定义的格式的译句;变量替换模块根据变量识别模块输出的变量信息定义列表,对对比模块输出的变量信息替换成定义的格式的译句中的定义格式替换为对应的变量;翻译模块调用双语对照数据库的数据,将定义格式已经替换为对应的变量的译句中的变量进行翻译;结果输出模块输出完整的译句。
2.根据权利要求1所述提高翻译效率的系统,其特征在于,所述的变量是指表示地址、数字、电话、信箱、尺寸、重量、日期、时间、长度、温度、面积、体积和货币信息的符号;所述的变量信息识别数据库中包含的用于变量识别的数据记录,是指表示地址、数字、电话、信箱、尺寸、重量、日期、时间、长度、温度、面积、体积和货币信息的数据记录。
3.根据权利要求2所述提高翻译效率的系统,其特征在于,所述的变量规则数据库包含有大量带有变量信息的句子的译文,是指经过对已经翻译过的双语对的综合分析,找到其中的共同点,然后将可变部分进行类型替换而形成规则记录。
4.根据权利要求2所述提高翻译效率的系统,其特征在于,所述的双语对照数据库中包含有大量信息的双语对照数据记录,是指用于翻译时使用的电子词典,词典中含有大部分常用单词及其词义。
5.根据权利要求2所述提高翻译效率的系统,其特征在于,所述的变量识别模块调用信息识别数据库中的数据记录识别出语句中的变量信息,输出变量信息定义列表,是指将待识别内容放到识别数据库中去比较,找出待识别内容中包含的在识别数据库中存在的所有类型,按照出现的前后顺序进行排列。
6.根据权利要求2所述提高翻译效率的系统,其特征在于,所述的格式化模块利用变量识别模块输出的变量信息定义列表,将待译句中的变量信息替换成定义的格式,输出变量信息替换成定义的格式的句子,是指根据识别模块输出的变量信息列表对待识别内容进行格式化,生成一条与待识别内容相对应的格式化信息。
7.根据权利要求2所述提高翻译效率的系统,其特征在于,所述的格式化信息,是指保留识别模块未识别的内容,将已经识别出来的内容按照种类和顺序进行排列而成的与待识别内容相似的内容。
8.根据权利要求2所述提高翻译效率的系统,其特征在于,所述的对比模块将变量信息替换成定义的格式的句子格式化模块输出的变量信息替换成定义的格式的句子在变量规则数据库中进行比对,输出变量信息替换成定义的格式的译句,是指将格式化模块输出的格式化信息到变量规则数据库中进行查找,找到与格式化信息完全一样的记录,得到这条记录的译文格式化信息。
9.根据权利要求2所述提高翻译效率的系统,其特征在于,所述的变量替换模块根据变量识别模块输出的变量信息定义列表,对对比模块输出的变量信息替换成定义的格式的译句中的定义格式替换为对应的变量,是指分析对比模块输出的译文格式化信息中的变量,按照种类和顺序替换为待识别内容中的对应种类和顺序的原始变量。替换后的内容为准译句。
10.根据权利要求2所述提高翻译效率的系统,其特征在于,所述的翻译模块调用双语对照数据库的数据,将定义格式已经替换为对应的变量的译句中的变量进行翻译,是指对准译句中的变量进行翻译,然后将翻译的结果替换回去。
11.使用权利要求1-10任意一项所述提高翻译效率的系统的方法,包括步骤如下(1)变量识别模块调用信息识别数据库中的数据记录识别出语句中的变量信息,输出变量信息定义列表;(2)格式化模块利用变量识别模块输出的变量信息定义列表,将待译句中的变量信息替换成定义的格式,输出变量信息替换成定义的格式的句子;(3)对比模块将变量信息替换成定义的格式的句子拼接模块输出的变量信息替换成定义的格式的句子在变量规则数据库中进行比对,找到与格式化信息相同的规则记录,得到这条记录的译文格式化信息并继续后边的步骤,若数据库中不存在匹配的规则记录,则提示译文不存在,放弃对该句的翻译;(4)变量替换模块根据变量识别模块输出的变量信息定义列表,对对比模块输出的变量信息替换成定义的格式的译句中的定义格式替换为对应的变量;(5)翻译模块调用双语对照数据库的数据,将定义格式已经替换为对应的变量的译句中的变量进行翻译;(6)结果输出模块输出完整的译句。
全文摘要
本发明涉及一种提高翻译效率的系统及方法。本发明提供一种提高翻译效率的系统,包括变量信息识别数据库、变量规则数据库、双语对照数据库、变量识别模块、格式化模块、对比模块、变量替换模块、翻译模块和结果输出模块,本发明还提供使用上述提高翻译效率的系统的方法。利用本发明提供的提高翻译效率的系统,可以实现翻译的自动化,尤其是文档中大量存在的常用变量的自动化翻译。
文档编号G06F17/30GK101034394SQ20071008668
公开日2007年9月12日 申请日期2007年3月30日 优先权日2007年3月30日
发明者何战涛 申请人:传神联合(北京)信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1