机器翻译方法和系统的制作方法

文档序号:6585687阅读:212来源:国知局

专利名称::机器翻译方法和系统的制作方法
技术领域
:本发明涉及机器翻译方法和系统,尤其涉及基于形式化处理的机器翻译方法和系统。
背景技术
:将文本从一种语言翻译成另一种语言一般是一项需要有经验的翻译的乏味工作。在出现计算机不久以后,研究人员就开始利用计算机来帮助进行自然语言的翻译。最早的机器翻译(MT)系统取决于大的双语词典,其中记录了对应于一个或多个目标语言(TL)同义词的源语言(SL)词汇。很快,显然由于词典的句法和语法规则是如此复杂,以至于专家不能开发出一个可描述的综合规则集,从而放弃了机器翻译。机器翻译系统一般分为直接翻译、基于转换的翻译或基于中间语言的翻译。在直接翻译方法中,源语言和目标语言之间没有中间表现形式。源语言文本被"直接"处理以将其转换为目标文本。这种处理基本上是一种字对字的翻译,同时进行一些调整。但是由于忽略句子内部结构的所有方面而导致的明显缺陷使得目前的任何机器翻译系统都不采用这种方法。在基于转换的翻译方法中,来自对源文本的不同分析界别的信息被转换成生成的目标文本级别。例如,通过设置在词法级、语法级或由语法构建而成的结构级等的对应关系来实现转换。但是转换方法只适用于特定的语言对,因此必须费心地生成每个语言对。基于中间语言的翻译方法的基础是假设能够定义一种合适的中间表达形式,使源文本能够映射到该中间表达形式,而中间表达形式再映射到目标文本。但在是否能够产生一种真正的语言独立中间表达形式是不清楚的。当前的基于中间语言的系统对其所宣称的中间表达形式的普遍性少有信心。机器翻译专家董振东先生在《机器翻译漫谈》一文中说"近20年左右,机器翻译研究的方法真可谓花样翻新,令人目不暇接。有基于规则的,基于知识的,基于语料库的,基于统计和语料库的,基于例子的,基于对话的等等。从另一种角度,还有直接法、转换法、中间语言法等等。但其中哪一种也未能在翻译质量上取得实质性的突破。"自然语言是非形式化(即,一个形式表示两个或更多意义)的符号系统。对非形式化的源语言进行形式化(即,一个形式表示一个意义)处理是高质量的机器翻译的基础。现有的机器翻译方法未能在翻译质量上取得实质性突破的根本原因是未能对非形式化的源语言进行形式化处理。
发明内容本发明的目的在于解决上述问题,提出了一种机器翻译方法,使得翻译质量取得了实质性突破。本发明的另一目的是提出了一种机器翻译系统。本发明的技术方案为本发明揭示了一种把非形式化的源语言翻译成形式化的目标语言的机器翻译方法,该方法包括步骤一对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段;步骤二以自动方式把形式化的源语言转换成形式化的目标语言——以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段。根据本发明的机器翻译方法的一实施例,在步骤一中,使用替代标记进行预处理——预先使用替代标记把一个初始语段分解成若干个子语段,接着对这些子语段分别进行形式化处理。根据本发明的机器翻译方法的一实施例,步骤一是以交互方式对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,以交互方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以交互方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。根据本发明的机器翻译方法的一实施例,以交互方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果在存储器里存在最前的n,个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,运用一个固定语段模式标注这个固定语段的意义标记,然后,使用者确认或修改,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段并标注这个固定语段的意义标记,然后,处理器切分和标注下一个同定语段。根据本发明的机器翻译方法的一实施例,步骤一是以自动方式对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,以自动方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以自动方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。根据本发明的机器翻译方法的一实施例,以自动方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记、语法属性标记、语义属性标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果,在存储器里,存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,查出存储器里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注这个固定语段的意义标记、语法属性标记、语义属性标记,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,处理器就进行回溯。根据本发明的机器翻译方法的一实施例,以自动方式组合并标注非固定语段的过程进一步包括存储器里的非固定语段模式包含成分语段的语法属性标记、语义属性标记和组合语段的组合标记、核心成分标记、关系标记、语法属性标记、语义属性标记;处理器查出存储器里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式,运用这个非固定语段模式组合一个非固定语段并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记,然后,处理器组合和标注下一个非固定语段,依此类推,直到整个初始语段构成的一个非固定语段;如果处理器查出在存储器里不存在可以运用的非固定语段模式,处理器就进行回溯。根据本发明的机器翻译方法的一实施例,在步骤二中,处理器查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段,目标语言的固定语段带有意义标记;在使用者点击目标语言的固定语段的意义标记以后显示器显示固定语段的意义特征,在使用者点击关系标记以后显示器显示关系标记所代表的关系。本发明还揭示了一种把非形式化的源语言翻译成非形式化的目标语言的机器翻译方法,该方法包括步骤一对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段;步骤二以自动方式把形式化的源语言转换成非形式化的目标语言——首先,以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段,然后,以自动方式运用非固定语段转换规则逐层把源语言的非固定语段转换成目标语言的语段。根据本发明的机器翻译方法的一实施例,在步骤一中,使用替代标记进行预处理一预先使用替代标记把一个初始语段分解成若干个子语段,接着对这些子语段分别进行形式化处理。根据本发明的机器翻译方法的一实施例,步骤一是以交互方式对非形式化的源语言进行形式化处理进一步包括对于非形式化的源语言的初始语段,首先,以交互方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以交互方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。根据本发明的机器翻译方法的一实施例,以交互方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果在存储器里存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,运用一个固定语段模式标注这个固定语段的意义标记,然后,使用者确认或修改,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段并标注这个固定语段的意义标记,然后,处理器切分和标注下一个固定语段。根据本发明的机器翻译方法的一实施例,步骤一是以自动方式对非形式化的源语言进行形式化处理,进一步包括对于非形式化的源语言的初始语段,首先,以自动方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以自动方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。根据本发明的机器翻译方法的一实施例,以自动方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记、语法属性标记、语义属性标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果,在存储器里,存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,查出存储器里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注这个固定语段的意义标记、语法属性标记、语义属性标记,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,处理器就进行回溯。根据本发明的机器翻译方法的一实施例,以自动方式组合并标注非固定语段的过程进一步包括存储器里的非固定语段模式包含成分语段的语法属性标记、语义属性标记和组合语段的组合标记、核心成分标记、关系标记、语法属性标记、语义属性标记;处理器查出存储器里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式,运用这个非固定语段模式组合一个非固定语段并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记,然后,处理器组合和标注下一个非固定语段,依此类推,直到整个初始语段构成的一个非固定语段;如果处理器查出在存储器里不存在可以运用的非固定语段模式,处理器就进行回溯。根据本发明的机器翻译方法的一实施例,步骤二进一步包括处理器查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段;处理器查找非固定语段转换规则列表得到匹配的非固定语段转换规则,目标语言的非固定语段的规则是根据源语言的非固定语段的核心成分标记、关系标记或关系词用源语言的非固定语段的成分的译文、目标语言的关系词构成的,运用匹配的非固定语段转换规则把源语言的非固定语段转换成目标语言的非固定语段,通过递归执行此步骤逐层转换所有的非固定语段,其中对形式化的源语言的当前非固定语段来说,首先把当前非固定语段的各个成分分别转换成非形式化的目标语言,然后运用匹配的非固定语段转换规则把当前非固定语段转换成非形式化的目标语言,返回当前非固定语段的转换结果供上一层次的非固定语段调用,直到把作为初始数据的非固定语段转换成非形式化的目标语言。本发明又揭示了一种把非形式化的源语言翻译成形式化的目标语言的机器翻译系统,该系统包括源语言形式化处理模块,该模块对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段;形式化目标语言转换模块,该模块连接在源语言形式化处理模块之后,以自动方式把形式化的源语言转换成形式化的目标语言——以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段。根据本发明的机器翻译系统的一实施例,该系统还包括一个连接在源语言形式化处理模块之前的替代模块,该模块使用替代标记进行预处理——预先使用替代标记把一个初始语段分解成若干个子语段,接着对这些子语段分别进行形式化处理。根据本发明的机器翻译系统的一实施例,源语言形式化处理模块以交互方式对非形式化的源语言进行形式化处理,该模块进一步包括交互方式固定语段切分单元,该单元以交互方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段;交互方式非固定语段组合单元,该单元连接在交互方式固定语段切分单元之后,以交互方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。根据本发明的机器翻译系统的一实施例,交互方式固定语段切分单元以交互方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果在存储器里存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,运用一个固定语段模式标注这个固定语段的意义标记,然后,使用者确认或修改,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段并标注这个固定语段的意义标记,然后,处理器切分和标注下一个固定语段。根据本发明的机器翻译系统的一实施例,源语言形式化处理模块以自动方式对非形式化的源语言进行形式化处理,该模块进一步包括自动方式固定语段切分单元,该单元以自动方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段;自动方式非固定语段组合单元,该单元连接在自动方式固定语段切分单元之后,以自动方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。根据本发明的机器翻译系统的一实施例,自动方式固定语段切分单元以自动方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记、语法属性标记、语义属性标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果,在存储器里,存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,查出存储器里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注这个固定语段的意义标记、语法属性标记、语义属性标记,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,处理器就进行回溯。根据本发明的机器翻译系统的一实施例,自动方式非固定语段组合单元以自动方式组合并标注非固定语段的过程进一步包括存储器里的非固定语段模式包含成分语段的语法属性标记、语义属性标记和组合语段的组合标记、核心成分标记、关系标记、语法属性标记、语义属性标记;处理器查出存储器里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式,运用这个非固定语段模式组合一个非固定语段并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记,然后,处理器组合和标注下一个非固定语段,依此类推,直到整个初始语段构成的一个非固定语段;如果处理器查出在存储器里不存在可以运用的非固定语段模式,处理器就进行回溯。根据本发明的机器翻译系统的一实施例,形式化目标语言转换模块进一步包括自动方式固定语段转换单元,该单元查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段,目标语言的固定语段带有意义标记;标记点击单元,该单元在使用者点击目标语言的固定语段的意义标记以后显示固定语段的意义特征,在使用者点击关系标记以后显示关系标记所代表的关系。本发明又揭示了一种把非形式化的源语言翻译成非形式化的目标语言的机器翻译系统,该系统包括源语言形式化处理模块,该模块对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段;非形式化目标语言转换模块,该模块连接在源语言形式化处理模块之后,以自动方式把形式化的源语言转换成非形式化的目标语言——首先,以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段,然后,以自动方式运用非固定语段转换规则逐层把源语言的非固定语段转换成目标语言的语段。根据本发明的机器翻译系统的一实施例,该系统还包括一个连接在源语言形式化处理模块之前的替代模块,该模块使用替代标记进行预处理——预先使用替代标记把一个初始语段分解成若干个子语段,接着对这些子语段分别进行形式化处理。根据本发明的机器翻译系统的一实施例,源语言形式化处理模块以交互方式对非形式化的源语言进行形式化处理,该模块进一步包括交互方式固定语段切分单元,该单元以交互方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段;交互方式非固定语段组合单元,该单元连接在交互方式固定语段切分单元之后,以交互方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。根据本发明的机器翻译系统的一实施例,交互方式固定语段切分单元以交互方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记,形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果在存储器里存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,运用一个固定语段模式标注这个固定语段的意义标记,然后,使用者确认或修改,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段并标注这个固定语段的意义标记,然后,处理器切分和标注下一个固定语段。根据本发明的机器翻译系统的一实施例,源语言形式化处理模块以自动方式对非形式化的源语言进行形式化处理,该模块进一步包括自动方式固定语段切分单元,该单元以自动方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段;自动方式非固定语段组合单元,该单元连接在自动方式固定语段切分单元之后,以自动方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。根据本发明的机器翻译系统的一实施例,自动方式固定语段切分单元以自动方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记、语法属性标记、语义属性标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果,在存储器里,存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,查出存储器里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注这个固定语段的意义标记、语法属性标记、语义属性标记,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,处理器就进行回溯。根据本发明的机器翻译系统的一实施例,自动方式非固定语段组合单元以自动方式组合并标注非固定语段的过程进一步包括存储器里的非固定语段模式包含成分语段的语法属性标记、语义属性标记和组合语段的组合标记、核心成分标记、关系标记、语法属性标记、语义属性标记;处理器查出存储器里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式,运用这个非固定语段模式组合一个非固定语段并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记,然后,处理器组合和标注下一个非固定语段,依此类推,直到整个初始语段构成的一个非固定语段;如果处理器查出在存储器里不存在可以运用的非固定语段模式,处理器就进行回溯。根据本发明的机器翻译系统的一实施例,非形式化目标语言转换模块进一步包括自动方式固定语段转换单元,该单元查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段;自动方式非固定语段转换单元,该单元连接在自动方式固定语段转换单元之后,查找非固定语段转换规则列表得到匹配的非固定语段转换规则,其中目标语言的非固定语段的规则是根据源语言的非固定语段的核心成分标记、关系标记或关系词用源语言的非固定语段的成分的译文、目标语言的关系词构成的,运用匹配的非固定语段转换规则把源语言的非固定语段转换成目标语言的非固定语段,通过递归执行此步骤逐层转换所有的非固定语段,其中对形式化的源语言的当前非固定语段来说,首先把当前非固定语段的各个成分分别转换成非形式化的目标语言,然后运用匹配的非固定语段转换规则把当前非固定语段转换成非形式化的目标语言,返回当前非固定语段的转换结果供上一层次的非固定语段调用,直到把作为初始数据的非固定语段转换成非形式化的目标语言。本发明对比现有技术有如下的有益效果本发明的技术方案主要是先以交互方式或自动方式对非形式化的源语言进行形式化处理,然后以自动方式把形式化的源语言转换成形式化的目标语言或非形式化的目标语言。对比现有技术,本发明具有如下的三个特点1、既可以以交互方式对非形式化的源语言进行形式化处理,又可以以自动方式对非形式化的源语言进行形式化处理;既可以以自动方式把形式化的源语言转换成形式化的目标语言,又可以以自动方式把形式化的源语言转换成非形式化的目标语言。2、用于对源语言进行形式化处理的非固定语段模式和用于把源语言转换成目标语言的非固定语段转换规则相互独立。这样,既可以在不牵涉非固定语段转换规则的情况下修改、补充非固定语段模式,又可以在不牵涉非固定语段模式的情况下修改、补充非固定语段转换规则。这一特点使机器翻译系统具有易扩充性。3、对源语言进行形式化处理是把源语言转换成各种目标语言的共同基础。这一特点十分有利于"一对多"(例如英语转换成汉语/日语/法语/德语/俄语)机器翻译系统的研发。图1是使用替代标记进行预处理的实现示意图。图2是以交互方式切分固定语段并标注标记的汉语实例的实现示意图。图3是以交互方式组合非固定语段并标注标记的实现示意图。图4是以自动方式切分固定语段并标注标记的汉语实例的实现示意图。图5是以自动方式组合非固定语段并标注标记的实现示意图。图6是把形式化的源语言转换成形式化的目标语言的实现示意图。图7是把形式化的源语言转换成非形式化的目标语言的实现示意图。图8是机器翻译系统的第一实施例的原理图。图9是机器翻译系统的第二实施例的原理图。图10是机器翻译系统的第三实施例的原理图。图11是机器翻译系统的第四实施例的原理图。具体实施例方式下面结合附图和实施例对本发明作进一步的描述。一、和遍i圣诚白條一輔你l本实施例的机器翻译方法是将非形式化的源语言转换成形式化的目标语言,主要包括两个步骤,第一步骤是对于非形式化的源语言的初始语段,首先,以交互方式逐个切分固定语段(标注固定语段标记)并标注固定语段的意义标记,直到最后一个固定语段,然后,以交互方式逐层组合非固定语段(标注组合标记)并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。第二步骤是自动运用固定语段转换规则把源语言的固定语段转换为目标语言的语段,从而将非形式化的源语言转换为形式化的目标语言。标记的说明在详细介绍本实施例的第一步骤之前,首先对下文中经常提到的七种标记(固定语段标记、意义标记、组合标记、核心成分标记、关系标记、语法属性标记、语义属性标记)进行说明。(1)固定语段标记是表示固定语段的标记。一般而言,词、词组、成语、典故、俗语、格言、人名、地名等都可以作为固定语段。字符串(即两个空格之间的若干个字母)、汉字、假名都是文字单元(即,具有独立的形体的文字片段)。若干个文字单元构成一个固定语段。例如,固定语段的下划线用作固定语段标记。一个文字单元构成的固定语段的固定语段标记可省略。下面是固定语段标记的一个示例TheGreatStBernardPassisthehighestmountainpassinEurope.圣伯纳德大山口是欧洲最高的山口。(2)意义标记是使形式相同意义不同的固定语段成为形式不同意义不同的固定语段的标记。例如,将固定语段的右上角的数字用作意义标记。下面是意义标记的一个示例research1research2(3)组合标记表示若干个语段组合成一个语段的标记。例如可以是括号式组合t示记,如{[({[({[()]})]})]}示例为「(算术运算)(逻辑运算)l组合标记也可以是横线式组合标记,如____示例为魅遂鹏遂__(4)核心成分标记表示核心成分的标记,核心成分的对象包含组合成的语段的对象或与组合成的语段的对象同一。可以将核心成分一方的星号用作核心成分标记,例如[(^^遮*)0£^遮*)]魅遂鹏遂_^_^_核心成分的对象包含组合成的对象或与组合成的语段的对象同一。可以用两种核心成分标记表示两种核心成分如果核心成分的对象包含组合成的语段的对象,核心成分一方的星号用作核心成分标记;如果核心成分的对象与组成的语段的对象同一,核心成分一方的#号用作核心成分标记。示例如下clevermancleverJohn_^_^themanwhowrotethisbookJohn,whowrotethisbook__^_^_(5)关系标记表示组合成的语段的各个成分的关系。例如可将成分之间的数字用作关系标记,示例如下「(算术4运算*)21(逻辑4运算算术运算逻菊运算4氺4氺21以下是用数字122表示不同的关系1表示非核心成分的对象承受核心成分的对象2表示非核心成分的对象领有核心成分的对象3表示非核心成分的对象限定核心成分的对象4表示非核心成分的对象是核心成分的对象的属性5表示非核心成分的对象是核心成分的对象的方式6表示非核心成分的对象是核心成分的对象的目的7表示非核心成分的对象是核心成分的对象的结果8表示非核心成分的对象是核心成分的对象的手段9表示非核心成分的对象是核心成分的对象的时间表示非核心成分的对象是核心成分的对象的处所11表示非核心成分的对象是核心成分的对象的起点12表示非核心成分的对象是核心成分的对象的方向13表示非核心成分的对象是核心成分的对象的材料14表示非核心成分的对象是核心成分的对象的条件15表示非核心成分的对象是核心成分的对象的原因16表示非核心成分的对象是核心成分的对象的频度17表示非核心成分的对象是核心成分的对象的范围18表示非核心成分的对象是核心成分的对象的程度19表示左边的成分的对象是右边的成分的对象的主体20表示核心成分的对象是非核心成分的对象的主体21表示各成分的对象具有联合关系22表示各成分的对象具有选择关系(6)语法属性标记是在第二个步骤中涉及到的标记,是表示语段的语法属性的标记。通常将大写拉丁字母用作语法属性标记。下面是基于英语用于英语的语法属性标记名词N、及物动词VT、不及物动词VI、连系动词LV、情态动词MV、形容词A、一般副词AD、疑问副词IAD、关系副词RAD、名词性代词NP、形容词性代词AP、疑问代词IP、关系代词RP、数词NUM、冠词ART、介词P、并列连词CC、从属连词SC;限定动词FV、不定式INF、-ING分词ING、-ED分词ED;主动AC、被动PA;句S、定语从句ATC、状语从句ADC、名词性从句NC。下面是基于汉语用于汉语的语法属性标记名词M、及物动词JD、不及物动词BJD、连系动词LD、情态动词QD、形容词X、一般副词F、疑问副词YF、名词性代词MD、形容词性代词XD、疑问代词YD、数词S、介词J、并列连词BL、从属连词CL;句JU、定语从句DC、状语从句ZC、名词性从句MC。(7)语义属性标记也是在第二个步骤中涉及到的标记,是表示语段的语义属性的标记,通常将小写拉丁字母用作语义属性标记。下面是基于英语用于英语的语义属性标记人hu、生物li、物体ob、物质su、事物th、时间ti、处所pl、单位un、具体行为ca、抽象行为aa、状态co、心理活动ma、具体性质cc、抽象性质ac、频度fr、程度de、否定ne。下面是基于汉语用于汉语的语义属性标记人re、生物sw、物体wt、物质wz、事物ww、时间sj、处所cs、单位dw、具体行为jw、抽象行为cw、状态zt、心理活动xh、具体性质jx、抽象性质cx、频度pd、程度cd、否定fd。替代在上述的第一个步骤中,预先使用替换标记把一个初始语段分解成若干个子语段,接着针对这些子语段分别进行后续的形式化处理。这里所说的替换标记是表示替代的标记,例如可以用带圈的数字作为替代标记,如算术运算和逻辑运算=下面是使用替代标记进行预处理的实例第一步计算机在屏幕上显示电子计算机以惊人的速度完成算术运算和逻辑运算第二步使用者在屏幕上选中电子计算机以惊人的速度完成算术运算和逻辑运算第三步使用者按"替代"功能键第四步计算机在屏幕上显示算术运算和逻辑运算=电子计算机以惊人的速度完成①然后,对"算术运算和逻辑运算"、"电子计算机以惊人的速度完成①"这两个子语段分别进行形式化处理。可见,使用替代标记进行预处理使对结构复杂的语段进行形式化处理变得比较方便。图1示出了使用替代标记进行预处理的实现,请同时参见图l,下面是以一个具体的实例来说明使用替代标记进行预处理的过程。第一步以String类型保存被输入的作为数据的语段"电子计算机以惊人的速度完成算术运算和逻辑运算"。进行数据初始化,形成一个节点对应一个文字单元的节点数组(Array)。替代符号列表为空。第二步使用者选中"算术运算和逻辑运算"。第三步使用者按"替代"功能键。第四步更新节点数组——第14个节点对应"算术运算和逻辑运算",其容量为9个文字单元。用符号"①"代表被选中的语段,在屏幕上显示更新后的作为数据的语段。以夺互方式对源i吾言讲行形式化处理在第一步骤中,本实施例是以交互方式对源语言进行形式化处理,包含了以交互方式切分固定语段并标注标记的过程以及以交互方式组合非固定语段并标注标记的过程。下面分别就上述的这两个过程进行详细的描述。以夺互方式切分固定i吾段并标沣标记的过禾呈以交互方式切分固定语段并标注标记的过程详述如下存储装置里的固定语段模式包含固定语段及其意义标记(形式相同意义不同的固定语段带有意义标记);计算机依次判断,在存储装置里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果在存储装置里,存在最前的n个文字单元开头的固定语段但不存在最前的n+l个文字单元开头的固定语段,计算机就把最前的n个文字单元切分为固定语段(标注固定语段标记),运用一个固定语段模式(固定语段模式的实例为methods1、dataprocessingautomatic1)标注这个固定语段的意义标记,然后,使用者确认或修改,依此类推,直到最后一个固定语段;如果计算机查出在存储装置里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段(标注固定语段标记)并标注这个固定语段的意义标记,然后,计算机切分和标注下一个固定语段。下面以一个实例来说明上述的以交互方式切分固定语段并标注标记。设ABCDEFGHIJKLMNOPQRSTUVWXYZ是一个语段(A、B、C......X、Y、Z是文字单元)。计算机依次判定,在存储装置里,存在A开头的固定语段,存在AB开头的固定语段,存在ABC开头的固定语段,不存在ABCD开头的固定语段,于是计算机把ABC切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注ABC的意义标记,然后,使用者确认或修改,依此类推,直到最后一个固定语段。之所以将ABC切分为一个同定语段,是因为在存储装置里,存在A开头的固定语段,存在AB开头的固定语段,存在ABC开头的固定语段,不存在ABCD开头的固定语段,所以,A开头的固定语段可能是A,可能是AB,可能是ABC,不可能是ABCD,不可能是其他A开头的语段(ABCDE、ABCDEF……)。计算机把A、AB、ABC三者中最长(文字单元最多)的ABC切分为固定语段。计算机判定在存储装置里不存在L开头的固定语段,于是使用者切分L开头的固定语段LMNO(标注固定语段标记)并标注LMNO的意义标记,计算机自动存储这个新的固定语段模式,然后,计算机切分和标注下一个固定语段。在使用者确认或修改意义标记的步骤中,先由计算机显示各个可以运用的固定语段模式及其意义特征。例如degree1[3stepinaprocess]degree[astepinadirecthereditarylineofdescent]degree3[relativesocialorofficialrank]degree4[relativeintensityoramount]degree5[theextentofastateofbeingoranaction]degree6[aunitdivisionofatemperaturescale]degree7[aplanarunitofangularmeasure]degree8[aunitoflatitudeorlongitude]degree9[anacademictitle]degree10[aclassificationofaspecificcrime]degree11[aclassificationoftheseverityofaninjury]degree12[aformusedinthecomparisonofadjectivesandadverbs]degree13[anoteofadiatonicscale]然后由使用者选择并点击一个意义标记。以夺互方式切分固定i吾段并标沣标记的英i吾实例Computerscienceisthebranchofsciencethatisconcernedwithmethodsrelatingtodataprocessingperformedbyautomaticmeans.计算机依次判定,在存储装置里,存在computer开头的固定语段(第一个文字单兀是computer的固定语段,例如computer,computerassistedinstruction,computergraphics),存在computerscience开头的固定语段(第一个文字单元是computer第二个文字单兀是science的固定语段,例如computerscience,computerscienceandtechnology,computersciencedepartment),不存在computerscienceis开头的固定语段(第一个文字单元是computer第二个文字单元是science第二个文字单元是is的固定语段),于是计算机把computerscience切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注computerscience的意义标记,然后,使用者确认。21计算机依次判定,在存储装置里,存在is开头的固定语段,不存在isthe开头的固定语段,于是计算机把is切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注is的意义标记,然后,使用者确认。计算机依次判定,在存储装置里,存在the开头的固定语段,不存在thebranch开头的固定语段,于是计算机把the切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注the的意义标记,然后,使用者确认。计算机依次判定,在存储装置里,存在branch开头的固定语段,不存在branchof开头的固定语段,于是计算机把branch切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注branch的意义标记,然后,使用者确认。计算机依次判定,在存储装置里,存在of开头的固定语段,不存在ofscience开头的固定语段,于是计算机把of切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注of的意义标记,然后,使用者确认。计算机依次判定,在存储装置里,存在science开头的固定语段,不存在sciencethat开头的固定语段,于是计算机把science切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注science的意义标记,然后,使用者确认。Computerscienceis1thebranch3ofscience1"*......之所以将computerscience作为固定语段,是因为在存储装置里,存在computer开头的固定语段,存在computerscience开头的固定语段,不存在computerscienceis开头的固定语段,所以,computer开头的固定语段可能是computer,可能是computerscience,不可會g是computerscienceis,不可會g是其他computer开头的i吾段(computerscienceisthe,computerscienceisthebranch,computerscienceisthebranchof......)。计算机把computer,computerscience二者中最长(文字单元最多)的computerscience切分为固定语段。以夺互方式切分固定i吾段并标沣标记的汉i吾实例图2示出了以交互方式切分固定语段并标注标记的汉语实例的实现过程,请参见图2,其中粗实线表示不存在固定语段,细实线箭头表示存在固定语段,虚线箭头表示不存在以此开头的固定语段。计算机科学是研究用自动化工具完成数据处理的方法的一门科学。计算机依次判定,在存储装置里,存在计开头的固定语段(第一个文字单元是计的固定语段,例如计、计划、计算机、计量单位、计算机辅助设计),存在计算开头的固定语段(第一个文字单元是计第二个文字单元是算的固定语段,例如计算、计算机、计算机辅助设计),存在计算机开头的固定语段(第一个文字单元是计第二个文字单元是算第三个文字单元是机的固定语段,例如计算机、计算机安全、计算机辅助设计),存在计算机科开头的固定语段(第一个文字单元是计第二个文字单元是算第三个文字单元是机第四个文字单元是科的固定语段,例如计算机科学、计算机科学技术、计算机科学家),存在计算机科学开头的固定语段(第一个文字单元是计第二个文字单元是算第三个文字单元是机第四个文字单元是科第五个文字单元是学的固定语段,例如计算机科学、计算机科学技术、计算机科学家),不存在计算机科学是开头的固定语段(第一个文字单元是计第二个文字单元是算第三个文字单元是机第四个文字单元是科第五个文字单元是学第六个文字单元是是的固定语段),于是计算机把计算机科学切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注计算机科学的意义标记,然后,使用者确认。计算机依次判定,在存储装置里,存在是开头的固定语段,不存在是研开头的固定语段,于是计算机把是切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注是的意义标记,然后,使用者确认。计算机依次判定,在存储装置里,存在研开头的固定语段,存在研究开头的固定语段,不存在研究用开头的固定语段,于是计算机把研究切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注研究的意义标记,然后,使用者确认。计算机依次判定,在存储装置里,存在用开头的固定语段,不存在用自开头的固定语段,于是计算机把用切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注用的意义标记,然后,使用者确认。计算机依次判定,在存储装置里,存在自开头的固定语段,存在自动开头的固定语段,存在自动化开头的固定语段,不存在自动化工开头的固定语段,于是计算机把自动化切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注自动化的意义标记,然后,使用者确认。计算机科学是皿1用1自动化……......之所以将"计算机科学"作为固定语段,是因为在存储装置里,存在计开头的固定语段,存在计算开头的固定语段,存在计算机开头的固定语段,存在计算机科开头的固定语段,存在计算机科学开头的固定语段,不存在计算机科学是开头的固定语段,所以,计开头的固定语段可能是计,可能是计算,可能是计算机,可能是计算机科,可能是计算机科学,不可能是计算机科学是,不可能是其他计开头的语段(计算机科学是研、计算机科学是研究、计算机科学是研究用……)。计算机把计、计算、计算机、计算机科、计算机科学五者中最长(文字单元最多)的计算机科学切分为固定语段。以夺互方式飽合非固定i吾段并标沣标记的过禾呈以交互方式组合非固定语段并标注标记的过程详述如下以交互方式逐层逐个按组合标记、核心成分标记、关系标记的顺序标注非固定语段的标记,直到整个初始语段构成的一个非固定语段。lU柯材会目絲醇i鹏射示射示iff白嫂你l第一步计算机在屏幕上显示请组合一个非固定语段第二步使用者用鼠标在屏幕上点击第一层第一个非固定语段的第一个字符和最^个字符。第三步计算机在屏幕上显示第一层第一个非固定语段的组合标记。第四步计算机在屏幕上显示请标注核心成分标记第五步使用者用鼠标在屏幕上点击核心成分标记的位置。第六步计算机在屏幕上显示核心成分标记。第七步计算机在屏幕上显示请选择关系标记1表示非核心成分的对象承受核心成分的对象2表示非核心成分的对象领有核心成分的对象3表示非核心成分的对象限定核心成分的对象4表示非核心成分的对象是核心成分的对象的属性5表示非核心成分的对象是核心成分的对象的方式6表示非核心成分的对象是核心成分的对象的目的7表示非核心成分的对象是核心成分的对象的结果8表示非核心成分的对象是核心成分的对象的手段9表示非核心成分的对象是核心成分的对象的时间10表示非核心成分的对象是核心成分的对象的处所11表示非核心成分的对象是核心成分的对象的起点12表示非核心成分的对象是核心成分的对象的方向13表示非核心成分的对象是核心成分的对象的材料14表示非核心成分的对象是核心成分的对象的条件15表示非核心成分的对象是核心成分的对象的原因16表示非核心成分的对象是核心成分的对象的频度17表示非核心成分的对象是核心成分的对象的范围18表示非核心成分的对象是核心成分的对象的程度19表示左边的成分的对象是右边的成分的对象的主体20表示核心成分的对象是非核心成分的对象的主体21表示各成分的对象具有联合关系22表示各成分的对象具有选择关系第八步使用者用鼠标在屏幕上点击合适的关系标记。第九步计算机在屏幕上显示关系标记。第十步计算机在屏幕上显示请组合一个非固定语段第十一步使用者用鼠标在屏幕上点击第一层第二个非固定语段的第一个字符和最后一个字符。......lU柯材会目絲醇i鹏射示射示iff白條i吾糊初始语段methodsrelatingtodataprocessingperformedbyautomaticmeans第一层组合methods1relatingtodataprocessingperformed1by2automatic1means1_4氺第二层组合methods1relatingtodataprocessihgperformed1by2automatic1means1_4承^_第三层组合methods1relatingtodataprocessinoperformed1by2automatic1means1_4氺^_^_2^_第四层组合methods1relatingtodataprocessingperformed1by2automatic1means1_4氺^_^_2^_^_以夺互方式飽合非固定i吾段并标沣标记的实现,图3示出了以交互方式组合非固定语段并标注标记的实现过程。下面的说明请同时参见图3。第一步在程序界面上显示初始语段,提示"请组合非固定语段"。第二步接受鼠标的两次点击,获得非固定语段的第一个字符和最后一个字符,给从第一个字符到最后一个字符的字符串标注横线式组合标记,提示"请标注核心成分标记"。第三步如果使用者点击核心成分标记的位置,程序就标注核心成分标记;如果使用者点击核心成分标记,程序就删除核心成分标记。第四步使用者用鼠标右键点击非固定语段的横线式组合标记,程序弹出包含"关系标记列表"和"取消非固定语段"两项内容的右键菜单。如果使用者在右键菜单里点击一个关系标记,程序就标注这个关系标记;如果使用者在右键菜单里选择"取消非固定语段",程序就删除这个非固定语段的横线式组合标记。第五步重复第二步到第四步,直到整个初始语段构成的一个非固定语段。第六步生成节点列表。25把形式化的源语言转换成形式化的目标语言以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段。把形式化的源语言转换成形式化的目标语言的实例例子1:英语到汉语的翻译非形式化的英语methodsrelatingtodataprocessingperformedbyautomaticmeans形式化的英语methods1relatingtodataprocessingperformed1by2automatic1means1_4氺^_承20_(以交互方式对源语言进行形式化处理的结果)作为以自动方式对源语言进行形式化处理的结果的形式化的源语言有语法属性标记和语义属性标记。例如methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob_4_^NobVTEDPAaa20NaaNth(以自动方式对源语言进行形式化处理的结果)首先,以自动方式删除语法属性标记和语义属性标记。例如methods1relatingtodataprocessingperformed1by2automatic1means1420(形式化的源语言的语法属性标记和语义属性标记可以不删除)然后,以自动方式运用固定语段转换规则把英语的固定语段转换成汉语的语段固定语段转换规则<table>tableseeoriginaldocumentpage27</column></row><table>使用者点击关系标记以后,计算机显示关系。例如使用者点击关系标记4以后,机显示4表示非核心成分的对象是核心成分的对象的属性例子2:汉语到英语的翻译非形式化的汉语计算机辅助教学通常包含学生和计算机的对话形式化的汉语i十覚和,辅助教学鹏M学牛和4计覚机的3对话1619和4[各成分的对象具有联合关系]的3[非核心成分的对象施行核心成分的对象]27首先以自动方式把汉语的固定语段转换成英语的语段computerassistedinstructionusuallyinvolve2studentand1computerof14dialogue__^_1___^_involve2[containasapart]and1[theobjectsoftheelementsjointogether]of14[theobjectofthenon_keyelementexecutestheobjectofthekeyelement]护U纖原結斜免成U涵服i吾舗叙见图6以上述的英语到汉语翻译的实例示出了把形式化的源语言转换成形式化的目标语言的实现过程。下面的描述请同时参见图6。第一步删除形式化的源语言的语法属性标记和语义属性标记。第二步查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非同定语段。目标语言的固定语段带有意义标记。第三步在使用者点击目标语言的固定语段的意义标记以后显示固定语段的意义特征。在使用者点击关系标记以后显示关系标记所代表的关系。从源i吾言到l形式化的目标i吾言的机器翻译的应用1从源语言到形式化的目标语言的机器翻译可以用于手机等网络终端设备。例如在手机的存储装置里存储从源语言到形式化目标语言机器翻译系统。甲是母语是汉语、完全不懂英语的使用者;乙是母语是英语、完全不懂汉语的使用者。甲把非形式化的汉语输入自己的手机,甲和自己的手机以交互方式对非形式化的汉语进行形式化处理,甲的手机以自动方式把形式化的汉语转换成形式化的英语,然后,甲的手机把形式化的英语发送给乙,乙在自己的手机上阅读形式化的英语;乙把非形式化的英语输入自己的手机,乙和自己的手机以交互方式对非形式化的英语进行形式化处理,乙的手机以自动方式把形式化的英语转换成形式化的汉语,然后,乙的手机把形式化的汉语发送给甲,甲在自己的手机上阅读形式化的汉语。(具有从源语言到形式化目标语言机器翻译功能的手机所连接的电脑也具有从源语言到形式化目标语言机器翻译功能)母语不同的使用者可以使用手机在互联网上各自用母语进行绝对准确(没有任何歧义)的信息交流(即时交谈、电子邮件等)。具有从源语言到形式化目标语言机器翻译功能的手机不但能够消除互联网的语言障碍,增进各国人民的相互了解与合作,而且能够促进各种语言的相互借鉴共同发展,保持世界文化的多样性。2从源语言到形式化的目标语言的机器翻译可以用于互联网知识库和知识推理搜索引擎在其存储装置里存储用形式化的语言表示的普通知识和专业知识并且存储以交互方式或自动方式对非形式化的源语言进行形式化处理然后以自动方式把形式化的源语言转换成形式化的目标语言的机器翻译系统。例如在互联网知识库里用形式化的英语全面而充分地表示普通知识和专业知识。母语是汉语/日语/法语/德语/俄语的科学技术工作者用非形式化的汉语/日语/法语/德语/俄语在互联网发表论文。作者和知识推理搜索引擎以交互方式对非形式化的汉语/日语/法语/德语/俄语的论文摘要进行形式化处理,然后,知识推理搜索引擎以自动方式把形式化的汉语/日语/法语/德语/俄语转换成形式化的英语,然后,知识推理搜索引擎把形式化的英语的论文摘要存入互联网知识库。知识推理搜索引擎根据使用者提出的某个专题,从互联网知识库搜索出关于这个专题的知以,进行知识推理以延伸、扩展或重组知识,输出形式化的英语的推理结果,启迪使用者作出新的发现和发明。知识推理搜索引擎可以根据使用者的需要,以自动方式把形式化的英语的推理结果转换成形式化的汉语/日语/法语/德语/俄语的推理结果。知识推理搜索引擎能够大大加快科学技术的发展。人类正处于以互联网和搜索引擎为特征的信息时代初级阶段;人类将进入以互联网知识库和知识推理搜索引擎为特征的信息时代高级阶段。3从源语言到形式化的目标语言的机器翻译可以用于专家系统。例如在专家系统的知识库里用形式化的英语全面而充分地表示普通知识和专业知识。母语是汉语/日语/法语/德语/俄语的专家用非形式化的汉语/日语/法语/德语/俄语向专家系统输入知识。然后,专家和专家系统以交互方式对非形式化的汉语/日语/法语/德语/俄语进行形式化处理,然后,专家系统以自动方式把形式化的汉语/日语/法语/德语/俄语转换成形式化的英语,然后,专家系统把用形式化的英语表示的知识存入知识库。母语是汉语/日语/法语/德语/俄语的使用者用非形式化的汉语/日语/法语/德语/俄语向专家系统提出问题,然后,使用者和专家系统以交互方式对非形式化的汉语/日语/法语/德语/俄语进行形式化处理,然后,专家系统以自动方式把形式化的汉语/日语/法语/德语/俄语转换成形式化的英语,然后,专家系统进行知识推理,用形式化的英语作出解答。专家系统可以根据使用者的需要,以自动方式把形式化的英语的解答转换成形式化的汉语/日语/法语/德语/俄语的解答。4从源语言到形式化的目标语言的机器翻译可以用于自动程序设计。例如母语是汉语/日语/法语/德语/俄语的使用者把用非形式化的汉语/日语/法语/德语/俄语设计的程序输入计算机,然后,使用者和计算机以交互方式对非形式化的汉语/日语/法语/德语/俄语进行形式化处理,然后,计算机以自动方式把形式化的汉语/日语/法语/德语/俄语转换成形式化的英语,然后,计算机以自动方式把形式化的英语转换成程序设计语言。二、机器翻译方法的第二实施例本实施例的机器翻译方法是将非形式化的源语言转换成形式化的目标语言,主要包括两个步骤,第一步骤是对于非形式化的源语言的初始语段,首先,以自动方式逐个切分固定语段(标注固定语段标记)并标注固定语段的意义标记,直到最后一个固定语段,然后,以自动方式逐层组合非固定语段(标注组合标记)并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。第二步骤是自动运用固定语段转换规则把源语言的固定语段转换为目标语言的语段,从而将非形式化的源语言转换为形式化的目标语言。其中本实施例的标记的说明、替代都和第一实施例相同,在此不再赘沭,以下重点说明本实施例和上述第一实施例的区别所在。IU自云力材麵i吾豁对亍総仆細在第一步骤中,本实施例是以自动方式对源语言进行形式化处理,包含了以自动方式切分固定语段并标注标记的过程以及以自动方式组合非固定语段并标注标记的过程。下面分别就上述的这两个过程进行详细的描述。IU自云力材t刀,分醇鹏射示射示iP鍾禾罕存储装置里的固定语段模式包含固定语段及其意义标记(形式相同意义不同的固定语段带有意义标记)、语法属性标记、语义属性标记;计算机依次判断,在存储装置里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果,在存储装置里,存在最前的n个文字单元开头的固定语段,不存在最前的n+l个文字单元开头的固定语段,计算机就把最前的n个文字单元切分为固定语段(标注固定语段标记),查出存储装置里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注这个固定语段的意义标记、语法属性标记、语义属性标记,依此类推,直到最后一个固定语段;如果计算机查出在存储装置里不存在剩余语段的最前的1个文字单元开头的固定语段,计算机就回溯。在上述过程中,计算机通过固定语段自动切分和标注时的回溯改正固定语段自动切分和标注中的错误。对于上述过程中提及的"固定语段模式",其实例如下methods1dataprocessingautomatic1NthNaaAac以自动方式切分固定i吾段并标沣标记的实例英语的例子methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob汉语的例子计算机科学是皿1用1自动化MwwLDztJDcwJDcwXcx以自动方式切分固定语段并标注标记的实现图4示出了以自动方式切分固定语段并标注标记的实现过程,在图4中粗实线表示不存在固定语段,虚线表示不存在以此开头的固定语段,细实线表示存在固定语段。请结合图4参考下面的描述。第一步获得作为初始数据的语段计算机科学是研究用自动化工具完成数据处理的方法的一门科学。第二步查找第一个文字单元是计的固定语段一有(存在计开头的固定语段)一在第一个文字单元是计的固定语段里查找第二个文字单元是算的固定语段一有(存在计算开头的固定语段)一在第一个文字单元是计第二个文字单元是算的固定语段里查找第三个文字单元是机的固定语段一有(存在计算机开头的固定语段)一在第一个文字单元是计第二个文字单元是算第三个文字单元是机的固定语段里查找第四个文字单元是科的固定语段一有(存在计算机科开头的固定语段)一在第一个文字单元是计第二个文字单元是算第三个文字单元是机第四个文字单元是科的固定语段里查找第五个文字单元是学的固定语段一有(存在计算机科学开头的固定语段)一在第一个文字单元是计第二个文字单元是算第三个文字单元是机第四个文字单元是科第五个文字单元是学的固定语段里查找第六个文字单元是是的固定语段一没有(不存在计算机科学是开头的固定语段)一把计算机科学切分为固定语段。第三步查出计算机科学这个固定语段的标记组(意义标记、语法属性标记、语义属性标记)列表,选择累计运用次数最多的一个标记组对计算机科学这个固定语段进行标注。第四步用一个节点把计算机科学这个固定语段及其标记组(意义标记、语法属性标记、语义属性标记)存储于数据列表。依此逐个切分和标注固定语段,直到最后一个固定语段。如果查出在固定语段列表里不存在剩余语段的最前的1个文字单元开头的固定语段,就回溯。IU自云力材会目絲醇i鹏射示射示iP鍾禾罕存储装置里的非固定语段模式包含成分语段的语法属性标记、语义属性标记和组合语段的组合标记、核心成分标记、关系标记、语法属性标记、语义属性标记;计算机查出存储装置里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式,运用这个非固定语段模式组合一个非固定语段(标注组合标记)并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记,然后,计算机组合和标注下一个非固定语段,依此类推,直到整个初始语段构成的一个非固定语段;如果计算机查出在存储装置里不存在可以运用的非固定语段模式,计算机就回溯。其中计算机通过非固定语段自动组合和标注时的回溯改正非固定语段自动组合和标注中的错误或固定语段自动切分和标注中的错误。固定语段自动切分和标注中的错误往往通过非固定语段自动组合和标注时的回溯才能改正。上述过程中的非固定语段模式的实例如下阔^固定语段模式的实例模式一模式二…relatingto...............NthPNaa^_Nth模式三…by2...............VTEDPAaaPNobNaaVTEDPAaaAacNob4氺Nob模式四^_氺20_VTEDPAaaNaaIU自云力材会目絲醇鹏射示射示iff白嫂你l下面以一个英语的例子来说明以自动方式组合非固定语段并标注标记的过程。初始语段methodsrelatingtodataprocessingperformedbyautomaticmeansNthPNaaVTEDPAaaPAacNob第一层组合计算机查出存储装置里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式(上述的模式二),运用这个非固定语段模式组合一个非固定语段(标注组合标记)并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记。methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob_4_^Nob第二层组合计算机查出存储装置里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式(上述的模式三),运用这个非固定语段模式组合一个非固定语段(标注组合标记)并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记。methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob4氺Nob^_VTEDPAaa第三层组合计算机查出存储装置里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式(上述的模式四),运用这个非固定语段模式组合一个非固定语段(标注组合标记)并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记。methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob_4氺Nob^_VTEDPAaa^__Naa第四层组合计算机查出存储装置里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式(上述的模式一),运用这个非同定语段模式组合一个非固定语段(标注组合标记)并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记。methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob_4氺Nob^_VTEDPAaa^_2^_Naa^_NthIU自云力材会目絲醇i鹏射示射示iff白嫂现'图5示出了以自动方式组合非固定语段并标注标记的实现过程。以下结合图5给出了实现过程的详细描述。第一步查出各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式,运用这个非固定语段模式组合一个非固定语段(标注组合标记)并给这个非固定语段标注核心成分标记、关系标记、语法属性标记、语义属性标记。第二步用一个节点把这个非固定语段及其标记组(核心成分标记、关系标记、语法属性标记、语义属性标记)存储于数据列表。保存成分语段的引用(子节点)和组合语段的引用(父节点)。依此逐个组合和标注非固定语段,直到整个作为初始数据的语段构成的一个非固定语段。如果查出在非固定语段模式列表里不存在可以运用的非固定语段模式,就回溯。对于本实施例的第二个步骤,即把形式化的源语言转换成形式化的目标语言(包括其实现以及应用),已经在上述的第一个实施例中详细描述,因此在此不再赘述。三、机器翻译方法的第三实施例本实施例的机器翻译方法是将非形式化的源语言转换成形式化的目标语言,主要包括两个步骤,第一步骤是对于非形式化的源语言的初始语段,首先,以交互方式逐个切分固定语段(标注固定语段标记)并标注固定语段的意义标记,直到最后一个固定语段,然后,以交互方式逐层组合非固定语段(标注组合标记)并标注非同定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。第二步骤是自动运用固定语段转换规则把源语言的固定语段转换为目标语言的语段,然后以自动方式运用非固定语段转换规则逐层把源语言的非固定语段转换成目标语言的语段,从而将非形式化的源语言转换为非形式化的目标语言。其中本实施例的标记的说明、替代、以夺互方式对源语言讲行形式化处理(包括,i材t刀側斜吾肖射示射示iP扁柳層乂拽材会目絲,鹏射示射示iffffiii^l都和第一实施例相同,在此不再赘述,以下重点说明本实施例和上述第一实施例的区别所在。换句话说,本实施例的第一个步骤和第一实施例的第一个步骤是完全一样的,因此下面是对本实施例第二个步骤的详细描述。护U纖原i吾諧械,i涵服i吾舗讨禾罕以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段,然后,以自动方式运用非固定语段转换规则(即,根据源语言的非固定语段的核心成分标记和关系标记或关系词用源语言的非固定语段的成分的译文和目标语言的关系词构成目标语言的非固定语段的规则)逐层把源语言的非固定语段转换成目标语言的语段。护U纖原i吾諧械,i涵服i吾剖嫂你l以下是以形式化的英语转换成非形式化的汉语为例来说明把形式化的源语言转换成非形式化的目标语言的过程。非形式化的英语methodsrelatingtodataprocessingperformedbyautomaticmeans形式化的英语methods1relatingtodataprocessingperformed1by2automatic1means1_4氺氺20(以交互方式对源语言进行形式化处理的结果)以自动方式运用固定语段转换规则把英语的固定语段转换成汉语的语段固定语段转换规则<table>tableseeoriginaldocumentpage34</column></row><table>methods1—方法dataprocessing-数据处理performed1—被执,行automatic1—自动3means1—工具1以自动方式运用非固定语段转换规则逐层把英语的非固定语段转换成汉语的语段非固定语段转换规则(、代表英语成分,b/、relatingto是英语关系词,*是核心成分标记,4、1是关系标记;一代表转换;R、……a代表英语成分的汉语译文,的、被s、皿工是汉语关系词)规则一…4......*—"..汉的......汉规则二*."by2......-—被5……汉…汉规则三氺…1......—规则四relatingto......—有关i......汉白勺...汉第一层转换automatic1means1—automatic1^勺means1汉—自动3的工具、规则一)第二层转换performed1by2automatic1means1—被5automatic1meanslRperformed1皿3的工具1被执行(规则二)第三层转换dataprocessingperformed1by2automatic1means1—performed1by2automatic1means1汉的dataprocessing汉一被5自动3的工具1被执行的数据处理(规则三)第四层转换methods1relatingtodataprocessingperformed1by2automatic1means1—有关1dataprocessingperformed1by2automatic1means1汉白勺methods1汉—^^1f皮5直的工具1被执行的数据处理的方法(规则四)非形式化的汉语皿1被5^^3的工具1被执,行的数据处理的方法把形式化的源i吾言转换成非形式化的目标i吾言的实现,图7示出了把形式化的源语言转换成非形式化的目标语言的实现过程。请结合图7参考下面的实现过程的详细描述。第一步查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段。目标语言的固定语段带有意义标记。第二步查找非固定语段转换规则列表得到匹配的非固定语段转换规则,运用匹配的非固定语段转换规则(即,根据源语言的非固定语段的核心成分标记、关系标记或关系词用源语言的非固定语段的成分的译文、目标语言的关系词构成目标语言的非固定语段的规则)把源语言的非固定语段转换成目标语言的语段。通过递归执行此步骤逐层转换所有的非固定语段。就形式化的源语言的一个当前非固定语段而言首先,把它的各个成分分别转换成非形式化的目标语言;然后,运用匹配的非固定语段转换规则把当前非固定语段转换成非形式化的目标语言;返回当前非固定语段的转换结果供上一层次的非固定语段调用,直到把最高层次的非固定语段(作为初始数据的非固定语段)转换成非形式化的目标L口口o第三步输出非形式化的目标语言。雄i吾拥,i涵服i吾舗和遍i圣,ffl从源语言到非形式化的目标语言的机器翻译可以用于互联网终端设备。例如在用作互联网终端设备并且连接电脑的手机的存储装置里存储从源语言到非形式化目标语言机器翻译系统。甲是母语是汉语、完全不懂英语的使用者;乙是母语是英语、完全不懂汉语的使用者。甲把非形式化的汉语输入自己的手机,甲和自己的手机以交互方式对非形式化的汉语进行形式化处理,甲的手机以自动方式把形式化的汉语转换成非形式化的英语,然后,甲的手机把非形式化的英语发送给乙,乙在自己的手机上阅读非形式化的英语;乙把非形式化的英语输入自己的手机,乙和自己的手机以交互方式对非形式化的英语进行形式化处理,乙的手机以自动方式把形式化的英语转换成非形式化的汉语,然后,乙的手机把非形式化的汉语发送给甲,甲在自己的手机上阅读非形式化的汉语。(具有从源语言到非形式化目标语言机器翻译功能的手机所连接的电脑也具有从源语言到非形式化目标语言机器翻译功能)使用者可以使用手机把母语正确(而且没有任何词汇歧义)地翻译成任何一种自己完全不懂的外语。具有从源语言到非形式化目标语言机器翻译功能的手机能够消除互联网的语言障碍,增进各国人民的相互了解与合作。四、析,器翻译方法的第四实施例本实施例的机器翻译方法是将非形式化的源语言转换成形式化的目标语言,主要包括两个步骤,第一步骤是对于非形式化的源语言的初始语段,首先,以自动方式逐个切分固定语段(标注固定语段标记)并标注固定语段的意义标记,直到最后一个固定语段,然后,以自动方式逐层组合非固定语段(标注组合标记)并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。第二步骤是自动运用固定语段转换规则把源语言的固定语段转换为目标语言的语段,然后以自动方式运用非固定语段转换规则逐层把源语言的非固定语段转换成目标语言的语段,从而将非形式化的源语言转换为非形式化的目标语言。其中本实施例的标记的说明、替代、以自动方式对源语言进行形式化处理(包括以自动方式切分固定i吾段并标沣标记的过禾呈以及以自动方式飽合非固定i吾段并标沣标记Miilil都和第二实施例相同,在此不再赘述,以下重点说明本实施例和上述第二实施例的区别所在。换句话说,本实施例的第一个步骤和第二实施例的第一个步骤是完全一样的,因此下面是对本实施例第二个步骤的详细描述。护U纖原i吾諧械,i涵服i吾舗讨禾罕以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段,然后,以自动方式运用非固定语段转换规则(即,根据源语言的非固定语段的核心成分标记和关系标记或关系词用源语言的非固定语段的成分的译文和目标语言的关系词构成目标语言的非固定语段的规则)逐层把源语言的非固定语段转换成目标语言的语段。'王o非形式化的英语methodsrelatingtodataprocessingperformedbyautomaticmeans形式化的英语methods1relatingtodataprocessingperformed1by2automatic1means1NthPNaaVTEDPAaaPAacNob_4_^NobVTEDPAaa20NaaNth(以自动方式对源语言进行形式化处理的结果)以自动方式运用固定语段转换规则把英语的固定语段转换成汉语的语段固定语段转换规则英语汉语法语德语日语methods1方法***************dataprocessing数据处理***************performed1***************automatic1自动3***************m6肌s1工具1***************methods1—方法dataprocessing—数据处王串.performed1—被执行automatic1—自云力3means1—工具1以自动方式运用非固定语段转换规则逐层把英语的非固定语段转换成汉语的语段非固定语段转换规则(、代表英语成分,b/、relatingto是英语关系词,*是核心成分标记,4、1是关系标记;一代表转换;R、……a代表英语成分的汉语译文,的、被s、皿工是汉语关系词)规则一…4......*—"..汉的......汉规则二*."by2......-—被5……汉…汉规则三氺…1......—规则四relatingto......—有关i......汉白勺...汉第一层转换automatic1means1—automatic1^勺means1汉—自动3的工具、规则一:第二层转换performed1by2automatic1means1—被5automatic1means1汉performed皿3的工具1被执行(规则二)第三层转换dataprocessingperformed1by2automatic1means1—performed1by2auto腿tic1means1汉的dataprocessing汉一被5自动3的工具1被执行的数据处理(规则三)第四层转换methods1relatingtodat抑rocessingperformed1by2automatic1means1—有关Mataprocessingperformed1by2automatic1means1汉的methods1汉一有关1被5自的工具1被执行的数据处理的方法(规则四)非形式化的汉语皿1被5^^3的工具1被执,行的数据处理的方法而把形式化的源i吾言转换成非形式化的目标i吾言的实现,以及从源i吾言到l非形式化的目标语言的机器翻译的应用均在上述的第三实施例中说明,在此不再赘述。在描述了关于机器翻译方法的上述四个实施例之后,本发明分别针对上述的四个有关方法的实施例,提供了关于机器翻译系统的四个实施例。由于这四个系统的实施例的技术实现细节和对应的方法实施例相同,因此对于这些系统实施例下面不提供对其具体实施技术的详细描述。五、机器翻译系统的第一实施例图8示出了机器翻译系统的第一实施例的原理。请参见图8,本实施例的机器翻译系统至少包括两个模块源语言形式化处理模块10和与之连接的形式化目标语言转换模块12。对于源语言形式化处理模块IO,对于非形式化的源语言的初始语段,首先,以交互方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以交互方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。对于形式化目标语言转换模块12,自动运用固定语段转换规则把源语言的固定语段转换为目标语言的语段,从而将非形式化的源语言转换为形式化的目标L口口o对于本实施例的机器翻译系统中涉及的标记,和机器翻译方法的第一实施例中详细记载的标记相同。较佳的,本实施例还可以设置一个替换标记模块,替换标记模块连接在源语言形式化处理模块10之前,在源语言形式化处理模块10之前预先使用替换标记把一个初始语段分解成若干个子语段,针对这些子语段分别进行后续的源语言形式化处理模块10的处理。替换标记模块的具体运作过程和机器翻译方法的第一实施例中详细记载的替换标记相同。对于源语言形式化处理模块10而言,其内部至少包括了交互式切分固定语段单元100以及与之连接的交互式组合非固定语段单元102。对于交互式切分固定语段单元100来说,存储器的固定语段模式包含固定语段及其意义标记,其中形式相同意义不同的固定语段带有意义标记,由处理器依次判断在存储器里是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推,如果在存储器里存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就将最前的n个文字单元切分为固定语段,标注固定语段标记,运用一个固定语段模式标注该固定语段的意义标记,其中n为自然数,然后由使用者确认或修改,依此类推直到最后一个固定语段;其中如果在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段,标注固定语段标记并标注这个固定语段的意义标记,然后由处理器继续切分和标注下一个固定语段。而其内部实现的具体细节、实例等均已在机器翻译方法的第一实施例中说明。对于交互式组合非固定语段单元102来说,以交互方式逐层逐个按组合标记、核心成分标记、关系标记的顺序标注非固定语段的标记,直到整个初始语段构成的一个非固定语段。而交互式组合非固定语段单元102具体的实现细节、实例等均已在机器翻译方法的第一实施例中说明。形式化目标语言转换模块12进一步包括依次连接的标记删除单元120、固定语段转换单元122以及标记点击单元124。标记删除单元120删除形式化的源语言的语法属性标记和语义属性标记。固定语段转换单元122查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段,其中目标语言的固定语段带有意义标记。标记点击单元124在使用者点击目标语言的固定语段的意义标记以后显示固定语段的意义特征,在使用者点击关系标记以后显示关系标记所代表的关系。这三个单元具体的实现细节以及形式化目标语言转换模块12的实例,均已在机器翻译方法的第一实施例中说明。A、和遍i圣碰白條二輔你l图9示出了机器翻译系统的第二实施例的原理。请参见图9,本实施例的机器翻译系统至少包括两个模块源语言形式化处理模块20和与之连接的形式化目标语言转换模块22。对于源语言形式化处理模块20,对于非形式化的源语言的初始语段,首先,以自动方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以自动方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。对于形式化目标语言转换模块22,自动运用固定语段转换规则把源语言的固定语段转换为目标语言的语段,从而将非形式化的源语言转换为形式化的目标L口口o对于本实施例的机器翻译系统中涉及的标记,和机器翻译方法的第二实施例中详细记载的标记相同。较佳的,本实施例还可以设置一个替换标记模块,替换标记模块连接在源语言形式化处理模块20之前,在源语言形式化处理模块20之前预先使用替换标记把一个初始语段分解成若干个子语段,针对这些子语段分别进行后续的源语言形式化处理模块20的处理。替换标记模块的具体运作过程和机器翻译方法的第二实施例中详细记载的替换标记相同。对于源语言形式化处理模块20而言,其内部至少包括了自动式切分固定语段单元200以及与之连接的自动式组合非固定语段单元202。对于自动式切分固定语段单元200来说,存储器的固定语段模式包含固定语段及其意义标记,其中形式相同意义不同的固定语段带有意义标记,由处理器依次判断在存储器里是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推,如果在存储器里存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就将最前的n个文字单元切分为固定语段,标注固定语段标记,运用一个固定语段模式标注该固定语段的意义标记,其中n为自然数,然后由使用者确认或修改,依此类推直到最后一个固定语段;其中如果在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段,标注固定语段标记并标注这个固定语段的意义标记,然后由处理器继续切分和标注下一个固定语段。而其内部实现的具体细节、实例等均已在机器翻译方法的第二实施例中说明。对于自动式组合非固定语段单元202来说,以自动方式逐层逐个按组合标记、核心成分标记、关系标记的顺序标注非固定语段的标记,直到整个初始语段构成的一个非固定语段。而自动式组合非固定语段单元202具体的实现细节、实例等均已在机器翻译方法的第二实施例中说明。形式化目标语言转换模块22进一步包括依次连接的自动方式标记删除单元220、自动方式固定语段转换单元222以及标记点击单元224。自动方式标记删除单元220以自动方式删除作为以自动方式对源语言进行形式化处理的结果的形式化的源语言的语法属性标记和语义属性标记(自动方式标记删除单元220可以不设置)。自动方式固定语段转换单元222查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段,其中目标语言的固定语段带有意义标记。标记点击单元224在使用者点击目标语言的固定语段的意义标记以后显示固定语段的意义特征,在使用者点击关系标记以后显示关系标记所代表的关系。这三个单元具体的实现细节以及形式化目标语言转换模块22的实例,均已在机器翻译方法的第二实施例中说明。七'、和遍i圣碰白勺m翻图IO示出了机器翻译系统的第三实施例的原理。请参见图IO,本实施例的机器翻译系统至少包括两个模块源语言形式化处理模块30和与之连接的非形式化目标语言转换模块32。对于源语言形式化处理模块30,对于非形式化的源语言的初始语段,首先,以交互方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以交互方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。对于非形式化目标语言转换模块32,以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段,然后以自动方式运用非固定语段转换规则逐层把源语言的非固定语段转换成目标语言的语段,从而将非形式化的源语言转换为非形式化的目标语言。对于本实施例的机器翻译系统中涉及的标记,和机器翻译方法的第三实施例中详细记载的标记相同。较佳的,本实施例还可以设置一个替换标记模块,替换标记模块连接在源语言形式化处理模块30之前,在源语言形式化处理模块30之前预先使用替换标记把一个初始语段分解成若干个子语段,针对这些子语段分别进行后续的源语言形式化处理模块30的处理。替换标记模块的具体运作过程和机器翻译方法的第三实施例中详细记载的替换标记相同。对于源语言形式化处理模块30而言,其内部至少包括了交互式切分固定语段单元300以及与之连接的交互式组合非固定语段单元302。对于交互式切分固定语段单元300来说,存储器的固定语段模式包含固定语段及其意义标记,其中形式相同意义不同的固定语段带有意义标记,由处理器依次判断在存储器里是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推,如果在存储器里存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就将最前的n个文字单元切分为固定语段,标注固定语段标记,运用一个固定语段模式标注该固定语段的意义标记,其中n为自然数,然后由使用者确认或修改,依此类推直到最后一个固定语段;其中如果在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段,标注固定语段标记并标注这个固定语段的意义标记,然后由处理器继续切分和标注下一个固定语段。而其内部实现的具体细节、实例等均已在机器翻译方法的第三实施例中说明。对于交互式组合非固定语段单元302来说,以交互方式逐层逐个按组合标记、核心成分标记、关系标记的顺序标注非固定语段的标记,直到整个初始语段构成的一个非固定语段。而交互式组合非固定语段单元302具体的实现细节、实例等均已在机器翻译方法的第三实施例中说明。非形式化目标语言转换模块32进一步包括固定语段转换单元320以及与之连接的非固定语段转换单元322。固定语段转换单元320查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段,其中目标语言的固定语段带有意义标记。非固定语段转换单元322查找非固定语段转换规则列表得到匹配的非固定语段转换规则,运用匹配的非固定语段转换规则把源语言的非固定语段转换成目标语言的语段,通过递归执行此步骤逐层转换所有的非固定语段,其中对形式化的源语言的当前非固定语段来说,首先把当前非固定语段的各个成分分别转换成非形式化的目标语言,然后运用匹配的非固定语段转换规则把当前非固定语段转换成非形式化的目标语言,返回当前非固定语段的转换结果供上一层次的非固定语段调用,直到把最高层次的非固定语段转换成非形式化的目标语言,最后输出非形式化的目标语言。这两个单元具体的实现细节以及非形式化目标语言转换模块32的实例,均已在机器翻译方法的第三实施例中说明。八、和遍i圣碰白條隨翻图11示出了机器翻译系统的第四实施例的原理。请参见图ll,本实施例的机器翻译系统至少包括两个模块源语言形式化处理模块40和与之连接的非形式化目标语言转换模块42。对于源语言形式化处理模块40,对于非形式化的源语言的初始语段,首先,以自动方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以自动方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。对于非形式化目标语言转换模块42,以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段,然后以自动方式运用非固定语段转换规则逐层把源语言的非固定语段转换成目标语言的语段,从而将非形式化的源语言转换为非形式化的目标语言。对于本实施例的机器翻译系统中涉及的标记,和机器翻译方法的第四实施例中详细记载的标记相同。较佳的,本实施例还可以设置一个替换标记模块,替换标记模块连接在源语言形式化处理模块40之前,在源语言形式化处理模块40之前预先使用替换标记把一个初始语段分解成若干个子语段,针对这些子语段分别进行后续的源语言形式化处理模块40的处理。替换标记模块的具体运作过程和机器翻译方法的第四实施例中详细记载的替换标记相同。对于源语言形式化处理模块40而言,其内部至少包括了自动式切分固定语段单元400以及与之连接的自动式组合非固定语段单元402。对于自动式切分固定语段单元400来说,存储器的固定语段模式包含固定语段及其意义标记,其中形式相同意义不同的固定语段带有意义标记,由处理器依次判断在存储器里是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推,如果在存储器里存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的同定语段,处理器就将最前的n个文字单元切分为固定语段,标注固定语段标记,运用一个固定语段模式标注该固定语段的意义标记,其中n为自然数,然后由使用者确认或修改,依此类推直到最后一个固定语段;其中如果在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段,标注固定语段标记并标注这个固定语段的意义标记,然后由处理器继续切分和标注下一个固定语段。而其内部实现的具体细节、实例等均已在机器翻译方法的第四实施例中说明。对于自动式组合非固定语段单元402来说,以自动方式逐层逐个按组合标记、核心成分标记、关系标记的顺序标注非固定语段的标记,直到整个初始语段构成的一个非固定语段。而自动式组合非固定语段单元402具体的实现细节、实例等均已在机器翻译方法的第四实施例中说明。非形式化目标语言转换模块42进一步包括固定语段转换单元420以及与之连接的非固定语段转换单元422。固定语段转换单元420查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段,其中目标语言的固定语段带有意义标记。非固定语段转换单元422查找非固定语段转换规则列表得到匹配的非固定语段转换规则,运用匹配的非固定语段转换规则把源语言的非固定语段转换成目标语言的语段,通过递归执行此步骤逐层转换所有的非固定语段,其中对形式化的源语言的当前非固定语段来说,首先把当前非固定语段的各个成分分别转换成非形式化的目标语言,然后运用匹配的非固定语段转换规则把当前非固定语段转换成非形式化的目标语言,返回当前非固定语段的转换结果供上一层次的非固定语段调用,直到把最高层次的非固定语段转换成非形式化的目标语言,最后输出非形式化的目标语言。这两个单元具体的实现细节以及非形式化目标语言转换模块42的实例,均已在机器翻译方法的第四实施例中说明。上述实施例是提供给本领域普通技术人员来实现或使用本发明的,本领域普通技术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。4权利要求一种把非形式化的源语言翻译成形式化的目标语言的机器翻译方法,该方法包括步骤一对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段;步骤二以自动方式把形式化的源语言转换成形式化的目标语言——以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段。2.根据权利要求l所述的机器翻译方法,其特征在于在步骤一中,使用替代标记进行预处理——预先使用替代标记把一个初始语段分解成若干个子语段,接着对这些子语段分别进行形式化处理。3.根据权利要求1所述的机器翻译方法,其特征在于步骤一是以交互方式对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,以交互方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以交互方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。4.根据权利要求3所述的机器翻译方法,其特征在于以交互方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果在存储器里存在最前的n,个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,运用一个固定语段模式标注这个固定语段的意义标记,然后,使用者确认或修改,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段并标注这个固定语段的意义标记,然后,处理器切分和标注下一个固定语段。5.根据权利要求1所述的机器翻译方法,其特征在于步骤一是以自动方式对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,以自动方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以自动方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。6.根据权利要求5所述的机器翻译方法,其特征在于以自动方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记、语法属性标记、语义属性标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果,在存储器里,存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,查出存储器里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注这个固定语段的意义标记、语法属性标记、语义属性标记,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,处理器就进行回溯。7.根据权利要求5所述的机器翻译方法,其特征在于以自动方式组合并标注非固定语段的过程进一步包括存储器里的非固定语段模式包含成分语段的语法属性标记、语义属性标记和组合语段的组合标记、核心成分标记、关系标记、语法属性标记、语义属性标记;处理器查出存储器里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式,运用这个非固定语段模式组合一个非固定语段并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记,然后,处理器组合和标注下一个非固定语段,依此类推,直到整个初始语段构成的一个非固定语段;如果处理器查出在存储器里不存在可以运用的非固定语段模式,处理器就进行回溯。8.根据权利要求1所述的机器翻译方法,其特征在于在步骤二中,处理器查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段,目标语言的固定语段带有意义标记;在使用者点击目标语言的固定语段的意义标记以后显示器显示固定语段的意义特征,在使用者点击关系标记以后显示器显示关系标记所代表的关系。9.一种把非形式化的源语言翻译成非形式化的目标语言的机器翻译方法,该方法包括步骤一对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段;步骤二以自动方式把形式化的源语言转换成非形式化的目标语言——首先,以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段,然后,以自动方式运用非固定语段转换规则逐层把源语言的非固定语段转换成目标语言的语段。10.根据权利要求9所述的机器翻译方法,其特征在于在步骤一中,使用替代标记进行预处理——预先使用替代标记把一个初始语段分解成若干个子语段,接着对这些子语段分别进行形式化处理。11.根据权利要求9所述的机器翻译方法,其特征在于步骤一是以交互方式对非形式化的源语言进行形式化处理进一步包括对于非形式化的源语言的初始语段,首先,以交互方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以交互方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。12.根据权利要求11所述的机器翻译方法,其特征在于以交互方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果在存储器里存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,运用一个固定语段模式标注这个固定语段的意义标记,然后,使用者确认或修改,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段并标注这个固定语段的意义标记,然后,处理器切分和标注下一个固定语段。13.根据权利要求9所述的机器翻译方法,其特征在于步骤一是以自动方式对非形式化的源语言进行形式化处理,进一步包括对于非形式化的源语言的初始语段,首先,以自动方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,以自动方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。14.根据权利要求13所述的机器翻译方法,其特征在于以自动方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记、语法属性标记、语义属性标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果,在存储器里,存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,查出存储器里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注这个固定语段的意义标记、语法属性标记、语义属性标记,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,处理器就进行回溯。15.根据权利要求13所述的机器翻译方法,其特征在于以自动方式组合并标注非固定语段的过程进一步包括存储器里的非固定语段模式包含成分语段的语法属性标记、语义属性标记和组合语段的组合标记、核心成分标记、关系标记、语法属性标记、语义属性标记;处理器查出存储器里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式,运用这个非固定语段模式组合一个非固定语段并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记,然后,处理器组合和标注下一个非固定语段,依此类推,直到整个初始语段构成的一个非固定语段;如果处理器查出在存储器里不存在可以运用的非固定语段模式,处理器就进行回溯。16.根据权利要求9所述的机器翻译方法,其特征在于步骤二进一步包括处理器查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段;处理器查找非固定语段转换规则列表得到匹配的非固定语段转换规则,目标语言的非固定语段的规则是根据源语言的非固定语段的核心成分标记、关系标记或关系词用源语言的非固定语段的成分的译文、目标语言的关系词构成的,运用匹配的非固定语段转换规则把源语言的非固定语段转换成目标语言的非固定语段,通过递归执行此步骤逐层转换所有的非固定语段,其中对形式化的源语言的当前非固定语段来说,首先把当前非固定语段的各个成分分别转换成非形式化的目标语言,然后运用匹配的非固定语段转换规则把当前非固定语段转换成非形式化的目标语言,返回当前非固定语段的转换结果供上一层次的非固定语段调用,直到把作为初始数据的非固定语段转换成非形式化的目标语言。17.—种把非形式化的源语言翻译成形式化的目标语言的机器翻译系统,该系统包括源语言形式化处理模块,该模块对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段;形式化目标语言转换模块,该模块连接在源语言形式化处理模块之后,以自动方式把形式化的源语言转换成形式化的目标语言——以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段。18.根据权利要求17所述的机器翻译系统,其特征在于该系统还包括一个连接在源语言形式化处理模块之前的替代模块,该模块使用替代标记进行预处理——预先使用替代标记把一个初始语段分解成若干个子语段,接着对这些子语段分别进行形式化处理。19.根据权利要求17所述的机器翻译系统,其特征在于源语言形式化处理模块以交互方式对非形式化的源语言进行形式化处理,该模块进一步包括交互方式固定语段切分单元,该单元以交互方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段;交互方式非固定语段组合单元,该单元连接在交互方式固定语段切分单元之后,以交互方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。20.根据权利要求19所述的机器翻译系统,其特征在于交互方式固定语段切分单元以交互方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果在存储器里存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,运用一个固定语段模式标注这个固定语段的意义标记,然后,使用者确认或修改,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段并标注这个固定语段的意义标记,然后,处理器切分和标注下一个固定语段。21.根据权利要求17所述的机器翻译系统,其特征在于源语言形式化处理模块以自动方式对非形式化的源语言进行形式化处理,该模块进一步包括自动方式固定语段切分单元,该单元以自动方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段;自动方式非固定语段组合单元,该单元连接在自动方式固定语段切分单元之后,以自动方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。22.根据权利要求21所述的机器翻译系统,其特征在于自动方式固定语段切分单元以自动方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记、语法属性标记、语义属性标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果,在存储器里,存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,查出存储器里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注这个固定语段的意义标记、语法属性标记、语义属性标记,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,处理器就进行回溯。23.根据权利要求21所述的机器翻译系统,其特征在于自动方式非固定语段组合单元以自动方式组合并标注非固定语段的过程进一步包括存储器里的非固定语段模式包含成分语段的语法属性标记、语义属性标记和组合语段的组合标记、核心成分标记、关系标记、语法属性标记、语义属性标记;处理器查出存储器里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式,运用这个非固定语段模式组合一个非固定语段并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记,然后,处理器组合和标注下一个非固定语段,依此类推,直到整个初始语段构成的一个非固定语段;如果处理器查出在存储器里不存在可以运用的非固定语段模式,处理器就进行回溯。24.根据权利要求17所述的机器翻译系统,其特征在于形式化目标语言转换模块进一步包括自动方式固定语段转换单元,该单元查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段,目标语言的固定语段带有意义标记;标记点击单元,该单元在使用者点击目标语言的固定语段的意义标记以后显示固定语段的意义特征,在使用者点击关系标记以后显示关系标记所代表的关系。25.—种把非形式化的源语言翻译成非形式化的目标语言的机器翻译系统,该系统包括源语言形式化处理模块,该模块对非形式化的源语言进行形式化处理——对于非形式化的源语言的初始语段,首先,逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段,然后,逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段;非形式化目标语言转换模块,该模块连接在源语言形式化处理模块之后,以自动方式把形式化的源语言转换成非形式化的目标语言——首先,以自动方式运用固定语段转换规则把源语言的固定语段转换成目标语言的语段,然后,以自动方式运用非固定语段转换规则逐层把源语言的非固定语段转换成目标语言的语段。26.根据权利要求25所述的机器翻译系统,其特征在于该系统还包括一个连接在源语言形式化处理模块之前的替代模块,该模块使用替代标记进行预处理——预先使用替代标记把一个初始语段分解成若干个子语段,接着对这些子语段分别进行形式化处理。27.根据权利要求25所述的机器翻译系统,其特征在于源语言形式化处理模块以交互方式对非形式化的源语言进行形式化处理,该模块进一步包括交互方式固定语段切分单元,该单元以交互方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段;交互方式非固定语段组合单元,该单元连接在交互方式固定语段切分单元之后,以交互方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。28.根据权利要求27所述的机器翻译系统,其特征在于交互方式固定语段切分单元以交互方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记,形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果在存储器里存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,运用一个固定语段模式标注这个固定语段的意义标记,然后,使用者确认或修改,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,使用者就切分剩余语段的最前的1个文字单元开头的固定语段并标注这个固定语段的意义标记,然后,处理器切分和标注下一个固定语段。29.根据权利要求25所述的机器翻译系统,其特征在于源语言形式化处理模块以自动方式对非形式化的源语言进行形式化处理,该模块进一步包括自动方式固定语段切分单元,该单元以自动方式逐个切分固定语段并标注固定语段的意义标记,直到最后一个固定语段;自动方式非固定语段组合单元,该单元连接在自动方式固定语段切分单元之后,以自动方式逐层组合非固定语段并标注非固定语段的核心成分标记、关系标记,直到整个初始语段构成的一个非固定语段。30.根据权利要求29所述的机器翻译系统,其特征在于自动方式固定语段切分单元以自动方式切分并标注固定语段的过程进一步包括存储器里的固定语段模式包含固定语段及其意义标记、语法属性标记、语义属性标记,其中形式相同意义不同的固定语段带有意义标记;处理器依次判断,在存储器里,是否存在最前的1个文字单元开头的固定语段,是否存在最前的2个文字单元开头的固定语段,是否存在最前的3个文字单元开头的固定语段,依此类推;如果,在存储器里,存在最前的n个文字单元开头的固定语段而不存在最前的n+l个文字单元开头的固定语段,处理器就把最前的n个文字单元切分为固定语段,其中n是自然数,查出存储器里的各个可以运用的固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个固定语段模式,运用这个固定语段模式标注这个固定语段的意义标记、语法属性标记、语义属性标记,依此类推,直到最后一个固定语段;如果处理器查出在存储器里不存在剩余语段的最前的1个文字单元开头的固定语段,处理器就进行回溯。31.根据权利要求29所述的机器翻译系统,其特征在于自动方式非固定语段组合单元以自动方式组合并标注非固定语段的过程进一步包括存储器里的非固定语段模式包含成分语段的语法属性标记、语义属性标记和组合语段的组合标记、核心成分标记、关系标记、语法属性标记、语义属性标记;处理器查出存储器里的各个可以运用的非固定语段模式,按累计运用次数从多到少的选择顺序选择其中的一个非固定语段模式,运用这个非固定语段模式组合一个非固定语段并标注这个非固定语段的核心成分标记、关系标记、语法属性标记、语义属性标记,然后,处理器组合和标注下一个非固定语段,依此类推,直到整个初始语段构成的一个非固定语段;如果处理器查出在存储器里不存在可以运用的非固定语段模式,处理器就进行回溯。32.根据权利要求25所述的机器翻译系统,其特征在于非形式化目标语言转换模块进一步包括自动方式固定语段转换单元,该单元查找固定语段转换规则列表得到匹配的固定语段转换规则,运用匹配的固定语段转换规则把源语言的固定语段转换成目标语言的固定语段或非固定语段;自动方式非固定语段转换单元,该单元连接在自动方式固定语段转换单元之后,查找非固定语段转换规则列表得到匹配的非固定语段转换规则,其中目标语言的非固定语段的规则是根据源语言的非固定语段的核心成分标记、关系标记或关系词用源语言的非固定语段的成分的译文、目标语言的关系词构成的,运用匹配的非固定语段转换规则把源语言的非固定语段转换成目标语言的非固定语段,通过递归执行此步骤逐层转换所有的非固定语段,其中对形式化的源语言的当前非固定语段来说,首先把当前非固定语段的各个成分分别转换成非形式化的目标语言,然后运用匹配的非固定语段转换规则把当前非固定语段转换成非形式化的目标语言,返回当前非固定语段的转换结果供上一层次的非固定语段调用,直到把作为初始数据的非固定语段转换成非形式化的目标语言。全文摘要本发明揭示了机器翻译方法和系统,使用者可以把母语正确(而且没有任何词汇歧义)地翻译成任何一种自己完全不懂的外语。机器翻译方法包括以交互方式或自动方式对非形式化源语言进行形式化处理和以自动方式把形式化源语言转换成形式化目标语言或非形式化目标语言两个步骤。机器翻译系统包括交互方式或自动方式源语言形式化处理模块和自动方式形式化目标语言或非形式化目标语言转换模块。源语言形式化处理模块和目标语言转换模块相互独立,这一特点使本发明具有易扩充性。对源语言进行形式化处理是把源语言翻译成各种目标语言的共同基础,这一特点使本发明特别适合“一对多”机器翻译。文档编号G06F17/28GK101739395SQ20091024794公开日2010年6月16日申请日期2009年12月31日优先权日2009年12月31日发明者程光远申请人:程光远
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1