意义形式化自动翻译方法

文档序号:6604864阅读:359来源:国知局
专利名称:意义形式化自动翻译方法
技术领域
本发明涉及一种自动翻译方法。
自动翻译(计算机自动地把一种语言翻译成其他语言)是实现跨语言交际地手段。现有的自动翻译方法尚有以下缺点1.存储在计算机里的翻译规则是人概括典型的语言现象制定的因而不能解释实际语料所包含的极其丰富的语言现象,所以自动翻译的正确率达到70%左右以后难以进一步提高。2.存储在计算机里的翻译规则是人制定然后输入计算机的,计算机不参与翻译规则的制定,所以自动翻译系统的开发效率很低。
本发明的目的是提供一种改进的自动翻译方法,它与现有的自动翻译方法相比具有以下优点1.存储在计算机里的翻译规则能够解释实际语料所包含的极其丰富的语言现象,所以自动翻译的正确率达到70%左右以后仍能稳步提高。2.计算机参与翻译规则的制定,所以自动翻译系统的开发效率显著提高。
本发明的目的是以如下方式实现的
1.在计算机的存储装置里存储翻译模式。源语言的一个组合模式和与之对应的把源语言转换成若干种目标语言的若干个转换模式构成一个翻译模式。组合模式包含参加组合的语段的属性标记和组合成的语段的属性标记。属性包括语法属性和语义属性。例
这是一个翻译模式。它的意思是源语言是英语。语段甲的核心词是B(即实义动词)和j(即表示活动的词),语段乙的核心词是A(即名词)和c(即表示物体的词),语段甲和语段乙组合成的语段的核心词是B和j。目标语言是汉语和日语。语段甲和语段乙组合成的语段的汉语译文是语段甲的汉语译文+语段乙的汉语译文。语段甲和语段乙组合成的语段的日语译文是语段乙的日语译文+を+语段甲的日语译文。
2.在计算机的存储装置里存储基本的组合规则—运用组合模式进行逐层组合。
3.计算机运用组合模式进行逐层组合时,在有两个以上组合模式可以运用的情况下选用累计运用次数最多(即常用度最高)的一个组合模式进行组合,在没有组合模式可以运用的情况下排除最近的一次组合后再进行组合。例设A、B、C、D、E是连续的五个语段。
(有三个组合模式可以运用<按累计运用次数由多到少排列>
(有两个组合模式可以运用<按累计运用次数由多到少排列>
(没有组合模式可以运用)→
(组合完成)
4.在计算机的存储装置里存储基本的转换规则—运用转换模式进行逐层转换。例
转换第一层An→一个electronic→电子computer→计算机performs→执行operations→运算surprising→惊人speed→速度转换第二层electronic computer→电子计算机performs operations→执行运算surprising speed→惊人的速度转换第三层An electronic computer→一个电子计算机performs operations with surprisingspeed→以惊人的速度执行运算转换第四层An electronic computer performs operations with surprising speed→一个电子计算机以惊人的速度执行运算
5.人和计算机共同制定组合模式—人通过计算机的输入装置输入实际语料,计算机的显示装置显示被输入的实际语料,然后人通过计算机的输入装置和显示装置对被显示的实际语料进行组合分析并标注各层语段的属性标记,然后计算机根据被显示的经过组合分析和标注各层语段的属性标记的实际语料生成组合模式。
6.计算机统计并标注各组合模式的累计运用次数。
以下将通过英汉自动翻译实例对本发明的翻译模式及其制定作详细描述。
英语的词的语法分类名词(A)实义动词(B)连系动词(C)情态动词(D)形容词(E)副词(F)代词(G)数词(H)冠词(I)介词(J)连词(K)。
英语的词的语义分类表示人的词(a)表示生物的词(b)表示物体的词(c)表示物质的词(d)表示事物的词(e)表示时间的词(f)表示处所的词(g)表示单位的词(h)表示动作的词(i)表示活动的词(j)表示状态的词(k)表示心理的词(1)表示表象的词(m)表示性质的词(n)表示频度的词(o)表示程度的词(p)表示否定的词(q)表示估量的词(r)表示范围的词(s)。
人通过计算机的输入装置输入实际语料,计算机的显示装置显示被输入的实际语料,然后人通过计算机的输入装置和显示装置对被显示的实际语料进行组合分析并标注各层语段的属性标记
*
然后计算机根据被显示的经过组合分析和标注各层语段的属性标记的实际语料生成组合模式并标注各组合模式的累计运用次数
Ac BjAe Ac Bj*
注1.*代表“句”。2.累计运用次数略。
然后人制定与各组合模式对应的转换模式与第一个组合模式对应的转换模式是→甲汉乙汉,与第二个组合模式对应的转换模式是→甲汉乙汉,与第三个组合模式对应的转换模式是→甲汉的乙汉,与第四个组合模式对应的转换模式是→甲汉乙汉,与第五个组合模式对应的转换模式是→以乙汉甲汉,与第六个组合模式对应的转换模式是→甲汉乙汉。
本发明具有以下主要特点
1.组合模式包含参加组合的语段的语义属性;在有两个以上组合模式可以运用的情况下选用累计运用次数最多(即常用度最高)的一个组合模式进行组合,在没有组合模式可以运用的情况下排除最近的一次组合后再进行组合。这实质上是系统地依据背景知识处理歧义问题的方式。
2.模式(组合模式、转换模式)和规则(组合规则、转换规则)相互独立。这样,既可以在不牵涉规则的情况下修改、补充模式,又可以在不牵涉模式的情况下修改、补充规则。这一特点使采用本发明的自动翻译系统具有易扩充性。
3.源语言的一个组合模式可以对应把源语言转换成多种目标语言的多个转换模式;组合规则、转换规则通用于各语言对。这样,“一对多”(如英→汉日德法)自动翻译系统存储空间较小,开发工作量较小。这一特点也使采用本发明的自动翻译系统具有易扩充性。
4.如果组合模式包含表示参加组合的语段之间的语义关系的标记和表示参加组合的语段和组合成的语段之间的语义关系的标记,就可以采用组合模式和组合规则实现自然语言理解(即,使自然语言表示的意义形式化)。例
这个组合模式包含表示语段乙的对象承受语段甲的对象的标记“2”和表示组合成的语段的对象跟语段甲的对象同一的标记“<”。
5.简单。爱因斯坦认为物理上真实的东西必定是逻辑上简单的东西。正如苹果落地、海水涨落、天体运行等等复杂的物理现象在本质上受着简单的万有引力规律的支配一样,支配着复杂的语言现象的语言规律在本质上也必定具有简单性。语言规律本身的简单性决定了本发明的简单性。
权利要求
1.自动翻译方法,其特征是在计算机的存储装置里存储翻译模式,源语言的一个组合模式和与之对应的把源语言转换成若于种目标语言的若干个转换模式构成一个翻译模式,组合模式包含参加组合的语段的属性标记和组合成的语段的属性标记,属性包括语法属性和语义属性。在计算机的存储装置里存储基本的组合规则—运用组合模式进行逐层组合和基本的转换规则—运用转换模式进行逐层转换。
2.权利要求1所述的自动翻译方法,其特征是计算机运用组合模式进行逐层组合时,在有两个以上组合模式可以运用的情况下选用累计运用次数最多(即常用度最高)的一个组合模式进行组合,在没有组合模式可以运用的情况下排除最近的一次组合后再进行组合。
3.权利要求2所述的自动翻译方法,其特征是计算机统计并标注各组合模式的累计运用次数。
4.权利要求1、2或3所述的自动翻译方法,其特征是人和计算机共同制定组合模式—人通过计算机的输入装置输入实际语料,计算机的显示装置显示被输入的实际语料,然后人通过计算机的输入装置和显示装置对被显示的实际语料进行组合分析并标注各层语段的属性标记,然后计算机根据被显示的经过组合分析和标注各层语段的属性标记的实际语料生成组合模式。
全文摘要
本发明提供了一种自动翻译方法:源语言的一个包含语法属性和语义属性的组合模式对应把源语言转换成若干种目标语言的若干个转换模式,计算机根据组合规则运用组合模式进行逐层组合,根据转换规则运用转换模式进行逐层转换;人和计算机共同制定组合模式——计算机根据人通过输入装置和显示装置进行了组合分析并标注了各层语段的属性标记的实际语料自动生成组合模式。采用本发明的自动翻译系统在正确性、易扩充性和开发效率方面明显优于现有的自动翻译系统。
文档编号G06F17/28GK1233026SQ9811079
公开日1999年10月27日 申请日期1998年4月21日 优先权日1998年4月21日
发明者程鸣 申请人:程鸣
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1