用于语音间翻译的方法和设备的制作方法

文档序号:6413132阅读:106来源:国知局
专利名称:用于语音间翻译的方法和设备的制作方法
技术领域
本发明涉及从一种语言到另一种语言的翻译,更具体地,本发明涉及至少在一部分上根据用户选择的该翻译的特定中心专题实现语言间的翻译。
语言间的翻译是周知的。在最基本的意义上,翻译是由通晓源语言和目标语言的个人人工地进行的。人力翻译员具有以很高的准确性在几乎即时下翻译文字或口语的能力。此外,由于翻译员通常很了解交流所基于的专题或主题,人力翻译员通常更为准确。
员然人力翻译通常很准确,但他们也是非常昂贵的,即需要非常专业的人才。除了价格可能是过高的基本费用外,许多需要翻译的情况要求具有其它知识的译员,这进一步增加了费用。例如,若二个说不同语言的生物科学家需要交流,译员除了在这二种语言上流利之外,还必须具有生物技术的知识,以便能以恰当的含意翻译许多“技术术语”。
人力译员的另一个问题是,只有少量的能进行这种工作的合格人员。已经作出许多尝试来解决劳力密集型人力翻译业务中的问题。这些尝试常常涉及到利用电子部件把书面文字从一种语言翻译到另一种语言。
例如,Masuzawa等的4,393,460号美国专利公开一种电子翻译器,其利用语音响应电路输入一种语言的单词,处理电路把单词翻译成第二种语言,然后语音合成电路“念出”翻译好的第二种语言中的单词。其翻译基于三个“分析器”的运行,这三个分析器分析单词的字符、语法以及各单词的频率。Masuzawa所说明的系统的一个不足是,它依赖单组规则并且“难以理解”每种语言的句子。这必定导致翻译错误,尤其当翻译的主题是专业论题时更如此。
在Okamoto等的4,805,732号美国专利中说明另一种翻译系统。Okamoto公开一种翻译机,它具有一个输入部分、一个存储语言学信息的词典部分、一个处理部分和一个输出部分。输出部分包括一个显示器,并具有允许用户编辑输入文本或编辑翻译文本的能力。然而,Okamoto的系统至少具有和Masuzawa系统相同的不足,即其翻译基于某给定语言的单组规则。
Fukumochi等的5,299,124号美国专利说明一种翻译机,它具体地以句子的句法分析为目标。通过词典/词态分析器把输入的句子分成各个单词。借助语法信息为每个单词匹配翻译单词,以得到时态、人称和数量信息(即单复数)。一个句法分析器根据词典翻译和句子的语法规则形成结构分析树。若该树失败,则把句子分成更小的数个部分并且重新处理,直至出现成功的翻译。但是,Fukumachi仍旧对每种语言应用单组的规则。
Frantz等的4,507,750号美国专利试图解决上述的一些不足。注意到对于准确的翻译单词对单词的翻译是不够的,Frantz说明一种分析给定句子内的前后关系的系统,以克服各种问题,例如处理其它翻译机带来的同音异义词。虽然Frantz的确解决了简单问题,例如区分to、too、和two,但他仍依赖于每种语言的单组规则。
至少出于上述原因,本发明的一个目的是提供一种翻译系统,它根据要翻译的信息的专题在语言间进行翻译。
本发明的另一个目的是提供一种翻译系统,其依赖于给定语言的多个规则库以提高翻译准确性。
本发明的又一个目的是提供一种翻译系统,其使用多个词典以在第一语言和第二语言间翻译。
本发明的上述和其它目的是通过本文中所说明的系统和方法实现的,在其中,二种语言间的翻译至少一部分上是根据交流所依从的选定专题的。本发明的翻译系统和方法包括为每对语言建立的可称之为的“三维”数据库。这三维由源语言、目标语言、和专题(或交流所依从的主题)。数据库的各个单元包括用于各个论题的例如和关联频率、同义词、与专题相关的词典定义有关的信息。
本发明的原理可应用于各种系统和方法,以自动地进行高准确翻译。在一种实施例中,通过扫描(或其它通用装置)各种资料构造专题词典。例如,为了建立和微生物学有关的数据库层(即,三维数据库的第一层),应扫描微生物学行业刊物的各种论文。扫描材料可通过语法分析程序,从而对单词指定词类。接着对输入材料应用普通的双语词典,以产生目标语言译文。
在扫描源语言材料的同时,利用目标语言中的各种资料(和相同的专题有关)对目标语言进行相同的过程。其最终结果是在带有相关翻译的一个语言中的二份单词文件。接着通过某种型式的模式识别子例程处理这二份文件,以计算出二份文件之间关联的前向和反向频率。该过程产生三维主题数据库的一层(即,用于选定的专题)。
一旦为某给定的专题建立三维主题数据,可以用许多方式使用该系统。一种实施例是借助提供几乎实时的翻译的系统(每个通话人在说话后要停顿下),二个说不同语言的人在该系统中可用电话对话。语音识别电路把从话筒接收到的模拟信号(或这些信号的数字化形式)转换成供处理的信号。处理电路把信号转换成单词,接着再把各单词施加到专题数据库和普通的双语数据库以翻译文本。合成译后的文本并发送给另一个通话者。
在研究连带附图的下述详细说明后,本发明的上述和其它目的以及优点将会更加明显,在附图中相同标号表示相同部件,附图中

图1是一个框图,表示依据本发明的原理构建的翻译系统的一个实施例;图2是一个框图,表示用于图1的翻译系统的各种可能的输入系统的示例;图3是一个框图,表示用于图1的翻译系统的各种可能的输出系统的示例;图4是一个过程流程图,用于建立使用依据本发明的原理的图1翻译系统的三维专题数据库;图5是一个示意图,表示用来建立图4中的三维数据库的一部分过程的示例;以及图6是一个流程图,表示依据本发明的原理的图1翻译系统的操作。
用于在不同语言间进行翻译的本发明的系统和方法包括一个利用三维数据库(用于多个专题)以提供高准确翻译的处理系统。数据库的各“层”为给定专题(例如,生物技术、高频电子电路、医学技术等)提供二种语言间的翻译。另外还包括普通的双语词典(即,非专题式的),它们用于补充由利用专题词典的处理机完成的翻译。
图1概括地表示依据本发明的原理用于在不同语言间进行翻译的一种系统。翻译系统100包括输入系统102、112,输出系统104、114,处理机106和存储器108。存储器108可包括永久存储设备(例如磁盘机或磁光机)以及暂时存储器(例如DRAM)。至少一部分存储器108是暂时存储器,以包括各主题词典120、各双语字典122、各句法规则124和各语法规则126的分块。各个分块120-126在系统100不运行时可存储在永久存储器中,并作为系统100的启动过程中的一部分装入暂时存储器中。
通过经输入系统102、112向系统100提供附加信息,翻译系统100可用于建立或修改专题词典120或双语词典122。图2表示一些可经过输入系统102向系统100输入信息的不同方法。业内技术人员可理解,虽然在图2中示出输入部件电路的三种具体实现,本发明的原理可以由包括输入部件/电路中的任一种的系统、包括这些部件的组合的系统、以及包括其它已知的可接收语言信息的系统和把该信息转换成计算机处理的信号的电路(例如,简单的话筒和语音识别电路)实施。
输入系统102例如可包括接收语音输入的电话202和把这些语音输入转换成可由处理机206作为“文本”处理的信号的语音识别电路204。输入系统102还包括向系统100输入印刷文本的扫描仪206(或者输入系统可包括替代电话202的扫描仪206)。会同扫描仪206,设置光字符识别(OCR)电路软件208以把扫描后的信号转换成“文本”。OCR 208可驻留在扫描仪206内、可以是独立的硬件或者可驻留在处理机106内(由于对处理机106增加附加的负载,这是一种不太称心的配置)。
输入系统102的另一种选择是视频屏幕/键盘210,这可以是一台专用个人计算机、一台允许通过接触屏幕选择输入的独立视频触屏、或者一台与服务器或主机连接的终端。视频/键盘210允许用户实现对系统100的直接输入,当它充当输出系统104、114的一部分时,如后面更详细说明的那样允许用户编辑输入文本、翻译文本或二者。此外,虽然把图2描述成应用于输入系统102,业内的技术人员可理解,相同的原理可不违背本发明的精神而应用于输入系统112。
另一方面,输出系统104可包括和语音合成电路304连接的电话302,语音合成电路304把翻译的文本转换成译后语言下的语音信号。当然,取决于配置,根据电话是充当输入部件或充当输出部件,电话202和302可以是一台电话。当电话202和302是一台电话时,语音识别电路204和语音合成电路304最好是完成二种功能的单台电子部件。输出系统104还可以包括打印系统100所翻译的文本的打印机206(或者输出系统104可包括替代电话302的打印机306)。
输出系统104可替代地包括视频屏幕/键盘310,它可以是一台专用个人计算机、一台允许通过接触屏幕选择输入的独立视频触屏、或者一台与服务器或主机连接的终端。视频/键盘310允许用户接收来自系统100的翻译信息,当和输入系统102、112一起使用时,如后面更详细说明的那样它允许用户编辑输入文本、翻译文本或二者。此外,虽然把图3描述成应用于输出系统104,业内技术人员可理解,相同的原理可不违背本发明的精神而应用于输出系统114。
图4是一个流程图,表示如何依据本发明的原理建立三维专题词典120。图4中所示的过程包括二条主要分支402和412,根据翻译系统100的确切配置,可以并行地、串行地或组合地执行它们。每条分支402、412包括四个步骤(即,分支402包括步骤404-410,分支412包括实质上和步骤404-410相同的步骤414-420(从而下面不单独说明)),四个步骤产生一个具有一个或多个与从源语言输入的每个词相关的目标语言翻译的数据库。
对于每个需要翻译的专题执行图4中所示的过程。从而,当如后面更完整地说明那样,用户使用该系统时,用户选择翻译系统100使用的特定专题来专用于翻译,从而以更准确的方式产生翻译。产生专题词典120的一个专题层的第一步是向系统输入材料(即,步骤404)。如上面所述,可以按不同方法实现404。例如,可以通过电话202口头地读资料,向系统100输入材料,或者可以利用扫描仪206和OCR电路/软件208快速地输入多份资料。替代地,可把材料键入到视频屏幕/键盘210中。
一旦把材料输入到系统100中,处理机106在步骤406处理输入信息,通过语法分析把输入材料分成各个词。语法分析是一种周知的把各个输入字符转换成各个单词的过程(例如,可包含二个空格之间的所有字符以建立一个词)。分析之后为各个词确定词类。分类至少部分地根据诸如语法功能(例如,该词为主语、修饰语或宾语)、语法形式(例如,该词为所有格名词或时态动词)和本义等信息。在确定词类后,在步骤410,处理机106对照双语词典122处理输入的词,以为目标语言中每个输入的词生成一种或多种翻译。
在对所有可得到的材料(或至少使系统性能为可靠的足够材料)执行分支402、412后,处理机106在步骤422处理词关联(associations)。例如,处理机106可利用来自各分支的词关联以形成一个确定每个词的双向关联频率的神经网络。这在图5中表示,假定某个源语言(例如英语)中的词在目标语言(例如日语)中具有五种翻译(TRANS.1-TRANS.5),并且某个日语词具有四种英语翻译(TRANS.A-TRANS.D)。在该例中,TRANS.3是TARGET的准确相同词,TRANS.A是SOUCE的准确相同词。然而,若神经网络发现,对于选定的专题,把SOUCE翻译成TRANS.4具有明显的高出现率,则专题词典120将包括对SOURCE的TRANS.4的翻译,以代替常规翻译中可能使用的TRANS.3。
在翻译处理中应用马尔可夫过程期间处理机106使用双向关联频率。马尔可夫过程例如可用于确定在第一词确定后出现的一个词的转换概率。此外,根据本发明的原理,马尔可夫过程的结果将随用户选择的专题变化。下面在表1中示出该过程的一个例子,图中一系列英语词(只用字母的组合表示)和一系列日语词(用数字串表示)相关。
表1日语126254 367 476597ABD.1 .5.10 .3FGW.2 .2.10 .5英语UKS0 0.6 .2 .2OSL0 0.2 .8 0PWJ .7 .3 00 0对于英语中的每个词,表1的马尔可夫矩阵定义可从英语翻译成的每个日语词的转换概率。例如,ABD可译成四种不同的日语词(即,126、254、367和597),然而,对于所选定的专题,最高概率是把ABD译成254(50%的概率)。每行和每列中的每个词都具有100%的总概率(例如,词367有四种概率,它们相加为1,即.1+.1+.6+.2=1),这表示可以在各个方向(即,从英语到日语或从日语到英语)上翻译每个词。
一旦利用神经网络处理了所有的词,处理机106在步骤424更新专题词典120以包含选定专题的专题层。图4中所描述的处理也可用于更新专题词典中的任一层。在这种情况下,应在把各词与适当的双语词典122对照之前,先使各词和专题词典120的现有层对照来执行步骤410和420。借助这种方式,可进一步改进选定专题的专题词典的准确性。
图6是一种流程图,表示依据本发明的原理的翻译系统100的操作。图6中所描述的方法可用于各种用途,然而出于示例的目的,讨论的范围集中在二个各说一种不同语言的人在电话上交谈的情况。此外,出于讨论的目的,假定用来实现图6中各步骤的翻译系统100包括组合的输入/输出系统102/104、112/114,这些组合的输入/输出系统包括每方使用的电话202/302(包含处理语音数据所需的电路204/304)和视频屏幕/键盘210/310。
当一个人启动通电话时出现第一步骤,在步骤602选择交谈的专题(例如,若二位科学家要讨论新型爱滋病药的化学成分,主叫人可根据所使用的系统的专题幅度选择化学、药物学或爱滋病)。以常规的方式进行通话并且二个用户都接通电话(未示出该步骤)。在步骤604,各个通话人对着电话说话并且在处理机106接收到代表源语言中分析出的输入单词的信号之前进行语音信号处理。处理机106在步骤606以类似于对步骤408和418所说明的方法确定各词的类别。此外,例如可以利用提取各输入词和其周围的词之间的关联的马尔可夫模型以对输入的词进行处理。马尔可夫模型使得系统100区分同音异义词(例如,to、two和too),并且在说出词组、说出不完整的或一部分的句子的情况下填上缺少的词。
处理机106在步骤608使输入的词和专题词典120对照以得到目标语言的初步翻译。在步骤610,处理机106通过向输入的词应用源语言的句法规则124构造句子。在步骤612,通过对照双语词典122处理信息并且还对输入的词应用语法规则126得到任何附加的翻译(例如,任何其它缺少的词)。在步骤614,处理机106对照目标语言的句法规则124处理输入词和有关的翻译,以生成存储在存储器108中的翻译消息。在步骤616,通过电话202/302向接收人按目标语言中所说文本输出信息。
此外,在步骤604期间当个人对电话202/302说话时,在视频屏幕/键盘210/310上显示输入的各词(一旦处理机106接收这些分析状态下的单词时)。从而,该人有机会中断处理机106,以便根据需要修改输入信息(例如,若检测出语音识别处理中的错误)。在按目标语言合成各词的同时,接收人也可在视频屏幕/键盘210/310上观看译后的消息,并当不能理解译文时立即做出反馈。例如,若一句中大多数已理解,但一个或两个词不能理解,该人可在视频屏幕/键盘210/310上选取不清楚的词(例如,通过使用鼠标器或通过触屏输入系统(未示出))。向发出人反馈这些输入,发出人可提供源语言下的替代文本,接着对替代文本作出不同的翻译。
业内技术人员会理解,可以以不同于所描述的实施例的方式实现本发明,该所描述的实施例是以示例的目的提出的,其不构成限制,而本发明只由后面的权利要求书限定。例如,仅利用一对代替电话202/302的视频屏幕/键盘210/310可在二个说不同语言的人之间完成对话,或者,本发明的翻译系统可基于使用专题词典以用于技术资料或其它专用资料的翻译。
权利要求
1.一种根据用户选择的专题把信息从源语言翻译到目标语言的方法,所述方法包括步骤输入所述源语言中的所述信息以生成输入的各词;对所述输入的各词分类;根据所述用户选定的所述专题对所述的输入各词与专题词典进行比照,对所述输入词进行的所述比照为所述输入各词的至少大部分生成所述输入词对所述目标语言的一种或多种翻译;至少部分地根据所述源语言的一组句法规则从所述输入的各词形成句子;对所述输入各词应用普通的双语词典以提供所述目标语言中的附加翻译信息,仅当所述专题词典不能对特定的输入词提供一种或数种翻译时才应用所述的附加信息;对照所述目标语言的一组句法规则处理所述输入各词和所述一种或多种翻译以生成翻译的消息;以及输出所述翻译消息。
2.权利要求1的方法,其中所述输入步骤包括步骤从电话接收口头语音信号;以及利用语音识别电路处理所述语音信号以产生代表所述语音信号的电子信号。
3.权利要求1的方法,其中所述输入步骤包括步骤从扫描仪接收信号;以及利用光字符识别电路处理所述扫描仪信号以把所述扫描信号转换成文本信息。
4.权利要求1的方法,其中所述输入步骤包括步骤经计算机键盘接收文本信息。
5.权利要求1的方法,其中所述分类步骤包括步骤至少确定大部分的所述输入词的语法功能。
6.权利要求1的方法,其中所述分类步骤包括步骤至少确定大部分的所述输入词的语法形式。
7.权利要求1的方法,其中所述分类步骤包括步骤至少确定大部分的所述输入词的本义。
8.权利要求1的方法,其中所述分类步骤包括步骤至少确定大部分的所述输入词的语法功能;至少确定大部分的所述输入词的语法形式;至少确定大部分的所述输入词的本义。
9.权利要求1的方法,其中所述分类步骤包括步骤对所述输入各词应用马尔可夫模型,马尔可夫模型把每个输入词和其周围的输入词相关联,以便至少减少同音异义词的出现。
10.权利要求1的方法,其中所述输出所述翻译消息的步骤包括步骤把所述翻译消息合成为语音信号;以及把所述语音信号提供给电话系统,从而可用电话输出它们。
11.权利要求1的方法,其中所述输出所述翻译消息的步骤包括步骤在计算机屏幕上显示翻译消息。
12.权利要求11的方法还包括步骤允许翻译消息的接收人指出翻译消息的一个或多个词是不明白的。
13.权利要求1的方法,其中所述输出步骤包括步骤打印翻译消息。
14.一种根据用户选择的专题提供源语言和目标语言之间的翻译的系统,所述系统包括用于接收所述源语言中的输入消息的输入电路;用于产生所述目标语言中的翻译消息的输出电路;存储器,其具有专题词典分块、双语词典分块、所述源语言以及所述目标语言的句法规则分块和所述源语言以及所述目标语言的语法规则分块;以及和所述输入电路、所述输出电路、所述存储器连接的处理电路,所述处理电路至少通过对所述输入消息应用所述专题词典把所述输入消息从所述源语言处理成目标语言以生成翻译消息。
15.权利要求14的用于翻译消息的系统,其中所述输入电路包括电话;以及语音识别电路。
16.权利要求14的用于翻译消息的系统,其中所述输入电路包括扫描仪;以及光字符识别电路。
17.权利要求14的用于翻译消息的系统,其中所述输入电路包括包括视频屏幕和键盘的计算机终端。
18.权利要求17的用于翻译消息的系统,其中所述视频屏幕显示所述输入消息并且所述计算机终端还包括用于修改所述输入消息的装置。
19.权利要求14的用于翻译消息的系统,其中所述输出电路包括电话;以及语音合成电路。
20.权利要求14的用于翻译消息的系统,其中所述输出电路包括打印机。
21.权利要求14的用于翻译消息的系统,其中所述输出电路包括包括视频屏幕和键盘的计算机终端。
22.权利要求21的用于翻译消息的系统,其中所述计算机终端还包括用于向所述用户指出所述翻译消息的一个词或多个词是不明白的装置。
全文摘要
提供在不同语言间进行翻译的方法和设备。本发明包括一种通过设置三维专题双语数据库进行高准确性翻译的翻译系统。专题数据库包括该数据库所适用的每个专题的源语言至目标语言的翻译集。在一个实施例中,用户首先选择对话的专题,说到电话里的词被翻译并从另一台电话生成合成的语音信号,从而在二个说不同语言的人之间可保持几乎实时的对话。本发明的另一个特性是增添一个显示输入、输出词组的计算机终端,从而每个用户可编辑输入词组,或指出翻译是含糊的并请求对材料重新措词。
文档编号G06F17/27GK1238051SQ97199784
公开日1999年12月8日 申请日期1997年10月16日 优先权日1996年10月18日
发明者朱利叶斯·查尔尼 申请人:格丹肯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1