一种即时语音翻译系统和翻译方法

文档序号:2831983阅读:416来源:国知局
专利名称:一种即时语音翻译系统和翻译方法
技术领域
本发明涉及即时语音翻译技术,特别涉及一种即时语音翻译系统和翻译方法。
背景技术
因为Internet的出现及网络技术不断地进步,通过电脑、短信、Wap、JaVa客户端、 IP话机等方式来实现即时通讯沟通的方式现在越来越普遍。随着国家同国家的贸易、交流 的不断发展和进步,用户国际化的趋势必然导致不同国家人们在进行沟通时存在语言上问 题。以中、英文母语用户为例,在中国的用户很少有人能熟练使用英语和美国人交流,美国 人也很少有人懂汉语,于是语言成为国际化交流的最大障碍。现有的即时语音还没有将语音进行即时翻译的技术出现,而且即时语音翻译将会 帮助人们进行更方便、更广泛的无障碍交流。

发明内容
本发明的目的在于提供一种即时语音翻译系统,能将即时翻译技术集成到各种发 送端语音通信设备或者语音通信软件上,从而支持不同语种之间的沟通。本发明的另一个目的在于提供一种将多语言即时翻译集成到目前各种发送端语 音通信设备或者语音通信软件上的方法,能实现多种语言之间的翻译转换,从而支持不同 语种用户之间的沟通。为了达到以上目的本发明的技术方案是这样实现的(1) 一种即时语音翻译系统,其特征在于,包括多语言翻译数据库单元,用于存储不同语言的词库、短句库、行业库、以及原始文 本信息与所翻译的目标文本信息之间的翻译对照关系;翻译服务器单元,利用多语言翻译数据库单元将语音转换后的文本翻译为目标语 言文本;发送端应用单元,通过语音转换单元将输入或接听的语音转化为文本信息,经翻 译服务器单元翻译为目标语言文本,后回传至语音转换单元转换为目标语音经由语音信号 发送端发送出去。上述技术方案的特点在于(a)所述翻译服务器单元包括分析模块,和合成模块,发送模块;其中,分析模块获取并分析由语音转换成的文本信息,从词法、语法数据库单元 中提取所需的原始文本信息与所翻译的目标文本信息;其中,合成模块将从词法、语法数据库单元提取的文本信息与翻译的目标文本信 息,依照语法规则和语言习惯,合成目标语言;其中,发送模块用于发送合成的目标语言到语音处理单元。(b)所述词法、语法数据库单元包括翻译对照数据库,用于存储输入的语音转换 得到的原始文本信息与所翻译的目标文本信息之间的翻译对照关系;所述翻译对照数据库
3包括第一语言向第二语言对照数据库,和第二语言向第一语言对照数据库。(c)所述发送端应用单元还可以选择性包括输入语音的目标翻译语言设置及语音段落的开始和结束标记。录入或接听语音的设置模块,可以设置语音的语速快慢和音量大小。(2) 一种即时语音翻译方法,其特征在于,包括以下步骤发送端用户设定好目标 语言后,由语音处理单元将发送端用户的语音转换为文本信息,再由翻译服务单元将得到 的文本翻译为目标语言文本,并返回语音处理单元处理为目标语音,语音处理单元将目标 语音结果发送到语音信号发送端口最终到接收端;或发送端用户听到接收端语音信息,首 先语音处理单元对接收端语音进行文本转换然后通过翻译服务单元转换为目标文本,最后 通过语音处理单元处理输出到发送端。


图1为一种即时语音翻译系统2为即时语音翻译数据流图
具体实施例方式本发明的核心思想是在现有各种发送端语音通信设备或者语音通信软件中集成 不同语言间的语音翻译功能,由翻译服务器单元对输入用户录入的语音信息进行翻译,或 对接收端用户发来的语音信息进行翻译,从而实现对不同语言的用户进行通话即时翻译的 支持。参照图1,本发明的即时语音翻译系统包括翻译服务器单元,发送端应用单元。 翻译服务器单元进一步包括中央处理单元4、分析处理单元5、合成单元7,词法、语法数据 库单元6。其中,单元4用于处理来自发送端的翻译请求,并在翻译完成后返回翻译结果。 单元5获取并分析语音转换原始文本,按照分析结果,依据处理规则,从词法、语法数据库 提取所需的文本信息。单元7将从数据库提取的文本信息,依照语法规则,和语言习惯,合 成目标文本。单元6,词法、语法数据库包括,翻译对照数据库包括第一语言向第二语言对 照数据库和,第二语言向第一语言对照库。发送端应用单元进一步包括目标语言选择单元 1,语音输入单元2,语音处理单元3。其中,单元1用于设置目标翻译语言;单元2用于判断 语音输入段落的开始与结束;单元3用于将输入端的语音转化成为文本信息,同时将翻译 的目标语言文本转化成为语音发送给语音信号发送端。本发明中,所述数据库6存储的翻译对照关系可存储于翻译对照表中,所述翻译 对照表包括第一语言向第二语言的翻译对照表、或第二语言向第一语言的翻译对照表,也 可以同时具有第一语言向第二语言的翻译对照表和第二语言向第一语言的翻译对照表。相 应的,翻译单元6可以仅具有第一语言到第二语言的翻译功能、或第二语言到第一语言的 翻译功能,也可以同时具有第一语言到第二语言的翻译功能和第二语言到第一语言的翻译 功能。这里,所述第一语言可以是中文、英文等等;与之对应,第二语言可以是英文、中文 等等。那么,所述数据库中存储的翻译对照表为中文与外文之间的翻译对照表,用于将中 文翻译成外文;或为外文与中文之间的翻译对照表,用于将外文翻译成中文;或为中文与外文之问互译的翻译对照表,既能将中文翻译成外文,又能将外文翻译成中文。本发明中,数据库6主要存储基于语料的类库,所谓基于语料的类库是指基于设 置一个含有各种句型的原始文本信息和目标文本信息双语对照的语料类库。在翻译时,从 语料类库中抽取与输入原始语音信息中句子相类似的句子,然后模仿例句来实现原始语音 信息到目标语音信息的转换。而且,由于数据库中存储对应的词库,因此,翻译语言的种类 是可以根据不同即时语音用户进行选择的。这里,不同用户可以是不同国家的使用者。如 果原始语音信息采用的是第一语言,则目标语音信息采用第二语言;反之,如果原始语音信 息采用的是第二语言,则目标语音信息采用第一语言。对于即时语音翻译系统中的任意两个用户而言,发送语音信息的可称为发送端即 时语音发送端,接收语音信息的可称为接收端即时语音发送端,发送端即时语音端与接收 端即时语音端通过互联网相连。在本发明的翻译平台中,可以在一个即时语音发送端中集 成翻译功能,也可以在两个即时语音发送端皆集成翻译功能。也就是说,上面所述的发送端 应用单元可以仅设置于发送端即时语音端中、或是仅设置于接收端语音通讯端中,也可以 同时设置于发送端即时语音端和接收端即时语音端中。本发明中翻译平台中,任意一个即时语音发送端应用可以采用图1所示的结构。 具体来说,本发明的发送端应用在实际应用中可采用以下几种基本架构①发送端即时语 音发送端采用图1所示结构,接收端保持不变;②发送端即时语音发送端保持不变,接收端 即时语音发送端采用图1所示结构;③发送端即时语音发送端和接收端即时语音发送端均 采用图1所示的结构,即每个即时语音通讯发送端都能支持第一语言到第二语言的翻译、 以及第二语言到第一语言的翻译。对于每个采用图1结构的即时语音发送端,还可以进一步设置选择发送设置模 块、翻译设置模块等。基于上述多语言翻译平台,本发明所提供的多语言翻译平台方法为先将原始语 音信息翻译为目标语音信息,再发送。具体有两种实现方式一种方式是,发送端即时语音发送端接收用户输入的原始 语音信息,并将原始语音信息翻译为目标语音信息,之后,将目标语音信息通过互联网发送 给接收端即时语音发送端。另一种方式是发送端即时语音发送端接收接收端即时语音发 送端发出的原始语音信息,并将原始语音信息翻译为目标语音信息,之后,将目标语音信息 提供给发送端用户。针对上述多语言即时语音方法的两种实现方式,该方法进一步包括预先设置需 翻译到的目标语言;具体来说,在语音发送前通过语音翻译功能键设置来确定发送端与接收端的语言 类型,这样在发送语音和接收语音信息时语音转化单元可以依据初始设定而自动进行转 换。上述即时语音翻译方法的实现方式中,所述翻译具体为发送端分析处理单元5, 将处理由语音处理单元经中央处理单元传入的文本信息,然后将结果送入词法、语法数据 库单元通过分析后经由合成单元合成目标语言文本信息。合成单元的结果通过中央处理单 元进入语音处理单元最后合成目标语音,最后通过互联网发送给接收端用户。这里,分析处理单元5获取原始语音对应的文本信息,并根据数据库6中存储的原始文本信息与目标文本信息之间的翻译对照关系,将原始文本信息翻译为目标文本信息的 过程,可采用的翻译方式有多种,比如既可以采用归属于传统派的翻译方式,包括直接 翻译法(Direct Translation)、中间语 g法(Intel Lingual Approach)、转换法(Transfer Approach.);又可以采用基于类库、归属于现代派的翻译方式.其中,直接翻译法是指将原始语音对应的文本信息中的单词、固定词组或句子直 接置换成目标文本信息中的对应成分。中间语言法是指先对原始语音对应的文本信息中的单词、固定词组或句子进行 分析,再转换成对所有目标文本信息都适合的一种句法,即语义表示,并根据语义表示生 成任何一种目标文本信息。转换法是指采用两种内部表达并按三个阶段进行翻译,第一个阶段把原始语音 对应的文本信息转换成原始语音对应的文本信息的内部表达,第二阶段把原始语音对应的 文本信息的内部表达转换成目标文本信息的内部表达,第三阶段再根据目标文本信息的内 部表达生成目标文本信息。本发明的即时语音翻译方法中,当存在多种目标语言可供选择时,在进行查询之 前还需先设置要翻译出发语言和的目标语言,之后,分析处理单元根据设置到相应的数据 库中进行查询。比如当前设置有英文数据库、韩文数据库,如果当前设置的目标语言是英 文,则分析处理单元会以原始语音对应的文本信息为索在英文数据库中进行查询,获得目 标文本信息。通常,可以确定一种语言为默认的目标语言,比如英语,如果没有设置目标语 言,则翻译时均翻译为英语。实施例一本实施例中,第一语言为中文,原始语音信息采用中文语音输入;第二语言为英 文,目标语音信息采用英文发音。所述翻译功能在发送语音前由本端即时语音翻译服务器 翻译完成,所述翻译单元及数据库设置于翻译服务器中,翻译的目标语言设置默认为英文, 即将中文翻译为英文。也就是说,本实施例中发送方提供翻译功能,接收方不提供翻译功 能。图2所示为本实施例所采用的即时语音翻译平台,发送语音的发动端采用图1所 示的即时语音翻译结构。那么,发送端即时语音录入的原始语音信息为“早上好”时,本实 施例中语音翻译平台方法的处理流程为步骤1、本地用户通过录入语音信息“早上好”,此时语音信息进入到图2中的语音 处理单元1中转换成对应的文本信息。步骤2、语音处理单元1将转换后的文本信息提交到中央处理单元2。步骤3、中央处理单元2对原始文本进行预处理后发送给分析处理单元3,根据默 认的目标语言将中文翻译到英文。具体为分析单元3以原始文本信息为索引通过词法、 语法算法进行拆分然后进入数据库5的英文库中进行查询,获得目标文本信息为“good morning”,之后将目标文本信息“good morning”发送给总成处理单元6进行合成,并且,将 目标文本信息“goodmorning”发送给中央处理单元2,由中央处理单元按照翻译堆栈序列 表中顺序依次将目标文本发送到语音处理单元1,语音处理单元根据初始语言设置条件将 目标文本转换为对应的目标语音信息,最后通过即时语音通讯端口发送到接收端。此时,接收端在听到语音信息后进行回复,当接收端在回复过程中发送端的语音处理单元以接收端语句中的停顿时间长短为判断依据来标记语句结束同时给接收端用户 一个提示音表示翻译中请等待。按照步骤1、2、3的翻译过程后,接收端的回复就会以本端 的语言形式输出语音。从而完成不同语言用户之间的及时语音沟通。
以上所述,仅为本发明的较佳实施例而巳,并非用于限定本发明的保护范围。 以下是语音转化为文本信息的部分程序代码,程序开发语言为JAVA。 Public class MyRec{ Il创建识别器并对资源进行分配
Recognizer recognizer = Central. createRecognizer (null); recognizer, allocate ();
Il添加引擎监听器-来表示录入语音何时开始,停止等等 recognizer. addEngineListener (engineListener); Il读取语法文件
File gf = new FileReader(grammarFile); RuleGrammar rules = recognizer. IoadJSGF(gf); //添加结果监听器
rules. addResultListener (new VoiceListener ()); Il语音识别器处理变化 recognizer. commitChanges (); recognizer. requestFocus (); Il开始监听 recognizer, resume ();
ι
以下是接受和处理语音为文本的代码片段
public class VoiceListener extends ResultAdaptor{
public void resultAccepted(ResultEvent re){
FinalRuleResult result = (FinalRuleResult) re. getSource()
Il获取一个检查语法标记
String [] tags = result. getTags ();
System, out. println (/r First tag was ” +tags
);
ι
权利要求
一种即时语音翻译技术,其特征在于,包括语音处理单元,用于将输入的语音转换为文本信息,为进入翻译服务单元做信息输入准备;同时将转换后得到的目标文本转换成对应的目标语音;词法、语法数据库单元,用于存储不同语言的词库、短句库、行业库、以及原始文本信息与所翻译的目标文本信息之间的翻译对照关系;翻译服务器单元,利用多语言词法、语法数据库单元将语音转换单元得到的文本信息翻译为目标语言。
2.根据权利要求1所述的一种即时语音翻译系统,其特征在于,所述翻译服务器单元 包括分析模块,和合成模块,发送模块;其中,分析模块获取并分析由语音转换成的文本信息,从词法、语法数据库单元中提 取所需的原始文本信息与所翻译的目标文本信息;其中,合成模块将从词法、语法数据库单元提取的文本信息与翻译的目标文本信息, 依照语法规则和语言习惯,合成目标语言;其中,发送模块用于发送合成的目标语言到语音处理单元。
3.根据权利要求1所述的一种即时语音翻译系统,其特征在于,所述词法、语法数据库 单元包括翻译对照数据库,用于存储输入的语音转换得到的原始文本信息与所翻译的目 标文本信息之间的翻译对照关系;所述翻译对照数据库包括第一语言向第二语言对照数据 库,和第二语言向第一语言对照数据库。
4.根据权利要求1所述的一种即时语音翻译系统,其特征在于,发送语音设置模块,设 置语音的语速快慢和音量大小。
5.一种即时语音翻译方法,其特征在于,包括以下步骤发送端用户设定好目标语言 后,由语音处理单元将发送端用户的语音转换为文本信息,再由翻译服务单元将得到的文 本翻译为目标语言文本,并返回语音处理单元处理为目标语音,语音处理单元将目标语音 结果发送到通信端口最终到接收端;或发送端用户听到接收端语音信息,首先语音处理单 元对接收端语音进行文本转换然后通过翻译服务单元转换为目标文本,最后通过语音处理 单元处理输出到发送端用户听筒。
6.根据权利要求5所述的一种即时语音翻译方法,其特征在于,录入的语音信息的输 入目标语音前,先设置目标语言、转换,再发送。
全文摘要
本发明涉及即时语音翻译技术,它是一种即时语音识别系统和即时翻译的方法,其核心思想是在现有提供即时语音的软件或者硬件上安装具有即时语音翻译功能的软件,由翻译服务单元对通过语音识别系统获取的信息进行翻译并将翻译结果发送给接收端,同时对接收端的语音信息进行同样处理,从而实现对不同语言用户通过即时语音翻译技术进行即时语音沟通。
文档编号G10L15/00GK101957814SQ200910023348
公开日2011年1月26日 申请日期2009年7月16日 优先权日2009年7月16日
发明者刘越, 韩西杰 申请人:刘越;韩西杰
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1