一种网络电话语音翻译系统和翻译方法

文档序号:7945696阅读:123来源:国知局
专利名称:一种网络电话语音翻译系统和翻译方法
技术领域
本发明涉及语音智能翻译技术,特别涉及一种网络电话语音翻译系统和翻译方 法。
背景技术
由于网络的普及现在越来越多的人习惯通过网络电话的方式互相沟通,但随着国 家同国家的贸易、交流的不断发展和进步,用户国际化的趋势必然导致不同国家人们在使 用网络电话进行沟通时存在语言障碍的问题。以中、英文母语用户为例,在中国的用户很少 有人能熟练使用英语和美国人交流,美国人也很少有人懂汉语,于是语言成为国际化交流 的最大障碍。现有的网络电话中还没有将语音进行即时翻译的技术出现,而且网络电话语音即 时翻译都将会帮助人们进行更方便、更广泛的无障碍交流。

发明内容
本发明的目的在于提供一种网络电话语音翻译系统,能将即时翻译技术集成到各 种网络电话上,从而支持不同语种的网络电话用户之间的沟通。本发明的另一个目的在于提供一种将多语言即时翻译集成到网络电话上的方法, 能实现多种语言之间的翻译转换,从而支持不同语种的网络电话用户之间的沟通。为了达到以上目的本发明的技术方案是这样实现的(1) 一种网络电话语音即时翻译系统,其特征在于,包括多语言翻译数据库单元,用于存储不同语言的词库、短句库、行业库、以及原始文 本信息与所翻译的目标文本信息之间的翻译对照关系;翻译服务器单元,利用多语言翻译数据库单元将语音转换后的文本翻译为目标语 言文本;终端应用单元,通过语音转换单元将输入或接听的语音转化为文本信息,经翻译 服务器单元翻译为目标语言文本,后回传至语音转换单元转换为目标语音经由网络电话信 号发送端发送出去。上述技术方案的特点在于(a)所述翻译服务器单元包括分析模块,和合成模块,发送模块;其中,分析模块获取并分析由语音转换成的文本信息,从词法、语法数据库单元 中提取所需的原始文本信息与所翻译的目标文本信息;其中,合成模块将从词法、语法数据库单元提取的文本信息与翻译的目标文本信 息,依照语法规则和语言习惯,合成目标语言;其中,发送模块用于发送合成的目标语言到语音处理单元。(b)所述词法、语法数据库单元包括翻译对照数据库,用于存储输入的语音转换 得到的原始文本信息与所翻译的目标文本信息之间的翻译对照关系;所述翻译对照数据库包括第一语言向第二语言对照数据库,和第二语言向第一语言对照数据库。(c)所述终端应用单元还可以选择性包括输入语音的目标翻译语言设置及语音段落的开始和结束标记。录入或接听语音的设置模块,可以设置语音的语速快慢和音量大小。(2) 一种网络电话语音即时翻译方法,其特征在于,包括以下步骤终端用户设定 好目标语言后,由语音处理单元将终端用户的语音转换为文本信息,再由翻译服务单元将 得到的文本翻译为目标语言文本,并返回语音处理单元处理为目标语音,语音处理单元将 目标语音结果发送到网络电话信号发送端口最终到对端网络电话听筒;或终端用户听到对 端语音信息,首先语音处理单元对对端语音进行文本转换然后通过翻译服务单元转换为目 标文本,最后通过语音处理单元处理输出到终端用户听筒。


图1为一种网络电话语音即时翻译系统2为网络电话语音即时翻译数据流图
具体实施例方式本发明的核心思想是在现有网络电话中集成不同语言间的语音翻译功能,由翻 译服务器单元对输入用户录入的语音信息进行翻译,或对对端用户发来的语音信息进行翻 译,从而实现对不同语言的网络电话用户进行通话的支持。参照图1,本发明的网络电话语音翻译系统包括翻译服务器单元,终端应用单 元。翻译服务器单元进一步包括中央处理单元4、分析处理单元5、合成单元7,词法、语法 数据库单元6。其中,单元4用于处理来自终端的翻译请求,并在翻译完成后返回翻译结果。 单元5获取并分析语音转换原始文本,按照分析结果,依据处理规则,从词法、语法数据库 提取所需的文本信息。单元7将从数据库提取的文本信息,依照语法规则,和语言习惯,合 成目标文本。单元6,词法、语法数据库包括,翻译对照数据库包括第一语言向第二语言对照 数据库和,第二语言向第一语言对照库。终端应用单元进一步包括目标语言选择单元1, 语音输入单元2,语音处理单元3。其中,单元1用于设置目标翻译语言;单元2用于判断语 音输入段落的开始与结束;单元3用于将输入端的语音转化成为文本信息,同时将翻译的 目标语言文本转化成为语音发送给网络电话信号发送端。本发明中,所述数据库6存储的翻译对照关系可存储于翻译对照表中,所述翻译 对照表包括第一语言向第二语言的翻译对照表、或第二语言向第一语言的翻译对照表,也 可以同时具有第一语言向第二语言的翻译对照表和第二语言向第一语言的翻译对照表。相 应的,网络电话的翻译单元6可以仅具有第一语言到第二语言的翻译功能、或第二语言到 第一语言的翻译功能,也可以同时具有第一语言到第二语言的翻译功能和第二语言到第一 语言的翻译功能。这里,所述第一语言可以是中文、英文等等;与之对应,第二语言可以是英文、中文 等等。那么,所述数据库中存储的翻译对照表为中文与外文之间的翻译对照表,用于将中 文翻译成外文;或为外文与中文之间的翻译对照表,用于将外文翻译成中文;或为中文与 外文之问互译的翻译对照表,既能将中文翻译成外文,又能将外文翻译成中文。
本发明中,数据库6主要存储基于语料的类库,所谓基于语料的类库是指基于设 置一个含有各种句型的原始文本信息和目标文本信息双语对照的语料类库。在翻译时,从 语料类库中抽取与输入原始语音信息中句子相类似的句子,然后模仿例句来实现原始语音 信息到目标语音信息的转换。而且,由于数据库中存储对应的词库,因此,翻译语言的种类 是可以根据不同网络电话用户进行选择的。这里,不同网络电话用户可以是不同国家的使 用者。如果原始语音信息采用的是第一语言,则目标语音信息采用第二语言;反之,如果原 始语音信息采用的是第二语言,则目标语音信息采用第一语言。对于网络电话即时语音翻译系统中的任意两个网络电话用户而言,发送语音信息 的可称为本端即时语音终端,接收语音信息的可称为对端即时语音终端,本端即时语音终 端与对端即时语音终端通过Internet相连。在本发明的翻译平台中中,可以在一个网络电 话中集成翻译功能,也可以在两个网络电话皆集成翻译功能。也就是说,上面所述的终端应 用单元可以仅设置于本端即时语音终端中、或是仅设置于对端语音通讯终端中,也可以同 时设置于本端即时语音终端和对端即时语音终端中。本发明中翻译平台中,任意一个即时语音终端应用可以采用图1所示的结构。具 体来说,本发明的终端应用在实际应用中可采用以下几种基本架构①本端即时语音终端 采用图1所示结构,对端网络电话保持不变;②本端即时语音终端保持不变,对端即时语音 终端采用图1所示结构;③本端即时语音终端和对端即时语音终端均采用图1所示的结构, 即每个即时通讯终端都能支持第一语言到第二语言的翻译、以及第二语言到第一语言的 翻译。对于每个采用图1结构的即时语音终端,还可以进一步设置选择发送设置模块、 翻译设置模块等。基于上述多语言翻译平台,本发明所提供的多语言翻译平台方法为先将原始语 音信息翻译为目标语音信息,再发送。具体有两种实现方式一种方式是,本端即时语音终端接收用户输入的原始语音 信息,并将原始语音信息翻译为目标语音信息,之后,将目标语音信息通过网络电话发送给 对端即时语音终端。另一种方式是本端即时语音终端接收对端即时语音终端发出的原 始语音信息,并将原始语音信息翻译为目标语音信息,之后,将目标语音信息提供给本端用 户。针对上述多语言即时语音方法的两种实现方式,该方法进一步包括预先设置需 翻译到的目标语言;具体来说,在语音发送前通过网络电话功能键设置来确定发送端与对端的语言类 型,这样在发送语音和接收语音信息时语音转化单元可以依据初始设定而自动进行转换。上述网络电话即时语音翻译方法的实现方式中,所述翻译具体为本端分析处理 单元5,将处理由语音处理单元经中央处理单元传入的文本信息,然后将结果送入词法、语 法数据库单元通过分析后经由合成单元合成目标语言文本信息。合成单元的结果通过中央 处理单元进入语音处理单元最后合成目标语音,最后通过网络电话发送给对端用户。这里,分析处理单元5获取原始语音对应的文本信息,并根据数据库6中存储的原 始文本信息与目标文本信息之间的翻译对照关系,将原始文本信息翻译为目标文本信息的 过程,可采用的翻译方式有多种,比如既可以采用归属于传统派的翻译方式,包括直接翻译法(Direct Translation)、中间语 g法(Intel Lingual Approach)、转换法(Transfer Approach.);又可以采用基于类库、归属于现代派的翻译方式其中,直接翻译法是指将原始语音对应的文本信息中的单词、固定词组或句子直 接置换成目标文本信息中的对应成分。中间语言法是指先对原始语音对应的文本信息中的单词、固定词组或句子进行 分析,再转换成对所有目标文本信息都适合的一种句法,即语义表示,并根据语义表示生 成任何一种目标文本信息。转换法是指采用两种内部表达并按三个阶段进行翻译,第一个阶段把原始语音 对应的文本信息转换成原始语音对应的文本信息的内部表达,第二阶段把原始语音对应的 文本信息的内部表达转换成目标文本信息的内部表达,第三阶段再根据目标文本信息的内 部表达生成目标文本信息。本发明的网络电话语音翻译方法中,当存在多种目标语言可供选择时,在进行查 询之前还需先设置要翻译出发语言和的目标语言,之后,分析处理单元根据设置到相应的 数据库中进行查询。比如当前设置有英文数据库、韩文数据库,如果当前设置的目标语言 是英文,则分析处理单元会以原始语音对应的文本信息为索在英文数据库中进行查询,获 得目标文本信息。通常,可以确定一种语言为默认的目标语言,比如英语,如果没有设置目 标语言,则翻译时均翻译为英语。实施例一本实施例中,第一语言为中文,原始语音信息采用中文语音输入;第二语言为英 文,目标语音信息采用英文发音。所述翻译功能在发送语音前由本端即时语音翻译服务器 翻译完成,所述翻译单元及数据库设置于翻译服务器中,翻译的目标语言设置默认为英文, 即将中文翻译为英文。也就是说,本实施例中发送方提供翻译功能,接收方不提供翻译功 能。图2所示为本实施例所采用的网络电话语音翻译平台,发送语音的本端采用图1 所示的即时语音翻译结构。那么,本端即时语音录入的原始语音信息为“早上好”时,本实 施例中语音翻译平台方法的处理流程为步骤1、本地用户通过网络电话录入语音信息“早上好”,此时语音信息进入到图2 中的语音处理单元1中转换成对应的文本信息。步骤2、语音处理单元1将转换后的文本信息提交到中央处理单元2。步骤3、中央处理单元2对原始文本进行预处理后发送给分析处理单元3,根据默 认的目标语言将中文翻译到英文。具体为分析单元3以原始文本信息为索引通过词法、 语法算法进行拆分然后进入数据库5的英文库中进行查询,获得目标文本信息为“good morning”,之后将目标文本信息“good morning”发送给总成处理单元6进行合成,并且,将 目标文本信息“goodmorning”发送给中央处理单元2,由中央处理单元按照翻译堆栈序列 表中顺序依次将目标文本发送到语音处理单元1,语音处理单元根据初始语言设置条件将 目标文本转换为对应的目标语音信息,最后通过网络电话发送到对端网络电话。此时,对端在听到语音信息后进行回复,当对端在回复过程中本端的语音处理单 元以对端语句中的停顿时间长短为判断依据来标记语句结束同时给对端用户一个提示音 表示翻译中请等待。按照步骤1、2、3的翻译过程后,对端的回复就会以本端的语言形式输
6出语音。从而完成不同语言用户之间的及时语音沟通。以上所述,仅为本发明的较佳实施例而巳,并非用于限定本发明的保护范围。以下是语音转化为文本信息的部分程序代码,程序开发语言为JAVA。Public class MyRec{H创建识别器并对资源进行分配Recognizer recognizer = Central. createRecognizer(null) ;recognizer, allocate ();H添加引擎监听器_来表示录入语音何时开始,停止等等recognizer. addEngineListene r (engineListener);//读取语法文件File gf = new FileReader(grammarFile);RuleGrammar rules = recognizer. IoadJSGF(gf);//添加结果监听器rules. addResultListener (new VoiceListener ());Il语音识别器处理变化recognizer. commitChanges ();recognizer. requestFocus ();//开始监听recognizer, resume ();......}以下是接受和处理语音为文本的代码片段public class VoiceListener extends ResultAdaptor{public void resultAccepted(ResultEvent re){FinalRuleResult result = (FinalRuleResult) re. getSource();//获取一个检查语法标记String [] tags = result. getTags ();System, out. println (/r First tag was “ +tags
);}......}
权利要求
一种网络电话语音翻译技术,其特征在于,包括语音处理单元,用于将输入的语音转换为文本信息,为进入翻译服务单元做信息输入准备;同时将转换后得到的目标文本转换成对应的目标语音;词法、语法数据库单元,用于存储不同语言的词库、短句库、行业库、以及原始文本信息与所翻译的目标文本信息之间的翻译对照关系;翻译服务器单元,利用多语言词法、语法数据库单元将语音转换单元得到的文本信息翻译为目标语言。
2.根据权利要求1所述的一种网络电话语音翻译系统,其特征在于,所述翻译服务器 单元包括分析模块,和合成模块,发送模块;其中,分析模块获取并分析由语音转换成的文本信息,从词法、语法数据库单元中提 取所需的原始文本信息与所翻译的目标文本信息;其中,合成模块将从词法、语法数据库单元提取的文本信息与翻译的目标文本信息, 依照语法规则和语言习惯,合成目标语言;其中,发送模块用于发送合成的目标语言到语音处理单元。
3.根据权利要求1所述的一种网络电话语音翻译系统,其特征在于,所述词法、语法数 据库单元包括翻译对照数据库,用于存储输入的语音转换得到的原始文本信息与所翻译 的目标文本信息之间的翻译对照关系;所述翻译对照数据库包括第一语言向第二语言对照 数据库,和第二语言向第一语言对照数据库。
4.根据权利要求1所述的一种网络电话语音翻译系统,其特征在于,发送语音设置模 块,设置语音的语速快慢和音量大小。
5.一种网络电话语音翻译方法,其特征在于,包括以下步骤终端用户设定好目标语 言后,由语音处理单元将终端用户的语音转换为文本信息,再由翻译服务单元将得到的文 本翻译为目标语言文本,并返回语音处理单元处理为目标语音,语音处理单元将目标语音 结果发送到发送端口最终到对端;或终端用户听到对端语音信息,首先语音处理单元对对 端语音进行文本转换然后通过翻译服务单元转换为目标文本,最后通过语音处理单元处理 输出到终端用户。
6.根据权利要求5所述的一种网络电话语音翻译方法,其特征在于,录入的语音信息 的输入目标语音前,先设置目标语言、转换,再发送。
全文摘要
本发明涉及网络电话语音翻译技术,它是一种语音识别系统和语音翻译的方法,其核心思想是在现有的网络电话安装具有语音翻译功能的软件,由翻译服务单元对通过语音识别系统获取的信息进行翻译并将翻译结果发送给对端,同时对对端的语音信息进行同样处理,从而实现对不同语言用户通过语音翻译技术进行网络电话语音交流。
文档编号H04M3/42GK101957813SQ20091002334
公开日2011年1月26日 申请日期2009年7月16日 优先权日2009年7月16日
发明者刘越, 韩西杰 申请人:刘越;韩西杰
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1