世界通多国翻译系统的制作方法

文档序号:6555922阅读:205来源:国知局
专利名称:世界通多国翻译系统的制作方法
技术领域
目前,即时网页翻译技术主要可分为以下两种实现手段1)在客户端计算机上安装WEB浏览器插件,这种方式实现网页的翻译有以下弊端1.软件的升级更新不便,不能及时通知用户因为安装软件时需要复制大量的语种翻译引擎及语种语料库到客户端计算机,所以软件中的任何一个语种翻译引擎、语种语料库做了调整(哪怕是少量),都会需要制作更新包。在软件的不断升级和完善过程中,这个过程的重复频率越高时,维护成本也会越高。另外,软件升级更新时并不能及时通知用户进行更新。
2.不能全面兼容所有WEB浏览器,开发者不能把工作重点有效的放在翻译技术上随着INTERNET的不断深入我们的生活,相应的WEB浏览器也越来越多,而不同的WEB浏览器中实现插件的方法也不尽相同(甚至有的浏览器不支持插件)。因此,这将导致开发者为了使软件能兼容各种浏览器,而疲于研究各种浏览器的插件开发,不能有效的专注于翻译技术的研究和拓展。
3.不利于知识产权以及核心技术的保护因为大量的语种翻译引擎以及语种语料库被复制到客户端计算机中,这些都是翻译软件的具体实现和基本数据,而语种语料库则更可能是明文的(即没有采取任何加密手段)。这样一来,核心技术和知识产权的危险性将会大大增加。
2)安装WEB浏览器插件,插件采用在线的语种语料库翻译网页内容。
这种方式同样存在第1)种方式中的前两种弊端,但增强了知识产权和核心技术的保护,而这种方式有一个致命的缺陷因为采用了在线语种语料库,所以在翻译过程中,需要不停的向服务器发送请求,此时当用户的网络不稳定或者网络状况不好的时候,翻译速度将不堪忍受,或者干脆不能翻译。
背景技术
在线翻译由三个重要因素来决定她的可行性1.服务器以及相关设施。这是在线翻译的基础、在线翻译的运行平台。在线翻译必须借助服务器以及服务器软件之间的协同合作来完成网页(当然,不仅仅是网页)的翻译。
2.服务器之间如何实现协同合作。目前,国际上已经有相当成熟的方案如远程调用(RPC)、WEBSERVICE、DCOM、CORBA等等。
3.翻译技术。这是最核心的内容,该部分内容除了实现必须的语种翻译功能外,还需要实现分布式校正、录入等功能。

发明内容
1.服务器的架设(硬件的安装与调试)所需的硬件设备企业级专业服务器、千兆交换机、路由器、硬件防火墙以及100-1000M带宽光纤接入。
通过接入光纤经过路由器、硬件防火墙和千兆交换机,最后到WEB服务器,首先将服务器接通,之后在服务器上安装好WINDOWS2000 SERVER操作系统,设置好网络,并安装IIS5.0或者IIS6.0,这样就架设好了WEB服务器。再从千兆交换机中连接上另一台服务器,该服务器安装好操作系统后,配置好网络以及DCOM,作为后台翻译服务器,该服务器上还需要安装SQL SERVER 2000。另外,从交换机中再引出交换机或者工作终端计算机,并安装好操作系统,用做分布式校正和录入。
2.服务器之间的协同合作在翻译服务器上配置好DCOM后,该服务器即可支持远程计算机的分布式计算请求。WEB服务器架设好之后,将网站对外开放之后,客户即可通过我们的网站来享受翻译服务。当客户点击网站的链接之后,我们的WEB服务器即可收到客户的URL请求,服务器接受到URL请求之后,即通过DCOM调用将URL转发给后台翻译服务器,并一直等待后台翻译服务器的回应。翻译服务器发送回翻译结果后,WEB服务器直接将翻译服务器传送过来的内容发送到客户端。至此,服务器之间即完成一次协同合作。
3.网页内容的翻译及分布式校正和录入翻译服务器的工作可以分为以下步骤a.收到WEB服务器转发来的URL请求后,翻译服务器立即通过SQL SERVER2000对已经预存的网页进行查询,如果网页已经预存,则取出翻译后预存的内容直接发送给WEB服务器。
b.SQL SERVER 2000中没有预存URL所指定的网页,翻译服务器则立即向INTERNET请求该URL网页内容,并同时分析URL,加载相应的翻译引擎和语料库。
c.接收到网页内容后,服务器立即把内容传给翻译引擎,并另外开辟一块缓冲区,供翻译引擎存放翻译结果。
d.翻译引擎首先向相应的工作终端发送开始翻译的消息级别的回调消息。之后,根据网页内容开始解析网页结构,修改网页中所有链接,使网页中的每一个链接都变成通过WEB服务器中转的URL地址;并提取网页中的文本,根据语料库中的资料配合一定的匹配算法对文本进行翻译。当遇到不可识别的文本时,立即记录该文本,同时向相应的工作终端计算机发送一个警告级别的回调消息,通知工作终端更新语料库,翻译引擎一直等待工作终端作出更新回应(考虑到效率,也可以不等待)。
e.翻译引擎处理完所有链接并将文本全部翻译完毕之后,将翻译结果存入服务器指定的缓冲区,并通知服务器翻译任务结束。另外,同样需要给工作终端发送翻译结束的消息级别的回调消息。
f.服务器接到翻译引擎的翻译结束通知后,将缓冲区的内容提交给SQLSERVER 2000进行预存,并将内容立即转发给WEB服务器。至此,翻译服务器完成一个翻译任务。
另工作终端计算机在每次启动操作系统之后,必须通过DCOM向翻译服务器注册一个相应的语种回调服务。这样,翻译服务器每受理一次翻译任务,即会向注册过相应语种回调的工作终端计算机发送一次回调消息。工作终端可以不理会消息级别的回调消息,但遇到警告级别的回调消息时,工作终端必须立即作出响应,并同时更新语料库。(图1)


a.收到WEB服务器转发来的URL请求后,翻译服务器立即通过SQL SERVER2000对已经预存的网页进行查询,如果网页已经预存,则取出翻译后预存的内容直接发送给WEB服务器。
b.SQL SERVER 2000中没有预存URL所指定的网页,翻译服务器则立即向INTERNET请求该URL网页内容,并同时分析URL,加载相应的翻译引擎和语料库。
c.接收到网页内容后,服务器立即把内容传给翻译引擎,并另外开辟一块缓冲区,供翻译引擎存放翻译结果。
d.翻译引擎首先向相应的工作终端发送开始翻译的消息级别的回调消息。之后,根据网页内容开始解析网页结构,修改网页中所有链接,使网页中的每一个链接都变成通过WEB服务器中转的URL地址;并提取网页中的文本,根据语料库中的资料配合一定的匹配算法对文本进行翻译。当遇到不可识别的文本时,立即记录该文本,同时向相应的工作终端计算机发送一个警告级别的回调消息,通知工作终端更新语料库,翻译引擎一直等待工作终端作出更新回应(考虑到效率,也可以不等待)。
e.翻译引擎处理完所有链接并将文本全部翻译完毕之后,将翻译结果存入服务器指定的缓冲区,并通知服务器翻译任务结束。另外,同样需要给工作终端发送翻译结束的消息级别的回调消息。
f.服务器接到翻译引擎的翻译结束通知后,将缓冲区的内容提交给SQLSERVER 2000进行预存,并将内容立即转发给WEB服务器。至此,翻译服务器完成一个翻译任务。
具体实施例方式
首先,通过接入光纤经过路由器、硬件防火墙和千兆交换机,最后到WEB服务器,首先将服务器接通,之后在服务器上安装好WINDOWS2000 SERVER操作系统,设置好网络,并安装IIS5.0或者IIS6.0,这样就架设好了WEB服务器。再从千兆交换机中连接上另一台服务器,该服务器安装好操作系统后,配置好网络以及DCOM,作为后台翻译服务器,该服务器上还需要安装SQL SERVER 2000。另外,从交换机中再引出交换机或者工作终端计算机,并安装好操作系统,用做分布式校正和录入。
接着,在翻译服务器上配置好DCOM后,该服务器即可支持远程计算机的分布式计算请求。WEB服务器架设好之后,将网站对外开放,客户即可通过我们的网站来享受翻译服务。
当客户点击网站的链接之后,我们的WEB服务器即可收到客户的URL请求,服务器接受到URL请求之后,即通过DCOM调用将URL转发给后台翻译服务器,并一直等待后台翻译服务器的回应。翻译服务器发送回翻译结果后,WEB服务器直接将翻译服务器传送过来的内容发送到客户端。
收到WEB服务器转发来的URL请求后,翻译服务器立即通过SQL SERVER 2000对已经预存的网页进行查询,如果网页已经预存,则取出翻译后预存的内容直接发送给WEB服务器。
SQL SERVER 2000中没有预存URL所指定的网页,翻译服务器则立即向INTERNET请求该URL网页内容,并同时分析URL,加载相应的翻译引擎和语料库。
接收到网页内容后,服务器立即把内容传给翻译引擎,并另外开辟一块缓冲区,供翻译引擎存放翻译结果。
翻译引擎首先向相应的工作终端发送开始翻译的消息级别的回调消息。之后,根据网页内容开始解析网页结构,修改网页中所有链接,使网页中的每一个链接都变成通过WEB服务器中转的URL地址;并提取网页中的文本,根据语料库中的资料配合一定的匹配算法对文本进行翻译。当遇到不可识别的文本时,立即记录该文本,同时向相应的工作终端计算机发送一个警告级别的回调消息,通知工作终端更新语料库,翻译引擎一直等待工作终端作出更新回应(考虑到效率,也可以不等待)。
翻译引擎处理完所有链接并将文本全部翻译完毕之后,将翻译结果存入服务器指定的缓冲区,并通知服务器翻译任务结束。另外,同样需要给工作终端发送翻译结束的消息级别的回调消息。
服务器接到翻译引擎的翻译结束通知后,将缓冲区的内容提交给SQL SERVER2000进行预存,并将内容立即转发给WEB服务器。至此,翻译服务器完成一个翻译任务。
权利要求
一、一种新型的即时在线网页翻译技术,其特征是利用服务器(或服务器集群)架设大型的服务型网站,利用WEB服务器截获用户的URL请求,WEB服务器再将URL转发给后台翻译服务器,翻译服务器采用网页预存、翻译引擎、预料库、工作终端计算机的语种回调、分布式校正和录入等技术将翻译后的网页转发给WEB服务器,再由WEB服务器发送给用户。其技术实现过程如下按特定的算法根据URL计算得出关键字,并根据关键字查询服务器中是否有该网页的预存内容。若有,则翻译任务结束。否则,继续下面的步骤。从INTERNET获取原始的网页内容,并提交给翻译引擎,翻译引擎根据预料库中的资料对网页内容进行翻译。在翻译过程中,翻译引擎会根据翻译的语种以及翻译时遇到的意外情况给相应的工作终端发送回调消息。一直循环该过程直到翻译结束。工作终端收到回调消息后,根据消息类别来作出响应。如果是警告级别的消息,工作终端必须检查翻译内容并进行确认,或修改翻译内容,或向语料库中增加新语料资料。翻译引擎翻译结束后,立即将翻译结果发送给服务器,服务器再转发给WEB服务器。
全文摘要
本发明是一种多国即时在线翻译系统,即时在线网页翻译技术(以下简称在线翻译)是一种新型的基于服务器的即时网页翻译技术,该技术利用WEB服务器截获客户提交的URL请求,并将URL转交给后台翻译服务器,翻译服务器首先获取URL内容,并将其进行翻译处理,之后再将翻译结果通过WEB服务器转发给客户。
文档编号G06F17/28GK101055573SQ20061003488
公开日2007年10月17日 申请日期2006年4月10日 优先权日2006年4月10日
发明者李钢, 刘智美 申请人:李钢, 刘智美
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1