动态网页翻译系统及方法

文档序号:6615547阅读:169来源:国知局
专利名称:动态网页翻译系统及方法
技术领域
本发明涉及一种网页翻译技术,特别涉及一种动态网页翻译系统及方法。
背景技术
网页翻译功能是指在不改变网页格式的前提下,将浏览器(browser) 显示的网页上的语言文字翻译成使用者所需要的语言文字。目前常见的网页 翻译技术多是针对以超文字标记语言(Hyper Text Markup Language, HTML) 所写成的网页进行翻译,其原理系先取得网页之源文件(也就是HTML档) 的内容,之后寻找网页中需要翻译的文字(即HTML巻标之间的文字)进 行翻译,然后将翻译的结果替代原文,并生成新的网页,再指示浏览器显示 新生成的网页。
这种单纯以HTML写成的网页一般称之为静态网页,在客户端(client) 仅能阅读网页上的信息,而无法透过网络对网页执行任何修改动作。相对于 静态网页,另一种为动态网页,其能够将网页与网站服务器上的数据库建立 连结,并且可以动态更新网页上的内容,让客户端与网站服务器端(server) 具有实时互动的效果,如在线购物、讨论区及网络拍卖等网页,均需由动态 网页来达成。
然而,动态网页的源文件都是由指令码(script)语句组成,且动态网 页中的元素(如显示在网页上的文字)不是记录在网页的源文件文件中,而 是透过程序并根据一定的逻辑关系从数据库中获得的。也就是说,动态网页 的源文件内容和显示于浏览器中的完全不同,因而无法从网页的源文件中获 得需要翻译的文字。
由此可知,已知的网页翻译技术无法对动态网页进行翻译,因此如何翻 译动态网页,是目前亟欲解决的问题。

发明内容
有鉴于现有技术无法针对动态网页进行翻译,本发明公开一种翻译动态
网页的系统及方法,其通过文件对象模型(Document Object Model, DOM) 取得动态网页中欲翻译的文字,并在进行翻译后将译文置回文件对象模型取 代原文,以生成以i奪文显示的动态网页。
本发明提供一种动态网页翻译系统,其包括接收模块、解析器(parser)、 读取模块以及翻译模块。其中,接收模块用以接收动态网页;解析器系用以 解析此动态网页,取得其文件对象模型,此文件对象模型具有多个节点,而 每个节点至少包括一文字节点;读取模块系用以读取并输出这些文字节点中 的第一语言文字;翻译模块则是用以接收读取模块所输出的第一语言文字, 并将其翻译为第二语言文字。
本发明提供另 一种动态网页翻译系统,适于对已被浏览器解析过的动态 网页进行翻译,其中已解析的动态网页于浏览器中储存有 一文件对象模型, 此文件对象模型具有多个节点,且这些节点至少包括一文字节点。此动态网 页翻译系统包括接收模块、解析器(parser)、读取模块以及翻译模块。其 中,读取模块用以从浏览器中读取动态网页的文件对象模型,并输出这些文 字节点中的第一文字;翻译模块用以接收读取模块所输出的第 一语言文字, 并将其翻译为第二语言文字;置回模块则是用以接收第二语言文字,并将其 置回文件对象^t型的文字节点中而取代对应的第一语言文字。其中,浏览器 依据具有第二语言文字的文件对象模型重构动态网页,并显示重构后的动态 网页。
本发明提供一种动态网页翻译方法,先接收一动态网页,接着对此动态 网页进行解析,以取得此动态网页的文件对象模型;其中,此文件对象模型 具有多个节点,且这些节点至少包括一文字节点。读取这些文字节点中的第 一语言文字,然后再将第一语言文字翻译为第二语言文字。
本发明所公开的系统与方法如上,与现有技术之间的差异在于本发明系 通过动态网页的文件对象模型取得欲翻译之文字,而非单纯从网页的HTML 内容中撷取欲翻译的文字。因此,本发明可有效地翻译动态网页。


图1为本发明的第一实施例中动态网页翻译方法的步骤流程图; 图2为本发明的第二实施例中动态网页翻译方法的步骤流程图; 图3为本发明的第一实施例中动态网页翻译系统的结构示意图; 图4为本发明的第二实施例中动态网页翻译系统的结构示意图; 图5为本发明的第三实施例中动态网页翻译系统的结构示意图。主要组件符号说明
300动态网页翻-泽系统
302输入界面
304传送模块
310接收模块
312解析器
330读取模块
340翻译模块
350置回模块
360重构模块
370节点选取模块
400动态网页翻译系统
500动态网页翻i奪系统
510读取模块
512选耳又单元
520翻译模块
530置回模块
600浏览器步骤110接收动态网页;
步骤120对动态网页进行解析,以取得动态网页的文件对象模型;
步骤125选取特定的文字节点;
步骤130读取文字节点中的第一语言文字;
步骤140将第一语言文字翻译为第二语言文字;
步骤150将第二语言文字置回文件对象模型之文字节点中,以取代第 一语言文字;
步骤160依据具有第二语言文字之文件对象模型,产生并显示一已重 构之动态网页。
具体实施例方式
下面将配合附图及实施例来详细说明本发明的实施方式,藉此对本发明 如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解 并据以实施。
如图1所示,为本发明的第一实施例中动态网页翻译方法的步骤流程 图。参照图1所示,本实施例的翻译动态网页的步骤系先接收一动态网页(步 骤110)。此动态网页可以是ASP (Active Server Pages ) 、 JSP (Java Server Pages)或超文字处理器(HypertextPreprocess, PHP)等程序语言所写成的 网页,本实施例是以可延展标记语言(Extensible Markup Language, XML) 的文档格式呈现。
然后,对此动态网页进行解析,以取得此动态网页的文件对象模型 (Document Object Model, DOM)(步骤120)。其中,文件对象模型系将 动态网页中的信息以树状结构表述(representation)。此树状结构具有多个 节点,而这些节点分别用以代表网页中的各元素(element),元素节点则包 含代表此元素的属性(property)的属性节点,或是存有此元素之文字(text) 的文字节点。
承上述,取得文件对象模型后,接着读取文字节点中的第一语言文字(步 骤130)。其中,读取第一语言文字的步骤例如是透过指令码(script)或程
8序来执行,如Javascript、 VB script或是PHP等程序语言。本实施例中,采 用的是于步骤130中读取文件对象模型中所有文字节点的第一语言文字,但 其并非作为本发明之限制。如图2所示,为本发明之第二实施例中动态网页 翻译方法的步骤流程图。在图2中,在执行步骤130之前,依照实际所需而 选取特定的文字节点(步骤125 ),之后再于步骤130中读取选定之文字节 点中的第一语言文字。
再次参照如图1,在读取到第一语言文字后,将第一语言文字翻译为第 二语言文字(步骤140),之后则可依据实际所需来执行后续的程序。举例 来说,如欲得到原文与译文的对照表,则完成步骤140后可同时输出相对应 之第一语言文字与第二语言文字。然而,此作法并非用以限制本发明。在其 它实施例中,完成步骤140后尚可执行多种不同的程序。
特别的是,本实施例在完成步骤140之后,更可以将第二语言文字置回 文件对象模型的文字节点中,以取代第一语言文字(步骤150),而置回第 二语言文字的步骤同样可以透过指令码或一程序执行,如Java script、 VB script或是PHP等程序语言。然后,依据具有第二语言文字的文件对象模型, 产生并显示一已重构的动态网页(步骤160)。也就是说,本实施例可在不 改动动态网页的格式的前提下,重新生成并显示以第二语言文字呈现的动态 网页。
为使熟习此项技艺者更加清楚了解上述步骤的实行过程,下文将举实施 例说明可用来执行上述步骤的翻译动态网页的系统。
如3所示,为本发明之第 一 实施例中动态网页翻译系统的方块示意图。 请参照3图所示,动态网页翻译系统300包括接收模块310、读取模块330 以及翻译模块340。其中,接收模块310系用以接收一动态网页。如前文所 述,此动态网页同样可以由ASP、 JSP或PHP等程序语言所写成,且其也可 以是以可延展标记语言的文档格式呈现。
另夕卜,本实施例的动态网页翻译系统300还可以包括输入界面302与传
传送模块304会透过因特网送出请求(request)讯号至储存有此动态网页的 远程服务器(图3中未标出),而远程服务器会依据此请求信号而将此动态网页传至动态网页翻译系统300,并由接收模块310接收。
接收模块310包括一解析器(parser) 312,在接收到动态网页后,会藉 由解析器312对此动态网页进行解析而取得动态网页的文件对象模型,此文 件对象模型即储存在接收模块310中。在本实施例中,解析器312是与一般 浏览器内建的解析器(如微软的MSXML)相似。读取模块330是用以读取 文件对象模型的文字节点中的第一语言文字,并将其输出至翻译模块340。 其中,读取模块330是以指令码(script)或程序来读取文件对象模型中的 信息,如Javascript, VB script或是PHP等程序语言。
翻译模块340是用以接收读取模块330所输出的第一语言文字,并将第 一语言文字翻译为第二语言文字。熟习此技艺者应该知道,翻译模块340中 储存有至少一个翻译词库,用以作为翻"^的依据。
此外,为了将动态网页上的第一语言文字以对应的第二语言文字取代, 动态网页翻译系统300还可以包括有置回模块350与重构模块360。其中, 置回模块350系用以接收翻译模块340所输出的第二语言文字,之后再将第 二语言文字输出至接收模块310,并置回至文件对象模型的文件节点中,以 取代对应的第一语言文字。如同上述,置回4莫块350也可以利用指令码 (script)或程序来将文件对象模型中的第一语言文字修改为第二语言文字。 在本实施例中,置回模块350是使用Java script、 VB script或PHP等程序语 言来修改文件对象模型。
重构模块360则是用以接收由解析器312输出的具有第二语言文字的文 件对象模型,并依据此文件对象模型重构动态网页,以产生重构后的动态网 页,而后将其显示于使用者的终端机画面上。在本实施例中,重构模块360 可以是一般人所熟知的各种网页浏览器。也就是说,翻译模块340会将第二 语言文字输出至浏览器中,以藉由浏览器来显示以第二语言文字呈现的动态 网页。
如图4所示,为本发明的第二实施例中动态网页翻译系统的结构示意 图。值得一提的是,动态网页翻译系统400与图3中的动态网页翻译系统 300相似,且两图式中相同的组件均以相同的标号来表示,以下将不再赘述 这些组件的配置、功能等细节。参照图4所示,本实施例的动态网页翻译系统400还包括有节点选取模 块370,用以选取特定之文字节点,而读取模块330系在节点选取模块370 所选定的文字节点中读取第一语言文字。也就是说,若仅欲针对动态网页上 的一部分的第一语言文字做翻译时,动态网页翻译系统400可以透过节点选 取模块370来选取储存有欲进行翻译的第一语言文字的文字节点,并于后续 藉由翻译模块340进行翻译。由此可知,在利用动态网页翻译系统400进行 动态网页的翻译时,可针对欲翻译的部分第一语言文字进行翻译,而无须对 动态网页上的所有第一语言文字进行翻译,因此能够缩短翻译所需时间。
在前述实施例中,翻译动态网页的系统系提供输入界面302来供使用者 输入动态网页的网址,并根据使用者所输入的网址取得动态网页,再对此动 态网页进行分析而得其文件对象模型。然而,在其它实施例中,本发明的翻 译动态网页的系统还可以直接从一般大众所熟知的网页浏览器中取得动态 网页的文件对象模型,以下将举实施例并配合图式说明之。
如图5所示,为本发明的第三实施例中动态网页翻译系统的结构示意 图。参照图5所示,动态网页翻译系统500系用以对已被浏览器600解析过 的动态网页进行翻译。熟知此技艺者可以知道,动态网页经由浏览器600解 析之后,浏览器600中会储存有此动态网页的文件对象模型。同样的,此文 件对象^t型系以树状结构呈现,并具有至少 一个文字节点。
请继续参照图5所示,动态网页翻译系统500包括读取模块510、翻译 模块520以及置回模块530。其中,读取模块510系用以从浏览器600中读 出并储存此动态网页的文件对象模型,以及输出文字节点内的第 一语言文 字。本实施例的读取模块510读取文件对象模型的方式与前述实施例相似, 此处不再赘述。
而且,本实施例的读取4莫块510可以包括一节点选取单元512,用以选 取部分的文字节点,而读取^莫块510即是依据节点选取单元512所选定的文 字节点,输出其中的第一语言文字。
翻译模块520系用以接收读取模块510所输出的第一语言文字,并将其 翻译为第二语言文字。当然,翻译模块520也可以具有至少一个翻译词库。 置回模块530则系用以接收第二语言文字,并将其输出至读取模块510,以置回至文件对象模型的文字节点中,以取代对应的第一语言文字。此处置回
模块530藉以将文件对象模型中的第一语言文字修改为第二语言文字的方 式与前述实施例相似。
特别的是,读取模块510会将具有第二语言文字的文件对象模型回传给 浏览器600,以使浏览器600可依据此文件对象模型重构一个动态网页,并 将其显示出来。由此可知,使用者在以浏览器取得动态网页后,即可利用翻 译动态网页系统500对此动态网页进行翻译,以解决因语言不通而无法获知 此动态网页上的信息的问题。
综上所述,可知本发明与先前技术之间的差异在于本发明系从动态网页 的文件对象模型取得欲进行翻译的文字,再将翻译后的文字置回文件对象模 型,并重构以译文呈现的动态网页。藉此,可解决先前技术仅能针对HTML 内之巻标中的文字进行翻译,因而无法翻译动态网页的问题,进而在不更动 网页原有格式的情况下,达成翻译动态网页的功效。
虽然本发明所公开实施方式如上,以上内容并非用以直接限定本发明的 专利保护范围。任何本发明所属技术领域中具有通常知识者,在不脱离本发 明所公开精神和范围的前提下,可以在实施的形式上及细节上作些许之更 动。本发明之专利保护范围,仍须以权利要求书所界定的范围为准。
权利要求
1、一种动态网页翻译系统,其特征在于,包括一接收模块,用以接收一动态网页,且该接收模块包括一解析器,用以解析该动态网页,取得该动态网页的一文件对象模型,其中该文件对象模型具有多个节点,且该些节点至少包括一文字节点;一读取模块,用以读取并输出该些文字节点中的一第一语言文字;以及一翻译模块,用以接收该第一语言文字,并将其翻译为一第二语言文字。
2、 如权利要求1所述的动态网页翻译系统,其特征在于,包括 一置回模块,用以接收该第二语言文字,并将其置回对应的该些文字节点中而耳又代对应的该第一语言文字;以及一重构模块,用以依据具有该第二语言文字的文件对象模型,产生并显 示一已重构的动态网页。
3、 如权利要求2所述的动态网页翻译系统,其特征在于,其中该置回 模块更用以4是供一指令码或一程序,以藉其将该第 一语言文字更改为该第二 语言文字。
4、 如权利要求3所述的动态网页翻译系统,其特征在于,其中该指令 码为Java指令码或VB指令码。
5、 如权利要求1所述的动态网页翻译系统,其特征在于,其中该读取 模块更用以提供一指令码或一程序,以藉其来读取该第一语言文字,其中该 指令码为java指令码或VB指令码。
6、 如权利要求1所述的动态网页翻译系统,其特征在于,还包括一节 点选取模块,用以从该些文字节点中选取至少其中之一,并将选定的该些文 字节点输出至该读取模块,以供该读取模块读取选定的该些文字节点中的该 第一语言文字。
7、 如权利要求1所述的动态网页翻译系统,其特征在于,还包括一输入界面,用以供使用者输入该动态网页的网址;以及一传送模块,用以传送一请求信号至储存有该动态网页的远程服务器, 其中该请求信号系用以请求远程服务器传回该动态网页。
8、 一种动态网页翻译方法,包括下列步骤 接收一动态网页;解析该动态网页,以取得该动态网页的一文件对象模型,其中该文件对 象模型具有多个节点,且该些节点至少包括一文字节点;读取该些文字节点中的一第一语言文字;以及 将该第一语言文字翻译为一第二语言文字。
9、 如权利要求8所述的动态网页翻译方法,其特征在于,进一步包括 将该第二语言文字置回对应的该些文字节点中而取代该第一语言文字;以及依据具有该第二语言文字的该文件对象模型,产生并显示一已重构的动 态网页。
10、 如权利要求9所述的动态网页翻译方法,其特征在于,其中将该第 二语言文字置回而取代该第 一语言文字的方法包括透过一指令码或一程序 执行。
11、 如权利要求IO所述的动态网页翻译方法,其特征在于,其中该指 令码为Java指令码或VB指令码。
12、 如权利要求8所述的动态网页翻译方法,其特征在于,其中读取该 第一语言文字的方法包括透过一指令码或一程序执行,其中该指令码为Java 指令码或VB指令码。
13、 如权利要求8所述的动态网页翻译方法,其特征在于,其中在读取 该第一语言文字之前,更包括从该些文字节点中选取至少其中之一,而后续 则是从选定的该些文字节点中读取该第 一语言文字。
14、 一种动态网页翻译系统,适于对已经由一浏览器解析过的一动态网 页进行翻"^,其特征在于,其中已解析的该动态网页于该浏览器中储存有一 文件对象模型,而该文件对象模型具有多个节点,且该些节点至少包括一文字节点,该系统包括一读取模块,用以读取并储存该文件对象模型,以及输出该些文字节点 中的一第一语言文字;一翻译模块,用以接收该第一语言文字,并将其翻译为一第二语言文字;以及一置回模块,用以接收该第二语言文字,并将其置回该文件对象模型之 该些文字节点中而取代对应之第一语言文字;其中,该浏览器系依据具有该第二语言文字之该文件对象模型重构该动 态网页,并显示重构后之动态网页。
15、 如权利要求14所述的动态网页翻译系统,其特征在于,其中该置 回模块更用以提供一指令码或一程序,以藉其将该第一语言文字更改为该第 二语言文字。
16、 如权利要求15所述的动态网页翻译系统,其特征在于,其中该指 令码为Java指令码或VB指令码。
17、 如权利要求14所述的动态网页翻译系统,其特征在于,其中该读 取模块更用以提供一指令码或一程序,以藉其来读取该第一语言文字,其中 该指令码为Java指令码或VB指令码。
18、 如权利要求14所述的动态网页翻译系统,其特征在于,其中该读 取模块更包括一节点选取单元,用以从该些文字节点中选取至少其中之一 , 以使该读取i^块输出选定的该些文字节点中的该第 一语言文字。
全文摘要
本发明公开了一种动态网页翻译系统及方法,其中的动态网页翻译方法通过文件对象模型取得动态网页中欲翻译的文字来进行翻译,并且在翻译后将译文置回文件对象模型取代原文,生成以译文显示的动态网页。利用本发明方法,可在不变更动态网页格式的前提下完成动态网页的翻译。另外,动态网页翻译系统可用以执行上述步骤。
文档编号G06F17/28GK101470705SQ20071030167
公开日2009年7月1日 申请日期2007年12月29日 优先权日2007年12月29日
发明者徐晓燕, 邱全成 申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1