校对程序中的文本翻译的方法和系统的制作方法

文档序号:6335242阅读:225来源:国知局
专利名称:校对程序中的文本翻译的方法和系统的制作方法
技术领域
本发明涉及校对程序中的文本翻译的技术。更具体地,本发明尤其涉及基于文档对象化模型树(DOM TREE)信息校对网络应用程序中的文本翻译的技术。
背景技术
随着应用编程技术以及图形用户接口(GUI)技术的迅速发展,越来越多的应用程序提供了支持用户在GUI界面下与程序进行交互的功能。为了满足应用程序在不同国家 (地区)的本地化需求,需要将⑶I界面下显示的应用程序中的文本翻译为多种语言。程序集成信息PII (ftOgram Integrated Information)文件即用于存储应用程序在运行过程中在⑶I界面下显示的文本内容。例如,PII文件包括在Java环境下的特性(Property)文件以及Microsoft. NET环境下的资源文件(resx)等。通常,翻译人员通过翻译PII文件来实现应用程序的本地化。但是,在翻译的过程中,翻译人员无法了解应用程序在实际运行过程中所展示的实际GUI界面,因此他们可能在不了解应用程序代码上下文环境的情况下作出错误的或者不准确的翻译。并且由于多数翻译人员不具备程序开发能力,他们可能无法正确地将PII文件中的文本翻译为适合于计算机程序环境下的恰当译文。例如,英文单词“rim”翻译成中文既可能是“跑步”也可能是 “运行”,在不了解应用程序代码上下文环境的情况下就可能做出错误的翻译。因此,需要执行翻译校对测试TVT (translation verification test)以便发现并校正这些可能存在的翻译中的错误。现有技术中存在一些执行翻译校对测试TVT的技术方案。其中一种技术方案叫做实时TVT。校对人员需要程序开发人员为其运行(build) 应用程序的基于源PII文件的实例,还需要运行应用程序的基于本地语言NLV(National Language Version)的PII文件的实例,从而在两个运行实例间进行翻译校对工作。这种方案将导致校对人员必须等待运行两个应用程序的实例,从而导致运行资源的增加以及校对等待耗时的增加。此外,利用实时TVT方案,如果校对人员在两个运行实例比对过程中发现了翻译错误,则其必须将更正后的PII文件返还给程序开发人员,以便由程序开发人员重新运行并向校对人员提供应用程序基于本地语言NLV的实例,从而进行确认更正的完成。 这样依赖于校对人员与程序开发人员的相互配合,严重影响了校对工作的效率。现有技术中存在另一种执行TVT的技术方案屏幕快照TVT。所谓屏幕快照TVT, 是指校对人员接收源PII文件的运行实例和NLVPII文件的运行实例的屏幕快照,并且直接基于屏幕快照进行校对工作。这同样将增加程序开发人员的额外负担并降低TVT的执行效率必须运行应用程序的两个实例并对两个实例的GUI界面进行屏幕快照。

发明内容
考虑到上述存在的问题,本发明的目的之一在于提供一种能够仅运行应用程序的一个实例就可以执行翻译文本校对TVT的技术方案,从而减小校对过程中的等待时间并提高效率。本发明的又一目的在于提供一种能够即时地反映在校对过程中对PII文件所进行的修改的技术方案,而无需等待重新运行应用程序的实例。根据本发明的一个方面,提供了一种用于校对程序中文本的翻译的方法,包括获取所述程序中文本的第一 PII文件以及第二 PII文件;运行所述程序中文本的第一 PII文件以生成源网页;获取所述源网页的文档对象化模型树DOM TREE信息;从所述DOM TREE信息中提取对应于第一 PII文件中的文本单元的标识信息;依据所提取的标识信息以及标识信息与所述文本单元间的对应关系,查找第二 PII文件中对应的文本单元;以及用所查找到的第二 PII文件中的文本单元替换所述DOM TREE信息中相应的文本单元,以生成新的关于第二 PII文件的网页展示。根据本发明的一个实施例,上述方法进一步包括为程序文本的第一 PII文件中的文本单元添加标识信息;以及记录所添加的标识信息与所述第一 PII文件中的文本单元间的对应关系。根据本发明的另一方面,提供了一种用于校对程序中文本的翻译的系统,包括 PII文件获取装置,用于获取所述程序中文本的第一 PII文件以及第二 PII文件;第一网页生成装置,用于运行所述程序中文本的第一 PII文件以生成源网页;DOM Tree信息获取装置,用于获取所述源网页的文档对象化模型树DOM TREE信息;标识信息提取装置,用于从所述DOM TREE信息中提取对应于第一 PII文件中的文本单元的标识信息;查找装置,用于依据所提取的标识信息以及标识信息与所述文本单元间的对应关系,查找第二 PII文件中对应的文本单元;以及第二网页生成装置,用于利用所查找到的第二 PII文件中的文本单元替换所述DOM TREE信息中相应的文本单元,以生成新的关于第二PII文件的网页展示。。通过本发明的方法和系统,可以实现仅运行应用程序的一个实例就可以执行翻译文本校对TVT的技术方案,从而减小校对过程中的等待时间并提高效率的技术效果。同时还可以获得即时地反映在校对过程中对PII文件所进行的修改的技术方案,而无需等待重新运行应用程序的实例的技术效果。


通过对结合附图所示出的实施方式进行详细说明,本发明的上述以及其他特征将更加明显,本发明附图中相同的标号表示相同或相似的部件。在附图中,图1示出了根据本发明的一个实施例的用于校对程序中文本的翻译的方法的流程图;图2示出了根据本发明的又一实施例的用于校对程序中文本的翻译的方法的流程图;图3示出了根据本发明的一个实施例的用于校对程序中文本的翻译的系统的框图;图4示出了根据本发明的另一个实施例的用于校对程序中文本的翻译的系统的框5示出了根据本发明一个实施例的校对程序中的文本翻译的效果图。
具体实施方式
在下文中,将参考附图通过实施方式对本发明提供的用于确定要被物化的节点的方法和系统进行详细地描述。图1示出了根据本发明的一个实施例的用于校对程序中文本的翻译的方法的流程图。图1所示的方法从步骤101开始。在步骤101中,获取应用程序中文本的源PII文件和被翻译后的PII文件。应用程序为了满足在世界多个国家(地区)的本地化需求,需要对其运行时在用户界面展示给用户的文本进行翻译,通常这些文本由开发人员在开发程序的过程中保存在程序集成信息PII文件中。在不同的编程环境下,PII文件通常具有特定的名称或具备固定的格式。例如,在Java环境下,PII文件体现为特性(Property)文件,其格式为,,key = text characters,,,其中 key 表示特性文件中的一个“键,,,而 text characters 即为该键的键值,也就是文本的内容。在Windows环境下,PII文件通常体现为资源文件 RESX0无论是在何种编程环境下,可以将PII文件的内容理解为包含多行文本字符的文件, 其中每一行文本字符即对应于应用程序在运行时要显示在用户界面中的每一处文本。需要指出的是,“源PII文件”是指程序开发人员以其母语初次开发出的程序版本的PII文件。 例如,一名以英语为母语的程序开发人员在开发程序时通常另其程序在运行时向用户显示英文文本,那么源PII文件即为此英文PII文件。“被翻译后的PII文件”是指翻译人员在根据源PII文件翻译其中的文本内容后所形成的PII文件。翻译人员在翻译要在用户界面显示的文本内容时通常直接在PII文件中进行翻译。也就是说,对应于源PII文件的每一行,翻译人员直接将源语种文本替换为要翻译的目标语种文本,以形成新的PII文件,而不改变PII文件的行数及结构。接下来图1所示的方法进行至步骤102。在步骤102中,运行所述程序中文本的源PII文件以生成源网页。这里“运行程序文本的源PII文件”是指在运行应用程序时导入源PII文件作为要显示给用户的文本内容,因为PII文件本身并不可被单独运行。如果应用程序是网络程序或者以网页形式与用户交互的程序,那么该程序在运行过程中就会通过网页来向展示文本内容。在步骤103中,获取源网页的DOM Tree信息。DOM Tree的含义是“文档对象化模型树”。本领域技术人员应当了解,网页的HTML源代码(或其它网页源代码语言)包含多个节点,而所有这些节点有主节点、子节点之分(也就是HTML代码中的标签),D0M Tree即是体现了网页的HTML源代码的节点的树形结构信息。具体地讲,将网页的HTML结构通过浏览器解析,在内存中创建整个文档节点对象,然后从文档中出现的第一个标记出发,按照HTML 的层次结构一个一个加以拦截。当网页被装载到内存后,在内存中就有了一个按照HTML结构形成的节点对象树状结构。当然,如何获得一个网页的HTML代码以及如何根据HTML代码获得其DOM Tree信息属于本领域的公知技术,上面的说明只是为了使技术方案的描述更加完整,本领域技术人员完全可以利用各种工具或技术手段取得网页的DOMTree信息。接下来进行至步骤104。在步骤104中,从获得的DOM TREE信息中提取对应于源 PII文件中的文本单元的标识信息。需要指出的是,“PII文件中的文本单元”指的是PII 文件中文本组成的基本单位。前面已经说明,PII文件的每一行文本字符即对应于应用程序在运行时要显示在用户界面中的每一处文本。因此,这里“文本单元”即可以理解为PII 文件中的每一行文本。当然,这里的“行”并非仅指由分行符隔开的传统意义上的“行”,由于PII文件在不同的编程环境下可能具有不同的结构,其中的文本组成的基本单位可以由CN 102467497 A说明书4/8 页
多种方式进行识别,例如Java环境下的“key”。由于源PII文件中的文本内容在程序运行过程中包含在生成的源网页中(也就是包含在源网页的HTML源代码中),因此这些文本内容也必然可以包含在源网页的DOM Tree信息中。所以,DOM Tree信息中的每一处文本内容就对应于源PII文件中的每一行文本。下面需要介绍的是“标识信息”。源PII文件中的文本单元的标识信息存在于源PII文件中并且对应于其中的每一个文本单元。根据本发明的一个实施例,标识信息是为源PII文件的每一个文本单元添加的ID。根据本发明的又 一实施例,标识信息是为源PII文件的每一个文本单元添加的任何可以起到标识作用的字符或字符串。根据本发明的一个实施例,标识信息在程序运行后生成的网页中对用户不可见。 根据本发明的一个实施例,标识信息在程序运行后生成的网页中对用户可见。根据本发明的一个实施例,源PII文件中每个文本单元的标识信息都是不同的。由于标识信息存在于源PII文件中(对应于源PII文件的每一个文本单元)从而构成源PII文件的文本内容的一部分,因此这些标识信息也必然包含在源网页的DOM Tree信息中。因此,可以获取到DOM Tree中的对应于源PII文件中的每一行文本(或文本单元)中的标识信息。还需要指出的是,根据本发明的一个实施例,标识信息是在校对工作前自动为源 PII文件的每个文本单元添加的。实现自动添加标识信息的工具有多种,只要能够检测到 PII文件有N个文本单元从而自动生成N个不同的标识信息(ID或其它字符)并进行添加即可。关于添加标识信息的具体方法将在下文中结合对图2的描述进行说明。根据此实施例,由于不向翻译后的PII文件中添加标识信息,需要以PII文件中的本身存在的其它标识信息(例如Java环境下的PII文件中的键“key”的名称)来在翻译后的PII文件中查找对应的文本内容(详见对步骤105的描述)。根据本发明的另一个实施例,标识信息是在翻译完成后校对开始前自动为源PII文件和翻译后的PII文件的每个文本单元添加的。其中,为源PII文件和翻译后的PII文件添加的标识信息是相同的(一组标识信息应用到两个PII文件)。根据此实施例,由于翻译后的PII文件中也包含与源PII文件相同的标识信息,因此可以直接通过添加的标识信息在翻译后的PII文件中查找翻译后的文本内容(详见对步骤105的描述)。需要强调的是,添加标识信息并非本发明的必要步骤,因为只需要存在这样的标识信息并且获取到这样的标识信息即可以实现本发明的目的。接下来,图1所示的方法进行至步骤105。在步骤105中,依据所提取的标识信息以及标识信息与源PII文件的文本单元间的对应关系,查找被翻译的PII文件中对应的文本单元。根据本发明的一个实施例,如果源PII文件和翻译后的PII文件中均添加了标识信息,那么对应关系包括标识信息与翻译后的PII文件中的文本单元的对应关系。因此,通过标识信息以及这样的对应关系就可以直接在步骤101中所获取的翻译后的PII文件中查找到对应的翻译后的文本内容。需要指出的是,虽然步骤105记载的是“依据……与源 PII文件的文本单元的对应关系”,但是本领域技术人员应当理解,在此实施例下这种对应关系直接体现为标识信息与翻译后的PII文件的文本单元的对应关系,由于任何源PII文件和翻译后的PII文件的文本单元都是一一对应的,因此也可以将这种对应关系理解为步骤105记载的“与源PII文件的文本单元的对应关系”,而并不与步骤105记载的文字内容相矛盾。根据本发明的另一个实施例,如果只有源PII文件中添加了标识信息,那么对应
7关系包括标识信息与源PII文件中的文本单元的对应关系。因此,需要通过标识信息查找其对应的源PII文件中的文本单元的键名(以Java环境为例),并且借助键名在翻译后的 PII文件中查找相应的翻译后的文本单元的内容。当然,“键名”只是在Java环境下举的一个例子,在其它不同的编程环境下本领域技术人员完全可以根据该环境PII文件的区别性特点来进行文本单元的查找。同样需要强调的是,与添加标识信息类似,记录标识信息与文本单元间的对应关系也并非本发明的必要步骤,因为只需要存在这样的对应关系并且获取到这样的对应关系即可实现本发明的目的。接下来在步骤106中,用所查找到的翻译后的PII文件中的文本单元替换所述DOM TREE信息中相应的文本单元,以生成新的关于翻译后的PII文件的网页展示。由于替换了文本单元后,就等于生成了新的DOM Tree信息,也就是生成了新的HTML源代码。从而可以利用现有的浏览器解析所生成的新的HTML源代码,以生成新的翻译后的PII文件的网页展示。根据本发明的一个实施例,新的网页展示与源网页处于同一浏览器标签中,并处于该同一浏览标签中的不同显示区域中。根据本发明的另一实施例,新的网页展示与源网页处于不同的浏览器标签中(不同的页面中)。至此,即利用图1所示的方法实现了只运行一个应用程序的实例就可以自动向校对人员提供关于源PII文件和翻译后的PII文件的网页展示的效果,大大减小校对过程中的等待时间并提高了效率。其关键在于如下两点(1)借助PII文件中的标识信息来巧妙地定位PII文件中的文本单元;(2)巧妙地利用了网页的DOM Tree信息替换其中的文本内容。下面需要强调的是,根据本发明的又一实施例,上述对图1的方法流程的描述中, 源PII文件与翻译后的PII文件可以替换。也就是说,在步骤102中,运行所述程序中文本的源PII文件以生成源网页。在步骤103中,获取源网页的DOM Tree信息。在步骤104中, 从获得的DOM TREE信息中提取对应于翻译后的PII文件中的文本单元的标识信息。在步骤 105中,依据所提取的标识信息以及标识信息与翻译后的PII文件的文本单元间的对应关系,查找源PII文件中对应的文本单元。在步骤106中,用所查找到的源PII文件中的文本单元替换所述DOM TREE信息中相应的文本单元,以生成新的关于源PII文件的网页展示。 相应地,其它关于每个步骤的具体的实施方式的描述中也可以进行上述替换。之所以上述实施例能够同样实现本发明的目的,是因为无论从源PII文件还是翻译后的PII文件入手, 都可以最终在只运行一个应用程序实例的情况下获得关于两个PII文件的网页展示,而校对人员所需要的正是这两个PII文件的网页展示。图2示出了根据本发明的又一实施例的用于校对程序中文本的翻译的方法的流程图。在步骤200A中,为程序文本的第一 PII文件中的文本单元添加标识信息。根据本发明的一个实施例,标识信息是例如A,B,C或990,991,992这样的ID或字符串,这样的标识信息在运行程序时生成的网页中是对用户可见的。根据本发明的另一个实施例,标识信息是例如Unicode编码中的U+200B,U+200C或U+200D这样的在用户界面⑶I中不可见的字符,从而避免由于添加了标识信息而影响用户观看程序界面的体验。在步骤200B中,记录所添加的标识信息与所述第一 PII文件中的文本单元间的对应关系。记录对应关系的方式可以有多种,根据本发明的一个实施例,在一个本地中间文件中以映射表的方式记录这种对应关系,并通过导入该中间文件来获取所记录的对应关系。根据本发明的另一实施例,将对应关系记录在远程服务器上,从而使得位于不同位置的程序开发人员或校对人员可以便利地获取该对应关系信息。对应关系记录的格式可以有多种。图2所示的步骤201-206可以理解为对应于图1所示的步骤101-106,在此不再赘述。此外,图2所示的方法还可能包含下列未在图2中示出的步骤监听所述源网页的 DOM TREE中的节点属性变化信息;以及根据所述节点属性变化信息更新所述第二 PII文件的网页展示。其中,监听以及更新的目的是为了当程序开发人员修改了 PII文件中的文本的属性时,能够及时地向校对人员反馈出这种信息。节点属性可能包括文本内容,以及文本在页面上显示的宽度、色彩、字体等。这样就可以即时地反映程序开发人员在校对过程中对 PII文件所进行的修改,而无需等待再次重新运行应用程序的实例。下面,给出一个利用图1和图2所示的方法在只运行一个程序实例的情况下提供关于两个PII文件的页面展示的实例。假设某应用程序的源PII文件的文件名为msg. properties,其内容如下所示MSG. HELLO = Hello, buddies !MSG. WELCOME = Welcome !该PII文件中有两个文本单元。其中,MSG. HELLO和MSG. TOLC0ME即是该源PII文件中的两个键“key”的键名,也就是PII文件中两个文本单元的名称。而“=”符号后面的 "Hello, buddies ! ”以及“Welcome ! ”则是该两个文本单元的文本内容。接下来,运行该应用程序关于源PII文件的一个实例,得到下面的网页的DOM iTree信息(未示出实际显示的网页页面)DOM Tree<HTML><Head></Head><Body><div id = " content" ><div>Hello, buddies ! </div><div>ffelcome ! </div></div></Body></HTML>接下来,为源PII文件中的每个文本单元添加标识信息,其中U+200D表示“1”, U+200C表示“0,,,U+200B表示PII文件中文本单元的开始和结束。则添加标识信息后的PII 文件如下所示MSG. HELLO = U+200BHello, buddies ! U+200BU+200CMSG. WELCOME = U+200Bffelcome ! U+200BU+200D从而,运行应用程序基于该添加了标识信息之后的源PII文件的实例所生成的网页的DOM Tree信息如下所示<HTML><Head></Head><Body><div id = " content" ><div>U+200BHello, buddies ! U+200BU+200C</div><div>U+200Bffelcome ! U+200BU+200D</div></div></Body></HTML>可见,添加的标识信息体现在DOM Tree信息中。假设将所添加的标识信息与PII 文件中的文本单元的对应关系记录在下列中间文件中,文件的内容例如U+200C = “ msg. properties" MSG. HELLOU+200D = “ msg. properties" MSG. WELCOME而翻译后的PII文件msg_zh. properties的内容如下所示MSG. HELLO =嗨,大伙 J L !
MSG. WELCOME =欢迎!那么,通过提取源PII文件的DOM Tree中的文本节点的标识信息来查找上面的中间文件,即可得到对应的两个键名。再分别利用这两个键名在翻译后的PII文件中找到对应的中文文本,用中文文本替换DOM Tree中的文本内容,从而得到下面新的DOM Tree信息<HTML><Head></Head><Body><div id = " content" ><div> 嗨,大伙儿! </div><div> 欢迎! </div></div></Body></HTML>利用浏览器解析上面新生成的DOM Tree即可得到对应于翻译后的PII文件的新的网页展示。图3示出了根据本发明一个实施例的用于校对程序中文本的翻译的系统的框图。 图3所示的系统在整体上由系统300表示。具体地,系统300包括PII文件获取装置301, 用于获取所述程序中文本的第一 PII文件以及第二 PII文件;第一网页生成装置302,用于运行所述程序中文本的第一 PII文件以生成源网页;DOM Tree信息获取装置303,用于获取所述源网页的文档对象化模型树DOM TREE信息;标识信息提取装置304,用于从所述DOMTREE信息中提取对应于第一 PII文件中的文本单元的标识信息;查找装置305,用于依据所提取的标识信息以及标识信息与所述文本单元间的对应关系,查找第二 PII文件中对应的文本单元;以及第二网页生成装置306,用于利用所查找到的第二 PII文件中的文本单元替换所述DOM TREE信息中相应的文本单元,以生成新的关于第二 PII文件的网页展示。本领域技术人员可以了解,系统300中的装置301-306分别对应于图1所示的方法中的步骤 101-106。因此各装置的具体实现方式在此不再赘述。图4示出了根据本发明的另一个实施例的用于校对程序中文本的翻译的系统的框图。图4所示的系统在整体上由系统400表示。具体地,系统400包括标识信息添加装置400A,用于为程序文本的第一 PII文件中的文本单元添加标识信息;记录装置400B,用于记录所添加的标识信息与所述第一 PII文件中的文本单元间的对应关系。其它的装置 401-406分别对应于图1所示的方法中的步骤101-106,在此不再赘述。图5示出了根据本发明一个实施例的校对程序中的文本翻译的效果图。在图5所示出的效果图中,左边为英文版的网页展示,右边为德文版的网页展示。按照本发明的具体实施方式
,仅运行一个关于英文PII文件的应用程序实例或者仅运行一个关于德文PII文件的应用程序实例均可以获得图5所示的展示关于两个PII文件的效果。类似地,多个PII 文件的情形同样可以用本发明提供的技术方案实现。通过以上对具体实施例的描述,本领域技术人员可以理解,上述的系统、装置和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、 CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本实施例的装置、服务器及其单元可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合实现。虽然以上结合具体实例,对本发明的利用远程应用处理本地文件的系统及方法进行了详细描述,但本发明并不限于此。本领域普通技术人员能够在说明书教导之下对本发明进行多种变换、替换和修改而不偏离本发明的精神和范围。应该理解,所有这样的变化、 替换、修改仍然落入本发明的保护范围之内。本发明的保护范围由所附权利要求来限定。
权利要求
1.一种用于校对程序中文本的翻译的方法,包括 获取所述程序中文本的第一 PII文件以及第二 PII文件; 基于第一 PII文件运行所述程序以生成源网页;获取所述源网页的文档对象化模型树DOM TREE信息; 从所述DOM TREE信息中提取对应于第一 PII文件中的文本单元的标识信息; 依据所提取的标识信息以及标识信息与所述文本单元间的对应关系,查找第二 PII文件中对应的文本单元;以及用所查找到的第二PII文件中的文本单元替换所述DOM TREE信息中相应的文本单元, 以生成新的基于第二 PII文件的网页。
2.如权利要求1所述的方法,其中第一PII文件是源PII文件,并且第二 PII文件是对源PII文件翻译后的PII文件。
3.如权利要求1所述的方法,其中第二PII文件是源PII文件,并且第一PII文件是对源PII文件翻译后的PII文件。
4.如权利要求2或3所述的方法,进一步包括为程序中文本的第一 PII文件中的文本单元添加标识信息;以及记录所添加的标识信息与所述第一 PII文件中的文本单元间的对应关系。
5.如权利要求1至3任一所述的方法,其中标识信息在图形用户界面中不可见。
6.如权利要求1至3任一所述的方法,所述第一PII文件中的各个文本单元具有唯一的标识信息。
7.如权利要求1至3任一所述的方法,进一步包括 监听所述源网页的DOM TREE中的节点属性变化信息;以及根据所述节点属性变化信息更新所述第二 PII文件的网页。
8.一种用于校对程序中文本的翻译的系统,包括PII文件获取装置,用于获取所述程序中文本的第一 PII文件以及第二 PII文件; 第一网页生成装置,用于基于第一 PII文件运行所述程序以生成源网页; DOM TREE信息获取装置,用于获取所述源网页的文档对象化模型树DOM TREE信息; 标识信息提取装置,用于从所述DOM TREE信息中提取对应于第一 PII文件中的文本单元的标识信息;查找装置,用于依据所提取的标识信息以及标识信息与所述文本单元间的对应关系, 查找第二 PII文件中对应的文本单元;以及第二网页生成装置,用于利用所查找到的第二 PII文件中的文本单元替换所述DOM TREE信息中相应的文本单元,以生成新的基于第二 PII文件的网页。
9.如权利要求8所述的系统,其中第一PII文件是源PII文件,并且第二 PII文件是对源PII文件翻译后的PII文件。
10.如权利要求8所述的系统,其中第二PII文件是源PII文件,并且第一 PII文件是对源PII文件翻译后的PII文件。
11.如权利要求9或10所述的系统,进一步包括标识信息添加装置,用于为程序中文本的第一 PII文件中的文本单元添加标识信息; 记录装置,用于记录所添加的标识信息与所述第一 PII文件中的文本单元间的对应关系。
12.如权利要求8至10任一所述的系统,其中标识信息在图形用户界面中不可见。
13.如权利要求8至10任一所述的系统,所述第一PII文件中的各个文本单元具有唯一的标识信息。
14.如权利要求8至10任一所述的系统,进一步包括监听装置,用于监听所述源网页的DOM TREE中的节点属性变化信息; 更新装置,用于根据所述节点属性变化信息更新所述第二 PII文件的网页。
全文摘要
本发明涉及校对程序中的文本翻译的技术。更具体地,本发明尤其涉及基于文档对象化模型树(DOM TREE)信息校对网络应用程序中的文本翻译的技术。本发明提供了一种用于校对程序中文本的翻译的方法,包括获取所述程序中文本的第一PII文件以及第二PII文件;基于第一PII文件运行所述程序以生成源网页;获取所述源网页的文档对象化模型树DOM TREE信息;从所述DOM TREE信息中提取对应于第一PII文件中的文本单元的标识信息;依据所提取的标识信息以及标识信息与所述文本单元间的对应关系,查找第二PII文件中对应的文本单元;以及用所查找到的第二PII文件中的文本单元替换所述DOM TREE信息中相应的文本单元,以生成新的基于第二PII文件的网页。
文档编号G06F17/28GK102467497SQ20101053220
公开日2012年5月23日 申请日期2010年10月29日 优先权日2010年10月29日
发明者戚利强, 施尉霁, 盛延敏, 罗凌 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1