用户勾圈网页即时翻译系统及方法

文档序号:6482081阅读:225来源:国知局
专利名称:用户勾圈网页即时翻译系统及方法
技术领域
本发明涉及一种全新的网页在线浏览翻译系统及方法,用以对网页中 被随意勾圈的网页段落进行截取处理并即时翻译。该系统及方法可应用于 各类有线或无线上网的电脑设备、嵌入式系统、便携式系统、系统芯片、 手机设备或移动电子装置。本发明的核心价值在于它不受限于网页的内部 设计格式和开发语言,也不受限于网页外部的表现风格和动画色彩,彻底 克服其他在线翻译系统严重受限于网页内部结构的致命缺点,能让用户将Internet上浏览到的源语言网页的任何内容自如翻译到目标语言来阅读。
技术背景随着互联网技术的发展与普及,Internet已经成为一个拥有庞大信息 量的全球性信息资源体,其大大加速了全球范围内的信息交换。只需借助 一台计算机,人们就能轻松快捷地获得世界各地的数据和信息。然而,在 享用Internet所带来的巨大便利时,人们会遇到一个语言障碍的问题。 Internet上的网页信息由不同国家所提供,包含了世界各国不同的语言文 字,由于这些信息以各种语言的形式存在于互联网上,给用户造成了诸多 不便,当用户没能掌握某种语言时,也就无法读懂该语言的网页。因此, 对网上的页面进行翻译就显得非常必要,网页翻译技术便应运而生。Internet在线即时翻译是机器翻译的一个最新应用领域,是当前信 息时代交流全球化的一个解决方案,人们通过互联网(Internet)査询、 浏览资料时,可以借助在线翻译软件,对文本进行即时翻译,以获得他所 需要的各种信息。 、现有的Internet在线翻译主要用了如下三种方法一、 通过翻译网站来进行翻译。客户将所要翻译网页的网址发送到 提供翻译服务的服务器,服务器翻译完后再将结果返送回来。二、 通过客户端进行翻译。即利用有翻译功能的浏览器来进行翻 译。人们在自己的计算机内,安装,个具有网页翻译功能的浏 览器软件,就可以通过该浏览器来浏览外国语言的网页。三、 通过E-mail进行联机机器翻译。它是由用户将需要翻译的资料 用E-mail发给提供翻译服务的翻译公司,等翻译公司翻译完后, 再用E-mail将结果发回给用户。其中,除了第三种不能在真正意义上算是即时机器翻译,另外两种可 归结为在线翻译和本地翻译两种模式,但是他们各有缺点。在线翻译的主 要缺点是翻译的速度较慢、资源利用不均衡,并且用户缺乏足够的控制力。 因为采用了在线语种语料库,所以在翻译过程中,客户端需要不停地向服 务器发送请求,此时当用户的网络不稳定或者网络通讯状况不好时,翻译 速度将不堪忍受,或者干脆不能翻译。
一个网页即时翻译系统应当具备以下几个基本功能1. 在线翻译功能。系统应能对原文页面做出实时快速的翻译。2. 原文页面和译文页面的对照显示功能。系统应能支持原文页面和 翻译结果页面的对照显示。3. 不打扰用户对计算机的其他正常操作,例如浏览网页或文字处理。 当用户需要对所浏览内容进行翻译的时候,才呼叫出即时翻译系 统执行操作。而浏览器翻译系统的一个主要发展则是其运算法则的发展,其主要困 难在于分析HTML的结构。 一个HTML网页主要由文本加上一些HTML格式 标签构成。如果直接将源文件根据格式标签分成几个部分,很可能会将完 整的内容切割成不完整的几部分,从而导致无法准确翻译原文。事实上, 在翻译时,应当将整个页面当作一个整体而不是分成单独的几个部分,否则会导致误解。要做到这点,机器翻译系统应当能将完整的句子或段落放到一个整体中去翻译,即使有些句子可能会被一些HTML格式标签分开。但是还有一点要注意,翻译后的文本也应当要有正确的格式标签。这就可能会遇到两个问题如何将HTML格式标签正确地插入到翻译后的文本中 以及如何正确地翻译纯文本。关于HTML文件,自然不能将格式标签与文 本分开后翻译文本待翻译完后再插入格式标签,因为两种语言结构不同, 不能总是找到一一对应的词,因此应当采用别的方法来处理整个问题。依 据现有的技术,首先,分别标记HTML格式标签和文本,然后分别翻译纯 文本和格式标签文本,之后系统会比较这二者。如果目标语言版本与源语 言完全吻合,象源文本那样直接标记它就可以了。如果不一致,系统必须 找出对应的部分,再加上必要的标记。这是一个极为繁琐而且低效率的方法,因为现在网页开发技术日新月 异,每时每刻都有新的格式标签出现在网页源代码之中。不仅如此,己有 的格式标签所构成网页的版面也会无时不刻地变化,这就要求网页翻译系 统能不断地更新网页版面识别模块。这些不仅降低了翻译的效果还增加了 系统后期维护的难度。总而言之,前述的网页翻译方法存在如下缺点l.用户只能通篇翻译 整个网页,不能有选择地进行有针对性的翻译,非常浪费时间,降低了系统效率。2.网页技术发展更新很快,容易发生系统因不能识别网页版面格式而不能翻译的情况。 发明内容鉴于上述现有技术的种种缺点,本发明的主要目的在于提供一种新型 网页即时翻译系统及方法,该方法通过由用户s圈网页以对被勾选出的目 标段落进行即时翻译。本发明的另一目的在于摆脱和跳出现在所有网页翻 译系统的架构和模式,提出了一种基于屏幕快照实现网页翻译的新方法。 该方法的意义在于,成功克服了现有网页翻译系统对网页版式内容认知依赖性较大的缺点,真正完全做到了能够轻松翻译任何能够浏览到的网页。本发明所揭示的用户勾圈网页即时翻译系统独立于任何网页浏览器 视窗,不影响用户浏览网页,只需呼叫出本系统,就能即刻进行翻译,方 便而快捷。该系统包括"设定模块",该模块为用户提供一个特定选项, 供用户自行设置快捷热键,当此快捷热键触发指令被触发时,则呼叫本翻 译系统执行勾圈截屏模块;"勾圈截屏模块",该模块负责将用户勾圈出的网页段落自动截取出来,以供其他模块处理;"字符识别模块",该模块 负责从自动截取的网页段落图像中识别出所包含的文字信息;"双语翻译 模块",该模块负责将所识别出的文字信息经由翻译引擎进行翻译;"翻译 结果显示模块",该模块负责将用户该次勾圈截取的指定段落的翻译数据 显示于一个独立的翻译结果浏览视窗中,该显示过程不影响用户原本的网 页浏览器视窗,做到能对照显示原文和译文。 本发明的用户勾圈网页即时翻译系统及方法的有益效果是,通过用户 勾圈截屏模块、字符识别模块、双语翻译模块及翻译结果显示模块的连串 工作,实现了对所勾网页段落的即时翻译;同时,由于本系统独立运行于 网页浏览器,因此,即使用户采用不同操作系统平台下的不同网页浏览器, 査看不同编程语言所编写的不同格式的网页,也都不会对本系统的功能造 成任何影响。再者,本系统完全独立,不依赖于任何别的软件系统和网络 资源,用户无需借助任何别的翻译工具,例如在线词典或者在线翻译网站, 也无需人工手动键入单词或者段落,只需直接用鼠标勾圈截取网页段落即 可方便快捷完成翻译。最后看到的翻译结果是显示在一个独立的视窗中 的,实现了原文和译文的对照显示,该翻译结果视窗不会覆盖和影响用户 正在浏览的网页,可以随时被用户保存或关闭。下面结合附图和具体实施方式
对本发明所述的用户勾圈网页即时翻译系统及方法作进一步说明 '


图1A是本发明所述用户勾圈网页即时翻译系统的结构示意图; 图IB是本发明所述用户勾圈网页即时翻译系统的翻译界面外观图; 图1C是采用本发明所述用户勾圈网页即时翻译系统的进行翻译的网 页案例示意图;图ID是采用本发明所述用户勾圈网页即时翻译系统的截取所要翻译 段落的虚线矩形框示意图;图IE是采用本发明所述用户勾圈网页即时翻译系统对所选段落进行 后的翻译结果数据显示视图。图2是本发明所述用户勾圈网页即时翻译系统的控制逻辑图。附图标记说明10 设定模块11 网页12 勾圈截屏模块 '13 字符识别模块14 双语翻译数据库15 双语翻译模块16 翻译结果显示模块S20 S29步骤 -具体实施方式
,参照图1A,提供一种用户勾圈网页即时翻译系统,该系统应用于各类电脑设备、嵌入式系统、便携式系统、系统芯片、手机设备或移动电子装 置的网页在线浏览翻译,用以对网页中被随意勾圈的网页段落进行截取处 理并即时翻译,该系统包括依次通讯连接的以下模块设定模块10供用户设置指定的快捷热键,以呼叫及快速操作本翻译系统;勾圈截屏模块12用以在用户勾圈网页内容后自动截取网页中的指定 段落;字符识别模块14负责识别处理所截取段落中的文字信息和剔除非文 字信息;双语翻译模块16负责将识别处理过的文字信息进行即时翻译,获得 表示成目标语言的翻译结果;还包括与双语翻译模块16通讯连接的翻译数据库15。 本发明的用户勾圈网页即时翻译系统可应用于任何电子装置中的任何 网页浏览器,用以对所勾出的网页段落执行即时翻译作业。本节以该系统 应甩于个人电脑的Internet Explore (IE)浏览器为例加以详细说明。参照图1B、图1C、图1D、图1E、图2,提供一种采用上述用户勾 圈网页即时翻译系统的翻译方法,包括以下步骤520、 开启本系统,通过设定模块10设定快捷热键;521、 等待并判断是否接收到用户设置指定的快捷热键发出的触发指522、 勾圈截屏模块12接收到快捷热键发出的触发指令,打开截屏界面;523、 在网页上所选的虚线矩形框上双击鼠标左键,选择所需要翻译 的段落;524、 将所选择的段落保存为图片;525、 调整所保存图片的图像属性,包括图片的灰度、饱和度以及亮 度,并把源图片转为黑白二进制格式保存;526、 通过字符识别模块14用模式识别算法,识别源图片中的文字, 保存于一个文件中; '.S26、将步骤S26所获得的文件传送至双语翻译模块16进行即时翻译;528、 将歩骤S26所获得的网页段落翻译数据显示在独立的翻译结果 显示模块17的视窗中;529、 结束本次勾圈翻译。图2流程图示出了本发明的用户勾圈网页即时翻译方法,该方法指的 是在各类电脑设备、嵌入式系统、便携式系统、系统芯片、手机设备或移 动电子装置上实施的具备上述全部或部分主要特征的用户勾圈网页在线 浏览翻译方法。本节是以基于个人电脑IE浏览器的用户勾圈截取网页段 落进行翻译为例说明本发明的用户勾圈网页即时翻译方法,但并非以此限 制本发明。 '首先执行步骤S20,开启本系统;接着进至步骤S21,等待并判断是否 接收到用户设置指定的快捷热键触发指令,例如"F10",若是,则进至步 骤S22,进入勾圈截屏模块;若否,则返回该步骤S21,继续等待并判断。在步骤S22中,用户正浏览的当前网页页面静止,屏幕上的鼠标变成 一个小十字型光标,此时用户可在网页任一位置单击按下鼠标左键并拖移 鼠标后再释放左键,此时屏幕上将会出现光标经过路线所形成的虚线矩形 框。在拖移过程中和拖移之后,单击鼠标右键可取消本次选择。光标经过 路径所形成的虚线矩形框可以被放大或縮小,亦可以被上下左右拖动,在 确定好虚线矩形框所包含的段落正是所需要翻译的内容之后,即可在虚线 矩形框上双击鼠标左键,确认所选内容,进至i^骤S23。在步骤S23中,等待并判断是否接收到用户在所选的虚线矩形框上双 击鼠标左键,若是,则进至步骤S24;若否,则返回步骤S23。在步骤S24中,将用户勾圈虚线矩形框所截取的网页段落保存为源图 片,接着进至步骤S25。至此,勾圈截屏模块结束,进入字符识别模块。在步骤S25中,调整源图片的图像属性,包括图片的灰度、饱和度以 及亮度,并把源图片转为黑白二进制格式保存,接着进至步骤S26。在步骤S26中,用模式识别算法,识别源图片中的文字,保存于一个文件中,以便传送至双语翻译模块进行即时翻译。至此,字符识别模块结束,进入双语翻译模块,接着进至步骤S27。在步骤S27中,调用翻译引擎,以对识别出的网页段落文字进行即 时翻译,接着进至步骤S28。在步骤S28中,将所获得的网页段落翻译数据显示在独立的翻译结 果视窗中,接着进至步骤S29。在步骤S29中,判断是否结束,即是否接收到退出消息,若否,则返 回至步骤S21,若是,结束本次实施流程。 '综上所述,本发明的用户勾圈网页即时翻译系统及方法主要是通过用 户勾圈截屏模块、字符识别模块、双语翻译模块及翻译结果显示模块的一 连串功能,实现对网页浏览器视窗中所勾出的网页段落进行即时翻译;同 时,由于本系统独立运行于任何网页浏览器,因此,即使用户采用不同操 作系统平台下的不同网页浏览器,査看用不同编程语言所编写的不同格式 的网页,也都不会对本系统的功能造成任何影响。再者,本系统完全独立, 不依赖于任何别的软件系统和网络资源,用户无需借助任何别的翻译工 具,例如在线词典或在线翻译网站,也无需人工手动键入单词或者段落, 只需直接用鼠标勾圈截取网页段落即可方便快捷完成翻译。最后看到的翻 译结果是显示在一个独立的翻译结果视窗中,实现了原文和译文的对照显 示,该翻译结果视窗不会覆盖和影响用户正在浏览的网页,可以随时被用 户保存或关闭。上述技术实施及操作仅为示例性说明本发明的原理及功效,而非用 于限制本发明。其中的各项细节亦可启发不同技术观点与应用,在不背离 本发明的精神及范畴下进行各种修饰与变更,但这一切均属于本发明之保护范围。ii
权利要求
1、一种用户勾圈网页即时翻译系统,该系统应用于各类电脑设备、嵌入式系统、便携式系统、系统芯片、手机设备或移动电子装置的网页在线浏览翻译,用以对网页中被随意勾圈的网页段落进行截取处理并即时翻译,其特征是,该系统包括依次通讯连接的以下模块设定模块(10)供用户设置指定的快捷热键,以呼叫及快速操作本翻译系统;勾圈截屏模块(12)用以在用户勾圈网页内容后自动截取网页中的指定段落;字符识别模块(14)负责识别处理所截取段落中的文字信息和剔除非文字信息;双语翻译模块(16)负责将识别处理过的文字信息进行即时翻译,获得表示成目标语言的翻译结果;翻译结果显示模块(17)用以将翻译结果显示于一个独立的视窗中,不影响用户原本在线浏览的网页视窗,从而能让原文和译文互相对照显示。
2、 根据权利要求1所述的用户勾圈网页即时翻译系统,其特征是, 还包括与双语翻译模块(16)通讯连接的翻译数据库(15)。
3. —种采用权利要求1所述用户勾圈网页即时翻译系统的翻译方法,其特征是包括以下步骤 、 开启本系统,通过设定模块(10)设定快捷热键; 、 等待并判断是否接收到用户设置指定的快捷热键发出的触发指 、 勾圈截屏模块(12)接收到快捷热键发出的触发指令,打开截屏 界面;s23、 在网页上所选的虚线矩形框上双击鼠标左键,选择所需要翻译的段落;<s24、 将所选择的段落保存为图片;<s25、 调整所保存图片的图像属性,包括图片的灰度、饱和度以及亮 度,并把源图片转为黑白二进制格式保存;s26、 通过字符识别模块(14)用模式识别算法,识别源图片中的文字,保存于一个文件中;s27、将步骤S26所获得的文件传送至双语翻译模块(16)进行即时翻译;s28、 将步骤S26所获得的网页段落翻译数据显示在独立的翻译结果 显示模块(17)的视窗中;s29、 结束本次勾圈翻译。
全文摘要
本发明公开了一种用户勾圈网页即时翻译系统及方法,该系统包括设定模块、勾圈截屏模块、字符识别模块、双语翻译模块及翻译结果显示模块,设定模块供用户设置指定的快捷热键;勾圈截屏模块用以在用户勾圈网页内容后自动截取网页中的指定段落;字符识别模块负责识别处理所截取段落中的文字信息和剔除非文字信息;双语翻译模块负责将识别处理过的文字信息进行即时翻译;翻译结果显示模块用以将翻译结果显示于一个独立的视窗中。它不受限于网页的内部设计格式和开发语言,也不受限于网页外部的表现风格和动画色彩,彻底克服其他在线翻译系统严重受限于网页内部结构的致命缺点,能让用户将网上浏览到的源语言网页的任何内容自如翻译到目标语言来阅读。
文档编号G06F17/28GK101576878SQ20091004030
公开日2009年11月11日 申请日期2009年6月17日 优先权日2009年6月17日
发明者董名垂, 费晓磊 申请人:董名垂
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1