一种页面文本信息的翻译方法及系统与流程

文档序号:15736886发布日期:2018-10-23 21:38阅读:189来源:国知局

本发明涉及翻译技术领域,尤其涉及一种页面文本信息的翻译方法及系统。



背景技术:

随着互联网技术的快速发展,人们的工作和生活越来越依赖互联网信息平台,由于世界上存在多民族多语言,则人们在阅读非母语网页时,可能会遇到语言障碍,翻译技术给人们带来了很大的便利。

翻译是使用计算机实现从一种语言信息转变成另一种语言信息的行为,现有针对页面文本信息的翻译方案,一般是用户需要对当前页面中如文本信息进行翻译时,用户需要另外打开翻译软件或者词典网站进行手动翻译,无法实现自动化翻译,操作繁琐,翻译效率较低。



技术实现要素:

本发明提供一种页面文本信息的翻译方法及系统,用以解决现有技术中用户需要对当前页面中如文本信息进行翻译时,用户需要另外打开翻译软件或者词典网站进行手动翻译,无法实现自动化翻译,操作繁琐,翻译效率较低的技术问题。

为解决上述技术问题,本发明提供一种页面文本信息的翻译方法,包括:

检测页面是否存在需要翻译的文本信息。

检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息;

对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文。

其中,所述检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息,包括:

检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息。

其中,所述检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息,包括:

检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取当前页面文本信息与最近一次的页面文本信息的翻译时间的页面文本信息不相同的更新的文本信息,获取所述需要翻译的页面文本信息。

其中,所述对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文,包括:

根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文。

其中,所述根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文,包括:

根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,替换所述获取的需要翻译的页面文本信息中的关键语句,如果文本信息包括text类型信息,则过滤掉text中全部的html标签,将text分段并组成数组,如果文本信息包括html类型信息,则过滤掉影响翻译质量的标签包括<a>\<strong>\<u>,过滤掉非英文的字符,并加上相应标识标签包括<notrans>,读取html、dom类型信息并组成数组,如果文本信息包括连接类型信息,则取得html内容信息,翻译成预定的目标语言类型,如果文本信息包括text类型信息,则根据数组直接组成文章,如果文本信息包括html类型信息,则反遍历dom类型信息,将数据信息填回去,如果文本信息包括连接类型信息,按数据格式组成新的连接类型信息,提供所述需要翻译的页面文本信息的译文。

为解决上述技术问题,本发明还提供一种页面文本信息的翻译系统,包括:检测模块、获取模块、翻译模块;

所述检测模块,用于检测页面是否存在需要翻译的文本信息;

所述获取模块,用于根据所述检测模块检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息;

所述翻译模块,用于对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文。

其中,所述获取模块,用于根据所述检测模块检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息,包括:

所述获取模块,用于根据所述检测模块检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息。

其中,所述所述获取模块,用于根据所述检测模块检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息,包括:

所述获取模块,用于根据所述检测模块检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取当前页面文本信息与最近一次的页面文本信息的翻译时间的页面文本信息不相同的更新的文本信息,获取所述需要翻译的页面文本信息。

其中,所述翻译模块,用于对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文,包括:

所述翻译模块,用于根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文。

其中,所述翻译模块,用于根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文,包括:

所述翻译模块,用于根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,替换所述获取的需要翻译的页面文本信息中的关键语句,如果文本信息包括text类型信息,则过滤掉text中全部的html标签,将text分段并组成数组,如果文本信息包括html类型信息,则过滤掉影响翻译质量的标签包括

<a>\<strong>\<u>,过滤掉非英文的字符,并加上相应标识标签包括<notrans>,读取html、dom类型信息并组成数组,如果文本信息包括连接类型信息,则取得html内容信息,翻译成预定的目标语言类型,如果文本信息包括text类型信息,则根据数组直接组成文章,如果文本信息包括html类型信息,则反遍历dom类型信息,将数据信息填回去,如果文本信息包括连接类型信息,按数据格式组成新的连接类型信息,提供所述需要翻译的页面文本信息的译文。

本发明提供的页面文本信息的翻译方法,包括:检测页面是否存在需要翻译的文本信息,检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息,对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文,从而达到实现可将当前页面的文本信息进行自动化翻译,操作便捷,翻译效率较高。

本发明提供的页面文本信息的翻译系统,包括:检测模块、获取模块、翻译模块;检测模块,用于检测页面是否存在需要翻译的文本信息;获取模块,用于根据检测模块检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息;翻译模块,用于对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文;从而达到实现可将当前页面的文本信息进行自动化翻译,操作便捷,翻译效率较高。

附图说明

图1为本发明页面文本信息的翻译方法的流程示意图;

图2为本发明页面文本信息的翻译系统的结构示意图。

具体实施方式

下面结合附图和实施例,对本发明作进一步的详细描述。特别指出的是,以下实施例仅用于说明本发明,但不对本发明的范围进行限定。同样的,以下实施例仅为本发明的部分实施例而非全部实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

本发明提供一种页面文本信息的翻译方法。

请参见图1,图1为本发明页面文本信息的翻译方法的流程示意图,本发明页面文本信息的翻译方法,包括:

S101:检测页面是否存在需要翻译的文本信息。

S102:检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息。

S103:对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文。

其中,检测页面是否存在需要翻译的文本信息,包括:

检测页面文本信息最近的更新时间,检测页面是否存在需要翻译的文本信息。

其中,检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息,包括:

检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取该需要翻译的页面文本信息。

其中,检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取该需要翻译的页面文本信息,包括:

检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取当前页面文本信息与最近一次的页面文本信息的翻译时间的页面文本信息不相同的更新的文本信息,获取该需要翻译的页面文本信息。

其中,对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文,包括:

根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供该需要翻译的页面文本信息的译文。

其中,根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供该需要翻译的页面文本信息的译文,包括:

根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,替换该获取的需要翻译的页面文本信息中的关键语句,如果文本信息包括text类型信息,则过滤掉text中全部的html标签,将text分段并组成数组,如果文本信息包括html类型信息,则过滤掉影响翻译质量的标签包括<a>\<strong>\<u>等,过滤掉非英文的字符,并加上相应标识标签包括<notrans>等,读取html、dom类型信息并组成数组,如果文本信息包括连接类型信息,则取得html内容信息,翻译成预定的目标语言类型,如果文本信息包括text类型信息,则根据数组直接组成文章,如果文本信息包括html类型信息,则反遍历dom类型信息,将数据信息填回去,如果文本信息包括连接类型信息,按数据格式组成新的连接类型信息,提供该需要翻译的页面文本信息的译文。

本发明还提供一种页面文本信息的翻译系统。

请参见图2,图2为本发明页面文本信息的翻译系统的结构示意图,本发明页面文本信息的翻译系统,包括:检测模块201、获取模块202、翻译模块203。

检测模块201,用于检测页面是否存在需要翻译的文本信息。

获取模块202,用于根据检测模块201检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息。

翻译模块203,用于对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文。

其中,检测模块201,用于检测页面是否存在需要翻译的文本信息检测页面是否存在需要翻译的文本信息,包括:

检测模块201,用于检测页面是否存在需要翻译的文本信息检测页面文本信息最近的更新时间,检测页面是否存在需要翻译的文本信息。

其中,获取模块202,用于根据检测模块201检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息,包括:

获取模块202,用于根据检测模块201检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取该需要翻译的页面文本信息。

其中,获取模块202,用于根据检测模块201检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取该需要翻译的页面文本信息,包括:

获取模块202,用于根据检测模块201检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取当前页面文本信息与最近一次的页面文本信息的翻译时间的页面文本信息不相同的更新的文本信息,获取该需要翻译的页面文本信息。

其中,翻译模块203,用于对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文,包括:

翻译模块203,用于根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供该需要翻译的页面文本信息的译文。

其中,翻译模块203,用于根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供该需要翻译的页面文本信息的译文,包括:

翻译模块203,用于根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,替换该获取的需要翻译的页面文本信息中的关键语句,如果文本信息包括text类型信息,则过滤掉text中全部的html标签,将text分段并组成数组,如果文本信息包括html类型信息,则过滤掉影响翻译质量的标签包括<a>\<strong>\<u>等,过滤掉非英文的字符,并加上相应标识标签包括<notrans>等,读取html、dom类型信息并组成数组,如果文本信息包括连接类型信息,则取得html内容信息,翻译成预定的目标语言类型,如果文本信息包括text类型信息,则根据数组直接组成文章,如果文本信息包括html类型信息,则反遍历dom类型信息,将数据信息填回去,如果文本信息包括连接类型信息,按数据格式组成新的连接类型信息,提供该需要翻译的页面文本信息的译文。

本发明提供的页面文本信息的翻译方法,包括:检测页面是否存在需要翻译的文本信息,检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息,对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文,从而达到实现可将当前页面的文本信息进行自动化翻译,操作便捷,翻译效率较高。

本发明提供的页面文本信息的翻译系统,包括:检测模块、获取模块、翻译模块;检测模块,用于检测页面是否存在需要翻译的文本信息;获取模块,用于根据检测模块检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息;翻译模块,用于对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文;从而达到实现可将当前页面的文本信息进行自动化翻译,操作便捷,翻译效率较高。

本发明提供的页面文本信息的翻译方法及系统,包括:

读取第一方传入的参数,根据参数进行校验,如果不符合则返回相应错误;

根据订单号及是否强制翻译标记去缓存中取数据,如取到而又不强制翻译则返回缓存数据,否则向第二方发起翻译;

读取待翻译的内容,如果是text,则去掉所以的HTML标签,然后分段如可以设置每段内容不超过3000字节,然后循环向第二方翻译,第二方翻译返回翻译内容后合并内容,写入缓存数据表,以备第一方再次发起翻译时可取到缓存数据,也减轻了翻译的压力;

如果是一个http(s)的请求,先获取到html内容,然后对内容进行基本的过滤,例如过滤掉<a>连接及<strong><u>此类在翻译时可能引起翻译不通顺的标签;

对内容进一步过滤,对于非英文字符插入<notrans>标签,解释脚本认为该类标签不需要翻译;

解释脚本遍历html dom,将需要翻译的内容取出来,组成一个数组如可以设置每个数据内总字段不超过3000字节,然后多个数组循环向第二方发起翻译,第二方返回翻译结果后,再组成一个大的数组,然后用数据反遍历html dom,把数据填回去,然后再把翻译后的html数据存入数据库,完成翻译;

将翻译好的数据返回给第一方,第一方存入dbh如果来源是连接的形式,还需要提供一个落地URL以供第一方直接调用,连接采用orderId/idx/setNumber的形式提供,用以防止被第三方遍历抓取。

本发明提供的页面文本信息的翻译方法及系统,可以实现翻译交互展示,可以实现翻译过程的实现展示,可以实现翻译公告后提供防爬取的连接形式。

在本发明所提供的几个实施方式中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外,在本发明各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的部分实施例,并非因此限制本发明的保护范围,凡是利用本发明说明书及附图内容所作的等效装置或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1