一种进行网页数据翻译的方法、装置和浏览器客户端的制作方法

文档序号:6640350阅读:365来源:国知局
一种进行网页数据翻译的方法、装置和浏览器客户端的制作方法
【专利摘要】本发明提供一种浏览器客户端进行网页数据翻译的方法、装置和浏览器客户端,其中该方法包括:在浏览器客户端加载显示第一网页页面;识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据;触发将第一语言文本数据翻译为第二语言文本数据的请求;将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。
【专利说明】一种进行网页数据翻译的方法、装置和浏览器客户端

【技术领域】
[0001]本发明属于浏览器【技术领域】,尤其涉及一种浏览器客户端进行网页数据翻译的方法、装置和浏览器客户端。

【背景技术】
[0002]在互联网技术中,通过浏览器访问是一种最常见的有效获取各种信息和数据的方式。浏览器主要通过HTTP协议与网页服务器交互并获取网页,一个网页中可以包括多个文档,每个文档都是分别从服务器获取得到的。大部分的浏览器本身支持除了 HTML之外的广泛的格式,例如JPEG、PNG、GIF等图像格式,并且能够扩展支持众多的插件(plug-1ns)。另夕卜,许多浏览器还支持其他的URL类型及其相应的协议,如FTP、Gopher、HTTPS (HTTP协议的加密版本)。HTTP内容类型和URL协议规范允许网页设计者在网页中嵌入图像、动画、视频、声音、流媒体等。
[0003]现有技术中,很多浏览器都内置了自动翻译的功能,当浏览器浏览外文网站或浏览器加载的页面中有外文的时候,浏览器会自动弹出询问“是否将网页翻译成中文”等提示,如果用户点击确认,则可以一键实现网页快速翻译的功能,这对于经常上外文网站的人来说非常方便。
[0004]但是,浏览器加载的页面往往类型多样,网页中很可能既有中文又有外文,但是浏览器的自动翻译不会对当前页面进行分析判断是否需要进行翻译。例如,一个中文网站中包含了个别的英文单词或外来语,这时就不需要翻译。由此可知,现有的浏览器提供的自动翻译功能还不够智能化,不能够满足用户的多元化需求。


【发明内容】

[0005]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的本发明的主要目的在于提供一种浏览器客户端进行网页数据翻译的方法、装置和浏览器客户端。
[0006]依据本发明的一个方面,提供一种浏览器客户端进行网页数据翻译的方法,包括:在浏览器客户端加载显示第一网页页面;识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据;触发将第一语言文本数据翻译为第二语言文本数据的请求;将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。
[0007]其中,所述识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据的步骤,还包括:获取网页数据信息并依据网页数据信息进行是否是第一语言文本数据的判断,其中所述网页数据信息包括:标题信息、编码数据信息、内容信息。
[0008]其中,还包括:获取页面的标题信息,如果该标题信息中包含有第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0009]其中,还包括:获取页面的编码数据信息,如果该编码数据信息为第一编码数据信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0010]其中,还包括:获取页面的内容信息,如果该内容信息中包含有预定数量和/或比例的第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0011]其中,还包括:在浏览器客户端获取到网页数据后或者进行渲染加载完毕后,进行是否是第一语言文本数据的判断;并在确定是要进行翻译时,弹窗提示出可选择翻译的语言文本。
[0012]其中,在触发将第一语言文本数据翻译为第二语言文本数据的请求后,还包括:由浏览器向当前页面中注入JS脚本,由该JS脚本进行分词以及对应的翻译请求的发起并获取对应分词的翻译结果,并由浏览器客户端依据翻译结果进行重新的渲染加载。
[0013]其中,还包括:对于网页文本进行预先语义分析后得出编号和分词的映射表对应,依据所述编号和分词以及翻译的目标语种进行翻译服务器端的翻译后,形成对应的翻译映射表;按照所述翻译映射表,对所述第一语言文本数据进行分词处理。
[0014]其中,还包括:提取搜索资源中网页内容的文本信息;依据网页内容类别划分所述第一语言文本数据所属类别;按照所述第一语言文本数据所属类别对应的分词词典,对所述第一语言文本数据进行分词处理。
[0015]其中,还包括:获取鼠标指针在当前页面中悬停的位置信息,如果在鼠标指针的位置信息对应的位置为加载的第一语言文本数据,则屏幕提示该第一语言文本数据对应的第二语言文本数据。
[0016]依据本发明的另一方面,提供一种浏览器客户端,包括:界面组件,其配置为所述浏览器客户端绘制交互界面,接收输入和/或输出显示与用户交互用的信息;网络组件,其配置为通过界面组件触发发起的网络请求;浏览器内核组件,其配置为处理网络组件触发发起的网络请求,解析渲染后形成网页显示用窗口中可加载显示的网页数据;所述浏览器内核组件进一步包括:加载模组,用于在浏览器客户端加载显示第一网页页面;识别模组,用于识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据;触发请求模组,用于触发将第一语言文本数据翻译为第二语言文本数据的请求;分词处理模组,用于将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;翻译替换模组,用于接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。
[0017]其中,所述识别模组还用于,获取网页数据信息并依据网页数据信息进行是否是第一语言文本数据的判断,其中所述网页数据信息包括:标题信息、编码数据信息、内容信肩、O
[0018]其中,所述识别模组还用于,获取页面的标题信息,如果该标题信息中包含有第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0019]其中,所述识别模组还用于,获取页面的编码数据信息,如果该编码数据信息为第一编码数据信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0020]其中,所述识别模组还用于,获取页面的内容信息,如果该内容信息中包含有预定数量和/或比例的第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0021]其中,所述触发请求模组还用于,在确定是要进行翻译时,弹窗提示出可选择翻译的语言文本。
[0022]其中,所述分词处理模组还用于,由浏览器向当前页面中注入JS脚本,由该JS脚本进行分词以及对应的翻译请求的发起并获取对应分词的翻译结果,并由浏览器客户端依据翻译结果进行重新的渲染加载。
[0023]其中,所述分词处理模组还用于,对于网页文本进行预先语义分析后得出编号和分词的映射表对应,依据所述编号和分词以及翻译的目标语种进行翻译服务器端的翻译后,形成对应的翻译映射表;按照所述翻译映射表,对所述第一语言文本数据进行分词处理。
[0024]其中,所述分词处理模组还用于,提取搜索资源中网页内容的文本信息;依据网页内容类别划分所述第一语言文本数据所属类别;按照所述第一语言文本数据所属类别对应的分词词典,对所述第一语言文本数据进行分词处理。
[0025]其中,所述翻译替换模组还用于,获取鼠标指针在当前页面中悬停的位置信息,如果在鼠标指针的位置信息对应的位置为加载的第一语言文本数据,则屏幕提示该第一语言文本数据对应的第二语言文本数据。
[0026]依据本发明的再一方面,提供一种进行网页数据翻译的装置,包括:处理器,该处理器中加载运行有加载模组、识别模组、触发请求模组、分词处理模组、翻译替换模组,其中:加载模组,用于在浏览器客户端加载显示第一网页页面;识别模组,用于识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据;触发请求模组,用于触发将第一语言文本数据翻译为第二语言文本数据的请求;分词处理模组,用于将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;翻译替换模组,用于接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。
[0027]其中,所述识别模组还用于,获取网页数据信息并依据网页数据信息进行是否是第一语言文本数据的判断,其中所述网页数据信息包括:标题信息、编码数据信息、内容信肩、O
[0028]其中,所述识别模组还用于,获取页面的标题信息,如果该标题信息中包含有第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0029]其中,所述识别模组还用于,获取页面的编码数据信息,如果该编码数据信息为第一编码数据信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0030]其中,所述识别模组还用于,获取页面的内容信息,如果该内容信息中包含有预定数量和/或比例的第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0031]其中,所述触发请求模组还用于,在确定是要进行翻译时,弹窗提示出可选择翻译的语言文本。
[0032]其中,所述分词处理模组还用于,由浏览器向当前页面中注入JS脚本,由该JS脚本进行分词以及对应的翻译请求的发起并获取对应分词的翻译结果,并由浏览器客户端依据翻译结果进行重新的渲染加载。
[0033]其中,所述分词处理模组还用于,对于网页文本进行预先语义分析后得出编号和分词的映射表对应,依据所述编号和分词以及翻译的目标语种进行翻译服务器端的翻译后,形成对应的翻译映射表;按照所述翻译映射表,对所述第一语言文本数据进行分词处理。
[0034]其中,所述分词处理模组还用于,提取搜索资源中网页内容的文本信息;依据网页内容类别划分所述第一语言文本数据所属类别;按照所述第一语言文本数据所属类别对应的分词词典,对所述第一语言文本数据进行分词处理。
[0035]其中,所述翻译替换模组还用于,获取鼠标指针在当前页面中悬停的位置信息,如果在鼠标指针的位置信息对应的位置为加载的第一语言文本数据,则屏幕提示该第一语言文本数据对应的第二语言文本数据。
[0036]根据本发明的技术方案,通过识别到浏览器客户端加载显示的网页页面中的文本数据为可进行翻译操作的第一语言文本数据,将所述第一语言文本数据进行分词后发送到翻译服务器以便翻译为对应的第二语言文本数据的分词,接收并替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词,从而实现浏览器客户端的自动化的智能化翻译。

【专利附图】

【附图说明】
[0037]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0038]图1是根据本发明实施例的进行网页数据翻译的方法的流程图;
[0039]图2是根据本发明实施例的基于网页内容类别进行分词处理的流程图;
[0040]图3是根据本发明实施例的进行网页数据翻译的装置的结构框图;
[0041]图4是根据本发明实施例的浏览器客户端的结构框图。

【具体实施方式】
[0042]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0043]根据本发明实施例,提供一种浏览器客户端进行网页数据翻译的方法,应用于具有客户端浏览器的各种客户端,该客户端例如可以为Web浏览器客户端。需要说明的是,上述客户端是指与服务器相对应,安装在终端上为用户提供服务的应用程序,如,安装在计算机终端或智能手机终端上的应用程序。
[0044]图1是根据本发明一个实施例的进行网页数据翻译的方法的流程图。如图1所示,进行网页数据翻译的方法包括:
[0045]步骤S102,在浏览器客户端加载显示第一网页页面。
[0046]步骤S104,识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据;
[0047]首选,获取到浏览器客户端加载显示或者渲染加载完毕的第一网页页面中的网页数据信息,其中所述网页数据信息包括但不限于:标题信息、编码数据信息、内容信息等。然后,依据网页数据信息判断第一网页页面中的文本数据是否为第一语言文本数据。具体地,包括如下实现方式:
[0048](I)、获取页面的标题信息(Title),如果该标题信息中包含有第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0049](2)、获取页面的编码数据信息,如果该编码数据信息为第一编码数据信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0050]例如,如果该编码数据信息为GB2312,则确定第一网页页面中文本数据为中文,可将中文文本翻译为英文文本。
[0051](3)、获取页面的内容信息(Page Info),如果该内容信息中包含有预定数量和/或比例的第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0052]例如,预先设定页面的内容信息中包含的第一语言文本信息的阈值,如果第一语言文本信息的数量和/或比例超过该阈值,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0053]步骤S106,触发将第一语言文本数据翻译为第二语言文本数据的请求;
[0054]其中,在确定是要进行翻译时,弹窗提示出可选择翻译的语言文本,可选择翻译的语言文本包括但不限于:第二语言文本、第三语言文本或第四语言文本等。一般地,浏览器默认的是将中英文进行互译。
[0055]步骤S108,将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;
[0056]在实际应用中,可以对于网页文本进行预先语义分析后得出编号和分词的映射表对应,依据所述编号和分词以及翻译的目标语种进行服务器端的翻译后,形成对应的翻译映射表,然后按照所述翻译映射表,对所述第一语言文本数据进行分词处理。
[0057]下面结合图2详细描述进行分词处理的细节。图2是根据本发明实施例的基于网页内容类别进行分词处理的方法实施例的步骤流程图,可以包括如下步骤(S202-S206):
[0058]步骤S202,提取搜索资源中网页内容的文本信息;
[0059]步骤S204,依据网页内容类别划分所述第一语言文本数据所属类别;
[0060]在一种情形中,可以基于网页的网址获得网页类别,再依据网页类别划分文本信息所属类别。例如,动漫领域的网页网址一般带有“comic”标识的域名,体育领域的网页网址一般带有“sports”标识的域名,如comic.XXX.com, sports.XXX.com,在网页网址中检测出“comic”或“sports”标识的域名时,则可以识别出该网页类别为动漫领域或体育领域,继而可以将文本信息划分为动漫领域或体育领域。
[0061]在又一种情形中,访问的网页通常带有标签(tag)信息,可以基于标签信息获得网页类别,再依据网页类别划分文本信息所属类别。例如,某网页带有视频、电影、喜剧电影等标签信息,则可以识别出该网页类别为电影领域,继而将文本信息划分为电影领域。
[0062]再一种情况中,可以分析网页内容标题(topic)中特定词获知网页类别,比如标题中含有篮球、足球、NBA或世界杯等特定词可知是体育领域。
[0063]需要说明,以上举例仅为示例性说明,并不限制本发明的保护范围,网页内容类别还可以包括其他的形式,此处不再赘述。
[0064]步骤S206,按照所述第一语言文本数据所属类别对应的分词词典,对所述第一语言文本数据进行分词处理。
[0065]在具体实现中,每一个类别都可以对应有一个特定的分词词典,以对文本信息进行合乎该类别语言特点的分词。
[0066]步骤S110,接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。
[0067]具体地,可以由浏览器向当前页面中注入JS脚本,由该JS脚本进行分词以及对应的翻译请求的发起并获取对应分词的翻译结果,并由浏览器客户端依据翻译结果进行重新的渲染加载。
[0068]此外,在本发明的部分实施例中,浏览器在获取到网页数据后或者进行渲染加载完毕后,还可以进行屏幕取词翻译或鼠标划词翻译。具体地,获取鼠标指针在当前页面中悬停的位置信息,如果在鼠标指针的位置信息对应的位置为加载的第一语言文本数据,则屏幕提示该第一语言文本数据对应的第二语言文本数据。
[0069]根据本发明的实施例,还提供一种进行网页数据翻译的装置。
[0070]参考图3,是根据本发明一个实施例的进行网页数据翻译的装置的结构框图,如图3所示,所述进行网页数据翻译的装置300包括有一处理器,该处理器中加载运行有加载模组310、识别模组320、触发请求模组330、分词处理模组340、翻译替换模组350,下面详细描述各模组的结构和功能。
[0071]加载模组310,用于在浏览器客户端加载显示第一网页页面;
[0072]识别模组320,用于识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据;
[0073]触发请求模组330,用于触发将第一语言文本数据翻译为第二语言文本数据的请求;进一步地,所述触发请求模组330还用于,在确定是要进行翻译时,弹窗提示出可选择翻译的语言文本。
[0074]分词处理模组340,用于将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;
[0075]翻译替换模组350,用于接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。
[0076]进一步地,所述识别模组320还用于,获取网页数据信息并依据网页数据信息进行是否是第一语言文本数据的判断,其中所述网页数据信息包括:标题信息、编码数据信息、内容信息。
[0077]具体地,所述识别模组320还用于以下的处理:
[0078](I)获取页面的标题信息,如果该标题信息中包含有第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0079](2)获取页面的编码数据信息,如果该编码数据信息为第一编码数据信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0080](3)获取页面的内容信息,如果该内容信息中包含有预定数量和/或比例的第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0081]进一步地,所述分词处理模组340还用于,由浏览器向当前页面中注入JS脚本,由该JS脚本进行分词以及对应的翻译请求的发起并获取对应分词的翻译结果,并由浏览器客户端依据翻译结果进行重新的渲染加载。
[0082]进一步地,所述分词处理模组340还用于,对于网页文本进行预先语义分析后得出编号和分词的映射表对应,依据所述编号和分词以及翻译的目标语种进行翻译服务器端的翻译后,形成对应的翻译映射表;按照所述翻译映射表,对所述第一语言文本数据进行分词处理。
[0083]进一步地,所述分词处理模组340还用于,提取搜索资源中网页内容的文本信息;依据网页内容类别划分所述第一语言文本数据所属类别;按照所述第一语言文本数据所属类别对应的分词词典,对所述第一语言文本数据进行分词处理。
[0084]进一步地,所述翻译替换模组350还用于,获取鼠标指针在当前页面中悬停的位置信息,如果在鼠标指针的位置信息对应的位置为加载的第一语言文本数据,则屏幕提示该第一语言文本数据对应的第二语言文本数据。
[0085]以上描述的装置与之前描述的进行网页数据翻译的方法的处理是对应的,因此,关于更详细的技术细节,可以参见之前描述的方法。
[0086]根据本发明的实施例,还提供了一种浏览器客户端。
[0087]参考图4,是根据本发明实施例的浏览器客户端的结构框图,如图4所示,所述浏览器客户端400至少包括:界面组件410、网络组件420、浏览器内核组件430。
[0088]其中,界面组件410,其配置为所述浏览器客户端绘制交互界面,接收输入和/或输出显示与用户交互用的信息;网络组件420,其配置为通过界面组件触发发起的网络请求;浏览器内核组件430,其配置为处理网络组件触发发起的网络请求,解析渲染后形成网页显示用窗口中可加载显示的网页数据。
[0089]所述浏览器内核组件430进一步包括:
[0090]加载模组431,用于在浏览器客户端加载显示第一网页页面;
[0091]识别模组432,用于识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据;
[0092]触发请求模组433,用于触发将第一语言文本数据翻译为第二语言文本数据的请求;
[0093]分词处理模组434,用于将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;
[0094]翻译替换模组435,用于接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。
[0095]进一步地,所述识别模组432还用于,获取网页数据信息并依据网页数据信息进行是否是第一语言文本数据的判断,其中所述网页数据信息包括:标题信息、编码数据信息、内容信息。
[0096]具体地,所述识别模组320还用于以下的处理:
[0097]获取页面的标题信息,如果该标题信息中包含有第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0098]获取页面的编码数据信息,如果该编码数据信息为第一编码数据信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0099]获取页面的内容信息,如果该内容信息中包含有预定数量和/或比例的第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
[0100]进一步地,所述触发请求模组433还用于,在确定是要进行翻译时,弹窗提示出可选择翻译的语言文本。
[0101]进一步地,所述分词处理模组434还用于,由浏览器向当前页面中注入JS脚本,由该JS脚本进行分词以及对应的翻译请求的发起并获取对应分词的翻译结果,并由浏览器客户端依据翻译结果进行重新的渲染加载。
[0102]进一步地,所述分词处理模组434还用于,对于网页文本进行预先语义分析后得出编号和分词的映射表对应,依据所述编号和分词以及翻译的目标语种进行翻译服务器端的翻译后,形成对应的翻译映射表;按照所述翻译映射表,对所述第一语言文本数据进行分词处理。
[0103]进一步地,所述分词处理模组434还用于,提取搜索资源中网页内容的文本信息;依据网页内容类别划分所述第一语言文本数据所属类别;按照所述第一语言文本数据所属类别对应的分词词典,对所述第一语言文本数据进行分词处理。
[0104]进一步地,所述翻译替换模组435还用于,获取鼠标指针在当前页面中悬停的位置信息,如果在鼠标指针的位置信息对应的位置为加载的第一语言文本数据,则屏幕提示该第一语言文本数据对应的第二语言文本数据。
[0105]以上描述的浏览器客户端与之前描述的进行网页数据翻译的方法的处理是对应的,因此,关于更详细的技术细节,可以参见之前描述的方法。
[0106]综上所述,根据本发明的上述技术方案,通过识别到浏览器客户端加载显示的网页页面中的文本数据为可进行翻译操作的第一语言文本数据,将所述第一语言文本数据进行分词后发送到翻译服务器以便翻译为对应的第二语言文本数据的分词,接收并替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词,从而实现浏览器客户端的自动化的智能化翻译。
[0107]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0108]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0109]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0110]本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0111]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0112]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的进行网页数据翻译的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0113]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0114]本发明的实施例揭示了 Al、一种浏览器客户端进行网页数据翻译的方法,包括:在浏览器客户端加载显示第一网页页面;识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据;触发将第一语言文本数据翻译为第二语言文本数据的请求;将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。A2、根据Al所述的方法,其中,所述识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据的步骤,还包括:获取网页数据信息并依据网页数据信息进行是否是第一语言文本数据的判断,其中所述网页数据信息包括:标题信息、编码数据信息、内容信息。A3、根据A2所述的方法,其中,还包括:获取页面的标题信息,如果该标题信息中包含有第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。A4、根据A2所述的方法,其中,还包括:获取页面的编码数据信息,如果该编码数据信息为第一编码数据信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。A5、根据A2所述的方法,其中,还包括:获取页面的内容信息,如果该内容信息中包含有预定数量和/或比例的第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。A6、根据Al所述的方法,其中,还包括:在浏览器客户端获取到网页数据后或者进行渲染加载完毕后,进行是否是第一语言文本数据的判断;并在确定是要进行翻译时,弹窗提示出可选择翻译的语言文本。A7、根据Al所述的方法,其中,在触发将第一语言文本数据翻译为第二语言文本数据的请求后,还包括:由浏览器向当前页面中注入JS脚本,由该JS脚本进行分词以及对应的翻译请求的发起并获取对应分词的翻译结果,并由浏览器客户端依据翻译结果进行重新的渲染加载。AS、根据Al所述的方法,其中,还包括:对于网页文本进行预先语义分析后得出编号和分词的映射表对应,依据所述编号和分词以及翻译的目标语种进行翻译服务器端的翻译后,形成对应的翻译映射表;按照所述翻译映射表,对所述第一语言文本数据进行分词处理。A9、根据AS所述的方法,其中,还包括:提取搜索资源中网页内容的文本信息;依据网页内容类别划分所述第一语言文本数据所属类别;按照所述第一语言文本数据所属类别对应的分词词典,对所述第一语言文本数据进行分词处理。A10、根据Al所述的方法,其中,还包括:获取鼠标指针在当前页面中悬停的位置信息,如果在鼠标指针的位置信息对应的位置为加载的第一语言文本数据,则屏幕提示该第一语言文本数据对应的第二语言文本数据。
[0115]本发明实施例揭示了 B11、一种浏览器客户端,包括:界面组件,其配置为所述浏览器客户端绘制交互界面,接收输入和/或输出显示与用户交互用的信息;网络组件,其配置为通过界面组件触发发起的网络请求;浏览器内核组件,其配置为处理网络组件触发发起的网络请求,解析渲染后形成网页显示用窗口中可加载显示的网页数据;所述浏览器内核组件进一步包括:加载模组,用于在浏览器客户端加载显示第一网页页面;识别模组,用于识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据;触发请求模组,用于触发将第一语言文本数据翻译为第二语言文本数据的请求;分词处理模组,用于将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;翻译替换模组,用于接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。B12、根据Bll所述的浏览器客户端,其中,所述识别模组还用于,获取网页数据信息并依据网页数据信息进行是否是第一语言文本数据的判断,其中所述网页数据信息包括:标题信息、编码数据信息、内容信息。B13、根据B12所述的浏览器客户端,其中,所述识别模组还用于,获取页面的标题信息,如果该标题信息中包含有第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。B14、根据B12所述的浏览器客户端,其中,所述识别模组还用于,获取页面的编码数据信息,如果该编码数据信息为第一编码数据信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。B15、根据B12所述的浏览器客户端,其中,所述识别模组还用于,获取页面的内容信息,如果该内容信息中包含有预定数量和/或比例的第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。B16、根据Bll所述的浏览器客户端,其中,所述触发请求模组还用于,在确定是要进行翻译时,弹窗提示出可选择翻译的语言文本。B17、根据Bll所述的浏览器客户端,其中,所述分词处理模组还用于,由浏览器向当前页面中注入JS脚本,由该JS脚本进行分词以及对应的翻译请求的发起并获取对应分词的翻译结果,并由浏览器客户端依据翻译结果进行重新的渲染加载。B18、根据Bll所述的浏览器客户端,其中,所述分词处理模组还用于,对于网页文本进行预先语义分析后得出编号和分词的映射表对应,依据所述编号和分词以及翻译的目标语种进行翻译服务器端的翻译后,形成对应的翻译映射表;按照所述翻译映射表,对所述第一语言文本数据进行分词处理。B19、根据B18所述的浏览器客户端,其中,所述分词处理模组还用于,提取搜索资源中网页内容的文本信息;依据网页内容类别划分所述第一语言文本数据所属类别;按照所述第一语言文本数据所属类别对应的分词词典,对所述第一语言文本数据进行分词处理。B20、根据Bll所述的浏览器客户端,其中,所述翻译替换模组还用于,获取鼠标指针在当前页面中悬停的位置信息,如果在鼠标指针的位置信息对应的位置为加载的第一语言文本数据,则屏幕提示该第一语言文本数据对应的第二语言文本数据。
[0116]本发明实施例揭示了 C21、一种进行网页数据翻译的装置,包括:处理器,该处理器中加载运行有加载模组、识别模组、触发请求模组、分词处理模组、翻译替换模组,其中:加载模组,用于在浏览器客户端加载显示第一网页页面;识别模组,用于识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据;触发请求模组,用于触发将第一语言文本数据翻译为第二语言文本数据的请求;分词处理模组,用于将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;翻译替换模组,用于接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。C22、根据C21所述的装置,其中,所述识别模组还用于,获取网页数据信息并依据网页数据信息进行是否是第一语言文本数据的判断,其中所述网页数据信息包括:标题信息、编码数据信息、内容信息。C23、根据C22所述的装置,其中,所述识别模组还用于,获取页面的标题信息,如果该标题信息中包含有第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。C24、根据C22所述的装置,其中,所述识别模组还用于,获取页面的编码数据信息,如果该编码数据信息为第一编码数据信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。C25、根据C22所述的装置,其中,所述识别模组还用于,获取页面的内容信息,如果该内容信息中包含有预定数量和/或比例的第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。C26、根据C21所述的装置,其中,所述触发请求模组还用于,在确定是要进行翻译时,弹窗提示出可选择翻译的语言文本。C27、根据C21所述的装置,其中,所述分词处理模组还用于,由浏览器向当前页面中注入JS脚本,由该JS脚本进行分词以及对应的翻译请求的发起并获取对应分词的翻译结果,并由浏览器客户端依据翻译结果进行重新的渲染加载。C28、根据C21所述的装置,其中,所述分词处理模组还用于,对于网页文本进行预先语义分析后得出编号和分词的映射表对应,依据所述编号和分词以及翻译的目标语种进行翻译服务器端的翻译后,形成对应的翻译映射表;按照所述翻译映射表,对所述第一语言文本数据进行分词处理。C29、根据C28所述的装置,其中,所述分词处理模组还用于,提取搜索资源中网页内容的文本信息;依据网页内容类别划分所述第一语言文本数据所属类别;按照所述第一语言文本数据所属类别对应的分词词典,对所述第一语言文本数据进行分词处理。C30、根据C21所述的装置,其中,所述翻译替换模组还用于,获取鼠标指针在当前页面中悬停的位置信息,如果在鼠标指针的位置信息对应的位置为加载的第一语言文本数据,则屏幕提示该第一语言文本数据对应的第二语言文本数据。
【权利要求】
1.一种浏览器客户端进行网页数据翻译的方法,包括: 在浏览器客户端加载显示第一网页页面; 识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据; 触发将第一语言文本数据翻译为第二语言文本数据的请求; 将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词; 接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。
2.根据权利要求1所述的方法,其中,所述识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据的步骤,还包括: 获取网页数据信息并依据网页数据信息进行是否是第一语言文本数据的判断,其中所述网页数据信息包括:标题信息、编码数据信息、内容信息。
3.根据权利要求2所述的方法,其中,还包括: 获取页面的标题信息,如果该标题信息中包含有第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
4.根据权利要求2所述的方法,其中,还包括: 获取页面的编码数据信息,如果该编码数据信息为第一编码数据信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
5.根据权利要求2所述的方法,其中,还包括: 获取页面的内容信息,如果该内容信息中包含有预定数量和/或比例的第一语言文本信息,则确定第一网页页面中文本数据为可进行翻译操作的第一语言文本数据。
6.根据权利要求1所述的方法,其中,还包括: 在浏览器客户端获取到网页数据后或者进行渲染加载完毕后,进行是否是第一语言文本数据的判断;并在确定是要进行翻译时,弹窗提示出可选择翻译的语言文本。
7.根据权利要求1所述的方法,其中,在触发将第一语言文本数据翻译为第二语言文本数据的请求后,还包括: 由浏览器向当前页面中注入JS脚本,由该JS脚本进行分词以及对应的翻译请求的发起并获取对应分词的翻译结果,并由浏览器客户端依据翻译结果进行重新的渲染加载。
8.根据权利要求1所述的方法,其中,还包括: 对于网页文本进行预先语义分析后得出编号和分词的映射表对应,依据所述编号和分词以及翻译的目标语种进行翻译服务器端的翻译后,形成对应的翻译映射表; 按照所述翻译映射表,对所述第一语言文本数据进行分词处理。
9.一种浏览器客户端,包括: 界面组件,其配置为所述浏览器客户端绘制交互界面,接收输入和/或输出显示与用户交互用的信息; 网络组件,其配置为通过界面组件触发发起的网络请求; 浏览器内核组件,其配置为处理网络组件触发发起的网络请求,解析渲染后形成网页显示用窗口中可加载显示的网页数据; 所述浏览器内核组件进一步包括: 加载模组,用于在浏览器客户端加载显示第一网页页面; 识别模组,用于识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据; 触发请求模组,用于触发将第一语言文本数据翻译为第二语言文本数据的请求;分词处理模组,用于将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;翻译替换模组,用于接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。
10.一种进行网页数据翻译的装置,包括: 处理器,该处理器中加载运行有加载模组、识别模组、触发请求模组、分词处理模组、翻译替换模组,其中: 加载模组,用于在浏览器客户端加载显示第一网页页面; 识别模组,用于识别到第一网页页面中文本数据为可进行翻译操作的第一语言文本数据; 触发请求模组,用于触发将第一语言文本数据翻译为第二语言文本数据的请求;分词处理模组,用于将所述第一语言文本数据进行分词后,发送第一语言文本数据的分词到与浏览器客户端对应的翻译服务器以便翻译为对应的第二语言文本数据的分词;翻译替换模组,用于接收所述翻译服务器返回的第二语言文本数据的分词,并对应地替换第一网页页面中的第一语言本文数据的分词为第二语言文本数据的分词。
【文档编号】G06F17/28GK104462074SQ201410835068
【公开日】2015年3月25日 申请日期:2014年12月26日 优先权日:2014年12月26日
【发明者】尹青建, 高寒蕊, 马远真 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1