基于图片化处理的网页展示方法及网页展示装置制造方法

文档序号:6505780阅读:127来源:国知局
基于图片化处理的网页展示方法及网页展示装置制造方法
【专利摘要】本申请公开了一种基于图片化处理的网页展示方法,该方法包括:对网页中需要基于图片化处理的文字信息进行预处理,设置显示框架并将所述文字信息分割为文字块;创建一图片生成该图片中每个文字块的位置描述将相应的文字块填充到所述图片中,保存图片并生成调用地址;将所述调用地址和各文字块的位置描述保存为所述网页的元数据;当接收到访问请求时,调用所述网页的元数据,根据调用地址加载所述图片,并根据位置描述从所述图片中拾取相应的文字块显示在所述网页中的相应显示位置。本申请解决了通过文字图片化方式在网络上公开的信息不容易被网络爬虫等工具爬取,但采用文字图片化又容易造成浏览器对含有多图片的页面展示速度过慢的问题。
【专利说明】基于图片化处理的网页展示方法及网页展示装置

【技术领域】
[0001]本申请涉及网络信息处理领域,具体地说,涉及一种基于图片化处理的网页展示方法及网页展示装置。

【背景技术】
[0002]在互联网络的时代,信息如同大海般没有边际。甚至我们获取信息的方法已经发生改变:从传统的翻书查字典,继而变成通过搜索引擎进行检索。我们从信息匮乏的时代一下子走到了信息极大丰富的今天。
[0003]在今天,困扰我们的问题不是信息太少,而是太多,信息多得让你无从分辨,无从选择。因此,很早现有技术中就提供一个能够自动在互联网上抓取数据,并可以自动分拣、分析。采用自动识别关键词技术,将你需要的信息从海量的信息中筛选出来。
[0004]对于现有技术中,所谓网页数据抓取,即通过网络爬虫等工具获取网页的数据,然后通过程序分析,将有用的数据提取分离出来。现有搜索引擎工作的一部分就是网页数据抽取。比如:编制程序抽取新浪网新闻频道里的这个新闻的标题就是一种网页数据抽取。
[0005]相反的现在很多公司都在防止自己的网上信息被别人所获取,即为了防止别的单位或个人通过网页数据抓取技术获得有未经授权的数据。例如:一些公司的产品部门发现自己公司的网站上认证的工商营业执照信息在某些网站上也有展示,推断是通过网络爬虫等工具爬取的,这种非法获取别人信息,没有取得授权人或权利人同意的情况下爬取的信息都是非法的。然而权利人为了公开其身份合法性又不得不公开这些信息在网络上。
[0006]因此,为避免在网络上公开信息被网络爬虫等工具爬取到,一些网站采取了将文字图片化的方式进行处理,来避免自己网站上的公开信息被网络爬虫等工具爬取到里面的内容。
[0007]然而,上述方式带来的一个缺点,就是当一个页面有非常多这类“文字图片”需要展示的时候,任何一款浏览器都需要发送很多http请求用来展示图片(每张图片一个请求),会非常影响页面展示的前端性能。
[0008]综上所述,如何解决目前通过文字图片化方式在网络上公开的信息不容易被网络爬虫等工具爬取,但同时采用文字图片化又容易造成浏览器对含有多图片的页面展示速度过慢,便成为亟待解决的技术问题。


【发明内容】

[0009]有鉴于此,本申请所要解决的技术问题是提供了一种基于图片化处理的网页展示方法及网页展示装置,以解决目前通过文字图片化方式在网络上公开的信息不容易被网络爬虫等工具爬取,但采用文字图片化又容易造成浏览器对含有多图片的页面展示速度过慢的问题。
[0010]为了解决上述技术问题,本申请公开了一种基于图片化处理的网页展示方法,包括:
[0011]对网页中需要基于图片化处理的文字信息进行预处理,其中,所述预处理,包括:设置显示框架并根据所述显示框架将所述文字信息分割为文字块;
[0012]创建一图片并生成所述图片中每个文字块的位置描述,根据所述位置描述将相应的文字块填充到所述图片中,保存填充后的图片并生成所述图片的调用地址;
[0013]将所述图片的调用地址和所述图片中每个文字块的位置描述对应地保存为所述网页的元数据;
[0014]当接收到所述网页的访问请求时,调用所述网页的元数据,根据所述网页的元数据中的调用地址加载所述图片,并根据所述网页的元数据中的位置描述从所述图片中拾取相应的文字块显示在所述网页中的相应显示位置。
[0015]进一步地,设置显示框架的操作,进一步包括:识别所述网页中文字信息的显示位置,并根据所述显示位置的宽度设定所述显示框架的最大行宽,所述显示框架的高度自适应地与所分割的文字信息的单行的行高匹配。
[0016]进一步地,所述预处理的操作中,分割得到的文字块的行宽小于等于所述最大行宽且所述文字块的高度等于所分割的文字信息的单行的行高。
[0017]进一步地,所述预处理,还包括:获取每个文字块中的文字样式,根据每个文字块中的文字样式计算每个文字块的尺寸,识别高度最高的文字块,选定所述文字块的高度的整数分之一为门限,根据所述门限及各个文字块的高度将各个文字块分组。
[0018]进一步地,所述预处理,还包括:结合每个文字块的尺寸和相应文字块的分组设置各个文字块的拼接组合,并根据所述拼接组合配置用于容纳所有文字块的图片的尺寸。
[0019]进一步地,创建一图片的操作,进一步包括:根据所配置的用于容纳所有文字块的图片的尺寸创建所述图片。
[0020]进一步地,生成所述图片中每个文字块的位置描述的操作,进一步包括:根据所述图片的尺寸、各个文字块的拼接组合和每个文字块的尺寸,定位每个文字块在所述图片中的边界,并根据每个文字块的边界生成每个文字块的位置描述。
[0021]进一步地,所述文字样式,包括以下一种或多种的组合:字体、字号、行高、是否粗体、是否斜体、颜色字体、背景颜色。
[0022]还公开了一种基于图片化处理的网页展示装置,包括:依次相连的文字处理模块、图片生成模块、存储控制模块和网页展示模块;其中,
[0023]所述文字处理模块,用于对网页中需要基于图片化处理的文字信息进行预处理,其中,所述预处理,包括:设置显示框架并根据所述显示框架将所述文字信息分割为文字块;
[0024]所述图片生成模块,用于创建一图片并生成所述图片中每个文字块的位置描述,根据所述位置描述将相应的文字块填充到所述图片中,保存填充后的图片并生成所述图片的调用地址;
[0025]所述存储控制模块,用于将所述图片的调用地址和所述图片中每个文字块的位置描述对应地保存为所述网页的元数据;
[0026]所述网页展示模块,用于当接收到所述网页的访问请求时,调用所述网页的元数据,根据所述网页的元数据中的调用地址加载所述图片,并根据所述网页的元数据中的位置描述从所述图片中拾取相应的文字块显示在所述网页中的相应显示位置。
[0027]进一步地,所述文字处理模块,进一步用于识别所述网页中文字信息的显示位置,并根据所述显示位置的宽度设定所述显示框架的最大行宽,所述显示框架的高度自适应地与所分割的文字信息的单行的行高匹配。
[0028]进一步地,所述文字处理模块,所分割得到的文字块的行宽小于等于所述最大行宽且所述文字块的高度等于所分割的文字信息的单行的行高。
[0029]进一步地,所述文字处理模块,还用于获取每个文字块中的文字样式,根据每个文字块中的文字样式计算每个文字块的尺寸,识别高度最高的文字块,选定所述文字块的高度的整数分之一为门限,根据所述门限及各个文字块的高度将各个文字块分组。
[0030]进一步地,所述文字处理模块,还用于结合每个文字块的尺寸和相应文字块的分组设置各个文字块的拼接组合,并根据所述拼接组合配置用于容纳所有文字块的图片的尺寸。
[0031]进一步地,所述图片生成模块,进一步用于根据所述文字处理模块所配置的用于容纳所有文字块的图片的尺寸创建所述图片。
[0032]进一步地,所述图片生成模块,进一步用于根据所述图片的尺寸、各个文字块的拼接组合和每个文字块的尺寸,定位每个文字块在所述图片中的边界,并根据每个文字块的边界生成每个文字块的位置描述。
[0033]进一步地,所述文字处理模块,所获取的所述文字样式,包括以下一种或多种的组合:字体、字号、行高、是否粗体、是否斜体、颜色字体、背景颜色。
[0034]目前防爬取的技术主要还是通过把文字在服务器端生成多个不同的图片在网站上展示,这样可以用来屏蔽掉一些比较低级的爬虫,但本申请与现有的方案相比,本申请所获得的技术效果:
[0035]I)本申请通过采用文字图片化方式在网络上公开的信息不容易被网络爬虫等工具爬取,同时可以确保了在浏览器访问含有多图片的页面时的展示速度。
[0036]2)将具有自然语义的文字信息分割成文字块,但是与文字信息的自然语义无关,所述文字块的尺寸是由网页上的显示位置决定的,有利于图片的填充存储以及利于由图片中拾取显示。
[0037]3)将很多不规则大小的文字块聚集在一个图片中往往会使图片比较大,本申请通过分组等操作不规则的文字块尽可能紧凑的聚集在一个比较小的区域内,将图片填充的利用率最大化,节省了服务器存储空间,同时也节约了客户端下载量。
[0038]当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。

【专利附图】

【附图说明】
[0039]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0040]图1是本申请一实施例的基于图片化处理的网页展示方法的方法流程图;
[0041]图2是本申请又一实施例的基于图片化处理的网页展示方法的方法流程图。
[0042]图3a是本申请一应用实例中的网页显示位置的示意图。
[0043]图3b是本申请一应用实例中的填充文字块的图片的示意图。
[0044]图3c是本申请又一应用实例中的网页显示位置的示意图。
[0045]图3d是本申请又一应用实例中的填充文字块的图片的示意图。
[0046]图4是本申请一实施例所述的基于图片化处理的网页展示装置的结构示意图。
[0047]图5是本申请一实施例所述的文字处理模块的结构示意图。

【具体实施方式】
[0048]以下将配合图式及实施例来详细说明本申请的实施方式,藉此对本申请如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
[0049]在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0050]内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0051]计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0052]如图1所示,为本申请一实施例的基于图片化处理的网页展示方法的方法流程图,包括:
[0053]步骤101,对网页中需要基于图片化处理的文字信息进行预处理,其中,所述预处理,包括:设置显示框架并根据所述显示框架将所述文字信息分割为文字块;
[0054]设置显示框架的操作,进一步包括:识别所述网页中文字信息的显示位置,并根据所述显示位置的宽度设定所述显示框架的最大行宽,所述显示框架的高度自适应地与所分割的文字信息的单行的行高匹配。这样,分割得到的文字块的行宽小于等于所述最大行宽且所述文字块的高度等于所分割的文字信息的单行的行高。
[0055]显然,所述文字块的分割是对具有自然语义的文字信息进行分割,但是与文字信息的自然语义无关,所述文字块的尺寸是根据显示框架的尺寸来确定的。而显示框架是与网页上的显示位置相关的,因此,是为了所述文字块的分割是从利于填充存储和利于拾取显不的角度来考虑的。
[0056]步骤102,创建一图片并设置所述图片中每个文字块的位置描述,根据所述位置描述将相应的文字块填充到所述图片中,保存填充后的图片并生成所述图片的调用地址;
[0057]在实际操作中,所述生成的调用地址可以使用URL (统一资源定位符,UniformResourceLocator)来实现,当然,本申请并不限于此。
[0058]步骤103,将所述图片的调用地址和所述图片中每个文字块的位置描述对应地保存为所述网页的元数据;
[0059]步骤104,当接收到所述网页的访问请求时,调用所述网页的元数据,根据所述网页的元数据中的调用地址加载所述图片,并根据所述网页的元数据中的位置描述从所述图片中拾取相应的文字块显示在所述网页中的相应显示位置。
[0060]当接收到所述网页的访问请求时,如果没有查找到所述网页的元数据,则需要跳转至步骤101进行执行,生成所述网页的元数据,并进行显示。
[0061]如图2所示,为本申请又一实施例的基于图片化处理的网页展示方法的方法流程图,包括:
[0062]步骤201,对网页中需要基于图片化处理的文字信息进行预处理,其中,所述预处理,包括:设置显示框架并根据所述显示框架将所述文字信息分割为文字块。
[0063]设置显示框架的操作,进一步包括:识别所述网页中文字信息的显示位置,并根据所述显示位置的宽度设定所述显示框架的最大行宽,所述显示框架的高度自适应地与所分割的文字信息的单行的行高匹配。
[0064]需要说明的是,所分割得到的文字块的宽度并不一定都等于所述最大行宽,宽度会因为每个文字块内字的个数和文字样式的不同而变化。因此,所分割得到的文字块的宽度小于等于所述最大行宽且所述文字块的高度等于所分割的文字信息的单行的行高。
[0065]因为每个文字块虽然是单行的,但是每个文字块可能具有不同文字样式,不同的文字样式的尺寸是不同的,因此导致每个文字块的尺寸都有可能不同,这给将文字块填充到图片中造成了很大的困难。所以下面需要通过步骤202到步骤203对所有文字块进行梳理。
[0066]步骤202,对网页中需要基于图片化处理的文字信息进行预处理,其中,所述预处理,还包括:获取每个文字块中的文字样式,根据每个文字块中的文字样式计算每个文字块的尺寸。
[0067]所述文字样式,包括以下一种或多种的组合:字体、字号、行高、是否粗体、是否斜体、颜色字体、背景颜色。
[0068]步骤203,对网页中需要基于图片化处理的文字信息进行预处理,其中,所述预处理,还包括:识别高度最高的文字块,选定所述文字块的高度的整数分之一为门限,根据所述门限及各个文字块的高度将各个文字块分组。
[0069]所述门限可以选定一个或者多个,例如,“最大高度的文字块行高”、“最大高度的文字块行高/2”、“最大高度的文字块行高/4”、“最大高度的文字块行高/8”等等,当然,本申请并不限于此。通过这些门限划定的范围,将各个文字块分为几组,同组的文字块具有相似的高度。
[0070]通过分组化处理,再进行文字块的拼接组合时,更加有利于使所有文字块拼接组合后的外形规则,更贴近于矩形。因为填充使用的图片一般为矩形,这样就可以使图片被填充的空间利用率最大化,从而有效降低所创建、保存的图片的数量,降低对于服务器存储空间的占用。
[0071]步骤204,对网页中需要基于图片化处理的文字信息进行预处理,其中,所述预处理,还包括:结合每个文字块的尺寸和相应文字块的分组设置各个文字块的拼接组合,并根据所述拼接组合配置用于容纳所有文字块的图片的尺寸。
[0072]步骤205,创建一图片,S卩,根据所配置的用于容纳所有文字块的图片的尺寸创建所述图片。
[0073]步骤206,生成所述图片中每个文字块的位置描述,S卩,根据所述图片的尺寸、各个文字块的拼接组合和每个文字块的尺寸,定位每个文字块在所述图片中的边界,并根据每个文字块的边界生成每个文字块的位置描述。
[0074]步骤207,根据所述位置描述将相应的文字块填充到所述图片中,保存填充后的图片并生成所述图片的调用地址。
[0075]步骤208,将所述图片的调用地址和所述图片中每个文字块的位置描述对应地保存为所述网页的元数据。
[0076]步骤209,当接收到所述网页的访问请求时,调用所述网页的元数据,根据所述网页的元数据中的调用地址加载所述图片,并根据所述网页的元数据中的位置描述从所述图片中拾取相应的文字块显示在所述网页中的相应显示位置。
[0077]当接收到网页的访问请求时,网页开启并进行图片的加载,读取网页上的相应显示位置的代码,执行代码并自动调用相应的所述网页的元数据。
[0078]当接收到所述网页的访问请求时,如果没有查找到所述网页的元数据,则需要跳转至步骤201进行执行,生成所述网页的元数据,并进行显示。
[0079]设置显示框架并根据所述显示框架将所述文字信息分割为文字块,在实际操作中,可以使用java原生的应用程序编程接口 “LineBreakMeasurer”类来实现。以下以一个应用实例来描述。
[0080]如图3a、3b所示,分别为本申请一应用实例中的网页显示位置的示意图和填充文字块的图片的示意图。
[0081]如图3a所示,网页中需要显示的中文字信息为“中国江苏无锡江阴市***工业园”。识别所述网页的显示位置的最大宽度不够显示“中国江苏无锡江阴市***工业园”,需要分成两行来显示。
[0082]通过“LineBreakMeasurer”类计算显不位置的最大宽度能够截取到“中国江苏无锡江阴市***工业园”中的“市”字的位置(如果截取的位置不合适,例如不能截取到完整的字,则相应微调截取位置让出该完整的字),最终获得选定适合的显示框架的最大行宽。
[0083]如图3b所不,根据此最大彳丁宽和“中国江苏无锡江阴市*** T.业园”的彳丁闻设直显示框架,使用所述显示框架将“中国江苏无锡江阴市***工业园”分别分割为“中国江苏无锡江阴市”和工业园”两个文字块。
[0084]在所述步骤104和步骤209中,均包括根据所述网页的元数据中的位置描述由所述图片中拾取相应的文字块显示在所述网页中的相应显示位置的操作,在实际操作中,可以使用CSS (Cascading Style Sheet级联样式表)的方式来实现。
[0085]以下一个应用实例来说明如何使用CSS的方式来实现本申请的上述操作。
[0086]如图3c、3d所示,分别为本申请又一应用实例中的网页显示位置的示意图和填充文字块的图片的示意图。
[0087]在本应用实例中该图片名称为text-1mage-picl (如图3d所示)。
[0088]在本应用实例中文子块“中国江苏无锡江阴市***工业园”(图3c中黑色框标出)在该图片中的位置描述为“-0px_22px; width: 179px;height: 22px”,其中,单位px是像素(pixel)。
[0089]当接收到网页的访问请求时,网页开启并进行图片的加载,读取网页上的相应显示位置“注册地址”的代码,根据代码调用相应的所述网页的元数据,根据所述网页的元数据中的调用地址加载图片text-1mage-picl ;
[0090]并通过CCS由图片 text-1mage-picl 中截取位置描述为“-0px_22px;width: 179px;height: 22px”的文字块,这个截取到的部分就是所需要显示的文字块“中国江苏无锡江阴市***工业园”,将这个文字块显示到网页中的相应显示位置“注册地址”上。
[0091 ] 所采用的CSS代码可以是:
[0092]〈p class="text_image-picl"
[0093]style=〃display:1niine_block; vertical-align:middle;background-posit1n:-Opx
[0094]-22px;width:179px;height:22px;">
[0095]</p>
[0096]通过上述代码实现了截取显示该图片中的不同文字块。当然本申请还可以采用其他代码方式,因此在这里不再详细赘述。
[0097]如图4所示,为本申请一实施例所述的基于图片化处理的网页展示装置的结构示意图,包括:依次相连的文字处理模块401、图片生成模块402、存储控制模块403和网页展示模块404 ;其中,
[0098]所述文字处理模块401,用于对网页中需要基于图片化处理的文字信息进行预处理,其中,所述预处理,包括:设置显示框架并根据所述显示框架将所述文字信息分割为文字块;在设置显示框架时,进一步用于识别所述网页中文字信息的显示位置,并根据所述显示位置的宽度设定所述显示框架的最大行宽,所述显示框架的高度自适应地与所分割的文字信息的单行的行高匹配,其所分割得到的文字块的行宽小于等于所述最大行宽且所述文字块的高度等于所分割的文字信息的单行的行高;
[0099]所述图片生成模块402,用于创建一图片并生成所述图片中每个文字块的位置描述,根据所述位置描述将相应的文字块填充到所述图片中,保存填充后的图片并生成所述图片的调用地址;在创建所述图片时,进一步用于根据所述文字处理模块所配置的用于容纳所有文字块的图片的尺寸创建所述图片;在生成所述位置描述时,进一步用于根据所述图片的尺寸、各个文字块的拼接组合和每个文字块的尺寸,定位每个文字块在所述图片中的边界,并根据每个文字块的边界生成每个文字块的位置描述;
[0100]所述存储控制模块403,用于将所述图片的调用地址和所述图片中每个文字块的位置描述对应地保存为所述网页的元数据;
[0101]所述网页展示模块404,用于当接收到所述网页的访问请求时,调用所述网页的元数据,根据所述网页的元数据中的调用地址加载所述图片,并根据所述网页的元数据中的位置描述从所述图片中拾取相应的文字块显示在所述网页中的相应显示位置。
[0102]如图5所示,为本申请一实施例所述的文字处理模块的结构示意图,所述文字处理模块401,进一步包括:文字分割单元4011、尺寸识别单元4012、文字块分组单元4013和组合配置单元4014。
[0103]所述文字分割单元4011,用于设置显示框架,并根据所述显示框架将需要基于图片化处理的文字信息分割为文字块;
[0104]所述尺寸识别单元4012,与文字分割单元4011相连,用于获取每个文字块中的文字样式,根据每个文字块中的文字样式计算每个文字块的尺寸,所述文字处理模块,所获取的所述文字样式,包括以下一种或多种的组合:字体、字号、行高、是否粗体、是否斜体、颜色字体、背景颜色。
[0105]所述文字块分组单元4013,与尺寸识别单元4012相连,用于识别高度最高的文字块,选定所述文字块的高度的整数分之一为门限,根据所述门限及各个文字块的高度将各个文字块分组。
[0106]所述组合配置单元4014,与尺寸识别单元4012和文字块分组单元4013相连,用于结合每个文字块的尺寸和相应文字块的分组设置各个文字块的拼接组合,并根据所述拼接组合配置用于容纳所有文字块的图片的尺寸。
[0107]由于方法部分已经对本申请实施例进行了详细描述,这里对实施例中涉及的方法与装置对应部分的展开描述省略,不再赘述。对于装置中具体内容的描述可参考所述方法实施例的内容,这里不再具体限定。
[0108]本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0109]上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。
【权利要求】
1.一种基于图片化处理的网页展示方法,包括: 对网页中需要基于图片化处理的文字信息进行预处理,其中,所述预处理,包括:设置显示框架并根据所述显示框架将所述文字信息分割为文字块; 创建一图片并生成所述图片中每个文字块的位置描述,根据所述位置描述将相应的文字块填充到所述图片中,保存填充后的图片并生成所述图片的调用地址; 将所述图片的调用地址和所述图片中每个文字块的位置描述对应地保存为所述网页的元数据; 当接收到所述网页的访问请求时,调用所述网页的元数据,根据所述网页的元数据中的调用地址加载所述图片,并根据所述网页的元数据中的位置描述从所述图片中拾取相应的文字块显示在所述网页中的相应显示位置。
2.如权利要求1所述的基于图片化处理的网页展示方法,其特征在于, 设置显示框架的操作,进一步包括:识别所述网页中文字信息的显示位置,并根据所述显示位置的宽度设定所述显示框架的最大行宽,所述显示框架的高度自适应地与所分割的文字信息的单行的行高匹配。
3.如权利要求1或2所述的基于图片化处理的网页展示方法,其特征在于, 所述预处理的操作中,分割得到的文字块的行宽小于等于所述最大行宽且所述文字块的高度等于所分割的文字信息的单行的行高。
4.如权利要求1所述的基于图片化处理的网页展示方法,其特征在于, 所述预处理,还包括:获取每个文字块中的文字样式,根据每个文字块中的文字样式计算每个文字块的尺寸,识别高度最高的文字块,选定所述文字块的高度的整数分之一为门限,根据所述门限及各个文字块的高度将各个文字块分组。
5.如权利要求4所述的基于图片化处理的网页展示方法,其特征在于, 所述预处理,还包括:结合每个文字块的尺寸和相应文字块的分组设置各个文字块的拼接组合,并根据所述拼接组合配置用于容纳所有文字块的图片的尺寸。
6.如权利要求1或5所述的基于图片化处理的网页展示方法,其特征在于, 创建一图片的操作,进一步包括:根据所配置的用于容纳所有文字块的图片的尺寸创建所述图片。
7.如权利要求1或5所述的基于图片化处理的网页展示方法,其特征在于, 生成所述图片中每个文字块的位置描述的操作,进一步包括:根据所述图片的尺寸、各个文字块的拼接组合和每个文字块的尺寸,定位每个文字块在所述图片中的边界,并根据每个文字块的边界生成每个文字块的位置描述。
8.如权利要求5所述的基于图片化处理的网页展示方法,其特征在于, 所述文字样式,包括以下一种或多种的组合:字体、字号、行高、是否粗体、是否斜体、颜色字体、背景颜色。
9.一种基于图片化处理的网页展示装置,其特征在于,包括:依次相连的文字处理模块、图片生成模块、存储控制模块和网页展示模块;其中, 所述文字处理模块,用于对网页中需要基于图片化处理的文字信息进行预处理,其中,所述预处理,包括:设置显示框架并根据所述显示框架将所述文字信息分割为文字块; 所述图片生成模块,用于创建一图片并生成所述图片中每个文字块的位置描述,根据所述位置描述将相应的文字块填充到所述图片中,保存填充后的图片并生成所述图片的调用地址; 所述存储控制模块,用于将所述图片的调用地址和所述图片中每个文字块的位置描述对应地保存为所述网页的元数据; 所述网页展示模块,用于当接收到所述网页的访问请求时,调用所述网页的元数据,根据所述网页的元数据中的调用地址加载所述图片,并根据所述网页的元数据中的位置描述从所述图片中拾取相应的文字块显示在所述网页中的相应显示位置。
10.如权利要求9所述的基于图片化处理的网页展示装置,其特征在于, 所述文字处理模块,进一步用于识别所述网页中文字信息的显示位置,并根据所述显示位置的宽度设定所述显示框架的最大行宽,所述显示框架的高度自适应地与所分割的文字信息的单行的行高匹配。
11.如权利要求9或10所述的基于图片化处理的网页展示装置,其特征在于, 所述文字处理模块,所分割得到的文字块的行宽小于等于所述最大行宽且所述文字块的高度等于所分割的文字信息的单行的行高。
12.如权利要求9所述的基于图片化处理的网页展示装置,其特征在于, 所述文字处理模块,还用于获取每个文字块中的文字样式,根据每个文字块中的文字样式计算每个文字块的尺寸,识别高度最高的文字块,选定所述文字块的高度的整数分之一为门限,根据所述门限及各个文字块的高度将各个文字块分组。
13.如权利要求12所述的基于图片化处理的网页展示装置,其特征在于, 所述文字处理模块,还用于结合每个文字块的尺寸和相应文字块的分组设置各个文字块的拼接组合,并根据所述拼接组合配置用于容纳所有文字块的图片的尺寸。
14.如权利要求9或13所述的基于图片化处理的网页展示装置,其特征在于, 所述图片生成模块,进一步用于根据所述文字处理模块所配置的用于容纳所有文字块的图片的尺寸创建所述图片。
15.如权利要求9或13所述的基于图片化处理的网页展示装置,其特征在于, 所述图片生成模块,进一步用于根据所述图片的尺寸、各个文字块的拼接组合和每个文字块的尺寸,定位每个文字块在所述图片中的边界,并根据每个文字块的边界生成每个文字块的位置描述。
16.如权利要求13所述的基于图片化处理的网页展示装置,其特征在于, 所述文字处理模块,所获取的所述文字样式,包括以下一种或多种的组合:字体、字号、行高、是否粗体、是否斜体、颜色字体、背景颜色。
【文档编号】G06T11/60GK104281626SQ201310293720
【公开日】2015年1月14日 申请日期:2013年7月12日 优先权日:2013年7月12日
【发明者】陈俊文, 潘俊俊 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1