页面数据过滤方法、装置及用户终端与流程

文档序号:14923582发布日期:2018-07-13 08:07阅读:149来源:国知局

本申请涉及计算机技术领域,具体而言,涉及一种页面数据过滤方法、装置及用户终端。



背景技术:

随着互联网技术的发展,用户对网页浏览的需求越来越大,页面广告常常是用户在浏览网页时所不愿意看到的。如何在终端对页面广告进行,是业界普遍关心的问题。

现在常见的广告过滤方法是基于一定的广告过滤规则进行过滤的,这种广告过滤规则是对页面信息对应节点的节点id或节点属性进行匹配,匹配后过滤掉指定节点id或节点属性的节点,从而达到过滤广告的目的,例如具体可以通过正则表达式或xpath来匹配页面上的节点。

然而随着技术的发展,越来越多的广告投放者为了避免广告被屏蔽,在投放广告时,通过设置脚本程序来随机生成广告所对应节点的节点id,来实现避免广告被现有的广告过滤技术过滤。

申请内容

有鉴于此,本申请实施例提供了一种页面数据过滤方法、装置及用户终端,能够对节点id为随机生成的数据(例如广告信息)进行过滤。

为实现上述目的,本申请实施例提供了一种页面数据过滤方法,所述方法包括:获取页面资源,并根据所述页面资源生成第一页面;再次获取所述页面资源,并根据所述页面资源生成第二页面;比较所述第一页面的所有节点标识信息与所述第二页面的所有节点标识信息;在所述第一页面中,去除只出现在所述第一页面而未出现在所述第二页面的节点标识信息对应的节点。

本申请实施例还提供了一种页面数据过滤装置,所述装置包括:第一页面生成模块,用于获取页面资源,并根据所述页面资源生成第一页面;第二页面生成模块,用于再次获取所述页面资源,并根据所述页面资源生成第二页面;节点标识比较模块,用于比较所述第一页面的所有节点标识信息与所述第二页面的所有节点标识信息;节点过滤模块,用于在所述第一页面中,去除只出现在所述第一页面而未出现在所述第二页面的节点标识信息对应的节点。

本申请实施例还提供了一种用户终端,所述用户终端包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时,使所述处理器执行以下操作:获取页面资源,并根据所述页面资源生成第一页面;再次获取所述页面资源,并根据所述页面资源生成第二页面;比较所述第一页面的所有节点标识信息与所述第二页面的所有节点标识信息;在所述第一页面中,去除只出现在所述第一页面而未出现在所述第二页面的节点标识信息对应的节点。

本申请实施例提供的页面数据过滤方法、装置及用户终端的有益效果为:

本申请实施例提供的页面数据过滤方法、装置及用户终端通过两次获取页面资源,并且根据获取到的页面资源分别生成第一页面和第二页面。然后将第一页面的节点标识信息以及第二页面的节点标识信息进行比较;根据比较结果,在第一页面中,去除只出现在第一页面而没出现在第二页面的节点标识信息对应的节点,由于广告的节点的节点标识信息(例如节点id)是随机生成的,故对同一页面资源生成两次页面,所得到的广告信息的节点标识信息是不同的,过滤掉节点标识信息不同的节点便实现了对节点id是随机生成的广告进行过滤的效果。

附图说明

为了更清楚的说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例的应用环境示意图;

图2示出了本申请实施例提供的用户终端的结构框图;

图3示出了本申请第一实施例提供的一种页面数据过滤方法的流程图;

图4示出了本申请第二实施例提供的一种页面数据过滤方法的流程图;

图5示出了与图4对应的具体交互示意图;

图6示出了节点标识信息的一个具体示例的示意图;

图7示出了本申请第三实施例提供的页面数据过滤装置的结构框图;

图8示出了图7中第一页面生成模块的一种具体实施方式的结构框图;

图9示出了与图8对应的第二页面生成模块的结构框图;

图10示出了图7中第一页面生成模块的另一种具体实施方式的结构框图;

图11示出了与图10对应的第二页面生成模块的结构框图。

具体实施方式

本申请下述各实施例均可应用于如图1所示的环境中。如图1所示,服务器10通过网络30与一个或多个用户终端20进行通信连接,以进行数据通信或交互。在本申请实施例中,用户终端20中安装有客户端,该客户端可以是应用程序,与服务器10相对应,从而为用户提供服务(例如接收用户输入的网址,向用户展示网页内容等)。所述服务器10可以是数据库服务器、即时通信服务器、网络服务器、验证服务器等多个服务器,也可以是一个服务器。所述用户终端20可以是个人电脑(personalcomputer,pc)、平板电脑、智能手机、电子书阅读器、膝上型便携计算机、车载电脑、智能穿戴设备等。所述网络30可以是无线网络或有线网络,例如无线网络可以是,但不限于wi-fi(无线保真)网络、2g/3g/4g网络等。

图2示出了一种可应用于本申请实施例中的用户终端20的结构框图。如图2所示,所述用户终端20包括存储器202、存储控制器204,一个或多个(图中仅示出一个)处理器206、外设接口208、射频模块210、音频模块212、触控屏幕214等。这些组件通过一条或多条通讯总线/信号线216相互通讯。

存储器202可用于存储软件程序以及模块,如本申请实施例中的页面数据过滤方法及装置对应的程序指令/模块,处理器206通过运行存储在存储器202内的软件程序以及模块,从而执行各种功能应用以及数据处理,如本申请实施例提供的页面数据过滤方法。

存储器202可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。处理器206以及其他可能的组件对存储器202的访问可在存储控制器204的控制下进行。

外设接口208将各种输入/输出装置耦合至处理器206以及存储器202。在一些实施例中,外设接口208,处理器206以及存储控制器204可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。

射频模块210用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。

音频模块212向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。

触控屏幕214在用户终端20与用户之间同时提供一个输出及输入界面。具体地,触控屏幕214向用户显示视频输出,这些视频输出的内容可包括文字、图形、视频及其任意组合。

可以理解,图2所示的结构仅为示意,用户终端20还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。

第一实施例

图3示出了本发明第一实施例提供的一种页面数据过滤方法的流程图,请参阅图3,本实施例描述的是用户终端的处理流程,所述方法包括:

步骤s110,获取页面资源,并根据所述页面资源生成第一页面。

于本发明实施例中,获取页面资源具体可以由位于用户终端的客户端进行,页面资源包括生成网页页面所需的文字、图片、视频等内容,以及生成上述文字、图片、视频等内容所要执行的程序代码。页面资源具体可以从服务器获取。

客户端根据获得的页面资源生成第一页面,第一页面可以是在客户端界面向用户展示的网页页面,即用户可以通过第一页面获取内容信息。

步骤s120,再次获取所述页面资源,并根据所述页面资源生成第二页面。

客户端再次获取页面资源时,具体可以从服务器再次重新获得,也可以将步骤s110所获得的页面资源缓存起来,以便于再次获取时,直接获取缓存起来的页面资源,客户端具体从何处获取页面资源不应该理解为是对本发明的限制。

客户端根据再次获取的页面资源生成第二页面,第二页面的生成过程可以在后台进行,即可以不用向用户展示出来。可以理解,第一页面与第二页面的生成方式可以互换,即第一页面的生成可以在后台进行,第二页面是在客户端界面向用户展示的网页页面。

步骤s130,比较所述第一页面的所有节点标识信息与所述第二页面的所有节点标识信息;

网页页面的内容信息例如文字信息、图片信息等,均有分别与内容信息对应的节点,每个节点均具有各自的节点标识信息,节点标识信息可以为节点id,也可以为其他能区别于其他节点的属性,例如plass属性。

开发者为了避免广告信息被删除,往往通过在广告信息所对应的节点产生时,产生随机的节点标识信息。若对同一页面资源进行两次页面资源的加载,两次生成的网页页面中,往往只有广告信息所对应节点的节点标识信息不同。以节点标识信息是节点id为例,详情请参见图6,图6左侧为第一页面的部分内容信息对应的节点id,图6右侧为第二页面的与第一页面相同位置的内容信息对应的节点id。可以看出,图6左侧与图6右侧的第8行到第12行的节点id是不同的,故可以判定第8行到第12行的节点对应的内容信息为广告信息。

因此,客户端可以将第一页面的所有节点标识信息以及第二页面的所有节点标识信息进行比较,从而获得两个页面中节点标识信息不同的节点。

步骤s140,在所述第一页面中,去除只出现在所述第一页面而未出现在所述第二页面的节点标识信息对应的节点。

客户端在第一页面中,去除只出现在第一页面而没出现在第二页面的节点标识信息对应的节点,从而达到删除与上述节点相对应的内容信息的目的。

客户端在第一页面中去除只出现在第一页面而没出现在第二页面的节点标识信息对应的节点,由于第一页面已经展示于客户端的界面,因此,广告信息可能也会随着第一页面的出现而短暂地出现一段时间,直到客户端将只出现过一次的节点标识信息对应的节点去除时,广告信息才会随之消失。由于程序的执行时间较短,故广告信息所出现的时间一般不会被用户所察觉。

当然,也可以先在后台加载第二页面,然后在客户端的界面加载第一页面。加载第一页面的同时,比较第一页面的所有节点标识信息和第二页面的所有节点标识信息,然后删除只出现在第一页面没出现在第二页面的节点标识信息对应的节点。按照该过程加载网页页面,可以做到避免广告信息的出现。

第二实施例

图4示出了本发明第二实施例提供的一种页面数据过滤方法的流程图,请参阅图4,本实施例描述的是用户终端的处理流程,所述方法包括:

步骤s210,从服务器获取页面资源。

在本实施例中,获取页面资源具体可以从服务器来获取。具体地,客户端向服务器请求页面资源,服务器则会返回页面资源给客户端。

步骤s220,根据所述页面资源生成第一页面。

客户端接收到服务器返回的页面资源后,生成第一页面。与此同时,客户端还在执行如下步骤,即

步骤s230,将所述页面资源存储至资源缓存区。

资源缓存区可以为客户端的一个用于缓存数据的存储器,用来缓存从服务器获得的页面资源以等待再一次被获取。

步骤s240,从所述资源缓存区再次获取所述页面资源。

客户端可以从资源缓存区再次获取页面资源,从而避免从服务器再次获取页面资源,可以缩短再次加载页面资源的时间。

步骤s250,根据所述页面资源生成第二页面。

客户端根据从资源缓存区获取的页面资源在后台生成第二页面,从而再一次获取同一页面资源的节点标识信息。

具体地,客户端可以包括网页视图组件,即webview组件,webview组件是用来展示网页页面或展示应用程序的内容的组件,具体可以用来加载上述的第一页面。

webview组件可以设置有隐藏框架,例如iframe标签。客户端可以在隐藏框架中,加载第二页面。由于隐藏框架可以被隐藏起来,因此第二页面的加载过程可以在后台进行。

客户端除了通过网页视图组件以及设置于网页视图组件的隐藏框架分别加载第一页面和第二页面外,还可以通过其他的方式来分别加载第一页面和第二页面。

例如,客户端具体可以包括第一网页视图组件以及第二网页视图组件,通过第一网页视图组件加载第一页面,通过第二网页视图组件加载第二页面。其中,通过第二网页视图组件加载第二页面的过程可以在后台进行。

客户端也可以通过再次刷新的方式两次加载同一页面资源,客户端加载同一页面资源的具体方式不应该理解为是对本发明的限制。

步骤s260,比较所述第一页面的所有节点标识信息与所述第二页面的所有节点标识信息。

步骤s270,在所述第一页面中,去除只出现在所述第一页面而未出现在所述第二页面的节点标识信息对应的节点。

步骤s260以及步骤s270与图3示出的步骤s130以及步骤s140相同,在此便不做赘述。

具体请参见图5,图5示出了与图4对应的一种具体交互示意图,用户可以在用户终端的客户端输入统一资源定位符(uniformresourcelocator,缩写为url),即网页网址。客户端根据接收到的url向服务器请求页面资源,服务器则会返回页面资源给客户端。

客户端接收到服务器返回的页面资源后,生成第一页面。与此同时,客户端还在执行将所述页面资源存储至资源缓存区的步骤。资源缓存区可以为客户端的一个用于缓存数据的存储器,用来缓存从服务器获得的页面资源以等待再一次被获取。

客户端可以从资源缓存区再次获取页面资源,从而避免从服务器再次获取页面资源,可以缩短再次加载页面资源的时间。

客户端根据从资源缓存区获取的页面资源在后台生成第二页面,从而再一次获取同一页面资源的节点标识信息。

在后台生成第二页面后,比较第一页面的节点id与第二页面的节点id;然后在第一页面中,去除只出现在第一页面未出现在第二页面的节点id对应的节点。

本发明实施例提供的页面数据过滤方法通过对同一页面资源生成两次页面,过滤掉两次页面中,只出现过一次的节点标识信息所对应的节点,实现了对节点标识信息随机生成的广告的过滤。

第三实施例

本发明实施例还提供了一种页面数据过滤装置,详情请参见图7,该装置300包括:

第一页面生成模块310,用于获取页面资源,并根据所述页面资源生成第一页面。

于本发明实施例中,获取页面资源具体可以由位于用户终端的客户端进行,页面资源包括生成网页页面所需的文字、图片、视频等内容,以及生成上述文字、图片、视频等内容所要执行的程序代码。页面资源具体可以从服务器获取。

客户端根据获得的页面资源生成第一页面,第一页面可以是在客户端界面向用户展示的网页页面,即用户可以通过第一页面获取内容信息。

第二页面生成模块320,用于再次获取所述页面资源,并根据所述页面资源生成第二页面。

客户端再次获取页面资源时,具体可以从服务器再次重新获得,也可以将步骤s110所获得的页面资源缓存起来,以便于再次获取时,直接获取缓存起来的页面资源,客户端具体从何处获取页面资源不应该理解为是对本发明的限制。

客户端根据再次获取的页面资源生成第二页面,第二页面的生成过程可以在后台进行,即可以不用向用户展示出来。可以理解,第一页面与第二页面的生成方式可以互换,即第一页面的生成可以在后台进行,第二页面是在客户端界面向用户展示的网页页面。

节点标识比较模块330,用于比较所述第一页面的所有节点标识信息与所述第二页面的所有节点标识信息。

网页页面的内容信息例如文字信息、图片信息等均有分别与内容信息对应的节点,每个节点均具有各自的节点标识信息,节点标识信息可以为节点id,也可以为其他能区别于其他节点的属性,例如plass属性。

客户端可以将第一页面的所有节点标识信息以及第二页面的所有节点标识信息进行比较,从而获得两个页面中节点标识信息不同的节点。

节点过滤模块340,用于在所述第一页面中,去除只出现在所述第一页面而未出现在所述第二页面的节点标识信息对应的节点。

客户端在第一页面中,去除只出现在第一页面而没出现在第二页面的节点标识信息对应的节点,从而达到删除与上述节点相对应的内容信息的目的。

开发者为了避免广告信息被删除,往往通过在广告信息所对应的节点产生时,产生随机的节点标识信息。因此,若对同一页面资源进行两次页面资源的加载,两次生成的网页页面中,往往只有广告信息所对应节点的节点标识信息不同,因此,在两次加载过程中,去除只出现过一次的节点标识信息对应的节点,便能达到过滤广告信息的目的。

图8示出了第一页面生成模块310的一种具体实施方式的结构框图,图9示出了第二页面生成模块320与图8所对应的结构框图。详情参见图8,第一页面生成模块可以包括第一页面资源获取模块311,用于从服务器获取页面资源。

网页视图加载模块312,用于通过网页视图组件来根据所述页面资源加载第一页面;所述网页视图组件设置有隐藏框架。

客户端可以包括网页视图组件,即webview组件,webview组件是用来展示网页页面或展示应用程序的内容的组件,具体可以用来加载上述的第一页面。

webview组件可以设置有隐藏框架,例如iframe标签。客户端可以在隐藏框架中,加载第二页面。由于隐藏框架可以被隐藏起来,因此第二页面的加载过程可以在后台进行。

详情参见图9,第二页面生成模块可以包括资源缓存模块321,用于将所述页面资源存储至资源缓存区。

第二页面资源获取模块322,用于从所述资源缓存区再次获取所述页面资源。

隐藏框架加载模块323,用于通过所述隐藏框架来根据所述页面资源加载第二页面。

图8和图9共同示出的加载页面资源的方式即为上文提到的通过网页视图组件以及设置于网页视图组件的隐藏框架分别加载第一页面和第二页面。

图10示出了第一页面生成模块310的另一种具体实施方式的结构框图,图11示出了第二页面生成模块320与图10所对应的结构框图。详情参见图10,第一页面生成模块310可以包括第一页面资源获取模块311,用于从服务器获取页面资源。

第一网页视图模块313,用于通过第一网页视图组件来根据所述页面资源加载第一页面。

详情请参见图11,第二页面生成模块320可以包括资源缓存模块321,用于将所述页面资源存储至资源缓存区。

第二页面资源获取模块322,用于从所述资源缓存区再次获取所述页面资源。

第二网页视图模块324,用于通过第二网页视图组件来根据所述页面资源加载第二页面。

客户端具体可以包括第一网页视图组件以及第二网页视图组件,通过第一网页视图组件加载第一页面,通过第二网页视图组件加载第二页面。其中,通过第二网页视图组件加载第二页面的过程可以在后台进行。

客户端也可以通过再次刷新的方式两次加载同一页面资源,客户端加载同一页面资源的具体方式不应该理解为是对本发明的限制。

本申请实施例提供的页面数据过滤方法、装置及用户终端通过两次获取页面资源,并且根据获取到的页面资源分别生成第一页面和第二页面。然后将第一页面的节点标识信息以及第二页面的节点标识信息进行比较;根据比较结果,在第一页面中,去除只出现在第一页面而没出现在第二页面的节点标识信息对应的节点,由于广告的节点的节点标识信息(例如节点id)是随机生成的,故对同一页面资源生成两次页面,所得到的广告信息的节点标识信息是不同的。过滤掉节点标识信息不同的节点便实现了对节点标识信息是随机生成的广告进行过滤的效果。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1