广告物料数据网址验证方法和装置与流程

文档序号:12278563阅读:236来源:国知局
广告物料数据网址验证方法和装置与流程

本发明涉及广告技术领域,具体涉及一种广告物料数据网址验证方法和装置。



背景技术:

对于广告平台,每个广告投放方都会在该广告平台注册一个广告账户,然后该商家可以在其客户端中登录广告平台,将其编辑好的各条广告物料数据上传至该广告平台中,该广告物料数据可以理解为包括广告内容,该广告内容文本、图片等的数据,还包括对应的URL(Uniform Resource Locator,统一资源定位符)。在实际应用中,广告平台为了保证上线后可以正常被访问,避免广告物料数据出现无法访问的情况,提高广告召回率,广告平台会对所有的上传的广告物料数据的网址进行验证。当广告物料数据网址验证为可连通之后,广告平台才会将该广告物料数据上线,使其可以被检索以及展示。

但是,实际应用中,各个网站会设置防火墙,该防火墙的其中一个功能是避免网络流量的攻击,比如某个IP地址的网站,对于同一IP地址的客户端,如果该服务器短时间内接收到该客户端的请求数量大于第一阈值,则会封禁该IP地址。那么,对于广告平台来说,由于有大量的广告物料数据的URL需要验证,其发送网络请求的频率较高,并且可能存在大量的URL针对同一个IP地址的网站,如果在短时间内对同一个IP地址的网站,发送了超过其防火墙限制的访问请求,则可能被该网站的防火墙封禁。

那么,如果一个URL实际上可以访问,而由于在验证过程中,广告平台的IP地址被该URL所在的服务器封禁,则验证该URL为不连通,那么该URL对应的广告物料数据则不会被广告平台上线。因此,上述方式对于广告投放方来说,其广告无法被正常上线,无法在广告平台中被检索,也无法展示给客户端;对于广告平台来说,其也相当于做了错误的验证。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的广告物料数据网址验证装置和相应的广告物料数据网址 验证方法。

依据本发明的一个方面,公开了一种广告物料数据网址验证方法,包括:

获取各个未验证的广告物料数据的网址;

从各个广告物料数据的网址中,对于属于同一主域名的网址,提取一个主域名;

对各个主域名进行验证,并记录验证结果;

对各个广告物料数据的网址进行验证;其中,当对一网址的验证未通过,则查找与所述网址对应的主域名的验证结果;

如果所述验证结果表示验证通过,则确认所述网址的验证通过。

优选地,所述对各个广告物料数据的网址进行验证包括:

根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组;

对获得的各个验证分组,循环对各个验证分组进行验证;其中,对每个验证分组进行验证时包括:从所述验证分组中未验证的网址中,选择指定个数的网址据进行验证。

优选地,所述对获得的各个验证分组,循环对各个验证分组进行验证包括:

判断是否存在还未验证完毕的验证分组;

如果存在还未验证完毕的验证分组,则循环选择下一个未验证完毕的验证分组以进行验证;其中,最后一个验证分组的下一个验证分组为第一个验证分组;

如果不存在还未验证完毕的验证分组,则验证结束。

优选地,所述从所述验证分组中未验证的网址中,选择指定个数的网址据进行验证包括:

从未验证的网址中,逐个选择网址进行验证;

在每次选择网址后,如果选择的网址达到指定个数并且还存在未验证的网址,则转入对下一个验证分组的验证过程;

如果不存在未验证的网址,则将对应的验证分组退出循环过程,转入对 下一个验证分组的验证过程。

优选地,所述根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组包括:

根据各个广告物料数据的网址,获取所述网址对应的IP地址;

将对应同一个IP地址的网址分为一个验证分组。

优选地,所述根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组,包括:

根据各个广告物料数据的网址中的主域名,将同一主域名的网址分为一个第一分组;

根据每个主域名,获取对应所述主域名的IP地址;

将对应同一个IP地址的各个第一分组合为一个验证分组。

依据本发明的另外一个方面,本发明公开了一种广告物料数据网址验证装置,包括:

获取模块,适于获取各个未验证的广告物料数据的网址;

主域名提取模块,适于从各个广告物料数据的网址中,对于属于同一主域名的网址,提取一个主域名;

主域名验证模块,适于对各个主域名进行验证,并记录验证结果;

网址验证模块,适于对各个广告物料数据的网址进行验证;其中,当对一网址的验证未通过,则查找与所述网址对应的主域名的验证结果;如果所述验证结果表示验证通过,则确认所述网址的验证通过。

优选地,所述网址验证模块包括:

IP分组模块,适于根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组;

循环验证模块,适于对获得的各个验证分组,循环对各个验证分组进行验证;其中,对每个验证分组进行验证时包括:从所述验证分组中未验证的网址中,选择指定个数的网址据进行验证。

优选地,所述循环验证模块包括:

验证分组判断模块,适于判断是否存在还未验证完毕的验证分组;

循环选择模块,适于如果存在还未验证完毕的验证分组,则循环选择下一个未验证完毕的验证分组以进行验证;其中,最后一个验证分组的下一个验证分组为第一个验证分组;

结束模块,适于如果不存在还未验证完毕的验证分组,则验证结束。

优选地,所述循环验证模块包括:

逐个验证模块,适于从未验证的网址中,逐个选择网址进行验证;

转入判断模块,适于在每次选择网址后,如果选择的网址达到指定个数并且还存在未验证的网址,则转入对下一个验证分组的验证过程;

退出模块,适于如果不存在未验证的网址,则将对应的验证分组退出循环过程,转入对下一个验证分组的验证过程。

优选地,所述IP分组模块包括:

IP地址获取模块,适于根据各个广告物料数据的网址,获取所述网址对应的IP地址;

第一IP分组模块,适于将对应同一个IP地址的网址分为一个验证分组。

优选地,所述IP分组模块包括:

主域名分组模块,适于根据各个广告物料数据的网址中的主域名,将同一主域名的网址分为一个第一分组;

主域名IP获取模块,适于根据每个主域名,获取对应所述主域名的IP地址;

第二IP分组模块,适于将对应同一个IP地址的各个第一分组合为一个验证分组。

根据本发明的广告物料数据网址验证方法,可以从未验证的网址中,对于属于同一主域名的网址,提取一个主域名;然后对该主域名进行连通性验证,并记录验证结果。在后续对各个广告物料数据的网址进行验证的过程中,如果某个网址验证未通过,则去查找该网址对应的主域名的验证结果,如果主域名验证通过,则表示该网址所在的网站是连通的,该网址被误判为不连通,从而还是认为该网址验证通过,可以对相应的广告物料数据上线。由此解决了对于实际上可以访问的网站,其主域名下的各个广告物料数据的网 址,在验证过程中,被服务器的防火墙进行拦截,而导致连通性验证不通过,从而使该网址被误判,导致该广告物料数据不能上线的问题,取得了降低广告物料数据的网址的验证过程中,网址的验证被防火墙拦截而导致误判的几率,使相应的广告物料数据可以正常上线的有益效果。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一个实施例的一种广告物料数据网址验证方法的流程示意图;

图2示出了根据本发明一个实施例的一种广告物料数据网址验证方法的流程示意图;

图2A示出了本发明实施例的IP验证分组示例;

图3示出了根据本发明一个实施例的一种广告物料数据网址验证方法的流程示意图;

图4示出了根据本发明一个实施例的一种广告物料数据网址验证装置的结构示意图;

图5示出了根据本发明一个实施例的一种广告物料数据网址验证装置的结构示意图;

图6示出了根据本发明一个实施例的一种广告物料数据网址验证装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例的核心思想之一在于,可以从未验证的网址中,对于属于同一主域名的网址,提取一个主域名;然后对该主域名进行连通性验证,并记录验证结果。在后续对各个广告物料数据的网址进行验证的过程中,如果某个网址验证未通过,则去查找该网址对应的主域名的验证结果,如果主域名验证通过,则表示该网址所在的网站是连通的,该网址被误判为不连通,从而还是认为该网址验证通过,可以对相应的广告物料数据上线。由于各个网址所在主域名如果是连通的,在通常情况下,该主域名下的各个网址也是连通的,因此,本发明实施例可以降低广告物料数据的网址的验证过程中,网址的验证被防火墙拦截而导致误判的几率,使相应的广告物料数据可以正常上线。

实施例一

参照图1,其示出了本发明实施例一种广告物料数据网址验证方法的流程示意图,具体可以包括:

步骤110,获取各个未验证的广告物料数据的网址;

本发明实施例应用于广告平台,该广告平台中可以接收各个广告投放方注册的广告账户,该广告投放方可以理解为商家。然后各个商家能通过该广告账户登录广告平台,在广告账户中上传广告物料数据。

其中,广告平台可以理解为广告服务器或者广告服务器集群。

其中,所述广告物料数据可以包括广告内容和URL,该广告内容可以包括文本、图片等数据。广告内容用于在客户端的网页中展示具体类容,URL用于在用户点击广告内容后引导网页跳转至目标网页。

对于用户新上传的广告物料数据,广告平台为了使广告物料数据上线之后,该广告物料数据被投放到客户端展示以后,当用户点击展示广告物料数据时可以正常跳转到相应URL的页面中,保证广告物料数据的有效性。因 为,如果用户在客户端中点击该展示的广告物料数据之后,该广告物料数据的URL不能连通,则实际上该广告物料数据是无效的,对于用户来说浪费其时间和操作。

因此,广告平台需要首先对各个广告物料数据的网址进行连通性验证,该网址被验证为可以连通后,然后才能发布到线上。

在广告平台中,新上传的广告物料数据是存储在基础数据库中,该基础数据库存储未验证的广告物料数据。其存储时,还是以广告账户为数据库的主键进行存储的。当然,如果对于广告账户,用户在广告账户中设置了多个广告分组,然后在广告分组中上传广告物料数据,数据库则以广告账户为一级主键,广告组为下一级主键,存储广告物料数据。

那么,本发明实施例中,本发明实施例可以从上述基础数据库中提取各种未验证的广告物料数据的网址。提取时,是按照广告物料数据进行提取的,即有多少个广告物料数据,则提取多少个网址,网址的个数与广告物料数据的个数一一对应。并且,本发明实施例中,对于提取每个网址会记录其对应的广告物料数据。

步骤120,从各个广告物料数据的网址中,对于属于同一主域名的网址,提取一个主域名;

在实际应用中,可能一个商家在其一个或多个广告账户中注册的广告账户中上传的广告物料数据的URL可能都是一个主域名下的URL。比如http://www.tuniu.com/guide/d-ouzhou-3600/、http://www.tuniu.com/g3600/tours-bj-0/、http://www.tuniu.com/g3600/pkg-sh-0/等,这几个URL的主域名都为www.tuniu.com。

在实际应用中,如果该主域名的网址http://www.tuniu.com/连通,则该主域名下的URL也是连通的。那么,本发明则提取各个URL的主域名,并进行归一化,每个主域名保存一份。

步骤130,对各个主域名进行验证,并记录验证结果;

通过步骤120归一化得到的各个主域名,对每个主域名进行一次连通性验证,并对验证结果进行记录,该验证结果可包括:连通、不连通。连通表 示验证通过,不连通表示验证不通过。

当然,在本发明实施例中,可以每隔一段时间对各个主域名进行验证,以减少该主域名所在网站的变化,导致该主域名的连通性变更的情况。比如主域名A在时刻A验证时是不连通的,该主域名的验证结果记录为不连通;隔一段时间之后,再次对主域名A验证,该主域名则是连通的,则将该主域名的验证结果更改为连通。

在本发明实施例在,步骤130中,对各个主域名进行验证,并记录验证结果,其可以在参照服务器中执行,在该参照服务器中,能以较低的频率对各个主域名进行验证。比如每10秒验证1个,该种频率基本上不会被网站防火墙限制。

步骤140,对各个广告物料数据的网址进行验证;其中,当对一网址的验证未通过,则查找与所述网址对应的主域名的验证结果;如果所述验证结果表示验证通过,则确认所述网址的验证通过。

在本发明实施例中,对于各个广告物料数据的网址,则逐一对这些网址进行连通性验证。

广告平台判断对每个网址的验证是否通过。如果该网址的验证通过,则可以将相应的广告物料数据上线。如果该网址的验证不通过,则查找该网址的主域名的验证结果,根据该验证结果判断是否确认该网址通过验证;如果该主域名的验证结果为连通,则表示主域名验证通过,可以将该网址的初始验结果证修改为验证通过。如果该主域名的验证结果为不连通,在表示主域名的验证也没通过,继续认为该网址验证未通过。

比如,当步骤130中对www.tuniu.com的验证结果记录为连通。步骤140中广告平台对http://www.tuniu.com/guide/d-ouzhou-3600/的验证为不通过,那么查找http://www.tuniu.com/guide/d-ouzhou-3600/对应的主域名www.tuniu.com的验证结果,其记录为连通,则广告平台确定http://www.tuniu.com/guide/d-ouzhou-3600/为通过。

在本发明实施例中,对于主域名、URL的连通性验证,可以根据该URL 发起HTTP(Hypertext transfer protocol,超文本传送协议)请求,然后根据收到的针对该HTTP请求的HTTP响应判断是否连通,连通则验证通过,不连通则验证不通过。比如,HTTP响应的4XX系列,和5XX系列的响应都表示不连通,2XX系统的响应表示连通。

在本发明实施例在,步骤140对各个网址的验证可以在步骤130提及的参照服务器之外的其他验证服务器中验证。当某个网址验证不通过,则去参照服务器获取该网址对应的主域名的验证结果。如果该主域名验证通过,则认为该网址验证通过,如果主域名验证未通过,则该网址验证未通过。

本发明实施例可以从未验证的网址中,对于属于同一主域名的网址,提取一个主域名;然后对该主域名进行连通性验证,并记录验证结果。在后续对各个广告物料数据的网址进行验证的过程中,如果某个网址验证未通过,则去查找该网址对应的主域名的验证结果,如果主域名验证通过,则表示该网址所在的网站是连通的,该网址被误判为不连通,从而还是认为该网址验证通过,可以对相应的广告物料数据上线。由于各个网址所在主域名如果是连通的,在通常情况下,该主域名下的各个网址也是连通的,因此,本发明实施例可以降低广告物料数据的网址的验证过程中,网址的验证被防火墙拦截而导致误判的几率,使相应的广告物料数据可以正常上线。

实施例二

参照图2,其示出了本发明实施例一种广告物料数据网址验证方法的流程示意图,具体可以包括:

步骤210,获取各个未验证的广告物料数据的网址;

步骤220,从各个广告物料数据的网址中,对于属于同一主域名的网址,提取一个主域名;

步骤230,对各个主域名进行验证,并记录验证结果;

步骤210-230与实施例一类似的步骤原理类似,在此不再详述。

步骤240,根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组;

在实际应用中,每个URL有对应的IP地址,那么本发明实施例可以根据URL对应的IP地址将各个广告物料数据的网址分组。也可以尽量将指向同一网站的广告物料数据的网址分到一个验证分组中。

优选地,步骤240所述的根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组包括:

子步骤241,根据各个广告物料数据的网址,获取所述网址对应的IP地址;

对于取所述网址对应的IP地址,可以通过如下步骤实现:

子步骤A11,针对每个URL,构建DNS请求;

子步骤A12,将DNS请求发送至DNS服务器;

子步骤A13,接收DNS服务器返回的IP地址,将该IP地址与URL进行对应。

任何一个URL,如果客户端想要访问该URL,那么均需要先通过DNS(Domain Name System,域名解析系)获取到其IP地址,然后才能发送具体的访问请求到该URL相应的服务器中,以获取URL的资源。

本发明实施例则由广告平台对每个URL构建DNS请求,然后向DNS服务器发送该DNS请求,即可从DNS服务器中获取到对应该URL的IP地址。

当然,本发明实施例中,对于没有获取到IP地址的URL,可以不对其进行分类。并且可以认为其连通性验证不通过,因为该URL的查找不到相应的IP地址,则无法访问该广告物料数据对应的URL,该URL对应的广告物料数据则不能上线。

子步骤242,将对应同一个IP地址的网址分为一个验证分组。

每个广告物料数据的网址有对应的IP地址,根据该IP地址对广告物料数据的网址进行分组。那么,同一个IP地址的广告物料数据的网址则分到同一个验证分组中。如图2A所示,验证分组为IP地址1、IP地址2等,验证分组“IP地址1”内,有URL11、URL12、URL13等,验证分组“IP地 址2”内,有URL21、URL22等。

在本发明实施例中,验证分组内的网址也按序排列。

优选地,所述根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组,包括:

子步骤243,根据各个广告物料数据的网址中的主域名,将同一主域名的网址分为一个第一分组;

在实际应用中,各个网址都有一个主域名,比如前述http://www.tuniu.com/guide/d-ouzhou-3600/、http://www.tuniu.com/g3600/tours-bj-0/、http://www.tuniu.com/g3600/pkg-sh-0/几个网址的主域名均为www.tuniu.com。

那么本发明可以将具备同一个主域名的URL分到一个第一分组中,每个第一分组以相应的主域名进行标识。比如上述三个URL就可以分到www.tuniu.com的第一分组中。

子步骤244,根据每个主域名,获取对应所述主域名的IP地址;

那么对于上述第一分组,因为每个第一分组有一个主域名,那么可以获取该主域名的IP地址。

在实际应用中,可以针对该主域名构建一个DNS请求,然后将该DNS请求发送到DNS服务器,从DNS服务器获取相应的IP地址。

子步骤245,将对应同一个IP地址的各个第一分组合为一个验证分组。

在实际应用中,可能很多主域名指向同一个IP地址,那么本发明实施例则可以将同一个IP地址的第一分组,合并为同一个验证分组。

子步骤243-245,先将网址以主域名进行第一次分组,然后只对主域名获取IP地址,再以IP地址划分验证分组,可以减少IP地址的获取量,提高IP地址的获取速度,降低资源消耗。比如对于前述三个http://www.tuniu.com/guide/d-ouzhou-3600/、http://www.tuniu.com/g3600/tours-bj-0/、http://www.tuniu.com/g3600/pkg-sh-0/,如果直接获取IP地址则需要获取3次,而划分第一分组后,只需要获取www.tuniu.com的IP地址即可,如此只需要获取一次IP地址,减少了IP地 址的获取次数。

在实际应用中,可能同一个广告投放方有多个IP地址,为了尽量使该广告投放的IP地址不在验证分组队列中连续存在,可以对各个IP地址的验证分组进行随机排序。

步骤250,对获得的各个验证分组,循环对各个验证分组进行验证;其中,对每个验证分组进行验证时包括:从所述验证分组中未验证的网址中,选择指定个数的网址据进行验证;当对一网址的验证未通过,则查找与所述网址对应的主域名的验证结果;如果所述验证结果表示验证通过,则确认所述网址的验证通过。

比如有10个验证分组,从第1个分组开始进行验证,从该验证分组选择10个未验证广告物料数据的网址进行验证;然后进入第2个验证分组,从该验证分组中选择10个未验证的未验证广告物料数据的网址进行验证;以此类推,到第10个验证分组之后,再循环到第1个验证分组,继续循环,直到所有验证分组的未验证广告物料数据的网址验证完毕。

当前,如果在验证过程中,某个验证分组中的未验证的未验证广告物料数据的网址个数小于指定个数,则选择实际的个数进行验证。

在本发明实施例中,所述指定个数,可以根据需要进行设定。该指定个数的数量级很小,一般不超过百位数。从而可以快速的对各个验证分组进行一轮循环。

优选地,步骤250所述的对获得的各个验证分组,循环对各个验证分组进行验证包括:

子步骤251,判断是否存在还未验证完毕的验证分组;如果存在还未验证完毕的验证分组,则进入步骤252;如果不存在还未验证完毕的验证分组,则进入步骤253;

子步骤252,循环选择下一个未验证完毕的验证分组以进行验证;其中,最后一个验证分组的下一个验证分组为第一个验证分组;

子步骤253,验证结束。

在本发明实施例中,对于各个验证分组,可以先判断是否存在未验证完 毕的验证分组。其中,所述未验证完毕表示该验证分组中还有未验证的网址;如果该验证分组的所有网址都验证过了,则表示对该验证分组验证完毕。

其中,当对一网址的验证未通过,则查找与所述网址对应的主域名的验证结果;如果所述验证结果表示验证通过,则确认所述网址的验证通过。

在实际应用中,在验证过程中,对于一个验证分组,会对其进行是否验证完毕的标记,比如0表示未验证完毕,1表示验证完毕。

对于初始情况下,每个验证分组都存在未验证的网址,因而每个验证分组都被标记为0,则从第一个验证分组开始验证。在对每个验证分组进行验证时,从所述验证分组中未验证的网址中,选择指定个数的网址进行验证。

对一个验证分组进行验证后,如果该验证分组还存在未验证的网址,则不改变0,如果不存在未验证的网址,则将0改变为1。

如此,在循环中,每次对一个验证分组的指定个数的网址验证完之后,可转入子步骤251,判断是否存在还未验证完毕的验证分组。当然,在初始情况下,即第一次验证第一个验证分组之前,不用判断是否存在还未验证完毕的验证分组。

优选地,所述从所述验证分组中未验证的网址中,选择指定个数的网址据进行验证包括:

子步骤254,从未验证的网址中,逐个选择网址进行验证;

在本发明实施例中,对于每个验证分组,其未验证的广告物料数据的网址是按序排列的,可以理解为各个网址形成一个网址队列。

本发明实施例在对每个验证分组进行验证时,则逐个从该网址队列中提取网址进行验证。比如,对于验证分组A,如果其有100条未验证网址,假使指定个数为10。第一次循环到该验证分组时,则提取1-10条网址进行验证,第二次循环到该验证分组时,则提取11-20条网址进行验证。其他情况以此类推。

其中,对每个URL进行验证时包括:

子步骤B11,判断所述对所述网址的验证是否通过:如果对所述网址的验证未通过,则进入子步骤B12;

如果对所述网址的验证通过,则进入子步骤255。

子步骤B12,查找与所述网址对应的主域名的验证结果,并判断所述验证结果是否表示验证通过;如果所述验证结果表示验证通过,则进入子步骤B13;

子步骤B13,确认所述网址的验证通过。

子步骤B13之后,即可进入子步骤255。

子步骤255,在每次选择网址后,如果选择的网址达到指定个数并且还存在未验证的网址,则转入对下一个验证分组的验证过程;

对于一个验证分组,由于设定了每次对该验证分组进行验证时,最多只能选择指定个数的未验证的网址进行验证。那么当步骤254中,逐个提取网址进行验证时,会记录提取的个数,当提取的个数达到指定个数,则会判断最后提取的网址之后是否还有未验证的网址,如果有,则说明剩余的网址需要等待后续轮次的验证。

比如前述例子,验证分组A,如果其有100条未验证网址,其相当于1-100的队列。假使指定个数为10时。第一次循环到该验证分组后,从该队列中逐个提取网址,当提取到第10个,发现还有第11个,则转入对下一个验证分组的验证过程,比如验证分组队列中,下一个验证分组为验证分组B,则切换到对验证分组B的验证。

子步骤256,如果不存在未验证的网址,则将对应的验证分组退出循环过程,转入对下一个验证分组的验证过程。

比如前述例子,验证分组A,第10次循环到该验证分组后,从该队列中的91个开始,逐个提取网址,当提取到第100个,发现没有第101个,则表示该验证分组验证完毕,可以将该验证分组退出循环过程,同时,转入对下一个验证分组的验证过程。

又比如,假使验证分组A有98个未验证网址,指定个数为10。从该队列中的91个开始,逐个提取网址,当提取到第98个,发现没有第99个,只提取了8个,也没达到指定个数10,但是该验证分组A的所有网址也验证完毕,则可以将该验证分组退出循环过程同时,转入对下一个验证分组的 验证过程。

可以理解,子步骤256中无论是否达到指定个数,即选择的网址个数小于或者等于指定个数,当该验证分组的网址验证完毕,将该验证分组退出循环过程同时,转入对下一个验证分组的验证过程。

其中,将验证分组退出循环过程,比如将该验证分组退出验证过程。比如原来有A、B、C、D的验证分组队列,验证分组A验证完毕,其退出循环过程,则验证分组队列为B、C、D。同时,切换到对验证分组B的验证。那么后续的验证则在B、C、D验证分组队列中继续循环。如此,验证分组队列的个数越来越少,减少对验证分组的遍历。

在本发明实施例中,对于验证通过的网址,广告平台会将其该网址对应的广告物料数据上线。然后商家即可从网络中查找到该广告物料数据,该广告物料数据也可投放个各个客户端。

在本发明实施例中,广告平台可以有多个服务器节点对验证分组执行验证功能,各验证分组可以分配到广告平台的多个服务器节点中进行验证。即步骤120之后,还包括:将各验证分组分配到各个服务器节点。比如验证分组A、B、C、D在服务器节点A中验证,验证分组C、D、E、F在服务器节点B中验证。每个服务器节点执行步骤130的过程。

本发明实施例可以根据广告物料数据的网址所对应的IP地址对各个网址进行分组,得到各个验证分组,每个验证分组包括了一系列的广告物料数据的网址;然后每次针对一个验证分组的部分网址(比如10个网址)进行验证,该验证分组的该部分网址验证完毕之后,则转入下一个验证分组;在下一个验证分组中,对下一个验证分组的部分网址进行验证,该部分网址验证完毕之后,则转入下一个验证分组;以此类推,到最后一个验证分组验证完毕之后,则再循环到第一个,如此循环,直到所有验证分组的不存在未验证的网址。

相对于在先技术中,按照广告账户提取广告物料数据的网址,然后直接按照提取顺序进行排序,导致同一个广告账户的广告物料数据的网址在一起,使验证时,当某个广告账户的对于广告物料数据的数据量特别庞大时, 排序在该广告账户之后的广告账户,其广告物料数据的网址则需要等待很长时间才能开始验证。尤其是在一个广告投放方在广告平台中的多个广告账户中上传了大量的广告物料数据的情况下,对于排序在这这些广告账户之后的广告账户,其广告物料数据的网址等待验证的时间更长,相应的广告投放方需要非常长时间才能开始看到有广告物料数据上线。在以各个广告投放方位单位的验证队列中,在先技术的执行过程相当于数据量较大的广告账户完全堵塞了队列,影响后续数据量较小的广告账户的验证。

本发明实施例可以使各个广告账户的广告物料数据的网址可以有部分的快速验证,从而可以有部分的快速上线,使各个广告账户等待上线的时间缩短。对于各个广告账户而言,其可以及时看到上线的广告物料数据。特别是对于广告物料数据的数据量交小的广告账户,较少轮次的循环即可将其广告物料数据的网址全部验证完毕,对于各个广告账户来说,从整体上来说,降低了广告账户等待验证的时间,使验证时间分散到了各个广告账户中,从而提高了广告物料数据的上线速度。本发明实施例可以提高广告平台的公平性和友好性,提高了广告平台的用户体验。

并且,本发明实施例可以从未验证的网址中,对于属于同一主域名的网址,提取一个主域名;然后对该主域名进行连通性验证,并记录验证结果。在后续对各个广告物料数据的网址进行验证的过程中,如果某个网址验证未通过,则去查找该网址对应的主域名的验证结果,如果主域名验证通过,则表示该网址所在的网站是连通的,该网址被误判为不连通,从而还是认为该网址验证通过,可以对相应的广告物料数据上线。由于各个网址所在主域名如果是连通的,在通常情况下,该主域名下的各个网址也是连通的,因此,本发明实施例可以降低广告物料数据的网址的验证过程中,网址的验证被防火墙拦截而导致误判的几率,使相应的广告物料数据可以正常上线。

实施例三

参照图3,其示出了本发明实施例一种广告物料数据网址验证方法的流程示意图,具体可以包括:

步骤312,获取各个未验证的广告物料数据的网址;

步骤314,从各个广告物料数据的网址中,对于属于同一主域名的网址,提取一个主域名;

步骤316,对各个主域名进行验证,并记录验证结果;

步骤318,根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组。

对于步骤312-318,与实施例二相应步骤原理类似,在此不再赘叙。

步骤320,判断是否存在还未验证完毕的验证分组;如果存在还未验证完毕的验证分组,则进入步骤322;,如果不存在还未验证完毕的验证分组,则,进入步骤336。

步骤322,循环选择下一个未验证完毕的验证分组;其中,最后一个验证分组的下一个验证分组为第一个验证分组;

步骤324,从所述验证分组的未验证的网址中,逐个选择网址进行验证;

步骤326,针对每个广告物料数据的网址,判断所述网址的验证是否通过;如果验证未通过,则进入步骤328;如果验证通过,则进入步骤332;

步骤328,查找与所述网址对应的主域名的验证结果,并判断所述验证结果是否表示验证通过;如果所述验证结果表示验证通过,则进入步骤330;如果所述验证结果表示验证未通过,则进入步骤332;

步骤330,确认所述网址的验证通过。

步骤332,在每次选择网址后,判断当前选择的网址的个数是否达到指定个数,以及是否存在未验证的网址;如果选择的网址达到指定个数并且还存在未验证的网址,则进入步骤320;如果不存在未验证的网址,则进入步骤334;

步骤334,将对应的验证分组退出循环过程,进入步骤320。

步骤336,结束验证。

对于步骤320至步骤336的循环过程,下面以一个示例进行描述:

比如步骤318得到验证分组队列:IP地址1、IP地址2、IP地址3。其中:

IP地址1中按序有80个未验证URL。

IP地址2中按序有60个未验证URL。

IP地址3中按序有35个未验证URL。

指定个数为10。

第一轮循环:初始情况下,步骤320判断存在未验证完毕的验证分组IP地址1、IP地址2、IP地址3。则步骤322按序选择第一个验证分组:IP地址1。步骤322中,逐个从IP地址1中提取1-10的URL进行验证。

其中,对每个URL验证时,当该URL验证通过则进入步骤332;当该URL验证不通过,则进入步骤328。步骤328查找与所述网址对应的主域名的验证结果,并判断所述验证结果是否表示验证通过;如果所述主域名的验证结果表示验证通过,则进入步骤330,确认所述网址的验证通过进入步骤332。如果所述主域名的验证结果表示未通过,则直接进入步骤332。

在步骤332中,当提取到第10个时,发现第10个不是最后一个网址,则转入步骤320。

步骤320继续判断存在未验证完毕的验证分组:IP地址1、IP地址2、IP地址3。则步骤322选择下一个验证分组:IP地址2。步骤324中,逐个从IP地址2中提取1-10的网址进行验证。然后经过步骤326-328的步骤。进入步骤332之后,当提取到第10个时,发现第10个不是最后一个网址,则转入步骤320。

步骤320继续判断存在未验证完毕的验证分组:IP地址1、IP地址2、IP地址3。则步骤322选择下一个验证分组:IP地址3。步骤324中,逐个从IP地址3中提取1-10的网址进行验证,然后经过步骤326-328的步骤。进入步骤332之后,当提取到第10个时,发现第10个不是最后一个网址,则转入步骤320。此时IP地址3是验证分组队列的最后一个,则其下一个验证分组则为IP地址1。进入第二轮循环。

按上述原理类推,进入到第四轮循环后,循环到IP地址3,在步骤332中,当提取到第35个时,发现第35个是最后一个网址,则将对应的验证分组退出循环过程,转入步骤320。步骤320判断存在未验证完毕的验证分组: IP地址1、IP地址2。进入第五轮循环。

进入第六轮循环后,循环到IP地址2,在步骤332中,当提取到第60个时,发现第60个是最后一个网址,则将对应的验证分组退出循环过程,转入步骤320。步骤320判断存在未验证完毕的验证分组:IP地址1。进入第七轮循环。

然后就一直对该IP地址1进行验证,直到循环完毕,进入步骤336。

本发明实施例与实施例一、二类似的步骤原理类似,在此不再赘叙。

首先,本发明实施例可以使各个广告账户的广告物料数据的网址可以有部分的快速验证,从而可以有部分的快速上线,使各个广告账户等待上线的时间缩短。对于各个广告账户而言,其可以及时看到上线的广告物料数据。特别是对于广告物料数据的数据量交小的广告账户,较少轮次的循环即可将其广告物料数据的网址全部验证完毕,对于各个广告账户来说,从整体上来说,降低了广告账户等待验证的时间,使验证时间分散到了各个广告账户中,从而提高了广告物料数据的上线速度。本发明实施例可以提高广告平台的公平性和友好性,提高了广告平台的用户体验。

其次,本发明实施例可以降低广告物料数据的网址的验证过程中,网址的验证被防火墙拦截而导致误判的几率,使相应的广告物料数据可以正常上线。

实施例四

参照图4,其示出了本发明实施例一种广告物料数据网址验证装置的结构示意图,具体可以包括:

获取模块410,适于获取各个未验证的广告物料数据的网址;

主域名提取模块420,适于从各个广告物料数据的网址中,对于属于同一主域名的网址,提取一个主域名;

主域名验证模块430,适于对各个主域名进行验证,并记录验证结果;

网址验证模块440,适于对各个广告物料数据的网址进行验证;其中,当对一网址的验证未通过,则查找与所述网址对应的主域名的验证结果;如果所述验证结果表示验证通过,则确认所述网址的验证通过。

实施例五

参照图5,其示出了本发明实施例一种广告物料数据网址验证装置的结构示意图,具体可以包括:

获取模块510,适于获取各个未验证的广告物料数据的网址;

主域名提取模块520,适于从各个广告物料数据的网址中,对于属于同一主域名的网址,提取一个主域名;

主域名验证模块530,适于对各个主域名进行验证,并记录验证结果;

网址验证模块540,具体包括:

IP分组模块542,适于根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组;

循环验证模块543,适于对获得的各个验证分组,循环对各个验证分组进行验证;其中,对每个验证分组进行验证时包括:从所述验证分组中未验证的网址中,选择指定个数的网址据进行验证;其中,当对一网址的验证未通过,则查找与所述网址对应的主域名的验证结果;如果所述验证结果表示验证通过,则确认所述网址的验证通过。

优选地,所述循环验证模块包括:

验证分组判断模块,适于判断是否存在还未验证完毕的验证分组;

循环选择模块,适于如果存在还未验证完毕的验证分组,则循环选择下一个未验证完毕的验证分组以进行验证;其中,最后一个验证分组的下一个验证分组为第一个验证分组;

结束模块,适于如果不存在还未验证完毕的验证分组,则验证结束。

优选地,所述循环验证模块包括:

逐个验证模块,适于从未验证的网址中,逐个选择网址进行验证;

转入判断模块,适于在每次选择网址后,如果选择的网址达到指定个数并且还存在未验证的网址,则转入对下一个验证分组的验证过程;

退出模块,适于如果不存在未验证的网址,则将对应的验证分组退出循环过程,转入对下一个验证分组的验证过程。

优选地,所述IP分组模块包括:

IP地址获取模块,适于根据各个广告物料数据的网址,获取所述网址对应的IP地址;

第一IP分组模块,适于将对应同一个IP地址的网址分为一个验证分组。

优选地,所述IP分组模块包括:

主域名分组模块,适于根据各个广告物料数据的网址中的主域名,将同一主域名的网址分为一个第一分组;

主域名IP获取模块,适于根据每个主域名,获取对应所述主域名的IP地址;

第二IP分组模块,适于将对应同一个IP地址的各个第一分组合为一个验证分组。

实施例六

参照图6,其示出了本发明实施例一种广告物料数据网址验证装置的结构示意图,具体可以包括:

获取模块610,适于获取各个未验证的广告物料数据的网址;

主域名提取模块620,适于从各个广告物料数据的网址中,对于属于同一主域名的网址,提取一个主域名;

主域名验证模块630,适于对各个主域名进行验证,并记录验证结果;

网址验证模块640,具体包括:

IP分组模块642,适于根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据分为一个验证分组。

循环验证模块643,具体包括:

验证分组判断模块6431,适于判断是否存在还未验证完毕的验证分组;如果存在还未验证完毕的验证分组,则进入循环选择模块6432;如果不存在还未验证完毕的验证分组,则进入结束模块6439。

循环选择模块6432,适于如果存在还未验证完毕的验证分组,则循环选择下一个未验证完毕的验证分组以进行验证;其中,最后一个验证分 组的下一个验证分组为第一个验证分组;如果不存在未验证的广告物料数据,则进入退出模块6438。

逐个验证模块6433,适于从未验证的广告物料数据中,逐个选择网址进行验证;

验证判断模块6434,适于针对每个广告物料数据的网址,判断所述网址的验证是否通过;如果验证未通过,则进入结果校验模块6435;如果验证通过,则进入转入判断模块6437;

结果校验模块6435,适于查找与所述网址对应的主域名的验证结果,判断所述验证结果是否表示验证通过;如果所述验证结果表示验证通过,则进入通过确认模块6436;如果所述验证结果表示验证未通过,则进入转入判断模块6437;

通过确认模块6436,确认所述网址的验证通过。

转入判断模块6437,适于在每次选择网址后,判断当前选择的网址的个数是否达到指定个数,以及是否存在未验证的网址;如果选择的广告物料数据达到指定个数并且还存在未验证的广告物料数据,则进入验证分组判断模块6431;

退出模块6438,适于将对应的验证分组退出循环过程,进入验证分组判断模块6431。

结束模块6439,适于如果不存在还未验证完毕的验证分组,则验证结束。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的广告物料数据网址验证设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样 的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

本发明还公开了A1、一种广告物料数据网址验证方法,包括:

获取各个未验证的广告物料数据的网址;

从各个广告物料数据的网址中,对于属于同一主域名的网址,提取一个主域名;

对各个主域名进行验证,并记录验证结果;

对各个广告物料数据的网址进行验证;其中,当对一网址的验证未通过,则查找与所述网址对应的主域名的验证结果;

如果所述验证结果表示验证通过,则确认所述网址的验证通过。

A2、根据A1所述的方法,所述对各个广告物料数据的网址进行验证包括:

根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组;

对获得的各个验证分组,循环对各个验证分组进行验证;其中,对每个验证分组进行验证时包括:从所述验证分组中未验证的网址中,选择指定个数的网址据进行验证。

A3、根据A2所述的方法,所述对获得的各个验证分组,循环对各个验 证分组进行验证包括:

判断是否存在还未验证完毕的验证分组;

如果存在还未验证完毕的验证分组,则循环选择下一个未验证完毕的验证分组以进行验证;其中,最后一个验证分组的下一个验证分组为第一个验证分组;

如果不存在还未验证完毕的验证分组,则验证结束。

A4、根据A2或A3所述的方法,所述从所述验证分组中未验证的网址中,选择指定个数的网址据进行验证包括:

从未验证的网址中,逐个选择网址进行验证;

在每次选择网址后,如果选择的网址达到指定个数并且还存在未验证的网址,则转入对下一个验证分组的验证过程;

如果不存在未验证的网址,则将对应的验证分组退出循环过程,转入对下一个验证分组的验证过程。

A5、根据A2所述的方法,所述根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组包括:

根据各个广告物料数据的网址,获取所述网址对应的IP地址;

将对应同一个IP地址的网址分为一个验证分组。

A6、根据A2所述的方法,所述根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组,包括:

根据各个广告物料数据的网址中的主域名,将同一主域名的网址分为一个第一分组;

根据每个主域名,获取对应所述主域名的IP地址;

将对应同一个IP地址的各个第一分组合为一个验证分组。

本发明公开了B7、一种广告物料数据网址验证装置,包括:

获取模块,适于获取各个未验证的广告物料数据的网址;

主域名提取模块,适于从各个广告物料数据的网址中,对于属于同一主域名的网址,提取一个主域名;

主域名验证模块,适于对各个主域名进行验证,并记录验证结果;

网址验证模块,适于对各个广告物料数据的网址进行验证;其中,当对一网址的验证未通过,则查找与所述网址对应的主域名的验证结果;如果所述验证结果表示验证通过,则确认所述网址的验证通过。

B8、根据B7所述的装置,所述网址验证模块包括:

IP分组模块,适于根据各个广告物料数据的网址所对应的IP地址,将同一IP地址的广告物料数据的网址分为一个验证分组;

循环验证模块,适于对获得的各个验证分组,循环对各个验证分组进行验证;其中,对每个验证分组进行验证时包括:从所述验证分组中未验证的网址中,选择指定个数的网址据进行验证。

B9、根据B8所述的装置,所述循环验证模块包括:

验证分组判断模块,适于判断是否存在还未验证完毕的验证分组;

循环选择模块,适于如果存在还未验证完毕的验证分组,则循环选择下一个未验证完毕的验证分组以进行验证;其中,最后一个验证分组的下一个验证分组为第一个验证分组;

结束模块,适于如果不存在还未验证完毕的验证分组,则验证结束。

B10、根据B8或B9所述的装置,所述循环验证模块包括:

逐个验证模块,适于从未验证的网址中,逐个选择网址进行验证;

转入判断模块,适于在每次选择网址后,如果选择的网址达到指定个数并且还存在未验证的网址,则转入对下一个验证分组的验证过程;

退出模块,适于如果不存在未验证的网址,则将对应的验证分组退出循环过程,转入对下一个验证分组的验证过程。

B11、根据B8所述的装置,所述IP分组模块包括:

IP地址获取模块,适于根据各个广告物料数据的网址,获取所述网址对应的IP地址;

第一IP分组模块,适于将对应同一个IP地址的网址分为一个验证分组。

B12、根据B8所述的装置,所述IP分组模块包括:

主域名分组模块,适于根据各个广告物料数据的网址中的主域名,将同一主域名的网址分为一个第一分组;

主域名IP获取模块,适于根据每个主域名,获取对应所述主域名的IP地址;

第二IP分组模块,适于将对应同一个IP地址的各个第一分组合为一个验证分组。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1