广告落地页自动审核方法及系统与流程

文档序号:30084436发布日期:2022-05-18 05:16阅读:372来源:国知局
广告落地页自动审核方法及系统与流程

1.本技术涉及计算机技术领域,特别是涉及一种广告落地页自动审核方法及系统。


背景技术:

2.在互联网高速发展的背景下,信息迎来大爆炸时代,平均每个人每天要经过上百条信息轰炸,在信息输送的主流方式-广告投放上的研究也越来越多。
3.投放广告的主要流程是广告主在广告平台进行广告投放,用户点击用户端应用程序展示页面的广告位进入广告主的广告落地页。为了保证广告主投放的广告没有违规内容,并且为了能够把不同类型的广告投放到对应合适的媒体,在广告投放到广告落地页后,需要对广告落地页进行审核,审核完毕后还要对广告落地页进行二次审核。
4.传统的广告落地页审核方法是通过人工浏览广告落地页中的广告内容进行审核。然而,这种方式有个很大的问题就是审核效率低下。一方面,人工审核速度慢,无法做到及时审核,这会导致广告无法及时投放。另一方面,人工审核容易出现错误遗漏,需要人工复查。


技术实现要素:

5.基于此,有必要针对传统通过人工浏览广告落地页中的广告内容去审核广告落地页的方式导致审核效率低下的问题,提供一种广告落地页自动审核方法及系统。
6.本技术提供一种广告落地页自动审核方法,适用于二次进审的广告落地页,所述方法包括:
7.接收广告落地页进审请求;
8.判断广告落地页中投放的广告是否为旧广告计划;
9.若广告落地页中投放的广告为旧广告计划,则对广告落地页截图,将对广告落地页的截图后生成的图片作为本次进审图片;
10.基于复合感知哈希算法的phash图像配准算法,计算本次进审图片的哈希值;
11.从云服务器中提取广告落地页前一次进审时的进审图片的哈希值;
12.比较本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值,判断广告落地页的内容是否发生变化;
13.若广告落地页的内容未发生变化,则生成与广告落地页相对应的审核通过消息发送至上位机。
14.本技术还提供一种广告落地页自动审核系统,包括:
15.审核终端,用于执行前述内容提及的广告落地页自动审核方法,接收广告落地页进审请求并对广告落地页进行审核,并在所述广告落地页审核通过时,生成审核通过消息;
16.送审终端,与所述审核终端通信连接,用于向所述审核终端发送广告落地页进审请求;
17.上位机,与所述审核终端通信连接,用于接收所述审核终端发送的审核通过消息;
18.云服务器,与所述审核终端通信连接。
19.本技术涉及一种广告落地页自动审核方法及系统,通过送审终端向审核终端发送广告落地页进审请求,审核终端接收广告落地页进审请求后,首先通过判断广告落地页中投放的广告是否为旧广告计划,来对广告落地页进行初步的广告新旧判断,再基于复合感知哈希算法的phash图像配准算法,通过计算本次进审图片的哈希值,和前一次进审时的进审图片的哈希值进行对比,判断广告落地页的内容是否发生变化,最终从实质广告内容上判断广告落地页是否是二次进审,从而确定最终是否审核通过,审核的准确性高,且无须人工审核,大大提高审核效率。
附图说明
20.图1为本技术一实施例提供的广告落地页自动审核方法的流程示意图。
21.图2为本技术一实施例提供的广告落地页自动审核系统的结构示意图。
具体实施方式
22.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
23.本技术提供一种广告落地页自动审核方法。需要说明的是,本技术提供的一种广告落地页自动审核方法应用于二次进审的广告落地页。即本技术提供的广告落地页自动审核方法适用于,在一个广告落地页首次进审之后的第二次进审过程中的审核。
24.此外,本技术提供的广告落地页自动审核方法不限制其执行主体。可选地,本技术提供的广告落地页自动审核方法的执行主体的可以为一个审核终端。
25.如图1所示,在本技术的一实施例中,所述广告落地页自动审核方法包括如下s100至s700:
26.s100,接收广告落地页进审请求。
27.具体地,送审终端向审核终端发送广告落地页进审请求,审核终端接收所述广告落地页进审请求,触发后续审核步骤。
28.s200,判断广告落地页中投放的广告是否为旧广告计划。
29.具体地,本实施例中,当广告落地页首次进审时,审核终端会读取广告落地页中投放的广告的广告信息,依据广告落地页中投放的广告的广告信息,在云服务器中创建广告计划。创建广告计划时,会建立与广告落地页对应的存储单元,且该存储单元通过广告落地页的唯一识别码进行标识。进一步地,审核终端将广告落地页中投放的广告的广告信息发送至与其对应的存储单元中存储。广告落地页的唯一识别码是创建广告落地页时生成的,具有唯一性,用于区别不同的广告落地页。
30.所述s200可以包括:
31.s210,读取广告落地页的唯一识别码,依据以广告落地页的唯一识别码为索引在云服务器搜索与广告落地页的唯一识别码对应的广告信息,判断在云服务器中是否存在与广告落地页的唯一识别码对应的广告信息。
32.s230,若在云服务器中存在与广告落地页的唯一识别码对应的广告信息,则判定
广告落地页中投放的广告为旧广告计划,执行后续s300。
33.由于广告落地页是唯一的,那么如果广告落地页已经经历过首次进审,那么一定会在在云服务器存储过广告信息,可以理解,如果在云服务器中存在与广告落地页的唯一识别码对应的广告信息,则表明广告落地页中投放的广告为旧广告计划,本次进审属于二次进审,可以执行后续步骤。
34.本步骤属于一个初步的广告新旧判断,并没有实际对广告落地页的内容进行审核,这样会筛选出明显包含的广告是新广告计划的广告落地页,提高审核效率。
35.s300,若广告落地页中投放的广告为旧广告计划,则对广告落地页截图,将对广告落地页的截图后生成的图片作为本次进审图片。
36.具体地,若广告落地页中投放的广告为旧广告计划,表明该广告落地页通过了初步的广告新旧判断,可以进入后续的广告落地页内容审核。
37.广告落地页内容审核首先需要对广告落地页截图。对广告落地页截图时,可选地,截图面积大于或等于整个广告落地页覆盖面积的80%,可以使得对广告落地页截图后,图片所包含的信息量可以基本覆盖广告落地页的全部关键信息。
38.s400,基于复合感知哈希算法的phash图像配准算法,计算本次进审图片的哈希值。
39.具体地,本步骤采用了复合感知哈希算法的phash图像配准算法,可以简单、准确且全面的提取本次进审图片中的关键信息,将这些关键信息以哈希值的形式展示。
40.s500,从云服务器中提取广告落地页前一次进审时的进审图片的哈希值。
41.具体地,可选地,在s400计算本次进审图片的哈希值后,执行s500之前,还包括s450,将本次进审图片的哈希值存储于云服务器中,具体地,和广告落地页的唯一识别码相对应的存储。
42.由于广告落地页是二次进审,那么从云服务器中提取广告落地页前一次进审时的进审图片的哈希值,用于后续的两张进审图片的相似度比较。
43.s600,比较本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值,判断广告落地页的内容是否发生变化。
44.具体地,在s400中我们得到了本次进审图片的哈希值。在s500中,我们得到了本次进审图片的哈希值。本步骤中,我们通过比较本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值,从而判断广告落地页的内容是否发生变化。
45.s700,若广告落地页的内容未发生变化,则生成与广告落地页相对应的审核通过消息发送至上位机。
46.具体地,若广告落地页的内容未发生变化,则判定广告落地页二次审核通过,生成与广告落地页相对应的审核通过消息发送至上位机。
47.在s600之后,所述所述广告落地页自动审核方法包括还包括:、
48.s800,若广告落地页的内容未发生变化,则判定广告落地页二次审核失败,生成与广告落地页相对应的审核失败消息发送至上位机。
49.本实施例中,通过送审终端向审核终端发送广告落地页进审请求,审核终端接收广告落地页进审请求后,首先通过判断广告落地页中投放的广告是否为旧广告计划,来对广告落地页进行初步的广告新旧判断,再基于复合感知哈希算法的phash图像配准算法,通
过计算本次进审图片的哈希值,和前一次进审时的进审图片的哈希值进行对比,判断广告落地页的内容是否发生变化,最终从实质广告内容上判断广告落地页是否是二次进审,从而确定最终是否审核通过,审核的准确性高,且无须人工审核,大大提高审核效率。
50.在本技术的一实施例中,所述s600包括如下步骤:
51.s610,判断本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值的差异度是否小于预设差异度。
52.具体地,本实施例中,通过判断本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值的差异度是否小于预设差异度,从而去判断广告落地页的内容是否发生变化。
53.预设差异度可以通过查阅文献资料和学术论文资料设置。
54.在本技术的一实施例中,若本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值的差异度小于预设差异度,则判定广告落地页的内容未发生变化。
55.具体地,本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值的差异度越小,表明两张进审图片相似度越高,表明广告落地页的内容发生变化的概率越低。当本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值的差异度小于预设差异度时,判定广告落地页的内容未发生变化。
56.在本技术的一实施例中,在所述s200之前,所述广告落地页自动审核方法还包括如下s151至s153:
57.s151,依据广告落地页进审请求中的广告主信息,判断所述广告落地页归属的广告主是否处于在投状态。
58.具体地,广告落地页进审请求中包含广告主信息。所述广告主信息包括广告主id,审核通过状态和在投状态中的一种或多种。
59.s152,若所述广告落地页归属的广告主处于在投状态,则执行所述s200。
60.具体地,若所述广告落地页归属的广告主处于在投状态,表明广告主在投状态正常,可以执行后续s200。
61.s153,若所述广告落地页归属的广告主不处于在投状态,则终止后续步骤。
62.具体地,若所述广告落地页归属的广告主不处于在投状态,表明广告主在投状态异常,可能余额不足,此时需要冻结广告主后续的广告投放进程,终止后续步骤。
63.在本技术的一实施例中,所述s300包括如下s310至s320:
64.s310,若广告落地页中投放的广告为旧广告计划,则从云服务器获取与广告落地页中投放的广告对应的优惠卷信息,判断与广告落地页中投放的广告对应的优惠卷信息是否被改动。
65.具体地,前述内容已经阐述了当创建广告计划时,会建立与广告落地页对应的存储单元,且该存储单元通过广告落地页的唯一识别码进行标识。审核终端将广告落地页中投放的广告的广告信息发送至与其对应的存储单元中存储。本实施例中,广告信息还包括优惠卷信息。
66.本步骤中,在对广告落地页截图前,还判断与广告落地页中投放的广告对应的优惠卷信息是否被改动,这样可以防止广告落地页中的广告的优惠卷信息被广告主突然改动,造成广告落地页中的广告信息产生剧变。
67.s320,若与广告落地页中投放的广告对应的优惠卷信息没有被改动,则对广告落地页截图,将对广告落地页的截图后生成的图片作为本次进审图片。
68.具体地,若与广告落地页中投放的广告对应的优惠卷信息没有被改动,则执行对广告落地页截图,将对广告落地页的截图后生成的图片作为本次进审图片。
69.若与广告落地页中投放的广告对应的优惠卷信息被改动,则终止后续步骤,后续要执行针对广告落地页执行首次进审的流程。本技术只适用于二次进审的审核流程,因此必须终止后续步骤,
70.在本技术的一实施例中,所述s400包括如下s410至s480:
71.s410,将本次进审图片的尺寸缩放至32
×
32的尺寸。
72.具体地,一张高频率的图片可以提供详细的信息,而低频率的图片只显示一个框架。一张尺寸大的,详细的图片有很高的频率,而尺寸小的图片缺乏图像细节,因此尺寸小的图片都是低频率的。
73.本步骤为了去除高频和细节,采用了缩放的手段,将本次进审图片的尺寸缩放至32
×
32的尺寸,这里的32
×
32是32像素
×
32像素的意思,总共1025个像素。缩放到32
×
32的尺寸后,本次进审图片变为一个尺寸较小的正方形图块,这样就可以比较任意大小的两张图片,摒弃不同尺寸、比例带来的图片差异。
74.但是缩放不易缩放到很小,以32
×
32的尺寸为最佳,这么做的好处是可以简化后续dct变换的计算量。dct变换的全称是离散余弦变换(discrete cosine transform),是一种数据或图像的压缩方法。
75.s420,将缩放后的本次进审图片转化为灰度图像。
76.具体地,本步骤是为了简化色彩,将1025个像素的可能出现的不同颜色统一转换为黑白颜色来表达的灰度,简化计算量,便于后续处理与计算。
77.s430,对灰度图像进行dct变换,得到32
×
32的dct系数矩阵。
78.具体地,32
×
32的dct系数矩阵中有1024个元素,每个元素都为一个dct系数。
79.s440,截取32
×
32的dct系数矩阵中左上角的8
×
8的dct系数矩阵。
80.具体地,只保留左上角的8
×
8的dct系数矩阵是因为左上角的8
×
8的dct系数矩阵呈现了本次进审图片中的最低频率。
81.s450,计算8
×
8的dct系数矩阵中所有dct系数的平均值,得到dct系数均值。
82.具体地,dct系数均值作为后续比较的一个基准。
83.s460,从8
×
8的dct系数矩阵中任意选取一个dct系数。
84.s470,将选取的dct系数与dct系数均值比较大小,若选取的dct系数大于或等于dct系数均值,则生成一个数位,且该数位的值为1;若选取的dct系数小于dct系数均值,则生成一个数位,且该数位的值为0。
85.s480,返回所述s460,直至8
×
8的dct系数矩阵中的所有dct系数均与dct系数均值进行过比较,将生成的64个数位组合为一个64位的整数,并将该64位的整数作为本次进审图片的哈希值。
86.具体地,经过s460至s470,可以得知每个dct系数相对于dct系数均值的相对比较结构,只要图片的整体结构保持不变,这个64位的整数就不变。
87.需要说明的是,s480中,将生成的64个数位组合为一个64位的整数时,组合的次序
是任意的,但是必须保证每一次执行s480中将生成的64个数位组合为一个64位的整数时,都需要按照这个顺序组合64个数位。
88.本实施例中,采用了复合感知哈希算法的phash图像配准算法,相对于死板将于的单一的均值哈希算法,更加灵活,不易产生错误。
89.在本技术的一实施例中,所述s610包括如下s611至s613:
90.s611,比较本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值的每一个数位的数字。
91.s612,计算数字不同的数位的数量,将数字不同的数位的数量作为本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值的差异度。
92.s613,判断本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值的差异度是否小于预设差异度。
93.具体地,例如,将本次进审图片的哈希值的第1位和前一次进审时的进审图片的哈希值的第1位进行比较,发现都是0,那么数字不同的数位的数量记为0。继续将本次进审图片的哈希值的第2位和前一次进审时的进审图片的哈希值的第2位进行比较,发现都是本次进审图片的哈希值的第2位是1,前一次进审时的进审图片的哈希值的第2位是0,二者不同,那么数字不同的数位的数量记为1,以此类推。例如,最终计算出来数字不同的数位的数量为9,而预设差异度为10,9小于10,则确定本次进审图片的哈希值与广告落地页前一次进审时的进审图片的哈希值的差异度小于预设差异度。
94.本实施例中,采用数字不同的数位的数量计算哈希值差异度的算法,使得对尺度的变化(比如非等比例图片缩放)的适应性和鲁棒性更强。
95.在本技术的一实施例中,若广告落地页的内容未发生变化,在s700之前,所述广告落地页自动审核方法还包括如下s651至s653:
96.s651,识别本次进审图片中的文字信息。
97.具体地,可以通过调用第三方阿里云图片文字识别服务识别本次进审图片中的文字信息。
98.s652,从云服务器中调取关键字映射表,依据所述关键字映射表提取本次进审图片中的文字信息中的关键字,得到本次进审图片中的关键字。
99.具体地,关键字映射表是预先创建的,并存储于云服务器的表格。关键字映射表中展示了哪些文字属于关键字的范畴,因此通过执行本做不做可以提取本次进审图片中的关键字。
100.s653,对本次进审图片中的关键字进行标注,生成已标注关键字的本次进审图片。
101.具体地,可以通过附加标签的方式对次进审图片中的关键字进行标注。
102.本实施例中,通过对本次进审图片中的关键字进行标注,可以对二次进审通过的广告落地页中的关键文字信息进行标注,便于后续审核人员查看。
103.在本技术的一实施例中,所述s700包括如下s710至s730:
104.s710,生成与广告落地页相对应的审核通过消息。
105.s720,建立审核通过日志,将与广告落地页相对应的审核通过消息,以及已标注关键字的本次进审图片存入所述审核通过日志。
106.s730,将所述审核通过日志发送至上位机。
107.具体地,本步骤s710至s730可以生成审核通过日志,便于后续审核人员通过上位机查看。
108.本技术还提供一种广告落地页自动审核系统。
109.如图2所示,在本技术的一实施例中,所述广告落地页自动审核系统包括审核终端100、送审终端200、上位机300和云服务器400。所述审核终端100用于执行如前述任意一个实施例所提及的广告落地页自动审核方法,接收广告落地页进审请求并对广告落地页进行审核,并在所述广告落地页审核通过时,生成审核通过消息。
110.所述送审终端200与所述审核终端100通信连接。所述送审终端200用于向所述审核终端100发送广告落地页进审请求。所述上位机300与所述审核终端100通信连接。所述上位机300用于接收所述审核终端100发送的审核通过消息。所述云服务器400与所述审核终端通信连接。
111.以上所述实施例的各技术特征可以进行任意的组合,各方法步骤也并不做执行顺序的限制,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
112.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1