一种曝光日志采集系统和方法

文档序号:9691038阅读:1077来源:国知局
一种曝光日志采集系统和方法
【技术领域】
[0001]本发明涉及到一种网页日志采集系统和方法,更具体地涉及到一种网页曝光日志采集系统和方法。
【背景技术】
[0002]商品的曝光日志是电子商务网站的重要运营数据,它是商品推荐效果评价,转化率分析等工作的必不可少的基础数据。
[0003]在现有技术中,有很多针对商品价格的数据采集方案,如申请号为200410062211.4,发明名称为“利用网络爬行者程序在网上进行价格收集的方法”的中国专利申请公开了一种利用网络爬虫程序在网上进行价格收集的方法;在申请号为201220055227.2,发明名称为“一种户外价格采集对比装置”的中国专利申请公开了一种户外价格采集对比装置,主要用于消费者获取商品信息并与消费数据库数据进行对比。
[0004]但是,在现有技术中,还没有针对商品曝光的数据进行采集的系统或方法。

【发明内容】

[0005]针对电子商务网站中对曝光日志进行采集的需要,依据本发明的一个方面,本发明提供了一种曝光日志采集系统,所述系统包括网页前端服务器、网页浏览客户端和曝光日志采集服务器,其特征在于,
[0006]所述网页前端服务器提供包含具有唯一标示的曝光元素的网页和曝光数据采集工具;
[0007]所述网页浏览客户端下载所述曝光数据采集工具,当曝光元素加载成功后进行曝光数据采集,所述曝光数据采集工具从网页提取曝光元素并向曝光日志采集服务器发送包含有所述曝光元素的唯一标示以及相关信息的曝光数据;
[0008]所述曝光日志采集服务器接收上述曝光数据,并在对该数据进行处理后写入曝光日志。
[0009]优选地,在上述的曝光日志采集系统中,所述曝光数据采集工具被设置在网页的特定位置启动,所述特定位置表明所述曝光元素已经加载成功。
[0010]优选地,在上述的曝光日志采集系统中,所述曝光数据采集工具具有如下工作情旦牙、:
[0011]在曝光元素同步加载并且特定信息被成功展示时所述曝光数据采集工具进行曝光数据采集;或
[0012]在曝光元素同步加载并且特定信息没有成功展示时所述曝光数据采集工具进行曝光数据采集;或
[0013]在曝光元素异步加载并且特定信息被成功展示时所述曝光数据采集工具进行曝光数据采集;或
[0014]在曝光元素异步加载并且特定信息没有成功展示时所述曝光数据采集工具进行曝光数据采集。
[0015]优选地,在上述的曝光日志采集系统中,所述曝光数据采集工具向曝光日志采集服务器发送的相关信息中包含访问数据唯一标示、城市标示和cookield中的一个或多个。
[0016]优选地,在上述的曝光日志采集系统中,所述系统还包括映射服务器,当所述曝光日志采集服务器接收到cookield时,所述曝光日志采集服务器将该cookield推送给所述映射服务器进行cookield映射,然后才写入曝光日志。
[0017]另外一个方面,本发明提供了一种使用权利要求1中所述系统进行曝光日志采集的方法,其特征在于,所述方法包括如下步骤:
[0018]所述网页浏览客户端下载曝光数据采集工具以及包含具有唯一标示的曝光元素的网页;
[0019]在曝光元素加载成功后,启动所述曝光数据采集工具;
[0020]所述曝光数据采集工具从网页提取曝光元素的唯一标示以及相关信息,并组织成曝光数据;
[0021 ] 所述曝光数据采集工具将上述曝光数据发送给所述曝光日志采集服务器;
[0022]所述曝光日志采集服务器接收所述曝光数据,并且在对所述数据进行处理后写入曝光日志。
[0023]优选地,在上述曝光日志采集方法中,所述曝光数据采集工具在页面的特定位置启动,所述位置表明所述曝光元素已经加载成功。
[0024]优选地,在上述曝光日志采集方法中,其特征在于,
[0025]在曝光元素同步加载并且特定信息被成功展示时所述曝光数据采集工具进行曝光数据采集;或
[0026]在曝光元素同步加载并且特定信息没有成功展示时所述曝光数据采集工具进行曝光数据采集;或
[0027]在曝光元素异步加载并且特定信息被成功展示时所述曝光数据采集工具进行曝光数据采集;或
[0028]在曝光元素异步加载并且特定信息没有成功展示时所述曝光数据采集工具进行曝光数据采集。
[0029]优选地,在上述曝光日志采集方法中,所述曝光数据采集工具向曝光日志采集服务器发送的相关信息中包含访问数据唯一标不、城市标不和cookield中的一个或多个。
[0030]优选地,在上述曝光日志采集方法中,所述系统还包括映射服务器,当所述曝光日志采集服务器接收到cookield时,所述曝光日志采集服务器将该cookield推送给所述映射服务器进行cookield映射,然后才写入曝光日志。
[0031]上述曝光日志采集系统和方法,可以应诸如同步加载、异步加载、展示、不展示等各种要求完成曝光日志的采集,并且能通过映射服务器的cookield映射来保护用户的隐私。
【附图说明】
[0032]图1为本发明所述的曝光日志采集系统的示意图;
[0033]图2为本发明所述的曝光日志采集方法的执行步骤。
【具体实施方式】
[0034]下面将结合具体实施例对本发明进行详细说明,但应该明白的是,这些实施例仅用来说明本发明,并不构成对本发明的限定。参考图1,根据本发明的一个实施例,所述的曝光日志采集系统包括网页前端服务器1、网页浏览客户端2和曝光日志采集服务器3。
[0035]其中,网页前端服务器1上提供了一系列的商品展示网页和曝光数据采集工具。其中,例如包含有某个品牌电视机的商品展示网页,在所述网页中包含有如下曝光元素,艮P,网页中包含如下标签:
[0036]<a id = "baoguang_100100123">〈/a>
[0037]其中baoguang_是曝光元素的特定前缀,100100123是该曝光元素的唯一标示。
[0038]在本实施例中曝光数据采集工具是一段javascript代码,为了加载曝光数据采集工具,在所述网页的开始段中包括如下script标签:
[0039]〈script type = "text/javascripi/'src = "baoguang.js^X/script)
[0040]用于在网页浏览客户端2打开上述商品网页时加载曝光数据采集工具。
[0041]上述javascript曝光数据采集工具baoguang.js中包括有曝光数据采集方法OnBaoguang ()。
[0042]为了在网页浏览客户端2加载上述商品展示网页的曝光元素之后进行曝光数据采集,开发人员会在其网页的一个特定位置调用上述工具中的曝光数据采集方法,该位置能确保曝光元素加载完成:
[0043]〈script type = //text/javascript//>OnBaoguang () </script>
[0044]该方法OnBaoguangO会对加载的网页进行分析,获取该网页中的a标签,并将符合特定格式的元素识别为曝光元素,在本实施例中,如果id是以baoguang_开头,则被识别为曝光元素。
[0045]识别出曝光元素后,上述曝光数据采集工具提取所述曝光元素的唯一标示100100123,以及该商品相关的信息,如城市标示cityld,以及用以标定用户的cookield等构造成一个曝光数据,即一个完整的字符串发送给曝光日志采集服务器3。
[0046]所述曝光日志采集服务器3接收上述曝光数据后,会进行相应的处理,将相应的信息写入曝光日志。
[0047]在上述实施例中,曝光元素与网页是同步加载的,并且只有在曝光元素与网页同步加载时才进行曝光数据采集。
[0048]在另外一个实施例中,曝光元素与网页是异步加载的,这种异步加载可以通过javascript的异步特性或是通过网页加载回调来实现。并且,在该异步加载情况下,仍然进行曝光数据采集。
[0049]在其它的实施例中,是否进行曝光数据采集是与特定的网页内容是否已经加载相联系的。
[0050]例如,在一个实施例中,曝光数据采集仅在商品图片被成功展示后才进行,S卩,在上述javascript曝光数据采集工具中对商
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1