实现互联网用户访问情况统计分析的方法及装置的制作方法

文档序号:6426256阅读:137来源:国知局
专利名称:实现互联网用户访问情况统计分析的方法及装置的制作方法
技术领域
本发明涉及互联网服务提供商统计分析服务网站受访情况的方法,尤其涉及基于Cookie实现网站受访情况统计分析的方法及装置。
背景技术
Cookie是服务器暂时存放在上网用户的电脑里的资料,即ー种文本文件,以便让服务器能够识别网络用户身份。当用户访问某ー网站吋,Web服务器会首先传递ー份Cookie资料放在用户的机器上,将用户在访问网站时所输入的文字或做的一些选择记录下来。当用户再次访问同一个网站吋,Web服务器若查询到该用户机留有Cookie资料,便会依据Cookie资料的内容来判断用户机,并送出特定的网页内容给用户机。 网站服务提供商可以利用cookie跟踪统计分析访问网站的访问频次和用户行为习惯。其中,用户行为包括浏览网站中的网页,点击网页中的广告,在网上进行购买活动,浏览网上商品,点播IPTV频道节目等;访问频次例如根据对访问页面、访问时间(在每个网页上的停留时间)、点击某ー网站链接的次数以及用户的上网时间等行为习惯进行的分析,统计出访问总人数、人均访问次数以及不同访问次数的人数分布分析等。利用统计分析出的这些受访情况信息,一方面可以为用户提供个性化的网络服务,另一方面,也可以作为了解网络用户行为习惯的工具,用于改进网站经营策略。随着互联网技术的高速发展,网络上的信息越来越多,能够提供的商品和信息服务越来越丰富,人们的生活也越来越依赖于网络,互联网用户呈爆炸式地增长。信息提供商希望通过统计分析用户的访问频次和浏览行为习惯,发现影响网站流量的相关因素,以便改善产品的质量和服务的针对性,吸引更多目标用户的访问。广告主则希望更科学地评价其广告投放的效果,并由此改善广告投放策略,将有限的广告资源更精准地集中针对潜在的客户上。目前,针对互联网用户访问频次和行为的分析,主要是基于浏览器Cookie或Flash cookie (Share 0b ject),即把Cookie与用户等同起来。比如,当统计出一个网站的访问次数大于两次的Cookie有2000个,则认为访问该网站大于两次的人有2000人。然而,依据Cookie进行统计分析存在以下问题由于用户可以自行删除cookie,或者直接阻止cookie,因此通常Cookie的生命周期要比用户短很多,一个用户有可能对应了多个CookieAookie实际只相当于用户在某段时间的行为片段;因此直接基于Cookie来统计分析相当于将ー个用户割裂为多个用户,使得统计出的用户访问频次和行为数据会与实际的结果产生较大的误差,从而导致网站受访分析的结果缺乏真实性。

发明内容
本发明所要解决的技术问题是提供一种实现互联网用户访问情况统计分析的方法及装置,能够避免统计的用户行为的关联性丢失和统计误差。为了解决上述技术问题,本发明提供了一种实现互联网用户访问情况统计分析的方法,包括提取及记录每一来访用户对象所代表的用户机的信息,根据用户机的信息的相似度合并用户对象。进ー步地,提取及记录每一来访用户对象所代表的用户机的信息,根据所述用户机的信息的相似度合并所述用户对象,具体包括为每ー来访的用户对象分配ー个唯一标识,针对用户对象提取并记录用户机的信息,包括IP地址、浏览器类型及其版本、操作系统类型及其版本、屏幕分辨率以及Flash版本信息中的ー种或多种;针对用户机的信息的重要性或相关程度为所述信息赋予相应的权重,包括用户机的第I信息至第η信息的各个权重,η为大于I的整数;
按如下公式计算各用户对象之间的相似度=Σ第N信息的权重*用户对象之间第N信息的相似度;式中,用户对象之间第N信息的相似度,是指该第N信息具有信息重叠部分占总信息的比率;Ν = I η ;将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的所述新用户对象重新分配ー个唯一标识,并存储新用户对象的所述标识和描述合并后浏览行为的对应关系记录。进ー步地,该方法还包括记录用户对象的浏览行为,根据用户机的信息的相似度和浏览行为的相似度合并用户对象。进ー步地,记录用户对象的浏览行为,根据用户机的信息的相似度和浏览行为的相似度合并用户对象,具体包括记录浏览行为,包括浏览网站及其页面、浏览总时间、浏览总频次以及浏览网站频道的频次行为中的ー种或多种;针对用户机的信息和浏览行为的重要性或相关程度为所述信息和浏览行为赋予相应的权重,包括用户机的第I信息至第η信息的各个权重,用户对象第I浏览行为至第m浏览行为的各个权重,n、m分别为大于I的整数;按如下公式计算各用户对象之间的相似度= Σ第N信息的权重*用户对象之间第N信息的相似度+ Σ第M浏览行为的权重*用户对象之间第M浏览行为的相似度;式中,用户对象之间第M浏览行为的相似度通过求取浏览网站频道的频次占浏览总频次的比率计算;N=l n;M=l m;将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的新用户对象重新分配ー个唯一标识,并存储新用户对象的标识和描述合并后浏览行为的对应关系记录。为了解决上述技术问题,本发明提供了一种实现互联网对象受访情况统计分析的方法,包括提取及记录每一来访用户对象所代表的用户机的信息,根据用户机的信息的相似度合并用户对象;
记录合并的用户对象的浏览行为,根据该记录统计分析网站受访情況。为了解决上述技术问题,本发明提供了一种实现互联网用户访问情况统计分析的装置,包括用户机信息提取模块、存储模块以及用户合并模块,其中用户机信息提取模块,用于提取每ー来访用户对象所代表的用户机的信息,并将提取的信息记录在存储模块中用户机信息记录中;用户合并模块,用于根据存储模块记录中的用户机的信息的相似度合并用户对象,并将合并后的用户对象所发生的浏览行为记录在存储模块中合并用户行为记录中;存储模块,至少用于存储用户机信息和合并用户行为记录。进ー步地,用户合并模块针对所述用户机的信息的重要性或相关程度为信息赋予相应的权 重,根据权重及用户机的信息的相似度计算各用户对象之间的相似度,将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的新用户对象重新分配ー个唯一标识,并存储新用户对象的标识和描述合并后浏览行为的对应关系记求。进ー步地用户行为记录模块,用于将记载在用户机信息和行为记录中的用户对象所发生的浏览行为记录在用户行为记录中;用户合并模块还根据用户机的信息和浏览行为的相似度合并用户对象,并将合并后的用户对象所发生的浏览行为记录在存储模块中合并用户行为记录中;存储模块还存储用户行为记录。进一步地,用户机信息提取模块为每一来访的用户对象分配ー个唯一标识;针对用户对象提取并记录的用户机的信息包括IP地址、浏览器类型及其版本、操作系统类型及其版本、屏幕分辨率以及Flash版本信息中的ー种或多种;用户行为记录模块记录的用户对象的浏览行为包括浏览网站及其页面、浏览总时间、浏览总频次以及浏览网站频道的频次行为中的ー种或多种;用户合并模块针对用户机的信息和浏览行为的重要性或相关程度赋予相应的权重,根据所述权重、用户机的信息的相似度以及浏览行为的相似度计算各用户对象之间的相似度,将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的新用户对象重新分配ー个唯一标识,并存储新用户对象的标识和描述合并后浏览行为的对应关系记录。进ー步地,该装置还包括统计分析模块,其中统计分析模块,用于根据存储模块中合并用户行为记录统计用户访问频次及用户行为,并将生成的结果报告存储在存储模块中的结果报告记录中;存储模块还用于存储统计分析模块生成的结果报告。本发明通过学习过程,对不同的Cookie所代表的用户机的信息以及对Cookie所发生的浏览行为的记录对用户相似程度进行判断,将有可能是同一个用户产生的Cookie进行合并,并基于合并后Cookie的浏览行为记录统计分析访问频次和浏览行为习惯,由此可避免因用户清除Cookie等因素造成的用户行为关联性丢失和统计误差,从而能够真实客观地评价网站的受访情况。


图I为本发明的互联网用户访问情况统计分析的方法实施例的流程图;图2为本发明的互联网用户访问情况统计分析的装置实施例的结构框图。
具体实施例方式以下结合附图和优选实施例对本发明的技术方案进行详细地阐述。以下例举的实施例仅用于说明和解释本发明,而不构成对本发明技术方案的限制。如图I所示,是为本发明的实现互联网用户访问情况统计分析的方法实施例的流程,包括如下步骤
110 :提取及记录每一来访用户对象(即Cookie)所代表的用户机的信息;首先为每ー个来访Cookie分配ー个唯一标识(ID),提取并记录每个Cookie所代表的用户机的信息,包括IP地址、浏览器类型及其版本、操作系统类型及其版本以及屏幕分辨率等机器信息中的一种或多种。记录的Cookie用户机的信息和/或浏览行为如表I所示。表I
权利要求
1.一种对互联网用户访问情况统计分析的方法,包括 提取及记录每一来访用户对象所代表的用户机的信息,根据所述用户机的信息的相似度合并所述用户对象。
2.按照权利要求I所述的方法,其特征在于,所述提取及记录每一来访用户对象所代表的用户机的信息,根据所述用户机的信息的相似度合并所述用户对象,具体包括 为每一来访的所述用户对象分配一个唯一标识,针对所述用户对象提取并记录所述用户机的信息,包括IP地址、浏览器类型及其版本、操作系统类型及其版本、屏幕分辨率以及Flash版本信息中的一种或多种; 针对所述用户机的信息的重要性或相关程度为所述信息赋予相应的权重,包括用户机的第I信息至第η信息的各个权重,所述η为大于I的整数; 按如下公式计算各用户对象之间的相似度 =Σ第N信息的权重*所述用户对象之间第N信息的相似度; 式中,所述用户对象之间第N信息的相似度,是指该第N信息具有信息重叠部分占总信息的比率;所述N = I η ; 将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的所述新用户对象重新分配一个唯一标识,并存储所述新用户对象的所述标识和描述合并后浏览行为的对应关系记录。
3.按照权利要求2所述的方法,其特征在于,还包括 记录所述用户对象的浏览行为,根据所述用户机的信息的相似度和所述浏览行为的相似度合并所述用户对象。
4.按照权利要求3所述的方法,其特征在于,记录所述用户对象的浏览行为,根据所述用户机的信息的相似度和所述浏览行为的相似度合并所述用户对象,具体包括 记录所述浏览行为,包括浏览网站及其页面、浏览总时间、浏览总频次以及浏览网站频道的频次行为中的一种或多种; 针对所述用户机的信息和所述浏览行为的重要性或相关程度为所述信息和所述浏览行为赋予相应的权重,包括用户机的第I信息至第η信息的各个权重,用户对象第I浏览行为至第m浏览行为的各个权重,所述n、m分别为大于I的整数; 按如下公式计算各用户对象之间的相似度 =Σ第N信息的权重*所述用户对象之间第N信息的相似度 + Σ第M浏览行为的权重*所述用户对象之间第M浏览行为的相似度; 式中,所述用户对象之间第M浏览行为的相似度通过求取浏览网站频道的频次占浏览总频次的比率计算;所述N = I η ;所述M= I m ; 将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的所述新用户对象重新分配一个唯一标识,并存储所述新用户对象的所述标识和描述合并后浏览行为的对应关系记录。
5.一种实现互联网对象受访情况统计分析的方法,包括 提取及记录每一来访用户对象所代表的用户机的信息,根据所述用户机的信息的相似度合并所述用户对象; 记录合并的用户对象的浏览行为,根据该记录统计分析网站受访情况。
6.一种实现互联网用户访问情况统计分析的装置,其特征在于,包括用户机信息提取模块、存储模块以及用户合并模块,其中 用户机信息提取模块,用于提取每一来访用户对象所代表的用户机的信息,并将提取的信息记录在存储模块中用户机信息记录中; 用户合并模块,用于根据存储模块记录中的所述用户机的信息的相似度合并所述用户对象,并将合并后的用户对象所发生的浏览行为记录在存储模块中合并用户行为记录中;存储模块,至少用于存储所述用户机信息和所述合并用户行为记录。
7.按照权利要求6所述的装置,其特征在于, 所述用户合并模块针对所述用户机的信息的重要性或相关程度为所述信息赋予相应的权重,根据所述权重及所述用户机的信息的相似度计算各用户对象之间的相似度,将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的所述新用户对象重新分配一个唯一标识,并存储所述新用户对象的所述标识和描述合并后浏览行为的对应关系记录。
8.按照权利要求7所述的装置,其特征在于,还包括用户行为记录模块,其中 用户行为记录模块,用于将记载在所述用户机信息和行为记录中的用户对象所发生的浏览行为记录在用户行为记录中; 所述用户合并模块还根据所述用户机的信息和所述浏览行为的相似度合并所述用户对象,并将合并后的用户对象所发生的浏览行为记录在存储模块中合并用户行为记录中;所述存储模块还存储所述用户行为记录。
9.按照权利要求8所述的装置,其特征在于, 所述用户机信息提取模块为每一来访的所述用户对象分配一个唯一标识;针对所述用户对象提取并记录的所述用户机的信息包括IP地址、浏览器类型及其版本、操作系统类型及其版本、屏幕分辨率以及Flash版本信息中的一种或多种; 所述用户行为记录模块记录的所述用户对象的浏览行为包括浏览网站及其页面、浏览总时间、浏览总频次以及浏览网站频道的频次行为中的一种或多种; 所述用户合并模块针对所述用户机的信息和所述浏览行为的重要性或相关程度赋予相应的权重,根据所述权重、所述用户机的信息的相似度以及所述浏览行为的相似度计算各用户对象之间的相似度,将相似度大于或等于预定阈值的用户对象合并成代表一个互联网用户的新用户对象,为合并后的所述新用户对象重新分配一个唯一标识,并存储所述新用户对象的所述标识和描述合并后浏览行为的对应关系记录。
10.按照权利要求7至9任一项所述的装置,其特征在于,还包括统计分析模块,其中 统计分析模块,用于根据所述存储模块中所述合并用户行为记录统计用户访问频次及用户行为,并将生成的结果报告存储在所述存储模块中的结果报告记录中; 所述存储模块还用于存储统计分析模块生成的所述结果报告。
全文摘要
本发明披露了实现互联网用户访问情况统计分析的方法及装置,其中方法包括提取及记录每一来访用户对象所代表的用户机的信息,根据用户机的信息的相似度合并用户对象。本发明通过学习过程记录不同的Cookie所代表的用户机的信息以及对Cookie所发生的浏览行为,对用户相似程度进行判断,将有可能是同一个用户产生的Cookie进行合并,并基于合并后Cookie的浏览行为记录统计分析访问频次和浏览行为习惯,由此可避免因用户清除Cookie等因素造成的用户行为关联性丢失和统计误差,从而能够真实客观地评价网站的受访情况。
文档编号G06F17/30GK102831114SQ20111015936
公开日2012年12月19日 申请日期2011年6月14日 优先权日2011年6月14日
发明者陈家耀, 申志辉, 欧阳佑 申请人:北京思博途信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1