一种网页追踪用户访问链路的方法、设备及存储设备与流程

文档序号:14488849阅读:349来源:国知局
一种网页追踪用户访问链路的方法、设备及存储设备与流程

本发明涉及网页技术领域,具体涉及一种网页追踪用户访问链路的方法、设备及存储设备。



背景技术:

随着互联网的快速发展,互联网安全领域中针对恶意用户,主要采用机器爬虫的识别技术进行甄别。其中,就包含对用户在网页上的操作链路的分析。分析的首要步骤就是对用户在网页访问链路的收集,现有的技术解决方案是通过javascript来获取网页html文档的referrer属性来确定源网页的url。

现有的方案获取到的url无法区别相同地址重复打开两次的网页。例:用户打开了两个a网页,url均为www.a.com,此时用户通过a网页中的链接跳转到b网页,那么b网页的referrer属性则为www.a.com,无法确认用户到底是从哪一个a网页跳转而来。网站主可以通过给每个网页的跳转地址动态地加上特殊标识,这样就需要会对既有网站的改造,需要一定的工程量。如果作为第三方服务,想获取用户的访问链路,则没有权限对网站本身结构进行修改,因此前述对网站进行改造的方法也无法使用。因此,找到一种可以唯一确认源网页,不用修改网页主体,不会影响用户正常操作,并且可以用于第三方服务的方法就成为亟待解决的问题。



技术实现要素:

本发明提供了一种网页追踪用户访问链路的方法、设备及存储设备,通过另行存储生成的网页标识符,并在网页跳转前将标识符加载到网页的url中,可以有效解决上述问题。

本发明提供的技术方案是:一种网页追踪用户访问链路的方法,所述方法包括步骤:加载一网页;生成所述网页的标识符并将所述标识符存储在存储设备中;在所述网页发生跳转之前对该网页添加所述标识符;执行对所述网页的网页跳转;完成网页跳转并确定跳转后新网页的源网页。存储设备,所述存储设备存储指令及数据用于实现所述一种网页追踪用户访问链路的方法。一种网页追踪用户访问链路的设备,所述设备包括处理器及所述存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现所述的一种网页追踪用户访问链路的方法。

本发明的有益效果是:本发明提供了一种网页追踪用户访问链路的方法、设备及存储设备,通过另行存储生成的网页标识符,并在网页跳转前将标识符加载到网页的url中,可以在跳转后的新网页中有效识别源网页。同时,整个过程中不会对网页主体进行修改,也不会影响用户的正常操作,更不需要修改网站原有代码,因此可用于第三方服务。

附图说明

图1是本发明第一实施例中网页追踪用户访问链路的方法的整体流程图;

图2是本发明第二实施例中采用改进open窗口法追踪用户访问链路的方法步骤流程图;

图3是本发明第三实施例中采用标签法追踪用户访问链路的方法步骤流程图;

图4是本发明实施例中的html文档的referrer属性功能示意图;

图5是本发明实施例的硬件设备工作示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述,下文中提到的具体技术细节,如:方法,设备等,仅为使读者更好的理解技术方案,并不代表本发明仅局限于以下技术细节。

本发明的实施例提供了一种网页追踪用户访问链路的方法、设备及存储设备。请参阅图1,图1是本发明第一实施例中网页追踪用户访问链路的方法的整体流程图,所述方法由硬件设备实现,具体步骤包括:

s101:加载一网页。

s102:生成所述网页的标识符并将所述标识符存储在存储设备中。所述标识符具有唯一性,即,唯一标识网页。

s103:在所述网页发生跳转之前对该网页添加所述标识符。

s104:执行对所述网页的网页跳转。

s105:完成网页跳转并确定跳转后新网页的源网页。所述新网页中的referrer属性值形式为:网址加唯一标识符。网页跳转完成后,将所述源网页中的url回复原状态,即,去掉源网页的url中的标识符。网页跳转具体采用代理方式进行跳转。

参加图2,图2是本发明第二实施例中采用改进open窗口法追踪用户访问链路的方法步骤流程图,包括:

s201:加载一网页。

s202:生成所述网页的标识符并将所述标识符存储在存储设备中。所述标识符具有唯一性,即,唯一标识网页。

s203:保证所述网页未跳转。

s204:通过html5的history接口在所述网页的url中添加所述标识符。

s205:进行现有调用open新窗口进行的跳转。

s206:完成网页跳转并确定跳转后新网页的源网页。所述新网页中的referrer属性值形式为:网址加唯一标识符。网页跳转完成后,将所述源网页中的url回复原状态,即,去掉url中的标识符。网页跳转具体采用代理方式进行跳转。

参见图3,图3是本发明第三实施例中采用标签法追踪用户访问链路的方法步骤流程图,包括:

s301:加载一网页。

s302:生成所述网页的标识符并将所述标识符存储在存储设备中。所述标识符具有唯一性,即,唯一标识网页。

s303:判断标签是否为有效跳转链接。

s304:如果不是,则不执行网页跳转。

s305:如果是,保证所述网页未跳转。

s306:通过html5的history接口在所述网页的url中添加所述标识符。

s307:完成网页跳转并确定跳转后新网页的源网页。所述新网页中的referrer属性值形式为:网址加唯一标识符。网页跳转完成后,将所述源网页中的url回复原状态,即,去掉url中的标识符。网页跳转具体采用代理方式进行跳转。

参见图4,图4是本发明实施例中的html文档的referrer属性功能示意图,包括:跳转后新网页的url401,referrer属性代码402,源网页url403,标识符404。由图中可见,在现有技术中执行referrer属性代码402后,会得到跳转后新网页的url401的源网页url403,通过执行本发明的技术方案后,就可以的到源网页url403及标识符404,从而唯一确定新网页的源网页。

参见图5,图5是本发明实施例的硬件设备工作示意图,所述硬件设备具体包括:一种网页追踪用户访问链路的设备501、处理器502及存储设备503。

网页追踪用户访问链路的设备501:所述一种网页追踪用户访问链路的设备501实现所述一种网页追踪用户访问链路的方法。

处理器502:所述处理器502加载并执行所述存储设备503中的指令及数据用于实现所述的一种网页追踪用户访问链路的方法。

存储设备503:所述存储设备503存储指令及数据;所述存储设备503用于实现所述的一种网页追踪用户访问链路的方法。

通过执行本发明的实施例,本发明权利要求里的所有技术特征都得到了详尽阐述。

区别于现有技术,本发明的实施例提供了一种网页追踪用户访问链路的方法、设备及存储设备,通过另行存储生成的网页标识符,并在网页跳转前将标识符加载到网页的url中,可以在跳转后的新网页中有效识别源网页。同时,整个过程中不会对网页主体进行修改,也不会影响用户的正常操作,更不需要修改网站原有代码,因此可用于第三方服务。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1