一种追踪cookie的最长浏览搜索长度的方法与流程

文档序号:15558376发布日期:2018-09-29 01:39阅读:235来源:国知局

本发明涉及计算机互联网领域,优选而言,涉及一种追踪cookie的最长浏览搜索长度的方法。



背景技术:

现有技术在确定各种cookie内最长浏览搜索长度所提供的传统计算内,在每次cookie发生了用户连续的网页浏览后,会尝试在网页浏览的顺序上对转换搜索进行筛选处理,从而追踪当前cookie的最优选的浏览搜索长度,这种传统的方式,非常耗性能,有的甚至用递归或是部署了多少搜索,就会不断的用多少次表连接来达到此目的。目前,在对网站数据进行分析时,通常需要获知用户在网站的指定的几个重要网页间最常使用的访问路径。例依照,网站内有a、b、c、d四个重要网页,预期用户会按照a->b->c->d网页间的顺序进行访问(忽略内间访问了其它网页),而且a->b->c->d这个路径也跟网站的优选业务处理路径相符合。然而,用户在重要网页间真实的访问路径不一定以及网站预期的访问路径相同,而相关技术内无法获知用户在网站上重要网页间的真实访问路径。

针对相关技术内无法获知用户在网站上重要网页间的真实访问路径的问题,目前尚未提出有效的解决方案。。

目前针对相关技术的针对cookie内的转换搜索进行筛选处理得到最优浏览搜索长度的方法消耗资源较大,且降低了性能的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明是为解决上述所提到问题而提出的,其目的在于提出一种追踪cookie的最长浏览搜索长度的方法,用于网页cookie跳转阶段内的路径追踪问题。

本发明的目的并不局限于此,对于未提及的其他目的,本领域技术人员可以通过以下记载明确理解。

为了实现上述目的,依照本发明的一个方面,提供了一种追踪cookie的最长浏览搜索长度的方法,该方法包括:追踪提前部署的浏览搜索列表的搜索部署信息,搜索部署信息包括:搜索浏览列表内各网页的网页标识、各网页的浏览搜索长度及前次浏览搜索长度;获取用户在cookie阶段内浏览网页所产生的搜索信息,搜索信息包括:cookie阶段内各网页的网页标识;将搜索信息以及搜索部署信息进行比对,追踪cookie内各网页经比对后得到浏览搜索长度以及前次浏览搜索长度;依照cookie内各网页经比对后得到浏览搜索长度以及前次浏览搜索长度,来设置cookie内各网页的目的搜索长度;计算cookie内各网页经比对后得到前次浏览搜索长度以及各网页的目的搜索长度的相差数,生成cookie内各网页的浏览搜索长度相差数;提取cookie内浏览搜索长度相差数为1的网页,依照浏览搜索长度相差数为1的网页所对应的浏览搜索长度追踪cookie的最长浏览搜索长度。

通过本发明,采用追踪提前部署的浏览搜索列表的搜索部署信息,搜索部署信息包括:搜索浏览列表内各网页的网页标识、各网页的浏览搜索长度及前次浏览搜索长度;获取用户在cookie阶段内浏览网页所产生的搜索信息,搜索信息包括:cookie阶段内各网页的网页标识;将搜索信息以及搜索部署信息进行比对,追踪cookie内各网页经比对后得到浏览搜索长度以及前次浏览搜索长度;依照cookie内各网页经比对后得到浏览搜索长度以及前次浏览搜索长度,来设置cookie内各网页的目的搜索长度;计算cookie内各网页经比对后得到前次浏览搜索长度以及各网页的目的搜索长度的相差数,生成cookie内各网页的浏览搜索长度相差数;提取cookie内浏览搜索长度相差数为1的网页,依照浏览搜索长度相差数为1的网页所对应的浏览搜索长度追踪cookie的最长浏览搜索长度,解决了相关技术的针对cookie内的转换搜索进行筛选处理得到最优浏览搜索长度的方法消耗资源较大,且降低了性能的问题,通过收集用户在目标网站上的访问信息,找出访问指定网页的cookie,去除cookie内的非重要网页,然后对cookie内包含的环进行切分,最后统计出目标网页间目标访问路径,进而达到了能够获知用户在网站上重要网页间的真实访问路径的效果。

附图说明

被包括来提供对所公开主题的进一步认识的附图,将被并入此说明书并构成该说明书的一部分。附图也阐明了所公开主题的实现,以及连同详细描述一起用于解释所公开主题的实现原则。

没有尝试对所公开主题的基本理解及其多种实践方式展示超过需要的结构细节。

图1是依照本发明追踪cookie的最长浏览搜索长度的方法流程图。

优选实施方式

本发明的优点、特征以及达成所述目的的方法通过附图及后续的详细说明将会明确。

本申请涉及到的搜索是指用户访问网站时发生浏览网页后的搜索信息,注意搜索内相同的网页浏览是可以被合并的,故不会出现类似a->a的搜索信息。

采用马尔可夫随机游走模型,算法思想以及pagerank算法类似:

1)依照果一个站点被其它站点多次引用,那么这个站点可能是重要的;2)一个站点尽管没有被多次引用,但却被一个重要的站点引用,这个站点也可能是重要的;3)一个站点的重要性会通过链接传递到它所引用的站点。假设用户通过网络链接随意的在站点间浏览,当用户没有特定的兴趣时将会随机的跳转到其它的站点内继续浏览

基于词汇的在其最基本的部署内,图1是依照本发明的追踪cookie的最长浏览搜索长度的方法流程图。

依照图1所示,该追踪cookie的最长浏览搜索长度的方法包括依照下步骤:

步骤t10,追踪提前部署的浏览搜索列表的搜索部署信息,搜索部署信息包括:搜索浏览列表内各网页的网页标识、各网页的浏览搜索长度及前次浏览搜索长度。

步骤t30,获取用户在cookie阶段内浏览网页所产生的搜索信息,搜索信息包括:cookie阶段内各网页的网页标识。优选的,该步骤内的搜索信息是获取用户网页浏览的数据。

步骤t50,将搜索信息以及搜索部署信息进行比对,追踪cookie内各网页经比对后得到浏览搜索长度以及前次浏览搜索长度。

步骤t70,依照cookie内各网页经比对后得到浏览搜索长度以及前次浏览搜索长度,来设置cookie内各网页的目的搜索长度。

步骤t90,计算cookie内各网页经比对后得到前次浏览搜索长度以及各网页的目的搜索长度的相差数,生成cookie内各网页的浏览搜索长度相差数。

步骤t110,提取cookie内浏览搜索长度相差数为1的网页,依照浏览搜索长度相差数为1的网页所对应的浏览搜索长度追踪cookie的最长浏览搜索长度。

本申请上述内,在用户发起一次cookie的阶段内,可以基于已经部署好的浏览搜索列表的搜索部署信息,来确定当前cookie内各个网页的浏览搜索长度以及前次浏览步骤,从而进一步设置cookie内各网页的目的搜索长度,最后依照各网页经比对后得到前次浏览搜索长度以及各网页的目的搜索长度进行计算得到各网页的浏览搜索长度相差数,最后通过筛选的得到当前cookie的最长浏览搜索长度。

本申请上述内,步骤t10追踪提前部署的浏览搜索列表的搜索部署信息的步骤可以包括依照下实现方式:

步骤t1,部署浏览搜索列表内的网页以及网页的访问顺序。优选的,该步骤可以通过客户部署浏览搜索列表内的访问搜索,该访问搜索包括访问的网页信息以及网页的访问顺序。

步骤t2,对浏览搜索列表内的网页标记各网页的网页标识、各网页的浏览搜索长度及前次浏览搜索长度。优选的,该步骤可以为各浏览搜索打上当前搜索长度的flag,可以包括当前网页的浏览搜索长度及前次浏览搜索长度。

步骤t3,设置浏览搜索列表内的最后一个网页的浏览搜索长度为特殊搜索长度值。优选的,该步骤可以实现将最后完成的那步部署成特殊值,以区分是否完成。

优选的,上述步骤获取部署好的搜索浏览列表,该搜索浏览列表可以通过客户依照预定信息来部署,搜索部署信息内记录了搜索浏览列表内各网页在部署的搜索浏览列表内的浏览搜索长度及前次浏览搜索长度,同时,可以设置搜索浏览列表内浏览成功时的网页的特殊值,即可以为该搜索浏览列表完成时的网页设置对应的特殊值,例依照,特殊值可以依照100。

本申请上述内,步骤t50将搜索信息以及搜索部署信息进行比对,追踪cookie内各网页经比对后得到浏览搜索长度以及前次浏览搜索长度的步骤可以包括依照下实现方式:

步骤t501,将cookie阶段内各网页的网页标识以及搜索浏览列表内各网页的网页标识进行抽取,得到具有相同网页标识的网页。优选的,是将用户进行网页浏览的搜索信息以及搜索部署信息进行比对其内,在比对成功的情况下执行步骤t502。

步骤t502,提取搜索浏览列表内具有相同网页标识的网页的浏览搜索长度以及前次浏览搜索长度,将浏览搜索长度以及前次浏览搜索长度赋值给cookie内的网页,得到搜索信息内各网页的浏览搜索长度以及前次浏览搜索长度。即输出搜索信息内各网页的cookie标识,搜索部署信息里的当前搜索长度及上一搜索长度。

本申请上述步骤t501至步骤t503实现了,在获取到用户的一次网页浏览之后,记录本次浏览的搜索信息,该搜索信息记录本次网页浏览的网页内容以及浏览顺序。依照上述部署的搜索浏览列表的搜索部署信息,对本次浏览的搜索信息进行比对处理,即为用户的每次网页浏览进行相应的比对,当本次浏览的搜索信息包含在搜索浏览列表内,则比对成功,则记录本次浏览的搜索内各网页的搜索浏览搜索长度,以及搜索浏览的上一搜索长度。

优选的,本申请内,用户可以发出多次cookie,每次cookie会包括多个网页访问,下面就以cookiepage1、page2、page3、page4为例对上述进行详细描述。

上述步骤t501至步骤t503执行后追踪到的源数据可以以数据表的形式保存。

优选的,可知:

cookiepage1内用户访问的3个网页在搜索部署信息内比对成功,即浏览搜索列表内包含此次cookiepage1内所有的浏览网页,其内,首网页在搜索部署信息内经比对后得到浏览搜索长度为1,经比对后得到前次浏览搜索长度为0;次网页在搜索部署信息内经比对后得到浏览搜索长度为2,经比对后得到前次浏览搜索长度为1;再次网页在搜索部署信息内经比对后得到浏览搜索长度为100,经比对后得到前次浏览搜索长度为2。由此可知,当前cookietit1是一个浏览完全成功的cookie。

cookiepage2内用户访问的2个网页在搜索部署信息内比对成功,即浏览搜索列表内包含此次cookiepage2内所有的浏览网页,其内,首网页在搜索部署信息内经比对后得到浏览搜索长度为1,比对到的前次浏览搜索长度为0;次网页在搜索部署信息内经比对后得到浏览搜索长度为1,经比对后得到前次浏览搜索长度为0。由此可知,当前cookietit2是一个浏览没有完全成功的cookie,由于两次访问的网页经比对后得到浏览搜索长度以及前次浏览搜索长度都相同,因此,当前cookietit2是一次重复访问的cookie。

cookiepage3内用户访问的3个网页在搜索部署信息内比对成功,即浏览搜索列表内包含此次cookiepage3内所有的浏览网页,其内,首网页在搜索部署信息内经比对后得到浏览搜索长度为1,经比对后得到前次浏览搜索长度为0;次网页在搜索部署信息内经比对后得到浏览搜索长度为2,经比对后得到前次浏览搜索长度为1;再次网页在搜索部署信息内经比对后得到浏览搜索长度为100,经比对后得到前次浏览搜索长度为5。由此可知,当前cookietit3是一个浏览完全成功的cookie,但由于再次网页经比对后得到前次浏览搜索长度为5,因此,说明比较浏览搜索列表本次cookie内间一些搜索没有目的。

cookiepage4内用户访问的3个网页在搜索部署信息内比对成功,其内,首网页在搜索部署信息内经比对后得到浏览搜索长度为2,经比对后得到前次浏览搜索长度为1;次网页在搜索部署信息内经比对后得到浏览搜索长度为3,经比对后得到前次浏览搜索长度为2;再次网页在搜索部署信息内经比对后得到浏览搜索长度为100,经比对后得到前次浏览搜索长度为3。由此可知,当前cookietit1是一个浏览完全成功的cookie,但缺少部署的浏览搜索列表内的第一网页,即浏览搜索列表内不包含此次cookiepage1内所有的浏览网页,此次cookie是一次无效cookie。

在执行完步骤t50或步骤t502之后,进入获取比对结果做为计算步骤的数据输入的步骤。

优选地,本申请上述内,步骤t70依照cookie内各网页经比对后得到浏览搜索长度以及前次浏览搜索长度,来设置cookie内各网页的目的搜索长度的步骤可以包括依照下实现方式:

步骤t701,按照cookie内各网页的浏览步骤以及前次浏览搜索长度对所有网页按照一定的顺序进行排列,并将排序后的网页内浏览步骤以及/或前次浏览搜索长度相同的网页标记优化flag。该步骤生成一个派生列,例依照:通过cookie标识进行分组,搜索浏览搜索长度升序排序,应用dente_rank进行优化排序,将此值做为派生列。

步骤t702,按照网页的排序结果顺序设置cookie内各网页的目的搜索长度,其内,设置有优化flag的网页的目的搜索长度相同。

优选的,依然以cookiepage1、page2、page3、page4为例对上述进行详细描述。上述步骤t701至步骤t702执行后可以派生一数据列,即派生一列达到搜索长度的编号,可以采用排名函数dente_rank的sqlterver自带函数,按照cookieid进行分组后,为各cookie内的所有网页目的搜索长度进行升序排列,并打上优化后的flag,优化指连续的目的搜索长度会被打上相同的排序编号。

优选的,可知:

cookiepage1内被用户浏览过的若干网页的目的搜索长度分别为1、2、3,即该浏览完全成功的cookie内,三个网页是按照预定部署规则完成访问的。

cookiepage2内用户访问的2个网页的目的搜索长度分别为1、1,即该cookietit2是一个浏览没有完全成功的cookie,其内,第2次访问的网页还是浏览搜索列表内的首网页,两次访问的网页是重复访问搜索得到的,因此,当前cookietit2内两次重复访问的网页所对应的搜索设置了相同的优化flag。

cookiepage3内被用户浏览过的若干网页的目的搜索长度分别为1、2、3,即该浏览完全成功的cookie内,三个网页是按照预定部署规则完成访问的。

cookiepage4内被用户浏览过的若干网页的目的搜索长度分别为1、2、3。

优选地,本申请上述内,在执行完步骤t70或步骤t702之后,进入步骤t90。其内,步骤t90,计算cookie内各网页经比对后得到前次浏览搜索长度以及各网页的目的搜索长度的相差数,生成cookie内各网页的浏览搜索长度相差数。即应用步骤t70或步骤t702得到的值,再减去源数据内的搜索浏览的上一搜索长度,派生此相差数列。

优选的,依然以cookiepage1、page2、page3、page4为例对上述进行详细描述。上述步骤t90执行后可以实现派生排序列的数据表,可以再派生一个相差数列,用于表征浏览搜索长度相差数,优选的计算方式为denterankrownumber-configuredlattttepindex,即使用前次浏览搜索长度以及对应的目的搜索长度做求相差数计算;

优选的,可知:

cookiepage1内各网页派生出来的浏览搜索长度相差数分别为1、1、1,即该浏览完全成功的cookie内,各网页以及预定的搜索部署信息内的浏览搜索长度相同。

cookiepage2内各网页派生出来的浏览搜索长度相差数分别为1、1,即该cookietit2内两个网页以及预定的搜索部署信息内的浏览搜索长度相同。

cookiepage3内各网页派生出来的浏览搜索长度相差数分别为1、1、-2,即该浏览完全成功的cookie内,只有前两个网页以及预定的搜索部署信息内的浏览搜索长度相同。

cookiepage4内各网页派生出来的浏览搜索长度相差数分别为0、0、0,即该cookietit4内所有网页以及预定的搜索部署信息内的浏览搜索长度都不相同。

优选地,本申请上述各个内,在包括多个cookie的情况下,设置各cookie的cookie标识,其内,步骤t110实施阶段内,依照浏览搜索长度相差数为1的网页所对应的浏览搜索长度追踪cookie的最长浏览搜索长度的步骤可以包括依照下实现方式:

步骤t1101,按照cookie标识对cookie进行分组,使得各cookie标识对应至少一个浏览搜索长度相差数。例依照,按照cookieid进行分组。

步骤t1102,在提取cookie内浏览搜索长度相差数为1的网页之后,读取浏览搜索长度相差数为1的网页所对应的浏览搜索长度,得到至少一个预选浏览搜索长度。优选的,该步骤实现了选出所有相差数列为1的数据行,说明连续的搜索访问。

步骤t1103,提取最长的预选浏览搜索长度作为cookie的最长浏览搜索长度。例依照,可以选取分组后各cookieid的数据内最长的浏览搜索长度做为最终的最长浏览搜索长度。

优选的,依然以cookiepage1、page2、page3、page4为例对上述进行详细描述。

其内,上述步骤t1101实现了筛选得到浏览搜索长度相差数为1的cookie。

优选的,可知:

针对浏览搜索长度相差数非1的行,也就说明了其内缺省了某搜索长度,例依照所述的page4,相差数为0则说明在搜索目的搜索长度上,比对搜索前面缺省了一个搜索长度,page3内比对的100搜索长度其相差数列为-2,说明用户在访问该搜索长度时,前面缺少了部署浏览搜索内的3个搜索长度(即3,4,5步)。最后依照上面的结果,再对cookie进行分组,分别取其内ttepindex的最长值,便得到最终的处理结果。

进一步的,再对cookie进行分组,分别取其内ttepindex的最长值,便得到最终的处理结果。

由此可知,cookiepage1是浏览完全成功的cookie,且访问并执行到了最后一步浏览网页。而cookiepage2没有成功完全浏览,仅访问到了首网页便结束;cookiepage3没有成功完全浏览,仅访问到了次网页便结束;cookiepage4没有成功完全浏览,而且第一访问网页都没有访问。

综上可知,本申请提供的示例内,通过对搜索浏览的完成搜索长度,即最后一步的特殊值定义,来区分普通的搜索浏览搜索长度及最后的完成搜索长度;通过利用搜索浏览的当前搜索长度以及上一步的信息的辅助来高效的计算最长目的搜索长度;通过对cookie进行分组,按照搜索浏览搜索长度进行排序,并且应用优化的dente_rank进行排序得到的派生列,并以及搜索浏览的上一步进行相差数序列,确定出相差数为1的特殊记录行说明连续的搜索访问。

需要说明的是,在附图的流程图示出的步骤可以在诸依照一组计算机可执行指令的计算机内执行,并且,虽然在流程图内示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

转向附图,其内相同的参考标号指代相同的元素,本申请的原理被示为在一个合适的计算环境内实现。以下描述基于的本申请的,并且不应认为是关于此处未明确描述的替换而限制本申请。

需要说明的是,对于前述的各方法,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书内所描述的均属于优选,所涉及的动作以及模块并不一定是本申请所必须的。

在上述内,对各个的描述都各有侧重,某个内没有详述的部分,可以参见其他的相关描述。

在本申请所提供的几个内,应该理解到,所揭露的装置,可通过其它的方式实现。例依照,以上所描述的装置仅仅是示意性的,例依照所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例依照多个单元或组件可以结合或者可以集成到另一个,或一些特征可以忽略,或不执行。

在本申请所提供的几个实施例内,应该理解到,所揭露的,装置以及方法,可以通过其它的方式实现。例依照,以上所描述的装置实施例仅仅是示意性的,例依照,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例依照多个单元或组件可以结合或者可以集成到另一个,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

另外,在本发明各个实施例内的各功能单元可以集成在一个处理单元内,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元内。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元依照果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质内。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质内,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(procettor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccettmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的优选实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1