一种基于终端访问的页面停留时长确定方法及装置的制造方法_2

文档序号:9618781阅读:来源:国知局
处理子单元,用于基于所述最后一次非激活时间、所述目标网页的访问开始 时间、所述非浏览器进程激活时间以及预设的网页访问时长阈值,确定所述目标网页的关 闭时间;
[0042] 第四处理子单元,用于基于所述浏览器进程激活时间、所述目标网页的访问开始 时间、所述目标网页之后的下一个访问网页的访问开始时间以及所述目标网页的关闭时 间,确定所述终端针对目标网页的访问结束时间。
[0043] 可选的,所述第三处理子单元,用于判断从所述目标网页的访问开始时间之后的 所述网页访问时长阈值内是否存在非浏览器进程激活时间;若存在至少一个非浏览器进程 激活时间,则确定所述目标网页的关闭时间为所述至少一个非浏览器进程激活时间中最先 激活的时间;若不存在非浏览器进程激活时间,则判断从所述目标网页的访问开始时间起 经过所述网页访问时长阈值之后是否存在非浏览器进程激活时间;若存在非浏览器进程激 活时间,则确定所述目标网页的关闭时间为所述目标网页的访问开始时间与所述网页访问 时长阈值之和;若不存在非浏览器进程激活时间,则确定所述目标网页的关闭时间为所述 最后一次非激活时间。
[0044] 可选的,第四处理子单元,用于判断从所述目标网页的访问开始时间至所述目标 网页之后的下一个访问网页的访问开始时间是否包含于所述浏览器进程激活时间至所述 目标网页的关闭时间内;若包含于,则确定所述终端针对目标网页的访问结束时间为所述 目标网页之后的下一个访问网页的访问开始时间;若不包含于,则判断条件是否成立,所述 条件为:所述目标网页的访问开始时间属于所述浏览器进程激活时间至所述目标网页的关 闭时间内,且所述目标网页之后的下一个访问网页的访问开始时间不属于所述浏览器进程 激活时间至所述目标网页的关闭时间内;若条件成立,则确定所述终端针对目标网页的访 问结束时间为所述目标网页的关闭时间。
[0045] 相比于现有技术,本发明的基于终端访问的页面停留时长确定方法及装置,采集 终端的浏览器进程信息及非浏览器进程信息,求得用户终端的页面停留时长。克服现有的 页面停留时长测量方法,无法解决针对海量数据的分析和挖掘问题。
[0046] 进一步地,本发明的基于终端访问的页面停留时长确定方法及装置,针对终端数 据采集不完全的情况,充分考虑各种可能性,进而准确计算浏览器在某URL访问的开始与 结束时间点。
[0047] 进一步地,本发明的基于终端访问的页面停留时长确定方法及装置,借助hadoop 分布式计算技术,增强了处理海量终端数据的能力。在实际大数据分析项目中,该方法得到 了可靠的结果,能充分满足用户终端上网行为的分析需求。
【附图说明】
[0048]图1为本发明实施例提供的一种基于终端访问的页面停留时长确定方法流程图;
[0049] 图2为本发明实施例提供的一种基于终端访问的页面停留时长确定装置结构图;
[0050] 图3为本发明实施例提供的第一确定单元结构图。
【具体实施方式】
[0051] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明 一部分实施例,而不是全部的实施例。
[0052] 如图1所示,本实施例公开一种基于终端访问的页面停留时长确定方法,该方法 可包括以下步骤101至103 :
[0053] 101、采集终端的浏览器进程信息及非浏览器进程信息。
[0054] 本实施例中,为了米集终端的?目息,需要先米集终端的ID。
[0055] 102、基于所述浏览器进程信息及非浏览器进程信息,确定所述终端针对目标网页 的访问开始时间及访问结束时间。
[0056] 本实施例中的目标网页,即待确定停留时长的网页。
[0057] 103、基于所述访问开始时间及访问结束时间,确定所述终端在目标网页的页面停 留时长。
[0058] 页面停留时长=访问结束时间一访问开始时间。
[0059] 相比于现有技术,本实施例公开的基于终端访问的页面停留时长确定方法,通过 采集终端的浏览器进程信息及非浏览器进程信息,求得用户终端的页面停留时长。克服现 有的页面停留时长测量方法,无法解决针对海量数据的分析和挖掘问题。
[0060] 进一步地,本实施例公开的基于终端访问的页面停留时长确定方法,可借助 hadoop分布式计算技术,增强了处理海量终端数据的能力。在实际大数据分析项目中,该方 法得到了可靠的结果,能充分满足用户终端上网行为的分析需求。
[0061] 在一个具体的例子中,步骤101 :采集终端的浏览器进程信息及非浏览器进程信 息,具体包括:
[0062] 采集终端的浏览器进程创建时间、浏览器进程结束时间、浏览器进程激活时间、浏 览器进程非激活时间、浏览器进程访问网页的地址、浏览器进程访问网页的时间;
[0063] 采集终端的非浏览器进程创建时间、非浏览器进程结束时间、非浏览器进程激活 时间、非浏览器进程非激活时间。
[0064] 需要说明的是,本实施例仅为举例说明,并不限定采集终端的信息,本领域技术人 员可根据实际需要确定采集终端的具体信息,以方便进行大数据分析,比如还可采集终端 的开关机时间,相应地,在没有采集到终端的关机时间时,可基于上述采集的浏览器进程信 息及非浏览器进程信息,确定终端的关机时间。
[0065] 对于开关机时长T计算需要具体分析讨论,主要可以分为四种情况:
[0067] 其中,符号表示不存在,日表示存在,ActiveTime (first)表示终端创建的各进 程的第一次激活时间,DisableTime (last)表示终端创建的各进程的最后一次非激活时 间。举例来说,若终端创建了三个进程,进程1、进程2和进程3,对应的非激活时间分别 为1点、2点和3点,则DisableTime (last)为3点。当然一个进程可能被多次激活或非激 活,比如进程1的非激活时间有2个:1点和3点半,进程2和进程3的非激活时间不变,则 DisableTime (last)为 3 点半。
[0068] 表1给出了实施例采用的字段名称及其描述。
[0069] 表1字段名称及其描述 [0070]
[0071] 基于上述求得到开关机时长T,可过滤掉非用户访问URL时间,从而可以确定每天 开关机时间内,用户访问URL的时间信息。
[0072] 在一个具体的例子中,步骤102 :基于所述浏览器进程信息及非浏览器进程信息, 确定所述终端针对目标网页的访问开始时间及访问结束时间,具体可包括图1中未示出的 步骤1021至1024。
[0073] 1021、基于所述浏览器进程创建时间、所述浏览器进程非激活时间、所述非浏览器 进程创建时间及所述非浏览器进程非激活时间,确定所述终端创建的各进程的最后一次非 激活时间。
[0074] 本实施例中,如果没有采集到最后一次非激活时间,则通过下式确定最后一次非 激活时间:
[0075] DisableTime(last) = ActiveTime(last)+topActiveTime(last)
[0076] 其中,DisableTimedast)表示终端创建的各进程的最后一次非激活时间, ActiveTime (last)表示终端创建的各进程的最后一次激活时间,topActiveTime (last)表 示终端创建的各进程的最后一次处于顶层且处于活动状态(或称为激活状态)的时长。 topActiveTime (last)也可以在采集终端的信息时采集到。
[0077] 1022、基于所述浏览器进程访问网页的地址及所述浏览器进程访问网页的时间, 确定目标网页的访问开始时间以及所述目标网页之后的下一个访问网页的访问开始时间。
[0078] 1023、基于所述最后一次非激活时间、所述目标网页的访问开始时间、所述非浏览 器进程激活时间以及预设的网页访问时长阈值,确定所述目标网页的关闭时间。
[0079] 本实施例中,所述目标网页的关闭时间可以理解为终端通过浏览器进程关闭目标 网页的时间。
[0080] 本实施例中,网页访问时长阈值可根据不同需求进行设置,本实施例不限定网页 访问时长阈值的具体值。
[0081] 1024基于所述浏览器进程激活时间、所述目标网页的访问开始时间、所述目标网 页之后的下一个访问网页的访问开始时间以及所述目标网页的关闭时间,确定所述终端针 对目标网页的访问结束时
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1