一种基于终端访问的页面停留时长确定方法及装置的制造方法_3

文档序号:9618781阅读:来源:国知局
间。
[0082] 本实施例公开的基于终端访问的页面停留时长确定方法,针对采集终端数据不完 全的情况,充分考虑各种可能性,进而准确计算浏览器在某URL访问的开始与结束时间点。
[0083] 在一个具体的例子中,步骤1023 :基于所述最后一次非激活时间、所述目标网页 的访问开始时间、所述非浏览器进程激活时间以及预设的网页访问时长阈值,确定所述目 标网页的关闭时间,具体过程如下(1)至(5):
[0084] (1)判断从所述目标网页的访问开始时间之后的所述网页访问时长阈值内是否存 在非浏览器进程激活时间;
[0085] (2)若存在至少一个非浏览器进程激活时间,则确定所述目标网页的关闭时间为 所述至少一个非浏览器进程激活时间中最先激活的时间;
[0086] (3)若不存在非浏览器进程激活时间,则判断从所述目标网页的访问开始时间起 经过所述网页访问时长阈值之后是否存在非浏览器进程激活时间;
[0087] (4)若存在非浏览器进程激活时间,则确定所述目标网页的关闭时间为所述目标 网页的访问开始时间与所述网页访问时长阈值之和;
[0088] (5)若不存在非浏览器进程激活时间,则确定所述目标网页的关闭时间为所述最 后一次非激活时间。
[0089] 在一个具体的例子中,步骤1024 :基于所述浏览器进程激活时间、所述目标网页 的访问开始时间、所述目标网页之后的下一个访问网页的访问开始时间以及所述目标网页 的关闭时间,确定所述终端针对目标网页的访问结束时间,具体过程如下1)至4):
[0090] 1)判断从所述目标网页的访问开始时间至所述目标网页之后的下一个访问网页 的访问开始时间是否包含于所述浏览器进程激活时间至所述目标网页的关闭时间内;
[0091] 本实施例中,所述浏览器进程激活时间至所述目标网页的关闭时间内,可选为:时 间上最接近目标网页的访问开始时间的浏览器进程激活时间至所述目标网页的关闭时间 内。
[0092] 2)若包含于,则确定所述终端针对目标网页的访问结束时间为所述目标网页之后 的下一个访问网页的访问开始时间;
[0093] 3)若不包含于,则判断条件是否成立,所述条件为:所述目标网页的访问开始时 间属于所述浏览器进程激活时间至所述目标网页的关闭时间内,且所述目标网页之后的下 一个访问网页的访问开始时间不属于所述浏览器进程激活时间至所述目标网页的关闭时 间内;
[0094] 4)若条件成立,则确定所述终端针对目标网页的访问结束时间为所述目标网页的 关闭时间。
[0095] 相比于现有技术,上述实施例公开的基于终端访问的页面停留时长确定方法,采 集终端的浏览器进程信息及非浏览器进程信息,求得用户终端的页面停留时长。克服现有 的页面停留时长测量方法,无法解决针对海量数据的分析和挖掘问题。
[0096] 进一步地,上述实施例公开的基于终端访问的页面停留时长确定方法,针对终端 数据采集不完全的情况,充分考虑各种可能性,进而准确计算浏览器在某URL访问的开始 与结束时间点。
[0097] 进一步地,上述实施例公开的基于终端访问的页面停留时长确定方法,借助 hadoop分布式计算技术,增强了处理海量终端数据的能力。在实际大数据分析项目中,该方 法得到了可靠的结果,能充分满足用户终端上网行为的分析需求。
[0098] 如图2所示,本实施例公开一种基于终端访问的页面停留时长确定装置,该装置 可包括以下单元:采集单元21、第一确定单元22以及第二确定单元23。
[0099] 采集单元21,用于采集终端的浏览器进程信息及非浏览器进程信息;
[0100] 第一确定单元22,用于基于所述浏览器进程信息及非浏览器进程信息,确定所述 终端针对目标网页的访问开始时间及访问结束时间;
[0101] 第二确定单元23,用于基于所述访问开始时间及访问结束时间,确定所述终端在 目标网页的页面停留时长。
[0102] 在一个具体的例子中,所述采集单元21,用于采集终端的浏览器进程创建时间、浏 览器进程结束时间、浏览器进程激活时间、浏览器进程非激活时间、浏览器进程访问网页的 地址、浏览器进程访问网页的时间;采集终端的非浏览器进程创建时间、非浏览器进程结束 时间、非浏览器进程激活时间、非浏览器进程非激活时间。
[0103] 在一个具体的例子中,如图3所示,所述第一确定单元22,包括:第一处理子单元 221、第二处理子单元222、第三处理子单元223及第四处理子单元224。
[0104] 第一处理子单元221,用于基于所述浏览器进程创建时间、所述浏览器进程非激活 时间、所述非浏览器进程创建时间及所述非浏览器进程非激活时间,确定所述终端创建的 各进程的最后一次非激活时间;
[0105] 第二处理子单元222,用于基于所述浏览器进程访问网页的地址及所述浏览器进 程访问网页的时间,确定目标网页的访问开始时间以及所述目标网页之后的下一个访问网 页的访问开始时间;
[0106] 第三处理子单元223,用于基于所述最后一次非激活时间、所述目标网页的访问开 始时间、所述非浏览器进程激活时间以及预设的网页访问时长阈值,确定所述目标网页的 关闭时间;
[0107] 第四处理子单元224,用于基于所述浏览器进程激活时间、所述目标网页的访问开 始时间、所述目标网页之后的下一个访问网页的访问开始时间以及所述目标网页的关闭时 间,确定所述终端针对目标网页的访问结束时间。
[0108] 在一个具体的例子中,所述第三处理子单元223,用于判断从所述目标网页的访问 开始时间之后的所述网页访问时长阈值内是否存在非浏览器进程激活时间;若存在至少一 个非浏览器进程激活时间,则确定所述目标网页的关闭时间为所述至少一个非浏览器进程 激活时间中最先激活的时间;若不存在非浏览器进程激活时间,则判断从所述目标网页的 访问开始时间起经过所述网页访问时长阈值之后是否存在非浏览器进程激活时间;若存在 非浏览器进程激活时间,则确定所述目标网页的关闭时间为所述目标网页的访问开始时间 与所述网页访问时长阈值之和;若不存在非浏览器进程激活时间,则确定所述目标网页的 关闭时间为所述最后一次非激活时间。
[0109] 在一个具体的例子中,所述第四处理子单元224,用于判断从所述目标网页的访问 开始时间至所述目标网页之后的下一个访问网页的访问开始时间是否包含于所述浏览器 进程激活时间至所述目标网页的关闭时间内;若包含于,则确定所述终端针对目标网页的 访问结束时间为所述目标网页之后的下一个访问网页的访问开始时间;若不包含于,则判 断条件是否成立,所述条件为:所述目标网页的访问开始时间属于所述浏览器进程激活时 间至所述目标网页的关闭时间内,且所述目标网页之后的下一个访问网页的访问开始时间 不属于所述浏览器进程激活时间至所述目标网页的关闭时间内;若条件成立,则确定所述 终端针对目标网页的访问结束时间为所述目标网页的关闭时间。
[0110] 本实施例公开的基于终端访问的页面停留时长确定装置可以执行上述基于终端 访问的页面停留时长确定方法实施例的流程,本实施例不再赘述。
[0111] 相比于现有技术,上述实施例公开的基于终端访问的页面停留时长确定装置,通 过采集终端的浏览器进程信息及非浏览器进程信息,求得用户终端的页面停留时长。克服 现有的页面停留时长测量方法,无法解决针对海量数据的分析和挖掘问题。
[0112] 进一步地,上述实施例公开的基于终端访问的页面停留时长确定装置,针对终端 数据采集不完全的情况,充分考虑各种可能性,进而准确计算浏览器在某URL访问的开始 与结束时间点。
[0113] 进一步地,上述实施例公开的基于终端访问的页面停留时长确定装置,借助 hadoop分布式计算技术,增强了处理海量终端数据的能力。在实际大数据分析项目中,该方 法得到了可靠的结果,能充分满足用户终端上网行为的分析需求。
[0114] 需要说明的是,本文中,"第一"、"第二"、"第三"及"第四"仅仅用来区分名称相同 的词语,并不暗示这些名称相同的词语之间的关系或顺序。
[0115] 本领域技术人员可以理解,可以把装置实施例中的各单元组合成一个单元,以及 此外可以把它们分成多个子单元。除了这样的特征和/或过程或者单元中的至少一些是互 相排斥之处,可以采用任何组合对本说明书中公开的所有特征以及如此公开的任何方法或 者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书中公开的每个特征可以 由提供相同、等同或相
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1