一种数据处理方法及装置与流程

文档序号:11234188

技术特征:

1.一种数据处理方法,应用于分布式存储系统中,其特征在于,包括:

从所述分布式存储系统中获取目标服务器在预设周期内的用户行为数据;

获取所述用户行为数据所包含的用户唯一标识;

统计所述用户行为数据中包含的互不相同的所述用户唯一标识的数量,得到所述目标服务器在预设周期内的用户访问数量。

2.根据权利要求1所述的方法,其特征在于,所述预设周期为一天,则所述统计所述用户行为数据中包含的互不相同的所述用户唯一标识的数量,得到所述目标服务器在预设周期内的用户访问数量,包括:

对于一天内所述用户行为数据所包含的用户唯一标识,逐个进行两两比较,去除重复的用户唯一标识,得到互不相同的用户唯一标识集合;

计算所述用户唯一标识集合中所包含的用户唯一标识的数量,得到所述目标服务器的日访问用户量。

3.根据权利要求2所述的方法,其特征在于,若所述预设周期是一周,则所述统计所述用户行为数据中包含的互不相同的所述用户唯一标识的数量,得到所述目标服务器在预设周期内的用户访问数量,包括:

查找所述预设周期内每一天的用户行为数据所包含的互不相同的用户唯一标识,获得所述目标服务器每一天的日访问用户集合,所述日访问用户集合包括所述用户唯一标识;

将所述预设周期中第二天对应的所述日访问用户集合与所述预设周期中第一天对应的所述日访问用户集合进行合并,并去除合并后的日访问用户集合中重复的用户唯一标识,得到所述第二天对应的累计日访问用户集合;

从所述预设周期中的第三天开始,将当天对应的所述日访问用户集合与前一天对应的累计日访问用户集合进行合并,并去除合并后的日访问用户集合中重复的用户唯一标识,得到所述当天对应的累计日访问用户集合,直到所述预设周期中的最后一天结束,计算得到所述目标服务器的周访问用户量。

4.根据权利要求3所述的方法,其特征在于,若所述预设周期为一个月,则所述统计所述用户行为数据中包含的互不相同的所述用户唯一标识的数量,得到所述目标服务器在预设周期内的用户访问数量,包括:

根据所述预设周期内的用户行为数据,获得所述目标服务器在所述预设周期内每一周对应的周访问用户集合,所述周访问集合包含一周内访问所述目标服务器的全部互不相同的用户唯一标识;

将所述预设周期中第二周对应的周访问用户集合与第一周对应的周访问用户集合进行合并,并去除合并后的周访问用户集合中重复的用户唯一标识,得到所述第二周对应的累计周访问用户集合;

从所述预设周期中的第三周开始,将本周对应的周访问用户集合与前一周对应的累计周访问用户集合进行合并,并去除合并后的周访问用户集合中重复的用户唯一标识,得到所述本周对应的累计周访问用户集合,直到所述预设周期中的最后一个完整周,得到第四周对应的累计周访问用户集合;

将所述预设周期内不够一个完整周的剩余天数对应的日访问用户集合进行合并,得到剩余累计日访问用户集合;

将所述剩余累计日访问用户集合与所述第四周对应的累计周访问用户集合进行合并,并去除合并后的访问用户集合中重复的用户唯一标识,得到所述预设周期对应的月访问用户集合;

计算所述月访问用户集合中包含的用户唯一标识,得到所述预设周期的月访问用户量。

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:输出所述目标服务器在预设周期内的用户访问数量。

6.一种数据处理装置,应用于分布式存储系统中,其特征在于,包括:

第一获取单元,用于从所述分布式存储系统中获取目标服务器在预设周期内的用户行为数据;

第二获取单元,用于获取所述用户行为数据所包含的用户唯一标识;

统计单元,用于统计所述用户行为数据中包含的互不相同的所述用户唯一标识的数量,得到所述目标服务器在预设周期内的用户访问数量。

7.根据权利要求6所述的装置,其特征在于,所述预设周期为一天,则所述统计单元,包括:

第一去重子单元,用于将一天内所述用户行为数据所包含的用户唯一标识,逐个进行两两比较,去除重复的用户唯一标识,得到互不相同的用户唯一标识集合;

第一计算子单元,用于计算所述用户唯一标识集合中所包含的用户唯一标识的数量,得到所述目标服务器的日访问用户量。

8.根据权利要求7所述的装置,其特征在于,若所述预设周期是一周,则所述统计单元,包括:

第一获取子单元,用于查找所述预设周期内每一天的用户行为数据所包含的互不相同的用户唯一标识,获得所述目标服务器每一天的日访问用户集合,所述日访问用户集合包括所述用户唯一标识;

第二去重子单元,用于将所述预设周期中第二天对应的所述日访问用户集合与所述预设周期中第一天对应的所述日访问用户集合进行合并,并去除合并后的日访问用户集合中重复的用户唯一标识,得到所述第二天对应的累计日访问用户集合;

第三去重子单元,用于从所述预设周期中的第三天开始,将当天对应的所述日访问用户集合与前一天对应的累计日访问用户集合进行合并,并去除合并后的日访问用户集合中重复的用户唯一标识,得到所述当天对应的累计日访问用户集合,直到所述预设周期中的最后一天结束;

第二计算子单元,用于计算得到所述目标服务器的周访问用户量。

9.根据权利要求8所述的装置,其特征在于,若所述预设周期为一个月,则所述统计单元,包括:

第二获取子单元,用于根据所述预设周期内的用户行为数据,获得所述目标服务器在所述预设周期内每一周对应的周访问用户集合,所述周访问集合包含在一周内访问所述目标服务器的全部互不相同的用户唯一标识;

第四去重子单元,用于将所述预设周期中第二周对应的周访问用户集合与第一周对应的周访问用户集合进行合并,并去除合并后的周访问用户集合中重复的用户唯一标识,得到所述第二周对应的累计周访问用户集合;

第五去重子单元,用于从所述预设周期中的第三周开始,将本周对应的周访问用户集合与前一周对应的累计周访问用户集合进行合并,并去除合并后的周访问用户集合中重复的用户唯一标识,得到所述本周对应的累计周访问用户集合,直到所述预设周期中的最后一个完整周,得到第四周对应的累计周访问用户集合;

第六去重子单元,用于将所述预设周期内不够一个完整周的剩余天数对应的日访问用户集合进行合并,得到剩余累计日访问用户集合;

第七去重子单元,用于将所述剩余累计日访问用户集合与所述第四周对应的累计周访问用户集合进行合并,并去除合并后的访问用户集合中重复的用户唯一标识,得到所述预设周期对应的月访问用户集合;

第三计算子单元,用于计算所述月访问用户集合中包含的用户唯一标识,得到所述预设周期的月访问用户量。

10.根据权利要求6所述的装置,其特征在于,还包括:

输出单元,用于输出所述目标服务器在预设周期内的用户访问数量。

再多了解一些
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1