甄别用户的方法及设备与流程

文档序号:14847312发布日期:2018-06-30 16:51阅读:386来源:国知局
甄别用户的方法及设备与流程

本申请涉及信息技术领域,尤其涉及一种甄别用户的方法及设备。



背景技术:

不同类型的热点,如公共热点、商业热点、企业热点或个人热点等,其连接上的用户的使用习惯各不相同,基于用户的使用习惯能够在一定程度上识别出用户的类型,例如有些用户经常且有规律的连接某个热点,而有些用户仅会偶尔或临时连接某个热点。甄别某个热点上有哪些用户是有规律用户,将会对判定该热点的类型、使用行为以及其它相关方面等起到积极有效的帮助,但是目前还未有一种能够有效甄别用户的方案。

申请内容

本申请的一个目的是提供一种甄别用户的方法及设备,用以解决现有技术中的问题。

为实现上述目的,本申请提供了一种甄别用户的方法,所述方法包括以下步骤:

获取某一无线接入点上同一用户在预设时间段的每一预设时间粒度内连接行为;

根据所述连接行为确定所述用户对于所述无线接入点的用户类型,其中,所述用户类型包括关于规律周期的有规律用户或无规律用户。

进一步地,根据所述连接行为确定所述用户对于所述无线接入点的用户类型,包括:

获取所述预设时间段的每一预设时间粒度内连接行为的发生次数;

根据所述预设时间段的每一预设时间粒度内连接行为的发生次数,生成关于连接行为发生次数的时间序列;

根据所述时间序列确定所述用户对于所述无线接入点的用户类型。

进一步地,根据所述时间序列确定所述用户对于所述无线接入点的用户类型,包括:

将所述时间序列由时域变换至频域,在频域上分解为多个频率的分量,其中,所述频率对应的周期包含用户类型的规律周期;

根据振幅对所述多个频率的分量进行排序,选取显著分量,其中,所述显著分量为排序结果靠前的N个分量,N为正整数;

若所述显著分量的周期包含用户类型的规律周期,则确定所述用户为所述无线接入点上关于所述规律周期的有规律用户。

进一步地,所述预设时间粒度为一小时;

根据所述时间序列确定所述用户对于所述无线接入点的用户类型,包括:

将以小时为单位的时间序列由时域变换至频域,在频域上分解为多个频率的分量,其中,所述频率对应的周期包含24小时;

若24小时对应频率的分量的振幅为最高、次高或第三高,则确定所述用户为有规律用户。

进一步地,将时间序列由时域变换至频域,包括:

对时间序列进行离散傅立叶变换,将其由时域变换至频域。

进一步地,该方法还包括:

若所述显著分量的周期不包含用户类型的规律周期,则确定所述用户为所述无线接入点上关于所述规律周期的无规律用户。

进一步地,确定所述用户为所述无线接入点上关于所述规律周期的有规律用户之后,还包括:

根据如下公式获取所述有规律用户的信心值:

其中,所述第一分量为所述规律周期所对应的显著分量,所述第二分量为振幅大于所述第一分量的显著分量。

进一步地,在根据所述时间序列确定所述用户对于所述无线接入点的用户类型之前,还包括:

对所述时间序列进行去趋势化处理。

进一步地,该方法还包括:

根据所述有规律用户的规律周期,向所述有规律用户发送与所述无线接入点相关的营销信息。

进一步地,该方法还包括:

根据所述有规律用户的规律周期,确定所述有规律用户与所述无线接入点相关的社交属性信息。

进一步地,该方法还包括:

将所述有规律用户确定为所述无线接入点的所有者的候选用户。

基于本申请的另一方面,还提供了一种甄别用户的设备,所述设备包括:

数据接收装置,用于获取某一无线接入点上同一用户在预设时间段的每一预设时间粒度内连接行为;;

处理装置,用于根据所述连接行为确定所述用户对于所述无线接入点的用户类型,其中,所述用户类型包括关于规律周期的有规律用户或无规律用户。

进一步地,所述处理装置,包括:

数据统计模块,用于获取所述预设时间段的每一预设时间粒度内连接行为的发生次数;

序列生成模块,用于根据所述预设时间段的每一预设时间粒度内连接行为的发生次数,生成关于连接行为发生次数的时间序列;

序列分析模块,用于根据所述时间序列确定所述用户对于所述无线接入点的用户类型。

进一步地,所述序列分析模块,包括:

变换单元,用于将所述时间序列根据所述时间序列确定所述用户对于所述无线接入点的用户类型,在频域上分解为多个频率的分量,其中,所述频率包含用户类型的规律周期;

排序单元,用于根据振幅对所述多个频率的分量进行排序,选取显著分量,其中,所述显著分量为排序结果靠前的N个分量,N为正整数;

分量分析单元,用于在所述显著分量的周期包含用户类型的规律周期时,确定所述用户为所述无线接入点上关于所述规律周期的有规律用户。

进一步地,所述预设时间粒度为一小时;

所述序列分析模块,包括:

变换单元,用于将以小时为单位的时间序列根据所述时间序列确定所述用户对于所述无线接入点的用户类型,在频域上分解为多个频率的分量,其中,所述频率对应的周期包含24小时;

分量分析单元,用于当24小时对应频率的分量的振幅为最高、次高或第三高时,确定所述用户为有规律用户。

进一步地,所述变换单元,用于对时间序列进行离散傅立叶变换,将其由时域变换至频域。

进一步地,所述分量分析单元,还用于在所述显著分量的周期不包含用户类型的规律周期时,确定所述用户为所述无线接入点上关于所述规律周期的无规律用户。

进一步地,所述分量分析单元,还用于在确定所述用户为所述无线接入点上关于所述规律周期的有规律用户之后,根据如下公式获取所述有规律用户的信心值:

其中,所述第一分量为所述规律周期所对应的显著分量,所述第二分量为振幅大于所述第一分量的显著分量。

进一步地,该设备还包括:

预处理模块,用于在根据所述时间序列确定所述用户对于所述无线接入点的用户类型之前,对所述时间序列进行去趋势化处理。

进一步地,该设备还包括:

第一功能装置,用于根据所述有规律用户的规律周期,向所述有规律用户发送与所述无线接入点相关的营销信息。

进一步地,该设备还包括:

第二功能装置,用于根据所述有规律用户的规律周期,确定所述有规律用户与所述无线接入点相关的社交属性信息。

进一步地,该设备还包括:

第三功能装置,用于将所述有规律用户确定为所述无线接入点的所有者的候选用户。

与现有技术相比,本申请的方案通过获取某一无线接入点上同一用户在预设时间段的每一预设时间粒度内连接行为,例如若干周或者若干月内的连接行为,基于所述连接行为进行数据分析,并根据分析结果所反映出的该用户的连接行为的规律,从而准确地判断用户的用户类型,确定该用户是所述无线接入点上关于某一规律周期的有规律用户(例如每天连接该无线接入点的用户),或者不是所述无线接入点关于某一规律周期的有规律用户(例如仅仅是偶尔或者临时性的连接某一无线接入点)。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为本申请实施例提供的一种甄别用户的方法的流程图;

图2为本申请实施例中基于连接行为的发生时间判断用户类型的处理流程图;

图3为本申请实施例提供的通过频域分析的方式确定用户类型的处理流程图;

图4(a)~(d)分别为几例对时间序列进行离散傅立叶变换后的处理结果图;

图5(a)和(b)分别一组数据进行去趋势化处理前后的示意图;

图6为本申请实施例提供的一种甄别用户的设备的结构图;

图7为本申请实施例中一种处理装置的结构示意图;

图8为本申请实施例中一种序列分析模块的详细结构示意图;

图9为采用本申请提供的方案无线接入点的某一用户进行甄别的具体处理流程图;

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本申请作进一步详细描述。

在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

图1示出了一种甄别用户的方法,其中,所述方法包括以下步骤:

步骤S101,获取某一无线接入点上同一用户在预设时间段的每一预设时间粒度内连接行为。在此,某一无线接入点上某一用户的连接行为具体是指该用户通过其用户设备与所述无线接入点之间的连接行为,具体包括连接无线接入点的操作、以及通过该无线接入点与互联网进行数据交互的操作等。例如,对于某一无线接入点AP1,用户U1通过其手机连接上该AP1,可以算作一次连接行为;然后,该用户通过连接上AP1的手机浏览一个新闻页面,也可以算作一次连接行为,而浏览多个新闻页面则算作多次连接行为。

步骤S102,根据所述连接行为确定所述用户对于所述无线接入点的用户类型,其中,所述用户类型包括关于规律周期的有规律用户或无规律用户。本申请的方案基于所述连接行为进行数据分析,并根据分析结果所反映出的该用户的连接行为的规律,从而准确地判断用户的用户类型,确定该用户是所述无线接入点上关于某一规律周期的有规律用户(例如每天连接该无线接入点的用户),或者不是所述无线接入点关于某一规律周期的有规律用户(例如仅仅是偶尔或者临时性的连接某一无线接入点)。

在实际场景中,获取数据时可以直接获取某一无线接入点中所有用户在预设时间段内每次连接行为的发生时间,然后基于不同的用户对数据进行分类,并且同步进行后续处理,以从而分析一个无线接入点中所有用户的用户类型。

具体地,在进行步骤S102的处理时,具体可以采用如图2流程:

步骤S1021,获取所述预设时间段的每一预设时间粒度内连接行为的发生次数。例如,在本实施例中,所述预设之间可以设定为28天(即4周),而所述时间粒度可以设定为1小时,由此,首先可以根据连接行为的发生时间,统计出28天内该无线接入点中某一用户在每一个小时内的连接行为的发生次数。

步骤S1022,根据所述预设时间段的每一预设时间粒度内连接行为的发生次数,生成关于连接行为发生次数的时间序列。为简明起见,本实施例中以其中一周的时间为例,所述关于连接行为发生次数的时间序列即为:按照由周一0点起至周日24点的序列。由于不同的无线接入点中,其用户的使用习惯不同,以某一企业无线接入点AP1中一个用户U1一周的数据为例,统计的具体数据如下所述:

[0,0,0,0,0,0,0,10,24,30,44,55,31,60,24,10,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,1,34,20,42,5,23,10,24,20,15,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,23,28,14,15,11,23,32,2,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,11,34,50,24,2,21,32,22,1,2,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,12,28,12,23,1,11,3,2,12,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]

其中,每个数字表示每个小时中的连接行为的发生次数,如第一个数字0表示用户在周一00:00~01:00这一个小时的时间段内,没有在该无线接入点上发生连接行为,而第八个数字“10”则表示,用户在周一07:00~08:00这一个小时的时间段内,在该该无线接入点上发生了10次连接行为。

某一用户U2家中的无线接入点AP2上,关于该用户U2的连接行为发生次数的数据可能如下:

[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,10,46,24,52,7,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,6,22,12,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,15,33,42,1,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,3,22,12,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,12,46,60,42,27,30,

19,1,0,0,0,0,0,0,0,0,1,20,21,10,30,33,2,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,9,20,12,1,0,0,0,0,0]

而某一用户U3仅到访过一次的休闲娱乐场所中的无线接入点AP3上,关于该用户U3的连接行为发生次数的数据可能如下:

[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,19,50,32,12,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]

此外,某一用户U4仅到偶尔到访的餐饮场所中的无线接入点AP4上,关于该用户U4的连接行为发生次数的数据可能如下:

[0,0,0,0,0,0,0,0,0,0,0,20,5,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,17,30,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,23,20,15,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]

步骤S1023,基于所述根据所述时间序列可以确定所述用户对于所述无线接入点的用户类型。具体地,本申请实施例提供了一种优选的方式,用于根据所述时间序列确定所述用户对于所述无线接入点的用户类型,其处理流程如图3所示,包括如下步骤:

步骤S201,将所述时间序列由时域变换至频域,并在频域上分解为多个频率的分量,其中,所述频率对应的周期包含用户类型的规律周期。

在将所述时间序列由时域变换至频域时,可以采用任意适用于时频变换的方法,例如离散傅立叶变换、Z-变换、拉普拉斯变换以及小波变换等。通过上述方法将时间序列由时域变换至频域后,频域中任意一个频率的分量均表示该时间序列在该频率所对应的周期上的周期性显著程度。由此,利用频域上多个(理论上无穷多)频率的序列来模拟原本在时域的序列,进而判断其该时间序列是否在时域上存在明显的周期性。

例如,本申请的一个实施例中以离散傅立叶变换为例对上述处理过程进行详细说明,若需要甄别用户是否为所述无线接入点上关于24小时这一规律周期的有规律用户,则在进行傅立叶变换时,其在频域上分解的分量中至少需要包含24小时所对应的频率,以便于判断24小时否是为该用户在无线接入点上的显著周期。图4(a)~(d)分别为几例对时间序列进行离散傅立叶变换后的处理结果图。在此,本领域技术人员应当能够理解上述采用离散傅立叶变换将实现时间序列由时域变换至频域的方式仅为举例,其他现有的或今后可能出现的可实现时间序列由时域变换至频域的方式如可适用于本申请,例如前述的Z-变换、拉普拉斯变换以及小波变换等,也应当包含在本申请保护范围以内,并在此以引用方式包含于此。

由于时间序列有可能存在系统化的总体走向,因此可以在步骤S201对时间序列进行分析之前,对其进行去趋势化处理。即在对所述时间序列进行离散傅立叶变换之前,对所述时间序列进行去趋势化处理。所述去趋势化处理是指去除时间序列中的系统化总体走向,从而只显示数值上的波动,进而使得潜在的周期模式显现出来。

常用的去趋势化方法有两种:常量方法与线性方法。常量方法是指序列中的每个数值都减去该序列的平均值;线性方法是指序列中的每个数值都前去该序列的线性回归模型。线性回归模型指的是用一条直线模拟自变量与因变量之间的关系。以其中一种方式为例,本申请实施例中采用线性方法进行去趋势化处理,例如图5(a)为进行去趋势化值处理之前的数据的走势图,其中的直线即为线性回归模型。由该图可知,随着时间的推移,数据的走势呈上升趋势,对其进行去趋势化处理之后的结果如图5(b),由此可以去除数据的系统化总体走向,从而只显示数值上的波动,进而使得潜在的周期模式显现出来。

步骤S202,根据振幅对所述多个频率的分量进行排序,选取显著分量,其中,所述显著分量为排序结果靠前的N个分量,N为正整数。

由于离散傅立叶变换是利用多个(理论上无穷多)频率的序列来模拟原本在时域的序列。基本上任意一个时间序列都可以进行离散傅立叶变换在频域上表示成多个频率的分量的总和,其中,每个分量的振幅表示对应频率在整个序列中的权重,因此振幅的从高到低的排序代表了其对应频率的显著程度。

一些在时域有明显周期性的时间序列,其离散傅立叶变换的结果中规律周期所对应的频率上的振幅会明显高于其他频率,例如图4(a)与图4(b)所示。而一些在时域并无明显周期性的时间序列,其离散傅立叶变换的结果中各频率在振幅上均无明显优势且绝对值较低,例如图4(c)与图4(d)所示。因此,通过判断离散傅立叶变换结果中有无明显优势的频率,可以判断时域上时间序列的周期性。

在实际场景中,通常有周期性的时间序列的离散傅立叶变换的结果中,振幅在最显著的几个频率之后会迅速减退,并且排序越靠前,表示在该周期上的周期性也越显著。若需要甄别的规律周期所对应的频率的振幅在排序中为靠前的几个,则表示其周期性相对较为明显,可以认为对于该无线接入点,这一用户是关于该规律周期的有规律用户。而相应地,若需要甄别的规律周期所对应的频率的振幅在排序中相对较为靠后,则表示其周期性相对不明显,可以认为对于该无线接入点,这一用户是关于该规律周期的无规律用户。

以24小时这一规律周期为例,在本例中,N可以设定为3。若变换结果中24小时对应的频率的振幅为第三高振幅,也可以说24小时是该时间序列的一个周期,但相对于排序第一和第二的频率多对应的周期,其周期性不算显著,但是还是可以认为这一用户是关于24小时这一规律周期的有规律用户。若24小时对应的频率的振幅出现在前三高振幅之后,则可以认为其并非是一个有意义的周期了。

步骤S203,若所述显著分量的周期包含用户类型的规律周期,则确定所述用户为所述无线接入点上关于所述规律周期的有规律用户。在实际应用场景中,所述规律周期一般会根据实际生活的规律进行设定,例如设定为1天(24小时)、一周、一个月等,当然也可以根据特殊的需求,设定为21小时、12小时等其它的周期。例如,本申请的一个实施例中,显著分量的数量N设定为3个,预设时间粒度设定为一小时,用户类型的规律周期设定为1天(24小时),此时,若24小时对应频率的分量的振幅为最高、次高或第三高,则确定所述用户为有规律用户。以图4(a)所示的离散傅立叶变换结果为例,所述显著分量的振幅按照高低排序依次为[758.23,384.54,380.10],其频率对应的周期(单位为小时)分别为[24.00,12.00,21.00]。由此可知,显著分量的周期包含需要甄别的规律周期24小时,可以确定所述用户为所述无线接入点上关于24小时这一规律周期的有规律用户。

再如,以图4(b)所示的离散傅立叶变换结果为例,设定显著分量的数量N为3个,则所述显著分量的振幅按照高低排序依次为[506.89,323.25,319.95],其频率对应的周期(单位为小时)分别为[24.00,12.00,56.00]。由此可知,显著分量的周期包含需要甄别的规律周期24小时,可以确定所述用户为所述无线接入点上关于24小时这一规律周期的有规律用户。

步骤S204,若所述显著分量的周期不包含用户类型的规律周期,则确定所述用户为所述无线接入点上关于所述规律周期的无规律用户。

例如,以图4(c)所示的离散傅立叶变换结果为例,设定显著分量的数量N为3个,则所述显著分量的振幅按照高低排序依次为[128.60,117.36,114.26],其频率对应的周期(单位为小时)分别为[84.00,33.60,56.00]。由此可知,显著分量的周期不包含需要甄别的规律周期24小时,可以确定所述用户为所述无线接入点上关于24小时这一规律周期的无规律用户。

再如,以图4(d)所示的离散傅立叶变换结果为例,设定显著分量的数量N为3个,则所述显著分量的振幅按照高低排序依次为[117.60,105.92,103.69],其频率对应的周期(单位为小时)分别为[10.50,56.00,14.00]。由此可知,显著分量的周期不包含需要甄别的规律周期24小时,可以确定所述用户为所述无线接入点上关于24小时这一规律周期的无规律用户。

在此,本领域技术人员应当理解,上述对时域上的时间序列进行频域变换后,再来判断用户关于规律周期的用户类型的分析方式,仅为本申请实施例中提供的一种优选方式。其他现有的或今后可能出现的分析方式(例如直接在时域上进行分析)如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。

进一步地,在确定所述用户为所述无线接入点上关于所述规律周期的有规律用户之后,还可以进一步计算该有规律用户的信心值,具体地,根据根据第一分量和第二分量的振幅,获取所述有规律用户的信心值,其中,所述第一分量为所述规律周期所对应的显著分量,所述第二分量为振幅大于所述第一分量的显著分量。

在此,所述信心值标识该某一规律周期相较于其它周期的显著性,在具体计算时,具体公示可以为:

仍以24小时作为需要甄别的规律周期为例,若变换结果中24小时对应的频率的振幅为第一高振幅,如图4(a)和图4(b)所示情形,不存在所述的第二分量,其信心值为100%。

假设存在一时间序列,其进行离散傅立叶变换后的结果中,振幅最高的三个振幅为[206.9,123.2,119.5],所对应的周期分别为[56.0,12.0,24.0]。24小时对应的振幅为第三高振幅,即第一分量(24小时对应的分量)不是振幅最高的分量,因此,在本例中所述第二分量为56小时和12小时对应的频率,其振幅分别为206.9,123.2。由此,其信心值=119.5/(206.9+123.2+119.5)≈26.58%。也可以说,24小时是该时间序列的一个周期,但相对于排序第一和第二的频率多对应的周期,其周期性不算显著。

在另一种情况下,若对一时间序列进行离散傅立叶变换后的结果中,振幅最高的三个振幅为[206.9,123.2,119.5],所对应的周期分别为[56.0,24.0,12.0]。此时,24小时对应的振幅为次高的振幅,同样,第一分量(24小时对应的分量)不是振幅最高的分量。而此时,本例中的第二分量为56小时对应的分量,其振幅为206.9。由此,其信心值=123.2/(206.9+123.2)≈37.32%。

还存在另一种情形,若对一时间序列进行离散傅立叶变换后的结果中,振幅最高的三个振幅为[206.9,123.2,119.5],所对应的周期分别为[24.0,56.0,12.0]。此时,24小时对应的振幅为最高的振幅,即第一分量(24小时对应的分量)是振幅最高的分量。因此,没有振幅大于所述第一分量的显著分量,即没有第二分量。由此,其信心值=206.9/206.9=100%。也可以说,24小时是该时间序列的一个显著的周期。

优选地,在甄别出用户的用户类型之后,可以基于该结果实现一些附加功能。这些附加功能可以包括:

一、实现营销信息的定制化推广。

根据所述有规律用户的规律周期,向所述有规律用户发送与所述无线接入点相关的营销信息。此方式适用于一些商家的无线接入点,例如,对于每周都会固定连到一个超市的无线接入点的有规律用户,可以对其发送每周特价信息、抵用卷等;而对于每天固定连某个餐厅的无线接入点的有规律用户,可以发当晚的信息、广告、等等。

二、推测用户的社交属性。

根据所述有规律用户的规律周期,确定所述有规律用户与所述无线接入点相关的社交属性信息。例如,一个高端休闲场所的无线接入点上关于某一规律周期的有规律用户,有可能只是在该场所工作的员工(例如24小时这一规律周期,表示该用户每天都需要在该场所),而经常到访不同高端休闲场所的无规律用户,可能是此类场所的主要客户。

三、帮助过滤某一共享的无线接入点的所有者。

将所述有规律用户确定为所述无线接入点的所有者的候选用户。在一般情况下,一个无线接入点的所有者通常至少应该是该无线接入点上关于某一规律周期的有规律用户。因此,在甄别某一用户是否是无线接入点的真正所有者时,可以基于用户类型进行初步的判断,若为无规律用户,可以直接排除该用户。

基于同一发明构思,本申请实施例中还提供了一种甄别用户的设备,该设备对应的方法是前述实施例中的甄别用户的方法,并且其解决问题的原理与所述方法相似。

图6示出了所述甄别用户的设备,该设备包括数据接收装置610和处理装置620。具体地,所述数据接收装置610用于获取某一无线接入点上同一用户在预设时间段的每一预设时间粒度内连接行为。所述处理装置620用于根据连接行为确定所述用户对于所述无线接入点的用户类型,其中,所述用户类型包括有规律用户或无规律用户。

在此,某一无线接入点上某一用户的连接行为具体是指该用户通过其用户设备与所述无线接入点之间的连接行为,具体包括连接无线接入点的操作、以及通过该无线接入点与互联网进行数据交互的操作等。例如,对于某一无线接入点AP1,用户U1通过其手机连接上该AP1,可以算作一次连接行为;然后,该用户通过连接上AP1的手机浏览一个新闻页面,也可以算作一次连接行为,而浏览多个新闻页面则算作多次连接行为。

本申请的方案基于所述连接行为进行数据分析,并根据分析结果所反映出的该用户的连接行为的规律,从而准确地判断用户的用户类型,确定该用户是所述无线接入点上关于某一规律周期的有规律用户(例如每天连接该无线接入点的用户),或者不是所述无线接入点关于某一规律周期的有规律用户(例如仅仅是偶尔或者临时性的连接某一无线接入点)。

在此,本领域技术人员应当理解,所述设备可以包括但不限于用户设备、网络设备或用户设备与网络设备通过网络相集成所构成的设备。所述用户设备包括但不限于个人计算机、触控终端等实现;所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟计算机。

在实际场景中,获取数据时可以直接获取某一无线接入点中所有用户在预设时间段内每次连接行为的发生时间,然后基于不同的用户对数据进行分类,并且同步进行后续处理,以从而分析一个无线接入点中所有用户的用户类型。

进一步地,所述处理装置620的结构如图7所示,包括数据统计模块621、序列生成模块622和序列分析模块623。具体地,所述数据统计模块621用于获取所述预设时间段的每一预设时间粒度内连接行为的发生次数。例如,在本实施例中,所述预设时间可以设定为28天(即4周),而所述时间粒度可以设定为1小时,由此,首先可以根据连接行为的发生时间,统计出28天内该无线接入点中某一用户在每一个小时内的连接行为的发生次数。

所述序列生成模块622用于根据所述预设时间段的每一预设时间粒度内连接行为的发生次数,生成关于连接行为发生次数的时间序列。为简明起见,本实施例中以其中一周的时间为例,所述关于连接行为发生次数的时间序列即为:按照由周一0点起至周日24点的序列。由于不同的无线接入点中,其用户的使用习惯不同,以某一企业无线接入点AP1中一个用户U1一周的数据为例,统计的具体数据如下所述:

[0,0,0,0,0,0,0,10,24,30,44,55,31,60,24,10,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,1,34,20,42,5,23,10,24,20,15,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,23,28,14,15,11,23,32,2,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,11,34,50,24,2,21,32,22,1,2,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,12,28,12,23,1,11,3,2,12,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]

其中,每个数字表示每个小时中的连接行为的发生次数,如第一个数字0表示用户在周一00:00~01:00这一个小时的时间段内,没有在该无线接入点上发生连接行为,而第八个数字“10”则表示,用户在周一07:00~08:00这一个小时的时间段内,在该该无线接入点上发生了10次连接行为。

某一用户U2家中的无线接入点AP2上,关于该用户U2的连接行为发生次数的数据可能如下:

[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,10,46,24,52,7,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,6,22,12,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,15,33,42,1,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,3,22,12,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,12,46,60,42,27,30,

19,1,0,0,0,0,0,0,0,0,1,20,21,10,30,33,2,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,9,20,12,1,0,0,0,0,0]

而某一用户U3仅到访过一次的休闲娱乐场所中的无线接入点AP3上,关于该用户U3的连接行为发生次数的数据可能如下:

[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,19,50,32,12,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]

此外,某一用户U4仅到偶尔到访的餐饮场所中的无线接入点AP4上,关于该用户U4的连接行为发生次数的数据可能如下:

[0,0,0,0,0,0,0,0,0,0,0,20,5,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,17,30,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,23,20,15,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]

所述序列分析模块623用于根据所述时间序列确定所述用户对于所述无线接入点的用户类型。优选地,所述序列分析模块至少包含如图8所示的几个功能单元,用以在具体处理过程中分别实现相应的功能,所述的几个功能单元分别为变换单元623a、排序单元623b和分量分析单元623c。

所述变换单元623a,用于将所述时间序列由时域变换至频域,在频域上分解为多个频率的分量,其中,所述频率包含用户类型的规律周期。

在将所述时间序列由时域变换至频域时,可以采用任意适用于时频变换的方法,例如离散傅立叶变换、Z-变换、拉普拉斯变换以及小波变换等。通过上述方法将时间序列由时域变换至频域后,频域中任意一个频率的分量均表示该时间序列在该频率所对应的周期上的周期性显著程度。由此,利用频域上多个(理论上无穷多)频率的序列来模拟原本在时域的序列,进而判断其该时间序列是否在时域上存在明显的周期性。

例如,本申请的一个实施例中以离散傅立叶变换为例对上述处理过程进行详细说明,若需要甄别用户是否为所述无线接入点上关于24小时这一规律周期的有规律用户,则在进行傅立叶变换时,其在频域上分解的分量中至少需要包含24小时所对应的频率,以便于判断24小时否是为该用户在无线接入点上的显著周期。图4(a)~(d)分别为几例对时间序列进行离散傅立叶变换后的处理结果图。在此,本领域技术人员应当能够理解上述采用离散傅立叶变换将实现时间序列由时域变换至频域的方式仅为举例,其他现有的或今后可能出现的可实现时间序列由时域变换至频域的方式如可适用于本申请,例如前述的Z-变换、拉普拉斯变换以及小波变换等,也应当包含在本申请保护范围以内,并在此以引用方式包含于此。由于时间序列有可能存在系统化的总体走向,因此所述设备还可以包括一预处理模块,用于在根据所述时间序列确定所述用户对于所述无线接入点的用户类型之前,对所述时间序列进行去趋势化处理。即在变换单元623a在对所述时间序列进行离散傅立叶变换之前,对所述时间序列进行去趋势化处理。所述去趋势化处理是指去除时间序列中的系统化总体走向,从而只显示数值上的波动,进而使得潜在的周期模式显现出来。

常用的去趋势化方法有两种:常量方法与线性方法。常量方法是指序列中的每个数值都减去该序列的平均值;线性方法是指序列中的每个数值都前去该序列的线性回归模型。线性回归模型指的是用一条直线模拟自变量与因变量之间的关系。以其中一种方式为例,本申请实施例中采用线性方法进行去趋势化处理,例如图5(a)为进行去趋势化值处理之前的数据的走势图,其中的直线即为线性回归模型。由该图可知,随着时间的推移,数据的走势呈上升趋势,对其进行去趋势化处理之后的结果如图5(b),由此可以去除数据的系统化总体走向,从而只显示数值上的波动,进而使得潜在的周期模式显现出来。

排序单元623b用于根据振幅对所述多个频率的分量进行排序,选取显著分量,其中,所述显著分量为排序结果靠前的N个分量,N为正整数。

由于离散傅立叶变换是利用多个(理论上无穷多)频率的序列来模拟原本在时域的序列。基本上任意一个时间序列都可以进行离散傅立叶变换在频域上表示成多个频率的分量的总和,其中,每个分量的振幅表示对应频率在整个序列中的权重,因此振幅的从高到低的排序代表了其对应频率的显著程度。

一些在时域有明显周期性的时间序列,其离散傅立叶变换的结果中规律周期所对应的频率上的振幅会明显高于其他频率,例如图4(a)与图4(b)所示。而一些在时域并无明显周期性的时间序列,其离散傅立叶变换的结果中各频率在振幅上均无明显优势且绝对值较低,例如图4(c)与图4(d)所示。因此,通过判断离散傅立叶变换结果中有无明显优势的频率,可以判断时域上时间序列的周期性。

在实际场景中,通常有周期性的时间序列的离散傅立叶变换的结果中,振幅在最显著的几个频率之后会迅速减退,并且排序越靠前,表示在该周期上的周期性也越显著。若需要甄别的规律周期所对应的频率的振幅在排序中为靠前的几个,则表示其周期性相对较为明显,可以认为对于该无线接入点,这一用户是关于该规律周期的有规律用户。而相应地,若需要甄别的规律周期所对应的频率的振幅在排序中相对较为靠后,则表示其周期性相对不明显,可以认为对于该无线接入点,这一用户是关于该规律周期的无规律用户。

以24小时这一规律周期为例,在本例中,N可以设定为3。若变换结果中24小时对应的频率的振幅为第三高振幅,也可以说24小时是该时间序列的一个周期,但相对于排序第一和第二的频率多对应的周期,其周期性不算显著,但是还是可以认为这一用户是关于24小时这一规律周期的有规律用户。若24小时对应的频率的振幅出现在前三高振幅之后,则可以认为其并非是一个有意义的周期了。

分量分析单元623c,用于在所述显著分量的周期包含用户类型的规律周期时,确定所述用户为所述无线接入点上关于所述规律周期的有规律用户。在实际应用场景中,所述规律周期一般会根据实际生活的规律进行设定,例如设定为1天(24小时)、一周、一个月等,当然也可以根据特殊的需求,设定为21小时、12小时等其它的周期。例如,本申请的一个实施例中,显著分量的数量N设定为3个,预设时间粒度设定为一小时,用户类型的规律周期设定为1天(24小时),此时,若24小时对应频率的分量的振幅为最高、次高或第三高,则确定所述用户为有规律用户。以图4(a)所示的离散傅立叶变换结果为例,所述显著分量的振幅按照高低排序依次为[758.23,384.54,380.10],其频率对应的周期(单位为小时)分别为[24.00,12.00,21.00]。由此可知,显著分量的周期包含需要甄别的规律周期24小时,可以确定所述用户为所述无线接入点上关于24小时这一规律周期的有规律用户。

再如,以图4(b)所示的离散傅立叶变换结果为例,设定显著分量的数量N为3个,则所述显著分量的振幅按照高低排序依次为[506.89,323.25,319.95],其频率对应的周期(单位为小时)分别为[24.00,12.00,56.00]。由此可知,显著分量的周期包含需要甄别的规律周期24小时,可以确定所述用户为所述无线接入点上关于24小时这一规律周期的有规律用户。

此外,分量分析单元623c还用于在所述显著分量的周期不包含用户类型的规律周期时,确定所述用户为所述无线接入点上关于所述规律周期的无规律用户。

例如,以图4(c)所示的离散傅立叶变换结果为例,设定显著分量的数量N为3个,则所述显著分量的振幅按照高低排序依次为[128.60,117.36,114.26],其频率对应的周期(单位为小时)分别为[84.00,33.60,56.00]。由此可知,显著分量的周期不包含需要甄别的规律周期24小时,可以确定所述用户为所述无线接入点上关于24小时这一规律周期的无规律用户。

再如,以图4(d)所示的离散傅立叶变换结果为例,设定显著分量的数量N为3个,则所述显著分量的振幅按照高低排序依次为[117.60,105.92,103.69],其频率对应的周期(单位为小时)分别为[10.50,56.00,14.00]。由此可知,显著分量的周期不包含需要甄别的规律周期24小时,可以确定所述用户为所述无线接入点上关于24小时这一规律周期的无规律用户。

在此,本领域技术人员应当理解,上述对时域上的时间序列进行频域变换后,再来判断用户关于规律周期的用户类型的分析方式,仅为本申请实施例中提供的一种优选方式。其他现有的或今后可能出现的分析方式(例如直接在时域上进行分析)如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。

进一步地,在确定所述用户为所述无线接入点上关于所述规律周期的有规律用户之后,还可以进一步计算该有规律用户的信心值。具体地,所述分量分析单元623c还用于在确定所述用户为所述无线接入点上关于所述规律周期的有规律用户之后,根据第一分量和第二分量的振幅,获取所述有规律用户的信心值,其中,所述第一分量为所述规律周期所对应的显著分量,所述第二分量为振幅大于所述第一分量的显著分量。

在此,所述信心值标识该某一规律周期相较于其它周期的显著性,在具体计算时,具体公示可以为:

仍以24小时作为需要甄别的规律周期为例,若变换结果中24小时对应的频率的振幅为第一高振幅,如图4(a)和图4(b)所示情形,不存在所述的第二分量,其信心值为100%。

假设存在一时间序列,其进行离散傅立叶变换后的结果中,振幅最高的三个振幅为[206.9,123.2,119.5],所对应的周期分别为[56.0,12.0,24.0]。24小时对应的振幅为第三高振幅,即第一分量(24小时对应的分量)不是振幅最高的分量,因此,在本例中所述第二分量为56小时和12小时对应的频率,其振幅分别为206.9,123.2。由此,其信心值=119.5/(206.9+123.2+119.5)≈26.58%。也可以说,24小时是该时间序列的一个周期,但相对于排序第一和第二的频率多对应的周期,其周期性不算显著。

在另一种情况下,若对一时间序列进行离散傅立叶变换后的结果中,振幅最高的三个振幅为[206.9,123.2,119.5],所对应的周期分别为[56.0,24.0,12.0]。此时,24小时对应的振幅为次高的振幅,同样,第一分量(24小时对应的分量)不是振幅最高的分量。而此时,本例中的第二分量为56小时对应的分量,其振幅为206.9。由此,其信心值=123.2/(206.9+123.2)≈37.32%。

还存在另一种情形,若对一时间序列进行离散傅立叶变换后的结果中,振幅最高的三个振幅为[206.9,123.2,119.5],所对应的周期分别为[24.0,56.0,12.0]。此时,24小时对应的振幅为最高的振幅,即第一分量(24小时对应的分量)是振幅最高的分量。因此,没有振幅大于所述第一分量的显著分量,即没有第二分量。由此,其信心值=206.9/206.9=100%。也可以说,24小时是该时间序列的一个显著的周期。

优选地,在甄别出用户的用户类型之后,可以基于该结果实现一些附加功能。这些附加功能可以包括:

一、实现营销信息的定制化推广。

由所述设备的第一功能装置根据所述有规律用户的规律周期,向所述有规律用户发送与所述无线接入点相关的营销信息。此方式适用于一些商家的无线接入点,例如,对于每周都会固定连到一个超市的无线接入点的有规律用户,可以对其发送每周特价信息、抵用卷等;而对于每天固定连某个餐厅的无线接入点的有规律用户,可以发当晚的信息、广告、等等。

二、推测用户的社交属性。

由所述设备的第二功能装置根据所述有规律用户的规律周期,确定所述有规律用户与所述无线接入点相关的社交属性信息。例如,一个高端休闲场所的无线接入点上关于某一规律周期的有规律用户,有可能只是在该场所工作的员工(例如24小时这一规律周期,表示该用户每天都需要在该场所),而经常到访不同高端休闲场所的无规律用户,可能是此类场所的主要客户。

三、帮助过滤某一共享的无线接入点的所有者。

由所述设备的第三功能装置将所述有规律用户确定为所述无线接入点的所有者的候选用户。在一般情况下,一个无线接入点的所有者通常至少应该是该无线接入点上关于某一规律周期的有规律用户。因此,在甄别某一用户是否是无线接入点的真正所有者时,可以基于用户类型进行初步的判断,若为无规律用户,可以直接排除该用户。

以下结合一实际应用场景对本申请的方案进行详细说明,在本实施例需要无线接入点AP5上的用户进行甄别,判断其中的用户U5是否为该无限接入点AP5上关于24小时这一规律周期的有规律用户,其具体处理过程如图9所示,包括以下处理步骤:

步骤S901,获取该无限接入点AP5在过去一段时期内所有用户的连接行为的发生时间。其中,本实施例中,所述的过去一段时期设定为过去的28天内。

步骤S902,统计用户U5在此28天内每个小时的连接行为发生次数。

步骤S903,以小时作为时间粒度,生成关于连接行为发生次数的时间序列。

步骤S904,对所述时间序列进行去趋势化处理。

步骤S905,将去趋势化处理之后的时间序列进行周期组件分解,即对其进行离散傅立叶变换,并根据不同周期对应的频率在频域上分解为多个分量。

步骤S906,选取频域上振幅最高的三个分量。

步骤S907,判断这三个分量对应的周期是否包含24小时这一规律周期。

步骤S908,若不包含24小时这一规律周期,则可确定该用户U5是无规律用户。

步骤S909,若包含24小时这一规律周期,则可确定该用户U5是有规律用户,并继续执行步骤S910。

步骤S910,计算信心值,所述信息值=24小时对应分量的振幅÷24小时对应分量的振幅与振幅高于它的分量的振幅之和。

综上所述,本申请的方案通过获取某一无线接入点上同一用户在预设时间段的每一预设时间粒度内连接行为,例如若干周或者若干月内的连接行为,基于所述连接行为进行数据分析,并根据分析结果所反映出的该用户的连接行为的规律,从而准确地判断用户的用户类型,确定该用户是所述无线接入点上关于某一规律周期的有规律用户(例如每天连接该无线接入点的用户),或者不是所述无线接入点关于某一规律周期的有规律用户(例如仅仅是偶尔或者临时性的连接某一无线接入点)。

需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。

另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。

对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1