画像方法及装置与流程

文档序号:15982754发布日期:2018-11-17 00:31阅读:220来源:国知局

本公开涉及大数据技术领域,尤其涉及一种画像方法及装置。

背景技术

用户画像是大数据技术的重要应用,其目标是在很多的维度上建立针对用户的描述性标签属性,从而利用这些标签属性对用户多方面的真实个人特征进行勾勒,在管理中有着不可忽视的作用。

相关技术中,可以基于用户的基本信息、消费行为、网络行为(通过基于有线传输协议等采集方式,采集用户的有线网络行为数据)等,对用户画像,但是基于该种方式得到的画像并不完整。



技术实现要素:

有鉴于此,本公开提出了一种画像方法及装置,能够得到用户更为完整的画像特征。

根据本公开的一方面,提供了一种画像方法,包括:

从无线访问接入点ap中采集无线网络数据;

解析所述无线网络数据,得到无线网络行为数据及位置信息,其中,所述无线网络行为数据包括用户身份信息;

获取所述用户身份信息对应的有线网络行为数据;

根据与所述用户身份信息对应的有线网络行为数据、无线网络行为数据及位置信息确定用户的画像特征,

其中,所述画像特征包括网络行为特征及位置特征。

根据本公开的另一方面,提供了一种画像装置,包括:

采集模块,用于从无线访问接入点ap中采集无线网络数据;

解析模块,用于解析所述无线网络数据,得到无线网络行为数据及位置信息,其中,所述无线网络行为数据包括用户身份信息;

第一获取模块,用于获取所述用户身份信息对应的有线网络行为数据;

确定模块,用于根据与所述用户身份信息对应的有线网络行为数据、无线网络行为数据及位置信息确定用户的画像特征,

其中,所述画像特征包括网络行为特征及位置特征。

这样,本公开实施例可以从无线ap中采集无线网络数据,并结合无线网络数据和有线网络数据为用户确定用户的画像特征,进而为用户画像。相对于相关技术中,画像仅依赖有线网络数据,由于数据单一造成画像不完整,本公开实施例中画像方法及装置能够依据有线网络数据和无线网络数据确定画像特征,画像所依据的数据更为丰富,因此能够得到用户更为完整的画像特征。

根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。

图1示出根据本公开一实施例的一种画像方法的流程图;

图2示出根据本公开一实施例的一种画像方法的流程图;

图3示出根据本公开一实施例的一种画像方法的流程图;

图4示出根据本公开一实施例的一种画像方法的流程图;

图5示出根据本公开一实施例的一种画像方法的流程图;

图6示出根据本公开一示例的一种画像方法的流程图;

图7示出根据本公开一实施例的一种画像装置的结构框图;

图8示出根据本公开一实施例的一种画像装置的结构框图;

图9是根据一示例性实施例示出的一种画像装置的硬件结构框图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。

图1示出根据本公开一实施例的一种画像方法的流程图。如图1所示,该方法可以包括以下步骤:

步骤101、从无线访问接入点ap中采集无线网络数据。

终端设备可以从无线访问接入点ap中采集无线网络数据,无线网络数据可以包括用户使用手机、平板电脑等设备登录无线网络生成的数据信息,该无线网络数据可以包括日志信息及数据流信息。

举例来说,终端设备可以采用wget、socket、logstash、以及kafka等技术手段中的任一种技术手段从无线ap中获取用户的无线网络数据。

步骤102、解析所述无线网络数据,得到无线网络行为数据及位置信息,其中,所述无线网络行为数据包括用户身份信息。

终端设备可以解析采集到的无线网络数据(例如:采用spark技术对无线网络数据进行解析),并从解析后的无线网络数据中,得到无线网络行为数据及对应的位置信息,其中无线网络行为数据中可以包括用户身份信息(例如:学号或者手机号或者用户所使用的终端设备的mac号)和用户的行为数据。

步骤103、获取所述用户身份信息对应的有线网络行为数据。

终端设备可以获取与上述用户身份信息对应的有线网络行为数据。

举例来说,终端设备可以采集有线网络数据,并解析有线网络数据得到有线网络行为数据,并从所有的有线网络行为数据中获取与上述用户身份信息对应的有线网络行为数据。

或者,终端设备可以从网络行为数据库中获取与用户身份信息对应的有线网络行为数据,其中网络行为数据库可以用于存储有线网络行为数据。

步骤104、根据与所述用户身份信息对应的有线网络行为数据、无线网络行为数据及位置信息确定用户的画像特征,其中,所述画像特征包括网络行为特征及位置特征。

终端设备可以对用户对应的有线网络行为数据、无线网络行为数据进行数据分析,得到用户的网络行为特征,可以对位置信息进行数据分析,得到用户的位置特征。

举例来说,终端设备可以分别对上述有线网络行为数据及无线网络行为数据、位置信息进行数据分析,得到用户对应的画像特征,或者终端设备可以将有线网络行为数据和无线网络行为数据进行融合,得到实时网络行为数据,根据实时网络行为数据和位置信息进行数据分析,得到用户对应的画像特征。

这样,本公开实施例可以从无线ap中采集无线网络数据,并结合无线网络数据和有线网络数据为用户确定用户的画像特征,进而为用户画像。相对于相关技术中,画像仅依赖有线网络数据,由于数据单一造成画像不完整,本公开实施例中画像方法能够依据有线网络数据和无线网络数据确定画像特征,画像所依据的数据更为丰富,因此能够得到用户更为完整的画像特征。

图2示出根据本公开一实施例的一种画像方法的流程图。

在一种可能的实现方式中,参照图2,上述步骤104、根据与所述用户身份信息对应的有线网络行为数据、无线网络行为数据及位置信息确定用户的画像特征,可以包括以下步骤:

步骤1041、建立所述无线网络行为数据、所述位置信息、及所述有线网络数据与所述用户身份信息表征的用户之间的关联关系;

步骤1042、根据与所述用户关联的无线网络行为数据和所述位置信息、及所述有线网络数据,确定所述用户的画像特征。

终端设备可以实时获取无线网络数据,解析获取无线网络行为数据和位置信息后,建立该无线网络行为数据和位置信息,及该无线网络数据对应的用户的有线网络行为数据与该用户的关联关系。

在为用户画像时,终端设备可以获取与该用户关联的所有无线网络行为数据、位置信息、及有线网络数据,并根据与该用户关联的所有无线网络行为数据、位置信息、及有线网络数据确定用户的画像特征。

图3示出根据本公开一实施例的一种画像方法的流程图。

在一种可能的实现方式中,参照图3,上述步骤1041、建立所述无线网络行为数据、所述位置信息、及所述有线网络数据与所述用户身份信息表征的用户之间的关联关系,可以包括以下步骤:

步骤10411、确定所述有线网络行为数据中是否存在第一有线网络行为数据,所述第一有线网络行为数据的生成时间与对应的所述无线网络行为数据的生成时间一致。

终端设备可以从无线网络行为数据中获取该无线网络行为数据的生成时间,并从获取的对应同一用户身份信息的有线网络行为数据中,确定生成时间与上述无线网络行为数据的生成时间一致的第一有线网络行为数据,该第一有线网络行为数据与上述无线网络行为数据在同一时刻产生。

步骤10412、当存在所述第一有线网络行为数据时,确定所述无线网络行为数据对应的位置信息所表征的位置是否为预置位置。

当存在第一有线网络行为数据时,终端设备可以确定无线网络行为数据的对应的位置信息表征的位置是否为预置位置,该预置位置可以为产生第一有线网络行为数据的位置。

举例来说,在校园内,能够产生有线网络行为数据的位置为机房和宿舍,则上述预置位置可以设置为机房和宿舍。

步骤10413、若所述位置信息所表征的位置为所述预置位置,则将所述第一有线网络行为数据与所述无线网络行为数据合并为实时网络行为数据。

在位置信息所表征的位置为预置位置时,表明第一有线网络行为数据及无线网络行为数据在同一地点生成,说明第一有线网络行为数据与无线网络行为数据均是根据用户的行为产生的数据,故可以将第一有线网络行为数据及无线网络行为数据合并,得到用户在该时刻的实时网络行为数据。

步骤10414、建立所述实时网络行为数据及所述位置信息与所述用户身份信息表征的用户之间的关联关系。

终端设备可以建立该实时网络行为数据及位置信息与该用户之间的关联关系,以使得可以根据该关联关系为用户进行画像。

在一种可能的实现方式中,上述步骤104还可以包括:

若所述位置信息所表征的位置不为所述预置位置,则确定所述无线网络行为数据为实时网络行为数据。

若无线网络行为数据对应的位置信息所表征的位置不是预置位置,则说明在同一时刻、不同地点产生了针对用户的无线网络行为数据与有线网络行为数据。由于手机、平板电脑等设备相对于计算机而言,更便携,因此在同一时间,不同地点生成了同一用户的有线网络行为数据和无线网络行为数据时,无线网络行为数据更能真实的反应用户的行为操作,因此可以将无线网络行为数据作为用户在该时刻的实时网络行为数据。

举例来说,学生在宿舍开启计算机后,去了食堂吃饭,此时宿舍内的计算机生成了该学生的有线网络行为数据,而同一时刻,用户在食堂操作手机,又生成了该学生的无线网络行为数据,可见无线网络行为数据才是由于学生的实际操作行为产生的,故终端设备可以将该无线网络行为数据确定为该学生在该时刻的实时网络行为数据,以使得可以根据该关联关系为该学生进行精准的画像。

图4示出根据本公开一实施例的一种画像方法的流程图。

在一种可能的实现方式中,参照图4,上述方法还可以包括以下步骤:

步骤105、获取用户的基本信息及历史画像特征。

终端设备可以从用于存储用户的基本信息的数据库中获取用户的基本信息,可以从用于存储用户的画像特征的数据库中获取用户的历史画像特征。其中用户的基本信息可以为用户的个人信息中与人个行为无关的数据。例如:学生的基本信息可以包括:年龄、性别、年级、专业、和成绩等信息。举例来说,终端设备可以根据学生的身份信息从数据库中获取与该身份信息关联的基本信息,终端设备可以根据学生的身份信息从数据库中获取与该身份信息关联的历史画像特征。

以学生为例,终端设备可以根据学生的学号从学校的学生管理数据库中读取学生的基本信息,根据学生的学号从学校的学生画像数据库中读取学生的历史画像特征。

需要说明的是,上述步骤105既可以在步骤104后执行,也可以在步骤101之前执行,本公开实施例对此不作限定。

步骤106、以时间为序,将所述用户的画像特征与所述历史画像特征建立成特征序列,将所述特征序列作为所述用户的实时画像特征。

步骤107、根据所述用户的基本信息及所述实时画像特征建立所述用户的画像。

若用户不存在历史画像,终端设备可以在获取用户的基本信息后,根据用户的基本信息与用户的画像特征建立用户的画像。

以学生为例,终端设备根据学生的有线网络行为数据及无线网络行为数据确定的该学生的画像特征可以包括:学生的网络行为特征,例如:喜爱浏览哪类网站,喜欢在什么时间段上网等特征,还可以从用于记录学生消费数据(学生消费途径为刷校园一卡通)的数据库中获取学生的消费行为数据,并确定学生的消费行为特征,例如:喜欢购买哪类产品,消费水平等特征。终端设备在获取学生的基本信息后,可以根据学生的基本信息及上述画像特征,以及无线网络行为数据对应的位置信息特征建立该学生的画像。

若用户存在历史画像,则终端设备可以根据当前确定的用户的画像特征更新用户的历史画像特征,得到用户的实时画像特征。举例来说,终端设备可以将当前的用户的画像特征与历史画像特征以时间为序,建立成特征序列,确定该特征序列为用户的实时画像特征,并根据实时画像特征建立该用户的画像。

以学生为例,终端设备可以将获取的学生的基本信息作为该学生的基本信息特征;根据消费行为特征的生成时间与历史消费行为特征的生成时间建立消费行为特征序列,确定该消费行为特征序列为该学生的实时消费行为特征序列;根据位置信息特征的生成时间及历史位置信息特征的生成时间,建立位置信息特征序列,确定该位置信息特征序列为该学生的实时位置信息特征;根据网络行为特征的生成时间与历史网络行为特征的生成时间建立网络行为特征序列,确定该网络行为特征序列为该学生的实时网络行为特征序列。

图5示出根据本公开一实施例的一种画像方法的流程图。

在一种可能的实现方式中,参照图5,上述方法还可以包括:

步骤108、建立用户群组,所述用户群组具有群组画像特征。

终端设备可以响应于用户的设置操作,根据用户设置的群组画像特征建立用户群组,其中,群组画像特征为该用户群组内的所有用户共有的画像特征。

需要说明的是,上述步骤108与上述步骤101至步骤107在执行顺序上没有限定,步骤108可以与步骤101至步骤107中任一步骤同步执行,也可以在步骤101至步骤107中任一步骤之前或者之后执行,本公开实施例对此不作限定。

步骤109、将画像特征包括所述群组画像特征的用户添加至所述用户群组中。

终端设备在建立用户的画像后,可以确定该用户的画像特征中是否包括群组画像特征,若包括,则可以将该用户添加至所述用户群组中去。

仍以学生为例,假设用户群组的群组画像特征包括:性别女、专业为计算机专业,则终端设备在建立用户的画像后,可以将所有画像特征包括性别为女、专业为计算机专业的学生添加至所述用户群组中。

这样一来,根据本公开实施例提供的画像方法可以自定义群组,将画像特征包括群组画像特征的用户均添加至该群组中,可以便于对用户进行管理,使得管理工作更加灵活,进一步的可以提高管理效率。

图6示出根据本公开一示例的一种画像方法的流程图。

为使本领域技术人员更好的理解本公开实施例,以下通过图6所示的具体示例对本公开实施例加以说明。

步骤601、自定义群组,该群组具有群组画像特征;

步骤602、从学校数据库中获取学生的基本信息;

步骤603、利用wget、socket、logstash、以及kafka等技术手段从无线ap中获取用户的无线网络数据,并对无线网络数据进行解析,得到对应的无线网络行为数据和位置信息;

步骤604、获取有线网络行为数据;

步骤605、判断具有相同学生身份信息的学生是否在同一时刻产生无线网络行为数据和有线网络行为数据,若是,执行步骤606,否则执行步骤609;

步骤606、判断同一时刻产生的无线网络行为数据与有线网络行为数据对应的位置信息是否相同,若不相同,则执行步骤607,若相同则执行步骤608;

步骤607、清除该有线网络行为数据,将该无线网络行为数据作为该时刻对应的实时网络行为数据。

步骤608、将该有线网络行为数据与无线网络行为数据合并,得到实时网络行为数据;

步骤609、将各个时刻对应的有线网络行为数据或者无线网络行为数据作为各个时刻对应的实时网络行为数据;

步骤610、建立实时网络行为数据、位置信息与学生的关联关系;

步骤611、根据与学生关联的所有实时网络行为数据、位置信息确定学生的画像特征;

步骤612、根据学生的画像特征建立学生的画像;

步骤613、将画像特征包括群组画像特征的用户添加至群组中。

图7示出根据本公开一实施例的一种画像装置的结构框图。如图7所示,该画像装置可以包括:

采集模块701,可以用于从无线访问接入点ap中采集无线网络数据;

解析模块702,可以用于解析所述无线网络数据,得到无线网络行为数据及位置信息,其中,所述无线网络行为数据包括用户身份信息;

第一获取模块703,可以用于获取所述用户身份信息对应的有线网络行为数据;

确定模块704,可以用于根据与所述用户身份信息对应的有线网络行为数据、无线网络行为数据及位置信息确定用户的画像特征,

其中,所述画像特征包括网络行为特征及位置特征。

这样,本公开实施例可以从无线ap中采集无线网络数据,并结合无线网络数据和有线网络数据为用户确定用户的画像特征,进而为用户画像。相对于相关技术中,画像仅依赖有线网络数据,由于数据单一造成画像不完整,本公开实施例中画像装置能够依据有线网络数据和无线网络数据确定画像特征,画像所依据的数据更为丰富,因此能够得到用户更为完整的画像特征。

图8示出根据本公开一实施例的一种画像装置的结构框图。

在一种可能的实现方式中,参照图8,上述确定模块704可以包括:

建立子模块7041,可以用于建立所述无线网络行为数据、所述位置信息、及所述有线网络数据与所述用户身份信息表征的用户之间的关联关系;

确定子模块7042,可以用于根据与所述用户关联的无线网络行为数据和所述位置信息、及所述有线网络数据,确定所述用户的画像特征。

在一种可能的实现方式中,所述建立子模块还用于:

确定所述有线网络行为数据中是否存在第一有线网络行为数据,所述第一有线网络行为数据的生成时间与对应的所述无线网络行为数据的生成时间一致;

当存在所述第一有线网络行为数据时,确定所述无线网络行为数据对应的位置信息所表征的位置是否为预置位置;

若所述位置信息所表征的位置为所述预置位置,则将所述第一有线网络行为数据与所述无线网络行为数据合并为实时网络行为数据;

建立所述实时网络行为数据及所述位置信息与所述用户身份信息表征的用户之间的关联关系。

在一种可能的实现方式中,所述建立子模块还用于:

若所述位置信息所表征的位置不为所述预置位置,则确定所述无线网络行为数据为实时网络行为数据。

在一种可能的实现方式中,参照图8,上述画像装置还可以包括:

第二获取模块705,可以用于获取用户的基本信息及历史画像特征;

处理模块706,可以用于以时间为序,将所述用户的画像特征与所述历史画像特征建立成特征序列,将所述特征序列作为所述用户的实时画像特征;

第一建立模块707,可以用于根据所述用户的基本信息及所述实时画像特征建立所述用户的画像。

在一种可能的实现方式中,参照图8,上述画像装置还可以包括:

第二建立模块708,可以用于建立用户群组,所述用户群组具有群组画像特征;

添加模块709,可以用于将画像特征包括所述群组画像特征的用户添加至所述用户群组中。

图9是根据一示例性实施例示出的一种画像装置的硬件结构框图。在实际应用中,该装置可通过服务器实现。参照图9,该装置1300可包括处理器1301、存储有机器可执行指令的机器可读存储介质1302。处理器1301与机器可读存储介质1302可经由系统总线1303通信。并且,处理器1301通过读取机器可读存储介质1302中与画像逻辑对应的机器可执行指令以执行上文所述的画像方法。

本文中提到的机器可读存储介质1302可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:随机存取存储器(英文:radomaccessmemory,简称:ram)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。

以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1