职业预测方法、装置、设备及计算机可读存储介质与流程

文档序号:20839261发布日期:2020-05-22 17:17阅读:129来源:国知局
职业预测方法、装置、设备及计算机可读存储介质与流程

本发明涉及数据处理领域,尤其涉及一种职业预测方法、装置、设备及计算机可读存储介质。



背景技术:

大数据技术是以任何系统的全部数据资源为对象并从中发现数据之间表现的相关性关系的信息处理技术,目前已经广泛应用于互联网的流程优化、目标化消息及广告推送、用户个性化服务与改善等方面,成为了网络服务背后强大的后台支撑。用户画像是大数据技术的重要应用,其目标是在很多的维度上建立针对用户的描述性标签属性,从而利用这些标签属性对用户多方面的真实个人特征进行勾勒。其中,用户的职业标签即为用户画像中的一项,如何实现对用户职业标签的推测即成为了亟待解决的问题。

现有技术中一般都通过预设的职业预测算法实现对用户职业的预测,但是,现有的职业预测算法往往存在召回率不高且预测不够准确的问题,召回率不高即产品中只有少部分的用户可以推断出职业。



技术实现要素:

本发明提供一种职业预测方法、装置、设备及计算机可读存储介质,用于解决现有技术中通过职业预测算法实现用户职业的预测导致召回率不高且预测不够准确的技术问题。

本发明的第一个方面是提供一种职业预测方法,包括:

获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;

对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;

根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;

根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。

本发明的另一个方面是提供一种职业预测装置,包括:

地址信息获取模块,用于获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;

聚类模块,用于对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;

绘制模块,用于根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;

预测模块,用于根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。

本发明的又一个方面是提供一种职业预测设备,包括:存储器,处理器;

存储器;用于存储所述处理器可执行指令的存储器;

其中,所述处理器被配置为由所述处理器执行如上述的职业预测方法。

本发明的又一个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的职业预测方法。

本发明提供的职业预测方法、装置、设备及计算机可读存储介质,通过获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。从而能够准确地对当前全部用户的职业进行预测,以便后续根据用户的职业标签进行大数据分析。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1为本发明基于的网络架构示意图;

图2为本发明实施例一提供的职业预测方法的流程示意图;

图3为本发明实施例提供的目标定位点拓扑图的架构图;

图4为本发明实施例二提供的职业预测方法的流程示意图;

图5为本发明实施例三提供的职业预测方法的流程示意图;

图6为本发明实施例四提供的职业预测方法的流程示意图;

图7为本发明又一实施例提供的目标定位点拓扑图的架构图;

图8为本发明实施例五提供的职业预测装置的结构示意图;

图9为本发明实施例六提供的职业预测设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例所获得的所有其他实施例,都属于本发明保护的范围。

现有技术中一般都通过预设的职业预测算法实现对用户职业的预测,但是,现有的职业预测算法往往存在召回率不高且预测不够准确的问题,召回率不高即产品中只有少部分的用户可以推断出职业。为了解决上述技术问题,本发明提供了一种职业预测方法、装置、设备及计算机可读存储介质。

需要说明的是,本申请提供职业预测方法、装置、设备及计算机可读存储介质可运用在任意一种对用户职业预测的场景中的场景中。

图1为本发明基于的网络架构示意图,如图1所示,本发明基于的网络架构至少包括:职业预测装置1、数据平台2。其中,职业预测装置1可以由软件和/或硬件的方式实现,当其采用软件实现时,其可以采用c/c++、java、shell或python等语言编写;数据平台2可以为云端服务器或服务器集群,其内存储有大量的数据。需要说明的是,职业预测装置1能够与数据平台2进行通信,实现数据交互。

图2为本发明实施例一提供的职业预测方法的流程示意图,图3为本发明实施例提供的目标定位点拓扑图的架构图,在上述实施例的基础上,如图2-图3所示,所述方法包括:

步骤101、获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户。

本实施例的执行主体为职业预测装置,职业预测装置能够与数据平台进行通信,实现数据交互。为了实现对用户职业的预测,首先可以与数据平台进行数据交互,从数据平台中获取多个用户的多个地址信息,其中,该用户可以为职业待测的第一用户以及职业已知的第二用户,从而能够根据职业已知的第二用户以及地址信息对第一用户的职业进行预测。举例来说,数据平台可以为应用软件的数据库,例如滴滴以及淘宝等,用户在使用应用软件的过程中,会产生使用数据,使用数据中可以包括多个地址信息,因此,可以从数据平台中实现对用户地址信息的获取。需要说明的是,地址信息可以以经纬度的方式进行表示。

步骤102、对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点。

在本实施方式中,由于用户的地址信息有多个,多个地址信息往往分布的较为分散,因此,为了能够根据用户的地址信息实现对用户的职业预测,获取预存的至少一个用户的多个地址信息之后,需要对分散的地址信息进行聚类操作,获得每一个用户的目标定位点。

步骤103、根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图。

在本实施方式中,对用户的地址信息进行聚类操作,获得各用户的目标定位点之后,可以根据目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图。具体地,目标定位点拓扑图如图3所示,用户的目标定位点可以为目标定位点拓扑图的节点,两个节点之间由连接线连接,每一个第二节点都具有预设的点权重,而第一节点不具有点权重,需要根据第二用户的目标定位点的点权重以及连接线的边权重进行计算。

需要说明的是,用户在使用应用软件时,可以根据使用内容输入自己的职业信息,相应地,为了实现对第一用户的职业的预测,可以根据第二用户的职业信息为第二用户的目标定位点设置范围在0-1内的点权重。举例来说,权重的设置也已根据第二用户的职业信息的明确度来设置,若第二用户的职业信息为一个具体的职业,如老师、医生等,则可以将该第二用户的目标定位点设置为1,若第二用户的职业信息为一个笼统的概念,如白领、医疗人员等,则可以将第二用户的目标定位点设置为小于1的值。此外,还可以根据其他因素实现对第二用户的目标定位点点权重的设置,本发明在此不做限制。

步骤104、根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。

在本实施方式中,根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图之后,可以根据该目标定位点拓扑图实现对第一用户的职业的预测,从而能够将该拓扑图中全部第一用户的职业的预测,提高预测的召回率。

本实施例提供的职业预测方法,通过获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。从而能够准确地对当前全部用户的职业进行预测,以便后续根据用户的职业标签进行大数据分析。

需要说明的是,在上述任一实施例的基础上,所述用户的地址信息包括用户使用网约车的定位点地址、出发点地址以及目的地地址和/或用户网络购物的收货地址和/或用户外卖的收货地址。

其中,网约车的定位点地址为用户发起约车请求的地址,出发点为用户输入的出发地址,相应地,目的地地址为用户输入的目的地址。由于用户可以在上下班的时间均选择网约车出行,因此,网约车的地址信息中能够包含用户的单位的地址,进而可以根据该单位地址以及该地址附近已知职业的第二用户实现对第一用户职业的预测;可以理解的是,用户的网购收货地址可以为用户的家,也可以为单位等地址,用户的外卖接收地址也可以为单位或者家等任意位置,因此,可以根据该目的地地址和/或用户网络购物的收货地址和/或用户外卖的收货地址实现对用户单位地址的获取,进而可以根据该单位地址以及该地址附近已知职业的第二用户实现对第一用户职业的预测。

图4为本发明实施例二提供的职业预测方法的流程示意图,在上述任一实施例的基础上,如图4所示,所述方法包括:

步骤201、获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;

步骤202、针对每一所述用户,通过预设的编码算法分别对所述用户多个地址信息进行编码,获得多个与所述地址信息对应的编码信息;

步骤203、针对每一编码信息,确定所述编码信息对应的全部地址信息;

步骤204、根据所述编码信息对应的全部地址信息确定所述目标定位点;

步骤205、根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;

步骤206、根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。

在本实施例中,由于用户的地址信息有多个,多个地址信息往往分布的较为分散,因此,为了能够根据用户的地址信息实现对用户的职业预测,获取预存的至少一个用户的多个地址信息之后,需要对分散的地址信息进行聚类操作,获得每一个用户的目标定位点。具体地,针对每一个用户,可以根据预设的编码算法对用户的多个地址信息进行编码,获得多个与地址信息对应的编码信息。举例来说,该预设的编码算法可以为geohash算法,geohash可以将二维的经纬度转换成字符串,每一个字符串代表一定大小的区域,geohash算法生成的字符串的长度越长,则其所代表的区域越精准。本实施例中,字符串的长度可以根据实际应用对精度的需求进行调整,举例来说,可以将字符串长度定为五位数。可以理解的是,由于一个字符串代表一定大小的区域,因此,针对每一个用户,其多个地址信息可能对应同一个字符串,因此,针对每一编码信息,确定所述编码信息对应的全部地址信息,并可以根据所述编码信息对应的全部地址信息确定所述目标定位点,实现地址信息的聚类。

本实施例提供的职业预测方法,通过针对每一所述用户,通过预设的编码算法分别对所述用户多个地址信息进行编码,获得多个与所述地址信息对应的编码信息;针对每一编码信息,确定所述编码信息对应的全部地址信息;根据所述编码信息对应的全部地址信息确定所述目标定位点,从而能够为后续的职业预测提供基础。

进一步地,在上述任一实施例地基础上,所述方法包括:

获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;

针对每一所述用户,通过预设的编码算法分别对所述用户多个地址信息进行编码,获得多个与所述地址信息对应的编码信息;

针对每一编码信息,确定所述编码信息对应的全部地址信息;

判断所述编码信息对应的全部地址信息与所述用户的多个地址信息的比值是否大于预设的第一阈值;

若是,则计算所述编码信息对应的全部地址信息经纬度的平均值,获得所述目标定位点;

若否,则不对所述用户进行职业预测;

根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;

根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。

在本实施例中,由于一个编码信息可能对应多个地址信息,可以理解的是,用户单位所在地应该为用户的常用地址,也即用户单位所在地的编码信息可能对应较多的地址信息,而编码信息对应较少的地址信息则表征该地为用户偶然去过的地址,因此,可以根据编码信息对应的地址信息数量实现对地址信息的筛选。具体地,判断编码信息对应的全部地址信息与所述用户的多个地址信息的比值是否大于预设的第一阈值,若是,则取该编码信息对应的全部地址信息经纬度的平均值,将该平均值对应的经纬度作为目标定位点。相应地,若编码信息对应的全部地址信息与用户的多个地址信息的比值小于预设的第一阈值,则无法根据地址信息实现对该用户职业的预测,因此可以不对所述用户进行职业预测。

本实施例提供的职业预测方法,通过判断所述编码信息对应的全部地址信息与所述用户的多个地址信息的比值是否大于预设的第一阈值;若是,则计算所述编码信息对应的全部地址信息经纬度的平均值,获得所述目标定位点;若否,则不对所述用户进行职业预测,从而能够精准地实现对用户职业的预测。

进一步地,在上述任一实施例的基础上,所述方法包括:

获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;

针对每一所述用户,通过预设的编码算法分别对所述用户多个地址信息进行编码,获得多个与所述地址信息对应的编码信息;

针对每一编码信息,确定所述编码信息对应的全部地址信息;

判断所述编码信息对应的全部地址信息与所述用户的多个地址信息的比值是否大于预设的第一阈值;

若是,则计算所述编码信息对应的全部地址信息经纬度的平均值,获得所述目标定位点;

确定所述目标定位点的数量是否大于预设的第二阈值;

若是,则根据预设的筛选规则对所述目标定位点进行筛选;

若否,则不对所述用户进行职业预测;

根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;

根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。

在本实施例中,可能一个用户具有多个目标定位点,举例来说,若用户只在单位与家之间使用网约车,则家与单位两个编码信息对应的地址信息数量一致,则根据上述方法计算二者均为目标定位点,为了提高后续预测效率,可以对目标定位点进行筛选。具体地,可以根据预设的筛选规则对所述目标定位点进行筛选。

本实施例提供的职业预测方法,通过确定所述目标定位点的数量是否大于预设的第二阈值;若是,则根据预设的筛选规则对所述目标定位点进行筛选,从而能够精准地实现对目标定位点的筛选,进而能够提高用户职业预测的精准度。

进一步地,在上述任一实施例的基础上,所述方法包括:

获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;

针对每一所述用户,通过预设的编码算法分别对所述用户多个地址信息进行编码,获得多个与所述地址信息对应的编码信息;

针对每一编码信息,确定所述编码信息对应的全部地址信息;

判断所述编码信息对应的全部地址信息与所述用户的多个地址信息的比值是否大于预设的第一阈值;

若是,则计算所述编码信息对应的全部地址信息经纬度的平均值,获得所述目标定位点;

确定所述目标定位点的数量是否大于预设的第二阈值;

若是,则针对各目标定位点,确定用户出现在所述目标定位点的时间信息,根据所述时间信息对所述目标定位点进行筛选;和/或,

针对各目标定位点,确定所述目标定位点附近的建筑类型,根据所述建筑类型对所述目标定位点进行筛选;

若否,则不对所述用户进行职业预测;

根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;

根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。

在本实施例中,为了提高后续预测效率,可以根据预设的筛选规则对目标定位点进行筛选。具体地,预设的筛选规则可以为根据建筑类型进行筛选。举例来说,若第一目标定位点周围预设区域内均为公寓,则可以判定该第一目标定位点为用户的家,而若第二定位点周围预设区域为工业园区,则可以判定该第二目标定位点为用户单位。作为一种可以实施的方式,预设的筛选规则可以为根据时间信息进行筛选。以用户使用网约车举例来说,若第一目标定位点出现的时间均为早上,则表征该第一目标定位点为用户的家,若第二目标定位点出现的时间均为晚上,则表征该第二目标定位点为用户的单位。需要说明的是,上述两种方法可以结合实施也可以单独实施,本发明在此不做限制。

本实施例提供的职业预测方法,通过针对各目标定位点,确定用户出现在所述目标定位点的时间信息,根据所述时间信息对所述目标定位点进行筛选;和/或,针对各目标定位点,确定所述目标定位点附近的建筑类型,根据所述建筑类型对所述目标定位点进行筛选,从而能够精准地实现对目标定位点的筛选,进而能够提高用户职业预测的精准度。

图5为本发明实施例三提供的职业预测方法的流程示意图,在上述任一实施例的基础上,如图5所示,所述方法包括:

步骤301、获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;

步骤302、对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;

步骤303、针对各目标定位点,将所述目标定位点分别和与所述目标定位点距离小于预设的第三阈值的其他目标定位点建立边连接线;

步骤304、针对每一条边连接线,计算所述边连接线两端的目标定位点之间的距离,对所述距离进行归一化,将归一化后的距离作为所述边连接线对应的边权重,根据点权重、边权重以及目标定位点绘制目标定位点拓扑图,根据点权重、边权重以及目标定位点绘制目标定位点拓扑图;

步骤305、根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。

在本实施例中,根据用户的地址信息确定各用户的目标定位点之后,可以根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图。具体地,由于距离用户较近的其他用户可能与用户是同一个职业,举例来说,学校区域内职业大多数都是老师,因此,可以针对每一个目标定位点,将目标定位点分别和与该目标定位点距离小于预设的第三阈值的目标定位点建立边连接线,针对每一个边连接线,计算边连接线两端的目标定位点之间的距离,并对该距离进行归一化处理,获得边连接点的边权重,从而后续能够根据点权重、边权重、目标定位点建立该目标定位点拓扑图。

本实施例提供的职业预测方法,通过针对各目标定位点,将所述目标定位点分别和与所述目标定位点距离小于预设的第三阈值的其他目标定位点建立边连接线;针对每一条边连接线,计算所述边连接线两端的目标定位点之间的距离,对所述距离进行归一化,将归一化后的距离作为所述边连接线对应的边权重,根据点权重、边权重以及目标定位点绘制目标定位点拓扑图,根据点权重、边权重以及目标定位点绘制目标定位点拓扑图,从而能够精准地实现对目标定位点拓扑图的绘制,为用户的职业预测提供了基础。

图6为本发明实施例四提供的职业预测方法的流程示意图,图7为本发明又一实施例提供的目标定位点拓扑图的架构图,在上述任一实施例的基础上,如图6所示,所述方法包括:

步骤401、获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;

步骤402、对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;

步骤403、根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;

步骤404、针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点;

步骤405、将所述第二用户目标定位点的点权重以及与其相连接全部第一用户的目标定位点的边连接线的边权重相乘,获得与所述第二用户目标定位点相连接的全部第一用户的目标定位点的点权重;

步骤406、将所述与所述第二用户目标定位点相连接的全部第一用户的目标定位点作为所述第二用户的目标定位点,返回执行针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点的步骤,直至所述网络定位点拓扑图中的全部用户的职业都预测完毕,获得全部用户的目标定位点的点权重;

步骤407、对所述全部第一用户的目标定位点的点权重进行归一化,获得所述全部第一用户的第一职业比例。

在本实施例中,由于当前拓扑图中具有点权重已知的第二用户的目标定位点,也有权重待测的第一用户的目标定位点,因此,首先可以各第二用户的目标定位点,确定与第二用户目标定位点相连接的全部第一用户的目标定位点,由于第二用户目标定位点权重和边权重已知,因此,将第二用户目标定位点的点权重以及与其相连接全部第一用户的目标定位点的边连接线的边权重相乘,获得与第二用户目标定位点相连接的全部第一用户的目标定位点的点权重,此时,可以将已获得点权重的目标定位点作为第二用户的目标定位点,返回执行针对各第二用户的目标定位点,确定与第二用户目标定位点相连接的全部第一用户的目标定位点的步骤,直至网络定位点拓扑图中的全部用户的职业都预测完毕,获得全部用户的目标定位点的点权重。对全部第一用户的目标定位点的点权重进行归一化,获得全部第一用户的职业比例。

需要说明的是,用户职业在该拓扑图中的传播可以有多种方式,具体地,其可以采用标签传播算法(labelpropagationalgorithm,简称lpa)进行传播,具体实现方式如上述实施例所示。此外,还可以采用其他能够实现传播的算法进行用户点权重的计算,本发明在此不做限制。

如图7所示,用户1与用户2的点权重均为1,用户1为老师,用户2为医生,用户1与用户4之间的边权重1为0.5,用户4与用户5之间的边权重2为0.5,用户2与用户5之间的边权重3为0.1,因此,可以通过用户1的点权重与边权重1相乘,获得用户4为老师的点权重为0.5,通过用户4的点权重与边权重2相乘,获得用户5为老师的点权重为0.25,通过用户2的点权重与边权重3相乘,获得用户5为医生的点权重为0.1。由于每一个用户的点权重均有小数表示,因此,需要将小数进行归一化,获得每一个第一用户的职业比例。如用户5为老师的概率为0.25/0.35,用户5为医生的概率为0.1/0.35。

本实施例提供的职业预测方法,通过针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点;将所述第二用户目标定位点的点权重以及与其相连接全部第一用户的目标定位点的边连接线的边权重相乘,获得与所述第二用户目标定位点相连接的全部第一用户的目标定位点的点权重;将所述与所述第二用户目标定位点相连接的全部第一用户的目标定位点作为所述第二用户的目标定位点,返回执行针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点的步骤,直至所述网络定位点拓扑图中的全部用户的职业都预测完毕,获得全部用户的目标定位点的点权重;对所述全部第一用户的目标定位点的点权重进行归一化,获得所述全部第一用户的第一职业比例。从而能够实现对全部用户职业的预测,提高召回率。

进一步地,在上述任一实施例的基础上,所述方法包括:

获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;

对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;

根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;

针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点;

将所述第二用户目标定位点的点权重以及与其相连接全部第一用户的目标定位点的边连接线的边权重相乘,获得与所述第二用户目标定位点相连接的全部第一用户的目标定位点的点权重;

将所述与所述第二用户目标定位点相连接的全部第一用户的目标定位点作为所述第二用户的目标定位点,返回执行针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点的步骤,直至所述网络定位点拓扑图中的全部用户的职业都预测完毕,获得全部用户的目标定位点的点权重;

对所述全部第一用户的目标定位点的点权重进行归一化,获得所述全部第一用户的第一职业比例;

针对所述网络定位点拓扑图中的各用户的目标定位点,根据目标定位点的点权重以及与其相连接全部用户的目标定位点的边连接线的边权重进行迭代运算,获得本轮迭代运算对应的全部用户目标定位点的点权重;

对所述本轮迭代运算对应的全部用户目标定位点的点权重进行归一化,获得所述全部第一用户的第二职业比例;

判断所述第一职业比例与所述第二职业比例的差值是否大于预设的差值阈值,若是,则返回执行针对所述网络定位点拓扑图中的各用户的目标定位点,根据目标定位点的点权重以及与其相连接全部用户的目标定位点的边连接线的边权重进行迭代运算,获得本轮迭代运算对应的全部用户目标定位点的点权重的步骤,直至所述第一职业比例与所述第二职业比例的差值不大于所述预设的差值阈值。

在本实施例中,为了进一步地提高用户职业预测的精准度,可以根据已经计算获得的全部用户目标定位点的点权重以及边权重,对各目标定位点的点权重进行迭代运算。网络定位点拓扑图里包含的用户,职业类型有多种,所以职业传播的结果,很多用户会有多个标签,比如0.7概率是医生,0.3概率是老师,而当所有用户都被职业传播上后,可以继续以边传播权重,然后再归一化,直到,每个用户相比上一轮迭代,属于各个职业标签的概率无大变化,然后才停止算法。具体地,针对所述网络定位点拓扑图中的各用户的目标定位点,根据目标定位点的点权重以及与其相连接全部用户的目标定位点的边连接线的边权重进行迭代运算,获得本轮迭代运算对应的全部用户目标定位点的点权重;对所述本轮迭代运算对应的全部用户目标定位点的点权重进行归一化,获得所述全部第一用户的第二职业比例;判断所述第一职业比例与所述第二职业比例的差值是否大于预设的差值阈值,若是,则返回执行针对所述网络定位点拓扑图中的各用户的目标定位点,根据目标定位点的点权重以及与其相连接全部用户的目标定位点的边连接线的边权重进行迭代运算,获得本轮迭代运算对应的全部用户目标定位点的点权重的步骤,直至所述第一职业比例与所述第二职业比例的差值不大于所述预设的差值阈值。

本实施例提供的职业预测方法,通过针对所述网络定位点拓扑图中的各用户的目标定位点,根据目标定位点的点权重以及与其相连接全部用户的目标定位点的边连接线的边权重进行迭代运算,获得本轮迭代运算对应的全部用户目标定位点的点权重;对所述本轮迭代运算对应的全部用户目标定位点的点权重进行归一化,获得所述全部第一用户的第二职业比例;判断所述第一职业比例与所述第二职业比例的差值是否大于预设的差值阈值,若是,则返回执行针对所述网络定位点拓扑图中的各用户的目标定位点,根据目标定位点的点权重以及与其相连接全部用户的目标定位点的边连接线的边权重进行迭代运算,获得本轮迭代运算对应的全部用户目标定位点的点权重的步骤,直至所述第一职业比例与所述第二职业比例的差值不大于所述预设的差值阈值。,从而能够进一步地提高用户职业预测的精准度。

图8为本发明实施例五提供的职业预测装置的结构示意图,如图8所示,所述职业预测装置,包括:

地址信息获取模块51,用于获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;

聚类模块52,用于对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;

绘制模块53,用于根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;

预测模块54,用于根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。

本实施例提供的职业预测装置,通过获取预存的至少一个用户的多个地址信息,所述用户包括职业待测的第一用户以及职业已知的第二用户;对所述至少一个用户的多个地址信息进行聚类操作,获得各用户的目标定位点;根据所述第一用户以及所述第二用户目标定位点的地址信息、预设的第二用户的点权重以及根据任意两个用户目标定位点之间的距离计算获得的边权重绘制目标定位点拓扑图;根据所述目标定位点拓扑图对全部所述第一用户的职业进行预测。从而能够准确地对当前全部用户的职业进行预测,以便后续根据用户的职业标签进行大数据分析。

进一步地,在上述任一实施例的基础上,所述聚类模块包括:

编码单元,用于针对每一所述用户,通过预设的编码算法分别对所述用户多个地址信息进行编码,获得多个与所述地址信息对应的编码信息;

第一确定单元,用于针对每一编码信息,确定所述编码信息对应的全部地址信息;

第二确定单元,用于根据所述编码信息对应的全部地址信息确定所述目标定位点。

进一步地,在上述任一实施例的基础上,所述第二确定单元具体用于:

判断所述编码信息对应的全部地址信息与所述用户的多个地址信息的比值是否大于预设的第一阈值;

若是,则计算所述编码信息对应的全部地址信息经纬度的平均值,获得所述目标定位点;

若否,则不对所述用户进行职业预测。

进一步地,在上述任一实施例的基础上,所述第二确定单元具体用于:

确定所述目标定位点的数量是否大于预设的第二阈值;

若是,则根据预设的筛选规则对所述目标定位点进行筛选。

进一步地,在上述任一实施例的基础上,所述第二确定单元具体用于:

针对各目标定位点,确定用户出现在所述目标定位点的时间信息,根据所述时间信息对所述目标定位点进行筛选;和/或,

针对各目标定位点,确定所述目标定位点附近的建筑类型,根据所述建筑类型对所述目标定位点进行筛选。

进一步地,在上述任一实施例的基础上,所述绘制模块包括:

边连接线建立单元,用于针对各目标定位点,将所述目标定位点分别和与所述目标定位点距离小于预设的第三阈值的其他目标定位点建立边连接线;

绘制单元,用于针对每一条边连接线,计算所述边连接线两端的目标定位点之间的距离,对所述距离进行归一化,将归一化后的距离作为所述边连接线对应的边权重,根据点权重、边权重以及目标定位点绘制目标定位点拓扑图。

进一步地,在上述任一实施例的基础上,所述预测模块包括:

目标定位点确定单元,用于针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点;

计算单元,用于将所述第二用户目标定位点的点权重以及与其相连接全部第一用户的目标定位点的边连接线的边权重相乘,获得与所述第二用户目标定位点相连接的全部第一用户的目标定位点的点权重;

循环单元,用于将所述与所述第二用户目标定位点相连接的全部第一用户的目标定位点作为所述第二用户的目标定位点,返回执行针对各第二用户的目标定位点,确定与所述第二用户目标定位点相连接的全部第一用户的目标定位点的步骤,直至所述网络定位点拓扑图中的全部用户的职业都预测完毕。

进一步地,在上述任一实施例的基础上,所述预测模块还包括:

处理单元,用于对所述点权重进行归一化处理,获得所述第一用户的职业比例。

进一步地,在上述任一实施例的基础上,所述用户的地址信息包括用户使用网约车的定位点地址、出发点地址以及目的地地址和/或用户网络购物的收货地址和/或用户外卖的收货地址。

图9为本发明实施例六提供的职业预测设备的结构示意图,如图9所示,所述职业预测设备包括:存储器61,处理器62;

存储器61;用于存储所述处理器62可执行指令的存储器61;

其中,所述处理器62被配置为由所述处理器62执行如上述任一实施例所述的职业预测方法;

所述职业预测设备还包括通信接口。

本发明又一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述任一实施例所述的职业预测方法。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1