一种收入水平预测方法、装置、存储介质和系统与流程

文档序号:14872395发布日期:2018-07-07 01:28阅读:136来源:国知局

本发明涉及用户收入水平预测领域,尤其是一种收入水平预测方法、装置、存储介质和系统。



背景技术:

在互联网领域,我们为了对用户进行细分以实现精准营销的目的,会针对用户的收入能力划分层级推荐不同的产品和服务内容。我们无法获取每个终端用户的真实收入水平,通常是根据用户的行为做统计建模分析,常规模型十分依赖技术人员对行为特征的理解,无法将特征映射到更高维的空间,难以最大限度的发挥现有特以的价值。至于大部分常规模型存在性能差、准确率低的问题,导致营销、推荐效果差,成本高昂。



技术实现要素:

针对现有技术中的缺陷,本发明提供一种收入水平预测方法、装置、存储介质和系统,克服了用户行为特征利用率低、模型准确率低、投入成本高和推荐效果差等问题。

为了实现上述目的,本发明提供的一种收入水平预测方法,包括如下步骤:

收集用户端发送的用户行为数据,并对所述行为数据进行数值化处理得到数值化的行为特征;

将每个行为特征转化为向量,并根据所述向量建立n层全连接神经网络,以及将所有行为特征进行组合映射到全连接神经网络的高纬空间;

学习全连接神经网络的行为特征间的关联关系,得到上层全连接神经网络对下层全连接神经网络的影响系数。

进一步地,所述收入水平预测方法还包括:对所述行为数据进行预处理。

进一步地,所述收入水平预测方法还包括:按照行为特征的数值变化区间,做归一化处理。

进一步地,所述收入水平预测方法还包括:根据所述n层全连接神经网络添加m个残差块。

进一步地,所述n层全连接神经网络为150层全连接神经网络,所述m个残差块为30个残差块。

进一步地,所述收入水平预测方法还包括:设定每一层全连接神经网络上的节点保留概率,所述全连接神经网络包括多个节点。

一种收入水平预测装置,所述收入水平预测装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的程序,所述存储器和处理器电连,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如所述的收入水平预测方法的步骤。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如所述的收入水平预测方法的步骤。

一种收入水平预测系统,所述收入水平预测系统包括收入水平预测装置和用户端;所述水平预测装置通过无线或者有线网络与用户端相连;所述水平预测装置执行如所述的收入水平预测方法的步骤。

本发明的有益效果是:本发明提供一种收入水平预测方法、装置、存储介质和系统实现了,对用户行为数据的采集和处理得到数值化的行为特征,行为特征利用率高、模型准确率高、投入成本低和推荐效果好。

附图说明

图1为本发明收入水平预测方法第一实施例的流程图;

图2为本发明收入水平预测方法第二实施例的流程图;

图3为本发明收入水平预测系统实施例的框图。

具体实施方式

下面将详细描述本发明的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。在以下描述中,为了提供对本发明的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的电路,软件或方法。

在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。

收入水平预测方法第一实施例:

如图1所示,收入水平预测方法,包括如下步骤:

s001,收集用户端发送的用户行为数据,并对所述行为数据进行数值化处理得到数值化的行为特征;

s002,将每个行为特征转化为向量,并根据所述向量建立n层全连接神经网络,以及将所有行为特征进行组合映射到全连接神经网络的高纬空间;

s003,学习全连接神经网络的行为特征间的关联关系,得到上层全连接神经网络对下层全连接神经网络的影响系数。

收入水平预测方法第二实施例:

如图2所示,收入水平预测方法,包括如下步骤:

s101,收集用户端发送的用户行为数据。

具体的,用户端将用户行为数据进行收集之后上传给收入水平预测装置,而所述水平预测装置在采集用户行为数据的过程中是按照每个不同用户以及每个用户的行为发生的先后时间顺序进行采集的。

s102,对所述行为数据进行预处理。

具体的,当采集到所述用户行为数据之后对所述行为数据进行预处理,所述预处理的方式包括但不限于踢出异常值和空值;通过对所述用户行为数据进行预处理能够降低后期运算,提高收入水平预测的效率。

s103,对所述行为数据进行数值化处理得到数值化的行为特征。

具体的,通过将所述行为数据数值化处理能够将用户行为变换为数值化的行为特征,有利于后期计算。

s104,将每个行为特征转化为向量,并根据所述向量建立n层全连接神经网络,以及将所有行为特征进行组合映射到全连接神经网络的高纬空间。

具体的,全连接神经网络是通过人为设定的即n为正整数,而本实施例中根据实际的运算时间和效率等因素将n设置为150,即建立150层全连接神经网络,当全连接神经网络建好之后再把所有行为特征进行,所述行为特征的组合包括但不现于行为特征间的加减乘除运算或者转向,组合映射到全连接神经网络的高纬空间中去,通过放在高纬空间中能够更加方便得找出各个特征间最佳的组合方式。

s105,按照行为特征的数值变化区间,做归一化处理。

具体的,通过按照所述行为特征的数值变化区间对所有被采集用户的行为特征进行分批次归一化处理,既能够提高计算效率,又能够避免同时对所有被采集用户的行为特征进行统一归一化处理后行为特征信息损失较多的缺陷。

s106,设定每一层全连接神经网络上的节点保留概率。

具体的,所述全连接神经网络包括多个节点,所述节点的个数是通过人为设定的,可以通过不断的测试进行增减;所述节点可以用来代表一个行为特征,通过设置该节点保留概率随机丢掉一些参数,能够减少节点的权重,提高泛化能力。

s107,根据n层全连接神经网络添加m个残差块。

具体的,残差块是通过人为设定的,即m为正整数且m≤n。在实际的应用过程中,考虑计算效率等条件因素的前提下,通过将150层全连接神经网络的每5层全连接神经网络进行添加一个残差块,当上层全连接神经网络对下层全连接神经网络的影响系数的梯度即对所述影响系数进行求导,当求导的值基本趋近于零时或者梯度消失时,直接跳过全连接神经网络的剩余中间层得到影响系数的最终确定值,其具有降低计算量提高计算效率的优点。

s108,学习全连接神经网络的行为特征间的关联关系,得到上层全连接神经网络对下层全连接神经网络的影响系数。

具体的,所述行为特征间的关联关系是根据判断分数来进行确定,所述判断分数的计算方式为:预测值与真实值差值的平方;需要进行说明的是真实值是已有的固定已有值,预测值与真实值差值的平方越来越趋近于0,则预测值与真实值越接近;所述影响系数为公式的系数,训练的过程就是学习该影响系数的过程。

s109,使用激活函数输出最终结果,映射到分类类别上。

具体的,通过所述激活函数能够将预测值与真实值差值的平方得进行具体呈现,并通过设置一判断阈值与所述最终结果进行比较,若最终结果大于所述判断阈值,则用户的收入水平高,若最终结果小于所述判断阈值,则用户的收入水平低。

收入水平预测装置的第一实施例:

收入水平预测装置,所述收入水平预测装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的程序,所述存储器和处理器电连,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如所述的收入水平预测方法第二实施例的步骤,具体包括:

s201,收集用户端发送的用户行为数据。

s202,对所述行为数据进行预处理。

s203,对所述行为数据进行数值化处理得到数值化的行为特征。

s204,将每个行为特征转化为向量,并根据所述向量建立n层全连接神经网络,以及将所有行为特征进行组合映射到全连接神经网络的高纬空间。

s205,按照行为特征的数值变化区间,做归一化处理。

s206,设定每一层全连接神经网络上的节点保留概率。

s207,根据n层全连接神经网络添加m个残差块。

s208,学习全连接神经网络的行为特征间的关联关系,得到上层全连接神经网络对下层全连接神经网络的影响系数。

s209,使用激活函数输出最终结果,映射到分类类别上。

具体的,存储器可能包含高速随机存取存储器(ram:randomaccessmemory),也可能还包括非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。通过至少一个通信接口(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。

具体的,处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

需要进行说明的是,所述处理器在执行如所述的收入水平预测方法第二实施例的步骤时,其具体的方式和有益效果与收入水平预测方法第二实施例中所记载的基本类似在此不再累述。

计算机可读存储介质的第一实施例:

计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如所述的收入水平预测方法第二实施例的步骤,具体包括:

s301,收集用户端发送的用户行为数据。

s302,对所述行为数据进行预处理。

s303,对所述行为数据进行数值化处理得到数值化的行为特征。

s304,将每个行为特征转化为向量,并根据所述向量建立n层全连接神经网络,以及将所有行为特征进行组合映射到全连接神经网络的高纬空间。

s305,按照行为特征的数值变化区间,做归一化处理。

s306,设定每一层全连接神经网络上的节点保留概率。

s307,根据n层全连接神经网络添加m个残差块。

s308,学习全连接神经网络的行为特征间的关联关系,得到上层全连接神经网络对下层全连接神经网络的影响系数。

s309,使用激活函数输出最终结果,映射到分类类别上。

具体的,计算机可读存储介质可包括缓存(cache)、高速随机存取存储器(ram),例如常见的双倍数据率同步动态随机存取内存(ddrsdram),并且还可包括非易失性存储器(nvram),诸如一个或多个只读存储器(rom)、磁盘存储设备、闪存(flash)存储器设备、或其他非易失性固态存储器设备例如光盘(cd-rom,dvd-rom),软盘或数据磁带等。

需要进行说明的是,所述处理器在执行如所述的收入水平预测方法第二实施例的步骤时,其具体的方式和有益效果与收入水平预测方法第二实施例中所记载的基本类似在此不再累述。

收入水平预测系统的第一实施例:

如图3所示,收入水平预测系统,所述收入水平预测系统包括收入水平预测装置和用户端;所述水平预测装置通过无线或者有线网络与用户端相连;所述水平预测装置执行如收入水平预测方法第二实施例的步骤,具体包括:

s401,收集用户端发送的用户行为数据。

s402,对所述行为数据进行预处理。

s403,对所述行为数据进行数值化处理得到数值化的行为特征。

s404,将每个行为特征转化为向量,并根据所述向量建立n层全连接神经网络,以及将所有行为特征进行组合映射到全连接神经网络的高纬空间。

s405,按照行为特征的数值变化区间,做归一化处理。

s406,设定每一层全连接神经网络上的节点保留概率。

s407,根据n层全连接神经网络添加m个残差块。

s408,学习全连接神经网络的行为特征间的关联关系,得到上层全连接神经网络对下层全连接神经网络的影响系数。

s409,使用激活函数输出最终结果,映射到分类类别上。

需要进行说明的是,所述收入水平预测装置在执行如所述的收入水平预测方法第二实施例的步骤时,其具体的方式和有益效果与收入水平预测方法第二实施例中所记载的基本类似在此不再累述。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1