一种基于大数据预测用户行为的控制方法及装置的制造方法

文档序号:10687708阅读:336来源:国知局
一种基于大数据预测用户行为的控制方法及装置的制造方法
【专利摘要】本发明提供一种基于大数据预测用户行为的控制方法,其用于基于用户行为大数据集合进行归类分析以预测计算行为期望指数I,包括:a.获取用户实际行为变量y;b.基于函数fi(u,y,φ......)计算获得特征参数β1、β2...βp;c.基于线性组合公式u=β1x1+β2x2+......βpxp计算获得用户期望值u;d.基于公式I=g(u)计算获得所述行为期望指数I。还提供相应的控制装置。通过本发明可以针对用户风险、购买偏好、续保、加保等方面设计客户指标,从成千上万的用户数据中优选出特定数量的数据,构建精炼的预测模型并基于该预测模型对用户未来行为走势进行直观评估。
【专利说明】
一种基于大数据预测用户行为的控制方法及装置
技术领域
[0001] 本发明涉及大数据分析领域,尤其是大数据分析在保险行业的应用,具体地涉及 一种基于大数据预测用户行为的控制方法及相应的装置。
【背景技术】
[0002] 随着大数据时代的到来,越来越多的行业开始将大数据分析应用到其对客户的日 常管理工作中,诸如保险行业、电信行业、快消品行业等,这些行业都开始基于大数据处理 来分析客用户的行为模式,甚至可以预测用户行为的未来走势,挖掘潜在用户资源。在传统 保险行业领域中,数据分析人员一般通过精算技术获取产品销量及用户风险指数,其更多 地在一个维度上对数据进行定量计算及定性分析,无法从整体上反映实际运营过程中数据 的多样化及复杂性。目前保险公司向用户提供的保险产品大多都是根据历史数据的总体分 析计算获得的,这些产品通过综合考察大量用户在同一指标上的行为数据评估获得一个平 均值,并以此为基础制定出一个能够适用于大多数用户的保险产品,这种以不变应万变的 保险产品虽然能在一定程度上满足业务员日常扩展用户的工作需求,但不利于业务员针对 用户做进一步追踪。
[0003] 在很多时候,业务员都希望能够在用户参保后继续跟进,通过分析用户参保后的 行为数据对不同行为特征的用户进行归类划分,以便后续针对不同类型用户提供个性化续 保服务,例如,结合用户本期参保情况综合分析用户的赔付风险、加保概率等数值,将不同 行为特征的用户区分开来,涉及相应指标以构建预测模型,以车险产品为例,保险公司可以 结合用户属性(如年龄、性别、婚姻状况、职业、教育背景等)及用户一段时间内的行为特征 (如驾驶情况、违章记录等)来评估不同用户在购买车险之后的赔付风险,或者预测该客户 在购买了数次车险之后的后续购买意向,从而基于用户在同一指标下行为的分析建模的基 础上,使得业务员能够通过数据模型对用户行为有一个直观认识并基于模型走势对用户后 续行为有一个精确预测。
[0004] 在现阶段,没有一个非常好的方法能够解决上述提到的问题。大多数情况下,业务 员都只能通过对所有用户数据的综合分析获得固定内容的保险产品提供给用户,没有提供 一种有效地基于大数据预测用户行为的方法,使得业务员可以通过对不同行为特征的用户 进行归因分析,涉及指标建立对应数据模型来获得客户未来的行为走向,对同一类型用户 购买保险产品后的行为进行分析预测。

【发明内容】

[0005] 为了克服现有技术中没有提供基于用户行为的大数据预测用户未来行为走向的 技术问题,本发明的目的是提供一种基于大数据预测用户行为的控制方法及相应的装置。
[0006] 根据本发明的一个方面,提供一种基于大数据预测用户行为的控制方法,其用于 基于用户行为大数据集合进行归类分析以预测计算行为期望指数I,包括如下步骤:
[0007] a.获取用户实际行为变量y;
[0008] b.基于函数fi(u,y,Φ......)计算获得特征参数· .?,其中所述Φ等为除 一阶矩外的其他分布参数;所述i表示第i用户;所述......)为分布的密度函数, 其用于表示第i用户实际行为的出现概率;所述P表示用户的特征行为数量;
[0009] C.基于线性组合公式计算获得用户期望值u:
[0010] 11 = β?Χ1+β2Χ2+......βρΧρ,其中,X= {χι、χ2、Χ3· · ·Χρ}表示用户特征行为指数变量 集,Xk表示一用户特征行为指数,所述扮、&.. .?为特征参数;
[0011] d.基于公式I = g(u)计算获得所述行为期望指数I。
[0012] 优选地,所述特征行为数量p基于如下公式计算获得:
[0013]
[0014] 其中,所述Θ表示第一阈值,其用于确定所述用户期望值u对应的特征行为数量p; 所述A1表示基于用户特征行为指数捕捉到的用户行为指数变量X1、X2、 X3. . .^的信息量,其 中 0<p<k〇
[0015] 优选地,基于如下公式计算所述信息量Μ:
[0016]
[0017] 其中所述Ai表示所述主成分Zi捕捉到的用户行为指数变量xi、X2、X3. . .Xk的信息 量。
[0018] 根据本发明的另一个方面,还提供一种基于大数据预测用户行为的控制装置,其 用于基于用户行为大数据集合进行归类分析以预测计算行为期望指数I,包括:
[0019] 第一获取装置,其用于获取用户实际行为变量y;
[0020] 第一处理装置,其用于基于函数fi(u,y,(i)......)计算获得特征参数、&_··βρ, 其中所述Φ等为除一阶矩外的其他分布参数;所述i表示第i用户;所述......) 为分布的密度函数,其用于表示第i用户实际行为的出现概率;所述P表示用户的特征行为 数量;
[0021] 第二处理装置,其用于基于线性组合公式计算获得用户期望值U:
[0022] 11 = β?Χ1+β2Χ2+......βρΧρ,其中,X= {χ?、Χ2、Χ3· · ·Χρ}表示用户特征行为指数变量 集,Xk表示一用户特征行为指数,所述扮、&.. .?为特征参数;
[0023] 第三处理装置,其用于基于公式I = g(u)计算获得所述行为期望指数I。
[0024] 通过本发明提供的技术内容,可以有效地解决无法基于大数据预测具体用户行为 的技术问题,从而给数据分析方带来了良好的用户体验,提高了工作效率及数据分析水平。
【附图说明】
[0025]通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其他特征、 目的和优点将会变得更明显:
[0026] 图1示出根据本发明的第一实施例的,一种基于大数据预测用户行为的控制方法 的流程图;
[0027] 图2示出根据本发明的一个【具体实施方式】的,基于泊松分布函数描绘的用户实际 行为曲线;
[0028]图3示出根据本发明的又一个【具体实施方式】的,基于行为期望指数获得的预测模 型;
[0029]图4示出根据本发明的另一个【具体实施方式】的,客户预测值的分布情况;
[0030] 图5示出根据本发明的一个【具体实施方式】的,基于伽马分布函数描绘的用户实际 行为曲线;
[0031] 图6示出根据本发明的第二实施例的,一种基于大数据预测用户行为的控制装置 的结构图;以及
[0032] 图7示出根据本发明的一个典型应用场景的结构示意图。
【具体实施方式】
[0033]为了更好的使本发明的技术方案清晰的表示出来,下面结合附图对本发明作进一 步说明。
[0034]本领域技术人员理解,为了解决现有技术无法通过分析用户行为数据来预测用户 未来走势的技术问题,本发明的技术方案在于提供一种基于大数据预测用户行为的控制方 法以实现为不同行为特征的用户建立预测模型的解决方案。通过本发明提供的技术方案, 业务员可以针对用户风险、购买偏好、续保、加保等方面设计客户指标,从成千上万的用户 数据中优选出特定数量的数据,构建精炼的预测模型并基于该预测模型对用户未来行为走 势进行直观评估。具体地,在本发明的优选实施例中,通过广义线性回归法计算获取下期用 户行为期望值u,然后设计行为期望指数I = g(u)将不同行为特征的用户区分开并建立以u 为自变量,I为因变量的预测模型。
[0035]图1示出根据本发明的第一实施例的,一种基于大数据预测用户行为的控制方法 的流程图,其用于基于用户行为大数据集合进行归类分析以预测计算行为期望指数I。具体 地,在本实施例中,首先执行步骤SlOl,获取用户实际行为变量y。更为具体地,所述用户实 际行为变量y为用户人身属性集合,其用于表征用户的固有属性,如年龄、性别、婚姻状况、 职业、教育背景等。更进一步地,所述用户实际行为变量y基于对用户的定期跟踪收集获得。 优选地,所述用户实际行为变量y还包括用户在本期参保时间段内产生的与用户所购保单 有关联的一些列行为集合,例如,若用户本期购买了一车险保单,则相对应的用户实际行为 变量y包括用户在本期保单周期内的驾车里程数、交通事故处理情况、违章记录等。
[0036] 然后进入步骤S102执行,基于函数fi(u,y,Φ......)计算获得特征参数.. βρ。具体地,所述Φ等为除一阶矩外的其他分布参数;所述i表示第i用户;所述 Φ......)为分布的密度函数,其用于表示第i用户实际行为的出现概率;所述P表示用户的 特征行为数量。更为具体地,所述分布的密度函数包括正态分布函数、泊松分布函数或者伽 马分布函数等。更进一步地,所述特征参数仇、&.. .?为步骤S103中用户期望值u的系数,其 用于对所述用户期望值u进行调节。在一个优选例中,业务员所观测到的用户实际行为变量 y出现的概率基于如下泊松分布函数表示:
[0037]
[0038] 其中,所述k表示所
述用户实际行为变量y的实际出现次数,所述λ表示单位时间内 用户实际行为变量y的平均发生率,所述泊松分布函数用于描述单位时间内所述用户实际 行为变量出现的次数,如图2所示,所述曲线上的每一个点即代表实际观测到的用户行为变 量出现的概率P,所述泊松分布函数基于λ的不同可以获得多条曲线,在观测独立性假设下, 所有观测到的用户实际行为变量y出现的概率戈
EX所述概率f最大值即 fmax时对应u'的参数扮、&.. .βΡ作为所述步骤S103中计算用户期望值u时的系数。
[0039] 接下来执行步骤S103,基于线性组合公式11 = β?Χ1+β2Χ2+......βρΧρ计算获得用户 期望值11。具体地,所述1132、13...11)共同组成一集合乂={11、12、13...11)},其用于表示用户 特征行为指数变量集,ΧΡ表示用户的第P个特征行为指数。更为具体地,所述扮、&.. .?为所 述步骤S102中计算获得的特征参数。更进一步地,所述用户期望值u为下期用户行为的期望 值,其用于表征用户在新保单周期内的可能出现的用户行为。在一个优选例中,所述用户期 望值u基于所述仏的取值可组成一集合U,所述集合U中包括基于不同的β线性计算后得到的 用户期望值u,将所述集合U中的数值依次代入上述步骤S102中的公式匕(1!,7, Φ......)即 可获得对应的分布函数曲线,则所述分布函数曲线的顶点即实际观测到的用户实际行为变 量出现的概率最大值时u的计算系数扮.βΡ即为所述用户期望值u的特征参数。
[0040] 最后执行步骤S104,基于公式I=g(u)计算获得所述行为期望指数I。具体地,所述 行为期望指数I表示用户在下期保单时间段内的行为预测情况。更为具体地,所述行为期望 指数I为一连接函数,其具有单调可微的特征。更进一步地,所述行为期望指数I基于所述不 同类型的分布密度函数^而具有对应的连接函数。更进一步地,基于所述行为期望指数I构 建对应的预测模型,所述预测模型基于线性模型表示。优选地,所述预测模型基于平面直角 坐标系表示,其中,所述用户期望值u作为自变量对应所述平面直角坐标系上的X轴,所述行 为期望指数I作为因变量对应所述平面直角坐标系上的y轴。在一个优选例中,所述行为期 望指数I = l〇g(u),其适用于所述用户期望值u服从于泊松分布或负二项分布时的情形,最 终得到如图3所示的预测模型,从图3所示预测模型可以看出,通过本发明所述技术方案模 拟获得的预测赔付情形是与用户实际赔付数据高度吻合的(因分辨率限制无法显示更进一 步地吻合情况),在一个优选例中,以车险业务车损险保单赔付金额预测为例,业务员可以 根据预测值将客户分成如图4所示的10个等分,其中,第10个等分(预测赔付和实际赔付均 最高的一组)被标定为高风险用户,本领域技术人员可以根据预测模型计算出的预测赔付 作为风险预警指标,并根据该指标制定合适的业务政策。
[0041] 进一步地,所述预测模型还基于三维坐标系表示,本领域技术人员还可以变化出 更多实施例,在此不予赘述。
[0042]本领域技术人员理解,本发明所述技术方案优选地基于广义线性回归法分析所述 用户期望值u对所述行为期望指数I的依存关系,其中,所述行为期望指数I为连续且充分光 滑的函数,所述不同用户的用户期望值u相互独立,且每一个数值型用户期望值u与行为期 望值书I的关系与所述用户期望值u所服从的分布密度函数类型密切相关,通过上述步骤 SlOl至步骤S104的计算推导获得的某一指标上用户的预测走势图,业务员可以对具有不同 行为特征的用户进行归类,针对特定类型用户提供个性化服务,这是现有技术所不采用的 技术方案,能够极大的优化业务员的数据分析能力,提高工作效率。
[0043]进一步地,在所述步骤S102中,所述矩表示所述用户实际行为变量y在不同的阶数 距离零点和/或中心的距离,优选地,所述Φ =E( (y-c)K),其中,k>l,c>0,例如,当k = 2且 c = 0时,Φ =E(y2)表示所述用户实际行为变量y的二阶零点矩,其用于衡量所述用户实际 行为变量y的均值或数字期望,本领域技术人员理解,所述函数fdiy,Φ......)中所述Φ 等除一阶矩外的其他分布函数,可以通过对上述0=E((y-c)K)公式中的参数c及参数k赋 予不同的数值获得,从而通过不同阶数的矩来衡量所述用户实际行为变量y的不同方面特 征。
[0044] 在本实施例的一个变化例中,所述分布函数fi(u,y,Φ......)基于如下的正态分 布函数表示:
[0045]
[0046] 其中,所述-°°<y< + °°,且_°°<μ< + °°,〇为参数,所述F函数用于表示所述用户 实际行为变量y服从参数为(μ,σ2)的正态分布,记作y~Ν(μ,〇2)。具体地,所述以和〇基于所 述用户期望值u及分布参数Φ所确定。
[0047] 进一步地,所述分布函数fi(u,y,Φ......)还基于如下的伽马分布函数表示:
[0048]
[0049] 其中,所述a表示形状参数,所述b表示尺度参数,均基于所述用户期望值u及分布 参数Φ确定。具体地,当y <〇时,所述F(y) = 0,如图5所示。
[0050] 本领域技术人员理解,与所述步骤S102中所采用的泊松分布函数相比,本变化例 所述正态分布函数或伽马分布函数用于描述所述用户实际行为变量y为连续型数值的概率 分布情况。
[0051 ]在本实施例的一个变化例中,所述步骤S102中所述特征行为数量P基于如下公式 计算获得:
[0052]
[0053] 其中,所述Θ表示第一阈值,其用于确定所述用户期望值u对应的特征行为数量p; 所述A1表示基于用户特征行为指数捕捉到的用户行为变量指数X1、X2、 X3. . .^的信息量,其 中 0<p<k〇
[0054] 进一步地,所述信息量\基于如下公式计算获得:
[0055]
[0056] 其中所述Ai表示所述主成分Zi捕捉到的用户行为指数变量xi、X2、X3. . .Xk的信息 量。优选地,所述主成分Z1基于对所述用户行为指数变量的线性组合获得。
[0057] 优选地,通过设定所述第一阈值Θ对原始用户行为指数变量进行优选,进而构建精 炼的预测模型。优选地,从k个用户行为指数变量中优选出包含有最多信息量的p个变量作 为所述用户特征行为指数变量集X中的元素进行后续计算。在一个优选例中,所述第一阈值 Θ基于百分比表示,其数值优选地为80 %,即当所述用户特征行为指数变量集X中的元素所 代表的信息量之和占所述用户行为指数变量总信息量的比例达到80%时,认为所述变量集 X中的元素数量已经达到要求,所述变量集X中元素所包含的信息量能够用来代表所述用户 行为指数变量的总信息量,则此时所述变量集X中的元素数量即为所述步骤S102及所述步 骤S103中的用户特征行为数量p。
[0058] 在本实施例的又一个变化例中,所述行为期望指数Iig(U)=If1,其优选地适用于 所述用户期望值u服从于伽马分布时的情形。
[0059] 进一步地,所述行为期望指I
,其优选地适用于所述用户期望指数u 服从于二项分布时的情形。
[0060] 本领域技术人员理解,本发明的技术方案首先利用主成分分析法等技术从较多的 用户行为指数变量X1、 X2、X3. . .Xk中获取较少的蕴含足够信息量的用户特征行为指数变量 集X,从而根据这些精简的用户特征行为指数变量集X中的元素进一步利用其它数据挖掘算 法建立简练而精确的模型,本发明所述技术方案在客户细分方面具有足够的精确性,在模 型训练、模型部署阶段具有足够的快速性、易用性。
[0061] 图6示出根据本发明的第二实施例的,一种基于大数据预测用户行为的控制装置 的结构图,其用于基于用户行为大数据集合进行归类分析以预测计算行为期望指数I,具体 地,在本实施例中,所述控制装置4包括第一获取装置41,其用于获取用户实际行为变量y; 第一处理装置42,其用于基于函数乜(1!,7, Φ......)计算获得特征参数仇、此.· .?;第二处 理装置43,其用于基于线性组合公式计算获得用于期望值u;第三处理装置44,其用于基于 公式I=g(u)计算获得所述行为期望指数I。其中,所述Φ等为除一阶矩外的其他分布参数; 所述i表示第i用户;所述......)为分布的密度函数,其用于表示第i用户实际行 为的出现概率;所述P表示用户的特征行为数量。优选地,所述用户期望值u基于公式1! = β1Χ1 +^2X2+......βρΧρ计算获得,其中,X= {X1、X2、X3. . .Χρ}表示用户特征行为指数变量集,Xk表 示一用户特征行为指数,所述扮、&.. .?为特征参数。
[0062] 进一步地,所述用户特征行为数量p基于公式
f算获得,其中所述参数的 具体含义及获得方式本领域技术人员可以参考上述图1所示实施例中所述技术方案获得, 在此不予赘述。
[0063] 在一个优选例中,所述控制装置4首先调用所述第一获取装置41获取基于对用户 的定期跟踪收集获得的用户行为组成的大数据集合,并从中提炼本次分析所需的用户实际 行为变量y;所述第一处理装置42基于泊松分布函数
算获得上述用户实际行为变量y的出现概率,得到相应的概率曲线,所述分布函数中各参数 的含义本领域技术人员可以参考上述图1所示实施例中所述步骤S102,在此不予赘述;进一 步地,所述第二处理装置43基于线性组合公式U = β?Χ1+β2Χ2+......βρΧρ计算获得用户期望 值U,其中,所述Χ1、Χ2、Χ3· · .Xp共同组成一集合X= {χ?、Χ2、Χ3· · ·Χρ},其用于表示用户特征行 为指数变量集,所述ΧΡ表示用户的第P个特征行为指数,通过对所述计算系数. .?的 不同取值获得对应用户期望值U组成的集合U,从而将所述集合U中的数值依次代入所述第 一处理装置42中的泊松分布函数公式得到对应的分布函数曲线,最终获得所述曲线顶点即 实际观测到的用户实际行为变量y出现概率最大时的用户期望值u,并将此用户期望值u对 应的计算系数. .?作为所述用户期望值u的特征参数;然后,所述第三处理装置43基 于所述用户期望值u套用公式I = Iog(U)获得用来表征预测模型的行为期望指数I。
[0064]进一步地,所述用户期望指数u服从泊松分布;所述控制装置4基于广义线性回归 法分析所述用户期望值u对所述行为期望指数I的依存关系。本领域技术人员理解,本实施 例所述技术方案通过所述控制装置4中各模块的协同运作,实现将大量的用户实际行为变 量y精炼为基于概率的分布函数并最终基于已有数据生成预测曲线的过程,使得业务员能 够根据用户现有的数据简单直观地获得用户大致的未来走势,例如理赔风险、续保意向等, 这是现有技术所不采用的技术方案,能够在很大程度上减轻业务员的工作量,优化业务员 的工作模式,使得业务员针对不同用户能够制定一个更为合理、更有针对性的后续服务方 案。
[0065] 在本实施例的一个变化例中,所述第一处理装置42还基于正态分布函数
计算获得所述特征参数β1、β2. . .βΡ,其中,所述-00Sy;+00,且_ 0<μ< + α,σ为参数,所述F函数用于表示所述用户实际行为变量y服从参数为(μ, 〇2)的正 态分布,记作y~Ν(μ,σ2),又例如,所述分布函数fi(u,y,Φ......)还基于伽马分布函数
表示,其中,所述a表示形状参数,所述b表示尺度参数, 均基于所述用户期望值u及分布参数Φ确定,本领域技术人员理解,本实施例所述分布函数 用于绘制所述用户实际行为变量y的出现概率曲线,通过对不同数值下用户期望值u对应分 布曲线的绘制获得所述用户实际行为变量出现概率最大时对应的特征参数β?、β2. . .βρ,从 而获得对应的预测模型I=g(U)。
[0066] 在本实施例的又一个变化例中,还基于公式I = g(u) =If1计算获得所述行为期望 指数,本领域技术人员理解,上述实施例中所述第三处理装置43基于公式I = Iog(U)获得行 为期望指数I的技术方案优选地适用于第一处理装置42获得的用户实际行为变量出现概率 基于泊松分布排布的情形,本变化例所述技术方案则优选地适用于所述用户实际行为变量 出现概率基于伽马分布进行排布的情形,相应地,在本变化例中所述用户期望值u同样服从 于伽马分布。
[0067] 进一步地,所述第三处理装置44还基于么
卜算获得所述行为期望 指数I,本领域技术人员理解,当所述第一处理装置42获得的用户实际行为变量出现概率基 于二项分布时,所述第三处理装置44优选地基于本变化例所述公式计算获得对应的行为期 望指数I并生成相应的预测曲线,相应地,在本变化例中所述用户期望指数u同样服从于二 项分布时的情形。
[0068] 图7示出根据本发明的一个典型应用场景的结构示意图,其中建模系统与上述图6 所述实施例中所述控制装置相通讯。具体地,在本实施例中,所述建模系统包括用户实际行 为变量y,其用于精炼表示用户在一定时期内的人身属性集合;分布函数6(11,7, Φ......),其用于基于分布曲线获得用户实际行为变量y出现概率最高时对应的特征参数 . .?;行为期望指数I,其用于基于公式I=g(u)计算获得用户在下期保单时间段内的 行为预测情况,并构建对应的预测模型直观获得用户的未来行为走势。
[0069] 在一个具体地应用场景中,所述建模系统通过一系列的市场调研并结合数据推导 将数以万计的用户原始行为数据抽象精炼为用户实际行为变量y,然后基于泊松分布函数 描绘出对应的用户实际行为变量的出现概率,通过变化用户期望值获得对应的多条概率分 布曲线,从而将其中用户实际行为变量y出现概率最高时(即曲线顶点)对应的用户期望值 作为本技术方案所需要的用户期望值U,其中,所述用户期望值U基于公式1! = β1Χ1+β2Χ2 +......βρΧρ获得,所述建模系统通过代入不同的β?、&· · ·βρ以及所述Χ1、Χ2、Χ3· · .Xp来获得 不同的用户期望值,进而获得上述多条概率分布曲线,而当所述用户期望值U确定后,所述 建模系统基于公式I = IogU)计算获得用户对应的行为期望指数I,并生成对应的预测模 型。优选地,本应用场景所述用户期望值u服从于泊松分布或负二项分布情形。优选地,所述 预测模型基于线性模型表示。优选地,所述预测模型基于平面直角坐标系表示。进一步地, 所述预测模型还基于三维坐标系表示,本领域技术人员可以根据实际需要变化出更多实施 例,在此不予赘述。
[0070] 在另一个应用场景中,所述建模系统还基于二项分布函数计算获得所述特征参数 ^1J2. . .βΡ,相应地,所述行为期望指数I基于公:
计算获得,本领域技术人 员理解,在本应用场景中,所述用户实际行为变量出现概率以及所述用户期望指数u优选地 服从二项分布的规律展示在相应的平面直角坐标系上。
[0071] 进一步地,所述建模系统还基于伽马分布函数计算获得所述特征参数仇.βΡ, 相应地,所述行为期望指数I基于公式I Ig(U)=IT1计算获得,本领域技术人员理解,在本应 用场景中,所述用户实际行为变量出现概率以及所述用户期望指数u优选地服从伽马分布 的规律展示在相应的平面直角坐标系上。
[0072]在另一个应用场景中,所述建模系统还基于正态分布函数计算获得所述特征参数 . .βΡ,这同样能获得本发明所述预测模型,本领域技术人员理解,本发明所述不同的 分布函数用于针对不同的用户实际行为变量y给出最为符合的概率曲线,所述建模系统在 运行过程中优选地依次套用不同的分布函数对已有的用户实际行为变量y进行拟合,从中 筛选与所述用于实际行为变量y出现概率最为贴切的分布函数作为本发明所述技术方案的 优选分布函数进行建模。
[0073]以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述 特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影 响本发明的实质内容。
【主权项】
1. 一种基于大数据预测用户行为的控制方法,其用于基于用户行为大数据集合进行归 类分析以预测计算行为期望指数I,其特征在于,包括如下步骤: a. 获取用户实际行为变量y; b. 基于函数匕(1!,7,(})......)计算获得特征参数仇、&...?,其中所述Φ等为除一阶矩 外的其他分布参数;所述i表示第i用户;所述......)为分布的密度函数,其用于 表示第i用户实际行为的出现概率;所述Ρ表示用户的特征行为数量; c. 基于线性组合公式计算获得用户期望值u: 11 = β?Χ1+β2Χ2+.....βρΧρ,其中,Χ= {Χ1、Χ2、Χ3…Χρ}表示用户特征行为指数变量集,Xk表 示一用户特征行为指数,所述扮、&.. .?为特征参数; d. 基于公式I = g(u)计算获得所述行为期望指数I。2. 根据权利要求1所述的控制方法,其特征在于,所述特征行为数量ρ基于如下公式计 算获得:其中,所述Θ表示第一阈值,其用于确定所述用户期望值u对应的特征行为数量ρ;所述Μ 表示基于用户特征行为指数捕捉到的用户行为指数变量X1、X2、X3. . .xk的信息量,其中0<ρ <k〇3. 根据权利要求2所述的控制方法,其特征在于,基于如下公式计算所述信息量Μ:其中所述Μ表示所述主成分Zi捕捉到的用户行为指数变量JQ、X2、X3. . .Xk的信息量。4. 一种基于大数据预测用户行为的控制装置,其用于基于用户行为大数据集合进行归 类分析以预测计算行为期望指数I,其特征在于,包括: 第一获取装置,其用于获取用户实际行为变量y; 第一处理装置,其用于基于函数fdud,Φ......)计算获得特征参数仇、此.· .?,其中 所述Φ等为除一阶矩外的其他分布参数;所述i表示第i用户;所述......)为分 布的密度函数,其用于表示第i用户实际行为的出现概率;所述Ρ表示用户的特征行为数量; 第二处理装置,其用于基于线性组合公式计算获得用户期望值u: u=β1Χ1+β2Χ2+.....β pXp,其中,X= {xi、X2、X3. . .Χρ}表示用户特征行为指数变量集,Xk表示一用户特征行为指数, 所述仇、&...βρ为特征参数; 第三处理装置,其用于基于公式I = g(u)计算获得所述行为期望指数I。
【文档编号】G06Q40/08GK106056241SQ201610356742
【公开日】2016年10月26日
【申请日】2016年5月26日
【发明人】吴敏辰, 马伟伟, 陈军, 孙佩, 张孟露, 张雅停
【申请人】中国太平洋保险(集团)股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1