基于数据分析的人群画像生成方法、装置和计算机设备与流程

文档序号:18872212发布日期:2019-10-14 19:49阅读:345来源:国知局
基于数据分析的人群画像生成方法、装置和计算机设备与流程

本发明涉及到数据分析的技术领域,特别是涉及到一种基于数据分析的人群画像生成方法、装置、计算机设备和存储介质。



背景技术:

人群画像即为通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,抽象模拟出的一种调查分析报告,是用户信息标签,通常应用于产品营销、设计等方面。

在产品营销方面,一般只是分析购买某个产品的人群画像,再按该人群画像去制定销售策略,然而实际中,不同的地区对于产品的接受度不一样,这样的人群画像并不精准,而单纯分析某一地区产品的消费者,并不能反映该地区的人群特性,现有技术中对于需要针对特定地区销售特定产品的情况,一般是人为地根据业务经验去分析销售对象,再制定营销策略,效率慢且易出错。



技术实现要素:

本发明的主要目的为提供一种基于数据分析的人群画像生成方法、装置、计算机设备和存储介质,旨在解决现有针对指定地区人群画像不够精准的技术问题。

基于上述发明目的,本发明提出一种基于数据分析的人群画像生成方法,包括:

获取指定地区内获得目标物的第一人群的资料,所述资料包括所述第一人群中每个人的多项不同属性的信息;

依据所述资料分析出所述第一人群在每个属性中的第一人群分布信息;

将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果,所述标准信息为所述指定地区的第二人群在每个属性中的第二人群分布信息;

依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内潜在获得目标物的人群画像。

进一步地,所述获取指定地区内获得目标物的第一人群的资料的步骤,包括:

获取所述第一人群对应的查询信息,所述查询信息包括用于确定所述第一人群为在所述指定地区内获得所述目标物的人群的信息;

依据所述查询信息在预设的资料库中获取所述资料。

进一步地,所述将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果的步骤,包括:

依据所述第一人群分布信息得到每个所述属性的目标属性值,所述目标属性值为分布在所述属性中指定范围内的人群数量占所述属性中总人数的比值;

计算每个所述目标属性值与对应标准信息的属性值的比值;

依次识别出所述比值与预设阀值的差值所处在的数值范围以得到所述对比结果,所述数值范围包括非特征范围以及特征范围,所述非特征范围为用户预设的用于表明所述第一人群没有对应所述属性的特征的数值范围,所述特征范围为用户预设的用于表明所述第一人群具有对应所述属性的特征的数值范围。

进一步地,所述依据所述对比结果获取所述第一人群的人群特征的步骤,包括:

从所述对比结果中获取处于特征范围的比值,并记为目标比值;

依据所述目标比值获取对应所述目标比值的属性,并依据所述属性获取对应的目标属性值;

以所述目标属性值中占比大的群体的属性类型作为所述人群特征,所述属性类型为同一属性中指定范围的人群的类型。

进一步地,所述将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果的步骤,包括:

获取确定年龄范围的选择信息;

依据所述选择信息从所述指定地区的所有人群中抽取对应所述年龄范围的人群作为所述第二人群,并将所述第二人群在各个属性的人群分布信息记为所述标准信息;

将每个所述属性的第一人群分布信息按预设规则一一与对应的所述标准信息进行对比,以得到对比结果。

进一步地,所述依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内潜在获得所述目标物的人群画像的步骤之后,包括:

获取所述第一人群的各个属性的目标属性值;

将所述目标属性值按从小到大依次排序以得到属性列表,并将所述属性列表加入所述对比结果;

将加入所述属性列的对比结果以及所述人群画像展示在所述查询平台中,所述查询平台为预设的用于查询所述人群画像的平台。

进一步地,所述依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内潜在获得所述目标物的人群画像的步骤,包括:

从所述对比结果中获取大于所述预设阀值的全部比值,并将所述比值记为第一比值;

依据每个所述第一比值获得对应的属性,并记为第一属性;

依次判断所述第一属性是否属于预设的重要属性,若所述第一属性属于所述重要属性,则将所述第一属性记为第二属性;

计算所述第二属性与第一属性的个数的属性比值,并判断所述属性比值是否大于指定值,所述指定值为用户预设的数值;

若所述属性比值大于指定值,则将对应所述第一属性的属性特征记为所述人群特征,并依据所述人群特征生成所述人群画像;否则将对应所述第一人群每个属性的属性特征记为所述人群特征,并依据所述人群特征生成所述人群画像。

本发明还提供一种基于数据分析的人群画像生成装置,包括:

获取资料单元,用于获取指定地区内获得目标物的第一人群的资料,所述资料包括所述第一人群中每个人的多项不同属性的信息;

分析属性单元,用于依据所述资料分析出所述第一人群在每个属性中的第一人群分布信息;

对比信息单元,用于将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果,所述标准信息为所述指定地区的第二人群在每个属性中的第二人群分布信息;

形成画像单元,用于依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内潜在获得所述目标物的人群画像。

本发明还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

本发明的有益效果为:通过获取指定地区获得目标物的人群资料,然后根据这些资料分析出每个属性的人群分布情况,再按预设规则与预设标准信息进行对比得到对比结果,以获取到人群特征得到人群画像,直接通过大数据分析,挖掘指定人群的特殊属性,人群画像更精准,为企业基于指定地区和目标物的精准营销提供数据依据,将人群画像产出流程化,更快速、便捷、高效。

附图说明

图1为本发明一实施例中基于数据分析的人群画像生成方法的步骤示意图;

图2为本发明一实施例中基于数据分析的人群画像生成装置的结构示意框图;

图3为本发明一实施例的计算机设备的结构示意框图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

参照图1,本实施例中的基于数据分析的人群画像生成方法,包括:

步骤s1:获取指定地区内获得目标物的第一人群的资料,所述资料包括所述第一人群中每个人的多项不同属性的信息;

步骤s2:依据所述资料分析出所述第一人群在每个属性中的第一人群分布信息;

步骤s3:将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果,所述标准信息为所述指定地区中第二人群各属性的第二人群分布信息;

步骤s4:依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内潜在获得所述目标物的人群画像。

如上述步骤s1所述,上述指定地区并不限制,可为任何一有意销售上述目标物的地区,此处的目标物可以为任何有意销售的指定产品,如金融行业的贷款、基金等,即本发明提供的人群画像生成方法,可应用于不同的地区以及不同产品。为了更好的制定营销策略,需要知道哪些是更有意向购买上述指定产品的人群,故而需要知道该人群的特征,而购买过该指定产品的人群中极大可能包含有这些特征,故而需要获取购买过上述指定产品的第一人群的资料,如a地区中所有购买过b基金的人群的资料。上述资料中包括用于对比的对比信息,对比信息可以为基本信息、资产信息、收入信息、消费信息、资金信息、兴趣信息以及地理信息中的任一种,且每种对比信息中分别包含有多项不同的属性,例如基本信息中包括有年龄、性别、婚姻、学历等属性;资产信息包括有没有房子、车子、银行存款金额、投资金额等属性;收入信息包括有从事行业、月薪、工作年限、公积金状况等属性;消费信息包括年消费、消费种类(衣食住行)等属性;资金信息包括有没贷款、贷款金额、房子贷款、车子贷款等属性;兴趣信息包括日常关注、爱好等属性;地理信息包括日常通勤距离、节假日出门等属性。由于购买过上述指定产品的购买者均有记录,并保留有对应的资料,这些资料存储于预设的资料库中,即上述对比信息均存于资料库中,使用时从资料库中获取即可,本实施例中,为了便于表述,将在指定地区内购买指定产品的人群记为第一人群,从资料库中获取第一人群的多项不属性的信息。

在一个实施例中,上述步骤s1包括:

步骤s11:获取所述第一人群对应的查询信息,所述查询信息包括用于确定所述第一人群为在所述指定地区内获得所述目标物的人群的信息;

步骤s12:依据所述查询信息在预设的资料库中获取所述资料。

如上述步骤s11-s12所述,本实施例提供了一个人群画像查询平台,可通过用户输入的输入信息,即可得到对应输入信息的人群画像。具体而言,上述查询信息包括用于确定第一人群为在指定地区内购买指定产品的人群的信息,可以为购买者的手机号码或身份证号码,也可以为预设对应每个购买上述指定产品的购买者的标签,该标签与在资料库中购买者的资料绑定。当用户输入人群中每个人的手机号码以及身份证号码或者标签,该人群画像查询平台即可获取到该查询信息,然后依据查询信息去查找,获取查找到的资料。另一方面也可从业务员处获取上述查询信息,例如每个业务员有多个客户的手机号码,工作人员将每个业务员对应的客户的手机号码进行汇集,上传到系统。

如上述步骤s2所述,将获取到的资料进行分析,得到第一人群每种信息中各个属性的人群分布信息,具体而言,可通过将人群中每个人按每个具体的属性进行归类从而得到该属性的人群分布信息,例如基本信息中的性别属性,则将人群进行男女归类,从而得到该人群中男女的分布(如男占70%,女占30%);将人群进行婚姻属性进行归类,得到婚姻分布(如已婚40%,未婚60%)等。

如上述步骤s3所述,将人群分布信息与对应的标准信息按预设规则对比,此处的标准信息为上述指定地区的人群在每个属性中的人群分布信息,对应的,为了便于表述,上述指定地区的人群记为第二人群,对应的人群分布信息记为第二人群分布信息。且此处的属性均可与上述在该指定地区中购买过指定产品的第一人群的属性一一对应,上述第二人群分布信息可为该指定地区普遍的人群信息,通过各种业务场景获取,并事先已存于预设的资料库中,需要时调取即可。上述预设规则可以为将直接上述第一人群分布信息一一与对应的标准信息对比,得到两者差异,或者通过两个人群的不同比值来判断结果,如,在一个实施例中,上述步骤s3,包括:

步骤s31:依据所述第一人群分布信息得到每个所述属性的目标属性值,所述目标属性值为分布在所述属性中指定范围内的人群数量占所述属性中总人数的比值;

步骤s32:计算每个所述目标属性值与对应标准信息的属性值的比值;

步骤s33:依次识别出所述比值与预设阀值的差值所处在的数值范围以得到所述对比结果,所述数值范围包括非特征范围以及特征范围,所述非特征范围为用户预设的用于表明所述第一人群没有对应所述属性的特征的数值范围,所述特征范围为用户预设的用于表明所述第一人群具有对应所述属性的特征的数值范围。

本实施例中,上述目标属性值为分布在属性中指定范围内的人群数量占该属性中总人数的比值,例如性别属性,上述指定范围可以为男性或者女性两个范围;又如年龄属性,上述指定范围可以为1-18岁、19-40岁、40-60岁等范围中的任一个范围。依据上述人群分布信息得到每个属性的目标属性值,如上述性别属性,男性占70%,女性占30%,该例子中选取男性范围作为上述指定范围,则对应的目标属性值为70%,若性别属性对应的标准的属性值是40%,如上述步骤s32所述,则计算两者的比值为1.75,由于需要得到两者的差异,故用于对比的预设阀值设为1,两者差异越大,则比值和预设阀值的差值越大,两者差异越小,则比值与预设阀值的差值越小,上述数值范围为用户根据实际情况设定的范围,包括特征范围以及非特征范围例如用户可设定大于0.5为特征范围,小于或等于0.5为非特征范围。其中特征范围用于表明第一人群具有对应的属性的特征,反之,非特征范围用于表明第一人群不具有对应的属性特征,如当差值在0.5以下为非特征范围,因为这时两者差异小,说明该属性对应的特征并不是影响上述指定地区的人购买的因素,而差值在0.5以上,则这时两者差异大,说明该属性对应的特征会影响到指定地区人群的购买上述指定产品,如上述例子中性别的目标属性值为70%,而对应的标准同样为70%(购买人群男占70%,女占30%,标准同样是男占70%,女占30%),说明在该指定地区中,性别属性没有影响到人群购买指定产品。然后通过判断该差值落于哪个的数值范围,从而得到落在特征范围的人群特征,此处判断的结果即为上述对比结果。

进一步地,为了更方便用户观看、使用,在上述步骤s32之后,将上述比值乘以100,得到一个属性指数,将该属性指数定义为“tgi指数”,然后将该tgi指数与设定值进行对比,若超过设定值即说明该属性对应的特征会影响到指定地区人群的购买上述指定产品,该设定值可根据实际情况设置,对于不同的产品不同的地区,其设定值可不一样,如设定值可为120、150、160等。如上述例子中的比值为1.75,则对应的tgi指数为175,与设定值120作对比,tgi指数远超过设定值,说明该属性对应的特征会影响到指定地区人群的购买上述指定产品。

如上述步骤s4所述,获得对比结果之后,从该对比结果中获取上述第一人群的人群特征,多个人群特征形成上述第一人群的人群画像,即为在指定地区内购买所述指定产品的人群画像,可供在所述指定地区内营销指定产品时进行参考。此处的人群画像即为综合多个人群特征得到的一群人,当在指定地区进行销售上述指定产品时,销售对象可参考人群画像,因为具有上述人群特征的人更能接受上述指定产品,这样有针对性地销售,可大大提高销售额。在一个实施例中,上述步骤s4,包括:

步骤s41:从所述对比结果中获取处于特征范围的比值,并记为目标比值;

步骤s42:依据所述目标比值获取对应所述目标比值的属性,并依据所述属性获取对应的目标属性值;

步骤s43:以所述目标属性值中占比大的群体的属性类型作为所述人群特征,所述属性类型为同一属性中指定范围的人群的类型。

本实施例中,当将第一人群中的每个属性都按预设规则进行对比之后,得到每个属性对应的对比结果,对比结果有两种,一为比值处于特征范围,一为比值不处于特征范围,那么可从中找出处于特征范围的比值,为了方便描述,将该比值记为目标比值。然后依据目标比值分析出对应属性的人群特征,如上述性别属性中,目标比值为1.75,对应的事件是性别是会影响指定地区购买指定产品的因素,且男性客户比女性客户多。具体分析过程可为依据目标比值找到对应该目标比值的属性,然后根据属性获得对应该属性的目标属性值,即得到该属性的人群分布信息,以人群分布信息中比例大的群体的属性类型作为人群特征,此处的属性类型为为同一属性中指定范围的人群的类型,例如性别属性中的男女类型,年龄属性中的少年青年老年等类型,学历属性中的初中高中本科等类型,如购买人群中男占70%,女占30%,年龄属性中少年占20%,青年占30%,老年占50%,则学历中初中占10%,高中60%,本科占30%,以其中比例大的群体的属性类型作为人群特征,则从上述每个属性的人群分布信息得到人群特征可为学历高中、老年、男性。

在另一个实施例中,上述步骤s3,包括:

步骤s34:获取确定年龄范围的选择信息;

步骤s35:依据所述选择信息从所述指定地区的所有人群中抽取对应所述年龄范围的人群作为所述第二人群,并将所述第二人群在各个属性的人群分布信息记为所述标准信息;

步骤s36:将每个所述属性的第一人群分布信息按预设规则一一与对应的所述标准信息进行对比,以得到对比结果。

本实施例中,由于产品对于不同年龄层的人群来说,购买力、接受程度等等均可能不一样,为了更有针对性地进行对比,可以在指定地区中选择一个年龄范围的人群来进行对比,首先获取选择年龄范围的选择信息,该选择信息可通过用户输入,也可以通过其他指令触发,此处并不限定发出选择信息的方式。上述年龄范围可以为各个年龄层,如18岁以上、18岁到60岁之间等等。确定年龄范围之后,从上述指定地区所有人群中抽取对应该年龄范围的人群,将该人群作为上述第二人群,这时第二人群在每个属性的人群分布信息即为上述标准信息,即可用该标准信息去和上述需要分析人群画像的第一人群分布信息进行对比,以得到对比结果,而且这样还可以减小系统工作量,提高效率。

在一个实施例中,在上述查询平台输入查询信息进行查询之后,查询平台的展示窗口将得到的人群画像以及对比结果进行展示,以供用户在销售指定产品时作出有针对的营销策略,这样将人群画像和对比结果可视化,进一步方便用户观看、使用。

进一步地,上述步骤s5包括:

步骤s51:获取所述第一人群的各个属性的目标属性值;

步骤s52:将所述目标属性值按从小到大依次排序以得到属性列表,并将所述属性列表加入所述对比结果;

步骤s53:将加入所述属性列的对比结果以及所述人群画像展示在所述查询平台中,所述查询平台为预设的用于查询所述人群画像的平台。

本实施例中,在进行人群画像展示的时候,可以将第一人群的各个属性值进行展示,这时可先获取属性的目标属性值,然后排序得到属性列表,再将该列表加入的对比结果中。如可获取各个属性对应的tgi指数,可依据tgi指数的数值大小按顺序排序,例如按从大至小的顺序进行排序,然后将全部属性的tgi指数均展示在上述查询平台的展示窗口,方便用户观看、选取各特征。

另外,还可以将不超过设定值的tgi指数隐藏,只展示超过设定值的tgi指数,例如设定值为120,当tgi指数超过120,则在展示窗口进行展示,若不超过120,则不展示在上述窗口,当然,这时还可以对可超过120的tgi指数按从大至小的顺序进行排序再进行展示。

在一个实施例中,所述步骤s4,包括:

步骤s401:从所述对比结果中获取大于所述预设阀值的全部比值,并将所述比值记为第一比值;

步骤s402:依据每个所述第一比值获得对应的属性,并记为第一属性;

步骤s403:依次判断所述第一属性是否属于预设的重要属性,若所述第一属性属于所述重要属性,则将所述第一属性记为第二属性;

步骤s404:计算所述第二属性与第一属性的个数的属性比值,并判断所述属性比值是否大于指定值,所述指定值为用户预设的数值;

步骤s405:若所述属性比值大于指定值,则将对应所述第一属性的属性特征记为所述人群特征,并依据所述人群特征生成所述人群画像;否则将对应所述第一人群每个属性的属性特征记为所述人群特征,并依据所述人群特征生成所述人群画像。

为了得到更精准的人群画像,可进一步按规则获得形成人群画像的人群特征,本实施例中,通过执行上述步骤s401-s405来完成,首先从对比结果中得到对应每个属性的比值,然后从中获取大于对应预设阀值的所有比值,将这些比值记为第一比值,需知,每一个比值对应的预设阀值不一定相同,如对于性别属性,其预设阀值可设为0.2,而对于婚姻属性,其预设阀值可设为0.5等。根据第一比值得到每个对应的这些第一比值的属性,为了便于表述,将其记为第一属性,然后逐个判断所有的第一属性是否为重要属性,上述重要属性为用户根据实际情况预设的,由于在所有属性中可能存在在实际中影响人群购买产品较小的属性,也存在影响人群购买产品较大的属性,此时用户可通过收集到信息,根据实际情况将影响较大的属性设为重要属性。当系统将第一属性判定为重要属性,这时会将该第一属性记为第二属性,逐个对比判断,遍历所有的第一属性,从而得到多个第二属性。

如上述步骤s404-步骤s405所述,需知,由于重要属性是根据实际情况设定,若重要属性超过一定数量,说明系统判断与实际情况相符合,这时可将通过第一属性的属性特征得到上述人群特征,否则说明系统判断的与实际情况不相符,上述属性特征为可为该属性中比例大的群体的属性类型,这时可按照已知的第一人群的属性的属性特征得到上述人群特征。具体而言可通过计算第二属性与第一属性的个数的属性比值来得到重要属性的比例,当属性比值大于指定值,说明第一属性中重要属性的比例已达到系统判断与实际情况相符合的要求,上述指定值由用户设定,用于判断第一属性中重要属性的比例是否满足上述要求,这时可获取第一属性的目标属性值,按上述步骤s43的方法得到人群特征;当属性比值小于指定值,说明第一属性中重要属性的比例没有达到系统判断与实际情况相符合的要求,故而直接通过第一人群的每个属性的目标属性值来获得人群特征。

参照图2,本实施例中基于数据分析的人群画像生成装置,包括:

获取资料单元100,用于获取指定地区内购买获得目标物的第一人群的资料,所述资料包括所述第一人群中每个人的多项不同属性的信息;

分析属性单元200,用于依据所述资料分析出所述第一人群在每个属性中的第一人群分布信息;

对比信息单元300,用于将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果,所述标准信息为所述指定地区的第二人群在每个属性中的第二人群分布信息;

形成画像单元400,用于依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内潜在获得所述目标物的人群画像。

如上述获取资料单元100所述,上述指定地区并不限制,可为任何一有意销售上述目标物的地区,此处的目标物可以为任何有意销售的指定产品,如金融行业的贷款、基金等,即本发明提供的人群画像生成方法,可应用于不同的地区以及不同产品。为了更好的制定营销策略,需要知道哪些是更有意向购买上述指定产品的人群,故而需要知道该人群的特征,而购买过该指定产品的人群中极大可能包含有这些特征,故而需要获取购买过上述指定产品的第一人群的资料,如a地区中所有购买过b基金的人群的资料。上述资料中包括用于对比的对比信息,对比信息可以为基本信息、资产信息、收入信息、消费信息、资金信息、兴趣信息以及地理信息中的任一种,且每种对比信息中分别包含有多项不同的属性,例如基本信息中包括有年龄、性别、婚姻、学历等属性;资产信息包括有没有房子、车子、银行存款金额、投资金额等属性;收入信息包括有从事行业、月薪、工作年限、公积金状况等属性;消费信息包括年消费、消费种类(衣食住行)等属性;资金信息包括有没贷款、贷款金额、房子贷款、车子贷款等属性;兴趣信息包括日常关注、爱好等属性;地理信息包括日常通勤距离、节假日出门等属性。由于购买过上述指定产品的购买者均有记录,并保留有对应的资料,这些资料存储于预设的资料库中,即上述对比信息均存于资料库中,使用时从资料库中获取即可,本实施例中,为了便于表述,将在指定地区内购买指定产品的人群记为第一人群,从资料库中获取第一人群的多项不属性的信息。

在一个实施例中,上述获取资料单元100包括:

获取信息子单元,用于获取所述第一人群对应的查询信息,所述查询信息包括用于确定所述第一人群为在所述指定地区内获得所述目标物的人群的信息;

查询资料子单元,用于依据所述查询信息在预设的资料库中获取所述资料。

本实施例提供了一个人群画像查询平台,可通过用户输入的输入信息,即可得到对应输入信息的人群画像。具体而言,上述查询信息包括用于确定第一人群为在指定地区内购买指定产品的人群的信息,可以为购买者的手机号码或身份证号码,也可以为预设对应每个购买上述指定产品的购买者的标签,该标签与在资料库中购买者的资料绑定。当用户输入人群中每个人的手机号码以及身份证号码或者标签,该人群画像查询平台即可获取到该查询信息,然后依据查询信息去查找,获取查找到的资料。另一方面也可从业务员处获取上述查询信息,例如每个业务员有多个客户的手机号码,工作人员将每个业务员对应的客户的手机号码进行汇集,上传到系统。

如上述分析属性单元200所述,将获取到的资料进行分析,得到第一人群每种信息中各个属性的人群分布信息,具体而言,可通过将人群中每个人按每个具体的属性进行归类从而得到该属性的人群分布信息,例如基本信息中的性别属性,则将人群进行男女归类,从而得到该人群中男女的分布(如男占70%,女占30%);将人群进行婚姻属性进行归类,得到婚姻分布(如已婚40%,未婚60%)等。

如上述对比信息单元300所述,将人群分布信息与对应的标准信息按预设规则对比,此处的标准信息为上述指定地区的人群在每个属性中的人群分布信息,对应的,为了便于表述,上述指定地区的人群记为第二人群,对应的人群分布信息记为第二人群分布信息。且此处的属性均可与上述在该指定地区中购买过指定产品的第一人群的属性一一对应,上述第二人群分布信息可为该指定地区普遍的人群信息,通过各种业务场景获取,并事先已存于预设的资料库中,需要时调取即可。上述预设规则可以为将直接上述第一人群分布信息一一与对应的标准信息对比,得到两者差异,或者通过两个人群的不同比值来判断结果,如,在一个实施例中,上述对比信息单元300,包括:

获取属性子单元,用于依据所述第一人群分布信息得到每个所述属性的目标属性值,所述目标属性值为分布在所述属性中指定范围内的人群数量占所述属性中总人数的比值;

计算比值子单元,用于计算每个所述目标属性值与对应标准信息的属性值的比值;

判断结果子单元,用于依次识别出所述比值与预设阀值的差值所处在的数值范围以得到所述对比结果,所述数值范围包括非特征范围以及特征范围,所述非特征范围为用户预设的用于表明所述第一人群没有对应所述属性的特征的数值范围,所述特征范围为用户预设的用于表明所述第一人群具有对应所述属性的特征的数值范围。

本实施例中,上述目标属性值为分布在属性中指定范围内的人群数量占该属性中总人数的比值,例如性别属性,上述指定范围可以为男性或者女性两个范围;又如年龄属性,上述指定范围可以为1-18岁、19-40岁、40-60岁等范围中的任一个范围。依据上述人群分布信息得到每个属性的目标属性值,如上述性别属性,男性占70%,女性占30%,该例子中选取男性范围作为上述指定范围,则对应的目标属性值为70%,若性别属性对应的标准的属性值是40%,如上述计算比值子单元所述,则计算两者的比值为1.75,由于需要得到两者的差异,故用于对比的预设阀值设为1,两者差异越大,则比值和预设阀值的差值越大,两者差异越小,则比值与预设阀值的差值越小,上述数值范围为用户根据实际情况设定的范围,包括特征范围以及非特征范围例如用户可设定大于0.5为特征范围,小于或等于0.5为非特征范围。其中特征范围用于表明第一人群具有对应的属性的特征,反之,非特征范围用于表明第一人群不具有对应的属性特征,如当差值在0.5以下为非特征范围,因为这时两者差异小,说明该属性对应的特征并不是影响上述指定地区的人购买的因素,而差值在0.5以上,则这时两者差异大,说明该属性对应的特征会影响到指定地区人群的购买上述指定产品,如上述例子中性别的目标属性值为70%,而对应的标准同样为70%(购买人群男占70%,女占30%,标准同样是男占70%,女占30%),说明在该指定地区中,性别属性没有影响到人群购买指定产品。然后通过判断该差值落于哪个的数值范围,从而得到落在特征范围的人群特征,此处判断的结果即为上述对比结果。

进一步地,为了更方便用户观看、使用,将上述比值乘以100,得到一个属性指数,将该属性指数定义为“tgi指数”,然后将该tgi指数与设定值进行对比,若超过设定值即说明该属性对应的特征会影响到指定地区人群的购买上述指定产品,该设定值可根据实际情况设置,对于不同的产品不同的地区,其设定值可不一样,如设定值可为120、150、160等。如上述例子中的比值为1.75,则对应的tgi指数为175,与设定值120作对比,tgi指数远超过设定值,说明该属性对应的特征会影响到指定地区人群的购买上述指定产品。

如上述形成画像单元400所述,获得对比结果之后,从该对比结果中获取上述第一人群的人群特征,多个人群特征形成上述第一人群的人群画像,即为在指定地区内购买所述指定产品的人群画像,可供在所述指定地区内营销指定产品时进行参考。此处的人群画像即为综合多个人群特征得到的一群人,当在指定地区进行销售上述指定产品时,销售对象可参考人群画像,因为具有上述人群特征的人更能接受上述指定产品,这样有针对性地销售,可大大提高销售额。在一个实施例中,上述形成画像单元400,包括:

获取比值子单元,用于从所述对比结果中获取处于特征范围的比值,并记为目标比值;

分析特征子单元,用于依据所述目标比值获取对应所述目标比值的属性,并依据所述属性获取对应的目标属性值;

作为特征子单元,用于以所述目标属性值中占比大的群体的属性类型作为所述人群特征,所述属性类型为同一属性中指定范围的人群的类型。

本实施例中,当将第一人群中的每个属性都按预设规则进行对比之后,得到每个属性对应的对比结果,对比结果有两种,一为比值处于特征范围,一为比值不处于特征范围,那么可从中找出处于特征范围的比值,为了方便描述,将该比值记为目标比值。然后依据目标比值分析出对应属性的人群特征,如上述性别属性中,目标比值为1.75,对应的事件是性别是会影响指定地区购买指定产品的因素,且男性客户比女性客户多。具体分析过程可为依据目标比值找到对应该目标比值的属性,然后根据属性获得对应该属性的目标属性值,即得到该属性的人群分布信息,以人群分布信息中比例大的群体的属性类型作为人群特征,此处的属性类型为为同一属性中指定范围的人群的类型,例如性别属性中的男女类型,年龄属性中的少年青年老年等类型,学历属性中的初中高中本科等类型,如购买人群中男占70%,女占30%,年龄属性中少年占20%,青年占30%,老年占50%,则学历中初中占10%,高中60%,本科占30%,以其中比例大的群体的属性类型作为人群特征,则从上述每个属性的人群分布信息得到人群特征可为学历高中、老年、男性。

在另一个实施例中,上述对比信息单元300,包括:

获取选择子单元,用于获取确定年龄范围的选择信息;

抽取年龄子单元,用于依据所述选择信息从所述指定地区的所有人群中抽取对应所述年龄范围的人群作为所述第二人群,并将所述第二人群在各个属性的人群分布信息记为所述标准信息;

得到结果子单元,用于将每个所述属性的第一人群分布信息按预设规则一一与对应的所述标准信息进行对比,以得到对比结果。

本实施例中,由于产品对于不同年龄层的人群来说,购买力、接受程度等等均可能不一样,为了更有针对性地进行对比,可以在指定地区中选择一个年龄范围的人群来进行对比,首先获取选择年龄范围的选择信息,该选择信息可通过用户输入,也可以通过其他指令触发,此处并不限定发出选择信息的方式。上述年龄范围可以为各个年龄层,如18岁以上、18岁到60岁之间等等。确定年龄范围之后,从上述指定地区人群中抽取对应该年龄范围的人群,将该人群作为上述第二人群,这时第二人群在每个属性的人群分布信息即为上述标准信息,即可用该标准信息去和上述需要分析人群画像的第一人群分布信息进行对比,以得到对比结果,而且这样还可以减小系统工作量,提高效率。

在一个实施例中,在上述查询平台输入查询信息进行查询之后,查询平台的展示窗口将得到的人群画像以及对比结果进行展示,以供用户在销售指定产品时作出有针对的营销策略,这样将人群画像和对比结果可视化,进一步方便用户观看、使用。

进一步地,上述显示画像单元包括:

获取目标子单元,用于获取所述第一人群的各个属性的目标属性值;

排序列表子单元,用于将所述目标属性值按从小到大依次排序以得到属性列表,并将所述属性列表加入所述对比结果;

加入列表子单元,用于将加入所述属性列的对比结果以及所述人群画像展示在所述查询平台中,所述查询平台为预设的用于查询所述人群画像的平台。

本实施例中,在进行人群画像展示的时候,可以将第一人群的各个属性值进行展示,这时可先获取属性的目标属性值,然后排序得到属性列表,再将该列表加入的对比结果中。如可获取各个属性对应的tgi指数,可依据tgi指数的数值大小按顺序排序,例如按从大至小的顺序进行排序,然后将全部属性的tgi指数均展示在上述查询平台的展示窗口,方便用户观看、选取各特征。

另外,还可以将不超过设定值的tgi指数隐藏,只展示超过设定值的tgi指数,例如设定值为120,当tgi指数超过120,则在展示窗口进行展示,若不超过120,则不展示在上述窗口,当然,这时还可以对可超过120的tgi指数按从大至小的顺序进行排序再进行展示。

在一个实施例中,所述形成画像单元400,包括:

对比比值子单元,用于从所述对比结果中获取大于所述预设阀值的全部比值,并将所述比值记为第一比值;

获得属性子单元,用于依据每个所述第一比值获得对应的属性,并记为第一属性;

判断属性子单元,用于依次判断所述第一属性是否属于预设的重要属性,若所述第一属性属于所述重要属性,则将所述第一属性记为第二属性;

计算属性子单元,用于计算所述第二属性与第一属性的个数的属性比值,并判断所述属性比值是否大于指定值,所述指定值为用户预设的数值;

得到特征子单元,用于若所述属性比值大于指定值,则将对应所述第一属性的属性特征记为所述人群特征,并依据所述人群特征生成所述人群画像;否则将对应所述第一人群每个属性的属性特征记为所述人群特征,并依据所述人群特征生成所述人群画像。

为了得到更精准的人群画像,可进一步按规则获得形成人群画像的人群特征,本实施例中,首先从对比结果中得到对应每个属性的比值,然后从中获取大于对应预设阀值的所有比值,将这些比值记为第一比值,需知,每一个比值对应的预设阀值不一定相同,如对于性别属性,其预设阀值可设为0.2,而对于婚姻属性,其预设阀值可设为0.5等。根据第一比值得到每个对应的这些第一比值的属性,为了便于表述,将其记为第一属性,然后逐个判断所有的第一属性是否为重要属性,上述重要属性为用户根据实际情况预设的,由于在所有属性中可能存在在实际中影响人群购买产品较小的属性,也存在影响人群购买产品较大的属性,此时用户可通过收集到信息,根据实际情况将影响较大的属性设为重要属性。当系统将第一属性判定为重要属性,这时会将该第一属性记为第二属性,逐个对比判断,遍历所有的第一属性,从而得到多个第二属性。

如上述计算属性子单元、得到特征子单元所述,需知,由于重要属性是根据实际情况设定,若重要属性超过一定数量,说明系统判断与实际情况相符合,上述属性特征为可为该属性中比例大的群体的属性类型,这时可将通过第一属性的属性特征得到上述人群特征,否则说明系统判断的与实际情况不相符,这时可按照已知的第一人群的属性的属性特征得到上述人群特征。具体而言可通过计算第二属性与第一属性的个数的属性比值来得到重要属性的比例,当属性比值大于指定值,说明第一属性中重要属性的比例已达到系统判断与实际情况相符合的要求,上述指定值由用户设定,用于判断第一属性中重要属性的比例是否满足上述要求,这时可获取第一属性的目标属性值,按上述作为特征子单元得到人群特征;当属性比值小于指定值,说明第一属性中重要属性的比例没有达到系统判断与实际情况相符合的要求,故而直接通过第一人群的每个属性的目标属性值来获得人群特征。

参照图3,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和资料库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和资料库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的资料库用于存储生成人群画像所需的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于数据分析的人群画像生成方法。

上述处理器执行上述基于数据分析的人群画像生成方法的步骤:获取指定地区内获得目标物的第一人群的资料,所述资料包括所述第一人群中每个人的多项不同属性的信息;依据所述资料分析出所述第一人群在每个属性中的第一人群分布信息;将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果,所述标准信息为所述指定地区的第二人群在每个属性中的第二人群分布信息;依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内潜在获得所述目标物的人群画像。

上述计算机设备,上述获取指定地区内获得目标物的第一人群的资料的步骤,包括:获取所述第一人群对应的查询信息,所述查询信息包括用于确定所述第一人群为在所述指定地区内获得所述目标物的人群的信息;依据所述查询信息在预设的资料库中获取所述资料。

在一个实施例中,上述将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果的步骤,包括:依据所述第一人群分布信息得到每个所述属性的目标属性值,所述目标属性值为分布在所述属性中指定范围内的人群数量占所述属性中总人数的比值;计算每个所述目标属性值与对应标准信息的属性值的比值;依次识别出所述比值与预设阀值的差值所处在的数值范围以得到所述对比结果,所述数值范围包括非特征范围以及特征范围,所述非特征范围为用户预设的用于表明所述第一人群没有对应所述属性的特征的数值范围,所述特征范围为用户预设的用于表明所述第一人群具有对应所述属性的特征的数值范围。

在一个实施例中,上述依据所述对比结果获取所述第一人群的人群特征的步骤,包括:从所述对比结果中获取处于特征范围的比值,并记为目标比值;依据所述目标比值获取对应所述目标比值的属性,并依据所述属性获取对应的目标属性值;以所述目标属性值中占比大的群体的属性类型作为所述人群特征,所述属性类型为同一属性中指定范围的人群的类型。

在一个实施例中,上述将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果的步骤,包括:获取确定年龄范围的选择信息;依据所述选择信息从所述指定地区的所有人群中抽取对应所述年龄范围的人群作为所述第二人群,并将所述第二人群在各个属性的人群分布信息记为所述标准信息;将每个所述属性的第一人群分布信息按预设规则一一与对应的所述标准信息进行对比,以得到对比结果。

在一个实施例中,上述依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内获得所述目标物的人群画像的步骤之后,包括:获取所述第一人群的各个属性的目标属性值;将所述目标属性值按从小到大依次排序以得到属性列表,并将所述属性列表加入所述对比结果;将加入所述属性列的对比结果以及所述人群画像展示在查询平台中,所述查询平台为预设的用于查询所述人群画像的平台。

在一个实施例中,所述依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内潜在获得所述目标物的人群画像的步骤,包括:从所述对比结果中获取大于所述预设阀值的全部比值,并将所述比值记为第一比值;依据每个所述第一比值获得对应的属性,并记为第一属性;依次判断所述第一属性是否属于预设的重要属性,若所述第一属性属于所述重要属性,则将所述第一属性记为第二属性;计算所述第二属性与第一属性的个数的属性比值,并判断所述属性比值是否大于指定值,所述指定值为用户预设的数值;若所述属性比值大于指定值,则将对应所述第一属性的属性特征记为所述人群特征,并依据所述人群特征生成所述人群画像;否则将对应所述第一人群每个属性的属性特征记为所述人群特征,并依据所述人群特征生成所述人群画像。

本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。

本发明一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于数据分析的人群画像生成方法,具体为:获取指定地区内获得目标物的第一人群的资料,所述资料包括所述第一人群中每个人的多项不同属性的信息;依据所述资料分析出所述第一人群在每个属性中的第一人群分布信息;将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果,所述标准信息为所述指定地区的第二人群在每个属性中的第二人群分布信息;依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内潜在获得所述目标物的人群画像。

上述计算机可读存储介质,上述获取指定地区内获得目标物的第一人群的资料的步骤,包括:获取所述第一人群对应的查询信息,所述查询信息包括用于确定所述第一人群为在所述指定地区内获得所述目标物的人群的信息;依据所述查询信息在预设的资料库中获取所述资料。

在一个实施例中,上述将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果的步骤,包括:依据所述第一人群分布信息得到每个所述属性的目标属性值,所述目标属性值为分布在所述属性中指定范围内的人群数量占所述属性中总人数的比值;计算每个所述目标属性值与对应标准信息的属性值的比值;依次识别出所述比值与预设阀值的差值所处在的范围以得到所述对比结果,所述数值范围包括非特征范围以及特征范围,所述非特征范围为用户预设的用于表明所述第一人群没有对应所述属性的特征的数值范围,所述特征范围为用户预设的用于表明所述第一人群具有对应所述属性的特征的数值范围。

在一个实施例中,上述依据所述对比结果获取所述第一人群的人群特征的步骤,包括:从所述对比结果中获取处于特征范围的比值,并记为目标比值;依据所述目标比值获取对应所述目标比值的属性,并依据所述属性获取对应的目标属性值;以所述目标属性值中占比大的群体的属性类型作为所述人群特征,所述属性类型为同一属性中指定范围的人群的类型。

在一个实施例中,上述将每个所述属性的第一人群分布信息按预设规则一一与对应的标准信息进行对比,以得到对比结果的步骤,包括:获取确定年龄范围的选择信息;依据所述选择信息从所述指定地区的所有人群中抽取对应所述年龄范围的人群作为所述第二人群,并将所述第二人群在各个属性的人群分布信息记为所述标准信息;将每个所述属性的第一人群分布信息按预设规则一一与对应的所述标准信息进行对比,以得到对比结果。

在一个实施例中,上述依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内获得所述目标物的人群画像的步骤之后,包括:获取所述第一人群的各个属性的目标属性值;将所述目标属性值按从小到大依次排序以得到属性列表,并将所述属性列表加入所述对比结果;将加入所述属性列的对比结果以及所述人群画像展示在查询平台中,所述查询平台为预设的用于查询所述人群画像的平台。

在一个实施例中,所述依据所述对比结果获取所述第一人群的人群特征,形成在指定地区内潜在获得所述目标物的人群画像的步骤,包括:从所述对比结果中获取大于所述预设阀值的全部比值,并将所述比值记为第一比值;依据每个所述第一比值获得对应的属性,并记为第一属性;依次判断所述第一属性是否属于预设的重要属性,若所述第一属性属于所述重要属性,则将所述第一属性记为第二属性;计算所述第二属性与第一属性的个数的属性比值,并判断所述属性比值是否大于指定值,所述指定值为用户预设的数值;若所述属性比值大于指定值,则将对应所述第一属性的属性特征记为所述人群特征,并依据所述人群特征生成所述人群画像;否则将对应所述第一人群每个属性的属性特征记为所述人群特征,并依据所述人群特征生成所述人群画像。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram一多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1