客户渗透分析的方法、装置及计算机可读存储介质与流程

文档序号:19680431发布日期:2020-01-14 17:16阅读:156来源:国知局
客户渗透分析的方法、装置及计算机可读存储介质与流程

本发明涉及大数据领域,尤其涉及一种客户渗透分析的方法、装置及计算机可读存储介质。



背景技术:

随着成员企业的客户日益增多,分析成员企业中客户之间的渗透关系对于企业业务的开展至关重要。目前对于成员企业中客户之间的渗透关系分析主要采用寻找与给定目标客户相近或相似客户的方式,这种方式主要存在以下两个缺点:第一,可解释性较差,无法建立不同成员企业间客户之间的对应关系;第二,可扩展性差,无法对不同成员企业之间业务的开展进行高效的推荐。



技术实现要素:

本发明提供一种客户渗透分析的方法、装置及计算机可读存储介质,其主要目的在于提供一种能够建立不同成员企业间关联关系的客户渗透分析方案。

为实现上述目的,本发明提供的一种客户渗透分析的方法,包括:

获取成员企业中的客户数据集,对所述客户数据集进行数据清洗,得到标准客户数据集;

对所述标准客户数据集按预设的周期进行数据更新处理,得到更新客户数据集;

将所述更新客户数据集中的客户数据与成员企业之间进行关联分析,生成所述成员企业之间的强关联规则;

根据所述强关联规则,统计客户在所述成员企业之间的渗透数据,根据所述渗透数据,计算在所述成员企业之间所述客户互相渗透的所占比例,从而完成成员企业之间的客户渗透分析。

可选地,所述数据清洗包括:

对所述客户数据集进行空缺值填充,得到填充客户数据集,对所述填充客户数据集进行数据修正,得到修正客户数据集,对所述修正客户数据集进行离散化处理,得到所述标准客户数据集。

可选地,所述离散化处理包括:

对所述修正客户数据集进行排序,选取排序后的所述修正客户数据集中任意一个修正客户数据作为离散点,识别出所述离散点是否满足离散化的衡量尺度;

若所述离散点满足所述离散化的衡量尺度,对所述修正客户数据集进行分裂,得到所述标准客户数据集;

若所述离散点不满足所述离散化的衡量尺度,遍历下一个修正客户数据作为离散点,直至遍历到所述修正客户数据满足所述离散化的衡量尺度时停止遍历。

可选地,所述数据更新处理包括:虚假数据的剔除、有效数据的增添以及旧数据的删除。

可选地,所述将所述更新客户数据集中的客户数据与成员企业之间进行关联分析,生成所述成员企业之间的强关联规则,包括:

计算所述更新客户数据集中的相同客户数据在不同成员企业之间出现的频率,得到所述成员企业之间的支持度;

根据所述出现的频率对所述成员企业之间进行排序,利用关联算法计算所述排序后的所述成员企业之间的置信度;

若所述支持度大于预设第一阈值且所述置信度大于预设第二阈值时,得到所述成员企业之间的强关联规则。

此外,为实现上述目的,本发明还提供一种客户渗透分析的装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的客户渗透分析程序,所述客户渗透分析程序被所述处理器执行时实现如下步骤:

获取成员企业中的客户数据集,对所述客户数据集进行数据清洗,得到标准客户数据集;

对所述标准客户数据集按预设的周期进行数据更新处理,得到更新客户数据集;

将所述更新客户数据集中的客户数据与成员企业之间进行关联分析,生成所述成员企业之间的强关联规则;

根据所述强关联规则,统计客户在所述成员企业之间的渗透数据,根据所述渗透数据,计算在所述成员企业之间所述客户互相渗透的所占比例,从而完成成员企业之间的客户渗透分析。

可选地,所述数据清洗包括:对所述客户数据集进行空缺值填充,得到填充客户数据集,对所述填充客户数据集进行数据修正,得到修正客户数据集,对所述修正客户数据集进行离散化处理,得到所述标准客户数据集。

可选地,所述离散化处理包括:

对所述修正客户数据集进行排序,选取排序后的所述修正客户数据集中任意一个修正客户数据作为离散点,识别出所述离散点是否满足离散化的衡量尺度;

若所述离散点满足所述离散化的衡量尺度,对所述修正客户数据集进行分裂,得到所述标准客户数据集;

若所述离散点不满足所述离散化的衡量尺度,遍历下一个修正客户数据作为离散点,直至遍历到所述修正客户数据满足所述离散化的衡量尺度时停止遍历。

可选地,所述将所述更新客户数据集中的客户数据与成员企业之间进行关联分析,生成所述成员企业之间的强关联规则,包括:

计算所述更新客户数据集中的相同客户数据在不同成员企业之间出现的频率,得到所述成员企业之间的支持度;

根据所述出现的频率对所述成员企业之间进行排序,利用关联算法计算所述排序后的所述成员企业之间的置信度;

若所述支持度大于预设第一阈值且所述置信度大于预设第二阈值时,得到所述成员企业之间的强关联规则。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有客户渗透分析程序,所述客户渗透分析程序可被一个或者多个处理器执行,以实现如上所述的客户渗透分析的方法的步骤。

本发明提出的客户渗透分析的方法、装置及计算机可读存储介质获取各个成员企业中的客户数据集,并对客户数据与成员企业之间进行关联分析,并根据所述关联分析,统计出客户在所述成员企业之间的渗透数据,因此建立了不同成员企业的客户之间的对应关系,进一步计算在所述成员企业之间所述客户互相渗透的所占比例,从而有利于各个成员企业进行企业业务的开展。

附图说明

图1为本发明一实施例提供的客户渗透分析的方法的流程示意图;

图2为本发明一实施例提供的客户渗透分析的装置的内部结构示意图;

图3为本发明一实施例提供的客户渗透分析的装置中客户渗透分析程序的模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提供一种客户渗透分析的方法。参照图1所示,为本发明一实施例提供的客户渗透分析的方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。

在本实施例中,客户渗透分析的方法包括:

s1、获取成员企业中的客户数据集,对所述客户数据集进行数据清洗,得到标准客户数据集。

本发明较佳实施例中,所述成员企业可以包括总公司下面的各个子公司。例如总公司为中国水利水电建设公司,则其成员企业可以为水利一电、水利二电以及水利三电等。所述客户数据集是从与所述成员企业产生过联系的客户中获取得到的信息数据组合形成。较佳地,所述客户数据集可以包括:客户基本身份信息、交易信息数据以及客户行为数据等。

较佳地,本发明所述数据清洗包括:对所述客户数据集进行空缺值填充,得到填充客户数据集,对所述填充客户数据集进行数据修正,得到修正客户数据集,对所述修正客户数据集进行离散化处理,得到所述标准客户数据集等。

详细地,所述空缺值填充包括对所述客户数据集中字段空缺值进行填充,得到所述填充客户数据集。

较佳地,本发明将所述字段空缺值分为数值属性和非数值属性,并根据所述数值属性和非数值属性,采用不同的方法分别对所述字段空缺值进行填充处理。详细地,若所述字段空缺值为数值属性的,则采用其他所有对象的字段取值的平均值来填充该字段空缺值;若所述字段空缺值是非数值属性,则根据统计学中的众数原理,选择在其他所有对象的字段取值中次数最多的值(即出现频率最高的值)来补齐该字段空缺值。

所述数据修正用于对所述填充客户数据集中存在不一致的数据进行修正,得到所述修正客户数据集。

较佳地,本发明通过遍历查找到所述填充数据集中不一致数据集,将所述不一致数据集用对应的字符标识进行统一化修正。

所述数据离散化处理用于将连续的数值属性转化为离散的数值属性。较佳地,本发明中对所述修正客户数据集进行排序,选取排序后的所述修正客户数据集中任意一个修正客户数据作为离散点,利用离散函数识别出所述离散点是否满足离散化的衡量尺度,若所述离散点满足所述离散化的衡量尺度,则对所述修正客户数据集进行分裂,得到所述标准客户数据集;若所述离散点不满足所述离散化的衡量尺度,遍历下一个修正客户数据作为离散点,直至遍历到所述修正客户数据满足所述离散化的衡量尺度时停止遍历。

本发明进一步将所述标准客户数据集存入数据库中。

s2、对所述标准客户数据集按预设的周期进行数据更新处理,得到更新客户数据集。

由于在企业的经营活动持续进行的过程中,成员企业会不断与客户发生着新的联系,如产生新的交易关系等,导致存储在所述数据库中的标准客户数据集处于动态变化中,于是,本发明对所述标准客户数据集按预设的周期进行数据更新处理。其中,所述预设的周期根据用户的需求进行选择,比如预设的周期可以为一个星期、一个月以及一年等。

本发明较佳实施例中,所述数据更新处理包括:虚假数据的剔除、有效数据的增添以及旧数据的删除。

所述虚假数据的剔除是指企业在搜集客户数据的过程中可能经常会涉及到客户隐私等敏感性的问题,收集起来具有一定的困难,即使企业凭借一定的渠道收集了一些数据,但是也不能排除这些数据的虚假性,因为理性的客户不愿意把一些涉及个人隐私的数据提供给一个自己不太熟悉的企业,最初提供给企业的个人信息很有可能是随意编造出来的,如果企业用这些数据作为企业分析客户渗透的基础,结果会有较大的误差,因此要将所述虚假数据进行筛选及剔除操作。

所述有效数据的增添是指,随着客户与企业接触次数的增加,客户逐渐放弃对企业的敌意,增加对企业的信任,客户愿意并且期望企业能够给他们提供一站式的服务,所以会毫无保留的把个人的一些偏好、生活方式、性格特征等一些个性特征提供给企业,希望企业能够针对自己的特性提供最适合自己的业务、产品及服务,此时成员企业会更新客户特征数据库中的客户资料,增添这些有效数据。

所述旧数据的删除主要针对业务交易不断进行过程中,客户的偏好、理性程度和业务知识也不断增长的情况。所述客户数据并非一成不变,利用数据库进行客户渗透分析这一目的建立起来的客户特征数据库也应该随时间及时地把那些陈旧客户信息的删除掉。

s3、将所述更新客户数据集中的客户数据与成员企业之间进行关联分析,生成所述成员企业之间的强关联规则。

本发明较佳实施例中,所述关联分析包括:计算所述更新客户数据集中的相同客户数据在不同成员企业之间出现的频率,得到所述成员企业之间的支持度,根据出现的频率对所述成员企业之间进行排序,利用关联算法计算所述排序后的所述成员企业之间的置信度,若所述支持度大于预设第一阈值且所述置信度大于预设第二阈值时,得到所述成员企业之间的强关联规则,其中,所述强关联规则用于挖掘出成员企业之间的客户数据。所述预设第一阈值与所述预设第二阈值根据实际业务场景进行设定。

例如,在待分析成员企业的业务范围内(d),客户购买计算机(x)时,也趋向于同时购买软件(y),可以用所述强关联规则表示为:

computer=>software[support=5%,confidence=80%]

其中,支持度5%(support=5%),即意味着分析中全部成员企业范围内的5%同时购买计算机和软件;置信度80%(confidence=80%)意味着购买计算机的客户中有80%的客户也同时购买软件。

s4、根据所述强关联规则,统计客户在所述成员企业之间的渗透数据,根据所述渗透数据,计算在所述成员企业之间所述客户互相渗透的所占比例,从而完成基于成员企业的客户渗透分析。

本发明较佳实施例中,基于上述强关联规则,统计出所述客户在不同成员企业中渗透数据,所述渗透数据包括:人数数量、交易次数、交易类型等根据所述渗透数据,计算在所述成员企业之间所述客户互相渗透的所占比例,从而完成成员企业之间的客户渗透分析。

通过所述客户渗透分析关系挖掘的结果并结合企业的实际情况,成员企业之间可以进行较为精确跨企业的业务开展工作,如执行产品推荐。

本发明还提供一种客户渗透分析的装置。参照图2所示,为本发明一实施例提供的客户渗透分析的装置的内部结构示意图。

在本实施例中,所述客户渗透分析的装置1可以是pc(personalcomputer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。该客户渗透分析的装置1至少包括存储器11、处理器12,通信总线13,以及网络接口14。

其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是客户渗透分析的装置1的内部存储单元,例如该客户渗透分析的装置1的硬盘。存储器11在另一些实施例中也可以是客户渗透分析的装置1的外部存储设备,例如客户渗透分析的装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器11还可以既包括客户渗透分析的装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于客户渗透分析的装置1的应用软件及各类数据,例如客户渗透分析程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行客户渗透分析程序01等。

通信总线13用于实现这些组件之间的连接通信。

网络接口14可选的可以包括标准的有线接口、无线接口(如wi-fi接口),通常用于在该装置1与其他电子设备之间建立通信连接。

可选地,该装置1还可以包括用户接口,用户接口可以包括显示器(display)、输入单元比如键盘(keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在客户渗透分析的装置1中处理的信息以及用于显示可视化的用户界面。

图2仅示出了具有组件11-14以及客户渗透分析程序01的客户渗透分析的装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对客户渗透分析的装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

在图2所示的装置1实施例中,存储器11中存储有客户渗透分析程序01;处理器12执行存储器11中存储的客户渗透分析程序01时实现如下步骤:

步骤一、获取成员企业中的客户数据集,对所述客户数据集进行数据清洗,得到标准客户数据集。

本发明较佳实施例中,所述成员企业可以包括总公司下面的各个子公司。例如总公司为中国水利水电建设公司,则其成员企业可以为水利一电、水利二电以及水利三电等。所述客户数据集是从与所述成员企业产生过联系的客户中获取得到的信息数据组合形成。较佳地,所述客户数据集可以包括:客户基本身份信息、交易信息数据以及客户行为数据等。

较佳地,本发明所述数据清洗包括:对所述客户数据集进行空缺值填充,得到填充客户数据集,对所述填充客户数据集进行数据修正,得到修正客户数据集,对所述修正客户数据集进行离散化处理,得到所述标准客户数据集等。

详细地,所述空缺值填充包括对所述客户数据集中字段空缺值进行填充,得到所述填充客户数据集。

较佳地,本发明将所述字段空缺值分为数值属性和非数值属性,并根据所述数值属性和非数值属性,采用不同的方法分别对所述字段空缺值进行填充处理。详细地,若所述字段空缺值为数值属性的,则采用其他所有对象的字段取值的平均值来填充该字段空缺值;若所述字段空缺值是非数值属性,则根据统计学中的众数原理,选择在其他所有对象的字段取值中次数最多的值(即出现频率最高的值)来补齐该字段空缺值。

所述数据修正用于对所述填充客户数据集中存在不一致的数据进行修正,得到所述修正客户数据集。

较佳地,本发明通过遍历查找到所述填充数据集中不一致数据集,将所述不一致数据集用对应的字符标识进行统一化修正。

所述数据离散化处理用于将连续的数值属性转化为离散的数值属性。较佳地,本发明中对所述修正客户数据集进行排序,选取排序后的所述修正客户数据集中任意一个修正客户数据作为离散点,利用离散函数识别出所述离散点是否满足离散化的衡量尺度,若所述离散点满足所述离散化的衡量尺度,则对所述修正客户数据集进行分裂,得到所述标准客户数据集;若所述离散点不满足所述离散化的衡量尺度,遍历下一个修正客户数据作为离散点,直至遍历到所述修正客户数据满足所述离散化的衡量尺度时停止遍历。

本发明进一步将所述标准客户数据集存入数据库中。

步骤二、对所述标准客户数据集按预设的周期进行数据更新处理,得到更新客户数据集。

由于在企业的经营活动持续进行的过程中,成员企业会不断与客户发生着新的联系,如产生新的交易关系等,导致存储在所述数据库中的标准客户数据集处于动态变化中,于是,本发明对所述标准客户数据集按预设的周期进行数据更新处理。其中,所述预设的周期根据用户的需求进行选择,比如预设的周期可以为一个星期、一个月以及一年等。

本发明较佳实施例中,所述数据更新处理包括:虚假数据的剔除、有效数据的增添以及旧数据的删除。

所述虚假数据的剔除是指企业在搜集客户数据的过程中可能经常会涉及到客户隐私等敏感性的问题,收集起来具有一定的困难,即使企业凭借一定的渠道收集了一些数据,但是也不能排除这些数据的虚假性,因为理性的客户不愿意把一些涉及个人隐私的数据提供给一个自己不太熟悉的企业,最初提供给企业的个人信息很有可能是随意编造出来的,如果企业用这些数据作为企业分析客户渗透的基础,结果会有较大的误差,因此要将所述虚假数据进行筛选及剔除操作。

所述有效数据的增添是指,随着客户与企业接触次数的增加,客户逐渐放弃对企业的敌意,增加对企业的信任,客户愿意并且期望企业能够给他们提供一站式的服务,所以会毫无保留的把个人的一些偏好、生活方式、性格特征等一些个性特征提供给企业,希望企业能够针对自己的特性提供最适合自己的业务、产品及服务,此时成员企业会更新客户特征数据库中的客户资料,增添这些有效数据。

所述旧数据的删除主要针对业务交易不断进行过程中,客户的偏好、理性程度和业务知识也不断增长的情况。所述客户数据并非一成不变,利用数据库进行客户渗透分析这一目的建立起来的客户特征数据库也应该随时间及时地把那些陈旧客户信息的删除掉。

步骤三、将所述更新客户数据集中的客户数据与成员企业之间进行关联分析,生成所述成员企业之间的强关联规则。

本发明较佳实施例中,所述关联分析包括:计算所述更新客户数据集中的相同客户数据在不同成员企业之间出现的频率,得到所述成员企业之间的支持度,根据出现的频率对所述成员企业之间进行排序,利用关联算法计算所述排序后的所述成员企业之间的置信度,若所述支持度大于预设第一阈值且所述置信度大于预设第二阈值时,得到所述成员企业之间的强关联规则,其中,所述强关联规则用于挖掘出成员企业之间的客户数据。所述预设第一阈值与所述预设第二阈值根据实际业务场景进行设定。

例如,在待分析成员企业的业务范围内(d),客户购买计算机(x)时,也趋向于同时购买软件(y),可以用所述强关联规则表示为:

computer=>software[support=5%,confidence=80%]

其中,支持度5%(support=5%),即意味着分析中全部成员企业范围内的5%同时购买计算机和软件;置信度80%(confidence=80%)意味着购买计算机的客户中有80%的客户也同时购买软件。

步骤四、根据所述强关联规则,统计客户在所述成员企业之间的渗透数据,根据所述渗透数据,计算在所述成员企业之间所述客户互相渗透的所占比例,从而完成基于成员企业的客户渗透分析。

本发明较佳实施例中,基于上述强关联规则,统计出所述客户在不同成员企业中渗透数据,所述渗透数据包括:人数数量、交易次数、交易类型等根据所述渗透数据,计算在所述成员企业之间所述客户互相渗透的所占比例,从而完成成员企业之间的客户渗透分析。

通过所述客户渗透分析关系挖掘的结果并结合企业的实际情况,成员企业之间可以进行较为精确跨企业的业务开展工作,如执行产品推荐。

可选地,在其他实施例中,客户渗透分析程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述客户渗透分析程序在客户渗透分析的装置中的执行过程。

例如,参照图3所示,为本发明客户渗透分析的装置一实施例中的客户渗透分析程序的程序模块示意图,该实施例中,所述客户渗透分析程序可以被分割为数据清洗模块10、数据更新模块20、关联分析模块30以及渗透分析模块40,示例性地:

所述数据清洗模块10用于:获取成员企业中的客户数据集,对所述客户数据集进行数据清洗,得到标准客户数据集。

所述数据更新模块20用于:对所述标准客户数据集按预设的周期进行数据更新处理,得到更新客户数据集。

所述关联分析模块30用于:将所述更新客户数据集中的客户数据与成员企业之间进行关联分析,生成所述成员企业之间的强关联规则。

所述渗透分析模块40用于:根据所述强关联规则,统计客户在所述成员企业之间的渗透数据,根据所述渗透数据,计算在所述成员企业之间所述客户互相渗透的所占比例,从而完成成员企业之间的客户渗透分析。

上述数据清洗模块10、数据更新模块20、关联分析模块30以及渗透分析模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有客户渗透分析程序,所述客户渗透分析程序可被一个或多个处理器执行,以实现如下操作:

获取成员企业中的客户数据集,对所述客户数据集进行数据清洗,得到标准客户数据集;

对所述标准客户数据集按预设的周期进行数据更新处理,得到更新客户数据集;

将所述更新客户数据集中的客户数据与成员企业之间进行关联分析,生成所述成员企业之间的强关联规则;

根据所述强关联规则,统计客户在所述成员企业之间的渗透数据,根据所述渗透数据,计算在所述成员企业之间所述客户互相渗透的所占比例,从而完成成员企业之间的客户渗透分析。

本发明计算机可读存储介质具体实施方式与上述客户渗透分析的装置和方法各实施例基本相同,在此不作累述。

需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1