一种基于销售数据预测客户对产品特征偏好的方法与流程

文档序号:15312879发布日期:2018-08-31 22:17阅读:1751来源:国知局

本发明涉及大数据分析技术领域,尤其涉及一种基于销售数据预测客户对产品特征偏好的方法。



背景技术:

随着世界产品的发展越来越迅速,当下掌握客户对于产品的需求还是很重要的,这对于开发具有竞争力的产品起着重要的基础作用。产品销售数据是获取客户需求和偏好的重要来源。近年来,在线销售市场发展非常迅速。据统计,自2011年以来,全球在线零售交易额和在线销售客户数量呈上升趋势,预计在2018年将分别达到2.49万亿美元和17.9亿客户。客户对产品特征偏好可以通过在线销售数据客观表现出来。研究发现,现有的研究主要集中在在线销售客户评论和反馈的行为上。客户对产品特征偏好的潜意识和感官感觉很难全面描述,因此需要开发一种基于在线销售大数据确定客户对产品特征偏好的方法。



技术实现要素:

本发明实施例所要解决的技术问题在于,提供一种基于销售数据预测客户对产品特征偏好的方法。可用大数据预测客户对产品特征偏好。

为了解决上述技术问题,本发明实施例提供了一种基于销售数据预测客户对产品特征偏好的方法,包括以下步骤:

获取产品销售数据;

对于指定产品计算客户满意度指数;

删除与目的不相关的指数降低数据的复杂性;

抽取产品样本,确定零件和指标之间的关系模型;

以神经网络建立智能模型,运用现有的指标组合作为输入,且以各指标对应的客户满意度指数总和作为输出,进行模型预测。

进一步地,所述对于指定产品计算客户满意度指数通过以下步骤进行:

产品总销量nt计算如下:

其中p是市场调查中考虑的产品数量,ni是特定产品i的购买数量,i=1,2、……p;

指定产品i的客户满意度指数sii计算:

更进一步地,所述删除与目的不相关的指数降低数据的复杂性的步骤包括:计算产品和指标的统计参数的均值和方差,删除缺失或不完整的数据。

更进一步地,所述抽取产品样本通过模糊k均值方法进行。

更进一步地,所述确定零件和指标之间的关系模型包括使用智能聚类算法实现产品指标聚类。

实施本发明实施例,具有如下有益效果:通过对在线销售数据进行分析,将在线销售数据划分为三类进行考虑,分别为客户域数据、功能域数据和物理域数据,运用大数据算法和人工智能算法,建立产品指标与零件之间的关系,进行产品指标聚类分析,建立客户满意度指数与聚类指标之间的模型,找出最佳指标组合,从而实现客户对产品特征偏好的预测。本发明方法可以在考虑零件约束的条件下,形成客户对产品特征偏好的智能模型,从而预测出客户对产品特征的偏好。

附图说明

图1是本发明的整体的流程示意图;

图2是本发明实施例获得的数据构成示意图;

图3是本发明实施例中产品指标和零件的关系矩阵图;

图4是本发明实施例中产品详细指标;

图5是本发明实施例中系统产生的最优组合。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。

参照图1所示的流程示意图。

本发明实施例的一种基于销售数据预测客户对产品特征偏好的方法,以电动玩具车产品为预测应用对象说明,具体包括以下步骤。

第一步,在线销售数据采集:通过访问淘宝购物平台获取有关电动玩具汽车及其指标的数据,进行了全面调查。在本次调查中,筛选出具有新品牌、相同邮件服务和类似广告强度的产品。通过检索每月销售数据,考虑51种产品指标,制作了232辆电动玩具车的统计表。其中电动玩具车在零售平台收集的原始数据如图2所示。

第二步,客户满意度指数计算:运用模糊k-[8]均值方法抽样得出8辆小车,分别对8辆抽样小车分别计算客户满意度指数,nt=232,针对第一辆样车,其调查数量ni为23,所以其第一辆客户满意度指数为23/232=9.91379%;其余以此类推。

第三步,指标数据处理和统计特征:从统计表中,应用数据集约简移除无关和冗余指标。

通过删除与目的不相关的指标来减少大数据复杂性,多余的或难以数值化的指标也应被删除。

为了从得到的大数据中提取信息,并使信息进一步减少,需要计算产品的(行)和指标(列)的统计参数,即均值和方差。这种处理旨在突出缺失的、不完整的数据,并说明此数据无统计学意义,例如,极微小的数据变量。这些处理可使数据集减少,并获得有意义的指标和它们的值,可用来做进一步的分析。

统计每种产品和指标的缺失数据,并对丢失数据超过50%的直接删除;另外对于指标中数值相差非常大的和数值超过90%相同的指标也直接删除。最终得到了一个232辆×18指标的统计表。对于最大速度,遥控距离和价格,用分级标准值来降低计算复杂度。如图4。

第四步,产品抽样和零件识别:产品抽样用于选择出具有统计代表性的产品实例的子集。产品可以按照一个精确的指标进行抽样,例如价格范围或销量。当问题复杂度增加时,需要同时根据更多的指标进行选择,采样技术可应用于大数据集。

要选择的产品实例数量取决于具体应用程序、商业可用性和经济可行性。

对232×18矩阵数据应用模糊k-[8]均值方法进行抽样,得到了8辆玩具样车。由于难以访问每个车辆的设计数据,所以将8辆玩具样车进行了物理拆卸,以统计零件清单。通过8辆玩具样车零件的统计,分析确定了一辆玩具汽车中存在至少43种不同类型的零件。

第五步,建立指标和零件之间的关系:这里用43个零件和18个指标构建指标和零件关系矩阵,其中,行表示43个零件,列表示18个指标,单元格里显示的是产品实例数量,通过这些数据确定指标和零件之间的关系。在此过程中,价格只考虑产品中主要或贵重部分的影响。关系矩阵图如图3所示。

在零件与指标之间的关系矩阵基础上,智能聚类算法实现产品指标聚类,如模糊k-均值、层次聚类、或自组织映射。在本实施例优选为运用层次聚类,将指标进行聚类,并对指标集群进行测试和用相关系数对聚类的结果进行评估。

运用层次聚类具体步骤包括:

a)计算规范/组件关系矩阵

b)计算规范和组件对之间的成对距离

c)通过获取上一步生成的距离信息,并将对象紧密地组合成二进制集群来计算链接。然后,链接函数将这些新形成的簇连接到另一个对象和其他对象,以创建更大的集群,直到原始数据集中的所有对象在层次树中链接在一起。

对于电动玩具车案例,决定将集群的数量设置为9,如图5所示。每个集群指标受相同或相似零件的影响。此案例研究定义了三个指标约束:

1.转向模式=“离散”→转动微调=“不存在”;

2.速度模式=“离散”→速度微调=“不存在”;

3.

第六步,最佳指标组合的智能建模:由于涉及的变量个数多、变量的具体范围广,故而以神经网络建立智能模型,运用现有的指标组合作为输入,且以各指标对应的客户满意度指数总和作为输出,进行模型预测。三层前馈bp神经网络拟合数据使用18个输入层节点建立(指标),36个隐藏层节点和1个输出层节点(客户满意度指数)。采用贝叶斯正则化算法对网络进行训练,总体回归系数为0.93,具有良好的建模适应性。为了评估以客户满意度指数为标准的最佳组合,在图4中列出了所有可能的指标组合的完整列表,并将其输入到受过训练的神经网络中。用这种方法,就可以根据指标说明绘制客户满意度指数趋势,并预测各指标组合的预期客户满意度指数。

图5显示了3个最佳指标组合及其客户满意度指数,即预测出的客户对电动玩具车偏好的模型。

以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1