一种共享经济下的基于数据挖掘的动态定价算法的制作方法

文档序号:11288025阅读:1676来源:国知局
一种共享经济下的基于数据挖掘的动态定价算法的制造方法与工艺

本发明涉及一种基于移动互联网的动态定价技术,尤其涉及一种共享经济下的基于数据挖掘的动态定价算法。



背景技术:

随着移动智能设备及移动支付的推广和普及,使得供给和需求方的资源互换具备更高的实时性。基于此,动态定价策略得到很大的发展:uber的动态定价策略获得了较大的成功,引起了市场和业界的高度关注;airbnb于2015年对其民宿平台实施了动态定价策略,用于提示供给方一个相对合理的房租价格,实现了基于数据的客观市场指导和参考,并开源了其机器学习工程(aerosolve)代码。

在全民共享经济资源模式兴起的当前,动态定价策略在一定程度上很好的解决了服务的合理定价问题,但其仍有许多需要改进的问题,如定价变化过快、节日或应急事件时定价过高、缺乏灵活性等等。

国内动态定价的兴起起步不久,目前已有使用案例,如滴滴打车、神州专车。然而其定价的策略较为单一,同时具备较强的局限性,动态定价并未在其价格制定上占据主要地位。本文基于特征筛选方法与机器学习方法,对影响定价的多因素及其权重进行探索,并基于此构建自动化的动态定价模型,通过多重定价策略的辅助使用,实现动态定价算法的优化与应用,解决了算法应用单一、难以进行因素干预、时效性低等问题。



技术实现要素:

本发明的目的是提供一种共享经济下的基于数据挖掘的动态定价算法,并基于实际效果,优化实现较为灵活的动态定价策略。本发明所提出的定价方法分为三个层次,分别为初步定价策略、基于特征筛选进行权重优化的定价策略、以及基于机器学习建模测试进行权重优化的定价策略。

本发明所采用的技术方案是:

一种共享经济下的基于数据挖掘的动态定价算法,包括如下步骤过:

步骤1、采用初步定价策略,包括如下步骤:

初步定价策略可以有多种类型,且比较灵活,如供给方定价、个性化细分定价、拍卖定价等多种类型。

多数服务商具备服务端、交易、客户信息等数据,同时具备历史同期及当前产品的价格信息等数据,将服务端、交易、客户信息、历史同期及当前产品的价格信息数据进行收集;基于数据挖掘技术,可以实现基于访问模式、购买模式、习惯偏好等特征进行客户分层;基于价格与需求之间、销售商品之间的关联特征进行参考定价;基于商品关注人数、销售量、库存等的时间序列数据进行预测定价。

初步定价策略存在个性化分群定价的公平问题、时间序列预测定价的突发时段定价不及时问题。因此,需要基于进一步的定价策略进行混合辅助。

步骤2、基于特征筛选的权重优化

数据挖掘的特征提取步骤中,我们需要将尽可能多的信息整合到特征文件中,因此初始特征集包含所有选定特征。然而并非所有特征集中的特征都具有很好的代表性,且过多的特征会使信息冗余,使模型训练过拟合,反而会降低模型的判断力,因此提取合适的特征则成为提高模型效果的重要环节。

有众多的特征筛选算法可以用来评价不同场景下特征的优劣,如主成分分析(principalcomponentanalysis,pca)、最小冗余最大相关算法(minimal-redundancy-maximal-relevance,mrmr)、方差分析(analysisofvariance,anova)、二项分布(binomialdistribution,bd)等等,本发明主要使用f-score方法实现特征筛选。

给定训练特征向量x,k=1,2,则第i个特征的f-score可表示为

这里分别为第i个特征在整个特征集和第k个数据集中的特征平均值。代表第k个数据集中第j条序列的第i个特征值,nk是第k个数据集中的蛋白质序列条数。

我们可以看出,在f-score定义中,分子表示当前特征在不同数据集间的判别力,分母则表示其在各集内部序列之间的判别力。可见,分子越大,类别判别越准确;分母越小,类别判别错误率越小。也就是说,f-score值越大,当前特征越具有判别力,因此这个分值即可作为特征筛选的评价依据。

基于产品的所有属性,及市场的即时需求,转化为样本特征值,在大量特征集的情况下,基于实际数据中,其是否被购买或选定,来进行样本分类,作为后期建模的训练集。

通过f-score方法进行特征筛选,找出得分高的特征,并进行从高到低顺序排列,作为对订购与否影响依重至轻的特征。

通过历史数据的分析,所有高于阈值的特征信息都考虑到模型中,与动态定价策略产生相关。

步骤3、基于机器学习的权重优化

支持向量机是一种基于统计学理论的机器学习方法,它集成了学习理论vc维(vapnik-chervonenkisdimension)和结构风险最小原理,因在处理分类回归方面表现出色,被广泛应用。其基本原理是通过引入核函数,将输入向量映射到一个高维的空间,在高维空间中构造线性决策函数来实现回归,从而很好地解决了非线性分类及回归问题。

这里假设样本集为这里l为样本数,y为样本目标,d为输入数据维度。则在高维空间中,最优函数可表示为:

其中αi为lagrange因子,b是分类的阈值,而k(xi,xj)为核函数,即实现非线性变换的内积函数。

在支持向量机中通常有四种内积函数可选用于非线性变换——线性内积函数,多项式内积函数,sigmoid内积函数及径向基内积函数。其中以多项式内积函数,sigmoid内积函数及径向基内积函数研究及使用最多,公式如下:

2)多项式形式的内积函数:

k(x,xi)=[(x·xi)+1]q(3)

参数q由用户预先指定,这里产生的是一个q阶的多项式分类器。

2)sigmoid内积函数:

k(x,xi)=tanh[v(x·xi)+c](4)

其中v>0,c<0。使用这个内积函数,则得到的就是一个双层的感知机神经网络,其权值及隐藏节点数均由算法自动确定。

3)径向基内积函数:

采用上述内积函数,得到的支持向量机是一种区别于传统径向基函数(rbf)方法的分类器,其每一个内积函数的中心对应一个支持向量,其中参数σ越大,径向基内积函数的外推能力越弱。

使用支持向量机回归(supportvectorregression,svr),通过对特征集的特征进行调整,基于最近及同期的实际交易数据进行训练,从而构建各因素与适时价格的函数关系,实现价格预测。

为保持模型的时效性,每次定价通过动态的特征提取和数据准备,进行动态建模。并基于所建最优模型,进行模型的应用和价格预测。

同时,通过将价格信息作为特征之一,进行基于支持向量机的分类预测,实现成交是否成功的预测及概率输出。系统提供灵活的定价,为供给方提供足够的自由度去订立价格,并可基于价格计算产品可以售出的概率,用作反馈提醒。

在获得成功的定价数据基础上,系统通过变动单一属性特征的方式,进行不同产品属性的权重调整,从而实现基于属性标准的自动参数设置,实现动态定价。

值得一提的是,在整个建模的过程中,需求比例作为重要参考值之一,与其他特征因素对定价产生的影响是不等价的,具体体现为需求的供给具有绝对的影响地位。因此,特征筛选过程中,需求量比例不应作为淘汰特征之一。相反的,需要进行对应性的权重放大。即在特征集归一化步骤中,需给予需求量更大的特征间距。

本发明的有益效果是,本发明公开的一种共享经济下的基于数据挖掘的动态定价算法,通过多重定价策略的辅助使用,实现动态定价算法的优化与应用,解决了算法应用单一、难以进行因素干预、时效性低等问题。

下面结合附图对本发明作进一步详细描述。

附图说明

图1为本发明具体实施例的数据挖掘实现过程示意图;

图2为支持向量机示意图。

图3为本发明共享经济下的基于数据挖掘的动态定价算法的动态定价策略架构图。

具体实施方式

为了加深对本发明的理解,下面结合附图和实施例对本发明作进一步详细的说明。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

一种共享经济下的基于数据挖掘的动态定价算法,包括如下步骤过:

步骤1、采用初步定价策略,包括如下步骤:

初步定价策略可以有多种类型,且比较灵活,如供给方定价、个性化细分定价、拍卖定价等多种类型。

多数服务商具备服务端、交易、客户信息等数据,同时具备历史同期及当前产品的价格信息等数据。基于数据挖掘技术,可以实现基于访问模式、购买模式、习惯偏好等特征进行客户分层;基于价格与需求之间、销售商品之间的关联特征进行参考定价;基于商品关注人数、销售量、库存等的时间序列数据进行预测定价等等。

然而初步定价策略同时存在一定的问题,如个性化分群定价的公平问题、时间序列预测定价的突发时段定价不及时问题等。因此,需要基于进一步的定价策略进行混合辅助。

步骤2、基于特征筛选的权重优化

数据挖掘的特征提取步骤中,我们需要将尽可能多的信息整合到特征文件中,因此初始特征集包含所有选定特征。然而并非所有特征集中的特征都具有很好的代表性,且过多的特征会使信息冗余,使模型训练过拟合,反而会降低模型的判断力,因此提取合适的特征则成为提高模型效果的重要环节。

有众多的特征筛选算法可以用来评价不同场景下特征的优劣,如主成分分析(principalcomponentanalysis,pca)、最小冗余最大相关算法(minimal-redundancy-maximal-relevance,mrmr)、方差分析(analysisofvariance,anova)、二项分布(binomialdistribution,bd)等等,本发明主要使用f-score方法实现特征筛选。

给定训练特征向量x,k=1,2,则第i个特征的f-score可表示为

这里分别为第i个特征在整个特征集和第k个数据集中的特征平均值。代表第k个数据集中第j条序列的第i个特征值,nk是第k个数据集中的蛋白质序列条数。

我们可以看出,在f-score定义中,分子表示当前特征在不同数据集间的判别力,分母则表示其在各集内部序列之间的判别力。可见,分子越大,类别判别越准确;分母越小,类别判别错误率越小。也就是说,f-score值越大,当前特征越具有判别力,因此这个分值即可作为特征筛选的评价依据。

基于产品的所有属性,及市场的即时需求,转化为样本特征值,在大量特征集的情况下,基于实际数据中,其是否被购买或选定,来进行样本分类,作为后期建模的训练集。

通过f-score方法进行特征筛选,找出得分高的特征,并进行从高到低顺序排列,作为对订购与否影响依重至轻的特征。

通过历史数据的分析,所有高于阈值的特征信息都考虑到模型中,与动态定价策略产生相关。

步骤3、基于机器学习的权重优化

支持向量机是一种基于统计学理论的机器学习方法,它集成了学习理论vc维(vapnik-chervonenkisdimension)和结构风险最小原理,因在处理分类回归方面表现出色,被广泛应用。其基本原理是通过引入核函数,将输入向量映射到一个高维的空间,在高维空间中构造线性决策函数来实现回归,从而很好地解决了非线性分类及回归问题。

这里假设样本集为这里l为样本数,y为样本目标,d为输入数据维度。则在高维空间中,最优函数可表示为:

其中αi为lagrange因子,b是分类的阈值,而k(xi,xj)为核函数,即实现非线性变换的内积函数。

在支持向量机中通常有四种内积函数可选用于非线性变换——线性内积函数,多项式内积函数,sigmoid内积函数及径向基内积函数。其中以多项式内积函数,sigmoid内积函数及径向基内积函数研究及使用最多,公式如下:

3)多项式形式的内积函数:

k(x,xi)=[(x·xi)+1]q(3)

参数q由用户预先指定,这里产生的是一个q阶的多项式分类器。

2)sigmoid内积函数:

k(x,xi)=tanh[v(x·xi)+c]

(4)

其中v>0,c<0。使用这个内积函数,则得到的就是一个双层的感知机神经网络,其权值及隐藏节点数均由算法自动确定。

3)径向基内积函数:

采用这个内积函数,得到的支持向量机是一种区别于传统径向基函数(rbf)方法的分类器,其每一个内积函数的中心对应一个支持向量,其中参数σ越大,径向基内积函数的外推能力越弱。

使用支持向量机回归(supportvectorregression,svr),通过对特征集的特征进行调整,基于最近及同期的实际交易数据进行训练,从而构建各因素与适时价格的函数关系,实现价格预测。

为保持模型的时效性,每次定价通过动态的特征提取和数据准备,进行动态建模。并基于所建最优模型,进行模型的应用和价格预测。

同时,通过将价格信息作为特征之一,进行基于支持向量机的分类预测,实现成交是否成功的预测及概率输出。系统提供灵活的定价,为供给方提供足够的自由度去订立价格,并可基于价格计算产品可以售出的概率,用作反馈提醒。

在获得成功的定价数据基础上,系统通过变动单一属性特征的方式,进行不同产品属性的权重调整,从而实现基于属性标准的自动参数设置,实现动态定价。

值得一提的是,在整个建模的过程中,需求比例作为重要参考值之一,与其他特征因素对定价产生的影响是不等价的,具体体现为需求的供给具有绝对的影响地位。因此,特征筛选过程中,需求量比例不应作为淘汰特征之一。相反的,需要进行对应性的权重放大。即在特征集归一化步骤中,需给予需求量更大的特征间距。

本发明的具体实施例,

以一款移动端的旅游共享经济应用平台为例,该平台为个人旅游创业者提供资金、技术、营销及交易撮合扶助,降低创业门槛。倡导个人共享闲置资源、技术、能力,创造额外收益,为用户提供基于旅游的社交平台及差异化、个性化旅游产品服务。该平台以社交为入口,把握中国移动互联网未来重要的流量入口,目前该项目已在张家界、镇江、三亚等地落地。

该平台的动态定价是以移动app为社交的沟通媒介,所展开的一种类拍卖的方式进行的。拍卖机制是:卖家设置的一个起始价格,低起拍价格为10元。同时卖家可以自定义加价幅度,也可以使用系统自动代理加价;前者是固定不变的,而后者的加价幅度是随着当前出价金额的增加而增加的,但是对应固定的“当前价格”,其加价幅度也是固定的。买家可以在超越前一个人的出价记录以及不小于卖家设置的加价幅度的情况下,自己出价或者采用代理出价的方式。代理出价是指系统根据买家所输入的高价格,在有其他买家出价时,自动以小加价金额向上出价,以维持买家高出价者的位置,直到买家的高出价被其他买家超过为止。在系统自动代理加价的情况下,价格变动幅度是间接的由消费者需求决定的,有购买意愿的人越多,出价次数就越多,从而就导致了较高的“当前价格”,这样就随之提升了加价幅度。也就是说,在app上拍卖的初始价格是卖家根据市场信息以及成本一收益而确定的,加价幅度是固定不变的或者是仅仅由需求间接决定的,而且是对所有商品都通用的。这种定价机制很简单,但缺陷也很多。在现行的拍卖机制下,卖家很难搜集全面的客户及竞争对手信息,不能对其进行深度挖掘,也就不能依据客户特征进行差别化定价,也做不到对不同的商品依据时间变化、需求、库存情况做出及时、适当的加价幅度的调整,从而不能达到客户大满意和卖家收入大化的目的。而基于数据挖掘的电子商务动态定价模型的引入则可以解决这个问题。系统可以搭建数据挖掘平台完成模型中数据层和分析层的任务,即通过搜集买卖双方以及外部市场的数据、建立数据仓库、进行数据挖掘形成辅助定价决策的知识库。然后卖家(包括企业和个人)依托该平台,并结合自身信息掌握情况和技术实力进行动态定价决策。

在c2c模式下,卖家是个人,不能完成庞大的数据搜集直至数据挖掘的任务,那么基于动态竞价的数据挖掘平台就可以帮助完成这些信息搭建工作,然后运用统一的定价模型和算法依据各种动态定价策略对不同类型的商品做出相应的定价决策,包括适当的初始价格的确定和加价幅度的调整,各个卖家可依据所销售商品的不同选择相应的定价策略。另外,网络平台可以建立统一的标准帮助卖家对客户进行细分,并对不同的客户实施不同的定价策略,尤其在拍卖中凸显高忠诚度客户的优先机制,达到保存客户、提高客户满意度的目的。当然,为争取新的买家,也可以采取一定的优惠措施,增加客户源,扩大市场份额。

要说明的是,以上所述实施例是对本发明技术方案的说明而非限制,所属技术领域普通技术人员的等同替换或者根据现有技术而做的其他修改,只要没超出本发明技术方案的思路和范围,均应包含在本发明所要求的权利范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1