积压物料相关物料属性的查询和预测方法与流程

文档序号:11408422阅读:592来源:国知局

本发明涉及商品管理,尤其是涉及一种积压物料相关物料属性的查询和预测方法。



背景技术:

商家在采购商品时,往往凭借采购人员的采购经验对商品的种类和数量进行采购,容易造成紧缺商品的采购不足以及滞销商品的过度采购,这种采购方式对采购人员的采购经验依赖性大,对采购种类和采购数量缺乏科学性分析,造成库存压力,增加库存成本[1]。

为了防止货物积压和减少货物积压投资,对物料库存的监控是必不可少的。传统的统计方法可以帮助我们建立库存相关图表,直观地了解物料库存的整体情况。但由于物料相关库存数据量激增和属性复杂度的提高,仅通过图表很容易忽略库存相关的重要信息。

参考文献:

[1]zipkinph.foundationsofinventorymanagement[m].newyork:mcgraw-hill,2000.

[2]i.guyonanda.elisseeff,“anintroductiontovariableandfeatureselection,”thejournalofmachinelearningresearch,vol.3,pp.1157–1182,2003.

[3]q.zhou,w.hong,f.yang,andl.luo,“featureselectionofrandomforest-basedproximitymatrixdifference,”journalofhuazhonguniv.ofsci.&tech.:naturalscienceedition,no.4,pp.58–61,2010.

[4]l.breiman,“randomforests,”machinelearning,vol.45,no.1,pp.5–32,2001.



技术实现要素:

本发明的目的在于提供一种积压物料相关物料属性的查询和预测方法。

本发明包括以下步骤:

1)库龄基本统计分析,利用图表等形式初步了解特定货物的库龄分布基本情况,同时比较当前和历史库龄的变化;

2)针对预测物料是否积压问题,对相关物料属性进行重要性排序;

3)查询积压物料,利用属性重要性排序得出的对造成积压最相关的属性,在该属性上查询某个时间范围的库存量。

4)预测积压物料,通过步骤3)的查询结果来预测积压物料。

在步骤1)中,所述库龄基本统计分析的具体方法可为:通过各种直观图表形式,按产品、产品类型、公司及其组合计算当期库龄和库龄金额结构,来显示库龄的基本信息;通过选择不同的属性,来查看关于库龄数据分布情况,包括货物库龄、库龄金额结构、当期库龄、历史库龄比较和库龄排名等。

在步骤2)中,所述针对预测物料是否积压问题,对相关物料属性进行重要性排序的具体方法可为:将预测物料是否积压问题转化为特征选择问题,综合多种特征选择方法:过滤法和封装法,来进行相关物料属性重要性排序。首先利用过滤法进行特征选择,从原始特征中获得候选特征子集。然后利用封装法进行特征选择,从上一步中的候选特征子集中确定对于物料积压与否相关性大的属性,并按相关性进行重要性排序;所述相关物料属性包括:上月入库数量、上月出库数量、上次入库数量、上次出库数量、上次入库至今时间(月)、上次出库至今时间(月)、上次入库至今时间、上次出库至今时间(月)、类型、尺寸等;

在步骤3)中,所述查询积压物料的具体方法可为:利用属性重要性排序得出的对造成积压最相关的属性,在该属性上获取某个时间范围的库存量。

在步骤4)中,所述预测积压物料,通过步骤3)的查询结果预测积压物料的具体方法可为:若在设置的查询范围内库存量为0或者小于一定阈值,则不是积压物料;若库存量越过一定阈值,则可能是积压物料。

本发明利用特征选择方法对相关物料属性进行排列,从而找到与造成积压最相关的物料属性,然后通过查询在该属性上的某个时间查询范围的库存量,来判断该物料是否是积压物料,从而降低成本,实现了对商品库存的精益化管理。

本发明将预测物料是否积压问题转化为特征选择问题,集成多种特征选择方法:过滤法和封装法,进行相关物料属性重要性排序[2,3,4]。选取重要性大的属性进行重点监控,将大大降低了库存监管的工作复杂度和提高了物料库存积压的预判精度。

本发明的有益效果是:通过判断该物料是否是积压物料,降低了库存监管的工作复杂度和提高了物料库存积压的预判精度,有效防止货物积压和减少货物积压投资。

具体实施方式

以下实施例对本发明作进一步的说明。

本发明提供的一种基于数据挖掘技术的一种积压物料相关物料属性的查询和预测方法的流程图,该方法包括;

步骤一:库龄基本统计分析。利用图表等形式初步了解特定货物的库龄分布基本情况,同时比较当前和历史库龄的变化。

步骤二:将预测物料是否积压问题转化为特征选择问题,综合多种特征选择方法:过滤法和封装法,来进行相关物料属性重要性排序。

步骤三:查询积压物料。利用属性重要性排序得出的对造成积压最相关的属性,在该属性上获取某个时间范围的库存量。

步骤四:预测积压物料。通过上一步的查询结果来预测积压物料。

下面结合一个具体实施例对本发明进行具体描述。

库龄分析主要针对货物从入库起在仓库存放时间和其相关属性的分析,其主要目的是防止货物积压和减少货物积压投资。在本发明中,一种货物在一段时间y内(例如6个月)库存量超过x%(例如30%)则定义为在时间t的积压货物,其中用户可以自己设置x和y。

步骤一:库龄基本分析。利用图表等形式初步了解特定货物的库龄分布基本情况,同时比较当前和历史库龄的变化。

通过各种直观图表形式,按产品、产品类型、公司及其组合计算当期库龄和库龄金额结构,来显示库龄的基本信息。通过选择不同的属性,来查看关于库龄数据分布情况,包括货物库龄、库龄金额结构、当期库龄、历史库龄比较和库龄排名等。

步骤二:将针对预测物料是否积压问题转化为特征选择问题,集成多种特征选择方法:过滤法和封装法,来进行相关物料属性重要性排序。

相关物料属性包括:上月入库数量、上月出库数量、上次入库数量、上次出库数量、上次入库至今时间(月)、上次出库至今时间(月)、上次入库至今时间、上次出库至今时间(月)、类型、尺寸等。本发明将针对预测物料是否积压问题转化为特征选择问题,综合多种特征选择方法:过滤法和封装法来进行相关物料属性重要性排序。

本发明假设对于库存中的每个物料和每个时间戳,有一个数据样本,(xi,yi),其中xi表示项目的属性,yi是标签。当一个物料发生积压时,yi=1;否则yi=0。标签信息可以将整个物料集合x划分为积压物料x1和非积压物料x0。

库存数据具有大量的样本和属性。分类算法所需的时间通常随着特征的数量而急剧增长。在过滤法的特征选择模型用作区分不相关和冗余特征的过滤器。它通常比封装法模型计算密集度低。因此,本发明首先采用过滤模型从原始属性集合中寻找候选特征子集,以加快库存时效挖掘的处理。本发明集成了多种过滤器特性选择方法,包括信息增益、mrmr和relieff来对属性进行排序,并允许用户对其进行配置。

在过滤模型生成候选特征子集之后,使用封装模型,利用随机森林相似度矩阵来获得最终属性排序结果。

一般来说,库存物料具有大量噪声,并且它们的属性包含各种类型,例如作为数字、文本和时间。随机森林(rf)是一种恰好非常适合于上述特征下的库存数据的集合学习算法。原始随机森林以out-of-bag(oob)错误为指标返回属性重要性排序。本发明通过使用更敏感的指标来改进这种方法:样本相似度矩阵。以相似度内核度量,使用样本间相似度来替代原始的oob错误作为属性重要性排序的标准,命名为randomforestproximity(fs-rfp)。通过对所有样本的一个特征的值进行随机重排,利用相似度矩阵的变化来计算特征的重要性分数。排名靠前的特征具有高的重要性。与随机森林原始的变量重要性分析相比,本发明对相关特征更敏感,产生更小的信息特征集合并保持预测精度。

本实施例中得出结论,上次入库至今时间(月)与上次出库至今时间(月)这两个属性与物料积压(一年以上库存金额占比>30%)有着比较强的关联,相关系数分别为0.454和0.467,而其它的属性的相关系数都小于0.026。

步骤三:查询积压物料。利用属性重要性排序得出的对造成积压最相关的属性,在该属性上获取某个时间范围的库存量。

针对上一步得到的重要属性建立库存查询。一个查询是一组文字的逻辑连接,每个条件筛选对应一个属性。例如:对连续属性a,它的查询对应为la<a<ha,其中la和ha分别是属性a的上限和下限值;对离散属性b,其查询对应为b=v。为属性设定一个查询条件,可以获得符合该条件的新的集合。从而在阈值对应的集合中发掘货物积压概率最大的集合。

步骤四:预测积压物料,通过上一步的查询结果来预测积压物料。

通过上一步的查询结果来预测积压物料,如果在设置的查询范围内库存量为0或者小于一定阈值,则不是积压物料,如果库存量越过一定阈值,则可能是积压物料。如对2011年1月到2月的数据分析,本发明发现了一些有价值的信息。如属性“最新入库时间”和“最新出库时间”有很强的相关性,这两个属性有利于货物积压的预测。另外,也得到了一些关于潜在积压的信息,例如产品a的安全库龄阈值是4到6个月,如果库存龄超过这个阈值,该产品很有可能产生货物积压。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1