基于大数据的食品销售数据挖掘分析方法与流程

文档序号:35294574发布日期:2023-09-01 17:50阅读:60来源:国知局
基于大数据的食品销售数据挖掘分析方法与流程

本发明涉及数据处理,具体涉及一种基于大数据的食品销售数据挖掘分析方法。


背景技术:

1、近年来,随着网络技术的发展和普及,在食品销售领域,大多数食品的销售行为已经从单纯的线下销售转换为线上销售的模式,尤其是食品中的农产畜牧分类。而在进行线上的农产畜牧食品销售时,会产生海量的销售数据,由于这些销售数据中包含了大量的具有价值的信息,因此通过对这些销售数据进行数据挖掘,可以从这些销售数据中提取有价值的信息、发现潜在的规律以及趋势,对农产畜牧食品的销售决策制定具有重要意义。

2、现有技术在对农产畜牧分类的食品进行数据挖掘时,通常是根据销售数据中单个产品的被购买的次数以及不同种类的食品被同时购买的次数,来量化对应的支持度和置信度,而后通过置信度阈值进行不同种类的农产畜牧食品的关联规则挖掘。但是考虑到不同于其余的食品,农产畜牧食品会受到季节、环境等多方面的因素影响,且不同种类的农产畜牧食品对于消费者的消费必要性不同,就会导致其价格存在较大的波动区间,而在不同的价格变化的影响下,就会导致所挖掘出的关联规则不够准确,进而影响农产畜牧食品的销售决策的准确制定,不利于农产畜牧食品的销售。


技术实现思路

1、本发明的目的在于提供一种基于大数据的食品销售数据挖掘分析方法,用于解决现有食品销售关联规则挖掘准确性低的问题。

2、为解决上述技术问题,本发明提供了一种基于大数据的食品销售数据挖掘分析方法,包括以下步骤:

3、获取待挖掘的食品销售数据,按照设定的置信度阈值和销售周期,对所述食品销售数据进行数据挖掘,获取每种食品在每个销售周期下的关联规则集合以及所述关联规则集合中每条关联规则的置信度;

4、根据每种食品在每个销售周期下的关联规则集合中各条关联规则中后项食品的种类的分布特征以及各条关联规则对应的置信度,确定每种食品在每个销售周期下的关联规则复杂程度;

5、根据所述食品销售数据,确定每种食品在每个销售周期下的价格,根据所述价格和关联规则复杂程度,确定每种食品的最具有市场潜力价格;

6、根据每种食品在每相邻两个销售周期下的价格的差异、关联规则集合中各条关联规则的个数的差异以及关联规则集合中各条关联规则中后项食品的总种类数的差异,确定每种食品对应的关联规则相关参数;

7、根据每种食品对应的所述关联规则相关参数、每种食品在每个销售周期下的价格与对应的所述最具有市场潜力价格的差异、以及每种食品在每相邻两个销售周期下的价格的差异,确定每种食品在每个销售周期下的动态调整参数;

8、根据所述动态调整参数,对所述置信度阈值进行调整,获取每种食品在每个销售周期下的调整置信度阈值,并根据所述调整置信度阈值和销售周期,对所述食品销售数据进行数据挖掘,确定每种食品在每个销售周期下的最终的关联规则集合。

9、进一步的,确定每种食品在每个销售周期下的关联规则复杂程度,包括:

10、确定每种食品在每个销售周期下的关联规则集合中各条关联规则中后项食品的种类对应的信息熵;

11、确定每种食品在每个销售周期下的关联规则集合中各条关联规则的置信度的累加和,从而得到每种食品在每个销售周期下对应的置信度累加和;

12、根据每种食品在每个销售周期下对应的信息熵和置信度累加和,确定每种食品在每个销售周期下的关联规则复杂程度,所述信息熵和置信度累加和均与所述关联规则复杂程度成正相关关系。

13、进一步的,确定每种食品对应的关联规则相关参数,包括:

14、所述关联规则相关参数包括食品关联规则改变系数和食品种类规则改变系数,所述食品关联规则改变系数和食品种类规则改变系数对应的计算公式为:

15、

16、其中,和分别表示第 n种食品对应的食品关联规则改变系数和食品种类规则改变系数,和分别表示第 n种食品在第t个和第t-1个销售周期下的关联规则集合中各条关联规则的总个数,和分别表示第 n种食品在第t个和第t-1个销售周期下的价格,和分别表示第 n种食品在第t个和第t-1个销售周期下的关联规则集合中所有后项食品的总种类数,t表示第 n种食品对应的销售周期的总数目,| |表示取绝对值符号,e表示自然常数。

17、进一步的,确定每种食品在每个销售周期下的动态调整参数,包括:

18、根据每种食品在每个销售周期下的价格和对应的所述最具有市场潜力价格的差值,确定每种食品在每个销售周期下的价格系数;

19、确定每种食品在每相邻两个销售周期下的价格的差值的平均值,从而得到每种食品对应的价格差异均值;

20、根据每种食品在每个销售周期下的价格和对应的所述最具有市场潜力价格的差值绝对值,以及每种食品对应的价格差异均值,确定每种食品在每个销售周期下对应的价格差距量化值;

21、根据每种食品在每个销售周期下对应的价格差距量化值以及每种食品对应的关联规则相关参数,确定每种食品在每个销售周期下对应的关联规则价格影响程度;

22、对所述关联规则价格影响程度进行正相关归一化,并将每种食品在每个销售周期下对应的正相关归一化结果与所述价格系数的乘积值,确定为每种食品在每个销售周期下的动态调整参数。

23、进一步的,确定每种食品在每个销售周期下的价格系数,包括:

24、判断每种食品在每个销售周期下的价格和对应的所述最具有市场潜力价格的差值是否大于0,若大于0,则将对应销售周期下的价格系数设置为第一数值,否则将对应销售周期下的价格系数设置为第二数值,所述第一数值为负数且所述第二数值为正数。

25、进一步的,所述第一数值为-1,所述第二数值为1。

26、进一步的,确定每种食品的最具有市场潜力价格,包括:

27、将每种食品在各个销售周期下的关联规则复杂程度中的最大值所对应的销售周期,确定为每种食品的目标销售周期,并将每种食品在其目标销售周期下的价格确定为每种食品的最具有市场潜力价格。

28、进一步的,对所述置信度阈值进行调整,获取每种食品在每个销售周期下的调整置信度阈值,对应的计算公式为:

29、

30、其中,为第 n种食品在第t个销售周期下的调整置信度阈值,为所述置信度阈值,为第 n种食品在第t个销售周期下的动态调整参数。

31、进一步的,采用apriori算法对所述食品销售数据进行数据挖掘。

32、进一步的,所述销售周期为每相邻两天的设定时刻之间的时间段,所述设定时刻根据食品价格变更完成时间确定。

33、本发明具有如下有益效果:通过按照设定的置信度阈值和销售周期,对食品销售数据进行初步的数据挖掘,从而可以确定每种食品在每个销售周期下的关联规则集合以及关联规则集合中每条关联规则的置信度。为了消除食品的价格因素对关联规则的影响,确定每种食品在每个销售周期下的关联规则复杂程度,以对每个销售周期内每种食品在当前价格下的市场潜力进行衡量,从而筛选出每种食品的最具有市场潜力价格。同时,通过分析每种食品在每相邻两个销售周期下的价格的差异、关联规则集合中各条关联规则的个数的差异以及关联规则集合中各条关联规则中后项食品的总种类数的差异,对食品价格差异对关联规则的影响程度进行衡量,从而确定每种食品对应的关联规则相关参数。最后基于关联规则相关参数,并结合每种食品在每个销售周期下的价格与对应的所述最具有市场潜力价格的差异、以及每种食品在每相邻两个销售周期下的价格的差异,自适应确定每种食品在每个销售周期下的动态调整参数,并利用该动态调整参数对置信度阈值进行动态调整,从而得到每种食品在每个销售周期下的调整置信度阈值。基于该调整置信度阈值,对食品销售数据再次进行数据挖掘,此时避免了价格因素对于食品关联规则的影响,可以获得更加准确的关联规则,从而保证了后续食品销售决策的准确制定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1