本发明属于数据分析,尤其涉及一种基于历史数据对比的电商销售异常检测与问题定位方法。
背景技术:
1、在电商运营数据分析中,通常围绕对历史销售数据的理解,预测未来的趋势,以及基于这些预测做出商业决策,而时间序列分析能够更准确地预测销售趋势,以支持更好的库存和供应链管理,可以对运营人员提供建议,运营能够根据预测结果规划促销活动和营销预算。
2、但时间序列分析的方式,存在以下缺点:
3、1. 由于电商数据的属性使然,每个月的活动时间不具有周期性,并不能有效的进行时间序列分解,所以时间序列分析并不能准确的去判断电商行业的活动期,并且无法给出准确的判断;
4、2. 时间序列分析无法解读异常的数据出现的根源,并且并不能从各方位给出异常数据的解读,时间序列分析无法对运营人员产生的运营动作进行合理性判断,时间序列对自然数据的准确性更高;
5、3. 电商和市场分析较为浅显,给出的结论不够深刻,无法从根源上对运营人员做出指导。
6、基于此,本案由此提出。
技术实现思路
1、本发明的目的在于提供一种基于历史数据对比的电商销售异常检测与问题定位方法,帮助运营人员对店铺各项数据进行分析,能够判断过往一段时间内店铺数据是否异常,对店铺各项数据进行预测,给出相对应的预测区间,对运营做出指导性作用。
2、为了实现上述目的,本发明的技术方案如下:
3、一种基于历史数据对比的电商销售异常检测与问题定位方法,包括以下步骤:
4、收集店铺数据;
5、逐级拆分数据至最小单元,最小单元包括若干元素,同时记录各级单元拆分时的占比系数,其中单元是指数据拆分到需要分析的项,元素是指最小单元所拆分出来的计算公式中的各项;
6、将拆分的数据分组汇总;
7、以第1天至第n-1天的时间段内的数据作为数据分析基础,计算该时间段内每一天数据的测试基准值、测试标准差、异常值上限和异常值下限;
8、判断处于异常值上下限之间的数据视为有效数据天数;
9、计算该时间段内有效数据天数中,所有数据中各元素的基准值、标准差、上下置信区间、区间最大波动;
10、判断第n日的数据中,各元素是否波动,并计算波动系数和波动程度;
11、根据波动系数、波动程度以及占比系数,计算第n日数据中每个元素对该日总体数据的影响程度;
12、给出分析和预测结果;
13、给出运营的建议和总结。
14、进一步的,所述分析结果包括以下:判断第n日店铺数据是否有波动,给出影响数据波动程度最高的元素,并给出可视化分析。
15、进一步的,所述预测结果包括以下:
16、以第1天至第n天的时间段内的数据作为数据分析基础,计算该时间段内每一天数据的测试基准值、测试标准差、异常值上限和异常值下限;
17、判断不在异常值上、下限范围内的有效数据天数;
18、计算该时间段内有效数据天数中,所有数据中各元素的置信区间,将该置信区间作为第n+1天的数据、数据各级单元、元素的预测区间。
19、与现有技术相比,本发明的优点在于:
20、1. 可以定位到数据最小单元,寻找出数据波动的最重要原因,如若数据并没有波动,依然可以去分析昨日店铺的经营情况,保优提良减差;
21、2. 可以根据店铺的运营方法,给出各运营方法带来的数据是否满足预期roi,从而减少运营负担,能够让运营方更快的自省昨日的经营状况,以及更快的上手一家店铺;
22、3. 对每一项数据都有一个预测区间,能够较好的关照到每一项数据是否达标;
23、4. 可以根据数据有效的判断出店铺是否参加了大促小促、优惠活动,是否处于淡季旺季,或者店铺运营决策是否出现问题等。
1.一种基于历史数据对比的电商销售异常检测与问题定位方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于历史数据对比的电商销售异常检测与问题定位方法,其特征在于,所述分析结果包括以下:判断第n日店铺数据是否有波动,给出影响数据波动程度最高的元素,并给出可视化分析。
3.如权利要求1所述的一种基于历史数据对比的电商销售异常检测与问题定位方法,其特征在于,所述预测结果包括以下: