电商指数自动分段拟合方法、装置、设备及介质与流程

文档序号:37640624发布日期:2024-04-18 18:02阅读:12来源:国知局
电商指数自动分段拟合方法、装置、设备及介质与流程

本发明涉及数据处理,尤其涉及一种电商指数自动分段拟合方法、装置、设备及介质。


背景技术:

1、目前成交金额、访客数等指标是经过非线性指数化处理后呈现的,且千店千面。目前没有商业化的指数转化工具,少数电商平台有比较成熟的商业化的指数转化工具如指数妖,但仅适用于指定电商平台指数改版前,按照指数种类进行统一破解,无法实现对千店千面情况的处理,即无法实现通用化。

2、目前通过不同电商平台只能获得电商指数信息,无法得到实际成交金额、访客数等,在店铺运营时无法了解行业的真实变化,通常采用人工逐一寻找断层部位或者设定一个固定分段数,耗时长且误差大,精准度较低。电商指数千店千面的现状,使得它不适合用指数妖这种按照指数种类统一破解的工具。同时,指数分段不连续的情况,使得单个公式拟合的方法误差很大,人工判断分段节点和设定固定分段数的情况,不适合商业化和大规模推广,所以需要一种自动分段拟合且对任意店铺均适用的电商指数拟合方法。


技术实现思路

1、本发明的目的是提供一种电商指数自动分段拟合方法、装置、设备及介质,采用自动分段拟合的办法,通过增加拟合分段数的方法,来控制预测值与真实值之间的偏差,从而找到指数与真实值之间分段的函数关系,实现指数破解以获取真实的电商数据,提高拟合的精度。

2、本发明提供了一种电商指数自动分段拟合方法,包括:

3、获取电商指数和该电商指数对应的目标数据,所述电商指数包括成交金额指数及访客数指数;

4、基于模型对所述电商指数和所述目标数据进行数据拟合形成第一拟合曲线,根据所述第一拟合曲线获取每个节点的变动幅度,根据相邻节点间的变动幅度判断并识别所述第一拟合曲线中存在错位的目标分段节点,将所述目标分段节点作为分割点,根据所述分割点执行一次分段操作并生成分段后的第二拟合曲线;

5、根据预设的误差阈值对所述第二拟合曲线执行二次分段操作进一步缩小拟合值与实际值的误差,得到误差分段后的第三拟合曲线;

6、遍历当前的分段节点列表,基于拟合函数对所述第三拟合曲线进行拟合,将多种拟合函数得到的拟合结果进行对比,选取最优拟合函数并更新为当前最终的拟合函数。

7、作为优选地,所述根据所述第一拟合曲线获取每个节点的变动幅度,根据相邻节点间的变动幅度判断并识别所述第一拟合曲线中存在错位的目标分段节点包括:

8、初始化模型后,遍历初始分段节点列表,得到当前的分段区间;

9、对当前的分段区间的样本按照从大到小排序进行拟合得到拟合值,计算残差绝对值=∑|实际值-拟合值|)/样本数,对残差绝对值进行差分操作;

10、基于箱型图理论计算历史性能数据的四分位数得到异常值,从而判断差分是否异常,筛选出异常且大于预设残差波动阈值的差分节点对应的电商指数;

11、遍历电商指数得到目标节点,判断目标节点是否满足残差分段条件,在目标节点满足残差分段条件的情况下,将目标节点更新至分段节点列表,在目标节点未满足残差分段条件的情况下,判断是否遍历完电商指数直至遍历完当前分段节点列表。

12、作为优选地,所述遍历初始分段节点列表之后包括:

13、如果存在满足所述残差分段条件的节点,则更新至当前的分段节点列表,否则停止执行自动分段操作;

14、其中,所述残差分段条件包括:所述目标节点残差波动大于预设残差波动阈值,且若对目标节点执行分段操作,则分段后的目标节点左右区间样本数大于等于预设的最小分段样本数;且若目标节点执行分段操作,则分段后的目标节点左右区间采用直线拟合的斜率为正。

15、作为优选地,所述根据预设的误差阈值对所述第二拟合曲线执行二次分段操作进一步缩小预测值与真实值的误差包括:

16、遍历更新后的分段节点列表,得到当前的分段区间;

17、对当前的分段区间的样本按照从大到小排序进行拟合得到拟合值,计算误差绝对值=|(实际值-拟合值)/实际值|,得到误差结果;

18、从所述误差结果中筛选出连续大于预设误差阈值节点对应的电商指数;

19、遍历电商指数得到目标节点,判断目标节点是否满足误差分段条件,在目标节点满足误差分段条件的情况下,将目标节点更新至分段节点列表,在目标节点未满足误差分段条件的情况下,判断是否遍历完电商指数直至遍历完当前分段节点列表。

20、作为优选地,所述更新后的分段节点列表之后包括:

21、如果存在满足所述误差分段条件的节点,则更新至当前的分段节点列表,否则停止执行自动分段操作;

22、其中,所述误差分段条件包括:所述目标节点误差大于预设误差阈值,且若对目标节点执行分段操作,则分段后的目标节点左右区间样本数大于等于预设的最小分段样本数;且若目标节点执行分段操作,则分段后的目标节点左右区间采用直线拟合的斜率为正。

23、作为优选地,所述基于拟合函数对所述第三拟合曲线进行拟合,将多种拟合函数得到的拟合结果进行对比包括:

24、根据公式平均绝对残差=(∑|实际值-拟合值|)/样本数,计算平均绝对残差,选取平均绝对残差最小的拟合函数作为当前分段曲线的拟合函数。

25、作为优选地,所述拟合函数包括直线函数、二次项函数、三次项函数及幂函数。

26、本发明还提供了一种电商指数自动分段拟合装置,包括:

27、数据采集模块,用于获取电商指数和该电商指数对应的目标数据,所述电商指数包括成交金额指数及访客数指数;

28、一次分段模块,用于基于模型对所述电商指数和所述目标数据进行数据拟合形成第一拟合曲线,根据所述第一拟合曲线获取每个节点的变动幅度,根据相邻节点间的变动幅度判断并识别所述第一拟合曲线中存在错位的目标分段节点,将所述目标分段节点作为分割点,根据所述分割点执行一次分段操作并生成分段后的第二拟合曲线;

29、二次分段模块,用于根据预设的误差阈值对所述第二拟合曲线执行二次分段操作进一步缩小拟合值与实际值的误差,得到误差分段后的第三拟合曲线;

30、最优拟合模块,用于遍历当前的分段节点列表,基于拟合函数对所述第三拟合曲线进行拟合,将多种拟合函数得到的拟合结果进行对比,选取最优拟合函数并更新为当前最终的拟合函数。

31、本发明提供了一种电子设备,包括:

32、存储器,所述存储器用于存储处理程序;

33、处理器,所述处理器执行所述处理程序时实现如本发明实施例所述的电商指数自动分段拟合方法。

34、本发明提供了一种可读存储介质,其特征在于,所述可读存储介质上存储有处理程序,所述处理程序被处理器执行时实现如本发明实施例所述的电商指数自动分段拟合方法。

35、针对现有技术,本发明具有如下的有益效果:

36、本发明所提供的一种电商指数自动分段拟合方法采用自动分段拟合的办法,通过增加拟合分段数的方法,来控制预测值与真实值之间的偏差,从而找到指数与真实值之间分段的函数关系,实现指数破解以获取真实的电商数据,提高拟合的精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1