基于历史商家记录及用户行为的电商消费客流量预测系统

文档序号:33119638发布日期:2023-02-01 03:28阅读:37来源:国知局
基于历史商家记录及用户行为的电商消费客流量预测系统

1.本发明属于客流量预测技术领域,尤其涉及一种基于历史商家记录及用户行为的电商消费客流量预测系统。


背景技术:

2.目前,在信息技术高度发达的当今社会,电子商务将传统的商务流程电子化、数字化,一方面以电子流代替了实物流,可以大量减少人力、物力等方面的支出,降低成本,提高效率。与此同时,产生了大量的数据,合理利用数据信息,挖掘信息内部存在的价值,可以提高对事物的认知和了解,进一步优化资源配置,提高经济和社会效益。以数据为原料的数据挖掘和机器学习技术在生活中发挥着越加重要的作用,通过挖掘数据中的“知识”,达到利用数据的目的。通过平台上实时产生的数据,包括商家特征数据、用户浏览记录和用户的支付行为等,都能获得有价值的隐藏信息,能够极大地优化以后的服务质量,合理的分配调度服务资源。但是,现有电商消费客流量预测方法大多通过简单的将历史数据处理后作为训练数据构建模型来预测商家客流量,但是由于没有考虑到多种因素对用户消费行为的影响综合程度,现有方法的预测精度并不是很理想。因此,亟需设计一种新的电商消费客流量预测系统。
3.通过上述分析,现有技术存在的问题及缺陷为:由于没有考虑到多种因素对用户消费行为的影响综合程度,现有电商消费客流量预测方法预测精度较低。


技术实现要素:

4.针对现有技术存在的问题,本发明提供了一种基于历史商家记录及用户行为的电商消费客流量预测系统。
5.本发明是这样实现的,一种基于历史商家记录及用户行为的电商消费客流量预测系统,所述基于历史商家记录及用户行为的电商消费客流量预测系统,包括:
6.数据获取模块,与中央控制模块连接,用于通过数据获取设备获取历史商家记录及用户行为的特征数据,并预设各类机器学习算法;
7.数据预处理模块,与中央控制模块连接,用于通过数据预处理程序对获取的历史商家记录及用户行为的特征数据进行增强处理,获得训练样本集;
8.数据传输模块,与中央控制模块连接,用于通过数据传输装置将预处理后的训练样本集发送至中央处理器进行后续的分析处理;
9.中央控制模块,与数据获取模块、数据预处理模块、数据传输模块、预测模型构建模块、预测模型优化模块、客流量预测模块、预测结果评估模块、数据存储模块、更新显示模块连接,用于通过中央处理器协调控制所述基于历史商家记录及用户行为的电商消费客流量预测系统各个模块的正常运行;
10.预测模型构建模块,与中央控制模块连接,用于通过模型构建程序根据训练样本集以及预设的各类机器学习算法分别训练出各类机器学习算法对应的电商消费客流量预
测模型;
11.预测模型优化模块,与中央控制模块连接,用于通过模型优化程序对各类机器学习算法对应的电商消费客流量预测模型进行评估优化,筛选得到多个预测结果较好的电商消费客流量预测模型;
12.客流量预测模块,与中央控制模块连接,用于通过利用筛选得到的多个电商消费客流量预测模型分别对电商消费客流量进行预测,得到客流量预测结果;
13.预测结果评估模块,与中央控制模块连接,用于通过结果评估程序对得到的多个客流量预测结果进行评估,得到最优客流量预测结果;
14.数据存储模块,与中央控制模块连接,用于通过存储器存储获取的历史商家记录及用户行为的特征数据、预设的机器学习算法、训练样本集、电商消费客流量预测模型、客流量预测结果以及预测结果评估信息;
15.更新显示模块,与中央控制模块连接,用于通过显示器对获取的历史商家记录及用户行为的特征数据、预设的机器学习算法、训练样本集、电商消费客流量预测模型、客流量预测结果及预测结果评估信息的实时数据进行更新显示。
16.进一步,所述通过预测模型构建模块利用模型构建程序根据训练样本集以及预设的各类机器学习算法分别训练出各类机器学习算法对应的电商消费客流量预测模型包括:
17.(1)获取电商消费客流量的训练样本集;
18.(2)利用预设的各类机器学习算法获取所述训练样本集中指示所述电商消费客流量预测模型的输入和输出之间的映射关系的函数表达式;
19.(3)根据所述函数表达式确定目标电商的参数值,根据所述参数值对所述电商消费客流量预测模型进行训练,得到训练后的电商消费客流量预测模型。
20.进一步,所述函数表达式包括待赋值参数和待调整参数,所述参数值用于对所述待赋值参数赋值,根据所述参数值调整所述函数表达式中的待调整参数。
21.进一步,所述通过预测模型优化模块利用模型优化程序对各类机器学习算法对应的电商消费客流量预测模型进行评估优化包括:
22.(1)获取电商消费客流量的训练样本集;
23.(2)将所述电商消费客流量的训练样本集中的每个数据分别输入到各类机器学习算法对应的客流量预测模型,得到预测结果;
24.(3)根据各客流量预测模型对应的预测结果以及rmse计算方法计算各客流量预测模型对应的rmse值。
25.进一步,所述根据评估结果从各机器学习算法对应的客流量预测模型中选择出多个预测效果较好的客流量预测模型,具体包括:
26.根据各客流量预测模型对应的rmse值进行客流量预测模型的选择,筛选得到多个预测结果较好的电商消费客流量预测模型。
27.进一步,步骤(2)中预设的各类机器学习算法包括有alpso-lssvm预测算法,所述alpso-lssvm预测算法的具体流程包括:
28.1)初始化pso的各参数:种群规模、最大进化次数、惯性权重上下限和位置;
29.2)定义lssvm的相关参数,将粒子的初始位置传递给lssvm的γ和σ参数,作为lssvm的初始参数,然后训练模型,以测试集的均方误差作为粒子的初始适应度值f,计算种
群的平均适应度并寻找初始p
lbest
和初始p
gbest
;p
lbest
为第j个粒子在第k次迭代时历史最优位置,p
gbest
为第k次迭代时群体的历史最优位置;
30.3)进行粒子的速度和位置的更新,并判断更新后的速度和位置是否超过设定的界限,如果v
jd
=v
max
,x
jd
>x
max
则v
jd
=v
max
,x
jd
=x
max
;如果v
jd
<v
min
,x
jd
<x
min
则v
jd
=v
min
,x
jd
=x
min

31.4)重新计算粒子的适应度值,并进行p
lbest
和p
gbest
更新;
32.5)判断是否符合迭代停止的条件,若符合,输出并记录全局最优解,若不符合,则重新计算惯性权重,直到找出全局最优解;
33.6)将寻找到的全局最优解输入lssvm,重新训练预测。
34.进一步,所述步骤2)中粒子的初始适应度值f和种群的平均适应度的计算公式为:
[0035][0036][0037]
所述步骤5)中计算惯性权重采用以下公式计算:
[0038][0039]
其中,w
max
和w
min
分别为w的上限和下限;f为第k+1代第j个粒子的适应度值;为种群当前的平均适应度值;为k+1代种群的适应度方差;μ为极小值。
[0040]
进一步,所述步骤6)中进行p
lbest
和p
gbest
更新时,若粒子当前位置的适应度值优于plbest,则将plbest更新为当前的适应度值;若粒子当前的适应度值优于pgbest,则将pgbest更新为当前的适应度值。
[0041]
进一步,所述通过预测结果评估模块利用结果评估程序对得到的多个客流量预测结果进行评估包括:
[0042]
(1)根据筛选得到的预测结果较好的电商消费客流量预测模型数量生成权重向量集合;
[0043]
(2)将所述权重向量集合中的各权重向量分别与选择出的客流量预测模型的预测结果进行加权平均计算,得到各权重向量对应的加权平均结果;
[0044]
(3)采用rmse计算法计算各加权平均结果的rmse值,并确定最小的rmse值对应的权重向量,利用所述权重向量对客流量预测结果进行评估。
[0045]
进一步,所述根据筛选得到的预测结果较好的电商消费客流量预测模型数量生成权重向量集合包括:
[0046]
确定权重变化粒度1/h,并根据权重变化粒度生成集合m;其中,m={1,1,1,1,...,1},集合m中一共包含h个1;
[0047]
使用插空法将集合m中的h个1分为n组,共有种分配方式,分别把每种分配方式中每组的1加起来,并除以h,得到共有个均匀分布的权重向量的权重向量集合;其中,n为筛选得到的预测结果较好的电商消费客流量预测模型的数量。
[0048]
本发明的另一目的在于提供一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以应用所述的基于历史商家记录及用户行为的电商消费客流量预测系统。
[0049]
本发明的另一目的在于提供一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机应用所述的基于历史商家记录及用户行为的电商消费客流量预测系统。
[0050]
本发明的另一目的在于提供一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现所述的基于历史商家记录及用户行为的电商消费客流量预测系统。
[0051]
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的基于历史商家记录及用户行为的电商消费客流量预测系统,利用历史商家记录及用户行为的特征数据构建训练样本集,充分考虑到了多种因素对用户消费行为的影响综合程度,并结合各类机器学习算法,分别训练出各类机器学习算法对应的电商消费客流量预测模型,同时对各类机器学习算法对应的电商消费客流量预测模型进行评估优化,筛选得到多个预测结果较好的电商消费客流量预测模型,预测精度高,预测结果较为准确。
附图说明
[0052]
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
[0053]
图1是本发明实施例提供的基于历史商家记录及用户行为的电商消费客流量预测系统结构框图;
[0054]
图中:1、数据获取模块;2、数据预处理模块;3、数据传输模块;4、中央控制模块;5、预测模型构建模块;6、预测模型优化模块;7、客流量预测模块;8、预测结果评估模块;9、数
据存储模块;10、更新显示模块。
[0055]
图2是本发明实施例提供的基于历史商家记录及用户行为的电商消费客流量预测方法流程图。
[0056]
图3是本发明实施例提供的通过预测模型构建模块利用模型构建程序根据训练样本集以及预设的各类机器学习算法分别训练出各类机器学习算法对应的电商消费客流量预测模型的方法流程图。
[0057]
图4是本发明实施例提供的通过预测模型优化模块利用模型优化程序对各类机器学习算法对应的电商消费客流量预测模型进行评估优化的方法流程图。
[0058]
图5是本发明实施例提供的通过预测结果评估模块利用结果评估程序对得到的多个客流量预测结果进行评估的方法流程图。
[0059]
图6是本发明实施例提供的alpso-lssvm预测算法的流程图。
具体实施方式
[0060]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0061]
针对现有技术存在的问题,本发明提供了一种基于历史商家记录及用户行为的电商消费客流量预测系统,下面结合附图对本发明作详细的描述。
[0062]
如图1所示,本发明实施例提供的基于历史商家记录及用户行为的电商消费客流量预测系统包括:数据获取模块1、数据预处理模块2、数据传输模块3、中央控制模块4、预测模型构建模块5、预测模型优化模块6、客流量预测模块7、预测结果评估模块8、数据存储模块9、更新显示模块10。
[0063]
数据获取模块1,与中央控制模块4连接,用于通过数据获取设备获取历史商家记录及用户行为的特征数据,并预设各类机器学习算法;
[0064]
数据预处理模块2,与中央控制模块4连接,用于通过数据预处理程序对获取的历史商家记录及用户行为的特征数据进行增强处理,获得训练样本集;
[0065]
数据传输模块3,与中央控制模块4连接,用于通过数据传输装置将预处理后的训练样本集发送至中央处理器进行后续的分析处理;
[0066]
中央控制模块4,与数据获取模块1、数据预处理模块2、数据传输模块3、预测模型构建模块5、预测模型优化模块6、客流量预测模块7、预测结果评估模块8、数据存储模块9、更新显示模块10连接,用于通过中央处理器协调控制所述基于历史商家记录及用户行为的电商消费客流量预测系统各个模块的正常运行;
[0067]
预测模型构建模块5,与中央控制模块4连接,用于通过模型构建程序根据训练样本集以及预设的各类机器学习算法分别训练出各类机器学习算法对应的电商消费客流量预测模型;
[0068]
预测模型优化模块6,与中央控制模块4连接,用于通过模型优化程序对各类机器学习算法对应的电商消费客流量预测模型进行评估优化,筛选得到多个预测结果较好的电商消费客流量预测模型;
[0069]
客流量预测模块7,与中央控制模块4连接,用于通过利用筛选得到的多个电商消
费客流量预测模型分别对电商消费客流量进行预测,得到客流量预测结果;
[0070]
预测结果评估模块8,与中央控制模块4连接,用于通过结果评估程序对得到的多个客流量预测结果进行评估,得到最优客流量预测结果;
[0071]
数据存储模块9,与中央控制模块4连接,用于通过存储器存储获取的历史商家记录及用户行为的特征数据、预设的机器学习算法、训练样本集、电商消费客流量预测模型、客流量预测结果以及预测结果评估信息;
[0072]
更新显示模块10,与中央控制模块4连接,用于通过显示器对获取的历史商家记录及用户行为的特征数据、预设的机器学习算法、训练样本集、电商消费客流量预测模型、客流量预测结果及预测结果评估信息的实时数据进行更新显示。
[0073]
如图2所示,本发明实施例提供的基于历史商家记录及用户行为的电商消费客流量预测方法包括以下步骤:
[0074]
s101,通过数据获取模块利用数据获取设备获取历史商家记录及用户行为的特征数据,并预设各类机器学习算法;通过数据预处理模块利用数据预处理程序对获取的历史商家记录及用户行为的特征数据进行增强处理,获得训练样本集;
[0075]
s102,通过数据传输模块利用数据传输装置将预处理后的训练样本集发送至中央处理器进行后续的分析处理;通过中央控制模块利用中央处理器协调控制所述基于历史商家记录及用户行为的电商消费客流量预测系统各个模块的正常运行;
[0076]
s103,通过预测模型构建模块利用模型构建程序根据训练样本集以及预设的各类机器学习算法分别训练出各类机器学习算法对应的电商消费客流量预测模型;
[0077]
s104,通过预测模型优化模块利用模型优化程序对各类机器学习算法对应的电商消费客流量预测模型进行评估优化,筛选得到多个预测结果较好的电商消费客流量预测模型;
[0078]
s105,通过客流量预测模块利用筛选得到的多个电商消费客流量预测模型分别对电商消费客流量进行预测,得到客流量预测结果;通过预测结果评估模块利用结果评估程序对得到的多个客流量预测结果进行评估,得到最优客流量预测结果;
[0079]
s106,通过数据存储模块利用存储器存储获取的历史商家记录及用户行为的特征数据、预设的机器学习算法、训练样本集、电商消费客流量预测模型、客流量预测结果以及预测结果评估信息;
[0080]
s107,通过更新显示模块利用显示器对获取的历史商家记录及用户行为的特征数据、预设的机器学习算法、训练样本集、电商消费客流量预测模型、客流量预测结果及预测结果评估信息的实时数据进行更新显示。
[0081]
如图3所示,本发明实施例提供的步骤s103中的通过预测模型构建模块利用模型构建程序根据训练样本集以及预设的各类机器学习算法分别训练出各类机器学习算法对应的电商消费客流量预测模型包括:
[0082]
s201,获取电商消费客流量的训练样本集;
[0083]
s202,利用预设的各类机器学习算法获取所述训练样本集中指示所述电商消费客流量预测模型的输入和输出之间的映射关系的函数表达式;
[0084]
s303,根据所述函数表达式确定目标电商的参数值,根据所述参数值对所述电商消费客流量预测模型进行训练,得到训练后的电商消费客流量预测模型。
[0085]
本发明实施例提供的函数表达式包括待赋值参数和待调整参数,所述参数值用于对所述待赋值参数赋值,根据所述参数值调整所述函数表达式中的待调整参数。
[0086]
如图4所示,本发明实施例提供的步骤s104中的通过预测模型优化模块利用模型优化程序对各类机器学习算法对应的电商消费客流量预测模型进行评估优化包括:
[0087]
s301,获取电商消费客流量的训练样本集;
[0088]
s302,将所述电商消费客流量的训练样本集中的每个数据分别输入到各类机器学习算法对应的客流量预测模型,得到预测结果;
[0089]
s303,根据各客流量预测模型对应的预测结果以及rmse计算方法计算各客流量预测模型对应的rmse值。
[0090]
本发明实施例提供的根据评估结果从各机器学习算法对应的客流量预测模型中选择出多个预测效果较好的客流量预测模型,具体包括:
[0091]
根据各客流量预测模型对应的rmse值进行客流量预测模型的选择,筛选得到多个预测结果较好的电商消费客流量预测模型。
[0092]
如图5所示,本发明实施例提供的步骤s105中的通过预测结果评估模块利用结果评估程序对得到的多个客流量预测结果进行评估包括:
[0093]
s401,根据筛选得到的预测结果较好的电商消费客流量预测模型数量生成权重向量集合;
[0094]
s402,将所述权重向量集合中的各权重向量分别与选择出的客流量预测模型的预测结果进行加权平均计算,得到各权重向量对应的加权平均结果;
[0095]
s403,采用rmse计算法计算各加权平均结果的rmse值,并确定最小的rmse值对应的权重向量,利用所述权重向量对客流量预测结果进行评估。
[0096]
本发明实施例提供的根据筛选得到的预测结果较好的电商消费客流量预测模型数量生成权重向量集合包括:
[0097]
确定权重变化粒度1/h,并根据权重变化粒度生成集合m;其中,m={1,1,1,1,...,1},集合m中一共包含h个1;
[0098]
使用插空法将集合m中的h个1分为n组,共有种分配方式,分别把每种分配方式中每组的1加起来,并除以h,得到共有个均匀分布的权重向量的权重向量集合;其中,n为筛选得到的预测结果较好的电商消费客流量预测模型的数量。
[0099]
本发明实施例中的步骤s202中预设的各类机器学习算法包括有alpso-lssvm预测算法,如图6所示,所述alpso-lssvm预测算法的具体流程包括:
[0100]
1)初始化pso的各参数:种群规模、最大进化次数、惯性权重上下限和位置;
[0101]
2)定义lssvm的相关参数,将粒子的初始位置传递给lssvm的γ和σ参数,作为lssvm的初始参数,然后训练模型,以测试集的均方误差作为粒子的初始适应度值f,计算种群的平均适应度并寻找初始p
lbest
和初始p
gbest
;p
lbest
为第j个粒子在第k次迭代时历史最优位置,p
gbest
为第k次迭代时群体的历史最优位置;
[0102]
3)进行粒子的速度和位置的更新,并判断更新后的速度和位置是否超过设定的界限,如果v
jd
=v
max
,x
jd
>x
max
则v
jd
=v
max
,x
jd
=x
max
;如果v
jd
<v
min
,x
jd
<x
min
则v
jd
=v
min
,x
jd

x
min

[0103]
4)重新计算粒子的适应度值,并进行p
lbest
和p
gbest
更新;
[0104]
5)判断是否符合迭代停止的条件,若符合,输出并记录全局最优解,若不符合,则重新计算惯性权重,直到找出全局最优解;
[0105]
6)将寻找到的全局最优解输入lssvm,重新训练预测。
[0106]
本发明实施例中的步骤2)中粒子的初始适应度值f和种群的平均适应度的计算公式为:
[0107][0108][0109]
本发明实施例中的步骤5)中计算惯性权重采用以下公式计算:
[0110][0111]
其中,w
max
和w
min
分别为w的上限和下限;f为第k+1代第j个粒子的适应度值;为种群当前的平均适应度值;为k+1代种群的适应度方差;μ为极小值。
[0112]
本发明实施例中的步骤6)中进行p
lbest
和p
gbest
更新时,若粒子当前位置的适应度值优于plbest,则将plbest更新为当前的适应度值;若粒子当前的适应度值优于pgbest,则将pgbest更新为当前的适应度值。
[0113]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一
个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。
[0114]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1