本发明涉及数据处理,具体而言,涉及一种用于产品推荐的数据采集方法及系统。
背景技术:
1、产品推荐旨在向用户展示和推荐商品或服务,这些商品或服务是基于用户的需求而选择的。这个过程增强了客户体验,提高了购买率,并促进了客户忠诚度。用于产品推荐的数据采集是其中的关键,其用于收集和分析用户行为数据,以便生成个性化的产品推荐,帮助企业更好地了解其客户,因此在电子商务和数字营销领域中非常重要。
2、然而当前用于产品推荐的数据采集方法中收集大量用户信息并存储增加了存储负担,并且过量的数据也造成过度分析,无法准确把控用户需求,延长了数据处理时间且产品推荐准确性较低。
3、如何有效地收集用户数据,提高数据处理速度和推荐准确性成为急需解决的问题。
技术实现思路
1、鉴于此,本发明提出了一种用于产品推荐的数据采集方法及系统,旨在解决如何有效地收集用户数据,提高数据处理速度和推荐准确性成为急需解决的问题。
2、一个方面,本发明提出了一种用于产品推荐的数据采集方法,包括:
3、在第一用户登录线上服务平台后,获取所述第一用户的身份信息,根据所述身份信息获取所述第一用户在所述线上服务平台内的行为数据,所述行为数据包括所述第一用户的历史登录次数c0、历史每次登录时的浏览产品信息、历史每次登录时的在线时长和历史在线总时长ta,ta=t1+t2+t3+...+tc0,其中t1至tc0依次为所述第一用户登录所述线上服务平台时的第一次登录时的历史在线时长至第c0次登录时的历史在线时长;
4、在所述线上服务平台的数据库内建立暂存数据存储模块、临时数据存储模块和推荐数据存储模块;
5、根据所述第一用户的历史登录次数c0、历史在线总时长ta和预设参考总时长t0确定获取的所述第一用户的行为数据的存储位置:
6、当c0<3时,则将所述行为数据存储至所述暂存数据存储模块内;
7、当c0≥3时,则将所述行为数据存储至所述临时数据存储模块内,并将所述历史在线总时长ta与所述预设参考总时长t0进行比对:
8、当ta<t0时,则保持所述行为数据存储在所述临时数据存储模块内;
9、当ta≥t0时,则将所述行为数据存储至所述推荐数据存储模块内;
10、获取所述推荐数据存储模块内的所述行为数据,并基于所述第一用户的浏览产品信息生成产品推荐数据,并将所述产品推荐数据发送给所述第一用户进行产品推荐。
11、进一步的,当c0<3,将所述行为数据存储至所述暂存数据存储模块内时,包括:
12、根据所述历史每次登录时的在线时长确定是否对所述行为数据的存储位置进行调整:
13、当c0=0时,则将当前采集到的所述第一用户的行为数据存储至所述暂存数据存储模块内;
14、当c0=1时,则获取所述第一用户的第一次登录时的历史在线时长t1,并将所述第一次登录时的历史在线时长t1与预设单次登录时长tb进行比对:
15、若t1<tb,则保持所述行为数据存储在所述暂存数据存储模块内;
16、若t1≥tb,则将所述行为数据存储至所述临时数据存储模块内;
17、当c0=2时,则获取所述第一用户的第一次登录时的历史在线时长t1和第二次登录时的历史在线时长t2,并将t1与t2相加之和与所述预设单次登录时长tb进行比对:
18、若t1+t2<tb,则保持所述行为数据存储在所述暂存数据存储模块内;
19、若t1+t2≥tb,则获取所述第一用户第一次登录与第二次登录所述线上服务平台时的间隔时长m1,以及获取所述第一用户第二次登录与当前登录所述线上服务平台时的间隔时长m2:
20、当m1≤m2时,则将所述行为数据存储至所述临时数据存储模块内;
21、当m1>m2时,则将所述行为数据存储至所述推荐数据存储模块内。
22、进一步的,在将所述行为数据存储至所述临时数据存储模块内后,包括:
23、为存储在所述临时数据存储模块内的所述行为数据设定初始评分a0,a0为正整数;
24、获取所述第一用户登录线上服务平台后的单次最大历史在线时长tn,并预先设定第一预设在线时长t01、第二预设在线时长t02和第三预设在线时长t03,且t01<t02<t03;
25、预先设定第一预设调节系数k1、第二预设调节系数k2、第三预设调节系数k3和第四预设调节系数k4,且0.5<k1<k2<k3<k4<0.8;
26、将所述单次最大历史在线时长tn与各预设在线时长进行比对,以选定调节系数对所述初始评分a0进行调节:
27、当tn<t01时,则选定所述第一预设调节系数k1对所述初始评分a0进行调节;
28、当t01≤tn<t02时,则选定所述第二预设调节系数k2对所述初始评分a0进行调节;
29、当t02≤tn<t03时,则选定所述第三预设调节系数k3对所述初始评分a0进行调节;
30、当t03≤tn时,则选定所述第四预设调节系数k4对所述初始评分a0进行调节;
31、在选定第m预设调节系数km对所述初始评分a0进行调节后,m=1,2,3,4,设定初始采集间隔时长p0,每间隔一所述初始采集间隔时长p0则获取一次所述第一用户的历史登录次数c0:
32、若c0变大,则不对所述初始评分a0进行调节;
33、若c0无变化,则对所述初始评分a0调节一次,调节后的评分为a0×km;
34、在持续获取n次间隔所述初始采集间隔时长p0的所述第一用户的历史登录次数c0后,若c0无变化,获取所述行为数据的评分a0×kmn;
35、当a0×kmn<a0/3后,则将所述临时数据存储模块内的行为数据转存至所述暂存数据存储模块内。
36、进一步的,在将所述行为数据存储至所述推荐数据存储模块内后,包括:
37、预先设定第一预设推荐周期r1、第二预设推荐周期r2、第三预设推荐周期r3和第四预设推荐周期r4,r1<r2<r3<r4;预先设定第一预设在线总时长ta1、第二预设在线总时长ta2、第三预设在线总时长ta3和第四预设在线总时长ta4,且ta1<ta2<ta3<ta4;
38、根据所述历史在线总时长ta与各预设在线总时长之间的关系确定为所述第一用户进行产品推荐时的推荐周期:
39、当ta1<ta≤ta2时,则选定所述第四预设推荐周期r4作为向所述第一用户进行产品推荐时的推荐周期;
40、当ta2<ta≤ta3时,则选定所述第三预设推荐周期r3作为向所述第一用户进行产品推荐时的推荐周期;
41、当ta3<ta≤ta4时,则选定所述第二预设推荐周期r2作为向所述第一用户进行产品推荐时的推荐周期;
42、当ta4<ta时,则选定所述第一预设推荐周期r1作为向所述第一用户进行产品推荐时的推荐周期。
43、进一步的,在选定第i预设推荐周期ri作为向所述第一用户进行产品推荐时的推荐周期后,包括:
44、预先设定第一预设修正系数q1、第二预设修正系数q2、第三预设修正系数q3和第四预设修正系数q4,且1>q1>q2>q3>q4>0.5;
45、在获取所述第一用户登录线上服务平台后的单次最大历史在线时长tn后,根据所述单次最大历史在线时长tn与各预设在线时长进行比对,以选定修正系数对产品推荐时的推荐周期进行修正:
46、当t01<tn≤t02时,则选定所述第一预设修正系数q1对产品推荐时的推荐周期进行修正,修正后的产品推荐周期为ri*q1;
47、当t02<tn≤t03时,则选定所述第二预设修正系数q2对产品推荐时的推荐周期进行修正,修正后的产品推荐周期为ri*q2;
48、当t03<tn≤t04时,则选定所述第三预设修正系数q3对产品推荐时的推荐周期进行修正,修正后的产品推荐周期为ri*q3;
49、当t04<tn时,则选定所述第四预设修正系数q4对产品推荐时的推荐周期进行修正,修正后的产品推荐周期为ri*q4。
50、与现有技术相比,本发明的有益效果在于,本发明通过获取第一用户登录线上服务平台后历史登录次数c0、历史每次登录时的浏览产品信息、历史每次登录时的在线时长和历史在线总时长ta,并在数据库内建立暂存数据存储模块、临时数据存储模块和推荐数据存储模块存储不同等级的数据,根据第一用户的历史登录次数c0、历史在线总时长ta和预设参考总时长t0确定获取的行为数据的存储位置,最终从推荐数据存储模块内获取用户的行为数据,基于用户的浏览产品信息生成产品推荐数据,并将所述产品推荐数据发送给所述第一用户,以进行产品推荐,极大地提高了数据采集效率和产品推荐效率。本发明通过根据用户在线上服务平台内历史登录次数和历史登录时长信息对用户的行为数据进行筛选分类,从而能够确定用户的行为数据的等级,并将筛选分类后的行为数据存储至不同等级的存储模块中,并对高等级的行为数据所对应的用户进行产品推荐,不仅提高了数据采集的处理效率,还能够有效地进行用户数据的筛选,从而提高后续产品推荐时的推荐效率,提高了产品推荐时的成功率。
51、另一方面,本发明还提出了一种用于产品推荐的数据采集系统,包括:
52、采集单元,用于在第一用户登录线上服务平台后,获取所述第一用户的身份信息,根据所述身份信息获取所述第一用户在所述线上服务平台内的行为数据,所述行为数据包括所述第一用户的历史登录次数c0、历史每次登录时的浏览产品信息、历史每次登录时的在线时长和历史在线总时长ta,ta=t1+t2+t3+...+tc0,其中t1至tc0依次为所述第一用户登录所述线上服务平台时的第一次登录时的历史在线时长至第c0次登录时的历史在线时长;
53、数据管理单元,用于在所述线上服务平台的数据库内建立暂存数据存储模块、临时数据存储模块和推荐数据存储模块;
54、处理单元,用于根据所述第一用户的历史登录次数c0、历史在线总时长ta和预设参考总时长t0确定获取的所述第一用户的行为数据的存储位置:
55、当c0<3时,则将所述行为数据存储至所述暂存数据存储模块内;
56、当c0≥3时,则将所述行为数据存储至所述临时数据存储模块内,并将所述历史在线总时长ta与所述预设参考总时长t0进行比对:
57、当ta<t0时,则保持所述行为数据存储在所述临时数据存储模块内;
58、当ta≥t0时,则将所述行为数据存储至所述推荐数据存储模块内;
59、推荐单元,用于获取所述推荐数据存储模块内的所述行为数据,并基于所述第一用户的浏览产品信息生成产品推荐数据,并将所述产品推荐数据发送给所述第一用户进行产品推荐。
60、进一步的,所述处理单元还用于当c0<3,将所述行为数据存储至所述暂存数据存储模块内时,包括:
61、所述处理单元还用于根据所述历史每次登录时的在线时长确定是否对所述行为数据的存储位置进行调整:
62、当c0=0时,则将当前采集到的所述第一用户的行为数据存储至所述暂存数据存储模块内;
63、当c0=1时,则获取所述第一用户的第一次登录时的历史在线时长t1,并将所述第一次登录时的历史在线时长t1与预设单次登录时长tb进行比对:
64、若t1<tb,则保持所述行为数据存储在所述暂存数据存储模块内;
65、若t1≥tb,则将所述行为数据存储至所述临时数据存储模块内;
66、当c0=2时,则获取所述第一用户的第一次登录时的历史在线时长t1和第二次登录时的历史在线时长t2,并将t1与t2相加之和与所述预设单次登录时长tb进行比对:
67、若t1+t2<tb,则保持所述行为数据存储在所述暂存数据存储模块内;
68、若t1+t2≥tb,则获取所述第一用户第一次登录与第二次登录所述线上服务平台时的间隔时长m1,以及获取所述第一用户第二次登录与当前登录所述线上服务平台时的间隔时长m2:
69、当m1≤m2时,则将所述行为数据存储至所述临时数据存储模块内;
70、当m1>m2时,则将所述行为数据存储至所述推荐数据存储模块内。
71、进一步的,所述处理单元还用于在将所述行为数据存储至所述临时数据存储模块内后,包括:
72、所述处理单元还用于为存储在所述临时数据存储模块内的所述行为数据设定初始评分a0,a0为正整数;
73、获取所述第一用户登录线上服务平台后的单次最大历史在线时长tn,并预先设定第一预设在线时长t01、第二预设在线时长t02和第三预设在线时长t03,且t01<t02<t03;
74、预先设定第一预设调节系数k1、第二预设调节系数k2、第三预设调节系数k3和第四预设调节系数k4,且0.5<k1<k2<k3<k4<0.8;
75、将所述单次最大历史在线时长tn与各预设在线时长进行比对,以选定调节系数对所述初始评分a0进行调节:
76、当tn<t01时,则选定所述第一预设调节系数k1对所述初始评分a0进行调节;
77、当t01≤tn<t02时,则选定所述第二预设调节系数k2对所述初始评分a0进行调节;
78、当t02≤tn<t03时,则选定所述第三预设调节系数k3对所述初始评分a0进行调节;
79、当t03≤tn时,则选定所述第四预设调节系数k4对所述初始评分a0进行调节;
80、在选定第m预设调节系数km对所述初始评分a0进行调节后,m=1,2,3,4,设定初始采集间隔时长p0,每间隔一所述初始采集间隔时长p0则获取一次所述第一用户的历史登录次数c0:
81、若c0变大,则不对所述初始评分a0进行调节;
82、若c0无变化,则对所述初始评分a0调节一次,调节后的评分为a0×km;
83、在持续获取n次间隔所述初始采集间隔时长p0的所述第一用户的历史登录次数c0后,若c0无变化,获取所述行为数据的评分a0×kmn;
84、当a0×kmn<a0/3后,则将所述临时数据存储模块内的行为数据转存至所述暂存数据存储模块内。
85、进一步的,所述处理单元还用于在将所述行为数据存储至所述推荐数据存储模块内后,包括:
86、所述处理单元还用于预先设定第一预设推荐周期r1、第二预设推荐周期r2、第三预设推荐周期r3和第四预设推荐周期r4,r1<r2<r3<r4;预先设定第一预设在线总时长ta1、第二预设在线总时长ta2、第三预设在线总时长ta3和第四预设在线总时长ta4,且ta1<ta2<ta3<ta4;
87、根据所述历史在线总时长ta与各预设在线总时长之间的关系确定为所述第一用户进行产品推荐时的推荐周期:
88、当ta1<ta≤ta2时,则选定所述第四预设推荐周期r4作为向所述第一用户进行产品推荐时的推荐周期;
89、当ta2<ta≤ta3时,则选定所述第三预设推荐周期r3作为向所述第一用户进行产品推荐时的推荐周期;
90、当ta3<ta≤ta4时,则选定所述第二预设推荐周期r2作为向所述第一用户进行产品推荐时的推荐周期;
91、当ta4<ta时,则选定所述第一预设推荐周期r1作为向所述第一用户进行产品推荐时的推荐周期。
92、进一步的,所述处理单元还用于在选定第i预设推荐周期ri作为向所述第一用户进行产品推荐时的推荐周期后,包括:
93、所述处理单元还用于预先设定第一预设修正系数q1、第二预设修正系数q2、第三预设修正系数q3和第四预设修正系数q4,且1>q1>q2>q3>q4>0.5;
94、在获取所述第一用户登录线上服务平台后的单次最大历史在线时长tn后,根据所述单次最大历史在线时长tn与各预设在线时长进行比对,以选定修正系数对产品推荐时的推荐周期进行修正:
95、当t01<tn≤t02时,则选定所述第一预设修正系数q1对产品推荐时的推荐周期进行修正,修正后的产品推荐周期为ri*q1;
96、当t02<tn≤t03时,则选定所述第二预设修正系数q2对产品推荐时的推荐周期进行修正,修正后的产品推荐周期为ri*q2;
97、当t03<tn≤t04时,则选定所述第三预设修正系数q3对产品推荐时的推荐周期进行修正,修正后的产品推荐周期为ri*q3;
98、当t04<tn时,则选定所述第四预设修正系数q4对产品推荐时的推荐周期进行修正,修正后的产品推荐周期为ri*q4。
99、可以理解的是,上述用于产品推荐的数据采集方法与系统,具有相同的有益效果,在此不再赘述。