基于互联网的电子商务数据挖掘系统的制作方法

文档序号:30267587发布日期:2022-06-02 05:16阅读:85来源:国知局
基于互联网的电子商务数据挖掘系统的制作方法

1.本发明涉及电子商务和数据挖掘领域,尤其涉及一种基于互联网的电子商务数据挖掘系统。


背景技术:

2.随着互联网技术的日新月异,电子商务发展也十分迅猛,已经成为推动地区经济发展的重要力量。针对以上背景,我们迫切地需要得到大体量、高质量的数据来做分析调研,以便能够更直观地反映地区电商产业发展状况,及时做出更好的调整。电商大数据主要包括两块内容:电商经营主体的基本信息和电商经营主体的交易信息。这些数据分布在各大主流电商网站上,其内容错综复杂,结构各异,而且随着时间推移和技术的发展,内容和结构也在推陈出新。
3.数据采集作为大数据领域的一个关键技术,为大数据分析提供了重要的数据支持,从而为传统的数据分析方法注入了新的活力。它通过网络爬虫的方式,在短时间内能获取到大量的目标数据,且对数据经过一定的处理后,数据变得层次分明。


技术实现要素:

4.有鉴于此,本发明提供了一种基于互联网的电子商务数据挖掘系统,其包括:
5.产品管理终端、建模服务器、预测服务器和数据库,其中,产品管理终端分别与建模服务器和预测服务器具有通信连接,数据库分别与建模服务器和预测服务器具有通信连接。
6.建模服务器包括:数据采集单元、信息离散单元、属性选择单元和标准验证单元,其中各单元间具有通信连接。
7.产品管理终端发送目标产品的产品管理请求到建模服务器,建模服务器的数据采集单元从数据库获取建模客户信息包;
8.建模服务器的信息离散单元根据客户属性列表对建模客户信息包进行离散化处理以生成建模客户属性包;
9.建模服务器的属性选择单元根据建模客户属性包生成联合客户属性包,联合客户属性包中包括客户属性列表中所有客户属性的联合属性映射表;
10.建模服务器的属性选择单元获取联合客户属性包中每个联合属性映射表的每个客户属性值的属性特征,并根据每个联合属性映射表的每个客户属性值的属性特征计算每个客户属性的联合度;
11.建模服务器的属性选择单元将每个客户属性的联合度与联合度阈值进行比较,删除联合度小于联合度阈值的客户属性;将联合度大于联合度阈值的客户属性作为标准客户属性,根据所有标准客户属性得到标准客户属性列表;
12.建模服务器的标准验证单元根据标准客户属性列表对每个建模客户的客户属性映射表进行标准验证,并删除没有通过标准验证的客户属性映射表以生成标准建模客户属
性包;
13.预测服务器根据标准建模客户属性包对目标产品进行销量预测以得到目标产品的预测销量,产品管理员根据接收到的预测销量调整目标产品的产品采购量。
14.根据一个优选实施方式,所述客户信息包括:客户年龄、客户性别、客户住址、客户学历、婚姻状况、生子状况、家庭收入和个人收入;所述客户属性包括:年龄属性、性别属性、住址属性、学历属性、婚姻属性和收入属性;产品管理终端为产品管理员使用的具有通信功能和数据传输功能的设备,其包括:智能手机、笔记本电脑、平板电脑和台式电脑。
15.根据一个优选实施方式,建模服务器的信息离散单元根据客户属性列表对建模客户信息包进行离散化处理以生成建模客户属性包包括:
16.信息离散单元根据客户属性列表对建模客户信息包中的每个客户信息进行离散化处理以得到每个建模客户的每个客户属性的客户属性值;所述建模客户信息包中包含了若干个建模客户的客户信息,每个客户信息对应一个建模客户;
17.信息离散单元根据每个建模客户的每个客户属性的客户属性值得到每个建模客户的客户属性映射表;所述客户属性映射表包括同一个建模客户的所有客户属性的客户属性值,每个建模客户对应一个客户属性映射表;
18.信息离散单元根据所有建模客户的客户属性映射表生成建模客户属性包,建模客户属性包包含若干个建模客户的客户属性映射表。
19.根据一个优选实施方式,建模服务器的属性选择单元根据建模客户属性包生成联合客户属性包包括:
20.属性选择单元遍历客户属性列表中的每个客户属性,并将正在遍历的客户属性作为目标客户属性,获取建模客户属性包中每个建模客户的目标客户属性的客户属性值;
21.属性选择单元根据建模客户属性包中每个建模客户的目标客户属性的客户属性值生成目标客户属性的联合属性映射表;所述联合属性映射表包括同一个客户属性在不同建模客户的客户属性值,每个联合属性映射表对应一个客户属性;
22.属性选择单元根据客户属性列表中每个客户属性的联合属性映射表得到联合客户属性包,联合客户属性包中包括客户属性列表中所有客户属性的联合属性映射表。
23.根据一个优选实施方式,预测服务器根据标准建模客户属性包对目标产品进行销量预测以得到目标产品的预测销量包括:
24.预测服务器根据标准建模客户属性包和标准建模客户属性包中每个标准建模客户的销售属性建立目标产品的销量预测模型;所述标准建模客户属性包中包括若干个标准建模客户的客户属性映射表;所述标准建模客户为通过标准验证的客户属性映射表对应的建模客户;
25.预测服务器从数据库获取所有预测客户的客户信息,根据目标产品的销量预测模型和所有预测客户的客户信息得到目标产品的预测销量,并将目标产品的预测销量发送给相应的产品管理终端。
26.根据一个优选实施方式,建模服务器的标准验证单元根据标准客户属性列表对客户属性映射表进行标准验证包括:
27.标准验证单元遍历标准客户属性表中的每个标准客户属性,将正在遍历的标准客户属性作为目标标准客户属性,并将目标标准客户属性与客户属性映射表中的每个客户属
性进行对比以判断客户属性映射表中是否包含目标标准客户属性;重复以上步骤直到将标准客户属性表遍历完成;
28.若客户属性映射表包含标准客户属性表中的所有标准客户属性,则客户属性映射表通过标准验证;若客户属性映射表不包含标准客户属性表中的所有标准客户属性,则客户属性映射表不通过标准验证;所述客户属性映射表包括若干个客户属性映射项,客户属性映射项表示客户属性与客户属性值的映射关系。
29.根据一个优选实施方式,预测服务器根据标准建模客户属性包和标准建模客户的销售属性建立目标产品的销量预测模型包括:
30.预测服务器根据标准客户属性列表删除每个标准建模客户的客户属性映射表中除标准客户属性外的其它客户属性以得到每个标准建模客户的标准客户属性映射表;
31.预测服务器从数据库获取目标产品与每个标准客户属性的属性相关度;所述属性相关性为标准客户属性对目标产品销量的影响程度;
32.预测服务器根据每个标准客户属性的属性相关度得到每个标准客户属性的属性关键度,并按照属性关键度将标准客户属性进行排序;所述属性关键度为标准客户属性对目标产品销量的重要程度,属性相关性越高相应标准客户属性对目标产品的销量的影响越大;
33.预测服务器根据每个标准建模客户的销售属性和标准客户属性映射表得到每个标准客户属性的属性调整系数,并根据每个标准客户属性的属性调整系数和每个标准客户属性的属性关键度建立目标产品的销量预测模型。
34.根据一个优选实施方式,联合度的计算公式为:
[0035][0036]
其中,ck为客户属性列表中第k个客户属性的联合度,i和j为客户属性的索引,n为建模客户的数量,为第i个建模客户的第k个客户属性的客户属性值,为第j个建模客户的第k个客户属性的客户属性值。
[0037]
本发明具有以下有益效果:本发明通过对客户属性数据与其业务进行关联,对客户的消费行为进行分析,对目标产品的产品销量进行精准预测,为产品采购提供依据。此外,本发明借助数据挖掘技术,可以让平台更具有竞争性,从而获取商业价值。
附图说明
[0038]
图1为一示例性实施例提供的基于互联网的电子商务数据挖掘系统的结构框图。
具体实施方式
[0039]
为了更清楚地说明本文实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本文的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
这些附图获得其他的附图。
[0040]
下面将结合本文实施例中的附图,对本文实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本文一部分实施例,而不是全部的实施例。基于本文中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文保护的范围。
[0041]
参见图1,在一个实施例中,基于互联网的电子商务数据挖掘方法系统可以包括:产品管理终端、建模服务器、预测服务器和数据库,其中,产品管理终端分别与建模服务器和预测服务器具有通信连接,数据库分别与建模服务器和预测服务器具有通信连接。
[0042]
建模服务器包括:数据采集单元、信息离散单元、属性选择单元和标准验证单元,其中各单元间具有通信连接。
[0043]
产品管理终端发送目标产品的产品管理请求到建模服务器,建模服务器的数据采集单元从数据库获取建模客户信息包;
[0044]
建模服务器的信息离散单元根据客户属性列表对建模客户信息包进行离散化处理以生成建模客户属性包;
[0045]
建模服务器的属性选择单元根据建模客户属性包生成联合客户属性包,联合客户属性包中包括客户属性列表中所有客户属性的联合属性映射表;
[0046]
建模服务器的属性选择单元获取联合客户属性包中每个联合属性映射表的每个客户属性值的属性特征,并根据每个联合属性映射表的每个客户属性值的属性特征计算每个客户属性的联合度;
[0047]
建模服务器的属性选择单元将每个客户属性的联合度与联合度阈值进行比较,删除联合度小于联合度阈值的客户属性;将联合度大于联合度阈值的客户属性作为标准客户属性,根据所有标准客户属性得到标准客户属性列表;
[0048]
建模服务器的标准验证单元根据标准客户属性列表对每个建模客户的客户属性映射表进行标准验证,并删除没有通过标准验证的客户属性映射表以生成标准建模客户属性包;
[0049]
预测服务器根据标准建模客户属性包对目标产品进行销量预测以得到目标产品的预测销量,产品管理员根据接收到的预测销量调整目标产品的产品采购量。
[0050]
本发明通过对客户属性数据与其业务进行关联,对客户的消费行为进行分析,对目标产品的产品销量进行精准预测,为产品采购提供依据。此外,本发明借助数据挖掘技术,可以让平台更具有竞争性,从而获取商业价值。
[0051]
本发明通过对建模客户的客户信息进行分析以得到目标产品的销量预测模型,并根据预测客户的客户信息和目标产品的销量预测模型对目标产品的产品销量进行精准预测,为产品采购提供依据,减少由于产品采购量高于产品销售量而导致的产品积压的情况,也减少由于产品采购量小于产品销售量导致产品断货的情况。
[0052]
为了便于理解,下面对本发明的工作方法和原理进行具体说明。
[0053]
具体的,在一个实施例中,基于互联网的电子商务数据挖掘方法可以包括:
[0054]
s1、产品管理终端发送目标产品的产品管理请求到建模服务器,建模服务器的数据采集单元从数据库获取建模客户信息包;建模服务器的信息离散单元根据客户属性列表对建模客户信息包进行离散化处理以生成建模客户属性包。
[0055]
可选地,产品管理终端为产品管理员使用的具有通信功能和数据传输功能的设备,其包括:智能手机、笔记本电脑、平板电脑和台式电脑。
[0056]
在一个实施例中,建模服务器的数据采集单元从数据库获取若干个建模客户的客户信息以得到建模客户信息包,建模客户信息包中包含了若干个建模客户的客户信息,每个客户信息对应一个建模客户。客户信息包括:客户年龄、客户性别、客户住址、客户学历、婚姻状况、生子状况、家庭收入和个人收入。建模客户为预先挑选出的用于建立销量预测模型的客户。
[0057]
客户属性列表包括若干个客户属性,客户属性包括:年龄属性、性别属性、住址属性、学历属性、婚姻属性和收入属性。客户属性值用于量化或识别相应客户属性,例如,婚姻属性中在婚姻属性值为1时表示客户已婚,在婚姻属性值为0时表示客户未婚。客户属性映射表包括若干个客户属性映射项,客户属性映射项表示客户属性与客户属性值的映射关系。
[0058]
在一个实施例中,建模服务器的信息离散单元根据客户属性列表对建模客户信息包进行离散化处理以生成建模客户属性包包括:
[0059]
信息离散单元根据客户属性列表对建模客户信息包中的每个客户信息进行离散化处理以得到每个建模客户的每个客户属性的客户属性值;所述建模客户信息包中包含了若干个建模客户的客户信息,每个客户信息对应一个建模客户;
[0060]
信息离散单元根据每个建模客户的每个客户属性的客户属性值得到每个建模客户的客户属性映射表;所述客户属性映射表包括同一个建模客户的所有客户属性的客户属性值,每个建模客户对应一个客户属性映射表;
[0061]
信息离散单元根据所有建模客户的客户属性映射表生成建模客户属性包,建模客户属性包包含若干个建模客户的客户属性映射表。
[0062]
s2、建模服务器的属性选择单元根据建模客户属性包生成联合客户属性包,建模服务器的属性选择单元获取联合客户属性包中每个联合属性映射表的每个客户属性值的属性特征,并根据每个联合属性映射表的每个客户属性值的属性特征计算每个客户属性的联合度。
[0063]
在一个实施例中,建模服务器的属性选择单元根据建模客户属性包生成联合客户属性包包括:
[0064]
属性选择单元遍历客户属性列表中的每个客户属性,并将正在遍历的客户属性作为目标客户属性,获取建模客户属性包中每个建模客户的目标客户属性的客户属性值;
[0065]
属性选择单元根据建模客户属性包中每个建模客户的目标客户属性的客户属性值生成目标客户属性的联合属性映射表;所述联合属性映射表包括同一个客户属性在不同建模客户的客户属性值,每个联合属性映射表对应一个客户属性;
[0066]
属性选择单元根据客户属性列表中每个客户属性的联合属性映射表得到联合客户属性包,联合客户属性包中包括客户属性列表中所有客户属性的联合属性映射表。
[0067]
可选地,联合客户属性包中包括客户属性列表中所有客户属性的联合属性映射表。联合属性映射表包括同一个客户属性在不同建模客户的客户属性值,每个联合属性映射表对应一个客户属性。客户属性的联合度用于指示客户属性是否具有差异性,联合度越低表示不同的建模客户在该客户属性上越不具有差异性,该客户属性对于建立销量预测模
型的作用越小。联合度阈值根据实际情况预先进行设置。
[0068]
标准客户属性为联合度大于联合度阈值的客户属性,即,标准客户属性为在不同建模客户上表现的差异性大,对建立销量预测模型的作用大的客户属性。标准客户属性列表包括所有的标准客户属性。
[0069]
在一个实施例中,联合度的计算公式为:
[0070][0071]
其中,ck为客户属性列表中第k个客户属性的联合度,i和j为客户属性的索引,n为建模客户的数量,为第i个建模客户的第k个客户属性的客户属性值,为第j个建模客户的第k个客户属性的客户属性值。
[0072]
s3、建模服务器的属性选择单元将每个客户属性的联合度与联合度阈值进行比较,删除联合度小于联合度阈值的客户属性;将联合度大于联合度阈值的客户属性作为标准客户属性,根据所有标准客户属性得到标准客户属性列表。
[0073]
s4、建模服务器的标准验证单元根据标准客户属性列表对每个建模客户的客户属性映射表进行标准验证,并删除没有通过标准验证的客户属性映射表以生成标准建模客户属性包。
[0074]
可选地,标准建模客户属性包中包括若干个标准建模客户的客户属性映射表。标准建模客户为通过标准验证的客户属性映射表对应的建模客户。
[0075]
在一个实施例中,建模服务器的标准验证单元根据标准客户属性列表对客户属性映射表进行标准验证包括:
[0076]
标准验证单元遍历标准客户属性表中的每个标准客户属性,将正在遍历的标准客户属性作为目标标准客户属性,并将目标标准客户属性与客户属性映射表中的每个客户属性进行对比以判断客户属性映射表中是否包含目标标准客户属性;重复以上步骤直到将标准客户属性表遍历完成;
[0077]
若客户属性映射表包含标准客户属性表中的所有标准客户属性,则客户属性映射表通过标准验证;若客户属性映射表不包含标准客户属性表中的所有标准客户属性,则客户属性映射表不通过标准验证;所述客户属性映射表包括若干个客户属性映射项,客户属性映射项表示客户属性与客户属性值的映射关系。
[0078]
s5、预测服务器根据标准建模客户属性包对目标产品进行销量预测以得到目标产品的预测销量,产品管理员根据接收到的预测销量调整目标产品的产品采购量。
[0079]
在一个实施例中,预测服务器根据标准建模客户属性包对目标产品进行销量预测以得到目标产品的预测销量包括:
[0080]
预测服务器根据标准建模客户属性包和标准建模客户属性包中每个标准建模客户的销售属性建立目标产品的销量预测模型;所述标准建模客户属性包中包括若干个标准建模客户的客户属性映射表;所述标准建模客户为通过标准验证的客户属性映射表对应的建模客户;
[0081]
预测服务器从数据库获取所有预测客户的客户信息,根据目标产品的销量预测模型和所有预测客户的客户信息得到目标产品的预测销量,并将目标产品的预测销量发送给相应的产品管理终端。
[0082]
具体地,预测服务器根据标准建模客户属性包和标准建模客户的销售属性建立目标产品的销量预测模型包括:
[0083]
预测服务器根据标准客户属性列表删除每个标准建模客户的客户属性映射表中除标准客户属性外的其它客户属性以得到每个标准建模客户的标准客户属性映射表;
[0084]
预测服务器从数据库获取目标产品与每个标准客户属性的属性相关度;所述属性相关性为标准客户属性对目标产品销量的影响程度;
[0085]
预测服务器根据每个标准客户属性的属性相关度得到每个标准客户属性的属性关键度,并按照属性关键度将标准客户属性进行排序;所述属性关键度为标准客户属性对目标产品销量的重要程度;例如:在目标产品为电脑时,住址属性对电脑销量没有影响,在目标产品为羽绒服时住址属性对羽绒服销量有影响。
[0086]
预测服务器根据每个标准建模客户的销售属性和标准客户属性映射表得到每个标准客户属性的属性调整系数,并根据每个标准客户属性的属性调整系数和每个标准客户属性的属性关键度建立目标产品的销量预测模型。
[0087]
在一个实施例中,将所有的预测客户的客户信息进行离散化以得到所有预测客户的标准客户属性的客户属性值,并将所有预测客户的所有标准客户属性的属性值输入目标产品的销量预测模型以得到目标产品的预测销量。
[0088]
可选地,销售属性的属性值包括0和1,属性值为0时表示相应标准建模客户没有购买目标产品,属性值为1时表示相应标准建模客户购买了目标产品。预测客户为预先挑选出的用于根据销量预测模型预测产品销量的客户。
[0089]
在本文所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
[0090]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。
[0091]
另外,在本文各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0092]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本文的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设
备(可以是个人计算机,服务器,或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0093]
本文中应用了具体实施例对本文的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本文的方法及其核心思想;同时,对于本领域的一般技术人员,依据本文的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本文的限制。
[0094]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本文的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1