基于数据挖掘的用户行为分析方法、系统、设备及介质与流程

文档序号:30305594发布日期:2022-06-05 05:16阅读:142来源:国知局
基于数据挖掘的用户行为分析方法、系统、设备及介质与流程

1.本发明涉及数据处理技术领域,尤其涉及一种基于数据挖掘的用户行为分析方法、系统、设备及介质。


背景技术:

2.在互联网领域,随着产品及活动的不断丰富,产品之间、活动之间以及产品和活动之间的交叉愈发频繁且复杂,容易产生一些漏洞,存在恶意用户趁机抓住漏洞并趁机获利,并由此形成一个黑色产业链。这部分人和行为严重损害产品的正常体验和活动最终取得的实际效果,一直给公司造成巨大损失。因此如何快速发现现有的漏洞以及背后的恶意用户,对日常运营至关重要。
3.目前的恶意刷单用户识别的主要方法是每日人工抽查、ip聚集或设备聚集等简单强规则,这些方法都存在一定缺陷。人工识别虽然准确率较高,但是效率低下,同时人工识别存在一定的主观性,即不同人之间的判别标准不一致,容易造成用户体验的下降。基于规则的识别,简单规则可以覆盖大部分业务场景,但是准确率不高,容易误杀正常用户,损害用户正常体验;复杂规则要求对特定业务有较强的理解,并且难以覆盖大部分业务场景。同时规则容易被专业化恶意群体发现,然后通过针对性的改变行为模式例如频繁变更ip或常用设备等,即可快速逃过规则的识别封杀。


技术实现要素:

4.针对现有技术中的问题,本发明的目的在于提供一种基于数据挖掘的用户行为分析方法、系统、设备及介质,基于数据挖掘快速分析用户行为,实现恶意用户的快速和准确识别。
5.本发明实施例提供一种基于数据挖掘的用户行为分析方法,包括如下步骤:
6.获取用户的待预测访问数据,所述待预测访问数据包括用户访问的页面和访问页面的顺序;
7.根据所述待预测访问数据和各个页面的嵌入向量,得到待预测序列向量;
8.将所述待预测序列向量输入训练好的编码器,得到待预测编码向量;
9.将所述待预测编码向量输入分类器,获取所述分类器输出的分类结果。
10.在一些实施例中,根据所述待预测访问数据和各个页面的嵌入向量,得到待预测序列向量,包括如下步骤:
11.将所述待预测访问数据划分为用户的至少一次访问;
12.对于每次访问,确定用户访问的页面和访问页面的顺序;
13.对于每次访问,将该次访问的页面的嵌入向量按照访问页面的顺序进行拼接,得到一个访问序列;
14.将所述至少一次访问所对应的访问序列进行组合,得到待预测序列向量。
15.在一些实施例中,所述待预测访问数据还包括辅助分类数据;
16.将所述待预测序列向量输入训练好的编码器,得到待预测编码向量,包括如下步骤:
17.将所述待预测序列向量输入训练好的编码器,得到所述编码器的输出向量;
18.根据所述辅助分类数据,基于预设的辅助向量生成规则,得到辅助特征向量;
19.将所述编码器的输出向量与所述辅助特征向量进行拼接,将拼接后的向量作为待预测编码向量。
20.在一些实施例中,所述辅助分类数据包括用户的业务场景类型、访问时长、每个页面的停留时长和个人信息数据中的至少一种。
21.在一些实施例中,还包括如下步骤:
22.获取预设时间范围内的所有页面的被访问数据;
23.根据所有页面的被访问数据,构建包括所有页面的关系网络;
24.根据所述关系网络,基于图嵌入方法,生成各个页面节点的嵌入向量。
25.在一些实施例中,所述根据所有页面的被访问数据,构建包括所有页面的关系网络,包括如下步骤:
26.将各个页面分别作为一个节点;
27.在具有跳转关系的两个节点之间添加连接线;
28.对于中间具有连接线的两个节点,根据预设时间范围内从第一节点跳转到第二节点的次数和从第一节点跳出的总次数,计算该连接线的权重值。
29.在一些实施例中,还包括如下步骤:
30.采集用户的样本访问数据,所述样本访问数据包括用户访问的页面和访问页面的顺序;
31.根据所述样本访问数据和各个页面的嵌入向量,得到样本序列向量,为样本序列向量添加样本标签;
32.基于所述样本序列向量训练编码器,并保存训练好的编码器;
33.将所述样本序列向量输入训练好的编码器中,得到样本编码向量;
34.基于所述样本编码向量和对应的样本标签,训练分类器。
35.在一些实施例中,将所述样本序列向量输入训练好的编码器中,得到样本编码向量,包括如下步骤:
36.将所述样本序列向量输入训练好的编码器中,得到所述编码器的输出向量;
37.从所述样本访问数据中提取样本辅助分类数据;
38.根据所述样本辅助分类数据,基于预设的辅助向量生成规则,得到样本辅助特征向量;
39.将所述编码器的输出向量与所述样本辅助特征向量进行拼接,将拼接后的向量作为样本编码向量。
40.在一些实施例中,所述样本序列向量包括多个访问序列,每个访问序列对应于一次访问;
41.根据所述样本访问数据和各个页面的嵌入向量,得到样本序列向量之后,还包括如下步骤:
42.随机从一个或多个样本序列向量中抽取一个或多个序列;
43.将抽取的序列进行随机组合,得到新的序列向量,添加至样本序列向量中。
44.在一些实施例中,所述编码器采用基于注意力机制的多层双向lstm模型;和/或,所述分类器为多层深度神经网络,且所述多层深度神经网络包括残差模块。
45.本发明实施例还提供一种基于数据挖掘的用户行为分析系统,用于实现所述的基于数据挖掘的用户行为分析方法,所述系统包括:
46.数据采集模块,用于获取用户的待预测访问数据,所述待预测访问数据包括用户访问的页面和访问页面的顺序;
47.向量获取模块,用于根据所述待预测访问数据和各个页面的嵌入向量,得到待预测序列向量;
48.向量编码模块,用于将所述待预测序列向量输入训练好的编码器,得到待预测编码向量;
49.行为分析模块,用于将所述待预测编码向量输入分类器,获取所述分类器输出的分类结果。
50.本发明实施例还提供一种基于数据挖掘的用户行为分析设备,包括:
51.处理器;
52.存储器,其中存储有所述处理器的可执行指令;
53.其中,所述处理器配置为经由执行所述可执行指令来执行所述的基于数据挖掘的用户行为分析方法的步骤。
54.本发明实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现所述的基于数据挖掘的用户行为分析方法的步骤。
55.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
56.本发明的基于数据挖掘的用户行为分析方法、系统、设备及介质具有如下有益效果:
57.本发明通过对用户在最近一天或最近其他时间段内对各个页面的访问数据的分析,以用户每日访问行为作为切入点,通过搭建包括编码器和分类器的机器学习模型来直接判断用户的访问数据所对应的行为是否为恶意行为,也可以作为初筛然后辅助人工识别,进一步提升判断精度。相比于传统的基于规则从ip或者设备号切入的方法,在保证较高准确率的同时能更加灵活快速地学习恶意用户的新行为从而调整应对策略,使得恶意用户很难通过改变行为绕过检测。该方法可以应用于在线旅游(online travel agency,ota)领域,对在线旅游app或网站的用户访问数据进行分析,有效地筛选恶意用户行为,如恶意刷单等。该方法也可以应用于其他领域,例如购物平台等。
附图说明
58.通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
59.图1是本发明一实施例的基于数据挖掘的用户行为分析方法的流程图;
60.图2是本发明一实施例的用户行为分析网络的结构示意图;
61.图3是本发明一实施例的编码器的结构示意图;
62.图4是本发明一实施例的分类器的结构示意图;
63.图5是本发明一实施例的预先获取各个页面的嵌入向量的流程图;
64.图6是本发明一实施例的编码器和分类器的训练流程图;
65.图7是本发明一实施例的得到待预测序列向量的流程图;
66.图8是本发明一实施例的得到待预测编码向量的流程图;
67.图9是本发明一实施例的基于数据挖掘的用户行为分析系统的结构示意图;
68.图10是本发明一实施例的基于数据挖掘的用户行为分析设备的结构示意图;
69.图11是本发明一实施例的计算机可读存储介质的结构示意图。
具体实施方式
70.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
71.此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
72.附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此,实际执行的顺序有可能根据实际情况改变。
73.如图1所示,本发明实施例提供一种基于数据挖掘的用户行为分析方法,包括如下步骤:
74.s210:获取用户的待预测访问数据,所述待预测访问数据包括用户访问的页面和访问页面的顺序;
75.该待预测访问数据可以是用户在最近一天内对各个页面的访问数据,用户在一天内可以有多次访问,该访问数据包括了用户每次访问中访问的页面和访问页面的顺序;在其他实施方式中,该待预测访问数据例如可以是用户在最近三天内的访问数据,或者用户在一周内的访问数据等,该时间范围可以根据需要设定;
76.s220:根据所述待预测访问数据和各个页面的嵌入向量,得到待预测序列向量;
77.s230:将所述待预测序列向量输入训练好的编码器,得到待预测编码向量;
78.s240:将所述待预测编码向量输入分类器,获取所述分类器输出的分类结果。所述分类器输出的分类结果例如可以包括该用户的待预测访问数据属于恶意用户的概率。
79.本发明的用户行为分析方法中,通过对用户在最近一天或最近其他时间段内对各个页面的访问数据的分析,以用户每日访问行为作为切入点,通过搭建包括编码器和分类器的机器学习模型来直接判断用户的访问数据所对应的行为是否为恶意行为,也可以作为初筛然后辅助人工识别,进一步提升判断精度。相比于传统的基于规则从ip或者设备号切入的方法,在保证较高准确率的同时能更加灵活快速地学习恶意用户的新行为从而调整应
对策略,使得恶意用户很难通过改变行为绕过检测。
80.如图2和图3所示,在该实施例中,所述编码器采用基于注意力机制(attention)的多层双向lstm(long short-term memory,长短期记忆)模型。采用简单的全连接层计算注意力机制,即将lstm模型计算过程中的所有隐藏状态(hidden state)输入全连接层计算权重,然后将各个隐藏状态根据对应权重加权平均后作为输入行为序列的编码。为了能够处理变长的用户访问序列,对访问序列做了填充(padding),即对不足预设长度的行为进行填充,对超过预定长度的行为进行分割,同时在注意力机制计算时剔除填充位置的影响。
81.如图2和图4所示,所述分类器为多层深度神经网络(dnn,deep neural networks),且所述多层深度神经网络包括残差模块(res block)。
82.如图2和5所示,在该实施例中,所述基于数据挖掘的用户行为分析方法还包括预先获取各个页面的嵌入向量的步骤,基于所有用户的访问行为,构建访问节点之间的关系网络(graph),基于关系网络训练node2vec模型,可以获取对于每个节点的嵌入向量,具体地,包括如下步骤:
83.s110:获取预设时间范围内的所有页面的被访问数据,例如可以从页面跳转网络获取到所有用户的页面访问数据;
84.s120:根据所有页面的被访问数据,构建包括所有页面的关系网络;
85.s130:根据所述关系网络,基于图嵌入方法,生成各个页面节点的嵌入向量。
86.如图5所示,在该实施例中,所述步骤s120:根据所有页面的被访问数据,构建包括所有页面的关系网络,包括如下步骤:
87.s121:将各个页面分别作为一个节点(node);
88.s122:在具有跳转关系的两个节点之间添加连接线;
89.例如,单个用户从页面a跳转到页面b,则有两个节点分别代表页面a和b,同时在a和b之间有一条连接(link),a和b之间的连接可以是有向的,也可以是无向的;
90.s123:对于中间具有连接线的两个节点,根据预设时间范围内从第一节点跳转到第二节点的次数和从第一节点跳出的总次数,计算该连接线的权重值。例如,对于中间具有两个连接线的节点a(页面a)和节点b(页面b),权重的计算采用过去7日页面a到页面b的跳转次数除以页面a的总出度(out-degree),即(a

b)/a
out degree
作为权重。python实现通过networkx模块构建网络。
91.在其他实施方式中,两个节点之间的权重也可以结合具体场景采用其他的计算方法,或者也可以不设置权重。
92.在该实施例中,所述步骤s130中,采用的图嵌入方法为node2vec图嵌入方法,简单实现通过在构建好的图网络(graph)上进行有偏(biased)的随机游走(random walk),生成定长的随机序列,再通过传统字嵌入(word embedding)方法word2vec计算每个页面的嵌入向量。python实现主要通过pytorch模块中的node2vec类实现。除开预先计算的嵌入向量,在预训练编码器的过程中会有新的嵌入向量随模型一起学习后加到预先计算的嵌入向量,因此预先计算的嵌入向量可以看做最终得到的嵌入向量的初始化。
93.如图6所示,在该实施例中,所述用户行为分析方法还包括编码器和分类器的训练步骤,具体地,包括如下步骤:
94.s140:采集用户的样本访问数据,所述样本访问数据包括用户访问的页面和访问
页面的顺序;
95.s150:根据所述样本访问数据和各个页面的嵌入向量,得到样本序列向量,为样本序列向量添加样本标签;具体地,按照识别规则打标,例如包含正样本即为正其余为负,构建样本标签;
96.s160:基于所述样本序列向量训练编码器,并保存训练好的编码器;
97.如上所述,所述编码器采用3层双向lstm模型结合attention机制,同时对于多条序列采取分层(hierarchical attention)抽取,模型结构如图3所示,其中sequence embedding即为序列向量,attention layer是注意力层,hidden state是隐藏状态,lstm cell是lstm单元,seq emb1~4是各个序列的向量;
98.s170:将所述样本序列向量输入训练好的编码器中,得到样本编码向量;
99.s180:基于所述样本编码向量和对应的样本标签,训练分类器,保存训练好的分类器,用于后续对真实用户的待预测行为数据进行分类。
100.该分类器在训练时,分类器对样本编码向量进行分类,得到的分类结果为该样本编码向量属于恶意用户行为的概率,其样本标签标识该样本编码向量属于恶意用户行为还是非恶意用户行为,根据分类器的分类结果和样本标签可以计算得到损失函数值,基于损失函数值反向优化分类器,训练至损失函数值小于预设阈值为止,训练完成。
101.在该实施例中,所述步骤s170:将所述样本序列向量输入训练好的编码器中,得到样本编码向量,包括如下步骤:
102.将所述样本序列向量输入训练好的编码器中,得到所述编码器的输出向量;
103.从所述样本访问数据中提取样本辅助分类数据,所述辅助分类数据包括用户的业务场景类型、访问时长、每个页面的停留时长和个人信息数据中的至少一种;
104.根据所述样本辅助分类数据,基于预设的辅助向量生成规则,得到样本辅助特征向量,辅助特征例如可以包括用户的业务场景类型、访问时长、各个页面的停留时长、用户名、用户年龄、用户地区等;
105.将所述编码器的输出向量与所述样本辅助特征向量进行拼接,将拼接后的向量作为样本编码向量。
106.在该实施例中,所述样本序列向量包括多个访问序列,每个访问序列对应于一次访问。所述步骤s150:根据所述样本访问数据和各个页面的嵌入向量,得到样本序列向量之后,还包括如下步骤:
107.随机从一个或多个样本序列向量中抽取一个或多个序列;
108.将抽取的序列进行随机组合,得到新的序列向量,添加至样本序列向量中。
109.因此,在该实施例中,随机组合构建增强样本一方面可以解决样本量不够的情况,另一方面可以减少错误标注的数据的影响,具体采用的构建方法如下:
110.(1)随机一个序列数n~uniform(1,5)
111.(2)随机一个正样本序列数nd~uniform(1,n)
112.(3)随机抽取nd条正样本序列,n-nd条负样本序列
113.(4)将抽取的序列打散顺序组合
114.(5)如果nd》0,则为正样本,否则为负样本
115.例如,随机一个序列数n为4,随机一个正样本序列数nd为3,随机抽取3条正样本序
列,1条负样本序列,将抽取的序列打散顺序组合。由于存在正样本的序列,则整个组合的向量为正样本。此处正样本指的是恶意用户的样本,负样本指的是非恶意用户的样本。
116.因此,本发明的用户行为分析方法,可以实现恶意用户行为挖掘,通过深度学习模型框架,基于少量的标注数据,就能快速总结特定活动恶意刷单用户的行为模式并能复制推广到所有用户中,识别尚未被发现的恶意用户,并能对现有用户的行为进行监控,同时经过简单调整也能快速推广到其他活动。具体地,本发明采用半监督(semi-supervise)的方法能够减少对样本量的需求,实施数据增强能够减少错误标注对模型的影响,增强模型的鲁棒性,兼容不同长度多种类的用户访问行为,支持多种类的下游任务。
117.如图7所示,在该实施例中,所述步骤s220:根据所述待预测访问数据和各个页面的嵌入向量,得到待预测序列向量,包括如下步骤:
118.s221:将所述待预测访问数据划分为用户的至少一次访问;
119.s222:对于每次访问,确定用户访问的页面和访问页面的顺序;
120.s223:对于每次访问,将该次访问的页面的嵌入向量按照访问页面的顺序进行拼接,得到一个访问序列;该页面的嵌入向量即通过前述的图嵌入方法得到的各个页面的嵌入向量;
121.例如,一个用户一天n次访问经过的页面,其访问序列包括:
122.序列1:[页面a-》页面b-》
…‑
》页面b]=》
[0123]
序列2:[页面a-》页面c-》
…‑
》页面d]=》

=》
[0124]
序列n:[页面a-》页面c-》
…‑
》页面d]
[0125]
s224:将所述至少一次访问所对应的访问序列进行组合,得到待预测序列向量。
[0126]
如图8所示,在该实施例中,所述待预测访问数据还包括辅助分类数据,在该实施例中,所述辅助分类数据包括用户的业务场景类型、访问时长、每个页面的停留时长和个人信息数据中的至少一种。所述步骤s230:将所述待预测序列向量输入训练好的编码器,得到待预测编码向量,包括如下步骤:
[0127]
s231:将所述待预测序列向量输入训练好的编码器,得到所述编码器的输出向量,所述编码器采用基于注意力机制的多层双向lstm模型,例如采用如图3所示的结构;
[0128]
s232:根据所述辅助分类数据,基于预设的辅助向量生成规则,得到辅助特征向量,辅助特征例如可以包括用户的业务场景类型、访问时长、各个页面的停留时长、用户名、用户年龄、用户地区等;
[0129]
此处预设的辅助向量生成规则例如可以包括对用户的业务场景类型的识别规则和各个业务场景类型对应的特征值、访问时长的统计方法、时长的特征表示规则、用户名的特征表示规则、年龄的特征表示规则、各个地区对应的特征值等;
[0130]
s233:将所述编码器的输出向量与所述辅助特征向量进行拼接,将拼接后的向量作为待预测编码向量。
[0131]
如图9所示,本发明实施例还提供一种基于数据挖掘的用户行为分析系统,用于实现所述的基于数据挖掘的用户行为分析方法,所述系统包括:
[0132]
数据采集模块m100,用于获取用户的待预测访问数据,所述待预测访问数据包括用户访问的页面和访问页面的顺序;
[0133]
向量获取模块m200,用于根据所述待预测访问数据和各个页面的嵌入向量,得到
待预测序列向量;
[0134]
向量编码模块m300,用于将所述待预测序列向量输入训练好的编码器,得到待预测编码向量;
[0135]
行为分析模块m400,用于将所述待预测编码向量输入分类器,获取所述分类器输出的分类结果。
[0136]
本发明的用户行为分析系统中,通过对用户在最近一天或最近其他时间段内对各个页面的访问数据的分析,以用户每日访问行为作为切入点,通过搭建包括编码器和分类器的机器学习模型来直接判断用户的访问数据所对应的行为是否为恶意行为,也可以作为初筛然后辅助人工识别,进一步提升判断精度。相比于传统的基于规则从ip或者设备号切入的方法,在保证较高准确率的同时能更加灵活快速地学习恶意用户的新行为从而调整应对策略,使得恶意用户很难通过改变行为绕过检测。
[0137]
在该实施例中,所述基于数据挖掘的用户行为分析系统还包括页面向量获取模块,用于获取各个页面的嵌入向量。具体地,所述页面向量获取模块用于获取预设时间范围内的所有页面的被访问数据,例如可以从页面跳转网络获取到所有用户的页面访问数据;根据所有页面的被访问数据,构建包括所有页面的关系网络;以及根据所述关系网络,基于图嵌入方法,生成各个页面节点的嵌入向量。关系网络(graph)的构建方法可以采用上述的步骤s121-s123的步骤。
[0138]
在该实施例中,所述用户行为分析系统还包括模型训练模块,用于训练所述编码器和所述分类器。具体地,所述模型训练模块用于采集用户的样本访问数据,所述样本访问数据包括用户访问的页面和访问页面的顺序;根据所述样本访问数据和各个页面的嵌入向量,得到样本序列向量,为样本序列向量添加样本标签;具体地,按照识别规则打标,例如包含正样本即为正其余为负,构建样本标签;基于所述样本序列向量训练编码器,并保存训练好的编码器;将所述样本序列向量输入训练好的编码器中,得到样本编码向量;以及基于所述样本编码向量和对应的样本标签,训练分类器。
[0139]
本发明实施例还提供一种基于数据挖掘的用户行为分析设备,包括处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行所述的基于数据挖掘的用户行为分析方法的步骤。
[0140]
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
[0141]
下面参照图10来描述根据本发明的这种实施方式的电子设备600。图10显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0142]
如图10所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
[0143]
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述基于数据挖掘的用户行为分析方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图1中所
示的步骤。
[0144]
所述存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(rom)6203。
[0145]
所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0146]
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0147]
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0148]
所述基于数据挖掘的用户行为分析设备中,所述存储器中的程序被处理器执行时实现所述的基于数据挖掘的用户行为分析方法的步骤,因此,所述设备也可以获得上述基于数据挖掘的用户行为分析方法的技术效果。
[0149]
本发明实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现所述的基于数据挖掘的用户行为分析方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上执行时,所述程序代码用于使所述终端设备执行本说明书上述基于数据挖掘的用户行为分析方法部分中描述的根据本发明各种示例性实施方式的步骤。
[0150]
参考图11所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上执行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0151]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0152]
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁
信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0153]
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0154]
所述计算机存储介质中的程序被处理器执行时实现所述的基于数据挖掘的用户行为分析方法的步骤,因此,所述计算机存储介质也可以获得上述基于数据挖掘的用户行为分析方法的技术效果。
[0155]
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1