一种无线互联网用户行为的预测系统和方法

文档序号:6601970阅读:161来源:国知局
专利名称:一种无线互联网用户行为的预测系统和方法
技术领域
本发明涉及无线互联网行为分析及预测技术,尤其涉及一种无线互联网用户行为的预测系统和方法。
背景技术
随着3G技术的广泛应用以及各种智能移动终端的出现,无线互联网用户呈急剧上升的趋势。如何对无线互联网用户进行精准营销成了摆在各运营商以及各移动网站面前的一个迫切问题。通过对无线互联网络用户行为的深入分析,可以了解用户的真正需求,充分利用网络资源,提供用户关注的相关信息,提升用户体验和忠诚度,进而构建更好的盈利模式。目前的无线互联网用户行为预测还属较新的研究领域,还没有比较完善的解决方案。现有的最为类似的研究领域为1.传统互联网用户的行为预测;2.无线互联网用户的行为分析。这两个研究领域都是通过对用户行为的收集(如网站日志),并进行数据挖掘(如利用聚类、回归等算法),获取用户的特征(例如用户的爱好)。目前,和本申请技术方案最为接近的两个方面的实现都存在着明显的缺点传统互联网用户行为预测无法有效标识单一用户并且取得其个人属性及个人行为数据,只能通过单个行为本身进行分析预测。此局限是因用户使用传统互联网的方式造成的。无线互联网用户由于有个人终端及个人标识,使精准预测成为可能。无线互联网用户行为分析表现为离线分析的方式,采用数据发掘方式得到用户行为报告,从而指导后续营销方向。目前没有正式发布的实时分析预测系统。

发明内容
本发明提供一种能够有效收集无线互联网用户的上网行为数据,并且基于无线互联网用户的上网行为进行实时分析及预测的无线互联网用户行为预测系统和方法。一方面,提出一种无线互联网用户行为的预测系统,包括位于客户端的用户行为数据采集模块,用于收集用户运行时间的用户行为数据, 并且发送到服务器;位于服务器端的用户行为分析预测模块,用于建立用户行为模型、根据位于客户端的用户行为数据采集模块收集的用户行为数据进行用户行为分析及预测。对于上述预测系统,该用户行为分析预测模块依次包括建模子模块和用户行为分析预测子模块。对于上述预测系统,该用户行为分析预测子模块包括依次相连的聚类分组单元和基于聚类分组的用户行为预测单元;依次相连的行为关联单元和基于关联行为的用户行为预测单元;以及与该基于聚类分组的用户行为预测单元和该基于关联行为的用户行为预测单元相连的用户行为综合预测模块。对于上述预测系统,该用户行为数据采集模块定时向该服务器传送最近时段的用
3户行为数据更新。对于上述预测系统,该用户行为数据包括静态数据和动态数据。另一方面,提出一种无线互联网用户行为的预测方法,包括如下步骤A、建立用户行为模型;B、收集用户运行时间的用户行为数据;C、根据收集到的用户行为数据对用户行为进行分析及预测。对于上述预测方法,步骤C进一步包括如下步骤C10、根据收集到的用户行为数据进行聚类分析得到用户分组;C20、对于运行时间的用户请求,根据该用户所在分组获得对应行为。对于上述预测方法,该聚类分析采用基于遗传算法的模糊聚类方法。对于上述预测方法,用户分组与对应行为之间的关联通过关联规则挖掘获得,该关联规则挖掘包括从已知用户类别的样本集合中找出高频项目组;由该高频项目组产生关联规则。对于上述预测方法,步骤C进一步包括如下步骤C11、根据所有用户历史行为间的关联性统计,计算与单个行为或行为链的关联性比预定的可能性数值强的行为;C21、对于运行时间的用户请求,根据该用户近期行为或行为链获得对应的关联性强的行为。对于上述预测方法,步骤C进一步包括步骤C3、将步骤ClO和C20的用户行为预测结果以及步骤Cll和C21的用户行为预测
结果综合起来,对用户行为进行预测。对于上述预测方法,该用户行为综合预测利用神经元网络的方法。对于上述预测方法,该用户行为数据包括静态数据和动态数据。本发明技术方案主要的优点在于1、和现有技术相比,本发明采用的数据模型以及用户分类均为经过基于遗传算法的模糊聚类计算的最优解,保证数据的完整性和有效性。2、行为预测分为群体长期行为预测和个体短期行为预测,充分挖掘出用户属性和用户行为之间的关联。3、并且使用了具有自学习特征的人工神经元网络进行最终的综合行为预测,使预测结果随着学习样本的增加不断完善和精确。


图1示出本发明所述的无线互联网用户行为预测系统的框图。图2示出本发明所述的无线互联网用户行为预测方法的一个实施例的流程图。
具体实施例方式参照图1,本发明所述的无线互联网用户行为预测系统包括用户行为分析预测模块11和用户行为数据采集模块12。
位于服务器端的用户行为分析预测模块11,首先根据样本数据建立合理的手机用户及其行为模型,涵盖用户的自然、社会属性以及其在上网过程中的多纬度行为属性;然后采用人工智能中的基因算法的方法进行用户分类,既避免了由于主观分类不准确对行为预测带来的影响,也得到了用户模型的优化。在得到用户分类后利用数据挖掘得到针对用户类别的长期行为预测以及针对个体行为的短期行为关联。在运行时间采用神经元网络的方法通过自主学习不断更新完善实时行为预测的准确度。进一步地,该用户行为分析预测模块11依次包括建模子模块111和用户行为分析预测子模块112。再进一步地,该用户行为预测子模块112包括依次相连的聚类分组单元1121和基于聚类分组的用户行为预测单元1122 ;依次相连的行为关联单元1123和基于关联行为的用户行为预测单元1124 ;以及与该基于聚类分组的用户行为预测单元1122和该基于关联行为的用户行为预测单元IlM相连的用户行为综合预测模块1125。位于客户端的用户行为数据采集模块12,表现为运行在用户手机终端中的一个内嵌模块,负责收集及传送用户行为信息。具体作用是收集用户运行时间的使用偏好,并且发送到服务器,结合用户在使用过程中的浏览点击动作得到完整的用户行为数据。此模块支持智能手机操作系统,Symbian、Linux、WindowsMobile, Windows CE、 Palm OS、IPhone OS、Blackberry OS、Android 和 / 或 wphone 等。此模块可由手机供应商或运营商内置于手机终端,并由用户认可参与后运行;也可以由用户主动下载安装后运行。 此模块采集数据包括用户使用的应用名称和/或类别以及使用时间等。此模块将定时向服务器传送最近时段的用户行为数据更新。用户行为数据包括静态数据和动态数据。静态数据包括用户作为自然人的特征, 如年龄、性别、地域、教育程度等。静态数据的取得和样本来源相关。动态数据包括用户在使用手机登陆互联网的过程中的行为特征,如浏览网页类别、停留时间、阅读习惯、网页特征等。其中,动态数据具有一定的时间相关性,比如同一用户在工作日关注的网页内容和在休息日关注的网页内容有所区别。动态数据具有一定的偶然性,比如用户误操作或者随机操作产生的数据,应在分析时被标示为无效数据。无效数据的判定采用高通滤波算法。 动态数据具有一定的地域相关性,比如同一用户在到达其非常住地区时,其浏览行为可能有所改变。参照图2,描述基于上述无线互联网用户行为预测系统的无线互联网用户行为预测方法的一个实施例,该方法包括以下步骤A、建模建立用户行为模型,包括用户的自然属性、社会属性以及用户的浏览习惯。用户的自然属性比如年龄、性别等;社会属性比如教育程度、职业等;用户的浏览习惯比如关注网页的关键词、类别、停留时间等。B、初始数据收集收集初始用户行为数据样本,即用户上网的行为以及具体行为属性,并进行数据处理,生成适合上述模型的待分析数据组。用户上网行为比如浏览网页、 下载应用、观看视频等;具体行为属性比如网页关键字、应用类别、停留时间等。C10、聚类分组根据待分析数据样本进行聚类分析得到初始用户群划分,同时得到和用户群划分相关的用户属性,剔除和用户群划分不相关的用户属性。根据用户群划分得到群体(长期)行为关联,如每个用户群的关注关键词和/或类别等。聚类分析方法采用基于遗传算法的模糊聚类方法a.初始化过程al).首先根据原始行为样本,生成待分析的初始种群;a2).根据用户行为模型产生特征向量编码,形成染色体;a3).计算每个染色体的适应度,将适应度高的染色体进行选择、交叉和变异,重复上述计算过程直到找到全局最优解。b.模糊聚类过程根据初始化过程中得到的最优点作为聚类中心点,采用FCM算法得到聚类结果。C20、基于聚类分组的用户行为预测对于运行时间的用户请求,根据其所在分组, 获得不同行为的可能性。在这里,得到用户分类之后利用关联规则挖掘得到针对用户类别的长期行为预测。关联规则挖掘包括a.从已知用户类别的样本集合中找出目标高频项目组,待选项目组为网页相关特征,如关键字、网页排版、语言偏好、图像属性、网页类别等;b.由高频项目组产生关联规则。C11、行为关联根据所有用户历史行为间的关联性统计,计算与单个行为或行为链关联性强的各行为的可能性。如,关注汽车价格的用户很可能会同时关注汽车配件的信肩、οC21、基于关联行为的用户行为预测对于运行时间的用户请求,根据其近期行为或行为链,获得与之关联性强的各行为的可能性。C3、用户行为综合预测结合基于聚类分组的用户行为预测结果,以及基于关联行为的用户行为预测结果,对用户行为进行预测。根据用户行为综合预测结果,对待投放信息进行匹配,达到精准投放。本发明的行为预测方法分为群体行为计算和个体行为计算两个层次,满足用户分类的相对稳定性以及个体行为的敏感性;采用神经元网络进行综合行为预测,利用其自主学习的特性不断提高预测的准确性。综上所述,本发明建立了从模型建立、数据收集、行为分析到行为预测的一整套可行的解决方案。而现有技术无相同类型的端到端解决方案。而且,本发明独创了综合考虑用户所在群体行为特征及用户短期行为的自适应无线互联网用户行为模型。此数据模型为进行用户群体及个人行为预测的基石。本发明的数据采集过程包括用户的终端数据采集, 以及用户的点击和/或浏览行为数据采集。此数据采集方式确保收集到完整的用户运行时间数据进行精准预测。
权利要求
1.一种无线互联网用户行为的预测系统,其特征在于,该系统包括位于客户端的用户行为数据采集模块,用于收集用户运行时间的用户行为数据,并且发送到服务器;位于服务器端的用户行为分析预测模块,用于建立用户行为模型、根据位于客户端的用户行为数据采集模块收集的用户行为数据进行用户行为分析及预测。
2.根据权利要求1所述的预测系统,其特征在于,所述用户行为分析预测模块依次包括建模子模块和用户行为分析预测子模块。
3.根据权利要求2所述的预测系统,其特征在于,所述用户行为分析预测子模块包括依次相连的聚类分组单元和基于聚类分组的用户行为预测单元;依次相连的行为关联单元和基于关联行为的用户行为预测单元;以及与所述基于聚类分组的用户行为预测单元和所述基于关联行为的用户行为预测单元相连的用户行为综合预测模块。
4.根据权利要求1所述的预测系统,其特征在于,所述用户行为数据采集模块定时向所述服务器传送最近时段的用户行为数据更新。
5.根据权利要求1所述的预测系统,其特征在于,所述用户行为数据包括静态数据和动态数据。
6.一种无线互联网用户行为的预测方法,其特征在于,该方法包括如下步骤A、建立用户行为模型;B、收集用户运行时间的用户行为数据;C、根据收集到的用户行为数据对用户行为进行分析及预测。
7.根据权利要求6所述的预测方法,其特征在于,步骤C进一步包括如下步骤C10、根据收集到的用户行为数据进行聚类分析得到用户分组;C20、对于运行时间的用户请求,根据该用户所在分组获得对应行为。
8.根据权利要求7所述的预测方法,其特征在于,所述聚类分析采用基于遗传算法的模糊聚类方法。
9.根据权利要求7所述的预测方法,其特征在于,用户分组与对应行为之间的关联通过关联规则挖掘获得,所述关联规则挖掘包括从已知用户类别的样本集合中找出高频项目组;由所述高频项目组产生关联规则。
10.根据权利要求6或7所述的预测方法,其特征在于,步骤C进一步包括如下步骤C11、根据所有用户历史行为间的关联性统计,计算与单个行为或行为链的关联性比预定的可能性数值强的行为;C21、对于运行时间的用户请求,根据该用户近期行为或行为链获得对应的关联性强的行为。
11.根据权利要求10所述的预测方法,其特征在于,步骤C进一步包括步骤C3、将步骤ClO和C20的用户行为预测结果以及步骤Cll和C21的用户行为预测结果综合起来,对用户行为进行预测。
12.根据权利要求11所述的预测方法,其特征在于,所述用户行为综合预测利用神经元网络的方法。
13.根据权利要求6所述的预测方法,其特征在于,所述用户行为数据包括静态数据和动态数据。
全文摘要
本发明公开一种无线互联网用户行为的预测系统和方法。该系统包括位于客户端的用户行为数据采集模块,用于收集用户运行时间的用户行为数据,并且发送到服务器;位于服务器端的用户行为分析预测模块,用于建立用户行为模型、根据位于客户端的用户行为数据采集模块收集的用户行为数据进行用户行为分析及预测。该方法包括A、建立用户行为模型;B、收集用户运行时间的用户行为数据;C、根据收集到的用户行为数据对用户行为进行分析及预测。本发明的技术方案能够保证数据的完整性和有效性;行为预测分为群体长期行为预测和个体短期行为预测,充分挖掘出用户属性和用户行为间的关联。使用神经元网络进行综合行为预测,使预测结果不断完善和精确。
文档编号G06N3/12GK102238045SQ20101016663
公开日2011年11月9日 申请日期2010年4月27日 优先权日2010年4月27日
发明者谢永开 申请人:广州迈联计算机科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1