一种基于网站用户的信息预测方法与流程

文档序号:11144074阅读:322来源:国知局
一种基于网站用户的信息预测方法与制造工艺

本发明涉及本发明涉及数据处理技术领域,尤其涉及一种基于网站用户的信息预测方法。



背景技术:

随着进入移动互联网时代的到来,信息更新迭代的时间逐渐缩短,要想在行业中处于不败之地必须有把握市场方向的能力,即预测能力。古人在当时科学依据较少的情况下,以经验来对某一个即将发生的事情进行预判断,但是这种完全凭借经验的判断很难称其为“预测”,因为其完全没有一个相对标准的依据。比如现在从事网站运营业务的团队,不能有效的预测未来一段时间新用户注册量,就很难掌握网站运营的业务方向,一旦行业方向发生转向,运营团队再去改变运营方向,就很难再跟上行业的发展,甚至被整个行业抛弃。但是现在市场上公开的准确度较高并且操作相对简单的预测模型基本上没有。本发明不仅很好的解决了预测问题,而且填补了预测网站用户注册量的空白。



技术实现要素:

下面描述的一种预测网站新增用户数的模型有效的解决了上面所述的问题。

本发明公开一种基于网站用户的信息预测方法。包括:

步骤1:通过控制单元设定:客观事件边界、主观事件边界、事件发生时间间隔、事件影响持续时间。

步骤2:基于控制单元获取客观事件和用户新增数据表;

步骤3:基于控制单元获取主观事件和用户新增数据表;

步骤4:通过数据处理单元分别建立:1、客观事件和用户新增关系的模型;2、建立主观事件和用户新增关系的模型;

步骤5:通过数据预测单元建立以客观事件和用户新增关系、主观事件和用户新增关系为因子的预测模型,基于模型预测网站新增用户数。

步骤6:通过数据分析单元对比网站预测增长的用户数和实际增长的用户数,基于对比结果,排除干扰预测的客观事件和主观事件,并且实时调整对应的事件发生时间间隔、事件影响持续时间等设置,进而实现模型的自我优化和更新。

其中,步骤1所述的控制单元为本装置的基础单元,控制单元通过定义相关等参数等操作控制预测装置的实际运行,具体包含:

101:定义客观事件边界:即定义影响网站用户增长的客观事件发生列表,并且基于网站运营随时保持更新(本发明所指的客观事件均为影响本网站的客观事件,如果事件发生时间间隔内没有任何外部客观事件发生也算一种客观事件,如:网站服务群体是否放假、影响网站业务的政策发布更新等);

102:定义主观事件边界:即定义影响网站注册的主观事件发生列表(本发明所指的主观事件均为影响本网站的主观事件,如:网站版本更新、网站内容模块更新、网站业务信息推送等事件);

103:定义事件发生时间间隔:即如果长时间没有发生外部客观事件,定义多长时间算一个事件发生的时间间隔,也就是这段时间内,基于时间间隔,可以确认这个时间段内有几个客观事件发生。

104:定义事件影响持续时间:即定义事件发生后,截止到什么时间,来计算用户增长的数量。

步骤2所述的获取客观事件和用户新增数据表具体包含:

步骤201:基于控制单元获取每一个客观事件发生后,事件影响持续时间内的新增用户数;

步骤202:生成客观事件和新增用户数的关系列表。

步骤3所述的获取主观事件和用户新年增数据表具体包含:

步骤301:基于控制单元获取每一个主观事件发生后,事件影响持续时间内的新增用户数;

步骤302:生成主观事件和新增用户数的关系列表。

步骤4所述数据处理单元主要包含对两个事件列表的逻辑处理,具体处理方法如下:

步骤401:对于每个客观事件,当此事件发生后,把事件影响持续时间内新增用户数量构成一个变量Xm。其中,m是客观事件发生的次数;

步骤402:对于每个主观事件,当此事件发生后,把事件影响持续时间内新增用户数量构成一个变量Xn。其中,n是客观事件发生的次数;

步骤403:假设新增用户数Yi,和以上两个有如下关系:

Yi=a+bXm+cXn

利用上述m和n维参数对此式进行线性回归,利用最小二乘法估计出模型参数a、b和c。

针对未来用户新增数用上述二元线性回归方程预测。

本发明的关键点:

1、本发明基于线性回归的模型相比于其他(德尔菲法预测模型、灰色预测模型等)预测模型更具有可操作性和高效性;

2、算法创造性的把客观事件影主观时间影响分类处理,区分为两个因子,符合实际情况,增加了预测的准确性;

3、由于主观和客观事件的列表是积累更新的,所以可以实现对算法预测的同步实时更新;

4、通过控制单元人为的设定相关参数,并且通过数据分析单元动态更新,提升了预测系统的准确性。

附图说明

图1是本发明的基于网站用户的信息预测方法流程图。

图2是控制单元参数设定步骤图。

图3是在系统中获取预先设定的客观事件和新增用户关系的数据表信息图。

图4是在系统中获取预先设定的主观事件和新增用户关系的数据表信息图。

图5是用户预测模型图。

具体实施方式

下面结合具体实施例对本发明所述的预测网站新增用户数的方法做进一步详细说明,但是本发明的保护范围并不限于此。

本发明的整体思路是通过获取客观事件发生后,事件影响持续时间内新增用户的关系;主观事件发生后,事件影响持续时间内新增用户数的关系为二元线性回归方程的两个因子,通过计算线性回归方程的参数,得到预测一定时间内用户新增数量的模型。进而预测在一定时间段内相应事件发生后,网站用户新增数,如图1。

下面结合附图说明本发明的实现方式,具体实施步骤如下:

步骤1:在系统中设定关键参数,并且基于数据分析单元实时调整相应参数,如图2所示;

步骤2:在系统中获取预先设定的客观事件和新增用户关系的数据表信息,如图3所示;

其中,对同一客观事件多次发生后用户新增数量求平均值计入此关系数据表,

步骤3:在系统中获取预先设定的主观事件和新增用户关系的数据表信息,如图4所示;

其中,对同一事件多次发生后用户新增数量求平均值计入此关系数据表,

步骤4:基于以上数据表,将每一个客观事件发生后,事件影响持续时间内新增用户数量,建立一个变量Xm

Xm=[OeU1,OeU2,OeU3,......,OeUk,......,OeUm],其中,OeUk为客观事件Oe发生后新增的用户数量Uk

步骤5:基于以上关系表,将每一个主观事件发生后,事件影响持续时间内新增用户数量,建立一个向量Xn

Xn=[SeU1,SeU2,SeU3,......,SeUk,......,SeUn],其中,SeUk为主观事件Se发生后新增的用户数量Uk

步骤6:假设新增用户数Yi和Xm、Xn存在如下关系,如图5:

Yi=a+bXm+cXn

利用上述m和n参数对此式进行线性回归,利用最小二乘法估计出模型参数a、b和c。

以误差平方和最小作为确定回归系数的准则,我们得到以下数据模型:

模型1:

其中,当满足时,Q有最小值。

通过数据预测单元基于最小二乘法计算参数a、b和c的值,得出以下模型:

模型2:其中,

通过求解方程,得出最终的用户模型。

预测模型:

通过以上模型实现用户新增数量的预测。

步骤6:基于数据分析单元通过预测模型预测出的用户增长数据和网站实际增长的数据进行对比确认,排除干扰预测的客观事件和主观事件,并且动态调整控制单元的控制参数,优化预测模型。

可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1