网站用户行为分析方法及装置与流程

文档序号:14609467发布日期:2018-06-05 20:31阅读:161来源:国知局
网站用户行为分析方法及装置与流程

本发明涉及网站用户行为分析技术领域,更具体地,是网站用户行为分析方法及装置。



背景技术:

用户访问网站时,会发生一系列的行为,例如通过搜索引擎进入网站、进行站内搜索、浏览站内内容、注册账号等,多种行为可以串联为行为路径。网站想要进行推广,一种方式是对访问该网站的热门路径上的用户进行网站推荐。

因此,需要一种技术方案,对访问网站的大量用户的访问行为进行分析,以确定出访问网站的热门路径,分析出的热门路径可以作为网站推广的依据。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的网站用户行为分析方法。

第一方面,本申请提供了一种网站用户行为分析方法,包括:

获取多个目标用户访问目标网站时的行为数据及与行为数据对应的行为发生时间;

针对每一所述目标用户,根据行为发生时间的先后顺序,对该目标用户的目标行为数据所表示的行为排序,形成行为路径;

按照预设长度切分各个所述目标用户的行为路径,获得子行为路径;

确定每种所述子行为路径对应的目标用户与所有目标用户的占比;

将超过预设占比阈值的占比所对应的子行为路径确定为热门路径。

第二方面,本申请提供了一种网站用户行为分析装置,包括:

行为数据及时间获取单元,用于获取多个目标用户访问目标网站时的行为数据及与行为数据对应的行为发生时间;

行为路径生成单元,用于针对每一所述目标用户,根据行为发生时间的先后顺序,对该目标用户的目标行为数据所表示的行为排序,形成行为路径;

行为路径切分单元,用于按照预设长度切分各个所述目标用户的行为路径,获得子行为路径;

子行为路径占比确定单元,用于确定每种所述子行为路径对应的目标用户与所有目标用户的占比;

热门路径确定单元,用于将超过预设占比阈值的占比所对应的子行为路径确定为热门路径。

第三方面,本申请还提供了一种网站用户行为分析装置,包括处理器和存储器,所述处理器通过运行存储在所述存储器内的软件程序、调用存储在所述存储器内的数据,至少执行如下步骤:

获取多个目标用户访问目标网站时的行为数据及与行为数据对应的行为发生时间;

针对每一所述目标用户,根据行为发生时间的先后顺序,对该目标用户的目标行为数据所表示的行为排序,形成行为路径;

按照预设长度切分各个所述目标用户的行为路径,获得子行为路径;

确定每种所述子行为路径对应的目标用户与所有目标用户的占比;

将超过预设占比阈值的占比所对应的子行为路径确定为热门路径。

借由上述技术方案,本发明提供的网站用户行为分析方法,该方法针对特定的网站,确定出大量用户访问该网站的行为,并将同一用户的行为按照发生时间的先后顺序串联为行为路径,切分所有用户的行为路径获得子行为路径,并统计每种子行为路径所对应的用户与用户总数的占比,进而将占比超过预设占比阈值的子行为路径确定为热门路径,热门路径可以反映大多数用户访问网站的行为特征,从而本方法实现了对用户行为的分析。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明提供的网站用户行为分析方法的一个流程图;

图2示出了本发明提供的网站用户行为分析方法的另一流程图;

图3示出了本发明提供的网站用户行为分析方法的又一流程图;

图4示出了本发明提供的网站用户行为分析装置的一个结构示意图;

图5示出了本发明提供的网站用户行为分析装置的另一结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

用户访问某一网站时,针对该网站会发生一系列的行为,例如通过搜索引擎进入网站、进行站内搜索、浏览站内内容、注册账号等。对大量用户的行为数据进行综合分析,可以统计出用户行为的特点。用户行为的特点,可以作为网站广告投放的依据,例如,向有相似行为的用户投放该网站的广告。

为了分析出用户的行为特征,本发明提供了一种网站用户行为分析方法。见图1,该网站用户行为分析方法包括以下步骤S101~S105。

S101:获取多个目标用户访问目标网站时的行为数据及与行为数据对应的行为发生时间。

在实施中,想要对哪一网站进行推广,则需要获取用户访问该网站的行为数据。为了便于描述,可以将该网站称为目标网站。可以理解的是,用户数量越多,获取到的行为数据也越多,从而分析结果的可靠性也越高。

用户访问网站时会发生各种各样的行为,例如,用户在某购物网站中会发生找回密码、兑换积分、站内搜索、购买物品、申请退款、注册账号等行为。

目标用户可以是访问该网站的任意用户,但能够对网站推广有指导价值的用户是发生转化行为的用户,因此,目标用户也可以是发生转化行为的用户。

转化行为为预设的行为,转化行为与网站的推广目的有关。因此,从访问目标网站的用户中,确定发生预设转化行为的用户为目标用户。

例如,网站推广目的是希望获得更多的用户注册,则转化行为为注册账号;又如,购物类网站的推广目的是希望用户多购买商品,则转化行为为购买行为;再如,网上授课类网站的推广目的是希望用户多收听课程,则转化行为为预约课程。当然,以上转化行为仅仅是几种举例,根据实际情况,可以是其他形式的行为。

需要说明的是,不仅需要获得目标用户的行为数据,还需要获得用户发生行为数据所表示的行为时的时间点,例如,某用户在11月1日14:00发生注册行为,在11月1日14:20发生购买行为。

S102:针对每一所述目标用户,根据行为发生时间的先后顺序,对该目标用户的目标行为数据所表示的行为排序,形成行为路径。

其中,页面数据不经包含行为数据,还可以同时记录用户发生行为数据所对应的行为的具体时间,因此,从页面数据中获取到目标行为数据后,还可以从页面数据中获取各个目标行为数据所表示的行为的发生时间。

依据时间的先后顺序,对目标行为数据所表示的行为进行排序,从而形成行为路径。

例如,对某目标用户的目标行为数据所表示的行为排序后,生成的行为路径为:搜索关键词-点击广告进入网站-站内搜索-注册账号-站内搜索-购买商品。

每个目标用户具有各自的目标行为数据,因此,对行为排序后,会生成每个目标用户的行为路径。

S103:按照预设长度切分各个所述目标用户的行为路径,获得子行为路径。

其中,行为路径中包含若干个行为数据对应的行为,此些行为可以看作行为节点。例如,行为路径“搜索关键词-点击广告进入网站-站内搜索-注册账号-站内搜索-购买商品”中包含6个行为节点。

按照预设的长度切分行为路径,即以N(N大于等于2)个行为节点作为切分单元切分行为路径。需要说明的是,切分行为路径时,将所有符合预设长度的行为路径均切分出来。

例如,假设按照长度2切分上述行为路径,则获得的子行为路径包括:搜索关键词-点击广告进入网站,点击广告进入网站-站内搜索,站内搜索-注册账号,注册账号-站内搜索,站内搜索-购买商品。

当然,还可以按照其他长度切分路径,例如:

假设按照长度3切分上述行为路径,则获得的子行为路径包括:

搜索关键词-点击广告进入网站-站内搜索,点击广告进入网站-站内搜索-注册账号,站内搜索-注册账号-站内搜索,注册账号-站内搜索-购买商品。

假设按照长度4切分上述行为路径,则获得的子行为路径包括:

搜索关键词-点击广告进入网站-站内搜索-注册账号,点击广告进入网站-站内搜索-注册账号-站内搜索,站内搜索-注册账号-站内搜索-购买商品。

假设按照长度5切分上述行为路径,则获得的子行为路径包括:

搜索关键词-点击广告进入网站-站内搜索-注册账号-站内搜索,点击广告进入网站-站内搜索-注册账号-站内搜索-购买商品。

按照某个预设长度切分每个用户的行为路径后,获得多个子行为路径。

S104:确定每种所述子行为路径对应的目标用户与所有目标用户的占比。

其中,通常地,不同用户切分出的子行为路径中,会包含相同的子行为路径。例如,用户1的子行为路径中包括搜索关键词-点击广告进入网站-站内搜索,用户2的子行为路径中也包含这一条子行为路径。

将相同的子行为路径看作一种子行为路径。针对每种子行为路径,统计哪些目标用户的行为路径中包含该种子行为路径,将统计出的目标用户的数量与目标用户总数进行比值计算,以确定出每种子行为路径对应的占比值。

S105:将超过预设占比阈值的占比所对应的子行为路径确定为热门路径。

在实施中,可以按照比值大小,对所有的子行为路径的比值进行排序。

若预设数量为1,则将比值最高的子行为路径确定为热门路径。若比值最高的子行为路径为多个,则可以将该多个子行为路径均确定为热门路径,此种情况下,预设数量为1并不表示仅取一个子行为路径,而是表示比值排序在第1位的所有子行为路径。当然,预设数量为其他数值时,也适用此解释说明。

若预设数量大于1,则将排序在前的相应数量的子行为路径确定为热门路径。根据实际需求,预设数量可以设置为大于1的任意数值。

但是,以上排序方法确定热门路径的方法可能存在问题,即确定出的热门路径虽然排序在前,但发生该热门路径中的行为的用户数量并不多,该路径也达不到热门标准。因此,可以通过占比阈值来选择热门路径。

具体地,根据热门路径选择数量的需求,预先设置占比阈值。占比阈值设置得越高,则可以达到占比阈值标准的路径数量就越少,进而在网站推广时,可用的热门路径就越少。但是,占比阈值设置得越高,所选择出的热门路径越能反映大多数用户的行为特征,从而在网站推广时,使用该热门路径的推广效果更好。

获取每种子行为路径所对应的占比,该占比即具有该种子行为路径中的行为的目标用户与所有目标用户的比值。将每种子行为路径的占比与预设占比阈值一一比较,将超过或等于预设占比阈值的占比所对应的子行为路径确定为热门路径。

例如,假设步骤S101中的目标用户为100个,则步骤S103中生成的行为路径为100条。假设按照长度2切分100条行为路径后,生成的子行为路径有350条,350条子行为路径分为50种。

则统计该50种子行为路径中,每种子行为路径对应的用户数量(行为路径中包含该子行为路径的用户的数量),进而将用户数量与100进行比值计算,再从中选择比值高于预设占比阈值(如40%)的子行为路径为热门路径。

需要说明的是,本方法切分出子行为路径后,并非统计每种子行为路径的数量与子行为路径总数的比值,而是计算子行为路径对应的目标用户数与目标用户总数的比值。因为,目标用户总数是一定的,使用本方法计算出的比值可以准确反映出,在目标用户中大多数用户的行为特征是怎样的。但是,如果选择第一种方法,由于切分时选用的切分长度不同,则所切分出的子行为路径总数也就不一定,从而不能准确反映出上述特征。

由以上技术方案可知,本发明提供了一种网站用户行为分析方法,该方法针对特定的网站,确定出大量用户访问该网站的行为,并将同一用户的行为按照发生时间的先后顺序串联为行为路径,切分所有用户的行为路径获得子行为路径,并统计每种子行为路径所对应的用户与用户总数的占比,进而将占比超过预设占比阈值的子行为路径确定为热门路径,热门路径可以反映大多数用户访问网站的行为特征,从而本方法实现了对用户行为的分析。

见图2,其示出了本申请提供的用户行为分析方法另一实施例的流程,具体包括步骤S201~S206。

S201:针对某一网站,获取多个目标用户访问该网站的页面数据,其中,目标用户为发生预设转化行为的用户。

其中,若想要对某网站进行推广,需要依据用户访问该网站的页面数据,来确定用户的行为数据。该网站即目标网站,用户即目标用户。

页面数据可以是用户在任意时间段访问该网站的页面数据。

在目标用户为发生预设转化行为的用户的场景中,页面数据可以是用户发生转化行为的前预设时间段内的数据。例如,转化行为为注册行为,某用户在11月1日14:00发生注册行为,则页面数据为10月1日14:00到11月1日14:00点的页面数据。

页面数据可以是从预先收集的页面数据中提取到的。例如,收集访问目标网站的所有用户的所有页面数据,从而,本步骤可以从预先收集的页面数据中选择满足上述条件的页面数据。

S202:针对每一目标用户,从该目标用户的页面数据中,提取预设种类的目标行为数据。

其中,页面数据中包含字段,字段可以表示一种行为。例如,字段zhmm表示找回密码,字段registe表示账号注册,字段search表示站内搜索等。

页面数据中包含的访问网站的行为有多种,本发明仅关注对网站推广有指导价值的几种行为,因此,从页面数据中提取表示这些行为的行为数据即可。此些行为是预设的行为。

例如,预设种类的行为包括:进入网站的行为及网站内的行为。进入网站的行为如通过搜索引擎进入网站、通过网站网址进入网站或通过邮件进行网站等;网站内的行为如站内搜索、注册账号、提交订单、查看预设的目标网页等。当然,预设的行为不仅仅局限于此,根据实际需求,可以是本领域技术人员可以理解并预期得到的其他各种行为。

因此,从页面数据中,提取用于表示预设行为的字段即可,这些字段即行为数据。为了便于描述,可以将提取到的行为数据称为目标行为数据。

需要说明的是,在实际应用中,可能存在同一个页面数据中,检测到多个目标行为数据的情况。为了保证行为数据后续所形成的行为路径的简单清楚,可以预先定义行为优先级。这样,若从同一页面中检测到多个目标行为数据,则选择优先级最高的行为所对应的目标行为数据。

例如,同一个页面数据中既包括表示注册行为的字段,也包括站内搜索行为的字段,预先定义注册行为的优先级高于站内搜索行为,则从该页面中提取的目标行为数据为注册行为对应的目标行为数据。

在提取时,以用户为单位,所提取到的行为数据可以划分为集合,这样每个目标用户具有各自的目标行为数据集合。

S203:针对每一目标用户,根据行为发生时间的先后,对该目标用户的目标行为数据所表示的行为排序,形成行为路径。

S204:按照预设长度切分各个目标用户的行为路径,获得子行为路径。

S205:确定每种子行为路径对应的目标用户与所有目标用户的占比。

S206:将超过预设占比阈值的占比所对应的子行为路径确定为热门路径。

需要说明的是,有关步骤S203~S206的说明可以参见图1中的步骤S102~S105,此处并不赘述。

由上述步骤S201可知,热门路径是针对某一网站统计出来的,且用来作为统计依据的目标用户实际发生了网站期望用户发生的行为,因此,根据这些用户的行为所确定出的热门路径可以用于该网站的推广。

具体地,见图3所示的网站用户行为分析方法,该方法在图2所示的方法基础上,还包括以下步骤S207及S208。

S207:在访问网站但还未发生预设转化行为的用户中,确定行为路径与热门路径相似的潜在用户。

其中,访问网站的用户中除了发生预设的转化行为的目标用户外,还包含未发生转化行为的用户。在未发生转化行为的用户中,可以进一步确定行为路径与确定出的热门路径相似的用户,为了便于描述,该用户可以称为潜在用户。

路径是否相似可以通过预设的相似阈值判断。具体地,预先设置用于判断相似的阈值,该阈值可以称为相似阈值。按照上述图2中的方式确定出用户的行为路径后,确定用户的行为路径与热门路径相同的行为节点的数量,将该数量与热门路径中行为节点的总数进行比值计算,将比值大于相似阈值的行为路径确定为相似路径。进一步将该行为路径对应的用户确定为潜在用户。

需要说明的是,上述“行为路径与热门路径相同的行为节点”中的“相同”不仅包括内容相同,还包括行为节点的顺序也相同。

例如,确定出的热门路径为“点击广告进入网站-站内搜索-注册账号-购买商品”,假设用户的行为路径中包括“通过网址进入网站-站内搜索-注册账号-站内搜索-购买商品”,则用户的行为路径中与热门路径相同的行为节点为“站内搜索-注册账号”(2个)。

需要说明的是,虽然用户的行为路径中也包括“购买商品”这个行为节点,但该行为节点的顺序并未在“注册账号”之后,因此,该行为节点不属于相同的行为节点,并不能作为相似路径的判断依据。

仍以上述示例为例,确定相同的行为节点为2个后,将2与热门路径的行为节点个数(4)进行比值计算,可以确定出相似度为50%。假设相似阈值为50%,则该用户可以被确定为潜在用户。

S208:向潜在用户发送该网站的进入方式。

其中,可以以各种形式发送网站的进入方式。例如,向潜在用户的手机发送短信,或者,向潜在用户的邮箱发送邮件等。网站的进入方式也可以是各种方式,例如,网站的网址链接、网站的二维码等。当然,发送方式及进入方式可以是本领域技术人员可以理解并预期得到的其他方式,本发明并不做具体限定。

本发明提供了的上述网站用户行为分析方法,并非在所有用户中推广网站,而是在潜在用户中推广网站,潜在用户发生网站期望行为的可能性更大,因此,网站推广效果更佳。

见图4,其示出了本发明提供的网站用户行为分析装置的一种结构示意,具体包括:行为数据及时间获取单元401、行为路径生成单元402、行为路径切分单元403、子行为路径占比确定单元404及热门路径确定单元405。

行为数据及时间获取单元401,用于获取多个目标用户访问目标网站时的行为数据及与行为数据对应的行为发生时间;

行为路径生成单元402,用于针对每一所述目标用户,根据行为发生时间的先后顺序,对该目标用户的目标行为数据所表示的行为排序,形成行为路径;

行为路径切分单元403,用于按照预设长度切分各个所述目标用户的行为路径,获得子行为路径;

子行为路径占比确定单元404,用于确定每种所述子行为路径对应的目标用户与所有目标用户的占比;

热门路径确定单元405,用于将超过预设占比阈值的占比所对应的子行为路径确定为热门路径。

在一个示例中,在执行所述获取多个目标用户访问目标网站时的行为数据及行为数据对应的行为发生时间的步骤时,所述行为数据及时间获取单元具体用于:

从访问目标网站的用户中,确定发生预设转化行为的用户为目标用户;获取所述目标用户访问所述目标网站时的行为数据及与行为数据对应的行为发生时间。

在一个示例中,在执行所述获取多个目标用户访问目标网站时的行为数据及行为数据对应的行为发生时间的步骤时,所述行为数据及时间获取单元具体用于:

获取多个所述目标用户访问所述目标网站的页面数据;针对每个所述目标用户,从该所述目标用户的页面数据中,提取预设种类的行为数据以及行为数据对应的行为发生时间。

见图5,其示出了本发明提供的网站用户行为分析装置的另一结构示意,具体包括:行为数据及时间获取单元401、行为路径生成单元402、行为路径切分单元403、子行为路径占比确定单元404、热门路径确定单元405、潜在用户确定单元406及网站进入方式发送单元407。其中单元401~405的说明可以参见上述说明,此处并不赘述。

潜在用户确定单元406,用于在访问所述目标网站但还未发生预设转化行为的用户中,确定行为路径与所述热门路径相似的潜在用户;

网站进入方式发送单元407,用于向所述潜在用户发送所述目标网站的进入方式。

在一个示例中,在执行所述在访问所述目标网站但还未发生预设转化行为的用户中,确定行为路径与所述热门路径相似的潜在用户的步骤时,所述潜在用户确定单元具体用于:

确定访问所述目标网站但还未发生预设转化行为的用户的行为路径;计算所述行为路径与所述热门路径中相同的行为节点的数量,并计算所述数量与所述热门路径中行为节点总数的比值;将所述比值超过预设相似阈值的行为路径对应的用户确定为潜在用户。

所述网站用户行为分析装置包括处理器和存储器,上述行为数据及时间获取单元401、行为路径生成单元402、行为路径切分单元403、子行为路径占比确定单元404及热门路径确定单元405等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现分析网站用户的行为特征,以确定出由用户行为组成的热门路径。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。

本发明还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:

获取多个目标用户访问目标网站时的行为数据及与行为数据对应的行为发生时间;

针对每一所述目标用户,根据行为发生时间的先后顺序,对该目标用户的目标行为数据所表示的行为排序,形成行为路径;

按照预设长度切分各个所述目标用户的行为路径,获得子行为路径;

确定每种所述子行为路径对应的目标用户与所有目标用户的占比;

将超过预设占比阈值的占比所对应的子行为路径确定为热门路径。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1