一种个性化引导的实现方法及装置与流程

文档序号:12597772阅读:166来源:国知局
一种个性化引导的实现方法及装置与流程

本发明属于计算机技术领域,尤其涉及一种个性化引导的实现方法及装置。



背景技术:

在计算机技术领域,尤其是目前基于互联网提供的各种应用,在应用的网页上为用户提供了订制的菜单。当用户选择网页上的一个功能按钮后,会为用户弹出供用户进行下一个操作选择的菜单,所弹出的菜单也可以是半透明的蒙层,蒙层中具有供用户进行下一个操作选择的选择项,为用户提供功能引导。

然而现有的蒙层中那些用来引导的选择项都是事先根据业务经验设置的,在功能繁多的应用系统中,用户可以选择的选择项非常多,无法将所有选择项都包括在蒙层中。即使包括在蒙层中的选择项也未必是最合理的选择项,有些订制的选择项也许用户不太常用,而常用的未必在蒙层中。

公开号为CN 103092471A的中国发明专利公开了一种动态功能菜单的实现方法和终端,该方法统计各个功能菜单的用户使用频率,得到功能菜单使用频率统计信息,根据功能菜单使用频率统计信息,以系统预设的排列形式或布局形式,动态调整功能菜单列表或布局的排序。能够根据用户的使用习惯或形式需求,对菜单进行适当的排列或布局调整,以提高菜单的用户体验,方便用户的操作。

但是该发明中仅仅对已经具有的各个功能菜单的用户使用频率进行统计,并根据使用频率统计信息调整功能菜单列表,即对已经具有的功能菜单进行排列的调整。而对于用户的上网操作来说,用户下一个操作目标的可选择项越来越多,可以是另一个网站,或是在同一个网页上的其他板块。在现有技术中无法根据用户当前的操作,为用户提供下一操作的引导, 需要用户自己来寻找下一步操作的页面点击进入操作,这对于用户来说,浪费了大量不必要的时间和精力,对于功能繁杂的应用系统来说,用户操作起来更加不便。



技术实现要素:

本发明的目的是提供一种个性化引导的实现方法及装置,能够根据用户的当前操作行为、历史操作信息、以及用户属性信息,为用户下一步操作提供个性化引导,方便了用户的操作,提升了用户体验。

为了实现上述目的,本发明技术方案如下:

一种个性化引导的实现方法,包括:

根据用户访问信息,识别出用户访问序列集;

将用户访问序列集中的每一个访问序列,与频繁访问模式集合中的项进行匹配,获得相应的规则集;

将规则集中所有规则的后项作为功能引导列表推荐给用户;

其中,所述频繁访问模式集合是根据用户历史访问序列集合进行频繁访问模式挖掘得到的。

进一步地,所述根据用户历史访问序列集合进行频繁访问模式挖掘,包括:

根据Web服务器日志文件进行预处理得到用户历史访问序列集;

对用户历史访问序列集进行频繁访问模式挖掘得到频繁访问模式集合。

其中,所述根据Web服务器日志文件进行预处理,包括数据净化、用户识别、会话识别、路径补充步骤。所述对用户历史访问序列集进行频繁访问模式挖掘,采用prefixspan数据挖掘算法。

本发明所述将用户访问序列集中的每一个访问序列,与频繁访问模式集合中的项进行匹配,采用最长匹配选择法。

本发明的一种实现方式,所述最长匹配选择法,设置含有用户访问序列中网页节点数大于第一设定预置的频繁访问模式为匹配的频繁访问模式。

本发明的另一种实现方式,所述最长匹配选择法,设置与用户访问序列中网页节点数匹配最多的前N个频繁访问模式为匹配的频繁访问模式。

本发明还同时提出了一种个性化引导的实现装置,包括:

挖掘模块,用于根据用户历史访问序列集合进行频繁访问模式挖掘得到频繁访问模式集合;

识别模块,用于根据用户访问信息,识别出用户访问序列集;

匹配模块,用于将用户访问序列集中的每一个访问序列,与频繁访问模式集合中的项进行匹配,获得相应的规则集;

引导模块,用于将规则集中所有规则的后项作为功能引导列表推荐给用户。

进一步地,所述挖掘模块在进行频繁访问模式挖掘时,执行如下操作:

根据Web服务器日志文件进行预处理得到用户历史访问序列集;

对用户历史访问序列集进行频繁访问模式挖掘得到频繁访问模式集合。

其中所述挖掘模块在进行预处理时,对Web服务器日志文件进行数据净化、用户识别、会话识别、路径补充处理;在进行频繁访问模式挖掘时,采用prefixspan数据挖掘算法。

进一步地,所述匹配模块采用最长匹配选择法来进行匹配。

本发明提出的一种个性化引导的实现方法及装置,通过对用户访问的Web日志数据进行预处理,挖掘出用户频繁访问模式集合,然后匹配出规则集,向用户客户端浏览器输出功能引导列表,便于用户选择下一步将要进行的操作。为用户下一步操作提供个性化引导,方便了用户的操作,提升了用户体验。

附图说明

图1为本发明一种个性化引导的实现方法中离线处理过程流程图;

图2为本发明一种个性化引导的实现方法流程图;

图3为本发明一种个性化引导的实现装置结构示意图。

具体实施方式

下面结合附图和实施例对本发明技术方案做进一步详细说明,以下实施例不构成对本发明的限定。

本发明的总体思路是将Web日志数据预处理,然后利用prefixspan算法从用户的web访问日志中挖掘出频繁访问序列模式集合,然后根据获得的用户当前访问序列,利用最长匹配选择法在频繁访问模式集合中进行匹配,从而获得相应的规则集,最后由Web服务器端程序对规则集合进行处理后向客户端浏览器输出功能引导列表。本实施例以“御膳房”阿里云公共计算平台为例来进行说明,“御膳房”阿里云公共计算平台为淘宝商家、独立软件开发商、企业、科研机构提供精准营销解决方案、商家调研解决方案、会员营销解决方案、企业云数据解决方案等等,用户可操作的选择项非常多,需要为用户提供一种基于用户频繁访问模式的功能引导。

本实施例一种个性化引导的实现方法,包括离线处理过程和在线处理过程,以下分别进行说明。

如图1所示,离线处理过程是将Web服务器日志文件经过数据净化、用户识别、会话识别、路径补充等步骤进行处理,得到用户历史访问序列集合,然后利用优化后的prefixspan数据挖掘算法对用户历史访问序列集合进行频繁访问模式挖掘得到频繁访问模式集合,即对用户历史访问序列集合进行频繁访问模式挖掘得到频繁访问模式集合。

用户在“御膳房”阿里云公共计算平台上的访问都记录在Web服务器日志文件中,将Web服务器日志文件经过数据净化、用户识别、会话识别、路径补充等步骤进行处理后,能够得到用户历史访问序列集合。访问序列是一个用户对网站的一次访问,其中包含一次访问过的所有页面节点,所访问的页面节点按照时间顺序排列为访问序列。

具体地,数据净化是从Web服务器日志文件中提取必要字段,如用户ID、时间、页面节点ID等;用户识别是将没有登录的用户,通过cookie和用户ID对应表将用户ID补充上;会话识别是以规定的时间为单位例如60分钟,将用户的访问路径切分为多个会话,即切分为多个访问序列,每个会话对应一个访问序列;最后,对于由于服务器同步数据的原因,有可 能用户访问过的页面节点有丢失的情况,通过网站结构图,将丢失的路径补充上,以便后续的分析。在经过上述预处理后,就能够得到用户历史访问序列集合。

然后利用优化后的prefixspan算法对用户历史访问序列集合进行频繁访问模式挖掘得到频繁访问模式集合,具体的prefixspan算法实现如下表:

其中,输入的序列模式相当于一个访问序列,而最终输出的频繁序列模式就是频繁访问模式,所有的频繁访问模式组成频繁访问模式集合。关于prefixspan算法,为数据挖掘中常用的算法,在数据挖掘中,常用的算法还很多,例如Apriori算法等,这里不再赘述。

在线处理部分的核心思想是,将客户端收集的用户访问信息通过Web服务器端处理,得到用户的访问路径,对用户的访问路径进行会话识别,得到用户访问序列集;然后对访问序列集中的每一个访问序列,利用最长匹配选择法对访问序列集与频繁访问模式集合中的项进行匹配,获得相应的规则集;最后把规则集中所有规则的后项作为功能引导列表推荐给用户。

具体地,如图2所示,包括如下步骤:

S1、根据用户访问信息,识别出用户访问序列集;

用户在自己的电脑上登录“御膳房”阿里云公共计算平台,“御膳房”阿里云公共计算平台通过客户端浏览器收集用户访问信息,并发往阿里云公共计算平台的后端Web服务器,Web服务器对用户访问信息进行会话识别,以规定的时间为单位(例如60分钟),将用户的访问路径切分为多个会话,即切分为多个访问序列,得到用户访问序列集。与离线处理过程不同的是,这里得到的是用户当前的访问序列集。

S2、将用户访问序列集中的每一个访问序列,与频繁访问模式集合中的项进行匹配,获得相应的规则集;

采用最长匹配选择法,将每一个访问序列与频繁访问模式集合中的项进行匹配,频繁访问模式集合中的每一项就是一个频繁访问模式。采用最长匹配选择法,即匹配到的频繁访问模式集合中的项含有用户访问序列中的大部分网页节点,例如可以设置频繁访问模式集合中的项含有用户访问序列中网页节点数大于70%,则该频繁访问模式集合中的项为匹配项;或者设置与用户访问序列中网页节点数匹配最多前N个频繁访问模式为匹配的频繁访问模式。

例如,假设用户访问序列A1包含有10个网页节点,频繁访问模式集合中有B1,B2,B3三个频繁访问模式分别为与用户访问序列A1最匹配的前三个频繁访问模式,其中B1包含所有用户访问序列A1的10个网页节点,B2包含用户访问序列A1的10个网页节点中的9个,B3包含用户访问序列A1的10个网页节点中的8个,如果设定的N为3,则B1,B2,B3即为匹配出的频繁访问模式,他们的集合就是规则集。

S3、将规则集中所有规则的后项作为功能引导列表推荐给用户。

规则的后项,是指规则中用户访问列表所不包含的网页节点,这些访问节点都是用户后续可能会去访问的网页节点。例如B1包含的网页节点假设有15个,其中有10个与用户访问序列中的网页节点相同,而后5个网页节点就是用户可能会去访问的网页节点。

从而将所有规则的后项作为功能引导列表推荐给用户,在用户的浏览器上显示为蒙层,供用户选择。从而用户能够直接选择蒙层中想要去访问的网页节点,实现直接访问。

例如在“御膳房”阿里云公共计算平台的数据引擎区域,用户把鼠标放置在数据开发模块上后,根据该用户的历史操作,挖掘出该用户的频繁模式并存储在数据库中,此时把用户当前访问序列(即当前的操作路径)作为参数,根据“最长匹配模式”从该用户的频繁访问模式集合中找到下一步操作集,如“前往授权中心”,并传给用户操作页面,此时页面动态的改变导航标签中的链接,将“前往授权中心”等选择项显示在导航标签中,供用户选择,导航标签以蒙层的形式在用户浏览器上显示。

本实施例基于上述方法的一种个性化引导的实现装置,如图3所示,包括:

挖掘模块,用于根据用户历史访问序列集合进行频繁访问模式挖掘得到频繁访问模式集合;

识别模块,用于根据用户访问信息,识别出用户访问序列集;

匹配模块,用于将用户访问序列集中的每一个访问序列,与频繁访问模式集合中的项进行匹配,获得相应的规则集;

引导模块,用于将规则集中所有规则的后项作为功能引导列表推荐给 用户。

本实施例挖掘模块在进行频繁访问模式挖掘时,执行如下操作:

根据Web服务器日志文件进行预处理得到用户历史访问序列集;

对用户历史访问序列集进行频繁访问模式挖掘得到频繁访问模式集合。

其中挖掘模块在进行预处理时,需要对Web服务器日志文件进行数据净化、用户识别、会话识别、路径补充处理;在进行频繁访问模式挖掘时,采用prefixspan数据挖掘算法。

本实施例中,匹配模块采用最长匹配选择法来进行匹配。

以上实施例仅用以说明本发明的技术方案而非对其进行限制,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1