一种用户访问路径的数据采集方法、系统及服务器的制作方法

文档序号:7924781阅读:228来源:国知局
专利名称:一种用户访问路径的数据采集方法、系统及服务器的制作方法
技术领域
本发明涉及网络服务技术,特别涉及一种用户访问路径的数据采集方法、 系统及网页服务器。
背景技术
现有技术中,路径分析是指对用户的行为进行分析,其通过收集用户使用 服务时操作的相关数据,并对这些数据进行分析,并将分析结果用于改善用户 的体验。现有收集路径分析相关数据的方式主要是通过供应商进行收集,获取用户访问路径的方法主要是在用户需要服务时,用户通过对页面进行操作点击来 完成;在用户对页面进行点击操作后,先将该点击链接到信息采集服务器,由 采集服务器对数据进行采集,然后由采集服务器将访问页面地址重新定向到应 用服务器,应用服务器再向用户提供服务,其中,采集服务器是由供应商为网 站提供的,专门用来收集相关的数据设备。但是利用该方案的不足在于只能收集用户点击链接操作的数据,只能做 链接浏览量统计,想做用户路径分析基本不可能。因为用户路径分析需要的数 据包括表单提交,业务处理是否正确等数据,这些数据是无法通过目前的模式 来获取的;同时,现有技术的不足还在于,传统模式在更换运营商时成本比较 高,需要把所有监控点上布置的链接到更换前供应商提供的信息采集服务器的 设置人工改掉,否则会影响运行中的业务,即还会链接到更换前的营运商提供 的信息采集服务器上。发明内容本发明解决的技术问题在于提供了一种用户访问路径的数据采集方法、系 统及网页服务器,用以解决获取用户访问路径数据的釆集问题。本发明实施例中提供了 一种用户访问路径的数据采集方法,包括如下步骤用户在网页上通过提供给用户进行交互的功能区域进行信息交互;在用户在对网页中的功能区域进行操作时,获取所操作的区域提供的功能,及用户在该区域执行的操作;根据各区域提供的功能及用户在该区域的操作得到该用户的访问路径。 本发明实施例中还提供了 一种用户访问路径的数据采集系统,包括 网页供给才莫块,用于向用户提供网页,所述网页包含提供给用户进行信息交互的功能区域;获取装置,用于在用户在对网页中的功能区域进行操作时,获取所操作的 区域提供的功能,及用户在该区域执行的操作,并将获取用户信息发送至数据 服务器;数据服务器,用于存储获取装置发送至的用户信息;数据仓库系统,用于根据数据服务器中的用户信息得到各用户的访问路径。本发明实施例中又提供了一种网页服务器,包括 网页供给模块,用于向用户提供网页,所述网页包含提供给用户进行信息 交互的功能区域;获取装置,用于在用户在对网页中的功能区域进行才喿作时,获取所操作的 区域提供的功能,及用户在该区域执行的操作。 本发明实施时的有益效果如下本发明在实施时,在用户在对网页中的功能区域进行操作时,获取所操作 的区域提供的功能,及用户在该区域执行的操作;并根据各区域提供的功能及 用户在该区域的操作得到该用户的访问路径。其并不像现有技术一样,将点击链接至采集服务器,采集后才重定向到用户需要的服务器,而是,直接通过用 户在网页上的操作来获取访问路径有关的数据,因此,在更换运营商时成本低, 并不需要用人工把所有监控点上布置的、链接到更换前供应商提供的信息采集服务器上的链接设置重新改掉,也不会影响运行中的业务;同时,由于采集的数据是根据功能区域来设置的,因此本方案中并不仅限 于只能像现有技术一样收集用户点击链接操作的数据,只能做链接浏览量统 计;而是能够全面地掌握用户在网页上所进行各种操作,显然,使用本发明实 施的方案可以获得更多的信息。


图1为本发明实施例中所述用户访问路径的数据采集方法实施流程示意图;图2为本发明实施例中所述用户访问路径的数据釆集系统结构示意图; 图3为本发明实施例中所述网页服务器结构示意图。
具体实施方式
下面结合附图对本发明的具体实施方式
进行说明。图1为用户访问路径的数据采集方法实施流程示意图,如图所示,在采集 用户的访问路径数据时,可以包括如下步骤步骤101、用户在网页上通过提供给用户进行交互的功能区域进行信息交互;步骤102、在用户在对网页中的功能区域进行操作时,获取所操作的区域 提供的功能,及用户在该区域执行的操作;步骤103、根据各区域提供的功能及用户在该区域的操作得到该用户的访 问路径。易知,网页中包括很多区域,其中有些仅仅才是供文字信息,如新闻网页的文字区域,但是网页中会包括一些插件,通过它们,用户可以通过点选等方式 来进行选择,比如一个关于投票的网页中,会在一个功能区中设置若干供选择的选项,用户可以通过点选相应的选项来完成投票。步骤101中所指的提供给用户进行交互的功能区域即指这些区域,确定该功能区域的目的在于,对用户 访问路径的分析在于了解用户的行为模式,而了解其行为的最好方式莫过于能 够收集到用户表达的意愿,用户在这些区域的操作实际上就是其意愿的表达, 因此通过收集这些信息,便可以获得用户的真实访问路径。具体实施中,提供给用户进行交互的功能区域可以包括按钮点击区域、 表单提交区域、AJAX (Asynchronous JavaScript+ XML)页面加载区域其 中之一或者其组合。具体的,在步骤102中,在用户在对网页中的功能区域进行操作时,获取 所操作的区域提供的功能,及用户在该区域执行的操作,可以具体为在网页中的功能区域设置网页标签,所述网页标签在用户对该区域进行操 作时进行响应,所述响应的内容包括该区域所提供的功能及执行的操作;在用户在对网页中的功能区域进行操作时,该区域设置的网页标签进行响应;根据所述响应内容获取该区域提供的功能及用户在该区域的操作。 下面以网页为HTML (HyperText Markup Language,超文本标记语言)网 页,网页标签为HTML网页标签为例来进行说明。但是,本步骤中设置网页 标签的目的在于,通过网页标签这种手段来获取用户在功能区域的操作情况, 事实上,即使网页有不同的技术构成形式,也可以采糾目应的技术手段在相应 的区域采集这些数据,这对于了解网页制作技术的本领域技术人员来说是容易 理解的。因此,实施例中仅用以HTML技术制成的网页的实施为例进行说明。 实际应用中可以使用Jquery的javascript框架,因为它提供了很多便捷的 方法,如监控网页上的特定点的按钮点击、以及表单提交。使用它的监控机制 并定义新的HTML标签,对这类标签上发生的动作可以全部都监控。8200810210895.6 据的功能区域设置网页标签,本领域技术人员常称为埋点;例如将网页标签定义为<a href="http:〃www.alipay.com" gz="index/summer">, <a href ...>才示签是超链4矣 标签,其中href用来表示链接的目的地址。标签中代码中所示,,gz"标签并不一 定是标准的html标签,可以在这里定义gz标签,gz的数据值为"index/summer", 这个值是具体要收集的一些业务数据,如本例中可以知道这个连接是用户ID (标识)是summer在首页进行的操作。埋好点后,便是监控网页标签,这里可以使用Jquery的选择器, 一个具体 的实例可以々口下<script language = "Javascript,,> $(document).ready(fbnction() { $("a[@gc]").click(fimction(){ 〃发送数据给数据服务器";</script〉上述代码用自然语言描述可以为整个HTML的文档(document)对带有 gc标签的定义为链^:的(a)的控件作动作响应,响应的动作是点击动作(click), 响应时要做的事情就是"发送数据给数据服务器"。这样的代码在实际应用中可以4艮据各种应用场景下的标签进行全面定义, 这是易知的。从上面实施例可知,页面工程师不需要了解^f艮复杂的原理,只需采用他们 熟悉的HTML标签即可完成监控点的埋设,同时,即使是在更换运营商时, 由于监控点只是一个HTML标签,不删除也不会影响原业务,也无须人工改 掉所有监控点上布置的链接设置。这样,当在网页上的功能区域埋好点后,只要用户在页面上的这些区域进 行一些交互动作时,就可以收到相应地方的数据,用于步骤103中的访问路径数据分析处理了。
在步骤103中,根据各区域提供的功能及用户在该区域的操作得到该用户 的访问路径。具体实施中,当获取了各功能区域所执行的功能、以及每一个用 户在该区域执行的操作,那么就可以根据这些数据进行用户的行为分析,从而 针对用户进行服务的改善,至于如何分析处理这些数据、以及得出何种结论, 按照不同的心理分析模型便可以进行了 ,这对于已经获取到这些原始数据的本 领域技术人员来说是容易理解的。例如在一个商品购买提交表单的功能区域 里,获得A用户进行的操作都是选择红色的选项,而B用户的操作都是选择 绿色的选项,那么显然,A用户偏好红色,而B用户偏好绿色。
根据同 一发明构思,本发明还提供了 一种用户访问路径的数据采集系统及 网页服务器,下面对采集系统及网页服务器的具体实施方式
进行说明。
图2为用户访问路径的数据釆集系统结构示意图,如图所示,釆集系统中 可以包括
网页供给模块201,用于向用户提供网页,所述网页包含提供给用户进行 信息交互的功能区域;
获取装置202,用于在用户在对网页中的功能区域进行操作时,获取所操 作的区域提供的功能,及用户在该区域执行的操作,并将获取用户信息发送至 数据服务器;
数据服务器203,用于存储获取装置发送至的用户信息; 数据仓库系统204,用于根据数据服务器中的用户信息得到各用户的访问 路径。
实施中,网页供给模块201向用户提供网页,这样用户便可以在这些网页 上进行信息交互了 ;获取装置202在用户在对网页中的功能区域进行操作时, 获取所操作的区域提供的功能,及用户在该区域执行的操作,并将获取用户信 息发送至数据服务器,这样便取得了用于分析用户访问路径的原始数据;数据 服务器203存储获取装置发送至的用户信息;然后利用数据仓库系统204来根据数据服务器中的用户信息得到各用户的访问路径。
实施中,网页供给模块还可以进一步用于在提供的网页中的功能区域设置 网页标签,所述网页标签在用户对该区域进行操作时进4亍响应,所述响应的内
容包括该区域所提供的功能及执行的操作;
在此方案下,则获取装置可以进一步用于通过响应内容获取该区域提供的 功能及用户在该区域进行的操作。
网页供给模块可以在网页为HTML网页,设置的网页标签为HTML网页 标签。
网页供给模块可以通过Jquery的javascript框架设置网页标签。
网页供给模块还可以进一步用于在网页上提供给用户进行交互的按钮点
击区域、表单提交区域、AJAX页面加载区域其中之一或者其组合的功能区域
上设置网页标签。
获取装置则还可以进一步用于将获取用户信息使用AJAX技术发送至数据 服务器。
获取装置可以将获得的数据采用AJAX同步调用机制发送到数椐采集服务 器上,该技术的关键在于对浏览器端的JavaScript, DHTML和与服务器异步通 信的组合。AJAX技术使浏览器可以为用户提供更为自然的浏览体验。AJAX 提供与服务器异步通信的能力,从而使用户从请求/响应的循环中解脱出来。借 助于AJAX,可以在用户单击按钮时,使用JavaScript和DHTML立即更新数 据,并向服务器发出异步请求,以执行更新或查询数据库。当请求返回时,就 可以使用JavaScript和CSS来相应地更新数据,而不是刷新整个页面。最重要 的是,用户甚至不知道浏览器正在与服务器通信,Web站点看起来是即时响应 的。因此,使用该技术,可以收集到非页面点击产生的用户行为,现在互联网 上AJAX页面无刷新技术广泛应用,使得本发明的技术方案可以无侵入式的轻 松获取用户访问路径信息。
下面举一实例用以说明使用AJAX技术来发送获取的数据,实例可以如下<script language = "Javascript"> $.ajax({
url:"http:〃gc-alipay,com/index.do",
async:falss }) .responsetext; </script>
其中async-false表示非异步,此时会锁住浏览器,待数据返回后再继续 往下扭J亍。
上述代码可以用自然语言描述为把数据发送到服务器为gc.alipay.com的 应用index.do上,发送时需要锁住浏览器,数据没有交互完成时不能解锁,即 完成了一个同步调用。
系统中,由于采用了AJAX技术,使得各模块实体关系中,网页供给模块 与数据服务器之间的关系是松耦合的关系,而数据仓库系统则与网页供给模块 没有直接关系,数据仓库系统是用来分析获取的用户操作数据从而得到完整的 用户访问路径数据。而现有技术中,在用户对页面进行点击操作后,由于其会 先将该点击链接到信息采集服务器,由采集服务器对数据进行采集,然后由采 集服务器将访问页面地址重新定向到应用服务器,应用服务器再向用户提供服 务,因此,采集服务器与供给网页的服务器之间是强耦合的关系,显然,采用 本技术方案可以在用户的访问过程中,并不会出现现有技术中需等待链接、再 重定向的等待过程。
图3为网页服务器结构示意图,如图所示,本服务器中可以包括
网页供给模块201,用于向用户提供网页,所述网页包含提供给用户进行 信息交互的功能区域;
获取装置202,用于在用户在对网页中的功能区域进行操作时,获取所操 作的区域提供的功能,及用户在该区域执行的操作。
网页供给模块可以进一步用于在提供的网页中的功能区域设置网页标签, 所述网页标签在用户对该区域进行操作时进行响应,所述响应的内容包括该区域所提供的功能及执行的操作;
获取装置还可以进一步用于通过所述响应内容获取该区域提供的功能及 用户在该区域进行的搡作。
综上所述,本发明在实施时,在用户在对网页中的功能区域进行才喿作时, 获取所操作的区域提供的功能,及用户在该区域执行的操作;并根据各区域提 供的功能及用户在该区域的操作得到该用户的访问路径。其并不像现有技术一 样,将链接至采集服务器,采集后才重定向到用户需要的服务器,而是,直接 通过用户在网页上的操作来获取访问路径有关的数据,因此,其能够减少用户 访问时的等待过程,并且,在更换运营商时成本低,不需要把所有监控点上布 置的链接到更换前供应商提供的信息采集服务器的设置人工改掉,也不会影响 运行中的业务。
同时,由于采集的数据是根据功能区域来设置的,因此本方案中并不仅限 于只能像现有技术一样收集用户点击链接操作的数据,只能做链接浏览量统 计;而是能够全面地掌握用户在网页上所进行各种操作,显然,使用本发明实 施的方案可以获得更多的信息。
进一步的,可以通过在功能区域定义HTML标签来获取在它上面发生的 用户操作行为,因此,页面工程师不需要了解很复杂的原理,采用他们熟悉的 HTML标签即可完成监控点的埋设,当要更换技术方案时原监控点只是一个特 殊html标签,不删除也不会影响原业务。
进一步的,获取到数据后采用AJAX同步发送到数据服务器,使得本发明 实施时可以收集到非页面点击产生的用户行为,可以无侵入式的轻松监控。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计 算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结 合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包 含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产 品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入 式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算 机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一 个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设
备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中 的指令产生包括指令装置的制造品,该指令装置实现在流程图 一个流程或多个 流程和/或方框图 一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使
得在计算机或其他可编程设备上执行一 系列操作步骤以产生计算机实现的处 理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个 流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员 一旦得知了基 本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要 求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及 其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
权利要求
1、一种用户访问路径的数据采集方法,其特征在于,包括如下步骤用户在网页上通过提供给用户进行交互的功能区域进行信息交互;在用户在对网页中的功能区域进行操作时,获取所操作的区域提供的功能,及用户在该区域执行的操作;根据各区域提供的功能及用户在该区域的操作得到该用户的访问路径。
2、 如权利要求1所述的方法,其特征在于,所述在用户在对网页中的功 能区域进行操作时,获取所操作的区域提供的功能,及用户在该区域执行的操 作,具体为在网页中的功能区域设置网页标签,所述网页标签在用户对该区域进行才乘 作时进行响应,所述响应的内容包括该区域所提供的功能及执行的操作;在用户在对网页中的功能区域进行操作时,该区域设置的网页标签进行响应;根据所述响应内容获取该区域提供的功能及用户在该区域的操作。
3、 如权利要求2所述的方法,其特征在于,所述网页为超文本标记语言 网页,所述网页标签为超文本标记语言网页标签。
4、 如权利要求2所述的方法,其特征在于,所述网页标签通过Jquery的 javascript框架进行设置。
5、 如权利要求1所述的方法,其特征在于,所述在网页上提供给用户进 行交互的功能区域包括按钮点击区域、表单提交区域、AJAX页面加载区域 其中之一或者其组合。
6、 一种用户访问路径的数据采集系统,其特征在于,包括 网页供给模块,用于向用户提供网页,所述网页包含提供给用户进行信息交互的功能区域;获取装置,用于在用户在对网页中的功能区域进行操作时,获取所操作的 区域提供的功能,及用户在该区域执行的操作,并将获取用户信息发送至数据服务器;数据服务器,用于存储获取装置发送至的用户信息;数据仓库系统,用于根据数据服务器中的用户信息得到各用户的访问路径。
7、 如权利要求6所述的采集系统,其特征在于,所述网页供给模块进一 步用于在提供的网页中的功能区域设置网页标签,所述网页标签在用户对该区 域进行操作时进行响应,所述响应的内容包括该区域所提供的功能及执行的操 作;所述获取装置进一步用于通过所述响应内容获取该区域提供的功能及用户在该区域进行的操:作。
8、 如权利要求7所述的采集系统,其特征在于,所述网页供给沖莫块进一 步用于在网页为超文本标记语言网页,设置的网页标签为超文本标记语言网页 标签。
9、 如权利要求7所述的采集系统,其特征在于,所述网页供给模块进一 步用于通过Jquery的javascript框架设置网页标签。
10、 如权利要求7所述的采集系统,其特征在于,所述网页供给模块进一 步用于在网页上提供给用户进行交互的按钮点击区域、表单提交区域、AJAX 页面加载区域其中之一或者其组合的功能区域上设置网页标签。
11、 如权利要求6所述的采集系统,其特征在于,所述获取装置进一步用 于将获取用户信息使用AJAX技术发送至数据服务器。
12、 一种网页服务器,其特征在于,包括网页供给模块,用于向用户提供网页,所述网页包含提供给用户进行信息 交互的功能区域;获取装置,用于在用户在对网页中的功能区域进行操作时,获取所操作的 区域提供的功能,及用户在该区域执行的操作。
13、 如权利要求12所述的服务器,其特征在于,所述网页供给模块进一步用于在提供的网页中的功能区域设置网页标签,所述网页标签在用户对该区 域进行操作时进行响应,所述响应的内容包括该区域所提供的功能及执行的操作;所述获取装置进一步用于通过所述响应内容获取该区域提供的功能及用 户在该区域进行的操作。
全文摘要
本发明公开了一种用户访问路径的数据采集方法、系统及网页服务器,包括用户在网页上通过提供给用户进行交互的功能区域进行信息交互;在用户在对网页中的功能区域进行操作时,获取所操作的区域提供的功能,及用户在该区域执行的操作;根据各区域提供的功能及用户在该区域的操作得到该用户的访问路径。使用本发明,在更换运营商时成本低,不需要把所有监控点上布置的链接到更换前供应商提供的信息采集服务器的设置人工改掉,也不会影响运行中的业务;同时,还能够全面地掌握用户在网页上所进行各种操作,可以获得更多的信息。
文档编号H04L29/08GK101662493SQ20081021089
公开日2010年3月3日 申请日期2008年8月25日 优先权日2008年8月25日
发明者天 夏 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1