路径分析方法和装置制造方法

文档序号:6519853阅读:403来源:国知局
路径分析方法和装置制造方法
【专利摘要】本发明公开了一种路径分析方法和装置,其中,该方法包括:建立访问表,其中,访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息;查找访问表中包含特定路径的条目;根据该条目,进行特定路径相关的路径分析。通过本发明,解决了相关技术中通过对数据仓库中的路径访问表进行自连接来进行路径分析所导致的执行效率低的问题,提高了路径分析的效率。
【专利说明】路径分析方法和装置【技术领域】
[0001]本发明涉及数据分析领域,具体而言,涉及一种路径分析方法和装置。
【背景技术】
[0002]联机分析处理(On-Line Analytical Processing,简称为0LAP)是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。决策数据是多维数据,多维数据就是决策的主要内容。OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。有关OLAP的相关资料可以进一步参见百度百科:httpj//baike.baidu.com/view/22068.htm?fromld=57810中的描述,在此不再赘述。
[0003]路径导航:路径是用户访问网站的路径链,如从A页面再访问B页面再回到A页面,再离开,则表示路径为A->B->A。路径导航即是通过界面来展示用户的访问路径。
[0004]在Olap里,路径导航主要包括:
[0005]前置页面分析:选定某一个统一资源定位符(Uniform Resource Locator,简称为URL)路径,查看访问本页面的所有用户前一个页面的分布情况;
[0006]后置页面分析:选定某一个URL路径,查看访问本页面的所有用户后一个页面的分布情况。
[0007]然而,在相关技术中,并没有采用Olap的实现方式,而是采用了通过查询数据仓库来获得特定URL的前置和后置页面,并进行相关页面的指标(例如访问次数、停留时长等)的统计分析的方法。
[0008]相关技术中基于传统数据仓库的路径导航分析方法采用了如下的技术方案:
[0009]建立一张路径访问表,在路径访问表中,包含:列,用户名(VisitorKey),会话ID(SessionID),当前访问页面(PageKey),下一个访问页面(NextPageKey);
[0010]以相关技术中的前置页面分析方法为例:根据PageKey=选定页面,通过NextPageKey去查找下一个页面的分布情况。
[0011]采用上述的技术方案,若是要多级剖析,即分析以某一页面其特定后置页面的再后置页面分布情况,则需要进行表连接操作,并且,需要剖析多少级,便需要多少次的表连接操作。发明人在研究过程中发现,在剖析多级路径时,由于要进行大量的自连接操作,其执行效率将会很慢。
[0012]针对相关技术中通过对数据仓库中的路径访问表进行自连接来进行路径分析所导致的执行效率低的问题, 目前尚未提出有效的解决方案。

【发明内容】
[0013]本发明提供了一种路径分析方法和装置,以至少解决相关技术中的上述问题。
[0014]根据本发明的一个方面,提供了 一种路径分析方法,包括:建立访问表,其中,所述访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息;查找所述访问表中包含特定路径的条目;根据所述条目,进行特定路径相关的路径分析。
[0015]优选地,建立所述访问表包括:获取数据仓库中保存的原始访问表,其中,所述原始访问表中的每个条目中保存有一个用户访问的一个路径的信息;根据所述原始访问表,建立所述访问表。
[0016]优选地,在所述特定路径相关的路径分析为所述特定路径的前置分析的情况下,根据所述条目,进行所述特定路径相关的路径分析包括:确定所述条目中用户在访问所述特定路径之前所访问的路径的信息;确定用户在访问所述特定路径之前所访问的路径的分布情况。
[0017]优选地,在所述前置分析为N级前置分析的情况下,根据所述条目,进行所述特定路径相关的路径分析包括:确定所述条目中用户在访问所述特定路径之前所访问的N个路径的信息;确定用户在访问所述特定路径之前所访问的N个路径的分布情况,其中,N为正整数。
[0018]优选地,在所述特定路径相关的路径分析为所述特定路径的后置分析的情况下,根据所述条目,进行所述特定路径相关的路径分析包括:确定所述条目中用户在访问所述特定路径之后的所访问的路径的信息;确定用户在访问所述特定路径之后的所访问的路径的分布情况。
[0019]优选地,在所述后置分析为M级后置分析的情况下,根据所述条目,进行所述特定路径相关的路径分析包括:确定所述条目中用户在访问所述特定路径之后的所访问的M个路径的信息;确定用户在访问所述特定路径之后的所访问的M个路径的分布情况,其中,M为正整数。
[0020]根据本发明的另一个方面,还提供了一种路径分析装置,包括:建立模块,用于建立访问表,其中,所述访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息;查找模块,用于查找所述访问表中包含特定路径的条目;分析模块,用于根据所述条目,进行特定路径相关的路径分析。
[0021]优选地,所述建立模块包括:获取单元,用于获取数据仓库中保存的原始访问表,其中,所述原始访问表中的每个条目中保存有一个用户访问的一个路径的信息;建立单元,用于根据所述原始访问表,建立所述访问表。
[0022]优选地,所述分析模块包括:第一确定单元,用于确定所述条目中用户在访问所述特定路径之前所访问的路径的信息;第二确定单元,用于确定用户在访问所述特定路径之前所访问的路径的分布情况。
[0023]优选地,所述分析模块包括:第三确定单元,用于确定所述条目中用户在访问所述特定路径之后的所访问的路径的信息;第四确定单元,用于确定用户在访问所述特定路径之后的所访问的路径的分布情况。
[0024]根据本发明的另一个方面,还提供了一种路径分析系统,包括:数据仓库和路径分析装置,其中,所述数据仓库,用于建立访问表,其中,所述访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息;所述路径分析装置,用于查找所述访问表中包含特定路径的条目,并根据所述条目,进行特定路径相关的路径分析。
[0025]通过本发明,采用建立访问表,其中,访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息;查找访问表中包含特定路径的条目;根据该条目,进行特定路径相关的路径分析的方式,解决了相关技术中通过对数据仓库中的路径访问表进行自连接来进行路径分析所导致的执行效率低的问题,提高了路径分析的效率。
【专利附图】

【附图说明】
[0026]此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0027]图1是根据本发明实施例的路径分析方法的流程示意图;
[0028]图2是根据本发明实施例的路径分析装置的结构示意图;
[0029]图3是根据本发明实施例的路径分析系统的结构示意图;
[0030]图4是根据本发明优选实施例的路径导航结果的示意图;
[0031]图5是根据本发明优选实施例的路径分析系统的工作示意图;
[0032]图6是根据本发明优选实施例的路径导航分析结果的示意图。
【具体实施方式】
[0033]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
[0034]在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0035]本实施例提供了一种路径分析方法,图1是根据本发明实施例的路径分析方法的流程示意图,如图1所示,该流程包括如下步骤:
[0036]步骤S102,建立访问表,其中,访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息;
[0037]步骤S104,查找访问表中包含特定路径的条目;
[0038]步骤S106,根据条目,进行特定路径相关的路径分析。
[0039]通过上述步骤,通过采用建立每个天幕中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息的访问表,从而使得在进行特点路径相关的路径分析的情况下只需要查找建立的访问表中特定路径的条目,而不再需要再进行表的自连接。相对于相关技术中在分析时需要对数据仓库中的数据进行自连接操作导致的执行效率变低,本实施例提供的上述方案解决了通过对数据仓库中的路径访问表进行自连接来进行路径分析所导致的执行效率低的问题,提升了路径分析的效率。
[0040]优选地,在步骤S102中建立的访问表是通过数据仓库中保存的原始访问表生成的,并且可以由数据仓库或者其他装置来生成访问表,生成访问表的时间可以选在系统空闲的时间段内,并以保证路径数据更新的及时性为最低要求。例如,获取数据仓库中保存的原始访问表,并根据原始访问表,建立访问表,其中,原始访问表中的每个条目中保存有一个用户访问的一个路径的信息。通过上述处理,通过将处理时间转移到系统空闲时间,从而提高了路径分析时的分析效率。
[0041]优选地,在特定路径相关的路径分析为特定路径的前置分析的情况下,在进行特定路径相关的路径分析时,先确定条目中用户在访问特定路径之前所访问的路径的信息;然后根据确定的路径信息,确定用户在访问特定路径之前所访问的路径的分布情况,例如,页面的浏览次数的总体分布情况、页面的浏览次数按照时间规律的分布情况、页面的浏览时长分布情况、页面的浏览时长按照时间规律的分布情况等。
[0042]优选地,在前置分析为N级前置分析的情况下,在进行特定路径相关的路径分析时,先确定条目中用户在访问特定路径之前所访问的N个路径的信息;然后根据确定的N个路径的信息,确定用户在访问特定路径之前所访问的N个路径的分布情况,其中,N为正整数。
[0043]优选地,在特定路径相关的路径分析为特定路径的后置分析的情况下,在进行特定路径相关的路径分析时,先确定条目中用户在访问特定路径之后的所访问的路径的信息;然后根据确定的路径信息,确定用户在访问特定路径之后的所访问的路径的分布情况。
[0044]优选地,在后置分析为M级后置分析的情况下,在进行特定路径相关的路径分析时,先确定条目中用户在访问特定路径之后的所访问的M个路径的信息;然后根据确定的M个路径的信息,确定用户在访问特定路径之后的所访问的M个路径的分布情况,其中,M为正整数。
[0045]本实施例还提供了一种路径分析装置,该装置用于实现上述路径分析方法,该装置实施例中的功能实现在上述方法实施例中已经进行过详细的说明,在此将不再赘述。
[0046]图2是根据本发明实施例的路径分析装置的结构示意图,如图2所示,该装置包括:建立模块22、查找模块24和分析模块26,其中,建立模块22,用于建立访问表,其中,访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息;查找模块24耦合至建立模块22,用于查找访问表中包含特定路径的条目;分析模块26耦合至查找模块24,用于根据条目,进行特定路径相关的路径分析。
[0047]本发明的实施例中所涉及到的模块、单元可以通过软件的方式实现,也可以通过硬件的方式来实现。本实施例中的所描述的模块、单元也可以设置在处理器中,例如,可以描述为:一种处理器包括建立模块22、查找模块24和分析模块26。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,建立模块还可以被描述为“用于建立访问表的模块”。
[0048]优选地,建立模块22包括:获取单元222耦合至数据仓库,用于获取数据仓库中保存的原始访问表,其中,原始访问表中的每个条目中保存有一个用户访问的一个路径的信息;建立单元224耦合至获取单元222,用于根据原始访问表,建立访问表。
[0049]优选地,分析模块26包括:第一确定单元262,用于确定条目中用户在访问特定路径之前所访问的路径的信息;第二确定单元264耦合至第一确定单元262,用于确定用户在访问特定路径之前所访问的路径的分布情况。
[0050]优选地,第一确定单元262还用于确定条目中用户在访问特定路径之前所访问的N个路径的信息;第二确定单元还用于确定用户在访问特定路径之前所访问的N个路径的分布情况。
[0051]优选地,分析模块26包括:第三确定单元266,用于确定条目中用户在访问特定路径之后的所访问的路径的信息;第四确定单元268耦合至第三确定单元266,用于确定用户在访问特定路径之后的所访问的路径的分布情况。
[0052]优选地,第三确定单元266还用于确定条目中用户在访问特定路径之后的所访问的M个路径的信息;第四确定单元268还用于确定用户在访问特定路径之后的所访问的M个路径的分布情况。
[0053]本实施例还提供了一种路径分析系统,该系统用于实现上述路径分析方法,该系统实施例中的功能实现在上述方法实施例中已经进行过详细的说明,在本系统实施例中可以结合上述描述进行说明,在此将不再赘述。
[0054]图3是根据本发明实施例的路径分析系统的结构示意图,如图3所示,该系统包括:数据仓库32和路径分析装置34,其中,数据仓库32,用于建立访问表,其中,访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息;路径分析装置,用于查找访问表中包含特定路径的条目,并根据条目,进行特定路径相关的路径分析。
[0055]由上述描述可知:在该系统实施例中,将建立访问表的过程移植到数据仓库中进行处理。可以理解的是,无论是在数据仓库中还是在路径分析装置中进行处理都能够实现本发明的有益效果,均应在本发明的保护范围之内。
[0056]下面结合优 选实施例进行描述和说明。
[0057]本优选实施例提供了一种Olap高效路径导航分析方案,以解决相关技术不能在Olap里进行分析查询,只能在数据仓库里进行分析查询,并且性能比较低,每次导航都需要一次页面表的自连接操作的问题。本优选实施例中提供的Olap高效路径导航分析装置,由于不会有表的自连接操作,从而性能高效。
[0058]在本优选实施例中,采用N级高效方式,N指代任意正整数,若为I则可以退化成传统的实现方式,此设置是为了避免在Olap里发生类似上面传统方式的表自连接查询操作,通过存储空间换取查询时间。
[0059]本优选实施例包括如下步骤:
[0060]步骤Sll,在数据仓库里建立一张访问表,包含列VisitorKey (访客唯一标识),SessionID (会话唯一标识),PagelKey (路径链上的第一条路径),Page2Key,…,PageNKey,这样一行记录表示用户的一次访问路径,其后续的扩展N列代表此路径的后续N个路径;
[0061]步骤S12,为每个PageKey定义其退出默认值,该默认值标识用户离开网站;
[0062]步骤S13,为各page2Key —直到PageNKey的路径列进行赋值,形成从各路径点开始的后续N路径信息,若后续离开的则将其设置为定义的默认值;
[0063]步骤S14,01ap里设计时添加PagelKey —直到PageNKey的N个页面维度,分别与访问路径表的PagelKey到PageNKey通过对应的键关联;
[0064]步骤S15,通过上面的设置后,便可方便的进行下面的分析:
[0065]前置分析:查找Page2Key为特定页面的前一页面路径PagelKey的分布情况;
[0066]后置分析:查找PagelKey为特定页面的后一页面路径Page2Key的分布情况;
[0067]多级前置分析:在N级内,通过扩展的PageNKey到PagelKey可以直接剖析前置的N级,而不需要进行表连接,当超过N级的前置路径分析退化成传统实现里的表连接方式;
[0068]多级后置分析:在N级内,通过扩展的PagelKey到PageNKey可以直接剖析后置的N级,而不需要进行表连接,当超过N级的后置路径分析退化成传统实现里的表连接方式。
[0069]下面结合具体的实例对上述优选实施例进行说明。
[0070]图4是根据本发明优选实施例的路径导航结果的示意图,如图4所示,选取任一页面,便可以查看其前置和后置页面,即从哪来,到哪去了 ;多级剖析(即多级前置或者多级后置分析)是指到哪去后又到哪去了等,采用本优选实施例的方案可支持N级剖析或无限级剖析。
[0071]例如,图5是根据本发明优选实施例的路径分析系统的工作示意图,如图5所示,在采用本优选实施例的一个方案中,通过数据仓库装置、OLAP装置和查询装置来完成路径导航分析。
[0072]其中,在数据仓库装置中:
[0073]在上述步骤Sll中,数据仓库建立表,包含列VisitorKey (访客唯一标识),SessionID (会话唯一标识),PagelKey (路径链上的第一条路径),Page2Key,…,PageNKey,例如:
[0074]获得原始页面路径顺序,假设如下表1所示的pl->p2->pl:
[0075]表1
[0076]
【权利要求】
1.一种路径分析方法,其特征在于包括: 建立访问表,其中,所述访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息; 查找所述访问表中包含特定路径的条目; 根据所述条目,进行特定路径相关的路径分析。
2.根据权利要求1所述的方法,其特征在于,建立所述访问表包括: 获取数据仓库中保存的原始访问表,其中,所述原始访问表中的每个条目中保存有一个用户访问的一个路径的信息; 根据所述原始访问表,建立所述访问表。
3.根据权利要求1或2所述的方法,其特征在于,在所述特定路径相关的路径分析为所述特定路径的前置分析的情况下,根据所述条目,进行所述特定路径相关的路径分析包括: 确定所述条目中用户在访问所述特定路径之前所访问的路径的信息; 确定用户在访问所述特定路径之前所访问的路径的分布情况。
4.根据权利要求3所述的方法,其特征在于,在所述前置分析为N级前置分析的情况下,根据所述条目,进行所述特定路径相关的路径分析包括: 确定所述条目中用户在访问所述特定路径之前所访问的N个路径的信息; 确定用户在访问所述特定路径之前所访问的N个路径的分布情况,其中,N为正整数。
5.根据权利要求1或2所述的方法,其特征在于,在所述特定路径相关的路径分析为所述特定路径的后置分析的情况下,根据所述条目,进行所述特定路径相关的路径分析包括: 确定所述条目中用户在访问所述特定路径之后的所访问的路径的信息; 确定用户在访问所述特定路径之后的所访问的路径的分布情况。
6.根据权利要求5所述的方法,其特征在于,在所述后置分析为M级后置分析的情况下,根据所述条目,进行所述特定路径相关的路径分析包括: 确定所述条目中用户在访问所述特定路径之后的所访问的M个路径的信息; 确定用户在访问所述特定路径之后的所访问的M个路径的分布情况,其中,M为正整数。
7.—种路径分析装置,其特征在于包括: 建立模块,用于建立访问表,其中,所述访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息; 查找模块,用于查找所述访问表中包含特定路径的条目; 分析模块,用于根据所述条目,进行特定路径相关的路径分析。
8.根据权利要求7所述的装置,其特征在于,所述建立模块包括: 获取单元,用于获取数据仓库中保存的原始访问表,其中,所述原始访问表中的每个条目中保存有一个用户访问的一个路径的信息; 建立单元,用于根据所述原始访问表,建立所述访问表。
9.根据权利要求7或8所述的装置,其特征在于,所述分析模块包括: 第一确定单元,用于确定所述条目中用户在访问所述特定路径之前所访问的路径的信息; 第二确定单元,用于确定用户在访问所述特定路径之前所访问的路径的分布情况。
10.根据权利要求7或8所述的装置,其特征在于,所述分析模块包括: 第三确定单元,用于确定所述条目中用户在访问所述特定路径之后的所访问的路径的信息; 第四确定单元,用于确定用户在访问所述特定路径之后的所访问的路径的分布情况。
11.一种路径分析系统,其特征在于包括:数据仓库和路径分析装置,其中, 所述数据仓库,用于建立访问表,其中,所述访问表中的每个条目中保存有根据用户访问路径的顺序保存的一个用户访问的多个路径的信息; 所述路径分析装置,用于查找所述访问表中包含特定路径的条目,并根据所述条目,进行特定路径相关的 路径分析。
【文档编号】G06F17/50GK103605848SQ201310585827
【公开日】2014年2月26日 申请日期:2013年11月19日 优先权日:2013年11月19日
【发明者】洪超, 杨基彬 申请人:北京国双科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1