一种用于确定多个访问对象之间的访问相关性信息的方法

文档序号:6379556阅读:204来源:国知局
专利名称:一种用于确定多个访问对象之间的访问相关性信息的方法
技术领域
本发明涉及网络技术领域,尤其涉及一种用于确定多个访问对象之间的访问相关性信息的技术。
背景技术
随着互联网的不断发展,互联网上的网页数量与网页类型越来越多、各种应用及其功能也层出不穷,大量的网页或功能往往使得用户在选择信息时产生不便,因此需要了解各个网页或功能点之间的联系,从而根据所述网页或功能点之间的联系对网站或产品进行规划,优化产品设计,提高用户的访问体验。当前,对于多个访问对象之间的访问相关性,主要是根据设计者,如产品经理的角度获取所述网页或功能点之间的联系,然而该方法无法从用户角度,根据用户实际应用中·的操作来获取各个访问对象之间的访问相关性,例如无法得到用户在使用一个功能点之后又使用了那些功能点,不同功能点中哪个占比例最高,以及联系最密切多个功能点等,从而无法真实反映用户的意图,使得当前获取多个访问对象之间的访问相关性的方法具有较大的局限性。

发明内容
本发明的目的是提供一种用于确定多个访问对象之间的访问相关性信息的方法与设备。根据本发明的一个方面,提供了一种用于确定多个访问对象之间的访问相关性信息的方法,其中,该方法包括以下步骤a获取关于多个访问对象的一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个;b对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。根据本发明的另一方面,还提供了一种用于确定多个访问对象之间的访问相关性信息的访问分析设备,其中,该设备包括序列获取装置,用于获取关于多个访问对象的一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个;相关性生成装置,用于对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。与现有技术相比,本发明通过访问分析设备获取关于多个访问对象的一个或多个访问序列信息,根据所述访问序列信息中包含的连续的访问记录信息,建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息,从而根据用户对于访问对象的访问记录信息,建立或更新多个访问对象间的访问相关性信息,进而根据所述访问相关性信息为网站或产品的性能优化提供数据支撑,优化产品设计,以提升服务质量,提高用户获取信息的效率,提高用户的访问体验。而且,本发明还可以根据所述访问序列信息,建立表征访问相关性信息的访问视图,进一步地,所述访问视图包括基于力导向模型的访问视图,更进一步地,还可以结合节点速度衰减模型,对所述力导向模型的访问视图中的节点的速度进行确定,从而能够根据所述访问序列信息,生成与所述访问序列信息的可视化访问视图,还可以进一步地结合力导向模型,将所述访问相关性信息利用可视化方式展现出来,使用户能够直观的获取各个访问对象间的访问相关性信息,提高了用户获取访问相关性信息的效率,进而优化产品设计,以提升服务质量,提高用户获取信息的效率,提高用户的访问体验。而且,本发明还可以根据预定的聚合阈值,对所述访问视图中的相关节点进行聚合,从而实现对访问对象的分类,从用户角度提高了对访问对象分类的准确性,进而根据所述访问相关性信息为网站或产品的性能优化提供数据支撑,优化产品设计,以提升服务质量。而且,本发明还可以 根据访问记录信息所对应的权重信息,对所述访问相关性信息进行建立或更新,从而提高了对访问对象分类的准确性,进而根据所述访问相关性信息为网站或产品的性能优化提供数据支撑,优化产品设计,以提升服务质量。而且,本发明还可以根据多个访问对象的访问日志信息,对所述访问日志信息进行筛选,从而获取访问序列信息,从而能够按照不同的需求,灵活的获取访问序列信息;进一步地,还可以根据对访问记录信息之间的操作间隔阈值确定连续的访问记录信息,从而能够根据用户的连续访问记录信息,确定用户的操作信息流,进而根据所述操作信息流,为网站或产品的性能优化提供数据支撑,优化产品设计,以提升服务质量,提高用户获取信息的效率,提高用户的访问体验。而且,本发明还可以根据用户的访问相关性信息,基于在用访问对象,对所述后续访问对象进行确定,从而能够根据所述访问相关性信息,对后续访问对象进行预测,从而为网站或产品的性能优化提供数据支撑,优化产品设计,以提升服务质量,提高用户获取信息的效率,提高用户的访问体验。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显图I示出根据本发明一个方面的一种用于确定多个访问对象之间的访问相关性信息的访问分析设备示意图;图2示出根据本发明一个优选实施例的一种用于确定多个访问对象之间的访问相关性信息的访问分析设备示意图;图3示出根据本发明另一个方面的一种用于确定多个访问对象之间的访问相关性信息的方法流程图;图4示出根据本发明一个优选实施例的一种用于确定多个访问对象之间的访问相关性信息的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。图I示出根据本发明一个方面的一种用于确定多个访问对象之间的访问相关性信息的访问分析设备示意图;其中,该访问分析设备包括序列获取装置11、相关性生成装置12。具体地,序列获取装置11获取关于多个访问对象的一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个 ;相关性生成装置12对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。在此,访问分析设备包括但不限于网络设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设备。其中,所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(CloudComputing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(AdHoc网络)等。本领域技术人员应能理解,其他的访问分析设备同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地,或者按照设定的或实时调整的工作模式要求,进行访问序列信息的获取、访问相关性信息的获取等,直至访问分析设备停止获取关于多个访问对象的一个或多个访问序列信息。序列获取装置11获取关于多个访问对象的一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。具体地,序列获取装置11通过基于各种通信协议(Communications Protocol),与其他能够提供关于多个访问对象的一个或多个访问序列信息的设备,如访问序列信息数据库进行交互,获取关于多个访问对象的一个或多个访问序列信息;或通过与其他能够提供包含访问序列信息的访问日志的设备,如访问日志数据库进行交互,通过日志分析,获取关于多个访问对象的一个或多个访问序列信息。其中,所述访问对象包括但不限于页面,如同一网站的多个页面、一组网站的多个页面、应用的多个应用页面;功能点,如应用的多个功能模块、页面的多个页面元素等。所述访问包括但不限于对所述访问对象的点击、查询、使用、触摸、输入信息等操作。其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。在此,可根据用户对所述访问对象的操作信息进行连续的访问记录信息的判定,如根据相邻操作的时间间隔,当一个用户对多个访问对象的两次操作间隔在10分钟以内,则认为是连续操作等,并将此记录作为一个连续的访问记录信息,所述两次操作可对应于同一个访问对象或不同的访问对象。在此,所述访问序列信息可利用表格、矩阵、数组或其他自定义的格式进行表示。在此,“通信协议”包括计算机通信的传送协议,如TCP/IP、UDP、FTP、ICMP、NetBEUI等,或者存在于计算机中的其他形式通信,例如面向对象编程里面对象之间的通信或操作系统内不同程序或计算机不同模块之间的消息传送协议。相关性生成装置12对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。具体地,相关性生成装置12根据序列获取装置11所获取的关于多个访问对象的一个或多个访问序列信息,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。若当前未存在任何访问对象以及访问对象间的访问相关性信息,或者当前的访问相关性信息中不存在所述连续的访问记录信息中所对应的一个或多个当前访问对象,则相关性生成装置12根据所述访问序列信息,建立所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,例如所述访问序列信息为(A, B),所述A和B表示访问对象,当前访问相关性信息中包括访问对象A,但不包含访问对 象B,则相关性生成装置12建立访问对象B与访问对象A之间的访问相关性信息。其中,建立访问相关性信息的方式,例如,通过在访问相关性信息数据库中添加数据节点并建立节点间的关联关系,或是在访问相关性信息视图中插入新的节点并建立节点间的边,或是在访问相关性矩阵中添加新的行列及调整行列值,或是在访问相关性信息表格中加入新的行列以表示访问对象和访问对象间的访问相关性信息等。若当前的访问相关性信息中存在所述连续的访问记录信息中所对应的一个或多个当前访问对象,则相关性生成装置12根据所述访问序列信息,更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,例如所述访问序列信息为(C,D),所述C和D表示访问对象,当前访问相关性信息中包括访问对象C及访问对象D,则相关性生成装置12更新访问对象C与访问对象D之间的访问相关性信息。其中,更新访问相关性信息的方式,例如,通过在访问相关性信息数据库中更新节点间的关联关系,或是在访问相关性信息视图中更新节点间的边的权重值,或是在访问相关性矩阵中调整行列值,或是在访问相关性信息表格中调整与访问对象间相对应的表格值等方式,以更新访问对象和访问对象间的访问相关性信息等。在此,所述访问相关性信息包括多个访问对象是否属于一个访问操作序列,多个访问对象间的访问顺序,相邻访问对象间的访问时间间隔或多个访问时间间隔的平均数,访问对象的点击次数等。本领域技术人员应能理解上述建立或更新访问相关性信息的方式仅为举例,其他现有的或今后可能出现的建立或更新访问相关性信息的的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,所述相关性生成装置12还可以对于所述一个或多个访问序列信息,按所述访问记录信息以及对应的权重信息,建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。具体地,所述相关性生成装置12还可以按照所述访问记录信息以及对应的权重信息,对所述访问相关性信息进行建立或更新,其中,所述与访问记录信息对应的权重信息表示不同的访问记录信息对于访问相关性的不同程度的影响,例如,当连续的访问记录信息所对应的访问时间越接近或在一定阈值范围内,则对所对应的多个访问对象的影响越大,所对应的权重信息可按照时间间隔的减少而增大等。从而,所述相关性生成装置12按所述访问记录信息以及对应的权重信息,例如,通过在访问相关性信息数据库中以一定的权重数值更新节点间的关联关系,或是在访问相关性信息视图中结合所述权重信息更新节点间的边的权重值,或是在访问相关性矩阵中结合所述权重信息调整行列值,或是在访问相关性信息表格中结合所述权重信息调整与访问对象间相对应的表格值等方式,以更新访问对象和访问对象间的访问相关性信息等。在此,所述建立或更新访问相关性信息的方式与图I中所述相关性生成装置12的建立或更新方式相同或相似,此处不再赘述,并以引用的形式包含于此。优选地,所述序列获取装置11包括日志获取单元(未示出)和序列筛选单元(未示出),其中,日志获取单元获取关于所述多个访问对象的访问日志信息;序列筛选单元根据预定的筛选条件,从所述访问日志信息筛选所述一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。具体地,日志获取单元通过基于各种通信协议(Communications Protocol),与其他能够提供包含访问对象的访问日志信息的设备,如访问日志数据库进行交互,获取关于所述多个访问对象的访问日志信息。序列筛选单元根据预定的筛选条件,从所述访问日志信息筛选所述一个或多个访问序列信息,其中,所述 访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。其中,所述筛选条件包括但不限于所述访问操作信息所对应的操作时段,例如,当多个所述访问操作信息所对应的操作时段为工作时间/休息时间,则按照不同的时段筛选与操作时段对应的访问序列信息;所述访问操作信息所对应的操作用户的地域属性,例如,所述一个或多个用户所对应的地域属性在同一地域(如北京、上海等一线城市,二线城市等等;或按照地理位置分为南北地域等),筛选出所述在同一地域的不同用户所对应的访问序列信息;所述访问操作信息所对应的操作用户的群组属性,例如,不同群组的用户,例如“旅游”、“时尚”等,由于关注的兴趣点不同,对应的访问序列信息可能存在一定的差异,因此将同一群组属性下的操作用户所对应的访问序列信息进行筛选。在此,“通信协议”包括计算机通信的传送协议,如TCP/IP、UDP、FTP、ICMP、NetBEUI等,或者存在于计算机中的其他形式通信,例如面向对象编程里面对象之间的通信或操作系统内不同程序或计算机不同模块之间的消息传送协议。更优选地,所述访问分析设备还包括阈值确定装置(未示出),其中,所述阈值确定装置根据所述访问对象或其所对应的应用信息,确定所述连续的访问记录信息之间的时间间隔的操作间隔阈值;其中,所述序列筛选单元根据所述筛选条件,并结合所述操作间隔阈值,从所述访问日志信息筛选所述一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个,所述连续的访问记录信息之间的时间间隔低于所述操作间隔阈值。具体地,所述阈值确定装置根据所述访问对象或其所对应的应用信息,通过系统预置、用户自定义或是利用机器学习进行获取等方式,确定所述连续的访问记录信息之间的时间间隔的操作间隔阈值;在此,由于所述“访问序列”应是满足操作间隔阈值的同一个用户的多个操作,所以需要对所述操作间隔阈值进行确定;不同的访问对象或其对应的应用信息,所适用的操作间隔可以不同,例如,有些功能点(如注册页面)相比其他功能点(如登录页面)包含很多输入项,或者很多新闻页面的第一页包含很多文字、而后续页面仅包括一个插图等,从而使得所适用的操作间隔阈值不同。所述序列筛选单元根据所述筛选条件,并结合所述操作间隔阈值,从所述访问日志信息筛选所述一个或多个访问序列信息,所述结合操作间隔阈值的方式例如将所属操作间隔阈值作为筛选字段等。在此,所述筛选访问序列信息的方式与图I的优选实施例中的序列筛选单元的所对应的所述筛选访问序列信息的方式相同或相似,此处不再赘述,并以引用的形式包含于此。优选地,所述访问分析设备还包括查询获取装置(未示出)、后续对象确定装置(未示出)和后续对象提供装置(未示出),其中,查询获取装置获取用户提交的关于后续访问对象的查询请求,其中所述查询请求包括所述用户的在用访问对象;后续对象确定装置根据所述多个访问对象之间的访问相关性信息,基于所述在用访问对象,确定与所述在用访问对象相对应的后续访问对象;后续对象提供装置将所述后续访问对象提供给所述用户。具体地,所述查询获取装置通过基于各种通信协议(CommunicationsProtocol),获取查询用户通过点击、滑动、触摸、输入等方式,在例如浏览器或其他可以提交关于后续访问对象的查询请求的应用、软件或系统中,所提交的关于后续访问对象的查询请求,其中所述查询请求包括所述用户的在用访问对象。其中,所述关于后续访问对象的查询请求可·以直接对应于网页(如后续可能点击的网页信息)、网页上的功能模块(如后续可能选择的网页上的一个或多个连接)、后续可能访问的应用(如下一个可能访问的应用APP);所述关于后续访问对象的查询请求还可以对应对于网页或应用或网页/应用上所对应的功能点的优化或测试信息,例如,所述后续访问对象的查询请求为对用户当前的在用访问对象的优化信息,则为了实现优化目的,需要获取与用户的在用访问对象相关联的后续访问对象信息等。后续对象确定装置根据所述多个访问对象之间的访问相关性信息,基于所述在用访问对象,确定与所述在用访问对象相对应的后续访问对象。具体地,所述后续对象确定装置基于所述查询请求包括的所述用户的在用访问对象,通过根据多个访问对象之间的访问相关性信息,确定与所述在用访问对象相对应的后续访问对象。例如,通过根据在用访问对象所对应的节点的各个有向边的度或权重等信息,将度或权重最高的一个或多个有向边所对应的节点(即访问对象)作为后续访问对象。其中,所述后续访问对象包括但不限于单个或多个可供选择的后续访问对象,或多个可形成访问序列的后续访问对象,例如,可根据聚类或遍历的方式,确定多个可形成访问序列的后续访问对象等。后续对象提供装置将所述后续访问对象提供给所述用户。具体地,后续对象提供装置基于各种通信协议(CommunicationsProtocol),通过直接与用户进行交互,或通过调用用户设备所提供的应用程序接口(API),或http、https等其他约定的通信方式的格式要求,将所述后续访问对象提供给所述用户。在此,“通信协议”包括计算机通信的传送协议,如TCP/IP、UDP、FTP、ICMP、NetBEUI等,或者存在于计算机中的其他形式通信,例如面向对象编程里面对象之间的通信或操作系统内不同程序或计算机不同模块之间的消息传送协议。图2示出根据本发明一个优选实施例的一种用于确定多个访问对象之间的访问相关性信息的访问分析设备示意图;其中,该访问分析设备包括序列获取装置11’、相关性生成装置12’。具体地,序列获取装置11’获取关于多个访问对象的一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个;相关性生成装置12’对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新用于表征所述多个访问对象之间访问相关性信息的访问视图,其中,所述访问视图包括节点及相邻节点间的有向边,所述节点对应于所述多个访问对象中之一,所述有向边表征在该有向边的起点所对应的访问对象与该有向边的终点所对应的访问对象之间的访问相关性信息。其中,访问分析设备中的序列获取装置11’与图I所示对应装置相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地,或者按照设定的或实时调整的工作模式要求,进行访问序列信息的获取、表征所述多个访问对象之间访问相关性信息的访问视图的建立或更新等,直至访问分析设备停止获取关于多个访问对象的一个或多个访问序列信息。相关性生成装置12’对于所述一个或多个访问序列信息,按所述访问记录信息建 立或更新用于表征所述多个访问对象之间访问相关性信息的访问视图,其中,所述访问视图包括节点及相邻节点间的有向边,所述节点对应于所述多个访问对象中之一,所述有向边表征在该有向边的起点所对应的访问对象与该有向边的终点所对应的访问对象之间的访问相关性信息。具体地,相关性生成装置12’根据序列获取装置11’所获取的访问序列信息,将所述访问序列信息中的每个访问对象通过映射等方式,对应于访问视图中的一个节点,将所述访问对象与对应的另一个访问对象之间的访问相关性信息,通过映射等方式,对应于访问视图中的一条有向边或有向边的权重,例如,用户先访问了访问对象A,然后点击了访问对象B,则建立从A到B的有向边等,从而建立或更新用于表征所述多个访问对象之间访问相关性信息的访问视图。在此,所述访问视图包括但不限于经过绘制后的可视化视图,如可呈现给用户的图片等,或者未经绘制的访问视图数据,所述访问视图数据可供绘制等处理。所述访问视图的绘制可以利用canvas绘图方式生成二维视图,也可以根据webGL绘图方式生成三维视图。优选地,所述建立或更新操作包括以下任一项-按所述访问记录信息在所述访问视图中建立对应所述前一访问对象的出节点和/或对应所述当前访问对象的入节点,并建立从所述出节点指向所述入节点的有向边,即,当前访问对象所对应的入节点和/或前一访问对象所对应的出节点不存在时,在所述访问视图中建立与其相对应的节点,并建立与其相对应的有向边;-按所述访问记录信息在所述访问视图中建立从所述出节点指向所述入节点的有向边,即,当当前访问对象所对应的入节点和/或前一访问对象所对应的出节点存在,但与其相对应的有向边不存在时,则建立与其相对应的有向边;-按所述访问记录信息在所述访问视图中更新从所述出节点指向所述入节点的有向边,即,当当前访问对象所对应的入节点和/或前一访问对象所对应的出节点存在,与其相对应的有向边也存在时,则按所述访问记录信息,对所述有向边进行更新,如增加有向边
的权重等。优选地,所述访问视图包括基于力导向模型的访问视图,所述访问分析设备还包括速度确定装置13’、位置更新装置14’、视图更新装置15’,其中,速度确定装置13’根据所述力导向模型,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度;位置更新装置14’根据所述速度,更新对应节点的位置;视图更新装置15’根据所述节点更新后的位置,更新所述访问视图。具体地,所述力导向模型指的是将图中的节点映射为电荷,将节点间的边映射为电荷力,根据节点和节点间的边,以及图内节点和/或节点间的边的变化,计算节点位移的速度,使节点产生位移,直至节点间受力平衡(即视图内的整个布局能量最小时)为止。当所述访问视图包括基于力导向模型的访问视图时,根据所述力导向模型,将所述访问视图内的节点和节点间的边映射为与力导向模型相对应的如电荷和电荷力;速度确定装置13’根据所述力导向模型,初始化每个节点的位置,并根据相应的遍历算法,遍历所有节点,计算节点之间的斥力,遍历所有边,计算边所对应的两个节点间的引力,根据所述斥力与引力信息,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度。位置更新装置14’根据所述速度,计算出每个节点的位移信息和新的位置信息,从而更新对应节点的位置。 视图更新装置15’根据所述节点更新后的位置,通过例如根据每个顶点的新的位置,在画布上重绘所有的顶点和边的方式,或者根据每个顶点的新的位置,在画布上重绘更新后的顶点和边的方式,更新所述访问视图。更优选地,所述速度确定装置13’还可以根据所述力导向模型,并结合节点速度衰减模型,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度。具体地,所述速度确定装置13’根据所述力导向模型,并结合节点速度衰减模型,其中,所述节点速度衰减模型包括但不限于模拟退火模型,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度。例如,首先,速度确定装置13’初始化每个节点的位置,利用模拟退火模型中的温度元素,判断整个视图中的温度是否小于一定阈值;若是,则结束操作;若否,则遍历所有节点,计算节点之间的斥力;遍历所有边,计算边所对应的两个节点间的引力;根据所述斥力与引力信息,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度;根据所述温度元素,衰减顶点速度,从而根据所述衰减后的速度计算出每个顶点的位移和新的位置。利用所述节点速度衰减模型可以使节点尽快达到平衡水平,力口快平衡的速度。优选地,所述访问分析设备还包括聚合装置(未示出),其中,所述聚合装置根据预定的聚合阈值,将所述访问视图中相关节点聚合为虚拟节点,其中,所述相关节点之间的有向边的权重或度超过所述聚合阈值。具体地,聚合装置通过获取预定的聚合阈值,当多个所述相关节点之间的有向边的权重或度超过所述聚合阈值时,将所述访问视图中相关节点聚合为虚拟节点。其中,所述预定的聚合阈值可以根据用户自定义、系统预置或根据机器学习的方式进行获取;所述虚拟节点包括但不限于将所述相关节点聚合为具有类型标记的同类节点,或者将所述相关节点聚合为在所述访问视图一侧或一部分展现的节点簇等。图3示出根据本发明另一个方面的一种用于确定多个访问对象之间的访问相关性信息的方法流程图。具体地,在步骤Si中,访问分析设备获取关于多个访问对象的一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个;在步骤s2中,访问分析设备对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地,或者按照设定的或实时调整的工作模式要求,进行访问序列信息的获取、访问相关性信息的获取等,直至访问分析设备停止获取关于多个访问对象的一个或多个访问序列信息。在步骤Si中,访问分析设备获取关于多个访问对象的一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。具体地,在步骤Si中,访问分析设备通过基于各种通信协议(Communications Protocol),与其他能够提供关于多个访问对象的一个或多个访问序列信息的设备,如访问序列信息数据库进行交互,获取关于多个访问对象的一个或多个访问序列信息;或通过与其他能够提供包含访问序列信息的访问日志的设备,如访问日志数据库进行交互,通过日志分析,获取关于多个访问对象的一个或多个访问序列信息。其中,所述访问对象包括但不限于页面,如同一网站的多个页面、一组 网站的多个页面、应用的多个应用页面;功能点,如应用的多个功能模块、页面的多个页面元素等。所述访问包括但不限于对所述访问对象的点击、查询、使用、触摸、输入信息等操作。其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。在此,可根据用户对所述访问对象的操作信息进行连续的访问记录信息的判定,如根据相邻操作的时间间隔,当一个用户对多个访问对象的两次操作间隔在10分钟以内,则认为是连续操作等,并将此记录作为一个连续的访问记录信息,所述两次操作可对应于同一个访问对象或不同的访问对象。在此,所述访问序列信息可利用表格、矩阵、数组或其他自定义的格式进行表示。在此,“通信协议”包括计算机通信的传送协议,如TCP/IP、UDP、FTP、ICMP、NetBEUI等,或者存在于计算机中的其他形式通信,例如面向对象编程里面对象之间的通信或操作系统内不同程序或计算机不同模块之间的消息传送协议。在步骤s2中,访问分析设备对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。具体地,在步骤s2中,访问分析设备根据步骤Si中所获取的关于多个访问对象的一个或多个访问序列信息,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。若当前未存在任何访问对象以及访问对象间的访问相关性信息,或者当前的访问相关性信息中不存在所述连续的访问记录信息中所对应的一个或多个当前访问对象,则在步骤s2中,访问分析设备根据所述访问序列信息,建立所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,例如所述访问序列信息为(A,B),所述A和B表示访问对象,当前访问相关性信息中包括访问对象A,但不包含访问对象B,则在步骤s2中,访问分析设备建立访问对象B与访问对象A之间的访问相关性信息。其中,建立访问相关性信息的方式,例如,通过在访问相关性信息数据库中添加数据节点并建立节点间的关联关系,或是在访问相关性信息视图中插入新的节点并建立节点间的边,或是在访问相关性矩阵中添加新的行列及调整行列值,或是在访问相关性信息表格中加入新的行列以表示访问对象和访问对象间的访问相关性信息等。若当前的访问相关性信息中存在所述连续的访问记录信息中所对应的一个或多个当前访问对象,则在步骤s2中,访问分析设备根据所述访问序列信息,更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,例如所述访问序列信息为(C,D),所述C和D表示访问对象,当前访问相关性信息中包括访问对象C及访问对象D,则在步骤s2中,访问分析设备更新访问对象C与访问对象D之间的访问相关性信息。其中,更新访问相关性信息的方式,例如,通过在访问相关性信息数据库中更新节点间的关联关系,或是在访问相关性信息视图中更新节点间的边的权重值,或是在访问相关性矩阵中调整行列值,或是在访问相关性信息表格中调整与访问对象间相对应的表格值等方式,以更新访问对象和访问对象间的访问相关性信息等。在此,所述访问相关性信息包括多个访问对象是否属于一个访问操作序列,多个访问对象间的访问顺序,相邻访问对象间的访问时间间隔或多个访问时间间隔的平均数,访问对象的点击次数等。本领域技术人员应能理解上述建立或更新访问相关性信息的方式仅为举例,其他现有的或今后可能出现的建立或更新访问相关性信息的的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,在步骤s2中,访问分析设备还可以对于所述一个或多个访问序列信息,按所述访问记录信息以及对应的权重信息,建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。具体地,在步骤s2中,访问分析设备还可以按照所述访问记录信息以及对应的权重信息,对所述访问相关性信息进行建立或更新,其中,所述与访问记录信息对应的权重信息表示不同的访问记录信息对于访问相关性的不同程度的影响,例如,当连续的访问记录信息所对应的访问时间越接近或在一定阈值范围内,则对所对应的多个访问对象的影响越大,所对应的权重信息可按照时间间隔的减少而增大等。从而,在步骤s2中,访问分析设备按所述访问记录信息以及对应的权重信息,例如,通过在访问相关性信息数据库中以一定的权重数值更新节点间的关联关系,或是在访问相关性信息视图中结合所述权重信息更新节点间的边的权重值,或是在访问相关性矩阵中结合所述权重信息调整行列值,或是在访问相关性信息表格中结合所述权重信息调整与访问对象间相对应的表格值等方式,以更新访问对象和访问对象间的访问相关性信息等。在此,所述建立或更新访问相关性信息的方式与图3中步骤s2中的建立或更新方式相同或相似,此处不再赘述,并以引用的形式包含于此。优选地,在步骤si中,访问分析设备包括步骤sll (未示出)和步骤sl2(未示出),其中,在步骤sll中,访问分析设备获取关于所述多个访问对象的访问日志信息;在步骤sl2中,访问分析设备根据预定的筛选条件,从所述访问日志信息筛选所述一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。具体地,在步骤sll中,访问分析设备通过基于各种通信协议(Communications Protocol),与其他能够提供包含访问对象的访问日志信息的设备,如访问日志数据库进行交互,获取关于所述多个访问对象的访问日志信息。在步骤sl2中,访问分析设备根据预定的筛选条件,从所述访问日志信息筛选所述一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。其中,所述筛选条件包括但不限于所述访问操作信息所对应的操作时段,例如,当多个所述访问操作信息所对应的操作时段为工作时间/休息时间,则按照不同的时段筛选与操作时段对应的访问序列信息;所述访问操作信息所对应的操作用户的地域属性,例如,所述一个或多个用户所对应的地域属性在同一地域(如北京、上海等一线城市,二线城市等等;或按照地理位置分为南北地域等),筛选出所述在同一地域的不同用户所对应的访问序列信息;所述访问操作信息所对应的操作用户的群组属性,例如,不同群组的用户,例如“旅游”、“时尚”等,由于关注的兴趣点不同,对应的访问序列信息可能存在一定的差异,因此将同一群组属性下的操作用户所对应的访问序列信息进行筛选。在此,“通信协议”包括计算机通信的传送协议,如TCP/IP、UDP、FTP、I CMP,NetBEUI等,或者存在于计算机中的其他形式通信,例如面向对象编程里面对象之间的通信或操作系统内不同程序或计算机不同模块之间的消息传送协议。更优选地,所述方法还包括步骤s6 (未示出),其中,在步骤s6中,访问分析设备根据所述访问对象或其所对应的应用信息,确定所述连续的访问记录信息之间的时间间隔的操作间隔阈值;其中,在步骤sl2中,访问分析设备根据所述筛选条件,并结合所述操作间 隔阈值,从所述访问日志信息筛选所述一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个,所述连续的访问记录信息之间的时间间隔低于所述操作间隔阈值。具体地,在步骤s6中,访问分析设备根据所述访问对象或其所对应的应用信息,通过系统预置、用户自定义或是利用机器学习进行获取等方式,确定所述连续的访问记录信息之间的时间间隔的操作间隔阈值;在此,由于所述“访问序列”应是满足操作间隔阈值的同一个用户的多个操作,所以需要对所述操作间隔阈值进行确定;不同的访问对象或其对应的应用信息,所适用的操作间隔可以不同,例如,有些功能点(如注册页面)相比其他功能点(如登录页面)包含很多输入项,或者很多新闻页面的第一页包含很多文字、而后续页面仅包括一个插图等,从而使得所适用的操作间隔阈值不同。在步骤sl2中,访问分析设备根据所述筛选条件,并结合所述操作间隔阈值,从所述访问日志信息筛选所述一个或多个访问序列信息,所述结合操作间隔阈值的方式例如将所属操作间隔阈值作为筛选字段等。在此,所述筛选访问序列信息的方式与图3的优选实施例中的步骤sl2的所对应的所述筛选访问序列信息的方式相同或相似,此处不再赘述,并以引用的形式包含于此。优选地,所述访问分析设备还包括步骤s7(未示出)、步骤s8(未示出)和步骤s9(未示出),其中,在步骤s7中,访问分析设备获取用户提交的关于后续访问对象的查询请求,其中所述查询请求包括所述用户的在用访问对象;在步骤s8中,访问分析设备根据所述多个访问对象之间的访问相关性信息,基于所述在用访问对象,确定与所述在用访问对象相对应的后续访问对象;在步骤s9中,访问分析设备将所述后续访问对象提供给所述用户。具体地,在步骤s7中,访问分析设备通过基于各种通信协议(CommunicationsProtocol),获取查询用户通过点击、滑动、触摸、输入等方式,在例如浏览器或其他可以提交关于后续访问对象的查询请求的应用、软件或系统中,所提交的关于后续访问对象的查询请求,其中所述查询请求包括所述用户的在用访问对象。其中,所述关于后续访问对象的查询请求可以直接对应于网页(如后续可能点击的网页信息)、网页上的功能模块(如后续可能选择的网页上的一个或多个连接)、后续可能访问的应用(如下一个可能访问的应用APP);所述关于后续访问对象的查询请求还可以对应对于网页或应用或网页/应用上所对应的功能点的优化或测试信息,例如,所述后续访问对象的查询请求为对用户当前的在用访问对象的优化信息,则为了实现优化目的,需要获取与用户的在用访问对象相关联的后续访问对象信息等。在步骤s8中,访问分析设备根据所述多个访问对象之间的访问相关性信息,基于所述在用访问对象,确定与所述在用访问对象相对应的后续访问对象。具体地,在步骤s8中,访问分析设备基于所述查询请求包括的所述用户的在用访问对象,通过根据多个访问对象之间的访问相关性信息,确定与所述在用访问对象相对应的后续访问对象。例如,通过根据在用访问对象所对应的节点的各个有向边的度或权重等信息,将度或权重最高的一个或多个有向边所对应的节点(即访问对象)作为后续访问对象。其中,所述后续访问对象包括但不限于单个或多个可供选择的后续访问对象,或多个可形成访问序列的后续访问对象,例如,可根据聚类或遍历的方式,确定多个可形成访问序列的后续访问对象等。在步骤s9中,访问分析设备将所述后续访问对象提供给所述用户。具体地,在步 骤s9中,访问分析设备基于各种通信协议(Communications Protocol),通过直接与用户进行交互,或通过调用用户设备所提供的应用程序接口(API),或http、https等其他约定的通信方式的格式要求,将所述后续访问对象提供给所述用户。在此,“通信协议”包括计算机通信的传送协议,如TCP/IP、UDP、FTP、ICMP、NetBEUI等,或者存在于计算机中的其他形式通信,例如面向对象编程里面对象之间的通信或操作系统内不同程序或计算机不同模块之间的消息传送协议。图4示出根据本发明一个优选实施例的一种用于确定多个访问对象之间的访问相关性信息的方法流程图。具体地,在步骤Si’中,访问分析设备获取关于多个访问对象的一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个;在步骤s2’中,访问分析设备对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新用于表征所述多个访问对象之间访问相关性信息的访问视图,其中,所述访问视图包括节点及相邻节点间的有向边,所述节点对应于所述多个访问对象中之一,所述有向边表征在该有向边的起点所对应的访问对象与该有向边的终点所对应的访问对象之间的访问相关性信息。其中,访问分析设备中的步骤sI’与图3所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地,或者按照设定的或实时调整的工作模式要求,进行访问序列信息的获取、表征所述多个访问对象之间访问相关性信息的访问视图的建立或更新等,直至访问分析设备停止获取关于多个访问对象的一个或多个访问序列信息。在步骤s2 ’中,访问分析设备对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新用于表征所述多个访问对象之间访问相关性信息的访问视图,其中,所述访问视图包括节点及相邻节点间的有向边,所述节点对应于所述多个访问对象中之一,所述有向边表征在该有向边的起点所对应的访问对象与该有向边的终点所对应的访问对象之间的访问相关性信息。具体地,在步骤s2’中,访问分析设备根据步骤Si’所获取的访问序列信息,将所述访问序列信息中的每个访问对象通过映射等方式,对应于访问视图中的一个节点,将所述访问对象与对应的另一个访问对象之间的访问相关性信息,通过映射等方式,对应于访问视图中的一条有向边或有向边的权重,例如,用户先访问了访问对象A,然后点击了访问对象B,则建立从A到B的有向边等,从而建立或更新用于表征所述多个访问对象之间访问相关性信息的访问视图。在此,所述访问视图包括但不限于经过绘制后的可视化视图,如可呈现给用户的图片等,或者未经绘制的访问视图数据,所述访问视图数据可供绘制等处理。所述访问视图的绘制可以利用canvas绘图方式生成二维视图,也可以根据webGL绘图方式生成三维视图。优选地,所述建立或更新操作包括以下任一项-按所述访问记录信息在所述访问视图中建立对应所述前一访问对象的出节点和/或对应所述当前访问对象的入节点,并建立从所述出节点指向所述入节点的有向边,即,当前访问对象所对应的入节点和/或前一访问对象所对应的出节点不存在时,在所述访问视图中建立与其相对应的节点,并建立与其相对应的有向边;·
-按所述访问记录信息在所述访问视图中建立从所述出节点指向所述入节点的有向边,即,当当前访问对象所对应的入节点和/或前一访问对象所对应的出节点存在,但与其相对应的有向边不存在时,则建立与其相对应的有向边;-按所述访问记录信息在所述访问视图中更新从所述出节点指向所述入节点的有向边,即,当当前访问对象所对应的入节点和/或前一访问对象所对应的出节点存在,与其相对应的有向边也存在时,则按所述访问记录信息,对所述有向边进行更新,如增加有向边
的权重等。优选地,所述访问视图包括基于力导向模型的访问视图,所述访问分析设备还包括步骤s3’、步骤s4’、步骤s5’,其中,在步骤S3’中,访问分析设备根据所述力导向模型,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度;在步骤s4’中,访问分析设备根据所述速度,更新对应节点的位置;在步骤s5’中,访问分析设备根据所述节点更新后的位置,更新所述访问视图。具体地,所述力导向模型指的是将图中的节点映射为电荷,将节点间的边映射为电荷力,根据节点和节点间的边,以及图内节点和/或节点间的边的变化,计算节点位移的速度,使节点产生位移,直至节点间受力平衡(即视图内的整个布局能量最小时)为止。当所述访问视图包括基于力导向模型的访问视图时,根据所述力导向模型,将所述访问视图内的节点和节点间的边映射为与力导向模型相对应的如电荷和电荷力;在步骤S3’中,访问分析设备根据所述力导向模型,初始化每个节点的位置,并根据相应的遍历算法,遍历所有节点,计算节点之间的斥力,遍历所有边,计算边所对应的两个节点间的引力,根据所述斥力与引力信息,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度。在步骤s4’中,访问分析设备根据所述速度,计算出每个节点的位移信息和新的位置信息,从而更新对应节点的位置。在步骤s5’中,访问分析设备根据所述节点更新后的位置,通过例如根据每个顶点的新的位置,在画布上重绘所有的顶点和边的方式,或者根据每个顶点的新的位置,在画布上重绘更新后的顶点和边的方式,更新所述访问视图。
更优选地,在步骤S3’中,访问分析设备还可以根据所述力导向模型,并结合节点速度衰减模型,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度。具体地,在步骤S3’中,访问分析设备根据所述力导向模型,并结合节点速度衰减模型,其中,所述节点速度衰减模型包括但不限于模拟退火模型,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度。例如,首先,在步骤S3’中,访问分析设备初始化每个节点的位置,利用模拟退火模型中的温度元素,判断整个视图中的温度是否小于一定阈值;若是,则结束操作;若否,则遍历所有节点,计算节点之间的斥力;遍历所有边,计算边所对应的两个节点间的引力;根据所述斥力与引力信息,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度;根据所述温度元素,衰减顶点速度,从而根据所述衰减后的速度计算出每个顶点的位移和新的位置。利用所述节点速度衰减模型可以使节点尽快达到平衡水平,加快平衡的速度。优选地,所述方法还包括步骤sl0’(未示出),其中,在步骤s 10’中,访问分析设备根据预定的聚合阈值,将所述访问视图中相关节点聚合为虚拟节点,其中,所述相关节点之间的有向边的权重或度超过所述聚合阈值。具体地,在步骤slO’中,访问分析设备通过获取预定的聚合阈值,当多个所述相关节点之间的有向边的权重或度超过所述聚合阈值时, 将所述访问视图中相关节点聚合为虚拟节点。其中,所述预定的聚合阈值可以根据用户自定义、系统预置或根据机器学习的方式进行获取;所述虚拟节点包括但不限于将所述相关节点聚合为具有类型标记的同类节点,或者将所述相关节点聚合为在所述访问视图一侧或一部分展现的节点簇等。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此夕卜,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
权利要求
1.一种用于确定多个访问对象之间的访问相关性信息的方法,其中,该方法包括以下步骤 a获取关于多个访问对象的一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个; b对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。
2.根据权利要求I所述的方法,其中,所述步骤b包括 -对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新用于表征所述多个访问对象之间访问相关性信息的访问视图,其中,所述访问视图包括节点及相邻节点间的有向边,所述节点对应于所述多个访问对象中之一,所述有向边表征在该有向边的起点所对应的访问对象与该有向边的终点所对应的访问对象之间的访问相关性信息。
3.根据权利要求2所述的方法,其中,所述建立或更新操作包括以下任一项 -按所述访问记录信息在所述访问视图中建立对应所述前一访问对象的出节点和/或对应所述当前访问对象的入节点,并建立从所述出节点指向所述入节点的有向边; -按所述访问记录信息在所述访问视图中建立从所述出节点指向所述入节点的有向边; -按所述访问记录信息在所述访问视图中更新从所述出节点指向所述入节点的有向边。
4.根据权利要求2或3所述的方法,其中,所述访问视图包括基于力导向模型的访问视图,其中,该方法还包括 X根据所述力导向模型,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度; -根据所述速度,更新对应节点的位置; -根据所述节点更新后的位置,更新所述访问视图。
5.根据权利要求4所述的方法,其中,所述步骤X包括 -根据所述力导向模型,并结合节点速度衰减模型,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度。
6.根据权利要求2至5中任一项所述的方法,其中,该方法还包括 -根据预定的聚合阈值,将所述访问视图中相关节点聚合为虚拟节点,其中,所述相关节点之间的有向边的权重或度超过所述聚合阈值。
7.根据权利要求I至6中任一项所述的方法,其中,所述步骤b包括 -对于所述一个或多个访问序列信息,按所述访问记录信息以及对应的权重信息,建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。
8.根据权利要求I至7中任一项所述的方法,其中,所述步骤a包括 -获取关于所述多个访问对象的访问日志信息; al根据预定的筛选条件,从所述访问日志信息筛选所述一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。
9.根据权利要求8所述的方法,其中,该方法还包括 -根据所述访问对象或其所对应的应用信息,确定所述连续的访问记录信息之间的时间间隔的操作间隔阈值; 其中,所述步骤al包括 -根据所述筛选条件,并结合所述操作间隔阈值,从所述访问日志信息筛选所述一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个,所述连续的访问记录信息之间的时间间隔低于所述操作间隔阈值。
10.根据权利要求I至9中任一项所述的方法,其中,该方法还包括 -获取用户提交的关于后续访问对象的查询请求,其中所述查询请求包括所述用户的在用访问对象; -根据所述多个访问对象之间的访问相关性信息,基于所述在用访问对象,确定与所述在用访问对象相对应的后续访问对象; -将所述后续访问对象提供给所述用户。
11.一种用于确定多个访问对象之间的访问相关性信息的访问分析设备,其中,该设备包括 序列获取装置,用于获取关于多个访问对象的一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个; 相关性生成装置,用于对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。
12.根据权利要求11所述的访问分析设备,其中,所述相关性生成装置用于 -对于所述一个或多个访问序列信息,按所述访问记录信息建立或更新用于表征所述多个访问对象之间访问相关性信息的访问视图,其中,所述访问视图包括节点及相邻节点间的有向边,所述节点对应于所述多个访问对象中之一,所述有向边表征在该有向边的起点所对应的访问对象与该有向边的终点所对应的访问对象之间的访问相关性信息。
13.根据权利要求12所述的访问分析设备,其中,所述建立或更新操作包括以下任一项 -按所述访问记录信息在所述访问视图中建立对应所述前一访问对象的出节点和/或对应所述当前访问对象的入节点,并建立从所述出节点指向所述入节点的有向边; -按所述访问记录信息在所述访问视图中建立从所述出节点指向所述入节点的有向边; -按所述访问记录信息在所述访问视图中更新从所述出节点指向所述入节点的有向边。
14.根据权利要求12或13所述的访问分析设备,其中,所述访问视图包括基于力导向模型的访问视图,其中,该设备还包括速度确定装置,用于根据所述力导向模型,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度; 位置更新装置,用于根据所述速度,更新对应节点的位置; 视图更新装置,用于根据所述节点更新后的位置,更新所述访问视图。
15.根据权利要求14所述的访问分析设备,其中,所述速度确定装置用于 -根据所述力导向模型,并结合节点速度衰减模型,基于所述访问视图中节点及其对应的有向边,确定所述视图中节点的速度。
16.根据权利要求12至15中任一项所述的访问分析设备,其中,该设备还包括 聚合装置,用于根据预定的聚合阈值,将所述访问视图中相关节点聚合为虚拟节点,其中,所述相关节点之间的有向边的权重或度超过所述聚合阈值。
17.根据权利要求11至16中任一项所述的访问分析设备,其中,所述相关性生成装置用于 -对于所述一个或多个访问序列信息,按所述访问记录信息以及对应的权重信息,建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。
18.根据权利要求11至17中任一项所述的访问分析设备,其中,所述序列获取装置包括 日志获取单元,用于获取关于所述多个访问对象的访问日志信息; 序列筛选单元,用于根据预定的筛选条件,从所述访问日志信息筛选所述一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个。
19.根据权利要求18所述的访问分析设备,其中,该设备还包括 阈值确定装置,用于根据所述访问对象或其所对应的应用信息,确定所述连续的访问记录信息之间的时间间隔的操作间隔阈值; 其中,所述序列筛选单元用于 -根据所述筛选条件,并结合所述操作间隔阈值,从所述访问日志信息筛选所述一个或多个访问序列信息,其中,所述访问序列信息包括一个用户对所述多个访问对象中至少一个的连续的访问记录信息,所述访问记录信息对应于所述多个访问对象中的一个,所述连续的访问记录信息之间的时间间隔低于所述操作间隔阈值。
20.根据权利要求11至19中任一项所述的访问分析设备,其中,该设备还包括 查询获取装置,用于获取用户提交的关于后续访问对象的查询请求,其中所述查询请求包括所述用户的在用访问对象; 后续对象确定装置,用于根据所述多个访问对象之间的访问相关性信息,基于所述在用访问对象,确定与所述在用访问对象相对应的后续访问对象; 后续对象提供装置,用于将所述后续访问对象提供给所述用户。
全文摘要
本发明的目的是提供一种用于确定多个访问对象之间的访问相关性信息的方法与设备,其中,通过访问分析设备获取关于多个访问对象的一个或多个访问序列信息,根据所述访问序列信息中包含的连续的访问记录信息,建立或更新所述访问记录信息所对应的前一访问对象与当前访问对象间的访问相关性信息,以获得所述多个访问对象之间的访问相关性信息。与现有技术相比,本发明根据用户对于访问对象的访问记录信息,建立或更新多个访问对象间的访问相关性信息,从而根据所述访问相关性信息为网站或产品的性能优化提供数据支撑,优化产品设计,以提升服务质量,提高用户获取信息的效率,提高用户的访问体验。
文档编号G06F17/30GK102945263SQ20121040778
公开日2013年2月27日 申请日期2012年10月23日 优先权日2012年10月23日
发明者沈毅 申请人:北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1