一种对数据访问进行重定向的方法和设备与流程

文档序号:12121985阅读:285来源:国知局
一种对数据访问进行重定向的方法和设备与流程

本发明涉及网络通信领域,并且更具体地,涉及一种对数据访问进行重定向的方法和设备。



背景技术:

重定向是通过各种方法将各种网络请求重新定个方向转到其它位置例如:网页重定向、域名的重定向、路由选择的变化也是对数据报文经由路径的一种重定向。目前,用户针对内容服务器的数据访问通常是在时间上没有规律的,这种情况造成服务提供商无法对内容服务器进行有效地管理。通常,内容服务器在空闲时可以降低处理能力以节省电源,但是由于用户对内容服务器的访问时间是分散且无规律的,因此内容服务器无法有效地进行管理。

此外,内容提供商通常会进行数据迁移,例如将两个或多个内容服务器中的内容迁移到另一单独的内容服务器中,从而实现对相同或相近内容或访问时间的有效管理。目前的数据迁移通常仅根据内容来进行迁移。例如,内容提供商将提供相同或相似内容的内容服务器中的内容迁移到另一内容服务器中。然而,在实际应用中,还需要考虑用户针对内容服务器的访问时间。通常,内容提供商可以对在相同或相似时间段内对内容服务器进行的数据访问进行有效管理。



技术实现要素:

根据本发明的第一方面,提供一种对数据访问进行重定向的方法,包括:

确定第一内容服务器的第一稳定用户集和第二内容服务器的第二稳定用户集;

计算第一稳定用户集的每个用户和第二稳定用户集的每个用户的用户相似度,获得第一内容服务器和第二内容服务器的用户相似度矩阵;

根据所述用户相似度矩阵确定第一稳定用户集与第二稳定用户集的相似度;以及

当第一稳定用户集与第二稳定用户集的相似度大于阈值时,将第一稳定用户集或第二稳定用户集中的用户针对第一内容服务器或第二内容服务器的数据访问重定向到第三内容服务器。

优选地,所述方法还包括:当第一稳定用户集与第二稳定用户集的相似度大于阈值时,将第一内容服务器和第二内容服务器中的内容发送给第三内容服务器。

优选地,根据记录的用户数据访问日志确定所述第一内容服务器的稳定用户集和第二内容服务器的稳定用户集。

优选地,根据用户数据访问的时间段列表采用余弦相似度来计算所述用户相似度,具体为:第一稳定用户集的第一用户与第二稳定用户集的第二用户的用户相似度为一比值,比值的分子为第一用户和第二用户的两个时间段列表的交集所含时间段数量的个数,分母为第一用户和第二用户的两个时间段列表的并集所含时间段数量的个数的根值。

优选地,所述根据记录的用户数据访问日志确定所述第一内容服务器的稳定用户集和第二内容服务器的稳定用户集包括:确定第一内容服务器或第二内容服务器的用户集中每个用户平均每天访问第一内容服务器或第二内容服务器的时间达到阈值时,将所述用户确定为第一内容服务器或第二内容服务器的稳定用户。

优选地,所述根据所述用户相似度矩阵确定第一稳定用户集与第二稳定用户集的相似度包括:将第一稳定用户集中每个稳定用户与第二稳定用户集中每个稳定用户的相似度的均值作为第一稳定用户集与第二稳定用户集的相似度。

根据本发明的另一方面,提供一种对数据访问进行重定向的设备,包括:

第一确定单元,用于确定第一内容服务器的第一稳定用户集和第二内容服务器的第二稳定用户集;

计算单元,用于计算第一稳定用户集的每个用户和第二稳定用户集的每个用户的用户相似度,获得第一内容服务器和第二内容服务器的用户相似度矩阵;

第二确定单元,用于根据所述用户相似度矩阵确定第一稳定用户集与第二稳定用户集的相似度;以及

重定向单元,当第一稳定用户集与第二稳定用户集的相似度大于阈值时,将第一稳定用户集或第二稳定用户集中的用户针对第一内容服务器或第二内容服务器的数据访问重定向到第三内容服务器。

优选地,当第一稳定用户集与第二稳定用户集的相似度大于阈值时,重定向单元将第一内容服务器和第二内容服务器中的内容发送给第三内容服务器。

优选地,第一确定单元根据记录的用户数据访问日志确定所述第一内容服务器的稳定用户集和第二内容服务器的稳定用户集。

优选地,计算单元根据用户数据访问的时间段列表采用余弦相似度来计算所述用户相似度,具体为:第一稳定用户集的第一用户与第二稳定用户集的第二用户的用户相似度为一比值,比值的分子为第一用户和第二用户的两个时间段列表的交集所含时间段数量的个数,分母为第一用户和第二用户的两个时间段列表的并集所含时间段数量的个数的根值。

优选地,所述根据记录的用户数据访问日志确定所述第一内容服务器的稳定用户集和第二内容服务器的稳定用户集包括:确定第一内容服务器或第二内容服务器的用户集中每个用户平均每天访问第一内容服务器或第二内容服务器的时间达到阈值时,将所述用户确定为第一内容服务器或第二内容服务器的稳定用户。

优选地,所述第二确定单元根据所述用户相似度矩阵确定第一稳定用户集与第二稳定用户集的相似度包括:将第一稳定用户集中每个稳定用户与第二稳定用户集中每个稳定用户的相似度的均值作为第一稳定用户集与第二稳定用户集的相似度。

附图说明

通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:

图1为本发明实施方式的对数据访问进行重定向的系统的结构图;

图2为本发明实施方式的网络设备的结构示意图;

图3为本发明实施方式的对数据访问进行重定向的方法的流程图;

图4为本发明实施方式的重定向设备的结构示意图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。

除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。

一般来说,用户通常会习惯于访问或网络服务提供商会将用户的访问请求给相同的内容服务器。在移动通信的情况下,服务提供商会将数据内容存储在内容服务器中以供用户访问。由于每个用户的数据访问通常在时间上具有习惯性,即通常会在习惯的时间进行数据访问。但是,由于各个用户的习惯不同,因此也会导致多个用户的访问时间分布不同。为了提升内容服务器对客户进行数据服务的质量并且降低响应时间,需要将具有相同访问时间的数据访问请求进行归类和合并。并且,将归类和合并的数据访问请求重定向到新的内容服务器,从而更好地为数据访问请求进行访问。通常,由同一内容服务器对归类和合并的数据访问请求提供服务,能够更好地降低响应时间、节省处理资源等。

图1为本发明实施方式的对数据访问进行重定向的系统100的结构图。系统100。系统100在进行数据迁移或内容合并时,考虑每个用户的数据访问在时间上的习惯性并且将其作为数据迁移或内容合并的基础。为了提升内容服务器对客户进行数据服务的质量并且降低响应时间,将具有相同访问时间的数据访问请求进行归类和合并。

如图1所示,系统100包括:重定向设备101和第一内容服务器102、第二内容服务器103、第三内容服务器104以及网络设备105。重定向设备101用于确定第一内容服务器的第一稳定用户集和第二内容服务器的第二稳定用户集并且计算第一稳定用户集的每个用户和第二稳定用户集的每个用户的用户相似度,获得第一内容服务器和第二内容服务器的用户相似度矩阵。优选地,重定向设备101根据所述用户相似度矩阵确定第一稳定用户集与第二稳定用户集的相似度并且重定向单元,当第一稳定用户集与第二稳定用户集的相似度大于阈值时,将第一稳定用户集或第二稳定用户集中的用户针对第一内容服务器或第二内容服务器的数据访问重定向到第三内容服务器。

优选地,当第一稳定用户集与第二稳定用户集的相似度大于阈值时,重定向设备101将第一内容服务器和第二内容服务器中的内容发送给第三内容服务器。重定向设备101根据记录的用户数据访问日志确定所述第一内容服务器的稳定用户集和第二内容服务器的稳定用户集。

优选地,重定向设备101根据用户数据访问的时间段列表采用余弦相似度来计算所述用户相似度,具体为:第一稳定用户集的第一用户与第二稳定用户集的第二用户的用户相似度为一比值,比值的分子为第一用户和第二用户的两个时间段列表的交集所含时间段数量的个数,分母为第一用户和第二用户的两个时间段列表的并集所含时间段数量的个数的根值。其中根据记录的用户数据访问日志确定所述第一内容服务器的稳定用户集和第二内容服务器的稳定用户集包括:确定第一内容服务器或第二内容服务器的用户集中每个用户平均每天访问第一内容服务器或第二内容服务器的时间达到阈值时,将所述用户确定为第一内容服务器或第二内容服务器的稳定用户。重定向设备101根据所述用户相似度矩阵确定第一稳定用户集与第二稳定用户集的相似度包括:将第一稳定用户集中每个稳定用户与第二稳定用户集中每个稳定用户的相似度的均值作为第一稳定用户集与第二稳定用户集的相似度。

优选地,第一内容服务器102、第二内容服务器103以及第三内容服务器104用于存储数据内容并且能够对用户的数据访问请求进行响应。通常,第一内容服务器102、第二内容服务器103以及第三内容服务器104可以在地理上临近或远离。例如,第一内容服务器102、第二内容服务器103以及第三内容服务器104位于同一建筑物内部,或者第一内容服务器102、第二内容服务器103以及第三内容服务器104位于城市的不同的区域内。通常,第一内容服务器102、第二内容服务器103以及第三内容服务器104中存储的数据内容包括各种类型的文件,例如音频文件、视频文件、可执行文件、文本文件以及各种数据文档等。

优选地,网络设备105用于将重定向设备101与第一内容服务器102、第二内容服务器103以及第三内容服务器104进行通信连接。网络设备105可以将重定向设备101的迁移指令或重定向指令发送给第一内容服务器102、第二内容服务器103以及第三内容服务器104。另一方面,第一内容服务器102、第二内容服务器103以及第三内容服务器104可以将与数据访问相关的数据发送给重定向设备101以供其进行计算和处理。

图1中的重定向设备可以以图2中的计算机设备200(或系统)的方式来实现。图2为本发明实施方式的重定向设备的结构示意图。如图2所示,将利用计算机设备200来实现重定向设备。计算机设备200包括至少一个处理器201,通信总线202,存储器203以及至少一个通信接口204。

优选地,处理器201可以是一个通用中央处理器(CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本发明方案程序执行的集成电路。

优选地,通信总线202可包括一通路,在上述组件之间传送信息。所述通信接口204,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,无线接入网(RAN),无线局域网(Wireless Local Area Networks,WLAN)等。

优选地,存储器203可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。

其中,所述存储器203用于存储执行本发明方案的应用程序代码,并由处理器201来控制执行。所述处理器201用于执行所述存储器203中存储的应用程序代码。

在具体实现中,处理器201可以包括一个或多个CPU,每个CPU可以是一个单核(single-core)处理器,也可以是一个多核(multi-Core)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

在具体实现中,作为一种实施例,计算机设备200还可以包括输入/输出(I/O)接口205。例如,输出设备可以是液晶显示器(liquid crystal display,LCD),发光二级管(light emitting diode,LED)显示设备,阴极射线管(cathode ray tube,CRT)显示设备,或投影仪(projector)等。输入设备可以是鼠标、键盘、触摸屏设备或传感设备等。

上述的计算机设备200可以是一个通用计算机设备或者是一个专用计算机设备。在具体实现中,计算机设备200可以是台式机、便携式电脑、网络服务器、掌上电脑(Personal Digital Assistant,PDA)、移动手机、平板电脑、无线终端设备、通信设备、嵌入式设备或有图2中类似结构的设备。本发明实施例不限定计算机设备的类型。

如图1中的重定向设备可以为图2所示的计算机设备,重定向设备的存储器203中存储了一个或多个软件模块(例如:计算模块和判断模块)。重定向设备可以通过处理器以及存储器中的程序代码来实现软件模块,数据访问的重定向。

图3为本发明实施方式的对数据访问进行重定向的方法300的流程图。方法300在进行数据迁移或内容合并时,考虑每个用户的数据访问在时间上的习惯性并且将其作为数据迁移或内容合并的基础。为了提升内容服务器对客户进行数据服务的质量并且降低响应时间,将具有相同访问时间的数据访问请求进行归类和合并。

如图3所示,方法300从步骤301处开始。优选地,在步骤301,确定第一内容服务器的第一稳定用户集和第二内容服务器的第二稳定用户集。优选地,方法300根据记录的用户数据访问日志确定所述第一内容服务器的稳定用户集和第二内容服务器的稳定用户集。其中所述根据记录的用户数据访问日志确定所述第一内容服务器的稳定用户集和第二内容服务器的稳定用户集包括:确定第一内容服务器或第二内容服务器的用户集中每个用户平均每天访问第一内容服务器或第二内容服务器的时间达到阈值时,将所述用户确定为第一内容服务器或第二内容服务器的稳定用户。

优选地,重定向设备记录用户HTTP访问的日志信息。在记录的日志文件中,每一条记录可以包含用户标识,业务内容的地址URL,用户访问时所请求的内容服务器标识,内容类型,业务请求时间等信息。这些信息存储在重定向设备,用于后续的计算。重定向设备记录用户访问内容服务器的时间。通常用户访问内容服务器时,会保持与内容服务器的连接。重定向设备将用户与内容服务器的连接时间进行记录以用于之后确定用户相似度。

对于每个内容服务器,都存在稳定用户(经常访问的用户)和临时用户(临时访问用户)。为了减少临时用户对计算结果的干扰,需要确定每个内容服务器的稳定用户,确定稳定用户的方法有多种,例如,许多天都接入内容服务器访问业务内容的用户。可以根据上述的访问日志信息确定。具体的天数可以由预设的值确定。例如,对一个内容服务器,该内容服务器下的稳定用户定义为在过去一周之内不少于4天都有访问记录的用户。符合条件的用户可以标记为该内容服务器下的稳定用户。本实施例中,假设第一内容服务器A下的所有稳定用户记为第一稳定用户集,第二内容服务器B下的所有稳定用户记为第二稳定用户集。其中稳定用户的求解可定期进行更新,由于实时性要求不高,因此重定向设备可以在闲时进行计算。

优选地,在步骤302,计算第一稳定用户集的每个用户和第二稳定用户集的每个用户的用户相似度,获得第一内容服务器和第二内容服务器的用户相似度矩阵。其中根据用户数据访问的时间段列表采用余弦相似度来计算所述用户相似度,具体为:第一稳定用户集的第一用户与第二稳定用户集的第二用户的用户相似度为一比值,比值的分子为第一用户和第二用户的两个时间段列表的交集所含时间段数量的个数,分母为第一用户和第二用户的两个时间段列表的并集所含时间段数量的个数的根值。

优选地,用户相似度描述的是两个用户对业务内容的访问习惯的相似程度,主要根据用户访问业务内容的历史记录确定。本实施例采用余弦相似度(CosineSimilarity)来进行用户相似度计算。假设A内容服务器的一个稳定用户为u,B内容服务器的一个稳定用户为v,则从上述日志信息中获取用户访问内容的列表,然后通过如下公式计算两个用户相似度:

其中S(u,v)表示用户u和用户v的相似度,c(u)记录的是用户u访问的内容列表,c(v)记录的是用户v访问的内容列表。公式的分子部分表示取c(u)和c(v)两个内容列表的交集,然后求出交集所含内容数量的个数,分母表示取c(u)和c(v)的并集,然后求出并集所含内容数量的个数,然后再取根值。

将内容服务器A的每一个稳定用户与内容服务器B的每一个稳定用户按照上述公式(1)计算用户相似度,可以得到A内容服务器的稳定用户集与B内容服务器的稳定用户集的相似度矩阵,如下:

其中,A内容服务器的稳定用户数记为U,B内容服务器的稳定用户数记为V,a11表示A内容服务器的第一个稳定用户与B内容服务器的第一个稳定用户的用户相似度,同理aUV表示A内容服务器的第U个稳定用户和B内容服务器的第V个稳定用户之间的用户相似度。

用户每天访问内容的列表是动态变化的,因此一般也需要根据时间的推移定期更新用户相似度的计算值。

优选地,在步骤303,根据所述用户相似度矩阵确定第一稳定用户集与第二稳定用户集的相似度。其中所述根据所述用户相似度矩阵确定第一稳定用户集与第二稳定用户集的相似度包括:将第一稳定用户集中每个稳定用户与第二稳定用户集中每个稳定用户的相似度的均值作为第一稳定用户集与第二稳定用户集的相似度。

优选地,在步骤304,当第一稳定用户集与第二稳定用户集的相似度大于阈值时,将第一稳定用户集或第二稳定用户集中的用户针对第一内容服务器或第二内容服务器的数据访问重定向到第三内容服务器。方法300还包括:当第一稳定用户集与第二稳定用户集的相似度大于阈值时,将第一内容服务器和第二内容服务器中的内容发送给第三内容服务器。

图4为本发明实施方式的重定向设备400的结构示意图。重定向设备400在进行数据迁移或内容合并时,考虑每个用户的数据访问在时间上的习惯性并且将其作为数据迁移或内容合并的基础。为了提升内容服务器对客户进行数据服务的质量并且降低响应时间,将具有相同访问时间的数据访问请求进行归类和合并。

如图4所示,重定向设备400包括:第一确定单元401、计算单元402、第二确定单元403和重定向单元404。优选地,第一确定单元401,用于确定第一内容服务器的第一稳定用户集和第二内容服务器的第二稳定用户集。第一确定单元401根据记录的用户数据访问日志确定所述第一内容服务器的稳定用户集和第二内容服务器的稳定用户集。其中根据记录的用户数据访问日志确定所述第一内容服务器的稳定用户集和第二内容服务器的稳定用户集包括:确定第一内容服务器或第二内容服务器的用户集中每个用户平均每天访问第一内容服务器或第二内容服务器的时间达到阈值时,将所述用户确定为第一内容服务器或第二内容服务器的稳定用户。

优选地,计算单元402,用于计算第一稳定用户集的每个用户和第二稳定用户集的每个用户的用户相似度,获得第一内容服务器和第二内容服务器的用户相似度矩阵。计算单元402根据用户数据访问的时间段列表采用余弦相似度来计算所述用户相似度,具体为:第一稳定用户集的第一用户与第二稳定用户集的第二用户的用户相似度为一比值,比值的分子为第一用户和第二用户的两个时间段列表的交集所含时间段数量的个数,分母为第一用户和第二用户的两个时间段列表的并集所含时间段数量的个数的根值。

优选地,第二确定单元403,用于根据所述用户相似度矩阵确定第一稳定用户集与第二稳定用户集的相似度。第二确定单元403根据所述用户相似度矩阵确定第一稳定用户集与第二稳定用户集的相似度包括:将第一稳定用户集中每个稳定用户与第二稳定用户集中每个稳定用户的相似度的均值作为第一稳定用户集与第二稳定用户集的相似度。

优选地,重定向单元404,当第一稳定用户集与第二稳定用户集的相似度大于阈值时,将第一稳定用户集或第二稳定用户集中的用户针对第一内容服务器或第二内容服务器的数据访问重定向到第三内容服务器。当第一稳定用户集与第二稳定用户集的相似度大于阈值时,重定向单元将第一内容服务器和第二内容服务器中的内容发送给第三内容服务器。

已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。

通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1