一种利用当前互联网数据和服务的方法

文档序号:7945029阅读:200来源:国知局
专利名称:一种利用当前互联网数据和服务的方法
技术领域
本发明属于分布式技术在互联网系统中综合应用,涉及的技术范围大致包括互联网基本结构、互联网资源分配及有效使用、互联网搜索以及互联网数据传输协议等。
背景技术
当前互联网技术在商业运行上已经有超过十年的历史,拥有的网站数量超过 一百万1。其中有大量数据以及服务资源,计算资源也相当丰富。然而,这些资源的利用 是建立在一个相对不合理的分布式结构上。当前互联网提供数据和服务资源的方式是以中 心结构为基础的客户服务器模式2。这种模式的优点是安全性高、管理方便。但由于受到 计算资源的限制,带来性能低、伸缩性差等诸多缺憾。现在互联网基于数据的应用可以简单 归纳为内敛、低性能、小规模、非流、小粒度、轻量级数据、非即时、无状态、低智能以及高成 本等特点。所谓内敛指的是当前互联网提供数据和服务的核心技术(服务器技术)是以互联 网客户端访问而触发的被动数据传输为特征的。如果客户端不对服务器端发出请求,则月艮 务器端的数据不会发往客户端,即使服务器端的数据不断发生变化而且服务器端明确这种 变化是客户端所需要,服务器端也不会对客户端传送任何数据。当前互联网数据和服务的低性能体现在严重受制于网络瓶颈。作为提供数据资源 的互联网服务器来说一般都具备比客户端强得多的计算资源,如CPU、存贮以及带宽等,但 是由于互联网复杂的计算环境导致实际和客户端的网络连接质量低,甚至远低于客户端所 允许的带宽,这样导致数据传输速率差以及整个互联网系统性能差。小规模也是当前互联网应用的一个特征。导致“小规模”的原因主要是互联网应 用系统的压力集中于对互联网服务器计算资源的争夺。无论客户端规模大小,计算资源完 全由互联网服务器提供。这种模式导致在互联网服务器计算资源消耗殆尽后,系统将不能 接受新的数据和服务请求,即系统规模无法继续扩大。流特征是对互联网数据和服务模式的一种常识性要求。但是这种要求对于当前互 联网互联网数据和服务应用来说却无法实现,即当前互联网是以非流为特征的。所谓流指 的是数据传输的方式。任何一个计算都有相对应的数据,而这些数据如果可以全部由互联 网服务器传送到客户端,那么对于提高系统计算性能以及用户感受会有显著帮助。然而,当 前系统由于受制于服务器计算资源的压力以及网络瓶颈,在提供数据和服务时,只能将有 限的数据提供给客户端只有在用户请求的情况下或者说相关数据必须传输否则无法延续 服务的情况下,才会把数据提供给客户端。这样就形成了当前互联网以请求回应为特征的 基本数据传输模式,即非流模式。这种模式对于降低互联网服务器压力有明显作用,是在有 限资源前提下尽可能扩大客户端规模后的产物。小粒度特征也是当前互联网为了扩大客户端规模并节省互联网服务器的计算资 源而作出的一种努力。所谓小粒度在当前互联网应用中特指数据和服务层次结构中的一个 节点。在通常的互联网应用中数据和服务都组成了层次结构,这也是一般知识结构在系统中的反映。当前互联网首先将这个层次结构中的每个节点尽量划分得足够小,即在表达完 整知识或意义的同时使得其在数据量以及内容含量上尽量小。当客户端对服务器端进行请 求的时候,其请求的对象也被严格限制在事先定义的这些小粒度数据上,即互联网服务器 所拥有的数据服务层次结构上的一个节点。客户端的请求不会导致更多节点返回给用户, 即使这些节点与被访问节点存在联系。这样处理的结果是,使得客户端尽量减少与服务器 端交互的次数;但随之造成的不足是用户必须在众多节点中寻找自己所需数据,降低了浏 览效果。与小粒度特征对应的就是轻量级特征。所谓轻量级特征就是数据或者服务对互联 网服务器形成的压力小。这种压力体现于对互联网服务器计算资源的需求上。在当前互联 网上,重量级数据传输和复杂计算等应用都会对互联网服务器造成压力,从而使得有限计 算资源被消耗在对一个或少数请求的响应,导致互联网服务器性能下降,众多客户端请求 被延误。鉴于重量级数据应用对互联网服务器资源要求高,大多数互联网应用只好以轻量 级为主,或者尽量把重量级应用转化为轻量级。上面介绍的粒度划分就是这种转换的例子 之一。
非即时也是当前互联网应用的主要特征。所谓非即时指的是互联网服务器端的数 据和服务变化无法以任何服务器主动的方式通知或者传输到互联网客户端。互联网本身是 一个不断变动的计算系统,而这种变动在当前互联网系统中只能通过互联网客户端主动请 求才能反映出来;与此矛盾的是由于互联网服务器是当前互联网计算的主体,任何变化首 先都体现在互联网服务器上,即变化的主动方来自于互联网服务器。但作为主动变化的一 方,却只能被动把这种变化反映给对此变化真正感兴趣的互联网客户端。这本身是不合理 的。这也是当前互联网在提供数据和服务资源时的一个不足。这个不足也是当前互联网技 术为减小互联网服务器压力、尽量满足更多互联网客户端访问而采取的折中解决方案。无状态特征指的是当前互联网服务器不对互联网客户端的请求作任何记忆。任何 来自客户端的请求都是一次性的,不会因为多次请求而造成服务器端接下来的响应受前面 请求的影响。这样的处理方式也是为了尽量保护互联网服务器有限的计算资源。而无状态 导致对互联网应用影响很大,比如即时性、流的形成以及智能处理等都需要对客户端状态 进行保存。当前互联网技术不得不以损失上述特征来维持有限资源对潜在用户尽可能的响 应。低智能也是当前互联网应用的主要问题。作为一个存在大量智力资源的互联网 系统来说,表现出低智能也是不合理的。在当前互联网中,由于对系统状态的忽略,作为互 联网主要计算资源的互联网服务器无法对系统智力资源的变化作出反应,对智力资源利用 差,尤其是对动态智力资源利用差。高成本是当前互联网一个缺陷之一。随着数字媒体、计算设备以及通信等技术的 提高,使得用户对互联网的需求发生变化,比如需要丰富展示、强交互、大粒度、重量级应 用、即时以及高智能等等。但在当前互联网系统中要实现上述目的,必须付出高昂的成本, 即在不改变现有体系结构的情况下,通过增加计算资源来达到对当前互联网弊端的克服。 然而,这样的成本是大多数数据和服务提供者无法承担的。大规模非中心互联网技术试图对当前互联网基本结构做改善,提出了包括基于社 会网络的路由、基于动态集群的流传输、改进后互联网的基本功能变化、改进后互联网应用层的变化等多项技术。大规模非中心互联网技术是建立在以大量用户控制的个人计算设备的基础上,再辅以有限的以多种方式贡献资源为特征的互联网服务器。从长远观点看,这种 改进的互联网系统会比当前互联网在功能、性能以及智能上都有显著提高,会成为下一代 互联网的发展趋势。但作为一个新技术其成熟和被接受需要时间;另外,对传统网站技术的 替代虽然会降低现有网站的成本,但用户习惯、提供商的经验方式的转变、客户端软件接受 程度等等因素都会影响这个新技术的普及。因此,利用当前互联网资源而不是简单等待新 技术被广泛接受对大规模非中心互联网的应用会更有意义。

发明内容
本发明的创作目的在于充分利用当前互联网数据、服务以及计算资源,使之可以 和大规模非中心互联网能够有机结合,改变当前系统的弊端,并为新型互联网贡献其资源。发布时利用当前互联网资源。在大规模非中心互联网中,发布的内容、方式以及面 临的环境和当前互联网完全不同。但这并不是说当前互联网资源不能对这样的发布起到任 何协助作用。正确的说法应该是当前互联网资源在新发布机制当中的利用条件苛刻。新发 布机制是基于大量普通计算设备来进行的。通常普通计算设备和互联网服务器之间的网络 连接质量不能达到重量级数据发布的要求。同时,当前互联网服务器和普通计算设备之间 的关系只能形成简单的客户/服务器模式,不能通过彼此之间的协作改善网络连接质量问 题。鉴于上述原因,为了利用当前互联网资源,可行的办法就是事先通过传统上载手段把发 布数据传送到互联网服务器之上;然后当需要在大规模非中心互联网中进行大规模、重量 级、即时、迅速的发布时,可以利用事先存放在互联网服务器上的数据。这样除了对等服务 器、安装了对等客户端的普通计算设备参与发布外,还可以尽量让上述设备与这个当前互 联网服务器建立连接,使得发布数据的压力可以不仅限于原始发布设备、对等服务器、对等 客户端,也可以从当前互联网服务器上得到帮助。访问时利用当前互联网资源。大规模非中心互联网的访问也不是互联网客户端简 单地根据域名向互联网服务器发出请求。新的访问机制也是由访问者拥有的普通计算设 备、对等服务器以及其他对等客户端来参与的,从而形成重量级数据的访问效果。当被访问 者为当前互联网服务器时,通过本发明的支持,可以把这样的访问转化为大粒度、性能显著 提高、即时,甚至具备重量级数据访问的效果。当然,达到这样的目的有一个前提,就是被访 问互联网服务器拥有高质量的数据或服务。否则,至少在重量级数据效果上不会有显著变 化。如果被访问的互联网服务器以轻量级数据为主,那么大粒度、低延迟、大规模、即时性、 发散性甚至成本都会有体现。所谓大粒度是针对当前互联网服务器对数据访问量以及范围 的严格限制上的缺陷而言的数据的访问打破了基于请求回应的消息模式,而是将数据层 次结构上相关的数据都传输给访问者,形成所谓大粒度,降低延迟,提高访问效率。访问规 模上的扩大会得到显著体现任何访问用户都可以得到相关回应,无需受到互联网服务器 计算资源的限制。当被访问数据发生变化时,也无需访问者通过发出请求就可以获得相关 数据;这个变化也体现了对当前互联网服务器无状态特征的改进。这些改进的结果还有一 个直接体现就是当前互联网服务器为支持大规模访问所需成本大大下降。搜索时利用当前互联网资源。本发明在利用现有搜索资源的基础上,给用户提供 了新的搜索体验。新的搜索体验主要表现在以下几个方面,即直接获取数据、全息、即时、高性能、智能性等。当前互联网搜索服务不能直接获取数据,搜索返回的是指向数据的远程链 接,并不是搜索的最终结果。本发明使得现有搜索服务以直接搜索结果回应搜索请求。除 此之外,搜索还具备了全息特征。所谓全息指的是搜索结果能反映搜索请求所涉及事物的 全貌。任何一个事物都不是孤立的,都是和其他事物相关的。鉴于这个认识,对当前互联网 搜索服务的改造,产生的结果除了直接相关的数据外,更重要的是把相关人群也搜索到;这 个人群当中包括相关数据读者,也包括相关数据提供者。搜索者可以借助这些结果找到更 精确的数据和相关的人。本发明认为对人的寻找比数据更为重要。搜索本质上也是一种访 问,或者称为间接访问。由于本发明对访问当前互联网服务器进行了改造,也会导致搜索性 能的提高以及具备即时性。除此之外,利用本发明还可以对现有搜索结果按照新的标准重 新排序,以更好地体现系统的智能特征。观看时利用当前互联网资源。观看是指对持续的数据和服务有选择的访问形式。 在当前互联网系统中,所有数据和服务的访问都是基于非流机制进行的;这种非流机制要 求用户频繁地和互联网服务器进行交互,以达到获取完整数据的目的。这并不是最佳的方 式;频繁进行远程请求严重降低了用户的访问体验。通过对传统互联网系统的改造和再利 用,可以赋予传统互联网观看的功能,大大减少用户在访问过程中的远程请求数量,同时保 证视频数据的访问效果,从而根本上改变传统互联网访问方式。本发明的积极效果为本发明提供了一个利用现有互联网资源的基本方法。这个方法使得当前互联网资 源能够以即时、智能、高效的方式展现在互联网用户面前,为旧的互联网体系中有价值的资 源更便捷地服务于新型互联网及其用户建立了技术环境,这也是最终完成当前互联网向下 一代互联网转型的必要手段。


图1.对当前互联网服务器进行对等化和发散化后形成互联网的工作方式;图2.对现有搜索引擎的利用。
具体实施例方式第一步,对现有互联网服务器进行对等化处理,即把当前互联网服务器转化成大 规模非中心互联网的一个对等服务器。当前互联网服务器的工作目标和对等服务器类似, 即贡献给整个互联网用户,在资源许可的条件下满足用户请求。当然,在资源不足的情况 下,对等服务器和当前互联网服务器的行为是有差别的。当前互联网服务器一般会采取让 用户等待的方式;而对等服务器根据当前整个系统的状态拒绝某些正在服务的用户和接受 当前用户的请求,但也可能作出让用户等待的方式。但即使是等待,并不是得不到服务,而 是提供集群信息,使用户加入相应集群而得到服务。用户请求只有在下面情况下才会得不 到响应没有相应集群存在,并且对等服务器也满负荷,同时对等服务器也作出了让用户等 待的决定。由于当前互联网服务器在目标上和对等服务器有类似之处,在当前互联网服务 器保持现有方式不变的情况下,可以通过动态集群和对等服务器技术将其转换成类似于对 等服务器的工作方式。具体实现方式如下。(1)在大规模非中心互联网中为用户提供访问当前互联网服务器的接口。当前用户习惯于使用浏览器来访问当前互联网服务器;如果通过使用大规模非中心互联网接口访 问当前互联网服务器能够得到显著不同的感受和效果,那么就可以改变用户的使用习惯。 (2)在用户通过这个接口输入待访问的当前互联网服务器网址后,对等服务器会 检验是否曾经访问过这个网址。如果没有,应该根据这个网址去访问相关当前互联网服务 器,并使得用户请求直接发送到传统服务器从而得到响应。对等服务器自身在访问这个当 前互联网服务器时,要根据这个网址做粒度略大的访问,即获得基于当前用户访问请求获 得更深层次的数据,可能的情况下应该获得基于这个网址的全部低层数据;这为提高用户 的访问效率及改造当前互联网服务器有重要作用。如果有这个数据,并且当前有多个用户 因此而形成了集群,那么这个对等服务器可以允许用户加入这个集群,在集群中获得相关 数据和服务,同时通过自身的能力协助这个集群。对等互联网服务器除了根据用户请求的 网址获得大粒度数据外,还要针对这个网址做周期访问,以期获得最新更新,并向仍然没有 离开这个网址的用户发送更新数据。然而当前互联网服务器是不提供状态服务的。对等服 务器由于有能力向用户提供更新数据,对于一个更新频繁的网址,用户可以长期和对等服 务器联系,从而保持获得最新数据或服务的状态。对于集群的形成要借助于频道节点的帮 助;这需要访问当前互联网服务器的用户指定频道以提供可能的集群计算资源。关于频道 的问题可以参照下面的相关论述。(3)赋予当前互联网服务器具备协助弱集群的能力。对等服务器的主要职责是对 弱集群提供帮助。在用户节点基于网址形成集群后,也会出现类似一般集群中性能下降的 情况。在这种情况下,这时候对等服务器可以依照其本身的规则对这些节点进行帮助。除了 利用自身资源优势协助弱集群外,对等服务器可以把传统服务器的计算资源引入来帮助弱 集群,其方式也直截了当,即让用户的一些请求发送至传统互联网即可。与此同时,对等服 务器也可获得相应更新数据,从而减轻自身访问其他系统的代价。这里需要指出的是,由于 当前互联网服务器主要还是以轻量级数据和服务为主,所以出现弱集群的机会并不大。另 夕卜,对等服务器虽然在周期性地访问传统服务器,但它并没有必要保存这些真实数据,而是 这些数据的哈希值,用以验证数据是否更新;它只需要作出数据是否变更的判断后并把数 据移动到相关集群即可。这减小了对等服务器的存贮压力和相关资源消耗。当对等服务器 无法承担这个工作时,也可以采取选取某个节点来完成这个工作。(4)对等化时可以利用用户控制的计算资源和当前互联网服务器资源。除了前面 提到的利用对等服务器周期访问当前互联网服务器来进行对等化以外,还可以利用用户的 访问能力以及相应的当前互联网服务器的能力。虽然对等服务器主要负责对等化任务,但 系统也允许用户以主动的方式访问当前互联网服务器。但与传统系统不同的是,这个访问 的回应除了访问用户可以直接获得外,对等服务器也会得到,并进行确认其是否已在相应 集群中存在;如果存在,则不在集群中进行广播;否则,则进行广播;同时,对等服务器的访 问周期可以因此适当推后,从而减轻了对等服务器周期访问的压力。当集群规模大时,对等 服务器周期访问频率会明显因此而下降。这种做法实质上是对用户资源和传统服务器资源 的利用带来的好处。(5)最后要注意的是,现在有一些互联网服务器通过⑶N3甚至P2P技术4来 辅助互联网服务器形成重量级数据的应用,如流媒体5等。面临这种情况,可以通过获取 其流媒体数据并转发给集群的手段来解决。但如果当前互联网服务器使用的是私有协议,那么这个做法会受到限制。由于这样的互联网服务器通常计算资源丰富,不去做任何辅助 也可以。第二步,通过网址建立动态计算集群。在大规模非中心互联网系统中节点都是以 或大或小的集群方式来运行的。为了有效利用传统互联网的数据、服务资源以及相关计算 资源,除了通过对等服务器来帮助以外,在访问传统互联网节点之间形成集群也会提高计 算资源使用效率,并降低对对等服务器形成的压力。由于传统互联网中的数据大多还是以 轻量级为主,系统动态性对集群影响不大,所以这种集群的质量一般是高的,维护代价也要 小。对于面向轻量级数据和服务的应用,集群的形成方法也可以简化,一般通过基于消息的 多播协议就可以形成。第三步,利用当前互联网服务器资源形成流。当前互联网服务器的特点之一就是 非流系统,即数据和服务是以间断、小粒度和轻量级的方式传输的。这和流的概念完全不同 的。在引入对等服务器和动态集群技术后,可以通过对等服务器大粒度周期访问非流互联 网服务器,并把相关数据注入动态集群的方式形成流。这种做法一方面提高了系统资源利 用率,同时提高了用户访问互联网的感受。在这个过程中,从传统服务器采集数据并进行组 织的顺序对于形成有意义的流非常重要。通常可借助网址之间的层次关系来进行判断。网 址之间的层次关系一般是数据和服务提供者人为建立的。在多数情况下会形成树状或接近 树状的层次结构。但这些网址之间的关系也由于广告等其他因素变得凌乱复杂,这只有借 助于相关网页处理技术7来进行分析。极端情况下,甚至需要人为参与,进行手工辅助。第四步,对当前互联网服务器进行发散化。将内敛型互联网服务器转换成发散型 互联网服务器。内敛型互联网服务器的出现是适应当时互联网环境造成的结果。在维持当 前互联网基本运行方式不变的条件下,通过动态集群技术和对等服务器技术,可以把传统 内敛型互联网服务器改造成发散型互联网服务器。这时候,对等互联网服务器除了负责获 取当前互联网服务器数据并帮助弱集群外,还需要在大规模非中心互联网中寻找潜在的用 户。其基本方式也是利用频道和复杂网络8的特征来进行。为了减轻对等服务器的代价, 也可以在相应的动态集群中选择节点来完成此任务。需要强调的是,这里所说的对等化和 发散化是严格建立在用户意愿之上的,或者决定于当前互联网服务器作为一个特殊发布者 所拥有数据和服务质量基础上。相应集群的质量也决定于用户的选择和互联网服务器的数 据和服务本身。第五步,协调对等化和发散化之后的互联网服务器与频道的关系。频道作为大规 模非中心互联网系统中重要的路由辅助手段,对整个系统集群的建立起着重要支持作用。 对普通节点来说,加入、离开甚至创建频道都是在自愿基础上作出的决定,系统无权对此做 任何干扰。作为当前互联网服务器来说,其运行模式完全和大规模非中心互联网中的普通 节点不同,或者说两者完全是异质系统,不通过特别处理根本不能进行交互。这样,一个当 前互联网服务器所处频道只能由该服务器的局外人来控制。通常要求用户指定所访问的互 联网服务器所处的频道。系统将根据频道内部成员的反应来作出最终决定是否接纳此网址 成为该频道的成员。如果用户对当前互联网服务器的访问形成了集群,则接纳此网址对应 的互联网服务器为该频道成员;如果用户对当前互联网服务器的访问没有形成集群,则不 接纳此网址对应的互联网服务器为该频道成员。这种做法会给用户带来额外负担。另外一 个可行的方法是利用现有互联网存在的目录服务系统。这样的目录服务系统对网址进行了分类,包含主要互联网现存网址。这种分类类似于大规模非中心互联网中的频道,因此可以 利用这个数据来建立频道。假设一个网址不在这个分类当中,可以借助人工辅助或者根据 基于此网址形成的集群成员来对此网址进行频道归类。图1表示对当前互联网服务器进行 对等化和发散化后形成互联网的工作方式。第六步,利用现存搜索引擎的资源。搜索是当前互联网最重要的应用之一。然而, 当前互联网的搜索同当前互联网服务器一样面临众多问题。所有出现在当前互联网服务器 上的问题在当前搜索系统表现得很典型。当前搜索服务的提供者在成本上的负担很沉重。 在建立大规模非中心互联网系统时,开始阶段数据和用户有限。一个可行的解决方案是合 理使用当前搜索引擎提供的服务,并将其数据逐步转换成大规模非中心互联网的一部分, 从而实现全面满足用户需求的搜索目标。
(1)把用户的搜索请求发至相关搜索引擎。要做到这一点并不困难,鉴于当前互联 网提供搜索服务的互联网服务器已经趋于固定几个提供者,甚至可以人为地进行设定。但 这个请求是发至传统搜索提供者还是大规模非中心互联网自己处理,决定于系统的成熟程 度。一般在早期阶段,应该以发至搜索服务提供者为主,自身处理为辅;在进入成熟阶段后, 这个局面会逐渐改变。其标志是主要互联网服务器都已经被大规模非中心互联网对等化和 发散化。(2)在相关搜索引擎给予回应后,应当把数据返回给用户。需要注意的是,这个搜 索结果还不是真实的数据而是超链接或者网址;并且一般来说,这个网址的数量多。这时, 对等服务器可以根据这些网址替用户获得数据,然后把数据转发给用户;同时在大规模非 中心互联网中做索引,从而使这个数据成为大规模非中心互联网的一部分。这里要强调的 一点是,对等服务器在获取数据时和对普通互联网服务器进行的对等化处理是不同的。这 里数据获取类似广度优先9,而对等化过程类似于深度优先9。根据全息搜索的要求, 用户节点在收到搜索结果后,也要对相关数据做索引,为个性化搜索做准备。(3)利用现有搜索资源产生集群。基于现有搜索服务商提供的搜索结果产生集群 是困难的。在大规模非中心互联网足够成熟时,这些网址对应的互联网服务器已经被对等 化和发散化,那么用户还可以通过相应集群以高效率获得更多数据。如果这些网址对应的 互联网服务器很多还没有被对等化和发散化,可以通过搜索中获得邻居节点的方式来找到 相应集群。但这种情况下数据来源以及运行机制不同,集群的形成会变得困难。用户的搜 索请求是由搜索服务提供者响应的,所以不存在大规模非中心互联网中搜索时会产生搜索 路径;这也对集群的形成造成影响。一个可行的方法是通常用户在搜索时都会局限在一个 频道内部,可以通过频道的方式获得计算资源来形成集群。问题是一般搜索结果对应的互 联网服务器很多,在集群资源寻找困难的情况下,如果对众多互联网服务器进行对等化或 发散化,其效率会过低。一般来说,只能对搜索产生的网址中少数互联网服务器进行对等化 和发散化。图2表示对现有搜索引擎的利用。第七步,在大规模非中心互联网中利用转化后的当前互联网服务器。当前互联网 服务器在被对等化和发散化之后,从普通用户角度看和一个发布者没有区别。所有处于大 规模非中心互联网中的节点会形成社会网络系统8。作为一个成熟的当前互联网服务器, 通常会成为这个社会网络中的超级节点8;作为一个普通的当前互联网服务器,其作用甚 至会小于系统中以个人身份出现的一些超级节点。一个成熟的当前互联网服务器,通常会有大量人工维持其运行,这种智力资源是形成其超级节点地位的重要原因。但这个超级节 点除了对数据和服务资源的贡献外,对提高系统性能的贡献要小于对等服务器,这主要是 其工作方式无法与众多节点形成更有效的动态集群。但对于成熟的当前互联网服务器来 说,其对系统性能的提高也是显著的。这主要是因为其绝对计算资源多而造成的。第八步,利用转换后当前互联网服务器中的智能资源。大规模非中心互联网的特 点之一是系统性能或集群性能不只决定于计算资源的多寡,而更大程度上决定于数据和服 务质量。这个特点的形成是由于参与计算的节点是在用户直接控制之下;数据和服务的质 量会即时对用户产生作用。用户的正面或负面的反应会增强或消弱系统或集群的性能。这 个特征正是系统智能资源的体现,即智能资源直接决定计算资源;反过来,也可以利用这样 的智能资源对数据和服务作出评估。对等化和发散化后的当前互联网服务器不具备这样的 动态性,但如 果作为超级节点,其提供的数据和服务影响力会大于普通发布者。在对数据和 服务进行评估的时候,超级节点贡献的数据和服务进行适当加权处理。参考文献[1] January 2009Web Server Survey ; http://news.netcrafi.com/archives/ web_server_survey. html2Satyanarayanan Μ.,Mullender S-Distributed Systems, an Advanced Course,2ndEdition,Wokingham :ACM Press/Addison-Wesley, 19893Akamai ;http://www. akamai. com4Cohen B. ;Incentives Build Robustness in BitTorrent,in Workshop on Economics of Peer—to—Peer Systems, Berkeley USA, May 2005Vlavianos Aggelos,et al· BiToS !Enhancing BitTorrent for Supporting StreamingAppIications,INF0C0M 2006,25th IEEE International Conference on Computer Communications Proceedings, April 2006, Page (s) :1_6Obraczka,K· ;Multicast Transport Protocols :a Survey and Taxonomy, Communication Magazine, IEEE, Volume 36,Issue 1, Jan. 1998Page(s) :94_102
7Soumen Chakrabart i,Mart in van den BergiByron Dom ;Focused Crawling :a New Approach to Topic-Specific Web Resource Discovery,the International Journal of Computer and Telecommunications Networking,Page(s) : 1623-16408Newman M E J. ;The Structure and Function of Complex Networks, SIAM Review, 2003,45,Page(s) :167_259Thomas H. Cormen, Charles E.Leiserson,Ronald L Rivest ;Introduction to Algorithms,MIT Press,2nd Edition, ISBN-IO 026203293权利要求
一种利用当前互联网数据和服务的方法,其特征在于发布时利用当前互联网资源;访问时利用当前互联网资源;搜索时利用当前互联网资源;观看时利用当前互联网资源。
2.一种利用当前互联网数据和服务的工作方法,其步骤如下1)建立对等服务器;2)对当前互联网服务器进行以对等化为特征的转化;3)通过网址建立动态计算集群;4)利用传统互联网服务器资源形成流;5)对当前互联网服务器进行以发散化为特征的转化;6)将对等化和发散化后的互联网服务器加入频道;7)通过对等化和发散化的方式利用现存搜索引擎。
3.如权利要求2所述,其特征在于为互联网提供资源资助机制,这个机制能够监测到 互联网中资源的运行状态,并通过自身资源去协助,保证整个互联网计算的高效率。
4.如权利要求2所述,其特征在于从用户角度看,把传统互联网服务器转化成以对等 方式工作服务器,其方法为1)为用户提供访问当前互联网服务器的接口,这个接口以当前互联网基本访问方式工 作,即HTTP和WWW ;2)用户通过这个接口输入待访问的当前互联网服务器网址;3)对等服务器检验是否访问过这个网址。若未访问过,则对等服务器将用户请求的网 址直接发送到传统服务器并得到其回应;若访问过,并且当前已有多个用户基于此形成了 集群,则对等服务器允许用户加入这个集群,使其在集群中获得相关数据和服务;4)对等服务器根据用户请求的网址获得大粒度数据,同时通过自身的能力协助相关集 群,使得每个集群的效率达到最佳;5)对等服务器依照用户输入的网址对传统互联网服务器做周期访问,以获得最近更 新,并向尚未离开这个网址的用户发送更新数据;6)对等服务器利用自身资源优势,把当前服务器的计算资源引入弱集群,即将用户的 一些请求发送至当前互联网服务器来分担访问压力。
5.如权利要求2所述,其特征在于通过网址建立动态计算集群,以提高计算资源使用 效率,降低对对等服务器以及当前互联网服务器形成的压力,其方法为1)在访问当前互联网节点时通过互相访问,实现相互提供对方需要的数据,从而形成 集群;2)通过基于消息的多播协议形成传统互联网中的以轻量级数据为主的动态计算集群;3)当数据以重量级形式表现出来时,互联网节点之间以BT或BitToS支持的方式交互。
6.如权利要求2所述,其特征在于流的形成。流指的是数据在无用户具体数据请求下 持续不断的传输方式,其方法为1)按照权利要求4所述方法引入以对等和贡献方式主导的服务器;2)按照权利要求5所述方法引入动态集群;3)按照权利要求4所述方法,对等服务器以大粒度、周期性地访问非流互联网服务器, 并把相关数据注入动态集群;4)对等服务器从当前互联网服务器采集数据,根据网址之间的层次关系把所采集数据 提供给(或流向于)用户。
7.如方法2所述,其特征在于从用户角度看,将当前(内敛型)互联网服务器转换成发 散型互联网服务器,其方法为1)对等服务器担负为当前互联网服务器寻找潜在客户端的任务;通过基于频道和社 会网络的路由机制找到潜在用户,并把从当前互联网服务器得到的数据或服务转发给用 户;2)少数当前互联网服务器具备充分的资源;在对等服务器主动为用户服务时,可以利 用当前互联网服务器的能力服务于潜在用户,分担资源管理器压力。
8.如权利要求7所述,其特征在于依据当前互联网服务器提供的数据意义将其加入相 应的频道,其方法为1)用户指定所访问互联网服务器网址所处频道;如果用户对传统互联网服务器的访 问形成了集群,则接纳此网址对应的互联网服务器为该频道成员;如果用户对传统互联网 服务器的访问没有形成集群,则不接纳此网址对应的互联网服务器为该频道成员;2)利用现有互联网存在的目录服务系统建立频道;目录系统包含主要互联网现存网 址及其分类;利用这些信息来建立频道;如果一个网址不在这个目录中,可以借助人工辅 助或者根据基于此网址形成的集群成员来对此网址进行频道归类。
9.如权利要求2所述,其特征在于在利用现存搜索引擎的能力和资源,其方法为1)把用户搜索请求发至相关搜索引擎;在系统尚未成熟的早期阶段,一般应将搜索请 求发至搜索服务提供者;当系统进入成熟阶段(主要互联网服务器都已经被大规模非中心 互联网对等化和发散化)后,一般应将搜索请求发至大规模非中心互联网;2)相关搜索引擎返回超链接或数据的网址,对等服务器从返回的网址中取得真实数 据,然后转发给用户;3)在大规模非中心互联网中对搜索到的数据做索引,使这个数据成为大规模非中心互 联网的一部分;4)用户节点在收到搜索结果后,也要对相关用户、频道等信息做索引,为个性化搜索做 准备。5)在大规模非中心互联网足够成熟时,用户还可以通过相应集群以高效率获得更多数据。
全文摘要
本发明公开了一种利用当前互联网数据和服务的方法,属于分布式技术在互联网系统中的综合应用。本发明首先要求建立以贡献自身资源为主要目的的对等服务器;并赋予这个服务器以转换当前互联网数据和服务的能力,即通过与当前互联网进行交互,获得其数据和服务,并把这种数据和服务以大规模非中心互联网接受的方式加以利用。在这个过程中,对等服务器要对当前互联网服务器采取对等化和发散化,使之从用户角度看成为与对等服务器一致的形式运行;对等化和发散化的互联网服务器要被以手工或自动的方式加入相应频道,使它能够接收范围模糊的访问以及易于产生流。使用类似方法,当前互联网引擎也可以被利用并逐步改造。本发明充分利用了当前互联网数据、服务以及计算资源,使之可以和大规模非中心互联网能够有机结合,改变当前系统的弊端,并为新型互联网贡献其资源。
文档编号H04L12/18GK101800688SQ200910008610
公开日2010年8月11日 申请日期2009年2月5日 优先权日2009年2月5日
发明者李冰 申请人:李冰
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1