管理企业网络对等共享存储的方法和系统的制作方法

文档序号:10488964阅读:562来源:国知局
管理企业网络对等共享存储的方法和系统的制作方法
【专利摘要】本申请提供了管理企业网络对等共享存储的方法和系统。对等者使用联网设备利用唯一标识(ID)登录到企业社交平台中,所述唯一ID标识相应企业网络用户。用户可以是企业网络团队的成员。当团队成员对等者请求与该团队相关联的文件的拷贝时,联网设备确定其他成员是否已存储该文件的复本。如果其他成员存储了复本,则联网设备接收这些复本中的一个。否则,联网设备从企业社交平台接收拷贝,并且该拷贝由团队成员中的一个存储。
【专利说明】
管理企业网络对等共享存储的方法和系统
技术领域
[0001] 本发明涉及共享文档管理,并且更特别地涉及用于企业团队合作文档的共享文档 管理和存储。
[0002] 情境技术
[0003] 社交网络诸如Facebook、Twitter和My space已经变得无处不在。企业特别是大企 业诸如大型跨国公司正在使封闭(内部)的社交网络适应于特定企业内的不同情境。这些企 业社交网络可以改善不同的企业分支或团队(例如部门、地点和/或国家边界)中的同事关 系以及不同的企业分支或团队之间的同事关系。使用封闭的社交网络,企业员工可以与其 他员工成员联系和联合以便合作和共享想法、内部文档和信息。社交网络用户(例如,企业 管理人员和员工)可以针对每个项目形成项目组成员的团队以促进项目互通。类似地,用户 可以形成其他特设的与工作相关的或有共同兴趣的社区,例如公司运动队或其他业余活 动。
[0004] 在这些团队内,团队成员可以形成活动流、上传/下载和共享文档。在典型项目中, 成员可能会经常更新共享文档。多次散发更新对于改善机构范围的合作和协调至关重要。 然而,典型的,利用每次更新,旧版本可能会变得无关。然而,在新版本变得可用时,用户很 少清除旧版本。此外,偶尔地,可能会需要参照、或者甚至回溯并撤消最近的更新。因此,可 能合乎期望的是,保持一定数量的旧版本。然而,取决于特定文档上的合作者的数量,用于 在若干不同的用户机器上保持同一文档的若干不同版本的开销可能过高。尽管在专用的中 心存储上收集所有不同版本可能会降低这种开销,但是这也需要专用存储具有充分弹性以 匹配增加/扩展的数据量。不幸的是,提供足够的专用本地或云存储以保证可用性和可靠性 的费用可能过高。例如,公共云存储可能足以存储数据,但是数据私密性是典型公共云的问 题。
[0005] 此外,企业是雇员和雇员责任流动或变化的流动实体。雇员和关联责任的变化常 常会改变企业团队成员。例如,现有的项目可能会新添加雇用者或被调动者。同样,随着时 间推移,雇员可能会离开项目,例如当某人退出、被解雇、调动或受提拔时。这些雇员变化会 改变项目成员和成员关系,并因此改变社交网络团队的全体成员。此外,典型的项目可能会 由于它的动态特性、或者因为具有由活动很少的平静期划分开的高度活跃的高峰期的广泛 变化的活动而改变。而且,随着项目平静下来并结束,相关联的社区可能会保留兴趣和责 任。为企业团队提供存储能力的典型存储系统需要显著的努力和所得到的开销(即,费用) 来适应这种流动性。
[0006] 因此,存在着降低企业合作数据存储开销以及加强合作数据处理的需要;并且更 特别地,存在着降低在企业范围的合作项目中所收集和存储的冗余数据和过时数据的量的 需要。

【发明内容】

[0007] 本发明的一个特征是自管理对等存储;
[0008] 本发明的另一特征是用于企业社交网络的自管理对等存储;
[0009] 本发明的又一特征是企业社交网络对等存储系统;
[0010]本发明的又一特征是基于云的自管理企业社交网络对等存储。
[0011] 本发明涉及用于管理企业网络中的对等存储的对等存储系统、方法和程序产品。 对等者使用联网设备以便利用标识各个企业网络用户的唯一标识(ID)登录到企业社交平 台中。用户可以是企业网络团队的成员。当团队成员对等者请求与该团队相关联的文件的 拷贝时,联网设备确定其他成员是否已存储该文件的复本。如果其他成员存储了该复本,则 联网设备接收这些复本中的一个。否则,联网设备从企业社交平台接收拷贝,并且该拷贝由 团队成员中的一个成员存储。
【附图说明】
[0012] 前述和其他目的、方面和优点将参照附图从本发明的优选实施例的以下详细描述 中得到更好的理解,在附图中:
[0013] 图1示出根据本发明实施例的云计算节点;
[0014] 图2示出根据本发明实施例的云计算环境;
[0015] 图3示出根据本发明实施例的抽象模型层;
[0016] 图4示出根据本发明优选实施例的企业网络对等存储系统的示例;
[0017] 图5示出在优选的对等(例如,员工对员工)网络存储系统中的企业社交联网对等 设备的示例;
[0018] 图6示出响应于新文件上传请求而推荐一组用户在对等设备上存储文件的对等设 备的示例;
[0019] 图7示出管理本地存储的复本的对等设备的示例。
【具体实施方式】
[0020] 本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机 可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
[0021] 计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形 设备。计算机可读存储介质例如可以是一一但不限于一一电存储设备、磁存储设备、光存储 设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的 更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存 储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式 压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上 存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算 机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通 过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输 的电信号。
[0022] 这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/ 处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外 部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关 计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计 算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计 算机可读存储介质中。
[0023] 用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、 机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的 任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言一诸如 Smalltalk、C++等,以及常规的过程式编程语言一诸如"C"语言或类似的编程语言。计算机 可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独 立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机 或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络一包 括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利 用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令 的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可 编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方 面。
[0024] 这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/ 或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/ 或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0025] 这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据 处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据 处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功 能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指 令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的 计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中 规定的功能/动作的各个方面的指令。
[0026] 也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它 设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产 生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的 指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0027] 附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程 序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代 表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用 于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也 可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执 行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或 流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动 作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。 [0028]还应事先理解的是,尽管本公开包括关于云计算的详细描述,但是本文所记载的 教导的实现并不局限于云计算环境。而是,本发明的实施例能够结合现在已知或以后开发 的且如下文中进一步指示的任何其它类型的计算环境而实现。
[0029] 对等(P2P)计算或联网是在对等者之间划分任务或工作负荷的分布式应用架构。 P2P网络设备或对等者是P2P应用中的具有同等特权的等效参与者的网络节点。对等者可使 它们的资源(诸如盘存储)的一部分直接可用于其他网络参与者,而无需服务器或稳定主机 的中央协调。通常,对等者既是资源的供应者又是消费者。这与划分资源的消费和供给的传 统客户端-服务器模型形成对比。
[0030] 云计算是一种服务交付模型,用于实现对可配置的计算资源(例如,网络、网络带 宽、服务器、处理、内存、存储、应用、虚拟机和服务)的共享池的便利、按需的网络访问,所述 可配置的计算资源能够以最小的管理成本或与服务提供者的最少交互而被快速供应和释 放。这种云模型可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
[0031] 其特征如下:
[0032] 按需自助服务:云的消费者无需与服务提供者进行人为交互就能够单方面自动地 按需供应诸如服务器时间和网络存储等之类的计算能力。
[0033] 广泛的网络访问:能力可以通过网络获取并通过标准机制访问,所述标准机制促 进不同种类的瘦客户端平台或厚客户端平台(例如移动电话、膝上型电脑和HM)对云的使 用。
[0034] 资源池化:提供者的计算资源被池化以使用多租户模型服务于多个消费者,并且 根据需求动态地分配和再分配不同的物理和虚拟资源。存在着位置独立感,因为消费者通 常不能控制或不知晓所提供的资源的确切位置,但是能够在较高的抽象层面(例如国家、州 或数据中心)上规定位置。
[0035] 迅速弹性:能力能够迅速且有弹性地被供应,在一些情况下被自动地供应以快速 扩展,并且能够迅速释放以快速缩减。对于消费者而言,用于供应的可用能力往往看上去是 无限的,并且能够在任何时候购买任意数量。
[0036]被测量的服务:云系统通过利用适合于服务类型(例如存储、处理、带宽和有效用 户帐户)的某个抽象层面上的计量能力,自动地控制和优化资源使用。可以监测、控制和报 告资源使用,从而为被利用的服务的提供者和消费者双方提供透明度。
[0037]服务模型如下:
[0038]软件即服务(SaaS):向消费者提供的能力是使用在云基础设施上运行的提供者的 应用。该应用可通过诸如网络浏览器的瘦客户端接口(例如基于网络的电子邮件)从各种客 户端设备访问。除了有限的特定于用户的应用配置设置的可能例外,消费者并不管理或控 制包括网络、服务器、操作系统、存储、乃至个体应用能力的下层云基础设施。
[0039]平台即服务(PaaS):向消费者提供的能力是把使用提供者支持的程序设计语言和 工具创建的消费者创建或获取的应用部署到云基础设施上。消费者并不管理或控制包括网 络、服务器、操作系统或存储的下层云基础设施,但是对部署的应用和可能的应用托管环境 配置具有控制权。
[0040]基础设施即服务(IaaS):向消费者提供的能力是在消费者能够部署并运行包括操 作系统和应用的任意软件的地方供应处理、存储、网络和其他基础计算资源。消费者并不管 理或控制下层云基础设施,但是对操作系统、存储、部署的应用具有控制权,并且可能对选 择联网组件(例如主机防火墙)具有有限的控制权。
[0041 ]部署模型如下:
[0042]私有云:云基础设施单独为某个组织运行。其可以由该组织或第三方管理、并且可 以存在于该组织内部或外部。
[0043]社区云:云基础设施被若干组织共享并且支持具有共同关注的问题(例如使命、安 全要求、政策和合规考虑)的特定社区。其可以由这些组织或第三方管理并且可以存在于该 社区内部或外部。
[0044]公共云:云基础设施对于一般公众或大型行业群体而言可用并且由出售云服务的 组织拥有。
[0045] 混合云:云基础设施是两个或多个云(私有云、社区云或公共云)的组成物,所述两 个或多个云依然是独特的实体,但是通过使数据和应用能够移植的标准化或私有技术(例 如用于云之间的负荷平衡的云突发(cloud bursting))绑定在一起。
[0046]云计算环境是面向服务的,聚焦于无状态性、低耦合性、模块性和语意互操作性。 云计算的核心是包含互连节点的网络的基础设施。
[0047]现在参考图1,其示出云计算节点的示例的示意图。云计算节点10仅是适合的云计 算节点的一个示例,并且并非旨在暗示对本文所述的本发明的实施例的使用范围或功能进 行任何限制。无论如何,云计算节点10能够实现和/或执行上文中阐述的任何功能。
[0048] 在云计算节点10中,存在计算机系统/服务器12,其可以利用许多其他通用或专用 计算系统环境或配置来运行。可适合由计算机系统/服务器12使用的熟知的计算系统、环境 和/或配置的示例包括但不限于:个人计算机系统、服务器计算机系统、瘦客户端、厚客户 端、手持或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子设 备、网络PC、迷你计算机系统、大型计算机系统、以及包括上述系统或设备中的任一种的分 布式云计算环境、等等。
[0049] 计算机系统/服务器12可在由计算机系统执行的计算机系统可执行指令(诸如程 序模块)的一般背景中描述。通常,程序模块可包括执行特定任务或实现特定抽象数据类型 的例程、程序、对象、组件、逻辑、数据结构等。计算机系统/服务器12可在任务由通过通信网 络连接的远程处理设备执行的分布式云计算环境中实施。在分布式云计算环境中,程序模 块可位于包括存储器存储设备的本地和远程计算机系统存储介质中。
[0050] 如图1所示,云计算节点10中的计算机系统/服务器12以通用计算设备的形式示 出。计算机系统/服务器12的组件可包括但不限于一个或多个处理器或处理单元16、系统存 储器28、以及将包括系统存储器28在内的各种系统组件耦接至处理器16的总线18。
[0051]总线18表示几种类型的总线结构中的一种或多种,所述几种类型的总线结构包括 存储器总线或存储器控制器、外围总线、加速图形端口、以及使用各种总线架构中的任一种 的处理器或本地总线。举例来说而并非进行限制,这样的架构包括工业标准架构(ISA)总 线、微通道架构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)本地总线、以 及外围组件互连(PCI)总线。
[0052] 计算机系统/服务器12通常包括各种计算机系统可读介质。这样的介质可以是可 由计算机系统/服务器12访问的任何可用介质,并且其包括易失性和非易失性介质、可移动 和不可移动介质。
[0053] 系统存储器28可以包括易失性存储器形式的计算机系统可读介质,诸如随机存取 存储器(RAM)30和/或高速缓冲存储器32。计算机系统/服务器12还可包括其他可移动/不可 移动、易失性/非易失性计算机系统存储介质。仅举例来说,可以提供存储系统34以用于从 不可移动、非易失性磁介质(未示出并通常被称为"硬驱")读取和向其写入。尽管未示出,但 是可以提供用于从可移动、非易失性磁盘(例如,"软盘")读取和向其写入的磁盘驱动器,以 及从可移动、非易失性光盘诸如⑶-R0M、DVD-R0M或其他光学介质读取或向其写入的光盘驱 动器。在这样的实例中,各自可通过一个或多个数据介质接口连接到总线18。如将在下面进 一步示出和描述的那样,存储器28可包括具有一组(例如,至少一个)程序模块的至少一个 程序产品,所述程序模块配置成执行本发明的实施例的功能。
[0054]举例来说而不是进行限制,具有一组(至少一个)程序模块42的程序/实用程序40、 以及操作系统、一个或多个应用程序、其他程序模块和程序数据可存储在存储器28中。操作 系统、一个或多个应用程序、其他程序模块和程序数据或上述的某种组合中的每一个可包 括联网环境的实现。程序模块42通常执行如本文所述的本发明的实施例的功能和/或方法。 [0055]计算机系统/服务器12还可与以下组件通信:一个或多个外部设备14诸如键盘、指 点设备、显示器24等;使用户能够与计算机系统/服务器12交互的一个或多个设备;和/或使 计算机系统/服务器12能够与一个或多个其他计算设备通信的任何设备(例如,网卡、调制 解调器等)。这样的通信可经由输入/输出(I/O)接口 22发生。再者,计算机系统/服务器12可 以经由网络适配器20与一个或多个网络诸如局域网(LAN)、一般广域网(WAN)和/或公共网 络(例如,互联网)通信。如图所示,网络适配器20经由总线18与计算机系统/服务器12的其 他组件通信。应当理解的是,尽管未示出,但是其他硬件和/或软件组件可以与计算机系统/ 服务器12结合使用。示例包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动 器阵列、RAID系统、磁带驱动器以及数据档案存储系统等。
[0056] 现在参照图2,其示出说明性云计算环境50。如图所示,云计算环境50包括一个或 多个云计算节点10,其中云消费者所使用的本地计算设备诸如个人数字助理(PDA)或蜂窝 电话54A、台式计算机54B、膝上型计算机54C和/或汽车计算机系统54N可以与所述一个或多 个云计算节点10通信。节点10可以彼此通信。它们可以在一个或多个网络(诸如上文中所述 的私有、社区、公共或混合云或它们的组合)中被物理地或虚拟地归组(未示出)。这允许云 计算环境50提供基础设施、平台和/或软件作为服务,其中云消费者不需要在本地计算设备 上为所述服务维持资源。应当理解的是,在图2中示出的计算设备54A-N的类型仅旨在是说 明性的,并且计算节点10和云计算环境50可以通过任何类型的网络和/或网络可寻址连接 (例如,使用网页浏览器)与任何类型的计算机化设备通信。
[0057]现在参照图3,其示出由云计算环境50(图2)提供的一组功能抽象层。应事先理解 的是,图3中所示的组件、层和功能仅旨在是说明性的,并且本发明的实施例并不局限于此。 如图所示,提供了以下层和对应功能:
[0058] 硬件和软件层60包括硬件和软件组件。硬件组件的示例包括:大型机,在一个示例 中为IBM? zSeries?系统;基于Rise(精简指令集计算机)架构的服务器,在一个示例 中为 IBM pS.e.ries_? 系统;iBMxS.erie:s? 系统;IBM BladeCenter? 系统;存储设备;网络 61、以及联网组件。软件组件的示例包括:网络应用服务器软件,在一个示例中为IBM WebSphere?.应用服务器软件;以及数据库软件,在一个示例中为IBM DB2?.数据库软 件。(IBM、zSeries、pSeries、xSeries、BladeCenter、WebSphere以及DB2是国际商业机器公 司在全球许多司法辖区注册的商标)。
[0059] 虚拟层62提供抽象层,从该抽象层可以提供虚拟实体的以下示例:虚拟服务器、虚 拟存储、虚拟网络63(包括虚拟私有网络)、虚拟应用和操作系统;以及虚拟客户端。
[0060] 在一个示例中,管理层64可提供下面描述的功能。优选的情境感知资源供应功能 提供用于在云计算环境内执行任务的计算资源和其他资源的动态获取。计量和定价功能在 云计算环境内对资源进行利用时提供成本跟踪,并为这些资源的消耗开账单或发票。在一 个示例中,这些资源可以包括应用软件许可。安全功能为云消费者和任务提供身份验证,以 及为数据和其它资源提供保护。用户入口功能为消费者和系统管理员提供对云计算环境的 访问。优选的情境感知服务水平管理功能提供云计算资源的分配和管理,使得所要求的服 务水平得到满足。优选的情境感知服务水平协议(SLA)规划和履行功能为根据SLA预期到未 来需求的云计算资源提供预先安排和获取。
[0061] 工作负荷层66提供可为其利用云计算环境的功能的示例。可以从该层提供的工作 负荷和功能的示例包括:地图绘制和导航;软件开发和生命周期管理;虚拟教室教育交付; 数据分析处理;事务处理;以及社交网络68。
[0062] 图4示出根据本发明的优选实施例的具有管理分布式文件复本的对等者的企业网 络(例如,图1和2中的50、61、63)对等存储系统100的示例。企业社交平台102可包括一个或 多个计算机,例如计算机10。先前,通常在本文中也被称为用户的企业对等者/员工已向企 业社交平台102注册。(例如,计算机10、54六、548、54(:或54~中的)用户设备100-六、100-8、 100-C、100-D、100-E、100-F、100-G与登录用户相关联。在该示例中,用户 100-A、100-B、100-C、100-D是被识别为是正在进行的项目社区104的成员的关联用户。用户100-B、100-E、100-F、100-G是社交社区106(例如,同一部门或分支)的成员。另外,在本示例中,一个用户100-B 属于两个社区,即企业项目104和社交社区106。应注意的是,通过例如经由互联网或内联网 连接相关的设备100-A、100-B、100-C、100-D、100-E、100-F、100-G,用户联系在一起。为了简 化描述,用户、对等者和相关设备在本文中可互换使用。
[0063]例如,用户例如IOO-C可从图1中的例如存储系统34中的企业平台102发起项目104 相关文件108的上传或传送。通常,文件108的复本由一个或多个其他用户100-A、100-B、 100-D存储在项目104成员设备内。如果用户例如100-B选择使文件108与用户的简档 (profile)相关联、而并不与其他企业用户共享,则其他社交社区106用户(例如,来自同一 部门或分支)1004、1004、100-6存储文件108。为了确定哪些用户存储了来自100-(:或100-B的文件108,系统预处理该文件,从而推断情境或标记(例如项目或主题)。系统可使用传统 的关键字提取技术(诸如监督机器学习、文本挖掘、词频分析、贝叶斯分类器或词汇链)来推 断情境或标记。随后,系统推荐社交社区106或104中的连接到100-B或100-C的、与推断出的 文件情境/标记相关的一组用户。
[0064] 因此,并非是局限于各个可用设备 100-A、100-B、100-C、100-D、100-E、100-F、100- G的具有存储装置的每个用户,而是由系统管理员配置所使用的可用存储量。如有必要,可 用存储可被调节以满足系统需要。系统基于社交圈的时间方面(包括例如社交圈成员之间 的活动、访问或互动的数量)来计算存储复本的用户的数量。
[0065] 优选的对等存储系统100跨越对等者100^、100-8、100-(:、100-0和/或100-8、100- E、100-F、100-G对存储进行聚集以用于低成本的合作项目/企业存储。用户在企业社交网络 对等设备100-A、100-B、100-C、100-D、100-E、100-F、IOO-G中存储项目相关的和工作活动数 据的拷贝。对等者100-A、100-B、100-C、100-D、100-E、100-F、100-G使用社交网络时间特性 来动态地管理文件复本并在彼此之间分发文件复本。例如,来自对等者100-B的文件108的 复本将在本地存储在对等者的设备IOO-E、IOO-F和IOO-G处。
[0066] 图5示出在图4中的优选对等(例如,员工对员工)网络存储系统100中的企业社交 联网对等设备110的示例。每个对等设备110包括社交网络连接器112、本地存储管理器114、 本地存储装置116和远程接口单元118。社交网络连接器112管理对等者社交连接活动。本地 存储管理器114管理存储在本地存储装置116中的所有存储网络用户数据。远程接口单元 118管理检索和传送,包括去往/来自其他对等设备110的上传和下载请求。
[0067] 对等设备(图4中的 100-A、100-B、100-C、100-D、100-E、100-F、100-G)在社交网络 (例如图2和3中的50、61、63)中进行认证,从而加入/再加入团队104/106。在加入后,每个设 备110中的社交网络连接器112拦截访问与企业社区或简档相关联的文件的所有尝试。社交 网络连接器112对访问尝试进行认证、并连接(couple)经认证的文件以完成访问。社交网络 连接器112也管理任何新的上传,检测相关联的文件情境/标记,并基于社交网络时间特性 来推荐和显示用于存储每个新的上传的用户或用户组的列表。
[0068]本地存储管理器114管理存储在本地存储装置116中的特定设备110中的所有数 据。因此,本地存储管理器114存储数据、检索所存储的数据、并管理剩余的未使用存储。另 外,本地存储管理器114保持所有存储拷贝的状态、并且例如基于到期日期和减少的使用来 选择性删除过时的复本/拷贝。本地存储装置116可以是任何适合的非易失性存储,诸如硬 盘驱动器、或者可以是持久或可互换的闪存存储器(例如固态盘(SSD)、微SD或XD卡等)。 [0069]远程接口单元118管理个体文件存储和去往/来自其他对等设备110的文件传送。 当成员促使对等设备110共享文档时,其他对等设备100下载共享文档的拷贝,其中远程接 口单元118将所述共享文档的拷贝视为原始文档的复本。此外,远程文件存储116和传送单 元118响应来自其他对等设备110的用于上传或下载所存储的文件的远程用户请求,并管理 文件检索和传送。远程接口单元118保持与用户对等设备110共享且远程地存储在用户对等 设备110上的所有文件的状态。对等设备110将文件的每个新复本版本视为新文件。
[0070] 优选地,如上文所述,每个团队成员具有单个标识符/登录或用户ID,并且对于每 个团队,一个或多个成员被指定为团队管理员。由于每个团队成员具有单个ID,所以甚至当 成员同时或分别地从多个设备11〇(例如,智能电话54A、台式计算机54B和膝上型电脑54C) 连接时,该成员在所有设备上利用相同用户ID登录到社交网络中以保持单一在线存在。此 外,优选地,与一成员相关联的多个设备中的每个设备是对等设备110,其中本地对等存储 系统管理各个设备110中的存储。任选地,设备110可包括任何当前技术发展水平的安全性 和/或隐私性,例如消息和文件加密密码术和文件传送授权。
[0071] 图6示出响应于来自文件拥有者的新文件上传请求122来推荐120-组用户在对等 设备110上存储文件复本的对等设备(例如,图5中的110)的示例。远程连接器118管理文件 拥有者请求,将该请求转发给从列表136中选出的一组对等者。被选择为存储所述复本的社 交社区是基于文件情境。来自所述组中的社交社区的用户的数量定义为每个特定文件所存 储的文档复本的数量。系统(例如,图1中的100)基于社交圈104、106的时间方面(例如成员 之间的活动、访问或互动的数量)来计算该数量。
[0072] 系统选择用户组以使得无论何时拥有者很可能需要该文件时,对于文件拥有者来 说总是有至少一个用户可用于访问所述复本的概率最大化。因此,系统可从来自不同地理 位置/时区的社交社区、并基于对等连接性历史信息(例如连接性的日期/小时和持续时间) 来选择用户。每次对等者请求122存储一拷贝时,当前复本由用户组中的一个用户存储,直 到该组中的所有用户存储复本。应注意的是,因为工作关系是动态的,所以被推荐用于存储 每个特定复本的用户组是动态的并且可随时间而改变。
[0073] 无论何时对等设备上传或传送项目相关文件时,所述设备系统预处理该文件以便 确定来自所确定的要在其上存储该文件的社交社区的其他对等设备。优选地,所述设备使 用传统的关键字提取技术(诸如监督机器学习、文本挖掘、词频分析、贝叶斯分类器或词汇 链)来推断该文件的情境或标记(例如,项目或主题)。
[0074]因此,在收到请求122时,社交网络连接器112从新文件中提取标记(T)的列表124、 并推断126文件情境。随后,社交网络连接器112检索128与情境/标记(项目或主题)相关联 的社交社区或社交圈(C)以及来自相关统计资料(S)的信息(η)。本地存储管理器114基于来 自相关统计资料(S)的信息(η)来确定130所保持的复本(R)的数量(V)。因此,例如,与活跃 性较低的社区相比,系统100可以为与非常活跃的社区(例如具有若干工作流和上传文档的 社区)相关的文档存储更多复本(V)。
[0075] 基于来自同一社交圈(社区、项目、活动或连接到用户)中的用户的可用性,以使文 档可用性最大化为目标来选择用户组。相关统计资料(S)可包括例如特定社交圈中的用户 数;用户之间交换的消息数;社区或简档相关文档和信息中发布的用户活动数;上传文件 数;对具有相同标记的文件的访问数;对过去文件版本的访问数;和/或标记/情境相关性。 文档可用性可以是最大值,例如使社交圈用户位于不同的地理位置/时区中、并且基于对等 者的连接历史(例如,指示每个用户何时最后一次访问或者通常何时访问社交网络系统)。 优选地,系统管理员定义关联函数(f)以确定130复本(V)的数量,其中该数量由具有形式 v=Σ::Γ.((α)的函数来定义。
[0076] 优选地,本地存储管理器114也从元组的数量(N)确定132复本的数量,其中每个元 组包含与统计信息相关联的参数。这样的一组元组可包括例如用户数(u)、活动数(g)或相 关性(h)。
[0077] 根据确定130、132,本地存储管理器114选择当前社交圈或社交社区中的与推断出 的情境/标记相关的一组连接对等者。随后,本地存储管理器114从指定的社交圈(C)生成 134用于向请求用户或文件拥有者显示136的复本用户列表(L)。所述设备推荐例如位于不 同地理位置/时区中的用户的列表,其可以基于用户连接性历史,该用户连接性历史指示例 如每个用户何时最后一次访问或者通常何时访问社交网络系统。同样,本地存储管理器114 生成134复本用户列表,优选地,以使文档对社交圈用户的可用性最大化。
[0078] 所述设备可以例如使用典型的图形用户接口(GUI)来图形地呈现推荐的用户列 表,以在本地窗口中显示所述建议作为例如列表,并允许与所推荐的一个或多个对等者相 关联的对等者存储新文件拷贝。此外,相关联的对等者可选择一个、一些或所有显示的对等 者,或者去除或添加新的对等者。所述设备包括来自选择的信息作为反馈以用于改善针对 未来推荐的训练。因此,例如,所述设备可确定:未分类的文档正存储在与一个对等者相关 联的设备上,但是机密文档不是这样。后续的推荐是基于这些推断出的偏好来作出的。
[0079] 图7示出对等设备(例如,图5中的110)本地存储管理器114如何管理140本地存储 116的复本的示例。每个本地存储的文件(F) 142具有复本(R)的已识别/指派的数量(V )、标 记(T)列表、基于时间戳(TS)的年龄、以及访问计数或数量(Af)。本地存储管理器114通常存 储文件复本,直到它们太旧(达到一定年龄)并且对于更流行的文件而言存储了更长时间, 或者直到用户不再是社交社区的一部分。因此,系统检索144社交圈(例如项目和社区)。例 如,如果用户不再被指派给项目或改变的部门,则存储管理器114进行检查146,并且复本从 本地存储中被删除164。否则,系统验证复本142时间戳(TS)和相关联的复本访问次数(Af), 以确定所述复本是旧的还是流行的。当复本时间戳指示所述复本比所选的年龄阈值(TH 1) 更旧148、或者相关联的复本访问计数大于所选阈值(TH2)时,存储管理器检索150文件历 史。否则,对文件f 142的处理停止166。
[0080] 当所述复本年龄超过TH1或者非常流行148时,本地存储管理器114检索文件142的 文件历史150、统计资料和相关联的统计信息(S)(包括例如文件下载数和文件访问/读取 数)。根据文件历史,本地存储管理器114确定152复本数(R f)。因此,存储管理器114检查152 何时该复本数(Rf)超过先前确定(图6中的130)的限值(即,待存储的复本(V)的数量)。
[0081] 如果当前存储的复本的数量低于所确定的数量(Rf>v),则另一对等者存储所述复 本。本地存储管理器114识别154被推荐用于存储文件复本的用户组,并向所述组发送156存 储所述复本的请求。已存储复本的任何设备110接收所述请求,忽略所述请求。否则,接收设 备110中的一个接收设备存储158所述复本。
[0082]另一方面,如果当前已经存储的存储复本的数量超过所确定的数量(V 2 Rf),则所 述复本从存储中被删除。如果请求设备Iio与管理员相关联160,或者文件142与设备110的 用户共享,则本地存储管理器114向文件拥有者发送删除164旧复本的请求162。
[0083] 无论何时用户请求恢复或访问所存储的文档时,优选的系统检索可用复本。然而, 如果请求针对的是不可用的存储文件,例如因为对等组中的成员当前不在线,则所述系统 例如通过GUI来警告用户:所述文件当前不可用。优选地,用户可以选择是否在所述文件一 旦变为可用时自动加载该文件。同时,系统也记录所述文件不可用,并记录不可用的时长。 所述设备在后续更新期间使用登录的信息来确定用户组,以便例如推荐存储至更大或更多 变化的一组用户设备110。另外,登录的信息可用于向社区用户通知不可用文件的时间范围 以帮助其他用户选择设备的更广泛的用户组。
[0084] 有利地,优选的系统可使用访问历史(例如用户活动和可用时间),以便考虑不同 时区以获得24/7可用性(例如,来自美国、欧洲和亚洲的用户)。此外,优选的系统容纳动态 项目活动以及变化的同事关系和责任,从而在情况改变时更新复本存储位置和数量。优选 的系统利用诸如用户计算机、膝上型电脑、智能电话等上的未使用的用户存储以降低服务 成本。因为存储是分散的、并且利用社交网络关系中内置的信任来实现存储共享,所以优选 的系统对相关的失败展现出改善的弹性。聚集的、共享的对等设备存储为企业用户提供附 加的项目存储容量,且相对于现有的公共云存储系统具有改善的数据控制、私密性和安全 性;并且降低了用于存储企业数据的成本。
[0085] 本发明的各个实施例的描述已经出于举例说明的目的而被呈现,而并非旨在是无 遗漏的或局限于所公开的实施例。在不脱离所述实施例的范围和精神的情况下,许多改型 和变型对于本领域普通技术人员来说将是明显的。本文所使用的术语被选择为最佳地解释 所述实施例的原理、实际应用、或者相对于在市场中发现的技术的技术改进,或者使本领域 其他普通技术人员能够理解本文公开的实施例。
【主权项】
1. 一种企业网络对等存储系统,包括: 企业社交平台,其支持具有一个或多个识别的企业团队的至少一个企业社区,每个团 队包括在所述每个团队中合作并向所述企业社交平台注册的多个企业用户; 多个对等设备,每个对等设备具有本地存储并与注册的企业用户相关联; 企业社交平台存储,其存储与所述一个或多个识别的企业团队中的每一个相关的文 件,在至少一个所述企业团队中,活跃文件的多个复本被存储在团队对等设备存储中;W及 网络,所述多个对等设备通过所述网络彼此连接,其中每当对等设备请求访问活跃文 件时,所述团队对等设备中的一个提供对所述多个复本中的一个存储的复本的访问。2. 如权利要求1所述的企业网络对等存储系统,其中存储复本的所述团队对等设备还 包括: 管理对等连接活动的社交网络连接器; 管理本地复本存储的本地存储管理器;W及 管理复本共享的远程接口单元。3. 如权利要求2所述的企业网络对等存储系统,其中所述社交网络连接器管理新的上 传,对文件访问进行认证,W及拦截和连接经认证的文件访问。4. 如权利要求3所述的企业网络对等存储系统,其中所述社交网络连接器还检测相关 联的文件情境/标记,W及列出被推荐用于存储新的/更新的文件复本的存储系统用户。5. 如权利要求2所述的企业网络对等存储系统,其中所述企业社交平台在云服务器上, 所述多个对等设备是云客户端,所述企业社交平台存储是云存储,W及所述本地存储管理 器还保持所有存储的复本的状态并选择性地删除过时的复本。6. 如权利要求2所述的企业网络对等存储系统,其中所述远程接口单元检索共享的复 本,并响应于用户上传和下载文件请求而传送复本。7. 如权利要求6所述的企业网络对等存储系统,其中所述远程接口单元保持所有共享 的复本的状态。8. -种管理企业网络对等共享存储的方法,所述方法包括: 利用唯一标识(ID)登录到企业社交平台中,所述ID标识所述企业社交平台内的相应用 户; 请求与企业网络团队相关联的文件的拷贝,多个识别的用户是所述企业网络团队的成 员; 确定所请求的所述拷贝的复本是否由其他团队成员存储; 检索所述拷贝,如果复本已经由其他成员存储则检索复本,否则从所述企业社交平台 检索所述拷贝;W及 由所述成员中的至少一个其他成员选择性地存储所述拷贝。9. 如权利要求8所述的方法,其中确定是否存储复本包括: 确定要存储的复本的数量; 将所述其他成员识别为用于存储所述复本的候选者; 从所述候选者中选择一组成员,其中所述组被选择为使复本可用性最大化;W及 显示列出所述组的列表。10. 如权利要求9所述的方法,其中确定复本的所述数量包括: 提取标记(τ)的列表; 推断所请求的文件的情境;W及 响应于所述情境和来自相关统计资料(S)的信息(η)而检索社交圈(C),其中复本(V)的 所述数量由确定。11. 如权利要求10所述的方法,其中所述企业社交平台是云平台,所述企业网络中的对 等者是云客户端,W及所述相关统计资料(S)包括: 团体成员的数量; 在团体成员之间交换的消息的数量; 在社区文档中发布的用户活动的数量; 在简档相关文档和信息中发布的用户活动的数量; 上传文件的数量; 对具有相同标记的文件的访问的数量; 对过去的文件版本的访问的数量;W及 标记/情境相关性。12. 如权利要求8所述的方法,还包括管理本地存储的复本,管理包括: 确定每个存储的复本的年龄; 确定任何存储的复本是否比所选的年龄更老;并且对于比所选的年龄更老的任何复 本, 确定针对所存储的复本的访问计数是否小于所选的计数;并且对于所述访问计数低于 所选的计数的任何复本, 确定所存储的复本的数量是否小于被确定用于存储的数量;W及 每当所述数量较小时,由所述其他成员中的识别出的一个将所述拷贝存储为复本。13. 如权利要求12所述的方法,其中每当所述访问计数等于或高于所选的计数时,所述 方法还包括:在确定所存储的复本的数量是否小于被确定用于存储的数量之前,等待直到 所存储的复本比流行的文件年龄更老。14. 如权利要求12所述的方法,其中存储所述拷贝包括: 将所述其他成员识别为复本存储候选者; 向所述复本存储候选者发送存储所述拷贝的请求;W及 由所述复本存储候选者中的一个存储所述拷贝。15. 如权利要求12所述的方法,其中每当所存储的复本的数量等于或高于用于存储的 数量时,所述方法包括:删除一个或多个所存储的复本。16. -种管理企业网络对等共享存储W执行权利要求8至15中任一项所述的方法步骤 的系统。
【文档编号】G06F17/30GK105843838SQ201610069070
【公开日】2016年8月10日
【申请日】2016年2月1日
【发明人】A·P·阿佩尔, S·C·S·比安奇, H·C·D·S·P·坎德罗, R·L·D·F·库尼亚
【申请人】国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1