对消息传递上的附件的去重复以及对附件的自动修复的制作方法

文档序号:8269407阅读:621来源:国知局
对消息传递上的附件的去重复以及对附件的自动修复的制作方法
【专利说明】对消息传递上的附件的去重复以及对附件的自动修复
[0001] 背景
[0002] 在数据库和存储器管理领域,在给定计算机内、多个计算机内、或跨计算和联网环 境减少重复文件(被称为"团块")的数量是合乎需要的。为了使这一过程自动化,计算机 或环境需要标识这些团块并且之后采取适当动作。
[0003] 避免重复文件的努力以伴随而来的盘空间方面的节省、I/O和网络带宽节省为回 报。因此,准确且高效地处理和管理重复文件是合乎需要的。
[0004] 概述
[0005] 下面呈现了本发明的简化概述,以便提供此处所描述的某些方面的基本概念。此 概述不是所要求保护的主题的详尽的概述。既不是要标识所要求保护的主题的要点或关键 性元素,也不是要详细描述本发明的范围。唯一的目的是以简化形式呈现所要求保护的主 题的某些概念,作为稍后呈现的比较详细的描述的前奏。
[0006] 呈现了对文件系统内的文件和/或团块进行去重复的系统和技术。在一个实施例 中,公开了一种电子邮件系统,其中该电子邮件系统接收包括一组相关联的附件的电子邮 件消息。该系统确定这些相关联的附件是否先前已被存储在电子邮件系统中、以及所存储 的附件的状态,并且如果附件的状态适于共享附件的副本,则依共享附件的请求而提供对 附件的引用。在另一实施例中,该系统可以检测所存储的附件是否被损坏,并且如果是,则 尝试修复附件,并且可能在共享对附件的引用之前尝试修复附件。
[0007] 在一个实施例中,公开了一种用于对文件系统中的数据进行去重复的方法,其中 该文件系统包括一个或多个文件,每一文件可以包括数据集,并且该数据集能够由两个或 更多个用户共享。该方法可以包括以下步骤:接收要存储在文件系统内的文件;检查该文 件内的数据集先前是否已被存储在该文件系统中;如果该数据集已被存储在该文件系统 中,则检查所存储的该数据集的状态,并且如果所存储的该数据集的该状态适于共享该文 件的副本,则依共享该数据集的命令而提供对该文件的引用。
[0008] 在另一实施例中,公开了一种用于对电子邮件系统中的数据进行去重复的系统, 其中该系统包括:电子邮件服务器,该电子邮件服务器与一组电子邮件客户端处于通信中; 用于存储电子邮件以及相关联的附件的数据库;该数据库存储包括一组中的至少一个,该 组包括:电子邮件消息、相关联的附件、与电子邮件消息有关的元数据以及与该相关联的 附件有关的元数据;用于管理该组电子邮件客户端之间的附件的共享的模块;以及进一步 地,其中管理该组电子邮件客户端之间的附件的共享的模块能够检测附件的状态,并且取 决于该附件的状态来共享指向该附件的引用指针。
[0009] 当与本申请中呈现的附图结合阅读时,在下面的详细描述中呈现了本系统的其它 特征和方面。
【附图说明】
[0010] 示例性实施例在所参考的附图中示出。此处公开的实施例和附图旨在被认为是说 明性而非限制性的。
[0011] 图1描绘了根据本申请的原理的本申请的各个实施例可在其中操作并存留的一 个示例性计算和/或联网环境。
[0012] 图2是根据本申请的原理作出的团块管理系统的状态表/流程图的一个实施例。
[0013] 图3是根据本申请的原理作出的电子邮件传递系统和相关联的团块管理系统的 高级流程图的一个实施例。
[0014] 详细描述
[0015] 如在此使用的,术语"组件"、"系统"、"接口"等指的是计算机相关的实体,它们可 以是硬件、软件(例如,执行中的)和/或固件。例如,组件可以是运行在处理器上的进程、 处理器、对象、可执行码、程序、和/或计算机。作为说明,在服务器上运行的应用和服务器 两者都可以是组件。一个或多个组件可以驻留在进程中,组件可以位于一个计算机内和/ 或分布在两个或更多计算机之间。
[0016] 现在参考附图来描述所要求保护的主题,所有附图中使用相同的附图标记来指代 相同的元素。在以下描述中,为解释起见,阐明了众多具体细节以提供对本发明的全面理 解。然而,很明显,所要求保护的主题可以在没有这些具体细节的情况下实施。在其他情况 下,以框图形式示出了各个已知的结构和设备以便于描述本发明。
[0017] II直
[0018] 为了节省文件系统、数据库、电子邮件系统等的空间、处理时间以及总体成本,实 现一种可跨整个系统来有效地管理对文件("团块")的去重复的系统是合乎需要的。这样 的系统还可以被诸如数据安全性、数据恢复和数据完整性等概念关注。
[0019] 图1是本申请的各实施例可在其中操作和驻留的计算/联网环境(100)的一个示 例。尽管以电子邮件系统的形式描述图1,但本申请的原理在数据库管理或文件系统管理的 应用中也能够具有同样效力。
[0020] 在环境100中,可能存在多个电子邮件客户端102a、102b和102c。在该示例中, 客户端102a撰写了带有附件的电子邮件104并且将其发送到联网系统106,目的地是另一 客户端102b。客户端102b进而可以决定是否将该带有附件的电子邮件转发给第三客户端 102c〇
[0021] 在联网系统106内,可能存在电子邮件服务器108、可能连同多个其他服务器、路 由器以及本领域已知的其他网络组件。例如,在Microsoft Outlook?电子邮件系统的设 计中,系统确保数据的副本驻留在独立的硬盘驱动器、控制器和机器上。这类系统的昵称为 "JB0D",代表"磁盘束(Just a Bunch Of Disks)"。在JB0D系统中,硬盘驱动器控制器尝 试避开,这意味着就控制器先前处理的故障而言,软件更被关注。这些故障的范围可以从硬 盘驱动器本身上的固件隐错到诸如"不可恢复的读取错误"等先前由控制器自动修理的问 题。另外,软件现在可以周期性地擦拭驱动器以检测数据从而寻找"位腐坏"(即,出于某种 原因已变得不可读或损坏的数据)。在这一情况下,完全用软件来建立分布式"RAID"控制 器是可能的,其代替工业标准固件控制器。
[0022] 这一 JB0D系统的软件可以监视硬盘驱动器调度修复动作、检测故障以及诊断修 复。这一软件还可以包括持续地监视特定类型的故障的多个"看门狗(watchdog)"。如果 看门狗检测到其正在寻找的故障,则看门狗引发警告,这可以自动触发修复过程。这一修复 过程的范围可以从重新引导机器或重新启动过程到修理数据损坏或在无法获得进展的情 况下甚至涉及人工。
[0023] 作为总体系统的一部分(110),可以采用元数据112和冗余元数据114,以使得软 件也可以确切地知道系统可访问的电子邮件消息(例如在116中)有多少良好副本(例如, 118a和118b)。在发现存在太少副本的情况下,它可以对修复动作区分优先级以避免潜在 的危险情形。在修复花费太长时间的情形中,将数据一起移动到另一位置是可能的。
[0024] 系统可以通过与原始电子邮件消息被传递时完全相同地存储原始电子邮件消息 来有效地管理并且存储重复的电子邮件消息。发生改变的关于电子邮件消息的数据(诸 如,已读/未读、文件夹中的位置等)被分
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1