对消息传递上的附件的去重复以及对附件的自动修复的制作方法_4

文档序号:8269407阅读:来源:国知局
,该模块还可尝试修复。由于系统可能不知道团块的确切状态(仅仅知道有某些东西错 误),因此系统可能不使用团块来进行去重复。出于本申请的目的,TurboFSS是指确保文件 和团块在系统中的多个冗余副本之间保持同步的模块。
[0074] 在执行修复时TurboFSS还可以考虑团块的最后写入时间以避免过多次尝试修 复。如果团块达到引用计数0,则团块进入不确定状态,因为在重用团块之前使团块被重写 是合乎需要的。如果具有与处于某些损坏的现有团块相同散列的新团块到达,则系统可以 用新传递来盖写它。如果所有写入都成功,则团块可以被标记为已修复。由于传递或移动 用户(MoveUser)期间一份共享停工而部分冗余的团块不被置于某些损坏状态,因为在不 能以全部冗余性对所有团块进行写入的情况下可能不对系统去重复。增加引用一一不行。
[0075] 全部损坏状态
[0076] 该状态指示对于给定团块已发生数据丢失并且所有修复尝试失败。可能不进行进 一步的修复尝试。团块可永远保留在该状态,直到手动修复或全部引用计数达到〇并且团 块被删除。
[0077] 由于移动用户可能移动整个帐户(包括失去的团块),因此在团块在源系统上完 全失去的情况下移动用户可以在目的地系统上创建全部损坏的团块。如果处于该状态的团 块到达引用计数〇,则团块可以进入不确定状态,因为在重用团块之前使团块被确认和/或 重写是合乎需要的。出于本申请的目的,移动用户是为了与文件系统或电子邮件系统等进 行最优平衡而围绕内联和互联数据中心移动电子邮件帐户的模块。
[0078] 在一个实施例中,处于该状态的团块在某一用户和/实体引用时可以保留在数据 库中。在某些实施例中,可能存在用于修复此类团块的多种技术,包括:
[0079] (1)邮件传递或移动用户可以在具有同一散列的新团块被传递的情况下修复现有 团块。
[0080] (2)查看其他服务器或数据库组以查看那里是否存在附件。
[0081] (3)对于使用主动同步(ActiveSync)的用户,系统可以从那里拉取附件。
[0082] 如果具有与处于全部损坏的现有团块相同散列的新团块到达,则一个实施例系统 可以用新传递来盖写它,因为永久性存储可被确保与写入是幂等的。如果所有写入都成功, 则团块可以被标记为良好并且随后被增加引用。增加引用一一不行。
[0083] 引用计数
[0084] 由于团块可在用户之间共享,因此跟踪团块具有的引用数量以使得系统可以在它 达到零引用时清理它是合乎需要的。或者,如果期望减轻可能影响所需阈值数量的帐户的 数据丢失,则系统可以潜在地防止团块具有过多引用。
[0085] 团块的状态可对引用计数具有影响,因为特定状态期望引用计数为0,而其他状态 期望引用计数大于〇。例如,以下表反映一个实施例的实现:
[0086]
【主权项】
1. 一种用于对文件系统中的数据进行去重复的方法,所述文件系统包括一个或多个文 件,每一所述文件包括数据集且所述数据集能够由两个或更多个用户共享,所述方法的步 骤包括: 接收要存储在文件系统内的文件; 检查所述文件内的数据集先前是否已被存储在所述文件系统中; 如果所述数据集已被存储在所述文件系统中,则检查所存储的数据集的状态;W及 如果所存储的数据集的所述状态适于共享所述文件的副本,则依共享所述数据集的命 令来提供对所述文件的引用。
2. 如权利要求1所述的方法,其特征在于,所述文件系统是电子邮件系统,所述文件包 括电子邮件,并且所述数据集包括所述邮件的附件,并且进一步地,其中所述接收要存储在 文件系统内的文件的步骤包括: 接收电子邮件,所述电子邮件进一步包括附件。
3. 如权利要求2所述的方法,其特征在于,所述接收要存储在文件系统内的文件的步 骤进一步包括: 存储关于所述电子邮件的元数据,所述元数据包括一组中的一项,所述组包括;与所述 电子邮件有关的元数据,与所述电子邮件的附件有关的元数据,与所述电子邮件有关的状 态元数据,与所述附件有关的状态元数据,与如何共享关于所述附件有关的元数据W及与 所述附件的复制有关的元数据。
4. 如权利要求1所述的方法,其特征在于,所述检查所存储的数据集的状态的步骤进 一步包括: 指派与所述附件相关联的状态。
5. 如权利要求4所述的方法,其特征在于,与所述附件相关联的所述状态包括一组中 的一项,所述组包括:良好、某些损坏、全部损坏、不确定、删除、孤儿和已恢复。
6. 如权利要求1所述的方法,其特征在于,如果所存储的数据集的所述状态适于共享 所述文件的副本、则依共享所述数据集的命令来提供对所述文件的引用的所述步骤进一步 包括: 使所存储的所述数据集的引用计数递增;W及 向目标实体发送对所存储的所述数据集的指针引用。
7. 如权利要求1所述的方法,其特征在于,所述方法进一步包括W下步骤: 检测数据集是否被损坏;W及 如果已损坏,则将与所述数据集相关联的状态从良好转换成损坏; 修复所述损坏的数据集;W及 将与所述数据集相关联的状态从损坏转换成良好;
8. -种用于对电子邮件系统中的数据进行去重复的系统,所述电子邮件系统包括: 电子邮件服务器,所述电子邮件服务器与一组电子邮件客户端通信; 用于存储电子邮件和相关联的附件的数据库,所述数据集存储一组中的至少一项,所 述组包括;所述电子邮件消息,相关联的附件,与所述电子邮件消息有关的元数据W及与所 述相关联的附件有关的元数据; 用于管理所述一组电子邮件客户端之间的附件共享的模块;W及 进一步地,其中所述管理所述一组电子邮件客户端之间的附件共享的模块能够检测附 件的状态并且取决于所述附件的状态来共享对所述附件的引用指针。
9. 如权利要求8所述的系统,其特征在于,所述用于管理附件共享的模块进一步包括 用于检测附件是否被损坏的模块。
10. 如权利要求9所述的系统,其特征在于,所述用于管理附件共享的模块进一步包括 用于维护附件的状态的模块。
【专利摘要】呈现了对文件系统内的文件和/或团块进行去重复的系统和技术。在一个实施例中,公开了一种电子邮件系统,其中该电子邮件系统接收包括一组相关联的附件的电子邮件消息。该系统确定这些相关联的附件先前是否已被存储在该电子邮件系统中、所存储的附件的状态,并且如果该附件的状态适于共享该附件的副本,则依共享该附件的请求而提供对该附件的引用。在另一实施例中,该系统可以检测所存储的附件是否被损坏,并且如果是,则尝试修复该附件,并且可能地在共享对该附件的引用之前尝试修复该附件。
【IPC分类】G06F17-30
【公开号】CN104584006
【申请号】CN201380043316
【发明人】K·卢姆普, A·达日瓦, I·季米特洛夫, C·胡, L·刘, B·派, K·帕苏玛斯, G·皮提果-艾伦, J·罗德里格斯
【申请人】微软公司
【公开日】2015年4月29日
【申请日】2013年8月6日
【公告号】EP2883163A1, US20140046911, WO2014028261A1
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1