基于局域网的分布式文件系统的制作方法

文档序号:9579329阅读:369来源:国知局
基于局域网的分布式文件系统的制作方法
【技术领域】
[0001]本发明涉及一种解决计算机文件实现分布式存储的文件系统,尤其是一种没有Master节点、所有计算机处于平等地位的分布式文件系统,该系统基于局域网组播、TCP技术实现通信,基于虚拟磁盘技术实现对单一电脑跨分区文件存储功能。
【背景技术】
[0002]目前,常见的分布式存储技术均采用Master-Slaves结构来解决分布式存储的数据同步问题,由Master节点统一管理数据索引信息。但是,一旦Master节点出现问题,整个分布式系统就会瘫痪,造成重大损失。
[0003]再者,随着计算机技术飞速发展,计算机面临大数据存储问题,直接的解决方法就是购买更大容量的磁盘,但这不能根本性解决大数据问题,存储容量很快就会达到新的瓶颈。而在一个局域网范围内,绝大部分计算机仍余留存储空间,虽然总的剩余空间足够存储某一大小的文件,但单一计算机无法实现,这就造成存储资源的浪费。
[0004]在单一计算机上,各分区剩余空间不尽相同,当总剩余空间足以存放某一大小的文件,但单一分区无法实现,这也造成存储资源的浪费。

【发明内容】

[0005]为了克服现有文件系统无法实现跨分区存储数据,局域网内计算机不能方便的共享磁盘空间,造成存储资源浪费的不足,本发明提供了一种文件系统,该文件系统不仅能将各分区剩余空间统一进行管理,还能对局域网内计算机剩余存储空间进行统一管理。
[0006]本发明解决其技术问题采用的技术方案是:在操作系统驱动层,通过虚拟出一个磁盘分区,用户层程序发往虚拟磁盘分区的数据,被自动分流到各个真实物理磁盘分区,用户层无需知道数据被存放的具体物理磁盘位置,从而实现对单一计算机剩余磁盘空间的统一管理。在一个局域网内,在安装有该文件系统的计算机之间,当某一台计算机上的程序往虚拟磁盘以数据流的方式写入数据时,数据被自动分块并随机发往任一计算机进行存储。其中,采用了组播技术发起询问各计算机剩余磁盘空间请求,其它计算机将会收到该请求,并分别检索各自虚拟磁盘中是否有所请求的文件的分块,并用TCP技术反馈消息,因此各台计算机处于平等地位,而不是传统的Master-Slaves结构。同时,用户可以自定义分块的备份数,相同的分块数据存放在不同计算机上,当存放有某一分块数据的计算机因故停止运行,用户仍然能从其它计算机获取到同一分块的数据备份,从而大大提高系统稳定性。
[0007]本发明的效果是,用户层程序对虚拟磁盘的数据操作可以被自动重定向到局域网内任意可用磁盘空间中,而在用户层程序看来,只是对某一磁盘分区的数据读写操作,从而给用户层程序带来极大便利,无需文件系统提供额外操作接口,即可实现对整个局域网内剩余磁盘空间的充分利用,从而提高资源利用率,大大降低存储成本,还能提高数据存储安全稳定性。
【附图说明】
[0008]下面附图对整个文件系统的架构作进一步说明。
[0009]图1是本发明的单机架构图。
[0010]图2是本发明的局域网架构图。
[0011]图3是本发明的一个数据读写结构图。
[0012]图4是本发明的一个数据流分块模型。
【具体实施方式】
[0013]在图1中,展示了本发明的单机架构图。操作系统上程序可以分为两类,一类是内核模式下运行的程序,如:驱动程序,另一类是用户模式下运行的程序,如:浏览器。本发明的程序既有运行在用户模式下的程序,又有内核模式下运行的程序。内核模式下的程序其一是虚拟磁盘,它负责统一管理各个分区的共享空间,大小可以由用户设定。内核模式下的程序其二是DFAT (Distributed File Allocat1n Table)文件系统,它负责维护虚拟磁盘上的数据结构,为用户层程序提供访问接口。用户模式下的程序其一是配置器,负责配置虚拟磁盘的相关运行参数,查看和控制系统的运行状态。用户模式下的程序其二是后台服务端程序,负责处理DFAT发来的数据请求,并将该请求发往局域网内其它计算机,最后将处理结果反馈给DFAT文件系统。
[0014]当用户层某一应用程序向虚拟磁盘发起数据读写请求,该请求先经过DFAT进行处理,DFAT再对虚拟磁盘进行读写操作,虚拟磁盘将读写操作下发到真实的物理磁盘分区,然后把处理结果反馈给DFAT文件系统,若返回的处理结果需要在经过其它计算机处理,则DFAT在将请求发往上层的后台服务端程序处理,最后DFAT再把处理结果反馈给用户层的程序,从而完成数据读写操作。
[0015]在图2中,展示了本发明的局域网架构。假设局域网内有四台计算机安装了本发明的DFAT文件系统,各自共享了 80M的剩余磁盘空间,则整个局域网拥有80*4=320M的共享磁盘空间,则可以存放单文件大小为320M的文件,每台计算机只存储文件的一部分。
[0016]在图3中,展示了一个用户层程序读数据的过程,该程序在计算机A上经过DFAT对虚拟磁盘发起了读请求,DFAT将该请求转发给计算机A上的后台服务端程序,台服务端程序发起组播查询,B、C、D三台计算机都将收到查询请求,并对本机的虚拟磁盘进行查询,其中计算机B发现本机存在所请求的读写数据分块,则直接与计算机A建立TCP连接,并将数据发往A。计算机C、D查询本机的虚拟磁盘文件信息后发现没有所请求的分块数据,则不予反馈消息。计算机A上的后台服务端程序收到发自计算机B的数据后转发给DFAT文件系统,最后转发给用户层程序,完成本次数据读过程。
[0017]数据写操作与数据读操作类似,用户层程序在计算机A上发起数据写操作,DFAT文件系统收到该请求后,将其转发给后台服务端程序,后台服务端程序先以组播方式询问其它计算机是否有足够大小空间存放指定大小的分块数据,收到该请求的计算机经过判断,若剩余空间符合请求,则以TCP连接方式反馈一个消息给计算机A上的后台服务端程序,随后A上的后台服务端程序根据反馈得到的计算机消息,随机选择预先设置的计算机台数的计算机,并用TCP连接方式将数据发送出去。后台服务端程序再将处理结果反馈给DFAT文件系统,DFAT文件系统在把结果反馈给用户层程序,从而完成写过程。
[0018]在图4中,展示了一个用户层程序往计算机A以数据流方式写入数据的数据分块过程。首先本发明对数据流进行了人为的边界指定,数据流是某一个文件的一部分,文件的起始位置定义为边界1,此外分块大小的整数倍数字偏移量皆是边界。如当设置分块大小为2MB,则边界2为2MB、边界3为4MB、边界4为6MB,以此类推。计算机A上的DFAT文件系统在处理数据流时,先判断当前数据小块所属的数据分块,数据小块定义为数据分块的一部分,数据分块由很多个数据小块组成。数据小块的大小定义为缓存块大小,为固定值4096B。
[0019]计算机A上的DFAT文件系统收到数据流读写请求后,依数据发来的先后次序处理数据流,每获取达到一个数据小块大小的数据后,DFAT文件系统将该数据小块数据转发给后台服务端程序处理,若数据流大小小于数据小块大小,则DFAT文件系统自动补足剩余部分并记录原始数据流大小。随后,计算机A上的后台服务端程序发起组播查询请求并判断当前数据小块所属的数据分块是否已经在某一计算机上存在,其它计算机收到请求后检索各自虚拟磁盘数据,并以TCP连接反馈检索结果。若反馈的结果为存在,则计算机A直接将该数据小块发往反馈结果为存在的计算机,若反馈结果为都不存在,则计算机A通过随机算法,任意选择一台有足够空间的计算机,并将该数据小块发送到该计算机上。数据分块的备份数由用户设定,若有多个备份,则在随机选择主机时,多次重复随机选择算法并发送数据。
【主权项】
1.一种基于局域网的分布式文件系统,包括:虚拟磁盘、DFAT文件系统、后台服务端程序,其特征是:系统无Master节点,存入系统的数据流被该系统自动分块分散存储到局域网内可用空间内。2.根据权利要求1所述的基于局域网的分布式文件系统,其特征是:虚拟磁盘是一个驱动层程序虚拟出来的磁盘,负责统一管理各个物理磁盘分区共享的磁盘空间,供应用层程序直接或间接访问,写入虚拟磁盘的数据会被自动分发到各个分区内,用户层程序无需知道写入的数据在物理磁盘上的具体位置。3.根据权利要求1所述的基于局域网的分布式文件系统,其特征是:DFAT文件系统负责维护虚拟磁盘上的数据结构,能与用户层后台服务端程序通信和交换数据,为用户层其它程序提供访问虚拟磁盘的数据读写接口。4.根据权利要求1所述的基于局域网的分布式文件系统,其特征是:后台服务端程序负责处理DFAT文件系统发来的数据读写请求,并将该请求发往局域网内其它计算机上的后台服务程序,并将处理结果反馈给DFAT文件系统。5.根据权利要求4所述的基于局域网的分布式文件系统,其特征是:计算机之间的通信由后台服务端程序完成,采用组播技术、TCP技术进行通信。6.根据权利要求5所述的基于局域网的分布式文件系统,其特征是:后台服务端程序发出组播请求,其它计算机上的后台服务端程序收到该请求后,自行决定是否反馈消息和是否采用组播技术或TCP技术反馈消息。7.根据权利要求1所述的基于局域网的分布式文件系统,其特征是:系统无Master节点,局域网内计算机处于平等地位,各台计算机通过组播技术实现信息的多播,保证了各台计算机上信息的同步,当传输具体数据时,采用TCP技术,保证了数据传输的正确性和稳定性。8.根据权利要求1所述的基于局域网的分布式文件系统,其特征是:数据分块的大小由用户预先设置,先判断发往系统的数据分块在系统是否已存在,若存在则直接修改对应计算机上的分块数据,若不存在则根据规则随机选择计算机并向其发送分块数据。9.根据权利要求8所述的基于局域网的分布式文件系统,其特征是:判断数据分块是否存在的方法为,后台服务端程序发出组播请求,其它计算机上收到该组播请求后自行检索各自计算机,并用TCP技术反馈检索结果。10.根据权利要求1所述的基于局域网的分布式文件系统,其特征是:数据以数据流的方式写入该系统,并被自动分块,分块文件在DFAT文件系统中以特殊文件的身份存在,只能被后台服务端程序读写,其它应用程序无权限访问。
【专利摘要】一种基于局域网的分布式文件系统。由三大部分:虚拟磁盘、DFAT文件系统、后台服务端程序组成。通过虚拟出一个磁盘分区,写入该分区的数据会被系统自动分块,并分散存储到局域网内任一共享空间中,不限所属计算机、不限所属磁盘分区,且从应用程序角度出发,数据只是被存放到了某一个磁盘分区空间中,从而充分利用单一计算机剩余磁盘空间和充分利用局域网内剩余磁盘空间,提高存储资源利用率,大大降低存储成本。
【IPC分类】G06F17/30
【公开号】CN105335441
【申请号】CN201410394194
【发明人】阳平
【申请人】阳平
【公开日】2016年2月17日
【申请日】2014年8月12日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1