一种文件合并方法及控制器与流程

文档序号：15614897发布日期：2018-10-09 21:07阅读：103来源：国知局

本发明实施例涉及存储
技术领域：
：，尤其涉及一种文件合并方法及控制器。
背景技术：
：：日志结构合并树(logstructuredmergetree,lsmtree)是相对应b+树的一种数据结构，其主要是为了克服b+树的大量随机io导致性能低的问题，本质是实现读写之前取得平衡，牺牲读性能来大幅度提高写性能。业界有很多基于lsmtree原理实现的kv存储引擎，这些存储引擎被广泛应用各种数据存储系统中。这些应用实现kv存储引擎的核心思想都是将随机io转化为顺序io写入，数据再通过内存整理为局部有序的文件存储到文件系统，最后再对多个文件系统中的文件进行合并和排序提升读取性能。然而，如何提高这些文件的读数据的效率是当前需要解决的问题。技术实现要素：本发明第一方面提供了一种文件合并方法。该方法应用于存储系统中。所述存储系统包括控制器、固态硬盘和机械硬盘。所述控制器读取所述固态硬盘中的第一文件和第二文件。第一文件中保存有第一数据以及所述第一数据的关键字，第二文件中保存有第二数据以及所述第二数据的关键字。所述控制器判断所述第一数据的关键字与所述第二数据的关键字是否相同，当所述第一数据的关键字与所述第二数据的关键字相同时，所述控制器在所述机械硬盘上创建第三文件。然后，所述控制器合并所述第一数据和所述第二数据，并将所述合并后的数据写入所述第三文件。按照本发明第一方面提供的文件合并方法，将合并前的文件存储在固态硬盘中，将合并后的文件存储在机械硬盘中。由于合并前的文件中的数据属于新数据，被读取的可能性较大，将其存储在固态硬盘中可以提高读数据的效率。而合并后的文件中的数据属于旧数据，被读取的可能性较小，将其存储在机械硬盘中，可以降低成本。在第一方面中，也可以将合并后的文件，即第三文件保存在固态硬盘中，虽然不能达到降低成本的目的，但可以进一步提高读数据的效率。基于第一方面，在第一方面的第一种实现方式中，所述控制器的缓存中保存有至少两个不可变跳表和一个可变调表，所述第一数据来自于所述至少两个不可变调表中一个不可变跳表中的数据，所述第二数据来自于所述至少两个不可变调表中另一个不可变跳表中的数据，所述可变跳表用于接收主机发送的数据。基于第一方面，在第一方面的第二种实现方式中，所述控制器监控所述固态硬盘中的文件的数量是否达到预设阈值，当所述固态硬盘中的文件的数量已达到所述预设阈值时，所述控制器读取所述固态硬盘中的所述第一文件和所述第二文件。这里是给文件合并设置了一个触发条件，即，当固态硬盘中的文件的数量达到预设阈值时，开始执行文件合并。关于如何选择待合并的文件，可以是将所述固态硬盘中的所有文件作为待合并文件，也可以是由用户指定待合并的文件等方式。基于第一方面，在第一方面的第三种实现方式中，所述存储系统还包括储存级存储器，所述储存级存储器中还保存有日志文件。所述控制器接收主机发送的第一写数据指令，将所述第一写数据指令写入所述日志文件，所述第一写数据指令包括所述第一数据以及所述第一数据的关键字。所述控制器接收主机发送的第二写数据指令，将所述第二写数据指令写入所述日志文件中，所述第二写数据指令包括所述第二数据以及所述第二数据的关键字。所述控制器回放所述日志文件，得到所述第一数据以及所述第一数据的关键字以及所述第二数据以及所述第二数据的关键字。所述控制器在所述固态硬盘中创建所述第一文件，将所述第一数据以及所述第一数据的关键字写入所述第一文件，在所述固态硬盘中创建所述第二文件，将所述第二数据以及所述第二数据的关键字写入所述第二文件。由于储存级存储器是一种读写效率较高的新型存储介质，将日志文件保存在储存级存储器中，通过所述日志文件回放得到数据的效率会更高结合第一方面的第三种实现方式，在第一方面的第四种实现方式中将所述第一写数据指令写入所述日志文件中具体是采用追加写的方式。采用追加写的方式可以提高写日志文件的效率。结合第一方面的第三种或第四种实现方式，在第一方面的第五种实现方式中，所述日志文件还包括其他写数据指令，所述方法还包括：所述控制器对所述日志文件中的所有写数据指令按照每个写数据指令中携带的关键字进行排序。经过排序后的日志文件，经回放生成文件数据之后，数据的关键字也是按照从小到大或者从大到小的顺序进行排序的，方便查找。本发明第二方面提供了一种控制器。所述控制器位于存储系统中，所述存储系统包括所述控制器、固态硬盘和机械硬盘。所述控制器包括通信接口和处理器。其中，通信接口，用于与所述固态硬盘，以及所述机械硬盘通信。所述处理器用于执行第一方面任意一种实现方式的方法。附图说明为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。图1为本发明实施例提供的一种存储系统的组成图；图2为本发明实施例提供的一种控制器11的结构示例图；图3为本发明实施例提供的一种控制器11组织数据的结构图；图4为本发明实施例提供的一种文件合并方法的流程图。具体实施方式下面将结合附图，对本发明实施例中的技术方案进行清楚、完整地描述。kv(key-value)存储系统的数据存储采用lsm-tree的结构实现。lsm-tree将硬盘的随机写转化为顺序写，从而提高了写数据的速度。本发明实施例将lsm-tree应用于包含固态硬盘的存储系统中。下面结合图1和图2，对本实施例所描述的存储系统进行介绍。如图1所示，存储系统包括至少一个控制器11、至少一个固态硬盘44和至少一个机械硬盘45。控制器11通过存储区域网络(英文：storageareanetwork，san)与主机(图中未示出)连接。控制器11可以是一种计算设备，如服务器、台式计算机等等。在控制器11上安装有写入系统以及应用程序。控制器11可以接收来自主机的输入输出(i/o)请求。控制器11还可以存储i/o请求中携带的数据，并且将该数据写入固态硬盘44中。控制器11属于系统控制器，系统控制器是独立的设备，不同于固态硬盘44中的控制芯片。本实施例将固态硬盘44的控制芯片称为固态硬盘控制器。如无特别指明，本实施例中的控制器都是指系统控制器。固态硬盘44(英文：solidstatedisk，ssd)是以闪存(英文：flashmemory)芯片为存储介质的存储器，又名固态驱动器(solidstatedrive，ssd)。图2是控制器11的结构示例图，如图2所示，控制器11包括接口卡110、处理器112、存储器111和接口卡113。接口卡110，用于和主机通信，控制器11可以通过接口卡110接收主机的写数据指令。例如，写数据指令包括关键字(英文：key)和值(英文：value)，所述值是指待写入所述存储系统的数据(以下简称为数据)，所述关键字是所述值的标识。举一个具体的例子，所述值可以是学生的各种信息，所述关键字可以是该学生的学号，或者其他表示该学生某一方面属性的标识。接口卡113，用于和固态硬盘44通信，控制器11可以通过接口卡113将写数据请求(包括上面描述的写数据指令中的关键字和数据，以及控制器11为所述数据分配的逻辑地址)发送给固态硬盘44存储。处理器112，可能是一个中央处理器(英文：centralprocessingunit，cpu)。在本发明实施例中，处理器112可以用于接收来自主机的写数据指令或者读取指令并且处理这些指令。处理器112还可以将所述写数据指令中的数据发送给固态硬盘44。此外，处理器112，还可以用于在一定条件时，执行文件的合并操作。存储器111，1包括易失性存储器，非易失性存储器或其组合。易失性存储器例如为随机访问存储器(英文：random-accessmemory，ram)。非易失性存储器例如软盘、硬盘、固态硬盘44(solidstatedisk，ssd)、光盘等各种可以存储程序代码的机器可读介质。存储器111具有保电功能，保电功能是指系统发生掉电又重新上电时，存储器111中存储的数据也不会丢失。存储器111可以有一个或者多个，用于临时存储从主机接收的数据或从固态硬盘44读取的数据，例如控制器11接收主机发送的多个写数据请求时，可以将所述多个写数据请求中的数据暂时保存在存储器111中。此外，存储器111还保存有可变存储表(英文：memtable)和不可变存储表(immutablememtable)。根据lsm-tree机制，memtable用于接收一段时间内主机发送的写数据指令。示例性的，memtable中存储的写数据指令可以如表1所示：keyvalueversion0001张三2017.30003李四2017.3………………0002王五2017.3表1如表1所示，memtable中保存有多组数据，每组数据都包括关键字、值和版本信息。关键字和值已在上面的段落中进行了介绍，这里不再赘述。版本信息是指数据写入的时间信息，或者其他用以标识数据写入的先后顺序的信息。可以理解的是，本实施例中版本信息可以精确到月，也可以精确到日、时、分、秒。本实施例并不对版本信息的形式和精确度进行任何限定。另外，只要在这段时间内写入的数据都会保存在所述memtable中。所述版本信息是控制器11接收写数据指令时为所述写数据指令分配的。根据lsm-tree机制，当memtable中保存的所有数据的数据量达到预设阈值时，所述memtable将转化为immutablememtable。immutablememtable会不再接收新的数据，同时存储器111中会再创建一个新的memtable。所述新的memtable将继续接收数据。因此存储器111中可能保存有一个或多个immutablememtable，但只有一个memtable。每个immutablememtable中的数据是固化的，而memtable可以不断接收新写入的数据。immutablememtable中的数据需要按照关键字从小到大或者从大到小进行排序，如表2所示：keyvalueversion0001张三2017.30001张三2017.40002王五2017.30002王五2017.4………………0003李四2017.3在lsm-tree机制中，每个immutablememtable中的数据被倾倒(英文：dump)在一个分类线表(sortedstringtable，sst)文件(以下简称为文件)中。可以理解的是，所述存储系统中包含多个文件，每个文件与一个immutablememtable对应，用于接收由所述immutablememtable倾倒而来的数据。本实施例中将直接由immutablememtable倾倒而来的文件(也就是未经过合并的文件)作为第一层级的文件。本实施例中，控制器11包含文件系统，因此可以以文件的形式组织数据。具体的，控制器11组织数据的结构如图3所示。如图3所示，key-value数据保存在固态硬盘的44的擦除块(英文：block)中，该数据保存在擦除块中的实际地址为该数据的物理地址。控制器11将一个或多个擦除块映射为一个逻辑空间，举例来说，所述逻辑空间可以是逻辑单元(logicalunit，lu)。控制器11和固态硬盘44都保存有该数据的逻辑地址，以及所述逻辑地址与物理地址之间的对应关系。该数据的逻辑地址是指该数据所在的逻辑单元的标识(例如，luid)、该数据位于该逻辑单元内的起始位置(例如，logicalblockaddress)和长度。另外，由于控制器11在逻辑空间的上层还具有文件系统，因此用户可以以文件的形式访问数据。控制器11还保存有所述逻辑地址与文件的标识之间的对应关系，以及所述物理地址与文件的标识之间的对应关系。由上面的描述可知，每个immutablememtable中包含不同关键字的数据，那么，相应地，与immutablememtable对应的文件中保存的也是不同关键字的数据。也就是说，同样的关键字所对应的数据会分布在不同的文件中。因此，当接收读取指令要求读取数据时，固态硬盘44需要根据读取指令携带的关键字从不同的文件中获取所述关键字对应的各个数据，并根据版本信息确认出最新的数据返回给用户。这样的过程会影响读取数据的效率，因此有必要对文件进行合并。合并的目的是对不同文件中，关键字相同的数据进行合并，合并后同一个关键字只对应一个数据或少量的几个数据(根据系统设置或者用户需求设定)。具体的，当第一层级的文件的总量达到一定阈值时，需要将第一层级中的文件进行合并。其合并方式可以是，对于第一层级中的所有文件进行合并，也可以是第一层级中的部分文件进行合并，还可以是由用户指定第一层级中待合并的文件。合并后生成的新的文件，就是第二层级的文件。依此类推，当第二层级的文件的总量达到一定阈值时，可以对其进行再次规定，建立第三层级的文件。对文件进行合并可以减少重复的数据或者无效的数据，提高读数据的效率。例如，在一个时间段内file1中写入了键范围为[1-10]的数据，file4更新了键范围为[5-20]的数据，file7又删除了[10-20]的部分数据。另外，在sst文件中，每个数据的存储格式为键值(key-value，kv),通过键值中的关键字标识文件中的每个数据，每个文件保存的所有关键字是有序排列的，通过起始关键字与终止关键字的组合标识每个文件的键范围。一般来说，第一层级的文件中的数据被读取的可能性更大，因为这些数据是新接收的数据，而其他层级的文件中的数据属于旧数据，被读取的可能性相对较小。因此，在本实施例中，将第一层级的文件部署在固态硬盘44中，将除第一层级以外的其他层级的文件部署在机械硬盘45中。由于固态硬盘读写数据的效率高于机械硬盘，因此采用这样的文件部署，可以进一步提高读数据的效率。另外，图1所示的存储系统还可以包含储存级存储器(storageclassmemory，scm)46，用于保存日志文件，控制器11在接收写数据指令之后，首先将写数据指令携带的信息写入所述日志文件，再将所述写数据指令写入memtable。上面介绍了将immutablememtable中的数据倾倒在固态硬盘44中，生成一个sst文件。另外，本实施例还提供了另一种数据存储的方式，即，直接根据所述日志文件中的记录生成sst文件。具体的，控制器11在接收主机发送的多个写数据指令之后，采用追加写的方式将每个写数据指令写入所述日志文件。因此，所述日志文件中保存有多个写数据指令，其中每个写数据指令都携带有关键字。所述日志文件按照每个写数据指令的关键字进行排序。另外，所述日志文件中还包括控制信息，例如操作类型、全局序列号等信息。这些信息用于日志文件回放后生成数据以及数据的关键字，以及保证回放时的顺序和操作的可靠性。操作类型用于指示写数据指令或者删除指令等操作。全局序列号可以是日志序列号(logsequencenumber，lsn)。另外，存储系统中还保存有一个或多个管理文件(图3中未示出)，用于记录各个文件所在的层级，单个文件最大的关键字以及最小的关键字，每个文件的标识，每个文件所包含的关键字的区间以及其他元数据信息。其他元数据信息包括但不限于：数据在固态硬盘44中的实际地址，逻辑地址和对数据进行写入的写入记录，以及实际地址与所属文件的标识的对应关系等，数据的逻辑地址可以是数据所属的文件的标识，也可以是数据所属的文件的标识和数据在文件中的偏移位置的组合，也可以是数据所属的文件的标识，数据在文件中的偏移位置和数据的长度的组合。写入记录包括对用户对数据进行写入的方式和时间，通过版本信息对数据进行写入的时间。所述管理文件可以保存在固态硬盘44中，也可以保存在机械硬盘45中，还可以保存在储存级存储器46中。下面结合图1所示的存储系统，以及图2所示的控制器11的结构，对本发明实施例公开的文件合并方法进行具体的描述。请参见图4，图4为本发明实施例提供的一种文件合并方法的流程图。如图4所示，所述数据的存储方法由控制器11中的处理器112执行，具体包括如下步骤。s301，控制器11读取固态硬盘44中的第一文件和第二文件。一种情况下，第一文件中的数据和第二文件中的数据均来自控制器11的存储器111。具体的，第一文件是由存储器111中的一个immutablememtable倾倒而来的，第二文件是由存储器111中的另一个immutablememtable倾倒而来的。由于immutablememtable中的数据是按照关键字从小到大或者从大到小的顺序进行排序的，因此第一文件和第二文件中的数据也是按照关键字排序的。这是为了提高读数据的效率。另一种情况下，第一文件中的数据和第二文件中的数据均是由日志文件回放而来的。由于日志文件中保存有多个写数据指令，以及操作类型、全局序列号等信息。因此，可以由日志文件回放生成第一文件的数据和第二文件的数据。其中，每个文件的尺寸是预先设置的，可以和一个immutablememtable的尺寸相同，也可以和一个immutablememtable的尺寸不同。在这种情况下，日志文件通常保存在储存级存储器中，以利用更加快速地从所述日志文件获取数据。无论第一文件的数据和第二文件的数据是来自存储器111还是来自日志文件，当所述第一文件的数据和所述第二文件的数据在固态硬盘44中进行持久化存储之后，可以将日志文件中对应的内容删掉，以节省日志文件所占用的存储空间。以控制器11读取第一文件为例，控制器11根据第一文件的标识在文件的标识与文件所包含的数据的逻辑地址的对应关系中查询，获取第一文件所包含的数据(例如，第一数据)的逻辑地址；控制器11将所述逻辑地址发送给固态硬盘44，固态硬盘44根据所述逻辑地址和物理地址的对应关系，从所述逻辑地址对应的物理地址中获取数据并发送给控制器11。同理，控制器11也按照这样的方式读取第二文件。为了方便描述，本实施例中第一文件包含第一数据以及第一数据的关键字，第二文件包含第二数据以及第二数据的关键字。s302，控制器11判断所述第一数据的关键字与所述第二数据的关键字是否相同。数据的关键字是用来标识所述数据的，判断第一数据的关键字与所述第二数据的关键字是否相同是为了确定是否需要对第一文件和第二文件进行合并。s303，当所述第一数据的关键字与所述第二数据的关键字相同时，控制器11在所述机械硬盘45上创建第三文件。如果第一数据的关键字与所述第二数据的关键字相同，则说明第一文件和第二文件需要合并，合并后的文件为第三文件。由于合并后的文件中的数据属于旧数据，被读取的可能性比第一文件、第二文件的可能性小，因此从节省成本的角度考虑，控制器11将合并后的数据写入机械硬盘45。具体的，控制器11创建第三文件，为所述第三文件分配标识，并且为所述第三文件分配一段逻辑地址区间，所述逻辑地址区间与机械硬盘45的一段物理地址区间对应。控制器11保存所述第三文件的标识与所述逻辑地址区间的对应关系，以及所述逻辑地址区间与所述物理地址区间之间的对应关系。s304，所述控制器11合并所述第一数据和所述第二数据，并且将所述合并后的数据写入所述第三文件。具体的，控制器11将所述合并后的数据写入所述分配的逻辑地址区间所对应的物理地址中。如果第一数据的关键字与第二数据的关键字不相同，则不需要对所述第一文件与所述第二文件进行合并。那么控制器11在机械硬盘45上创建第三文件，分别将第一文件所包含的数据和第二文件所包含的数据写入第三文件。其具体的写入第三文件的过程与将合并后的数据写入所述第三文件的过程相同，这里不再赘述。本发明实施例提供的文件合并方法，将合并前的文件存储在固态硬盘中，将合并后的文件存储在机械硬盘中。由于合并前的文件中的数据属于新数据，被读取的可能性较大，将其存储在固态硬盘中可以提高读数据的效率。而合并后的文件中的数据属于旧数据，被读取的可能性较小，将其存储在机械硬盘中，可以降低成本。在本申请所提供的几个实施例中，应该理解到，所揭露的系统，设备和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，在本发明各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的保护范围。当前第1页12当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：任波;黄飞腾
技术所有人：华为技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。