文件加速方法和装置与流程

文档序号:11830156阅读:368来源:国知局
文件加速方法和装置与流程

本发明涉及通讯领域,尤其涉及一种文件加速方法和装置。



背景技术:

随着科学技术的发展,我们面对的数据量越来越大,工作生活中常用的电脑、摄像机、移动硬盘或U盘等,数据容量达几百G或几百T,里面存储了海量的数据文件。典型的情况下,语音信箱系统中每日新增数据文件几百G字节,分布在几万个数据文件里面,数据文件系统总体规模非常庞大,文件管理工作显得困难,常常会出现数据文件的排序或查询不便利的问题。

在现有生活中,文件系统负责对文件存储设备的空间进行组织和分配,负责文件存储管理,并对存入的文件进行保护和检索。根据现有的技术,文件系统在存储数据文件时,仅通过数据文件的名字或节点将数据文件存储在目录中,当用户查询数据文件时,只能通过名字或节点进行查询,数据文件的查询效率低。



技术实现要素:

本发明的主要目的在于提出一种文件加速方法和装置,旨在解决数据文件的查询效率低的技术问题,实现高效有序管理。

为实现上述目的,本发明提供了一种文件加速方法,所述文件加速方法包括以下步骤:

在接收到索引的创建指令时,提取文件系统中待创建索引的各个数据文件的关联信息,所述关联信息包括所述数据文件的属性信息及/或内容信息;

基于提取到的所述关联信息生成各个所述数据文件的索引信息。

优选地,当所述关联信息为所述数据文件的内容信息时,所述基于提取到的所述关联信息生成各个所述数据文件的索引信息的步骤包括:

通过数据文件的列间隔符对各个数据文件的各个行内容分别进行分段,以生成各个数据文件的各个数据段;

获取各个数据段对应的内容信息及其地址信息;

基于各个所述数据段对应的内容信息及其地址信息,生成各个所述数据文件的索引信息。

优选地,所述在接收到索引的创建指令时,提取文件系统中待创建索引的各个数据文件的关联信息,所述关联信息包括所述数据文件的属性信息及/或内容信息的步骤之前,所述文件加速方法包括:

在检测到文件系统中出现新数据文件时,将所述新数据文件作为待创建索引的数据文件,以触发索引的创建指令。

优选地,所述文件加速方法还包括:

在接收到数据文件查询指令时,分析所述接收到的查询指令,并基于所述查询指令提取出预设的索引项;

基于提取的所述索引项,提取所述索引项对应的关键词;

基于提取的所述关键词获取相应的索引信息;

根据所述索引信息获取所述索引信息对应的数据文件。

此外,为实现上述目的,本发明还提出一种文件加速装置,所述文件加速装置包括:

提取模块,用于在接收到索引的创建指令时,提取文件系统中待创建索引的各个数据文件的关联信息,所述关联信息包括所述数据文件的属性信息及/或内容信息;

生成模块,用于基于提取到的所述关联信息生成各个所述数据文件的索引信息。

优选地,当所述关联信息为所述数据文件的内容信息时,所述生成模块包括:

处理单元,用于通过数据文件的列间隔符对各个数据文件的各个行内容分别进行分段,以生成各个数据文件的各个数据段;

获取单元,用于获取各个数据段对应的内容信息及其地址信息;

生成单元,用于基于各个所述数据段对应的内容信息及其地址信息,生成各个所述数据文件的索引信息。

优选地,所述文件加速装置还包括:

触发模块,用于在检测到文件系统中出现新数据文件时,将所述新数据 文件作为待创建索引的数据文件,以触发索引的创建指令。

优选地,所述文件加速装置还包括:

处理模块,用于在接收到数据文件查询指令时,分析所述接收到的查询指令,并基于所述查询指令提取出预设的索引项;

所述提取模块,还用于基于提取的所述索引项,提取所述索引项对应的关键词;

获取模块,用于基于提取的所述关键词获取相应的索引信息;

所述获取模块,还用于根据所述索引信息获取所述索引信息对应的数据文件。

本发明提出的文件加速方法和装置,在接收到索引的创建指令时,提取文件系统中待创建索引的各个数据文件的关联信息,基于提取到的所述关联信息生成各个所述数据文件的索引信息,实现了用户在查询数据文件及其内容时,通过索引信息直接定位到对应的数据文件及其内容位置,以便快速查询到数据文件及其内容,提高了数据文件的查询效率,实现了高效有序管理。

附图说明

图1为本发明文件加速方法第一实施例的流程示意图;

图2为图1中步骤S20的细化流程示意图;

图3为本发明文件加速方法第二实施例的流程示意图;

图4为本发明文件加速装置第一实施例的功能模块示意图;

图5为图4中生成模块20的细化功能模块示意图;

图6为本发明文件加速装置第二实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提供一种文件加速方法。

参照图1,图1为本发明文件加速方法第一实施例的流程示意图。

步骤S10,在接收到索引的创建指令时,提取文件系统中待创建索引的各个数据文件的关联信息,所述关联信息包括所述数据文件的属性信息及/或内容信息;

在本实施例中,所述步骤S10之前,包括在检测到文件系统中出现新数据文件时,将所述新数据文件作为待创建索引的数据文件,以触发索引的创建指令的步骤,所述索引的创建指令的触发方式包括:

1)自动触发方式,在检测到文件系统中出现新数据文件时,将所述新数据文件作为待创建索引的数据文件,以触发索引的创建指令。

2)定时触发方式,可预设终端在预设时间段内对文件系统进行一次搜索,如每12小时进行一次搜索,若在预设时间段内检测到新数据文件时,将所述搜索到的新数据文件作为待创建索引的数据文件,以触发索引的创建指令。

3)人工触发方式,在检测到文件系统中出现新数据文件时,终端在预设显示界面输出提示信息,所述输出提示信息优选在预设界面显示提示窗口(如显示:系统出现新数据文件!),或者在终端界面的预设区域显示抖动窗口,以提示用户文件系统中出现了新数据文件,并在检测到用户触控预设的索引创建图标时,将所述新数据文件作为待创建索引的数据文件,并触发索引的创建指令。

以上所列举的三种索引的创建指令的触发方式仅仅为示例性的,本领域技术人员利用本发明的技术思想,根据其具体需求所提出的各种索引的创建指令的触发方式均在本发明的保护范围内,在此不进行一一穷举。

在本实施例中,所述步骤S10之前,还包括预设文件系统的管理方式以及配置文件系统运行参数的步骤,所述预设文件系统的管理方式以及配置文件系统运行参数包括:a、配置文件系统的基本参数,如配置文件系统中索引的更新方式、系统内存分配方式、系统线程数以及索引是否随系统的启动在后台运行的方式等;b、配置索引的相关参数,如配置索引存储位置、索引对应的数据文件类型(如索引包括/排除哪些类型文件夹)等。进一步地,终端可提取系统运行过程中产生的数据统计信息,并将所述产生的数据统计信息展现给用户,用户通过分析这些统计信息,可优化调整文件系统的管理方式以及配置文件系统运行参数,使系统运行状态达到最佳。

所述数据文件包括语音信箱数据文件、系统日志文件、文本文件或二进制文件。所述属性信息包括数据文件的名称、大小、创建时间或数据文件的类型,所述内容信息包括数据文件内容的关键字段。

步骤S20,基于提取到的所述关联信息生成各个所述数据文件的索引信息。

在本实施例中,所述基于提取到的所述关联信息生成各个所述数据文件的索引信息的实施例包括:

1)第一实施例,当提取到的所述关联信息为所述数据文件的属性信息时,可通过预设的算法,优选根据hash(Hash algorithm哈希算法)方法,计算所述各个属性信息,并根据计算结果,生成各个所述数据文件的索引信息。例如,根据预设的哈希算法计算所述属性信息,根据所述属性信息计算的结果,得到所述对应的索引数据在索引树上的位置指针结果,并将所述索引数据加入所述获取的位置指针并保存,以生成各个所述数据文件的索引信息。可以理解的是,在查询数据文件过程中,通过文件名称等文件属性信息进行查询时,可通过所述属性信息关联的索引信息进行定位查询,如用户输入预设的索引信息,并触发查询指令,根据所述索引信息与数据文件的关联性,可快速定位到所述索引信息对应的数据文件。

2)第二实施例,参照图2,当所述提取到的所述关联信息为所述数据文件的内容信息时,所述步骤S20包括:

步骤S21,通过数据文件的列间隔符对各个数据文件的各个行内容分别进行分段,以生成各个数据文件的各个数据段;

在本实施例中,当所述提取到的所述关联信息为所述数据文件的内容信息时,例如所述数据文件的内容信息为日志文件的内容信息,由于日志文件的行是固定的,可按照预设的列间隔符,将各个所述行内容分别拆分成预设个数的数据段,以生成各个数据文件的各个数据段。本领域技术人员可以理解的是,在语音信箱系统中,日志文件是结构化的,内容具有固定的表格格式,有明确的行、列间隔符。典型的日志内容包括以下字段:时间、日志级别、主叫号码、消息号、操作类型、失败原因等,其中内容信息包括以下字段:时间、主叫号码、消息号等。

步骤S22,获取各个数据段对应的内容信息及其地址信息;

步骤S23,基于各个所述数据段对应的内容信息及其地址信息,生成各个所述数据文件的索引信息。

在本实施例中,优选先获取各个数据文件,分别对获取的所述各个数据文件进行分段处理,以得到每个数据文件的多个数据段,提取每个数据段中的关键内容,同时,提取出每个关键内容对应的地址信息,确定各个内容信息与地址信息的对应关系。也就是说,获取各个内容信息在对应的数据文件上的指针位置,在获取的所述指针位置上分别写入对应的各个内容信息,以生成各个数据文件的索引信息。可以理解的是,每个数据文件可对应一个索引,也可对应多个索引,当所述数据文件对应的索引为多个索引时,根据多个索引生成各个数据文件的索引信息。

3)第三实施例,当提取到的所述关联信息包括所述数据文件的属性信息以及所述数据文件的内容信息时,优选先提取所述各个数据文件的属性信息,并根据提取的各个属性信息,确定对应的各个数据文件在文件系统的位置信息,以生成各个所述数据文件的索引信息,即获取各个数据文件在文件系统中的指针位置,根据获取的指针位置生成各个所述数据文件的索引信息;进一步地,在各个数据文件中,可按照预设的列间隔符,将各个数据文件中的每个行内容分别拆分成预设个数的数据段,基于所述拆分的预设个数的数据段,分别获取所述预设个数数据段的内容信息以及地址信息,并确定各个内容信息在对应的数据文件上的指针位置,在获取的所述指针位置上分别写入对应的各个内容信息,以生成各个数据文件的索引信息。

在本实施例中,在接收到索引创建指令时,依次打开待创建索引的数据文件,从依次打开的待创建索引的文件中提取属性信息或内容信息,并根据所述属性信息或内容信息创建对应的数据文件的索引信息,所述属性信息可能不止一个,某个索引信息也可能是多个属性的联合;同理,所述内容信息可能不止一个,某个索引信息也可能是多个内容的联合。

本实施例提出的文件加速方法,在接收到索引的创建指令时,提取文件系统中待创建索引的各个数据文件的关联信息,基于提取到的所述关联信息生成各个所述数据文件的索引信息,实现了用户在查询数据文件及其内容时,通过索引信息直接定位到对应的数据文件及其内容位置,以便快速查询到数据文件及其内容,提高了数据文件的查询效率,实现了高效有序管理。

进一步地,参照图3,基于第一实施例提出本发明文件加速方法第二实施例,在本实施例中,所述文件加速方法还包括:

步骤S30,在接收到数据文件查询指令时,分析所述接收到的查询指令,并基于所述查询指令提取出预设的索引项;

步骤S40,基于提取的所述索引项,提取所述索引项对应的关键词;

步骤S50,基于提取的所述关键词获取相应的索引信息;

步骤S60,根据所述索引信息获取所述索引信息对应的数据文件。

在本实施例中,优选方案为,在接收到数据查询指令时,提取所述查询指令对应的索引项,如查询指令为名称查询,则所述索引项为数据文件的文件名;再根据所述索引项提取出所述索引项对应的关键词(如关键词为系统),则可根据所述关键词获取相应的索引信息,再根据所述索引信息获取所述索引信息对应的数据文件。

可以理解的是,在文件使用过程中,由于索引是有序排列的,可通过预先创建好的索引迅速查询、排序和展现。解决文件使用过程中查询和排序操作耗时长问题,提高日志数据文件查询效率,例如当访问数据文件时,首先使用索引信息,通过索引信息定位到对应的数据文件,快速跳到所述索引信息对应的数据文件,方便了用户查询。例如:通过文件名称等属性信息寻找文件的时候,可以通过索引定位,直接定位到文件系统中的数据文件;或者在查询日志数据内容过程中,根据查询条件找到相关索引信息,然后从索引信息中找到位置索引,最后通过位置索引直接访问数据内容。由于索引结构具有高效的访问效率,所以访问数据内容过程具有比当前技术更高的效率。

在本实施例中,优选方案为,在接收到数据文件查询指令时,分析所述接收到的查询指令并基于所述查询指令提取出关键词,所述关键词可为一个或多个,当提取出的所述关键词为多个时,基于提取的多个关键词获取对应的索引信息,并通过索引查询数据,本实施例中,根据提取的多个关键词,可一次性获得结果,使得数据文件的查询效率更高。

本发明进一步提供一种文件加速装置。

参照图4,图4为本发明文件加速装置第一实施例的功能模块示意图。

需要强调的是,对本领域的技术人员来说,图4所示功能模块图仅仅是一个较佳实施例的示例图,本领域的技术人员围绕图4所示的文件加速装置的功能模块,可轻易进行新的功能模块的补充;各功能模块的名称是自定义名称,仅用于辅助理解该文件加速装置的各个程序功能块,不用于限定本发明的技术方案,本发明技术方案的核心是,各自定义名称的功能模块所要达成的功能。

本实施例提出一种文件加速装置,所述文件加速装置包括:

提取模块10,用于在接收到索引的创建指令时,提取文件系统中待创建索引的各个数据文件的关联信息,所述关联信息包括所述数据文件的属性信息及/或内容信息;

在本实施例中,所述文件加速装置还包括触发模块,所述触发模块用于在检测到文件系统中出现新数据文件时,将所述新数据文件作为待创建索引的数据文件,以触发索引的创建指令,所述索引的创建指令的触发方式包括:

1)自动触发方式,在检测到文件系统中出现新数据文件时,将所述新数据文件作为待创建索引的数据文件,以触发索引的创建指令。

2)定时触发方式,可预设在预设时间段内对文件系统进行一次搜索,如每12小时进行一次搜索,若在预设时间段内检测到新数据文件时,将所述搜索到的新数据文件作为待创建索引的数据文件,以触发索引的创建指令。

3)人工触发方式,在检测到文件系统中出现新数据文件时,在预设显示界面输出提示信息,所述输出提示信息优选在预设界面显示提示窗口(如显示:系统出现新数据文件!),或者在终端界面的预设区域显示抖动窗口,以提示用户文件系统中出现了新数据文件,并在检测到用户触控预设的索引创建图标时,将所述新数据文件作为待创建索引的数据文件,并触发索引的创建指令。

以上所列举的三种索引的创建指令的触发方式仅仅为示例性的,本领域技术人员利用本发明的技术思想,根据其具体需求所提出的各种索引的创建指令的触发方式均在本发明的保护范围内,在此不进行一一穷举。

在本实施例中,包括预设文件系统的管理方式以及配置文件系统运行参数的步骤,所述预设文件系统的管理方式以及配置文件系统运行参数包括:a、配置文件系统的基本参数,如配置文件系统中索引的更新方式、系统内存分 配方式、系统线程数以及索引是否随系统的启动在后台运行的方式等;b、配置索引的相关参数,如配置索引存储位置、索引对应的数据文件类型(如索引包括/排除哪些类型文件夹)等。进一步地,所述提取模块10可提取系统运行过程中产生的数据统计信息,并将所述产生的数据统计信息展现给用户,用户通过分析这些统计信息,可优化调整文件系统的管理方式以及配置文件系统运行参数,使系统运行状态达到最佳。

所述数据文件包括语音信箱数据文件、系统日志文件、文本文件或二进制文件。所述属性信息包括数据文件的名称、大小、创建时间或数据文件的类型,所述内容信息包括数据文件内容的关键字段。

生成模块20,用于基于提取到的所述关联信息生成各个所述数据文件的索引信息。

在本实施例中,所述生成模块20基于提取到的所述关联信息生成各个所述数据文件的索引信息的实施例包括:

1)第一实施例,当提取到的所述关联信息为所述数据文件的属性信息时,可通过预设的算法,优选根据hash(Hash algorithm哈希算法)方法,计算所述各个属性信息,并根据计算结果,所述生成模块20生成各个所述数据文件的索引信息。例如,根据预设的哈希算法计算所述属性信息,根据所述属性信息计算的结果,得到所述对应的索引数据在索引树上的位置指针结果,并将所述索引数据加入所述获取的位置指针并保存,以供所述生成模块20生成各个所述数据文件的索引信息。可以理解的是,在查询数据文件过程中,通过文件名称等文件属性信息进行查询时,可通过所述属性信息关联的索引信息进行定位查询,如用户输入预设的索引信息,并触发查询指令,根据所述索引信息与数据文件的关联性,可快速定位到所述索引信息对应的数据文件。

2)第二实施例,参照图5,当所述提取到的所述关联信息为所述数据文件的内容信息时,所述生成模块20包括:

处理单元21,用于通过数据文件的列间隔符对各个数据文件的各个行内容分别进行分段,以生成各个数据文件的各个数据段;

在本实施例中,当所述提取到的所述关联信息为所述数据文件的内容信息时,例如所述数据文件的内容信息为日志文件的内容信息,由于日志文件 的行是固定的,所述处理单元21可按照预设的列间隔符,将各个所述行内容分别拆分成预设个数的数据段,以生成各个数据文件的各个数据段。本领域技术人员可以理解的是,在语音信箱系统中,日志文件是结构化的,内容具有固定的表格格式,有明确的行、列间隔符。典型的日志内容包括以下字段:时间、日志级别、主叫号码、消息号、操作类型、失败原因等,其中内容信息包括以下字段:时间、主叫号码、消息号等。

获取单元22,用于获取各个数据段对应的内容信息及其地址信息;

生成单元23,用于基于各个所述数据段对应的内容信息及其地址信息,生成各个所述数据文件的索引信息。

在本实施例中,所述获取单元22优选先获取各个数据文件,分别对获取的所述各个数据文件进行分段处理,以得到每个数据文件的多个数据段,提取每个数据段中的关键内容,同时,提取出每个关键内容对应的地址信息,确定各个内容信息与地址信息的对应关系。也就是说,所述获取单元22获取各个内容信息在对应的数据文件上的指针位置,在获取的所述指针位置上分别写入对应的各个内容信息,以供所述生成单元23生成各个数据文件的索引信息。可以理解的是,每个数据文件可对应一个索引,也可对应多个索引,当所述数据文件对应的索引为多个索引时,所述生成单元23根据多个索引生成各个数据文件的索引信息。

3)第三实施例,当所述提取模块10提取到的所述关联信息包括所述数据文件的属性信息以及所述数据文件的内容信息时,优选所述提取模块10先提取所述各个数据文件的属性信息,并根据提取的各个属性信息,确定对应的各个数据文件在文件系统的位置信息,以供所述生成单元23生成各个所述数据文件的索引信息,即所述提取模块10获取各个数据文件在文件系统中的指针位置,所述生成单元23根据获取的指针位置生成各个所述数据文件的索引信息;进一步地,在各个数据文件中,可按照预设的列间隔符,所述处理单元21将各个数据文件中的每个行内容分别拆分成预设个数的数据段,基于所述拆分的预设个数的数据段,所述获取单元22分别获取所述预设个数数据段的内容信息以及地址信息,并确定各个内容信息在对应的数据文件上的指针位置,在获取的所述指针位置上分别写入对应的各个内容信息,以供所述生成单元23生成各个数据文件的索引信息。

在本实施例中,在接收到索引创建指令时,依次打开待创建索引的数据文件,从依次打开的待创建索引的文件中提取属性信息或内容信息,并根据所述属性信息或内容信息创建对应的数据文件的索引信息,所述属性信息可能不止一个,某个索引信息也可能是多个属性的联合;同理,所述内容信息可能不止一个,某个索引信息也可能是多个内容的联合。

本实施例提出的文件加速装置,在接收到索引的创建指令时,提取文件系统中待创建索引的各个数据文件的关联信息,基于提取到的所述关联信息生成各个所述数据文件的索引信息,实现了用户在查询数据文件及其内容时,通过索引信息直接定位到对应的数据文件及其内容位置,以便快速查询到数据文件及其内容,提高了数据文件的查询效率,实现了高效有序管理。

进一步地,参照图6,基于第一实施例提出本发明文件加速装置第二实施例,在本实施例中,所述文件加速装置还包括:

处理模块30,用于在接收到数据文件查询指令时,分析所述接收到的查询指令,并基于所述查询指令提取出预设的索引项;

所述提取模块10,还用于基于提取的所述索引项,提取所述索引项对应的关键词;

获取模块40,用于基于提取的所述关键词获取相应的索引信息;

所述获取模块40,还用于根据所述索引信息获取所述索引信息对应的数据文件。

在本实施例中,优选方案为,所述处理模块30在接收到数据查询指令时,提取所述查询指令对应的索引项,如查询指令为名称查询,则所述索引项为数据文件的文件名;所述提取模块10再根据所述索引项提取出所述索引项对应的关键词(如关键词为系统),则可根据所述关键词获取相应的索引信息,以供所述获取模块40根据所述索引信息获取所述索引信息对应的数据文件。

可以理解的是,在文件使用过程中,由于索引是有序排列的,可通过预先创建好的索引迅速查询、排序和展现。解决文件使用过程中查询和排序操作耗时长问题,提高日志数据文件查询效率,例如当访问数据文件时,首先使用索引信息,通过索引信息定位到对应的数据文件,快速跳到所述索引信息对应的数据文件,方便了用户查询。例如:通过文件名称等属性信息寻找文 件的时候,可以通过索引定位,直接定位到文件系统中的数据文件;或者在查询日志数据内容过程中,根据查询条件找到相关索引信息,然后从索引信息中找到位置索引,最后通过位置索引直接访问数据内容。由于索引结构具有高效的访问效率,所以访问数据内容过程具有比当前技术更高的效率。

在本实施例中,优选方案为,所述处理模块30在接收到数据文件查询指令时,分析所述接收到的查询指令并基于所述查询指令提取出关键词,所述关键词可为一个或多个,当提取出的所述关键词为多个时,所述获取模块40基于提取的多个关键词获取对应的索引信息,并通过索引查询数据,本实施例中,根据提取的多个关键词,可一次性获得结果,使得数据文件的查询效率更高。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1