一种基于滑块的目录索引优化方法

文档序号:8223600阅读:161来源:国知局
一种基于滑块的目录索引优化方法
【技术领域】
[0001]本发明涉及目录服务系统领域,尤其是基于滑块的目录索引优化方法。
【背景技术】
[0002]随着互联网的发展,对各种数据资源的标准化管理和高效存取的要求变得十分迫切,目录服务技术就是在这样的背景下产生并迅速发展的新技术。目录服务系统是用于网络数据资源的分布式存储和快速查询的新型专用数据库系统,是专门为那些检索频率大大高于数据更新频率的信息服务而设计的。比如图书馆图书索引系统、网络资源管理系统、组织人员管理系统、单点登录系统等。
[0003]目录服务系统一般遵循轻型目录访问协议LDAPv3协议,该协议规定了目录数据的基本单元和格式,目录服务连接和通讯的操作及安全处理,目录服务的基本操作和通讯格式,目录服务扩展和自定义操作的方式,目录服务的分布式部署等,从而能够保持应用的标准性和独立性,该协议中目录的数据单元为条目,且该协议规定的操作条目数据的九个基本操作包括绑定,添加,修改,删除,搜索,比较,解绑定等,而该协议规定的控制和扩展使得目录服务系统在基本的九个操作之外,增加了服务方能够处理的操作请求的数量和范围。
[0004]目录服务系统的实现厂商,可以在自己的目录服务系统中给出这些操作的不同实现方式、特性,并且可以自定义新的扩展和控制操作,实现新的目录服务功能,同时可以提供数据同步的方式和具体功能。
[0005]所述基于滑块的目录索引优化技术,目的是为了降低目录创建索引的负载,并提高目录查找的效率。根据不同的应用需求,合理设置索引滑块大小,可同时降低创建索引的时间,并提高索引查找效率。
[0006]滑块大小,指计算索引时每次提取的数据字符个数,计算索引时,按照动态设定的滑块大小从条目属性值中去除数据并计算;如果没有滑块的设置,那么需要每次错一个字符且不固定长度,然后获取数据并计算,这样会大幅增加计算索引的时间,以及索引存储的空间。
[0007]为了实现目录子串索弓丨,需要执行如图1所示的过程:
[0008]步骤101,直接按照每个字符都计算的方式来计算索引个数,2个以上才计算索弓I ;
[0009]步骤102,根据索引个数循环,计算具体的索引值;
[0010]由以上操作可以看出,所述目录子串索引,使用的是固定大小的计算方法,这种方式的缺点是创建的索引个数较多,一般远远超出查询所需要的范围,造成添加、修改数据时的低效,尤其是在目录这种本身写慢读快的库中,体现的更加明显。

【发明内容】

[0011]本发明要解决的问题是提供一种通过定义和实现可配置大小的滑块进而实现目录索引创建及查询优化的基于滑块的目录索引优化方法,用以降低索引创建的强度,提高索引为查询服务的效率,满足不同应用场景下对查询效率的要求,进而达到提高查询性能的目的。
[0012]为解决上述技术问题,本发明采用的技术方案是:一种基于滑块的目录索引优化方法,包括以下步骤:
[0013](I)在目录索引中设置动态检索滑块,且在该检索滑块内增加可配置该检索滑块大小的参数;
[0014](2)在检索系统中输入查询条件,配置文件根据查询条件为目录索引属性设置参数;
[0015](3)目录索引启动时根据所启动目录索引的属性读取配置文件中的参数;
[0016](4)根据检索滑块内参数的设置,重新计算目录索引中的索引个数;
[0017](5)根据滑块参数及目录索引中的索引个数做循环,计算该目录索引当前属性当前类别匹配规则的索引值。
[0018](6)统计检索结果,得到查询结果,查询结束。
[0019]进一步,所述步骤(I)中可配置检索滑块大小的参数与该检索滑块的属性名字位于检索目录的同一级别。
[0020]进一步,所述步骤(I)中可配置检索滑块大小的参数为全局参数。
[0021]进一步,所述步骤(I)中可配置检索滑块大小的参数包括检索对象字符串长度min值和滑块大小数值。
[0022]进一步,所述步骤(4)中检索目录的索引个数的计算方法和逻辑包括initial,final,any三种情况。
[0023]进一步,所述步骤⑷中检索目录的索引个数的计算方法如下:
[0024](a)比较所要检索的字符串长度与滑块大小之间的关系;
[0025](b)当所要检索的字符串长度大于或等于滑块大小时:
[0026]initial索引个数是滑块大小-min值+1 ;
[0027]final索引个数是滑块大小-min值+1 ;
[0028]any索引个数是字符串长度-滑块大小+1
[0029](c)当字符串长度小于滑块大小,但大于或等于min值时:
[0030]initial索引个数是字符串长度-min值+1 ;
[0031]final索引个数是字符串长度-min值+1 ;
[0032]无any 索引;
[0033](d)当字符串长度小于min时:
[0034]无initial 索引;
[0035]无final 索引;
[0036]无any 索引。
[0037]本发明具有的优点和积极效果是:采用上述技术方案,可以根据业务需要指定滑块大小,避免any类型的索引要进行的每字符错位计算,可以快速完成索引创建过程,又能保证查询的效率。
【附图说明】
[0038]图1是现有索引创建流程示意图;
[0039]图2是优化索引创建流程示意图。
【具体实施方式】
[0040]以下根据附图及具体实施例对本发明作出详细说明。
[0041]如图2所示,本发明包括以下步骤:
[0042](I)在目录索引中设置动态检索滑块,且在该检索滑块内增加可配置该检索滑块大小的参数;
[0043](2)在检索系统中输入查询条件,配置文件根据查询条件为目录索引属性设置参数;
[0044](3)目录索引启动时根据所启动目录索引的属性读取配置文件中的参数;
[0045](4)根据检索滑块内参数的设置,重新计算目录索引中的索引个数;
[0046](5)根据滑块参数及目录索引中的索引个数做循环,计算该目录索引当前属性当前类别匹配规则的索引值。
[0047](6)统计检索结果,得到查询结果,查询结束。
[0048]步骤(I)中可配置检索滑块大小的参数与该检索滑块的属性名字位于检索目录的同一级别,也可以是全局参数。
[0049]步骤(I)中可配置检索滑块大小的参数包括检索对象字符串长度min值和滑块大小数值,以便于根据参数进行索引个数的计算。
[0050]步骤(4)中检索目录的索引个数的计算方法和逻辑包括initial,final,any三种情况。
[0051]进步骤(4)中检索目录的索引个数的其中一个计算方法如下:
[0052](a)比较所要检索的字符串长度与滑块大小之间的关系;
[0053](b)当所要检索的字符串长度大于或等于滑块大小时:
[0054]initial索引个数是滑块大小-min值+1 ;
[0055]final索引个数是滑块大小-min值+1 ;
[0056]any索引个数是字符串长度-滑块大小+1
[0057](c)当字符串长度小于滑块大小,但大于或等于min值时:
[0058]initial索引个数是字符串长度-min值+1 ;
[0059]final索引个数是字符串长度-min值+1 ;
[0060]无any 索引;
[0061](d)当字符串长度小于min时:
[0062]无initial 索引;
[0063]无final 索引;
[0064]无any 索引。
[0065]此种计算方法避免了原来索引个数是字符串长度的级数级别,使得索引个数与字符串长度成线性相关,大大缩减了索引个数,提高了索引创建效率。
[0066]本发明中动态检索滑块的设置,使得索引属性的滑块大小由业务中的查询条件确定,使得查询中使用于滑块匹配的查询值长度,提升了查询时的效率。
[0067]在查询时,目录使用标准的过滤字符串表示方法,即正则表达式的形式;当查询条件中要查找的内容长度与滑块大小相同时,将达到最佳的匹配;否则需要把查询条件拆成若干个去计算索引,然后再匹配;比如查询*张三*,当滑块设置成4 (一个中文是2个字符,gb2312编码)时,将会只计算一个索引值,然后进行匹配。
[0068]此种查询步骤与索引个数相结合,对动态检索滑块进行合理配置,综合提升创建和查询时的效率。
[0069]以上对本发明的实施例进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明范围所作的均等变化与改进等,均应仍归属于本专利涵盖范围之内。
【主权项】
1.一种基于滑块的目录索引优化方法,其特征在于:包括以下步骤: (1)在目录索引中设置动态检索滑块,且在该检索滑块内增加可配置该检索滑块大小的参数; (2)在检索系统中输入查询条件,配置文件根据查询条件为目录索引属性设置参数; (3)目录索引启动时根据所启动目录索引的属性读取配置文件中的参数; (4)根据检索滑块内参数的设置,重新计算目录索引中的索引个数; (5)根据滑块参数及目录索引中的索引个数做循环,计算该目录索引当前属性当前类别匹配规则的索引值。 (6)统计检索结果,得到查询结果,查询结束。
2.根据权利要求1所述的基于滑块的目录索引优化方法,其特征在于:所述步骤(I)中可配置检索滑块大小的参数与该检索滑块的属性名字位于检索目录的同一级别。
3.根据权利要求1所述的基于滑块的目录索引优化方法,其特征在于:所述步骤(I)中可配置检索滑块大小的参数为全局参数。
4.根据权利要求1所述的基于滑块的目录索引优化方法,其特征在于:所述步骤(I)中可配置检索滑块大小的参数包括检索对象字符串长度min值和滑块大小数值。
5.根据权利要求1所述的基于滑块的目录索引优化方法,其特征在于:所述步骤(4)中检索目录的索引个数的计算方法和逻辑包括initial,final,any三种情况。
6.根据权利要求1所述的基于滑块的目录索引优化方法,其特征在于:所述步骤(4)中检索目录的索引个数的计算方法如下: (a)比较所要检索的字符串长度与滑块大小之间的关系; (b)当所要检索的字符串长度大于或等于滑块大小时: initial索引个数是滑块大小_min值+1 ; final索引个数是滑块大小-min值+1 ; any索引个数是字符串长度-滑块大小+1 (c)当字符串长度小于滑块大小,但大于或等于min值时: initial索引个数是字符串长度-min值+1 ; final索引个数是字符串长度-min值+1 ; 无any索引; (d)当字符串长度小于min时: 无initial索引; 无final索引; 无any索引。
【专利摘要】本发明提供一种基于滑块的目录索引优化方法,包括以下步骤:(1)在目录索引中设置动态检索滑块,且在该检索滑块内增加可配置该检索滑块大小的参数;(2)在检索系统中输入查询条件,配置文件根据查询条件为目录索引属性设置参数;(3)目录索引启动时根据所启动目录索引的属性读取配置文件中的参数;(4)根据检索滑块内参数的设置,重新计算目录索引中的索引个数;(5)根据滑块参数及目录索引中的索引个数做循环,计算该目录索引当前属性当前类别匹配规则的索引值;(6)统计检索结果;采用上述技术方案,可以根据业务需要指定滑块大小,避免any类型的索引要进行的每字符错位计算,可以快速完成索引创建过程,又能保证查询的效率。
【IPC分类】G06F17-30
【公开号】CN104537078
【申请号】CN201410851219
【发明人】张健, 陈文亭, 朱宏军, 崔维力, 武新
【申请人】天津南大通用数据技术股份有限公司
【公开日】2015年4月22日
【申请日】2014年12月31日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1