一种大数据图像筛选方法与流程

文档序号：18030260发布日期：2019-06-28 22:35阅读：645来源：国知局

本发明涉及数据处理技术领域技术领域，具体涉及一种大数据图像筛选方法。

背景技术：

随着互联网的快速发展以及计算机的广泛普及，数字图像的获取也变得越来越容易。因此，可用的数字图像正快速地增长并且在越来越多的行业中得到应用。图像筛选技术是一种辅助用户高效地获取期望图像的方法，同时也是很多与图像相关的人机交互系统取得成功的基础，如检索系统、推荐系统等。

现有的图像筛选方法大多不能根据特征点对图像进行筛选，且不能根据需要随时对筛选条件进行修改，导致使用不便。

技术实现要素：

发明目的：针对上述现有技术中的不足，本发明提供一种大数据图像筛选方法，能够提高对图像的数据查询结果进行筛选的效率，提高web系统查询结果处理的交互性，使得查询系统的应用性更佳。

技术方案：为实现上述目的，本发明采用如下技术方案：

一种大数据图像筛选方法，包括如下步骤：

步骤1：对图像进行预处理后，将图像文件存储在分布式文件系统的图像库中；

步骤2：提取图像的特征点；

步骤3：对所提取的特征点建立特征索引，将索引文件和图像文件存储在分布式文件数据库上；

步骤4：用户设置第一次图像查询条件对数据库进行图像查询，记录第一次查询的结果和查询条件，按照第一次查询条件对第一次查询结果进行第二次查询；

步骤5：根据所述第二次查询结果，建立第二次查询结果的索引，将第二次查询结果和第二次查询结果的索引存储在分布式文件数据库；

步骤6：访问分布式文件数据库，使用所述索引筛选再查询结果，返回筛选结果。

进一步的，步骤1中，所述预处理为：根据图像的像素位置信息和像素灰度值信息，对图像进行滤波处理，生成滤波图像，根据滤波图像的局部像素信息和整体像素信息，对滤波图像进行增强处理，生成增强图像。

进一步的，所述接收第二次查询结果之后、建立第二次查询结果的索引之前包括，建立第二次查询结果表；所述建立第二次查询结果的索引包括，根据筛选条件建立索引，通过保存在所述索引中的页码找到第二次查询结果表中对应的记录。

有益效果：本发明能够提高对图像的数据查询结果进行筛选的效率，提高web系统查询结果处理的交互性，使得查询系统的应用性更佳。

具体实施方式

下面结合实施例对本发明做更进一步的解释。

本发明提供一种大数据图像筛选方法，包括如下步骤：

步骤1：对图像进行预处理后，将图像文件存储在分布式文件系统的图像库中；所述预处理为：根据图像的像素位置信息和像素灰度值信息，对图像进行滤波处理，生成滤波图像，根据滤波图像的局部像素信息和整体像素信息，对滤波图像进行增强处理，生成增强图像。

步骤2：提取图像的特征点；所述特征点为图像的斑点和角点两类局部特征点，斑点检测的方法主要包括利用高斯拉普拉斯算子检测的方法(log)，以及利用像素点hessian矩阵(二阶微分)及其行列式值的方法(doh)。无论是log还是doh，它们对图像中的斑点进行检测，其步骤都可以分为以下两步：

1)使用不同的σ生成或模板，并对图像进行卷积运算；

2)在图像的位置空间与尺度空间中搜索log与doh响应的峰值。

角点检测的方法中具有代表性的算法是harris算法与fast算法。harris角点检测是一种基于图像灰度的一阶导数矩阵检测方法。检测器的主要思想是局部自相似性/自相关性，即在某个局部窗口内图像块与在各个方向微小移动后的窗口内图像块的相似性。基于加速分割测试的fast算法可以快速地提取出角点特征。该算法判断一个候选点p是否为角点，依据的是在一个像素点p为圆心，半径为3个像素的离散化bresenllam圆周上，在给定阈值t的条件下，如果在圆周上有n个连续的像素灰度值大于i(p)+t或小于i(p)-t。

针对于上面的定义，我们可以用快速的方法来完成检测，而不用把圆周上的所有点都比较一遍。首先比较上下左右四个点的像素值关系，至少要有3个点的像素灰度值大于i(p)+t或小于i(p)-t，则p为候选点，然后再进一步进行完整的判断。

为了加快算法的检测速度，可以使用机器学习id3贪心算法来构建决策树。这里需要说明的是，在2010年elmar和gregory等人提出了自适应通用加速分割检测(agast)算法，通过把fast算法中id3决策树改造为二叉树，并能够根据当前处理的图像信息动态且高效地分配决策树，提高了算法的运算速度。

步骤3：对所提取的特征点建立特征索引，将索引文件和图像文件存储在分布式文件数据库上；

步骤5：根据所述第二次查询结果，建立第二次查询结果的索引，将第二次查询结果和第二次查询结果的索引存储在分布式文件数据库；

步骤6：访问分布式文件数据库，使用所述索引筛选再查询结果，返回筛选结果。

根据下述实施例，可以更好的理解本发明。然而，本领域的技术人员容易理解，实施例所描述的具体的物料配比、工艺条件及其结果仅用于说明本发明，而不应当也不会限制权利要求书中所详细描述的本发明。

技术特征：

技术总结
本发明提供一种大数据图像筛选方法，包括如下步骤：对图像进行预处理后，将图像文件存储在分布式文件系统的图像库中；提取图像的特征点；对所提取的特征点建立特征索引，将索引文件和图像文件存储在分布式文件数据库；用户设置第一次图像查询条件进行查询，记录第一次查询的结果和查询条件，按照第一次查询条件对第一次查询结果进行第二次查询；根据第二次查询结果，建立第二次查询结果的索引，将第二次查询结果和第二次查询结果的索引存储在分布式文件数据库；访问分布式文件数据库，使用所述索引筛选再查询结果，返回筛选结果。本发明能够提高对图像的数据查询结果进行筛选的效率，提高WEB系统查询结果处理的交互性，使得查询系统的应用性更佳。

技术研发人员：王立钧;吴勇
受保护的技术使用者：南京唯实科技有限公司
技术研发日：2017.10.13
技术公布日：2019.06.28

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王立钧;吴勇
技术所有人：南京唯实科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。