基于灰度的分布式图像底层特征识别方法及系统的制作方法

文档序号:9597886阅读:1521来源:国知局
基于灰度的分布式图像底层特征识别方法及系统的制作方法
【技术领域】
[0001] 本发明涉及一种分布式图像识别方法,具体地涉及一种在灰度化下通过捕捉图像 底层特征,利用分布式计算进行图像识别的基于灰度的分布式图像底层特征识别方法。
【背景技术】
[0002] 文字、图像、视频,是多媒体时代常见的数据信息的展现形式,也代表了数据信息 维度的变化,从一维、二维到三维的过程。图像作为二维数据的代表,既包含了一维数据载 体文字的直观反映又展现了三维数据载体视频的每一过程。据统计,一个人获取的信息大 约有75%来自视觉,图像已经越来越成为信息的代名词,为人类构建了一个形象的思维模 式。
[0003] 图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机 程序,人们提出了不同的图像识别模型,例如模板匹配模型。这种模型认为,识别某个图像 必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的刺激如果能与大脑中的模 板相匹配,这个图像也就被识别。例如有一个字母A,如果在脑中有个A模板,字母A的大 小、方位、形状都与这个A模板完全一致,字母A就被识别。这个模型简单明了,也容易得到 实际应用。但这种模型强调图像必须与脑中的模板完全符合才能加以识别,而事实上人不 仅能识别与脑中的模板完全一致的图像,也能识别与模板不完全一致的图像。例如,人们不 仅能识别某一个具体的字母A,也能识别印刷体的、手写体的、方向不正、大小不同的各种字 母A。同时,人能识别的图像是大量的,然而所识别的每一个图像在脑中都有一个精确相应 的模板是比较困难的。
[0004] 因此图像识别作为研究分析图像的一个触角,已经为图像应用提供了强有力的技 术支撑并带来了新的机遇点。图像识别,在识别过程中有两方面的信息来源,一个是基于感 官信息,另一个是基于记忆的信息,催生了图像识别的不同方向与思路。图像识别是用眼识 物的模拟实现,是人工智能新的探索。图象识别作为人工智能重要的领域,已经在许多的方 向取得了发展,典型的应用包括图像搜索、图像挖掘、图像知识图谱等等。
[0005] 图像识别的关键在于图像特征以及主要特征的分析上,即如何找到图像主要特征 的突破点,提取图像特征数据,再进行系统的数据分析工作。分析过程中,可以采用不同识 别模式,主要包括统计、结构、模糊。图像分割也正是基于该思想,从轮廓、纹理、色彩等角度 完成数据提取。
[0006] 图像识别的难点与挑战主要在于图像来源的不稳定性,图像质量难以保证,造成 数据源头污染,从而影响图像识别过程。另外,图像识别角度的多样化与复杂化造成图像分 析数据庞大而且难以保证数据的真实性。
[0007] 轮廓、纹理、颜色是图像物品识别中最重要的几个特征,能够很好地满足图像识别 中对主要特征的分析提取的要求。而且为了更好地保存图像的本质效果,对图像进行灰度 化处理,从而建立图像识别的统一基本的特征准线。
[0008] 另外,图像识别中的特征提取正在向特征点多化,特征值富化的方向发展,对数据 处理能力和方法提出了更高的要求。

【发明内容】

[0009] 针对图像识别中面临的问题,本发明提供了一种基于灰度的分布式图像底层特征 识别方法。建立图像识别的一个量化基准,即以灰度为量化标准,建立轮廓、纹理、色彩三重 的数据维度,并将此过程中的数据分配给分布式计算和存储平台,在大数据平台下进行图 像数据分析,并且分等级分层分级,利用客户端部分识别元素,并且将识别的图像信息进行 快速采集处理,以提高图像数据分析的能力与质量。
[0010] 本发明的技术方案是: 一种基于灰度的分布式图像底层特征识别方法,包括以下步骤: S1:将彩色图像根据不同特征要求转化为灰度图像,保存灰度图像的灰度值、像素值、 像素坐标,建立统一的特征基准; S2:设计图像指纹结构:采用字符串作为指纹存储结构,并且选择最佳字符串匹配算 法进行指纹识别; S3:利用蒙版抠图确定待识别图像的轮廓特征,生成图像轮廓指纹段; S4:选取图像主要特征区域,获取灰度数据,利用PHash算法,计算主要特征区域汉明 距离,生成图像纹理指纹段; S5:构建三维颜色直方图:将彩色图像转化为灰度图像,保存图像的三原色信息,构建 基于三原色的三维数组,生成图像色彩的指纹段; S6:分布式指纹生成计算节点设计:根据特征算法运行需求的不同,确定算法执行步 骤,评估计算节点的数量、分布以及运算策略; S7:分布式指纹轮询匹配计算节点设计:将图像原始信息与底层特征合成,生成全指 纹;将待匹配图像指纹数据根据指纹段切割,分配到不同的匹配计算节点,通过调整相应计 算节点的数量保证匹配时间在可允许的范围结束; S8:指纹识别匹配度标识:将多次轮询匹配的结果作为权值依据,与通过S7步骤匹配 的结果进行加权,得到匹配度,筛选出匹配结果。
[0011]优选的,步骤S1中彩色图像灰度化过程如下: 在以轮廓,纹理为特征的灰度化过程中,彩色图像转化为灰度图像,用灰度值来代表彩 色图像的亮度信息,彩色图像的亮度值即转化为灰度图像后的灰度值I由以下公式计算: I = 0. 3B + 0. 59G + 0. 11R; 其中R、G、B为红、绿、蓝三个通道的颜色; 在以色彩为特征的灰度化过程中,灰度图像保存彩色图像的颜色表,颜色表中每一项 的R、G、B分量用三维数组表示。
[0012] 优选的,所述步骤S3包括: 1) 生成图像原图的蒙版图; 2) 获取原图和蒙版图的像素值,将蒙版图的像素值赋值给原图,达到背景透明处理的 效果; 3)实现图像轮廓的抠图,对图像进行灰度化处理; 4)对灰度化的图像,计算每一个像素点的灰度值,从而获取图像的灰度平均值,将每个 像素的灰度值与其图像的灰度平均值进行比较,并分别用0和1表示比较的结果,生成64 位^进制序列串; 5)通过比较两个图像的哈希值,计算汉明距离,获取图像轮廓指纹段。
[0013] 优选的,所述步骤S4包括: 1) 将图像缩小为8*8共64个像素; 2) 将缩小后的图像转化为灰度图像,记录图像的灰度值,并将图像的灰度值作为计算 因子; 3) 对图像进行离散余弦变换DCT处理; 4) 缩小DCT值,并计算DCT均值; 5) 根据8*8的DCT矩阵,设置0或1的64位Hash值,大于等于DCT均值的设为" 1", 小于DCT均值的设为"0"; 6) 构造哈希值,计算汉明距离,获取图像纹理指纹段。
[0014] 优选的,所述步骤S5包括: 1) 获取图像,进行灰度化处理; 2) 在图像灰度化下,利用三维数组保存图像色彩信息,生成颜色直方图; 3) 计算巴氏系数,获取图像色彩的指纹段; 所述巴氏系数的计算公式为: 其中,P,P'分别代表源与候选的图像直方图数据,巴氏系数因子值的范围为〇到1之 间,i为直方图每个RGB数据的序号。
[0015] 优选的,所述步骤S6中分布式指纹生成计算节点,包括对图像数据处理、清洗、筛 选、整合,将整个计算过程分成不同的部分,对于每一个部分,再分割成不同的步骤,保持横 向和纵向计算节点分布的有序;在保证10图像数据流,图像优化处理基本函数以及灰度化 的前提下,针对各个特征算法设计计算节点的顺序以及计算节点的数量。
[0016] 优选的,所述步骤7中分布式指纹轮询匹配包括: 1) 对前期生成的图像全指纹数据,从分布式文件存储系统调到计算节点; 2) 根据全指纹结构,对全指纹结构进行切割,对应不同的计算节点,包括输入输出流, 图像优化处理函数,主要特征匹配算法,匹配度标识; 3) 对每一部分以及每部分的步骤进行封装,装载到对应计算节点,包括计算节点的分 配策略; 4) 在匹配算法的环节中,采用轮询的匹配算法,在进行特征匹配时,在可信计算时间 内,保证每种特征匹配算法轮询匹配三次,并以多次轮询的匹配结果决定特征匹配度,并进 行匹配标识。
[0017] 优选的,步骤S6和S7中的分布式包括分布式环境搭建和分布式程序设计;所述 分布式环境搭建包括使用Linux操作系统,安装Centos操作系统以及进行相关网络环境配 置,在Linux操作系统上安装Hadoop分布式系统集群,实现SSH免验证登录,设计主从节点 以及节点分布,在Hadoop集群基础上,搭建基于分布式的Nutch框架环境;所述分布式程序 设计包括在搭建的分布式环境中,通过Hadoop集群Web服务端界面监控集群的运行情况, 通过导入Hadoop代码在Eclipse中进行Hadoop程序设计,具体包括通过HDFS完成分布式 数据的存取,设计MapReduce程序实现分布式图像识别算法,结合Nutch框架设计Web爬虫 进行图像数据爬取。
[0018] 优选的,当有新的图像特征形式时,还包括:发掘新的图像特征形式,建立新的匹 配特征点;对图像特征点细化,完善单一特征点的匹配点数量;通过对匹配点分析数据进 行扩展。
[0019] 本发明还公开了一种基于灰度的分布式图像底层特征识别系统,包括:提取模块、 处理模块、分析模块以及数据模块; 所述提取模块:用于本地与云端的图像数据提取,本地的图像数据提取包括从应用客 户端获取的图像资源,云端的图像数据包括构建的分布式爬虫,基于Hadoop+Nutch框架, 10数据流,包括HttpClientAPI以及开源的网页解析框架,构建一个分布式的网络图像爬 取的框架,从而提供大数据量的图像资源;
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1