基于xgml的图像半结构化表示方法

文档序号：9787570阅读：700来源：国知局

基于xgml的图像半结构化表示方法
【技术领域】
[0001]本发明涉及一种基于XGML的图像半结构化表示方法，属于数字图像处理中的图像分析领域。
【背景技术】
[0002]随着计算机应用技术的高速发展，网络上出现了大量的数字图像，而在Web页面中，图像的常用格式主要有.JPG、.GIF、.PNG等。这些格式的图像以非结构化数据(无规律、语义不明确)的形式存在，因此其生成的图形在不同分辨率的屏幕上的显示效果不同。此夕卜，由于这些格式的图像不支持图形数据与文字信息的分离存储，存储空间过大，也给搜索引擎检索Web信息带来了一定的难度。因此，基于Web的图形图像的表示、存储与应用，一直是人们研究的热点之一。
[0003]目前，对于图像的半结构化存储主要是依靠二维矢量图形SVG。使用SVG可以在不同分辨率的网页上显示出各种各样高质量的矢量图形，其支持几何、动画、渐变色、滤镜等多种功能。但是SVG本身也有其固有的缺点，例如它不是一种流媒体的图形图像格式，存在图像表示不清晰的缺点，模块设计功能差，提供的指令集有限等。
[0004]由此可见，设计出一种可解决图像表示不清晰、存储空间过大、检索不便等缺点的图像表示技术方案，是目前急需解决的问题。

【发明内容】

[0005]本发明的目的在于提供一种基于XGML的图像半结构化表示方法，其可将非结构化的光栅图像转换为可支持图形数据与文字信息分离存储的半结构化文档，有效克服了现有图像表示不清晰、存储空间过大、检索不便等缺点。
[0006]为了实现上述目的，本发明采用了以下技术方案:
[0007]—种基于XGML的图像半结构化表示方法，其特征在于，它包括步骤:
[0008]定义XGML指令模型为{metadata_descriptor，element_descriptor}，其中:
[0009]1116丨&(1&丨&_(168(31^。1:01'为图元数据描述指令集，1116丨&(1&丨&_(168(31^。1:01'分为两个集合，一个集合为图像语义规则集合semantic_rule，来源于图像的标签和邻域关系，用于描述图像的语义数据，另一个集合为图像内容规则集合contentjule，来源于图像的上下文和视觉特征，用于描述图像的内容数据；616!116111:_(16 8(314口1:01'为图元素描述指令集，element_descriptor分为两个对象，一个对象为基本图形对象basic_graphic，另一个对象为不能使用基本图形对象表达的较复杂形状的复杂图形对象complex_graphic;
[00?0] I)确定待半结构化表示的图像；
[00??] 2)通过计算机自动提取出图像中的语义数据，将语义数据储存入semantic_rule，并且基于用户的视觉感知和主观识别，人工标注出图像中的内容数据，将内容数据储存入content—rule;
[0012]3)依据区域一致性条件，对图像进行区域分裂与合并，形成若干处理后区域，然后各处理后区域分别分解出边缘信息和颜色特征；
[0013]4)处理各处理后区域的边缘信息，各处理后区域分别得到边缘点集合；
[00? 4] 5)对各处理后区域的边缘点集合分别提取边缘特征点来形成边缘特征点集合；
[0015]6)对各处理后区域的边缘特征点集合进行拟合处理，得到代表处理后区域所拥有边缘的线性特征、关键要素，其中:线性特征、关键要素由相应二维坐标表示；
[0016]7)根据各处理后区域的线性特征、颜色特征，判断各处理后区域属于基本图形还是复杂图形，然后将属于基本图形的处理后区域的线性特征、关键要素和颜色特征储存入basiC_graphiC，将属于复杂图形的处理后区域的线性特征、关键要素和颜色特征储存入complex—graphic;
[0017]8)图像以XGML指令模型的形式，被表示成半结构化文档。
[0018]在实际设计时，所述步骤3)中对所述图像进行区域分裂与合并的具体步骤为:
[0019]al)计算所述图像的当前区域的灰度均值，其中:首次执行步骤al)时，当前区域为所述图像的整个区域；
[0020]a2)判断当前区域中各像素点的像素值与当前区域的灰度均值之差的绝对值的最大值是否小于设定阈值:若是，则不再对当前区域进行分裂，反之，将当前区域分裂成四个相邻的区域；
[0021]a3)新分裂出的各区域分别重复执行步骤al)_a2)，直至不存在新分裂出的区域；
[0022]a4)判断相邻区域的灰度均值之差的绝对值是否小于设定差阈值:若是，则相邻区域合并为一个区域，反之，相邻区域不合并；
[0023]a5)执行完步骤a4)后呈现的各区域为所述处理后区域。
[0024]在实际设计时，所述步骤5)中所述边缘特征点的提取步骤包括:
[0025]假设当前边缘点为i，ai为从边缘点1-Ι到边缘点i的角度，ai+i为从边缘点i到边缘点i+Ι的角度，di为ai到ai+1的变化曲率；
[0026]bO)确定待判断的当前边缘点i ;
[0027]bl)判断Iam |是否小于4:若是，贝Ijdi= ai+1-ai |并进入b4)，反之进入b2)；
[0028]b2)判断I ai+1-ai |是否大于4:若是，则di = | ai+1-ai | _8并进入b4)，反之进入b3)；
[0029]b3)令di = 4并进入b4);
[0030]b4)判断I di I是否等于O:若是，则表示当前边缘点i不是边缘特征点，反之进入b5);
[0031]b5)判断I di I是否大于2:若是，则表示当前边缘点i是边缘特征点，记录当前边缘点i的坐标，反之进入b6)；
[0032]b6)判断|di I是否等于I或2:若是，则表示当前边缘点i可能是边缘特征点，记录当前边缘点i的坐标，反之结束。
[0033]在实际设计时，所述步骤6)中对所述处理后区域的边缘特征点集合进行拟合处理包括步骤:
[0034]cI)对所述处理后区域的整个边缘进行如下判断:
[0035]若所述处理后区域的某个边缘部分中的相邻边缘特征点之间的斜率都为一个相同的常数，那么此边缘部分拟合为一个直线作为线性特征；
[0036]若所述处理后区域的某个边缘部分中的相邻边缘特征点之间的斜率各不相同，那么此边缘部分拟合为一个曲线作为线性特征；
[0037]c2)整理构成所述处理后区域的边缘的各个边缘部分的线性特征。
[0038]本发明的优点是:
[0039]本发明基于超图形文本标记语言XGML，提出了图像半结构化的概念，可将现有图像，特别是光栅图像存储为使用XGML指令模型表示的半结构化文档，实现了图形数据与文字信息的分离存储，提高了图像表示的清晰度，极大减小了图像的存储空间，提高了图像的检索速度与效率。
【附图说明】
[0040]图1是本发明的实施流程图。
[0041]图2是说明本发明中的图元数据描述指令集内容的一个图像示意图。
[0042]图3是说明本发明中的图元素描述指令集内容的一个图像示意图。
【具体实施方式】
[0043]本发明基于XGML(超图形文本标记语言)实现。XGML是一种借鉴XML和SVG语法，可将图像存储为具有一定格式和结构的文本指令集合(半结构化体系)，其是一种适合图像半结构化的简洁高效的超图形文本标记语言。
[0044]现阶段，Web中出现大量各式各样的图像类型，例如纹理图像、平滑图像、光栅化矢量图像等。本发明适用于可进行半结构化表示的各种图像，例如光栅化矢量图像。光栅化矢量图像原本为矢量图，被人为处理后转换为二进制的光栅图像，在本发明中，光栅化矢量图像被简称为光栅图像。
[0045]如图1所示，本发明基于XGML的图像半结构化表示方法包括步骤:
[0046]定义XGML指令模型为{metadata_descriptor，element_descriptor}，其中:
[0047]metadata_descriptor为图元

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：袁家政;刘宏哲;邱静;谭智勇;
技术所有人：北京联合大学;
我是此专利的发明人

上一篇：一种无车道线路口驶入驶出车道连接配对的算法
上一篇：一种存储系统的索引数据修复方法和存储系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。