基于xgml的图像半结构化表示方法_3

文档序号：9787570阅读：来源：国知局

e x_gr a P h i c，区域3、4、5、7的线性特征和颜色特征储存入basiC_graphiC，由于区域1-7都不具有曲线，因此都没有关键要素。下面分别列出区域1-7的半结构化表示:
[0090]区域1:“385 176,392 181,308 190,325 189,438 203,423 217,437 226,417226,437 229,422 271,346 287,333 271”(线性特征)
[0091]“25，34，77”(颜色特征)
[0092]区域2:“356 311,368 325,355 334,432 469,447 409,452 427,463 415,475407，453 361，430 340”(线性特征)
[0093]“79，90，94”(颜色特征)
[0094]区域3:“537 22，555 8，566 8，566 22”(线性特征)
[0095]“255，227，99”(颜色特征)
[0096]区域4:“566 444，589 432，627 482，625 504，591 462”(线性特征)
[0097]“77，93，109，，(颜色特征)
[0098]区域5:“196 310,212 315,357 302,249 287”(线性特征)
[0099]“250，222，65”(颜色特征)
[0100]区域6:“295 242,204 242,333 271,337 282,355 334,340 363,333 341,317326，303 287，302 256”(线性特征)
[0101]“76，91，98”(颜色特征)
[0102]区域7:“120 195，138 195，143 209，143 219，137 226”(线性特征)
[0103]“250，222，65”(颜色特征)
[0104]本发明的优点是:
[0105]本发明基于超图形文本标记语言XGML，提出了图像半结构化的概念，可将现有图像，特别是光栅图像存储为使用XGML指令模型表示的半结构化文档，实现了图形数据与文字信息的分离存储，提高了图像表示的清晰度，极大减小了图像的存储空间，提高了图像的检索速度与效率。
[0106]以上所述是本发明较佳实施例及其所运用的技术原理，对于本领域的技术人员来说，在不背离本发明的精神和范围的情况下，任何基于本发明技术方案基础上的等效变换、简单替换等显而易见的改变，均属于本发明保护范围之内。
【主权项】
1.一种基于XGML的图像半结构化表示方法，其特征在于，它包括步骤: 定义XGML指令模型为{metadata_descriptor，element_descriptor}，其中: metadata_descriptor为图元数据描述指令集，metadata_descriptor分为两个集合，一个集合为图像语义规则集合semantiC_rUle，来源于图像的标签和邻域关系，用于描述图像的语义数据，另一个集合为图像内容规则集合content_rule，来源于图像的上下文和视觉特征，用于描述图像的内容数据；element_descriptor为图元素描述指令集，element—descriptor分为两个对象，一个对象为基本图形对象basic_graphic，另一个对象为不能使用基本图形对象表达的较复杂形状的复杂图形对象complex_graphic; 1)确定待半结构化表示的图像； 2)通过计算机自动提取出图像中的语义数据，将语义数据储存入semanticjule，并且基于用户的视觉感知和主观识别，人工标注出图像中的内容数据，将内容数据储存入content_rule； 3)依据区域一致性条件，对图像进行区域分裂与合并，形成若干处理后区域，然后各处理后区域分别分解出边缘信息和颜色特征； 4)处理各处理后区域的边缘信息，各处理后区域分别得到边缘点集合； 5)对各处理后区域的边缘点集合分别提取边缘特征点来形成边缘特征点集合； 6)对各处理后区域的边缘特征点集合进行拟合处理，得到代表处理后区域所拥有边缘的线性特征、关键要素，其中:线性特征、关键要素由相应二维坐标表示； 7)根据各处理后区域的线性特征、颜色特征，判断各处理后区域属于基本图形还是复杂图形，然后将属于基本图形的处理后区域的线性特征、关键要素和颜色特征储存入basiC_graphiC，将属于复杂图形的处理后区域的线性特征、关键要素和颜色特征储存入complex_graphic ； 8)图像以XGML指令模型的形式，被表示成半结构化文档。2.如权利要求1所述的基于XGML的图像半结构化表示方法，其特征在于: 所述步骤3)中对所述图像进行区域分裂与合并的具体步骤为: al)计算所述图像的当前区域的灰度均值，其中:首次执行步骤al)时，当前区域为所述图像的整个区域； a2)判断当前区域中各像素点的像素值与当前区域的灰度均值之差的绝对值的最大值是否小于设定阈值:若是，则不再对当前区域进行分裂，反之，将当前区域分裂成四个相邻的区域； a3)新分裂出的各区域分别重复执行步骤al)_a2)，直至不存在新分裂出的区域；a4)判断相邻区域的灰度均值之差的绝对值是否小于设定差阈值:若是，则相邻区域合并为一个区域，反之，相邻区域不合并； a5)执行完步骤a4)后呈现的各区域为所述处理后区域。3.如权利要求1所述的基于XGML的图像半结构化表示方法，其特征在于: 所述步骤5)中所述边缘特征点的提取步骤包括: 假设当前边缘点为i，ai为从边缘点1-1到边缘点i的角度，ai+i为从边缘点i到边缘点i+1的角度，di为ai到ai+1的变化曲率；bO)确定待判断的当前边缘点i ; bl)判断I ai+1-ai |是否小于4:若是，贝Ijdi= ai+1-ai |并进入b4)，反之进入b2): b2)判断I ai+1-ai |是否大于4:若是，贝Ijdi= ai+1-ai | _8并进入b4)，反之进入b3); b3)令di = 4并进入b4)； b4)判断I di I是否等于O:若是，则表示当前边缘点i不是边缘特征点，反之进入b5)；b5)判断I di I是否大于2:若是，则表示当前边缘点i是边缘特征点，记录当前边缘点i的坐标，反之进入b6)； b6)判断I di I是否等于I或2:若是，则表示当前边缘点i可能是边缘特征点，记录当前边缘点i的坐标，反之结束。4.如权利要求1所述的基于XGML的图像半结构化表示方法，其特征在于: 所述步骤6)中对所述处理后区域的边缘特征点集合进行拟合处理包括步骤: Cl)对所述处理后区域的整个边缘进行如下判断: 若所述处理后区域的某个边缘部分中的相邻边缘特征点之间的斜率都为一个相同的常数，那么此边缘部分拟合为一个直线作为线性特征；若所述处理后区域的某个边缘部分中的相邻边缘特征点之间的斜率各不相同，那么此边缘部分拟合为一个曲线作为线性特征； c2)整理构成所述处理后区域的边缘的各个边缘部分的线性特征。5.如权利要求1至4中任一项所述的基于XGML的图像半结构化表示方法，其特征在于: 所述图像为光栅图像。
【专利摘要】本发明公开了一种基于XGML的图像半结构化表示方法，包括：确定待半结构化表示的图像；提取语义数据并存入semantic_rule，标注出内容数据并存入content_rule；对图像进行区域分裂与合并，对得到的各处理后区域分解出边缘信息和颜色特征；处理边缘信息，得到边缘点集合；对边缘点集合提取出边缘特征点；对各处理后区域的边缘特征点拟合，得到线性特征、关键要素；基于基本图形与复杂图形的判断，将各线性特征、关键要素和颜色特征存入basic_graphic或complex_graphic。本发明可将非结构化的光栅图像转换为可支持图形数据与文字信息分离存储的半结构化文档，有效克服了现有图像表示不清晰、存储空间过大、检索不便等缺点。
【IPC分类】G06F17/30
【公开号】CN105550363
【申请号】CN201610007341
【发明人】袁家政, 刘宏哲, 邱静, 谭智勇
【申请人】北京联合大学
【公开日】2016年5月4日
【申请日】2016年1月6日

完整全部详细技术资料下载

当前第3页1 2 3