一种漫画图像版面的识别方法和自动识别系统的制作方法_3

文档序号:9766206阅读:来源:国知局
集合的平 均像素值差小于设定值(如60),那么将准备捜索的像素点加入当前像素点集合,否则新建 一个像素点集合,将准备捜索的像素点加入新建的集合。重复捜索过程,直至漫画图像中所 有的像素点都被捜索过。捜索结束后,找到分布范围最广(区域的矩形包围框面积最大)的 像素点集合(即连通区域),将其当作背景区域,将其他所有区域当作前景区域,并将漫画图 像二值化为黑白二值图(背景为黑色,前景为白色)。
[0069] 2)轮廓检测过程
[0070] 在进行轮廓检测前,可选对二值图进行预处理,对二值化的图像进行一次形态学 腐蚀操作一次形态学膨胀操作。接着使用文献"Suzuki,S.and Abe, K. ,Topological Structural Analysis of Digitized Binary Images by Border Following.CVGIP 301, PP 32-46(1985)"提出的考察二值化图像的边界包围关系的方法,对二值化图像的外轮廓 进行追踪。得到轮廓之后,使用道格拉斯-普克算法(参数epsilon设为7.0)对轮廓进行多边 形拟合。该算法迭代地将曲线近似表示为一系列点,并减少点的数量。如果某个轮廓能够拟 合出四边形,那么跳过直线段检测和分镜查找模块,直接送到多边形验证模块。本实施例中 使用计算机自动筛选来验证多边形,设置分辨率约束、面积约束和边长约束;具体是:分辨 率约束即多边形的长宽比必须在1: 20到20:1之间,面积约束即多边形的面积至少占整幅漫 画页面的0.0015倍,边长约束即多边形的每一条边长度至少为25像素。如果通过多边形验 证,那么认为运个拟合出的四边形是一个分镜。
[0071] 3)直线段检测过程
[0072] 对于每一个没有通过四边形拟合的轮廓,逐个提取轮廓中所包含的直线段。可设 定一个固定阔值,当长度小于该阔值,从曲线上提取出的直线段将被抛弃;因为分镜的边线 不可能过短也不可能处于曲线上,所W长度小于漫画页面长度1/32的直线段,W及从曲线 上提取出的直线段将被抛弃。使用直线段的左端点坐标(Xl,yl)和右端点坐标(x2,y2)表示 一条直线段。坐标空间定义为:漫画图像页面左上角点作为坐标原点,X轴方向从左到右增 加,Y轴方向从上到下增加。
[0073] 4)分镜查找过程
[0074] 得到被识别出的直线段之后,通过多边形形成模块对于运些直线段进行拼接,成 为完整的四边形,运些四边形都是可能的漫画图像分镜。具体拼接方法为:将直线段按照斜 率分为两类,一类是水平直线段,另一类是垂直直线段,接着选取两条水平直线段和两条垂 直直线段,将他们延长使水平直线段与垂直直线段相交,两条垂直和两条水平的直线段会 有四个交点,形成一个四边形。在形成四边形时,并不是所有的线段都可W组合。如果两条 直线段的交点处于其中一条直线段内部,此时形成了T形交叉,运样的交叉是不允许的,仅 仅允许L形交叉。
[0075] 每个组合直线段形成的四边形都会送到多边形验证模块进行校验,校验之后,分 镜查找模块进一步去除互相重合面积超过95%的分镜,只保留一份副本,并且去除与已有 分镜重合面积超过20 %的四边形,不保留副本。
[0076] 接下来,本发明根据过滤后的四边形(多个)和同一图像中已有的分镜构建图模 型,每一个四边形或者分镜(本小节下面统称为四边形)都是图模型中的一个节点。针对过 滤后的多个四边形,如果两两四边形有面积重合,在两个节点间连一条边,表明运两个节点 互斥;如果两两四边形没有面积重合,并且两两相邻,在两个节点间连一条边,表明运两个 节点相邻;由此形成图结构。根据形成的图结构,本发明定义能量函数E(y;x,w)如式1:
[0077] E(y;x,w)=I:peP〇(i)(yP,x;w)+I:(p'q)eN〇(2)(yP,yq,x;w)(式 1)
[0078] 其中,E表示总能量,y表示节点的标记值集合,yP表示节点P的标记值,表示节点q 的标记值,X表示节点的特征集合,W是能量函数的参数,P EP表示P是节点集合P的一个节 点,(p,q)EN表示节点p和q在邻域定义N中相邻。(6>W(yP,x;w)表示一元势能,对于未确定 为分镜的四边形,其取值为100(l-yP)xP+100yP(l-xP),对于已确定为分镜的四边形,其取值 为(1-yP) ? INF,INF表示无穷大。(6W(yP,yq,x;w)表示二元势能。本发明中使用四边形的紧 凑性度量作为特征,紧凑性即实际构成分镜的直线段长度之和与分镜边框周长的比例,取 值范围在O~1.0之间,考虑实际应用的需求也可W扩充特征向量。节点的标记值yP取值为O 或1,〇表示该节点(四边形)不是分镜,1表示该节点(四边形)是分镜。二元势能中的N包含了 两种不同的邻域定义,一种是互斥一种是相邻,如果两个节点互斥,二元势能如下计算: t (V| / 、 O 二-〇, 二 1 ,
[0079] 如一;(.V 护,八龙;W)二^ . ^ ,.g n 试如 0 V 二 Kr 二 0 INF i,P 二 ^ 二 1
[0080] 如果两个节点相邻,二元势能如下计算: 0 类p = v'' = 0
[0081] &P)(v',vg,x;w) = <5 y 试;3) 5 = 1, // = 0 4 JP = V"二 L > 一 -
[0082] 构造完成能量函数之后,需要使用图模型理论中的推断算法最小化上述能量函 数,得到最优标记值集合。常用的推断方法包括Gra地化ts图割算法、置信传播算法和Movemaking 算法 ,本发明的能量函数是非 凸函数 ,不满足使用GraphCuts 图 割算法要求二元势能 为度量或者半度量的前提条件,所W不能使用Gra地化ts算法中的a-e邱ansion和a-0-swap 求解。本发明实施例使用Loopy Belief Propagation!;LBP,循环置信传播)算法、Iterated Conditional Modes(ICM,迭代条件模式)算法和化UteForce(BF,暴力捜索)算法进行求解。 循环置信传播算法较为高效,迭代条件模式算法保证能量函数随着迭代次数增加必定收敛 到某一个局部最小能量值,而暴力捜索算法保证找到全局最小能量值。本发明可W在不同 的应用场景中按照使用需求来选取推断算法。
[0083] 最后,将能量函数的解(即标记值集合)对应到四边形中,将标记值为1的四边形加 入已识别的分镜中,其余标记为0的四边形将被抛弃。四边形识别结果由其四个顶点表示, 左下角、左上角、右上角、右下角依次为点1、点2、点3和点4。
[0084] (5)多边形验证模块为可选模块。默认情况启用该模块进行多边形验证。本实施例 中使用计算机自动筛选。
[0085] (6)用户U保存并且确认多边形识别结果(本实施例为四边形识别,四边形识别结 果由其四个顶点表示,左下角、左上角、右上角、右下角依次为点1、点2、点3和点4)之后,将 作为阅读顺序检测模块的输入。阅读顺序检测模块根据多边形之间的几何位置关系判断其 阅读顺序。分镜阅读顺序的识别将输入的分镜进行排序,排序的核屯、是如何判定任意两个 分镜之间的阅读顺序。具体做法是判定两个分镜横向和纵向的交叠情况:1.如果两个分镜 在竖直方向没有交叠,则分镜中屯、点偏上的阅读顺序靠前;2.如果两个分镜在竖直方向有 交叠水平方向无交叠,对于日系漫画,分镜中屯、点偏右的阅读顺序靠前,对于欧美W及大陆 港澳台漫画则阅读顺序靠后;3.如果两个分镜水平竖直方向均有交叠,则两分镜相邻处必 有一对平行的直线,如果运两直线段与X轴夹角小于45°则同情况2,否则同情况1。
[0086] (7)最终,客户端软件将漫画版面分析结果(包括源图像,识别出的分镜的几何位 置W及阅读顺序)返回给用户。
[0087] 本发明还提供实现上述漫画图像版面的识别方法的漫画图像版面自动识别系统, 包括分镜识别与提取模块和后处理模块;所述分镜识别与提取模块包括前景背景分割模 块、轮廓检测模块、直线段检测模块和分镜查找模块;具体地,本发明的各个模块主要实现 W下功能:
[0088] 前景背景分割模块,该模块可W寻找漫画页面的背景区域,并将前景和背景区域 二值化,为后续模块提供预处理。需要注意的是漫画图像的背景不一定是纯白色,也可能是 其他颜色,所W前景背景分割模块对于本发明中的系统是不可或缺的。
[0089] 轮廓检测模块,该模块对二值化的图像进行轮廓追踪(根据文献"Suzuki,S. and Abe,K.,Topological Structural Analysis of Digitized Binary Images by Border Following.CVGIP 301,pp32-46(1985)"提出的算法)。得到轮廓之后,使用道格拉斯-普克 算法对轮廓进行多边形拟合,如果某个轮廓能够拟合出四边形,那么跳过直线段检测和分 镜查找模块,直接送到多边形验证模块。如果通过多边形验证,那么认为运个拟合出的四边 形是一个分镜。
[0090] 直线段检测模块:识别漫画图像中的直线段,并且记录运些直线段的位置信息。
[0091] 分镜查找模块:该模块包括两个子模块多边形形成模块(四边形形成模块)和构造 求解能量函数模块。多边形形成模块根据直线段检测模块检测的结果,对直线段进行拼接、 形成若干个四边形。运个过程会产生大量的四边形,需要合并重叠程度过高(比如高于 95%)的四边形。构造求解能量函数模块根据形成的若干多边形构造能量函数,使用优化算 法优化能量函数,判断形成的多边形是否是分镜。
[0092] 后处理模块:该模块包括两个子模块,分镜补全模块和阅读顺序
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1