一种对平面媒体图像进行适应屏幕阅读的重排方法

文档序号:6369750阅读:136来源:国知局
专利名称:一种对平面媒体图像进行适应屏幕阅读的重排方法
技术领域
本发明属于信息技术领域,尤其是ー种对平面媒体图像进行适应屏幕阅读的重排方法。
背景技术
随着互联网、数字影像技术的迅猛发展,数字媒体得以广泛传播,随之而来的是人们对电子阅读方式、特别是跨越不同设备之间阅读方式的需求越来越大。人们普遍希望能够使用手持移动设备阅读各种来源、版式不同的文章,例如图像式PDF或者来源于摄像头拍摄的电子书籍。由于手持移动设备通常只有3-4吋的屏幕可供显示,因此,手持移动设备在阅读图像式PDF或者来源于摄像头拍摄的电子书籍时,往往会产生屏幕尺寸不能满足图像大小的情况,如果缩放,文字太小,看不清楚;如果不缩放,则需要反复拖动图像才能阅读,操作麻烦;而相对于分辨率较高的大屏幕显示设备,例如,微型计算机的高分辨率显示 器、电视、投影等设备,会出现相反的情況。针对上述问题,目前主要采用OCR技术对文字进行识别来解決,但是采用OCR技术存在的问题是(I)识别率不完美,容易出错,给阅读带来不便;(2)含有插图的平面媒体图像需要去除插图,否则影响识别;(3)图像质量差、噪声多、影响识别;(4)算法复杂度高,在移动平台上费时多;(5)适用的字体过于局限,对于华文彩云、华文行楷很难识别。另外,手持移动设备在阅读漫画时存在如下问题虽然手持移动设备上安装有漫画阅读软件,但是这些软件相对封闭,不同软件用自己的独有格式,而且只能阅读软件开发者已经制作好的漫画,其阅读范围有限;即使有部分开放的软件,也需要用户自行分割漫画,耗费精力,并需要额外的学习软件使用。

发明内容
本发明的目的在于克服现有技术的不足,提供ー种对平面媒体图像进行适应目标屏幕阅读的重排方法,通过对平面媒体图像进行分割以实现版面的重排,解决了手持移动设备对于平面媒体图像阅读不便以及漫画阅读问题。本发明解决其技术问题是采取以下技术方案实现的ー种对平面媒体图像进行适应屏幕阅读的重排方法,包括以下步骤(I)对含有噪声、水印或傾斜度的平面媒体图像分别进行噪声去除、水印去除或倾斜度校正预处理;(2)对图文混排的平面媒体图像进行图文分离处理;(3)对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理;(4)根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为目标屏幕宽度的图像。而且,所述的平面媒体图像包括摄像头采集的图像或者从其他方式传入的图像。
而且,所述步骤(I)的噪声去除方法为首先对光照不均的图像采取背景减除、小波变换实现ニ值化,然后利用高斯平滑、中值滤波等去除小噪点。而且,所述步骤(I)的水印去除预处理包括灰度处理、usm锐化和ニ值化处理步骤。而且,所述步骤(I)的傾斜度校正采用基于边缘检测的傾斜度校正算法实现,其处理步骤为通过提取倾斜图像边界像素点的坐标,利用最小二乗法对边界直线进行拟合,求出边界对于图像的倾斜角,进而对图像进行旋转变换,对原始倾斜的图像进行校正。而且,所述步骤(2)的图文分离处理方法为利用图像和文字的连通域大小的显著区别,提取出连通域较大的图像,剩余较小的文字、标点。而且,所述步骤(4)对正文图像进行分割重排处理包括多行文本正文图像分割重 排处理方法和漫画正文图像分割重排处理方法。而且,所述的多行文本正文图像分割重排处理方法包括以下步骤(I)采用下式计算行高RowHeight :RowHeight = RowEnd-RowBeg上式中,RowBeg为第一个不全为白色像素的行,RowEnd为下ー个不全为白像素的行;(2)以行高RowHeight为单行文字图像的高,把多行文字图像拼接成单行文字的图像;(3)设目标屏幕宽度为ScreenWide,直接找到单行文字图像的第ScreenWide列像素处,检验该列是否全为白像素,若是,则认为该列位于字与字之间,从该列像素处分割,否贝1J,对屏幕宽度ScreenWide处左侧的-列进行扫描,按上述方法循环下去,直到最后剩余的像素宽度小于等于屏幕宽度ScreenWide,扫描结束,从而实现对多行文本正文图像的分割重排功能。而且,所述的漫画正文图像分割重排处理方法是通过自动识别边框并将其分割为单幅画面实现对漫画正文图像的分割重排功能。而且,所述步骤(4)的目标屏幕为比原平面媒体图像分辨率低的手持移动设备,或者为屏幕分辨率比原平面媒体图像分辨率高的显示设备上;对正文图像进行分割重排处理适用于将小分辨率平面媒体图像在相对较大的设备上显示或将大分辨率平面媒体图像在相对较小设备上显示。本发明的优点和积极效果是I、本方法根据目标屏幕分辨率对平面媒体正文图像进行分割重排处理,对于比原图片分辨率小的手持移动设备,通过分割实现每行的文字数減少;对于原图分辨率大的显示设备,通过合并行再重新切分实现每行文字数増加,整个处理过程中不需要对文字进行识别即可满足各种分辨率显示设备的自适应显示需要,避免OCR技术带来的识别出错问题。2、本方法通过对漫画自动识别边框将漫画分割成单幅漫画,达到了适应屏幕阅读的目的,不需要另外安装漫画软件即可直接阅读,解决了手持移动设备阅读漫画的问题。


图I是本发明的对多行文本进行分割重排处理的流程图;图2是行闻计算方法不意图;图3是多行文本正文图像示意图;图4是多行文本正文图像处理结果示意图;图5是漫画正文图像不意图;图6是漫画正文图像处理结果示意图。
具体实施例方式以下结合附图对本发明实施例做进ー步详述ー种对平面媒体图像进行适应屏幕阅读的重排方法,是通过对平面媒体图像进行版面分块和文本的分割以实现版面的重排,以适应对于比原图片分辨率小的手持移动设备以及对于原图分辨率大的显示设备的现实需要。所谓的平面媒体图像,是指平面媒体经过转化,其内容已经不再以有序的方式存在,而是以图像形式存在,媒体内包含的文字已经无法编辑,也无法被机器设备识别而只能通过人来阅读,上述平面媒体图像既包括了带插图的电子读物,也包括没有文字的漫画读物,其中的文字方向可以是横向或者竖向排版,所使用的语言可以使汉语和英语等。下面对本发明进行详细说明—种对平面媒体图像进行适应屏幕阅读的重排方法,包括以下步骤步骤I :对含有噪声、水印或傾斜度的平面媒体图像分别进行噪声去除、水印去除或傾斜度校正预处理由于待重新排版的平面媒体图像包括手持移动设备通过摄像头采集的图像或者从其他方式传入的图像,这些图像可能会存在一定程度的倾斜和噪声,部分文档为了版权保护加有水印,因此,在本步骤中,需要对这些原始图像进行傾斜度校正、噪声去除、水印去除等预处理工作,以得到理想图像便于后续的处理。噪声去除是图像处理过程中的ー个重要环节,其结果直接影响到图像质量和特征提取的精确性。本噪声去除方法结合多种算法对图像进行噪声去除首先对光照不均的图像采取背景减除、小波变换实现ニ值化,然后利用高斯平滑、中值滤波等去除小噪点。水印去除预处理包括灰度处理、usm锐化和ニ值化处理步骤实现。傾斜度校正采用基于边缘检测的傾斜度校正算法实现,其通过提取倾斜图像边界像素点的坐标,利用最小二乗法对边界直线进行拟合,求出边界对于图像的倾斜角,进而对图像进行旋转变换,对原始倾斜的图像进行校正。步骤2 :对图文混排的平面媒体图像进行图文分离处理图文分离采取相对完美的算法,利用图像和文字的连通域大小的显著区别,提取出连通域较大的图像,剩余较小的文字、标点。步骤3 :对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理由于页眉页脚和标题在版面中处于特殊位置,和正文有显著区別,通过简单的算法就可以剔除。步骤4:根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为屏幕宽度的图像,从而达到适应屏幕的效果。本步骤是对正文图像进行分割重排处理,正文图像既可以是由多行文本构成的,也可以是由漫画构成的。因此,对于正文图像处理包括多行文本正文图像分割重排处理方法和漫画正文图像分割重排处理方法,下面分别进行说明多行文本正文图像分割重排处理是采用基于前后检测的方法实现,处理时纵向以行为单位切分,横向通常多个字同时分割,必要时以字或特殊符号为最小分割単位,从而能够明显提高正文分割的正确率。如图I所示,多行文本正文图像分割重排处理方法,包括以下步骤I、计算行高
根据汉语书写习惯,多行文本的汉字行距是相等的。如图2所示,在多行文档图像中,从第一行像素开始横向扫描,将第一个不全为白色像素的行记为RowBeg,继续扫描至下一个全为白像素的行记为RowMid,然后扫描至下ー个不全为白像素的行记为RowEnd。因此,行高RowHeight计算的公式如下RowHe i ght = RowEnd-RowBeg这样算出的行高包括字高和行距两部分。2、以行高RowHeight为单行文字图像的高,把多行文字图像拼接成单行文字的图像。3、设目标屏幕宽度为ScreenWide,直接找到单行文字图像的第ScreenWide列像素处,检验该列是否全为白像素,若是,则认为该列位于字与字之间,从该列像素处分割,否贝丨J,对屏幕宽度ScreenWide处左侧的一列进行扫描。按上述方法循环下去,直到最后剩余的像素宽度小于等于屏幕宽度ScreenWide,扫描结束。通过上述步骤实现对多行文本正文图像的分割重排处理。图3为处理前的正文图像,图4是处理后在目标屏幕上显示的效果。漫画分割重排处理通过自动识别边框的方法来实现的,其处理结果是将漫画分割为单幅画面在手持移动设备上进行显示。图5为处理前漫画的内容,图6是将漫画分割为单幅画面在目标屏幕上显示的效果。通过上述步骤即可将待处理平面媒体图像分割成宽度为屏幕宽度的图像,从而达到适应不同屏幕的显示效果。需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明并不限于具体实施方式
中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。
权利要求
1.一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于包括以下步骤 (1)对含有噪声、水印或倾斜度的平面媒体图像分别进行噪声去除、水印去除或倾斜度校正预处理; (2)对图文混排的平面媒体图像进行图文分离处理; (3)对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理; (4)根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为目标屏幕宽度的图像。
2.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述的平面媒体图像包括摄像头采集的图像或者从其他方式传入的图像。
3.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述步骤(I)的噪声去除方法为首先对光照不均的图像采取背景减除、小波变换实现二值化,然后利用高斯平滑、中值滤波等去除小噪点。
4.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述步骤(I)的水印去除预处理包括灰度处理、usm锐化和二值化处理步骤。
5.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述步骤(I)的倾斜度校正采用基于边缘检测的倾斜度校正算法实现,其处理步骤为通过提取倾斜图像边界像素点的坐标,利用最小二乘法对边界直线进行拟合,求出边界对于图像的倾斜角,进而对图像进行旋转变换,对原始倾斜的图像进行校正。
6.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述步骤(2)的图文分离处理方法为利用图像和文字的连通域大小的显著区别,提取出连通域较大的图像,剩余较小的文字、标点。
7.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述步骤(4)对正文图像进行分割重排处理包括多行文本正文图像分割重排处理方法和漫画正文图像分割重排处理方法。
8.根据权利要求7所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述的多行文本正文图像分割重排处理方法包括以下步骤 (1)采用下式计算行高RowHeightRowHeight = RowEnd-RowBeg 上式中,RowBeg为第一个不全为白色像素的行,RowEnd为下一个不全为白像素的行; (2)以行高RowHeight为单行文字图像的高,把多行文字图像拼接成单行文字的图像; (3)设目标屏幕宽度为ScreenWide,直接找到单行文字图像的第ScreenWide列像素处,检验该列是否全为白像素,若是,则认为该列位于字与字之间,从该列像素处分割,否贝丨J,对屏幕宽度ScreenWide处左侧的一列进行扫描,按上述方法循环下去,直到最后剩余的像素宽度小于等于屏幕宽度ScreenWide,扫描结束,从而实现对多行文本正文图像的分割重排功能。
9.根据权利要求7所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述的漫画正文图像分割重排处理方法是通过自动识别边框并将其分割为单幅画面实现对漫画正文图像的分割重排功能。
10.根据权利要求I至9任一项所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述步骤(4)的目标屏幕为比原平面媒体图像分辨率低的手持移动设备,或者为屏幕分辨率比原平面媒体图像分辨率高的显示设备上;对正文图像进行分割重排处理适用于将小分辨率平面媒体图像在相对较大的设备上显示或将大分辨率平面媒体图像在相 对较小设备上显示。
全文摘要
本发明涉及一种对平面媒体图像进行适应屏幕阅读的重排方法,包括以下步骤(1)对含有噪声、水印或倾斜度的平面媒体图像分别进行噪声去除、水印去除或倾斜度校正预处理;(2)对图文混排的平面媒体图像进行图文分离处理;(3)对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理;(4)根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为屏幕宽度的图像。本发明设计合理,不需要对文字进行识别即可满足不同分辨率的手持移动设备或大屏幕显示设备自适应显示的需要,同时通过对漫画自动识别边框将漫画分割成单幅漫画,解决了手持移动设备阅读漫画的问题,具有准确性高、方法简单、效率高等特点。
文档编号G06T11/60GK102682457SQ20121015215
公开日2012年9月19日 申请日期2012年5月17日 优先权日2012年5月17日
发明者刘鑫鑫, 姜洲, 张敬威, 张金, 杨子健, 江亚庆, 罗俊 申请人:南开大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1