图像形成设备、图像形成设备的扫描图像校正方法以及非暂时性计算机可读记录介质与流程

文档序号:17816345发布日期:2019-06-05 21:44阅读:147来源:国知局
图像形成设备、图像形成设备的扫描图像校正方法以及非暂时性计算机可读记录介质与流程

与本公开一致的设备和方法涉及一种图像形成设备、图像形成设备的扫描图像校正方法以及非暂时性计算机可读记录介质,并且更具体地,涉及一种能够对在执行扫描时可能发生的图像质量的劣化进行抑制的图像形成设备、图像形成设备的扫描图像校正方法以及非暂时性计算机可读记录介质。



背景技术:

随着图像形成设备、扫描仪等的普及,在扫描文档或者复印文档的情况下,将扫描图像校正为具有用户所期望的形式的技术的必要性已经增加。

传统上,已经提出了对扫描图像中的倾斜进行校正的各种方法。然而,在难以检测到文档的边界的情况下,存在可能无法准确地校正倾斜的问题。此外,在分析文档的全部内容的情况下,存在复杂度过度增加的问题。此外,存在由于对倾斜的校正而导致文档的内容被切掉的问题。

此外,还存在这样的问题:根据每种语言的特征或段落的类型,文档的方向可能被确定为彼此不同。此外,在扫描诸如书的厚文档的情况下,没有从扫描图像提取边界的技术,使得还存在书的内容被切掉的问题。



技术实现要素:

技术问题

本公开提供一种能够校正扫描文件中的倾斜、调整文档方向以及校正文档的轮廓边界表面的图像形成设备、图像形成设备的扫描图像校正方法以及非暂时性计算机可读记录介质。

技术方案

根据本公开的示例,一种图像形成设备包括:扫描单元,用于扫描文档,以生成扫描图像;以及处理器,用于执行以下操作:检测所述扫描图像的倾斜角度,基于所述扫描图像中的内容的位置来确定参考点,以及使所述扫描图像围绕确定的参考点旋转,以对所述倾斜角度进行校正。

所述处理器可从所述扫描图像中检测所述文档的边界,并且基于检测到的边界来检测所述扫描图像的倾斜角度。

当未检测到所述文档的边界时,所述处理器可检测所述扫描图像中的内容,并且基于检测到的内容的梯度来检测所述扫描图像的倾斜角度。

所述处理器可使用在所述扫描图像中包括的字符串的梯度、图表的线的梯度和视频边缘的梯度中的至少一者来检测所述内容的梯度。

所述图像形成设备还可包括用于显示屏幕和接收用户输入的输入/输出单元,其中,所述处理器控制所述输入/输出单元显示用户界面,通过所述用户界面选择用于检测所述扫描图像的倾斜角度的多种方法中的一种方法,并且所述处理器通过根据用于选择所述多种方法中的一种方法的用户输入而选择的方法来检测所述扫描图像的倾斜角度。

所述多种方法可包括:通过检测所述文档的边界来检测所述倾斜角度的第一方法、通过检测所述扫描图像中的内容来检测所述倾斜角度的第二方法以及当未检测到所述倾斜角度时执行所述第一方法和所述第二方法的第三方法。

所述扫描图像可包括多个内容,并且所述处理器可确定所述多个内容中的每个内容的大小和位置,根据所述多个内容中的每个内容的大小向所述多个内容中的每个内容的位置分配权重,并且基于分配了权重的所述多个内容中的每个内容的位置来确定所述参考点。

所述处理器可检测所述扫描图像中的多个文本区域,并且基于所述多个文本区域中的每个文本区域的字符串方向来确定所述扫描图像的页面方向。

所述处理器可检测具有预定文本大小的文本区域。

所述处理器可从所述文本区域的字符串方向检测所需的旋转量,并且当检测到的量大于预定值时,使所述扫描图像沿确定的所述扫描图像的页面方向旋转。

根据本公开的另一示例,一种图像形成设备的扫描图像校正方法包括:通过扫描文档来生成扫描图像;检测所述扫描图像的倾斜角度;基于所述扫描图像中的内容的位置来确定参考点;以及使所述扫描图像围绕确定的参考点旋转,以对所述倾斜角度进行校正。

检测所述扫描图像的倾斜角度的步骤可包括:从所述扫描图像中检测所述文档的边界;以及基于检测到的边界来检测所述扫描图像的倾斜角度。

检测所述扫描图像的倾斜角度的步骤还可包括:当未检测到所述文档的边界时,检测所述扫描图像中的内容,并且基于检测到的内容的梯度来检测所述扫描图像的倾斜角度。

在检测所述扫描图像的倾斜角度时,可使用在所述扫描图像中包括的字符串的梯度、图表的线的梯度和视频边缘的梯度中的至少一者来检测所述内容的梯度。

所述扫描图像校正方法还可包括:显示用户界面,通过所述用户界面选择用于检测所述扫描图像的倾斜角度的多种方法中的一种方法,其中,在检测所述扫描图像的倾斜角度时,通过根据用于选择所述多种方法中的一种方法的用户输入而选择的方法来检测所述扫描图像的倾斜角度。

所述多种方法可包括:通过检测所述文档的边界来检测所述倾斜角度的第一方法、通过检测所述扫描图像中的内容来检测所述倾斜角度的第二方法以及当未检测到所述倾斜角度时执行所述第一方法和所述第二方法的第三方法。

所述扫描图像可包括多个内容,并且确定参考点的步骤可包括:确定所述多个内容中的每个内容的大小和位置;根据所述多个内容中的每个内容的大小向所述多个内容中的每个内容的位置分配权重;以及基于分配了权重的所述多个内容中的每个内容的位置来确定所述参考点。

所述扫描图像校正方法还可包括:检测所述扫描图像中的多个文本区域以及基于所述多个文本区域中的每个文本区域的字符串方向来确定所述扫描图像的页面方向。

所述扫描图像校正方法还可包括:从所述文本区域的字符串方向检测出所需的旋转量;以及当检测到的量大于预定值时,使所述扫描图像沿确定的所述扫描图像的页面方向旋转。

根据本公开的另一示例,一种非暂时性计算机可读记录介质包括用于执行图像形成设备的扫描图像校正方法的程序,所述扫描图像校正方法包括:通过扫描文档来生成扫描图像;检测所述扫描图像的倾斜角度;基于所述扫描图像中的内容的位置确定参考点;以及使所述扫描图像围绕确定的参考点旋转,以对所述倾斜角度进行校正。

有益效果

如以上所阐述的,根据本公开的各种示例,可在不产生内容丢失的情况下对扫描图像中的倾斜进行校正,并且可对文档的方向和轮廓边界进行校正。

附图说明

图1是用于描述根据本公开的示例的图像形成设备的组件的示意性框图。

图2是用于描述根据本公开的示例的图像形成设备的组件的框图。

图3是示出了可通过检测文档的边界来检测倾斜角度的情况的示例图。

图4是示出了未检测到文档的边界的情况的示例图。

图5a至图5c是用于描述确定用于对倾斜角度进行校正的旋转参考点的处理的示例图。

图6是用于描述在存在多个内容的情况下确定旋转参考点的处理的示例图。

图7a至图7c是用于描述确定扫描图像的方向的处理的示例图。

图8至图11是用于描述根据本公开的各个示例的扫描图像校正方法的流程图。

图12a和图12b是用于描述在未检测到文档的边界线的情况下的校正方法的示例图。

具体实施方式

在下文中,将参照附图详细地描述本公开的示例。在描述本公开时,当确定针对与本公开相关的公知的功能或配置的详细描述会不必要地使本公开的要点模糊时,将省略针对与本公开相关的公知的功能或配置的详细描述。此外,下面描述的术语是考虑到本公开中的功能来定义的,并且可根据用户、操作者、实践等按照不同的方式解释。因此,应基于整个说明书的内容来定义这些术语。

包括诸如“第一”、“第二”等序数的术语可用于描述各种组件。然而,这些组件不受这些术语限制。所述术语仅用于将一个组件与另一组件区分开。例如,在不脱离本公开的范围的情况下,“第一”组件可被命名为“第二”组件,并且“第二”组件也可被类似地命名为“第一”组件。术语“和/或”包括多个相关项的组合或多个相关项中的任意一个。

说明书中使用的术语用于描述示例,而不意在约束和/或限制本公开。除非上下文另外明确地指出,否则单数形式意在包括复数形式。将进一步理解的是,说明书中使用的术语“包括”或“具有”指定说明书中提及的特征、数字、步骤、操作、组件、部件或它们的组合的存在,但不排除一个或更多个其它特征、数字、步骤、操作、组件、部件或它们的组合的存在或添加。

在说明书中,“图像形成作业”可指代诸如图像的形成、图像文件的创建/存储/发送等的与图像相关的各种作业(例如,打印、扫描或传真),并且“作业”不仅可指代图像形成作业,还可包括执行图像形成作业所需的一系列处理。

此外,“图像形成设备”指代将在终端装置(诸如,计算机)中创建的打印数据打印在记录纸张上的设备。这种图像形成设备的示例可包括复印机、扫描仪、打印机、传真机、多功能打印机(mfp)(通过一台设备复合地实现复印机、打印机和传真机的功能)等。

此外,“硬复印”指代在打印介质(诸如,纸等)上输出图像的操作。

此外,“内容”可指代成为图像形成作业的目标的所有类型的数据,诸如照片、图像或文档文件等。

此外,“打印数据”可指代被转换为可在打印机中打印的格式的数据。同时,当打印机支持直接打印时,文件本身可以是打印数据。

此外,“扫描文件”可指代通过由扫描仪扫描图像而生成的文件。

此外,“用户”可指代使用图像形成设备或者使用以有线方式或无线方式连接到图像形成设备的装置来执行与图像形成作业相关的操作的人。此外,“管理员”可指代具有访问图像形成设备的全部功能和系统的权限的人。“管理员”和“用户”可以是同一个人。

图1是用于描述根据本公开的示例的图像形成设备100的组件的示意性框图。参照图1,图像形成设备100可包括扫描单元110和处理器120。此外,尽管未示出,但是图像形成设备100还可包括用于给各个组件供电的电源。

扫描单元110可扫描文档,以生成扫描图像。扫描单元110可将光照射到文档并且接收从文档反射的光,以读取记录在文档上的图像。例如,电荷耦合器件(ccd)、接触型图像传感器(cis)等可用作从文档读取图像的图像传感器。扫描单元110可具有平板结构、文档馈送结构以及这些结构的组合结构,其中,在所述平板结构中,文档位于固定位置并且图像传感器在移动时读取图像,在所述文档馈送结构中,图像传感器位于固定位置并且文档被馈送。

处理器120可检测生成的扫描图像的倾斜角度。此外,处理器120可基于扫描图像中的内容的位置来确定其将对扫描图像进行扫描的参考点。处理器120可通过使扫描图像围绕确定的参考点旋转来对倾斜角度进行校正。

根据本公开的示例,处理器120可从生成的扫描图像中检测出文档的边界。此外,处理器120可基于检测到的文档的边界来检测扫描图像的倾斜角度。

根据本公开的示例,在处理器120由于对文档的损坏等而无法检测到文档的边界的情况下,处理器120可检测扫描图像中的内容。此外,处理器120可基于检测到的内容的梯度来检测扫描图像的倾斜角度。例如,处理器120可基于在扫描图像中包括的字符串的梯度、图表中包括的线的梯度以及视频(诸如,照片)的边缘的梯度的任意组合来检测扫描图像的倾斜角度。

根据本公开的示例,处理器120可使扫描图像旋转以对检测到的倾斜角度进行校正。当处理器120旋转扫描图像时,处理器120可基于内容的位置来确定成为旋转的中心点的参考点。当在扫描图像中检测到多个内容时,处理器120可通过根据多个检测到的内容中的每个内容的大小而分配权重来确定参考点。

根据本公开的示例,在扫描图像的方向与内容的页面方向不一致的情况下,处理器120可使扫描图像沿内容的页面方向旋转。因此,可改善扫描图像的可读性。

根据本公开的示例,处理器120可检测文档的精确的边界表面,以防止对最终扫描结果/最终打印结果的轮廓的损坏。

同时,尽管在上文中已经示出并描述了组成图像形成设备的简单组件,但是在实现图像形成设备时可在图像形成设备中进一步包括各种组件。这些组件将在下面参照图2来描述。

图2是用于详细地描述根据本公开的示例的图像形成设备100的组件的框图。参照图2,图像形成设备100可包括扫描单元110、处理器120、图像形成器130、输入/输出单元140、通信器150和存储器160。针对扫描单元110的描述将被省略。

处理器120可对图像形成设备100的一般操作进行控制,并且包括处理器(诸如中央处理器(cpu)、专用集成电路(asic)或片上系统(soc))、存储器、只读存储器(rom)等。处理器120可控制在图像形成设备100中包括的其它组件,以执行与通过输入/输出单元140接收到的用户输入相对应的操作。

在下文中将参照附图详细地描述处理器120的详细操作。

图像形成器130可打印校正后的扫描图像。图像形成器130可以以各种打印方式(诸如,电子照相方式、喷墨方式、热转印方式和热方式)在记录介质上形成图像。

例如,图像形成器130可通过一系列的处理(包括曝光处理、显影处理、转印处理和定影处理)使图像形成在记录介质上。

输入/输出单元140可包括:输入单元,用于从用户接收用于执行图像形成作业的输入;以及显示器,用于显示通过执行图像形成作业获得的结果或诸如图像形成设备100的状态的信息。例如,输入/输出单元140可包括接收用户输入的操作面板、显示屏幕的显示面板等。

详细地,输入单元可包括可接收各种类型的用户输入的装置(诸如,键盘、物理按钮、触摸屏、相机或麦克风)。然而,输入/输出单元140不限于此,并且可包括支持各种输入/输出的装置。

作为示例,处理器120可控制输入/输出单元140显示用户界面(ui),用户可通过所述ui来设置检测倾斜角度的方法。此外,处理器120可通过根据通过所述ui接收到的用户输入而选择的方法来检测倾斜角度。

作为另一示例,处理器120还可显示ui,用户可通过所述ui来设置处理器120将围绕其旋转扫描图像的参考点。

通信器150可以以有线方式或无线方式执行与另一装置或另一网络(例如,局域网(lan)、互联网或公共交换电话网(pstn)网络)的通信。为此,通信器150可包括支持各种有线通信方法或无线通信方法中的至少一种的通信模块。例如,通信模块可具有芯片组的形式,或者可以是包括进行通信所需的信息的贴纸/条形码(例如,包括近场通信(nfc)标签的贴纸)等。

无线通信可包括例如无线保真(wi-fi)、wi-fi直连、蓝牙、超宽带(uwb)和nfc中的至少一种。有线通信可包括例如以太网、通用串行总线(usb)和高清多媒体接口(hdmi)中的至少一种。

程序(诸如,应用)和各种类型的数据(诸如,扫描文件)可分别安装和存储在存储器160中。处理器120可访问并且使用存储在存储器160中的数据,或者将新数据存储在存储器160中。此外,处理器120可执行安装在存储器160中的程序。此外,处理器120可将通过通信器150从外部装置接收到的应用安装在存储器160中。

同时,存储器160可由图像形成设备100中的存储介质(例如,硬盘驱动器(hdd)、固态驱动器(ssd)等)、外部存储介质(诸如,包括usb存储器的可移动盘)、通过网络的web服务器等来实现。

此外,尽管在图1和图2中仅示出和描述了图像形成设备100的一般功能,但是除了以上描述的组件之外,图像形成设备100还可根据图像形成设备100所支持的功能而包括执行传真发送/接收功能的传真收发器。

根据本公开的示例,处理器120可检测生成的扫描图像的倾斜角度。处理器120还可基于文档的边界来检测倾斜角度。当处理器120无法检测到文档的边界时,处理器120可基于扫描图像中的内容来检测倾斜角度。

图3是示出了可通过检测文档的边界来检测倾斜角度的情况的示图。例如,处理器120可使用阴影值来检测文档的边界。如图3所示,在从文档的边界检测倾斜角度的情况下,处理器120可省略基于扫描图像中的内容的倾斜角度检测处理。因此,处理器120可快速地检测扫描图像的倾斜角度。

如图4所示,在文档的轮廓被损坏的情况下,可能无法检测到文档的边界。在这种情况下,处理器120可检测扫描图像中的内容。此外,处理器120可基于检测到的内容的梯度来检测扫描图像的倾斜角度。

例如,处理器120可使用在图4所示的扫描图像中包括的字符串的梯度、照片的轮廓的梯度、表格的线的梯度等来检测扫描图像的倾斜角度。

处理器120可通过各种方法来检测倾斜角度,诸如,通过检测文档的边界来检测倾斜角度的方法、通过检测扫描图像中的内容来检测倾斜角度的方法、通过首先检测文档的边界并且在未检测到文档的边界时检测扫描图像中的内容来检测倾斜角度的方法等。

此外,处理器120可向用户提供检测倾斜角度的多种方法,并且允许用户在多种方法中选择一种方法。例如,处理器120可控制输入/输出单元140以显示ui,用户可通过所述ui在多种方法中选择一种方法。此外,处理器120可根据通过ui选择的方法来检测倾斜角度。

随后,处理器120可基于扫描图像中的内容的位置来确定处理器120将对扫描图像进行扫描的参考点。处理器120可通过使扫描图像围绕确定的参考点旋转来对倾斜角度进行校正。

如图5a所示,在内容位于扫描图像的中心部分的情况下,即使处理器120使扫描图像围绕与参考点相对应的扫描图像的中心坐标旋转,也不会发生切掉部分内容的问题。

然而,如图5b所示,在内容位于扫描图像的轮廓部分的情况下,当处理器120使扫描图像围绕与参考点相对应的扫描图像的中心坐标旋转时,部分内容会被切掉。

为了防止这样的问题,处理器120可计算内容在扫描图像中所位于的坐标。此外,处理器120可确定内容的中心坐标是参考点,并且使扫描图像围绕确定的参考点旋转。

参照图5c,处理器120可确定内容的中心坐标520(而不是扫描图像的中心坐标510)是参考点。此外,处理器120可使扫描图像围绕确定的参考点旋转确定的倾斜角度。处理器120可将倾斜角度被校正的扫描图像传送并输出到图像形成器130,或者将倾斜角度被校正的扫描图像存储在存储器160中。

如图6所示,在在扫描图像中检测到多个内容601、602和603的情况下,处理器120可考虑内容的大小来确定参考点。例如,处理器120可通过根据内容的大小而分配权重来确定靠近具有大尺寸的内容的位置是参考点。

在图6的情况下,处理器120可检测多个内容601、602和603,并且计算多个内容中的每个内容的中心坐标610、620和630。此外,处理器120可考虑内容的大小(而不是计算的坐标的简单平均值)来确定参考点640。

根据本公开的示例,处理器120可对扫描图像的方向进行校正,使得文档方向和扫描图像的方向彼此一致。文档方向或页面方向指的是矩形页面被设置为就页面的可读性而言适当的方向。在垂直方向(例如,高度方向)上的长度大于水平方向(例如,宽度方向)上的长度的情况下的页面方向被称为纵向型页面方向,并且在水平方向上的长度大于垂直方向上的长度的情况下的页面方向被称为横向型页面方向。纵向型页面方向的适当的示例可包括内容被设置为沿垂直方向伸长的书。横向型页面方向的适当的示例可包括内容被设置为沿水平方向伸长的时间轴曲线图。

处理器120可检测扫描图像中的内容的方向,以确定文档方向或页面方向。此外,在确定的页面方向和当前的扫描图像的页面方向彼此不同的情况下,处理器120可使扫描图像按照直角进行旋转(例如,旋转90°、180°或270°),使得扫描图像的方向与确定的页面方向一致。

根据本公开的示例,处理器120可检测扫描图像中的多个文本区域。此外,处理器120可基于多个文本区域中的每个文本区域的字符串方向来确定文档的页面方向。应注意的是,文本的字符串方向与文档的页面方向不同。例如,在文本的字符串方向是水平方向(文本被编写为沿所述水平方向伸长)的情况下,包括所述文本的文档具有作为垂直方向的页面方向。

例如,在假设沿垂直方向(例如,纵向型)生成扫描图像的前提下来提供描述。在检测到的文本区域的方向是水平方向的情况下(例如,在文本沿水平方向被编写的情况下),处理器120可确定页面方向是纵向型垂直方向。因此,处理器120可通过确定扫描图像的方向与文档的页面方向一致而不旋转扫描图像。

另一方面,在检测到的文本区域的方向是垂直方向的情况下(例如,在文本沿垂直方向编写的情况下),处理器120可确定页面方向是横向型水平方向。由于确定扫描图像的方向与页面方向彼此不同,因此处理器120可使扫描图像按照直角进行旋转,以将扫描图像改变成为横向型。

因此,在文档方向和扫描图像的方向彼此不同的情况下,处理器120可使扫描图像旋转,以改善扫描图像的可读性。

处理器120可检测各个文本的方向,以检测文本字符串的方向或包含文本的文本行的方向。例如,处理器120可通过光学字符识别(ocr)来检测各个文本的方向。详细地,处理器120可沿全部的四个方向执行ocr,并且检测具有字符将被识别为文本方向的最高概率的方向。作为另一示例,处理器可计算文本之间的连接角度,并且根据连接角度的梯度来检测文本区域的方向。

由于应尝试针对各种语言的识别,因此处理器120可主要检测关于具有高识别率的目标的方向。作为示例,处理器120可尝试检测关于具有预定大小范围的文本区域的方向。作为另一示例,处理器120可尝试检测关于具有预定文本大小的文本的方向。

此外,处理器120可从各个文本区域的字符串方向检测所需的旋转的量。当检测到的量大于预定值时,处理器120可使扫描图像沿确定的扫描图像的页面方向旋转。例如,处理器120可检测字符串方向与文档方向一致的文本区域的大小。此外,当检测到的文本区域的大小超过在文档中包括的内容区域的大小的一半时,处理器120可执行使扫描图像旋转的校正处理。

参照图7a,处理器120可通过仅提取每个段落的代表性文本来确定文档的方向。例如,处理器120可仅基于文本“标题”来确定下面的段落是文本沿水平方向编写的段落。此外,处理器120可仅基于文本“条目1”来确定上面的段落是文本沿垂直方向编写的段落。

此外,处理器120可基于各个确定的段落的区域的大小来确定哪个方向占据多数。在图7a的示例中,处理器120可将包括“标题”的下面的段落的大小与包括“条目1”的上面的段落的大小相互比较。由于包括“标题”的下面的段落的大小比包括“条目1”的上面的段落的大小大,因此处理器120可确定页面方向是文本沿水平方向编写的纵向型页面方向。

参照图7b,处理器120可以以段落为单位来对文档进行划分,并且仅识别每个段落中的一些文本,以确定整个文档的方向。

参照图7c,当在段落中包括具有大小易于识别的文本时,处理器120可优先对具有该大小的文本执行识别。

图8是用于描述根据本公开的示例的图像形成设备100的扫描图像校正方法的流程图。

参照图8,图像形成设备100可通过扫描文档来生成扫描图像(s810)。在扫描图像中可能由于各种原因(诸如,用户在生成扫描图像期间将文档设置为倾斜状态的情况、当自动文档馈送器馈送文档时由于非恒定速度等而导致文档被设置为倾斜状态的情况、扫描/复印厚书的情况等)而发生倾斜。

图像形成设备100可检测生成的扫描图像的倾斜角度(s820)。作为示例,图像形成设备100可使用文档的轮廓的阴影来检测文档的边界,并且使用检测到的边界来检测扫描图像的倾斜角度。作为另一示例,图像形成设备100可基于内容(或文档内容)来检测扫描图像的倾斜角度。

图像形成设备100可基于内容的位置来确定图像形成设备100将使扫描图像围绕其旋转的参考点(s830)。此外,图像形成设备100可使扫描图像围绕确定的参考点旋转,以对倾斜角度进行校正(s840)。随后,图像形成设备100可打印校正后的扫描图像。图像形成设备100可在图像形成设备100中存储或发送校正后的扫描图像或者将校正后的扫描图像存储或发送到外部设备,而不打印校正后的扫描图像。

图9是用于更详细地描述根据本公开的示例的图像形成设备100的扫描图像校正方法的流程图。

参照图9,图像形成设备100可通过扫描文档来生成扫描图像(s910)。此外,图像形成设备100可检测文档的边界(s920)。在使用文档的轮廓的阴影检测到文档的边界的情况下(s930-是),图像形成设备100可基于检测到的边界来检测扫描图像的倾斜角度(s940)。由于基于文档的边界来检测倾斜角度会比基于内容来检测倾斜角度执行得快,因此图像形成设备100可优先尝试检测文档的边界。

在未检测到文档的边界的情况下(s930-否)(例如,在文档的轮廓被损坏的情况下或者在在扫描盖板被打开的状态下扫描文档的情况下),图像形成设备100可基于扫描图像中的内容来检测扫描图像的倾斜角度(s950)。例如,图像形成设备100可从在扫描图像中包括的字符串的梯度、图表的线的梯度和/或视频边缘的梯度来检测内容的梯度。此外,图像形成设备100可从所述内容的梯度来检测扫描图像的倾斜角度。

在检测到倾斜角度之后,图像形成设备100可确定将使扫描图像围绕其旋转的参考点。在扫描图像将仅围绕扫描图像的中心坐标旋转的情况下,存在部分内容将被切掉的风险。因此,图像形成设备100可基于内容的位置来确定参考点(s960)。在基于内容的位置来确定参考点的情况下,减小了内容将被切掉的可能性。

随后,图像形成设备100可使扫描图像围绕确定的参考点旋转,以对倾斜角度进行校正(s970)。此外,图像形成设备100可打印校正后的扫描图像(s980)。

图10是用于描述根据本公开的示例的图像形成设备100的文档方向校正方法的流程图。

参照图10,图像形成设备100可检测扫描图像内的文本(s1005)。此外,图像形成设备100可将检测到的文本的大小与预定范围进行比较,以确认检测到的文本的大小是否被包括在预定范围内(s1010)。例如,预定范围可以是被设置为易于被图像形成设备100识别的大小范围。

当检测到的文本的大小在预定范围之外时,图像形成设备100可移除检测到的文本,以使得检测到的文本不被用于确定文档方向(s1015)。另一方面,当检测到的文本的大小在预定范围内时,图像形成设备100可对齐检测到的文本的位置,以生成字符行(s1020)。

此外,图像形成设备100可根据字符行的大小来对字符行进行分类(s1025)。例如,图像形成设备100可将字符行的大小与预定大小进行比较,以将字符行分类为a类和b类。根据分类的类别,图像形成设备100可在未来计算每个段落的方向时分配权重。

随后,图像形成设备100可对字符行进行分组,以生成文本区域(或段落)(s1030)。此外,图像形成设备100可计算每个文本区域的字符串方向(s1035)。例如,图像形成设备100可使用作为执行ocr的结果而获得的文本的方向或文字之间的连接角度的梯度来执行字符串方向计算。

图像形成设备100可基于分配了取决于字符行的大小的权重的各个本文区域的方向来确定整个文档的方向(s1040)。此外,图像形成设备100可从分别确定的文本区域的字符串方向来检测所需的旋转的量,并且将检测到的量与预定值进行比较,以确定是否需要使扫描图像旋转(s1045)。当确定需要使扫描图像旋转(s1045-是)时,图像形成设备100可执行旋转文档方向的校正处理(s1050)。

图11是用于描述根据本公开的示例的图像形成设备100的边界校正方法的流程图。在在将厚文档(诸如,书)放在图像形成设备100的玻璃平板上的状态下扫描或复印厚文档的情况下,不管盖板是被打开还是被闭合,取决于书的大小和厚度,书以外的边缘区域都以黑色输出。此外,在诸如位于书被折叠的中心区域中的文本的内容中发生失真现象。为了校正这种失真现象,需要准确地识别书的边界。根据本公开的示例的图像形成设备100可通过轮廓分析来检测或估计边界的位置,以解决该问题。

在图11的示例中示出了图像形成设备100输出垂直边界并且随后输出水平边界,但图像形成设备100可首先输出水平边界,或者并行地执行针对垂直边界的处理和针对水平边界的处理。

即使在难以抓取边界的情况下(例如,即使在复印书的情况下),图像形成设备100也可使用图11的示例通过检测准确的边界表面来防止对最终扫描结果的轮廓的损坏。例如,即使在将书放在扫描单元的玻璃平板的边缘上使得文档的边界被切掉的情况下,图像形成设备100也可对边界进行估计,以防止内容被切掉并且防止其它校正处理失效。

参照图11,图像形成设备100可计算扫描图像的垂直倾斜度(s1105)。垂直倾斜度指的是扫描图像的垂直边界倾斜的水平。在以倾斜状态下扫描文档的情况下,图像形成设备100需要计算垂直倾斜度,以沿着准确的文档边界执行轮廓分析等。

在构建垂直边缘图的后续处理之后的处理和在构建垂直边缘轮廓的后续处理之后的处理可被并行执行。

图像形成设备100可基于计算的垂直倾斜度在垂直方向上构建垂直边缘图(s1120)。边缘指的是图像或视频中的区域的边界,并且指的是像素亮度的不连续点。也就是说,亮度差异出现在对象与背景之间的边界处。这与对象的轮廓相对应,并且提供多条信息(诸如,对象的位置、形状、大小等)。检测与边缘相对应的像素,并且将由如上所述检测到的边缘表示的图像或视频称为边缘图。

图像形成设备100可使用垂直方向上的垂直边缘图来分析垂直边缘直方图,以选择垂直边界候选(s1125和s1130)。详细地,图像形成设备100可沿水平方向将扫描图像划分为多个片段。也就是说,文档可被划分为这样的形式:具有沿垂直方向伸长的字符串形状的多个片段沿水平方向设置。图像形成设备100可执行垂直边缘直方图分析以分析各个片段的阴影。由于当执行垂直边缘直方图分析时将在文档的边界部分处检测到峰值的可能性高,因此图像形成设备100可选择检测到峰值的部分作为垂直边界候选。

此外,图像形成设备100可检测垂直边缘轮廓(s1110)。详细地,垂直边缘轮廓指的是在沿垂直方向行进时分析边缘的变化。例如,在清楚地扫描到文档的边缘的情况下,文档的内部的边缘轮廓具有直线形状。另一方面,在未清楚地扫描到文档的边缘的情况下,文档的内部的边缘轮廓具有不规则的波形状。例如,在未扫描到文档的边界使得文档被扫描为好像文档中的内容是边界一样的情况下,边缘轮廓具有不规则的波形状。

在垂直边缘轮廓是线性的情况下(s1115-是),图像形成设备100可将通过了垂直边缘直方图分析的垂直边界候选选择为垂直边界(s1130)。因为垂直边缘轮廓是线性的意味着清楚地扫描到文档的边缘,所以图像形成设备100可确定以在垂直边缘直方图分析中选择的垂直边界候选是准确的垂直边界。

在垂直边缘轮廓不是线性的情况下(s1115-否),图像形成设备100可确定通过了垂直边缘直方图分析的垂直边界候选不是实际的垂直边界。此外,图像形成设备100可估计垂直边界(s1135)。因为垂直边缘轮廓不是线性的意味着文档的内容被确定为边缘,所以图像形成设备100可将与垂直边界候选分隔开预定距离的点估计为垂直边界。

图像形成设备100可输出选择的垂直边界或估计的垂直边界(s1140)。此外,图像形成设备100可从输出的垂直边界添加预定量的空白,并且随后生成扫描图像。

输出水平边界的处理(s1145至s1180)与输出垂直边界的处理(s1105至s1140)相对应,因此省略重复的描述。

图12a示出了通过根据现有技术的方法扫描的结果,并且可从图12a中确认文档的内容丢失。另一方面,根据本公开的示例,如图12b所示,可确认的是,通过估计文档的边界线而使得文档的内容没有丢失。

根据如上所述的各种示例,图像形成设备100可对在扫描文档时可能发生的文档的倾斜进行校正。此外。图像形成设备100可基于文档的内容来对文档的倾斜进行校正,从而防止在校正倾斜之后图像的丢失。

此外,图像形成设备100可允许扫描文档的方向与文档中的句子的方向彼此一致,以改善可读性。此外,图像形成设备100可检测或估计准确的边界表面,以防止对最终扫描结果的轮廓的损坏。

同时,上述示例可以以存储计算机可执行指令和数据的计算机可读记录介质的形式实现。所述指令和数据中的至少一者可以以程序代码的形式存储,并且可在由处理器执行时通过生成预定程序模块来执行预定操作。

计算机可读记录介质可指代例如磁存储介质(诸如,硬盘)、光学可读介质(诸如,致密盘(cd)和数字通用光盘(dvd))等,并且可指代在可通过网络访问的服务器中包括的存储器。例如,计算机可读记录介质可以是图像形成设备100的存储器160和输入/输出单元140的存储器中的至少一者,或者可以是在通过网络连接到图像形成设备100的外部设备中包括的存储器。

尽管已经参照示例和附图描述了本公开,但是本公开不限于上述示例,而是可由本公开所属领域的技术人员根据以上描述对本公开进行各种修改和变化。因此,本公开的范围不应被解释为限于上述示例,而应由权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1