图像处理装置和记录图像处理程序的记录媒介的制作方法

文档序号:6561852阅读:144来源:国知局
专利名称:图像处理装置和记录图像处理程序的记录媒介的制作方法
技术领域
本发明涉及一种图像处理装置和记录图像处理程序的记录媒介,其可用于文档的电子化和归档。
背景技术
近年来,印刷在纸媒介上的文档(纸文档)常通过扫描仪进行扫描,并经过电子化而成为文档数据,且文档数据例如可存储在硬盘上以供使用。为了增加所存储文档的可用性,一般对每一文档数据给定一些属性信息(attribute information)。属性信息的典型实例可包含用于文档查找的关键字。用户可在存储文档数据时通过键盘输入所需关键字来登记用作属性信息的关键字。然而,在必须处理大量文档数据时,由于将要登记的关键字的数目由此而增加,因此通过键盘输入关键字可能变得繁重。

发明内容
根据本发明的一目的,本发明提供一种图像处理装置,包括文档输入单元,其输入文档的文档数据;第一识别单元,其识别文档中包含的字符串的位置;第二识别单元,其基于字符串的方位来识别文档中给定的标记的范围;以及字符串提取单元,其根据第一识别单元所识别的字符串的位置和第二识别单元所识别的标记的范围来提取经受标记的字符串。


将基于以下图式详细描述本发明的示范性实施例,其中图1为绘示根据本发明示范性实施例的图像处理装置的构造实例的方框图。
图2为绘示根据本发明示范性实施例的图像处理方法的流程图。
图3为描述检测字符位置的处理的示意图。
图4为绘示一实例中的字符串被划分为词的示意图。
图5为描述定位字符串的处理的示意图。
图6为描述识别标记范围的处理的示意图。
图7为绘示通过字符串方位识别的标记范围的示意图。
具体实施例方式
以下参看附图详细描述本发明的特定示范性实施例。
图1为绘示根据本发明示范性实施例的图像处理装置的构造实例的方框图。图1中,文档输入单元1(document input unit)输入位图格式(bitmap format)的电子化文档数据。文档输入单元1例如包含图像扫描仪,用以光学性地扫描纸文档上的图像,并将经扫描的图像转换(电子化)为文档数据;或是一输入接口(input interface),通过电缆而获取从图像扫描仪输出的文档数据。
这里假定文档数据单元的原始纸文档包含有标记的部分。例如,通过用本身含有半透明荧光墨水的荧光记号笔或行标记笔在文档中填充将要登记为属性信息的字符串来执行标记。可采用多种颜色作为荧光墨水的颜色,例如黄色、淡蓝色、粉红色、桔黄色、黄绿色、蓝色、红色和绿色。只要纸文档是黑白印刷的,那么任何颜色都可用于标记,但考虑到字符的可读性最好使用淡颜色(例如黄色、淡蓝色和粉红色)而不是深颜色。对于彩色印刷的文档,可采用与彩色印刷的纸张上呈现的颜色不同的颜色进行标记。
字符辨识单元2(character recognizing unit)使用从文档输入单元1输入的文档数据来辨识包含在文档数据中的字符。字符位置检测单元3(character position detecting unit)检测由字符辨识单元2所辨识的字符的位置。字符串位置识别单元4(position-of-string identifying unit)将以字符辨识单元2所辨识的字符而表示的文本划分为词形式的字符串(stringsin words),并基于字符位置检测单元3所检测到的字符的位置信息来识别每一字符串的位置。
标记像素提取单元5(mark pixel extracting unit)提取一像素,该像素表示从文档输入单元1输入的文档数据的文档中给定的标记(下文中可称为“标记像素”)。根据文档中给定的标记的颜色而在标记像素提取单元5中定义将要提取的像素的颜色信息。例如,在用于标记的荧光墨水的颜色为黄色时,通过根据荧光墨水的黄色的颜色信息而在其中定义将要提取的像素的颜色信息。当文档中使用多种颜色进行标记时,将标记颜色定义为将要提取的像素的颜色信息,且每种标记颜色与关于文档登记的属性信息可映射。例如,当黄色、粉红色和淡蓝色为标记颜色时,在用颜色标记的字符串与各种类型的属性信息(例如,用于文档查找的关键字、文档的文件名、创建日期和创建者)之间定义对应关系。
连接像素区提取单元6(connected pixel area extracting unit)在标记像素提取单元5所提取的标记像素中确定相互连接的标记像素作为“连接像素(connected pixels)”,并提取属于一个连接组的多个(或许多)连接像素所占据的像素区作为连接像素区。方位识别单元7(orientationidentifying unit)识别文档中给定的标记的方位。标记末端识别单元8(end-of-mark identifying unit)基于方位识别单元7所识别的标记的方位和连接像素区提取单元6所提取的连接像素区的范围,而识别一标记的开端和末端。标记范围识别单元9(range-of-mark identifying unit)基于标记末端识别单元8所识别的标记的开端和末端并依据字符串方位来识别标记的范围。
字符串提取单元10(string extracting unit)基于字符串位置识别单元4所识别的字符串的位置和标记范围识别单元9所识别的标记的范围来提取经受标记的字符串。文档登记单元11(document registering unit)向数据库单元12(database unit)登记从文档输入单元1输入的文档数据,在登记文档数据时,并向数据库单元12登记字符串提取单元10所提取的字符串以作为文档数据的属性信息。数据库单元12可为大容量数据存储器件,例如硬盘。
上述各组件中的字符辨识单元2、字符位置检测单元3和字符串位置识别单元4是包含在本发明的一目的中的“第一识别单元(first identifyingunit)”内,亦即,通过使用文档输入单元1所输入的文档数据来识别文档中包含的字符串位置的单元(unit)。标记像素提取单元5、连接像素区提取单元6、方位识别单元7、标记末端识别单元8和标记范围识别单元9包含在本发明的一目的中的“第二识别单元(second identifying unit)”内,亦即,通过使用文档输入单元1所输入的文档数据来识别文档中藉由字符串方位所给定标记的范围的单元。
随后,将参看图2中的流程图来描述应用根据本发明的示范性实施例的图像处理装置的图像处理方法。此图像处理方法的实施方式,其是将存储在ROM(Read Only Memory,只读存储器)或硬盘中的图像处理程序(image processing program)通过CPU(Central Processing Unit,中央处理单元)调用到RAM(Read Access Memory,随机存取存储器)并执行。图像处理程序可预先安装在图像处理装置中、或可存储并提供于例如CD-ROM、MO和DVD等计算机可读媒介中。或者,可在不使用记录媒介的情况下以有线或无线方式通过通信网络来提供图像处理程序。
首先,从文档输入单元1输入文档数据(步骤S1)。可通过抓取经由已预先标记的纸文档上图像的光学扫描所产生的文档数据来输入文档数据。随后,经由进行步骤(proceeding step)而输入的文档数据,其被用以执行定位文档中所包含的字符串(步骤S2)的处理以及识别文档中给定标记的范围(步骤S3)的处理。步骤S2中的处理和步骤S3中的处理可以任何次序执行,或可并行地(in parallel)同时执行。
定位字符串(步骤S2)的处理由第一识别单元中所包含的字符辨识单元2、字符位置检测单元3和字符串位置识别单元4来执行。此情况下,字符辨识单元2通过使用众所周知的字符辨识技术(例如,光学字符辨识处理(optical character recognition,OCR))来辨识文档中包含的每一个字符,并将所辨识的每一个字符转换为文本码(text code)。字符位置检测单元3检测文档中包含的每一字符的位置的坐标数据(coordinatedata)。例如,如图3所示,当由字符辨识单元2转换为文本码的字符为“a”时,检测出指示限定此字符的矩形区域位置的坐标数据(x11,y11)-(x12,y12)作为字符的位置信息。
字符串位置识别单元4对由字符辨识单元2转换为文本码的每一字符执行形态分析(morphological analysis),从而将文档中包含的字符串划分为词(words),且通过使用字符位置检测单元3检测到的坐标数据来识别每个词表示的字符串的位置。例如,如图4所示,可将字符串“familiarwith the task in advance in order to register a document having an image file”划分为以下的词“familiar”“with”“the”“task”“in”“advance”“in”“order”“to”“register”“a”“document”“having”“an”“image”“file”。如图5所示,可基于字符串开端处的字符“a”的坐标数据(x11,y11)-(x12,y12)和末端处的字符“e”的坐标数据(x51,y51)-(x52,y52),通过角落的坐标数据(x11,y11)-(x52,y52)来识别包含含有多个字符的词(例如“advance”)的字符串的位置。
另一方面,识别标记的范围(步骤S3)的处理由第二识别单元中所包含的标记像素提取单元5、连接像素区提取单元6、方位识别单元7、标记末端识别单元8和标记范围识别单元9来执行。标记像素提取单元5提取具有与预定义的颜色信息匹配的像素值的像素作为标记像素。例如,在将由标记像素提取单元5提取的像素的颜色信息由黄色荧光墨水定义时,提取具有与黄色荧光墨水匹配的像素值的像素作为标记像素。
连接像素区提取单元6在标记像素提取单元5提取的标记像素中确定相互连接的标记像素作为连接像素,并提取属于一个连接组的多个连接像素所占据的像素区作为连接像素区。例如,可通过如下方法来确定给定标记像素是否有连接。即,在中心处用一个标记像素(焦点像素(focuspixel))定义预定尺寸(m×n像素尺寸)的窗口(window),并且,如果具有与焦点像素的颜色相同颜色的另一标记像素存在于窗口内,那么将这两个标记像素确定为连接像素。因此,将实际上指示一行中标记的像素全部确定为属于一个连接组的连接像素。当文档中多个部分有标记时,会提取数目等于标记数目的连接像素区。
方位识别单元7识别文档中给定的标记的方位。一般来说,标记的方位遵循文档中字符的方位。例如,由于字符在水平线方位文档中水平对准,因此在其上水平地给出标记。由于字符在垂直线方位文档中垂直对准,因此在其上垂直地给出标记。在水平线方位文档中,词中包含的多个字符的方位是水平的,而在垂直线方位文档中,词中包含的多个字符的方位是垂直的。因而,方位识别单元7会识别由字符串位置识别单元4进行的字符串划分而形成的词中所包含的多个字符的方位,以作为标记的方位。或者,由连接像素确定单元5确定为连接像素的属于一个组的像素可被包围在限定像素的矩形区域中,且可将矩形区域的纵向方位识别为标记的方位。
标记末端识别单元8沿着方位识别单元7所识别的标记的方位,进而识别由连接像素区提取单元6所提取的连接像素区的一个末端和另一末端,以作为标记的开端和末端。例如,如图6所示,当方位识别单元7所识别的标记的方位为方位X时,将方位X中的由连接像素区提取单元6所提取的连接像素区的一个末端P1和另一末端P2识别为标记的开端和末端。
标记范围识别单元9基于标记末端识别单元8所识别的标记的开端P1和末端P2来识别给定标记在字符串的方位中覆盖的范围(即,字符实际对准的区域)的开端和末端。例如,如图7所示,当文档中沿着方位X1提供其上具有标记M的字符串时,在字符串的排列(排列区域)的方位X1中识别标记M的从开端P1到末端P2的范围,以作为标记的范围E。换句话说,即使标记M在其中途部份弯曲,仍可忽略此弯曲,且由实际提供有字符串的区域(行/列)识别标记的范围E。
以此方式,即使在文档中用户给定的标记的位置偏离了用户所希望的在标记中间部份的位置,依据字符串的方位X1对标记范围E的识别可通过忽略偏离而允许适当识别用户希望的标记范围。因此,即使字符在标记M的中途部份偏离标记M,仍可将包含此字符的范围识别为标记的范围E。另外,通过识别垂直与水平线方位之间的标记M的方位,并沿着标记方位识别连接像素区的一个末端和另一末端,可适当识别用户希望的标记范围的开端和末端,以分别作为标记的开端P1和末端P2。
随后,字符串提取单元10基于字符串位置识别单元4所识别的字符串的位置和标记范围识别单元9所识别的标记的范围来提取经受标记的字符串。更特定来说,从位置由字符串位置识别单元4所识别的字符串中,提取包含在标记范围识别单元9所识别的标记范围中的字符串,以作为经受标记的字符串(步骤S4)。例如,如图7所示,在通过字符串的方位X1识别标记的范围E时,提取标记范围E中所包含的字符串以作为经受标记的字符串。标记范围中包含的字符串表示至少一部分与标记范围重叠的字符串。
这里,标记M的开端P1位于表示给定词的给定字符串“familiar”的中途部份,而标记M的末端P2位于表示给定词的给定字符串“file”的中途部份。在此情况下,字符串提取单元10基于预先定义的提取条件来确定是否提取字符串以作为“经受标记的字符串”。
提取条件可基于给定字符串(例如“familiar”和“file”)与标记范围识别单元9所识别的标记范围E重叠的部分与给定字符串不与标记范围E重叠的部分之间的比率。此情况下,字符串位置识别单元4所识别的字符串的位置叠加在标记范围识别单元9所识别的标记范围E上,随后确定字符串与标记范围E重叠的部分和字符串不与标记范围E重叠的部分。如果给定字符串与标记范围E的一半或超过一半重叠,那么可将此字符串提取作为“经受标记的字符串”,且可不提取另一部分。
在提取条件下,在字符串“familiar”中,与标记范围E重叠的部分(字符部分“amiliar”)比不与标记范围E重叠的部分(字符部分“f”)具有更高的比率。因此,字符串提取单元10提取给定字符串“familiar”作为“经受标记的字符串”。另一方面,在字符串“file”中,与标记范围E重叠的部分(字符部分“f”)比不与标记范围E重叠的部分(字符部分“ile”)具有更低的比率。因此,字符串提取单元10不会提取给定字符串“file”作为“经受标记的字符串”。
因此,字符串提取单元10提取用户希望标记的字符串,即,字符串“familiar with the task in advance in order to register a document having animage”。特别地,在先前技术中,由于标记部分经受OCR处理,所以提取的字符串为“amiliar”和“document having an image f”。
另一替代的提取条件可基于给定字符串表示的词的类型。例如,可将各种类型的词划分为独立词(包含名词和动词)和依附词(包含冠词),且如果字符串表示的词的类型是独立词,那么可将给定字符串提取作为经受标记的字符串,而如果字符串表示的词的类型是依附词,那么可不提取给定字符串。可分离地或组合地采用所示范的两种提取条件。或者,可在标记末端识别单元8所识别的标记的开端P1与末端P2之间定义不同的提取条件。
即使当文档中由用户给定的标记的末端偏离用户所希望的位置时,基于预先定义的提取条件的字符串提取的确定,仍允许进行用户希望的字符串的适当提取。
随后,文档登记单元11在登记文档数据时向数据库单元12登记从文档输入单元1所输入的文档数据,并向数据库单元12登记字符串提取单元10所提取的字符串,以作为文档数据的属性信息(步骤S5)。此情况下,文档数据与属性信息在登记时相互形成对应关系。当文档数据的属性信息除用于文档查找的关键字之外还包含如文档的文件名和创建日期等多种不同类型的属性信息时,多种不同类型的属性信息在登记时与一条文档数据(one piece of document data)形成对应关系。因此,可将用户通过标记而希望的字符串登记作为文档数据的属性信息。
用于输入文档数据的文档(或纸文档)不仅可为办公室文档,例如也可为杂志或海报。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的结构及技术内容作出些许的更动或修饰为等同变化的等效实施例,但是凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
权利要求
1.一种图像处理装置,其特征在于包括文档输入单元,其输入文档的文档数据;第一识别单元,其识别所述文档中包含的字符串的位置;第二识别单元,其基于所述字符串的方位来识别所述文档中给定的标记的范围;以及字符串提取单元,其根据所述第一识别单元所识别的所述字符串的所述位置和所述第二识别单元所识别的所述标记的所述范围来提取被给定所述标记的字符串。
2.根据权利要求1所述的图像处理装置,其特征在于还包括登记单元,其登记由所述字符串提取单元提取的所述字符串以作为所述文档数据的属性信息。
3.根据权利要求1所述的图像处理装置,其特征在于所述字符串提取单元提取由所述第二识别单元识别的所述标记的所述范围中包含的字符串,以作为被给定所述标记的所述字符串,而所述字符串的位置由所述第一识别单元所识别。
4.根据权利要求1所述的图像处理装置,其特征在于当界定由所述第二识别单元识别的所述标记的所述范围的所述标记的开端和末端的至少一者位于给定字符串的中途部份时,所述字符串提取单元基于预设的提取条件确定是否提取所述给定字符串,以作为被给定所述标记的所述字符串。
5.根据权利要求4所述的图像处理装置,其特征在于所述提取条件是基于所述给定字符串与所述标记的所述范围重叠的部分与所述给定字符串不与所述标记的所述范围重叠的部分之间的比率。
6.根据权利要求4所述的图像处理装置,其特征在于所述提取条件是基于由所述给定字符串表示的词的类型。
7.根据权利要求1所述的图像处理装置,其特征在于所述第二识别单元包括连接像素区提取单元,其提取其中表示所述文档中给定的标记的像素已连接的连接像素区;方位识别单元,其识别所述文档中给定的所述标记的方位;以及标记末端识别单元,其基于所述方位识别单元所识别的所述标记的所述方位和所述连接像素区提取单元所提取的所述连接像素区的所述范围来识别所述标记的开端和末端。
8.根据权利要求7所述的图像处理装置,其特征在于所述标记末端识别单元沿着所述方位识别单元所识别的所述标记的所述方位识别由所述连接像素区提取单元提取的所述连接像素区的一个末端和另一末端,作为所述标记的所述开端和所述末端。
9.一种记录媒介,记录促使计算机执行一处理的图像处理程序,其特征在于所述处理包括输入一文档的文档数据;识别所述文档中包含的字符串的位置;基于所述字符串的方位来识别所述文档中给定的标记的范围;以及根据所述经识别的字符串的所述位置和所述标记的所述经识别的范围来提取被给定所述标记的字符串。
10.一种图像处理方法,其特征在于包括输入文档的文档数据的步骤;识别所述文档中包含的字符串的位置的步骤;基于所述字符串的方位来识别所述文档中给定的标记的范围的步骤;以及基于所述经识别的字符串的所述位置和所述标记的所述经识别的范围来提取被给定所述标记的字符串的步骤。
全文摘要
一种图像处理装置包含文档输入单元,其输入文档的文档数据;第一识别单元,其识别文档中包含的字符串的位置;第二识别单元,其基于字符串的方位来识别文档中给定的标记的范围;以及字符串提取单元,其基于第一识别单元所识别的字符串的位置和第二识别单元所识别的标记的范围来提取经受标记的字符串。
文档编号G06K9/20GK101034435SQ20061013176
公开日2007年9月12日 申请日期2006年10月8日 优先权日2006年3月6日
发明者加藤雅弘 申请人:富士施乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1