文档图像处理装置以及文档图像处理方法

文档序号:6570905阅读:105来源:国知局
专利名称:文档图像处理装置以及文档图像处理方法
技术领域
本发明涉及将文档作为图像进行输入并存储的文档图像处理装置以 及文档图像处理方法,特别是涉及具有对于所输入的文档图像自动生成文 档名并进行管理的功能的文档图像处理装置以及文档图像处理方法。
背景技术
一种利用图像扫描仪等图像输入装置将文档转换成图像,并以电子形 式存储,且在之后可以检索的文档归档装置已经步入实用化。另外,对于所存储的文档图像,为了便于管理而赋予了文档名。作 为对图像数据自动地赋予文档名的现有技术,例如有中国专利公开公报CN1746884A、中国专利公开公报CN1658192A。在中国专利公开公报CN1746884A中,记栽有通过作为所拍摄的时 间数据的日期时间、和表示在该日期时间拍摄的第几个图像数据的编号 来生成文档名的技术。另外,在中国专利/^开公才艮CN1658192A中,记栽有如下技术采 用由所给的经度及炜度等构成的拍摄地点的位置信息,对所拍摄的时间 数据,用户通过手动输入赋予"x x x宅"这样的拍摄地点等具体信息, 而设为文档名。然而,这样的现有技术,由于其目的在于对各文档图像生成不同文 档名,所以在文档名中不能反映出文档图像的内容。因此,用户不能从 文档名中掌握到该文档图像的内容,而为了确认内容,需要一个一个地 打开文档图像的文件。发明内容本发明的目的是,提供一种不用麻烦用户的手,且可以自动地生成反 映了文档图像的内容的有意义的文档名并进行管理的文档图像处理装置 和文档图像处理方法。为了达到上述目的,本发明的文档图像处理装置是对所存储的文档图像赋予文档名并进行管理的文档图像处理装置,其特征在于,具有字形 特征字典,其以单个文字为单位储存有文字图像的图像特征;标题抽出部, 其抽取出在所输入的文档图像中存在的标题区域;图像特征抽出部,其将单个文字进行分割,并抽出各文字图像的图像特征;候补文字列生成部,其以由上述图像特征抽出部抽出的文字图像的图像特征为J^出,参照上述 字形特征字典,选择图像特征的匹配度高的文字图像作为候补文字,并制 作成相应于上述文字列的候补文字列,而且采用词义解析法来调整构成该候补文字列的各候补文字,并设为有意义的候补文字列;文档名制作部, 其对上述所输入的文档图像,制作包含上述候补文字列生成部中生成的有 意义的候补文字列的第 一文档名。根据上述构成,标题抽出部对文档图像中的标题区域进行定位,并抽 取出该区域中所包含的文字列,即标题。接下来,图像特征抽出部,将由 所抽取出的标题的文字列构成的图像按单个文字进行分割,并抽出各文字 图像的图像特征。然后,候补文字列生成部,以由上述图像特征抽出部抽出的文字图像的图像特征为1^出,参照字形特征字典,选择图像特征的匹配度高的文字图4象作为候补文字,并制作成相应于上述文字列的^i补文字列。候补文字列,由于具有与标题区域中所包含的文字列相似的特征,所以也有候补文 字列本身与抽取出的标题区域的文字相同而具有意义的场合。然而,由于为字形的特征的匹配,所以也有可能是形状相似的其它文 字。在此,候补文字列生成部,采用词义解析法调整构成该候补文字列的 各候补文字,并"&为有意义的候补文字列。由此,对于由与所抽取出的标 题区域中包含的标题相同的文字构成、且带有相同意义的候补文字列,进 行高概率的调整。文档名制作部对于所输入的文档图像,制作由候补文字列生成部生成 的包含有意义的候补文字列的文档名(第一文档名有意义的文档名), 利用该文档名来管理文档图寸象。从而,不用麻烦用户的手,就可以对所存储的文档图像自动地赋予有 意义的文档名,而且用户可以利用反映了文档图^f象的内容的文档名来阅览 所存储的文档图像,可以简单地实施所存储的文档图像的管理及搜索。关于本发明的其他目的,特征以及优点,可以通过以下的说明得到充分的理解。另外,通过参照附图的以下说明,可以了解本发明的优点。


图1是表示本发明的一个实施方式的图,是表示文档图像处理装置的 功能的功能方框图。图2是本实施方式的文档图像处理装置的构成图。 图3是表示制作字形样板数据库的处理的说明图。 图4是文字图像外围特征的说明图。 图5 ( a )和图5 ( b )是网格方向特征的说明图。 图6是表示制作字形特征字典的处理的说明图。 图7是表示制作索引信息数据库的处理的说明图。 图8是采用具体例来表示制作索引矩阵的处理的说明图。 图9是表示文档图像例、和索引信息数据库中的该文档图像的索引信 息的数据配置例的说明图。图IO是表示检索部的功能和检索处理的说明图。 图U是表示检索部中的检索顺序的流程图。图12是表示计算出检索关键词与索引矩阵之间的相关度的方法的说明图。图13是采用具体例来表示检索关键词与索引矩阵之间的相关度的计 算的说明图。图14是表示附带词汇分析功能的检索处理的说明图。图15是表示文档图像管理部中的处理的说明图。图16是采用具体例来表示调整制作成的索引矩阵并使第一列的文字列成为有意义的文字列的处理的说明图。图17是表示文档图像显示部所显示的、储存在文档图像DB中的文档图像的阅览画面的说明图。
具体实施方式
本发明涉及基于图像的特征识别和匹配技术来自动生成与文档图像 的内容相匹配的有意义的文档名的技术。而且,作为更好的实施方式,在 此,公开如下的装置及方法,即基于文档图^f象的标题区域来生成文档图 像的索引信息,并对所生成的索引信息进行检索,另外基于索引信息来制作反映了内容的有意义的文档名。下面,基于图1~图17,对本发明涉及的一个实施方式进行说明。另 外,本发明不限于此。图2是本实施方式的文档图像处理装置的构成图。在图2中,l是键 盘,其用于检索关键词的输入,以及后述的候补文字数、相关值、行的相 关度加权因数Q等的设定值变更。此外,键盘l还用于输入阅览所存储的 文档图像时的指示。2是图像扫描仪,且用于取得文档图像。另外,文档图像的取得不限 于图像扫描仪2,也可以通过网络等进行通信来取得。另外,也可以进行 采用了图像扫描仪2的检索关键词的输入。6是数码相机等数字式摄影装置,其也是获取文档图像的装置。3是输出检索到的文档图像并进行显示的显示装置。在所显示的内容 中,还包含相关度的信息和图像名称等信息。此外,显示装置3还显示使 所存储的文档图<象的阅览变为可能的阅览画面。4是处理器,其实际进行如下处理从文档图像中抽取出成为检索要 点的标题区域的文档图像特征抽出处理;制作能够对文档图像进行检索的 索引信息的索引信息生成处理;采用所制作的索引信息的检索处理;采用 索引信息来制作后述的有意义的文档名并管理文档图像的文档图像管理 处理等。5是储存有用于使处理器4进行实际的处理的软件等的外部存储 装置。上述处理器4中的实际的处理是根据储存在外部存储装置5中的软件 来执行。处理器4例如由通常的计算机主体等构成。在本实施方式中,处 理器4还实施字形特征字典制作处理,该处理用于制作在索引信息生成处 理中采用的后述的字形特征字典15 (参照图1)。外部存储装置5例如可以由能够高速存取的硬盘等构成。外部存储装 置5为了保存大量的文档图像,也可以构成为采用光盘等大容量设备的构成。利用该外部存储装置5,来构成后述的字形特征字典15、索引信息数 据库17、文档图像数据库19、字形样板数据库13、语言模型61等。图1是表示本发明的一个实施方式的图,是表示文档图像处理装置的 功能的功能方^f匡图。如图1所示,本实施方式的文档图像处理装置包含文字数据库输入 部(文字DB输入部)11、字体正规化处理部12、字形样板数据库(字形 样板l)B) 13、文字图像特征抽出部(图像特征抽出部)14、字形特征字 典15、特征匹配部16、索引信息数据库(索引信息DB) 17、标题区域初 始处理部(标题抽出部)18、文档图像数据库(文档图像DB) 19、文档 图像特征数据库(文档图像特征DB ) 20、文档图像输入部21、检索部22、 词汇解析部23、关键词输入部24、检索结果显示部25,文档名制作部51、 文档图像DB管理部52、文档图像显示部53、和指示输入部54。其中,由文字DB输入部ll、字体正规化处理部12、字形样板DB13、 文字图像特征抽出部14、字形特征字典15来构成上述的实施字形特征字 典制作处理的字形特征字典生成部30。首先,对构成字形特征字典生成部30的上述功能框11、 12、 13、 14、 15进行说明。文字DB输入部11是用于输入为制作字形特征字典所必要的、成为基 础的文字数据库的输入部。如果本装置例如是对应于中文的装置,则输入 中华人民共和国的GB2312的6763个的全部文字。另夕卜,如果本装置是对 应于日语的装置,则输入JIS第一标准的约3000字种等。这样的文字DB 输入部ll由处理器4构成,并通过记录媒体或网络等来提供文字数据库。字体正规化处理部12是对由文字DB输入部11输入的文字数据库中 所包含的全部文字,制作不同字体和大小的文字图像的部分。将不同字体 和大小的文字图像储存在字形样板Dm3中。图3表示字体正规化处理部12制作字形样板DB13的处理。在字体正 规化处理部12中,如果本装置是对应于中文的装置,则具有例如宋体、仿 宋体、黑体、楷体等的字形样板12a。另外,如果本装置是对应于日语的 装置,则具有MSMincho、 MS Gothic…等字形样板。字体正规化处理部12中的变形处理部12b,对文字数据库的文字进行 图像化,并对文字图像进行标准化处理。然后,变形处理部12b参照字形 样板12a,对标准化处理后的文字图像实施变形处理,并进一步改变为不 同字体和大小的文字图像。变形处理中,包括例如模糊化处理、扩大/缩小 化处理、细微化处理等。字体基准部12c将这样变形处理后的文字图像作 为基准文字图^象储存到字形样板DB13中。在字形样板DB13中,针对文字数据库的所有文字,即使是相同的文字,也储存有对应每个由字体、大小决定的字形的基准文字图像。如果举 例说明,则,即使文字种类都是"中",也存在仅相当于所决定的字体的数 量的不同形状的基准文字图像的"中",另外,还储存有仅相当于所决定的 大小的数量的不同大小的基准文字图像的"中"。文字图像特征抽出部14是抽出文字图像的特征(图像特征),并储存 到字形特征字典15中的部分。在本实施方式中,文字图4象特征抽出部14 根据文字图像外围特征与网格方向的组合,来抽出文字图像的特征,并设 为特征矢量。另外,文字图像的特征不限于这些,也可以抽出其他特征来 形成特征矢量。这里,预先对文字图像外围特征和网格方向特征进行说明。图4是文 字图像外围特征的说明图。所谓文字图像外围特征是指从文字图像的外部 观察的轮廓的特征。如图4所示,从文字图像的外接矩形的4边进行扫描, 并将从白像素变化为黑像素时的点为止的距离作为特征,取出最初变化的 位置和第二次变化的位置。例如,在将外接矩形分割成X行Y列的场合下,以行为单位分别从左 方向和右方向扫描图像,以列为单位分别从上方向和下方向扫描图像。另 外,图4是表示以行为单位从左进行扫描的图。另外,在图4中,用实线箭头l表示最初从白像素变化为黑像素时的 点为止的扫描轨迹。虛线箭头2表示第二次从白像素变化为黑像素时的点 为止的扫描轨迹。实线箭头3表示最终也未能检测到从白像素变化为黑像 素的点的情况下的扫描轨迹,在此场合下,距离值为0。另一方面,图5 (a)、 (b)是网格方向特征的说明图。将文字图像分 割成粗网格,对各格子区域内的黑像素,向预先确定的多个方向延伸触手。 然后,对在各个方向上连接的黑像素的像素数进行计数,并将表示该黑像 素按各方向成分的分布状况的方向影响度,作为识别函数釆用欧几里得距 离,并利用与黑像素数之差相应的值,对距离值进行除法运算,而计算出 距离值。在图5(a)中,将文字图像分割成4x4共16个格子,且以在X轴方 向上最接近于格子交点的从黑像素变化为白像素的点为中心,向X轴方向 (0° )、 45°方向、Y轴方向(卯° )的3个方向延伸触手。在本实施例中,将文字图像分割成8x8的4角的网格,并如图5(b) 所示,向0。 、 45° 、卯° 、 135° 、 180° 、 225。 、 270° 、 315°这8个方向延伸触手。另外,作为网格方向的特征的抽出方法,有设置触手的延伸方向、延 伸触手的中心点的方法等各种方法,例如记载在日本国公开专利公报"特开2000-181994号乂>才艮,,等中。文字图像特征抽出部14,对储存在文字形状样板DB13中的所有的基 准文字图像进行这样的文字图像的特征的抽出。然后,文字图像特征抽出 部14将储存在字形样板DB13中的基准文字图像的抽出结果储存到字形特 征字典15中,而生成字形特征字典15。图6表示制作基于文字图像特征抽出部14的字形特征字典15的处理。 文字图像特征抽出部14中的字形标准化部14a从字形样板DB13中取出基 准文字图像,文字图像特征取出部14b从由字形标准化部14a取出的基准 文字图像中取出其特征。然后,特征分类部14c参照字形样板DB13,对 从按每个基准文字图像抽出的特征进行分类,并储存到字形特征字典15 中。在文字图像特征取出部14b中,如上述那样,^^个单个文字,求出 基于带加权的不同基准文字图像的特征的适应值,并取得基准文字图像的 标准特征。文字图像特征取出部14b通过对不同字体字号进行加权,可制作不同 的字形特征字典。通过融合多字体的图像特征,且以单个文字图像特征为 单位来制作字形特征字典,可满足多字体/字号文档图像的自动检索和管理。下面,说明构成实施文档图像特征抽出处理的文档图像特征抽出部31 的文档图像DB19、文档图像特征DB20、标题区域初始处理部18、文字 图像特征抽出部14。文档图像DB19是在由文档图像输入部21输入文档图像时,对其附加 用于识别的文档ID并进行保存的数据库。标题区域初始处理部18是在文档图像DB19中保存了新的文档图像 时,根据其图像数据来定位并抽出文档图像中的标题区域,然后将文字图 像送到上述的文字图像特征抽出部14的。图9表示对文档图像50以Tl、 T2、 T3这3个区域定位为标题区域的 状态。根据该图9也可以看出,将文档图像50中的标题部分作为标题区域T抽出。由标题区域初始处理部18抽出并送到文字图像特征抽出部14的文字 图像,通常是包含多个文字的文字列的图像。从而,在以下的说明中,将 由标题区域初始处理部18送来的文字图像设为文字列的图像。在本实施方式中,标题区域初始处理部18利用投影法和连通区域统计 分析来进行标题区域T的定位和抽出。另夕卜,这样的标题区域T主要相当 于标题部分,例如可以采用在日本国公开专利公报"特开平9-319747号公 报"、日本国公开专利公报"特开平8-153110,,等所记栽的方法等各种以往 的方法。由于不是将文档图像的全部文字区域(文本区域)作为对象,而是如 上所述仅将标题区域T定位并抽出,所以可减少成为检索对象的信息量, 并缩短检索时间。其中,不是对全部的文本区域进行定位而仅对标题区域T进行定位的 事项,对于检索而言并不是必须的构成要素,也可以对全文的文本区域进 行定位并抽出。但是,对于后述的有意义的文档名的制作而言,仅对标题 区域T进行定位是必须的构成要素。文字图像特征抽出部14,对于从标题区域初始处理部18输入的文字 列的图像,分割成单个文字的文字图像,然后与字形特征字典15的制作时 同样,抽出各文字图像的特征。然后,将抽出的特征,在文档图像特征DB20 中M个文档图1象进行储存。在文档图像特征DB20中,由标题区域初始处理部18抽出的标题区域 T中所包含的文字列的图像的特征信息,作为构成文字列的各文字的各自 的特征(特征矢量)而被储存。如图9所示,对于1个文档图像50,将在所抽出的全部标题区域T1、 T2、 T3…中所包含的文字列的文字图像的特征,即构成文字列的各文字的 文字图像的特征,与文档图像50的文档ID—同储存。下面,说明构成实施索引信息制作处理的索引信息生成部32的文字图 像特征抽出部14、字形特征字典15、特征匹配部16、索引信息DB17、文 档图像特征DB20。文字图像特征抽出部14、字形特征字典15、文档图像特征DB20的功 能,与上述的说明相同。特征匹配部16是从文档图像特征DB20中读出在文档图像的标题区域 T中所包含的文字图像的特征,基于该读出的特征,参照字形特征字典15, 如后述那样制作索引矩阵,并生成文档图像的索引信息的部分。这里,对应l个文档图像生成l个索引信息,并按每个标题区域T制 作索引信息中所包含的索引矩阵。从而,在l个文档图像内存在多个标题 区域T的场合下,在该文档图像的索引信息中包含多个索引矩阵。图7表示制作索引信息DB17的处理。如上所述,当某个文档图像被 输入并被储存到文档图像DB19中时,文字图像特征取出部14b抽出在各 标题区域T中所包含的文字列的文字图像的特征,并储存到文档图像特征 DB20中。特征匹配部16从文档图像特征DB20中读出各标题区域T中所包含 的文字列的图像的特征,且按每个单个文字与字形特征字典15内的基准文 字图像进行匹配,而制作标题区域T各自的索引矩阵。然后,特征匹配部16将该文档图像的其他信息,即文档ID和文档图 像DB19内的该当的文档图像的保存位置的信息等包含在这些索引矩阵 中,而作为索引信息储存到索引信息DB17中。图8表示基于特征匹配部16的制作索引矩阵的处理的一例。图8是说 明针对图9中的标题区域T3中所包含的文字列"去神仙居住的地方"这8 个文字图像,制作索引矩阵的说明图。文字列"去神仙居住的地方"被分割成单个文字图像"去""神""仙" "居""住""的""地""方"。将这样的文字列的图^^分割成单个文字的 图像的处理,可利用以往的方法。在"去"..."方,,这8个文字中,按照排列顺序附加1 8的编号,即 对"去"附加l、对"神"附加2、…对"方,,附加8。该编号相当于索引 矩阵的行编号。对这样的所有的8个文字图像,实施如下的处理,即取出针对被储 存在图8中参照符号A所示的文档图像特征DB20中的文字图像"去,,的 特征(Sl ),并参照字形特征字典15,按照特征相近(匹配度高)的顺序, 选择N个候补文字(S2)。对按照匹配度从高到低的顺序抽出的N个候补文字,附加与抽出顺序 相应的编号,该编号相当于索引矩阵的列编号。然后,才艮据该列编号,来文字相关值(相关值)。在图8中,由参照符号IOO所表示的表表示文字列"去神仙居住的地方" 的索引矩阵的内容。例如,对于第5个文字的"住"的文字图像,在行编 号为5的行中,从匹配度高的第1列,顺序地抽出"任"、"佳"、"住"、…、 "仁"的候补文字。在表100中,例如候补文字"去"的索引矩阵内的位 置是[l, l],候补文字"屑"的位置是[4, 2],候补文字"仁"的位置是 [5, N〗。另外,在图8的表100中,为了有助于理解,对于与文字列的各文字 对应的候补文字附加 进行表示。对于这样的索引矩阵的行数M,根据由标题区域初始处理部18作为 标题区域T而抽出的文字列的图像的文字数来决定。另外,列数N是根据 针对l个文字所选择出的候补文字数来决定。从而,根据本发明,可通过 改变索引矩阵的维数(列数),来灵活地设定索引矩阵内的要素数,即候 补文字数量。因此,在文档图像的检索中,可以进行正确且几乎无遗漏的 检索。在索引矩阵中,可以与检索关键词的输入方法相应地适当设定所选择 的候补文字的信息赋予方式。例如,如果是由键盘l来输入检索关鍵词的 构成,则以文字代码等信息的形式储存候补文字,从而能够对从键盘输入 的检索关键词进行检索。另外,如果是采用图像扫描仪2等以图像数据的形式输入检索关键词 的构成,则也可以抽出检索关键词的特征(特征矢量),以特征(特征矢 量)信息的形式储存候补文字,从而能够对特征矢量彼此进行比较。图9表示索引信息DB17中的索引信息的数据配置例。在存在多个标 题区域T1、 T2、 T3、、 Tn的文档图1象50的索引信息中,针对多个标 题区域T1、 T2、 T3、…、Tn制作的索引矩阵配置成线形。在图9的例中, 文档ID被配置在先头,接下来配置多个索引矩阵,最后配置保存位置的 信息。这里,5xN表示索引矩阵的大小,表示5行N列的情况。通过预先将索引信息进行这样的数据配置,可以迅速地定位文档图像 DB19内的文档图像的储存位置、和文档图像中的标题区域T的位置,并 用于检索结果的显示。另夕卜,也可以根据实际要求,在索引信息中il^口文档图像的其他属性。下面,对实施采用了索引信息的检索处理的检索部22进行说明。图 10是表示检索部22的功能和检索处理的说明图。检索部22包含索引矩 阵检索处理部22a、文字相关值保存部(保存部)22b、相关度计算部22c、 显示顺序决定部(顺序决定部)22d、以及文档图4象抽出部22e。对于索引矩阵检索处理部22a,由关键词输入部24输入检索关键词。 作为关键词输入部24,相当于上述的键盘1或图像扫描仪2等。索引矩阵检索处理部22a是对索引信息DB17进行检索,而检索出包 含所输入的检索关键词的索引矩阵的部分。索引矩阵检索处理部22a将检 索关键词分割成单个文字,搜索包含各检索文字的索引矩阵,在包含检索 文字的场合下,取得该检索文字在索引矩阵内的匹配位置的信息。另外, 关于索引矩阵的抽出顺序例,将在下面采用图ll的流程图来进行说明。文字相关值保存部22b是保存由索引矩阵检索处理部22a取得的匹配 位置的信息、和与该匹配位置的列编号相应的文字相关值的部分。相关度计算部22c是在索引矩阵检索处理部22a中完成了对全部索引 矩阵的检索时,计算出所检索出的索引矩阵与检索关键词之间的相关度的 部分。相关度的计算,是采用被保存在文字相关值保存部22b中的匹配位置 和文字相关值的信息,并按照预先设定的相关度计算方法来进行计算的。 关于相关度的计算,将在下面采用图12、图13来进行说明。另外,这里,构成为文字相关值保存部22b保存匹配位置的信息、和 与该匹配位置的列编号相应的文字相关值,但也可以构成为文字相关值 保存部22b只保存匹配位置,相关度计算部22c由匹配位置的信息取得文字相关值。显示顺序决定部22d是基于由相关度计算部22c计算出的相关度的信 息来决定显示顺序的部分。显示顺序决定部22d按如下方式决定显示顺序, 即从包含相关度高的索引矩阵的文档图像开始,依次在检索结果显示部 25中显示文档图像的内容。文档图像抽出部22e是,以按照由显示顺序决定部22d所决定的顺序 显示文档图像的方式,从文档图像DB19中读出丈档图像的图像数据,并 输出到检索结果显示部25来进行显示。检索结果显示部25按照显示顺序来显示文档图4象。也可以采用缩略图显示等的方式。作为检索结果显示部25,相当于上迷的显示装置3等。这里,说明检索顺序。图11是表示检索部22中的检索顺序的流程图。 当输入了由R个文字列构成的检索关键词,并指示进行检索时,索引矩阵 检索处理部22a首先取出检索关键词的第1个检索文字(Sll )。然后,索引矩阵检索处理部22a对索引信息DB17内的全部索引矩阵 进行第1个检索文字的检索(S12)。在完成了对全部索引矩阵的检索时,判断是否检索到第1个检索文字, 在l个也没有检索到的场合下,转移到S19,在检索到的场合下进入S14。在S14中,索引矩阵检索处理部22a将包含第1个检索文字的索引矩 阵中的匹配位置和文字相关值保存到文字相关值保存部22b中。接着,索引矩阵检索处理部22a取出包含有第l个检索文字的全部的 索引矩阵(S15)。然后,取出作为检索关键词的下一个文字的第2个检索 文字,并对在S15中取出的包含有第1个检索文字的索引矩阵进行检索 (S16)。在完成对在S15中取出的全部索引矩阵的检索时,判断是否检索到第 2个检索文字(sn)。在1个也没有检索到的场合下,与上述同样地转移 到S19,在检索到的场合下进入S18。在S18中,索引矩阵检索处理部22a将包含有第2个检索文字的索引 矩阵中的匹配位置和文字相关值保存到文字相关值保存部22b中。接下来,索引矩阵检索处理部22a再次返回到S16,取出作为检索关 键词中的再下一个文字的第3个检索文字,并对在S15中取出的包含有第 1个检索文字的索引矩阵进行检索。然后,在这里,也在完成检索时,索引矩阵检索处理部22a判断是否 检索到第3个检索文字(S17 ),在1个也没有检索到的场合下,转移到S19, 在检索到的场合下,再次进入S18,进行关于检索关键词的再下一个检索 文字的检索。索引矩阵检索处理部22a, 一直进行这样的S16 S18的处理,即以在 S15中抽出的包含有第1个检索文字的索引矩阵为对象的、第2个以后的 各检索文字的收缩检索,直到在S17中判断为l个也没有检索到、或完成 了对检索关键词内的全部检索文字的检索为止,然后转移到S19。在S19中,取出作为检索关键词中的下一个文字的第2个检索文字。然后,判断检索文字是否都已被检索,即,是否完成了对全部的检索文字的检索(S20),在未完成的场合下,返回到S12。然后,与上述同样,索引矩阵检索处理部22a对索引信息DB17内的 全部索引矩阵进行第2个检索文字的检索。在检索到的场合下,保存索引 矩阵的匹配位置和文字相关值,然后iiXS15,对包含有第2个检索文字 的全部索引矩阵,针对检索关键词的下一个文字,即作为第2个之后的第 3个以后的各个检索文字,反复进行S16 S18,从而进行收缩检索。索引矩阵检索处理部22a,对第3个以后的各检索文字依次进行如下 处理,即在S19中进行对一个检索文字的如上述的检索,并取出包含进 行检索的检索文字的索引矩阵,且用其以后的检索文字来进行收缩检索。然后,在由S19取出了检索关键词内的全部检索文字,并且由S20判 断为完成了对全部检索文字的检索的场合下,进入S21。在S21中,相关度计算部22c如后述那样根据相关度基准,来计算出 检索关键词与各索引矩阵的相关度。然后,显示顺序决定部22d以从包含相关度高的索引矩阵的文档图像 开始进行显示的方式决定显示顺序,文档图^^出部22e从文档图像DB19 中取得文档图像的图像数据,检索结果显示部25按相关度高的顺序来显示 文档图像(S22)。接下来,采用图12、图13,对相关度计算部22c中的根据相关度基准 来计算索引矩阵与检索关键词的相关度计算方法进行说明。在图12的参照符号101的方框中,记栽有检索条件。而且,在参照符 号102的方框中,记栽有用于计算相关度的某个假设的检索关键词与索引 矩阵的相对关系。在方框IOI所示的检索条件下,在检索关键词与索引矩 阵为如方框102所示的相对关系的场合下,可以通过由方框103所示的计 算式来计算出检索关键词与索引矩阵的相关度。首先,对方框101的检索条件进行说明。检索关键词的文字数为R个, 第1个检索文字为C1、第2个为C2、…、第R个为Cr。成为检索对象的索引矩阵为MxN维矩阵。即,作为标题区域T而抽 取出的文字列图像的文字数为M个,作为文字列的各文字的各个候补而选 择出的候补文字数为N个。由于作为检索文字与^M补文字的相关值的文字相关值,是相应于索引矩阵的各位置来决定的,所以成为与索引矩阵相同次数的矩阵。即,文字相关值矩阵的权重为MxN维矩阵。例如,权重[i] [j]表示位于索引矩阵 中的位置[i, j] ( = Index [i, j])上的候补文字匹配的场合下的文字相关值。 在本实施方式中,如果索引矩阵的列编号[j]相同,则与行编号[i]无关, 文字相关值相同。行的相关度加权因数Q是在索引矩阵中相邻的2行中检索文字匹配的 场合下,对这些2行的文字相关值附加的加权。在相邻的2行中检索文字 匹配的场合下,包含检索关键词的连续的2个文字的可能性大。在将行的相关度加权因数Q设定得高时,对于相关度计算部22c计算 出的相关度的影响度,在连续匹配的2行的文字相关值中变大,但是在不 相邻的各行的文字相关值中变小。即,通过将行的相关度加权因数Q设定 得高,接近以词汇为单位进行检索的结果,反之,通过将行的相关度加权 因数Q设定得小,接近以单字为单位进行检索的结果。将检索文字Cl匹配的文字相关值表示为Wl,将检索文字C2匹配的 文字相关值表示为W2,…,将检索文字Cr匹配的文字相关值表示为Wr。接下来,对方框图102所示的为了计算相关度而假设的检索关键词与 索引矩阵之间的相对关系进行说明。检索关键词与索引矩阵之间具有全部的检索文字C1, C2,…,Cr与 索引矩阵内的任意候补文字相匹配的关系。将检索文字Cl, C2,…,Cr 匹配的^^矣补文字在索引矩阵内的位置,即匹配位置表示为[Cli, Clj]、 [C2" C2j],…,[Cri, Crj]。而且,作为进一步的相对关系,具有方框102所示的式(1)的关系,即C (k+l ) i = Cki+l, C (m+l) i = Cmi+l (m>k)在该式中,k、 m表示构成检索关鍵词的各检索文字的相对位置。另 外,C (k+l ) i表示与检索关键词的第k+l个检索文字匹配的候补文字的 索引矩阵内的行编号,Cki表示与检索关键词的第k个检索文字匹配的候 补文字的索引矩阵内的行编号。从而,C (k+l) i = Cki+1表示与检索关键词的笫k+l个检索文字匹 配的候补文字在索引矩阵内的行编号,和在与检索关键词的第k个检索文 字匹配的候补文字在索引矩阵内的行编号上加1的编号相同。换言之,C<formula>formula see original document page 19</formula>表示检索关鍵词的笫k+l个检索文字和第k个检索文字 具有分别与索引矩阵中的相邻的2行相匹配的关系。C ( m+l ) i = Cmi+l也同样,表示检索关键词的笫m+l个检索文字和 第m个检索文字具有分别与索引矩阵中的相邻的2行相匹配的关系。在检索关键词与索引矩阵具有这样的相对关系的场合下,可以通过方 框103所示的式(2)来计算出检索关键词与索引矩阵的相关度。<formula>formula see original document page 19</formula><formula>formula see original document page 19</formula>在该式中,Wl是第1个检索文字Cl匹配的文字相关值,W2是第2 个检索文字C2匹配的文字相关值,W (k-l)是第(k-l)个检索文字C (k-l)匹配的文字相关值。同样,W (k)是第k个检索文字Ck匹配的 文字相关值,W (k+l)是第(k+l)个检索文字C (k+l)匹配的文字相 关值。另外,W (m-l)是第(m-l)个检索文字C (m-l)匹配的文字相 关值。同样,W (m)是第(m)个检索文字C (m)匹配的文字相关值, W (m+l)是第(m+l)个检索文字C (m+l)匹配的文字相关值,另夕卜, 最后的Wr是第r个的最后的检索文字Cl匹配的文字相关值。这样,在相关度的计算中,构成检索关键词的全部检索文字的文字相 关值W被累加(累计)计算。而且,在式(2)中的Q * (Wk+W (k+l))表示由于检索关键词 中的第k个检索文字Ck和第(k+l)个检索文字C (k+l)分别与索引矩 阵中的相邻的2行相匹配,所以对文字相关值Wk和文字相关值W(k+l) 乘以行的相关度加权因数Q。关于Q, (Wm + W (m+l))也同样。另外,检索关键词的第k-l个检索文字与第k个检索文字,由于不具 有与相邻的2行相匹配的关系,所以对W (k-l)和Wk双方不乘以相关 度加权因数Q。关于W (m-l)和Wm也同样。另夕卜,由于图12的方框102所示的检索关键词与索引矩阵的相对关系 中,具有全部的检索文字C1、 C2、、 Cr与索引矩阵内的任意候补文字 相匹配的关系,所以在式(2)中,将Wl Wr的全部的检索文字的文字相 关值累计计算。但是,这只是一例,例如,在虽然具有式(1)的相对关系,但检索文 字Cl和检索文字Cr不与索引矩阵内的任意候补文字相匹配的场合下,计算相关度的计算式为如下计算式,相应于累积项的减少,当然其相关度会降低。<formula>formula see original document page 20</formula>( r画l)另外,在具有全部检索文字C1、 C2、…、Cr与索引矩阵内的任意候 补文字相匹配的关系,并且,具有检索关键词的第k+l个检索文字和第k 个检索文字、以及第k+2个检索文字和第k+l个检索文字分别与相邻的2 行相匹配的关系的场合下,计算相关度的计算式为如下计算式。<formula>formula see original document page 20</formula>在该场合下,由于检索关键词的第k-l个检索文字和第k个检索文字 不具有与相邻的2 4亍相匹配的关系,所以对W (k-l)和Wk双方不乘以 相关度加权因数Q。下面,采用图13,对相关度计算的具体例进行说明。这里,求出图8 所示的文字列"去神仙居住的地方,,的索引矩阵(参照表100)与检索关键 词"神仙"的相关度。图13的方框104表示检索条件。相关值矩阵Weight是MxN维,文 字相关值是Weight[i] = [1, 1-1/N, l画2/N,, 1/N] (i = 0, 1,…,M-l), 行的相关度加权因数Q。检索关键词"神仙,,分别被分割成第1个检索文字"神"和第2个检索文 字"仙,,,对于这两个字,分别在索引矩阵内的候补文字中进行检索。参照图8的表100可看出,检索文字"神"与索引矩阵中的位置[i、 j] 的[2、 2]相匹配,检索文字"仙"与索引矩阵中的[3、 l]相匹配。从而,如方框105所示,检索文字"神"的文字相关值为(l-l/N),检 索文字"仙"的文字相关值为1。而且,检索文字"神"的行编号为[2],检索文字"仙"的行编号为[3], 如图8的表100所示,这2个检索文字分别与索引矩阵中的相邻的2行相匹配。从而,如方框106所示那样,对检索文字"神"的文字相关值(l-l/N) 和检索文字"仙,,的文字相关值1乘以行的相关度加权因数Q,检索关键词的"神仙"与文字列"去神仙居住的地方"的索引矩阵之间的相关度为Siml)egree = Q * ((1國1/N ) +1 )。检索关键词与索引矩阵之间的相关度,通过按照用户的要求灵活地调 整相关值矩阵中的加权(文字相关值)和行的相关度加权因数Q等的参数, 可以获得更理想的检索结果。用户可釆用键盘1等,相应于需要而适当设定相关值矩阵中的加权(文 字相关值)和行的相关度加权因数Q等的参数。而且,基于这样的图4象特征的索引和匹配方式,可以满足多种语言的 文档图像的索引和检索。不需要进行文字识别,计算量少。本发明不限于 中文,可以应用于各种语言的文档图像。最后,对具备词汇分析功能(词义分析功能)的检索处理进行说明。 如图l所示那样,在本实施方式的文档图像处理装置中,在关键词输入部 24与检索部22之间,设有词汇解析部23。图14中表示具备词汇分析功能 的检索处理。词汇解析部23由词汇分析处理部23a和概念字典23b构成。词汇分 析处理部23a,在从关键词输入部24输入检索关键词时,参照词义字典 23b,对检索关键词的词汇进行分析。例如,在作为检索关键词输入"中日关系"时,词汇分析处理部23a 作为与"中日关系"相关的单词,将例如"中国"、"日本"、"关系,,这3 个输入到检索部22。这些"中国"、"日本"、"关系"具有或的关系,检索 式为"中国"或"日本"或"关系"。将该检索式"中国"或"日本"或"关系"输入到检索部22,检索部 22对索引信息DB17进行检索,抽出包含"中国"的文档图像、包含"曰 本"的文档图像、和包含"关系"的文档图像。由此,不仅能够检索出直接包含所输入的检索关键词的文档图像,而 且还能够检索出相关的文档图像。接下来,对实施文档图像管理处理的文档图像管理部57进行说明。文 档图像管理部57由文字图像特征抽出部14、字形特征字典15、特征匹配 部16、标题区域初始处理部18、文档图像DB19、文档围像特征DB20、 文档名制作部51、文档图像DB管理部52、文档图像显示部53、指示输 入部54构成,下面对这些进行说明。关于文字图像特征抽出部14、字形特征字典15、特征匹配部16、标 题区域初始处理部18、文档图像DB19、文档图《象特征DB20的功能已进 行了说明。在此,仅对为实施文档图像管理处理而进一步所需的功能进行 适当说明,该文档图像管理处理中制作有意义的文档名并对文档图像特征 DB20的文档图像进行管理。采用图15说明文档图像管理处理。从由图像扫描仪2及数字摄影装置 6构成的文档图像输入部21,输入文档图像1 N。对于所输入的文档图像1 N,标题区域初始处理部18对各个文档图 像的内容进行分析,并抽取出标题区域获取文字列。接着,虽然未图示, 但文字图像特征抽出部14与上述同样,将所抽取出的标题区域中包含的文 字列的文字图像按单个文字进行分割,并抽出各文字图像的图像特征。然后,以这样抽出的文字图像的图像特征为M,由字形特征字典15 及特征匹配部16构成的候补文字列生成部55,选择图〗象特征的匹配度高 的文字图像作为候补文字,并制作成与所抽取出的标题区域中包含的文字 列相应的候补文字列,而且采用词义解析法来调整构成该候补文字列的各 候补文字,并设为有意义的候补文字列。更具体地说,候补文字列生成部55,以由文字图像特征抽出部14抽 出的文字图像的图像特征为1^,从字形特征字典15中,以图像特征的匹 配度从高到低的顺序选择出N个(N>1的整数)文字图4象作为候补文字, 在上述文字列的文字数为M个(M>1的整数)的场合下,制作成MxN 维的索引矩阵。这就是上述的特征匹配部16的处理。接下来,特征匹配部16,基于制作的索引矩阵,来制作将位于该索引 矩阵中的第一列的各行的候补文字按顺序排列的候补文字列。然后,对构 成该候补文字列的连续的各行的候补文字所构成的单词的词义进行解析, 并调整各行的第一列的候补文字,从而使候补文字列带有意义。图16是表示调整所制作的索引矩阵而使第一列的文字列成为具有意 义的文字列,为此采用词义解析法来进行调整的具体例的说明图。图16的上部分所示的调整前的索引矩阵109,与图8所示的表100中 示出的索引矩阵相同。在索引信息DB17中是以该状态储存的。由这样的 索引矩阵109制作成的候补文字列为"去伸仙居任酌地方",不具有意义。用作有意义的文档名的候补文字列中,主语、谓语、以及宾语的连接 词关系等必须在意义上正确。在此,利用词义解析,变换成有意义的候补文字列。具体地说,对于多个错误候补文字,使用概念词典,分析多个错 误候补文字与候补文本的其它单词之间的意义信息,而将候补文字列修改 为有意义的文字列。在这种词义解析中所采用的语言模型61,只要提供由所有的汉字开始 的活字的统计数据即可。换言之,利用该语言模型61的主要概念,可以在 技术上确立自动搜索系统,能够得到与中文报纸的稿本有关的统计数据。例如,作为实例,可使用Bi-gram模型(语言模型)。Bi-gram是两个 文字、两个音节、或者两个单词的群(group),且作为文本的简单统计分 析的基础被广泛使用。以符号序列来示出的场合下,将各符号的外观设为 独立事项,并将上述符号序列的概率如下定义。并且,在上述功能的分解中,可以使用概率的链锁律。将中文设为 (N-l )阶马尔可夫链(符号的概率以N-l阶符号的前出为条件)。该语言 模型被称为N-gram模型。确立性的N-gram模型的使用,包含长期带来良好结果的统计上的自 然语言处理。N-gram通常由采用文本大的整个文档(语料库)中的文字 及单词的共起而得到的统计来构成,且规定文字连锁或单词连锁的确立。N-gram中,与通常直接从语料库中抽出的场合相比,具有能够覆盖非常 大的语言的优点。在对语言模型的应用中,由于计算机的限制和没有限制 的语言的特性(文字、单词无限量地存在),所以将N设为N-2,且设为 Bi-gram模型。图16的下部分表示调整后的索引矩阵110。第2行的第1列的"伸" 作为错误候补文字^皮置换成第2列的"神"。同样,第5行的第1列的"任" 被置换成第3列的"住"。然后,第6行的第1列的"酌",鉴于其前后的 "居住"和"地方"之间的关联性而被认为是错误候补文字,并被置换成 第2列的"的"。这样的索引矩阵110的第1列中包含的候补文字列变为"去神仙居住 的地方",从而具有意义。并且,特征匹配部16,也可以将这样的调整后 的索引矩阵110储存在索引信息DB17中。再次,返回到图15,由候补文字列生成部55如上生成的有意义的候 补文字列被送到文档名制作部51。文档名制作部51,对所输入的文档图像,制作出包舍有由候补文字列 生成部55生成的有意义的候补文字列的文档名。以下,将包含有该有意义的候补文字列的文档名称为"有意义的文档名"。从时间数据等发生部60向文档名制作部51,还输4示文档图像被 输入的时间及输入路径的数据等其它数据。文档名制作部51还可以采用至 少包含从时间数据等发生部60输入的时间数据的其它数据,来生成文档 名。例如,也可以构成为将时间数据等其它数据之中的时间数据包含在 有意义的文档名中,且将有意义的文档名由时间数据和有意义的候补文字 列来构成。或者,也可以采用时间数据等其它数据,来对相同的文档图像制作另 外的文档名。以下,将由时间数据等其它数据等构成的文档名称为原始的 文档名。通过这样构成,对一个文档图像,可以利用有意义的文档名、以及由 时间数据等其它数据等构成的原始的文档名来进^f于管理。对于每一个文档图像生成的有意义的文档名、以及原始的文档名,被 送到文档图像DB管理部52,且在文档图像DB19中,与文档图像的图像 数据相对应地进行储存。文档图像DB管理部52,当用户采用由键盘l等构成的图l所示的指 示输入部54,来输入文档图像Dm9中所存储的文档图像的阅览指示等时, 在由显示装置3等构成的图1的文档图像显示部53上,显示阅览画面。图17中表示在文档图像显示部53上显示的、文档图像DB19中所储 存的文档图^^的阅览画面的一个例子。图中,左侧所示画面201表示所存储的文档图4象按原始的文档名列表 表示的状态。在画面201的上面,示出了各文档图像的输入顺序。在纸面 上最靠前的带有"AR - C262M_20060803—103140"的原始的文档名的文 档图像,是在该画面中最先被输入的文档^像。"20060803"表示输入的日 期(2006年8月3日),"103140"表示时间(10点31分40秒)。在这样的显示状态下,通过选择画面上所显示的"有意义的文档名" 的标识符等的操作,阅览画面的显示在图中将转移到右側所示的画面202。 画面202表示所存储的文档图像按有意义的文档名列M示的状态。该画面202与画面201对应,在此,画面201的上部所示的、纸面上 最靠前的带有"定格惠州西湖,,的有意义的文档名的文档图像,是在该画面中最先被输入的文档图像。这样,能够按有意义的文档名来进行阅览,由此用户可容易实施所存 储的文档图像的管理及搜索。此外, 一并制作出原始的文档名,由此可同 时看到时间数据等信息与文档名。另外,在该文档图像处理装置中,采用制作成的索引矩阵来制作索引信息,并用于检索处理中。因此,标题区域初始处理部18抽出文档图像中 包含的多个标题区域T,并制作各自的索引矩阵。然而,如果仅仅以对文 档图像制作有意义的文档名为目的的话,则没有必要抽出文档图像中包含 的多个标题并制作各自的索引矩阵。换言之,可以构成为对于最能表示出文档图像的标题区域中包含的 标题的文字列(文字图像列),制作出索引矩阵,并基于此,使用特征匹 配的文字列,来制作带有意义的名称。作为最能表示出文档图像的标题区域,例如可以设为所抽出的多个标 题区域之中、存在于文档图像的最上面一行的区域。这是因为重要的标题 很多场合下配置在文档图像的最上面 一行。此外,也可以将标题区域中包含的文字的大小设为比某个阈值大,且 比所抽出的其它标题区域中的文字大。这是因为重要的标题很多场合下用 比其它标题大的文字大小来记载。或者,也可以将标题区域中包含的文字的字体(字形)类型,设为与 所抽出的其它标题区域的文字不同的字体类型。这是因为重要的标题很多 场合下用与其它标题不同的字体(字形)来记栽。此外,也可以附加其他基准,并且各基准可以分别采用,也可以组合来采用。此外,如该文档图^^处理装置那样,在对于一个文档图l象抽出多个标 题区域,并制作出各自的索引矩阵的构成中,通过标题区域的配置位置、 文字大小、或字体,来特定最重要的标题区域的索引矩阵即可。此外,如 果是这种场合,则特别优选为,从所抽出的多个标题区域的索引矩阵中, 制作出最频繁出现的单词包含在候补文字列中的索引矩阵。最后,文档图像处理装置的各方框,特别是字体正规化处理部l2、文 字图像特征抽出部14、特征匹配部16、标题区域初始处理部18、检索部 22、词汇解析部23、文档名制作部51、文档图像DB管理部52等也可以 由硬件逻辑电路构成,也可以如下那样采用CPU由软件来实现。即,文档图像处理装置10具有执行用于实现各功能的控制程序的命令 的CPU (central processing unit )、储存有上述禾呈序的ROM (read only memory )、展开上述程序的RAM ( random access memory )、储存上述程 序和各种数据的存储器等存储装置(记录媒体)等。而且,本发明的目的 可通过如下过程来达到,即将记录有计算机可读取的、实现上述的功能 的软件即文档图像处理装置的控制程序的程序代码(执行形式程序、中间 代码程序、源程序)的记录媒体,提供给上述文档图像处理装置,且由该 计算机(或CPU、 MPU)读出记录在记录媒体上的程序代码并执行。作为上述的记录媒体,例如可以采用磁带或盒式磁带等的磁带类、包 括软(注册商标)盘/硬盘等磁盘和CD-ROM/MO/MD/DVD/CD-R等光盘 的盘类、IC卡(包括存储卡)/光卡等的卡类、或掩模ROM/EPROM /EEPROM/闪存ROM等的半导体存储器类等。另外,也可以将文档图像处理装置构成为能够与通信网络连接,通过 通信网络来供给上述程序代码。作为该通信网络,没有特别的限定,例如 可以利用互联网、内部网、外联网、LAN、 ISDN、 VAN、 CATV通信网、 虛拟专用网(virtual private network )、电话线路网、移动体通信网、卫星 通信网等。另外,作为构成通信网络的传送媒体,没有特别的限定,例如 既可以利用IEEE1394、 USB、电力线输送、有线TV线路、电话线、ADSL 线路等的有线,也可以利用IrDA、远程控制那样的红外线、Bluetooth (注 册商标)、802.11无线、HDR、移动电话网、卫星线路、地面波数字网等 的无线。另外,本发明也能够以上述程序代码通过电子传送而具体化的被 叠加在载波中的计算才几数据信号的形式来实现。如上所述,本发明的文档图像处理装置是对所存储的文档图像赋予文 档名并进行管理的文档图像处理装置,其特征在于,具有字形特征字典, 其以单个文字为单位储存有文字图像的图像特征;标题抽出部,其抽取出 在所输入的文档图像中存在的标题区域;图像特征抽出部,其将由上述标 题抽出部抽取出的标题区域中所包含的文字列的文字图像按单个文字进 行分割,并抽出各文字图像的图像特征;候补文字列生成部,其以由上述 图像特征抽出部抽出的文字图像的图像特征为^ 出,参照上述字形特征字典,选择图像特征的匹配度高的文字图像作为候补文字,并制作成相应于 上述文字列的候补文字列,而且采用词义解析法来调整构成该候补文字列 的各候补文字,并设为有意义的候补文字列;文档名制作部,其对上述所 输入的文档图像,制作包含上述候补文字列生成部中生成的有意义的候补文字列的第一文档名。根据上述构成,标题抽出部对文档图像中的标题区域进行定位,并抽 取出该区域中所包含的文字列,即标题。接下来,图像特征抽出部,将由 所抽取出的标题的文字列构成的图像按单个文字进行分割,并抽出各文字 图像的图像特征。然后,候补文字列生成部,以由上述图像特征抽出部抽出的文字图像 的图像特征为基础,参照字形特征字典,选择图像特征的匹配度高的文字 图像作为候补文字,并制作成相应于上述文字列的候补文字列。候补文字 列,由于具有与标题区域中所包含的文字列相似的特征,所以也有候补文 字列本身与抽取出的标题区域的文字相同而具有意义的场合。然而,由于为字形的特征的匹配,所以也有可能是形状相似的其它文 字。在此,候补文字列生成部,采用词义解析法调整构成该候补文字列的 各候补文字,并"&为有意义的候补文字列。由此,对于由与所抽取出的标 题区域中包含的标题相同的文字构成、且带有相同意义的候补文字列,进 行高概率的调整。文档名制作部对于所输入的文档图像,制作由候补文字列生成部生成的包含有意义的候补文字列的文档名(第一文档名有意义的文档名), 利用该文档名来管理文档图像。从而,不用麻烦用户的手,就可以对所存储的文档图像自动地赋予有 意义的文档名,而且用户可以利用反映了文档图〗象的内容的文档名来阅览 所存储的文档图像,可以简单地实施所存储的文档图像的管理及搜索。此外,上述文档图像处理装置既可以利用硬件来实现,也可以通过使 计算机执行程序来实现。具体是,本发明涉及的程序是使计算机作为上述 的各个部分动作的程序,本发明涉及的记录媒体中记录有该程序。在由计算机执行这些程序时,该计算机作为上述文档图像处理装置进 行动作。从而,可以起到与上述文档图像处理装置相同的效果。在本发明的具体实施方式
中的各项列举的具体的实施方式或实施例, 仅仅是用于清楚地说明本发明的技术内容的,本发明不受这样的具体例的 限定,且不应被解释成狭义的范围,在本发明的精神和本发明的权利要求 书所记载的范围内,可以进行各种变形来实施。
权利要求
1. 一种文档图像处理装置,对所存储的文档图像赋予文档名并进行管理,该文档图像处理装置的特征在于,具有字形特征字典,其以单个文字为单位储存有文字图像的图像特征;标题抽出部,其抽取出在所输入的文档图像中存在的标题区域;图像特征抽出部,其将在由上述标题抽出部抽取出的标题区域中所包含的文字列的文字图像按单个文字进行分割,并抽出各文字图像的图像特征;候补文字列生成部,其以由上述图像特征抽出部抽出的文字图像的图像特征为基础,参照上述字形特征字典,来选择图像特征的匹配度高的文字图像作为候补文字,制作成相应于上述文字列的候补文字列,而且采用词义解析法来调整构成该候补文字列的各候补文字,并设为有意义的候补文字列;文档名制作部,其对上述所输入的文档图像,制作包含由上述候补文字列生成部生成的有意义的候补文字列的第一文档名。
2. —种文档图像处理装置,对所存储的文档图像赋予文档名并进行管 理,该文档图像处理装置的特征在于,具有字形特征字典,其以单个文字为单位储存有文字图像的图像特征; 标题抽出部,其抽取出在所输入的文档图像中存在的标题区域; 图像特征抽出部,其将由上述标题抽出部抽取出的标题区域中所包含的文字列的文字图像按单个文字进行分割,并抽出各文字图像的图像特征;候补文字列生成部,其以由上述图像特征抽出部抽出的文字图像的图 像特征为基础,从上述字形特征字典,按图像特征匹配度从高到低的顺序 选择N个文字图^f象作为候补文字,其中N为N>1的整数,且将上述文字 列的文字数设为M个,其中M为M>1的整数,在该场合下,制作MxN 维索引矩阵,基于该索引矩阵,来制作将该索引矩阵中的连续的各行的一 个候补文字依次排列的候补文字列,并且采用词义解析法来调整构成该候 补文字列的各候补文字,并设为有意义的候补文字列;文档名制作部,其对上述所输入的文档图像,制作包含由上述候补文 字列生成部生成的有意义的候补文字列的第一文档名。
3. 根据权利要求l或2所述的文档图像处理装置,其特征在于,上述 文档名制作部在第一文档名中包含上述所输入的文档图像被输入的时间 的数据。
4. 根据权利要求1或2所述的文档图像处理装置,其特征在于,上述 文档管理部除第 一文档名之外另外制作包含上述所输入的文档图像被输 入的时间的数据的第二文档名,并对一个文档图<象利用第一文档名和第二 文档名来进行管理。
5. 根据权利要求1或2所述的文档图像处理装置,其特征在于,上述 标题抽出部利用投影法和连通区域统计分析法,来抽取出文档图像中的标 题区域。
6. 根据权利要求1或2所述的文档图像处理装置,其特征在于,上述 图像特征抽出部利用网格方向特征和文字图像外围特征的组合,来抽出文 字图像的图像特征。
7. —种文档图^(象处理方法,对所存储的文档图傳J昧予文档名并进行管 理,该文档图像处理方法的特征在于,具有标题抽出步骤,抽取出在所输入的文档图像中存在的标题区域;图像特征抽出步骤,将在上述标题抽出步骤中抽取出的标题区域中所包含的文字列的文字图像按单个文字进行分割,并抽出各文字图像的图像特征;候补文字列生成步骤,以在上述图像特征抽出步骤中抽出的文字图像 的图像特征为基础,参照以单个文字为单位储存有文字图像的图像特征的 字形特征字典,来选择图像特征的匹配度高的文字图像作为候补文字,并 制作成相应于上述文字列的候补文字列,而且采用词义解析法来调整构成 该候补文字列的各候补文字,并设为有意义的候补文字列;文档管理步骤,对上述所输入的文档图《象,制作包含上述候补文字列 生成步骤中生成的有意义的候补文字列的第一文档名,并进行管理。
8. —种文档图像处理方法,对所存储的文档图像赋予文档名并进行管 理,该文档图^f象处理方法的特征在于,具有标题抽出步骤,抽出在所输入的文档图像中存在的标题区域;图像特征抽出步骤,将在上述标题抽出步骤中抽出的标题区域中所包 含的文字列的文字图像按单个文字进行分割,并抽出各文字图像的图像特征;特征匹配步骤,以在上述图像特征抽出步骤中抽出的文字图像的图像 特征为基础,从以单个文字为单位储存有文字图像的图像特征的字形特征字典中,按图像特征匹配度从高到低的顺序选择N个文字图像作为候补文 字,其中N为N>1的整数,且将上述文字列的文字数i殳为M个,其中M 为M〉1的整数,在该场合下,制作MxN维索引矩阵;文档管理步骤,对上述所输入的文档图像,基于上述特征匹配步骤中 制作出的索引矩阵,来制作包含将该索引矩阵中的连续的^f亍的一个候补 文字按顺序排列的候补文字列的第一文档名,并进行管理。
全文摘要
本发明的文档图像处理装置,抽取出文档图像中的标题区域的图像,将其按单个文字进行分割,并抽出各文字图像的图像特征,基于该图像特征,从以单个文字为单位储存有文字图像的图像特征的字形特征字典中,按照匹配度从高到低的顺序,选择出N个文字图像作为候补文字,其中N为N>1的整数,并制作成抽取出的文字列的文字数M×N维索引矩阵。然后,基于所制作出的索引矩阵,制作出反映了文档图像内容的有意义的文档名,并对所存储的文档图像进行管理。由此,可以提供一种不用麻烦用户的手,就可自动制作反映了文档图像内容的有意义的文档名并进行管理的文档图像处理装置及方法。
文档编号G06K9/62GK101226595SQ200710000960
公开日2008年7月23日 申请日期2007年1月15日 优先权日2007年1月15日
发明者宁 乐, 波 吴, 吴亚栋, 窦建军, 靖 贾 申请人:夏普株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1