检索设备和检索方法

文档序号:2726212阅读:165来源:国知局
专利名称:检索设备和检索方法
技术领域
本发明涉及一种检索设备和检索方法。更具体地说,本发明涉及 在使用具有存储由例如扫描仪读取的文档数据信息的功能的检索设备 从所存储的文档数据当中检索目标文档数据的情况下,使用在文档数据中包含的图像数据作为检索键(search key)来检索目标文档数据的 技术。
背景技术
在最近的办公室环境中,随着工作变得复杂和信息量的增加,要 管理的文档数据的量很大地增加。因此,甚至更为需要从大量的文档 中检索目标文档。通过把多条文档信息转换成电子数据并作为文档数 据来存储,文档检索设备或文档检索系统能够在检索目标文档时使用 这个转换的信息。已经提出了各种文档检索方法,包括文档属性检索,其检索与 文档数据相关的信息(即,属性数据);全文检索,其检索在文档数 据中包含的字符串;以及图像数据检索,其检索在文档数据中包含的 图像数据。为了执行这些检索方法,需要向检索设备(检索引擎)输入检索 键。与诸如属性检索或全文检索之类的使用字符串作为键的检索方法:i简单地指定或输入这种图像检索键。。 ' 、 *例如在专利参考文献1中所述的图像存储设备利用扫描仪扫描具 有预先指定区域的文档来获得检索键。此外,在专利文献2中所述的 图像存储设备通过如下方式来提取检索键在窗口上显示利用扫描仪 进行扫描而获得的文档数据,并利用例如鼠标指定要用作检索键的区域。此外,在专利参考文献3中所述的一种类似图像检索设备预先登 记要用作检索键的的图像数据,并在登记的图像数据当中指定检索键。专利参考文献1:曰本专利特开5 - 274367号专利参考文献2:日本专利特开5-274368号专利参考文献3:日本专利特开10-340272号发明内容本发明要解决的问题然而,在专利参考文献l中所述的图像存储设备中,为了指定要 登记为检索键的区域,需要在原始文档中写入区域信息。此操作对于 用户M烦的。此外,为了保持原始文档清洁,文档必须被复印。在专利参考文献2中,为了使用户能够指定作为键的区域,需要 诸如笔设备或鼠标之类的操作装置来指定所述区域。诸如具有扫描仪 仪功能、复印功能、以及打印机功能的多功能外围设备之类的OA装 置通常没有这种操作装置。因而,必须新增加除了图像检索之外不使 用的操作装置,并且该操作装置的附加位置或容纳方法产生新问题。 此外,为了从足够大的显示区域提取多个检索键,用户必须进行多次 麻烦的区域指定。在专利参考文献3所述的类似图像检索设备中,用户难于自由地 选择要被记录为检索键的图像数据,因而,可能降低检索精度。本发明是考虑上述情况而作出的,其目的在于,使用户能够容易 而简单地指定或输入作为检索键的图像数据。本发明的另一个目的在于,即使在文档数据的被限制的显示区域 内,也使用户能够容易地指定或输入作为检索键的图像数据。用于解决问题的手段为实现上述目的,按照本发明的一个方面,提供一种用于根据预 定检索键从多个存储的数据中检索所需数据的检索设备,其包括 读取装置,用于读取文档图像以获得图像数据; 区域提取装置,用于提取在所述图像数据中的图像区域;显示装置,用于显示信息; 输入装置,用于输入指令;以及列表显示装置,用于在所述显示装置上显示与由所述区域提取装 置提取的图像区域对应的多个图像的列表;其中当所述输入装置选择在所述列表中显示的所述多个图像中的 至少一个时,使用所选择的图像作为检索键来执行检索。为了实现上述目的,按照本发明的另一个方面,提供一种用于根 据预定检索键从多个存储的数据中检索所需数据的检索方法,包括以 下步骤读取文档图像以获得图像数据; 提取在所述图像数据中的图像区域;在用于显示信息的显示装置上显示与在所述区域提取步骤中提取 的图像区域对应的图像的列表;以及当用于输入指令的输入装置选择在所述列表中显示的所述图像中 的至少一个时,使用所选择的图像作为检索键来执行检索。即,在本发明中,用于根据预定检索键从存储的数据中检索数据在用于向用户显示信息的显示装置上:示与所提取的图像区域对应的 图4象的列表,当用户利用用于使用户输入指令的输入装置选择列表中 显示的图像中的至少一个时,使用所选择的图像作为检索键来执行检 索。这种布置提取文档中的图像,显示所提取的图像的列表,并使用 由用户选择的图像作为检索键来执行检索。因而,用户可以容易而简单地指定或输入作为检索键的图像,增 加了用户的便利性。使计算机设备执行上述的检索方法的计算机程序和存储计算机程 序的存储介质也实现上述目的。发明效果按照本发明,检索设备提取文档中的图像作为图像数据,显示图说明书第4/17页像数据的列表,并利用由用户从列表中显示的图像数据中选择的图像 数据作为检索鍵来执行检索。因而,用户可以容易而简单地指定或输入作为检索键的图像数据, 增加了用户的便利性。从下面的示例性实施例(参照附图)的描述可以清楚地看出本发 明的其它特征。


包括在说明书中并构成说明书的一部分的附图与说明书 一起用于 例示本发明的实施例,用于解释本发明的原理。图1是用于解释按照本发明的实施例的文档检索设备的总体布置的方块图;图2是用于解释图l所示的文档检索设备的主单元的硬件配置的 方块图;图3是表示按照本发明的文档检索设备的外观的视图; 图4是表示按照本发明的文档检索设备的主单元的软件配置的方 块图;图5是表示按照本发明的文档管理设备的软件配置的方块图;图6是表示在按照本发明的文档管理设备的检索处理中在操作单 元上显示的窗口的转换示例的示意图;图7是表示在选择"图像检索"之后直到执行检索之前的、由按 照本发明的文档管理设备的主单元执行的处理的流程图;以及图8是表示在选择"经由OCR的关键字检索"直到执行检索之 前的、由按照本发明的文档管理设备的主单元执行的处理的流程图。
具体实施方式
下面将参照附图详细说明本发明的优选实施例。注意,在下面实 施例中的每个元件并不旨在限制本发明的范围,而仅仅作为示例。 图1是用于解释按照本发明的实施例的文档检索设备的总体布置本实施例的文档检索设备1000包括作为图像输入装置的扫描仪 1002;作为图像输出装置的打印机1003;和作为用户接口单元的操作 单元1004。设备1000还包括用于控制上述部分的主单元1001,以及 具有用于存储、管理和检索文档数据的功能的文档管理系统1005。扫 描仪1002、打印机1003和操作单元1004中的每一个通过相应接口经 由内部总线(未示出)连接到主单元1001。主单元1001连接到诸如LAN 1010之类的网络传输装置和公共交 换电话网1020。文档管理系统1005也连接到LANIOIO,以便经由LAN 1010与主单元1001传递数据和命令。代替在文档检索设备1000中提 供文档管理系统1005,具有与文档管理系统1005相同功能的外部服 务器可通过LAN 1010连接到文档检索设备1000的外部。本实施例的文档检索设备1000被配置为可由用户识别为一个设 备。文档检索设备1000被设计为多功能外设(MFP),其不仅具有文档 检索功能,而且具有复印功能、传真功能、打印机功能和文档存储功 能。图2是用于解释图1所示的文档检索设备的主单元1001的硬件配 置的方块图。图1中的标号IOOI对应于图2中的2000, 1002对应于 2070, 1003对应于2080, 1004对应于2050, 1005对应于2060, 1010 对应于2020, 1020对应于2010。参见图2,主单元2000是控制器,用于输入和/或输出文档数据、 图像信息和装置信息。主单元2000通过与其相连的作为图像输入装置 的扫描仪2070和作为图像输出装置的打印机2080实现扫描仪和打印 机功能。主单元2000还通过LAN 2020与诸如文档管理系统2060或 PC (未示出)之类的外部装置进行通信,从而实现存储、读取和检索 文档的功能。主单元2000还连接到公共交换电话网(PSTN)2010,以 实现传真功能。作为用户接口(UI)以对用户提供这些功能的操作单元 2050连接到主单元2000。CPU 2001是用于控制整个主单元2000的控制器。RAM 2002是用于操作CPU 2001的系统工作存储器。RAM 2002还用作用于暂时 存储图像数据的图像存储器。ROM 2003是用于存储系统的引导程序 的引导ROM。 HDD 2004是硬盘驱动器,用于存储系统软件、图像数 据、与图像数据相关的属性数据、以及其它用户数据。通过例如执行 在HDD 2004中存储的系统软件来实现用于文档检索的操作规程(后 面i兌明)。操作单元I/F 2006用作操作单元2050的接口单元,并向操作单元 2050输出要在操作单元2050的显示装置6000上显示的图像数据。操 作单元I/F 2006还向CPU 2001传送由用户通过操作单元2050输入的 信息。网络2007连接到LAN 2020,以l更从/向连接到LAN 2020的诸如 文档管理系统2060或PC之类的外部装置输入/输出信息。文档检索 设备1000支持作为网络通信协议的TCP/IP。文档管理系统2060也按 照TCP/IP通信协议进行通信。MODEM 2008连接到公共交换电话网(PSTN) 2010,以便利用传 真功能把图像数据传递到设置在公共交换电话网2010上的传真设备 (未示出)。上述这些装置被连接到系统总线2009。图像总线I/F 2005用作连接到系统总线2009和图像总线2030的 总线桥,用于高速传输图像数据并转换数据结构。图像总线2030配置 有PCI总线或IEEE1394总线。以下装置被布置在图#>总线2030上。光栅图像处理器(RIP) 2031装置I/F 2032把作为图像输入/输出装置的扫描仪2070和打印机2080 连接到主单元控制器2000,并转换图像数据的同步/异步系统。扫描仪图像处理单元2033校正、操纵和编辑来自扫描仪2070的 图像数据。扫描仪图像处理单元2033具有根据图像数据的颜色信号分 量确定输入的图像数据是彩色图像还是单色图像并保持该确定结果的 功能。打印机图像处理单元2034校正、操纵和编辑由打印机2080输出的图像数据。图像旋转单元2035与扫描仪图像处理单元2033协同操 作,在读取的同时旋转由扫描仪2070读取的图像数据,并把该图像数 据存储在RAM 2002中。图像旋转单元2035还旋转在RAM 2002中 的图像数据。图像旋转单元2035还使得可以与打印机图像处理单元 2034协同操作,在旋转图像数据的同时打印在HDD 2004或RAM 2002 中的图像数据。分辨率转换单元2037转换RAM 2002中的图像数据的分辨率, 并把图像数据再次存储在RAM 2002中。颜色空间转换单元2038通 过矩阵运算把例如RAM 2002中的YUV图像数据转换成Lab图像数 据,并把图像数据再次存储在RAM 2002中。色调转换单元2039通 过诸如误差扩散处理之类的技术把例如RAM 2002中的9位256色调 的图像数据转换成1位2色调的图像数据,并把图像数据再次存储在 RAM 2002中。图像压缩/解压单元2036按照诸如JPEG之类的格式 压缩/解压多级图像数据,并按照诸如JBIG、 MMR、 MR、或MH之 类的格式压缩/解压二进制图像数据。图像旋转单元2035、分辨率转换单元2037、颜色空间转换单元 2038、色调转换单元2039以及图像压缩/解压单元2036可被连接在一 起。例如,在RAM 2002中的图像数据的旋转处理和分辨率转换处理 可同时进行,而不把数据暂时存储在RAM 2002中。图3是表示按照本实施例的文档检索设备1000的外观的透视图。 如参照图1所述,本实施例的文档检索设备1000是作为多功能外设提 供给用户的,其具有复印功能、传真功能、打印机功能、和文档管理 功能。作为图像输入装置的扫描仪单元3001对在诸如纸之类的印刷介 质上的文档进行照射,并扫描CCD线传感器(line sensor ),由此把 文档转换成光栅图像数据,即电信号。也就是说,用户把文档纸张放 在文档馈送器3002的盘上,并经由操作单元3006指示开始读取文档。 然后,图2所示的主单元控制器CPU 2001向扫描仪2070发送命令。 文档馈送器3002逐页运送文档纸张,并开始文档读取操作。作为图像输出装置的打印机单元3003输出光栅图像数据作为在 纸上的打印图像,任何打印系统都是可以利用的。例如,可以使用利 用感光鼓或感光带的电子照相型打印系统,或者使用从小喷嘴阵列喷 射油墨并直接在纸张上打印图像数据的喷墨型打印系统。响应来自作为控制器的CPU 2001的指令,开始打印操作。打印 机单元3003具有多个馈送台3004,用于选择不同的纸尺寸和纸取向。 在馈送台3004中设置有相应的纸盒。此外,排放盘3005接收打印的 纸张。也可以按照来自作为控制器的CPU 2001的命令进行诸如分类 和装订的后处理。图1所示的主单元1001和文档管理系统1005被布置在文档检索 设备1000内,因此从外部看不到。图4是表示按照本实施例的文档检索设备1000的主单元1001的 软件配置的方块图。图4所示的软件被存储在图2所示的HDD 2004 中。用于控制操作单元2050的UI控制管理器4001进行控制以向下 层模块发送用户指令,或在操作单元2050的显示装置6000上显示来 自下层的信息。网络控制管理器4002进行控制以通过网络接收指令或 信息,或发送来自主单元1001的指令或信息。复印应用单元4003和发送应用单元4004接收来自UI控制管理 器4001的指令,并使每个管理器单元(后面说明)执行复印作业和传 送作业。文档管理应用单元4005与文档管理系统1005通信,并提供文档 管理功能。文档管理应用单元4005控制检索处理(下面说明)。文档 管理应用单元4005连接到从文档数据中包含的图像数据中提取文本 信息的OCR引擎4006,还连接到从文档数据中包含的图像数据中提 取所需区域内的图像数据的块选择(BS)引擎4007。本实施例的BS引擎4007识别图像数据中的图像区域和文本区 域,并产生图像数据中的每个区域的类型、位置和尺寸的信息。BS 引擎4007还可以确定与图像区域和文本区域不同的各种属性块(如表块、艺术线条块、背景块等),并提取每种属性的块(区域)。公共接口单元4008吸收下层的每个管理单元的装置相关部分。作 业管理器4009排列从公共接口单元4008接收的多条作业信息,并将 其发送给与下层的装置紧密相关的多个管理器(4010到4014)。例如, 如果接收的作业指示"本地复印",则作业管理器4009控制扫描管理 器4011和打印管理器4010。如果接收的作业是传真传送作业,则作业管理器4009控制扫描管 理器4011、用于文档存储的文件管理器4014以及传真管理器4012。 如果接收的作业是LIPS或PostScript的PDL打印作业,则作业管理 器4009控制PDL管理器4013、文件管理器4014和打印管理器4010。 通过这种方式,作业管理器4009按照接收的作业控制每个管理器的诸 如启动、同步和终止的处理。图5是表示在按照图1所示的本实施例的文档检索设备1000中布 置的文档管理系统1005的软件配置的方块图。文档管理系统1005对 主单元1001提供文档的存储、获取和检索的功能。图5中的标号5004 和5005表示与图4中的4006以及4007相同的部分。网络控制单元5001控制与主单元2000的网络控制管理器4002 的通信。检索控制单元5002执行对于从主单元2000请求的检索的处 理,或者创建所存储的文档数据的检索索引的处理.图像文档处理单元5003根据需要进行缩略像数据的创建或 图像的转换。图像文档处理单元5003还按照所记录的文档数据从所记 录的文档数据中提取检索索引。即,由图像文档处理单元5003把要记 录在文档管理系统1005中的文档数据转换成预定格式。对于图像数 据,块选择(BS)引擎5005提取在文档数据中包含的图像区域。对于文 本(字符)数据,OCR引擎5004从文档数据中包含的图像数据中提 取索引数据和固定字符信息。文档管理控制单元5006分配关于文档管理的所有处理。标号5007 表示在文档管理系统侧上使用的暂时数据的存储位置。数据库控制单元5008进行要存储在数据库中的各种数据的创建,并存储与巻数据库5009、属性数据库5010、全文检索数据库5011和 图像检索数据库5012对应的各种数据。数据库控制单元5008还按照 来自主单元1001的请求,从每个数据库中读出数据并创建要传输到主 单元1001的文档数据。巻数据库5009存储文档数据实体。巻数据库5009是概念性单元, 其实体可以是文档管理系统1005的OS上的文件系统。属性数据库 5010存储关于诸如文档数据的名称、创建日期和注释之类的属性的信 息。全文检索数据库5011记录由OCR引擎5004从所记录的文档数 据中提取的索引数据和固定字符信息。当主单元1001指示全文检索 时,对全文数据库5011进行全文检索。图像检索数据库5012以与文 档数据相关联的方式记录由块选择(BS)引擎5005从所记录的文档数 据中提取的图像区域的特征。当主单元1001指示进行图像检索时,对 图像检索数据库5012进行图像检索,以按照检索目标图像数据的特征 找出相关联的文档数据。图6是表示在按照本实施例的检索处理中在操作单元2050内提供 的显示装置6000上显示的显示窗口的转换示例的视图。将参照图6 说明按照本实施例的检索处理的过程。首先显示基本显示窗口 6001。本实施例的操作单元2050使用显 示装置6000的触摸板。当用户按下在显示窗口上显示的按钮时,执行 对应的功能。在本示例中,显示对应于包括"复印"、"传送"和"检 索"等10个功能的多个按钮。对于检索,在本示例中显示对应于两个 功能即"利用标准的检索"和"原件检索"的按钮6050和6060。"利 用标准的检索"表示检索含有被指定为检索鍵的图像或关键字的文档 数据。在另一方面,"原件检索"表示检索与文档页的读取图像完全 一致的文档数据(当读取具有多页的文档时,检索与所有文档页的图 ^^一致的文档数据)。在按下基本显示窗口 6001上的"利用标准的检索"按钮6050之 后,显示显示窗口 6002。在这个显示窗口中,用户能够通过按钮6070 或6080选择"图像检索"或"经由OCR进行关键字检索"。如果用户在显示窗口 6002内选择"图像检索,,,则显示显示窗口 6013以设置文档输入等待状态,以便提取要用作检索键的图像数据。当显示显示窗口 6013并且用户放置文档并按下"扫描开始"按钮 时,该文档被读取,BS引擎从读取的图像数据中提取图像区域。所提 取的图像区域作为缩略像被显示在显示窗口 6014上。在这个示例 中,显示3个缩略像。用户在显示窗口 6014上选择要用作检索鍵 的图像数据,并按下"检索开始"按钮以执行检索。为了选择缩略图 图像,用户只需要触摸缩略像的区域。例如在缩略像的左上 方提供的复选框中显示的标记表示该图像正被选择。在本实施例中, 用户能够选择多个图像数据作为检索键。在这种情况下,用户能够选 择是通过多个图像数据的AND还是多个图像数据的OR进行检索。当用户按下"检索开始"按钮时,主单元1001对文档管理系统 1005发出"图像检索"的指令。文档管理系统1005执行检索,并把 结果返回主单元1001。在接收到检索结果后,主单元1001在显示窗 口 6015上显示该结果。显示窗口 6015显示诸如文档名、 一致率(相 似度)、更新日期和存储位置之类的信息的列表。用户能够在显示窗 口 6015上选择所需的文档数据,并执行诸如打印或传送之类的操作。在另一方面,当用户在显示窗口 6002上选择"经由OCR的关键 字检索"时,显示显示窗口 6023,并且系统1005变成等待状态,等 待输入要提取关键字的文档。当显示窗口 6013被显示,并且用户放置文档并按下"扫描开始" 按钮时,该文档被读取,OCR引擎从所读取的图像数据中提取关键字。 这样提取的关键字被列举在显示窗口 6024上。用户在显示窗口 6024 上选择要用作检索键的关键字,并按下"检索开始"按钮以执行检索。 为了选择关鍵字,用户只需要触摸关键字的区域。如在关键字的左上 方提供的复选框中显示的标记表示该关键字正被选择。在本实施例中, 用户能够选择多个关鍵字作为检索键。在这种情况下,用户能够选择 是利用多个关键字的AND还是多个关鍵字的OR进行检索。当用户按下"检索开始"按钮时,主单元1001对文档管理系统1005发出"经由OCR的关键字检索"指令。文档管理系统1005执行 检索,并把结果返回给主单元1001。在接收到检索结果后,主单元1001 便在显示窗口 6025上显示该检索结果。显示窗口 6025显示诸如文档 名、 一致率(相似度)、更新日期和存储位置之类的信息的列表。用 户能够在显示窗口 6015上选择所需的文档数据,并执行诸如打印或传 送之类的操作。图7是按照本实施例在选择"图像检索"之后直到执行检索之前、 由文档检索设备1000的主单元执行的处理的流程图。这个处理对应于 当显示如图6所示的显示窗口 6013和6014时执行的处理。当用户选择"图像检索",放置文档以提取作为检索键的图像, 并指示开始读取时,主单元2000启动扫描仪2070以执行文档读取处 理(步骤S7001 )。读取的图像数据被暂时存储在HDD 2004中。主单元对于所存储的图像数据执行块选择(BS)(步骤S7002)。 BS引擎4007按照来自文档管理应用4005的指令执行这个处理。作为 块选择的结果,确定是否存在图像区域(步骤S7003)。如果不存在 图像区域,则结束处理.然而,如果存在图像区域,则从所存储的图 像数据中提取对应的图像区域,并将该图像区域存储在RAM 2002中 (步骤S7004 )。接着,从提取的图像区域中提取图像特征(步骤S7005)。这个 处理提取图像的边沿信息、颜色信息和布局式样作为图像特征,并把 它们作为文件存储在HDD 2004中。在这个实施例中,在HDD 2004 中存储的文件名包括预定的名称和名称后面的序列号,例如 AREAOl.xml和AREA02.xml。主单元2000向文档管理系统2060发 出含有作为检索键的图像特征的信息的"图像检索"指令。因而,与 传输图像数据本身作为检索键的情况相比,可以减少传输数据的量。 文档管理应用单元4005执行图像特征提取处理。创建所提取的图像数据的缩小(缩略图)图像,并将其存储在HDD 2004中(步骤S7006)。即使在这种情况下,所存储的图像的名称也 包括预定的名称和其后的序列号,例如AREA01.jpg和AREA02.jpg。因为在本实施例中对于每个图像区域执行这个处理,从而能够使得在步骤S7005创建的图像特征信息与缩略像相关联。确定是否存在下一个图像区域(步骤S7007)。如果存在下一个 图像区域,则处理返回步骤S7004,以重复该处理。如果不存在下一 个图像区域,则确定是否完成所有图像区域的处理。在显示窗口6014 上显示在步骤S7006存储的缩略像的列表(步骤S7008)。当用户选择要用作检索键的图像数据并指示开始检索(步骤 S7009 )时,主单元2000向文档管理系统2060发出含有与作为检索键 的所选图像数据相对应的图像特征信息在内的"图像检索"指令(步 骤S7010)。然后结束处理。图8是示出按照本实施例在选择"经由OCR的关键字检索"之 后直到执行检索之前、文档检索设备1000的主单元执行的处理的流程 图。这个处理对应于当显示如图6所示的显示窗口 6023和6024时执 行的处理。当用户选择"经由OCR的关鍵字检索",放置文档以提取关键 字,并指示开始读取时,主单元2000启动扫描仪2070以执行文档读 取处理(步骤S8001 )。所读取的图像数据被暂时存储在HDD 2004 中。对于所存储的图像数据执行块选择(BS)(步骤S8002) 。 BS引擎 4007按照来自文档管理应用4005的指令执行这个处理。作为块选择 的结果,确定是否存在文本区域(步骤S8003)。如果不存在文本区 域,则结束处理。如果存在文本区域,则从存储的图像数据中提取对 应的文本区域,并将该文本区域存储在RAM 2002中(步骤S8004)。主单元通过OCR从所提取的文本区域中提取字符串(步骤58005) 。 OCR引擎4006执行这个处理。对所提取的字符串进行语素 分析处理以提取名词。所提取的名词根据出现的频率或位置,按照优 先权顺序被排列,并作为关键字列表被存储在HDD 2004中。如果存 在已经存储的关键字列表,则把这些名词加于其中并存储(步骤58006) 。文档管理应用单元4005执行上述的关键字提取处理。然后确定是否存在下一个文本区域(步骤S8007)。如果存在下 一个文本区域,则处理返回步骤S8004,以重复该处理。如果不存在 下一个文本区域,则确定完成了所有区域的处理。在显示窗口 6024 上显示在步骤S8006存储的关键字列表(步骤S8008)。当用户选择要用作检索键的关键字并指示开始检索(步骤S8009) 时,主单元2000向文档管理系统2060发出含有作为检索键的所选关 键字在内的全文检索指令(步骤S8010)。然后结束处理。如上所述,按照本实施例,对应于所读取文档中的图像数据的缩 略像的列表被显示,从而用户能够容易地从列表中选择要用作关 键字的图像数据。因而,用户能够容易而简单地指定或输入用作关键字的图像数据, 这增加了用户的便利性。<其它实施例>在上面的实施例中所述的布置、处理过程和操作显示窗口仅仅是 示例。这些布置或处理过程可被改变或修正,只要可以实现本发明的 目的。例如,在上面的实施例中,显示与所读取文档的图像区域对应的 缩略像。然而,如果根据显示区域的尺寸和图像区域的数量和尺 寸之间的关系,可以显示图像区域的列表,则能够以实际尺寸显示图 像。在这种情况下,确定是否可以进行列表类型显示。如果无法进行 列表类型显示,则可以把每个图像缩小到允许进行这种列表类型显示 的尺寸,或者按照要以列表的形式显示的图像的数量改变图像的缩小 比率。在上面的实施例中,在操作单元中提供的显示装置具有在显示屏 幕上提供的触摸板。然而,可以使用不同于触摸板的任何其它操作装 置(如,键和按钮),从所列图像中选择要用于检索的图像。图像数据的格式不限于上面实施例中所述的格式,根据需要可以 4吏用合适的格式。
上述实施例在使用图像数据作为检索键的处理与使用文本数据作为检索键的处理之间进行区分。然而,本发明不限于此。也可以才艮据图像数据和字符串的OR或AND进行检索。通过向图像或文本数据的检索键添加来自所述操作的另 一检索条 件(如,文档创建日期/时间、更新日期/时间、存储位置、文档名、 文档类型和字符串),可以进行精确的检索。除去在文档中的图像和文本数据的检索鍵之外,通过块选择而获 得的其它的属性(表格、艺术线条或背景)也可用作检索键。上面详细说明了本发明的实施例。本发明可应用于包括多个设备 的文档检索系统或包括单个设备的文档检索设备。例如,在上述实施例中,本发明应用于具有扫描仪功能、复印功 能、打印机功能和传真功能的多功能外设。在这些功能当中,复印功 能、传真功能和打印机功能不是重要的。因而,包括扫描仪(读取设 备)和诸如对应于主单元和操作单元的计算机之类的信息处理设备的 系统也可应用于本发明。在这种情况下,以上实施例的文档管理系统 可被提供在计算机设备中,或者作为外部设备通过网络被连接。当文档管理系统是外部设备时,可以准备多个外部设备,使得用 户可以指定要用来检索的外部设备。另选的,所有可检索的外部装置 都可执行检索。键。然而,可以使用任何其它图像数据。例如,可以从通过传真接收的图像数据、经由诸如LAN 2020之类的网络通过电子邮件功能或FTP功能接收的图像数据、或者从Web服务器接收的数据中包含的图像数据中提取检索键。也可以使用从另一打印客户端接收的打印数据。用户可以经由操作单元2050选择在HDD 2004中存储的一个图像 数据并提取检索键。本发明甚至通过如下方式实现直接或者从远方对系统或设备供 应软件程序,并使系统或设备的计算机读出并执行所供应的程序,所 述程序实现上述实施例的功能。在上述实施例中,所述程序对应于图 7和图8的流程图。如果可以获得程序的功能,则不必总是采用程序的形式。因而,被安装在计算机中以由计算机实现本发明的功能处理的程 序代码本身也实现本发明。即,本发明的权利要求还包括用于实现本发明的功能处理的计算机程序本身。在这种情况下,程序可以采取任何形式,例如目标代码、要由解释器执行的程序、或者要提供给os的脚本数据,只要可以获得所述程序的这些功能。可以利用各种记录介质来提供所述程序。示例有£1(^口7@盘、硬盘、 光盘、磁光盘、MO、 CD-ROM、 CD-R、 CD-RW、磁带、非易失存 储卡、ROM、以及DVD ( DVD國ROM或DVD-R)。为了供应程序,可以通过使用客户端计算机内的浏览器使客户端 计算机连接到互联网上的主页,以便从该主页把程序下栽到诸如硬盘 之类的记录介质。用户可以下栽本发明的计算机程序本身或者含有自 动安装功能的压缩文档。在本发明的程序中包含的程序代码可被分成多个文件,从而用户 可以从不同的主页上下载这些文件。即,使多个用户下载使计算机实现本发明的功能处理的程序文件的www服务器也被包括在本发明的权利要求内。本发明的程序可被加密,存储在诸如CD-ROM之类的存储介质 中并分发给用户。满足预定条件的任何用户可以通过互联网从主页下 栽用于解密的密钥信息,使用该密钥信息来执行加密的程序,并把程 序安装在计算机内。上述实施例的功能不仅在所读出的程序由计算机执行时才被实 现。例如,当在计算机上运行的OS根据程序的指令执行实际处理的 一部分或全部时,可以实现上述实施例的功能。从记录介质读出的程序可被写入插入计算机中的功能扩展板的存 储器中或者写入连接到计算机的功能扩展单元中。在这种情况下,功 能扩展板或功能扩展单元的CPU根据程序的指令执行实际处理的一 部分或全部,由此实现上述实施例的功能。虽然参照示例性实施例说明了本发明,但是应当理解,本发明不 限于公开的示例性实施例。下面权利要求的范围应当被给予最宽的解 释,使得包括所有这些改变、等效结构和功能。本申请要求于2005年7月28日提交的日本专利申请第2005-219441号的优先权,该专利申请的全部内容通过引用被包括在本文 中。
权利要求
1.一种用于根据预定检索键从多个存储的数据中检索所需数据的检索设备,其特征在于包括读取装置,用于读取文档图像以获得图像数据;区域提取装置,用于提取在所述图像数据中的图像区域;显示装置,用于显示信息;输入装置,用于输入指令;以及列表显示装置,用于在所述显示装置上显示与由所述区域提取装置提取的图像区域对应的多个图像的列表;其中当所述输入装置选择在所述列表中显示的所述多个图像中的至少一个时,使用所选择的图像作为检索键来执行检索。
2. 如权利要求1所述的检索设备,其特征在于还包括 缩小装置,用于缩小图像数据的尺寸,其中所述列表显示装置在所述显示装置上显示与由所述区域提取 装置提取的图像区域对应的所述图像的缩小图像的列表。
3. 如权利要求1或2所述的检索设备,其特征在于, 所述设备具有两种检索模式,包括使用图像信息作为检索鍵来执行检索的图像检索模式和使用字符串作为检索键来执行检索的关鍵字 检索模式,所述设备还包括OCR装置,用于在指定的图像区域中提取文本信息,以及 关键字提取装置,用于按照预定规则从所提取的文本信息中提取 关键字,当指定所述关键字检索模式时,所述区域提取装置提取在所述图 像数据中的文本区域,所述列表显示装置在所述显示装置上显示利用所述OCR装置和 所述关键字提取装置从所述区域提取装置所提取的文本区域中提取的 关键字的列表,以及当所述输入装置选择所述列表中显示的所述关键字中的至少一个 时,使用所选择的关键字作为检索键来执行检索。
4. 如权利要求1到3中任何一个所述的检索设备,其特征在于, 使用所选择的图像的特征信息作为检索键来执行检索。
5. 如权利要求4所述的检索设备,其特征在于, 所述特征信息包含图像的边沿信息、颜色信息、和布局式样中的至少一个。
6. 如权利要求1到5中任何一个所述的检索设备,其特征在于, 所述显示装置具有显示屏,所述输入装置包括提供在所述显示屏上的触摸板。
7. 如权利要求1到6中任何一个所述的检索设备,其特征在于, 所述检索设备是至少具有读取功能和打印功能的多功能外设。
8. —种用于根据预定检索键从多个存储的数据中检索所需数据的 检索方法,其特征在于包括以下步骤读取文档图像以获得图像数据; 提取在所述图像数据中的图像区域;在用于显示信息的显示装置上显示与在所述区域提取步骤中提取 的图像区域对应的图像的列表;以及当用于输入指令的输入装置选择在所述列表中显示的所述图像中 的至少一个时,使用所选择的图像作为检索键来执行检索。
9. 一种包括使计算机执行如权利要求8所述的检索方法的步骤的 程序代码的计算机程序。
10. —种用于存储如权利要求9所述的计算机程序的计算机可读的 存储介质。
全文摘要
本发明的目的在于使用户能够容易而简单地指定或输入用作文档检索键的图像。即,检索设备读取文档图像(S7001)以获得图像数据,在图像数据中提取图像区域(S7004),以及在显示装置上显示与所提取的图像区域对应的图像的列表(S7008)。当用户经由输入装置选择列表中显示的至少一个图像时(S7009),使用所选择的图像作为检索键来执行检索(S7010)。
文档编号G03G21/00GK101233511SQ20068002765
公开日2008年7月30日 申请日期2006年7月24日 优先权日2005年7月28日
发明者户高伸治 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1