文档检索设备和文档检索方法

文档序号:6612329阅读:226来源:国知局
专利名称:文档检索设备和文档检索方法
技术领域
本发明涉及文档检索设备和文档检索方法。
背景技术
先进的存储技术和成本降低允许存储和管理大量文档数据。并 且,文件服务器、文档管理系统、群件等已经流行并在先进的功能和 性能方面得到改进。在每个都具有文档存储、以及图像传送和接收功 能的诸如复印机、打印机、图像扫描仪、传真机、数字摄影机、多功
能外围设备(MFP)之类的各种视频办公室机器与网络兼容的同时, 信息处理设备也进行了更新。在网络环境中,信息处理设备和各种视 频办公室机器持续交换大量文档数据。可校验地存储经由办公室网络 传播的文档通信量的存储基础结构(infrastructure)正在开始进入实 际使用。
日本专利No.3,486,452披露了 一种多功能图像处理设备,该多功 能图像处理设备可连接至少两个图像数据输出设备,以便提供一种能 保证对所需图像制作副本而不麻烦操作者的多功能图像处理设备。
为了有效地从巨大数量的存储文档中检索所需文档,考虑除文本 之外主要包括图像的文档的检索是重要的。全文本搜索对于检索主要 包括图像而不是文本的文档,诸如演示材料、广泛使用图形和可视数 据之类的文档是能力不足的。当用户想要使用给定图像作为检索关 键,并检索包括图像的文档时,单独的全文本搜索不能很好地起作用。
已知使用图像作为检索关键来检索相似图像的许多相似图像检 索方案。已获得一种基于图像中的边缘等来确定对象的形状以抽取对 象,并使用对象的配置、配色、多个对象之间的位置关系等的方案, 一种基于直方图等抽取并使用形成整个图像的占主导的颜色的组合
或彩色图案的方案等。
例如,日本专利申请乂>开No.2005 - 244684披露了 一种相似图像 检索方案,该相似图像检索方案使用推导具有与认知相似度确定接近 的特性的特征量的数学处理。
日本专利No.3691962披露了基于文本检索包括多个页面的文 档,并显示包括与命中(hit)文本对应的文本图像的一个或多个页面 (当文本出现在跨越两个页面时的两个页面)的布置。
在使用图像检索技术的文档检索中,只获得一个文档作为检索结 果的情况是罕见的。在大多数情况下,根据用户的判断,在检索之后 需要从相当大数量的命中文档中抽取所需文档的处理。其原因是出 于所有实用目的,在大规模存储基础结构中存在包括被再次使用或修 改的同样图像的多个文档。并且,图像相似度由模拟连续量来表达, 甚至是一对不同的图像也具有一定相似度。根据检索的最终目的,因 为"相似,,是基于用户的主观性的,所以"相似,,的标准是任意的。因为 不可能自动地作出与用户的主观性完全符合的相似度评估,所以相似 图像检索只被用来缩小(narrow down)相当大的数量的备选,并且 用于找出所需文档的操作应由用户的主观性负责。此外,演示某范围 内的相当大的数量的检索结果文档可激发用户的思考,从而支持他或 她的创造性作品。
在使用在日本专利申请公开No.2005 - 244684所披露的图像检 索技术的文档检索中,检索结果列表包括相当大的数量的文档、还有 许多噪声结果(除所需文档之外的文档)。因而,当用户浏览该列表 并从该列表检索所需文档时,效率是重要的。
例如,当多个文档包括命中检索条件的图像时,将该多个文档列 入文档检索结果列表中。在这样的情况下,根据该图像被分配的上下 文,该文档可能不是所需的。在文档主要包括文本的情况下,可构建 一种检索系统,该检索系统使用文本概要技术自动地产生概要,并且 将该文档概要显示在检索结果列表中,以允许用户容易地选择所需文 档。然而,不能由基于文本的概要来表达图像信息。
日本专利No.3691962披露了 一种当基于文本的检索结果跨越文 档中的多个页面出现时的显示技术。然而,当由用户从相似图像检索 的文档检索结果列表中选择所需文档时,这样的技术没有导致效率的提兩。

发明内容
本发明的一个目的是提供一种文档检索技术,该文档检索技术可 有效地显示文档概要,并且使用该图像检索技术,可将命中图像检索条 件的图像所在的文档中的内容分配到文档检索的检索结果列表中。
本发明的另 一 目的是提供一种文档检索技术,该文档检索技术允 许用户迅速地从包括相当大的数量的文档以及还有许多噪声结果的 检索结果列表中找出所需文档。
为实现上述目的中的至少一个目的,根据本发明的一个方面,提 供一种文档检索设备,所述设备包括
文档检索单元,其适用于检索包括与输入检索条件相匹配的图像 的文档数据;
检索结果列表显示单元,其适用于基于文档检索单元的检索结 果,在显示单元上显示与检索条件相匹配的文档数据的列表显示;以 及
缩略图显示单元,其适用于在通过检索结果列表显示单元的列表 显示中显示和与检索条件相匹配的页面或图像元素相关联的第一缩 略像,以及与形成包括与检索条件相匹配的页面或图像元素的文 档数据的另一页面或另一图像元素相关联的第二缩略像。
根据本发明的另 一方面,提供一种用于包括显示单元的文档检索 设备的文档检索方法,所述方法包括
检索包括与输入检索条件相匹配的图像的文档数据的文档检索
步骤;
基于文档检索步骤的检索结果,在显示单元上显示与检索条件相 匹配的文档数据的列表显示的检索结果列表显示步骤;以及在通过检索结果列表显示步骤的列表显示中显示和与检索条件 相匹配的页面或图像元素相关联的第一缩略像,以及与形成包括 与检索条件相匹配的页面或图像元素的文档数据的另一页面或另一 图像元素相关联的第二缩略像的缩略图显示步骤。
根据本发明,在使用图像检索技术的文档检索中,在检索结果列 表中可有效地显示文档的概要和命中图像检索条件的图像在文档中 ,皮分配的上下文。
并且,根据本发明,用户可迅速地从检索结果列表中找出所需文 档,其中该检索结果列表包括相当大的数量的文档以及还包括许多噪 声结果。
参考附图,本发明的其它特征将从示例性实施例的下述说明中变 得明了。


图1是示出根据本发明的一个实施例的图像处理系统的整体布置的框图2是示出在服务器系统上运行的作业存档应用的软件配置的框图3是示出图像处理设备的硬件布置的框图4是示出图像处理设备的外观的透视图5示出图像处理设备的操作单元的布置;
图6是示出与控制单元的布置一致的、图像处理设备的操作单元 和操作单元接口 (i/f)的布置的框图7示出图像处理设备的操作单元上显示的操作窗口的示例;
图8示出了数据库(db)管理系统中存储的数据库的数据结构;
图9是用于说明检索处理的序列的流程图10示出了作为文档检索应用的基本窗口的文档检索窗口的配 置示例;
图11示出了文档检索应用的文档检索结果列表窗口的配置示
例;
图12示出了检索命中文档显示的示例;
图13示出了其中多个页面命中的文档的检索命中文档显示的示
例;
图14示出了文档概要缩略图的动画显示示例;
图15示出了在密集显示模式下的文档检索应用的文档检索结果 列表窗口的显示示例;
图16A和16B是示出了文档概要缩略图动画显示处理的序列的 流程图17示出了由多个图像区域元素配置的文档的示例;以及 图18示出了根据第二实施例的检索命中文档显示的示例。
具体实施例方式
将参考附图在下文详细例示本发明的优选实施例。然而,根据实 施例说明的构造组件仅为示例,并且本发明的技术范围由权利要求的 范围定义,但不限于下述个体实施例。 (图像处理系统的布置)
图l是示出根据一个实施例的图像处理系统的整体布置的框图。 参考图1,图像处理系统包括通过网络彼此相连接的图像处理设备 110、 120和130、个人计算机(在下文中也被称为"信息处理设备") 101和102、以及服务器系统140。网络包括例如LAN(局域网) 亂
图像处理设备IIO包括作为图像输入装置的扫描仪113、作为图 像输出装置的打印机114、控制单元111和作为用户接口的操作单元 112。扫描仪113、打印机114和操作单元112与控制单元111相连接, 并由来自控制单元111的指令控制。使控制单元111连接到LAN 100。
图像处理设备120和130具有与图像处理设备110的布置相同的布置。
个人计算机101是由多个用户中的每一个用户亲自使用,并存储 由用户使用的应用程序、用户数据等的信息处理设备。
服务器系统140包括服务器计算机141和大规模存储设备142。
服务器计算机141存储对多个用户和客户端系统提供服务的服 务器应用、共享数据等。大规模存储设备142是具有高性能和高可靠 性、并且主要存储在服务器计算机141等上运行的数据库管理系统 (DBMS)的数据的大规模次级存储设备。
由服务器系统140执行的服务器应用之一是将遍及网络分布的 作业数据(例如,打印数据和扫描数据)存档(即,累积并管理)的 数据库应用器。在下文中将服务器应用称为作业存档应用。作业存档 应用与安装在连接到网络的其它设备中的软件协作,以配置被称为作 业存档系统的分布式应用。
在图1所示的系统中,个人计算机101与图像处理设备110、 120 和130、服务器系统140等,通过LAN100协作。例如,个人计算机 101与图像处理设备110交换文档数据(在下文中也被简称为"文档")。 个人计算机101执行诸如打印作业、扫描作业、传真发送和接收作业、 存储和检索作业到箱(box)(图像处理设备110中的嵌入文档管理 系统)等的作业。在执行处理文档的作业时,在服务器系统140上运 行的作业存档应用将作业信息和作业中要被处理的文档数据的副本 存档。例如,在打印作业的情况下,个人计算机101上的打印机驱动 程序将作业输入到图像处理设备110,还将与该作业相关联的信息和 要被处理的文档的数据传送到服务器系统140,从而将作业存档。
在图1所示的系统中,图像处理设备110与其它图像处理设备 120和130、个人计算机101和102、服务器系统140等通过LAN 100 协作。例如,图像处理设备110可扫描原稿图像以将其转换为数字数 据,并将该数字数据发送到另一设备。并且,图像处理设备110可执 行用于检索存储在另一设备中的数据、并且打印检索到的数据、将其 存储在本地箱中、或仍将其传输到另一设备的作业。
在执行处理文档的这样的作业时,运行在服务器系统140上的作 业存档应用将作业信息和在每个作业中要被处理的文档数据的副本 存档。例如,在自动路由扫描(push scan)作业的情况下,利用图像 处理设备110上的"发送"应用将使用扫描仪通过扫描原稿文档获得的 数字文档数据发送到主要发送目的地。在发送的同时,将与该作业相 关联的作业信息和要被处理的文档的数据发送至服务器系统140,从 而将该作业存档。
因而,作业存档应用将遍及网络分布的作业文档存档。
(作业存档应用的软件配置)
图2是示出在服务器系统140上运行的作业存档应用的软件配置 的框图。
数据库管理系统(DB管理系统)201存储大量数据,包括作为 数据库的大量记录,该数据库是与记录之间的关系 一起被结构化的。 响应使用诸如SQL (结构化查询语言)之类的查询语言的查询,DB 管理系统201高速检索与来自数据库的输入条件相匹配的记录。DB 管理系统201包括文档DB 202、作业DB 203和索引DB 204。通过公 知的关系数据库、面向对象数据库等实现DB管理系统201。
文档DB 202是存储由作业存档系统累积和管理的文档数据的数 据库。文档DB 202将文档的内容数据和与该文档相关联的元数据存 储为文档记录。文档DB 202和作业DB 203在其所存储的记录之中彼 此相关。
作业DB 203是将由作业存档系统累积和管理的作业数据存储为 作业记录的数据库。作业DB 203和文档DB 202在其所存储的记录之 中彼此相关。
索引DB 204是存储索引记录的数据库,该索引记录用于从由作 业存档系统累积和管理的文档数据和作业数据中迅速地检索所需数 据。存储在索引DB 204中的索引记录查阅文档DB 202和作业DB 203 中的记录。
存储单元205是存储请求接受模块,该存储请求接受模块从诸如 图像处理设备110、个人计算机101之类的客户端接收文档数据和作 业数据,并将该数据存储在DB管理系统201中。存储单元205将接收的文档数据和作业数据存储在DB管理系统201中。存储单元205 切换用于产生与接收的文档数据的数据格式一致的元数据的处理。当 接收的文档数据是通过由图像扫描仪扫描图像、由数字摄影机捕获图 像、或通过传真接收图像而产生的光栅图像文档数据时,存储单元205 将文档数据发送至光栅图像页面处理器206。
当接收的文档数据是编码文档数据时,存储单元205将该数据发 送至再现(rendering)单元210。例如,存储单元205将由页面描述 语言或向量数据表达的各种文档格式发送至再现单元210。存储单元 205将诸如桌面出版(desk publish )应用、文字处理器、电子制表软 件、演示应用、制图应用、喷绘应用之类的各种应用的文档格式的数 据发送至再现单元210。
光栅图像页面处理器206是将光栅图像文档分成形成该文档的 页面(图像页面),并处理所分开的图像页面的模块。光栅图像页面 处理器206将分开的图像页面发送至图像特征抽取单元207和图像结 构分析单元208。
图像特征抽取单元207是分析光栅图像数据并抽取特征数据(在 下文中也被简称为"特征")的模块,其中该特征数据被用作关于确定 图像之间的相似度的标准。将抽取的特征数据发送至存储接收的特征 数据的DB管理系统201。可利用对于相似图像检索有效的各种特征 抽取方案。实施例不取决于具体算法,并可一起使用多个有效的方案。 可采用的方案包括下述方案。
例如,可利用基于图像中的边缘等抽取对象以确定其形状,并使 用图像的分配、配色、多个对象之间的位置关系等抽取对象的方案。 并且,可利用基于直方图等抽取并使用形成整个图像的占主导的颜色 的组合或颜色图案的方案。此外,可利用使用推导具有与认知相似度 确定接近的特性的特征量的各种数学处理(例如,傅立叶梅林变换) 的方案。由日本专利申请^>开No.2006 - 65866(日本专利申请No.2005 -244684)披露的方法也是适合的方案。
图像结构分析单元208是分析光栅图像数据的结构的模块。图像
结构分析单元208使用诸如块选择、图像区分离之类的方案将一组图 像区(图像页面)分解为形成图像页面并具有不同特性的多个区。例 如,图像结构分析单元208将图像页面分解为多个区(文本区、图像 区、照片区、图形区、黑白区、彩色区等),并对区结构进行分析和 分类。
并且,图像结构分析单元208对诸如背景之类的背景图案和诸如 文本、形状之类的布局在背景图案上的对象之间的层结构进行分析和 分类。图像结构分析单元208将作为分析结果获得的图像区(或图像 层)的光栅图像数据发送至图像特征抽取单元207。并且,图像结构 分析单元208将作为分析结果获得的文本区(或文本层)的光栅图像 数据发送至OCR单元209。图像结构分析单元208将作为分析结果 获得的结构信息发送至存储接收的结构信息的DB管理系统201。
OCR单元209是分析对其已再现了字符的光栅图像数据,并识 别字符的模块。OCR单元209将已经过字符识别的文本数据(即, 由统一码等编码的数据)发送至存储接收的文本数据的DB管理系统 201。
索引产生器211是产生用于从文档DB 202和作业DB 203迅速 检索数据的索引信息的模块。预先产生索引,以迅速地检索包括与给 定作为检索关键的图像相似的图像的文档记录;或预先产生索引,以 在文档内容数据或页面内容数据中对包括给定作为检索关键的文本 的文档记录迅速地实施全文本检索(或搜索)。并且,预先产生索引,
文档记录或作业记录。索引产生可使用多种已知方法的组合。
用于全文本检索的索引的产生4吏用例如,N元模型(N-gram) 方案。使表达图像的特征的特征向量预先聚集或按照给定的顺序使用 散列函数对其进行分类,以产生用于相似图像检索的索引。当文档 DB 202和作业DB 203的内容在另外登记或编辑文档数据和作业数据 而进行更新时,完成由索引产生器211进行的索引产生。索引产生器 211能与更新各个DB异步地如批处理一样执行索引产生。将产生的
索引存储在DB管理系统201的索引DB 204中。
检索单元212是从诸如图像处理设备110、个人计算机101之类 的客户端接受检索关键(检索关键图像或检索关键文本)和检索条件 的模块。检索单元212根据接受的检索条件从DB管理系统201检索 文档数据。检索单元212将命中的文档数据、与该文档相关联的缩略 像(在下文中将被简称为"缩略图,,)和诸如作业数据之类的元数 据返回至客户端。
文档检索单元213是检索与文档检索请求相匹配的文档的模块。 文档检索单元213可实施基于文档的内容数据的检索,其基于文档中 所包括的页面数据,并根据检索请求和给定检索关键的类型基于文档 的元数据。文档检索单元213基于与文档相关的作业组合检索,并找 出与检索请求相匹配的多个文档记录备选。
页面检索单元214基于文档中所包括的页面数据,^J应检索请 求,从文档DB 202中找出与检索请求的条件相匹配的多个页面记录 备选(和包括该页面的文档)。
相似图像检索单元215基于给定作为检索关键的图像,响应相似 图像检索请求,找出具有包括与检索关键图像相似的图像的页面内容 数据的多个页面记录(和包括该页面的文档)。相似图4象检索单元215 对检索关键图像应用如在图像特征抽取单元207中相同的图像特征抽 取,并基于各个特征的相似度检索相似图像。
DB操作单元216是从客户端接受并处理对数据库的操作和对各 个数据库中的记录的操作请求,并将结果返回至客户端的数据库操作 模块。客户端包括服务器计算机141的管理控制台、图像处理设备IIO、 个人计算机101等。对记录的操作包括诸如元数据的添加、编辑之类 的操作(例如,标签等)。
(图像处理设备的硬件布置)
图3是示出图像处理设备110的硬件布置的框图。图像处理设备 120和130也包括相同的布置。
控制单元111连接到扫描仪113和打印机114,并连接到LAN 100 和公共线(WAN),以便控制图像信息和装置信息的输入和输出。
CPU 301控制控制单元111的操作。RAM 302是由CPU 301使 用的、用于CPU 301的操作的系统工作存储器。RAM 302还是用于 临时存储图像数据的图像存储器。ROM 303是存储系统的引导程序 的引导ROM。 HDD 304是存储系统软件和图像数据的硬盘驱动器。
操作单元接口 (I/F) 306控制与操作单元(UI) 112的接口,并 将要被显示在操作单元112上的图像数据输出至操作单元112。并且, 操作单元I/F 306充当对CPU 301通报由用户经由操作单元112输入 的信息的角色。
网络接口 (1/F)308控制与LAN 100的连接,并充当对LAN 100 输入信息和从LAN 100输出信息的通信单元。调制解调器309控制与 公共线路的连接,并充当对公共线路输入信息和从公共线路输出信息 的通信单元。上述装置被分配在系统总线307上。
图像总线接口 (图像总线I/F) 305是将系统总线307与高速传 输图像数据的图像总线310相连接,并转换数据结构的总线桥。图像 总线310包括PCI总线或IEEE 1394。
在图像总线310上分配下述装置。光栅图像处理器(RIP) 311 将从网络发送的PDL代码数据光栅化为位像。装置接口 (I/F) 312将作为图像输入和输出装置的扫描仪113和打印机114连接到控 制单元111,并执行图像数据的同步系统和异步系统之间的转换。
扫描仪图像处理器313校正、修改、并编辑输入图像数据。打印 机图像处理器314根据打印机114的性能执行校正、分辨率转换等, 以打印输出图像数据。图像旋转单元315旋转图像数据。图像压缩单 元316应用对多值图像数据应用JPEG压缩/解压缩处理,以及对二值 图4象数据应用JBIG、 MMR或MH的压缩和解压缩处理。 (图像处理设备的外观)
图4是示出图像处理设备110的外观的透视图。图像处理设备 120和130也具有相同的外观。要注意的是,尽管将关于图像处理设 备110作出下述说明,图像处理设备120和130也包括相同布置,并
可执行相同操作。
作为图像输入装置的扫描仪113通过以光照射作为原稿的打印 介质(纸张)上的图像,并扫描CCD线传感器(未示出)产生光栅 图像数据。
当用户将原稿用纸置于文档给送器405的托盘406中,并在操作 单元112输入扫描激活指令时,控制单元111的CPU 301将该指令发 送至扫描仪113。基于该输入指令,将置于托盘406上的原稿用纸逐 张给送,并且扫描仪113扫描原稿图像。
作为图像输出装置的打印机114将光栅图像数据打印并输出到 打印介质(纸张)上。可利用使用感光鼓、感光带等的电子照像系统、 从微喷嘴阵列喷墨以在打印介质(纸张)上直接形成图像的喷墨系统 等作为打印系统,并且可釆用任何这样的系统。要注意的是打印操
作是响应来自CPU 301的指令而被激活的。
打印机114具有多个纸给送板,以便允许用户选择不同的纸张尺 寸或不同的纸张方向,并包括对应的纸盒401、 402和403。排空的托 盘404接收打印的纸张。
(图像处理设备的操作单元)
图5是示出图像处理设备110的操作单元112的布置的平面图。 要注意的是图像处理设备120和130的操作单元包括等同的布置。
LCD显示单元501是通过将触摸板薄片粘接到液晶显示器 (LCD)上的触摸板显示器502配置而成的。LCD显示单元501显 示图像处理设备IIO的操作窗口和软件键,并且当用户按压所显示的 鍵之一时,单元501将指示所按下的位置的位置信息发送至控制单元 111的CPU 301。
当用户想要启动,例如原稿图像的扫描操作时,按下启动键505。 启动键505的中心位置包括指示启动键505是否准备进行操作的绿 红、两色LED指示器506。当用户想要停止图像处理设备IIO的激活 操作时,按下停止键503。当用户输入他或她的用户ID时,按下ID 键507。复位键504允许用户将来自操作单元112的设定复位。
(操作单元和操作单元接口 (I/F)的内部布置)
图6是示出与控制单元111的内部布置一致的、图像处理设备 110的操作单元112和操作单元I/F 306的内部布置的框图。要注意的 是尽管下述说明是关于图像处理设备110作出的,即使当图像处理 设备IIO由图像处理设备120或130替代时,也不会引起问题。
如上所述,操作单元112通过操作单元I/F 306与系统总线307 相连接。CPU 301、 RAM302、 ROM303和硬盘驱动器(HDD ) 304 连接到系统总线307。 CPU 301基于存储在ROM 303和HDD 304中 的控制程序等,系统地控制对连接到系统总线307的各种装置的访问。 CPU 301从通过装置I/F 312连接的扫描仪113读取输入信息,并将 图像信号作为输出信息输出至通过装置I/F 312连接的打印机114。 RAM302充当CPU301的主存储器、工作区等。
来自触摸板显示器502的每个触摸板和各种硬件键(停止键503、 复位键504、启动键505和ID键507 )的用户输入信息通过输入端口 601传递给CPU 301。 CPU 301基于用户输入信息的内容和控制程序 产生显示窗口数据,并将显示窗口数据通过控制窗口输出装置的输出 端口 602输出至LCD显示单元501。并且,CPU301根据需要控制两 色LED指示器506。
图7示出了在图像处理设备110的操作单元112上显示的标准操 作窗口的示例。
布置在图7的最上方的显示区701上的按钮被用于选择由图像处 理设备110提供的各种功能之一。复制功能704允许用户使用打印机 114,打印由扫描仪113通过扫描原稿图像获得的原稿图像数据,以 便获得原稿图像的副本。
发送功能705允许用户将由扫描仪113扫描的原稿图像数据或存 储在HDD 304中的图像数据发送至各输出目的地。输出目的地包括 由各种协议通过网络接口 308能对其发送数据的各输出目的地,和通 过例如,诸如FAX之类的协议经由调制解调器309能对其发送数据 的输出目的地。利用发送功能705,通过选择多个输出目的地能发送数据。
箱功能706允许用户浏览、编辑、打印和发送存储在HDD 304 中的诸如图像数据、代码数据之类的文档文件。存储在HDD 304中 的文档文件包括由扫描仪113扫描的原稿图像数据,和通过网络接口 308下载的数据。并且,存储在HDD 304中的文档文件包括通过存储 从另一设备经由网络接口 308接收的打印数据而获得的数据、从另一 设备经由调制解调器309接收的传真数据等。
箱功能706可被用作为用户的办公室环境中的电子邮件信箱。因 为到纸张上的打印输出操作被延迟,直到用户输入密码,所以箱功能 706也可以用作为增强PDL打印作业的保密性的安全打印(secured print)功能。
使用箱功能706允许用户对其它图像处理设备120和130的 HDD 、以及由信息处理设备101和102公开的共享文件系统进行访问, 以浏览、编辑、打印和发送数据。利用箱功能706,用户可访问存储 在服务器系统140的共享文件系统、数据库系统等中的诸如图像数据、 代码数据之类的文档文件,并浏览、编辑、打印并发送数据。
扩展功能707允许用户调用各种扩展功能,以从外部设备使用扫 描仪113。
检索功能708允许用户从图像处理设备110的箱、其它图像处理 设备的箱等检索所需文档。利用检索功能708,用户可从由信息处理 设备公开的共享文件系统、以及由服务器系统140提供的共享文件系 统和数据库系统检索所需文档。
图7中的中间显示区702显示当用户选择复制功能704时的操作 窗口。图7中的最下方的显示区703与状态显示区对应,该状态显示 区向用户显示诸如图像处理设备IIO的功能、设备本身的信息之类的 各种消息,而与在最上方的显示区701上选择的功能无关。
图8示出了在DB管理系统201中存储的各个数据库的示意性配置。
文档DB 202包括多个文档记录801。文档记录801与要由用户
处理的纸文档和数字文档文件对应。每一个文档记录801包括文档元 数据802、文档内容数据803和多个页面记录804。
文档元数据802是存储与对应于文档记录的文档相关联的各种 元数据。文档元数据802包括文档名称、作者、创建日期、数据格式、 数据大小、页面数量、标签、作业日志等。
"标签,,是像由任意字符串形成的、由用户赋给文档的关键词 一样 的信息。文档可基于该标签被检索。用户可自由地将多个标签赋给一 个文档。通过将标签附加给文档,文档可基于各种标准被分类并可以 容易地被检索。对于共享文档,多个用户可稍后添加标签,以便在稍 后的时间查阅或使用该文档。因此,可显著地将用于分类和检索文档 的元数据做得更加满意。
该方法;故通常称为"大众分类法(folksonomy)"。"大众分类法" 是组合了 "大众"和"分类法"的术语。
作业日志是用于详细说明对于作为要被处理的对象的文档执行 的 一 系列作业的参考信息列表。 一个文档记录通常保持对多个作业记 录的参考。例如,考虑其中作为要被处理的对象的多个作业使用被明 显详细说明为相同文档的文档的情况。
文档内容数据803是与文档本身的内容对应的数据。当存储编码 文档数据时,文档内容数据803与应用程序的文本、数据等对应。当 将形成文档的页面像与纸原稿对应的光栅图像数据一样明显地分离, 并由扫描仪扫描时,每个页面记录804都包括内容数据。
页面记录804是与形成文档的每一页面对应的记录。单独的页面 记录804与由扫描仪113扫描的光栅图像数据组、通过由再现单元210 再现应用程序的数据并将其分开到各页面而获得的图像数据、结构信 息、文本、元数据组等对应。
每一个页面记录包括页面元数据805和页面内容数据806。页面 元数据805是存储与对应的页面相关联的各种元数据的记录。页面元 数据805包括结构信息、特征、缩略图等。结构信息是与由图像结构 分析单元208或再现单元210存储作为分析结果的该页面的结构相关 联的信息。
特征是表达由图像特征抽取单元207抽取和存储、并形成页面的 图像的特征的信息。
缩略图是易于处理的几个相对小的尺寸的图像,并且该图像是通 过对整个页面的图像或该页面中所包括的图像元素应用分辨率转换 (或按比例缩减)获得的。可以在产生页面元数据805时产生缩略图 图像,或者如果需要它们响应外部检索请求,则可以根据需要产生缩 略像。并且,产生还未产生的缩略像的任务可与预定的批处 理一起被异步执行。
页面内容数据806是与页面本身的内容对应的数据。页面内容数 据806存储用于每个页面的图像数据,诸如通过由图像扫描仪扫描纸 原稿的页面而获得的光栅图像数据、通过由再现单元210将代码文档 再现成为页面而获得的图像数据等。并且,页面内容数据806存储通 过由OCR 209对页面图像应用字符识别而获得的文本数据、用于通 过由再现单元210再现代码文档而获得的每个页面的文本信息等。
作业DB 203包括多个作业记录808。作业记录808是与由用户 执行的每个分别的文档处理作业对应的记录。每个作业记录808包括 日期和时间、操作者、请求源设备、处理设备、处理内容、处理的文 档等。日期和时间是表达执行对应作业的日期和时间的数据。操作者 是详细说明已经执行该作业的用户的数据。
处理请求源设备是充当作业执行请求源的设备。例如,当个人计 算机101将打印作业发送至图像处理设备110时,请求源设备是个人 计算机101。
处理设备是实际处理作业的设备。例如,当个人计算机101将打 印作业发送至图像处理设备110时,处理设备是图像处理设备110。
处理内容是详细说明作业的处理内容的信息。处理内容包括作业 类型、以及详细说明在进行处理时在每种作业类型中如何选择并设定 各种可选择的选项和各种可设定的参数的信息。
处理文档是参考信息的列表,该参考信息详细说明将要处理的作
为目标的作业的文档。
一个作业记录通常参照多个文档记录。例如, 考虑其中执行一个作业以使作为目标的多个文档被处理的情况。
索引DB 204包括多个索引记录809。每个索引记录809是用于 从文档DB 202和作业DB 203中迅速地检索数据的索引信息,并且参 照多个文档记录801和多个作业记录808。
索引记录是由索引产生器211产生的。索引记录可用于迅速地检
索包括与给定作为检索关键的图像相似的图像的文档记录。并且,索
引记录可用于在文档内容数据和页面内容数据中迅速地检索包括给
定作为检索关键的文本的文档记录。此外,索引记录可用于迅速地检 索具有与给定作为检索关键的条件相匹配的元数据的文档记录和作
业记录。
(检索处理的序列)
图9是用于说明检索处理的序列的流程图。检索处理是通过由图 像处理设备IIO的CPU 301执行的嵌入应用程序来实施的。嵌入应用 被称为文档检索应用。
当用户选择例如,操作单元112上的显示区701中的"检索,,按钮 时,开始一系列的流程的序列。
在步骤S901中,文档检索应用显示操作单元112的显示区702 上的文档检索功能的基本窗口 (检索窗口 )。该检索窗口允许用户设 定检索条件、输入检索关键、输入开始检索指令等。下面将使用图10 说明该检索窗口的配置。
在步骤S902中,该应用根据用户的指令输入检索关键图像。
在步骤S903中,该应用根据用户的指令输入其它检索条件设定。
在步骤S904中,该应用等待来自用户的开始检索指令的输入。 在用户输入开始检索指令之前(S904中为否),处理返回至步骤S902 以重复输入检索关键图像和其它检索条件设定。如果用户输入开始检 索指令(S904中为是),则处理前进至步骤S905。
在步骤S905中,应用执行检索处理。文档检索应用建立与在服 务器系统140上运行的作业存档应用的连接,并将检索关键和检索条
件发送至检索单元212。该应用接收所需数据以将与一个或更多文档 相关联的检索结果列表显示作为由检索单元212进行的检索结果,其 中该一个或更多文档与检索条件匹配(命中)。相当大的数量的文档 命中根据相似图像检索和全文本检索的特征的检索条件。显示检索结 果显示的所需数据是与所命中的文档对应的文档记录中所包括的元 数据,以及与文档记录相关联的作业记录中所包括的一些数据。
在步骤S906中,该应用基于从作业存档应用接收的信息显示检 索结果列表。将在下文中参考图ll说明该检索结果列表的配置。
在步骤S907中,该应用检查用户是否输入缩略图显示设定改变 指令。如果用户输入了该指令(S卯7中为是),则该处理前进至步骤 S908以改变缩略图显示设定。处理返回至步骤S906。在步骤S906中, 该应用基于改变的缩略图显示设定再次显示检索结果列表。
如果在步骤S907中该应用确定用户没有输入任何缩略图显示设 定改变指令(S907中为否),则该处理前进至步骤S909。
在步骤S909中,该应用检查用户是否输入文档记录过滤器改变 指令。如果用户输入了该指令(S卯9中为是),则该处理前进至步骤 S910以改变文档记录过滤器。然后,该处理返回至步骤S卯6,以基 于改变的文档记录过滤器再次显示检索结果列表。
如果在步骤S909中该应用确定用户没有输入任何文档记录过滤 器改变指令(S909中为否),则该处理前进至步骤S911。
在步骤S911中,该应用检查用户是否输入文档或页面的详细项 目显示指令。如果用户输入了该指令(S911中为是),则该处理前进 至步骤S912以显示窗口,该窗口显示与所选文档、页面或作业相关 联的详细信息。在用户关闭详细项目显示窗口之后,该处理返回至步 骤S906以再次显示检索结果列表。
如果在步骤S911中该应用确定用户没有输入4壬何详细项目显示 指令(S911中为否),则该处理前进至步骤S913。
在步骤S913中,该应用检查用户是否对文档记录输入操作指令。 允许对在列表中显示的文档记录进行的操作包括打印、保存、发送、 附加标签、检索并显示相关文档、标记等。如果用户输入该指令(S913 中为是),则该处理前进至步骤S914以执行与所选指令对应的文档 记录操作。该处理返回至步骤S906以再次显示检索结果列表。
如果在步骤S913中该应用确定用户没有输入任何文档操作指令 (S913中为否),则该处理前进至步骤S915。
在步骤S915中,该应用检查用户是否输入再次检索指令。如果 用户没有输入任何再次检索指令(S915中为否),则该处理返回至步 骤S906以再次显示检索结果列表。如果在步骤S915中,该应用确定 用户输入了再次检索指令(S915中为是),则该处理返回至步骤S901 以再次执行一系列检索处理。
要注意的是,信息处理设备101可执行一系列序列处理。可替代 地, 一系列处理是可分开的,并且可将执行各个处理的软件程序安装 于多个设备之上,并由该多个设备执行以形成分布式应用。例如,可 在图像处理设备110上执行检索窗口和检索结果列表的显示、以及来 自用户的指令输入。从而,可在信息处理设备IOI、服务器系统140、 其它图像处理设备120和130等上执行其它处理。
相反地,可在信息处理设备101上执行检索窗口和检索结果列表 的显示、以及来自用户的指令输入,而在图像处理设备110和服务器 系统140上执行其它处理。当用户在信息处理设备IOI上操作文档检 索应用时,对于用户,在纸原稿上输入作为检索关键图像的图像比在 包括扫描仪113的图像处理设备110上的操作更不方便。在这样的情 况下,因为用户可从信息处理设备101、另一个图像处理设备120等 操作由图像处理设备IIO的箱功能预先存储的图像,所以用户可容易 地使用从箱选择的作为检索关键图像的图像。
作为形成分布式应用的方法之一,可利用由网络浏览器和网络服 务器的组合来实现的基于网络的应用的形式。 (文档检索窗口的配置示例)
图10示出了作为文档检索应用的基本窗口的文档检索窗口的配 置的示例。将文档检索窗口 1000用作文档检索应用的基本窗口。在
本实施例中,文档检索应用在操作单元112的显示区702上显示文档 检索窗口。文档检索窗口 1000包括检索条件设定区1001、检索关键 图像输入区1002、以及检索开始指令区1003。
检索条件设定区1001允许用户设定并确认检索条件。
检索条件单选按钮1004允许用户选择基本检索条件并确认所选 设定。选项"包括所有关键,,指示命中所有设定检索关键的文档的检 索。选项"包括一些关键,,指示命中一些设定检索关键的文档的检索。 选项"高级检索"指示命中在按下检索选项按钮1005时设定的详细检 索条件的文档的检索。
检索选项按钮1005允许用户打开用于设定详细检索条件的窗 口。详细检索条件设定包括高级检索条件设定,该高级检索条件设定 用作用于在高级检索模式中执行检索时确定命中文档的标准。作为详 细检索条件的选项,可设定一起使用元数据检索和全文本检索的条 件,以与相似图像检索一起使用。
元数据检索是对于存储在与对应于给定文档的文档记录801相 关联的文档元数据、 一组页面元数据805、以及对应作业记录808中 的各个数据项目指定检索条件的检索方法。元数据检索允许基于标 签、文档名称、所有者、创建日期、数据格式、页面数量、标签和相 关文档等指定检索条件。元数据检索允许基于作业日志(日期和时间、 操作者、请求设备、处理设备、处理内容、以及由该作业处理过的、 要被处理的其它文档)、各个页面的结构信息等指定检索条件。
因而,除了基于文档名称、所有者、创建的日期和时间、标签等 的普通检索,还可以基于相关文档和文档的先前检索的日志来检索文 档。
元数据检索允许基于诸如形成文档的页面的方向,即,纵向(垂 直延长)或横向(水平延长)之类的其它标准检索文档。并且,元数 据检索允许基于诸如纸张大小、页面范围(n页S页面数量〈m页)、 彩色或单色、图像和文本的比率等的其它标准检索文档。
此外,元数据检索允许基于与作业相关联的其它标准,即该文档是在何时、何地、由谁和如何被处理的来检索文档。
全文本检索将文本(字符串)设定为检索关键,并在全文本中检
索包括设定字符串的文档。文档的文本被包括在文档记录801中所包 括的文档内容数据803中,以及在页面记录804中的任何一个中所包 括的页面内容数据。
可将文档元数据802或页面元数据805中所包括的文档数据作为 全文本检索目标添加。并且,可采用下述设定。当将与文档相关的作 业记录808中所包括的文本数据作为全文本检索目标添加,并且作业 记录808命中时,对应的文档记录801可命中。
检索关键图像输入区1002允许用户设定并确认要被用作相似图 像检索的检索关键的图像。
原稿图像扫描按钮1006允许用户使用图像处理设备的扫描仪 113扫描纸文档,并将扫描的图像作为相似图像检索的检索关键输入。 在按下原稿图像扫描按钮1006时打开图像扫描窗口。图像扫描窗口 允许用户在图像处理设备110的复制或扫描功能、基于TWAIN等的 普通扫描仪装置驱动程序的功能等中进行原稿扫描设定,并设定原稿 扫描参数。
在按下启动键505时,根据设定的原稿扫描参数扫描原稿图像, 并且将扫描的图像数据作为检索关键图像输入。在完成原稿图像扫描 时,如果图像扫描窗口是打开的,则将其关闭。在按下启动键505而 没有按下原稿图像扫描按钮1006时,根据默认原稿扫描参数或目前 设定的扫描参数扫描原稿图像。
箱图像选择按钮1007允许用户使用图像处理设备110的箱功能 从预存储的文档中选择检索关键图像。箱功能允许用户浏览图像处理 设备110的HDD 304的内容,并选择包括他或她想要用作检索关键 图像的图像的文档。
并且,用户可经由LAN IOO通过访问并浏览其它图像处理设备 120和130的HDD、或由信息处理设备101和102^>开的共享文件系 统的内容来选择包括他或她想要用作检索关键图像的图像的文档。可
替代地,用户可通过访问并浏览由服务器系统140提供的共享文件系 统、数据库系统等的文档文件来选择包括他或她想要用作检索关键图 像的图像的文档。
检索关键图像设定区1008允许用户确认并操作设定的检索关键图像。
检索关键图像设定条件消息1009指示检索关键图像的设定条 件,并显示设定的检索关键图像的数量等。
检索关键图像显示区IOIO显示设定的检索关键图像组。该区显 示与设定为检索关键的图像对应的一组并列检索关键图标。当用户使 用原稿图像扫描按钮1006或箱图像选择按钮1007输入检索关键图像 时,对其添加对应的检索关键图标。
检索关键图标1011与一个检索关键图像对应。用户可由此对检 索关键图像输入各种指令。
检索关键ID 1012是用于指定检索关键图像的识别信息(识别符)。
检索关键缩略图1013是检索关键图像的缩略图。在按下检索关 键缩略图1013时,打开图像查看器窗口并以比缩略图大的尺寸显示 检索关键图像。利用图像查看器窗口,用户可确认检索关键图像的详 情。
检索关键概要1014是检索关键图像的简要说明。 检索关键详情按钮1015允许用户确认关于检索关键图像的详细 信息。在检索关键详情按钮1015操作时,打开比检索关键概要1014 更详细地显示关于检索关键的信息的检索关键详情窗口。检索关键详 情窗口还允许用户设定对检索关键图像唯一的检索条件。为了在未来 的检索中再次使用该检索关键,用户可将检索关键图像保存在箱中。
检索关键编辑按钮1016允许用户编辑检索关键图像。在检索关 键编辑按钮1016操作时,可打开用于编辑检索关键图像的检索关键 编辑窗口。检索关键编辑窗口允许用户通过对检索关键图像应用诸如 修整、遮蔽(masking)、噪声去除之类的各种图像处理获得所需的 编辑过的检索关键图像。用户可将检索关键图像分为多个检索关键图 像。用户可将与包括多个页面图像的文档对应的一个检索关键分成为 与各个页面图像对应的检索关键图像。
检索关键删除按钮1017允许用户从一组检索关键中移除检索关 键图像。检索开始指令区1003允许用户激活检索处理。
检索启动按钮1018允许用户启动检索处理。在按下检索启动按 钮1018时,使用检索条件设定区1001上的检索条件和检索关键图像 输入区1002上的检索关键图像,对服务器系统140的作业存档应用 发出检索处理请求。
(文档检索结果列表窗口的配置示例)
图11示出了文档检索应用的文档检索结果列表窗口的配置的示 例。文档检索结果列表窗口 1100是一个窗口的示例,当文档检索应 用从作业存档应用接收到检索处理请求的响应时,该窗口显示检索结 果。本实施例的文档检索应用在操作单元112的显示区702上显示文 档检索结果列表窗口。文档检索结果列表窗口 1100包括列表操作区 1101、检索列表显示区1102、滚动条1103。
检索列表操作区1101是用于控制检索结果列表的显示的操作设 定区。显示过滤显示区域1104显示应用于作为检索结果命中的多个 文档的显示过滤器,以便留下当前显示在检索列表显示区1102上的 文档组。图11示出了其中窗口显示作为检索结果命中的"所有文档,, 状态。
窗口能显示从服务器系统140的检索单元212接收的所有命中文 档(即,没有过滤的)、或根据用于缩小结果的显示过滤器设定的条 件通过过滤命中文档而获得的文档。
显示过滤器设定按钮(过滤器)1105允许用户设定显示过滤器 条件。在按下显示过滤器设定按钮1105时,打开显示过滤器设定窗 口以提示用户设定所需过滤器条件。用户可基于命中文档的文档记录 801中所包括的各种信息来设定条件作为过滤器条件。并且,用户可 将条件设定为用于存储在文档元数据802、命中页面的页面记录804 的页面元数据805、与该文档相关联的作业记录808等中的各条信息 的图案匹配条件。换句话说,用户可设定与他或她基于按下检索选项 按钮1005设定的详细检索选项相似的过滤器条件。
例如,除了基于文档名称、创建的日期和时间、标签等的普通过 滤之外,用户还可基于相关文档和该文档先前检索的日志设定过滤。
用于缩小结果的显示过滤器设定条件。并且,用户可基于诸如形成文 档的页面的方向,即,纵向(垂直延伸)或横向(水平延伸),之类 的其它标准来设定过滤。此外,用户可基于诸如纸张大小、页面范围 (n页S页面数量〈m页)、颜色、灰度(连续色调图像)、或单色二 值图像(二值图像)、图像和文本的比率之类的其它标准来设定过滤。 此外,用户可基于与作业相关联的其它标准,即,该文档是何时、何 地、由谁、和如何被处理的来设定过滤。
根据实施例,不仅在检索列表显示区1102上显示作为检索结果
的所有命中的文档,还可以设定抽取满足特定条件的文档、并且将所 抽取的文档显示为列表的过滤器。此外,当用户改变设定时,更新检
索结果列表的内容。从而,用户可从大数量的备选文档中容易地检索
所需文档。
显示项目设定区1106在将命中文档作为检索结果显示在检索列 表显示区1102上时,控制每个文档要被显示的项目。每次用户在复 选框上进行选取或点击指定给该复选框的标记字符串时,复选框的已 选和未选状态可被交替切换。当用户选择"显示属性信息"复选框时, 诸如文档名称、数据格式、页面数量、文档位置信息之类的与文档相 关联的元数据被显示在检索列表显示区1102上。当用户选择"显示缩 略图,,复选框时,命中检索条件的每个页面的缩略像被显示在检 索列表显示区1102上。
文档概要缩略图设定区1107在将命中文档作为检索结果显示在 检索列表显示区1102上的同时,控制用于每个文档的要被显示的文 档概要缩略图的显示格式。当用户在显示项目设定区1106上选择"显 示缩略图"复选框,以及还选择"显示文档概要缩略图"复选框时,显 示文档概要缩略图。文档概要缩略图是与形成文档的页面对应的一对 缩略图,以便允许用户在视觉上识别其概要。
文档概要缩略图配置设定区1108允许用户设定形成文档概要缩 略图的缩略图组的配置。在文档概要缩略图配置设定区1108上,用 于输入数值的四个文本输入区域并列,并分别对它们指定"首页"、"之 前"、"后续,,和"尾页"标记字符串。用户通过对"首页"区域输入从文 档的第一页起要显示多少页缩略图的数值进行设定。用户通过对"之 前"区域输入在命中检索条件的页面之前要显示多少之前页缩略图的 数值来设定。用户通过对"后续,,区域输入在命中检索条件的页面之后 要显示多少后续页缩略图的数值来设定。用户通过对"尾页"区域输入 从文档的最后一页起要显示多少页缩略图的数值来设定。
动画显示复选框1109允许用户设定文档概要缩略图的动画显示。
再次检索按钮1110允许用户返回到文档检索窗口 1000。 缩小检索按钮1111允许用户返回到文档检索窗口 1000并实施范 围更小的缩小再次检索。用户从在检索列表显示区1102上显示的文 档中标记要被添加作为检索关键的文档(包括要被添加作为检索关键 的图像的文档),并按下缩小检索按钮1111。在按下缩小检索按钮 1111时,当标记的文档被作为检索关键添加到检索关键图像显示区 1010时,再次显示文档检索窗口 1000,并继续进行缩小再次检索。
仅通过添加尽可能多的足够的检索关键图像,可以提高所需文档 的检索命中率(与设定条件相匹配的比率),并且可容易地检索到所 需文档。通过分析所添加的检索关键图像的特征量、并在确定相似度 时调整各种特征量的标记的分配,可根据用户的意向作出相似图像检索。
更具体地说,可将由用户添加的用于缩小检索的检索关鍵图像从 实施检索的用户的角度确定为具有主观地高相似度的样本图像。因
而,用户可通过将多个特征量和相似度确i^算法组合来调整标记的分
配,以便更高地评估检索关键图像的相似度。例如,当在原稿检索关 键图像和添加的检索关键图像之间,基于形状的相似度很高,而基于 色彩的相似度很低时,可实施缩小检索,以将基于形状的相似度取为 优先于基于色彩的相似度。反之,可作出适合的调整以实施色彩优先 检索、彩色图案优先检索、对象树型结构相似度优先检索等。
检索列表显示区1102显示与检索条件匹配的文档列表作为检索 结果。检索命中文档显示区1112、 1113、 1114和1115分别显示与和 检索条件和缩小条件相匹配的文档对应的信息。在默认设定中,将具 有更高命中率(与设定条件相匹配的比率)的文档显示在列表的更高 级别位置。在相同的命中率(与设定条件匹配的比率)的情况下,将具 有通过数字评估文档值而获得的更高文档级别的文档显示在更高级 别位置。用户可通过以与默认顺序不同的顺序对文档分类来再次显示 文档列表,其中可通过按下显示过滤器设定按钮1105来以与默认顺 序不同的顺序进行文档分类。例如,可基于诸如创建日期、最后参考 日期、数据格式、页面数量、每个文档的信息的位置、用于该文档的 作业的日期、设备、处理内容之类的与文档相关联的各种元数据,以 升序或降序显示文档。当用户再次设定文档列表的显示顺序时,迅速 地更新该列表显示。
将在下文中简要说明基于默认显示顺序的文档命中率(与设定条 件匹配的比率)。相似图像检索基于对单独算法唯一的相似度。 一般 来讲,相似度是表达"相似程度"的连续量,而不是二进制值"相似"或 "不相似"。然而,基于实施例的实现,将其相似度低于预定阈值的图 像处理为"不相似"。对于其相似度高于预定阈值的图像,可将具有相 对高相似度的图像与具有低相似度的图像区别开。基于给定检索条件 中所包括的检索关键图像与要被检索的文档数据中所包括的图像之 间的相似度确认结果来计算命中率(与设定条件匹配的比率)。也就 是说,包括具有高相似度的图像的文档的命中率被计算为高于包括具 有低相似度的图像的文档的命中率。
由于可指定多个检索关键,将与更大数量的检索条件相匹配的文
高。当指定相似图像检索的多个检索关键图像时,如果文档包括具有 高相似度的大数量的图像,则其命中率变得很高。当在选择"包括所 有关键,,单选按钮同时实施检索时,确定没有命中,除非该文档与所 有给定检索关键相匹配。
下面将说明基于默认显示顺序的文档等级。将文档等级作为表示 文档的语义重要性的索引来计算。文档等级基于明确指定作为文档的 元数据的重要性。基于诸如秘密程度、所有者、作者、位置、页面数 量之类的文档属性来计算文档等级。此外,还可以基于后来附加于文 档的标签的数量和类型、参考的次数、相关文档的相互参照关系的网 络等来计算文档等级。
由于文档等级基于相关文档的相互参照关系的网络,因此从具有
更高文档等级的许多文档参考的文档的文档等级被计算为相对高。具 有指示与具有高文档等级的文档被同时处理(即,它们被同时打印、
发送、保存或检索,它们的作业被组合等)的日志的文档的文档等级 被计算为相对高。
通过使检索列表显示区1102上显示的文档中在较低等级的文档 的检索命中文档显示状态比较高等级的文档的显示状态更简单,或减
小它们的显示尺寸,可增加在一个窗口内显示的文档的总数量。
根据实施例,在默认设定下,可基于命中率的顺序、文档等级的 顺序、附加到文档的元数据的顺序、用于文档的执行的作业的顺序等 将文档列表分类并显示。此外,当再次设定文档列表的显示顺序时, 立即更新列表显示。从而,可从大量的备选文档中容易地检索所需文 档。
滚动条1103允许用户滚动文档检索结果列表窗口 1100。在许多 情况下,由于检索列表显示区1102显示大数量的文档,所以那些文 档没有正常地落于操作单元112的LCD显示单元501的显示区之内。 用户可通过在滚动窗口的同时浏览文档来找出所需文档。要注意的 是,可将用于翻页等的按钮(未示出)分配在例如,检索列表显示区1102的最下方部分,并且可将检索结果文档的列表分为要被显示的多 个页面。
要注意的是,当按下分配在例如检索列表显示区1102的最下方 部分的列表打印按钮(未示出)时,打印出文档检索结果。在有限的 显示区之内显示尽可能最大数量的文档的列表的需要、和允许用户通 过在视觉上比较尽可能详细的文档概要缩略图来选择所需文档的需 要是难以同时满足的竟争性的需要。然而,根据本实施例,由于可立 即打印出文档检索结果列表,所以用户可使用具有比触摸板显示器 502更高的分辨率和浏览率(browsability)的输出纸张来检索所需文 档。
(检索命中文档显示的示例)
图11所示的检索命中文档显示区1112、 1113、 1114和1115被 配置为具有相同显示格式。在窗口上实际显示指示文档的对应元数据 的实际值的斜体字符串。有下划线的字符串允许在按下其显示区域时 打开对应的详细信息显示窗口,并允许用户确认其详细信息。
图12示出了作为检索命中文档显示区的示例的检索命中文档显 示区1112。数据格式图标1201被用于显示对应文档的数据格式。"文 档名称"1202是用于显示对应文档的文档名称的字符串。"数据格 式"1203是用于显示对应文档的数据格式的字符串。"页面数量"1204 是用于显示对应文档的页面数量的字符串。"文档位置信息"1205是用 于详细说明诸如保存对应文档的文件服务器之类的存储位置(地点) 的字符串。文档位置信息是由URI或文件服务器及其文件系统中的文 件路径字符串识别的。在由作业存档系统累积文档的情况下,可显示 其中保存由作业存档系统的作业收集的将被处理的文档的副本数据 的位置。可替代地,当指定要被处理的文档的原稿数据的位置时,可 显示该位置。
"日志信息"1206是用于表达预先应用于作为要被处理的对象的 对应文档的作业处理、检索等的日志的字符串。用户可确认指示该文 档是何时、由谁、通过何种处理,并且由那个设备处理的日志信息。 "页面"1207是用于表达命中形成对应文档的检索关键的条件的 页面的页面数量的字符串。
命中页面缩略图1208是用于显示命中形成对应文档的检索关键 的条件的页面或图像元素的概况的缩略像。
首页缩略图1209是用于显示对应文档的首页的概况的缩略 像。编号与在文档概要缩略图配置设定区1108上设定的页面的数量 一样多的缩略像被显示成行。
之前页面缩略图1210是用于表达命中检索关键的页面之前的页 面的概况的缩略像。编号与在文档概要缩略图配置设定区1108 上设定的页面的数量一样多的缩略像被显示成行。后续页面缩略 图1211是用于表达命中检索关键的页面之后的页面的概况的缩略图 图像。编号与在文档概要缩略图配置设定区1108上设定的页面的数 量一样多的缩略像被显示成行。尾页缩略图1212是用于表达对 应文档的尾页的概况的缩略像。编号与在文档概要缩略图配置设 定区1108上设定的页面的数量一样多的缩略像被显示成行。根 据实施例,以大尺寸显示命中页面缩略图1208,并且以小于命中页面 缩略图1208的尺寸显示其它页面的缩略图。根据目前的配置,用户 可明确地识别命中的页面。
在有限的显示区之内显示尽可能最大数量的文档的需要、和允许 用户通过在视觉上比较尽可能详细的文档概要缩略图来选择所需文 档的需要是难以同时满足的竟争性的需要。然而,根据本发明,由于 用户可容易地改变将在文档概要缩略图中显示的页面配置、和页面数 量,他或她可容易地检索所需文档。
当要在文档概要缩略图内显示非常大的数量的页面时,显示具有 更高缩减比例的小缩略图以使其落于有限的显示区之内,从而调整检 索结果的显示。可替代地,可如下控制显示。也就是说,以更小的尺 寸显示具有相对更低的优先级的页面的缩略图,或如此布局缩略图以 使之前页面部分地重叠在后续页面之上。可替代地,可通过省略检索 结果的一些信息调整检索结果的显示,以使其落于有限的显示区之 内。
当显示区不够大时,可根据下述算法选择优选地显示在文档概要 缩略图中的具有高优先级的页面。也就是说,可使用当页面命中相似 图像检索的条件时,优选地选择文档的更年轻的页面,优选地选择命 中更早指定的检索关键的页面,或优选地选择具有更高相似度的页面 的算法。
打印按钮1213允许用户使用打印功能打印出对应文档。保存按 钮1214允许用户将对应文档保存在箱功能中。发送按钮1215允许用 户通过发送功能发送对应文档。
"附加标签,,按钮1216允许用户操作对应文档的标签。当按下"附 加标签,,按钮1216时,打开文档标签窗口,并且用户可浏览并编辑已 为对应文档设定的标签并能另外登记新的任意标签。
相关文档按钮1217允许用户操作并设定与对应文档相关的文档 (相关文档)。当按下相关文档按钮1217时,打开相关文档窗口,并且 用户可浏览并编辑与对应文档相关的相关文档。并且,用户可使其它 文档与对应文档相关,并将它们登记为相关文档。
"标记"复选框(标记)1218允许用户标记对应文档。当用户想 要选择性地操作显示在列表上的一些文档时,他或她可操作在选定状 态具有复选框的每个文档。例如,当用户将"标记"复选框1218设为 已选状态,然后按下缩小检索按钮1111时,在将标记的(所选)文 档添加到检索关键的同时实施再次检索。
根据实施例,使用文档概要缩略图,用户不仅可识别命中检索条 件的页面,还可以一眼识别文档的页面和全局图像的上下文,因此他 或她可容易地从列表中检索所需文档。
(包括多个命中页面的文档的显示)
图13示出了包括多个命中页面的文档的检索命中文档显示区的 示例。相同的附图标记表示上述显示项目,并且将避免对其的重复说 明。由于相似图像检索基于连续的相似度,因此一个文档中所包括的 多个相似图像都可能命中检索条件。由于在设定多个检索关键和条件同时可实施检索,因此一个文档中的多个页面都可能命中检索条件。
图13示出了与其中两个命中页面缩略图1208和1302命中检索条件 的文档相关联的显示示例。
"页面"1301是用于显示命中形成对应文档的那些页面的检索关 键的条件的第二页面的页面数量的字符串。命中页面缩略图1302是 用于显示命中检索关鍵的条件的第二页面的概况的缩略像。
之前页面缩略图1303是用于表达在命中检索关键的第二页面之 前的页面的概况的缩略像。编号与在文档概要缩略图配置设定区 1108上设定的页面的数量一样多的缩略像被显示成行。
后续页面缩略图1304是用于表达在命中检索关键的页面之后的 页面的概况的缩略像。编号与在文档概要缩略图配置设定区1108 上设定的页面的数量一样多的缩略像被显示成行。
在有限的显示区之内显示尽可能最大数量的文档的列表的需要、 和允许用户通过在视觉上比较尽可能详细的文档概要缩略图来选择 所需文档的需要是难以同时满足的竟争性的需要。然而,根据本实施 例,由于用户可容易地改变将在文档概要缩略图中显示的页面配置和 页面数量,他或她可容易地检索所需文档。
如图12所示,在图13的显示示例中,显示具有更高的缩减比例 的小缩略图,以使其落于有限的显示区之内,从而调整检索结果的显 示。可替代地,可如下控制显示。也就是说,以更小的尺寸显示具有 相对更低的优先级的页面的缩略图,或如此布局缩略图以使之前页面 部分地重叠在后续页面之上。可替代地,可通过省略检索结果的一些 信息调整检索结果的显示,以使其落于有限的显示区之内。
当显示区不够大时,对于文档概要缩略像设定优先级。根据 下述算法,可选择具有高优先级的页面。也就是说,可使用当页面命 中相似图像检索的条件时,优选地选择文档的更年轻的页面,优选地 选择命中更早指定的检索关键的页面,或优选地选择具有更高相似度的页面的算法。
(文档概要缩略图的动画显示的示例)图14示出了文档概要缩略图的动画显示示例。当动画显示复选 框1109处于选定状态中时,自动动画显示检索命中文档显示区1112、 1113、 1114和1115中的文档概要缩略图。
首页缩略图1209是用于显示对应文档的首页的概况的缩略 像。编号与在文档概要缩略图配置设定区1108上设定的页面的数量 一样多的缩略像被显示成行。在这种情况下,当用户设定"四个 页面,,时,将文档的第一页面缩略图1209、以及文档接下来的第二到 第四页面的缩略图1401a、 1401b和1401c显示成行。在表示检索文 档数据的内容的缩略像中,在相对其它缩略像的前面的位置 并且在放大的状态下,依次自动地显示各个页面的缩略图1209和 1401a到1401c中的每一个(动画显示)。通过像翻页一样使缩略图 进行动画,可通过使用小显示区表达文档中的大数量的页面的上下文 和概况。
之前页面缩略图1210a、 1210b和1210c是用于表达命中检索关 键的页面之前的页面的概况的缩略像。与在文档概要缩略图配置 设定区1108上设定的页面的数量一样多的缩略像被显示成行。 图14示出了其中用户设定"三个页面,,的状态。
命中页面缩略图1208是用于表达命中形成对应文档的页面的检 索关键的条件的页面的概况的缩略像。
后续页面缩略图1211a、 1211b和1211c是用于表达在命中检索 关键的页面之后的页面的概况的缩略像。与在文档概要缩略图配 置设定区1108上设定的页面的数量一样多的缩略像被显示成行。 图14示出了其中用户设定"三个页面"的状态。
在相对其它缩略像的前面的位置并且在放大的状态下,依次 自动地显示各个页面的缩略图1210a到1210c、1208和1211a到1211c 中的每一个。通过像翻页一样使缩略图进行动画,可通过使用小显示 区表达文档中的大数量的页面的上下文和概况。
尾页缩略图1212是用于显示对应文档的尾页的概况的缩略 像。编号与在文档概要缩略图配置设定区1108上设定的页面的数量 一样多的缩略像被显示成行。在这种情况下,当用户设定"四个
页面"时,将文档的最后一页页面缩略图1212、以及从文档的最后一 页计数的第二到第四页面的缩略图1402a、 1402b和1402c显示成行。 在相对其它缩略像的前面的位置并且在放大的状态下,依次自动 地显示各个页面的缩略图1402a到1402c和1212中的每一个(动画 显示)。通过像翻页一样使缩略图进行动画,可通过使用小显示区表 达文档中的大数量的页面的上下文和概况。
在有限的显示区之内显示尽可能最大数量的文档的列表的需要、 和允许用户通过在视觉上比较尽可能详细的文档概要缩略图来选择 所需文档的需要是难以同时满足的竟争性的需要。
然而,根据实施例,由于将文档概要缩略像配置为自动地进 行动画,因此可同时满足竟争性的需要。
(在密集模式中的文档检索结果列表窗口的显示示例)
图15示出了在密集显示模式中的文档检索应用的文档检索结果 列表窗口的显示配置的示例。
文档检索结果列表窗口 1500与图11中所示的文档检索结果列表 显示示例的另一模式对应。当显示项目设定区1106上的"显示属性信 息,,复选框没有被选择时,将与在检索列表显示区1101上要被显示的 每个文档相关联的元数据尽可能多地省略,并代替为在窗口上显示尽 可能最大的数量的命中文档的列表。相同附图标记表示与在图11中 示出的文档检索结果列表窗口 1100上的那些元素相同的元素,并且 将避免对其重复说明。
详情按钮1501用于打开允许用户确认与文档相关联的详细信息 的窗口,省略详细信息的显示。在按下该按钮时,打开与图13所示 的显示窗口相同的详细信息显示窗口。
^^用文档概要缩略图动画显示区1502a到1502i (在下文中也祐_ 简称为"显示区1502")以动画显示文档概要缩略图。
在密集显示模式下,为允许用户从大数量的检索结果文档中找出 所需文档,在一个窗口内同时显示尽可能最大数量的检索结果文档。
如用于显示文档概要缩略图的显示区1502,只能确保用于一个页面的 显示大小。因此,当选择动画显示复选框1109时,显示区1502的显 示是分时的。显示区1502的显示是分时的,以执行如翻页一样依次 自动切换页面(或图像元素)的动画显示。动画显示允许用户识别帮 助他或她理解形成文档的页面和包括检索命中页面的上下文的概况 的特性页面。
(文档概要缩略图动画显示处理的序列)
图16A和16B是示出了文档概要缩略图动画显示处理的序列的 流程图。显示处理是通过由图像处理设备110的CPU 301执行的文档 检索应用来实现的。
当显示图15中示出的密集显示模式下的文档检索结果列表窗口 时,对于所有显示文档的每个文档概要缩略图动画显示区1502a到 1502i,并行执行一系列流程的序列。在下面的说明中,将这些显示区 1502a到1502i作为文档概要缩略图动画显示区1502来说明。
文档检索应用在步骤S1601中检查是否设定了动画显示。如果选 择了动画显示复选框1109( S1601中为是),则处理前进至步骤S1602; 否则(S1601中为否),该处理结束。
该应用在步骤S1602中检查是否已经显示从首页开始、编号与在 文档概要缩略图配置设定区1108上设定的页面数量一样多的缩略图 图像。如果已经显示了该缩略像(S1602中为是),则处理跳至 步骤S1604;否则(S1602中为否),该处理前进至步骤S1603。
在步骤S1603中,应用在文档概要缩略图动画显示区1502上从 首页显示缩略像,并且该处理返回至步骤S1602。根据目前的循 环,顺序使从第一页面开始,编号同设定的页面数量一样多的缩略图 图像进行动画。
应用在步骤S1604中检查是否已经显示了检索命中页面的缩略 像。如果已经显示了该缩略像(S1604中的是),则该处理 跳至步骤S1610;否则(S1604中为否),该处理前进至步骤S1605。
该应用在步骤S1605中检查是否已经显示编号与在文档概要缩
略图配置设定区1108上设定的页面数量一样多的之前页面的缩略图 图像。如果已经显示了该缩略像(S1605中的是),则该处理跳 至步骤S1607;否则(S1605中为否),该处理前进至步骤S1606。
在步骤S1606中,应用显示编号与在文档概要缩略图动画显示区 1502上设定的页面数量一样多的之前页面的缩略像,并且该处理 返回至步骤S1605。根据目前的循环,顺序使编号与检索命中页面相 关联地设定的编号同页面数量一样多的之前页面的缩略像进行 动画。
在步骤S1607中,该应用还在文档概要缩略图动画显示区1502 上显示该检索命中页面的缩略像。
该应用在步骤S1608中检查是否已经显示编号与在文档概要缩 略图配置设定区1108上与一个检索命中页面相关联地设定的页面数 量一样多的后续页面的缩略像。如果已经显示了该缩略像 (S1608中的是),则该处理返回步骤S1604;否则(S1608中为否), 该处理前进至步骤S1609。
在步骤S1609中,应用显示编号与在文档概要缩略图动画显示区 1502上设定的页面数量一样多的后续页面的缩略像,并且该处理 返回至步骤S1608。根据目前的循环,顺序使编号与检索命中页面相 关联地设定的页面数量一样多的后续页面的缩略像进行动画。
另一方面,如果步骤S1608中的条件为真,并且处理返回至步骤 S1604,则该循环允许每个检索命中页面和其之前和后续页面的缩略 图与文档中的所有检索命中页面相关联地进行顺序动画。
该应用在步骤S1610中检查是否已经从尾页显示编号与在文档 概要缩略图配置设定区1108上设定的页面数量一样多的缩略像。 如果已经显示了该缩略像(S1610中为是),则该处理返回步骤 S1601;否则(S1610中为否),该处理前进至步骤S1611。
在步骤S1611中,应用在文档概要缩略图动画显示区1502上显 示尾页的缩略像,并且该处理返回至步骤S1610。根据目前的循 环,顺序使编号与设定的页面数量一样多、从尾页开始的缩略像进行动画。
为了使缩略像进行动画,可基于定时器设定对于各个时帧切 换显示。根据用于文档概要缩略图中的各个页面的优先级,可以将具 有高优先级的页面显示长时间段,而具有低优先级的页面显示短时间 段。
根据下述算法来选择优选地显示在文档概要缩略图中的具有高 优先级的页面。也就是说,可使用当页面命中相似图像检索的条件时, 优选地选择文档的更年轻的页面,优选地选择命中更早指定的检索关 键的页面,或优选地选择具有更高相似度的页面的算法。
要注意的是,可使未在文档概要缩略图配置设定区1108上设定 的页面的缩略图只显示非常短的时间段。根据目前的配置,由于根据 重要页面的重要级,与包括文档中命中页面的文档或上下文的概况相 关联的重要页面显示相对长的时间段,可增强对命中页面的文档和上 下文的概况的印象。
在有限的显示区之内显示尽可能最大数量的文档的列表的需要、 和允许用户通过在视觉上比较尽可能详细的文档概要缩略图来选择 所需文档的需要是难以同时满足的竟争性的需要。
然而,根据实施例,由于将文档概要缩略像配置为自动地进 行动画,因此可同时满足竟争性的需要。 (第二实施例)
根据第一实施例,使用形成文档的页面为单位显示文档概要缩略 图。然而,第二实施例将说明使形成文档的单独图像区元素作为单位 显示文档概要缩略图的配置。
图17示出了由多个图像区元素形成的文档的示例。 文档1700是由多个图像区和文本区形成的文档的示例。由图像 结构分析单元208或再现单元210获得与页面的结构相关联的结构信 息作为文档1700的分析结果,并且可将形成文档的诸如多个图像和 多个文本元素的元素分解。并且,可基于分配的元素之间的距离、由 文化确定的分配和上下文的习惯等,通过分析获得元素之间的交叉关系作为结构信息。要注意的是,当通过诸如HTML之类的代码数据 来描述文档时,数据本身通常描述元素之间的关系。
文档1700包括图像元素1701到1702。可基于将它们从左到右、 从上到下分配的文化习惯来分析图像元素以使上下文在附图标记的 升序中。
图18示出了根据第二实施例的检索命中文档显示区。图18的检 索命中文档显示区示例假设其中使用与图像元素1704相似的图像作 为关键来实施检索,并且图17中所示的文档1700命中的情况。图18 中的检索命中文档显示区具有与第一实施例的图12中所示的检索命 中文档显示区的示例相同的配置。因而,相同附图标记表示共同的元 素,并且避免对其的重复说明。
命中图像缩略图1804是用于显示图像元素的概况的缩略 像,其中该图像元素命中形成对应文档的条件的检索关键的条件。该 缩略图与形成图17中的文档1700的图像元素1704对应。
第一图像缩略图1801是用于表达对应文档的第一图像元素的概 况的缩略像。缩略图与形成图17中的文档1700的图像元素1701 对应。编号与在与文档概要缩略图配置设定区1108相似的设定区(未 示出)上设定的页面的数量一样多的缩略像可被显示成行。
之前图像缩略图1803是用于显示在命中检索关键的图像元素之 前的图像元素的概况的缩略像。缩略图与形成图17中的文档1700 的图像元素1703对应。编号与在与文档概要缩略图配置设定区1108 相似的设定区(未示出)上设定的页面的数量一样多的缩略像可 被显示成行。
后续图像缩略图1805是用于表达命中检索关键的图像元素之后 的图像元素的概况的缩略像。缩略图与形成图17中的文档1700 的图像元素1705对应。与在与文档概要缩略图配置设定区1108相似 的设定区(未示出)上设定的页面的数量一样多的缩略像可被显 示成行。
最后图像缩略图1812是用于表达对应文档的最后图像元素的概况的缩略像。缩略图与形成图17中的文档1700的图像元素1712 对应。编号与在与文档概要缩略图配置设定区1108相似的设定区(未 示出)上设定的页面的数量一样多的缩略像可被显示成行。
在有限的显示区之内显示尽可能最大数量的文档的列表的需要、 和允许用户通过在视觉上比较尽可能详细的文档概要缩略图来选择 所需文档的需要是难以同时满足的竟争性的需要。
根据实施例,由于用户可容易地改变要被显示在文档概要缩略图 中的图像元素配置、以及图像元素的数量,因此他或她可容易地检索 所需文档。
当要在文档概要缩略图内显示非常大的数量的图像元素时,显示 具有更高缩减比例的小缩略图以使其落于有限的显示区之内,从而调 整检索结果的显示。可替代地,可如下控制显示。也就是说,以更小 的尺寸显示具有相对更低的优先级的图像元素的缩略图,或如此布局 图像元素以使之前页面部分地重叠在后续页面之上。可替代地,可通 过省略一些显示内容调整检索结果的显示,以使其落于有限的显示区之内。
当显示区不够大时,可根据下述算法选择优选地显示在文档概要 缩略图中的具有高优先级的图像元素。也就是说,可使用当文档命中 相似图像检索的条件时,优选地选择文档的更年轻数量的图像元素, 优选地选择命中更早指定的检索关键的图像元素,或优选地选择具有 更高相似度的图^象元素的算法。
可以如同图14的显示示例中的、和图16A和16B中的序列相同 的序列,使用图像元素为单元使文档概要缩略图进行动画,并且可通 过使用小显示区来显示布置在文档中的大数量的图像元素的上下文 和概况。
(其它实施例)
要注意的是,也可通过提供记录软件的程序代码的存储介质来实 现本发明的目的,其中该软件可基于系统或设备实现上述实施例的功 能。并且,当系统或设备的计算机(或CPU或MPU)读取出并执行 存储在存储介质中的程序代码时,可实现该目的。
在这样的情况下,从存储介质读取出的程序代码本身实现上述实 施例的功能,并且存储程序代码的存储介质构成本发明。
可使用例如,软盘、硬盘、光盘、磁光盘、CD-ROM、 CD-R、 非易失性存储卡、ROM等作为用于提供程序代码的存储介质。
当计算机执行读取程序代码时实现上述实施例的功能。并且运行 在计算机上的OS (操作系统)基于程序代码的指令执行一些或所有 实际处理操作,以实现上述实施例。
尽管已参考示例性实施例说明了本发明,应理解为本发明不限于 公开的示例性实施例。下述权利要求的范围依照最广泛的说明,以便 包含所有这样的修改和等同的结构和功能。
权利要求
1.一种文档检索设备,包括文档检索单元,其适用于检索包括与输入检索条件相匹配的图像的文档数据;检索结果列表显示单元,其适用于基于文档检索单元的检索结果,在显示单元上显示与检索条件相匹配的文档数据的列表显示;以及缩略图显示单元,其适用于在通过检索结果列表显示单元的列表显示中显示和与检索条件相匹配的页面或图像元素相关联的第一缩略像,以及与形成包括与检索条件相匹配的页面或图像元素的文档数据的另一页面或另一图像元素相关联的第二缩略像。
2. 根据权利要求1所述的设备,其中,缩略图显示单元基于在第 一缩略像之前或之后要分配的页面或图像元素的布置顺序显示 第二缩略像。
3. 根据权利要求1所述的设备,其中,要被显示的第二缩略图 图像包括与页面或图像元素相关联的缩略像,该页面或图像元素 邻近与检索条件相匹配的页面或图像元素。
4. 根据权利要求1所述的设备,其中,要被显示的第二缩略图 图像包括与形成文档数据的首页或尾页、或第一或最后图像元素相关 联的缩略像,其中所述文档数据包括与检索条件相匹配的页面或 图像元素。
5. 根据权利要求1所述的设备,其中,要被显示的第二缩略图 图像包括与多个页面或多个图像元素相关联的多个缩略像,其中 该多个页面或多个图像元素是基于从邻近与检索条件相匹配的页面 或图像元素的页面或图像元素依次的布置顺序来选择的。
6. 根据权利要求1所述的设备,其中,要被显示的第二缩略图 图像包括与多个页面或多个图像元素相关联的多个缩略像,其中 该多个页面或多个图像元素是基于从形成包括与检索条件相匹配的页面或图像元素的文档数据的首页或尾页、或第一或最后图像元素依 次的布置顺序选择的。
7. 根据权利要求5所述的设备,还包括显示计数设定单元,其适用于设定要被显示的第二缩略像的 显示计数,其中,缩略图显示单元根据由显示计数设定单元设定的显示计 数,选择要被作为第二缩略像显示的页面或图像元素,并显示与 所选页面或图像元素相关联的多个缩略像。
8. 根据权利要求1所述的设备,其中,缩略图显示单元显示尺寸比第二缩略像大的第一缩略像。
9. 根据权利要求1所述的设备,还包括动画显示设定单元,其适用于进行设定以动画显示表示由文档检 索单元检索的文档数据的内容的缩略像,其中,缩略图显示单元根据动画显示设定单元的设定动画显示第 一缩略像和第二缩略像。
10. 根据权利要求1所述的设备,还包括 显示过滤器设定单元,其适用于设定缩小文档检索单元的检索结果所需条件,其中,检索结果列表显示单元基于由显示过滤器设定单元设定的 条件在显示单元上显示缩小的检索结果。
11. 根据权利要求1所述的设备,其中检索条件包括使用扫描图 像和保存在存储装置中的图像中至少之一 的检索关键图像。
12. 根据权利要求1所述的设备,其中,当一个文档数据包括与 检索条件相匹配的多个页面或多个图像元素时,缩略图显示单元显示 和与检索条件相匹配的页面或图像元素相关联的多个第一缩略 像、以及与形成包括与检索条件相匹配的页面或图像元素的其它页面 或其它图像元素相关联的多个第二缩略像。
13. 根据权利要求12所述的设备,其中,当一个文档数据包括 与检索条件相匹配的多个页面或多个图像元素时,要由缩略图显示单元显示的第一缩略像是与根据优先条件所选的页面或图像元素 相关联的缩略像。
14. 一种用于包括显示单元的文档检索设备的文档检索方法,所 述方法包括检索包括与输入检索条件相匹配的图像的文档数据的文档检索步骤;基于该文档检索步骤的检索结果,在显示单元上显示与检索条件 相匹配的文档数据的列表显示的检索结果列表显示步骤;以及在通过检索结果列表显示步骤的列表显示中显示和与检索条件 相匹配的页面或图像元素相关联的第一缩略像,以及与形成包括 与检索条件相匹配的页面或图像元素的文档数据的另一页面或另一 图像元素相关联的第二缩略像的缩略图显示步骤。
15. 根据权利要求14所述的方法,其中,缩略图显示步骤基于在 第一缩略像之前或之后要分配的页面或图像元素的布置顺序显 示第二缩略像。
16. 根据权利要求14所述的方法,其中,要被显示的第二缩略 像包括与页面或图像元素相关联的缩略像,该页面或图像元 素邻近与检索条件相匹配的页面或图像元素。
17. 根据权利要求14所述的方法,其中,要被显示的第二缩略 像包括与首页或尾页、或第一或最后图像元素相关联的缩略 像,该首页或尾页、或第一或最后图像元素形成包括与检索条件相匹 配的页面或图像元素的文档数据。
全文摘要
本发明涉及文档检索设备和文档检索方法。文档检索设备包括文档检索单元,其适用于检索包括与输入检索条件相匹配的图像的文档数据;检索结果列表显示单元,其适用于基于该文档检索单元的检索结果,在显示单元上显示与检索条件相匹配的文档数据的列表显示;以及缩略图显示单元,其适用于在通过检索结果列表显示单元的列表显示中显示和与检索条件相匹配的页面或图像元素相关联的第一缩略像,以及与形成包括与检索条件相匹配的页面或图像元素的文档数据的另一页面或另一图像元素相关联的第二缩略像。
文档编号G06F17/30GK101206662SQ20071015377
公开日2008年6月25日 申请日期2007年9月20日 优先权日2006年12月13日
发明者山本雅仁 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1