图像处理装置及基于该装置的缩略图像生成方法

文档序号:6373083阅读:197来源:国知局
专利名称:图像处理装置及基于该装置的缩略图像生成方法
技术领域
本发明涉及可生成缩略图像的多功能数字图像形成装置等的图像处理装置及基于该装置的缩略图像生成方法。
背景技术
作为电子资料的文档数据(也称文件)的缩略图通常使用显示页面的缩小图像,在用户回忆资料的内容方面成为有用的信息。
但是,在对显示页面的缩略图像没有印象的情况下,不能判断是否为目标文件,因此,就得花费时间打开文件确认内容。
例如,在像将技术报告逐年度整理成文件的资料那样,并列具有多个彼此关联性较低且独立的内容的资料的情况下,适合缩略图的页面及位置对每个用户不同。
具体而言,例如在用户A和用户B生成的技术报告包含于缩略图生成对象的资料中的情况下,对用户A来说,如果是用户A生成的位置的缩略图则是有用的,但即使从没有印象的封面页或用户B的文档生成位置生成缩略图像,也不能成为有用的信息。
另外,为了将缩略图像设为更有用的信息,专利文献I中提出了一种图像处理装置,其对作为多个图像数据的缩小图像的缩略图像进行列表显示,并且,将各图像数据中的开头等容易识别的部分切出,在缩略图像的附近通过气球显示等放大并显示,由此,用户能够容易识别图像数据的内容,能够选择希望的图像数据。
另外,专利文献2中提出了一种图像处理装置,其通过使包含于读取原稿得到的读取数据中的标题、索引、图、表、照片、手写、关键词等各项目以每组不同的形态显示在显示单元上,用户能够从缩略图像容易确定希望的页面。
现有技术文献
专利文献I :日本特开2008-298903号公报
专利文献2 :日本特开2010-72842号公报发明内容
发明要解决的课题
但是,上述专利文献I及2记载的图像处理装置生成与被出示缩略图像的用户没有关系的缩略图像,因此,不能消除前述的问题点,即,适合缩略图的页面及位置对每个用户不同,因此即使从没有印象的封面页及其它用户的文档生成位置生成缩略图像,也不能成为有用信息的问题点。
本发明是鉴于这样的技术背景而完成的,其课题是,提供能够生成对被出示缩略图像的缩略图像被出示者来说有用的缩略图像,并容易地进行是否为目标文件的判断及文件的内容把握的图像处理装置,还提供由该装置执行的缩略图像的生成方法。
用于解决课题的方案
通过以下方法解决上述课题。
(I) 一种图像处理装置,其特征在于,具备分割部件,该分割部件将多个页面的文档数据分割为每个独立的文档单位的单位块;单位块确定部件,该单位块确定部件从由所述分割部件分割所得的单位块中确定与被出示缩略图像的缩略图像被出示者关联性较高的单位块;以及缩略图像生成部件,该缩略图像生成部件使用由所述单位块确定部件确定的单位块内的图像和/或文本数据生成缩略图像。
(2)如上述(I)所述的图像处理装置,所述分割部件将所述文档数据通过行距检测分割成小块,并且,将分割所得的小块进行分层,将最低层级的块分割为单位块。
(3)如上述(I)或(2)所述的图像处理装置,所述缩略图像生成部件生成缩略图像,该缩略图像包含由所述单位块确定部件确定的与缩略图像被出示者关联性较高的单位块的首页的图像和/或单位块内的索引字符串。
(4)如上述(I)或(2)所述的图像处理装置,还具备存储部件,该存储部件存储缩略图像被出示者对于所述文档数据的任意页面或区域进行的操作历史,所述单位块确定部件根据存储于所述存储部件的操作历史,将包含缩略图像被出示者进行操作的页面或区域的单位块确定为与缩略图像被出示者关联性较高的单位块。
(5)如上述(I)或(2)所述的图像处理装置,所述文档数据为发送对象数据,所述缩略图像被出示者为所述发送对象数据的发送接收者。
(6)如上述(I)或(2)所述的图像处理装置,所述文档数据为被广播通信的发送对象数据,所述缩略图像被出示者为所述发送对象数据的多个发送接收者,所述单位块确定部件从所述单位块中对每个发送接收者确定关联性较高的单位块,所述缩略图像生成部件使用由所述单位块确定部件对每个发送接收者确定的单位块内的图像和/或文本数据,对每个发送接收者分别生成缩略图像。
(7)如上述(I)或(2)所述的图像处理装置,还具备图像区域提取部件,该图像区域提取部件从由所述单位块确定部件确定的单位块中提取图像区域;以及文章区域检测部件,该文章区域检测部件检测文章区域,该文章区域参照由所述图像区域提取部件提取的图像区域的图像,所述缩略图像生成部件将在由所述文章区域检测部件检测的文章区域中记载有概要或主旨的情况设为第一优先顺序,将在由所述文章区域检测部件检测的文章区域中记载有总结或结论的情况设为第二优先顺序,使用由该文章区域所参照的图像作为缩略图像。
(8)如上述(I)或(2)所述的图像处理装置,还具备图像区域提取部件,该图像区域提取部件从由所述单位块确定部件确定的单位块中提取图像区域;以及图像分类部件, 该图像分类部件将由所述图像区域提取部件提取的图像区域的图像分类为图、表或照片, 所述缩略图像生成部件在由所述图像分类部件分类的图像中,将按照图、表或照片的优先顺序选择的一个或多个图像作为缩略图像使用。
(9)如上述(7)所述的图像处理装置,所述缩略图像生成部件将所述优先顺序为最高位的图像和由所述单位块确定部件确定的单位块的索引字符串合成而生成缩略图像。
(10)如上述(I)或(2)所述的图像处理装置,还具备字符串提取部件,该字符串提取部件从文档数据中提取与缩略图像被出示者的姓名、所属名及个人识别信息的至少任一个一致的字符串;以及计数部件,该计数部件对每个单位块计数字符串提取部件对字符串的提取次数,所述单位块确定部件根据由所述计数部件计数的字符串的提取次数,确定与缩略图像被出示者关联性较高的单位块。
(11)如上述(I)或(2)所述的图像处理装置,还具备历史保存部件,该历史保存部件对每个缩略图像被出示者保存文档数据检索时的关键词的历史;字符串提取部件,该字符串提取部件从文档数据中提取与所述历史保存部件保存的关键词一致的字符串;以及计数部件,该计数部件对每个单位块计数字符串提取部件对字符串的提取次数,所述单位块确定部件根据由所述计数部件计数的字符串的提取次数,确定与缩略图像被出示者关联性较高的单位块。
(12)如上述(I)或(2)所述的图像处理装置,还具备预览时间保存部件,该预览时间保存部件保存缩略图像被出示者对文档数据的页面单位或区域单位的预览时间;以及运算部件,该运算部件从所述预览时间保存部件保存的页面单位或区域单位的预览时间, 运算每个所述单位块的预览时间,所述单位块确定部件根据所述运算部件运算的预览时间,确定与缩略图像被出示者关联性较高的单位块。
(13)如上述(I)或(2)所述的图像处理装置,还具备印刷次数保存部件,该印刷次数保存部件保存缩略图像被出示者对文档数据的页面单位或区域单位的印刷次数;以及运算部件,该运算部件从所述印刷次数保存部件保存的页面单位或区域单位的印刷次数, 运算每个所述单位块的印刷次数,所述单位块确定部件根据所述运算部件运算的印刷次数,确定与缩略图像被出示者关联性较高的单位块。
(14)如上述(I)或(2)所述的图像处理装置,还具备历史保存部件,该历史保存部件保存由缩略图像被出示者变更文档数据名称时的历史;字符串提取部件,该字符串提取部件从文档数据中提取与所述历史保存部件保存的文档数据的变更后的名称一致的字符串;以及计数部件,该计数部件对每个单位块计数由字符串提取部件对字符串的提取次数,所述单位块确定部件根据由所述计数部件计数的字符串的提取次数,确定与缩略图像被出示者关联性较高的单位块。
(15)如上述(I)或(2)所述的图像处理装置,还具备标题保存部件,该标题保存部件保存由缩略图像被出示者发送的、添加有文档数据的电子邮件的标题;字符串提取部件,该字符串提取部件从文档数据中提取与所述标题保存部件保存的电子邮件的标题一致的字符串;以及计数部件,该计数部件对每个单位块计数由字符串提取部件对字符串的提取次数,所述单位块确定部件根据由所述计数部件计数的字符串的提取次数,确定与缩略图像被出示者关联性较高的单位块。
(16)如上述(I)或(2)所述的图像处理装置,还具备发送次数保存部件,该发送次数保存部件保存在缩略图像被出示者以页面为单位或以区域为单位发送文档数据时的发送次数;以及运算部件,该运算部件从所述发送次数保存部件保存的以页面为单位或以区域为单位的发送次数运算每个所述单位块的发送次数,所述单位块确定部件根据所述运算部件运算的发送次数,确定与缩略图像被出示者关联性较高的单位块。
(17)如上述(I)或(2)所述的图像处理装置,还具备移动次数保存部件,该移动次数保存部件保存在缩略图像被出示者以页面为单位或以区域为单位移动文档数据时的移动次数;以及运算部件,该运算部件从所述移动次数保存部件保存的以页面为单位或以区域为单位的移动次数运算每个所述单位块的移动次数,所述单位块确定部件根据由所述运算部件运算的移动次数,确定与缩略图像被出示者关联性较高的单位块。
( 18 )如上述(I)或(2 )所述的图像处理装置,还具备目录页面检测部件,该目录页面检测部件检测所述文档数据的目录页面,所述分割部件将所述目录页面检测部件检测出的目录页面除外,将文档数据分割成每个独立的文档单位的单位块。
(19) 一种根据图像处理装置的缩略图像生成方法,其特征在于,具备分割步骤, 将多个页面的文档数据分割成每个独立的文档单位的单位块;单位块确定步骤,从在所述分割步骤中分割的单位块中,确定与缩略图像被出示者关联性较高的单位块;以及缩略图像生成步骤,使用在所述单位块确定步骤中确定的单位块内的图像和/或文本数据生成缩略图像。
发明效果
根据上述(I)记载的发明,多个页面的文档数据被分割成每个独立的文档单位的单位块,并且,从这些被分割的单位块中确定与缩略图像被出示者关联性较高的单位块,使用该确定的单位块内的图像和/或文本数据生成缩略图像,因此,缩略图像对缩略图像被出示者来说,为关联性较高的熟悉的缩略图像。因此,能够生成对缩略图像被出示者来说有用的缩略图像,能够容易地判断是否为目标文件及掌握文件的内容等。
根据上述(2)记载的发明,将文档数据通过行距检测分割成小块,并且将分割的小块进行分层,将最低层级的块分割作为单位块,因此,能够比较简单地进行对单位块的分割。
根据上述(3)记载的发明,能够生成与缩略图像被出示者关联性较高的单位块的首页的缩略图像。
根据上述(4)记载的发明,根据缩略图像被出示者对于文档数据的任意页面或区域出示进行的操作历史,判定包含例如缩略图像被出示者进行最多的操作的页面或区域的单位块,并确定为与缩略图像被出示者关联性较高的单位块。
根据上述(5)记载的发明,能够生成对于被发送发送对象数据的发送接收者关联性较高的较熟悉的缩略图像。
根据上述(6)记载的发明,能够生成分别对于被广播发送发送对象数据的多个发送接收者关联性较高的较熟悉的缩略图像。
根据上述(7)记载的发明,在参照所确定的单位块中的图像的文章区域中记载有概要或主旨的情况下,使用由记载有该概要或主旨的文章区域所参照的图像生成缩略图像。另一方面,在参照所确定的单位块中的图像的文章区域中未记载有概要或主旨而记载有总结或结论的情况下,使用由记载有该总结或结论的文章区域所参照的图像生成缩略图像。
根据上述(8)记载的发明,从所确定的单位块中提取图像区域,并且将所提取的图像区域的图像分类为图、表或照片,在这些分类的图像中,使用按照图、表或照片的优先顺序选择的一个或多个图像生成缩略图像。
根据上述(9)记载的发明,将优先顺序为最高位的图像和所确定的单位块的索引字符串合成并生成缩略图像,因此,可以生成对缩略图像被出示者来说更有用的缩略图像。
根据上述(10)记载的发明,从文档数据中提取与缩略图像被出示者的姓名、所属名及个人识别信息的至少任一个一致的字符串,并且对每个单位块计数字符串的提取次数。而且,根据所计数的字符串的提取次数确定与缩略图像被出示者关联性较高的单位块。例如,将所计数的字符串的提取次数最多的单位块确定作为与缩略图像被出示者关联性较高的单位块。因此,能够可靠地确定与缩略图像被出示者关联性较高的单位块。
根据上述(11)记载的发明,对每个缩略图像被出示者保存文档数据检索时的关键词的历史,将与该保存的关键词一致的字符串从文档数据中提取,并且,对每个单位块计数字符串的提取次数。而且,根据所计数的字符串的提取次数确定与缩略图像被出示者关联性较高的单位块。例如将所计数的字符串的提取次数最多的单位块确定为与缩略图像被出示者关联性最高的单位块。因此,能够可靠地确定与缩略图像被出示者关联性较高的单位块。
根据上述(12)记载的发明,保存缩略图像被出示者的文档数据对以页面为单位或以区域为单位的预览时间,并且从所保存的以页面为单位或以区域为单位的预览时间运算每个单位块的预览时间。而且,根据所运算的预览时间,确定与缩略图像被出示者关联性较高的单位块。例如将预览时间最长的单位块确定作为与缩略图像被出示者关联性最高的单位块。因此,能够可靠地确定与缩略图像被出示者关联性较高的单位块。
根据上述(13)记载的发明,保存缩略图像被出示者对文档数据的以页面为单位或以区域为单位的印刷次数,并且从所保存的以页面为单位或以区域为单位的印刷次数运算每个单位块的印刷次数。而且,根据所运算的印刷次数,确定与缩略图像被出示者关联性较高的单位块。因此,能够可靠地确定与缩略图像被出示者关联性较高的单位块。
根据上述(14)记载的发明,保存由缩略图像被出示者变更文档数据名称时的历史,将与该保存的文档数据的变更后的名称一致的字符串从文档数据中提取,并且对每个单位块计数字符串的提取次数。而且,根据所计数的字符串的提取次数,确定与缩略图像被出示者关联性较高的单位块。例如,将所计数的字符串的提取次数最多的单位块确定为与缩略图像被出示者关联性较高的单位块。因此,能够可靠地确定与缩略图像被出示者关联性较高的单位块。
根据上述(15)记载的发明,保存由缩略图像被出示者发送的、添加有文档数据的电子邮件的标题,将与该保存的电子邮件的标题一致的字符串从文档数据中提取,并且对每个单位块计数字符串的提取次数。而且,根据所计数的字符串的提取次数,确定与缩略图像被出示者关联性较高的单位块。例如,将所计数的字符串的提取次数最多的单位块确定作为与缩略图像被出示者关联性较高的单位块。因此,能够可靠地确定与缩略图像被出示者关联性最高的单位块。
根据上述(16)记载的发明,保存缩略图像被出示者对文档数据的以页面为单位或以区域为单位的发送次数,并且从所保存的以页面为单位或以区域为单位的发送次数,运算每个单位块的发送次数。而且,根据运算的发送次数,确定与缩略图像被出示者关联性较高的单位块。因此,能够可靠地确定与缩略图像被出示者关联性较高的单位块。
根据上述(17)记载的发明,保存在缩略图像被出示者以页面为单位或以区域为单位移动出示文档数据时的移动次数,并且从所保存的以页面为单位或以区域为单位的移动次数,运算每个单位块的移动次数。而且,根据运算的移动次数,确定与缩略图像被出示者关联性较高的单位块。例如,将所计数的移动次数最多的单位块确定作为与缩略图像被出示者关联性最高的单位块。因此,能够可靠地确定与缩略图像被出示者关联性较高的单位块。
根据上述(18)记载的发明,将目录页面除外,文档数据被分割成每个独立的文档单位的单位块,所以可以防止生成目录页面的缩略图像。
根据上述(19)记载的发明,能够生成对缩略图像被出示者来说有用的缩略图像, 能够容易地判断是否为目标文件及掌握文件的内容。


图I是表示本发明一实施方式的图像处理装置的结构的方框图。
图2是用于对文档数据的内容和用户的关联进行说明的图。
图3是表示对用户A及B的缩略图像的图。
图4是表示图像处理装置实施的缩略图像生成处理的流程图。
图5是表示缩略图像生成对象的文档数据的图。
图6是用于说明将文档数据分割成多个单位块的途中状态的图。
图7同样用于说明将文档数据分割成多个单位块的途中状态的图。
图8同样用于说明将文档数据分割成多个单位块的途中状态的图。
图9是表示从文档数据中提取与用户B的注册信息一致的字符串的结果的表。
图10是表示所生成的缩略图像的图。
图11是用于更详细地说明图4的流程图所表示的处理的流程图。
图12是用于说明本发明的另一实施方式的、用户B将保存在图像处理装置的文档数据发送至用户A的终端装置的状况的图。
图13是表示图像处理装置的动作的流程图。
图14是表示从文档数据中提取与用户A的注册信息一致的字符串的结果的表。
图15是用于说明将包含缩略图像的文档数据从图像处理装置发送至用户A的终端装置的状况的图。
图16是用于说明本发明的又另一实施方式的、将包含缩略图像的文档数据从图像处理装置发送至多个用户终端装置的状况的图。
图17是表示图像处理装置的动作的流程图18 Ca) 图18 (c)是表示本发明的又另一实施方式的缩略图像生成处理的变形例的图。
图19是表示图像处理装置的动作的流程图20 Ca) 图20 (c)是表示本发明的又另一实施方式的缩略图像生成处理的其它变形例的图。
图21是表示图像处理装置的动作的流程图。
图22是表示用于对本发明的又另一实施方式、从全部文档数据中提取与过去的文档数据检索时的关键词一致的字符串,并根据提取的次数,确定与用户有关联的单位块的状况进行说明的图。
图23是表示图像处理装置的动作的流程图。
图24是用于对本发明的又另一实施方式的、根据过去预览显示文档数据时的预览时间,确定与用户有关联的单位块的状况进行说明的图。
图25是表示图像处理装置的动作的流程图。
图26是用于对本发明的又另一实施方式的、根据过去印刷文档数据时的印刷次数,确定与用户有关联的单位块的状况进行说明的图。
图27是表示图像处理装置的动作的流程图。
图28是用于对本发明的又另一实施方式的、从全部文档数据中提取与过去的文档数据的重命名时的输入文字一致的字符串,并根据提取的次数,确定与用户有关联单位块的状况进行说明的图。
图29是表示图像处理装置的动作的流程图。
图30是用于对本发明的又另一实施方式的、从全部文档数据中提取与添加文档数据的过去的电子邮件发送时的标题一致的字符串,并根据提取的次数,确定与用户有关联的单位块的状况进行说明的图。
图31是表示图像处理装置的动作的流程图。
图32是表示又另一实施方式的图像处理装置的动作的流程图。
图33是表示又另一实施方式的表示图像处理装置的动作的流程图。
标号说明
I图像处理装置
11CPU
12ROM
13RAM
15存储部
151箱
17操作面板
2、21 23终端装置
100文档数据
IOla IOld缩略图像具体实施方式
下面,根据附图对本发明的实施方式进行说明。
图I是表示本发明一实施方式的图像处理装置的结构的方框图。
该实施方式中,作为图像处理装置,使用具备复印功能、打印功能、传真功能、扫描功能等多个功能的多功能数字图像形成装置即MFP(Multi Function Peripherals,多功能外围设备),其具备CPU11、R0M12、RAM13、扫描部14、存储部15、打印部16、操作面板17、网络控制器(NIC) 18等。
上述CPUll统括控制图像形成装置I的全部,除了对复印功能、打印机功能、扫描功能、传真功能等基本功能进行可使用的控制外,该实施方式中,还生成关于文档数据的缩略图像,对于这一点在后面叙述。
上述R0M12是存储CPUll的动作程序等的存储器。
上述RAM13是提供CPUll根据动作程序动作时的工作区域的存储器。
上述扫描部14为读取置于原稿台(未图示)的原稿的图像,并输出图像数据的读取单元。
上述存储部15由例如硬盘驱动器(HDD)等非易失性的存储设备构成,对每个用户存储各用户操作图像处理装置I时的操作历史。
另外,在存储部15设有被称为箱(box)151的一个或多个存储区域,在该存储区域可以保存文档数据。另外,箱151中包含对于每个用户或者每个部门等设置的、只有该用户或者属于部门的用户可以访问的私人箱、及不确定多数可以访问的公共箱等。
上述打印部16将由上述扫描部14读取的原稿的图像数据及来自用户终端的打印数据等,按照所指示的模式进行印刷。
上述操作面板17使用于各种输入操作等,具备由显示消息及操作画面的触控面板式液晶等构成的显示部171、和具备数字盘、启动键、停止键等的键输入部172。
上述网络控制器18通过控制网络上的其它图像处理装置及其他外部设备例如用户终端等之间的通信,进行数据的发送接收。
下面,对根据图I所示的图像处理装置I的缩略图像的生成处理进行说明。
就缩略图像的生成处理而言,在例如使用图像处理装置I的用户从保存于箱151 的文档数据中选择希望的文档数据并执行作业(job)时,例如向接收地址发送或印刷时等执行,但也可以将缩略图像生成按钮显示在操作面板17的显示部171上,用户通过按下该按钮开始处理,生成定时(timing)没有限定。另外,所生成的缩略图像显示于操作面板17 的显示部171,或者印刷,或者与文档数据同时发送至发送地址,但也未限定生成后的处理。
该实施方式中,对每个用户生成有效缩略图像。例如图2所示,假设存在“2009年度技术报告”的标题记载于封面页(第一页)的文档数据(文件)100,其在第二页及第三页记载有用户A生成的技术报告,在第四页以后记载有用户B生成的技术报告。
在该情况下,对用户A来说,即使对封面页的标题即“2009年度技术报告”没有印象,也应该对记载于第二页及第三页的用户A自身生成的技术报告的内容有印象。
同样,对用户B来说,即使对封面页的标题即“2009年度技术报告”没有印象,也应该对记载于第四页以后的用户B自身生成的技术报告的内容有印象。
因此,该实施方式中,不是采用封面页的缩小图像及封面页的标题部分作为文档数据的缩略图像,而是如图3所示,从用户A及B分别生成的有印象的技术报告的记载部分生成缩略图像。由此,用户A及B能够容易地判断是否为目标文件的及掌握文件的内容。
另外,在图3中,标号IOla是将用户A有印象的报告的首页缩小的缩略图像,标号 IOlb是由用户A有印象的报告的标题和代表图像构成的缩略图像。标号IOlc是将用户B 有印象的报告的首页缩小的缩略图像,标号IOld是由用户B有印象的报告的标题和代表图像构成的缩略图像。缩略图像的种类未特别限定,但由各用户有印象的报告的标题和代表图像构成的缩略图像IOlb及101d,与将各用户的报告的首页缩小的缩略图像IOla及IOlc 相比,文字及图像的残缺等得到改善,成为更容易掌握文档数据的内容的缩略图像。
[实施方式I]
图4是表示图像处理装置I实施的缩略图像生成处理的流程图。图4的流程图所示的处理、及以后的流程图所示的处理,通过图像处理装置I的CPUll按照R0M12等记录介质记录的动作程序进行动作来执行。
另外,在以下的实施方式中,如图5所示,生成缩略图像的文档数据设为“2009年度技术报告”的标题记载于封面页(第一页),第二页及第三页记载有用户A生成的技术报告,第四页以后记载有用户B生成的技术报告的文档数据100,假设保存于前述存储部15的箱151中。
在步骤SI中,进行将用户从箱151选择的文档数据100分割成每个独立的文档单位的单位块的成块处理,在步骤S2中,实施确定与用户关联性较高的单位块(以下,也称高关联单位块)的处理。该实施方式中,使用图像处理装置I的用户为被出示缩略图像的缩略图像被出示者。
接着,在步骤S3中,从上述确定的高关联单位块内提取图像及文本等缩略图像用数据后,在步骤S4中使用提取的图像及文本等生成缩略图像。
对上述步骤SI的成块处理,更详细地进行说明。
在成块处理中,首先,如图6所示,通过检测文档数据的行距,分割成最小块(以下,称为小块)。图6的例子中,分割成小块I 9。
下面,提取索引(包含标题)文字的开头的章记号,用分隔符(连字符、间隔符)等分离。在没有章记号的情况下,判定索引文字的大小关系后,将块分层。
例如,如图7所示,从小块I的索引文字“A〇〇技术报告”提取章记号“A”,用连字符分离(该情况只有“A”),设为块层I。另外,从小块2的索引文字“A-1概要”提取章记号“A-1”,用连字符分离为“A”和“1”,设为块层2。对各小块重复同样的处理。
通过该处理,如图8所示,完成如下的层构造,将章记号“A”的“〇〇技术报告”设为块层1,在该块层I的下位层中存在章记号“A - I”的“概要”、“A - 2”的“前言”、“A - 3” 的“设计”、“A - 4” “总结”、章记号“无”的“参考文献”的各块层2,将章记号“B”的“ΛΛ 技术报告”设为块层1,在该块层次I的下位层中,存在“B - I”的“概要”、“B - 2”的“前古”坐口寸ο
而且,将最低层级别(level)即层I的分割块设为单位块。因此,在图8的例子中, 分割成包含单位块I及单位块2的多个单位块。
另外,在存在目录页面的情况下,预先检测是目录页面,将该目录页面除外而进行块化,目录页面优选为不作为缩略图像的生成对象。只要通过将位于文档数据的紧随封面的开头位置或末尾位置的页面群设为目录候补并判定是否为包含“目录” “内容 (Contents)”等确定的关键词(key word)的页面、字符串是否分项写或者是否记载有页数、 分项写的字符串群的一部分是否与所提取的索引字符串的一部分一致等进行是目录页面的检测即可。
下面,对在上述步骤S2中实施的高关联单位块的确定处理进行说明。
首先,从文档数据100中提取与使用图像处理装置I的用户的注册信息一致的字符串。作为用户注册信息,可举出姓名、所属名及个人识别信息(个人ID)的至少任意一个, 但该实施方式中,使用这些信息的全部。另外,使用图像处理装置I的用户通过登录到图像处理装置I时的认证来确定。另外,用户的注册信息预先注册于存储部15等,将使用图像处理装置I的用户的注册信息从存储部15等调用,判断文档数据中是否包含这些注册信息。
然后,对每个单位块计数所提取的字符串的提取次数后,提取计数值最大的单位块,将其确定为对于该用户的高关联单位块。例如图9所示,用户的姓名为“用户B”、所属名为“ □□开发部”、个人ID为“A12345”,若每个单位块的字符串的提取次数在单位块I为I 次、在单位块2为3次、在单位块3为O次,则对于用户B的高关联单位块为单位块2“ΛΛ技术报告”。
另外,该实施方式中,对作为用户注册信息的姓名、所属名及个人ID的全部用同一加权进行计数,以该合计值进行评价,但也可以改变姓名、所属名及个人ID的加权,考虑它们的加权和各自的字符串的提取次数的双方,确定高关联单位块。
这样,根据与缩略图像被出示者的姓名、所属名及个人ID的至少任意一个一致的字符串的文档数据100中的提取次数,确定对缩略图像被出示者的高关联单位块,因此,能够可靠地确定该高关联单位块。
下面,对上述步骤S3的缩略图像用数据提取处理及步骤S4的缩略图像生成处理进行说明。
从用前述的方法确定的高关联单位块的首页提取图像及文本数据,生成如图10 所示的缩略图像。该实施方式中,生成对用户B的高关联单位块即单位块2的首页的缩小图像,作为用户B的缩略图像101c。
这样,由于从高关联单位块中生成缩略图像,因此,可以提供包含对缩略图像被出示者来说有印象的图像的缩略图像,缩略图像被出示者能够容易地掌握、确认文档数据的内容。
图11是用于对图4的流程图所示的处理进一步详细说明的流程图。
在步骤SlOl中,检测文档数据100的行距,将其分割成最小块(小块)。接着,在步骤S102,判断索引文字的开头是否有章记号,如果有章记号(在步骤S102为“是”),则在步骤S103,将章记号用连字符、间隔符等分隔符分离后,进入步骤S105。如果没有章记号(在步骤S102为“否”),则在步骤S104,判定索引文字的字号的大小关系后,进至步骤S105。
在步骤S105中,将块分层,在步骤S106中,以层I的单位分割作为单位块。
接着,步骤S107中,从文档数据100中提取与用户注册信息一致的字符串后,在步骤S108,对每个单位块计数字符串的提取次数。
然后,在步骤S109,判断对于全部文件(文档数据)是否完成字符串的提取处理,如果未完成(在步骤S109为“否”),则返回到步骤S107。若完成(在步骤S109为“是”),则在步骤SllO中,将计数值(提取次数)最大的单位块确定作为对上述用户的高关联单位块。
而且,在步骤Slll中,生成所确定的高关联单位块的首页的缩略图像。
[实施方式2]
在该实施方式中,如图12所示,表示的是用户B将存储于图像处理装置I的存储部15的箱151的文档数据100,以包含缩略图像的形态通过PDF文件等发送至用户A的终端装置2的情况。
对该情况的图像处理装置I的动作表示在图13的流程图上。
由于步骤S201 S206的处理与图11的步骤SlOl S106的处理相同,因此省略说明。
该实施方式中,文档数据100的发送接收者即用户A为缩略图像被出示者,在步骤 S207中,从文档数据100中提取与用户A的注册信息一致的字符串后,在步骤S208对每个单位块计数字符串的提取次数。
然后,在步骤S209,判断对于全部文件(文档数据)是否完成字符串的提取处理,如果未完成(在步骤S209为“否”),则返回到步骤S207。若完成(在步骤S209为“是”),则在步骤S210,将计数值(提取次数)最大的单位块确定作为对于用户A的高关联单位块。
例如图14所示,用户的姓名为“用户A”、所属名为“ □□开发部”、个人ID为 “A12333”,若每个单位块的字符串计数值在单位块I为3次、在单位块2为I次,在单位块 3为O次,则确定单位块I “〇〇技术报告”作为对用户A的高关联单位块。
另外,该情况也可以改变姓名、所属名及个人ID的加权,考虑它们的加权和各自的字符串的计数值的双方,确定对用户A的高关联单位块。
返回到图13,在步骤S211中,生成所确定的高关联单位块的首页的缩略图像后, 在步骤S212中,将生成的缩略图像插入发送文件,用公知的方法转换成TOF后,在步骤S213 中发送到用户A。
这样,如图15所示,包含缩略图像IOla的文档数据100通过电子邮件等从图像处理装置I发送到用户A的终端装置2。
接收文档数据的用户A通过表示有印象的图像的缩略图像101a,可以容易地掌握、确认文档数据的内容。
[实施方式3]
在该实施方式中,如图16所示,表示的是用户B将存储于图像处理装置I的存储部15的箱151的文档数据100,以包含缩略图像的形态通过PDF文件等广播发送至多个用户A、B、C的终端装置21 23的情况。
对该情况的图像处理装置I的动作表示在图17的流程图上。
由于步骤S301 S306的处理与图11的步骤SlOl S106的处理相同,因此,省略说明。
该实施方式中,文档数据100的发送接收者即用户A、B、C为缩略图像被出示者, 在步骤S307中,从文档数据100中首先提取与用户A的注册信息一致的字符串后,在步骤 S308中,对每个单位块计数字符串的提取次数。
然后,在步骤S309中,判断对于全部文件(文档数据)是否完成字符串的提取处理, 如果未完成(在步骤S309为“否”),则返回到步骤S307。若完成(在步骤S309为“是”),则在步骤S310中,将计数值(提取次数)最大的单位块确定作为对用户A的高关联单位块。
接着,在步骤S311中,生成所确定的用户A的高关联单位块的首页的缩略图像后, 在步骤S312中,将生成的缩略图像插入发送文件,用公知的方法转换成PDF后,在步骤S313 中发送到用户A。
接着,在步骤S314,判断对于广播发送所有接收者是否完成发送,如果未完成(在步骤S314为“否”),则返回到步骤S307,按照下一个用户B、进而C的顺序进行同样的处理。 如果对于所有接收者完成发送(在步骤S314为“是”),则结束处理。
接收到文档数据100的各用户,通过分别对用户来说有印象的缩略图像,可以容易地掌握、确认文档数据100的内容。
[实施方式4]
该实施方式表示确定对于缩略图像被出示者的高关联单位块后所实施的缩略图像生成处理的变形例。该实施方式是,从高关联单位块提取图像,附加优先级来决定作为缩略图像使用的图像,生成缩略图像。
具体而言,如图18的(a)所示,从所确定的高关联单位块中通过公知的方法提取图像区域后,从图像的附近区域提取图像记号(例如图A — I)。另外,从高关联单位块内提取参照上述提取的图像号码的位置。图18的(a)的例子中,如箭头所示,在文章区域即小块2有上述图像记号的参照位置。
然后,判别参照源的小块2是“概要或主旨”的小块、还是“总结或结论”的小块,还是它们以外的小块。这些判定只要通过小块内是否包含“概要” “主旨” “总结” “结论”等字符来判定即可。
另一方面,按照“概要或主旨”的小块、“总结或结论”的小块、它们以外的小块的顺序预先设定优先级,将由优先级最高的小块所参照的图像如图18的(b)那样提取,使用该图像,如图18的(c)那样生成缩略图像。特别地,在高关联单位块中存在多个图像,它们分别由不同的小块被参照的情况下,显现上述优先级的效果。
另外,通过公知的方法将图像分类为图、表(包含图表)、照片,并且,在按照它们的顺序设定优先级,在同一小块参照多个图像的情况、及在“概要或主旨”及“总结或结论”以外的小块参照多个图像的情况等下,也可以根据上述图、表、照片的优先级,设为决定使用于缩略图像的图像。
图19是表示附加优先级决定作为缩略图像使用的图像,生成缩略图像的实施方式中的图像处理装置I的动作的流程图。
由于步骤S401 S406的处理与图11的步骤SlOl S106的处理相同,因此,省略说明。
在步骤S407中,从文档数据100中,提取与用户的注册信息一致的字符串后,在步骤S408中,对每个单位块计数字符串的提取次数。
然后,在步骤S409中,判断对于全部文件(文档数据)是否完成字符串的提取处理, 如果未完成(在步骤S409为“否”),则返回到步骤S407。若完成(在步骤S409为“是”),则在步骤S410,将计数值(提取次数)最大的单位块确定作为对用户的高关联单位块。
接着,在步骤S411中,从所确定的高关联单位块内提取图像区域后,在步骤S412 中,从图像区域的周边提取图像记号。
接着,在步骤S413中,从小块内提取图像的参照信息,在步骤S414,判断是否有 “概要/主旨”的小块所参照的图像。
如果有“概要/主旨”的小块所参照的图像(在步骤S414为“是”),则进至步骤 S417,将该图像决定作为缩略图使用图像。如果没有“概要/主旨”的小块所参照的图像(在步骤S414为“否”),则在步骤S415中,判断是否有“总结/结论”的小块所参照的图像。
如果有“总结/结论”的小块所参照的图像(在步骤S415为“是”),则进至步骤 S417,将上述图像决定为缩略图使用图像。如果没有“总结/结论”的小块所参照的图像(在步骤S415为“否”),则在步骤S416中,按照图、表、照片的优先顺序选择图像后,进至步骤 S417,将最优先顺序的图像决定作为缩略图使用图像。
而且,在步骤S418,使用所决定的图像生成缩略图像。
另外,使用哪个图像作为缩略图像不限定于上述,也可以优先使用色相分布最大的图像、或明度分布最大的图像、或尺寸最大的图像等。
[实施方式5]
该实施方式表示确定对于缩略图像被出示者的高关联单位块后所实施的缩略图像生成处理的另一变形例。
如图20的(a)所示,该实施方式中,通过在实施方式4说明的方法决定作为缩略图像使用的图像,并且,提取该高关联单位块的索引字符串。如图20的(b)所示,该例子中,提取“〇〇技术报告”。而且,将所提取的图像和索引字符串进行合成,生成如图20的(c)那样的缩略图像。
对该情况的图像处理装置I的动作用图21的流程图进行说明。
由于步骤S501 S506的处理与图11的步骤SlOl S106的处理相同,因此,省略说明。
在步骤S507中,从文档数据100中提取与用户的注册信息一致的字符串后,在步骤S508中,对每个单位块计数字符串的提取次数。
然后,在步骤S509中,判断对于全部文件(文档数据)是否完成字符串的提取处理, 如果未完成(在步骤S509为“否”),则返回到步骤S507。若完成(在步骤S509为“是”),则在步骤S510中,将计数值(提取次数)最大的单位块确定作为对于用户的高关联单位块。
接着,在步骤S511中,从所确定的高关联单位块内提取图像区域后,在步骤S512 中,从图像区域的周边提取图像记号。
接着,在步骤S513中,从小块内提取图像的参照信息,在步骤S514中,判断是否有 “概要/主旨”的小块所参照的图像。
如果有“概要/主旨”的小块所参照的图像(在步骤S514为“是”),则进至步骤 S517,将该图像决定作为缩略图使用图像。如果没有“概要/主旨”的小块所参照的图像(在步骤S514为“否”),则在步骤S515中,判断是否有“总结/结论”的小块所参照的图像。
如果有“总结/结论”的小块所参照的图像(在步骤S515为“是”),则进至步骤 S517,将上述图像决定作为缩略图使用图像。如果没有“总结/结论”的小块所参照的图像 (在步骤S515为“否”),则在步骤S516中,按照图、表、照片的优先顺序选择了图像后,进入步骤S517,将最优先顺序的图像决定作为缩略图使用图像。
另一方面,在步骤S518中,事先将在步骤S501 S506的成块处理中提取的各单位块的索引字符串保存于RAM13及存储部15等中,在步骤S519中,从保存的各单位块的索引字符串中,提取在步骤S510中所确定的闻关联单位块的索引字符串。
而且,在步骤S520中,将步骤S517中所决定的图像和在步骤S519中提取的高关联单位块的索引字符串进行合成,在步骤S521中生成缩略图像。
这样,将图像和索引字符串进行合成来生成缩略图像,因此,可以提供对缩略图像被出示者来说有用的缩略图像。
[实施方式6]
该实施方式中,对每个用户预先保存过去的文档数据(文件)检索时的关键词的历史,从生成缩略图像的全部文档数据100中,提取与上述关键词一致的字符串,根据提取的次数,确定高关联单位块。
例如,如图22所示,在用户A过去用“〇〇报告”的关键词检索图像处理装置I的箱内的文件,用户B过去用“ΛΛ图表” “ΛΛ结果”的关键词检索图像处理装置I的箱内的文件,用户C过去用“ X X表”的关键词检索图像处理装置I的箱内的文件的情况下,这些历史在该图中以表格表示的方式存储于存储部15等。
利用这样的关键词,确定对缩略图像被出示者即用户的高关联单位块。
具体而言,从全部文档数据100中提取与上述关键词一致的字符串,并且,计数字符串的提取次数。而且,将提取次数最多的单位块确定作为高关联单位块,生成缩小了所确定的高关联单位块的首页的图像等作为缩略图像。
对该情况的图像处理装置I的动作用图23的流程图进行说明。
由于步骤S601 S606的处理与图11的步骤SlOl S106的处理相同,所以省略说明。
在步骤S607中,从文档数据中提取与用户的文件检索历史的字符串(关键词)一致的字符串后,在步骤S608中,对每个单位块计数字符串的提取次数。
然后,在步骤S609中,判断对于全部文件(文档数据)是否完成字符串的提取处理, 如果未完成(在步骤S609为“否”),则返回到步骤S607。若完成(在步骤S609为“是”),则在步骤S610中,将计数值(提取次数)最大的单位块确定作为对用户的高关联单位块。
而且,在步骤S611中,生成所确定的高关联单位块的首页的缩略图像。
这样,根据缩略图像被出示者的过去的文件检索时的关键词的文档数据100中的提取次数,确定高关联单位块,因此,能够可靠地确定对缩略图像被出示者的高关联单位块。
[实施方式7]
该实施方式中,以页面为单位对每个用户保存过去预览显示文档数据100时的预览时间,对每个分割的单位块算出预览时间,根据该算出的预览时间,确定高关联单位块。
例如图24所示,在用户A过去预览显示文档数据100的第一页2秒、第二页10秒、 第三页8秒、第四页3秒…,用户B过去预览显示文档数据的第一页3秒、第二页3秒、第三页I秒、第四页9秒…的情况下,将这些历史存储于存储部15等中。
使用这样的预览时间,确定对缩略图像被出示者即用户的高关联单位块。
具体而言,从涉及预览时间的用户的历史,对每个单位块算出预览时间的相加时间。例如用户A的情况,每个单位块的预览时间的相加时间为18秒和5秒,其中最大为18 秒的“〇〇技术报告”的单位块被确定作为高关联单位块。另一方面,在用户B的情况,每个单位块的预览时间的相加时间为4秒和16秒,其中最大为16秒的“ΛΛ技术报告”的单位块被确定作为高关联单位块。
用图25的流程图说明该情况的图像处理装置I的动作。
由于步骤S701 S706的处理与图11的步骤SlOl S106的处理相同,因此,省略说明。
在步骤S707中,在从存储部15提取了文档数据100的用户的预览时间的历史后, 在步骤S708中,对每个单位块相加预览时间。
然后,在步骤S709,判断对于全部文件(文档数据)是否完成处理,如果未完成(在步骤S709为“否”),则返回到步骤S707。若完成(在步骤S709为“是”),则在步骤S710中, 将预览时间的相加值最大的单位块确定作为对用户的高关联单位块。
而且,在步骤S711中,生成所确定的高关联单位块的首页的缩略图像。
另外,也可以预先存储例如小块等每个规定区域的预览时间作为历史而不是每页的预览时间,根据上述历史确定高关联单位块。
这样,根据缩略图像被出示者的过去的预览时间,确定高关联单位块,因此,能够可靠地确定对缩略图像被出示者的高关联单位块。
[实施方式8]
该实施方式中,对每个用户预先保存过去打印文档数据100时的以页面为单位的打印次数,对分割的每个单位块算出打印次数的最大值,根据该算出的打印次数的最大值, 确定闻关联单位块。
例如,如图26所示,用户A对文档数据100的过去的印刷次数为,第一页为O次、 第二页为2次、第三页为I次、第四页为O次,第五页为O次…,用户B对文档数据100的过去的印刷次数为,第一页为O次、第二页为O次、第三页为O次、第四页为2次、第五页为3 次…。对于用户A,单位块内的最大的打印次数为2次和O次,因此,最大打印次数为2次的 “〇〇技术报告”的单位块被确定作为高关联单位块。另一方面,对于用户B,单位块内的最大的打印次数为O次和3次,因此,最大打印次数为3次的“ΛΛ技术报告”的单位块被确定作为高关联单位块。
用图27的流程图说明该情况的图像处理装置I的动作。
由于步骤S801 S806的处理与图11的步骤S 101 S106的处理相同,所以省略说明。
在步骤S807中,从存储部15提取了用户对文档数据100的每页的打印次数的历史后,在步骤S808中,对每个单位块算出打印次数的最大值。
然后,在步骤S809中,判断对于全部文件(文档数据)是否完成处理,如果未完成 (在步骤S809为“否”),则返回到步骤S807。若完成(在步骤S809为“是”),则在步骤S810 中,将打印次数为最大的单位块确定作为对用户的高关联单位块。
而且,在步骤S811中,生成所确定的高关联单位块的首页的缩略图像。
另外,该实施方式中,评价以页面为单位的打印次数的最大值而确定了高关联单位块,但也可以根据各单位块内的各页的打印次数的相加值的最大值,确定高关联单位块。
另外,也可以存储例如小块等的每个规定区域的打印次数作为历史而不是每页的打印次数,根据该历史确定高关联单位块。
这样,根据缩略图像被出示者的过去的打印次数,确定高关联单位块,因此,能够可靠地确定对缩略图像被出示者的高关联单位块。
[实施方式9]
该实施方式中,对每个用户预先保存重命名文档数据100的名称时的历史,从生成缩略图像的全部文档数据100中,提取与上述变更后的名称的字符串一致的字符串,根据提取的次数,确定闻关联单位块。
例如图28所示,在用户A过去重命名为“〇〇报告”的名称并将该文档数据100保存于图像处理装置I的存储部15的箱151等中,用户B过去重命名为“ΛΛ技术”“ΛΛ报告”的名称并保存于箱151等中,用户C过去重命名为“ X X技术报告”的名称并保存于箱 151等中的情况下,将这些历史在该图中以表格表示的方式存储于存储部15等中。
利用这种新输入的文档数据的名称的字符串,确定对缩略图像被出示者即用户的闻关联单位块。
具体而言,从全部文档数据100中提取与上述重命名的字符串一致的字符串,并且,对每个单位块计数字符串的提取次数。而且,将提取次数最大的单位块确定作为高关联单位块,生成将所确定的高关联单位块的首页缩小的图像等作为缩略图像。
用图29的流程图说明该情况的图像处理装置I的动作。
由于步骤S901 S906的处理与图11的步骤SlOl S106的处理相同,所以省略说明。
在步骤S907中,从文档数据100中提取了与用户对相应文件的重命名历史的字符串一致的字符串后,在步骤S908中,对每个单位块计数字符串的提取次数。
然后,在步骤S909中,判断对于全部文件(文档数据)是否完成字符串的提取处理, 如果未完成(在步骤S909为“否”),则返回到步骤S907。若完成(在步骤S909为是),则在步骤S910中,将计数值(提取次数)最大的单位块确定作为对用户的高关联单位块。
而且,在步骤S911中,生成所确定的高关联单位块的首页的缩略图像。
这样,根据与由缩略图像被出示者重命名时的文档数据的名称相同的字符串的文档数据100中的提取次数,确定高关联单位块,因此,能够可靠地确定对缩略图像被出示者的高关联单位块。
[实施方式10]
该实施方式中,对每个用户预先保存发送历史,该发送历史包含从图像处理装置I 将文档数据100添加于电子邮件中发送的情况的电子邮件标题(题目)的,并从生成缩略图像的全部文档数据100中,提取与上述电子邮件的标题的字符串一致的字符串,根据提取的次数,确定高关联单位块。
例如如图30所示,在用户A过去以“〇〇报告”的标题添加该文档数据100 (文件 A)并发送电子邮件,用户B过去以“ΛΛ报告” “ΛΛ报告添加”的标题添加该文档数据100 (文件A)并发送电子邮件,用户C过去以“ X X技术报告添加”的标题添加该文档数据100 (文件A)并发送电子邮件的情况下,将这些历史在该图中以表格表示的方式存储于存储部 15等中。
使用这种电子邮件的标题的字符串,确定对缩略图像被出示者即用户的高关联单位块。
具体而言,从全部文档数据100中提取与上述电子邮件的标题一致的字符串,并且,对每个单位块计数字符串的提取次数。而且,将提取次数最大的单位块确定作为高关联单位块,生成将所确定的高关联单位块的首页缩小的图像等作为缩略图像。
用图31的流程图说明该情况的图像处理装置I的动作。
由于步骤S1001 S1006的处理与图11的步骤SlOl S106的处理相同,所以省略说明。
在步骤S1007中,从文档数据100中提取与用户对该文件进行电子邮件添加时的标题一致的字符串后,在步骤S1008中,对每个单位块的计数字符串的提取次数。
然后,在步骤S1009中,判断对于全部文件(文档数据)是否完成字符串的提取处理,如果未完成(在步骤S1009为“否”),则返回到步骤S1007。若完成(在步骤S1009为 “是”),则在步骤S1010中,将计数值(提取次数)最大的单位块确定作为对用户的高关联单位块。
而且,在步骤SlOll中,生成所确定的高关联单位块的首页的缩略图像。
通过该实施方式,也能可靠地确定对缩略图像被出示者的高关联单位块。
[实施方式11]
该实施方式中,对每个用户保存过去将文档数据从图像处理装置I以页面为单位发送时的发送次数,对分割的每个单位块计算发送次数的最大值,根据该算出的发送次数的最大值,确定高关联单位块。
例如图26所示,用户A的文档数据100的过去的发送次数为,第一页为O次、第二页2为次、第三页为I次、第四页为O次、第五页为O次…,用户B的文档数据100的过去的发送次数为,第一页为O次、第二页为O次、第三页为O次、第四页为2次、第五页为3次…。 对于用户A,单位块内的最大的发送次数为2次和O次,因此,最大发送次数为2次的“〇〇 技术报告”的单位块被确定作为高关联单位块。另一方面,对于用户B,单位块内的最大的发送次数为O次和3次,因此,最大发送次数为3次的“ΛΛ技术报告”的单位块被确定作为闻关联单位块。
用图32的流程图说明该情况的图像处理装置I的动作。
由于步骤SllOl S1106的处理与图11的步骤SlOl S106的处理相同,所以省略说明。
在步骤S1107中,在从存储部15提取了对文档数据100的用户对每页的发送次数的历史后,在步骤S1108中,对每个单位块算出发送次数的最大值。
然后,在步骤SI 109中,判断对于全部文件(文档数据)是否完成处理,如果未完成 (在步骤S1109为“否”),则返回到步骤S1107。若完成(在步骤S1109为“是”),则在步骤 SlllO中,将发送次数为最大的单位块确定作为对用户的高关联单位块。
而且,在步骤Sllll中,生成所确定的高关联单位块的首页的缩略图像。
另外,该实施方式中,评价以页面为单位的发送次数的最大值而确定了高关联单位块,但也可以根据各单位块内的各页的发送次数的相加值的最大值,确定高关联单位块。
另外,也可以存储例如小块等每个规定区域的发送次数作为历史而不是每页的发送次数,根据上述历史确定高关联单位块。
通过该实施方式,也能够可靠地确定对于缩略图像被出示者的高关联单位块。
以上说明了本发明的实施方式,但本发明并未限定于上述实施方式。
例如,根据缩略图像被出示者的预览时间、印刷次数、发送次数等,从文档数据中确定关联性最高的高关联单位块,但也可以确定缩略图像被出示者以页面为单位或以区域为单位移动文件的次数最多的单位块作为高关联单位块。
图33表示将缩略图像被出示者以页面为单位移动文件移动的次数最多的单位块确定作为高关联单位块的情况的图像处理装置I的动作。
由于步骤S1201 S1206的处理与图11的步骤SlOl S106的处理相同,所以省略说明。
将用户对文档数据100的每页的移动次数的历史存储于存储部15中。在步骤 S1207中,在从存储部15提取了用户对文档数据100的每页的移动次数的历史后,在步骤 S1208中,对每个单位块算出移动次数的最大值。
然后,在步骤S1209中,判断对于全部文件(文档数据)是否完成处理,如果未完成 (在步骤S1209为“否”),则返回到步骤S1207。若完成(在步骤S1209为“是”),则在步骤S1210中,将移动次数为最大的单位块确定作为对于用户的高关联单位块。
而且,在步骤S1211中,生成所确定的高关联单位块的首页的缩略图像。
另外,在以上的实施方式中,评价以页面为单位的发送次数的最大值而确定了高关联单位块,但也可以根据各单位块内的各页的发送次数的相加值的最大值,确定高关联单位块。
另外,也可以使用高关联单位块中的预览时间、印刷次数、发送次数、移动次数最多的页面或区域的图像等生成缩略图像。
权利要求
1.一种图像处理装置,其特征在于,具备 分割部件,该分割部件将多个页面的文档数据分割为每个独立的文档单位的单位块; 单位块确定部件,该单位块确定部件从由所述分割部件分割所得的单位块中确定与被出示缩略图像的缩略图像被出示者关联性较高的单位块;以及 缩略图像生成部件,该缩略图像生成部件使用由所述单位块确定部件确定的单位块内的图像和/或文本数据生成缩略图像。
2.如权利要求I所述的图像处理装置, 所述分割部件将所述文档数据通过行距检测分割成小块,并且将分割所得的小块进行分层,将最低层级的块分割为单位块。
3.如权利要求I或2所述的图像处理装置, 所述缩略图像生成部件生成缩略图像,该缩略图像包含由所述单位块确定部件确定的与缩略图像被出示者关联性较高的单位块的首页的图像和/或单位块内的索引字符串。
4.如权利要求I或2所述的图像处理装置, 还具备存储部件,该存储部件存储缩略图像被出示者对于所述文档数据的任意页面或区域进行的操作历史, 所述单位块确定部件根据存储于所述存储部件的操作历史,将包含缩略图像被出示者进行操作的页面或区域的单位块确定为与缩略图像被出示者关联性较高的单位块。
5.如权利要求I或2所述的图像处理装置, 所述文档数据为发送对象数据,所述缩略图像被出示者为所述发送对象数据的发送接收者。
6.如权利要求I或2所述的图像处理装置, 所述文档数据为被广播通信的发送对象数据,所述缩略图像被出示者为所述发送对象数据的多个发送接收者, 所述单位块确定部件从所述单位块中对每个发送接收者确定关联性较高的单位块, 所述缩略图像生成部件使用由所述单位块确定部件对每个发送接收者确定的单位块内的图像和/或文本数据,对每个发送接收者分别生成缩略图像。
7.如权利要求I或2所述的图像处理装置,还具备 图像区域提取部件,该图像区域提取部件从由所述单位块确定部件确定的单位块中提取图像区域;以及 文章区域检测部件,该文章区域检测部件检测文章区域,该文章区域参照由所述图像区域提取部件提取的图像区域的图像, 所述缩略图像生成部件将在由所述文章区域检测部件检测的文章区域中记载有概要或主旨的情况设为第一优先顺序,将在由所述文章区域检测部件检测的文章区域中记载有总结或结论的情况设为第二优先顺序,使用由该文章区域所参照的图像作为缩略图像。
8.如权利要求I或2所述的图像处理装置,还具备 图像区域提取部件,该图像区域提取部件从由所述单位块确定部件确定的单位块中提取图像区域;以及 图像分类部件,该图像分类部件将由所述图像区域提取部件提取的图像区域的图像分类为图、表或照片,所述缩略图像生成部件在由所述图像分类部件分类的图像中,将按照图、表或照片的优先顺序选择的一个或多个图像作为缩略图像使用。
9.如权利要求7所述的图像处理装置, 所述缩略图像生成部件将所述优先顺序为最高位的图像和由所述单位块确定部件确定的单位块的索引字符串合成而生成缩略图像。
10.如权利要求I或2所述的图像处理装置,还具备 字符串提取部件,该字符串提取部件从文档数据中提取与缩略图像被出示者的姓名、所属名及个人识别信息的至少任一个一致的字符串;以及 计数部件,该计数部件对每个单位块计数由字符串提取部件对字符串的提取次数, 所述单位块确定部件根据由所述计数部件计数的字符串的提取次数,确定与缩略图像被出示者关联性较高的单位块。
11.如权利要求I或2所述的图像处理装置,还具备 历史保存部件,该历史保存部件对每个缩略图像被出示者保存文档数据检索时的关键词的历史; 字符串提取部件,该字符串提取部件从文档数据中提取与所述历史保存部件保存的关键词一致的字符串;以及 计数部件,该计数部件对每个单位块计数字符串提取部件对字符串的提取次数, 所述单位块确定部件根据由所述计数部件计数的字符串的提取次数,确定与缩略图像被出示者关联性较高的单位块。
12.如权利要求I或2所述的图像处理装置,还具备 预览时间保存部件,该预览时间保存部件保存缩略图像被出示者对文档数据的页面单位或区域单位的预览时间;以及 运算部件,该运算部件从所述预览时间保存部件保存的页面单位或区域单位的预览时间,运算每个所述单位块的预览时间, 所述单位块确定部件根据所述运算部件运算的预览时间,确定与缩略图像被出示者关联性较高的单位块。
13.如权利要求I或2所述的图像处理装置,还具备 印刷次数保存部件,该印刷次数保存部件保存缩略图像被出示者对文档数据的页面单位或区域单位的印刷次数;以及 运算部件,该运算部件从所述印刷次数保存部件保存的页面单位或区域单位的印刷次数,运算每个所述单位块的印刷次数, 所述单位块确定部件根据所述运算部件运算的印刷次数,确定与缩略图像被出示者关联性较高的单位块。
14.如权利要求I或2所述的图像处理装置,还具备 历史保存部件,该历史保存部件保存由缩略图像被出示者变更文档数据名称时的历史; 字符串提取部件,该字符串提取部件从文档数据中提取与所述历史保存部件保存的文档数据的变更后的名称一致的字符串;以及 计数部件,该计数部件对每个单位块计数由字符串提取部件对字符串的提取次数,所述单位块确定部件根据由所述计数部件计数的字符串的提取次数,确定与缩略图像被出示者关联性较高的单位块。
15.如权利要求I或2所述的图像处理装置,还具备 标题保存部件,该标题保存部件保存由缩略图像被出示者发送的、添加有文档数据的电子邮件的标题; 字符串提取部件,该字符串提取部件从文档数据中提取与所述标题保存部件保存的电子邮件的标题一致的字符串;以及 计数部件,该计数部件对每个单位块计数字由符串提取部件对字符串的提取次数,所述单位块确定部件根据由所述计数部件计数的字符串的提取次数,确定与缩略图像被出示者关联性较高的单位块。
16.如权利要求I或2所述的图像处理装置,还具备 发送次数保存部件,该发送次数保存部件保存在缩略图像被出示者以页面为单位或以区域为单位发送出示文档数据时的发送次数;以及 运算部件,该运算部件从所述发送次数保存部件保存的以页面为单位或以区域为单位的发送次数,运算每个所述单位块的发送次数, 所述单位块确定部件根据所述运算部件运算的发送次数,确定与缩略图像被出示者关联性较高的单位块。
17.如权利要求I或2所述的图像处理装置,还具备 移动次数保存部件,该移动次数保存部件保存在缩略图像被出示者以页面为单位或以区域为单位移动出示文档数据时的移动次数;以及 运算部件,该运算部件从所述移动次数保存部件保存的以页面为单位或以区域为单位的移动次数,运算每个所述单位块的移动次数, 所述单位块确定部件根据由所述运算部件运算的移动次数,确定与缩略图像被出示者关联性较高的单位块。
18.如权利要求I或2所述的图像处理装置, 还具备目录页面检测部件,该目录页面检测部件检测所述文档数据的目录页面, 所述分割部件将所述目录页面检测部件检测出的目录页面除外,将文档数据分割成每个独立的文档单位的单位块。
19.一种根据图像处理装置的缩略图像生成方法,其特征在于,具备 分割步骤,将多个页面的文档数据分割成每个独立的文档单位的单位块; 单位块确定步骤,从在所述分割步骤中分割的单位块中,确定与缩略图像被出示者关联性较高的单位块;以及 缩略图像生成步骤,使用在所述单位块确定步骤中确定的单位块内的图像和/或文本数据生成缩略图像。
全文摘要
公开了图像处理装置及基于该装置的缩略图像生成方法。图像处理装置生成对被出示缩略图像的缩略图像被出示者来说有用的缩略图像,能够容易地判断是否为目标文件或掌握文件的内容。将多个页面的文档数据(100)分割成每个独立的文档单位的单位块,从分割所得的单位块中确定与被出示缩略图像的缩略图像被出示者关联性较高的单位块。使用所述确定的单位块内的图像和/或文本数据生成缩略图像。
文档编号G06F3/12GK102984417SQ201210237748
公开日2013年3月20日 申请日期2012年7月10日 优先权日2011年7月14日
发明者堤隆弘, 松井健儿 申请人:柯尼卡美能达商用科技株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1