相关文档检索装置、方法及程序的制作方法

文档序号:6626837阅读:138来源:国知局
相关文档检索装置、方法及程序的制作方法
【专利摘要】本发明的实施形态涉及相关文档检索装置、方法及程序。其目的在于,提供能够高效率检索显示相关文档的相关文档检索装置、方法及程序。本实施形态的相关文档检索装置包含输入部、存储部、检索部、获取部、判定部以及显示部。输入部获取文档和与该文档重叠的第1笔迹信息。存储部存储文档、第1笔迹信息、以及文档与第1笔迹信息的对应关系。检索部从存储部检索与作为检索的检索式的文档即检索文档的内容相关的1个以上的文档,作为1个以上的相关文档获取。获取部根据对应关系获取重叠于相关文档的第2笔迹信息。判定部判断第2笔迹信息中是否包含文字。在第2笔迹信息中包含文字的情况下,显示部显示检索文档及第2笔迹信息,第2笔迹信息中不包含文字的情况下,显示部显示检索文档及第2笔迹信息和重叠有第2笔迹信息的相关文档的区域。
【专利说明】相关文档检索装置、方法及程序

【技术领域】
[0001]本发明的实施形态涉及相关文档检索装置、方法及程序。

【背景技术】
[0002]对电子设备用笔输入等的手写文字输入方式向来广泛使用着。不仅PDA (PersonalDigital Assistant:便携式信息终端),伴随智能手机和平板型终端、游戏机的功能扩展,具备笔输入功能的设备也在增加。
[0003]在这样的环境中,存在笔输入等手写产生的摘录(片断、边框)、下划线、标记(记入〇、☆等)、或网页和电子书籍的书签(Bookmark)记录这样的用户进行注释(Annotat1n)的功能。通过使用这样的附加功能,用户能够通过用电子学方式模仿熟悉的纸笔的直觉的阅览手段和输入手段,在任何时候都能够容易地进行注释。
[0004]具有这样的注释功能的电子设备,存在检索有注释的文档,以后加以利用的方法。


【发明内容】

[0005]但是,像智能手机和平板电脑终端那样,与电视和台式电脑等相比画面较小的终端、一次只显示一个应用程序的画面的单一窗口终端的情况下,即使是检索与阅览中的文档类似或相关的文档,将检索结果得到的文档重叠显示时,能够显示的检索结果的个数也非常少。
[0006]本发明是为解决上述存在问题而作出的,其目的在于,提供能够高效率检索显示相关文档的相关文档检索装置、方法及程序。
[0007]本实施形态的相关文档检索装置包含输入部、存储部、检索部、获取部、判定部以及显示部。输入部获取文档和与该文档重叠的第I笔迹信息。存储部存储上述文档、上述第I笔迹信息、以及上述文档与上述第I笔迹信息的对应关系。检索部从所述存储部检索与作为检索的检索式(Query)的文档即检索文档的内容相关的I个以上的文档,并作为I个以上的相关文档获取。获取部根据上述对应关系,获取与上述相关文档重叠的第2笔迹信息。判定部判断上述第2笔迹信息中是否含有文字。在上述第2笔迹信息中含有文字的情况下,显示部显示上述检索文档及该第2笔迹信息,该第2笔迹信息中不包含文字的情况下,显示该检索文档以及该第2笔迹信息和重叠有该第2笔迹信息的上述相关文档的区域。
[0008]如果采用上述构成的相关文档检索装置,则能够提供能高效率检索显示相关文档的相关文档检索装置、方法及程序。

【专利附图】

【附图说明】
[0009]图1是表示本实施形态的相关文档检索装置的方框图。
[0010]图2表示存储于文档存储部的信息之一例。
[0011]图3表示笔迹信息存储部存储的笔迹信息之一例。
[0012]图4表示对应信息存储部存储的对应信息之一例。
[0013]图5是表示本实施形态的相关文档检索装置的动作的流程图。
[0014]图6表示相关文档检索装置的第I使用例。
[0015]图7表示相关文档检索装置的第2使用例。

【具体实施方式】
[0016]以下参照附图对本实施形态的相关文档检索装置、方法及程序进行详细说明。还有,在下述实施形态中,标以相同符号的部分表示进行相同的动作的零部件,适当省略重复说明。
[0017]下面参照图1的方框图对本实施形态的相关文档检索装置进行说明。
[0018]本实施形态的相关文档检索装置100包含输入部101、文档存储部102、笔迹信息存储部103、对应信息存储部104、检索部105、笔迹信息获取部106、判定部107以及显示部108。还有,虽然设想本实施形态的相关文档检索装置100使用于能够输入注释的终端(例如PC、智能手机、平板电脑终端、电子书籍终端、游戏机终端),但是并不限于此。而且为了说明方便,分为文档存储部102、笔迹信息存储部103以及对应信息存储部104这3个存储部,但是也可以是I个存储部。
[0019]输入部101在制作文档时获取文档及笔迹信息。文档假设是用户制作的文档和用户阅览的文档。笔迹信息是评论、注释等与文档重叠的用户写入的信息。注释是表达用户的意图的操作,例如对网页、电子书籍/杂志等文档或画像的书签操作、或用户手写划出的圈圈、圈圈、笔记等。又,输入部101在检索时获取作为检索的检索式(々二 U )的,用户正在制作的文档以及用户正在阅览的文档作为检索文档。
[0020]还有,笔迹信息被赋予文档的哪一个区域,在文档有多页的情况下将笔迹信息被赋予哪一页的哪一个区域这样的对应关系只要在输入部101在赋予笔迹信息的阶段进行判定即可。
[0021]又,输入部101也可以收集预先被赋予注释的文档。在这种情况下,由分离部(未图示)从文档中提取出注释部分,将文档与注释分离即可。
[0022]文档存储部102从输入部101接收文档,将文档加以存储。
[0023]笔迹信息存储部103从输入部101接收笔迹信息加以存储。
[0024]对应信息存储部104从输入部101接收文档与笔迹信息的对应关系加以存储。还有,文档以页为单位的情况下,对每一页,存储页与赋予页的笔迹信息的对应关系。
[0025]检索部105从输入部101接收检索文档,参照文档存储部102存储的文档及对应信息存储部104存储的对应关系,从与检索文档的内容相关的文档检索,获取作为与检索文档相关的文档的相关文档。
[0026]笔迹信息获取部106从检索部105接收相关文档,参照对应信息存储部103的对应关系,获取重叠于相关文档的笔迹信息。
[0027]判定部107从笔迹信息获取部106接收相关文档和与相关文档对应的笔迹信息,判断笔迹信息中包含文字串与否。
[0028]显示部108在判定部107接收相关文档和与相关文档对应的笔迹信息后,根据笔迹信息的种类切换显示方法进行显示。所谓笔迹信息的种类,是指例如表示用户的笔迹是评论,还是下划线、圈圈、记号这样的注释的种类。在这里,笔迹信息中包含文字的情况下,显示检索文档与笔迹信息,笔迹信息中不包含文字的情况下,显示检索文档与笔迹信息和笔迹信息重叠的文档的区域。如果是例如下划线,只要显示带下划线的文字串即可,如果是圈圈,只要显示圈圈内包含的文字区域即可。还设想对区域加以严密规定时,根据笔迹,不包含必要的文字串,因此也可以显示比下划线或圈圈指定的区域大的区域。
[0029]下面参照图2对有关文档存储部102存储的文档的信息之一例进行说明。
[0030]图示的表200将文档ID201、文档标题202、作成日期和时间203、阅览日期和时间204以及文档内容文件205分别相关联地加以存储。
[0031]文档ID201是文档固有的标识符(ID)。文档标题202表示文档的标题。作成日期和时间203表示作成文档的日期和时间。阅览日期和时间204表示用户阅览文档的日期和时间。文档内容文件205表示文档的数据文件的名称。
[0032]具体地说,例如、文档ID201 “D1”、文档标题202 “宅建问题A”、作成日期和时间203 “2013/09/1010:00:00”、阅览日期和时间 204 “2013/09/1212:50:30”以及文档内容文件205 “问题A.XXX”分别相关联。还有,“.XXX”表示文档的扩展名。
[0033]下面参照图3对笔迹信息存储部103存储的笔迹信息进行说明。
[0034]图3所示的表300相关联地存储笔迹ID301、输入日期和时间302以及笔划串303。
[0035]笔迹ID301是笔划串固有的识别符。输入日期和时间302表示输入笔划串的日期和时间。笔划串303表示I个笔划的每一取样的总坐标值。只要是文档的区域与笔划的对应清楚的坐标值,坐标信息可以是显示画面的坐标值,也可以是一页文档的坐标值。
[0036]具体地说,例如笔迹ID301 “SI”、输入日期和时间302 “2013/09/1212:51:40”以及笔划串 303 “((30、820)、(31、818)、...)、((50、800)、…)、…”相关联。
[0037]下面参照图4对对应信息存储部104存储的对应信息之一例进行说明。
[0038]图4所示的表400将笔迹ID301、文档ID201以及页401分别相关存储。
[0039]页401表示记入笔迹信息的文档中的页码。具体地说,例如笔迹ID301“S1”、文档ID201 “D1”以及页401 “I”相关联。
[0040]还有,在本实施形态中,记载着表示文档与笔迹的对应的最低限度信息,但是也可以存储其他布局信息和色信息、输入文档和笔迹的用户ID、文档和笔迹的删除信息等其他附带信息。又,作成日期和时间、阅览日期和时间、输入日期和时间对于每一文档和笔迹记载一个,但是与编辑.保存时刻等一起,也可以存储多个日期和时间。
[0041]下面参照图5的流程图对相关文档检索装置100的动作进行说明。
[0042]在步骤S501,输入部101获取用户正在阅览或正在编辑等的使用中的文档作为检索文档。还有,输入部101也可以不是获取整个文档,而是获取文档中的预先选择的范围作为检索文档。
[0043]在步骤S502,检索部105检索与检索文档相关的相关文档。在这里,所谓「内容与检索文档相关」,是指根据文档内容(单词和文句)的共通性,判定同一单词出现的概率在阈值以上。在这里,关于作为判断共通性的最小单位的单词和文句的分割,可以使用词素解析和字符类型(数字、字母、空白、记号、汉字、平假名、片假名等)的变化等已有技术。
[0044]还有,不限于文档内容的共通性,也可以用单词的概念层次的上下关系、是否是同一层次、文档的阅览日期和时间、作成日期和时间以及编辑时刻的类似性等。用时刻信息的情况下,用例如图2所示的文档的阅览日期和时间204和笔迹信息的输入日期和时间302即可。例如业务上的日报和业绩的年度报告等一定的日期和时间制作的文档,被认为是共通文档,因此也可以基于这样的日期和时间的类似性检索相关文档。
[0045]在步骤S503中,检索部105判断未处理的相关文档是否存在。未处理的相关文档存在的情况下,进入步骤S504,如果未处理的相关文档不存在,则终止相关文档检索装置的动作。
[0046]在步骤S504中,笔迹信息获取部106获取赋予相关文档的笔迹信息。还有,笔迹信息获取部106也可以对笔迹信息进行文字识别处理,将关于作为文字识别处理的结果的文字串的信息反馈到存储于对应信息存储部104的对应关系。借助于此,可以扩展与检索文档形成对应关系的文档的广度。
[0047]在步骤S505,判定部107对笔迹信息是哪一种类的进行判断,判断其是否包含文字。在包含文字的情况下,进入步骤S506,不包含文字的情况下,进入步骤S507。作为是否包含文字的判定方法的一个例子,考虑对全部笔迹信息进行一般使用的手写文字识别处理,计算是否包含阈值以上的文字数,以判断笔迹信息中包含文字与否。还有,只要是能够判断是否包含文字的方法,使用哪一种方法都可以。
[0048]又,包含文字与否的判定,也可以不在整个笔迹输入区域进行,而进行部分判定处理,分为包含文字的区域和不包含文字的区域。作为进行部分判定的方法,可以采用将区域单纯分割为矩形的方法、或在对最近的数个笔划进行文字识别的情况下,计算外接各笔划的矩形的面积或外接的椭圆的长径的分布,对分布的每一块进行计算的方法。关于分布的利用,在例如书写文字的情况下和加圈圈或画下划线的情况下,与笔划外接的矩形的面积和外接的椭圆的长径不同,因此可分别将其分离开来进行判定。
[0049]在步骤S506中,笔迹信息中包含文字的情况下,可以设想笔迹信息自身具有可读性,因此显示部108可以将笔迹信息表达的笔迹原封不动地加以显示。其后返回步骤S503,反复进行同样的处理。
[0050]在步骤S507中,笔迹信息中不包含文字的情况下,仅笔迹信息不具备可读性,像标以下划线的文档、线条包围的区域内的文字串那样,也必须获取相关文档自身记述的内容,因此将笔迹重叠的相关文档的区域与笔迹一起显示。其后返回步骤S503,反复进行同样的处理。然后,使相关文档检索装置100的动作结束。
[0051]下面参照图6对本实施形态的相关文档检索装置100的第I使用例进行说明。
[0052]图6是用户解类似的问题时参考用户对问题集写入的内容的例子。作为前提,是对过去的解答的写入。关于“问题A”,对解答赋予文字写入601。关于“问题B”,框出解答本身赋予注释602。
[0053]例如,要考虑看到与问题A和问题B相关的问题“类似问题C”的学习者,在不了解解法,查找对类似问题的解法的情况下,将问题A和问题B原封不动显示,则画面尺寸不足。因此,通过使用本实施形态的相关文档检索装置100的检索处理,问题A由于笔迹信息中包含文字串,由问题A显示写入601。另一方面,问题B由于笔迹信息中不包含文字串,由问题B显示笔迹与重叠笔迹的区域、即圈圈内的文字区域作为注释602。关于问题A,只将笔迹信息加以显示,这样能够避免背景的文字重叠造成不容易看清楚的情况。又,关于问题B,由于圈圈本身不包含文字串,通过将笔迹与存在于相同区域的文档中的区域重叠显示,以用户能够理解的形式显示注释内容。这样,只显示记载笔迹的区域即可,因此笔迹信息在画面上所占的面积小。又,由于文档的区域狭小,从上面重叠书写文字的情况下,只有重叠书写的文字能够读出,因此也有提高可读性的效果。
[0054]下面参照图7对本实施形态的相关文档检索装置100的第2使用例进行说明。
[0055]图7是利用具有某种程度的共通性的演示幻灯片文件(Presentat1n Slidefile),作成多个面向不同的公司的营业资料的情况。作为前提,假定为作成面向A公司的幻灯片文件(面向A公司.yyy)与面向B公司的幻灯片文件(面向B公司.yyy),在各文件的一部分页面上手写评论的情况。还有,“.yyy”表示文件的扩展名。在图7的例子中,面向A公司的幻灯片上记载评论701和评论702,面向B公司的幻灯片上记载评论703和评论704。又,假定各文件内的A、B、C、…等分别表示I页,标以A与A’、A”那样的记号的页,是内容类似但有部分不同的页(例如只是将单词“A公司”置换为单词“B公司”等情况)。
[0056]在这样的状況下新制作面向C公司的幻灯片文件(面向C公司.yyy)时,对作为素材的幻灯片在排列阶段进行检索处理时,检索类似的幻灯片,将过去的赋予面向A公司的幻灯片的评论701及评论702、赋予面向B公司的幻灯片的评论703分别重叠显示。
[0057]例如,关于C页,由于分别在面向A公司的资料、面向B公司的资料上记载别的手写笔记,可以将两者分别显示。这时,手写笔记的内容相同的情况下,分别显示则太长,因此也可以只在有差别的情况下进行显示。又,对含类似页面的幻灯片文件“面向B公司的幻灯片”,虽然对D’页也赋予评论704,但是该页或类似页不存在于文件“面向C公司.yyy”。在这种情况下,为了提醒评论,也可以增加追加页,将评论704重叠,使人想起用户过去的评论。
[0058]根据以上所示的本实施形态,存储包含输入的注释的笔迹信息,在进行文档检索时,根据笔迹信息的种类显示相关文档,这样即使是平板电脑终端等单一窗口,显示面积有限的终端,也容易将相关文档加以比较,同时容易找到赋予相关文档的手写评论。而且,在存储后隐藏起来的注释后来要利用时,容易加以利用。又,资料作成时,利用相关文档检索装置的检索处理,不必每次打开过去的类似资料进行确认,而且能够减少看漏过去赋予的评论的情况。
[0059]还有,本实施形态的相关文档检索装置虽然设想为安装在能够搬运的硬件装置上,但是也可以在连接于互联网的外部服务器上实施信息处理装置的功能的一部分。又可以将信息处理装置安装在具备CPU等控制装置、ROM和RAM等存储装置、HDD等外部存储装置、显示器等显示装置、键盘、以及鼠标器等输入装置的一般的电脑上。
[0060]上述实施形态中所示的处理步骤上的指示可基于作为软件的程序执行。通用的计算机系统预先存储这种程序,通过读入该程序,也能够得到与上述相关文档检索装置产生的效果相同的效果。上述实施形态记述的指示,作为能够使电脑执行的程序,记录于磁盘(软盘、硬盘等)、光盘(CD - ROM、CD — R、CD — RW、DVD — ROM、DVD±R、DVD土RW、Blu —ray (注册商标)Disc等)、半导体存储器、或与此类似的记录媒体。只要是电脑或嵌入式系统能够读取的记录媒体,其存储形式可以是任何形态。电脑只要从该记录媒体读入程序,基于该程序利用CPU执行程序上记述的指示,就能够实现与上述实施形态的相关文档检索装置相同的动作。当然,电脑获取程序的情况下或读入程序的情况下也可以通过互联网获取或读入。
[0061]又可以基于从记录媒体安装到电脑或嵌入式系统的程序的指示,电脑上运行着的OS(操作系统)、数据库管理软件、网络等MW(中间件)等执行实现本实施形态用的各处理的一部分。
[0062]而且,本实施形态的记录媒体不限于独立于电脑或嵌入式系统的媒体,也包含将利用LAN、互联网等传递的程序下载并加以存储或暂时存储的记录媒体。
[0063]又,记录媒体不限于I个,由多个媒体执行本实施形态的处理的情况也包含于本实施形态的记录媒体,媒体的构成可以是任何构成。
[0064]还有,本实施形态的电脑或嵌入式系统,是基于记录媒体中存储的程序,执行本实施形态的各处理用的系统,可以是一个个人电脑、微电脑等构成的装置、多个装置通过互联网连接的系统等任何构成。
[0065]又,本实施形态的电脑不限于个人电脑,也包含信息处理设备中包含的运送处理装置、微电脑等,是能够利用程序实现本实施形态的功能的设备、装置的总称。
[0066]以上对本发明的几个实施形态进行了说明,但是这些实施形态是作为例子提示的实施形态,无意限定发明范围。这些新的实施形态可以利用其他各种各样的形态实施,在不超出发明的要旨的范围内,可以有各种省略、置换、变更。这些实施形态及其变形包含于发明的范围和要旨,同时包含于与专利申请的权利要求书中记载的发明同等的范围。
【权利要求】
1.一种相关文档检索装置,其特征在于,具备 输入部,其获取文档和与该文档重叠的第I笔迹信息; 存储部,其存储所述文档、所述第I笔迹信息、以及所述文档与所述第I笔迹信息的对应关系; 检索部,其从所述存储部检索与作为检索的检索式的文档即检索文档的内容相关的I个以上的文档,并作为I个以上的相关文档获取; 获取部,其基于所述对应关系,获取与所述相关文档重叠的第2笔迹信息; 判定部,其判断所述第2笔迹信息中是否包含文字,以及 显示部,其在所述第2笔迹信息中包含文字的情况下,显示所述检索文档以及该第2笔迹信息,在该第2笔迹信息中不包含文字的情况下,显示该检索文档及该第2笔迹信息和重叠有该第2笔迹信息的所述相关文档的区域。
2.根据权利要求1所述的相关文档检索装置,其特征在于, 所述存储部在所述检索文档能以页为单位进行分割的情况下,存储该每一页的所述对应关系, 所述显示部以所述检索文档的页为单位将所述相关文档的相关的页与所述第2笔迹信息重叠显示。
3.根据权利要求2所述的相关文档检索装置,其特征在于, 所述显示部在与所述相关文档的页相关的所述检索文档的页不存在的情况下,将所述第2笔迹信息显示于别的页。
4.根据权利要求1?3中的任一项所述的相关文档检索装置,其特征在于, 所述输入部获取全部所述检索文档及该检索文档中的被预先选择的范围中的至少一方。
5.根据权利要求1?4中的任一项所述的相关文档检索装置,其特征在于, 所述显示部在多个相关文档的所述第2笔迹信息相互类似的情况下,将其中一方的笔迹信息全部显示,至于另一方的笔迹信息则显示其与该一笔迹信息的差分。
6.根据权利要求1?5中的任一项所述的相关文档检索装置,其特征在于, 所述检索部进一步参照所述检索文档的日期时间信息,检索作为所述相关文档的文档。
7.根据权利要求1?6中的任一项所述的相关文档检索装置,其特征在于, 所述获取部将对所述第2笔迹信息进行文字识别处理后的结果反馈到所述对应关系。
8.根据权利要求1?7中的任一项所述的相关文档检索装置,其特征在于, 所述第I笔迹信息是用户的写入。
9.根据权利要求1?8中的任一项所述的相关文档检索装置,其特征在于, 所述检索文档是用户正在制作的文档和用户正在阅览的文档。
10.根据权利要求1?9中的任一项所述的相关文档检索装置,其特征在于, 所述判定部将所述第2笔迹信息的整个输入区域分割为部分区域,对该部分区域进行判定。
11.一种相关文档检索方法,其特征在于, 获取文档和重叠于该文档的第I笔迹信息, 将所述文档、所述第I笔迹信息、以及所述文档与所述第I笔迹信息的对应关系存储于存储装置, 从所述存储装置检索与作为检索的检索式的文档即检索文档的内容相关的I个以上的文档,并作为I个以上的相关文档获取, 基于所述对应关系,获取与所述相关文档重叠的第2笔迹信息, 判断所述第2笔迹信息中是否包含文字, 在所述第2笔迹信息中包含文字的情况下,显示所述检索文档及该第2笔迹信息,在该第2笔迹信息中不包含文字的情况下,显示该检索文档及该第2笔迹信息和重叠有该第2笔迹信息的所述相关文档的区域。
12.一种相关文档检索程序,其特征在于, 是使电脑作为以下装置作用: 输入装置,其获取文档和与该文档重叠的第I笔迹信息; 存储装置,其存储所述文档、所述第I笔迹信息、以及所述文档与所述第I笔迹信息的对应关系; 检索装置,其从所述存储部检索与作为检索的检索式的文档即检索文档的内容相关的I个以上的文档,并作为I个以上的相关文档获取; 获取装置,其基于所述对应关系,获取重叠于所述相关文档的第2笔迹信息; 判定装置,其判断所述第2笔迹信息中是否包含文字;以及 显示装置,其在所述第2笔迹信息中包含文字的情况下,显示所述检索文档及该第2笔迹信息,该第2笔迹信息中不包含文字的情况下,显示该检索文档及该第2笔迹信息和重叠有该第2笔迹信息的所述相关文档的区域。
【文档编号】G06F17/30GK104516941SQ201410466530
【公开日】2015年4月15日 申请日期:2014年9月12日 优先权日:2013年9月30日
【发明者】冈本昌之, 布目光生 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1