文件管理系统的制作方法

文档序号:6594148阅读:359来源:国知局
专利名称:文件管理系统的制作方法
技术领域
本发明涉及文件管理系统,例如,涉及利用商务文件(文档)的文档结构,显示该 商务文件(文档)的概览。
背景技术
最近几年,在各种组织机构中所使用的文档被越来越多地创建并存储为电子数 据。随着存储成本的降低、对内部控制的不断认识、以及因为计算机技术的进步而使电子数 据的优势扩大(例如,能够以低的成本存储电子数据且电子数据易于被分享),这种趋势还 在加速。作为利用文件系统所管理的树结构、以分层文件夹的形式显示文件的技术,迄今 为止开发并提供了下面的内容1)现有技术1 Windows (注册商标)的dir命令或Unix (注册商标)的Is命令 列出特定文件夹中的文件。2)现有技术2 =Windows (注册商标)的tree命令和资源管理器以树结构的形式 显示文件夹分层结构。利用资源管理器,可以显示指定文件夹的子文件夹,而不显示其他文 件夹的子结构。3)现有技术3 磁盘空间显示软件已经开发出显示文件夹的分层和该文件夹中 总文件大小的软件。这样的软件的示例包括kanner、WinDu2、WinDirStat JequoiaView以 及SpaceMonger (非专利文献1至5)。这样的软件的目的是,可视地确定什么类型的文件 占用大部分的磁盘空间以及发现并删除不必要的大文件,从而有效地获得磁盘自由空间。4)现有技术4 文档搜索列出含有用户规定为查询词的字符串的文档。Google 公司提供的“Google Search Appliance”(非专利文献6)具有高亮显示文档内的查询字符 串的功能。Vivisimo提供的“Velocity”(非专利文献7)具有,当发现含有查询词的多个 文档时,利用文档的字段动态地分类文档并显示结果的功能。5)现有技术5 对于文档管理系统,提供了一种采用模仿书架和书夹的用户界面 的文档管理系统(非专利文献8)。该系统具有,根据文档的类型,将存储的文档归入书夹, 并且允许利用标签写注释的功能。 html

非专禾丨J文献 1 Scanner :http://www. steffengerlach. de/freeware/ 非专利文献 2 :WinDu2 :http://www. vector, co. jp/soft/win95/util/se059546.
非专利文献 3 =WinDirStat :http:/ 非专利文献 4 =SquoiaView :http: informatica/visualization/sequoiaview
非专利文献 5 SpaceMonger :http:
"Vindirstat. sourceforge. net/
//w3. win. tue. nl/nl/onderzoek/onderzoek_
Vwww. sixty-five, cc/sm/ 非 专利 文献 6 :Google Search Appliance :http://www. google, co. jp/ enterprise/gsa/
非专利文献 7 Velocity :http://vivisimo. com/html/products非专利文献8 :Visual Cabinet (NEC 公司)http://www.nec· co. jp/univerge/solution/pack/visual_cabinet/index, html非专利文献9 =Rack-Rack Library (PFU 有限公司):http://www. pfu. fujitsu. com/raku21ibrary/

发明内容
本发明要解决的问题对于在组织机构内创建的文档,与单一商务有关的多个文档通常由多个负责的人 员创建和管理。在许多组织机构中,例如,通过在文件服务器上设立共享文件夹、对其中的 文件存储位置设立给定规则、以及允许多个负责的人员将文件存储在该文件夹中,进行文
件管理。在这样的情况下,不断地需要一种用于有效地理解该文件夹中的文件的概览的方 法,原因如下第一,就长期的商务诸如进行了数年的单一商务而言,在进行该商务期间创建的 文档也应当在相同的时期内被维持。因此,可能难以记住哪个文件存储在分层文件夹的哪 一级上。第二,当多个负责的人员共享文件管理时,其它的负责人员难以知道那里存储了 什么类型的文件。即使在对存储位置设立规则时,如果新创建了该规则没有定义的类型的 文件,创建该文件的负责人员随意新准备文件的存储位置,则通常也如此。第三,涉及单一商务的人员不必固定,稍后其它负责人员通常也可以参与该商务。 在这样的情况下,之后突然参与该商务的(多个)人访问迄今累积的文档,这样,所述(多 个)人甚至可能不能确定首先浏览哪个子文件夹。第四,当使用电子数据时,与在纸张上存 储文档相比,可以轻而易举地存储大量文档。因此,文档的数量和总量倾向于增长,这反过 来增强了前述第一至第三种趋势。附带提一下,对于纸质文档,通过浏览各页、检验各页之间装订的标题、或者检验 各标题之间的页的厚度,可以知道装订在文件夹中的文档的概览(例如,存在什么类型的 文档和存在多少文档)。同时,当多个文件夹存储在书柜中时,通过查看文件夹的数量或者 文件夹的脊,可以知道文档的概览(例如,存在什么类型的文档和存在多少文档)。然而,采用上面引述的现有技术1至现有技术5 (包括非专利文献1至9)都不可能 知道关于存在什么类型的文档和存在多少文档的概览。即,当使用被引述为现有技术1的 命令时,应当对每个文件夹执行该命令,当文件夹的数量增大时,或者当文件夹的层数增大 时,这样做的效率低。同时,采用被引述为现有技术2的文档搜索,搜索到的含有查询字符 串的文档被显示在列表中,而与该文档在分层文件夹中的位置无关。因此,只能获得搜索到 的每个单个文档的信息,而不能获得整个文件夹的信息。此外,被引述为现有技术3的软件 仅关注文件夹中文件大小总量,并且几乎不能获得关于小文件的信息,因此,不足以知道文 件夹中文件的概览。此外,现有技术3是一种假定在家庭内主要由个人使用的技术。因此, 如果文件夹的层数增多,或者文件夹的数量增大,则显示列表的性能下降。现有技术5关注 于模仿基于纸张的文档管理方法。因此,反而难以处理存储在文件服务器的共享文件夹上的文件。当共享文件夹被设置在文件服务器上时,这样的文件夹的层深度通常与其内容相 对应。相反,当利用书架和书夹进行文件管理时,即使在索引插在书夹之间的情况下,仍只 能最多创建3层。非专利文献9描述了,对于Rack-Rack Library,可以处理1000或者更多 个书夹和具有1000000页或者更多页的文件。尽管研究了通过文件服务器处理大量文件和 文件夹的情况,但是可以轻而易举地明白,书夹数量的增大可能使得难以检验该书夹的脊。鉴于上面的情况,设计了本发明,并且本发明提供了一种商务文档管理方法,在多 个负责人员长期管理文档(诸如共享文件服务器上的文档)的数量和大小的情况下,该方 法能够有效地帮助理解文件夹上文件的概览,而无需打开各子文件夹或者文件。本发明还 提供了一种商务文档管理方法,在查询搜索时,该方法有助于理解分层文件夹上含有查询 字符串的多个文件的位置分布的概览。解决该问题的方式为了解决上述问题,根据本发明,动态创建(例如,每次将光标放置在文件夹上访 问该文件夹时)并显示包括在文件夹中的多个文件的概览。因此,可以有效地理解文件夹 中的文件的概览,而无需检验各子文件夹或者文件的内容。根据属性(文件大小、文件扩展名、文件类型、文件创建日期、文件上次更新日期、 文件上次浏览日期、文件提交日期、文件创建者、文件创建者所属组、文件来源、文件目的 地、文件夹深度、或者子文件夹数量)的一个或者多个如下特征或者趋势(频繁出现在文件 名中的字符串、频繁出现在子文件夹名中的字符串、频繁出现在标题中的字符串、出现在文 件名中的顺序号字符串、出现在子文件夹名中的顺序号字符串、出现在标题中的顺序号字 符串、子文件夹中的聚集文件、子文件夹的相似性、以及多维文件交叉节点的分布),描述包 括在文件夹中的多个文件的概览。例如,在图1所示的情况下,显示表示“手册”文件夹包括“大小为500Kb至2Mb的 5个doc文件和大小为IOOKb至300Kb的30个jpg文件”的概览。因此,用户可以大致知 晓该“手册”文件夹包括什么类型的文件,而无需实际检验该文件夹的内容(无需打开该文 件夹)。尽管这里的概览的示例是基于文件大小和文件扩展名的特征,但是这同样适用于其 它属性。然后,显示动态获得(在每次访问该文件夹(选择该文件夹)时)的概览,如图 2A至图2C中的200至203所示,从而文件夹内容的校验材料可以被以适当的方式提供给 用户。根据如图2B中的201所示的各种属性,可以有效地显示概览,或者根据如图2C中 的202所示的用户规定的属性(此处为属性“扩展名”),同样可以有效地显示概览。标号 200和203表示利用影线示出的“手册”文件夹当前被选择,并且显示该文件夹的概览。标 号201表示利用影线示出的“我的文档”文件夹当前被选择,并且显示包括在该文件夹中的 每个子文件夹的概览。标号202和203表示在“手册”文件夹以展开的形式显示的情况下, 显示紧接在“手册”文件夹下的文件的概览(概览的信息不包括“插图”子文件夹中的文件 的概览)。关于文件类型,如果例如具有不同扩展名的图像文件(例如,jpg文件和tiff文 件)被事先定义为相同类型的文件,并且这样的扩展名被结合成一个,则可以根据用户请 求的详情程度,显示概览。此外,根据本发明,有效地显示含有顺序号字符串的文件的概览。在此,包含在文件名中的顺序号字符串指多个文件含有顺序号字符串的情况。例如,假定通过重复修改产 生报告,并且存储文件名内嵌入了版本号诸如“报告版本1. doc”的文件。在这样的情况下, 可以通过显示存在文件名含有字符串“报告版本”和版本号的“.doc”文件,显示关于请求 的概览的足够信息。除了在此所述的版本号顺序出现的情况,也可以考虑分配有雇员的ID 号、资源等等的其它情况。这同样适用于出现在子文件夹名中的顺序号字符串。根据本发明,即使当文件在给定的子文件夹中聚集时,仍可以有效地显示概览。在 给定的子文件夹中聚集的文件指,例如,图3所示文件夹中被称为“收集于2007年10月” 的子文件夹包括90%的文件的情况。在这样的情况下,通过关注该子文件夹并且根据属性 的特征或者趋势,将概览描述成“大多数文件在“收集于2007年10月”子文件夹中并且包 括在该子文件夹内的文件是大小为IOOKb至500Kb的doc文件”,可以显示更重要文件的概 览。例如,表示“大多数文件在‘A(子文件夹名)’子文件夹中并且包括在该子文件夹内的 文件是大小为‘B(大小),的‘C(文件类型),文件”的模板字符串存储在内存中,以便通过 从后面描述的文件夹内容数据(图9和图10)中提取对应于组成元素A至C的信息,产生 概览。根据本发明,还研究了子文件夹的相似性。在此,相似的子文件夹指,包括在多个 子文件夹中的文件相似。例如,当单一产品的不同版本的手册存储在不同子文件夹中时,包 括在所述子文件夹中的文件被认为是相似的。因此,仅显示子文件夹之一的概览并且显示 表示其它子文件夹是相似子文件夹的信息就足够了。因此,可以利用较少的说明显示文件 夹的概览,这样有助于有效地理解。根据本发明,还研究了文件在多维交叉节点上分布的情况。在此,文件被分布在多 维交叉节点上指,诸如图4所示的情况。在此所示的示例是,创建与多个部门、时期和类型 相关的文件的情况。对于文件夹分层结构,需要通过选择部门、时期和类型之一,根据文件 夹的分类,创建树结构。因此,较低层的子文件夹被以相似的方式布置(在该示例中,两个 部门具有在每个时期布置的相同子文件夹组合)。在这样的情况下,考虑多维(部门、时期 和类型)的空间,并且根据树结构,显示在每个节点上存在的文件,而不显示文件夹内容的 概览,将更加有效。因此,可以以用户更容易理解的形式将包含在文件夹内的文件的概览显 示成“每个部门每月有一个xls文件和一个doc文件”。根据本发明,根据通过比较被认为与包括在同级文件夹中的多个文件的特征不同 的特征,描述包括在文件夹中的多个文件的概览。例如,参考诸如图5所示的分层文件夹, 研究待显示文件夹“产品A版本2描述文档”的内容的概览的情况。在该示例中,文件夹“产 品A版本1描述文档”和文件夹“产品A版本2描述文档”是同级关系。在该情况下,两个 文件夹“产品A版本1描述文档”和“产品A版本2描述文档”包括许多ppt文件。因此, 将作为文件夹“产品A版本2描述文档”的概览的信息描述为“该文件夹包括许多ppt文 件”毫无意义。相反,根据包括在文件夹“产品A版本2描述文档”中的文件与包括在文件 夹“产品A版本1描述文档,,中的文件之间的被识别出的、例如在它们的文件创建日期或者 上次更新日期方面的差异,来描述文件夹“产品A版本2描述文档”的概览,可以为用户提 供更容易理解的信息(例如,版本2后开发)。应当注意,如果多个子文件夹的父文件夹相 同,则这样的子文件夹是同级子文件夹。然而,同级文件夹不必为相似的文件夹。根据本发明,当显示存储在分层文件夹中的文档的查询搜索结果时,显示分层文件夹中的查询命中文档的位置分布(参见图6)。现有搜索引擎被配置成,根据独立地计算 出的结果,将含有查询字符串的文档布置成行,而舍弃与每个文件位于该分层文件夹上的 哪一级有关的信息。利用文档的内容动态群集文档的现有技术诸如Velocity (非专利文献 7)也不使用与该分层文件夹中的文档位置有关的信息。本发明提供查询搜索结果显示,诸 如图6A和图6B中的600或者601和602所示。因此,根据个人或者多个负责的人员中的 个人设立的文件存储位置的规则,可以为用户提供关于“该子文件夹有多少个文件含有查 询字符串”的信息。利用这样的信息,可以向用户提供,该分层文件夹上含有查询字符串的 多个文件的位置分布的概览。根据本发明,以展开方式显示分层文件夹,而部分地省略该分层文件夹。例如,研 究分层文件夹和含有查询字符串的文件的位置分布,如图7A中的700所示。如700所示, 显示包括含有不包括查询词的文件的文件夹的整个分层文件夹毫无意义。因此,如图7B中 的701所示,显示仅包括含有查询字符串的文件的文件夹的概览,而省略文件夹4至文件夹 8,如702所示。利用该方法,可以提供更容易被用户理解的信息。即,根据本发明的文件管理系统是管理存储在分层文件夹中的文件的文件管理系 统,它包括文件夹内容数据存储单元,用于在其内存储该分层文件夹中的每个文件夹的内 容数据;文件夹概览计算处理单元,用于参考该文件夹内容数据存储单元,并产生表示包括 在用户选择的文件夹内的多个文件的概览的字符串;以及显示处理单元,用于在显示装置 上显示所产生的字符串。在此,当规定了文件属性时,该文件夹概览计算处理单元获取多个文件的规定属 性的直方图,而非产生该字符串。然后,该显示处理单元将获取的直方图显示在该显示装置 上。当被选择的文件夹具有多维(分层)文件交叉节点分布时,该文件夹概览计算处 理单元产生表示在每个节点上存在文件的概览字符串,而且还在该概览中描述每个节点的 名称。此外,当被选择的文件夹中的多个子文件夹包括相似文件时,该文件夹概览计算 处理单元产生表示存在多个含有相似文件的子文件夹的概览字符串,而且还在该概览中描 述所述子文件夹的名称。当被选择的文件夹不含有包括相似文件的子文件夹并且当子文件夹中存在聚集 文件时,该文件夹概览计算处理单元产生表示存在具有聚集文件的子文件夹和聚集文件的 子文件夹的名称的概览字符串。根据本发明的文件管理系统是管理存储在分层文件夹中的文件的文件管理系统, 它包括文件存储单元,用于在其内存储多个文件;搜索索引存储单元,用于在其内存储搜 索索引;查询搜索处理单元,用于参考存储在该搜索索引存储单元内的搜索索引,执行查询 搜索,并且获得搜索结果;位置分布处理单元,用于对于存储了多个文件的每个文件夹,获 取关于与该搜索结果匹配的文件的数量的信息;以及显示处理单元,用于在显示装置上显 示每个文件夹的匹配文件的数量。在此,该显示处理单元以文本方式显示所述匹配文件的 数量。可替选地,该位置分布处理单元根据关于与该搜索结果匹配的文件的数量的信息,创 建直方图;并且该显示处理单元显示每个文件的直方图。应当注意,该显示处理单元可以被 配置成,省略显示不包括与该搜索结果匹配的文件的文件夹。
根据本发明的文件管理系统是管理存储在分层文件夹中的文件的文件管理系统, 它包括文件存储单元,用于在其内存储多个文件;搜索索引存储单元,用于在其内存储搜 索索引;文件夹内容数据存储单元,用于在其内存储该分层文件夹中的每个文件夹的内容 数据;文件夹概览计算处理单元,用于当概览显示被规定为显示模式时,参考该文件夹内容 数据存储单元,并且产生表示包括在用户选择的文件夹内的多个文件的概览的字符串;查 询搜索处理单元,用于当查询搜索结果的位置分布显示被规定为显示模式时,参考存储在 该搜索索引存储单元内的搜索索引,执行查询搜索,并且获得搜索结果;位置分布处理单 元,用于对于存储了多个文件的每个文件夹,获取关于与该搜索结果匹配的文件的数量的 信息;以及显示处理单元,用于根据规定的显示模式,在显示装置上显示所产生的字符串, 或者在该显示装置上,显示每个文件夹的匹配文件的数量。根据下面实施本发明的具体实施方式
和附图,可以更清楚地理解本发明的其它特 征。本发明的有益效果根据本发明,用户可以有效地理解文件夹中文件的概览,而无需检验各子文件夹 或者文件的内容。此外,在查询搜索中,也可以理解分层文件夹中含有查询字符串的多个文 件的位置分布的概览。


图1是示出文件夹中包含的文件的示例的示意图;图2是示出屏幕的示例的示意图,其中,屏幕显示了文件夹中包含的文件的概览;图3是示出特定子文件夹包括许多文件的情况的示例的示意图;图4是示出创建了关于许多部门、日期和类型的文件的情况的示例的示意图;图5是示出同级文件夹中包含的多个文件的示例的示意图;图6是示出屏幕的示例的示意图,其中,屏幕显示了分层文件夹上含有查询字符 串的多个文件的位置分布的概览;图7是示出屏幕的示例的示意图,其中,屏幕显示了仅包括含有查询字符串的文 件的文件夹的概览;图8是示出根据本发明实施例的商务文档处理系统的示意配置的功能框图;图9是示出文件夹内容数据的示例数据结构的示意图;图10是示出文件夹数据内容的另一示例数据结构的示意图;图11是示出扩展名-类型定义数据和文档命中数据的示例数据结构的示意图;图12是用于说明商务文档处理系统执行的、显示文件概览和含有查询字符串的 多个文件的位置分布的概览的全部处理的流程图;图13是用于说明计算文件夹的概览的处理细节的流程图;图14是用于说明获得紧接在文件夹下的每个子文件夹的规定属性的直方图的处 理细节的流程图;图15是用于说明获得紧接在文件夹下的每个子文件夹的概览的处理细节的流程 图;图16是用于说明计算分层文件夹内的查询搜索结果的位置分布信息的处理细节的流程图;图17是用于说明获得紧接在文件夹下的每个子文件夹的命中次数的直方图的处 理细节的流程图。
具体实施例方式下面参考附图描述本发明的实施例。应当注意,本发明实施例仅为说明性的,用于 实现本发明,而无意限制本发明的技术范围。全部附图中相同的结构采用相同的标号。<商务文档处理系统的配置>图8是示意性地示出根据本发明的一个实施例实现的商务文档处理系统的内部 配置的功能框图。该商务文档处理系统包括文件系统(DB) 800,具有文件夹分层结构和文 件;搜索索引801,用于搜索引擎,从而对文件执行全文本搜索;显示装置802,显示数据;键 盘803 ;以及定位装置804,诸如用于执行例如为显示的数据选择菜单的操作的鼠标;中央 处理单元805,执行必要的运算处理、控制过程等等;程序存储器806,其内存储了在中央处 理单元805内执行处理所需的程序;以及数据存储器807,其内存储了在中央处理单元805 内执行处理所需要的数据。中央处理单元805包括查询搜索处理单元808,对存储在文件系统内的文件执行 全文本搜索;文件夹概览计算处理单元809,计算文件夹的概览;以及搜索结果文件夹分层 位置分布处理单元810,计算分层文件夹内的查询命中文档的分布。文件夹概览计算处理 单元809包括属性获得概览计算处理单元811,属性获得概览计算处理单元811根据属性 计算文件夹的概览。属性获得概览计算处理单元811包括属性差异获得概览计算处理单元 812,属性差异获得概览计算处理单元812计算属性被认为与同级文件夹的属性不同的文 件夹的概览。搜索结果文件夹分层位置分布处理单元810包括搜索结果省略显示处理单元 813,搜索结果省略显示处理单元813以展开的形式显示分层文件夹,而省略该分层文件夹 的一部分。数据存储器807包括文件夹内容数据814,含有关于文件夹内容(子文件夹或者 文件)的信息;扩展名-类型定义数据815,含有关于扩展名及其类型的信息;以及文档命 中数据816,含有关于哪个文件包含搜索查询词的信息。<数据存储器807的数据内容〉图9、图10和图11是示出包括在数据存储器807内的文件夹内容数据814、扩展 名-类型定义数据815和文档命中数据816的数据结构的示意图。图9和图10均示出文件夹内容数据的数据结构并且分别说明了文件和子文件夹 的数据示例。图9所示的文件夹内容数据包括路径名900 ;标记901,表示该文件夹内容是 否是子文件夹;标记902,当该文件夹内容是子文件夹时,表示该子文件夹是否被展开;直 方图903,当该文件夹内容是子文件夹时,为该子文件夹下的文件属性的直方图;大小904, 当该文件夹内容是文件时,表示该文件的大小;扩展名905,当该文件夹内容是文件时,表 示该文件的扩展名;类型906,当该文件夹内容是文件时,为由该扩展名的扩展名-类型定 义数据815所限定的类型;创建日期907,当该文件夹内容是文件时,表示该文件的创建日 期;上次更新日期908,当该文件夹内容是文件时,表示该文件的上次更新日期;上次浏览 日期909,当该文件夹内容是文件时,表示该文件的上次浏览日期;提交日期910,当该文件夹内容是文件时,表示该文件的提交日期;创建者911,当该文件夹内容是文件时,表示该 文件的创建者;创建者所属组912,当该文件夹内容是文件时,表示该文件的创建者所属的 组;来源913,当该文件夹内容是文件时,表示该文件的来源;目的地914,当该文件夹内容 是文件时,表示该文件的目的地;文件夹深度915,当该文件夹内容是子文件夹时,表示该 子文件夹下的文件夹的深度;以及文件夹数量916,当该文件夹内容是子文件夹时,表示该 子文件夹下的文件夹的数量。每个这样的数据均是从每个文件的属性信息获得的,并被布 置在列表中。如图9示出该文件夹内容是文件的情况,字段901示出为“否,FALSE”,而字 段902、903、915和916示出为“无效,NULL”。相反,如图10示出该文件夹内容是子文件夹 的情况,字段1001示出为“是,TRUE”,而字段1004至1014示出为“无效,NULL”。图IlA示出扩展名-类型定义数据815的数据结构。扩展名-类型定义数据是包 括扩展名1100和类型1101的元素阵列。例如,当jpg文件和tiff文件被定义为图像文件 时,该阵列包括两个元素,它们是扩展名1100为“jpg”、类型1101为“图像”的元素,和扩展 名1100为“tiff”、类型为“图像”的元素。图IlB示出文档命中数据816的数据结构。该文档命中数据是包括路径名1102、 命中查询词1103和概览1104的元素阵列。当单一文档含有多个查询字符串时,该命中查 询词1103含有多个查询字符串。例如,在图11所示的示例中,路径名为“C: ¥ IeaderOl ¥ temp ¥: file001.txt”的文档含有两个查询字符串“文档”和“显示”。因此,命中查询词 1103含有这两个查询字符串。<商务文档处理系统的操作>下面将描述由根据本发明实施例的商务文档处理系统执行的处理。1)操作概述图12是示意性地示出由商务文档处理系统执行的处理流程的流程图。在图12中, 在收到用户的指令时,中央处理单元805确定对应于该指令的处理是显示文件夹的概览, 还是显示分层文件夹上的查询搜索结果的位置分布的概览(步骤1200)。如果待执行的处 理被确定为显示文件夹的概览,则文件夹概览计算处理单元809执行计算文件夹的概览的 处理(步骤1201)。如果在步骤1200中,待执行的处理被确定为显示分层文件夹上的查询 搜索结果的位置分布概览,则查询搜索处理单元808进行搜索并获取查询搜索结果。然后, 搜索结果文件夹分层位置分布处理单元810执行计算分层文件夹中的查询搜索结果的位 置分布信息的处理(步骤1202)。此后,中央处理单元805接收用户的指令,并且确定它是展开该文件夹的指令,还 是图标显示该文件夹的指令,还是终止处理的指令(步骤1203)。在此,“展开文件夹”指, 展开文件夹使子文件夹成行显示,而“图标显示文件夹”指,将展开的文件夹重新调整成单 一行。如果要执行的处理被规定为展开文件夹或者图标显示文件夹,则根据用户的输入,更 新表示文件夹内容数据814是否以展开方式显示的标记902 (步骤1204)。然后,再一次从 步骤1200开始重复该处理。如果在步骤1203中待执行的处理被确定为终止处理,则流程 结束。2)步骤1201的细节图13是示出图12所示的步骤1201计算文件夹的概览的处理的细节的流程图。首先,文件夹概览计算处理单元809接收用户的指令,并确定是否规定了文件夹的概览应当基于的属性(步骤1300)。如果确定规定了属性,则文件夹概览计算处理单元 809校验哪个属性被规定为该文件夹的概览应当基于的属性(步骤1301)。此外,对于紧接 在该文件夹下面的每个子文件夹,文件夹概览计算处理单元809获得在步骤1301确定的规 定属性的直方图(步骤1302)。然后,对于紧接在该文件夹下面的每个子文件夹,文件夹概 览计算处理单元809显示在步骤1302确定的直方图,如图2中的202所示(步骤1303)。如果在步骤1300中确定没有用户规定的属性,则文件夹概览计算处理单元809获 得紧接在该文件夹下面的每个子文件夹的概览(步骤1304)。然后,文件夹概览计算处理单 元809显示关于文件夹或者包括在紧接在该文件夹下面的每个子文件夹内的文件的信息, 如图2中的201所示(步骤1305)。以弹出方式,显示靠近鼠标指针的子文件夹,如图2A中 的200和图2C中的203所示(步骤1306)。3)步骤1302的细节图14是示出在图13的步骤1302中,对于紧接在文件夹下的每个子文件夹,获得 规定属性的直方图的处理细节的流程图。首先,文件夹概览计算处理单元809参考图9和图10所示的文件夹内容数据814, 并创建目标文件夹的列表L (步骤1400)。接着,文件夹概览计算处理单元809将作为该列 表的可变索引的Sub_f0lder_index初始化为1 (步骤1401)。然后,文件夹概览计算处理 单元809检验该列表L的长度是否大于或者等于Sub_f ο Iderjndex的长度(步骤1402)。 如果确定L的长度小于Sub_f ο Iderjndex的长度,则该处理终止。同时,如果确定L的长度大于或者等于Sub_f ο Iderjndex的长度,则文件夹概览 计算处理单元809继续该处理。首先,文件夹概览计算处理单元809参考表示列表L内的 第Sub_f ο Iderjndex个元素是否以展开方式显示的标记1002,以检验该元素是否被规定 成以展开形式显示(步骤1403)。如果规定以展开形式显示该元素,则文件夹概览计算处理 单元809参考该文件系统800,以检验紧接在该第Sub_f ο Iderjndex个元素下的文件的规 定属性并形成直方图,然后,将其存储为直方图1003 (步骤1404)。然后,文件夹概览计算处 理单元809参考文件系统800,并将紧接在第Sub_f ο Iderjndex个元素下的子文件夹添加 到该列表L中(步骤1405)。如果在步骤1403中未规定以展开形式显示第Sub_f olderjndex个元素,则文 件夹概览计算处理单元809递归地参考文件系统800,以检验包括在列表L中的第Sub_ folderjndex个元素内的全部文件的规定属性并形成直方图,然后,将其存储为直方图 1003 (步骤1406)。此后,文件夹概览计算处理单元809将Sub_f ο Iderjndex递增1 (步骤 1407),并再一次从步骤1402开始重复该处理。4)步骤1304的细节图15是示出在图13所示的步骤1304中,获得紧接在文件夹下的每个子文件夹的 概览字符串(表示每个子文件夹的内容的字符串)的处理细节的流程图。首先,文件夹概览计算处理单元809利用空字符串初始化用于存储概览的字符串 S (步骤1500)。接着,文件夹概览计算处理单元809递归地参考文件系统800,并创建列 表L,在该列表L中,包括在目标文件夹内的全部文件被存储为图9所示的文件夹内容数据 (步骤1501)。接着,文件夹概览计算处理单元809检验列表L是否含有该元素(待处理的 文件)(步骤1502)。
如果列表L中不含有该元素,则该处理终止。相反,如果列表L中含有该元素,则 文件夹概览计算处理单元809首先检验是否存在多维文件交叉节点的分布(步骤1503),诸 如参考图4所描述的那样。如果确定存在这样的分布,则文件夹概览计算处理单元809对 概览S附加代表符,该代表符表示在每一维上都存在文件并且还在该概览中描述了每一维 的名称,然后,从列表L中移除这样的文件(步骤1504)。例如,在诸如图4所示的结构中, 创建代表设计部门A和设计部门B的概览字符串,然后,从列表L中移除设计部门A和设计 部门B的文件夹。例如通过将字符串模板存储在存储器中,并将适当的字符插入该模板上 的空字段中,创建概览字符串。在图4所示的情况下,如果提供了模板“涉及[]的[]文 件”,则通过将“xls,doc”和“销售”插入相应的字段,创建字符串。此后,文件夹概览计算处理单元809再一次从步骤1502开始重复该处理。如果在 步骤1503确定,不存在多维文件交叉节点的分布,则文件夹概览计算处理单元809检验是 否存在包括相似文件的多个子文件夹(步骤150 。如果确定存在这样的子文件夹,则文件 夹概览计算处理单元809对该概览S附加代表符,以表示某些子文件夹包括相似文件,而且 还在该概览中描述了所述子文件夹的名称,并且从该列表L中移除包括在该子文件夹中的 文件(步骤1506)。文件夹概览计算处理单元809再一次从步骤1502开始重复该处理。如果在步骤 1505确定不存在包括相似文件的多个子文件夹,则文件夹概览计算处理单元809检验子文 件夹中是否存在聚集的文件(步骤1507)。如果确定存在聚集的文件,则文件夹概览计算处 理单元809将该子文件夹的名称和描述添加到概览S中,以表示该子文件夹包括大量文件, 然后,从该列表L中移除除了包括在该子文件夹中的这些文件之外的文件(步骤1508)。文件夹概览计算处理单元809再一次从步骤1502开始重复该处理。当在步骤1507 确定不存在聚集的文件时,根据每个文件属性(文件大小、文件扩展名、文件类型、文件创 建日期、文件上次更新日期、文件上次浏览日期、文件提交日期、文件创建者、文件创建者所 属的组、文件来源、文件目的地、文件夹深度或者文件夹数量)的如下特征或者趋势(文件 名中频繁出现的字符串、子文件夹名中频繁出现的字符串、标题中频繁出现的字符串、文件 名中出现的顺序号字符串、子文件夹名中出现的顺序号字符串、或者标题中出现的顺序号 字符串),属性差异获得概览计算处理单元812将被认为与包括在同级文件夹中的多个文 件的特征不同的特征添加到该概览S中(步骤1509),然后,终止该处理。利用现有统计试 验技术,可以执行步骤1509的差异确定。5)步骤1202的细节图16是示出在图12所示的步骤1202中,计算分层文件夹内的查询搜索结果的位 置分布信息的处理细节的流程图。首先,对于紧接在该文件夹下面的每个子文件夹,搜索结 果文件夹分层位置分布处理单元810获得查询搜索处理单元808执行的查询搜索所命中的 文件的命中次数的直方图(步骤1600)。然后,文件夹概览计算处理单元809接收用户的指 令,并且确定是否规定以文本方式显示该命中次数(步骤1601)。如果规定以文本方式显示该命中次数,则文件夹概览计算处理单元809参考一次 或者多次查询命中的文件的数量的直方图以及文件的总数量,并且在分层结构显示部分上 (如图6的600所示),仅显示包括含有查询字符串的文件的文件夹(如图7的701所示) (步骤 1602)。
同时,如果规定不以文本方式,而以图形方式显示该命中次数,则文件夹概览计算 处理单元809参考每次查询的命中次数的直方图和文件总数,并在分层结构显示部分上显 示它们,如图6B中的601所示(步骤1603)。6)步骤1600的细节图17是示出在图16的步骤1600中,获得紧接在文件夹下的每个子文件夹的命 中次数的直方图的处理细节的流程图。首先,查询搜索处理单元808参考搜索索引801, 以获取文档命中信息,并以图IlB所示的文档命中数据的形式存储该文档命中信息(步骤 1700)。这可以通过搜索引擎领域内的现有技术来实现。接着,参考图9和图10所示的文件夹内容数据814,搜索结果文件夹分层位置分 布处理单元810创建目标文件夹的列表L(步骤1701),然后,将作为列表L的变量索引的 Sub_folder_index 初始化为 1 (步骤 1702)。搜索结果文件夹分层位置分布处理单元810确定列表L的长度是否大于或者等于 Sub_folder_index的长度(步骤1703)。如果L的长度小于Sub_folder_index的长度,则 该处理终止。相反,如果L的长度大于或者等于Sub_f0lder_index的长度,则搜索结果文 件夹分层位置分布处理单元810参考表示是否以展开方式显示列表L中的第Sub_folder_ index个元素的标记1002,以检验是否规定以展开形式显示该元素(步骤1704)。如果规 定以展开形式显示该元素,则对于紧接在列表L中的第SUb_f0lder_index个元素下面的文 件,搜索结果文件夹分层位置分布处理单元810参考文件系统800和在步骤1700获得的文 档命中信息,以获得每次查询的命中次数、一次或者多次查询命中的文件数量以及文件总 数,然后,将它们记录在直方图1003中(步骤1705)。然后,搜索结果文件夹分层位置分布 处理单元810参考文件系统800,并且将紧接在列表L中的第Sub_f ο Iderjndex个元素下 面的子文件夹添加到列表L中(步骤1706)。同时,如果在步骤1704,没有规定以展开形式显示该元素,则对于包括在列表L中 的第Sub_f ο Iderjndex个元素中的全部文件,搜索结果文件夹分层位置分布处理单元810 递归地参考文件系统800,并且还参考在步骤1700获得的文档命中信息,以获得每次查询 的命中次数、一次或者多次查询命中的文件数量以及文件总数,并且将它们记录在直方图 1003中(步骤1707)。然后,搜索结果文件夹分层位置分布处理单元810将Sub_folder_ index递增1(步骤1708),然后,再一次从步骤1703开始重复该处理。〈补遗〉在该实施例中,提供雇员或者资源的版本号或者ID号,作为文件名中出现的顺序 号字符串的示例。此外,考虑到文件名含有文件创建日期的情况或者存在丢失号码的情况。 因此,文件名也可以使用0至9或者连续英文字母字符作为属性趋势。这同样适用于子文 件夹名。此外,文件夹深度915或者文件夹数量916也可以使用空文件夹之外的文件夹数 量作为保存在图9所示的文件夹内容数据内的属性。上面描述了,当仅显示包括含有查询字符串的文件的文件夹时的情况(如图7B中 的701所示),图16中规定以文本方式显示命中次数。此外,即使当规定以图形方式显示每 次查询的命中次数时,仍可以仅显示包括含有查询字符串的文件的文件夹。此外,还可以根 据用户的请求,展开702所示的省略部分,并切换显示,从而显示全部的文件夹4至文件夹 8。
图8所示的文件系统800还可以是文档DB诸如文档管理系统。可替选地,文件系 统800可以被搜索索引取代,所述搜索索引是通过利用搜索引擎爬行文件系统而获得的。应当注意,本发明还可以由实现实施例的功能的软件程序代码予以实现。在这样 的情况下,将存储有该程序代码的存储介质提供给系统或者设备,然后,该系统或者设备中 的计算机(或者CPU或者MPU)读取存储在该存储介质中的程序代码,在这种情况下,从该 存储介质读取的程序代码本身实现上述实施例的功能,并且该程序代码本身和存储有该程 序代码的存储介质构成本发明。作为提供这样的程序代码的存储介质,例如,可以采用软 盘、CD-ROM、DVD-ROM、硬盘、光盘、磁光盘、CD-R、磁带、非易失性存储卡、ROM等等。此外,根据该程序代码的指令,计算机等上运行的OS (操作系统)等可以执行一些 或者全部的实际处理,并且这些处理可以实现上述实施例的功能。此外,在将从该存储介质 读取的程序代码写入该计算机的内存内后,该计算机的CPU等可以根据该程序代码的指令 执行一些或者全部的实际处理,并且这些处理可以实现上述实施例的功能。此外,可以通过网络发布实现实施例的功能的软件的程序代码,因此,所述程序代 码可以存储在存储装置诸如该系统或者设备的硬盘或者内存中,或者存储在存储介质诸如 CD-RW或者CD-R中,并且在使用时,该系统或者设备中的计算机(或者CPU或者MPU)可以 读取存储在该存储装置或者存储介质中的程序代码,并执行该程序代码。
0116]符号说明0117]800文件系统0118]801搜索索引0119]802显示装置0120]803键盘0121]804定位装置0122]805中央处理单元0123]806程序存储器0124]807数据存储器0125]808查询搜索处理单元0126]809文件夹概览计算处理单元0127]810搜索结果文件夹分层位置分布处理单元0128]811属性获得概览计算处理单元0129]812属性差异获得概览计算处理单元0130]814文件夹内容数据0131]815扩展名-类型定义数据0132]816文档命中数据
权利要求
1.一种用于管理存储在分层文件夹中的文件的文件管理系统,包括文件夹内容数据存储单元,用于在该文件夹内容数据存储单元内存储所述分层文件夹 中的每个文件夹的内容数据;文件夹概览计算处理单元,用于参考所述文件夹内容数据存储单元,并产生表示包括 在用户选择的文件夹内的多个文件的概览的字符串;以及 显示处理单元,用于在显示装置上显示所产生的字符串。
2.根据权利要求1所述的文件管理系统,其中,当指定了文件属性时,所述文件夹概览计算处理单元获取所述多个文件的指定属性的 直方图,而非产生所述字符串,并且所示显示处理单元将所获取的直方图显示在所述显示装置上。
3.根据权利要求1所述的文件管理系统,其中,所述文件夹概览计算处理单元根据从 文件大小、文件扩展名、文件类型、文件创建日期、文件上次更新日期、文件上次浏览日期、 文件提交日期、文件创建者、文件创建者所属组、该文件的来源、该文件的目的地、文件夹深 度、或者子文件夹数量中选择的至少一个属性的特征或者趋势,产生包括在所述选择的文 件夹中的所述多个文件的概览。
4.根据权利要求3所述的文件管理系统,其中,所述特征或者趋势包括如下项目中的 至少一个频繁出现在文件名中的字符串、频繁出现在子文件夹名中的字符串、频繁出现在 标题中的字符串、出现在文件名中的顺序号字符串、出现在子文件夹名中的顺序号字符串、 出现在标题中的顺序号字符串、子文件夹中的聚集文件、子文件夹的相似性、以及多维文件 交叉节点的分布。
5.根据权利要求1所述的文件管理系统,其中,当所述选择的文件夹具有多维(分层) 文件交叉节点分布时,所述文件夹概览计算处理单元产生表示每个节点上均存在文件的概 览字符串,并且还在概览中描述每个节点的名称。
6.根据权利要求1所述的文件管理系统,其中,当所述选择的文件夹中的多个子文件 夹包括相似文件时,所述文件夹概览计算处理单元产生表示存在包括相似文件的多个子文 件夹的概览字符串,并且还在概览中描述所述子文件夹的名称。
7.根据权利要求1所述的文件管理系统,其中,当所述选择的文件夹不包括包含相似 文件的子文件夹时,并且当在子文件夹中存在聚集文件时,所述文件夹概览计算处理单元 产生表示具有聚集文件的子文件夹的存在和具有所述聚集文件的子文件夹的名称的概览 字符串。
8.一种用于管理存储在分层文件夹中的文件的文件管理系统,包括 文件存储单元,用于在该文件存储单元内存储多个文件;搜索索引存储单元,用于在该搜索索引存储单元内存储搜索索引; 查询搜索处理单元,用于参考存储在所述搜索索引存储单元内的搜索索引执行查询搜 索,并且获得搜索结果;位置分布处理单元,用于对于存储了多个文件的每个文件夹,获取关于与该搜索结果 匹配的文件的数量的信息;以及显示处理单元,用于在显示装置上显示每个文件夹的匹配文件的数量。
9.根据权利要求8所述的文件管理系统,其中,所述显示处理单元以文本方式显示所述匹配的文件的数量。
10.根据权利要求8所述的文件管理系统,其中,所述位置分布处理单元根据关于与该搜索结果匹配的文件的数量的信息,创建直方 图;并且所述显示处理单元显示每个文件夹的直方图。
11.根据权利要求8所述的文件管理系统,其中,所述显示处理单元省略显示不包括与 该搜索结果匹配的文件的文件夹。
12.一种用于管理存储在分层文件夹中的文件的文档文件管理系统,包括 文件存储单元,用于在该文件存储单元内存储多个文件;搜索索引存储单元,用于在该搜索索引存储单元内存储搜索索引; 文件夹内容数据存储单元,用于在该文件夹内容数据存储单元内存储所述分层文件夹 中的每个文件夹的内容数据;文件夹概览计算处理单元,用于当概览显示被指定为显示模式时,参考所述文件夹内 容数据存储单元,并且产生表示包括在用户选择的文件夹内的多个文件的概览的字符串;查询搜索处理单元,用于当查询搜索结果的位置分布显示被指定为显示模式时,参考 存储在所述搜索索引存储单元内的搜索索引执行查询搜索,并且获得搜索结果;位置分布处理单元,用于对于存储了多个文件的每个文件夹,获取关于与该搜索结果 匹配的文件的数量的信息;以及显示处理单元,用于根据指定的显示模式,在显示装置上显示所产生的字符串,或者在 所述显示装置上,显示每个文件夹的匹配文件的数量。
全文摘要
提供了一种有效地识别包含在文件夹中的文件概览、而无需检验各子文件夹或者文件的内容的文件(文档)管理方法。动态地产生(例如,每次将光标放置在文件夹上进行访问时)并显示包括在文件夹中的多个文件的概览。例如,利用包含在文件夹中的文件的属性的特征或者趋势,与包含在同级文件夹中的多个文件相比较,并且概括并描述了具有差异的特征。此外,显示命中查询词的文档在分层文件夹中的位置的分布。
文档编号G06F17/30GK102077179SQ20098012552
公开日2011年5月25日 申请日期2009年6月25日 优先权日2008年6月30日
发明者中重亮, 松本俊子, 野崎康行 申请人:日立系统解决方案有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1