基于集合的文件项目归类和检索的方法与系统的制作方法

文档序号:6571373阅读:228来源:国知局
专利名称:基于集合的文件项目归类和检索的方法与系统的制作方法
第l/6页基于集合的文件项目归类和检索的方法与系统 技术领域该发明所涉及技术领域为计算机文件系统领域。
背景技术
现代电子计算机系统对于持久信息的存储一般是采用被操作系统管理的为文件系统的 方式来进行,而文件系统无论它建立在哪种介质上,采用怎样的存储组织方式,从用户逻 辑上看基本都采用树形结构。文件就是处在这个树形结构中的叶子节点位置的一个独立的 信息存储实体,非叶子节点称之为目录,每个文件可以通过由树形结构的根节点到该文件 节点的路径进行唯一的标识。这是一般意义上的电子计算机系统上的文件系统和文件的概 念,在这称为狭义的文件及文件系统概念。如果进一步抽象可以得到更加广义的文件和文件系统的概念,称之为广义文件及广义文 件系统。广义文件定义为一个独立的信息存储实体,而广义文件系统可以定义为由多个广 义文件构成的复合结构,而广义文件系统中的每个广义文件都有唯一的标识进行标识和引 用。这样的定义剔除了原来定义中的和操作系统的关系以及树形的组织结构,使很多不属 于常规文件系统的信息组织结构也满足这个定义。例如, 一个购物网站上的商品目录系统,可以将每个商品的网页看作是广义的文件,将 每个商品的网页的URL看作是唯一的标识,则可以认为商品目录系统是一个广义的文件系 统。再例如,内存中独立的若干块内存,每块内存可以用唯一的地址进行标识和引用,那 么也可以将这些内存块看作一个广义的文件系统。但由于满足广义文件系统定义的系统太多,且之间区别较大,难以用统一的方式描述和处理,故此在这里指定,本发明所指定的文件系统明确包含两类情况第一类就是由运行在计算机系统上的操作系统管理的文件系统,第二类就是采用WWW浏览器访问的网站上所 实现的分级目录系统。例如, 一个购物网站按照商品类别逐级划分所形成多级商品目录系 统。这类文件系统和操作系统管理的文件系统就有很大的相似性,逻辑上也是按照树形的 结构来组织,网页的URL和文件路径有很大的相似性,虽然没有一个直观的界面展示这种 树形结构,但是其逻辑本质是树形结构。本发明适用的计算机系统界定为具有一个或多个CPU和一个统一的内存的能够执行程 序的机器设备。包括在这个定义内现实的系统有个人电脑、各种大、种、小型计算机系 统、PDA和手机等移动计算设备。在前面所界定的文件系统一般都采用树形结构来进行组织,虽然这种树形结构被应用广 泛但是存在一些严重的缺点概括如下-(1) 当文件需要根据其所属类别将其放置在对应目录下时,由于一个文件可以属于 多个类别,而现今文件系统所采用的树形结构为了保证一个文件在文件系统中 标识的唯一性即路径的唯一性一般只允许文件放置在一个目录下,这就和文件属于多个类别想矛盾。例如我们要按照国籍去区分保存人的人事信息文件,如果按国别划分若干子目录,中国、美国、俄罗斯、英国、日本…等,将对应 有该国国籍的人的人事信息文件放在下面。这种方式存在的困绕是一个人可以 有多个国籍,比如一个人既可以有瑞士国籍,也可以同时拥有美国国籍。如果 采用现有文件系统方式的话,该人所对应的文件及应该存在于瑞士子目录又应
该存在与美国子目录,而这在现在的文件系统中是不允许的。更进一步的问题 是,假如说想知道那些人具有多重国籍,比如,同时具有加拿大国籍和美国国 籍或者同时具有俄罗斯、英国、瑞士国籍,显然在传统的文件系统所采用的树 形结构上想做到这点是很麻烦的事。(2) 树形目录系统还存在的一个问题是模式组合引起的分支爆炸问题。比如,同样 是存储人事信息文件的文件系统,假如说首先按人所在的省级行政区域划分若 干子目录,再在这些子目录下按照性别分别划分出男性和女性两个子目录,再 在分别在男性和女性两个子目录下按年龄划分成儿童,少年,青年,中年,老 年几个子目录,其目录结构见图l。这样划分方式最终的叶子目录的数目将是 34x2x5 = 340个,如果我们还想分下去的话,最终的叶子目录的数目将成倍 增加,可以由以下公式确定假设文件系统F有n层,S,是整个文件系统叶子目录数,S,代表第i层子目录数。再进一步的问题是,假如想按省份获取青年的信息文件的话,会遇到第 二级目录按性别划分的问题,即无法一次获得一个省份所有的青年的信息文 件,而是要进入同一省份目录两次, 一次是获得该省份所有男性青年的信息文 件,第二次是获得该省份所有女性青年的信息文件。(3) 分类方式固定缺乏动态性。接着参照上文的例子,如果需要增加按照学历分类 人事信息文件的话,需要增加小学,中学,大学,研究生等子目录,第一是不 好确定将这些子目录放在哪一级别目录下,第二是,无论这些子目录放在哪一 级别目录下都需要建立和删除若干子目录并且要将人事信息文件移动到对应 子目录下。(4) 不能依据属性对文件进行分类和检索。接着引用上文的例子,如果想指定査找 年龄在10至15岁之间人的信息文件,在不读取文件本身信息的前提上,现有 文件系统结构上无法实现这一功能。发明内容本发明的最基本的两个概念就是文件项目和文件项目集合。 一个文件项目可定义为一个 广义文件在广义文件系统中的唯一标识。在操作系统管理的文件系统中就是一个文件的全 路径,在网站目录系统中就是一个网页的URL。文件项目集合就是由文件项目组成的数学意 义上集合。文件项目s是文件项目集合J的组成元素则定义s属于4采用公式可表示为 "e^,反之如果文件项目s属于文件项目集合A则文件项目s是文件项目集合的组成单 元之一。同一个文件项目在一个文件项目集合内是唯一的,但一个文件项目可以同时属于 多个不同的文件项目集合。通过文件项目就可以对文件系统中的文件进行读取、写入等访问,不用去关心这个文件 具体的存储位置,到底是在网络服务器上还是在本地磁盘上等。同样对于对文件项目进行 归属到哪个文件项目集合的操作也不会影响到文件本身。真是由于文件项目与文件实体之 间的相对独立关系,所以可以釆用集合的方式对文件项目进行归类和检索。引用上节中按照国籍分类人事信息文件的例子,解决按国籍划分人事信息文件的方法是,首先建立一系列代表国家的文件项目集合"中国"、"美国"、"俄罗斯"、"英国"、"曰本"等,然后是根据每个人事信息文件记载的人所具有的国籍将文件项目添加到对应的文 件项目集,如果这个人具有中国国籍,则将其对应的人事信息文件项目添加到"中国"这 个文件项目集合中,如果一个人具有美国国籍,则将其对应的人事信息文件项目添加到"美 国"这个文件项目集合中,如果一个人同时具有中国和美国国籍则将该人所对应的文件项 目分别添加到"中国"和"美国"两个文件项目集合中。在上面的基础上就可以采用集合运算的方式对想要的获取的对应国籍的人事信息文件 进行检索。可以采用集合运算表达式来表示检索要求。例如想要检索具有中国国籍的人事 信息文件项目是则表示检索要求的集合运算表达式为"中国"。当想要检索既具有瑞士国 籍又具有美国国籍的人事信息文件项目是则表示检索要求的集合运算表达式为 "瑞士"n"美国"。当想要检索那些具有瑞士国籍或者是美国国籍的人事信息文件项目,采 用表达式为"瑞士"U"美国"。集合的基本运算有集合的自身运算集合的自身运算可定义为输入的运算集合为集合A输出的运算结果 集合为A交运算集合的交运算可定义为输入的运算集合为集合^和集合A输出的运算结果集 合为C-(。l""且"e用,集合的交运算可以表示为^n^ = C, C称之为j与万的交集。并运算集合的并运算可定义为输入的运算集合为集合力和集合A输出的运算结果集 合为C^al。"或ae辨,集合的并运算可以表示为^U5 = C, C称之为J与S的并集。差运算集合的差运算可定义为输入的运算集合为集合^和集合A输出的运算结果集 合为C^^lae j且"g^,则集合的差运算可表示为」-5 = C, C称之为j与^的交集。所有本发明所涉及的集合运算都可以通过组合以上基本集合运算逻辑来构造。本发明另一个重要概念就是属性。属性指的是记录文件项目的某方面的特征信息,可以 由人为赋予。例如上节背景技术中用到的人事信息文件项目,根据需要可以为之赋予一定 的属性,比如可以为该人事信息文件项目设置一个age属性,取值按照人事信息文件对应 的人的年龄。一个文件项目按照需要可以赋予若干不同的属性和对应属性取值。同样一个文件项目集 合可以被赋予若干不同的属性和对应的属性取值范围。参照上一节背景技术中现有文件系 统树形结构缺点(2)中提到的应用场景,建立一个代表老年的文件项目集合,赋予其age 这个属性,将该属性取值范围设置为大于等于50。则加入到该文件项目集合内部的文件项 目必须具有age这个属性,且属性取值必须和该集合^^属性的取值范围相一致,即大于 等于50。文件项目可以具有所属文件项目集合不具备的属性,例如属于老年文件项目集合 的人事信息文件项目可以具有表征性别的se;r这个属性和对应的属性值。针对上一节中提到的现有文件系统的树形结构缺点(2),可以采取以下措施 按照省级行政区域建立对应的文件项目集合分别为"北京市"、"上海市"、"河南省"、 "河北省"等,再按照性别建立"男性"和"女性"两个文件项目集合,再按照年龄划分 建立"儿童"、"少年"、"青年"、"中年","老年"等文件项目集合。对于一个人事信息文 件项目,根据其对应的所属的省级行政区域加入到对应的文项目件集合中,再根据其对应 的性别加入到对应的以性别区分的文件项目集合中,再根据所属年龄阶段加入到对应的年 龄相关的文件项目集合之中。检索的时候根据需要采用集合运算动态地组合这些集合,例 如想要检索所有北京的老年人事信息文件,只需要求"北京"和"老年"的交集即可,采 用集合运算表达式描述检索请求为"北京"n"老年"。这种方式所需设置的文件项目集合 数目是一个算术加和形式为34 + 2 + 5 = 41 ,很明显和传统文件系统的所需的叶子目录的乘
法数目相比有了巨大的縮减。针对上一节中提到的现有文件系统树形结构的缺点(3),可以采取以下措施 在上面的集合划分基础上再增加"小学"、"中学"、"大学"、"研究生"文件项目集合,再将人事信息文件项目根据其对应的学历加入到对应的文件项目集合之中。


图1是现有人事信息文件系统树形结构的由于模式组合引起的分支爆炸; 图2是人事信息文件项目集合之间的父子关系; 图3是采用该方法的一种系统的逻辑框图;具体实施方式
为了简化叙述,在后面内容中"系统"一词指的是,采用本方明方法模式的系统。在采 用本发明方法的系统中,存在两类文件项目集合。 一类是实体文件项目集合,这类文件项目 集合是由具体的文件项目构成,系统为其记录构成的文件项目及其这些文件项目具有的属 性及对应的属性值范围。另r类是视图文件项目集合,这类文件项目集合是由其他文件项 目集合包括实体文件项目集合和视图文件项目集合采用集合运算的方式或者是指定属性值 范围或者是两者结合的方式组合而成,系统只记录这种文件项目集合的运算表达式。在系 统中,不论是实体文件项目集合还是视图文件项目集合均采用唯一的名称进行标识和引用, 这是为了在采用集合运算组合文件项目集合时采用唯一的名称指定文件项目集合避免指定 上的混淆和冲突。实体文件项目集合之间存在父子关系,假如指定实体文件项目集合^是实体文件项目集合5的子集,则所有归属于^的文将项目也归属于5,并且力继承5的所有属性且对应属性 取值范围在S所设置的属性取值范围内。例如,在系统中建立"年龄"实体文件项目集合, 赋予其age属性并设置age取值范围为OS化e ,建立"老年"实体文件项目集合,指定"老 年"为"年龄"的子集,贝lj"老年"继承了堪e属性,进一步设置"老年"a^的范围为5(x卿, 该属性值范围在"年龄"age取值范围内。所有归属到"老年"的文件项目都就具有sge属 性且取值在"老年"的设置范围内,根据前面子集关系概念的定义这些文件项目同时也归 属到"年龄"之中。如果实体文件项目集合^是实体文件项目集合^的子集,那么反过来 可以称"是力的父集,也可以称实体文件项目集合^是实体文件项目集合5的子集存在父 子关系。在系统中实体文件项目集合间父子关系是传递的,即实体文件项目集合力是实体 文件项目集合5的子集,同时实体文件项目集合5是实体文件项目集合C的子集,则实体 文件项目集合/1也是实体文件项目集合C的子集,力和S的父子关系称为直接父子关系,力 和C的父子关系称为间接父子关系。归属于一个实体文件项目集合的文件项目有两类,一类是直接归属于该文件项目集合的 文件项目,另一类是该实体文件项目集合所有子集,包括直接子集和间接子集,所属的所 有文件项目。系统在记录实体文件项目集合构成时,只记录直接归属于该文件项目集合的 文件项目,对于它的子集的文件项目可以根据子集关系推算得到。总结以上系统为实体文 件项目集合记录的信息包括直接归属于该实体文件项目集合的文件项目及其具有的属性 和对应的属性值;该实体文件项目集合所具有的属性及对应的属性范围;给实体文件项目 集合和其它实体文件项目集合之间的直接父子关系。为了清楚说明系统工作方式,还是采用上面所举的人事信息文件归类的例子来说明。假 设需要根据人事信息文件对应的人的所在地区,性别,年龄,学历属性对人事信息文件进
行归类。首先建立一系列的实体文件项目集合,它们之间的父子关系见图2。
归类的具体过程就是用户根据一个具体的人事信息文件项目对应的人的所在地区,性 别,年龄,学历将该文件项目标记为属于哪个对应的文件项目集合,由系统将用户做的这 种指定记录下来。比如,对于某个具体人事信息文件项目,用户知道该人事文件记录的人 来自福建省漳州市,性别为男性,年龄为32岁属于青年,学历为硕士研究生,根据这些信 息将该文件项目分别添加到"漳州市","男性","青年","硕士研究生"文件项目集合中。 由于集合间的父子关系,该文件项目相当于也被添加到这些文件项目集合的所有父文件项 目集合之中。比如,"漳州市"的上一级文件项目集合"福建省",将文件项目添加到"漳 外i市"相当同时将文件项目添加到"福建省"这个文件项目集合中。由于父子关系是传递 的,该文件项目相当于添加到所有"漳州市"的直接或间接上级文件项目集合之中。但是 系统只记录该文件项目属于"漳州市"这个关系,对于该文件项目和"漳州市"直接上级 或是间接上级文件项目集合的归属关系可以由这些文件项目集合和"漳州市"之间的父子 关系推演得到。
检索的具体过程是用户通过集合运算表达式或者其他方式指定结果文件项目集合的集 合运算组合模式提交给系统,系统根据该模式查询所涉及的实体文件项目集合的构成,再 进行集合运算得到结果文件项目集合返回给用户,用户得到结果文件项目集合就可以根据该文件项目集合中的文件项目所记载的路径或者URL对文件进行访问。根据上文所述基础上,假如用户需要检索福建省所有具有研究生学历的人所对应的人事信息文件项目。则提交给系统的表达式为"福建省"∩"研究生"。系统根据该表达式首先计算"福建省"文件 项目集合的构成,属于该文件项目集合的文件项目有,系统中记录的直接归属于"福建省" 的文件项目和通过集合父子关系归属于"福建省"的文件项目集合中的文件项目,"漳州市", "厦门市"等"福建省"的下一级文件项目集合中的文件项目集合都在此范围内。系统再 按照同样方法计算出"研究生"文件项目集合。然后通过求"福建省"和"研究生"两个 文件项目集合的交集得到最终的结果文件项目集合。
值得指出的是,对于检索过程中用户指定结果文件项目集合的方式,最直接和最基本的 就是采用集合运算表达式。对于集合运算表达式不论其采用什么样外观的运算符,以及什 么样的语法结构,例如逆波兰式,所表达的集合运算实质不变。对于其他方式,比如采用 友好的图形界面接受用户的输入来指定集合间的运算关系,这些都可视为集合运算表达式 的等效。
以上介绍的归类和检索过程没有涉及到属性,下面介绍采用属性进行归类和检索的过程。在这里采用年龄这个属性作为例子。首先对于"年龄"这个文件项目集合赋予sge属 性取值范围设置为大于等于0。根据前面所讲的实体文件项目集合之间的父子关系和属性之 间的约束关系,"儿童","少年"等下一级文件项目集合也继承了 age这个属性,所以由用 户根据这些集合对应事实上的年龄范围设置这些文件项目集合age属性的范围,在这里设 置"儿童"age取值范围为0≤age<12,设置"少年"age取值范围为12≤age<18 ,设置"青年"age取值范围为18≤age<38,设置"中年"age取值范围为38 ≤age< 50 ,设 置"老年"age取值范围为50≤age。
带有属性的归类过程是对于某个具体人事信息文件项目,用户知道该人事文件记录的 人来自福建省漳州市,性别为男性,年龄为32岁,学历为硕士研究生。关于地区、性别、 学历依然按照其面的例子归类。对于年龄的归类首先指定具有age属性的最上级的文件项 目集合即"年龄",然后通过指定该文件项目的age属性取值32,系统根据这个取值将该文 件项目添加到"年龄"的下一级文件项目集合且sge取值范围能够包括上述文件项目的age
取值,在这里只有"青年"满足这个要求,其age属性取值范围为l8^。ge〈38。这里要指 出的是,以上这种过程以一种递归的方式进行,如果"青年"根据age取值进一步细分为 18《艰e < 25的文件项目集合和25 S ge < 38的文件项目集合,则该文件项目最终将被直接 添加到25 S age < 38的文件项目集合之中。带有属性的检索过程是例如,用户想要检索来自福建省,年龄为18-40岁的男性的人 事信息文件,采用表达式描述检索要求为"福建省"n("年龄"18SagW40)。系统接到检索 要求后,首先计算出"福建省"文件项目集合,再计算得到"年龄"文件项目集合,然后 再将"年龄"文件项目集合中不满足age属性值范围设定的文件项目滤除掉,再将这个文 件项目集合和"福建省"进行交集运算得到最终的结果文件项目集合。视图文件项目集在系统中的作用是起到简化用户输入的作用。当用户需要经常对某个特 定的文件项目集合组合模式进行检索的时候,可以将该模式的表达式和一个唯一的名称相 关联并由系统记录,建立一个视图文件项目集合,这样检索的时候将该视图文件项目集合 的名字提交给系统,系统会将其转换为其对应的组合模式进行计算得到结果文件项目集合。 例如,想要经常检索青年中具有大学学历的人事信息文件,则建立名为"青年一大学"的视 图文件项目集合,其关联模式表达式为"青年"n"大学"。视图文件项目集合也可以作为 运算集合再次参与集合组合,例如,在前面的基础上想要检索福建省的具有大学学历的青 年人的人事信息文件,可采用表达式"青年—大学"n"福建省"。根据所基于的平台和所采用的技术,系统存在多种实现方式。下面所介绍的是实现系统 的一个可行的方案。根据该方案系统主要构成见附图3。下面按照系统的工作流程介绍系统 各个组成单元及其功能。首先来看归类流程。归类流程开始于用户通过归类界面给出一组要进行归类的文件项目 以及这些文件项目和系统实体文件项目集合间的归属关系。归属关系可以由三种方式确定。 第一种是直接将文件项目标记为属于某个文件项目集合,第二种是通过设置属性和对应属 性值的方式,即将文件项目赋予要归类到的文件项目集合的所有属性并设置对应的属性值。 最后一种方式是前两种方式的结合,即通过直接标记的方式添加到某个文件项目集合,再 通过设置属性值的方式添加到另一个文件项目集合,值得注意的是一个文件项目对于同一 个文件项目集合只能按照标记或者设置属性其中之一的方式来添加到该文件项目集合。界 面将要归类文件项目和文件项目的属性设置信息及其归属关系传送给"文件项目集合存储 器",由该模块实现将这些信息写入"实体文件项目集合数据库"中。"实体文件项目集 合数据库"就是永久保存系统中实体文件项目集合组成和属性设置以及包含在其中的文件 项目属性值的装置。检索过程首先是由用户操纵检索界面提出检索请求,接着"检索界面"将用户的检索 请求转换为表达式传送给"表达式解析器"。"表达式解析器"通过解析表达式得出运算结 果集所需的实体文件项目集合和这些实体文件集合间的运算关系,它将对于实体文件项目 集合提交给"实体文件项目集合提取器",由该装置査询"实体文件项目集合数据库"得到 运算所需实体文件项目集合并传递给"集合运算器",同时"表达式解析器"将实体文件集合间的运算关系传递给"集合运算器",由该装置进行集合运算得到结果文件项目集合并传 递给"检索界面",由"检索界面"采用合适的方式呈现给用户。对于表达式中含有视图文 件项目集合的,系统将该视图文件项目集合的定义从"视图文件项目集合定义库"査出并 传送至"表达式解析器"解析。
权利要求
1.该方法是在计算机系统上实现的基于集合的文件项目的归类和检索方法,该方法包括归类过程,其特征在于通过直接指定或者是赋予属性并设置其对应属性值或者两者结合的方式建立文件项目与现有文件项目集合之间的归属关系;检索过程,其特征在于采用指定集合运算模式或者指定属性值范围或者两者结合的方式从现有文件项目集合得到结果文件项目集合。
2. 如权利l要求所述的方法,其特征还在于文件项目指的是一个文件在所处的文件系统 中唯一的标识。
3. 如权利2要求所述的方法,其特征还在于文件项目至少包括两类,一类是计算机操作 系统管理的文件系统中的文件的文件路径,另一类是采用WWW浏览器访问的网站页面的 亂。
4. 如权利l要求所述的方法,其特征在于文件项目集合是由"个不同文件项目组成的集 合,"为大于或等于0的整数,如果文件项目fl是文件项目集合J的组成单元则该文件 项目归属于该文件项目集合,反之如果文件项目a归属于文件项目集合^则该文件项目 "必是该文件项目集合^的组成单元。
5. 如权利4要求所述的方法,其特征还在于 一个文件项目在一个文件项目集合中最多只 能出现一次,但一个文件项目可以归属于多个不同的文件项目集合。
6. 如权利l要求所述的方法,其特征在于 一个文件项目可以被赋予/7个属性,对于赋予 的属性必须设置对应的属性值,刀为大于或等于0的整数。
7. 如权利l要求所述的方法,其特征在于 一个文件项目集合可以被赋予/7个属性,对于 赋予的属性必须设置对应的属性值范围,"为大于或等于0的整数。
8. 如权利7要求所述的方法,其特征在于 一个文件项目集合具有某种属性及对应属性值 范围,则归属于该文件项目集合必须具有该属性,且对应属性值在文件项目集合所设置 的该属性值范围内,但一个文件项目可以具有其归属的文件项目集合所不具备的属性。
9. 如权利l要求所述的方法,其特征还在于在采用该方法的系统中,现有文件项目集合 指的是实体文件项目集合,系统为其记录直接归属于该实体文件项目集合的文件项目以 及每个文件项目所具有的属性及对应的属性取值,系统还记录实体文件项目集合所直接 被赋予的属性及对应属性值范围和该实体文件项目集合与系统中其它实体文件项目集 合之间的直接父子关系。
10. 如权利9要求所述的方法,其特征还在于在采用该方法的系统中,若一个实体文件项 目集合是另一个实体文件项目的子集,则所有归属于前者的文件项目也归属于后者,并 且前者继承所有后者具有的所有属性,并且对应的属性值范围在前者对应的属性值范围 内。
11. 如权利10要求所述的方法,其特征还在于在采用该方法的系统中,父子关系是传递 的,即实体文件项目集合/!是实体文件项目集合5的子集,同时实体文件项目集合^是 实体文件项目集合C的子集,则实体文件项目集合^也是实体文件项目集合C的子集, 力和5的父子关系称为直接父子关系,/1和C的父子关系称为间接父子关系。
12. 如权利11要求所述的方法,其特征还在于在采用该方法的系统中,归属于一个实体 文件项目集合的文件项目有两类, 一类是直接归属于该文件项目集合的文件项目,另一 类是该实体文件项目集合所有子集包括直接子集和间接子集,所归属的所有文件项目。
13. 如权利1要求所述的方法,其特征还在于在采用该方法的系统中,对于一个文件项目 归类过程可以采用的第一种方式是指定该文件项目与系统中的/7个实体文件项目集合之 间的归属关系,"为大于0的整数。
14. 如权利1要求所述的方法,其特征还在于在采用该方法的系统中,对于一个文件项目 归类过程可以采用的第二种方式是首先赋予该文件项目的/7个属性并且设置对应属性 值,/^为大于0的整数,为每个属性指定一个具有该属性的实体文件项目集合,然后根据 该文件项目的该属性取值归属到包括前面所指定的具有该属性的实体文件项目集合及 其直接子集和间接子集范围内该属性取值范围最接近该文件项目该属性取值的历个实体 文件项目集合之中,历为大于或等于O的整数,并且这历个实体文件项目集合之间不存 在父子集关系。
15. 如权利1要求所述的方法,其特征还在于在采用该方法的系统中,对于一个文件项目 归类过程可以采用的第三种方式是直接指定该文件项目与系统中的历个实体文件项目集 合之间的归属关系和设置该文件项目的/7个属性值这两种方式的结合,岛"为大于O的 整数,但对同一个实体文件项目集合的归属只能采用直接指定其为所属实体文件项目集 合或者设置属性值中的一种方式来进行。
16. 如权利1要求所述的方法,其特征还在于在采用该方法的系统中,检索过程釆用的第 一种方式是通过指定结果文件项目集合的集合运算组合模式,由系统组合现有文件项目 集合得到结果文件项目集合;集合基本运算包括集合的自身运算、集合的交运算、集合 的并运算、集合的差运算,由这些基本集合运算组合成的集合运算均在本方法指定范围 之内。
17. 如权利1要求所述的方法,其特征还在于在采用该方法的系统中,检索过程采用的第 二种方式是对于一个实体文件项目集合指定其具有的"个属性的属性值范围,/7为大 于0且小于或等于该实体文件项目集合所具有的属性的数目的整数。
18. 如权利1要求所述的方法,其特征还在于在采用该方法的系统中,检索过程采用的第 三种方式是指定属性值和集合运算模式两种方式的结合,即可以首先通过指定一个实 体文件项目集合的"个属性及对应的属性取值范围来得到一个文件项目集合,"为大于 O的整数,再通过指定该文件项目集合和其它文件项目集合的集合运算关系,由这种方 式来确定结果文件项目集合。
19. 如权利1要求所述的方法,其特征还在于在采用该方法的系统中,在检索过程中,指 定结果文件项目集合的表达方式中最基本的方式就是运算表达式。
20. 如权利1要求所述的方法,其特征还在于在采用该方法的系统中,视图文件项目集合 为系统中其它文件项目集合的组合模式,系统采用运算表达式记录视图文件项目集合。2L如权利9、 20要求所述的方法,其特征还在于在采用该方法的系统中,每个文件项目 集合均有一个唯一的名称与之对应。
全文摘要
文件项目是一个文件在所处文件系统中唯一的标识。本发明采用集合的方式对文件项目进行归类和检索。系统构成见图3。系统的归类的过程是由用户指定文件项目与系统中若干实体文件项目集合的归属关系,由系统的“实体文件项目集合存储器”将这些指定存储到“实体文件项目集合数据库”之中。检索过程是由用户给出要检索的结果文件项目集合组合模式,由“检索界面”转换为表达式传送至“表达式解析器”,由该单元解析得到进行表达式运算所需的实体文件项目集合及之间运算关系,采用“实体文件项目集合提取器”提取出运算所需文件项目集合,并连同运算关系传送至“集合运算器”进行集合运算得出结果文件项目集合,由“检索界面”呈现给用户。
文档编号G06F17/30GK101158949SQ20071000923
公开日2008年4月9日 申请日期2007年7月20日 优先权日2007年7月20日
发明者文 时 申请人:文 时
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1