应用于操作系统的文件分类管理系统及方法

文档序号:6552900阅读:186来源:国知局
专利名称:应用于操作系统的文件分类管理系统及方法
技术领域
本发明涉及一种应用于操作系统的文件分类管理系统及文件分类管理方法,尤其涉及一种对现有的操作系统的文件系统中的物理文件进行分类管理的文件分类管理系统及文件分类管理方法。
随着计算机及因特网的迅速普及,人们开始利用计算机来管理各种各样的文件。另外,通过因特网查找和下载所感兴趣的信息资源也成为越来越多的人所感兴趣的事情。
众所周知,信息通常是以各种各样的文件形式存储在计算机中。而现有的对文件进行管理的操作系统通常按照目录树的形式对文件进行管理,其中与一个应用相关的所有文件都被放在系统或用户为该应用所建立的目录之下。例如在Windows操作系统之下,系统把Windows操作系统文件均放在“Windows”目录之下。而用户可能将自己的所有文件放在自己在计算机上所建立的目录,例如“Mydocuments”之下。在存储大量信息的文件服务器中,大量的各种各样的文件也是按照目录树的方式被操作员人为分别放到不同的目录之下。
在采用这种方式对文件进行管理的过程中,尤其是在存储的文件很多的情况下,用户在搜索涉及某个具体主题的文件时是比较费时的,要么他应该知道这些文件的具体内容,要么他就不得不在成千上万的文件中一个个地进行查找,而后者的作法,在现今的信息爆炸的时代中基本上是不可行的。
本发明就是为克服现有技术的上述问题而提出的,其目的在于提供一种应用于操作系统的文件分类管理系统,从而可以根据文件所涉及的内容对文件进行管理。
本发明另一个目的是提供一种应用于操作系统的文件分类管理方法,用于根据文件内容对文件进行分类管理。
本发明又一个目的是提供一种根据文件的内容对文件进行分类的设备和方法。
本发明再一个目的是提供一种对文件进行分类浏览管理的操作系统桌面文件资源管理器和浏览管理方法。
本发明再一个目的是提供一种用于添加新的文件分类类别及分类标准的文件分类添加器和分类添加方法。
为了实现上述目的,本发明提供一种应用于操作系统的文件分类管理系统,所述文件管理系统用于对文件进行分类管理,其特征在于该文件分类管理系统根据文件的内容将物理存储的文件分别映射到一个或多个逻辑类别之下进行管理。
根据本发明提供的应用于操作系统的文件分类管理系统包括文件分类设备,用于按照文件的内容对文件进行分类;分类器,用于存放与各逻辑类别对应的分类标准以在对文件进行分类时进行参照;文件分类映射数据库,用于存放文件分类结果。
根据本发明提供的文件分类设备包括文件信息抽取装置,用于从一个待分类的文件中抽取关于文件类型及相关文件内容的信息;文件信息分析装置,用于将所述抽取出的信息进行分析;文件分类装置,用于将分析结果提供给分类器,并将分类器对文件与各逻辑类别进行匹配后找出的一个或多个最优的匹配结果存放到文件分类映射数据库。
根据本发明提供的应用于操作系统的文件分类管理系统还包括一个操作系统桌面文件资源管理器,其中该操作系统桌面文件资源管理器以树的形式显示各类别及各类别之下的各文件信息。
根据本发明的应用于操作系统的文件分类管理系统还包括一个分类添加器,用于添加新的类别及与该类别对应的分类标准。
本发明还提供一种应用于操作系统的文件分类管理方法,所述文件管理方法用于对文件进行分类管理,其特征在于根据文件的内容将物理存储的文件分别映射到一个或多个逻辑类别之下进行管理。
根据本发明的文件分类管理方法包括对文件进行分类的步骤,用于根据文件的内容对文件进行分类。
根据本发明的文件分类步骤包括如下子步骤从一个待分类的文件中抽取关于文件类型及相关文件内容的信息;将所述抽取出的信息进行分析;将分析结果按照预先存储的关于分类的标准与各逻辑类别进行匹配,找出一个或多个最优的匹配结果,并将该分类结果存储到一个文件分类映射数据库中。
根据本发明的文件分类管理方法进一步包括应用于操作系统中对文件进行桌面分类浏览管理的步骤,用于以树的形式显示各类别及各类别之下的各文件信息。
根据本发明的文件分类管理方法还包括一个分类添加步骤,用于添加新的类别及与该类别对应的分类标准。
通过本发明的应用于操作系统的文件分类管理系统和方法,通过将文件按照其内容所涉及的主题进行分类管理和显示,使得用户可以直接选择自己感兴趣的主题进行浏览。从而使得人机界面更为友好。
下面将参考附图对本发明的优选实施例进行详细描述。


图1是根据本发明的应用于操作系统的文件分类管理系统的概念图。
图2是根据本发明一个优选实施例的应用于操作系统的文件分类管理系统的结构方框图。
图3是根据本发明的进行文件分类的流程图。
图4是根据本发明的操作系统桌面文件资源管理器进行文件分类显示的示意图。
图5是根据本发明的操作系统桌面文件资源管理器进行文件分类显示的另一个示意图。
如图1所示,该图示出根据本发明的应用于操作系统的文件分类管理系统的概念模式图。其中,本发明的应用于操作系统的文件分类管理系统102对计算机等电子设备中物理存储的文件系统101中的所有文件,根据其内容进行分类,从而将这些文件分别映射到各个类别1~类别n中。这种映射,也即分类的方法将在以后详细描述。通过该概念模式图可以容易地看出,本发明的文件分类管理系统实际上起到了用户和物理文件之间接口的作用,通过这种逻辑接口,直接呈现给用户的是在逻辑类别之下的各个文件。从而用户通过各种分类,直接查找到所有自己感兴趣的所有文件,大大地提高了文件管理系统的易用性能,使得人机接口十分友好,方便用户使用。
为了实现图1所示的文件分类管理系统,下面将参考图2至图5描述该文件分类管理系统的主要构成及其功能。
图2是根据本发明一个优选实施例的文件分类管理系统的主要构成的方框图。
该文件分类管理系统2包括用于对文件进行分类的文件分类设备200;文件分类映射数据库300,用于存放文件分类设备200对文件进行分类后的分类结果;操作系统桌面文件资源管理器400,用于按照文件内容分类显示各文件;分类器505,用于存放与各类别对应的各分类标准,在文件分类设备200工作时进行参考;分类添加器500,在需要时用于添加新的分类及分类标准;如图2所示,物理文件数据库100是现有的物理文件系统,用于存储个人计算机或服务器上大量的物理文件。本领域技术人员将能够理解,在现有的操作系统下管理的所有文件均可认为存放在该物理文件数据库100中。
根据本发明的文件分类设备200包括如下装置文件信息抽取装置202,该文件信息抽取装置202用于从物理文件数据库100中存放的待分类的文件中抽取文本信息,由于物理文件可能采用各种文件类型,例如.doc,.pdf,.lwp,.zip等等,因而为了以后进行分类时更精确,该文件信息抽取装置202将首先检测待分类文件的文件类型,然后根据各不同的文件格式从原始文件中抽取相应的文本信息。
文件信息分析装置203,用于将从文件信息抽取装置202中抽取出的文本信息分离成便于以后进行分类所需的小的信息块。在本发明的实施例中,由于要使用后述的基于统计的方法的分类器将文件进行分类,因而文件信息分析装置203将文本信息进一步分离成各独立的单词,并然后统计出关键词出现的频率,并将统计结果暂时存储起来。当然,对于本领域技术人员来讲,文件信息分析装置203的功能可以根据在进行文件分类时所使用的分类器进行灵活设计,例如,如果分类器是根据文件结构信息设定的,那么文件信息分析装置203所抽取的信息与基于统计的方法时所抽取的信息将有所不同,这一点对于本领域技术人员来讲是很容易理解。
文件信息分类装置204,将文件信息分析装置203的分析结果提供给分类器505,分类器505按照预先存储的分类标准将文件与各逻辑类别进行匹配,找出一个或多个最优匹配结果,将待分类的文件分配到相应的类别之下,然后文件信息分类装置204将作为匹配结果的该文件的文件名及其所属的类别存储在文件分类映射数据库300中,当然为了方便用户查看,还可以同时存储文件的其它属性信息例如,最后更新时间,文件类型,文件大小等等。当然,为了提高处理速度减少处理负担从而提高性能,还可以提供一个二级数据库,用于暂时存放对文件分类映射数据库300进行更新和增加的少量操作结果,并在特定的定时将二级数据库的内容插入文件分类映射数据库300。对于本领域的技术人员来讲,很容易实现这种改进,因而不再描述。
图3是根据本发明的文件分类设备进行文件分类的流程图。
如图所示,在步骤S1,当存在有待分类的文件时,首先文件信息抽取装置202从待分类的文件中抽取信息。
然后,在步骤S2,文件信息分析装置203将抽取的信息分析为适合于进行分类的小信息块,在本发明优先实施例中,是将抽取的信息进一步分离成单词,找出关键词,统计关键词的出现频率。
在步骤S3,文件信息分类装置204将在步骤S2中所得到的分析结果提供给分类器505,分类器505按照预先存储的分类标准将文件与各逻辑类别进行匹配,找出一个或多个最优匹配结果,将待分类的文件分配到相应的类别之下,然后在步骤S4,文件信息分类装置204将作为匹配结果的该文件的文件名及其所属的类别存储在文件分类映射数据库300中。
在步骤S5,判断是否还有未分类的文件,如果有则返回步骤S1继续处理,否则结束进行文件分类的处理。
在文件分类设备200对物理文件数据库100中的文件进行分类并将分类结果存放到文件分类映射数据库300中之后,操作系统桌面文件资源管理器400可以根据文件分类映射数据库300中的内容以树型的结构显示文件分类映射数据库300中所涉及的各类别及各类别之下的子类别,并且当用户选中一个类别时以列表的形式显示该类别下的所有文件信息。
当然本领域的技术人员将能够理解,文件分类设备200也可以在操作系统桌面文件资源管理器400对文件进行浏览的同时实时地对文件进行分类处理。
图4是根据本发明的操作系统桌面文件资源管理器400进行文件分类显示的示意图,其中该操作系统桌面文件资源管理器400按照树型的结构显示上述文件分类映射数据库中存储的类别信息及各类别下的文件信息。如图4左半部分所示,操作系统桌面文件资源管理器400以树型的结构显示文件分类映射数据库中的各大类,即类别1、类别2、类别3…类别n,并且以树型的结构显示各大类之下的子类别,例如类别1下的子类别11、子类别12、子类别13…。当然各子类别之下还可能存在更多的子类别,该图未详尽示出。
图4的右半部分是显示当类别2被选中后,操作系统桌面文件资源管理器400将类别2下的子类别21、22、23及文件1、文件2…文件n以列表的形式显示出来的示意图。
图5示出当子类别21被选中后,操作系统桌面文件资源管理器400所显示的该子类别21下的所有文件信息。
从图4和图5的示意图可以清楚地看出,本发明的操作系统桌面文件资源管理器通过将文件按照其内容所涉及的主题进行分类显示,使得用户可以直接选择自己感兴趣的主题进行浏览。从而使得人机界面更为友好。
另外,关于分类器505,前面已经描述,可以根据需要建立多种进行分类时所使用的分类标准。在本发明的优选实施例中,使用了基于统计分类算法的分类标准。该统计分类算法的基本原理是,首先设定统计分类标准模型及分类判决函数,其中该分类判决函数的参数值待定。然后对带有类别标记的文件样本进行统计分析,该统计分析的对象包括统计样本中出现的关键字及其在样本集合中出现的频率等,并利用这些信息对分类判决函数的各参数按照某种原则(例如分类错误率最小)进行调整,最终得到该类别的分类标准,包括各关键词对分类的权重等。当对未知类别的文件进行分类时,计算分类判决函数,当其值大于判决阈值时,则将该文件判为属于该类别,否则判定为不属于该类别。
另外,在本发明的另一个优选实施例中,由基于规则的方法设定分类标准。其中该规则可以是人为设定的分类标准,也可以是基于机器学习的分类标准。在对文件进行分类的时候,通过用这些规则规定的判定标准进行判断,来确定将文件分类到什么类别之下。
此外,用户可以根据需要在文件管理系统中添加新的分类,这可以通过根据本发明提供的一个分类添加器500将新的分类标准添加到分类器505中来实现。具体地说,在采用统计分类算法的优选实施例中,当用户希望添加一个新的分类时,例如当用户希望将“旅游”这个主题作为一个类别,从而在以后一旦出现涉及“旅游”主题的文件,就将其分类到“旅游”主题之下时。用户仅需向分类添加器提供若干个均涉及“旅游”主题的文件,然后分类添加器将基于统计分类算法对该分类进行训练,并将训练结果作为具体的分类标准添加到分类器505中。
当然,本领域技术人员应该理解,基于不同的分类器505,可以对分类添加器500的功能进行灵活设计。
例如在对由人为地设定各分类及各分类标准的方法来实现分类器505的优选实施例中,分类添加器500的实现就比较简单,即只要人为地设定新的分类及编制新的分类标准即可。
再例如,在对由机器学习的方法设定各分类及各分类标准的方法来实现分类器505的优选实施例中,分类添加器500的实现就较为复杂,这时要通过机器学习的方法设定新的分类及新的分类标准。
这样根据本发明的文件管理系统具有学习的功能,从而使得用户可以根据需要设定新的类别。
本发明的应用于操作系统的文件分类管理系统通过将已经存在的各物理文件按照其内容涉及的主题逻辑地映射到不同的类别之下,向用户呈现逻辑类别下的各文件,为用户提供一个管理文件的良好方法。本发明尤其适用于存储了大量文件的文件服务器。
另外,本领域的技术人员将能够理解,根据本发明的分类方法将物理文件进行映射时可能会将一个物理文件映射到两个以上的类别之下。从而使得在进行检索时可以从多个角度为用户提供尽可能全面的资源。
此外,在对文件进行分类时,可以按照本发明的分类方法,由本发明的分类设备自动进行分类。另外,用户自己可以人为地将文件分类到各类别之下。本领域的技术人员当然可以理解,在本发明的优选实施例的基础上可以添加一个选择装置来提示用户进行系统自动分类或人工分类,因此省略其说明。
另外,本领域的技术人员当然可以理解,根据本发明进行的分类可以是多层分类,即在涉及一个主题的主类别之下可以有多层涉及更详细的主题的子类别。
本发明已经根据具体的实施例和附图进行了详细描述,但这些描述并非用于限制本发明。在不偏离本发明的精神和范围内,可以对其进行修改和改进
权利要求
1.一种应用于操作系统的文件分类管理系统,所述文件分类管理系统用于对文件进行分类管理,其特征在于该文件分类管理系统根据文件的内容将物理存储的文件分别映射到一个或多个逻辑类别之下进行管理。
2.根据权利要求1所述的文件分类管理系统,其特征在于该系统包括文件分类设备,用于按照文件的内容对文件进行分类;分类器,用于存放与各逻辑类别对应的分类标准,在文件分类设备对文件进行分类时进行参照;文件分类映射数据库,用于存放文件分类结果。
3.根据权利要求2所述的文件分类管理系统,其特征在于该文件分类设备包括文件信息抽取装置,用于从一个待分类的文件中抽取关于文件类型及相关文件内容的信息;文件信息分析装置,用于将所述抽取出的信息进行分析;文件分类装置,用于将分析结果提供给分类器,将分类器对文件与各逻辑类别进行匹配后找出的一个或多个最优的匹配结果存放到文件分类映射数据库中。
4.根据权利要求1-3任一项所述的文件分类管理系统,其特征在于该文件分类管理系统还包括一个操作系统桌面文件资源管理器,其中该操作系统桌面文件资源管理器以树的形式显示各类别及各类别之下的各文件信息。
5.根据权利要求4所述的文件分类管理系统,其特征在于所述文件信息包括文件名。
6.根据权利要求5所述的文件分类管理系统,其特征在于所述文件信息进一步包括文件类型,文件大小,文件最后更新日期中的至少一个信息。
7.根据权利要求1所述的文件分类管理系统,其特征在于该系统包括一个选择装置,当选择进行人工分类时,人工地将待分类的文件分类到一个或多个逻辑类别之下,当选择进行自动分类时,由权利要求2-6任一项所述中的文件分类装置进行分类。
8.根据权利要求7所述的文件分类管理系统,其特征在于所述分类器使用基于统计的方法设定的分类标准。
9.根据权利要求7所述的文件分类管理系统,其特征在于所述分类器使用基于规则的方法设定的分类标准。
10.根据权利要求9所述的文件分类管理系统,其特征在于所述规则是人为设定的分类规则。
11.根据权利要求9所述的文件分类管理系统,其特征在于所述规则是基于机器学习的分类规则。
12.根据权利要求1-11任一项所述的文件分类管理系统,其特征在于所述类别是多层分类的类别。
13.根据权利要求1-6任一项所述的文件分类管理系统,其特征在于该文件分类管理系统还包括一个分类添加器,用于添加新的类别及与该类别对应的分类标准。
14.根据权利要求13所述的文件分类管理系统,其特征在于所述分类添加器使用基于统计的方法添加新的分类标准。
15.根据权利要求13所述的文件分类管理系统,其特征在于所述分类添加器使用基于规则的方法添加新的分类标准。
16.根据权利要求15所述的文件分类管理系统,其特征在于所述规则是人为设定的分类规则。
17.根据权利要求15所述的文件分类管理系统,其特征在于所述规则是基于机器学习的分类规则。
18.一种应用于操作系统的文件分类管理方法,所述文件管理方法用于对文件进行分类管理,其特征在于根据文件的内容将物理存储的文件分别映射到一个或多个逻辑类别之下进行管理。
19.根据权利要求18所述的文件分类管理方法,其特征在于包括对文件进行分类的步骤,用于根据文件的内容对文件进行分类。
20.根据权利要求19所述的文件分类管理方法,该文件分类步骤包括如下子步骤从一个待分类的文件中抽取关于文件类型及相关文件内容的信息;将所述抽取出的信息进行分析;将分析结果按照预先存储的关于分类的标准与各逻辑类别进行匹配,找出一个或多个最优的匹配结果,并将该分类结果存储到一个文件分类映射数据库中。
21.根据权利要求18-20任一项所述的文件分类管理方法,其特征在于该文件分类管理方法进一步包括对文件进行分类浏览管理的步骤,用于以树的形式显示各类别及各类别之下的各文件信息。
22.根据权利要求21所述的文件分类管理方法,其特征在于所述文件信息包括文件名。
23.根据权利要求22所述的文件分类管理方法,其特征在于所述文件信息进一步包括文件类型,文件大小,文件最后更新日期中的至少一个信息。
24.根据权利要求18所述的文件分类管理方法,其特征在于还包括一个选择步骤,当选择进行人工分类时,人工地将待分类的文件分类到一个或多个逻辑类别之下,当选择进行自动分类时,由权利要求19-23任一项所述中的文件分类步骤进行分类。
25.根据权利要求24所述的文件分类管理方法,其特征在于所述分类步骤使用基于统计的方法设定的分类标准。
26.根据权利要求24所述的文件分类管理方法,其特征在于所述分类步骤使用基于规则的方法设定的分类标准。
27.根据权利要求26所述的文件分类管理方法,其特征在于所述规则是人为设定的分类规则。
28.根据权利要求26所述的文件分类管理方法,其特征在于所述规则是基于机器学习的分类规则。
29.根据权利要求18-28任一项所述的文件分类管理方法,其特征在于所述类别是多层分类的类别。
30.根据权利要求18-23任一项所述的文件分类管理方法,其特征在于所述文件分类管理方法还包括一个分类添加步骤,用于添加新的类别及与该类别对应的分类标准。
31.根据权利要求30所述的文件分类管理方法,其特征在于所述分类添加步骤使用基于统计的方法添加新的标准。
32.根据权利要求30所述的文件分类管理方法,其特征在于所述分类添加步骤使用基于规则的方法添加新的标准。
33.根据权利要求32所述的文件分类管理方法,其特征在于所述规则是人为设定的分类规则。
34.根据权利要求32所述的文件分类管理方法,其特征在于所述规则是基于机器学习的分类规则。
全文摘要
本发明提供一种应用于操作系统的文件分类管理系统和方法,用于对文件进行分类管理。该文件分类管理系统根据文件的内容将物理存储的文件分别映射到一个或多个逻辑类别之下进行管理。并且通过一个操作系统桌面文件资源管理器向用户呈现各逻辑类别下的文件。这样用户不用与成千上万个文件直接打交道,而是通过各种分类,直接查找到所有自己感兴趣的所有文件,从而大大地提高了文件管理系统的易用性能,使得人机接口十分友好,方便用户使用。
文档编号G06F17/30GK1378158SQ01112130
公开日2002年11月6日 申请日期2001年3月29日 优先权日2001年3月29日
发明者张俐, 杨力平, 潘越, 刘 东 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1