多维度多演算法的文件分类方法及系统的制作方法

文档序号:6574342阅读:273来源:国知局
专利名称:多维度多演算法的文件分类方法及系统的制作方法
技术领域
本发明系有关于一种文件分类方法及系统,且特别有关于一种可以将文件进行多维度分类的多维度多演算法的文件分类方法及系统。
然而,文件中其他被认为重要但相对上不是此文件显著重要的特征,则无法被分类出来。举例来说,由于文件的作者也许只出现一次,因此文件的作者无法被分类出来,或由于系统分析文件中所约略谈到的技术相对于分析来说,并不是最重要的文件特征,因此系统分析文件中所提出的技术也无法被分类出来。


图1为一示意图系显示一企业的原始文件的分类表100。分类表100中包括“作者”110、“文章类别”120、“需求分析方法”130及“应用领域”140等类别,且“作者”110、“文章类别”120、“需求分析方法”130及“应用领域”140类别中分别具有“员工A”111与“员工B”112、“需求规格”121与“设计规格”122、“SDG2分析”131与“USE CASE分析”132、及“型录服务”141与“供应链管理”142等类别细目。
假设一需求规格书中多次描述“型录服务”的需求规格,而作者“员工A”与“需求规格”只出现在封面过一次,且“需求分析方法”只出现在需求规格书中的需求分析方法段落中一次。在习知的单维度文件分类方法中,由于“型录服务”的特征远大于“员工A”、“需求规格”及“需求分析方法”,因此,此需求规格书经过分类之后,即为图2中所示,仅被分类至“应用领域”140类别中的“型录服务”141类别细目(以在类别细目“型录服务”前的圆圈中填黑表示)。
为了达成本发明的上述目的,可借由本发明所提供的多维度多演算法的文件分类方法来达成。
依据本发明实施例的一型态,首先,使用者设定一文件分类设定,其中文件分类设定包括复数个维度项目与分别相应每一维度项目的一分类演算法。之后,依据此文件分类设定,将文件进行分类,从而文件相应每一维度项目得到一至多个类别细目。
依据本发明实施例的另一型态,首先,接收一文件,并决定一分类程序码,其中分类程序码包括一文件分类设定,且文件分类设定包括复数个维度项目与分别相应每一维度项目的一分类演算法。最后,执行此分类程序码,将文件进行分类,从而文件相应每一维度项目得到一至多个类别细目。其中,将文件进行分类系将文件分别针对每一维度项目依据相应的分类演算法进行分类。
此外,本发明亦提出一多维度多演算法的文件分类系统。此文件分类系统包括一文件分类设定资料库、分类程序码产生器及文件分类单元。
文件分类设定资料库储存至少一文件分类设定,其中文件分类设定包括复数个维度项目与分别相应每一维度项目的一分类演算法。分类程序码产生器将文件分类设定转换为一分类程序码。文件分类单元则执行分类程序码,将文件进行分类,从而文件相应每一维度项目得到一至多个类别细目。
图2为显示一需求规格书经过分类后的相应分类表的情况示意图。
图3为显示依据本发明实施例的多维度多演算法的文件分类系统的系统架构示意图。
图4为显示依据本发明实施例的多维度多演算法的文件分类方法的操作流程的流程图。
图5为显示一需求规格书借由本发明实施例分类后的相应分类表的情况示意图。
依据本发明实施例的多维度多演算法的文件分类系统包括一范本资料库300、一文件分类设定资料库310、一分类程序码产生器320、及一文件分类单元330。
范本资料库300中可以储存许多不同类型文件的文件分类设定范本301。文件分类设定资料库310中可以储存多个文件分类设定311,其中文件分类设定范本301与文件分类设定311可以包括多个维度项目(类别)(图3中未显示)与分别相应每一维度项目的一分类演算法及其他相关参数等等(图3中未显示)。当使用者需要进行文件分类时,可以在文件分类设定资料库310中直接设定文件分类设定311,或是由范本资料库300中选取适合的文件分类设定范本301,或再进行修改设定成为文件分类设定311。
注意的是,使用者可以依照不同的维度项目的类型或是特性,设定不同的分类演算法,例如,若维度项目为“作者”110与“文章类别”120时可以设定其相应的分类演算法为辞典比对法,若维度项目为“需求分析方法”时可以设定其相应的分类演算法为统计方法,而若维度项目为“应用领域”时可以设定其相应的分类演算法为概念比对法。此外,其他相关参数系用以决定相应分类演算法的精确度。
分类程序码产生器320将使用者在文件分类设定资料库310中设定的文件分类设定311转换为一分类程序码321,其中,分类程序码321可以是一“MACRO”的批次程序集合(但不限定于此)。
文件分类单元330则可以接收多个文件340,并执行分类程序码产生器320所产生的分类程序码321,自动地将文件340进行分类,使得每一文件340相应每一维度项目可以得到相应的类别细目。
接下来,图4显示依据本发明实施例的多维度多演算法的文件分类方法的操作流程,同时参考图3与图4,本发明实施例的操作流程将说明于下。
首先,如步骤S400,文件分类单元330接收一份准备进行分类的文件340,此文件340可以是由使用者任意指定。接着,如步骤S402,使用者可以由范本资料库300中选择适合此文件340的文件分类设定范本301来进一步修改设定,或是直接在文件分类设定资料库310中设定适合此文件340的文件分类设定311。
当文件分类设定311设定完成之后,如步骤S404,分类程序码产生器320将此文件分类设定311转换为分类程序码321。最后,如步骤S406,文件分类单元330执行此分类程序码321,将文件340进行分类,使得文件340相应文件分类设定311中的每一维度项目都可以得到相应的类别细目。
相同地,步骤S402中设定文件分类设定311包括了设定多个维度项目(类别)与分别相应每一维度项目的一分类演算法及其他相关参数等等。此外,步骤S406中将文件340进行分类系将文件340分别针对每一维度项目依据相应的分类演算法进行分类。
注意的是,步骤S404中将文件分类设定311转换为分类程序码321的主要目的为提升大量类似文件进行分类时的自动化需求,当有大量的类似文件需要进行分类时,使用者可以仅需要设定一次文件分类设定311,且执行相同的分类程序码321来进行分类即可。而若不需考虑大量文件的情形下,则亦不需将文件分类设定311转换为分类程序码321,而直接依据文件分类设定311将文件进行分类即可。
相同地,假设一需求规格书中多次描述“型录服务”的需求规格,而作者“员工A”与“需求规格”只出现在封面过一次,且“需求分析方法”只出现在需求规格书中的需求分析方法段落中一次。图5为一示意图系显示此需求规格书借由本发明实施例的分类后的相应分类表的情况。由图5中可知,需求规格书经过分类之后,被分类至“作者”110类别中的“员工A”111、“文章类别”120类别中的“需求规格”121、“需求分析方法”130类别中的“SDG2分析”131、以及“应用领域”140类别中的“型录服务”141类别细目。相较于图2,图5中的“作者”110、“文章类别”120、“需求分析方法”130及“应用领域”140等类别分别代表一维度项目,可以分别独立地进行分类。
因此,借由本发明所提出的多维度多演算法的文件分类方法及系统,使用者可以依据不同的文件性质设定多个分类维度与相应的分类演算法,从而将文件进行多维度分类,而不至于丧失一些重要但非最明显的特征。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,任何熟悉此项技艺者,在不脱离本发明的精神和范围内,当可做些许更动与润饰,因此本发明的保护范围当由权利要求书所界定。
权利要求
1.一种多维度多演算法的文件分类方法,其特征在于,该方法包括下列步骤设定一文件分类设定,其中该文件分类设定包括复数维度项目与分别相应每一该等维度项目的一分类演算法;以及依据该文件分类设定,将一文件进行分类,从而该文件相应每一该等维度项目得到一至多个类别细目。
2.如权利要求1所述的一种多维度多演算法的文件分类方法,其特征在于,将该文件进行分类系将该文件分别针对每一该等维度项目依据相应的该分类演算法进行分类。
3.如权利要求1所述的一种多维度多演算法的文件分类方法,其特征在于,该分类设定更包括分别相应每一该等维度项目的一参数,用以决定该分类演算法的精确度。
4.如权利要求1所述的一种多维度多演算法的文件分类方法,其特征在于,更包括将该文件分类设定转换为一分类程序码,用以当执行该分类程序码时自动将一第二文件进行分类。
5.一种多维度多演算法的文件分类方法,其特征在于,该方法包括下列步骤接收一文件;决定一分类程序码,其中该分类程序码系由一文件分类设定转换而成,且该文件分类设定包括复数维度项目与分别相应每一该等维度项目的一分类演算法;以及执行该分类程序码,将该文件进行分类,从而该文件相应每一该等维度项目得到一至多个类别细目。
6.如权利要求5项所述的一种多维度多演算法的文件分类方法,其特征在于,将该文件进行分类系将该文件分别针对每一该等维度项目依据相应的该分类演算法进行分类。
7.如权利要求5项所述的一种多维度多演算法的文件分类方法,其特征在于,该分类设定更包括分别相应每一该等维度项目的一参数,用以决定该分类演算法的精确度。
8.一种多维度多演算法的文件分类系统,其特征在于,包括一文件分类设定资料库,储存至少一文件分类设定,其中该文件分类设定包括复数维度项目与分别相应每一该等维度项目的一分类演算法;一分类程序码产生器,用以将该文件分类设定转换为一分类程序码;以及一文件分类单元,用以接收一文件,并执行该分类程序码,将该文件进行分类,从而该文件相应每一该等维度项目得到一至多个类别细目。
9.如权利要求8所述的一种多维度多演算法的文件分类系统,其特征在于,该文件分类单元将该文件进行分类系将该文件分别针对每一该等维度项目依据相应的该分类演算法进行分类。
10.如权利要求8所述的一种多维度多演算法的文件分类系统,其特征在于,该分类设定更包括分别相应每一该等维度项目的一参数,用以决定该分类演算法的精确度。
全文摘要
一种多维度多演算法的文件分类方法,设定一文件分类设定,其中该文件分类设定包括复数维度项目与分别相应每一该等维度项目的一分类演算法,依据该文件分类设定,将一文件进行分类;接收一文件,决定一分类程序码,其中该分类程序码系由一文件分类设定转换而成,执行该分类程序码,将该文件进行分类。一种多维度多演算法的文件分类系统,包括一文件分类设定资料库、分类程序码产生器及文件分类单元。文件分类设定资料库储存至少一文件分类设定。分类程序码产生器将文件分类设定转换为一分类程序码。文件分类单元则执行分类程序码,将文件进行分类,从而文件相应每一维度项目得到一至多个类别细目。
文档编号G06F17/22GK1430161SQ0114508
公开日2003年7月16日 申请日期2001年12月29日 优先权日2001年12月29日
发明者施信德, 陈文鋕, 李汉超 申请人:财团法人资讯工业策进会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1