文档分类系统、文档分类方法及文档分类程序的制作方法

文档序号:6533188阅读:164来源:国知局
文档分类系统、文档分类方法及文档分类程序的制作方法
【专利摘要】本发明提供一种文档分类系统,对诉讼中用于作为证据提交收集的数字化的文档信息进行分析,然后分类以容易地用于诉讼。文档分类系统具有:抽取部,其从收集的文档信息中抽取所规定数量的文档;文档显示部,其将所述抽取的文档群显示在画面上;分类符号接受部,其接受用户根据与所述诉讼之间的关联性对所述显示的文档群赋予的分类符号;选定部,其根据所述分类符号,将所述抽取的文档群按分类符号分类,并解析所述被分类的文档群中共同出现的关键词并选定;数据库,其记录所述选定的关键词;搜索部,其从所述文档信息搜索所述数据库中记录的关键词;得分计算部,其利用所述搜索部的搜索结果和所述选定部的解析结果,计算出表示分类符号和文档之间的关联性的得分;自动分类部,其根据所述得分的结果自动赋予分类符号。
【专利说明】文档分类系统、文档分类方法及文档分类程序

【技术领域】
[0001] 本发明涉及一种文档分类系统、文档分类方法及文档分类程序,尤其是涉及与诉 讼相关文档信息的文档分类系统、文档分类方法及文档分类程序。

【背景技术】
[0002] 现有技术中,已提出一种在发生非法访问(illegal access)或机密信息泄露等与 计算机相关的犯罪或法律纠纷时,对原因查明或搜查所需的仪器、数据或电子记录进行收 集/分析,并明确其法律上的证据性的装置或技术。
[0003] 尤其在美国民事诉讼中,由于需要eDiscovery (电子证据公开)等,该诉讼的原告 及被告的任何一方均需要承担作为证据提交全部相关数字信息的义务。因此,必须将计算 机或服务器中所记录的数字信息作为证据提交。
[0004] 另一方面,由于随着IT业迅速发展及普及,在当今商务世界中几乎所有的信息均 由计算机制作,因此即使在同一企业内部,也充斥着大量的数字信息。
[0005] 因此,在为了向法庭提交证据材料而进行准备工作的过程中,容易产生在证据材 料中还包含了未必与该诉讼相关的机密数字信息的失误。存在提交与该诉讼无关的机密文 档?目息的问题。
[0006] 近几年来,在专利文献1?专利文献3中提出一种与取证系统的文档信息相关的 技术。在专利文献1中公开一种取证系统,从使用者信息中所包含的至少1人以上的使用 者中指定特定人,并根据与被指定的特定人相关的访问履历信息,仅抽取特定人所访问的 数字文档信息,并设定表示各所抽取的数字文档信息的文档文件是否与诉讼相关的附带信 息,并且根据附带信息,输出与诉讼相关的文档文件。
[0007] 另外,在专利文献2中公开一种取证系统,显示所记录的数字信息,对多个文档文 件的每一个设定表示是否与包含于使用者信息的使用者中任意的使用者相关的使用者特 定信息,并将该被设定的使用者特定信息记录在存储部中,而进行设定,并指定至少一个以 上的使用者,对设定有与所指定的使用者相对应的使用者特定信息的文档文件进行检索, 并借助显示部,设定表示所检索的文档文件是否与诉讼相关的附带信息,根据附带信息,输 出与诉讼相关的文档文件。
[0008] 另外,在专利文献3中公开一种取证系统,接受数字文档信息中所包含的至少一 个以上的文档文件的指定,并接受是否将所指定的文档文件翻译为任意一种语言的指定, 将接受所指定的文档文件翻译为接受指定的语言,从记录部所记录的数字文档信息抽取与 所指定的文档文件显示同一内容的共同文档文件,并生成翻译关联信息,该翻译关联信息 表示所抽取的共同的文档文件因引用被翻译的文档文件的翻译内容而被翻译,根据翻译关 联信息输出与诉讼相关的文档文件。
[0009] 专利文献1 :日本专利特开2011-209930号公报
[0010] 专利文献2 :日本专利特开2011-209931号公报
[0011] 专利文献3 :日本专利特开2012-32859号公报
[0012] 然而,例如专利文献1?3中所公开的取证系统,需要使用多台计算机及服务器以 收集使用者的庞大的文档信息。
[0013] 通过被称为查阅者的用户阅读确认,进行分辨将上述的数字化的庞大的文档信息 作为诉讼的证据材料是否合适的操作,必须对该文档信息逐个进行分辨,这样需要消耗大 量的人力。


【发明内容】

[0014] 有鉴于此,本发明提供一种文档分类系统、文档分类方法及文档分类程序,使在收 集数字化的文档信息后,通过对该文档信息自动赋予分类符号,能够减轻诉讼中对所使用 的文档信息分类作业的负担。
[0015] 本发明的文档辨别系统获取记录在多个计算机或服务器中的数字信息,并对该获 取的数字信息中所包含的文档信息进行分析,然后进行分类以易于在诉讼中使用,该文档 辨别系统具有:抽取部,其从所述文档信息中抽取作为数据组而包含规定数量文档的文档 群;文档显示部,其将所述抽取的文档群显示在画面上;分类符号接受部,其接受用户根据 与所述诉讼之间的关联性对所述显示的文档群赋予的分类符号;选定部,其根据所述分类 符号,按每个分类符号对所述抽取的文档群进行分类,解析并选定在该被分类的文档群中 共同出现的关键词;数据库,其记录所述被选定的关键词;搜索部,其从所述文档信息中搜 索记录在所述数据库中的关键词;得分计算部,其利用所述搜索部的搜索结果和所述选定 部的解析结果,计算表示分类符号和文档之间的关联性的得分;以及自动分类部,其根据所 述得分的结果自动赋予分类符号。
[0016] 在本发明中,"文档"是指包含1个以上关键词的数据。例如为电子邮件、企划案材 料、表计算材料、商洽材料、合同书、组织图、事业企划书等。
[0017] 在本发明中,在为某种语言下,"关键词"是指具有一定意义的语句的概括。例如, 在从"将文档分类"的文章选定关键词时,可选"文档"、"分类"为关键词。
[0018] 在本发明中,"分类符号"为将文档分类时使用的标识符。例如,诉讼中将文档信息 作为证据使用时,可根据证据的种类赋予分类符号。
[0019] "得分"是指,定量评价某个文档与特定的分类符号的联系的强度。例如,得分计算 部根据出现在文档群中的关键词和各关键词所拥有的权重计算得分。作为一个例子,该权 重根据拥有关键词的、每个分类符号的传递信息量决定。
[0020] 另外,本发明的文档辨别系统中,抽取部从文档信息中抽取文档群时,可进行随机 采样。
[0021] 本发明的文档辨别系统中,所述搜索部从由未被赋予所述分类符号的文档构成的 文档信息中搜索所述关键词,所述得分计算部利用所述搜索部的搜索结果和所述选定部的 解析结果,计算表示分类符号和文档之间关联性的得分,所述自动分类部具有抽取未由所 述分类符号接受部接受到赋予所述分类符号的文档,并对文档信息自动赋予分类符号的功 能。
[0022] 另外,本发明的文档分类系统中,所述数据库还具有抽取并记录与所述分类符号 具有关联性的关联用语的功能,所述搜索部还具有从所述文档信息中搜索所述关联用语的 功能,所述得分计算部还具有根据所述搜索部对所述关联用语进行搜索的结果计算得分的 功能,所述自动分类部还具有根据使用所述关联用语计算的得分自动赋予分类符号的功 能。
[0023] 另外,本发明的文档分类系统还具有文档排除部,其在文档群中的文档中,选定不 包含由所述选定部选定的所述关键词、所述关联用语及与所述分类符号有相关关系的关键 词的文档,并从所述自动分类部的分类对象中排除所述被选定的文档。
[0024] 本发明的文档分类系统还具有学习部,其根据所述选定部的分析结果和所述得分 计算部计算的得分,对由所述选定部选定的关键词、记录在所述数据库中的与分类符号有 相关关系的关键词及关联用语进行增减。
[0025] 本发明的文档分类方法其应用于获取记录在多个计算机或服务器中记录的数字 信息,并对该获取的数字信息中所包含的文档信息进行分析,然后分类以易于在诉讼中使 用的文档分类系统,从所述文档信息中抽取作为数据组而包含规定数量文档的文档群,将 所述抽取的文档群显示在画面上,接受用户根据与所述诉讼之间的关联性对所述显示的文 档群赋予的分类符号,根据所述分类符号,按每个分类符号对所述抽取的文档群进行分类, 解析并选定该被分类的文档群中共同出现的关键词,记录所述被选定的关键词,从所述文 档信息搜索所述被记录的关键词,利用所述搜索结果和所述解析结果,计算表示分类符号 和文档之间的关联性的得分,根据所述得分的结果自动赋予分类符号。
[0026] 本发明的文档分类程序其应用于获取记录在多个计算机或服务器中记录的数字 信息,并对该获取的数字信息中所包含的文档信息进行分析,然后分类以易于在诉讼中使 用的文档分类系统,使计算机中实现如下功能,从所述文档信息中抽取作为数据组而包含 规定数量文档的文档群,将所述抽取的文档群显示在画面上,接受用户根据与所述诉讼之 间的关联性对所述显示的文档群赋予的分类符号,根据所述分类符号,按每个分类符号对 所述抽取的文档群进行分类,解析并选定该被分类的文档群中共同出现的关键词,记录所 述被选定的关键词,从所述文档信息搜索所述被记录的关键词,利用所述搜索结果和所述 解析结果,计算表示分类符号和文档之间的关联性的得分,根据所述得分的结果自动赋予 分类符号。
[0027] 发明的效果
[0028] 本发明的文档辨别系统、文档辨别方法及文档辨别程序从所述文档信息中抽取作 为数据组而包含规定数量文档的文档群,将所述抽取的文档群显示在画面上,接受用户根 据与所述诉讼之间的关联性对所述显示的文档群赋予的分类符号,根据所述分类符号,按 每个分类符号对所述抽取的文档群进行分类,解析并选定该被分类的文档群中共同出现的 关键词,记录所述被选定的关键词,从所述文档信息搜索所述被记录的关键词,利用所述搜 索结果和所述解析结果,计算表示分类符号和文档之间的关联性的得分,根据所述得分的 结果自动赋予分类符号,由此,能够减轻查阅者分类作业的负担。
[0029] 另外,本发明的文档辨别系统中,所述搜索部从由未被赋予所述分类符号的文档 构成的文档信息中搜索所述关键词,所述得分计算部利用所述搜索部的搜索结果和所述选 定部的解析结果,计算表示分类符号和文档之间关联性的得分,所述自动分类部具有抽取 未由所述分类符号接受部接受到赋予所述分类符号的文档,并对文档信息自动赋予分类符 号的功能时,对于未由分类符号接受部接受赋予分类符号的文档信息,根据查阅者进行分 类的规则性,可自动赋予分类符号。
[0030] 另外,本发明还具有学习部,其根据所述选定部的分析结果和所述得分计算部计 算的得分,对由所述选定部选定的关键词、记录在所述数据库中的与分类符号有相关关系 的关键词及关联用语进行增减,这种情况下,每重复分类次数,都可提高分类精度。
[0031] 另外,本发明从所述文档信息中抽取作为数据组而包含规定数量文档的文档群, 将所述抽取的文档群显示在画面上,接受用户根据与所述诉讼之间的关联性对所述显示的 文档群赋予的分类符号,根据所述分类符号,按每个分类符号对所述抽取的文档群进行分 类,解析并选定该被分类的文档群中共同出现的关键词,记录所述被选定的关键词,从所述 文档信息搜索所述被记录的关键词,利用所述搜索结果和所述解析结果,计算表示分类符 号和文档之间的关联性的得分,根据所述得分的结果自动赋予分类符号,并在文档群的文 档中,选定不含与选定部所选定的关键词、关联用语及分类符号具有相关关系的关键词的 文档,而从自动分类部的分类对象排除被选定的文档,此时,可更高效的进行文档分类。由 此,在诉讼中容易使用所收集的数字信息。

【专利附图】

【附图说明】
[0032] 图1为本发明的第1实施方式的文档辨别系统的结构图;
[0033] 图2为本发明的实施方式的表示选定部的解析结果的坐标图;
[0034] 图3为本发明的实施方式的每个阶段处理的图表;
[0035] 图4为本发明的实施方式的数据库的处理流程的图表;
[0036] 图5为本发明的实施方式的搜索部的处理流程的图表;
[0037] 图6为本发明的实施方式的得分计算部的处理流程的图表;
[0038] 图7为本发明的实施方式的自动分类部的处理流程的图表;
[0039] 图8为本发明的实施方式的抽取部的处理流程的图表;
[0040] 图9为本发明的实施方式的文档显示部的处理流程的图表;
[0041] 图10为本发明的实施方式的分类符号接受部的处理流程的图表;
[0042] 图11为本发明的实施方式的选定部的处理流程的图表;
[0043] 图12为本发明的实施方式的文档排除部的处理流程的图表;
[0044] 图13为本发明的实施方式的学习部的处理流程的图表;
[0045] 图14为本发明的实施方式的文档显示画面。
[0046] 符号说明
[0047] 101文档分类装置
[0048] 102抽取部
[0049] 103文档显示部
[0050] 104分类符号接受部
[0051] 105选定部
[0052] 106搜索部
[0053] 107得分计算部
[0054] 108自动分类部
[0055] 109文档排除部
[0056] 110 学习部
[0057] 201数据库
[0058] 301 客户端
[0059] II 文档显示画面

【具体实施方式】 [0060] 第1实施方式
[0061] 下面,参照附图对本发明的实施方式进行说明。图1表示第1实施方式的文档辨 别系统的结构图。
[0062] 第1实施方式为,与专利侵权诉讼的文档提交指令相对应时,对与作为被指控产 品的产品A相关的文档进行分类处理情况的实施例。
[0063] 本发明的文档分类系统包括:抽取部102,其抽取文档信息中包含所规定数量文 档的数据组的文档群;文档显示部103,其将被抽取的文档群显示在画面上;分类符号接受 部104,其接受被称为查阅者的用户根据与诉讼的关联性对所显示的文档群赋予的分类符 号;选定部105,其根据分类符号,将抽取的文档群分类给每个分类符号,并在该被分类的 文档群中解析并选定共同出现的关键词;数据库201,用于记录所选定的关键词;搜索部 106,其从文档信息搜索记录在数据库201中的关键词;得分计算部107,其利用搜索部106 的搜索结果和选定部105的解析结果,计算出表示分类符号和文档的关联性的得分;自动 分类部108,其根据得分的结果,自动赋予分类符号;文档排除部109,其用于从自动分类部 108的分类对象中排除被选定的文档;学习部110,其根据选定部105的分析结果及得分计 算部计算出的得分,对由选定部105选定的关键词、与记录在数据库201中的分类符号具相 关关系的关键词及关联用语进行增减。
[0064] 在第1实施方式中,该文档分类系统包括文档分类装置101、数据库201及查阅者 使用的客户端301构成,其中,文档分类装置101具有抽取部102、文档显示部103、分类符 号接受部104、选定部105、搜索部106、得分计算部107、自动分类部108、文档排除部109和 学习部110。在1个文档辨别系统内,客户端301可具有多个。
[0065] 文档分类装置101及客户端301为计算机或服务器,其根据各种输入使CUP实施 ROM中记录的程序,进行作为各种功能部的动作。
[0066] 分类符号为将文档分类时使用的标识符。诉讼中将文档信息作为证据使用时,可 根据证据的种类赋予分类符号。第1实施方式中,分类符号为"无关"、"有关"和"重要"3 种符号,其中"无关"表示此次的诉讼中无举证能力的文档,"有关"表示需要作为证据提交 的文档,"重要"表示与产品A有着特别关系的文档,其中,对赋予"重要"符号的文档进行分 类。
[0067] 这里所述的文档是指,诉讼中作为证据提交的数字信息,是包含1个以上单词的 数据。例如为电子邮件、企划案材料、表计算材料、商洽材料、合同书、组织图、事业企划书 等。另外,可将扫描数据作为文档处理。这种情况下,可在文档辨别系统中设置OCR(光符 阅读器:〇ptical Character Reader)装置,以将扫描数据转换为文档数据。通过使用OCR 装置转换为文档数据,可从扫描数据中解析或搜索关键词及关联用语。
[0068] 例如,在第1实施方式中,对记载有与产品A相关的商谈内容的会议记录或电子邮 件等赋予"有关"符号,对产品A的研发企划书或设计书等赋予"重要"符号,对与产品A无 关的法院、地方定期召开的会议(日本语"定例会")等材料赋予"无关"符号。
[0069] 另外,在为某种语言下,关键词为具有一定意义的语句的概括。例如,在从"将文档 分类"的文章选定关键词时,可选"文档"、"分类"为关键词。在第1实施方式中,重点选择 "侵害"、"诉讼"或"专利公报〇〇号"为关键词。
[0070] 数据库201为在电子介质上记录数据的记录装置,可设置在文档分类装置101的 内部,例如也可作为储存装置设置在外部。
[0071] 文档分类装置101、数据库201及客户端301通过有线或无线的网络连接。也可使 用云计算的形式。
[0072] 数据库201记录各分类符号的关键词。另外,可事先登记能够根据以往的分类处 理的结果判断与产品A关联性高且若包含在文档中则可直接赋予"重要"符号的关键词。例 如像产品A的主要功能名称或"诉讼"、"警告"、"专利公报" 一类的关键词。另外,同样地, 也可以根据以往的分类处理的结果,抽取与如下所述文章群关联性高的一般用语,登记为 关联用语,其中该文章群因与产品A关联性高而被赋予"重要"符号。
[0073] 对于已登记于数据库201的关键词及关联用语,除了根据学习部110的学习结果 进行增减,还可以通过手动的方式进行追加登记及删除。
[0074] 抽取部102在从文档信息中抽取文档群时,可进行随机采样。在第1实施方式中, 随机抽取全部文档信息中两成(20%)文档,作为查阅者的分类对象。抽取部102从全部文 档信息抽取的文档的比例可自由设定。另外,可将抽取源的对象作为全部文档信息的一部 分。
[0075] 文档显示部103向客户端301提示如图14所示的文档显示画面II。文档显示画 面II,如图14所示,在中间显示作为分类对象的文档,并在左侧显示分类符号,而以该画面 结构在1个画面内显示分类对象的文档和要赋予的分类符号。其画面结构也可以使显示文 档的部位和显示分类符号的部位分别不同。
[0076] 在第1实施方式中,文档显示画面II中的分类符号1表示"无关"符号,分类符号 2表示"有关"符号,分类符号3表示"重要"符号。另外,在赋予"有关"符号的文档中,小 类1赋予与产品A的价格相关的文档,小类2赋予与产品A的开发计划相关的文档。在1 个分类符号中可具有多个小类,也可不具有。
[0077] 分类符号接受部104,对文档显示部103显示的文档信息中由查阅者观察确认并 逐个决定分类符号的文档,根据该决定赋予分类符号,从而可将该文档分类。可通过被赋予 的分类符号进行文档的分类。
[0078] 选定部105对由分类符号接受部104分类的文档信息进行解析,并对被赋予"无 关"、"有关"及"重要"的各分类符号的文档信息,选定共同频繁出现的关键词作为该分类符 号的关键词。
[0079] 图2是表不选定部105对被赋予"重要"符号的文档解析结果的图表。
[0080] 图2中,纵轴R_hot表示,由查阅者赋予"重要"符号的全部文档中,包含选定的关 键词作为附带在"重要"符号中的关键词,且表示被赋予"重要"符号的文档的比例。横轴 表示,查阅者实施分类处理的全部文档中,包含由选定部105选定的关键词的文档的比例。
[0081] 在第1实施方式中,选定部105可选定标识于直线R_hot = R_all上部的关键词 作为其分类符号的关键词。
[0082] 搜索部106具有从作为对象的文档中搜索特定的关键词的功能。搜索部106在搜 索包含由选定部105选定的关键词或由数据库201抽取的包含关联用语的文档时,由分类 符号接受部104未接受到赋予分类符号的文档构成的文档群为对象进行搜索。
[0083] 得分计算部107可根据文档群中出现的关键词和各关键词所拥有的权重,利用下 式计算得分。得分是指,定量评价某个文档与特定的分类符号的联系的强度。
[0084]

【权利要求】
1. 一种文档分类系统,其获取记录在多个计算机或服务器中的数字信息,并对该获取 的数字信息中所包含的文档信息进行分析,然后进行分类以易于在诉讼中使用,其特征在 于,具有: 抽取部,其从所述文档信息中抽取作为数据组而包含规定数量文档的文档群; 文档显示部,其将所述抽取的文档群显示在画面上; 分类符号接受部,其接受用户根据与所述诉讼之间的关联性对所述显示的文档群赋予 的分类符号; 选定部,其根据所述分类符号,按每个分类符号对所述抽取的文档群进行分类,解析并 选定在该被分类的文档群中共同出现的关键词; 数据库,其记录所述被选定的关键词; 搜索部,其从所述文档信息中搜索记录在所述数据库中的关键词; 得分计算部,其利用所述搜索部的搜索结果和所述选定部的解析结果,计算表示分类 符号和文档之间的关联性的得分;以及 自动分类部,其根据所述得分的结果自动赋予分类符号。
2. 根据权利要求1所述的文档分类系统,其特征在于, 所述得分计算部根据出现在所述文档群中的所述关键词和各关键词所拥有的权重计 算得分。
3. 根据权利要求1或2中任意一项所述的文档分类系统,其特征在于, 所述权重根据拥有所述关键词的、每个所述分类符号的传递信息量决定。
4. 根据权利要求1?3中任意一项所述的文档分类系统,其特征在于, 所述抽取部具有从所述文档信息中随机采样而抽取文档群的功能。
5. 根据权利要求1?4中任意一项所述的文档判别系统,其特征在于, 所述搜索部从由未被赋予所述分类符号的文档构成的文档信息中搜索所述关键词, 所述得分计算部利用所述搜索部的搜索结果和所述选定部的解析结果,计算表示分类 符号和文档之间关联性的得分, 所述自动分类部具有抽取未由所述分类符号接受部接受到赋予所述分类符号的文档, 并对文档信息自动赋予分类符号的功能。
6. 根据权利要求1所述的文档分类系统,其特征在于, 所述数据库还具有抽取并记录与所述分类符号具有关联性的关联用语的功能, 所述搜索部还具有从所述文档信息中搜索所述关联用语的功能, 所述得分计算部还具有根据所述搜索部对所述关联用语进行搜索的结果计算得分的 功能, 所述自动分类部还具有根据使用所述关联用语计算的得分自动赋予分类符号的功能。
7. 根据权利要求6所述的文档分类系统,其特征在于, 所述数据库还具有事先记录与所述分类符号有相关关系的关键词的功能, 所述自动分类部还具有在对所述文档群中包含与分类符号有相关关系的关键词的文 档进行搜索时,决定所述分类符号的功能。
8. 根据权利要求6或7所述的文档分类系统,其特征在于, 还具有文档排除部,其在所述文档群中的文档中,选定不包含由所述选定部选定的所 述关键词、所述关联用语及与所述分类符号有相关关系的关键词的文档,并从所述自动分 类部的分类对象中排除所述被选定的文档。
9. 根据权利要求6或7所述的文档分类系统,其特征在于, 还具有学习部,其根据所述选定部的分析结果和所述得分计算部计算的得分,对由所 述选定部选定的关键词、记录在所述数据库中的与分类符号有相关关系的关键词及关联用 语进行增减。
10. -种文档分类方法,其应用于获取记录在多个计算机或服务器中记录的数字信息, 并对该获取的数字信息中所包含的文档信息进行分析,然后分类以易于在诉讼中使用的文 档分类系统,其特征在于, 从所述文档信息中抽取作为数据组而包含规定数量文档的文档群, 将所述抽取的文档群显示在画面上, 接受用户根据与所述诉讼之间的关联性对所述显示的文档群赋予的分类符号, 根据所述分类符号,按每个分类符号对所述抽取的文档群进行分类,解析并选定该被 分类的文档群中共同出现的关键词, 记录所述被选定的关键词, 从所述文档信息搜索所述被记录的关键词, 利用所述搜索结果和所述解析结果,计算表示分类符号和文档之间的关联性的得分, 根据所述得分的结果自动赋予分类符号。
11. 一种文档分类程序,其应用于获取记录在多个计算机或服务器中记录的数字信息, 并对该获取的数字信息中所包含的文档信息进行分析,然后分类以易于在诉讼中使用的文 档分类系统,其特征在于, 使计算机中实现如下功能, 从所述文档信息中抽取作为数据组而包含规定数量文档的文档群, 将所述抽取的文档群显示在画面上, 接受用户根据与所述诉讼之间的关联性对所述显示的文档群赋予的分类符号, 根据所述分类符号,按每个分类符号对所述抽取的文档群进行分类,解析并选定该被 分类的文档群中共同出现的关键词, 记录所述被选定的关键词, 从所述文档信息搜索所述被记录的关键词, 利用所述搜索结果和所述解析结果,计算表示分类符号和文档之间的关联性的得分, 根据所述得分的结果自动赋予分类符号。
【文档编号】G06F17/30GK104160395SQ201380011864
【公开日】2014年11月19日 申请日期:2013年2月28日 优先权日:2012年2月29日
【发明者】守本正宏, 白井喜胜, 武田秀树, 莲子和巳 申请人:Ubic股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1