制作知识地图的方法

文档序号:6378608阅读:1281来源:国知局
专利名称:制作知识地图的方法
技术领域
本发明是关于一种制作知识地图的方法,尤指一种制作广度与深度可供调整的知识地图的方法。
背景技术
知识地图(Knowledge Map)是一个广泛运用于知识经济与知识管理的工具。知识地图包括知识与地图两部分,其中知识是加值过的数据与信息,地图则是知识内容的可视化与图表化呈现模式。关于知识地 图的现有技术,中国台湾专利公开号200523782揭露了一种知识地图,该知识地图的概念是利用线条和图形来表现计划元素间的关系,而表现方式也则以环状图呈现。然而对于文章撰写工作者如记者来说,有兴趣的是不同词汇间连结的关系,通过了解不同词汇间连结的关系有利于新闻文章的撰写,因此该知识地图并无法一个以特定字符串的关联词数据库中进行查询,也无法提供一个以特定字符串相关的关联词网。另外,中国台湾专利公告号520484是使用一个图形接口树组件显示对象间的逻辑关联性,该树形图仅呈现上下关系,并无法呈现深度与广度,使用者也无法自行调整深度或广度的参数值,以呈现客制化的知识地图。职是之故,发明人鉴于现有技术的缺失,乃经悉心试验与研究,并一本锲而不舍的精神,发明出本发明“制作知识地图的方法”,以下为本发明的简要说明。

发明内容
本发明是提供一种知识地图的制作方法,其特征在于使用者输入字符串时,再透过一个以特定字符串的关联词数据库来进行查询,以提供一个以特定字符串相关的关联词网。关联词网的产生在网络的深度与广度是由系统就关联词的重要性依比率原则自动筛选。本发明的一面向是提供一种制作知识地图的方法。该知识地图包含词汇(t)以及多个关联词汇,而该方法包含下列步骤:建立词汇关联知识集Kt,Si,Wi) |i=l,…,n},其中Si代表与该词汇配对的关联词汇,Wi代表(t,Si)的权重;提供使用者接口,以供查询该词汇;从该词汇关联知识集筛选出多个关联词汇共现配对;将该等关联词汇共现配对依K-means演算法分成多个群组;输出该知识地图,该知识地图以该词汇为中心,该等关联词汇以该等群组呈现;以及调整该知识地图的多个参数。词汇共现配对的意涵指任一分句中任两中文词的组合,假设分句有η个中文词(Wi I i=l,..., η },则任两中文词的词汇共现配对以((Wi, W」)I i < j且i, j=l,…,η }表示。例如“发生跳票挤兑”分句,有三个中文词分别为“发生”、“跳票”、“挤兑”,则该分句的词汇共现配对包括(发生,跳票)、(发生,挤兑)、(跳票,挤兑)。本发明的另一面向是提供一种制作知识地图的方法。该知识地图包含词汇⑴以及多个关联词汇,而该方法包含下列步骤:建立词汇关联知识集Kt,Si,Wi) |i=l,…,n},其中Si代表与该词汇的关联词汇,Wi代表该等词汇共现配对(t,Si)的权重;从该词汇关联知识集筛选出多个关联词汇共现配对;以及将该等关联词汇共现配对依K-means演算法分成多个群组。本发明的又一面向是提供一种调整知识地图的方法。该知识地图具有广度a,该广度a代表词汇的分支度数目,而该方法包含下列步骤:由词汇关联知识集{(t, SilWi) |i=l,…,η}输出该知识地图,其中t代表该词汇,Si代表与该词汇配对的关联词汇,Wi代表(t,Si)的权重;以及在满足Wi彡a的条件下,由使用者调整该广度a。本发明的再一面向是提供知识地图,该知识地图具有可调整的深度b,该深度b代表词汇以及与该词汇配对的关联词汇延伸的层级数。本发明的再一面向是提供知识地图,其是由词汇关联知识集Kt,Si,Wi)
所衍生,其中t代表该词汇,Si代表与该词汇配对的关联词汇,Wi代表(t,Si)的权重,
其中该知识地图具有广度a,该广度a代表词汇的分支度数目,且在满足Wi > a的条件下,该广度a是可调整的。为了易于说明,本发明得通过下述的实施例及附图而得到充分了解,并使得熟习本技术领域的人员据以完成之,然本发明的实施型态并不限制于下列实施例中。


图1:本发明知识地图制作方法的流程图。图2(a) (b):本发明知识地图呈现方式。主要组件符号说明1、2、21、22、3、31、32、4、41、42、5、6、7、8 步骤
具体实施例方式请参阅图1,其是为本发明的知识地图的制作方法的流程图。制作知识地图,首先输入文件集(步骤I),其数据来自于任一大型语料(corpus),所谓语料是指为特定目的所搜集的文件资料。由于语词是中文语意的单位,因此所搜集的文件需进行前处理(步骤2),以将文件分解成有意义的语词。前处理的工作分两部分,分别为分句切割(步骤21)及断词(步骤22),其操作如表一至表三所示。分句切割(步骤21)是将文章内容的每一个句子进行拆解,拆解的方法是以标点符号,如“,”、“。”、“ ;”、“ ! ”、“? ”等作为拆解的标记符号。断词(步骤22)是将每一分句再进行语词的分割。表一:原始文件数据:
权利要求
1.一种制作知识地图的方法,所述知识地图包含词汇(t)以及多个关联词汇,所述方法包含下列步骤: 建立词汇关联知识集{(t, Si, Wi) I i=l,…,η},其中Si代表与所述词汇配对的关联词汇,Wi代表(t, Si)的权重; 提供使用者接口,以供查询所述词汇; 从所述词汇关联知识集筛选出多个关联词汇共现配对; 将所述等关联词汇共现配对依K-means演算法分成多个群组; 输出所述知识地图,所述知识地图以所述词汇为中心,所述等关联词汇以所述等群组呈现;以及 调整所述知识地图的多个参数。
2.如权利要求1所述的方法,其中Wi的值介于O至1,所述等参数包含所述知识地图的广度a与深度b,所述广度a与所述深度b的值介于O至I。
3.如权利要求2所述的方法,其中所述广度a代表所述词汇的分支度数目,所述分支度数目满足Wi ^ a,所述深度b代表所述词汇t与Si延伸的层级数。
4.一种制作知识地图的方法,所述知识地图包含词汇(t)以及多个关联词汇,所述方法包含下列步骤: 建立词汇关联知识集{(t, Si, Wi) I i=l,...,]!},其中Si代表与所述词汇的关联词汇,Wi代表所述等词汇共现配对(t,Si)的权重;` 从所述词汇关联知识集筛选出多个关联词汇共现配对;以及 将所述等关联词汇共现配对依K-means演算法分成多个群组。
5.如权利要求4所述的方法,还包含下列步骤: 提供使用者接口,以供查询所述词汇; 调整所述知识地图的多个参数,其中所述等参数包含广度a与深度b,所述广度a与所述深度b的值介于O至I;以及 输出所述知识地图,所述知识地图以所述词汇为中心,所述等关联词汇以所述等群组呈现。
6.如权利要求5所述的方法,其中Wi的值介于O至1,所述等参数包含所述知识地图的广度a与深度b,所述广度a与所述深度b的值介于O至I。
7.—种调整知识地图的方法,所述知识地图具有广度a,所述广度a代表词汇的分支度数目,所述方法包含下列步骤: 由词汇关联知识集Kt,SilWi) |i=l,-,η}输出所述知识地图,其中t代表所述词汇,Si代表与所述词汇配对的关联词汇,Wi代表(t,Si)的权重;以及在满足Wi > a的条件下,由使用者调整所述广度a。
8.如权利要求7所述的方法,所述知识地图具有深度b,进一步包含下列步骤:其中所述深度b代表所述词汇t与Si延伸的层级数。
9.知识地图,所述知识地图具有可调整的深度b,所述深度b代表词汇以及与所述词汇配对的关联词汇延伸的层级数。
10.知识地图,其是由词汇关联知识集{(t,Si,Wi)| =1,...,η}所衍生,其中t代表所述词汇,Si代表与所述词汇配对的关联词汇,Wi代表(t,Si)的权重,其中所述知识地图具有广度a,所述广度a代表词汇的分支度数目,且在满足Wi > a的条件下,所述广度a是可调整的 。
全文摘要
本发明是提供一种制作知识地图的方法。该知识地图包含词汇(t)以及多个关联词汇,而该方法包含下列步骤建立词汇关联知识集{(t,si,wi)|i=1,…,n},其中si代表与该词汇配对的关联词汇,wi代表(t,si)的权重;提供使用者接口,以供查询该词汇;从该词汇关联知识集筛选出多个关联词汇共现配对;将该等关联词汇共现配对依K-means演算法分成多个群组;输出该知识地图,该知识地图以该词汇为中心,该等关联词汇以该等群组呈现;以及调整该知识地图的多个参数。
文档编号G06F17/30GK103106232SQ201210383029
公开日2013年5月15日 申请日期2012年10月11日 优先权日2011年10月11日
发明者卢阳正, 陈振南, 魏裕珍 申请人:铭传大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1