一种知识地图生成方法及装置的制造方法

文档序号:9687565阅读:416来源:国知局
一种知识地图生成方法及装置的制造方法
【技术领域】
[0001]本发明属于知识地图技术领域,更具体的说,尤其涉及一种知识地图生成方法及
目.ο
【背景技术】
[0002]知识地图是知识库系统核心功能模块之一,其能够从多条知识组成的知识集合中抽取出来代表所述知识集合核心内容的词汇,并组装成网络结构将各条知识展示出来,因此通过知识地图可以迅速了解知识集合的核心内容以及多条知识之间的关系。
[0003]为了能够生成知识地图,其首要任务则是从知识集合中抽取到核心内容,并确定多条知识之间的关系,在申请号为201210383029.3的制作知识地图的方法中,该知识地图包含词汇(〖)以及多个关联词汇,其技术方案为:建立词汇关联知识集{(〖,^,^)|1 =1,…,η},其中si代表与该词汇配对的关联词汇,wi代表(t,si)的权重;提供使用者接口,以供查询该词汇;从该词汇关联知识集筛选出多个关联词汇共现配对;将该等关联词汇共现配对依K-means演算法分成多个群组;输出该知识地图,该知识地图以该词汇为中心,该等关联词汇以该等群组呈现。
[0004]从申请号为201210383029.3的制作知识地图的方法提供的技术方案可知:其在确定多条知识之间的关系是基于任意两个词汇组合的共现度来判断。但是计算任意两个词汇的共现度会造成大量的循环计算操作,使得计算复杂度提高,并且任意两个词汇可能包含有无意义词以及不符合语法要求的词汇,从而导致共现度计算不准确,导致得到的各条知识之间的关系不准确,进而使得知识地图的准确度降低。

【发明内容】

[0005]有鉴于此,本发明提供一种知识地图生成方法及装置,用于提高知识地图的准确度,并降低计算复杂度。技术方案如下:
[0006]本发明提供一种知识地图生成方法,所述方法包括:
[0007]获取同一类别中每条热门知识的关键词,其中所述类别是通过对知识列表进行聚类划分后得到,且所述知识列表中存储有所述热门知识;
[0008]计算每个所述关键词的关联关系,其中所述关联关系用于指示所述关键词与处于同一类别的关键词之间具有特定关系,以指示不同热门知识之间具有特定关系;
[0009]基于每个所述关键词的关联关系,获取作为所述知识地图的中心节点的关键词;
[0010]基于每个所述关键词的关联关系,获取所述知识地图中各个节点的层级关系;
[0011]以所述中心节点为基准,依据所述知识地图中各个节点的层级关系生成所述知识地图。
[0012]优选地,所述计算每个所述关键词的关联关系,包括:
[0013]获取同一条热门知识的同一句话中的至少两个关键词;
[0014]如果所述同一条热门知识的同一句话中至少两个关键词相连,且在预设关键词集合中查找到相连的至少两个关键词,则所述相连的至少两个关键词具有强关联关系;
[0015]如果具有强关联关系的两个关键词中的第一关键词与其他具有强关联关系的两个关键词中的第二关键词相同,则具有强关联关系的两个关键词和其他具有强关联关系的两个关键词中的三个关键词具有推导关联关系;
[0016]如果所述同一条热门知识的同一句话中的至少两个关键词不相连,则不相连的至少两个关键词具有弱关联关系;
[0017]将每条热门知识的关键词按照预设词组长度进行分词,若分词后得到的关键词和分词前的关键词均在所述预设关键词集合中查找到,则分词后得到的关键词和分词前的关键词具有包含关联关系。
[0018]优选地,所述基于每个所述关键词的关联关系,获取作为所述知识地图的中心节点的关键词,包括:
[0019]基于每个所述关键词的关联关系和预设关系权重,计算每个所述关键词的关联得分;
[0020]基于每个所述关键词的关联得分,从所有关键词中选取关联得分最高的关键词;[0021 ]当所述关联得分最高的关键词的关联得分大于预设关联得分时,所述关联得分最尚的关键词为所述知识地图的中心节点的关键词;
[0022]当所述关联得分最高的关键词的关联得分小于等于所述预设关联得分时,选取点击率最尚的关键词为所述知识地图的中心节点的关键词。
[0023]优选地,基于每个所述关键词的关联关系,获取所述知识地图中各个节点的层级关系,包括:
[0024]当所述作为知识地图的中心节点的关键词的关联关系指示与相连的至少一个关键词具有强关联关系,则将所述作为知识地图的中心节点的关键词的强关联关系作为所述知识地图中至少一条知识路径中其他节点与所述中心节点的层级关系,其中所述知识路径的层级关系为所述作为知识地图的中心节点的关键词与相连的一个关键词之间的强关联关系,且每条所述知识路径基于的强关联关系不同;
[0025]对于所述知识地图中其他知识路径,基于作为中心节点的关键词的关联关系与其他关键词的关联得分确定所述其他知识路径中其他节点与所述中心节点的层级关系,且所述其他知识路径的层级关系中不包括以所述知识地图的中心节点的关键词的强关联关系得到的层级关系。
[0026]优选地,所述方法还包括:
[0027]获取所述知识地图中第i级节点的关键词,i为大于等于1的整数,且i小于等于N,N为知识地图中层级数;
[0028]如果在关键词关联列表中查找到与所述第i级节点的关键词对应的第i+ Ι级节点的关键词,则将所述第i+Ι级节点的关键词的关联知识列表合并到所述第i级节点的关键词的关联知识列表中,所述第i+Ι级节点为所述第i级节点的下一级节点;
[0029]去除所述第i+ Ι级节点的关键词的关联知识列表和第i级节点的关键词的关联知识列表中的相同知识,得到第i级节点的关联知识列表;
[0030]如果在关键词关联列表中未查找到与所述第i级节点的关键词对应的第i+ Ι级节点的关键词,则将所述第i级节点的关键词的关联知识列表按照点击量进行排序,排序后的关联知识列表为所述第i级节点的关联知识列表。
[0031]本发明还提供一种知识地图生成装置,所述装置包括:
[0032]获取单元,用于获取同一类别中每条热门知识的关键词,其中所述类别是通过对知识列表进行聚类划分后得到,且所述知识列表中存储有所述热门知识;
[0033]计算单元,用于计算每个所述关键词的关联关系,其中所述关联关系用于指示所述关键词与处于同一类别的关键词之间具有特定关系,以指示不同热门知识之间具有特定关系;
[0034]中心节点确定单元,用于基于每个所述关键词的关联关系,获取作为所述知识地图的中心节点的关键词;
[0035]关系确定单元,用于基于每个所述关键词的关联关系,获取所述知识地图中各个节点的层级关系;
[0036]生成单元,用于以所述中心节点为基准,依据所述知识地图中各个节点的层级关系生成所述知识地图。
[0037]优选地,所述计算单元包括:
[0038]获取子单元,用于获取同一条热门知识的同一句话中的至少两个关键词;
[0039]第一确定子单元,用于如果所述同一条热门知识的同一句话中至少两个关键词相连,且在预设关键词集合中查找到相连的至少两个关键词,则所述相连的至少两个关键词具有强关联关系;
[0040]第二确定子单元,用于如果具有强关联关系的两个关键词中的第一关键词与其他具有强关联关系的两个关键词中的第一.关键词相同,则具有强关联关系的两个关键词和其他具有强关联关系的两个关键词中的三个关键词具有推导关联关系;
[0041]第三确定子单元,用于如果所述同一条热门知识的同一句话中的至少两个关键词不相连,则不相连的至少两个关键词具有弱关联关系;
[0042]第四确定子单元,用于将每条热门知识的关键词按照预设词组长度进行分词,若分词后得到的关键词和分词前的关键词均在所述预设关键词集合中查找到,则分词后得到的关键词和分词前的关键词具有包含关联关系。
[0043 ] 优选地,所述中心节点确定单元包括:
[0044]计算子单元,用于基于每个所述关键词的关联关系和预设关系权重,计算每个所述关键词的关联得分;
[0045]选取子单元,用于基于每个所述关键词的关联得分,从所有关键词中选取关联得分最尚的关键词;
[0046]节点确定子单元,用于当所述关联得分最高的关键词的关联得分大于预设关联得分时,所述关联得分最高的关键词为所述知识地图的中心节点的关键词,以及用于当所述关联得分最高的关键词的关联得分小于等于所述预设关联得分时,选取点击率最高的关键词为所述知识地图的中心节点的关键词。
[0047]优选地,关系确定单元包括:
[0048]第一关系确定子单元,用于当所述作为知识地图的中心节点的关键词的关联关系指示与相连的至少一个关键词具有强关联关系,则将所述作为知识地图的中心节点的关键词的强关联关系作为所述知识地图中至少一条知识路径中其他节点与所述中心节点的层级关系,其中所述知识路径的层级关系为所述作为知识地图的中心节点的关键词与相连的一个关键词之间的强关联关系,且每条所述知识路径基于的强关联关系不同;
[0049]第二关系确定子单元,用于对于所述知识地图中其他知识路径,基于作为中心节点的关键词的关联关系与其他关键词的关联得分确定所述其他知识路径中其他节点与所述中心节点的层级关系,且所述其他知识路径的层级关系中不包括以所述知识地图的中心节点的关键词的强关联关系得到的层级关系。
[0050]优选地,所述装置还包括:
[0051]关键词获取单元,用于获取所述知识地图中第i级节点的关键词,i为大于等于1的整数,且i小于等于N,N为知识地图中层级数;
[0052]第一知识列表获取单元,用于如果在关键词关联列表中查找到与所述第i级节点的关键词对应的第i+Ι级节点的关键词,则将所述第i+Ι级节点的关键词的关联知识列表合并到所述第i级节点的关键词的关联知识列表中,所述第i+Ι级节点为所述第i级节点的下一级节点;
[0053]去重单元,用于去除所述第i+Ι级节点的关键词的关联知识列表和第i级节点的关键词的关联知识列表中的相同知识,得到第i级节点的关联知识列表;
[0054]第二知识列表获取单元,用于如果在关键词关联列表中未查找到与所述第i级节点的关键词对应的第i+Ι级节点的关键词,则将所述第i级节点的关键词的关联知识列表按照点击量进行排序,排序后的关联知识列表为所述第i级节点的关联知识列表。
[0055]与现有技术相比,本发明提供的上述技术方案具有如下优点:
[0056]本发明提供的上述技术方案,首先获取同一类别中每条热门知识的关键词,然后计算每个关键词的关联关系,这样就可以基于每个关键词的关联关系,来获取作为知识地图的中心节点的关键词以及知识地图中各个节点的层级关系,进而可以以中心节点为基准,依据知识地图中各个节点的层级关系生成知识地图。在本发明中上述关联关系
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1