一种基于相关性知识特征提取的方法

文档序号:6619592阅读:159来源:国知局
一种基于相关性知识特征提取的方法
【专利摘要】本发明涉及一种基于相关性知识特征提取的方法,属于工业工程领域。本发明首先针对一组信息的信息源分别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建n行n列的关键词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对应的除自身以外评分最高的列中关键词作为自身最相关的关键词;根据找到的自身最相关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为止。本发明通过关键词的概括与提取,可以更好地针对信息源作出判断;通过采用AHP“1~9”评分法提高了信息整合的精确性,对相互关系强烈的关键词进行合并,生成新的信息关键词,提高了信息整合的有效性。
【专利说明】一种基于相关性知识特征提取的方法

【技术领域】
[0001] 本发明涉及一种基于相关性知识特征提取的方法,属于工业工程领域。

【背景技术】
[0002] 随着社会的发展与进步,我们已经进入到一个信息大爆炸的时代,在多元、大量复 杂的信息中提取有用的相关信息,是一个难点,也是一个重点。21世纪企业的成功越来越依 赖于企业所拥有知识的质量,利用企业所拥有的知识为企业创造竞争优势和持续竞争优势 对企业来说始终是一个挑战。知识来源越多,对我们利用知识的特征来进行知识的整合就 越来越难,这是当前人们所研究的热点。
[0003] 如何快速精确地定位相关有用信息的特征,并整合相关知识,在这一问题中:①没 有针对相关知识系统进行相关知识特征整合的方法设计;②没有采用ΑΗΡ法中的"1?9" 评分原理进行知识特征聚类的规则设计;③没有采用降维的思想对知识信息结构体进行设 计;④没有设计过特征值相互关系表。
[0004] 针对上述问题,本发明一种相关性知识特征提取的方法,该方法采用降维的思想, 针对相关知识结构体中复杂、多元的信息进行了提取关键知识特征的方法设计。该方法通 过设计特征值相互关系表以及基于ΑΗΡ法中" 1?9"的评分规则设计,为相关知识特征提 取提供了一个有效的方法。


【发明内容】

[0005] 本发明提供了一种基于相关性知识特征提取的方法,以用于解决如何快速准确的 从相互独立的复杂信息中,提取并整合关键性的知识信息。
[0006] 本发明的技术方案是:一种基于相关性知识特征提取的方法,首先针对一组信息 的信息源分别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建行 列的关键词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中 的关键词所对应的除自身以外评分最1?的列中关键词作为自身最相关的关键词;根据找到 的自身最相关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为 止。
[0007] 所述方法的具体步骤如下: Stepl、针对一组信息中的/7个信息源分别通过信息筛选与压缩的方式得到每个信息 源相对应的关键词; Step2、利用信息源所对应的关键词组成/7行/7列两两对应的关键词相互关系;接着 采用ΑΗΡ法中的" 1?9"评分标准对两两对应的关键词相互关系进行两两比较评分,得到 X/?个关键词相互关系强烈度;根据X/?个关键词相互关系强烈度构建行列的关键 词相互关系表; Step3、相关性的检验:采用ΑΗΡ法中的"1?9"评分标准进行关键词相互关系评分后, 对关键词相互关系进行相关性的检验: 如果关键词相互关系构成的关键词相互关系表中数据的每一行、每一列的分数不存在 相同的情况,则不需重新进行打分比较; 如果关键词相互关系构成的关键词相互关系表中数据的每一行、每一列的分数存在相 同的情况,则需重新进行打分比较; Step4、依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对 应的除自身以外评分最1?的列中关键词作为自身最相关的关键词; Step5、通过步骤Step4中找到的自身最相关的关键词的两两结合,形成新的信息源; Step6、针对步骤Step5中形成的新信息源重复执行步骤Stepl?步骤Step5,直到关键 词合并成统一的关键词为止。
[0008] 所述相互关系强烈度由1至9依次增强;其中,系数越大为相互关系强烈度越强, 系数越小为相互关系强烈度越弱。
[0009] 所述步骤Step3中重新进行打分比较为根据需要确定评分中所有要保留的小数 点后的位数。
[0010] 所述统一的关键词为一组信息的关键知识点。
[0011] 本发明的有益效果是:该方法在实际应用背景中具有较好的环境适应性;通过关 键词的概括与提取,可以更好地针对信息源作出判断,通过设计关键词相互关系表,并采用 ΑΗΡ "1?9"评分法提高了信息整合的精确性,对相互关系强烈的关键词进行合并,生成新 的信息关键词,提高了信息整合的有效性。

【专利附图】

【附图说明】
[0012] 图1为本发明的算法流程图。

【具体实施方式】
[0013] 实施例1 :如图1所示,一种基于相关性知识特征提取的方法,首先针对一组信息 的信息源分别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建行 列的关键词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中 的关键词所对应的除自身以外评分最1?的列中关键词作为自身最相关的关键词;根据找到 的自身最相关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为 止。
[0014] 所述方法的具体步骤如下: Stepl、针对一组信息中的/7个信息源分别通过信息筛选与压缩的方式得到每个信息 源相对应的关键词; Step2、利用信息源所对应的关键词组成/7行/7列两两对应的关键词相互关系;接着 采用ΑΗΡ法中的" 1?9"评分标准对两两对应的关键词相互关系进行两两比较评分,得到 X/?个关键词相互关系强烈度;根据X/?个关键词相互关系强烈度构建行列的关键 词相互关系表; Step3、相关性的检验:采用ΑΗΡ法中的"1?9"评分标准进行关键词相互关系评分后, 对关键词相互关系进行相关性的检验: 如果关键词相互关系构成的关键词相互关系表中数据的每一行、每一列的分数不存在 相同的情况,则不需重新进行打分比较; 如果关键词相互关系构成的关键词相互关系表中数据的每一行、每一列的分数存在相 同的情况,则需重新进行打分比较; Step4、依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对 应的除自身以外评分最1?的列中关键词作为自身最相关的关键词; Step5、通过步骤Step4中找到的自身最相关的关键词的两两结合,形成新的信息源; Step6、针对步骤Step5中形成的新信息源重复执行步骤Stepl?步骤Step5,直到关键 词合并成统一的关键词为止。
[0015] 所述相互关系强烈度由1至9依次增强;其中,系数越大为相互关系强烈度越强, 系数越小为相互关系强烈度越弱。
[0016] 所述步骤Step3中重新进行打分比较为根据需要将关键词相互关系表中数据的 每一行、每一列的分数存在相同情况的数据重新确定其相同评分中所有要保留的小数点后 的位数。
[0017] 所述统一的关键词为一组信息的关键知识点。
[0018] 实施例2 :如图1所示,一种基于相关性知识特征提取的方法,首先针对一组信息 的信息源分别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建行 列的关键词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中 的关键词所对应的除自身以外评分最1?的列中关键词作为自身最相关的关键词;根据找到 的自身最相关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为 止。
[0019] 所述方法的具体步骤如下: 现有6条相关性知识的信息,利用本发明所述的相关知识特征提取的方法对这6条相 关性知识的信息进行特征关系的提取与合并,该6条信息如下: 信息1 :线性表是一种线性结构,它的特点是数据元素之间是一种线性关系,即数据元 素一个接一个的排列; 信息2 :栈是一种限制在表的一端进行插入和删除的结构体,允许插入、删除的这一端 称为找顶,另一个固定端称为找底; 信息3 :二叉树是树形结构的另一个重要类型,许多实际问题抽象出来的数据结构往 往是二叉树的形式; 信息4 :图形结构是一种比树形结构更为复杂的非线性结构,被用来描述各种复杂的 数据结构,在实际生活中应用广泛; 信息5 :顺序存储结构的主要优点是节省存储空间,因为分配给数据的存储单元全用 存放结点的数据(不考虑C/C++语言中数组需指定大小的情况),结点之间的逻辑关系没有 占用额外的存储空间; 信息6 :链式存储又叫链接存储结构,在计算机中用一组任意的存储单元存储线性表 的数据元素,它不要求逻辑上相邻的元素在物理位置上也相邻,因此它没有顺序存储结构 所具有的弱点,但也同时失去了顺序表可随机存取的优点。
[0020] Stepl、针对一组信息中的6个信息源分别通过信息筛选与压缩的方式得到每个 信息源相对应的关键词; 具体为: 信息1的关键词(关键词1):线性表 信息2的关键词(关键词2):栈 信息3的关键词(关键词3):二叉树 信息4的关键词(关键词4):图形结构 息5的关键词(关键词5):顺序存储 信息6的关键词(关键词6):链式存储 Step2、利用信息源所对应的关键词组成/7行/7列两两对应的关键词相互关系;接着 采用ΑΗΡ法中的" 1?9"评分标准对两两对应的关键词相互关系进行两两比较评分,得到 X/?个关键词相互关系强烈度;根据X/?个关键词相互关系强烈度构建行列的关键 词相互关系表; 所述相互关系强烈度由1至9依次增强;其中,系数越大为相互关系强烈度越强,系数 越小为相互关系强烈度越弱。
[0021] 具体为: 表1关键词相互关系表

【权利要求】
1. 一种基于相关性知识特征提取的方法,其特征在于:首先针对一组信息的信息源分 别得到每个信息源相对应的关键词;然后利用信息源所对应的关键词构建/7行/7列的关键 词相互关系表;依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所 对应的除自身以外评分最1?的列中关键词作为自身最相关的关键词;根据找到的自身最相 关的关键词的两两结合,形成新的信息源,直到关键词合并成统一的关键词为止。
2. 根据权利要求1所述的基于相关性知识特征提取的方法,其特征在于:所述方法的 具体步骤如下: Stepl、针对一组信息中的/7个信息源分别通过信息筛选与压缩的方式得到每个信息 源相对应的关键词; Step2、利用信息源所对应的关键词组成/7行/7列两两对应的关键词相互关系;接着 采用ΑΗΡ法中的" 1?9"评分标准对两两对应的关键词相互关系进行两两比较评分,得到 X/?个关键词相互关系强烈度;根据X/?个关键词相互关系强烈度构建行列的关键 词相互关系表; Step3、相关性的检验:采用ΑΗΡ法中的"1?9"评分标准进行关键词相互关系评分后, 对关键词相互关系进行相关性的检验: 如果关键词相互关系构成的关键词相互关系表中数据的每一行、每一列的分数不存在 相同的情况,则不需重新进行打分比较; 如果关键词相互关系构成的关键词相互关系表中数据的每一行、每一列的分数存在相 同的情况,则需重新进行打分比较; Step4、依据上述关键词相互关系表,按行进行查找,依次找出每一行中的关键词所对 应的除自身以外评分最1?的列中关键词作为自身最相关的关键词; Step5、通过步骤Step4中找到的自身最相关的关键词的两两结合,形成新的信息源; Step6、针对步骤Step5中形成的新信息源重复执行步骤Stepl?步骤Step5,直到关键 词合并成统一的关键词为止。
3. 根据权利要求2所述的基于相关性知识特征提取的方法,其特征在于:所述相互关 系强烈度由1至9依次增强;其中,系数越大为相互关系强烈度越强,系数越小为相互关系 强烈度越弱。
4. 根据权利要求2所述的基于相关性知识特征提取的方法,其特征在于:所述步骤 St印3中重新进行打分比较为根据需要将关键词相互关系表中数据的每一行、每一列的分 数存在相同情况的数据重新确定其相同评分中所有要保留的小数点后的位数。
5. 根据权利要求2所述的基于相关性知识特征提取的方法,其特征在于:所述统一的 关键词为一组信息的关键知识点。
【文档编号】G06F17/30GK104123349SQ201410324529
【公开日】2014年10月29日 申请日期:2014年7月9日 优先权日:2014年7月9日
【发明者】侯开虎, 朱栩颖, 杨维平, 陈婷, 钟昕怡 申请人:昆明理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1