一种基于背景知识的动态重构的语义检索方法

文档序号:6580438阅读:179来源:国知局
专利名称:一种基于背景知识的动态重构的语义检索方法
技术领域
本发明属于信息检索技术领域,尤其涉及一种基于背景知识的动态重构的语义检索方法。
背景技术
随着互联网的快速发展,网络的信息量越来越大,如何从海量数据中检索到用户真正需要的信息成为信息检索的关键任务。应用广泛的信息检索是目前信息科学的一个研究热点,各种方法技术不断涌现。信息检索的研究方法大体上可以分为基于语法的检索和基于内容的检索两个方面。目前大多数的检索方法都是基于语法的检索。通过爬虫等技术从互联网上抓取网页,然后进行信息抽取,对其进行智能化信息处理,并通过相关的索引和 排序技术为用户提供信息检索服务。上述方法没有涉及到对检索内容的语义挖掘,从而在很多情况下返回给用户很多冗余的信息,如较低的查准率导致大量不相关的检索结果,导致检索任务很大程度上依赖于用户的检索技巧,从而加重了用户的检索负担。目前基于内容的检索成一个研究热点。基于内容的检索涉及到信息的语义方面挖掘和处理,能够兼顾信息的语法和语义信息,尽可能的通过信息的背景知识挖掘其更深层次的语义信息,因此,检索结果往往能够更加满足用户真正的检索需求。但是,目前如何对信息的背景知识进行描述、在信息动态演化基础上如何对背景知识进行重构以适应信息演化的需要以及如何基于背景知识进行相关的语义检索仍处于初步阶段,缺乏相关的可行研究方法。

发明内容
本发明结合上述背景技术中提到的问题以及信息检索领域的信息发展趋势和需求,提出一种基于背景知识的动态重构的语义检索方法。本方法综合了语法相似度和语义相似度两方面因素,尽可能的避免各种因素造成的检索误差,并对检索结果进行进一步精确划分,得到满足用户的更为准确的检索结果,减少用户的检索负担。为了实现上述目的,本发明提出的技术方案是,一种基于背景知识的动态重构的语义检索方法,采用二维表表示通用领域知识的形式背景,利用FCA方法构建形式背景的概念格结构模型,得到形式背景属性集和形式背景对象集,其特征是所述方法包括步骤1:将用户输入的检索关键词作为检索属性集S = {S1; S2, , SJ并令i=l ;步骤2 :分析检索属性Si与形式背景属性集A的关系,如果.s', A,则执行步骤3 ;如果Si e A,执行步骤9 ;步骤3 :加载与检索属性Si相关的具体领域知识,合并二维表,重构形式背景属性集,即令A = A U Ai, Ai为与Si相关的具体领域知识的形式背景的属性集;步骤4 :如果a·,, A,则执行步骤5 ;如果Si e A,执行步骤9 ;步骤5 :计算检索属性Si与形式背景属性集A中所有属性的相似度值Siiv并令Sim = max (Sim1, sim2, . . . simj , η为形式背景属性集A中的属性数目;步骤6 :如果Sim小于设定阈值,则执行步骤7 ;如果Sim值大于或等于设定阈值,则执行步骤8 ;步骤7 :从检索属性集中删除属性Si,即令S = \{SJ,执行步骤9 ;步骤8:在形式背景属性集A中,找出与检索属性Si最为相似的属性αρ用属性a j替换检索属性Si ;步骤9 :判断i < m是否成立,如果成立,则令i=i+l,返回步骤3 ;否则,执行步骤10 ;步骤10 :进行基于检索属性集的语义检索。所述计算检索属性Si与形式背景属性集A中属性a j的相似度值采用公式Sim (Si, α」)=λ X Syn (Si, α ρ + (1- λ ) X Sem (Si, α」)其中,Sim(Si,Qj)是检索属性Si与形式背景属性集A中属性的相似度值,Syn (Si, a ^是语法相似度值,Sem(Si, a ^是语义相似度值,λ是线性叠加系数;所述语法相似度值Syn (Si,α的计算公式为
权利要求
1.一种基于背景知识的动态重构的语义检索方法,采用二维表表示通用领域知识的形式背景,利用FCA方法构建形式背景的概念格结构模型,得到形式背景属性集和形式背景对象集,其特征是所述方法包括步骤1:将用户输入的检索关键词作为检索属性集S = Is1, s2,…,sj并令i=l ;步骤2 :分析检索属性Si与形式背景属性集A的关系,如果λ', € A ,则执行步骤3 ;如果 Si e A,执行步骤9 ;步骤3 :加载与检索属性Si相关的具体领域知识,合并二维表,重构形式背景属性集, 即令A = A U Ai, Ai为与Si相关的具体领域知识的形式背景的属性集;步骤4 :如果^ € A,则执行步骤5 ;如果Si e A,执行步骤9 ;步骤5 :计算检索属性Si与形式背景属性集A中所有属性的相似度值Siiv并令Sim = max {Sim1, sim2, . simj , η为形式背景属性集A中的属性数目;步骤6 :如果Sim小于设定阈值,则执行步骤7 ;如果Sim值大于或等于设定阈值,则执行步骤8 ;步骤7 :从检索属性集中删除属性Si,即令S = S\{Si},执行步骤9 ;步骤8:在形式背景属性集A中,找出与检索属性^最为相似的属性αρ用属性%替换检索属性Si ;步骤9 :判断i <m是否成立,如果成立,则令i=i+l,返回步骤3 ;否则,执行步骤10 ; 步骤10 :进行基于检索属性集的语义检索。
2.根据权利要求1所述的方法,其特征是所述计算检索属性Si与形式背景属性集A中属性a j的相似度值采用公式Sim(si, α」)=λ XSyrKsi, α」)+ (1-λ ) XSenKsp α」)其中,Sim(Si,αρ是检索属性Si与形式背景属性集A中属性%的相似度值,Syn(Si, Qj)是语法相似度值,Sem(Si,Qj)是语义相似度值,λ是线性叠加系数;所述语法相似度值Syn (Si,Qj)的计算公式为
全文摘要
本发明公开了信息检索技术领域中的一种基于背景知识的动态重构的语义检索方法。包括先采用二维表给出通用领域的背景知识,利用FCA方法将其构建为概念格模型。然后把用户输入的搜索关键词作为检索属性,分析其与原有形式背景属性集的关系;如果所有检索属性属于形式背景属性集,则直接基于概念格模型进行语义检索;否则,则对领域知识的形式背景进行动态重构;进一步通过相似度计算从属性集中找出与每一个检索属性最为相似的对应替换属性,更新检索属性集;最后,利用重构后的形式背景构建新的概念格结构,并利用此结构完成基于检索属性集的语义检索。本发明通过基于背景知识的动态重构的语义检索方法,能够确保检索结果满足用户的检索要求。
文档编号G06F17/30GK103020283SQ20121058066
公开日2013年4月3日 申请日期2012年12月27日 优先权日2012年12月27日
发明者马应龙, 张潇澜, 宋鹏 申请人:华北电力大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1