一种关键词提取及信息检索方法与流程

文档序号:24410441发布日期:2021-03-26 19:08阅读:来源:国知局

技术特征:
1.一种关键词提取方法,其特征在于,包括以下步骤:知识库建立,接收原始数据,根据原始数据建立知识库,所述知识库包括同义词库,所述同义词库将相同含义的词条收集为同义词集合,并在同义词集合上设置有同义词标签,所述同义词标签为同义词集合中词语的标准化表述;关键词提取,接收检索文本,提取所述检索文本中的关键词为第一关键词;关键词标准处理,接收所述第一关键词,将所述第一关键词输入所述同义词库,得出所述第一关键词所在的同义词集合,将该同义词集合的同义词标签作为搜索关键词。2.根据权利要求1所述的关键词提取方法,其特征在于:所述知识库还包括多义词库,所述关键词提取方法还包括步骤多义词消歧,所述多义词消歧的步骤包括:接收所述第一关键词;判断所述第一关键词是否存在于所述多义词库中;若否,进行步骤关键词标准处理;若是,根据所述多义词库将第一关键词转化为第二关键词,将所述第二关键词输入所述同义词库,得出所述第二关键词所在的同义词集合,将该同义词集合的同义词标签作为搜索关键词。3.根据权利要求2所述的关键词提取方法,其特征在于:根据所述多义词库将第一关键词转化为第二关键词的步骤为,根据所述第一关键词所在检索文本的其他第一关键词得出词义标签,将词义标签添加到第一关键词得出第二关键词。4.根据权利要求1

3任一项所述的关键词提取方法,其特征在于:所述知识库建立的步骤包括:接收原始数据,所述原始数据包括结构化数据和非结构化数据;当原始数据为结构化数据时,对结构化数据进行数据整合,得出知识库;当原始数据为非结构化数据时,对非结构化数据进行数据抽取,得出知识库。5.根据权利要求4所述的关键词提取方法,其特征在于:所述数据抽取的步骤包括:实体抽取,提取所述原始数据中的实义词;关系抽取,接收所述关系模板,根据所述关系模板得出原始数据中实义词之间的关系,得出知识库。6.根据权利要求1或5所述的关键词提取方法,其特征在于:所述关键词提取的步骤还包括:分词处理,接收所述检索文本,对所述检索文本进行分词,得出候选词;第一关键词获取,接收所述候选词,为所述候选词分配权重为第一权重,提取第一权重较大的前n个所述候选词为第一关键词。7.一种信息检索方法,其特征在于,包括:权重接收,接收如权利要求1

6任一项所述的搜索关键词和所述搜索关键词对应的第一关键词的第一权重,将该权重值赋予给对应的搜索关键词;文本检索,将所述搜索关键词输入数据库中,输出数据库中与所述搜索关键词相关的文档;文档排序,接收所述搜索关键词在相关的文档中所占权重为第二权重,根据所述第一权重和第二权重得出文档相关度,根据所述文档相关度对文档进行排序。
8.根据权利要求7所述的信息检索方法,其特征在于:所述文档排序的步骤还包括:相关度计算,接收所述第一权重和第二权重,所述第一权重值与第二权重值相乘得出文档相关度;相关度排序,接收与所述搜索关键词所有相关的文档的文档相关度,根据文档相关度从大到小对文档进行排序。9.一种关键词提取装置,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1

6任一项所述的关键词提取方法。10.一种信息检索装置,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求7或8所述的信息检索方法。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1