一种建立分词索引库的方法和装置与流程

文档序号:14774307发布日期:2018-06-23 02:38阅读:来源:国知局
技术总结
本发明公开了一种建立分词索引库的方法和装置,该方法包括:首先,根据待分词文本中的标点符号,获取待分词语句;然后,采用反向最大分词匹配算法拆分所述待分词语句,获得拆分后的词语作为索引项;最后,根据所述索引项和对应的索引信息,建立分词索引库,所述索引信息为索引项所属待分词文本的信息。由此可见,相较于利用IKAnalyzer进行分词,利用反向最大分词匹配算法对待分词语句进行分词处理,拆分出的词语既具有实际含义,且数量较少,即,生成的索引项少而精确,从而在后续全文检索时,对由上述方式建立的索引项少而精确的索引库进行检索,能够大大提升全文检索的速度,极大地提高检索结果准确率。

技术研发人员:刘明;姚杰
受保护的技术使用者:中控技术(西安)有限公司
技术研发日:2018.02.01
技术公布日:2018.06.22

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1