有利于提高检索精度的系统的制作方法

文档序号:14403166阅读:159来源:国知局

本发明涉及计算机技术领域,具体涉及有利于提高检索精度的系统。



背景技术:

在网络时代,我们无时无刻地进行着检索。在因特网上进行检索主要有两种方式:目录浏览和使用搜索引擎。目录浏览的方式即搜索引擎采用的方式,用户可以根据自己的需要点击目录,深入下一层子目录,从而找到自己需要的信息。这种方式便于查找某一类的信息集合,但是精确定位的能力不强。搜索引擎是目前最为常用的一种网络检索工具。用户只需要提交自己的需求,搜索引擎就能返回大量结果。这些结果按照和检索提问的相关性进行排序。除了搜索引擎之外,图书馆订购的各种数据库也是信息检索的重要途径。美国国会图书馆参考咨询馆员托马斯·曼就介绍了关键词检索、引文检索、相关性检索等检索方法。

目前的检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本。



技术实现要素:

本发明所要解决的技术问题是目前的检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本,目的在于提供有利于提高检索精度的系统,解决上述问题。

本发明通过下述技术方案实现:

有利于提高检索精度的系统,包括:用于将需要检索的文字划分为多个词语的划分模块;用于得出所有词语出现的频率,并选出出现频率最高的词语作为高频词的选取模块;用于选出与高频词相关的词语的相关模块;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;用于将高频词和相关的词语作为检索词进行检索的检索模块。

现有技术中,检索往往都采用人工的方式进行检索,而随着文件数据量的增大,人工检索需要的工作量会以几何倍上升,极大的提高了检索工作的人力成本。本发明应用时,先将需要检索的文字划分为多个词语;再得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;然后选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;再然后将高频词和相关的词语作为检索词进行检索。由于通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。

进一步的,所述划分模块通过语意树将需要检索的文字划分为多个词语。

进一步的,当出现频率最高的词语为两个及以上时,所述选取模块将两个及以上词语都作为高频词。

进一步的,所述词语的字节数不超过10个。

进一步的,所述高频词的出现频率为两次及以上。

本发明与现有技术相比,具有如下的优点和有益效果:

本发明有利于提高检索精度的系统,通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解,构成

本技术:
的一部分,并不构成对本发明实施例的限定。在附图中:

图1为本发明系统结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。

实施例

如图1所示,本发明有利于提高检索精度的系统,包括:用于将需要检索的文字划分为多个词语的划分模块;用于得出所有词语出现的频率,并选出出现频率最高的词语作为高频词的选取模块;用于选出与高频词相关的词语的相关模块;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;用于将高频词和相关的词语作为检索词进行检索的检索模块。所述划分模块通过语意树将需要检索的文字划分为多个词语。当出现频率最高的词语为两个及以上时,所述选取模块将两个及以上词语都作为高频词,,所述词语的字节数不超过10个。所述高频词的出现频率为两次及以上。

本实施例实施时,先将需要检索的文字划分为多个词语;再得出所有词语出现的频率,并选出出现频率最高的词语作为高频词;然后选出与高频词相关的词语;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;再然后将高频词和相关的词语作为检索词进行检索。由于通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。



技术特征:

技术总结
本发明公开了有利于提高检索精度的系统,包括:用于将需要检索的文字划分为多个词语的划分模块;用于得出所有词语出现的频率,并选出出现频率最高的词语作为高频词的选取模块;用于选出与高频词相关的词语的相关模块;所述相关的词语是指通过介词、形容词或副词与高频词连接的词语;用于将高频词和相关的词语作为检索词进行检索的检索模块。本发明有利于提高检索精度的系统,通过智能语意的方式对词汇进行筛选,事先了检索的智能化,可以有效的节省人力成本。

技术研发人员:徐娇
受保护的技术使用者:成都谷问信息技术有限公司
技术研发日:2017.12.08
技术公布日:2018.05.11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1