专利检索用语义分析方法与流程

文档序号:12271303阅读:1394来源:国知局

本发明属于专利数据处理技术领域,特别是一种专利检索用语义分析方法。



背景技术:

现有技术提供的专利检索方法都是通过输入关键词进行检索,并且通过人工来改变关键词的种类与数量进行不同的组合检索,检索效率低,且获取到的文献繁多不方便使用。



技术实现要素:

为解决上述技术问题,本发明提供了专利检索用语义分析方法,其包括以下步骤:

S1:将中文技术文档以词汇为单位进行拆分,将该技术文档中出现的技术词汇按照频次进行排序,获取排在前若干位的技术词汇作为关键词;

S2:将获取的关键词进行归类,具有重合文字的部分归为一类,将所述获取到的关键词归纳为多个类别;

S3:分别在所述各个类别中选取一个关键词进行组合,并作为检索所需要的关键词组合,得到多组不同的关键词组合;

S4:将所述获取到的技术关键词组合输入到专利数据库中进行检索,分别得到若干个专利文献;

S5:将所述各技术关键词组合得到的专利文献进行比对,按照不同组合下的专利文献的重合频次进行排序,出现频率越高的专利文献其技术关联度越高,出现频率越低的专利文献其技术关联度越低。

较佳地,所述技术词汇为预存在词汇库中的技术用词,所述词汇库定期进行更新。

较佳地,所述技术文档的拆分方式为:

将技术词汇从技术文档中筛选出来,并将除技术词汇之外的其他词汇删除。

本发明具有以下有益效果:

本发明提供的专利检索用语义分析方法根据关键词组合得到不同的专利文献组合,并且对专利文献的技术关联度进行评估并排序,得到的检索结果使用起来更为便捷。

当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。

具体实施方式

下面将结合本发明实施例对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

本发明实施例提供了专利检索用语义分析方法,其包括以下步骤:

S1:将中文技术文档以词汇为单位进行拆分,将该技术文档中出现的技术词汇按照频次进行排序,获取排在前若干位的技术词汇作为关键词;

S2:将获取的关键词进行归类,具有重合文字的部分归为一类,将所述获取到的关键词归纳为多个类别;

S3:分别在所述各个类别中选取一个关键词进行组合,并作为检索所需要的关键词组合,得到多组不同的关键词组合;

S4:将所述获取到的技术关键词组合输入到专利数据库中进行检索,分别得到若干个专利文献;

S5:将所述各技术关键词组合得到的专利文献进行比对,按照不同组合下的专利文献的重合频次进行排序,出现频率越高的专利文献其技术关联度越高,出现频率越低的专利文献其技术关联度越低。

其中所述技术词汇为预存在词汇库中的技术用词,所述词汇库定期进行更新。

所述技术文档的拆分方式为:

将技术词汇从技术文档中筛选出来,并将除技术词汇之外的其他词汇删除。

本发明提供的专利检索用语义分析方法根据关键词组合得到不同的专利文献组合,并且对专利文献的技术关联度进行评估并排序,得到的检索结果使用起来更为便捷。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1