一种基于电力行业专利信息的精确检索方法和系统与流程

文档序号:12550853阅读:383来源:国知局

本专利属于信息服务领域,具体涉及一种电力行业信息的检索方法和系统。

技术背景

目前,在专利文献检索中,科技研发人员习惯于使用专业术语或专有名词进行文献检索,但是实际检索过程中,经常遇到检索文献并不是自己所找的内容,或者说利用简单关键词检索,噪音太多,无法精确检索.例如电力行业中检索核电,会出现核潜艇、核武器电器相关内容,相关内容属于军事武器领域,与核电、核能等领域差别较大,并不是科研人员所要检索的文献。噪音文献的去除和筛选给技术人员精确检索专利文献信息带来很大困扰;

但是,实际上每篇中文专利在经过审查时,专利审查员都会根据专利内容分配一个分类号码,例如发明和实用新型为IPC分类号。IPC分类(国际专利分类)是根据1971年签订的《国际专利分类斯特拉斯堡协定》编制的,是目前惟一国际通用的专利文献分类和检索工具。IPC采用了功能和应用相结合,以功能性为主、应用性为辅的分类原则。采用等级的形式,将技术内容注明:部-分部-大类-小类-大组-小组,逐级分类形成完整的分类体系。依据某一种产品的国际分类,就可以很容易的检索出本产品所属技术领域的专利信息了。

目前存在的实际状况是:IPC分类号检索只有专业的专利文献检索人员或熟悉专利文献格式的人员才会采用,大多数研究学者、技术人员以及企业管理人员,甚至图书情报人员只会通过关键词及其组合,进行专利文献检索,专利文献检索结果不甚理想。



技术实现要素:

为提升电力行业科研人员利用关键词或其组合检索专利文献的精确度,实现通过关键词精准检索电力行业专利文献的目的,本发明提出一种通过IPC分类号和电力行业关键词相关联检索专利文献方法,以及基于该方法开发的精确检索系统,具体方案如下:

一种基于电力行业专利信息的精确检索方法,包括以下步骤:首先采集电力行业相关专利文献文本数据,构建电力行业专题专利数据库;

其次利用计算机文本提取和汇聚技术,提取专题专利数据库中专利文献中的关键词、技术术语、专有名词及其他实体词,以下统称电力术语;

然后将全部电力术语与IPC分类号一一对应,每个电力术语对应一个或多个IPC分类号,使得电力术语与IPC分类号相互映射

最后通过计算机自动匹配技术,将电力术语自动映射IPC分类号,进而转化为通过IPC分类号进行检索专利文献,并反馈检索结果。

所述电力术语与IPC分类号对应是指与IPC分类号小组对应,实现精确检索专利文献的目的。

根据上述的基于电力行业专利信息的精确检索方法,本发明提出一种基于电力行业专利信息的精确检索系统,包括:数据存储部、术语处理部、IPC映射部、数据检索部和信息反馈部;

其中,数据存储部主要作用是存储电力行业相关专利文献,构建系统基础构架,形成底层数据库,支撑信息处理和检索;术语处理部采用计算机文本提取和汇聚技术,提取专利文本中的电力术语;IPC映射部支持人工加工电力术语与IPC分类号的对应,保存加工成果,形成映射关系数据库,为数据检索提供支持;IPC映射部能够将关键词与电力术语自动匹配,将检索词汇自动转换为IPC分类号,具有数据自动转换功能;数据检索部利用IPC映射部自动转换的IPC分类号进行主动检索,智能化搜集数据存储部的专利文献,并将检索结果反馈给信息反馈部;信息反馈部负责调用数据存储部信息,为系统使用人员提供信息检索结果。

通过以上电力行业专利信息的精确检索方法和系统,科研人员在检索专利文献时,只需要输入关键词等电力术语,计算机系统智能化比对,自动映射到IPC分类号小组,转化为根据IPC分类号号码进行检索的方式,并反馈检索结果。

由于IPC分类号是由专利审查员按照专利内容分配的号码,能够准确反映专利实际内容,因此通过关键词映射到IPC分类号,进而检索专利的方法能够达到精确检索专利文献的目的,非常方便科研、管理、技术人员检索专利文献。

具体实施方式

以下结合实施例对本发明的技术方案作进一步地详细介绍,需要说明的是,实施例仅用于进一步解释本发明内容,方便本技术领域技术人员理解,并不限制本发明的保护范围,相关人员对本发明显而易见的改变,仍然在本发明要求的保护范围之内。

首先基于已经构建的电力行业专题专利数据库,利用计算机技术文本提取和汇聚技术,提取专题专利数据库中专利文献中的电力术语,以提取到的关键词--熔断器为例;

其次,将关键词熔断器与IPC分类号对照,确定熔断器映射的IPC分类号小组为:

H01H69/02

·熔断器制造

G01R31/07

··熔断器的测试

H01H85/044

····低压,即低于1000伏的熔断器,或未指明使用电压的熔断器,其一般构成或结构

H01H85/047

····真空熔断器

H01H85/042

····高压,即高于1000伏的熔断器的一般构成或结构

H01H85/046

····形成为印制电路的熔断器

最后通过计算机自动匹配技术,将关键词熔断器映射到以上IPC分类号小组。计算机系统自动识别关键词与IPC分类号H01H69/02、G01R31/07、H01H85/044、H01H85/047、H01H85/042、H01H85/046对应,进而智能化转化为根据IPC分类号检索,并反馈检索结果。

基于上述电力行业专利信息的精确检索方法,开发了数据检索系统,包括数据存储部、术语处理部、IPC映射部、数据检索部和信息反馈部。

实际使用时,技术研发人员利用本发明数据检索系统,通过输入检索关键词----熔断器,系统IPC映射部将关键词主动与IPC分类号进行匹配,按照映射关系,自动映射到IPC分类号小组,数据检索部根据IPC分类号进行检索,并反馈检索结果,信息反馈部将检索结果从数据存储部调出,向用户反馈检索到的专利文献,由此通过关键词自动转化为IPC分类号,进而实现精确检索的目的。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1