一种专利数据挖掘系统及方法与流程

文档序号:23305533发布日期:2020-12-15 11:35阅读:202来源:国知局
一种专利数据挖掘系统及方法与流程

本发明涉及专利技术挖掘领域,尤其涉及一种专利数据挖掘系统及方法。



背景技术:

随着我国科学技术的快速发展和人们知识产权保护意识的增强,越来越多的企业、机构、个人愿意用法律保护他们的技术和产品、品牌、作品,通过申请专利、商标、版权来获取保护。

知识产权在进行申请保护过程中,大部分都是现有专利工程师根据所涉及领域和关键词进行人工检索,而专利工程师检索专利时,往往只检索一些授权的专利,很少会检索无效的专利,尤其是经过复审无效的专利,因为经过复审无效的专利,相对来说,它的技术创新程度可能不是太够,但是,因为它能够进入复审无效状态,说明了它还是有一定的市场价值空间,也就是说它的技术跟实际的应用是比较接近的,可以从中了解最接近这个行业现状的技术、产品、工艺或配方等,对这个行业有个大概的把握,然后从这些专利当中筛选出关键技术词(包括工艺、参数或数据等),在反过来进行逆向检索,检索这些关键技术词的空白区以及收集这些关键技术词之间的交叉重合区,然后分析空白区和交叉重合区,空白区可以说是目前还没有技术的,而交叉重合区是比较符合行业实际的。

经检索发现,专利申请号cn201110432218.0的发明专利,公开了一种专利信息呈现方法及系统,包括:s10,创建专利列表窗口及若干个与专利列表窗口关联以分别呈现不同专利信息的子窗口;s20,下载并存储专利信息,所述专利信息中的所有专利以列表方式呈现在专利列表窗口;s30,在专利列表窗口选择要查看的专利及子窗口;s40,所述子窗口自专利信息数据库获取其所要呈现的信息内容并呈现于其中,以方便用户的浏览查看。

专利申请号:cn201010217459.9的发明专利,公开了一种专利信息分析方法及装置,用以实现专利信息分析的可扩展性。专利信息分析方法,包括:接收用户发起的针对特定的分析模板的分析指令;根据所述分析指令从配置的至少一个分析模板中提取该特定的分析模板,所述分析模板用于定义分析项目和度量指标;通过访问数据源查找该特定的分析模板定义的分析项目对应的数据内容,并根据该特定的分析模版定义的度量指标,查找满足所述数据内容的度量指标值,将查找到的数据内容及其对应的度量指标值作为得到的分析结果;将得到的分析结果呈现给用户。

专利申请号:cn201210579351.3的发明专利,公开了一种信息呈现方法和装置,其中在信息呈现方法中,通过提取数据集的属性信息;选择属性信息中的三个维度,分别作为三维空间的x轴、y轴和z轴;为数据集中的每个样本数据,确定对应的三维坐标;将每个样本数据显示在由所述x轴、y轴和z轴构成的三维空间中。由于将平面数据以三维方式进行呈现,从而便于用户了解样本数据之间的相关度和聚集度。提高了用户的感知效果。

专利申请号:cn200910216835.x的发明专利,公开了一种专利检索方法和系统,包括:获取用户的专利检索请求;从所述专利检索请求中读取用户的专利检索条件;判断所述专利检索条件是否为系统定期进行后台检索所用的专利检索条件;如果是,将系统定期进行后台检索的检索结果提供给用户;否则,则根据用户的专利检索条件进行检索,并将检索结果提供给用户。本发明技术方案通过预先为系统设置相关的专利检索条件,并定期进行后台检索,从而在收到用户的检索请求时,能够将系统按照预先设置的相关检索条件定期进行后台检索的检索结果提供给用户,大大缩减了用户的等待时间。

综合上述所述我们可以看出,目前,市面还是比较缺少专利挖掘这方面的数据,因此,我们有必要解决这一类的问题,以便于专利技术人员对专利技术的挖掘。



技术实现要素:

本发明的目的在于克服现有技术存在的以上问题,提供一种专利数据挖掘系统及方法,本发明通过检索分析专利数据库中复审无效的专利,研究其关键技术词语出现频次最多以及逆向检索中的空白区,从而便于专利技术人员挖掘数据之间的相关度和聚集度。提高了专利技术人员的感应效果。

为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:

一种专利数据挖掘系统,包括与专利数据库连接的服务器,所述服务器包括关键词输入模块、专利检索模块、专利筛选模块、专利文件提取模块、专利分类模块、技术抓取模块、基础模型模块、逆向检索模型模块、技术收集模型模块和专利分析模块,其中:

关键词输入模块,用于输入目标技术的关键词语;

专利检索模块,用于在专利数据库中检索输入的关键词语;

专利筛选模块,用于在专利数据库中筛选出符合关键词语的专利复审无效信息的专利;

专利文件提取模块,用于将专利复审无效信息的专利文件从数据库中提取出来;

专利分类模块,用于将提取出来的专利文件按照专利类型进行分类;

技术抓取模块,用于抓取各类专利文件中的技术部分;

基础模型模块,用于将归类后的专利文件以及抓取后的技术部分生成数据基础模型图;

技术收集模型模块,用于收集各类专利文件技术部分中的关键技术词语,并将其生成数据集合图;

逆向检索模型模块,用于在专利数据库中逆向检索各类专利文件技术部分中的关键技术词语的,并将其进行逆向检索生成逆向检索图;

专利分析模块,用于分析逆向检索图中无结果所对应的技术部分以及数据集合图中重合度最高所对应的技术部分。

一种专利数据挖掘方法,该方法包括以下步骤,

步骤1)通过关键词输入窗口输入需要检索的关键词语;

步骤2)在专利数据库中检索带有关键词语的专利文件;

步骤3)在专利文件中筛选出符合关键词语的复审无效的专利文件;

步骤4)将复审无效的专利文件从数据库中提取出来;

步骤5)将提取出来的专利文件按照专利类型进行分类;

步骤6)抓取各类专利文件中的技术部分,并将抓取的技术部分与分类后的专利文件做成数据基础模型图;

步骤7)收集各类专利文件中技术部分相同的关键技术词语,并将收集到的关键技术词语归类到数据基础模型图中统计其关键技术词语出现的频次;

步骤8)分析各类专利文件中的技术部分,并将技术部分内的关键技术词语在数据库中进行逆向检索;

步骤9)将逆向检索的关键技术词语以及逆向检索的结果归类到数据基础模型图中;

步骤10)分析步骤7中出现重合度最高的关键技术词语以及步骤9中没有检索到的逆向关键技术词语。

作为优选,所述关键词语包括产品名称或技术特征。

作为优选,所述关键技术词语为权利要求书中带有“序号”的词语以及权利要求书中“包括、所述、和、通过、设置有、与和连接”等词的后面和/或前面的词语。

作为优选,所述专利类型包括产品专利、工艺专利、方法专利、配方专利和/或零部件总成专利;其中,产品专利就是以产品结构为主的专利;零部件总成就是由各种零件组成的专利。

作为优选,所述技术部分包括专利文件中的权利要求书或专利文件中描述结构、工艺、方法、配方和零部件总成的部分。

作为优选,所述数据基础模型图用于显示各类专利文件以及各类专利文件所对应的技术部分。

作为优选,所述逆向检索图用于在数据基础模型图中显示各类专利文件逆向检索的关键技术词语及其检索的结果。

作为优选,所述数据集合图用于在数据基础模型图中显示各类专利文件中的关键技术词语以及统计各类专利文件中关键技术词语出现的频次。

作为优选,所述服务器设置为云服务器,所述云服务器与专利数据库网络连接。

作为优选,所述数据库包括国家知识产权专利数据库、佰腾专利数据库、智慧芽专利数据库或soopat专利数据库。

本发明的有益效果是:本发明通过检索专利数据库中复审无效的专利,并将其从数据库中提取出来进行分类,摘取其专利文件中的技术部分,将其生产数据基础模型图,并在数据基础模型图中统计各类专利文件中的关键技术词语以及关键技术词语在各类专利文件中出现的频次,并将关键技术词语进行逆向检索寻找其空白区,供专利技术人员进行挖掘。本发明通过检索分析专利数据库中复审无效的专利,研究其关键技术词语出现频次最多以及逆向检索中的空白区,从而便于专利技术人员挖掘数据之间的相关度和聚集度,能够提高专利技术人员的感知效果和挖掘分析能力。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明。本发明的具体实施方式由以下实施例及其附图详细给出。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明涉及的流程示意图。

具体实施方式

下面结合附图对本发明作进一步的描述:

参照图1,一种专利数据挖掘系统,包括与专利数据库连接的服务器,所述服务器包括关键词输入模块、专利检索模块、专利筛选模块、专利文件提取模块、专利分类模块、技术抓取模块、基础模型模块、逆向检索模型模块、技术收集模型模块和专利分析模块,其中:

关键词输入模块,用于输入目标技术的关键词语;

专利检索模块,用于在专利数据库中检索输入的关键词语;

专利筛选模块,用于在专利数据库中筛选出符合关键词语的专利复审无效信息的专利;

专利文件提取模块,用于将专利复审无效信息的专利文件从数据库中提取出来;

专利分类模块,用于将提取出来的专利文件按照专利类型进行分类;

技术抓取模块,用于抓取各类专利文件中的技术部分;

基础模型模块,用于将归类后的专利文件以及抓取后的技术部分生成数据基础模型图;

技术收集模型模块,用于收集各类专利文件技术部分中的关键技术词语,并将其生成数据集合图;

逆向检索模型模块,用于在专利数据库中逆向检索各类专利文件技术部分中的关键技术词语的,并将其进行逆向检索生成逆向检索图;

专利分析模块,用于分析逆向检索图中无结果所对应的技术部分以及数据集合图中重合度最高所对应的技术部分。

一种专利数据挖掘方法,该方法包括以下步骤,

步骤1)通过关键词输入窗口输入需要检索的关键词语;

步骤2)在专利数据库中检索带有关键词语的专利文件;

步骤3)在专利文件中筛选出符合关键词语的复审无效的专利文件;

步骤4)将复审无效的专利文件从数据库中提取出来;

步骤5)将提取出来的专利文件按照专利类型进行分类;

步骤6)抓取各类专利文件中的技术部分,并将抓取的技术部分与分类后的专利文件做成数据基础模型图;

步骤7)收集各类专利文件中技术部分相同的关键技术词语,并将收集到的关键技术词语归类到数据基础模型图中统计其关键技术词语出现的频次;

步骤8)分析各类专利文件中的技术部分,并将技术部分内的关键技术词语在数据库中进行逆向检索;

步骤9)将逆向检索的关键技术词语以及逆向检索的结果归类到数据基础模型图中;

步骤10)分析步骤7中出现重合度最高的关键技术词语以及步骤9中没有检索到的逆向关键技术词语。

作为优选,所述关键词语包括产品名称或技术特征。

作为优选,所述关键技术词语为权利要求书中带有“序号”的词语以及权利要求书中“包括、所述、和、通过、设置有、与和连接”等词的后面和/或前面的词语。

作为优选,所述专利类型包括产品专利、工艺专利、方法专利、配方专利和/或零部件总成专利;其中,产品专利就是以产品结构为主的专利;零部件总成就是由各种零件组成的专利。

作为优选,所述技术部分包括专利文件中的权利要求书或专利文件中描述结构、工艺、方法、配方和零部件总成的部分。

作为优选,所述数据基础模型图用于显示各类专利文件以及各类专利文件所对应的技术部分。

作为优选,所述逆向检索图用于在数据基础模型图中显示各类专利文件逆向检索的关键技术词语及其检索的结果。

作为优选,所述数据集合图用于在数据基础模型图中显示各类专利文件中的关键技术词语以及统计各类专利文件中关键技术词语出现的频次。

作为优选,所述服务器设置为云服务器,所述云服务器与专利数据库网络连接。

作为优选,所述数据库包括国家知识产权专利数据库、佰腾专利数据库、智慧芽专利数据库或soopat专利数据库。

具体实施例

在实际使用时,在专利关键词输入窗口输入需要检索的关键词语;然后点击检索按钮,在专利数据库中检索带有关键词语的专利文件;在筛选项中选择法律状态中的无权,再选择法律事件中的无效程序,进行筛选,得到与关键词语相似的无效程序专利文件;然后由人工筛选出符合关键词语的专利复审无效信息的专利文件;然后,将复审无效的专利文件从数据库中提取出来,按照专利的类型进行分类,并将各类专利文件中的技术部分摘录出来做成数据基础模型图;然后,将各专利文件中的技术部分内的关键技术词语摘录出来,并统计其关键技术词语出现的频次;然后分析各类专利文件中的关键技术词语,并将分析后的关键技术词语在专利数据库中进行逆向检索,并将逆向检索的数据记录下来,;然后分析关键技术词语中出现频次最多的关键技术词语和逆向检索空白部分,通过分析后可以从两个方向进行挖掘,一个从空白部分进行挖掘,空白部分代表了这方面的技术相对来说比较缺少或不够成熟,从这方面挖掘可以进行提前布局;而另一个可以从出现频次最多的关键技术词语进行挖掘,从这方面挖掘可以把比较符合行业实际的技术给挖掘出来。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1