一种企业专利预警方法、装置、设备及存储介质与流程

文档序号:37437876发布日期:2024-03-25 19:37阅读:18来源:国知局
一种企业专利预警方法、装置、设备及存储介质与流程

本发明涉及数据挖掘与分析,特别涉及一种企业专利预警方法、装置、设备及存储介质。


背景技术:

1、随着知识经济与技术创新的快速发展,企业亟需及时跟踪技术动向,发现可能的机遇与威胁。专利情报作为分析技术变化的重要手段,在企业技术管理与决策中发挥着重要作用。专利预警的关键是从海量专利数据中高效发现技术主题和发展趋势。然而,传统人工分析方法难以应对快速增长的专利大数据。因此,如何实现大规模专利数据的主题挖掘,发现技术关联与发展方向是目前亟待解决的问题。


技术实现思路

1、有鉴于此,本发明的目的在于提供一种企业专利预警方法、装置、设备及存储介质,能够应用卷积自动编码k-means算法实现对企业大规模专利数据集的主题聚类,可以自动高效发现数据集内在的主题结构,克服传统人工分析的局限,实现专利挖掘与预警的高效、智能化。其具体方案如下:

2、第一方面,本技术公开了一种企业专利预警方法,包括:

3、基于目标企业的技术领域以及目标专利数据库构建企业专利数据集,并对所述企业专利数据集中的数据进行预处理,基于相应的处理后专利元数据确定所述企业专利数据集中各专利文献的特征向量;

4、利用卷积自编码器对所述特征向量进行无监督预训练,以便于从所述卷积自编码器对应的编码器中选择隐藏层,并根据所述隐藏层对应的激活值确定k-means聚类算法的初始中心点;

5、基于所述初始中心点、所述特征向量以及所述k-means聚类算法进行迭代聚类,以得到主题聚类结果,基于所述主题聚类结果对各聚类中的技术主题进行判断,根据相应的判断结果对各所述技术主题进行命名;

6、基于各所述主题聚类结果以及相应的命名结果确定所述目标企业的技术关联,根据所述技术关联以及所述目标企业的战略定位对所述目标企业进行专利预警。

7、可选的,所述对所述企业专利数据集中的数据进行预处理,包括:

8、读取所述企业专利数据集中所述专利文献的初始元数据,并利用文字识别和规则匹配算法提取所述初始元数据的目标信息;所述初始元数据包括所述专利文献的标题、摘要以及申请日;

9、基于预设规则对所述目标信息进行校验和清洗,以得到所述处理后专利元数据。

10、可选的,所述基于相应的处理后专利元数据确定所述企业专利数据集中各专利文献的特征向量,包括:

11、基于所述处理后专利元数据提取各所述专利文献的目标特征,并将所述目标特征进行整合,以确定所述特征向量;所述目标特征包括所述专利文献的关键词、分类号以及时间。

12、可选的,所述根据所述隐藏层对应的激活值确定k-means聚类算法的初始中心点,包括:

13、基于所述企业专利数据集的规模以及所述目标企业的技术门类确定聚类数;

14、根据所述聚类数从所述隐藏层对应的激活值中采样相应数量的目标点;

15、将所述目标点确定为所述k-means聚类算法的所述初始中心点。

16、可选的,所述基于所述初始中心点、所述特征向量以及所述k-means聚类算法进行迭代聚类,以得到主题聚类结果,包括:

17、计算各所述专利文献的所述特征向量与各所述初始中心点之间的距离,根据相应的计算结果中的最小距离将所述专利文献进行分类,并确定分类结果;

18、根据所述分类结果计算各个类的质心,将所述质心确定为聚类中心,并重新跳转至所述计算各所述专利文献的所述特征向量与各所述初始中心点之间的距离的步骤,直至所述聚类中心符合预设条件,并将符合所述预设条件的聚类中心确定为最终的聚类中心;

19、基于所述最终的聚类中心确定所述主题聚类结果。

20、可选的,所述基于所述主题聚类结果对各聚类中的技术主题进行判断,根据相应的判断结果对各所述技术主题进行命名,包括:

21、基于所述主题聚类结果读取各所述聚类中的所述专利文献的标题以及摘要,获取读取结果;

22、基于词频统计的方法以及所述读取结果提取各所述聚类的高频关键词;

23、基于所述高频关键词判断各所述聚类中的技术主题,并根据相应的判断结果以及读取的所述专利文献的内容确定并命名所述技术主题。

24、可选的,所述基于各所述主题聚类结果以及相应的命名结果确定所述目标企业的技术关联,包括:

25、基于所述主题聚类结果以及所述命名结果构建预设的主题技术网络,利用所述主题技术网络对应的节点和边表示主题以及所述主题之间的关联;

26、计算任意两个所述主题中相同的所述专利文献的数量,将所述数量确定为主题关联强度的权重值,并将所述权重值赋值到所述任意两个所述主题对应的边;

27、基于各所述边的权重值以及预设的相关性阈值对所述权重值小于所述相关性阈值的边进行移除,以根据相应的移除结果确定目标技术关联网络;

28、对所述目标技术关联网络的网络拓扑结构进行分析,根据相应的分析结果确定所述目标企业的技术关联。

29、第二方面,本技术公开了一种企业专利预警装置,包括:

30、预处理模块,用于基于目标企业的技术领域以及目标专利数据库构建企业专利数据集,并对所述企业专利数据集中的数据进行预处理;

31、特征向量确定模块,用于基于相应的处理后专利元数据确定所述企业专利数据集中各专利文献的特征向量;

32、初始中心点确定模块,用于利用卷积自编码器对所述特征向量进行无监督预训练,以便于从所述卷积自编码器对应的编码器中选择隐藏层,并根据所述隐藏层对应的激活值确定k-means聚类算法的初始中心点;

33、主题命名模块,用于基于所述初始中心点、所述特征向量以及所述k-means聚类算法进行迭代聚类,以得到主题聚类结果,基于所述主题聚类结果对各聚类中的技术主题进行判断,根据相应的判断结果对各所述技术主题进行命名;

34、专利预警模块,用于基于各所述主题聚类结果以及相应的命名结果确定所述目标企业的技术关联,根据所述技术关联以及所述目标企业的战略定位对所述目标企业进行专利预警。

35、第三方面,本技术公开了一种电子设备,包括:

36、存储器,用于保存计算机程序;

37、处理器,用于执行所述计算机程序以实现前述的企业专利预警方法。

38、第四方面,本技术公开了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的企业专利预警方法。

39、本技术在进行企业专利预警时,首先基于目标企业的技术领域以及目标专利数据库构建企业专利数据集,并对所述企业专利数据集中的数据进行预处理,基于相应的处理后专利元数据确定所述企业专利数据集中各专利文献的特征向量;之后利用卷积自编码器对所述特征向量进行无监督预训练,以便于从所述卷积自编码器对应的编码器中选择隐藏层,并根据所述隐藏层对应的激活值确定k-means聚类算法的初始中心点;再基于所述初始中心点、所述特征向量以及所述k-means聚类算法进行迭代聚类,以得到主题聚类结果,基于所述主题聚类结果对各聚类中的技术主题进行判断,根据相应的判断结果对各所述技术主题进行命名;最后基于各所述主题聚类结果以及相应的命名结果确定所述目标企业的技术关联,根据所述技术关联以及所述目标企业的战略定位对所述目标企业进行专利预警。可见,本技术应用卷积自动编码k-means算法实现对企业大规模专利数据集的主题聚类,可以自动高效发现数据集内在的主题结构,克服传统人工分析的局限;基于主题聚类,进行技术关联分析,可以发现不同技术领域的交叉与融合方向,判断技术发展趋势。这样一来,本技术相比单独手工分析,融合算法自动化与人工经验,实现专利挖掘与预警的高效、智能化;同时提高了专利数据分析的效率、规模和客观性,为企业快速应对技术变革,提升核心竞争力提供了重要支撑。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1