技术机会识别方法、装置、计算机设备及存储介质

文档序号:37217813发布日期:2024-03-05 15:09阅读:19来源:国知局
技术机会识别方法、装置、计算机设备及存储介质

本发明涉及大数据,具体涉及技术机会识别方法、装置、计算机设备及存储介质。


背景技术:

1、当今世界知识更新步伐加快,产品生命周期缩短。市场机遇稍纵即逝,企业一旦在关键领域技术机会识别与分析上出现错误,不仅会浪费宝贵、有限的资源,而且会导致技术机会丧失,甚至直接影响企业未来发展。技术机会是指未来可能发生且可以利用的技术变化,是企业进行技术创新的关键。技术机会的核心是利用文本挖掘技术对学术论文、专利信息、网络资源等进行深度挖掘,识别出现有技术之间的相互关系及横向发展趋势,技术机会分析实质上是技术知识的挖掘,已被广泛应用于科技发展态势评价与技术机会分析。

2、相关技术中,现有的技术机会识别方法大多依赖专家进行人工识别,宏观技术领域适用性差且运算效率低下,很难适用于现今宏观技术领域、面向大数据的使用场景,难以满足大数据环境的信息量对技术机会识别的需求。


技术实现思路

1、有鉴于此,本发明提供了一种技术机会识别方法、装置、计算机设备及存储介质,以解决现有技术机会识别适用性差、人工依赖性强且工作效率低的问题。

2、第一方面,本发明提供了一种技术机会识别方法,方法包括:

3、根据待分析技术领域,采集待分析技术领域对应的初始文献数据集;

4、对初始文献数据集进行预处理,得到预分析数据集;

5、对预分析数据集进行筛选,确定待分析技术领域对应的技术主路径,其中,技术主路径是指一个待分析技术领域中一个技术主题的演进发展历程;

6、计算技术主路径的发展成熟度,确定技术主路径所处的发展阶段,其中,预先根据技术演进发展的阶段将技术主题演进发展历程划分为多个发展阶段;

7、基于确定出的发展阶段,确定待分析技术领域的潜在技术机会。

8、在本发明中,通过采集技术领域内的文献数据集,预处理并筛选得到技术领域对应的技术主题的演进发展历程对应的技术主路径,计算技术主路径的发展成熟度,确定主路径的发展程度,识别并描述出领域现存的潜在技术机会,有助于自动揭示出具有重要技术价值和技术发展潜力的技术机会,且通过多步骤多模式对数据集进行层层筛选,更适合基于大量级的领域数据集来揭示相对宏观的技术机会,提升了对领域技术机会识别的有效性和准确性。

9、在一种可选的实施方式中,对初始文献数据集进行预处理,得到预分析数据集,包括:

10、对初始文献数据集进行实体关联抽取,得到待分析技术领域对应的技术实体集合;

11、将技术实体集合划分为若干时间窗,对各时间窗的技术实体进行实体语义关联计算和聚类,得到预分析数据集。

12、在该方式中,通过对文献数据集进行技术实体及实体关联抽取,划分时间窗,进行实体语义关联计算及聚类分析,实现了对文献数据集的进一步筛选与过滤,确保预分析数据集涵盖的技术实体内容相对准确完整。

13、在一种可选的实施方式中,对初始文献数据集进行实体关联抽取,得到待分析技术领域对应的技术实体集合,包括:

14、基于材料、产品、方法、功效及应用领域技术实体类型,对初始文献数据集进行主谓宾结构抽取,得到初始文献数据集对应的主谓宾结构;

15、利用通用信息抽取框架,结合知识增强语义表示模型,抽取得到待分析技术领域对应的不同类型的技术实体集合及实体关联。

16、在该方式中,通过基于材料、产品、方法、功效及应用领域技术实体类型,对初始文献数据集进行主谓宾结构抽取,利用通用信息抽取框架结合知识增强语义表示模型,实现实体及实体关联抽取,具备良好的迁移和泛化能力,一定程度上实现了领域实体及实体关联的自动化。

17、在一种可选的实施方式中,对预分析数据集进行筛选,确定待分析技术领域对应的技术主路径,包括:

18、基于预分析数据集中相邻时间窗的实体类的主谓宾结构,计算预分析数据集中相邻时间窗的实体类之间的互信息量,筛选得到相邻时间窗的实体类之间的互信息量大于互信息量阈值的实体类作为核心技术主题;

19、基于核心技术主题,构建核心技术主题对应的时序关联网络;

20、基于时序关联网络,识别待分析技术领域对应的技术主路径。

21、在该方式中,通过构建时序关联网络,利用时序关联网络识别技术实体的演化主路径,便于找到技术价值高、且有发展前景的技术路径。

22、在一种可选的实施方式中,基于时序关联网络,识别待分析技术领域对应的技术主路径,包括:

23、基于共有主谓宾结构,遍历计算得到时序关联网络中所有路径的技术权重;

24、筛选得到技术权重不小于预设技术权重阈值且路径终点在当前时间点的路径作为待分析技术领域对应的技术主路径。

25、在该方式中,由于主题关联网络包含关联信息较强的演化路径,因而主路径的选择可以在主题关联网络的基础上进行,便于进一步筛选具有发展空间的技术主路径。

26、在一种可选的实施方式中,基于确定出的发展阶段,确定待分析技术领域的潜在技术机会,包括:

27、基于确定出的发展阶段,对技术主路径进行发展阶段筛选,得到第一主路径集合;

28、对第一主路径集合进行排序,得到第二主路径集合,利用第二主路径集合中的实体主题类构建实体类关联矩阵;

29、基于主谓宾结构,筛选得到备选技术机会集合;

30、计算备选技术机会集合中各实体的技术机会值,确定待分析技术领域的潜在技术机会。

31、在该方式中,针对当前筛选出的具有发展潜力的各类型技术主路径,进而得到覆盖各类型技术实体的主路径的多个重要技术实体聚类集合,并基于此构建有限数量的实体类关联矩阵,通过实体语义关联计算挖掘具有潜在关联的实体类对,进而识别并描述出该领域现存的潜在技术机会。

32、在一种可选的实施方式中,基于主谓宾结构,筛选得到备选技术机会集合,包括:

33、基于主谓宾结构,计算得到实体类关联矩阵中实体类之间的关联强度;

34、将实体类之间的关联强度低于关联矩阵值阈值的实体类对纳入备选技术机会集合。

35、在该方式中,通过依据实体类关联强度识别出技术未实现或较少实现的功能或应用领域,从关联矩阵中获取备选技术机会集合,进而完成技术领域内的技术机会的自动识别。

36、第二方面,本发明提供了一种技术机会识别装置,装置包括:

37、数据采集模块,用于根据待分析技术领域,采集待分析技术领域对应的初始文献数据集;

38、数据预处理模块,用于对初始文献数据集进行预处理,得到预分析数据集;

39、技术路径确定模块,用于对预分析数据集进行筛选,确定待分析技术领域对应的技术主路径,其中,技术主路径是指一个待分析技术领域中一个技术主题的演进发展历程;

40、发展阶段确定模块,用于计算技术主路径的发展成熟度,确定技术主路径所处的发展阶段,其中,预先根据技术演进发展的阶段将技术主题演进发展历程划分为多个发展阶段;

41、技术机会确定模块,用于基于确定出的发展阶段,确定待分析技术领域的潜在技术机会。

42、第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的技术机会识别方法。

43、第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的技术机会识别方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1