本发明实施例涉及计算机,尤其涉及一种图谱构建方法、装置、电子设备及存储介质。
背景技术:
1、产业链的本质是用于描述一个具有某种内在联系的企业群结构,它是一个相对宏观的概念,存在两维属性:结构属性和价值属性。产业链中大量存在着上下游关系和相互价值的交换,上游环节向下游环节输送产品或服务,下游环节向上游环节反馈信息。
2、目前,对某产业进行分析时,需要构建该产业的产业链图谱;一般的,在构建产业链图谱时,需要人工大量查阅产业资料,比较繁琐,另外,人工查阅产业资料构建产业链图谱还有可能出现构建不全面等问题。
技术实现思路
1、鉴于此,为解决上述在构建产业链图谱时,需要人工大量查阅产业资料,比较繁琐,另外,人工查阅产业资料构建产业链图谱还有可能出现构建不全面的技术问题,本发明实施例提供一种图谱构建方法、装置、电子设备及存储介质。
2、第一方面,本发明实施例提供一种图谱构建方法,所述方法包括:
3、从预设的产业数据库中确定与目标产业匹配的产业数据;
4、根据所述产业数据确定产业链图谱中各实体之间的上下位关系;
5、获取所述目标产业的企业信息;
6、根据所述上下位关系及所述企业信息,构建所述目标产业的产业链图谱。
7、在一可能的实施方式中,所述根据所述产业数据确定产业链图谱中各实体之间的上下位关系,包括:
8、获取预先训练的关系确定模型;
9、将所述产业数据输入至所述关系确定模型中,得到用于构建产业链图谱的各实体之间的上下位关系。
10、在一可能的实施方式中,所述将所述产业数据输入至所述关系确定模型中,得到用于构建产业链图谱的各实体之间的上下位关系,包括:
11、针对产业数据中每一句文本,对所述产业数据进行数据分类处理,得到分类后的文本;
12、在确定所述文本中包含上下位关系的情况下,对所述文本进行句法分析,得到包含上下位关系的词组集合;
13、确定与所述词组集合对应的词组向量;
14、对所述词组向量进行层次聚类处理,得到聚类后的词组簇;
15、根据预设的关系库,确定所述词组簇之间的上下位关系为实体之间的上下位关系。
16、在一可能的实施方式中,所述关系确定模型通过以下方式训练得到:
17、针对训练样本中每一句文本,对所述训练样本进行数据分类处理,得到分类后的文本样本;
18、在确定所述文本样本中包含上下位关系的情况下,对所述文本样本进行句法分析,得到包含上下位关系的词组样本集合;
19、确定与所述词组样本集合对应的词组向量样本为训练数据;
20、根据所述训练数据对预设的初始模型进行训练,得到关系确定模型。
21、在一可能的实施方式中,所述对所述产业数据进行数据分类处理,得到分类后的文本,包括:
22、将所述产业数据输入至预设的文本处理模型中,得到所述文本处理模型提取出的文本特征向量;
23、将所述文本特征向量输入至预设的分类模型,得到分类后的文本。
24、在一可能的实施方式中,所述对所述词组向量进行层次聚类处理,得到聚类后的词组簇,包括:
25、从多个所述词组向量中确定多个待处理的词组向量对;
26、针对每一待处理的词组向量对,利用预设的距离算法确定所述词组向量对中词组向量之间的距离值;
27、判断所述距离值是否达到预设的距离阈值;
28、若所述距离值未达到预设的距离阈值,则确定所述词组向量对中词组向量为同一词组簇;
29、若所述距离值达到预设的距离阈值,则确定所述词组向量对中词组向量为不同的词组簇。
30、在一可能的实施方式中,所述方法还包括:
31、从所述产业数据库中获取更新后的新产业数据;
32、基于所述新产业数据执行确定产业链图谱中各实体之间的上下位关系的步骤。
33、第二方面,本发明实施例提供一种图谱构建装置,所述装置包括:
34、数据确定模块,用于从预设的产业数据库中确定与目标产业匹配的产业数据;
35、关系确定模块,用于根据所述产业数据确定产业链图谱中各实体之间的上下位关系;
36、信息获取模块,用于获取所述目标产业的企业信息;
37、图谱构建模块,用于根据所述上下位关系及所述企业信息,构建所述目标产业的产业链图谱。
38、第三方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的图谱构建程序,以实现第一方面中任一项所述的图谱构建方法。
39、第四方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面中任一项所述的图谱构建方法。
40、本发明实施例提供的技术方案,通过从预设的产业数据库中确定与目标产业匹配的产业数据,根据产业数据确定产业链图谱中各实体之间的上下位关系。获取目标产业的企业信息,根据上下位关系及企业信息,构建目标产业的产业链图谱。由此,可以准确确定产业链图谱中各实体之间的上下位关系,避免需要人工大量的查阅产业资料,简化操作流程,提升了产业链图谱生成的便利性,一定程度上解决了人工构建可能不全面的问题。
1.一种图谱构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述产业数据确定产业链图谱中各实体之间的上下位关系,包括:
3.根据权利要求2所述的方法,其特征在于,所述将所述产业数据输入至所述关系确定模型中,得到用于构建产业链图谱的各实体之间的上下位关系,包括:
4.根据权利要求2所述的方法,其特征在于,所述关系确定模型通过以下方式训练得到:
5.根据权利要求3所述的方法,其特征在于,所述对所述产业数据进行数据分类处理,得到分类后的文本,包括:
6.根据权利要求3所述的方法,其特征在于,所述对所述词组向量进行层次聚类处理,得到聚类后的词组簇,包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种图谱构建装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的图谱构建程序,以实现权利要求1~7中任一项所述的图谱构建方法。
10.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1~7中任一项所述的图谱构建方法。