本申请涉及时空知识图谱,且更为具体地,涉及一种基于网络采集数据的时空知识图谱智能构建方法及系统。
背景技术:
1、随着互联网的快速发展和信息爆炸式增长,人们可以从各种网络平台上获取大量的文本数据。这些数据包含了丰富的知识和信息,但由于数据来源的多样性和异构性,如何有效地整合和利用这些数据成为一个重要的挑战。
2、时空知识图谱是一种能够表示实体在不同时间和空间下的属性和关系的图结构,其中实体和实体之间的关系以及实体的属性被表示为图中的节点和边。时空知识图谱可以帮助理解和推理知识,从而能够为多领域的智能应用提供丰富的知识支持,如问答系统、推荐系统和智能搜索等。然而,现有的时空知识图谱构建方法通常需要手工编写规则或使用特定的领域知识来构建,很难应对数据规模的增长和知识更新的需求。并且,现有的构建方案通常只能从单一的数据源中抽取实体的信息,导致知识图谱的信息覆盖度和表达能力有限。
3、因此,期望一种优化的基于网络采集数据的时空知识图谱智能构建方案。
技术实现思路
1、为了解决上述技术问题,提出了本申请。本申请提供了一种基于网络采集数据的时空知识图谱智能构建方法及系统,其可以从不同平台获取关于同一实体的文本描述,并在后端引入基于人工智能的数据处理和语义理解算法对来自不同平台的关于同一实体的文本描述进行语义分析融合和实体描述生成,以使得所构造的知识图谱具有更大的信息全面度。
2、根据本申请的一个方面,提供了一种基于网络采集数据的时空知识图谱智能构建方法,其包括:
3、从第一网络平台提取第一实体的第一文本描述;
4、从第二网络平台提取所述第一实体的第二文本描述;
5、对所述第一实体的第一文本描述进行基于词粒度的语义编码和分析以得到第一文本描述词粒度语义编码特征向量的序列;
6、对所述第一实体的第二文本描述进行基于词粒度的语义编码和分析以得到第二文本描述词粒度语义编码特征向量的序列;
7、对所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列进行词粒度语义交互融合编码以得到第一文本描述-第二文本描述细粒度语义交互融合特征;
8、以及基于所述第一文本描述-第二文本描述细粒度语义交互融合特征,生成所述第一实体的更新文本描述。
9、根据本申请的另一个方面,提供了一种基于网络采集数据的时空知识图谱智能构建系统,其包括:
10、第一文本描述提取模块,用于从第一网络平台提取第一实体的第一文本描述;
11、第二文本描述提取模块,用于从第二网络平台提取所述第一实体的第二文本描述;
12、第一语义编码分析模块,用于对所述第一实体的第一文本描述进行基于词粒度的语义编码和分析以得到第一文本描述词粒度语义编码特征向量的序列;
13、第二语义编码分析模块,用于对所述第一实体的第二文本描述进行基于词粒度的语义编码和分析以得到第二文本描述词粒度语义编码特征向量的序列;
14、词粒度语义交互融合编码模块,用于对所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列进行词粒度语义交互融合编码以得到第一文本描述-第二文本描述细粒度语义交互融合特征;
15、以及更新文本描述生成模块,用于基于所述第一文本描述-第二文本描述细粒度语义交互融合特征,生成所述第一实体的更新文本描述。
16、与现有技术相比,本申请提供的基于网络采集数据的时空知识图谱智能构建方法及系统,其首先对第一网络平台提取的第一实体的第一文本描述和第二网络平台提取的第一实体的第二文本描述分别进行基于词粒度的语义编码和分析以得到第一文本描述词粒度语义编码特征向量的序列和第二文本描述词粒度语义编码特征向量的序列,接着进行词粒度语义交互融合编码以得到第一文本描述-第二文本描述细粒度语义交互融合特征,最后基于所述第一文本描述-第二文本描述细粒度语义交互融合特征,生成所述第一实体的更新文本描述,这样可以使得所构造的知识图谱具有更大的信息全面度,并且可以综合不同平台的文本表达特色。
1.一种基于网络采集数据的时空知识图谱智能构建方法,其特征在于,包括:
2.根据权利要求1所述的基于网络采集数据的时空知识图谱智能构建方法,其特征在于,对所述第一实体的第一文本描述进行基于词粒度的语义编码和分析以得到第一文本描述词粒度语义编码特征向量的序列,包括:
3.根据权利要求2所述的基于网络采集数据的时空知识图谱智能构建方法,其特征在于,对所述第一实体的第二文本描述进行基于词粒度的语义编码和分析以得到第二文本描述词粒度语义编码特征向量的序列,包括:
4.根据权利要求3所述的基于网络采集数据的时空知识图谱智能构建方法,其特征在于,对所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列进行词粒度语义交互融合编码以得到第一文本描述-第二文本描述细粒度语义交互融合特征,包括:
5.根据权利要求4所述的基于网络采集数据的时空知识图谱智能构建方法,其特征在于,使用词粒度语义交互层对所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列进行处理以得到第一文本描述-第二文本描述细粒度语义交互融合特征向量作为所述第一文本描述-第二文本描述细粒度语义交互融合特征,包括:
6.根据权利要求5所述的基于网络采集数据的时空知识图谱智能构建方法,其特征在于,基于所述第一文本描述-第二文本描述细粒度语义交互融合特征,生成所述第一实体的更新文本描述,包括:
7.根据权利要求6所述的基于网络采集数据的时空知识图谱智能构建方法,其特征在于,对所述第一文本描述-第二文本描述细粒度语义交互融合特征向量进行特征校正处理以得到校正第一文本描述-第二文本描述细粒度语义交互融合特征向量,包括:
8.一种基于网络采集数据的时空知识图谱智能构建系统,其特征在于,包括:
9.根据权利要求8所述的基于网络采集数据的时空知识图谱智能构建系统,其特征在于,所述第一语义编码分析模块,用于:
10.根据权利要求9所述的基于网络采集数据的时空知识图谱智能构建系统,其特征在于,所述第二语义编码分析模块,用于: