一种网络加密资产数据的分析方法和分析装置与流程

文档序号:37940908发布日期:2024-05-11 00:19阅读:10来源:国知局
一种网络加密资产数据的分析方法和分析装置与流程

本发明涉及一种网络加密资产数据的分析方法和分析装置,属于网络测绘资产行业识别。


背景技术:

1、随着互联网的持续发展,网络空间资产测绘在多个行业中得到了广泛的应用,尤其是在企业信息化、网络安全和云计算等领域,在利用测绘资产分析风险资产、威胁资产应对安全威胁的过程中,分析问题资产影响的行业对相关部门也是至关重要的。但随着数据的爆炸性增长,如何从海量的资产数据中准确提取关键信息并确定其归属行业,成为了一个挑战。关键的问题在于,网络资产测绘得到的资产数据中,可能包含了大量的行业关键词、企业信息等内容。这些信息在单独看来,可能不足以确定资产的归属行业。而在多个数据点之间,往往存在着隐性的联系和上下文关系,这就需要一种更为高效和智能的方式来分析和处理。


技术实现思路

1、为此,本发明提供一种网络加密资产数据的分析方法和分析装置,以解决网络测绘资产行业归属划分的问题,从而提高网络的安全性。

2、为了实现上述目的,本发明实施例提供如下技术方案:

3、本发明提供一种网络加密资产数据的分析方法,包括:

4、基于行业网络信息构建不同行业的信息库;

5、对预设的资产数据的文本进行预处理,并将预处理结果转换为与bert模型相匹配的输入格式;

6、基于bert模型与不同行业的信息库对预处理结果进行综合分析,得到资产数据在不同行业的综合得分;

7、根据综合得分,确认得分最高的行业作为资产数据的行业归属。

8、进一步地,所述基于行业网络信息构建不同行业的信息库包括:

9、获取包含不同行业的关键词,术语和短语的海量信息;

10、为每个行业标签创建一个词库,将海量信息中分属每个行业的关键词,术语和短语输入到对应词库;

11、对每个关键词,术语和短语进行数据分析,并基于分析结果匹配对应权重值。

12、进一步地,所述对预设的资产数据的文本进行预处理,并将预处理结果转换为与bert模型相匹配的输入格式包括:

13、对所述资产数据进行清洗,去除无关内容和噪音;

14、使用文本分词工具将资产数据的文本划分为词或者短语形式的分词结果;

15、将分词结果转换为与bert模型相匹配的输入格式。

16、进一步地,所述基于bert模型与不同行业的信息库对预处理结果进行综合分析,得到资产数据在不同行业的综合得分包括:

17、使用预训练的bert模型对资产数据的文本进行向量化,将文本中的每条资产信息转换为一个高维向量;

18、利用向量的语义信息,对每个行业标签计算与资产信息的相似度;

19、将相似度值与信息库中的行业词库的权重进行综合加权平均,得到语义分析得分;

20、利用不同行业的信息库,对资产数据的文本进行关键词匹配;

21、根据匹配的关键词数量和权重,为每个行业计算一个关键词匹配得分;

22、根据语义分析得分及关键词匹配得分计算出综合得分。

23、根据本发明的另外一个方面,提供一种网络加密资产数据的分析装置,包括:

24、构建模块,用于基于行业网络信息构建不同行业的信息库;

25、处理模块,用于对预设的资产数据的文本进行预处理,并将预处理结果转换为与bert模型相匹配的输入格式;

26、分析模块,用于基于bert模型与不同行业的信息库对预处理结果进行综合分析,得到资产数据在不同行业的综合得分;

27、确认模块,用于根据综合得分,确认得分最高的行业作为资产数据的行业归属。

28、进一步地,所述构建模块包括:

29、获取模块,用于获取包含不同行业的关键词,术语和短语的海量信息;

30、创建模块,用于为每个行业标签创建一个词库,将海量信息中分属每个行业的关键词,术语和短语输入到对应词库;

31、第一匹配模块,用于对每个关键词,术语和短语进行数据分析,并基于分析结果匹配对应权重值。

32、进一步地,所述处理模块包括:

33、清洗模块,用于对所述资产数据进行清洗,去除无关内容和噪音;

34、分词模块,用于使用文本分词工具将资产数据的文本划分为词或者短语形式的分词结果;

35、转换模块,用于将分词结果转换为与bert模型相匹配的输入格式。

36、进一步地,所述分析模块包括:

37、向量化模块,用于使用预训练的bert模型对资产数据的文本进行向量化,将文本中的每条资产信息转换为一个高维向量;

38、第一计算模块,用于利用向量的语义信息,对每个行业标签计算与资产信息的相似度;

39、加权模块,用于将相似度值与信息库中的行业词库的权重进行综合加权平均,得到语义分析得分;

40、第二匹配模块,用于利用不同行业的信息库,对资产数据的文本进行关键词匹配;

41、第二计算模块,用于根据匹配的关键词数量和权重,为每个行业计算一个关键词匹配得分;

42、第三计算模块,用于根据语义分析得分及关键词匹配得分计算出综合得分。

43、本发明还提供一种智能终端,所述智能终端包括:数据采集装置、处理器和存储器;

44、所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行如上所述的分析方法。

45、本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行如上所述的分析方法。

46、本发明的有益效果主要体现在:

47、本发明提供的网络加密资产数据的分析方法和分析装置可以为网络测绘资产补充行业归属信息,在分析风险资产、威胁资产时,可以有效判断哪些行业中的网络资产存在哪种风险,以及哪些行业易受到网络攻击等,为企业决策提供有力的数据支撑。本发明提出“网络测绘资产行业归属”的概念,通过bert模型并结合关键词检索技术,有效地对网络空间资产测绘的文本数据进行深入分析,综合考量各个字段的权重和关联性,对资产数据加权计算,从而获得资产的行业归属。这种机器学习与关键词检索相结合的方法,不仅提高了分析的准确性,还大大提高了处理效率。而且本发明所构建的所有测绘资产、权重等相关,与具体网站无关,故可以方便的移植到其他网站或网络测绘资产,因此具备一定的普适性。



技术特征:

1.一种网络加密资产数据的分析方法,其特征在于,包括:

2.根据权利要求1的分析方法,其特征在于,所述基于行业网络信息构建不同行业的信息库包括:

3.根据权利要求1的分析方法,其特征在于,所述对预设的资产数据的文本进行预处理,并将预处理结果转换为与bert模型相匹配的输入格式包括:

4.根据权利要求1的分析方法,其特征在于,所述基于bert模型与不同行业的信息库对预处理结果进行综合分析,得到资产数据在不同行业的综合得分包括:

5.一种网络加密资产数据的分析装置,其特征在于,包括:

6.根据权利要求5的分析装置,其特征在于,所述构建模块包括:

7.根据权利要求5的分析装置,其特征在于,所述处理模块包括:

8.根据权利要求5的分析装置,其特征在于,所述分析模块包括:

9.一种智能终端,其特征在于,所述智能终端包括:数据采集装置、处理器和存储器;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行如权利要求1-4任一项所述的分析方法。


技术总结
本发明公开了一种网络加密资产数据的分析方法和分析装置,所述分析方法包括:基于行业网络信息构建不同行业的信息库;对预设的资产数据的文本进行预处理,并将预处理结果转换为与BERT模型相匹配的输入格式;基于BERT模型与不同行业的信息库对预处理结果进行综合分析,得到资产数据在不同行业的综合得分;根据综合得分,确认得分最高的行业作为资产数据的行业归属。本发明通过BERT模型并结合关键词检索技术,有效地对网络空间资产测绘的文本数据进行深入分析,综合考量各个字段的权重和关联性,对资产数据加权计算,从而获得资产的行业归属,为企业决策提供有力的数据支撑。

技术研发人员:朱志宇,梁兴强
受保护的技术使用者:北京观成科技有限公司
技术研发日:
技术公布日:2024/5/10
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1