物联网资产识别方法、装置、设备及存储介质与流程

文档序号:31712505发布日期:2022-10-04 20:06阅读:144来源:国知局
物联网资产识别方法、装置、设备及存储介质与流程

1.本公开涉及物联网技术领域,尤其涉及一种物联网资产识别方法、装置、设备及存储介质。


背景技术:

2.随着万物互联的普及和人工智能技术的发展,越来越多的物联网设备及服务暴露在互联网中,物联网安全问题也备受关注,物联网资产识别是物联网安全中必要且关键的一环。
3.传统的资产识别方法是人工主导的,人工成本和时间成本偏高,而一般结合人工智能的物联网资产识别方法,是将聚类算法应用其中,其准确率有待进一步提高。


技术实现要素:

4.为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种物联网资产识别方法、装置、设备及存储介质。
5.第一方面,本公开实施例提供了一种物联网资产识别方法,包括:
6.获取物联网设备的资产信息;
7.提取所述资产信息的关键字,并对所述资产信息进行向量化处理,生成与所述物联网设备对应的向量化数据;
8.将所述关键字与资产分类库进行匹配,若所述资产分类库中不存在所述关键字,则对所述向量化数据进行降维处理;
9.将降维处理后的所述向量化数据进行多分类,确定所述物联网设备的分类结果。
10.可选地,所述提取所述资产信息的关键字,并对所述资产信息进行向量化处理,生成与所述物联网设备对应的向量化数据,包括:
11.对所述资产信息进行有效信息提取,生成文本数据;
12.对所述文本数据进行分词,并通过tf-idf算法确定所述文本数据的关键字;以及
13.对所述文本数据进行向量化处理,生成所述向量化数据。
14.可选地,在将所述关键字与资产分类库进行匹配之后,还包括:
15.若所述资产分类库中存在所述关键字,则对所述资产信息进行标签化和统一化处理,并存储至所述资产分类库中。
16.可选地,所述将降维处理后的所述向量化数据进行多分类,确定所述物联网设备的分类结果,包括:
17.将所述降维处理后的所述向量化数据输入boosting算法模型进行处理,确定所述物联网设备对应的类别;
18.若所述类别为所述资产分类库包含的资产类别,则对所述资产信息进行标签化和统一化处理,并存储至所述资产分类库中。
19.可选地,在确定所述物联网设备对应的类别之后,还包括:
20.在所述降维处理后的所述向量化数据中确定所述类别不为所述资产分类库包含的资产类别的目标数据;
21.通过聚类算法对所述目标数据进行聚类,生成聚类结果;
22.对所述聚类结果进行标定,以存储至所述资产分类库中。
23.可选地,所述方法还包括:根据所述物联网设备的分类结果更新所述资产分类库。
24.可选地,所述获取物联网设备的资产信息,包括:
25.发送网络协议通信请求,以探测物联网设备;
26.响应于返回的响应信息,确定所述物联网设备的资产信息。
27.第二方面,本公开实施例提供了一种物联网资产识别装置,包括:
28.获取模块,用于获取物联网设备的资产信息;
29.处理模块,用于提取所述资产信息的关键字,并对所述资产信息进行向量化处理,生成与所述物联网设备对应的向量化数据;
30.匹配模块,用于将所述关键字与资产分类库进行匹配,若所述资产分类库中不存在所述关键字,则对所述向量化数据进行降维处理;
31.分类模块,用于将降维处理后的所述向量化数据进行多分类,确定所述物联网设备的分类结果。
32.第三方面,本公开实施例提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述第一方面所述的物联网资产识别方法。
33.第四方面,本公开实施例提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的物联网资产识别方法。
34.本公开实施例提供的技术方案与现有技术相比具有如下优点:通过获取物联网设备的资产信息,提取所述资产信息的关键字,并对所述资产信息进行向量化处理,生成与所述物联网设备对应的向量化数据;将所述关键字与资产分类库进行匹配,若所述资产分类库中不存在所述关键字,则对所述向量化数据进行降维处理,并将降维处理后的所述向量化数据进行多分类,确定所述物联网设备的分类结果。由此,基于自然语言处理技术、降维算法以及集成学习多分类算法实现物联网资产识别分类,减少物联网资产识别分类所产生的人工成本和时间成本,提升了物联网资产识别分类的准确性和智能性。
附图说明
35.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
36.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
37.图1为本公开实施例所提供的一种物联网资产识别方法的流程示意图;
38.图2为本公开实施例所提供的另一种物联网资产识别方法的示意图;
39.图3为本公开实施例所提供的一种物联网资产识别装置的结构示意图;
40.图4为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
41.为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
42.在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
43.图1为本公开实施例所提供的一种物联网资产识别方法的流程示意图,本公开实施例提供的方法可以由物联网资产识别装置来执行,该装置可以采用软件和/或硬件实现,并可集成在任意具有计算能力的电子设备上,例如智能手机、平板电脑等用户终端。
44.如图1所示,本公开实施例提供的物联网资产识别方法可包括:
45.步骤101,获取物联网设备的资产信息。
46.本公开实施例的方法,可以应用于物联网设备的资产识别分类场景。其中,物联网设备包括但不限于智能家居设备、智能汽车、传感器设备、医疗设备等。
47.本实施例中,可以发送网络协议通信请求,以探测物联网设备,进而,响应于返回的响应信息,确定物联网设备的资产信息。具体地,设置主动识别模块,该主动识别模块通过主动发送网络协议通信请求的方式探测互联网上的资产,通过请求返回的响应信息来收集物联网设备资产信息,主动识别模块运用的技术包括但不限于nmap等,获取的资产信息包括多维度的数据。
48.步骤102,提取资产信息的关键字,并对所述资产信息进行向量化处理,生成与所述物联网设备对应的向量化数据。
49.本实施例中,获取到物联网设备资产信息后,对收集的资产信息进行向量化处理,包括提取报文中的属性以及标签内容等有效信息,然后对有效信息进行分词、关键字提取及文本数据的向量化处理。
50.作为一种示例,所述提取所述资产信息的关键字,并对所述资产信息进行向量化处理,生成与所述物联网设备对应的向量化数据,包括:对所述资产信息进行有效信息提取,生成文本数据;对所述文本数据进行分词,并通过tf-idf(term frequency

inverse document frequency,词频-逆文本频率指数)算法确定所述文本数据的关键字;以及对所述文本数据进行向量化处理,生成所述向量化数据。
51.本示例中,通过自然语言处理技术提取与资产识别相关的有效信息,以生成相应的文本数据,进而,提取文本数据的关键字,以根据关键字进行匹配。例如,关键字可以是企业名称、设备型号、资产类型等。
52.其中,在自然语言处理的领域中,通过文本数据的向量化处理将文本表示为能够表达文本语义的向量,文本数据向量化处理的方式包括但不限于基于统计的方法、基于神经网络的方法等,例如,可以采用向量化算法word2vec生成文本数据的向量化数据。
53.步骤103,将关键字与资产分类库进行匹配,若资产分类库中不存在关键字,则对向量化数据进行降维处理。
54.本实施例中,资产分类库中包括多个关键字,将文本数据的关键字与资产分类库中的关键字进行匹配,在本公开的一个实施例中,在将所述关键字与资产分类库进行匹配之后,还包括:若所述资产分类库中存在所述关键字,则对所述资产信息进行标签化和统一化处理,并存储至所述资产分类库中。其中,通过对文本数据进行标签化和统一化处理,以实现物联网设备的存库处理,作为一种示例,对于物联网设备一,确定文本数据的关键字包括xx企业,将关键字xx企业与资产分类库进行匹配后,若确定资产分类库中也存在关键字xx企业,则对物联网设备一进行存库处理,并通过对文本数据进行标签化和统一化处理,根据处理后的文本数据更新资产分类库。
55.本实施例中,在资产分类库中不存在所述关键字的情况下,对向量化数据进行降维处理。在物联网设备资产识别场景下,随着物联网资产信息维度增加,会造成维度灾难,维度灾难是指在涉及到向量计算的问题中,随着维数的增加,计算量呈指数倍增长的一种现象,在维度灾难情况下,聚类算法会增加大量计算并带来数据的准确性问题,因此,本实施例中首先对向量化数据进行降维处理,具体地,对多个物联网设备对应的关键字与资产分类库进行匹配之后,确定资产分类库中不存在所述关键字的至少一个物联网设备,并采用pca(principal component analysis)等数据降维技术对至少一个物联网设备对应的向量化数据进行降维处理。
56.步骤104,将降维处理后的所述向量化数据进行多分类,确定所述物联网设备的分类结果。
57.本实施例中,将降维后的向量化数据,作为分类模型的输入,分类模型输出的类别包括当前资产分类库中的资产类型,从而确定物联网设备的分类结果,可选地,根据物联网设备的分类结果对物联网设备进行存库处理,并更新资产分类库。
58.作为一种示例,将降维处理后的所述向量化数据进行多分类,确定所述物联网设备的分类结果,包括:将所述降维处理后的所述向量化数据输入boosting算法模型进行处理,确定所述物联网设备对应的类别;若所述类别为所述资产分类库包含的资产类别,则对所述资产信息进行标签化和统一化处理,并存储至所述资产分类库中。
59.本示例中,根据样本数据训练分类模型,分类模型的输出为资产类型,输入为向量化数据,可选地,根据资产分类库中已存库的物联网设备的向量化数据和资产类型构建样本数据,以训练分类模型。
60.本示例中,模型输出的类别包括资产分类库包含的第一资产类别,以及资产分类库不包含的第二资产类别,可选地,在确定所述物联网设备对应的类别之后,若物联网设备对应的类别为第一资产类别,则对物联网设备进行存库处理,若物联网设备对应的类别为第二资产类别,则进一步对该物联网设备进行标定,即在降维处理后的向量化数据中确定类别不为所述资产分类库包含的资产类别的目标数据;通过聚类算法对目标数据进行聚类,生成聚类结果;对所述聚类结果进行标定,以存储至所述资产分类库中。其中,聚类算法包括但不限于kmeans算法,通过对此部分数据进行聚类,得到不同种类的资产种类信息,进而基于聚类出的资产种类信息进行标定以确定新增的资产类别或已存在的资产类别,并基于标定结果更新资产分类库。
61.举例而言,参照图2,设置主动识别模块、向量化模块、匹配模块、降维模块、集成分类模块、聚类模块以及人工干预模块。其中,通过物联网网关主动发现模型,通过nmap进行
主动探测互联中的物联网资产设备,并对探测的响应数据进行初步数据清洗。对于任一物联网设备,对数据进行向量化处理,同时利用tf-idf算法从数据中提取关键字,然后利用提取的关键字到当前资产分类库中进行匹配,如果匹配到,则将当前物联网设备进行存库处理,并更新资产分类库;若未匹配到,则对向量化数据进行数据降维处理,利用集成学习boosting算法处理降维后的向量化数据,将得到的分类结果与资产分类库中的类别进行比对,将未比对成功的数据进行进一步聚类处理,综上,将上述处理后的结果展现在网关界面,包括已分类和未分类的数据。进一步,在网关界面上,根据客户提供的进一步信息,对已分类的资产进行核实,对未分类的资产进行重新标定,并进行存库处理和资产分类库更新,包括但不限于库中关键字和资产类型的更新。于此往复的执行上述几步流程,提升物联网资产分类的准确性和自动化性。
62.根据本公开实施例的技术方案,通过获取物联网设备的资产信息,提取所述资产信息的关键字,并对所述资产信息进行向量化处理,生成与所述物联网设备对应的向量化数据;将所述关键字与资产分类库进行匹配,若所述资产分类库中不存在所述关键字,则对所述向量化数据进行降维处理,并将降维处理后的所述向量化数据进行多分类,确定所述物联网设备的分类结果。由此,基于自然语言处理技术、降维算法以及集成学习多分类算法实现资产识别分类,减少物联网资产识别分类所产生的人工成本和时间成本,提升了物联网资产识别分类的准确性和智能性。
63.图3为本公开实施例所提供的一种物联网资产识别装置的结构示意图,如图3所示,该物联网资产识别装置包括:获取模块31,处理模块32,匹配模块33,分类模块34。
64.其中,获取模块31,用于获取物联网设备的资产信息;
65.处理模块32,用于提取所述资产信息的关键字,并对所述资产信息进行向量化处理,生成与所述物联网设备对应的向量化数据;
66.匹配模块33,用于将所述关键字与资产分类库进行匹配,若所述资产分类库中不存在所述关键字,则对所述向量化数据进行降维处理;
67.分类模块34,用于将降维处理后的所述向量化数据进行多分类,确定所述物联网设备的分类结果。
68.在本公开的一个实施例中,处理模块32具体用于:对所述资产信息进行有效信息提取,生成文本数据;对所述文本数据进行分词,并通过tf-idf算法确定所述文本数据的关键字;以及对所述文本数据进行向量化处理,生成所述向量化数据。
69.在本公开的一个实施例中,该装置还包括:第一存库模块,用于若所述资产分类库中存在所述关键字,则对所述资产信息进行标签化和统一化处理,并存储至所述资产分类库中。
70.在本公开的一个实施例中,分类模块34具体用于:将所述降维处理后的所述向量化数据输入boosting算法模型进行处理,确定所述物联网设备对应的类别;若所述类别为所述资产分类库包含的资产类别,则对所述资产信息进行标签化和统一化处理,并存储至所述资产分类库中。
71.在本公开的一个实施例中,分类模块34具体用于:在所述降维处理后的所述向量化数据中确定所述类别不为所述资产分类库包含的资产类别的目标数据;通过聚类算法对所述目标数据进行聚类,生成聚类结果;对所述聚类结果进行标定,以存储至所述资产分类
库中。
72.在本公开的一个实施例中,该装置还包括:更新模块,用于根据所述物联网设备的分类结果更新所述资产分类库。
73.在本公开的一个实施例中,获取模块31具体用于:发送网络协议通信请求,以探测物联网设备;响应于返回的响应信息,确定所述物联网设备的资产信息。
74.本公开实施例所提供的物联网资产识别装置可执行本公开实施例所提供的任意物联网资产识别方法,具备执行方法相应的功能模块和有益效果。本公开装置实施例中未详尽描述的内容可以参考本公开任意方法实施例中的描述。
75.图4为本公开实施例提供的一种电子设备的结构示意图。如图4所示,电子设备600包括一个或多个处理器601和存储器602。
76.处理器601可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备600中的其他组件以执行期望的功能。
77.存储器602可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器601可以运行程序指令,以实现上文的本公开的实施例的方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
78.在一个示例中,电子设备600还可以包括:输入装置603和输出装置604,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。此外,该输入装置603还可以包括例如键盘、鼠标等等。该输出装置604可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置604可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
79.当然,为了简化,图4中仅示出了该电子设备600中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备600还可以包括任何其他适当的组件。
80.除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本公开实施例所提供的任意方法。
81.计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
82.此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本公开实施例所提供的任意方法。
83.计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是
可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
84.需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
85.以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1