本发明涉及机器学习,尤其是一种物联网终端业务模型识别方法和系统、设备及存储介质。
背景技术:
1、随着生活中对以智能水电气表为主的各类物联网终端设备的需求增多,物联网开卡量也在增加,由于部分以三表为代表的物联网终端的消息上报规律呈现一定的聚集性,会引起部分地区的基站容易在集中上报时刻出现拥塞,从而影响上报质量。对于此类情况,识别不同终端设备上报业务规律模型,可以为智能错峰策略提供合适的错峰时间,从而减少基站的压力,最终提高消息上报成功率。现有技术中,大多基于人工进行物联网终端业务模型的判别和分类,效率低下且容易出错,影响了物联网终端业务模型识别的准确率。
技术实现思路
1、本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
2、为此,本发明实施例的一个目的在于提供一种物联网终端业务模型识别方法,该方法提高了物联网终端业务模型识别的效率和准确率,从而可以实现物联网终端消息上报的智能错峰,降低了基站压力,提高了消息上报成功率。
3、本发明实施例的另一个目的在于提供一种物联网终端业务模型识别系统。
4、为了达到上述技术目的,本发明实施例所采取的技术方案包括:
5、一方面,本发明实施例提供了一种物联网终端业务模型识别方法,包括以下步骤:
6、获取预设物联网终端的话单数据和设备上报数据,对所述话单数据和所述设备上报数据进行特征提取得到多个第一样本数据;
7、对所述第一样本数据进行数据清洗得到多个第二样本数据,进而对所述第二样本数据进行聚类处理得到多个业务模型类别;
8、根据所述第二样本数据生成图结构数据,进而根据所述图结构数据和所述业务模型类别生成训练数据集;
9、将所述训练数据集输入到预先构建的半监督图卷积神经网络进行模型训练,得到训练好的业务模型类别识别模型,进而根据所述业务模型类别识别模型对目标物联网终端进行业务模型识别。
10、进一步地,在本发明的一个实施例中,所述预设物联网终端包括预设智能水表终端、预设智能气表终端以及预设智能电表终端,所述获取预设物联网终端的话单数据和设备上报数据,对所述话单数据和所述设备上报数据进行特征提取得到多个第一样本数据这一步骤,其具体包括:
11、获取所述预设智能水表终端、所述预设智能气表终端以及所述预设智能电表终端的话单数据和设备上报数据;
12、对所述话单数据和所述设备上报数据进行特征提取,得到imei号、周上报时间、周上报次数、总上报次数、平均上报频率以及总流量数据;
13、根据所述imei号、所述周上报时间、所述周上报次数、所述总上报次数、所述平均上报频率以及所述总流量数据生成多维特征数据,进而根据所述多维特征数据确定对应的所述预设物联网终端的第一样本数据。
14、进一步地,在本发明的一个实施例中,所述对所述第一样本数据进行数据清洗得到多个第二样本数据这一步骤,其具体包括:
15、根据预设的采样周期确定所述第一样本数据的缺失值,并根据预设的数据阈值确定所述第一样本数据的异常值;
16、通过预设的填充字符对所述缺失值进行填充处理,并对所述异常值进行剔除处理,得到第三样本数据;
17、对所述第三样本数据进行归一化处理,得到所述第二样本数据。
18、进一步地,在本发明的一个实施例中,所述对所述第二样本数据进行聚类处理得到多个业务模型类别这一步骤,其具体包括:
19、根据所述第二样本数据确定多维特征矩阵;
20、通过聚类算法对所述多维特征矩阵进行聚类处理,并通过肘部法则确定所述多维特征矩阵的最优聚类数,得到多个业务模型类别。
21、进一步地,在本发明的一个实施例中,所述根据所述第二样本数据生成图结构数据,进而根据所述图结构数据和所述业务模型类别生成训练数据集这一步骤,其具体包括:
22、根据所述第二样本数据确定多个图结构节点,并根据相邻的所述图结构节点的样本相似度权重确定相邻的所述图结构节点之间的边,得到所述图结构数据;
23、根据所述图结构数据构建图邻接矩阵、度矩阵以及拉普拉斯矩阵,并根据所述样本相似度权重和所述图邻接矩阵生成图权重矩阵;
24、根据所述图权重矩阵、所述度矩阵以及所述拉普拉斯矩阵生成训练样本,并根据所述业务模型类别确定所述训练样本的标签,进而根据所述训练样本和所述标签生成训练数据集。
25、进一步地,在本发明的一个实施例中,所述将所述训练数据集输入到预先构建的半监督图卷积神经网络进行模型训练,得到训练好的业务模型类别识别模型这一步骤,其具体包括:
26、将所述训练数据集输入到所述半监督图卷积神经网络,得到业务模型类别识别结果;
27、根据所述业务模型类别识别结果、所述标签以及预设的损失函数确定所述半监督图卷积神经网络的损失值;
28、根据所述损失值通过反向传播算法更新所述半监督图卷积神经网络的模型参数,并返回将所述训练数据集输入到所述半监督图卷积神经网络这一步骤,直至所述损失值达到预设的第一阈值或迭代次数达到预设的第二阈值,得到训练好的业务模型类别识别模型。
29、进一步地,在本发明的一个实施例中,所述半监督图卷积神经网络包括输入层、第一图卷积层、第二图卷积层、全连接层以及输出层。
30、另一方面,本发明实施例提供了一种物联网终端业务模型识别系统,包括:
31、样本数据获取模块,用于获取预设物联网终端的话单数据和设备上报数据,对所述话单数据和所述设备上报数据进行特征提取得到多个第一样本数据;
32、数据清洗及聚类处理模块,用于对所述第一样本数据进行数据清洗得到多个第二样本数据,进而对所述第二样本数据进行聚类处理得到多个业务模型类别;
33、训练数据集生成模块,用于根据所述第二样本数据生成图结构数据,进而根据所述图结构数据和所述业务模型类别生成训练数据集;
34、模型训练及识别模块,用于将所述训练数据集输入到预先构建的半监督图卷积神经网络进行模型训练,得到训练好的业务模型类别识别模型,进而根据所述业务模型类别识别模型对目标物联网终端进行业务模型识别。
35、另一方面,本发明实施例提供了一种电子设备,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现如前面所述的物联网终端业务模型识别方法。
36、另一方面,本发明实施例还提供了一种存储介质,所述存储介质为计算机可读存储介质,用于计算机可读存储,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如前面所述的物联网终端业务模型识别方法。
37、本发明的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到:
38、本发明实施例获取预设物联网终端的话单数据和设备上报数据,对话单数据和设备上报数据进行特征提取得到多个第一样本数据,然后对第一样本数据进行数据清洗得到多个第二样本数据,进而对第二样本数据进行聚类处理得到多个业务模型类别,再根据第二样本数据生成图结构数据,进而根据图结构数据和业务模型类别生成训练数据集,然后将训练数据集输入到预先构建的半监督图卷积神经网络进行模型训练,得到训练好的业务模型类别识别模型,进而根据业务模型类别识别模型对目标物联网终端进行业务模型识别。本发明实施例基于物联网终端的话单数据和设备上报数据提取具有多维度特征的样本数据,通过聚类处理确定样本数据的业务模型类别,然后根据样本数据生成图结构的训练数据集,通过半监督图卷积神经网络对图结构数据进行训练得到业务模型类别识别模型,基于该业务模型类别识别模型即可识别目标物联网终端的业务模型,提高了物联网终端业务模型识别的效率和准确率,基于识别的业务模型类别可以实现物联网终端消息上报的智能错峰,降低了基站压力,提高了物联网终端的消息上报成功率。