物联网终端的识别方法和装置与流程

文档序号:18168038发布日期:2019-07-13 09:44阅读:427来源:国知局
物联网终端的识别方法和装置与流程

本发明涉及信号处理技术领域,具体地,涉及一种物联网终端的识别方法和装置。



背景技术:

随着物联网的发展,万物互联的时代已经到来,越来越多的终端加入物联网中,为了便于物联网中的终端管理,需要对物联网中的终端进行识别,例如终端所属的类别的识别。

然而,目前对物联网终端的识别仅仅限于识别物联网中的终端是否为物联网终端,并不能识别出终端的类型。



技术实现要素:

本发明至少部分解决现有的无法识别物联网中的终端类型的不足的问题,提供了一种能够准确、高效的识别物联网中的终端类型的物联网终端的识别方法和装置。

解决本发明技术问题所采用的技术方案是一种物联网终端的识别方法,包括:

获取待识别终端的识别数据,其中,所述识别数据包括所述待识别终端与物联网交互的数据;

根据所述识别数据得出所述待识别终端的识别结果,其中,所述识别结果包括所述待识别终端的类型标签。

可选地,所述根据所述识别数据得出所述待识别终端的识别结果,包括:

将所述识别数据分别输入多个分类算法不同的分类器,得到由各所述分类器输出的初级识别结果;

将全部所述初级识别结果输入结果融合模型,得到所述物联网终端的识别结果。

可选地,所述将所述识别数据分别输入多个分类算法不同的分类器中,所述分类算法包括:

逻辑回归算法、决策树算法、随机森林算法、xgboost算法中的至少两者。

可选地,在所述根据所述识别数据得出所述待识别终端的识别结果之前,还包括:

基于集成学习算法建立多个所述分类器和基于stacking算法建立所述结果融合模型。

可选地,所述基于集成学习算法建立多个所述分类器和基于stacking算法建立所述结果融合模型,包括:

获取训练数据,所述训练数据包括样本终端与物联网交互的交互数据中与所述样本终端使用情况相关的数据;

对所述训练数据进行预处理;

将所述训练数据划分多个训练样本集和测试样本集;

每个所述分类器对应一个所述训练样本集,基于集成学习算法使用所述训练样本进行数据训练建立所述分类器;

基于网格搜索使用所述测试样本集对所述分类器进行参数优化;

基于stacking算法使用所述分类器对所述样本终端的初级识别结果建立所述结果融合模型。

可选地,所述获取待识别终端的识别数据,包括:

从所述待识别终端与物联网交互的数据中,筛选包含与所述待识别终端使用情况相关字段的数据作为所述识别数据;

对所述识别数据进行预处理,其中,所述预处理包括:数据类型转换、数据探索、属性规约、数据标准化。

可选地,所述识别数据包括:待识别终端的费用数据、流量使用数据、所在位置数据、物联网传感器数据。

解决本发明技术问题所采用的技术方案是一种物联网终端的识别装置,包括:

数据获取单元,用于获取待识别终端的识别数据,所述识别数据包括与所述待识别终端使用情况相关的数据;

结果输出单元,根据所述识别数据得出所述待识别终端的识别结果,其中,所述识别结果包括所述待识别终端的类型。

可选地,所述结果输出单元包括:多个分类算法不同的分类器和结果融合模块,其中,

各所述分类器,用于输入所述识别数据,输出初级识别结果;

所述融合模块,用于输入多个所述分类器输出的全部所述初级识别结果,输出所述待识别终端的识别结果。

可选地,所述识别装置还包括训练单元,用于基于集成学习算法建立多个所述分类器和基于stacking算法建立所述结果融合模型。

本发明物联网终端的识别方法和装置,物联网中不同类型的终端的使用情况有所不同,故与终端的使用情况相关的数据也有所不同,因此,根据待识别终端使用情况相关的数据对待识终端进行识别,能够准确、高效的识别出待识别终端的类型。

附图说明

图1为本发明实施例1的一种物联网终端的识别方法的流程图;

图2为本发明实施例1的另一种物联网终端的识别方法的流程图;

图3为本发明实施例1的一种物联网终端的识别方法的分类器和结果融合模块的建立流程图;

图4为本发明实施例2的物联网终端的识别装置的框图;

其中的附图标记说明:01、数据获取单元;02、结果输出单元;021、第一分类器;022、第二分类器;023、第三分类器;024、第四分类器;03、融合模块。

具体实施方式

为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明所提供的一种显示单元、显示基板及其驱动方法和显示装置作进一步详细描述。

实施例1:

参加图1至3,本实施例提供一种物联网终端的识别方法,该方法例如运行在物联网中对物联网中的终端进行类型的识别,该方法包括以下步骤。

步骤11、获取待识别终端的识别数据,其中,识别数据包括待识别终端与物联网交互的数据;

具体地,识别数据是与待识别终端使用情况相关的且存储在物联网中的数据,例如,识别数据可以来自于物联网云平台(如边缘云平台、核心云平台)的数据库、基于hadoop的数据仓库工具(hive)、分布式文件系统(hadoopdistributedfilesystem,简称hdfs)等数据仓库。

步骤12、根据识别数据得出待识别终端的识别结果,其中,识别结果包括待识别终端的类型标签。

具体地,这里的待识别终端的类型标签是指根据实际情况用于对物联网中的终端进行区分,例如,根据用途不同定义的类型标签:冰箱、电视机、空调、手机等;根据使用的电源换不同定义的类型标签:高压交流电源终端、低压交流电源终端、高压直流终端等。

其中,不同类型标签的待识别终端的使用情况不同,故产生的与使用情况相关的数据也不相同。以冰箱和手机的使用情况为例,冰箱的位置数据几乎不变,然而手机的位置数据经常变化;冰箱会频繁地向云平台上传温度数据,手机不向云平台上传温度数据。

因此,上述方案中,以与待识别终端使用情况相关的数据作为识别数据,根据识别数据(即待识别终端的使用情况),得出的待识别终端的识别结果准确性高。

可选地,上述步骤12包括:

步骤12a、将识别数据分别输入多个分类算法不同的分类器,得到由各分类器输出的初级识别结果;

具体地,每个分类器对应一种分类算法,分类算法包括但不限于:逻辑回归算法、决策树算法、随机森林算法、xgboost算法中的至少两者。

步骤12b、将全部初级识别结果输入结果融合模型,得到待识别终端的识别结果。

具体地,结果融合模型可以采用平均法(如算数平均、加权平均)、投票法(如相对多数投票法、加权投票法)对多个初级识别结果进行融合,得出待识别终端的识别结果。

当然,为得出准确度更高的待识别终端的识别结果,结果融合模型可以是基于学习法(例如stacking算法)建立的模型,将多个初级识别结果输入训练好的结果融合模型中,然后得到待识别终端的识别结果。

上述方案中,采用多个分类器分别对待识别终端进行识别,并输出初级识别结果,将多个初级识别结果进行融合得出待识别终端的最终识别结果,因此,有效提高了待识别终端类型的识别正确率和识别效率。

可选地,在上述步骤11之前,还包括:

步骤13、基于集成学习算法建立多个分类器和基于stacking算法建立结果融合模型。

上述方案中,采用集成学习算法建立多个分类器,故提高了每一个分类器的精度,从而提高了每一个初级识别结果的准确度,进而由这些初级识别结果融合得出的待识别终端的识别结果的准确度更高。

具体地,上述步骤10包括:

步骤10a、获取训练数据,训练数据包括样本终端与物联网交互的数据中,与样本终端使用情况相关的数据;

步骤10b、对训练数据进行预处理;

可选地,预处理包括:数据类型转换、数据探索、属性规约、数据标准化。

具体的,数据类型转换是指将训练数据的数据类型转换为指定的数据类型(例如与分类器可识别的数据类型)。

数据探索包括根据探索结果,对异常值、缺失值进行处理。

属性规约包括根据各个属性的相关性进行特征选择。

另外,训练数据中用于表征样本终端使用情况的数据特征比较少时,对预处理后的训练数据进行特征工程,提高训练数据的维度。

步骤10c、将训练数据划分多个训练样本集和测试样本集;

优选地,为了交叉验证,利用计算引擎(spark)将训练数据划分为多个训练样本集和测试样本集,例如,训练数据中70%划分为用于训练的数据,30%划分为用于测试的数据。

步骤10d、每个分类器对应一个训练样本集,基于集成学习算法(例如boosting算法、bagging算法)使用训练样本进行数据训练建立分类器;

优选地,为了提高分离器的精度、防止过拟合,每一个分类器的训练样本集是随机从用于训练的数据中抽取部分数据形成的。

步骤10e、基于网格搜索(gridsearch)使用测试样本集对分类器进行参数优化;

步骤10f、基于stacking算法使用分类器对样本终端的识别结果建立结果融合模型。

可选地,上述步骤11包括:

步骤11a、从待识别终端在物联网中产生的数据中,筛选包含待识别终端使用情况相关字段的数据,作为识别数据;

可选地,识别数据包括:待识别终端的费用数据(如市场购买价格)、流量使用数据(如sim卡流量数据,包括本地流量、省际漫游流量、国际漫游流量和港澳台漫游流量等)、所在位置数据、物联网传感器数据。

步骤11b、对识别数据进行预处理,其中,预处理包括:数据类型转换、数据探索、属性规约、数据标准化。

实施例2

本实施例提供一种物联网终端的识别装置,其包括:

数据获取单元01,用于获取待识别终端的识别数据,识别数据包括与待识别终端使用情况相关的数据;

结果输出单元02,根据识别数据得出待识别终端的识别结果,其中,识别结果包括待识别终端的类型。

可选地,结果输出单元包括:多个分类算法不同的分类器和结果融合模块,其中,

各分类器,用于输入识别数据,输出初级识别结果;

具体地,每个分类器对应一种分类算法,分类算法包括但不限于:逻辑回归算法、决策树算法、随机森林算法、xgboost算法中的至少两者。参见图4,第一分类器021运行逻辑回归算法,第二分类器022运行决策树算法,第三分类器023运行随机森林算法算法,第四分类器024运行xgboost算法。

融合模块03,用于输入多个分类器输出的全部初级识别结果,输出物联网终端的识别结果。

可选地,识别装置还包括训练单元,用于基于集成学习算法建立多个分类器和基于stacking算法建立结果融合模型。

可选地,训练单元可以运行步骤13a至13f,从而完成对多个分类器和结果融合模型的数据训练。

上述方案的物联网终端的识别装置可执行以上的方法,故其可高效的对待识别终端的类型进行识别,且输出的识别结果准确性高。

可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1