一种基于动态特征的异构物联网标识识别方法及系统的制作方法

文档序号:9471433阅读:238来源:国知局
一种基于动态特征的异构物联网标识识别方法及系统的制作方法
【技术领域】
[0001] 本发明属于物联网技术领域,具体涉及一种基于动态特征的异构物联网标识识别 方法及系统。
【背景技术】
[0002] 物联网的本质就是通过RFID(RadioFrequencyIdentification,射频识别)、无 线传感器以及卫星定位等自动识别和感知技术获取物品的名称与地址等标识信息以及物 品自身和周边的相关属性信息,并借助各种通讯技术将物品相关信息集成到信息网络中, 进而通过类似互联网中解析、寻址、搜索等标识信息服务,实现海量物品相关信息的智能索 引和整合,并利用云计算、模糊识别、数据挖掘以及语义分析等各种智能计算技术,对海量 物品相关信息进行分析处理,最终实现对物理世界智能化的决策和控制。
[0003] 物联网环境中的各种感知信息组成了海量的物联网资源,这是物联网的典型特 征。在同一个物联网应用领域内部,或不同应用领域之间,海量物联网资源的互联互通将是 物联网发展面临的核心难题,是物联网"物物互联"的关键所在。和传统互联网类似,任何 物联网感知资源均需要进行统一标识和解析,如互联网中的域名系统,一旦域名系统出现 故障,互联网"物理基础设施层"被割裂,各类互联网业务应用将无法开展,网络间将无法互 联互通,互联网将会面临瘫痪。因此,海量物联网资源的标识、解析等技术是促进物联网发 展的核心支撑。
[0004] 由于政治、经济及军事等多方面原因,物联网中的标识类别非常多,不同国家之间 甚至一个国家的内部都有很多种异构标识。为实现对各类异构标识的兼容、统一解析,迫切 需要一种能自动识别各类物联网标识编码所属物联网标识种类的方法,从而为后续进一步 的处理奠定基础。

【发明内容】

[0005] 为了解决上述问题,本发明提供了一种基于动态特征的异构物联网标识识别方法 及系统,解决了物联网标识码(IoTID)在命名空间发生冲突情况下的IoTID识别问题,使用 特征向量描述物联网标识类型和待识别IoTID,通过向量距离刻画待识别IoTID对发生冲 突的标识类型的隶属度。
[0006] 物联网编码命名空间是由各行业的编码标准文件规定的,标准文件规定了IoTID 的长度,每一位或几位取值范围以及取值规则。在标准文件中,将IoTID分成了若干部分, 每一部分都代表一定的现实含义。如手机号13810380001可以被分为三个部分,第一部分 " 138"代表运营商,第二部分" 1038"代表地区,第三部分"0001"是随机数。我们将每一部 分称为一个分片,分片的边界成为切分点。
[0007] 由于没有统一的管理,两个或者多个不相关的物联网标识类型的编码空间可能是 冲突的。因而,依据标准文件中规定的长度和范围的取值规则对待识别IoTID进行正则判 定,得到的符合规则条件的物联网标识类型是一个命名空间冲突的结果集,我们称之为冲 突域。得到冲突域的过程我们称之为静态识别。
[0008] 然而实际中我们发现,现实世界(RealWorld)中,IoTID实际使用的编码空间可 能仅仅占用了理论编码空间的非常小的一部分。比如,肉类蔬菜流通追溯码由行政区域 编码+流通节点码+经营者编码+交易流水号构成,其中"经营者编码"理论编码空间是 0000-9999,然而在现实世界中,我们注意到,除去少数超大型的超市、市场,绝大多数的流 通节点不能拥有近万家商户。所以,当待识别IoTID的经营者编码位的取值超过一定值时, 它属于肉类蔬菜流通追溯码的分类的可能性就会相对降低(尽管该IoTID满足肉类蔬菜流 通追溯码每一部分的取值要求);当这几位的取值在一定范围之内时,它属于肉类蔬菜流 通追溯码分类的可能性就会增加。我们将现实世界的取值空间的分布称为动态特征。
[0009] 拥有了这样的动态特征后,使得在静态识别基础上得到冲突域后进行进一步的识 别成为可能。
[0010] 为了实现"进一步"地识别(我们称作动态识别),本发明将IoTID与物联网类型 分别进行特征表示得到在某一类型下的IoTID特征向量和物联网类型中心向量,然后求取 在一个冲突域下,待识别IoTID属于每一个类型的特征向量与冲突域所有类型的类中心向 量的距离,距离的大小与对于该类型的隶属度成反比。
[0011] 具体采用以下技术方案:
[0012] -种基于动态特征的异构物联网标识识别方法,包括以下步骤:
[0013] 1)对待识别的IoTID进行静态识别,得到待识别IoTID的物联网标识类型所属冲 关域;
[0014] 2)根据冲突域中每一种类型的类型切分点,对待识别IoTID依次进行切分,得到 IoTID分片,进而求出待识别IoTID在每一种类型下的特征向量;
[0015] 3)计算在一个冲突域下,待识别IoTID在每一个类型下的特征向量与该类型的类 中心向量的距离;
[0016] 4)根据上述距离的大小得到待识别IoTID对于各物联网标识类型的隶属度,完成 对物联网标识的识别。
[0017] 进一步地,上述静态识别包括:依据物联网编码标准文件中规定的长度和范围的 取值规则对待识别IoTID进行正则判定,得到符合规则条件的物联网标识类型。
[0018]进一步地,待识别IoTID在某类型下的特征向量U1,t2,. . .,tk,. . .,tm)通过以下 方法求得:
[0019]其中,m表示待识别IoTID共有m个分片,tk表示第k个分片的特征值,
[0021] XiR表一个分片,巾(X;)为1;在64位位图表示下的取值,i= 1,2, . . .,1,所述 64位位图用于表示根据物联网编码标准文件划分的IoTID的每一分片的特征值,IoTID中 的每一位唯一的用0-61中的一个数字表示,62、63为保留位。
[0022] 我们希望物联网分类的特征可以精准的描述现实世界中的IoTID的分布情况,因 而我们需要获取大量现实世界IoTID作为训练数据集,按照物联网分类进行分组,将其按 照公式(1)求出分片的特征值和特征向量,最后求出每组的组平均向量作为该物理网分类 的特征,也称作类中心向量。
[0023] 所述类中心特征向量通过以下方法得出:
[0024] 1)获取大量现实世界中的IoTID作为输入训练样本,根据其切分点进行分片操 作,得出每个输入训练样本的特征向量;
[0025] 2)求出每一个类型的平均特征向量作为类中心特征向量。
[0026] 进一步地,上述方法还包括从标准文献中提取物联网分类的切分点保存到数据 库。
[0027] 这样的类中心向量是可以作为线下处理的(off-the-shelf),仅需要将类中心向 量保存到数据库中。如果现实世界数据集数量不足,可以使用模拟数据补充。补充的原则是 根据调研的实际情况,通过截断,拟合分布等手段,尽量模拟真实世界的IoTID的分布。等 日后获取到足够多的现实世界的IoTID或者现实世界数据集发生更新的时候,可以进行替 换与类中心向量的重新计算。
[0028] 进一步地,在一个冲突域下,待识别IoTID属于某一个类型的特征向量与冲突域 所有类型的类中心向量的距离通过以下公式计算:
[0029]
[0030] 其中,Cl1表示待识别IoTID与第i个类型的类中心向量的距离,Tlk表示第i个 类型的类中心向量的第k个分量,tik表示待识别IoTID在类型i下的特征向量的第k个分 量,i<n,n表示冲突域中的物联网标识类型的个数。
[0031] 进一步地,待识别IoTID对于某一类型的隶属度通过以下公式计算:
[0032]
[0033] 其中,yi表示待识别IoTID对于类型i的隶属度,di表示待识别IoTID与第i个 类型的类中心向量的距离,d,表示待识别IoTID与第j个类型的类中心向量的距离。
[0034] 一种基于动态特征的异构物联网标识识别系统,包括:
[0035] 静态识别模块,用于对待识别的IoTID进行静态识别,得到待识别IoTID的物联网 标识类型所属冲突域;
[0036] IoTID切分模块,用于根据冲突域中每一种类型的类型切分点,对待识别IoTID依 次进行切分,得到IoTID分片;
[0037] 特征向量转化模块,用于将IoTID分片转化为特征向量;
[0038] 类中心向量计算模块,用于计算每一个类型的平均特征向量作为类中心特征向 量;
[0039] 距离计算模块,用于计算待识别IoTID属于每一个类型的特征向量与冲突域所有 类型的类中心向量的距离;
[0040] 结果转换模块,用于将待识别
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1