一种物联网终端设备的语义化方法

文档序号:8380979阅读:374来源:国知局
一种物联网终端设备的语义化方法
【技术领域】
[0001] 本发明涉及物联网终端设备技术领域,具体地说是一种物联网终端设备的语义化 方法。
【背景技术】
[0002] 物联网是在互联网概念的基础上,将其用户端延伸和扩展到任何物品与物品之 间,进行信息交换和通信的一种网络概念。具体说来,通过射频识别(RFID)、红外感应器、全 球定位系统、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联网相连接,进 行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络概念。
[0003] 信息语义化是物联网的基础,是针对当今物联网中信息无序,数据缺乏语义和信 息获取效率低等问题提出来的。在语义Web中,信息被赋予了明确的含义,使计算机能够理 解和辨识Web信息,并对其自动解释,交换和处理,从而为人们提供优质的服务。语义Web 使用XML定义的标签格式,采用RDF灵活地描述数据以及用OWL语言来描述网络文档中的 术语的明确含义和它们之间的关系。
[0004] 本体是语义的核心,其主要目标是通过获取相关领域知识得到共同认可的代表领 域的词汇以及这些词汇的层次化结构,以实现对领域知识的共同理解。
[0005] 但是目前传感器本体,无论是作为一种通用语言还是作为一种数据模型都缺少时 间和空间的语义,如从温度传感器中获得"25"这个数据,用传感器本体中的"温度"这一概 念标注它,则表明"25"是温度,但该本体却不能表明采集的时间,地点以及采集者等相关信 肩、。
[0006] 另一方面,本体开发者都是根据特定应用来构建相应的传感器本体,并没有明确 的含义和统一的框架,导致各个本体中的类定义不同,使彼此之间共享性和重用性较差。面 对传感器本体的开发,没有比较完整成熟的构建方法。目前常见的本体构建方法有骨架 法,METH0NT0L0GY法,IDEF5,评价法和七步法等,但是这些方法并不适合传感器本体的构 建。首先,这些方法是从领域本体构建方法中提炼出来的,本身并不完善,如构建过程不规 范,无计划性,无需求分析过程,未考虑本体的可扩展性,不能充分保证本体的共享和重用 性,没有统一的评价标准。

【发明内容】

[0007] 针对现有技术的不足,为实现本体的规模化和规范化开发,提高传感器本体开发 质量,本发明在传感器本体构建准则和传感器本体特性的基础上,综合METH0NT0L0GY法 的生命周期开发特点,七步法的系统分析法,Tove法的评价优化技术以及其它本体构建方 法的优点,依据软件工程中的原型法,提出了一种支持需求分析,利于传感器本体不断进 化,有效减少领域专家参与度的传感器本体Senont-PDF构建法(PDFBuilding of Sensor ontology)。该方法分为传感器本体计划(SoP,Sensor ontology Plan),传感器本体构建 (Sensor ontology Do)和传感器本体反馈(Sensor ontology Feedback)三个阶段,米用 面向对象的方式制定项目计划,利用已有测试数据集或仿真数据分析执行结果,并根据具 体应用实现传感器本体的领域更新和扩展,整个传感器本体开发及进化过程是循序渐进, 螺旋上升的。
[0008] 本发明为实现上述目的所采用的技术方案是:一种物联网终端设备的语义化方 法,分析物联网终端设备的应用特征,制定建立本体库的规则;利用本体建立工具,分析建 立初始本体库;对网络与传感器信息进行预处理;采集传感器上传的信息,对初始本体库 进行更新,并且采集网络搜集的信息对初始本体库进行扩展。
[0009] 所述预处理包括本体解析和文本处理。
[0010] 所述本体解析包括对初始本体库中的概念信息进行解析,得到概念集;对初始本 体库中的实例信息进行解析,得到实例集;对初始本体库中的关系信息进行解析,得到关系 集。
[0011] 所述文本处理包括对网页文本处理和对采集数据文本处理。
[0012] 所述网页文本处理包括:对网页去噪声后,提取网页特征。
[0013] 所述采集数据文本处理包括:对数据格式进行转换。
[0014] 所述对初始本体库进行更新包括以下过程:
[0015] 当采集到传感器发送的实时动态测量值时,进行动态数据匹配,更新初始本体库 中的实例集;
[0016] 当采集到传感器发送的固有属性信息值时,进行静态数据匹配,更新初始本体库 中的概念集和关系集。
[0017] 所述对初始本体库进行扩展包括以下过程:
[0018] 对网络搜集到的信息进行筛选,得到与本体库相似度较高的网络信息;
[0019] 通过对编辑距离和上下文相似度的计算得到相关度较高的词汇信息。
[0020] 所述对网络搜集到的信息进行筛选包括以下过程:
[0021] 设有η个领域文档的集合为SetD= {Dl,D2,…Dn},cj为传感器本体中的任一概 念,文档Di与概念cj的相关度为:
【主权项】
1. 一种物联网终端设备的语义化方法,其特征在于: 分析物联网终端设备的应用特征,制定建立本体库的规则; 利用本体建立工具,分析建立初始本体库; 对网络与传感器信息进行预处理; 采集传感器上传的信息,对初始本体库进行更新,并且采集网络搜集的信息对初始本 体库进行扩展。
2. 根据权利要求1所述的一种物联网终端设备的语义化方法,其特征在于: 所述预处理包括本体解析和文本处理。
3. 根据权利要求2所述的一种物联网终端设备的语义化方法,其特征在于: 所述本体解析包括对初始本体库中的概念信息进行解析,得到概念集;对初始本体库 中的实例信息进行解析,得到实例集;对初始本体库中的关系信息进行解析,得到关系集。
4. 根据权利要求2所述的一种物联网终端设备的语义化方法,其特征在于: 所述文本处理包括对网页文本处理和对采集数据文本处理。
5. 根据权利要求4所述的一种物联网终端设备的语义化方法,其特征在于:所述网页 文本处理包括:对网页去噪声后,提取网页特征。
6. 根据权利要求4所述的一种物联网终端设备的语义化方法,其特征在于:所述采集 数据文本处理包括:对数据格式进行转换。
7. 根据权利要求1所述的一种物联网终端设备的语义化方法,其特征在于: 所述对初始本体库进行更新包括以下过程: 当采集到传感器发送的实时动态测量值时,进行动态数据匹配,更新初始本体库中的 实例集; 当采集到传感器发送的固有属性信息值时,进行静态数据匹配,更新初始本体库中的 概念集和关系集。
8. 根据权利要求1所述的一种物联网终端设备的语义化方法,其特征在于: 所述对初始本体库进行扩展包括以下过程: 对网络搜集到的信息进行筛选,得到与本体库相似度较高的网络信息; 通过对编辑距离和上下文相似度的计算得到相关度较高的词汇信息。
9. 根据权利要求8所述的一种物联网终端设备的语义化方法,其特征在于:所述对网 络搜集到的信息进行筛选包括以下过程: 设有n个领域文档的集合为SetD={Dl,D2,…Dn},cj为传感器本体中的任一概念,文 档Di与概念cj的相关度为:
其中:
freqy为术语cj在Di中出现的次数,即频率。则 文档Dj与传感器本体的相关度为:
m表示传感器本体中的概念个数; 如果文档Dj与传感器本体的相关度DRs_nt大于领域文档相关系数0,则领域文档相 关度较高,反之领域文档相关度较低;其中领域文档相关系数e为用户输入文档变量。
10.根据权利要求8所述的一种物联网终端设备的语义化方法,其特征在于: 所述对编辑距离和上下文相似度的计算包括: 给定两个词汇h和t2,根据Sigmoid函数以及编辑距离和上下文相似度得到两个词汇 的概念匹配度为:
其中,a,@作为协调因子,采用Sigmoid函数,
如果两个词汇的概念匹配度Sim_rept(tl,t2)大于领域词汇相关系数6,则领域词汇 相关度较高,反之领域词汇相关度较低;其中领域词汇相关系数S为用户输入词汇变量。
【专利摘要】本发明涉及物联网终端设备技术领域,具体地说是一种物联网终端设备的语义化方法,分析物联网终端设备的应用特征,制定建立本体库的规则;利用本体建立工具,分析建立初始本体库;对网络与传感器信息进行预处理;采集传感器上传的信息,对初始本体库进行更新,并且采集网络搜集的信息对初始本体库进行扩展。本发明采用面向对象的方式制定项目计划,利用已有测试数据集或仿真数据分析执行结果,并根据具体应用实现传感器本体的领域更新和扩展,整个传感器本体开发及进化过程是循序渐进,螺旋上升的。
【IPC分类】G06F17-30
【公开号】CN104699719
【申请号】CN201310669226
【发明人】佟星, 刘阳, 施昭, 曾鹏, 于海斌
【申请人】中国科学院沈阳自动化研究所
【公开日】2015年6月10日
【申请日】2013年12月10日
【公告号】WO2015085622A1
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1