基于室内环境监测的训练样本数据获取方法及装置与流程

文档序号：19377455发布日期：2019-12-11 00:01阅读：228来源：国知局

本发明涉及数据处理技术领域，具体涉及一种基于室内环境监测的训练样本数据获取方法及装置。

背景技术：

工业技术的发展，尤其是化工原料、新型材料等的使用，使得环境污染日益严重，直接影响了人们的日常健康。出于工作和生活的需要，人们大部分的时间在室内停留，而现代大楼建设过程中，出于节能或方便管理等多方面考虑，自然通风不再是主要换气手段，通风换气、室内温度等环境要素控制主要依靠新风系统配合空调系统完成。现有技术大楼的新风系统多采用集中控制、工作模式单一，而空调多数情况下仍需手动控制，不能根据室内空气质量给出智能的控制方案，达不到即节能又舒适的效果。其重要原因是未能实现对环境信息进行有效分析评估以作为控制依据。随着科技的发展，环境监测设备布置得越来越广泛，所产生的大量数据未能得到有效的评估。为了减少空气环境不良对生活质量和工作效率的影响，对室内空气质量的评估分析具有重要的实用价值。

针对空气质量的分析评估，近年来研究颇多，但多是针对室外大环境开展，比如分析空气质量的基本趋势、进行pm2.5短期浓度动态预报等，针对室内空气监测的数据的评估分析较少。室内空气监测传感器由不同种类的异质传感器构成，具有多样性。利用机器学习技术通过人工神经网络实现对空气质量的分析评估具有普遍适用性。利用人工神经网络进行室内空气质量分析评估，首先要获取训练样本数据以便对人工神经网络进行训练，现在亟待进行该方面的研究。

技术实现要素：

本发明的一个目的是提供一种训练样本数据获取的新的技术方案。为了对披露的实施例的一些方面有一个基本的理解，下面给出了简单的概括。该概括部分不是泛泛评述，也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念，以此作为后面的详细说明的序言。

根据本发明实施例的一个方面，提供一种基于室内环境监测训练样本数据获取方法，包括：

采集多种室内环境监测数据；

统一所述多种室内环境监测数据的采样间隔；

对统一采样间隔之后的室内环境监测数据进行归一化处理，将归一化处理后的室内环境监测数据作为人工神经网络的训练样本数据。

进一步地，所述统一所述多种室内环境监测数据的采样间隔包括：采用二次多项式对统一后的采样间隔进行拟合插值或插值后抽取。

进一步地，所述对室内环境监测数据进行归一化处理包括：利用分量白化方法对室内环境监测数据进行数据归一化处理。

进一步地，所述对室内环境监测数据进行归一化处理，包括：

设室内环境监测数据的数据集x由p个样本组成，每个样本有j个分量，x表示样本的分量；表示数据集x的第p(1≤p≤p)个样本的第j(1≤j≤j)个分量，表示归一化后的样本的分量；表示归一化后的数据集的第p个样本的第j个分量，采用分量白化方法对数据进行归一化，分量白化后得到：

其中数据集x的第p个样本的所有分量的平均值标准差σj由计算公式为：

根据本发明实施例的另一个方面，提供一种人工神经网络训练方法，包括：

向人工神经网络输入通过所述基于室内环境监测训练样本数据获取方法获取的训练样本数据；

采用回弹后向传播算法对所述人工神经网络进行训练；所述人工神经网络包括输入层、隐含层和输出层。

进一步地，所述采用回弹后向传播算法对所述人工神经网络进行训练包括：

设所述人工神经网络的输出层具有m个神经元，所述训练样本数据包含p个输入样本，定义所述人工神经网络输出的总方差e为：

其中ypj表示第p个输入样本产生的输出层第j个神经元的输出，dpj表示第p个输入样本对应的输出层第j个神经元的期望输出；εp代表每个输入样本的方差。

进一步地，所述采用回弹后向传播算法对所述人工神经网络进行训练包括对网络权值的调整；所述对网络权值的调整的计算公式为

其中，t表示迭代次数，η表示学习速率，wij(·)表示连接前一层第i个神经元到当前层第j个神经元的连接权值；代表在进行第t次迭代时求和的梯度信息。

根据本发明实施例的另一个方面，提供一种基于室内环境监测的训练样本数据获取装置，包括：

采集模块，用于采集多种室内环境监测数据；

预处理模块，用于统一所述多种室内环境监测数据的采样间隔；

归一化处理模块，用于对统一采样间隔之后的室内环境监测数据进行归一化处理，将归一化处理后的室内环境监测数据作为人工神经网络的训练样本数据。

根据本发明实施例的另一个方面，提供一种人工神经网络训练装置，包括：

输入模块，用于向人工神经网络输入通过所述基于室内环境监测训练样本数据获取方法获取的训练样本数据；

训练模块，用于采用回弹后向传播算法对所述人工神经网络进行训练；所述人工神经网络包括输入层、隐含层和输出层。

根据本发明实施例的另一个方面，提供一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现所述基于室内环境监测训练样本数据获取方法和/或所述人工神经网络训练方法。

根据本发明实施例的另一个方面，提供一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行，以实现所述基于室内环境监测训练样本数据获取方法和/或所述人工神经网络训练方法。

本发明实施例提供的技术方案可以包括以下有益效果：

本发明提供的基于室内环境监测的训练样本数据获取方法，包括采集室内环境监测数据以及对数据进行预处理和归一化处理，得到用于训练人工神经网络的训练样本数据，该训练样本数据能够加快人工神经网络的学习速度，提高人工神经网络的收敛速度，完全能够满足人工神经网络的训练要求。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者，部分特征和优点可以从说明书中推知或毫无疑义地确定，或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一个实施例的训练样本数据获取方法流程图；

图2为本申请另一个实施例的神经网络权值调整方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，下面结合附图和具体实施例对本发明做进一步说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

如图1所示，本申请的一个实施例，提供了一种基于室内环境监测的训练样本数据获取方法，所述训练样本数据用于训练人工神经网络，所述获取方法包括：

步骤s1：采集室内环境监测数据；所述室内环境监测数据包括通过多种环境异质传感器采集的异质传感器数据(例如温度传感器数据、湿度传感器数据、噪音传感器数据、各种气体传感器数据等)；通过这些用于室内环境监测的异质传感器进行室内环境监测数据的采集；

步骤s2：对所述室内环境监测数据进行预处理：统一所述室内环境监测数据(即所有异质传感器数据)的采样间隔，将其统一到一致的采样间隔；具体地，可以采用二次多项式对统一后的采样间隔进行拟合插值或插值后抽取；

步骤s3：对预处理后的室内环境监测数据进行数据归一化处理：利用分量白化方法对预处理后的室内环境监测数据进行数据归一化处理，以便加快人工神经网络学习速度，从而提高人工神经网络的收敛速度；将归一化处理后的室内环境监测数据作为人工神经网络的训练样本数据；

设预处理后的室内环境监测数据的数据集x由p个样本组成，每个样本有j个分量，x表示样本的分量；表示数据集x的第p(1≤p≤p)个样本的第j(1≤j≤j)个分量，表示归一化后的样本的分量；表示归一化后的数据集的第p个样本的第j个分量，采用分量白化方法对数据进行归一化，分量白化后得到：

其中数据集x的第p个样本的所有分量的平均值而标准差σj由下式计算：

该归一化处理方法是一种类似白化的处理方法，它对训练集中所有样本的同一分量进行处理，从而使得在全部训练集上，每个分量的均值为0且具有相同的方差(通常取1.0)。

本申请的实施例还提供一种人工神经网络训练方法，包括：

输入通过上述基于室内环境监测的训练样本数据获取方法获取的训练样本数据，采用回弹后向传播算法对人工神经网络进行训练；所述人工神经网络包括输入层、隐含层和输出层；具体地：

设所述人工神经网络的输出层具有m个神经元，训练样本数据包含p个输入样本，定义人工神经网络输出的总方差e为：

其中ypj表示第p个输入样本产生的人工神经网络输出层第j个神经元的输出，dpj表示第p个输入样本对应的人工神经网络输出层第j个神经元的期望输出；εp代表每个输入样本的方差。

对所述人工神经网络进行训练包括对网络权值的调整；对网络权值的调整，计算公式如下：

式中：t表示迭代次数，η表示学习速率，wij(·)表示连接前一层第i个神经元到当前层第j个神经元的连接权值；代表在进行第t次迭代时求和的梯度信息。

网络权值调整方法过程如图2所示。其中以表示训练集的所有模式(批学习)在t时刻或第t次迭代时求和的梯度信息。t表示迭代次数。

训练好的人工神经网络可以用于室内空气质量的分析评估或人流估计等领域。

本申请的又一个实施例提供了一种基于室内环境监测的训练样本数据获取装置，包括：

采集模块，用于采集室内环境监测数据；

预处理模块，用于统一所述室内环境监测数据的采样间隔，采用二次多项式对统一后的采样间隔进行拟合插值或插值后抽取；

归一化处理模块，用于对室内环境监测数据进行归一化处理，将归一化处理后的室内环境监测数据作为人工神经网络的训练样本数据。

本申请的又一个实施例提供了一种人工神经网络训练装置，包括：

输入模块，用于向人工神经网络输入通过所述基于室内环境监测的训练样本数据获取方法获取的训练样本数据；

训练模块，用于采用回弹后向传播算法对所述人工神经网络进行训练；所述人工神经网络包括输入层、隐含层和输出层。

本申请的又一个实施例提供了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现所述基于室内环境监测的训练样本数据获取方法和/或所述人工神经网络训练方法。

本申请的又一个实施例提供了一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行，以实现所述训练样本数据获取方法和/或所述人工神经网络训练方法。

本发明实施例提供的训练样本数据获取方法，包括采集室内环境监测数据以及对数据进行预处理和归一化处理，得到用于训练人工神经网络的训练样本数据，该训练样本数据能够加快人工神经网络的学习速度，提高人工神经网络的收敛速度，完全能够满足人工神经网络的训练要求；该获取方法易于编程实现，提高了数据的智能化分析水平和使用价值。

本发明实施例提供的人工神经网络训练方法，算法网络结构简单、效率高，易于编程实现，提高了数据的智能化分析水平和使用价值；得到的人工神经网络可用于对室内环境做出有效的分析评估，可以用于推测人流或设备工作状况，可为生产安全、空气质量监测、室内新风系统等智能化控制提供依据。

需要说明的是：

术语“模块”并非意图受限于特定物理形式。取决于具体应用，模块可以实现为硬件、固件、软件和/或其组合。此外，不同的模块可以共享公共组件或甚至由相同组件实现。不同模块之间可以存在或不存在清楚的界限。

在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述，构造这类装置所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本申请并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的虚拟机的创建装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述实施例仅表达了本发明的实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贾琳;赵磊
技术所有人：特斯联(北京)科技有限公司
我是此专利的发明人

上一篇：按摩机的制作方法
上一篇：一种高耐折、超平滑、高雾度的透明全纤维素复合薄膜及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。