一种视频神经元节点的空间重构方法与流程

文档序号:16507089发布日期:2019-01-05 09:06阅读:242来源:国知局
一种视频神经元节点的空间重构方法与流程

本发明属于计算机软件领域,具体涉及一种视频神经元节点的空间重构方法。



背景技术:

传统视频监控系统是由摄像、传输、控制、显示、记录登记5大部分组成。摄像机通过同轴视频电缆将视频图像传输到控制主机,控制主机再将视频信号分配到各监视器及录像设备,同时可将需要传输的语音信号同步录入到录像机内。通过控制主机,操作人员可发出指令,对云台的上、下、左、右的动作进行控制及对镜头进行调焦变倍的操作,并可通过控制主机实现在多路摄像机及云台之间的切换。利用特殊的录像处理模式,可对图像进行录入、回放、处理等操作,使录像效果达到最佳。

随着时代的发展,传统的视频监控系统体现出一系列的缺点。无论是早期的模拟电视监控系统(cctv)、后来的数字视频监控系统(dvr)及当前主流的网络视频监控系统(ipsurveillance),其核心大多仍然停留在“监”和“控”的应用,主要通过人员的实时监控及事后的录像回放来进行各种应用(早期主要应用于安防),无法有效整合各类资源实现“智能化”的目的。



技术实现要素:

为了解决现有技术存在的视频监控系统监控画面多、不具备针对性、实时性差、出错率高的技术问题,本发明目的在于提供一种视频神经元节点的空间重构方法。为跨地区跨部门视频图像信息资源提供整合共享功能。

本发明所采用的技术方案为:

一种视频神经元节点的空间重构方法,包括如下步骤:

s1、对每个视频感知单元均建立人工视频神经元节点并网络化,形成视频神经网络;

s2、将每个视频神经元节点感知的海量视频图像信息加入时间轴进行空间重构后,接入后端管理平台进行统一管理。

本发明对每个视频感知单元均建立人工视频神经元节点并网络化,形成视频神经网络,并将每个视频神经元节点感知的海量视频图像信息加入时间轴形成“一机一档”进行空间重构后,接入后端管理平台进行统一管理,为跨地区跨部门视频图像信息资源提供整合共享功能。实现各类异构平台间的标准化级联/互联,同时可实现对非国标平台的标准化改造。

所述视频感知单元包括高点视频单元和低点视频单元,每个高点视频单元和低点视频单元均建立人工视频神经元节点并网络化。

具体地,所述高点视频单元对区域进行全局监控,在视频图像上迭加全息位置地图,对视野范围内的关注点进行可视化标注,将标签在视频图像中进行图像化展示,将视频图像中的背景信息进行结构化描述,并将地理位置、场景信息和视频流一起编码,加入时间轴形成复合视频流。

具体地,所述低点视频单元与其中一个或多个关注点相关联,在低点不同角度查看监控区域细节,并将地理位置、场景信息和视频流一起编码,加入时间轴形成复合视频流。

进一步地,所述低点视频单元在视频图像上迭加全息位置地图,对视野范围内的标注物进行可视化标注,将标签在视频图像中进行图像化展示,将视频图像中的背景信息进行结构化描述。构建全息位置地图,从位置关联网络提升到多维动态场景。

当查找视频时,一键返回所有高点视频单元和低点视频单元的视频图像时间,实现视频同步。

所述复合视频流加入时间轴进行空间重构。

作为优选地,所述视频神经网络包括输入层、输出层和一个以上隐藏层,并采用bp算法对视频神经网络进行学习,每个视频神经元节点作为输入层的输入数据。

作为优选地,所述bp算法包括梯度下降法。

本发明的有益效果为:

本发明对每个视频感知单元均建立人工视频神经元节点并网络化,形成视频神经网络,并将每个视频神经元节点感知的海量视频图像信息加入时间轴形成“一机一档”进行空间重构后,接入后端管理平台进行统一管理,为跨地区跨部门视频图像信息资源提供整合共享功能。实现各类异构平台间的标准化级联/互联,同时可实现对非国标平台的标准化改造。

本发明构建全息位置地图,从位置关联网络提升到多维动态场景。

附图说明

图1是本发明-实施例的神经网络的结构示意图。

图2是全息位置地图的核心组成原理图。

图3是全息位置地图关键技术主要框架图。

图4是一层神经网络结构图。

图5是前向神经网络结构图。

图6是两层神经网络图(决策分界)。

图7是两层神经网络图(空间变换)。

具体实施方式

下面结合附图及具体实施例对本发明作进一步阐述。

如图1所示,本实施例的一种视频神经元节点的空间重构方法,包括如下步骤:

第一步、对每个视频感知单元均建立人工视频神经元节点并网络化,形成视频神经网络。

第二步、神经元节点感知的海量视频图像信息加入时间轴进行空间重构后,接入后端管理平台进行统一管理。

视频感知单元包括高点视频单元和低点视频单元,每个高点视频单元和低点视频单元均建立人工视频神经元节点并网络化。

在本实施例中,高点视频单元对区域进行全局监控,在视频图像上迭加全息位置地图,对视野范围内的关注点进行可视化标注,将标签在视频图像中进行图像化展示,将视频图像中的背景信息进行结构化描述,并将地理位置、场景信息和视频流一起编码,加入时间轴形成复合视频流。

低点视频单元与其中一个或多个关注点相关联,在低点不同角度查看监控区域细节,在视频图像上迭加全息位置地图,对视野范围内的标注物进行可视化标注,将标签在视频图像中进行图像化展示,将视频图像中的背景信息进行结构化描述。并将地理位置、场景信息和视频流一起编码,加入时间轴形成复合视频流。复合视频流加入时间轴进行空间重构。

低点视频单元构建全息位置地图,从位置关联网络提升到多维动态场景。

以下详细阐述全息位置地图:

全息位置地图是指在泛在网环境下以位置为纽带动态关联事物或事件的多时态、多主题、多层次、多粒度的信息提供个性化的位置及与位置相关的智能服务平台。其宗旨是以人为本,根据用户的应用需求基于位置来集成和关联适宜的地理范围内容类型、细节程度、时间点或间隔的泛在信息。通过适应于特定用户的表达方式为用户提供信息服务。

其中泛在网涵盖了传感网、互联网、通信网、行业网等网络系统,它们既是全息位置地图的信息来源,又是其运行环境。泛在信息是在泛在网环境下获取的事物或事件本身及其相关信息(如位置、状态、环境等),涵盖地球表面的基础地理信息、独立地理实体(如建筑物)的结构信息地理实体间的关联信息、各行业的信息、人的自身及其喜好信息等。泛在信息能够直接或间接地与空间位置相关联,形成描述特定事物或事件等的总体信息。

位置是指现实世界和虚拟环境中特定目标所占用的空间。在现实世界中,位置可以是用地理坐标表达的直接位置,也可以是地名、地址、相对方位和距离关系等表达的相对位置,用以描述地理实体或要素的所在地、社会事件发生地、移动目标的路径等;在虚拟环境下用ip地址,url,社交网络账户等形式描述用户登录或发布信息的位置等。

泛在信息通过位置进行关联,根据特定应用与需求,选择特定的时态、主题、层次和粒度来描述相关事物或事件的特征。“时态”反映了事物或事件随着时间变化的情形;“主题”是指从不同角度描述事物或事件;“层次”是基于事物或事件自身的层次或级别的划分来描述其相应层次的特征;“粒度”是指依据用户需求确定的描述事物或事件信息的详细程度。

全息位置地图强调以位置为核心将泛在信息到多维地图上进行汇聚、关联、分析、传递、表达。其核心组成如图2所示。

泛在信息是全息位置地图最重要的数据源,为全息位置地图提供数据支撑;语义位置作为泛在信息的核心元素,为全息位置地图提供有效的关联手段;多维动态场景应满足泛在信息及空间信息在时间尺度上的变化需求。因此,泛在信息、语义位置和多维动态场景表达构成了全息位置地图的三大核心组成部分。

通过对全息位置地图概念的理解,归纳了全息位置地图的五大特征,包括实时动态性、语义位置关联、室内外一体化、多维时空表达和自适应性。

其中,实时动态性是指实时、动态获取(接入)来源于互联网、传感网、行业网、通信网的泛在(位置关联)信息,为大众和专业领域用户的信息服务和应用,提供快速、准确的数据支持;语义位置关联,传统位置服务综合利用多源位置数据存在位置描述能力不足,而语义位置内涵丰富,基于语义位置建立人、事、物的关联关系,形成位置关联网络,为用户提供个性化、智能化位置服务;室内外一体化,实现全方位、多尺度和多粒度的室内外地上下一体化综合表达和可视化,促进室内外一体化导航等应用发展;多维时空表达,全息位置地图涵盖多个学科且跨领域,向大众、政府、社会和私人企业等提供二、三维、四维地图(三维空间+时间)等多维表达形式,三维场景与全景影像一体化融合表达结果;自适应性是指以人为本,自适应地满足用户需求,提供智能化的交互方式,以访问某实验室为例,当访问者进入大厅时,综合用户位置、朝向和角色分析,自动关联和推送用户感兴趣的信息,比如标志性的雕像、楼梯入口以及办公室方位等,这种关联和推送的内容随着位置以及用户角色的变化而不同。

作为一种新型的地图服务平台,全息位置地图的研究尚处于起步阶段,其关键技术框架如图3所示。语义位置关联以语义位置模型为基础,动态感知泛在信息中存在的位置信息,并基于度量、方位、拓扑和语义等简单的位置关联和通过时空分布、聚类模型和趋势预测等方法形成深层次的位置关联网络,实现全方位的语义位置关联。多维动态场景的技术框架则分别从场景模型与建模,表达与可视化四个方面构建。

由于地图数据服务主要来源于专业测试部门和地图提供商,提供信息相对单一;同时,大数据环境下的信息量越来越大,信息内容越来越丰富,亟需一种新型的泛在信息汇集和融合技术。多维地图作为全息位置地图泛在信息的重要表现形式,在传统地图模型与建模方法基础上,需研究室内外场景数据快速获取方法以及面向用户自适应构建地图表达模型;解决室内外一体化语义非一致性问题,实现室内外一体化实时、快速可视化。语义位置关联技术则是将来源广泛、类型复杂、时空参考异构的泛在信息,基于全息位置地图语义位置模型,在语义和知识层次上透过位置进行深度感知关联,实现目标对象的全方位发现。

当查找视频时,一键返回所有高点视频单元和低点视频单元的视频图像时间,实现视频同步。

视频神经网络包括输入层、输出层和一个以上隐藏层,并采用bp算法对视频神经网络进行学习,每个视频神经元节点作为输入层的输入数据。所述bp算法包括梯度下降法。

其中,隐藏层可以包括很多逻辑机,例如:结构化、全息位置地图、ai推理等。

单个神经元如图4所示,图中有三个输入值,分别为x1、x2、x3,结果的公式为:

其中,x为输入信号,一般可以是矩阵也可以是向量激活函数是f。公式中的w称为权重,b是一个偏置参数。目前最常用的激活函数还是非线性变化的激活函数,关于具体的激活函数将在下文中阐述。类比生物的神经网络,x可以看做是神经元的刺激信号,这个神经元的输出信号就是传递给下个神经元的刺激信号,而w和b可以看做是这个神经元的自身特性,通过这个神经元实际上就对输入信号进行了一次信号处理。

一个神经元显然不可能处理复杂的输入信号,所以将次结构的神经元组合成如图5所示的前向神经网络结构。从图中可以看到一个完整的前向神经网络一个输入层,一个输出层和一个以上隐藏层组成。首先由输入层输入原始数据,经过各层隐藏层的计算,最后由输出层输出最后的结果。每一层之间通过节点间的全连接方式连通,上一层的输出就是下一层的输入。

通过不同的网络层数和每层不同的神经元数目,我们可以组成不同的神经网络结构,加上不同的参数即权重w和偏置b,每一个神经网络几乎都是不同的。这样每一个神经网络实际上都是一种计算模型,理论上可以解决许多不同的计算问题。只要通过对应待解决的问题去搭建适合的神经网络结构和学习出对应的参数即可。

每一个神经网络参数都需要经过有标签的数据的前向传导和反向传导来进行学习和优化。一般会对一个神经网络的参数进行初始化,有随机初始化,也有的会利用高斯函数进行初始化。目前最常用的训练方法是采用bp算法来进行神经网络参数的训练。bp算法的算法核心是梯度下降法,来尽量减小的目标函数的误差值,在之后的学习迭代后达到极小值后,就可以认为整个神经网络参数达到了一个极优的结果。

面对复杂的非线性分类任务,两层(带一个隐藏层)神经网络可以分类的很好。下面的例子中,a线与b线代表数据。而a区域和b区域代表由神经网络划开的区域,两者的分界线就是决策分界。如图6所示。

可以看到,这个两层神经网络的决策分界是非常平滑的曲线,而且分类很好。单层网络只能做线性分类任务。两个线性分类任务结合就可以做非线性分类任务。把输出层的决策分界单独拿出来看一下。如图7所示。

可以看到,输出层的决策分界仍然是直线。关键就是,从输入层到隐藏层时,数据发生了空间变换。也就是说,两层神经网络中,隐藏层对原始的数据进行了一个空间变换,使其可以被线性分类,然后输出层的决策分界划出了一个线性分类分界线,对其进行分类。

这样就导出了两层神经网络可以做非线性分类的关键--隐藏层。从开始推导出的矩阵公式可知,矩阵和向量相乘,本质上就是对向量的坐标空间进行一个变换。因此,隐藏层的参数矩阵的作用就是使得数据的原始坐标空间从线性不可分,转换成了线性可分。

两层神经网络通过两层的线性模型模拟了数据内真实的非线性函数。因此,多层的神经网络的本质就是复杂函数拟合。

本发明不局限于上述可选实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是落入本发明权利要求界定范围内的技术方案,均落在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1