一种基于李群深度学习分析图像序列不变性的方法与流程

文档序号:16685844发布日期:2019-01-22 18:18阅读:1233来源:国知局

本发明涉及一种基于李群深度学习分析图像序列不变性的方法,属于图像处理技术领域。



背景技术:

在识别图像序列中的一幅图像时主要是抓住图像的不变性进行识别。不变性是由图像的最小生成元决定的,有了最小生成元的基本元素,就可以生成复杂的图像。如汉字系统以基本笔画为最小生成元;英文语言系统以26个字母为最小生成元;图形、图像结构以点、线、面为最小生成元;空间变换以平移、旋转为最小生成元等。



技术实现要素:

本发明所要解决的技术问题是,克服现有技术的缺点,提供一种基于李群深度学习分析图像序列不变性的方法,利用李群子范畴进行表示,系统提出面向图像序列隐含信息特征深度不变性的李群深度学习理论框架。

为了解决以上技术问题,本发明提供一种基于李群深度学习分析图像序列不变性的方法,其特征在于包括以下步骤:

⑴假设样例空间中有p个独立向量,观测空间有q个固变量,分别表示为:

x=(x1,…,xp)∈x=rp,u=(u1,…,up)∈u=rq,

建立关系式:

uα=fα(x1,…,xp),α=1,…q

因此,开集m上的一个局部李变换群就称之为作用于x×u上的不变群;

⑵以x×u为基底构造x×u(n),即由低维结构到高维结构。

具体分析如下:

设f(x)=f(x1,…,xp),即f:rp→r,它具有个不同的k阶偏导数,记为:

其中j=(j1,…jk),1≤jk≤p,k为j的重数。一般的,若即u=(u1,…,uq)=f(x)=(f1(x1,…,xp),…,fq(x1,…,xp)2,则uα(α=1,…q)具有qpk个不同的k阶偏导数,

其中α=1,…,q,j的重数为k;而

u(n)=u×u1×u2×…×un;

即u(n)中的元素为其中α=1,…,q,jk(k=1,…,n)的重数为k;

显然uk是qpk维的,而u(n)的维数则为:

即记为qp(n)

⑶进一步将m扩展到多模态结构上,即m(n)

m(n)=m×u1×…×un;

通过x×u和x×u(n)的关系,可以看出复杂图像可以由简单图像生成,即图像序列问题可以由单幅图像的方法在连续空间上处理。

本发明的有益效果是:本发明所介绍的李群理论的一个核心思想是将全局对象,也就是李群本身,用李群的局部或者称作李群的线性化版本来替代。这个李群局部的无穷小群被称作李代数;李群机器学习避免了常规流形学习中流形结构和性质难以确定以及两类空间中相互映射难以定义的问题。李群在现代几何中发挥的重要作用使得李群机器学习面对李群训练样例时能够明确界定学习的任务以及选择合适的性能度量标准,以此给出完整的机器学习系统。通过该学习分析方法,李群理论在机器学习主要应用在视觉感知、目标跟踪、运动估计、自动控制等方面。李群机器学习的目标任务很多时候都直接或者间接地涉及到李群流形上的拓扑不变性问题,这样的拓扑不变性问题不仅能够帮助在计算机视觉中寻找恒常的视觉认知,还能够为机械系统估计复杂的刚性运动。

具体实施方式

实施例1

本实施例以寻找图像序列中的一副图像的李不变子群和最小生成元为例说明本项目具体的研究方法。

(1)线性结构中不变群的方法:

m是m维微分流形,g是作用于m的一个局部李变换群,如果对m的一个子群中的任意一个x∈φ和g∈g均有g·x∈φ,即则m的一个子集φ就是g的不变子集。依此可类推得,若m的子集φ1和φ2是g不变子集,则也是g不变子集。

(2)找线性结构中生成元的方法:

设g是作用于m的局部李交换群,对其李代数ge中的任一非零元素v,有相应的单参数子群g(tv)。因此可得m上的向量场v,则称之为g的生成元。并且ge到m向量场李代数l(m)的一个李代数同态可表示为:

σ:ge→l(m)。

本实施例中通过建立iso(2)在r2上的群作用与so(3)在二维球面s2上的群作用之间的一个局部同构的平移和旋转两个不变性来具体说明本项目的技术路线。

(1)若iso+(2)是非紧的,则我们处理的图像限定在一个紧区域上,并且我们所关注的平移旋转也就被限定在了完整变换群的一个紧子集上。由此可以看出,任何与iso+(2)局部同构的群都产生相同的不变性问题。

(2)为找出局部同构,我们用参数化方法进行处理。即表示为:

bq={(x,y)∈r2,||x+y||<ε}表示r2中原点周围的一个以ε为半径的圆曲面,x=rcosφ和y=rsinφ表示r2中点标记(r,φ)的极坐标。

s2曲线将被参数化为极坐标(θ,φ),其中0≤θ≤2π度量了到正z轴的极角,0≤φ≤2π度量了到正x轴的方位角,由此有如下表达式:

对于r∈so(3),使用欧拉角(θ,φ,ψ)r分解为绕x轴、y轴以及z轴旋转:

该式直观表述的含义是r=(θ,φ,ψ)首先绕z轴旋转至球面坐标(θ,φ),然后绕ez的旋转图像以ψ来旋转另外两个基本向量。

下面再引入符号

现建立从b1中的点到(球面的北半球)上的点的映射为:

其中

其中,r2和s2之间的下标是为了证明使用的是球面坐标还是平面坐标。

三维旋转对应表示为:其中

α=ψ,tx=sinθcosφ,ty=sinθsinφ,

由此式可以看出,这些对应关系形成了一个局部同构。即:如果x=(x,y)∈bε且

对某些且r=γ(t),则有||t(x)-ω-1ur(ω(x)))||=o(ε2)。进一步,通过ω:(其中f(ω(x))=h(x))将它们射影到球面上。我们称同胚φ:r2→r2是一个δ-同胚,当对所有x∈r2时,有||x-φ(x)||≤δ,在这样的条件下有如下结论:

对任意其中存在一个δ-同胚φt,使得对任意之集被限定在bε上的图像h有,(ω-1((ωf)γt))(x)=f(φt(x)),δ=o(ε2)。

上式表明,对大于ε的图像所做的不超过ε的平移/旋转可以通过将图像投影到球面上并旋转球面来实现。在实际中即使对ε=1/2的失真也是可以接收的,当ε<0.1时,对图像的影响也可以忽略不计。这就给我们在处理视觉感知图像旋转问题时提供了一种具体的实现技术。

(3)旋转可以看作是在s上按so(3)的元素平移来进行处理。

对于一幅0<ω<1/2的n×n像素的图形m,向量可以按在o(l3n2)时间内计算出来。已经成功验证当ω=0.5时,l≈n。

综上所述,通过图像序列中的一副图像的李子群表示,利用李群的连通关系及李群子范畴的相关理论,建立李群深度学习理论框架。

除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1