深度神经网络的下采样方法、装置和计算机设备与流程

文档序号:15762198发布日期:2018-10-26 19:26阅读:581来源:国知局
深度神经网络的下采样方法、装置和计算机设备与流程

本发明涉及计算机技术领域,具体而言,本发明涉及一种深度神经网络的下采样方法、装置和计算机设备。



背景技术:

近不到十年的时间里,人工智能取得了巨大的进步。而这样的进步主要是由深度学习或者说深度神经网络来推动的。深度学习是一种堆叠多层神经网络的机器学习方法。由于神经网络的层数比传统的方法层数多得多,故称为深度学习。随着近年来大量训练数据获得的可能,以及计算机计算性能(主要是显卡的计算性能)的提高,训练大型深度学习模型成为可能。随着深度学习算法的发展,深度学习在很多领域都达到了最先进的水平。例如图像识别、图像分割和自然语言处理等领域。

由于深度神经网络体积较大,如果不用适当的下采样方法对输入信号进行下采样以减少深度神经网络对内存的占用需求,很多深度神经网络都没办法进行训练。所以下采样的方法对于深度神经网络来说是非常重要的一部分,也可以说,深度神经网络的基本架构就是将输入信号逐步进行下采样,不断得到转化之后的抽象特征再加以利用。

目前深度神经网络的下采样方法包括将卷积的步长(stride)设置为大于1、最大值池化(maxpooling)和平均值池化(averagepooling)等。但是上述三种方法都会导致信息的丢失,导致深度神经网络性能较差。



技术实现要素:

本发明针对现有方式中深度神经网络下采样过程中信息丢失的问题,提出一种深度神经网络的下采样方法、装置和计算机设备,以在保持所有像素信息的情况下进行深度神经网络的下采样,提高深度神经网络的性能。

本发明的实施例根据第一个方面,提供了一种深度神经网络的下采样方法,包括步骤:

获取多个维度的输入信号,其中,所述维度包括第一通道数和第一空间尺寸;

根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,其中,所述第一通道数与所述第一空间尺寸的乘积与所述第二通道数和所述第二空间尺寸的乘积相等,所述第一空间尺寸大于所述第二空间尺寸;

根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号。

在一个实施例中,所述根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,包括:

将所述第一通道数与所述设定比值的n次方相乘,得到第二通道数,其中,n为大于等于1的正整数;

将所述第一空间尺寸与所述设定比值的n次方相除,得到第二空间尺寸。

在一个实施例中,所述第一空间尺寸包括第一水平方向尺寸和第一竖直方向尺寸,所述第二空间尺寸包括第二水平方向尺寸和第二竖直方向尺寸;

所述将所述第一空间尺寸与所述设定比值的n次方相除,得到第二空间尺寸,包括:

将所述第一水平方向尺寸与所述设定比值的x次方相除,得到第二水平方向尺寸,其中,x为小于等于n的正整数;

将所述第一竖直方向尺寸与所述设定比值的(n-x)次方相除,得到第二竖直方向尺寸。

在一个实施例中,所述n为2,所述x为1。

在一个实施例中,所述根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号,包括:

从所述输入信号中依次读取与所述第二通道数相同数目的像素;

将读取的各个像素一一存储在每个第二通道对应的信号中;

将历遍所述输入信号所有像素后得到的每个第二通道对应的信号进行堆叠,形成下采样之后的输出信号。

在一个实施例中,所述根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号,包括:

从所述输入信号中依次读取与所述第二空间尺寸相同数目的像素;

从每个第二通道对应的信号中选取一个未存储像素的信号,将依次读取的各个像素一一存储在选取的信号中;

将历遍所述输入信号所有像素后得到的各个信号进行堆叠,形成下采样之后的输出信号。

在一个实施例中,所述根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号,包括:

从所述输入信号中依次读取预设数目的像素;

从每个第二通道对应的信号中选取存在空位置的信号,将依次读取的各个像素一一存储在选取的信号中;

将历遍所述输入信号所有像素后得到的各个信号进行堆叠,形成下采样之后的输出信号。

本发明的实施例根据第二个方面,还提供了一种深度神经网络的下采样装置,包括:

输入信号获取模块,用于获取多个维度的输入信号,其中,所述维度包括第一通道数和第一空间尺寸;

维度确定模块,用于根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,其中,所述第一通道数与所述第一空间尺寸的乘积与所述第二通道数和所述第二空间尺寸的乘积相等,所述第一空间尺寸大于所述第二空间尺寸;

下采样模块,用于根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号。

本发明的实施例根据第三个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述的深度神经网络的下采样方法。

本发明的实施例根据第四个方面,还提供了一种计算机设备,所述计算机设备包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的深度神经网络的下采样方法。

上述的深度神经网络的下采样方法、装置和计算机设备,将第一空间尺寸压缩至第二空间尺寸,将第一通道数扩展至第二通道数,而第一通道数与第一空间尺寸的乘积与第二通道数和第二空间尺寸的乘积相等,因此通过将空间域上面的像素信息重排到通道域上面,就可以在保持所有像素信息的情况下实现对输入信号的下采样,有效解决了深度神经网络下采样过程中信息丢失的问题,提高了神经网络的性能和表现。

本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本发明一个实施例的深度神经网络的下采样方法的流程示意图;

图2为本发明一个实施例的输入信号和下采样之后的输出信号的示意图;

图3为本发明一个实施例的下采样之后的输出信号获得方法的示意图;

图4为本发明另一个实施例的下采样之后的输出信号获得方法的示意图;

图5为本发明另一个实施例的下采样之后的输出信号获得方法的示意图;

图6为本发明一个实施例的的深度神经网络的下采装置的结构示意图;

图7为本发明一个实施例的计算机设备的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该进一步理解的是,这里使用的“第一”和“第二”仅用于区分同一技术术语,并不对该技术术语的顺序和数量等进行限定。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

有必要先对本发明的研究背景、技术构思及其应用场景进行如下的先导性说明。

目前深度神经网络的下采样方法主要包括将卷积的步长(stride)设置为大于1,最大值池化(maxpooling)和平均值池化(averagepooling)。对于将卷积的步长(stride)设置为大于1的下采样方法,下面公式展示了输入信号x经过一次卷积运算(权重w)得到输出y的过程:

其中,s表示步长,当s大于1时,输出y的空间尺寸比x小,于是得到了下采样之后的信号。但是采样间隔的增大,使得输入层的某些模式会被漏掉,导致像素信息的丢失。而池化(pooling)只是用一个特定大小的滑动窗口作用于输入信号,在每个位置取最大值(maxpooling)或者平均值(averagepooling),从而得到输出信号,池化层没有可以学习的参数,而且因为只取最大值或者平均值,每个池化窗口很多像素信息都丢失了。

针对上述三种方式存在的深度神经网络的下采样方法存在像素信息丢失的缺陷,本发明实施例利用像素的重排和维度的变换的方法进行下采样,将原来空间域上面的像素信息重排到通道域上面,那么就可以在下采样的过程中利用全部像素信息,实现在不丢失像素信息的情况下对输入信号进行下采样,极大提高了深度神经网络的感受野(receptivefield),并同时保留了细节信息,从而提高了深度神经网络的性能和表现,极大压缩了深度神经网络的计算量。

目前好多产品功能利用到了深度神经网络,例如,噪点小视频用到的很多技术都以深度学习或者说深度神经网络为基础,yy直播当中很多功能,例如超分辨率、抠图和手势识别等都利用到了深度学习或者说深度神经网络。所以采用本发明实施例提供的深度神经网络的下采样方法,可以提高相关产品功能的性能,缩小相关产品的体积,使其可以部署到移动端流畅稳定的运行。例如,yy直播的实景分割中利用到的深度神经网络利用这种下采样方法,能够得到性能好、体积小和计算量小的模型,可以将该深度神经网络部署到移动端而且流畅稳定运行。

下面结合附图,对本发明的具体实施方式进行详细描述。

如图1所示,在一个实施例中,一种深度神经网络的下采样方法,包括步骤:

s110、获取多个维度的输入信号,其中,所述维度包括第一通道数和第一空间尺寸。

输入信号为输入深度神经网络的信号,深度神经网络的应用场景不同,输入信号的形式不同,例如,对于直播产品中的深度神经网络来说,输入信号指的一般是图像信号。输入信号有多个维度,一个是通道数,另一个是空间尺寸,一般来说,空间尺寸指的是水平方向上的尺寸和竖直方向上的尺寸,也即是宽和高。以图像信号为例,输入的图像信号有三个维度(c,h,w),即通道数c,高h和宽w。

s120、根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,其中,所述第一通道数与所述第一空间尺寸的乘积与所述第二通道数和所述第二空间尺寸的乘积相等,所述第一空间尺寸大于所述第二空间尺寸。

设定比值可以根据实际需要进行设置,例如,设定比值为2。在确定第二通道数和第二空间尺寸时,需要保证第一通道数与第一空间尺寸的乘积与第二通道数和第二空间尺寸的乘积相等,也即是保证像素的总个数不变。通过压缩第一空间尺寸,将原来空间域(即维度为空间尺寸)上面的像素信息重排到通道域(即维度为通道数),就可以在保证不丢失像素信息的情况下对输入信号进行下采样。

s130、根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号。

确定好第二通道数和第二空间尺寸后,就可以根据该第二通道数和第二空间尺寸对输入信号的所有像素进行重排,得到下采样之后的输出信号。

本实施例在保持所有像素信息的情况下对输入信号的第一空间尺寸进行下采样,第一空间尺寸可以下采样到很小的尺寸,因此深度神经网络的感受野可以得到极大的提高,从而可以让深度神经网络学习到更多的全局信息。另外,由于原来空间域上面的像素信息重排到了通道域上面,每个感受野不但获得更多的全局信息,而且能够接触到更多的细节信息。

在保持像素总个数不变的情况下,确定第二通道数和第二空间尺寸的方式有很多。例如,在一个实施例中,所述根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,包括:

s121、将所述第一通道数与所述设定比值的n次方相乘,得到第二通道数,其中,n为大于等于1的正整数。

考虑到像素的个数为正整数,所以可选的,设定比值为大于1的正整数,n除了满足为大于等于1的正整数之外,还需要满足第一空间尺寸与设定比值的n次方相除的结果为正整数。例如,输入信号的维度为(1,64),设定比值为2,则n可以为2或者4等。

将第一通道数和设定比值的n次方相乘,就可以得到第二通道数。例如,第一通道数为1,设定比值为2,n为2,则第二通道数为1*22=4。

s122、将所述第一空间尺寸与所述设定比值的n次方相除,得到第二空间尺寸。

将第一空间尺寸和设定比值的n次方相除,就可以得到第二空间尺寸。例如,第一空间尺寸为64,设定比值为2,n为2,则第二通道数为64/22=16。

在一个实施例中,所述第一空间尺寸包括第一水平方向尺寸和第一竖直方向尺寸,所述第二空间尺寸包括第二水平方向尺寸和第二竖直方向尺寸;所述将所述第一空间尺寸与所述设定比值的n次方相除,得到第二空间尺寸,包括:

s1221、将所述第一水平方向尺寸与所述设定比值的x次方相除,得到第二水平方向尺寸,其中,x为小于等于n的正整数。

考虑到像素的个数为正整数,所以在确定x的值时需要满足,第一水平方向尺寸与所述设定比值的x次方相除的结果为正整数,第一竖直方向尺寸与设定比值的(n-x)次方相除的结果为正整数。

将所述第一水平方向尺寸与所述设定比值的x次方相除,就可以得到第二水平方向尺寸。例如,第一水平方向尺寸为8,设定比值为2,n为2,x为1,则第二水平方向尺寸为8/21=4。

s1222、将所述第一竖直方向尺寸与所述设定比值的(n-x)次方相除,得到第二竖直方向尺寸。

将所述第一竖直方向尺寸与所述设定比值的(n-x)次方相除,就可以得到第二竖直方向尺寸。例如,第一竖直方向尺寸为8,设定比值为2,n为2,x为1,则第二竖直方向尺寸为8/21=4。

可选的,所述n为2,所述x为1。例如,输入信号有三个维度(c,h,w),通道数为c,高为h和宽为w,则:

(c,h,w)->(c,(h/r)*r,(w/r)*r)->(c*r2,h/r,w/r)

本实施例在保持所有像素信息的情况下对输入信号的高h和宽w下采样到原来的1/r。由于这种下采样的方法可以保证没有像素信息丢失,r可以相对比较大,这样h和w可以下采样到很小的尺寸。这样带来的好处就是网络的感受野可以得到极大的提高。提高感受野可以让网络学习到更多的全局信息。另外,由于原来空间域上面的像素信息重排到了通道域上面,每个感受野不但获得更多的全局信息,而且能够接触到更多的细节信息。

为了更好的理解本发明,下面以一个具体例子进行说明。

图2给出了一个r=2的例子。从一个维度为(1,8,8)的输入信号(左图)经过两倍的下采样转化成维度为(4,4,4)的输出信号(右图)。像素的个数1*8*8=4*4*4保持不变。右图虚框的感受野对应左图灰度部分,感受野增大了两倍。因此本发明实施例提供的下采样方法,在下采样时没有像素信息损失,而且感受野扩大了。这对提高深度神经网络的性能有极大的帮助。如果采用更大的r值,感受野将得到更大的提高。

下面结合几个实施例详细说明获得下采样之后的输出信号的具体过程,应当理解,本发明并不限制于下述方式,在确定第二通道数和第二空间尺寸后,还可以采取其它方式对输入信号所有的像素进行重排,以获得下采样之后的输出信号。

在一个实施例中,所述根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号,包括:

s131、从所述输入信号中依次读取与所述第二通道数相同数目的像素。

假设第二通道数为c,则先从输入信号中读取c个像素,步骤s132完成后,再从输入信号的剩余像素中读取c个像素,依次类推,直至输入信号中所有的像素均被读取。

读取像素的顺序可以根据实际需要进行确定,例如,可以按照行数从低到高的顺序依次读取,也可以按照列数从低到高的顺序依次读取,还可以按照区域块的方式依次读取,其中,该区域块不仅包括某一行的一些像素,还包括与该些像素竖直方向相邻的像素。

s132、将读取的各个像素一一存储在每个第二通道对应的信号中。

读取与所述第二通道数相同数目的像素后,将这些像素分别存储到每个第二通道对应的信号中,每个第二通道对应的信号中均存储一个像素。每个信号存储像素的顺序可以根据实际需要进行确定,例如,可以按照行数从低到高的顺序进行存储,也可以按照列数从低到高的顺序进行存储,还可以按照其它设置的存储规则进行存储。

s133、将历遍所述输入信号所有像素后得到的每个第二通道对应的信号进行堆叠,形成下采样之后的输出信号。

得到每个第二通道对应的信号后,将这些信号堆叠起来,就形成通道数为c的输出信号。

以一个例子进行说明。如图3所示,将一个维度为(1,8,8)的信号经过两倍的下采样转化成维度为(4,4,4)的信号的过程为:先从左图的左上角(有填充内容部分)读取四个像素,然后将该四个像素一一对应排列到右图四个信号的图示位置(有填充内容位置)。然后再从左图的左上角相邻区域读取四个像素,然后将该四个像素一一对应排列到右图四个信号的图示位置的相邻位置。依次类推,直至所有信号均被填充完毕。右图中的四个信号堆叠起来就形成通道数为4的输出信号。

在另一个实施例中,所述根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号,包括:

s13-1、从所述输入信号中依次读取与所述第二空间尺寸相同数目的像素。

假设第二空间尺寸为m,则先从输入信号中读取m个像素,步骤s13-3完成后,再从输入信号的剩余像素中读取m个像素,依次类推,直至输入信号中所有的像素均被读取。

读取像素的顺序可以根据实际需要进行确定,例如,可以按照行数从低到高的顺序依次读取,也可以按照列数从低到高的顺序依次读取,还可以按照区域块的方式依次读取,其中,该区域块不仅包括某一行的一些像素,还包括与该些像素竖直方向相邻的像素。

s13-2、从每个第二通道对应的信号中选取一个未存储像素的信号,将依次读取的各个像素一一存储在选取的信号中。

由于本实施例是采取的是读取m个像素,然后将该m个像素一次填满一个信号,所以就可以根据信号是否还未存储任何像素的规则进行选取。例如,一共有四个第二通道的信号,该四个第二通道的信号均未存储像素,则可以任意选取一个信号,如果一个信号已经存储像素,则可以从剩下的三个信号中选取一个信号。

读取与第二空间尺寸相同数目的像素后,将该些像素存储在选取的信号中。在存储时可以按照这些像素在输入信号中的排列方式直接进行存储,还可以在存储时对这些像素进行重排,本发明并不对此作出限定。

s13-3、将历遍所述输入信号所有像素后得到的各个信号进行堆叠,形成下采样之后的输出信号。

得到每个第二通道对应的信号后,将这些信号堆叠起来,就形成下采样之后的输出信号。

以一个例子进行说明。如图4所示,将一个维度为(1,8,8)的信号经过两倍的下采样转化成维度为(4,4,4)的信号的过程为:先从左图的左上角(有填充内容部分)读取16个像素,从右图中的四个信号中选取一个未存储像素的信号,如右图中的第一个信号,然后将该16个像素对应排列到第一个信号中。然后再从左图的左上角相邻区域读取16个像素,从右图剩余的三个信号中选取一个信号,然后将该16个像素排列到选取的信号中。依次类推,直至所有信号均被填充完毕。右图中的四个的信号堆叠起来就形成通道数为4的输出信号。

在另一个实施例中,所述根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号,包括:

s13a、从所述输入信号中依次读取预设数目的像素。

预设数目n可以根据实际需要进行设定。先从输入信号中读取n个像素,步骤s13c完成后,再从输入信号的剩余像素中读取n个像素,依次类推,直至输入信号中所有的像素均被读取。

读取像素的顺序可以根据实际需要进行确定,例如,可以按照行数从低到高的顺序依次读取,也可以按照列数从低到高的顺序依次读取,还可以按照区域块的方式依次读取,其中,该区域块不仅包括某一行的一些像素,还包括与该些像素竖直方向相邻的像素。

s13b、从每个第二通道对应的信号中选取存在空位置的信号,将依次读取的各个像素一一存储在选取的信号中。

存在空位置指的是信号中还有位置未存储像素。选取的方式有很多种,例如,如果只存在一个信号存在空位置,则直接选取该信号,如果存在多个信号存在空位置,可以从该多个信号中选取一个空位置最多的、能够容纳n个像素的或者多个信号中的两个信号等等,本发明并不对此作出限定。

读取n个像素后,将该些像素存储在选取的信号中。在存储时可以按照这些像素在输入信号中的排列方式直接进行存储,还可以在存储时对这些像素进行重排,本发明并不对此作出限定。

s13c、将历遍所述输入信号所有像素后得到的各个信号进行堆叠,形成下采样之后的输出信号。

得到每个第二通道对应的信号后,将这些信号堆叠起来,就形成下采样之后的输出信号。

以一个例子进行说明。如图5所示,将一个维度为(1,8,8)的信号经过两倍的下采样转化成维度为(4,4,4)的信号的过程为:先从左图的左上角读取8个像素,从右图中的四个信号中选取一个未存储像素的信号,如右图中的第一个信号,然后将该8个像素对应排列到第一个信号中。依次类推,当选取到左图所示的有填充内容部分的8个像素后,从右图剩余的三个信号中选取一个信号,如右图中的第二个信号,然后将该8个像素排列到选取的信号中。依次类推,直至所有信号均被填充完毕。右图中的四个的信号堆叠起来就形成通道数为4的输出信号。

基于同一发明构思,本发明还提供一种深度神经网络的下采样装置,下面结合附图对本发明装置的具体实施方式进行详细描述。

如图6所示,在一个实施例中,一种深度神经网络的下采样装置,包括:

输入信号获取模块110,用于获取多个维度的输入信号,其中,所述维度包括第一通道数和第一空间尺寸;

维度确定模块120,用于根据所述第一通道数、所述第一空间尺寸和设定比值,确定第二通道数和第二空间尺寸,其中,所述第一通道数与所述第一空间尺寸的乘积与所述第二通道数和所述第二空间尺寸的乘积相等,所述第一空间尺寸大于所述第二空间尺寸;

下采样模块130,用于根据所述第二通道数和所述第二空间尺寸,对所述输入信号进行下采样,获得下采样之后的输出信号。

在一个实施例中,维度确定模块120包括:

通道数确定单元,用于将所述第一通道数与所述设定比值的n次方相乘,得到第二通道数,其中,n为大于等于1的正整数;

空间尺寸确定单元,用于将所述第一空间尺寸与所述设定比值的n次方相除,得到第二空间尺寸。

在一个实施例中,所述第一空间尺寸包括第一水平方向尺寸和第一竖直方向尺寸,所述第二空间尺寸包括第二水平方向尺寸和第二竖直方向尺寸;空间尺寸确定单元用于将所述第一水平方向尺寸与所述设定比值的x次方相除,得到第二水平方向尺寸,其中,x为小于等于n的正整数;将所述第一竖直方向尺寸与所述设定比值的(n-x)次方相除,得到第二竖直方向尺寸。

在一个实施例中,所述n为2,所述x为1。

在一个实施例中,下采样模块130包括:

像素读取单元,用于从所述输入信号中依次读取与所述第二通道数相同数目的像素;

像素存储单元,用于将读取的各个像素一一存储在每个第二通道对应的信号中;

输出信号获得单元,用于将历遍所述输入信号所有像素后得到的每个第二通道对应的信号进行堆叠,形成下采样之后的输出信号。

在另一个实施例中,下采样模块130包括:

像素读取单元,用于从所述输入信号中依次读取与所述第二空间尺寸相同数目的像素;

像素存储单元,用于从每个第二通道对应的信号中选取一个未存储像素的信号,将读取的各个像素一一存储在选取的信号中;

输出信号获得单元,用于将历遍所述输入信号所有像素后得到的各个信号进行堆叠,形成下采样之后的输出信号。

在另一个实施例中,下采样模块130包括:

像素读取单元,用于从所述输入信号中依次读取预设数目的像素;

像素存储单元,用于从每个第二通道对应的信号中选取存在空位置的信号,将读取的各个像素一一存储在选取的信号中;

输出信号获得单元,用于将历遍所述输入信号所有像素后得到的各个信号进行堆叠,形成下采样之后的输出信号。

本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述的深度神经网络的下采样方法。其中,所述存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、cd-rom、和磁光盘)、rom(read-onlymemory,只读存储器)、ram(randomaccessmemory,随即存储器)、eprom(erasableprogrammableread-onlymemory,可擦写可编程只读存储器)、eeprom(electricallyerasableprogrammableread-onlymemory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。可以是只读存储器,磁盘或光盘等。

本发明实施例还提供一种计算机设备,所述计算机设备包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的深度神经网络的下采样方法。

图7为本发明计算机设备的结构示意图,包括处理器220、存储装置230、输入单元240以及显示单元250等器件。本领域技术人员可以理解,图7示出的结构器件并不构成对所有计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储装置230可用于存储应用程序210以及各功能模块,处理器220运行存储在存储装置230的应用程序210,从而执行设备的各种功能应用以及数据处理。存储装置230可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器、可编程rom(prom)、电可编程rom(eprom)、电可擦写可编程rom(eeprom)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、zip盘、u盘、磁带等。本发明所公开的存储装置包括但不限于这些类型的存储装置。本发明所公开的存储装置230只作为例子而非作为限定。

输入单元240用于接收信号的输入,以及接收多个维度的输入信号。输入单元240可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元250可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元250可采用液晶显示器、有机发光二极管等形式。处理器220是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储装置230内的软件程序和/或模块,以及调用存储在存储装置内的数据,执行各种功能和处理数据。

在一实施方式中,计算机设备包括一个或多个处理器220,以及一个或多个存储装置230,一个或多个应用程序210,其中所述一个或多个应用程序210被存储在存储装置230中并被配置为由所述一个或多个处理器220执行,所述一个或多个应用程序210配置用于执行以上实施例所述的深度神经网络的下采样方法。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

应该理解的是,在本发明各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1