一种应用于手机端的深度学习图像识别系统及实现方法与流程

文档序号：12468918阅读：来源：国知局

技术特征：

1.一种应用于手机端的深度学习图像识别方法，其特征在于，包括如下步骤：

根据概念划分映射得到一树状类别映射关系；

基于原始的Inception-v3网络结构，在网络中的降维处各增加一并联分支作为网络下一层的输入得到改进的Inception-v3网络结构；

按照所述改进的Inception-v3网络结构并在设定类上根据所述树状类别映射关系训练得到基模型；

对所述基模型进行压缩后在手机端运行识别出图像；

所述压缩至少包括：参数稀疏化、参数量化或者参数稀疏存储中的一种。

2.根据权利要求1所述的深度学习图像识别方法，其特征在于，所述降维处具体是指：

对于原始的Inception-v3网络结构，维度变化在147*147->73*73和71*71->35*35的两处降维的地方增加并联分支；

其中，所述并联分支是指，一卷积核为3*3，步长为2的卷积层，通过所述卷积层的输出和原始的Inception-v3网络结构中的Max Pooling层的输出做通道维度的拼接。

3.根据权利要求1或2所述的深度学习图像识别方法，其特征在于，还包括：在多处相邻串联的多分支并联Inception模块之间加入跨模块直连分支。

4.根据权利要求1所述的深度学习图像识别方法，其特征在于，根据概念划分映射得到一树状类别映射关系的方法具体为：

首先，定义2000类细化关键词，用以训练深度卷积神经网络即在网络的最后一个Soft max层输出2000类概念；

其次，定义10类基本类为粗概念，定义60类基本细化类为细概念；

然后，按照类别概念完成以下映射关系：

10类粗概念涵盖60类细概念，

60类细概念涵盖2000类细化关键词。

5.根据权利要求1所述的深度学习图像识别方法，其特征在于，所述参数稀疏化具体为：

设定一与稀疏比呈正比的第一阈值，若小于该阈值的神经元之间的连接则会被剪断，

若大于该阈值的神经元的连接则会被保留，得到初步稀疏模型；

设定第二阈值，并按照同样的操作得到一个稀疏比大于初步稀疏模型的第二稀疏模型；

……

设定第三阈值，并按照同样的操作得到一个稀疏比大于第二稀疏模型的第三稀疏模型。

6.根据权利要求5所述的深度学习图像识别方法，其特征在于，设定上述稀疏比变化为30％->50％->70％。

7.根据权利要求1所述的深度学习图像识别方法，其特征在于，所述参数量化具体为：

将权重矩阵聚类为4个类别，其中属于同一类的权重共享同一个权重值大小，并存储权重值的index索引；

在原始的Inception-v3网络结构，对每个卷积层和全连接层分别按照压缩比计算公式设定个量化中心，其中n表示参数个数，每个参数用b bits表示，k为量化后的中心数。

8.根据权利要求7所述的深度学习图像识别方法，其特征在于，进一步还包括：

在量化训练时采用固定类别中心不变，并将每次前馈索引离权重最近的类别中心做为该权重值，

和/或，根据稀疏模型有效参数的分布范围，线性等间隔的选取类别中心；

和/或，后馈时不进行额外计算，即固定类别中心更新权重值的index。

9.根据权利要求1所述的深度学习图像识别方法，其特征在于，所述参数稀疏存储具体为：

对于权重值的index，存储与上一个有效权重值的相对位置，不存储绝对位置的index。

10.一种应用于手机端的深度学习图像识别系统，其特征在于，包括：映射关系单元、结构改进单元以及模型单元，

所述映射关系单元，用以根据概念划分映射得到一树状类别映射关系；

所述结构改进单元，用以基于原始的Inception-v3网络结构，在网络中的降维处各增加一并联分支作为网络下一层的输入得到改进的Inception-v3网络结构；

所述模型单元，用以按照所述改进的Inception-v3网络结构并在设定类上根据所述树状类别映射关系训练得到基模型；

以及，对所述基模型进行压缩后在手机端运行识别出图像；所述压缩至少包括：参数稀疏化、参数量化或者参数稀疏存储中的一种。

完整全部详细技术资料下载

当前第2页1 2 3