图像分类方法、装置、移动终端及计算机可读存储介质与流程

文档序号:29611228发布日期:2022-04-13 08:57阅读:63来源:国知局
图像分类方法、装置、移动终端及计算机可读存储介质与流程

1.本发明涉及图像处理技术领域,具体而言,涉及一种图像分类方法、装置、移动终端及计算机可读存储介质。


背景技术:

2.随着技术的不断进步,神经网络模型的应用越来越广泛。其中,神经网络模型在图像分类方面的应用也很广泛。具体地,将图片输入至训练好的神经网络分类模型,神经网络分类模型便可以输出分类的结果标签,确定该图片包含的对象的类型。
3.然而,现有分类模型的负样本抗性较低,导致分类结果并不准确。


技术实现要素:

4.有鉴于此,本发明的目的在于提供一种图像分类方法、装置、移动终端及计算机可读存储介质,以解决上述问题。
5.第一方面,本技术实施例提供了一种图像分类方法,所述图像分类方法包括:
6.对输入图像进行特征提取,获取所述输入图像的特征向量;
7.分别确定所述特征向量与多个预先设定的权重向量的相似度,其中,多个所述预先设定的权重向量与预先设置的多个类型一一对应,所述多个类型包括目标类型;
8.获取所述目标类型的相似度分布情况,并根据所述目标类型的相似度分布情况及所述目标类型对应的相似度确定所述输入图像为所述目标类型的极端值概率,所述极端值概率表征所述输入图像不属于所述相似度分布情况内类别的概率,所述相似度分布情况表征所述目标类型的样本与所述目标类型对应的权重向量的相似度的分布情况;
9.根据所述相似度确定所述输入图像的多个归一化概率,所述多个归一化概率与所述多个类型一一对应;
10.根据所述目标类型对应的所述极端值概率及所述目标类型对应的所述归一化概率确定最终概率,所述最终概率表征所述输入图像为所述目标类型的概率。
11.在一种可选的实施方式中,所述根据所述目标类型对应的所述极端值概率及所述目标类型对应的所述归一化概率确定最终概率的步骤包括:
12.以所述极端值概率为权重对所述归一化概率进行加权平均操作确定所述最终概率。
13.在一种可选的实施方式中,所述极端值概率、所述归一化概率及所述最终概率满足算式:
14.p_finali=(1-p_evti)*p_softmaxi15.其中,i表征所述目标类型,p_finali为所述目标类型对应的最终概率,p_evti为所述目标类型对应的极端值概率,p_softmaxi为所述目标类型对应的归一化概率。
16.在一种可选的实施方式中,在所述根据所述目标类型对应的所述极端值概率及所述目标类型对应的所述归一化概率确定最终概率的步骤之后,所述方法还包括:
17.根据多个所述最终概率确定负样本概率,所述负样本概率表征所述输入图像不属于所述多个类型中的任意一类的概率。
18.在一种可选的实施方式中,多个所述最终概率及所述负样本概率满足算式:
[0019][0020]
其中,p_finalf为所述负样本概率,k表征所述多个类型的数量,i表征所述目标类型,p_finali为所述目标类型对应的最终概率。
[0021]
在一种可选的实施方式中,在所述根据多个所述最终概率确定负样本概率的步骤之后,所述方法还包括:
[0022]
根据多个所述最终概率及所述负样本概率确定所述输入图像的类型。
[0023]
在一种可选的实施方式中,所述根据多个所述最终概率及所述负样本概率确定所述输入图像的类型的步骤包括:
[0024]
确定多个所述最终概率及所述负样本概率中的最大概率值;
[0025]
将最大概率值对应的所述类型确定为所述输入图像的类型。
[0026]
第二方面,本技术实施例还提供了一种图像分类装置,所述图像分类装置包括:
[0027]
特征提取模块,用于对输入图像进行特征提取,获取所述输入图像的特征向量;
[0028]
计算模块,用于分别确定所述特征向量与多个预先设定的权重向量的相似度,其中,多个所述预先设定的权重向量与预先设置的多个类型一一对应,所述多个类型包括目标类型;
[0029]
极端值估计模块,用于获取所述目标类型的相似度分布情况,并根据所述目标类型的相似度分布情况及所述目标类型对应的相似度确定所述输入图像为所述目标类型的极端值概率,所述极端值概率表征所述输入图像不属于所述相似度分布情况内类别的概率;
[0030]
归一化概率确定模块,用于根据所述相似度确定所述输入图像的多个归一化概率,所述多个归一化概率与所述多个类型一一对应;
[0031]
最终概率确定模块,用于根据所述目标类型对应的所述极端值概率及所述目标类型对应的所述归一化概率确定最终概率,所述最终概率表征所述输入图像为所述目标类型的概率。
[0032]
第三方面,本技术实施例还提供了一种移动终端,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器可执行所述机器可执行指令以实现上述任意一种实施方式中的图像分类方法。
[0033]
第四方面,本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种实施方式中的图像分类方法。
[0034]
本发明实施例提供的图像分类方法、装置、移动终端及计算机可读存储介质,通过分别确定特征向量与多个预先设定的权重向量的相似度,并获取目标类型的相似度分布情况,并根据目标类型的相似度分布情况及目标类型对应的相似度确定输入图像为目标类型的极端值概率,然后根据目标类型对应的极端值概率及目标类型对应的归一化概率确定最终概率。由于先确定极端值概率用以确定输入图像不属于某个分布内类别的概率,并结合该极端值概率和归一化概率确定最终概率,这就使得即使输入图像属于分布外数据类别且
其在某个类别上的归一化概率很高,其在该类别上的最终概率也会很低,从而达到提高负样本抗性的效果。
[0035]
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0036]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0037]
图1示出了本发明实施例提供的图像分类方法的流程图。
[0038]
图2示出了图1中s107的具体流程图。
[0039]
图3示出了本发明实施例提供的图像分类装置的功能模块图。
[0040]
图4示出了本发明实施例提供的移动终端的方框示意图。
[0041]
图标:100-图像分类装置;110-特征提取模块;120-计算模块;130-极端值估计模块;140-归一化概率确定模块;150-最终概率确定模块;160-类型确定模块;200-移动终端;201-射频单元;202-网络模块;203-音频输出单元;204-输入单元;2041-图像处理器;2042-麦克风;205-传感器;206-显示单元;2061-显示面板;207-用户输入单元;2071-触控面板;2072-其他输入设备;208-接口单元;209-存储器;210-处理器;211-电源。
具体实施方式
[0042]
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0043]
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0044]
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0045]
传统神经网络中,常常需要利用分类模型确定输入图像属于某一类型的归一化概率,然后根据其归一化概率输出分类的结果标签。然而,传统神经网络存在负样本抗性较低的问题。
[0046]
现有技术中,大多需要通过对模型输出概率进行阈值过滤的方式来降低负样本抗性,即只有当模型输出某一类结果的概率大于某一人工设置的阈值时,才会认为模型对该
结果有较高置信度,予以采纳,否则不输出结果。
[0047]
然而,利用上述方法对于提高负样本抗性的作用有限,该方法需要大量测试和调参工作与经验,且调参过程依靠的数据需要在大量真实环境下进行测试获得,成本较高;同时,调参依赖于测试工程师的经验,阈值过大会降低模型准确率,无法在目标场景获得正确分类,阈值过小则负样本抗性提高不明显;进一步地,当后期模型出现更新维护时,之前测试调节获得的阈值无法继续使用,需要重新测试,维护成本较高;最后,该方法无法根本改善模型负样本抗性,部分分布外类别在模型某一类上也可能会有较高的分类概率。
[0048]
而发明人经研究发现,而传统分类模型负样本抗性较低的主要原因如下:
[0049]
其一,传统分类模型采用归一化概率确定类别标签。可以理解地,通过softmax函数后产生的概率因为是归一化的(即各类别概率之和为1),因此其本质是一种相对的概率,蕴含了这张输入图像已经属于分布内数据类别的假设,或者换句话说,softmax归一化后产出的概率为:在输入图像不是分布外数据类别的前提下,该图片为某一类别的概率是多少。因此传统分类模型产出的softmax概率不适用于分布外数据。
[0050]
其中,神经网络模型需要使用大量图片数据进行训练才可获得对图片分类的能力,而这些训练模型时使用的数据所包含的类别称为分布内类别;相应地,对于训练时没有使用过的数据类别,即为分布外类别。例如,预先使用苹果和橘子的图片训练和一个可以对苹果和橘子进行区分的分类神经网络,那么苹果和橘子即为分布内数据类别,香蕉即为分布外数据类别。
[0051]
其二,传统分类模型的最后一层是线性回归的,因此其决策边界对于模型的最后一层特征来说是线性的,而线性的决策边界并不适合用于无限宽广的特征空间做负样本识别。
[0052]
由此,本技术实施例提供了一种图像分类方法,可以先确定极端值概率用以确定输入图像不属于某个分布内类别的概率,并结合该极端值概率和归一化概率确定最终概率,使得即使输入图像属于分布外数据类别且其在某个类别上的归一化概率很高,其在该类别上的最终概率也会很低,从而达到提高负样本抗性的效果。
[0053]
下面将对本技术实施例进行详细的说明。
[0054]
请参阅图1,为本技术实施例提供的图像分类方法的流程图,实施例描述的处理流程的执行主体可以为一移动终端200。该图像分类方法包括:
[0055]
s101,对输入图像进行特征提取,获取输入图像的特征向量。
[0056]
需要说明的是,移动终端200上配置有已经训练至收敛的分类模型。从而。移动终端200接收到该输入图像以后,便可直接提取该输入图像的特征向量。提取特征的算法包括但不仅限于方向梯度直方图(histogram of oriented gradient,hog)算法、尺度不变特征变换(scale-invariant features transform,sift)算法等。
[0057]
s102,分别确定特征向量与多个预先设定的权重向量的相似度,其中,多个预先设定的权重向量与预先设置的多个类型一一对应,多个类型包括目标类型。
[0058]
需要说明的是,该分类模型可以识别的类型即为预先设置的多个类型,且每个类型都存在对应的、预先设置的权重向量。此外,多个预先设定的权重向量可以来自于基于分布内数据集训练至收敛的分类模型的最后一层全连接层,最后一层全连接层中的每一个权重向量可以作为某分布内数据类别在该特征空间的特征向量表示,即所述预先设定的权重
向量。
[0059]
在一种可选的实施方式中,上述相似度可以为余弦相似度,且该余弦相似度可采用以下算式进行计算:
[0060][0061]
其中,i表征类型,cos_si表征类型i对应的相似度,x表征特征向量,yi表征类型i对应的权重向量。
[0062]
此外,目标类型可以为多个类型中的一个或多个。目标类型对应的相似度表征该特征向量与目标类型对应的权重向量的差异度。
[0063]
需要说明的是,在其他实施方式中,该相似度也可以为其他类型的相似度,例如欧式距离等。
[0064]
s103,获取目标类型的相似度分布情况,并根据目标类型的相似度分布情况及目标类型对应的相似度确定输入图像为目标类型的极端值概率。
[0065]
需要说明的是,相似度分布情况具体可以指某一类型对应的相似度的分布情况。具体地,相似度分布情况表征目标类型的样本与目标类型对应的权重向量的相似度的分布情况。在一种可选的实施方式中,在对分类模型训练结束后,再收集验证集中的每个训练样本的特征向量与多个预先设定的权重向量的相似度,再将所有的相似度按照其所属类型进行分组,并对确定每组相似度的分布情况则可以得到该类型对应的相似度分布情况。
[0066]
例如,训练好的分类模型可以识别a、b、c三种类型的图像,且验证集包括总共3n个训练样本,每个类别各自有n个训练样本。对于每个训练样本而言都具备3个相似度(且分别对应a、b、c三类),则对于3n个训练样本而言则可以确定9n个相似度,将9n个相似度按照其样本所属类型进行分组,则可以得到n个a类型样本对应的a类型相似度、n个b类型样本对应的b类型相似度以及n个c类型样本对应的c类型相似度。
[0067]
在一种可选的实施方式中,对具有相同类型的所有相似度使用韦布尔分布拟合一组极端值估计参数,便可以获得该类型样本在该类型上的相似度分布情况。
[0068]
在获取目标类型的相似度分布情况后,便根据目标类型的相似度分布情况及目标类型对应的相似度进行极端值估计(extreme value theory,evt)操作,从而确定目标类型的极端值概率。
[0069]
可以理解地,极端值概率表征输入图像不属于相似度分布情况内类别的概率,换句话说,该目标类型的极端值概率表征输入图像“属于目标类型的极端值的概率”。
[0070]
从而,极端值概率越大,则表明该输入图像属于分布外类别的概率越大。一般地,如若输入图像属于分布外类别,则该极端值概率为1;如若输入图像属于分布内类别,则该极端值概率接近0。
[0071]
需要说明的是,该目标类型可以为多个,也即,通过本步骤可以确定所有类型的极端值概率。
[0072]
s104,根据相似度确定输入图像的多个归一化概率,多个归一化概率与多个类型一一对应。
[0073]
可以理解地,该归一化概率可以利用softmax或amsoftmax确定。在一种优选的实施方式中,该归一化概率可采用amsoftmax确定,利用amsoftmax并结合mixup、ac-block等
一系列模型优化方法,可以提高模型的泛化性能,从而提取到更加具有分布内类别代表性的特征。
[0074]
s105,根据目标类型对应的极端值概率及目标类型对应的归一化概率确定最终概率,最终概率表征输入图像为目标类型的概率。
[0075]
在一种可选的实施方式中,以极端值概率为权重对归一化概率进行加权平均操作确定最终概率。
[0076]
具体地,极端值概率、归一化概率及最终概率满足算式:
[0077]
p_finali=(1-p_evti)*p_softmaxi[0078]
其中,i表征目标类型,p_finali为目标类型对应的最终概率,p_evti为目标类型对应的极端值概率,p_softmaxi为目标类型对应的归一化概率。
[0079]
可以理解地,由于p_evti表征输入图像属于目标类型的极端值的概率,从而1-p_evti可表征输入图像不是某个类型的极端值的概率,将该极端值概率作为权重,用于衡量输入图像作为分布内类别的概率,再与相同类型的归一化概率相乘,便可得到输入图像为某个类型的最终概率。
[0080]
可以理解地,如若训练模型可以识别出n个类型,那么则可以输入图像分别为这n个类型的最终概率。
[0081]
假设输入图像属于分布内类别,则在每个类型对应的极端值概率均接近于0,此时p_finali≈p_softmaxi,与常规分类模型类似;而如若输入图像属于分布外类别,则在每个类型对应的极端值概率均为1,此时即使是某个类型的归一化概率接近1,该类型对应的最终概率也会为0,从而达到提高负样本抗性的效果。
[0082]
此外,由于是利用相似度确定最终概率,而相似度可以视为两个向量做单位向量化后进行的内积,而单位矢量在特征空间中时一个高维球面而非可以无线延伸的传统欧式空间,因此在进行极端值估计后,在此高维球面上的决策边界是一个球面上的圆环,而此圆环自然圈定了某一类向量在此球面上允许存在的有限空间,相比于原先的线性决策边界,所带来的直接将无限特征空间非至某一类别的粗暴做法,高维球面上圆环带来的决策边界有着更好的鲁棒性和可解释性,不会将过多模型从未踏足和认识的特征空间进行分类,达到提高负样本抗性的效果。
[0083]
s106,根据多个最终概率确定负样本概率,负样本概率表征输入图像不属于多个类型中的任意一类的概率。
[0084]
具体地,多个最终概率及负样本概率满足算式:
[0085][0086]
其中,p_finalf为负样本概率,k表征多个类型的数量,i表征目标类型,p_finali为目标类型对应的最终概率。
[0087]
也即,假设所有的输出结果的总概率为1,将总概率减去输入图像分别为n个类型的最终概率,则可确定该输入图像不属于多个类型中的任意一类的概率,也即,输入图像为负样本的概率。
[0088]
s107,根据多个最终概率及负样本概率确定输入图像的类型。
[0089]
可以理解地,假设可以识别n个类型,那么移动终端200可以输出的结果包括n+1
种,即输入图像输入的类型或者输入图像为负样本。
[0090]
请参阅图2,为s107的具体流程图。该s207包括:
[0091]
s1071,确定多个最终概率及负样本概率中的最大概率值。
[0092]
例如,可以对多个最终概率及负样本概率进行排序,从而确定多个最终概率及负样本概率中的最大概率值。
[0093]
s1072,将最大概率值对应的类型确定为输入图像的类型。
[0094]
也即,本技术不需要设置阈值即可确定输入图像的类型,且具备较高的负样本抗性,节约了确定阈值过程的成本,也避免了阈值设置不合理导致的分类结果不准确的问题。
[0095]
以分类模型可以识别苹果、香蕉、橘子为例,说明本技术实施例提供的图像分类方法的原理。
[0096]
首先,预先设定的权重向量包括第一权重向量、第二权重向量以及第三权重向量,分别对应于苹果、香蕉、橘子,在提取到输入图像的特征向量后,分别计算该特征向量与第一权重向量的第一相似度,特征向量与第二权重向量的第二相似度,特征向量与第三权重向量的第三相似度。
[0097]
再分别获取第一相似度分布情况、第二相似度分布情况以及第三相似度分布情况,同样分别对应于苹果、香蕉、橘子,然后对第一相似度与第一相似度分布情况进行evt得到第一极端值概率p1,对第二相似度与第二相似度分布情况进行evt得到第二极端值概率p2,对第三相似度与第三相似度分布情况进行evt得到第三极端值概率p3。
[0098]
再分别计算该输入图像分别为苹果、香蕉、橘子的第一归一化概率m1、第二归一化概率m2、第三归一化概率m3。
[0099]
然后,根据pf1=(1-p1)*m1确定第一最终概率,根据pf2=(1-p2)*m2确定第二最终概率,根据pf3=(1-p3)*m3确定第三最终概率。其中,第一最终概率pf1表征该输入图像为苹果的概率,第二最终概率pf2表征该输入图像为香蕉的概率,第三最终概率pf3表征该输入图像为橘子的概率。
[0100]
接着,根据p
fu
=1-pf1-pf2-pf3确定负样本概率,该负样本概率p
fu
表征该输入图像不为苹果、香蕉、橘子中的任意一种的概率。
[0101]
最后,比较第一最终概率pf1、第二最终概率pf2、第三最终概率pf3以及负样本概率p
fu
,将最大概率值对应的类型确定为输入图像的类型。如第一最终概率pf1最大,则可以确定输入图像的类型为苹果;如负样本概率p
fu
最大,则可以确定输入图像为负样本。
[0102]
为了执行上述实施例及各个可能的方式中的相应步骤,下面给出一种图像分类装置100的实现方式。请参阅图3,图3为本发明实施例提供的一种图像分类装置100的功能模块图。需要说明的是,本实施例所提供的图像分类装置100,其基本原理及产生的技术效果和上述实施例相同,为简要描述,本实施例部分未提及之处,可参考上述的实施例中相应内容。该图像分类装置100包括:特征提取模块110、计算模块120、极端值估计模块130、归一化概率确定模块140、最终概率确定模块150以及类型确定模块160。
[0103]
特征提取模块110由于对输入图像进行特征提取,获取输入图像的特征向量。
[0104]
可以理解地,在一种可选的实施方式中,该特征提取模块110可用于执行s101以实现相应功能。
[0105]
计算模块120用于分别确定特征向量与多个预先设定的权重向量的相似度,其中,
多个预先设定的权重向量与预先设置的多个类型一一对应,多个类型包括目标类型。
[0106]
可以理解地,在一种可选的实施方式中,该计算模块120可用于执行s102以实现相应功能。
[0107]
极端值估计模块130用于获取目标类型的相似度分布情况,并根据目标类型的相似度分布情况及目标类型对应的相似度确定输入图像为目标类型的极端值概率。
[0108]
可以理解地,在一种可选的实施方式中,该极端值估计模块130可用于执行s103以实现相应功能。
[0109]
归一化概率确定模块140用于根据相似度确定输入图像的多个归一化概率,多个归一化概率与多个类型一一对应。
[0110]
可以理解地,在一种可选的实施方式中,该归一化概率确定模块140可用于执行s104以实现相应功能。
[0111]
最终概率确定模块150用于根据目标类型对应的极端值概率及目标类型对应的归一化概率确定最终概率,最终概率表征输入图像为目标类型的概率。
[0112]
可以理解地,在一种可选的实施方式中,该最终概率确定模块150可用于执行s105以实现相应功能。
[0113]
最终概率确定模块150还用于根据多个最终概率确定负样本概率,负样本概率表征输入图像不属于多个类型中的任意一类的概率。
[0114]
可以理解地,在一种可选的实施方式中,该最终概率确定模块150可用于执行s106以实现相应功能。
[0115]
类型确定模块160用于根据多个最终概率及负样本概率确定输入图像的类型。
[0116]
具体地,类型确定模块160用于确定多个最终概率及负样本概率中的最大概率值,并将最大概率值对应的类型确定为输入图像的类型。
[0117]
可以理解地,在一种可选的实施方式中,该类型确定模块160可用于执行s107以实现相应功能。
[0118]
综上所述,本技术实施例提供的图像分类方法、装置、移动终端200及计算机可读存储介质,通过分别确定特征向量与多个预先设定的权重向量的相似度,并获取目标类型的相似度分布情况,并根据目标类型的相似度分布情况及目标类型对应的相似度确定输入图像为目标类型的极端值概率,然后根据目标类型对应的极端值概率及目标类型对应的归一化概率确定最终概率。由于先确定极端值概率用以确定输入图像不属于某个分布内类别的概率,并结合该极端值概率和归一化概率确定最终概率,这就使得即使输入图像属于分布外数据类别且其在某个类别上的归一化概率很高,其在该类别上的最终概率也会很低,从而达到提高负样本抗性的效果。
[0119]
在本技术所提供的几个实施例中,所显示或讨论的模块相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0120]
另外,在本技术各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
[0121]
请参照图4,是移动终端200的方框示意图。所述移动终端200射频单元201、网络模
块202、音频输出单元203、输入单元204、传感器205、显示单元206、用户输入单元207、接口单元208、存储器209、处理器210以及电源211等部件。本领域技术人员可以理解,图4中示出的移动终端结构并不构成对移动终端200的限定,移动终端200可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端200包括但不限于手机、平板电脑、笔记本电脑、掌上电脑等。
[0122]
其中,处理器210用于分别确定特征向量与多个预先设定的权重向量的相似度,并获取目标类型的相似度分布情况,并根据目标类型的相似度分布情况及目标类型对应的相似度确定输入图像为目标类型的极端值概率,然后根据目标类型对应的极端值概率及目标类型对应的归一化概率确定最终概率。
[0123]
应理解的是,本发明实施例中,射频单元201可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器210处理;另外,将上行的数据发送给基站。通常,射频单元201包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元201还可以通过无线通信系统与网络和其他设备通信。
[0124]
移动终端通过网络模块202为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
[0125]
音频输出单元203可以将射频单元201或网络模块202接收的或者在存储器209中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元203还可以提供与移动终端200执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元203包括扬声器、蜂鸣器以及受话器等。
[0126]
输入单元204用于接收音频或视频信号。输入单元204可以包括图形处理器(graphicsprocessingunit,gpu)2041和麦克风2042,图形处理器2041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元206上。经图形处理器2041处理后的图像帧可以存储在存储器209(或其它存储介质)中或者经由射频单元201或网络模块202进行发送。麦克风2042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元201发送到移动通信基站的格式输出。
[0127]
移动终端200还包括至少一种传感器205,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板2061的亮度,接近传感器可在移动终端200移动到耳边时,关闭显示面板2061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器205还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
[0128]
显示单元206用于显示由用户输入的信息或提供给用户的信息。显示单元206可包括显示面板2061,可以采用液晶显示器(liquidcrystaldisplay,lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板2061。
[0129]
用户输入单元207可用于接收输入的数字或字符信息,以及产生与移动终端的用
户设置以及功能控制有关的键信号输入。具体地,用户输入单元207包括触控面板2071以及其他输入设备2072。触控面板2071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板2071上或在触控面板2071附近的操作)。触控面板2071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器210,接收处理器210发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板2071。除了触控面板2071,用户输入单元207还可以包括其他输入设备2072。具体地,其他输入设备2072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
[0130]
进一步的,触控面板2071可覆盖在显示面板2061上,当触控面板2071检测到在其上或附近的触摸操作后,传送给处理器210以确定触摸事件的类型,随后处理器210根据触摸事件的类型在显示面板2061上提供相应的视觉输出。虽然在图4中,触控面板2071与显示面板2061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板2071与显示面板2061集成而实现移动终端的输入和输出功能,具体此处不做限定。
[0131]
接口单元208为外部装置与移动终端200连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(i/o)端口、视频i/o端口、耳机端口等等。接口单元208可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端200内的一个或多个元件或者可以用于在移动终端200和外部装置之间传输数据。
[0132]
存储器209可用于存储软件程序以及各种数据。存储器209可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器209可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0133]
处理器210是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器209内的软件程序和/或模块,以及调用存储在存储器209内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器210可包括一个或多个处理单元;优选的,处理器210可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器210中。
[0134]
移动终端200还可以包括给各个部件供电的电源211(比如电池),优选的,电源211可以通过电源管理系统与处理器210逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
[0135]
另外,移动终端200包括一些未示出的功能模块,在此不再赘述。
[0136]
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器210执行时实现上述图像分类方法实施例的各个过程,且
能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等。
[0137]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0138]
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0139]
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0140]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1