本发明涉及互联网技术领域,具体涉及一种确定业务参数的方法、建立图像分类模型的方法及装置。
背景技术:
当前很多业务与业务参数都是直接相关的,业务参数直接影响到业务申请是否能够成功。业务提供方在为用户分配业务时会根据已有的业务参数来评估是否为该用户分配业务。
但目前,在业务提供方有业务参数记录的人只占总人口的一小部分,绝大多数人没有业务参数记录,业务提供方无法对无业务参数记录的用户做出判断,导致业务提供方所提供的业务很难被广泛推广。
技术实现要素:
为了解决现有技术中无法得到绝大多数人的业务参数的问题,本发明实施例提供一种确定业务参数的方法,可以根据用户的应用头像进行业务参数的确定,从而提高了业务参数确定的广泛度和业务推广的广泛度。本发明实施例还提供了相应的装置。
本发明第一方面提供一种确定业务参数的方法,包括:
获取待确定业务参数的用户的应用头像;
采用具有图像分类功能的卷积神经网络CNN模型对所述应用头像进行归类处理,得到所述应用头像的多个类别标签;
确定所述多个类别标签中每个类别标签对应的数值,得到所述应用头像的头像数值,所述头像数值用于参与确定所述业务参数;
其中,所述具有图像分类功能的CNN模型是采用受限玻尔兹曼机RBM和总图像样本对初始的CNN模型进行基于无监督学习的逐层训练,再在所述总图像样本中的少量图像样本被贴上类别标签后,使用被贴上类别标签的少量图像样本进行微调得到的,所述总图像样本为大量用户的应用头像。
本发明第二方面提供一种建立图像分类模型的方法,包括:
获取总图像样本和初始的卷积神经网络CNN模型,所述总图像样本为大量用户的应用头像;
采用受限玻尔兹曼机RBM和所述总图像样本对所述初始的CNN模型进行基于无监督学习的逐层训练,得到用于图像分类的初始特征权值;
用第一部分图像样本对所述初始特征权值进行微调,得到具有图像分类功能的CNN模型;其中,所述第一部分图像样本为所述总图像样本中的一小部分,所述第一部分图像样本在从所述总图像样本中抽取后被贴上类别标签。
本发明第三方面提供一种确定业务参数的装置,包括:
获取单元,用于获取待确定业务参数的用户的应用头像;
归类单元,用于采用具有图像分类功能的卷积神经网络CNN模型对所述获取单元获取的所述应用头像进行归类处理,得到所述应用头像的多个类别标签;
确定单元,用于确定所述归类单元归类后得到的所述多个类别标签中每个类别标签对应的数值,得到所述应用头像的头像数值,所述头像数值用于参与确定所述业务参数;
其中,所述具有图像分类功能的CNN模型是采用受限玻尔兹曼机RBM和总图像样本对初始的CNN模型进行基于无监督学习的逐层训练,再在所述总图像样本中的少量图像样本被贴上类别标签后,使用被贴上类别标签的少量图像样本进行微调得到的,所述总图像样本为大量用户的应用头像。
本发明第四方面提供一种建立图像分类模型的装置,包括:
获取单元,用于获取总图像样本和初始的卷积神经网络CNN模型,所述总图像样本为大量用户的应用头像;
计算单元,用于采用受限玻尔兹曼机RBM和所述获取单元获取的总图像样本对所述初始的CNN模型进行基于无监督学习的逐层训练,得到用于图像分类的初始特征权值;
调整单元,用于用第一部分图像样本对所述计算单元得到的初始特征权值进行微调,得到具有图像分类功能的CNN模型;其中,所述第一部分图像样本为所述总图像样本中的一小部分,所述第一部分图像样本在从所述总图像样本中抽取后被贴上类别标签。
本发明实施例采用获取待确定业务参数的用户的应用头像;采用具有图像分类功能的卷积神经网络CNN模型对所述应用头像进行归类处理,得到所述应用头像的多个类别标签;确定所述多个类别标签中每个类别标签对应的数值,得到所述应用头像的头像数值,所述头像数值用于参与确定所述业务参数;其中,所述具有图像分类功能的CNN模型是采用受限玻尔兹曼机RBM和总图像样本对初始的CNN模型进行基于无监督学习的逐层训练,再在所述总图像样本中的少量图像样本被贴上类别标签后,使用被贴上类别标签的少量图像样本进行微调得到的,所述总图像样本为大量用户的应用头像。与现有技术中无法得到绝大多数人的业务参数相比,本发明实施例提供的确定业务参数的方法,可以根据用户的应用头像进行业务参数的确定,从而提高了业务参数确定的广泛度和业务推广的广泛度。例如:现有技术中无法评估绝大多数人的可信度,而本申请所提供的方案可以用户的应用头像进行可信度的评估,得到用户的信用评分,从而提高了用户信用评分的广泛度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中建立图像分类模型的方法的一实施例示意图;
图2是本发明实施例中CNN模型的结构示意图;
图3是本发明实施例中建立图像分类模型的方法的另一实施例示意图;
图4是本发明实施例中确定业务参数的方法的一实施例示意图;
图5是本发明实施例中确定业务参数的装置的一实施例示意图;
图6是本发明实施例中确定业务参数的装置的另一实施例示意图;
图7是本发明实施例中建立图像分类模型的方法的一实施例示意图;
图8是本发明实施例中建立图像分类模型的方法的另一实施例示意图;
图9是本发明实施例中确定业务参数的装置的另一实施例示意图;
图10是本发明实施例中建立图像分类模型的方法的另一实施例示意图。
实施方式
本发明实施例提供一种确定业务参数的方法,可以根据用户的应用头像进行可信度评估,从而提高了用户可信度评估的广泛度。以下分别进行详细说明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在描述本发明实施例之前,先对本发明实施例中涉及到的名词做初步的介绍:
卷积神经网络(convolutional neural networks,CNN)模型:一种深度学习模型,通过卷积运算来提取特征,卷积核通过机器自动学习得到。
受限玻尔兹曼机(restricted Boltzmann machine,RBM)一种神经网络模型,通过最小化能量函数来训练参数,可预训练深度学习模型。
单标签分类:一种分类方法,为每个样本计算一个标签,其中这个标签属于一个互斥的标签集合。
多标签分类:一种分类方法,为每个样本同时计算多个标签。
无监督学习:一种训练方法,有训练样本,但是没有训练标签。
有监督学习:一种训练方法,有训练样本和训练标签。
半监督学习:一种训练方法,有训练样本,但只有一部分有训练标签。
随着各种社交应用的广泛普及,在避免涉及用户隐私的情况下,可以选择用户的应用头像来分析用户的信用情况,例如:QQ头像、微信头像、支付宝头像和微博头像等,应用头像是大家都可见的,不涉及到用户隐私,而且,用户头像是用户根据自己的兴趣爱好和主观意愿自己设置的,这是一种主动的行为,一定程度上反映了用户的心理。需要说明的是,本发明实施例的方案不限于社交应用,所有可以公开的用户应用头像都可以用作本发明实施例。
本发明实施例中,通过挖掘用户的应用头像来评估用户的可信度,也就是给用户的信用评分。当然,确定用户信用评分的因素可以很多,不限于只有应用头像,应用头像可以只是参与用户信用评分中的一项,将诸多因素的可信度评估结果做综合处理,就可以得到一个可靠的用户信用评分。
本发明实施例中,基于用户的应用头像来确定业务参数,实际上该业务参数是能反应用户可信度的参数。本发明实施例中的能反应用户可信度的业务参数可以理解为是用户的信用评分。本发明实施例中的可信度评估和用户信用评分只是表达方式不同,实际上原理是相同的。
基于RBM对CNN进行无监督的深度训练的过程可以是:把图像样本输入到CNN模型,然后进行逐层训练,其中把上一层的输出当成下一层的输入,在逐层训练时,把输入当成标签,通过最小化重构误差,来完成这层的训练,因为实际上没有标签信息,所以是一种无监督学习方法,这种模型最后得到的是目标的特征,没有标签信息。
基于有监督训练的训练过程可以是:把样本和样本标签作为模型的输入进行训练,通过最优化目标函数完成训练,这种模型能得到目标的标签结果。
无监督的训练,不需要为图像标注标签,但是训练出来的结果没有标签信息,不准确,有监督的训练,需要标注大量的图像标签,又导致工作繁琐,且容易出错。
针对以上传统方法及其缺点,本发明实施例提供了一种基于应用图像建立图像分类模型的方法,并基于该图像分类模型确定业务参数的方法。
参阅图1,本发明实施例中建立图像分类模型的方法的一实施例包括:
101、获取总图像样本和初始的卷积神经网络CNN模型,所述总图像样本为大量用户的应用头像。
102、采用受限玻尔兹曼机RBM和所述总图像样本对所述初始的CNN模型进行基于无监督学习的逐层训练,得到用于图像分类的初始特征权值。
本发明实施例中初始特征权值为图像特征的量化值。
103、用第一部分图像样本对所述初始特征权值进行微调,得到具有图像分类功能的CNN模型;其中,所述第一部分图像样本为所述总图像样本中的一小部分,所述第一部分图像样本在从所述总图像样本中抽取后被贴上类别标签。
微调的过程就是建立初始特征权值与类别标签的对应关系的过程。
微调的方法可以有两种,一种为:所述用第一部分图像样本对所述初始特征权值进行微调,可以包括:
对所述第一部分图像样本进行有监督学习的逐层训练,提取出所述第一部分图像样本中的特征权值和所述第一部分图像样本的类别标签;
将所述初始特征权值与所述第一部分图像样本的类别标签建立关联,得到具有图像分类功能的CNN模型。
本方案中,只为总图像样本中一小部分图像样本贴上类别标签,可以降低工作繁琐度,而且还能解决完全没有标签的情况下无法实现图像归类的问题,这样,本发明实施例提供的方法,可以提高图像归类的效率。
另一种为:所述用第一部分图像样本对所述初始特征权值进行微调时,所述方法还可以包括:
对第二部分图像样本进行有监督学习的逐层训练,提取出所述第二部分图像样本中的特征权值和所述第二部分图像样本的类别标签,所述第二部分图像样本的类别标签为所述初始的CNN模型中输出层输出的概率最高的类别标签,所述第二部分图像样本为所述总图像样本中除去所述第一部分图像样本的剩余图像样本;
将所述初始特征权值与所述第二部分图像样本的类别标签建立关联。
本方案中,只为总图像样本中一小部分图像样本贴上类别标签,可以降低工作繁琐度,而且针对总图像样本中未贴标签的图像样本,可以采用输出层输出的概率最高的类别标签作为该图像的类别标签,这样,相对于上一种只依靠一小部分带类别标签的图像样本进一步提高了图像分类的准确度。
另外,考虑到应用头像好多都是用户上传的自拍照片,代表同一类别的照片因为光亮度的不同,使得Softmax层分类时产生了误分类,可能会被分到不同的类别中,因此,本发明实施例中,在CNN模型中设置了亮度归一化层,例如:如图2所示,在Softmax层之前加入一个亮度归一化层。这样,所述用第一部分图像样本对所述初始特征权值进行微调之前,所述方法还可以包括:
对所述第一部分图像样本进行亮度归一化处理;
所述用第一部分图像样本对所述初始特征权值进行微调,可以包括:
用亮度归一化处理后的第一部分图像样本对所述初始特征权值进行微调。
下面结合图3,对本发明实施例中建立图像分类模型的过程做进一步介绍:
201、建立一个初始的CNN模型,然后基于原始的总图像样本用RBM对初始的CNN模型进行基于无监督学习的逐层训练,得到用于图像分类的初始特征权值。
202、从原始的总图像样本中随机抽取出少量的图像样本A和大量的图像样本B。
203、针对少量的图像样本A可以用自定义的类别标签对样本A进行多标签标注,多标签标注即一个样本同时标注多个类别标签。
根据经验知识自定义一些对信用评分有用的类别标签,在选取标签时,可以定义若干个大类标签集合{A,B,C,…},每个大类里有多个小类,比如大类A的小类标签集合为{a1,a2,a3,…}等。
举例来说,大标签集合中的A可以为图像内容种类,B可以为图像像素,当然大类标签还可以有其他的标签,本处不一一列举。小类标签集合中a1可以为动物,a2可以为人物,a3可以为卡通,…,B的小类中可以包含模糊和清晰。其他大类的小类本处不一一列举。
用自定义的类别标签对样本A进行多标签标注。每个样本的类别标签必须包含所有大类,但对于每一个大类,它有且只有一个小类;例如:一图像样本的标签可以为A-a1、B-b1…,也就是图像内容种类的人物、图像像素模糊…,“…”表示对其他种类标签不做一一列举。
204、利用无标签的图像样本B和有标签的图像样本A在初始特征权值的基础上进行基于有监督学习的微调,其中无标签的样本B使用输出层概率最高的类当作其标签,这样得到的训练好的CNN模型即为具有图像分类功能的CNN模型。
其中无标签的样本B使用输出层概率最高的类当作其标签。
即
其中f′(x)为输出层的输出,y′i为无标签的样本B的第i个标签,在微调阶段,CNN的代价函数如下:
其中C为总体代价函数,n为有标签的图像样本A的总数,S为标签的数目,λ为有标签样本和无标签样本的平衡因子,n′为无标签样本B的总数,为第m个样本A的第i个标签,为第m个样本A的输出层的第i个输出,为第m个样本B的第i个标签,为第m个样本B的输出层的第i个输出,L为交叉熵。CNN模型如图2所示。考虑到有大量应用头像的图片来自于用户的手机或者网络摄像头自拍照片,这些代表同一个场景的图片可能会因为光照不同,使得Softmax层分类时产生了误分类,被分到了不同的类别,为了克服这一问题。如图2所示,在Softmax层之前加入一个亮度归一化层,可以用Luminance Norm层来表示亮度归一化层。
Luminance Norm层的前向公式可以表达为:
对于训练好的具有图像分类功能的CNN模型,在确定业务参数时,只需要输入用户的应用头像。
关于基于具有图像分类功能的CNN模型确定户业务参数的过程可以参阅图4所示的实施例进行理解。
参阅图4,本发明实施例提供的确定业务参数的方法的一实施例包括:
301、获取待确定业务参数的用户的应用头像。
302、采用具有图像分类功能的卷积神经网络CNN模型对所述应用头像进行归类处理,得到所述应用头像的多个类别标签。
其中,所述具有图像分类功能的CNN模型是采用受限玻尔兹曼机RBM和总图像样本对初始的CNN模型进行基于无监督学习的逐层训练,再在所述总图像样本中的少量图像样本被贴上类别标签后,使用被贴上类别标签的少量图像样本进行微调得到的,所述总图像样本为大量用户的应用头像。
303、确定所述多个类别标签中每个类别标签对应的数值,得到所述应用头像的头像数值,所述头像数值用于参与确定所述业务参数。
类别标签会对应一个数值,这个可以预先设定,例如:在图像内容类别标签里面,把动物定义为0,任务定义为1,卡通定义为2。把像素标签里面,清晰定义为0,模糊定义为1。其他类别标签中的变量也可以做类似的定义。
这样的,针对一个应用头像我们就能得到一系列的值,比如,图像内容的结果是3,像素结果是1,…,这样,就可以按次序确定应用头像的评分数值为:3,1,…。
本发明实施例采用获取待确定业务参数的用户的应用头像;采用具有图像分类功能的卷积神经网络CNN模型对所述应用头像进行归类处理,得到所述应用头像的多个类别标签;确定所述多个类别标签中每个类别标签对应的数值,得到所述应用头像的头像数值,所述头像数值用于参与确定所述业务参数;其中,所述具有图像分类功能的CNN模型是采用受限玻尔兹曼机RBM和总图像样本对初始的CNN模型进行基于无监督学习的逐层训练,再在所述总图像样本中的少量图像样本被贴上类别标签后,使用被贴上类别标签的少量图像样本进行微调得到的,所述总图像样本为大量用户的应用头像。与现有技术中无法得到绝大多数人的业务参数相比,本发明实施例提供的确定业务参数的方法,可以根据用户的应用头像进行业务参数的确定,从而提高了业务参数确定的广泛度和业务推广的广泛度。例如:现有技术中无法评估绝大多数人的可信度,而本申请所提供的方案可以用户的应用头像进行可信度的评估,得到用户的信用评分,从而提高了用户信用评分的广泛度。
可选地,在上述图1对应的实施例的基础上,本发明实施例提供的确定业务参数的方法的一可选实施例中,所述采用具有图像分类功能的卷积神经网络CNN模型对所述应用头像进行归类处理,得到所述应用头像的多个类别标签,可以包括:
采用具有图像分类功能的卷积神经网络CNN模型计算得到所述应用头像的多个特征值;
根据所述多个特征值,以及预先建立的特征权值与类别标签的对应关系确定每个特征值对应的类别标签,得到所述应用头像的多个类别标签。
可选地,在上述图1对应的实施例的基础上,本发明实施例提供的确定业务参数的方法的一可选实施例中,所述确定所述多个类别标签中每个类别标签对应的数值,得到所述应用头像的评分数值之后,所述方法还可以包括:
向信用评分总模型输出所述应用头像的评分数值,以使所述应用头像的评分数值用于所述用户的信用评分。
本发明实施例中,将应用头像的评分数值为:3,1,…输入到信用评分总模型,即可以得到该用户的总和信用评分。
参阅图5,本发明实施例提供的确定业务参数的装置40的一实施例包括:
获取单元401,用于获取待确定业务参数的用户的应用头像;
归类单元402,用于采用具有图像分类功能的卷积神经网络CNN模型对所述获取单元401获取的所述应用头像进行归类处理,得到所述应用头像的多个类别标签;
其中,所述具有图像分类功能的CNN模型是采用受限玻尔兹曼机RBM和总图像样本对初始的CNN模型进行基于无监督学习的逐层训练,再在所述总图像样本中的少量图像样本被贴上类别标签后,使用被贴上类别标签的少量图像样本进行微调得到的,所述总图像样本为大量用户的应用头像;
确定单元403,用于确定所述归类单元402归类后得到的所述多个类别标签中每个类别标签对应的数值,得到所述应用头像的头像数值,所述头像数值用于参与确定所述业务参数。
本发明实施例获取单元401获取待确定业务参数的用户的应用头像;归类单元402采用具有图像分类功能的卷积神经网络CNN模型对所述获取单元401获取的所述应用头像进行归类处理,得到所述应用头像的多个类别标签,确定单元403确定所述归类单元402归类后得到的所述多个类别标签中每个类别标签对应的数值,得到所述应用头像的头像数值,所述头像数值用于参与确定所述业务参数,其中,所述具有图像分类功能的CNN模型是采用受限玻尔兹曼机RBM和总图像样本对初始的CNN模型进行基于无监督学习的逐层训练,再在所述总图像样本中的少量图像样本被贴上类别标签后,使用被贴上类别标签的少量图像样本进行微调得到的,所述总图像样本为大量用户的应用头像与现有技术中无法得到绝大多数人的业务参数相比,本发明实施例提供的确定业务参数的方法,可以根据用户的应用头像进行业务参数的确定,从而提高了业务参数确定的广泛度和业务推广的广泛度。例如:现有技术中无法评估绝大多数人的可信度,而本申请所提供的方案可以用户的应用头像进行可信度的评估,得到用户的信用评分,从而提高了用户信用评分的广泛度。
可选地,在上述图5对应的实施例的基础上,发明实施例提供的确定业务参数的装置40的一可选实施例中,
所述归类单元402用于:
采用具有图像分类功能的卷积神经网络CNN模型计算得到所述应用头像的多个特征值;
根据所述多个特征值,以及预先建立的特征权值与类别标签的对应关系确定每个特征值对应的类别标签,得到所述应用头像的多个类别标签。
可选地,在上述图5对应的实施例的基础上,参阅图6,本发明实施例提供的确定业务参数的装置40的另一可选实施例中,所述装置50还包括:
输出单元404,用于向信用评分总模型输出所述确定单元403确定的所述应用头像的评分数值,以使所述应用头像的评分数值用于所述用户的信用评分。
图5或图6对应的确定业务参数的装置40的实施例或可选实施例都可以参阅图4部分的相关描述进行理解,本处不再重复赘述。
参阅图7,本发明实施例提供的建立图像分类模型的装置50的一实施例包括:
获取单元501,用于获取总图像样本和初始的卷积神经网络CNN模型,所述总图像样本为大量用户的应用头像;
计算单元502,用于采用受限玻尔兹曼机RBM和所述获取单元501获取的总图像样本对所述初始的CNN模型进行基于无监督学习的逐层训练,得到用于图像分类的初始特征权值;
调整单元503,用于用第一部分图像样本对所述计算单元502的到的所述初始特征权值进行微调,得到具有图像分类功能的CNN模型;其中,所述第一部分图像样本为所述总图像样本中的一小部分,所述第一部分图像样本在从所述总图像样本中抽取后被贴上类别标签。
本发明实施例中,获取单元501,用于获取总图像样本和初始的卷积神经网络CNN模型,所述总图像样本为用户的应用头像;计算单元502,用于采用受限玻尔兹曼机RBM和所述获取单元501获取的总图像样本对所述初始的CNN模型进行基于无监督学习的逐层训练,得到用于图像分类的初始特征权值;调整单元503,用于用第一部分图像样本对所述计算单元502的到的所述初始特征权值进行微调,得到具有图像分类功能的CNN模型;其中,所述第一部分图像样本为所述总图像样本中的一小部分,所述第一部分图像样本在从所述总图像样本中抽取后被贴上类别标签。本发明实施例提供的建立图像分类模型的装置50只为总图像样本中一小部分图像样本贴上类别标签,可以降低工作繁琐度,而且还能解决完全没有标签的情况下无法实现图像归类的问题,这样,本发明实施例提供的方法,可以提高图像归类的效率。
可选地,在上述图7对应的实施例的基础上,本发明实施例提供的建立图像分类模型的装置50的第一个可选实施例中,
所述调整单元503用于:
对所述第一部分图像样本进行有监督学习的逐层训练,提取出所述第一部分图像样本中的特征权值和所述第一部分图像样本的类别标签;
将所述初始特征权值与所述第一部分图像样本的类别标签建立关联,得到具有图像分类功能的CNN模型。
可选地,在上述图7对应的实施例的基础上,本发明实施例提供的建立图像分类模型的装置50的第二个可选实施例中,
所述调整单元503还用于:
对第二部分图像样本进行有监督学习的逐层训练,提取出所述第二部分图像样本中的特征权值和所述第二部分图像样本的类别标签,所述第二部分图像样本的类别标签为所述初始的CNN模型中输出层输出的概率最高的类别标签,所述第二部分图像样本为所述总图像样本中除去所述第一部分图像样本的剩余图像样本;
将所述初始特征权值与所述第二部分图像样本的类别标签建立关联。
可选地,在上述图7对应的实施例、装置50的第一个或第二个的基础上,参阅图8,本发明实施例提供的建立图像分类模型的装置50的第三个可选实施例中,所述装置50还包括亮度处理单元504,
所述亮度处理单元504,用于对所述第一部分图像样本进行亮度归一化处理;
所述调整单元503,用于用所述亮度处理单元504亮度归一化处理后的第一部分图像样本对所述初始特征权值进行微调。
图7或图8对应的建立图像分类模型的装置50的实施例或任一可选实施例都可以参阅图1至图3中的相关描述进行理解,本处不再重复赘述。
图9是本发明实施例提供的确定业务参数的装置40的结构示意图。所述确定业务参数的装置40包括处理器410、存储器450和输入/输出I/O设备430,存储器450可以包括只读存储器和随机存取存储器,并向处理器410提供操作指令和数据。存储器450的一部分还可以包括非易失性随机存取存储器(NVRAM)。
在一些实施方式中,存储器450存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
在本发明实施例中,通过调用存储器450存储的操作指令(该操作指令可存储在操作系统中),
获取待确定业务参数的用户的应用头像;
采用具有图像分类功能的卷积神经网络CNN模型对所述应用头像进行归类处理,得到所述应用头像的多个类别标签;
确定所述多个类别标签中每个类别标签对应的数值,得到所述应用头像的头像数值,所述头像数值用于参与确定所述业务参数;
其中,所述具有图像分类功能的CNN模型是采用受限玻尔兹曼机RBM和总图像样本对初始的CNN模型进行基于无监督学习的逐层训练,再在所述总图像样本中的少量图像样本被贴上类别标签后,使用被贴上类别标签的少量图像样本进行微调得到的,所述总图像样本为大量用户的应用头像。
本发明实施例提供的确定业务参数的装置40可以根据用户的应用头像进行业务参数的确定,从而提高了业务参数确定的广泛度和业务推广的广泛度。例如:现有技术中无法评估绝大多数人的可信度,而本申请所提供的方案可以用户的应用头像进行可信度的评估,得到用户的信用评分,从而提高了用户信用评分的广泛度。
处理器410控制确定业务参数的装置40的操作,处理器410还可以称为CPU(Central Processing Unit,中央处理单元)。存储器450可以包括只读存储器和随机存取存储器,并向处理器410提供指令和数据。存储器450的一部分还可以包括非易失性随机存取存储器(NVRAM)。的应用中确定业务参数的装置40的各个组件通过总线系统520耦合在一起,其中总线系统520除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统520。
上述本发明实施例揭示的方法可以应用于处理器410中,或者由处理器410实现。处理器410可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器410中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器410可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器450,处理器410读取存储器450中的信息,结合其硬件完成上述方法的步骤。
可选地,处理器410用于:
采用具有图像分类功能的卷积神经网络CNN模型计算得到所述应用头像的多个特征值;
根据所述多个特征值,以及预先建立的特征权值与类别标签的对应关系确定每个特征值对应的类别标签,得到所述应用头像的多个类别标签。
可选地,输入/输出I/O设备430还用于向信用评分总模型输出所述应用头像的评分数值,以使所述应用头像的评分数值用于所述用户的信用评分。
图10是本发明实施例提供的建立图像分类模型的装置50的结构示意图。所述建立图像分类模型的装置50包括处理器510、存储器550和输入/输出I/O设备530,存储器550可以包括只读存储器和随机存取存储器,并向处理器510提供操作指令和数据。存储器550的一部分还可以包括非易失性随机存取存储器(NVRAM)。
在一些实施方式中,存储器550存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
在本发明实施例中,通过调用存储器550存储的操作指令(该操作指令可存储在操作系统中),
获取总图像样本和初始的卷积神经网络CNN模型,所述总图像样本为大量用户的应用头像;
采用受限玻尔兹曼机RBM和所述总图像样本对所述初始的CNN模型进行基于无监督学习的逐层训练,得到用于图像分类的初始特征权值;
用第一部分图像样本对所述初始特征权值进行微调,得到具有图像分类功能的CNN模型;其中,所述第一部分图像样本为所述总图像样本中的一小部分,所述第一部分图像样本在从所述总图像样本中抽取后被贴上类别标签。
本发明实施例提供的建立图像分类模型的装置50只为总图像样本中一小部分图像样本贴上类别标签,可以降低工作繁琐度,而且还能解决完全没有标签的情况下无法实现图像归类的问题,这样,本发明实施例提供的方法,可以提高图像归类的效率。
处理器510控制建立图像分类模型的装置50的操作,处理器510还可以称为CPU(Central Processing Unit,中央处理单元)。存储器550可以包括只读存储器和随机存取存储器,并向处理器510提供指令和数据。存储器550的一部分还可以包括非易失性随机存取存储器(NVRAM)。的应用中建立图像分类模型的装置50的各个组件通过总线系统520耦合在一起,其中总线系统520除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统520。
上述本发明实施例揭示的方法可以应用于处理器510中,或者由处理器510实现。处理器510可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器510中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器510可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器550,处理器510读取存储器550中的信息,结合其硬件完成上述方法的步骤。
可选地,处理器510用于:
对所述第一部分图像样本进行有监督学习的逐层训练,提取出所述第一部分图像样本中的特征权值和所述第一部分图像样本的类别标签;
将所述初始特征权值与所述第一部分图像样本的类别标签建立关联,得到具有图像分类功能的CNN模型。
可选地,处理器510用于:
对第二部分图像样本进行有监督学习的逐层训练,提取出所述第二部分图像样本中的特征权值和所述第二部分图像样本的类别标签,所述第二部分图像样本的类别标签为所述初始的CNN模型中输出层输出的概率最高的类别标签,所述第二部分图像样本为所述总图像样本中除去所述第一部分图像样本的剩余图像样本;
将所述初始特征权值与所述第二部分图像样本的类别标签建立关联。
可选地,处理器510还用于:
对所述第一部分图像样本进行亮度归一化处理;
用亮度归一化处理后的第一部分图像样本对所述初始特征权值进行微调。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例所提供的确定业务参数的方法、建立图像分类模型的方法以及装置进行了详细介绍,本文中应用了个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。