人物图像识别方法、服务器及计算机可读存储介质与流程

文档序号:16250179发布日期:2018-12-11 23:57阅读:187来源:国知局
人物图像识别方法、服务器及计算机可读存储介质与流程

本发明涉及图像识别技术领域,尤其涉及一种人物图像识别方法及服务器。

背景技术

人体识别的应用越来越广泛,然而,现有的人体识别技术大多限制于单人的识别,或者简单的人物形象识别,而在包含多人的图像识别中,由于图像可能包含可能发生在任何位置或比例的未知数量的人。并且由于接触,遮挡和多个人之间的肢体关节相互作用引起复杂的空间干扰,使部件的联系变得困难。因此,将一张图像中的多个人的姿势,特别是在公共场所对人群中包含的各个人的详细的肢体姿态的识别,是更加难以实现。因此,现有技术中,对包含多个人物的图像进行人物识别的效果往往差强人意。



技术实现要素:

有鉴于此,本发明提出一种服务器,能够将待识别的多人物图像中的各类肢体组件图像识别出来,然后再根据预设的肢体组件矢量规则对识别出来的肢体组件进行配对,从而能够有效地识别出多人物图像中的各个人物的图像。

首先,为实现上述目的,本发明提供一种人物图像识别方法,该方法应用于服务器,所述方法包括步骤:

获取待识别的多人物图像;根据预设的人物的各个肢体组件学习模型从待识别的多人物图像识别出各个肢体组件图像,所述肢体组件图像包括头部图像、颈部图像、躯干图像、手部图像以及脚部图像;

根据预设的肢体组件矢量规则将识别出来的肢体组件中不同部位的肢体组件图像进行配对,从而识别出待识别的多人物图像中的每个人物的图像。

可选地,所述人物的各个肢体组件学习模型是根据完全卷积模型分别对每个所述肢体组件图像进行深度学习,生成对应的肢体组件学习模型。

可选地,所述肢体组件矢量规则为人体所包含的肢体组件的连接顺序:头部--颈部、颈部--躯干、躯干上半部分--手部,以及躯干下半部分--脚部。

可选地,所述根据预设的肢体组件矢量规则将识别出来的肢体组件中不同部位的肢体组件图像进行配对的步骤还包括步骤:在符合所述肢体组件矢量规则的肢体组件组合中选择最邻近的两个肢体组件进行配对。

可选地,所述方法还包括步骤:根据预设的手掌图像训练模型对识别出来的所述肢体图像中的手部图像进行识别,从而获取手部图像中的手掌及手指图像的信息。

可选地,在所述根据预设的手掌图像训练模型对识别出来的所述肢体图像中的手部图像进行识别的步骤之前,还包括步骤:利用预设的关键点检测器对预先采样的手部图像中预设数量比例的第一类手部图像的手掌部分进行异常值标记,其中,所述关键点检测器为具有深度学习能力的传感器,以获取图像的数据;根据所述异常值对所述采样的手部图像中的除去所述第一类手部图像的剩余手部图像进行数据训练,生成手掌图像训练模型。

可选地,所述方法还包括步骤:根据预设的人物的肢体组件连接处的学习模型从待识别的多人物图像识别出各个肢体组件连接处的图像,所述肢体组件连接处图像包括头-颈连接处图像、颈-躯连接处图像、躯-手连接处图像以及躯-脚连接处图像;根据所述肢体组件图像、所述肢体组件矢量规则,以及所述肢体组件连接处图像从而获得各个人物的整体图像。

可选地,所述根据识别出来的所述肢体组件图像、所述肢体组件矢量规则,以及所述肢体组件连接处图像从而获得各个人物的整体图像具体包括步骤:符合所述肢体组件矢量规则的肢体组件组合中存在多组最邻近的两个肢体组件时,则根据所述多组最邻近的两个肢体组件中间位置是否存在对应的所述肢体组件连接处图像从而判定是否进行配对。

进一步地,为实现上述目的,本发明还提供一种服务器,所述服务器包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的人物图像识别程序,所述人物图像识别程序被所述处理器执行时实现如上述的人物图像识别方法的步骤。

进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有人物图像识别程序,所述人物图像识别程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的人物图像识别方法的步骤。

相较于现有技术,本发明所提出的人物图像识别方法、服务器及计算机可读存储介质,能够将待识别的多人物图像中的各类肢体组件图像识别出来,然后再根据预设的肢体组件矢量规则对识别出来的肢体组件进行配对,从而能够有效地识别出多人物图像中的各个人物的图像。

附图说明

图1是服务器一可选的硬件架构的示意图;

图2是本发明人物图像识别程序第一实施例的程序模块示意图;

图3是本发明人物图像识别程序第二实施例的程序模块示意图;

图4是本发明人物图像识别方法一实施例的流程示意图;

图5是本发明人物图像识别方法另一实施例的部分流程步骤示意图。

附图标记:

本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

参阅图1所示,是服务器1一可选的硬件架构的示意图。

所述服务器1可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备,该服务器1可以是独立的服务器,也可以是多个服务器所组成的服务器集群。

本实施例中,所述服务器1可包括,但不仅限于,可通过系统总线相互通信连接存储器11、处理器12、网络接口13。

所述服务器1通过网络接口13连接网络(图1未标出),或者连接到其他电子装置,以获取或传递包括待识别图像在内的所有资讯。所述网络可以是企业内部网(intranet)、互联网(internet)、全球移动通讯系统(globalsystemofmobilecommunication,gsm)、宽带码分多址(widebandcodedivisionmultipleaccess,wcdma)、4g网络、5g网络、蓝牙(bluetooth)、wi-fi、通话网络等无线或有线网络。

需要指出的是,图1仅示出了具有组件11-13的服务器1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述服务器1的内部存储单元,例如该服务器1的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述服务器1的外部存储设备,例如该服务器1配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,所述存储器11还可以既包括所述服务器1的内部存储单元也包括其外部存储设备。本实施例中,所述存储器11通常用于存储安装于所述服务器1的操作系统和各类应用软件,例如所述人物图像识别程序200的程序代码等。此外,所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器12在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述服务器1的总体操作,例如执行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行所述的人物图像识别程序200等。

所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13用于在所述服务器1、网络、外置存储器或者其他电子装置之间建立通信连接。

本实施例中,当所述服务器1内安装并运行有人物图像识别程序200时,当所述人物图像识别程序200运行时,所述服务器1能够将待识别的人物图像划分为肢体组件图像分别进行识别,然后再根据预设的肢体组件矢量规则对识别出来的肢体组件进行配对,最后再根据训练得到的手掌异常值模型识别出手部的手掌及手指数据,从而达到识别出图像中的各个人物的肢体以及手掌、手指的姿态。从而实现高效、精确地人物图像识别。

至此,己经详细介绍了本发明各个实施例的应用环境和相关设备的硬件结构和功能。下面,将基于上述应用环境和相关设备,提出本发明的各个实施例。

首先,本发明提出一种人物图像识别程序200。

参阅图2所示,是本发明人物图像识别程序200第一实施例的程序模块图。

本实施例中,所述人物图像识别程序200包括一系列的存储于存储器11上的计算机程序指令,当该计算机程序指令被处理器12执行时,可以实现本发明各实施例的人物图像识别操作。在一些实施例中,基于该计算机程序指令各部分所实现的特定的操作,人物图像识别程序200可以被划分为一个或多个模块。例如,在图2中,所述人物图像识别程序200可以被分割成获取模块201、第一学习模块202、第一识别模块203和配对模块204。其中:

所述获取模块201,用于获取待识别的多人物图像。

具体地,所述服务器1可以通过网络获取其他设备或者终端传送过来的多人物图像数据,也可以从自身存储单元获取预先存储的多人物图像数据。

所述第一学习模块202,用于根据完全卷积模型分别对每个所述肢体组件图像进行深度学习,生成对应的肢体组件学习模型。

具体地,在本实施例中,使用了卷积姿态机(cpm),而不是通常的姿态机(pm),姿态机的预测和图像特征计算可以被深卷积架构代替,从而可以直接从数据中学习图像特征进行表示,卷积架构还具有完全可微分的优点,从而实现所有阶段的训练。例如,使用由五个卷积层组成的网络结构,然后是两个1×1卷积层,这产生了完全卷积结构,实践证明,这种卷积结构能够为了更高精度的学习模型。因此,所述第一学习模块202根据完全卷积模型分别对5种肢体组件图像以及4种肢体连接处的图像进行深度学习,生成对应的肢体组件学习模型和肢体肢体连接处学习模型。

所述第一识别模块203,用于根据所述肢体组件学习模型从待识别的多人物图像识别出各个肢体组件图像。所述肢体组件图像包括头部图像、颈部图像、躯干图像、手部图像以及脚部图像。

具体的,当所述第一学习模块202根据完全卷积模型分别对5种肢体组件图像进行深度学习以生成对应的肢体组件学习模型,所述第一识别模块203根据所述5种肢体组件图像的学习模型对待识别的多人物图像进行识别,从而识别出待识别的多人物图像中的所有的肢体组件图像。在本实施例中,所述第一学习模块202生成了头部图像的学习模型、颈部图像的学习模型、躯干图像的学习模型、手部图像的学习模型以及脚部图像的学习模型。然后所述第一识别模块203根据这5种肢体组件的学习模型对待识别的多人物图像进行识别,从而识别出所有的头部图像、颈部图像、躯干图像、手部图像以及脚部图像,例如所述待识别的多人物图像包括有5个人物,则会分别识别出5个头部图像、5个颈部图像、5个躯干图像、5个手部图像以及5个脚部图像。

所述配对模块204,用于根据预设的肢体组件矢量规则将识别出来的肢体组件中不同部位的肢体组件图像进行配对,从而识别出待识别的多人物图像中的每个人物的图像。

具体的,所述肢体组件矢量规则为人体所包含的肢体组件的连接顺序:头部--颈部、颈部--躯干、躯干上半部分--手部,以及躯干下半部分--脚部。由于某一肢体组件连接的其他肢体组件较多,因此这里的矢量规则,每个肢体组件并不看做是一个点,而是带有一定长度和方向的线段的表示。例如,其中手或者脚,还可以进一步划分,比如脚可以划分为大腿,小腿和脚板,对应的矢量则为大腿到小腿,小腿到脚板。而所述进行配对,则是在符合所述肢体组件矢量规则的肢体组件组合中选择最邻近的两个肢体组件进行配对。

因此,所述配对模块204会根据所述肢体组件矢量规则对识别出来的肢体组件进行配对。例如,当待识别的多人物图像中多个人物之间相互手牵手时,在所述第一识别模块203识别出各个肢体组件图像之后,则所述配对模块204根据头部--颈部、颈部--躯干、躯干上半部分--手部,以及躯干下半部分--脚部的矢量规则对各个肢体组件图像进行配对。该步骤就是将人物包括的肢体组件,以具有方向的矢量来表示,即一个人物包含从上到下的矢量为:头部到颈部,颈部到躯干上部分,躯干上部分到手,躯干下部分到脚,其中躯干上部分到手,躯干下部分到脚还分为各两个等。利用这种肢体组件的矢量规则,能够将肢体组件进行配对,然后就可以很好地将包含多个人物的图像中的各个人物进行识别。当然,可能由于同一类的肢体组件不止一个,因此,在符合所述肢体组件矢量规则的肢体组件组合中选择最邻近的两个肢体组件进行配对,即最相邻的两个肢体组件图像最有可能属于同一个人物图像。例如,多人物图像中识别出2个头部图像,2个颈部图像;则根据肢体组件的矢量规则,头部图像跟颈部图像是具有头部到颈部的矢量关系,因此可以配对。而且,肢体组件矢量规则,应该是直接连接关系,因此,其中任一个头部图像会与之距离最近,接触最紧密的颈部图像进行配对。

在另一个实施例中,由于当符合所述肢体组件矢量规则的肢体组件组合中存在多组最邻近的两个肢体组件,此时所述第一学习模块202还会根据完全卷积模型分别对各种肢体组件连接处的图像进行深度学习以生成对应的肢体组件连接处的学习模型。所述肢体组件连接处包括:即头部与颈部连接处,颈部与躯干连接处,颈部与手连接处,以及躯干与脚连接处。所述第一识别模块203则还会根据所述4种肢体组件连接出的图像的学习模型对待识别的多人物图像进行识别,从而识别出待识别的多人物图像中的所有的肢体组件连接处的图像。也就是说,在本实施例中,所述第一学习模块202对5种肢体组件图像以及4种肢体连接处的图像进行深度学习,生成对应的肢体组件学习模型和肢体肢体连接处学习模型。然后所述第一识别模块203对所述待识别的多人物图像进行识别,识别出5种肢体组件图像以及4种肢体连接处的图像。

这种情况下,所述配对模块204根据所述肢体组件矢量规则对所述肢体组件图像以及所述肢体组件连接处图像进行配对,从而获得各个人物的整体图像。具体地,所述配对模块204当符合所述肢体组件矢量规则的肢体组件组合中存在多组最邻近的两个肢体组件时,则根据所述多组最邻近的两个肢体组件中间位置是否存在对应的所述肢体组件连接处图像从而判定是否进行配对。例如,两个头部图像和两个颈部图像需要进行配对,但是其中一个头部图像到两个颈部图像的距离都一样,因此需要根据头部-颈部的连接处图像进一步进行配对判定。由于该头部图像到两个颈部图像的距离相同,因此当该头部图像与其中一个颈部图像中间存在有一个头部-颈部的连接处图像,且该头部-颈部的连接处图像正好处于该头部图像与该颈部图像的中间距离处,则判定该头部图像与该头部-颈部的连接处图像及该颈部图像配对。因此被识别为同一人体的组件。

从上文可知,所述服务器1能够根据人体的肢体组件图像及组件连接处图像分别建立学习模型,然后根据对应的学习模型对待识别的多人物图像进行识别,识别出所有的肢体组件的图像及肢体组件连接处的图像,最后再根据预设的肢体组件矢量规则对识别出来的肢体组件进行配对,从而能够有效地将人物图像中的各个人物识别出来。

参阅图3所示,是本发明人物图像识别程序200第二实施例的程序模块图。本实施例中,所述的人物图像识别程序200除了包括第一实施例中的所述获取模块201、第一学习模块202、第一识别模块203、配对模块204之外,还包括第二学习模块206以及第二识别模块207。

所述获取模块201、第一学习模块202、第一识别模块203及配对模块204与所述人物图像识别程序200第一实施例中的对应的程序模块功能相同。这里不再赘述。所述人物图像识别程序200第一实施例能够将包含多个人物的人物图像中的各个人物识别出来,然而有时候会对识别的结果要求更多,比如将手掌及手指的姿态也识别出来。因此在所述人物图像识别程序200第二实施例中,增加有对手掌及手指姿态识别作用的标记模块205、第二学习模块206以及第二识别模块207。

所述标记模块205,用于利用预设的关键点检测器对预先采样的手部图像中预设数量比例的第一类手部图像的手掌部分进行异常值标记,其中,所述关键点检测器为具有深度学习能力的传感器,以获取图像的数据。

具体的,使用初始关键点检测器在手的多个视图将手指及手掌标记为异常值(或者噪声标签),其中,所述关键点检测器,可以认为是具有深度学习能力的传感器,可以获取图像的数据。也就是说,所述关键点检测器可以检测出手指及手掌的数据,然后标记为异常值(或者噪声标签),然后所述异常值(或者噪声标签)代表的就是手指及手掌部分的数据特征。

所述第二学习模块206,用于根据所述异常值对所述采样的手部图像中的除去所述第一类手部图像的剩余手部图像进行数据训练,生成手掌图像的训练模型。

具体的,由于所述异常值训练模型在训练的时候需要进行一定的数量,从而能够识别图像中人物的手部的握拳、展开手指等姿态,具体表现在手掌与拇指、食指、中指、无名指及小指的位置关系,或者也可以是矢量定义关系。使用初始关键点检测器在手的预先采样的手部图像中预设数量比例的第一类手部图像的手掌部分将手指及手掌标记为异常值(或者噪声标签)后,然后根据该异常值(或者噪声标签)对所述采样的手部图像中的除去所述第一类手部图像的剩余手部图像进行数据训练,训练的过程主要是将代表手指及手掌的所述异常值(或者噪声标签)的部分数据进行深度学习,从而建立一个包括手指及手掌信息的手掌图像训练模型,然后则可以根据该训练模型对手部图像的手掌部分将手指及手掌图像进行识别。

所述第二识别模块207,用于根据所述手掌图像训练模型对识别出来的所述肢体图像中的手部图像进行识别,从而获取手部图像中的手掌及手指图像的信息。

具体的,根据所述手掌图像训练模型对识别出的人物图像中的每个人物的手部图像中的手掌部分进行识别,识别步骤则是将所述手掌图像训练模型中的手指图像级手掌图像的训练模型对各个手部图像进行识别,从而识别出手部图像中包括的手指及手掌数据。因此能够将图像中人物的手部的手掌,及手掌与拇指、食指、中指、无名指及小指的数据识别出来。这样的数据表现为图像形式,就是手掌及手指的动作姿态。

也就是说,所述服务器1在识别出多人物图像中的所有的肢体组件的图像,然后根据预设的肢体组件矢量规则对识别出来的肢体组件进行配对,从而能够有效地将人物图像中的各个人物识别出来之后,还能够根据预设的手掌图像训练模型对识别出来的所述肢体图像中的手部图像进行识别,从而获取手部图像中的手掌及手指的动作姿态信息。

此外,本发明还提出一种人物图像识别方法。

参阅图4所示,是本发明人物图像识别方法一实施例的流程示意图。在本实施例中,根据不同的需求,图4所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。

步骤s500,获取待识别的多人物图像。

具体地,所述服务器1可以通过网络获取其他设备或者终端传送过来的多人物图像数据,也可以从自身存储单元获取预先存储的多人物图像数据。步骤s502,根据完全卷积模型分别对每个所述肢体组件图像进行深度学习,生成对应的肢体组件学习模型。

具体地,在本实施例中,使用了卷积姿态机(cpm),而不是通常的姿态机(pm),姿态机的预测和图像特征计算可以被深卷积架构代替,从而可以直接从数据中学习图像特征进行表示,卷积架构还具有完全可微分的优点,从而实现所有阶段的训练。例如,使用由五个卷积层组成的网络结构,然后是两个1×1卷积层,这产生了完全卷积结构,实践证明,这种卷积结构能够为了更高精度的学习模型。因此,本步骤根据完全卷积模型分别对5种肢体组件图像以及4种肢体连接处的图像进行深度学习,生成对应的肢体组件学习模型和肢体肢体连接处学习模型。

步骤s504,根据所述肢体组件学习模型从待识别的多人物图像识别出各个肢体组件图像。所述肢体组件图像包括头部图像、颈部图像、躯干图像、手部图像以及脚部图像。

在本实施例中,当生成了头部图像的学习模型、颈部图像的学习模型、躯干图像的学习模型、手部图像的学习模型以及脚部图像的学习模型之后,可根据这5种肢体组件的学习模型对待识别的多人物图像进行识别,从而识别出所有的头部图像、颈部图像、躯干图像、手部图像以及脚部图像,例如所述待识别的多人物图像包括有5个人物,则会分别识别出5个头部图像、5个颈部图像、5个躯干图像、5个手部图像以及5个脚部图像。

步骤s506,用于根据预设的肢体组件矢量规则将识别出来的肢体组件中不同部位的肢体组件图像进行配对,从而识别出待识别的多人物图像中的每个人物的图像。

具体的,所述肢体组件矢量规则为人体所包含的肢体组件的连接顺序:头部--颈部、颈部--躯干、躯干上半部分--手部,以及躯干下半部分--脚部。由于某一肢体组件连接的其他肢体组件较多,因此这里的矢量规则,每个肢体组件并不看做是一个点,而是带有一定长度和方向的线段的表示。例如,其中手或者脚,还可以进一步划分,比如脚可以划分为大腿,小腿和脚板,对应的矢量则为大腿到小腿,小腿到脚板。而所述进行配对,则是在符合所述肢体组件矢量规则的肢体组件组合中选择最邻近的两个肢体组件进行配对。

例如,当待识别的多人物图像中多个人物之间相互手牵手时,在识别出各个肢体组件图像之后,则根据头部--颈部、颈部--躯干、躯干上半部分--手部,以及躯干下半部分--脚部的矢量规则对各个肢体组件图像进行配对。该步骤就是将人物包括的肢体组件,以具有方向的矢量来表示,即一个人物包含从上到下的矢量为:头部到颈部,颈部到躯干上部分,躯干上部分到手,躯干下部分到脚,其中躯干上部分到手,躯干下部分到脚还分为各两个等。利用这种肢体组件的矢量规则,能够将肢体组件进行配对,然后就可以很好地将包含多个人物的图像中的各个人物进行识别。当然,可能由于同一类的肢体组件不止一个,因此,在符合所述肢体组件矢量规则的肢体组件组合中选择最邻近的两个肢体组件进行配对,即最相邻的两个肢体组件图像最有可能属于同一个人物图像。例如,多人物图像中识别出2个头部图像,2个颈部图像;则根据肢体组件的矢量规则,头部图像跟颈部图像是具有头部到颈部的矢量关系,因此可以配对。而且,肢体组件矢量规则,应该是直接连接关系,因此,其中任一个头部图像会与之距离最近,接触最紧密的颈部图像进行配对。

步骤s508,利用预设的关键点检测器对预先采样的手部图像中预设数量比例的第一类手部图像的手掌部分进行异常值标记,其中,所述关键点检测器为具有深度学习能力的传感器,以获取图像的数据。

具体的,使用初始关键点检测器在手的多个视图将手指及手掌标记为异常值(或者噪声标签),其中,所述关键点检测器,可以认为是具有深度学习能力的传感器,可以获取图像的数据。也就是说,所述关键点检测器可以检测出手指及手掌的数据,然后标记为异常值(或者噪声标签),然后所述异常值(或者噪声标签)代表的就是手指及手掌部分的数据特征。

步骤s510,根据所述异常值对所述采样的手部图像中的除去所述第一类手部图像的剩余手部图像进行数据训练,生成手掌图像的训练模型。

具体的,由于所述异常值训练模型在训练的时候需要进行一定的数量,从而能够识别图像中人物的手部的握拳、展开手指等姿态,具体表现在手掌与拇指、食指、中指、无名指及小指的位置关系,或者也可以是矢量定义关系。使用初始关键点检测器在手的预先采样的手部图像中预设数量比例的第一类手部图像的手掌部分将手指及手掌标记为异常值(或者噪声标签)后,然后根据该异常值(或者噪声标签)对所述采样的手部图像中的除去所述第一类手部图像的剩余手部图像进行数据训练,训练的过程主要是将代表手指及手掌的所述异常值(或者噪声标签)的部分数据进行深度学习,从而建立一个包括手指及手掌信息的手掌图像训练模型,然后则可以根据该训练模型对手部图像的手掌部分将手指及手掌图像进行识别。

步骤s512,根据所述手掌图像训练模型对识别出来的所述肢体图像中的手部图像进行识别,从而获取手部图像中的手掌及手指图像的信息。

具体的,根据所述手掌图像训练模型对识别出的人物图像中的每个人物的手部图像中的手掌部分进行识别,识别步骤则是将所述手掌图像训练模型中的手指图像级手掌图像的训练模型对各个手部图像进行识别,从而识别出手部图像中包括的手指及手掌数据。因此能够将图像中人物的手部的手掌,及手掌与拇指、食指、中指、无名指及小指的数据识别出来。这样的数据表现为图像形式,就是手掌及手指的动作姿态。

通过本实施例所提出的人物图像识别方法的以上步骤,能够在识别出多人物图像中的所有的肢体组件的图像,然后根据预设的肢体组件矢量规则对识别出来的肢体组件进行配对,从而能够有效地将人物图像中的各个人物识别出来之后,还能够根据预设的手掌图像训练模型对识别出来的所述肢体图像中的手部图像进行识别,从而获取手部图像中的手掌及手指的动作姿态信息。

由于在图4所示的实施例中,当符合所述肢体组件矢量规则的肢体组件组合中存在多组最邻近的两个肢体组件,因此需要通过肢体组件连接处的图像进行辅助识别。

图5所示的步骤为本发明人物图像识别方法另一实施例的部分流程步骤示意图。本发明人物图像识别方法另一实施例的步骤流程包括:步骤s500-步骤s502-步骤s504-步骤s514-步骤s516-步骤s518-步骤s508-步骤s510-步骤s512。其中步骤s500、步骤s502、步骤s504、步骤s508、步骤s510及步骤s512与图4所示的步骤相同,以下将不再赘述,以下说明步骤s514-步骤s516-步骤s518。

步骤s514,根据完全卷积模型分别对各种肢体组件连接处的图像进行深度学习以生成对应的肢体组件连接处的学习模型。

由于当符合所述肢体组件矢量规则的肢体组件组合中存在多组最邻近的两个肢体组件,则此时还会根据完全卷积模型分别对各种肢体组件连接处的图像进行深度学习以生成对应的肢体组件连接处的学习模型。所述肢体组件连接处包括:即头部与颈部连接处,颈部与躯干连接处,颈部与手连接处,以及躯干与脚连接处。

步骤s516,根据种肢体组件连接出的图像的学习模型对待识别的多人物图像进行识别,从而识别出待识别的多人物图像中的所有的肢体组件连接处的图像。

步骤s518,根据所述肢体组件矢量规则对所述肢体组件图像以及所述肢体组件连接处图像进行配对,从而获得各个人物的整体图像。

具体地,当符合所述肢体组件矢量规则的肢体组件组合中存在多组最邻近的两个肢体组件时,则根据所述多组最邻近的两个肢体组件中间位置是否存在对应的所述肢体组件连接处图像从而判定是否进行配对。例如,两个头部图像和两个颈部图像需要进行配对,但是其中一个头部图像到两个颈部图像的距离都一样,因此需要根据头部-颈部的连接处图像进一步进行配对判定。由于该头部图像到两个颈部图像的距离相同,因此当该头部图像与其中一个颈部图像中间存在有一个头部-颈部的连接处图像,且该头部-颈部的连接处图像正好处于该头部图像与该颈部图像的中间距离处,则判定该头部图像与该头部-颈部的连接处图像及该颈部图像配对。因此被识别为同一人体的组件。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1