表情的制作方法、装置、终端及计算机可读存储介质与流程

文档序号：14940940发布日期：2018-07-13 20:45阅读：143来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明属于图像处理技术领域，尤其涉及表情的制作方法、装置、终端及计算机可读存储介质。

背景技术：

随着智能手机、平板电脑等智能终端的广泛普及，安装在所述智能终端上的即时聊天工具也得到了广泛的使用。

在利用所述即时聊天工具进行交流时，常常会使用表情进行信息表达，增加了聊天的趣味性。但是，现有技术中表情的制作过程较为繁琐，制作效率较低。

技术实现要素：

本发明实施例提供一种表情的制作方法、装置、终端及计算机可读存储介质，可以提高表情的制作效率。

本发明实施例第一方面提供一种表情的制作方法，包括：

获取图像文件，对所述图像文件的图片进行表情识别，得到与表情标签匹配的图片；其中，所述表情标签用于标识所述图片的情感类型；

获取与所述表情标签匹配的文本信息；

加载所述文本信息至所述图片，并保存所述图片。

本发明实施例第二方面提供一种表情的制作装置，包括：

图片获取单元，用于获取图像文件，对所述图像文件的图片进行表情识别，得到与表情标签匹配的图片；其中，所述表情标签用于标识所述图片的情感类型；

文本获取单元，用于获取与所述表情标签匹配的文本信息；

加载单元，用于加载所述文本信息至所述图片，并保存所述图片。

本发明实施例第三方面提供一种终端，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

本发明实施例第四方面提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述方法的步骤。

本发明实施例中，通过对所述图像文件中的批量图片进行表情识别，从中得到与预设的表情标签匹配的图片，再通过获取与所述表情标签匹配的文本信息，并将所述文本信息加载到所述图片上，完成针对所述图片的表情制作。在所述表情的制作过程中，经过对批量的图片进行表情识别，因而能够得到较多的符合表情制作要求的图片，并且通过表情标签与文本信息进行匹配的方式，获取与所述图片匹配的文本信息，实现了所述表情的批量制作，具有制作方法简单的特点，提高了表情制作的效率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明实施例提供的表情的制作方法的实现流程图；

图2是本发明实施例提供的表情的制作方法s101的实现流程图；

图3是本发明实施例提供的表情的制作方法s203的实现流程图；

图4是本发明实施例提供的面部运动单元限定的区域示意图；

图5是本发明实施例提供的表情的制作装置的结构示意图；

图6是本发明实施例提供的终端的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。同时，在本发明的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

图1示出了本发明第一实施例提供的一种表情的制作方法的实现流程图，所述方法由终端执行，所述终端包括个人电脑(pc)、平板电脑、智能手机、个人数字助理(pda)、学习机等终端。所述方法可以包括步骤s101至步骤s103。

在s101中，获取图像文件，对所述图像文件的图片进行表情识别，得到与表情标签匹配的图片；其中，所述表情标签用于标识所述图片的情感类型。

其中，所述图像文件可以为视频文件，也可以为图片文件。例如，用户使用所述终端拍摄的视频或照片；或者从网络中下载的视频或照片，例如，电视剧、电影和短视频等等视频数据。

在获取了所述图像文件后，即可对所述图像文件的图片进行表情识别，得到与表情标签匹配的图片。也就是说，利用所述图像文件中的每一张图片作为制作表情的素材，通过对所述图片进行表情识别，判定所述图片是否能够表达出所述表情标签标定的某种情感类型；若其能表达出所述表情标签标定的某种情感类型，则表示所述图片可以用来制作表情，即，所述图片为与所述表情标签匹配的图片。

其中，所述表情标签可以包括用于标定几十种或上百种情感类型的表情标签，并且，每一种情感类型对应一个表情标签。例如，表示“高兴”的表情标签、表示“愤怒”的表情标签、表示“囧”的表情标签以及表示“恐惧”的表情标签等等。

在s102中，获取与所述表情标签匹配的文本信息。

在对所述图像文件的图片进行表情识别，得到与表情标签匹配的图片后，即得到了可以用于制作表情的图片及与所述图片匹配的表情标签；因此，可以通过获取与所述表情标签匹配的文本信息，得到可以加载在所述图片上的文本信息。

例如，与所述图片匹配的表情标签为“愤怒”，则与所述表情标签匹配的文本信息可以为“吼吼”。

可选地，所述获取与所述表情标签匹配的文本信息，包括：在本地数据库中查询与所述表情标签相匹配的文本信息；或根据所述表情标签生成查询指令，并将所述查询指令发送给服务器；接收所述服务器反馈的所述文本信息；所述查询指令用于指示所述服务器查询并反馈与所述表情标签相匹配的文本信息。

其中，所述本地数据库中存储有所述表情标签与所述文本信息的对应关系列表，通过查找所述对应关系列表，即可获取所述与所述表情标签匹配的文本信息。

在s103中，加载所述文本信息至所述图片，并保存所述图片。

在获取到与所述表情标签匹配的文本信息后，即可将所述文本信息加载至与所述表情标签匹配的图片上，从而完成表情的批量制作。

可选地，所述加载所述文本信息至所述图片，包括：确定所述文本信息在所述目标视频帧中的加载位置；将所述文本信息加载至所述加载位置。

例如，根据所述目标视频帧中的人脸位置，确定所述加载位置为所述人脸位置以外的位置；或者，确定所述加载位置为所述目标视频帧的空白位置；或者，确定所述加载位置为用户自定义的位置；或者，根据所述文本信息的预设位置确定所述加载位置。

可选地，所述获取与所述表情标签匹配的文本信息之后，还包括：若未获取到与所述表情标签匹配的文本信息，则直接保存所述与表情标签匹配的图片；或获取输入的文本信息，加载所述文本信息至所述图片，并保存所述图片。

上述从本地数据库中获取所述文本信息，以及从服务器中获取所述文本信息的方法属于自动获取方法，无需用户参与，即可通过将所述文本信息加载至所述图片上，完成所述表情的制作。

但是，当从所述本地数据库或所述服务器中未获取到所述文本信息时，例如，所述本地数据库或所述服务器中未存储有与所述表情标签匹配的文本信息时，则可以通过直接保存所述与表情标签匹配的图片完成所述表情的制作，即所述表情为不加载所述文本信息的表情。也就是说，所述表情标签并不需要与所述文本信息一一对应，即，所述表情标签可以没有与之对应的文本信息，此时，所述表情标签只用于筛选出适合制作成无需加载文本信息的图片。

可选地，所述获取与所述表情标签匹配的文本信息之后，还包括：若未获取到与所述表情标签匹配的文本信息，则获取输入的文本信息，并加载所述文本信息至所述图片，并保存所述图片。

也就是说，用户也可以参与所述表情的制作。例如，未获取到与所述表情标签匹配的文本信息时，通过输入所述文本信息，完成所述表情的制作，并得到个性化表情。

可选地，用户可以通过自定义所述表情标签的方式，将随意拍摄的视频或照片制作成表情。

例如，用户拍摄的“老鼠过街”的视频，并自定义表情标签为“流浪”，再将所述“老鼠过街”的视频匹配成所述表情标签“流浪”，即可将其直接保存为表情，或在输入文本信息后保存为表情。

如图2所示，在步骤s101中，当所述图像文件为视频文件时，所述对所述图像文件的图片进行表情识别，得到与表情标签匹配的图片，包括：步骤s201至步骤s203。

在s201中，获取视频文件。

在s202中，对所述视频文件的各视频帧进行人脸识别，得到包括目标人脸的目标视频帧。

所述目标人脸可以为用户指定的一个或多个特定人物的人脸。例如，用户想要以包含人物a和人物b的视频帧作为制作表情的素材时，则可以通过对所述视频文件的各视频帧进行人脸识别，得到包含人物a和人物b的目标视频帧，从而制作包含人物a和人物b的表情。需要说明的是，当用户不对所述特定人物进行指定时，所述目标人脸可以默认设置为所有人物的人脸，其中，所述人物的人脸可以包括人类的人脸和卡通人物的人脸。

在s203中，对所述目标视频帧的目标人脸进行表情识别，得到与表情标签匹配的所述目标视频帧。

在获取了所述目标视频帧后，需要对所述目标视频帧的目标人脸进行表情识别，得到与表情标签匹配的所述目标视频帧。例如，制作包含人物a和人物b的表情时，需要对包含人物a和人物b的目标视频帧中的人物a和人物b的人脸进行表情识别，判定所述目标视频帧是否能够表达出所述表情标签标定的某种情感类型；若其能表达出所述表情标签标定的某种情感类型，则表示所述目标视频帧可以用来制作表情，即，所述目标视频帧为与所述表情标签匹配的视频帧，从而实现表情的批量制作，简化了表情制作的流程。

在本发明的一些实施方式中，如图3所示，实施所述步骤s203的方法可以包括步骤s301至步骤s304。

在s301中，获取所述目标视频帧中目标人脸的各个面部运动单元。

所述各个面部运动单元是指将人脸分成的各个区域，例如，口部区域、鼻子区域、眼睛区域和眉毛区域。本发明实施例中，通过对所述各个小块进行分析，获取各个小块的特征，并将所述特征输入至表情分类器，由所述表情分类器根据各个面部运动单元加权后的特征确定所述目标视频帧是否与表情标签匹配。

其中，由于人脸的运动部位一般集中在眉毛到下巴的位置，因此，可以只对眉毛到下巴位置的运动单元进行捕捉与分析，实现减少表情识别的计算量的同时，能够较全面地得到人脸各个面部运动单元的特征。

可选地，所述获取所述目标视频帧中目标人脸的面部运动单元，包括：确定所述目标视频帧中目标人脸的眉毛特征点和下巴特征点；通过对称的所述眉毛特征点确定第一直线，通过所述下巴特征点确定平行于所述第一直线的第二直线；获取所述目标人脸在所述第一直线和第二直线所限定的区域内的面部运动单元。

例如，如图4所示，确定所述目标视频帧中目标人脸的眉毛特征点a、b和下巴特征点c；通过对称的所述眉毛特征点a、b确定第一直线l1，通过所述下巴特征点确定平行于所述第一直线l1的第二直线l2；获取所述目标人脸在所述第一直线l1和第二直线l2所限定的区域内的面部运动单元。

在s302中，提取所述各个面部运动单元的特征。

所述特征可以包括利用ad-aboost方法提取的gabor特征，haar特征提取方法的haar特征，lbp特征提取方法的lbp特征。

在s303中，将所述特征输入训练好的表情分类器，由所述表情分类器根据各个面部运动单元加权后的特征确定所述目标视频帧是否与表情标签匹配。

在提取了所述各个面部运动单元的特征之后，需要将所述特征输入到训练好的表情分类器中，由所述表情分类器根据各个面部运动单元加权后的特征确定所述目标视频帧是否与表情标签匹配。其中，一个面部运动单元包括可以多个特征。所述表情分类器按各个面部运动单元在所有面部运动单元中所占的比重，对所述特征进行加权，并根据所述加权后的特征确定所述目标视频帧是否与表情标签匹配。

例如，当目标视频帧中人脸的眉毛位置低垂、上眼睑上抬、眼睑紧凑、唇角下压、口唇压紧等特征的加权值达到预设阈值时，表示该目标视频帧与用于标识“愤怒”的表情标签匹配；否则，该目标视频帧与用于标识“愤怒”的表情标签不匹配。

在s304中，若所述目标视频帧与表情标签匹配，则输出所述目标视频帧及与所述目标视频帧匹配的表情标签。

例如，输出与“愤怒”的表情标签匹配的所述目标视频帧，及与所述目标视频帧匹配的表情标签“愤怒”。

可选地，当所述图像文件为视频文件时，所述加载所述文本信息至所述图片，并保存所述图片，包括：加载所述文本信息至所述目标视频帧，并保存所述目标视频帧。

需要说明的是，所述加载所述文本信息至所述目标视频帧的具体实现方式可以参考上述对加载所述文本信息至所述图片的实现方式，此处不再赘述。

在本发明的一些实施方式中，所述加载所述文本信息至所述目标视频帧，并保存所述目标视频帧之后，还包括：将加载有相同文本信息的连续设定数量的目标视频帧进行组合，生成表情动图并保存。

例如，当所述连续100帧的目标视频帧加载的文本信息都为“哈哈哈哈”，则可以将所述连续100帧的目标视频帧组合成表情动图，即，具有动画效果的表情，使得所述表情更具有趣味性。

在本发明的一些实施方式中，还可以将多个所述表情动图组合成新的表情动图，例如，将表情标签为“高兴”的表情动图与表情标签为“愤怒”的表情动图进行组合，或者其他自定义的表情动图的组合。

可选地，所述获取图像文件，对所述图像文件的图片进行表情识别，得到与表情标签匹配的图片，还包括：获取图片文件；对所述图片文件的图片进行表情识别，得到与表情标签匹配的所述图片。

例如，获取用户终端相册中的照片，并对所述照片进行表情识别，得到与表情标签匹配的所述照片。

图5示出了本发明实施例提供的一种表情的制作装置500的结构示意图，包括图片获取单元501、文本获取单元502和加载单元503。

图片获取单元501，用于获取图像文件，对所述图像文件的图片进行表情识别，得到与表情标签匹配的图片；所述表情标签用于标识所述图片的情感类型；

文本获取单元502，用于获取与所述表情标签匹配的文本信息；

加载单元503，用于加载所述文本信息至所述图片，并保存所述图片。

可选地，图片获取单元501包括图片获取第一子单元，用于获取视频文件；对所述视频文件的各视频帧进行人脸识别，得到包括目标人脸的目标视频帧；对所述目标视频帧的目标人脸进行表情识别，得到与表情标签匹配的所述目标视频帧。

可选地，所述图片获取第一子单元，具体用于获取所述目标视频帧中目标人脸的各个面部运动单元；提取所述各个面部运动单元的特征；将所述特征输入训练好的表情分类器，由所述表情分类器根据各个面部运动单元加权后的特征确定所述目标视频帧是否与表情标签匹配；若所述目标视频帧与表情标签匹配，则输出所述目标视频帧及与所述目标视频帧匹配的表情标签。

可选地，所述图片获取第一子单元，还具体用于确定所述目标视频帧中目标人脸的眉毛特征点和下巴特征点；通过对称的所述眉毛特征点确定第一直线，通过所述下巴特征点确定平行于所述第一直线的第二直线；获取所述目标人脸在所述第一直线和第二直线所限定的区域内的面部运动单元。

可选地，所述加载单元503，还用于加载所述文本信息至所述目标视频帧，并保存所述目标视频帧。

可选地，所述装置还包括组合单元，用于将加载有相同文本信息的连续设定数量的目标视频帧进行组合，生成表情动图并保存。

可选地，所述文本获取单元502，具体用于在本地数据库中查询与所述表情标签相匹配的文本信息；或根据所述表情标签生成查询指令，并将所述查询指令发送给服务器；所述查询指令用于指示所述服务器查询并反馈与所述表情标签相匹配的文本信息；接收所述服务器反馈的所述文本信息。

可选地，所述文本获取单元502，还具体用于若未获取到与所述表情标签匹配的文本信息，则直接保存所述与表情标签匹配的图片；或获取输入的文本信息，加载所述文本信息至所述图片，并保存所述图片。

可选地，所述加载单元503，还用于确定所述文本信息在所述目标视频帧中的加载位置；将所述文本信息加载至所述加载位置。

可选地，所述图片获取单元501，还用于获取图片文件；对所述图片文件的图片进行表情识别，得到与表情标签匹配的所述图片。

需要说明的是，为描述的方便和简洁，上述描述的表情的制作装置500的具体工作过程，可以参考上述图1至图4中所述方法的对应过程，在此不再过多赘述。

如图6所示，上述用户终端还可以包括：一个或多个输入设备63(图6中仅示出一个)和一个或多个输出设备64(图6中仅示出一个)。处理器61、存储器62、输入设备63和输出设备64通过总线65连接。

应当理解，在本发明实施例中，所称处理器61可以是中央处理单元(centralprocessingunit，cpu)，该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现场可编程门阵列(field-programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

输入设备63可以包括键盘、触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等，输出设备64可以包括显示器、扬声器等。

存储器62可以包括只读存储器和随机存取存储器，并向处理器61提供指令和数据。存储器61的一部分或全部还可以包括非易失性随机存取存储器。例如，存储器62还可以存储设备类型的信息。

所述存储器62存储有计算机程序，所述计算机程序可在所述处理器61上运行，例如，所述计算机程序为表情的制作程序。所述处理器61执行所述计算机程序时实现上述各个表情的制作方法实施例中的步骤，例如图1所示的步骤101至103，以及图2所示的步骤201至203。或者，所述处理器61执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能，例如图5所示单元501至503的功能。

所述计算机程序可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器62中，并由所述处理器61执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述表情的制作的用户终端中的执行过程。例如，所述计算机程序可以被分割成图片获取单元、文本获取单元和加载单元，各单元具体功能如下：图片获取单元，用于获取图像文件，对所述图像文件的图片进行表情识别，得到与表情标签匹配的图片；所述表情标签用于标识所述图片的情感类型；文本获取单元，用于获取与所述表情标签匹配的文本信息；加载单元，用于加载所述文本信息至所述图片，并保存所述图片。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中，应该理解到，所揭露的装置/用户终端和方法，可以通过其它的方式实现。例如，以上所描述的装置/用户终端实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-onlymemory，rom)、随机存取存储器(randomaccessmemory，ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张烨
技术所有人：广东欧珀移动通信有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。