一种多媒体文件生成方法及终端设备与流程

文档序号：16688027发布日期：2019-01-22 18:31阅读：182来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本发明实施例涉及通信技术领域，尤其涉及一种多媒体文件生成方法及终端设备。

背景技术：

目前，手机的拍照功能或者小视频的录制功能已经成为用户使用频率很高的一项功能，各大厂家都在相机上做出更多的优化和突破。

随着人们拍摄的视频越来越多，所拍摄视频的长度也越来越长，当用户查看某个精彩片段时，需要从整个视频文件中查找，并需要人为地拖动进度条以查找用户感兴趣的内容，从而导致整个操作过程比较繁琐。

技术实现要素：

本发明实施例提供一种多媒体文件生成方法及终端设备，以解决现有技术中需要人为地从整个多媒体文件中查找用户感兴趣的内容而导致操作繁琐的问题。

为解决上述技术问题，本发明是这样实现的：

第一方面，提供了一种多媒体文件生成方法，应用于包括第一摄像头和第二摄像头的终端设备，所述方法包括：

在第一摄像头拍摄过程中，控制第二摄像头识别目标人脸的面部表情；

在识别到目标面部表情的情况下，标记目标时间段内所拍摄的多媒体子文件；

基于所述多媒体子文件，生成目标多媒体文件；

其中，所述目标时间段为识别到所述目标面部表情的时间段，所述多媒体子文件为图像或者视频。

第二方面，提供了一种终端设备，包括：

控制单元，用于在第一摄像头拍摄过程中，控制第二摄像头识别目标人脸的面部表情；

文件标记单元，用于在识别到目标面部表情的情况下，标记目标时间段内所拍摄的多媒体子文件；

目标多媒体文件生成单元，用于基于所述多媒体子文件，生成目标多媒体文件；

其中，所述目标时间段为识别到所述目标面部表情的时间段，所述多媒体子文件为图像或者视频。

第三方面，还提供一种计算机可读介质，所述计算机可读介质上存储计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的方法的步骤。

在本发明实施例中，多媒体文件生成方法在第一摄像头拍摄过程中，控制第二摄像头识别目标人脸的面部表情，并在识别到目标面部表情的情况下，标记目标时间段内所拍摄的多媒体子文件，以根据多媒体子文件，生成目标多媒体文件。如此，当用户录制多媒体文件的同时，可根据用户的面部表情判断当前所录制的内容对用户的吸引力，并将对用户具有吸引力的内容标记为多媒体子文件，并根据多媒体子文件形成目标多媒体文件，而无需用户在拍摄完多媒体文件后需要对第一摄像头所拍摄或录制的整个多媒体文件进行重新剪辑，即可观看用户所感兴趣的内容，因此，解决了现有技术中需要人为地从整个多媒体文件中查找用户感兴趣的内容而导致操作繁琐的问题。

附图说明

图1是根据本发明一个实施例的多媒体文件生成方法的示意性流程图；

图2是根据本发明一个实施例的多媒体文件生成方法的示意性原理图；

图3是根据本发明另一个实施例的多媒体文件生成方法的示意性流程图；

图4是根据本发明一个实施例的多媒体文件生成方法中多媒体子文件的时间轴的示意性原理图；

图5是根据本发明一个实施例的多媒体文件生成方法的示意性原理图；

图6是根据本发明一个实施例的终端设备的结构示意图。

图7是根据本发明另一个实施例的终端设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

以下结合附图，详细说明本发明各实施例提供的技术方案。

图1是根据本发明一个实施例的多媒体文件生成方法的示意性流程图，以解决现有技术中需要人为地从整个多媒体文件中查找用户感兴趣的内容而导致操作繁琐的问题。本发明实施例的方法可包括：

步骤102.在第一摄像头拍摄过程中，控制第二摄像头识别目标人脸的面部表情。

结合图2进行说明，当用户使用第一摄像头(一般后置摄像头)拍摄视频等多媒体文件(在显示区域202显示后置摄像头拍摄的内容)时，可开启第二摄像头(如前置摄像头)获取用户(即拍摄者)的人脸图像信息，以便识别用户当前的表情，以根据用户当前的表情判断用户对其当前所拍摄的画面的兴趣。

步骤104.在识别到目标面部表情的情况下，标记目标时间段内所拍摄的多媒体子文件。

步骤106.基于所述多媒体子文件，生成目标多媒体文件。

其中，目标时间段为识别到目标面部表情的时间段，多媒体子文件为图像或者视频。

当识别到用户的目标面部表情后，可根据用户的目标面部表情标记目标时间段内所拍摄的多媒体子文件，以根据所标记的多媒体子文件生成目标多媒体文件。如此，当用户录制多媒体文件的同时，可根据用户的面部表情判断当前所录制的内容对用户的吸引力，并将对用户具有吸引力的内容标记为多媒体子文件，并根据多媒体子文件形成目标多媒体文件，而无需用户在拍摄完多媒体文件后需要对第一摄像头所拍摄或录制的整个多媒体文件进行重新剪辑，即可观看用户所感兴趣的内容，因此，解决了现有技术中需要人为地从整个多媒体文件中查找用户感兴趣的内容而导致操作繁琐的问题。

其中，用户的面部表情可包括：高兴、快乐、兴奋、期待、惊讶、无聊等。可以将面部表情分为两大类，可将其中的高兴、快乐、兴奋、期待、惊讶等用于表示用户积极向上心态的表情归类为第一面部表情，而将无聊、烦躁等用于表示用户消极心态的表情归类为第二面部表情。

根据面部表情类型的分类，可将两大面部表情类型分别用于触发开启或触发关闭标记多媒体子文件的两个集合，即，可将包含用户表现关注和愉悦(如高兴、期待、惊讶等)的表情归类为用于触发开启标记多媒体子文件的触发开关，而将包含有用户表现无聊和厌恶的情绪归类用于触发关闭标记多媒体子文件的触发开关。如此，可根据用户的表情类型，标记目标时间段内所拍摄的多媒体子文件。

当然，也可以将上述两类面部表情细化为多种面部表情，比如，将“高兴、快乐等”面部表情归类为第一面部表情，将“期待、惊讶等”面部表情归类为第二面部表情，将“烦躁、生气等”面部表情归类为第三面部表情，等等，这里不一一举例说明，从而根据不同的面部表情分别用于触发开启或触发关闭标记多媒体子文件的集合。

即，在上述实施例中，可结合图3、图4和图5进行说明，控制第二摄像头识别目标人脸的面部表情之后的操作还可包括：

步骤302.将第i次识别到目标面部表情从第一面部表情转换为第二面部表情的时刻确定为第i时间段的开始时刻t1。

步骤304.将第i次识别到目标面部表情由第二面部表情转换为第三面部表情的时刻确定为第i时间段的结束时刻t2。其中，i为正整数。

其中，图4或图5中的横轴表示录像视频的时间轴400。即，当用户开启或者关闭剪辑文件记录功能时，在拍摄或录像视频的时间轴400上标记对应的时间操作。

应理解，在用户拍摄视频等多媒体文件的过程中，由于所拍摄的画面内容的不确定性，用户可能会对画面部分内容的兴趣比较强，也可能会对画面部分内容的兴趣比较弱，此时，可根据用户的表情类型，触发开启标记多媒体子文件的功能，或触发关闭标记多媒体子文件的功能。

由此，当检测到用户的面部表情属于第二面部表情(比如图4中第二次检测到用户表情由第一面部表情转换为第二面部表情)时，开启标记多媒体子文件的功能，此时，可将检测到的用户的表情确定为第二面部表情的时刻记为第二时间段的开始时刻；而检测到用户的面部表情属于第三面部表情或者第一面部表情(如图4中第二次检测到用户表情由第二面部表情转换为第三面部表情或者第一面部表情)，可将用户表情转换为第三面部表情(或者第一面部表情)的时刻记为第二时间段的结束时刻。

由此，可将第二时间段的开始时刻与结束时刻之间所标记的多媒体子文件确定为第二次所记录的目标多媒体文件。如此，可将所有第i次确定目标面部表情从第一面部表情转换为第二面部表情的开始时刻与目标面部表情由第二面部表情转换为第三面部表情的结束时刻的第i时间段内标记的多媒体子文件确定为最终的目标多媒体文件。

由此，用户可阅览所得到的目标多媒体文件，由于该目标多媒体文件是根据用户的面部表情判断出用户所感兴趣的内容，因此，用户可快速阅览对其吸引力比较大的内容，而无需用户在拍摄完多媒体文件后需要对第一摄像头所拍摄的整个多媒体文件进行重新剪辑，因此，可解决现有技术中需要人为地从整个多媒体文件中查找用户感兴趣的内容而导致操作繁琐的问题。

当然，即使所得到的目标多媒体文件可能出现与用户所需要的内容不太相符的地方，但目标多媒体文件的绝大多数内容会比较符合用户的当时心理，因此，在后续剪辑过程中，也可大幅度减轻用户的剪辑工作，从而可提高用户的工作效率。

在上述进一步的实施例中，目标面部表情的个数为n，n为大于1的正整数，那么，在识别到目标面部表情的情况下，标记目标时间段内所拍摄的多媒体子文件的操作可包括：

在识别到第k个目标面部表情的情况下，标记第k个目标面部表情对应的目标时间段内所拍摄的多媒体子文件；其中，k为正整数，k≤n。

应理解，可将用户的面部表情细分为多个不同的表情，如上述实施例所述的高兴、快乐、兴奋、期待、惊讶、烦躁、生气等。如此，当识别到目标面部表情属于其中的一个表情类别时，则标记相应的目标表情对应的目标时间段内所拍摄的多媒体子文件，从而根据所标记的多媒体子文件生成目标多媒体文件。

在上述任一项实施例中，多媒体子文件可以为图像，则基于多媒体子文件，生成目标多媒体文件，包括以下至少一项：

将所有多媒体子文件进行图像合成处理，生成合成图像；

基于所有多媒体子文件，生成第一视频或幻灯片。

或者，多媒体子文件为视频，则基于多媒体子文件，生成目标多媒体文件，包括将所有多媒体子文件进行视频合成处理，生成第二视频。

也就是说，在所标记的多媒体子文件为图像的情况下，可根据所标记的图像生成目标多媒体图像或者是多媒体视频甚至是幻灯片等，而在多媒体子文件为视频的情况下，可根据所标记的视频内容生成目标视频等，从而可以便于用户观看其所感兴趣的内容，因此，解决了现有技术中需要人为地从整个多媒体文件中查找用户感兴趣的内容而导致操作繁琐的问题。

在上述任一项实施例中，基于多媒体子文件，生成目标多媒体文件，包括：

按照拍摄的时间顺序，基于所有多媒体子文件，生成目标多媒体文件；

或者，按照目标面部表情的类型，基于所有多媒体子文件，生成目标多媒体文件。

应理解，当标记完目标时间段的多媒体子文件后，可按照所拍摄的时间顺序(当然也可以为所标记的时间顺序，也可手动调节不同时间段内标记的多媒体子文件的顺序)，或可按照目标面部表情的类型，自动生成目标多媒体文件。当然，用户可自动挑选其中的一个或多个时间段内标记的多媒体子文件形成目标多媒体文件，也可手动调节不同时间段内标记的多媒体子文件的顺序，以形成目标多媒体文件。即，根据多媒体子文件，生成目标多媒体文件的方法不限于本实施例所述的方式，可根据用户的习惯或爱好或其他需求进行设置。

在上述一些实施例中，若多媒体子文件为视频，则控制第二摄像头识别目标人脸的面部表情之后的操作还可包括：

在识别到目标面部表情的情况下，标记目标时间段的起始时间和结束时间。在第一摄像头拍摄完成后，生成第一视频，并显示第一视频的播放进度条，播放进度条上包括每个目标时间段对应的第一标识和第二标识。其中，第一标识用于指示目标时间段的起始时间，第二标识用于指示目标时间段的结束时间。

应理解，在第一摄像头拍摄完成后，会生成第一视频，则可显示第一视频的播放进度条，通过播放进度条上的每个目标时间段对应的第一标识和第二标识，向用户展示根据识别到的目标面部表情所标记目标时间段的起始时间和结束时间。如此，可便于用户根据第一标识和第二标识确定是否选择目标时间段对应的多媒体子文件，以形成目标多媒体文件，从而可便于用户对第一视频文件的剪辑。

在上述进一步的实施例中，基于多媒体子文件，生成目标多媒体文件的操作可包括：

接收用户对m个多媒体子文件或所对应的播放进度条上的目标时间段的选择输入。

响应于选择输入，将基于m个多媒体子文件，生成目标多媒体文件。

其中，m为正整数，且m小于等于多媒体子文件的总个数。

由此可知，通过播放进度条上的每个目标时间段对应的第一标识和第二标识，用户可对其中的m个多媒体子文件或所对应的播放进度条上的目标时间段进行选择(比如可根据第一标识和第二标识确定是否选择目标时间段对应的多媒体子文件)，以形成目标多媒体文件，从而可便于用户对第一视频文件的剪辑。

在上述另一些实施例中，结合图2进行说明，控制第二摄像头识别目标人脸的面部表情之后，还包括：

在识别到目标面部表情从第一面部表情转换为第二面部表情的情况下，显示第一提示信息206，第一提示信息206用于提示用户开始标记所拍摄的多媒体子文件；

在识别到目标面部表情由第二面部表情转换为第三面部表情的情况下，显示第二提示信息204，第二提示信息204用于提示用户停止标记所拍摄的多媒体子文件。

也就是说，当剪辑文件记录功能处于关闭状态时，前置摄像头根据所检测的面部表情为触发开启剪辑文件记录功能的表情，此时，可通过弹出一个提示界面(即第一提示信息)用于提示用户开启标记所拍摄的多媒体子文件的功能。而当剪辑文件记录功能处于开启状态时，前置摄像头根据所检测的面部表情为触发关闭剪辑文件记录功能的表情，则可通过弹出一个提示界面(即第二提示信息)用于提示用户关闭标记所拍摄的多媒体子文件的功能。

其中，提示方法可包括通过弹出提示操作按钮，供用户点击该提示操作按钮的方式完成对应的动作。也可以为通过采集用户头部的动作，来完成该交互过程，比如，当弹出提示操作按钮后，识别到用户发出点头动作时表示完成对应的动作。

需要说明的是，上述实施例所提供方法的各步骤的一些执行主体可以是同一设备，或者，该方法也可由不同设备作为执行主体。比如，步骤102、104的执行主体可以为同一个执行主体，而步骤106的执行主体则可以为另一执行主体(如控制单元)；又比如，步骤102、104、106的执行主体均可以为同一个执行主体等等。

在一个具体的实施例中，多媒体文件生成方法的实现过程可以为：

首先，在后置摄像头录制视频文件时，启动前置摄像头，寻找用户的人脸图像，在没有收到结束拍摄的信号时，识别前置摄像头拍摄的人脸图像，以识别得到当前拍摄者的面部表情。如高兴、快乐、兴奋、期待、惊讶、无聊等。其中，将用户的面部表情分成触发开启剪辑记录功能和触发剪辑记录功能关闭两个集合，触发开启集合包含用户表现关注和愉悦的表情(第二面部表情)，例如高兴、期待、惊讶等；触发关闭集合包含用户表现无聊和厌恶的表情(第一面部表情)，例如无聊、厌恶等。

其次，当剪辑记录功能处于关闭状态(即标记多媒体子文件的触发开关处于关闭状态)时，若第i次前置摄像头根据所拍摄的人脸图像识别到用户的面部表情为触发开启剪辑记录功能的表情(即目标面部表情从第一面部表情转换为第二面部表情)，则提示用户开启记录剪辑记录功能，并标记用户操作的时间点(第i时间段的开始时刻)。而当剪辑记录功能处于关闭状态时，若前置摄像头根据所拍摄的人脸图像识别到用户的面部表情为触发关闭剪辑记录功能的表情(即目标面部表情从第二面部表情转换为第一面部表情)，则提示用户关闭记录剪辑记录功能，并标记用户操作的时间点(第i时间段的结束时刻)。

再者，在接收到结束拍摄的信号时，根据标记的目标时间段内所拍摄的多媒体子文件生成视频集锦文件(即目标多媒体文件)。

可参见图5，视频文件下的控制条(也为时间轴400)代表用户拍摄视频的总长度，阴影部分表示前置摄像头识别到拍摄者的表情为快乐、兴奋、期待、惊讶等所对应的多媒体剪辑文件，其余部分表示没有识别到用户没有明显好恶(或者厌恶等消极情绪)的表情所对应的多媒体文件。当然，根据所识别到的用户的目标面部表情类型对与目标面部表情相对应的时间段内的多媒体子文件进行标记，可根据用户的喜好或习惯进行设置，不限于上述实施例所述的方式。

那么，生成的视频集锦则只包含上述阴影部分所对应的多媒体子文件。在保存后置摄像头(即第一摄像头)所拍摄的多媒体文件的同时，可根据所标记的多媒体子文件自动生成一份集锦视频文件，其中，各片段之间可通过虚化、过渡等手段完成视频的拼接。当然，用户也可以点击视频上的导出精彩视频按钮来完成手动的导入。

如此，本发明实施例的方法可一键生成原视频(即后置摄像头录制的多媒体文件)的精彩集锦(目标多媒体文件)，该方法可减少用户自动剪辑的工作，同时，由于精彩集锦的时长较短，因此，可方便用户的阅览。

在另一个具体的实施例中，多媒体文件生成方法的实现过程可以为：

首先，在后置摄像头录制视频文件时，启动前置摄像头，寻找用户的人脸图像，在没有收到结束拍摄的信号时，识别前置摄像头拍摄的人脸图像，以识别得到当前拍摄者的面部表情。

其次，在识别到目标面部表情的情况下，标记用户面部表情变化的时间点。即，当第i次用户的面部表情从无表情转换到有表情时，自动标记用户面部表情变化的时刻为第一时刻，而当用户的面部表情从有表情转换到无表情时，自动记录用户面部表情变化的时刻为第二时刻。其中，可在拍摄预览界面显示一个红色的图标格式来提示用户该拍摄的部分内容会被自动记录到视频集锦中。

再者，在接收到结束拍摄的信号时，根据后置摄像头所采集的多媒体文件和根据用户面部表情变化所标记的多媒体子文件，生成视频集锦文件(即目标多媒体文件)。

如此，通过自动识别人脸图像的表情特征，标记拍摄者面部表情变化的时间点，并且通过显示屏上的面部表情提示器可提醒用户当前所拍摄的部分内容会被自动记录到视频集锦中，从而完成自动化的配置手机视频精彩集锦，可避免用户手动记录带来的滞后以及繁琐等问题。

也就是说，上述任一项实施例的方法在拍摄视频等多媒体文件时，可通过开启前置摄像头识别拍摄者的面部表情，并根据拍摄者面部表情的变化来判断当前拍摄内容对于拍摄者的吸引力，然后弹出视频剪裁快捷开关，用于提醒用户标记精彩片段的起始时刻和结束时刻。如此，在结束拍摄时，除了保存用户拍摄的原始完整长度的视频外，还可将用户标记的片段拼接成精彩画面集锦用于供用于阅览或使用。

本发明实施例还提供一种终端设备，如图6所示，包括：控制单元602，用于在第一摄像头拍摄过程中，控制第二摄像头识别目标人脸的面部表情；文件标记单元604，用于在识别到目标面部表情的情况下，标记目标时间段内所拍摄的多媒体子文件；目标多媒体文件生成单元606，用于基于多媒体子文件，生成目标多媒体文件；其中，目标时间段为识别到目标面部表情的时间段，多媒体子文件为图像或者视频。

应理解，当通过控制单元602控制第二摄像头识别到用户的目标面部表情后，可通过文件标记单元604根据用户的目标面部表情标记目标时间段内所拍摄的多媒体子文件，以通过目标多媒体文件生成单元606根据所标记的多媒体子文件生成目标多媒体文件。如此，当用户录制多媒体文件的同时，可根据用户的面部表情判断当前所录制的内容对用户的吸引力，并将对用户具有吸引力的内容标记为多媒体子文件，并根据多媒体子文件形成目标多媒体文件，而无需用户在拍摄完多媒体文件后需要对第一摄像头所拍摄或录制的整个多媒体文件进行重新剪辑，即可观看用户所感兴趣的内容，因此，解决了现有技术中需要人为地从整个多媒体文件中查找用户感兴趣的内容而导致操作繁琐的问题。

在上述实施例中，文件标记单元604用于：将第i次识别到目标面部表情从第一面部表情转换为第二面部表情的时刻确定为第i时间段的开始时刻，并将第i次识别到目标面部表情由第二面部表情转换为第三面部表情的时刻确定为第i时间段的结束时刻。其中，i为正整数。

应理解，当检测到用户的面部表情属于第二面部表情(比如图4中第二次检测到用户表情由第一面部表情转换为第二面部表情)时，开启标记多媒体子文件的功能，此时，可将检测到的用户的表情确定为第二面部表情的时刻记为第二时间段的开始时刻；而检测到用户的面部表情属于第三面部表情或者第一面部表情(如图4中第二次检测到用户表情由第二面部表情转换为第三面部表情或者第一面部表情)，可将用户表情转换为第三面部表情或者第一面部表情的时刻记为第二时间段的结束时刻。由此，可将第二时间段的开始时刻与结束时刻之间所标记的多媒体子文件确定为第二次所记录的目标多媒体文件。如此，可将所有第i次确定目标面部表情从第一面部表情转换为第二面部表情的开始时刻与目标面部表情由第二面部表情转换为第三面部表情(或者第一面部表情)的结束时刻的第i时间段内标记的多媒体子文件确定为最终的目标多媒体文件。

在上述进一步的实施例中，若目标面部表情的个数为n，n为大于1的正整数，则文件标记单元604还用于：在识别到第k个目标面部表情的情况下，标记第k个目标面部表情对应的目标时间段内所拍摄的多媒体子文件；其中，k为正整数，k≤n。

在上述任一项实施例中，若多媒体子文件可以为图像，则目标多媒体文件生成单元606还用于：将所有多媒体子文件进行图像合成处理，生成合成图像；和/或基于所有多媒体子文件，生成第一视频或幻灯片。或者，若多媒体子文件为视频，则目标多媒体文件生成单元606还用于将所有多媒体子文件进行视频合成处理，生成第二视频。也就是说，在所标记的多媒体子文件为图像的情况下，可根据所标记的图像生成目标多媒体图像或者是多媒体视频甚至是幻灯片等，而在多媒体子文件为视频的情况下，可根据所标记的视频内容生成目标视频等，从而可以便于用户观看其所感兴趣的内容，因此，解决了现有技术中需要人为地从整个多媒体文件中查找用户感兴趣的内容而导致操作繁琐的问题。

在上述任一项实施例中，目标多媒体文件生成单元606还用于按照拍摄的时间顺序，基于所有多媒体子文件，生成目标多媒体文件；或者，按照目标面部表情的类型，基于所有多媒体子文件，生成目标多媒体文件。

在上述一些实施例中，若多媒体子文件为视频，则文件标记单元604还用于在识别到目标面部表情的情况下，标记目标时间段的起始时间和结束时间。终端设备则还可包括显示单元608，用于在第一摄像头拍摄完成生成第一视频后，显示第一视频的播放进度条，播放进度条上包括每个目标时间段对应的第一标识和第二标识。其中，第一标识用于指示目标时间段的起始时间，第二标识用于指示目标时间段的结束时间。

在上述进一步的实施例中，终端设备还包括接收单元610，用于接收用户对m个多媒体子文件或所对应的播放进度条上的目标时间段的选择输入。则目标多媒体文件生成单元606用于响应于选择输入，将基于m个多媒体子文件，生成目标多媒体文件。其中，m为正整数，且m小于等于多媒体子文件的总个数。由此可知，通过播放进度条上的每个目标时间段对应的第一标识和第二标识，用户可根据第一标识和第二标识确定对其中的m个多媒体子文件或所对应的播放进度条上的目标时间段进行选择，以形成目标多媒体文件，从而可便于用户对第一视频文件的剪辑。

在上述另一些实施例中，终端设备还包括提示单元612，其用于：在识别到目标面部表情从第一面部表情转换为第二面部表情的情况下，显示第一提示信息，第一提示信息用于提示用户开始标记所拍摄的多媒体子文件；在识别到目标面部表情由第二面部表情转换为第三面部表情的情况下，显示第二提示信息，第二提示信息用于提示用户停止标记所拍摄的多媒体子文件。

图7为实现本发明实施例的终端设备的硬件结构示意图。如图7所示，该终端设备700包括但不限于：射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、处理器710、以及电源711等部件。本领域技术人员可以理解，图7中示出的终端设备结构并不构成对终端设备的限定，终端设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。在本发明实施例中，终端设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中，处理器710，用于执行以下步骤：

在第一摄像头拍摄过程中，控制第二摄像头识别目标人脸的面部表情；

在识别到目标面部表情的情况下，标记目标时间段内所拍摄的多媒体子文件；

基于所述多媒体子文件，生成目标多媒体文件；

其中，所述目标时间段为识别到所述目标面部表情的时间段，所述多媒体子文件为图像或者视频。

由于在第一摄像头拍摄过程中，控制第二摄像头识别目标人脸的面部表情，并在识别到目标面部表情的情况下，标记目标时间段内所拍摄的多媒体子文件，以根据多媒体子文件，生成目标多媒体文件。如此，当用户录制多媒体文件的同时，可根据用户的面部表情判断当前所录制的内容对用户的吸引力，并将对用户具有吸引力的内容标记为多媒体子文件，并根据多媒体子文件形成目标多媒体文件，而无需用户在拍摄完多媒体文件后需要对第一摄像头所拍摄或录制的整个多媒体文件进行重新剪辑，即可观看用户所感兴趣的内容，因此，解决了现有技术中需要人为地从整个多媒体文件中查找用户感兴趣的内容而导致操作繁琐的问题。

应理解的是，本发明实施例中，射频单元701可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器710处理；另外，将上行的数据发送给基站。通常，射频单元701包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元701还可以通过无线通信系统与网络和其他设备通信。

终端设备通过网络模块702为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元703可以将射频单元701或网络模块702接收的或者在存储器707中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元703还可以提供与终端设备700执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元703包括扬声器、蜂鸣器以及受话器等。

输入单元704用于接收音频或视频信号。输入单元704可以包括图形处理器(graphicsprocessingunit，gpu)7041和麦克风7042，图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元706上。经图形处理器7041处理后的图像帧可以存储在存储器709(或其它存储介质)中或者经由射频单元701或网络模块702进行发送。麦克风7042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元701发送到移动通信基站的格式输出。

终端设备700还包括至少一种传感器705，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板7061的亮度，接近传感器可在终端设备700移动到耳边时，关闭显示面板7061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别终端设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器705还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，其中红外线传感器能够通过发射和接收红外光测量物体与终端设备之间的距离，在此不再赘述。

显示单元706用于显示由用户输入的信息或提供给用户的信息。显示单元706可包括显示面板7061，可以采用液晶显示器(liquidcrystaldisplay，lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板7061。

用户输入单元707可用于接收输入的数字或字符信息，以及产生与终端设备的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板7071上或在触控面板7071附近的操作)。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器710，接收处理器710发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板7071。除了触控面板7071，用户输入单元707还可以包括其他输入设备7072。具体地，其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板7071可覆盖在显示面板7061上，当触控面板7071检测到在其上或附近的触摸操作后，传送给处理器710以确定触摸事件的类型，随后处理器710根据触摸事件的类型在显示面板7061上提供相应的视觉输出。虽然在图7中，触控面板7071与显示面板7061是作为两个独立的部件来实现终端设备的输入和输出功能，但是在某些实施例中，可以将触控面板7071与显示面板7061集成而实现终端设备的输入和输出功能，具体此处不做限定。

接口单元708为外部装置与终端设备700连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(i/o)端口、视频i/o端口、耳机端口等等。接口单元708可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到终端设备700内的一个或多个元件或者可以用于在终端设备700和外部装置之间传输数据。

存储器709可用于存储软件程序以及各种数据。存储器709可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器709可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器710是终端设备的控制中心，利用各种接口和线路连接整个终端设备的各个部分，通过运行或执行存储在存储器709内的软件程序和/或模块，以及调用存储在存储器709内的数据，执行终端设备的各种功能和处理数据，从而对终端设备进行整体监控。处理器710可包括一个或多个处理单元；优选的，处理器710可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器710中。

终端设备700还可以包括给各个部件供电的电源711(比如电池)，优选的，电源711可以通过电源管理系统与处理器710逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外，终端设备700包括一些未示出的功能模块，在此不再赘述。

优选地，本发明实施例还提供一种终端设备，其可包括处理器710，存储器709，存储在存储器709上并可在所述处理器710上运行的计算机程序，该计算机程序被处理器710执行时实现上述图1所示的方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述图1所示的方法的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(read-onlymemory，rom)、随机存取存储器(randomaccessmemory，ram)、磁碟或者光盘等。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本发明的实施例可提供为方法、系统或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本发明的实施例而已，并不用于限制本发明。对于本领域技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周晨
技术所有人：维沃移动通信有限公司
我是此专利的发明人

上一篇：一种将专业知识做成软件帮助家庭选择最佳食物的方法与流程
上一篇：一种减振器辅助换装装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。