一种拍摄方法及移动终端与流程

文档序号：12496996阅读：273来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本发明涉及通信技术领域，尤其是涉及一种拍摄方法及移动终端。

背景技术：

随着电子技术及通信技术的发展，无线移动通信产业发展迅速，移动终端已经成为人们日常工作、生活的必备品。

目前，由于移动终端便于携带，使用移动终端拍摄非常普遍，例如使用移动终端合照留影、周年聚会拍摄留影等。然而，拍摄得到的图像记录的是静止的画面，图像中的信息比较单一，无法重现拍摄时的场景，以使得拍摄多年之后，无法通过图像体验拍摄时的场景。

技术实现要素：

本发明实施例提供一种拍摄方法及移动终端，以解决目前由于图像记录的是静止画面，信息比较单一，无法通过图像体验拍摄时的场景的问题。

第一方面，本发明实施例提供了一种拍摄方法，应用于具有摄像头的移动终端，所述方法包括：

在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据；

在语音数据录制过程中，记录每个人的说话顺序和每个人的生物特征信息；

建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系；

在图像拍摄完成后，生成目标图像；

将所述目标图像与所述每个人说话的语音数据进行关联存储。

第二方面，提供了一种移动终端，包括摄像头，所述移动终端还包括：

语音数据录制模块，用于在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据；

记录模块，用于在语音数据录制过程中，记录每个人的说话顺序和每个人的生物特征信息；

第一关联关系建立模块，用于建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系；

目标图像生成模块，用于在图像拍摄完成后，生成目标图像；

存储模块，用于将所述目标图像生成模块生成的目标图像与所述语音数据录制模块录制的每个人说话的语音数据进行关联存储。

这样，本发明实施例中，移动终端在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据，同时记录每个人的说话顺序和每个人的生物特征信息，建立每个人的生物特征信息、说话顺序和语音数据之间的关联关系，在生成目标图像后，将目标图像与每个人说话的语音数据进行关联存储。应用本发明实施例，将目标图像与每个人说话的语音数据进行关联存储，可以在浏览目标图像时播放与之关联的语音数据，解决了目前图像记录的是静止画面，无法透过图像体验拍摄时的场景的问题，使得用户能够通过图像播放拍摄时的每个人说话的语音数据，重现了拍摄时的场景。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一的一种拍摄方法的流程图；

图2是本发明实施例二的一种拍摄方法的流程图；

图3是本发明实施例三的一种拍摄方法的流程图；

图4是本发明实施例四的一种拍摄方法的流程图；

图5是本发明实施例五的一种拍摄方法的流程图；

图6是本发明实施例五中根据音频数据的数据来源或声纹信息，实时更新与目标图像关联存储的各语音数据的流程图；

图7是本发明实施例六的一种移动终端的结构框图之一；

图7a是本发明实施例六的一种移动终端的结构框图之二；

图7b是本发明实施例六的一种移动终端的结构框图之三；

图7c是本发明实施例六的一种移动终端的结构框图之四；

图7d是本发明实施例六的一种移动终端的结构框图之五；

图8是本发明实施例七的一种移动终端的结构框图；

图9是本发明实施例八的一种移动终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

图1是本发明实施例一的一种拍摄方法的流程图。

参照图1所示，本发明实施例的一种拍摄方法，应用于具有摄像头的移动终端，该方法包括：

步骤101，在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据。

本发明实施例的移动终端可以设置有麦克风，通过麦克风在拍摄过程中录制拍摄时预览画面中每个人说话的语音数据，例如在拍摄全景图像或者非全景图像对焦取景时显示拍摄预览画面，可以录制拍摄预览画面中每个人说话的语音数据。语音数据可以为mp3、wma、wav等格式，本发明实施例对语音数据的格式不做限制。

步骤102，在语音数据录制过程中，记录每个人的说话顺序和每个人的生物特征信息。

在语音数据录制的过程中，移动终端的摄像头同时在取景，在拍摄预览画面显示图像，可以通过面部识别技术，对拍摄预览画面中的每个人进行面部识别得到每个人的生物特征信息，生物特征信息可以是每个人的面部特征信息，也可以是每个人的性别，年龄等信息，同时记录每个人的说话顺序，说话顺序可以使用数字进行编号记录，当然也可以使用其它方式进行记录说话顺序。

步骤103，建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系。

为了使得每个人的语音数据和生物特征信息一一对应，可以建立每个人的生物特征信息、说话顺序、和语音数据的关联关系，具体的，可以将每个人的说话顺序按照数字进行编号，然后依据说话顺序的编号，给每个人的生物特征信息和语音数据添加相同的编号，编号相同的生物特征信息和语音数据属于同一个人，当然，本发明实施例还可以通过其它方式进行关联，本发明实施例对此不做限制。本步骤，通过建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系，可以在浏览目标图像时，播放与说话顺序或者生物特征信息相关联的语音数据。

步骤104，在图像拍摄完成后，生成目标图像。

当每个人说话的语音数据和生物特征信息记录完成后，移动终端的摄像头进行对焦、曝光等图像处理后，生成目标图像，生成的目标图像可以根据拍摄模式，可以是全景图像，也可以是非全景图像，目标图像格式可以为jpg.jpeg.gif.png.bmp等。

步骤105，将所述目标图像与所述每个人说话的语音数据进行关联存储。

生成目标图像后，可以将目标图像与每个人说话的语音数据进行关联存储，具体的，可以将目标图像以及每个人的生物特征信息存储在一个存储器中，将语音数据、语音数据与生物特征信息、说话顺序的关联关系存储在另一个存储器中，当然也可以将目标图像与每个人的说话的语音数据存储在一个存储器中，同时存储步骤103建立的关联关系。

本发明实施例中，移动终端在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据，同时记录每个人的说话顺序和每个人的生物特征信息，建立每个人的生物特征信息、说话顺序和语音数据之间的关联关系，在生成目标图像后，将目标图像与每个人说话的语音数据进行关联存储。应用本发明实施例，通过建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系，可以在浏览目标图像时，播放与说话顺序或者生物特征信息关联的语音数据，解决了图像记录的是静止画面，无法透过图像体验拍摄时的场景的问题，使得用户能够通过图像播放拍摄时的每个人说话的语音数据，重现了拍摄时的场景。

实施例二

图2是本发明实施例二的一种拍摄方法的流程图。

参照图2所示，本发明实施例的一种拍摄方法的方法，应用于具有摄像头的移动终端，该方法包括：

步骤201，在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据。

本发明实施例的移动终端可以设置有麦克风，通过麦克风在拍摄过程中录制拍摄时预览画面中每个人说话的语音数据，例如，可以是学生毕业时拍摄图像或者是毕业十周年聚会拍摄图像，当然也可以是其它拍摄的场景，例如拍摄家庭照等，本发明实施例对此不做限制。图像拍摄可以是全景图像，也可以是非全景图像，例如可以是在拍摄集体合影全景图像时录制每个人的语音数据。本发明实施例以拍摄毕业照为示例进行说明，例如拍摄学生毕业时的班级集体合影图像时，可以在拍摄时，录制拍摄预览画面中每个学生的毕业感言等。

步骤202，在语音数据录制过程中，记录每个人的说话顺序和每个人的生物特征信息。

在语音数据录制的过程中，可以通过面部识别技术，对拍摄预览画面中的每个人进行面部识别得到每个人的生物特征信息，生物特征信息可以是每个人的面部特征信息、性别信息等，同时记录每个人的说话顺序，说话顺序可以使用数字进行编号记录，当然也可以使用其它方式进行记录说话顺序，例如，可以是拍摄集体合影的过程中，按照参与拍摄的每个人站立的位置顺序说话，然后记录每个人的说话顺序和每个人的生物特征信息，当然也可以是按照预设的顺序，例如，对于上述拍摄毕业班级集体合影图像的过程中，每个学生说一些简短的毕业感言，可以记录每个人说话的时间顺序，然后记录每个人的生物特征信息。

步骤203，提取每个人的所述生物特征信息中的性别信息。

在本发明的一种优选实施例中，生物特征信息包括性别信息，该性别信息可以在录制每个人的生物特征信息时添加或者生成，例如通过面部识别技术对参与拍摄的每个人进行面部识别，识别出性别信息自动生成在生物特征信息中，也可以是对所有人的生物特征信息识别完成后，用户手动编辑添加性别信息，例如，对于拍摄毕业时的班级集体合影，在拍摄集体合影时，可以提取参与拍摄的每个人的性别信息，该性别信息可以在生物特征信息中提取，也可以是用户为每个人手动输入。

步骤204，根据每个人的所述性别信息，分别为每个人说话的语音数据添加性别标识。

每个人说话的语音数据可以是分别存储的，因此，可以为每个人说话的语音数据添加性别标识，该性别标识可以是文字形式的“男”或者“女”，也可以是其它表征男性或者女性的字符，例如“M”代表男，“F”代表女等，例如，可以为集体合影中性别为男性的人的语音数据添加上“男”的性别标识，为性别为女性的人的语音数据添加上“女”的性别标识。

步骤205，建立每个人的所述语音数据与所述性别标识之间的关联关系；其中，性别标识包括男和女。

本发明实施例中，可以建立每个人的语音数据与性别标识之间的关联关系，具体的，可以建立每个人的语音数据与性别标识之间的映射关系，或者是索引关系，当某个人性别为男性时，性别标识为男，当查找性别标识为男的语音数据时，可以通过映射关系或者索引关系，找到性别标识为男的所有语音数据，通过将语音数据与性别标识进行关联，能够实现语音数据按照性别进行分类或者检索，方便用户根据人物性别播放语音数据，例如，在毕业班级的集体合影图像中，将集体合影图像中所有男性的语音数据与性别标识“男”建立关联关系，将所有女性的语音数据与性别标识“女”建立关联关系。

步骤206，在图像拍摄完成后，生成目标图像。

当每个人说话的语音数据和生物特征信息记录完成后，移动终端的摄像头进行对焦、曝光等图像处理后，生成目标图像，生成的目标图像可以根据拍摄模式，可以是全景图像，也可以是非全景图像，目标图像格式可以为jpg.jpeg.gif.png.bmp等，例如，对于毕业班级的集体合影图像，可以为jpg.jpeg.gif.png.bmp等格式的全景图像或者非全景图像。

步骤207，将所述目标图像与所述每个人说话的语音数据进行关联存储。

生成目标图像后，可以将目标图像与每个人说话的语音数据进行关联存储，具体的，可以将目标图像、生物特征信息、语音数据、性别标识、以及语音数据与性别标识的关联关系存储，以能够实现根据目标图像播放目标图像中每个人说话的语音数据，例如，在毕业班级的集体合影中，可以将集体合影中生成的集体合影图像、图像中每个人的生物特征信息、语音数据、性别标识、语音数据与性别标识的关联关系进行关联存储，这样就可以通过集体合影图像中人物的性别播放图像中每个人的语音数据。

步骤208，接收移动终端用户对所述目标图像所输入的第一语音播放指令。

目标图像可以设置有菜单，菜单包括播放选项，播放选项包括男性语音数据播放选项和女性语音数据播放选项。当用户在显示的目标图像上，选择男性语音数据播放选项或者女性语音数据播放选项时，移动终端接收到用户的选择操作，生成包含性别标识的第一语音播放指令，例如，用户进入移动终端相册浏览毕业时的班级集体合影图像时，可以在集体合影图像上显示播放选项，播放选项包括男性语音数据播放选项和女性语音数据播放选项，当用户选择其中一个时，移动终端接收到用户的选择操作，生成第一语音播放指令。

步骤209，提取所述第一语音播放指令中的目标性别标识。

接收到第一语音播放指令后，可以提取第一语音播放指令中包含的目标性别标识，具体的，第一语音播放指令依据用户的选择操作，其包含的性别标识为男或者女，也可以是包含其它代表性别的字符，包含的性别字符与用户添加性别标识时表达性别的字符相对应。可以对第一语音播放指令中的特征字段进行提取和匹配，特征字段可以为包含性别的字符，提取该特征字段后，与预设的性别字符匹配，即可以知道目标性别标识代表的是男性还是女性，例如，在毕业时拍摄的集体合影图像中，用户选择女性语音播放选项后，第一语音播放指令包含的目标性别标识为“女”，则可以提取出目标性别标识“女”。

步骤210，根据所述目标性别标识，播放与所述目标性别标识相关联的所有语音数据。

当提取目标性别标识后，若目标性别标识为男，则根据性别标识与语音数据的关联关系，获取性别为男的所有语音数据，或者目标性别标识为女，获取性别为女的所有语音数据，将获取与目标性别标识对应的所有语音数据进行播放，这样，用户能够将语音数据按照目标图像上的人物性别进行播放，可以将拍摄时的语音数据，按照人物性别进行重现，当用户想播放所有女生或者男生的语音数据时，不需要多次点击播放操作，仅需要输入一次指令，即可播放所有女生或者男生的语音数据。例如，在毕业时拍摄的集体合影图像中，可以将拍摄时的语音数据按照集体合影图像中的人物的性别进行播放。

本发明实施例中，为每个人的语音数据添加性别标识并建立性别标识与语音数据的关联关系，能够实现在目标图像上按照的人物性别进行播放，可以将拍摄时的语音数据，按照人物性别进行重现。

实施例三

图3是本发明实施例三的一种拍摄方法的流程图。

参照图3所示，本发明实施例的一种拍摄方法的方法，应用于具有摄像头的移动终端，该方法包括：

步骤301，在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据。

步骤302，在语音数据录制过程中，记录每个人的说话顺序和每个人的生物特征信息。

在语音数据录制的过程中，可以通过面部识别技术，对拍摄预览画面中的每个人进行面部识别得到每个人的生物特征信息，生物特征信息可以是每个人的面部特征信息、年龄信息等，同时记录每个人的说话顺序，说话顺序可以使用数字进行编号记录，当然也可以使用其它方式进行记录说话顺序。例如，可以是拍摄毕业集体合影的过程中，按照参与拍摄的每个人站立的位置顺序说话，然后记录每个人的说话顺序和每个人的生物特征信息，当然也可以是按照预设的顺序，例如，对于上述拍摄毕业班级集体合影图像的过程中，每个学生说一些简短的毕业感言，可以记录每个人说话的时间顺序，然后记录每个人的生物特征信息，本发明实施例对每个人说话的顺序不做限制。

步骤303，提取每个人的所述生物特征信息中的年龄信息。

在本发明的一种优选实施例中，生物特征信息包括年龄信息，该年龄信息可以在录制每个人的生物特征信息时添加或者生成，例如可以是面部识别技术对人物的面部识别，识别出人物的大概年龄自动生成在生物特征信息中，也可以是对所有人的生物特征信息识别完成后，用户手动编辑添加年龄信息，例如，对于拍摄毕业时的班级集体合影，在拍摄集体合影时，可以提取参与拍摄的每个人的年龄信息，该年龄信息可以在生物特征信息中提取，也可以是用户为每个人手动输入。

步骤304，根据每个人的所述年龄信息和预设的年龄段信息，分别为每个人说话的语音数据添加年龄标识。

本发明实施例中，可以设置预设的年龄段信息，例如年龄段为1-10岁为一个年龄段，年龄标识为0；年龄段为11-20岁为另一个年龄段，年龄标识为1；以此类推。当然还可以是其它的方式设置年龄段与年龄标识，本发明实施例对此不做限制。

例如，对于学生毕业的班级集体合影时，可以将参与集体合影的每个人的年龄信息和预设的年龄段信息进行比较，得到每个人的年龄属于具体的年龄段，可以为每个人说话的语音数据添加相应的年龄标识，具体的，可以将集体合影中年龄为1-10岁的人说话的语音数据添加年龄标识“0”，年龄为11-20岁的人说话的语音数据添加年龄标识“1”等。

步骤305，建立每个人的所述语音数据与所述年龄标识之间的关联关系；其中，属于同一个年龄段的年龄标识相同。

本发明实施例中，可以建立每个人的语音数据与年龄标识之间的关联关系，具体的，可以建立每个人的语音数据与年龄标识之间的映射关系，或者是索引关系，当需要查找年龄标识关联的语音数据时，可以通过映射关系或者索引关系，找到该年龄标识的所有语音数据，例如，对于毕业班级的集体合影中，某个人年龄为15岁时，年龄标识可以为1，代表年龄在11-20岁的年龄段，当查找年龄标识为1的语音数据时，可以查找到集体合影中年龄在11-20岁的所有人的语音数据，这样能够实现将语音数据按照年龄进行分类和检索，方便用户根据不同年龄段的人物进行播放语音数据。

步骤306，在图像拍摄完成后，生成目标图像。

当每个人说话的语音数据和生物特征信息记录完成后，移动终端的摄像头进行对焦、曝光等图像处理后，生成目标图像，目标图像格式可以为jpg.jpeg.gif.png.bmp等，例如，对于毕业班级的集体合影图像，可以为jpg.jpeg.gif.png.bmp等格式的全景图像或者非全景图像。

步骤307，将所述目标图像与所述每个人说话的语音数据进行关联存储。

生成目标图像后，可以将目标图像与每个人说话的语音数据进行关联存储，具体的，可以将目标图像、生物特征信息、语音数据、年龄标识、以及语音数据与年龄标识的关联关系存储，以能够实现根据目标图像播放目标图像中每个人说话的语音数据，例如，在毕业班级的集体合影中，可以将集体合影中生成的集体合影图像、图像中每个人的生物特征信息、语音数据、年龄标识、语音数据与年龄标识的关联关系进行关联存储，这样就可以通过集体合影图像中每个人物的年龄所在的年龄段播放图像中每个人的语音数据。

步骤308，接收移动终端用户对所述目标图像所输入的第二语音播放指令。

目标图像可以设置有菜单，菜单包括播放选项，播放选项包括多个年龄段选项。当用户在显示的目标图像上，选择相应的年龄段时，移动终端接收到用户的选择操作，生成包含年龄标识的第二语音播放指令，例如，用户进入移动终端相册浏览毕业时的班级集体合影图像，可以在集体合影图像上显示播放选项，播放选项包括多个年龄段选项，当用户选择其中一个时，移动终端接收到用户的选择操作，生成第二语音播放指令，当用户选择年龄段0-10岁时，对应的年龄标识为0，此时第二语音播放指令中包含年龄标识0。

步骤309，提取所述第二语音播放指令中的目标年龄标识。

接收到第二语音播放指令后，可以提取目标年龄标识，具体的，可以对第二语音播放指令中的特征字段进行提取和匹配，特征字段可以为包含年龄标识的字符，提取该特征字段后，与预设的字符匹配，即可以知道年龄标识。例如，当用户浏览毕业时拍摄的集体合影图像时，在播放选项上的年龄段中选择0-10岁时，对应的年龄标识为0，此时目标年龄标识为0。

步骤310，根据所述目标年龄标识，播放与所述目标年龄标识相关联的所有语音数据。

当提取目标年龄标识后，可以根据年龄标识与语音数据的关联关系，获取年龄标识对应的年龄段的所有人的说话的语音数据，将获取的所有语音数据进行播放，这样，用户能够将语音数据按照目标图像上的人物的年龄进行播放，可以将拍摄时的语音数据，按照人物年龄进行重现，当用户想播放所有年轻人或者长者的语音数据时，不需要多次点击播放操作，仅需要输入一次指令，即可播放所有年轻人或者长者的语音数据。例如，对于毕业时的班级集体合影图像，可以实现播放毕业时集体合影中指定年龄段的人说话的语音数据，将拍摄时的语音数据按照人物的年龄进行播放，例如可以播放学生或者老师的语音数据。

本发明实施例中，为每个人的语音数据添加年龄标识，建立年龄标识与语音数据的关联关系，同一年龄段的人的年龄标识相同，能够在目标图像上将语音数据按照的人物年龄进行播放，可以将拍摄时的语音数据，按照人物年龄进行重现。

本发明实施例中，移动终端在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据，同时记录每个人的说话顺序和每个人的生物特征信息，建立每个人的生物特征信息、说话顺序和语音数据之间的关联关系，在生成目标图像后，将目标图像与每个人说话的语音数据进行关联存储。应用本发明实施例，通过建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系，可以在浏览目标图像时，播放与说话顺序或者生物特征信息关联的语音数据，解决了图像记录的是静止画面，无法透过图像体验拍摄时的场景的问题，使得用户能够通过图像播放拍摄时每个人说话的语音数据，重现了拍摄时的场景。

实施例四

图4是本发明实施例四的一种拍摄方法的流程图。

参照图4所示，本发明实施例的一种拍摄方法的方法，应用于具有摄像头的移动终端，该方法包括：

步骤401，在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据。

本发明实施例的移动终端可以设置有麦克风，通过麦克风在拍摄过程中录制拍摄时预览画面中每个人说话的语音数据。例如，可以是学生毕业时拍摄图像或者是毕业十周年聚会拍摄图像，当然也可以是其它拍摄的场景，例如拍摄家庭照等，本发明实施例对此不做限制。图像拍摄可以是全景图像，也可以是非全景图像，例如可以是在拍摄集体合影全景图像时录制每个人的语音数据。本发明实施例以拍摄毕业照为示例进行说明，例如拍摄学生毕业时的班级集体合影图像时，可以在拍摄时，录制拍摄预览画面中每个学生的毕业感言等。

步骤402，在语音数据录制过程中，记录每个人的说话顺序和每个人的生物特征信息。

本发明实施例可以通过面部识别技术，对拍摄预览画面中的每个人进行面部识别得到每个人的生物特征信息，生物特征信息可以是每个人的面部特征信息，同时记录每个人的说话顺序，说话顺序可以使用数字进行编号记录，当然也可以使用其它方式进行记录说话顺序。例如，可以是拍摄毕业集体合影的过程中，按照参与拍摄的每个人站立的位置顺序说话，然后记录每个人的说话顺序和每个人的生物特征信息，当然也可以是按照预设的顺序，例如，对于上述拍摄毕业时的班级集体合影图像的过程中，每个学生说一些简短的毕业感言，可以记录每个人说话的时间顺序，然后记录每个人的生物特征信息，本发明实施例对每个人说话的顺序不做限制。

步骤403，建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系。

为了使得每个人的语音数据和生物特征信息一一对应，可以建立每个人的生物特征信息、说话顺序、和语音数据的关联关系，例如，对于拍摄毕业时的班级集体合影，在拍摄集体合影时，可以将每个人的说话顺序按照数字进行编号，然后依据说话顺序的编号，给每个人的生物特征信息和语音数据添加相同的编号，编号相同的生物特征信息和语音数据属于同一个人，当然，本发明实施例还可以通过其它方式进行关联，本发明实施例对此不做限制。

步骤404，在图像拍摄完成后，生成目标图像。

步骤405，将所述目标图像与所述每个人说话的语音数据进行关联存储。

生成目标图像后，可以将目标图像与每个人说话的语音数据进行关联存储，具体的，可以将目标图像、生物特征信息、语音数据、每个人的说话顺序以及说话顺序与语音数据的关联关系进行存储，以能够实现根据目标图像播放目标图像中每个人说话的语音数据，例如，在毕业班级的集体合影中，可以将集体合影中生成的集体合影图像、图像中每个人的生物特征信息、语音数据、说话顺序、语音数据与说话顺序的关联关系进行关联存储，这样就可以通过集体合影图像按照预设的顺序播放图像中每个人的语音数据。

步骤406，接收移动终端用户对所述目标图像所输入的第三语音播放指令。

目标图像可以设置有菜单，菜单包括顺序播放选项，当用户在显示的目标图像上，选择顺序播放选项时，移动终端接收到用户的选择操作，生成包含播放顺序的第三语音播放指令，例如，对于毕业时拍摄的集体合影图像，用户进入移动终端相册浏览集体合影图像时，可以在集体合影图像上显示播放选项，播放选项包括顺序播放选项，当用户选择顺序播放时，移动终端接收到用户的选择操作，生成第三语音播放指令。

步骤407，按照记录的所述每个人的说话顺序，依次播放所述每个人说话的语音数据。

接收到第三语音播放指令后，根据第三语音播放指令中的播放顺序，例如，对于毕业拍摄的集体合影图像，按照拍摄集体合影时录制每个人说话的语音数据时的说话顺序，依次提取对应的语音数据进行播放，能够实现在集体合影中按照拍摄时的说话顺序播放每个人说话的语音数据，可以更真实的重现拍摄时的场景。

本发明实施中，按照记录的每个人的说话顺序，依次播放每个人说话的语音数据，可以更逼真的重现拍摄时的场景。

本发明实施例中，移动终端在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据，同时记录每个人的说话顺序和每个人的生物特征信息，建立每个人的生物特征信息、说话顺序和语音数据之间的关联关系，在生成目标图像后，将目标图像与每个人说话的语音数据进行关联存储。应用本发明实施例，通过建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系，可以在浏览目标图像时，播放与说话顺序或者生物特征信息关联的语音数据，解决了图像记录的是静止画面，无法透过图像体验拍摄时的场景的问题，使得用户能够通过图像播放拍摄时每个人说话的语音数据，重现了拍摄时的场景。

实施例五

图5是本发明实施例五的一种拍摄方法的流程图。

参照图5所示，本发明实施例的一种拍摄方法的方法，应用于具有摄像头的移动终端，该方法包括：

步骤501，在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据。

步骤502，在语音数据录制过程中，记录每个人的说话顺序和每个人的生物特征信息。

在语音数据录制的过程中，可以通过面部识别技术，对拍摄预览画面中的每个人进行面部识别得到每个人的生物特征信息，生物特征信息可以是每个人的面部特征信息，性别信息，年龄信息等，同时记录每个人的说话顺序。例如，可以是拍摄毕业集体合影的过程中，按照参与拍摄的每个人站立的位置顺序说话，然后记录每个人的说话顺序和每个人的生物特征信息，当然也可以是按照预设的顺序，例如，对于上述拍摄毕业时的班级集体合影图像的过程中，每个学生说一些简短的毕业感言，可以记录每个人说话的时间顺序，然后记录每个人的生物特征信息，本发明实施例对每个人说话的顺序不做限制。

步骤503，建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系。

步骤504，在图像拍摄完成后，生成目标图像。

步骤505，将所述目标图像与所述每个人说话的语音数据进行关联存储。

生成目标图像后，可以将目标图像与每个人说话的语音数据进行关联存储，具体的，可以将目标图像、生物特征信息、语音数据、以及语音数据与说话顺序的关联关系存储，以能够实现根据目标图像播放目标图像中每个人说话的语音数据，例如，在毕业班级的集体合影中，可以将集体合影中生成的集体合影图像、图像中每个人的生物特征信息、语音数据、说话顺序、语音数据与说话顺序的关联关系存储。

步骤506，获取所述目标图像中每个人的姓名信息。

目标图像中每个人具有姓名，可以获取每个人的姓名信息，可以是记录每个人的生物特征信息时，根据用户输入目标照片上的每个人的姓名信息，具体而言，可以是记录一个人的生物特征信息时用户输入一个人物的姓名信息，也可以是记录所有人的生物特征信息后，用户编辑输入每个人的姓名信息，在实际应用中，可以是获取集体合影中每个人的姓名，例如，在毕业拍摄的集体合影图像中，可以获取用户输入的每个学生或者老师的姓名。

步骤507，根据所述每个人的姓名信息，为所述目标图像中每个人添加姓名标识。

每个人说话的语音数据可以是分别存储的，因此，可以为每个人说话的语音数据添加姓名标识，目标图像中每个人的姓名标识可以是每个人的姓名信息，对于毕业时拍摄的集体合影，可以将集体合影图像中每个学生或者老师的姓名，作为姓名标识。

步骤508，建立每个人的所述语音数据与所述姓名标识之间的关联关系。

本发明实施例中，可以通过姓名标识，将目标图像中每个人与其说话的语音数据对应，由于目标图像中的每个人已经添加了姓名标识，可以将语音数据与姓名标识建立关联关系，就可以将目标图像中每个人与其说话的语音数据对应。例如，可以建立每个人的语音数据与姓名标识之间的映射关系，或者是索引关系，例如，在毕业时拍摄的集体合影图像中，某个学生的姓名为“张三”时，姓名标识可以为“张三”，当需要查找学生张三说话的语音数据时，可以通过姓名标识为“张三”的映射关系或者索引关系，找到对应语音数据，这样能够实现按照姓名查找语音数据，方便查找具体某个人说话的语音数据。

步骤509，获取移动终端中新增的音频数据。

本发明实施例中，可以将拍摄时目标图像中的人物加入同一个聊天群中，例如QQ群、微信群等，可以获取聊天群中每个人说话的语音数据，通常的，聊天群中每个人说话的语音数据以音频数据存储在移动终端中，可以获取移动终端中新增的音频数据。当然，该音频数据也可以是移动终端重新录制的图像中某个人的音频数据，例如，学生毕业后，建立有班级QQ群或者微信群等，在QQ群或者微信群中可以进行语音聊天，例如毕业周年纪念，每个人重新说简短的周年纪念感言等，这些语音聊天的音频数据可以存储在移动终端中。

步骤510，提取所述音频数据的数据来源或声纹信息。

如果新增的音频数据属于聊天群里面每个人的聊天语音数据，则提取所述音频数据具体的数据来源，例如来源于QQ群张三的语音数据；当新增的音频数据是移动终端麦克风直接录制每个人的说话声音，则可以直接提取录制的每个人的声纹信息，声纹信息可以是指向录制每个人说话的语音数据的文件路径等，例如，在班级QQ群的数据来源可以是来自QQ群张三的语音数据，或者来自本地张三的录音等。

步骤511，根据所述音频数据的数据来源或声纹信息，实时更新与所述目标图像关联存储的各语音数据。

如图6所示，本发明实施例中，根据所述音频数据的数据来源或声纹信息，实时更新与所述目标图像关联存储的各语音数据包括以下步骤：

步骤5111，根据所述音频数据的数据来源或声纹信息，确定所述音频数据对应的说话者姓名。

在实际应用中，聊天群里可以用每个人的姓名作为聊天群里面的名片，当聊天群里面进行语音聊天时，将每个人说话的音频数据以姓名为文件命名存储，例如存储为“QQ群张三的语音聊天”，对于移动终端录制的音频数据，也可以保存为以说话者的姓名命名的文件，的当然也可以是其它方式进行存储，这样，可以根据存储文件的命名得知音频数据对应的说话者姓名。

步骤5112，根据所述音频数据对应的说话者姓名，确定所述说话者姓名对应的目标姓名标识。

在确定音频数据对应的说话者姓名后，可以将该姓名与所有的姓名标识进行匹配，当找到匹配的姓名标识时，该姓名标识即确定为目标姓名标识。

步骤5113，将所述目标姓名标识相关联的所述语音数据替换为所述音频数据。

当确定目标姓名标识后，根据语音数据与姓名标识的关联关系，获取与该目标姓名标识关联的语音数据，采用新的音频数据替换掉与目标姓名标识关联的语音数据，例如通过覆盖存储方式，覆盖原有的语音数据，实现替换更新。例如，对于毕业的集体合影图像，在集体合影图像中某人在QQ群、微信群或者本地有新的音频数据时，采用该新的音频数据替换掉该人在集体图像中对应的语音数据，这样，通过姓名标识与移动终端中新增的音频数据的说话者姓名进行匹配，实现了目标图像中语音数据的实时更新。

本发明实施例中，获取目标图像中每个人的姓名信息，并将每个人的姓名信息作为目标图像中每个人的姓名标识，然后建立姓名标识与语音数据的关联关系，当移动终端中新增音频数据时，依据音频数据说话者姓名与姓名标识进行匹配，以将新增音频数据更新为目标图像中相应的语音数据，实现了目标图像中语音数据的实时更新。

本发明实施例中，移动终端在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据，同时记录每个人的说话顺序和每个人的生物特征信息，建立每个人的生物特征信息、说话顺序和语音数据之间的关联关系，在生成目标图像后，将目标图像与每个人说话的语音数据进行关联存储。应用本发明实施例，通过建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系，可以在浏览目标图像时，播放与说话顺序或者生物特征信息关联的语音数据，解决了图像记录的是静止画面，无法透过图像体验拍摄时的场景的问题，使得用户能够通过图像播放拍摄时每个人说话的语音数据，重现了拍摄时的场景。

实施例六

图7是本发明实施例六的一种移动终端的结构框图。

参照图7所示，本发明实施例提供的一种移动终端600包括摄像头，还包括：

语音数据录制模块601，用于在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据；

记录模块602，用于在语音数据录制过程中，记录每个人的说话顺序和每个人的生物特征信息；

第一关联关系建立模块603，用于建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系；

目标图像生成模块604，用于在图像拍摄完成后，生成目标图像；

存储模块605，用于将所述目标图像生成模块生成的目标图像与所述语音数据录制模块录制的每个人说话的语音数据进行关联存储。

参照图7a所示，本发明实施例的另一种移动终端600中，第一关联关系建立模块603包括：

性别信息提取子模块6031，用于提取每个人的所述生物特征信息中的性别信息；

性别标识添加子模块6032，用于根据所述性别信息提取子模块提取的每个人的所述性别信息，分别为每个人说话的语音数据添加性别标识；

第一关联关系建立子模块6033，用于建立每个人的所述语音数据与所述性别标识添加子模块添加的性别标识之间的关联关系；

其中，性别标识包括男和女。

移动终端600还包括：

第一播放指令接收模块606，用于接收移动终端用户对所述目标图像所输入的第一语音播放指令；

目标性别标识提取模块607，用于提取所述第一播放指令接收模块接收的第一语音播放指令中的目标性别标识；

第一播放模块608，用于根据所述目标性别标识提取模块提取的目标性别标识，播放与所述目标性别标识相关联的所有语音数据。

参照图7b所示，本发明实施例的另一种移动终端600中，第一关联关系建立模块603包括：

年龄信息提取子模块6034，用于提取每个人的所述生物特征信息中的年龄信息；

年龄标识添加子模块6035，用于根据所述年龄信息提取子模块提取的每个人的所述年龄信息和预设的年龄段信息，分别为每个人说话的语音数据添加年龄标识；

第二关联关系建立子模块6036，用于建立每个人的所述语音数据与所述年龄标识添加子模块添加的年龄标识之间的关联关系；

其中，属于同一个年龄段的年龄标识相同。

移动终端600还包括：

第二播放指令接收模块609，用于接收移动终端用户对所述目标图像所输入的第二语音播放指令；

目标年龄标识提取模块610，用于提取所述第二播放指令接收模块接收的第二语音播放指令中的目标年龄标识；

第二播放模块611，用于根据所述目标年龄标识提取模块提取的目标年龄标识，播放与所述目标年龄标识相关联的所有语音数据。

参照图7c所示，本发明实施例的另一种移动终端600，还包括：

第三播放指令接收模块612，用于接收移动终端用户对所述目标图像所输入的第三语音播放指令；

第三播放模块613，用于按照记录的所述每个人的说话顺序，依次播放所述每个人说话的语音数据。

参照图7d所示，本发明实施例的另一种移动终端600，还包括：

姓名信息获取模块614，用于获取所述目标图像中每个人的姓名信息；

姓名标识添加模块615，用于根据所述姓名信息获取模块获取的每个人的姓名信息，为所述目标图像中每个人添加姓名标识；

第二关联关系建立模块616，建立每个人的所述语音数据与所述姓名标识添加模块添加的姓名标识之间的关联关系。

音频数据获取模块617，用于获取移动终端中新增的音频数据；

音频数据信息提取模块618，用于提取所述音频数据获取模块获取的音频数据的数据来源或声纹信息；

语音数据更新模块619，用于根据所述音频数据信息提取模块提取的音频数据的数据来源或声纹信息，实时更新与所述目标图像关联存储的各语音数据。

其中，语音数据更新模块619包括：

姓名确定子模块6191，用于根据所述音频数据的数据来源或声纹信息，确定所述音频数据对应的说话者姓名；

姓名标识确定子模块6192，用于根据所述姓名确定子模块确定的音频数据对应的说话者姓名，确定所述说话者姓名对应的目标姓名标识；

语音数据替换子模块6193，用于将所述姓名标识确定子模块确定的目标姓名标识相关联的所述语音数据替换为所述音频数据。

移动终端能够实现图1至图6的方法实施例中移动终端实现的各个过程，为避免重复，这里不再赘述。

进一步地，为每个人的语音数据添加年龄标识，建立年龄标识与语音数据的关联关系，同一年龄段的人的年龄标识相同，能够在目标图像上将语音数据按照的人物年龄进行播放，可以将拍摄时的语音数据，按照人物年龄进行重现。

进一步地，按照记录的每个人的说话顺序，依次播放每个人说话的语音数据，可以更逼真的重现拍摄时的场景。

进一步地，获取目标图像中每个人的姓名信息，并将每个人的姓名信息作为目标图像中每个人的姓名标识，然后建立姓名标识与语音数据的关联关系，当移动终端中新增音频数据时，依据音频数据说话者姓名与姓名标识进行匹配，以将新增音频数据更新为目标图像中相应的语音数据，实现了目标图像中语音数据的实时更新。

本发明实施例中，移动终端在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据，同时记录每个人的说话顺序和每个人的生物特征信息，建立每个人的生物特征信息、说话顺序和语音数据之间的关联关系，在生成目标图像后，将目标图像与每个人说话的语音数据进行关联存储。应用本发明实施例，通过建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系，可以在浏览目标图像时，播放与说话顺序或者生物特征信息关联的语音数据，解决了图像记录的是静止画面，无法透过图像体验拍摄时的场景的问题，使得用户能够通过图像播放拍摄时每个人说话的语音数据，重现了拍摄时的场景。

实施例七

图8是本发明实施例七提供的一种移动终端的结构框图，图8所示的移动终端1000包括：至少一个处理器1001、存储器1002、至少一个网络接口1004、摄像头1006、麦克风1007和用户接口1003。移动终端1000中的各个组件通过总线系统1005耦合在一起。可理解，总线系统1005用于实现这些组件之间的连接通信。总线系统1005除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图8中将各种总线都标为总线系统1005。

其中，用户接口1003可以包括显示器、键盘或者点击设备(例如，鼠标，轨迹球(trackball)、触感板或者触摸屏等。

可以理解，本发明实施例中的存储器1002可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本发明实施例描述的系统和方法的存储器1002旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中，存储器1002存储了如下的元素，可执行模块或者数据结构，或者他们的子集，或者他们的扩展集：操作系统10021和应用程序10022。

其中，操作系统10021，包含各种系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务。应用程序10022，包含各种应用程序，例如媒体播放器(Media Player)、浏览器(Browser)等，用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序10022中。

在本发明实施例中，通过调用存储器1002存储的程序或指令，具体的，可以是应用程序10022中存储的程序或指令，处理器1001用于在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据；在语音数据录制过程中，记录每个人的说话顺序和每个人的生物特征信息；建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系；在图像拍摄完成后，生成目标图像；将所述目标图像与所述每个人说话的语音数据进行关联存储。

上述本发明实施例揭示的方法可以应用于处理器1001中，或者由处理器1001实现。处理器1001可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器1001中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1001可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1002，处理器1001读取存储器1002中的信息，结合其硬件完成上述方法的步骤。

摄像头1006用于在拍摄时拍摄生成目标图像，麦克风1007用于录制拍摄时预览画面中每个人说话的语音数据。

可以理解的是，本发明实施例描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processing，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable Logic Device，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现，可通过执行本发明实施例所述功能的模块(例如过程、函数等)来实现本发明实施例所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

优选的，处理器1001还用于：提取每个人的所述生物特征信息中的性别信息；根据每个人的所述性别信息，分别为每个人说话的语音数据添加性别标识；建立每个人的所述语音数据与所述性别标识之间的关联关系；其中，性别标识包括男和女。

优选的，处理器1001还用于：接收移动终端用户对所述目标图像所输入的第一语音播放指令；提取所述第一语音播放指令中的目标性别标识；根据所述目标性别标识，播放与所述目标性别标识相关联的所有语音数据。

优选的，处理器1001还用于：提取每个人的所述生物特征信息中的年龄信息；根据每个人的所述年龄信息和预设的年龄段信息，分别为每个人说话的语音数据添加年龄标识；建立每个人的所述语音数据与所述年龄标识之间的关联关系；其中，属于同一个年龄段的年龄标识相同。

优选的，处理器1001还用于：接收移动终端用户对所述目标图像所输入的第二语音播放指令；提取所述第二语音播放指令中的目标年龄标识；根据所述目标年龄标识，播放与所述目标年龄标识相关联的所有语音数据。

优选的，处理器1001还用于：接收移动终端用户对所述目标图像所输入的第三语音播放指令；按照记录的所述每个人的说话顺序，依次播放所述每个人说话的语音数据。

优选的，处理器1001还用于：获取所述目标图像中每个人的姓名信息；根据所述每个人的姓名信息，为所述目标图像中每个人添加姓名标识；建立每个人的所述语音数据与所述姓名标识之间的关联关系。

优选的，处理器1001还用于：获取移动终端中新增的音频数据；提取所述音频数据的数据来源或声纹信息；根据所述音频数据的数据来源或声纹信息，实时更新与所述目标图像关联存储的各语音数据。

优选的，处理器1001还用于：根据所述音频数据的数据来源或声纹信息，确定所述音频数据对应的说话者姓名；根据所述音频数据对应的说话者姓名，确定所述说话者姓名对应的目标姓名标识；将所述目标姓名标识相关联的所述语音数据替换为所述音频数据。

移动终端1000能够实现图1至图6的方法实施例中移动终端实现的各个过程，为避免重复，这里不再赘述。

进一步地，按照记录的每个人的说话顺序，依次播放每个人说话的语音数据，可以更逼真的重现拍摄时的场景。

本发明实施例的移动终端1000，在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据，同时记录每个人的说话顺序和每个人的生物特征信息，建立每个人的生物特征信息、说话顺序和语音数据之间的关联关系，在生成目标图像后，将目标图像与每个人说话的语音数据进行关联存储。应用本发明实施例，通过建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系，可以在浏览目标图像时，播放与说话顺序或者生物特征信息关联的语音数据，解决了图像记录的是静止画面，无法透过图像体验拍摄时的场景的问题，使得用户能够通过图像播放拍摄时每个人说话的语音数据，重现了拍摄时的场景。

实施例八

图9是本发明实施例八提供的一种移动终端的结构示意图。具体地，图9中的移动终端1100可以为手机、平板电脑、个人数字助理(Personal Digital Assistant，PDA)、或车载电脑等。

图9中的移动终端1100包括射频(Radio Frequency，RF)电路1101、存储器1102、输入单元1103、显示单元1104、摄像头1105、麦克风1110、处理器1106、音频电路1107、WiFi(Wireless Fidelity)模块1108和电源1109。

其中，输入单元1103可用于接收用户输入的数字或字符信息，以及产生与移动终端1100的用户设置以及功能控制有关的信号输入。具体地，本发明实施例中，该输入单元1103可以包括触控面板11031。触控面板11031，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板11031上的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板11031可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给该处理器1106，并能接收处理器1106发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板11031。除了触控面板11031，输入单元1103还可以包括其他输入设备11032，其他输入设备11032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

其中，显示单元1104可用于显示由用户输入的信息或提供给用户的信息以及移动终端1100的各种菜单界面。显示单元1104可包括显示面板11041，可选的，可以采用LCD或有机发光二极管(Organic Light-Emitting Diode，OLED)等形式来配置显示面板11041。

应注意，触控面板11031可以覆盖显示面板11041，形成触摸显示屏，当该触摸显示屏检测到在其上或附近的触摸操作后，传送给处理器1106以确定触摸事件的类型，随后处理器1106根据触摸事件的类型在触摸显示屏上提供相应的视觉输出。

触摸显示屏包括应用程序界面显示区及常用控件显示区。该应用程序界面显示区及该常用控件显示区的排列方式并不限定，可以为上下排列、左右排列等可以区分两个显示区的排列方式。该应用程序界面显示区可以用于显示应用程序的界面。每一个界面可以包含至少一个应用程序的图标和/或widget桌面控件等界面元素。该应用程序界面显示区也可以为不包含任何内容的空界面。该常用控件显示区用于显示使用率较高的控件，例如，设置按钮、界面编号、滚动条、电话本图标等应用程序图标等。

其中处理器1106是移动终端1100的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在第一存储器11021内的软件程序和/或模块，以及调用存储在第二存储器11022内的数据，执行移动终端1100的各种功能和处理数据，从而对移动终端1100进行整体监控。可选的，处理器1106可包括一个或多个处理单元。

摄像头1105用于在拍摄时拍摄生成目标图像，麦克风1110用于录制拍摄时预览画面中每个人说话的语音数据。

在本发明实施例中，通过调用存储该第一存储器11021内的软件程序和/或模块和/或该第二存储器11022内的数据，处理器1106用于于在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据；在语音数据录制过程中，记录每个人的说话顺序和每个人的生物特征信息；建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系；在图像拍摄完成后，生成目标图像；将所述目标图像与所述每个人说话的语音数据进行关联存储。

优选的，处理器1106还用于：提取每个人的所述生物特征信息中的性别信息；根据每个人的所述性别信息，分别为每个人说话的语音数据添加性别标识；建立每个人的所述语音数据与所述性别标识之间的关联关系；其中，性别标识包括男和女。

优选的，处理器1106还用于：接收移动终端用户对所述目标图像所输入的第一语音播放指令；提取所述第一语音播放指令中的目标性别标识；根据所述目标性别标识，播放与所述目标性别标识相关联的所有语音数据。

优选的，处理器1106还用于：提取每个人的所述生物特征信息中的年龄信息；根据每个人的所述年龄信息和预设的年龄段信息，分别为每个人说话的语音数据添加年龄标识；建立每个人的所述语音数据与所述年龄标识之间的关联关系；其中，属于同一个年龄段的年龄标识相同。

优选的，处理器1106还用于：接收移动终端用户对所述目标图像所输入的第二语音播放指令；提取所述第二语音播放指令中的目标年龄标识；根据所述目标年龄标识，播放与所述目标年龄标识相关联的所有语音数据。

优选的，处理器1106还用于：接收移动终端用户对所述目标图像所输入的第三语音播放指令；按照记录的所述每个人的说话顺序，依次播放所述每个人说话的语音数据。

优选的，处理器1106还用于：获取所述目标图像中每个人的姓名信息；根据所述每个人的姓名信息，为所述目标图像中每个人添加姓名标识；建立每个人的所述语音数据与所述姓名标识之间的关联关系。

优选的，处理器1106还用于：获取移动终端中新增的音频数据；提取所述音频数据的数据来源或声纹信息；根据所述音频数据的数据来源或声纹信息，实时更新与所述目标图像关联存储的各语音数据。

优选的，处理器1106还用于：根据所述音频数据的数据来源或声纹信息，确定所述音频数据对应的说话者姓名；根据所述音频数据对应的说话者姓名，确定所述说话者姓名对应的目标姓名标识；将所述目标姓名标识相关联的所述语音数据替换为所述音频数据。

移动终端1100能够实现前述实施例中移动终端实现的各个过程，为避免重复，这里不再赘述。

进一步地，按照记录的每个人的说话顺序，依次播放每个人说话的语音数据，可以更逼真的重现拍摄时的场景。

本发明实施例的移动终端1100，在图像拍摄过程中，录制拍摄预览画面中每个人说话的语音数据，同时记录每个人的说话顺序和每个人的生物特征信息，建立每个人的生物特征信息、说话顺序和语音数据之间的关联关系，在生成目标图像后，将目标图像与每个人说话的语音数据进行关联存储。应用本发明实施例，通过建立每个人的所述生物特征信息、所述说话顺序和所述语音数据之间的关联关系，可以在浏览目标图像时，播放与说话顺序或者生物特征信息关联的语音数据，解决了图像记录的是静止画面，无法透过图像体验拍摄时的场景的问题，使得用户能够通过图像播放拍摄时每个人说话的语音数据，重现了拍摄时的场景。

本领域普通技术人员可以意识到，结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通话连接可以是通过一些接口，装置或单元的间接耦合或通话连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邓桐红
技术所有人：维沃移动通信有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。