媒体文件生成方法和装置与流程

文档序号:11063505阅读:261来源:国知局
媒体文件生成方法和装置与制造工艺

本发明涉及通信领域,具体而言,涉及一种媒体文件生成方法和装置。



背景技术:

目前的拍摄技术中,在拍照时只能生成图像文件,不能在拍照过程中对图像文件添加音频记录,而只能在拍照完成之后,通过后期的编辑软件对照片添加文字、音频等信息。这种照片生成过程和音频信息添加过程在时间上相互隔离的情况,导致用户在后期为照片添加音频信息时,已然没有了拍摄照片时的感觉和兴致,使得拍照的过程缺少了趣味性。

针对相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明提供了一种媒体文件生成方法和装置,以至少解决相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题。

根据本发明的一个方面,提供了一种媒体文件生成方法,包括:在拍摄模式下,获取预设音频;在所述预设音频的时间轴上的时间点上拍摄图像;建立拍摄的所述图像与所述预设音频的所述时间轴上的所述时间点的映射关系;生成携带有所述图像和预设标识的媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在所述映射关系。

可选地,获取所述预设音频包括:根据用户输入的存储路径,读取所述存储路径指示的音频文件;剪辑所述音频文件,得到所述预设音频。

可选地,拍摄所述图像包括:接收用于指示生成所述媒体文件的指令;根据用于指示生成所述媒体文件的指令,在所述预设音频的所述时间轴上的所述时间点上拍摄所述图像。

可选地,生成携带有所述图像和所述预设标识的所述媒体文件包括:接收编辑指令,其中,所述编辑指令用于调整所述图像与所述预设音频的所述时间轴上所述时间点的对应关系,并更新所述映射关系;生成携带有所述图像和所述预设标识的所述媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在更新后的所述映射关系。

可选地,生成携带有所述图像和所述预设标识的所述媒体文件还包括:生成所述媒 体文件,其中,所述媒体文件为携带有所述图像、所述预设音频、所述映射关系和所述预设标识的一个媒体文件。

可选地,在生成携带有所述图像和所述预设标识的所述媒体文件之后,所述方法还包括:读取文件,并判断所述文件是否为携带有所述预设标识的所述媒体文件;在判断到所述文件为携带有所述预设标识的所述媒体文件的情况下,播放所述预设音频,并在播放到所述预设音频的所述时间轴上的所述时间点时,根据所述映射关系显示对应的图像。

可选地,所述图像包括三维图像。

根据本发明的另一个方面,还提供了一种媒体文件生成装置,包括:获取模块,用于在拍摄模式下,获取预设音频;拍摄模块,用于在所述预设音频的时间轴上的时间点上拍摄图像;建立模块,用于建立拍摄的所述图像与所述预设音频的所述时间轴上的所述时间点的映射关系;生成模块,用于生成携带有所述图像和预设标识的媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在所述映射关系。

可选地,所述获取模块包括:读取单元,用于根据用户输入的存储路径,读取所述存储路径指示的音频文件;剪辑单元,用于剪辑所述音频文件,得到所述预设音频。

可选地,所述拍摄模块包括:第一接收单元,用于接收用于指示生成所述媒体文件的指令;拍摄单元,用于根据用于指示生成所述媒体文件的指令,在所述预设音频的所述时间轴上的所述时间点上拍摄所述图像。

可选地,所述生成模块包括:第二接收单元,用于接收编辑指令,其中,所述编辑指令用于调整所述图像与所述预设音频的所述时间轴上所述时间点的对应关系,并更新所述映射关系;生成单元,用于生成携带有所述图像和所述预设标识的所述媒体文件,其中,所述预设标识用于指示所述图像与所述预设音频存在更新后的所述映射关系。

可选地,所述生成模块还用于;生成所述媒体文件,其中,所述媒体文件为携带有所述图像、所述预设音频、所述映射关系和所述预设标识的一个媒体文件。

可选地,所述装置还包括:第一处理模块,用于读取文件,并判断所述文件是否为携带有所述预设标识的所述媒体文件;第二处理模块,用于在判断到所述文件为携带有所述预设标识的所述媒体文件的情况下,播放所述预设音频,并在播放到所述预设音频的所述时间轴上的所述时间点时,根据所述映射关系显示对应的图像。

通过本发明,采用在拍摄模式下,获取预设音频;在预设音频的时间轴上的时间点上拍摄图像;建立拍摄的图像与预设音频的时间轴上的时间点的映射关系;生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在映射关系的方式,解决了相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题,实现了拍照和添加音频文件在时间上的同步,提升了用户体验。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的媒体文件生成方法的流程图;

图2是根据本发明实施例的媒体文件生成装置的结构框图;

图3是根据本发明实施例的媒体文件生成装置的可选结构框图一;

图4是根据本发明实施例的媒体文件生成装置的可选结构框图二;

图5是根据本发明实施例的媒体文件生成装置的可选结构框图三;

图6是根据本发明实施例的媒体文件生成装置的可选结构框图四;

图7是根据本发明可选实施例的媒体文件生成装置的结构框图;

图8是根据本发明可选实施例的3D拍照方法的示意图;

图9是根据本发明可选实施例的媒体文件生成方法的示意图一;

图10是根据本发明可选实施例的媒体文件生成方法的示意图二;

图11是根据本发明可选实施例的3D照片浏览方法的示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

在本实施例中提供了一种媒体文件生成方法,图1是根据本发明实施例的媒体文件生成方法的流程图,如图1所示,该流程包括如下步骤:

步骤S102,在拍摄模式下,获取预设音频;

步骤S104,在预设音频的时间轴上的时间点上拍摄图像;

步骤S106,建立拍摄的图像与预设音频的时间轴上的时间点的映射关系;

步骤S108,生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在映射关系。

通过上述步骤,在拍照模式下,获取到用户选择的预设音频,在播放预设音频的同 时拍摄图像,获取拍摄的图像在音频中的对应关系,建立预设音频时间轴上的时间点与图像的映射关系,再生成携带有图像和用于指示图像与预设音频间存在映射关系的标识的媒体文件。可见,采用上述步骤,解决了相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题,实现了拍照和添加音频文件在时间上的同步,提升了用户体验。

需要说明的是,在本发明的实施例及可选实施例中,媒体文件是指存储了媒体形式的文件,可以是存储了一种媒体形式的文件,例如,图像文件、音频文件,也可以是存储了多种媒体形式的文件,例如,视频文件、多媒体文件(图像、音频同时存储的文件)。

可选地,上述方法可以应用于用户设备,例如,手机,平板电脑,相机设备,以及可以进行图像拍摄的设备等。

可选地,在上述步骤S102中,预设音频可以通过编辑导入的音频文件获得,可以根据用户输入的存储路径,读取存储路径下的音频文件,再对音频文件进行剪辑,得到预设音频,例如,在拍摄模式下,提示用户可以选择音频文件的存储路径,根据用户选择的存储路径获取音频文件,再为用户提供对音频文件的编辑选项,比如,可以通过对音频的开始标记和结束标记的移动对音频文件进行截取,并且在截取后,也可以为用户提供试听和进行再次编辑,根据用户的编辑对音频文件进行剪辑,得到预设音频。可见,通过上述步骤,可以使用户根据喜好对音频文件进行编辑以获取预设音频,提高了用户体验度,同时解决了相关技术中拍照和添加音频文件在时间上相互隔离导致的用户体验差的问题,实现了拍照和添加音频文件在时间上的同步,提升了用户体验。

可选地,在上述步骤S104中,可以在拍照模式下显示用于指示生成媒体文件的控件,接收到用户通过触发上述控件发出的用于指示生成媒体文件的指令,并根据用于指示生成媒体文件的指令,在预设音频的时间轴上的时间点上拍摄图像。可见,通过上述步骤可以为用户提供是否生成媒体文件的选择,在用户选择生成媒体文件的情况下,在预设音频的时间轴上的时间点上拍摄图像,否则,直接进行拍摄,提高了用户的体验度。

可选地,在上述步骤S108中,用户可以对建立的拍摄的图像与预设音频的时间轴上的时间点的映射关系进行编辑,在接收到用于调整图像与预设音频的时间轴上时间点的对应关系,并更新映射关系的编辑指令后,生成携带有图像和用于指示图像与预设音频存在更新后的映射关系的预设标识的媒体文件,例如,为用户提供对映射关系进行编辑的控件,比如,用户可以在预设音频的时间轴上拖动拍摄的图像至其他时间点,接收到用户操作的编辑指令后,将根据拍摄的图像与预设音频的时间轴上时间点的新的对应关系更新映射关系,并生成携带有拍摄的图像以及用于指示图像与音频间存在更新后的映射关系的预设标识的媒体文件。可见,通过上述步骤,用户可以对图像与音频的映射关系进行编辑,根据喜好在预设音频时间轴上的特定的时间点上显示特定的图像,提高了用户的体验度。

可选地,在上述步骤S108中,生成的媒体文件可以是同时携带有图像、预设音频、映射关系和预设标识的一个媒体文件,例如,在媒体文件的第一区域存储拍摄的图像,在媒体文件的第二区域存储预设音频,在媒体文件的第三区域存储映射关系,在媒体文件的第四区域存储用于指示图像与预设音频存在映射关系的预设标识。可见,通关上述步骤,可以将图像、预设音频、映射关系、预设标识整合在一个媒体文件中,避免了由于分别存储图像与音频可能导致的调用错误,同时提高了资源的聚合度,使用户能够得到更高的体验度。

可选地,在上述步骤S108之后,可以对媒体文件进行查看,并根据媒体文件携带的预设标识读取预设标识指示的映射关系,在播放预设音频的相应时间点上显示对应的图像,例如,判断读取到的文件是否为携带有预设标识的媒体文件,在判断到文件为携带有预设标识的媒体文件的情况下,播放预设音频,并在播放到预设音频的时间轴上的时间点时,根据映射关系显示对应的图像;还可以在判断到读取的文件为携带有预设标识的媒体文件的情况下,提示用户是否选择播放预设音频,在用户选择播放预设音频时,在播放到预设音频的时间轴上的时间点时,根据映射关系显示对应的图像,在用户选择不播放预设音频时,直接显示图像。可见,通过上述步骤,使用户可以在收听预设音频的同时浏览图像,同时为用户提供了是否播放预设音频的选择,提高了用户体验度。

可选地,上述拍摄的图像可以是三维图像。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。

在本实施例中还提供了一种媒体文件生成装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图2是根据本发明实施例的媒体文件生成装置的结构框图,如图2所示,该装置包括:获取模块22、拍摄模块24、建立模块26和生成模块28,其中,获取模块22,用于在拍摄模式下,获取预设音频;拍摄模块24,用于在预设音频的时间轴上的时间点上拍摄图像;建立模块26,耦合至拍摄模块24,用于建立拍摄的图像与预设音频的时间轴上的时间点的映射关系;生成模块28,耦合至建立模块26,用于生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在映射关系。

图3是根据本发明实施例的媒体文件生成装置的可选结构框图一,如图3所示,可 选地,上述获取模块22包括:读取单元32和剪辑单元34,其中,读取单元32,用于根据用户输入的存储路径,读取存储路径指示的音频文件;剪辑单元34,耦合至读取单元32,用于剪辑音频文件,得到预设音频。

图4是根据本发明实施例的媒体文件生成装置的可选结构框图二,如图4所示,可选地,上述拍摄模块24包括:第一接收单元42和拍摄单元44,其中,第一接收单元42,用于接收用于指示生成媒体文件的指令;拍摄单元44,耦合至第一接收单元42,用于根据用于指示生成媒体文件的指令,在预设音频的时间轴上的时间点上拍摄图像。

图5是根据本发明实施例的媒体文件生成装置的可选结构框图三,如图5所示,可选地,上述生成模块28包括:第二接收单元52和生成单元54,其中,第二接收单元52,用于接收编辑指令,其中,编辑指令用于调整图像与预设音频的时间轴上时间点的对应关系,并更新映射关系;生成单元54,耦合至第二接收单元52,用于生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图像与预设音频存在更新后的映射关系。

可选地,上述生成模块28还用于生成媒体文件,其中,媒体文件为携带有图像、预设音频、映射关系和预设标识的一个媒体文件。

图6是根据本发明实施例的媒体文件生成装置的可选结构框图四,如图6所示,可选地,上述装置还包括:第一处理模块62和第二处理模块64,其中,第一处理模块62,耦合至生成模块28,用于读取文件,并判断文件是否为携带有预设标识的媒体文件;第二处理模块64,耦合至第一处理模块62,用于在判断到文件为携带有预设标识的媒体文件的情况下,播放预设音频,并在播放到预设音频的时间轴上的时间点时,根据映射关系显示对应的图像。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述模块分别位于多个处理器中。

本发明的实施例还提供了一种软件,该软件用于执行上述实施例及优选实施方式中描述的技术方案。

本发明的实施例还提供了一种存储介质。在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:

步骤S102,在拍摄模式下,获取预设音频;

步骤S104,在预设音频的时间轴上的时间点上拍摄图像;

步骤S106,建立拍摄的图像与预设音频的时间轴上的时间点的映射关系;

步骤S108,生成携带有图像和预设标识的媒体文件,其中,预设标识用于指示图 像与预设音频存在映射关系。

可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

为了使本发明实施例的描述更加清楚,下面结合可选实施例进行描述和说明。

本发明可选实施例以拍摄图像为三维图像(即3D照片)为例进行描述。需要说明的是,拍摄的图像也可以是二维图像,在本实施例中对此并不作限制。

本发明可选实施例提供的文件生成装置包括:左右摄像单元、音频接收单元、3D成像单元、图像音频处理单元、存储单元、显示单元、音频播放单元等部分。

另外,在文件生成装置中,还提供了一种拍照模式,该拍照模式的主界面上可以包括:添加录音、添加音乐的功能选项。

本发明可选实施例提供的媒体文件生成方法包括如下步骤:

步骤12,当不开启两个选项的时候,拍摄照片时直接通过左右摄像头生成3D照片;

步骤14,当开启添加录音功能时,拍摄3D照片的同时,界面出现录音的开始和结束开关,在拍摄3D照片的同时,录制音频信息,并将照片和音频信息进行映射对应(相当于上述第一映射关系),绑定保存;

步骤16,当开启添加音乐功能时,选择需要添加的音乐(相当于上述预设音频),并进行3D照片的拍摄,或者选择对应的3D照片,可以选择一张或者多张照片,同时将照片和音乐信息建立映射关系,绑定保存。

通过3D显示屏查看照片时,对于有音频和音乐信息的照片,通过特定的图标(相当于上述预设标识)进行标识。本发明可选实施例提供的查看图像的方法包括如下步骤:

步骤22,对于没有标识的3D照片,直接通过3D显示屏幕查看;

步骤24,对于有标识的照片,如果用户不想收听音频信息(相当于上述预设音频),不点击打开音频,直接进行3D照片的查看;

步骤26,对于有标识的3D照片,如果用户想收听音频信息,点击图标打开,如果是录制的音频信息,则查看3D图片的同时,播放录音信息;如果是音乐文件,则播放音乐的同时,显示照片信息,自动显示多张或者一张。

下面结合附图对本发明可选实施例进行说明。

本发明可选实施例主要是通过左右摄像单元、音频接收单元、3D成像单元、图像音频处理单元、存储单元、显示单元、音频播放单元等实现一种具有音频功能的3D拍 照方法,改变目前媒体形式单一、内容零散的情况,为用户带来更好的用户体验。

本发明可选实施例提供了一种媒体文件生成装置,图7是根据本发明可选实施例的媒体文件生成装置的结构框图,如图7所示,该装置包括:

左右摄像单元702,用于拍摄左右摄像头的照片;

音频接收单元704,用于添加音频信息;

3D成像单元706,耦合至左右摄像单元702,用于将左右摄像头拍摄的照片进行处理,得到3D图像;

图像音频处理单元708,耦合至音频接收单元704和3D成像单元706,用于将3D照片和音频建立对应映射关系;

存储单元710,耦合至图像音频处理单元708,用于存储绑定的3D照片和音频信息;

显示单元712,耦合至存储单元710,用于显示3D图像;

音频播放单元714,耦合至存储单元710,用于播放音频文件;

本发明可选实施例提供了一种基于上述的媒体文件生成方法的3D拍照方法。图8是根据本发明可选实施例的3D拍照方法的示意图,如图8所示,该方法包括以下步骤:

步骤S802,进入3D拍照模式,如果不需要添加音频文件,直接进行3D照片的拍摄;

步骤S804,如果要添加录音信息,则打开添加录音选项,在拍摄3D照片的同时,开始录制音频时,音频接收单元启用,录制相关的音频信息,录制完成可以手动结束,或者达到特定的时长自动结束录音;

步骤S806,如果要添加音乐信息,则打开添加音乐选项,选择需要添加的音乐,然后可以拍摄一张或者多张3D照片,或者从已有的图库中选择一张或者多张3D照片。

本发明可选实施例提供了一种媒体文件生成方法。图9是根据本发明可选实施例的媒体文件生成方法的示意图一,如图9所示,该方法包括以下步骤:

步骤S902,打开相机,进入3D拍照模式;

步骤S904,判断是否添加音频信息;

步骤S906,若不添加音频信息,则直接拍摄3D照片并进行保存;

步骤S908,若添加音频信息,判断是否添加音乐文件;

步骤S910,若不添加音乐文件,则添加录音信息,启动录音,开始拍照,达到设置的时长录音结束,或者可以手动结束录音;

步骤S912,若添加音乐文件,选择要添加的音乐,选择后可以对音乐进行快进、后退等试听操作;

步骤S914,在添加的音乐点开始拍照,可以连续拍摄多张照片,拍照结束时截取音乐结束。

本发明可选实施例结合3D照片的生成方法,提供了一种媒体文件生成方法。在生成3D照片时,可以通过左右摄像头得到了左右两张视图的照片,并且对两张视图进行处理,得到3D图像和音频文件,图10是根据本发明可选实施例的媒体文件生成方法的示意图二,如图10所示,该方法包括以下步骤:

步骤S1002,通过左摄像头拍摄左视图照片;

步骤S1004,通过右摄像头拍摄右视图照片;

步骤S1006,通过双目立体视觉算法,利用获取的左右视图,计算获得三维的深度信息生成3D照片,文件以多维编码的形式存储,同时将音频信息作为多一个维度插入编码;

步骤S1008,将3D照片的数据和音频数据的编码进行多维整合,在原来3D照片的多维数据矩阵中增加一维用来存储音频信息,对整个数据进行统一存储和读取。

获得3D照片和添加音频文件完成后,对相关的信息进行处理,建立3D照片和音频的映射关系,通过对应的映射表格将照片信息和音频信息绑定起来,进行统一存储到存储单元内。

本发明可选实施例中还提供了一种3D照片的浏览方法,其中,本实施例中的3D照片是指根据本发明实施例生成的媒体文件。图11是根据本发明可选实施例的3D照片浏览方法的示意图,如图11所示,该方法包括以下步骤:

步骤S1102,打开图库,查看3D照片;

步骤S1104,判断3D照片中是否包含音频信息,包含音频信息的照片在存储中会有一个标志位标识,在照片的缩略显示界面也有特殊的图标标识;

步骤S1106,通过3D显示单元,显示3D照片进行查看;

步骤S1108,判断音频文件是录音信息还是音乐信息,两种不同的音频信息在存储时通过标识加以区别;

步骤S1110,如果是录音信息,用户可以通过界面上的播放开关进行播放,如果打开播放开关,则在显示3D照片的同时,播放录制的音频信息,音频播放完成后自动切换到下一组,或者用户也可以手动切换到下一组;

步骤S1112,如果音频文件是音乐信息,用户同样可以通过界面上的播放开关进行 播放,打开开关后,在播放音乐的同时,显示绑定的一张或者多张3D照片,音乐播放完成后自动切换到下一组,或者用户也可以通过手动切换到下一组。

综上所述,通过本发明的上述实施例和可选实施例,新增了一种文件生成模式,首先能够实现照片(例如3D照片)的拍摄、存储和显示,并且可以为照片添加音频信息,使得媒体资料的信息更加丰富逼真;其次为照片添加的音频信息,可以包括录音和音乐两种形式,并且对于不同的形式具有不同的操作和处理流程,具有更好的扩展性和易用性;此外建立照片和音频信息的对应映射关系,进行绑定处理、存储和显示,使得一组媒体信息具有更高的完整性;并且音频和照片绑定时,不止局限为一张照片,还可以是多张照片,对于绑定的信息形成一组内容,在显示播放时具有更加丰富的形式;最后对于增加音频文件的分类、时长等细节信息进行了分析和处理,使得整个过程更加完整和全面。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1