媒体文件集合获取方法、装置、服务器及存储介质与流程

文档序号：16062432发布日期：2018-11-24 12:19阅读：150来源：国知局

本发明涉及计算机技术领域，特别涉及一种媒体文件集合获取方法、装置、服务器及存储介质。

背景技术

随着计算机技术的发展，人们越来越喜欢通过网络与其他人进行数据共享，例如，向他人共享自己媒体文件集合，该媒体文件集合可以是指自己的专辑，该专辑中可以包括自己的多个音频文件。人们可以通过在终端上进行操作，以获取媒体文件集合，之后可以将获取到的媒体文件集合分享给他人，由他人观看或收听媒体文件集合中的媒体文件。

目前，媒体文件集合获取方法通常是用户预先去录音棚，或通过终端或录音设备预先录制音频文件，然后通过音频处理软件，将多个音频文件获取为一个媒体文件集合。

在实现本发明的过程中，发明人发现相关技术至少存在以下问题：

用户需要预先录制好要获取为媒体文件集合中的音频文件，且需要自行对音频文件进行处理，获取媒体文件集合，用户操作复杂、难度高，上述方法中媒体文件集合的获取效率低。

技术实现要素：

本发明实施例提供了一种媒体文件集合获取方法、装置、服务器及存储介质，可以解决相关技术中用户操作复杂、难度高，媒体文件集合的获取效率低的问题。所述技术方案如下：

一方面，提供了一种媒体文件集合获取方法，所述方法包括：

在终端的用户进行直播的时间段内，接收所述终端发送的直播流，所述直播流包括至少一个直播流片段；

从所述直播流中，获取直播过程中播放的至少一个媒体资源对应的至少一个直播流片段，所述媒体资源是指在所述终端上进行播放以辅助所述用户进行直播的音频文件；

基于所述至少一个媒体资源对应的至少一个直播流片段，生成至少一个媒体文件；

基于所述至少一个媒体文件，获取媒体文件集合。

在一种可能实现方式中，所述从所述直播流中，获取直播过程中播放的至少一个媒体资源对应的至少一个直播流片段，包括：

对于所述至少一个媒体资源中的每个媒体资源，根据所述媒体资源在直播过程中的播放起始时间与播放终止时间，获取生成时间在所述播放起始时间与所述播放终止时间之间的至少一个直播流片段。

在一种可能实现方式中，所述基于所述至少一个媒体资源对应的至少一个直播流片段，生成至少一个媒体文件，包括：

对于所述至少一个媒体资源中的每个媒体资源，接收所述媒体资源对应的至少一个直播流片段对应的分数，所述分数用于表示直播流片段中所述用户的声音与所述媒体资源对应的原唱声音的相似度；

获取所述至少一个直播流片段对应的分数的和值；

当所述和值大于分数阈值，或所述和值与所述媒体资源对应的最大分数的比值大于比值阈值时，将所述至少一个直播流片段拼接为一个媒体文件。

在一种可能实现方式中，所述基于所述至少一个媒体资源对应的至少一个直播流片段，生成至少一个媒体文件之后，所述方法还包括：

将所述媒体文件和所述终端的用户进行直播时生成的本次直播的标识信息对应存储于媒体文件数据库中；

将所述至少一个媒体文件和所述终端的用户进行直播时生成的本次直播的标识信息对应存储于媒体文件数据库中；

相应地，所述基于所述至少一个媒体文件，获取媒体文件集合，还包括：

当接收到所述终端发送的直播结束通知时，根据所述本次直播的标识信息，从所述媒体文件数据库中提取所述标识信息对应的媒体文件；

当所述标识信息对应的媒体文件的数量大于数量阈值时，执行所述基于所述至少一个媒体文件，获取媒体文件集合的步骤。

在一种可能实现方式中，所述基于所述至少一个媒体文件，获取媒体文件集合，包括：

当接收到所述终端发送的直播结束通知时，向终端发送媒体文件集合的信息编辑通知；

当接收到所述终端发送的集合信息时，基于所述至少一个媒体文件的文件信息，生成媒体文件列表，所述媒体文件列表中每一项用于提供媒体文件的文件信息；

根据所述集合信息、所述媒体文件列表和所述至少一个媒体文件，获取媒体文件集合。

在一种可能实现方式中，所述向终端发送媒体文件集合的信息编辑通知之后，所述方法还包括：

当在预设时长内未接收到所述终端发送的集合信息时，基于所述至少一个媒体文件的文件信息，生成媒体文件列表；

根据预设的集合信息、所述媒体文件列表和所述至少一个媒体文件，获取媒体文件集合。

一方面，提供了一种媒体文件集合获取装置，所述装置包括：

接收模块，用于在终端的用户进行直播的时间段内，接收所述终端发送的直播流，所述直播流包括至少一个直播流片段；

获取模块，用于从所述直播流中，获取直播过程中播放的至少一个媒体资源对应的至少一个直播流片段，所述媒体资源是指在所述终端上进行播放以辅助所述用户进行直播的音频文件；

生成模块，用于基于所述至少一个媒体资源对应的至少一个直播流片段，生成至少一个媒体文件；

所述获取模块，还用于基于所述至少一个媒体文件，获取媒体文件集合。

在一种可能实现方式中，所述获取模块用于对于所述至少一个媒体资源中的每个媒体资源，根据所述媒体资源在直播过程中的播放起始时间与播放终止时间，获取生成时间在所述播放起始时间与所述播放终止时间之间的至少一个直播流片段。

在一种可能实现方式中，所述生成模块用于：

获取所述至少一个直播流片段对应的分数的和值；

当所述和值大于分数阈值，或所述和值与所述媒体资源对应的最大分数的比值大于比值阈值时，将所述至少一个直播流片段拼接为一个媒体文件。

在一种可能实现方式中，所述装置还包括：

存储模块，用于将所述至少一个媒体文件和所述终端的用户进行直播时生成的本次直播的标识信息对应存储于媒体文件数据库中；

相应地，所述获取模块还用于：

当接收到所述终端发送的直播结束通知时，根据所述本次直播的标识信息，从所述媒体文件数据库中提取所述标识信息对应的媒体文件；

当所述标识信息对应的媒体文件的数量大于数量阈值时，执行所述基于所述至少一个媒体文件，获取媒体文件集合的步骤。

在一种可能实现方式中，所述获取模块还用于：

当接收到所述终端发送的直播结束通知时，向终端发送媒体文件集合的信息编辑通知；

根据所述集合信息、所述媒体文件列表和所述至少一个媒体文件，获取媒体文件集合。

在一种可能实现方式中，所述获取模块还用于：

当在预设时长内未接收到所述终端发送的集合信息时，基于所述至少一个媒体文件的文件信息，生成媒体文件列表；

根据预设的集合信息、所述媒体文件列表和所述至少一个媒体文件，获取媒体文件集合。

一方面，提供了一种服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现所述媒体文件集合获取方法所执行的操作。

一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现所述媒体文件集合获取方法所执行的操作。

本发明实施例提供的技术方案带来的有益效果至少包括：

本发明实施例通过在用户进行直播的时间段内，根据接收到的直播流中的直播流片段，生成至少一个媒体文件，从而在用户结束直播后，将媒体文件获取为媒体文件集合，无需用户预先录制好多个音频文件，也无需用户自行通过音视频处理软件对预先录制好的音频文件进行处理，即可在直播后获取到媒体文件集合，有效地降低了用户操作的复杂度，提高了媒体文件集合的获取效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种媒体文件集合获取方法流程图；

图2是本发明实施例提供的一种媒体文件集合获取方法流程图；

图3是本发明实施例提供的一种媒体文件集合获取方法流程图；

图4是本发明实施例提供的一种媒体文件集合获取装置的结构示意图；

图5是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

图1是本发明实施例提供的一种媒体文件集合获取方法流程图，参见图1，该方法可以包括：

101、服务器在终端的用户进行直播的时间段内，接收该终端发送的直播流，该直播流包括至少一个直播流片段。

102、服务器从该直播流中，获取直播过程中播放的至少一个媒体资源对应的至少一个直播流片段，该媒体资源是指在该终端上进行播放以辅助该用户进行直播的音频文件。

103、服务器基于该至少一个媒体资源对应的至少一个直播流片段，生成至少一个媒体文件。

104、服务器基于该至少一个媒体文件，获取媒体文件集合。

在一种可能实现方式中，该从该直播流中，获取直播过程中播放的至少一个媒体资源对应的至少一个直播流片段，包括：

对于该至少一个媒体资源中的每个媒体资源，根据该媒体资源在直播过程中的播放起始时间与播放终止时间，获取生成时间在该播放起始时间与该播放终止时间之间的至少一个直播流片段。

在一种可能实现方式中，该基于该至少一个媒体资源对应的至少一个直播流片段，生成至少一个媒体文件，包括：

对于该至少一个媒体资源中的每个媒体资源，接收该媒体资源对应的至少一个直播流片段对应的分数，该分数用于表示直播流片段中该用户的声音与该媒体资源对应的原唱声音的相似度；

获取该至少一个直播流片段对应的分数的和值；

当该和值大于分数阈值，或该和值与该媒体资源对应的最大分数的比值大于比值阈值时，将该至少一个直播流片段拼接为一个媒体文件。

在一种可能实现方式中，该基于该至少一个媒体资源对应的至少一个直播流片段，生成至少一个媒体文件之后，该方法还包括：

将该媒体文件和该终端的用户进行直播时生成的本次直播的标识信息对应存储于媒体文件数据库中；

将该至少一个媒体文件和该终端的用户进行直播时生成的本次直播的标识信息对应存储于媒体文件数据库中；

相应地，该基于该至少一个媒体文件，获取媒体文件集合，还包括：

当接收到该终端发送的直播结束通知时，根据该本次直播的标识信息，从该媒体文件数据库中提取该标识信息对应的媒体文件；

当该标识信息对应的媒体文件的数量大于数量阈值时，执行该基于该至少一个媒体文件，获取媒体文件集合的步骤。

在一种可能实现方式中，该基于该至少一个媒体文件，获取媒体文件集合，包括：

当接收到该终端发送的直播结束通知时，向终端发送媒体文件集合的信息编辑通知；

当接收到该终端发送的集合信息时，基于该至少一个媒体文件的文件信息，生成媒体文件列表，该媒体文件列表中每一项用于提供媒体文件的文件信息；

根据该集合信息、该媒体文件列表和该至少一个媒体文件，获取媒体文件集合。

在一种可能实现方式中，该向终端发送媒体文件集合的信息编辑通知之后，该方法还包括：

当在预设时长内未接收到该终端发送的集合信息时，基于该至少一个媒体文件的文件信息，生成媒体文件列表；

根据预设的集合信息、该媒体文件列表和该至少一个媒体文件，获取媒体文件集合。

图2是本发明实施例提供的一种媒体文件集合获取方法流程图，参见图2，该方法可以包括以下步骤：

201、服务器在终端的用户进行直播的时间段内，接收该终端发送的直播流，该直播流包括至少一个直播流片段。

其中，直播是一种新兴的网络社交方式，它是多个用户可以在同一时间通过网络观看或收听同样的直播内容的一种社交方式。用户在该终端上进行操作，该终端可以向服务器发送网络直播请求，由该服务器为该用户创建直播房间，该直播房间是一种提供弹幕式音视频直播的在线虚拟房间，则该用户即为该直播房间的发起者，也即是主播，该主播可以在该直播房间中展示歌唱、游戏、电影、电视剧等音视频内容，其他用户也可以通过终端进入该直播房间，在该直播房间中观看或收听主播的展示内容，也可以与该主播进行互动，例如，点赞、为该主播送礼物、关注或者分享该主播、与该主播进行聊天等。

在本发明实施例中，在该终端的用户开始进行直播时，服务器可以为该终端的用户的本次直播生成标识信息，并记录本次直播的初始信息。其中，该标识信息用于唯一标识本次直播，当然，服务器还可以将该标识信息与该用户的账号对应存储。该初始信息可以包括开播时间或开播封面等，当然，也可以包括该用户的直播房间号、直播房间名称或其他信息，本发明实施例对此不作具体限定。用户可以在直播应用或直播门户网站中看到该初始信息，从而获知该用户的直播房间的相关信息，可以进入直播房间中观看或收听该用户的直播内容。

在该终端的用户进行直播的时间段内，终端可以采集该用户直播时的视频帧和音频帧，基于采集到的视频帧和音频帧生成直播流，并将该直播流发送给服务器，该服务器接收到该直播流，可以将该直播流转发给其他终端，也可以基于该直播流，获取媒体文件集合。该其他终端是指在上述正在直播的用户的直播房间内的用户所在终端，也可以是上述正在直播的用户的直播房间内的在线用户所在终端，本发明实施例对此不作限定。

其中，终端可以基于麦克风采集用户直播的音频帧，基于摄像头采集用户直播的视频帧，并对采集到的视频帧进行编码、流化和封装后得到视频流，对采集到的音频帧进行编码、流化和封装后得到音频流。在一种可能实现方式中，该终端也可以仅采集用户直播的音频帧，并对音频帧进行处理得到音频流，本发明实施例对此不作限定。以下均以该终端采集用户直播的视频帧和音频帧为例进行说明。

终端还可以为采集到的每个视频帧和音频帧打上时间戳，该时间戳用于指示该视频帧或音频帧在直播流中的时间信息，后续终端或服务器可以基于该时间戳，确定视频帧或音频帧的播放顺序。在一种可能实现方式中，终端可以与服务器之间进行交互，以服务器的时间为准，为采集到的视频帧或音频帧打时间戳，当然，也可以基于该终端的系统时间，本发明实施例对此不作限定。

在本发明实施例中，该终端的用户可以在终端中进行播放媒体资源操作，从而该终端可以通过与服务器进行交互，获取到媒体资源，并播放该媒体资源，该媒体资源是指在该终端上进行播放以辅助该用户进行直播的音频文件。具体地，该终端可以向服务器发送媒体资源获取请求，该服务器接收到该媒体资源获取请求时，可以向终端发送该媒体资源。该终端接收到该媒体资源，可以播放该媒体资源，用户可以在该媒体资源播放过程中进行表演，从而服务器可以接收到该用户的表演的数据，例如，该媒体资源可以是歌曲的伴奏文件，用户可以在伴奏文件播放过程中进行演唱。

在一种可能实现方式中，当服务器接收到该媒体资源获取请求时，可以记录该媒体资源的名称、该媒体资源的作者以及该用户的账号信息等，也可以将上述记录信息与本次直播开始时生成的标识信息相关联，本发明实施例对此不作限定。相应地，该服务器接收到的终端发送的直播流中的音频帧中除了用户的声音外，还可以包括采集到的媒体资源的音频，具体地，终端可以采集用户的声音以及该媒体资源的音频，并将该用户的声音与该媒体资源的音频合成为音频帧。同理地，终端可以为该合成后的音频帧打上时间戳，以便于后续确定该直播流中音频帧的播放情况。

例如，用户(主播)开始进行直播时，服务器为该主播创建直播房间，并生成标识信息，该主播在直播期间可以选择一首歌曲的伴奏，终端可以从服务器获取该歌曲的伴奏文件，并播放该伴奏文件。该服务器可以记录该伴奏文件的歌曲名称、歌手信息以及该主播的信息，并将这些信息与标识信息相关联，在伴奏文件播放期间，该用户可以跟着伴奏进行演唱，终端可以持续向服务器发送直播流片段，该直播流片段是指该用户直播过程中的部分直播流。在一种可能实现方式中，该终端可以根据该伴奏的歌词，在获取到每一句歌词所对应的直播流片段后，将该直播流片段发送至服务器，当然，该用户在直播的时间段内选择多首歌曲的伴奏，对于每一首歌曲的伴奏，终端与服务器之间的交互情况以及终端或服务器所执行的操作均同理，从而服务器可以获取到用户进行直播的时间段内的直播流。

202、服务器从该直播流中，获取直播过程中播放的至少一个媒体资源对应的至少一个直播流片段。

该用户在直播的时间段内可能选择了多个媒体资源，每个媒体资源可能对应于至少一个直播流片段，服务器可以获取每个媒体资源对应的至少一个直播流片段。在一种可能实现方式中，该服务器可以获取直播过程中播放的所有媒体资源对应的至少一个直播流片段，也可以获取直播过程中播放的部分媒体资源对应的至少一个直播流片段，本发明实施例对此不作限定。具体地，对于该至少一个媒体资源中的每个媒体资源，服务器可以根据每个媒体资源在直播过程中的播放起始时间与播放终止时间，获取生成时间在该播放起始时间与该播放终止时间之间的至少一个直播流片段。

例如，终端在播放某个歌曲的伴奏文件前，可以向服务器发送伴奏文件播放开始通知，以通知服务器开始播放伴奏文件，则服务器可以确定当前时间点为该伴奏文件的播放起始时间，该播放起始时间点后的某段时间内的直播流片段即为该伴奏文件对应的直播流片段，在该伴奏文件播放结束时，终端可以在向服务器发送该伴奏文件的最后一个直播流片段时，还可以向服务器发送伴奏文件播放结束通知，以通知该服务器该伴奏文件已经播放结束，从而服务器可以确定生成时间在该伴奏文件的播放起始时间至播放终止时间之间的直播流片段即为该伴奏文件对应的直播流片段。在一种可能实现方式中，该直播流中的视频帧和音频帧均携带有时间戳，服务器可以根据该时间戳确定生成时间在该伴奏文件的播放起始时间和终止时间之间的直播流片段。

在一种可能实现方式中，服务器可以将终端播放该媒体资源的时间段内接收到的直播流片段存储到本地文件中，并在确定该媒体资源播放结束时，获取本地文件中的至少一个直播流片段作为该媒体资源对应的至少一个直播流片段。

203、服务器基于该至少一个媒体资源对应的至少一个直播流片段，生成至少一个媒体文件。

在本发明实施例中，服务器可以将获取到的至少一个媒体资源中每个媒体资源对应的至少一个直播流片段拼接为媒体文件，其中，每个媒体文件与一个媒体资源对应，从而实现基于直播流片段，生成至少一个完整的媒体文件，以便于后续再基于该媒体文件进行处理。

在一种可能实现方式中，该步骤203中，对于该至少一个媒体资源中的每个媒体资源，服务器可以基于直播流片段中视频帧和音频帧中的时间戳，确定各个直播流片段的播放顺序，从而根据该播放顺序，将该至少一个直播流片段拼接为一个媒体文件。

可选地，该终端向服务器发送的直播流片段可能也不完全与媒体资源的播放时间段对应，例如，终端向服务器发送的某个直播流片段中，该媒体资源是从该直播流片段对应的时间段的中间时刻开始播放的，或者在某个直播流片段中，该媒体资源被停止播放过一段时间。为了提高该媒体文件的播放效果，服务器还可以根据该直播流片段中媒体资源的播放情况，对该至少一个直播流片段进行切割，将该媒体资源的播放过程中对应的视频帧和音频帧按照时间戳的顺序拼接为一个媒体文件。

通过上述获取到媒体资源对应的直播流片段，并基于直播流片段，生成媒体文件的过程，可以将用户直播期间的音视频按照媒体资源，拼接得到至少一个媒体文件，该媒体文件为完整的媒体资源，后续可以将该媒体文件合成为一个媒体文件集合，从而用户可以在后续观看或收听该媒体文件集合中的媒体文件。

在一种可能实现方式中，为了提高后续获取的媒体文件集合的播放质量，在上述生成媒体文件的过程中，可以设置分数阈值或用于体现分数等级的比值阈值，基于每个媒体资源对应的至少一个直播流片段的分数与该分数阈值的关系或直播流片段的分数比值与比值阈值的关系，来确定是否将该至少一个直播流片段获取为一个媒体文件，也即确定了是否将这一个媒体资源对应的至少一个直播流片段作为后续媒体文件集合中包括的内容。

具体地，该步骤203中对于每个媒体资源，服务器还可以执行下述步骤(1)至步骤(3)，生成媒体文件：

(1)对于该至少一个媒体资源中的每个媒体资源，服务器还可以接收该媒体资源对应的至少一个直播流片段对应的分数，该分数用于表示直播流片段中该用户的声音与该媒体资源对应的原唱声音的相似度。

在该步骤(1)中，终端在步骤201中向服务器发送直播流时，在该终端播放媒体资源时，终端还可以对该媒体资源播放期间的直播流片段进行评分，得到每个直播流片段对应的分数，并将该分数发送至服务器，这样服务器可以接收到直播流片段以及对应的分数。

具体地，终端在向服务器发送媒体资源获取请求，由服务器发送媒体资源至该终端时，终端还可以获取到该媒体资源对应的评分规则，终端在采集到用户的声音后，可以基于该评分规则进行评分，从而得到该媒体资源对应的各个直播流片段对应的分数。其中，该评分规则可以由相关技术人员预先设置，该媒体资源中不同片段的评分规则也可以不同。

例如，对于某个伴奏文件中的某一句歌词对应的评分规则可以包括有一个高音，有一个转音等，如果采集到的用户声音中符合该评分规则，这一句歌词对应的直播流片段对应的分数则会比较高。当然，该终端也可以从服务器获取到该媒体资源的原唱音频，通过对用户的声音和原唱音频中的原唱声音进行相似度计算，确定直播流片段对应的分数，本发明实施例对此不作限定。

在一种可能实现方式中，为了提高直播内容的实时性，终端可以通过一个接口向服务器发送直播流片段，并在获取到直播流片段对应的分数后，通过另一个接口向该服务器发送该直播流片段对应的分数。

(2)服务器获取该至少一个直播流片段对应的分数的和值。

对于每一个媒体资源，服务器可以在该媒体资源播放结束后，获取该媒体资源对应的至少一个直播流片段对应的分数的和值，从而获取到该用户在该媒体资源播放期间的总评分，从而可以基于该评分，来确定用户表现的好坏，从而确定是否将这个媒体资源对应的用户的直播情况作为媒体文件集合中的一项。

例如，服务器在某首歌曲的伴奏文件播放结束后，将该歌曲的每一句歌词用户的分数进行求和，得到该用户演唱该歌曲获得的总分数。

(3)当该和值大于分数阈值，或该和值与该媒体资源对应的最大分数的比值大于比值阈值时，将该至少一个直播流片段拼接为一个媒体文件。

其中，该分数阈值或比值阈值均可以由相关技术人员预先设置，本发明实施例对此不作限定。该和值大于分数阈值，或该和值与该媒体资源对应的最大分数的比值大于比值阈值时，可以确定该至少一个直播流片段中用户的表现比较好，可以将该部分内容作为媒体文件集合中的一项，因此，可以执行直播流片段拼接步骤，得到媒体文件，以便在后续将其作为媒体文件集合中的一项。

在一种可能实现方式中，当该和值小于或等于分数阈值，或该和值与该媒体资源对应的最大分数的比值大于比值阈值时，服务器可以不执行上述将该至少一个直播流片段拼接为一个媒体文件的步骤，也即是不执行上述基于该媒体资源对应的至少一个直播流片段，生成一个媒体文件的步骤。对应于上述步骤202，服务器还可以将该至少一个直播流片段从本地文件中删除。在一种可能实现方式中，该比值阈值还可以表示为分数等级，例如，s级、ss级、sss级等,本发明实施例对此不作具体限定。

例如，可以设置有分数等级高于s级时可以进行上述媒体文件生成步骤，用户演唱一首歌，服务器通过获取总评分，并进行比值计算等，得到这个歌的分数等级为ss级，ss级高于s级，则服务器通过上述媒体文件生成步骤，得到这首歌对应的媒体文件。

通过上述分数阈值、比值阈值或分数等级的设置，可以确定需要对本次直播过程中的媒体资源中哪些媒体资源对应的直播流片段进行拼接步骤，得到媒体文件，这样可以保证媒体文件集合中的媒体文件的质量，以提高用户在观看或收听该媒体文件集合中的媒体文件时的观看或收听体验，也无需用户自行将质量不好的媒体文件在后续进行删除操作，提高了用户操作的便捷性。

在一种可能实现方式中，对于每个媒体资源，通过上述过程，服务器生成至少一个媒体文件后，还可以将该至少一个媒体文件和该终端的用户进行直播时生成的本次直播的标识信息对应存储于媒体文件数据库中。服务器可以基于终端发送的直播流片段，获取到媒体文件，从而将媒体文件与该终端的直播的标识信息对应存储，从而在后续获取媒体文件集合时，可以基于每次直播的标识信息，获取到相应的媒体文件，避免了出现媒体文件的丢失现象，也提高了媒体文件存储的有序性。

当然，服务器在存储该媒体文件时，还可以将该媒体文件、该用户的信息、该媒体文件对应的媒体资源的信息以及该媒体文件的分数和值或上述比值或上述分数等级等对应存储，以保证该媒体文件的相关信息的全面性和丰富性。

204、当接收到该终端发送的直播结束通知时，服务器向终端发送媒体文件集合的信息编辑通知。

该终端的用户可以在终端上进行结束直播操作，终端在检测到该结束直播操作时，可以向服务器发送直播结束通知，服务器接收到该直播结束通知时，可以基于本次直播的过程中获取到的媒体文件，获取媒体文件集合，以便于后续该用户或其他用户可以观看或收听本次直播中的媒体文件。

在本发明实施例中，媒体文件集合除了包括媒体文件之外，还可以包括集合信息，例如，该媒体文件集合的名称、该媒体文件集合的封面或该媒体文件集合的说明标签等，当然，该集合信息也可以是其它信息，本发明实施例对此不作限定。服务器可以在直播结束后，向终端发送信息编辑通知，用于提示用户对集合信息进行编辑。

在一种可能实现方式中，该步骤204中，服务器接收到该直播结束通知时，还可以更新本次直播的信息，例如，可以记录本次直播的停播时间或直播时长等信息。服务器也可以将本次直播的信息与本次直播的标识信息对应存储。当然，服务器也可以将本次直播的信息与该用户的账号对应存储，本发明实施例对此不作限定。

205、当接收到该终端发送的集合信息时，服务器基于该至少一个媒体文件的文件信息，生成媒体文件列表，该媒体文件列表中每一项用于提供媒体文件的文件信息。

在上述步骤204后，终端接收到服务器发送的信息编辑通知时，可以在界面中显示信息编辑提示信息，具体地，该终端可以将界面跳转到信息编辑界面，在该信息编辑界面中包括集合编辑选项，从而用户可以在该信息编辑界面中进行信息编辑操作，也即是填写或选择集合信息。当然，该终端也可以不进行界面跳转，直接在当前界面中显示信息编辑弹窗，用户可以在信息编辑弹窗中进行集合信息的信息编辑操作，或终端也可以通过其他方式提示用户，本发明实施例对此不作限定。

终端获取到用户编辑的集合信息后，可以将集合信息发送至服务器，服务器接收到该集合信息，则可以执行获取媒体文件集合的步骤。上述步骤203中，服务器在生成该媒体文件后，将该媒体文件存储于媒体文件数据库时，还可以将该媒体文件对应的媒体资源的信息或该终端的用户的信息等与该媒体文件对应存储。服务器可以从上述媒体文件数据库中，提取本次直播过程中获取到的媒体文件的文件信息。则相应地，该文件信息可以包括该媒体文件对应的媒体资源的信息，例如，媒体资源的名称、媒体资源的作者等。该文件信息还可以包括该终端的用户的信息，例如，该用户的名称，当然，该文件信息还可以包括其他信息，本发明实施例对此不作限定。服务器可以基于提取到的文件信息，生成媒体文件列表，该媒体文件列表中每一项用于提供媒体文件的文件信息，通过该媒体文件列表，可以获知媒体文件集合中具体包括哪些媒体文件或每个媒体文件的文件信息等。

206、服务器根据该集合信息、该媒体文件列表和该至少一个媒体文件，获取媒体文件集合。

服务器获取到媒体文件集合的集合信息，也获取到媒体文件列表，服务器也在之前获取到了该媒体文件列表对应的媒体文件，则可以根据这些数据，生成一个媒体文件集合。在一种可能实现方式中，服务器还可以在该媒体文件集合的集合信息中记录有本次直播的标识信息。服务器还可以将该媒体文件集合与该终端的用户的账号对应存储，其他终端可以从服务器中获取到该媒体文件集合，从而该用户或该用户的粉丝用户可以在该用户的作品列表中看到该媒体文件集合的集合信息，并可以对该媒体文件集合进行观看或收听操作，以观看或收听该媒体文件集合。

例如，服务器可以在某个用户(主播)直播期间，获取到多个媒体文件，每个媒体文件对应于该用户唱的每首歌，则服务器可以将其获取为一个音乐专辑，从而该用户或该用户的粉丝可以在该用户的专辑中观看或收听该音乐专辑。

在一种可能实现方式中，在上述步骤205中，当在预设时长内未接收到该终端发送的集合信息时，服务器还可以基于该至少一个媒体文件的文件信息，生成媒体文件列表，从而根据预设的集合信息、该媒体文件列表和该至少一个媒体文件，获取媒体文件集合。该预设时长可以由相关技术人员预先设置，该预设的集合信息可以是用户预先设置的集合信息，也可以是该服务器中存储的默认的集合信息，本发明实施例对该预设时长的取值和该预设的集合信息不作限定。

上述步骤204之步骤206为基于该至少一个媒体文件，获取媒体文件集合的过程，上述过程中，用户结束直播后，服务器即为该用户获取媒体文件集合，而无需用户预先录制好多个音频文件，也无需用户自行通过音视频处理软件对预先录制好的音频文件进行处理，即可在直播后获取到媒体文件集合，有效地降低了用户操作的复杂度，提高了媒体文件集合的获取效率。

上述仅以该服务器向该终端发送信息编辑通知为例进行说明，在一种可能实现方式中，服务器还可以将先执行步骤205中生成媒体文件列表的步骤，然后将该媒体文件列表发送至该终端，由该用户通过对该媒体文件列表所包括的文件信息进行删减，对媒体文件进行删减，从而确定该媒体文件集合中包括的媒体文件，本发明实施例对此不作具体限定。

在一种可能实现方式中，对应于上述步骤203中将媒体文件与本次直播的标识信息对应存储的步骤，上述步骤205和步骤206还可以为：当接收到该终端发送的直播结束通知时，服务器可以根据该本次直播的标识信息，从该媒体文件数据库中提取该标识信息对应的媒体文件；当该标识信息对应的媒体文件的数量大于数量阈值时，执行该基于生成的至少一个媒体文件，获取媒体文件集合的步骤。在一种可能实现方式中，该数量阈值可以为零，也即是媒体文件的数量大于或等于一时，服务器即可执行基于该至少一个媒体文件，获取媒体文件集合的步骤。相应地，当该媒体文件的数量等于零时，服务器则获取不到媒体文件，也无需获取媒体文件集合，则可以不执行上述步骤204至步骤206。当然，该数量阈值也可以是其它数值，本发明实施例对该数量阈值的具体取值不作限定。

下面以一示例对上述媒体文件集合获取方法中终端与服务器之间的具体交互情况进行说明。图3是本发明实施例提供的一种媒体文件集合获取方法流程图，参见图3，该方法可以包括以下步骤：

301、当该终端的用户开始直播时，终端向服务器发送直播流片段。

该终端的用户即为主播，为本次直播的直播房间的发起者。该直播流片段是指用户在终端还没有播放媒体资源时的直播数据。

302、当服务器接收到该终端发送的直播流片段时，服务器将该直播流片段转发给其他终端。

该其他终端可以是进入主播的直播房间观看直播内容的用户所在终端。服务器将该直播流片段转发给其他终端，则该其他终端的用户可以观看到主播的直播内容。

303、终端向服务器发送媒体资源获取请求。

该步骤303可以由用户(主播)在终端上进行的播放媒体资源操作触发。例如，该媒体资源可以是指歌曲的伴奏文件。

304、当接收到终端发送的媒体资源获取请求时，服务器向该终端发送该媒体资源。

服务器还可以向该终端发送该媒体资源对应的评分规则，以便于终端基于该评分规则，为采集到的主播的声音进行评分，得到直播流片段对应的分数。

305、当终端接收到该媒体资源时，终端播放该媒体资源，并在播放该媒体资源的时间段内向服务器发送直播流片段和该直播流片段对应的分数。

306、服务器接收该终端发送的该媒体资源播放的时间段内的直播流片段和对应的分数。

307、当接收到终端发送的媒体资源播放结束通知时，服务器获取该媒体资源对应的至少一个直播流片段对应的分数的和值。

308、当该和值大于分数阈值，或该和值与该媒体资源对应的最大分数的比值大于比值阈值时，服务器将该至少一个直播流片段拼接为一个媒体文件。

309、服务器将该媒体文件和该终端的用户进行直播时生成的本次直播的标识信息对应存储于媒体文件数据库中。

上述步骤301至步骤309为在终端的用户进行直播的时间段内，接收该终端发送的直播流；从该直播流中，获取直播过程中播放的每个媒体资源对应的至少一个直播流片段；对于每个媒体资源，基于该媒体资源对应的至少一个直播流片段，生成一个媒体文件的过程，且该过程中在该服务器中设置有分数阈值或比值阈值，在媒体资源对应的至少一个直播流片段的分数的和值符合条件时，服务器才将该至少一个直播流片段拼接为一个媒体文件，并将该媒体文件存储于媒体文件数据库中。上述步骤303至步骤309仅对获取一个媒体文件的过程为例进行说明，当该用户再次选择播放一个媒体资源时，终端和服务器可以执行与上述步骤303与步骤309同理的步骤，获取到其它媒体文件，在此不多做赘述。

310、当终端的用户结束直播时，服务器根据本次直播的标识信息，从该媒体文件数据库中提取该标识信息对应的媒体文件。

311、当该标识信息对应的媒体文件的数量大于或等于一时，服务器向终端发送媒体文件集合的信息编辑通知。

当该媒体文件的数量为零时，则服务器无需获取媒体文件集合，也就无需执行该步骤311，终端或服务器也无需执行下述步骤312至步骤315。

312、当接收到该信息编辑通知时，终端在界面中显示信息编辑提示信息。

313、当终端在预设时长内检测到信息编辑操作时，终端获取该信息编辑操作对应的集合信息，并向服务器发送该集合信息。

314、当接收到该终端发送的集合信息时，服务器基于该至少一个媒体文件的文件信息，生成媒体文件列表，该媒体文件列表中每一项用于提供媒体文件的文件信息；

315、服务器根据该集合信息、该媒体文件列表和该至少一个媒体文件，获取媒体文件集合。

该步骤313至步骤315为在预设时长内用户进行了信息编辑操作的情况，在一种可能实现方式中，在预设时长内该用户还可能没有进行信息编辑操作。在这种实现方式中，当在预设时长内未接收到该终端发送的集合信息时，服务器可以基于该至少一个媒体文件的文件信息，生成媒体文件列表，服务器可以根据预设的集合信息、媒体文件列表和该至少一个媒体文件，获取媒体文件集合。

上述所有可选技术方案，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。

图4是本发明实施例提供的一种媒体文件集合获取装置的结构示意图，参见图4，该装置包括：

接收模块401，用于在终端的用户进行直播的时间段内，接收该终端发送的直播流，该直播流包括至少一个直播流片段；

获取模块402，用于从该直播流中，获取直播过程中播放的至少一个媒体资源对应的至少一个直播流片段，该媒体资源是指在该终端上进行播放以辅助该用户进行直播的音频文件；

生成模块403，用于基于该至少一个媒体资源对应的至少一个直播流片段，生成至少一个媒体文件；

该获取模块402，还用于基于该至少一个媒体文件，获取媒体文件集合。

在一种可能实现方式中，该获取模块402用于对于该至少一个媒体资源中的每个媒体资源，根据该媒体资源在直播过程中的播放起始时间与播放终止时间，获取生成时间在该播放起始时间与该播放终止时间之间的至少一个直播流片段。

在一种可能实现方式中，该生成模块403用于：

获取该至少一个直播流片段对应的分数的和值；

当该和值大于分数阈值，或该和值与该媒体资源对应的最大分数的比值大于比值阈值时，将该至少一个直播流片段拼接为一个媒体文件。

在一种可能实现方式中，该装置还包括：

存储模块，用于将该至少一个媒体文件和该终端的用户进行直播时生成的本次直播的标识信息对应存储于媒体文件数据库中；

相应地，该获取模块402还用于：

当接收到该终端发送的直播结束通知时，根据该本次直播的标识信息，从该媒体文件数据库中提取该标识信息对应的媒体文件；

当该标识信息对应的媒体文件的数量大于数量阈值时，执行该基于该至少一个媒体文件，获取媒体文件集合的步骤。

在一种可能实现方式中，该获取模块402还用于：

当接收到该终端发送的直播结束通知时，向终端发送媒体文件集合的信息编辑通知；

根据该集合信息、该媒体文件列表和该至少一个媒体文件，获取媒体文件集合。

在一种可能实现方式中，该获取模块402还用于：

当在预设时长内未接收到该终端发送的集合信息时，基于该至少一个媒体文件的文件信息，生成媒体文件列表；

根据预设的集合信息、该媒体文件列表和该至少一个媒体文件，获取媒体文件集合。

本发明实施例提供的装置通过在用户进行直播的时间段内，根据接收到的直播流中的直播流片段，生成至少一个媒体文件，从而在用户结束直播后，将媒体文件获取为媒体文件集合，无需用户预先录制好多个音频文件，也无需用户自行通过音视频处理软件对预先录制好的音频文件进行处理，即可在直播后获取到媒体文件集合，有效地降低了用户操作的复杂度，提高了媒体文件集合的获取效率。

需要说明的是：上述实施例提供的媒体文件集合获取装置在获取媒体文件集合时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的媒体文件集合获取装置与媒体文件集合获取方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图5是本发明实施例提供的一种服务器的结构示意图，该服务器500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(centralprocessingunits，cpu)501和一个或一个以上的存储器502，其中，该存储器502中存储有至少一条指令，该至少一条指令由该处理器501加载并执行以实现上述各个方法实施例提供的方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括指令的存储器，上述指令可由处理器执行以完成上述实施例中的媒体文件集合获取方法。例如，该计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

上述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄桂志
技术所有人：广州酷狗计算机科技有限公司
我是此专利的发明人

上一篇：一种用于激光直接成像光刻的对准镜头的制作方法
上一篇：反压式固液压榨分离机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。