一种音视频文件同时播放的方法、装置和系统的制作方法

文档序号：10474177阅读：431来源：国知局

一种音视频文件同时播放的方法、装置和系统的制作方法
【专利摘要】本发明公开了一种音视频文件同时播放的方法、装置和系统，包括：在播放视频文件的过程中，同步获取用户输入的语音数据，将输入起始时刻对应在所述视频文件的时间点作为时间戳与所述语音数据一起保存为音频文件；将音频文件发送至网络服务器；再次播放所述视频文件时，从网络服务器获取所述音频文件；当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据。本发明提供的一种音视频文件同时播放的方法、装置、系统，通过获取用户在观看视频文件时同步录制的语音数据作为音频文件，使得后续用户再次播放该视频文件时可以同时收听到在前用户的语音评论内容，丰富了网络视频播放的功能。
【专利说明】
一种音视频文件同时播放的方法、装置和系统
技术领域
[0001]本发明涉及多媒体播放控制领域，特别是指一种音视频文件同时播放的方法、装置和系统。
【背景技术】
[0002]随着视频播放技术的不断进步和人们社交愿望的不断提升，网络视频不再局限于传播信息的媒介，逐渐发展为人们表达观点，抒发情感的桥梁;而促使这一转变完成的一个重要工具就是视频弹幕系统。现有的弹幕系统，将用户输入的文字评论按照输入时视频文件的播放时间进行记录，并在该视频文件再次被播放时，以滚动字幕的形式展示在视频播放页面上，这些评论大多诙谐幽默，其他用户在观看视频内容之余，浏览其他用户发布的弹幕，更添乐趣。
[0003]现有的弹幕技术仅应用于文字评论的同步播放，而对于语音评论则无法与视频进行同步播放，即如果用户想听某段语音评论，只能通过暂停当下播放的视频来实现，操作比较麻烦，用户体验度不高。

【发明内容】

[0004]有鉴于此，本发明实施例的目的在于提出一种音视频文件同时播放的方法、装置和系统，可应用在手机、平板电脑、计算机、TV、车载系统等终端中。
[0005]基于上述目的本发明提供的一种音视频文件同时播放的方法，应用于终端，包括:
[0006]在播放视频文件的过程中，同步获取用户输入的语音数据，将输入所述语音数据的起始时刻对应的所述视频文件的时间点作为时间戳与所述语音数据一起保存为音频文件；
[0007]将所述音频文件发送至网络服务器；
[0008]接收所述视频文件的播放请求，从网络服务器同步获取所述音频文件；
[0009]当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据。
[0010]可选的，所述当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据，包括:
[0011]提取所述音频文件中的时间戳；
[0012]将所述时间戳作为播放语音数据的标记加入所述视频文件的播放时间轴；
[0013]当视频文件的播放进度达到所述时间戳时，播放该时间戳所属音频文件中的语音数据。
[0014]可选的，所述当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据，包括:
[0015]提取所述音频文件中的时间戳；
[0016]按照时间戳由前到后的顺序对所述音频文件进行排序；
[0017]按照排序后音频文件的顺序，依次判断视频文件的播放进度是否达到所述音频文件的时间戳标记的时间点;若达到，播放所述时间戳所属音频文件中的语音数据。
[0018]可选的，所述音频文件还包括创建者的用户名，所述接收所述视频文件的播放请求，从网络服务器同步获取所述音频文件，包括:
[0019]所述播放请求中包含某些音频文件创建者的用户名；
[0020]从服务器获取由所述用户名对应的用户创建的音频文件。
[0021]可选的，所述再次播放所述视频文件时，从网络服务器获取所述音频文件后，包括:
[0022]根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段；
[0023]根据所述声音片段的声音情况，对所述语音数据进行调整。
[0024]可选的，所述根据所述声音片段的声音情况，对所述语音数据进行调整，包括:
[0025]计算所述声音片段的平均音量和所述语音数据的平均音量；
[0026]判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若是，对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。
[0027]可选的，所述视频文件预设重要情节时间段;所述再次播放所述视频文件时，从网络服务器获取所述音频文件后，包括:
[0028]根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若是，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。
[0029]可选的，所述根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内，包括:
[0030]获取所述语音数据的起始时间^和终止时间Ae3;
[0031 ]获取所述重要情节时间段的起始时间Bs和终止时间Be;
[0032]判断是否满足:As处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于或等于Bs且Ae大于或等于Be;若是，判定所述语音数据处于所述重要情节时间段内；
[0033]所述更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外，包括:
[0034]判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系；
[0035]若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae3-Bs;
[0036]若(Ae+As)/2的结果大于或等于(Be+Bs)/2的结果，将所述时间戳后移Be-As。
[0037]可选的，所述当所述视频文件播放至所述时间戳标识的时间点时，播放所述音频文件，包括:
[0038]获取音量调整指令，根据所述音量调整指令对所述音频数据的音量进行调整。
[0039]本发明还提供一种音视频文件同时播放的装置，包括:
[0040]音频文件获取单元，用于在播放视频文件的过程中，同步获取用户输入的语音数据，将输入起始时刻对应在所述视频文件的时间点作为时间戳与所述语音数据一起保存为音频文件；
[0041]第一网络单元，用于将所述音频文件发送至网络服务器;还用于需要与所述视频文件同时播放所述音频文件时，从网络服务器获取所述音频文件；
[0042]音频文件播放单元，用于当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据。
[0043]可选的，所述音频文件播放单元用于提取所述音频文件中的时间戳;将所述时间戳作为播放语音数据的标记加入所述视频文件的播放时间轴；当视频文件的播放进度达到所述时间戳时，播放该时间戳所属音频文件中的语音数据。
[0044]可选的，所述音频文件播放单元用于提取所述音频文件中的时间戳;按照时间戳由前到后的顺序对所述音频文件进行排序;按照排序后音频文件的顺序，依次判断视频文件的播放进度是否达到所述音频文件的时间戳标记的时间点；若达到，播放所述时间戳所属音频文件中的语音数据。
[0045]可选的，所述第一网络单元用于向网络服务器发送包含用户名的音频文件获取请求;接收网络服务器返回的，由这些用户名对应的用户创建的音频文件。
[0046]可选的，所述终端还包括:
[0047]第一音量处理单元，用于根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段;还用于根据所述声音片段的声音情况，对所述语音数据进行调整。
[0048]可选的，所述第一音量处理单元还用于计算所述声音片段的平均音量和所述语音数据的平均音量;判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若是，对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。
[0049]可选的，所述视频文件预设重要情节时间段;终端还包括:
[0050]第一重要情节处理单元，用于根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若是，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。
[0051]可选的，所述第一重要情节处理单元用于获取所述语音数据的起始时间As和终止时间Ae;获取所述重要情节时间段的起始时间Bs和终止时间Be;判断是否满足:AS处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于或等于Bs且Ae大于或等于Be;若是，判定所述语音数据处于所述重要情节时间段内；
[0052]所述第一重要情节处理单元还用于判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系;若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae3-Bs;若(Ae3+As)/2的结果大于(Be+Bs)/2的结果，将所述时间戳后移H
[0053]可选的，所述终端还包括:
[0054]音量调整单元，用于获取音量调整指令，根据所述音量调整指令对所述音频数据的音量进行调整。
[0055]本发明还提供一种音视频文件同时播放的方法，应用于网络服务器，包括:
[0056]接收由终端发送的音频文件;所述音频文件包括用户在播放视频文件的过程中同步输入的语音数据和所述语音数据的输入起始时刻在终端正在播放的视频文件中对应时间点的时间戳；
[0057]建立所述音频文件和所述视频文件的关联；
[0058]所述视频文件再次被播放时，查找与所述视频文件关联的所述音频文件，将所述音频文件发送至播放所述视频文件的用户。
[0059]可选的，所述视频文件在网络服务器预设有关联列表;所述建立所述音频文件和所述视频文件的关联，包括:
[0060]将所述音频文件的名称添加至所述视频文件的关联列表中。
[0061]可选的，所述音频文件还包括创建者的用户名，所述关联列表内的音频名称按照所述用户名进行分组;所述将所述音频文件的音频名称添加至所述关联列表中，包括:
[0062]在所述关联列表内查找所述音频文件创建者的用户名；
[0063]若找到所述用户名，将所述音频文件的名称添加至所述用户名的分组内；若未找到，建立所述用户名的新分组，将所述音频文件的名称添加至所述新分组内；
[0064]所述视频文件再次被播放时，查找与视频文件关联的音频文件，发送至播放所述视频文件的用户，包括:
[0065]获取终端发送的包含用户名的音频文件获取请求；
[0066]在所述视频文件的关联列表中查找所述用户名，将所述用户名对应分组内的音频文件发送至所述终端。
[0067]可选的，所述建立所述音频文件和所述视频文件的关联后，包括:
[0068]根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段；
[0069]根据所述声音片段的声音情况，对所述语音数据进行调整。
[0070]可选的，所述根据所述声音片段的声音情况，对所述语音数据进行调整，包括:
[0071]计算所述声音片段的平均音量和所述语音数据的平均音量；
[0072]判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若是，则对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。
[0073]可选的，所述视频文件预设重要情节时间段;所述建立所述音频文件和所述终端当前正在播放的视频文件的关联后，包括:
[0074]根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若是，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。
[0075]可选的，所述根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内，包括:
[0076]获取所述语音数据的起始时间^和终止时间Ae3;
[0077]获取所述重要情节时间段的起始时间Bs和终止时间Be;
[0078]判断是否满足:As处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于或等于Bs且Ae大于或等于Be;若是，判定所述语音数据处于所述重要情节时间段内；
[0079]所述更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外，包括:
[0080]判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系；
[0081]若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae3-Bs;
[0082]若(Ae+As)/2的结果大于(Be+Bs)/2的结果，将所述时间戳后移Be-As。
[0083]本发明还提供一种音视频文件同时播放的装置，包括:
[0084]第二网络单元，用于接收由终端发送的音频文件;所述音频文件包括用户在播放视频文件的过程中同步输入的语音数据和所述语音数据的输入起始时刻在终端正在播放的视频文件中对应时间点的时间戳；
[0085]关联单元，用于建立所述音频文件和所述视频文件的关联;还用于所述视频文件再次被播放时，查找与该视频文件关联的所述音频文件，所述第二网络单元用于将查找到的所述音频文件发送至播放所述视频文件的用户。
[0086]可选的，所述视频文件在网络服务器预设有关联列表;所述关联单元用于将所述音频文件的名称添加至所述视频文件的关联列表中。
[0087]可选的，所述音频文件还包括创建者的用户名，所述关联列表内的音频名称按照所述用户名进行分组;所述关联单元还用于在所述关联列表内查找所述音频文件创建者的用户名；若找到所述用户名，将所述音频文件的名称添加至所述用户名的分组内；若未找至IJ，建立所述用户名的新分组，将所述音频文件的音频名称添加至所述新分组内；
[0088]所述第二网络单元用于获取终端发送的包含用户名的音频文件获取请求;所述关联单元用于在所述视频文件的关联列表中查找所述用户名，所述第二网络单元用于将所述用户名对应分组内的音频文件发送至所述终端。
[0089]可选的，还包括:
[0090]第二音量处理单元，用于根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段;还用于根据所述声音片段的声音情况，对所述语音数据进行调整。
[0091]可选的，所述第二音量处理单元用于计算所述声音片段的平均音量和所述语音数据的平均音量;判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若是，则对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。
[0092]可选的，所述视频文件预设重要情节时间段；网络服务器还包括:
[0093]第二重要情节处理单元，用于根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若是，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。
[0094]可选的，所述第二重要情节处理单元用于获取所述语音数据的起始时间As和终止时间Ae;获取所述重要情节时间段的起始时间Bs和终止时间Be;判断是否满足:As处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于或等于Bs且Ae大于或等于Be;若是，判定所述语音数据处于所述重要情节时间段内；
[0095]所述第二重要情节处理单元还用于判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系;若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae3-Bs;若(Ae3+As)/2的结果大于(Be+Bs)/2的结果，将所述时间戳后移H
[0096]本发明还提供一种音视频文件同时播放的系统，包括上述实施例中任意一项所述的终端和上述实施例中任意一项所述的网络服务器。
[0097]从上面所述可以看出，本发明提供的一种音视频文件同时播放的方法、装置、系统，通过获取用户在观看视频文件时同步录制的语音数据作为音频文件，使得后续用户再次播放该视频文件时可以同时收听到在前用户的语音评论内容，丰富了网络视频播放的功會K。
【附图说明】
[0098]图1为本发明提供的一种音视频文件同时播放的方法的一个实施例的流程示意图；
[0099]图2为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图；
[0100]图3为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图；
[0101]图4为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图；
[0102]图5为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图；
[0103]图6为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图；
[0104]图7为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图；
[0105]图8为本发明提供的一种音视频文件同时播放的装置的实施例的框图；
[0106]图9为本发明提供的一种音视频文件同时播放的方法的另一实施例的流程示意图；
[0107]图10为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图；
[0108]图11为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图；
[0109]图12为本发明提供的一种音视频文件同时播放的装置的另一实施例的框图。
【具体实施方式】
[0110]为使本发明实施例的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。
[0111]图1为本发明提供的一种音视频文件同时播放的方法的一个实施例的流程示意图。如图所示，本发明提供的音视频文件同时播放的方法的一个应用于终端的实施例，包括:
[0112]S10，在播放视频文件的过程中，同步获取用户输入的语音数据，将输入起始时刻对应在所述视频文件的时间点作为时间戳与所述语音数据一起保存为音频文件。
[0113]上述“同步获取”是指，用户在播放视频文件时，即时录制输入语音数据，例如，用户观看电影时在某一搞笑情节后，希望发表一些评论，则可以触发录制进程(具体触发方法可根据需要另行确定，例如设置专用触发案件，或在视频播放页面输入特定手势等;录制进程与现有的音频数据录制过程相似，不再赘述)，录制一段包含语音评论的语音数据。
[0114]Sll，将所述音频文件发送至网络服务器。
[0115]所述发送过程可以在单一音频文件制作完成后，在用户继续播放视频文件的过程中执行，也可以在视频文件播放完毕后将用户播放该视频文件的过程中录制的全部音频文件统一上传;前者具备较好地实时性，并且可以利用多余的带宽资源，不会影响用户播放其他视频文件，后者则是针对网络带宽不足以满足视频下行传输和语音上行传输的用户设计，在播放完一个视频文件后，需要等待用户在播放该视频文件的过程中录制的全部音频文件上传完毕后，才可以获得足够的网络带宽播放下一视频文件。上述两种具体的实施方式可以根据用户实际的网络带宽和所播放视频文件的清晰度(码率等)综合使用。
[0116]S12，接收所述视频文件的播放请求，从网络服务器同步获取所述音频文件。
[0117]S13，当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据。
[0118]本实施例实现了用户在观看视频文件的过程中实时保存语音评论，而当该视频文件再次被播放时，观看的用户可以收听在前用户录制的语音评论。将声音作为一种新的评论载体加入到视频文件播放中。
[0119]图2为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图。如图所示，在可选的实施例中，步骤S13，当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据，包括:
[0120]S20，提取所述音频文件中的时间戳。
[0121]S21，将所述时间戳作为播放语音数据的标记加入所述视频文件的播放时间轴。在可选的实施方式中，所述音频文件有多个，当一个音频文件的时间戳键入视频文件的播放时间轴后，在视频播放界面的时间轴上通过可见的标记进行标注，用户通过可见的标记可以看到视频播放至何处时会播放语音数据。
[0122]S22，当视频文件的播放进度达到所述时间戳时，播放该时间戳所属音频文件中的语音数据。
[0123]本实施例给出了一种语音数据的具体播放方法，在视频文件播放开始时(或开始前，即视频文件进行预缓存或播放广告期间)，提前在视频文件的播放时间轴上将需要播放的语音数据排列好，在视频文件播放至这些时间戳时，调用相应的语音数据执行播放即可。
[0124]图3为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图。如图所示，在另一可选的实施例中，步骤S13，当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据，包括:
[0125]S30，提取所述音频文件中的时间戳。
[0126]S31，按照时间戳由前到后的顺序对所述音频文件进行排序。
[0127]S32，按照排序后音频文件的顺序，依次判断视频文件的播放进度是否达到所述音频文件的时间戳标记的时间点;若达到，播放所述时间戳所属音频文件中的语音数据。
[0128]本实施例不同于上一实施例，没有预先将时间戳加入视频文件的时间轴内，而是通过将音频文件提前排序，并将视频文件的当前播放进度按照顺序依次与排序后的音频文件的时间戳对比，只要达到某一音频文件的时间戳，则播放该音频文件，并继续与下一音频文件进行对比。这样的方法由于需要额外的资源执行判断和排序，在及时性上略不及上一实施例的方案，但是若在视频播放的过程中，下载到新的音频文件，则可以在对比时间戳后将新的音频文件直接插入音频文件序列中，与前一实施例相比更为灵活。
[0129]在可选的实施例中S12，接收所述视频文件的播放请求，从网络服务器同步获取所述音频文件，包括:
[0130]所述播放请求中包含某些音频文件创建者的用户名。
[0131]S40，向网络服务器发送包含用户名的音频文件获取请求。
[0132]S41，接收网络服务器返回的，由这些用户名对应的用户创建的音频文件。
[0133]本实施例提供了一种方法，即在下载音频文件时，根据用户需要选取部分音频文件进行下载和播放，其中，选取的用户名可以是一个，也可以是多个。不同于文本的弹幕文件，音频文件的数据内存较大，同时由于多个用户都可以针对同一个视频文件录制音频，因此音频文件的数量也非常多，在下载时要占用的网络带宽也比较大，因此采用一些方式进行音频文件的筛选是十分必要的。
[0134]图4为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图。如图所示，在一具体实施例中，S12，再次播放所述视频文件时，从网络服务器获取所述首频文件后，包括:
[0135]S50，根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段。
[0136]S51，根据所述声音片段的声音情况，对所述语音数据进行调整。由于用户录制的语音数据的音量具有随机性，为了避免语音数据和其对应在视频文件中的声音片段相互覆盖导致用户无法听清，因此在播放语音数据前预先调整。
[0137]图5为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图。如图所示，在另一可选的实施例中，S51，根据所述声音片段的声音情况，对所述语音数据进行调整，包括:
[0138]S60，计算所述声音片段的平均音量和所述语音数据的平均音量。
[0139]S61，判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若是，转至步骤S62，若否，不作更改。
[0140]S62，对所述语音数据的音量进行调整，直至所述差值小于或等于所述调整阈值。
[0141]所述调整阈值根据所述声音片段的平均音量确定，例如，设置为所述声音片段平均音量的0.1至0.5倍;可选的，调整阈值设置为所述声音片段平均音量的0.2倍。每次在执行S60-S62的调整步骤时，根据对象声音片段的平均音量重新计算调整阈值，减小语音数据音量和声音片段音量之间的差距。
[0142]本实施例以视频文件声音片段的平均音量作为判定依据，将过大或过小的音频数据的音量进行调整，使其靠近所述声音片段的音量，以避免二者中某一项音量过大掩盖另一项，用户无法分辨的问题。
[0143]图6为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图。如图所示，在可选的实施例中，所述视频文件预设重要情节时间段;S12，再次播放所述视频文件时，从网络服务器获取所述音频文件后，包括:
[0144]S70，根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若是，转至步骤S71，若否，不作更改。
[0145]S71，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。
[0146]上述重要情节时间段是指视频文件中剧情较为精彩的一些片段，在这些片段中，用户希望能够单纯地观看视频，而不希望听到其他声音，因此声音文件应当避免在这些片段内同时播放。所述重要情节时间段的确定方式，可以通过分许视频文件的音轨中音量特殊的区间进行确定(例如以一定宽度的窗作为判断区域，将这一窗沿音轨移动，该窗用于计算窗口内音轨的平均音量；当所述平均音量达到预设的阈值，则标记为一个重要情节时间段的开始点，直到平均音量低于预设的阈值后，则标记为该重要情节时间段的终止点。)，也可以由人工预先设定。
[0147]图7为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图。如图所示，在另一可选的实施例中，S70，根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内，包括:
[0148]S80，获取所述语音数据的起始时间As和终止时间Ae;获取所述重要情节时间段的起始时间Bs和终止时间Be。
[0149]S82，判断是否满足:As处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于或等于Bs且Ae3大于或等于Be3;若是，判定所述语音数据处于所述重要情节时间段内。即只要判定语音数据的与任一重要情节时间段发生部分重合，则判定所述语音数据处于所述重要情节时间段内。
[0150]S71，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外，包括:
[0151]S83，判断(Ae+As )/2的结果与(Be+Bs )/2的结果的大小关系。
[0152]S84，若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae-Bs。
[0153]S85，若(Ae+As)/2的结果大于(Be+Bs)/2的结果，将所述时间戳后移Be-As。
[0154]步骤S83-S85，通过判定发生重合的语音数据与重要情节时间段的前后关系，将语音数据对应的时间戳向语音数据更加靠近的情节一侧移动，直至语音数据不再与重要情节时间段重合。
[0155]在可选的实施例中，S13，当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据，包括:
[0156]S90，获取音量调整指令，根据所述音量调整指令对所述音频数据的音量进行调整。所述音量调整指令是由用户直接发出的，指示对音频文件的音量进行调整的命令。
[0157]本实施例所实现的功能为，当用户认为音频文件的音量过大时，可以手动调节音频文件的音量大小，使其适宜视频文件音量。在一些可选的实施方式中，所述根据所述音量调整指令对所述音频文件的音量进行调整，是指对本视频文件当前加载的全部音频文件的音量所进行统一调整;在另外一些可选的实施方式中，当检测到视频文件的音量发生改变时，对所述音频文件的音量大小按照所述视频文件音量大小的改变倍数，同步改变。
[0158]图8为本发明提供的一种音视频文件同时播放的装置的实施例的框图。如图所示，本发明的另一实施例包括一种音视频文件同时播放的装置，包括:
[0159]音频文件获取单元100，用于在播放视频文件的过程中，同步获取用户输入的语音数据，将输入起始时刻对应在所述视频文件的时间点作为时间戳与所述语音数据一起保存为音频文件。所述音频文件获取单元100包括用于直接获取语音样本的获取部(如麦克风)、用于采集用户操作从而启动获取功能的操作部(例如按键、触屏或其他控制部件)以及用于处理语音样本得到语音数据的处理部。
[0160]第一网络单元101，用于将所述音频文件发送至网络服务器;还用于再次播放所述视频文件时，从网络服务器获取所述音频文件。所述第一网络单元101包括W1-Fi模块。
[0161]音频文件播放单元102，用于当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据。
[0162]本实施例中的所述装置为用于播放视频文件的手机、平板电脑、计算机、TV、车载系统等终端。
[0163]需要说明的是，本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量，可见“第一” “第二”仅为了表述的方便，不应理解为对本发明实施例的限定，后续实施例对此不再一一说明。
[0164]在可选的实施例中，所述音频文件播放单元102用于提取所述音频文件中的时间戳;将所述时间戳作为播放语音数据的标记加入所述视频文件的播放时间轴；当视频文件的播放进度达到所述时间戳时，播放该时间戳所属音频文件中的语音数据。
[0165]在可选的实施例中，所述音频文件播放单元102用于提取所述音频文件中的时间戳;按照时间戳由前到后的顺序对所述音频文件进行排序;按照排序后音频文件的顺序，依次判断视频文件的播放进度是否达到所述音频文件的时间戳标记的时间点；若达到，播放所述时间戳所属音频文件中的语音数据。
[0166]在可选的实施例中，所述第一网络单元101用于向网络服务器发送包含用户名的音频文件获取请求;还用于接收网络服务器返回的，由这些用户名对应的用户创建的音频文件。
[0167]在可选的实施例中，所述装置还包括:
[0168]第一音量处理单元103，用于根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段;还用于根据所述声音片段的声音情况，对所述语音数据进行调整。
[0169]在可选的实施例中，所述第一音量处理单元103还用于计算所述声音片段的平均音量和所述语音数据的平均音量;判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若是，对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。
[0170]在可选的实施例中，所述视频文件预设重要情节时间段;所述终端还包括:
[0171]第一重要情节处理单元104，用于根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若是，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。
[0172]在可选的实施例中，所述第一重要情节处理单元104用于获取所述语音数据的起始时间As和终止时间Ae ；获取所述重要情节时间段的起始时间Bs和终止时间Be ；判断是否满足:As处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于或等于Bs且Ae大于或等于Be;若是，判定所述语音数据处于所述重要情节时间段内。
[0173]所述第一重要情节处理单元104还用于判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系;若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae3-Bs5S(Ae+As)/2的结果大于(Be+Bs)/2的结果，将所述时间戳后移Be-As。
[0174]在可选的实施例中，所述装置还包括:
[0175]音量调整单元105，用于获取音量调整指令，根据所述音量调整指令对所述音频文件的音量进行调整。
[0176]图9为本发明提供的一种音视频文件同时播放的方法的另一实施例的流程示意图。如图所示，本发明提供的音视频文件同时播放的方法的一个应用于网络服务器的实施例，包括:
[0177]S110，接收由终端发送的音频文件;所述音频文件包含标识其输入起始时刻在终端当前正在播放的所述视频文件中对应时间点的时间戳和用户在播放所述视频文件的过程中同步输入的语音数据。
[0178]Slll，建立所述音频文件和所述视频文件的关联。
[0179]S112，所述视频文件再次被播放时，查找与该视频文件关联的所述音频文件，发送至播放所述视频文件的用户。
[0180]图10为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图。如图所示，在可选的实施例中，所述视频文件在网络服务器预设有关联列表;步骤Slll，建立所述音频文件和所述终端当前正在播放的视频文件的关联，包括:
[0181]S120，将所述音频文件的名称添加至所述视频文件的关联列表中。
[0182]需要说明的是，本实施例中的关联列表仅表示一类概念，即可以通过这一关联列表，查找到视频文件对应的音频文件，对于关联列表的具体形式则不加以限定;例如，可以是采用表格列出关联关系，还可以是将单个视频文件及其关联的音频文件共同保存在同一文件夹下等。
[0183]图11为本发明提供的一种音视频文件同时播放的方法的可选实施例的流程示意图。如图所示，在可选的实施例中，所述音频文件还包括创建者的用户名，所述关联列表内的音频名称按照所述用户名进行分组;步骤S120，将所述音频文件的音频名称添加至所述关联列表中，包括:
[0184]S130，在所述关联列表内查找所述音频文件创建者的用户名；若找到，转至步骤S131，若未找到，转至步骤S132。
[0185]S131，将所述音频文件的名称添加至所述用户名的分组内。
[0186]S132，建立所述用户名的新分组，将所述音频文件的音频名称添加至所述新分组内。
[0187]步骤SI12，视频文件再次被播放时，查找与视频文件关联的音频文件，发送至播放所述视频文件的用户，包括:
[0188]S133，获取终端发送的包含用户名的音频文件获取请求。
[0189]S134，在所述视频文件的关联列表中查找所述用户名，将所述用户名对应分组内的音频文件发送至所述终端。
[0190]在可选的实施例中，Slll，建立所述音频文件和所述视频文件的关联后，包括:
[0191]S140，根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段。
[0192]S141，根据所述声音片段的声音情况，对所述语音数据进行调整。
[0193]在可选的实施例中，S141，根据所述声音片段的声音情况，对所述语音数据进行调整，包括:
[0194]S150，计算所述声音片段的平均音量和所述语音数据的平均音量。
[0195]S151，判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若是，则对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。
[0196]在可选的实施例中，所述视频文件预设重要情节时间段;SI11，建立所述音频文件和所述视频文件的关联后，包括:
[0197]S160，根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若是，转至步骤S161。
[0198]S161，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。
[0199]在可选的实施例中，S160，根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内，包括:
[0200]S170，获取所述语音数据的起始时间As和终止时间Ae。
[0201 ] S171，获取所述重要情节时间段的起始时间Bs和终止时间Be。
[0202]3172，判断是否满足:1处于区间(83，86)，或46处于区间(83，86)，或尨小于或等于队且Ae大于或等于Be ;若是，判定所述语音数据处于所述重要情节时间段内。
[0203]S161，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外，包括:
[0204]S173，判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系。
[0205]S174，若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae-Bs。
[0206]S175，若(Ae+As)/2的结果大于(Be+Bs)/2的结果，将所述时间戳后移Be-As。
[0207]图12为本发明提供的一种音视频文件同时播放的装置的实施例的框图。如图所示，本发明的另一实施例包括一种音视频文件同时播放的装置，包括:
[0208]第二网络单元180，用于接收由终端发送的音频文件;所述音频文件包含标识其输入起始时刻在终端当前正在播放的所述视频文件中对应时间点的时间戳和用户在播放所述视频文件的过程中同步输入的语音数据。
[0209]关联单元181，用于建立所述音频文件和所述视频文件的关联;还用于所述视频文件再次被播放时，查找与该视频文件关联的所述音频文件，发送至播放所述视频文件的用户。
[0210]本实施例中的所述装置为用于提供网络侧视频服务功能的视频服务器、网站服务器等服务器。
[0211]在可选的实施例中，所述视频文件在网络服务器预设有关联列表;所述关联单元181用于将所述音频文件的名称添加至所述视频文件的关联列表中。
[0212]在可选的实施例中，所述音频文件还包括创建者的用户名，所述关联列表内的音频名称按照所述用户名进行分组;所述关联单元181还用于在所述关联列表内查找所述音频文件创建者的用户名；若找到所述用户名，将所述音频文件的名称添加至所述用户名的分组内；若未找到，建立所述用户名的新分组，将所述音频文件的音频名称添加至所述新分组内。
[0213]所述第二网络单元180用于获取终端发送的包含用户名的音频文件获取请求;所述关联单元181用于在所述视频文件的关联列表中查找所述用户名，所述第二网络单元180用于将所述用户名对应分组内的音频文件发送至所述终端。
[0214]在可选的实施例中，所述装置还包括:
[0215]第二音量处理单元182，用于根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段;根据所述声音片段的声音情况，对所述语音数据进行调整。
[0216]在可选的实施例中，所述第二音量处理单元182用于计算所述声音片段的平均音量和所述语音数据的平均音量;判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若是，则对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。
[0217]在可选的实施例中，所述视频文件预设重要情节时间段;网络服务器还包括:
[0218]第二重要情节处理单元183，用于根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若是，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。
[0219]在可选的实施例中，所述第二重要情节处理单元183用于获取所述语音数据的起始时间As和终止时间Ae ；获取所述重要情节时间段的起始时间Bs和终止时间Be ；判断是否满足:As处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于或等于Bs且Ae大于或等于Be;若是，判定所述语音数据处于所述重要情节时间段内。
[0220]所述第二重要情节处理单元183还用于判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系;若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae3-Bs5S(Ae+As)/2的结果大于(Be+Bs)/2的结果，将所述时间戳后移Be-As。
[0221]从上面所述可以看出，本发明提供的一种音视频文件同时播放的方法、装置和系统，通过获取用户在观看视频文件时同步录制的语音数据作为音频文件，使得后续用户再次播放该视频文件时可以同时收听到在前用户的语音评论内容，丰富了网络视频播放的功會K。
[0222]所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的，并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本发明的不同方面的许多其它变化，为了简明它们没有在细节中提供。
[0223]另外，为简化说明和讨论，并且为了不会使本发明难以理解，在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外，可以以框图的形式示出装置，以便避免使本发明难以理解，并且这也考虑了以下事实，即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即，这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如，电路)以描述本发明的示例性实施例的情况下，对本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此，这些描述应被认为是说明性的而不是限制性的。
[0224]尽管已经结合了本发明的具体实施例对本发明进行了描述，但是根据前面的描述，这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如，其它存储器架构(例如，动态RAM(DRAM))可以使用所讨论的实施例。
[0225]本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本发明的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【主权项】
1.一种音视频文件同时播放的方法，应用于终端，其特征在于，包括: 在播放视频文件的过程中，同步获取用户输入的语音数据，将输入所述语音数据的起始时刻对应的所述视频文件的时间点作为时间戳与所述语音数据一起保存为音频文件；将所述音频文件发送至网络服务器；接收所述视频文件的播放请求，从网络服务器同步获取所述音频文件；当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据。2.根据权利要求1所述的方法，其特征在于，所述当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据，包括: 提取所述音频文件中的时间戳；将所述时间戳作为播放语音数据的标记加入所述视频文件的播放时间轴；当视频文件的播放进度达到所述时间戳时，播放该时间戳所属音频文件中的语音数据。3.根据权利要求1所述的方法，其特征在于，所述当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据，包括: 提取所述音频文件中的时间戳；按照时间戳由前到后的顺序对所述音频文件进行排序；按照排序后音频文件的顺序，依次判断视频文件的播放进度是否达到所述音频文件的时间戳标记的时间点;若达到，播放所述时间戳所属音频文件中的语音数据。4.根据权利要求1所述的方法，其特征在于，所述音频文件还包括创建者的用户名；所述接收所述视频文件的播放请求，从网络服务器同步获取所述音频文件，包括: 所述播放请求中包含某些音频文件创建者的用户名；从服务器获取由所述用户名对应的用户创建的音频文件。5.根据权利要求1所述的方法，其特征在于，所述接收所述视频文件的播放请求，从网络服务器获取所述音频文件后，包括: 根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段；根据所述声音片段的声音情况，对所述语音数据进行调整。6.根据权利要求5所述的方法，其特征在于，所述根据所述声音片段的声音情况，对所述语音数据进行调整，包括: 计算所述声音片段的平均音量和所述语音数据的平均音量；判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若大于预设的调整阈值，对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。7.根据权利要求1所述的方法，其特征在于，所述视频文件预设重要情节时间段;所述接收所述视频文件的播放请求，从网络服务器获取所述音频文件后，包括: 根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若处于所述重要情节时间段内，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。8.根据权利要求7所述的方法，其特征在于，所述根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内，包括: 获取所述语音数据的起始时间AjP终止时间Ae3 ；获取所述重要情节时间段的起始时间Bs和终止时间Be ; 判断是否满足:As处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于或等于Bs且Ae大于或等于Be3;若满足，确定所述语音数据处于所述重要情节时间段内；所述更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外，包括: 判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系；若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae3-Bs; 若(Ae+As)/2的结果大于(Be+Bs)/2的结果，将所述时间戳后移Be-As。9.一种音视频文件同时播放的装置，其特征在于，包括: 音频文件获取单元，用于在播放视频文件的过程中，同步获取用户输入的语音数据，将输入所述语音数据的起始时刻对应的所述视频文件的时间点作为时间戳与所述语音数据一起保存为音频文件；第一网络单元，用于将所述音频文件发送至网络服务器;还用于接收所述视频文件的播放请求后，从网络服务器同步获取所述音频文件；音频文件播放单元，用于当所述视频文件播放至所述时间戳标识的时间点时，在继续播放所述视频文件的同时播放所述语音数据。10.根据权利要求9所述的装置，其特征在于，所述音频文件播放单元用于提取所述音频文件中的时间戳;将所述时间戳作为播放语音数据的标记加入所述视频文件的播放时间轴;当视频文件的播放进度达到所述时间戳时，播放该时间戳所属音频文件中的语音数据。11.根据权利要求9所述的装置，其特征在于，所述音频文件播放单元用于提取所述音频文件中的时间戳;按照时间戳由前到后的顺序对所述音频文件进行排序;按照排序后音频文件的顺序，依次判断视频文件的播放进度是否达到所述音频文件的时间戳标记的时间点;若达到，播放所述时间戳所属音频文件中的语音数据。12.根据权利要求9所述的装置，其特征在于，所述音频文件还包括创建者的用户名，所述播放请求中包含某些音频文件创建者的用户名;所述第一网络单元用于从服务器获取由所述用户名对应的用户创建的音频文件。13.根据权利要求9所述的装置，其特征在于，还包括: 第一音量处理单元，用于根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段;还用于根据所述声音片段的声音情况，对所述语音数据进行调整。14.根据权利要求13所述的装置，其特征在于，所述第一音量处理单元还用于计算所述声音片段的平均音量和所述语音数据的平均音量;判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若大于预设的调整阈值，对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。15.根据权利要求9所述的装置，其特征在于，所述视频文件预设重要情节时间段;终端还包括: 第一重要情节处理单元，用于根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若处于所述重要情节时间段内，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。16.根据权利要求15所述的装置，其特征在于，所述第一重要情节处理单元用于获取所述语音数据的起始时间As和终止时间Ae ；获取所述重要情节时间段的起始时间Bs和终止时间Be ;判断是否满足:As处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于或等于Bs且Ae大于或等于Be3;若满足，判定所述语音数据处于所述重要情节时间段内；所述第一重要情节处理单元还用于判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系;若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae3-Bs;若(Ae+As)/2的结果大于(Be+Bs)/2的结果，将所述时间戳后移Be-As。17.—种音视频文件同时播放的方法，应用于网络服务器，其特征在于，包括: 接收由终端发送的音频文件;所述音频文件包括用户在播放视频文件的过程中同步输入的语音数据和所述语音数据的输入起始时刻在终端正在播放的视频文件中对应时间点的时间戳；建立所述音频文件和所述视频文件的关联；所述视频文件再次被播放时，查找与所述视频文件关联的所述音频文件，将所述音频文件发送至播放所述视频文件的用户。18.根据权利要求17所述的方法，其特征在于，所述视频文件在网络服务器预设有关联列表;所述建立所述音频文件和所述视频文件的关联，包括: 将所述音频文件的名称添加至所述视频文件的关联列表中。19.根据权利要求18所述的方法，其特征在于，所述音频文件还包括创建者的用户名，所述关联列表内的音频名称按照所述用户名进行分组;所述将所述音频文件的音频名称添加至所述关联列表中，包括: 在所述关联列表内查找所述音频文件创建者的用户名；若找到所述用户名，将所述音频文件的名称添加至所述用户名的分组内；若未找到，建立所述用户名的新分组，将所述音频文件的名称添加至所述新分组内；所述视频文件再次被播放时，查找与视频文件关联的音频文件，发送至播放所述视频文件的用户，包括: 获取终端发送的包含用户名的音频文件获取请求；在所述视频文件的关联列表中查找所述用户名，将所述用户名对应分组内的音频文件发送至所述终端。20.根据权利要求17所述的方法，其特征在于，所述建立所述音频文件和所述视频文件的关联后，包括: 根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段；根据所述声音片段的声音情况，对所述语音数据进行调整。21.根据权利要求20所述的方法，其特征在于，所述根据所述声音片段的声音情况，对所述语音数据进行调整，包括: 计算所述声音片段的平均音量和所述语音数据的平均音量；判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若是，则对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。22.根据权利要求17所述的方法，其特征在于，所述视频文件预设重要情节时间段;所述建立所述音频文件和所述终端当前正在播放的视频文件的关联后，包括: 根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若是，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。23.根据权利要求22所述的方法，其特征在于，所述根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内，包括: 获取所述语音数据的起始时间AjP终止时间Ae3 ；获取所述重要情节时间段的起始时间Bs和终止时间Be ; 判断是否满足:As处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于或等于Bs且Ae大于或等于Be;若是，判定所述语音数据处于所述重要情所述更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外，包括: 判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系；若(Ae+As)/2的结果小于或等于(Be+Bs)/2的结果，将所述时间戳前移Ae3-Bs; 若(Ae+As)/2的结果大于(Be+Bs)/2的结果，将所述时间戳后移Be-As。24.一种音视频文件同时播放的装置，其特征在于，包括: 第二网络单元，用于接收由终端发送的音频文件;所述音频文件包括用户在播放视频文件的过程中同步输入的语音数据和所述语音数据的输入起始时刻在终端正在播放的视频文件中对应时间点的时间戳；关联单元，用于建立所述音频文件和所述视频文件的关联;还用于所述视频文件再次被播放时，查找与该视频文件关联的所述音频文件，所述第二网络单元用于将查找到的所述音频文件发送至播放所述视频文件的用户。25.根据权利要求24所述的装置，其特征在于，所述视频文件在网络服务器预设有关联列表;所述关联单元用于将所述音频文件的名称添加至所述视频文件的关联列表中。26.根据权利要求25所述的装置，其特征在于，所述音频文件还包括创建者的用户名，所述关联列表内的音频名称按照所述用户名进行分组;所述关联单元还用于在所述关联列表内查找所述音频文件创建者的用户名；若找到所述用户名，将所述音频文件的名称添加至所述用户名的分组内；若未找到，建立所述用户名的新分组，将所述音频文件的音频名称添加至所述新分组内；所述第二网络单元用于获取终端发送的包含用户名的音频文件获取请求;所述关联单元用于在所述视频文件的关联列表中查找所述用户名，所述第二网络单元用于将所述用户名对应分组内的音频文件发送至所述终端。27.根据权利要求24所述的装置，其特征在于，还包括: 第二音量处理单元，用于根据所述音频文件的时间戳和语音数据的长度，查找所述语音数据在所述视频文件的音轨中对应的声音片段;还用于根据所述声音片段的声音情况，对所述语音数据进行调整。28.根据权利要求27所述的装置，其特征在于，所述第二音量处理单元用于计算所述声音片段的平均音量和所述语音数据的平均音量;判断所述声音片段的平均音量和所述语音数据的平均音量的差值是否大于预设的调整阈值;若是，则对所述音频文件的音量进行调整，直至所述差值小于或等于所述调整阈值。29.根据权利要求24所述的装置，其特征在于，所述视频文件预设重要情节时间段；网络服务器还包括: 第二重要情节处理单元，用于根据所述音频文件的时间戳和语音数据的长度，判断所述语音数据是否处于所述重要情节时间段内；若是，更改所述音频文件的时间戳，使所述语音数据处于所述重要情节时间段外。30.根据权利要求29所述的装置，其特征在于，所述第二重要情节处理单元用于获取所述语音数据的起始时间As和终止时间Ae ；获取所述重要情节时间段的起始时间Bs和终止时间Be ;判断是否满足:As处于区间(Bs，Be)，或Ae处于区间(Bs，Be)，或As小于Bs且Ae大于Be ;若是，判定所述语音数据处于所述重要情节时间段内；所述第二重要情节处理单元还用于判断(Ae+As)/2的结果与(Be+Bs)/2的结果的大小关系;若(Ae+As ) /2的结果小于(Be+Bs ) /2的结果，将所述时间戳前移Ae-Bs ；若(Ae+As )/2的结果大于(Be+Bs ) /2的结果，将所述时间戳后移Be-As。31.—种音视频文件同时播放的系统，其特征在于，包括权利要求9-16任意一项所述的装置和权利要求24-30任意一项所述的装置。
【文档编号】H04N21/233GK105828100SQ201610162806
【公开日】2016年8月3日
【申请日】2016年3月21日
【发明人】王若韬
【申请人】乐视网信息技术（北京）股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王若韬;
技术所有人：乐视网信息技术（北京）股份有限公司;
我是此专利的发明人

上一篇：生成字幕文件的方法及装置的制造方法
上一篇：通过新媒体技术平实现媒体文件与观众互动的方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。