多媒体播放方法、系统及电子设备与流程

文档序号:17837438发布日期:2019-06-05 23:43阅读:139来源:国知局
多媒体播放方法、系统及电子设备与流程

本公开涉及计算机技术领域,更具体地,涉及一种多媒体播放方法、系统及电子设备。



背景技术:

随着移动互联网的发展与智能手机的普及,用户有了更多的社交和娱乐方式。例如,用户使用智能手机安装的应用可以与其他用户进行互动唱歌。但是在实现本发明构思的过程中,发明人发现现有技术中至少存在如下问题:用户在使用智能手机安装的应用可以与其他用户进行互动唱歌时,需要用户手动对该应用进行操作。例如,用户手动对歌曲的原声切换、手动调节歌曲的音量和/或音量等功能。



技术实现要素:

有鉴于此,本公开提供了一种多媒体播放方法、系统及电子设备。

本公开的一个方面提供了一种多媒体播放方法,包括:获取用户声音的参数,所述参数包括音量和/或音调;以及根据用户声音的音量和/或音调,控制第一多媒体文件的播放方式,所述控制第一多媒体文件的播放方式包括调整所述第一多媒体文件使其与用户声音的音量和/或音调相匹配,并根据调整后的第一多媒体文件输出音频。

根据本公开的实施例,所述控制第一多媒体文件的播放方式包括当用户声音的音量低于预定阈值时,根据所述第一多媒体文件和第二多媒体文件输出音频。

根据本公开的实施例,当所述方法是由与外部设备连接的电子设备执行时,所述输出音频包括通过所述外部设备输出音频。

根据本公开的实施例,调整第一多媒体文件使其与用户声音的音量相匹配包括调整第一多媒体文件中音频的音量使其与用户声音的音量相同或相近;并且/或者调整第一多媒体文件使其与用户声音的音调相匹配包括调整第一多媒体文件中音频的音调使其与用户声音的音调相同或相近。

根据本公开的实施例,所述第二多媒体文件包括与所述第一多媒体文件相关联的音频或与所述用户相关联的人的音频。

根据本公开的实施例,与所述用户相关联的人的音频是根据第一多媒体文件与用户相关联的人的音色和/或与所述第一多媒体文件相关联的内容合成的。

根据本公开的实施例,所述方法由与电子设备相连接的服务器执行;所述电子设备接收用户声音;以及所述服务器经由所述电子设备控制所述第一多媒体文件的播放方式。

本公开的另一个方面提供了一种多媒体播放系统,包括:获取模块,用于获取用户声音的参数,所述参数包括音量和/或音调;以及用于根据用户声音的音量和/或音调,控制第一多媒体文件的播放方式,所述控制第一多媒体文件的播放方式包括调整所述第一多媒体文件使其与用户声音的音量和/或音调相匹配,并根据调整后的第一多媒体文件输出音频。

根据本公开的实施例,所述控制第一多媒体文件的播放方式包括当用户声音的音量低于预定阈值时,根据所述第一多媒体文件和第二多媒体文件输出音频。

根据本公开的实施例,当所述系统是由与外部设备连接的电子设备执行时,所述输出音频包括通过所述外部设备输出音频。

根据本公开的实施例,调整第一多媒体文件使其与用户声音的音量相匹配包括调整第一多媒体文件中音频的音量使其与用户声音的音量相同或相近;并且/或者调整第一多媒体文件使其与用户声音的音调相匹配包括调整第一多媒体文件中音频的音调使其与用户声音的音调相同或相近。

根据本公开的实施例,所述第二多媒体文件包括与所述第一多媒体文件相关联的音频或与所述用户相关联的人的音频。

根据本公开的实施例,上述系统还包括语音合成模块,用于根据第一多媒体文件与用户相关联的人的音色和/或与所述第一多媒体文件相关联的内容合成所述与所述用户相关联的人的音频。

根据本公开的实施例,所述系统由与电子设备相连接的服务器执行;所述电子设备接收用户声音;以及所述服务器经由所述电子设备控制所述第一多媒体文件的播放方式。

根据本公开的实施例,上述系统还包括语音识别模块,用于识别用户声音的音量和/或音调。

本公开的另一方面提供了一种电子设备,包括:一个或多个处理器;以及一个或多个存储器,存储有可执行指令,所述指令在被处理器执行时,使得处理器执行如上所述的方法。

本公开的另一方面提供了一种可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。

本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。

根据本公开的实施例,可以至少部分地减少用户在使用智能手机安装的应用与其他用户进行互动唱歌时,无需用户过多的依赖手动对上述应用进行操作的问题,提高了用户体验。

附图说明

通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:

图1示意性示出了可以应用本公开的多媒体播放方法和电子设备的示例性系统架构;

图2示意性示出了根据本公开实施例的用于多媒体播放方法的流程图;

图3示意性示出了根据本公开另一个实施例的用于多媒体播放方法的流程图;

图4示意性示出了根据本公开实施例的多媒体播放系统的框图;

图5示意性示出了根据本公开另一个实施例的多媒体播放系统的框图;以及

图6示意性示出了根据本公开实施例的电子设备的框图。

具体实施方式

以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。

在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。在使用类似于“a、b或c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b或c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“a或b”应当被理解为包括“a”或“b”、或“a和b”的可能性。

本公开的实施例提供了一种多媒体播放方法,包括:获取用户声音的参数,所述参数包括音量和/或音调;以及根据用户声音的音量和/或音调,控制第一多媒体文件的播放方式,所述控制第一多媒体文件的播放方式包括调整所述第一多媒体文件使其与用户声音的音量和/或音调相匹配,并根据调整后的第一多媒体文件输出音频。

图1示意性示出了可以应用本公开的多媒体播放方法和电子设备的示例性系统架构100。

如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103、104,网络105和服务器106。网络105用以在终端设备101、102、103、104和服务器106之间提供通信链路的介质。网络105可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103、104通过网络105与服务器106交互,以接收或发送消息等。终端设备101、102、103、104上可以安装有各种通讯客户端应用和娱乐客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件、酷我k歌应用、全民k歌应用等(仅为示例)。

终端设备101、102、103、104可以是具有声音识别功能并且支持声音识别的各种电子设备,包括但不限于智能音箱、智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器106可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103、104所加载歌曲的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的歌曲、信息、或数据等)反馈给终端设备。

需要说明的是,本公开实施例所提供的多媒体播放方法一般可以由服务器106执行,也可以由终端设备执行。相应地,本公开实施例所提供的多媒体播放的装置一般可以设置于服务器106中。本公开实施例所提供的多媒体播放方法也可以由不同于服务器106且能够与终端设备101、102、103、104和/或服务器106通信的服务器或服务器集群执行。相应地,本公开实施例所提供的多媒体播放的装置也可以设置于不同于服务器106且能够与终端设备101、102、103、104和/或服务器106通信的服务器或服务器集群中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

图2示意性示出了根据本公开实施例的多媒体播放方法的流程图。

如图2所示,该方法包括在操作s201和操作s202。

在操作s201,获取用户声音的参数,该参数包括音量和/或音调。

在操作s202,根据用户声音的音量和/或音调,控制第一多媒体文件的播放方式。根据本公开的实施例,控制第一多媒体文件的播放方式包括调整所述第一多媒体文件使其与用户声音的音量和/或音调相匹配,并根据调整后的第一多媒体文件输出音频。

根据本公开的实施例,通过上述方法获取用户的声音的音量和/或音调,根据用户声音的音量和/或音调,控制第一多媒体文件的播放方式,从而减少了用户手动对第一多媒体文件操作的次数,为用户节省了时间。

根据本公开的实施例,用户声音的参数例如可以是用户声音的音量,也可以是用户声音的音调,还可以是用户声音的音量和用户声音的音调。

通过根据本公开的实施例,可以根据用户声音的音量和/或音调,调整第一多媒体文件使其与用户声音的音量和/或音调相匹配,并根据调整后的第一多媒体文件输出音频。

例如,第一多媒体文件可以是一首歌曲的伴奏,用户声音的内容可以是与该歌曲伴奏相对应的歌词,而用户声音的音量和/或音调可以是与用户在歌唱该歌词时发出的音量和/或音调相对应。相应地,此时电子设备可以根据用户在歌唱该歌词时发出的音量和/或音调对该歌曲的伴奏进行调整。

根据本公开的实施例,调整第一多媒体文件使其与用户声音的音量相匹配包括调整第一多媒体文件中音频的音量使其与用户声音的音量相同或相近;并且/或者调整第一多媒体文件使其与用户声音的音调相匹配包括调整第一多媒体文件中音频的音调使其与用户声音的音调相同或相近。

例如,可以将上述歌曲的伴奏的音量调整为与用户声音的音量相同或相近,也可以将上述歌曲的伴奏的音调调整为与用户声音的音调相同或相近等等,但不限于此。然后,通过电子设备输出调整后的歌曲伴奏。从而实现了第一多媒体的音量和/或音调与用户声音的音量和/或音调相同步,使得用户在歌唱时无需花费时间来调整歌曲伴奏的音量和/或音调,进一步提高了用户的体验效果。

图3示意性示出了根据本公开另一个实施例的用于多媒体播放方法的流程图。

根据本公开的实施例,当上述参数包括音量时,控制第一多媒体文件的播放方式还包括当用户声音的音量低于预定阈值时,根据所述第一多媒体文件和第二多媒体文件输出音频,并执行上述方法具体如图3所示。

在操作s301,获取用户声音的音量。

在操作s302,当用户声音的音量低于预定阈值时,根据所述第一多媒体文件和第二多媒体文件输出音频。

用户声音的音量例如可以分为10个等级,按照音量的强弱分别为9、8、7、6、5、4、3、2、1、0,其中0可以认为无声。当然也可以换成其他的表现形式对音量的强弱进行表示,例如利用英文字母的先后顺序对音量的强弱进行表示等等,但不限于此。

根据本公开的实施例,预设阈值可以设置为1。当用户声音的音量低于1时,可以认为用户声音的音量为0。在这种情况下,将所述第一多媒体文件和第二多媒体文件一起作为输出音频,并对该音频进行播放。例如,第一多媒体文件可以是歌曲伴奏,第二多媒体文件可以是该歌曲的原唱,在用户声音的音量为0时,将该歌曲的原唱与其伴奏一起进行播放,这样使得用户在歌唱整首歌曲的过程中非常和谐,不会出现歌曲断续断续的情况,而且还实现了用户的声音与原唱的对唱功能。

根据本公开的实施例,当上述方法是由与外部设备连接的电子设备执行时,输出音频包括通过外部设备输出音频。

外部设备例如可以是与电子设备相同的设备,也可以是与电子设备不同的设备。根据本公开的实施例,电子设备例如可以是手机、平板电脑,笔记本电脑、智能音箱等等,但不限于此。相应地,外部设备也可以是手机、平板电脑,笔记本电脑、智能音箱等等,但不限于此。下面以电子设备为手机,外部设备为智能音箱,作为一个示例对上述方法进行描述。

具体地,手机获取用户声音的参数,该参数包括音量和/或音调。手机根据用户声音的音量和/或音调,调整所述第一多媒体文件使其与用户声音的音量和/或音调相匹配,并将调整后的第一多媒体文件发送至与电子设备相连接的外部设备,然后由外部设备对调整后的第一多媒体文件的音频进行播放。需要说明的是,当用户声音的音量低于预定阈值时,将所述第一多媒体文件和第二多媒体文件一起发送至与电子设备相连接的外部设备,并对其进行播放。

根据本公开的实施例,上述第二多媒体文件包括与第一多媒体文件相关联的音频或与用户相关联的人的音频。与用户相关联的人的音频是根据第一多媒体文件与用户相关联的人的音色和/或与该第一多媒体文件相关联的内容合成的。

例如,当第一多媒体文件为歌曲伴奏,则与第一多媒体文件相关联音频的第二多媒体文件为该歌曲的原唱。与用户相关联的人的音频可以是根据歌曲伴奏与用户相关联的人的音色和/或与歌曲伴奏相关联的内容(例如,该歌曲的歌词)合成的。这样,将合成的第二对媒体文件与第一多媒体文件一起进行播放,实现了在个性化的模式下与用户进行对唱。

根据本公开的实施例,上述方法由与电子设备相连接的服务器执行;电子设备接收用户声音;以及服务器经由该电子设备控制第一多媒体文件的播放方式。

上述方法由与电子设备相连接的服务器执行时,其操作步骤与电子设备执行上述方法类似,在此不再赘述。

图4示意性示出了根据本公开的实施例的多媒体播放系统的框图。

如图4所示,系统400包括获取模块410和控制模块420。

获取模块410,用于获取用户声音的参数,该参数包括音量和/或音调。

控制模块420,用于根据用户声音的音量和/或音调,控制第一多媒体文件的播放方式。根据本公开的实施例,控制第一多媒体文件的播放方式包括调整所述第一多媒体文件使其与用户声音的音量和/或音调相匹配,并根据调整后的第一多媒体文件输出音频。

根据本公开的实施例,有关获取用户声音参数和控制第一多媒体文件的播放方式的详细过程可以参见上面参考图2~图3的描述,这里不再重复。

图5示意性示出了根据本公开另一的实施例的多媒体播放系统的框图。

如图5所示,除了图4实施例中的获取模块410和控制模块420之外,系统500还包括语音识别模块510和语音合成模块520。

具体地,语音识别模块510,用于识别用户声音的音量和/或音调。

语音合成模块520,用于根据第一多媒体文件与用户相关联的人的音色和/或与第一多媒体文件相关联的内容合成与用户相关联的人的音频。

例如,当第一多媒体文件为歌曲伴奏,则与第一多媒体文件相关联音频的第二多媒体文件为该歌曲的原唱。与用户相关联的人的音频可以是根据歌曲伴奏与用户相关联的人的音色和/或与歌曲伴奏相关联的内容(例如,该歌曲的歌词)合成的。这样,将合成的第二对媒体文件与第一多媒体文件一起进行播放,实现了在个性化的模式下与用户进行对唱。

图6示意性示出了根据本公开实施例的适于实现多媒体播放方法及系统的电子设备的框图。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

如图6所示,根据本公开实施例的电子设备600包括处理器601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic)),等等。处理器610还可以包括用于缓存用途的板载存储器。处理器610可以包括用于执行参考图2~图3描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在ram603中,存储有电子设备600操作所需的各种程序和数据。处理器601、rom602以及ram603通过总线604彼此相连。处理器601通过执行rom602和/或ram603中的程序来执行以上参考图2~图3描述的方法及系统的各种操作。需要注意,所述程序也可以存储在除rom602和ram603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行以上参考图2~图3描述的方法及系统的各种操作。

根据本公开的实施例,电子设备600还可以包括输入/输出(i/o)接口605,输入/输出(i/o)接口605也连接至总线604。系统600还可以包括连接至i/o接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

根据本公开的实施例,上文参考流程图描述的方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。

需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。根据本公开的实施例,计算机可读介质可以包括上文描述的rom602和/或ram603和/或rom602和ram603以外的一个或多个存储器。

附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行本公开的方法:获取用户声音的音量和/或音调;以及根据用户声音的音量和/或音调,调整第一多媒体文件使其与用户声音的音量和/或音调相匹配,并根据调整后的第一多媒体文件输出音频。

以上对本公开的实施例进行了描述。但是,这些实施例仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1