一种播放多媒体的方法和装置与流程

文档序号：14135971阅读：160来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本申请实施例涉及计算机技术领域，具体涉及计算机网络技术领域，尤其涉及一种播放多媒体的方法和装置。

背景技术：

随着网络时代的来临，越来越多的用户倾向于接受智能化的服务。以视听服务为例，人们希望智能终端能够理解用户的语音输入，并基于对用户语音的理解，向用户提供一些个性化的视听服务。

目前，在智能终端的视听语音交互场景中，对于用户的语音输入，终端可以满足实时的检索播放，对于用户的任何点播需求，智能终端会中断当前的歌曲播放状态，之后根据对用户语音的理解改变当前播放的多媒体内容。

技术实现要素：

本申请实施例的目的在于提出一种播放多媒体的方法和装置。

第一方面，本申请实施例提供了一种播放多媒体的方法，包括：接收用户输入的语音播放请求；从语音播放请求中，提取预约播放时机和播放参数；基于播放参数，生成多媒体列表；响应于当前时机满足预约播放时机，播放多媒体列表中的多媒体。

在一些实施例中，预约播放时机包括以下一项或多项：多媒体的排序位置、播放时间和播放场景。

在一些实施例中，播放参数包括多媒体的以下一项或多项参数：名称、主创人员、专题多媒体列表、兴趣多媒体列表、语种、风格、场景、情感以及主题。

在一些实施例中，方法还包括：语音反馈用户对于语音播放请求的答复信息。

在一些实施例中，基于播放参数，生成待播放歌单包括：基于播放参数和以下一项或多项生成待播放歌单：多媒体的时效热度、用户画像和用户喜好反馈数据。

在一些实施例中，语音反馈用户对于语音播放请求的答复信息包括以下一项或多项：响应于生成多媒体列表，语音反馈收到指令信息；响应于以下任意一项语音反馈用户未找到相关歌曲：从语音播放请求中未提取到播放参数；或基于播放参数，未能生成待播放歌单；响应于多媒体曲库中无满足播放参数的多媒体版本，语音反馈用户请求播放的多媒体无版权。

在一些实施例中，接收用户输入的语音播放请求包括：接收用户输入的唤醒指令；语音反馈应答信息并接收用户输入的语音播放请求。

第二方面，本申请实施例提供了一种播放多媒体的装置，包括：接收单元，用于接收用户输入的语音播放请求；提取单元，用于从语音播放请求中，提取预约播放时机和播放参数；生成单元，用于基于播放参数，生成多媒体列表；播放单元，用于响应于当前时机满足预约播放时机，播放多媒体列表中的多媒体。

在一些实施例中，提取单元所提取的预约播放时机包括以下一项或多项：多媒体的排序位置、播放时间和播放场景。

在一些实施例中，提取单元所提取的播放参数包括多媒体的以下一项或多项参数：名称、主创人员、专题多媒体列表、兴趣多媒体列表、语种、风格、场景、情感以及主题。

在一些实施例中，装置还包括：反馈单元，用于语音反馈用户对于语音播放请求的答复信息。

在一些实施例中，生成单元进一步用于：基于播放参数和以下一项或多项生成待播放歌单：多媒体的时效热度、用户画像和用户喜好反馈数据。

在一些实施例中，反馈单元进一步用于以下一项或多项：响应于生成多媒体列表，语音反馈收到指令信息；响应于以下任意一项语音反馈用户未找到相关歌曲：从语音播放请求中未提取到播放参数；或基于播放参数，未能生成待播放歌单；响应于多媒体曲库中无满足播放参数的多媒体版本，语音反馈用户请求播放的多媒体无版权。

在一些实施例中，接收单元包括：唤醒子单元，用于接收用户输入的唤醒指令；反馈子单元，用于语音反馈应答信息；以及接收子单元，用于接收用户输入的语音播放请求。

第三方面，本申请实施例提供了一种设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序；当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如上任意一项一种播放多媒体的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如上任意一项一种播放多媒体的方法。

本申请实施例提供的一种播放多媒体的方法和装置，首先，接收用户输入的语音播放请求；之后，从语音播放请求中，提取预约播放时机和播放参数；之后，基于播放参数，生成多媒体列表；响应于当前时机满足预约播放时机，播放多媒体列表中的多媒体。在这一过程中，可以根据用户语音提出的播放请求，在预约播放时机播放多媒体列表中的多媒体，从而提高播放的多媒体的准确度和针对性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请实施例的其它特征、目的和优点将会变得更明显：

图1示出了可以应用本申请的测试业务逻辑的方法或测试业务逻辑的装置的实施例的示例性系统架构图；

图2是根据本申请的一种播放多媒体的方法的一个实施例的示意性流程图；

图3是根据本申请的一种播放多媒体的方法的一个应用场景的示意性流程图；

图4是根据本申请的一种播放多媒体的装置的一个实施例的示例性结构图；

图5是适于用来实现本申请的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请实施例作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请实施例中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请实施例。

图1示出了可以应用本申请的播放多媒体的方法或播放多媒体的装置的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105、106。网络104用以在终端设备101、102、103和服务器105、106之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户110可以使用终端设备101、102、103通过网络104与服务器105、106交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如搜索引擎类应用、购物类应用、即时通信工具、邮箱客户端、社交平台软件、音视频播放类应用等。

终端设备101、102、103可以是具有显示屏的各种电子设备，包括但不限于智能音箱、智能手机、可穿戴设备、平板电脑、电子书阅读器、mp3播放器(movingpictureexpertsgroupaudiolayeriii，动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105、106可以是提供各种服务的服务器，例如对终端设备101、102、103提供支持的后台服务器。后台服务器可以对终端的数据进行分析或计算等处理，并将分析或计算结果推送给终端设备。

需要说明的是，本申请中实施例所提供的播放多媒体的方法一般由服务器105、106或终端设备101、102、103执行，相应地，播放多媒体的装置一般设置于服务器105、106或终端设备101、102、103中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，图2示出了根据本申请的一种播放多媒体的方法的一个实施例的示意性流程。

如图2所示，该生成一种播放多媒体的方法200包括：

在步骤210中，接收用户输入的语音播放请求。

在本实施例中，运行一种播放多媒体的方法的电子设备(例如图1中所示的服务器或图1中所示的终端设备)可以经由终端设备的麦克风接收用户输入的语音播放请求。这里的语音播放请求，用以指示终端设备播放的多媒体，多媒体的内容可以为音频内容，视频内容，或者音频内容和视频内容的组合。

在本实施例的一些可选实现方式中，接收用户输入的语音播放请求可以包括：首先，接收用户输入的唤醒指令；之后，语音反馈应答信息并接收用户输入的语音播放请求。

以多媒体为音频内容中的歌曲为例，终端设备可以接收用户的语音输入“小a”，其中“小a”为预先确定的唤醒指令；之后，终端设备语音反馈用户“哎！”，之后，用户输入语音播放请求“下一首播放bb的ccc”，其中，“下一首”为播放时机，bb和ccc均为播放参数bb，其中bb为歌手名称，ccc为歌曲名称。

在步骤220中，从语音播放请求中，提取预约播放时机和播放参数。

在本实施例中，运行一种播放多媒体的方法的电子设备将语音播放请求识别为文本，再对文本进行语义解析，得到语音播放请求中所包括的语义，之后，可以从语义中提取命中播放时机语义槽位的预约播放时机，以及命中播放参数语义槽位的播放参数。这里的播放参数，为用于筛选多媒体的参数，例如多媒体名称或多媒体风格等。

在本实施例的一些可选实现方式中，预约播放时机可以包括以下一项或多项：多媒体的排序位置、播放时间和播放场景。

在本实现方式中，多媒体的排序位置是指多媒体在当前播放列表中的位置，例如：“下一首”、“第20首”等；播放时间是指多媒体播放的时间，例如：“早上八点”、“晚上十点”、“每天中午一点”等；播放场景是指需要播放多媒体的场景，例如车速、基于位置的服务、拥堵状况、里程状态、天气、新闻热点、情绪和人群等，在具体地示例中，可以为“在发现我困倦时”、“在堵车时”、“在下雨时”等。

这里的多媒体的排序位置和播放时间，可以明确的指示预约播放时机。这里的播放场景，需要用户语音输入，例如用户说：“小a(终端设备的名称)，堵车好烦啊”，或者终端设备根据设备采集的数据来确定，例如根据终端设备采集的图像、声音、脉搏等来确定用户是否处于困倦状态、根据终端设备的位置信息或集成终端设备的汽车制造厂商所提供的基于位置的服务来确定目前是否堵车、根据互联网公开的天气预报以及当前终端设备的位置信息确定目前是否下雨等。

在本实施例的一些可选实现方式中，播放参数可以包括多媒体的以下一项或多项参数：名称、主创人员、专题多媒体列表、兴趣多媒体列表、语种、风格、场景、情感以及主题。

在本实现方式中，播放参数可以包括多媒体的名称、主创人员、专题多媒体列表、兴趣多媒体列表、语种、风格、场景、情感以及主题等。

下面，以多媒体为音频中的歌曲为例进行说明，播放参数中的多媒体名称可以为歌名；主创人员可以为歌手、词作者或曲作者；专题多媒体列表可以为专辑；兴趣多媒体列表可以为歌单；语种可以为华语、粤语、英语、日语、韩语、德语、法语、其它语种等；风格可以为流行、摇滚、民谣、电子、舞曲、说唱、轻音乐、爵士、乡村、黑人音乐、古典、民族、英伦、金属、朋克、蓝调、雷鬼、拉丁、另类、新纪元、古风、后摇滚、新派爵士等；场景可以为清晨、夜晚、学习、工作、午休、下午茶、地铁、驾车、运动、旅行、散步、酒吧等；情感可以为怀旧、清新、浪漫、性感、伤感、治愈、放松、孤独、感动、兴奋、快乐、安静、思念等；主题则可以为：影视原声、动漫、校园、游戏、70后、80后、90后、网络歌曲、ktv、经典、翻唱、吉他、钢琴、器乐、儿童、榜单、00后等。

在步骤230中，基于播放参数，生成多媒体列表。

在本实施例中，基于从语音播放请求中提取的播放参数，可以从多媒体库或网络数据中提取符合播放参数的多媒体，例如，从语音播放请求中提取的播放参数为“英语”、“乡村”和“歌曲”，那么，可以从曲库中提取同时满足“英语”和“乡村”的歌曲，生成歌曲列表。

在本实施例的一些可选实现方式中，上述基于播放参数，生成多媒体列表还可以包括：基于播放参数和以下一项或多项生成待播放歌单：多媒体的时效热度、用户画像和用户喜好反馈数据。

在本实现方式中，用户画像和用户喜好数据均可以基于大数据或用户的历史交互数据得到。在这里，通过基于播放参数，同时参考用户画像以及用户输入的喜好反馈数据，可以筛选出更为匹配用户喜好的个性化多媒体列表，从而提高多媒体列表中的多媒体的针对性。

在步骤240中，响应于当前时机满足预约播放时机，播放多媒体列表中的多媒体。

在本实施例中，响应于终端设备监测到目前的条件符合预约播放时机，可以经由终端设备的扬声器来播放多媒体列表中的多媒体。例如，当从语音播放请求中提取的预约播放时机为“早上八点”，那么在终端设备监测到当前时间为早上八点时，可以播放多媒体列表中的多媒体。

在播放多媒体列表时，可以保留播放该多媒体列表之前的历史播放列表，以便在用户输入“上一首歌”的播放请求时，仍能回到历史播放列表中的内容。

可选地，在步骤250中，上述播放多媒体的方法还可以包括：语音反馈用户对于语音播放请求的答复信息。

在本实现方式中，可以采用语音来答复用户的播放请求，以便用户可以及时便捷的接收终端设备的反馈。例如，在接收用户的语音播放请求并生成多媒体列表后，可以向用户反馈“好的”。或者在未能提取到播放参数时，向用户反馈“sorry，没找到相关歌曲”。

在本实施例的一些可选实现方式中，上述语音反馈用户对于语音播放请求的答复信息包括：响应于生成多媒体列表，语音反馈收到指令信息；响应于以下任意一项语音反馈用户未找到相关歌曲：从语音播放请求中未提取到播放参数；或基于播放参数，未生成待播放歌单；响应于多媒体曲库中无满足播放参数的多媒体版本，语音反馈用户请求播放的多媒体无版权。

在本实现方式中，响应于生成多媒体列表，可以语音反馈用户收到答复信息，例如：“好的”，“没问题”，“ok”等；响应于从语音播放请求中未提取到播放参数，语音反馈用户未找到相关歌曲，或者响应于基于播放参数，未生成待播放歌单，语音反馈用户未找到相关歌曲，例如，用户的语音播放请求中的播放参数为“xx的八里香”，多媒体库中无满足该表述的多媒体，因此反馈“没有找到相关歌曲”。响应于多媒体曲库中无满足播放参数的多媒体版本，语音反馈用户请求播放的多媒体无版权，例如，反馈用户“相关歌曲还没有版权”。

本申请上述实施例提供的一种播放多媒体的方法，基于用户的语音播放请求提取预约播放时机和播放参数，并在预约播放时机播放满足播放参数的多媒体，使得播放的多媒体更为满足用户的需求，从而提升了向用户播放的多媒体的准确度和针对性。

以下结合图3，描述本申请的一种播放多媒体的方法的示例性应用场景。

如图3所示，图3示出了根据本申请的一种播放多媒体的方法的一个应用场景的示意性流程图。

如图3所示，播放多媒体的方法300运行于智能音箱320中，可以包括：

首先，接收用户输入的语音播放请求301：“下一首播放abc”；

之后，从语音播放请求301“下一首播放abc”中，提取预约播放时机302“下一首”和播放参数303“abc”；

之后，基于播放参数303“abc”，生成多媒体列表304：可以包括单曲abc、翻唱版abc以及相似歌曲；

最后，响应于当前时机为当前歌曲播放完毕，满足预约播放时机302“下一首”，播放多媒体列表304中的多媒体305。

应当理解，上述图3中所示出的播放多媒体的方法，仅为播放多媒体的方法的示例性实施例，并不代表对本申请实施例的限定。例如，在响应于当前时机满足预约播放时机302，播放多媒体列表中的多媒体305之后，可以语音反馈用户对于语音播放请求的答复信息。又例如，基于播放参数，生成待播放歌单也可以包括：基于播放参数和以下一项或多项生成待播放歌单：多媒体的时效热度、用户画像和用户喜好反馈数据。

本申请实施例的上述应用场景中提供的一种播放多媒体的方法，可以提高播放的多媒体的准确性和针对性。

进一步参考图4，作为对上述方法的实现，本申请提供了一种播放多媒体的装置的一个实施例，该一种播放多媒体的装置的实施例与图1至图3所示的一种播放多媒体的方法的实施例相对应，由此，上文针对图1至图3中一种播放多媒体的方法描述的操作和特征同样适用于一种播放多媒体的装置400及其中包含的单元，在此不再赘述。

如图4所示，该一种播放多媒体的装置400包括：接收单元410，用于接收用户输入的语音播放请求；提取单元420，用于从语音播放请求中，提取预约播放时机和播放参数；生成单元430，用于基于播放参数，生成多媒体列表；播放单元440，用于响应于当前时机满足预约播放时机，播放多媒体列表中的多媒体。

在一些实施例中，提取单元420所提取的预约播放时机包括以下一项或多项：多媒体的排序位置、播放时间和播放场景。

在一些实施例中，提取单元420所提取的播放参数包括多媒体的以下一项或多项参数：名称、主创人员、专题多媒体列表、兴趣多媒体列表、语种、风格、场景、情感以及主题。

在一些实施例中，装置400还包括：反馈单元450，用于语音反馈用户对于语音播放请求的答复信息。

在一些实施例中，生成单元430进一步用于：基于播放参数和以下一项或多项生成待播放歌单：多媒体的时效热度、用户画像和用户喜好反馈数据。

在一些实施例中，反馈单元450进一步用于以下一项或多项：响应于生成多媒体列表，语音反馈收到指令信息；响应于以下任意一项语音反馈用户未找到相关歌曲：从语音播放请求中未提取到播放参数；或基于播放参数，未能生成待播放歌单；响应于多媒体曲库中无满足播放参数的多媒体版本，语音反馈用户请求播放的多媒体无版权。

在一些实施例中，接收单元410包括：唤醒子单元411，用于接收用户输入的唤醒指令；反馈子单元412，用于语音反馈应答信息；以及接收子单元413，用于接收用户输入的语音播放请求。

本申请还提供了一种设备的实施例，包括：一个或多个处理器；存储装置，用于存储一个或多个程序；当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如上任意一项所述的一种播放多媒体的方法。

本申请还提供了一种计算机可读存储介质的实施例，其上存储有计算机程序，该程序被处理器执行时实现如上任意一项所述的一种播放多媒体的方法。

下面参考图5，其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。图5示出的终端设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图5所示，计算机系统500包括中央处理单元(cpu)501，其可以根据存储在只读存储器(rom)502中的程序或者从存储部分508加载到随机访问存储器(ram)503中的程序而执行各种适当的动作和处理。在ram503中，还存储有系统500操作所需的各种程序和数据。cpu501、rom502以及ram503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。

以下部件连接至i/o接口505：包括键盘、鼠标等的输入部分506；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分507；包括硬盘等的存储部分508；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至i/o接口505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(cpu)501执行时，执行本申请实施例的方法中限定的上述功能。

需要说明的是，本申请实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请实施例中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请实施例中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、rf等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请实施例各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分，所述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括接收单元、提取单元、生成单元和播放单元，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，接收单元还可以被描述为“接收用户输入的语音播放请求的单元”。

作为另一方面，本申请实施例还提供了一种非易失性计算机存储介质，该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质；也可以是单独存在，未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序，当所述一个或者多个程序被一个设备执行时，使得所述设备：接收用户输入的语音播放请求；从语音播放请求中，提取预约播放时机和播放参数；基于播放参数，生成多媒体列表；响应于当前时机满足预约播放时机，播放多媒体列表中的多媒体。

以上描述仅为本申请实施例的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请实施例中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陆广;叶世权;罗夏君;尹相杰
技术所有人：百度在线网络技术（北京）有限公司
我是此专利的发明人

上一篇：主链含笼型倍半硅氧烷双甲板结构的聚芳醚酮树脂及其制备方法与流程
上一篇：一种新型宠物头套的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。