播放控制方法、装置、电子设备和存储介质与流程

文档序号：28483100发布日期：2022-01-14 22:23阅读：83来源：国知局

1.本发明实施例涉及通信技术领域，尤其涉及一种播放控制方法、装置、电子设备和存储介质。

背景技术：

2.智能音箱作为一种低成本、高灵活性的智能设备，可以为用户提供音乐播放服务、实时消息提醒等服务，也可以作为其他应用程序的运行平台。此外，智能音箱还提供了便捷的多种人机交互接口，能够实现诸如实体按键控制、移动终端控制、语音识别控制等。
3.但是，智能音箱由于其低成本和高灵活性，与其他的用户设备相比，不一定能在所有方面提供较佳的用户体验，因此，在设备能力方面，还存在改进的空间。

技术实现要素：

4.有鉴于此，本发明实施例提供一种播放控制方法、装置、电子设备和存储介质，以解决或缓解上述问题。
5.根据本发明实施例的第一方面，提供了一种播放控制方法，包括：获取对目标流媒体对象进行播放的播放请求，所述播放请求中包括所述目标流媒体对象的资源信息；响应所述播放请求，基于所述资源信息，向播放端传输所述目标流媒体对象。
6.根据本发明实施例的第二方面，提供了一种播放控制方法，包括：接收控制端发送的目标音频流的播放请求触发消息；响应所述播放请求触发消息，基于所述目标音频流的资源信息，向所述控制端发送对所述目标音频流进行播放的播放请求，以便所述控制端基于所述资源信息传输所述目标音频流。
7.根据本发明实施例的第三方面，提供了一种播放控制装置，包括：请求获取模块，获取对目标流媒体对象进行播放的播放请求，所述播放请求中包括所述目标流媒体对象的资源信息；流媒体传输模块，响应所述播放请求，基于所述资源信息，向播放端传输所述目标流媒体对象。
8.根据本发明实施例的第四方面，提供了一种播放控制装置，包括：消息接收模块，接收控制端发送的目标音频流的播放请求触发消息；请求发送模块，响应所述播放请求触发消息，基于所述目标音频流的资源信息，向所述控制端发送对所述目标音频流进行播放的播放请求，以便所述控制端基于所述资源信息传输所述目标音频流。
9.根据本发明实施例的第五方面，提供了一种电子设备，所述设备包括：一个或多个处理器；计算机可读介质，配置为存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如第一方面或第二方面所述的方法。
10.根据本发明实施例的第六方面，提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面或第二方面所述的方法。
11.在本发明实施例的方案中，由于能够响应播放请求，基于资源信息，向播放端传输
目标音频流，因此实现了对播放端的播放能力的有效利用。
附图说明
12.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。
13.图1a为本发明的一个实施例的播放控制方法和装置所适用的一个示例的网络架构的示意图；
14.图1b为本发明的另一实施例的播放控制方法的示意性流程图；
15.图2为本发明的另一实施例的播放控制方法的示意性流程图；
16.图3为本发明的另一实施例的播放控制方法的示意性流程图；
17.图4a为本发明的另一实施例的一个示例的播放触发场景的示意图；
18.图4b为本发明的另一实施例的一个示例的播放控制场景的示意图；
19.图5a为本发明的另一实施例的另一示例的播放触发场景的示意图；
20.图5b为本发明的另一实施例的另一示例的播放触发场景的示意图；
21.图6a为本发明的另一实施例的另一示例的播放控制场景的示意图；
22.图6b为本发明的另一实施例的另一示例的播放控制场景的示意图；
23.图7为本发明的另一实施例的播放控制装置的示意性框图；
24.图8为本发明的另一实施例的播放控制装置的示意性框图；
25.图9为本发明的另一实施例的电子设备的示意性结构图；
26.图10为本发明的另一实施例的电子设备的硬件结构。
具体实施方式
27.为了使本领域的人员更好地理解本发明实施例中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明实施例一部分实施例，而不是全部的实施例。基于本发明实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本发明实施例保护的范围。
28.下面结合本发明实施例附图进一步说明本发明实施例具体实现。图1a为本发明的一个实施例的播放控制方法和装置所使用的一个示例的网络架构的示意图。如图所示，用户20通过人机交互界面11对电子设备10进行控制。电子设备10可以为嵌入式设备或物联网设备等。所述电子设备10具有语音唤醒模块13、数据处理模块12和网络接口14。应理解，网络接口14可以将对用户20针对电子设备10的语音控制信息发送到服务端60进行语音识别。上述的语音信息仅仅为示例性的，用户20针对电子设备10的操作指令还可以为其他形式的消息。例如，诸如指纹识别或人脸识别的生物特征信息指令等。上述的服务端60具有的语音识别功能仅仅为示例性的，例如，服务端60还可以包括对上述的生物特征信息进行识别的识别服务器。相应地，服务端60还包括存储装置61。存储装置61可以存储诸如语音识别样本、生物特征信息识别样本等。还应理解，用户20在人机交互界面输入的操作指令还可以经由电子设备10本地进行识别而做出响应。例如，上述的操作指令可以包括但不限于手势指
令、触控指令、流设备输入指令、姿态指令、远程控制指令等。
29.内容服务端50可以包括内容服务器和数据存储(诸如，内容数据库)51。例如，内容数据库51中可以存储诸如视频资源、音频资源等数字媒体资源。
30.内容服务器可以从内容数据库51中读取内容、存入内容、更新内容或删除内容等。内容服务器还可以管理内容的资源信息。在一个示例中，语音识别服务端60可以向内容服务器请求访问内容的资源信息(例如，统一资源标识或统一资源定位符等)。内容服务端50可以将访问内容的资源信息返回到语音识别服务端60或者电子设备10。在另一示例中，电子设备10可以向内容服务器请求访问内容的资源信息。内容服务端50可以将访问内容的资源信息返回到电子设备10。
31.上述的服务端60可以通过诸如互联网的网络30与电子设备10进行通信，以便进行控制消息的传输或数据的传输。图中所示的链路40可以仅仅为是示例性的，并且在其他示例中，链路40不必然直接接入网络30，也可以通过其他网络间接地与网络30连接。电子设备10、服务端50和服务端60可以位于同一接入点，也可以处于不同的接入点。本发明实施例对此不作限定。上述的网络30仅仅为示例性的，可替代地，网络30还可以为诸如移动网络或其他异构网络，来替代上述的互联网。在一些实施例中，服务端60可以绕过上述网络30与电子设备进行端到端的通信，或者经由其他网络与电子设备进行通信。
32.网络接口14可以为集成的网络接口，用于与服务端60进行通信。网络接口14还可以被配置为分离的接口，即，网络接口14被配置为两个网路接口模块，其中，第一网络接口模块与其他服务端进行通信。例如，第二网络接口模块与服务端60进行通信。语音唤醒模块13可以包括语音唤醒引擎。语音唤醒模块13还可以包括去噪处理子模块等。数据处理模块12可以包括压缩组件、音频播放组件等。应理解，上述的配置仅仅为示例性的，例如，可以配置音频模块，用于实现网络接口14、语音唤醒模块13或数据处理模块12中的至少一者的部分功能。本发明实施例对此不作限定。下面将具体说明和描述本发明实施例的各种实现方式，应理解，本发明实施例的数据处理方法可以适用于上述的网络架构，也可以适用于其他的网络架构。
33.图1b为本发明的另一实施例的播放控制方法的示意性流程图。图1b的播放控制方法可以适用于任意适当的具有数据处理能力的电子设备，包括但不限于：嵌入式设备、物联网设备、服务器、移动终端(如手机、pad等)和pc机等，该方法包括：
34.110：获取对目标流媒体对象进行播放的播放请求，播放请求中包括目标流媒体对象的资源信息。
35.应理解，文中的电子设备可以为诸如智能音箱的智能设备。在播放控制意义上，电子设备在文中又被称为控制端。在访问诸如目标音频流或目标视频流的内容或资源的意义上，电子设备在文中又被称为客户端。此外，流媒体对象可以为各种流媒体数据格式的音频流或视频流、或者流媒体文件索引格式的音频文件或视频文件。目标流媒体对象可以通过基于任何方式的通信连接传输而进行播放。目标流媒体对象可以通过诸如内容服务端或资源服务端的服务端获取。该服务端可以为诸如公有云、私有云、专有云、混合云的云服务端。此外，目标音频流的资源信息可以为目标音频流在资源服务端对应的资源标识，也可以为目标音频流在客户端对应的资源标识。资源标识可以语音对象的uri(uniform resource identifier,uri)或url(uniform resource locator,统一资源定位符)、诸如歌曲的曲目
的uri或url、视频对象的uri或url等。此外，播放请求可以包括资源信息。播放请求可以通过对资源信息的模拟访问指令触发。
36.120：响应播放请求，基于资源信息，向播放端传输目标流媒体对象。
37.应理解，播放端也可以为诸如智能音箱的智能设备。播放端也可以为具有网络访问能力的高音质音箱，优选地，播放端具有比该电子设备高的音质播放能力，例如，播放端的功率放大器可以比电子设备的功率放大器具有更高的数据处理能力。此外，播放端也可以为案由具有播放能力的应用程序或播放器的终端设备、嵌入式设备、物联网设备等。
38.在本发明实施例的方案中，由于能够响应播放请求，基于资源信息，向播放端传输目标音频流，因此实现了对播放端的播放能力的有效利用。
39.例如，电子设备可以包括设备连接模块、设备控制模块、设备管理模块、播控管理模块和设备认证模块中的至少一个软件模块。例如，设备连接模块可以用于电子设备与其他播放端(音箱或播放器)通过连接协议进行连接。该连接的协议可以为全双工或半双工传输层协议，诸如用户数据报协议(udp，user datagram protocol)、传输控制协议(tcp，transmission control protocol)、websocket协议或http等通信协议。其中，用户数据报协议为一种无连接的传输协议，为应用程序提供了一种无需建立连接就可以发送封装的ip数据包的方法。传输控制协议是一种面向连接的、可靠的、基于字节流的传输层通信协议。websocket是一种在单个tcp连接上进行全双工通信的协议。http是一个简单的请求-响应协议，它通常运行在tcp之上。它指定了客户端可能发送给服务器什么样的消息以及得到什么样的响应。此外，设备控制模块可以用于在设备连接完成后，可以对设备进行控制，控制命令可以是js对象简谱格式/xml格式等。应理解，js对象简谱(javascript object notation,json)是一种轻量级的数据交换格式。xml为一种可扩展标记语言，标准通用标记语言的子集。此外，设备管理模块可以用于对局域网内发现的设备进行分组，状态，存储管理。播控管理模块可以用于通过播控命令对播放端的播放状态进行控制，同时用户在播放端上直接操作后，需要与电子设备进行同步，比如在播放端上直接调节音量后，需要通过状态同步命令同步给电子设备。此外，设备认证模块可以用于对设备进行鉴权，只有认证通过的设备才能进行设备连接。
40.在本发明的另一实现方式中，资源信息包括目标音频流在资源服务端对应的第一资源标识，其中，响应播放请求，基于资源信息，向播放端传输目标流媒体对象，包括：响应播放请求，基于第一资源标识，从资源服务端获取目标流媒体对象；通过与播放端的连接，向播放端传输目标流媒体对象。与播放端的连接可以为诸如蓝牙的端到端通信连接、基于同一网络接入点的连接(例如，同一无线局域网的连接)、基于传输控制协议的连接等。
41.在本发明的另一实现方式中，目标流媒体对象为目标音频流，其中，获取对目标流媒体对象进行播放的播放请求，包括：向播放端发送目标音频流的播放请求触发消息，播放请求触发消息指示播放端基于目标音频流的资源信息触发对目标音频流进行播放的播放请求。在本发明实施例的方案中，由于播放请求触发消息指示播放端触发对目标音频流进行播放的播放请求，因此实现了对播放端的主动控制。
42.在本发明的另一实现方式中，目标流媒体对象为目标视频流，资源信息包括目标视频流在资源服务端对应的第三资源标识，其中，响应播放请求，基于资源信息，向播放端传输目标流媒体对象，包括：响应播放请求，基于第三资源标识，从资源服务端获取目标视
频流；通过与播放端的连接，向播放端传输目标视频流，以便在播放端的屏幕上播放目标视频流。例如，播放端可以有屏设备，与播放端的连接可以为诸如蓝牙的端到端通信连接、基于同一网络接入点的连接(例如，同一无线局域网的连接)、基于传输控制协议的连接等。
43.图2为本发明的另一实施例的播放控制方法的示意性流程图。图2的播放控制方法可以适用于任意适当的具有数据处理能力的电子设备，包括但不限于：嵌入式设备、物联网设备、服务器、移动终端(如手机、pad等)和pc机等，该方法包括：
44.210：向播放端发送目标音频流的播放请求触发消息，播放请求触发消息指示播放端基于目标音频流的资源信息触发对目标音频流进行播放的播放请求。
45.此外，目标音频流可以为各种流媒体数据格式或流媒体文件索引格式的音频文件。目标音频流的音频文件可以基于任何方式的通信连接获得。目标音频流可以通过基于任何方式的通信连接传输而进行播放。目标音频流可以通过诸如内容服务端或资源服务端的服务端获取。目标音频流可以为语音对象的音频流、诸如歌曲的曲目的音频流、视频对象的音频流等。
46.220：响应播放请求，基于资源信息，向播放端传输目标音频流。
47.应理解，播放请求可以包括资源信息。播放请求可以通过对资源信息的模拟访问指令触发。此外，在一个示例中，基于资源信息向播放端传输目标音频流，包括：基于资源信息，从资源服务端获取目标音频流，并且将目标音频流转发到播放端。在另一示例中，基于资源信息向播放端传输目标音频流，包括：将对应于本地的资源信息的目标音频流传输到播放端。在另一示例中，基于资源信息向播放端传输目标音频流，包括：基于服务端资源信息，从资源服务端获取目标音频流，并且基于客户端资源信息，将目标音频流转发到播放端。
48.在本发明实施例的方案中，由于播放请求触发消息指示播放端触发对目标音频流进行播放的播放请求，因此实现了对播放端的主动控制。
49.例如，电子设备可以包括设备连接模块、设备控制模块、设备管理模块、播控管理模块和设备认证模块中的至少一个软件模块。例如，设备连接模块可以用于电子设备与其他播放端(音箱或播放器)通过连接协议进行连接。该连接的协议可以为全双工或半双工传输层协议，诸如用户数据报协议(udp，user datagram protocol)、传输控制协议(tcp，transmission control protocol)、websocket协议或http等通信协议。其中，用户数据报协议为一种无连接的传输协议，为应用程序提供了一种无需建立连接就可以发送封装的ip数据包的方法。传输控制协议是一种面向连接的、可靠的、基于字节流的传输层通信协议。websocket是一种在单个tcp连接上进行全双工通信的协议。http是一个简单的请求-响应协议，它通常运行在tcp之上。它指定了客户端可能发送给服务器什么样的消息以及得到什么样的响应。此外，设备控制模块可以用于在设备连接完成后，可以对设备进行控制，控制命令可以是js对象简谱格式/xml格式等。应理解，js对象简谱(javascript object notation,json)是一种轻量级的数据交换格式。xml为一种可扩展标记语言，标准通用标记语言的子集。此外，设备管理模块可以用于对局域网内发现的设备进行分组，状态，存储管理。播控管理模块可以用于通过播控命令对播放端的播放状态进行控制，同时用户在播放端上直接操作后，需要与电子设备进行同步，比如在播放端上直接调节音量后，需要通过状态同步命令同步给电子设备。此外，设备认证模块可以用于对设备进行鉴权，只有认证通过
的设备才能进行设备连接。
50.在一个示例中，客户端可以基于第一通信连接向应用服务端人机交互指令(例如，语音指令)，应用服务端对人机交互指令进行识别，得到对应于音频对象(例如，歌曲)的标识。例如，人机交互指令的语义内容中包括音频对象的关键词。应用服务器可以基于第二通信连接将该标识发送到内容服务器(或者，资源服务器)，获得该音频对象的音频流的资源信息(例如，uri或url)。此外，可以通过对应关系，确定与该标识对应的资源信息。该对应关系可以存储在内容服务器(或者，资源服务器)侧。
51.电子设备(或者被称为客户端或控制端)可以主动基于该服务端资源信息访问资源服务器以获得相应的音频流。或者，电子设备(或者被称为客户端或控制端)响应播放端发送的播放请求，基于该服务端资源信息访问资源服务器，以获得相应的音频流。应理解，上述的第一通信连接和第二通信连接中的任一者可以为用户数据报协议(udp，user datagram protocol)、传输控制协议(tcp，transmission control protocol)、全双工传输层通信(例如，websocket通信)或半双工传输层通信(例如，http通信)等。
52.在另一示例中，客户端可以基于目标通信连接向应用服务端人机交互指令(例如，语音指令)，应用服务端对人机交互指令进行识别，得到对应于音频对象(例如，歌曲)的标识。例如，人机交互指令的语义内容中包括音频对象的关键词。应用服务器可以通过对应关系，获得该音频对象的音频流的资源信息(例如，uri或url)。该对应关系可以存储在应用服务器中。此外，可以通过对应关系，确定与该标识对应的资源信息。电子设备(或者被称为客户端或控制端)可以主动基于该服务端资源信息访问资源服务器以获得相应的音频流。或者，电子设备(或者被称为客户端或控制端)响应播放端发送的播放请求，基于该服务端资源信息访问资源服务器，以获得相应的音频流。
53.应理解，上述的目标通信连接可以为用户数据报协议(udp，user datagram protocol)、传输控制协议(tcp，transmission control protocol)、全双工传输层通信(例如，websocket通信)或半双工传输层通信(例如，http通信)等。
54.如上所述，资源服务端或应用服务端可以下发音频对象的服务端资源信息(歌曲url)给电子设备。电子设备可以将该服务端资源信息转换为本地资源信息(或者，客户端资源信息)(或者，本地url)。播放端可以在接收到本地资源信息(或者，本地url)后通过诸如http客户端的客户端访问电子设备(作为资源服务器的反向代理)。然后，电子设备将播放端请求的本地资源信息(本地url链接)还原为服务端资源信息(歌曲url链接)并访问该url的资源服务端(例如，内容云端)获取到音频对象的音频流，并将其下发给播放端。
55.在本发明的另一实现方式中，资源信息包括目标音频流在资源服务端对应的第一资源标识，响应播放请求，基于资源信息，向播放端传输目标音频流，包括：响应播放请求，基于第一资源标识，从资源服务端获取目标音频流；向播放端传输目标音频流。
56.由于能够响应播放请求向播放端传输从资源服务端获取的目标音频流，因此通过转发目标音频流，实现了对资源服务端的反向代理。此外，由于无需对目标音频流进行转发以外的其他处理，有利于实现目标音频流在播放端的播放流畅性。
57.在本发明的另一实现方式中，资源信息包括目标音频流在客户端对应的第二资源标识，该方法还包括：根据目标音频流在资源服务端对应的第一资源标识，生成第二资源标识，向播放端发送目标音频流的播放请求触发消息，包括：将包括第二资源标识的播放请求
触发消息发送到播放端。
58.由于根据目标音频流在资源服务端对应的第一资源标识生成目标音频流在客户端对应的第二资源标识，并且将第二资源标识发送到播放端，因此避免了泄露第一资源标识的风险，从而保证了数据安全。
59.避免了盗链，即，保证了信息安全，电子设备将歌曲url转换为本地url以json格式发送给播放端，url可以为可以为用户数据报协议(udp，user datagram protocol)链接、传输控制协议(tcp，transmission control protocol)链接、全双工传输层通信(例如，websocket通信)链接或半双工传输层通信(例如，http通信)链接等。
60.在本发明的另一实现方式中，播放请求中包括第二资源标识，响应播放请求，基于资源信息，向播放端传输目标音频流，包括：响应播放请求，基于第二资源标识，确定第一资源标识；经由第一资源标识，从资源服务端获取目标音频流，向播放端传输。
61.由于基于目标音频流在客户端对应的第二资源标识确定目标音频流在资源服务端对应的第一资源标识，并且播放请求中包括第二资源标识，因此避免了泄露第一资源标识的风险，从而保证了数据安全。
62.在本发明的另一实现方式中，该方法还包括：通过向应用服务端发送第一人机交互指令，获取第一资源标识，其中，应用服务端对第一人机交互指令进行指令识别，得到对应于第一资源标识的指令识别结果。
63.由于能够通过向应用服务端发送第一人机交互指令，获取第一资源标识，因此利用了应用服务端的数据处理能力，实现了第一资源标识的高效获取。
64.在一个示例中，应用服务端可以将作为识别结果的音频对象的标识，发送到资源服务器，并且从资源服务器获取对应于该标识的第一资源标识。
65.在另一示例中，应用服务端可以存储有音频对象标识与资源标识的对应关系。基于该对应关系，应用服务端可以确定与作为识别结果的音频对象的标识对应的资源标识。
66.在本发明的另一实现方式中，该方法还包括：经由第一资源标识，从资源服务端，缓存目标音频流的音频文件；将第二资源标识与音频文件关联，响应播放请求，基于资源信息，向播放端传输目标音频流，包括：响应播放请求，基于第二资源标识，确定音频文件；基于音频文件，向播放端传输目标音频流。
67.由于先缓存了目标音频流的音频文件，再向播放端传输目标音频流。因此实现了资源服务端的反向代理，并且由于音频文件缓存在本地，因此减少了对资源服务端的实时连接的要求。
68.在本发明的另一实现方式中，经由第一资源标识，从资源服务端，缓存目标音频流的音频文件，包括：经由第一资源标识，从资源服务端，以第一流媒体数据索引格式，获取目标音频流；将目标音频流从第一流媒体数据索引格式转换为第二流媒体数据索引格式，并缓存为音频文件，基于音频文件，向播放端传输目标音频流，包括：基于音频文件，以第二流媒体数据索引格式，向播放端传输目标音频流。
69.播放端在接收到本地url后，可以通过http客户端访问电子设备本地http流媒体服务器获取音频流。例如，播放端可以使用相应流媒体播放器播放音乐。
70.由于将目标音频流从第一流媒体数据索引格式转换为第二流媒体数据索引格式，因此向播放端进行目标音频流的传输实现了与从资源服务端获取目标音频流不同的流媒
体数据索引格式。由于能够实现流媒体数据索引格式的转换，因此播放端和资源服务端的各自流媒体数据索引格式无需一致，从而降低了对播放端的流媒体数据索引格式的要求。
71.电子设备可以将歌曲音频数据统一转换为诸如m3u8的流媒体数据格式，并将该数据缓存在本地。可将将本地url以json格式发送给播放端。上述的m3u8是一种索引文件格式，例如，采用m3u8文件可以通过它来解析对应的存储在服务器上的音视频网络地址，从而实现在线播放。
72.在本发明的另一实现方式中，该方法还包括：通过向应用服务端发送第二人机交互指令，获取第一资源标识，其中，应用服务端对第二人机交互指令进行指令识别，得到对应于第一资源标识的指令识别结果，将包括第二资源标识的播放请求触发消息发送到播放端，包括：响应第一资源标识的获取，将包括第二资源标识的播放请求触发消息发送到播放端。
73.由于能够通过向应用服务端发送第二人机交互指令，获取第一资源标识，因此利用了应用服务端的数据处理能力，实现了第一资源标识的高效获取。
74.在本发明的另一实现方式中，该方法还包括：通过对第三人机交互指令进行本地指令识别；基于本地指令识别结果，向播放端发送播放控制指令，并且在本地更新播放端的播放状态信息。
75.由于能够对第三人机交互指令进行本地指令识别，因此无需与诸如应用服务端的服务端进行连接，即可实现指令识别，实现了数据处理的可靠性。
76.例如，第三人机交互指令可以为用户的语音指令，例如，用户可以对电子设备说出“暂停播放”、“上一首”、“下一首”等语音指令。电子设备可以将语音指令解析转换为json格式的指令，并且通过与播放端建立的全双工传输层通信(例如，websocket通信)或半双工传输层通信(例如，http通信)，将指令发送到播放端。此外，播放端可以在接收到该指令后，将对json进行解析，并进行相应的操作。
77.在本发明的另一实现方式中，该方法还包括：接收播放端发送的播放控制同步指令，播放控制同步指令在完成根据播放控制指令进行的播放控制时生成；基于播放控制同步指令，在本地更新播放端的播放状态信息。
78.由于基于播放控制同步指令进行播放端的播放状态信息的同步，从而提高了以不同方式对播放端进行播放控制的灵活性。
79.电子设备中可能有诸如播放、暂停、上一首、下一首、音量+、音量-的实体按键(或者，物理按键)，或者播放端也由自身的应用程序进行控制。在一个示例中，当用户在播放端进行这些控制后，播放端通过全双工传输层通信(例如，websocket通信)或半双工传输层通信(例如，http通信)，将播放状态以json格式命令同步给电子设备。此外，电子设备在收到指令后进行解析并进行相应的操作。
80.在本发明的另一实现方式中，该方法还包括：向本地局域网发送设备查询消息；在接收到播放端根据设备查询消息发送的响应消息时，建立与播放端的局域网通信连接，向播放端发送目标音频流的播放请求触发消息，包括：基于局域网通信连接，向播放端发送目标音频流的播放请求触发消息。
81.由于能够在本地局域网中进行快速连接，因此进一步提高了基于该连接进行播放控制的效率。例如，通过发现协议在局域网内进行设备的发现。上述的设备发现的协议可以
是ssdp、mdns、udp广播、udp组播等。
82.图3为本发明的另一实施例的播放控制方法的示意性流程图。图3的播放控制方法可以适用于任意适当的具有数据处理能力的电子设备，包括但不限于：嵌入式设备、物联网设备、服务器、移动终端(如手机、pad等)和pc机等，该方法包括：
83.310：接收控制端发送的目标音频流的播放请求触发消息。
84.320：响应播放请求触发消息，基于目标音频流的资源信息，向控制端发送对目标音频流进行播放的播放请求，以便控制端基于资源信息传输目标音频流。
85.在本发明实施例的方案中，由于响应播放端的播放请求，基于资源信息，向播放端传输目标音频流，因此实现了对播放端的播放能力的有效利用，此外，由于播放请求触发消息指示播放端触发对目标音频流进行播放的播放请求，因此实现了对播放端的主动控制。
86.图4a为本发明的另一实施例的一个示例的播放触发场景的示意图。如图所示，在本示例中，在步骤411中，客户端向播放端发送播放请求触发消息。在步骤412中，播放端向客户端发送目标音频流的播放请求。在步骤413中，客户端向播放端传输目标音频流。
87.图4b为本发明的另一实施例的一个示例的播放控制场景的示意图。如图所示，在本示例中，在步骤421中，播放端接收本地播放控制命令。在步骤422中，播放端根据本地播放控制命令，改变播放状态信息。在步骤423中，播放端向控制端(客户端)发送播放控制同步指令。在步骤424中，控制端基于当前播放状态信息，进行更新。
88.在其他示例中，资源服务端或应用服务端可以下发音频对象的服务端资源信息(歌曲url)给电子设备。电子设备可以将该服务端资源信息转换为本地资源信息(或者，客户端资源信息)(或者，本地url)。播放端可以在接收到本地资源信息(或者，本地url)后通过诸如http客户端的客户端访问电子设备(作为资源服务器的反向代理)。然后，电子设备将播放端请求的本地资源信息(本地url链接)还原为服务端资源信息(歌曲url链接)并访问该url的资源服务端(例如，内容云端)获取到音频对象的音频流，并将其下发给播放端。
89.图5a为本发明的另一实施例的另一示例的播放触发场景的示意图。如图所示，在本示例中，在步骤511中，客户端从资源服务端获取目标音频流的音频文件。在步骤512中，客户端缓存该音频文件。在步骤513中，客户端向播放端发送播放请求触发消息。在步骤514中，播放端向客户端发送目标音频流的播放请求。在步骤515中，客户端向播放端传输目标音频流。
90.图5b为本发明的另一实施例的另一示例的播放触发场景的示意图。如图所示，在本示例中，在步骤521中，客户端从资源服务端获取目标音频流的服务端资源标识。在步骤522中，客户端根据服务端资源标识，生成本地资源标识。在步骤523中，客户端向播放端发送播放请求触发消息。在步骤524中，播放端向客户端发送目标音频流的播放请求。在步骤525中，客户端向资源服务端请求目标音频流。
91.在其他示例中，资源服务端或应用服务端可以下发音频对象的服务端资源信息(歌曲url)给电子设备。电子设备可以将该服务端资源信息转换为本地资源信息(或者，客户端资源信息)(或者，本地url)。播放端可以在接收到本地资源信息(或者，本地url)后通过诸如http客户端的客户端访问电子设备(作为资源服务器的反向代理)。然后，电子设备将播放端请求的本地资源信息(本地url链接)还原为服务端资源信息(歌曲url链接)并访问该url的资源服务端(例如，内容云端)获取到音频对象的音频流，并将其下发给播放端。
92.图6a为本发明的另一实施例的另一示例的播放控制场景的示意图。如图所示，在本示例中，在步骤611中，控制端对人机交互指令进行指令识别。在步骤612中，控制端根据识别结果，向播放端发送播放控制指令。在步骤613中，控制端基于当前播放状态信息，进行更新。在步骤614中，播放端根据播放控制指令，改变播放状态信息。
93.图6b为本发明的另一实施例的另一示例的播放控制场景的示意图。如图所示，在本示例中，在步骤621中，控制端获取人机交互指令。在步骤622中，控制端向服务端发送人机交互指令，用于进行指令识别。在步骤623中，应用服务端向控制端返回人机交互指令的识别结果。在步骤624中，控制端根据识别结果，向播放端发送播放控制指令。在步骤625中，控制端基于当前播放状态信息，进行更新。在步骤626中，播放端根据播放控制指令，改变播放状态信息。
94.在其他示例中，资源服务端或应用服务端可以下发音频对象的服务端资源信息(歌曲url)给电子设备。电子设备可以将该服务端资源信息转换为本地资源信息(或者，客户端资源信息)(或者，本地url)。播放端可以在接收到本地资源信息(或者，本地url)后通过诸如http客户端的客户端访问电子设备(作为资源服务器的反向代理)。然后，电子设备将播放端请求的本地资源信息(本地url链接)还原为服务端资源信息(歌曲url链接)并访问该url的资源服务端(例如，内容云端)获取到音频对象的音频流，并将其下发给播放端。
95.图4a至图6b仅仅示出了播放控制方法的若干示例，在其他的示例中，还可以具有其他的交互方式、数据处理方式、基于其他通信协议的通信方法等。本发明实施例对此不作赘述，参照说明书的其他部分可以获得各个步骤或子步骤之间的不同组合以及其他的实施例。
96.图7为本发明的另一实施例的播放控制装置的示意性框图。图7的播放控制装置可以适用于任意适当的具有数据处理能力的电子设备，包括但不限于：嵌入式设备、物联网设备、服务器、移动终端(如手机、pad等)和pc机等，该装置包括：
97.请求获取模块710，获取对目标流媒体对象进行播放的播放请求，所述播放请求中包括所述目标流媒体对象的资源信息；
98.流媒体传输模块720，响应所述播放请求，基于所述资源信息，向播放端传输所述目标流媒体对象。
99.在本发明实施例的方案中，由于能够响应播放请求，基于资源信息，向播放端传输目标音频流，因此实现了对播放端的播放能力的有效利用。
100.在本发明的另一实现方式中，所述资源信息包括所述目标音频流在资源服务端对应的第一资源标识，其中，流媒体传输模块具体用于：响应所述播放请求，基于所述第一资源标识，从所述资源服务端获取所述目标流媒体对象；通过与所述播放端的连接，向所述播放端传输所述目标流媒体对象。
101.在本发明的另一实现方式中，所述目标流媒体对象为目标音频流，其中，请求获取模块具体用于：向播放端发送目标音频流的播放请求触发消息，所述播放请求触发消息指示所述播放端基于所述目标音频流的资源信息触发对所述目标音频流进行播放的播放请求。由于播放请求触发消息指示播放端触发对目标音频流进行播放的播放请求，因此实现了对播放端的主动控制。
102.在本发明的另一实现方式中，资源信息包括目标音频流在资源服务端对应的第一
资源标识，流媒体传输模块具体用于：响应播放请求，基于第一资源标识，从资源服务端获取目标音频流；向播放端传输目标音频流。
103.在本发明的另一实现方式中，资源信息包括目标音频流在客户端对应的第二资源标识，该装置还包括资源标识生成模块，根据目标音频流在资源服务端对应的第一资源标识，生成第二资源标识。请求获取模块具体用于：将包括第二资源标识的播放请求触发消息发送到播放端。
104.在本发明的另一实现方式中，播放请求中包括第二资源标识，流媒体传输模块具体用于：响应播放请求，基于第二资源标识，确定第一资源标识；经由第一资源标识，从资源服务端获取目标音频流，向播放端传输。
105.在本发明的另一实现方式中，请求获取模块还用于：通过向应用服务端发送第一人机交互指令，获取第一资源标识，其中，应用服务端对第一人机交互指令进行指令识别，得到对应于第一资源标识的指令识别结果。
106.在本发明的另一实现方式中，该装置还包括：缓存模块，经由第一资源标识，从资源服务端，缓存目标音频流的音频文件；关联模块，将第二资源标识与音频文件关联，流媒体传输模块具体用于：响应播放请求，基于第二资源标识，确定音频文件；基于音频文件，向播放端传输目标音频流。
107.在本发明的另一实现方式中，缓存模块具体用于：经由第一资源标识，从资源服务端，以第一流媒体数据索引格式，获取目标音频流；将目标音频流从第一流媒体数据索引格式转换为第二流媒体数据索引格式，并缓存为音频文件，流媒体传输模块具体用于：基于音频文件，以第二流媒体数据索引格式，向播放端传输目标音频流。
108.在本发明的另一实现方式中，请求获取模块还用于：通过向应用服务端发送第二人机交互指令，获取第一资源标识，其中，应用服务端对第二人机交互指令进行指令识别，得到对应于第一资源标识的指令识别结果，请求获取模块还用于：响应第一资源标识的获取，将包括第二资源标识的播放请求触发消息发送到播放端。
109.在本发明的另一实现方式中，该装置还包括：指令识别模块，通过对第三人机交互指令进行本地指令识别。第一信息更新模块，基于本地指令识别结果，在本地更新播放端的播放状态信息。请求获取模块还用于：基于本地指令识别结果，向播放端发送播放控制指令。
110.在本发明的另一实现方式中，该装置还包括第一消息接收模块，接收播放端发送的播放控制同步指令，播放控制同步指令在完成根据播放控制指令进行的播放控制时生成。第二信息更新模块，基于播放控制同步指令，在本地更新播放端的播放状态信息。
111.在本发明的另一实现方式中，请求获取模块还用于：向本地局域网发送设备查询消息；该装置还包括第二消息接收模块，在接收到播放端根据设备查询消息发送的响应消息时，建立与播放端的局域网通信连接，请求获取模块具体用于：基于局域网通信连接，向播放端发送目标音频流的播放请求触发消息。
112.在本发明的另一实现方式中，所述目标流媒体对象为目标视频流，所述资源信息包括所述目标视频流在资源服务端对应的第三资源标识，其中，流媒体传输模块：响应所述播放请求，基于所述第三资源标识，从所述资源服务端获取所述目标视频流；通过与所述播放端的连接，向所述播放端传输所述目标视频流，以便在所述播放端的屏幕上播放所述目
标视频流。
113.本实施例的装置用于实现前述多个方法实施例中相应的方法，并具有相应的方法实施例的有益效果，在此不再赘述。此外，本实施例的装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述，在此亦不再赘述。
114.图8为本发明的另一实施例的播放控制装置的示意性框图。图8的播放控制装置可以适用于任意适当的具有数据处理能力的电子设备，包括但不限于：嵌入式设备、物联网设备、服务器、移动终端(如手机、pad等)和pc机等，该装置包括：
115.消息接收模块810，接收控制端发送的目标音频流的播放请求触发消息。
116.播放请求模块820，响应播放请求触发消息，基于目标音频流的资源信息，向控制端发送对目标音频流进行播放的播放请求，以便控制端基于资源信息传输目标音频流。
117.在本发明实施例的方案中，由于能够响应播放请求，基于资源信息，向播放端传输目标音频流，因此实现了对播放端的播放能力的有效利用。此外，由于播放请求触发消息指示播放端触发对目标音频流进行播放的播放请求，因此实现了对播放端的主动控制。
118.在本发明的另一实现方式中，消息发送模块还用于：根据播放控制指令，向控制端发送播放控制同步指令，播放控制同步指令指示在控制端更新播放端的播放状态信息。
119.本实施例的装置用于实现前述多个方法实施例中相应的方法，并具有相应的方法实施例的有益效果，在此不再赘述。此外，本实施例的装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述，在此亦不再赘述。
120.图9为本发明的另一实施例的电子设备的结构示意图；该电子设备可以包括：
121.一个或多个处理器901；
122.计算机可读介质902，可以配置为存储一个或多个程序，
123.当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上述实施例所述的方法。
124.图10为本发明的另一实施例的电子设备的硬件结构；如图10所示，该电子设备的硬件结构可以包括：处理器1001，通信接口1002，计算机可读介质1003和通信总线1004；
125.其中处理器1001、通信接口1002、计算机可读介质1003通过通信总线1004完成相互间的通信；
126.可选地，通信接口1002可以为通信模块的接口；
127.其中，处理器1001具体可以配置为：向播放端发送目标音频流的播放请求触发消息，所述播放请求触发消息指示所述播放端基于所述目标音频流的资源信息触发对所述目标音频流进行播放的播放请求；响应所述播放请求，基于所述资源信息，向所述播放端传输所述目标音频流，或者，
128.接收控制端发送的目标音频流的播放请求触发消息；响应所述播放请求触发消息，基于所述目标音频流的资源信息，向所述控制端发送对所述目标音频流进行播放的播放请求，以便所述控制端基于所述资源信息传输所述目标音频流。
129.处理器1001可以是通用处理器，包括中央处理器(central processing unit，简称cpu)、网络处理器(network processor，简称np)等；还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻
辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
130.计算机可读介质1003可以是，但不限于，随机存取存储介质(random access memory，ram)，只读存储介质(read only memory，rom)，可编程只读存储介质(programmable read-only memory，prom)，可擦除只读存储介质(erasable programmable read-only memory，eprom)，电可擦除只读存储介质(electric erasable programmable read-only memory，eeprom)等。
131.特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含配置为执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分从网络上被下载和安装，和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(cpu)执行时，执行本发明的方法中限定的上述功能。需要说明的是，本发明所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读介质例如可以但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储介质(ram)、只读存储介质(rom)、可擦式可编程只读存储介质(eprom或闪存)、光纤、便携式紧凑磁盘只读存储介质(cd-rom)、光存储介质件、磁存储介质件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输配置为由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、rf等等，或者上述的任意合适的组合。
132.可以以一种或多种程序设计语言或其组合来编写配置为执行本发明的操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++，还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络：包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
133.附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个配置为实现规定的逻辑功能的可执行指令。上述具体实施例中有特定先后关系，但这些先后关系只是示例性的，在具体实现的时候，这些步骤可能会更少、更多或执行顺序有调整。即
在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
134.描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。这些模块的名称在某种情况下并不构成对该模块本身的限定。
135.作为另一方面，本发明还提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如上述实施例所描述的方法。
136.作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：向播放端发送目标音频流的播放请求触发消息，所述播放请求触发消息指示所述播放端基于所述目标音频流的资源信息触发对所述目标音频流进行播放的播放请求；响应所述播放请求，基于所述资源信息，向所述播放端传输所述目标音频流，或者，
137.接收控制端发送的目标音频流的播放请求触发消息；响应所述播放请求触发消息，基于所述目标音频流的资源信息，向所述控制端发送对所述目标音频流进行播放的播放请求，以便所述控制端基于所述资源信息传输所述目标音频流。
138.在本公开的各种实施方式中所使用的表述“第一”、“第二”、“所述第一”或“所述第二”可修饰各种部件而与顺序和/或重要性无关，但是这些表述不限制相应部件。以上表述仅配置为将元件与其它元件区分开的目的。例如，第一用户设备和第二用户设备表示不同的用户设备，虽然两者均是用户设备。例如，在不背离本公开的范围的前提下，第一元件可称作第二元件，类似地，第二元件可称作第一元件。
139.当一个元件(例如，第一元件)称为与另一元件(例如，第二元件)“(可操作地或可通信地)联接”或“(可操作地或可通信地)联接至”另一元件(例如，第二元件)或“连接至”另一元件(例如，第二元件)时，应理解为该一个元件直接连接至该另一元件或者该一个元件经由又一个元件(例如，第三元件)间接连接至该另一个元件。相反，可理解，当元件(例如，第一元件)称为“直接连接”或“直接联接”至另一元件(第二元件)时，则没有元件(例如，第三元件)插入在这两者之间。
140.以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本发明中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗奎;张辉;刘兆健;汪贇;胡俊锋;许秋生
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：一种用于开关电源的软启动电路及方法与流程
上一篇：一种显示设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。