一种智能音箱音频播放方法、装置、电子设备、存储介质与流程

文档序号：24725178发布日期：2021-04-16 15:52阅读：171来源：国知局

1.本发明涉及智能音箱技术领域，尤其涉及一种智能音箱音频播放方法、装置、电子设备、存储介质。

背景技术：

2.智能音箱是一种新型的智能电子产品，大都具有语音输入功能以及远距离语音采集功能，通过将多个型号较小的mems麦克风按照一定的阵列方式排布，固定于音箱内部的pcb板上，使得音箱对来自各个角度和方向的语音都能够进行很好的采集。但是，在实际的使用过程中，音箱的喇叭发出声音，使得音箱整体以及内部的pcb板处于振动状态，对麦克风采集的语音信号造成了的干扰，公开号为cn107134286a的发明专利申请公开了一种基于语音交互的无线音频播放方法、音乐播放器及存储介质，通过智能音乐播放器接收用户的控制语音，通过无线通讯连接大功率音箱进行播放，将接收和播放设别分开设置，降低播放音频对语音指令识别效果的影响，但是该方法没有解决在使用音频播放器播放音频时，如何消除pcb板的振动对接收语音信号的影响，在此情况下，小功率的音频播放器只能作为控制器使用，无法独立作为播放器，限制了设备的用途。

技术实现要素：

3.本发明所要解决的技术问题在于提供一种能够消除播放音频对接收音频效果影响的智能音箱音频播放方法。
4.本发明是通过以下技术方案解决上述技术问题的：一种智能音箱音频播放方法，包括以下步骤：
5.步骤a：智能音箱接收到唤醒语音，切换到唤醒状态，唤醒状态下，如果智能音箱处于播放状态，则降低智能音箱输出音量；
6.步骤b：智能音箱接收播放控制语音，基于播放控制语音提取播放关键词，生成播放请求；
7.步骤c：基于播放请求访问音频流服务器，依次从音频流服务器获取对应的音频流数据；
8.步骤d：智能音箱播放收到的音频流数据。
9.本发明基于唤醒语音唤醒智能音箱，在智能音箱播放音频时，被唤醒后能够主动降低播放音量以方便接收用户后续语音指令，提高识别精度，解决了自身播放振动对接收控制指令的影响，从而使智能音箱能够有效的充当控制器和播放器，提升用户体验；在智能音箱中解析控制指令得到播放请求，并访问对应的服务器，能够基于用户指定的音频信息访问不同的音频流服务器，解决因版权等问题导致的单一音频流服务器无法满足用户需求的问题，通过统一的端口进行控制，使用方便，用户体验更好。
10.优选的，所述唤醒语音内容为智能音箱的标识名，唤醒语音能够将智能音箱从休眠状态切换至唤醒状态；用户在预设时间段内未进行任何操作或输入任何有效语音指令，
智能音箱进入休眠状态。
11.优选的，步骤b中智能音箱接收到播放控制语音后，通过解析得到播放控制语音对应的文本信息，根据文本信息解析得到所述播放关键词，智能音箱根据播放关键词解析出对应的音频流服务器地址，所述播放请求包括播放关键词、音频流服务器地址和播放顺序。
12.优选的，所述播放顺序包括顺序播放、随机播放、循环播放、单曲播放；在文本信息未包括播放顺序时，基于总播放次数顺序播放、基于用户喜好顺序播放或随机播放。
13.优选的，解析播放关键词的方法为利用预设的播放关键词库对文本信息进行解析和匹配，所述播放关键词库包括音频流文件名、演唱者、曲作者、类别、地区、年代、性别中的一种或多种组合。
14.优选的，所述智能音箱基于预设的播放关键词与音频流服务器地址的关系解析得到播放关键词对应的音频流服务器地址，智能音箱播放音频流数据时，所述智能音箱还从音频流服务器缓存下一首待播放音频流数据，当前音频流数据播放完成后，智能音箱播放缓存数据。
15.优选的，如果无法从文本信息中解析出播放关键词，则基于用户的历史播放数据随机生成播放关键词，或者基于历史播放数据根据播放次数从高到低依次生成播放关键词。
16.优选的，智能音箱在接收播放控制语音之前，还包括与用户终端通信进行联网的步骤，用户终端通过蓝牙连接智能音箱，通过用户终端选择连接wifi网络，使用用户终端输入账号或者使用智能音箱设备账号登录音频流服务器，获取账号的历史播放数据，所述历史播放数据包括与播放关键词库中的关键词对应的音频流信息，以及音频流服务器地址和音频流播放次数。
17.优选的，如果智能音箱在步骤a之后接收到操作控制请求语音，则解析操作控制请求获取控制关键词，并执行对应的命令；所述控制关键词包括暂停、开始、上一个、下一个、上一首、下一首、音量加、音量减。
18.优选的，所述智能音箱为双喇叭或多喇叭蓝牙音箱。
19.本发明还提供了一种智能音箱音频播放方法，包括
20.步骤i：用户说出智能音箱的唤醒语音；
21.步骤ii：智能音箱接收到唤醒语音，切换到唤醒状态，并发出提示信息，唤醒状态下，如果智能音箱处于播放状态，则降低智能音箱输出音量；
22.步骤iii：智能音箱发出提示信息后，用户说出希望智能音箱执行的播放控制语音；
23.步骤iv：智能音箱接收播放控制语音，基于播放控制语音提取播放关键词，并基于播放关键词解析音频流服务器地址，生成播放请求；
24.步骤v：智能音箱基于播放请求访问对应的音频流服务器；
25.步骤vi：所述音频流服务器响应于播放请求，基于播放请求中的播放顺序，依次将查找到的音频流数据返回智能音箱；
26.步骤vii：智能音箱播放收到的音频流数据。
27.本发明还提供了一种智能音箱音频播放装置，包括
28.唤醒模块：用于接收唤醒语音，切换到唤醒状态，唤醒状态下，如果智能音箱处于
播放状态，则降低智能音箱输出音量
29.播放请求生成模块：用于接收播放控制语音，解析生成播放请求；
30.播放请求发送模块：用于将播放请求发送给解析得到的音频流服务器；
31.音频流数据接收模块：用于接收音频流服务器返回的音频流数据；
32.播放模块：通过智能音箱播放音频流数据。
33.本发明还提供了一种电子设备，包括存储器和处理器，所述存储器用于存储一条或多条计算机指令，所述一条或多条计算机指令被所述处理器执行以实现所述播放方法。
34.本发明还提供了一种可读存储介质，存储有计算机指令，所述计算机指令被处理器执行时能够实现所述的音频播放方法。
35.本发明提供的智能音箱音频播放方法、装置、电子设备、存储介质的优点在于：基于唤醒语音唤醒智能音箱，在智能音箱播放音频时，被唤醒后能够主动降低播放音量以方便接收用户后续语音指令，提高识别精度，解决了自身播放振动对接收控制指令的影响，从而使智能音箱能够有效的充当控制器和播放器，提升用户体验；在智能音箱中解析控制指令得到播放请求，并访问对应的服务器，能够基于用户指定的音频信息访问不同的音频流服务器，解决因版权等问题导致的单一音频流服务器无法满足用户需求的问题，通过统一的端口进行控制，使用方便，用户体验更好。所有播放数据除了能够保存在各音频流服务器的账号上之外，还能够统一的保存在智能音箱上，由此能够实现对不同的音乐播放器进行统一的管理和控制，极大的便利了用户，提升用户满意度，能够融合用户在不同音频流服务器上的历史数据，更好的分析用户的喜好，更智能的理解用户的指令，提升用户满意度。通过对播放控制语音提取播放关键词，得到播放请求，从而只需要对关键词进行检测，降低语音识别难度，通过访问对应的音频流服务器获取数据，从音频流服务器层面滤除错误数据，提高用户体验，并基于音频流服务器反馈的数据播放音频。
附图说明
36.图1为本发明的实施例一提供的智能音箱音频播放方法的流程图。
37.图2为本发明的实施例一提供的智能音箱音频播放方法生成播放请求的流程图；
38.图3为本发明的实施例一提供的智能音箱音频播放方法解析播放关键词的流程图；
39.图4为本发明的实施例一提供的智能音箱音频播放方法对应的音频流服务器的工作流程图；
40.图5为本发明的实施例一提供的智能音箱音频播放方法解析控制关键词的流程图；
41.图6为本发明的实施例一提供的智能音箱音频播放方法进行联网的流程图；
42.图7为本发明的实施例三提供的智能音箱音频播放装置的组成图；
43.图8为本发明的实施例三提供的智能音箱音频播放装置播放请求生成模块的组成图；
44.图9为本发明的实施例三提供的智能音箱音频播放装置结构图。
具体实施方式
45.为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
46.实施例一
47.如图1所示，本实施例提供了一种智能音箱音频播放方法，包括以下步骤：
48.步骤a：智能音箱接收到唤醒语音，切换到唤醒状态，唤醒状态下，如果智能音箱处于播放状态，则降低智能音箱输出音量；
49.本实施例基于唤醒语音唤醒智能音箱，在智能音箱播放音频时，被唤醒后能够主动降低播放音量以方便接收用户后续语音指令，提高识别精度，解决了自身播放振动对接收控制指令的影响，从而使智能音箱能够有效的充当控制器和播放器，提升用户体验。
50.所述唤醒语音的内容为智能音箱的标识名，可由用户自行定义，唤醒语音能够将智能音箱从休眠状态切换至唤醒状态，在唤醒状态，智能音箱能够接受用户的控制语音，智能音箱处于唤醒状态时，用户在预设时间段内未进行任何操作或输入任何有效语音指令，智能音箱自动进入休眠状态；为了与大部分人名或昵称进行区分，一般唤醒语音的内容为四字或以上的短语。
51.步骤b：智能音箱接收播放控制语音，基于播放控制语音提取播放关键词，生成播放请求；
52.参考图2，智能音箱接收到播放控制语音后，将播放控制语音发送给智能音箱，所述智能音箱通过解析得到对应的文本信息，根据文本信息解析得到所述播放关键词，智能音箱根据播放关键词解析出对应的音频流服务器地址，所述播放请求包括播放关键词、音频流服务器地址和播放顺序；
53.参考图3，解析播放关键词的方法为利用预设的播放关键词库对文本信息进行解析和匹配，所述播放关键词库包括音频流文件名、演唱者、曲作者、类别、地区、年代、性别中的一种或多种组合。
54.例如，用户说出“我想听周杰伦的歌”，则播放关键词为“播放
‑
周杰伦”；用户说出“郭德纲”，则播放关键词解析为“播放
‑
郭德纲”；还可以进一步细化播放关键词，以降低搜索噪声，例如对于“周杰伦”，解析为“播放
‑
周杰伦
‑
流行音乐”；对于“郭德纲”，解析为“播放
‑
郭德纲
‑
相声”；由此能够快速的提取关键信息，在用户表达相对繁琐或者有习惯性的口头禅的情况下，可以自动滤除无法识别的短语，最终只基于解析到的播放关键词执行后续步骤。
55.所述智能音箱基于预设的播放关键词与音频流服务器地址的关系解析得到播放关键词对应的音频流服务器地址。
56.例如对于播放关键词“播放
‑
周杰伦
‑
流行音乐”，和“播放
‑
郭德纲
‑
相声”，智能音箱基于音频流的分类结果，使用qq音乐或者网易云音乐等单个或多个音频流服务器搜索“周杰伦”，而对于相声这一类别，智能音箱则访问喜马拉雅或其他音频流服务器进行搜索；在确定音频流服务器类型时，除了依据不同音频流服务器本身的专业类别外，还可以考虑版权等信息，例如在已知周杰伦音乐的版权属于qq音乐的情况下，在解析播放关键词为“播
放
‑
周杰伦
‑
流行音乐”的情况下，智能音箱确定的音频流服务器地址为qq音乐的服务器地址。
57.所述播放顺序包括顺序播放、随机播放、循环播放、单曲播放；智能音箱优先基于用户的播放控制语音提取播放顺序，如用户说“随机播放周杰伦的歌”，则解析后的播放关键词为“播放
‑
周杰伦
‑
qq音乐
‑
随机播放”；在文本信息未包括播放顺序时，基于总播放次数顺序播放、基于用户喜好顺序播放或随机播放，其中用户喜好是根据用户的在不同的音频流服务器上听过的所有音频流数据根据播放次数降序排列得到的，播放次数越多，则说明用户喜好度越高。
58.如果无法从文本信息中解析出播放关键词，则基于用户的历史播放数据随机生成播放关键词，或者根据历史播放数据根据播放次数从高到低依次生成播放关键词。例如用户说出“我想听歌”，则匹配不到任何具体的歌曲、作者或类型信息，此时基于用户的历史偏好依次播放用户播放频次最高的歌曲。
59.本实施例在智能音箱内完成播放关键词的解析，并进一步分析确定音频流服务器地址和播放顺序，由此能够基于音乐版权自动确定对应的音乐提供方，并在对应的音频流服务器上进行搜索，从而解决单一服务器部分音频流数据版权缺失的问题，能够满足用户的需求，而且操作便捷，用户只需要通过统一的接口，即智能音箱进行控制即可，所有播放数据除了能够保存在各音频流服务器的账号上之外，还能够统一的保存在智能音箱上，由此能够实现对不同的音乐播放器进行统一的管理和控制，极大的便利了用户，提升用户满意度。
60.步骤c：基于播放请求访问音频流服务器，依次从音频流服务器获取对应的音频流数据；智能音箱基于解析到的播放请求，访问并搜索对应的音频流服务器，并将搜索结果返回智能音箱，在存在多个搜索结果的情况下，基于解析得到的播放顺序依次返回给智能音箱；
61.对于音频流服务器，参考图4，其工作方法为：音频流服务器响应于所述播放请求，将对应的音频流数据发送给智能音箱，所述播放请求至少包括：音频流服务器地址、播放关键词、播放顺序；连接到音频流服务器之后，根据播放关键词在音频流服务器上查找对应的音频流数据；基于所述播放请求中包含的播放顺序，将查找到的音频流数据依次发送给智能音箱；
62.智能音箱在播放搜索到的音频流数据时，所述智能音箱还从音频流服务器缓存下一首待播放音频流数据，当前音频流数据播放完成后，智能音箱播放缓存数据；如果在当前音频流数据播放完成之前，智能音箱再次接收到其他播放控制语音，则基于最新的播放控制语音执行以上步骤。
63.步骤d：通过智能音箱播放音频流数据，为了提高播放音质，得到更丰富的高低音效果，所述智能音箱选用双喇叭或多喇叭蓝牙音箱。
64.进一步的，参考图5，如果智能音箱在步骤b中接收到播放控制语音后解析出控制关键词，则执行对应的控制操作，所述控制关键词包括暂停、开始、上一个、下一个、上一首、下一首、音量加、音量减。
65.如果智能音箱处于播放状态时被唤醒，在步骤b中根据播放控制语音执行后续步骤，访问音频流服务器得到新的音频流数据，则播放新的音频流数据，并丢弃前次任务缓存
的音频流数据，重新对当前任务缓存待播放的音频流数据。
66.参考图6，以上播放方法需要基于网络访问音频流服务器，智能音箱在接收播放控制语音之前，还包括与用户终端通信进行联网的步骤，用户终端通过蓝牙连接智能音箱，通过用户终端选择连接wifi网络，使用用户终端输入账号或者使用智能音箱设备账号登录音频流服务器，获取账号的历史播放数据，所述历史播放数据包括与播放关键词库中的关键词对应的音频流信息，音频流服务器地址和音频流播放次数；从而能够将用户在不同音频流服务器中的历史数据集中到智能音箱中，方便进行统一的控制。
67.实施例二
68.本实施例提供的音频播放方法包括以下步骤：
69.一种智能音箱音频播放方法，包括
70.步骤i：用户说出智能音箱的唤醒语音；
71.步骤ii：智能音箱接收到唤醒语音，切换到唤醒状态，并发出提示信息，唤醒状态下，如果智能音箱处于播放状态，则降低智能音箱输出音量；
72.步骤iii：智能音箱发出提示信息后，用户说出希望智能音箱执行的播放控制语音；
73.步骤iv：智能音箱接收播放控制语音，基于播放控制语音提取播放关键词，并基于播放关键词解析音频流服务器地址，生成播放请求；
74.步骤v：智能音箱基于播放请求访问对应的音频流服务器；
75.步骤vi：所述音频流服务器响应于播放请求，基于播放请求中的播放顺序，依次将查找到的音频流数据返回智能音箱；
76.步骤vii：智能音箱播放收到的音频流数据。
77.实施例三
78.基参考图7，基于以上音频播放方法，本实施例还提供了一种智能音箱音频播放装置，包括：
79.唤醒模块：用于接收唤醒语音，切换到唤醒状态，唤醒状态下，如果智能音箱处于播放状态，则降低智能音箱输出音量；
80.播放请求生成模块：用于接收播放控制语音，解析生成播放请求；
81.播放请求发送模块：用于将播放请求发送给解析得到的音频流服务器；
82.音频流数据接收模块：用于接收音频流服务器返回的音频流数据；
83.播放模块：通过智能音箱播放音频流数据。
84.参考图8，所述播放请求生成模块，包括
85.语音接收和处理单元：用于接收用户环境中的声音信息，并对接收到的声音信息进行降噪处理和回声消除处理；所述回声消除的目的是去掉智能音箱自身播放的背景声音，从而进一步提高对控制指令的辨识能力，提升用户体验；
86.离线语音识别单元：用于对语音接收和处理单元处理过的声音信息进行离线语音识别，所述离线语音识别的范围包括了播放控制关键词的识别，所述控制关键词包括暂停、开始、上一个、下一个、上一首、下一首、音量加、音量减；
87.语音发送和解析单元：用于通过智能音箱的语音云接口，将处理过的声音信息发送给服务器，通过服务器解析出播放控制语音对应的文本信息，并根据文本信息解析出播
放关键词、音频流服务器地址和音频播放顺序；
88.播放请求生成单元：用于融合播放关键词、音频流服务器地址和音频播放顺序生成播放请求。
89.所述唤醒模块可以基于播放请求生成模块的语音接收和处理单元获取唤醒语音。
90.参考图9，所述智能音箱音频播放设备还包括
91.联网模块：用于连接wifi网络；
92.反馈模块：用于获取和反馈用户在智能音箱和各音频流服务器中的历史数据；
93.缓冲模块：，用于将音频流数据存入缓冲区。
94.实施例四
95.本实施例还提供了一种电子设备，包括存储器和处理器，所述存储器用于存储一条或多条计算机指令，所述一条或多条计算机指令被所述处理器执行能够执行以下方法：
96.步骤a：智能音箱接收到唤醒语音，切换到唤醒状态，唤醒状态下，如果智能音箱处于播放状态，则降低智能音箱输出音量；
97.步骤b：智能音箱接收播放控制语音，基于播放控制语音提取播放关键词，生成播放请求；
98.步骤c：基于播放请求访问音频流服务器，依次从音频流服务器获取对应的音频流数据；
99.步骤d：智能音箱播放收到的音频流数据。
100.实施例五
101.本实施例还提供了一种可读存储介质，存储有计算机指令，所述计算机指令被处理器执行时能够执行以下方法：
102.步骤a：智能音箱接收到唤醒语音，切换到唤醒状态，唤醒状态下，如果智能音箱处于播放状态，则降低智能音箱输出音量；
103.步骤b：智能音箱接收播放控制语音，基于播放控制语音提取播放关键词，生成播放请求；
104.步骤c：基于播放请求访问音频流服务器，依次从音频流服务器获取对应的音频流数据；
105.步骤d：智能音箱播放收到的音频流数据。
106.以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：彭媛;操灿;方律
技术所有人：合肥飞尔智能科技有限公司
我是此专利的发明人

上一篇：一线生料磨外循环系统的制作方法
上一篇：一种智能交直流配电监控系统的制作方法