语音消息的处理方法、装置、设备及存储介质与流程

文档序号：25991690发布日期：2021-07-23 21:03阅读：来源：国知局

技术特征：

1.一种语音消息的处理方法，其特征在于，所述方法包括：

获取第一音频数据和第一参考数量个连续的第二音频数据，所述第一音频数据对应语音消息中当前待处理的第一音频帧，所述第一参考数量个连续的第二音频数据对应第二音频帧，所述第二音频帧为所述语音消息中位于所述第一音频帧之后的连续音频帧；

基于所述第一音频数据和所述第二音频数据，确定所述第一音频帧的有效性；

响应于所述第一音频帧无效，确定所述语音消息中位于所述第一音频帧之后的音频帧的有效性，直至得到有效的音频帧，获取与所述有效的音频帧对应的待播放音频数据。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

响应于所述第一音频帧有效，基于所述第一音频数据，获取与所述第一音频帧对应的待播放音频数据。

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一音频数据，获取与所述第一音频帧对应的待播放音频数据，包括：

获取第三音频帧的有效性，所述第三音频帧为所述语音消息中位于所述第一音频帧前一位的音频帧；

响应于所述第三音频帧有效，将所述第一音频数据作为与所述第一音频帧对应的待播放音频数据；

响应于所述第三音频帧无效，获取目标音频数据，基于所述第一音频数据和所述目标音频数据，获取与所述第一音频帧对应的待播放音频数据，所述目标音频数据为与目标音频帧对应的待播放音频数据，所述目标音频帧为在已经确定有效的各个音频帧中与所述第一音频帧最近的音频帧。

4.根据权利要求3所述的方法，其特征在于，所述基于所述第一音频数据和所述目标音频数据，获取与所述第一音频帧对应的待播放音频数据，包括：

将所述第一音频数据和所述目标音频数据进行拼接处理，得到拼接处理后的音频数据，将所述拼接处理后的音频数据作为与所述第一音频帧对应的待播放音频数据。

5.根据权利要求4所述的方法，其特征在于，所述将所述第一音频数据和所述目标音频数据进行拼接处理，得到拼接处理后的音频数据，包括：

将所述目标音频数据中的第一采样点集和所述第一音频数据中的第二采样点集进行加窗处理，得到第三采样点集，所述第一采样点集包括所述目标音频数据中位于末尾部分的第二参考数量个采样点，所述第二采样点集包括所述第一音频数据中位于起始部分的第二参考数量个采样点；

基于所述第三采样点集，对所述第一音频数据和所述目标音频数据进行拼接，得到拼接处理后的音频数据。

6.根据权利要求1所述的方法，其特征在于，所述基于所述第一音频数据和所述第二音频数据，确定所述第一音频帧的有效性，包括：

获取所述第一音频数据对应的检测结果和各个第二音频数据对应的检测结果，任一音频数据对应的检测结果用于指示所述任一音频数据是否为语音信号数据；

基于所述第一音频数据对应的检测结果和所述各个第二音频数据对应的检测结果，确定所述第一音频帧的有效性。

7.根据权利要求6所述的方法，其特征在于，所述基于所述第一音频数据对应的检测结果和所述各个第二音频数据对应的检测结果，确定所述第一音频帧的有效性，包括：

响应于所述第一音频数据对应的检测结果和所述各个第二音频数据对应的检测结果满足无效条件，确定所述第一音频帧无效；

响应于所述第一音频数据对应的检测结果和所述各个第二音频数据对应的检测结果不满足所述无效条件，确定所述第一音频帧有效。

8.根据权利要求7所述的方法，其特征在于，所述第一音频数据对应的检测结果和所述各个第二音频数据对应的检测结果满足无效条件，包括：

所述第一音频数据对应的检测结果指示所述第一音频数据为非语音信号数据，所述各个第二音频数据对应的检测结果指示所述各个第二音频数据均为非语音信号数据。

9.根据权利要求1所述的方法，其特征在于，所述第一参考数量个连续的第二音频数据包括第一部分第二音频数据和第二部分第二音频数据，所述第一部分第二音频数据对应所述第二音频帧中除最后一个音频帧外的其他音频帧，所述第二部分第二音频数据对应所述第二音频帧中最后一个音频帧；所述获取第一音频数据和第一参考数量个连续的第二音频数据，包括：

从缓存中提取所述第一音频数据和所述第一部分第二音频数据；

对所述第二音频帧中最后一个音频帧的码流进行解码处理，得到所述第二部分第二音频数据。

10.根据权利要求1所述的方法，其特征在于，所述获取第一音频数据和第一参考数量个连续的第二音频数据，包括：

对所述第一音频帧的码流进行解码处理，得到所述第一音频数据；

对所述第二音频帧中的各个音频帧的码流分别进行解码处理，得到所述第一参考数量个连续的第二音频数据。

11.一种语音消息的处理装置，其特征在于，所述装置包括：

第一获取模块，用于获取第一音频数据和第一参考数量个连续的第二音频数据，所述第一音频数据对应语音消息中当前待处理的第一音频帧，所述第一参考数量个连续的第二音频数据对应第二音频帧，所述第二音频帧为所述语音消息中位于所述第一音频帧之后的连续音频帧；

确定模块，用于基于所述第一音频数据和所述第二音频数据，确定所述第一音频帧的有效性；

所述确定模块，还用于响应于所述第一音频帧无效，确定所述语音消息中位于所述第一音频帧之后的音频帧的有效性，直至得到有效的音频帧；

第二获取模块，用于获取与所述有效的音频帧对应的待播放音频数据。

12.根据权利要求11所述的装置，其特征在于，所述第二获取模块，还用于响应于所述第一音频帧有效，基于所述第一音频数据，获取与所述第一音频帧对应的待播放音频数据。

13.根据权利要求12所述的装置，其特征在于，所述第二获取模块，还用于获取第三音频帧的有效性，所述第三音频帧为所述语音消息中位于所述第一音频帧前一位的音频帧；

响应于所述第三音频帧有效，将所述第一音频数据作为与所述第一音频帧对应的待播放音频数据；

14.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如权利要求1至10任一所述的语音消息的处理方法。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如权利要求1至10任一所述的语音消息的处理方法。

技术总结
本申请公开了语音消息的处理方法、装置、设备及存储介质，属于计算机技术领域。方法包括：获取第一音频数据和第一参考数量个连续的第二音频数据，第一音频数据对应语音消息中当前待处理的第一音频帧，第一参考数量个连续的第二音频数据对应第二音频帧；基于第一音频数据和第二音频数据，确定第一音频帧的有效性；响应于第一音频帧无效，确定语音消息中位于第一音频帧之后的音频帧的有效性，直至得到有效的音频帧，获取与有效的音频帧对应的待播放音频数据。基于上述过程，仅获取与有效的音频帧对应的待播放音频数据，可以在基于待播放音频数据对语音消息进行播放的过程中，既保证播放质量，又有效缩短播放耗时，语音消息的处理效果较好。

技术研发人员：梁俊斌
受保护的技术使用者：腾讯科技(深圳)有限公司
技术研发日：2020.01.07
技术公布日：2021.07.23

完整全部详细技术资料下载

当前第2页1 2