一种多媒体文件的播放方法、装置和电子设备与流程

文档序号：39984514发布日期：2024-11-15 14:34阅读：74来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本公开涉及多媒体，尤其涉及一种多媒体文件的播放方法、装置和电子设备。

背景技术：

1、目前，用户在车载终端播放多媒体文件时，可以采用两种播放方式，一种是伴奏模式，另一种是原唱模式；其中，伴奏模式是仅播放多媒体文件的伴奏音乐的模式，而原唱模式则同时播放多媒体文件的人声和伴奏音乐的模式。

2、车载终端在播放多媒体文件时，如果用户需要进行伴奏模式和原唱模式的模式切换时，通常是通过手动操作实现的，即通过点击车载终端上的切换控件来进行切换伴奏模式和原唱模式的切换，操作繁琐。

技术实现思路

1、为了解决上述技术问题，本公开提供了一种多媒体文件的播放方法、装置和电子设备。

2、为达到上述目的，本公开采用如下技术方案：

3、第一方面，本公开提供了一种多媒体文件的播放方法，包括：在播放多媒体文件的情况下，获取舱内的舱内语音数据；其中，多媒体文件包括实际配音数据和实际背景声数据；对实际配音数据和舱内语音数据进行相似度计算，得到舱内语音数据和实际配音数据的相似度；在相似度大于或等于相似度阈值的情况下，获取多媒体文件的伴唱参数；其中，伴唱参数包括实际配音数据的音量值，和实际背景声数据的音量值；按照伴唱参数播放多媒体文件。

4、在一些可实施的示例中，对实际配音数据和舱内语音数据进行相似度计算，得到舱内语音数据和实际配音数据的相似度，包括：对舱内语音数据进行语音转文本操作，得到舱内语音数据对应的舱内文本数据；在舱内文本数据包含字符的情况下，分别提取实际配音数据和舱内文本数据对应的实际文本数据的文本特征，得到舱内文本数据对应的第一文本特征向量和实际文本数据对应的第二文本特征向量；计算第一文本特征向量和第二文本特征向量之间的第一关系，并将第一关系作为实际配音数据和舱内语音数据的相似度；其中，第一关系包括余弦相似度和预设距离中的任一项，预设距离包括欧式距离、曼哈顿距离中的任一项。

5、在一些可实施的示例中，本公开实施例提供的多媒体文件的播放方法还包括：在舱内文本数据不包含字符的情况下，分别提取实际配音数据和舱内语音数据的音频特征，得到舱内语音数据对应的第一音频特征向量和实际配音数据对应的第二音频特征向量；计算第一音频特征向量和第二音频特征向量之间的第二关系，并将第二关系作为实际配音数据和舱内语音数据的相似度；其中，第二关系包括余弦相似度和预设距离中的任一项，预设距离包括欧式距离、曼哈顿距离中的任一项。

6、在一些可实施的示例中，在播放多媒体文件的情况下，获取舱内的舱内语音数据包括：在播放多媒体文件的情况下，对多媒体文件进行声源分离，得到多媒体文件对应的实际配音数据和实际背景声数据。

7、在一些可实施的示例中，在相似度大于或等于相似度阈值的情况下，获取多媒体文件的伴唱参数，包括：在相似度大于或等于相似度阈值的情况下，获取多媒体文件的文件类型；基于文件类型查询预设关系表，得到文件类型对应的伴唱参数；其中，不同的文件类型对应的伴唱参数不同。

8、在一些可实施的示例中，按照伴唱参数播放多媒体文件后，本公开实施例提供的多媒体文件的播放方法还包括：在相似度小于相似度阈值的情况下，按照预设参数播放多媒体文件；其中，预设参数为播放多媒体文件时设置的播放参数。

9、在一些可实施的示例中，舱内包含至少一个功能区域，一个功能区域包含至少一个音频播放装置和至少一个灯光装置，伴唱参数还包括灯光参数；按照伴唱参数播放多媒体文件，包括：对舱内语音数据进行位置分析，得到发出舱内语音数据的功能区域；在功能区域内按照伴唱参数播放多媒体文件。

10、第二方面，本公开提供了一种多媒体文件的播放装置，包括：处理单元，用于在播放多媒体文件的情况下，控制获取单元获取舱内的舱内语音数据；其中，多媒体文件包括实际配音数据和实际背景声数据；处理单元，还用于对实际配音数据和获取单元获取的舱内语音数据进行相似度计算，得到舱内语音数据和实际配音数据的相似度；处理单元，还用于在相似度大于或等于相似度阈值的情况下，控制获取单元获取多媒体文件的伴唱参数；其中，伴唱参数包括实际配音数据的音量值，和实际背景声数据的音量值；处理单元，还用于按照获取单元获取的伴唱参数播放多媒体文件。

11、在一些可实施的示例中，处理单元，具体用于对获取单元获取的舱内语音数据进行语音转文本操作，得到舱内语音数据对应的舱内文本数据；处理单元，具体用于在舱内文本数据包含字符的情况下，分别提取实际配音数据和获取单元获取的舱内文本数据对应的实际文本数据的文本特征，得到舱内文本数据对应的第一文本特征向量和实际文本数据对应的第二文本特征向量；处理单元，具体用于计算第一文本特征向量和第二文本特征向量之间的第一关系，并将第一关系作为实际配音数据和舱内语音数据的相似度；其中，第一关系包括余弦相似度和预设距离中的任一项，预设距离包括欧式距离、曼哈顿距离中的任一项。

12、在一些可实施的示例中，处理单元，还用于在舱内文本数据不包含字符的情况下，分别提取实际配音数据和获取单元获取的舱内语音数据的音频特征，得到舱内语音数据对应的第一音频特征向量和实际配音数据对应的第二音频特征向量；处理单元，还用于计算第一音频特征向量和第二音频特征向量之间的第二关系，并将第二关系作为实际配音数据和舱内语音数据的相似度；其中，第二关系包括余弦相似度和预设距离中的任一项，预设距离包括欧式距离、曼哈顿距离中的任一项。

13、在一些可实施的示例中，处理单元，具体用于在播放多媒体文件的情况下，对多媒体文件进行声源分离，得到多媒体文件对应的实际配音数据和实际背景声数据。

14、在一些可实施的示例中，处理单元，具体用于在相似度大于或等于相似度阈值的情况下，控制获取单元获取多媒体文件的文件类型；处理单元，具体用于基于获取单元获取的文件类型查询预设关系表，得到文件类型对应的伴唱参数；其中，不同的文件类型对应的伴唱参数不同。

15、在一些可实施的示例中，处理单元，还用于在相似度小于相似度阈值的情况下，按照预设参数播放多媒体文件；其中，预设参数为播放多媒体文件时设置的播放参数。

16、在一些可实施的示例中，舱内包含至少一个功能区域，一个功能区域包含至少一个音频播放装置和至少一个灯光装置，伴唱参数还包括灯光参数；处理单元，具体用于对获取单元获取的舱内语音数据进行位置分析，得到发出舱内语音数据的功能区域；处理单元，具体用于在功能区域内按照伴唱参数播放多媒体文件。

17、第三方面，本公开提供一种电子设备，包括：存储器和处理器，存储器用于存储计算机程序；处理器用于在执行计算机程序时，使得电子设备实现如上述第一方面提供的多媒体文件的播放方法。

18、第四方面，本公开提供一种计算机可读存储介质，包括：计算机可读存储介质上存储有计算机程序，当计算机程序被计算设备执行时，使得计算设备实现如上述第一方面提供的多媒体文件的播放方法。

19、第五方面，本公开提供一种车辆，包括如第二方面提供的任一项多媒体文件的播放装置。

20、在本公开中，上述多媒体文件的播放装置的名字对设备或功能模块本身不构成限定，在实际实现中，这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本公开类似，属于本公开权利要求及其等同技术的范围之内。

21、本公开的这些方面或其他方面在以下的描述中会更加简明易懂。

22、本公开提供的技术方案与现有技术相比具有如下优点：

23、将本公开提供的多媒体文件的播放方法应用于汽车时，汽车在播放多媒体文件的情况下，获取舱内的舱内语音数据。之后，汽车通过对实际配音数据和舱内语音数据进行相似度计算，得到舱内语音数据和实际配音数据的相似度；在相似度大于或等于相似度阈值的情况下，获取多媒体文件的伴唱参数；按照伴唱参数播放多媒体文件。这样，无需用户手动地点击车载终端上的切换控件来进行切换伴奏模式和原唱模式的切换，而是可以根据用户在汽车的舱内发出的舱内语音数据，判别是否采用伴唱参数播放该多媒体文件，简化了用户的操作，解决了现有技术中车载终端在播放多媒体文件时，如果用户需要进行伴奏模式和原唱模式的模式切换时，通常是通过手动操作实现的，即通过点击车载终端上的切换控件来进行切换伴奏模式和原唱模式的切换，操作繁琐的问题。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邹勇,周盼,陈伟
技术所有人：北京罗克维尔斯科技有限公司
我是此专利的发明人

上一篇：一种雾化器生产用金属线圈绕制工具的制作方法
下一篇：密封组件及增材制造成形设备的制作方法

该领域下的技术专家

1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究

2、王老师：1.机器人 2.嵌入式控制系统开发

3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计

4、毕老师：机构动力学与控制

5、袁老师：1.计算机视觉 2.无线网络及物联网

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！