多媒体播放器中的多媒体文件存储方法和装置与流程

文档序号：12484914阅读：来源：国知局

技术特征：

1.一种多媒体播放器中的多媒体文件存储方法，其特征在于，所述方法包括：

获取针对多媒体播放器中的多媒体文件输入的语音信息；

对所述语音信息进行语音识别，将所述语音信息识别成对应的文字信息；

将所述文字信息与所述多媒体文件进行关联存储。

2.根据权利要求1所述的方法，其特征在于，在所述将所述文字信息与所述多媒体文件进行关联存储之前，所述方法还包括：

对所述文字信息进行语义拆分，从所述文字信息中提取关键词；

所述将所述文字信息与所述音视频文件进行关联存储具体为：

将所述关键词与所述多媒体文件进行关联存储。

3.根据权利要求1所述的方法，其特征在于，在所述获取针对多媒体播放器中的多媒体文件输入的语音信息之前，所述方法还包括：

通过多媒体播放器的多媒体采集设备录制多媒体片段；

通过多媒体播放器中的预设算法对录制的多媒体片段进行去噪声和增益调整处理；

将处理后的多媒体片段存储成多媒体播放器中的音视频文件。

4.根据权利要求3所述的方法，其特征在于，所述通过多媒体播放器中的预设算法对录制的多媒体片段进行去噪声和增益调整处理具体包括：

对录制的多媒体片段进行去噪声处理；

采用多媒体播放器中预设的回声抑制算法对去噪处理后的多媒体片段进行回声抑制处理；

对回声抑制处理后的多媒体片段进行增益调整。

5.根据权利要求4所述的方法，其特征在于，所述对录制的多媒体片段进行去噪声具体包括：

将录制的多媒体片段的频谱与录制的环境背景噪声的频谱相减，其中所述环境背景噪声的频谱为在录制多媒体片段时录制的环境背景噪声的频谱，或者当在录制多媒体片段时未录制环境背景噪声时，统计录制的多媒体片段的幅值，将幅值低于预设幅值阈值的多媒体片段的平均频谱作为环境背景噪声的频谱；

统计与环境背景噪声的频谱相减后的多媒体片段的频率，去除该多媒体片段中频率过高以及频率过低的异常频段。

6.根据权利要求4所述的方法，其特征在于，所述对回声抑制处理后的多媒体片段进行增益调整具体包括：

统计环境背景噪声的幅值，所述环境背景噪声的幅值为在录制多媒体片段时录制的环境背景噪声的，或者为录制的多媒体片段中幅值低于预设幅值阈值的多媒体片段的平均幅值；

当录制的多媒体片段的幅值远大于环境背景噪声的幅值时，降低录制的多媒体片段的幅值；当录制的多媒体片段的幅值远小于环境背景噪声的幅值时，提高录制的多媒体片段的幅值。

7.根据权利要求1所述的方法，其特征在于，所述获取针对多媒体播放器中的多媒体文件输入的语音具体包括：

通过多媒体播放器中的多媒体采集设备采集针对多媒体播放器中的多媒体文件输入的语音信息；和/或，

从多媒体播放器中的多媒体文件中提取语音信息。

8.根据权利要求7所述的方法，其特征在于，所述通过多媒体播放器中的多媒体采集设备采集针对多媒体播放器中的多媒体文件输入的语音信息具体包括：

通过多媒体播放器中的多媒体采集设备采集至少一段针对多媒体播放器中的多媒体文件输入的语音片段，将所述至少一段语音片段组合成针对多媒体播放器中的多媒体文件输入的语音信息，所述语音信息包括主题部分和标题部分。

9.根据权利要求7所述的方法，其特征在于，从多媒体播放器中的多媒体文件中提取语音信息具体包括：

按照预设的时间间隔从多媒体文件中截取预设长度的语音片段；

将截取的语音片段的频率与预先存储的噪声语音库中的噪声的频率进行比对，去除截取的语音片段中的噪声部分；

在剩余的语音片段的附近位置截取固定长度的语音片段，将截取到的固定长度的语音片段组合成针对音视频播放器中的音视频文件输入的语音信息。

10.一种多媒体播放器中的多媒体文件存储装置，其特征在于，所述装置包括：

语音信息获取单元，用于获取针对多媒体播放器中的多媒体文件输入的语音信息；

语音识别单元，用于对所述语音信息进行语音识别，将所述语音信息识别成对应的文字信息；

文件存储单元，用于将所述文字信息与所述多媒体文件进行关联存储。

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

关键词提取单元，用于对所述语音识别单元识别得到的所述文字信息进行语义拆分，从所述文字信息中提取关键词；

所述文件存储单元将所述关键词与所述多媒体文件进行关联存储。

12.根据权利要求10所述的装置，其特征在于，所述语音信息获取单元具体包括：

语音信息采集模块，用于通过多媒体播放器中的多媒体采集设备采集针对多媒体播放器中的多媒体文件输入的语音信息；和/或，

语音信息提取模块，用于从多媒体播放器中的多媒体文件中提取语音信息。

13.根据权利要求12所述的装置，其特征在于，

所述语音信息采集模块具体用于通过多媒体播放器中的多媒体采集设备采集至少一段针对多媒体播放器中的多媒体文件输入的语音片段，将所述至少一段语音片段组合成针对多媒体播放器中的多媒体文件输入的语音信息，所述语音信息包括主题部分和标题部分；

所述语音信息提取模块具体用于按照预设的时间间隔从多媒体文件中截取预设长度的语音片段，将截取的语音片段的频率与预先存储的噪声语音库中的噪声的频率进行比对，去除截取的语音片段中的噪声部分，在剩余的语音片段的附近位置截取固定长度的语音片段，将截取到的固定长度的语音片段组合成针对音视频播放器中的音视频文件输入的语音信息。

完整全部详细技术资料下载

当前第2页1 2 3