一种大数据语音分类方法

文档序号：8382010阅读：247来源：国知局

一种大数据语音分类方法
【技术领域】
[0001] 本发明涉及一种大数据语音分类方法。
【背景技术】
[0002] 随着移动互联网的迅速发展，带有数字摄像头智能手机、平板电脑越来越多的进入人们的生活，很容易产生大量的个人语音信息。虽然利用时间和目录对语音数据进行管理是一种常见的方法，但是缺乏语义层面对语音进行有效的管理。因此利用监督学习方法，通过学习人工标注数据，以获得语音分类模型，然后对没有标注的语音进行自动语音分类。由于语音通常的特征维数非常高，因此傅里叶变换法有助于识别性能的提高。
[0003] 传统的全局线性傅里叶变换方法主要是基于线性的，其中线性判别分析被广泛地应用在模式分类问题上。线性判别分析法主要通过最大化类间距离的同时使类内样本间距离最小，从而实现不同类别之间的可分性。但是，大数据图像分类面临着类别数巨大，需要分类的样本数量巨大等困难。线性判别分析对于大数据而言，使用成本是比较高的，为了获得一定的分类性能，它需要人工大量的标注样本。这使得语音分类软件开发成本大量增加，需要人工大量的标注样本。
[0004] 因此，寻找一个需要标注少量样本即可得到满足要求的自动语音分类方法是非常必要的。

【发明内容】

[0005] 本发明所要解决的技术问题是提供一种大数据语音分类方法，减少软件开发成本，合理对大量的语音数据进行有效地分类，辨别以及处理。
[0006] 本发明解决上述技术问题的技术方案如下：一种大数据语音分类方法，包括如下步骤：
[0007] 1)收集语音样本作为训练集；
[0008] 2)寻找大数据语音分类最优的频谱矩阵；
[0009] 3)对无标注数据进行频谱分析；
[0010] 4)对频谱数据采用频段对大数据语音进行分类。
[0011] 优选地，所述寻找大数据语音分类最优的频谱矩阵，包括以下步骤：
[0012] 步骤1、建立局部优化目标函数；
[0013] 步骤2、建立全局优化目标函数；
[0014] 步骤3、利用傅里叶变换算法：将新的全局优化目标的问题转换为求广义特征值问题，大数据语音分类最优的频谱矩阵由式子
【主权项】
1. 一种大数据语音分类方法，其特征在于，包括如下步骤： 1) 收集语音样本作为训练集； 2) 寻找大数据语音分类最优的频谱矩阵； 3) 对无标注数据进行频谱分析； 4) 对频谱数据采用频段对大数据语音进行分类。
2. 根据权利要求1所述的大数据语音分类方法，其特征在于，所述寻找大数据语音分类最优的频谱矩阵，包括以下步骤：步骤1、建立局部优化目标函数；步骤2、建立全局优化目标函数；步骤3、利用傅里叶变换算法：将新的全局优化目标的问题转换为求广义特征值问题，
t 大数据语音分类最优的频谱矩阵由式子的前m 个最小特征值对应的X(n，k)。
【专利摘要】本发明公开了一种大数据语音分类方法，包括如下步骤：1)收集语音样本作为训练集；2)寻找大数据语音分类最优的频谱矩阵；3)对无标注数据进行频谱分析；4)对频谱数据采用频段对大数据语音进行分类。利用本发明提出的方法，能够有效地找出大数据情况下，不同语音数据的特征信息从而得到各类相关数据的有效分类，有效地减少训练过程中的存储成本，其分类准确度高于现有技术。
【IPC分类】G10L15-08
【公开号】CN104700833
【申请号】CN201410844027
【发明人】高辉, 尚成辉
【申请人】芜湖乐锐思信息咨询有限公司
【公开日】2015年6月10日
【申请日】2014年12月29日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高辉;尚成辉;
技术所有人：芜湖乐锐思信息咨询有限公司;
我是此专利的发明人

上一篇：信息处理方法及信息处理装置的制造方法
上一篇：语音关键字检测系统及方法