基于人工智能的电话拨测音频分类方法及装置与流程

文档序号：12128637阅读：来源：国知局

技术特征：

1.一种基于人工智能的电话拨测音频分类方法，其特征在于，包括以下步骤：

获取电话拨测音频数据；

利用预设的分类器，对所述电话拨测音频数据进行处理，确定所述电话拨测音频与各类型的相似度，其中，所述预设的分类器为根据历史电话拨测音频数据及其分别对应的电话类型，确定的深度学习模型；

根据所述电话拨测音频与各类型的相似度，确定所述电话拨测音频对应的电话类型。

2.如权利要求1所述的方法，其特征在于，所述利用预设的分类器，对所述拨测音频数据进行处理之前，还包括：

对历史电话拨测音频数据及其对应的电话类型，进行深度模型训练确定所述分类器。

3.如权利要求2所述的方法，其特征在于，所述对历史电话拨测音频数据及对应的电话类型，进行深度模型训练之前，还包括：

按照预设的规则，从所述历史电话拨测音频数据中提取待训练的声学特征。

4.如权利要求3所述的方法，其特征在于，所述利用预设的分类器，对所述电话拨测音频数据进行处理之前，还包括：

按照所述预设的规则，从所述电话拨测音频数据中提取有效声学特征。

5.如权利要求4所述的方法，其特征在于，所述按照预设的规则，从所述电话拨测音频数据中提取有效声学特征，包括：

对所述电话拨测音频进行语音活动检测处理，确定预处理电话拨测音频数据；

从所述预处理电话拨测音频数据中，截取特定长度的待处理电话拨测音频数据；

根据预设的步长和帧长，从所述待处理电话拨测音频数据中，提取有效声学特征。

6.如权利要求5所述的方法，其特征在于，所述有效声学特征包括N帧音频数据；所述预设的分类器中包括M个电话类型；

所述确定所述电话拨测音频与各类型的相似度，包括：

将所述有效声学特征输入所述分类器，确定所述N帧音频数据分别与所述M个电话类型之间的相似度；

根据所述N帧音频数据分别与所述M个电话类型之间的相似度，确定所述N帧音频数据与M个电话类型之间相似度的M个平均值；

所述根据所述电话拨测音频与各类型的相似度，确定所述电话拨测音频对应的电话类型，包括：

根据所述M个平均值中最大的值对应的电话类型，确定所述电话拨测音频对应的电话类型。

7.一种基于人工智能的电话拨测音频分类装置，其特征在于，包括：

获取模块，用于获取电话拨测音频数据；

第一确定模块，用于利用预设的分类器，对所述电话拨测音频数据进行处理，确定所述电话拨测音频与各类型的相似度，其中，所述预设的分类器为根据历史电话拨测音频数据及其分别对应的电话类型，确定的深度学习模型；

第二确定模块，用于根据所述电话拨测音频与各类型的相似度，确定所述电话拨测音频对应的电话类型。

8.如权利要求7所述的装置，其特征在于，还包括：

第三确定模块，用于对历史电话拨测音频数据及其对应的电话类型，进行深度模型训练确定所述分类器。

9.如权利要求8所述的装置，其特征在于，还包括：

第一提取模块，用于按照预设的规则，从所述历史电话拨测音频数据中提取待训练的声学特征。

10.如权利要求9所述的装置，其特征在于，还包括：

第二提取模块，用于按照所述预设的规则，从所述电话拨测音频数据中提取有效声学特征。

11.如权利要求10所述的装置，其特征在于，所述第二提取模块，包括：

确定单元，用于对所述电话拨测音频进行语音活动检测处理，确定预处理电话拨测音频数据；

截取单元，用于从所述预处理电话拨测音频数据中，截取特定长度的待处理电话拨测音频数据；

提取单元，用于根据预设的步长和帧长，从所述待处理电话拨测音频数据中，提取有效声学特征。

12.如权利要求11所述的装置，其特征在于，所述有效声学特征包括N帧音频数据；所述预设的分类器中包括M个电话类型；

所述第一确定模块，具体用于：

将所述有效声学特征输入所述分类器，确定所述N帧音频数据分别与所述M个电话类型之间的相似度；

根据所述N帧音频数据分别与所述M个电话类型之间的相似度，确定所述N帧音频数据与M个电话类型之间相似度的M个平均值；

所述第二确定模块，具体用于：

根据所述M个平均值中最大的值对应的电话类型，确定所述电话拨测音频对应的电话类型。

完整全部详细技术资料下载

当前第2页1 2 3