基于人工智能的语音识别与自然语言处理方法与流程

文档序号:42650557发布日期:2025-08-05 18:35阅读:39来源:国知局
技术特征:

1.一种基于人工智能的语音识别与自然语言处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于人工智能的语音识别与自然语言处理方法,其特征在于,所述当检测到语音触发信号时,采集语音信号的完整数据,包括:

3.根据权利要求2所述的基于人工智能的语音识别与自然语言处理方法,其特征在于,所述语音特征向量包括起始帧特征向量和结束帧特征向量,所述基于所述背景噪声数据和完整数据提取语音特征向量具体为:

4.根据权利要求1所述的基于人工智能的语音识别与自然语言处理方法,其特征在于,对所述语音特征向量进行预处理后得到归一化特征向量,具体为:

5.根据权利要求4所述的基于人工智能的语音识别与自然语言处理方法,其特征在于,对所述第一特征数据进行降维处理得到第二特征数据,具体为:对所述第一特征数据进行主成分分析pca,得到第四特征数据;基于设定的第二阈值对所述第四特征数据进行二值化处理,得到第二特征数据。

6.根据权利要求3和4任一项所述的基于人工智能的语音识别与自然语言处理方法,其特征在于,归一化特征向量包括起始帧归一化特征和结束帧归一化特征;基于起始帧归一化特征获取语音开始时刻;基于结束帧归一化特征获取语音结束时刻。

7.根据权利要求6所述的基于人工智能的语音识别与自然语言处理方法,其特征在于,所述基于起始帧归一化特征获取语音开始时刻,具体为:

8.根据权利要求7所述的基于人工智能的语音识别与自然语言处理方法,其特征在于,所述根据该第一临界数据获取语音开始时刻,具体为:

9.根据权利要求6所述的基于人工智能的语音识别与自然语言处理方法,其特征在于,所述基于结束帧归一化特征获取语音结束时刻,具体为:

10.根据权利要求9所述的基于人工智能的语音识别与自然语言处理方法,其特征在于,所述根据该第三临界数据获取语音结束时刻,具体为:


技术总结
本发明涉及人工智能技术领域,提供了一种基于人工智能的语音识别与自然语言处理方法,包括采集背景噪声数据并在检测到语音触发信号时采集语音完整数据;基于背景噪声和完整数据提取语音特征向量,经预处理得到归一化特征向量;通过深度学习模型将归一化特征向量转换为文本。具体地,语音触发信号包括开始和结束信号,分别控制数据采集的启停;特征提取时区分起始帧和结束帧特征,通过背景噪声与语音数据的特征差值计算特征向量;预处理包括二值化、滤波、特征增强、降维和上下文建模;最终利用归一化特征确定语音起止时刻并进行语音识别。本发明可以提高语音识别的准确性和抗干扰能力,优化语音起止时刻的检测精度。

技术研发人员:蒋毅
受保护的技术使用者:华葳(上海)文化发展有限公司
技术研发日:
技术公布日:2025/8/4
当前第2页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!