一种基于自然语言处理的语音交互方法及系统与流程

文档序号：37058756发布日期：2024-02-20 21:08阅读：13来源：国知局

本发明涉及计算机，尤其涉及一种基于自然语言处理的语音交互方法及系统。

背景技术：

1、随着人工智能技术的进步和人们对生活需求的不断改变，人们需要一种更为快捷且便利的交互方式来方便人们的日常生活和工作，因此语音交互这一方式得到了迅速发展和广泛应用，在语音交互的发展过程中，如何对语音进行准确识别和如何对语音的语义进行准确分析是各企业一直重视的问题，对此，提出了一种基于自然语言处理进行语音交互的技术，通过语音识别技术准确识别输入的语音信息，并采用自然语言处理技术对识别后的语音信息的语义进行准确的分析，提供更加准确且快捷的语音交互服务，提升人们对语音交互的使用体验。

技术实现思路

1、本发明的目的在于克服现有技术的不足，本发明提供了一种基于自然语言处理的语音交互方法及系统，不仅能够提供更加准确且快捷的语音交互服务，而且可以提升人们对语音交互的使用体验。

2、为了解决上述技术问题，本发明提供了一种基于自然语言处理的语音交互方法，所述方法包括：

3、获取用户输入的语音信息，并基于语音识别技术将所述语音信息转化为自然语言文本信息；

4、对所述自然语言文本信息进行文本预处理，获得文本预处理后的自然语言文本信息；

5、将文本预处理后的自然语言文本信息输入nlp语义解析模型中，基于所述nlp语义解析模型将文本预处理后的自然语言文本信息转换为结构化查询语言；

6、基于所述结构化查询语言获取对应的目标数据；

7、将对应的目标数据输入至优化自然语言生成模型中，基于所述优化自然语言生成模型将对应的目标数据转换为应答文本；

8、基于语音合成技术将所述应答文本转换为应答语音，并将所述应答语音输出。

9、可选的，所述基于语音识别技术将所述语音信息转化为自然语言文本信息，包括：

10、对所述语音信息进行预处理，获得预处理后的语音信息；

11、基于感知线性预测算法对预处理后的语音信息进行特征提取处理，获得语音特征向量；

12、将所述语音特征向量输入声学模型中，基于所述声学模型输出音素序列；

13、将所述音素序列输入语言文本模型中，基于所述语言文本模型输出自然语言文本信息。

14、可选的，所述将所述语音特征向量输入声学模型中，基于所述声学模型输出音素序列，包括：

15、构建gmm-hmm模型作为初始声学模型，其中，所述gmm-hmm模型的结构包括：输入层、声学状态层、隐含层、可观察层、高斯成分层和输出层；

16、对所述初始声学模型进行训练，获得训练好的声学模型；

17、将所述语音特征向量输入训练好的声学模型中，基于训练好的声学模型利用解码算法生成音素序列。

18、可选的，所述对所述自然语言文本信息进行文本预处理，获得文本预处理后的自然语言文本信息，包括：

19、对所述自然语言文本信息进行语料清洗处理，获得语料清洗处理后的自然语言文本信息；

20、对语料清洗后的自然语言文本信息进行分词处理，获得若干个文本分词；

21、对若干个文本分词进行词性标注处理，获得文本预处理后的自然语言文本信息。

22、可选的，所述将文本预处理后的自然语言文本信息输入nlp语义解析模型中，基于所述nlp语义解析模型将文本预处理后的自然语言文本信息转换为结构化查询语言，包括：

23、对文本预处理后的自然语言文本信息进行特征提取处理，获得对应的特征编码；

24、基于对应的特征编码对nlp语义解析模型进行训练，获得训练好的nlp语义解析模型；

25、基于训练好的nlp语义解析模型进行语言转换，获得结构化查询语言。

26、可选的，所述基于对应的特征编码对nlp语义解析模型进行训练，获得训练好的nlp语义解析模型，包括：

27、将对应的特征编码输入nlp语义解析模型中，利用nlp语义解析模型中的第一解码器对对应的特征编码进行处理，获得选择子句的处理结果；

28、利用nlp语义解析模型中的第二解码器对对应的特征编码进行处理，获得条件子句的处理结果；

29、基于选择子句的处理结果和条件子句的处理结果计算损失函数；

30、基于所述损失函数利用优化器对nlp语义解析模型的参数进行更新调整，基于更新调整后的参数对nlp语义解析模型进行优化，获得训练好的nlp语义解析模型。

31、可选的，所述基于所述结构化查询语言获取对应的目标数据，包括：

32、基于所述结构化查询语言利用查询引擎获取目标存储位置；

33、基于所述目标存储位置利用结构化查询语言中的逻辑规则和计算引擎获取对应的目标数据。

34、可选的，所述将对应的目标数据输入至优化自然语言生成模型中，基于所述优化自然语言生成模型将对应的目标数据转换为应答文本，包括：

35、构建lstm模型作为初始自然语言生成模型，其中，所述lstm模型的结构包括：输入层、隐含层和输出层，所述隐含层包含若干个lstm单元，每个lstm单元包含一个输入门、遗忘门、输出门和一个细胞状态；

36、对所述初始自然语言生成模型进行训练，获得训练好的自然语言生成模型；

37、利用遗传粒子群优化算法对训练好的自然语言生成模型进行结构优化，获得优化自然语言生成模型；

38、基于所述优化自然语言生成模型将对应的目标数据转换为应答文本。

39、可选的，所述基于语音合成技术将所述应答文本转换为应答语音，并将所述应答语音输出，包括：

40、对所述应答文本进行文本预处理，获得文本预处理后的应答文本；

41、对文本预处理后的应答文本进行韵律预测和字音转换处理，获得对应的音素；

42、基于预设自回归声学模型将对应的音素转换为声学特征；

43、基于声码器将所述声学特征转换为应答语音，并将所述应答语音输出。

44、另外，本发明还提供了一种基于自然语言处理的语音交互系统，所述系统包括：

45、语音识别模块，用于获取用户输入的语音信息，并基于语音识别技术将所述语音信息转化为自然语言文本信息；

46、文本预处理模块，用于对所述自然语言文本信息进行文本预处理，获得文本预处理后的自然语言文本信息；

47、语义解析模块，用于将文本预处理后的自然语言文本信息输入nlp语义解析模型中，基于所述nlp语义解析模型将文本预处理后的自然语言文本信息转换为结构化查询语言；

48、获取目标数据模块，用于基于所述结构化查询语言获取对应的目标数据；

49、自然语言生成模块，用于将对应的目标数据输入至优化自然语言生成模型中，基于所述优化自然语言生成模型将对应的目标数据转换为应答文本；

50、语音合成模块，用于基于语音合成技术将所述应答文本转换为应答语音，并将所述应答语音输出。

51、在本发明实施例中，通过语音识别技术准确识别用户输入的语音信息，将其转化为自然语言文本信息，通过nlp语义解析模型将自然语言文本信息转换为结构化查询语言，能够准确的解析自然语言文本信息中的语义，并将其用结构化查询语言进行表示，通过结构化查询语言中包含的逻辑和计算引擎能够准确获取目标数据，将目标数据通过结构优化后的自然语言生成模型进行处理，可以更为准确且快速的生成应答文本，采用语音合成技术将应答文本转换为应答语音并进行输出，可以完成语音交互的完整流程，从而提供更加准确且快捷的语音交互服务，提升人们对语音交互的使用体验。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：皇甫汉聪,王永才,关兆雄,林浩,李沐栩,宋才华,杜家兵,刘胜强
技术所有人：广东电网有限责任公司佛山供电局
我是此专利的发明人

上一篇：高边驱动电路以及电子设备的制作方法
上一篇：一种旋翼机测试台的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。