人工智能语音系统参与控制铸片炉操作工艺的方法及装置与流程

文档序号：41464584发布日期：2025-03-28 18:04阅读：81来源：国知局

本技术涉及真空感应铸片炉，特别是涉及一种人工智能语音系统参与控制铸片炉操作工艺的方法及装置。

背景技术：

1、铸片炉又称sc炉，是一种将纯净的钕铁硼金属原材料在真空或者惰性气氛条件下在坩埚内部通过中频电源感应加热熔化、精炼、恒流量浇铸、破碎、冷却从而形成鳞片的设备。sc炉在日常生产过程中，控制执行部件的动作主要通过触摸屏上面的软开关进行操作，触摸屏与plc进行modbus udp通讯，进而达到人机交互，将plc内部的控制软件进行可视化操作，控制电机的启动与停止以及阀门的打开与关闭等动作。

2、在实现本技术的过程中，申请人发现相关技术至少存在以下问题：

3、sc炉的触摸屏控制系统被集中设置在特定的位置，这意味着操作人员必须前往这个指定的地点才能进行触摸屏操作，以便发出相应的指令。这种设计导致操作人员不得不频繁地在工作台与触摸屏之间来回移动，从而使得操作过程变得更加复杂，同时也增加了操作人员的工作负担。

技术实现思路

1、有鉴于此，本技术提供了一种人工智能语音系统参与控制铸片炉操作工艺的方法及装置，主要目的在于解决目前sc炉的触摸屏控制系统被集中设置在特定的位置，这意味着操作人员必须前往这个指定的地点才能进行触摸屏操作，以便发出相应的指令。这种设计导致操作人员不得不频繁地在工作台与触摸屏之间来回移动，从而使得操作过程变得更加复杂，同时也增加了操作人员的工作负担的问题。

2、依据本技术第一方面，提供了一种人工智能语音系统参与控制铸片炉操作工艺的方法，该方法包括：

3、获取待识别音频，对所述待识别音频进行特征提取，得到所述待识别音频对应的待识别特征向量，所述待识别音频是基于语音采集设备采集到的操作人员的语音信号，所述语音采集设备设置在多个预先指定的操作工位上；

4、基于所述待识别特征向量，确定所述待识别音频对应的文本指令；

5、当所述文本指令对应的指令类别为命令词类别时，将所述文本指令对应的命令符数据传递至可编程逻辑控制器plc，以使所述plc基于所述命令符数据控制铸片炉动作以执行所述文本指令；

6、接收所述plc传递的反馈信息，基于预设音频播放设备播放所述反馈信息关联的音频，所述反馈信息为所述plc根据所述铸片炉的动作状态生成的。

7、可选地，所述获取待识别音频，对所述待识别音频进行特征提取，得到所述待识别音频对应的待识别特征向量，包括：

8、对所述待识别音频进行预处理，得到待提取音频，所述预处理包括但不限于降噪处理、增益调节处理和分帧处理；

9、对所述待提取音频的每一帧音频信号进行短时傅里叶变换，得到所述待提取音频对应的频谱，以及使用梅尔频率滤波器组对所述频谱进行滤波，计算每个梅尔频率滤波器输出的对数能量，得到对数能量序列；

10、对所述对数能量序列进行离散余弦变换dct变换，得到梅尔频率倒谱系数mfcc特征，将所述mfcc特征输入至预训练的语音识别模型进行识别，得到所述待提取音频对应的待识别文本；

11、对所述待识别文本进行特征提取，得到所述待识别特征向量。

12、可选地，所述基于所述待识别特征矢量参数，确定所述待识别音频对应的文本指令，包括：

13、计算所述待识别特征向量与参考模型库中存储的每个特征模型之间的特征相似度，确定特征相似度高于其他特征相似度的目标特征模型，所述参考模型库是通过对语音播放库中的音频信息进行特征提取并对提取出的音频特征进行模型化得到的，所述语音播放库是基于智能语音识别模型的语音芯片构建的；

14、在所述语音播放库中查询所述目标特征模型映射的文本信息，将所述文本信息作为所述待识别音频对应的文本指令。

15、可选地，所述基于所述待识别特征向量，确定所述待识别音频对应的文本指令之后，所述方法还包括：

16、当所述文本指令对应的指令类别为管理类别时，在语音播放库中查询所述文本指令关联的指令音频，采用所述预设音频播放设备播放所述指令音频；

17、将所述文本指令传递至触摸屏进行可视化展示。

18、可选地，所述接收所述plc传递的反馈信息，基于预设音频播放设备播放所述反馈信息关联的音频，包括：

19、对所述反馈信息进行特征提取得到反馈文本特征向量；

20、计算所述反馈文本特征向量与语音播放库中的每个文本特征向量之间的特征相似度，确定特征相似度高于其他特征相似度的目标文本特征向量；

21、确定所述目标文本特征向量关联的前置音频和动作音频，将所述前置音频与所述动作音频连接，生成待播放音频；

22、基于所述预设音频播放设备播放所述待播放音频。

23、可选地，所述基于所述预设音频播放设备播放所述待播放音频之后，所述方法还包括：

24、确定所述目标文本特征向量关联的文本信息，将所述文本信息传递至触摸屏进行可视化展示。

25、可选地，所述方法还包括：

26、接收plc传递的报警信息，所述报警信息是所述plc基于铸片炉设备传递的报警信号生成的；

27、对所述报警信息进行特征提取，确定所述报警信息对应的报警文本特征向量，计算所述报警文本特征向量与所述语音播放库中的每个文本特征向量之间的特征相似度，确定特征相似度高于其他特征相似度的目标文本特征向量，以及确定所述目标文本特征向量关联的报警音频，基于所述预设音频播放设备播放所述报警音频；和/或，

28、将所述报警信息传递至触摸屏进行可视化展示。

29、依据本技术第二方面，提供了一种人工智能语音系统参与控制铸片炉操作工艺的装置，该装置包括：

30、提取模块，用于获取待识别音频，对所述待识别音频进行特征提取，得到所述待识别音频对应的待识别特征向量，所述待识别音频是基于语音采集设备采集到的操作人员的语音信号，所述语音采集设备设置在多个预先指定的操作工位上；

31、确定模块，用于基于所述待识别特征向量，确定所述待识别音频对应的文本指令；

32、执行模块，用于当所述文本指令对应的指令类别为命令词类别时，将所述文本指令对应的命令符数据传递至可编程逻辑控制器plc，以使所述plc基于所述命令符数据控制铸片炉动作以执行所述文本指令；

33、播放模块，用于接收所述plc传递的反馈信息，基于预设音频播放设备播放所述反馈信息关联的音频，所述反馈信息为所述plc根据所述铸片炉的动作状态生成的。

34、可选地，所述提取模块，用于对所述待识别音频进行预处理，得到待提取音频，所述预处理包括但不限于降噪处理、增益调节处理和分帧处理；对所述待提取音频的每一帧音频信号进行短时傅里叶变换，得到所述待提取音频对应的频谱，以及使用梅尔频率滤波器组对所述频谱进行滤波，计算每个梅尔频率滤波器输出的对数能量，得到对数能量序列；对所述对数能量序列进行离散余弦变换dct变换，得到梅尔频率倒谱系数mfcc特征，将所述mfcc特征输入至预训练的语音识别模型进行识别，得到所述待提取音频对应的待识别文本；对所述待识别文本进行特征提取，得到所述待识别特征向量。

35、可选地，所述确定模块，用于计算所述待识别特征向量与参考模型库中存储的每个特征模型之间的特征相似度，确定特征相似度高于其他特征相似度的目标特征模型，所述参考模型库是通过对语音播放库中的音频信息进行特征提取并对提取出的音频特征进行模型化得到的，所述语音播放库是基于智能语音识别模型的语音芯片构建的；在所述语音播放库中查询所述目标特征模型映射的文本信息，将所述文本信息作为所述待识别音频对应的文本指令。

36、可选地，所述装置还包括：

37、查询模块，用于当所述文本指令对应的指令类别为管理类别时，在语音播放库中查询所述文本指令关联的指令音频，采用所述预设音频播放设备播放所述指令音频；

38、第一展示模块，用于将所述文本指令传递至触摸屏进行可视化展示。

39、可选地，所述播放模块，用于对所述反馈信息进行特征提取得到反馈文本特征向量；计算所述反馈文本特征向量与语音播放库中的每个文本特征向量之间的特征相似度，确定特征相似度高于其他特征相似度的目标文本特征向量；确定所述目标文本特征向量关联的前置音频和动作音频，将所述前置音频与所述动作音频连接，生成待播放音频；基于所述预设音频播放设备播放所述待播放音频。

40、可选地，所述装置还包括：

41、第二展示模块，用于确定所述目标文本特征向量关联的文本信息，将所述文本信息传递至触摸屏进行可视化展示。

42、可选地，所述装置还包括：

43、接收模块，用于接收plc传递的报警信息，所述报警信息是所述plc基于铸片炉设备传递的报警信号生成的；

44、计算模块，用于对所述报警信息进行特征提取，确定所述报警信息对应的报警文本特征向量，计算所述报警文本特征向量与所述语音播放库中的每个文本特征向量之间的特征相似度，确定特征相似度高于其他特征相似度的目标文本特征向量，以及确定所述目标文本特征向量关联的报警音频，基于所述预设音频播放设备播放所述报警音频；和/或，

45、第三展示模块，用于将所述报警信息传递至触摸屏进行可视化展示。

46、依据本技术第三方面，提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述第一方面中任一项所述方法的步骤。

47、依据本技术第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面中任一项所述的方法的步骤。

48、借由上述技术方案，本技术提供的一种人工智能语音系统参与控制铸片炉操作工艺的方法及装置，本技术首先获取待识别音频，通过对待识别音频进行特征提取，得到待识别音频对应的待识别特征向量，其中，待识别音频是基于语音采集设备采集到的操作人员的语音信号，而语音采集设备设置在多个预先指定的操作工位上。进一步地，基于待识别特征向量，确定待识别音频对应的文本指令。当文本指令对应的指令类别为命令词类别时，将文本指令对应的命令符数据传递至可编程逻辑控制器plc，以使plc基于命令符数据控制铸片炉动作以执行文本指令。最后，接收plc传递的反馈信息，基于预设音频播放设备播放反馈信息关联的音频，反馈信息为plc根据铸片炉的动作状态生成的。在本技术实施例中，由于语音识别系统能够即时处理操作人员的语音指令，因此铸片炉的动作可以迅速响应操作人员的命令，提高了生产效率和响应速度。另外，在铸片炉的生产过程中，执行的动作和发生的报警均通过扬声器播放出来，这样无论操作人员在铸片炉附近的任何地方都可以第一时间了解到设备的运行情况和报警内容，进而实现降低劳动强度，缩短劳动时间，提高工作效率。

49、上述说明仅是本技术技术方案的概述，为了能够更清楚了解本技术的技术手段，而可依照说明书的内容予以实施，并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂，以下特举本技术的具体实施方式。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐福兴,刘顺钢
技术所有人：沈阳广泰真空科技股份有限公司
我是此专利的发明人

上一篇：多设备的路径调度方法、电子设备及存储介质与流程
下一篇：参数确定方法及装置、存储介质及电子设备与流程

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！