调度自动化主站智能语音联调系统的制作方法

文档序号:37337387发布日期:2024-03-18 18:03阅读:14来源:国知局
调度自动化主站智能语音联调系统的制作方法

本发明涉及电网厂站并网调试,具体地说,涉及调度自动化主站智能语音联调系统。


背景技术:

1、随着国民经济的发展,对电力供应需求越来越大,带来大量的发电厂、变电站、用户变接入电网,厂站并网需将四遥信息接入调度自动化主站系统,并与调度自动化主站端进行联调,联调验收合格方能并网投运。一直以来自动化信息的调试均采用厂站端和调度端人工电话核对数据的工作模式,过程繁琐,造成工作效率低下;现有调度自动化调试技术的研究,主要集中在规约研究、通道测试、站内试验分析等几个方向,缺少对调度自动化主站端智能值守的相关研究。

2、传统人工调试方式通过厂站端和主站端调试人员电话交流完成四遥信息联调,给主站端自动化运行业务造成巨大工作压力,且主站、厂站双方人员须全程协同开展,大量时间耗费在双方沟通、协调工作时间、等待实验过程上,过程繁琐,工作效率低下;现有的调试技术,主要缺点是仅能对主厂站间通信环节进行自动比对调试,不能实现信息传递、展示全链路各环节的调试验证,不符合自动化四遥信息调试技术规范的要求,仍需主站人工进行核对确认,无法解决调度自动化主站在厂站接入调试时的无人值守和两端调试人员协同工作的问题。鉴于此,我们提出了调度自动化主站智能语音联调系统。


技术实现思路

1、本发明的目的在于提供调度自动化主站智能语音联调系统,以解决上述背景技术中提出的问题。

2、为实现上述技术问题的解决,本发明的目的之一在于,提供了调度自动化主站智能语音联调系统,该系统以组件化、服务化模式实现功能模块交互,采用目前主流的微服务体系架构实现,确保交互的可重用性及独立性,主要由语音处理及交互平台、自动化调试知识平台、数据自动提起与预处理组件、智能处理与人机交互界面组成;其中:

3、所述智能处理与人机交互界面用于管理智能调试工作模式,采用hdsa接口订阅方式获取数据,并在调试完成后自动生成完整的、规范统一的调试报告;

4、语音处理及交互平台用于实现语音接入、语音预处理、语音识别、语义识别及语音合成技术。

5、作为本技术方案的进一步改进,所述智能处理与人机交互界面中,厂站完成现场试验工作后,厂站端工作人员发起调试工作流程,采用电子调试工单形式,结合工作流引擎,实现调试过程在线流转、全程管控、自动闭环,形成从工作任务下达至调试结束生成调试报告的闭环管理模式;

6、其采用hdsa接口订阅方式获取数据,对自动化系统数据订阅hdsa接口进行规范,数据消费者可按需求确定所查询数据的范围,在数据发生改变时,由主站系统自动将改变后的数据推送至数据消费者;并通过量测量订阅,形成量测核对工单;

7、调试完成后,系统自动生成完整的、规范统一的调试报告,调度端在调试过程中可随时查看调试报告,了解调试进度及具体情况。

8、作为本技术方案的进一步改进,所述语音接入采用直接利用模拟电话线接入服务器,应用sip协议代理,实现模拟电话信号及语音接入;通过sip代理,可以控制电话(session)的创建、更改和挂断,在模拟电话拨入时,会触发invite请示,同时,请示中会携带sdp报文;sdp会话描述协议,描述、协商多媒体会话参数;根据sdp协议内容中对媒体信息的描述,媒体使用rtp协议传输,采用g.711a算法进行编/解码及打包;采用rtp(real-timetransport protocol-实时传输协议)协议实现与调度电话之间的音频传输。

9、作为本技术方案的进一步改进,所述语音预处理主要包括编码转换和音频切片;

10、所述编码转换用于对接入的音频数据进行重采样,以提高量化位数,避免语音识别接口对音频参数的码率低于其最低要求导致无法识别;

11、所述音频切片即采用语音活动检测(voice activity detection,vad),利用话音/静默特性,当检测到突发的活动声音时才生成语音信号,并加以传输,当检测到为静默时,停止传输,切断音频,对语音和非语音的区域进行区分,找到一段语音真正有效的内容;

12、同时采用双门限比较法,并加入汉明窗计算短时能量和短时过零率来评估环境噪音,通过改进短时能量和双门限阀值两个参数的提取算法,拟合出一个能反映语音与噪声显著差异的特征参数,并采用动态门限进行判决,同时,加入静音状态确认和语音状态确认两个过程,使效果得到了很大的改善。

13、作为本技术方案的进一步改进,所述音频切片主要包括分帧加窗、计算短时能量、计算短时过零率、估计噪声阀值和语音检测五个部分,具体为:

14、所述分帧加窗中,分帧采用交叠分段的方法,使帧与帧之前平滑过渡,保持其连续性;

15、加窗可以认为对抽样n附近的语音波形加以强调而对波形的其余部分加以减弱;对语音信号的各个短段进行处理,实际上就是对各个短段进行某种变换或施以某种运算,其实加窗相当于把每一帧里面对应的元素变成它与窗序列对应元素的乘积;常用的窗口函数至少包括矩形窗、汉明窗(hamming)和汉宁窗(hanning),其中汉明窗(hamming)的函数为:

16、

17、式中,a为常数,n为窗口宽度;

18、加窗之后是为了进行傅里叶展开,使全局更加连续,避免出现吉布斯效应;

19、计算短时能量时,每一帧的短时能量,即将这一帧的所有样点值相加,公式如下:

20、

21、其中,w(n)是窗口函数;

22、计算短时过零率时,过零率就是样本改变符号的次数,公式如下:

23、

24、式中,sgn[x]是符号函数;

25、估计噪声阀值时,通过短时能量和过零率计算得出噪声阀值,可以设置不同的参数针对短时能量和过零率计算出双门限阀值,以减少语音段的判决;

26、所述语音检测中,利用过零率检测清音,用短时能量检测浊音,两者配合;具体检测过程包括如下步骤:

27、step1、首先为短时能量和过零率分别确定两个门限,一个是较低的门限数值较小,对信号的变化比较敏感,很容易超过;另一个是比较高的门限,数值较大;其中,低门限被超过未必是语音的开始,高门限被超过并且接下来的自定义时间段内的语音超过低门限,意味着语音信号开始;

28、step2、将语音状态标记等确认,进入过渡段,等待再一次满足语音激活条件,则启动语音激活,进入语音段,开始缓存语音信号;处于语音段时,如果两参数降低到门限以下,而且总的计时长度小于最短时间门限,则认为是一段噪音,作为静音确认状态;

29、step3、静音确认状态持续一段时间便可作为语音结束端点,触发语音切片,启动语音识别。

30、作为本技术方案的进一步改进,所述语音识别主要包括特征提取、声学模型、语言模型以及语义字典与解码四个部分;其中:

31、所述特征提取中,采用dfcnn中的语谱图作为特征输入实现语音识别;

32、所述声学模型(am)基于cnn(卷积神经网络)对语音数据进行训练获得,输入是语谱图特征向量,输出为音素信息;对业务领域相关高频词汇进行了微调,提高业务领域汉字词汇的频度,以提高识别率;

33、所述语言模型通过导出调度录音系统录音文件,并进行人工标注并整理出电力术语和调度自动化厂站接入时常用语言表达文本、词汇,加入到训练集,对语言模型进行微调训练,以提高语言模型准确率。

34、作为本技术方案的进一步改进,所述语义识别主要包括基于深度学习的意图识别和实体提取两部分;其中:

35、基于深度学习的意图识别,先对基于深度学习的意图识别方法进行实际业务应用,通过与量测核对业务人员的需求讨论及对量测核对录音文件的收听、总结,再进行对话策略设计;对话策略至少包括:

36、问候(greeting):问候意图主要用于电话接通时值守机器人向现场调试人员问好并收集待核对厂站信息及现场调试人员姓名;

37、待核对量测类型收集(ask-checking):待核对量测类型收集意图主要用于值守机器人向现场核对人员收集当前期望核对的是遥测或是遥信,并明确需要核对量测的起始位置,并从该逐一顺序核对;

38、遥信状态汇报(report-yx-state):遥信状态汇报意图主要用于值守机器人指挥现场核对人员对待核对量测信号进行模拟,并与ocs中收到的实时数据进行核对;

39、遥测加量汇报(report-yc-state):遥测加量汇报意图主要用于值守机器人指挥现场核对人员对待核对量测进行加量模拟,并与ocs中收到的实时数据进行核对;

40、肯定结果(confirm):肯定结果为子意图,即在对话过程中,对需要现场进行确认时的事项进行意图识别并判定为肯定状态;

41、否定结果(deny):否定结果为子意图,即在对话过程中,对需要现场进行确认时的事项进行意图识别并判定为否定状态;

42、重新检查(rechecking):在量测核对不成功的情况下,现场重新加量后要求值守机器人重新与ocs核对量测量:

43、复述(repeat):在现场人员未听清楚机器讲述内容时,要求机器重复之前的话语;

44、结束会话(finish):结束会话用于现场人员完成量测核对任务或其他原因,需结束与值守机器人的对话。

45、作为本技术方案的进一步改进,所述实体提取基于电力调度领域知识图谱,依据cim模型进行数据的抽取,通过cim模型建立电气设备的基本拓扑知识结构图,依据电气设备的知识图谱关系,从ocs、oms、规章规程、文档等抽取设备的遥测、遥信、遥控、遥调、电气量、量测点表、检修、运行日志、缺陷以及单位、人员之间的调管和运维关系;所述实体提取包括cim模型解析、构建cim模型中电气设备拓扑结构和实体识别三部分;

46、在cim模型解析中,电力领域的cim模型是用于描述电气设备之间的连接关系,需要根据cim模型结构进行分析,并实现意图识别模型的应用;其中,意图识别模型可以为卷积神经网络(cnn)、循环神经网络(rnn)或循环神经网络+注意力机制(rnn+attention),并在对比分析后最终选用循环神经网络+注意力机制作为项目意图识别任务的主要模型;

47、在构建cim模型中电气设备拓扑结构时,通过电力cim模型解析后,可以获取母线、厂站、变压器、线路、隔离开关、接地开关等设备数据及关系;通过程序处理后,可以将数据转换为知识图谱。

48、作为本技术方案的进一步改进,所述实体识别用于从文本中抽取实体信息元素,包括人名、组织名、机构名、地理位置、变电站、设备、电气单位、日期、设备状态、量测等。实体识别是解决很多自然语言处理问题的基础,也是实体提取中最基本的任务;

49、实体识别的方法至少包括:

50、基于规则方法:通过电力调度领域的数据库,以及领域专家构建的规则,实现电力调度领域实体的识别;

51、基于统计模型的方法:利用完全标注或部分标注的预料进行训练,采用的模型包括隐马尔可夫模型(hidden markov model,hmm)、最大熵模型(max entropy model,mem)以及条件随机场模型(conditional random field,crf),利用这些模型将命名实体识别作为序列标注处理;

52、基于深度学习的方法:直接以文本中词的向量为输入,通过神经网络实现端到端的命名实体识别,不再依赖人工定义特征;

53、所述实体识别还包括关系提取,关系抽取是实体提取的重要任务之一,面向非结构化文本数据,关系抽取是从文本中抽取到两个或者多个实体之间的语义关系;关系抽取与实体识别密切相关,一般在识别出文本中的实体后,再抽取实体之间可能存在的关系;

54、关系提取的方法主要包括基于模板的关系抽取方法和基于知识图谱的关系抽取方法。

55、作为本技术方案的进一步改进,所述语音合成用于在各意图识别完成后,根据意图执行相应的业务处理逻辑,由业务处理结果确定值守机器人需与现场调试人员进行什么样的交互;所述语音合成包括温拌生成和文本转语音两个阶段;

56、在文本生成阶段,文本生成任务采用规则模板的模型,由交流业务处理模块生成并返回值守机器人处理;模板嵌入变量(即业务处理结果),最终根据业务处理结果拼接成完整的语句;

57、在文本转语音阶段中的研究点主要解决的是分词和断句问题;

58、因为在文本生成阶段使用的是规则模板生成技术,所以可在人工定义规则模板的时候,预先在模板中设置好断句,以解决大部分合成自然度的问题;针对模板中变量部分,通过分词算法及词汇库,可对变量部分文本进行合理划分;最终可以获得较为自然、流畅的语音。

59、本发明的目的之三在于,提供了一种系统运行平台装置,包括处理器、存储器以及存储在存储器中并在处理器上运行的计算机程序,处理器用于执行计算机程序时实现上述的调度自动化主站智能语音联调系统的运行步骤。

60、本发明的目的之四在于,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的调度自动化主站智能语音联调系统的运行步骤。

61、与现有技术相比,本发明的有益效果:

62、该调度自动化主站智能语音联调系统涉及电网厂站并网调试领域,从调度自动化主站四遥信息联调方面进行研究,采用人工智能和语音识别技术,根据厂站端调试内容,智能识别和分析调度自动化主站系统收到的调试信息,完成自动比对,与厂站端调试人员在线、自助式调试交互,实现联调过程主站端无人值守,代替传统人工核对工作模式,实现调度自动化厂站信息接入智能高效调试。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1