本发明涉及电力安全监督,尤其涉及一种基于智能语音识别的电力调度安全监督方法及系统。
背景技术:
1、电力生产运行过程中,各级调度机构以及调度机构与现场单位之间,通过录音电话系统来进行工作联系和调令收发等相关业务的开展,运行人员联系汇报的正确性、规范性对电力生产安全至关重要。为此电力调度中心制定多种规程制度以规范调度生产联系,并建立事后监察机制,由安监部门对录音开展抽查分析,对联系汇报中存在的问题隐患做出反馈以促进整改。
2、但随着电网规模与复杂性的与日俱增,调度联系的范围与频次日益增加,传统人工听识录音的方式无法满足安全生产监督的需要。
技术实现思路
1、基于背景技术存在的技术问题,本发明提出了一种基于智能语音识别的电力调度安全监督方法及系统,能够自动识别出调度联系中不规范的行为,且更为直观清晰,对电力安全生产运行提供了有力保障。
2、本发明提出的一种基于智能语音识别的电力调度安全监督方法,包括:
3、抓取被监督对象的通话录音数据,并将所述通话录音数据依次输入到已训练完成的声学模型和语言模型,输出所述录音数据对应的通话中文文本;
4、利用余弦相似度计算所述通话中文文本中的文本相似容错率;
5、当所述文本相似容错率处于容错阈值内时,基于预设的程序化判据判定所述通话中文文本中违反调度规章制度的行为。
6、进一步地,所述声学模型采用卷积神经网络和连接性时序分类建立模型,用于将所述通话录音数据转化中文拼音标签序列;
7、所述语言模型是基于马尔可夫模型建立的模型,用于将所述中文拼音标签序列转化为对应的中文文本。
8、进一步地,在利用余弦相似度计算所述通话中文文本中的文本相似容错率中,公式如下:
9、当:
10、cos(s1,s2)≥k1
11、判定甲正确复诵乙的语句;
12、当:
13、k1>cos(s1,s2)>k2
14、判定甲未正确复诵乙的语句;
15、当:
16、cos(s1,s2)≤k2
17、判定甲未进行复诵;
18、其中,cos(s1,s2)为语句s1和s2的余弦相似度,k1和k2为正确复诵阈值和未正确复诵的阈值,通话中文文本为甲和乙双方的通话文本。
19、进一步地,在抓取被监督对象的通话录音数据中,具体包括:
20、基于scrapy搭建python爬虫框架;
21、根据所述python框架采用浏览器发送请求方法,将通话录音数据自动下载到本地;
22、进一步地,在基于scrapy搭建python爬虫框架中,具体包括:
23、在待抓取url队列中抓取一个目标url;
24、通过http-client模拟浏览器get请求到所述目标url,将网页内容下载;
25、对所述网页内容进行解析,获取目标url的数据并存储;
26、基于设定的规则从当前抓取的所述网页内容中获取继续爬取的url。
27、进一步地,在根据所述python框架采用浏览器发送请求方法,将通话录音数据自动下载到本地中,具体包括:
28、利用http-client模拟浏览器获取调度电话录音系统的post、响应头、请求头信息,模拟用户登录;
29、通过所述网页内容的请求头信息获取目标url的数据;
30、通过页面录音文件播放信息自动下载目标url数据对应的通话录音数据到本地。
31、进一步地,所述声学模型的训练过程如下:
32、获取声学样本集;
33、设计声学模型的目标损失函数,得到定义好的声学模型;
34、将训练集输送到定义好的声学模型中,在声学模型中将所述通话录音数据转化中文拼音标签序列,将中文拼音标签序列中每个语音帧对应到hmm模型中的每一个状态,输出hmm模型状态得到中文拼音标签序列。
35、进一步地,所述语言模型的训练过程如下:
36、获取语言样本集;
37、设计语言模型的目标损失函数,得到定义好的语言模型;
38、将语言训练集输送到定义好的语言模型中,输出中文拼音标签序列转化的中文文本。
39、一种基于智能语音识别的电力调度安全监督系统,包括抓取转化模块、计算模块和判定模块;
40、抓取转化模块用于抓取被监督对象的通话录音数据,并将所述通话录音数据依次输入到已训练完成的声学模型和语言模型,输出所述录音数据对应的通话中文文本;
41、计算模块用于利用余弦相似度计算所述通话中文文本中的文本相似容错率;
42、判定模块用于当所述文本相似容错率处于容错阈值内时,基于预设的程序化判据判定所述通话中文文本中违反调度规章制度的行为。
43、进一步地,计算模块具体计算如下:
44、当:
45、cos(s1,s2)≥k1
46、判定甲正确复诵乙的语句;
47、当:
48、k1>cos(s1,s2)>k2
49、可判定甲未正确复诵乙的语句;
50、当:
51、cos(s1,s2)≤k2
52、可判定甲未进行复诵;
53、其中,cos(s1,s2)为语句s1和s2的余弦相似度,k1和k2为正确复诵阈值和未正确复诵的阈值,通话中文文本为甲和乙双方的通话文本。
54、本发明提供的一种基于智能语音识别的电力调度安全监督方法及系统的优点在于:本发明结构中提供的一种基于智能语音识别的电力调度安全监督方法及系统,采用采用爬虫技术从省、地调调度电话录音系统中抓取通话时段、录音文件,并对获取到的信息进行自动分类,大大减少调度安全监督工作听取录音文件时间。首先基于scrapy框架抓取被监督对象的通话录音数据,并通过自动语音识别技术将录音数据转译为文本形式,然后利用余弦相似度的文本容错算法,建立基于转译后文本的安全监督分析的判据和策略,使安全监督员得到信息的效率大大提高;该安全监督方法为自动语音识别技术在安全生产和监督领域的运用提供了理论依据和实践经验,能够自动识别出调度联系中不规范的行为,且更为直观清晰,便于事后回溯和进一步分析,改进了电力调度安全监督的工作方式,对电力安全生产运行提供了有力保障。
1.一种基于智能语音识别的电力调度安全监督方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于智能语音识别的电力调度安全监督方法,其特征在于,所述声学模型采用卷积神经网络和连接性时序分类建立模型,用于将所述通话录音数据转化中文拼音标签序列;
3.根据权利要求1所述的基于智能语音识别的电力调度安全监督方法,其特征在于,在利用余弦相似度计算所述通话中文文本中的文本相似容错率中,公式如下:
4.根据权利要求1所述的基于智能语音识别的电力调度安全监督方法,其特征在于,在抓取被监督对象的通话录音数据中,具体包括:
5.根据权利要求4所述的基于智能语音识别的电力调度安全监督方法,其特征在于,在基于scrapy搭建python爬虫框架中,具体包括:
6.根据权利要求5所述的基于智能语音识别的电力调度安全监督方法,其特征在于,在根据所述python框架采用浏览器发送请求方法,将通话录音数据自动下载到本地中,具体包括:
7.根据权利要求2所述的基于智能语音识别的电力调度安全监督方法,其特征在于,所述声学模型的训练过程如下:
8.根据权利要求7所述的基于智能语音识别的电力调度安全监督方法,其特征在于,所述语言模型的训练过程如下:
9.一种基于智能语音识别的电力调度安全监督系统,其特征在于,包括抓取转化模块、计算模块和判定模块;
10.根据权利要求1所述的基于智能语音识别的电力调度安全监督系统,其特征在于,计算模块具体计算如下: