一种虚拟台区经理人的跨域数据智能处理方法与流程

文档序号:32056317发布日期:2022-11-04 21:36阅读:134来源:国知局
一种虚拟台区经理人的跨域数据智能处理方法与流程

1.本发明属于电力服务中的模式识别技术,具体的涉及一种虚拟台区经理的跨域数据分析方法。


背景技术:

2.台区经理承担客户报障、电力抄表、信息发布等电力网格化服务的基础职责,是电力企业提升供电服务水平的关键岗位。台区经理的工作任务纷繁复杂,其人数、规模、经验、持续性以及人员素质等对网格化服务实施效果起重要作用。针对台区经理工作繁忙、人员不足的问题,目前提出了采用自动设备的方式来辅助人工完成部分工作。然而,部分老年人等操作自动设备有一定困难,不知道如何进行服务的选择。现有也有使用语音识别的手段,但传统语音识别方法准确率不高,对于有口音的老年人、或说话不清楚的老年人无法正确提供服务。为此,如何为所有人群提供智能化、便捷、准确的服务是亟待解决的问题。


技术实现要素:

3.本发明提出一种虚拟台区经理的数据分析方法,利用模式识别技术实现电力行业中跨图像、语音、用电等多领域数据的分析,进而实现面向客户的自动化服务,替代或减轻台区经理的部分职责,实现虚拟台区经理的功效。在实施模式识别任务时采用创新的快速识别方法,能快速识别图像、语音等非结构化数据和用电信息等结构化数据,提升了虚拟台区经理与用户互动的响应能力。
4.一种虚拟台区经理人的跨域数据智能处理方法,
5.(一)利用图像处理自动获取客户用电卡片客户号码
6.利用拍摄到的客户电能卡片图像,自动提取卡片上客户号码,用于客户的身份识别;
7.(二)对用电记录、服务记录进行分析评估客户可能需要的服务类型
8.根据步骤(一)获得的客户号码查询客户的用电记录、服务记录,根据客户号码查询附近地址的用电数据、服务数据,并对上述记录、数据进行分析;
9.(三)基于客户语音互动的服务类型确认、选择方法
10.将步骤(二)输出的客户可能需要的服务类型向客户展示,并提示客户进行确认;如果上述可能选项不满足用户需求,则提示客户说出需要的服务类型,捕捉客户的语音,识别其中包含的服务类型;如果识别失败,则转入客户人工服务;
11.其中,识别包括:
12.将音频数据切分为分段音频数据,每段音频数据记为speech
τ
;τ表示第几段音频数据;speechτ和speech
τ+1
存在部分重叠数据,重叠部分记为λ
τ,τ+1
,故不重叠部分分别表示为speech
τ-λ
τ,τ+1
、speech
τ+1-λ
τ,τ+1

13.分别计算speech
τ-λ
τ,τ+1
、speech
τ+1-λ
τ,τ+1
、λ
τ,τ+1
的傅里叶能量谱,依次记为将能量谱通过带通滤波器,过滤能量谱的低频和高频部分,获得滤
波后的能量谱
14.将若干组能量谱作为输入送入神经网络模型进行识别;
15.其中神经网络模型为:
[0016][0017]
式中,变量∈表示能量谱的频率,ω
11
(t,∈)、ω
12
(t,∈)、ω
13
(t,∈)分别表示线性权值矩阵,矩阵的行数等于能量谱频率的量化级数,矩阵列数为64,即0《t≤64取整数;β
11
、β
12
、β
13
表示线性偏移参数;σ为非线性映射函数;
[0018][0019]
α的为调节参数;
[0020]
h2(t)=σ(β2+ω
21
(t)h
11
(t)+ω
22
(t)h
12
(t)+ω
23
(t)h
13
(t))

(9)
[0021]
ω
21
(t)、ω
22
(t)、ω
23
(t)为对应于式(7)输出的线性权值向量,0《t≤64表示向量的维数;h2(t)为一个64维向量;β2表示线性偏移参数;
[0022]
定义神经网络模型的输出为:
[0023][0024]
ω3(c,t)为线性权值矩阵,矩阵的每一个元素表示h2(t)的一个元素与输出y(c)中一个元素的线性映射关系;β3表示线性偏移参数。
[0025]
所述步骤(一)中,客户请求服务时,提示客户出示印有客户号码的用电卡片,放置于客户交互平台的指定拍摄区域。
[0026]
步骤(一)采集用电卡片的图像,提取其中卡片部分,进一步检测卡片四角可能印刷有客户号的部分,采用基于梯度的数字分类模型,用于识别用电卡片上印刷的客户号,作为识别客户身份的标识符。
[0027]
所述客户的用电记录、服务记录是指客户用电、请求服务时采集到的原始的、未经统计或分析的数据。
[0028]
所述附近地址的用电数据、服务数据,是指根据客户号码查询到客户所在地,并对所在地附近地理位置其它用户的用电记录、服务记录进行统计后获得的数据。
[0029]
客户的用电记录包括客户单位时间用电的功率、电压、电流等电力指标,电表的实时读数、余额。
[0030]
客户的服务记录包括客户在历史上请求服务的时间、服务类型、服务时长、解决情况。
[0031]
附近地址的用电数据包括与上述客户用电记录对应的,附近客户的用电记录集合
的均值、最大值、最小值、分位值、方差值的统计数据。
[0032]
附近地址的服务数据包括与上述客户服务记录对应的,附近客户的服务记录集合的均值、最大值、最小值、分位值、方差值统计数据。
[0033]
根据客户的用电记录、服务记录,统计获得客户的用电情况、请求服务情况,并生成与客户号码对应的客户分布数据;将客户分布数据与附近地址的用电数据、服务数据进行联合,采用模式识别的非线性分类方法,对上述联合数据进行分析,评估客户可能需要某类服务的概率,按照评估概率的大小输出客户可能需要的服务类型。
[0034]
本发明的发明点及技术效果:
[0035]
1、本发明利用拍摄到的客户电能卡片图像,通过专门优化的算法,能够快速、准确自动提取卡片上客户号码;通过自动提取客户号码,使客户免于使用电子设备输入客户号,解决了特殊人群如老年人不熟悉虚拟电子设备及方法等困难,提升了客户与虚拟台区经理互动的便利性。
[0036]
2、本发明根据客户号码查询客户的用电记录、服务记录,及附近地址的用电数据、服务数据,并对上述记录、数据进行分析;通过采用模式识别的非线性分类方法进行分析,评估客户可能需要某类服务的概率,按照评估概率的大小输出客户可能需要的服务类型,实现对客户服务类型的预测,提高服务效率。
[0037]
3、本发明创新地提出了对语音数据进行处理的算法,并优化了神经网络模型,使得对于各类客户的语音识别更加快速、准确,进一步提高了客户服务的便利性和服务效率。
附图说明
[0038]
此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,并不构成对本发明的限定。在附图中:
[0039]
图1是本发明用电卡片图像拍摄及客户号码识别方法示意图。
[0040]
图2是用电记录、服务记录的分析方法流程图。
具体实施方式
[0041]
(一)利用图像处理自动获取客户用电卡片客户号码
[0042]
利用拍摄到的客户电能卡片图像,自动提取卡片上客户号码,用于客户的身份识别。
[0043]
客户请求服务时,提示客户出示印有客户号码的用电卡片,放置于客户交互平台的指定拍摄区域。操作摄像机拍摄指定拍摄区域的一张图像,并将图像用于分析(图1)。
[0044]
客户交互平台是实现本发明方法的设备载体,包括用于采集数据、展示数据的若干设备,可以是专用设备、或通用型设备(如pc机);平台可以采用单机架构,或客户-服务器模式的多机架构,采用多机架构时,客户机主要用于采集数据和展示数据,服务器用于对数据做分析、建模;本发明所述方法作为软件或服务运行于客户交互平台及其关联的相关设备上,实现虚拟台区经理的工作职责。
[0045]
指定拍摄区域的颜色着特定单色,用于区分卡片与其背景,便于提取卡片的图像。
[0046]
获取拍摄的一张图像,为rgb彩色图像,采取如下公式提取图像的颜色相位h:
[0047][0048]
其中θ定义如下:
[0049][0050]
cos-1
表示反余弦三角函数,r、g、b分别为图像的红色、绿色、蓝色颜色通道,π为圆周率。相对于颜色的亮度,颜色相位更不易受到环境光照影响,具备更好的稳定性,可以提高自动提取图像中卡片部分的效果。
[0051]
定义p(h)表示颜色相位的分布,计算:
[0052][0053]
为使p(h)取最大值的相位,表示图像中分布最为集中的颜色,并判断:
[0054]
如果与特定背景单色相近(如不超过5δh),则认为颜色相位分布峰值在背景上,将附近δh范围内,即颜色相位在的像素排除,获得背景分离图像i

。δh为邻域的大小,根据经验取值,参考优选值为
[0055]
如果与特定背景单色相差较大(如超过5δh),则认为颜色相位分布峰值在卡片上,将颜色相位在的像素排除,并重新计算分布得到p

(h),再按照前述标准判断直至获得背景分离图像i

。如果上述迭代过程超过3次,则提示用户重新放置卡片,并避免遮挡。
[0056]
对背景分离图像i

进行边缘提取,计算图像的空间偏导数并采用canny算法提取图像的二值边缘标记,获得二值边缘图像i
′b。i
′b中像素值为1的表示边缘像素,否则为非边缘像素。
[0057]
设参数k1、k2、l1、l2、l3、l4满足:
[0058][0059]
(x,y)是图像中像素的位置坐标。式(4)表示四条直线组成的矩形,采用hough算法计算包含最多的i
′b中边缘像素的矩形所对应的一组参数(k1,k2,l1,l2,l3,l4),其所围成的封闭矩形作为卡片边缘。
[0060]
按前述卡片边缘所围区域的空间位置,在原拍摄图像的对应区域截取矩形的四角,即沿长边方向距离短边1/3、沿短边方向距离长边1/10的四个子矩形,因客户号码印刷于用电卡片的某一角。
[0061]
对从原拍摄图像中截取的四个子矩形依次检测其中的数字部分。
[0062]
对任一个子矩形的图像,计算其高斯尺度图像ξ:
[0063]
[0064]
s(x,y)表示一个子矩形的图像,g1、g2表示两个高斯尺度核函数,表示局部卷积运算,x,y是图像的空间坐标,i,j是核函数的相对空间坐标。尺度图像相对于原拍摄图像具有更少的噪声,细节更突出,信噪比高,有利于图像特征的识别。
[0065]
计算高斯尺度图像的梯度η:
[0066][0067]
ξ
x
(x,y)、ξy(x,y)表示高斯尺度图像ξ的偏导数。高斯尺度图像的梯度反映了原图像的局部空间变化特征,可以有效的用于数字识别。
[0068]
设ck(u,v)表示用电卡片客户号码单个数字的样本图像,k∈[1,k]表示数字的种类,通常k=10。对每一类数字采集若干样本图像,并根据式(5)、(6)计算样本图像的梯度,再利用统计学习模型如支持向量机等建立针对每种数字的分类模型θ。
[0069]
遍历子矩形的图像,并根据数字分类模型θ识别其中的数字,可获得用电卡片上印刷的客户号。当在某一个子矩形获得符合位数条件的客户号后,本步骤结束。
[0070]
步骤1采集用电卡片的图像,提取其中卡片部分,进一步检测卡片四角可能印刷有客户号的部分,采用基于梯度的数字分类模型,用于识别用电卡片上印刷的客户号,作为识别客户身份的标识符。
[0071]
通过本发明所述图像识别方法所需训练样本数据集更少,可快速识别卡片上的客户号码,使客户免于使用电子设备输入客户号,解决了特殊人群如老年人不熟悉虚拟电子设备及方法等困难,提升了客户与虚拟台区经理互动的便利性。
[0072]
(二)对用电记录、服务记录进行分析评估客户可能需要的服务类型
[0073]
根据步骤1获得的客户号码查询客户的用电记录、服务记录,根据客户号码查询附近地址的用电数据、服务数据,并对上述记录、数据进行分析(图2)。
[0074]
所述客户的用电记录、服务记录是指客户用电、请求服务时采集到的原始的、未经统计或分析的数据。
[0075]
所述附近地址的用电数据、服务数据,是指根据客户号码查询到客户所在地,并对所在地附近地理位置其它用户的用电记录、服务记录进行统计后获得的数据。
[0076]
客户的用电记录包括客户单位时间用电的功率、电压、电流等电力指标,电表的实时读数、余额等用电信息。
[0077]
客户的服务记录包括客户在历史上请求服务的时间、服务类型、服务时长、解决情况。
[0078]
附近地址的用电数据包括与上述客户用电记录对应的,附近客户的用电记录集合的均值、最大值、最小值、分位值、方差值等统计数据。
[0079]
附近地址的服务数据包括与上述客户服务记录对应的,附近客户的服务记录集合的均值、最大值、最小值、分位值、方差值等统计数据。
[0080]
根据客户的用电记录、服务记录,统计获得客户的用电情况、请求服务情况,并生成与客户号码对应的客户分布数据。
[0081]
将客户分布数据与附近地址的用电数据、服务数据进行联合,采用模式识别的非
线性分类方法,如决策树方法,对上述联合数据进行分析,评估客户可能需要某类服务的概率,按照评估概率的大小输出客户可能需要的服务类型。
[0082]
(三)基于客户语音互动的服务类型确认、选择方法
[0083]
将步骤2输出的客户可能需要的服务类型向客户展示,并提示客户进行确认;如果上述可能选项不满足用户需求,则提示客户说出需要的服务类型,捕捉客户的语音,识别其中包含的服务类型;如果识别失败,则转入客户人工服务。
[0084]
根据步骤2获得的客户可能需要的服务类型及相应概率,在客户交互平台的显示屏上展示对应的服务类型。作为优化措施,根据服务类型的概率预测值将概率更高的服务加大、突出显示。
[0085]
客户根据展示的服务类型选择所需服务;如果没有客户所需要的服务,则选择服务没有列出。进入客户语音识别选择服务步骤。
[0086]
31、在客户交互平台上设置语音播报模块,进入客户语音识别选择服务步骤后,提示客户说出自己需要的服务类型。捕捉并记录客户的语音。
[0087]
32、记录下的客户语音经过采样、量化、编码后形成音频数据。
[0088]
33、音频数据经过强度检测模块,按照周期、步长切分为若干重叠的分段音频数据;计算每段音频数据的平均强度值,将平均强度大于阈值的分段做标记;选取时间最长的连续分段作为有效数据,并将对应的连续音频数据截取出来作为下一步骤的输入数据。
[0089]
将音频数据切分后去除音频数据中不包括客户声音的空白部分,降低数据冗余,突出音频数据中的客户语音特征,可提高语音识别的性能。通过设置步长小于周期,保持分段数据的部分重叠,可以克服由于语音采集设备质量导致的音频数据局部不连续问题,提取完整的客户语音特征。
[0090]
34、根据步骤33获得的音频数据,识别客户语音的模式,判断其需要的服务类型。
[0091]
将上述音频数据按照与步骤33相同的周期、步长切分为分段音频数据,每段音频数据记为speech
τ
。τ表示第几段音频数据。speech
τ
和speech
τ+1
存在部分重叠数据,重叠部分记为λ
τ,τ+1
,故不重叠部分分别表示为speech
τ-λ
τ,τ+1
、speech
τ+1-λ
τ,τ+1

[0092]
分别计算speech
τ-λ
τ,τ+1
、speech
τ+1-λ
τ,τ+1
、λ
τ,τ+1
的傅里叶能量谱,依次记为
[0093]
将能量谱通过带通滤波器,过滤能量谱的低频和高频部分,获得滤波后的能量谱
[0094]
将步骤33获得的完整的音频数据分段、并按前述步骤计算相邻分段之间的能量谱,获得若干组能量谱;并作为输入建立神经网络模型。
[0095]
[0096]
式中,变量∈表示能量谱的频率,ω
11
(t,∈)、ω
12
(t,∈)、ω
13
(t,∈)分别表示线性权值矩阵,矩阵的行数等于能量谱频率的量化级数,矩阵列数为64,即0《t≤64取整数。β
11
、β
12
、β
13
表示线性偏移参数。σ为非线性映射函数,定义如下。
[0097][0098]
cos表示余弦三角函数,余弦三角函数在建立本发明所述语音模型时拟合能量谱的非线性特性的效果更好;α的为调节参数,作用是使函数在x=0点处产生一个不连续断点,改善神经网络模型的识别效果。
[0099]
进一步的,以式(7)为基础:
[0100]
h2(t)=σ(β2+ω
21
(t)h
11
(t)+ω
22
(t)h
12
(t)+ω
23
(t)h
13
(t))

(9)
[0101]
ω
21
(t)、ω
22
(t)、ω
23
(t)为对应于式(7)输出的线性权值向量,0《t≤64表示向量的维数。h2(t)为一个64维向量。β2表示线性偏移参数,σ为非线性映射函数,定义如(8)。
[0102]
进一步的,定义神经网络模型的输出为:
[0103][0104]
ω3(c,t)为线性权值矩阵,矩阵的每一个元素表示h2(t)的一个元素与输出y(c)中一个元素的线性映射关系;β3表示线性偏移参数,σ为非线性映射函数,定义如(8)。神经网络输出y(c)表示根据输入的音频数据拟合计算的需求类型,c表示某一类需求。根据上述(7)-(10)所述神经网络模型,当输入音频数据的能量谱后,获得输出y(c);若y(c)的最大值当时取得,且该最大值大于分类阈值(如0.5),则认为输入音频数据对应客户需求为本发明提出的神经网络模型自由参数较少,相对于语音识别的广泛应用模型如bert等,能更高效识别客户语音中蕴含的需求。
[0105]
使用神经网络模型前对该模型进行训练,求取模型(7)-(10)中相关参数。准备训练样本为根据客户需求的语音所计算的能量谱,及相应的客户真实需求将训练样本数据输入模型,计算其输出值y,并与样本的真实值相对比:
[0106][0107]
上述函数为模型训练的损失函数,采用指数损失函数以增加对样本数据的拟合程度,提高模型性能。样本的真实值当类别为时取值为1,其余分量取值为0.
[0108]
35、根据步骤34判断客户语音所隐含的服务需要(即服务类型)。如果步骤34无法输出客户需求,则转入客户人工服务。
[0109]
本发明提出一种虚拟台区经理的跨域数据分析方法,建立自动化的客户交互平台,通过拍摄客户用电卡片的图像自动识别客户号码,进而根据客户号码分析相关数据,预测客户可能的需求,在需求不明的情况下通过自动分析用户语音进一步明确客户需求,实现虚拟台区经理服务,减轻台区经理的工作负担。表1给出了本发明方法各项运营数据,数据表明通过采用本方法,客户服务效率、解决率、满意度指标有了明显提高,客户服务自动应答率高,有效的缓解了台区经理的工作负担。
[0110]
表1
[0111]
指标采用本方法前采用本方法后平均响应时间22分3分平均问题解决时间12.1小时3.3小时客户问题解决率83%95%客户满意度87%98%客户服务自动应答率不适用83%
[0112]
本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1