一种电力企业大数据平台中数据的查询与展示方法与流程

文档序号:18823378发布日期:2019-10-09 01:09阅读:286来源:国知局
一种电力企业大数据平台中数据的查询与展示方法与流程

本发明属于电力数据处理技术领域,具体涉及一种电力企业大数据平台中数据的查询与展示方法。



背景技术:

传统的人机交互方式有键盘、鼠标等,而随着生产经营业务量的增加,各个企业都建设了大量的信息系统供办公或经营决策使用,菜单交互方式是使用较早,也是使用最广泛的人机交互方式。其特点是,让用户在一组多个可能对象中进行选择,各种可能的选择项以菜单项的形式显示在屏幕上。随着移动技术的发展,企业对于移动办公的要求也越来越高,但是很多能在计算机端建设的功能项并不能全部展现到移动端,而且被选对象受限制,即只能完成预定的系统功能,在大系统中使用速度慢。因受屏幕显示空间的限制,每幅菜单显示的菜单项数受限制。由于显示菜单需要占用屏幕空间和显示时间,从而增加了系统开销。

在如今数字时代下,电力行业又作为资产密集型和技术密集型行业的典型,信息技术已覆盖基建、生产、经营、办公、管理等各个领域,不仅历史数据量大,系统建设繁多,用户的沟通成本较大,有的时候数据也会要重复输入到各个业务系统,也会存在系统数据不一致的情况。查询无疑是帮助人们快速找到所需数据资源的一种重要方式。另一方面,随着语音识别技术的应用,语音查询也逐渐成为方式的发展趋势之一。

如何通过最直接的获取信息的方式,充分利用语音交互技术,设计一款能够实现语音交互电力行业数据的机器人,从输入、识别到执行,降低用户的沟通和办公成本,高效提升操作性,显得尤为有必要。

现有智能语音助理或语音机器人工作原理大致如下:

第一阶段:语音到文本的过程;信号源→设备(捕获音频输入)→增强音频输入→检测语音→转换为其他形式(如文本);

第二阶段:响应过程;处理文本(如用nlp处理文本,识别意图)→操作响应。

在检测语音过程中,就包括分辨是否为语音信号,该过程会通过指定的频率对模拟信号进行采样,将模拟声波转换为数字数据。这一过程很重要,是否成功地识别语音。如果生成数字数据都是错误的,那么后期的处理响应那肯定是错的。这也是影响智能语音助理或语音机器人识别率的重要因素。

在这个过程,用于语音处理的技术是语音活性检测(voiceactivitydetection,vad),目的是检测语音信号是否存在。vad技术主要用于语音编码和语音识别。它可以简化语音处理,也可用于在音频会话期间去除非语音片段:可以在ip电话应用中避免对静音数据包的编码和传输,节省计算时间和带宽。

目前一些相关技术方案已经提出用于数据查询方案。例如,公开号为cn104199956a的发明专利,介绍了提供了一种erp数据语音搜索方法。然而,现有查询速度在网络上对语音的搜索效率还不能令人满意,此外,对于电力行业企业大数据平台的管理来说,不同类型的数据在不同的人员,不同的区域都有着各自不同的需求和管理方式,语音查询多数情况下仍然依赖于使用大数据平台自身的权限管理模块实现权限管理,面对不同的使用者使用查询和数据搜索功能时,必须退出当前用户的系统并让其他人重新其自身的身份登陆到系统中。这给使用者带来了极大的不便。尤其是在登陆手机端等键盘或点击操作方式不便输入的客户界面时,这种低效率的问题就更加明显。



技术实现要素:

针对上述问题,本发明提出一种电力企业大数据平台中数据的查询与展示方法,充分利用语音交互技术,实现了从输入、识别到执行的自动化操作,降低用户的沟通和办公成本,高效提升操作性。

实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:

一种电力企业大数据平台中数据的查询与展示方法,包括以下步骤:

建立大数据平台,所述大数据平台中包括顺次相连的数据采集单元、数据存储单元、数据分析与处理单元和数据应用单元;

利用人机交互模块中的语音采集器获取用户发出的自然语音命令,并对接收到的自然语音命令进行分析提取出查询用关键信息;

利用人机交互模块将所述查询用关键信息发送至大数据平台中的数据应用单元中,经由大数据平台中的数据分析与处理单元处理后,从数据存储单元中获取相应的数据信息,并返回相应的查询信息至人机交互模块,最后通过人机交互模块中的人机交互界面显示该返回的查询信息。

优选地,所述数据应用单元提供与人机交互模块进行交互的接口。

优选地,所述数据存储单元为基于hadoop体系搭建的分布式结构。

优选地,所述数据采集单元中,对于办公管理类数据,则将rdb数据库中的数据同步到hdfs中,使得hdfs成为备份了完整数据的冗余存储;对于生产实时类数据,则根据业务场景做对应的预处理,之后再写入到对应的数据存储中;对于视频文件类数据,需要在extract阶段加载图片后,然后根据设定的识别算法,识别并提取图片的特征信息,并将其转换为业务场景需要的数据模型。

优选地,所述预处理包括去重、去噪和/或中间计算。

优选地,所述数据分析与处理单元提供各项销售数据、市场指标的统计和综合功能,还提供为预警数据设置提供参考数据功能。

优选地,所述人机交互模块中包含了语音识别库;所述对接收到的自然语音命令进行分析提取出查询用关键信息,具体包括以下子步骤:

对接收到的自然语音命令进行特征值提取,所述特征值包括:分词和关系;

将提取出来的特征值按照设定的匹配准则与语音识别库中的数据进行匹配;

最终从语音识别库中找出最匹配的查询用关键信息。

优选地,所述语音识别库中包含参考模板,所述参考模板通过机器学习获得,在学习阶段,将特征参数进行处理后,为每个业务类型建立一个模型,保存为模板库。

优选地,在识别阶段,自然语音命令经处理后生成测试模板,并将所述测试模块与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果。

优选地,匹配成功后,将自然语音命令转化为文字字符串流,并通过语音解析功能对其进行分析,结合时域分析方法,以时间和指标、单位名、事务关系作为自变量进行分析,正确的判断自然语音命令的起点,提取出查询用关键信息。

与现有技术相比,本发明的有益效果:

本发明提出的一种电力企业大数据平台中数据的查询与展示方法,充分利用语音交互技术,实现了从输入、识别到执行的自动化操作,降低用户的沟通和办公成本,高效提升操作性。

附图说明

图1为本发明一种实施例的大数据平台的结构示意图;

图2为本发明一种实施例的电力企业大数据平台中数据的查询与展示方法的数据流向示意图;

图3(a)为本发明一种实施例的人机交互界面显示图之一;

图3(b)为本发明一种实施例的人机交互界面显示图之二;

图3(c)为本发明一种实施例的人机交互界面显示图之三;

图3(d)为本发明一种实施例的人机交互界面显示图之四。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

下面结合附图对本发明的应用原理作详细的描述。

如图1所示,本发明提供了一种电力企业大数据平台中数据的查询与展示方法,包括以下步骤:

步骤(1)建立大数据平台,如图1所示,所述大数据平台中包括顺次相连的数据采集单元、数据存储单元、数据分析与处理单元和数据应用单元;

在本发明实施例的一种具体实施方式中,所述数据采集单元中,对于办公管理类数据,则将rdb数据库中的数据同步到hdfs中,使得hdfs成为备份了完整数据的冗余存储,在这种场景下,数据采集就仅仅是一个简单的同步,无需执行转换;对于生产实时类数据,则根据业务场景做对应的预处理,所述预处理包括去重、去噪和/或中间计算,之后再写入到对应的数据存储中,这个过程类似传统的etl,但它是流式的处理方式,而非定时的批处理job;对于视频文件类数据,需要在extract阶段加载图片后,然后根据设定的识别算法,识别并提取图片的特征信息,并将其转换为业务场景需要的数据模型,在这个场景下,数据提取的耗时相对较长,也需要较多的内存资源;

所述数据存储单元为基于hadoop体系搭建的分布式结构,统一存储管理分散的数据,保证海量数据的存储需求,支持增量扩容和数据的自动平衡,支持随机读写和追加写的操作,有效解决现有技术中数据相对比较分散,都存储在各自的业务应用中,没有统一汇聚在一个存储介质中,从而阻碍实现与各专业生产经营系统的协同互动的问题,能够做到数据决策的及时性、科学性、前瞻性,真正发挥数据在发电企业的生产、经营活动中各个环节中的作用,为电力市场营销决策提供服务的目的;

所述数据分析与处理单元提供各项销售数据、市场指标的统计和综合功能,为业务部门提供了较准确的市场供需状况信息、零售客户及消费者对于行业的需求情况等,也为营销部门做好能源供应和投放等提供了较可靠的依据;还提供为预警数据设置提供参考数据,能源企业可以根据提供的数据信息,分析售电售热、发电等等;结合以上几方面的分析,数据分析工作的重要性不言而喻;

所述数据应用单元提供与人机交互模块进行交互的接口,以实现对外提供给软件企业、科研机构使用,将数据进行标准化封装,在满足各业务数据使用的需求下按需进行开放,并在经验成熟的情况下逐渐开放给外部众多的合作伙伴使用;

步骤(2)利用人机交互模块中的语音采集器获取用户发出的自然语音命令,并对接收到的自然语音命令进行分析提取出查询用关键信息;

所述人机交互模块中包含了语音识别库;所述语音识别库中包含参考模板,所述参考模板通过机器学习获得,在学习阶段,将特征参数进行处理后,为每个业务类型建立一个模型,保存为模板库;

在本发明的一种具体实施例中,所述对接收到的自然语音命令进行分析提取出查询用关键信息,具体包括以下子步骤:

对接收到的自然语音命令进行特征值提取,所述特征值包括:分词和关系;对于分词提取,在实际应用中,对单位名及其简称、业务内容,比如发电量等元素,使用机器学习的方法将其录入到统计分词系统进行串匹配分词,同时使用统计方法识别一些新的词,即将串频统计和串匹配结合起来,既发挥匹配分词切分速度快、效率高的特点,又利用了无词典分词结合上下文识别生词、自动消除歧义的优点;对于关系的提取,主要采用统计和机器学习的方法,对大数据平台中事务关系、时间、地点、指标进行提取;

将提取出来的特征值按照设定的匹配准则与语音识别库中的数据进行匹配;

最终从语音识别库中找出最匹配的查询用关键信息;

即在识别阶段,自然语音命令经处理后生成测试模板,并将所述测试模块与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果;匹配成功后,将自然语音命令转化为文字字符串流,并通过语音解析功能对其进行分析,结合时域分析方法,以时间和指标、单位名、事务关系作为自变量进行分析,正确的判断自然语音命令的起点,在没有背景噪声的情况下,正确区分清音和无声段,提取出查询用关键信息。

步骤(3)利用人机交互模块将所述查询用关键信息发送至大数据平台中的数据应用单元中,经由大数据平台中的数据分析与处理单元处理后,从数据存储单元中获取相应的数据信息,并返回相应的查询信息至人机交互模块,最后通过人机交互模块中的人机交互界面显示该返回的查询信息,实现了系统具有“会说话”的功能。

为了更好的实现企业大数据平台中数据的语音交互展现,本发明中设计了几种不同触发的展示界面,包括:待机界面、听询界面、结果选择界面、回答正确显示界面、回答错误显示界面等。系统根据不同的结果进行不同界面的展示,具体参见图3。

以下仅展示问询用户希望得知***的电话号码的实例流程:

1、是大数据机器人“大华001”正常情况下的待机界面,如图3(a)所示;

2、用户来到“大华001”面前,用户语音进行互动:“大华001,你好”,机器人回应:

“您没有经过人脸认证,请先登录”;用户在界面前,通过识别框,进行人脸录入,通过后;

3、用户再次唤醒“大华001”,机器人回应:“你好,请问需要什么帮助”,同时机器人页面上展示“聆听中”的状态,如图3(b)所示;

3、用户语音提出:“***的电话号码”。机器人识别此句话后,进行后台操作,如果有多个叫**的人,则在前台界面全部输出**的信息,用户再次语音提示选择需要选择的信息,,机器人识别后,语音给出答应信息:“***的手机号为**********”,前台界面上也展示成功的笑脸,如图3(c)所示;

4、用户还想再次尝试询问另外一个人的电话,机器人没有正确识别语音信息,此时则交互不成功,语音提示用户没有找到用户想要的内容:“没有听清楚,请换个关键词试试”,前台界面则展示不开心的表情,如图3(d)所示;

5、问询结束,用户语音“待机”,机器人重新回到图3(a)的展示界面。

在正常条件下,基于大数据的人机交互是完全成功的。结果如下表所示:

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1