一种基于粗糙集和基因表达式的电力业务数据过滤系统及方法

文档序号:6376750阅读:458来源:国知局
专利名称:一种基于粗糙集和基因表达式的电力业务数据过滤系统及方法
技术领域
本发明涉及电力业务数据安全保护系统中的敏感数据过滤,主要用于解决电力业务数据保护系统中敏感数据过滤的问题,属于信息安全领域。
背景技术
“十一五”到目前,国家电网公司通过“SG186”工程建设,其信息系统已基本覆盖其主要业务领域,信息化对企业战略发展的支撑效果明显。对于“十二五”的信息化建设,国家电网公司围绕智能电网,提出了为智能电网提供信息支撑的“ SG-ERP ”计划,其目标是利用现代通信和信息技术,在电网数字化和自动化的基础之上,深化电力各环节的数据采集、传输、存储和利用,实现数据采集数字化、生产过程自动化、业务处理互动化、经营管理信息化、战略决策科学化;助力智能电网建设,全面提升公司生产、经营、管理和决策水平。可见 SG-ERP作为信息化建设工程,已经将业务融合作为首要出发点,已经着眼于打破先前电力自动化和电力信息化相对独立、各自发展的局面,已经将信息化建设延伸到了电力生产核心业务中。随着SG-ERP信息化建设的实施和不断深入推进,越来越多的电力业务应用系统中(安全生产、营销管理、物资管理等)将广泛采用移动智能终端接入方式和电力信息内网进行实时、非实时的数据通讯和数据交换。同时,随着坚强智能电网的建设,大量智能采集和智能终端设备的使用,3G/WIFI等无线通信技术的广泛使用,使得各种电力业务应用数据被破坏和泄漏出去的途径大大增加。电力业务应用数据保护是智能电网发、输、变、配、用等各环节业务系统安全稳定运营的基础。同时随着国家电网公司三大数据中心的建设,各种业务系统数据越来越集中进行存储,敏感数据的可靠存储与防护变得愈加重要。针对电力业务应用敏感数据保护而言,其核心技术就是电力业务应用数据在存储和传输过程中能够被有效识别,并针对相应的策略来实现其过滤,从而达到防止其泄露的目的。而数据识别过滤的方法也很多,有基于策略匹配、基于BP网络等。不同的数据识别过滤方法,其效果不甚相同,主要体现在性能、自动化程度、日常管理以及可扩展性等方面。电力业务应用数据识别过滤的最终目的是为了在其存储和传输过程中,能够通过一定的策略方法对其进行有效的保护,防止涉及国家电网公司机密的业务数据泄露。因此在电力业务应用敏感数据保护系统中研究一种有效的数据识别过滤方案对于提高敏感数据保护能力、降低其泄露、保障电力业务系统安全稳定运行都具有重要的意义。随着国家电网公司信息化技术的不断深入发展,各种信息化技术逐渐成熟并被应用到各种电力业务应用中,所使用的数据位于不同存储节点上,随着各类电力业务应用数据之间的共享,现有的安全机制无法保证其在存储和传输过程中的不被泄露。为了确保这些电力业务应用数据在存储和传输过程中的安全性,防止敏感数据的泄露,可以采用全文加密、策略匹配以及人工智能等方法。全文加密可以解决数据在存储和传输过程中的安全性,但针对海量电力业务数据而言,难以有效地保证其性能和准确性。策略匹配方法既能解决电力业务数据的安全问题,又可以保证其性能和准确性,但是针对不同电力业务系统,需要制定的策略各不相同,因此需要一套较为复杂的策略库支持才能达到电力业务应用数据防泄漏的目的。而各种人工智能的方法既能满足数据安全防护的需求,又可以充分利用方法的智能化和自学习的能力来提高数据过滤的性能。数据识别过滤方法主要从以下几个方面来进行考虑(1)针对采集得到的各类电力业务数据,为了便于后期数据过滤处理,对其进行数据清洗、噪声数据剔除等预处理;
(2)针对预处理后的电力业务数据,结合粗糙集方法约简其属性,降低数据的复杂度;(3)针对属性约简后的电力业务数据,利用基因表达式方法建立电力业务数据分类模型,基于该分类模型在电力业务数据存储和传输过程中,主动识别其敏感程度,并配合策略知识库防止其泄露
发明内容
为了解决上述的问题,本发明的目的就是提供一种新的有关电力业务数据过滤的系统和方法,来解决电力业务数据保护系统中的敏感数据过滤问题,所采用的机制是一种策略性方法,通过使用本发明可以使得各类电力业务敏感数据在终端和网络间传输时可以最大限度地防止电力业务敏感数据的泄露,从而保护各类电力业务系统安全稳定运行。根据本发明的一个方面,提出了一种基于粗糙集和基因表达式的电力业务数据过滤系统,所述电力业务数据过滤系统包括数据预处理器,用于对待处理的各类电力业务数据进行数据预处理,所述数据预处理可包括数据清理及数据变换等;数据属性约简控制器,用于约简电力业务数据集合,简化电力业务数据集;数据过滤控制器,用于对敏感电力业务数据进行智能过滤,保证电力业务数据传输的安全性。根据本发明的一个方面,在电力业务数据安全保护系统中,数据属性约简控制器采用粗糙集方法约简电力业务数据集合,降低数据的复杂度。根据本发明的一个方面,在电力业务数据安全保护系统中,数据过滤控制器利用基因表达式方法建立电力业务数据分类模型,基于该分类模型主动识别电力业务数据的敏感程度,配合策略知识库防止泄漏。根据本发明的一个方面,提出了一种基于粗糙集和基因表达式的电力业务数据过滤方法,所述电力业务数据方法用于电力业务数据安全保护,包含的步骤为通过数据预处理器对待处理的各类电力业务数据进行数据预处理,所述数据预处理可包括数据清理及数据变换等;通过数据属性约简控制器约简电力业务数据集合,简化电力业务数据集;通过数据过滤控制器对敏感电力业务数据进行智能过滤,保证电力业务数据传输的安全性。根据本发明的一个方面,在数据过滤方法中,数据属性约简控制器采用粗糙集方法约简电力业务数据集合,降低数据的复杂度。根据本发明的一个方面,在数据过滤方法中,数据过滤控制器利用基因表达式方法建立电力业务数据分类模型,基于该分类模型主动识别电力业务数据的敏感程度,配合策略知识库防止泄漏。


下面结合附图及具体实施例对本发明再作进一步详细的说明。图I是根据本发明一个实施例的数据过滤结构图,主要包括数据预处理器、数据属性约简控制器、数据过滤控制器以及数据过滤操作核心。图2是根据本发明一个实施例的参考体系结构示意图,表示本发明包括的组件。图3是根据本发明一个实施例的方法流程示意图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。本发明的方法是一种策略性的方法,通过对各种存储或传输过程中的电力业务数据进行预处理,得到符合粗糙集处理的电力业务样本数据集,然后通过粗糙集理论对预处理后电力业务样本数据集进行有效的属性约简,大大降低电力业务数据识别过滤的时间复杂度,最后基于基因表达式算法对约简后的数据集进行分类处理,实现各类电力业务数据的过滤。图I给出了基于粗糙集和基因表达式的电力业务数据过滤系统的结构图,它主要包括五个部分数据预处理器、数据属性约简控制器、数据过滤控制器以及数据过滤操作核心。图中的数据过滤操作核心包括了在数据预处理和分类好的情况下,对数据进行过滤所需的具体操作。本发明增加了其它三个部分保证数据过滤更加顺利有效地进行,最大限度地保证数据的识别过滤能力,减小电力业务敏感数据的泄露风险。下面给出具体介绍数据预处理器为了保障电力业务系统安全稳定运行,最重要的就是各类电力业务数据在存储和传输过程的安全,其中防止其数据泄露是重中之重。在进行电力业务数据识别和保护之前,需要对待处理的各类电力业务数据进行数据清理及数据变换等数据预处理。为了提高过滤电力业务数据的质量,降低其时间复杂度,首先针对各类电力业务数据,通过填写相应属性的缺失值、平滑噪声数据等清理数据;其次通过规范化等方法将电力业务数据转换成适用于识别过滤的形式。在本专利中对数据预处理的具体实现不做任何限制。数据属性约简控制器对于经过预处理后的电力业务数据集合,由于电力业务自身的特性,造成该数据集合属性众多,如果没有相应的属性约简方法,将会导致电力业务数据集识别过滤的复杂度大大增加,同时其处理的效率也将大大下降。数据属性约简控制器针对预处理后的电力业务数据集合,在不改变其固有分类能力的情况下,采用粗糙集方法来约简电力业务数据集合,删除电力业务数据集合中的属性冗余信息,简化电力业务数据集。数据过滤控制器为了保证电力业务数据在终端和网络间传输时,能够快速有效地识别电力业务数据中是否包含敏感信息,在数据保护系统中仅基于关键字匹配是远远不够的,因为关键字匹配并不能对恶意泄露者更改数据自身属性等行为进行有效的检查,无法保证各类敏感电力业务数据在传输过程中的保密。如果恶意泄露者对待传输的敏感数据更改其文件名、文件属性等,那么数据保护系统将无法保证其安全。因此必须建立智能化自动化的数据识别过滤模型。本专利中采用基因表达式来建立电力业务数据识别过滤模型。I、数据预处理器电力业务数据集是否需要进行预处理取决于数据集的格式是否满足识别过滤方法的要求。为了及时判断出电力业务数据集是否需要进行相应的预处理操作,在本方法中,建立一个数据预处理规则库,当用户在执行数据过滤时,首先通过查询数据预处理规则库,判断当前数据集中的属性值是否有缺失,若某一属性值有缺失,则通过使用当前数据集该属性值的均值来填充;其次通过聚类的方法来判断当前数据集中是否含有噪声数据,若有,则删除对应的噪声数据;最后判断当前数据集中是否含有字符型数据,若有,则通过规范化方法将其变换成数值型数据,最终形成符合数据过滤方法要求的电力业务数据集。在这里我们以原始电力业务数据集ODataSet为例,整个ODataSet的数据结构形式如表I所示。表IODataSet的数据结构
权利要求
1.一种基于粗糙集和基因表达式的电力业务数据过滤系统,用于保障电力业务数据的安全,其特征在于,所述电力业务数据过滤系统包括 数据预处理器,用于对待处理的各类电力业务数据进行数据预处理,所述数据预处理可包括数据清理及数据变换; 数据属性约简控制器,用于约简电力业务数据集合,简化电力业务数据集; 数据过滤控制器,用于对敏感电力业务数据进行智能过滤,保证电力业务数据传输的安全性。
2.根据权利要求I中的电力业务数据安全保护系统,其特征在于 数据属性约简控制器采用粗糙集方法约简电力业务数据集合,降低数据的复杂度。
3.根据权利要求2中的电力业务数据安全保护系统,其特征在于 数据过滤控制器利用基因表达式方法建立电力业务数据分类模型,基于该分类模型主动识别电力业务数据的敏感程度,配合策略知识库防止泄漏。
4.一种基于粗糙集和基因表达式的电力业务数据过滤方法,其特征在于,该方法所包含的步骤为 通过数据预处理器对待处理的各类电力业务数据进行数据预处理,所述数据预处理可包括数据清理及数据变换; 通过数据属性约简控制器约简电力业务数据集合,简化电力业务数据集; 通过数据过滤控制器对敏感电力业务数据进行智能过滤,保证电力业务数据传输的安全性。
5.根据权利要求4中的数据过滤方法,其特征在于 数据属性约简控制器采用粗糙集方法约简电力业务数据集合,降低数据的复杂度。
6.根据权利要求5中的数据过滤方法,其特征在于 数据过滤控制器利用基因表达式方法建立电力业务数据分类模型,基于该分类模型主动识别电力业务数据的敏感程度,配合策略知识库防止泄漏。
全文摘要
本发明提出了一种新的电力业务数据过滤的系统和方法,来解决电力业务数据保护系统中的敏感数据过滤问题,该系统主要有数据预处理器、数据属性约简控制器、数据过滤控制器等部分组成。采用粗糙集方法约简电力业务数据集合,降低数据的复杂度,利用基因表达式方法建立电力业务数据分类模型,基于该分类模型主动识别电力业务数据的敏感程度,配合策略知识库防止泄漏。
文档编号G06Q50/06GK102915423SQ20121033541
公开日2013年2月6日 申请日期2012年9月11日 优先权日2012年9月11日
发明者邓松, 张涛, 林为民, 马媛媛, 李伟伟, 时坚, 汪晨, 周诚, 胡斌 申请人:中国电力科学研究院, 国家电网公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1