基于互联网访问情况分析企业运行管理状况的方法及系统的制作方法

文档序号:10690882阅读:179来源:国知局
基于互联网访问情况分析企业运行管理状况的方法及系统的制作方法
【专利摘要】本发明揭示了基于互联网访问情况分析企业运行管理状况的方法及系统,通过企业员工上网信息的分析,建立若干分析模型,并通过这些模型查找企业中长期开机且非服务器的主机,并发出预警;进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析;进行员工访问招聘类网站的时间段分析以及员工访问招聘类网站的频度分析;进行员工工作时间的分析和员工访问工作相关网站时间段分析;并将分析结果进行展示。本发明可以对公司内部员工的工作动向、情绪变化、工作负荷、节能等情况进行实时、准确的分析,便于企业经营者及时了解员工的动态,为企业经营管理者的管理行为提供了有效的数据支撑。
【专利说明】
基于互联网访问情况分析企业运行管理状况的方法及系统
技术领域
[0001 ]本发明涉及企业运行管理状况的方法及系统,尤其涉及一种基于互联网访问情况分析企业运行管理状况的方法及系统。
【背景技术】
[0002]企业经营过程中,企业管理者需及时了解知道员工的工作动向、情绪变化、工作负荷等相关背景信息,另外,节能减排的有效推进不仅能让企业节约开支,更是企业社会责任的重要体现。
[0003]传统方法中,这些信息主要通过问卷调查,面对面沟通等方式进行,这些方式虽然具有内容详细、针对性强等优势,但存在周期长、效率低、信息不及时、主观性较强、信息不真实等问题。
[0004]并且,随着时代的变化,新一代年轻人的自我意识和被尊重意识更显强烈,对企业管理措施从堵到疏的要求日益迫切
[0005]因此,就企业经营管理而言,特别是在人的管理上,企业经营的管理者需要有更多的渠道及时反映员工的情绪变化、员工的敬业程度等真实信息。
[0006]网络设备在互联网不同的阶段有不同的角色产生,满足不同层次的需求,同样也可以用马斯洛需求层次理论(生理需求、安全需求、社交需求、尊重需求和自我实现需求)分析。
[0007]随着互联网的进一步发展,为满足社会人对尊重的需求,相关网络设备出现就成为必然。

【发明内容】

[0008]本发明的目的就是为了解决现有技术中存在的上述问题,创新的使用“互联网+企业管理”的理念,通过对企业内部有效主机互联网访问行为数据的挖掘分析,从而提供了一种能够为企业节能减排和员工关怀方面实时地提供信息支撑的基于互联网访问情况分析企业运行管理状况的方法及系统。
[0009]本发明的目的将通过以下技术方案得以实现:
[0010]基于互联网访问情况分析企业运行管理状况的方法,包括如下步骤:
[0011]SI,获取企业互联网出口处设备采集的网络访问DPI信息、DFI信息以及企业的基础数据,形成数据源;
[0012]S2,对数据源中的数据进行处理,建立节能提示模型,并通过节能提示模型查找企业中是否存在长期开机且非服务器的主机,并在识别出长期开机且非服务器的主机时,发出预警;
[0013]S3,对数据源中的数据进行处理,建立员工互联网偏好模型,通过员工互联网偏好模型进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析;
[0014]S4,对数据源中的数据进行处理,建立员工情绪模型,通过员工情绪模型进行员工访问招聘类网站的时间段分析、员工访问招聘类网站的频度分析;
[0015]S5,对数据源中的数据进行处理,建立员工工作负荷模型,通过员工工作负荷模型进行员工工作时间的分析和员工访问工作相关网站时间段分析;
[0016]S6,将S2-S5的分析结果进行展示。
[0017]优选的,所述基础数据包括预定义基础数据、配置基础数据。
[0018]优选的,所述S2步骤-S5步骤中对数据源中的数据进行处理的过程包括数据清洗、数据关联、数据聚合、信息提取、信息验证及信息评估预测。
[0019]优选的,所述S2步骤包括如下过程:
[0020]S21,按照gw_id,equip_id,user_id,user_name , time_date ,URL, time_distinet对数据源中的数据表进行汇总操作,获取数据子集;
[0021]S22,按照8¥_1(1,1:;[1]16_(^七6,69111口_1(1对521步骤得到的数据子集进行汇总得到数据表;
[0022]S23,按照gw_id,time_date对S22步骤得到的数据表做汇总,取size()作为汇总统计量,该汇总统计量即为当日有效主机数;
[0023]S24,对S22步骤得到的数据表,按照gw_id,equip_id进行分组,观测每个time_date时间窗口内,有效主机是否一直有URL访问行为,将此类主机定义为未关机主机,并在数据表中增加status列,标示为未关机状态,得到新的数据表;
[0024]S25,对S24步骤中新的数据表使用公式:非工作特征时间URL数彡1/3*工作特征时间URL数,并在数据表中增加无人操作标识维度(no_operat1n),标记no_operat1n = yes(无人操作标识),得到新的数据表;
[0025]S26,对S25步骤得到的数据表按照gw_id, time_date , status,no_operat1n进行汇总,取size ()作为汇总统计量,其中,status = no_power_off (未关机标识)并且no_operat1n = yes(无人操作标识)的值即为未关机数(当日未关机且无人操作的主机数),得到新的数据表;
[0026]S27,对S26步骤得到的数据表使用公式:
[0027]未关机比例=非工作时段无人操作主机总数/当日有效主机总数;
[0028]S28,将日期(time_date)、未关机数、未关机比例连接,形成企业未关机趋势,超过预定阀值触发报警;
[0029]S29,将无人操作主机ID与日期(time_date)连接,得到最近一个月内I天、3天、I周、半月个以及一个月连续未关机的主机数刻画,超过预定阀值触发报警。
[0030]优选的,所述企业未关机趋势通过时间曲线图表示,所述S210步骤的分析结果通过帕累托图表示。
[0031]优选的,所述S3步骤包括如下过程:
[0032]S31,在数据源中提取最近一周或一月的URL数据表;
[OO33 ] S3 2,对S 31步骤中的URL数据表按照gw_i d,URL做汇总,取Sum (h i t_num)作为汇总统计量,将此点击量的汇总统计量作为最近一周或一月的URL网站访问热度指标;
[0034]S33,在数据源中提取最近一周或一月的流量数据表;
[0035]S34,在S33步骤中的流量数据表中增加traffic字段,使用公式:
[0036]traf f ic = traf f i c_up+traf f i c_down,得到新的数据表;
[0037]S35,对S34步骤中得到的数据表按照gw_id,app_name做汇总计算,取sum(traffic)作为汇总统计量,将此流量的汇总统计量作为最近一周或一月的app使用热度指标。
[0038]优选的,所述S4步骤包括如下过程:
[0039]S41,在数据源中提取最近一周或一月的URL数据表,其中URL_type = 33619968(招聘类);
[0040]S42,对S41步骤中的数据表按照gw_i d,t ime_d im进行汇总,汇总统计量取sum(hit_num);
[0041]S43,对S42步骤中点击量总数按倒序排序,即为最近一周或一月的各时段访问招聘网站的热度排名结果;
[0042]S44,对 S41 步骤中的 URL 数据表按照 gw_id,time_dim,user_id,user_name 进行汇总,得到新的数据表;
[OO43 ] S4 5,对S44步骤中得到的数据表按照gw_i d,t ime_d i m汇总,取s i z e ()作为汇总统计量,该统计量即为不同员工在该时段访问招聘网站的次数。
[0044]优选的,所述S5步骤包括如下过程:
[0045]S51,在数据源中提取URL数据表;
[0046]S52,在S51步骤的URL数据表中进一步提取可识别URL(URL_type不等于NULL)形成数据表;
[0047]S53,对S52步骤形成的数据表按照gw_id,user_id,user_name,time_dim,URL_type进行汇总,取size()作为汇总统计量;
[0048]S54,将URL_type = “生产类”的网站有点击行为的用户定义为工作状态,在S52步骤形成的数据表中添加新字段work_StatuS信息,将生产类网站有点击行为定义为工作状态;
[0049]S55,对S54步骤得到的数据表中的表状态work_status赋值,当同一个用户处于工作状态时,其状态只要不连续出现非工作状态,则将偶现的非工作状态修正为工作状态;
[0050]S56,汇总计算S55步骤得到的数据表中time_dim的开始时段(上班开始时段)、结束时段(下班开始时段)、中间时段(工作时长);
[0051 ] S57,对S54步骤得到的数据表进行汇总计算,汇总统计量按time_date取sum(hit_num),即获得生产类URL的日点击总数,再按日期排序即可得到生产类网站的访问趋势。
[0052]优选的,来自于数据源中提取的数据子集,并进行了数据类型转换,用于为建模做准备的中间数据表结构包括:网关ID号,时间槽,用户名,终端类型号,网址分组号,hit次数。
[0053]基于互联网访问情况分析企业运行管理状况的系统,包括:
[0054]数据获取单元,用于获取企业互联网出口处设备采集的网络访问DPI信息、DFI信息以及企业的基础数据,形成数据源;
[0055]节能提示单元,用于对数据源中的数据进行处理,建立节能提示模型,并通过节能提示模型查找企业中是否存在长期开机且非服务器的主机,并在识别出长期开机且非服务器的主机时,发出预警;
[0056]员工互联网偏好分析单元,用于建立员工互联网偏好模型,通过员工互联网偏好模型进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析;
[0057]员工情绪分析单元,用于对数据源中的数据进行处理,建立员工情绪模型,通过员工情绪模型进行员工访问招聘类网站的时间段分析、员工访问招聘类网站的频度分析;
[0058]员工工作负荷分析单元,用于对数据源中的数据进行处理,建立员工工作负荷模型,通过员工工作负荷模型进行员工工作时间的分析和员工访问工作相关网站时间段分析;
[0059]以及,展示单元,用于将节能提示单元、员工互联网偏好分析单元、员工情绪分析单元以及员工工作负荷分析单元的分析结果进行展示。
[0060]本发明技术方案的优点主要体现在:
[0061]本发明通过对互联网访问的跟踪记录和分析建模,可以对公司内部员工的工作动向、情绪变化、工作负荷、节能等情况进行分析,便于企业经营者及时了解员工的动态,为企业经营管理者的管理行为提供了有效的数据支撑,从而为企业经营者可以及时安抚员工情绪,对可能存在的问题防患于未然;同时也可以通过制定针对性的措施,提高团队的士气和凝聚力。
[0062]本方法数据获取及时、准确、快速,受人为主观因素影响小,数据分析效率高、范围广。
【具体实施方式】
[0063]本发明的目的、优点和特点,将通过下面优选实施例的非限制性说明进行图示和解释。这些实施例仅是应用本发明技术方案的典型范例,凡采取等同替换或者等效变换而形成的技术方案,均落在本发明要求保护的范围之内。
[0064]本发明重点关注企业内部管理和员工关怀两个方面,其中,企业内部管理至少包括节能提示模型;员工关怀方面至少包括员工互联网偏好分析、员工情绪分析和员工工作负荷度分析三个主体模型,结合企业基础数据,在员工个体和员工群体两个尺度上反映员工的各个方面。
[0065]具体的,本发明揭示的基于互联网访问情况分析企业运行管理状况的系统,包括:数据获取单元、节能提示单元、员工互联网偏好分析单元、员工情绪分析单元、员工工作负荷度分析单元以及结果展示单元。
[0066]其中,所述数据获取单元,用于获取企业互联网出口处设备采集的网络访问DPI信息、DFI信息以及企业的基础数据,形成数据源,其中,所述基础数据至少包括预定义基础数据、配置基础数据。
[0067]所述节能提示单元,用于对数据源中的数据进行处理,建立节能提示模型,并通过节能提示模型查找企业中是否存在长期开机且非服务器的主机,具体通过设备类型字段判断是否是服务器,并将下班特征时段有URL访问行为判定为未关机,进一步通过有无生产类访问行为判断是否为无人操作的主机,并将复核上述三个条件的主机进行标记,连续数天被标记为未关机且无人操作的主机即是长期未关机主机,在识别出长期未关机且非服务器的主机时,发出预警。
[0068]具体的,所述节能提示模型从时间维度和设备开机类型维度两个角度建立,时间上,所述节能提示模型监测活跃设备,所述活跃设备指当日开机的有效主机,包括PC、移动终端、路由或交换、其他终端等,计算每天的下班时间无人操作且未关机主机数,按日期形成未关机比例和未关机数的变化趋势,并以时间曲线图表示(act i ve_di s)。
[0069]设备开机类型上,节能提示模型监测被标记为未关机无人操作主机的未关机持续数天,将未关机主机分别统计为I天未关机、3天未关机、一周未关机、15天未关机、一个月未关机,并用帕累托图表示(active_user)。
[0070]并且,所述节能提示模型提取如下数据结构:
[0071]网关id:gw_id;
[0072]设备ID:equip_id;
[0073]设备类型:equip_type;
[0074]用户ID:user_id;
[0075]用户名:user_name;
[0076]IP地址:ip;
[0077]MAC 地址:mac;
[0078]时间戮:time_int;
[0079]URL:URL;
[0080 ]点击数目:h i t_num ;
[0081 ]时间:time_date;
[0082]时间特征:time_distinct0
[0083]所述员工互联网偏好分析单元,用于对员工在上班时段、加班时段以及其他时段关心的内容进行分析,以供管理者了解相关情况,其具体通过对数据源中的数据进行处理,建立员工互联网偏好模型,并通过员工互联网偏好模型进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析。
[0084]其中,员工访问网络的时间段偏好分析主要是将每天分为48个时段(每段半小时),根据最近一个月(不满一个月,取全量)或最近一周(不满一周,取全量)的数据,按照每个时间段的URL量确定哪个时段访问量最高,即汇总计算哪个时段的URL点击数最多,即时段偏好,其分析结果是网站访问热度对应的时段的帕累托图。
[0085]员工最喜爱访问的应用组排名(员工访问网络的应用偏好分析)主要是按照最近一个月(不满一个月,取全量)或最近一周(不满一周,取全量)的数据,获取每个应用组的访问量数据,将应用组分类排名,默认取Τορ10(可根据需要自由选择),其可以使用app应用产生的流量大小来度量(app使用热度指标),其分析结果是应用流量数据对应的应用名称的帕累托图。
[0086]所述员工访问网络的URL类型偏好分析主要是将访问记录关联URL分类信息(将URL划分为分为门户、工具、科技、频网、媒体营销、教育学习等29个细分门类),通过过滤(去掉机器自发的URL行为)、汇总(在同一个网关内按URL名称汇总,取点击数之和作为汇总统计量)、排序,给出员工最喜爱访问网站的URL类型排名,其可以按照URL类型分别汇总统计URL点击数得到,其分析结果是URL类型点击数对应每个URL类型的帕累托图。
[0087]并且,所述员工互联网偏好模型提取如下数据结构:
[0088]URL 数据表:
[0089]网关ID: gw—id
[0090]用户ID: user—id[0091 ]用户名:user—name[0092 ]时间戮:t ime—in t
[0093]时间:time—format
[0094]URL: URL
[0095]URL类型:URL—type
[0096]点击次数:hi t—num
[0097]时间维度:time—dim
[0098]人员维度:person—dim[00"]流量数据表:
[0100]网关 ID:gw—id[0101 ]用户 ID: user—id
[0102]用户名:user—name
[0103]时间戮:time—int
[0104]时间:time—format
[0105]APP ID: app—id
[0106]APP:app—name
[0107]APP类型:app—type
[0108]上行流量:traff ic—up
[0109]下行流量:traff i c—down
[0110]点击次数:hi t—num[0111 ]时间维度:time—dim
[0112]人员维度:person—dim。
[0113]进一步,所述员工情绪分析单元考察员工主动访问互联网查找招聘类信息的分布状况,招聘类网站访问的时间分布,人员分布,访问密度分布等信息,通过招聘类网站的访问来判断员工是否是寻求其他工作机会,基于假设:如果某个非HR员工经常访问招聘类网站,则说明该员工有跳槽打算,若企业内很多员工同时在找工作,则说员工情绪普遍低落,而员工访问招聘类网站的频度越高说明人数越多,情绪越差,通过招聘类网站的访问时段、访问频度分析,有助于管理者采取相应的措施,为管理者策略制定提供信息支撑。
[0114]详细的,所述员工情绪分析单元通过对数据源中的数据进行处理,建立员工情绪模型,并通过员工情绪模型进行员工访问招聘类网站的时间段分析、员工访问招聘类网站的频度分析,其中员工访问招聘类网站的访问时段分析即将每天分为48个时段(每段半小时),分析最近一段时间(I周或I个月)内,招聘类网站在哪个时段的点击数最多,点击数最多的时段即员工访问招聘类网站的偏好时段;员工访问招聘类网站的频度分析主要是计算哪个时段访问招聘类网站的人数最多以及统计每个员工在一段时间内访问招聘类网站的次数。
[0115]所述员工情绪模型模型提取如下数据结构:
[0116]网关ID:gw_id;
[0117]用户ID:user_id;
[0118]用户名:user_name;
[0119]时间戮:time_int;
[0120]时间:time_format;
[0121]URL:URL;
[0122]URL 类型:URL_type
[0123]点击次数:hit_num
[0124]时间维度:time_dim;
[0125]人员维度:person_dim。
[0126]更进一步,所述员工工作负荷度分析单元考察员工工作时间的分布,员工访问工作类网站的时间分布等信息,起通过对数据源中的数据进行处理,建立员工工作负荷模型,并通过员工工作负荷模型进行员工工作时间的分析和员工访问工作相关网站时间段分析,主要是使用是否有生产类URL的访问来判断是否为上班状态,对状态进行连续化处理后即可得到员工总做时间的分布;进一步按照上班时段对生产类网站汇总统计即可得到生产类网站的时段偏好,其最终的分析结果即上下班时间分布,上班时长分布,上班时段生产类网站的访问时段偏好。
[0127]所述结果展示单元,用于将节能提示单元、员工互联网偏好分析单元、员工情绪分析单元以及员工工作负荷度分析单元的分析结果进行展示,起展示的方式主要是通过基于云端的服务器,以网页形式展示。
[0128]再进一步,所述节能提示单元、员工互联网偏好分析单元、员工情绪分析单元以及员工工作负荷度分析单元对数据源中的数据进行处理的过程至少包括数据清洗、数据关联、数据聚合、信息提取、信息验证及信息评估预测。
[0129]并且,中间数据表是介于原始数据和结果数据之间,是数据分析处理过程中的重要环节,其是来自于数据源中提取的数据子集,并结合了基础的ID编码等信息,用于为某个数据模型建立做准备的数据表,所述中间数据表结构如下:网关ID号,时间槽,用户名,终端类型号,网址分组号,hit次数。
[0130]同时,本发明揭示的基于互联网访问情况分析企业运行管理状况的方法,包括如下步骤:
[0131]SI,获取企业互联网出口处设备采集的网络访问DPI信息、DFI信息以及企业的基础数据,形成数据源;
[0132]S2,对数据源中的数据进行处理,建立节能提示模型,并通过节能提示模型查找企业中是否存在长期开机且非服务器的主机,并在识别出长期开机且非服务器的主机时,发出预警。
[0133]其建模及分析的具体过程如下:
[0134]S21,按照gw_id,equip_id,user_id,user_name , time_date ,URL, time_distinet对数据源中的数据表进行汇总操作,获取数据子集;
[ΟΙ35] S22,按照8¥_丨(1,1:;[1]16_(^七6,6911丨口_丨(1对521步骤得到的数据子集进行汇总得到数据表;
[0136]S23,按照gw_id,time_date对S22步骤得到的数据表做汇总,取size()作为汇总统计量,该汇总统计量即为当日有效主机数;
[0137]S24,对S22步骤得到的数据表,按照gw_id,equip_id进行分组,观测每个time_date时间窗口内,有效主机是否一直有URL访问行为,将此类一直有URL访问行为的主机定义为未关机主机,并在数据表中增加status列,标示为未关机状态,得到新的数据表;
[0138]S25,对S24步骤中新的数据表使用公式:非工作特征时间URL数彡1/3*工作特征时间URL数,并在数据表中增加无人操作标识维度(no_operat1n),标记no_operat1n = yes(无人操作标识),得到新的数据表;
[0139]S26,对S25步骤得到的数据表按照gw_id, time_date , status,no_operat1n进行汇总,取size ()作为汇总统计量,其中,status = no_power_off (未关机标识)并且no_operat1n = yes(无人操作标识)的值即为未关机数(当日未关机且无人操作的主机数),得到新的数据表;
[0140]S27,对S26步骤得到的数据表使用公式:
[0141]未关机比例=非工作时段无人操作主机总数/当日有效主机总数;
[0?42] S28,将日期(time_date)、未关机数、未关机比例连接,形成企业未关机趋势,超过预定阀值触发报警;所述预定阀值由用户指定,所述未关机比例默认为10%
[0143]S29,将无人操作主机ID与日期(time_date)连接,得到最近一个月内I天、3天、I周、半月个以及一个月连续未关机的主机数刻画,超过预定阀值触发报警。所述预定阀值由用户指定,默认持续未关机天数为3天。
[0144]S3,对数据源中的数据进行处理,建立员工互联网偏好模型,通过员工互联网偏好模型进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析。
[0145]其建模及分析的具体过程如下:
[0146]S31,在数据源中提取最近一周或一月的URL数据表;
[0147 ] S3 2,对S 31步骤中的URL数据表按照gw_i d,URL做汇总,取Sum (h i t_num)作为汇总统计量,将此点击量的汇总统计量作为最近一周或一月的URL网站访问热度指标;
[0148]S33,在数据源中提取最近一周或一月的流量数据表;
[0149]S34,在S33步骤中的流量数据表增加traffic字段,使用公式:
[0150]traf f ic = traf f i c_up+traf f i c_down,得到新的数据表;
[0151 ] S35,对S34步骤中得到的数据表按照gw_id,app_name做汇总计算,取sum(traffic)作为汇总统计量,将此流量的汇总统计量作为最近一周或一月的app使用热度指标。
[0152]S4,对数据源中的数据进行处理,建立员工情绪模型,通过员工情绪模型进行员工访问招聘类网站的时间段分析、员工访问招聘类网站的频度分析;
[0153]其建模及分析的具体过程如下:
[0154]S41,在数据源中提取最近一周或一月的URL数据表,其中URL_type = 33619968(招聘类);
[0?55] S42,对S41步骤中的数据表按照gw_i d,t ime_d im进行汇总,汇总统计量取sum(hit_num);
[0156]S43,对S42步骤中点击量总数按倒序排序,即为最近一周或一月的各时段访问招聘网站的热度排名结果;
[0157]S44,对 S41 步骤中的 URL 数据表按照 gw_id,time_dim,user_id,user_name 进行汇总,得到新的数据表;
[ΟΙ58] S45,对S44步骤中得到的数据表按照gw_id,time_dim汇总,取size()作为汇总统计量,该统计量即为不同员工在该时段访问招聘网站的次数。
[0159]S5,对数据源中的数据进行处理,建立员工工作负荷模型,通过员工工作负荷模型进行员工工作时间的分析和员工访问工作相关网站时间段分析;
[0160]其建模及分析的具体过程如下:
[0161]S51,在数据源中提取URL数据表;
[0162]S52,在S51步骤的URL数据表中进一步提取可识别URL(URL_type不等于NULL)形成数据表;
[0163]S53,对S52步骤形成的数据表按照gw_id,user_id,user_name,time_dim,URL_type进行汇总,取size()作为汇总统计量;
[0164]S54,将URL_type = “生产类”的网站有点击行为的用户定义为工作状态,在S52步骤形成的数据表中添加新字段work_StatuS信息,将生产类网站有点击行为定义为工作状态;
[ΟΙ65] S55,对S54步骤得到的数据表中的表状态work_status赋值,当同一个用户处于工作状态时,其状态只要不连续出现非工作状态,则偶现的非工作状态会被修正为工作状态;
[0166]S56,汇总计算S55得到的步骤数据表中time_dim的开始时段(上班开始时段)、结束时段(下班开始时段)、中间时段(工作时长);
[0167]S57,对S54步骤得到的数据表进行汇总计算,汇总统计量按time_date取sum(hit_num),即获得生产类URL的日点击总数,再按日期排序即可得到生产类网站的访问趋势。
[0168]S6,将S2-S5的分析结果通过网页进行展示。
[0169]本发明尚有多种实施方式,例如S2-S5步骤的具体顺序可以进行调整,凡采用等同变换或者等效变换而形成的所有技术方案,均落在本发明的保护范围之内。
【主权项】
1.基于互联网访问情况分析企业运行管理状况的方法,其特征在于:包括如下步骤: SI,获取企业互联网出口处设备采集的网络访问DPI信息、DFI信息以及企业的基础数据,形成数据源; S2,对数据源中的数据进行处理,建立节能提示模型,并通过节能提示模型查找企业中是否存在长期开机且非服务器的主机,并在识别出长期开机且非服务器的主机时,发出预馨.1=I , S3,对数据源中的数据进行处理,建立员工互联网偏好模型,通过员工互联网偏好模型进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析; S4,对数据源中的数据进行处理,建立员工情绪模型,通过员工情绪模型进行员工访问招聘类网站的时间段分析、员工访问招聘类网站的频度分析; S5,对数据源中的数据进行处理,建立员工工作负荷模型,通过员工工作负荷模型进行员工工作时间的分析和员工访问工作相关网站时间段分析; S6,将S2-S5的分析结果进行展示。2.根据权利要求1所述的基于互联网访问情况分析企业运行管理状况的方法,其特征在于:所述基础数据包括预定义基础数据、配置基础数据。3.根据权利要求1所述的基于互联网访问情况分析企业运行管理状况的方法,其特征在于:S2步骤-S5步骤中对数据源中的数据进行处理的过程包括数据清洗、数据关联、数据聚合、信息提取、信息验证及信息评估预测。4.根据权利要求1所述的基于互联网访问情况分析企业运行管理状况的方法,其特征在于:所述S2步骤包括如下过程: S21,按照gw_id,equip_id,user_id,user_name,time_date ,URL, time_distinct对数据源中的数据表进行汇总操作,获取数据子集; S22,按照巧_1(1,^1^_(1&仏,叫1^?_1(1对321步骤得到的数据子集进行汇总得到数据表; S23,按照gw_id, time_date对S22步骤得到的数据表做汇总,取size()作为汇总统计量,该汇总统计量即为当日有效主机数; S24,对S22步骤得到的数据表,按照gw_id,equip_id进行分组,观测每个t ime_date时间窗口内,有效主机是否一直有URL访问行为,将此类主机定义为未关机主机,并在数据表中增加status列,标示为未关机状态,得到新的数据表; S25,对S24步骤中新的数据表使用公式:非工作特征时间URL数彡I/3*工作特征时间URL数,并在数据表中增加无人操作标识维度(no_operat1n),标记no_operat1n = yes(无人操作标识),得到新的数据表; S26,对S25步骤得到的数据表按照gw_id,time_date, status,no_operat1n进行汇总,取size()作为汇总统计量,其中,status = no_power_off (未关机标识)并且no_operat1n= yes(无人操作标识)的值即为未关机数(当日未关机且无人操作的主机数),得到新的数据表; S27,对S26步骤得到的数据表使用公式: 未关机比例=非工作时段无人操作主机总数/当日有效主机总数; S28,将日期(time_date)、未关机数、未关机比例连接,形成企业未关机趋势,超过预定阀值触发报警; S29,将无人操作主机ID与日期(time_date)连接,得到最近一个月内I天、3天、I周、半月个以及一个月连续未关机的主机数刻画,超过预定阀值触发报警。5.根据权利要求4所述的基于互联网访问情况分析企业运行管理状况的方法,其特征在于:所述企业未关机趋势通过时间曲线图表示,所述S210步骤的分析结果通过帕累托图6.根据权利要求1所述的基于互联网访问情况分析企业运行管理状况的方法,其特征在于:所述S3步骤包括如下过程: S31,在数据源中提取最近一周或一月的URL数据表; 332,对331步骤中的1]此数据表按照8¥_丨(1,1]1^做汇总,取811111(11;[1:_1111111)作为汇总统计量,将此点击量的汇总统计量作为最近一周或一月的网站访问热度指标; S33,在数据源中提取最近一周或一月的流量数据表; S34,在S33步骤中的流量数据表中增加traffic字段,使用公式: traf f i c = traf f i c_up+traf f i c_down,得到新的数据表; S35,对S34步骤中得到的数据表按照gw_id,app_name做汇总计算,取sum( traf f ic)作为汇总统计量,将此流量的汇总统计量作为最近一周或一月的app使用热度指标。7.根据权利要求1所述的基于互联网访问情况分析企业运行管理状况的方法,其特征在于:所述S4步骤包括如下过程: S41,在数据源中提取最近一周或一月的URL数据表,其中URL_type = 33619968(招聘类); S42,对S41步骤中的数据表按照gw_id,time_dim进行汇总,汇总统计量取sum(hit_num); S43,对S42步骤中点击量总数按倒序排序,即为最近一周或一月的各时段访问招聘网站的热度排名结果; S44,对S41步骤中的URL数据表按照gw_id,time_dim,user_id,user_name进行汇总,得到新的数据表; S45,对S44步骤中得到的数据表按照gw_id,time_dim汇总,取size O作为汇总统计量,该统计量即为不同员工在该时段访问招聘网站的次数。8.根据权利要求1所述的基于互联网访问情况分析企业运行管理状况的方法,其特征在于:所述S5步骤包括如下过程: S51,在数据源中提取URL数据表; S52,在S51步骤的URL数据表中进一步提取可识别URL(URL_type不等于NULL)形成数据表; 353,对352步骤形成的数据表按照8¥_丨(1,11861'_丨(1,11861'_1^1116,1:;[1116_(1;[111,1]此_七7口6进行汇总,取size()作为汇总统计量; S54,将URL_type= “生产类”的网站有点击行为的用户定义为工作状态,在S52步骤的数据表中添加新字段work_StatuS信息,将生产类网站有点击行为定义为工作状态; S55,对S54步骤得到的数据表中的表状态work_status赋值,当同一个用户处于工作状态时,其状态只要不连续出现非工作状态,则将偶现的非工作状态修正为工作状态; S56,汇总计算S55步骤得到的数据表中time_dim的开始时段(上班开始时段)、结束时段(下班开始时段)、中间时段(工作时长); S57,对S54步骤得到的数据表进行汇总计算,汇总统计量按time_date取sum(hit_num),即获得生产类URL的日点击总数,再按日期排序即可得到生产类网站的访问趋势。9.根据权利要求1所述的基于互联网访问情况分析企业运行管理状况的方法,其特征在于:来自于数据源中提取的数据子集,并进行了数据类型转换,用于为建模做准备的中间数据表结构包括:网关ID号,时间槽,用户名,终端类型号,网址分组号,hit次数。10.基于互联网访问情况分析企业运行管理状况的系统,其特征在于:包括: 数据获取单元,用于获取企业互联网出口处设备采集的网络访问DPI信息、DFI信息以及企业的基础数据,形成数据源; 节能提示单元,用于对数据源中的数据进行处理,建立节能提示模型,并通过节能提示模型查找企业中是否存在长期开机且非服务器的主机,并在识别出长期开机且非服务器的主机时,发出预警; 员工互联网偏好分析单元,用于对数据源中的数据进行处理,建立员工互联网偏好模型,通过员工互联网偏好模型进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析; 员工情绪分析单元,用于对数据源中的数据进行处理,建立员工情绪模型,通过员工情绪模型进行员工访问招聘类网站的时间段分析、员工访问招聘类网站的频度分析; 员工工作负荷分析单元,用于对数据源中的数据进行处理,建立员工工作负荷模型,通过员工工作负荷模型进行员工工作时间的分析和员工访问工作相关网站时间段分析; 以及,展示单元,用于将节能提示单元、员工互联网偏好分析单元、员工情绪分析单元以及员工工作负荷分析单元的分析结果进行展示。
【文档编号】H04L12/24GK106059831SQ201610591034
【公开日】2016年10月26日
【申请日】2016年7月26日 公开号201610591034.1, CN 106059831 A, CN 106059831A, CN 201610591034, CN-A-106059831, CN106059831 A, CN106059831A, CN201610591034, CN201610591034.1
【发明人】陈立, 周明中
【申请人】苏州迈科网络安全技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1