一种服务质量分析方法、装置及网络系统与流程

文档序号:14252961阅读:177来源:国知局
本发明涉及通信
技术领域
:,尤其涉及一种服务质量分析方法、装置及网络系统。
背景技术
::随着我国基础通信的不断发展,宽带已经越来越普及,据统计2013年,我国的宽带用户已经达到了1.89亿;用户越多,随之而来的问题也就越来越多,用户的投诉量也随之上升;如何保证和监控宽带用户的使用状况,提高用户使用宽带业务时的服务质量,增加用户粘度是各大运营商待以解决的一个难题。目前,运营商对用户使用宽带业务时的服务质量分析通常采用拨测的方法来测试用户的上网速度;即通过脚本模拟用户的上网行为,比如说浏览网页或者下载,进行小地区的采样,从而对测试地区进行整体的分析。然而,在采用拨测的方法分析用户使用宽带业务时的服务质量时,测试结果的准确性可以得到保证;但是,由于测试地区实际的宽带业务数据量是十分庞大,使用拨测的方法对测试地区用户的服务质量进行分析时很难详尽的计算出测试地区内每个用户使用宽带业务时的服务质量;然而若按照拨测的方法对测试地区内的每个用户使用宽带业务时的服务质量进行分析,则需要投入更多的人力和物力,加大了运营商对用户使用宽带业务时的服务质量分析的成本;因此,拨测的方法更适合做采样使用。由上述可知,现有技术中在使用拨测的方法测试用户的服务质量时,难以详尽的计算出测试地区内每个用户使用宽带业务时的服务质量。技术实现要素:本发明的实施例提供一种服务质量分析方法、装置及网络系统,解决了现有技术中在使用拨测的方法测试用户的服务质量时,难以详尽的计算出测试地区内每个用户使用宽带业务时的服务质量的问题。为达到上述目的,本发明的实施例采用如下技术方案:第一方面、本发明的实施例提供一种服务质量分析方法,包括:获取用户的实时应用数据;获取实时应用数据中的流量服务器日志以及网络流netflow日志;根据流量服务器日志和netflow日志确定用户使用的应用的平均流量;其中,应用的类型包括:网页、游戏、视频;根据平均流量确定用户的服务质量分析结果。可选的,根据平均流量确定用户的服务质量分析结果包括:根据平均流量查找第一服务质量分析表,得到用户的应用得分;其中,第一服务质量分析表包括:平均流量与应用得分的映射关系表;根据应用得分和应用对应的权重,计算用户的服务质量得分;根据服务质量得分查找第二服务质量分析表,得到用户的服务质量分析结果;其中,第二服务质量分析表包含:服务质量得分与服务质量分析结果的映射关系表。可选的,根据应用得分和应用对应的权重,计算用户的服务质量得分包括:构建服务质量得分的计算公式:m=w*a+g*b+v*c;其中,m表示服务质量得分,w表示网页的应用得分,g表示游戏的应用得分,v表示视频的应用得分,a表示网页的权重,b表示游戏的权重,c表示视频的权重,m∈[0,100],g∈[0,100],v∈[0,100],a∈[0,1],b∈[0,1],c∈[0,1]且a+b+c=1;根据计算公式计算用户的服务质量得分。可选的,流量服务器日志包括:radius日志和dns日志;根据流量服务器日志和netflow日志确定用户使用的应用的平均流量;包括:根据应用、域名、生存时间ttl、探测间隔和用户粘度建立流量特征库;根据流量特征库和ip地址对radius日志和dns日志进行数据整理,生成待处理的中间文件;其中,中间文件的格式包括:用户的请求ip、应用的开始时间、应用的结束时间以及应用的类型;根据netflow日志用户的信息和中间文件,生成用户的应用详单;其中,应用详单包括:用户、用户的请求ip、应用的开始时间和结束时间、应用的类型以及访问流量;根据应用详单确定用户使用的应用的平均流量。可选的,根据流量特征库和ip地址对radius日志和dns日志进行数据整理,生成待处理的中间文件前,还包括:对radius日志和dns日志进行流量清洗,其中,流量清洗后的radius日志的格式包括:用户名、开始时间、结束时间、上行流量、下行流量以及ip地址;流量清洗后的dns日志的格式包括:请求ip信息、long型时间戳以及请求域名。第二方面、本发明的实施例提供一种服务质量分析装置,包括:数据获取单元,用于获取用户的实时应用数据;数据获取单元,还用于获取实时应用数据中的流量服务器日志以及网络流netflow日志;数据处理单元,用于根据数据获取单元获取的流量服务器日志和数据获取单元获取的netflow日志确定用户使用的应用的平均流量;其中,应用的类型包括:网页、游戏、视频;数据处理单元,还用于根据平均流量确定用户的服务质量分析结果。可选的,数据处理单元,具体用于根据平均流量查找第一服务质量分析表,得到用户的应用得分;其中,第一服务质量分析表包括:平均流量与应用得分的映射关系表;数据处理单元,还用于根据应用得分和应用对应的权重,计算用户的服务质量得分;数据处理单元,还用于根据服务质量得分查找第二服务质量分析表,得到用户的服务质量分析结果;其中,第二服务质量分析表包含:服务质量得分与服务质量分析结果的映射关系表。可选的,数据处理单元,具体用于构建服务质量得分的计算公式:m=w*a+g*b+v*c;其中,m表示服务质量得分,w表示网页的应用得分,g表示游戏的应用得分,v表示视频的应用得分,a表示网页的权重,b表示游戏的权重,c表示视频的权重,m∈[0,100],g∈[0,100],v∈[0,100],a∈[0,1],b∈[0,1],c∈[0,1]且a+b+c=1;数据处理单元,还用于根据计算公式计算用户的服务质量得分。可选的,流量服务器日志包括:radius日志和dns日志;数据处理单元,具体用于根据应用、域名、生存时间ttl、探测间隔和用户粘度建立流量特征库;数据处理单元,还用于根据流量特征库和ip地址对radius日志和dns日志进行数据整理,生成待处理的中间文件;其中,中间文件的格式包括:用户的请求ip、应用的开始时间、应用的结束时间以及应用的类型;数据处理单元,还用于根据netflow日志用户的信息和中间文件,生成用户的应用详单;其中,应用详单包括:用户、用户的请求ip、应用的开始时间和结束时间、应用的类型以及访问流量;数据处理单元,还用于根据应用详单确定用户使用的应用的平均流量。可选的,数据处理单元,还用于对radius日志和dns日志进行流量清洗,其中,流量清洗后的radius日志的格式包括:用户名、开始时间、结束时间、上行流量、下行流量以及ip地址;流量清洗后的dns日志的格式包括:请求ip信息、long型时间戳以及请求域名。第三方面、本发明的实施例提供一种网络系统,包括如第二方面提供的任一项服务质量分析装置。本发明实施例提供的服务质量分析方法、装置及网络系统,通过用户的实时应用数据中的流量服务器日志以及网络流netflow日志确定用户在使用的应用的平均流量;如:用户使用网页时的平均流量、和/或用户在进行游戏时的平均流量、和/或用户在使用视频时的平均流量,从而可以确定用户在进行不同的应用时对应的平均流量,然后根据平均流量确定该用户的服务质量分析结果;本发明实施例提供的服务质量分析方法可以计算出测试地区内的每个用户使用宽带业务时的服务质量,从而解决了现有技术中在使用拨测的方法测试用户的服务质量时,难以详尽的计算出测试地区内每个用户使用宽带业务时的服务质量的问题。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明的实施例提供的一种服务质量分析方法的流程示意图;图2为本发明的实施例提供的一种服务质量分析方法的另一种流程示意图;图3为本发明的实施例提供的一种服务质量分析方法的又一种流程示意图;图4为本发明的实施例提供的一种服务质量分析方法的再一种流程示意图;图5为本发明的实施例提供的一种服务质量分析方法在实际应用中的流程示意图;图6为本发明的实施例提供的一种服务质量分析方法在实际应用中流量清洗的流程示意图;图7为本发明的实施例提供的一种服务质量分析方法在实际应用中数据处理的流程示意图;图8为本发明的实施例提供的一种服务质量分析装置的结构示意图。附图标记:服务质量分析装置-10;数据获取单元-101;数据处理单元-102。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明的实施例提供的一种服务质量分析方法、装置及网络系统依托于海杜普(英文全称:hadoopdistributedfilesystem,简称:hadoop)数据分析平台,在实际的应用中可以基于hadoop分布式计算以及通过hadoop的映射map化简reduce来实现,具体的实现方式如下:实施例一、本发明的实施例提供一种服务质量分析方法,如图1所示包括:s101、获取用户的实时应用数据。s102、获取实时应用数据中的流量服务器日志以及网络流netflow日志。s103、据流量服务器日志和netflow日志确定用户使用的应用的平均流量;其中,应用的类型包括:网页、游戏、视频。需要说明的是,在实际的应用中,游戏是指无论是网游还是页游,只要是通过超文本传输协议(英文全称:hypertexttransferprotocol,简称:http),并且有域名访问,且纳入到我们的域名特征库,都会归为游戏;视频是指无论是视频软件还是网页观看视频,只要是通过http,并且有域名访问,且纳入到我们的域名特征库,都会归为视频。s104、根据平均流量确定用户的服务质量分析结果。可选的,如图2所示,根据平均流量确定用户的服务质量分析结果包括:根据平均流量查找第一服务质量分析表,得到用户的应用得分;其中,第一服务质量分析表包括:平均流量与应用得分的映射关系表;根据应用得分和应用对应的权重,计算用户的服务质量得分;根据服务质量得分查找第二服务质量分析表,得到用户的服务质量分析结果;其中,第二服务质量分析表包含:服务质量得分与服务质量分析结果的映射关系表。可选的,根据应用得分和应用对应的权重,计算用户的服务质量得分包括:构建服务质量得分的计算公式:m=w*a+g*b+v*c;其中,m表示服务质量得分,w表示网页的应用得分,g表示游戏的应用得分,v表示视频的应用得分,a表示网页的权重,b表示游戏的权重,c表示视频的权重,m∈[0,100],g∈[0,100],v∈[0,100],a∈[0,1],b∈[0,1],c∈[0,1]且a+b+c=1;根据计算公式计算用户的服务质量得分。需要说明的是,在实际的应用中,第一服务质量分析表包括:网页的平均流量与应用得分的映射关系表(如表1所示),游戏的平均流量与应用得分的映射关系表(如表2所示),视频的平均流量与应用得分的映射关系表(如表3所示)。对各个分类根据平均流量经验值建立模型,这个是区分带宽的;示例性的,如表4所示给出了100m带宽下服务质量得分与服务质量分析结果的映射关系表;比如一个用户全天网页的流量为80kbytes/s,游戏是20kbytes/s,视频是20kbytes;根据服务质量得分的计算公式可知最终的服务质量得分为70*0.5+25*0.25+0*0.25=41.25,根据该用户的服务质量得分,对比表4可知该用户的服务质量较差。表1表2表3表4可选的,如图3所示流量服务器日志包括:远程用户拨号认证服务(英文全称:remoteauthenticationdialinuserservice,简称:radius)日志和域名系统(英文全称:domainnamesystem,简称:dns)日志;根据流量服务器日志和netflow日志确定用户使用的应用的平均流量;包括:根据应用、域名、生存时间(英文全称:timetolive,简称:ttl)、探测间隔和用户粘度建立流量特征库;根据流量特征库和网络之间互连的协议(英文全称:internetprotocol,简称:ip)地址对radius日志和dns日志进行数据整理,生成待处理的中间文件;其中,中间文件的格式包括:用户的请求ip、应用的开始时间、应用的结束时间以及应用的类型;根据netflow日志用户的信息和中间文件,生成用户的应用详单;其中,应用详单包括:用户、用户的请求ip、应用的开始时间和结束时间、应用的类型以及访问流量;根据应用详单确定用户使用的应用的平均流量。需要说明的是,在实际的应用中,分析算法包含两个处理过程,一是通过netflow日志得到某ip(用户的请求ip地址)的一天的某些端口的流量使用情况,比如http、80端口是网络应用的流量,tcp、5014为pplive应用的流量。这一过程通过hadoop的mapreduce来实现。将用户的信息以及流量信息保存在hdfs中。信息格式如下所示:首位为ip的信息,数据为每10分钟一个点,单位为bytes/s。一个ip在一天内会产生145条信息;其中,表5给出了netflow日志的信息格式。表5对于网络应用流量,结合dns日志的特征,可以分析出用户在某些时段进行了什么应用。示例性的:dns日志中出现了某请求ip要求解析www.youku.com的日志,我们分别以1分、5分、10分、15分为间隔向下遍历是否有再次对youku.com域名的解析,并且解析ip没有发生变化。如果符合这些条件,就认为用户是在持续进行对该网站的访问。针对不同类型的应用比如视频、游戏、网页我们会将相关的域名信息以及探测间隔放到流量特征库中。流量特征库由分类、域名、相关ttl、探测间隔、用户粘度五部分组成。比如视频类中的优酷就有如下的定义:视频、youku.com、3600、1-5-10-15、5。分类属于视频,域名为youku.com,dns的ttl是3600秒,探测间隔分别为1分、5分、10分、15分。用户粘度是指登入以后在网时间,对于视频类的默认为5分钟。使用mapreduece进行计算后,最终格式如表6所示的中间结果。ip为用户的请求ip,date1为应用的开始时间、date2为应用的结束时间,style为应用的类型。利用dns中ip与netflow中ip相同,最终两种文件以ip相等为条件进行连接,产生包含流量、应用的待处理的中间文件。ipdata1data2styleipdata1data2style表6另外一个处理过程是指将radius用户的信息和以上的信息结合起来,使得用户、ip、上下线时间、访问应用、访问流量串联起来。从而达到分析用户在一天上网使用情况,以及使用的网速情况,具体的分析情况如图7所示。可选的,如图4所示根据流量特征库和ip地址对radius日志和dns日志进行数据整理,生成待处理的中间文件前,还包括:对radius日志和dns日志进行流量清洗,其中,流量清洗后的radius日志的格式包括:用户名、开始时间、结束时间、上行流量、下行流量以及ip地址;流量清洗后的dns日志的格式包括:请求ip信息、long型时间戳以及请求域名;其中,long型时间戳中的long是java语言中的一个数据类型,long型时间戳指的是当前时间与格林威治时间的相差秒数。需要说明的是,在实际的应用中:通过流量特征模型确定一个应用时,可以通过两种实现方式:方式一、根据dns日志,访问某些应用的时候,体现出来的dns日志的特征来确认某个应用。方式二、通过netflow日志,利用固定的协议和端口号来确认某个应用;示例性的:聚力视频(英文全称:ppliveinc,简称:pplive)流传输的协议为传输控制协议(英文全称:transmissioncontrolprotocol,简称:tcp),端口号就为5014。流量清洗是指将日志中对于统计没有影响的字段去掉,保留或修改影响统计结果的字段,具体算法如图6所示:将日志提交到映射接口mapperinterface的map方法,基于hadoop分布式计算,map方法在多台机器上并行计算,map方法的主要功能是根据输入的日志信息,将有效的字段输出。map(writablekey,writablevalue,contextcontext)日志输出的格式为key+\t+value,相应的类型为keyvaluetextinputformat。dns日志的格式:日期、时间、访问信息、请求ip信息、请求域名信息、请求域名特征、dns服务器特征。清洗过后的日志格式:“请求ip信息+\t+long型时间戳_请求域名”;radius日志的格式有82个字段,清洗过后的日志格式:“用户名+\t+开始时间+\t+结束时间+\t+上行流量+\t+下行流量+\t+ip”;其中,key是指唯一的索引值;value是指索引值指向的实际值;\t是分隔符,一般代表8个空字符串。本发明实施例提供的服务质量分析方法,通过用户的实时应用数据中的流量服务器日志以及网络流netflow日志确定用户在使用的应用的平均流量;如:用户使用网页时的平均流量、和/或用户在进行游戏时的平均流量、和/或用户在使用视频时的平均流量,从而可以确定用户在进行不同的应用时对应的平均流量,然后根据平均流量确定该用户的服务质量分析结果;本发明实施例提供的服务质量分析方法可以计算出测试地区内的每个用户使用宽带业务时的服务质量,从而解决了现有技术中在使用拨测的方法测试用户的服务质量时,难以详尽的计算出测试地区内每个用户使用宽带业务时的服务质量的问题。实施例二、本发明的实施例提供一种服务质量分析装置10,如图8所示包括:数据获取单元101,用于获取用户的实时应用数据。数据获取单元101,还用于获取实时应用数据中的流量服务器日志以及网络流netflow日志。数据处理单元102,用于根据数据获取单元101获取的流量服务器日志和数据获取单元101获取的netflow日志确定用户使用的应用的平均流量;其中,应用的类型包括:网页、游戏、视频。数据处理单元102,还用于根据平均流量确定用户的服务质量分析结果。可选的,数据处理单元102,具体用于根据平均流量查找第一服务质量分析表,得到用户的应用得分;其中,第一服务质量分析表包括:平均流量与应用得分的映射关系表;数据处理单元102,还用于根据应用得分和应用对应的权重,计算用户的服务质量得分;数据处理单元102,还用于根据服务质量得分查找第二服务质量分析表,得到用户的服务质量分析结果;其中,第二服务质量分析表包含:服务质量得分与服务质量分析结果的映射关系表。可选的,数据处理单元102,具体用于构建服务质量得分的计算公式:m=w*a+g*b+v*c;其中,m表示服务质量得分,w表示网页的应用得分,g表示游戏的应用得分,v表示视频的应用得分,a表示网页的权重,b表示游戏的权重,c表示视频的权重,m∈[0,100],g∈[0,100],v∈[0,100],a∈[0,1],b∈[0,1],c∈[0,1]且a+b+c=1;数据处理单元102,还用于根据计算公式计算用户的服务质量得分。可选的,流量服务器日志包括:radius日志和dns日志;数据处理单元102,具体用于根据应用、域名、生存时间ttl、探测间隔和用户粘度建立流量特征库;数据处理单元102,还用于根据流量特征库和ip地址对radius日志和dns日志进行数据整理,生成待处理的中间文件;其中,中间文件的格式包括:用户的请求ip、应用的开始时间、应用的结束时间以及应用的类型;数据处理单元102,还用于根据netflow日志用户的信息和中间文件,生成用户的应用详单;其中,应用详单包括:用户、用户的请求ip、应用的开始时间和结束时间、应用的类型以及访问流量;数据处理单元102,还用于根据应用详单确定用户使用的应用的平均流量。可选的,数据处理单元102,还用于对radius日志和dns日志进行流量清洗,其中,流量清洗后的radius日志的格式包括:用户名、开始时间、结束时间、上行流量、下行流量以及ip地址;流量清洗后的dns日志的格式包括:请求ip信息、long型时间戳以及请求域名。本发明实施例提供的服务质量分析装置,通过用户的实时应用数据中的流量服务器日志以及网络流netflow日志确定用户在使用的应用的平均流量;如:用户使用网页时的平均流量、和/或用户在进行游戏时的平均流量、和/或用户在使用视频时的平均流量,从而可以确定用户在进行不同的应用时对应的平均流量,然后根据平均流量确定该用户的服务质量分析结果;本发明实施例提供的服务质量分析方法可以计算出测试地区内的每个用户使用宽带业务时的服务质量,从而解决了现有技术中在使用拨测的方法测试用户的服务质量时,难以详尽的计算出测试地区内每个用户使用宽带业务时的服务质量的问题。第三方面、本发明的实施例提供一种网络系统,包括如第二方面提供的任一项服务质量分析装置。本发明实施例提供的网络系统,通过用户的实时应用数据中的流量服务器日志以及网络流netflow日志确定用户在使用的应用的平均流量;如:用户使用网页时的平均流量、和/或用户在进行游戏时的平均流量、和/或用户在使用视频时的平均流量,从而可以确定用户在进行不同的应用时对应的平均流量,然后根据平均流量确定该用户的服务质量分析结果;本发明实施例提供的服务质量分析方法可以计算出测试地区内的每个用户使用宽带业务时的服务质量,从而解决了现有技术中在使用拨测的方法测试用户的服务质量时,难以详尽的计算出测试地区内每个用户使用宽带业务时的服务质量的问题。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
:的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1