运营服务系统及其维护方法和装置的制作方法

文档序号:7791441阅读:187来源:国知局
专利名称:运营服务系统及其维护方法和装置的制作方法
技术领域
本发明涉及通信领域,具体而言,涉及一种运营服务系统及其维护方法和装置。
背景技术
在电信语音增值业务中,后台服务器系统是系统正常运营的关键设备,主要包括语音通信平台、数据库服务器、WEB服务器和计费服务器等,下面以电话会议系统为例,进行简要说明。如图1所示,语音通信平台是平台交换系统,也是整个后台服务器系统的核心。负责多方电话会议用户接入的交换、自动语音资源提供、多方会议资源提供、录音等。硬件上由CPCI/PCI交换平台组成,由于采用了先进的工艺技术,具有极高的集成度和程控交换机的稳定性和处理能力。数据库服务器保存系统所有DE数据、会议记录、用户话单、操作日志和运行维护资料。计费服务器为后台服务器系统配备的独立计费系统,可以根据目前国家实行的计费政策灵活设置,最大限度地满足了各种计费方式的需要。对于预付费方式的用户,计费系统可以进行实时的费用扣减,当用户账户内的费用余额低于警戒值时,计费台会发送告警消息。此时,会场主持人会听到费用告警语音提示。当用户账户内的费用余额低于警戒值时,计费台会发送中断指令,此时系统会自动切断此账户的用户连接。系统可以独立出账, 也可以将计费话单发送给BOSS系统,将计费功能交由专业系统进行处理,以满足运营的需要。TOB服务器建立了 WWW服务,用户通过浏览器,可以在网上实现用户会议信息查询,会议预约,查询会议召开情况,编辑会议成员,实时会议控制,下载操作终端,查询会议费用等功能。现有的基于电话会议系统的维护方法,主要通过网络定时轮循远程服务器,利用类似HTTP的请求回答的方式,获得系统告警信息。系统告警信息主要包括语音板卡的异常、服务器应用软件异常、服务器宕机等。语音板卡的异常是指语音板卡硬件出现问题,中继线路的信令中断,中继线路的资源被占用满,语音板卡驱动出现问题等。服务器应用软件异常是指语音通信平台控制软件、数据库软件、计费软件、WEB软件出现异常。其中,语音通信平台控制软件的异常主要是软件异常崩溃、消息通道堵塞、控制语音板卡出现异常等。数据库软件的异常主要是重要表锁死、日志空间满等。计费软件的异常主要是软件异常崩溃。WEB软件的异常主要是应用软件异常崩溃。服务器宕机是指语音通信平台、数据库服务器、WEB服务器和计费服务器,出现因主机、操作系统、内存容量、硬盘容量问题导致的服务器重启或崩溃的问题。目前,一般通过以下方式进行后台服务器系统的维护维护系统在PC终端安装维护软件,并连接到INTERNET后运行,该软件通过TCP/IP协议,与后台服务器系统中的某一
5服务器(一般为语音通信平台)建立TCP长连接。维护系统定时(通常是IOs左右)向语音通信平台发送握手消息,语音通信平台接收到握手消息后向语音板卡、应用软件、其它服务器发送轮循信息,请求语音板卡、应用软件、其它服务器的告警信息。若没有告警,语音通信平台就回应维护系统握手信息;若有告警,语音通信平台就向维护转发告警信息,由维护人员处理。若语音通信平台出现问题,则无法回应维护握手信息,一般在多个握手信息无应答的情况下,就默认语音通信平台出现问题。这种维护方式,发送给远程维护系统的信息单一,只有告警信息一种,所以在维护系统接收到告警信息时,后台服务器系统已经出现问题,不能预先判断出可能出现的问题, 并提前将隐患排除;此外,维护系统通过与后台服务器系统中的某一台服务器连接获得信息,若该服务器的网络过慢或出现其它异常时,所有的告警消息无法传送,容易造成误告警,并且,需要维护人员持续监控维护系统,当维护人员不在线时,无法及时处理告警信息。针对相关技术中运营服务系统反馈给远程维护系统的信息单一,仅在运营服务系统瘫痪时才将告警信息反馈,不利于维护人员及时处理的问题,目前尚未提出有效的解决方案。

发明内容
本发明的主要目的在于提供一种运营服务系统及其维护方法和装置,以解决运营服务系统反馈给远程维护系统的信息单一,仅在运营服务系统瘫痪时才将告警信息反馈, 不利于维护人员及时处理的问题。为了实现上述目的,根据本发明的一个方面,提供了一种运营服务系统的维护方法。根据本发明的运营服务系统的维护方法包括读取运营服务系统中服务器的日志;根据服务器的日志,判断服务器的运行参数是否满足第一条件或第二条件,其中,第一条件和第二条件为不同的预设条件;在服务器的运行参数满足第一条件时,产生预警信息; 在服务器的运行参数满足第二条件时,产生告警信息;以及发送预警信息或告警信息至远程维护终端。进一步地,判断服务器的运行参数是否满足第一条件或第二条件包括判断服务器的运行参数是否满足第一条件;以及在确定服务器的运行参数不满足第一条件时,判断服务器的运行参数是否满足第二条件。进一步地,在产生预警信息或告警信息后,该方法还包括判断远程维护终端的维护人员是否在线;在维护人员在线时,发送预警信息或告警信息至远程维护终端;以及在维护人员离线时,查找维护人员的通信方式并通过通信方式发送预警信息或告警信息至维护人员。进一步地,通信方式包括以下任意一种方式语音、短信以及邮件。进一步地,在服务器的运行参数满足第一条件时,产生预警信息包括在服务器的内存占用超标或服务器的硬盘占用超标时,产生预警信息。进一步地,服务器的内存占用超标包括服务器的物理内存占满;以及服务器的硬盘占用超标包括服务器中应用软件所在硬盘资源占满。进一步地,当服务器为语音通信平台时,在服务器的运行参数满足第一条件时,产生预警信息包括在语音通信平台的语音板卡的中继占用率超过第一预设值时,产生第一语音通信平台预警信息,其中,中继占用率为语音板卡中正在使用线路占总线路的百分比; 在语音通信平台的语音板卡的信令链路所在的中继失步时,产生第二语音通信平台预警信息;在语音通信平台的消息处理线程速度低于第一预设速度时,产生第三语音通信平台预警信息;在语音通信平台的业务流程出现错误时,产生第四语音通信平台预警信息;在语音通信平台的数据库访问异常时,产生第五语音通信平台预警信息;以及在语音通信平台的控制板卡驱动异常时,产生第六语音通信平台预警信息。进一步地,第一预设值为80%。进一步地,语音通信平台的业务流程出现错误包括语音通信平台中控制软件的写记录失败;或语音通信平台中系统内部数据无法正常释放。进一步地,语音通信平台的数据库访问异常包括语音通信平台中控制软件的数据库访问连接中存在中断;或语音通信平台中控制软件的数据库访问查询数据超过预设时间。进一步地,语音通信平台的控制板卡驱动异常包括语音通信平台的控制板卡驱动程序存在出错提示,其中,出错提示包括选择通道外呼失败、通道加入会场失败。进一步地,当服务器为数据库服务器时,在服务器的运行参数满足第一条件时,产生预警信息包括在数据库服务器的数据库日志文件占用超过第三预设值时,产生数据库服务器预警信息。进一步地,第三预设值为80%至90%中的任意值。进一步地,当服务器为计费服务器时,在服务器的运行参数满足第一条件时,产生预警信息包括在计费服务器的消息处理线程速度低于第二预设速度时,产生第一计费服务器预警信息;以及在计费服务器的数据库访问异常时,产生第二计费服务器预警信息。进一步地,当服务器为TOB服务器时,在服务器的运行参数满足第一条件时,产生预警信息包括在WEB服务器的线程分配超标时,产生WEB服务器预警信息。为了实现上述目的,根据本发明的一个方面,提供了一种运营服务系统的维护装置。该装置用于执行本发明提供的任意一种运营服务系统的维护方法。为了实现上述目的,根据本发明的一个方面,提供了一种运营服务系统的维护装置。根据本发明的运营服务系统的维护装置包括读取模块,用于读取运营服务系统中服务器的日志;第一判断模块,用于根据服务器的日志,判断服务器的运行参数是否满足第一条件或第二条件,其中,第一条件和第二条件为不同的预设条件;第一产生模块,用于在服务器的运行参数满足第一条件时,产生预警信息;第二产生模块,用于在服务器的运行参数满足第二条件时,产生告警信息;第一发送模块,用于发送预警信息至远程维护终端;以及第二发送模块,用于发送告警信息至远程维护终端。进一步地,第一判断模块包括第一判断子模块,用于判断服务器的运行参数是否满足第一条件;以及第二判断子模块,用于在确定服务器的运行参数不满足第一条件时,判断服务器的运行参数是否满足第二条件。进一步地,根据本发明的运营服务系统的维护装置还包括第二判断模块,用于判断远程维护终端的维护人员是否在线;第三发送模块,用于在维护人员在线时,发送预警信息或告警信息至远程维护终端;以及第四发送模块,用于在维护人员离线时,查找是维护人
7员的通信方式并通过通信方式发送预警信息或告警信息至维护人员。为了实现上述目的,根据本发明的一个方面,提供了一种运营服务系统。根据本发明的运营服务系统包括语音通信平台、数据库服务器、WEB服务器以及计费服务器,其中,语音通信平台、数据库服务器、WEB服务器以及计费服务器分别包括本发明提供的任意一种运营服务系统的维护装置。进一步地,该运营服务系统还包括维护服务器,用于接收运营服务系统的维护装置产生的预警信息或告警信息,并将预警信息或告警信息发送至远程的维护系统,其中,运营服务系统的维护装置用于将预警信息或告警信息发送至维护服务器。通过本发明,采用包括以下步骤的运营服务系统的维护方法读取运营服务系统中服务器的日志;根据服务器的日志,判断服务器的运行参数是否满足第一条件或第二条件,其中,第一条件和第二条件为不同的预设条件;在服务器的运行参数满足第一条件时, 产生预警信息;在服务器的运行参数满足第二条件时,产生告警信息;以及发送预警信息或告警信息至远程维护终端,解决了运营服务系统反馈给远程维护系统的信息单一,仅在运营服务系统瘫痪时才将告警信息反馈,不利于维护人员及时处理的问题,进而达到了根据运营服务系统当前运行状态,在系统运行异常且没有瘫痪时便发送预警信息至远程维护终端,利于维护人员及时处理的效果。


构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中图1是根据相关技术的运营服务系统的示意图;图2是根据本发明实施例的运营服务系统的示意图;图3是根据本发明实施例的运营服务系统的维护装置的框图;以及图4是根据本发明实施例的运营服务系统的维护方法的流程图。
具体实施例方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。首先介绍本发明具体实施方式
的运营服务系统。图2是根据本发明实施例的运营服务系统的框图,如图2所示,该运营服务系统包括语音通信平台、数据库服务器、WEB服务器以及计费服务器,其中,语音通信平台、数据库服务器、WEB服务器以及计费服务器分别包括一种运营服务系统的维护装置,各服务器的维护装置根据服务器的日志判断服务器是否出现告警或预警,在服务器出现告警或预警时,能够及时将告警或预警信息传送至远程维护终端。采用该实施例提供的运营服务系统,与现有技术中采用单个服务器作为后台服务器与远程维护终端相比,避免了后台服务器出现问题时产生的误告警。各服务器的维护装置与各运营服务器的内部分析装置和应用装置连接,并通过远程网络与维护终端连接,所有的监测都由触发点主动发起,各服务器之间没有定时轮循,信息从各运营服务器直接到远程维护终端或维护人员。
优选地,该运营服务系统还包括维护服务器,用于接收运营服务系统的维护装置产生的预警信息或告警信息,并将预警信息或告警信息发送至远程的维护系统,其中,运营服务系统的维护装置用于将预警信息或告警信息发送至维护服务器。在该实施例中,维护装置安装在运营的服务器上,主要包括两部分功能,第一,分析服务器预警,通过系统函数定时监测内存占用、硬盘占用、其它系统异常等情况,并收集分析该数据,将超标或异常信息发送到维护服务器的监测装置;第二,分析应用装置预警, 主要通过应用日志和通过与应用装置通信进行分析,因为应用装置的业务不同,内部分析装置也有不同,每个应用的侧重点不同,如语音通信平台控制装置主要判断速度和信令情况,数据库装置主要判断DB LOG,内部分析装置将超标或异常信息发送到维护服务器的监测装置。监测装置安装在专用的维护服务器上,主要包括三部分功能,第一,通过与内部分析装置通信,收集预警信息;第二,通过与应用装置通信,收集告警信息;第三,根据当时远程维护终端的维护人员是否在线决定通知方式,若维护人员在线,通过网络发送到远程终端,若维护人员不在线,通过电话(由语音通信平台控制装置发起呼叫)、短信(发送到第三方的短信网关)、邮件(本机的邮件系统)等方式通知维护人员。具体地,该实施例提供的运营服务系统的具体工作流程举例如下(1)服务器内部维护装置定时读应用日志和系统日志,并通过请求应答方式判断服务器中的应用装置的主流程。(2)若数据库服务器的内部维护装置发现数据库DB LOG的空间达到空闲容量的 80%,内部维护装置产生一个关于数据库日志的预警信息,并将信息发送到维护服务器的监测装置。(3)监测装置收到该信息,检查发送通道,若远程维护终端的维护人员在线,则通过网络发送至远程维护终端,终端界面就会显示。若维护人员不在线,查看维护人员的通信方式,可通过语音通信平台控制软件呼叫用户手机并放语音,可通过第三方的短信网关发短信到用户手机,可通过邮件系统发送到用户邮箱。优选地,将该实施方式提供的运营系统应用于电话会议语音,作为该电话会议语音系统的重要维护方案。通过增加预警信息,将可能发生的问题提前通知,保证了系统的不间断运营,同时,通过主动通知和多种通知方式,维护人员不用坐班可实现7* 小时的维护,提高了工作效率。其次,介绍各运营服务器中维护装置的具体实施方式
。图3是根据本发明实施例的运营服务系统的维护装置的框图,如图3所示,该维护装置包括读取模块10,第一判断模块20,第一产生模块30,第一发送模块40,第二产生模块50和第二发送模块60。读取模块10用于读取运营服务系统中服务器的日志,包括应用日志和系统日志等。第一判断模块20用于根据服务器的日志,判断服务器的运行参数是否满足第一条件或第二条件,其中,第一条件和第二条件为不同的预设条件,针对服务器的特点设置两种判断条件,以判断服务器存在异常时的严重程度。第一产生模块30用于在服务器的运行参数满足第一条件时,产生预警信息,也即,当服务器出现异常,但仍可运行时,产生预警信息。在产生预警信息后,第一发送模块40用于发送预警信息至远程维护终端第二产生模块50用于在服务器的运行参数满足第二条件时,产生告警信息,也即,当服务器出现严重故障影响服务器的运行时,产生告警信息。在产生告警信息后,第二发送模块60用于发送告警信息至远程维护终端。预警信息是指有问题出现,但不影响系统运行,若不及时处理,预警信息未来就会转为告警信息,就会造成系统瘫痪。告警信息是指问题已经造成系统的瘫痪或错误,必须马上处理。采用该实施例提供的维护装置,能够将预警信息发送至远程维护终端,在系统出现异常但可运行时,提前进行处理。在服务器出现预警信息或告警信息,主动地将预警信息或告警信息发送至远程维护终端,利于维护人员及时处理。其中,在服务器的内存占用超标或服务器的硬盘占用超标时,例如服务器的物理内存占满时,或者服务器中应用软件所在硬盘资源占满时,第一产生模块30产生预警信肩、ο根据预警信息与告警信息的转化特点,告警信息一般由预警信息转化而来,并且, 在服务器的运行过程中,较容易出现预警信息。优选地,第一判断模块包括第一判断子模块,用于判断服务器的运行参数是否满足第一条件;以及第二判断子模块,用于在确定服务器的运行参数不满足第一条件时,判断服务器的运行参数是否满足第二条件。通过该优选实施方式仅在服务器的运行参数不满足第一条件时,即不产生预警信息时,判断其是否满足第二条件,节省执行程序的内存开销。为了节省人力资源,使维护人员离线时也能够获知预警或告警信息,优选地,该维护装置还包括第二判断模块,用于判断远程维护终端的维护人员是否在线;第三发送模块,用于在维护人员在线时,发送预警信息或告警信息至远程维护终端;以及第四发送模块,用于在维护人员离线时,查找是维护人员的通信方式并通过查找到的通信方式发送预警信息或告警信息至维护人员。其中,通信方式包括以下任意一种方式语音、短信以及邮件。采用该优选实施方式的维护装置,在运行系统不间断运行的条件下,无需维护人员持续坐班也可实现持续的维护,即使维护人员不在线也可及时获知运营系统中各服务器的异常状况,节省了人力资源,提高了工作效率。当该服务器为语音通信平台时,第一产生模块30包括第一产生子模块,用于在语音通信平台的语音板卡的中继占用率超过第一预设值时,产生第一语音通信平台预警信息,其中,中继占用率为语音板卡中正在使用线路占总线路的百分比,此时,第一预设值优选为80%。第二产生子模块,用于在语音通信平台的语音板卡的信令链路所在的中继失步时,产生第二语音通信平台预警信息。第三产生子模块,用于在语音通信平台的消息处理线程速度低于第一预设速度时,产生第三语音通信平台预警信息。第四产生子模块,用于在语音通信平台的业务流程出现错误时,产生第四语音通信平台预警信息,其中,语音通信平台的业务流程出现错误包括语音通信平台中控制软件的写记录失败;或语音通信平台中系统内部数据无法正常释放。第五产生子模块,用于在语音通信平台的数据库访问异常时,产生第五语音通信平台预警信息,其中,语音通信平台的数据库访问异常包括语音通信平台中控制软件的数据库访问连接中存在中断;或语音通信平台中控制软件的数据库访问查询数据超过预设时间。第六产生子模块,用于在语音通信平台的控制板卡驱动异常时,产生第六语音通信平台预警信息,其中,语音通信平台的控制板卡驱动异常包括语音通信平台的控制板卡驱动程序存在出错提示,其中,出错提示包括选择通道外呼失败、通道加入会场失败。在语音通信平台采用该实施例提供的维护装置后,能够将语音通信平台中的软硬件出现的预警信息发送至远程维护终端,以便在语音通信平台出现异常但可运行时,进行提前处理,利于维护人员及时处理。当服务器为数据库服务器时,第一产生模块30包括第七产生子模块,用于在数据库服务器的数据库日志文件占用超过第三预设值时,产生数据库服务器预警信息,其中,第三预设值为80%至90%中的任意值。在数据库服务器采用该实施例提供的维护装置后,能够在数据库日志文件占用超标时,将超标的预警信息发送至远程维护终端,以便对数据库服务器占用超标进行提前处理,利于维护人员及时处理。当服务器为计费服务器时,第一产生模块30包括第八产生子模块,用于在计费服务器的消息处理线程速度低于第二预设速度时, 产生第一计费服务器预警信息。第九产生子模块,用于在计费服务器的数据库访问异常时,产生第二计费服务器
预警信息。在计费服务器采用该实施例提供的维护装置后,能够在消息处理线程速度低或数据库访问异常时,将预警信息发送至远程维护终端,以便对计费服务器的预警进行提前处理,利于维护人员及时处理。当服务器为TOB服务器时,第一产生模块30包括第十产生子模块,用于在TOB服务器的线程分配超标时,产生WEB服务器预警信肩、ο在WEB服务器采用该实施例提供的维护装置后,能够在线程分配超标时,将预警信息发送至远程维护终端,以便对WEB服务器线程分配超标进行提前处理,利于维护人员及时处理。最后,介绍种运营服务系统的维护方法的具体实施方式
。图4是根据本发明实施例的运营服务系统的维护方法的流程图,如图4所示,该方法包括如下步骤S102至步骤Sl 12。步骤S102 读取运营服务系统中服务器的日志,该步骤可通过运营服务系统的维护装置中的读取模块实现。步骤S104:根据服务器的日志,判断服务器的运行参数是否满足第一条件或第二条件,其中,第一条件和第二条件为不同的预设条件,针对服务器的特点设置两种判断条件,以判断服务器存在异常时的严重程度,该步骤可通过运营服务系统的维护装置中的第一判断模块实现。其中,在服务器的运行参数满足第一条件时执行步骤S106,在服务器的运行参数满足第二条件时执行步骤S108,否则返回步骤S102,继续读取运营服务系统中服务器的日志。
步骤S106 在服务器的运行参数满足第一条件时,产生预警信息,也即,当服务器出现异常,但仍可运行时,产生预警信息。在产生预警信息后,执行步骤S110。该步骤可通过运营服务系统的维护装置中的第一产生模块实现。步骤S108 在服务器的运行参数满足第二条件时,产生告警信息,也即,当服务器出现严重故障影响服务器的运行时,产生告警信息。在产生预警信息后,执行步骤S112。该步骤可通过运营服务系统的维护装置中的第二产生模块实现。步骤SllO 发送预警信息远程维护终端。步骤S112 发送告警信息远程维护终端。预警信息是指有问题出现,但不影响系统运行,若不及时处理,预警信息未来就会转为告警信息,就会造成系统瘫痪。告警信息是指问题已经造成系统的瘫痪或错误,必须马上处理。采用该实施例提供的维护方法,能够将预警信息发送至远程维护终端,在系统出现异常但可运行时,提前进行处理。在服务器出现预警信息或告警信息,主动地将预警信息或告警信息发送至远程维护终端,利于维护人员及时处理。根据预警信息与告警信息的转化特点,告警信息一般由预警信息转化而来,并且, 在服务器的运行过程中,较容易出现预警信息。优选地,步骤S104包括判断服务器的运行参数是否满足第一条件;以及在确定服务器的运行参数不满足第一条件时,判断服务器的运行参数是否满足第二条件。通过该优选实施方式仅在服务器的运行参数不满足第一条件时,即不产生预警信息时,判断其是否满足第二条件,节省执行程序的内存开销。为了节省人力资源,使维护人员离线时也能够获知预警或告警信息,优选地,在产生预警信息或告警信息后,该方法还包括判断远程维护终端的维护人员是否在线;在维护人员在线时,发送预警信息或告警信息至远程维护终端;以及在维护人员离线时,查找维护人员的通信方式并通过通信方式发送预警信息或告警信息至维护人员。其中,通信方式包括以下任意一种方式语音、短信以及邮件。采用该优选实施方式的维护装置,在运行系统不间断运行的条件下,无需维护人员持续坐班也可实现持续的维护,即使维护人员离线也可及时获知运营系统中各服务器的异常状况,节省了人力资源,提高了工作效率。优选地,对运营系统中的各服务器,在服务器的内存占用超标或服务器的硬盘占用超标时均产生预警信息。其中,服务器的内存占用超标包括服务器的物理内存占满;服务器的硬盘占用超标包括服务器中应用软件所在硬盘资源占满。服务器的内存占用超标主要是指物理内存占用满,正在使用虚拟内存。一般这种情况下,系统也可正常运行,但由于虚拟内存是通过硬盘映射的,应用软件中控制堆栈等的处理,严重依赖当前操作系统的处理,WINDOWS操作系统的内存处理虚拟内存和物理内存是有区别的,有兼容性的问题,可能会导致应用软件的异常。从系统的稳定性考虑,应该进行处理。要对服务器的内存进行重新分配,可检查哪些异常进程占用内存较多,并释放。服务器的硬盘占用超标一般指是应用软件所在硬盘资源已经占满。若应用软件所在硬盘资源占满,则该应用软件就无法写日志信息,或无法写录音文件,但系统仍可正常运行。但无法录音会影响用户正常使用,无法写日志会影响系统的备份,应该进行处理。一般这种情况可删除旧的日志文件和旧的录音文件,释放资源。当服务器为语音通信平台时,步骤S106包括
在语音通信平台的语音板卡的中继占用率超过第一预设值时,产生第一语音通信平台预警信息,其中,中继占用率为语音板卡中正在使用线路占总线路的百分比。中继占用率超过第一预设值,也即语音板卡的中继占用率超标,一般正常范围是80%,若超过该数值,就说明该系统当前较忙,若业务继续发展,用户可能会将系统线路占满,就会出现电话无法接入的问题,一般这种情况若持续出现,要考虑扩容,增加系统线路。在语音通信平台的语音板卡的信令链路所在的中继失步时,产生第二语音通信平台预警信息。语音板卡的信令异常,这里的信令异常不是指信令链路中断,因为链路中断是严重告警,系统将无法使用了。而是指信令链路所在中继有失步现象,出现失步会导致用户接入系统后,有掉线现象或掉线较多,用户外呼时呼通率较底,若不处理,会影响用户的使用。一般这种情况与可能与线路接触有关,可重新作线或更换语音卡。在语音通信平台的消息处理线程速度低于第一预设速度时,产生第三语音通信平台预警信息。控制软件的消息处理线程是软件中的主线程,多个用户同时接续系统时,是顺序通过消息处理线程处理控制硬件及数据库等操作,若线程变慢,从用户角度是感觉系统提示较慢,要等待才有应答。虽然系统仍可运行,但已不方便用户使用,应该进行处理。这种情况就比较复杂,要通过日志分析系统在哪部分处理较慢,如写文件要等待,数据库查询超时,根据问题所在进行处理。在语音通信平台的业务流程出现错误时,产生第四语音通信平台预警信息,其中, 语音通信平台的业务流程出现错误包括语音通信平台中控制软件的写记录失败;或语音通信平台中系统内部数据无法正常释放。控制软件的业务流程是指根据业务需求,软件的正常处理过程。业务流程出现错误主要是从日志中发现的,如写记录数据失败,系统内部数据被占用无法正常释放等。虽然系统仍可运行,但未来会导致异常情况的发生,应该进行处理。这种情况就比较复杂,要通过代码分析系统日志。在语音通信平台的数据库访问异常时,产生第五语音通信平台预警信息,其中,语音通信平台的数据库访问异常包括语音通信平台中控制软件的数据库访问连接中存在中断;或语音通信平台中控制软件的数据库访问查询数据超过预设时间。控制软件的访问数据库异常主要是指数据库连接有中断恢复动作,查询数据超时等。通常这种情况会导致系统变慢,与语音通信平台控制软件的消息处理线程变慢类似,应该进行处理。一般这种情况可能是网络连接问题,或数据库有表被锁死。在语音通信平台的控制板卡驱动异常时,产生第六语音通信平台预警信息,其中, 语音通信平台的控制板卡驱动异常包括语音通信平台的控制板卡驱动程序存在出错提示,其中,出错提示包括选择通道外呼失败、通道加入会场失败。控制软件的控制板卡驱动异常不是指无法控制板卡驱动,因为无法控制板卡驱动是硬件问题,是严重告警,系统将无法使用了。一般是指控制板卡驱动操作时,驱动程序有出错提示,如无法选择通道外呼,无法将通道加入会场等操作,用户若重新操作可能会正常,也可能要重新操作几次才能成功。 一般这种情况是软件问题,虽然系统仍可运行,但未来会导致异常情况的发生,应该进行处理。一般这种情况可能是软件控制流程有隐藏的BUG,需要具体分析。当服务器为数据库服务器时,步骤S106包括在数据库服务器的数据库日志文件占用超过第三预设值时,产生数据库服务器预警信息。数据库软件的DB LOG的占用超标是指数据库日志文件空间已占用到80-90%,因为数据库是随时写事务日志到日志文件中,若日志文件空间写满,数据库就会停止运行,会导致严重告警,系统将无法使用,应该要提前处理。一般这种情况要将数据库进行备份及收缩文件空间。当服务器为计费服务器时,在步骤S106包括在计费服务器的消息处理线程速度低于第二预设速度时,产生第一计费服务器预
3 /= m . 目 Ih ; Ε* ;在计费服务器的数据库访问异常时,产生第二计费服务器预警信息。当服务器为TOB服务器时,步骤S106包括在TOB服务器的线程分配超标时,产生 WEB服务器预警信息。WEB软件的线程分配超标主要指WEB的应用服务控制的线程被大量占用,会导致WEB服务变慢或无响应。从用户角度就是输入网址后,打开网页很慢。一般这种情况是有多个用户下载较大的录音文件时造成线程资源的紧张。应该进行处理。一般这种情况可参考WEB应用服务的最大线程分配数做适当调整。从以上的描述中,可以看出,本发明实施例实现了如下技术效果通过增加预警信息,将可能发生的问题提前通知,发送至远程维护系统,保证了运营系统的不间断运营。进一步地,通过主动通知和多种通知方式,即使维护人员离线也可及时获知运营系统中各服务器的异常状况,节省了人力资源,提高了工作效率。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
1权利要求
1.一种运营服务系统的维护方法,其特征在于,包括 读取所述运营服务系统中服务器的日志;根据所述服务器的日志,判断所述服务器的运行参数是否满足第一条件或第二条件, 其中,所述第一条件和所述第二条件为不同的预设条件;在所述服务器的运行参数满足所述第一条件时,产生预警信息; 在所述服务器的运行参数满足所述第二条件时,产生告警信息;以及发送所述预警信息或所述告警信息至远程维护终端。
2.根据权利要求1所述的运营服务系统的维护方法,其特征在于,在产生所述预警信息或所述告警信息后,所述方法还包括判断所述远程维护终端的维护人员是否在线;在维护人员在线时,发送所述预警信息或所述告警信息至所述远程维护终端;以及在维护人员离线时,查找所述维护人员的通信方式并通过所述通信方式发送所述预警信息或所述告警信息至所述维护人员。
3.根据权利要求1所述的运营服务系统的维护方法,其特征在于,在所述服务器的运行参数满足所述第一条件时,产生预警信息包括在所述服务器的内存占用超标或所述服务器的硬盘占用超标时,产生所述预警信息。
4.根据权利要求1所述的运营服务系统的维护方法,其特征在于,当所述服务器为语音通信平台时,在所述服务器的运行参数满足所述第一条件时,产生预警信息包括在所述语音通信平台的语音板卡的中继占用率超过第一预设值时,产生第一语音通信平台预警信息,其中,所述中继占用率为所述语音板卡中正在使用线路占总线路的百分比;在所述语音通信平台的语音板卡的信令链路所在的中继失步时,产生第二语音通信平台预警信息;在所述语音通信平台的消息处理线程速度低于第一预设速度时,产生第三语音通信平台预警信息;在所述语音通信平台的业务流程出现错误时,产生第四语音通信平台预警信息; 在所述语音通信平台的数据库访问异常时,产生第五语音通信平台预警信息;以及在所述语音通信平台的控制板卡驱动异常时,产生第六语音通信平台预警信息。
5.根据权利要求4所述的运营服务系统的维护方法,其特征在于,所述语音通信平台的业务流程出现错误包括所述语音通信平台中控制软件的写记录失败;或所述语音通信平台中系统内部数据无法正常释放。
6.根据权利要求4所述的运营服务系统的维护方法,其特征在于,所述语音通信平台的数据库访问异常包括所述语音通信平台中控制软件的数据库访问连接中存在中断;或所述语音通信平台中控制软件的数据库访问查询数据超过预设时间。
7.根据权利要求4所述的运营服务系统的维护方法,其特征在于,所述语音通信平台的控制板卡驱动异常包括所述语音通信平台的控制板卡驱动程序存在出错提示,其中,所述出错提示包括选择通道外呼失败、通道加入会场失败。
8.根据权利要求1所述的运营服务系统的维护方法,其特征在于,当所述服务器为数据库服务器时,在所述服务器的运行参数满足所述第一条件时,产生预警信息包括在所述数据库服务器的数据库日志文件占用超过第三预设值时,产生数据库服务器预警信息。
9.根据权利要求1所述的运营服务系统的维护方法,其特征在于,当所述服务器为计费服务器时,在所述服务器的运行参数满足所述第一条件时,产生预警信息包括在所述计费服务器的消息处理线程速度低于第二预设速度时,产生第一计费服务器预警信息;以及在所述计费服务器的数据库访问异常时,产生第二计费服务器预警信息。
10.根据权利要求1所述的运营服务系统的维护方法,其特征在于,当所述服务器为 WEB服务器时,在所述服务器的运行参数满足所述第一条件时,产生预警信息包括在所述WEB服务器的线程分配超标时,产生WEB服务器预警信息。
11.一种运营服务系统的维护装置,其特征在于,包括 读取模块,用于读取所述运营服务系统中服务器的日志;第一判断模块,用于根据所述服务器的日志,判断所述服务器的运行参数是否满足第一条件或第二条件,其中,所述第一条件和所述第二条件为不同的预设条件;第一产生模块,用于在所述服务器的运行参数满足所述第一条件时,产生预警信息; 第二产生模块,用于在所述服务器的运行参数满足所述第二条件时,产生告警信息; 第一发送模块,用于发送所述预警信息至远程维护终端;以及第二发送模块,用于发送所述告警信息至所述远程维护终端。
12.根据权利要求11所述的运营服务系统的维护装置,其特征在于,所述第一判断模块包括第一判断子模块,用于判断所述服务器的运行参数是否满足所述第一条件;以及第二判断子模块,用于在确定所述服务器的运行参数不满足所述第一条件时,判断所述服务器的运行参数是否满足第二条件。
13.根据权利要求12所述的运营服务系统的维护装置,其特征在于,还包括 第二判断模块,用于判断所述远程维护终端的维护人员是否在线;第三发送模块,用于在维护人员在线时,发送所述预警信息或所述告警信息至所述远程维护终端;以及第四发送模块,用于在维护人员离线时,查找是维护人员的通信方式并通过所述通信方式发送所述预警信息或所述告警信息至所述维护人员。
14.一种运营服务系统,包括语音通信平台、数据库服务器、WEB服务器以及计费服务器,其特征在于,所述语音通信平台、所述数据库服务器、所述WEB服务器以及所述计费服务器分别包括权利要求11至13中任一项所述的运营服务系统的维护装置。
15.根据权利要求14所述的运营服务系统,其特征在于,还包括维护服务器,用于接收所述运营服务系统的维护装置产生的预警信息或告警信息,并将所述预警信息或所述告警信息发送至所述远程的维护系统,其中,所述运营服务系统的维护装置用于将所述预警信息或所述告警信息发送至所述维护服务器。
全文摘要
本发明提供了一种运营服务系统及其维护方法和装置。该方法包括读取运营服务系统中服务器的日志;根据服务器的日志,判断服务器的运行参数是否满足第一条件或第二条件,其中,第一条件和第二条件为不同的预设条件;在服务器的运行参数满足第一条件时,产生预警信息;在服务器的运行参数满足第二条件时,产生告警信息;以及发送预警信息或告警信息至远程维护终端。通过本发明,实时读取服务器的日志,并根据日志判断系统运行的情况,在系统出现问题但不影响系统运行时,产生预警信息,使得远程维护终端能够尽早发现运营服务系统出现的异常,以使维护人员及时处理。
文档编号H04L12/24GK102412998SQ20111043417
公开日2012年4月11日 申请日期2011年12月21日 优先权日2011年12月21日
发明者黄元庚 申请人:上海会畅通讯科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1