一种话务分析方法及系统的制作方法

文档序号:7647392阅读:194来源:国知局
专利名称:一种话务分析方法及系统的制作方法
技术领域
本发明涉及通讯领域的话务统计领域,可适用于但不限于语音呼叫、短信、 数据业务、用户数据查询的话务统计。
背景技术
通讯领域为了评价和分析设备的性能、负荷分配、业务运行质量和数量,需要对通话记录(CDR, Code Detail Record)进行分析和统计。现有技术中一般只针对通话记录(CDR)中预先设置的特定字段进行单独 的分析和统计,以获得如特定目的码、电路的统计信息。现有的技术中,也有 对通话记录中两个特定字段进行组合统计的实现,如有系统可以支持从指定来 话电路到指定去话电路的话务流向的统计。但很少见到可实现对三个以上字段 进行关联分析统计的实现。现有技术虽然能满足电信设备运维部门的大部分统计需要,但也存在如下 不足1. 不能满足运维部门对未预先设置的字段的统计。如要增加对新字段的 统计支持,通常需要修改代码;2. 不能满足运维部门复杂的多字段关联分析的需求。如运维部门可能需 要对特定用户类型的话务流向(从哪个方向来并且到哪个方向去的话务)进行 分析,或者要求某几个特定用户类型间呼叫的话务进行分析,等等。现有的话务分析方法有1. 西门子公司的话务矩阵2. 华为技术公司的话务分析西门子公司的话务矩阵,将通话的来话方向和去话方向作为矩阵的两个维 度,话务矩阵可以提供矩阵中任何一个交叉点的话务统计数据,即提供任意来 话方向到去话方向的话务数据。西门子公司的话务矩阵的局限在于只能提供两 维话务方向的统计,不能提供三维以上的话务数据。华为技术公司的实现方法是将呼叫记录(CDR)写入数据库,然后通过定 制査询模板,对数据库进行査询的方法,来满足各种话务统计的需求。这个方法可以提供多维话务的分析,也可以实现复杂的统计算法,但缺点是1. 需要依赖数据库;2. 需要大量的外部存储空间来保存呼叫记录;3. 话务分析非实时,要做到准实时,需要频繁对数据库进行复杂的査询;4. 需要预先定义分析的呼叫记录字段,支持新的字段需要修改数据库结构和查询模板。 发明内容本发明要解决的技术问题在于提供一种话务分析的系统及方法,以实现对 固定格式的呼叫记录或其他类似的原始记录进行实时的多维综合分析统计,而 不需要依赖数据库系统等第三方系统。为实现本发明的上述目的,本发明提供了一种话务分析方法,其中,包括a,设置话务分析参数,并根据设置的分析参数创建所需的索引,其中,所述分析参数包括分析字段及基于该分析字段的分类条件,所述索引包括分类条件 索引列表及分析字段索引表,其中分析条件中每个分析字段的取值都对应 -个 分类条件索引列表,该所述分类条件索引列表中保存有一组分类条件的索引 号,其中,该组分类条件的当前分析字段的取值均为该分类条件索引列表所对应的值;所述分析字段索引表是分析字段取值到分类条件索引列表的映射表;b,在接收的原始记录中搜索设置要分析的分析字段,获得所述分析字段的 取值,依次对每个分析字段的取值,根据所述分析字段索引表和分类条件索引 列表在分类条件中査找包含该分析字段取值的分类条件;c,査找到包含该分析字段取值的分类条件后,判断该分析字段是否为该分 类条件的最后一个分析字段;如是,则根据预设的特征值算法计算所述分类条 件的特征值,并判断该特征值与预设的所述分类条件的特征值是否相等;如是, 则所述分类条件与所述原始记录相匹配;如否,则所述分类条件与所述原始记录 不匹配。所述的方法,其中,在所述步骤c中,査找到包含该分析字段取值的分类 条件后还包括记录当前分析字段的值或该分析字段相关信息的步骤。所述的方法,其中,所述判断该分析字段是否为该分类条件的最后一个分析字段的步骤还包括预先设定所述分析条件中包含的各分析字段的分析顺序的步骤; 将所述分析条件中的分析字段进行记录的步骤;判断所述记录的分析顺序为最后的分析字段与当前的分析字段是否相同 的步骤;如相同,则当前分析字段为该分析条件的最后一个分析字段。所述的方法,其中,所述步骤a还包括根据所述设置的分析参数生成分析 字段定义表和分类条件定义表的步骤;其中,所述分析字段定义表的每条记录 定义一分析字段,所述定义的分析字段包括字段开始字节在原始记录中的偏移 量,字段的长度或者字段结尾在原始记录中的偏移量,及分析字段的唯一顺序 号;所述分类条件定义表的每条记录定义一分类条件所述定义的分类条件包括 一个或多个条件项;其中,所述条件项包括一分析字段及该分析字段的取值。所述的方法,其中,还包括创建对应每一分类条件的分类条件信息表的步骤,其中,所述分类条件信息表中包含该分类条件的索引号;该分类条件最 后一个分类字段的顺序号;及预设的该分类条件的特征值。所述的方法,其中,所述分析字段索引表利用如下搜索算法之一进行创建 二分法,其中,所述分析字段索引表为分析字段取值的有序表; HASH査找算法,其中,所述分析字段索引表为分析字段取值HASH桶。 所述的方法,其中,所述步骤b, c具体包括根据分析字段定义表中分析字段的顺序号,按从小到大的顺序从原始记录 取出分析字段的值;根据分析字段的值在所对应的分析字段索引表中査询获得包含该取值的 分类条件索引列表;从所述分类条件索引列表中顺序取出分类条件的索引;根据所述分类条件的索引,在分类条件记录表的对应记录上,将^累加到 特征值字段上,其中i为当前分析字段顺序号;根据所述分类条件的索弓i ,从所述分类条件信息表中取出对应分类条件的最大分析字段顺序号;比较当前分析字段的顺序号和该最大分析字段顺序号是否相等,如是,则比 较所述分类条件记录表对应记录的特征值和预设的特征值,如相等,则该分类条件是与所述原始记录相匹配的分类条件。所述的方法,其中,所述特征值算法为E2',其中i为当前分析字段顺序号。所述的方法,其中,还包括对与所述原始记录相匹配的分类条件进行统计 的步骤。所述的方法,其中,所述特征值算法为计算分析条件字串的HASH值。 所述的方法,其中,所述特征值算法包括能够表示出该分析条件涉及哪些 分析字段的算法。本发明还提供了一种话务分析系统,与业务模块和话务统计管理模块相通 讯,其中,包括分析条件设置模块,用于设置所需的分析参数,其中,所述分析参数包括 分析字段及基于该分析字段的分类条件;呼叫记录解析模块,用于在接收的原始记录中搜索所述设置要分析的分析 字段,以获得所述分析字段的取值;维度分析模块,根据原始记录各分析字段的值,在分类条件中分别找出原 始记录各分析字段取值所匹配的分类条件;多维分析模块,根据维度分析模块査找到的结果,按照预先设定的特征值 算法计算各分类条件的特征值,并判断所述计算得出的分类条件的特征值与预 设的所述分类条件的特征值是否相等;如是,则所述原始记录与所述分类条件相 匹配;如否,则所述原始记录与所述分类条件不匹配。所述的系统,其中,还包括分析条件处理模块,用于根据设置的分析参数 创建所需的索引,其中,所述分析参数包括分析字段及基于该分析字段的分类 条件,所述索引包括分类条件索引列表及分析字段索引表,其中分析条件中每 个分析字段的取值都对应一个分类条件索引列表,该所述分类条件索引列表中 保存有一组分类条件的索引号,其中,该组分类条件的当前分析字段的取值均 为该分类条件索引列表所对应的值;所述分析字段索引表是分析字段取值到分 类条件索引列表的映射表。所述的系统,其中,还包括接口模块,用于实现与话务统计管理模块和/或业务模块的接口功能。 所述的系统,其中,所述接口模块包括原始记录输入接口,用于传入原始记录;分析条件输入接口,用于传入需要进行分析的分析条件;和 统计结果获取接口,用于获取当前的统计结果。 所述的系统,其中,还包括统计模块,用于根据所述多维分析模块的匹配结果,对所述相匹配的分类 条件进行统计。所述的系统,其中,所述分类条件中包含的分析字段设置有相应的顺序号, 所述呼叫记录解析模块和维度分析模块根据所述顺序号按顺序获得所述原始 记录中分析字段的取值及找出各分析字段取值所匹配的分类条件所述的系统,其中,所述特征值算法为E2i,其中i为当前分析字段的顺序号。所述的系统,其中,所述特征值算法为计算分析条件字串的HASH值。 所述的系统,其中,所述特征值算法包括能够表示出该分析条件涉及哪些 分析字段的算法。在通讯领域中,本发明的方法通常承载在交换机上的一个处理板上,该处 理板需和业务模块以及话务统计管理模块通讯,以实现对业务的多维综合分析 的功能,并提供获取统计结果的接口。本发明的方法,也可以直接集成在业务 模块或者管理模块的内部。和现有技术相比,本发明具有以下有益效果1) 理论上可实现对任意多个分析字段的综合分析统计。可以处理的分析 字段数量仅限于环境的容量。2) 可实现对同一分析字段的条件项之间为"或"的关系,且不同分析字 段之间为"与"的关系的逻辑条件的分析统计,且分析字段的数量没有逻辑上 的限制。如(A-5 II A=6 II A=8)&& B=6 && (C=9 || C,,其中A,B,C均为不同 的分析字段。3) 本发明可实时对输入数据进行分析,并可实时得到统计结果。 且本发明的方法及系统可以在有限的内存和CPU资源的环境下,实现灵活的实时统计功能。


图1是本发明一实施例的话务分析系统的模块示意图;图2是本发明一实施例的方法在准备阶段时各模块之间的协作示意图;图3是本发明一实施例的方法在准备阶段时分析条件处理模块的处理流程示意图;图4是本发明一实施例的方法在分析阶段时的流程示意图。
具体实施方式
为便于说明,先对下列数据和名词进行定义。原始记录待分析的具有固定格式的一个码流。这里的固定格式是指在统 计活动整个周期内,格式不会发生变化。本方法对原始记录采用的具体格式不 做约束。分析条件由用户定义的分析参数,包括对分析字段的定义和基于定义的分析字段的一组分类条件。分析字段原始记录中由使用者定义的需要分析的字段。分类条件用户可定义多个分类条件,当原始记录的信息满足某个分类条件时,则对这个分类条件进行统计。每个分类条件由多个条件项以及条件项之间的关系组成。条件项组成分类条件的元素,包括一个分析字段和这个分析字段的取值。 分析字段定义表对原始记录中需要进行分析的字段进行定义。每条记录 定义一个分析字段。分析字段至少需要如下项目a.字段开始字节在原始记录 中的偏移量,b.字段的长度或者字段结尾在原始记录中的偏移量,C.分析字段 的唯一顺序号。分类条件定义表对分类条件进行定义。每条记录定义一个分类条件。至 少包括如下信息a.若干条件项定义。其中,在某些需要的情形下,还可包括 组成分类条件的各条件项之间的逻辑关系表达式。分类条件索引列表分析条件中,每个分析字段的取值,都对应一个分类条件索引列表。分类条件索引列表中保存的是一组分类条件的索引号,这些分类条件的当前分析字段取值均为该分类条件索引列表所对应的值。分析字段索引表是分析字段取值到分类条件索引列表的映射表。将所有 分类条件中相同的分析字段的取值汇总编制的索引表,用于根据原始记录的分析字段的取值,定位到分类条件索引列表。为每个分析字段建立独立的分析字 段索引表。建立分析字段索引表,可采用任何搜索算法实现,不同的分析字段, 可以针对其特点,采用不同的算法。其中,常见的公知搜索算法包括二分法和HASH法;如选用二分法查找算法,则所述分析字段索引表为分析字段取值的 有序表;如选用HASH查找算法,则分析字段索引表为分析字段取值HASH桶。分类条件信息表对原始记录进行分析时,判断是否满足分类条件所依赖 的信息。分类条件信息表至少包括如下信息a.分类条件索引号;b.最后一个 分析字段的顺序号;c.分析条件的特征值。分类条件记录表在分析过程中,用于记录的中间表。该表的-一个记录对 应一个分类条件,每条记录中保存对应分类条件的特征值的中间计算结果。分析字段值列表用于保存原始记录中需要分析的值的临时表。该表有两个字段,分别为Fiddld,val,每个分析字段的值为一条记录。字段FieldW为该 分析字段的序号,val是原始记录中该分析字段的取值。本发明将多维话务统计的过程分为单一维度的分析和多维度综合分析两 个过程,分别由维度分析模块102和多维分析模块103完成。为完成话务统计, 还设置了呼叫记录解析模块101来对业务模块传入的呼叫记录进行解析,设置 了用于对分析结果进行统计的统计模块105。此外,设置有专门的接口模块 104,用于实现和屏蔽本系统对外接口的技术细节。概括地,本发明的话务分析系统,与业务模块和话务统计管理模块相通讯, 包括分析条件处理模块100,呼叫记录解析模块101,维度分析模块102, 多维分析模块103。其中,分析条件处理模块用于处理外部传入的分析参数,其 中,所述分析参数包括分析字段及基于该分析字段的分类条件;呼叫记录解析 模块,用于在接收的原始记录中搜索所述设置的分析字段,获得所述分析字段 的取值;维度分析模块,根据原始记录各分析字段的值,在分类条件中分别找 出原始记录各分析字段取值所匹配的分类条件;多维分析模块,根据维度分析 模块査找到的结果,计算各分类条件的特征值,并判断所述计算得出的分类条 件的特征值与预设的所述分类条件的特征值是否相等;如是,则所述原始记录与所述分类条件相匹配;如否,则所述原始记录与所述分类条件不匹配。其中,用户可通过一分析条件设置模块来进行分析参数的设置。下面结合图1对各模块功能进行描述分析条件处理模块:对接收到的分析条件进行解析,形成分析字段定义表, 对应每个分析字段的分析字段索引表,以及对应每个分类条件的分类条件信息 表。并将分析字段定义表发送给呼叫记录解析模块,将分析字段索引表发送给 维度分析模块,将分类条件信息表发送给多维分析模块。呼叫记录解析模块根据分析字段定义表,从收到的呼叫记录码流中,解 析出所有后续分析所需要的字段值,并将这个值序列传递给维度分析模块。维度分析模块在分析字段所对应的分析字段索引表中査询呼叫记录对应 分析字段的值,并将查询结果发送到多维分析模块多维分析模块在分类条件信息表中寻找匹配的条目,并将匹配结果发送 给统计模块进行统计。统计模块,根据多维分析模块的匹配结果,对对应的分类条件进行统计。接口模块通讯和对外接口模块,实现通讯协议,处理收到的消息,调用 系统内其他模块完成消息所要求的功能,并反馈消息执行的结果。接口模块实 现三个接口,分别是呼叫记录输入接口 、分析条件输入接口 、统计结果获取 接口。呼叫记录输入接口由业务模块调用,传入呼叫记录。分析条件输入接口由外部的话务统计管理模块调用,传入需要进行分析的 分析条件。统计结果获取接口由外部的话务统计管理模块调用,用于获取当前的统计 结果。概括地说,本发明的话务分析方法,包括如下步骤-a,设置话务分析参数,所述分析参数包括分析字段及基于该分析字段的分类条件;b,在接收的原始记录中搜索所述设置的分析字段,获得所述分析字段的取 值,且当获得所述分类条件中所有分析字段的值时计算所述分类条件的特征值;c,判断所述计算得出的分类条件的特征值与预设的所述分类条件的特征 值是否相等;如是,则所述原始记录与所述分类条件相匹配;如否,则所述原始记 录与所述分类条件不匹配。具体地,本发明一实施例的方法可由两个阶段组成,分别是准备阶段和分 析阶段,下面分别对这两个阶段进行描述A.准备阶段。在准备阶段,用户定义分类条件,系统并构建实时分析时 所需要的索引。准备阶段的输入是用户定义的分析条件,内容包括a.分析字段的定义; b.分类条件的定义。其中每个分类条件由多个条件项以及条件项之间的关系组 成,而条件项包括一个分析字段和这个分析字段的取值。准备阶段的输出是分析字段定义表,分析字段索引表,分类条件索引列表, 分类条件信息表。图2是本发明一实施例的方法在准备阶段时各模块之间的协作示意图。如图2,各模块之间的协作流程包括步骤201,用户在话务统计管理模块上定义了多维话务分析任务,话务统 计管理模块将分析条件通过设置分析条件消息发送到接口模块;步骤202,接口模块收到设置分析条件消息,将分析条件传给分析条件处 理模块;步骤203-206,分析条件处理模块对分析条件进行分析,根据用户的分析 字段定义,建立分析字段定义表、分析字段索引表、分类条件信息表及分类条 件索引列表,并将生成的分析字段定义表发送给呼叫记录解析模块;将生成的 各分析字段索引表发送到维度分析模块;将生成的分类条件信息表发送到多维 分析模块;将生成的分类条件列表发送到统计模块,以便进行统计。图3是本发明-一实施例的方法在准备阶段时分析条件处理模块的处理流 程示意图。如图3,分析条件处理模块根据分析条件建立并发送相应分析字段 定义表、分析字段索引表、分类条件信息表及分类条件索引列表的步骤包括步骤301,分析条件处理模块对分析条件进行分析,并根据所述分析条件解 析出分析字段定义表和分类条件定义表;步骤302,按顺序读取一个分类条件,如已经读取所有分类条件,则转向 步骤310;步骤303,从分类条件中按顺序读取一个条件项,如已经读取所有条件项, 则转入步骤307;步骤304,分析条件项,并取出条件项中的分析字段,创建该分析字段的索引表;步骤305,将条件项中的值作为索引表的关键字,按选择的搜索算法的要求,插入分析字段索引表;歩骤306,在步骤305中插入的索引记录所指的分类条件索引列表中,添加当前分类条件的索引号,然后转入步骤302以读取下一个条件项;步骤307,搜索所有条件项,找出最大的分析字段顺序号即找出当前分类条件的结束字段的顺序号,计为LastField;歩骤308,根据用户定义的分类条件中的条件项间逻辑关系表达式,计算出分类条件的特征值,并将其计为EigenCond;步骤309,将分类条件的各条件项间的逻辑关系表达式,LastFidd,EigenCond写入分类条件信息表中当前分类条件记录中,然后,转入步骤303 读入下一个分类条件;步骤310,生成各分析字段索引表,并将其发送到维度分析模块; 步骤311,生成分类条件信息表,并将其发送到多维分析模块; 步骤312,将生成的分类条件列表送到统计模块,以便进行统计; 结束准备阶段的过程。 B.分析阶段分析阶段是对原始记录的实时分析,并根据分析结果进行统计的过程。 分析阶段的输入是原始记录和准备阶段中输出的分析字段定义表,分析字段索引表,分类条件索引列表,分类条件信息表。分析阶段的输出是对于输入的原始记录满足的结果分类条件列表,以便于后续的统计。图4是本发明一实施例的方法在分析阶段时的流程示意图。下面结合图4 描述分析阶段的过程,该过程包括B.0010接口模块收到呼叫记录消息;B.0020通知多维分析模块复位分类条件记录表;B.0030呼叫记录解析模块根据分析字段定义表中分析字段的顺序号,按 自小到大的顺序,从原始记录中取出一个分析字段的值,计为val,并记录当 前分析字段的顺序号为Fieldld。将Fiddld和val的取值填入一设置用于存放 呼叫记录需要分析信息的临时表一分析字段值列表中,并将分析字段值列表传给维度分析模块;B.0035维度维护模块从分析字段值列表中按顺序取出一个分析字段的 值。如已取完所有分析字段,转到B.0150;B.0040在所取值的分析字段所对应的分析字段索引表中査询取的值 val,如査询到val存在,则得到该val所对应的分类条件索引列表;如该列表 不为空,将分类条件索引列表发送给多维分析模块;如没有査询到val,或者 所对应的分类条件索引列表为空,则转向B.0030;B.0050多维分析模块从分类条件索弓1列表中顺序取出 一个分类条件列 表索引;如已全部取完,转向B.0030;B.0060按分类条件列表索引,在分类条件记录表的对应记录上,将2; (2的i次方,i为当前分析字段顺序号)累加到特征值字段上;B.0070按分类条件索引,从分类条件信息表中取出对应分类条件的最大 分析字段顺序号(FieldLast),即取出对应分类条件的最后一个分析字段;B.0080 比较当前分析字段顺序号Fiddld和FieldLast,如相等,则转向 B層O,否则,转向B.0050;B.0090按分类条件索引,从分类条件信息表中取出预设特征值;B.0100比较同一个分类条件所对应的分类条件记录表的特征字段的值 和分类条件信息表中预设的特征值,两者相同即可认为匹配成功;B.0110比较B.0090中取得的预设特征值和B.OIOO中计算得到的当前特 征值。如果两者相等,即如果特征值匹配则转到B.0120,否则转向B.O050;B.0120将当前分类列表的索引号发送给统计模块,对当前分类条件进行 统计。B.0130 转向B.0050; B.0150结束。如步骤B.0060,在本发明的一实施例中的设定采用的特征值算法为5>', 其中i为分析条件中所涉及的分析字段的顺序号。类似的,可采用现有公知的 具有类似功能的其它特征值算法,如5:i0',或者计算分析条件字串的HASH值 等,只要该算法可以表示出该分析条件涉及哪些分析字段,并便于计算即可。本发明不依赖数据库系统等第三方系统,可实现灵活的实时统计功能。进 一步地,利用本发明可实现对同一分析字段的条件项之间为"或"的关系,且不同分析字段之间为"与"的关系的逻辑条件的分析统计,且分析字段的数量没有逻辑上的限制,如(A-5 II A二6 if A=8)&& B=6 && (09 || OIO),其中A,B,C均为不同的分析字段。在GSM系统中,MSC负责处理呼叫的接续,并对呼叫进行统计,以评价 MSC的处理性能和话务情况。MSC每处理一个呼叫,都会产生一个CDR,在CDR中,包含由主叫号 码、被叫号码,主叫用户类别,被叫用户类别,来话电路群、去话电路群,来 话局向,去话局向,呼叫时长,接续时长,接续失败码等信息。用户经常需要 进行综合分析,如某个局向上某个号段的某类用户试呼次数和起呼的成功率 等。可采用本发明实现对呼叫进行统计的需求。通常,为了提高处理性能,适应大话务量的需要,此类话务分析在一个独 立的处理板上实现,这个处理板装载有基本的消息处理模块,可实现和业务模 块、操作维护模块的通讯。MSC的操作维护模块,实现了人机操作界面,和话务统计的调度管理功 能,通过消息接口向话务分析处理板发送分析参数和获取统计数据。本方法所实现的系统可以用于对有固定格式的呼叫原始记录进行实时综 合分析。本方法不仅适用于电信的话务统计,也可应用到任何需要对具有固定 格式原始记录进行分类统计的场合。本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下, 熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相 应的改变和变形都应属于本发明所附的权利要求的保护范围。
权利要求
1. 一种话务分析方法,其特征在于,包括a,设置话务分析参数,并根据设置的分析参数创建所需的索引,其中,所述分析参数包括分析字段及基于该分析字段的分类条件,所述索引包括分类条件索引列表及分析字段索引表,其中分析条件中每个分析字段的不重复的取值都对应一个分类条件索引列表,该所述分类条件索引列表中保存有一组分类条件的索引号,其中,该组分类条件的当前分析字段的取值均为该分类条件索引列表所对应的值;所述分析字段索引表是分析字段取值到分类条件索引列表的映射表;b,在接收的原始记录中搜索设置要分析的分析字段,获得所述分析字段的取值,依次对每个分析字段的取值,根据所述分析字段索引表和分类条件索引列表在分类条件中查找包含该分析字段取值的分类条件;c,查找到包含该分析字段取值的分类条件后,判断该分析字段是否为该分类条件的最后一个分析字段;如是,则根据预设的特征值算法计算所述分类条件的特征值,并判断该特征值与预设的所述分类条件的特征值是否相等;如是,则所述分类条件与所述原始记录相匹配;如否,则所述分类条件与所述原始记录不匹配。
2、 根据权利要求1所述的方法,其特征在于,在所述步骤c中,査找到包含该分析字段取值的分类条件后还包括记录当前分析字段的值或该分析字段 相关信息的步骤。
3、 根据权利要求1所述的方法,其特征在于,所述判断该分析字段是否 为该分类条件的最后一个分析字段的步骤还包括预先设定所述分析条件中包含的各分析字段的分析顺序的步骤; 将所述分析条件中的分析字段进行记录的步骤; 判断所述记录的分析顺序为最后的分析字段与当前的分析字段是否相同 的步骤;如相同,则当前分析字段为该分析条件的最后一个分析字段。
4、 根据权利要求1所述的方法,其特征在于,所述步骤a还包括根据所 述设置的分析参数生成分析字段定义表和分类条件定义表的步骤;其中,所述 分析字段定义表的每条记录定义一分析字段,所述定义的分析字段包括字段开始字节在原始记录中的偏移量,字段的长度或者字段结尾在原始记录中的偏移 量,及分析字段的唯一顺序号;所述分类条件定义表的每条记录定义一分类条 件所述定义的分类条件包括一个或多个条件项;其中,所述条件项包括-分析 字段及该分析字段的取值。
5、 根据权利要求4所述的方法,其特征在于,还包括创建对应每一分类 条件的分类条件信息表的步骤,其中,所述分类条件信息表中包含该分类条 件的索引号;该分类条件最后一个分类字段的顺序号;及预设的该分类条件的 特征值。
6、 根据权利要求1所述的方法,其特征在于,所述分析字段索引表利用 如下搜索算法之一进行创建二分法,其中,所述分析字段索引表为分析字段取值的有序表; HASH查找算法,其中,所述分析字段索引表为分析字段取值HASH桶。
7、 根据权利要求5中要求所述的方法,其特征在于,所述步骤b, c具体 包括根据分析字段定义表中分析字段的顺序号,按从小到大的顺序从原始记录 取出分析字段的值;根据分析字段的值在所对应的分析字段索引表中查询获得包含该取值的 分类条件索引列表;从所述分类条件索引列表中顺序取出分类条件的索引;根据所述分类条件的索引,在分类条件记录表的该分类条件对应记录上, 将2j累加到特征值字段上,其中i为当前分析字段顺序号;根据所述分类条件的索引,从所述分类条件信息表中取出对应分类条件的 最大分析字段顺序号;比较当前分析字段的顺序号和该最大分析字段顺序号是否相等,如是,则比 较所述分类条件记录表对应记录的特征值和预设的特征值,如相等,则该分类 条件是与所述原始记录相匹配的分类条件。
8、 根据权利要求4一7中任一权利要求所述的方法,其特征在于,所述特 征值算法为E2i,其中i为当前分析字段顺序号。
9、 根据权利要求1-7中任一权利要求所述的方法,其特征在于,还包括 对与所述原始记录相匹配的分类条件进行统计的步骤。
10、 根据权利要求1所述的方法,其特征在于,所述特征值算法包括能够表示出该分析条件所涉及的分析字段的算法。
11、 一种话务分析系统,与业务模块和话务统计管理模块相通讯,其特征 在于,包括-分析条件设置模块,用于设置所需的分析参数,其中,所述分析参数包括分析字段及基于该分析字段的分类条件;呼叫记录解析模块,用于在接收的原始记录中搜索所述设置要分析的分析 字段,以获得所述分析字段的取值;维度分析模块,根据原始记录各分析字段的值,在分类条件中分别找出原 始记录各分析字段取值所匹配的分类条件;多维分析模块,根据维度分析模块査找到的结果,按照预先设定的特征值 算法计算各分类条件的特征值,并判断所述计算得出的分类条件的特征值与预 设的所述分类条件的特征值是否相等;如是,则所述原始记录与所述分类条件相 匹配;如否,则所述原始记录与所述分类条件不匹配。
12、 根据权利要求11所述的系统,其特征在于,还包括分析条件处理模 块,用于根据设置的分析参数创建所需的索引,其中,所述分析参数包括分析 字段及基于该分析字段的分类条件,所述索引包括分类条件索引列表及分析字 段索引表,其中分析条件中每个分析字段的取值都对应一个分类条件索引列 表,该所述分类条件索引列表中保存有一组分类条件的索引号,其中,该组分 类条件的当前分析字段的取值均为该分类条件索引列表所对应的值;所述分析 字段索引表是分析字段取值到分类条件索弓I列表的映射表。
13、 根据权利要求ll所述的系统,其特征在于,还包括接口模块,用于实现与话务统计管理模块和/或业务模块的接口功能。
14、 根据权利要求13所述的系统,其特征在于,所述接口模块包括 原始记录输入接口,用于传入原始记录;分析条件输入接口,用于传入需要进行分析的分析条件;和 统计结果获取接口,用于获取当前的统计结果。
15、 根据权利要求11-14中任一权利要求所述的系统,其特征在于,还包括统计模块,用于根据所述多维分析模块的匹配结果,对所述相匹配的分类条件进行统计。
16、 根据权利要求11-14中任一权利要求所述的系统,其特征在于,所述 分类条件中包含的分析字段设置有相应的顺序号,所述呼叫记录解析模块和维 度分析模块根据所述顺序号按顺序获得所述原始记录中分析字段的取值及找 出各分析字段取值所匹配的分类条件
17、 根据权利要求16所述的系统,其特征在于,所述特征值算法为S21, 其中i为当前分析字段的顺序号。
18、 根据权利要求11所述的系统,其特征在于,所述特征值算法包括能 够表示出该分析条件所涉及的分析字段的算法。
全文摘要
本发明公开了一种话务分析方法及系统,其特征在于,该方法包括a,设置话务分析参数,所述分析参数包括分析字段及基于该分析字段的分类条件;b,在接收的原始记录中搜索所述设置的分析字段,获得所述分析字段的取值,且当获得所述分类条件中所有分析字段的值时计算所述分类条件的特征值;c,判断所述计算得出的分类条件的特征值与预设的所述分类条件的特征值是否相等;如是,则所述原始记录与所述分类条件相匹配;如否,则所述原始记录与所述分类条件不匹配。利用本发明的方法及系统能实现在有限的内存和CPU资源的环境下,对固定格式的呼叫记录或其他类似的原始记录进行实时的多维综合分析统计。
文档编号H04M3/36GK101247434SQ20071006402
公开日2008年8月20日 申请日期2007年2月16日 优先权日2007年2月16日
发明者珂 黄 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1