一种话单数据的统计方法及统计装置的制造方法

文档序号:10512180阅读:252来源:国知局
一种话单数据的统计方法及统计装置的制造方法
【专利摘要】本发明提供了一种话单数据的统计方法及统计装置,该方法包括:提取第一话单数据中第一字段的记录内容和第二字段的记录内容;判断第一字段的记录内容和所述第二字段的记录内容之间是否满足预定关系;当所述第一字段的记录内容和所述第二字段的记录内容之间满足预定关系时,将所述第一话单数据创建至第一分区文件中;当所述第一字段的记录内容和所述第二字段的记录内容之间不满足预定关系时,将所述第一话单数据分别创建至所述第一分区文件和第二分区文件中;其中所述第一分区文件是依据所述第一字段的名称和记录内容的组合被命名,所述第二分区文件是依据所述第二字段的名称和记录内容的组合被命名。采用本发明能够有效提高话单数据的统计效率。
【专利说明】
一种话单数据的统计方法及统计装置
技术领域
[0001] 本发明涉及数据处理技术领域,尤其涉及一种话单数据的统计方法及统计装置。
【背景技术】
[0002] 在电信领域很多的原始数据都是通过运行设备的原始话单提供的,这样的数据处 理具有几个特点:数据量大,几个月的数据就达T级;处理性能要求高,处理速度要求几千 条记录/秒,也就是说,对这些大量的话单进行多维统计分析,还要保持可接受的性能,是 一个很大的挑战。
[0003] 对上述挑战,第一种常用的处理方法是基于关系型数据库对数据进行分区,分区 指的是将同一个表的数据进行分类,分别存放到不同区域,这样在查询统计时就能直接缩 小被统计数据范围,从而有效提升性能,但是常用的关系型数据库对分区技术只支持一维 分区,无法做到两重分区,不能同时提高二维统计的性能;第二种常见的方法是采用内存数 据库,将数据放在内存中,由于内存的读取速度快,因此可以加速统计性能,但其缺陷也是 受制于内存,由于数据在内存中,其存放的数据量就会受限,通常内存数据是对磁盘数据的 映射,而话单的数据量很大,不太可能全部存放到内存中,因此会不断的在内存和磁盘之间 进行数据交换,导致内存数据库的性能大打折扣;第三种方法是采用集群或者云计算技术, 将数据分布到多个节点,充分利用多个节点并行处理的优势来提高性能,但是该方案实时 性较差,集群和云计算技术适合处理对实时性要求不太高的统计场景;其次是成本高,建设 一个集群和云计算处理平台,需要投入较高的建设和运营成本,在某些情况下,高成本意味 着不可行。

【发明内容】

[0004] 本发明实施例的目的是提供一种话单数据的统计方法及统计装置,可有效提高 话单数据的统计效率。
[0005] 为了解决上述技术问题,本发明实施例采用如下技术方案:
[0006] 依据本发明实施例的一个方面,提供了一种话单数据的统计方法,包括:
[0007] 提取第一话单数据中第一字段的记录内容和第二字段的记录内容;
[0008] 判断所述第一字段的记录内容和所述第二字段的记录内容之间是否满足预定关 系;
[0009] 当所述第一字段的记录内容和所述第二字段的记录内容之间满足预定关系时,将 所述第一话单数据创建至第一分区文件中;当所述第一字段的记录内容和所述第二字段的 记录内容之间不满足预定关系时,将所述第一话单数据分别创建至所述第一分区文件和第 二分区文件中;其中所述第一分区文件是依据所述第一字段的名称和记录内容的组合被命 名,所述第二分区文件是依据所述第二字段的名称和记录内容的组合被命名。
[0010] 其中,所述第一字段的名称为话单数据的结算日期,所述第二字段的名称为话单 数据的通话日期,所述预定关系为:所述第一字段的记录内容和所述第二字段的记录内容 相同。 toon] 其中,在所述提取第一话单数据中第一字段的记录内容和第二字段的记录内容的 步骤之前,所述方法还包括:
[0012] 在原始话单数据中提取包括所述第一字段和所述第二字段的部分数据,形成所述 第一话单数据。
[0013] 其中,在将所述第一话单数据创建至第一分区文件和第二分区文件中,或将所述 第一话单数据创建至第一分区文件中的步骤之后,所述方法还包括:
[0014] 判断所述第一话单数据所在的第一分区文件和/或第二分区文件的日期是否超 过在线保留的预设日期;
[0015] 若超过所述预设日期,则删除所述第一分区文件和/或第二分区文件。
[0016] 其中,在将所述第一话单数据创建至第一分区文件和第二分区文件中,或将所述 第一话单数据创建至第一分区文件中的步骤之后,所述方法还包括:
[0017] 获取用户的话单查询数据;
[0018] 根据所述话单查询数据,查询所述第一分区文件和/或所述第二分区文件,将对 应话单数据发送给用户。
[0019] 其中,所述根据所述话单查询数据,查询所述第一分区文件和/或所述第二分区 文件,将对应话单数据发送给用户的步骤包括:
[0020] 当所述话单查询数据的查询条件仅包括所述第一字段的名称和需要查询的第一 字段的记录内容时,根据所述第一字段的记录内容,查找相对应命名的所述第一分区文件, 获得需要查询的话单数据,并发送给用户;
[0021] 当所述话单查询数据的查询条件仅包括所述第二字段的名称和需要查询的第二 字段的记录内容时,根据第二字段的记录内容,查找相对应命名的所述第一分区文件和所 述第二分区文件,从所述第一分区文件和所述第二分区文件分别获得需要查询的话单数 据,并发送给用户;
[0022] 当所述话单查询数据的查询条件既包括第一字段的名称和需要查询的第一字段 的记录内容,也包括第二字段的名称和需要查询的第二字段的记录内容时,根据所述第一 字段的记录内容,查找相对应命名的所述第一分区文件,获得需要查询的话单数据,并发送 给用户。
[0023] 依据本发明实施例的另一个方面,还提供了一种话单数据的统计装置,包括:
[0024] 第一提取模块,用于提取第一话单数据中第一字段的记录内容和第二字段的记录 内容;
[0025] 第一判断模块,用于判断所述第一字段的记录内容和所述第二字段的记录内容之 间是否满足预定关系;
[0026] 创建模块,用于当所述第一字段的记录内容和所述第二字段的记录内容之间满足 预定关系时,将所述第一话单数据创建至第一分区文件中;以及用于当所述第一字段的记 录内容和所述第二字段的记录内容之间不满足预定关系时,将所述第一话单数据分别创建 至所述第一分区文件和第二分区文件中;其中所述第一分区文件是依据所述第一字段的名 称和记录内容的组合被命名,所述第二分区文件是依据所述第二字段的名称和记录内容的 组合被命名。
[0027] 其中,所述第一字段的名称为话单数据的结算日期,所述第二字段的名称为话单 数据的通话日期,所述预定关系为:所述第一字段的记录内容和所述第二字段的记录内容 相同。
[0028] 其中,所述统计装置还包括:
[0029] 第二提取模块,用于在原始话单数据中提取包括所述第一字段和所述第二字段的 部分数据,形成所述第一话单数据。
[0030] 其中,所述统计装置还包括:
[0031] 第二判断模块,用于判断所述第一话单数据所在的第一分区文件和/或第二分区 文件的日期是否超过在线保留的预设日期;
[0032] 删除模块,用于当所述第二判断模块判断所述第一话单数据所在的第一分区文件 和/或第二分区文件超过所述预设日期时,删除所述第一分区文件和/或第二分区文件。
[0033] 其中,所述统计装置还包括:
[0034] 获取模块,用于获取用户的话单查询数据;
[0035] 查询模块,用于根据所述话单查询数据,查询所述第一分区文件和/或所述第二 分区文件,将对应话单数据发送给用户。
[0036] 其中,所述查询模块包括:
[0037] 第一查询单元,用于当所述话单查询数据的查询条件仅包括所述第一字段的名称 和需要查询的第一字段的记录内容时,根据所述第一字段的记录内容,查找相对应命名的 所述第一分区文件,获得需要查询的话单数据,并发送给用户;
[0038] 第二查询单元,用于当所述话单查询数据的查询条件仅包括所述第二字段的名称 和需要查询的第二字段的记录内容时,根据第二字段的记录内容,查找相对应命名的所述 第一分区文件和所述第二分区文件,从所述第一分区文件和所述第二分区文件分别获得需 要查询的话单数据,并发送给用户;
[0039] 第三查询单元,用于当所述话单查询数据的查询条件既包括第一字段的名称和需 要查询的第一字段的记录内容,也包括第二字段的名称和需要查询的第二字段的记录内容 时,根据所述第一字段的记录内容,查找相对应命名的所述第一分区文件,获得需要查询的 话单数据,并发送给用户。
[0040] 本发明实施例的有益效果:在本发明的实施例中,通过对话单数据进行两重分区, 在提高分区范围精准度的同时,又有效提高了话单数据的统计效率。
【附图说明】
[0041] 图1为本发明实施例的话单数据的统计方法的流程图;
[0042] 图2为本发明实施例的采集话单数据的流程图;
[0043] 图3为本发明实施例的查询话单数据的流程图;
[0044] 图4为本发明实施例的话单数据的统计装置的结构示意图。
【具体实施方式】
[0045] 为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具 体实施例进行详细描述。
[0046] 本发明实施例提供了一种话单数据的统计方法,包括:提取第一话单数据中第一 字段的记录内容和第二字段的记录内容;判断所述第一字段的记录内容和所述第二字段的 记录内容之间是否满足预定关系;当所述第一字段的记录内容和所述第二字段的记录内容 之间满足预定关系时,将所述第一话单数据创建至第一分区文件中;当所述第一字段的记 录内容和所述第二字段的记录内容之间不满足预定关系时,将所述第一话单数据分别创建 至所述第一分区文件和第二分区文件中;其中所述第一分区文件是依据所述第一字段的名 称和记录内容的组合被命名,所述第二分区文件是依据所述第二字段的名称和记录内容的 组合被命名。
[0047] 在本发明的实施例中,根据话单数据的第一字段和第二字段建立两个分区文件, 其中第一分区文件是依据第一字段创建和命名,第二分区文件是依据第二字段创建和命 名,利用第一字段和第二字段的记录内容之间的对应关系,仅将第一字段和第二字段不满 足对应关系的话单数据创建至第二分区文件中,对于所有话单数据来说,形成两个维度的 分区,一个是关于第一字段的分区,另一个是关于第二字段的分区。
[0048] 采用上述方式,当用户需要查询话单数据时,在按照第一字段的名称和需要查询 的第一字段的记录内容查询时,根据所述第一字段的记录内容,只需查找相对应命名的所 述第一分区文件,获得需要查询的话单数据;在按照第二字段的名称和需要查询的第二字 段的记录内容时,根据第二字段的记录内容,查找相对应命名的所述第一分区文件和所述 第二分区文件,从所述第一分区文件和所述第二分区文件分别获得需要查询的话单数据; 在按照第一字段的名称和需要查询的第一字段的记录内容以及第二字段的名称和需要查 询的第二字段的记录内容时,根据所述第一字段的记录内容,查找相对应命名的所述第一 分区文件,获得需要查询的话单数据。
[0049] 也就是说,在本发明的实施例中,在用户查询话单数据时,可以精确的确定分区范 围,进而在精确的分区范围内获得需要的话单数据,从而大大提高了查询效率。
[0050] 较佳地,上述的第一字段相较于第二字段为查询概率较高的字段。
[0051] 其中,该统计方法具体可应用于国际漫游话单数据的统计系统中,其中,针对国际 漫游话单数据的统计系统,该第一字段的名称为话单数据的结算日期,第二字段的名称为 话单数据的通话日期。其中,这两个日期在大多数情况下是相同的,因为在通话发送后,话 单数据通话会在当天发送到清算中心处理,但是也存在话单数据延迟发送给清算中心的情 况,标准规定话单的有效期是35天,也就是说今天实际发生的通话,在今天之后的35天内 发送给清算中心都是有效的,这样延迟发送的话单数据的结算日期和通话日期就不是同一 天。
[0052] 基于实际业务分析现有话单文件,可知话单数据的结算日期与通话日期为同一天 的占比超过85 %;基于结算日期的话单数据查询业务占比超过60 %,基于此,我们以结算日 期为标准构造第一分区文件,以通话日期为标准构造第二分区文件,这样对于大部分按照 结算日期的查询都可以精确的确定分区范围,直接从第一分区文件中就可以查找数据,从 而大大提高查询效率。
[0053] 这里需要说明的是,本方法不仅适用于国际漫游话单数据的统计系统,也适用于 对于分区维度的字段类型相同或相似(可以转换即可)的相关系统。
[0054] 下面以该话单数据的统计方法应用于国际漫游话单数据的统计系统中为例,进一 步说明本发明实施的实施。
[0055] 如图1所示,所述方法包括:
[0056] 步骤101,提取第一话单数据中第一字段的记录内容和第二字段的记录内容。
[0057] 步骤102,判断所述第一字段的记录内容和所述第二字段的记录内容之间是否满 足预定关系。
[0058] 具体地,所述预定关系为:所述第一字段的记录内容和所述第二字段的记录内容 相同。也就是说,该步骤需要判断第一话单数据的结算日期与通话日期是否一致。需要说 明的是,该预定关系不限制于是相同,只要第一字段的记录内容与第二字段的记录内容有 关联、可以转换的情形也适用。
[0059] 步骤103,当所述第一字段的记录内容和所述第二字段的记录内容之间满足预定 关系时,将所述第一话单数据创建至第一分区文件中;当所述第一字段的记录内容和所述 第二字段的记录内容之间不满足预定关系时,将所述第一话单数据分别创建至所述第一分 区文件和第二分区文件中;其中所述第一分区文件是依据所述第一字段的名称和记录内容 的组合被命名,所述第二分区文件是依据所述第二字段的名称和记录内容的组合被命名。
[0060] 具体地,第一分区文件的文件名可为:"cdr_info. sttl_dt. 20141115"的第一分 区文件,其中,cdr_info为文件名的一种形式,sttl_dt为结算日期的英文简写;第二分区 文件的文件名可为:"cdr_info. sttl_dt. 20141115",其中,call_start_dt为通话日期的 英文简写;其中,相邻的两个第一分区文件之间的时间间隔为一天,相邻的两个第二分区文 件之间的时间间隔为一天。
[0061] 举例说明,对于一话单数据来说,若该话单数据的结算日期为20141115,通话日 期为20141115,即该话单数据第一字段的记录内容与第二字段记录的内容相同,则将该话 单数据创建至以"cdr_info. sttl_dt. 20141115"命名的第一分区文件中;若该话单数据的 结算日期为20141116,通话日期为20141115,则将该话单数据创建至以"cdr_info. sttl_ dt. 20141116"命名的第一分区文件中,以"cdr_info. call_start_dt. 20141115"命名的第 二分区文件中。
[0062] 在本发明实施例中,针对电信业务话单数据量大、话单数据的时间关联性强等特 点,基于实际情况中对话单数据按照结算日期查询的需求比较大,存储数据时根据话单数 据的结算日期和通话日期的预定关系进行分区和管理,大大提高了统计话单数据时的效 率。
[0063] 进一步地,在本发明上述实施例的步骤101之前,所述方法还包括:
[0064] 在原始话单数据中提取包括所述第一字段和所述第二字段的部分数据,形成所述 第一话单数据。
[0065] 具体地,由于原始话单数据中包括了大量的字段和信息量,在统计话单数据时耗 时比较久,在某些情况下难以接受。而在实际的话单数据统计中,并不是需要原始话单数据 中的所有字段,经过大量的统计分析,可从原始话单数据中提取一些我们常用的字段。具 体可参见表1和表2,表1为本发明实施例的原始话单数据的字段信息表,表2为本发明实 施例的第一话单数据的字段信息表。
[0066] 表 1
[0067]

[0071] 由表2可知,较表1减少了近2/3的字段,字段的减少意味着话单数据统计时磁盘 10的减少,也就意味着统计速度的提升。虽然第一话单数据与原始话单数据存在一定的数 据冗余存储,但是因为表字段的数据大幅较少,其存储占用量是可以接受的。
[0072] 进一步地,在本发明上述实施例的在将所述第一话单数据创建至第一分区文件和 第二分区文件中,或将所述第一话单数据创建至第一分区文件中的步骤之后,所述方法还 包括:
[0073] 判断所述第一话单数据所在的第一分区文件和/或第二分区文件的日期是否超 过在线保留的预设日期;若超过所述预设日期,则删除所述第一分区文件和/或第二分区 文件。
[0074] 具体地,在需要删除过期分区文件时,可以通过将过期数据分区文件移除的方法, 避免了从大数据表中删除部分过期数据的巨大开销。这里需要进一步说明的是,在实际情 况中,一般不对单条的话单数据进行删除处理。
[0075] 进一步地,在本发明上述实施例的在将所述第一话单数据创建至第一分区文件和 第二分区文件中,或将所述第一话单数据创建至第一分区文件中的步骤之后,所述方法还 包括:
[0076] 获取用户的话单查询数据;根据所述话单查询数据,查询所述第一分区文件和/ 或所述第二分区文件,将对应话单数据发送给用户。
[0077] 具体地,根据所述话单查询数据,发送话单数据至用户分为三种情况:
[0078] 情况1 :当所述话单查询数据的查询条件仅包括所述第一字段的名称和需要查询 的第一字段的记录内容时,根据所述第一字段的记录内容,查找相对应命名的所述第一分 区文件,获得需要查询的话单数据,并发送给用户;
[0079] 情况2 :当所述话单查询数据的查询条件仅包括所述第二字段的名称和需要查询 的第二字段的记录内容时,根据第二字段的记录内容,查找相对应命名的所述第一分区文 件和所述第二分区文件,从所述第一分区文件和所述第二分区文件分别获得需要查询的话 单数据,并发送给用户;
[0080] 情况3 :当所述话单查询数据的查询条件既包括第一字段的名称和需要查询的第 一字段的记录内容,也包括第二字段的名称和需要查询的第二字段的记录内容时,根据所 述第一字段的记录内容,查找相对应命名的所述第一分区文件,获得需要查询的话单数据, 并发送给用户。
[0081] 为了更好的理解本发明实施例的实施,下面结合图2及图3对本发明进一步解释。
[0082] 如图2所示,为本发明实施例的采集话单数据的流程图,包括:
[0083] 步骤201,插入第一话单数据。
[0084] 步骤202,判断第一话单数据的sttl_dt与call_start_dt是否相同。
[0085] 步骤203,若第一话单数据的sttl_dt与call_start_dt相同,判断sttl_dt对应 日期区文件存在。
[0086] 步骤204,若sttl_dt对应日期区文件存在,则直接将第一话单数据追加到sttl_ dt对应日期分区文件。
[0087] 步骤205,若sttl_dt对应日期区文件不存在,仓ij建sttl_dt对应日期分区文件; 继续步骤204。
[0088] 步骤206,若第一话单数据的sttl_dt与call_start_dt不相同,判断call_ start_dt对应日期分区文件存在。
[0089] 步骤207,若call_start_dt对应日期区文件存在,则直接将第一话单数据追加到 call_start_dt对应日期分区文件。
[0090] 步骤208,若sttl_dt对应日期区文件不存在,创建call_start_dt对应日期分区 文件;继续步骤207。
[0091] 在步骤207之后,继续步骤204,完成整个处理流程。
[0092] 也就是说,用于当所述第一字段的记录内容和所述第二字段的记录内容之间满足 预定关系时,则将所述第一话单数据创建至第一分区文件中;当所述第一字段的记录内容 和所述第二字段的记录内容之间不满足预定关系时,则将所述第一话单数据分别创建至所 述第一分区文件和第二分区文件中。
[0093] 如图3示,为本发明实施例的查询话单数据的流程图,包括:
[0094] 步骤301,获取话单查询数据。
[0095] 步骤302,查询条件仅包括sttl_dt时,继续步骤305 ;
[0096] 步骤305,查询sttl_dt对应日期的第一分区文件。
[0097] 步骤303,查询条件仅包括call_start_dt时,继续步骤306 ;
[0098] 步骤306,查询call_start_dt对应日期的第二分区文件和sttl_dt对应日期的第 一分区文件。
[0099] 步骤304,查询条件同时包括sttl_dt和call_start_dt时,继续步骤307 ;
[0100] 步骤307,查询sttl_dt对应日期的第一分区文件。
[0101] 为了更好的理解该查询的过程,通过举例进一步说明:
[0102] 例如:在日期为 20141115 的当天,在 "cdr_info. sttl_dt. 20141115" 的第一分区 文件中,包括80条话单数据,其中有65条话单数据是20141115当天发生的通话、当天进行 的结算,另15条数据是20141115之前的某天发生的通话,但是在20141115这天结算的; 在"cdr_info. sttl_dt. 20141115"的第二分区文件中,包括20条数据,说明这20条数据是 20141115当天发生,20141115当天没有进行结算的。当我们需要查询20141115当天结算 了多少话单数据时,只需要在"cdr_info. sttl_dt. 20141115"的第一分区文件中查询数据, 查询结果即是80条话单数据;当我们需要查询20141115当天发生了多少通话时,我们需要 在"cdr_info. sttl_dt. 20141115" 的第一分区文件中和"cdr_info. sttl_dt. 20141115" 的 第二分区文件中查询,即为65条加20条为85条话单数据;当我们需要查询20141115这天 发生的通话并进行结算的话单数据时,只需要在"cdr_inf 〇. sttl_dt. 20141115"的第一分 区文件中查询数据,即为65条,由于分区的划分精度高,从而大大减少了磁盘10操作次数, 提高了查询效率。
[0103] 依据本发明实施例的另一个方面,本发明实施例还提供了一种话单数据的统计 装置,所述统计装置应用于国际漫游话单数据的统计系统中,如图4所示,所示统计装置包 括:
[0104] 第一提取模块41,用于提取第一话单数据中第一字段的记录内容和第二字段的记 录内容。
[0105] 第一判断模块42,用于判断所述第一字段的记录内容和所述第二字段的记录内容 之间是否满足预定关系。
[0106] 创建模块43,用于当所述第一字段的记录内容和所述第二字段的记录内容之间满 足预定关系时,将所述第一话单数据创建至第一分区文件中;以及用于当所述第一字段的 记录内容和所述第二字段的记录内容之间不满足预定关系时,将所述第一话单数据分别创 建至所述第一分区文件和第二分区文件中;其中所述第一分区文件是依据所述第一字段的 名称和记录内容的组合被命名,所述第二分区文件是依据所述第二字段的名称和记录内容 的组合被命名。
[0107] 进一步地,所述统计装置还包括:
[0108] 第二提取模块,用于在原始话单数据中提取包括所述第一字段和所述第二字段的 部分数据,形成所述第一话单数据。
[0109] 进一步地,所述统计装置还包括:
[0110] 第二判断模块,用于判断所述第一话单数据所在的第一分区文件和/或第二分区 文件的日期是否超过在线保留的预设日期;
[0111] 删除模块,用于当所述第二判断模块判断所述第一话单数据所在的第一分区文件 和/或第二分区文件超过所述预设日期时,删除所述第一分区文件和/或第二分区文件。
[0112] 进一步地,所述统计装置还包括:
[0113] 获取模块,用于获取用户的话单查询数据;
[0114] 查询模块,用于根据所述话单查询数据,查询所述第一分区文件和/或所述第二 分区文件,将对应话单数据发送给用户。
[0115] 进一步地,所述查询模块包括:
[0116] 第一查询单元,用于当所述话单查询数据的查询条件仅包括所述第一字段的名称 和需要查询的第一字段的记录内容时,根据所述第一字段的记录内容,查找相对应命名的 所述第一分区文件,获得需要查询的话单数据,并发送给用户;
[0117] 第二查询单元,用于当所述话单查询数据的查询条件仅包括所述第二字段的名称 和需要查询的第二字段的记录内容时,根据第二字段的记录内容,查找相对应命名的所述 第一分区文件和所述第二分区文件,从所述第一分区文件和所述第二分区文件分别获得需 要查询的话单数据,并发送给用户;
[0118] 第三查询单元,用于当所述话单查询数据的查询条件既包括第一字段的名称和需 要查询的第一字段的记录内容,也包括第二字段的名称和需要查询的第二字段的记录内容 时,根据所述第一字段的记录内容,查找相对应命名的所述第一分区文件,获得需要查询的 话单数据,并发送给用户。
[0119] 以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员 来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也 应视为本发明的保护范围。
【主权项】
1. 一种话单数据的统计方法,其特征在于,包括: 提取第一话单数据中第一字段的记录内容和第二字段的记录内容; 判断所述第一字段的记录内容和所述第二字段的记录内容之间是否满足预定关系; 当所述第一字段的记录内容和所述第二字段的记录内容之间满足预定关系时,将所述 第一话单数据创建至第一分区文件中;当所述第一字段的记录内容和所述第二字段的记录 内容之间不满足预定关系时,将所述第一话单数据分别创建至所述第一分区文件和第二分 区文件中;其中所述第一分区文件是依据所述第一字段的名称和记录内容的组合被命名, 所述第二分区文件是依据所述第二字段的名称和记录内容的组合被命名。2. 根据权利要求1所述的话单数据的统计方法,其特征在于,所述第一字段的名称为 话单数据的结算日期,所述第二字段的名称为话单数据的通话日期,所述预定关系为:所述 第一字段的记录内容和所述第二字段的记录内容相同。3. 根据权利要求1所述的话单数据的统计方法,其特征在于,在所述提取第一话单数 据中第一字段的记录内容和第二字段的记录内容的步骤之前,所述方法还包括: 在原始话单数据中提取包括所述第一字段和所述第二字段的部分数据,形成所述第一 话单数据。4. 根据权利要求1所述的话单数据的统计方法,其特征在于,在将所述第一话单数据 创建至第一分区文件和第二分区文件中,或将所述第一话单数据创建至第一分区文件中的 步骤之后,所述方法还包括: 判断所述第一话单数据所在的第一分区文件和/或第二分区文件的日期是否超过在 线保留的预设日期; 若超过所述预设日期,则删除所述第一分区文件和/或第二分区文件。5. 根据权利要求1所述的话单数据的统计方法,其特征在于,在将所述第一话单数据 创建至第一分区文件和第二分区文件中,或将所述第一话单数据创建至第一分区文件中的 步骤之后,所述方法还包括: 获取用户的话单查询数据; 根据所述话单查询数据,查询所述第一分区文件和/或所述第二分区文件,将对应话 单数据发送给用户。6. 根据权利要求5所述的话单数据的统计方法,其特征在于,所述根据所述话单查询 数据,查询所述第一分区文件和/或所述第二分区文件,将对应话单数据发送给用户的步 骤包括: 当所述话单查询数据的查询条件仅包括所述第一字段的名称和需要查询的第一字段 的记录内容时,根据所述第一字段的记录内容,查找相对应命名的所述第一分区文件,获得 需要查询的话单数据,并发送给用户; 当所述话单查询数据的查询条件仅包括所述第二字段的名称和需要查询的第二字段 的记录内容时,根据第二字段的记录内容,查找相对应命名的所述第一分区文件和所述第 二分区文件,从所述第一分区文件和所述第二分区文件分别获得需要查询的话单数据,并 发送给用户; 当所述话单查询数据的查询条件既包括第一字段的名称和需要查询的第一字段的记 录内容,也包括第二字段的名称和需要查询的第二字段的记录内容时,根据所述第一字段 的记录内容,查找相对应命名的所述第一分区文件,获得需要查询的话单数据,并发送给用 户。7. -种话单数据的统计装置,其特征在于,包括: 第一提取模块,用于提取第一话单数据中第一字段的记录内容和第二字段的记录内 容; 第一判断模块,用于判断所述第一字段的记录内容和所述第二字段的记录内容之间是 否满足预定关系; 创建模块,用于当所述第一字段的记录内容和所述第二字段的记录内容之间满足预定 关系时,将所述第一话单数据创建至第一分区文件中;以及用于当所述第一字段的记录内 容和所述第二字段的记录内容之间不满足预定关系时,将所述第一话单数据分别创建至所 述第一分区文件和第二分区文件中;其中所述第一分区文件是依据所述第一字段的名称和 记录内容的组合被命名,所述第二分区文件是依据所述第二字段的名称和记录内容的组合 被命名。8. 根据权利要求7所述的话单数据的统计装置,其特征在于,所述第一字段的名称为 话单数据的结算日期,所述第二字段的名称为话单数据的通话日期,所述预定关系为:所述 第一字段的记录内容和所述第二字段的记录内容相同。9. 根据权利要求7所述的话单数据的统计装置,其特征在于,所述统计装置还包括: 第二提取模块,用于在原始话单数据中提取包括所述第一字段和所述第二字段的部分 数据,形成所述第一话单数据。10. 根据权利要求7所述的话单数据的统计装置,其特征在于,所述统计装置还包括: 第二判断模块,用于判断所述第一话单数据所在的第一分区文件和/或第二分区文件 的日期是否超过在线保留的预设日期; 删除模块,用于当所述第二判断模块判断所述第一话单数据所在的第一分区文件和/ 或第二分区文件超过所述预设日期时,删除所述第一分区文件和/或第二分区文件。11. 根据权利要求7所述的话单数据的统计装置,其特征在于,所述统计装置还包括: 获取模块,用于获取用户的话单查询数据; 查询模块,用于根据所述话单查询数据,查询所述第一分区文件和/或所述第二分区 文件,将对应话单数据发送给用户。12. 根据权利要求7所述的话单数据的统计装置,其特征在于,所述查询模块包括: 第一查询单元,用于当所述话单查询数据的查询条件仅包括所述第一字段的名称和需 要查询的第一字段的记录内容时,根据所述第一字段的记录内容,查找相对应命名的所述 第一分区文件,获得需要查询的话单数据,并发送给用户; 第二查询单元,用于当所述话单查询数据的查询条件仅包括所述第二字段的名称和需 要查询的第二字段的记录内容时,根据第二字段的记录内容,查找相对应命名的所述第一 分区文件和所述第二分区文件,从所述第一分区文件和所述第二分区文件分别获得需要查 询的话单数据,并发送给用户; 第三查询单元,用于当所述话单查询数据的查询条件既包括第一字段的名称和需要查 询的第一字段的记录内容,也包括第二字段的名称和需要查询的第二字段的记录内容时, 根据所述第一字段的记录内容,查找相对应命名的所述第一分区文件,获得需要查询的话
【文档编号】G06F17/30GK105868197SQ201510028730
【公开日】2016年8月17日
【申请日】2015年1月20日
【发明人】张爱民, 姜薇薇, 陈卓, 琚彬
【申请人】中国移动(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1