一种话单拣重方法

文档序号:7901692阅读:360来源:国知局
专利名称:一种话单拣重方法
技术领域
本发明涉及电通信技术,尤其涉及一种话单拣重方法。
背景技术
随着通信产业的发展,通信用户使用通信业务越来越频繁,电信计费产品处理话单数据量也日益增加,并且在新的电信环境下,“快”成为各电信运营商进行互相竞争的一个很有效的手段,并且随着电信运营商从“以技术为中心”转向“以客户为中心”,需要保存的消费数据也变得越来越丰富。各通信运营商为节约运营成本、提高服务质量、提高服务效率、体现以客户为中心的服务方式,选用的计费产品越来越趋向于消费数据集中处理,计费产品的实时性与处理速度性能要求越来越高。计时话单的拣重效率对计费产品对用户业务信息计费响应效率的主要因素,如何提高计时话单的拣重效率是全球电信运营商长期关注的重大课题。
重复话单定义一般有如下两种一、话单完全重复;二、相同主叫号码的话单通话时长交叉、嵌套或者重叠,其中,定义二是定义一的超集,本发明所涉及的重复话单是指定义二含义下的重复话单,有时也称时间包容性话单。
传统计时话单拣重方法应用数据库技术进行排序拣重或应用文件技术仅对每个文件内拣重,其仍限于对两种基本技术的简单应用,没有提出更有效的计时话单拣重方法,主要方法如下
1.数据库拣重方法这种方法将所有已计费的计时话单收集在一起,然后对这些话单进行统一拣重,这种方法虽然拣重的准确率较高,但具有如下缺点。
一、拣重效率较低,而且随着历史计时话单数量的增多,拣重效率也随着明显下降。
二、需要定期或不定期进行拣重处理,是非实时的拣重方法。
2.文件内拣重方法这种方法对计时话单数据只进行文件内拣重,这种方法虽然满足计时话单文件实时拣重要求且拣重效率较高,但具有如下缺点一、拣重的准确率较低。
二、当计时话单计费的实时性要求越高,拣重的准确率损失越高。

发明内容
本发明的目的在于提供一种高效实时的话单拣重方法。
本发明所采用的方法为这种话单拣重方法,其特征在于它采用如下实施步骤A.对计时话单文件按规则进行分块,在各相应的分块数据的话单文件内进行话单拣重;B.分块数据的话单文件经拣重处理后,按规则产生话单块,所产生的话单块中的话单在相应的历史话单中进行文件间拣重,拣重后的话单块写入拣重文件中,得到正常话单文件,且写入的拣重文件可作为下一次拣重处理的历史话单。
所述的步骤A中,计时话单文件按号码规则对文件进行分块;
所述的步骤A中,所述的计时话单文件按主叫号码、话单通话开始时间、话单通话结束时间进行排列;所述的步骤A中,采用操作系统多线程并发处理方式,对各分块数据的话单文件进行并发的拣重处理;所述的话单文件的大小小于或等于20MB;所述话单文件的话单经拣重后,非重复话单放入相应的正常话单缓冲区;所述的正常话单缓冲区按话单结束时间进行设置分组;所述的步骤B中,所述的分块数据的话单文件经拣重处理后,按主叫号码和话单结束日期进行分组产生话单块;所述的步骤B中,所述的历史话单为相应的按主叫号码和话单结束日期分组的拣重文件,该历史话单包括所述的话单块中所反映的话单结束日期前后至少1天的有关拣重文件;所述的步骤B中,所述的拣重后的话单块无对应的按主叫号码与日期分组的拣重文件,则创建相应的拣重文件;所述的历史话单包括所述的话单块中所反映的话单结束日期前后3天的有关拣重文件。
本发明采用如下具体控制步骤步骤一将计时话单文件按号码规则进行分割,对分块计时话单进行并发的后续拣重处理;步骤二对分块后文件内计时话单进行话单排序,排序后的话单按主叫号码、通话开始时间、通话结束时间等排序条件进行排列,排序条件与拣重条件有关;步骤三对文件内的计时话单进行遍历;步骤四每张话单与上一张正常话单比较是否是重复话单,拣出文件内所有重单;
步骤五文件内的正常话单按分割条件,即号码分组与话单结束日期的不同,进入相应的话单块中;步骤六按日期顺序取一个文件块,并加载拣重文件中与其对应日期范围与号码组的历史话单;步骤七对话单块中的话单进行遍历;步骤八将话单块中取出的单张话单与历史话单进行比较,判断是否是重复话单,若是则进行入重单流程,否则进入正常话单流程,并写入拣重文件内作为已拣重的历史话单,步骤八转步骤六,直到所有话单块拣重完毕。
本发明的有益效果为在本发明中,结合现有技术中文件内拣重方法和数据库拣重方法的特点,结合话单按规则,如号码进行分割,并将需要加载的数据范围缩小到一个相对小的范围,拣重处理时的处理单位为文件,文件到达系统后,可进行实时的拣重处理,不受电信计费周期性特点限制,做到计时话单随到随拣重,处理过程中加载适当结束日期范围内的相关历史话单,从而确保拣重的准确率,本发明满足计时话单实时拣重要求,又具有很高的拣重准确率与效率,因此,本发明可高效实时地进行话单拣重;所有数据都加载到内存中进行操作,可以进行分任务多线程或多进程并发处理,从而大大提高了拣重处理速度,进一步提高了本发明的实用性。
具体地说,本发明具有如下有益效果一、本发明不仅仅是在话单文件范围内进行话单拣重,还进行相对的所有话单文件范围的话单拣重,从而保证拣重范围的最大化,可以极大提高拣重准确率,其准确率可达到100%。
二、本发明应用多项技术,使得计时话单拣重处理具有很高的效率,可以达到传统拣重方法的3~20倍。
三、本发明满足计时话单文件实时拣重要求。
四、本发明的计时话单拣重效率与准确率不受计时话单实时性处理要求的影响,也不受历史话单大量积累的影响,具有高稳定性。


图1为本发明拣重数据流示意图;图2为本发明中拣重时与历史话单进行比较的示意图;图3为具体操作实例流程示意图。
具体实施例方式
下面根据附图和实施例对本发明作进一步详细说明根据图1和图2,本发明采用如下方法A.如图1所示,话单文件按号码规则对文件进行分块,如按主叫号码、话单通话开始时间、话单通话结束时间进行排列,在各相应的分块数据的话单文件内进行话单拣重,在实际处理中,采用操作系统多线程并发处理方式,对各分块数据的话单文件进行并发的拣重处理,话单文件的大小不大于20MB,话单经拣重后,非重复话单放入相应的正常话单缓冲区,正常话单缓冲区按话单结束时间进行设置分组。
B.如图1所示,分块数据的话单文件经拣重处理后,在正常话单缓冲区中的数据按主叫号码和话单结束日期进行分组产生话单块,所产生的话单块中的话单在相应的历史话单中进行文件间拣重,拣重后的话单块写入拣重文件中,得到正常话单文件,且写入的拣重文件可作为下一次拣重处理的历史话单,历史话单为相应的按主叫号码和话单结束日期分组的拣重文件,该历史话单包括所述的话单块中所反映的话单结束日期前后至少1天的有关拣重文件。
在本发明中,拣重过程的数据流反映为如图1所示的具体控制步骤步骤一将计时话单文件按号码规则进行分割,对分块计时话单进行并发的后续拣重处理。
步骤二对分块后文件内计时话单进行话单排序,排序后的话单按主叫号码(升序)、通话开始时间(升序)、通话结束时间(降序)等排序条件进行排列,排序条件与拣重条件有关;步骤三对文件内的计时话单进行遍历;步骤四每张话单与上一张正常话单比较是否是重复话单,拣出文件内所有重单;步骤五文件内的正常话单按分割条件,即号码分组与话单结束日期的不同,进入相应的话单块中;步骤六按日期顺序取一个文件块,并加载拣重文件中与其对应日期范围与号码组的历史话单;步骤七对话单块中的话单进行遍历;步骤八将话单块中取出的单张话单与历史话单进行比较,判断是否是重复话单,若是则进行入重单流程,否则进入正常话单流程,并写入拣重文件内作为已拣重的历史话单,步骤八转步骤六,直到所有话单块拣重完毕。
在实时计费处理过程中,话单文件经过排序、遍历、比较后,可以拣出文件内所有重单,但是文件内正常话单的重单可能分布在其它文件中,而话单文件到达时间是随机的,包含有与其内话单重复的话单的其它文件可能已经计费或还未到达,本发明为实现话单文件实时拣重过程中与历史话单进行拣重,处理过程中实时加载历史话单到内存中与经过文件内拣重的正常话单进行拣重比较,并按照先计费为正常话单的原则进行处理。为保证拣重效率,加载历史话单只取一定日期范围内的历史话单进行比较,只要日期范围足够大,就可以使拣重达到处理准确率100%。
从图2可以得出当且仅当存在话单,其时长跨越n天范围的情况下,与其结束日期相隔n天且不在一个文件内进行拣重处理的重复话单不能拣出,但只要扩大历史话单范围为n+1,则可以将其拣出。
由于目前大多数交换机考虑到反欺诈的需要,在一次通话超过数小时时,对话单进行分割,并且时长跨跃两天以上的通话极少出现,所以一般n的取值为1-2即可,取值为3可进一步保证精确度,如图2所示,话单C在文件间拣重时被判别为重复话单,而话单D为正常话单。
如下为一具体操作实例如图3所示,1、在话单文件拣重处理前进行分拣过程中,根据号码分组将较大的话单文件分成若干个小文件,这样,拣重处理时每个话单文件大小一般不超过20MB,每个文件内的话单都属于一个特定的号码分组,可以假定其中一个文件F1,文件F1属于号码分组G1。
2、在拣重前对话单文件进行话单排序,文件F1在排序后话单按主叫号码升序、话单通话开始时间升序、话单通话结束时间降序进行排列,得到如表1所示的话单序列

表13、对文件F1进行遍历,先取第一条话单作为正常话单T0,再取下一条话单T1与上一张正常话单T0进行比较,若T1为重单,则T1进入重复话单流程,否则,将T0放入正常话单缓冲区,T1替代T0作为下一条话单的比较话单。以此反复处理,到最后,将最后一张T0话单作为正常话单放入正常话单缓冲区,以上将文件内重单全部分拣出,正常话单缓冲区按话单结束时间进行组织,每张正常话单放入缓冲区前确定要放入的缓冲区区域。
4、将话单缓冲区按话单结束日期进行分割,得到话单块B1-Bn,每个块只包含F1内结束日期属于同一天的话单数据;5、按日期顺序对每块话单进行文件间拣重。即装载按Bn与本文件F1相同分组并与Bn日期信息前后3天范围的拣重文件内已处理的历史话单,其中重复部分则不必再进行装载。
6、遍历Bn中的每张话单Tn,若找到重单,则话单Tn作为重单进入重单流程;否则,将话单Tn按日期与号码分组写入拣重文件中,若相应的拣重文件不存在,则创建这个文件,再写入话单Tn,并将话单Tn输出到正常话单流程。
权利要求
1.一种话单拣重方法,其特征在于它采用如下实施步骤A.对计时话单文件按规则进行分块,在各相应的分块数据的话单文件内进行话单拣重;B.分块数据的话单文件经拣重处理后,按规则产生话单块,所产生的话单块中的话单在相应的历史话单中进行文件间拣重,拣重后的话单块写入拣重文件中,得到正常话单文件,且写入的拣重文件可作为下一次拣重处理的历史话单。
2.根据权利要求1所述的话单拣重方法,其特征在于所述的步骤A中,计时话单文件按号码规则对文件进行分块。
3.根据权利要求2所述的话单拣重方法,其特征在于所述的步骤A中,所述的计时话单文件按主叫号码、话单通话开始时间、话单通话结束时间进行排列。
4.根据权利要求1或2或3所述的话单拣重方法,其特征在于所述的步骤A中,采用操作系统多线程并发处理方式,对各分块数据的话单文件进行并发的拣重处理。
5.根据权利要求4所述的话单拣重方法,其特征在于所述的话单文件的大小小于或等于20MB。
6.根据权利要求4所述的话单拣重方法,其特征在于所述话单文件的话单经拣重后,非重复话单放入相应的正常话单缓冲区。
7.根据权利要求6所述的话单拣重方法,其特征在于所述的正常话单缓冲区按话单结束时间进行设置分组。
8.根据权利要求1所述的话单拣重方法,其特征在于所述的步骤B中,所述的分块数据的话单文件经拣重处理后,按主叫号码和话单结束日期进行分组产生话单块。
9.根据权利要求1或8所述的话单拣重方法,其特征在于所述的步骤B中,所述的历史话单为相应的按主叫号码和话单结束日期分组的拣重文件,该历史话单包括所述的话单块中所反映的话单结束日期前后至少1天的有关拣重文件。
10.根据权利要求9所述的话单拣重方法,其特征在于所述的步骤B中,所述的拣重后的话单块无对应的按主叫号码与日期分组的拣重文件,则创建相应的拣重文件。
11.根据权利要求9所述的话单拣重方法,其特征在于所述的历史话单包括所述的话单块中所反映的话单结束日期前后3天的有关拣重文件。
12.根据权利要求1或2或3或8所述的话单拣重方法,其特征在于它采用如下具体控制步骤步骤一将计时话单文件按号码规则进行分割,对分块计时话单进行并发的后续拣重处理;步骤二对分块后文件内计时话单进行话单排序,排序后的话单按主叫号码、通话开始时间、通话结束时间等排序条件进行排列;步骤三对文件内的计时话单进行遍历;步骤四每张话单与上一张正常话单比较是否是重复话单,拣出文件内所有重单;步骤五文件内的正常话单按分割条件,即号码分组与话单结束日期的不同,进入相应的话单块中;步骤六按日期顺序取一个文件块,并加载拣重文件中与其对应日期范围与号码组的历史话单;步骤七对话单块中的话单进行遍历;步骤八将话单块中取出的单张话单与历史话单进行比较,判断是否是重复话单,若是则进行入重单流程,否则进入正常话单流程,并写入拣重文件内作为已拣重的历史话单,步骤八转步骤六,直到所有话单块拣重完毕。
全文摘要
一种涉及电通信技术的话单拣重方法,其特征在于它采用如下方法对计时话单文件按规则进行分块,在各相应的分块数据的话单文件内进行话单拣重,分块数据的话单文件经拣重处理后,按规则产生话单块,所产生的话单块中的话单在相应的历史话单中进行文件间拣重,拣重后的话单块写入拣重文件中,得到正常话单文件,且写入的拣重文件可作为下一次拣重处理的历史话单;计时话单文件按号码规则如主叫号码、话单通话开始时间、话单通话结束时间对文件进行分块;分块数据的话单文件经拣重处理后,按主叫号码和话单结束日期进行分组产生话单块,本发明可高效实时地进行话单拣重。
文档编号H04L12/24GK1525689SQ03115608
公开日2004年9月1日 申请日期2003年2月24日 优先权日2003年2月24日
发明者张煌勤 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1