号码处理方法及装置、电子设备、计算机可读存储介质与流程

文档序号:28862152发布日期:2022-02-12 01:19阅读:40来源:国知局
号码处理方法及装置、电子设备、计算机可读存储介质与流程

1.本技术涉及号码处理技术领域,具体而言,涉及一种号码处理方法、号码处理装置、电子设备以及计算机可读存储介质。


背景技术:

2.相关技术中对于电话号码的识别,通常是由用户接听后进行人为标记,当电话号码被多个用户同时标记时,则该电话号码被识别为不可靠的电话号码,例如识别为骗取他人财产的电话号码。但是,相关技术中通过人为标记的识别不可靠的电话号码的方式识别效率较低,例如对于新出来的不可靠的电话号码,其在最开始并不会被标记,其需要多个用户同时标记才能最终被识别为不可靠的电话号码,同时通过人为标记的识别不可靠的电话号码的方式识别准确率也较低,其可能导致普通的电话号码如销售类的电话号码被错误标记为不可靠的电话号码等。
3.由此,如何提升号码识别的效率和准确率是亟待解决的问题。


技术实现要素:

4.为解决上述技术问题,本技术的实施例提供了一种号码处理方法及装置、电子设备、计算机可读存储介质,进而至少在一定程度上可以提升号码识别的效率和准确率。
5.根据本技术实施例的一个方面,提供了一种号码处理方法,所述方法包括:根据多个待识别号码的基础属性信息,从所述多个待识别号码中确定出初始识别号码;其中,所述基础属性信息表征和待识别号码的账号相关联的信息;根据所述初始识别号码的位置信息集合中含有的多个位置信息,从所述初始识别号码中确定出疑似号码;其中,所述位置信息表征对初始识别号码在使用过程中进行定位所得到的信息;根据所述疑似号码的通话数据,从所述疑似号码中确定出含有特征信息的目标号码。
6.根据本技术实施例的一个方面,提供了一种号码处理装置,所述装置包括:第一确定模块,配置为根据多个待识别号码的基础属性信息,从所述多个待识别号码中确定出初始识别号码;其中,所述基础属性信息表征和待识别号码的账号相关联的信息;第二确定模块,配置为根据所述初始识别号码的位置信息集合中含有的多个位置信息,从所述初始识别号码中确定出疑似号码;其中,所述位置信息表征对初始识别号码在使用过程中进行定位所得到的信息;第三确定模块,配置为根据所述疑似号码的通话数据,从所述疑似号码中确定出含有特征信息的目标号码。
7.根据本技术实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如前所述的号码处理方法。
8.根据本技术实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行如前所述的号码处理方法。
9.根据本技术实施例的一个方面,提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现如前所述的号码处理方法。
10.在本技术的实施例所提供的技术方案中,一方面,通过多种数据自动来进行待识别号码的识别以得到目标号码,这样无需再由用户进行标记以得到目标号码,能够在一定程度上提升号码识别的效率,避免了只有多个用户同时进行标记才能得到目标号码的现象;另一方面,通过基础属性数据、位置信息数据以及通话信息数据这三类数据共同来进行待识别号码的识别以得到目标号码,结合的数据类型以及数据量较多,能够在一定程度上提升号码识别的准确率,避免了由用户进行标记所带来的标记失误的现象。
11.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
12.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
13.图1是可以应用本技术实施例的技术方案的示例性实施环境的示意图;
14.图2是本技术的一示例性实施例示出的号码处理方法的流程图;
15.图3是图2所示实施例中的步骤s210在一示例性实施例中的流程图;
16.图4是图2所示实施例中的步骤s210在一示例性实施例中的流程图;
17.图5是图2所示实施例中的步骤s220在一示例性实施例中的流程图;
18.图6是图2所示实施例中的步骤s220在一示例性实施例中的流程图;
19.图7是图2所示实施例中的步骤s230在一示例性实施例中的流程图;
20.图8是本技术的一示例性实施例示出的号码处理方法的流程图;
21.图9是本技术的一示例性实施例示出的号码处理方法的流程图;
22.图10是本技术的一示例性实施例示出的号码处理装置的结构示意图;
23.图11示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
具体实施方式
24.这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
25.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
26.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
27.还需要说明的是:在本技术中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
28.相关技术中对于电话号码的识别,通常是由用户接听后进行人为标记,当电话号码被多个用户同时标记时,则该电话号码被识别为不可靠的电话号码,例如识别为骗取他人财产的电话号码。但是,相关技术中通过人为标记的识别不可靠的电话号码的方式识别效率较低,例如对于新出来的不可靠的电话号码,其在最开始并不会被标记,其需要多个用户同时标记才能最终被识别为不可靠的电话号码,同时通过人为标记的识别不可靠的电话号码的方式识别准确率也较低,其可能导致普通的电话号码如销售类的电话号码被错误标记为不可靠的电话号码等。
29.基于此,本技术的实施例提供了一种号码处理方法及装置、电子设备、计算机可读存储介质,可以号码识别的效率和准确率。
30.请参阅图1,图1是本技术一种示例性实施环境的示意图。该实施环境中包括终端设备110和服务器120,终端设备110和服务器120之间通过有线或者无线网络进行通信。
31.应该理解,图1中的终端设备110和服务器120的数目仅仅是示意性的。根据实际需要,可以具有任意数目的终端设备110和服务器120。
32.其中,终端设备110可以是任意具有用户输入接口的电子设备,包括但不限于智能手机、平板、笔记本电脑、计算机等等,其中,用户输入接口包括但不限于触摸屏、键盘、物理按键、音频拾取装置等。
33.其中,服务器120可以是提供各种服务的服务器,其可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器,本处不对此进行限制。
34.在本技术的一些实施例中,号码处理方法可以由服务器120执行,相应地,号码处理装置配置于服务器120中。其中,多个终端设备110可以分别向服务器120发送各自待识别号码的基础属性信息,进而服务器120根据接收到的多个待识别号码的基础属性信息,从多个待识别号码中确定出初始识别号码,其中,基础属性信息表征和待识别号码的账号相关联的信息;之后,根据初始识别号码的位置信息集合中含有的多个位置信息,从初始识别号码中确定出疑似号码,其中,位置信息表征对初始识别号码在使用过程中进行定位所得到的信息;之后,根据疑似号码的通话数据,从疑似号码中确定出含有特征信息的目标号码。
35.在本技术的一些实施例中,终端设备110也可以具有与服务器120相似的功能,从而执行本技术实施例提供的号码处理方法,请参见前述介绍。
36.以下对本技术实施例的技术方案的各种实现细节进行详细阐述:
37.请参阅图2,图2是本技术的一个实施例示出的号码处理方法的流程图。该方法可以应用于图1所示的实施环境中,并由图1所示实施环境中的服务器120执行。如图2所示,号码处理方法至少包括步骤s210至步骤s230,详细介绍如下:
38.步骤s210,根据多个待识别号码的基础属性信息,从多个待识别号码中确定出初始识别号码;其中,基础属性信息表征和待识别号码的账号相关联的信息。
39.本技术实施例中待识别号码指的是等待识别的电话号码;例如当前有100个电话号码待识别,则这100个电话号码则称之为待识别号码。
40.本技术实施例中基础属性信息指的是和待识别号码的账号相关联的信息;其中,通常一个电话号码对应一个账号,每个账号在创建后,可以对应有与电话号码所匹配的账号相关联的信息。
41.可以理解的是,从多个待识别号码中确定出的初始识别号码的数量为任意个,其中,如果未确定出初始识别号码,即确定出零个初始识别号码,则结束流程,如果确定出初始识别号码,即确定出一个或多个(两个及两个以上)初始识别号码,则执行下述步骤s220。
42.在本技术的一个实施例中,基础属性信息包括但不限于费用信息、入网时长信息。其中,费用信息包括但不限于预存费用信息和消费费用信息中的至少一种,即费用信息可以包括预存费用信息和消费费用信息中的任意一种或多种。在实际应用中,基础属性信息还可以包括其他信息,可以根据具体应用场景进行灵活调整。
43.可选实施例中预存费用信息指的是电话号码在使用过程中,用户可以向该电话号码对应的账号中进行充值以用于后期进行套餐费用、套餐外费用以及宽带费用等的扣除,其中所充值的金额则称之为预存费用信息。
44.可选实施例中消费费用信息指的是电话号码在使用过程中,用户在每月/季度/年实际所消费的金额,其中该消费的金额可以包括套餐费用、套餐外费用以及宽带费用等,所消费的金额则称之为消费费用信息。可选地,消费费用信息可以指代最低消费费用信息,即电话号码所对应的最低消费金额,其中最低消费金额通常是指套餐费用。
45.可以理解的是,预存费用信息与消费费用信息可以相同,也可以不相同,通常预存费用信息大于或等于消费费用信息;例如用户在月末预先缴纳金额100元(即预存费用信息),而用户每月的固定消费为68元(即消费费用信息),因而在下月初,自动从已有的预存费用信息100元中扣除固定消费68元,此时该电话号码对应的账户中剩余32元。
46.可选实施例中入网时长信息指的是从用户通过身份信息为该电话号码进行注册之日起算到当前时间的总时长;例如用户在2018年10月1日在电信营业厅用身份证办理了一张电话卡,当前时间为2021年11月1日,则该电话卡对应的电话号码的入网时长为3年零1个月。
47.在本技术的一个实施例中,请参阅图3,基础属性信息包括费用信息时,步骤s210中根据多个待识别号码的基础属性信息,从多个待识别号码中确定出初始识别号码的过程,可以包括步骤s310至步骤s320,详细介绍如下:
48.步骤s310,从多个待识别号码各自对应的账号信息中获取各个待识别号码的费用信息;
49.步骤s320,根据各个待识别号码的费用信息,从多个待识别号码中确定出费用信息小于预设费用阈值的待识别号码,将费用信息小于预设费用阈值的待识别号码作为初始识别号码。
50.也即,可选实施例中先从多个待识别号码各自对应的账号信息中获取到各个待识别号码的费用信息,之后,根据各个待识别号码的费用信息,从多个待识别号码中确定出费用信息小于预设费用阈值的待识别号码,此时费用信息小于预设费用阈值的待识别号码即为初始识别号码。
51.可以理解的是,由于每个电话号码都对应有一个账号,因此可以在待识别号码对应的账号信息中去获取待识别号码的相关信息,例如待识别号码的费用信息(可以是如前的预存费用信息和/或消费费用信息),然后再从多个待识别号码中进行筛选,筛选出费用信息小于预设费用阈值的待识别号码作为初始识别号码。在实际应用中,预设费用阈值可以根据具体应用场景进行灵活设置。
52.举例说明,例如设获取到的4个待识别号码在最近一个月的预存费用信息如下表1所示,同时设预设预存费用阈值为18元,可见,待识别号码18263396541与18263396544的预存费用信息均小于18元,则从这4个待识别号码中筛选出待识别号码18263396541与18263396544作为初始识别号码。
53.举例说明,例如设获取到的4个待识别号码在最近一个月的最低消费费用信息如下表1所示,同时设预设最低消费阈值为20元,可见,待识别号码18263396541与18263396544的最低消费信息均小于20元,则从这4个待识别号码中筛选出待识别号码18263396541与18263396544作为初始识别号码。
54.待识别号码预存费用信息最低消费费用信息182633965410018263396542100301826339654350401826339654400
55.表1
56.可以理解的是,当费用信息包括预存费用信息和消费费用信息时,可以是只要其中一个满足小于预设费用阈值(即前述示例中预存费用信息小于预设预存费用阈值,或者消费费用信息小于预设最低消费阈值),就可以将其对应的待识别号码作为初始识别号码;或者可以是当两个均满足小于预设费用阈值(即前述示例中预存费用信息小于预设预存费用阈值,且消费费用信息小于预设最低消费阈值),才将其对应的待识别号码作为初始识别号码。其中,通常预存费用信息低的电话号码,其对应的消费费用信息也较低,在实际应用中,可以根据具体应用场景进行灵活调整。
57.在本技术的一个实施例中,请参阅图4,基础属性信息包括入网时长信息时,步骤s210中根据多个待识别号码的基础属性信息,从多个待识别号码中确定出初始识别号码的过程,可以包括步骤s410至步骤s420,详细介绍如下:
58.步骤s410,从多个待识别号码各自对应的账号信息中获取各个待识别号码的入网时长信息;
59.步骤s420,根据各个待识别号码的入网时长信息,从多个待识别号码中确定出入网时长信息小于预设入网时长阈值的待识别号码,将入网时长信息小于预设入网时长阈值的待识别号码作为初始识别号码。
60.也即,可选实施例中先从多个待识别号码各自对应的账号信息中获取到各个待识别号码的入网时长信息,之后,根据各个待识别号码的入网时长信息,从多个待识别号码中确定出入网时长信息小于预设入网时长阈值的待识别号码,此时入网时长信息小于预设入网时长阈值的待识别号码即为初始识别号码。
61.可以理解的是,由于每个电话号码都对应有一个账号,因此可以在待识别号码对
应的账号信息中去获取待识别号码的相关信息,例如待识别号码的入网时长信息,然后再从多个待识别号码中进行筛选,筛选出入网时长信息小于预设入网时长阈值的待识别号码作为初始识别号码。在实际应用中,预设入网时长阈值可以根据具体应用场景进行灵活设置。
62.举例说明,例如设获取到的4个待识别号码的入网时长信息如下表2所示,同时设预设入网时长阈值为15天,可见,待识别号码18263396541与18263396544的入网时长信息均小于15天,则从这4个待识别号码中筛选出待识别号码18263396541与18263396544作为初始识别号码。
63.待识别号码入网时长信息1826339654151826339654260182633965431201826339654410
64.表2
65.可以理解的是,当基础属性信息包括费用信息和入网时长信息时,可以是只要其中一个满足小于预设阈值(即前述示例中费用信息小于预设费用阈值,或者入网时长信息小于预设入网时长阈值),就可以将其对应的待识别号码作为初始识别号码;或者可以是当两个均满足小于预设阈值(即前述示例中费用信息小于预设费用阈值,且入网时长信息小于预设入网时长阈值),才将其对应的待识别号码作为初始识别号码。其中,通常费用信息低的电话号码,其对应的入网时长也较短,在实际应用中,可以根据具体应用场景进行灵活调整。
66.值得注意的是,前述仅是以基础属性信息包括费用信息、入网时长信息进行初始识别号码的确定,在实际应用中,可以根据具体应用场景进行灵活调整。
67.步骤s220,根据初始识别号码的位置信息集合中含有的多个位置信息,从初始识别号码中确定出疑似号码;其中,位置信息表征对初始识别号码在使用过程中进行定位所得到的信息。
68.本技术实施例中根据多个待识别号码的基础属性信息,从多个待识别号码中确定出初始识别号码之后,便可以根据初始识别号码的位置信息集合中含有的多个位置信息,从初始识别号码中确定出疑似号码。
69.本技术实施例中各个初始识别号码各自对应有位置信息集合,位置信息集合包括多个位置信息,该位置信息是通过定位程序对初始识别号码在使用过程中进行定位所得到的信息,其中定位程序可以是安装在终端设备上的任意程序,例如gps程序。
70.在本技术的一个实施例中,请参阅图5,步骤s220中根据初始识别号码的位置信息集合中含有的多个位置信息,从初始识别号码中确定出疑似号码的过程,可以包括步骤s510至步骤s530,详细介绍如下:
71.步骤s510,根据位置信息集合中的多个位置信息,计算各个位置信息的停留时长;
72.步骤s520,若位置信息集合中存在停留时长大于预设停留时长阈值的位置信息,则对位置信息集合进行标记;
73.步骤s530,从初始识别号码中确定出被标记过的位置信息集合对应的初始识别号
码,将被标记过的位置信息集合对应的初始识别号码作为疑似号码。
74.也即,可选实施例中先根据位置信息集合中的多个位置信息,计算各个位置信息的停留时长,之后,对位置信息集合中含有的多个位置信息的停留时长进行判断,如果位置信息集合中存在至少一个停留时长大于预设停留时长阈值的位置信息,则对位置信息集合进行标记,之后,从初始识别号码中确定出被标记过的位置信息集合对应的初始识别号码,此时被标记过的位置信息集合对应的初始识别号码即为疑似号码。
75.举例说明,设确定出的待识别号码有100个,则分别获取这100个待识别号码对应的位置信息集合,其中,位置信息集合所含有的位置信息可以是最近三天内采集到的;以其中一个待识别号码18263396541确定其是否为疑似号码的过程为例,设获取到的待识别号码18263396541的位置信息集合以及计算出的各个位置信息的停留时长如下表3所示,同时设预设停留时长阈值为12小时,可见,待识别号码18263396541的位置信息集合中存在3个位置信息g1、g2、g3均大于12小时,则将待识别号码18263396541确定为疑似号码。可以理解的是,其余99个待识别号码是否为疑似号码的确定过程类似,类推即可,这里不再赘述。
[0076][0077]
表3
[0078]
在本技术的一个实施例中,请参阅图6,步骤s220中根据初始识别号码的位置信息集合中含有的多个位置信息,从初始识别号码中确定出疑似号码的过程,可以包括步骤s610至步骤s630,详细介绍如下:
[0079]
步骤s610,根据位置信息集合中的多个位置信息,分别计算相邻时刻的两个位置信息之间的距离;
[0080]
步骤s620,若位置信息集合中存在相邻时刻的两个位置信息之间的距离大于预设距离阈值,则对位置信息集合进行标记;
[0081]
步骤s630,从初始识别号码中确定出被标记过的位置信息集合对应的初始识别号码,将被标记过的位置信息集合对应的初始识别号码作为疑似号码。
[0082]
也即,可选实施例中先根据位置信息集合中的多个位置信息,分别计算相邻时刻的两个位置信息之间的距离,之后,对位置信息集合中含有的相邻时刻的两个位置信息之间的距离进行判断,如果位置信息集合中存在至少一个相邻时刻的两个位置信息之间的距离大于预设距离阈值,则对位置信息集合进行标记,之后,从初始识别号码中确定出被标记过的位置信息集合对应的初始识别号码,此时被标记过的位置信息集合对应的初始识别号码即为疑似号码。
[0083]
举例说明,设确定出的待识别号码有100个,则分别获取这100个待识别号码对应的位置信息集合,其中,位置信息集合所含有的位置信息可以是最近三天内采集到的;以其中一个待识别号码18263396541确定其是否为疑似号码的过程为例,设获取到的待识别号码18263396541的位置信息集合以及计算出的相邻时刻的两个位置信息之间的距离如下表4所示,同时设预设距离阈值为500公里,可见,待识别号码18263396541的位置信息集合中
相邻时刻的位置信息g1与g2、g2与g3之间的距离均大于500公里,则将待识别号码18263396541确定为疑似号码。可以理解的是,其余99个待识别号码是否为疑似号码的确定过程类似,类推即可,这里不再赘述。
[0084][0085][0086]
表4
[0087]
可以理解的是,前述介绍的根据初始识别号码的位置信息集合中含有的多个位置信息,从初始识别号码中确定出疑似号码的两种方式可以结合,其中,可以是只要其中一个满足标记条件(即前述示例中位置信息集合中存在停留时长大于预设停留时长阈值的位置信息,或者位置信息集合中存在相邻时刻的两个位置信息之间的距离大于预设距离阈值),就可以对位置信息集合进行标记,并将标记过的位置信息集合对应的初始识别号码作为疑似号码;或者可以是当两个均满足标记条件(即前述示例中位置信息集合中存在停留时长大于预设停留时长阈值的位置信息,且位置信息集合中存在相邻时刻的两个位置信息之间的距离大于预设距离阈值),才对位置信息集合进行标记,并将标记过的位置信息集合对应的初始识别号码作为疑似号码。
[0088]
值得注意的是,前述仅是根据初始识别号码的位置信息集合中含有的多个位置信息,从初始识别号码中确定出疑似号码的两种方式,在实际应用中,可以根据具体应用场景进行灵活调整。
[0089]
步骤s230,根据疑似号码的通话数据,从疑似号码中确定出含有特征信息的目标号码。
[0090]
本技术实施例中根据初始识别号码的位置信息集合中含有的多个位置信息,从初始识别号码中确定出疑似号码之后,便可以根据疑似号码的通话数据,从疑似号码中确定出含有特征信息的目标号码。
[0091]
本技术实施例中特征信息指的是某一方面所涉及的相关信息,例如要识别出的电话号码为骗取他人财产的电话号码,因此,特征信息可以是和金融相关的特征词如“转账”、“红包”、“金额”、“金钱”、“费用”、“消费”、“银行”等,或者特征信息是和法律相关的特征词如“公安局”、“法院”、“传票”等。
[0092]
在本技术的一个实施例中,请参阅图7,步骤s230中根据疑似号码的通话数据,从疑似号码中确定出含有特征信息的目标号码的过程,可以包括步骤s710至步骤s720,详细介绍如下:
[0093]
步骤s710,对疑似号码的通话数据进行语音识别,得到疑似号码的语音识别结果;
[0094]
步骤s720,从疑似号码中确定出语音识别结果中含有特征信息的疑似号码,将语音识别结果中含有特征信息的疑似号码作为目标号码。
[0095]
也即,可选实施例中先对对疑似号码的通话数据进行语音识别,得到疑似号码的语音识别结果,之后,从疑似号码中确定出语音识别结果中含有特征信息的疑似号码,此时
语音识别结果中含有特征信息的疑似号码即为目标号码。
[0096]
其中,可选实施例中对疑似号码的通话数据进行语音识别,可以采用现有的语音识别引擎,或者可以采用独立训练得到的语音识别模型,在实际应用中,可以根据具体应用场景进行灵活调整。
[0097]
在本技术的一个实施例中,根据初始识别号码的位置信息集合中含有的多个位置信息,从初始识别号码中确定出疑似号码之后,还可以从确定出疑似号码进行筛选,例如可以通过通话时长信息对疑似号码进行筛选,进而对筛选后的疑似号码进行语音识别以得到语音识别结果;这样对疑似号码进行筛选后再进行语音识别,可以减少系统资源消耗,提升号码处理效率。
[0098]
在本技术的一个实施例中,请参阅图8,在步骤s230根据疑似号码的通话数据,从疑似号码中确定出含有特征信息的目标号码的过程之后,可以包括步骤s810至步骤s820,详细介绍如下:
[0099]
步骤s810,统计目标号码,以生成包含有目标号码的预设格式的文件;
[0100]
步骤s820,根据文件中含有的目标号码向预设终端发送预警信息以进行号码预警。
[0101]
也即,可选实施例中在根据疑似号码的通话数据,从疑似号码中确定出含有特征信息的目标号码,之后,统计目标号码以生成包含有目标号码的预设格式的文件,之后,再根据文件中含有的目标号码向预设终端发送预警信息以进行号码预警。
[0102]
其中,可选实施例中预设格式的文件包括但不限于ascii、mime、.txt等格式的文件。可以理解的是,ascii标准使得只含有ascii字符的文本文件可以在unix、macintosh、microsoft windows、dos和其它操作系统之间自由交互;文本文件在mime标准中的类型为“text/plain”,通常还附加编码的信息;.txt是包含极少格式信息的文字文件的扩展名,.txt格式并没有明确的定义,它通常是指那些能够被终端设备或者简单的文本编辑器接受的格式。
[0103]
可选实施例中通过统计确定出的目标号码并生成包含有目标号码的预设格式的文件,这样就可以根据文件中含有的目标号码向预设终端发送预警信息以进行号码预警或者用于其他用途,简单便捷。
[0104]
本技术实施例中通过多种数据自动来进行待识别号码的识别以得到目标号码,这样无需再由用户进行标记以得到目标号码,提升了号码识别的效率,同时由于结合了多种类型的数据如基础属性数据、位置信息数据以及通话信息数据共同来进行待识别号码的识别以得到目标号码,提升了号码识别的准确率。
[0105]
以下对本技术实施例的一个具体应用场景进行详细说明:
[0106]
请参阅图9,图9是本技术的一个实施例示出的号码处理方法的流程图。如图9所示,号码处理方法至少包括步骤s910至步骤s980,详细介绍如下:
[0107]
步骤s910,根据多个待识别号码的基础属性信息,从多个待识别号码中确定出初始识别号码;其中,基础属性信息表征和待识别号码的账号相关联的信息。
[0108]
可选地,基础属性信息包括入网时长信息和费用信息,费用信息包括预存费用信息和消费费用信息。
[0109]
首先,根据多个待识别号码的入网时长信息,从多个待识别号码中筛选出入网时
长信息小于预设入网时长阈值的待识别号码;例如从多个待识别号码中筛选出入网时长信息小于30天的待识别号码。
[0110]
其次,根据筛选出的多个待识别号码在一个月内的预存费用信息以及消费费用信息,从多个待识别号码中确定出预存费用信息小于预设预存费用阈值,以及消费费用信息小于预设最低消费阈值的待识别号码,并将该确定出的待识别号码作为初始识别号码。
[0111]
举例说明,例如设筛选出入网时长信息小于30天的待识别号码如下表5所示,同时设预设预存费用阈值为18元,预设最低消费阈值为20元,可见,可以确定出待识别号码18263396541与18263396544为初始识别号码。
[0112]
待识别号码预存费用信息最低消费费用信息入网时长信息1826339654100101826339654210030251826339654350405018263396544005
[0113]
表5
[0114]
步骤s920,根据位置信息集合中的多个位置信息,计算各个位置信息的停留时长。
[0115]
承接前述示例,进一步地,根据待识别号码18263396541与18263396544分别对应的位置信息集合中的多个位置信息,计算各个位置信息的停留时长;例如设待识别号码18263396541与18263396544对应的位置信息集合所含有的位置信息,以及计算得到的各个位置信息的停留时长如下表6所示,同时设预设停留时长阈值为12小时,可见,待识别号码18263396541在g1、g2、g3的位置均停留有超过12小时,待识别号码18263396544在g4、g5、g20的位置均停留有超过12小时,并且待识别号码18263396544还存在位置信息跳跃的情况,即从g5跳跃到g20,其中g5与g20之间的距离相隔甚远。
[0116][0117]
表6
[0118]
步骤s930,若位置信息集合中存在停留时长大于预设停留时长阈值的位置信息,则对位置信息集合进行标记。
[0119]
承接上述示例,进一步地,对待识别号码18263396541与18263396544各自对应的位置信息集合进行标记。
[0120]
步骤s940,从初始识别号码中确定出被标记过的位置信息集合对应的初始识别号码,将被标记过的位置信息集合对应的初始识别号码作为疑似号码。
[0121]
承接上述示例,进一步地,确定出待识别号码18263396541与18263396544为疑似
号码。
[0122]
步骤s950,对疑似号码的通话数据进行语音识别,得到疑似号码的语音识别结果。
[0123]
可选地,可以通过预先训练得到的语音识别模型对疑似号码的通话数据进行语音识别,以得到疑似号码的语音识别结果。
[0124]
步骤s960,从疑似号码中确定出语音识别结果中含有特征信息的疑似号码,将语音识别结果中含有特征信息的疑似号码作为目标号码。
[0125]
可选地,可以对获取到的疑似号码进行进一步筛选,例如可以通过通话时长进行筛选;承接上述示例,进一步地,设获取到的识别号码18263396541与18263396544的通话时长信息与语音识别结果如下表7所示,可见,由于疑似号码18263396544的语音识别结果表征含有特征信息,因此,确定出疑似号码18263396544为目标号码。
[0126]
待识别号码通话总时长单次通话总时长语音识别结果1826339654110035未含有特征信息1826339654450060含有特征信息
[0127]
表7
[0128]
步骤s970,统计目标号码,以生成包含有目标号码的预设格式的文件。
[0129]
可以理解的是,前述示例仅是以少量的待识别号码为例,在实际应用中,待识别号码数量通常较多,因此,可以对确定出的目标号码进行统计,并生成含有目标号码的预设格式的文件。
[0130]
步骤s980,根据文件中含有的目标号码向预设终端发送预警信息以进行号码预警。
[0131]
可以理解的是,生成含有目标号码的预设格式的文件之后,便可以根据文件中含有的目标号码向预设终端发送预警信息以进行号码预警。
[0132]
可选地,本技术实施例中具体实施过程可以参照前述实施例的技术方案。
[0133]
本技术实施例中通过多种数据自动来进行待识别号码的识别以得到目标号码,这样无需再由用户进行标记以得到目标号码,提升了号码识别的效率,同时由于结合了多种类型的数据如基础属性数据、位置信息数据以及通话信息数据共同来进行待识别号码的识别以得到目标号码,提升了号码识别的准确率,并且对得到的目标号码进行号码预警,避免了用户财产的损失,保证了用户财产的安全性。
[0134]
图10是本技术的一个实施例示出的号码处理装置的框图。如图10所示,该装置包括:
[0135]
第一确定模块1010,配置为根据多个待识别号码的基础属性信息,从多个待识别号码中确定出初始识别号码;其中,基础属性信息表征和待识别号码的账号相关联的信息;
[0136]
第二确定模块1020,配置为根据初始识别号码的位置信息集合中含有的多个位置信息,从初始识别号码中确定出疑似号码;其中,位置信息表征对初始识别号码在使用过程中进行定位所得到的信息;
[0137]
第三确定模块1030,配置为根据疑似号码的通话数据,从疑似号码中确定出含有特征信息的目标号码。
[0138]
在本技术的一个实施例中,基础属性信息包括费用信息,其中,费用信息包括预存费用信息和消费费用信息中的至少一种;第一确定模块1010包括:
[0139]
第一获取单元,配置为从多个待识别号码各自对应的账号信息中获取各个待识别号码的费用信息;
[0140]
第一确定单元,配置为根据各个待识别号码的费用信息,从多个待识别号码中确定出费用信息小于预设费用阈值的待识别号码,将费用信息小于预设费用阈值的待识别号码作为初始识别号码。
[0141]
在本技术的一个实施例中,基础属性信息包括入网时长信息;第一确定模块1010包括:
[0142]
第二获取单元,配置为从多个待识别号码各自对应的账号信息中获取各个待识别号码的入网时长信息;
[0143]
第二确定单元,配置为根据各个待识别号码的入网时长信息,从多个待识别号码中确定出入网时长信息小于预设入网时长阈值的待识别号码,将入网时长信息小于预设入网时长阈值的待识别号码作为初始识别号码。
[0144]
在本技术的一个实施例中,第二确定模块1020包括:
[0145]
第一计算单元,配置为根据位置信息集合中的多个位置信息,计算各个位置信息的停留时长;
[0146]
第一标记单元,配置为若位置信息集合中存在停留时长大于预设停留时长阈值的位置信息,则对位置信息集合进行标记;
[0147]
第三确定单元,配置为从初始识别号码中确定出被标记过的位置信息集合对应的初始识别号码,将被标记过的位置信息集合对应的初始识别号码作为疑似号码。
[0148]
在本技术的一个实施例中,第二确定模块1020包括:
[0149]
第二计算单元,配置为根据位置信息集合中的多个位置信息,分别计算相邻时刻的两个位置信息之间的距离;
[0150]
第二标记单元,配置为若位置信息集合中存在相邻时刻的两个位置信息之间的距离大于预设距离阈值,则对位置信息集合进行标记;
[0151]
第四确定单元,配置为从初始识别号码中确定出被标记过的位置信息集合对应的初始识别号码,将被标记过的位置信息集合对应的初始识别号码作为疑似号码。
[0152]
在本技术的一个实施例中,第三确定模块1030包括:
[0153]
语音识别单元,配置为对疑似号码的通话数据进行语音识别,得到疑似号码的语音识别结果;
[0154]
第五确定单元,配置为从疑似号码中确定出语音识别结果中含有特征信息的疑似号码,将语音识别结果中含有特征信息的疑似号码作为目标号码。
[0155]
在本技术的一个实施例中,该装置还可以包括:
[0156]
生成模块,配置为统计目标号码,以生成包含有目标号码的预设格式的文件;
[0157]
发送模块,配置为根据文件中含有的目标号码向预设终端发送预警信息以进行号码预警。
[0158]
需要说明的是,上述实施例所提供的号码处理装置与前述实施例所提供的号码处理方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,这里不再赘述。
[0159]
本技术的实施例还提供了一种电子设备,包括:一个或多个处理器;存储装置,用
于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得电子设备实现前述各个实施例中提供的号码处理方法。
[0160]
图11示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
[0161]
需要说明的是,图11示出的电子设备的计算机系统1100仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
[0162]
如图11所示,计算机系统1100包括中央处理单元(central processing unit,cpu)1101,其可以根据存储在只读存储器(read-only memory,rom)1102中的程序或者从储存部分1108加载到随机访问存储器(random access memory,ram)1103中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在ram 1103中,还存储有系统操作所需的各种程序和数据。cpu 1101、rom 1102以及ram 1103通过总线1104彼此相连。输入/输出(input/output,i/o)接口1105也连接至总线1104。
[0163]
以下部件连接至i/o接口1105:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分1107;包括硬盘等的储存部分1108;以及包括诸如lan(local area network,局域网)卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至i/o接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入储存部分1108。
[0164]
特别地,根据本技术的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被中央处理单元(cpu)1101执行时,执行本技术的系统中限定的各种功能。
[0165]
需要说明的是,本技术实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compact disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
[0166]
附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0167]
描述于本技术实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
[0168]
本技术的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前的号码处理方法和/或模型训练方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
[0169]
本技术的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的号码处理方法和/或模型训练方法。
[0170]
上述内容,仅为本技术的较佳示例性实施例,并非用于限制本技术的实施方案,本领域普通技术人员根据本技术的主要构思和精神,可以十分方便地进行相应的变通或修改,故本技术的保护范围应以权利要求书所要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1