基于通信网络的电话号码黑名单建立方法及装置与流程

文档序号:14450946阅读:321来源:国知局
本发明涉及通信领域,具体涉及一种基于通信网络的电话号码黑名单建立方法及装置。
背景技术
:目前,金融贷款业务发展迅速,尤其是短期小额贷款业务,由于额度较小,不需要担保、抵押,手续简便,可以很快发放贷款,对于贷款用户来说可以方便快速的得到款项,解决用户需求。对于金融平台来说,其放贷的额度较小,理论上贷款用户具备了还款能力,单个贷款用户的信用判断偏向于贷款用户的还款意愿程度。但当贷款用户其实为欺诈用户时,金额贷款风控的关键在于检测出具有欺诈历史的用户,不对这些用户放款。现有技术在检测贷款用户是否为欺诈用户时,一般通过获取贷款用户的通讯录信息,得到手机号码与手机号码之间直接的通信联系,根据通信联系判断贷款用户是否为可能的欺诈用户。获取贷款用户通讯录信息会涉及贷款用户的隐私信息,因此,需要一种在保护用户隐私的前提下,基于通信网络对用户进行判断,建立电话号码黑名单,以更好的识别用户的方法。技术实现要素:鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于通信网络的电话号码黑名单建立方法及装置。根据本发明的一个方面,提供了一种基于通信网络的电话号码黑名单建立方法,其包括:通过收集用户设备的imei以及其对应的通话记录,建立电话号码与imei的第一对应关系;其中,第一对应关系具体为一个电话号码与n个imei的对应关系,n大于或等于1;根据imei的数个维度的属性信息对imei进行评分,根据评分结果得到电话号码的统计特征;根据电话号码与imei的第一对应关系,得到电话号码之间的第二对应关系;其中,第二对应关系具体为一个电话号码与m个电话号码的对应关系,m大于或等于1;根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分;根据所有电话号码的评分建立电话号码黑名单。可选地,通过收集用户设备的imei以及其对应的通话记录,建立电话号码与imei的第一对应关系进一步包括:收集用户设备的imei;根据用户设备的imei,收集用户设备的通话记录,得到与用户设备产生来电和/或去电的电话号码,建立imei和与用户设备产生来电和/或去电的电话号码之间的第三对应关系;其中,第三对应关系具体为一个imei与d个电话号码的对应关系,d大于或等于1;根据第三对应关系,建立电话号码与imei的第一对应关系。可选地,方法还包括:收集imei的数个维度的属性信息;其中,imei的数个维度的属性信息包括以下至少一个维度的属性信息:imei对应的用户设备中的用户行为信息;imei对应的用户设备中已安装的应用列表信息;imei是否属于imei黑名单的信息。可选地,根据电话号码与imei的第一对应关系,得到电话号码之间的第二对应关系进一步包括:采集imei对应的用户设备所使用的电话号码,从中提取出具有一一对应关系的imei与imei对应的用户设备所使用的电话号码;在第一对应关系中,将imei替换为与其具有一一对应关系的电话号码,得到电话号码之间的第二对应关系。可选地,方法还包括:通过收集电话号码间的通话记录,进一步得到电话号码之间的第二对应关系。可选地,方法还包括:从云端数据库获取部分电话号码的标签信息,根据标签信息对部分电话号码进行预标注评分;根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分具体为:利用机器学习算法,将部分电话号码的预标注评分作为学习目标,根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分。可选地,方法还包括:根据具有预标注评分的部分电话号码以及电话号码之间的第二对应关系,将相应的电话号码进行社区划分,将社区划分的结果作为机器学习算法的输入信息。根据本发明的另一方面,提供了一种基于通信网络的电话号码黑名单建立装置,其包括:第一关系模块,适于通过收集用户设备的imei以及其对应的通话记录,建立电话号码与imei的第一对应关系;其中,第一对应关系具体为一个电话号码与n个imei的对应关系,n大于或等于1;第一评分模块,适于根据imei的数个维度的属性信息对imei进行评分,根据评分结果得到电话号码的统计特征;第二关系模块,适于根据电话号码与imei的第一对应关系,得到电话号码之间的第二对应关系;其中,第二对应关系具体为一个电话号码与m个电话号码的对应关系,m大于或等于1;第二评分模块,适于根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分;黑名单模块,适于根据所有电话号码的评分建立电话号码黑名单。可选地,第一关系模块还包括:第一收集单元,适于收集用户设备的imei;第二收集单元,适于根据用户设备的imei,收集用户设备的通话记录,得到与用户设备产生来电和/或去电的电话号码,建立imei和与用户设备产生来电和/或去电的电话号码之间的第三对应关系;其中,第三对应关系具体为一个imei与d个电话号码的对应关系,d大于或等于1;对应单元,适于根据第三对应关系,建立电话号码与imei的第一对应关系。可选地,装置还包括:属性获取模块,适于收集imei的数个维度的属性信息;其中,imei的数个维度的属性信息包括以下至少一个维度的属性信息:imei对应的用户设备中的用户行为信息;imei对应的用户设备中已安装的应用列表信息;imei是否属于imei黑名单的信息。可选地,第二关系模块进一步适于:采集imei对应的用户设备所使用的电话号码,从中提取出具有一一对应关系的imei与imei对应的用户设备所使用的电话号码;在第一对应关系中,将imei替换为与其具有一一对应关系的电话号码,得到电话号码之间的第二对应关系。可选地,装置还包括:通话收集模块,适于通过收集电话号码间的通话记录,进一步得到电话号码之间的第二对应关系。可选地,装置还包括:预标注收集模块,适于从云端数据库获取部分电话号码的标签信息,根据标签信息对部分电话号码进行预标注评分;第二评分模块进一步适于:利用机器学习算法,将部分电话号码的预标注评分作为学习目标,根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分。可选地,方法还包括:社区划分模块,适于根据具有预标注评分的部分电话号码以及电话号码之间的第二对应关系,将相应的电话号码进行社区划分,将社区划分的结果作为机器学习算法的输入信息。根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行上述基于通信网络的电话号码黑名单建立方法对应的操作。根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述基于通信网络的电话号码黑名单建立方法对应的操作。根据本发明提供的基于通信网络的电话号码黑名单建立方法及装置,通过收集用户设备的imei以及其对应的通话记录,建立电话号码与imei的第一对应关系;其中,第一对应关系具体为一个电话号码与n个imei的对应关系,n大于或等于1;根据imei的数个维度的属性信息对imei进行评分,根据评分结果得到电话号码的统计特征;根据电话号码与imei的第一对应关系,得到电话号码之间的第二对应关系;其中,第二对应关系具体为一个电话号码与m个电话号码的对应关系,m大于或等于1;根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分;根据所有电话号码的评分建立电话号码黑名单。本发明在保护用户隐私的情况下,利用收集到的用户设备的imei以及其对应的通话记录,建立电话号码间的各种对应关系。并根据电话号码的统计特征及电话号码间的对应关系进行计算评分,从而得到电话号码黑名单。本发明大大降低了用户隐私信息的暴露率,降低了可能的隐私泄露风险。同时,利用机器学习算法结合电话号码的统计特征进行学习,有效的得到电话号码的评分,方便建立电话号码黑名单。上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本发明一个实施例的基于通信网络的电话号码黑名单建立方法的流程图;图2示出了根据本发明另一个实施例的基于通信网络的电话号码黑名单建立方法的流程图;图3示出了根据本发明一个实施例的基于通信网络的电话号码黑名单建立装置的功能框图;图4示出了根据本发明另一个实施例的基于通信网络的电话号码黑名单建立装置的功能框图;图5示出了根据本发明一个实施例的一种计算设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1示出了根据本发明一个实施例的基于通信网络的电话号码黑名单建立方法的流程图。如图1所示,基于通信网络的电话号码黑名单建立方法具体包括如下步骤:步骤s101,通过收集用户设备的imei以及其对应的通话记录,建立电话号码与imei的第一对应关系。imei(internationalmobileequipmentidentity,国际移动装备辨识码),是由15位数字组成的“电子串号”,它与每台移动用户设备一一对应,而且该码是全世界唯一的。一台移动用户设备对应一个唯一的imei。收集用户设备的imei,并同时收集与该用户设备对应的通话记录,即与该用户设备的imei相关的来电、去电、短信接收、短信发送的通话记录,从而得到与用户设备产生来电和/或去电关系的电话号码。根据用户设备的imei,以及得到的与用户设备产生来电和/或去电关系的电话号码,可以建立imei和与用户设备产生来电和/或去电的电话号码之间的第三对应关系。第三对应关系具体为一个imei与d个电话号码的对应关系,d大于或等于1。根据imei和与imei对应的电话号码,得到如表1所示的数据。具体如表1所示:imei1电话号码1电话号码2……imei2电话号码2电话号码5……imei3电话号码1电话号码3……imei4电话号码4电话号码5…………………………表1第1列为各用户设备的imei,第2列以后各列为与第1列imei对应的用户设备产生来电和/或去电关系的一个或多个电话号码。根据表1的数据可以得到第三对应关系,即imei1:电话号码1,电话号码2,……;imei2:电话号码2,电话号码5,……;imei3:电话号码1,电话号码3,……;imei4:电话号码4,电话号码5,……。第三对应关系是以imei为中心,统计与imei相关的电话号码。根据第三对应关系,可以建立电话号码与imei的第一对应关系。第一对应关系具体为一个电话号码与n个imei的对应关系,n大于或等于1。第一对应关系是以电话号码为中心,统计与电话号码相关的imei。从第三对应关系中以电话号码为中心进行整理,得到如表2的数据。具体如表2所示:电话号码1imei1imei7……电话号码2imei1imei2……电话号码3imei3…………电话号码4imei4…………电话号码5imei2imei4…………………………表2第1列为各电话号码,第2列以后各列为与第1列电话号码对应的用户设备的imei。如表2所示的第一对应关系,即电话号码1:imei1,imei7,……;电话号码2:imei1,imei2,……;电话号码3:imei3,……;电话号码4:imei4,……;电话号码5:imei2,imei4,……。步骤s102,根据imei的数个维度的属性信息对imei进行评分,根据评分结果得到电话号码的统计特征。收集imei的数个维度的属性信息,其中,imei的数个维度的属性信息包括以下至少一个维度的属性信息:imei对应的用户设备中的用户行为信息、imei对应的用户设备中已安装的应用列表信息、imei是否属于imei黑名单的信息(预先根据已经收集的信息建立的imei黑名单)等。如通过收集imei对应的用户设备中用户对各类应用的操作行为信息、用户通话时长、通话频率等行为信息(经常性通话时长较短可能为骚扰他人的行为,每天拨打异常多的电话可能为骚扰他人的行为等)、用户在贷款类应用中注册、申请贷款的行为信息、用户在支付类应用中的信用信息、用户设备安装的贷款类、支付类等应用信息、用户设备安装的某些属于预设黑名单的应用列表(预先收集的如催账类应用、不良小额贷款应用等应用列表)中的应用信息等得到imei的数个维度的属性信息。根据imei的数个维度的属性信息划分imei的分值,对imei进行评分。将第一对应关系中的各imei替换为对应的imei的评分,如imei1的评分为3,imei7的评分为0.5,得到电话号码1:3,0.5,……,即电话号码1的统计特征。根据各imei的评分结果,得到各个电话号码的统计特征。步骤s103,根据电话号码与imei的第一对应关系,得到电话号码之间的第二对应关系。采集imei对应的用户设备所使用的电话号码,从中提取出具有一一对应关系的imei与imei对应的用户设备所使用的电话号码。如用户设备注册时使用的电话号码,且该电话号码不是imei的第三对应关系的电话号码,该电话号码为与imei一一对应的用户设备所使用的电话号码。在第一对应关系中,将imei替换为与其具有一一对应关系的电话号码,得到电话号码之间的第二对应关系。第二对应关系具体为一个电话号码与m个电话号码的对应关系,m大于或等于1。如imei1对应的电话号码为电话号码5,imei7对应的电话号码为电话号码8,电话号码1的第二对应关系为电话号码1:电话号码5,电话号码8,……。步骤s104,根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分。利用机器学习模型,根据电话号码的统计特征(电话号码及其对应的imei评分),以及电话号码之间的第二对应关系,采用监督分类算法,对收集到的电话号码的统计特征进行分析。综合无监督和监督学习,分析电话号码的统计特征包含的评分、与电话号码具有第二对应关系的电话号码的统计特征包含的评分,得到所有电话号码的评分。步骤s105,根据所有电话号码的评分建立电话号码黑名单。根据所有电话号码的评分设立不同区间的评分阈值,根据评分阈值,可以将在黑名单评分阈值区间内的电话号码加入到电话号码黑名单中。根据本发明提供的基于通信网络的电话号码黑名单建立方法,通过收集用户设备的imei以及其对应的通话记录,建立电话号码与imei的第一对应关系;其中,第一对应关系具体为一个电话号码与n个imei的对应关系,n大于或等于1;根据imei的数个维度的属性信息对imei进行评分,根据评分结果得到电话号码的统计特征;根据电话号码与imei的第一对应关系,得到电话号码之间的第二对应关系;其中,第二对应关系具体为一个电话号码与m个电话号码的对应关系,m大于或等于1;根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分;根据所有电话号码的评分建立电话号码黑名单。本发明在保护用户隐私的情况下,利用收集到的用户设备的imei以及其对应的通话记录,建立电话号码间的各种对应关系。并根据电话号码的统计特征及电话号码间的对应关系进行计算评分,从而得到电话号码黑名单。本发明大大降低了用户隐私信息的暴露率,降低了可能的隐私泄露风险。同时,利用机器学习算法结合电话号码的统计特征进行学习,有效的得到电话号码的评分,方便建立电话号码黑名单。图2示出了根据本发明另一个实施例的基于通信网络的电话号码黑名单建立方法的流程图。如图2所示,基于通信网络的电话号码黑名单建立方法具体包括如下步骤:步骤s201,通过收集用户设备的imei以及其对应的通话记录,建立电话号码与imei的第一对应关系。步骤s202,根据imei的数个维度的属性信息对imei进行评分,根据评分结果得到电话号码的统计特征。步骤s203,根据电话号码与imei的第一对应关系,得到电话号码之间的第二对应关系。以上步骤参考图1实施例中的步骤s101-s103,在此不再赘述。步骤s204,通过收集电话号码间的通话记录,进一步得到电话号码之间的第二对应关系。利用第三方平台如来电秀等平台,可以收集到电话号码间的通话记录,根据电话号码间的通话记录,可以进一步补充电话号码之间的第二对应关系。步骤s205,从云端数据库获取部分电话号码的标签信息,根据标签信息对部分电话号码进行预标注评分。对于收集到的电话号码中的部分电话号码在云端数据库中存储有其对应的标签信息,如骚扰电话、快递电话、送餐电话等,从云端数据库获取部分电话号码的标签信息,并根据不同的标签信息对应不同的评分,方便根据标签信息对这些部分电话号码进行预标注评分。步骤s206,根据具有预标注评分的部分电话号码以及电话号码之间的第二对应关系,将相应的电话号码进行社区划分,将社区划分的结果作为机器学习算法的输入信息。对于可能为电话号码黑名单中的电话号码如不良电话号码,一般不会有用户愿意将该不良电话号码保存在其通讯录中,也不会多次接听该不良电话号码的来电。从社区结构来看,这些不良电话号码的社区结构是点状辐射类型的,但正常的电话号码会有与亲人、朋友、同事等频繁的来去电通话,其社区结构应该是紧密类型的社区结构。考虑到这种情况,可以根据具有预标注评分的部分电话号码以及电话号码之间的第二对应关系,将相应的电话号码进行社区划分,在正常的社区中的电话号码相对的也应该为正常的电话号码,在不良社区中的电话号码相对的也应该为不良的电话号码。社区划分的结果,也可以作为机器学习算法的输入信息,用于对电话号码进行分类,标识电话号码,以便于更好的得到电话号码的评分。步骤s207,利用机器学习算法,将部分电话号码的预标注评分作为学习目标,根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分。利用机器学习算法,先将部分电话号码的预标注评分作为学习目标,根据这些部分电话号码的统计特征等进行训练,学习出电话号码评分的机器学习算法。利用这种有监督的学习算法以及对大量无预标注评分的电话号码的统计特征以及电话号码之间的第二对应关系的无监督学习,计算得到所有电话号码的评分。步骤s208,根据所有电话号码的评分建立电话号码黑名单。由于标签信息中包括了骚扰电话、快递电话、送餐电话等不同标签信息,根据不同标签信息,设置对应不同的预标注评分,相对的,利用机器学习算法得到不良电话号码、中介电话号码(包括快递、送餐电话号码)、正常电话号码的不同评分。根据不同的评分,可以建立电话号码黑名单。不良电话号码属于电话号码黑名单内的电话号码。进一步,也还可以建立电话号码灰名单,将中介电话号码(包括快递、送餐电话号码)等放入电话号码灰名单中。根据本发明提供的基于通信网络的电话号码黑名单建立方法,通过部分电话号码的标签信息,对部分电话号码进行预标注评分。利用机器学习算法,将部分电话号码的预标注评分作为学习目标,可以使得到的评分结果更准确。进一步,将电话号码进行社区划分,将社区划分的结果作为机器学习算法的输入信息,充分的考虑了社会的实际情况,得到计算的评分更符合实际情况。利用机器学习结合有监督和无监督的学习共同分析,根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分,进而可以建立电话号码黑名单。图3示出了根据本发明一个实施例的基于通信网络的电话号码黑名单建立装置的功能框图。如图3所示,基于通信网络的电话号码黑名单建立装置包括如下模块:第一关系模块310,适于通过收集用户设备的imei以及其对应的通话记录,建立电话号码与imei的第一对应关系。imei(internationalmobileequipmentidentity,国际移动装备辨识码),是由15位数字组成的“电子串号”,它与每台移动用户设备一一对应,而且该码是全世界唯一的。一台移动用户设备对应一个唯一的imei。第一关系模块310进一步包括了第一收集单元311、第二收集单元312和对应单元313。第一收集单元311,适于收集用户设备的imei。第二收集单元312,适于根据用户设备的imei,收集用户设备的通话记录,得到与用户设备产生来电和/或去电的电话号码,建立imei和与用户设备产生来电和/或去电的电话号码之间的第三对应关系。第一收集单元311收集用户设备的imei,第二收集单元312同时收集与该用户设备对应的通话记录,即与该用户设备的imei相关的来电、去电、短信接收、短信发送的通话记录,从而得到与用户设备产生来电和/或去电关系的电话号码。第二收集单元312根据用户设备的imei,以及得到的与用户设备产生来电和/或去电关系的电话号码,可以建立imei和与用户设备产生来电和/或去电的电话号码之间的第三对应关系。第三对应关系具体为一个imei与d个电话号码的对应关系,d大于或等于1。第二收集单元312根据imei和与imei对应的电话号码,得到如表1所示的数据。第1列为各用户设备的imei,第2列以后各列为与第1列imei对应的用户设备产生来电和/或去电关系的一个或多个电话号码。第二收集单元312根据表1的数据可以得到第三对应关系,即imei1:电话号码1,电话号码2,……;imei2:电话号码2,电话号码5,……;imei3:电话号码1,电话号码3,……;imei4:电话号码4,电话号码5,……。第三对应关系是以imei为中心,统计与imei相关的电话号码。对应单元313,适于根据第三对应关系,建立电话号码与imei的第一对应关系。对应单元313根据第三对应关系,可以建立电话号码与imei的第一对应关系。第一对应关系具体为一个电话号码与n个imei的对应关系,n大于或等于1。第一对应关系是以电话号码为中心,统计与电话号码相关的imei。对应单元313从第三对应关系中以电话号码为中心进行整理,得到如表2的数据。第1列为各电话号码,第2列以后各列为与第1列电话号码对应的用户设备的imei。对应单元313得到如表2所示的第一对应关系,即电话号码1:imei1,imei7,……;电话号码2:imei1,imei2,……;电话号码3:imei3,……;电话号码4:imei4,……;电话号码5:imei2,imei4,……。第一评分模块320,适于根据imei的数个维度的属性信息对imei进行评分,根据评分结果得到电话号码的统计特征。可选地,本装置还包括了属性获取模块360,适于收集imei的数个维度的属性信息。属性获取模块360收集imei的数个维度的属性信息,其中,imei的数个维度的属性信息包括以下至少一个维度的属性信息:imei对应的用户设备中的用户行为信息、imei对应的用户设备中已安装的应用列表信息、imei是否属于imei黑名单的信息(预先根据已经收集的信息建立的imei黑名单)等。如属性获取模块360通过收集imei对应的用户设备中用户对各类应用的操作行为信息、用户通话时长、通话频率等行为信息(经常性通话时长较短可能为骚扰他人的行为,每天拨打异常多的电话可能为骚扰他人的行为等)、用户在贷款类应用中注册、申请贷款的行为信息、用户在支付类应用中的信用信息、用户设备安装的贷款类、支付类等应用信息、用户设备安装的某些属于预设黑名单的应用列表(预先收集的如催账类应用、不良小额贷款应用等应用列表)中的应用信息等得到imei的数个维度的属性信息。第一评分模块320根据imei的数个维度的属性信息划分imei的分值,对imei进行评分。第一评分模块320将第一对应关系中的各imei替换为对应的imei的评分,如imei1的评分为3,imei7的评分为0.5,得到电话号码1:3,0.5,……,即电话号码1的统计特征。第一评分模块320根据各imei的评分结果,得到各个电话号码的统计特征。第二关系模块330,适于根据电话号码与imei的第一对应关系,得到电话号码之间的第二对应关系。第二关系模块330采集imei对应的用户设备所使用的电话号码,从中提取出具有一一对应关系的imei与imei对应的用户设备所使用的电话号码。如用户设备注册时使用的电话号码,且该电话号码不是imei的第三对应关系的电话号码,第二关系模块330认为该电话号码为与imei一一对应的用户设备所使用的电话号码。在第一对应关系中,第二关系模块330将imei替换为与其具有一一对应关系的电话号码,得到电话号码之间的第二对应关系。第二对应关系具体为一个电话号码与m个电话号码的对应关系,m大于或等于1。如imei1对应的电话号码为电话号码5,imei7对应的电话号码为电话号码8,第二关系模块330得到电话号码1的第二对应关系为电话号码1:电话号码5,电话号码8,……。第二评分模块340,适于根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分。第二评分模块340利用机器学习模型,根据电话号码的统计特征(电话号码及其对应的imei评分),以及电话号码之间的第二对应关系,采用监督分类算法,对收集到的电话号码的统计特征进行分析。第二评分模块340综合无监督和监督学习,分析电话号码的统计特征包含的评分、与电话号码具有第二对应关系的电话号码的统计特征包含的评分,得到所有电话号码的评分。黑名单模块350,适于根据所有电话号码的评分建立电话号码黑名单。黑名单模块350根据所有电话号码的评分设立不同区间的评分阈值,根据评分阈值,可以将在黑名单评分阈值区间内的电话号码加入到电话号码黑名单中。根据本发明提供的基于通信网络的电话号码黑名单建立装置,通过收集用户设备的imei以及其对应的通话记录,建立电话号码与imei的第一对应关系;其中,第一对应关系具体为一个电话号码与n个imei的对应关系,n大于或等于1;根据imei的数个维度的属性信息对imei进行评分,根据评分结果得到电话号码的统计特征;根据电话号码与imei的第一对应关系,得到电话号码之间的第二对应关系;其中,第二对应关系具体为一个电话号码与m个电话号码的对应关系,m大于或等于1;根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分;根据所有电话号码的评分建立电话号码黑名单。本发明在保护用户隐私的情况下,利用收集到的用户设备的imei以及其对应的通话记录,建立电话号码间的各种对应关系。并根据电话号码的统计特征及电话号码间的对应关系进行计算评分,从而得到电话号码黑名单。本发明大大降低了用户隐私信息的暴露率,降低了可能的隐私泄露风险。同时,利用机器学习算法结合电话号码的统计特征进行学习,有效的得到电话号码的评分,方便建立电话号码黑名单。图4示出了根据本发明另一个实施例的基于通信网络的电话号码黑名单建立装置的功能框图。如图4所示,与图3不同之处在于,基于通信网络的电话号码黑名单建立装置还包括:通话收集模块370,适于通过收集电话号码间的通话记录,进一步得到电话号码之间的第二对应关系。通话收集模块370利用第三方平台如来电秀等平台,可以收集到电话号码间的通话记录。通话收集模块370根据电话号码间的通话记录,可以进一步补充电话号码之间的第二对应关系。预标注收集模块380,适于从云端数据库获取部分电话号码的标签信息,根据标签信息对部分电话号码进行预标注评分。对于收集到的电话号码中的部分电话号码在云端数据库中存储有其对应的标签信息,如骚扰电话、快递电话、送餐电话等,预标注收集模块380从云端数据库获取部分电话号码的标签信息,并根据不同的标签信息对应不同的评分,方便根据标签信息对这些部分电话号码进行预标注评分。社区划分模块390,适于根据具有预标注评分的部分电话号码以及电话号码之间的第二对应关系,将相应的电话号码进行社区划分,将社区划分的结果作为机器学习算法的输入信息。对于可能为电话号码黑名单中的电话号码如不良电话号码,一般不会有用户愿意将该不良电话号码保存在其通讯录中,也不会多次接听该不良电话号码的来电。从社区结构来看,这些不良电话号码的社区结构是点状辐射类型的,但正常的电话号码会有与亲人、朋友、同事等频繁的来去电通话,其社区结构应该是紧密类型的社区结构。考虑到这种情况,社区划分模块390根据具有预标注评分的部分电话号码以及电话号码之间的第二对应关系,将相应的电话号码进行社区划分,在正常的社区中的电话号码相对的也应该为正常的电话号码,在不良社区中的电话号码相对的也应该为不良的电话号码。社区划分的结果,也可以作为机器学习算法的输入信息,用于对电话号码进行分类,标识电话号码,以便于更好的得到电话号码的评分。第二评分模块340进一步适于利用机器学习算法,先将部分电话号码的预标注评分作为学习目标,根据这些部分电话号码的统计特征等进行训练,学习出电话号码评分的机器学习算法。第二评分模块340利用这种有监督的学习算法以及对大量无预标注评分的电话号码的统计特征以及电话号码之间的第二对应关系的无监督学习,计算得到所有电话号码的评分。由于标签信息中包括了骚扰电话、快递电话、送餐电话等不同标签信息,黑名单模块350进一步适于根据不同标签信息,设置对应不同的预标注评分,相对的,第二评分模块340利用机器学习算法得到不良电话号码、中介电话号码(包括快递、送餐电话号码)、正常电话号码的不同评分。黑名单模块350根据不同的评分,可以建立电话号码黑名单。不良电话号码属于电话号码黑名单内的电话号码。进一步,黑名单模块350也还可以建立电话号码灰名单,将中介电话号码(包括快递、送餐电话号码)等放入电话号码灰名单中。根据本发明提供的基于通信网络的电话号码黑名单建立装置,通过部分电话号码的标签信息,对部分电话号码进行预标注评分。利用机器学习算法,将部分电话号码的预标注评分作为学习目标,可以使得到的评分结果更准确。进一步,将电话号码进行社区划分,将社区划分的结果作为机器学习算法的输入信息,充分的考虑了社会的实际情况,得到计算的评分更符合实际情况。利用机器学习结合有监督和无监督的学习共同分析,根据电话号码的统计特征以及电话号码之间的第二对应关系计算所有电话号码的评分,进而可以建立电话号码黑名单。本申请还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于通信网络的电话号码黑名单建立方法。图5示出了根据本发明一个实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。如图5所示,该计算设备可以包括:处理器(processor)502、通信接口(communicationsinterface)504、存储器(memory)506、以及通信总线508。其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。处理器502,用于执行程序510,具体可以执行上述基于通信网络的电话号码黑名单建立方法实施例中的相关步骤。具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。处理器502可能是中央处理器cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。存储器506,用于存放程序510。存储器506可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。程序510具体可以用于使得处理器502执行上述任意方法实施例中的基于通信网络的电话号码黑名单建立方法。程序510中各步骤的具体实现可以参见上述基于通信网络的电话号码黑名单建立实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的基于通信网络的电话号码黑名单建立的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1