一种自动分析服务号码的方法和装置与流程

文档序号:17860325发布日期:2019-06-11 22:49阅读:221来源:国知局
本发明涉及计算机
技术领域
,更具体地涉及分析服务号码的方法。
背景技术
:企业为了构建统一服务通道,进一步加强品牌宣传,树立良好的企业形象,就产生成千上万、各种各类的服务号码,如运营商服务电话、银行服务电话、qq医生、微信公众号等;这些服务号码数量众多、无明显的号码特征、通联频繁,导致手机取证数据中充斥着大量这类型的干扰信息,如何自动分析并过滤掉不断新增的服务号码,成为提升手机取证数据分析能力和分析效率的工作重点。由于服务号码随着企业和应用类型的增加不断增加,且无明显的号码特征,目前市场上现有的同类分析工具,主要通过人工研判的方式,对号码一个个进行判断,如为服务号码再手工过滤,这些技术无法满足现实斗争中复杂的分析需求。因此,现有技术中包含以下不足:完全依赖于人工研判的方式,需要耗费大量的研判时间,而且容易出现错、漏的情况,极大影响数据分析工作的效率和质量;由于关联号码是先全部展示,再通过人工方式过滤,所以服务号码的存在严重影响系统的响应性能和用户体验,增加系统的资源开销和研发成本;由于服务号码的存在,在手机取证数据入库时,很容易将大量本来没关系的对象变成有关系,这些新增关系的存储需要耗费大量的存储空间,极大增加系统的建设成本。技术实现要素:考虑到上述问题而提出了本发明。本发明提供了一种自动分析服务号码的方法和装置,利用高斯分布算法自动分析服务号码,准确分析各种类型服务号码的方法,减少服务号码对手机取证数据分析工作的干扰,提升分析效率,帮助工作人员快速定位核心线索、调查取证。根据本发明一方面,提供了一种自动分析服务号码的方法,包括:获取通联数据;基于所述通联数据提取通联对象特征,得到通联对象的数据集;根据预定条件对所述通联对象的数据集进行分类,得到分析集合;对所述分析集合中的通联对象数进行高斯分布计算,得到所述分析集合的正态分布;根据所述分析集合中的通联对象数在所述分析集合的正态分布中的位置判断所述数据集是否为服务号码。可选地,所述通联对象具有属性,所述属性包括通联区域、通联方向、通联时段和通联类型。可选地,得到通联对象的数据集;包括:基于所述通联对象的属性对所述通联数据提取通联对象特征,得到通联对象的数据集。可选地,所述分析集合包括:本地正常工作时间的服务号码集合、本地全天侯的服务号码集合、骚扰性的服务号码集合、全国性服务号码集合中的至少一个。可选地,判断所述数据集是否为服务号码包括:如果所述分析集合中的通联对象数在所述正态分布中的位置距离平均值有n个标准差之内的范围的右边区域,n为自然数,则确定所述通联对象为服务号码。可选地,所述方法还包括:对所述判断结果进行验证。可选地,所述对所述判断结果进行验证包括:提取所述判断结果为服务号码的通联对象的备注信息和/或通联内容;基于所述备注信息和已经建立好的不同类型服务的名称库,验证所述判断结果为服务号码的通联对象是否为服务号码;和/或基于所述判断结果为服务号码的通联对象的通联内容和已经建立好的不同类型服务通联内容的关键词库,验证所述判断结果为服务号码的通联对象是否为服务号码。可选地,所述对所述判断结果进行验证还包括:如果基于所述名称库和关键词库无法验证所述判断结果为服务号码的通联对象是否为服务号码时,则发送至用户进行判断。可选地,提取所述判断结果为服务号码的通联对象的备注信息包括:通过提取所述判断结果为服务号码的通联对象的备注信息,构建备注数据集。可选地,提取所述判断结果为服务号码的通联对象的通联内容包括:通过提取所述判断结果为服务号码的通联对象的通联内容,构建通联内容集。可选地,基于所述备注信息和所述名称库,验证所述判断结果为服务号码的通联对象是否为服务号码包括:比对所述备注数据集与所述名称库,如果二者有交集,则验证结果为所述通联对象为服务号码。可选地,基于所述判断结果为服务号码的通联对象的通联内容和所述关键词库,验证所述判断结果为服务号码的通联对象是否为服务号码包括:比对所述通联内容集与所述关键词库,如果二所述通联内容集包含有所述关键词库的内容,则验证结果为所述通联对象为服务号码。可选地,所述方法还包括:保存所述通联对象的数据集及对应的验证结果。其中,所述验证结果包括所述通联对象是否为服务号码,和/或所述验证结果的可靠性。可选地,保存所述通联对象的数据集及对应的判断结果或验证结果包括:将单条通联记录存储在全文检索数据库,关联关系存储在图库数据库。可选地,保存所述通联对象的数据集及对应的判断结果或验证结果包括:当所述判断结果或验证结果为所述通联对象为服务号码时,将所述通联对象打上“服务号码”标签。根据本发明另一方面,提供了一种自动分析服务号码装置,所述装置包括:数据获取模块,用于获取通联数据;数据集模块,用于基于所述通联数据提取通联对象特征,得到通联对象的数据集;分析集模块,用于根据预定条件对所述通联对象的数据集进行分类,得到分析集合;计算模块,用于对所述分析集合中的通联对象数进行高斯分布计算,得到所述分析集合的正态分布;判断模块,用于根据所述分析集合中的通联对象数在所述分析集合的正态分布中的位置判断所述数据集是否为服务号码。可选地,数据获取模块可以进一步地用于:基于通讯工具的历史通讯数据获取所述通联数据。可选地,所述通联对象具有属性,所述属性包括通联区域、通联方向、通联时段和通联类型。可选地,数据集模块可以进一步地用于:基于所述通联对象的属性对所述通联数据提取通联对象特征,得到通联对象的数据集。可选地,所述分析集合包括:本地正常工作时间的服务号码集合、本地全天侯的服务号码集合、骚扰性的服务号码集合、全国性服务号码集合中的至少一个。可选地,判断模块还可以进一步地包括:如果所述分析集合中的通联对象数在所述正态分布中的位置距离平均值有n个标准差之内的范围的右边区域,n为自然数,则确定所述通联对象为服务号码。可选地,所述装置还包括:存储模块,用于保存所述通联对象的数据集及对应的判断结果。其中,所述判断结果包括所述通联对象是否为服务号码,和/或所述判断结果的可靠性。可选地,所述装置还包括:验证模块,用于对所述判断结果进行验证。可选地,所述对所述判断结果进行验证包括:提取所述判断结果为服务号码的通联对象的备注信息和/或通联内容;基于所述备注信息和已经建立好的不同类型服务的名称库,验证所述判断结果为服务号码的通联对象是否为服务号码;和/或基于所述判断结果为服务号码的通联对象的通联内容和已经建立好的不同类型服务通联内容的关键词库,验证所述判断结果为服务号码的通联对象是否为服务号码。可选地,所述对所述判断结果进行验证还包括:如果基于所述名称库和关键词库无法验证所述判断结果为服务号码的通联对象是否为服务号码时,则发送至用户进行判断。可选地,提取所述判断结果为服务号码的通联对象的备注信息包括:通过提取所述判断结果为服务号码的通联对象的备注信息,构建备注数据集。可选地,提取所述判断结果为服务号码的通联对象的通联内容包括:通过提取所述判断结果为服务号码的通联对象的通联内容,构建通联内容集。可选地,基于所述备注信息和所述名称库,验证所述判断结果为服务号码的通联对象是否为服务号码包括:比对所述备注数据集与所述名称库,如果二者有交集,则验证结果为所述通联对象为服务号码。可选地,基于所述判断结果为服务号码的通联对象的通联内容和所述关键词库,验证所述判断结果为服务号码的通联对象是否为服务号码包括:比对所述通联内容集与所述关键词库,如果二所述通联内容集包含有所述关键词库的内容,则验证结果为所述通联对象为服务号码。可选地,所述存储模块用于:保存所述通联对象的数据集及对应的验证结果。其中,所述验证结果包括所述通联对象是否为服务号码,和/或所述验证结果的可靠性。可选地,所述存储模块还用于:保存所述通联对象的数据集及对应的判断结果或验证结果。可选地,所述存储模块还用于:将单条通联记录存储在全文检索数据库,关联关系存储在图库数据库。可选地,保存所述通联对象的数据集及对应的判断结果或验证结果包括:当所述判断结果或验证结果为所述通联对象为服务号码时,将所述通联对象打上“服务号码”标签。根据本发明另一方面,提供了一种自动分析服务号码的系统,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。根据本发明另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被计算机执行时实现上述方法的步骤。根据本发明实施例的一种自动分析服务号码的方法、系统和存储介质,能够克服时间差异、个体差异等特性而引发的服务号码无法匹配的问题,并通过备注、号码所属区域等基础库的辅助提高分析结果的准确率,实现服务号码的自动分析和提取。附图说明通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1是用于实现根据本发明实施例的一种本发明实施例的自动分析服务号码的方法的示意性流程图;图2是用于实现根据本发明实施例的正态分布的示例;图3是用于实现根据本发明实施例的对所述判断结果进行验证的示例的示意流程图;图4是用于实现根据本发明实施例的在dalvik运行模式下恢复原函数的示例的示意性流程图;图5是是用于本发明实施例的自动分析服务号码的装置的示意性流程图。具体实施方式为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。本发明实施例提出了一种自动分析服务号码的方法。参考图1来描述用于实现本发明实施例的一种自动分析服务号码的方法100。所述方法100包括:首先,在步骤s110,获取通联数据;在步骤s120,基于所述通联数据提取通联对象特征,得到通联对象的数据集;在步骤s130,根据预定条件对所述通联对象的数据集进行分类,得到分析集合;在步骤s140,对所述分析集合中的通联对象数进行高斯分布计算,得到所述分析集合的正态分布;在步骤s150,根据所述分析集合中的通联对象数在所述分析集合的正态分布中的位置判断所述数据集是否为服务号码。本发明实施例提出的一种自动分析服务号码的方法,能够克服时间差异、个体差异等特性而引发的服务号码无法匹配的问题,并通过备注、号码所属区域等基础库的辅助提高分析结果的准确率,实现服务号码的自动分析和提取。根据本发明实施例,步骤110可以进一步地包括:基于通讯工具的历史通讯数据获取所述通联数据。其中,所述通讯工具的历史通讯数据包括手机中的通话记录和短信记录,即时通讯类型的通联和通话信息等。在一个实施例中,所述通讯工具的历史通讯数据包括手机通联库中通联对象的通话记录和/或短信记录,所述通联对象是指与用户发生通信行为的对象(如与用户发生通信的手机号,或虚拟通信账户等),如表1-表2所示,表1示出了通过通话记录获取所述通联数据,表2示出了通过短信记录获取所述通联数据。表1:通话记录表表2:短信记录表在另一个实施例中,所述通讯工具的历史通讯数据包括虚拟身份库库中通联对象的通联记录,如表3-表4所示,表3-表4均示出了通过即时通讯类型的通联记录获取所述通联数据。表3:im聊天信息表4:im通话信息可选地,所述通联对象具有属性,所述属性包括通联区域、通联方向、通联时段和通联类型。根据本发明实施例,步骤120可以进一步地包括:基于所述通联对象的属性对所述通联数据提取通联对象特征,得到通联对象的数据集。其中,所述通联对象的数据集s包括n个子集合{s1,s2,…,sn},每个子集包含的数据项有:通联对象数、所属区域、通联方向、通联时段、所属类型、聊天类型,每个子集的数据项是以通联对象为中心,结合所有历史数据进行叠加。例如:通联对象子集sn(通联对象为13022334455)包括:通联对象数:231,所属区域:福建福州;通联方向:进|出;通联时段:白天|晚上|凌晨;所属类型:手机;通联类型:临时|好友。根据本发明实施例,步骤130还可以进一步地包括:所述分析集合包括:本地正常工作时间的服务号码集合、本地全天侯的服务号码集合、骚扰性的服务号码集合、全国性服务号码集合中的至少一个。其中,本地正常工作时间的服务号码:如本地物流快递号码等,这类型号码的特性是正常时间才会发生通联的本地号码,所以通过设定子集条件(所属区域:本地;通联时段:白天|晚上),生成新的分析集合sa;本地全天侯的服务号码:如本地滴滴服务号码等,这类型号码的特性是正常人不会保存为好友、号码属地为本地,通过设定子集条件(所属区域:本地;通联类型:临时),生成新的分析集合sb;骚扰性的服务号码:如推荐股票或诈骗等,这类型号码的特性是正常人不会保存为好友,并且单向通联,通过设定子集条件(通联方向:进;通联类型:临时),生成新的分析集合sc;全国性服务号码:如银行服务号等,这类型号码的特性是正常人不会保存为好友,通过设定子集条件(通联类型:临时),生成新的分析集合sd。根据本发明实施例,步骤150还可以进一步地包括:如果所述分析集合中的通联对象数在所述正态分布中的位置距离平均值有n个标准差之内的范围的右边区域,n为自然数,则确定所述通联对象为服务号码。在一个实施例中,参见图2,图2示出了根据本发明实施例的正态分布的示例。取n=3,如图2所示,当通联对象数在所述正态分布中的位置距离平均值有3个标准差之内的范围的右边区域,则确定所述通联对象为服务号码。可选地,所述方法100还包括:保存所述通联对象的数据集及对应的判断结果。其中,所述判断结果包括所述通联对象是否为服务号码,和/或所述判断结果的可靠性。可选地,参见图3,图3示出了所述对所述判断结果进行验证的示例的示意流程图。所述方法100还包括:对所述判断结果进行验证。可选地,所述对所述判断结果进行验证包括:提取所述判断结果为服务号码的通联对象的备注信息和/或通联内容;基于所述备注信息和已经建立好的不同类型服务的名称库,验证所述判断结果为服务号码的通联对象是否为服务号码;和/或基于所述判断结果为服务号码的通联对象的通联内容和已经建立好的不同类型服务通联内容的关键词库,验证所述判断结果为服务号码的通联对象是否为服务号码。可选地,所述对所述判断结果进行验证还包括:如果基于所述名称库和关键词库无法验证所述判断结果为服务号码的通联对象是否为服务号码时,则发送至用户进行判断。其中,所述不同类型服务通联内容的关键词库gn,如运营商通知、银行通知、系统消息等;所述不同类型服务的名称库mn,如打车、物流、物业等。可选地,提取所述判断结果为服务号码的通联对象的备注信息包括:通过提取所述判断结果为服务号码的通联对象的备注信息,构建备注数据集bn。可选地,提取所述判断结果为服务号码的通联对象的通联内容包括:通过提取所述判断结果为服务号码的通联对象的通联内容,构建通联内容集tn。可选地,基于所述备注信息和所述名称库,验证所述判断结果为服务号码的通联对象是否为服务号码包括:比对所述备注数据集与所述名称库,如果二者有交集,则验证结果为所述通联对象为服务号码。可选地,基于所述判断结果为服务号码的通联对象的通联内容和所述关键词库,验证所述判断结果为服务号码的通联对象是否为服务号码包括:比对所述通联内容集与所述关键词库,如果二所述通联内容集包含有所述关键词库的内容,则验证结果为所述通联对象为服务号码。可选地,所述方法100还包括:保存所述通联对象的数据集及对应的验证结果。其中,所述验证结果包括所述通联对象是否为服务号码,和/或所述验证结果的可靠性。可选地,保存所述通联对象的数据集及对应的判断结果或验证结果包括:将单条通联记录存储在全文检索数据库,关联关系存储在图库数据库。可选地,保存所述通联对象的数据集及对应的判断结果或验证结果包括:当所述判断结果或验证结果为所述通联对象为服务号码时,将所述通联对象打上“服务号码”标签。其中,上述将单条通联记录存储在全文检索数据库(elasticsearch),将关联关系存储在图库数据库(titan),服务号码只是打上标签,不存储对应的关联关系的保存方式,可以降低了存储空间。在一个实施例中,所述保存所述通联对象的数据集及对应的判断结果或验证结果如表5所示:表5本发明实施例的自动分析服务号码方法,通过分析正常对象的通联对象数符合正态分布,而服务号码的通联对象数明显大于标准差;再者服务号码的通联特征依赖于持有对象,不同区域、业务、通联目的等对应的服务号码,具有不同的业务特征,通过构建针对不同类型服务号码的数据集进行分析,大大提高了服务号码的分析准确性。在一个实施例中,参见图4,图4示出了用于实现根据本发明实施例的在自动分析服务号码方法的示例的示意性流程图。具体来说:首先,基于通讯工具的历史通讯数据获取所述通联数据;具体包括根据手机取证提取的手机通话记录、手机短信、即时通讯通联记录、即时通讯通话记录。然后,基于所述通联数据提取通联对象特征,得到通联对象的数据集;具体包括:通过通联区域、通联时段、通联方向、通联类型4个维度,对所述通联数据提取特征后构建对应的通联对象数据集。接着,根据预定条件对所述通联对象的数据集进行分类,得到分析集合;具体包括:根据正常时间才会发生通联的本地号码,设定预定条件包括:所属区域为本地,通联时段为白天|晚上;生成本地正常工作时间的服务号码集合sa;根据正常人不会保存为好友、号码属地为本地的本地号码,设定预定条件包括:所属区域为本地,通联类型为临时;生成本地全天侯的服务号码集合sb;根据正常人不会保存为好友,并且单向通联的号码,设定预定条件包括:通联方向为进,通联类型为临时;生成骚扰性的服务号码集合sc;根据正常人不会保存为好友,设定预定条件包括:通联类型为临时;生成全国性服务号码集合sd。接着,对所述分析集合中的通联对象数进行高斯分布计算,得到所述分析集合的正态分布;具体包括:利用高斯分布算法分别算出上述集合sa、sb、sc、sd中的通联对象数的正态分布曲线。接着,根据“服务号码的通联对象数会超过正常号码很多”的特性,取分布在距离平均值有3个标准差之内的范围的右边区域,该区域的数据集即为服务号码;并保存该判断结果。接着,验证所述判断结果;具体包括:提取所述判断结果为服务号码的通联对象的备注信息;基于所述备注信息和已经建立好的不同类型服务的名称库,验证所述判断结果为服务号码的通联对象是否为服务号码;如果验证结果是服务号码,则将该通联对象标注“服务对象”标签,保存所述验证结果;如果验证结果不是服务号码,则提取所述判断结果为服务号码的通联对象的通联内容,基于所述判断结果为服务号码的通联对象的通联内容和已经建立好的不同类型服务通联内容的关键词库,验证所述判断结果为服务号码的通联对象是否为服务号码;如果验证结果是服务号码,则将该通联对象标注“服务对象”标签,保存所述验证结果;如果验证结果不是服务号码,则发送至用户进行人工审核。通过本发明实施例的自动分析服务号码的方法,通过构建服务号码的业务规则库,结合手机上大量的手机通联库、虚拟身份库,以计算机程序自动、准确分析各种类型服务号码的方法,减少服务号码对手机取证数据分析工作的干扰,提升分析效率,帮助工作人员快速定位核心线索、调查取证;而且可以将不同手机的通联库和虚拟身份库进行有效地处理和分析,智能分析出服务号码,有效地降低建设成本,提升系统的响应性能。参见图5,图5示出了本发明实施例的自动分析服务号码的装置。所述装置500包括:数据获取模块510,用于获取通联数据;数据集模块520,用于基于所述通联数据提取通联对象特征,得到通联对象的数据集;分析集模块530,用于根据预定条件对所述通联对象的数据集进行分类,得到分析集合;计算模块540,用于对所述分析集合中的通联对象数进行高斯分布计算,得到所述分析集合的正态分布;判断模块550,用于根据所述分析集合中的通联对象数在所述分析集合的正态分布中的位置判断所述数据集是否为服务号码。本发明实施例提出的自动分析服务号码的装置,能够克服时间差异、个体差异等特性而引发的服务号码无法匹配的问题,减少服务号码对手机取证数据分析工作的干扰,提升分析效率,有效地降低建设成本,提升系统的响应性能。根据本发明实施例,数据获取模块510可以进一步地用于:基于通讯工具的历史通讯数据获取所述通联数据。其中,所述通讯工具的历史通讯数据包括手机中的通话记录和短信记录,即时通讯类型的通联和通话信息等。可选地,所述通联对象具有属性,所述属性包括通联区域、通联方向、通联时段和通联类型。根据本发明实施例,数据集模块520可以进一步地用于:基于所述通联对象的属性对所述通联数据提取通联对象特征,得到通联对象的数据集。其中,所述通联对象的数据集s包括n个子集合{s1,s2,…,sn},每个子集包含的数据项有:通联对象数、所属区域、通联方向、通联时段、所属类型、聊天类型,每个子集的数据项是以通联对象为中心,结合所有历史数据进行叠加。例如:通联对象子集sn(通联对象为13022334455)包括:通联对象数:231,所属区域:福建福州;通联方向:进|出;通联时段:白天|晚上|凌晨;所属类型:手机;通联类型:临时|好友。根据本发明实施例,所述分析集合包括:本地正常工作时间的服务号码集合、本地全天侯的服务号码集合、骚扰性的服务号码集合、全国性服务号码集合中的至少一个。其中,本地正常工作时间的服务号码:如本地物流快递号码等,这类型号码的特性是正常时间才会发生通联的本地号码,所以通过设定子集条件(所属区域:本地;通联时段:白天|晚上),生成新的分析集合sa;本地全天侯的服务号码:如本地滴滴服务号码等,这类型号码的特性是正常人不会保存为好友、号码属地为本地,通过设定子集条件(所属区域:本地;通联类型:临时),生成新的分析集合sb;骚扰性的服务号码:如推荐股票或诈骗等,这类型号码的特性是正常人不会保存为好友,并且单向通联,通过设定子集条件(通联方向:进;通联类型:临时),生成新的分析集合sc;全国性服务号码:如银行服务号等,这类型号码的特性是正常人不会保存为好友,通过设定子集条件(通联类型:临时),生成新的分析集合sd。根据本发明实施例,判断模块550还可以进一步地包括:如果所述分析集合中的通联对象数在所述正态分布中的位置距离平均值有n个标准差之内的范围的右边区域,n为自然数,则确定所述通联对象为服务号码。可选地,所述装置500还包括:存储模块560,用于保存所述通联对象的数据集及对应的判断结果。其中,所述判断结果包括所述通联对象是否为服务号码,和/或所述判断结果的可靠性。可选地,所述装置500还包括:验证模块570,用于对所述判断结果进行验证。可选地,所述对所述判断结果进行验证包括:提取所述判断结果为服务号码的通联对象的备注信息和/或通联内容;基于所述备注信息和已经建立好的不同类型服务的名称库,验证所述判断结果为服务号码的通联对象是否为服务号码;和/或基于所述判断结果为服务号码的通联对象的通联内容和已经建立好的不同类型服务通联内容的关键词库,验证所述判断结果为服务号码的通联对象是否为服务号码。可选地,所述对所述判断结果进行验证还包括:如果基于所述名称库和关键词库无法验证所述判断结果为服务号码的通联对象是否为服务号码时,则发送至用户进行判断。其中,所述不同类型服务通联内容的关键词库gn,如运营商通知、银行通知、系统消息等;所述不同类型服务的名称库mn,如打车、物流、物业等。可选地,提取所述判断结果为服务号码的通联对象的备注信息包括:通过提取所述判断结果为服务号码的通联对象的备注信息,构建备注数据集bn。可选地,提取所述判断结果为服务号码的通联对象的通联内容包括:通过提取所述判断结果为服务号码的通联对象的通联内容,构建通联内容集tn。可选地,基于所述备注信息和所述名称库,验证所述判断结果为服务号码的通联对象是否为服务号码包括:比对所述备注数据集与所述名称库,如果二者有交集,则验证结果为所述通联对象为服务号码。可选地,基于所述判断结果为服务号码的通联对象的通联内容和所述关键词库,验证所述判断结果为服务号码的通联对象是否为服务号码包括:比对所述通联内容集与所述关键词库,如果二所述通联内容集包含有所述关键词库的内容,则验证结果为所述通联对象为服务号码。可选地,所述存储模块560用于:保存所述通联对象的数据集及对应的验证结果。其中,所述验证结果包括所述通联对象是否为服务号码,和/或所述验证结果的可靠性。可选地,所述存储模块560还用于:保存所述通联对象的数据集及对应的判断结果或验证结果。可选地,所述存储模块560还用于:将单条通联记录存储在全文检索数据库,关联关系存储在图库数据库。可选地,保存所述通联对象的数据集及对应的判断结果或验证结果包括:当所述判断结果或验证结果为所述通联对象为服务号码时,将所述通联对象打上“服务号码”标签。其中,上述将单条通联记录存储在全文检索数据库(elasticsearch),将关联关系存储在图库数据库(titan),服务号码只是打上标签,不存储对应的关联关系的保存方式,可以降低了存储空间。在一个实施例中,所述存储模块560保存所述通联对象的数据集及对应的判断结果或验证结果,如表5所示:属性名称属性描述备注srcaccountid账号idaccounttype账号类型1-服务号;2-正常号码accountnum账号nickname昵称areacode归属地表5本发明实施例的自动分析服务号码装置,通过分析正常对象的通联对象数符合正态分布,而服务号码的通联对象数明显大于标准差;再者服务号码的通联特征依赖于持有对象,不同区域、业务、通联目的等对应的服务号码,具有不同的业务特征,通过构建针对不同类型服务号码的数据集进行分析,大大提高了服务号码的分析准确性。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。根据本发明实施例,还提供了一种自动分析服务号码的系统,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述方法的步骤。此外,根据本发明实施例,还提供了一种计算机可读存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本发明实施例的自动分析服务号码方法的相应步骤。所述存储介质可以包括只读存储器,可擦除可编程只读存储器等各种存储器,或上述存储介质的任意组合。根据本发明实施例的自动分析服务号码方法、装置系统以及存储介质,通过分析正常对象的通联对象数符合正态分布,而服务号码的通联对象数明显大于标准差;再者服务号码的通联特征依赖于持有对象,不同区域、业务、通联目的等对应的服务号码,具有不同的业务特征,通过构建针对不同类型服务号码的数据集进行分析,大大提高了服务号码的分析准确性;并能够克服时间差异、个体差异等特性而引发的服务号码无法匹配的问题,减少服务号码对手机取证数据分析工作的干扰,提升分析效率,有效地降低建设成本,提升系统的响应性能;对服务号码的分析准确度高,而且能自动适配新增的应用类型的服务号码分析,提升通联数据的分析能力。尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1