异常企业识别方法、装置、电子设备及存储介质与流程

文档序号:26088982发布日期:2021-07-30 17:57阅读:73来源:国知局
异常企业识别方法、装置、电子设备及存储介质与流程

本公开涉及数据处理技术领域,尤其涉及异常企业识别方法、装置、电子设备及存储介质。



背景技术:

目前,企业主体数据以企业主体对象表和多个特征数据表的形式存在,用户查询某个企业的特征数据时,需要以企业主体对象从多个特征数据表中获取企业的各个特征数据,且用户需要手动对企业的各个特征数据进行分析,判断企业是否为异常企业,进而依据分析结果进行投资等,查询效率差,企业主体数据的利用率不高。



技术实现要素:

本公开提供了一种异常企业识别方法、装置、电子设备及存储介质,进而至少在一定程度上避免用户手动查询企业信息数据并进行分析,可以直接确定企业是否具有某个异常企业标签,查询效率高,企业主体数据的利用率高。

本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。

根据本公开的第一方面,提供了一种异常企业识别方法,包括:获取企业主体数据,其中,所述企业主体数据包括企业主体对象和与所述企业主体对象对应的企业信息数据;提取所述企业信息数据中至少一特征数据,其中,所述特征数据与所述企业信息数据对应的所述企业主体对象关联;判断与所述企业主体对象关联的特征数据是否符合预设异常企业条件;在与所述企业主体对象关联的特征数据符合所述预设异常企业条件时,根据预设方案将符合的所述预设异常企业条件对应的异常企业标签标识至与所述特征数据关联的企业主体对象。

在本公开的示例性实施例中,所述特征数据包括:企业法人数据和企业成立时间数据;

所述判断与所述企业主体关联的特征数据是否符合预设异常企业条件,包括:筛选所关联的企业法人数据相同的企业主体对象,形成第一疑似数据集;判断所述第一疑似数据集中所述企业主体对象的个数是否大于第一预设定企业主体对象个数;在所述第一疑似数据集中所述企业主体对象的个数大于所述第一预设定企业主体对象个数时,比对所述第一疑似数据集中企业主体对象关联的企业成立时间数据的最大差值是否小于第一标准时间差;在所述最大差值小于所述第一标准时间差时,判定所述第一疑似数据集中的企业主体对象符合第一异常企业标签对应的预设异常企业条件。

在本公开的示例性实施例中,所述特征数据还包括:至少一企业高管人员数据和至少一企业股东数据;所述的方法还包括:

获取多个标识有所述第一异常企业标签的企业主体对象,形成第二疑似数据集;在所述第二疑似数据集中,根据预设定算法,获取所关联的法人数据、至少一股东数据或至少一企业高管数据相同,且存在至少一联系关系的候选企业主体对象;确定所述候选企业主体对象符合第二异常企业标签对应的预设异常企业条件。

在本公开的示例性实施例中,所述方法还包括:滤除所述第二疑似数据集中所关联的企业法人数据、企业高管人员数据和企业股东数完全相同的企业主体对象。

在本公开的示例性实施例中,所述股东数据包括股东标识数据和股东类型数据;所述至少一股东数据是否相同的判定方式包括:在股东标识数据相同时,判断相同的每一股东标识数据对应的股东类型数据是否为自然人;在为自然人时,判定股东数据相同。

在本公开的示例性实施例中,所述特征数据还包括:企业法人数据、企业成立时间数据、企业经营范围数据、股东数据和注册地址数据;所述企业法人数据包括企业法人类型数据和法人标识数据;

所述判断与所述企业主体关联的特征数据是否符合预设异预设常企业条件,包括:筛选所关联的企业法人数据相同,且企业法人类型数据为自然人,且所述股东数据中不包括所述企业法人数据的企业主体对象,形成第三疑似数据集;判断所述第三疑似数据集中企业主体对象的个数是否大于第二预设定企业主体对象个数;若大于所述第二预设定企业主体对象个数,则判断所述第三疑似数据集中企业主体对象所关联的企业经营范围数据、注册地址数据和企业成立时间数据是否符合预设异常判定条件;若符合所述预设异常判定条件,则判定所述第三疑似数据集中企业主体对象符合第三异常企业标签对应的预设异常企业条件。

在本公开的示例性实施例中,所述判断所述第三疑似数据集中企业主体对象所关联的企业经营范围数据、注册地址数据和企业成立时间数据是否符合预设异常判定条件,包括:对比所述第三疑似数据集中企业主体对象所关联的企业成立时间数据的最大差值是否小于第二企业成立时间差;若小于所述第二企业成立时间差,则筛选所述第三疑似数据集中关联的企业经营范围数据之间符合经营范围相似条件的企业主体对象,形成第一疑似数据子集;筛选所述第三疑似数据集中关联的注册地址数据之间符合注册地址相似条件的企业主体对象,形成第二疑似数据子集;确定所述第一疑似数据子集和所述第二疑似数据子集的并集中的企业主体对象符合所述预设异常判定条件。

在本公开的示例性实施例中,所述判断与所述企业主体对象关联的特征数据是否符合预设异预设常企业条件,包括:判断与所述企业主体对象关联的所述特征数据中是否包含有企业经营异常数据以及与所述企业经营异常数据对应的企业经营异常数据存在时间数据;若所述特征数据中包含有企业经营异常数据,且所述企业经营异常数据对应的企业经营异常数据存在时间数据大于预设存在时间数据,则判定所述企业主体对象符合第四异常企业标签对应的预设异常企业条件。

在本公开的示例性实施例中,所述判断与所述企业主体对象关联的特征数据是否符合预设异常企业条件,包括:判断与所述企业主体对象关联的所述特征数据中是否包含有企业经营异常数据以及与所述企业经营异常数据对应的企业经营异常数据存在时间数据;若所述特征数据中包含有企业经营异常数据,且所述企业经营异常数据对应的企业经营异常数据存在时间数据大于预设存在时间数据,则判断所述特征数据中的实缴金额数据和注册地址状态是否符合非正常条件;若符合所述非正常条件,则判定所述企业主体对象符合第五异常企业标签对应的预设异常企业条件。

在本公开的示例性实施例中,所述判断所述特征数据中的实缴金额数据和注册地址状态是否符合非正常条件,包括:判断所述实缴金额数据是否为预设异常实缴数据,以及判断所述注册地址状态为预设异常状态;若所述实缴金额数据为所述预设异常实缴数据,或者所述注册地址状态为所述预设异常状态,则确定所述特征数据中的实缴金额数据和注册地址状态符合所述非正常条件。

在本公开的示例性实施例中,所述方法还包括:滤除所述企业主体数据中,对应的企业信息数据满足预设滤除条件的企业主体对象以及企业信息数据。

在本公开的示例性实施例中,所述企业信息数据包括行业数据、历史名称数据和企业评分数据中的一种或几种。

根据本公开的第二方面,提供了一种异常企业识别装置,包括:获取模块,用于获取企业主体数据,其中,所述企业主体数据包括企业主体对象和与所述企业主体对象对应的企业信息数据;提取模块,用于提取所述企业信息数据中至少一特征数据,其中,所述特征数据与所述企业信息数据对应的所述企业主体对象关联;判断模块,用于判断与所述企业主体对象关联的特征数据是否符合预设异常企业条件;处理模块,用于在与所述企业主体对象关联的特征数据符合所述预设异常企业条件时,根据预设方案将符合的所述预设异常企业条件对应的异常企业标签标识至与所述特征数据关联的企业主体对象。

在本公开的示例性实施例中,所述特征数据包括:企业法人数据和企业成立时间数据;所述判断模块具体可以用于,筛选所关联的企业法人数据相同的企业主体对象,形成第一疑似数据集;判断所述第一疑似数据集中所述企业主体对象的个数是否大于第一预设定企业主体对象个数;在所述第一疑似数据集中所述企业主体对象的个数大于所述第一预设定企业主体对象个数时,比对所述第一疑似数据集中企业主体对象关联的企业成立时间数据的最大差值是否小于第一标准时间差;在所述最大差值小于所述第一标准时间差时,判定所述第一疑似数据集中的企业主体对象符合第一异常企业标签对应的预设异常企业条件。

在本公开的示例性实施例中,所述特征数据还包括:至少一企业高管人员数据和至少一企业股东数据;所述处理模块还可以用于,获取多个标识有所述第一异常企业标签的企业主体对象,形成第二疑似数据集;在所述第二疑似数据集中,根据预设定算法,获取所关联的法人数据、至少一股东数据或至少一企业高管数据相同,且存在至少一联系关系的候选企业主体对象;确定所述候选企业主体对象符合第二异常企业标签对应的预设异常企业条件。

在本公开的示例性实施例中,所述处理模块,还用于滤除所述第二疑似数据集中所关联的企业法人数据、企业高管人员数据和企业股东数完全相同的企业主体对象。

在本公开的示例性实施例中,所述股东数据包括股东标识数据和股东类型数据;所述至少一股东数据是否相同的判定方式包括:在股东标识数据相同时,判断相同的每一股东标识数据对应的股东类型数据是否为自然人;在为自然人时,判定股东数据相同。

在本公开的示例性实施例中,所述特征数据还包括:企业法人数据、企业成立时间数据、企业经营范围数据、股东数据和注册地址数据;所述企业法人数据包括企业法人类型数据和法人标识数据;所述判断模块具体可以用于,筛选所关联的企业法人数据相同,且企业法人类型数据为自然人,且所述股东数据中不包括所述企业法人数据的企业主体对象,形成第三疑似数据集;判断所述第三疑似数据集中企业主体对象的个数是否大于第二预设定企业主体对象个数;若大于所述第二预设定企业主体对象个数,则判断所述第三疑似数据集中企业主体对象所关联的企业经营范围数据、注册地址数据和企业成立时间数据是否符合预设异常判定条件;若符合所述预设异常判定条件,则判定所述第三疑似数据集中企业主体对象符合第三异常企业标签对应的预设异常企业条件。

在本公开的示例性实施例中,所述判断模块具体可以用于,对比所述第三疑似数据集中企业主体对象所关联的企业成立时间数据的最大差值是否小于第二企业成立时间差;若小于所述第二企业成立时间差,则筛选所述第三疑似数据集中关联的企业经营范围数据之间符合经营范围相似条件的企业主体对象,形成第一疑似数据子集;筛选所述第三疑似数据集中关联的注册地址数据之间符合注册地址相似条件的企业主体对象,形成第二疑似数据子集;确定所述第一疑似数据子集和所述第二疑似数据子集的并集中的企业主体对象符合所述预设异常判定条件。

在本公开的示例性实施例中,所述判断模块具体可以用于,判断与所述企业主体对象关联的所述特征数据中是否包含有企业经营异常数据以及与所述企业经营异常数据对应的企业经营异常数据存在时间数据;若所述特征数据中包含有企业经营异常数据,且所述企业经营异常数据对应的企业经营异常数据存在时间数据大于预设存在时间数据,则判定所述企业主体对象符合第四异常企业标签对应的预设异常企业条件。

在本公开的示例性实施例中,所述判断模块具体可以用于,判断与所述企业主体对象关联的所述特征数据中是否包含有企业经营异常数据以及与所述企业经营异常数据对应的企业经营异常数据存在时间数据;若所述特征数据中包含有企业经营异常数据,且所述企业经营异常数据对应的企业经营异常数据存在时间数据大于预设存在时间数据,则判断所述特征数据中的实缴金额数据和注册地址状态是否符合非正常条件;若符合所述非正常条件,则判定所述企业主体对象符合第五异常企业标签对应的预设异常企业条件。

在本公开的示例性实施例中,所述判断模块具体可以用于,判断所述实缴金额数据是否为预设异常实缴数据,以及判断所述注册地址状态为预设异常状态;若所述实缴金额数据为所述预设异常实缴数据,且所述注册地址状态为所述预设异常状态,则确定所述特征数据中的实缴金额数据和注册地址状态符合所述非正常条件。

在本公开的示例性实施例中,所述处理模块还用于,滤除所述企业主体数据中,对应的企业信息数据满足预设滤除条件的企业主体对象以及企业信息数据。

在本公开的示例性实施例中,所述企业信息数据包括行业数据、历史名称数据和企业评分数据中的一种或几种。

根据第三方面,提供了一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行如上所述的异常企业识别方法。

根据第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的异常企业识别方法。

根据第五方面,提供了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如上所述的异常企业识别方法。

由上述技术方案可知,本公开示例性实施例中的异常企业识别方法、装置、电子设备及存储介质至少具备以下优点和积极效果:

本公开实施例中的异常企业识别方法首先通过获取企业主体数据,其中,企业主体数据包括企业主体对象和与企业主体对象对应的企业信息数据;提取企业信息数据中至少一特征数据,其中,特征数据与企业信息数据对应的企业主体对象关联;接着通过判断与企业主体对象关联的特征数据是否符合预设异常企业条件;在与企业主体对象关联的特征数据符合预设异常企业条件时,根据预设方案将符合的预设异常企业条件对应的异常企业标签标识至与特征数据关联的企业主体对象,从而能够避免用户手动查询企业信息数据并进行分析,可以直接确定企业是否具有某个异常企业标签,查询效率高,企业主体数据的利用率高。

本公开应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了可以应用本公开实施例的异常企业识别方法的系统架构的示意图;

图2示出本公开示例性实施例中异常企业识别方法的流程示意图;

图3是空壳团伙的示意图;

图4示出本公开示例性实施例中异常企业识别装置的框图;

图5示出本公开示例性实施例中异常企业识别方法的电子设备的框图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施例使得本公开将更加全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现或者操作以避免喧宾夺主而使得本公开的各方面变得模糊。

此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。符号“/”一般表示前后关联对象是一种“或”的关系。

在本公开中,除非另有明确的规定和限定,“连接”等术语应做广义理解,例如,可以是电连接或可以互相通讯;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本公开中的具体含义。

图1示出了可以应用本公开实施例的异常企业识别方法的系统架构的示意图。

如图1所示,系统架构100可以包括终端设备101、102、103中的一种或多种,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机、数字电影放映机等等。

服务器105可以是提供各种服务的服务器。例如,服务器105获取企业主体数据,其中,企业主体数据包括企业主体对象和与企业主体对象对应的企业信息数据;提取企业信息数据中至少一特征数据,其中,特征数据与企业信息数据对应的企业主体对象关联;判断与企业主体对象关联的特征数据是否符合预设异常企业条件;在与企业主体对象关联的特征数据符合预设异常企业条件时,根据预设方案将符合的预设异常企业条件对应的异常企业标签标识至与特征数据关联的企业主体对象。

终端设备103(也可以是终端设备101或102)可以通过网络104向服务器105发送查询请求,查询具有异常企业标签标识的企业主体对象。

图2示出本公开示例性实施例中异常企业识别方法的流程示意图。其中,需要说明的是,本申请实施例的执行主体为异常企业识别装置,异常企业识别装置具体可以为图1中的终端设备或者服务器,或者终端设备或者服务器中的软件等。

如图2所示,异常企业识别方法的具体实现过程如下:

s201,获取企业主体数据,其中,企业主体数据包括企业主体对象和与企业主体对象对应的企业信息数据。

本申请实施例中,企业主体对象可以有两种,一种是企业自身的标识cid,一种是企业在企业主体对象表(company_graph)中的序号gid,两种标识一一对应。企业主体对象对应的特征数据,分散存储在各个特征数据表中,有的特征数据表中存储的是标识cid以及对应的特征数据,有的特征数据表中存储的是标识gid以及对应的特征数据,通过根据企业主体对象查询各个特征数据表,能够获取到企业主体对象对应的各种特征数据,进而进行聚合,得到企业主体对象对应的企业信息数据。

本申请实施例中,可以每次从企业主体对象表中分割出一定数量的企业主体对象,进而查询各个特征数据表,获取各个企业主体对象对应的特征数据;处理完成后,再一次分割出一定数量的企业主体对象,进行处理。其中,一定数量例如可以为1000条。

本申请实施例中,各个特征数据表,例如可以为,企业类型表(company)、企业组织信息表(company_clean_info)、企业员工表(company_human_relation)、企业股东表(equity_ratio)、企业法人表、企业旧行业分类表(company_category_20170411)、企业新行业分类表(company_category_new)、企业历史名称表(company_history_names)、企业地理位置表(company_gps)、企业评估表(company_score)、企业违法异常表(company_illegal_info)、企业经营异常表(company_abnormal_info)等。

本申请实施例中,为了减少需要处理的数据量,可以对企业主体数据进行过滤,滤除企业主体数据中,对应的企业信息数据满足预设滤除条件的企业主体对象以及企业信息数据。其中,预设滤除条件包括以下条件中的至少一种:企业类型为工商、企业经营状态为预设状态、企业组织类型不为预设组织类型。

本申请实施例中,为了进一步减少需要处理的数据量,在预设滤除条件包括:企业类型为工商、企业经营状态为预设状态、企业组织类型不为预设组织类型的情况下,可以分层次进行过滤,对应的,异常企业识别装置对企业主体数据进行过滤的过程例如可以为,根据各个企业主体对象对应的企业信息数据中的企业类型,过滤掉对应的企业类型不为工商的企业主体对象;根据各个企业主体对象对应的企业信息数据中的企业经营状态和企业组织类型,过滤掉对应的企业经营状态不为预设状态,且对应的企业组织类型为预设组织类型的企业主体对象。其中,预设状态例如可以为在业、续存、迁入、迁出等。预设组织类型例如可以为,个体工商户、集体所有制、分支机构等。

本申请实施例中,企业类型为工商的,还可以判断企业类型表中property2字段是否为空字符串。对应的,预设滤除条件中的企业类型为工商,具体可以指企业类型为工商且property2字段为空字符串。

本申请实施例中,为了进一步减少需要处理的数据量,可以在过滤掉对应的企业信息数据不满足预设滤除条件的企业主体对象后,再针对每个企业主体对象,对企业主体对象对应的各种特征数据进行聚合,得到企业主体对象对应的企业信息数据,从而减少聚合时需要处理的数据量。

本申请实施例中,为了方便用户查询,提高查询效率,企业信息数据可以包括行业数据、历史名称数据和企业评分数据中的一种或几种。具体地,异常企业识别装置,可以根据各个企业主体对象分别查询旧行业分类表、新行业分类表、地理位置表以及企业评估表,以获取各个企业主体对象对应的旧行业类型、新行业类型、地理位置数据以及企业评估数据;根据各个企业主体对象对应的旧行业类型、新行业类型、地理位置数据以及企业评估数据,对各个企业对应的企业信息数据进行更新。其中,企业评估数据例如可以为企业的天眼分数等。

其中,旧行业分类表可以包含三级分类,新行业分类表也可以包含三级分类。

s202,提取企业信息数据中至少一特征数据,其中,特征数据与企业信息数据对应的企业主体对象关联。

s203,判断与企业主体对象关联的特征数据是否符合预设异常企业条件。

本申请实施例中,预设异常企业条件可以有多个,分别与不同的异常企业标签对应。其中,异常企业标签可以包括以下标签中的至少一种:僵尸企业标签、异地经营企业标签、套牌企业标签、傀儡企业标签和空壳团伙标签等。

本申请实施例中,在第一种示例中,特征数据包括:企业法人数据和企业成立时间数据;对应的,异常企业识别装置执行步骤203的过程例如可以为,筛选所关联的企业法人数据相同的企业主体对象,形成第一疑似数据集;判断第一疑似数据集中企业主体对象的个数是否大于第一预设定企业主体对象个数;在第一疑似数据集中企业主体对象的个数大于第一预设定企业主体对象个数时,比对第一疑似数据集中企业主体对象关联的企业成立时间数据的最大差值是否小于第一标准时间差;在最大差值小于第一标准时间差时,判定第一疑似数据集中的企业主体对象符合第一异常企业标签对应的预设异常企业条件。其中,第一异常企业标签指的是套牌企业标签。

在第二种示例中,特征数据还可以包括:至少一企业高管人员数据和至少一企业股东数据;对应的,步骤203中,异常企业识别装置在判定企业主体对象是否符合第一异常企业标签对应的预设异常企业条件之后,异常企业识别装置还可以执行以下步骤:获取多个标识有第一异常企业标签的企业主体对象,形成第二疑似数据集;在第二疑似数据集中,根据预设定算法,获取所关联的法人数据、至少一股东数据或至少一企业高管数据相同,且存在至少一联系关系的候选企业主体对象;确定候选企业主体对象符合第二异常企业标签对应的预设异常企业条件。其中,第二异常企业标签指的是空壳团伙标签。

其中,股东数据包括股东标识数据和股东类型数据;至少一股东数据是否相同的判定方式包括:在股东标识数据相同时,判断相同的每一股东标识数据对应的股东类型数据是否为自然人;在为自然人时,判定股东数据相同。

其中,为了避免将所关联的企业法人数据、企业高管人员数据和企业股东数完全相同的企业主体对象判定为符合空壳团伙标签对应的预设异常企业条件,提高异常企业识别的准确度,可以滤除第二疑似数据集中所关联的企业法人数据、企业高管人员数据和企业股东数完全相同的企业主体对象。

其中,空壳团伙的示意图例如可以如图3所示。在图3中,a贸易公司和b贸易公司具有相同的企业员工张三和李四;张三是a贸易公司的法人,且是b贸易公司的经理;李四是a贸易公司的经理,且是b贸易公司的法人,且是c贸易公司的经理,且是d贸易公司的股东;c贸易公司和d贸易公司具有相同的企业员工王五和董六;王五是c贸易公司的股东,且是d贸易公司的法人,且是a贸易公司的股东,且是b贸易公司的股东;董六是c贸易公司的法人,且是d贸易公司的经理。其中,a贸易公司、b贸易公司、c贸易公司和d贸易公司存在相同者李四和王五,因此4个贸易公司属于同一个空壳团伙,4个贸易公司符合空壳团伙标签对应的预设异常企业条件。

在第三种示例中,异常企业识别装置执行步骤203的过程例如可以为,判断与企业主体对象关联的特征数据中是否包含有企业经营异常数据以及与企业经营异常数据对应的企业经营异常数据存在时间数据;若特征数据中包含有企业经营异常数据,且企业经营异常数据对应的企业经营异常数据存在时间数据大于预设存在时间数据,则判定企业主体对象符合第四异常企业标签对应的预设异常企业条件。其中,第四异常企业标签指的是僵尸企业标签。预设存在时间数据例如可以为3年等。企业经营异常数据可以从企业经营异常表中获取,可以指企业被列入经营异常名录。

在第四种示例中,特征数据还包括:企业法人数据、企业成立时间数据、企业经营范围数据、股东数据和注册地址数据;企业法人数据包括企业法人类型数据和法人标识数据;对应的,异常企业识别装置执行步骤203的过程例如可以为,筛选所关联的企业法人数据相同,且企业法人类型数据为自然人,且股东数据中不包括企业法人数据的企业主体对象,形成第三疑似数据集;判断第三疑似数据集中企业主体对象的个数是否大于第二预设定企业主体对象个数;若大于第二预设定企业主体对象个数,则判断第三疑似数据集中企业主体对象所关联的企业经营范围数据、注册地址数据和企业成立时间数据是否符合预设异常判定条件;若符合预设异常判定条件,则判定第三疑似数据集中企业主体对象符合第三异常企业标签对应的预设异常企业条件。其中,第三异常企业标签指的是傀儡公司标签。

其中,异常企业识别装置判断第三疑似数据集中企业主体对象所关联的企业经营范围数据、注册地址数据和企业成立时间数据是否符合预设异常判定条件的过程例如可以为,对比第三疑似数据集中企业主体对象所关联的企业成立时间数据的最大差值是否小于第二企业成立时间差;若小于第二企业成立时间差,则筛选第三疑似数据集中关联的企业经营范围数据之间符合经营范围相似条件的企业主体对象,形成第一疑似数据子集;筛选第三疑似数据集中关联的注册地址数据之间符合注册地址相似条件的企业主体对象,形成第二疑似数据子集;确定第一疑似数据子集和第二疑似数据子集的并集中的企业主体对象符合预设异常判定条件。

在第五种示例中,异常企业识别装置执行步骤203的过程例如可以为,判断与企业主体对象关联的特征数据中是否包含有企业经营异常数据以及与企业经营异常数据对应的企业经营异常数据存在时间数据;若特征数据中包含有企业经营异常数据,且企业经营异常数据对应的企业经营异常数据存在时间数据大于预设存在时间数据,则判断特征数据中的实缴金额数据和注册地址状态是否符合非正常条件;若符合非正常条件,则判定企业主体对象符合第五异常企业标签对应的预设异常企业条件。其中,第五异常企业标签指的是异地经营企业标签。非正常条件指的是,注册地址状态为无法联系,或者,注册地址状态为包含预设关键词且实缴金额数据为空。

其中,异常企业识别装置判断特征数据中的实缴金额数据和注册地址状态是否符合非正常条件的过程例如可以为,判断实缴金额数据是否为预设异常实缴数据,以及判断注册地址状态为预设异常状态;若实缴金额数据为预设异常实缴数据,或者注册地址状态为预设异常状态,则确定特征数据中的实缴金额数据和注册地址状态符合非正常条件。

s204,在与企业主体对象关联的特征数据符合预设异常企业条件时,根据预设方案将符合的预设异常企业条件对应的异常企业标签标识至与特征数据关联的企业主体对象。

本申请实施例中,预设方案可以指,将企业主体对象、关联的特征数据、以及符合的预设异常企业条件对应的异常企业标签更新到异常企业表中。

另外,异常企业识别装置将企业主体对象、关联的特征数据、以及符合的预设异常企业条件对应的异常企业标签更新到异常企业表中之后,在接收到用户的异常企业查询请求后,可以根据异常企业查询请求中的待查询的企业主体对象,查询异常企业表,以获取待查询的企业主体对象对应的异常企业标签以及关联的特征数据并进行展示,避免用户手动分析企业是否满足某个异常企业标签对应的预设异常企业条件,从而提高查询效率,提高企业主体数据的利用率。

本申请实施例中,为了确保异常企业表的准确度,所述的方法还可以包括以下步骤:监测企业主体数据的变化情况,并获取企业主体数据中对应的企业信息数据发生变化的第一企业主体对象;针对第一企业主体对象,重新获取第一企业主体对象对应的企业信息数据;在第一企业主体对象对应的企业信息数据满足预设的异常企业条件时,将满足的异常企业条件对应的异常标签以及更新后的企业信息数据更新到异常企业表中。

本申请实施例中,企业主体数据的变化情况例如,已有企业的员工发生变化、股东发生变化、违法异常数据发生变化,经营异常数据发生变化等;又例如,新增了某个企业主体对象及其企业信息数据等。

综上,通过获取企业主体数据,其中,企业主体数据包括企业主体对象和与企业主体对象对应的企业信息数据;提取企业信息数据中至少一特征数据,其中,特征数据与企业信息数据对应的企业主体对象关联;判断与企业主体对象关联的特征数据是否符合预设异常企业条件;在与企业主体对象关联的特征数据符合预设异常企业条件时,根据预设方案将符合的预设异常企业条件对应的异常企业标签标识至与特征数据关联的企业主体对象,从而能够避免用户手动查询企业信息数据并进行分析,以判断企业是否符合某个异常企业标签,可以直接确定企业是否具有某个异常企业标签,查询效率高,企业主体数据的利用率高。

图4示意性示出了根据本公开的一实施例的异常企业识别装置的框图。本公开实施例提供的异常企业识别装置可以设置在终端设备上,也可以设置在服务器上,或者部分设置在终端设备上,部分设置在服务器上,例如,可以设置在图1中的服务器105(根据实际替换),但本公开并不限定于此。

本公开实施例提供的异常企业识别装置400包括:获取模块410、提起模块420、判断模块430和处理模块440。

其中,获取模块410,用于获取企业主体数据,其中,所述企业主体数据包括企业主体对象和与所述企业主体对象对应的企业信息数据;

提取模块420,用于提取所述企业信息数据中至少一特征数据,其中,所述特征数据与所述企业信息数据对应的所述企业主体对象关联;

判断模块430,用于判断与所述企业主体对象关联的特征数据是否符合预设异常企业条件;

处理模块440,用于在与所述企业主体对象关联的特征数据符合所述预设异常企业条件时,根据预设方案将符合的所述预设异常企业条件对应的异常企业标签标识至与所述特征数据关联的企业主体对象。

作为本申请实施例的一种可能实现方式,所述特征数据包括:企业法人数据和企业成立时间数据。对应的,所述判断模块430具体可以用于,筛选所关联的企业法人数据相同的企业主体对象,形成第一疑似数据集;判断所述第一疑似数据集中所述企业主体对象的个数是否大于第一预设定企业主体对象个数;在所述第一疑似数据集中所述企业主体对象的个数大于所述第一预设定企业主体对象个数时,比对所述第一疑似数据集中企业主体对象关联的企业成立时间数据的最大差值是否小于第一标准时间差;在所述最大差值小于所述第一标准时间差时,判定所述第一疑似数据集中的企业主体对象符合第一异常企业标签对应的预设异常企业条件。

作为本申请实施例的一种可能实现方式,所述特征数据还包括:至少一企业高管人员数据和至少一企业股东数据;所述处理模块440还可以用于,获取多个标识有所述第一异常企业标签的企业主体对象,形成第二疑似数据集;在所述第二疑似数据集中,根据预设定算法,获取所关联的法人数据、至少一股东数据或至少一企业高管数据相同,且存在至少一联系关系的候选企业主体对象;确定所述候选企业主体对象符合第二异常企业标签对应的预设异常企业条件。

作为本申请实施例的一种可能实现方式,所述处理模块440,还用于滤除所述第二疑似数据集中所关联的企业法人数据、企业高管人员数据和企业股东数完全相同的企业主体对象。

作为本申请实施例的一种可能实现方式,所述股东数据包括股东标识数据和股东类型数据;所述至少一股东数据是否相同的判定方式包括:在股东标识数据相同时,判断相同的每一股东标识数据对应的股东类型数据是否为自然人;在为自然人时,判定股东数据相同。

作为本申请实施例的一种可能实现方式,所述特征数据还包括:企业法人数据、企业成立时间数据、企业经营范围数据、股东数据和注册地址数据;所述企业法人数据包括企业法人类型数据和法人标识数据。所述判断模块430具体可以用于,筛选所关联的企业法人数据相同,且企业法人类型数据为自然人,且所述股东数据中不包括所述企业法人数据的企业主体对象,形成第三疑似数据集;判断所述第三疑似数据集中企业主体对象的个数是否大于第二预设定企业主体对象个数;若大于所述第二预设定企业主体对象个数,则判断所述第三疑似数据集中企业主体对象所关联的企业经营范围数据、注册地址数据和企业成立时间数据是否符合预设异常判定条件;若符合所述预设异常判定条件,则判定所述第三疑似数据集中企业主体对象符合第三异常企业标签对应的预设异常企业条件。

作为本申请实施例的一种可能实现方式,所述判断模块430具体可以用于,对比所述第三疑似数据集中企业主体对象所关联的企业成立时间数据的最大差值是否小于第二企业成立时间差;若小于所述第二企业成立时间差,则筛选所述第三疑似数据集中关联的企业经营范围数据之间符合经营范围相似条件的企业主体对象,形成第一疑似数据子集;筛选所述第三疑似数据集中关联的注册地址数据之间符合注册地址相似条件的企业主体对象,形成第二疑似数据子集;确定所述第一疑似数据子集和所述第二疑似数据子集的并集中的企业主体对象符合所述预设异常判定条件。

作为本申请实施例的一种可能实现方式,所述判断模块430具体可以用于,判断与所述企业主体对象关联的所述特征数据中是否包含有企业经营异常数据以及与所述企业经营异常数据对应的企业经营异常数据存在时间数据;若所述特征数据中包含有企业经营异常数据,且所述企业经营异常数据对应的企业经营异常数据存在时间数据大于预设存在时间数据,则判定所述企业主体对象符合第四异常企业标签对应的预设异常企业条件。

作为本申请实施例的一种可能实现方式,所述判断模块430具体可以用于,判断与所述企业主体对象关联的所述特征数据中是否包含有企业经营异常数据以及与所述企业经营异常数据对应的企业经营异常数据存在时间数据;若所述特征数据中包含有企业经营异常数据,且所述企业经营异常数据对应的企业经营异常数据存在时间数据大于预设存在时间数据,则判断所述特征数据中的实缴金额数据和注册地址状态是否符合非正常条件;若符合所述非正常条件,则判定所述企业主体对象符合第五异常企业标签对应的预设异常企业条件。

作为本申请实施例的一种可能实现方式,所述判断模块430具体可以用于,判断所述实缴金额数据是否为预设异常实缴数据,以及判断所述注册地址状态为预设异常状态;若所述实缴金额数据为所述预设异常实缴数据,且所述注册地址状态为所述预设异常状态,则确定所述特征数据中的实缴金额数据和注册地址状态符合所述非正常条件。

作为本申请实施例的一种可能实现方式,所述处理模块440还用于,滤除所述企业主体数据中,对应的企业信息数据满足预设滤除条件的企业主体对象以及企业信息数据。

作为本申请实施例的一种可能实现方式,所述企业信息数据包括行业数据、历史名称数据和企业评分数据中的一种或几种。

综上,通过获取企业主体数据,其中,企业主体数据包括企业主体对象和与企业主体对象对应的企业信息数据;提取企业信息数据中至少一特征数据,其中,特征数据与企业信息数据对应的企业主体对象关联;判断与企业主体对象关联的特征数据是否符合预设异常企业条件;在与企业主体对象关联的特征数据符合预设异常企业条件时,根据预设方案将符合的预设异常企业条件对应的异常企业标签标识至与特征数据关联的企业主体对象,从而能够避免用户手动查询企业信息数据并进行分析,以判断企业是否符合某个异常企业标签,可以直接确定企业是否具有某个异常企业标签,查询效率高,企业主体数据的利用率高。

本公开实施例提供的异常企业识别装置中的各个模块、单元和子单元的具体实现可以参照上述异常企业识别方法中的内容,在此不再赘述。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块、单元和子单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块、单元和子单元的特征和功能可以在一个模块、单元和子单元中具体化。反之,上文描述的一个模块、单元和子单元的特征和功能可以进一步划分为由多个模块、单元和子单元来具体化。

如图5所示,示例电子设备50包括用于执行软件例程的处理器501尽管为了清楚起见示出了单个处理器,但是电子设备50也可以包括多处理器系统。处理器501连接到通信基础设施502,用于与电子设备50的其他组件进行通信。通信基础设施502可以包括例如通信总线、交叉开关或网络。

电子设备50还包括诸如随机存取存储器(randomaccessmemory,ram)之类的存储器,所述存储器可包括主存储器503和辅助存储器510。辅助存储器510可以包括,例如硬盘驱动器511和/或可移动存储驱动器512,可移动存储驱动器512可以包括软盘驱动器,磁带驱动器,光盘驱动器等。可移动存储驱动器512以常规方式对可移动存储单元513进行读取和/或写入。可移动存储单元513可以包括由可移动存储驱动器512读取和写入的软盘、磁带、光盘等。相关领域技术人员可以理解,可移动存储单元513包括其上存储有计算机可执行程序代码指令和/或数据的计算机可读存储介质。

在一种可选实施方式中,辅助存储器510可以额外包括或选择性包括用于允许将计算机程序或其他指令加载到电子设备50中的其他类似装置。这样的装置可以包括例如可移动存储单元521和接口520。可移动存储单元521和接口520的示例包括:程序卡带(cartridge)和卡带接口(例如可在视频游戏控制台设备中找到的程序卡带和卡带接口)、可移动存储芯片(例如eprom或prom)和相关联的插槽、以及其他可移动存储单元521和允许软件和数据从可移动存储单元521传输到电子设备50的接口520。

电子设备50还包括至少一个通信接口540。通信接口540允许软件和数据经由通信路径541在电子设备50和外部设备之间传输。在本发明的各种实施例中,通信接口540允许数据在电子设备50和诸如公共数据或私有数据通信网络之类的数据通信网络之间传输。通信接口540可用于在不同的电子设备50之间交换数据,这些电子设备50形成互连的计算机网络的一部分。通信接口540的示例可以包括调制解调器、网络接口(诸如以太网卡)、通信端口、具有相关电路的天线等等。通信接口540可以是有线的或者可以是无线的。经由通信接口540传输的软件和数据为信号形式,该信号可以是能够被通信接口540接收的电、磁、光或其他信号。这些信号经由通信路径541被提供给通信接口。

如图5所示,电子设备50还包括显示器接口531和音频接口532,显示器接口531执行用于将图像渲染到关联的显示器530的操作,音频接口532用于执行通过关联的扬声器533播放音频内容的操作。

在本申请文件中,术语“计算机程序产品”部分程度上可以指代:可移动存储单元513、可移动存储单元521、安装在硬盘驱动器511中的硬盘、或承载着软件通过通信路径541(无线链路或电缆)到通信接口540的载波。计算机可读存储介质是指将记录的指令和/或数据提供给电子设备50以执行和/或处理的任何非暂时的有形的存储介质。这种存储介质的示例包括软盘、磁带、cd-rom、dvd、蓝光tm光盘、硬盘驱动器、rom或集成电路、usb存储器、磁光盘、或诸如pcmcia卡之类的计算机可读卡等等,这些部件无论是在电子设备50的内部还是外部均可。瞬态或非有形计算机可读传输介质也可以参与向电子设备50提供软件、应用程序、指令和/或数据,这种传输介质的示例包括无线电或红外传输信道、到另一台计算机或另一个联网设备的网络连接、以及包括电子邮件传输和记录在网站上的信息等的互联网或内联网。

计算机程序(也被称为计算机程序代码)存储在主存储器503和/或辅助存储器510中。也可以经由通信接口540来接收计算机程序。此类计算机程序在被执行时使电子设备50能够执行本文所讨论的实施例的一个或多个特征。在各种实施例中,计算机程序在被执行时,使处理器501能够执行上述实施例的特征。因此,此类计算机程序代表计算机系统50的控制器。

软件可以存储在计算机程序产品中,并使用可移动存储驱动器512、硬盘驱动器511或接口520加载到电子设备50中。替代地,可以通过通信路径541将计算机程序产品下载到计算机系统50。该软件在由处理器501执行时促使电子设备50执行本文描述的实施例的功能。

应该理解,图5的实施例仅以示例的方式给出。因此,在一些实施例中,可以省略电子设备50的一个或多个特征。而且,在一些实施例中,电子设备50的一个或多个特征可以被组合在一起。另外,在一些实施例中,电子设备50的一个或多个特征可以被分成一个或多个组成部分。

可以理解的是,图5所示的要素起到了提供执行以上实施例中所描述的服务器的各种功能和操作的途径的作用。

在一种实施方式中,服务器通常可以被描述为包括至少一个处理器和至少一个包括计算机程序代码的存储器的物理设备。所述至少一个存储器和计算机程序代码被配置为与所述至少一个处理器一起促使所述物理设备执行必要的操作。

本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现图2所示方法的功能。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被电子设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。

以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,在本发明中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本发明的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本发明为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。

本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

可能以许多方式来实现本发明的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。

本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1