一种数据挖掘、处理方法、装置、设备及介质与流程

文档序号:17398704发布日期:2019-04-13 01:01阅读:226来源:国知局
一种数据挖掘、处理方法、装置、设备及介质与流程

本申请涉及计算机技术领域,尤其涉及一种数据挖掘、处理方法、装置、设备及介质。



背景技术:

在当今社会,数据成为重要的资源,例如数据可以用来分析某个人的爱好,也可以用于各类案件的侦破。但是随着社会和科技的发展,一方面数据的积累越来越多,另一方面数据的增长速度也越来越快,并且不同领域的数据的存储平台或者存储服务器等也不尽相同,如何从这些海量数据中挖掘出有用数据并对数据进行处理,并且提高数据挖掘的效率,这是一个难题。

鉴于上述内容,需要更高效的数据挖掘、处理方案。



技术实现要素:

本说明书实施例提供了一种数据挖掘、处理方法、装置、设备及介质,用以解决如何更高效地进行数据挖掘、处理的技术问题。

为解决上述技术问题,本说明书实施例是这样实现的:

本说明书实施例提供一种数据挖掘方法,包括:

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。

本说明书实施例提供一种数据处理方法,包括:

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;

对所述数据根节点和/或任意或指定级目标数据进行处理。

本说明书实施例还提供了一种数据挖掘装置,包括:

挖掘模块,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点;以及,

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点;

目标数据确定模块,用于根据任一级属性节点中确定与其同级的目标数据。

本说明书实施例还提供了一种数据处理装置,包括:

挖掘模块,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点;以及,

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点;

目标数据确定模块,用于根据任一级属性节点中确定与其同级的目标数据;

处理模块,用于对所述数据根节点和/或任意或指定级目标数据进行处理。

本说明书实施例还提供了一种数据挖掘设备,包括:

至少一个处理器;

以及,

与所述至少一个处理器通信连接的存储器;

其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。

本说明书实施例还提供了一种数据处理设备,包括:

至少一个处理器;

以及,

与所述至少一个处理器通信连接的存储器;

其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;

对所述数据根节点和/或任意或指定级目标数据进行处理。

本说明书实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如下的步骤:

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。

本说明书实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如下的步骤:

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;

对所述数据根节点和/或任意或指定级目标数据进行处理。

本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:

从数据根节点开始按照挖掘维度逐级挖掘属性节点和目标数据,能够实现目标数据的一站式挖掘,且挖掘方向和路径更加清晰,数据挖掘效率也更高。在逐级挖掘的基础上,还可以进一步建立数据根节点、各级属性节点、各级目标数据之间的关联关系,便于对挖掘出来的包括各级属性节点在内的数据进行处理。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对本说明书实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本说明书第一个实施例提供的一种实际应用场景下的数据挖掘系统的示意图。

图2是本说明书第二个实施例提供的一种数据挖掘方法的流程示意图。

图3是本说明书第二个实施例提供的一种数据挖掘过程示意图。

图4是本说明书第三个实施例提供的一种数据处理方法的流程示意图。

图5是本说明书第四个实施例提供的一种电信诈骗场景下的数据挖掘数据挖掘导图。

图6是本说明书第五个实施例提供的一种社交场景下的数据挖掘数据挖掘导图。

图7是本说明书第六个实施例提供的一种数据挖掘装置的结构示意图。

图8是本说明书第六个实施例提供的另一种数据挖掘装置的结构示意图。

图9是本说明书第六个实施例提供的另一种数据挖掘装置的结构示意图。

图10是本说明书第六个实施例提供的一种数据处理装置的结构示意图。

图11是本说明书第六个实施例提供的另一种数据处理装置的结构示意图。

图12是本说明书第七个实施例提供的一种数据处理装置的结构示意图。

图13是本说明书第七个实施例提供的另一种数据处理装置的结构示意图。

图14是本说明书第七个实施例提供的另一种数据处理装置的结构示意图。

图15是本说明书第七个实施例提供的另一种数据处理装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

在现有技术中,一方面数据的积累越来越多,另一方面数据的增长速度也越来越快,并且不同领域的数据的存储平台或者存储服务器等也不尽相同,如何从这些海量数据中挖掘出有用数据,并且提高数据挖掘的效率,这是一个难题。如图1所示,本说明书第一个实施例提供了在一种实际应用场景下的数据挖掘系统11,从数据根节点开始,按照挖掘维度挖掘一级属性节点,并根据一级属性节点中确定一级目标节点,从二级开始,就由上一级的目标数据按照挖掘维度挖掘下一级的属性节点,并根据每一级属性节点中确定同级目标节点,从而得到各级属性节点和各级目标数据,实现目标数据的一站式挖掘,且挖掘方向和路径更加清晰,数据挖掘效率也更高。在逐级挖掘的基础上,还可以进一步建立数据根节点、各级属性节点、各级目标数据之间的关联关系,便于对包括数据根节点和/或各级属性节点和/或各级目标数据在内的数据进行处理。

从程序角度而言,上述流程的执行主体可以为计算机或者服务器或者相应的数据挖掘系统等,另外,也可以有第三方应用客户端协助流程的执行。

图2为本说明书第二个实施例提供的一种数据挖掘方法的流程示意图,图3是本实施例中的数据挖掘过程示意图。结合图2和图3,本说明书本实施例提供的一种数据挖掘方法具体可以包括以下步骤:

s101:根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据。

数据根节点是数据挖掘的起点,不同场景下数据根节点的形式可能不同,例如可以是账户、社交账号、手机号、设备等。挖掘维度表示从哪些方面来分析对象,比如交易、资金、设备、wifi网络等,都可以是对象的维度,维度没有具体的值。这里的“对象”即为要分析的目标,在本步骤中为数据根节点,下文将说明,“对象”也可以是目标数据,不同的对象的挖掘维度可以不同。属性节点是对象在挖掘维度下的具体的值,比如数据根节点为某银行账户,挖掘维度为交易,则属性节点就是该银行账户在某段时间范围内的交易信息,这些交易信息可以有多条,每一条可以包含时间、金额、状态、对方账户等信息。目标数据则是根据属性节点中来确定,沿用上例,假如属性节点是一条条的交易信息,每一条包含时间、金额、状态、对方账户等信息,则可以将对方账户筛选出来作为目标数据。一般来说,目标数据可以是从单个属性节点中所包含的数据,比如属性节点中的某些字段,还可以是与属性节点相关联的数据。当然,目标数据的具体形式实际场景而定。

在根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,可以建立数据根节点和/或目标数据与挖掘维度的对应关系,比如每种类型的数据根节点对应一种或多种挖掘维度,每种类型的目标数据对应一种或多种挖掘维度;又比如,不同重要度或优先级的数据根节点分别对应一种或多种挖掘维度,不同重要度或优先级的目标数据分别对应一种或多种挖掘维度,重要度或优先级高的数据根节点和/或目标节点对应的挖掘维度可以多一些。

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,可以接收所述数据根节点。上述数据根节点和/或目标数据与挖掘维度的对应关系可以在接收数据根节点之前就确定好。在实际应用场景下,接收到数据根节点后,根据上述对应关系可以确定数据根节点的挖掘维度,进而寻找与数据根节点在确定的各个挖掘维度上相关联的一级属性节点;对于目标数据来说,可以每挖掘到一级目标数据后再根据上述对应关系对新挖掘到的这级目标数据确定挖掘维度。

s102:根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。

首先指出,本步骤中的“上一级”和“下一级”是指相邻的两级。本步骤中挖掘维度的“对象”变成了各级目标数据。所述的“上一级目标数据”可以是s101中的一级目标数据,确定一级目标数据的挖掘维度,寻找与一级目标数据在其各个挖掘维度上相关联的二级属性节点,并根据二级属性节点确定二级目标数据。将二级目标数据作为“上一级目标数据”,确定二级目标数据的挖掘维度,寻找与该二级目标数据在其各个挖掘维度上相关联的三级属性节点,并根据三级属性节点确定三级目标数据,三级目标数据又可以作为“上一级目标数据”……寻找到n级属性节点,根据n级属性节点确定n级目标数据,将n级目标数据作为“上一级目标数据”,确定n级目标数据的挖掘维度,寻找与n级目标数据在其各个挖掘维度上相关联的n+1级属性节点,根据n+1级属性节点确定n+1级目标数据……上述步骤重复进行,从新挖掘到的“上一级目标数据”来寻找“下一级属性节点”,并根据寻找到的“下一级属性节点中”确定出与其同级的目标数据。

由上可知,本步骤中的“上一级目标数据”并不特指某一级目标数据,任一级目标数据都可以作为上一级目标数据;本步骤中的“下一级属性节点”也可以是除了以及属性节点之外的任一级属性节点。通过本步骤,就实现了逐级寻找属性节点以及逐级确定目标数据。

一般来说,数据根节点的挖掘维度是有至少一个的,虽然不一定在每个挖掘维度上都可以寻找到一级属性节点。通过数据根节点的各个挖掘维度所寻找到的一级属性节点形成了一级属性节点集合,里面包含一个或多个一级属性节点。相应的,根据一级属性节点所确定的一级目标数据也形成了一个一级目标数据集合。在由一级属性节点确定一级目标数据时,可以根据一级属性节点集合中的每一个一级属性节点来确定一级目标数据,也可以从一级属性节点集合中再筛选出一部分或者指定一部分以及属性节点,然后根据这一部分一级属性节点中的每一个一级属性节点来确定一级目标数据。在由一级目标数据寻找二级属性节点时,可以对一级目标数据集合中的每一个一级目标数据都确定挖掘维度,并寻找在其各个挖掘维度上相关联的二级属性节点;也可以从一级目标数据集合中再筛选出一部分或者指定一部分一级目标数据,然后对这一部分一级目标数据中的每一个目标数据都确定挖掘维度,并寻找在其各个挖掘维度上相关联的二级属性节点。同样的,寻找到的二级属性节点和确定的二级目标数据也分别可以形成二级属性节点集合和二级目标数据集合。以此类推,各级属性节点和各级目标数据都可以形成集合。类似于一级属性节点,对于每一级属性节点集合,可以根据其中的每一个属性节点来确定下一级目标数据,也可以根据其中的一部分属性节点来确定下一级目标数据。类似于一级目标数据,对于每一级目标数据集合,可以由其中的每个目标数据进行下一级属性节点的寻找,也可以由其中的一部分目标数据进行下一级属性节点的寻找。需要说明的是,对于各级属性节点和各级目标节点,不排除其中出现空集的情况。比如,有可能出现某一级属性节点集合是空集的情况,也有可能出现某一级属性节点集合不是空集,但根据该级属性节点确定出的同级目标数据却是空集的情况,即通过该级属性节点中确定不出目标数据。

在实际场景中,一般来说,寻找的属性节点的级数越多,所能得到的目标数据总量是越多的。但是通常来讲,级数越大的属性节点、目标数据与数据根节点的关系通常也是越松散的,其应用价值也相对更小一些。为了保证寻找和确定出的属性节点和目标数据的应用价值和/或为了控制寻找和确定出的属性节点和目标数据的数量和/或其他原因,可以对寻找属性节点和/或确定目标数据的级数做限定,当被寻找到的属性节点和/或确定的目标数据的级数达到级数阈值时,停止寻找下一级属性节点,即停止寻找属性节点。可能存在这种情况,例如n级目标数据集合不是空集,且没有达到级数阈值,在确定了用来寻找n+1级属性节点的目标数据(比如n级目标数据集合全部或者一部分,不妨就是n级目标数据集合全部)后,对每一个n级目标数据确定挖掘维度,且对每一个目标数据来说,在其各个挖掘维度上都没有寻找到n+1级属性节点,即n+1级属性节点是空集,这种情况下,可以变换所选择的用来寻找n+1级属性节点的n级目标数据(在一开始没有选择n级目标数据集合全部的情况下)和/或变换n级目标数据的挖掘维度,或者也可以停止寻找属性节点。或者m级属性节点集合不是空集,但m级目标数据集合却是空集,这种情况下也可以停止寻找属性节点。另外,在没有级数阈值的情况下,当某级目标数据为空时,可以停止寻找属性节点。

进一步,可以根据上述的数据根节点、各级属性节点和/或各级目标数据形成数据挖掘导图,从而清晰展现出目标数据的挖掘过程和结果。在不同场景下,形成的数据挖掘导图可能是不一样的。

通过本实施例,可以实现目标数据的一站式挖掘,且挖掘方向和路径更加清晰,数据挖掘效率也更高。在逐级挖掘的基础上,还可以进一步建立数据根节点、各级属性节点、各级目标数据之间的关联关系,便于对包括数据根节点和/或各级属性节点和/或各级目标数据在内的数据进行处理。

如图4所示,本说明书的第三个实施例提供了一种数据处理方法,包括:

s201:根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据。

该部分同第二个实施例中的s101。

s202:根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。

该部分同第二个实施例中的s102。

s203:对所述数据根节点和/或任意或指定级目标数据进行处理。

在寻找到各级目标数据后,可以对所述数据根节点和/或任意或指定级目标数据进行处理。具体来说,可以将目标数据进行分类。分类既可以针对各级目标数据进行,也可以针对指定的某一级或某些级进行;既可以将各级或指定级的目标数据的全体汇集在一起进行分类,也可以针对选定的某些目标数据进行,且可以跨级选定。在对目标数据进行分类后,便可根据分类对目标数据进行处理。例如可以将目标数据分为有风险类和无风险类,然后对有风险类的目标数据进行管控;还可以将目标数据分为营销类和正常类,然后对营销类的目标数据进行管控。具体分为哪些类别以及采取的处理措施可以根据实际应用场景而定。

进一步,可以根据目标数据的分类确定数据根节点的标签。根据目标数据的分类确定数据根节点的标签包括但不限于以下方式:

确定目标数据分类后的各个类别对所述数据根节点的权重分数,根据权重分数最高的类别确定所述数据根节点的标签。具体可以包括:

(1)若分类是针对某一级目标数据进行的,则确定该级目标数据分类后的各个类别对数据根节点的权重分数,根据权重分数最高的类别确定所述数据根节点的标签。一般一级目标数据(即第一级目标数据)与数据根节点的关系相对更加紧密,所以通常是针对一级目标数据。

(2)若分类是针对多级目标数据进行的,但是是对每一级目标数据单独进行分类,则确定被分类的各级目标数据分类后的各个类别对数据根节点的权重分数,根据权重分数最高的类别确定所述数据根节点的标签。特别的,若不同级的目标数据分类时出现了相同的类别,则将不同级的相同类别的权重分数相加作为其对数据根节点的权重分数。例如,若只有某一级目标数据分类具有类别a,该级该类别a对数据根节点的权重分数为a,则类别a对数据根节点的权重分数为a;若还有其他级目标数据分类后也出现了类别a,则将各级出现的类别a对数据根节点的权重分数相加作为类别a对数据根节点的权重分数,例如若还有另一级目标数据分类后也具有类别a,该级该类别a对数据根节点的权重分数为b,则将a+b作为类别a对数据根节点的权重分数。

(3)若分类是针对多级目标数据的集合(即多级目标数据的全体)或多级目标数据的集合的一部分进行的,则确定对集合或集合一部分分类后的各个类别对数据根节点的权重分数,根据权重分数最高的类别确定所述数据根节点的标签。

在确定了数据根节点的标签后,就可以根据标签对数据根节点进行处理。例如数据根节点的标签为“风险”,就可以对数据根节点进行风险管控;又比如数据根节点的标签为“营销”,就可以对数据根节点进行营销管控。数据根节点具体可以有哪些标签以及采取的处理措施可以根据实际应用场景而定。

图5是本说明书第四个实施例提供的一种电信诈骗场景下的数据挖掘数据挖掘导图。在本实施例中,数据根节点是已经掌握的受害人资金账户(可以来自受害人的报案或投诉),比如银行账户、第三方支付平台账户以及各种可以转账的电子钱包账户,针对受害人账户可以确定多个挖掘维度,包括但不限于图4中示出的设备信息、资金信息、wifi信息。通过设备信息这一挖掘维度,可以寻找到受害人账户登录过的设备,比如设备1、……、设备o,这些设备属于一级属性节点;通过资金信息这一挖掘维度,可以将时间范围限定在案发时间或者指定的时间段,然后寻找到关于受害人账户的交易明细,比如交易明细1、……、交易明细p,这些交易明细也属于一级属性节点;通过wifi信息这一挖掘维度,可以寻找到受害人账户使用过的wifi网络,比如wifi网络1、……、wifi网络q,这些wifi网络也属于一级属性节点。当然,若还使用了其他挖掘维度,则可以获得其他挖掘维度上的一级属性节点。上述寻找到的各个一级属性节点属于一级属性节点集合。对于属性节点的寻找可以做成在线接口的形式,能够做到实时返回。

可以根据一级属性节点的全体或者一部分来确定一级目标数据。对于一级属性节点中的设备,可以确定出使用过设备的其他账户,包括资金账户,仅以设备1为例,可以确定出使用过设备1的资金账户1、……、资金账户r,这r个资金账户可以作为一级目标数据(由此可以看出目标数据可以是与属性节点相关联的数据,比如资金账户与设备关联);对于一级属性节点中的交易明细,可以确定出与受害人资金账户对应的对方账户,对应于交易明细1、……、交易明细p,可以确定对方账户1、……、对方账户p,这p个对方账户可以作为一级目标数据,如果是电商交易明细,还可以确定例如时间、金额、商品名称、收获地址及电话、卖家账号等数据,然后可以从中选取目标数据,比如将卖家账号、收货人电话作为目标数据(由此可以看出目标数据可以是属性节点中的某些字段);对于一级属性节点中的wifi信息,可以确定出使用过wifi网络的其他账户,包括资金账户,仅以wifi网络1为例,可以确定出使用过wifi网络1的资金账户1、……、资金账户s,这s个资金账户可以作为一级目标数据。上述确定的各个一级目标数据属于一级目标数据集合。

根据一级目标数据集合中的每一个一级目标数据,可以确定挖掘维度,包括但不限于设备信息、资金信息、wifi信息,从而对于每一个一级目标数据在其各个挖掘维度上寻找二级属性节点。或者可以从一级目标数据集合中选择一部分,然后确定这一部分中每一个目标数据的挖掘维度,进而寻找二级属性节点。二级目标数据的确定过程同一级目标数据的确定过程。

以此类推,可以逐级寻找属性节点和确定目标数据,并且可以通过设置级数阈值的方式来作为停止寻找属性节点的条件,或者当出现某级目标数据为空集时停止寻找属性节点。

在本实施例中,一般是将资金账户作为目标数据。对于寻找到的各级目标数据,可以确定各个目标数据的风险度,从而锁定可疑账户。比如可以设定风险度阈值,将达到和/或超过风险度阈值的目标数据筛选出来作为可疑账户,通过可疑账户即可确定背后的风险目标,风险目标可以是嫌疑人。

可以对上述的目标数据进行分类,比如有些账户通过排查可以确定是风险目标账户,有些是非风险目标账户。对于非风险目标账户,可以看其与上述风险目标账户之间的关系,如果关系较为紧密,例如发生过汇款行为,则可以进一步确定非风险目标账户的持有人,持有人有可能是除数据根节点外的其他受害人,这样有利于帮助其他的受害人挽回损失。

以上仅是示例性的说明,实际应用可能会有不同。

图6是本说明书第五个实施例提供的一种社交场景下的数据挖掘数据挖掘导图。在本实施例中,数据根节点为某社交账号,对数据根节点所确定的挖掘维度为账户关注关系,从而可以确定该社交账号的关注明细,比如有该社交账号关注了公众号1,……,公众号t,这t个公众号作为一级属性节点,同时也可以作为一级目标数据。在本实施例中,一般确定一级目标数据即可。

进一步,可以将一级目标数据进行分类,例如将这些被数据根节点关注的社交账号或公众号分为“新闻”“娱乐”“财经”“体育”等类别,然后确定各个类别对数据根节点的权重分数,然后根据权重分数最高的类别确定数据根节点的标签,若出现不同类别权重分数并列最高的情况,则根据权重分数并列最高的类别确定数据根节点的标签。确定权重分数的方法包括但不限于:将每一类别的社交账号或公众号数量作为权重分数。比如数据根节点所关注的社交账号或公众号中属于“新闻”类别的最多,则数据根节点的标签就可以是“新闻”;又比如数据根节点所关注的社交账号或公众号中属于“新闻”和“娱乐”类别的并列最多,则数据根节点的标签就可以是“新闻”和“娱乐”。

在确定了数据根节点的标签后,就可以对数据根节点进行处理,例如向数据根基点发送“新闻”类资讯。

以上仅是示例性的说明,实际应用可能会有不同。

基于同样的思路,如图7所示,本说明书第六个实施例还提供了一种数据挖掘装置,包括:

挖掘模块301,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点;以及,

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点;

目标数据确定模块302,用于根据任一级属性节点中确定与其同级的目标数据。

可选的,当被寻找到的属性节点和/或目标数据的级数达到级数阈值时,停止寻找属性节点;

和/或,

当某级目标数据为空时,停止寻找属性节点。

可选的,如图8所示,所述装置还包括:

风险度确定筛选模块303,用于确定任意或指定级目标数据中各个目标数据的风险度,根据所述风险度对所述各级目标数据进行筛选;

风险目标确定模块304,用于根据筛选后的各级目标数据确定风险目标。

可选的,如图9所示,所述装置还包括:

维度模块305,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,建立数据根节点和/或目标数据与挖掘维度的对应关系;

和/或;

确定数据根节点和/或目标数据的挖掘维度。

可选的,建立数据根节点与挖掘维度的对应关系包括:

建立各重要度或优先级的数据根节点和/或目标数据与挖掘维度的对应关系;

和/或,

建立各类型数据根节点与挖掘维度的对应关系。

可选的,如图10所示,所述装置还包括:

根节点接收模块306,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,接收所述数据根节点。

可选的,如图11所示,所述装置还包括:

成图模块307,用于根据所述数据根节点、各级属性节点和/或各级目标数据形成数据挖掘导图。

基于同样的思路,如图12所示,本说明书第七个实施例还提供了一种数据处理装置,包括:

挖掘模块401,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点;以及,

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点;

目标数据确定模块402,用于根据任一级属性节点中确定与其同级的目标数据;

处理模块403,用于对所述数据根节点和/或任意或指定级目标数据进行处理。

可选的,如图13所示,所述装置还包括:

目标数据分类模块404,用于对任意或指定级目标数据进行分类;

所述处理模块403根据所述分类对所述数据根节点和/或任意或指定级目标数据进行处理。

可选的,如图14所示,所述装置还包括:

根节点标签确定模块405,用于根据所述目标数据的分类确定所述数据根节点的标签。

可选的,根据所述目标数据的分类确定所述数据根节点的标签包括:

确定目标数据的各个类别对所述数据根节点的权重分数;

根据权重分数最高的类别确定所述数据根节点的标签。

可选的,如图15所示,所述处理模块403还用于根据所述数据根节点的标签对所述数据根节点进行处理。

基于同样的思路,本说明书第八个实施例提供了一种数据挖掘设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;

其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。

基于同样的思路,本说明书第九个实施例提供了一种数据挖掘设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;

其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;

对所述数据根节点和/或任意或指定级目标数据进行处理。

基于同样的思路,本说明书第十个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如下的步骤:

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。

基于同样的思路,本说明书第十一个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如下的步骤:

根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;

根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;

对所述数据根节点和/或任意或指定级目标数据进行处理。

上述对本说明书特定实施例进行了描述,其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,附图中描绘的过程不一定必须按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书实施例提供的装置、设备、非易失性计算机可读存储介质与方法是对应的,因此,装置、设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、设备、非易失性计算机存储介质的有益技术效果。

在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmablelogicdevice,pld)(例如现场可编程门阵列(fieldprogrammablegatearray,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardwaredescriptionlanguage,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advancedbooleanexpressionlanguage)、ahdl(alterahardwaredescriptionlanguage)、confluence、cupl(cornelluniversityprogramminglanguage)、hdcal、jhdl(javahardwaredescriptionlanguage)、lava、lola、myhdl、palasm、rhdl(rubyhardwaredescriptionlanguage)等,目前最普遍使用的是vhdl(very-high-speedintegratedcircuithardwaredescriptionlanguage)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc625d、atmelat91sam、microchippic18f26k20以及siliconelabsc8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1