一种数据转移信息识别方法、装置、设备及存储介质与流程

文档序号:31733170发布日期:2022-10-05 02:35阅读:51来源:国知局
一种数据转移信息识别方法、装置、设备及存储介质与流程

1.本技术涉及数据处理技术领域,尤其涉及一种数据转移信息识别方法、装置、设备及存储介质。


背景技术:

2.贸易真实性验证是确保跨境交易安全的重要任务,通常作为相关跨境支付交易是否成功的关键要素。贸易真实性验证方法通常为,通过人工来构造规则以确定核验的贸易信息是否存在冲突,来判断贸易是否真实。但是基于规则冲突的贸易真实性验证方法,主要依赖配置的经验规则,规则覆盖的贸易材料很少,大量规则调整困难,局限性较大。
3.目前,也有一些使用规则学习方法进行贸易真实性验证。这种方法通常是对关联规则进行挖掘,以发现核验的贸易信息中数据项与项之间的关系,然后生成规则。此类方法适用于没有太大差异的数据项。然而,在实际应用中,常常需要挖掘不同类型数据项之间存在的规则,不能简单的将所有数据项当成同种规则。并且,关联规则挖掘是通用的规则生成算法,在频繁项挖掘阶段需要消耗大量时间挖掘无关项的频繁项,无法针对特定的规则进行优化,所以关联规则挖掘算法无论是效率还是产出结果的指标都偏低,无法准确高效地对贸易信息的真实性进行验证。


技术实现要素:

4.本技术提供一种数据转移信息识别方法、装置、设备及存储介质,基于多层神经网络生成初始决策树模型,然后通过强化学习对初始决策树模型进行优化,可以通过持续的训练学习自动更新模型,保障识别准确率。
5.第一方面,本技术实施例公开了一种数据转移信息识别方法,该方法包括:
6.获取待识别的数据转移信息;
7.将数据转移信息输入数据转移信息识别模型,得到数据转移信息识别模型输出的数据转移信息识别结果;数据转移信息识别结果用于表征数据转移信息为异常数据转移信息或非异常数据转移信息;
8.其中,数据转移信息识别模型为基于分类误差和全局信息增益对初始决策树模型进行强化学习得到的;初始决策树模型包括至少两棵决策树,分类误差为每棵决策树对分类数据进行分类的分类误差,全局信息增益用于表征所有决策树的分类结果,对初始决策树模型输出结果不确定性的降低程度;初始决策树模型为基于信息识别神经网络得到;信息识别神经网络为基于历史数据转移信息对多层神经网络进行训练得到,历史数据转移信息标注有非异常标注结果。
9.进一步的,获取待识别的数据转移信息,包括:
10.获取待识别的对象转移信息;
11.在对象转移信息中确定至少一个数据转移对象属性信息;
12.基于预定义规则,确定每个数据转移对象属性信息所对应的属性值;
13.将至少一个数据转移对象属性信息和每个数据转移对象属性信息所对应的属性值,作为数据转移信息。
14.进一步的,信息识别神经网络的训练方法包括:
15.获取标注有非异常标注结果的历史数据转移信息;
16.将历史数据转移信息输入多层神经网络中,得到多层神经网络输出的信息识别结果;
17.根据非异常标注结果和信息识别结果,确定信息识别神经网络。
18.进一步的,初始决策树模型的确定方法包括:
19.确定信息识别神经网络中每相邻两层神经网络的映射关系;
20.基于决策树生成算法,根据每个映射关系,构建至少两棵决策树;
21.将至少两棵决策树,作为初始决策树模型。
22.进一步的,初始决策树模型的强化学习方法包括:
23.确定每棵决策树中分类数据的分类误差和初始决策树模型的全局信息增益;
24.基于分类误差和全局信息增益,对每棵决策树进行调整,得到调整决策树模型;
25.基于调整决策树模型,确定数据转移信息识别模型。
26.进一步的,基于分类误差和全局信息增益,对每棵决策树进行调整,得到调整决策树模型,包括:
27.基于分类误差和全局信息增益,确定初始决策树模型的损失数据;
28.根据损失数据对每棵决策树进行调整,得到调整决策树模型。
29.进一步的,调整决策树模型包括结果输出层决策树和至少一棵决策层决策树;基于调整决策树模型,确定数据转移信息识别模型,包括:
30.确定至少一棵决策层决策树与结果输出层决策树的映射关系;
31.根据映射关系,将至少一棵决策层决策树与结果输出层决策树进行合并,得到数据转移信息识别模型。
32.第二方面,本技术实施例公开了一种数据转移信息的识别装置,装置包括:
33.获取模块,用于获取待识别的数据转移信息;
34.识别结果确定模块,用于将数据转移信息输入数据转移信息识别模型,得到数据转移信息识别模型输出的数据转移信息识别结果;数据转移信息识别结果用于表征数据转移信息为异常数据转移信息或非异常数据转移信息;
35.其中,数据转移信息识别模型为基于分类误差和全局信息增益对初始决策树模型进行强化学习得到的;初始决策树模型包括至少两棵决策树,分类误差为每棵决策树对分类数据进行分类的分类误差,全局信息增益用于表征所有决策树的分类结果,对初始决策树模型输出结果不确定性的降低程度;初始决策树模型为基于信息识别神经网络得到;信息识别神经网络为基于历史数据转移信息对多层神经网络进行训练得到,历史数据转移信息标注有非异常标注结果。
36.在一些可选的实施例中,获取模块包括:
37.对象转移信息获取单元,用于获取待识别的对象转移信息;
38.数据转移对象属性信息确定单元,用于在对象转移信息中确定至少一个数据转移对象属性信息;
39.属性值确定单元,用于基于预定义规则,确定每个数据转移对象属性信息所对应的属性值;
40.数据转移信息确定单元,用于将至少一个数据转移对象属性信息和每个数据转移对象属性信息所对应的属性值,作为数据转移信息。
41.在一些可选的实施例中,该装置还包括信息识别神经网络训练模块,信息识别神经网络训练模块包括:
42.历史数据转移信息获取单元,用于获取标注有非异常标注结果的历史数据转移信息;
43.信息识别结果确定单元,用于将历史数据转移信息输入多层神经网络中,得到多层神经网络输出的信息识别结果;
44.信息识别神经网络确定单元,用于根据非异常标注结果和信息识别结果,确定信息识别神经网络。
45.在一些可选的实施例中,该装置还包括始决策树模型确定模块,初始决策树模型确定模块包括:
46.映射关系确定单元,用于确定信息识别神经网络中每相邻两层神经网络的映射关系;
47.决策树构建单元,用于基于决策树生成算法,根据每个映射关系,构建至少两棵决策树;
48.初始决策树模型确定单元,用于将至少两棵决策树,作为初始决策树模型。
49.在一些可选的实施例中,该装置还包括初始决策树模型强化学习模块,初始决策树模型强化学习模块包括:
50.分类误差和全局信息增益确定单元,用于确定每棵决策树中被分类数据的分类误差和初始决策树模型的全局信息增益;
51.决策树模型确定单元,用于基于分类误差和全局信息增益,对每棵决策树进行调整,得到调整决策树模型;
52.数据转移信息识别模型确定单元,用于基于调整决策树模型,确定数据转移信息识别模型。
53.在一些可选的实施例中,决策树模型确定单元包括:
54.损失数据确定子单元,用于基于分类误差和全局信息增益,确定初始决策树模型的损失数据;
55.决策树模型调整子单元,用于根据损失数据对每棵决策树进行调整,得到调整决策树模型。
56.在一些可选的实施例中,调整决策树模型包括结果输出层决策树和至少一棵决策层决策树;数据转移信息识别模型确定单元包括:
57.映射关系确定子单元,用于确定至少一棵决策层决策树与结果输出层决策树的映射关系;
58.数据转移信息识别模型确定子单元,用于根据映射关系,将至少一棵决策层决策树与结果输出层决策树进行合并,得到数据转移信息识别模型。
59.第三方面,本技术实施例公开了一种电子设备,设备包括处理器和存储器,存储器
中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行如上所述的数据转移信息识别方法。
60.第四方面,本技术实施例公开了一种计算机可读存储介质,存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现如上所述的数据转移信息识别方法。
61.本技术实施例提供的技术方案具有如下技术效果:
62.该数据转移信息方法,利用多层神经网络对历史数据转移信息进行拟合得到信息识别神经网络,进而得到初始决策树模型,从而可以提高模型输出结果的可解释性。通过对初始决策树模型进行强化学习,获得数据转移信息识别模型。该模型可以通过持续的训练学习自动更新模型,从而保障识别准确率。
附图说明
63.为了更清楚地说明本技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
64.图1是本技术实施例提供的一种数据转移信息识别方法应用环境的示意图;
65.图2是本技术实施例提供的一种数据转移信息识别方法的流程示意图;
66.图3是本技术实施例提供的一种多层神经网络的结构示意图;
67.图4是本技术实施例提供的一种信息识别神经网络的训练方法的流程示意图;
68.图5是本技术实施例提供的一种初始决策树模型的强化学习方法的流程示意图;
69.图6是本技术实施例提供的一种数据转移信息的识别装置的结构示意图;
70.图7是本技术实施例提供的一种数据转移信息识别方法的服务器的硬件结构框图。
具体实施方式
71.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
72.需要说明的是,本技术实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术实施例的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
73.为了使本技术实施例公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术实施例进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用
以解释本技术实施例,并不用于限定本技术实施例。
74.以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
75.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
76.本技术实施例提供的方案涉及人工智能的机器学习领域。机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。本技术可以通过机器学习构建初始决策树模型,然后基于分类误差和全局信息增益对初始决策树模型进行强化学习得到数据转移信息识别模型,实现对数据转移信息的识别。
77.请参阅图1,图1是本技术实施例提供的一种数据转移信息识别方法应用环境的示意图,如图1所示,该应用环境可以至少包括终端设备101和服务器103。
78.本技术实施例中,终端设备101可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、智能音箱、车载终端、智能电视等类型的实体设备,但并不局限于此,也可以包括运行于实体设备中的软体,例如一些服务商提供给用户的网页页面,也可以为该些服务商提供给用户的应用。具体的,终端设备101可以用于向所述服务器103发送信息验证请求,信息验证请求中携带有数据转移信息,从而使服务器103对数据转移信息进行识别验证。
79.本技术实施例中,服务器103可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)以及大数据和人工智能平台等基础云计算服务的云服务器。服务器103可以包括有网络通信单元、处理器和存储器等等。具体的,服务器103为数据转移信息识别平台的内部系统服务器。服务器103可以对终端设备101所发送的信息验证请求进行处理,提取出信息验证请求中所携带的数据转移信息,并根据数据转移信息识别模型对所提取出的数据转移信息进行识别。服务器103还可以根据对数据转移信息的识别结果向终端设备101发送数据转移信息的识别结果。
80.本技术实施例中,终端设备101和服务器103之间可以通过通信链路进行连接。可
选的,该通信链路可以是有线链路,例如光纤、同轴电缆、电话线、网线等。该通信链路也可以是无线链路,例如红外线通信、蓝牙通信、紫蜂通信、无线局域网、蜂窝网络等。
81.以下介绍本技术一种数据转移信息识别方法的具体实施例,图2是本技术实施例提供的一种数据转移信息识别方法的流程示意图,本说明书提供了如实施例或流程图的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图2所示,该数据转移信息识别方法可以应用于服务器,该方法可以包括:
82.s201:获取待识别的数据转移信息。
83.本技术实施例中,服务器通过接收来自目标服务对象的信息验证请求来获取数据转移信息。目标服务对象可以是任意一个提交了信息验证请求的客户、商户或者用户,其相对于本技术实施例提供的数据转移信息识别平台的内部系统而言,可以认为其属于外部客户,外部客户可以通过任意一种电子设备,例如终端设备向数据转移信息识别平台发起信息验证请求。终端设备向所述服务器发送信息验证请求,信息验证请求中携带有数据转移信息,从而使服务器对数据转移信息进行识别验证。这里的信息验证请求以贸易真实性验证请求为例进行举例说明,但本技术并不限定于此。
84.作为一种可选的实施方式,信息验证请求中携带有对象转移信息,对象转移信息中包含有数据转移信息。服务器可以对信息验证请求进行解析,提取出信息验证请求中所携带的对象转移信息,进而可以获取到数据转移信息。具体的,服务器通过解析信息验证请求从而获取到待识别的对象转移信息,然后在对象转移信息中确定至少一个数据转移对象属性信息。服务器基于预定义规则,确定每个数据转移对象属性信息所对应的属性值,然后将至少一个数据转移对象属性信息和每个数据转移对象属性信息所对应的属性值,作为数据转移信息。该实施方式中,对象转移信息中包括多个数据转移对象属性信息,通过对每个数据转移对象属性信息进行离散化处理,确定出每个数据转移对象属性信息所对应的属性值。然后将每个数据转移对象属性信息和其所对应的属性值作为数据转移信息输入到数据转移信息识别模型中进行识别。在一些实施例中,也可以按照一定的顺序对数据转移对象属性信息进行排序,从而每个数据转移对象属性信息所对应的属性值也可以按照相应顺序组成数组。然后将该数组作为数据转移信息输入到数据转移信息识别模型中进行识别。
85.作为一种示例,在信息验证请求为贸易真实性验证请求时,对象转移信息可以是基于贸易真实性验证材料提取的具体贸易信息,数据转移信息可以是基于贸易信息提取的与商品交易相关的商品交易信息和相应的值。具体的,目标服务对象可以通过终端设备上传贸易真实性验证材料,终端设备将这些贸易真实性验证材料中的贸易信息发送至服务器。可选的,终端设备可以基于贸易真实性验证材料提取贸易信息,然后将贸易信息封装为信息验证请求发送给服务器。在一些实施例中,终端设备也可以将贸易真实性验证材料上传至服务器,服务器对这些贸易真实性验证材料提取出贸易信息。可选的,终端设备可以将贸易真实性验证材料直接封装为信息验证请求发送给服务器进行处理。可选的,终端设备还可以将贸易真实性验证材料上传至服务器,并向服务器发送信息验证请求。服务器在获取到贸易信息后,可以对贸易信息进行处理,确定出一下通用的商品交易信息,并将这些商
品交易信息进行离散化处理,得到每个商品交易信息的值,即确定每个数据转移对象属性信息所对应的属性值。例如,商品交易信息可以为:“商品交易数目”、“商品结算信息”、“商品物流信息”等,然后根据预定义的规则,确定每个商品交易信息的值。例如,“商品交易数目”的取值可以是实际的交易数量,“商品结算信息”的值可以按照预定义字符来表示,如“0”表示不存在,“1”表示存在。同样的,“商品物流信息”的值也可以按照预定义字符来表示,如“0”表示不存在,“1”表示存在。这些商品交易信息可以排列成一定的顺序,并为每个商品交易信息设置相应的序号。例如,x1:商品交易数目,x2:商品结算信息,x3:商品物流信息。同样地,每个商品交易信息所对应的值也可以按照相应的顺序进行排列,构成一个数组,例如,(3,1,1,
……
),代表商品交易数目为3,商品结算信息存在,商品物流信息存在。可选的,服务器在对数据转移信息进行验证时,可以将商品交易信息和对应的取值组合为矩阵作为输入数据,输入到数据转移信息识别模型中进行识别。可选的,服务器在对数据转移信息进行验证时,也可以将商品交易信息对应的取值作为输入数据集合,输入到数据转移信息识别模型中进行识别。
86.s203:将数据转移信息输入数据转移信息识别模型,得到数据转移信息识别模型输出的数据转移信息识别结果;数据转移信息识别结果用于表征数据转移信息为异常数据转移信息或非异常数据转移信息。
87.本技术实施例中,将数据转移信息输入到数据转移信息识别模型,数据转移信息识别模型通过对输入的数据转移信息进行识别,然后输出数据转移信息识别结果。数据转移信息识别结果用于表征数据转移信息为异常数据转移信息或非异常数据转移信息。数据转移信息识别模型为基于分类误差和全局信息增益对初始决策树模型进行强化学习得到的。初始决策树模型包括至少两棵决策树,分类误差为每棵决策树对分类数据进行分类的分类误差,全局信息增益用于表征所有决策树的分类结果,对初始决策树模型输出结果不确定性的降低程度。初始决策树模型为基于基于信息识别神经网络得到;信息识别神经网络为历史数据转移信息对多层神经网络进行训练得到,历史数据转移信息标注有非异常标注结果。
88.本技术实施例中,通过利用标注有非异常标注结果的历史数据转移信息对多层神经网络进行拟合,可以得到信息识别神经网络。多层神经网络可以包括输入层、至少一个隐藏层和输出层。图3是本技术实施例提供的一种多层神经网络的结构示意图示意图,如图3所示,该多层神经网络包括输入层、第一隐藏层、第二隐藏层和输出层。输入层用于接收输入数据,第一隐藏层用于对输入层输出的数据进行处理,第二隐藏层用于对第一隐藏层输出的数据进行处理,然后将处理结果输出到输出层,进而输出层通过对处理结果进行进一步处理的带最终的输出结果并将该结果进行输出。可选的,输入层和隐藏层可以包括多个节点,节点用于对输入数据进行处理,并向下一层的节点输出激活值。具体的,图4是本技术实施例提供的一种信息识别神经网络的训练方法的流程示意图,如图4所示,信息识别神经网络的训练方法可以包括:
89.s401:获取标注有非异常标注结果的历史数据转移信息。
90.本技术实施例中,在对多层神经网络进行模型训练时,首先需要获取训练数据集。可选的,训练数据集中包括多组历史数据转移信息,以及每组历史数据转移信息所对应的非异常标注结果。非异常标注结果指的是每组历史数据转移信息为异常数据转移信息或者
非异常数据转移信息。
91.s403:将历史数据转移信息输入多层神经网络中,得到多层神经网络输出的信息识别结果。
92.本技术实施例中,将历史数据转移信息作为输入数据输入到多层神经网络的输入层中,输入层中的每个节点以及隐藏层中的每个节点,对输入数据依次进行处理,最终得到输出层输出的信息识别结果。
93.s405:根据非异常标注结果和信息识别结果,确定信息识别神经网络。
94.本技术实施例中,非异常标注结果用于判断信息识别结果是否正确。通过对每个隐藏层的隐藏层参数进行调整,使非异常标注结果和信息识别结果完全一致,每个隐藏层中的隐藏层参数可以有多个,隐藏层参数表示每个节点对输入数据的处理结果。每个隐藏层参数确定后,可以得到信息识别神经网络。
95.本技术实施例中,由于信息识别神经网络为基于模型训练得到,信息识别神经网络所输出的结果存在可解释性差的问题。而对于数据转移信息的识别来说,不仅要求识别结果具有很高准确性,还需要识别结果具有很好的可解释性。本技术实施例采用决策树老对信息识别模型中每个神经元的输出进行拟合,从而提高输出结果的可解释性。
96.本技术实施例中,基于历史数据转移信息对多层神经网络拟合,得到信息识别神经网络后,再使用决策树生成算法对信息识别模型的数据处理过程进行拟合,得到初始决策树模型。在生成初始决策树模型中的每一棵决策树时,需要确定分类特征对输入数据进行分类,从而得到分类结果,该分类结果即为该决策树的输出结果。因此,在决策树生成过程中,首先需要确定对输入数据进行分类的分类特征。分类特征的选择,可以基于被该特征分类后的所得到数据集中数据的分类误差来确定。一般来说,数据被分类后所得到的分类数据集中,数据的分类误差越小则表明分类效果越好。在一些实施例中,分类特征的选择,也可以基于被该特征分类后的所得到数据集中数据的信息熵来确定。基于分类特征对输入决策树的输入数据进行分类,得到该组输入数据对应的分类结果,然后再将该分类结果作为下一棵决策树的输入数据,通过重新确定分类特征对输入数据进行分类,得到相应的分类结果。重复以上过程,可以构建多棵决策树,得到初始决策树模型。
97.本技术实施例中,信息识别神经网络包括多层的神经网络。每相邻两层神经网络之间存在输入与输出的映射关系,可以通过使用决策树来表征该映射关系。具体的,首先,确定信息识别神经网络中每相邻两层神经网络的映射关系,然后基于决策树生成算法,根据每个映射关系,构建至少两棵决策树,最后将至少两棵决策树,作为初始决策树模型。
98.本技术实施例中,初始决策树模型的所包含的决策树的数目与多层神经网络中隐藏层的层数有关。例如,对于一个包含两层隐藏层的多层神经网络,所生成的初始决策树模型包括:基于输入层与第一隐藏层所生成的输入层决策树、基于第一隐藏层与第二隐藏层所生成的决策层决策树,以及基于第二隐藏层和输出层所生成的输出层决策树。多层神经网络中相邻的两层可以生成一棵决策树,相邻两层神经网络的输入和输出,与对应的决策树的输入和输出相匹配。即相邻两层神经网络的输入与决策树的输入相匹配,相邻两层神经网络的输出与决策树的输出相匹配。这里的匹配指的是输入数据或输出结果近似相同或完全相同。例如,基于输入层与第一隐藏层所生成的输入层决策树,输入输入层决策树的输入数据与输入多层神经网络的输入层的输入数据相同。输入层决策树输出的数据与多层神
经网络的第一隐藏层所输出的数据大致相同或完全相同。基于第一隐藏层与第二隐藏层所生成的决策层决策树,其输入数据为输入层决策树所输出的结果,其输出的数据与多层神经网络中第二隐藏层所输出的结果近似相同或完全相同。作为一种示例,输入数据为x1和x2,则输入层与第一隐藏层之间的决策树可以表示为:if x1》0.5 and x2》0.6 then h
11
《=0.4。第一隐藏层与第二隐藏层之间的决策树可以表示为:if h
11
《=0.4 and h
12
》0.4 then h
23
《=0.5.第二隐藏层与输出层的决策树可以表示为:if h
21
》0.6 and h
23
》0.3 then o=0等决策树,其中,h
11
、h
12
、h
21
、h
23
为多层神经网络中隐藏层的隐藏层参数。
99.作为一种可选的实施方式,将数据转移信息输入多层神经网络,利用多层神经网络进行拟合,计算隐藏层参数。然后使用决策树生成算法,对于每条数据,生成包含隐层参数的多层次决策树。可选的,使用的决策树算法包括但不仅限于id3算法、c4.5算法、cart(classification and regression tree,分类回归树)算法等。在使用决策树生成算法生成初始决策树模型时,初始输入数据为数据转移信息,经过第一棵决策树分类后,得到该决策树分类结果。然后将该分类结果会作为下一棵决策树的输入,最终得到初始决策树模型分类结果。具体的,将数据转移信息输入多层全连接神经网络,设多层神经网络共m层,输出层记为第1层,输出层数记为第m层,每个神经网络节点数记为qj,1≤j≤m,q1=n,qm=1。对多层神经网络进行拟合,计算隐藏层参数。使用决策树生成算法,如cart算法对于每条数据,生成包含隐层参数的多层次决策树,多层次决策树t记为{t
jk
|1≤j≤m-1,1≤k≤q
j+1
},其中t
jk
表示由第j层神经网络的输出值作为决策树输入变量,第j+1层中的第k个神经网络节点输入值作为决策树目标变量,生成的决策树。
100.本技术实施例中,初始决策树模型中,每棵决策树所输出的分类结果,与与其对应的两层神经网络所输出的结果之间可能存在一定的误差。此外,初始决策树模型所输出的分类结果,与信息识别模型所输出的结果之间也可以存在一定的误差。因此,可以基于每棵决策树分类误差和全局信息增益对初始决策树模型进行强化学习,得到数据转移信息识别模型,提高对数据转移信息的识别准确度。具体的,图5是本技术实施例提供的一种初始决策树模型的强化学习方法的流程示意图,如图5所示,初始决策树模型的强化学习方法可以包括:
101.s501:确定每棵决策树中被分类数据的分类误差和初始决策树模型的全局信息增益。
102.本技术实施例中,在强化学习过程中,对于每棵决策树而言,输入数据被所选择的分类特征分类后,计算每个被分类数据集中数据的分类误差。分类误差可以用局部均方误差来表示。局部均方误差具体的计算方式为,先计算决策树输出数据与相应的两层神经网络所输出数据之间的差值,然后再计算该差值的平方。对于初始决策树模型中的每一棵决策树而言,在选择某个分类特征对输入数据进行分类后,还需要确定该选择对于最终输出结果所产生的全局信息增益。强化学习旨在令模型从回报中学习优化控制策略,进而使累计回报最大,从而获得更优秀的结果。
103.s503:基于分类误差和全局信息增益,对每棵决策树进行调整,得到调整决策树模型。
104.本技术实施例中,基于分类误差和全局信息增益,对每棵决策树进行调整,调整的原则是在保证最终全局信息增益最大的前提下,使每个分类数据的数据的分类误差最小。
具体的,基于分类误差和全局信息增益,确定初始决策树模型的损失数据。然后,根据损失数据对每棵决策树进行调整,得到调整决策树模型。
105.作为一种可选的实施方式,使用强化学习思想对初始决策树模型进行优化。通过采用对局部均方误差进行累计计算,对每棵决策树进行优化。并全局信息增益为决策树生成模型生成的决策树的全局信息增益,对多层次决策树进行全局优化。具体的,对每棵决策树t
jk
分别依次进行优化,对局部均方误差进行累计计算。由于对每棵决策树t
jk
优化时,对整个多层次决策树t也将造成影响,采用全局信息增益对多层次决策树进行全局优化。使用局部均方误差与全局信息增益相结合的方法确定损失函数,并根据损失函数优化决策树,损失函数可以用如下公式表示:
[0106][0107]
其中,a为局部均方误差的权重。m为多层神经网络的层数,输出层记为第1层,输出层数记为第m层。qj为每个神经网络节点数记,1≤j≤m,q1=n,qm=1。k表示第j+1层中的第k个神经网络节点。b为全局全局信息增益的权重。t
jk
(x)为t
jk
决策树中的被分类数据,h
jk
为与决策树t
jk
对应的相邻两层神经网络所输出的数据,(t
jk
(x)-h
jk
)2为t
jk
决策树输出的局部均方误差。gain(s,t
jk
)表示对t
jk
决策树优化前后对多层次决策树t的全局全局信息增益,gain(s,t
jk
)可以用如下公式表示:
[0108]
gain(s,t
jk
)=ent(s)-ent(s|t
jk
);
[0109]
公式(2)。
[0110]
其中,ent(s)为在对t
jk
决策树优化前数据集类别信息熵,ent(s|t
jk
)为在对t
jk
决策树优化后数据集类别信息熵。策树优化后数据集类别信息熵。式中,yj表示样本的预测值属于当前类的概率,k为决策树t
jk
的叶子节点个数,sj为叶子节点对应的子集,|sj|为子集中元素个数。
[0111]
该实施方式中,根据损失函数计算的损失数据,对初始决策树模型进行局部优化和全局优化,调整初始决策树模型的结构以及每个分类特征对应的数据。通过不断优化损失函数,直到损失函数l收敛到一个很小的正数,比如0.0001,终生成结果较好的调整决策树模型,调整决策树模型包含隐层参数的多层次决策树。
[0112]
s505:基于调整决策树模型,确定数据转移信息识别模型。
[0113]
本技术实施例中,基于分类误差和全局信息增益对初始决策树模型进行强化学习后,所得到的调整决策树模型。调整决策树模型包括多棵包含隐层参数的决策树,在得到包含多层次决策树的调整决策树模型之后,将会从后往前进行决策树的合并,在合并时,后一棵决策树的决策条件为前一棵决策树的输出,因此可以进行合成,进而合成不含隐藏参数的决策树,即得到从输入到输出的决策树,该决策树即为数据转移信息识别模型。
[0114]
本技术实施例中,初始决策树模型在强化学习过程中,主要考虑的是如何提高对数据的正确分类,从而构建了过于复杂的决策树,可能会产生过拟合现象。因此,可以对调整决策树模型进行简化。具体的,调整决策树模型包括至少一棵决策层决策树和结果输出层决策树。基于调整决策树模型,确定数据转移信息识别模型可以包括:首先,确定至少一
棵决策层决策树与结果输出层决策树的映射关系。然后根据映射关系,将至少一棵决策层决策树与结果输出层决策树进行合并,得到数据转移信息识别模型。
[0115]
作为一种可选的实施方式,在包含多棵决策树的调整决策树模型生成之后,由于决策树模型为基于多层神经网络生成,多层神经网络中前一层与中节点的输出值与后一层中节点的输出值之间存在映射关系。因此,可以基于多层神经网络中相邻两层之间的关联关系,将调整决策树模型进行合并。作为一种示例,以包含输入层、两层隐藏层和输出层的多层神经网络为例,第二隐藏层每个节点与输出层中输出节点之间存在映射关系,根据该映射关系可以将第二隐藏层与输出层进行合并得到合并层,进而可以将基于第一隐藏层与第二隐藏层所生成的决策层决策树和基于第二隐藏层和输出层所生成的输出层决策树,进行合并得到合并决策树。然后第一隐藏层每个节点与第二隐藏层每个节点之间存在映射关系,根据该映射关系可以将第二隐藏层与合并层进行合并,进而可以将基于输入层与第一隐藏层所生成的输入层决策树与基合并决策树进行合并,得到仅包含输入和输出两层结构的数据转移信息识别模型。
[0116]
本技术实施例提供的数据转移信息识别方法,首先对数据转移对象属性信息进行离散化处理,得到数据转移信息。然后将数据转移信息输入到多层神经网络,利用多层神经网络进行拟合,确定出每个隐藏层的隐藏层参数,并使用决策树生成算法生成包含多棵决策树的初始决策树模型。接着使用局部优化和全局优化方法对包含多棵决策树的初始决策树模型进行优化并调整参数,得到调整决策树模型,并通过将多棵决策树进行合并得到数据转移信息识别模型。最后,试用数据转移信息识别模型对待验证的数据转移信息进行验证从而获得数据转移信息识别结果。数据转移信息识别模型在结构上具备隐藏层的分布式表示能力,比统计规则识别的方式更加准确,同时可以通过持续的训练学习自动更新模型,保障识别准确率。该数据转移信息识别方法引入强化学习中的局部优化和全局优化方法,对包含隐层参数的多棵决策树进行优化和调整,最终将多棵决策树合并成只包含一颗决策树的数据转移信息识别模型,实现了将模型的决策过程透明化,大幅增加了模型输出结果的可解释性。
[0117]
本技术实施例还提供了一种数据转移信息的识别装置,图6是本技术实施例提供的一种数据转移信息的识别装置的结构示意图,如图6所示,装置包括:
[0118]
获取模块601,用于获取待识别的数据转移信息。
[0119]
识别结果确定模块603,用于将数据转移信息输入数据转移信息识别模型,得到数据转移信息识别模型输出的数据转移信息识别结果。数据转移信息识别结果用于表征数据转移信息为异常数据转移信息或非异常数据转移信息。
[0120]
其中,数据转移信息识别模型为基于分类误差和全局信息增益对初始决策树模型进行强化学习得到的。初始决策树模型包括至少两棵决策树,分类误差为每棵决策树对分类数据进行分类的分类误差,全局信息增益用于表征所有决策树的分类结果,对初始决策树模型输出结果不确定性的降低程度。初始决策树模型为基于信息识别神经网络得到;信息识别神经网络为基于历史数据转移信息对多层神经网络进行训练得到,历史数据转移信息标注有非异常标注结果。
[0121]
在一些可选的实施例中,获取模块包括:
[0122]
对象转移信息获取单元,用于获取待识别的对象转移信息。
[0123]
数据转移对象属性信息确定单元,用于在对象转移信息中确定至少一个数据转移对象属性信息。
[0124]
属性值确定单元,用于基于预定义规则,确定每个数据转移对象属性信息所对应的属性值。
[0125]
数据转移信息确定单元,用于将至少一个数据转移对象属性信息和每个数据转移对象属性信息所对应的属性值,作为数据转移信息。
[0126]
在一些可选的实施例中,该装置还包括信息识别神经网络训练模块,信息识别神经网络训练模块包括:
[0127]
历史数据转移信息获取单元,用于获取标注有非异常标注结果的历史数据转移信息。
[0128]
信息识别结果确定单元,用于将历史数据转移信息输入多层神经网络中,得到多层神经网络输出的信息识别结果。
[0129]
信息识别神经网络确定单元,用于根据非异常标注结果和信息识别结果,确定信息识别神经网络。
[0130]
在一些可选的实施例中,该装置还包括始决策树模型确定模块,初始决策树模型确定模块包括:
[0131]
映射关系确定单元,用于确定信息识别神经网络中每相邻两层神经网络的映射关系。
[0132]
决策树构建单元,用于基于决策树生成算法,根据每个映射关系,构建至少两棵决策树。
[0133]
初始决策树模型确定单元,用于将至少两棵决策树,作为初始决策树模型。
[0134]
在一些可选的实施例中,该装置还包括初始决策树模型强化学习模块,初始决策树模型强化学习模块包括:
[0135]
分类误差和全局信息增益确定单元,用于确定每棵决策树中被分类数据的分类误差和初始决策树模型的全局信息增益。
[0136]
决策树模型确定单元,用于基于分类误差和全局信息增益,对每棵决策树进行调整,得到调整决策树模型。
[0137]
数据转移信息识别模型确定单元,用于基于调整决策树模型,确定数据转移信息识别模型。
[0138]
在一些可选的实施例中,决策树模型确定单元包括:
[0139]
损失数据确定子单元,用于基于分类误差和全局信息增益,确定初始决策树模型的损失数据。
[0140]
决策树模型调整子单元,用于根据损失数据对每棵决策树进行调整,得到调整决策树模型。
[0141]
在一些可选的实施例中,调整决策树模型包括至少一棵决策层决策树和结果输出层决策树。数据转移信息识别模型确定单元包括:
[0142]
映射关系确定子单元,用于确定至少一棵决策层决策树与结果输出层决策树的映射关系。
[0143]
数据转移信息识别模型确定子单元,用于根据映射关系,将至少一棵决策层决策
树与结果输出层决策树进行合并,得到数据转移信息识别模型。
[0144]
本技术实施例中的数据转移信息的识别装置与数据转移信息识别方法实施例基于同样地申请构思,关于数据转移信息的识别装置具体实施情况,请参考数据转移信息识别方法的具体实施方式,在此不再赘述。
[0145]
本技术实施例还提供了一种电子设备,设备包括处理器和存储器,存储器中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行如上所述的数据转移信息识别方法。
[0146]
本技术实施例所提供的数据转移信息识别方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图7是本技术实施例提供的一种数据转移信息识别方法的服务器的硬件结构框图。如图7所示,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,cpu)710(处理器710可以包括但不限于微处理器mcu或可编程逻辑器件(field programmable gate array,fpga)等的处理装置)、用于存储数据的存储器730,一个或一个以上存储应用程序723或数据722的存储介质720(例如一个或一个以上海量存储设备)。其中,存储器730和存储介质720可以是短暂存储或持久存储。存储在存储介质720的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器710可以设置为与存储介质720通信,在服务器700上执行存储介质720中的一系列指令操作。服务器700还可以包括一个或一个以上电源760,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口740,和/或,一个或一个以上操作系统721,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm等等。
[0147]
输入输出接口740可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器700的通信供应商提供的无线网络。在一个实例中,输入输出接口740包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口740可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0148]
本领域普通技术人员可以理解,图7所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器700还可包括比图7中所示更多或者更少的组件,或者具有与图7所示不同的配置。
[0149]
本技术实施例还提供了一种计算机可读存储介质,存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现如上所述的数据转移信息识别方法。
[0150]
本技术实施例中,上述计算机存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选的,该计算机可读存储介质可以包括:只读存储器(readonlymemory,rom)、随机存取记忆体(randomaccessmemory,ram)、固态硬盘(solidstatedrives,ssd)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(resistancerandomaccessmemory,reram)和动态随机存取存储器(dynamicrandomaccessmemory,dram)。
[0151]
需要说明的是:上述本技术实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一
些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0152]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0153]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0154]
以上所述仅为本技术的较佳实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1