1.一种基于结构化数据的预测方法,其特征在于,包括以下内容:
获取所述结构化数据元组x=<x1,x2,…xj,…xm>,xj表示第j个属性值,m表示所述结构化数据属性的个数;
将属性值xj转换为嵌入向量表示ej,j∈{1,2,…,m};
使用多个指数神经元基于所述嵌入向量建模所述x的特征相互作用;
将所有所述特征相互作用聚合构建所述x的特征向量;
基于所述特征向量进行分类预测。
2.根据权利要求1所述的方法,其特征在于,所述将属性值xj转换为嵌入向量表示ej的过程如下:当所述xj为数值型时,先根据该属性值域范围缩放到(0,1]区间内,再与预学习的嵌入向量相乘;当所述xj为分类型时,直接根据其值索引对应预学习的嵌入向量。
3.根据权利要求1或2所述的方法,其特征在于,所述建模所述x的特征相互作用时,阶数非固定。
4.根据权利要求3所述的方法,其特征在于,所述指数神经元的个数为k×o个,其中,k表示注意头的个数,o表示每个注意头的所述指数神经元的数目,k和o都是自然数;每个注意头的所有所述指数神经元共享其双线性注意函数的权重矩阵watt;
每个注意头的第i个指数神经元yi表示如下:
其中,i,⊙表示哈达玛积,exp(·)函数和相应的指数wij按元素应用,ej表示所述结构化数据第j个属性值对应的嵌入向量,i,j,m,ne均为自然数,1≤i≤o,1≤j≤m,m表示所述结构化数据属性的个数,
wi=zi⊙vi;
其中,
其中,
5.根据权利要求4所述的方法,其特征在于,所述聚合为向量拼接。
6.根据权利要求5所述的方法,其特征在于,基于所述特征向量进行分类预测前先通过多层感知器mlp捕获元素的非线性特征交互,并获得编码关系的向量表示h:
其中,nh表示非线性特征交互尺寸,为自然数。
7.根据权利要求6所述的方法,其特征在于,所述分类预测通过下式进行:
其中,
8.根据权利要求7所述的方法,其特征在于,将所述方法与dnn结合进行目标预测。
9.根据权利要求3-8任一项所述的方法,其特征在于,将所述多个指数神经元的vi加和平均后的排序作为所述结构化数据中各属性对目标预测的影响程度排名。
10.根据权利要求3-8任一项所述的方法,其特征在于,将所述多个指数神经元的wi加和平均后的排序作为当前所述元组中各属性值对目标预测结果的影响程度排名。