基于循环神经网络的大数据轮廓查询处理方法与流程

文档序号：12786489阅读：来源：国知局

技术特征：

1.一种基于循环神经网络的大数据轮廓查询确认方法，其特征在于，包括如下步骤：

步骤1，轮廓对象离线学习，通过两个阶段实现：

在第一阶段中，对于k维大数据对象集合D，首先根据D所在领域的数据分布特征生成规模较小的领域数据对象集合M＝{s₁[d₁,…,d_k],s₂[d₁,…,d_k],…,s_m[d₁,…,d_k]}，其中m为M中的对象个数，进而获取M上的轮廓对象集SM和非轮廓对象集NM，在此基础上，构造离线学习样本集合Ψ＝{<s_i[d₁,…,d_k],w>|1≤i≤m}，w为轮廓对象标识符，取值为0或1，如果s_i[d₁,…,d_k]是M上的轮廓对象，那么w为1，否则为0；

在第二阶段中，首先对于离线学习样本集合Ψ中的每个样本<s_i[d₁,…,d_k],w>，将s_i[d₁,…,d_k]中的第d_j维(1≤j≤k)分量s_i[d_j]转换成一个长度为t的向量v(s_i[d_j])，从而，每个样本<s_i[d₁,…,d_k],w>对应k个t维向量v(s_i[d₁]),v(s_i[d₂]),…,v(s_i[d_k])，即Ψ＝{<(v(s_i[d₁]),v(s_i[d₂]),…,v(s_i[d_k])),w>|1≤i≤m}。然后，基于向量化之后的离线学习样本集合Ψ，构造k步循环神经网络学习模型k-RNN(Recurrent Neural Networks)。k-RNN学习模型顺序链接k个循环神经网络构件RNN₁,RNN₂,…,RNN_k，并迭代处理Ψ中的每个向量化样本<(v(s_i[d₁]),v(s_i[d₂]),…,v(s_i[d_k])),w>，处理过程为：循环神经网络构件RNN₁接收t维向量v(s_i[d₁])，并产生中间向量v₁，循环神经网络构件RNN₂,…,RNN_k-1分别接收t维向量v(s_i[d_k-1])和中间向量v_k-2，并产生中间向量v_k-1，而循环神经网络构件RNN_k接收t维向量v(s_i[d_k])和中间向量v_k-1，并输出[0,1]区间中的一个数ot；当ot计算出来之后，将w与ot之间的差值w-ot当作本次迭代的误差依次在RNN_k,…,RNN₂,RNN₁中传播来修改它们对应的权重参数。当模型收敛之后，迭代过程终止，并得到最终的k-RNN学习模型；

步骤2，轮廓对象在线识别：

针对待处理的k维大数据对象集合D＝{p₁[d₁,…,d_k],p₂[d₁,…,d_k],…,p_n[d₁,…,d_k]}，并接收用户给出的轮廓度阈值γ，并基于轮廓对象离线学习模块中构造的k-RNN学习模型，依次处理D中的每个数据对象p_z[d₁,…,d_k](1≤z≤n)，处理过程为：首先分别将该对象中的k个分量转换成k个t维向量v(p_z[d₁]),v(p_z[d₂]),…,v(p_z[d_k])，然后将这k个t维向量输入到k-RNN学习模型中，并获得[0,1]区间中的一个数ot_z，接着，判断ot_z是否大于轮廓度阈值γ，如果ot_z大于γ，那么识别p_z[d₁,…,d_k]为轮廓对象，否则识别为非轮廓对象。最后将所有识别为轮廓对象的数据对象返回给用户。

完整全部详细技术资料下载

当前第2页1 2 3