本发明涉及计算机,尤其是涉及一种基于深度学习的政务材料的标准化预测方法。
背景技术:
1、政府部门承担着广泛的职能,涉及法律、政策制定、社会福利、经济发展、卫生保健、教育、基础设施建设、环境保护等多个领域。在这些智能范围内,涉及到越来越多的办事事项,它涵盖了法律和司法事务、财政税收事务、教育事务、卫生医疗事务、社会保障事务、劳动就业事务、经济商业事务、环境和自然资源事务、城市规划事务、文化和娱乐事务、社区和居民事务、农业农村事务、旅游文化事务等。在这些事务中存在这许多事项流程。比如在房屋等建筑物、构筑物所有权登记事项中,会涉及到一系列的申请材料目录,包含了房屋等级所需要的材料名称。需要将这些原始材料名称映射为标准材料名称,标准材料主体、标准材料简称、标准材料说明以及适用情形。
2、由于传统的处理方法依靠人工从excel表中进行比对,找出其中标准材料名称,非常消耗人力、物力和财力,而且得不到准确的结果。
技术实现思路
1、本发明提供了一种基于深度学习的政务材料的标准化预测方法,以解决现有技术中原始材料名称映射为标准材料名称,标准材料主体、标准材料简称、标准材料说明以及适用情形,消耗人力、物力和财力,而且得不到准确的结果的技术问题。
2、本发明的一个方面在于提供一种基于深度学习的政务材料的标准化预测方法,所述预测方法包括如下方法步骤:
3、s1、收集数据集,所述数据集包括原始材料名称;
4、s2、对收集的数据集进行标注,包括:使用分隔符对原始材料名称标注为标准材料主体、标准材料简称和适用情形作为标准材料名称;
5、其中,所述标准材料主体为拟办理的政务事项,所述标准材料简称为拟办理的政务事项的主体的身份信息,所述适用情形为办理的政务事项;
6、s3、将所述原始材料名称作为政务材料名称标准化模型的输入,标准材料名称作为政务材料名称标准化模型输出,对政务材料名称标准化模型进行训练,并对训练后的政务材料名称标准化模型进行评价;
7、s4、获取需要进行标准化的原始材料名称,并输入到训练后的所述政务材料名称标准化模型,并输出需要进行标准化的原始材料名称对应的标准材料名称。
8、在进一步优选的实施例中,在步骤s1中,所述预测方法包括对原始材料名称进行数据增强:
9、通过语义相似度对收集的原始材料名称进行相似度计算,选取相似度最高的两个原始材料名称对数据集进行扩展。
10、在进一步优选的实施例中,在步骤s1中,所述数据集包括,某一个行政区划中收集的原始材料名称,以及跨行政区划收集的原始材料名称。
11、在进一步优选的实施例中,在步骤s3中,输入政务材料名称标准化模型的原始材料名称连接一个任务描述。
12、在进一步优选的实施例中,在步骤s3中,原始材料名称和原始材料名称连接的任务描述,以词嵌入向量输入政务材料名称标准化模型进行训练。
13、在进一步优选的实施例中,在步骤s3中,通过如下方法对训练后的政务材料名称标准化模型:
14、
15、其中,accuracy为训练后的政务材料名称标准化模型的输出正确率,number ofcorrect predictions为政务材料名称标准化模型输出的标准材料名称正确的样本数量,total number of predictions为输入政务材料名称标准化模型的原始材料名称的样本数量。
16、在进一步优选的实施例中,所述政务材料名称标准化模型至少包括编码器;
17、原始材料名称和原始材料名称连接的任务描述,以词嵌入向量输入政务材料名称标准化模型的编码器进行训练。
18、在进一步优选的实施例中,所述政务材料名称标准化模型至少包括解码器;
19、在步骤s4中,需要进行标准化的原始材料名称,以词嵌入向量输入到训练后的政务材料名称标准化模型的解码器,输出需要进行标准化的原始材料名称对应的标准材料名称。
20、在进一步优选的实施例中,在步骤s4中,训练后的政务材料名称标准化模型,输出的需要进行标准化的原始材料名称对应的标准材料名称,存入标准材料名称库;
21、所述预测方法还包括:
22、s5、当办理政务事项的主体提交身份信息后,根据标准材料简称在标准材料名称库中查找对应的标准材料名称;
23、s6、当标准材料名称库中存在办理政务事项的主体对应的标准材料名称,则办理政务事项的主体无需提交材料;
24、s7、当标准材料名称库中不存在办理政务事项的主体应的标准材料名称,则办理政务事项的主体提交材料。
25、本发明的另一个方面在于提供一种计算机存储介质,所述计算机存在介质用于执行计算机指令,所述计算机指令用于执行本发明提供的一种基于深度学习的政务材料的标准化预测方法。
26、与现有技术相比,本发明具有以下有益效果:
27、本发明提供的一种基于深度学习的政务材料的标准化预测方法,采用深度学习方法识别得到标准化材料名称等信息,进一步标准化了标准材料名称库的,为材料在更广泛的业务场景中复用奠定了更好的基础。
28、本发明提供的一种基于深度学习的政务材料的标准化预测方法,适用于政务事项办理中申请材料目录中申请材料名称的智能拆解,能够有效的提高材料拆解的准确性,并且提高拆解的效率。
1.一种基于深度学习的政务材料的标准化预测方法,其特征在于,所述预测方法包括如下方法步骤:
2.根据权利要求1所述的预测方法,其特征在于,在步骤s1中,所述预测方法包括对原始材料名称进行数据增强:
3.根据权利要求1所述的预测方法,其特征在于,在步骤s1中,所述数据集包括,某一个行政区划中收集的原始材料名称,以及跨行政区划收集的原始材料名称。
4.根据权利要求1所述的预测方法,其特征在于,在步骤s3中,输入政务材料名称标准化模型的原始材料名称连接一个任务描述。
5.根据权利要求4所述的预测方法,其特征在于,在步骤s3中,原始材料名称和原始材料名称连接的任务描述,以词嵌入向量输入政务材料名称标准化模型进行训练。
6.根据权利要求1所述的预测方法,其特征在于,在步骤s3中,通过如下方法对训练后的政务材料名称标准化模型:
7.根据权利要求5所述的预测方法,其特征在于,所述政务材料名称标准化模型至少包括编码器;
8.根据权利要求1所述的预测方法,其特征在于,所述政务材料名称标准化模型至少包括解码器;
9.根据权利要求1所述的预测方法,其特征在于,在步骤s4中,训练后的政务材料名称标准化模型,输出的需要进行标准化的原始材料名称对应的标准材料名称,存入标准材料名称库;
10.一种计算机存储介质,其特征在于,所述计算机存在介质用于执行计算机指令,所述计算机指令用于执行权利要求1至9中任一权利要求所述的预测方法。