本申请涉及数据处理,具体涉及一种文档自动生成方法、装置、存储介质及电子设备。
背景技术:
1、论文、法律文书、公文等作为比较正式的文档,其行文格式和文字排版具有一定的规范性。这就要求文档编写者不但要熟知本领域的专业知识,同时也需要熟知文档格式要求,并能够熟练使用具有一定的文档编辑能力的文档编辑工具,而直接使用文档编辑工具形成规范格式体例仍需要文档编辑者大量的学习和操作。
2、因此,通过人工编写文档的方式需要耗费大量的时间,文档的产出效率较为低下。
技术实现思路
1、本申请实施例提供了一种文档自动生成方法、装置、存储介质及电子设备,可以提高文档的产出效率。
2、第一方面,本申请实施例提供了一种文档自动生成方法,包括:
3、获取至少一个源文档;
4、对至少一个所述源文档进行预处理,得到至少一组关键信息;
5、对至少一组所述关键信息进行整合,生成至少一个初级文档;
6、判断所述初级文档是否符合预期;
7、若是,则将所述初级文档作为目标文档。
8、在本申请实施例提供的文档自动生成方法中,所述对至少一个所述源文档进行预处理,得到至少一组关键信息,包括:
9、对至少一个所述源文档依次进行文档语义识别、文档分类和关键词提取,得到至少一组关键信息。
10、在本申请实施例提供的文档自动生成方法中,所述对至少一个所述源文档依次进行文档语义识别、文档分类和关键词提取,得到至少一组关键信息,包括:
11、对至少一个所述源文档依次进行文档结构识别和文档语义理解,生成至少一个结构化文档;
12、获取所述结构化文档的文档类别,并根据所述文档类别对所述结构化文档进行分组;
13、根据所述文档类别分别对每一组所述结构化文档进行关键词提取,得到至少一组关键信息。
14、在本申请实施例提供的文档自动生成方法中,所述根据所述文档类别分别对每一组所述结构化文档进行关键词提取,得到至少一组关键信息,包括:
15、根据所述文档类别选取目标关键词提取模型;
16、将至少一组所述结构化文档输入至所述目标关键词提取模型,输出所述至少一组的关键信息。
17、在本申请实施例提供的文档自动生成方法中,所述对至少一个所述源文档依次进行文档结构识别和文档语义理解,生成至少一个结构化文档,包括:
18、对所述源文档进行文档结构识别,得到目标文档内容;
19、对所述目标文档内容进行文档语义理解,得到结构化文档。
20、在本申请实施例提供的文档自动生成方法中,所述对至少一组所述关键信息进行整合,生成至少一个初级文档,包括:
21、根据预设文档需求分别对每一组所述关键信息进行格式调整和布局处理,生成至少一个初级文档。
22、在本申请实施例提供的文档自动生成方法中,在将所述初级文档作为目标文档之后,还包括:
23、对所述目标文档进行分类存储。
24、第二方面,本申请实施例提供了一种文档自动生成装置,包括:
25、获取单元,用于获取至少一个源文档;
26、处理单元,用于对至少一个所述源文档进行预处理,得到至少一组关键信息;
27、整合单元,用于对至少一组所述关键信息进行整合,生成至少一个初级文档;
28、判断单元,用于判断所述初级文档是否符合预期;
29、输出单元,用于当初级文档符合预期时,将所述初级文档作为目标文档。
30、第三方面,本申请提供了一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述任一项所述的文档自动生成方法。
31、第四方面,本申请提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述任一项所述的文档自动生成方法。
32、综上所述,本申请实施例提供的文档自动生成方法包括获取至少一个源文档;对至少一个所述源文档进行预处理,得到至少一组关键信息;对至少一组所述关键信息进行整合,生成至少一个初级文档;判断所述初级文档是否符合预期;若是,则将所述初级文档作为目标文档。本方案可以通过对源文档进行预处理,得到关键信息,然后再对关键信息进行整合自动生成文档,减少了人工的参与,进而提高文档的产生效率。
1.一种文档自动生成方法,其特征在于,包括:
2.如权利要求1所述的文档自动生成方法,其特征在于,所述对至少一个所述源文档进行预处理,得到至少一组关键信息,包括:
3.如权利要求2所述的文档自动生成方法,其特征在于,所述对至少一个所述源文档依次进行文档语义识别、文档分类和关键词提取,得到至少一组关键信息,包括:
4.如权利要求3所述的文档自动生成方法,其特征在于,所述根据所述文档类别分别对每一组所述结构化文档进行关键词提取,得到至少一组关键信息,包括:
5.如权利要求3所述的文档自动生成方法,其特征在于,所述对至少一个所述源文档依次进行文档结构识别和文档语义理解,生成至少一个结构化文档,包括:
6.如权利要求1所述的文档自动生成方法,其特征在于,所述对至少一组所述关键信息进行整合,生成至少一个初级文档,包括:
7.如权利要求1所述的文档自动生成方法,其特征在于,在将所述初级文档作为目标文档之后,还包括:
8.一种文档自动生成装置,其特征在于,包括:
9.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1-7任一项所述的文档自动生成方法。
10.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的文档自动生成方法。