一种演示文档的生成方法、装置、电子设备及存储介质与流程

文档序号：31177870发布日期：2022-08-17 10:26阅读：44来源：国知局

1.本技术涉及计算机技术领域，尤其涉及一种演示文档的生成方法、装置、电子设备及存储介质。

背景技术：

2.随着计算机技术的发展，越来越多的技术(大数据、分布式、区块链blockchain、人工智能等)应用在金融领域，传统金融业正在逐步向金融科技(fintech)转变，但由于金融行业的安全性、实时性要求，也对文档转换技术提出了更高的要求。目前所有的开源文档台只能提供传统的文档功能，没有文档对应代码的双向转换或生成代码功能。而且在开源文档平台中，从文档到代码的开发成本较高，无法完全实现自动化创建文档，导致开发人员对开源文档平台中的文档维护成本较高，同时在文档转换过程中容易出现因格式不兼容导致文档转换失败。

技术实现要素：

3.为了解决上述技术问题或者至少部分地解决上述技术问题，本技术提供了一种演示文档的生成方法、装置、电子设备及存储介质。
4.根据本技术实施例的一个方面，提供了一种演示文档的生成方法，包括：
5.获取待进行转换操作的目标格式文档，其中，所述目标格式文档中包括不同格式的文档内容；
6.解析所述目标格式文档，并提取所述目标格式文档携带的至少一项文档内容，以及每项文档内容对应的格式信息；
7.按照所述格式信息与预设格式信息的匹配度对所述文档内容划分，得到第一文档内容以及第二文档内容，所述预设格式为演示文档所支持的格式；
8.将所述第二文档内容转换为语音文件，在所述预设演示文档中写入第一文档内容以及所述语音文件，得到目标演示文档。
9.进一步的，所述解析所述目标格式文档，并提取所述目标格式文档携带的至少一项文档内容，以及每项文档内容对应的格式信息，包括：
10.利用预设规则识别所述目标格式文档的全部文档内容，得到所述全部文档内容所携带的至少一个格式信息；
11.从所述全部文档内容中提取每个格式信息对应的文本内容。
12.进一步的，所述利用预设规则识别所述目标格式文档的全部文档内容，得到所述全部文档内容所携带的至少一个格式信息，包括：
13.检测所述全部文档内容，提取所述全部文档内容对应的文档特征；
14.按照所述文档特征对所述全部文档内容进行分类，得到至少一种内容类型的待处理文档内容，其中，所述内容类型包括：文本类型、图像类型、表格类型；
15.按照所述内容类型对应的识别策略，识别所述待处理文档内容中携带的至少一个
格式信息。
16.进一步的，所述按照所述格式信息与预设格式信息的匹配度对所述文档内容划分，得到第一文档内容以及第二文档内容，包括：
17.计算所述格式信息与所述预设格式信息之间的匹配度；
18.将所述格式信息与所述预设格式信息的匹配度大于或等于预设匹配度的文档内容确定为所述第一文档内容，将所述格式信息与所述预设格式信息的匹配度小于预设匹配度的文档内容确定为所述第二文档内容。
19.进一步的，所述在所述预设演示文档写入中第一文档内容以及所述语音文件，得到目标演示文档，包括：
20.将所述第一文档内容写入所述预设演示文档，得到初始演示文档；
21.确定所述初始演示文档中的分页节点，并按照所述分页节点对所述初始演示文档进行分页，得到分页后的初始演示文档；
22.从所述全部文档内容中获取所述第二文档内容的相邻文档内容，并确定所述相邻文档内容在所述分页后的初始演示文档中的第一位置信息；
23.基于所述第一位置信息确定所述语音文件的第二位置信息，并按照所述第二位置信息将所述语音文件写入所述分页后的初始演示文档，得到所述目标演示文档。
24.进一步的，所述确定所述初始演示文档中的分页节点，包括：
25.获取所述第一文档内容中满足预设分页格式的第三文档内容；
26.获取所述第三文档内容在所述第一文档内容中的位置信息，并将所述位置信息确定为所述分页节点。
27.进一步的，所述方法还包括：
28.获取所述目标演示文档对应用户需求信息；
29.在所述用户需求信息中携带所述目标演示文档对应的安全信息的情况下，获取所述安全信息对应的加密数据；
30.利用所述加密数据对所述目标演示文档进行加密，得到加密后的目标演示文档。
31.根据本技术实施例的另一个方面，还提供了一种演示文档的生成装置，包括：
32.获取模块，用于获取待进行转换操作的目标格式文档，其中，所述目标格式文档中包括不同格式的文档内容；
33.解析模块，用于解析所述目标格式文档，并提取所述目标格式文档携带的至少一项文档内容，以及每项文档内容对应的格式信息；
34.划分模块，用于按照所述格式信息与预设格式信息的匹配度对所述文档内容划分，得到第一文档内容以及第二文档内容，所述预设格式为演示文档所支持的格式；
35.处理模块，用于将所述第二文档内容转换为语音文件，在所述预设演示文档中写入第一文档内容以及所述语音文件，得到目标演示文档。
36.根据本技术实施例的另一方面，还提供了一种存储介质，该存储介质包括存储的程序，程序运行时执行上述的步骤。
37.根据本技术实施例的另一方面，还提供了一种电子装置，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；其中：存储器，用于存放计算机程序；处理器，用于通过运行存储器上所存放的程序来执行上
述方法中的步骤。
38.本技术实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述方法中的步骤。
39.本技术实施例提供的上述技术方案与现有技术相比具有如下优点：本技术实施例提供的方法通过对格式文档中文档内容进行检测，能够自动划分满足演示文档所支持的预设格式的第一文档内容，与不满足预设格式的第二文档内容，并将第一文档内容和第二文档内容写入演示文档，实现了演示文档的自动生成。且将第二文档内容以语音文件的形式写入演示文档，解决了格式不兼容导致文档转换失败的问题。
附图说明
40.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。
41.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
42.图1为本技术实施例提供的一种演示文档的生成方法的流程图；
43.图2为本技术另一实施例提供的一种演示文档的生成方法的流程图；
44.图3为本技术实施例提供的一种演示文档的生成装置的框图；
45.图4为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
46.为使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本技术的一部分实施例，而不是全部的实施例，本技术的示意性实施例及其说明用于解释本技术，并不构成对本技术的不当限定。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本技术保护的范围。
47.需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个类似的实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
48.本技术实施例提供了一种演示文档的生成方法、装置、电子设备及存储介质。本发明实施例所提供的方法可以应用于任意需要的电子设备，例如，可以为服务器、终端等电子设备，在此不做具体限定，为描述方便，后续简称为电子设备。
49.根据本技术实施例的一方面，提供了一种演示文档的生成方法的方法实施例，图1为本技术实施例提供的一种方法的流程图，如图1所示，该方法包括：
50.步骤s11，获取待进行转换操作的目标格式文档，其中，目标格式文档中包括不同
格式的文档内容。
51.本技术实施例提供的方法应用于智能终端，智能终端可以是智能手机、笔记本电脑、平板电脑等设备。具体的，智能终端获取待进行转换操作的目标格式文档的过程可以是：请求方设备根据自身的处理需求发送至智能终端。或，用户直接在智能终端直接上传。其中，目标格式文档可以是word文档，excle文档等。
52.在本技术实施例中，目标格式文档中包括的不同格式的文档内容可以是文本、表格以及图片等等。其中，文本和表格包括多个格式，例如：标题格式、正文格式等等，图片包括多个格式，例如：图片效果、轮廓等等。
53.步骤s12，解析目标格式文档，并提取目标格式文档携带的至少一项文档内容，以及每项文档内容对应的格式信息。
54.在本技术实施例中，步骤s12，解析目标格式文档，并提取目标格式文档携带的至少一项文档内容，以及每项文档内容对应的格式信息，包括以下步骤a1-a2：
55.步骤a1，利用预设规则识别目标格式文档的全部文档内容，得到全部文档内容所携带的至少一个格式信息。
56.在本技术实施例中，步骤a1，利用预设规则识别目标格式文档的全部文档内容，得到全部文档内容所携带的至少一个格式信息，包括以下步骤a101-a103：
57.步骤a101，检测全部文档内容，提取全部文档内容对应的文档特征。
58.在本技术实施例中，利用目标识别模型提取目标格式文档的全部文档内容，并提取全部文档内容所包括的文档特征，文档特征可以是，文本特征，图像特征，表格特征，页眉页码特征等等。
59.需要说明的是，目标识别模型可以采用文档样本进行训练，具体的，获取文档样本以及文档样本对应文档标注信息，文档标注信息用于标注全部文档内容中各个内容对应的文档特征，然后将文档样本以及文档标注信息输入至初始识别模型，以使初始识别模型提取文档内容的文档内容，并学习文档内容与文档特征之间的关系，得到最终的目标识别模型。
60.步骤a102，按照文档特征对全部文档内容进行分类，得到至少一种内容类型的待处理文档内容，其中，内容类型包括：文本类型、图像类型、表格类型。
61.在本技术实施例中，在得到全部文档内容的文档特征后，利用目标分类模型基于文档内容与预设内容类型之间的对应关系，输出当前的文档特征对应的内容类型，然后汇总每一个文档类型对应待处理文档内容。
62.需要说明的是，目标分类模型可以采用内容特征样本进行训练，具体的，获取内容特征样本以及内容特征样本对应类型标注信息，类型标注信息用于标注内容特征样本对应的内容类型，然后将内容特征样本以及类型标注信息输入至初始分类模型，以使初始分类模型内容特征样本与内容类型之间的关系，得到最终的目标分类模型。
63.步骤a103，按照内容类型对应的识别策略，识别待处理文档内容中携带的至少一个格式信息。
64.在本技术实施例中，获取预设内容类型与识别策略之间对应关系，并基于该对应关系确定当前的内容类型对应的识别策略，并利用该识别策略识别待处理文档内容中携带的至少一个格式信息。
65.作为一个示例：当内容类型为文本类型时，对应的识别策略是文本识别策略，利用文本识别策略对文本类型对应的待处理文档内容进行识别，可以是将待处理文档内容与预设格式信息进行匹配，将匹配度最大的预设格式信息作为最终的格式信息，例如：标题字号、字体，以及正文字号、字体等等。
66.步骤a2，从全部文档内容中提取每个格式信息对应的文本内容。
67.在本技术实施例中，在确定全部文档内容中的格式信息后，通过提取每个格式信息的文本内容，用于后续在格式信息不满足文档转换条件下，对该格式信息对应的文本内容进行处理。
68.步骤s13，按照格式信息与预设格式信息的匹配度对文档内容划分，得到第一文档内容以及第二文档内容，预设格式为演示文档所支持的格式。
69.在本技术实施例中，步骤s13，按照格式信息与预设格式信息的匹配度对文档内容划分，得到第一文档内容以及第二文档内容，包括以下步骤b1-b2：
70.步骤b1，计算格式信息与预设格式信息之间的匹配度。
71.步骤b2，将格式信息与预设格式信息的匹配度大于或等于预设匹配度的文档内容确定为第一文档内容，将格式信息与预设格式信息的匹配度小于预设匹配度的文档内容确定为第二文档内容。
72.在本技术实施例中，首先获取演示文档所支持的预设格式信息，并计算目标格式文档所携带格式信息与预设格式信息之间的匹配度，预设格式信息可以是图像格式、文本格式等等。如果格式信息与预设格式信息的匹配度大于或等于预设匹配度，则确定格式信息与预设格式信息匹配，并将格式信息与预设格式信息匹配的文档内容确定为第一文档内容。相反，如果格式信息与预设格式信息的匹配度小于预设匹配度，则确定格式信息与预设格式信息不匹配，并将格式信息与预设格式信息不匹配的的文档内容确定为第二文档内容。
73.步骤s14，将第二文档内容转换为语音文件，在预设演示文档中写入第一文档内容以及语音文件，得到目标演示文档。
74.在本技术实施例中，由于第二文档内容不符合演示文档的转换规则，因此在转换过程中首先将第二文档内容转换为语音文件，再写入演示文档。
75.在本技术实施例中，步骤s14，在预设演示文档写入中第一文档内容以及语音文件，得到目标演示文档，包括以下步骤c1-c4：
76.步骤c1，将第一文档内容写入预设演示文档，得到初始演示文档。
77.在本技术实施例中，首先获取第一文档内容在目标格式文档中的位置信息和/或排列顺序，按照位置信息和/或排列顺序将第一文档内容写入预设岩石文档，得到初始演示文档。
78.作为一个示例，第一文档内容中包括多个文本段落以及多张图像，首先依据文本段落在目标格式文档中的段落序号或者行号确定对个文本段落的段落排列顺序，以及依据图像在目标格式文档中的位置信息(例如：页码、行号等)，然后按照段落排列顺序将文本段落写入预设演示文档，以及按照位置信息将图像写入预设演示文档得到初始演示文档。
79.步骤c2，确定初始演示文档中的分页节点，并按照分页节点对初始演示文档进行分页，得到分页后的初始演示文档。
80.在本技术实施例中，确定初始演示文档中的分页节点，包括以下步骤c201-c202：
81.步骤c201，获取第一文档内容中满足预设分页格式的第三文档内容。
82.步骤c202，获取第三文档内容在第一文档内容中的位置信息，并将位置信息确定为分页节点。
83.在本技术实施例中，当第一文档内容中的文本段落由正文格式切换至一级标题格式时，则确定满足预设分页格式，此时将该正文格式对应的文档内容确定第三文档内容，并将第三文档内容在第一文档内容中的位置信息设置为分页节点。
84.或者，检测第一文档内容中文本段落的行数，在行数大于预设行数时，将文本段落中行数与预设行数相同的文档内容确定为第三文档内容，并将第三文档内容在第一文档内容中的位置信息设置为分页节点。
85.在本技术实施例中，在确定分页节点后，利用分页节点对初始演示文档进行分页，得到分页后的演示文档。
86.步骤c3，从全部文档内容中获取第二文档内容的相邻文档内容，并确定相邻文档内容在分页后的初始演示文档中的第一位置信息。
87.步骤c4，基于第一位置信息确定语音文件的第二位置信息，并按照第二位置信息将语音文件写入分页后的初始演示文档，得到目标演示文档。
88.在本技术实施例中，在写入第一文档内容后，还需要从全部文档内容中获取第二文档内容的相邻文档内容，由于全部文档内容中只包括第一文档内容和第二文档内容，因此可以确定第二文档内容的相邻文档内容属于第一文档内容，所以可以直接确定相邻文档内容在分页后的初始演示文档中的第一位置信息，并利用第一位置信息确定语音文件的第二位置信息，最后按照第二位置信息将语音文件写入分页后的初始演示文档，得到最终的目标演示文档。
89.本技术实施例提供的方法通过对格式文档中文档内容进行检测，能够自动划分满足演示文档所支持的预设格式的第一文档内容，与不满足预设格式的第二文档内容，并将第一文档内容和第二文档内容写入演示文档，实现了演示文档的自动生成。且将第二文档内容以语音文件的形式写入演示文档，解决了格式不兼容导致文档转换失败的问题。
90.图2为本技术实施例提供的一种演示文档的生成方法的流程图，如图2所示，该方法可以包括以下步骤：
91.步骤s21，获取目标演示文档对应用户需求信息。
92.步骤s22，在用户需求信息中携带目标演示文档对应的安全信息的情况下，获取安全信息对应的加密数据。
93.步骤s23，利用加密数据对目标演示文档进行加密，得到加密后的目标演示文档。
94.在本技术实施例中，在得到目标演示文档后，还需要获取目标演示文档对应的用户需求信息，从而依据目标演示文档对应的安全信息，安全信息可以包括：目标演示文档的安全等级或者目标演示文档所属的部门信息。基于安全等级或者部门信息与预设加密数据之间对应关系，确定当前使用的加密数据，利用加密数据对目标演示文档进行加密，得到加密后的目标演示文档，其中，加密过程可以是，利用加密数据中的加密算法或加密密钥对目标演示文档中的文本或图像进行加密。通过在得到目标演示文档后对目标演示文档进行加密能够保证目标演示文档的安全性。
95.图3为本技术实施例提供的一种演示文档的生成装置的框图，该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图3所示，该装置包括：
96.获取模块31，用于获取待进行转换操作的目标格式文档，其中，目标格式文档中包括不同格式的文档内容；
97.解析模块32，用于解析目标格式文档，并提取目标格式文档携带的至少一项文档内容，以及每项文档内容对应的格式信息；
98.划分模块33，用于按照格式信息与预设格式信息的匹配度对文档内容划分，得到第一文档内容以及第二文档内容，预设格式为演示文档所支持的格式；
99.处理模块34，用于将第二文档内容转换为语音文件，在预设演示文档中写入第一文档内容以及语音文件，得到目标演示文档。
100.在本技术实施例中，解析模块32，用于利用预设规则识别目标格式文档的全部文档内容，得到全部文档内容所携带的至少一个格式信息；从全部文档内容中提取每个格式信息对应的文本内容。
101.在本技术实施例中，解析模块32，用于检测全部文档内容，提取全部文档内容对应的文档特征；按照文档特征对全部文档内容进行分类，得到至少一种内容类型的待处理文档内容，其中，内容类型包括：文本类型、图像类型、表格类型；按照内容类型对应的识别策略，识别待处理文档内容中携带的至少一个格式信息。
102.在本技术实施例中，划分模块33，用于计算格式信息与预设格式信息之间的匹配度；将格式信息与预设格式信息的匹配度大于或等于预设匹配度的文档内容确定为第一文档内容，将格式信息与预设格式信息的匹配度小于预设匹配度的文档内容确定为第二文档内容。
103.在本技术实施例中，处理模块34，用于将第一文档内容写入预设演示文档，得到初始演示文档；确定初始演示文档中的分页节点，并按照分页节点对初始演示文档进行分页，得到分页后的初始演示文档；从全部文档内容中获取第二文档内容的相邻文档内容，并确定相邻文档内容在分页后的初始演示文档中的第一位置信息；基于第一位置信息确定语音文件的第二位置信息，并按照第二位置信息将语音文件写入分页后的初始演示文档，得到目标演示文档。
104.在本技术实施例中，处理模块34，用于获取第一文档内容中满足预设分页格式的第三文档内容；获取第三文档内容在第一文档内容中的位置信息，并将位置信息确定为分页节点。
105.在本技术实施例中，装置还包括：需求处理模块，用于获取目标演示文档对应用户需求信息；在用户需求信息中携带目标演示文档对应的安全信息的情况下，获取安全信息对应的加密数据；利用加密数据对目标演示文档进行加密，得到加密后的目标演示文档。
106.本技术实施例还提供一种电子设备，如图4所示，电子设备可以包括：处理器1501、通信接口1502、存储器1503和通信总线1504，其中，处理器1501，通信接口1502，存储器1503通过通信总线1504完成相互间的通信。
107.存储器1503，用于存放计算机程序；
108.处理器1501，用于执行存储器1503上所存放的计算机程序时，实现上述实施例的步骤。
109.上述终端提到的通信总线可以是外设部件互连标准(peripheral component interconnect，简称pci)总线或扩展工业标准结构(extended industry standard architecture，简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
110.通信接口用于上述终端与其他设备之间的通信。
111.存储器可以包括随机存取存储器(random access memory，简称ram)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。
112.上述的处理器可以是通用处理器，包括中央处理器(central processing unit，简称cpu)、网络处理器(network processor，简称np)等；还可以是数字信号处理器(digital signal processing，简称dsp)、专用集成电路(application specific integrated circuit，简称asic)、现场可编程门阵列(field－programmable gate array，简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
113.在本技术提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的演示文档的生成方法。
114.在本技术提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的演示文档的生成方法。
115.在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质(例如固态硬盘solid state disk)等。
116.以上所述仅为本技术的较佳实施例而已，并非用于限定本技术的保护范围。凡在本技术的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本技术的保护范围内。
117.以上所述仅是本技术的具体实施方式，使本领域技术人员能够理解或实现本技术。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下，在其它实施例中实现。因此，本技术将不会被限制于本文所示的这些实施例，而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：范纪营李霄寒
技术所有人：云知声智能科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。