1.一种基于自然语言处理的文档校验方法,其特征在于,包括:
对获取的包含财务数据的文档进行预处理;
以预设自然语言处理模型对经过预处理之后的所述文档进行处理,以从所述文档中抽取出财务数据;以及
对所述财务数据进行处理,以获得所述财务数据中的错误和/或冲突。
2.根据权利要求1所述的文档校验方法,其中,对所述财务数据进行处理,以获得所述财务数据中的错误和/或冲突,包括:
对所述财务数据进行关联性分析,以验证所述财务数据中财务指标数据之间的关系准确性。
3.根据权利要求2所述的文档校验方法,其中,对所述财务数据进行处理,以获得所述财务数据中的错误和/或冲突,进一步包括:
对所述财务数据进行关联性分析,以验证财务报表上下文内容的一致性。
4.根据权利要求3所述的文档校验方法,其中,对所述财务数据进行处理,以获得所述财务数据中的错误和/或冲突,进一步包括:
提取所述财务数据中的财务指标计算公式和对应的第一财务指标数据;
基于财务指标计算公式,获得第二财务指标数据;以及
对比所述第一财务指标数据和所述第二财务指标数据,以验证所述财务指标计算公式和对应财务指标数据之间的准确性。
5.根据权利要求4所述的文档校验方法,其中,对所述财务数据进行处理,以获得所述财务数据中的错误和/或冲突,进一步包括:
对所述财务数据进行语感甄别处理,以验证相关财务数据是否为输入错误。
6.根据权利要求1所述的文档校验方法,进一步包括:
获取日期确认指令;以及
响应于获取日期确认指令,提取满足日期阈值范围内的所述包含财务数据的文档。
7.根据权利要求1-6任一所述的文档校验方法,其中,所述包含财务数据的文档为债券募集说明书,其中,所述预设自然语言处理模型基于带标注的债券说明书训练集训练而成。
8.一种基于自然语言处理的文档校验装置,其特征在于,包括:
预处理单元,用于对获取的包含财务数据的文档进行预处理;
数据提取单元,用于以预设自然语言处理模型对经过所述预处理单元的预处理之后的所述文档进行处理,以从所述文档中抽取出财务数据;以及
校验单元,用于对所述数据提取单元所抽取出的所述财务数据进行处理,以获得所述财务数据中的错误和/或冲突。
9.根据权利要求8所述的文档校验装置,其中,所述校验单元用于:
对所述数据提取单元所抽取出的所述财务数据进行关联性分析,以验证所述财务数据中财务指标数据之间的关系准确性。
10.根据权利要求9所述的文档校验装置,其中,所述校验单元用于:
对所述数据提取单元所抽取出的所述财务数据进行关联性分析,以验证财务报表上下文内容的一致性。
11.根据权利要求10所述的文档校验装置,其中,所述校验单元用于:
提取所述数据提取单元所抽取出的所述财务数据中的财务指标计算公式和对应的第一财务指标数据;
基于财务指标计算公式,获得第二财务指标数据;以及
对比所述第一财务指标数据和所述第二财务指标数据,以验证所述财务指标计算公式和对应财务指标数据之间的准确性。
12.根据权利要求8所述的文档校验装置,其中,所述校验单元用于:
对所述数据提取单元所抽取出的所述财务数据进行语感甄别处理,以验证相关财务数据是否为输入错误。
13.根据权利要求8所述的文档校验装置,进一步包括:
日期获取单元,用于获取日期确认指令;以及
文档提取单元,用于响应于获取日期确认指令,提取满足日期阈值范围内的所述包含财务数据的文档。
14.根据权利要求8-12任一所述的文档校验装置,其中,所述文档为债券募集说明书,其中,所述预设自然语言处理模型基于带标注的债券说明书训练集训练而成。
15.一种电子设备,其特征在于,包括:
处理器;以及
存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-7中任一项所述的基于自然语言处理的文档校验方法。