本发明涉及信息,具体涉及一种基于业务表单数据的财务凭证生成方法及装置。
背景技术:
1、财务凭证是企业管理业务数据的一项重要工作,财务凭证一般分收、付、转三种形式,财务凭证的基本内容包括摘要、科目、金额、制证日期以及借贷方向等;财务凭证的生成主要方式是利用会计收集业务凭证数据并分门别类加以整理,根据记账要求在财务软件系统手工录入财务凭证。但是,这种方式工作效率低、容易出错。
技术实现思路
1、本发明正是基于上述问题,提出了一种基于业务表单数据的财务凭证生成方法及装置,通过智能化获取业务数据源,运用机器学习、知识图谱、区块链等前沿技术实现自动高效的财务凭证生成,可以降低企业会计处理成本,提升凭证质量和可信度。
2、有鉴于此,本发明的一方面提出了一种基于业务表单数据的财务凭证生成方法,包括:
3、采集不同类型的业务表单的业务表单数据,并利用机器学习技术对所述业务表单数据进行识别,获取所述业务表单中的第一业务数据;
4、利用自然语言处理技术对非结构化的所述第一业务数据进行解析和标准化,将所述第一业务数据转换为结构化的第二业务数据;
5、根据历史业务表单数据、历史凭证数据和历史企业会计准则,生成多个业务规则模型和多个账务处理模型;
6、根据所述第二业务数据、所述业务规则模型和所述账务处理模型,使用机器学习算法自动生成不同类型的第一财务凭证;
7、采用知识图谱技术对生成的所述第一财务凭证进行审核,输出审核意见;
8、利用区块链技术建立所述业务表单数据与所述第一财务凭证之间的关联,保证全流程的数据可追溯性。
9、可选地,所述采集不同类型的业务表单的业务表单数据,并利用机器学习技术对所述业务表单数据进行识别,获取所述业务表单中的第一业务数据的步骤,包括:
10、利用图像扫描设备扫描纸质业务表单,得到第一业务表单数据;
11、使用计算机视觉技术,识别所述第一业务表单数据中的表单布局数据、框线数据、坐标数据、文字数据;
12、对所述历史业务表单数据标注关键信息,构建表单文本的训练数据集;
13、使用自然语言处理技术中的序列标注模型训练出表单文本的字段抽取模型;
14、根据所述字段抽取模型,结合所述表单布局数据、所述框线数据、所述坐标数据抽取关键信息字段;
15、根据所述关键信息字段和所述文字数据识别出所述第一业务数据。
16、可选地,所述利用自然语言处理技术对非结构化的所述第一业务数据进行解析和标准化,将所述第一业务数据转换为结构化的第二业务数据的步骤,包括:
17、对非结构化的所述第一业务数据,根据事先定义好的第一数据规范,将识别出的文本字段进行转换和规范化得到第一业务识别数据;
18、对所述第一业务数据中无法识别字段的部分,使用基于规则的文本解析方法,抽取出第一结构化业务数据;
19、根据不同类型表单的业务含义,将所述第一业务识别数据和所述第一结构化业务数据,重新组合为结构化数据集,得到所述第二业务数据。
20、可选地,所述根据历史业务表单数据、历史凭证数据和历史企业会计准则,生成多个业务规则模型和多个账务处理模型的步骤,包括:
21、对所述历史业务表单数据、所述历史凭证数据的文本类数据采用自然语言处理技术进行预处理,提取关键信息并分别标记数据来源,得到第一关键信息;
22、从所述历史业务表单数据中提取第一表单结构化特征;
23、从所述历史凭证数据中提取第一凭证结构化特征;
24、利用所述历史企业会计准则和所述第一关键信息,分别为所述第一表单结构化特征、所述第一凭证结构化特征标注业务规则标签和账务处理方式标签;
25、构造深度学习框架,设计第一卷积神经网络模型,利用所述第一表单结构化特征、所述第一凭证结构化特征分别训练所述第一卷积神经网络模型学习业务数据与业务规则、账务处理方式之间的映射关系,分别生成多个业务规则模型和多个账务处理模型。
26、可选地,还包括:
27、使用区块链技术构建去中心化的业务规则模型存储结构,保证所述业务规则模型配置的一致性;
28、采用智能合约实现所述业务规则模型的修改交易操作,确保历史记录可追溯;
29、以企业相关人员的数字签名作为所述修改交易操作的触发条件,进行权限控制;
30、在区块链网络中设置测试环境,用于所述业务规则模型验证,避免错误配置;
31、所述业务规则模型配置变更成功后,自动同步到各节点的本地缓存数据库;
32、数据采集系统、凭证生成系统连接区块链网络,实时调用所述业务规则模型。
33、可选地,所述根据所述第二业务数据、所述业务规则模型和所述账务处理模型,使用机器学习算法自动生成不同类型的第一财务凭证的步骤,包括:
34、根据所述第二业务数据和所述业务规则模型,生成适用的第一业务规则;
35、抽取所述第二业务数据的账务相关数据特征,结合所述账务处理模型确定匹配的第一账务处理方案;
36、将所述第二业务数据、所述第一业务规则和所述第一账务处理方案,输入预设的凭证生成模型;
37、所述凭证生成模型生成描述所述第二业务数据对应的业务的第一凭证账务文本;
38、结合当前企业会计准则,补充所述第一凭证账务文本的格式化结构化数据,得到第一财务凭证。
39、可选地,所述采用知识图谱技术对生成的所述第一财务凭证进行审核,输出审核意见的步骤,包括:
40、获取会计相关知识数据,构建会计知识图谱;
41、使用自然语言处理技术,抽取已生成的所述第一财务凭证中的文本描述;
42、在所述会计知识图谱中关联查询所述文本描述与会计规则,检查所述第一财务凭证是否符合规则;
43、根据检查结果生成审核报告,标识出异常情况与不符合项;
44、根据所述审核报告输出审核意见。
45、可选地,还包括:
46、结合历史财务数据,对所述第一财务凭证的关键数据进行合理性验证;
47、利用机器学习模型,分析所述第一财务凭证的内部数据的匹配性;
48、构建业务规则校验引擎,验证所述第一财务凭证是否满足业务规则的要求。
49、可选地,所述利用区块链技术建立所述业务表单数据与所述第一财务凭证之间的关联,保证全流程的数据可追溯性的步骤,包括:
50、在区块链上设计存在对应关系的表单数据的表单数位身份标识与财务凭证的凭证数位身份标识间的匹配关系;
51、在所述业务表单数据上传时,写入所述第一表单数位身份标识和元数据到区块链;
52、在生成所述第一财务凭证时,为其分配第一凭证数位身份标识,并将所述第一凭证数位身份标识和所述第一财务凭证所依据的所述业务表单数据的所述第一表单数位身份标识写到区块链;
53、通过智能合约和所述匹配关系,校验所述第一表单数位身份标识和所述第一凭证数位身份标识的第一匹配关系。
54、本发明的另一方面提供一种基于业务表单数据的财务凭证生成装置,包括:数据采集模块、数据标准化模块、模型生成模块、凭证生成模块、审核模块和数据关联模块;
55、所述数据采集模块,用于采集不同类型的业务表单的业务表单数据,并利用机器学习技术对所述业务表单数据进行识别,获取所述业务表单中的第一业务数据;
56、所述数据标准化模块,用于利用自然语言处理技术对非结构化的所述第一业务数据进行解析和标准化,将所述第一业务数据转换为结构化的第二业务数据;
57、所述模型生成模块,用于根据历史业务表单数据、历史凭证数据和历史企业会计准则,生成多个业务规则模型和多个账务处理模型;
58、所述凭证生成模块,用于根据所述第二业务数据、所述业务规则模型和所述账务处理模型,使用机器学习算法自动生成不同类型的第一财务凭证;
59、所述审核模块,用于采用知识图谱技术对生成的所述第一财务凭证进行审核,输出审核意见;
60、所述数据关联模块,用于利用区块链技术建立所述业务表单数据与所述第一财务凭证之间的关联,保证全流程的数据可追溯性。
61、采用本发明的技术方案,基于业务表单数据的财务凭证生成方法包括:采集不同类型的业务表单的业务表单数据,并利用机器学习技术对所述业务表单数据进行识别,获取所述业务表单中的第一业务数据;利用自然语言处理技术对非结构化的所述第一业务数据进行解析和标准化,将所述第一业务数据转换为结构化的第二业务数据;根据历史业务表单数据、历史凭证数据和历史企业会计准则,生成多个业务规则模型和多个账务处理模型;根据所述第二业务数据、所述业务规则模型和所述账务处理模型,使用机器学习算法自动生成不同类型的第一财务凭证;采用知识图谱技术对生成的所述第一财务凭证进行审核,输出审核意见;利用区块链技术建立所述业务表单数据与所述第一财务凭证之间的关联,保证全流程的数据可追溯性。通过智能化获取业务数据源,运用机器学习、知识图谱、区块链等前沿技术实现自动高效的财务凭证生成,可以降低企业会计处理成本,提升凭证质量和可信度。