一种基于机器学习的票务自动入账系统及方法与流程

文档序号:36181015发布日期:2023-11-29 19:28阅读:25来源:国知局
一种基于机器学习的票务自动入账系统及方法与流程

本发明涉及票务识别,具体涉及一种基于机器学习的票务自动入账系统及方法。


背景技术:

1、传统票务入账类型的确认是由财务或相关业务人员根据个人主观评定的。他们主要依据国家、行业、职业税务税法相关规定以及个人在相关领域积累的经验进行评定。然而,这种方式存在一些缺陷。

2、首先,发票的种类繁多,导致人工校对和评判的工作量非常大,这增加了人力成本;其次,人工评判和个人经验有关,需要依赖相关领域的专家指导,这也存在一定的技术限制;最重要的是,个人经验具有一定的主观性,无法保证每种发票都能被准确地分配到最合适的入账类型上。

3、因此,需要优化这种传统的票务入账方式,以提高效率和准确性。


技术实现思路

1、本发明的目的在于提供一种基于机器学习的票务自动入账系统及方法,解决以下技术问题:

2、如何提供能够对具有多种数据结构类型的票据进行自动入账分类的票务自动入账系统及方法。

3、本发明的目的可以通过以下技术方案实现:

4、一种基于机器学习的票务自动入账方法,包括:

5、获取目标发票的采样图,提取所述采样图中的特征信息;

6、对所述特征信息进行分类得到特征分类结果;

7、根据所述特征分类结果对应的处理规则对所述特征信息进行预处理;

8、对预处理后的所述特征信息进行规范化汇总,得到整合规范数据;

9、将所述整合规范数据输入识别分类模块,获取所述整合规范数据输出的入账费用类型;

10、其中,所述识别分类模块为基于机器学习技术构建的分类模型。

11、作为本发明进一步的方案:所述对所述特征信息进行分类得到特征分类结果的方法包括:

12、step1:从历史沉淀数据中优先统计分析现有的票务和其入账类型的分布情况,完成对数据质量的初步探索;

13、step2:依据财务学、会计学、税务法律法规知识,初步筛选出影响票务入账的相关指标;

14、step3:筛选信息记录完整、数据量充足的指标留用,完成指标的再次筛选;

15、step4:继续对剩余指标做相关性筛选,如果每两个指标的相关系数超过指定阈值,则剔除其中一个指标,完成最终的指标筛选。

16、作为本发明进一步的方案:所述特征分类结果包括:离散的字典型数据、连续的数值型数据、非结构化的长文本数据。

17、作为本发明进一步的方案:所述预处理的方法包括:

18、针对所述离散的字典型数据,转化成特定的数值表示;

19、针对所述连续的数值型数据,采用最大最小归一化法做归一化处理,使所述所述连续的数值型数据被限定在[0,1]范围内;

20、针对所述非结构化的长文本数据,需把不同指标统一按照“key:value”的格式组合起来,再把所有的k-v组合拼接成一个特征;

21、其中,key是指标名称,value是指标值。

22、作为本发明进一步的方案:所述识别分类模块以深度学习模型架构transformer的编码部分(encoding)为主架构,外接分类层(classifier layer)构成最终的分类模型。

23、作为本发明进一步的方案:所述识别分类模块在训练时注意力部分的标准化采用rmsnorm;中间各层的激活函数选用gelu,输出层的激活函数为softmax;

24、在超参方面,选用adamw优化器和自衰减的学习速率,其中自衰减学习速率策略配置了对相关指标的监控,如当模型准确率在连续多次训练而没有任何提升时则自动减小学习速率。

25、一种基于机器学习的票务自动入账系统,包括:

26、采样提取模块,用于获取目标发票的采样图,提取所述采样图中的特征信息;

27、分类单元,用于对所述特征信息进行分类得到特征分类结果;

28、预处理模块,用于根据所述特征分类结果对应的处理规则对所述特征信息进行预处理;

29、规范整合模块,对预处理后的所述特征信息进行规范化汇总,得到整合规范数据;

30、识别分类模块,用于根据所述整合规范数据输出入账费用类型;

31、其中,所述识别分类模块为基于机器学习技术构建的分类模型。

32、本发明的有益效果:本发明以财务学、会计学、税务法律法规为依据,结合影响票务是否可入账以及入账类型的多维指标定义,提出票务入账类型的评判标准,对结构化数据和非结构化数据采用拼接融合不同编码的方法,使得模型可以同时捕获不同数据结构类型下的信息,减少了人工干预,实现对不同结构类型的数据进行快速、准确的分类,大大降低对经验型技术员的依赖程度,既可提升企业劳动生产力,又可降低人工成本;而且简化了票务入账的工作流程,促使漫长的人工审核向快速的ai智能识别转变,可大大提高工作效率。



技术特征:

1.一种基于机器学习的票务自动入账方法,其特征在于,包括:

2.根据权利要求1所述的基于机器学习的票务自动入账方法,其特征在于,所述对所述特征信息进行分类得到特征分类结果的方法包括:

3.根据权利要求2所述的基于机器学习的票务自动入账方法,其特征在于,所述特征分类结果包括:离散的字典型数据、连续的数值型数据、非结构化的长文本数据。

4.根据权利要求3所述的基于机器学习的票务自动入账方法,其特征在于,所述预处理的方法包括:

5.根据权利要求1所述的基于机器学习的票务自动入账方法,其特征在于,

6.根据权利要求1所述的基于机器学习的票务自动入账方法,其特征在于,所述识别分类模块在训练时注意力部分的标准化采用rmsnorm;中间各层的激活函数选用gelu,输出层的激活函数为softmax;

7.一种基于机器学习的票务自动入账系统,其特征在于,包括:


技术总结
本发明涉及票务识别技术领域,公开了一种基于机器学习的票务自动入账系统及方法,包括:获取目标发票的采样图,提取所述采样图中的特征信息;对所述特征信息进行分类得到特征分类结果;根据所述特征分类结果对应的处理规则对所述特征信息进行预处理;对预处理后的所述特征信息进行规范化汇总,得到整合规范数据;将所述整合规范数据输入识别分类模块,获取所述整合规范数据输出的入账费用类型;实现对不同结构类型的数据进行快速、准确的分类,减少了人工干预,使对经验型技术员的依赖程度降到最低,既可提升企业劳动生产力,又可降低人工成本,简化了票务入账的工作流程,可大大提高工作效率。

技术研发人员:胡杨,陈家涵,汪洋,童佳,陈凤,程康
受保护的技术使用者:浙江河马管家网络科技有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1