发票管理方法和发票管理装置与流程

文档序号:11135088阅读:283来源:国知局
发票管理方法和发票管理装置与制造工艺

本发明涉及发票管理技术领域,具体而言,涉及一种发票管理方法和一种发票管理装置。



背景技术:

根据《国家税务总局关于推行通过增值税电子发票系统开具增值税电子普通发票有关问题的公告》(国家税务总局公告2015年第84号),国家决定推行通过增值税电子发票系统开具的增值税电子普通发票(简称电子发票)。

电子发票是在购销商品、提供或者接受服务以及从事其他经营活动中,以电子数据方式开具、收取、存储的收付款凭证,具有不可篡改、成本低廉、易交互、易存储等多方面优势。电子发票由于其天然的信息化特征,可帮助税务机关信息管税,帮助消费者售后维权,帮助企业降低发票管理的财务成本。

在增值税普通发票、增值税专用发票等发票类型中,纸质发票(简称“纸票”)仍然发挥重要作用。在日常生产生活中,当发票开具完成后,消费者必须面对如何有效地同时管理纸质发票、电子发票的问题。在发票报销环节,作为收票方的企业,必须面对如果高效查验、归档纸质发票的问题。

而且由于纸质发票、电子发票的传播介质上包含的信息是异构的,现有技术中并不能实现对纸质发票和电子发票的统一管理。

因此,如何实现对纸质发票和电子发票的统一管理成为亟待解决的技术问题。



技术实现要素:

本发明正是基于上述问题,提出了一种新的技术方案,可以实现对纸质发票和电子发票的统一管理。

有鉴于此,本发明的第一方面提出了一种发票管理方法,包括:在接收到对发票进行管理的信号时,确定所述发票的属性,所述发票的属性包括纸质发票或者电子发票;根据所述发票的属性,提取所述发票中的票面数据,其中,所述票面数据包括元数据和其对应的数值;根据所述元数据,将所述元数据对应的数值存储到票面数据模型中。

在该技术方案中,通过提取发票中的票面数据,将票面数据存储到票面数据模型中,其中,该发票可以是纸质发票,还可以是电子发票,从而实现了对纸质发票和电子发票的统一管理。而且解决了发票来源多样不易管理的问题,从而方便个人或者企业科学、高效地管理发票,尤为纸质发票的自动化业务处理提供了数据支撑。

在上述技术方案中,优选地,所述根据所述发票的属性,提取所述发票中的票面数据的步骤,具体包括:若所述发票为纸质发票,则通过所述发票的标识码来识别出所述发票的摘要信息,根据所述摘要信息获取所述发票的表头信息、表体信息和表尾信息,将所述摘要信息、所述表头信息、所述表体信息和所述表尾信息作为所述票面数据;若所述发票为电子发票,则获取所述发票的版本文件,对所述发票的版本文件的内容进行解析,以从所述发票中解析出所述票面数据。

在该技术方案中,由于纸质发票和电子发票在存储介质性质上的不同,因此,采用不同的方式来提取这两种发票的票面数据,从而为纸质发票和电子发票的统一管理提供了保障。

在上述任一技术方案中,优选地,所述将所述元数据对应的数值存储到票面数据模型中的步骤之后,还包括:建立哈希索引表中的目标索引项与所述票面数据模型中所述票面数据之间的关联关系;在接收到查询所述发票的信号时,获取所述元数据在所述哈希索引表中的索引位置处的多个索引项;在所述多个索引项中查找出所述发票对应的所述目标索引项;从所述票面数据模型中获取与所述目标索引项关联的所述票面数据。

在该技术方案中,通过建立哈希索引表中的目标索引项与票面数据模型中的票面数据之间的关联关系,当查询发票时,先根据元数据获取哈希索引表中的索引位置,由于该索引位置处的多个索引项的项数比较少,因此,在比较小的范围内可以快速地查找出发票对应的目标索引项,接下来就可以根据目标索引项从票面数据模型中获取发票的票面数据。因此,通过以上方案,可以快速地对发票进行查询。

在上述任一技术方案中,优选地,还包括:若所述发票为纸质发票,则在提取所述发票中的票面数据之后,将所述发票中的票面数据以字符串集合的形式进行存储;若所述发票为电子发票,则在提取所述发票中的票面数据之后,将所述发票中的票面数据以属性表的形式进行存储。

在该技术方案中,通过不同的方式对纸质发票和电子发票的票面数据进行存储,不仅能够保持与其他系统之间的兼容性,还方便获取存储的票面数据。

在上述任一技术方案中,优选地,所述票面数据模型为树状模型或者属性表模型,在所述票面数据模型为树状模型的情况下,所述票面数据模型的根节点为所述发票的唯一编码,所述根节点包括有至少一个子节点,所述至少一个子节点中的每个子节点包括至少一个叶子节点。

在该技术方案中,票面数据模型为树状模型,可以保证后期从票面数据模型中查询票面数据的速度,票面数据模型为属性表模型,可以保证存储票面数据的速度。具体可以根据实际的需求来选择票面数据模型,从而满足用户在不同情况下对发票管理的需求。

本发明的第二方面提出了一种发票管理装置,包括:确定单元,用于在接收到对发票进行管理的信号时,确定所述发票的属性,所述发票的属性包括纸质发票或者电子发票;提取单元,用于根据所述发票的属性,提取所述发票中的票面数据,其中,所述票面数据包括元数据和其对应的数值;第一存储单元,用于根据所述元数据,将所述元数据对应的数值存储到票面数据模型中。

在该技术方案中,通过提取发票中的票面数据,将票面数据存储到票面数据模型中,其中,该发票可以是纸质发票,还可以是电子发票,从而实现了对纸质发票和电子发票的统一管理。而且解决了发票来源多样不易管理的问题,从而方便个人或者企业科学、高效地管理发票,尤为纸质发票的自动化业务处理提供了数据支撑。

在上述技术方案中,优选地,所述提取单元包括:确定子单元,用于若所述发票为纸质发票,则通过所述发票的标识码来识别出所述发票的摘要信息,根据所述摘要信息获取所述发票的表体信息,将所述摘要信息和所述表体信息作为所述票面数据;解析子单元,用于若所述发票为电子发票,则获取所述发票的版本文件,对所述发票的版本文件的内容进行解析,以从所述发票中解析出所述票面数据。

在该技术方案中,由于纸质发票和电子发票在存储介质性质上的不同,因此,采用不同的方式来提取这两种发票的票面数据,从而为纸质发票和电子发票的统一管理提供了保障。

在上述任一技术方案中,优选地,还包括:建立单元,用于建立哈希索引表中的目标索引项与所述票面数据模型中所述票面数据之间的关联关系;获取单元,用于在接收到查询所述发票的信号时,获取所述元数据在所述哈希索引表中的索引位置处的多个索引项;查找单元,用于在所述多个索引项中查找出所述发票对应的所述目标索引项;所述获取单元还用于,从所述票面数据模型中获取与所述目标索引项关联的所述票面数据。

在该技术方案中,通过建立哈希索引表中的目标索引项与票面数据模型中的票面数据之间的关联关系,当查询发票时,先根据元数据获取哈希索引表中的索引位置,由于该索引位置处的多个索引项的项数比较少,因此,在比较小的范围内可以快速地查找出发票对应的目标索引项,接下来就可以根据目标索引项从票面数据模型中获取发票的票面数据。因此,通过以上方案,可以快速地对发票进行查询。

在上述任一技术方案中,优选地,还包括:第二存储单元,用于若所述发票为纸质发票,则在提取所述发票中的票面数据之后,将所述发票中的票面数据以字符串集合的形式进行存储;所述第二存储单元还用于,若所述发票为电子发票,则在提取所述发票中的票面数据之后,将所述发票中的票面数据以属性表的形式进行存储。

在该技术方案中,通过不同的方式对纸质发票和电子发票的票面数据进行存储,不仅能够保持与其他系统之间的兼容性,还方便获取存储的票面数据。

在上述任一技术方案中,优选地,所述票面数据模型为树状模型或者属性表模型,在所述票面数据模型为树状模型的情况下,所述票面数据模型的根节点为所述发票的唯一编码,所述根节点包括有至少一个子节点,所述至少一个子节点中的每个子节点包括至少一个叶子节点。

在该技术方案中,票面数据模型为树状模型,可以保证后期从票面数据模型中查询票面数据的速度,票面数据模型为属性表模型,可以保证存储票面数据的速度。具体可以根据实际的需求来选择票面数据模型,从而满足用户在不同情况下对发票管理的需求。

通过本发明的技术方案,可以实现对纸质发票和电子发票的统一管理。

附图说明

图1示出了根据本发明的一个实施例的发票管理方法的流程示意图;

图2示出了根据本发明的另一个实施例的发票管理方法的流程示意图;

图3示出了根据本发明的一个实施例的发票的文本数据的示意图;

图4示出了根据本发明的一个实施例的数据模型的示意图;

图5示出了根据本发明的一个实施例的发票查询的原理示意图;

图6示出了根据本发明的一个实施例的发票管理装置的结构示意图。

具体实施方式

为了可以更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了根据本发明的一个实施例的发票管理方法的流程示意图。

如图1所示,根据本发明的一个实施例的发票管理方法,包括:

步骤102,在接收到对发票进行管理的信号时,确定所述发票的属性,所述发票的属性包括纸质发票或者电子发票。

步骤104,根据所述发票的属性,提取所述发票中的票面数据,其中,所述票面数据包括元数据和其对应的数值。

步骤106,根据所述元数据,将所述元数据对应的数值存储到票面数据模型中。

在该技术方案中,通过提取发票中的票面数据,将票面数据存储到票面数据模型中,其中,该发票可以是纸质发票,还可以是电子发票,从而实现了对纸质发票和电子发票的统一管理。而且解决了发票来源多样不易管理的问题,从而方便个人或者企业科学、高效地管理发票,尤为纸质发票的自动化业务处理提供了数据支撑。

在上述技术方案中,优选地,所述步骤104具体包括:若所述发票为纸质发票,则通过所述发票的标识码来识别出所述发票的摘要信息,根据所述摘要信息获取所述发票的表头信息、表体信息和表尾信息,将所述摘要信息、所述表头信息、所述表体信息和所述表尾信息作为所述票面数据;若所述发票为电子发票,则获取所述发票的版本文件,对所述发票的版本文件的内容进行解析,以从所述发票中解析出所述票面数据。

在该技术方案中,由于纸质发票和电子发票在存储介质性质上的不同,因此,采用不同的方式来提取这两种发票的票面数据,从而为纸质发票和电子发票的统一管理提供了保障。

在上述任一技术方案中,优选地,步骤106之后,还包括:建立哈希索引表中的目标索引项与所述票面数据模型中所述票面数据之间的关联关系;在接收到查询所述发票的信号时,获取所述元数据在所述哈希索引表中的索引位置处的多个索引项;在所述多个索引项中查找出所述发票对应的所述目标索引项;从所述票面数据模型中获取与所述目标索引项关联的所述票面数据。

在该技术方案中,通过建立哈希索引表中的目标索引项与票面数据模型中的票面数据之间的关联关系,当查询发票时,先根据元数据获取哈希索引表中的索引位置,由于该索引位置处的多个索引项的项数比较少,因此,在比较小的范围内可以快速地查找出发票对应的目标索引项,接下来就可以根据目标索引项从票面数据模型中获取发票的票面数据。因此,通过以上方案,可以快速地对发票进行查询。

在上述任一技术方案中,优选地,还包括:若所述发票为纸质发票,则在提取所述发票中的票面数据之后,将所述发票中的票面数据以字符串集合的形式进行存储;若所述发票为电子发票,则在提取所述发票中的票面数据之后,将所述发票中的票面数据以属性表的形式进行存储。

在该技术方案中,通过不同的方式对纸质发票和电子发票的票面数据进行存储,不仅能够保持与其他系统之间的兼容性,还方便获取存储的票面数据。

在上述任一技术方案中,优选地,所述票面数据模型为树状模型或者属性表模型,在所述票面数据模型为树状模型的情况下,所述票面数据模型的根节点为所述发票的唯一编码,所述根节点包括有至少一个子节点,所述至少一个子节点中的每个子节点包括至少一个叶子节点。

在该技术方案中,票面数据模型为树状模型,可以保证后期从票面数据模型中查询票面数据的速度,票面数据模型为属性表模型,可以保证存储票面数据的速度。具体可以根据实际的需求来选择票面数据模型,从而满足用户在不同情况下对发票管理的需求。

图2示出了根据本发明的另一个实施例的发票管理方法的流程示意图。

如图2所示,根据本发明的另一个实施例的发票管理方法,包括以下的三个步骤:一、提取发票中的票面数据,二、异构票面数据归一化处理,三、发票统一归集。

一、提取发票中的票面数据。

若发票为纸质发票,则通过扫描纸质发票上的标识码(例如,标识码为二维码或者条形码),以获取标识码对应的文本数据,如图3所示,文本数据包括发票的版本、发票类型、发票代码、发票号码、合计金额、开票日期、发票校验码和CRC校验码。由于该文本数据是一串文本字符串,分析该文本数据的字符特征,根据预置的文本特征规则,提取其中的摘要信息。根据摘要信息,对发票数据进行查验,以获取发票的表头信息、表体信息和表尾信息。查验完成的纸质发票将具备完整的票面数据(至少包括摘要信息、表头信息、表体信息和表尾信息),之后将完整的票面数据存储,供后续逻辑使用。

若发票为电子发票,则从发票持有者的收票邮箱附件中自动提取发票的板式文件,也可以获取用户手动上传导入的发票的板式文件,在获得电子发票的版式文件后,直接解析版式文件的内容,即可获得完整的票面数据。其中,该票面数据至少包括摘要信息、表头信息、表体信息和表尾信息,版式文件PDF格式的文件。

二、异构票面数据归一化处理。

可以通过树状模型对电子发票和纸质发票的票面数据进行存储。如图4所示,树状模型的根节点为发票的唯一编码,该唯一编码可以是系统为发票新生成的一个编码,还可以是发票代码或者发票号码,或者发票代码和发票号码的组合。发票的唯一编码拥有4个子节点,分别为“发票摘要信息”、“发票表头信息”、“发票表体信息”、“发票表尾信息”。这4个子节点分别拥有各自的叶子节点,叶子节点存储具体的票面数据。从图4可以看出,树状模型具备更强的层次结构和表达能力。

除了树状模型,还可以建立平铺结构的属性表(包含多个“键/值对”)模型。属性表中的“键”为上述的叶子节点的名称,“值”为对应的票面数据。

从纸质发票提取的票面数据以字符串集合的形式进行存储。电子发票的票面数据以属性表的形式进行存储。

设纸质发票的票面数据的字符串集合为L,Li(i=1,2,…,n)表示票面数据对应的数值。发票的元数据集合为MetaSet={发票代码,…,销售单位},电子发票的票面数据的属性表为M,M(k)=v,(k∈MetaSet,v为票面数据对应的数值)。设函数V(x)表示x对应的数据值。

树状模型为T,对表示节点t的值,其中,

T={Abstract,Header,Body,Footer,Features}

Abstract={发票代码,发票号码,开票日期,校验码}

Header={购买方名称,纳税人识别号,地址,电话,开户行,账号}

Body={销货清单,价税合计}

Footer={销售方名称,纳税人识别号,…,销售单位}

Features={特征1,…}

将发票的票面数据存储到树状模型中的步骤具体包括:

对于纸质发票的票面数据,取出任一数值,根据该数值的元数据,将该数值放入树状模型的叶子节点中。

对于电子发票的票面数据,遍历数据集中的元数据,将对应的数值放入树状模型中的相同元数据的叶子节点中。

三、发票统一归集。

对发票的票面数据可以自动执行分类,同时支持手动分类。发票的分类数据存储在发票根节点的“发票特征”的子节点下面。在分类完成后,自动提取发票关键词,如“购买方名称、销售方名称、销货清单中的物品名称”等。发票关键词存储在“发票特征”子节点下面。

发票索引采用哈希索引算法,该算法与B+树相比,具备更快的匹配速度。建立索引的步骤具体包括:建立哈希索引表中的目标索引项与票面数据模型中票面数据之间的关联关系。如图5所示,在接收到查询发票的信号时,元数据经过哈希算法,查找出该元数据在哈希索引表中的索引位置,该索引位置处有多个索引项,在多个索引项中查找出发票对应的目标索引项,由于目标索引项与发票的票面数据之间已经建立了关联关系,因此,可以从票面数据模型中获取与目标索引项关联的票面数据。

图6示出了根据本发明的一个实施例的发票管理装置的结构示意图。

如图6所示,根据本发明的一个实施例的发票管理装置600,包括:确定单元602、提取单元604和第一存储单元606。

确定单元602,用于在接收到对发票进行管理的信号时,确定所述发票的属性,所述发票的属性包括纸质发票或者电子发票;提取单元604,用于根据所述发票的属性,提取所述发票中的票面数据,其中,所述票面数据包括元数据和其对应的数值;第一存储单元606,用于根据所述元数据,将所述元数据对应的数值存储到票面数据模型中。

在该技术方案中,通过提取发票中的票面数据,将票面数据存储到票面数据模型中,其中,该发票可以是纸质发票,还可以是电子发票,从而实现了对纸质发票和电子发票的统一管理。而且解决了发票来源多样不易管理的问题,从而方便个人或者企业科学、高效地管理发票,尤为纸质发票的自动化业务处理提供了数据支撑。

在上述技术方案中,优选地,所述提取单元604包括:确定子单元6042,用于若所述发票为纸质发票,则通过所述发票的标识码来识别出所述发票的摘要信息,根据所述摘要信息获取所述发票的表体信息,将所述摘要信息和所述表体信息作为所述票面数据;解析子单元6044,用于若所述发票为电子发票,则获取所述发票的版本文件,对所述发票的版本文件的内容进行解析,以从所述发票中解析出所述票面数据。

在该技术方案中,由于纸质发票和电子发票在存储介质性质上的不同,因此,采用不同的方式来提取这两种发票的票面数据,从而为纸质发票和电子发票的统一管理提供了保障。

在上述任一技术方案中,优选地,发票管理装置600还包括:建立单元608,用于建立哈希索引表中的目标索引项与所述票面数据模型中所述票面数据之间的关联关系;获取单元610,用于在接收到查询所述发票的信号时,获取所述元数据在所述哈希索引表中的索引位置处的多个索引项;查找单元612,用于在所述多个索引项中查找出所述发票对应的所述目标索引项;所述获取单元610还用于,从所述票面数据模型中获取与所述目标索引项关联的所述票面数据。

在该技术方案中,通过建立哈希索引表中的目标索引项与票面数据模型中的票面数据之间的关联关系,当查询发票时,先根据元数据获取哈希索引表中的索引位置,由于该索引位置处的多个索引项的项数比较少,因此,在比较小的范围内可以快速地查找出发票对应的目标索引项,接下来就可以根据目标索引项从票面数据模型中获取发票的票面数据。因此,通过以上方案,可以快速地对发票进行查询。

在上述任一技术方案中,优选地,发票管理装置600还包括:第二存储单元614,用于若所述发票为纸质发票,则在提取所述发票中的票面数据之后,将所述发票中的票面数据以字符串集合的形式进行存储;所述第二存储单元614还用于,若所述发票为电子发票,则在提取所述发票中的票面数据之后,将所述发票中的票面数据以属性表的形式进行存储。

在该技术方案中,通过不同的方式对纸质发票和电子发票的票面数据进行存储,不仅能够保持与其他系统之间的兼容性,还方便获取存储的票面数据。

在上述任一技术方案中,优选地,所述票面数据模型为树状模型或者属性表模型,在所述票面数据模型为树状模型的情况下,所述票面数据模型的根节点为所述发票的唯一编码,所述根节点包括有至少一个子节点,所述至少一个子节点中的每个子节点包括至少一个叶子节点。

在该技术方案中,票面数据模型为树状模型,可以保证后期从票面数据模型中查询票面数据的速度,票面数据模型为属性表模型,可以保证存储票面数据的速度。具体可以根据实际的需求来选择票面数据模型,从而满足用户在不同情况下对发票管理的需求。

以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,可以实现对纸质发票和电子发票的统一管理。

在本发明中,术语“第一”、“第二”仅用于描述的目的,而不能理解为指示或暗示相对重要性;术语“多个”表示两个或两个以上。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1