一种数据匹配方法及装置的制作方法

文档序号:6580972阅读:179来源:国知局

专利名称::一种数据匹配方法及装置的制作方法
技术领域
:本发明涉及数据处理领域,特别是涉及一种数据匹配方法及装置。
背景技术
:企业资源计划(EnterpriseResourcePlanning,ERP)系统,是指建立在信息技术基础上,对企业的所有资源(物流、资金流、信息流或人力资源)进行整合集成管理,采用信息化手段实现企业供销链管理,从而达到对供应链上的每一环节实现科学管理的目的。在ERP系统中,有时候需要进行单据之间的数据匹配,从而将两张单据以某种关系匹配起来。例如,在做业务数据处理时,以核对应收款为例,为了确定收款单所收的金额对应的是哪一张销售发票上哪一个物料的钱,就需要建立销售发票明细与收款单明细之间的数据匹配关系,由这种数据匹配关系就可以明确哪张销售发票已经收过款了,哪张销售发票还未收款或还未全部收款,或者,客户的应收款余额是多少,等等。现有技术中有一种进行数据匹配的方法,以销售发票和收款单为例,对于销售发票中的金额进行匹配时,从第一行发票明细开始,依次匹配收款单中的第一行到最后一行数据,如果收款单有足够的剩余金额,那么将这条发票明细和这条收款单明细建立关联,关联金额为发票金额,如果收款单没有足够的剩余金额,则首先将这条发票明细和这条收款单明细建立关联,关联金额为收款单金额,发票的剩余金额为减去关联金额的金额,然后,在收款单中开始遍历下一条明细,利用同样的方法与发票的剩余金额进行匹配,直到销售发票中的这条金额匹配完成为止。然后在销售发票中插叙下一条发票明细,直至所有的发票明细都匹配完成。从上述过程中可以看出,需要建立一个嵌套循环,对于明细较多的时候,性能下降明显,性能不好。因此,目前需要本领域技术人员迫切解决的一个技术问题就是如何能够提出一种数据匹配方法,用以解决现有技术中需要建立嵌套循环导致的性能下降问题。
发明内容本发明所要解决的技术问题是提供一种数据匹配方法,用以解决现有技术中需要建立嵌套循环导致的性能下降问题。本发明的另一个目的是将上述构思应用于具体的应用环境中,提供一种数据匹配装置,从而保证该方法的实现和应用。为解决上述技术问题,本发明实施例提供了一种数据匹配方法,包括分别将原始数据集和比对数据集的匹配字段值进行累加,得到原始数据集和比对数据集中每条记录分别对应的累加字段值;对于所述原始数据集中的每条当前记录,在比对数据集中查找第一个大于所述当前记录的上一条记录的累加字段值对应的第一记录,以及,第一条大于或等于当前记录的累加字段值对应的第二记录;依据所述原始数据集中的当前记录,和所述比对数据集中的第一记录和第二记录生成原始数据集和比对数据集的匹配关系;根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联数据。可选的,所述根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联数据,具体包括对于原始数据集的每条记录,获取对应的累计字段值与匹配字段值的第一数据差;对于比对数据集的每条记录,获取对应的累计字段值与匹配字段值的第二数据差;当所述第一数据差大于等于所述第二数据差时,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值;如果否,则获取所述比对数据集与原始数据集的累计字段值之间的差,与原始数据集中的匹配字段值的和,并将所述和的值作为关联数据;6如果是,则获取原始数据集的匹配字段值作为关联数据。可选的,所述根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联数据,还包括当所述第一数据差小于所述第二数据差,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值;如果是,则获取原始数据集和比对数据集的匹配字段值之间的差,与比对数据集的匹配字段值的和,并将所述和的值作为关联数据;如果否,则获取比对数据集的匹配字段值作为关联数据。可选的,将所述匹配关系和关联数据以数据表的形式向用户进行展示。可选的,所述原始数据集和比对数据集中的记录数目不相同。本发明实施例还提供了一种数据匹配装置,包括累加模块,用于分别将原始数据集和比对数据集的匹配字段值进行累加,得到原始数据集和比对数据集中每条记录分别对应的累加字段值;查找模块,用于对于所述原始数据集中的每条当前记录,在比对数据集中查找第一个大于所述当前记录的上一条记录的累加字段值对应的第一记录,以及,第一条大于或等于当前记录的累加字段值对应的第二i己录;生成匹配关系模块,用于依据所述原始数据集中的当前记录,和所述比对数据集中的第一记录和第二记录生成原始数据集和比对数据集的匹配关系;生成关联数据模块,用于根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联数据。可选的,所述生成关联数据模块具体包括第一获取子模块,用于对于原始数据集的每条记录,获取对应的累计字段值与匹配字段值的第一数据差;第二获取子模块,用于对于比对数据集的每条记录,获取对应的累计字段值与匹配字段值的第二数据差;第一判断子模块,用于当所述第一数据差大于等于所述第二数据差时,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值;第三获取子模块,用于当所述第一判断子模块的结果为否时,获取所述比对数据集与原始数据集的累计字段值之间的差,与原始数据集中的匹配字段值的和,并将所述和的值作为关联数据;第四获取子模块,用于当所述第一判断子模块的结果为是时,获取原始数据集的匹配字段值作为关联数据。可选的,所述生成关联数据模块还包括第二判断子模块,用于当所述第一数据差小于所述第二数据差时,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值;第五获取子模块,用于当所述第二判断子模块的结果为是时,获取原始数据集和比对数据集的匹配字段值之间的差,与比对数据集的匹配字段值的和,并将所述和的值作为关联数据;第六获取子模块,用于当所述第二判断子模块的结果为否时,获取比对数据集的匹配字段值作为关联数据。可选的,还包才舌展示模块,用于将所述匹配关系和关联数据以数据表的形式向用户进行展示。可选的,所述原始数据集和比对数据集中的记录数目不相同。'与现有技术相比,本发明具有以下优点在本实施例中,首先将原始数据集和比对数据集中的匹配字段的值进行累加,在后续进行匹配时,就利用该累加字段的值,从而生成两个数据集之间的匹配关系和关联数据。采用本发明实施例所述的方法和装置,运用了数据库的集合处理的特点,从而不需要像现有技术一样设置嵌套循环,从而减少了匹配数据集中数据的时间,提升了匹配效率。本实施例所述的匹配方法,可以快速的建立数据集之间的凄t据匹配关系,8提升在ERP系统应用时的性能。为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本发明的一种数据匹配方法实施例1的流程图;图2是本发明的一种数据匹配方法实施例2的流程图;图3是本发明的一种数据匹配装置实施例1的结构示意图;图4是本发明的一种数据匹配装置实施例2的结构示意图。具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的i^明。本发明可用于众多通用或专用的计算装置环境或配置中。例如个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、'组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。为了使得本领域技术人员能够更清楚的了解本发明的技术方案,下面对数据匹配的原理估文一个简单的介绍。数据匹配就是将一个数据集(原始数据集)中的记录基于某一特定元素(即是比对元素,例如数量,金额等)与另一个数据集(比对数据集)中的记录按顺序进行比对,如果原始数据集的该条记录中的比对元素的数据值大于比对数据集被比对的记录的比对元素的数据值,则以数据值小的一方的值为匹配值建立两条记录的匹配关系,同时,将原始数据集中该记录中比对元素的余额(该条记录比对元素的原始值与已经匹配的值之差)与比对数据集的下一条记录进行比对,直至原始数据集中该条记录的比对元素的数据值与比对数据集中的记录完成匹配为止。同时,如果原始数据集中该记录比对元素的值小于比对数据集记录中比对元素的数据值,则同样以数据值小的一方的值为匹配值建立两条记录的匹配关系,并将比对数据集中该记录的比对元素的余额(该条记录比对元素的原始值与已经匹配的值之差)与原始数据集的下一条记录进行比对,直至比对数据集中该条记录的比对元素的值被与原始数据集中的记录完成匹配为止。按照互相匹配的顺序直至两个数据集中某一个数据集中的比对元素的值全部完成匹配为止。最终,两个lt据集之间就建立起以元素匹配值为依据的这样一种——对应的关系。参考图1,示出了本发明的一种数据匹配方法实施例1的流程图,可以包括以下步骤步骤101:分别将原始数据集和比对数据集的匹配字段值进行累加,得到原始数据集和比对数据集中每条记录分别对应的累加字段值。在实际应用中,如果比对元素是原始金额(为了与累加金额进行区分,本发明实施例中所述的原始金额即是实际中的金额),则首先需要获取到原始数据集和比对数据集中的金额字段,然后读取该字段的所有字段值(即是具体金额是多少),并依次从第一行的金额向最后一行累加。即是第一行的累加金额就是第一行的金额值,第二行的累加金额则是第一行和第二行的原始金额之和,以此类推。数据集中的累加金额的值,在实际应用中可以;改在一个累加字段中。步骤102:对于所述原始数据集中的每条当前记录,在比对数据集中查找第一个大于所述当前记录的上一条记录的累加字段值对应的第一记录,以及,第一条大于或等于当前记录的累加字段值对应的第二记录。10从原始数据集中的第一条记录开始匹配,并且从比对数据集中也是从第一条记录开始查找。当比对数据集中的第一条记录的累计金额小于原始数据集对应的累计金额时,则继续查找比对数据集中的下一条记录,直到找到比对数据集中大于原始数据集第一条记录累加金额的记录,这时,再拿原始数据集中的第二条记录与比对数据集中的该条记录匹配,直到找到原始数据集中大于比对数据集中该条记录累加金额的记录,以此类4偉。例如,对于原始数据集中的第二条记录,则在比对数据集中查找第一个大于原始数据集的第一条记录的累加字段值对应的记录,这里将比对数据集中的该记录记为第一记录;同时,在比对数据集中查找第一个大于原始数据集的第二条记录的累加字段值对应的记录,这里将比对数据集中的该记录记为第二记录。步骤103:依据原始数据集中的当前记录,和比对数据集中的第一记录和第二记录生成原始数据集和比对数据集的匹配关系。按照步骤102中查找到的比对数据集中的第一记录和第二记录,以及原始数据集中的当前记录,生成两个数据集之间的匹配关系。可以看出,对于原始数据集来说,原始数据集中的每一条记录的匹配记录,都是比对数据集中从第一个大于原始数据集的上一条记录的累加字段值对应的记录,到第一个大于原始数据集的当前记录的累加字段值对应的记录。对于比对数据集来说,比对数据集中的每一条记录的匹配记录,也都是原始数据集中从第一个大于比对数据集的上一条记录的累加字段值对应的记录,到第一个大于比对数据集的当前记录的累加字段值对应的^己录。步骤104:根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联数据。最后,再根据两个数据集中累加字段值以及匹配关系,计算获取所述原始数据集和比对数据集每一个记录对应的关联数据。在本实施例中,可以看出,运用了数据库的集合处理的特点,从而不需要像现有技术一样设置嵌套循环,从而减少了匹配数据集中数据的时间,提升了匹配效率。本实施例所述的匹配方法,可以快速的建立数据集之间的数据匹配关系,提升在ERP系统应用时的性能。参考图2,示出了本发明的一种数据匹配方法实施例2的流程图,本实施例可以包括以下步骤步骤201:分别将原始数据集和比对数据集的匹配字段值进行累加,得到原始数据集和比对数据集中每条记录分别对应的累加字段值。在实际应用中,所述原始数据集和比对数据集中的记录数目可以不相同,也可以相同。例如,所述原始数据集的如表1所示,所述比对数据集如表2所示,则两个数据集累加后的数据可以如表3所示。表1<table>tableseeoriginaldocumentpage12</column></row><table>表2<table>tableseeoriginaldocumentpage12</column></row><table>表3<table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table>步骤202:对于所述原始数据集中的每条当前记录,在比对数据集中查找第一个大于所述当前记录的上一条记录的累加字段值对应的第一记录,以及,第一条大于或等于当前记录的累加字段值对应的第二记录。对于表1所示的原始数据集而言,原始数据集的第一条记录(即是表中的第一行数据内容,序号为1)在比对数据集中的匹配记录,是比对数据集中的第一个记录和第二个记录,而对于原始数据集的第二条记录(序号为2)在比对数据集中的匹配记录,是比对数据集中的第二个记录,对于原始数据集的第三条记录(序号为3)在比对数据集中的匹配记录,是比对数据集中的第二、第三和第四个记录(序号分别为2、3和4);依次类推,可以找出原始数据集中所有记录在比对数据集中的匹酉己"i己录。步骤203:依据原始数据集中的当前记录,和比对数据集中的第一记录和第二记录生成原始数据集和比对数据集的匹配关系。同样的,对于比对数据集中的第一条记录(序号为1),对应原始数据集中的第一条记录,对于比对数据集中的第二条记录(序号为2),对应原始数据集中的第一条、第二条和第三条记录(序号包括1、2和3);以此类推,可以得到对于比对数据集中每一条记录在原始数据集中的匹配记录,依据生成两个数据集之间的匹配关系。其中,所述匹配关系在本实施例中具体可以如表4所示表4原始数据集序号比对数据集序号13<table>tableseeoriginaldocumentpage14</column></row><table>步骤204:对于原始数据集的每条记录,获取对应的累计字段值与匹配字段值的第一数据差。在本实施例中,匹配字段就是原始数据集和比对数据集中的原始金额字段,因此对于原始数据集中的第一条记录而言,第一数据差就是O,因为累计金额等于原始金额;对于原始数据集中的第二条记录而言,第一数据差就是100,依次类推,可以得到原始数据集中所有记录的第一数据差。步骤205:对于比对数据集的每条记录,获取对应的累计字段值与匹配字段值的第二数据差。而对于比对数据集中的第一条记录而言,第二数据差依旧是0,但是对于比对数据集中的第二条记录而言,第二数据差就是50,依此类推,可以得到比对数据集中所有记录的第一数据差。步骤206:当所述第一数据差大于等于所述第二数据差时,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值,如果是,则进入步骤208,如果否,则进入步骤207。当原始数据集中的第二条记录和比对数据集中的第二条记录比对时,原始数据集的第一数据差为100,而比对数据集的第二数据差为50,则判断原始数据集的第二条记录的累积字段值是否小于所述比对数据集的第二条记录的累积字段值。步骤207:获取所述比对数据集与原始数据集的累计字段值之间的差,与原始数据集中的匹配字段值的和,并将所述和的值作为关联数据。当原始数据集的第一条记录和比对数据集中的第一条记录比对时,原始数据集的原始金额值为100,比对数据集的原始金额值为50,因此此时,关联数据就为50-100+100,得到关联数据为50。步骤208:获取原始数据集的匹配字段值作为关联数据。则此时,就获取原始数据集中第二条记录的原始金额值IOO作为关联数据。步骤209:当所述第一数据差小于所述第二数据差,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值,如果是,则进入步骤210,如果否,则进入步骤211。当原始数据集的第三条记录与比对数据集的第三条记录比对时,第一数据差为250,第二数据差为290,此时,判断原始数据集第三条记录的累积字段值是否小于比对数据集中第三条记录的累计字段值。步骤210:获取原始数据集和比对数据集的累计字段值之间的差,与比对数据集的匹配字段值的和,并将该和的值作为关联数据。例如,对于原始数据集的第三条记录和比对数据集的第五条记录而言,其关联数据的计算方式就为450-480+50,关联数据的值为20。步骤211:获取比对数据集的匹配字段值作为关联数据。此时则两个数据集中第三条记录互相匹配的关联数据为比对数据集中第三条记录中的原始金额,即是30。当原始数据集和比对数据集的每一条记录对应的关联数据都获取到时,可以和匹配关系一起生成一个匹配关系和关联金额的表格。在本实施例中的匹配关系和关联金额可以如下表5所示。<table>tableseeoriginaldocumentpage15</column></row><table>2215032403330341044100420305630步骤212:将所述匹配数据和关联数据以数据表的形式向用户进行展示。最后生成的数据表可以向用户进行展示。与传递匹配算法相比,运用本实施例所述的数据匹配方法,在实际应用中,可以很好的提升性能,尤其是在需要匹配的数据量较大的时候,更能提升在ERP系统中对于数据匹配的效率。需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。参考图3,示出了本发明的一种数据匹配装置实施例1的结构框图,可以包括以下模块累加模块301,用于分别将原始数据集和比对数据集的匹配字段值进行累加,得到原始数据集和比对数据集中每条记录分别对应的累加字段值。在实际应用中,如果比对元素是原始金额(为了与累加金额进行区分,本发明实施例中所述的原始金额即是实际中的金额),则首先需要获取到原始数据集和比对数据集中的金额字段,然后读取该字段的所有字段值(即是具体金额是多少),并依次从第一行的金额向最后一行累加。即是第一行的累加金额就是第一行的金额值,第二行的累加金额则是第一行和第二行的原始金额之和,以此类推。数据集中的累加金额的值,在实际应用中可以放在一个累加字l殳中。查找模块302,用于对于所述原始数据集中的每条当前记录,在比对数据集中查找第一个大于所述当前记录的上一条记录的累加字段值对应的第一记录,以及,第一条大于或等于当前记录的累加字段值对应的第二记录。从原始数据集中的第一条记录开始匹配,并且从比对数据集中也是从第一条记录开始查找。当比对数据集中的第一条记录的累计金额小于原始数据集对应的累计金额时,则继续查找比对数据集中的下一条记录,直到找到比对数据集中大于原始数据集第一条记录累加金额的记录,这时,再拿原始数据集中的第二条记录与比对数据集中的该条记录匹配,直到找到原始数据集中大于比对数据集中该条记录累加金额的记录,以此类^^偉。生成匹配关系才莫块303,用于依据原始数据集中的当前记录,和比对数据集中的第一记录和第二记录生成原始数据集和比对数据集的匹配关系。按照前面查找到的比对数据集中的第一记录和第二记录,以及原始数据集中的当前记录,生成两个数据集之间的匹配关系。可以看出,对于原始数据集来说,原始数据集中的每一条记录的匹配记录,都是比对数据集中从第一个大于原始数据集的上」条记录的累加字段值对应的记录,到第一个大于原始数据集的当前记录的累加字段值对应的记录。对于比对数据集来说,比对数据集中的每一条记录的匹配记录,也都是原始数据集中从第一个大于比对数据集的上一条记录的累加字段值对应的记录,到第一个大于比对数据集的当前记录的累加字段值对应的记录。生成关联数据模块304,用于根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联1数据。最后,再根据两个数据集中累加字段值以及匹配关系,计算获取所述原始数据集和比对数据集每一个记录对应的关联数据。在本实施例中,可以看出,运用了数据库的集合处理的特点,从而不需要像现有技术一样设置嵌套循环,从而减少了匹配数据集中数据的时间,提升了匹配效率。本实施例所述的匹配方法,可以快速的建立数据集之间的数据匹配关系,提升在ERP系统应用时的性能。参考图4,示出了本发明的一种数据匹配装置实施例2的结构框图,可以包括以下模块累加模块301,用于分别将原始数据集和比对数据集的匹配字段值进行累加,得到原始数据集和比对数据集中每条记录分别对应的累加字段值。查找模块302,用于对于所述原始数据集中的每条当前记录,在比对数据集中查找第一个大于所述当前记录的上一条记录的累加字段值对应的第一记录,以及,第一条大于或等于当前记录的累加字段值对应的第二记录。生成匹配关系模块303,用于依据原始数据集中的当前记录,和比对数据集中的第一记录和第二记录生成原始数据集和比对数据集的匹配关系。第一获取子模块401,用于对于原始数据集的每条记录,获取对应的累计字段值与匹配字段值的第一数据差。第二获取子模块402,用于对于比对数据集的每条记录,获取对应的累计字段值与匹配字段值的第二数据差。第一判断子模块403,用于当所述第一数据差大于等于所述第二数据差,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值。第三获取子模块404,用于当所述第一判断子模块的结果为否时,获取所述比对数据集与原始数据集的累计字段值之间的差,与原始数据18集中的匹配字段值的和,并将所述和的值作为关联数据。第四获取子模块405,用于当所述第一判断子模块的结果为是时,获取原始数据集的匹配字段值作为关联数据。第二判断子模块406,用于当所述第一数据差小于所述第二数据差,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值。第五获取子模块407,用于当所述第二判断子模块的结果为是时,获取原始数据集和比对数据集的匹配字段值之间的差,与比对数据集的匹配字段值的和,并将该和的值作为关联数据。第六获取子模块408,用于当所述第二判断子模块的结果为否时,获取比对数据集的匹配字段值作为关联数据。展示模块409,用于将所述匹配关系和关联数据以数据表的形式向用户进行展示。需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求且,术语"包括"、"包含"或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句"包括一个......,,限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上对本发明所提供的一种数据匹配方法及数据匹配装置进行了详述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。权利要求1、一种数据匹配方法,其特征在于,包括分别将原始数据集和比对数据集的匹配字段值进行累加,得到原始数据集和比对数据集中每条记录分别对应的累加字段值;对于所述原始数据集中的每条当前记录,在比对数据集中查找第一个大于所述当前记录的上一条记录的累加字段值对应的第一记录,以及,第一条大于或等于当前记录的累加字段值对应的第二记录;依据所述原始数据集中的当前记录,和所述比对数据集中的第一记录和第二记录生成原始数据集和比对数据集的匹配关系;根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联数据。2、如权利要求1所述的方法,其特征在于,所述根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联数据,具体包括对于原始数据集的每条记录,获取对应的累计字段值与匹配字段值的第一数据差;对于比对数据集的每条记录,获取对应的累计字段值与匹配字段值的第二数据差;当所述第一数据差大于等于所述第二数据差时,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值;如果否,则获取所述比对数据集与原始数据集的累计字段值之间的差,与原始数据集中的匹配字段值的和,并将所述和的值作为关联数据;如果是,则获取原始数据集的匹配字段值作为关联数据。3、如权利要求2所述的方法,其特征在于,所述根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联数据,还包括当所述第一数据差小于所述第二数据差,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值;如果是,则获取原始数据集和比对数据集的匹配字段值之间的差,与比对数据集的匹配字段值的和,并将所述和的值作为关联数据;如果否,则获取比对数据集的匹配字段值作为关联数据。4、如权利要求1所述的方法,其特征在于,将所述匹配关系和关联数据以数据表的形式向用户进行展示。5、如权利要求l-4任意一项所述的方法,其特征在于,所述原始数据集和比对数据集中的记录数目不相同。6、一种数据匹配装置,其特征在于,包括累加模块,用于分别将原始数据集和比对数据集的匹配字段值进行累加,得到原始数据集和比对数据集中每条记录分别对应的累加字段值;查找模块,用于对于所述原始数据集中的每条当前记录,在比对数据集中查找第一个大于所述当前记录的上一条记录的累加字段值对应的第一记录,以及,第一条大于或等于当前记录的累加字段值对应的第二记录;生成匹配关系模块,用于依据所述原始数据集中的当前记录,和所述比对数据集中的第一记录和第二记录生成原始数据集和比对数据集的匹配关系;生成关联数据模块,用于根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联数据。7、如权利要求6所述的装置,其特征在于,所述生成关联数据模块具体包括第一获取子模块,用于对于原始数据集的每条记录,获取对应的累计字段值与匹配字段值的第一数据差;第二获取子模块,用于对于比对数据集的每条记录,获取对应的累计字段值与匹配字段值的第二数据差;第一判断子模块,用于当所述第一数据差大于等于所述第二数据差时,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值;第三获取子模块,用于当所述第一判断子模块的结果为否时,获取所述比对数据集与原始数据集的累计字段值之间的差,与原始数据集中的匹配字段值的和,并将所述和的值作为关联数据;第四获取子模块,用于当所述第一判断子模块的结果为是时,获取原始数据集的匹配字段值作为关联数据。8、如权利要求7所述的装置,其特征在于,所述生成关联数据模块还包括第二判断子模块,用于当所述第一数据差小于所述第二数据差时,判断原始数据集当前记录的累积字段值是否小于所述比对数据集的累计字段值;第五获取子模块,用于当所述第二判断子模块的结果为是时,获取原始数据集和比对数据集的匹配字段值之间的差,与比对数据集的匹配字段值的和,并将所述和的值作为关联数据;第六获取子模块,用于当所述第二判断子模块的结果为否时,获取比对数据集的匹配字段值作为关联数据。9、如权利要求6所述的装置,其特征在于,还包括展示模块,用于将所述匹配关系和关联数据以数据表的形式向用户进行展示。10、如权利要求6-9任意一项所述的装置,其特征在于,所述原始数据集和比对数据集中的记录数目不相同。全文摘要本发明提供了一种数据匹配方法及装置,所述方法包括分别将原始数据集和比对数据集的匹配字段值进行累加,得到原始数据集和比对数据集中每条记录分别对应的累加字段值;对于所述原始数据集中的每条当前记录,在比对数据集中查找第一个大于所述当前记录的上一条记录的累加字段值对应的第一记录,以及,第一条大于或等于当前记录的累加字段值对应的第二记录;依据原始数据集中的当前记录,和比对数据集中的第一记录和第二记录生成原始数据集和比对数据集的匹配关系;根据所述原始数据集和比对数据集各自的累加字段值和匹配关系,生成所述原始数据集和比对数据集的关联数据。本发明运用了减少了匹配数据集中数据的时间,提升了匹配效率。文档编号G06F17/30GK101661510SQ200910179910公开日2010年3月3日申请日期2009年9月29日优先权日2009年9月29日发明者邝维生申请人:金蝶软件(中国)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1