一种基于数据特征的单据数据映射关系确定方法及系统与流程

文档序号:35419861发布日期:2023-09-13 00:46阅读:41来源:国知局
一种基于数据特征的单据数据映射关系确定方法及系统与流程

所属的技术人员可以清楚地了解到,为方便的描述和简洁,上述描述的系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。进一步的,本申请实施例还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例所述的基于数据特征的单据数据映射关系确定方法。进一步的,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行如上述实施例所述的基于数据特征的单据数据映射关系确定方法。进一步的,本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在计算机设备上运行时,使得所述计算机设备实现如上所述的基于数据特征的单据数据映射关系确定方法。以上所述是本发明的优选实施方式,应当指出,对于本的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。


背景技术:

1、随着企业的业务不断增加,不同业务的相关数据也逐渐增加,为了方便管理不同的业务数据,会划分不同的业务系统对业务数据进行存储与管理。例如,关于收款单据的业务对应收款系统,采购业务单据的业务对应采购系统。

2、当需要转换或调用不同业务单据的数据时,可以通过确定不同业务单据之间的数据映射关系,根据数据映射关系进行数据提取或数据集成等操作。目前常用的方式是确定源数据与目标数据的字段(例如,编码或名称),根据字段进行自动映射,以确定两个数据之间的映射关系。

3、但现有技术有如下技术问题:映射关系随着业务规模复杂度增加而递增,编码和名称难以反映具体的业务,进而无法确定数据具体的映射关系;而且当字段编码和名称与业务存在差异时,确定的映射关于与业务也会产生偏差,降低了映射的精度。


技术实现思路

1、本发明提出一种基于数据特征的单据数据映射关系确定方法及系统,所述方法可以在获取用户单据的源数据以及目标系统所要录入的单据的目标数据后,根据源数据与目标数据的数据特征进行匹配,以确定数据的映射关系,以提升映射的精度和效率。

2、本发明实施例的第一方面提供了一种基于数据特征的单据数据映射关系确定方法,所述方法包括:获取单据数据,所述单据数据包括:用户单据的源数据以及目标系统的目标数据;

3、从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据;

4、对所述源特征数据和所述目标特征数据进行字段值匹配得到数据映射关系。

5、在第一方面的一种可能的实现方式中,所述从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据,包括:

6、识别所述源数据的源标识字段以及关于单据信息的源信息字段,将所述源信息字段添加至所述源标识字段,得到源特征数据;

7、识别所述目标数据的目标标识字段以及关于单据信息的目标信息字段,将所述目标信息字段添加至所述目标标识字段,得到目标特征数据。

8、在第一方面的一种可能的实现方式中,所述对所述源特征数据和所述目标特征数据进行字段匹配得到数据映射关系,包括:

9、遍历所述目标特征数据的字段值,得到目标特征字段值;

10、从所述源特征数据中筛选与所述目标特征字段值相同的字段值,得到源特征字段值;

11、对所述源特征字段值和所述目标特征字段值进行字段值匹配得到数据映射关系。

12、在第一方面的一种可能的实现方式中,在所述获取单据数据的步骤后,所述方法还包括:

13、利用语义算法识别所述源数据和所述目标数据在相同业务上相同的字段值,分别得到若干个源业务字段值和若干个目标业务字段值;

14、若所述源业务字段值和所述目标业务字段值相同,且若干个所述源业务字段值均不相同,则从所述源数据和所述目标数据提取特征数据。

15、本发明实施例的第二方面提供了一种基于数据特征的单据数据映射关系确定系统,所述系统包括:获取模块,用于获取单据数据,所述单据数据包括:用户单据的源数据以及目标系统的目标数据;

16、特征提取模块,用于从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据;

17、确定映射关系模块,用于对所述源特征数据和所述目标特征数据进行字段值匹配得到数据映射关系。

18、在第二方面的一种可能的实现方式中,所述特征提取模块,还用于:

19、识别所述源数据的源标识字段以及关于单据信息的源信息字段,将所述源信息字段添加至所述源标识字段,得到源特征数据;

20、识别所述目标数据的目标标识字段以及关于单据信息的目标信息字段,将所述目标信息字段添加至所述目标标识字段,得到目标特征数据。

21、在第二方面的一种可能的实现方式中,所述确定映射关系模块,还用于:

22、遍历所述目标特征数据的字段值,得到目标特征字段值;

23、从所述源特征数据中筛选与所述目标特征字段值相同的字段值,得到源特征字段值;

24、对所述源特征字段值和所述目标特征字段值进行字段值匹配得到数据映射关系。

25、在第二方面的一种可能的实现方式中,所述系统还包括:

26、字段识别模块,用于利用语义算法识别所述源数据和所述目标数据在相同业务上相同的字段值,分别得到若干个源业务字段值和若干个目标业务字段值;

27、字段判断模块,用于若所述源业务字段值和所述目标业务字段值相同,且若干个所述源业务字段值均不相同,则从所述源数据和所述目标数据提取特征数据。

28、本发明实施例的第三方面提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的基于数据特征的单据数据映射关系确定方法。

29、本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行如上所述的基于数据特征的单据数据映射关系确定方法。

30、本发明实施例的第五方面提供了一种计算机程序产品,所述计算机程序产品在计算机设备上运行时,使得所述计算机设备实现如上所述的基于数据特征的单据数据映射关系确定方法。

31、相比于现有技术,本发明实施例提供的一种基于数据特征的单据数据映射关系确定方法及系统,其有益效果在于:本发明可以在获取用户单据的源数据以及目标系统所要录入的单据的目标数据后,分别从源数据和目标数据中提取对应的特征数据,根据特征数据进行字段匹配,以确定源数据和目标数据的映射关系;一方面可以通过字段确定业务的映射关系,贴合实际业务场景,另一方面可以避免因编码和名称与业务存在差异,而导致映射关系与业务也产生偏差的情况,能提升映射的精度。



技术特征:

1.一种基于数据特征的单据数据映射关系确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于数据特征的单据数据映射关系确定方法,其特征在于,所述从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据,包括:

3.根据权利要求1所述的基于数据特征的单据数据映射关系确定方法,其特征在于,所述对所述源特征数据和所述目标特征数据进行字段值匹配得到数据映射关系,包括:

4.根据权利要求1-3任意一项所述的基于数据特征的单据数据映射关系确定方法,其特征在于,在所述获取单据数据的步骤后,所述方法还包括:

5.一种基于数据特征的单据数据映射关系确定系统,其特征在于,所述系统包括:

6.根据权利要求5所述的基于数据特征的单据数据映射关系确定系统,其特征在于,所述特征提取模块,还用于:

7.根据权利要求5所述的基于数据特征的单据数据映射关系确定系统,其特征在于,所述确定映射关系模块,还用于:

8.根据权利要求5-7任意一项所述的基于数据特征的单据数据映射关系确定系统,其特征在于,所述系统还包括:

9.一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4任意一项所述的基于数据特征的单据数据映射关系确定方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行如权利要求1-4任意一项所述的基于数据特征的单据数据映射关系确定方法。


技术总结
本发明公开了一种基于数据特征的单据数据映射关系确定方法及系统,所述方法包括:获取单据数据,所述单据数据包括:用户单据的源数据以及目标系统的目标数据;从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据;对所述源特征数据和所述目标特征数据进行字段值匹配得到数据映射关系。本发明在获取用户单据的源数据和目标系统所要录入的单据的目标数据后,从源数据和目标数据中提取对应的特征数据,根据特征数据进行字段匹配,以确定源数据和目标数据的映射关系;既可以通过字段确定业务的映射关系,贴合实际业务场景,又可以避免因编码和名称与业务存在差异,而导致映射关系与业务也产生偏差的情况,能提升映射的精度。

技术研发人员:杨建辉,胡慧君,杨发,胡启程,江婉玲
受保护的技术使用者:金蝶软件(中国)有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1