一种车型数据拆分匹配方法及设备与流程

文档序号:11407448阅读:220来源:国知局

本发明涉及数据分析处理技术领域,具体涉及一种车型数据拆分匹配方法及设备。



背景技术:

随着汽车大数据的发展,汽车电子商务公司对于汽车车型数据库的精准需求不断增加,不但要处理简单的数据,而且还要在数据量成倍增长的前提下,控制车型数据的质量。在汽车电子商务公司对外服务时,由于各司业务性质的不同,车型数据的标准与质量也有差异,双方公司进行合作时,首要任务就是要统一标准,即合作双方车型数据库的对接。只有这样,建立在数据库基础上的业务合作才能有更高的效率,对于汽车电子商务公司的数据业务才能有效扩展。但现实情况是目前数据库的对接主要依靠人力完成,耗时且匹配结果容易出错。

综上,现有的车型数据库在对接过程中,仍有诸多需改善的环节。



技术实现要素:

为解决现有技术的不足,本发明提供了一种车型数据拆分匹配方法,包括如下步骤:

s1:将多条车型数据存储于服务器的数据库中,其中,该车型数据包括多张存储不同种类车型参数的表格;

s2:从多条车型数据中筛选出重点项字段数据和非重点项字段数据;

s3:将重点项字段数据进行分类排列组合,或者将重点项字段数据和非重点项字段数据进行分类排列组合;s4:将排列组合后的重点项字段数据进行统一归类,对存在差异的字段数据值进行判定及关系转换,以得到标准值,并将统一标准值的分类排列组合结果存储于数据库中;

s5:根据步骤s4中得到的统一标准值分类排列组合结果进行数据匹配。

其中,还包括如下步骤:

s6:将步骤s5得到的数据匹配结果与业务线上的输出相连。

其中,所述步骤s3还包括:

s31:判定所需匹配的数据字段是否包含非重点项字段数据及是否缺失重点项字段数据;

s32:若所需匹配的数据字段包含非重点项字段数据且缺失重点项字段数据,则将重点项字段数据和非重点项字段数据进行分类排列组合,并将分类排列组合后的结果存储于数据库中;

若所需匹配的数据字段不缺失重点项字段数据,则将重点项字段数据进行分类排列组合,并将分类排列组合后的结果存储于数据库中。

其中,所述步骤s2中,所述重点项字段数据通过估值模型所需字段划分得来。

本发明另外提供了一种车型数据拆分匹配设备,包括服务器、处理器以及在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

s1:将多条车型数据存储于所述服务器的数据库中,其中,该车型数据包括多张存储不同种类车型参数的表格;

s2:从多条车型数据中筛选出重点项字段数据和非重点项字段数据;

s3:将重点项字段数据进行分类排列组合,或者将重点项字段数据和非重点项字段数据进行分类排列组合;s4:将排列组合后的重点项字段数据进行统一归类,对存在差异的字段数据值进行判定及关系转换,以得到标准值,并将统一标准值的分类排列组合结果存储于数据库中;

s5:根据步骤s4中得到的统一标准值分类排列组合结果进行数据匹配。

其中,所述处理器执行所述计算机程序时还实现以下步骤:

s6:将步骤s5得到的数据匹配结果与业务线上的输出相连。

其中,所述步骤s3还包括:

s31:判定所需匹配的数据字段是否包含非重点项字段数据及是否缺失重点项字段数据;

s32:若所需匹配的数据字段包含非重点项字段数据且缺失重点项字段数据,则将重点项字段数据和非重点项字段数据进行分类排列组合,并将分类排列组合后的结果存储于数据库中;

若所需匹配的数据字段不缺失重点项字段数据,则将重点项字段数据进行分类排列组合,并将分类排列组合后的结果存储于数据库中。

其中,所述步骤s2中,所述重点项字段数据通过估值模型所需字段划分得来。

本发明提供的车型数据拆分匹配方法及设备,能有效提高数据库之间的匹配效率,且提高匹配精准度。

具体实施方式

为了对本发明的技术方案及有益效果有更进一步的了解,下面详细说明本发明的技术方案及其产生的有益效果。

本发明提供的车型数据拆分匹配方法,主要基于汽车车型数据在商务合作中的需求,其思路在于根据数据的重要程度划分类型,之后进行排列组合,主要包括如下步骤:

s1:将多条车型数据存储于服务器的数据库中,其中,该车型数据包括多张存储不同种类车型参数的表格。

s2:从多条车型数据中的车型数据信息拆分为多个字段,从中筛选出重点项字段数据和非重点项字段数据;所谓的重点项字段数据,即为那些判断车型数据重要依据的字段,如排量、款型等,通过估值模型所需字段划分得来;如有的车型数据不包含重点项,则视为无效数据,不作为数据匹配的对象。

s31:判定所需匹配的数据字段是否包含非重点项字段数据及是否缺失重点项字段数据;

s32:若所需匹配的数据字段包含非重点项字段数据且缺失重点项字段数据,则将重点项字段数据和非重点项字段数据进行分类排列组合,并将分类排列组合后的结果存储于数据库中;

若所需匹配的数据字段不缺失重点项字段数据,则将重点项字段数据进行分类排列组合,并将分类排列组合后的结果存储于数据库中。

本发明在排列组合过程中,可利用不同品牌的规律及习惯差异,建立相应规则,并针对估值模型所需字段优先组合,从而可以大大提升原始随机读取的成功率及匹配效率。

表1及表2分别为将数据字段中的重点项字段数据进行分类排列组合后得到的其中两种结果或更多。

表1:车型重点项字段数据的一种分类排列组合结果

表2:车型重点项字段数据的另一种分类排列组合结果

由于在一条完整的数据中,包含的字段有时超过百项,其中大部分在数据匹配中是没有用的,作为一项参考标准或匹配依据,为在其中挑出可以辅助判断的、优先级最高的进行排列组合,本发明同时还可将非重点项字段数据进行分类排列组合,如表3所示,为将非重点项字段数据进行分类排列组合后得到的一组结果。

表3:车型非重点项字段数据的一种分类排列组合结果

表4表示本发明中,所需匹配的数据字段包含非重点项字段数据且缺失重点项时字段数据,则将重点项字段数据和非重点项字段数据进行分类排列组合得到的一组结果。

表4:车型重点项字段数据与非重点项字段数据的一种分类排列组合结果

因此,本发明提供的车型数据拆分匹配方法,可根据不同的匹配需求对数据字段重要项进行拆分组合,实现对匹配数据的质量进行控制,提升效率。

由于市场针对同类用途的功能(含字段)叫法不一、杂乱无章,为了进一步增加后期数据匹配的效果,将同类数据更准确归类,本发明提供的车型数据拆分匹配方法,还包括以下步骤:

s4:将重点项字段数据的差异值进行判定及关系转换,以得到标准值;详见表5,为重点项字段数据的差异值判定及关系转换结果。

表5:重点项字段数据的差异值判定及关系转换结果

s5:根据步骤s32中得到的分类排列组合结果进行数据匹配,将需要匹配的数据清洗入库,过滤掉对数据匹配起不到任何作用的错误信息等无用信息。因此,通过本发明提供的车型数据拆分匹配方法,可精确查找数据库中与所需匹配项一致的数据,进行一一对应,由于每条数据都有自己的id标识,最终对应的id及数据结果会存储于数据库中。

s6:将步骤s5得到的数据匹配结果与业务线上的输出相连,具体的,根据估值模型所需,实现估值接口的对接以及估值结果的输出,利用步骤s5所记录的id关系进行输入与输出,建立数据与业务线所需数据的一对多的关系,调取业务所需结果。

因此,本发明提供的车型数据拆分匹配方法,通过将重点项字段数据的差异值转换为标准值,并通过将得到的标准值在汽车电子商务领域进行应用,在技术层面,一方面实现了车型数据库与其他合作业务线的对接,另一方面提高了数据对接的效率及准确性。

基于上述车型数据拆分匹配方法,本发明另外提供了一种车型数据拆分匹配设备,包括服务器、处理器以及在所述处理器上运行的计算机程序,其特征在于,

所述处理器执行所述计算机程序时实现以下步骤:

s1:将多条车型数据存储于所述服务器的数据库中,其中,该车型数据包括多张存储不同种类车型参数的表格;

s2:从多条车型数据中筛选出重点项字段数据和非重点项字段数据;

s31:判定所需匹配的数据字段是否包含非重点项字段数据及是否缺失重点项字段数据;

s32:若所需匹配的数据字段包含非重点项字段数据且缺失重点项字段数据,则将重点项字段数据和非重点项字段数据进行分类排列组合,并将分类排列组合后的结果存储于数据库中;

若所需匹配的数据字段不缺失重点项字段数据,则将重点项字段数据进行分类排列组合,并将分类排列组合后的结果存储于数据库中;

s4:;将排列组合后的重点项字段数据进行统一归类,的对存在差异的字段数据值进行判定及关系转换,以得到标准值,并将统一标准值的分类排列组合结果存储于数据库中;

s5:根据步骤s4中得到的统一标准值分类排列组合结果进行数据匹配;

s6:将步骤s5得到的数据匹配结果与业务线上的输出相连。

本发明的有益效果如下:

1、可根据不同的匹配需求对数据字段重要项进行拆分组合,实现对匹配数据的质量进行控制,提升效率。

2、可实现车型数据库与其他合作业务线的对接,同时提高了数据对接的效率及准确性。

虽然本发明已利用上述较佳实施例进行说明,然其并非用以限定本发明的保护范围,任何本领域技术人员在不脱离本发明的精神和范围之内,相对上述实施例进行各种变动与修改仍属本发明所保护的范围,因此本发明的保护范围以权利要求书所界定的为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1