一种车辆型号校验方法及装置与流程

文档序号:11918012阅读:206来源:国知局
一种车辆型号校验方法及装置与流程

本发明实施例涉及文本识别技术,尤其涉及一种车辆型号校验方法及装置。



背景技术:

在车联网领域内,车辆的品牌和型号较多,对于每个品牌,大型品牌车厂可能有成千上万个车辆型号,再考虑车辆品牌众多,所有型号数量级甚至达到百万数量级。对车辆型号进行数据采集后,一般是以文本形式保存,在这个过程中,很多车辆型号由于书写问题、印刷字体出错或录入疏忽等原因产生了错误,车辆型号的错误可能会导致对车辆车长、载重、驱动型式、排放等属性的判断结果与真实情况出现偏差。

针对这一问题,传统方法是通过直接以标准型号库作为字典进行一一比对,但是这种方法便利性差,工作量大,浪费大量的时间。



技术实现要素:

本发明实施例提供一种车辆型号校验方法及装置,以实现对车辆型号进行校验。

第一方面,本发明实施例提供了一种车辆型号校验方法,该方法包括:

统计每个车辆型号在待检验车辆型号库中的重复次数;

将所有所述重复次数大于预设重复次数的车辆型号构成车型初选正确库,不大于预设重复次数的车辆型号构成车型初选错误库;

将所述车型初选正确库中与车辆其他属性不匹配或不符合型号规则的车辆型号,与所述车型初选错误库中不包含在标准型号库的车辆型号,构成车型错误库;

确定所述车型错误库中所有车辆型号的错误类型,其中,所述错误类型为不包含在标准型号库中、不符合型号规则、与车辆其他属性不匹配、包含乱码、长度过小以及车辆型号为空当中的至少一种;

将所述错误类型和正确结果保存为车辆型号校验结果。

进一步地,在确定所述车型错误库中所有车辆型号的错误类型之后,还包括:

按照修正模型对所述车型错误库中的车辆型号进行修正。

进一步地,所述修正模型的确定过程包括:

在所述车型错误库抽取车辆型号样本数据,并将所述样本数据与相对应的真实型号进行比对并进行修正,确定车辆型号的错误模式;

分别统计每个错误模式下的错误修正方式和操作字符,作为所述修正模型。

进一步地,将所述错误类型和正确结果保存为车辆型号校验结果包括:

对于每一个车辆型号,采用六位二进制的数字分别存储正确结果和六种错误类型,其中,对于每一位,正确或符合此类错误则为1,否则为0;

将所述二进制数字换算成十进制数字;

将所述十进制数字映射成ASCII码并进行保存,作为车辆型号校验结果。

进一步地,所述预设重复次数的确定过程包括:

分别拟合车辆型号覆盖率与重复次数之间以及,准确率与重复次数之间的线性关系;

将使覆盖率和准确率均最高的重复次数确定为所述预设重复次数。

第二方面,本发明实施例还提供了一种车辆型号校验装置,该装置包括:

次数统计模块,用于统计每个车辆型号在待检验车辆型号库中的重复次数;

初选库构成模块,用于将所有所述重复次数大于预设重复次数的车辆型号构成车型初选正确库,不大于预设重复次数的车辆型号构成车型初选错误库;

错误库构成模块,用于将所述车型初选正确库中与车辆其他属性不匹配或不符合型号规则的车辆型号,与所述车型初选错误库中不包含在标准型号库的车辆型号,构成车型错误库;

错误类型确定模块,用于确定所述车型错误库中所有车辆型号的错误类型,其中,所述错误类型为不包含在标准型号库中、不符合型号规则、与车辆其他属性不匹配、包含乱码、长度过小以及车辆型号为空当中的至少一种;

结果保存模块,用于将所述错误类型和正确结果保存为车辆型号校验结果。

进一步地,还包括车型修正模块,具体用于在确定所述车型错误库中所有车辆型号的错误类型之后,按照修正模型对所述车型错误库中的车辆型号进行修正。

进一步地,还包括修正模型建立模块,具体用于:

在所述车型错误库抽取车辆型号样本数据,并将所述样本数据与相对应的真实型号进行比对并进行修正,确定车辆型号的错误模式;

分别统计每个错误模式下的错误修正方式和操作字符,作为所述修正模型。

进一步地,所述结果保存模块包括:

类型存储子模块,用于对于所述车型错误库中的每一个车辆型号,采用六位二进制的数字分别存储六种错误类型,其中,对于每一位,符合此类错误则为1,否则为0;

进制转换子模块,用于将所述二进制数字换算成十进制数字;

ASCII码映射子模块,用于将所述十进制数字映射成ASCII码并进行保存,作为车辆型号校验结果。

进一步地,还包括预设重复次数确定模块,具体用于:

分别拟合车辆型号覆盖率与重复次数之间以及,准确率与重复次数之间的线性关系;

将使覆盖率和准确率均最高的重复次数确定为所述预设重复次数。

本发明实施例通过利用型号重复次数、车辆型号规则以及车辆属性等特征对车辆型号进行校验,解决了传统校验车辆型号过程工作量大、准确度低等问题,实现了对车辆型号的正确性校验,并判断错误车辆型号的错误类型。

附图说明

图1为本发明实施例一提供的一种车辆型号校验方法的流程图;

图2是本发明实施例一提供的一种车型校验方法中的车辆型号覆盖率、准确率与重复次数的关系示意图;

图3为本发明实施例二提供的一种车辆型号校验方法的流程图;

图4为本发明实施例三提供的一种车辆型号校验方法的流程图;

图5是本发明实施例四提供的一种车辆型号校验装置示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种车辆型号校验方法的流程图,本实施例可适用于对文本类型车辆型号校验的情况,该方法可以由车辆型号校验装置来执行,该装置可以由硬件或软件实现,可集成在计算机等设备中,该方法具体包括:

S110、统计每个车辆型号在待检验车辆型号库中的重复次数。

其中,车辆型号是为识别车辆而对一类车辆指定的由拼音字母和阿拉伯数字组成的编号,指制造厂对具有同类型、品牌、种类、系列及车身型式的车辆所给予的名称。车辆型号编码的内容有五部分:企业名称代号、车辆类别代号、主要参数代号、产品序号和企业自定代号。在待检测车辆型号库中统计每个车辆型号出现的次数,作为该车辆型号的重复次数。优选地,可以将车辆型号与其他与型号相应的属性作成一个组合键值,例如可以选车架号前8位与车辆型号作为一种组合键值,进行分组统计,获取每个型号组合的重复次数。

S120、将所有所述重复次数大于预设重复次数的车辆型号构成车型初选正确库,不大于预设重复次数的车辆型号构成车型初选错误库。

其中,预设重复次数可以根据实际需求进行设定,相当于确定一个判断初选正确与否的标准,当车辆型号的重复次数达到该标准时,认为初选正确,将这部分车辆型号构成车型初选正确库,将未达到该标准的车辆型号构成车型初选错误库。

S130、将所述车型初选正确库中与车辆其他属性不匹配或不符合型号规则的车辆型号,与所述车型初选错误库中不包含在标准型号库的车辆型号,构成车型错误库。

其中,由于数据库中除了记载着车辆型号外,也记载着车辆的其他属性,例如车辆品牌、类型、载重以及车长等属性,由于车辆型号的不同位对应着车辆的不同属性,当通过车型初选正确库中的型号翻译出来的这些属性与记载的属性不符,则认为该型号是错误的;将符合所有要求的车辆型号划入到车型正确库。将车型初选错误库中的车辆型号与标准型号库进行比对,认为不包含在标准型号库的车辆型号是错误的,划到车型错误库中;认为包含在标准型号库的车辆型号是正确的,划入到车型正确库。将车型正确库与原标准信号库进行合并,作为新的标准型号库,作为以后车型校验的基础。

S140、确定所述车型错误库中所有车辆型号的错误类型,其中,所述错误类型为不包含在标准型号库中、不符合型号规则、与车辆其他属性不匹配、包含乱码、长度过小以及车辆型号为空当中的至少一种。

其中,不同的品牌对车辆型号有不同的标准规定,将车型错误库中的车辆型号与对应的品牌标准进行比对,当车辆型号中包含除品牌标准中包括的字符以外的字符时,认为其包含乱码;当车辆型号的长度小于品牌标准要求时,认为车辆型号长度过小,还有一种情况就是车辆型号没有记载时,记为车辆型号为空。同时不同车辆型号对应不同的型号规则,车辆型号规则规定了型号的每一位的字符类型,例如是字母还是数字,是否为零等。车辆型号规则可以用正则表达式表示,示例性地,车辆型号规则对应的正则表达式为:[A-Z]{2,3}[1-9]{1}[0-9]{3}[A-Z0-9],即:两个或三个字母+四个数字,其中第一个数字不能为零+一个字母+字母与数字混合字符。其中前两位或前三位是第一部分,是识别企业名称的代号,例如CA标识第一汽车制造厂;第四位是第二部分,用一位阿拉伯数字表示,代表车辆类别代号;例如1代表载货汽车;第五到六位是第三部分,用阿拉伯数字表示,代表主参数代号,例如载货汽车的车辆总质量;第四部分为产品序号,用阿拉伯数字表示。其余部分为数字与字符的混合。错误类型可以是六种情况中的一种,也可能是多种情况同时存在。

S150、将所述错误类型和正确结果保存为车辆型号校验结果。

其中,车辆校验结果分为:正确、不包含在标准型号库中、不符合型号规则、与车辆其他属性不匹配、包含乱码、长度过小以及车辆型号为空七种情况。

本发明实施例通过利用型号重复次数、车辆型号规则以及车辆属性等特征对车辆型号进行校验,解决了传统校验车辆型号过程工作量大、准确度低等问题,实现了对车辆型号的正确性校验,并判断错误车辆型号的错误类型。

在上述技术方案的基础上,优选地,所述预设重复次数的确定过程包括:

分别拟合车辆型号覆盖率与重复次数之间以及,准确率与重复次数之间的线性关系;

将使覆盖率和准确率均最高的重复次数确定为所述预设重复次数。

其中,覆盖率是指大于某个重复次数的车辆型号占所有车辆型号中的比例,准确率是指在大于某个重复次数的车辆型号中,在标准型号库中可以查询到的部分占的比例。统计重复次数为多个不同值是的车辆型号覆盖率和准确率,拟合车辆型号覆盖率与重复次数之间以及,准确率与重复次数之间的线性关系,将使覆盖率和准确率均最高的重复次数确定为预设重复次数。示例性地,数据拟合之后覆盖率-重复次数符合线性关系:y1=-0.0082x+1.0082,准确率-重复次数符合自然对数函数y2=0.1985ln(x)+0.171,图2是本发明实施例一提供的一种车型校验方法中的车辆型号覆盖率、准确率与重复次数的关系示意图,图中虚线线条对应的是车辆型号准确率与重复次数的关系曲线,实线线条对应的是车辆型号覆盖率与重复次数的关系曲线,综合考虑覆盖率和准确率,尽量使覆盖率和准确率最高,可以令y1=y2,得到一个建议值x=25。设定预设重复次数为25,此时覆盖率和准确率大约为0.8。同时保证了覆盖率和准确率,使初选结果更加准确。

实施例二

图3为本发明实施例二提供的一种车辆型号校验方法的流程图,本实施例是在上述实施例的基础上进行了优化,增加了“按照修正模型对所述车型错误库中的车辆型号进行修正”这一步骤,该方法包括:

S210、统计每个车辆型号在待检验车辆型号库中的重复次数。

S220、将所有所述重复次数大于预设重复次数的车辆型号构成车型初选正确库,不大于预设重复次数的车辆型号构成车型初选错误库。

S230、将所述车型初选正确库中与车辆其他属性不匹配或不符合型号规则的车辆型号,与所述车型初选错误库中不包含在标准型号库的车辆型号,构成车型错误库。

S240、确定所述车型错误库中所有车辆型号的错误类型,其中,所述错误类型为不包含在标准型号库中、不符合型号规则、与车辆其他属性不匹配、包含乱码、长度过小以及车辆型号为空当中的至少一种。

S250、将所述错误类型和正确结果保存为车辆型号校验结果。

S260、按照修正模型对所述车型错误库中的车辆型号进行修正。

其中,针对车型错误库中的车辆型号,可以参照修正模型对其对应的错误进行修正。修正模型可以是指操作方式和操作字符之间的对应关系,示例性地,如表1所示:

表1修正模型对应表

表1是修正模型对应表,可以按照此表对车辆型号错误进行修正,示例性地,按照车辆型号规则,前两位应该为字母,某车型的前两位为7J,此时可检测出第一位错误,错误模式为字母误替换为数字,对该错误进行修正时,按照修正模型对应表,将数字替换为字符,7修正为T,修正后的车型前两位为TJ。其他修正方式同理,在此不再赘述。对所有错误的型号计算型号的错误模式,按照错误模型选取基本操作,对型号进行递归修正,直到所有错误模式匹配、操作完毕。

优选地,所述修正模型的确定过程包括:

在所述车型错误库抽取车辆型号样本数据,并将所述样本数据与相对应的真实型号进行比对并进行修正,确定车辆型号的错误模式;

分别统计每个错误模式下的错误修正方式和操作字符,作为所述修正模型。

其中,修正模型的确定过程可以利用车型错误库中抽取的车辆型号样本数据获得,在车型错误库中,抽取一部分样本,将这部分样本数据与真实型号进行对比,统计车辆型号的错误模式,错误模式包括数字或字母缺失、符号缺失、数字误替换为字符或字符误替换为数字等。参照真实型号将这部分样本数据进行修正,计算与真实型号的编辑距离,统计每个错误模式下的错误修正方式和操作字符,作为修正模型。

本发明实施例实现了对车辆型号的正确性校验,并判断错误车辆型号的错误类型,以修正模型为参照,实现了对错误型号的修正,保证了型号的准确度,对利用型号判断车辆属性具有重大意义。

实施例三

图4为本发明实施例三提供的一种车辆型号校验方法的流程图,本实施例是在上述实施例的基础上进行了优化,对“将所述错误类型和正确结果保存为车辆型号校验结果”这一步骤进行了进一步地细化,该方法包括:

S310、统计每个车辆型号在待检验车辆型号库中的重复次数。

S320、将所有所述重复次数大于预设重复次数的车辆型号构成车型初选正确库,不大于预设重复次数的车辆型号构成车型初选错误库。

S330、将所述车型初选正确库中与车辆其他属性不匹配或不符合型号规则的车辆型号,与所述车型初选错误库中不包含在标准型号库的车辆型号,构成车型错误库。

S340、确定所述车型错误库中所有车辆型号的错误类型,其中,所述错误类型为不包含在标准型号库中、不符合型号规则、与车辆其他属性不匹配、包含乱码、长度过小以及车辆型号为空当中的至少一种。

S350、对于每一个车辆型号,采用六位二进制的数字分别存储正确结果和六种错误类型,其中,对于每一位,正确或符合此类错误则为1,否则为0。

其中,对车辆相关信息的校验包括对车辆所有属性的校验,而车辆型号仅仅是车辆属性当中的一种,因此仅采用一位可见字符对车型校验结果进行保存,可以节省内存空间。首先可以采用一个6位的二进制数字,每一位依次对应正确和六种错误类型,示例性地,当该二进制数字为000100时,代表该车型包含第3种错误类型。

S360、将所述二进制数字换算成十进制数字。

其中,将所述二进制数字换算成十进制数字,将错误校验结果转换成1到63的校验值。以上述例子为例,二进制数字000100对应的十进制数字为4。

S370、将所述十进制数字映射成ASCII码并进行保存,作为车辆型号校验结果。

其中,将十进制数字映射成ASCII码并进行保存,可以实现仅采用一位可见字符对车型校验结果。可以将每一个校验值加上ASCII表中字符“0”对应的十进制数字“48”,则得到校验值对应的校验码,例如正确型号的校验码为“0”,不在标准型号库的校验码为“1”以及仅仅不在标准型号库中为“P”等。将校验码作为车辆型号校验结果。

本发明实施例实现了对车辆型号的正确性校验,并判断错误车辆型号的错误类型,并利用一位可见字符保存校验结果,节省内存空间,便于为修正车辆型号提供参考信息。

实施例四

图5是本发明实施例四提供的一种车辆型号校验装置示意图,该装置包括:

次数统计模块410,用于统计每个车辆型号在待检验车辆型号库中的重复次数;

初选库构成模块420,用于将所有所述重复次数大于预设重复次数的车辆型号构成车型初选正确库,不大于预设重复次数的车辆型号构成车型初选错误库;

错误库构成模块430,用于将所述车型初选正确库中与车辆其他属性不匹配或不符合型号规则的车辆型号,与所述车型初选错误库中不包含在标准型号库的车辆型号,构成车型错误库;

错误类型确定模块440,用于确定所述车型错误库中所有车辆型号的错误类型,其中,所述错误类型为不包含在标准型号库中、不符合型号规则、与车辆其他属性不匹配、包含乱码、长度过小以及车辆型号为空当中的至少一种;

结果保存模块450,用于将所述错误类型和正确结果保存为车辆型号校验结果。

进一步地,还包括车型修正模块,具体用于在确定所述车型错误库中所有车辆型号的错误类型之后,按照修正模型对所述车型错误库中的车辆型号进行修正。

进一步地,还包括修正模型建立模块,具体用于:

在所述车型错误库抽取车辆型号样本数据,并将所述样本数据与相对应的真实型号进行比对并进行修正,确定车辆型号的错误模式;

分别统计每个错误模式下的错误修正方式和操作字符,作为所述修正模型。

进一步地,所述结果保存模块450包括:

类型存储子模块,用于对于所述车型错误库中的每一个车辆型号,采用六位二进制的数字分别存储六种错误类型,其中,对于每一位,符合此类错误则为1,否则为0;

进制转换子模块,用于将所述二进制数字换算成十进制数字;

ASCII码映射子模块,用于将所述十进制数字映射成ASCII码并进行保存,作为车辆型号校验结果。

进一步地,还包括预设重复次数确定模块,具体用于:

分别拟合车辆型号覆盖率与重复次数之间以及,准确率与重复次数之间的线性关系;

将使覆盖率和准确率均最高的重复次数确定为所述预设重复次数。

上述车辆型号校验装置可执行本发明任意实施例所提供的车辆型号校验方法,具备执行方法相应的功能模块和有益效果。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1