建立逃漏费识别模型的方法、装置、存储介质及电子设备与流程

文档序号:16903683发布日期:2019-02-19 18:13阅读:178来源:国知局
建立逃漏费识别模型的方法、装置、存储介质及电子设备与流程
本公开涉及交通
技术领域
,具体地,涉及一种建立逃漏费识别模型的方法、装置、存储介质及电子设备。
背景技术
:目前,高速公路普遍存在缴费车辆逃漏费的现象,各种逃漏费手段层出不穷,给道路收费管理带来很大的困难和危害,如何查处逃漏费车辆是道路交通管理中的重要问题。现有技术中,主要采用人工筛查的方式,由业务人员凭借经验对车辆的收费卡数据进行分析来核实车辆是否存在逃漏费行为,然而该方式筛查速度慢且容易出现漏查的情况,识别效率低且准确率无法得到保证。技术实现要素:为了克服现有技术中存在的问题,本公开提供一种建立逃漏费识别模型的方法、装置、存储介质及电子设备。为了实现上述目的,本公开提供一种建立逃漏费识别模型的方法:根据预设逃漏费规则对存量收费卡数据进行分类,得到无逃漏费数据集和逃漏费数据集;以所述存量收费卡数据的预设目标字段作为特征因子,以所述无逃漏费数据集和所述逃漏费数据集作为训练样本,利用预设算法进行模型训练,获得逃漏费识别模型,所述逃漏费识别模型用于根据待识别车辆的收费卡数据得到所述待识别车辆是否逃漏费用的识别结果。可选地,所述方法还包括:针对所述存量收费卡数据的每一字段,获取该字段在所述无逃漏费数据集中的统计值分布与在所述逃漏费数据集中的统计值分布之间的分布差异度;根据各个所述字段的分布差异度确定所述预设目标字段。可选地,所述以所述存量收费卡数据的预设目标字段作为特征因子,以所述无逃漏费数据集和所述逃漏费数据集作为训练样本,利用预设算法进行模型训练,获得逃漏费识别模型,包括:根据所述预设目标字段的各统计值确定目标统计区间;以所述无逃漏费数据集和所述逃漏费数据集中所述预设目标字段的位于所述目标统计区间内的统计值作为训练样本,利用所述预设算法进行模型训练,获得所述逃漏费识别模型。可选地,所述方法还包括:获取待识别车辆的收费卡数据中所述预设目标字段的位于所述目标统计区间内的统计值;将所述统计值输入所述逃漏费识别模型,得到所述待识别车辆是否逃漏费用的识别结果。可选地,所述方法还包括:显示所述识别结果,以便对所述识别结果进行人工核对;若所述识别结果表明所述待识别车辆逃漏费用,且人工核对确定所述待识别车辆实际存在逃漏费行为,则将所述待识别车辆的收费卡数据加入所述逃漏费数据集。可选地,所述方法还包括:若所述识别结果表明所述待识别车辆逃漏费用,且人工核对确定所述待识别车辆实际不存在逃漏费行为,则根据所述待识别车辆的收费卡数据更新所述预设目标字段。本公开还提供一种建立逃漏费识别模型的装置,包括:数据分类模块,被配置为根据预设逃漏费规则对存量收费卡数据进行分类,得到无逃漏费数据集和逃漏费数据集;模型训练模块,被配置为以所述存量收费卡数据的预设目标字段作为特征因子,以所述无逃漏费数据集和所述逃漏费数据集作为训练样本,利用预设算法进行模型训练,获得逃漏费识别模型,所述逃漏费识别模型用于根据待识别车辆的收费卡数据得到所述待识别车辆是否逃漏费用的识别结果。可选地,所述装置还包括:分布差异度获取模块,被配置为针对所述存量收费卡数据的每一字段,获取该字段在所述无逃漏费数据集中的统计值分布与在所述逃漏费数据集中的统计值分布之间的分布差异度;预设目标字段确定模块,被配置为根据各个所述字段的分布差异度确定所述预设目标字段。可选地,所述模型训练模块包括:统计区间确定子模块,被配置为根据所述预设目标字段的各统计值确定目标统计区间;模型训练子模块,被配置为以所述无逃漏费数据集和所述逃漏费数据集中所述预设目标字段的位于所述目标统计区间内的统计值作为训练样本,利用所述预设算法进行模型训练,获得所述逃漏费识别模型。可选地,所述装置还包括:统计值获取模块,被配置为获取待识别车辆的收费卡数据中所述预设目标字段的位于所述目标统计区间内的统计值;识别结果获取模块,被配置为将所述统计值输入所述逃漏费识别模型,得到所述待识别车辆是否逃漏费用的识别结果。可选地,所述装置还包括:识别结果显示模块,被配置为显示所述识别结果,以便对所述识别结果进行人工核对;逃漏费数据集更新模块,被配置为若所述识别结果表明所述待识别车辆逃漏费用,且人工核对确定所述待识别车辆实际存在逃漏费行为,则将所述待识别车辆的收费卡数据加入所述逃漏费数据集。可选地,所述装置还包括:预设目标字段更新模块,被配置为若所述识别结果表明所述待识别车辆逃漏费用,且人工核对确定所述待识别车辆实际不存在逃漏费行为,则根据所述待识别车辆的收费卡数据更新所述预设目标字段。本公开还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开提供的建立逃漏费识别模型的方法的步骤。本公开还提供一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现本公开提供的建立逃漏费识别模型的方法的步骤。通过上述技术方案,根据预设逃漏费规则对存量收费卡数据进行分类,得到无逃漏费数据集和逃漏费数据集,并以存量收费卡数据的预设目标字段作为特征因子,以无逃漏费数据集和逃漏费数据集作为样本,通过预设算法进行模型训练获得逃漏费识别模型,相比于现有技术中通过人工筛查的方式识别逃漏费车辆,可以实现对逃漏费车辆的快速识别且不会出现漏查的情况,识别效率和准确率高。本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1是根据一示例性实施例示出的一种建立逃漏费识别模型的方法的流程图;图2是根据另一示例性实施例示出的一种建立逃漏费识别模型的方法的流程图;图3是根据另一示例性实施例示出的一种建立逃漏费识别模型的方法的流程图;图4是根据一示例性实施例示出的一种建立逃漏费识别模型的装置的框图;图5是根据另一示例性实施例示出的一种建立逃漏费识别模型的装置的框图;图6是根据一示例性实施例示出的一种电子设备的框图。具体实施方式以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。图1是根据一示例性实施例示出的一种建立逃漏费识别模型的方法的流程图,如图1所示,该方法包括以下步骤:在步骤s101中,根据预设逃漏费规则对存量收费卡数据进行分类,得到无逃漏费数据集和逃漏费数据集。在本公开的实施例中,收费卡数据可以例如包括但不限于:车辆的车型、车牌号、行驶轨迹、信用记录、称重记录、缴费记录、里程以及时间等字段。其中,预设逃漏费规则可以是申请人通过对大量的收费卡数据以及逃漏费手段进行分析得到的可以初步判定车辆是否存在逃漏费用的规则,如表1所示。表1逃漏费手段判断规则垫板历史称重及缴费金额匹配度操纵液压装置历史称重及缴费金额匹配度冲磅历史称重及缴费金额匹配度s形历史称重及缴费金额匹配度换卡入出口车牌不一致套牌同车牌多入口倒卡频繁入出口,收费卡不匹配伪造预编码卡短途的预编码卡uj型路线短途、超时车挂分离车型、短途、称重过大非正常出口无出口信息,离线分析假冒免征车辆抓一次进入黑名单,车型比对勾结内部人员离线分析…………根据预设逃漏费规则,可以从存量收费卡数据中初步确定不存在逃漏费行为的车辆和存在逃漏费行为的车辆,对于初步判定不存在逃漏费行为的车辆,可以将其收费卡数据整合后作为无逃漏费数据集;对于初步判定存在逃漏费行为的车辆,可以将其收费卡数据整合后作为逃漏费数据集。在步骤s102中,以存量收费卡数据的预设目标字段作为特征因子,以无逃漏费数据集和逃漏费数据集作为训练样本,利用预设算法进行模型训练,获得逃漏费识别模型,逃漏费识别模型用于根据待识别车辆的收费卡数据得到该待识别车辆是否逃漏费用的识别结果。在一种实施方式中,可以从存量收费卡数据的所有字段中选取部分或全部字段作为预设目标字段。示例地,可以选取称重记录、缴费记录等与逃漏费行为相关的字段作为预设目标字段。在另一种实施方式中,针对存量收费卡数据的每一字段,可以获取该字段在无逃漏费数据集中的统计值分布与在逃漏费数据集中的统计值分布之间的分布差异度,根据获取到的各个字段的分布差异度确定预设目标字段。示例地,针对每一字段,若该字段的统计值为离散值(如时间),则可以分别获取该字段的各统计值在无逃漏费数据集中所占的比例与在逃漏费数据集中所占的比例,根据各统计值所占比例差值的平方的平均数作为该字段的分布差异度;若该字段的统计值为连续值(如缴费金额),则可以分别获取该字段在无逃漏费数据集中的各统计值与该字段在逃漏费数据集中的各统计值的预设百分位数(如5%/10%/95%等)的值,将两数据集中各统计值的预设百分位数的值进行归一化后取两两之间的差值的平方的平均数作为该字段的分布差异度。对于分布差异度大于预设阈值的字段,可认为该字段与逃漏费行为相关,则可将该字段作为预设目标字段。在确定出预设目标字段后,可以将该预设目标字段作为特征因子,利用神经网络、决策树等预设算法进行模型训练,获得逃漏费识别模型,通过将待识别车辆的收费卡数据输入到该逃漏费识别模型中即得到该待识别车辆是否逃漏费用的识别结果。通过上述实施例所示的建立逃漏费识别模型的方法,相比于现有技术中通过人工筛查的方式识别逃漏费车辆,可以实现对逃漏费车辆的快速识别且不会出现漏查的情况,识别效率和准确率高。为了进一步提高车辆逃漏费识别的效率,在一种实施方式中,如图2所示,上述步骤s102可以包括:在步骤s121中,根据预设目标字段的各统计值确定目标统计区间。在步骤s122中,以无逃漏费数据集和逃漏费数据集中预设目标字段的位于目标统计区间的统计值作为训练样本,利用预设算法进行模型训练,获得逃漏费模型。例如,以预设目标字段为时间示意,该字段中包括01:00~02:00、02:00~03:00、…、23:00~24:00这12个统计值。通过大量研究发现,逃漏费车辆大多集中在01:00~02:00、02:00~03:00以及03:00~04:00这三个统计值,因而可以确定目标统计区间为01:00~04:00,并仅以无逃漏费数据和逃漏费数据中位于该目标统计区间的统计值作为训练样本进行模型训练,得到逃漏费模型。这样,通过确定的目标统计区间对无逃漏费数据和逃漏费数据进行过滤,使用过滤后的数据集作为训练样本进行模型训练,可以提高模型训练的速度,进而达到进一步提高车辆逃漏费识别的效率。相应地,如图2所示,上述方法还可以包括:在步骤s103中,获取待识别车辆的收费卡数据中预设目标字段的位于目标统计区间内的统计值。在步骤s104中,将统计值输入逃漏费识别模型,得到待识别车辆是否逃漏费用的识别结果。在确定出目标统计区间后,还可以利用目标统计区间对输入的待识别车辆的收费卡数据进行过滤,从待识别车辆的收费卡数据中的预设目标字段中提取出位于该目标统计区间的统计值,根据提取出的统计值得到待识别车辆是否逃漏费用的识别结果。这样,通过对待识别车辆的收费卡数据进行过滤,可以进一步提高车辆逃漏费识别的效率。在本公开的另一实施例中,如图3所示,在将待识别车辆的收费卡数据输入逃漏费识别模型而得到待识别车辆是否逃漏费用的识别结果后,还可以对识别结果进行显示,以便对该识别结果进行人工核对。若识别结果表明待识别车辆逃漏费用且人工核对确定该待识别车辆实际存在逃漏费行为,则可以将待识别车辆的收费卡数据加入到逃漏费数据集中,以更新训练样本,通过更新后的训练样本再次进行模型训练;若识别结果表明待识别车辆逃漏费而人工核对确定该待识别车辆实际不存在逃漏费行为,则可以根据待识别车辆的收费卡数据更新预设目标字段,将新确定的预设目标字段作为特征因子来再次进行模型训练。这样,通过不断更新训练样本或者特征因子,可以不断优化逃漏费识别模型,从而达到不断提高车辆逃漏费识别的准确度的效果。图4是根据一示例性实施例示出的一种建立逃漏费识别模型的装置的框图,如图4所示,该装置400包括:数据分类模块401和模型训练模块402。该数据分类模块401被配置为根据预设逃漏费规则对存量收费卡数据进行分类,得到无逃漏费数据集和逃漏费数据集。该模型训练模块402被配置为以所述存量收费卡数据的预设目标字段作为特征因子,以所述无逃漏费数据集和所述逃漏费数据集作为训练样本,利用预设算法进行模型训练,获得逃漏费识别模型,所述逃漏费识别模型用于根据待识别车辆的收费卡数据得到所述待识别车辆是否逃漏费用的识别结果。在另一个实施例中,如图5所示,所述装置400还包括:分布差异度获取模块403,被配置为针对所述存量收费卡数据的每一字段,获取该字段在所述无逃漏费数据集中的统计值分布与在所述逃漏费数据集中的统计值分布之间的分布差异度;预设目标字段确定模块404,被配置为根据各个所述字段的分布差异度确定所述预设目标字段。在另一个实施例中,如图5所示,所述模型训练模块402包括:统计区间确定子模块421,被配置为根据所述预设目标字段的各统计值确定目标统计区间;模型训练子模块422,被配置为以所述无逃漏费数据集和所述逃漏费数据集中所述预设目标字段的位于所述目标统计区间内的统计值作为训练样本,利用所述预设算法进行模型训练,获得所述逃漏费识别模型。在另一个实施例中,如图5所示,所述装置400还包括:统计值获取模块405,被配置为获取待识别车辆的收费卡数据中所述预设目标字段的位于所述目标统计区间内的统计值;识别结果获取模块406,被配置为将所述统计值输入所述逃漏费识别模型,得到所述待识别车辆是否逃漏费用的识别结果。在另一个实施例中,如图5所示,所述装置400还包括:识别结果显示模块407,被配置为显示所述识别结果,以便对所述识别结果进行人工核对;逃漏费数据集更新模块408,被配置为若所述识别结果表明所述待识别车辆逃漏费用,且人工核对确定所述待识别车辆实际存在逃漏费行为,则将所述待识别车辆的收费卡数据加入所述逃漏费数据集。在另一个实施例中,如图5所示,所述装置400还包括:预设目标字段更新模块409,被配置为若所述识别结果表明所述待识别车辆逃漏费用,且人工核对确定所述待识别车辆实际不存在逃漏费行为,则根据所述待识别车辆的收费卡数据更新所述预设目标字段。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。通过本公开实施例所示的建立逃漏费识别模型的装置,相比于现有技术中通过人工筛查的方式识别逃漏费车辆,可以实现对逃漏费车辆的快速识别且不会出现漏查的情况,识别效率和准确率高。图6是根据一示例性实施例示出的一种电子设备600的框图。如图6所示,该电子设备600可以包括:处理器601,存储器602。该电子设备600还可以包括多媒体组件603,输入/输出(i/o)接口604,以及通信组件605中的一者或多者。其中,处理器601用于控制该电子设备600的整体操作,以完成上述的建立逃漏费识别模型的方法中的全部或部分步骤。存储器602用于存储各种类型的数据以支持在该电子设备600的操作,这些数据例如可以包括用于在该电子设备600上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器602可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(staticrandomaccessmemory,简称sram),电可擦除可编程只读存储器(electricallyerasableprogrammableread-onlymemory,简称eeprom),可擦除可编程只读存储器(erasableprogrammableread-onlymemory,简称eprom),可编程只读存储器(programmableread-onlymemory,简称prom),只读存储器(read-onlymemory,简称rom),磁存储器,快闪存储器,磁盘或光盘。多媒体组件603可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器602或通过通信组件605发送。音频组件还包括至少一个扬声器,用于输出音频信号。i/o接口604为处理器601和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件605用于该电子设备600与其他设备之间进行有线或无线通信。无线通信,例如wi-fi,蓝牙,近场通信(nearfieldcommunication,简称nfc),2g、3g或4g,或它们中的一种或几种的组合,因此相应的该通信组件605可以包括:wi-fi模块,蓝牙模块,nfc模块。在一示例性实施例中,电子设备600可以被一个或多个应用专用集成电路(applicationspecificintegratedcircuit,简称asic)、数字信号处理器(digitalsignalprocessor,简称dsp)、数字信号处理设备(digitalsignalprocessingdevice,简称dspd)、可编程逻辑器件(programmablelogicdevice,简称pld)、现场可编程门阵列(fieldprogrammablegatearray,简称fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的建立逃漏费识别模型的方法。在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的建立逃漏费识别模型的方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器602,上述程序指令可由电子设备600的处理器601执行以完成上述的建立逃漏费识别模型的方法。以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1