一种基于不确定信息的假牌车筛选方法

文档序号:9751980阅读:403来源:国知局
一种基于不确定信息的假牌车筛选方法【
技术领域
】[0001]本发明涉及智能交通领域,尤其涉及一种基于不确定信息的假牌车筛选方法。【
背景技术
】[0002]近年来,随着我国国民经济的高速发展,机动车保有量每年都在持续迅速地增长,各种交通违法违章现象也日渐增多。在各种交通违法违章中,车辆"假牌"、"套牌"是具有严重危害的违法行为。车辆"假牌"现象,指的是车辆伪造、变造机动车号牌,非法使用在机动车辆管理所车辆登记信息中不存在的车牌号的现象。"假牌"现象危害严重,不法分子通过使用"假牌",逃避城市交通管制措施、逃避交通肇事责任,或从事非法营运及违法犯罪活动,严重影响了城市交通管理和人民生命财产安全,扰乱了社会秩序,危害了社会安全。查处"假牌"车辆,已成为各地公安部门和交通管理部门的重要任务。[0003]从已有文献和公开的专利提出的假牌车筛选识别方法来看,目前涉及假牌筛选识别的方法相对较少。主要方法可分为两类:[0004](1)基于物联网的检测识别方法,如专利申请号CN201210187968.0采用在交警内部管理系统平台预留车辆安全检测码,通过现场查验输入安全检测码来判断是否假牌套牌;专利申请号CN201320577360.9采用一种基于RFID技术的虚假车牌识别装置,通过将该装置安装在车身,利用射频识别技术来判断车辆是否假牌套牌。[0005](2)基于车辆信息对比的检测识别方法,如专利申请号CN200819944980.X采用成像装置拍摄车辆外观特征信息并获得成像时间和地理位置信息,通过与管理服务器进行车辆外观特征信息比对,以及与车载设备进行地理位置信息比对,达到识别假牌、套牌的目的;专利申请号CN201510026235.2通过将监控点采集的车辆信息与合法登记车辆信息进行号牌比对,如果发现其中出现合法登记牌照中所没有的牌照信息,则认为该车辆为造假牌照的非法车辆,再作进一步验证。[0006]上述方法在实际应用时存在一些弊端:基于物联网的检测识别方法需要给机动车安装检测设备,并采用人工方式查验或在道路部署无线监测点,成本较高,目前较难普及;基于车辆外观信息比对的方法容易受光照、环境影响较大,准确率不高;直接利用车辆号牌进行比对的方法虽然简单且有一定效果,但容易受到卡口识别错误率影响,以卡口平均识别错误率为3%来论,100万过车记录中就有3万辆车的号牌可能被错误识别成"假牌"。如果认为这些识别错误的都是"假牌"车辆,一方面不符合实际情况,另一方面对后续的视频核查和布控带来极大的不便。为了解决上述方法的弊端,实现快速有效地分析大规模的交通车辆数据,从众多不确定信息中筛选有用信息,准确锁定活跃的"假牌"车辆,需要一种新的技术方案来满足交管部门的需求。【
发明内容】[0007]本发明为克服上述的不足之处,目的在于提供一种基于不确定信息的假牌车筛选方法,本方法结合了交通卡口的过车信息和车辆登记信息,对车辆的状态信息进行深度刻画分析来筛选嫌疑假牌车辆或车牌污损严重的车辆,融合了车辆的时-空轨迹特性和车牌相似度特性,并综合考虑了卡口的识别错误率因素影响,本方法部署方便,适用性广,能够有效地在大量的数据中筛选出嫌疑假车牌或污损车牌,极大地提高后续核查和布控效率。[0008]本发明是通过以下技术方案达到上述目的:一种基于不确定信息的假牌车筛选方法,包括如下步骤:[0009](1)获取卡口过车记录数据与车辆登记信息数据,并进行数据清洗得到卡口过车记录数据集K与车辆信息数据集C;[0010](2)对卡口过车记录数据集K作时-空过滤得到新的卡口过车记录数据集Ki;[0011](3)利用卡口过车记录数据集h与车辆信息数据集C计算并得到嫌疑车辆过车记录数据集X与正常车辆过车记录数据集Z;[0012](4)基于嫌疑车辆过车记录数据集X与正常车辆过车记录数据集Z,利用Spark计算嫌疑车辆与正常车辆之间的轨迹匹配度ω;[0013](5)基于嫌疑车辆过车记录数据集X与正常车辆过车记录数据集Ζ,计算嫌疑车辆与正常车辆的车牌相似度Θ;[0014]⑷利用轨迹匹配度ω与车牌相似度Θ计算嫌疑车辆的假牌嫌疑度,得到假牌车筛选结果。[0015]作为优选,所述步骤(1)卡口过车记录数据与车辆登记信息数据的数据清洗方法相同,方法如下:根据设定的数据清洗规则,删除不符合规则的数据;削减与假车牌筛选无关的数据维度,将筛选后的数据作为新的数据集。[0016]作为优选,所述步骤(2)得到卡口过车记录数据集心步骤如下:[0017](i)以设定时段为时间槽,统计卡口过车记录数据集Κ中所有卡口在不同时间槽下的识别错误率W[0018](ii)计算卡口的平均识别错误率;,并去除#>@的时段的卡口过车记录数据,整理后得到按时间过滤的卡口过车记录数据集K';[0019](iii)基于卡口过车记录数据集K',计算单个卡口i的识别错误率奶;[0020](iv)计算所有卡口的错误率均值μ和标准差Θ,并去除卡口i中仍>//+0的卡口过车记录数据,整理后得到按空间过滤的卡口过车记录数据集Ku[0021]作为优选,所述步骤(i)与步骤(iii)计算识别错误率公式如下:η[0022]f=-N[0023]其中,η表示嫌疑车辆的过车记录数,N表示总过车记录数,嫌疑车辆指的是车辆号牌在卡口过车记录数据集中有记录但是在车辆信息数据集中无记录的车辆。[0024]作为优选,所述步骤(3)计算并得到嫌疑车辆过车记录数据集X的步骤如下:[0025](I)根据卡口过车记录数据集心统计在卡口过车数据集心中有记录但在车辆信息数据集C中无记录的车辆号牌,形成新的嫌疑车辆信息,并统计这些车辆号牌重复出现次数作为嫌疑车辆的活跃度01,形成嫌疑车辆活跃度数据集Η;[0026](II)对嫌疑车辆按活跃度由高到底排名,并设定活跃度阈值β;选取活跃度Ρ?>β的嫌疑车辆号牌,结合卡口过车记录数据集心整理后得到嫌疑车辆过车记录数据集X,其中。[0027]作为优选,所述步骤(3)计算正常并得到正常车辆过车记录数据集Z的方法为:根据卡口过车记录数据集心统计在卡口过车数据集心中有记录且在车辆信息数据集C中有记录的车辆号牌,作为正常车辆的信息,结合卡口过车记录数据集Ki,得到正常车辆过车记录数据集Z,其中Zcz/?。[0028]作为优选,所述步骤(4)计算嫌疑车辆与正常车辆之间的轨迹匹配度ω的计算方法如下:[0029](a)设定时间槽,利用Spark从嫌疑车辆过车记录数据集X中读取嫌疑车牌、卡口编号、过车记录数、过车时间数据,转换为RDD;[0030](b)根据计算节点数量确定RDD分区数量,将嫌疑车辆过车记录数据集X转化为RDD1[hphm,kkid,counts,times],其中,hphm表不嫌疑车牌,kkid表不卡口编号,counts表示通过某个卡口次数,times表示通过某个卡口的时间段;[0031](c)将hphm作为key,counts和times作为values,利用pivot_table工具将属于同一个车牌的所有卡口过车记录和各个时间槽整理成用以描述嫌疑车辆轨迹时-空特征的矩阵UsXt,将其整理为RDD2数据集,其中RDD2的Key为嫌疑车牌hphml,V当前第1页1 2 3 4 
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1