一种考虑收费路径的高速公路计费费率准确性评测方法与流程

文档序号:16585188发布日期:2019-01-14 18:21阅读:280来源:国知局
一种考虑收费路径的高速公路计费费率准确性评测方法与流程

本发明涉及高速公路网收费系统精度评定领域,具体涉及一种考虑收费路径的高速公路计费费率准确性评测方法。



背景技术:

高速公路计费费率准确性是高速公路收费软件可靠性评测的重要一环,其实质是利用大数据分析技术和科学的统计理论对能反映收费软件费率计算准确性(特别是收费路径的准确性)的相关数据进行采集、清洗和计算,得出体现各收费软件费率计算准确性的若干指标,为高速公路收费软件的改造升级提供重要数据依据。

然而,目前从实践层面上看,我国高速公路联网收费费率计算工作存在诸多问题,如:路网复杂、规模巨大,形成众多多义性路径,难以还原准确的收费路径;路段标识系统不完善,缺乏相应的维护建设,存在标识信息不完整、甚至有错误的情况;费率计算算法过于简单、存在漏洞,缺乏标准化收费流程,不少问题未进行精细化研究,可能引起收费争端。



技术实现要素:

本发明的目的是针对现有技术的不足,提供了一种考虑收费路径的高速公路计费费率准确性评测方法,所述方法利用基础收费流水数据,通过数据处理和数据挖掘,对高速公路收费软件费率计算准确性进行定量评价,克服了高速公路通行费用漏收错收、收费路径缺乏依据等问题。

本发明的目的可以通过如下技术方案实现:

一种考虑收费路径的高速公路计费费率准确性评测方法,所述方法包括以下内容:

以设定的评测周期收集高速公路收费流水数据,构建用于高速公路收费流水的历史数据库;导入特征值表、路段软件开发单位明细表,构建用于评测收费路径准确性的规则数据库;

对收集的高速公路收费流水数据及导入的特征值表进行数据预处理;

计算高速公路收费流水中的特征值表过滤率指标;

计算高速公路收费流水中路径存在连续漏标且判断处理有误的比例;

计算高速公路收费流水中收费路径缺乏依据但非最短路径的比例;

计算高速公路收费流水中收费路径取最短路径但与高卡路径冲突的比例。

进一步地,所述高速公路收费流水数据包含如下字段:出口流水号、入口路段编码、入口站编号、入口车道类型、入口日期及时间、出口路段编码、出口站编号、出口车道编号、出口车道类型、出口日期及时间、车牌号、车型、车种、行驶里程、收费金额、免费类型代码、原始标识信息、收费路径信息、收费路径路段组合以及高卡路径信息等;

所述特征值表数据包含如下字段:序号、标识点序列、出口路段编号、入口路段编号、出口站编号、入口站编号、10进制误标点编号、16进制误标点编号、16进制出口路段站编号以及误标所属情况等;

所述路段软件开发单位明细表数据包含:路段编号、路段名称、区域、上级业主单位、mtc车道系统开发单位和etc车道系统开发单位。

进一步地,所述对收集的高速公路收费流水数据及导入的特征值表进行数据预处理具体包括以下内容:

对比高速公路收费流水数据的收费路径信息和原始标识信息,两者不一致的收费流水判断为异常收费流水,其余定义为正常收费流水,然后分别存储;

将特征值表中的10进制误标点编号转换为16进制误标点编号,并更新至“16进制误标点编号”字段中。

进一步地,所述计算高速公路收费流水中的特征值表过滤率指标具体包括以下内容:

首先根据特征值表的标识点序列、出入口路段编号与出入口站编号对每一条异常收费流水进行模式匹配,判定收费路径中的误标点与误标所属情况,从中筛选出被特征值表过滤的收费流水;

然后对上述步骤获得的误标流水,根据出口路段编号和出口站编号匹配每条误标流水的生成单位,并按收费单位和收费路段分别统计,得到收费流水的特征值表过滤率。

进一步地,所述计算高速公路收费流水中路径存在连续漏标且判断处理有误的比例具体包括以下内容:

1)由于在收费流水中收费路径以标识点串的形式呈现,因此利用正常收费流水的收费路径和收费路径组合进行全样本学习,总结每个站点之间的标识点序列联系,形成高速公路网结合标识点的拓扑逻辑数据库,该数据库包含四个表格:

①表flagcomb_entry:记录路段上入口收费站与相邻节点之间的标识点串,该表格包含字段有:入口路段编号、入口站编号、16进制的下一路段编号、入口站至节点之间的r标路径组合、入口站至节点之间的e标路径组合;

②表flagcomb_exit:记录路段上出口收费站与相邻节点之间的标识点串,该表格包含的字段有:出口路段编号、出口站编号、16进制的上一路段编号、节点至出口站之间的r标路径组合、节点至出口站之间的e标路径组合;

③表flagcomb_btnode:记录每个路段上节点之间的标识点串,该表格包含的字段有:16进制路段编号、16进制的上一路段编号、16进制的下一路段编号、该路段前后的路段组合、节点至出口站之间的r标路径组合、节点至出口站之间的e标路径组合;

④表roadcomb_btroad:记录不相交的路段之间的路段组合roadcomb,该表格包含的字段有:起始路段编号、终点路段编号、16进制起始路段编号、16进制终点路段编号、起点与终点之间的路段组合;

2)根据步骤1)生成的四个表格,结合对收集的高速公路收费流水数据进行预处理过程中获得的异常收费流水的入口路段编号、入口站编号、出口路段编号、出口站编号、原始标识信息补充完整收费路径路段组合roadcomb_remake和重构收费路径originalpath_remake;

3)基于步骤2)获得的收费路径路段组合roadcomb_remake和重构收费路径originalpath_remake,将其与收费路径信息进行对比,判断该流水的收费路径是否连续漏标三个及以上标识点,并标记存在该情况的收费流水;

4)对上一步标记的收费流水,定位出收费路径中漏标部分的前后标识点为可能误标点,分三种情况分别剔除可能的误标点:剔除前误标点、剔除后误标点、同时剔除前后误标点,再基于步骤2)重新还原出三种情况下的收费路径;

5)对比收费流水中的原始标识信息与步骤4)还原出的三条重构收费路径,若此三条重构收费路径其中一条无三个及以上连续漏标点,则该收费流水的收费路径存在误标情况,收费软件对该流水的判断处理有误;

6)基于步骤5),参考收费流水的特征值表过滤率,根据出口路段编码和出口站编码匹配每条误标流水的生成单位,按照收费单位或路段统计存在收费路径连续漏标且收费软件判断处理有误的收费流水,从而计算出高速公路收费流水中路径存在连续漏标且判断处理有误的比例。

进一步地,所述计算高速公路收费流水中收费路径缺乏依据但非最短路径的比例具体包括以下内容:

首先,基于步骤2)获得的收费路径路段组合roadcomb_remake,对比收费流水中原有的收费路段路径组合roadcomb,若不一致则判断该路径不是最短路径,提取该流水;

然后核实流水路径不一致部分是否存在于高卡路径信息中,若高卡路径信息不能支撑该收费路径,则判断该流水有误;

最后参考收费流水的特征值表过滤率,根据出口路段编码和出口站编码匹配每条误标流水的生成单位,按照收费单位或路段统计收费路径缺乏依据但非最短路径的流水比例。

进一步地,所述计算高速公路收费流水中收费路径取最短路径但与高卡路径冲突的比例具体包括以下内容:

首先,基于步骤2)获得的收费路径路段组合roadcomb_remake,对比收费流水中原有的收费路段路径组合roadcomb,若一致则判断该路径为最短路径,提取roadcomb与roadcomb_remake一致的收费流水;

然后对比提取的收费流水的收费路径与高卡路径信息,若与高卡路径信息冲突,则判断该收费流水有误;

最后参考收费流水的特征值表过滤率,根据出口路段编码和出口站编码匹配每条误标流水的生成单位,按照收费单位或路段统计收费路径取最短路径但与高卡路径冲突的流水比例。

本发明与现有技术相比,具有如下优点和有益效果:

本发明充分挖掘现有高速公路收费流水数据资源,利用高速公路收费管理规则文件,从收费流水大数据中总结得出收费路径的组建规则,并反过来对收费路径进行验证,实现了以数据普遍特征验证未知数据的功能,开拓了收费流水数据准确性验证的新途径,构建了考虑收费路径的高速公路计费费率准确性评测方法,提高了评测收费流水的准确性和效率。

附图说明

图1为本发明实施例中各个收费软件的特征值表过滤率数据比例示意图。

图2为本发明实施例中按路段分类的特征值表过滤率数据比例示意图。

图3为本发明实施例中按收费单位统计的连续漏标且判断处理有误的数据流水比例统计结果图。

图4为本发明实施例中按收费路段统计的连续漏标且判断处理有误的数据流水比例统计结果图。

图5为本发明实施例中收费路径缺乏依据但非最短路径的数据流水比例统计结果图。

图6为本发明实施例中收费路径取最短路径但与高卡信息冲突的数据流水比例统计结果图。

图7为本发明实施例考虑收费路径的高速公路计费费率准确性评测方法流程图。

图8为本发明实施例的路网分布图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。

实施例:

本实施例提供了一种考虑收费路径的高速公路计费费率准确性评测方法,所述方法流程图如图7所示,包括以下步骤:

1)以设定的评测周期收集高速公路收费流水数据,构建用于高速公路收费流水的历史数据库;导入特征值表、路段软件开发单位明细表,构建用于评测收费路径准确性的规则数据库;

2)数据预处理;

3)计算高速公路收费流水中的特征值表过滤率指标;

4)计算高速公路收费流水中路径存在连续漏标且判断处理有误的比例;

5)计算高速公路收费流水中收费路径缺乏依据但非最短路径的比例;

6)计算高速公路收费流水中收费路径取最短路径但与高卡路径冲突的比例。

所述步骤1)包括以下内容:

1.1)高速公路收费流水数据包含:出口流水号、入口路段编码、入口站编号、入口车道类型、入口日期及时间、出口路段编码、出口站编号、出口车道编号、出口车道类型、出口日期及时间、车牌号、车型、车种、行驶里程、收费金额、免费类型代码、原始标识信息、收费路径信息、收费路径路段组合、高卡路径信息等字段;

1.2)特征值表数据包含:序号、标识点序列、出口(入口)路段编号、出口(入口)站编号、误标点编号(10进制)、误标点编号(16进制)、出口路段站编号(16进制)、所属情况等字段;

1.3)路段软件开发单位明细数据包含:路段编号、路段名称、区域、上级业主单位、mtc车道系统开发单位、etc车道系统开发单位。

所述步骤2)包括以下内容:

2.1)对比高速公路收费流水数据的收费路径信息和原始标识信息,两者不一致的流水判断为异常流水,其余定义为正常流水,然后分别存储;

2.2)将特征值表中的误标点编号转换为16进制的误标点编号,并更新至“误标点编号(16进制)”字段中。

所述步骤3)包括以下内容:

3.1)根据特征值表的标识点序列、出入口路段编号与站点编号对每一条异常收费流水进行模式匹配,判定收费路径中的误标点与误标所属情况,从中筛选出被特征值表过滤的收费流水;

3.2)对步骤3.1)获得的误标流水,根据出口路段编码和出口站编码匹配每条误标流水的生成单位,并按收费单位和收费路段分别统计,得到收费流水的特征值表过滤率。

所述步骤4)包括以下内容:

4.1)由于该方法主要考虑收费路径,在收费流水中收费路径以标识点串的形式呈现,因此可以利用正常收费流水的收费路径和收费路径组合进行全样本学习,总结每个站点之间的标识点序列联系,形成高速公路网结合标识点的拓扑逻辑数据库,该数据库包含四个表格:

①表flagcomb_entry:记录路段上入口收费站与相邻节点之间的标识点串,该表格包含字段有:入口路段编号、入口站编号、下一路段编号(16进制)、入口站至节点之间的r标路径组合、入口站至节点之间的e标路径组合;

②表flagcomb_exit:记录路段上出口收费站与相邻节点之间的标识点串,该表格包含的字段有:出口路段编号、出口站编号、上一路段编号(16进制)、节点至出口站之间的r标路径组合、节点至出口站之间的e标路径组合;

③表flagcomb_btnode:记录每个路段上节点之间的标识点串,该表格包含的字段有:路段编号(16进制)、上一路段编号(16进制)、下一路段编号(16进制)、该路段前后的路段组合、节点至出口站之间的r标路径组合、节点至出口站之间的e标路径组合;

④表roadcomb_btroad:记录不相交的路段之间的路段组合roadcomb,该表格包含的字段有:起始路段编号、终点路段编号、起始路段编号(16进制)、终点路段编号(16进制)、起点与终点之间的路段组合;

4.2)根据步骤4.1)生成的四个表格,结合步骤2.1)获得的异常收费流水的入口路段编号、入口站编号、出口路段编号、出口站编号、原始标识信息补充完整收费路径路段组合roadcomb_remake和重构收费路径originalpath_remake;

4.3)基于步骤4.2)获得的收费路径路段组合roadcomb_remake和重构收费路径originalpath_remake,将其与收费路径信息进行对比,判断该流水的收费路径是否连续漏标三个及以上标识点,并标记存在该情况的收费流水;

4.4)对上一步标记的收费流水,定位出收费路径中漏标部分的前后标识点为可能误标点,分三种情况分别剔除可能的误标点(剔除前误标点、剔除后误标点、同时剔除前后误标点),基于步骤4.2)重新还原出三种情况下的收费路径;

4.5)对比收费流水中的原始标识信息与步骤4.4)还原出的三条重构收费路径,若此三条重构收费路径其中一条无三个及以上连续漏标点,按照广东省高速公路收费规则文件定义,该收费流水的收费路径存在误标情况,收费软件对该流水的判断处理有误;

4.6)基于步骤4.5),参考步骤3.2)根据出口路段编码和出口站编码匹配每条误标流水的生成单位,按照收费单位或路段统计存在收费路径连续漏标且收费软件判断处理有误的收费流水。

所述步骤5)包含以下内容:

5.1)基于步骤4.2)获得的收费路径路段组合roadcomb_remake,对比收费流水中原有的收费路段路径组合roadcomb,若不一致则判断该路径不是最短路径,提取该流水;

5.2)核实流水路径不一致部分是否存在于高卡路径信息中,若高卡路径信息不能支撑该收费路径,则判断该流水有误;

5.3)基于步骤5.2),参考步骤3.2)根据出口路段编码和出口站编码匹配每条误标流水的生成单位,按照收费单位或路段统计收费路径缺乏依据但非最短路径的流水比例。

所述步骤6)包含以下内容:

6.1)基于步骤4.2)获得的收费路径路段组合roadcomb_remake,对比收费流水中原有的收费路段路径组合roadcomb,若不一致则判断该路径为最短路径,提取roadcomb与roadcomb_remake一致的流水;

6.2)对比流水收费路径与高卡路径信息,若与高卡信息冲突,则判断该流水有误;

6.3)基于步骤6.2),参考步骤3.2)根据出口路段编码和出口站编码匹配每条误标流水的生成单位,按照收费单位或路段统计收费路径取最短路径但与高卡路径冲突的流水比例。

下面结合具体示例对上述方法进行说明,以图8所示路网为研究对象,该路网为广东省2016年全省的公路网。

(1)收集2016年11月份广东省全省的高速公路收费数据,构建用于广东省公路网货物运输统计的历史数据库;导入误标特征值表、路段软件开发单位明细表,构建用于评测收费路径准确性的规则数据库。

(2)数据预处理

对比高速公路收费流水数据的收费路径信息和原始标识信息,将高速公路收费流水分为正常收费流水和异常收费流水两类;将特征值表中的误标点编号转换为16进制的误标点编号,并更新至“误标点编号(16进制)”字段中。

(3)计算高速公路收费流水中的特征值表过滤率指标

基于2016年11月的广东省高速公路收费流水数据和误标特征值表,根据特征值表的标识点序列、出入口路段编号与站点编号对每一条异常收费流水进行模式匹配,判定收费路径中的误标点与误标所属情况;然后匹配每条误标收费流水的生成单位,按收费单位和收费路段分别统计,特征值表过滤率的统计结果如表1所示:

表1

各个收费软件的特征值表过滤率数据比例如图1所示,按路段分类的特征值表过滤率数据比例如图2所示;

(4)计算高速公路收费流水中路径存在连续漏标且判断处理有误的比例

结合2016年11月的广东省正常收费流水的收费路径和收费路径组合进行全样本学习,形成高速公路网结合标识点的拓扑逻辑数据库;结合异常流水的原有标识信息还原收费路径,根据收费规则文件判断原始标识信息是否连续漏标三个及以上标识点,对存在漏标的异常流水分别剔除前后可能误标点,重新还原收费路径,若存在重新还原的路径其中一条不存在连续漏标的情况,则判断该流水的收费路径存在误标情况;然后匹配收费流水的生成单位,按收费单位和收费路段分别统计,连续漏标且判断处理有误的数据流水比例统计结果分别如图3和图4所示;

(5)计算高速公路收费流水中收费路径缺乏依据但非最短路径的比例

基于步骤(4)重组的收费路径路段组合,对比收费流水中原有的收费路段路径组合,若两者不一致且高卡路径信息不能支撑该收费路径,则判断该流水有误;然后匹配收费流水的生成单位,按收费单位和收费路段分别统计,收费路径缺乏依据但非最短路径的数据流水比例统计结果如图5所示;

(6)计算高速公路收费流水中收费路径取最短路径但与高卡路径冲突的比例

基于步骤(4)重组的收费路径路段组合,对比收费流水中原有的收费路段路径组合,若两者一致但高卡路径信息冲突,则判断该流水有误;然后匹配收费流水的生成单位,按收费单位和收费路段分别统计,收费路径取最短路径但与高卡信息冲突的数据流水比例统计结果如图6所示。

以上所述,仅为本发明专利较佳的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1