基于大规模货运数据的网络货运驾驶员可信等级识别方法与流程

文档序号:37942418发布日期:2024-05-11 00:21阅读:14来源:国知局
基于大规模货运数据的网络货运驾驶员可信等级识别方法与流程

本发明属于网络货运监管,具体涉及一种基于大规模货运数据的网络货运驾驶员可信等级识别方法。


背景技术:

1、随着网络货运行业的快速发展,货运量也随着飞速发展。如何对网络货运驾驶人的行为进行有效监测已成为网络货运行业监管的重要环节。货运驾驶人的行为监测效果越精确,行业监管方能够对其进行有效的数据跟踪,并设置有效的相关措施来降低货运驾驶人由于驾驶过程不规范所产生问题的概率。

2、如今的网络货运驾驶人的运单较多,目的地与出发地的距离较远,运单分布离散程度大,数据环节多,仅根据单一运单难以对货运驾驶人整体行为可信度进行全面可靠把握。由于货运驾驶人的行为监测过程设计诸多环节,因此需要对驾驶人的历史和当前运输信息进行全面整合分析建模,并采用智能分析技术提升结果有效性。


技术实现思路

1、针对现有技术中的上述不足,本发明提供的基于大规模货运数据的网络货运驾驶员可信等级识别方法解决了传统方法仅利用部分特征及网络货运数据或人工采样数据,导致样本总量少、无可信数据源支撑、人工校验效率不高的问题。

2、为了达到上述发明目的,本发明采用的技术方案为:基于大规模货运数据的网络货运驾驶员可信等级识别方法,包括以下步骤:

3、s1、基于大规模货运数据构建历史运单集合;

4、s2、基于历史运单集合中的运单与驾驶员对应关系,根据各运单的校验数据,确定各驾驶员的可信等级,并构建网络货运驾驶员可信历史数据库;

5、s3、提取网络货运驾驶员可信历史数据库中的驾驶员时空多维特征;

6、其中,驾驶员时空多维特征包括驾驶员基本属性特征、驾驶员运单分布特征和驾驶员经营行为特征;

7、s4、基于提取的多维时空特征,构建并训练融合多维时空特征的深度学习识别模型,利用训练好的深度学习识别模型识别驾驶员可信等级。

8、进一步地,所述步骤s1具体为:

9、s11、设置定期货运数据上传时间;

10、s12、在上传时间内,判断网络货运平台中当期累积货运数据的运单数是否达到设定阈值;

11、若是,则将网络货运经营平台当期运单上传至监管平台,进入步骤s13;

12、若否,则将当期运单累积至下一上传时间,直到达到设定阈值并上传至监管平台,进入步骤s13;

13、其中,所述网络货运平台上传运单对应车辆相关的全部运单均唯一上传至同一地区的监管平台中;

14、s13、在监管平台中,将当期接收的运单形成历史运单集合。

15、进一步地,所述步骤s2中,确定驾驶员i的可信等级的方法具体为:

16、s21、判断驾驶员i对应的驾驶员资质查询数据q(i)是否均有效;

17、若是,则判断驾驶员i对应运单集合o(i)是否均已补充上传有效销项发票数据c(i);若是,则进入步骤s21-1;若否,则进入步骤s22;

18、若否,则进入步骤s22;

19、s21-1、判断驾驶员i对应运单集合o(i)中各运单是否均有对应的交通部通信中心轨迹查询数据tr(i)或高速通行etc查询数据etc(i),且未经过第一系统异常校验运单占比小于10%;

20、若是,则将驾驶员i的可信等级设置为1级;

21、若否,则进入步骤s21-2;

22、s21-2、判断驾驶员i对应运单集合o(i)中各运单是否均有对应的交通部通信中心轨迹查询数据tr(i)或高速通行etc查询数据etc(i),且未经过第一系统异常校验运单占是否大于10%且小于20%;

23、若是,则将驾驶员i的可信等级设置为2级;

24、若否,则进入步骤s22;

25、s22、判断驾驶员i对应运单集合q(i)中是否存在无反馈数据或有反馈数据且有效的情况;

26、若是,则判断驾驶员i对应运单集合o(i)是否均已补充上传有效销项发票数据c(i);若是,则进入步骤s22-1;若否,则进入步骤s23;

27、若否,则进入步骤s23;

28、s22-1、判断驾驶员i对应运单集合o(i)中各运单均是否有tr(i)、etc(i)、ptr(i)、fare(i)中至少一项对应数据,且对应未经过第二系统异常校验运单占比小于10%;其中,ptr(i)为网络货运平台补充上传轨迹数据;fare(i)为网络货运平台补充上传道路通行费数据;

29、若是,则将驾驶员i的可信等级设置为3级;

30、若否,则进入步骤s22-2;

31、s22-2、判断驾驶员i对应运单集合o(i)中各运单均是否有tr(i)、etc(i)、ptr(i)、fare(i)中至少一项对应数据,且对应未经过第二系统异常校验运单占比大于10%且小于20%;其中,ptr(i)为网络货运平台补充上传轨迹数据;fare(i)为网络货运平台补充上传道路通行费数据;

32、若是,则将驾驶员i的可信等级设置为4级;

33、若否,则进入步骤s22-3;

34、s22-3、判断驾驶员i对应运单集合o(i)中各运单均是否无对应的tr(i)、etc(i)、ptr(i)、fare(i)数据;

35、若是,则将驾驶员i的可信等级设置为5级;

36、若否,则进入步骤s23;

37、s23、判断驾驶员i对应运单集合o(i)中各运单均是否无对应的tr(i)、etc(i)、ptr(i)、fare(i)数据,或tr(i)、etc(i)、ptr(i)、fare(i)中至少有一项对应数据且对应未经过第三系统异常校验运单占大于20%且小于50%;

38、若是,则将驾驶员i的可信等级设置为6级;

39、若否,则进入步骤s23-1;

40、s23-1、判断驾驶员i对应运单集合o(i)中各运单均是否无对应的tr(i)、etc(i)、ptr(i)、fare(i)数据,或tr(i)、etc(i)、ptr(i)、fare(i)中至少有一项对应数据且对应未经过第三系统异常校验运单占大于50%;

41、若是,则将驾驶员i的可信等级设置为7级;

42、若否,则进入步骤s23-2;

43、s23-2、判断驾驶员i对应运单集合o(i)中各运单均是否无对应的tr(i)、etc(i)、ptr(i)、fare(i)数据,或tr(i)、etc(i)、ptr(i)、fare(i)中至少有一项对应数据且对应未经过第三系统异常校验运单占小于10%;

44、若是,则将驾驶员i的可信等级设置为异常1级;

45、若否,则进入步骤s23-3;

46、s23-3、判断驾驶员i对应运单集合o(i)中各运单均是否无对应的tr(i)、etc(i)、ptr(i)、fare(i)数据,或tr(i)、etc(i)、ptr(i)、fare(i)中至少有一项对应数据且对应未经过第三系统异常校验运单占大于10%且小于30%;

47、若是,则将驾驶员i的可信等级设置为异常2级;

48、若否,则进入步骤s23-4;

49、s23-4、当驾驶员i对应运单集合o(i)中各运单均是否无对应的tr(i)、etc(i)、ptr(i)、fare(i)数据,或tr(i)、etc(i)、ptr(i)、fare(i)中至少有一项对应数据且对应未经过第三系统异常校验运单占大于30%时,将驾驶员i的可信等级设置为异常3级。

50、进一步地,所述第一系统异常校验是指运单对应交通部通信中心轨迹查询数据不为空,且通过时空一致性校验或通过高速通行etc查询数据与运单起终点时空逻辑一致性校验。

51、进一步地,所述时空一致性校验的方法为:

52、当运单起终点所在行政区域s/d在交通部通信中心轨迹查询数据行政区域r1-r2-...-rm上均出现过,则通过时空一致性校验;

53、所述时空逻辑一致性校验的方法具体为:

54、a1、查询运单i的起点区县到终点区县的规划路径距离dista;

55、a2、按时间顺序遍历查询数据etc(i)中的etc位置记录,查询轨迹起点区县到etc位置记录中的起点区县的规划路径距离distb1,第1条ect记录的里程distb2;

56、a3、按照步骤a2中方法,逐个确定第n条etc记录中终点区县到轨迹终点曲线的规划路径距离distbk,进而确定总里程距离distb;

57、其中,distb=distb1+distb2+...+distbk;

58、a4、判断distb<√2×dista是否成立;

59、若是,则通过时空逻辑一致性校验;

60、若否,则未通过时空逻辑一致性校验。

61、进一步地,当运单存在ptr(i)时,所述第二系统异常校验包括时空一致性校验和轨迹真实性校验。

62、进一步地,第三系统异常校验包括第一系统异常校验,以及当运单存在ptr(i)时的第二系统异常校验;

63、其中,所述第一系统异常校验是指运单对应交通部通信中心轨迹查询数据不为空,且通过时空一致性校验或通过高速通行etc查询数据与运单起终点时空逻辑一致性校验;

64、所述第二系统异常校验是指进行时空一致性校验和轨迹真实性校验。

65、进一步地,所述步骤s2中,在设置的驾驶员的可信等级中,异常3级、异常2级、异常1级、7级、6级、5级、4级、3级、2级、1级的可信等级依次增大;

66、在构建所述网络货运驾驶员可信历史数据库时,将驾驶员可信等级在3级及以上的数据作为模型正例,将可信等级在7级及以下的数据作为模型反例纳入网络货运驾驶员可信历史数据库并用于构建深度学习识别模型;其中,将可信等级为4级至6级的数据通过训练好的深度学习识别模型进行进一步判定。

67、进一步地,所述步骤s4中,所述深度学习识别模型对输入数据进行处理的方法具体为:

68、s41、将运单的时空多维特征的结构化特征向量作为深度学习识别模型的输入数据;

69、其中,结构化特征向量包括2个可信订单数据、11维驾驶员基本属性特征变量、18个驾驶员运单分布特征以及12个驾驶员经营行为特征变量;

70、s42、依次通过dense全连接层和dropout层对输入数据进行扩张和压缩,得到21维特征向量;

71、s43、将21维特征向量连续映射至3组7维带softmax激活函数的全连接层中,将输入信息用每个可信等级类别的3组特征向量表示,得到27个特征向量;

72、s44、对21个特征向量相同维度元素的均值和方差进行归一化处理,并映射到均值0方差为1的分布中,得到3组的隐变量;其中,每组7维数据;

73、s45、以softmax函数为激活函数的全连接层输出21维隐变量的概率分布,作为每个可信级别的推测概率分布;

74、s46、根据可信级别的推测概率分布,将概率值大于第一预设阈值的可信级别类型作为深度学习识别模型输出的初步识别可信等级。

75、进一步地,所述步骤s4中,利用训练好的深度学习识别模型识别驾驶员可信等级的方法为:

76、将初步识别可信等级作为识别结果,并基于构建网络货运驾驶员可信历史数据库中的驾驶员可信等级,根据贝叶斯更新公式,计算当前识别结果对应的后验推断概率;

77、当后验推断概率大于第二预设阈值时,则将初步识别结果的可信等级作为驾驶员可信等级的识别结果。

78、本发明的有益效果为:

79、(1)本发明实现了基于货运业务可信数据源多维特征采样的网络货运驾驶员驾驶行为特征可信等级深度学习识别模型与监测方法。通过运输业务可信数据源(如交通运输部通信中心、路网中心、银联数据、第三方真实查验数据等)大量已验证的真实运输业务历史数据提取构建网络货运驾驶员运输业务基本属性特征、驾驶员业务分布特征、驾驶员驾驶行为特征等,进而建立网络货运驾驶员驾驶行为特征可信等级深度学习识别模型及监管方法。

80、(2)本发明方法可实现利用大量已验证历史货运业务数据支撑网络货运业务驾驶员驾驶行为合规特征快速智能识别与监管,驾驶员驾驶行为数据来源不再局限于运输业务,可克服传统方法仅利用部分特征及网络货运数据或人工采样数据,导致样本总量少、无可信数据源支撑、人工校验效率不高等弱点,破解网络货运驾驶员监管环节过多且难于取证的监管难题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1