一种车辆保养项目的预估方法和系统与流程

文档序号:29048241发布日期:2022-02-25 22:52阅读:120来源:国知局
一种车辆保养项目的预估方法和系统与流程

1.本发明涉及车辆保养技术领域,具体涉及一种车辆保养项目的预估方法和系统。


背景技术:

2.目前,汽车后市场存在大量的车辆相关数据信息,如车辆基础信息、车辆保养工单信息、车辆检测工单信息、人为补充的车辆数据信息、车主信息等等,如何利用这些海量数据、并从中挖掘出有益的信息,显得尤为重要,例如预估车辆的服务项目下次保养时间。
3.车辆需要定期或定里程进行保养,例如每5000km或者每半年保养一次。且时间先到基于时间,里程先到基于里程。保养的服务项目包括更换机油、更换机滤等,可以单独实施,也可以组合实施。
4.现有的关于里程预估方法为:基于gps定位系统、电池中剩余电荷的可用状态(soc)以及充电桩位置来计算出电动汽车是否能到达最近的充电桩,即车辆的剩余或者续航里程数据预估;或者基于车辆的轨迹信息和该轨迹对应的费用信息进行里程预估。而缺少基于车辆详细信息对车辆服务项目的下次保养时间保养里程进行预估的方法。


技术实现要素:

5.针对现有技术中存在的上述技术问题,本发明提供一种车辆保养项目的预估方法和系统,通过对车辆信息的数据挖掘、预估出准确的保养时间和里程。
6.本发明公开了一种车辆保养项目的预估方法,所述预估方法包括:获取车辆信息,所述车辆信息包括以下任一数据或它们的组合:保养周期、保养数据、和检测数据;对所述车辆信息进行清洗,获得第一数据;根据第一数据,估算日均里程;基于gbdt算法,根据日均里程,预估第一保养;判断所述第一保养是否合理;若不合理,根据预设规则和日均里程,预估第二保养。
7.优选的,判断第一保养时间是否合理的方法包括:
8.判断第一保养时间与上次保养时间的间隔是否大于第一域值。
9.优选的,日均里程估算的方法包括:
10.基于gbdt算法,根据第一数据估算日均里程;
11.判断所述日均里程是否小于第二域值;
12.若日均里程小于第二域值,根据第二预设规则,估算日均里程。
13.优选的,第二预设规则包括:
14.根据第一数据,计算各个时间段内的日均里程,获得日均里程集合:
[0015][0016]
其中,mi表示为第i个里程,ti表示为第i个里程的记录时间,j=i-1,li表示为日均里程,deman表示为日均里程集合;
[0017]
获取日均时程集合的中位数和绝对中位差:
[0018]
dmedian=median(deman)
[0019]
ddmedian=median(|l
i-median(deman)|)
[0020]
median()表示为取中位数,dmedian表示为中位数,ddmedian表示为绝对中位差;
[0021]
判断日均值与中位数差值的绝对值,是否小于绝对中位差与第三域值的积;
[0022]
若是,保留所述是日均值。
[0023]
优选的,对所述车辆信息进行清洗的方法包括根据规则清洗的方法:
[0024]
同一天多条里程,保留时间最晚的里程;
[0025]
不同日期填写的里程一样,保留时间最晚的里程;
[0026]
车辆只有两条里程数据、且不合理的,保留数据来源可靠的里程;
[0027]
车辆具有n条里程数据、k∈(1,

,n)、n-k为2,且第k里程同时大于第k+1里程和第k+2里程,若第k+1里程小于第k+2里程,保留第k+1里程和第k+2里程,若第k+1里程大于第k+2里程,仅保留第k+2里程;
[0028]
车辆具有n条里程数据、k∈(1

n)、n-k大于3,保留小于所有较晚里程的第k里程。
[0029]
优选的,对所述车辆信息的清洗包括车辆信息中异常数据的处理规则:
[0030]
车辆信息的历史数据有两条,上次检测结果为有异常,最后一条历史数据为app填写、且小于上一条历史数据,去除最后一条历史数据;
[0031]
历史数据有两条,最后一条历史数据为app填写、且小于上次保养信息的里程或上一次检测异常信息的里程,去除最后一条历史数据;
[0032]
历史数据的最后一条是检测未见异常、且上一条是保养信息或app填写信息,去除最后一条历史数据;
[0033]
历史数据的最后一条是检测数据、上一条是保养数据、且两者的里程一致,去除最后一条。
[0034]
优选的,对所述车辆信息的清洗包括通过可信度选择或删除数据的方法:
[0035]
判断两条数据是否矛盾;
[0036]
若是,选择可信度大的数据,并删除可信度小的数据;
[0037]
其中,以下数据的可信度依次降低:保养信息、检测为异常的检测数据、app填写数据和检测为正常的检测数据。
[0038]
优选的,根据预设规则,预估第二保养时间的方法包括:
[0039]
判断里程周期和日均里程的商是否大于时间周期;
[0040]
若是,根据以下公式计算下次保养时间和保养的里程:
[0041]
next_time=t1+upkeep_time
[0042]
next_mil=m1+upkeep_time*res_mil
[0043]
其中,next_time表示为下次保养时间,t1表示为上次保养时间,upkeep_time表示为保养的时间周期,m1表示为上次保养里程,res_mil表示为日均里程;
[0044]
若否,判断,上次保养里程是否小于第四域值;
[0045]
若小于第四域值,根据以下公式,校正上次保养里程:
[0046]
m1=n_mil-res_mil*days
[0047]
days=(n_t-t1).days
[0048]
其中,n_mil表示为当前里程,days表示为上次保养时间到当前时间的时间差,t1
表示为上次保养时间;
[0049]
根据以下公式计算下次保养时间和保养里程:
[0050]
diff_mil=(n_mil-m1)%upkeep_mil
[0051]
next_mil=n_mil+(upkeep_mil-diff_mil)
[0052]
next_time=n_t+next_mil/res_mil
[0053]
其中,diff_mil表示为下一次保养前的剩余里程,upkeep_mil表示为保养的里程周期。
[0054]
优选的,所述预设规则包括根据检测数据进行预估的方法:
[0055]
根据检测数据,为车辆预设分值和分值区间;
[0056]
判断里程周期和日均里程的商是否大于时间周期;
[0057]
若是,根据以下公式计算下次保养里程和保养时间:
[0058]
diff_days=(score/100)*(upkeep_time)
[0059]
next_time=t2+diff_days
[0060]
next_mil=m2+diff_days*res_mil
[0061]
其中,score表示为分值,diff_days表示为下一次保养前的剩余时间,t2表示为检测时间,m2表示为检测里程;
[0062]
若否,判断上次检测的里程是否合理;
[0063]
若不合理,通过以下公式校正上次检测里程:
[0064]
days=(n_t-t2).days
[0065]
diff_mil=score/100.0*upkeep_mil
[0066]
m2=n_mil-res_mil*days;
[0067]
根据以下公式计算下次保养里程和保养时间:
[0068]
next_mil=m2+diff_mil
[0069]
next_time=t2+diff_mil/res_mil;
[0070]
所述预设规则还包括无历史保养数据和检测数据的预估方法:
[0071]
判断里程周期和日均里程的商是否大于时间周期;
[0072]
若大于时间周期,根据以下公式计算下次保养里程和保养时间:
[0073]
temp_time=n_mil/res_mil
[0074]
next_time=n_time+upkeep_time-temp_time%upkeep_time
[0075]
next_mil=n_mil+res_mil*(upkeep_time-temp_time%upkeep_time)
[0076]
其中,temp_time表示为购车时长;
[0077]
若小于时间周期,根据以下公式计算下次保养里程和保养时间:
[0078]
diff_mil=n_mil%upkeep_mil
[0079]
next_mil=n_mil+(upkeep_mil-diff_mil)
[0080]
next_time=n_t+(upkeep_mil-diff_mil)/res_mil
[0081]
其中,diff_mil表示下次保养的剩余里程。
[0082]
本发明还提供一种用于实现上述方法的系统,包括采集模块、清洗模块、日均里程估算模块和保养估算模块,
[0083]
所述采集模块用于获取车辆信息,所述车辆信息包括以下任一数据或它们的组
合:保养周期、保养数据、和检测数据;
[0084]
所述清洗模块用于对所述车辆信息进行清洗,获得第一数据;
[0085]
所述日均里程估算模块用于根据第一数据,估算日均里程;
[0086]
所述保养估算模块用于基于gbdt算法,根据日均里程,预估第一保养时间;判断所述第一保养时间是否合理;若不合理,根据预设规则和日均里程,预估第二保养时间。
[0087]
与现有技术相比,本发明的有益效果为:通过将基于gbdt算法的第一保养和基于规则的第二保养进行融合,筛选出其中较准确的预估结果,以提高预估的置信度;因此,通过对车辆信息的数据挖掘、预估出准确的保养时间和里程。
附图说明
[0088]
图1是本发明的车辆保养项目的预估方法流程图;
[0089]
图2是本发明的系统逻辑框图。
具体实施方式
[0090]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0091]
下面结合附图对本发明做进一步的详细描述:
[0092]
一种车辆保养项目的预估方法,如图1所示,所述预估方法包括:
[0093]
步骤101:获取车辆信息,所述车辆信息包括以下任一数据或它们的组合:保养周期、保养数据、和检测数据;
[0094]
步骤102:对所述车辆信息进行清洗,获得第一数据。数据清洗用于去除无效数据。
[0095]
步骤103:根据第一数据,估算日均里程。例如,根据时间段内的里程,计算出日均里程。
[0096]
步骤104:基于梯度提升树(gradient boosting decision tree,gbdt)的算法,根据日均里程,预估第一保养。
[0097]
gbdt用于预测实数值,在一个具体实施例中,输入车辆信息(例如组织、品牌名称、车型、车系、排量、版本、车辆类型、车辆级别、国家、停产年份、生产年份、上市年份、上市月份、最高指导价、最低指导价、年款、车牌前缀、厂家类型、生产状态、销售状态)、用户信息(例如省份、城市、地区、性别、客户类型、婚姻状态、月收入),获得预估值,如日均里程、保养时间差值。gbdt可以通过调用pyodps的gbdt包,修改参数后实现。但不限于此,也可以采用其它机器学习算法,如神经网络、随机森林等。
[0098]
步骤105:判断所述第一保养是否合理。其中,判断第一保养时间是否合理的方法包括:判断第一保养时间与上次保养时间的间隔是否大于第一域值。例如,第一保养时间与上次保养时间的间隔大于30天时,认为合理;小于或等于30天时,认为不合理。但第一域值的数值不限于此。
[0099]
若不合理,执行步骤106:根据预设规则和日均里程,预估第二保养,以第二保养为最终预估。
[0100]
若合理,以第一保养为最终预估。其中,第一保养和第二保养包括保养时间和保养里程。
[0101]
通过将基于gbdt算法的第一保养和基于规则的第二保养进行融合,筛选出其中较准确的预估结果,以提高预估的置信度;因此,通过对车辆信息的数据挖掘、预估出准确的保养时间和里程。预估结果(日均里程和预估保养)可以应用于app端的保养提醒或保养推荐、用于门店的提醒、也可以用于车辆信息的存档。
[0102]
步骤103中,日均里程估算的方法包括:
[0103]
步骤301:基于gbdt算法,根据第一数据估算日均里程。
[0104]
步骤302:判断所述日均里程是否小于第二域值。例如日均里程小于0或5km时,认为日均里程不合理。但第二域值的取值不限于此。
[0105]
若日均里程小于第二域值,执行步骤303:根据第二预设规则,估算日均里程。
[0106]
若日均里程大于第二域值,采用步骤301中估算的日均里程。
[0107]
通过gbdt的方法结合第二预设规则的方法,提高日均里程的置信度,提高预估结果的可靠性和准确性。
[0108]
其中,第二预设规则包括:
[0109]
步骤311:根据第一数据,计算各个时间段内的日均里程,获得日均里程集合:
[0110][0111]
其中,mi表示为第i个里程,ti表示为第i个里程的记录时间,j=i-1,li表示为日均里程,deman表示为日均里程集合。
[0112]
步骤312:获取日均时程集合的中位数和绝对中位差:
[0113]
dmedian=median(deman)
[0114]
ddmedian=median(|l
i-median(deman)|)
[0115]
median()表示为取中位数,dmedian表示为中位数,ddmedian表示为绝对中位差;|l
i-median(deman)|表示为日均里程集合中每个里程与中位数差绝对值组合的集合,ddmedian为该集合的中位数。
[0116]
步骤313:判断日均值与中位数差值的绝对值,是否小于绝对中位差与第三域值n的积。可以采用公式进行表示:
[0117]
|l
i-dmedian|<n*ddmedian
[0118]
若是,执行骤步314:保留该日均值li,即获得日均值的估算值。
[0119]
若否,去除该日均值。
[0120]
步骤102中,对所述车辆信息进行清洗的方法包括根据规则清洗的方法:
[0121]
规则201:去除不合理的里程数据,如填写里程《=0,或者填写里程》=999999等不合理数据。基于业务经验一辆车终身跑的里程不会超过这些数值。
[0122]
可以基于时间轴判断里程填写是否合理,由于数据采集来源多样化,导致部分数据可靠性不高或出现矛盾的情况,清洗规则如下:
[0123]
规则202:同一天多条里程,保留时间最晚的里程。
[0124]
规则203:不同日期填写的里程一样,保留时间最晚的里程。
[0125]
规则204:车辆只有两条里程数据、且不合理的,保留数据来源可靠的里程,例如门店提供的数据可靠性高于用户app提供的数据。
[0126]
规则205:车辆具有n条里程数据、k∈(1,

,n)、n-k为2,第k里程同时大于第k+1里程和第k+2里程,第k+1里程小于第k+2里程,保留第k+1里程和第k+2里程。例车辆具有3条里程数据,第1条里程同时大于第2条和第3条里程;若第2条里程大于第3条里程,则保留第2条和第3条里程,若第2条里程小于第3条里程,则仅保留第3条里程。
[0127]
规则206:车辆具有n条里程数据、k∈(1

n)、n-k大于3,保留小于所有较晚里程的第k里程。
[0128]
对所述车辆信息进行的清洗,还包括车辆信息中异常数据的处理规则:
[0129]
规则211:车辆信息的历史数据有两条,上次检测结果为有异常,最后一条历史数据为app填写、且小于上一条历史数据,去除最后一条历史数据。
[0130]
规则212:历史数据有两条,最后一条历史数据为app填写、且小于上次保养信息的里程或上一次检测异常信息的里程,去除最后一条历史数据。
[0131]
规则213:历史数据的最后一条是检测未见异常、且上一条是保养信息或app填写信息,去除最后一条历史数据。
[0132]
规则214:历史数据的最后一条是检测数据、上一条是保养数据、且两者的里程一致,去除最后一条。
[0133]
在另一个具体实施例中,通过数据来源的可信度选择或删除数据:
[0134]
步骤221:判断两条数据是否矛盾;
[0135]
若是,执行步骤222:选择可信度大的数据,并删除可信度小的数据。其中,以下数据的可信度依次降低:保养信息、检测为异常的检测数据、app填写数据和检测为正常的检测数据,但不限于此。
[0136]
步骤106中,根据预设规则,预估第二保养时间的方法包括:
[0137]
步骤601:判断里程周期和日均里程的商是否大于时间周期。
[0138]
若是,即保养时间周期先到,执行步骤602:根据以下公式计算下次保养时间和保养的里程:
[0139]
next_time=t1+upkeep_time
[0140]
next_mil=m1+upkeep_time*res_mil
[0141]
其中,next_time表示为下次保养时间,t1表示为上次保养时间,upkeep_time表示为保养的时间周期,例如3-6个月的保养时间周期,m1表示为上次保养里程,res_mil表示为日均里程。
[0142]
若否,即保养里程周期先到,执行步骤603:判断上次保养里程是否小于第四域值。例如,上次保养里程小于或等于100km,则认为上次保养里程不合理。
[0143]
若小于第四域值,执行步骤604:根据以下公式,校正上次保养里程:
[0144]
m1=n_mil-res_mil*days
[0145]
days=(n_t-t1).days
[0146]
其中,n_mil表示为当前里程,days表示为上次保养时间到当前时间的时间差(按天计),t1表示为上次保养时间,().days表示为将时间差转换为天数,执行步骤605。
[0147]
若大于第四域值,执行步骤605:根据以下公式计算下次保养时间和保养里程:
[0148]
diff_mil=(n_mil-m1)%upkeep_mil
[0149]
next_mil=n_mil+(upkeep_mil-diff_mil)
[0150]
next_time=n_t+next_mil/res_mil
[0151]
其中,diff_mil表示为下一次保养前的剩余里程,upkeep_mil表示为保养的里程周期,例如5000km。
[0152]
所述预设规则还包括根据检测数据进行预估的方法:
[0153]
步骤611:根据检测数据,为车辆预设分值和分值区间。例如,检测结果分为3个等级,未见异常是等级1,严重是等级2,特别严重是等级3,每个等级会对应一个score区间:[100-20]、[19-10]、[9-0]。
[0154]
步骤612:判断里程周期和日均里程的商是否大于时间周期。表示公式为:upkeep_mil/res_mil》upkeep_time。
[0155]
若是,即保养时间周期先到,执行步骤613:根据以下公式计算下次保养里程和保养时间:
[0156]
diff_days=(score/100)*(upkeep_time)
[0157]
next_time=t2+diff_days
[0158]
next_mil=m2+diff_days*res_mil
[0159]
其中,score表示为分值,diff_days表示为下一次保养前的剩余时间,t2表示为检测时间,m2表示为检测里程;
[0160]
若否,执行步骤614:判断上次检测的里程是否合理。上次检测里程小于或等于第五域值时,如100km,判断为不合理。
[0161]
若不合理,执行步骤615:通过以下公式校正上次检测里程:
[0162]
days=(n_t-t2).days
[0163]
diff_mil=score/100.0*upkeep_mil
[0164]
m2=n_mil-res_mil*days
[0165]
执行步骤616。
[0166]
若合理,执行步骤616:根据以下公式计算下次保养里程和保养时间:
[0167]
next_mil=m2+diff_mil
[0168]
next_time=t2+diff_mil/res_mil。
[0169]
所述预设规则还包括无历史保养数据和检测数据的预估方法:
[0170]
步骤621:判断里程周期和日均里程的商是否大于时间周期。
[0171]
若是,执行步骤622:根据以下公式计算下次保养里程和保养时间:
[0172]
temp_time=n_mil/res_mil
[0173]
next_time=n_time+upkeep_time-temp_time%upkeep_time
[0174]
next_mil=n_mil+res_mil*(upkeep_time-temp_time%upkeep_time)
[0175]
其中,temp_time表示为购车时长。
[0176]
若否,执行步骤623:根据以下公式计算下次保养里程和保养时间:
[0177]
diff_mil=n_mil%upkeep_mil
[0178]
next_mil=n_mil+(upkeep_mil-diff_mil)
[0179]
next_time=n_t+(upkeep_mil-diff_mil)/res_mil
[0180]
其中,diff_mil表示下次保养的剩余里程。
[0181]
若估算的下次保养里程和保养时间超过计算周期,则顺延到下一周期。
[0182]
本发明还提供一种用于实现上述预估方法的系统,如图2所示,包括采集模块1、清洗模块2、日均里程估算模块3和保养估算模块4,
[0183]
采集模块1用于获取车辆信息,所述车辆信息包括以下任一数据或它们的组合:保养周期、保养数据、和检测数据;
[0184]
清洗模块2用于对所述车辆信息进行清洗,获得第一数据;
[0185]
日均里程估算模块3用于根据第一数据,估算日均里程;
[0186]
保养估算模块4用于基于gbdt算法,根据日均里程,预估第一保养时间;判断所述第一保养时间是否合理;若不合理,根据预设规则和日均里程,预估第二保养时间。
[0187]
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1