用于对单车报修信息进行鉴别的方法、设备和存储介质与流程

文档序号:14686888发布日期:2018-06-15 03:52阅读:112来源:国知局

本发明涉及单车领域,具体地涉及一种用于对单车报修信息进行鉴别的方法、设备和存储介质。



背景技术:

共享单车的出现,为人们的出行提供了便利。但单车的高使用频率,也会导致故障车的出现。用户扫码开锁后,当发现该单车有故障,可以进行报修。为鼓励使用者对有故障的单车进行保修,当用户对单车报修后,提供该单车的企业一般会将此单免费。但这也会导致部分用户,恶意报修来获取免费骑行的机会。这种情况对共享单车企业至少带来三个方面的严重后果:一是给单车企业带来经济上的损失;二是恶意报修的单车,可能没有故障,但运维人员去收车时找不到,增加了运维负担;三是给后台数据带来了“噪音”、脏数据,会对后期的数据分析、研究工作带来干扰。



技术实现要素:

本发明实施例的目的是提供一种用于对单车报修信息进行鉴别的方法、设备和存储介质,用以至少解决现有技术中对单车的报修信息做鉴别的方法不够准确可靠的问题。

为了实现上述目的,本发明实施例提供一种用于对单车报修信息进行鉴别的方法,该方法由服务器执行,所述方法包括:接收来自客户端的报修信息;从该报修信息内提取特征;以及将所述报修信息的特征输入至鉴别模型,以鉴别所述报修信息的真实性;其中,所述鉴别模型基于历史报修信息而被建立。

可选地,所述鉴别模型基于历史报修信息而被建立包括:确定一鉴别模型;采集多个历史报修信息作为样本数据;提取所述多个历史报修信息中每个历史报修信息的特征;判断所述多个历史报修信息中每个历史报修信息的真实性;以及根据所述多个历史报修信息中每个历史报修信息的真实性及特征,对所述鉴别模型进行训练,以确定该鉴别模型的模型参数。

可选地,所述报修信息的特征与所述历史报修信息的特征的类型和维度相同。

可选地,所述判断所述多个历史报修信息中每个历史报修信息的真实性包括:若检测到历史报修发生之后的第一预设时间内,该历史报修所对应的单车被正常骑行超过第一预设距离,则判断该历史报修对应的历史报修信息为假报修信息;若检测到历史报修发生前后的第二预设时间内,该历史报修所对应的单车被报修超过预设次数,且未被正常骑行超过第二预设距离,则判断该历史报修对应的历史报修信息为真报修信息。

可选地,所述特征包括报修者特征、单车特征和/或实时特征。

可选地,所述报修者特征包括以下至少一者:性别、年龄、所在城市、信誉值、骑行次数、报修次数以及报修比例。

可选地,所述单车特征包括以下至少一者:单车类型、车锁类型、历史骑行次数、历史报修次数、历史报修部位、历史报修地理位置以及投放时长。

可选地,所述实时特征包括以下至少一者:报修地理位置、报修时间、报修部位、开关锁时间以及报修后预设时间内单车的运动信息。

可选地,所述方法还包括:当所述报修信息被鉴别为真报修信息时,通知单车维修系统;当所述报修信息被鉴别为假报修信息时,对所述报修信息进行标记。

可选地,所述方法还包括:接收报修者的申诉信息,并根据所述申诉信息监测和/或修正所述鉴别模型。

本申请实施例还提供一种用于对单车报修信息进行鉴别的设备,所述设备包括处理器,以及存储有计算机程序的存储器,所述计算机程序被所述处理器运行时,执行上述的方法。

本申请实施例还提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行上述的方法。

通过本申请上述技术方案,可以由鉴别模型对接收到的报修信息进行鉴别,由于该鉴别模型是基于历史报修信息而被建立的,所以利用该鉴别模型对报修信息进行鉴别时,能够参考历史报修信息来对报修信息进行鉴别,鉴别结果准确可信。

本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:

图1是本申请一种实施方式提供的用于对单车报修信息进行鉴别的方法的流程图;

图2是本申请一种实施方式提供的建立鉴别模型的方法的流程图;以及

图3是本申请一种可选实施方式提供的用于对单车报修信息进行鉴别的方法的流程图。

具体实施方式

以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。

图1是本申请一种实施方式提供的用于对单车报修信息进行鉴别的方法的流程图。如图1所示,本申请实施方式提供一种用于对单车报修信息进行鉴别的方法,该方法由服务器执行,所述方法包括:

步骤S101,接收来自客户端的报修信息。

步骤S102,从该报修信息内提取特征。

步骤S103,将所述特征输入至鉴别模型,以鉴别所述报修信息的真实性。

其中,所述鉴别模型基于历史报修信息而被建立。其中,所述历史报修信息是指在建立模型之前由用户反馈的针对不同单车的报修信息,并且用于建立模型的历史报修信息为已经通过其它方法确定其真实性的历史报修信息。

通过本申请上述技术方案,可以由鉴别模型对接收到的报修信息进行鉴别,由于该鉴别模型是基于历史报修信息而被建立的,所以利用该鉴别模型对报修信息进行鉴别时,能够以历史报修信息作为参考来对报修信息进行鉴别,因此本申请上述技术方案的鉴别结果准确可信。

图2是本申请一种实施方式提供的建立鉴别模型的方法的流程图。如图2所示,建立鉴别模型的方法包括:

步骤S201,确定一鉴别模型;

步骤S202,采集多个历史报修信息作为样本数据。

步骤S203,提取多个历史报修信息中每个历史报修信息的特征。

步骤S204,判断多个历史报修信息中每个历史报修信息的真实性。

步骤S205,根据所述多个历史报修信息中每个历史报修信息的真实性及特征,对所述鉴别模型进行训练,以确定该鉴别模型的模型参数。

其中,所述多个历史报修信息可以例如是过去一天、一周、两周或者一个月内的历史报修信息。本领域技术人员可以理解的是,该方法中,上述步骤S203和步骤S204的顺序是可以颠倒的或者可以是同时进行的。作为本申请的优选实施方式,采集的样本数据可以与待判断的报修信息具有相同或相近的客观条件,例如它们所对应的单车类型是相同的或它们所对应的单车在同一个城市等。

在建立鉴别模型的过程中,提取作为样本数据的历史报修信息的特征是非常重要的一个环节。由于报修行为实际是人对单车的一种行为,报修鉴别实则是衡量人和单车二者之间的一种关系,因此可以选取以下三种类型的特征作为被提取的特征。

1、报修者特征,报修者特征反映报修者的信息,其可以包括静态特征和动态特征。例如,静态特征可以包括报修者的性别,年龄,所在城市等一般不会变化的特征;动态特征,也可以称为统计特征,例如,可以包括报修者的信誉值,以及在历史一段时间(过去一周、两周、一个月)的骑行次数、报修次数和报修比例等会动态改变的信息。

2、单车特征,单车特征反映被报修单车的信息,其同样可以包括静态特征和动态特征。单车的静态特征可以例如包括单车的类型,车锁的类型等一般不会改变的特征;单车的动态特征,可以例如包括被报修单车在历史一段时间(例如过去一天、两天、一周、两周)的正常骑行次数、报修次数、报修最多的部位和报修的地理位置以及投放时长等。这些特征能充分反应被报修单车的健康状况。

3、实时特征,实时特征反映单车被报修当时的信息,例如单车被报修后短时间内所能获取的实时信息。例如,该实时特征可以包括:报修时单车的地理位置,报修时间,本次报修的部位,本次开关锁时间,报修后短时间内车辆的运动信息等。其中所述短时间例如可以是5分钟。

在具体实施中,本领域技术人员可以根据实际情况选择提取历史报修信息的上述特征中的全部特征或部分特征,但对于多个历史报修信息中每个历史报修信息,提取的特征的维度和类型一般应该相同。

此外,为了建立鉴别模型,首先需要判断作为样本数据的每个历史报修信息的真实性,也就是判断每个历史报修是真报修还是假报修,这样才能根据已确定真实性的历史报修信息的特征来对鉴别模型进行训练,确定鉴别模型的模型参数。为了准确判断历史报修信息的真实性,可以依据历史报修信息所对应的报修时间点之后的信息来进行判断,所述历史报修信息所对应的报修时间点之后的信息在以下简称为判断信息,该判断信息可以包括该历史报修信息对应的单车在报修时间点之后被使用的情况以及被报修的情况等,并且为了确保判断结果更为准确,需要采集尽可能多的判断信息,例如可以采集所述历史报修信息所对应的报修时间之后两小时(或者更久)内的所有的所述判断信息。如上所述,在历史报修信息所对应的报修时间点一定的时间段(例如上述的两小时)后可以获得更多有利于判断该历史报修真实性的判断信息,因此基于这些判断信息,可以较为准确地确定该历史报修信息的真实性,所以基于这些判断信息得到的历史报修信息的判断结果可以用于确定鉴别模型的模型参数。

在本申请一种可选实施方式中,判断所述多个历史报修信息中每个历史报修信息的真实性的方法包括:若检测到历史报修发生之后的第一预设时间内,该历史报修所对应的单车被正常骑行超过第一预设距离,则判断该历史报修对应的历史报修信息为假报修信息;若检测到历史报修发生前后的第二预设时间内,该历史报修所对应的单车被报修超过预设次数,且未被正常骑行超过第二预设距离,则判断该历史报修对应的历史报修信息为真报修信息。其中,所述第一预设时间可以例如是2小时,第一预设距离可以例如是500米,第二预设时间可以例如是12小时,第二预设距离可以例如是200米,所述预设次数可以例如是3次。也就是说,如果检测到历史报修信息对应的单车在被报修之后2小时内,有正常骑行订单且骑行超过500米,则确定该历史报修信息是假报修信息;如果历史报修信息对应的单车在被报修前后的12小时内被报修超过了3次,并且该单车在被报修前后12小时内没有发生骑行超过200米的订单,则确定该历史报修信息是真报修信息。对于不符合上述两种情况的历史报修信息,由于难以确认其真实性,因而不作为样本数据。本领域技术人员可以理解的是,上述实施方式仅仅为一种优选的实施方式,本申请不限于上述具体的实施方式,上述实施方式中的各种条件和数值可以根据实际情况进行重新组合和修改。

在本申请一种优选实施方式中,对于已经确定真实性的多个历史报修信息中每个历史报修信息的特征,可以通过机器学习技术来训练模型。具体地,可以采用机器学习领域的分类算法来训练鉴别模型,对于提取的特征在几十到几百维级别的情况,可以例如通过决策树或类似的算法来训练鉴别模型,从而提高效率。对于通过分类算法来训练模型的具体方法(例如通过决策树来训练模型的方法)属于现有技术,于此不再赘述。

此外,在利用提取的特征对鉴别模型进行训练时,可以在样本数据上做迭代优化,即在训练过程中,将样本数据输入至鉴别模型,将鉴别模型的输出结果与实际情况进行比较,通过比较结果调整鉴别模型的模型参数,然后不断重复上述过程,以提高最终建立的鉴别模型的输出结果的可靠性。此外,可以从样本数据中随机取一部分用于对鉴别模型进行训练,而另一部分用于对鉴别模型进行测试,以确定更好的模型参数。

在本申请上述技术方案中,在确定历史报修信息的真实性后,可以利用大数据、机器学习技术等对真报修信息的特征和假报修信息的特征进行深度分析、研究和计算以训练鉴别模型。

在本申请一种实施方式中,报修信息的特征与历史报修信息的特征的类型和维度相同,即报修信息的特征也可以包括上述的报修者特征、单车特征和实时特征,且提取的报修信息的特征与提取的作为样本数据的历史报修信息的特征的类型和维度相同。鉴于所述鉴别模型是基于历史报修信息的特征而建立的,因此在提取报修信息的特征时,需要提取与历史报修信息的特征的类型相同的特征,而为了保证输出结果的可靠性,提取的报修信息的维度可以与历史报修信息的特征的维度相同,即提取的报修信息的特征与历史报修信息的全部特征相对应。本领域技术人员可以理解的是,上述实施方式仅仅作为一种优选的实施方式,在具体实施中,也可以只提取报修信息中与历史报修信息的特征的类型相同的特征中的一部分特征并输入至鉴别模型以鉴别报修信息的真实性。

图3是本申请一种可选实施方式提供的用于对单车报修信息进行鉴别的方法的流程图。如图3所示,在本申请一种可选实施方式中,所述用于对单车报修信息进行鉴别的方法还包括:

步骤S301,对鉴别结果进行判断,当所述报修信息被鉴别为真报修信息时,转至步骤S302;当所述报修信息被鉴别为假报修信息时,转至步骤S303。

步骤S302,通知单车维修系统。

步骤S303,标记该报修信息。

通过本实施方式的上述方法,可以实现在报修为真报修时,通知单车维修系统,以使后续运维人员能够及时寻找并维修该单车;在报修为假报修时,可以对本次报修信息进行标记,以在后续数据分析及使用上区分对待,从而降低后台数据的噪音,并且对该报修对应的订单可以依然进行扣费处理,以降低单车企业经济上的损失。

此外,虽然鉴别模型是依据历史报修信息的特征建立的,但其鉴别结果也可能出现错误,因此,在本申请一种可选实施方式中,所述方法还包括:接收报修者的申诉信息,并根据所述申诉信息监测和/或修正所述鉴别模型。也就是说,若鉴别模型判别错误,报修者对报修识别结果有异议,可走申诉流程。运维人员或报修系统可以通过报修者的申诉信息来监测鉴别模型的稳健性。当运维人员或报修系统发现申诉率过高时,还可以根据报修者的申诉信息,反过来修正鉴别模型,以不断提升鉴别模型判断结果的准确率。

本申请上述方案通过将已经确定真实性的历史数据信息作为样本数据,并对样本数据进行深度分析,提取在报修时间点前后或当时的相关的特征,以建立用于鉴别真假报修信息的鉴别模型。然后通过提取待鉴别的报修信息的特征,利用该鉴别模型来对待鉴别的报修的特征进行分析以确定待鉴别的报修信息的真实性。相对于现有的鉴别方法,本申请上述方案参考了历史报修信息并利用了后验规则,因此鉴别结果更为可靠准确。

本申请实施方式提供一种用于对单车报修信息进行鉴别的设备,所述设备包括处理器,以及存储有计算机程序的存储器,所述计算机程序被所述处理器运行时,执行上述的方法。

本申请实施方式还提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行上述的方法。

以上结合附图详细描述了本发明实施例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。

本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1