一种车主身份识别方法及装置与流程

文档序号:13165343阅读:701来源:国知局
一种车主身份识别方法及装置与流程

本公开一般涉及计算机领域,具体涉及身份识别技术,尤其涉及一种车主身份识别方法及装置。



背景技术:

在我国,汽车保有量已经达到亿级别,而伴随互联网的迅速发展,出行类app在方便用户查询出行路线的同时,也提供了诸多方便车主用车的在线服务,如:在线加油、违章查询、汽车用品、车险、停车缴费、代驾等服务。

如今,如何在车主没有填写任何信息的情况下,通过用户使用过的出行服务、积累的大量出行数据,预测出该用户是否为车主,进而为车主用户提供更加个性的服务,是目前需要解决的问题。

目前存在的根据用户的路线检索等行为判断用户是否为车主的方法,其准确性不高,容易造成误判,导致对非车主提供车主的个性服务进而对非车主用户造成打扰。



技术实现要素:

鉴于现有技术中的上述缺陷或不足,期望提供一种车主身份识别方法及装置,以提高车主身份识别的准确性。

第一方面,本发明实施例提供一种车主身份识别方法,所述方法包括:

获取未知身份用户的用户数据;

利用预先设立的模型,根据所述用户数据确定所述用户是车主的概率值,所述预先设立的模型通过学习真实车主和真实非车主的用户数据得到。

第二方面,本发明实施例提供一种车主身份识别装置,所述装置包括:

数据获取单元,用于获取未知身份用户的用户数据;

身份识别单元,用于利用预先设立的模型,根据所述用户数据确定所述用户是车主的概率值,所述预先设立的模型通过学习真实车主和真实非车主的用户数据得到。

第三方面,本发明实施例提供一种设备,包括处理器和存储器;

所述存储器包含可由所述处理器执行的指令以使得所述处理器执行第一方面中提供的方法。

第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于实现第一方面中提供的方法。

本发明实施例提供一种车主身份识别方法及装置,获取未知身份用户的用户数据后,利用预先设立的模型,根据用户数据确定用户是车主的概率值,其中,预先设立的模型通过学习真实车主和真实非车主的用户数据得到。由于确定了用户是车主的概率,可以便于其它业务进一步根据该概率值进行具体的业务判断,并且,通过学习真实车主和真实非车主的用户数据得到模型,可以提高车主身份识别的准确性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为本发明实施例提供的车主身份识别方法流程图;

图2为本发明实施例提供的车主身份识别装置结构示意图;

图3为本发明实施例提供的车主身份识别设备结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

请参考图1,本发明实施例提供的车主身份识别方法,包括:

步骤s101、获取未知身份用户的用户数据;

步骤s102、利用预先设立的模型,根据用户数据确定用户是车主的概率值,其中,预先设立的模型通过学习真实车主和真实非车主的用户数据得到。

由于步骤s102中确定的是用户是车主的概率,可以便于其它业务进一步根据该概率值进行具体的业务判断,并且,预先设立的模型是通过学习真实车主和真实非车主的用户数据得到的,可以提高车主身份识别的准确性。

例如,将真实车主的用户数据作为正样本,用户数据可以从各业务线获取,用户数据的具体内容可以包括:在线加油、违章查询、汽车用品、车险、停车缴费、代驾;将真实非车主的用户数据作为负样本,例如可以根据用户画像标签筛选出真实非车主,例如确定为初中生的用户,即可确定为非车主,将真实非车主的用户数据作为负样本,所选择的用户数据需要和正样本及步骤s101中获取的未知身份用户的用户数据内容一致,例如可以都选择违章查询、车险、停车缴费、路线查询这几种用户数据。

使用真实车主和真实非车主的用户数据作为样本来确定模型,可以避免类似高频打车用户对模型识别能力的干扰,因为高频打车用户在用车前也会查看路况、使用导航查询路线,而该用户并非车主,故使用这类用户确定模型,无法保证正负样本的可靠性,将影响模型效果。

在本发明实施例中,用户数据可以具体包括如下之一或组合:

驾驶行为数据;

汽车服务数据;

出行统计数据。

其中,驾驶行为数据可以包括:驾车行为数据、驾车两框检索数据、驾车方案数据等;

汽车服务数据可以包括:4s店数据、汽车保养数据、汽车维修数据、收费站数据、加油数据等;

出行统计数据可以包括:用户设定时间内的出行总次数、驾驶出行占比、公交出行占比等。

这些用户数据可以通过合作的相关网站获得,或者根据实际情况从其它渠道获得。

在本发明实施例中,需要确定的是用户是车主的概率值,预先设立的模型采用逻辑回归模型较佳,优选的,可以采用如下模型:

hθ(x)=g(θtx);

其中,hθ(x)为用户是车主的概率值,x为量化后的用户数据,θ为通过学习真实车主和真实非车主的用户数据确定的各项用户数据对应的权重。

训练集在汽车保养、汽车装饰、洗车、加油站特征上量化后值分别为:[(5,12,7,9),(4,1,9,20)……],将这些数值作为x值代入hθ(x)=g(θtx)中,由于训练集对应的hθ(x)值已知,所以对其参数(特征的权重)进行学习(梯度下降法),可以得到特征的权重,例如计算出的权重分别为0.43、0.62、3.99、11.73。学习出权重后,即可使用求得的权重代入公式,进而在实际应用中,根据用户的用户数据作为x值得出概率hθ(x)。

进一步,还可以在模型的权重确定后,对模型进行评估、进行泛化能力验证,从而进一步保证模型进行车主身份识别的准确性。

对于lr(logisticregression,逻辑回归模型)分类模型的评估,常用准召、auc(areaunderthecurveofroc,roc曲线下方的面积,roc,receiveroperatingcharacteristiccurve,接收者操作特征曲线)指标来评估。对其基本指标评估后,通过未参与建模的业务数据进行泛化能力的验证。泛化能力(generalizationability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据对背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化能力。该指标标示模型应用的真实数据上的效果。

所以,本发明实施例中的预先设立的模型是通过准召或auc指标评估后的模型;和/或预先设立的模型是通过泛化能力验证的模型。

应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

本发明实施例还相应提供一种车主身份识别装置,如图2所示,该装置包括:

数据获取单元201,用于获取未知身份用户的用户数据;

身份识别单元202,用于利用预先设立的模型,根据用户数据确定用户是车主的概率值,其中,预先设立的模型通过学习真实车主和真实非车主的用户数据得到。

本发明实施例中的用户数据可以具体包括如下之一或组合:

驾驶行为数据;

汽车服务数据;

出行统计数据。

其中,驾驶行为数据,具体包括如下之一或组合:

驾车行为数据、驾车两框检索数据、驾车方案数据;

汽车服务数据具体包括如下之一或组合:

4s店数据、汽车保养数据、汽车维修数据、收费站数据、加油数据;

出行统计数据具体包括如下之一或组合:用户设定时间内的出行总次数、驾驶出行占比、公交出行占比。

进一步,预先设立的模型具体为:

逻辑回归模型。

更进一步,预先设立的模型具体为:

hθ(x)=g(θtx);

其中,hθ(x)为用户是车主的概率值,x为量化后的用户数据,θ为通过学习真实车主和真实非车主的用户数据确定的各项用户数据对应的权重。

优选的,预先设立的模型是通过准召或auc指标评估后的模型;和/或

预先设立的模型是通过泛化能力验证的模型。

应当理解,该装置中记载的诸单元或模块与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于该装置及其中包含的单元,在此不再赘述。该装置可以预先实现在电子设备的浏览器或其他安全应用中,也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。该装置中的相应单元可以与电子设备中的单元相互配合以实现本申请实施例的方案。

下面参考图3,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。

如图3所示,计算机系统包括中央处理单元(cpu)301,其可以根据存储在只读存储器(rom)302中的程序或者从存储部分308加载到随机访问存储器(ram)303中的程序而执行各种适当的动作和处理。在ram303中,还存储有系统300操作所需的各种程序和数据。cpu301、rom302以及ram303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。

以下部件连接至i/o接口305:包括键盘、鼠标等的输入部分306;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至i/o接口305。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器310上,以便于从其上读出的计算机程序根据需要被安装入存储部分308。

特别地,根据本公开的实施例,上文参考图x描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行图1的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分309从网络上被下载和安装,和/或从可拆卸介质311被安装。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括xx单元、yy单元以及zz单元。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,xx单元还可以被描述为“用于xx的单元”。

作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本申请的公式输入方法。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1