一种汽车推荐方法及装置与流程

文档序号:14070814阅读:166来源:国知局

本发明实施例涉及数据处理技术领域,具体涉及一种汽车推荐方法及装置。



背景技术:

目前,在推荐汽车选购的方案上,传统的方法主要分为两种,第一种是基于专业人员的推荐方法,是通过采集用户的需求,如价格,品牌,车型等信息,然后熟悉汽车市场的专业人员凭借个人的经验给出几个候选项。第二种是用户自己学习的方法,是汽车购买用户自己根据自己的需求,在各个汽车垂直类的网站上和不同汽车4s店之间对比观察,然后选择自己认为合理的车型。

由于前些年大众对汽车的了解所知甚少,因此第一种基于专业人员的推荐方法一度成为主流的获取汽车选购候选名单的方法。但是,这种方法的问题是如果寻找第三方的专业人士,价格不菲。如果是汽车厂家提供的顾问多数的目的是为了销售自家的产品。另一个问题就是不同的专业人士由于个人喜好的特点,会导致相同的用户需求,不同的专业人士给出的候选车型各不相同,并不能给用户高效的推荐建议。

对于第二种用户自己学习的方法,虽然随着信息时代的快速发展,用户在学习新的领域知识的门槛变得越来越低,但不同的领域知识之间仍然存在一定的技术壁垒,这点理工科的领域更甚,汽车领域由于涉及的领域众多,其中包含了大量的专业技术知识,普通无背景的人员学习成本较高。其次,由于每个用户的精力和时间上的限制,了解的车型、所能学习的资料和去4s店观察的数据都是有限的,因此会存在一定的数据样本不全的情况,导致有些优质的车型没有进入候选名单,即在有限的样本资料上做出的选择有时会忽略样本以外的优质车型。

鉴于此,如何提供一种汽车推荐方法及装置,以为用户提供便捷高效的汽车产品的推荐成为目前需要解决的技术问题。



技术实现要素:

由于现有方法存在上述问题,本发明实施例提出一种汽车推荐方法及装置。

第一方面,本发明实施例提出一种汽车推荐方法,包括:

获取各汽车垂直类网站中每个车型各维度数据,所述各维度数据包括各维度的评价分数;

对所述各维度数据进行预处理,以使所述评价分数均分布在预设区间范围内;

对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,其中聚类簇个数是根据获取的每个车型各维度数据中的维度信息来确定的;

获取用户指定的维度信息,并根据用户指定的维度信息对获得的聚类簇进行筛选;

在选择的聚类簇中对聚类簇中的所有车型进行排序,将排序结果展示给用户。

可选地,所述获取各汽车垂直类网站中每个车型各维度数据,包括:

利用爬虫技术对各汽车垂直类网站进行爬取,获得各汽车垂直类网站中每个车型各维度数据。

可选地,所述每个车型各维度,包括:空间、动力、操控、油耗、舒适性、外观、内饰和性价比。

可选地,所述对所述各维度数据进行预处理,以使所述评价分数均分布在预设区间范围内,包括:

将从各汽车垂直类网站中获取的每个车型各维度数据中的各维度的评价分数均映射到预设区间范围内。

可选地,所述对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,包括:

利用kmeans算法,对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇。

可选地,所述获取用户指定的维度信息,并根据用户指定的维度信息对获得的聚类簇进行筛选,包括:

获取用户指定的维度信息并确定用户的需求维度,其中用户指定的维度信息中排名靠前的维度信息的权重大于排名靠后的维度信息的权重;

根据用户的需求维度,利用第一公式,计算获得的每个聚类簇的维度加权二范数x;

选择维度加权二范数最大的聚类簇;

其中,所述第一公式为

wi为本聚类簇中第i个维度的权重,xi为第i个维度在本聚类簇中的平均评价分数值,n为本聚类簇中的维度数量,i=1,...,n。

可选地,所述在选择的聚类簇中对聚类簇中的所有车型进行排序,包括:

利用第二公式,计算所选择的聚类簇中每个车型的加权二范数x';

根据计算得到的所选择的聚类簇中每个车型的加权二范数的大小,对聚类簇中的所有车型进行排序;

其中,所述第二公式为

w'j为所选择的聚类簇中第j个车型的权重,x'j为所选择的聚类簇中第j个车型的评价分数值,m为所选择的聚类簇中车型的数量,j=1,...,m。

第二方面,本发明实施例还提出一种汽车推荐装置,包括:

获取模块,用于获取各汽车垂直类网站中每个车型各维度数据,所述各维度数据包括各维度的评价分数;

预处理模块,用于对所述各维度数据进行预处理,以使所述评价分数均分布在预设区间范围内;

聚类模块,用于对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,其中聚类簇个数是根据获取的每个车型各维度数据中的维度信息来确定的;

筛选模块,用于获取用户指定的维度信息,并根据用户指定的维度信息对获得的聚类簇进行筛选;

排序模块,用于在选择的聚类簇中对聚类簇中的信息进行排序,将排序结果展示给用户。

第三方面,本发明实施例还提出一种电子设备,包括:处理器、存储器、总线及存储在存储器上并可在处理器上运行的计算机程序;

其中,所述处理器,存储器通过所述总线完成相互间的通信;

所述处理器执行所述计算机程序时实现上述方法。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述方法。

由上述技术方案可知,本发明实施例通过获取各汽车垂直类网站中每个车型各维度数据,各维度数据包括各维度的评价分数;对各维度数据进行预处理,以使评价分数均分布在预设区间范围内;对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,其中聚类簇个数是根据获取的每个车型各维度数据中的维度信息来确定的;获取用户指定的维度信息并根据用户指定的维度信息对获得的聚类簇进行筛选;在选择的聚类簇中对聚类簇中的所有车型进行排序,将排序结果展示给用户,由此,能够为用户提供便捷高效的汽车产品的推荐,克服了现有的需要传统专业人士推荐的弊端,降低了咨询成本,避免了不同的专业人士意见带有一定的主观性的问题;省去了用户需要自学和掌握这些信息的时间成本,用户可以便捷高效的通过获取自己感兴趣方向的汽车推荐列表(汽车车型的推荐排序结果)。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。

图1为本发明一实施例提供的一种汽车推荐方法的流程示意图;

图2为本发明一实施例提供的一种汽车推荐装置的结构示意图;

图3为本发明一实施例提供的电子设备的逻辑框图。

具体实施方式

下面结合附图,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

图1示出了本发明一实施例提供的一种汽车推荐方法的流程示意图,如图1所示,本实施例的汽车推荐方法,包括:

s101、获取各汽车垂直类网站中每个车型各维度数据,所述各维度数据包括各维度的评价分数。

在具体应用中,可以利用爬虫技术对各汽车垂直类网站进行爬取,获得各汽车垂直类网站中每个车型各维度数据。

其中,所述每个车型各维度,包括:空间、动力、操控、油耗、舒适性、外观、内饰和性价比等,例如从某汽车垂直类网站获取的每个车型各维度数据包括:空间4.42分、动力4.08分、操控4.45分、油耗4.22分、舒适性4.16分、外观4.54分、内饰4.33分和性价比3.89分。本实施例并不对所述每个车型各维度进行限制,所述每个车型各维度也可以根据实际情况包括其他与车型相关的维度。

s102、对所述各维度数据进行预处理,以使所述评价分数均分布在预设区间范围内。

在具体应用中,可以将从各汽车垂直类网站中获取的每个车型各维度数据中的各维度的评价分数均映射到预设区间范围内。例如,所述预设区间范围可以为0-5。

s103、对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,其中聚类簇个数是根据获取的每个车型各维度数据中的维度信息来确定的。

在具体应用中,本实施例可以利用kmeans算法,对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇。当然,本实施例也可以利用其他聚类算法对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,本实施例并不对其进行限制。

可以理解的是,kmeans算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。

需要说明的是,在本步骤中,获取的每个车型各维度数据中有多少维度信息,可获得多少个汽车车型的聚类簇。

可以理解的是,聚类算法作为一种无监督学习算法,虽然不需要标签信息,但是需要确定聚类算法收敛的超参数(聚类簇个数就是一种)。本实施例中通过使用聚类维度数量的方法来估计聚类簇个数,避免了人为估算由于经验不足导致的不确定性,同时在某种程度上符合一定的自然规律,每个汽车都有擅长的方面,维度相似的车型更容易聚类到一起。

s104、获取用户指定的维度信息,并根据用户指定的维度信息对获得的聚类簇进行筛选。

在具体应用中,所述步骤s104可以包括:获取用户指定的维度信息并确定用户的需求维度(其中用户指定的维度信息中排名靠前的维度信息的权重大于排名靠后的维度信息的权重);根据用户的需求维度,利用第一公式,计算获得的每个聚类簇的维度加权二范数x;选择维度加权二范数最大的聚类簇;

其中,所述第一公式为

wi为本聚类簇中第i个维度的权重,xi为第i个维度在本聚类簇中的平均评价分数值,n为本聚类簇中的维度数量,i=1,...,n。

可以理解的是,用户的需求维度可以理解为用户的喜好类型(如性价比、外观、内饰等),本步骤实际是根据用户的需求维度进行多维度的筛选(例如可能某一用户比较注重动力和内饰),确定哪一个汽车车型的聚类簇与用户需求信息的匹配度最高。

可以理解的是,本实施例通过加权二范数的方法来确定哪个聚类簇中的车型是在用户需求下表现最好的簇,同时考虑了用户对不同维度的关注度不同,还有就是可以将多个维度信息,映射到一维进行比较选择。

s105、在选择的聚类簇中对聚类簇中的所有车型进行排序,将排序结果展示给用户。

在所述步骤s105中,可以利用第二公式,计算所选择的聚类簇中每个车型的加权二范数x';根据计算得到的所选择的聚类簇中每个车型的加权二范数的大小,对聚类簇中的所有车型进行排序;

其中,所述第二公式为

w'j为所选择的聚类簇中第j个车型的权重,x'j为所选择的聚类簇中第j个车型的评价分数值,m为所选择的聚类簇中车型的数量,j=1,...,m。

可以理解的是,利用加权二范数的方法,可以确定同一个聚类簇内部在用户关注的维度信息下各个车型的推荐排序,所述排序结果实际就是满足用户需求的推荐购车列表。

本实施例可以利用两次加权二范数的方法,一次是在选择具体哪一个簇是符合用户感兴趣的维度信息。另一次是在选定了簇之后,解决在簇内部如何对不同的车型进行排序的问题。与现有技术相比,本实施例基于聚类的方法将所有维度的值都考虑进去,然后重点考虑用户关注的维度,这种方法符合当今用户越来越苛刻的选购标准。

本实施例的汽车推荐方法,通过获取各汽车垂直类网站中每个车型各维度数据,各维度数据包括各维度的评价分数;对各维度数据进行预处理,以使评价分数均分布在预设区间范围内;对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,其中聚类簇个数是根据获取的每个车型各维度数据中的维度信息来确定的;获取用户指定的维度信息并根据用户指定的维度信息对获得的聚类簇进行筛选;在选择的聚类簇中对聚类簇中的所有车型进行排序,将排序结果展示给用户,由此,能够为用户提供便捷高效的汽车产品的推荐,克服了现有的需要传统专业人士推荐的弊端,降低了咨询成本,避免了不同的专业人士意见带有一定的主观性的问题;省去了用户需要自学和掌握这些信息的时间成本,用户可以便捷高效的通过获取自己感兴趣方向的汽车推荐列表(汽车车型的推荐排序结果)。

图2示出了本发明一实施例提供的一种汽车推荐装置的结构示意图,如图2所示,本实施例的汽车推荐装置,包括:获取模块21、预处理模块22、聚类模块23、筛选模块24和排序模块25;其中:

所述获取模块21,用于获取各汽车垂直类网站中每个车型各维度数据,所述各维度数据包括各维度的评价分数;

所述预处理模块22,用于对所述各维度数据进行预处理,以使所述评价分数均分布在预设区间范围内;

所述聚类模块23,用于对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,其中聚类簇个数是根据获取的每个车型各维度数据中的维度信息来确定的;

所述筛选模块24,用于获取用户指定的维度信息,并根据用户指定的维度信息对获得的聚类簇进行筛选;

所述排序模块25,用于在选择的聚类簇中对聚类簇中的信息进行排序,将排序结果展示给用户。

具体地,所述获取模块21获取各汽车垂直类网站中每个车型各维度数据,所述各维度数据包括各维度的评价分数;所述预处理模块22对所述各维度数据进行预处理,以使所述评价分数均分布在预设区间范围内;所述聚类模块23对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,其中聚类簇个数是根据获取的每个车型各维度数据中的维度信息来确定的;所述筛选模块24获取用户指定的维度信息,并根据用户指定的维度信息对获得的聚类簇进行筛选;所述排序模块25在选择的聚类簇中对聚类簇中的信息进行排序,将排序结果展示给用户。

在具体应用中,所述获取模块21可以利用爬虫技术对各汽车垂直类网站进行爬取,获得各汽车垂直类网站中每个车型各维度数据。

其中,所述每个车型各维度,包括:空间、动力、操控、油耗、舒适性、外观、内饰和性价比等,本实施例并不对其进行限制,所述每个车型各维度也可以根据实际情况包括其他与车型相关的维度。

在具体应用中,所述预处理模块22可以将从各汽车垂直类网站中获取的每个车型各维度数据中的各维度的评价分数均映射到预设区间范围内。

在具体应用中,所述聚类模块23可以利用kmeans算法,对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇。当然,所述聚类模块23可以利用其他聚类算法对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,本实施例并不对其进行限制。

需要说明的是,所述聚类模块23中,获取的每个车型各维度数据中有多少维度信息,可获得多少个汽车车型的聚类簇。

可以理解的是,聚类算法作为一种无监督学习算法,虽然不需要标签信息,但是需要确定聚类算法收敛的超参数(聚类簇个数就是一种)。本实施例中通过使用聚类维度数量的方法来估计聚类簇个数,避免了人为估算由于经验不足导致的不确定性,同时在某种程度上符合一定的自然规律,每个汽车都有擅长的方面,维度相似的车型更容易聚类到一起。

在具体应用中,所述筛选模块24,可以具体用于

获取用户指定的维度信息并确定用户的需求维度(其中用户指定的维度信息中排名靠前的维度信息的权重大于排名靠后的维度信息的权重);根据用户的需求维度,利用第一公式,计算获得的每个聚类簇的维度加权二范数x;选择维度加权二范数最大的聚类簇;

其中,所述第一公式为

wi为本聚类簇中第i个维度的权重,xi为第i个维度在本聚类簇中的平均评价分数值,n为本聚类簇中的维度数量,i=1,...,n。

可以理解的是,用户的需求维度可以理解为用户的喜好类型(如性价比、外观、内饰等),所述筛选模块24实际是根据用户的需求维度进行多维度的筛选(例如可能某一用户比较注重动力和内饰),确定哪一个汽车车型的聚类簇与用户需求信息的匹配度最高。

可以理解的是,所述筛选模块24通过加权二范数的方法来确定哪个聚类簇中的车型是在用户需求下表现最好的簇,同时考虑了用户对不同维度的关注度不同,还有就是可以将多个维度信息,映射到一维进行比较选择。

在具体应用中,在所述排序模块25中,可以利用第二公式,计算所选择的聚类簇中每个车型的加权二范数x';根据计算得到的所选择的聚类簇中每个车型的加权二范数的大小,对聚类簇中的所有车型进行排序;

其中,所述第二公式为

w'j为所选择的聚类簇中第j个车型的权重,x'j为所选择的聚类簇中第j个车型的评价分数值,m为所选择的聚类簇中车型的数量,j=1,...,m。

可以理解的是,利用加权二范数的方法,可以确定同一个聚类簇内部在用户关注的维度信息下各个车型的推荐排序,所述排序结果实际就是满足用户需求的推荐购车列表。

本实施例可以利用两次加权二范数的方法,一次是在选择具体哪一个簇是符合用户感兴趣的维度信息。另一次是在选定了簇之后,解决在簇内部如何对不同的车型进行排序的问题。与现有技术相比,本实施例基于聚类的方法将所有维度的值都考虑进去,然后重点考虑用户关注的维度,这种方法符合当今用户越来越苛刻的选购标准。

本实施例的汽车推荐装置,能够为用户提供便捷高效的汽车产品的推荐,克服了现有的需要传统专业人士推荐的弊端,降低了咨询成本,避免了不同的专业人士意见带有一定的主观性的问题;省去了用户需要自学和掌握这些信息的时间成本,用户可以便捷高效的通过获取自己感兴趣方向的汽车推荐列表(汽车车型的推荐排序结果)。

本实施例的汽车推荐装置,可以用于执行前述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。

图3示出了本发明实施例提供的一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器11、存储器12、总线13及存储在存储器12上并可在处理器11上运行的计算机程序;

其中,所述处理器11,存储器12通过所述总线13完成相互间的通信;

所述处理器11执行所述计算机程序时实现上述各方法实施例所提供的方法,例如包括:获取各汽车垂直类网站中每个车型各维度数据,所述各维度数据包括各维度的评价分数;对所述各维度数据进行预处理,以使所述评价分数均分布在预设区间范围内;对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,其中聚类簇个数是根据获取的每个车型各维度数据中的维度信息来确定的;获取用户指定的维度信息,并根据用户指定的维度信息对获得的聚类簇进行筛选;在选择的聚类簇中对聚类簇中的所有车型进行排序,将排序结果展示给用户。

本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例所提供的方法,例如包括:获取各汽车垂直类网站中每个车型各维度数据,所述各维度数据包括各维度的评价分数;对所述各维度数据进行预处理,以使所述评价分数均分布在预设区间范围内;对预处理后的各维度数据进行聚类,获得不同汽车车型的聚类簇,其中聚类簇个数是根据获取的每个车型各维度数据中的维度信息来确定的;获取用户指定的维度信息,并根据用户指定的维度信息对获得的聚类簇进行筛选;在选择的聚类簇中对聚类簇中的所有车型进行排序,将排序结果展示给用户。

本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、装置、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置/系统。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

本发明的说明书中,说明了大量具体细节。然而能够理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本发明并不局限于任何单一的方面,也不局限于任何单一的实施例,也不局限于这些方面和/或实施例的任意组合和/或置换。而且,可以单独使用本发明的每个方面和/或实施例或者与一个或更多其他方面和/或其实施例结合使用。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1