一种关于二手车销售知识的机器学习方法及装置与流程

文档序号:13760894阅读:274来源:国知局
一种关于二手车销售知识的机器学习方法及装置与流程

本发明涉及大数据和机器学习技术领域,尤其涉及一种关于二手车销售知识的机器学习方法及装置。



背景技术:

近年来二手车销售逐步在人们的生活中流行起来,越来越多的人通过店面或者网络平台来购买二手车。

但是,影响二手车销售的因素有很多,比如,车辆的外观、已经行驶的里程,换手的次数和销售价格等都会在不同程度上影响二手车的销售。以二手车的行驶里程来看,例如,一台2010年生产的大众捷达,型号是1.6Ltr.MT,70kW,假定到2016年官方的参考公里数为120000(每年20000公里),而如果该车的实际行驶公里数只有50000,那么,该车的行驶公里数明显少于参考值,在市场上进行销售时,会比较抢手。再例如,一台2013年生产的大众宝来,在市场上进行销售时,价格定位11万,由于定价接近新车,所以在进行销售时比较困难。

可见,单从某一个方面或者单从一辆车的销售情况来看,很难准确的得出影响二手车销售的规则。



技术实现要素:

有鉴于此,本发明实施例的目的在于提供一种关于二手车销售知识的机器学习方法,通过获取二手车的历史数据,并根据其计算二手车的售卖难易度,从而快捷准确的得出影响二手车销售的规则。

第一方面,本发明实施例提供了一种关于二手车销售知识的机器学习方法,包括:获取二手车的历史数据,其中,历史数据包括历史销售价格和累计行驶里程;

根据历史销售价格和累计行驶里程计算二手车的售卖难易度。

结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,步骤根据历史销售价格和累计行驶里程计算二手车的售卖难易度包括:

根据历史销售价格与车辆平均残值的高低关系,确定车辆价格评估参数;

根据累计行驶里程与车辆平均里程数高低关系,确定车辆里程评估参数;

根据车辆价格评估参数和车辆里程评估参数计算二手车的售卖难易度。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,若二手车的历史数据还包括二手车的库龄,则步骤根据历史销售价格和累计行驶里程计算二手车的售卖难易度包括:

根据历史销售价格、累计行驶里程和二手车的库龄,计算二手车的售卖难易度。

结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,步骤根据历史销售价格、累计行驶里程和二手车的库龄,计算二手车的售卖难易度包括:

当库龄少于30天时,判定二手车容易卖出;

当库龄超过30天时,判定二手车不容易卖出。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,步骤根据车辆价格评估参数和车辆里程评估参数计算二手车的售卖难易度包括:

若车辆价格评估参数显示为历史销售价格低于平均残值,且,车辆里程评估参数显示为累计行驶里程少于平均里程数,判断二手车容易卖出。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第五种可能的实施方式,其中,步骤根据车辆价格评估参数和车辆里程评估参数计算二手车的售卖难易度包括:

若车辆价格评估参数显示为历史销售价格高于平均残值,且,车辆里程评估参数显示为累计行驶里程多于平均里程数时,判断二手车不容易卖出。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第六种可能的实施方式,其中,步骤根据车辆价格评估参数和车辆里程评估参数计算二手车的售卖难易度包括:

若车辆价格评估参数显示为历史销售价格等于平均残值,且,车辆里程评估参数显示为累计行驶里程少于平均里程数时,判断二手车容易卖出。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第七种可能的实施方式,其中,步骤根据车辆价格评估参数和车辆里程评估参数计算二手车的售卖难易度包括:

若车辆价格评估参数显示为历史销售价格等于平均残值,且,车辆里程评估参数显示为累计行驶里程等于平均里程数时,判断二手车不容易卖出。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第八种可能的实施方式,其中,步骤根据车辆价格评估参数和车辆里程评估参数计算二手车的售卖难易度包括:

若车辆价格评估参数显示为历史销售价格低于平均残值,且,车辆里程评估参数显示为累计行驶里程等于平均里程数时,判断二手车不容易卖出。

第二方面,本发明实施例提供了二手车价格确定的装置,包括:

历史数据获取装置,用于获取二手车的历史数据,其中,历史数据包括历史销售价格和累计行驶里程;

售卖难易度计算装置,用于根据历史销售价格和累计行驶里程计算二手车的售卖难易度。

本发明实施例提供的一种关于二手车销售知识的机器学习方法及装置,其中,该方法包括:获取二手车的历史数据,其中,历史数据包括历史销售价格和累计行驶里程,根据历史销售价格和累计行驶里程计算二手车的售卖难易度。通过该方法能从二手车销售的历史数据中提炼出影响二手车售卖难易度的因素,而无需人工提供先验知识,快速准确的得出影响二手车售卖难易度的规则。

进一步的,二手车的历史数据还包括二手车的库龄,该方法还包括:根据历史销售价格、累计行驶里程和二手车的库龄,计算二手车的售卖难易度,当库龄少于30天时,判定二手车容易卖出;当库龄超过30天时,判定二手车不容易卖出,从而得到更为细致的二手车售卖难易度的规则。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例所提供的一种关于二手车销售知识的机器学习方法及装置的结构框架图;

图2示出了本发明实施例所提供的一种关于二手车销售知识的机器学习方法及装置的流程图。

主要组件符号说明:

1-历史数据获取装置 2-售卖难易度计算装置

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明的简化描述,而不是指示或暗示所指的装置或组件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。其中,术语“第一位置”和“第二位置”为两个不同的位置。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个组件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

目前,在二手车销售方面存在多种影响因素,例如,二手车已经行驶的里程数、车龄、换手率、市场的供求关系、销售价格、库龄等等,在上述因素中,已经行驶的里程数、销售价格和库龄三个因素对二手车销售的影响尤为重大。但在目前的销售方法中,很少有针对二手车销售方面的机器学习方法。

粗糙集理论是一种数学方法,主要用于处理不精确、模糊和不完备性等问题,在认知科学和人工智能方面尤为重要。粗糙集理论的不确定性是建立在上近似和下近似的概念基础上的。设U为有限非空集合,称为论域。用等价关系集R对离散表示的U进行划分。知识就是R对U划分的结果,表示R的所有等价类类簇。也可以说R是论域U上的等价关系,通常记为U/R。用[X]R表示等价关系R下包含元素的等价类。子集X关于R的下近似是由那些根据已有信息判断肯定属于X的对象所组成最大集合,即:

对于子集X关于R的上近似是由所有与X相交非空的等效类R(X)的并集,即:

本发明将粗糙集理论应用在二手车销售领域,目的是通过分析已有的大量的销售数据,可以提取规则或知识,挖掘出数据的潜在价值。

具体的,本发明提供了一种关于二手车销售知识的机器学习方法及装置,其中,该方法参见图2所示的流程图,具体步骤包括:

S101:获取二手车的历史数据,其中,历史数据包括历史销售价格和累计行驶里程;

获取已经销售的二手车的历史数据,其中,历史数据中包括先前记载二手车销售的诸多因素,例如,历史销售价格、累计行驶里程、库龄、车龄和换手率等。基于先验知识,影响二手车销售的主要因素为销售价格和累计行驶里程。因此,在历史数据中选取历史销售价格和累计行驶里程两个要素。

S102:根据历史销售价格和累计行驶里程计算二手车的售卖难易度;

具体的,根据历史销售价格与车辆平均残值的高低关系,确定车辆价格评估参数;

车辆平均残值是依据出厂价格和贬值的比率确定的,由于,车辆每年都会以一个不同的比率进行贬值。随着车辆的使用,车辆会不断的磨损消耗,伴随车辆性能的下降,车辆的价格也相应的下跌。例如,一辆新车的价格为10万,车辆第一年的贬值的比率为25%,则一年后车辆的价格为7.5万,即第一年车辆的平均残值为7.57万;车辆第二年贬值的比率为40%,则两年后车辆的价格为6万,即第二年车辆的平均残值为6万;第三年的贬值的比率为50%,则三年后车辆的价格是5万,即第三年车辆的平均残值是5万;以此类推,车辆每年都在以不同的比率进行贬值。

根据历史销售价格和销售当年的车辆平均残值的高低关系,来确定车辆价格评估参数。

为了对车辆平均残值进行明确的划分,具体的,依据平均残值将车辆分为三类:

当历史销售价格小于销售当年的车辆平均残值时,记作第一类;

当历史销售价格大于销售当年的车辆平均残值时,记作第二类;

当历史销售价格等于销售当年的车辆平均残值时,记作第三类。

以某二手车销售市场的一组数据为例,其车辆平均残值和历史销售价格的关系参见表1。

表1

则,上述8辆二手车进行分类得到R1{P1,P2,P3},

其中,第一类为P1={1,2,6};

第二类为P2={3,4,7};

第三类为P3={5,8}。

同理,车辆平均里程是按照出厂时间来确定的,以出厂时间为起点,每台车每年都有一个标准的车辆平均里程,随着车辆使用年限的增加,车辆平均里程会逐步递增。例如,一辆车每年的平均行驶20000公里,车辆的平均里程数都在以平均每年20000公里的的速度增加。所以一辆新车第一年行驶的平均里程数是20000公里。到第二年车辆的平均里程数就是40000公里,第三年就是60000公里,以此类推。

根据累计行驶里程与车辆平均里程数的高低关系,确定车辆里程评估参数;

为了能够对车辆平均里程进行明确的考量,具体的,根据累计行驶里程与车辆平均里程数的高低关系,将车辆分为三类:

当累计行驶里程小于车辆平均里程数时,记作第一集合;

当累计行驶里程大于车辆平均里程数时,记作第二集合;

当累计行驶里程等于车辆平均里程数时,记作第三集合。

以表1中的二手车为例,其累计行驶里程和车辆平均里程数的关系参见表2。

表2

对上述8辆车进行分类,得到R2{M1,M2,M3};

其中,第一集合为M1={1,2,5};

第二集合为M2={3,4,7};

第三集合为M3={6,8}。

根据车辆价格评估参数和车辆里程评估参数计算二手车的售卖难易度。即根据上述由车辆平均残值分类而得到的第二类、第三类和第一类,以及,由车辆平均里程数分类而得到的第二集合、第三集合和第一集合分别求取第二类、第三类或第一类中的任一项与第二集合、第三集合或第一集合中的任一项的交集,或者,求取第二类、第三类和第一类中的任意项与第二集合、第三集合或第一集合中的任意项的并集,即通过求交/并运算表达更加丰富的信息。比如:

价格相对较低且行驶公里数较少的汽车:P1∩M1={1,2,6}∩{1,2,5}={1,2}。

二手车的历史数据还包括二手车的库龄,库龄就是待售的二手车从进入销售市场后到卖出之前的累计天数,则步骤根据历史销售价格和累计行驶里程计算二手车的售卖难易度包括:

根据历史销售价格、累计行驶里程和二手车的库龄,计算二手车的售卖难易度。

当库龄少于30天时,判定二手车容易卖出;即二手车从开始售卖到卖出之前的累计天数少于30天时,依据行业内的衡量标准,判定二手车容易卖出。

当库龄超过30天时,判定二手车不容易卖出;即二手车从开始售卖到卖出之前的累计天数超过30天时,依据行业内的衡量标准,判定二手车不容易卖出。

设上述表1和表2的论域U,用等价关系集R对U进行划分(即:R是论域U的等价关系),得出的结果,即知识系统就变成了U/R={{1,2},{3,4,7},{5},{6},{8}}。通过这个知识库得到了下述结果:

若车辆价格评估参数显示为历史销售价格低于平均残值,且,车辆里程评估参数显示为累计行驶里程少于平均里程数,判断二手车容易卖出。

若车辆价格评估参数显示为历史销售价格高于平均残值,且,车辆里程评估参数显示为累计行驶里程多于平均里程数时,判断二手车不容易卖出。

若车辆价格评估参数显示为历史销售价格等于平均残值,且,车辆里程评估参数显示为累计行驶里程少于平均里程数时,判断二手车容易卖出。

若车辆价格评估参数显示为历史销售价格等于平均残值,且,车辆里程评估参数显示为累计行驶里程等于平均里程数时,判断二手车不容易卖出。

若车辆价格评估参数显示为历史销售价格低于平均残值,且,车辆里程评估参数显示为累计行驶里程等于平均里程数时,判断二手车不容易卖出。

当第二类、第三类或第一类中的任一项与第二集合、第三集合或第一集合中的任一项的交集为空,即没有得出符合逻辑的结果时,运用粗糙集理论分别对第二类、第三类或第一类中的任一项求取上近似和下近似,当第二类、第三类或第一类中的任一项上近似和下近似一致时,得出新的规则。或者,分别对第二集合、第三集合或第一集合中的任一项求取上近似和下近似,当上近似和下近似一致时,得出新的规则。即,如果去掉价格因素R1,只保留里程因素R2{{1,2,5},{3,4,7},{6,8}},发现R2在表达‘容易卖出’{1,2,5}上下近似是一致的,既:R(X)=R(X)={1,2,5},所以它能够准确表达“容易卖出”这个概念,即价格低才好卖。

另外,本发明还提供了二手车价格确定的装置,包括:

历史数据获取装置1,用于获取二手车的历史数据,其中,历史数据包括历史销售价格和累计行驶里程;

售卖难易度计算装置2,用于根据历史销售价格和累计行驶里程计算二手车的售卖难易度。

实施例一

获取二手车历史数据中的历史销售价格和累计行驶里程,根据历史销售价格与车辆平均残值的高低关系,确定车辆价格评估参数,根据累计行驶里程与车辆平均里程数高低关系,确定车辆里程评估参数,根据车辆价格评估参数和车辆里程评估参数计算二手车的售卖难易度,即,若车辆价格评估参数显示为历史销售价格低于平均残值,且,车辆里程评估参数显示为累计行驶里程少于平均里程数,判断二手车容易卖出;若车辆价格评估参数显示为历史销售价格高于平均残值,且,车辆里程评估参数显示为累计行驶里程多于平均里程数时,判断二手车不容易卖出;若车辆价格评估参数显示为历史销售价格等于平均残值,且,车辆里程评估参数显示为累计行驶里程少于平均里程数时,判断二手车容易卖出;若车辆价格评估参数显示为历史销售价格等于平均残值,且,车辆里程评估参数显示为累计行驶里程等于平均里程数时,判断二手车不容易卖出;若车辆价格评估参数显示为历史销售价格低于平均残值,且,车辆里程评估参数显示为累计行驶里程等于平均里程数时,判断二手车不容易卖出。

另外,二手车的历史数据还包括二手车的库龄,根据历史销售价格、累计行驶里程和二手车的库龄,计算二手车的售卖难易度,即,当库龄少于30天时,判定二手车容易卖出,当库龄超过30天时,判定二手车不容易卖出。

本实施例提供的一种关于二手车销售知识的机器学习方法及装置,该实施例的技术效果是:通过从二手车销售的历史数据中提炼出影响二手车售卖难易度的因素,而无需人工提供先验知识,快速准确的得出影响二手车售卖难易度的规则,进而可以利用这些规则指导二手车的销售业务。

实施例二

如图1所示,一种关于二手车销售知识的机器学习装置包括:历史数据获取装置1和售卖难易度计算装置2。具体的,历史数据获取装置1,用于获取二手车的历史数据,其中,历史数据包括历史销售价格和累计行驶里程;售卖难易度计算装置2,用于根据历史销售价格和累计行驶里程计算二手车的售卖难易度;根据历史销售价格与车辆平均残值的高低关系,确定车辆价格评估参数,根据累计行驶里程与车辆平均里程数高低关系,确定车辆里程评估参数,根据车辆价格评估参数和车辆里程评估参数计算二手车的售卖难易度,即,若车辆价格评估参数显示为历史销售价格低于平均残值,且,车辆里程评估参数显示为累计行驶里程少于平均里程数,判断二手车容易卖出;若车辆价格评估参数显示为历史销售价格高于平均残值,且,车辆里程评估参数显示为累计行驶里程多于平均里程数时,判断二手车不容易卖出;若车辆价格评估参数显示为历史销售价格等于平均残值,且,车辆里程评估参数显示为累计行驶里程少于平均里程数时,判断二手车容易卖出;若车辆价格评估参数显示为历史销售价格等于平均残值,且,车辆里程评估参数显示为累计行驶里程等于平均里程数时,判断二手车不容易卖出;若车辆价格评估参数显示为历史销售价格低于平均残值,且,车辆里程评估参数显示为累计行驶里程等于平均里程数时,判断二手车不容易卖出。

本实施例提供的二手车价格确定装置,该实施例的技术效果是:通过从二手车销售的历史数据中提炼出影响二手车售卖难易度的因素,而无需人工提供先验知识,快速准确的得出影响二手车售卖难易度的规则,进而可以利用这些规则指导二手车的销售业务。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1