汽车配件价格预测方法、系统、设备与可读存储介质与流程

文档序号:25882498发布日期:2021-07-16 18:49阅读:119来源:国知局
汽车配件价格预测方法、系统、设备与可读存储介质与流程

1.本申请涉及数据分析技术领域,尤其涉及一种汽车配件价格预测方法、系统、设备与可读存储介质。


背景技术:

2.随着汽车配件市场的发展,越来越多的汽车配件价格存在信息不透明、层级众多、流通各环节难以监控监管等问题。现有技术中对价格的确定获取到的数据较少,且根据获取到的数据进行简单的数学运算就确立价格。然而,在实际应用场景中存在多种影响汽车配件的价格确定的因素,汽车配件的价格会随着各种影响因素周期性波动,无法准确快速的确立价格。


技术实现要素:

3.本申请提出一种汽车配件价格预测方法、系统、设备与可读存储介质,能够解决现有技术中汽车价格难以预测的问题。
4.为实现上述目的,本申请提供一种汽车配件价格预测方法,所述方法包括:
5.采集目标汽车配件的原始交易数据集;
6.对所述原始交易数据集进行清洗,得到有效交易数据集;
7.根据预设的解析规则从所述有效交易数据集中解析出影响所述目标汽车配件的交易价格的关键设计特征,其中,所述关键设计特征包括交易属性、配件属性和环境属性中的至少一项非价格交易要素;
8.从所述有效交易数据集中提取包括所述关键设计特征的交易数据集作为训练数据集,并将所述训练数据集对预设的初始预测模型进行训练,得到价格预测模型;
9.利用所述价格预测模型预测所述目标汽车配件的当前价格。
10.进一步地,所述采集目标汽车配件的原始交易数据集包括:
11.通过网络爬虫方式从预设的第三方数据平台爬取汽车配件信息,并从所述汽车配件信息中提取出汽车配件的交易数据存储到所述原始交易数据集,其中,所述第三方数据平台包括汽车配件交易平台和汽车配件资讯平台。
12.进一步地,所述对所述原始交易数据集进行清洗,得到有效交易数据集包括:
13.根据预设的过滤规则对所述原始交易数据集进行过滤得到所述有效交易数据集,所述过滤规则包括去除所述原始交易数据集中的异常交易数据,所述异常交易数据包括交易要素缺失或乱码的交易数据及交易价格高于或低于所述原始交易数据交易价格平均数的预设倍数的交易数据。
14.进一步地,所述根据预设的解析规则从所述有效交易数据集中解析出影响所述目标汽车配件的交易价格的关键设计特征包括:
15.通过文字识别技术识别出所述有效交易数据集中每一条交易数据的交易价格和非价格交易要素;
16.采用灰色系统理论模型和时间序列模型找出对所述交易价格产生影响的非价格交易要素,作为所述关键设计特征。
17.进一步地,所述从所述有效交易数据集中提取包括所述关键设计特征的交易数据集作为训练数据集,并将所述训练数据集对预设的初始预测模型进行训练,得到价格预测模型包括:
18.获取所述有效交易数据集中包括所述关键设计特征的交易数据作为训练数据集,其中,所述交易数据包括所述非价格交易要素与符合所述非价格交易要素的配件价格数据,所述交易数据为所述训练数据集中的任一条交易数据;
19.将所述训练数据集中的所述交易数据随机分为训练样本数据集和验证样本数据集;
20.根据所述训练样本数据集中的交易数据对所述初始预测模型进行训练,得到非价格交易要素模型;
21.根据所述验证样本数据集中的交易数据对所述非价格交易要素模型进行验证,并根据验证结果修正所述非价格交易要素模型,得到所述价格预测模型。
22.进一步地,所述根据所述验证样本数据集中的交易数据对所述非价格交易要素模型进行验证,并根据验证结果修正所述非价格交易要素模型,得到所述价格预测模型包括:
23.将所述训练样本数据集中所述目标汽车配件的非价格交易要素输入所述初始预测模型中得到预测价格;
24.根据所述配件价格数据中的交易价格和所述预测价格对所述初始预测模型进行模型纠正,得到所述非价格交易要素模型,所述模型纠正包括调整所述非价格交易要素在所述初始预测模型中所占的权重。
25.进一步地,所述初始预测模型包括第一初始模型、第二初始模型和第三初始模型,所述将所述训练数据集对预设的初始预测模型进行训练,得到价格预测模型包括:
26.当所述训练数据集的数据量小于第一预设值时,将所述训练数据集输入到所述第一初始模型执行训练以得到所述价格预测模型,所述第一初始模型的预设算法为所述交易数据的众数或均值;
27.当所述训练数据集的数据量大于第一预设值并小于第二预设值时,将所述训练数据集输入到所述第二初始模型执行训练以得到所述价格预测模型,所述第二初始模型的预设算法为线性回归;
28.当所述训练数据集的数据量大于第二预设值时,将所述训练数据集输入到所述第三初始模型执行训练以得到所述价格预测模型,所述第三初始模型的预设算法为通过线性回归算法预测出一个第一基础价格,用极端梯度提升算法预测出一个第二基础价格,再对所述第一基础价格和所述第二基础价格取均值。
29.为实现上述目的,本申请提供一种汽车配件价格预测系统,所述系统包括:
30.采集模块,用于采集目标汽车配件的原始交易数据集;
31.数据清洗模块,用于对所述原始交易数据集进行清洗,得到有效交易数据集;
32.解析模块,用于根据预设的解析规则从所述有效交易数据集中解析出影响所述目标汽车配件的交易价格的关键设计特征,其中,所述关键设计特征包括交易属性、配件属性和环境属性中的至少一项非价格交易要素;
33.提取模块,用于从所述有效交易数据集中提取包括所述关键设计特征的交易数据集作为训练数据集,并将所述训练数据集对预设的初始预测模型进行训练,得到价格预测模型;
34.价格预测模块,用于利用所述价格预测模型预测所述目标汽车配件的当前价格。
35.为实现上述目的,本申请提供了一种计算机设备,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的汽车配件价格预测方法的步骤。
36.为实现上述目的,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上所述的汽车配件价格预测方法的步骤。
37.相较于现有技术,本发明所提出的一种汽车配件价格预测方法、系统、设备与可读存储介质,基于关键设计特征产生初始预测模型,再根据关键设计特征的对预测初始模型进行训练形成价格预测模型,该价格预测模型会根据输入的非价格交易要素进行适当调整,具有灵活性,产生的价格预测也更准确。
附图说明
38.图1为本发明汽车配件价格预测方法实施例一的流程图。
39.图2为本发明汽车配件价格预测方法实施例一中步骤s140的流程图。
40.图3为本发明汽车配件价格预测方法实施例一中步骤s160的第一实施例的流程图。
41.图4为本发明汽车配件价格预测方法实施例一中步骤s163的流程图。
42.图5为本发明汽车配件价格预测方法实施例一中步骤s160的第二实施例的流程图。
43.图6为本发明汽车配件价格预测系统实施例二的程序模块示意图。
44.图7为本发明计算机设备实施例三的硬件结构示意图。
具体实施方式
45.为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
46.需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
47.实施例一
48.参阅图1,示出了本发明实施例一之汽车配件价格预测方法的步骤流程图。可以理
解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备2为执行主体进行示例性描述,计算机设备2可以作为手机、平板、便携设备、pc机、服务器或其他电子设备。具体如下。
49.步骤s100,采集目标汽车配件的原始交易数据集。
50.在本发明的实施例中,原始交易数据包括目标汽车配件的交易价格、交易地址、交易时间等交易要素。收集不同交易平台的针对目标汽车配件的原始交易数据,确保原始交易数据来源的多样性。为了扩大数据收集范围,可以预先确定多个网站平台,比如,根据汽车配件交易数据量的多少,选择包括:百万级量的产险平台、千万级数据量的创配交易平台、万级数据量的企业资源计划平台以及第三方数据公司等不同数量级的网站平台,然后通过后台数据提取和第三方数据平台提供获得汽车目标配件的交易数据。以上平台交易数据均为可获得数据。
51.示例性地,所述步骤s100还包括:
52.通过网络爬虫方式从预设的第三方数据平台爬取汽车配件信息,并从所述汽车配件信息中提取出汽车配件的交易数据存储到所述原始交易数据集,其中,所述第三方数据平台包括汽车配件交易平台和汽车配件资讯平台。
53.在本发明的实施例中,交易数据包括每个数据平台对目标汽车配件的交易时间、汽车配件产地、汽车及汽车配件品牌、汽车配件品质、汽车配件库存情况、维修厂偏好、汽车车型及出厂日期等非价格交易要素。汽车配件资讯平台包括汽车最新资讯平台、汽车配件资讯平台等,汽车配件交易平台包括汽车厂商官网、汽车修理厂商官网等。为了保证信息的合法性,通过该网络爬虫爬取数据的方式不涉及个人或机密信息、符合网站的条款和服务、经所有者许可等。
54.步骤s120,对所述原始交易数据集进行清洗,得到有效交易数据集。
55.在本发明的实施例中,先对采集到的原始交易数据进行有效数据清洗和过来,比如,去除掉格式不合格的数据,以及剔除与价格中位数相差10倍及以上的异常数据,从而得到去除无效配件价格数据的有效交易数据集。
56.示例性地,所述步骤s120还包括:
57.根据预设的过滤规则对所述原始交易数据集进行过滤得到所述有效交易数据集,所述过滤规则包括去除所述原始交易数据集中的异常交易数据,所述异常交易数据包括交易要素缺失或乱码的交易数据及交易价格高于或低于所述原始交易数据交易价格平均数的预设倍数的交易数据。
58.在本发明的实施例中,预设的过滤规则包括:oe码(original equipment,汽配编号)清洗规则与配件价格清洗规则。oe码清洗规则包括:去掉特殊字符,例如:(|\`

[]{}<>()*&%$#@...),小写变大写;根据vin码(车辆识别号码,vehicle identification number)和配件别称反推出oe码,进而对其进行清洗,等。配件价格清洗规则包括:根据历史交易数据,设置价格上下限,超出价格上下限的交易价格则认为是异常交易数据进行清洗;箱线图剔除异常价格;价格矫正,有的交易价格是加税价格或调货价格或带运费价格,所以需要剔除掉税费、调货费、运费等,对其进行矫正,等其他规则。箱线图绘制过程为:先找出一组交易数据的上边缘、下边缘、中位数和两个四分位数;然后,连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间,形成箱体,将箱体外的异常交
易数据进行剔除。
[0059]
步骤s140,根据预设的解析规则从所述有效交易数据集中解析出影响所述目标汽车配件的交易价格的关键设计特征,其中,所述关键设计特征包括交易属性、配件属性和环境属性中的至少一项非价格交易要素。
[0060]
在本发明的实施例中,影响配件价格的因子有:交易地区、交易时间、配件品牌、配件品质、配件库存情况、供应商偏好、维修厂偏好、淡旺季、配件是冷门或热门、汽车品牌、汽车车型、汽车年款等。交易属性包括:交易地区、交易时间等;配件属性包括:配件品牌、配件品质、配件是冷门或热门、汽车品牌、汽车车型、汽车年款等;环境属性包括:配件库存情况、供应商偏好、维修厂偏好等;将这些非价格交易要素因子作为关键设计特征进行提取。
[0061]
示例性地,参阅图2,所述步骤s140还包括:
[0062]
步骤s141,通过文字识别技术识别出所述有效交易数据集中每一条交易数据的交易价格和非价格交易要素;步骤s142,采用灰色系统理论模型和时间序列模型找出对所述交易价格产生影响的非价格交易要素,作为所述关键设计特征。
[0063]
在本发明的实施例中,识别出有效交易数据集中每一条交易数据的交易价格和非价格交易要素,按照预设的格式进行存储,例如按照预设的oe编码进行排序。对有效交易数据集采用灰色系统理论模型gm(1,1)和时间序列模型对有效数据集进行预测,采用累加和累减的方式,将既含有已知信息又含有未知信息的有效数据集中的未知要素弱化,强化已知要素的影响程度,从而实现预测目的,找到能够显著影响配件价格的要素,这些要素即为关键设计特征。能够通过调节不同关键设计特征在数据清理过程中的权重比例,反复调整训练模型,达到准确快速的确定配件价格的技术目的。可以理解为通过灰色系统理论模型将有效数据集变为较有规律,再通过时间序列模型判断其与时间的关系。通过这种预测可以预测出汽车配件的更新换代情况,比如淡季或者旺季,从而能更加精准的预测出当前价格。
[0064]
步骤s160,从所述有效交易数据集中提取包括所述关键设计特征的交易数据集作为训练数据集,并将所述训练数据集对预设的初始预测模型进行训练,得到价格预测模型。
[0065]
在本发明的实施例中,通过交易数据集对预设的价格初始模型进行训练,得到可以根据汽车配件的当前的非价格交易要素预测出汽车配件的当前价格的价格预测模型。初始模型可以根据交易数据集中的交易数据的数据量进行调整,以使价格预测更加精确。
[0066]
示例性地,参阅图3,所述步骤s160还包括:
[0067]
步骤s161,获取所述有效交易数据集中包括所述关键设计特征的交易数据作为训练数据集,其中,所述交易数据包括所述非价格交易要素与符合所述非价格交易要素的配件价格数据,所述交易数据为所述训练数据集中的任一条交易数据;步骤s162,将所述训练数据集中的所述交易数据随机分为训练样本数据集和验证样本数据集;步骤s163,根据所述训练样本数据集中的交易数据对所述初始预测模型进行训练,得到非价格交易要素模型;步骤s164,根据所述验证样本数据集中的交易数据对所述非价格交易要素模型进行验证,并根据验证结果修正所述非价格交易要素模型,得到所述价格预测模型。
[0068]
在本发明的实施例中,以非价格交易要素为初始预测模型的输入,配件价格数据作为初始预测模型的输入出对初始预测模型进行训练,以得到可以根据汽车配件的非价格交易要素输出汽车配件的当前价格的价格预测模型。在进行模型训练时,需要对训练好的
初始预测模型进行验证,以使价格预测模型输出的当前价格更加精确。在训练前先将训练数据集随机分为训练样本数据集和验证样本数据集,训练样本数据集用于对初始预测模型进行训练,得到非价格交易要素模型。验证样本数据集用于对非价格交易要素模型进行验证,根据验证结果调整非价格交易要素模型中各非价格交易要素的权值占比,调整好后得到价格预测模型。非价格交易要素模型训练好后,验证预测结果时,也可从mse(均方误差)、r2(决定系数)等多个评估指标对模型结果进行全面评估。
[0069]
示例性地,参阅图4,所述步骤s163包括:
[0070]
步骤s163a,将所述训练样本数据集中所述目标汽车配件的非价格交易要素输入所述初始预测模型中得到预测价格;步骤s163b,根据所述配件价格数据中的交易价格和所述预测价格对所述初始预测模型进行模型纠正,得到所述非价格交易要素模型,所述模型纠正包括调整所述非价格交易要素在所述初始预测模型中所占的权重。
[0071]
在本发明的实施例中,通过训练样本数据集与初始预测模型训练出非价格交易要素模型。随着时间的变化,汽车行情也会变化,汽车配件的交易价格也会随着变化,采集最近时间段内,例如2021年

2008年内的原始交易数据进行清洗等处理后作为训练数据集,重新构建非价格交易要素模型。
[0072]
示例性地,所述初始预测模型包括第一初始模型、第二初始模型和第三初始模型,参阅图5,所述步骤s160还包括:
[0073]
步骤s160a,当所述训练数据集的数据量小于第一预设值时,将所述训练数据集输入到所述第一初始模型执行训练以得到所述价格预测模型,所述第一初始模型的预设算法为所述交易数据的众数或均值;步骤s160b,当所述训练数据集的数据量大于第一预设值并小于第二预设值时,将所述训练数据集输入到所述第二初始模型执行训练以得到所述价格预测模型,所述第二初始模型的预设算法为线性回归;步骤s160c,当所述训练数据集的数据量大于第二预设值时,将所述训练数据集输入到所述第三初始模型执行训练以得到所述价格预测模型,所述第三初始模型的预设算法为通过线性回归算法预测出一个第一基础价格,用极端梯度提升算法预测出一个第二基础价格,再对所述第一基础价格和所述第二基础价格取均值。
[0074]
在本发明的实施例中,当构建价格预测模型时,根据训练数据集中的交易数据的数据量,选择不同算法作为预测初始模型进行模型的构建。本实施例中设定第一预设值为一千,第二预设值为一万。当数据量小于1000条时,用众数或均值作为预设算法;当数据量大于1000条小于1万条时,用线性回归作为预设算法;当数据量大于1万条时,预设算法为用线性回归预测出一个第一基础价格,用极端梯度提升算法xgboost预测出一个第二基础价格,再对第一基础价格和第二基础价格取均值,求得汽车配件的当前价格。极端梯度提升算法xgboost结合多个弱学习器给出最终的学习结果,弱学习器为线性回归算法或者分类算法(均值或众数),都用回归任务的思想来构建最优价格预测模型。把每个弱学习器的输出结果当成连续值,这样做的目的是可以对每个弱学习器的结果进行累加处理,且能更好的利用损失函数来优化模型。
[0075]
因为实际数据中,根据车型的发售年限、年产量等因素,导致汽车配件的数据量差异较大,如果采用同一种预设算法进行训练,会造成预测结果误差大,所以对训练数据集的数据量进行阶梯式分段,使得价格预测模型输出的价格预测更加准确。
[0076]
步骤s180,利用所述价格预测模型预测所述目标汽车配件的当前价格。
[0077]
在本发明的实施例中,获取目标汽车配件的当前非价格交易要素,将当前非价格交易要素输入至价格预测模型中,以通过价格预测模型输出目标汽车配件的当前价格。基于关键设计特征产生初始模型,再根据关键设计特征的验证性能指标复合形成价格预测模型,该模型会根据输入的待预测配件的商品属性参数、商品所处环境参数进行适当调整,具有灵活性,产生的价格预测也更准确。
[0078]
实施例二
[0079]
请继续参阅图6,示出了本发明汽车配件价格预测系统实施例二的程序模块示意图。在本实施例中,汽车配件价格预测系统20可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述汽车配件价格预测方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述汽车配件价格预测系统20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
[0080]
采集模块200,用于采集目标汽车配件的原始交易数据集。
[0081]
在本发明的实施例中,原始交易数据包括目标汽车配件的交易价格、交易地址、交易时间等交易要素。收集不同交易平台的针对目标汽车配件的原始交易数据,确保原始交易数据来源的多样性。为了扩大数据收集范围,可以预先确定多个网站平台,比如,根据汽车配件交易数据量的多少,选择包括:百万级量的产险平台、千万级数据量的创配交易平台、万级数据量的企业资源计划平台以及第三方数据公司等不同数量级的网站平台,然后通过后台数据提取和第三方数据平台提供获得汽车目标配件的交易数据。以上平台交易数据均为可获得数据。
[0082]
示例性地,所述采集模块200还用于:
[0083]
通过网络爬虫方式从预设的第三方数据平台爬取汽车配件信息,并从所述汽车配件信息中提取出汽车配件的交易数据存储到所述原始交易数据集,其中,所述第三方数据平台包括汽车配件交易平台和汽车配件资讯平台。
[0084]
在本发明的实施例中,交易数据包括每个数据平台对目标汽车配件的交易时间、汽车配件产地、汽车及汽车配件品牌、汽车配件品质、汽车配件库存情况、维修厂偏好、汽车车型及出厂日期等非价格交易要素。汽车配件资讯平台包括汽车最新资讯平台、汽车配件资讯平台等,汽车配件交易平台包括汽车厂商官网、汽车修理厂商官网等。
[0085]
数据清洗模块202,用于对所述原始交易数据集进行清洗,得到有效交易数据集。
[0086]
在本发明的实施例中,先对采集到的原始交易数据进行有效数据清洗和过来,比如,去除掉格式不合格的数据,以及剔除与价格中位数相差10倍及以上的异常数据,从而得到去除无效配件价格数据的有效交易数据集。
[0087]
示例性地,所述数据清洗模块202还用于:
[0088]
根据预设的过滤规则对所述原始交易数据集进行过滤得到所述有效交易数据集,所述过滤规则包括去除所述原始交易数据集中的异常交易数据,所述异常交易数据包括交易要素缺失或乱码的交易数据及交易价格高于或低于所述原始交易数据交易价格平均数的预设倍数的交易数据。
[0089]
在本发明的实施例中,预设的过滤规则包括:oe码(original equipment,汽配编
号)清洗规则与配件价格清洗规则。oe码清洗规则包括:去掉特殊字符,例如:(|\`

[]{}<>()*&%$#@...),小写变大写;根据vin码和配件别称反推出oe码,进而对其进行清洗,等。配件价格清洗规则包括:根据历史交易数据,设置价格上下限,超出价格上下限的交易价格则认为是异常交易数据进行清洗;箱线图剔除异常价格;价格矫正,有的交易价格是加税价格或调货价格或带运费价格,所以需要剔除掉税费、调货费、运费等,对其进行矫正,等等其他规则。箱线图绘制过程为:先找出一组交易数据的上边缘、下边缘、中位数和两个四分位数;然后,连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间,形成箱体,将箱体外的异常交易数据进行剔除。
[0090]
解析模块204,用于根据预设的解析规则从所述有效交易数据集中解析出影响所述目标汽车配件的交易价格的关键设计特征,其中,所述关键设计特征包括交易属性、配件属性和环境属性中的至少一项非价格交易要素。
[0091]
在本发明的实施例中,影响配件价格的因子有:交易地区、交易时间、配件品牌、配件品质、配件库存情况、供应商偏好、维修厂偏好、淡旺季、配件是冷门或热门、汽车品牌、汽车车型、汽车年款等。交易属性包括:交易地区、交易时间等;配件属性包括:配件品牌、配件品质、配件是冷门或热门、汽车品牌、汽车车型、汽车年款等;环境属性包括:配件库存情况、供应商偏好、维修厂偏好等;将这些非价格交易要素因子作为关键设计特征进行提取。
[0092]
示例性地,所述解析模块204还用于:
[0093]
通过文字识别技术识别出所述有效交易数据集中每一条交易数据的交易价格和非价格交易要素;采用灰色系统理论模型和时间序列模型找出对所述交易价格产生影响的非价格交易要素,作为所述关键设计特征。
[0094]
在本发明的实施例中,识别出有效交易数据集中每一条交易数据的交易价格和非价格交易要素,按照预设的格式进行存储,例如按照预设的oe编码进行排序。对有效交易数据集采用灰色系统理论模型gm(1,1)和时间序列模型对有效数据集进行预测,采用累加和累减的方式,将既含有已知信息又含有未知信息的有效数据集中的未知要素弱化,强化已知要素的影响程度,从而实现预测目的,找到能够显著影响配件价格的要素,这些要素即为关键设计特征。可以理解为通过灰色系统理论模型将有效数据集变为较有规律,再通过时间序列模型判断其与时间的关系。通过这种预测可以预测出汽车配件的更新换代情况,比如淡季或者旺季,从而能更加精准的预测出当前价格。
[0095]
提取模块206,用于从所述有效交易数据集中提取包括所述关键设计特征的交易数据集作为训练数据集,并将所述训练数据集对预设的初始预测模型进行训练,得到价格预测模型。
[0096]
在本发明的实施例中,通过交易数据集对预设的价格初始模型进行训练,得到可以根据汽车配件的当前的非价格交易要素预测出汽车配件的当前价格的价格预测模型。初始模型可以根据交易数据集中的交易数据的数据量进行调整,以使价格预测更加精确。
[0097]
示例性地,所述提取模块206还用于:
[0098]
获取所述有效交易数据集中包括所述关键设计特征的交易数据作为训练数据集,其中,所述交易数据包括所述非价格交易要素与符合所述非价格交易要素的配件价格数据,所述交易数据为所述训练数据集中的任一条交易数据;将所述训练数据集中的所述交易数据随机分为训练样本数据集和验证样本数据集;根据所述训练样本数据集中的交易数
据对所述初始预测模型进行训练,得到非价格交易要素模型;根据所述验证样本数据集中的交易数据对所述非价格交易要素模型进行验证,并根据验证结果修正所述非价格交易要素模型,得到所述价格预测模型。
[0099]
在本发明的实施例中,以非价格交易要素为初始预测模型的输入,配件价格数据作为初始预测模型的输入出对初始预测模型进行训练,以得到可以根据汽车配件的非价格交易要素输出汽车配件的当前价格的价格预测模型。在进行模型训练时,需要对训练好的初始预测模型进行验证,以使价格预测模型输出的当前价格更加精确。在训练前先将训练数据集随机分为训练样本数据集和验证样本数据集,训练样本数据集用于对初始预测模型进行训练,得到非价格交易要素模型。验证样本数据集用于对非价格交易要素模型进行验证,根据验证结果调整非价格交易要素模型中各非价格交易要素的权值占比,调整好后得到价格预测模型。非价格交易要素模型训练好后,验证预测结果时,也可从mse(均方误差)、r2(决定系数)等多个评估指标对模型结果进行全面评估。
[0100]
示例性地,所述提取模块206还用于:
[0101]
将所述训练样本数据集中所述目标汽车配件的非价格交易要素输入所述初始预测模型中得到预测价格;根据所述配件价格数据中的交易价格和所述预测价格对所述初始预测模型进行模型纠正,得到所述非价格交易要素模型,所述模型纠正包括调整所述非价格交易要素在所述初始预测模型中所占的权重。
[0102]
在本发明的实施例中,通过训练样本数据集与初始预测模型训练出非价格交易要素模型。随着时间的变化,汽车行情也会变化,汽车配件的交易价格也会随着变化,采集最近时间段内,例如2021年

2008年内的原始交易数据进行清洗等处理后作为训练数据集,重新构建非价格交易要素模型。
[0103]
示例性地,所述初始预测模型包括第一初始模型、第二初始模型和第三初始模型,所述提取模块206还用于:
[0104]
当所述训练数据集的数据量小于第一预设值时,将所述训练数据集输入到所述第一初始模型执行训练以得到所述价格预测模型,所述第一初始模型的预设算法为所述交易数据的众数或均值;当所述训练数据集的数据量大于第一预设值并小于第二预设值时,将所述训练数据集输入到所述第二初始模型执行训练以得到所述价格预测模型,所述第二初始模型的预设算法为线性回归;当所述训练数据集的数据量大于第二预设值时,将所述训练数据集输入到所述第三初始模型执行训练以得到所述价格预测模型,所述第三初始模型的预设算法为通过线性回归算法预测出一个第一基础价格,用极端梯度提升算法预测出一个第二基础价格,再对所述第一基础价格和所述第二基础价格取均值。
[0105]
在本发明的实施例中,当构建价格预测模型时,根据训练数据集中的交易数据的数据量,选择不同算法作为预测初始模型进行模型的构建。本实施例中设定第一预设值为一千,第二预设值为一万。当数据量小于1000条时,用众数或均值作为预设算法;当数据量大于1000条小于1万条时,用线性回归作为预设算法;当数据量大于1万条时,预设算法为用线性回归预测出一个第一基础价格,用极端梯度提升算法xgboost预测出一个第二基础价格,再对第一基础价格和第二基础价格取均值,求得汽车配件的当前价格。
[0106]
因为实际数据中,根据车型的发售年限、年产量等因素,导致汽车配件的数据量差异较大,如果采用同一种预设算法进行训练,会造成预测结果误差大,所以对训练数据集的
数据量进行阶梯式分段,使得价格预测模型输出的价格预测更加准确。
[0107]
价格预测模块208,用于利用所述价格预测模型预测所述目标汽车配件的当前价格。
[0108]
在本发明的实施例中,获取目标汽车配件的当前非价格交易要素,将当前非价格交易要素输入至价格预测模型中,以通过价格预测模型输出目标汽车配件的当前价格。
[0109]
实施例三
[0110]
参阅图7,是本发明实施例三之计算机设备的硬件架构示意图。本实施例中,所述计算机设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图7所示,所述计算机设备2至少包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及汽车配件价格预测系统20。其中:
[0111]
本实施例中,存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。当然,存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如实施例二的汽车配件价格预测系统20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
[0112]
处理器22在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行汽车配件价格预测系统20,以实现实施例一的汽车配件价格预测方法。
[0113]
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述服务器2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将所述服务器2与外部终端相连,在所述服务器2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(intranet)、互联网(internet)、全球移动通讯系统(global system of mobile communication,gsm)、宽带码分多址(wideband code division multiple access,wcdma)、4g网络、5g网络、蓝牙(bluetooth)、wi

fi等无线或有线网络。
[0114]
需要指出的是,图7仅示出了具有部件20

23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
[0115]
在本实施例中,存储于存储器21中的所述汽车配件价格预测系统20还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器22)所执行,以完成本发明。
[0116]
例如,图6示出了所述实现汽车配件价格预测系统20实施例二的程序模块示意图,该实施例中,所述汽车配件价格预测系统20可以被划分为所述采集模块200、所述数据清洗模块202、所述解析模块204、所述提取模块206以及所述价格预测模块208。其中,本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述汽车配件价格预测系统20在所述计算机设备2中的执行过程。所述程序模块200

208的具体功能在实施例二中已有详细描述,在此不再赘述。
[0117]
实施例四
[0118]
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘、服务器、app应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于计算机程序,被处理器执行时实现实施例一的汽车配件价格预测方法。
[0119]
显然,本领域的技术人员应该明白,上述的本申请实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请实施例不限制于任何特定的硬件和软件结合。
[0120]
以上仅为本申请实施例的优选实施例,并非因此限制本申请实施例的专利范围,凡是利用本申请实施例说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请实施例的专利保护范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1