一种二手手机估价方法与流程

文档序号：30328435发布日期：2022-06-08 04:58阅读：669来源：国知局

1.本发明涉及二手手机估价技术领域，尤其涉及一种二手手机估价方法。

背景技术：

2.二手手机作为一种特殊的“电商商品”，因为其“一机一况”的特性比一般电商商品的交易要复杂得多，究其原因是二手手机价格难于准确估计和设定，不但受到手机本身基础配置，如品牌、处理器型号、内存等的影响，还受到使用情况如使用年限、机身受损和维修情况等的影响，甚至新手机价格的变化也会对二手手机价格带来作用。目前国家并没有出台一个评判二手手机资产价值的标准。一些二手手机交易平台和第三方估价平台都从自身的角度建立了一系列估价方法用于评估二手手机资产的价值。传统的二手手机估价主要依靠门店的估价师进行估价，最终确定的价格受到估价师的主观影响大，且没有一个较为客观统一的标准。
3.部分用于二手手机估价的算法较为简单，且许多关键参数仍然需要人为设置，无法有效避免主观性强的问题。一些使用了机器学习的估价算法受到数据噪声影响大，预测价格的相对误差较大，而且对于一些文本数据的编码方式不恰当，实用性并不强。

技术实现要素：

4.本发明的目的是提供一种二手手机估价方法，用于解决：价格受到估价师的主观影响大，且没有一个较为客观统一的标准。
5.为了实现上述目的，本发明采用了如下技术方案：
6.一种二手手机估价方法，包括以下步骤：
7.s1.获取一批二手手机的特征以及成交价格，记为原始数据集；将原始数据集划分为训练集和验证集；
8.s2.数据训练
9.将训练集中的二手手机的价格进行dbscan聚类将训练集划分为n个簇；
10.将二手手机的特征作为输入、将得到的簇作为标签，训练一个深度神经网络，用于预测数据属于哪一个簇；
11.将n个簇的训练集中的二手手机的特征训练出n个添加了高斯噪声的变分自编码器；
12.采用变分自编码器并每个簇的二手手机的特征进行数据降维；
13.如果数据降维后的样本数量大于或等于预设值，则对其进行降采样减少样本数量；如果数据降维后的样本数量小于预设值，则多次将数据降维前的原始数据输入变分自编码器进行重采样，得到编码后的二手手机的特征数据；
14.对于每一簇的编码后的二手手机的特征数据，以二手手机的价格为标签，分别训练出一个xgboost回归模型和一个random forest回归模型，总共训练了n个xgboost回归模型和n个random forest回归模型；
15.s3.回归模型选优
16.将验证集输入深度神经网络，并划分为m个簇；
17.将m个簇的二手手机的特征分别输入到训练出的xgboost回归模型和random forest回归模型，每簇得到两个预测价格，并将每簇得到的两个预测价格与二手手机的价格进行比对，舍弃平均相对误差较大的预测价格对应的回归模型，保留误差较小的回归模型；
18.s4.手机价格预测
19.将待确定价格的二手手机的特征输入神经网络进行软分类，得到该二手手机属于每个簇的概率；
20.将待确定价格的二手手机的特征输入每个簇的变分自编码器进行降维；
21.将待确定价格的二手手机的降维后的特征输入每个簇对应的回归模型，得到每个簇的预测价格；
22.将每个簇的预测价格进行加权，加权系数为属于每个簇的概率，得到最终估价。
23.进一步地，所述二手手机的特征至少包括有一下中的至少一项：
24.手机品牌、手机使用年限、手机型号、手机损坏程度。
25.本发明至少具备以下有益效果：
26.本发明使用dbscan聚类算法而不是人为划分价格档位，能够较为客观地考虑二手手机的价格分布，最终训练的回归模型更有针对性；
27.相比于使用单一的xgboost或者random forest回归算法，本发明通过聚类划分一系列簇，在每一个簇上使用表现最好的模型用于最终的回归，能够根据数据的特点使用准确率更高的模型，降低了预测的误差；
28.通过使用神经网络进行软分类，并通过变分自编码器进行数据降维和数据增强，该发明能够充分利用训练集数据，并能够有效避免由于样本分布不均衡导致的模型准确率下降。最终的回归结果充分考虑了所有簇的回归结果，数据利用率高。
附图说明
29.为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
30.图1为本发明训练集训练过程示意图；
31.图2为本发明验证集模型优选示意图；
32.图3为本发明价格预测示意图。
具体实施方式
33.为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
34.一种二手手机估价方法，包括以下步骤：
35.s1.获取一批二手手机的特征以及成交价格，记为原始数据集；将原始数据集划分
为训练集和验证集；
36.在此，所述二手手机的特征至少包括有一下中的至少一项：手机品牌、手机使用年限、手机型号、手机损坏程度。
37.s2.数据训练
38.将训练集中的二手手机的价格进行dbscan聚类将训练集划分为n个簇；
39.将二手手机的特征作为输入、将得到的簇作为标签，训练一个深度神经网络，用于预测数据属于哪一个簇；
40.将n个簇的训练集中的二手手机的特征训练出n个添加了高斯噪声的变分自编码器；
41.采用变分自编码器并每个簇的二手手机的特征进行数据降维；
42.如果数据降维后的样本数量大于或等于预设值，则对其进行降采样减少样本数量；如果数据降维后的样本数量小于预设值，则多次将数据降维前的原始数据输入变分自编码器进行重采样，得到编码后的二手手机的特征数据；
43.对于每一簇的编码后的二手手机的特征数据，以二手手机的价格为标签，分别训练出一个xgboost回归模型和一个random forest回归模型，总共训练了n个xgboost回归模型和n个random forest回归模型；
44.s3.回归模型选优
45.将验证集输入深度神经网络，并划分为m个簇；
46.将m个簇的二手手机的特征分别输入到训练出的xgboost回归模型和random forest回归模型，每簇得到两个预测价格，并将每簇得到的两个预测价格与二手手机的价格进行比对，舍弃平均相对误差较大的预测价格对应的回归模型，保留误差较小的回归模型；
47.s4.手机价格预测
48.将待确定价格的二手手机的特征输入神经网络进行软分类，得到该二手手机属于每个簇的概率；
49.将待确定价格的二手手机的特征输入每个簇的变分自编码器进行降维；
50.将待确定价格的二手手机的降维后的特征输入每个簇对应的回归模型，得到每个簇的预测价格；
51.将每个簇的预测价格进行加权，加权系数为属于每个簇的概率，得到最终估价。
52.综合上述可知：
53.本发明使用dbscan聚类算法而不是人为划分价格档位，能够较为客观地考虑二手手机的价格分布，最终训练的回归模型更有针对性。相比于使用单一的xgboost或者random forest回归算法，本发明通过聚类划分一系列簇，在每一个簇上使用表现最好的模型用于最终的回归，能够根据数据的特点使用准确率更高的模型，降低了预测的误差。此外，通过使用神经网络进行软分类，并通过变分自编码器进行数据降维和数据增强，该发明能够充分利用训练集数据，并能够有效避免由于样本分布不均衡导致的模型准确率下降。最终的回归结果充分考虑了所有簇的回归结果，数据利用率高。
54.以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是本发明
的原理，在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冯雨橦郑子涛朴世元
技术所有人：冯雨橦
我是此专利的发明人

上一篇：G型密封装置、智能开启装置及多级压裂智能控制系统的制作方法
上一篇：一种连续性稻草打捆机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。