一种基于销售方的网络购物退货预测系统的制作方法

文档序号：11775597阅读：533来源：国知局

本发明属于计算机人工智能信息技术领域，尤其涉及一种基于销售方的网络购物退货预测系统。

背景技术：

消费者目前有好评率、物品销售件数等数据可以参考。这在购物之前，可以作为是否购物的参考依据。如果货物好评率高、销售的件数多，则购买该物品的风险较小。这在一定程度上，避免了消费者的购物损失。消费者退货，如果是第三方物流，需要承担相应的费用；而销售者则需要承担退货成本：(1)销售方需要采用的主要退货审核方式为人工审核方式，这种方式往往具备如下特点：(a)耗时，退货周期过长；(b)耗费人力，需要大量客服人员；(c)判断困难，因为人工判断往往有争议。因此，减少退货率，能够减少消费者、销售方的损失。(2)定损，如果是运输过程中出现的问题，需要与运输方联系；如果是产品本身质量问题，销售方需要与生产厂家联系。与消费者相比，销售者需要承担更多的成本和风险。降低退货率对于销售方至关重要。

将数据挖掘方法引入销售方网络购物退货预测是一种新颖的做法：网络退货由销售方、运输方和消费者三方共同协作完成，在这个过程中，退货平台产生一系列的数据，其中包括：(1)销售方退货理由数据；(2)运输方在发货和退货过程中产生的数据；(3)销售方退货检测获得的产品质量数据、用户购物行为习惯等数据。将退货过程视作一个“黑箱”，只关注输入参数和输出参数的关系，建立和测试针对用户退货行为的数学模型，通过数据挖掘算法实现销售方网络购物退货预测系统。

本专利涉及的系统基于销售方已经积累的海量销售数据使用合适的数据挖掘模型开展数据分析，得到一个销售方网络购物退货预测模型。当用户在购物平台上购买某件产品时，该预测模型基于现有的数据，加上用户本身特定的行为模式，预测该用户针对这件商品的退货率，避免销售方过多的经济损失。另一方面，用户本次的购物行为及结果实时加入到销售数据中，对系统未来修正预测模型做进一步的准备。

通过使用上述技术能使得销售方在网络销售某商品经由某快递运送给某用户之前在一定程度上自动预测该商品的退货率。实现了销售方自动化控制销售风险的目标。

目前已有的论文大多数涉及物流的退货研究，而非快递研究。物流与快递有一定的不同之处，物流一般为企业服务，运送大容积的货物，一般有仓储管理；而快递更多的是为个人服务，运送货物体积相对较小，一般没有仓储管理。而当前针对逆向物流的研究存在如下缺点：(1)都是总体论述，并没有详细讨论多重配送模式下的不同策略。(2)多数文献讨论时采用了论证或者模拟的方法，并没有实地调研的事实数据支撑理论分析。

技术实现要素：

本发明所要解决的技术问题是针对背景技术的不足提供了一种基于销售方的网络购物退货预测系统，其实现自动化预测客户某次购买行为的退货率。

本发明为解决上述技术问题采用以下技术方案

一种基于销售方的网络购物退货预测系统，包含网络购物历史数据存储模块、数据集成模块、数据预处理模块、数据挖掘模块、人机交互界面；

其中，网络购物历史数据存储模块，用于收集和存储网络购物过程中销售方、运输方和消费者的历史痕迹数据；

数据集成模块，用于从异构数据库中提取所需的数据；

数据预处理模块，用于对数据集成模块得到的结果进行预处理；

数据挖掘模块，用于对数据预处理模块得到的结果进行数据挖掘，进而获取系统预测结果。

作为本发明一种基于销售方的网络购物退货预测系统的进一步优选方案，网络购物历史数据存储模块包含销售购物平台数据存储模块和快递公司数据存储模块，所述销售购物平台数据存储模块用于存储销售方和消费者的交互数据，所述快递公司数据存储模块用于存储销售方和消费者的购买和退货快递数据。

作为本发明一种基于销售方的网络购物退货预测系统的进一步优选方案，所述数据集成模块用于获取销售方数据、消费者数据和快递数据。

作为本发明一种基于销售方的网络购物退货预测系统的进一步优选方案，所述数据预处理模块包含数据归约模块、数据清洗模块、数据变换模块；

其中，数据归约模块，用于获取数据集的归约表示；

数据清洗模块，用于进行数据清理：将完整、正确、一致的数据信息存入网络购物历史数据存储模块中；

数据变换模块，用于将数据转换成适用于数据挖掘的形式。

作为本发明一种基于销售方的网络购物退货预测系统的进一步优选方案，通过朴素贝叶斯算法和集成学习算法对数据预处理模块得到的结果。

本发明采用以上技术方案与现有技术相比，具有以下技术效果：

本发明提出的销售方网络购物退货预测系统及其优化方法，可实现对本次消费者某次购物退货的预测；为销售方提供对某次购物结果的预先判断，为商品销售决策提供依据，在一定程度上实现资源配置的整体优化。

附图说明

图1是本系统涉及的电子购物退货流程图；

图2是本系统涉及的销售方网络购物退货预测流程图；

图3是本系统涉及的朴素贝叶斯算法流程图；

图4是本系统涉及的集成学习优化方法流程图。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明：

实施例一

如图1所示，本发明基于现代电子购物退货流程。网络购物涉及到消费者、运输方、销售方和生产商。其中，消费者、运输方和销售方构成了主要的数据来源。由于目前电商平台和快递公司缺乏统一的信息规划，各信息管理系统开发的时间和来源不一致，采用的开发平台、数据结构和数据库管理系统也各不相同，造成了各系统间相互独立，信息无法交流和融合，逐渐形成了“信息孤岛”。这里需要使用一种多源异构数据库数据融合方法，实现三方信息的交互和共享，提供一个安全可靠、高质量的信息化服务。为进一步开展数据挖掘工作提供保障。

如图2所示，本发明揭示了一种销售方网络购物退货预测系统，用以预测某次销售退货的概率；其包括：网络购物历史数据仓库、数据集成模块、数据预处理模块、数据挖掘模块和决策支持模块。以下具体介绍各模块。

网络购物历史数据仓库是一个分布式异构数据库环境，其中主要包含两个数据库：(1)销售购物平台数据仓库，该数据库中包含了销售方和消费者的交互数据；(2)快递公司数据仓库，该数据库中包含了销售方和消费者的购买和退货快递数据。

数据集成模块主要是从异构数据库中提取所需的数据，它们包括：(1)销售方数据；(2)消费者数据；(3)快递数据。

数据预处理模块针对数据集成模块得到的结果进行三方面的操作，它们包括：(1)数据规约；(2)数据清洗；(3)数据变换。

数据挖掘模块针对数据预处理模块得到的结果开展数据挖掘算法，其中典型的包括朴素贝叶斯算法如图3所示和集成学习算法如图4所示。

决策支持模块在数据挖掘的基础上，提供人机交互的可视化解决方案，并为企业的crm提供管理层决策支持。

如图3所示，本发明采用的销售方网络购物退货预测算法为朴素贝叶斯算法。其中，xi为销售方、运输方和消费者影响退货的原因。虽然退货由消费者发起，但是影响其退货率的因素主要由三个方面产生：消费者、销售方、运输方。涉及不同的异构数据库系统。

从消费者而言，退货的主要因素主要列举如下：(1)冲动购物，如商家集中打折销售活动等；(2)法律规定七天内无条件退货，退货代价较小；(3)部分自营平台退货方便，零成本退货；(4)有组织、有预谋的恶意退货。这些退货有可能是集中式的，也有可能是分布式协同方式的。除此以外，消费者退货还受到季节、个人无法预测的其它因素的影响。

从销售方而言，退货的主要因素主要列举如下：(1)商品质量问题；(2)商家标注的尺码存在问题，购买的商品偏大或偏小；(3)商家的虚假宣传，实物与图片描述不符；(4)商家发错货；

从运输方而言，主要是运送货物中途发生：(1)货物丢失；(2)货物损坏；(3)物流配送缓慢等。其中，商品质量问题是由销售方和生产商协作完成。

当然，上述原因还不能完全概括所有的退货理由。

给定某个用户在某个时间购买某个商品的退货率为c。由于朴素贝叶算法假定各项特征条件独立，在本系统中，既假定退货涉及的销售方、运输方和消费者彼此特征条件独立，也假定销售方内部影响退货的各个特征条件彼此独立。

由上述论述得知，对于所有的xi、xj而言，有xi⊥xj|c。计算某次购物的退货概率的计算公式为：

其中p(c)和p(xi|c)由数据库中现有的数据计算而来。

以上介绍了本发明的销售方网络购物退货预测系统，本发明在揭示上述系统的同时，还揭示了上述系统的优化方法；如图4所示，所述方法包括如下步骤：

所述优化方法采用集成学习方法。

本改进方法中采用投票法。假设预测类别是{c1,c2}，其中c1表示顾客本次购买行为会退货，而c2表示顾客本次购买行为不会退货。对于任意一个预测样本x，系统中假定有t个学习器h1～ht，典型的学习器包括朴素贝叶斯算法、决策树算法等。假定t个弱学习器的预测结果分别是(h1(x),h2(x)...ht(x))。

图4的投票法采用相对多数投票法，即t个弱学习器的对样本x的预测结果中，数量最多的类别ci为最终的分类类别。如果不止一个类别获得最高票，则随机选择一个作为最终类别。

综上所述，本发明提出的销售方网络购物退货预测系统及其优化方法，可实现自动对某个消费者某次购物的退货概率预测；为企业crm提供相应的数据支持。企业可以通过数据分析研判某商品的销售情况，增加或减少网络销售货物的种类。提升企业效率的整体优化。

本发明主要通过收集网络购物历史数据仓库，提取销售购物平台数据仓库及快递公司数据仓库中的历史数据，以获取销售方、消费者以及快递公司的三方数据，通过数据预处理，应用数据挖掘方法，得到结果，为企业决策提供数据支持。该发明具有：(1)坚实的数学基础；(2)稳定的分类效率；(3)所需估计的参数很少，对缺失数据不太敏感；(4)算法较简单。优化算法使用多个学习器来解决同一个问题，能够显著地提高学习系统的泛化能力。所采取的技术手段主要在数据挖掘阶段，其包括：应用朴素贝叶斯算法预测网络购物退货概率；优化方法采用集成学习方法。

本发明并不限于上述实施方式，采用与本发明上述实施例相同或近似的体系结构和算法，而得到的其他软硬件设计，均在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘志鹏;朱鹏飞
技术所有人：南京邮电大学
我是此专利的发明人

上一篇：一种经销商客户资源再循环管理系统及其方法与流程
上一篇：智能支付牌及系统的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。