本发明涉及一种基于大数据的预测系统模型与算法,设计一种新的模型参数选择准则,从而提高预测处理的精度与泛化性,从而更好地让企业进行客户管理。
背景技术:
随着信息时代的到来,大数据分析已成为各个领域愈来愈重视与依赖的技术手段。大数据分析主要包括可视化分析、数据挖掘算法、预测分析以及数据质量管理4个方面。其中,从大量数据中提取人们事先不知道的潜在有用信息从而预测事物未来的发展趋势在宏观的经济预测、市场营销、客流量分析、太阳黑子数、月降水量、河流流量、股票价格变动等众多领域得到应用。
目前,企业的观念正逐渐变成以客户为中心,为客户提供有针对性的营销和服务变得越来越重要。特别是随着网络通讯的迅猛发展,企业可收集海量的关于客户的信息和数据,应用这些数据去获得有价值的信息,以对客户购买行为预测,进而对客户关系管理都是企业急需攻克的难题。
大数据环境下,随着企业间的竞争加剧,企业越来越意识到客户购买行为预测的重要性。速鸿科技选择利用改进的决策树模型对客户购买行为进行预测,进而探索大数据环境下的客户管理,这无论对于企业还是社会都有十分重要的意义。
技术实现要素:
本发明提供一种基于大数据的预测系统模型与算法,不只是局限于单纯的分析客户购买行为方面,而是对客户的各方面的信息进行分析,然后对客户进行分类,以帮助企业对客户的购买行为进行预测,能更好,更实际的处理问题。
为了实现上述目的,本发明采用的技术方案如下。
基于大数据的预测系统模型与算法,包括以下步骤。
(1)基于id3的决策树模型构建。建立一个样本数据集,通过一定的方法,把这些数据有效的分类出来,这里要用到信息熵这个概念,最终得到各个属性的信息增益,将信息增益最大的作为根节点进行分类。
(2)算法的优化及优化前后效果比较。id3算法只能从局部最优来考虑,只会考虑每一步下的最优情况。但是,因为很多原因,例如噪音数据的影响等,往往不能得到全局最优,所以引入了属性核的概念来考虑优化问题。比较可以发现,利用id3算法做出的决策树模型会有一个很明显的缺陷,那就是做出的决策树一般高度很大,但是宽度很小,这样会让决策树变得非常的繁杂,而且解读起来也很困难。但是优化后算法做出的决策树兼顾到了决策树的高度和决策树的深度,这样能让使用者更好的理解和解读决策树的结果,因而更能满足企业对客户的购买行为进行预测的现实需要。
与现有技术相比,本发明具有以下有益效果。
(1)本系统可以通过决策树模型做出对客户购买行为的预测,从而更好地让企业进行客户管理。
(2)本系统可以让决策树模型更好更广泛的适用于各类情况,并利用样本数据对改进的决策树的算法进行研究。
(3)本系统在商业上也有着巨大的应用前景,可以通过海量数据来判断客户的开户年数,进而实现对客户的放贷,融资等业务的更好的掌控。
(4)本系统通过大数据预测过程和引入企业营销者主体因素,打开“消费者黑箱”,最后使整个模型形成一个动态的、互动的自反馈系统。
(5)本系统通过案例系统地分析了企业通过大数据可以获取并存储客户的个性化需求,从而重新拥有一对一的客户关系管理优势,从而实现以客户为中心来创造价值。
附图说明
图1为本发明的流程图。
图2为结果的详细解读。