潜在客户识别和预测的方法、装置、电子设备及存储介质与流程

文档序号：37681250发布日期：2024-04-18 20:54阅读：16来源：国知局

本发明涉及通信领域，具体而言，涉及一种用于智能通信服务产品潜在客户识别和预测的方法、装置、电子设备及存储介质。

背景技术：

1、对于通信运营商来说，如果能够及时准确识别或预测智能通信服务产品的潜在客户，则对智能通信服务产品的推广具有重要意义。

2、传统的客户挖掘技术多依赖于分公司一线营销人员经验，可能存在数据老旧、数据割裂、数据质量不高、挖掘效率低等问题。目前，市面上存在仅通过面板数据进行智能通信服务产品潜在客户预测，但同时存在的忽略客户与时间相关影响因素的干扰问题。

3、因此，亟需研发一种用于智能通信服务产品潜在客户识别和预测的方法，解决传统智能通信服务产品潜在客户挖掘技术的局限性，提高客户挖掘的效率和精度，实现高效、准确地识别和预测潜在客户，提高潜在客户识别的精度和通信服务产品的竞争力，降低客户挖掘成本，并适应大规模数据处理的需求。

技术实现思路

1、本发明要解决的技术问题是统智能通信服务产品潜在客户挖掘技术的局限性，如何提高客户挖掘的效率和精度，提高潜在客户识别的精度和通信服务产品的竞争力，降低客户挖掘成本，并适应大规模数据处理的需求。

2、为解决上述技术问题，根据本发明的一个方面，提供一种潜在客户识别和预测的方法，其包括如下步骤：s1、数据收集和处理，从多渠道收集智能通信服务产品关于潜在客户的数据，数据包括：通信行为数据、智能通信产品偏好及消费数据、手机应用偏好及使用行为数据，并对数据进行清洗、整合和标准化为原始数据集，以便后续模型使用；s2、数据特征提取，利用lstm(long short-term memory，长短期记忆网络)提取时间序列数据中的特征，包括客户的通信行为特征、消费行为特征、手机软件使用行为特征；lstm神经网络通过捕捉时间序列数据中的长期依赖关系和特征，对这些数据进行有效建模；输出结果为购买模式或行为模式的预测结果，使用预测结果作为特征生成新的特征集，新的特征用于描述客户的潜在购买意愿；s3、特征选择和优化，利用xgboost(extreme gradient boosting，极端梯度提升)算法对lstm提取的时序特征进行选择和优化以提高模型的预测精度和泛化能力；s4、并行计算和分布式存储，利用spark(一个大规模数据处理工具)分布式计算引擎对处理后的数据进行并行计算和分布式存储，以提高计算效率和存储能力；s5、潜在客户识别，根据提取的特征、选择的特征和训练的模型，利用xgboost算法对真实的待识别的潜在客户数据集进行训练、分类和识别，将客户分为潜在客户和非潜在客户两类，然后利用xgboost算法对模型进行训练和预测，从而实现潜在客户的准确识别。

3、根据本发明的实施例，潜在客户识别和预测的方法还可包括步骤：s6、结果分析和应用，根据模型的预测结果，对潜在客户进行分析和应用，将潜在客户分为不同的等级，针对不同等级的潜在客户提供不同的产品和服务；同时，利用模型结果对不同智能通信服务产品的营销策略进行调整和优化。

4、根据本发明的实施例，步骤s2中，lstm的计算公式可包括如下步骤：

5、s21、决定丢弃信息，lstm中的第一步是决定我们会从细胞状态中丢弃什么信息，这个决定通过一个称为忘记门层完成，该门会读取ht-1和xt，输出一个在0到1之间的数值给每个在细胞状态ct-1中的数字；1表示“完全保留”，0表示“完全舍弃”，具体计算公式为ft＝σ(wf·[ht-1，xt]+bf)；

6、s22、确定更新的信息，确定什么样的新信息被存放在细胞状态中；这里包含两个部分：sigmoid层称“输入门层”决定什么值将要更新，一个tanh层创建一个新的候选值向量会被加入到状态中；具体计算公式为：

7、it＝σ(wi·[ht-1，xt]+bi)

8、

9、s23、更新细胞状态，将ct-1更新为ct，具体计算公式为：

10、

11、s24、输出信息，确定输出什么值，这个输出将会基于我们的细胞状态，但是也是一个过滤后的版本；首先，我们运行一个sigmoid层来确定细胞状态的哪个部分将输出出去；接着，我们把细胞状态通过tanh进行处理，得到一个在-1到1之间的值，并将它和sigmoid门的输出相乘，最终我们仅仅会输出我们确定输出的那部分，具体计算公式为：

12、ot＝σ(w[ht-1，xt]+bo)

13、ht＝ot*tanh(ct)

14、其中，ft表示遗忘门限，it表示输入门限，表示前一时刻cell状态、表示cell状态，这里为循环发生处，ot表示输出门限，ot表示当前单元的输出，ht-1表示前一时刻单元的输出。

15、根据本发明的实施例，步骤s3中特征选择和优化具体步骤为：

16、先将上一步中生成的模型样本特征集80％随机划为训练集，20％划为验证集；

17、然后利用xgboost算法对训练集中lstm神经网络提取的长期时间特征进行选择和优化，将客户长期通信行为、消费习惯等带来的影响纳入于模型建模过程中，以提高模型的预测精度和泛化能力；

18、xgboost算法通过贪心算法(每次尝试分裂一个叶节点，计算分裂后的增益然后选择增益最大的)和梯度提升决策树(gbdt，gradient boosting decision tree)的原理，对特征进行选择和优化，筛选出对预测目标影响较大的特征，通过调整xgboost的参数，参数包括学习率、树深度、正则化参数，以获得最佳的特征选择和模型性能；

19、最后利用验证集数据输入训练完的xgboost模型，得到预测结果后，通过使用不同的评估指标来衡量模型的性能，通过包括准确率、召回率、f1分数、auc-roc的评估指标来进行验证。

20、根据本发明的实施例，步骤s4中并行计算、分布式存储和模型部署，将上一步中完成训练和验证后的可用模型及数据处理程序部署于具有spark分布式计算引擎的大数据平台上，利用spark分布式计算引擎对处理后的数据进行并行计算和分布式存储，以提高计算效率和存储能力；spark分布式计算引擎将数据分配到多个节点上进行处理，从而实现并行计算，同时可以利用其分布式存储的特性，将数据存储在多个节点上，以提高存储能力。

21、根据本发明的第二个方面，提供一种潜在客户识别和预测的装置，其包括：数据收集和处理模块，用于从多渠道收集智能通信服务产品关于潜在客户的数据，数据包括：通信行为数据、智能通信产品偏好及消费数据、手机应用偏好及使用行为数据，并对数据进行清洗、整合和标准化为原始数据集，以便后续模型使用；数据特征提取模块，用于利用lstm提取时间序列数据中的特征，包括客户的通信行为特征、消费行为特征、手机软件使用行为特征；lstm神经网络通过捕捉时间序列数据中的长期依赖关系和特征，对这些数据进行有效建模；输出结果为购买模式或行为模式的预测结果，使用预测结果作为特征生成新的特征集，新的特征用于描述客户的潜在购买意愿；特征选择和优化模块，用于利用xgboost算法对lstm提取的时序特征进行选择和优化以提高模型的预测精度和泛化能力；并行计算和分布式存储模块，用于利用spark分布式计算引擎对处理后的数据进行并行计算和分布式存储，以提高计算效率和存储能力；潜在客户识别模块，用于根据提取的特征、选择的特征和训练的模型，利用xgboost算法对真实的待识别的潜在客户数据集进行训练、分类和识别，将客户分为潜在客户和非潜在客户两类，然后利用xgboost算法对模型进行训练和预测，从而实现潜在客户的准确识别。

22、根据本发明的实施例，潜在客户识别和预测的装置还可包括：结果分析和应用模块，用于根据模型的预测结果，对潜在客户进行分析和应用，将潜在客户分为不同的等级，针对不同等级的潜在客户提供不同的产品和服务；同时，利用模型结果对不同智能通信服务产品的营销策略进行调整和优化。

23、根据本发明的实施例，数据特征提取模块中lstm的计算公式可包括如下步骤：

24、决定丢弃信息，lstm中的第一步是决定我们会从细胞状态中丢弃什么信息，这个决定通过一个称为忘记门层完成，该门会读取ht-1和xt，输出一个在0到1之间的数值给每个在细胞状态ct-1中的数字；1表示“完全保留”，0表示“完全舍弃”，具体计算公式为ft＝σ(wf·[ht-1，xt]+bf)；

25、确定更新的信息，确定什么样的新信息被存放在细胞状态中；这里包含两个部分：sigmoid层称“输入门层”决定什么值将要更新，一个tanh层创建一个新的候选值向量会被加入到状态中；具体计算公式为：

26、it＝σ(wi·[ht-1，xt]+bi)

27、

28、更新细胞状态，将ct-1更新为ct，具体计算公式为：

29、

30、输出信息，确定输出什么值，这个输出将会基于我们的细胞状态，但是也是一个过滤后的版本；首先，我们运行一个sigmoid层来确定细胞状态的哪个部分将输出出去；接着，我们把细胞状态通过tanh进行处理，得到一个在-1到1之间的值，并将它和sigmoiid门的输出相乘，最终我们仅仅会输出我们确定输出的那部分，具体计算公式为：

31、ot＝σ(w[ht-1，xt]+bo)

32、ht＝ot*tanh(ct)

33、其中，ft表示遗忘门限，it表示输入门限，表示前一时刻cell状态、表示cell状态，这里为循环发生处，ot表示输出门限，ot表示当前单元的输出，ht-1表示前一时刻单元的输出。

34、根据本发明的第三个方面，提供一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的潜在客户识别和预测程序，潜在客户识别和预测程序被处理器执行时实现上述的潜在客户识别和预测方法的步骤。

35、根据本发明的第四个方面，提供一种计算机存储介质，其中，计算机存储介质上存储有潜在客户识别和预测程序，潜在客户识别和预测程序被处理器执行时实现上述的潜在客户识别和预测方法的步骤。

36、与现有技术相比，本发明的实施例所提供的技术方案至少可实现如下有益效果：

37、本发明通过结合深度学习、集成学习和分布式计算的优点，能够提高客户挖掘的效率和精度解决传统客户挖掘技术的局限性，能够解决传统的客户挖掘技术多依赖于分公司一线营销人员经验，而存在数据老旧、数据割裂、数据质量不高、挖掘效率低等问题。

38、本发明通过通过结合lstm和xgboost算法，能够更加准确地预测和识别潜在客户的行为和需求，提高潜在客户识别的精度，从而提高营销的精准度和效果。

39、本发明通过使用智能通信服务产品潜在客户识别的方法，电信企业可以更好地理解客户需求，提供个性化的智能通信产品和服务，从而提升通信服务产品的竞争力。

40、本发明能够为不具备相应平台和能力的分公司一线营销提供强有力的支撑，降低电信企业在客户挖掘方面的人力、时间和资金投入，提高企业的营销效率和降低成本，降低客户挖掘成本。

41、本发明通过结合spark分布式计算引擎，能够适应大规模数据处理需求，实现高效、准确地处理和分析大规模数据，满足现代通信服务企业的需求。

42、从而解决传统智能通信服务产品潜在客户挖掘技术的局限性，提高潜在客户识别的精度和通信服务产品的竞争力，降低客户挖掘成本，并适应大规模数据处理的需求。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陶宇超,王华超,顾清
技术所有人：号百信息服务有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。