本技术涉及金融科技,应用于金融客户服务项目预测场景中,尤其涉及一种服务项目预测方法、装置、计算机设备及其存储介质。
背景技术:
1、随着金融行业的快速发展,金融公司涉及到的业务范围越来越宽泛,例如宠物生态业务方面。
2、在目前金融公司内,为了挖掘宠物生态潜在客户从而有效获客,需要从用户历史数据中进行分析以筛选出真正潜在客户。以往的研究中,主要以多种标签组合的形式,比如用户是否购买宠物保险、用户是否使用过宠物服务等多种条件进行结合进行潜在客户的筛选。但这种方式忽视了用户的真正服务需求,同时宠物客户样本目前存在有用数据少,且人力缺失等情况,从而造成潜在客户的筛选不准确。
技术实现思路
1、本技术实施例的目的在于提出一种服务项目预测方法、装置、设备及其存储介质,以解决现有技术在进行潜在客户筛选时,由于有用数据少,造成潜在客户筛选不准确的问题。
2、为了解决上述技术问题,本技术实施例提供服务项目预测方法,采用了如下所述的技术方案:
3、一种服务项目预测方法,包括下述步骤:
4、获取用户讨论数据,根据预设的分析策略对所述讨论数据进行分析,获得分析结果;
5、根据所述分析结果和预设的分类标签,对所述讨论数据进行标签化处理,得到第一类别用户和第二类别用户分别对应的已标记讨论数据;
6、根据用户类别将所述已标记讨论数据分别输入预设的数据增强模型进行数据增强处理,获得数据增强结果;
7、将所述第一类别用户对应的已标记讨论数据输入待训练的服务项目预测模型进行训练,获得初步训练的服务项目预测模型;
8、将所述第一类别用户对应的数据增强结果输入所述初步训练的服务项目预测模型进行增强训练,获得训练完成的服务项目预测模型;
9、将所述第二类别用户对应的数据增强结果输入所述训练完成的服务项目预测模型进行分类预测,获得分类预测结果,根据所述分类预测结果,确定所述第二类别用户中所有用户对应的服务项目。
10、进一步的,所述获取用户讨论数据,根据预设的分析策略对所述讨论数据进行分析,获得分析结果的步骤,具体包括:
11、通过预设的抓取工具,从目标平台上获取用户讨论数据,并根据用户区别标识,区分所有用户对应的所述讨论数据;
12、根据所述分析策略对所述讨论数据进行分析,分析所述讨论数据中的服务关键字段,以及所述讨论数据对应的用户所选择的服务项目,得到所述分析结果;
13、所述预设的分类标签包括服务明确型标签和服务未知型标签,所述根据所述分析结果和预设的分类标签,对所述讨论数据进行标签化处理,得到第一类别用户和第二类别用户分别对应的已标记讨论数据的步骤,具体包括:
14、基于用户区别标识,筛选出所有选择了服务项目的用户,构建第一用户列表;
15、根据所述用户区别标识,识别出所述第一用户列表中所有用户分别对应的讨论数据,并设置所述讨论数据的标签为服务明确型标签;
16、整理所述第一类别用户之外的剩余用户,构建第二用户列表;
17、根据所述用户区别标识,识别出所述第二用户列表中所有用户分别对应的讨论数据,并设置所述讨论数据的标签为服务未知型标签;
18、根据所有讨论数据分别对应的标签,得到第一类别用户和第二类别用户分别对应的已标记讨论数据。
19、进一步的,所述数据增强模型包括gpt-2语言生成模型,所述根据用户类别将所述已标记讨论数据分别输入预设的数据增强模型进行数据增强处理,获得数据增强结果的步骤,具体包括:
20、将第一类别用户和第二类别用户分别对应的已标记讨论数据,输入所述gpt-2语言生成模型;
21、根据所述gpt-2语言生成模型和所述用户区别标识,捕获所述第一类别用户中所有用户分别对应的讨论数据的语言文本结构信息;
22、通过所述语言文本结构信息,提取出所述讨论数据中主题信息和关键词字段;
23、基于所述主题信息、所述关键词字段和所述讨论数据,进行迭代组合,获得新的文本数据,作为所述第一类别用户中所有用户分别对应的数据增强结果;
24、根据所述gpt-2语言生成模型,捕获所述第二类别用户中所有用户分别对应的讨论数据的语言文本结构信息;
25、通过所述语言文本结构信息,提取出所述讨论数据中主题信息和关键词字段;
26、基于所述主题信息、所述关键词字段和所述讨论数据,进行迭代组合,获得新的文本数据,作为所述第二类别用户中所有用户分别对应的数据增强结果。
27、进一步的,所述服务项目预测模型包括基于roberta语言分析和dpcnn神经网络架构的分类模型,所述将所述第一类别用户对应的已标记讨论数据输入待训练的服务项目预测模型进行训练,获得初步训练的服务项目预测模型的步骤,具体包括:
28、步骤501,按照预设比例,将所述第一类别用户中所有用户对应的已标记讨论数据划分为训练数据和测试数据;
29、步骤502,将所述训练数据输入所述基于roberta语言分析和dpcnn神经网络架构的分类模型,进行分类器训练,获得所有服务项目分别对应的分类器;
30、步骤503,将所述测试数据输入所述基于roberta语言分析和dpcnn神经网络架构的分类模型,进行分类测试,获得分类测试结果;
31、步骤504,根据所述分类测试结果和所述测试数据分别对应的用户所选择的服务项目,识别所述分类模型是否训练成功;
32、步骤505,若所述分类模型未训练成功,则调整所述分类模型的超参数,并迭代执行步骤501至步骤504;
33、步骤506,若所述分类模型已训练成功,则停止迭代,获得所述分类模型作为初步训练的服务项目预测模型。
34、进一步的,所述根据所述分类测试结果和所述测试数据分别对应的用户所选择的服务项目,识别所述分类模型是否训练成功的步骤,具体包括:
35、通过所述分类测试结果,统计由所述测试数据分别预测出的服务项目;
36、采用余弦相似度算法,对由所述测试数据分别预测出的服务项目,以及所述测试数据分别对应的用户所选择的服务项目,进行相似度计算,获得相似度;
37、若所述相似度达到预设的置信度值,则所述分类模型训练成功;
38、若所述相似度未达到预设的置信度值,则所述分类模型未训练成功。
39、进一步的,所述将所述第一类别用户对应的数据增强结果输入所述初步训练的服务项目预测模型进行增强训练,获得训练完成的服务项目预测模型的步骤,具体包括:
40、步骤601,根据所述第一类别用户中所有用户分别所选择的服务项目,获得所述第一类别用户中所有用户分别对应的实际服务项目;
41、步骤602,将所述第一类别用户中所有用户分别对应的数据增强结果输入所述初步训练的服务项目预测模型,进行增强训练,获得增强训练结果;
42、步骤603,通过解析所述增强训练结果,获得所有数据增强结果分别对应的预测服务项目;
43、步骤604,基于预设的相似度算法,计算所述实际服务项目和所述预测服务项目之间的相似度,并判断所述相似度是否达到预设的相似度阈值;
44、步骤605,若所述相似度未达到所述相似度阈值,则调整所述服务项目预测模型的超参数,并迭代执行步骤602至步骤604;
45、步骤606,若所述相似度达到所述相似度阈值,则停止迭代,获得训练完成的服务项目预测模型,得到所有服务项目分别与所述数据增强结果间的对应关系,作为服务项目与数据增强结果间的关系知识图谱。
46、进一步的,所述将所述第二类别用户对应的数据增强结果输入所述训练完成的服务项目预测模型进行分类预测,获得分类预测结果,根据所述分类预测结果,确定所述第二类别用户中所有用户对应的服务项目的步骤,具体包括:
47、将所述第二类别用户中所有用户分别对应的数据增强结果输入所述训练完成的服务项目预测模型;
48、根据所述关系知识图谱,进行分类预测,获得分类预测结果;
49、通过解析所述分类预测结果,获得所述数据增强结果分别对应的预测服务项目;
50、基于所述预测服务项目,确定所述第二类别用户中所有用户对应的服务项目。
51、为了解决上述技术问题,本技术实施例还提供服务项目预测装置,采用了如下所述的技术方案:
52、一种服务项目预测装置,包括:
53、用户讨论数据分析模块,用于获取用户讨论数据,根据预设的分析策略对所述讨论数据进行分析,获得分析结果;
54、标签化处理模块,用于根据所述分析结果和预设的分类标签,对所述讨论数据进行标签化处理,得到第一类别用户和第二类别用户分别对应的已标记讨论数据;
55、数据增强处理模块,用于根据用户类别将所述已标记讨论数据分别输入预设的数据增强模型进行数据增强处理,获得数据增强结果;
56、模型初步训练模块,用于将所述第一类别用户对应的已标记讨论数据输入待训练的服务项目预测模型进行训练,获得初步训练的服务项目预测模型;
57、模型增强训练模块,用于将所述第一类别用户对应的数据增强结果输入所述初步训练的服务项目预测模型进行增强训练,获得训练完成的服务项目预测模型;
58、模型分类预测模块,用于将所述第二类别用户对应的数据增强结果输入所述训练完成的服务项目预测模型进行分类预测,获得分类预测结果,根据所述分类预测结果,确定所述第二类别用户中所有用户对应的服务项目。
59、为了解决上述技术问题,本技术实施例还提供一种计算机设备,采用了如下所述的技术方案:
60、一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现上述所述的服务项目预测方法的步骤。
61、为了解决上述技术问题,本技术实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
62、一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上述所述的服务项目预测方法的步骤。
63、与现有技术相比,本技术实施例主要有以下有益效果:
64、本技术实施例所述服务项目预测方法,通过获取用户讨论数据,进行分析,根据分析结果对所述讨论数据进行标签化处理,得到第一类别用户和第二类别用户分别对应的已标记讨论数据;对已标记讨论数据进行数据增强处理,获得数据增强结果;将所述第一类别用户对应的已标记讨论数据输入待训练的服务项目预测模型进行训练,获得初步训练的服务项目预测模型;将所述第一类别用户对应的数据增强结果输入所述初步训练的服务项目预测模型进行增强训练,获得训练完成的服务项目预测模型;将第二类别用户对应的数据增强结果输入服务项目预测模型,进行分类预测,确定第二类别用户中所有用户对应的服务项目。通过服务项目明确型用户的讨论数据和增强数据,训练出服务项目预测模型,输入服务项目未知型用户的讨论数据对应的数据增强结果,预测出服务项目未知型用户的金融服务项目,便于金融行业准确的进行客户挖掘和预测。