一种营销响应模型构建方法、设备及介质与流程

文档序号：28300386发布日期：2021-12-31 23:39阅读：428来源：国知局

1.本技术涉及营销响应领域，具体涉及一种营销响应模型构建方法、设备及介质。

背景技术：

2.金融科技在信贷金融领域的应用越来越广泛，运用先进的人工智能、机器学习、大数据技术进行企业信用的风险评估，建立贯穿营销、贷前、贷中、贷后整个信贷流程的金融风控体系是开展征信服务的业务目标。
3.金融信贷领域中，银行信贷产品面临的主要客户是小微企业，不同信贷产品服务的小微企业对象的条件有所不同，如何精准的划分小微企业这一群体对象，针对不同群体推荐不同的银行信贷产品，利用模型识别对银行信贷产品感兴趣及响应概率更大的企业客户，是金融科技助力小微企业信贷服务的重要内容之一。
4.因此，亟需一种能够准确反应客户企业对于银行信贷产品感兴趣概率的客户响应模型。

技术实现要素：

5.为了解决上述问题，本技术提出了一种营销响应模型构建方法、设备及介质，其中方法包括：确定预先采集的样本企业的企业数据，根据所述样本企业的企业数据建立标准数据库；根据所述标准数据库，确定所述样本企业的企业指标；根据所述企业指标，通过k均值聚类算法，建立所述样本企业的多维聚类分析模型；根据所述多维聚类分析模型，确定所述样本企业在不同指标维度下的聚类簇；根据所述样本企业在不同指标维度下分别对应的聚类簇，通过k最近邻算法，确定客户企业的营销响应概率。
6.在一个示例中，根据所述样本企业的企业数据建立标准数据库，具体包括：确定所述标准数据库内标准数据的数据结构；对所述企业数据进行数据加工，以将所述企业数据转化为所述标准数据；对所述标准数据进行内容识别，确定所述标准数据对应的内容重复率；若所述内容重复率高于预设阈值，则删除所述标准数据。
7.在一个示例中，根据所述标准数据库，确定所述样本企业的企业指标，具体包括：确定所述标准数据库中属于预设数据维度的所述标准数据；所述预设数据维度的种类由营销任务类型决定；将所述属于预设数据维度的所述标准数据进行文本识别，生成所述样本企业的企业指标。
8.在一个示例中，根据所述企业指标，通过k均值聚类算法，建立所述企业多维聚类分析模型，具体包括：根据营销任务类型，确定所述企业指标中的入模指标；对所述入模指标进行数据清洗，得到训练样例；根据聚类评价指标及所述训练样例，确定所述k均值聚类算法中的k值。
9.在一个示例中，对所述入模指标进行数据清洗，得到训练样例，具体包括：确定所述入模指标中各指标对应的缺失值，若所述缺失值大于预设比例，则将所述入模指标作为无效值删除；对剩余入模指标进行多重共线性检验，去除所述剩余入模指标中存在共线性
的所述入模指标；对所述剩余入模指标进行标准化处理，得到训练样例。
10.在一个示例中，根据聚类评价指标及所述训练样例，确定所述k均值聚类算法中的k值，具体包括：在预设区间内遍历所述k值，根据所述k的不同取值，对所述训练样例进行k均值聚类分析；根据所述k的不同取值，绘制对应的聚类分析结果图，并得到对应的ch度量指标值；选择最大的所述ch度量指标值对应的所述k值，作为所述k均值聚类算法中的k值。
11.在一个示例中，根据所述多维聚类分析模型，确定所述样本企业在不同维度下分别对应的聚类簇之后，所述方法还包括：根据所述聚类簇分别对应的指标，选择响应所述营销任务概率最高的聚类簇，作为目标聚类簇。
12.在一个示例中，根据所述样本企业在不同维度下分别对应的聚类簇，通过k最近邻算法，确定客户企业的营销响应概率，具体包括：确定输入的客户企业数据，调用所述多维聚类分析模型预测所述客户企业属于所述目标聚类簇的概率；将所述客户企业属于所述目标聚类簇的概率作为所述客户企业的所述营销响应概率。
13.本技术还提供了一种营销响应模型构建设备，包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行：确定预先采集的样本企业的企业数据，根据所述样本企业的企业数据建立标准数据库；根据所述标准数据库，确定所述样本企业的企业指标；根据所述企业指标，通过k均值聚类算法，建立所述样本企业的多维聚类分析模型；根据所述多维聚类分析模型，确定所述样本企业在不同指标维度下的聚类簇；根据所述样本企业在不同指标维度下分别对应的聚类簇，通过k最近邻算法，确定客户企业的营销响应概率。
14.本技术还提供了一种非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：确定预先采集的样本企业的企业数据，根据所述样本企业的企业数据建立标准数据库；根据所述标准数据库，确定所述样本企业的企业指标；根据所述企业指标，通过k均值聚类算法，建立所述样本企业的多维聚类分析模型；根据所述多维聚类分析模型，确定所述样本企业在不同指标维度下的聚类簇；根据所述样本企业在不同指标维度下分别对应的聚类簇，通过k最近邻算法，确定客户企业的营销响应概率。
15.通过本技术提出的方法相较于传统基于客户行为分析的客户营销响应模型方法，该专利基于企业工商、社保、税务等企业本身具有的信息，经过多源数据融合，对多源数据进行数据合并、数据对齐、数据融合等操作，拓宽了客户营销响应模型的分析场景。能够在无样本的情况下进行客户的聚类分析，算法简单、快速，解决业务开展初期数据积累较少的问题。根据客群分类之后的特征设定进行营销策略的确定能够进一步提升营销的效率，降低成本。
附图说明
16.此处所说明的附图用来提供对本技术的进一步理解，构成本技术的一部分，本技术的示意性实施例及其说明用于解释本技术，并不构成对本技术的不当限定。在附图中：
17.图1为本技术实施例中一种营销响应模型构建方法流程示意图；
18.图2为本技术实施例中一种营销响应模型构建设备示意图。
具体实施方式
19.为使本技术的目的、技术方案和优点更加清楚，下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
20.以下结合附图，详细说明本技术各实施例提供的技术方案。
21.图1为本技术实施例提供的一种营销响应模型构建方法的流程示意图。该流程流程中的某些输入参数或者中间结果允许人工干预调节，以帮助提高准确性。
22.本技术实施例涉及的分析方法的实现可以为终端设备，也可以为服务器，本技术对此不作特殊限制。为了方便理解和描述，以下实施例均以服务器为例进行详细描述。
23.如图1所示，本技术实施例提供一种营销响应模型构建方法，包括：
24.s101：确定预先采集的样本企业的企业数据，根据所述样本企业的企业数据建立标准数据库。
25.企业数据来源于多个数据源，可以来自企业政府数据、社会数据、第三方数据等，包括市场监管、人社、发改委、公安、住建局等相关数据，企业的第三方数据包括司法、知识产权、黑名单等信息。同时样本企业的企业数据的数据维度至少包括：企业偿债能力、管理能力、还款意愿、企业资质、盈利能力、营运能力、创新能力、发展能力，以使企业数据能够更加全面地反应样本企业的状态信息。然后根据样本企业的企业数据建立标准数据库。
26.s102：根据所述标准数据库，确定所述样本企业的企业指标。
27.服务器基于标准数据库，梳理标准数据库中企业数据，建立企业指标体系。其中，企业指标体系共覆盖企业偿债能力、管理能力、还款意愿、企业资质、盈利能力、营运能力、创新能力、发展能力共计8个维度。其中管理能力主要包括治理完善度、近6个月董监高变更次数、近一年董监高变更次数、近一年法定代表人变更次数、财务费用同比增长率、财务费用比率、职工人均营收、人员流失率等指标。偿债能力主要包括资产负债率、权益负债比率、净资产行业水平、负债总额同比增长率、速动比率、流动比率、现金流动负债比率等指标，企业还款意愿覆盖纳税信用等级、是否正常纳税、近六个月企业累计欠税次数、最近一次纳税距今月数、当前应缴未缴的欠税次数、近六个月重大税收违法次数等指标。但是在建立营销响模型时，企业的指标维度至少包括：企业背景、企业稳定性、企业经营能力、企业发展能力、企业科技创新能力，这五个与营销响应有密切关联的一级维度。
28.s103：根据所述企业指标，通过k均值聚类算法，建立所述样本企业的多维聚类分析模型。
29.服务器通过企业指标，使用k均值聚类算法，建立由样本企业的企业数据得到的多维聚类分析模型。k均值聚类算法是聚类方法中一种较常用、适用范围更广、使用场景更丰富的聚类方法。杜巍，赵春荣，黄伟建等人认为聚类算法在客户细分模型当中可以有效划分客户，使企业可以根据不同客户的特点来分别进行营销，提升企业的营销效果，提高投资回报率。他们将k均值聚类算法进行了改进，并对旅游业客户建立了客户细分模型，针对客户的不同需求来划分，最终得到模型效果较好。
30.s104：根据所述多维聚类分析模型，确定所述样本企业在不同指标维度下的聚类簇。
31.服务器验证各指标维度下，多维聚类分析模型已趋于稳定之后，确定适合各聚类簇划分的企业描述，例如该簇划分下企业还款意愿较强、企业偿债能力较强、企业资质较好等。从业务和聚类效果性能两方面综合评价各维度下企业聚类的效果，最终确定最优的聚类划分结果。
32.s105：根据所述样本企业在不同指标维度下分别对应的聚类簇，通过k最近邻算法，确定客户企业的营销响应概率。
33.服务器通过样本企业在不同指标维度下的聚类簇，使用k最近邻算法，来确定客户企业的营销响应概率。k最近邻(k
‑
nearest neighbor,knn)算法核心思想是如果一个样本在特征空间中的k个最临近的样本中的大多数属于某一个类别，则该样本也属于这个类别。其中，这里的k通常是不大于20的整数，为与k均值聚类算法中的k值区别，这里使用m值代替k最近邻算法中的k值。
34.在一个示例中，服务器在得到样本企业的企业数据之后，首先需要建立统一的数据标准，以规范对入库的多源数据进行规范化管理；其次，通过etl等数据治理工具进行企业多源数据的治理加工，如果企业数据是互联网数据等可存储的数据，那么可以每隔一段时间定期拉取，实时接口数据通过内存进行处理，结合批流处理模式对企业数据进行数据加工处理、数据标准化、指标计算、轻特征挖掘；然后对标准数据进行内容识别，确定标准数据对应内容的重复率，如果重复率高于预设阈值，则删除重复内容对应的标准数据，以删除重复数据，并降低存储空间的消耗。最后，将企业数据通过横纵向数据融合，融合汇聚到统一的数据仓库中，数据仓库存储多源数据融合之后的标准库数据、加工所得指标库、特征库等信息。
35.在一个示例中，服务器建立好标准数据库之后，需要根据营销任务的类型，挑选预设的数据维度，从而初步筛选标准数据库之中的标准数据。将筛选后的标准数据进行文本识别，生成样本企业的企业指标。一般来说，在生成指标时，需要工作人员的参与，根据经验，帮助生成企业指标。
36.在一个示例中，服务器建立企业的多维聚类分析模型时，首先需要根据营销任务类型，确定众多企业指标中的入模指标，对入模指标进行探索性数据分析，然后对入模指标进行数据清洗，从而得到训练样例，再根据聚类评价指标，及训练样例，确定所述k均值聚类算法中的k值。
37.其中，在对入模指标进行探索性数据分析时，要对筛选出的入模指标进行简单的描述统计，分析各指标的方差、均值、中位数、数据分布等，经过对数据进行简单的统计分析之后，对特定指标数据进行数据切分，对数据的动态变化情况、某一特定条件下的取值情况进行深入的剖析；通过绘制单变量的直方图曲线、单变量与目标变量的关系曲线等对入模样例指标进行可视化分析。
38.进一步地，在对入模指标对应的标准数据进行数据清洗时，需要对指标中的无效值进行处理，首先需要对部分可量化的指标进行数值量化，然后对入模指标进行缺失值统计，去除缺失值大于预设比例的入模指标，例如去除缺失值大于90％的训练指标。还可以对剩余指标进行同值率的统计，去除属性只有一个值的特征，例如去除属性同值率大于85％的指标；针对缺失同值过滤后的入模指标进行多重共线性检验，去除剩余入模指标中存在共线性的指标。最后采用标准化处理方法对剩余的入模指标进行标准化处理，得到训练样
例，用于聚类过程。
39.在一个实施例中，可以通过使用ch度量指标作为聚类评价指标，通过ch度量指标及训练样例，确定k均值聚类算法中的k值时，可以在预设的数值区间内遍历k值，例如将k值的取值范围设定为取1
‑
10区间内数值，分别进行k均值聚类分析，绘制聚类分析结果图，依次计算不同k取值下的ch度量指标值，ch值越大，则聚类效果越好。结合聚类分析的可视化结果图以及ch的不同取值选取聚类效果最优的k值结果。
40.进一步地，经过ch度量指标确定各维度下企业聚类分析的k值，并验证各维度下聚类模型已趋于稳定之后，使用相应最优k值训练聚类分析模型，需要绘制各维度下企业聚类分析结果形成的簇划分可视化图，观察各维度下企业聚类分析的效果。并针对每个簇分析各指标值得分布情况，确定适合该簇划分的企业描述，从业务和聚类效果性能两方面综合评价各维度下企业聚类的效果，最终确定最优的聚类划分结果。并根据所述聚类簇分别对应的指标，选择响应所述营销任务概率最高的聚类簇，作为目标聚类簇。
41.在一个实施例中，得到样本企业在不同维度下分别对应的聚类簇之后，通过k最近邻算法，也就是有监督分类knn方法，以聚类入模指标为x，以聚类结果簇作为y建立营销响应模型，各维度下的样本企业经过聚类划分之后，输入客户企业的企业数据，调用聚类分析模型预测客户企业的聚类簇划分之后，模型给出该企业所属的簇划分标签。采用各维度入模指标作为knn分类模型训练时所用的x，采用聚类分析簇划分的结果类别作为有监督分类的y，以此训练knn分类模型，此时多维聚类分析模型预测企业属于目标聚类簇的概率即为企业营销响应概率。
42.如图2所示，本技术实施例还提供了一种营销响应模型构建设备，包括：
43.至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行：确定预先采集的样本企业的企业数据，根据所述样本企业的企业数据建立标准数据库；根据所述标准数据库，确定所述样本企业的企业指标；根据所述企业指标，通过k均值聚类算法，建立所述样本企业的多维聚类分析模型；根据所述多维聚类分析模型，确定所述样本企业在不同指标维度下的聚类簇；根据所述样本企业在不同指标维度下分别对应的聚类簇，通过k最近邻算法，确定客户企业的营销响应概率。
44.本技术实施例还提供了一种非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：
45.至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行：确定预先采集的样本企业的企业数据，根据所述样本企业的企业数据建立标准数据库；根据所述标准数据库，确定所述样本企业的企业指标；根据所述企业指标，通过k均值聚类算法，建立所述样本企业的多维聚类分析模型；根据所述多维聚类分析模型，确定所述样本企业在不同指标维度下的聚类簇；根据所述样本企业在不同指标维度下分别对应的聚类簇，通过k最近邻算法，确定客户企业的营销响应概率。
46.本技术中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于设备和介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
47.本技术实施例提供的设备和介质与方法是一一对应的，因此，设备和介质也具有与其对应的方法类似的有益技术效果，由于上面已经对方法的有益技术效果进行了详细说明，因此，这里不再赘述设备和介质的有益技术效果。
48.本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd
‑
rom、光学存储器等)上实施的计算机程序产品的形式。
49.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
50.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
51.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
52.在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
53.内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
54.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd
‑
rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。
55.还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
56.以上所述仅为本技术的实施例而已，并不用于限制本技术。对于本领域技术人员来说，本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本技术的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘先淇;尹盼盼;崔乐乐
技术所有人：天元大数据信用管理有限公司
我是此专利的发明人

上一篇：用于LED的白色感光覆盖膜组合物、覆盖膜及其制备方法与流程
上一篇：一种路基填料压缩检测设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。