一种目标物品确定方法、装置、电子设备及存储介质与流程

文档序号:33650241发布日期:2023-03-29 07:41阅读:34来源:国知局
一种目标物品确定方法、装置、电子设备及存储介质与流程

1.本发明涉及计算机技术领域,尤其涉及一种目标物品确定方法、装置、电子设备及存储介质。


背景技术:

2.随着计算机技术的快速发展,在商业营销的过程中,往往需要根据用户的兴趣为用户推荐感兴趣的物品,不但可以提升商业营销的效率,还可以提高用户的使用体验。
3.但是,由于用户可以活跃于不同领域的业务板块中,现有技术主要集中应用在某个特定领域的业务板块,并仅针对该领域的客户进行个性化推荐,但跨业务板块的客户推荐场景中,存在引流效果差、营销成本过高、推荐负反馈明显等问题。


技术实现要素:

4.本发明提供一种目标物品确定方法、装置、电子设备及存储介质,实现了基于目标用户对应的特征数据确定对应的特征标签,以基于特征标签确定目标物品,并基于目标物品进行物品推荐,解决了现有技术中推荐效果差的问题。
5.第一方面,本发明实施例提供了一种目标物品确定方法,包括:
6.获取与目标用户相对应的特征数据集;其中,所述特征数据集包括物流特征数据、物品特征数据、历史特征数据;
7.确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签;
8.基于所述特征数据集确定所述目标用户的用户特征信息,基于所述用户特征信息和所述目标特征标签确定目标物品,并基于所述目标物品进行物品推荐。
9.第二方面,本发明实施例还提供了一种目标物品确定装置,该装置包括:
10.数据获取模块,用于获取与目标用户相对应的特征数据集;其中,所述特征数据集包括物流特征数据、物品特征数据、历史特征数据;
11.标签提取模块,用于确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签;
12.目标物品确定模块,用于基于所述特征数据集确定所述目标用户的用户特征信息,基于所述用户特征信息和所述目标特征标签确定目标物品,并基于所述目标物品进行物品推荐。
13.第三方面,本发明实施例还提供了一种电子设备,所述设备包括:
14.一个或多个处理器;以及
15.与所述至少一个处理器通信连接的存储器;其中,
16.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够实现如本发明实施例任一所述的目标物品确定方法。
17.第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例任一所述的目标物品确定方法。
18.本发明实施例的技术方案,通过获取与目标用户相对应的特征数据集,并且确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签,进而基于所述特征数据集确定所述目标用户的用户特征信息,基于所述用户特征信息和所述目标特征标签确定目标物品,并基于所述目标物品进行物品推荐。实现了基于目标用户对应的特征数据确定对应的特征标签,以基于特征标签确定目标物品,并基于目标物品进行物品推荐,解决了现有技术中推荐效果差的问题。
19.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
20.为了更加清楚地说明本发明实施例中的技术方案,下面对描述实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
21.图1是本发明实施例提供的一种目标物品确定方法的流程示意图;
22.图2是本发明实施例提供的概率值计算算法的示意图;
23.图3是本发明实施例提供的fasttext模型架构示意图;
24.图4是本发明实施例提供的哈弗曼编码编码示意图;
25.图5是本发明实施例提供的一种目标物品确定方法的流程图;
26.图6是本发明实施例提供的一种目标物品确定装置的结构框图;
27.图7是本发明实施例提供的电子设备的结构示意图。
具体实施方式
28.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
29.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
30.可以理解的是,在使用本发明各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本发明所涉及个人信息的类型、使用范围、使用场景等告知用户
并获得用户的授权。
31.例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主地选择是否向执行本发明技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
32.作为一种可选的但非限定性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
33.可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本发明的实现方式构成限定,其它满足相关法律法规的方式也可应用于本公开的实现方式中。
34.可以理解的是,本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
35.实施例一
36.图1为本发明实施例提供的一种目标物品确定方法的流程示意图,本实施例可适用于根据基于和目标用户对应的特征数据集确定对应的目标物品,并基于目标物品为目标用户进行物品推送的情况,该方法可以由目标物品确定装置来执行,该目标物品确定装置可以采用硬件/或软件的形式实现,该装置可配置于电子设备中,该电子设备可以是pc端或服务端等。
37.如图1所示,该方法包括:
38.s110、获取与目标用户相对应的特征数据集。
39.其中,目标用户可以是当前服务平台上的至少一个用户,例如可以是网购平台上的任一用户,还可以是不同业务板块下的用户。特征数据集可以理解为与目标用户相关联的特征数据的集合。特征数据集包括物流特征数据、物品特征数据、历史特征数据。物流特征数据可以是与目标用户相对应的物流数据,例如物流的收发数据、物流种类数据等物流相关数据。物品特征数据可以理解为与目标用户相对应的物品特征数据,例如可以是与目标用户相关联的购买物品的特征数据,还可以是目标用户浏览过的物品数据等。历史特征数据可以是目标用户的历史行为数据,例如目标用户的历史购买数据等。
40.具体的,可以从预先设置的数据库中,调取与目标用户相对应的特征数据集,例如可以是基于目标用户的识别码从数据库中进行匹配,进而获取到与目标用户相对应的特征数据集,还可是是预先选定业务种类,从数据库中获取与业务种类相匹配的所有用户的特征数据集,业务种类可以是理解为不同业务板块,需要说明的是,不同的业务板块提供服务是不同的,例如线上业务板块和线下业务板块。
41.s120、确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签。
42.其中,标签提取方式可以是提取特征标签的方式,不同的特征数据对应不同的特征标签提取方式。目标特征标签可以理解为与当前特征数据相对应的特征标签。
43.具体的,根据特征数据集中特征数据,确定与各特征数据相对应的特征标签提取方式,并基于特征标签提取方式处理对应的特征数据,进而得到与各特征数据相对应的目
标特征标签。需要说明的是,由于不同的特征数据中所包含的数据信息完全不同,因此需要根据不同的特征数据确定对应的特征标签提取方式,根据正确的提取方式才可以获取到目标特征标签。
44.在上述技术方案的基础上,所述确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签,包括:采用分词工具对所述物流特征数据进行处理,得到物流文本信息;基于第一信息提取维度采用无监督关键词提取算法对所述物流文本信息进行处理,得到物流物品关键词;根据朴素贝叶斯算法对预设物品类目信息和所述物流物品关键词进行处理,得到与所述物流特征数据对应的目标特征标签。
45.其中,分词工具可以是用于对特征数据进行分词处理的工具,例如可以是jieba分词工具、ansj分词工具或者hanlp分词工具。物流文本信息可以理解为通过分词工具对物流特征数据进行分词处理后,得到的文本信息。第一信息提取维度可以是预先设置的用于对物流文本信息进行信息提取的维度。物流物品关键词可以理解为根据第一信息提取维度从物流文本信息中提取得到的关键词。无监督关键词提取算法可以是不需要人工标注的关键词提取算法。物流物品关键词可以理解为从物流文本信息中提取得到的物品关键词。朴素贝叶斯算法(naive bayes model)可以是基于贝叶斯定理与特征条件独立假设的分类方法。预设物品类目信息可以是预先设置的物品的种类信息。
46.具体的,如果当前需要处理的数据为物流特征数据,则在得到物流特征数据后,先采用分词工具对获取到的物流特征数据进行分词处理得到物流文本信息,进而根据第一信息提取维度采用无监督关键词提取算法对物流文本信息进行特征词提取得到物流物品关键词,最终根据朴素贝叶斯算法对预设物品类目信息和物流物品关键词进行处理,进而可以获取到与物流特征数据对应的目标特征标签。例如,如图2所示,可以通过朴素贝叶斯算法获取到关键词和预设物品类目信息之间的概率值,可以将获取到的概率值按照从大到小的顺序排序后,选取排在前5,或者将排在首位的类目作为该关键词的特征标签。
47.在上述技术方案的基础上,所述确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签,包括:根据第二信息提取维度对所述物品特征数据进行处理,得到待处理物品文本;基于预先设置的文本修正规则对所述待处理物品文本进行修正,得到目标物品文本,以基于所述目标物品文本确定与所述物品特征数据对应的目标特征标签。
48.其中,第二信息提取维度可以是预先设定的用于对物品特征数据进行处理的维度信息,例如可以是提取物品的编码信息和物品题材信息。待处理物品文本可以理解为基于第二信息提取维度从物品特征数据中提取得到的文本信息。文本修正规则可以是预先设置的用于对待处理物品文本进行修正的规则。目标物品文本可以理解为对待处理物品文本进行修正后,得到的文本信息。
49.具体的,如果需要处理的特征数据为物品特征数据,则需要根据第二信息提取维度对物品特征数据进行信息提取,得到与物品特征数据相对应的待处理物品文本,并根据预先设置的文本修正规则对待处理物品文本进行修正后,得到目标物品文本,以基于目标物品文本确定对应的目标特征标签。例如,第二信息提取维度可以是提取物品特征数据中包括的物品编码和物品题材数据,进而得到包含物品编码和物品题材数据的待处理物品文
本,再基于文本修正规则对待处理物品文本进行修正后,得到目标物品文本,例如可以是基于文本修正规则将待处理物品文本中的错误信息、干扰信息以及歧义信息进行删除。
50.在上述技术方案的基础上,所述基于所述目标物品文本确定与所述物品特征数据对应的目标特征标签,包括:基于预先设置的物品类目对应表和所述目标物品文本,确定待应用物品标签;根据预设标签验证模型和验证阈值对所述待应用物品标签进行处理,得到与所述物品特征数据对应的目标特征标签。
51.其中,物品类目标签对应表可以是根据物品和物品类目之间的对应关系设置的表格。待应用物品标签可以理解为根据目标物品文本在物品类目对应表中进行匹配得到的物品标签。预设标签验证模型可以是预先设置的对物品标签的准确性进行验证的表格。验证阈值可以理解为预先设置的概率阈值,用于确定与物品特征数据对应的目标特征标签。
52.具体的,在获取到目标物品文本后,根据预先预设的物品类目对应表和目标物品文本确定待应用物品标签,例如可以是基于目标物品文本从预设的物品类目表中进行匹配,将匹配得到的类目作为待应用物品标签,需要说明的,物品类目对应表可以是预先设置的用于标识当前物品和类目之间的对应关系的表格。进而在得到待应用物品标签后,根据预设标签验证模型和验证阈值对待应用物品标签进行处理,进而得到与物品特征数据对应的目标特征标签。例如,可以是将待应用物品标签作为模型的输入,输入到预设标签验证模型中,进而得到与当前待应用物品标签相对应的概率值,将概率值与验证阈值进行比对,将满足验证阈值的待应用物品标签作为与物品特征数据对应的目标特征标签。
53.需要说明的是,如图3,本发明实施例所提供的预设标签验证模型可以是fasttext文本分类模型,本发明基于各系统中物品文本内容,对物品类目标签进行模型预估,提升物品基础数据的准确性和可信性。fasttext模型在保持高精度的前提下,可以快速进行模型训练和模型预测,便于进行模型迭代更新,并且该模型会自行训练词向量,所以不需要准备预训练好的词向量。例如可以通过获取到的目标物品文本,基于目标物品文本构建模型训练数据,并进行fasttext模型架构搭建,基于模型训练数据完成模型训练。如图4,在使用fasttext模型进行训练时,为了改善运行时间,使用了层次softmax技巧。层次softmax技巧建立在哈弗曼编码的基础上,对标签进行编码,能够极大地缩小模型预测目标的数量,这也使得进一步的计算效率更高。最终,通过auc、f1、acc等模型评估指标,对fasttext模型进行超参数调优,提升模型效果,得到指标最优的fasttext模型,也即预设标签验证模型。
54.在上述技术方案的基础上,在确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签,包括:基于所述历史特征数据确定所述目标用户是否交叉用户;如果所述目标用户为所述交叉用户,则获取与所述目标用户对应的历史特征标签,基于所述历史特征标签确定所述目标特征标签。
55.其中,交叉用户可以是在多个业务板块存在历史行为的用户。历史特征标签可以是理解为根据用户的历史特征数据确定的历史特征标签。
56.具体的,若当前需要处理的特征数据为历史特征数据,则基于与目标用户相对应的历史特征数据确定当前目标用户是否存在多个业务板块的历史行为,如果确定当目标用户存在多个业务板块的历史行为,则当前目标用户为交叉用户,则获取与当前目标用户相对应的历史特征标签,并基于历史特征标签确定目标特征标签。需要说明的是,如果当前用户存在历史特征数据,则说明当前用户已经存在历史特征标签,历史特征标签可以是基于
用户的历史数据得到的与物流特征数据对应的目标特征标签和与物品特征数据对应的目标特征标签的标签集合。
57.在上述技术方案的基础上,所述基于所述历史特征标签确定所述目标特征标签,包括:采用置信度计算算法对所述历史特征标签进行处理,得到与各历史特征标签相对应的历史标签置信度;根据预先设置的可信阈值和所述历史标签置信度对所述历史特征标签进行处理,得到所述目标特征标签。
58.其中,置信度计算算法可以是用于计算历史标签的可信程度的算法。历史标签置信度可以理解为根据置信度计算算法获取到的与当前历史特征标签相对应的概率值。可信阈值可以是预先设置的用于确定当前历史特征标签是否满足筛选条件的阈值。
59.具体的,根据置信度计算算法对当前目标用户相对应的历史特征标签进行处理,得到与各历史特征标签相对应的历史标签置信度,并基于预先设置的可信阈值和历史标签置信度对历史特征标签进行筛选,得到满足于预设筛选条件的历史特征标签,并将其作为目标特征标签。需要说明的是,由于已经确定了目标用户为交叉用户,则当前目标用户可能存在多个历史特征标签,则需要对获取到的历史特征标签记性筛选,得到最能代表当前用户的历史特征标签,并将其作为目标特征标签。例如可以是基于如下置信度计算公式,即可计算不同业务板块下的特征置信度,confidence(b1

a1)=p(b1|a1)=p(a1b1)/p(a1),即标签a1为与当前用户对应的历史特征标签后,另一个标签b1也为当前目光表用户对应的历史特征标签的概率。
60.s130、基于所述特征数据集确定所述目标用户的用户特征信息,基于所述用户特征信息和所述目标特征标签确定目标物品,并基于所述目标物品进行物品推荐。
61.其中,用户特征信息可以理解为当前用户是否存在购买行为的信息,例如如果当前用户不存在历史特征数据,则确定当前用户的用户特征信息为新用户。目标物品可以是需要进行物品推荐的物品。
62.具体的,基于获取到的特征数据集确定当前目标用户的用户特征信息,并基于当用用户的用户特征信息和目标特征标签确定目标物品,并根据目标物品进行物品推荐。例如,可以是通过基于当前目标用户对应的特征数据集确定当前目标用户的历史行为数据,基于当前目标用户的历史行为数据确定当前目标用户是否新客,如果当前目标用户为新客,则无需获取当前目标用户的历史特征数据,直接基于物流特征数据和物品特征数据确定与目标用户对应的目标物品即可,可以理解的是,可以将获取到的目标特征标签输入到预先设置的集成模型中,该集成平台中融合了逻辑回归、支撑向量机、gbdt模型这三个模型,提升集成模型的学习能力,实现老客的精准营销推荐。新用户为各个业务板块待推荐的业务客户,该类客户本身行为数据较少,所以基于客户本身标签信息,利用协同过滤算法,产出以客户标签为主键的物品推荐结果表,用于新客推荐。
63.在上述技术方案的基础上,在基于所述特征数据集确定所述目标用户的用户特征信息之前,包括:基于第三信息提取维度对所述历史特征数据进行信息提取,得到与所述目标用户对应的行为特征数据;基于所述行为特征数据生成与所述目标用户相对应的推荐数据表,以基于所述推荐数据表确定所述目标物品。
64.其中,第三信息提取维度可以是预先设置的用于从历史特征数据中进行信息提取的维度信息。行为特征数据可以理解为目标用户的历史行为所产生的信息。行为特征数据
包括交易属性数据、社会属性数据以及风险属性数据。交易属性信息可以是用户的历史交易行为的属性,例如交易次数、交易成功率等信息。社会属性数据可以理解为用户的行为产生的社会信息。风险属性数据可以是当前目标用户是否存在风险。推荐数据表可以是基于用户的行为特征数据生成的推荐物品表,可以用于反映当前用户的个人喜好。
65.具体的,根据第三信息提取维度处理与当前目标用户对应的历史特征数据,得到与当前目标用户对应的行为特征数据,进而基于与当前目标用户对应的行为特征数据,确定与当前目标用户相对应的推荐数据表,进而基于推荐数据表确定出目标物品。例如,可以是基于用户特征信息和目标特征标签确定目标物品后,根据推荐数据表对目标物品进行筛选,进而确定出最终为用户推荐的物品,并基于目标物品进行物品推荐。
66.本发明实施例的技术方案,通过获取与目标用户相对应的特征数据集,并且确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签,进而基于所述特征数据集确定所述目标用户的用户特征信息,基于所述用户特征信息和所述目标特征标签确定目标物品,并基于所述目标物品进行物品推荐。实现了基于目标用户对应的特征数据确定对应的特征标签,以基于特征标签确定目标物品,并基于目标物品进行物品推荐,解决了现有技术中推荐效果差的问题。
67.实施例二
68.图5是本发明实施例提供的一种目标物品确定方法的流程图。本实施例在上述实施例的基础上,进一步优化了上述目标物品确定方法。其具体的实施方式可以参见本实施例技术方案。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
69.需要说明的是,目前在进行跨板块客户推荐时,企业大多依托特定领域场景,基于营销员业务经验或者数据统计分析方法进行客户推荐,但该方法存在以下缺陷,第一,数据协同点不明确,具体的,在企业运营过程中,各板块之间业务关联性较低并且业务内容相对割裂,无法直接定位数据协同点,这是数据挖掘过程中常见的问题,也是传统跨板块推荐方法中需要突破的瓶颈。第二,缺乏算法技术支持,具体的,目前对客户进行跨板块营销时,企业主要依赖一线人员本身的经验积累,来探查该客户在其它板块的兴趣点,但该方法缺少科学的技术支持,导致营销结果强依赖于个人经验,无法进行普遍推广。第三,欠缺跨板块精准画像,具体的。在企业中各业务板块的数据一般都归属于不同企业系统,各个系统中客户和物品信息繁杂,但是板块之间存在数据孤岛问题,缺乏客户统一的多维精准画像,阻碍了业务之间数据协同和客户协同的发展。
70.获取与目标用户对应的目标特征标签:具体的,物流板块中包含了海量客户在全购物平台上的购买信息,体现了客户的身份、兴趣,爱好,消费偏好,有助于进行全方位多维度的消费者行为洞察,进而通过获取与目标用户对应的物流特征数据,针对物流特征数据,利用分词工具对进行物流特征数据进行分词,针对切词后的文本结果,利用统计特征的无监督关键词提取方法,提取信息关键词,以上两步已经完成物流文本信息的关键词提取,按照相同算法完成电商物品名称的关键词抽取。基于现有电商物品关键词和电商类目的对应关系,利用朴素贝叶斯算法,可计算得到物流文本关键词和电商类目之间的概率值,根据概率值选取top作为该物流文本关键词的类目标签。通过以上步骤已完成基于物流数据进行电商类目打标的过程,基于该类目标签结果,可以为目标用户进行已购买物品信息的丰富,优化客户兴趣,爱好,消费偏好等客户标签。
71.由于电商物品存在线上和线下同时推荐营销的业务形态,所以导致同一物品存在于不同多个业务系统中,并且业务系统之间存在物品类目混乱、标签值不统一、同物品不同编号等问题,本发明提出了协同多业务系统优化电商物品标签的创新点。
72.针对基于多个业务系统,提取出物品特征信息,针对物品特征信息进行正则化清洗,包括无用文本、歧义字符、干扰字符,并完成标签数值转化,针对修正后的信息,基于第二信息提取维度从物品特征信息中提取物品编号和物品题材数据,并建立物品类目对应表,进而基于物品类目对应表,确定物品类目标签,并完成模型训练数据的构造,并进行fasttext模型架构搭建,并基于模型训练数据完成模型训练,基于训练完成的fasttext模型对物品类目标签进行模型预估,通过阈值限制,产出物品top类目标签,作为该物品最终模型预估标签。需要说明的是,本发明实施例的技术方案,通过引入fasttext文本分类模型,本发明基于各系统中物品文本内容,对物品类目标签进行模型预估,提升物品基础数据的准确性和可信性。fasttext模型在保持高精度的前提下,可以快速进行模型训练和模型预测,便于进行模型迭代更新,并且该模型会自行训练词向量,所以不需要准备预训练好的词向量
73.针对跨板块的交叉客户,在企业中各业务板块之间其实存在一定交叉客户,客户在不同板块之间均有相应行为和客户标签,本发明基于交叉客户,创新性地提出了跨板块标签的置信度计算方式,并针对交叉客户挑选置信度较高的标签进行推荐模型训练。标签筛选可以为后续交叉客户构建推荐算法模型时,提供模型特征筛选的数值依据。特征筛选可以降低模型发生过拟合的风险,避免模型在训练集和测试集上的评估指标差异过大的问题,同时在保证模型精准度的前提下,可以缩短训练时间成本,避免不必要的机器性能消耗,也便于模型快速迭代优化。标签筛选的核心即为计算跨板块标签之间的置信度,保留置信度较高的标签,剔除置信度较低的标签,具体的,基于客户在不同板块之间的客户行为,圈选出跨板块的交叉客户群,并获取其在不同板块下的客户标签。假设交叉客户群为u,其中包含客户为u1、u2、u3、u4、...、um,其中u1客户在a业务板块下的客户标签为a1、a2、a3、...、an,在b业务板块下的客户标签为b1、b2、b3、...、bn,以此类推。基于如下置信度计算公式,即可计算不同业务板块下的特征置信度,置信度计算方式如下,即标签a1为客户ui标签后,另一个标签b1也为客户ui标签的概率。confidence(b1

a1)=p(b1|a1)=p(a1b1)/p(a1),进而依照置信度计算算法得到交叉板块之间标签置信度,按照置信度由大至小排序,通过置信度阈值限制,完成跨板块客户标签筛选。
74.建立与目标用户相对应的推荐数据表:具体的,为了充分发挥数据协同效能,针对获取得到的用户特征数据集,采用第三信息提取维度从特征数据集提取出与用户相关联的历史行为数据,并基于fasttext、规则集判定、逻辑回归等方法对历史行为数据进行分析后,对客户个人属性、交易属性、社会属性进行初步刻画,并生成与当前目标用户相关联的推荐数据表,并将推荐数据表与用户标识关联存储在数据库中。
75.确定目标用户的用户特征信息:具体的,针对用户的历史特征数据,选取消费金额、购买频率、时间间隔等价值因子,采用rfm模型对客户价值进行细分,识别战略重点客户,并根据客户在各版块近期一段时间内是否有历史消费记录,进行客户分层,将客户分为交叉老客、单一老客、新客,针对客户层级类型制定差异化营销方案,实现客户分层管理,提高对客户的个性化推荐服务能力。
76.确定目标物品:具体的,交叉老客和单一老客在前期特征处理阶段有所不同,交叉老客会根据各版块标签的置信度进行特征筛选,单一老客由于不存在其它板块标签,所以不需要进行该步骤。例如,基于当前目标用户的历史行为数据确定当前目标用户是否新客,如果当前目标用户为新客,则无需获取当前目标用户的历史特征数据,直接基于物流特征数据和物品特征数据确定与目标用户对应的目标物品即可,可以理解的是,可以将获取到的目标特征标签输入到预先设置的集成模型中,该集成平台中融合了逻辑回归、支撑向量机、gbdt模型这三个模型,提升集成模型的学习能力,实现老客的精准营销推荐。新用户为各个业务板块待推荐的业务客户,该类客户本身行为数据较少,所以基于客户本身标签信息,利用协同过滤算法,产出以客户标签为主键的物品推荐结果表,用于新客推荐。
77.本发明实施例的技术方案,通过获取与目标用户相对应的特征数据集,并且确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签,进而基于所述特征数据集确定所述目标用户的用户特征信息,基于所述用户特征信息和所述目标特征标签确定目标物品,并基于所述目标物品进行物品推荐。实现了基于目标用户对应的特征数据确定对应的特征标签,以基于特征标签确定目标物品,并基于目标物品进行物品推荐,解决了现有技术中推荐效果差的问题。
78.实施例三
79.图6是本发明实施例提供的一种目标物品确定装置的结构框图。该装置包括:数据获取模块610、标签提取模块620以及目标物品确定模块630。
80.数据获取模块610,用于获取与目标用户相对应的特征数据集;其中,所述特征数据集包括物流特征数据、物品特征数据、历史特征数据;
81.标签提取模块620,用于确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签;
82.目标物品确定模块630,用于基于所述特征数据集确定所述目标用户的用户特征信息,基于所述用户特征信息和所述目标特征标签确定目标物品,并基于所述目标物品进行物品推荐。
83.在上述技术方案的基础上,所述数据获取模块包括:物流特征数据处理单元,用于采用分词工具对所述物流特征数据进行处理,得到物流文本信息;基于第一信息提取维度采用无监督关键词提取算法对所述物流文本信息进行处理,得到物流物品关键词;根据朴素贝叶斯算法对预设物品类目信息和所述物流物品关键词进行处理,得到与所述物流特征数据对应的目标特征标签。
84.在上述技术方案的基础上,所述数据获取模块包括:物品特征数据处理单元,用于根据第二信息提取维度对所述物品特征数据进行处理,得到待处理物品文本;基于预先设置的文本修正规则对所述待处理物品文本进行修正,得到目标物品文本,以基于所述目标物品文本确定与所述物品特征数据对应的目标特征标签。
85.在上述技术方案的基础上,物品特征数据处理单元,用于基于预习设置的物品类目对应表和所述目标物品文本,确定待应用物品标签;根据预设标签验证模型和验证阈值对所述待应用物品标签进行处理,得到与所述物品特征数据对应的目标特征标签。
86.在上述技术方案的基础上,所述数据获取模块包括:历史特征数据处理单元,用于基于所述历史特征数据确定所述目标用户是否交叉用户;如果所述目标用户为所述交叉用
户,则获取与所述目标用户对应的历史特征标签,基于所述历史特征标签确定所述目标特征标签。
87.在上述技术方案的基础上,所述历史特征数据处理单元,用于采用置信度计算算法对所述历史特征标签进行处理,得到与各历史特征标签相对应的历史标签置信度;根据预先设置的可信阈值和所述历史标签置信度对所述历史特征标签进行处理,得到所述目标特征标签。
88.在上述技术方案的基础上,所述历史特征数据处理单元,用于基于第三信息提取维度对所述历史特征数据进行信息提取,得到与所述目标用户对应的行为特征数据;其中,所述行为特征数据包括交易属性数据、社会属性数据以及风险属性数据;基于所述行为特征数据生成与所述目标用户相对应的推荐数据表,以基于所述推荐数据表确定所述目标物品。
89.本发明实施例的技术方案,通过获取与目标用户相对应的特征数据集,并且确定与各特征数据相对应的标签提取方式,并基于所述标签提取方式得到与所述各特征数据相对应的目标特征标签,进而基于所述特征数据集确定所述目标用户的用户特征信息,基于所述用户特征信息和所述目标特征标签确定目标物品,并基于所述目标物品进行物品推荐。实现了基于目标用户对应的特征数据确定对应的特征标签,以基于特征标签确定目标物品,并基于目标物品进行物品推荐,解决了现有技术中推荐效果差的问题。
90.本发明实施例所提供的目标物品确定装置可执行本公开任一实施例所提供的目标物品确定方法,具备执行方法相应的功能模块和有益效果。
91.值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开实施例的保护范围。
92.实施例四
93.图7示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
94.如图7所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
95.电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
96.处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如目标物品确定方法。
97.在一些实施例中,目标物品确定方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的目标物品确定方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行目标物品确定方法。
98.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
99.用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
100.在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
101.为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
102.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据
服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
103.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
104.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
105.上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1