目标人群计算方法、装置、电子设备及介质与流程

文档序号:34102469发布日期:2023-05-10 18:01阅读:87来源:国知局
目标人群计算方法、装置、电子设备及介质与流程

本申请涉及大数据应用,特别涉及一种目标人群计算方法、装置、电子设备及介质。


背景技术:

1、在业务过程中,用户会在业务系统中产生海量用户内容,当中会包含很多业务人员关心的问题信息,业务人员需要根据问题关键词找到相关用户人群进行访谈调研和洞察分析,然后利用数据标签与用户人群进行规则化匹配后进行用户人群计算。

2、目前人群计算是根据用户属性、订单行为、浏览搜索行为等数据标签,组合进行交并差计算,并利用代码将可视化的筛选条件转变为sql(structured query language,结构化查询语言)语句,从而在广泛的数据底表中捞取到一个符合营销定位的精准用户群体。而人群计算主要运用于站内外广告投放、营销消息推送、活动营销人群验证、会员购买等以市场营销为主的场景中。

3、相关技术中,人群计算方法思路多以结构化的用户特征标签的方式来计算人群包,用户特征标签是和用户唯一识别id有关联的结构化的数据结构,这种做法虽然保证了匹配结果的精准度,但是在基于用户内容计算用户人群时,会丢失掉一部分和关键词不完全匹配但高度相关的用户内容及相关人群,造成匹配的用户人群较小,在特定情况下难以满足业务需求,适用性较差。


技术实现思路

1、本申请提供一种目标人群计算方法、装置、电子设备及介质,以解决相关技术中人群计算方法匹配用户人群不全面,导致适用性较差,无法满足业务需求等问题。

2、本申请第一方面实施例提供一种目标人群计算方法,包括以下步骤:获取用户标识和非结构化的用户特征值;根据所述用户标识匹配非结构化的用户内容,计算所述非结构化的用户特征值和所述非结构化的用户内容之间的匹配关系;根据所述匹配关系建立所述非结构化的用户特征值与所述用户标识之间的关联关系,基于所述关联关系确定所述非结构化的用户特征值对应的人群包。

3、可选地,所述计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系,包括:识别所述非结构化的用户特征值中的预设关键词;对所述预设关键词和用户内容进行向量化处理,得到向量化的预设关键词和用户内容,基于所述向量化的预设关键词和用户内容计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系。

4、可选地,在对所述预设关键词和用户内容进行向量化处理之前,还包括:对所述用户内容进行分词处理,得到分词后的单词集合;去除所述分词后的单词集合中的停用词,得到去除停用词后的单词集合;遍历所述去除停用词后的单词集合去除重复词,得到去重后的单词集合。

5、可选地,所述向量化的用户内容包括向量化的单词,所述基于所述向量化的预设关键词和用户内容计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系,包括:计算所述向量化的预设关键词和所述向量化的单词之间的相似度;若所述相似度大于匹配阈值,则判定所述非结构化的用户特征值和所述非结构化用户内容存在匹配关系,否则判定不存在匹配关系。

6、可选地,所述根据所述匹配关系建立所述非结构化的用户特征值与所述用户标识之间的关联关系,包括:若目标人群为系统内人群,则基于所述匹配关系确定目标用户标识集合,并建立所述用户标识集合与所述用户特征值之间的映射关系;若目标人群为系统外部上传人群,将上传的外部用户标识集合和系统内用户唯一标识进行遍历匹配,得到目标用户标识集合,并建立所述目标用户标识集合与所述用户特征值之间的映射关系。

7、可选地,在基于所述关联关系确定所述非结构化的用户特征值对应的人群包之后,还包括:利用所述人群包分析用户内容的热词分布,并基于所述热词分布进行业务操作。

8、可选地,利用所述人群包分析用户内容的热词分布,包括:通过人群包内的用户标识计算与每个用户标识关联的用户内容;对所述用户内容进行分词处理、停用词处理和遍历去重处理,得到去重后的单词集合;利用所述去重后的单词集合确定所述热词分布。

9、本申请第二方面实施例提供一种目标人群计算装置,包括:获取模块,用于获取用户标识和非结构化的用户特征值;计算模块,用于根据所述用户标识匹配非结构化的用户内容,计算所述非结构化的用户特征值和所述非结构化的用户内容之间的匹配关系;建立模块,用于根据所述匹配关系建立所述非结构化的用户特征值与所述用户标识之间的关联关系,基于所述关联关系确定所述非结构化的用户特征值对应的人群包。

10、本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的目标人群计算方法。

11、本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的目标人群计算方法。

12、由此,本申请至少具有如下有益效果:

13、本申请实施例改进非结构化用户特征值和用户内容之间的匹配方式,主要是通过输入非结构化的用户特征值,将其与用户唯一识别id有关联的非结构化用户内容进行匹配计算,计算出匹配关系后,建立输入的非结构化特征值与用户唯一识别id的关联关系,最终计算出输入的非结构化特征值关联的目标用户人群,从而保证匹配到的目标人群的准确度和适用性增高,满足业务人员的业务需求,提高工作效率。

14、本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。



技术特征:

1.一种目标人群计算方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系,包括:

3.根据权利要求2所述的方法,其特征在于,在对所述预设关键词和用户内容进行向量化处理之前,还包括:

4.根据权利要求3所述的方法,其特征在于,所述向量化的用户内容包括向量化的单词,所述基于所述向量化的预设关键词和用户内容计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述匹配关系建立所述非结构化的用户特征值与所述用户标识之间的关联关系,包括:

6.根据权利要求1所述的方法,其特征在于,在基于所述关联关系确定所述非结构化的用户特征值对应的人群包之后,还包括:

7.根据权利要求6所述的方法,其特征在于,利用所述人群包分析用户内容的热词分布,包括:

8.一种目标人群计算装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-7任一项所述的目标人群计算方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-7任一项所述的目标人群计算方法。


技术总结
本申请涉及大数据应用技术领域,特别涉及一种目标人群计算方法、装置、电子设备及介质,其中,方法包括:获取用户标识和非结构化的用户特征值;根据用户标识匹配非结构化的用户内容,计算非结构化的用户特征值和非结构化的用户内容之间的匹配关系;根据匹配关系建立非结构化的用户特征值与用户标识之间的关联关系,基于关联关系确定非结构化的用户特征值对应的人群包。由此,解决了相关技术中人群计算方法匹配用户人群不全面,导致适用性较差,无法满足业务需求等问题。

技术研发人员:杨春斌,武丽鸿,丁雪毅
受保护的技术使用者:芜湖雄狮汽车科技有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1