一种量化分析内容标签的互动和销售指标的分析方法与流程

文档序号:37167709发布日期:2024-03-01 12:10阅读:16来源:国知局
一种量化分析内容标签的互动和销售指标的分析方法与流程

本发明属于内容营销,更具体地说,涉及一种量化分析内容标签的互动和销售指标的分析方法。


背景技术:

1、社交媒体上的商品营销内容对于社交媒体站内电商平台上的商品销售有拉动作用。营销内容本身变化万千,为了量化分析营销内容的内容元素,可以将营销内容拆解为结构化的内容标签(内容元素),对内容标签可以分析其在内容的互动维度的指标(包括内容的曝光量、点赞数、转发数、评价数、收藏数等)。品牌商及内容创作者均有意愿获取内容标签对内容互动和商品销售维度的量化评估,从而指导营销内容的创作。而如何量化分析营销内容的内容标签对商品销售的影响作用,在内容营销行业内一直是一个较难的课题。

2、营销内容对商品销售的拉动有直接和间接的影响,部分营销内容有直接附上了站内商品链接,消费者可以直接点击购买,但部分消费者不一定马上购买而有可能过段时间再自行去购买;另一部分营销内容属于“种草”内容,并不直接给出商品链接,这种情况下营销内容对消费者购买决策的影响,更不容易评估。一般在平台后台,对于挂了商品链接的内容,可以有这部分商品的从内容转化的销量数据,但该数据只有平台本身拥有且不公开,除了平台本身之外很难有机构能对行业数据进行分析。并且,营销内容对消费者购买的间接影响的量化评估,品牌商及内容创作者通常也很难获取。

3、针对上述问题也进行相应的改进,如中国专利申请号cn202110787436.x,公开日为2021年10月29日,该专利公开了一种智慧银行多渠道协作营销系统及方法,包括:从自有渠道和营销渠道采集数据,得到用户信息;对用户信息进行分析,得到有效信息;将有效信息和银行产品进行匹配;采用银行自有渠道分别对产品营销内容进行投放。该专利的不足之处在于:精准投放的精准度较差,匹配精度有待提高。

4、又如中国专利申请号cn202110319997.7,公开日为2021年6月15日,该专利公开了一种自助式视频营销管理系统,包括:网络爬虫模块,用于基于预设的营销视频特征参数在各大视频播放平台上爬取对应的营销视频播放量、点赞量和评论量;观众群定位模块,用于实现点赞人群和评论人群账户信息的分析,从而定位该营销视频所适配的观众群特征,并构建观众群特征配置模型;评论分析模块,用于挖掘存在价值的评论数据,并实现评论数据的处理分析;视频内容改进建议模块,用于根据评论数据的处理分析结果生成对应的视频内容改进建议;营销视频定向投放模块,用于根据观众群定位模块的定位结果实现营销视频的定向投放。该专利的不足之处在于:虽能够根据定位结果实现营销视频的定向投放,但准确度较差。


技术实现思路

1、1、要解决的问题

2、针对现有营销内容创作困难且不精准的问题,本发明提供一种量化分析内容标签的互动和销售指标的分析方法。本发明通过内容互动指标和商品销售指标量化评估内容标签在内容互动和商品销售上的影响,对内容标签进行量化的比较,使得营销内容的创作简单可行且精准,节省人力成本以及资源成本。

3、2、技术方案

4、为解决上述问题,本发明采用如下的技术方案。

5、一种量化分析内容标签的互动和销售指标的分析方法,包括以下步骤:

6、获取社交媒体平台的内容数据库,并对内容数据库中的内容进行打标签处理得到内容标签,且对内容数据库添加商品spu(standard product unit,标准化产品单元)标签;

7、获取社交媒体平台内电商平台的电商商品数据库,并对商品数据库添加商品spu标签;

8、计算所有内容标签的内容互动指标和计算所有内容标签的商品销售指标;

9、对内容互动指标和商品销售指标进行可视化分析。

10、更进一步的,所述计算内容互动指标包括如下步骤:

11、确定内容数据库中的商品品类,并统计该商品品类在设定时间段内的所有内容标签k的内容数量n,得到关于内容的集合ck={内容1,内容2,...,内容n};

12、计算内容集合中每个内容的互动值ei:

13、ei=每个内容的点赞数+每个内容的转发数+每个内容的收藏数+每个内容的评价数;或

14、ei=每个内容的点赞数或每个内容的转发数或每个内容的收藏数或每个内容的评价数;

15、计算内容标签k的内容互动指标yk:

16、或者是

17、更进一步的,所述计算商品销售指标包括如下步骤:

18、确定内容数据库中的商品品类,并统计该商品品类在设定时间段内的所有内容标签k的内容数量n,得到关于内容的集合ck={内容1,内容2,...,内容n};

19、确定内容集合中单个内容i对应的m个商品spu,得到单个内容i对应的商品spu集合pi={spu1,spu2,...,spum};

20、确定单个商品spu在设定时间段内每个日期的销售额;

21、确定某个日期d,单个内容i对单个商品spuj的销售额贡献值:

22、

23、其中,sales(j,d)为商品spuj在日期d的销售额;wi为单个内容i在日期d对商品spuj销售额的影响贡献权重;u为对于日期d在有效时间窗口内提到spuj的内容的总数量;

24、确定单个内容i对其内容中提及的商品pi={spu1,spu2,...,spum}销售额总计贡献值:

25、

26、其中,t为设定的计算内容从发布日期开始影响商品销量的时间窗口天数;

27、确定内容标签k对应的内容集合ck对商品销售影响的累计值:

28、计算内容标签k的销售指标xk:或其中p为内容标签k对应的内容集合ck对应的排重总商品spu数。

29、更进一步的,对内容互动指标和商品销售指标进行可视化分析具体包括如下步骤:

30、建立二维坐标系,将内容标签对应的销售指标作为x轴;内容标签对应的互动指标作为y轴;

31、确定所有内容标签的销售指标和互动指标的均值,以销售指标和互动指标的均值为界分为四个区域,将销售指标和互动指标分别放入四个区域内。

32、更进一步的,所述对内容数据库中的内容进行打标签处理得到内容标签具体包括如下步骤:

33、构建商品知识图谱;

34、构建内容品类数据库;获取媒体内容数据库,利用商品知识图谱从媒体内容数据库中筛选出各商品的品类相关的内容数据,构建为内容品类数据库;

35、对内容品类数据库进行信息抽取构建品类内容标签树,按照品类内容标签树将品类数据库中的数据进行打标签;其中该步骤具体包括如下步骤:

36、首先使用raner模型对内容品类数据库进行抽取人物实体、品类实体、品牌实体和商品属性实体;再使用大语言模型结合信息抽取式prompt和思维链总结式prompt对品类数据库进行语义识别并抽取人物实体,网络热词实体,用户痛点实体,产品特点实体,适用实体;最后进行实体结果融合得到最终的实体;

37、将最终的实体通过文本向量化模型将实体词转换成词向量;然后通过聚类算法得到若干类词向量;再然后通过大语言模型将每一类中的词归纳为一个或多个标签,利用大语言模型输出的关键词类型,构建树形结构的内容标签树,以及每个标签的关键词;

38、按照品类内容标签树将品类数据库中的内容文本进行打标签。

39、更进一步的,对内容文本进行打标签包括如下步骤:

40、对内容文本进行打标签处理时,判断内容文本是否进行过实体抽取;如果进行过实体抽取,则实体词成为候选标签;如果没有进行过实体抽取则进行实体抽取后,对识别到的实体词对应的标签加入候选标签集合;

41、且对标签树中的各标签对应的关键词或正则表达式,使用关键词匹配和正则表达式匹配,匹配到的标签也加入内容文本的候选标签集合;

42、使用大语言模型利用判别式prompt对该内容文本已经筛选出的所有候选标签进行判断,确定候选标签与对应的内容文本含义是否匹配;若匹配则确认该候选标签,若不匹配则进行修正。

43、更进一步的,构建内容品类数据库具体包括如下步骤:

44、采集各社交媒体内容信息,形成媒体内容数据库;

45、利用商品知识图谱对媒体内容数据库中的文本信息进行文本匹配,建立商品品类的内容初筛数据库;

46、对初筛数据库中的图片类型内容和视频类型内容分别进行转换成文本内容;

47、对初筛数据库进行精筛分类,判断文本内容是否与商品品类相关。

48、更进一步的,所述媒体内容数据库中仅存储原始文本描述信息:对于图文内容,存储其内容标题、内容文本和图片链接内容;对于视频内容,存储其内容标题和视频链接内容。

49、3、有益效果

50、相比于现有技术,本发明的有益效果为:

51、(1)本发明通过获取社交媒体平台的内容数据库以及社交媒体平台内的电商商品数据库,对内容数据库中的内容进行打标签处理后,根据电商商品数据库分别计算每个内容标签的内容互动指标和商品销售指标,继而对其进行可视化分析;整个数据来源仅通过社交媒体页面上公开的数据,不依赖于追踪用户行为链路,极大拓宽了使用对象的范围;同时通过内容互动指标和商品销售指标量化评估内容标签在内容互动和商品销售上的影响,从而对内容标签进行量化的比较,当品牌商或内容创作者需要创作商品营销内容时可以选择在该品类较为优质的标签,使得营销内容的创作简单可行且精准;节省人力成本以及资源成本;

52、(2)本发明通过构建商品知识图谱,利用商品知识图谱中实体与关系从媒体内容数据库中构建内容品类数据库,使得内容品类数据库的构建效率快,有效提高工作效率;当构建品类数据库完成后对其进行信息抽取构建内容标签树,在进行信息抽取时采用raner模型识别具象化实体,再利用大语言模型结合信息抽取式prompt和思维链总结式prompt识别抽象化实体,不同类型的实体采用不同的模型进行识别抽取,有效弥补单一模型进行实体抽取所造成的抽取识别不准确且实体召回不全的问题;最后再通过内容标签树对内容文本进行打标签;整个过程步骤流程简单不繁琐,实体抽取准确率较高,使得整体打标签的精度较高;同时效率快,减少人工成本与时间成本;

53、(3)本发明在对内容文本进行打标签时先对内容文本进行判断是否进行实体抽取以此来提高工作效率,节省时间;已经进行实体抽取过的实体词成为候选标签,没有进行实体抽取的则进行实体抽取过后成为候选标签,同时对获取的候选标签集合进行判别,避免其存在潜在错误的可能,尽可能提升召回率(减少遗漏)的同时,利用大语言模型的语义理解能力,尽可能过滤掉关键词匹配到但语义上错误的实体,且尽可能过滤掉前面大语言模型可能给出的原文中并不存在的实体词,提高精确率;

54、(4)本发明在构建内容品类数据库时包括先对媒体内容数据库进行初筛,得到初筛数据库,随后再对初筛数据库中的图片以及视频内容进行分别转换为文本内容,最后再进行精筛分类得到最终的品类数据库;先低成本快速初筛,缩小数据范围再进行精筛的处理流程,整体保证精准的前提下降低成本的同时提高效率;并且媒体内容数据库中仅存储原始文本描述信息,大幅度降低存储成本。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1