一种基于评论文本的产品属性分析方法及设备与流程

文档序号:36171230发布日期:2023-11-24 08:49阅读:38来源:国知局
一种基于评论文本的产品属性分析方法及设备与流程

本技术涉及自然语言处理,尤其涉及一种基于评论文本的产品属性分析方法及设备。


背景技术:

1、随着互联网技术的发展,相继出现了众多电影、小说、电商等服务类平台,人们逐渐养成了在互联网相关平台分享体验的消费反馈模式,这些反馈以文本评论为主,提供了大量可借鉴分析的数据,一方面可以为受众群体提供重要的参考依据,另一方面可以帮助平台获取产品的优缺点,进而改善自己的产品。

2、但是,随着网上评论的持续增多,人们往往需要耗费大量的时间阅读评论,提取出与自己需求匹配的关键信息。而且,目前各服务平台获取用户对产品的好感度大多采用用户对整个产品的评分制,或者会提取评论中高度重合并具有代表性的分词及其频率,显示在评论区上方,帮助用户快速获取评论中的关键信息。但是这种方式存在提取属性无用、属性分类不够系统化,从而造成直观但是笼统,最终导致产品属性分析的准确性低。


技术实现思路

1、本技术实施例提供一种基于评论文本的产品属性分析方法及设备,用于解决产品属性分析的准确性低的问题。

2、本技术实施例采用下述技术方案:

3、一方面,本技术实施例提供了一种基于评论文本的产品属性分析方法,该方法包括:获取待分析产品的评论文本信息;对所述评论文本信息进行关键词提取,确定所述待分析产品的多个评论属性;根据所述多个评论属性,生成所述待分析产品的评论属性集合;从所述评论文本信息中,检索与所述评论属性集合中每个评论属性相关的多条评论文本信息,生成每个评论属性的评论文本组;在每个评论文本组中,对每条评论文本信息进行分词,得到所述每条评论文本信息的情感词,根据情感词典对所述情感词进行匹配,得到所述每条评论文本信息的情感分数;所述情感分数越高,用户对所述待分析产品的喜爱度越高;对所述每个评论文本组的多个情感分数进行求平均,得到所述每个评论属性的评分值。

4、一个示例中,所述对所述评论文本信息进行关键词提取,确定所述待分析产品的多个评论属性,具体包括:对所述评论文本信息进行预处理,得到有效评论文本信息;所述预处理包括数据清洗、数据去重、数据排空;通过jieba分词算法对所述有效评论文本信息进行分词,得到多个分词;通过停用词表对所述多个分词进行去除语气词,得到多个有效分词;通过tf-idf算法对每个有效分词进行权重计算,将权重值超过预设阈值的有效分词作为所述评论文本信息的关键词,将所述关键词确定为所述待分析产品的评论属性。

5、一个示例中,所述通过jieba分词算法对所述有效评论文本信息进行分词,得到多个分词,具体包括:获取标准自定义词典;所述标准自定义词典包括多个产品的描述词语;基于用户的操作,在所述标准自定义词典中添加与所述待分析产品的产品特性相关的产品常用词,得到更新的标准自定义词典;基于所述更新的标准自定义词典,通过jieba分词算法对所述有效评论文本信息进行分词,得到多个分词。

6、一个示例中,所述根据所述多个评论属性,生成所述待分析产品的评论属性集合,具体包括:根据所述多个评论属性,生成所述待分析产品的初始评论属性集合;判断评论属性的数量是否超过预设数量阈值;若否,则在自定义属性集合库中,查找与所述待分析产品关联的自定义属性集合;根据所述初始评论属性集合与所述自定义属性集合,生成所述待分析产品的评论属性集合;若是,则将所述待分析产品的初始评论属性集合确定为所述待分析产品的评论属性集合。

7、一个示例中,所述根据所述初始评论属性集合与所述自定义属性集合,生成所述待分析产品的评论属性集合,具体包括:将所述初始评论属性集合与所述自定义属性集合进行合并,得到合并属性集合;对所述合并属性集合中的评论属性进行查重,将重复的评论属性进行去重,得到有效评论属性;根据所述有效评论属性,生成所述待分析产品的评论属性集合。

8、一个示例中,所述对所述每个评论文本组的多个情感分数进行求平均,得到所述每个评论属性的评分值之后,所述方法还包括:获取多个产品分别对应的评论属性;通过基于物品的协同过滤算法与多个产品的评论属性,确定相似产品组合,并将所述相似产品组合中的每个产品标记为相似产品,所述每个产品之间均具有匹配的评论属性,将具有匹配关系的评论属性标记为相似评论属性;在每个相似产品组合中,获取用户针对第一相似产品的第一评论属性的历史情感分数;若所述历史情感分数大于预设分值阈值,则确定所述用户未评论过的第二相似产品;在第二相似产品中查找是否具有与所述第一评论属性相似的第二评论属性;若是,在所述第二评论属性的评分值大于预设评分阈值时,则将所述第二相似产品向所述用户进行推荐。

9、一个示例中,所述对所述每个评论文本组的多个情感分数进行求平均,得到所述每个评论属性的评分值之后,所述方法还包括:获取多个用户分别针对每个产品的评论属性的历史情感分数;通过基于用户的协同过滤算法与所述针对每个产品的评论属性的历史情感分数,确定相似用户组合,并将所述相似用户组合中的每个用户标记为相似用户,所述每个用户之间均具有共同评论的评论属性,且所述每个用户针对共同评论的评论属性的历史情感分数高于预设分值阈值;在每个相似用户组合中,获取第一相似用户评论过的参考产品组合;从所述参考产品组合中,筛选具有共同评论的评论属性的产品组合;在所述产品组合中,确定第二相似用户未评论过的产品,将所述产品向所述第二相似用户进行推荐。

10、一个示例中,所述获取待分析产品的评论文本信息,具体包括:确定所述待分析产品的上线时间;若所述上线时间晚于或等于预设上线时间,则获取所述待分析产品在所述上线时间之后的评论文本信息;若所述上线时间早于所述预设上线时间,则获取所述预设上线时间之后的评论文本信息。

11、另一方面,本技术实施例提供了一种基于评论文本的产品属性分析设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取待分析产品的评论文本信息;对所述评论文本信息进行关键词提取,确定所述待分析产品的多个评论属性;根据所述多个评论属性,生成所述待分析产品的评论属性集合;从所述评论文本信息中,检索与所述评论属性集合中每个评论属性相关的多条评论文本信息,生成每个评论属性的评论文本组;在每个评论文本组中,对每条评论文本信息进行分词,得到所述每条评论文本信息的情感词,根据情感词典对所述情感词进行匹配,得到所述每条评论文本信息的情感分数;所述情感分数越高,用户对所述待分析产品的喜爱度越高;对所述每个评论文本组的多个情感分数进行求平均,得到所述每个评论属性的评分值。

12、本技术实施例采用的上述至少一个技术方案能够达到以下有益效果:

13、能够在对评论文本信息进行关键词提取,确定所述待分析产品的多个评论属性之后,生成每个评论属性的评论文本组,从而计算每条评论文本信息的情感分数,得到每个评论属性的评分值,能够更高效准确地分析产品的各项评论属性,提供比较直观且客观的属性评分数据显示。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1