一种基于文本和图片内容的用户评论分析方法与流程

文档序号:18797279发布日期:2019-09-29 19:53阅读:776来源:国知局
一种基于文本和图片内容的用户评论分析方法与流程

本发明涉及电子商务相关技术领域,具体为一种基于文本和图片内容的用户评论分析方法。



背景技术:

近年来随着互联网的不断发展,电子商务平台运用在服装、美妆、书籍、食品农副产品等各个方面。其中消费之后的用户评论,是对商家及产品的最真实反应,可以为其他消费者提供更加透明的信息,有助于消费者进一步的了解商家和产品的真实情况。然而而用户的评论往往良莠不齐。优质的用户评论会正确的引导消费者在游戏内养殖和购物,而劣质评论将会降低消费者消费的信心以及对电商平台的好感度。另外,目前的电商平台对用户评论的分析和筛选也只是由评论的文本长度或是打分情况决定,忽略了文本中的用户观点、情感趋向以及图片评价的重要性。

cn106355455a公开了一种从网购用户评论中抽取产品特征信息的方法,通过对用户评论进行组块分析,抽取名词性信息,搜索频繁项并过滤非产品特征。该方法仅限于提取产品名词性信息,功能单一,并不能深度挖掘用户评论中的有效信息。

cn104123358a和cn108776864a分别对用户评论文本内容进行关键词提取并匹配和神经网络训练模型来对用户评论进行分析和估值,但是数据源单一,未考虑到用户评论中图片评论的重要性。



技术实现要素:

本发明的目的在于提供一种基于文本和图片内容的用户评论分析方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:一种基于文本和图片内容的用户评论分析方法,该种基于文本和图片内容的用户评论分析方法包括以下基本步骤:

步骤一,录入app内用户关于商品的评论数据:所述用户评论数据包括用户在进行商品评价时的打分数据、文本数据、图片数据。

步骤二,对用户评论进行关于商品的分类:根据app的服务器中的商品类别信息对用户评论进行归类

步骤三,提取用户评论中的文本评论,对其进行观点评价:采用lda模型,将词频按照观点分为不同的主题,并赋予相应的分值。

步骤四,提取用户评论中的文本内容、图片内容、商品打分信息,对其进行评价:分别对文本内容、图片内容采用情感分析、模板匹配进行评价并计算出相应的分值,然后对三者赋予预设的权值,进行计算,得出一个综合评价。

步骤五,将用户评论的综合评价与用户评论中的观点评价相结合:分别对综合性评分和观点性评分赋予预设的权值,进行加权计算,得出最后的用户评论得分。

步骤六,根据各商品分类下用户评论的最终得分,对用户评论进行排名,择优向用户推荐。

优选的,所述步骤一中,在录入关于商品的评论数据后,进行数据的预处理。

优选的,所述步骤三中,在提取文本评论后,进行观点分析,包括以下步骤:

s1.1基于lda模型提取文本评论的观点属性面,挖掘关于观点的各个属性词。

s1.2根据通过lda提取到的属性词,利用word2vec模型计算属性词之间的关系,将每个属性词映射到一个低维稠密的实数向量空间,在空间上,语义相似的词汇聚成一个属性面。

s1.3根据属性词构建一个打分矩阵,首先根据属性词进行打分,得到用户i对评论j的sk属性面的偏好度为:

其中,为主题词ωn在属性面sk分布的概率值,属性面sk由主题sn根据word2vec模型汇聚而成,n表示采集到评论文本的总用户数。

再结合关注度的影响,得到用户i对评论j的sk属性面综合评分:

fijk=θiksijk

其中lda模型中得到的文档—主题分布矩阵θik用于表达用户i对第k个属性面的关注度。

优选的,所述步骤四中,所述文本评价包括以下步骤:

s2.1对提取到的每一条用户评论,将其解析成单词的序列

w=<ω1,ω2,...,ωn>,其中ω为单词,n为每条评论中中包含的单词总数;

s2.2然后对照情感词库,提取其中的情感词并对其打分,完成单词打分后汇总成句子的情感得分,公式如下:

r代表待评分的用户评论,s(w)代表对单词或词组的评分,n是句子中单词总数。根据已制定和公开的情感词库将情感词分为积极、中性、消极三个词性,其中积极词性打分为1,中性词性打分为0,消极词性打分为-1。

优选的,所述步骤四中,所述的图片评价包括以下步骤:

s3.1获取参考图片s,并为其特征区域进行标注;参考图片为电商平台下各商品的实物图;

s3.2获取用户评论中的图片部分,并进行图片预处理,为其特征区域标注为模板t(m,n);

s3.3然后将待评价的图片和标注过特征区域的参考图片采用模板匹配归一化算法进行匹配,公式如下:

其中,sij是参考图片s的子图,r(i,j)是模板匹配的相关系数,r值越大,匹配度越高。

s3.4设定一个阈值,为匹配度r大于阈值的待评价图片打分。

优选的,所述步骤四中,所述的综合评价应表示为:

s=α1n1+α2n2+α3n3

其中α1,α2,α3分别为用户评论中文本评论、图片评论、商品打分所占的权值,n1,n2,n3分别为文本评论、图片评论、商品打分三者经处理过后的分值,s是经过计算的综合评价。

优选的,所述步骤五中,所述的用户评论的最终得分应表示为:

f=β1s1+β2s2

其中β1,β2分别为文本评论观点评价分值、用户评论综合评价分值所占的权重,s1,s2分别为观点评价分值和综合评价分值,f是经过计算后的用户评论最终分值。

与现有技术相比,本发明的有益效果是:

综上所述,本发明具有以下有益效果:

1、精细化的用户评论分析方案,便于进一步了解用户对商品的反馈情况,提供给用户更贴心的服务。

2、通过对用户评论的分析,可以了解到平台的不足,了解用户真实的想法,整合目前电商平台应具备的功能,便于企业对平台的合理定位。

附图说明

图1是用户评论分析方法的总体流程示意图;

图2是文本评论观点属性面提取的示意图;

图3是用户评论综合评价的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-3,本发明提供一种技术方案:一种基于文本和图片内容的用户评论分析方法,

如图1所示,通过采集用户关于商品订单的评论信息,进行数据的预处理,去除无价值的信息,并提取出用户评论中的文本内容、图片内容、商品打分内容,首先对其文本内容进行观点评价,之后结合文本内容、图片内容、商品打分内容进行综合评价,最后将观点评价和综合评价相结合,按照最终分值对用户评论进行排名。

如图2所示,文本内容的观点评价包括以下步骤:

s1.1基于lda模型提取文本评论的观点属性面,挖掘关于观点的各个属性词。

s1.2根据通过lda提取到的属性词,利用word2vec模型计算属性词之间的关系,将每个属性词映射到一个低维稠密的实数向量空间,在空间上,语义相似的词汇聚成一个属性面。

s1.3根据属性词构建一个打分矩阵,首先根据属性词进行打分,得到用户i对评论j的sk属性面的偏好度为:

其中,为主题词ωn在属性面sk分布的概率值,属性面sk由主题sn根据word2vec模型汇聚而成,n表示采集到评论文本的总用户数。

再结合关注度的影响,得到用户i对评论j的sk属性面综合评分:

fijk=θiksijk

其中lda模型中得到的文档—主题分布矩阵θik用于表达用户i对第k个属性面的关注度。

如图3所示,文本评价包括以下步骤:

s2.1对提取到的每一条用户评论,将其解析成单词的序列

w=<ω1,ω2,...,ωn>,其中ω为单词,n为每条评论中中包含的单词总数;

s2.2然后对照情感词库,提取其中的情感词并对其打分,完成单词打分后汇总成句子的情感得分,公式如下:

r代表待评分的用户评论,s(w)代表对单词或词组的评分,n是句子中单词总数。根据已制定和公开的情感词库将情感词分为积极、中性、消极三个词性,其中积极词性打分为1,中性词性打分为0,消极词性打分为-1。

如图3所示,图片评价包括以下步骤:

s3.1获取参考图片s,并为其特征区域进行标注;参考图片为电商平台下各商品的实物图;

s3.2获取用户评论中的图片部分,并进行图片预处理,为其特征区域标注为模板t(m,n);

s3.3然后将待评价的图片和标注过特征区域的参考图片采用模板匹配归一化算法进行匹配,公式如下:

其中,sij是参考图片s的子图,r(i,j)是模板匹配的相关系数,r值越大,匹配度越高。

s3.4设定一个阈值,为匹配度r大于阈值的待评价图片打分

如图3所示,用户评论的综合评价应表示为:

s=α1n1+α2n2+α3n3

其中α1,α2,α3分别为用户评论中文本评论、图片评论、商品打分所占的权值,n1,n2,n3分别为文本评论、图片评论、商品打分三者经处理过后的分值,s是经过计算的综合评价。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1