基于在线用户评论的产品功能特征重要性分析方法与流程

文档序号:16540178发布日期:2019-01-08 20:18阅读:482来源:国知局
基于在线用户评论的产品功能特征重要性分析方法与流程

本发明涉及计算机辅助设计,特别涉及一种基于在线用户评论的产品功能特征重要性分析方法。



背景技术:

用户需求所体现的用户对产品属性及所期望使用场景的满意度,确定了用户是否会购买或使用这个产品。因此,在开发一款产品时,企业将首先进行用户需求分析。随着互联网电子商务的发展,易于获取的在线用户评论成为用户需求的新来源。在电商平台上,一款畅销产品往往有成千上万条评论。相较于传统的通过问卷调查直接获取产品各项特性评价或期望,在线评论中用户对产品各方面特性的意见和态度都隐含在自然语言的文本表达中,需要预处理以获取对不同特性的评价。因此,面对激烈的市场竞争和越来越短的更新换代时间,则要求提供高效的基于在线评论的用户需求获取方法。

此外,众多用户的参与使得对产品各方面特性评价的可能存在明显的分歧和差异;用户需求是相对主观的对产品特性的感知和期望,无法直接用于指导系统的设计。因此,如何处理用户需求的分歧和争议,并将用户需求转化为对产品功能的要求并体现产品的不同功能对于提高用户满意度的重要性是需求分析的重点。

质量功能部署(qualityfunctiondeployment,qfd)将用户对产品的需求转换为产品开发过程中各阶段所用的工程特征(产品或系统相关的属性,功能和特征),以确保产品开发周期产生符合客户要求的结果。而在线用户评论的文本表达更具自发性和发散性,产品各方面需求的用户满意度和重要程度隐藏在数量庞大且无结构的评论文本中,因此直接使用qfd方法将在线评论中隐含的用户需求偏好转换为产品各工程特征的重要性存在挑战。

因此,从在线电子商务平台获取大量产品用户评论数据时,如何经过用户需求挖掘和分析,高效快速的捕获用户需求,并将用户需求偏好转换为产品设计中对应功能特征重要性,是目前亟需解决的问题。用户需求偏好是隐藏在评论中的用户对产品各方面特性的意见;功能特征是能够直接指导产品概念设计的系统功能需求,其重要性为设计者指明了功能设计的重点。



技术实现要素:

本发明的目的在于提供一种基于在线用户评论的产品功能特征重要性分析方法,可以自动从海量用户评论中挖掘出用户的需求偏好,直接将用户需求偏好映射为产品功能重要性的分析方法,具有最高重要性的功能特征成为产品开发过程中需要重点考虑和设计的功能,为用户驱动的产品设计指明了方向。

一种基于在线用户评论的产品功能特征重要性分析方法,包括以下步骤:

(1)基于用户评论文本,标注每条评论语句的产品需求类别;

(2)基于步骤(1)中被标注为每项需求的所有评论语句,计算每一条评论语句的用户评分,计算每项需求中用户评分的平均值得到用户对该项需求的总体评分;

(3)分析用户对每项需求的总体评分的差异度和评分区间的分布均匀性,并分别量化为h-硬争议性和s-软争议性;

(4)使用模糊推理,根据步骤(3)中的h-硬争议性和s-软争议、步骤(2)中的总体评分,获取用户对每项需求的满意度;

(5)基于所有类别需求的用户满意度、被用户提及的频率、及产品qfd矩阵中用户对每项需求与产品功能之间的权重关系,计算产品各项功能对于满足用户需求的重要性。

其中,用户评分体现了用户对该需求的情感态度,用户评分又称为情感极性评分。

在步骤(1)中,所述标注每条评论语句的产品需求类别的方法包括:

(1-1)从电子商务平台获取特定一种类型或特定一款产品的用户评论,通过自然语言处理方法自动将用户评论中的每句话处理为一个数据样本,由此构成数据集;

(1-2)对训练集中每条评论进行人工标注,添加类别标签后对textcnn网络模型进行训练;

(1-3)使用训练完好的textcnn网络模型,为收集到的同类型产品的标注每条评论语句,标注其所评价的产品需求类别。

用户评论属于短文本,因此使用文本分类算法,可以根据挖掘到的句子中隐含语义特征,将评论标注为对应的需求类型。textcnn是针对句子分类问题所提出的一个简单的cnn(convolutionalneuralnetwork)网络模型架构。通过微调少量超参数,该模型在面向情感分析和问题分类等多个不同应用的基准问题上效果显著。利用cnn标注文本的一个突出优点是能够自动获取文本的特征表达,避免繁杂的人工特征工程;同时应用cnn解决大规模分类问题,能够在较短的训练时间内获得良好的分类效果。因此,本发明选择使用textcnn作为本文中的用户评论自动标注的分类器。

对textcnn网络模型进行训练的方法为:

对于每一个需求类型的二分类模型,准备训练集和验证集,分别训练模型的参数及判断模型是否收敛。人工标注数据集时,对于每一个标签类别,在实验中所获取的评论样本是极度不均衡的,即负样本数量远超正样本数量。因此,采用重采样方式预处理模型每一次迭代的数据以均衡评论样本。

(1-2-1)首先分离所有数据集中的正负样本;然后选取所有正样本并随机抽取同等数量的负样本;最后打散并选取的正负样本作为一次迭代的样本集;

(1-2-2)在每一代的训练过程中,将样本集分为用于textcnn模型训练的训练集和检验textcnn模型分类准确度的验证集;使用十折交叉验证方法训练textcnn网络模型;

(1-2-3)同时,在训练中使用mini-batch训练协议,即每次采用多个训练样本来估计每一层网络神经元权值参数的梯度值;

(1-2-4)当完成每次验证阶段后,算法才进行下一次迭代,直到在验证集上的正样本识别精确度达到99.5%或者训练至最大迭代次数为止。

在步骤(2)中,所述总体评分的计算方法为:对于每项需求中的每一条评论语句,选择其中的名词、动词、形容词和副词,基于sentiwordnet计算每一条评论语句的用户评分;计算每项需求中用户评分的平均值,得到用户对每项需求的总体评分。

在步骤(3)中,所述h-硬争议性和s-软争议性的公式分别为:

其中,hi是对第i个用户需求的硬争议性的度量,是所有关于用户需求ri的评论的用户评分的平均分,rm是每一条与用户需求ri的相关的评论的用户评分,ni是与用户需求ri相关的评论总条数,ch是一个归一化因子;si是对第i个用户需求的软争议性的度量,pi,m是与i相关的所有用户评论中,在该用户需求上评分区间为(m-1,m+1]的比例,为归一化因子。

其中,h的值越低,评分越向均值附近集中,而h越高则表示用户对一个需求的评分没有达成共识;同样,如果所有评分都在同一个分数段,则s为0,而s的值越高,评分的分布越均匀。

在步骤(4)中,所述用户对每项需求的满意度的计算方法为:

(4-1)将h-硬争议性和s-软争议性作为输入,使用定义的模糊规则推导出争议性程度;

(4-2)将争议性程度和总体评分作为输入,使用定义的模糊规则,推导用户对每项需求的满意度。

在步骤(5)中,产品各项功能对于满足用户需求的重要性的计算公式为:

其中,importancei是第i个产品功能特征重要性的量化指标,satisfactionr是由模糊推理所确定的用户需求r的满意度,freqr是在所有用户评论中用户需求r的提及频率,而weightr,i则表示在qfd矩阵中,用户需求r与功能特征i之间关联关系的权重。

本发明提出了一种基于在线用户评论的产品功能特征重要性分析方法:首先结合在线评论这种新型的用户需求来源,基于卷积神经网络分类器和情感分析方法获取在线评论语句中隐藏的用户对产品各方面的需求偏好;其次,使用量化方法计算用户群体对产品需求偏好的分歧,并作将其为考虑因素之一,基于模糊推理确定各项需求的用户满意度;最后,基于qfd矩阵中用户需求与产品功能特征间的对应关系,计算各个产品功能对于满足用户需求的重要性。

本发明提供的方法可以以家电产品为研究对象,但不局限于此。

与现有技术相比,本发明的有益效果在于:

本发明提供的方法能够自动从海量用户评论中挖掘出用户的需求偏好,减轻了人工用户分析的工作量,提高了需求分析的效率;本发明提供的方法将用户对各项需求的整体评分,用户群体对需求评分的分歧,每项需求被提及的频率及用户需求与产品功能间的权重关系等进行综合考虑,直接将用户需求偏好映射为产品功能重要性,具有最高重要性的功能特征成为产品开发过程中需要重点考虑和设计的功能,为用户驱动的产品设计指明了方向,使得厂商能把有限的开发资源用在最重要的功能设计中。

附图说明

图1为本发明提供的基于在线用户评论的产品功能特征重要性分析方法的流程图;

图2为实施例1中对数据集中的评论语句添加类别标签的示意图;

图3为实施例1中基于模糊推理获取用户需求满意度的推理框架示意图;

图4为实施例1中h-硬争议性的隶属度函数;

图5为实施例1中s-软争议性的隶属度函数

图6为实施例1中单项需求争议程度的隶属度函数;

图7为实施例1中用户对单项需求总体评分的隶属度函数;

图8为实施例1中用户需求满意度的隶属度函数;

图9为实施例1中产品qfd矩阵图;

图10为实施例1中产品功能特征重要性的计算分析。

具体实施方式

如图1所示,本发明提供的基于在先用户评论的产品功能特征重要性分析方法包括以下步骤:

首先收集在线评论:根据企业所开发产品的领域和类别,从电子商务平台获取同种类产品的用户评论数据作为数据集;接下来使用自然语言处理技术对评论数据进行清洗,并使用深度卷积神经网络自动标注用户评论语句隐含的需求类别,并情感分析方法获取每一句用户的情感倾向评分,以此计算基于所有相关语句的特性需求类型的总体用户偏好评分;

然后,根据对每类需求情感分析的结果,计算该类型需求的用户整体评分及用户态度的争议程度,并使用模糊推理方法,以每类需求的总体评分和争议性程度为输入,获取用户对该需求的满意度;

最后基于qfd矩阵中需求与工程特征间的对应关系,计算出各个产品工程特征的重要性;在变更设计中考虑不同产品功能特征的重要性,将帮助生产方尽快修改设计并推出符合用户需求的产品。

实施例1

步骤一:在线用户评论分析

(1-1)用户评论获取。

从电子商务平台获取某类型或具体一款产品的用户评论,通过自然语言处理方法自动将评论中的每句话处理为一个数据样本,由此构成数据集。

(1-2)对数据集中每条评论进行人工标注,添加类别标签后对textcnn网络模型进行训练;使用训练完好的textcnn网络模型,为收集到的同类型产品的每条评论语句,标注其所评价的产品需求类别。

评论语句的类别标注示例如图2所示,如“但我非常喜欢这款吹风机,它更安静,即使在低温下也能快速干燥头发”,其标签为效率和噪声;如“不仅如此重要,它还非常漂亮”,其标签为外观。

用户评论属于短文本,因此使用文本分类算法,可以根据挖掘到的句子中隐含语义特征,将评论标注为对应的需求类型。textcnn是针对句子分类问题所提出的一个简单的cnncconvolutionalneuralnetwork)网络模型架构。通过微调少量超参数,该模型在面向情感分析和问题分类等多个不同应用的基准问题上效果显著。利用cnn标注文本的一个突出优点是能够自动获取文本的特征表达,避免繁杂的人工特征工程;同时应用cnn解决大规模分类问题,能够在较短的训练时间内获得良好的分类效果。因此,本发明选择使用textcnn作为本文中的用户评论自动标注的分类器。

对textcnn网络模型进行训练的具体方法为:

对于每一个需求类型的二分类模型,准备训练集和验证集,分别训练模型的参数及判断模型是否收敛。人工标注数据集时,对于每一个标签类别,在实验中所获取的评论样本是极度不均衡的,即负样本数量远超正样本数量。因此,采用重采样方式预处理模型每一次迭代的数据以均衡评论样本。

(1-2-1)首先分离所有数据集中的正负样本;然后选取所有正样本并随机抽取同等数量的负样本;最后打散并选取的正负样本作为一次迭代的样本集;

(1-2-2)在每一代的训练过程中,将整个样本集分为用于textcnn模型训练的训练集和检验textcnn模型分类准确度的验证集;同时,使用十折交叉验证方法训练textcnn网络模型;

(1-2-3)在训练中使用mini-batch训练协议,即每次采用多个训练样本来估计每一层网络神经元权值参数的梯度值;

(1-2-4)当完成每次验证阶段后,算法才进行下一次迭代,直到在验证集上的正样本识别精确度达到99.5%或者训练至最大迭代次数为止。

训练出的textcnn模型能够应用在更大规模的同类产品评论数据上,自动识别用户所评价的产品需求类别。

步骤二:基于情感词典sentiwordnet的用户需求偏好分析,计算每一条评论语句的用户评分,得到用户对每项需求的总体评分。

对于每一条评论语句,选择其中的名词、动词、形容词和副词并,基于sentiwordnet计算这句话的用户评分。对于每一种用户需求,则基于所有被标注用于该类标签的评论,计算这些评论的平均用户评分,作为该用户整体对该类型需求的情感态度(即总体评分,又称为用户态度)。

如果该评论的所有句子都只被标注为同一个用户需求,则直接使用用户评分作为该需求在这个评论中的情感态度得分。否则,对于该评论相关的每一个需求,选择被标注为该需求标签的所有句子,对它们的主观情感分数求均值,并将该值规范化并分段映射为(1,2,3,4,5)这五个取值。

步骤三:需求争议度计算-分析用户对每项需求的总体评分的差异度和评分区间的分布均匀性,并分别量化为h-硬争议性和s-软争议性。

根据获取的用户需求数据的统计,分析用户对产品各方面特性评分的分布均匀程度及方差,量化该项需求的争议程度。争议性的两种量化指标:h-硬争议性描述用户评分数据集的差异程度,s-软争议性描述用户评分在评分区间的分布均匀性。

其公式如下:

其中,hi是对第i个用户需求的硬争议性的度量,是所有关于用户需求ri的评论的情感得分的平均分,ni是与用户需求ri相关的评论总条数,ch是一个归一化因子。si是对第i个用户需求的软用户争议性的度量,pi,m是与i相关的所有用户评论中,在该用户需求上评分区间为(m-1,m+1]的比例,为归一化因子。

步骤四:需求满意度的模糊推理-获取用户对每项需求的满意度。

如图3所示,使用模糊推理方法,先基于h-硬争议性和s-软争议,使用9条模糊规则推导出需求的争议性程度;再以用户对每类需求的情感态度(总体评分)和争议性程度为输入,使用20条模糊规则,获取用户对每项需求的满意度。

图4、图5、图6分别给出了h-硬争议性,s-软争议性和最终争议性程度的隶属度函数。

在图4中,h-硬争议性的值被划分为低、中、高三个模糊集,及准确的h-硬争议性数值与这3个模糊集合的隶属度关系。

在图5中,s-软争议性的值被划分为低、中、高三个模糊集,及准确的s-软争议性数值与这3个模糊集合的隶属度关系。

在图6中,整体争议性程度的值被划分为低、中、高、很高这四个模糊集,及准确的整体争议性数值与这4个模糊集合的隶属度关系。

具体的,将硬争议性和软争议性分别根据各自的隶属度函数转换成模糊集合中相应语言变量对应隶属度后,这些隶属度与输入语言描述符一起被视为模糊推理过程的前提事实。最终的输出语言变量,即争议性也相应被划分到四个模糊区间:低、中、高、很高。

需求的争议性程度的模糊规则如表1所示。

表1争议性程度的模糊规则

图7和图8分别给出用户情感态度和满意度的隶属度函数。

在图7中,用户态度的值被划分为非常负面、负面、中立、正面、非常正面五个模糊集,及准确的用户态度数值与这5个模糊集合的隶属度关系。

在图8中,每项需求的用户满意度的值被划分为特别不满意、不满意、满意、很满意、特别满意五个模糊集,及准确的用户满意度数值与这4个模糊集合的隶属度关系。

需求满意度的模糊规则如表2所示。

表2需求满意度的模糊规则

步骤五:基于所有类别需求的用户满意度、被用户提及的频率、及产品qfd矩阵中用户对每项需求与产品功能之间的权重关系,计算产品各项功能对于满足用户需求的重要性。

综合考虑每项需求被用户提及的频率及用户满意度(暗示了需求在变更设计中的重要程度),以及qfd矩阵中每项用户需求与产品功能间的对应权重关系,使用公式,计算出产品每项功能的重要性。

其中,importancei是第i个产品功能特征重要性的量化指标。satisfactionr是由模糊推理所确定的用户需求r的满意度,去模糊化后的需求满意度取值区间为[0,1],值越大表明用户满意度越高,而在变更设计中需求被考虑的重要性程度与其满意度呈反相关;freqr是在所有用户评论中提及需求r的评论所占的频率,而weightr,i则表示在qfd中,需求r与功能特征i之间关联关系的权重。

图9显示了一个qfd矩阵的示例,给出了21种用户需求和26中产品工程特征间的关联关系,例如当想要评价在变更设计中“供应前部气流”这一功能特征的重要性时,需要考虑用户对“可靠性”、“价格”、“噪音”和“重量”这四个需求的满意程度和提及频率。同时,这四个需求作为考虑因素所占的权重分别为9,4,9,9。

图10展示了基于qfd矩阵中用户需求与产品功能特征间权重关联关系,根据上述公式计算出的各种产品功能特征的重要性排序,与其它功能特征相比,“加热前部气流”在产品的更新换代中具有最高的重要性,同时“提供可握性”、“允许控制冷/热爆裂”及“供应前部气流”也具有较高的重要性估值。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1