基于文本挖掘驱动的产品升级策略的获取方法及装置与流程

文档序号:16754635发布日期:2019-01-29 17:14阅读:178来源:国知局
基于文本挖掘驱动的产品升级策略的获取方法及装置与流程
本发明涉及数据处理
技术领域
,尤其涉及一种基于文本挖掘驱动的产品升级策略的获取方法及装置。
背景技术
:目前,为获得产品属性的满意度和重要性,相关人员需要设计调查问卷或安排访谈等形式,然后由用户填写问卷或访谈记录得到满意度和重要性。之后,基于满意度和重要性,利用ipa(importance-performanceanalysis,重要性-表现程度)模型分析产品的升级策略。然后,设计问卷、调查问卷或用户访谈都需要耗费大量的人力成本和时间成本,且样本量小,及时性差,使得到的产品升级策略往往达不到满意的效果。技术实现要素:针对现有技术中的缺陷,本发明提供了一种基于文本挖掘驱动的产品升级策略的获取方法及装置,用于解决现有技术中通过问卷或访谈方式来获得的升级策略的效果不佳的问题。第一方面,本发明实施例提供了一种基于文本挖掘驱动的产品升级策略的获取方法,包括:针对预先构建的产品属性术语库中的各产品属性,获取所述产品属性的满意度和重要性;基于预先设置的sipa模型,根据所述产品属性的满意度和重要性获取所述产品属性的分类;基于分类和升级策略的对应关系,依据所述分类获取升级策略。可选地,预先设置的产品发生术语库通过以下步骤获取,包括:利用预先设置的pos词性分析方法,获取出现次数超过预先设置的次数阈值的名词或者名词短语,得到目标产品的产品术语候选集;通过众包形式剔除所述产品术语候选集中的非产品属性术语;依据同义词库合并剔除非产品属性术语后的产品术语候选集中的产品属性术语,得到产品属性术语库。可选地,获取产品属性的满意度包括:获取包括所述产品属性相关联术语的至少一条评论语句;针对每条评论语句,依据情感词典方法判别所述产品属性的情感极性;所述情感极性至少包括正面情感极性和负面情感极性;获取所述产品属性中正面情感极性在所有情感极性中的占比,得到所述产品属性的满意度。可选地,获取所述产品属性的重要性包括:调用预先训练的有序选择模型;将所述产品属性的正面情感和负面情感输入至所述有序选择模型,得到所述产品属性正面情感和负面情感的重要性系数。可选地,所述有序选择模型为:式中,xk=(xk,l,pos,xk,l,neg),表示第k位客户对产品属性的正面情感和负面情感;yk表示对产品打分的等级,等级1表示低分,等级2表示中等分,等级3表示高分;β=(βl,pos,βl,neg),表示产品属性的正面情感和负面情感的重要性系数。可选地,基于预先设置的sipa模型,根据所述产品属性的满意度和重要性获取所述产品属性的分类包括:若所述正面情感的重要性系数为第一等级、所述负面情感的重要性系数为第一等级且所述产品属性的满意度为第三等级,则所述产品属性属于第一分类;若所述正面情感的重要性系数为第一等级、所述负面情感的重要性系数为第一等级且所述产品属性的满意度为第四等级,则所述产品属性属于第二分类;若所述正面情感的重要性系数为第一等级、所述负面情感的重要性系数为第二等级且所述产品属性的满意度为第四等级,则所述产品属性属于第三分类;若所述正面情感的重要性系数为第一等级、所述负面情感的重要性系数为第二等级且所述产品属性的满意度为第四等级,则所述产品属性属于第四分类;若所述正面情感的重要性系数为第二等级、所述负面情感的重要性系数为第一等级且所述产品属性的满意度为第三等级,则所述产品属性属于第五分类;若所述正面情感的重要性系数为第二等级、所述负面情感的重要性系数为第一等级且所述产品属性的满意度为第四等级,则所述产品属性属于第六分类;若所述正面情感的重要性系数为第二等级、所述负面情感的重要性系数为第二等级且所述产品属性的满意度为第三等级,则所述产品属性属于第七分类;若所述正面情感的重要性系数为第二等级、所述负面情感的重要性系数为第二等级且所述产品属性的满意度为第四等级,则所述产品属性属于第八分类。可选地,若所述产品属性的满意度大于或者等于预先设置的满意度阈值,则所述满意度为第三等级;若所述产品属性的满意度小于所述满意度阈值,则所述满意度为第四等级。可选地,若所述正面情感的重要性系数大于或者等于预先设置的系数阈值,则所述重要性系数为第一等级;若所述正面情感的重要性系数小于所述系数阈值,则所述重要性系数为第二等级。可选地,满意度阈值为0.75,和/或,系数阈值为0.015。第二方面,本发明实施例提供了一种基于文本挖掘驱动的产品升级策略的获取装置,包括:第一获取模块,用于针对预先构建的产品属性术语库中的各产品属性,获取所述产品属性的满意度和重要性;第二获取模块,用于基于预先设置的sipa模型,根据所述产品属性的满意度和重要性获取所述产品属性的分类;策略获取模块,用于基于分类和升级策略的对应关系,依据所述分类获取升级策略。由上述技术方案可知,本发明实施例中可以预先构建产品属性术语库,通过产品属性术语库中每个产品属性可以得到相关联的在线产品评论,即本实施例中获取产品评论的方式简单,样本量大,可以降低获取评述内容的劳动量。然后,本实施例中通过获取所述产品属性的满意度和重要性,并基于预先设置的sipa模型,根据所述产品属性的满意度和重要性获取所述产品属性的分类;基于分类和升级策略的对应关系,依据所述分类获取升级策略。由于在线评论的时效性比较高,因此获取的升级策略也具有及时性好,有效性高的特点。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。图1为本发明实施例提供的一种基于文本挖掘驱动的产品升级策略的获取方法的流程示意图;图2为本发明实施例提供的构建产品属性术语库的流程示意图;图3为本发明实施例提供的获取产品属性满意度的流程示意图;图4为本发明实施例提供的获取下面情感和负面情感的重要性系数的流程示意图;图5为本发明实施例提供的sipa模型的示意图;图6为本发明实施例提供的基于文本挖掘驱动的产品升级策略的获取装置的框图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图1为本发明一实施例提供的基于文本挖掘驱动的产品升级策略的获取方法的流程示意图。参见图1,该基于文本挖掘驱动的产品升级策略的获取方法包括:101,针对预先构建的产品属性术语库中的各产品属性,获取所述产品属性的满意度和重要性。102,基于预先设置的sipa模型,根据所述产品属性的满意度和重要性获取所述产品属性的分类。103,基于分类和升级策略的对应关系,依据所述分类获取升级策略。可见,本实施例中获取产品评论的方式简单,样本量大,可以降低获取评述内容的劳动量。并且,在线评论的时效性比较高,因此获取的升级策略也具有及时性好,有效性高的特点。。下面结合附图和实施例对本发明实施例提供的基于文本挖掘驱动的产品升级策略的获取方法的各步骤作详细描述。首先,介绍101,针对预先构建的产品属性术语库中的各产品属性,获取所述产品属性的满意度和重要性的步骤。本实施例中,可以预先构建产品属性术语库。参见图2,首先,利用预先设置的pos词性分析方法,获取出现次数超过预先设置的次数阈值的名词或者名词短语,得到目标产品的产品术语候选集(对应步骤201)。其中,设置次数阈值的目的在于,筛选出频繁出现的产品属性,因此次数阈值可以根据具体场景进行调整,例如5-10次,在此不作限定。然后,本实施例通过众包形式剔除所述产品术语候选集中的非产品属性术语(对应步骤202)。之后,本实施例依据同义词库合并剔除非产品属性术语后的产品术语候选集中的产品属性术语,得到产品属性术语库(对应步骤203)。本实施例中,可以获取每个产品属性的满意度,参见图3,包括:首先,针对产品属性术语库中各产品属性,选择包括该产品属性相关联术语的至少一条评论语句(对应步骤301)。其次,针对每条评论语句,依据情感词典方法判别所述产品属性的情感极性;所述情感极性至少包括正面情感极性和负面情感极性(对应步骤302)。最后,分别统计产品属性的正面情感极性和负面情感极性的数量,获取产品属性中正面情感极性在所有情感极性中的占比,得到所述产品属性的满意度(对应步骤303)。满意度公式如下所示:式中,performance(xil)表示第i个产品的第l个属性的满意度,pos(xil)表示第i个产品的第l个属性正面情感极性的次数,neg(xil)表示第i个产品的第l个属性负面情感极性的次数。本实施例中,可以获取每个产品属性的满意度,参见图4,包括:首先,调用预先训练的有序选择模型(对应步骤401),公式如下所示:式中,xk=(xk,l,pos,xk,l,neg),表示第k位客户对产品属性的正面情感和负面情感;yk表示对产品打分的等级,等级1表示低分,等级2表示中等分,等级3表示高分;β=(βl,pos,βl,neg),表示产品属性的正面情感和负面情感的重要性系数。然后,本实施例中将产品属性的正面情感和负面情感输入至所述有序选择模型,得到产品属性正面情感和负面情感的重要性系数(对应步骤402)。这样,本实施例中通过样本数据训练得到产品属性正面情感和负面情感的重要性系数βl,pos和βl,neg。其次,介绍102,基于预先设置的sipa模型,根据所述产品属性的满意度和重要性获取所述产品属性的分类的步骤。本实施例中,基于预先设置的sipa模型,根据产品属性的满意度和重要性获取产品属性的分类,包括:若所述正面情感的重要性系数为第一等级、所述负面情感的重要性系数为第一等级且所述产品属性的满意度为第三等级,则所述产品属性属于第一分类。若所述正面情感的重要性系数为第一等级、所述负面情感的重要性系数为第一等级且所述产品属性的满意度为第四等级,则所述产品属性属于第二分类。若所述正面情感的重要性系数为第一等级、所述负面情感的重要性系数为第二等级且所述产品属性的满意度为第四等级,则所述产品属性属于第三分类。若所述正面情感的重要性系数为第一等级、所述负面情感的重要性系数为第二等级且所述产品属性的满意度为第四等级,则所述产品属性属于第四分类。若所述正面情感的重要性系数为第二等级、所述负面情感的重要性系数为第一等级且所述产品属性的满意度为第三等级,则所述产品属性属于第五分类。若所述正面情感的重要性系数为第二等级、所述负面情感的重要性系数为第一等级且所述产品属性的满意度为第四等级,则所述产品属性属于第六分类。若所述正面情感的重要性系数为第二等级、所述负面情感的重要性系数为第二等级且所述产品属性的满意度为第三等级,则所述产品属性属于第七分类。若所述正面情感的重要性系数为第二等级、所述负面情感的重要性系数为第二等级且所述产品属性的满意度为第四等级,则所述产品属性属于第八分类。在一实施例中,若所述产品属性的满意度大于或者等于预先设置的满意度阈值,则所述满意度为第三等级;若所述产品属性的满意度小于所述满意度阈值,则所述满意度为第四等级。其中,满意度阈值可以为0.75。在另一实施例中,若所述正面情感的重要性系数大于或者等于预先设置的系数阈值,则所述重要性系数为第一等级;若所述正面情感的重要性系数小于所述系数阈值,则所述重要性系数为第二等级。其中,系数阈值可以为0.015。再次,介绍103,基于分类和升级策略的对应关系,依据所述分类获取升级策略的步骤。本实施例中,分类和升级策略的对应关系可以预先设置,可以包括:第一类产品属性是客户期望型需求,且客户满意度高,则升级策略可以是“需要持续创新,加强优势”。第二类产品属性是客户期望型需求,但是客户满意度低,则升级策略可以是“需要优先改进,缩短差距”。第三类产品属性是客户魅力型需求,且客户满意度高,则升级策略可以是“需要跟踪市场,保持优势”。第四类产品属性是客户魅力型需求,且客户满意度低,则升级策略可以是“在资金充足条件下,加强创新,建立优势”。第五类产品属性是客户基本型需求,且客户满意度高,则升级策略可以是“采取保守态度,谨慎创新”。第六类产品属性是客户基本型需求,且客户满意度低,则升级策略可以是“需要重点改进,降低抱怨”。第七类产品属性是客户无差异型需求,且客户满意度高,则升级策略可以是“保持性能,避免过度投入”。第八类产品属性是客户无差异型需求,且客户满意度低,则升级策略可以是“在低投入条件下,针对抱怨适当改进”。下面结合具体实施例和场景对本发明提供的基于文本挖掘驱动的产品升级策略的获取方法作示例性描述。首先,本实施例收集待分析产品及其竞争产品的在线产品评论,包括:传祺gs4,荣威rx5,长安cs75,远景suv,哈弗h6,比亚迪宋,博越和宝骏560。然后,本实施例中提供在线产品评论的特征,可以得到13个关键产品属性。对各产品属性的情感极性进行分析,并统计每个产品属性的满意度,结果如表1所示。表1,传祺gs4各产品属性的满意度本实施例中,通过求解有序选择模型,获取各个产品属性的正面情感和负面情感的重要性的大小和显著性,结果如表2所示:表2,产品属性正负面情感的重要性产品属性系数std.eroorp-value外观-正面0.02230.0073***外观-负面-0.08780.0279***油耗-正面0.01960.0113*油耗-负面-0.02270.0104**空间-正面0.08150.0073***空间-负面0.00500.01240.686配置-正面0.00970.00900.281配置-负面-0.03340.0259*动力-正面0.02020.0089**动力-负面-0.07790.0110***价格-正面0.03270.0250*价格-负面-0.00560.0115*内饰-正面0.02800.0097**内饰-负面-0.04110.0183***天窗-正面0.07700.0132***天窗-负面-0.00820.02310.723舒适-正面0.03870.0131***舒适-负面-0.02080.02910.476做工-正面0.01110.01900.558做工-负面-0.02040.02500.416用料-正面0.08840.0173***用料-负面-0.03950.0228*座椅-正面0.01200.02130.573座椅-负面-0.02750.0222*安全-正面0.01570.01770.375安全-负面-0.04820.0289*最后,参见图5,本实施例通过融合产品属性情感极性的sipa模型,将长安cs75的13个产品属性划分为8个类别,分别制定升级策略,结果如表3所示。表3、传祺gs4的产品属性分类及其升级策略属性类别产品属性升级策略第一类外观;油耗持续创新,加强优势第二类动力;内饰;用料优先改进,缩短差距第三类空间;舒适跟踪市场,保持优势第四类价格;天窗加强创新,建立优势第五类配置保守态度,谨慎创新第六类座椅;安全重点改进,降低抱怨第七类-保持性能,避免过度第八类做工低投入下,适当改进可见,本实施例中,可以利用社交媒体上的在线产品评论分析产品升级策略,可以实时获取,获取容易,可以降低时间成本和人力成本。并且,样本数量足够大且有效性强,有利于提升分类和升级策略的准确度。图6为本发明一实施例提供的基于文本挖掘驱动的产品升级策略的获取装置的框图。参见图6,基于文本挖掘驱动的产品升级策略的获取装置包括:第一获取模块601,用于针对预先构建的产品属性术语库中的各产品属性,获取所述产品属性的满意度和重要性;第二获取模块602,用于基于预先设置的sipa模型,根据所述产品属性的满意度和重要性获取所述产品属性的分类;策略获取模块602,用于基于分类和升级策略的对应关系,依据所述分类获取升级策略。需要说明的是,本发明实施例提供的基于文本挖掘驱动的产品升级策略的获取装置与上述方法是一一对应的关系,上述方法的实施细节同样适用于上述装置,本发明实施例不再对上述系统进行详细说明。本发明的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1