用户反馈数据处理方法和装置制造方法

文档序号:6534735阅读:168来源:国知局
用户反馈数据处理方法和装置制造方法
【专利摘要】本发明涉及信息处理领域,具体而言,涉及用户反馈数据处理方法及和装置。该方法,包括:利用标点符号对用户反馈数据进行切分;以每一个切分得到的语句为单位,进行操作:按照关键词词库对所述语句进行筛选处理,得到语句中包含的关键词,按照主题标签树,将包含关键词的设定级标签的标识度T加1,按照用户情感词库对经过筛选处理的所述语句进行处理,确定语句的情感,根据语句的情感确定设定级标签的极性,并将极性值加1,极性包括:批评P、表扬B、建议J;当所有切分得到的语句均进行以上操作后,根据每一个设定级标签的标识度T终和P终、B终、J终计算批评率、表扬率、建议率,得到处理结果。本发明处理数据快速、方便。
【专利说明】用户反馈数据处理方法和装置
【技术领域】
[0001]本发明涉及信息处理领域,具体而言,涉及用户反馈数据处理方法和装置。
【背景技术】
[0002]很多企业在售出产品或者服务后,会接到消费者大量的反馈意见。这些意见中,有的是表扬或者认可的,有的是批评或者抱怨的,还有一部分是即包括表扬又包括批评的,这些意见是实现企业信息闭 环、提高产品/服务质量的最好的信息源。然而,随着企业销售量的不断增加,会积累海量的意见数据,现有技术中,只能通过人为进行逐条辨别,费时又费力,导致企业基本没有利用好这部分反馈数据。

【发明内容】

[0003]本发明的目的在于提供用户反馈数据处理方法和装置,以解决用户反馈数据难以快速处理的问题。
[0004]在本发明的实施例中提供了一种用户反馈数据处理方法,包括:
[0005]利用标点符号对用户反馈数据进行切分;
[0006]以每一个切分得到的语句为处理单位,进行如下操作:
[0007]按照预先构建的关键词词库对所述语句进行筛选处理,得到所述语句中包含的关键词,
[0008]按照预先构建的主题标签树,将包含所述关键词的设定级标签的标识度T加1,
[0009]按照预先构建的用户情感词库对经过筛选处理的所述语句进行处理,确定所述语句的情感,根据所述语句的情感确定所述设定级标签的极性,并将所述极性值加1,所述极性包括:批评P、表扬B、建议J ;
[0010]当所有切分得到的语句均进行以上操作后,根据所述用户反馈数据中对应的每一个所述设定级标签的标识度T终和P终、B终、J终,按照批评率=P ? /T ? X 100%,表扬率=B终/T终X 100%,建议率=JS/Tft X 100%分别计算,得到处理结果,所述处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
[0011]在一些实施例中,优选为,所述标点符号包括以下任一种:句号、分号、感叹号。
[0012]在一些实施例中,优选为,所述关键词词库的预先构建包括:采集用户评价文本;抽取所述用户评价文本中的形容词、动词、象声词,构成关键词词库。
[0013]在一些实施例中,优选为,所述主题标签树的预先构建包括:采集用户评价文本;提取所述用户评价文本中的特征词;根据预设的主题类别分类体系,构建包含所述特征词的主题标签树。
[0014]在一些实施例中,优选为,所述用户情感词库的预先构建包括:采集用户评价文本;根据情感词库对所述用户评价文本进行提取情感词;将所有提取的情感词构成用户情感词库。
[0015]在一些实施例中,优选为,所述语句的情感的确定包括:按照预先设置的用户情感词库对所述语句进行处理;如果所述语句中含有否定词,则,定义所述语句的情感为批评;如果所述语句中不含有否定词,含有表扬词,则,定义该语句的情感为表扬;如果所述语句中不含有否定词,含有建议词,则,定义该语句的情感为建议;
[0016]所述设定级标签的极性的确定包括:当所述语句的情感为批评时,所述设定级标签的极性确定为批评;当所述语句的情感为表扬时,所述设定级标签的极性确定为表扬;当所述语句的情感为建议时,所述设定级标签的极性确定为建议。
[0017]本发明实施例中提供了一种上述用户反馈数据处理方法的用户反馈数据处理装置,包括:
[0018]切分模块,用于利用标点符号对用户反馈数据进行切分;
[0019]筛选模块,用于按照预先构建的关键词词库对所述语句进行筛选处理,得到所述语句中包含的关键词;
[0020]标识度生成模块,用于按照预先构建的主题标签树,将包含所述关键词的设定级标签的标识度TWi;
[0021]情感生成模块,用于按照预先构建的用户情感词库对经过筛选处理的所述语句进行处理,确定所述语句的情感;
[0022]极性生成模块,用于根据所述语句的情感确定所述设定级标签的极性,并将所述极性值加1,所述极性包括:批评P、表扬B、建议J ;
[0023]处理结果生成模块,用于当所有切分得到的语句均进行以上操作后,根据所述用户反馈数据中对应的每一个所述设定级标签的标识度和按照批评率=Pft/T终X 100%,表扬率=B终/T终X 100%,建议率=J终/T终X 100%分别计算,得到处理结果,所述处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
[0024]在一些实施例中,优选为,所述筛选模块包括:第一采集单元,用于采集用户评价文本;抽取单元,用于抽取所述用户评价文本中的形容词、动词、象声词,构成关键词词库。
[0025]在一些实施例中,优选为,所述标识度生成模块包括:第二采集单元,用于采集用户评价文本;第二提取单元,用于提取所述用户评价文本中的特征词;第二构建单元,用于根据预设的主题类别分类体系,构建包含所述特征词的主题标签树。
[0026]在一些实施例中,优选为,所述情感生成模块包括:第三采集单元,用于采集用户评价文本;第三提取单元,用于根据情感词库对所述用户评价文本进行提取情感词;第三构建单元,用于将所有提取的情感词构成用户情感词库。
[0027]本发明实施例提供的用户反馈数据处理方法和装置,与现有技术相比,对用户反馈数据进行切分,对切分的语句进行处理,先提取语句中的关键词,根据关键词获取包含关键词的设定级标签,并改变设定级标签的标识度;同时采用用户情感词库对语句中的情感进行分析,获取设定级标签的极性。然后通过计算公式能够得出用户反馈数据中包含的批评率、表扬率、建议率,完成用户反馈数据的处理结果。通过该方法能够处理上万条用户反馈数据,操作简单,处理方便、实用。
【专利附图】

【附图说明】
[0028]图1为本发明一个实施例中用户反馈数据处理方法的制备示意图;
[0029]图2为本发明一个实施例中用户反馈数据处理装置的结构示意图。【具体实施方式】
[0030]下面通过具体的实施例子并结合附图对本发明做进一步的详细描述。
[0031]考虑到众多用户反馈数据没有被处理,本发明提供一个用户反馈数据的处理方法。
[0032]本发明实施例提供的用户反馈数据处理方法,包括:
[0033]利用标点符号 对用户反馈数据进行切分;
[0034]以每一个切分得到的语句为处理单位,进行如下操作:
[0035]按照预先构建的关键词词库对语句进行筛选处理,得到语句中包含的关键词,
[0036]按照预先构建的主题标签树,将包含关键词的设定级标签的标识度T加1,
[0037]按照预先构建的用户情感词库对经过筛选处理的语句进行处理,确定语句的情感,根据语句的情感确定设定级标签的极性,并将极性值加1,极性包括:批评P、表扬B、建议J;
[0038]当所有切分得到的语句均进行以上操作后,根据用户反馈数据中对应的每一个设定级标签的标识度T终和P终、B终、J终,按照批评率=P终/T终X 100%,表扬率=B终/T终X 100%,建议率=J?/Tft X 100%分别计算,得到处理结果,处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
[0039]对应上述用户反馈数据处理方法的用户反馈数据处理装置,包括:
[0040]切分模块,用于利用标点符号对用户反馈数据进行切分;
[0041]筛选模块,用于按照预先构建的关键词词库对语句进行筛选处理,得到语句中包含的关键词;
[0042]标识度生成模块,用于按照预先构建的主题标签树,将包含关键词的设定级标签的标识度TWi;
[0043]情感生成模块,用于按照预先构建的用户情感词库对经过筛选处理的语句进行处理,确定语句的情感;
[0044]极性生成模块,用于根据语句的情感确定设定级标签的极性,并将极性值加I,极性包括:批评P、表扬B、建议J ;
[0045]处理结果生成模块,用于当所有切分得到的语句均进行以上操作后,根据用户反馈数据中对应的每一个设定级标签的标识度Ts和PS、BS、Js,按照批评率=PS/TS X 100%,表扬率=Bft/Tft X 100%,建议率=Jft/Tft X 100%分别计算,得到处理结果,处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
[0046]对用户反馈数据进行切分,对切分的语句进行处理,先提取语句中的关键词,根据关键词获取包含关键词的设定级标签,并改变设定级标签的标识度;同时采用用户情感词库对语句中的情感进行分析,获取设定级标签的极性。然后通过计算公式能够得出用户反馈数据中包含的批评率、表扬率、建议率,完成用户反馈数据的处理结果。通过该方法能够处理上万条用户反馈数据,操作简单,处理方便、实用。
[0047]接下来,本发明将详细描述该用户反馈数据处理方法,具体为,如图1所示:
[0048]步骤102,构建关键词词库;
[0049]考虑到后续需要从用户反馈数据处理需要提取关键词,而目前,已有的许多关键词词库并不符合用户反馈数据处理的需要,针对性差,提取的关键词不符合要求,因此,本发明针对服务、产品产生的用户评价进行提取构成关键词数据库,提高用户反馈数据处理中关键词数据库的针对性、准确程度。比如:对冰箱来说“滴滴声”,则是说明冰箱出现了问题,但是,在普通的词库中则作为一个普通的象声词处理。
[0050]具体包括:
[0051]采集用户评价文本;
[0052]抽取用户评价文本中的形容词、动词、象声词,构成关键词词库。
[0053]之所以抽取形容词、动词、象声词,是充分考虑了用户在描述某一项服务、某一个产品的使用效果时,通常会采用形容的词汇、象声词、以及动作类词来描述,因此,这种提取的关键词较为准确和全面。
[0054]步骤104,构建主题标签树;
[0055]考虑用户的反馈内容是多样化的,内容繁杂,有时一个相同的问题会出现多种表达的方式,因此,需要对多种表达进行汇总,且总结出一个合理的概括性主题,并将概括性的主题进行分层管理,形成标签树。
[0056]同时又鉴于目前的多种标签树仅是针对大众化来使用,无关于产品或服务的标签树,造成通过关键词找寻相应标签树时无所依从,因此,需要根据客户的评价文本建立针对性更强的主题标签树,并且需要将其中一级的标签树定义为标识级标签树,从而,在后续数据处理过程中进行标识度的增加,以便后续做批评率,表扬率,建议率的计算。构建主题标签书的具体操作为:
[0057]采集用户评价文本;
[0058]提取用户评价文本中的特征词;
[0059]根据预设的主题类别分类体系,构建包含特征词的主题标签树。
[0060]以电视为例,其标签树的一部分如表1:
[0061]表I电视领域产品使用方便的标签树
[0062]
【权利要求】
1.一种用户反馈数据处理方法,其特征在于,包括: 利用标点符号对用户反馈数据进行切分; 以每一个切分得到的语句为处理单位,进行如下操作: 按照预先构建的关键词词库对所述语句进行筛选处理,得到所述语句中包含的关键词, 按照预先构建的主题标签树,将包含所述关键词的设定级标签的标识度T加1, 按照预先构建的用户情感词库对经过筛选处理的所述语句进行处理,确定所述语句的情感,根据所述语句的情感确定所述设定级标签的极性,并将所述极性值加1,所述极性包括:批评P、表扬B、建议J ; 当所有切分得到的语句均进行以上操作后,根据所述用户反馈数据中对应的每一个所述设定级标签的标识度T终和P终、B终、J终,按照批评率=P ^/T ^ X 100%,表扬率=B纟冬/T终X 100%,建议率=Jft/Tft X 100%分别计算,得到处理结果,所述处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
2.根据权利要求1所述的用户反馈数据处理方法,其特征在于,所述标点符号包括以下任一种:句号、分号、感叹号。
3.根据权利要求1所述的用户反馈数据处理方法,其特征在于,所述关键词词库的预先构建包括: 采集用户评价文本; 抽取所述用户评价文本中的形容词、动词、象声词,构成关键词词库。
4.根据权利要求1所述的用户反馈数据处理方法,其特征在于,所述主题标签树的预先构建包括: 采集用户评价文本; 提取所述用户评价文本中的特征词; 根据预设的主题类别分类体系,构建包含所述特征词的主题标签树。
5.根据权利要求1所述的用户反馈数据处理方法,其特征在于,所述用户情感词库的预先构建包括: 采集用户评价文本; 根据情感词库对所述用户评价文本进行提取情感词; 将所有提取的情感词构成用户情感词库。
6.根据权利要求1-5任一项所述的用户反馈数据处理方法,其特征在于, 所述语句的情感的确定包括:按照预先设置的用户情感词库对所述语句进行处理;如果所述语句中含有否定词,则,定义所述语句的情感为批评;如果所述语句中不含有否定词,并含有表扬词,则,定义该语句的情感为表扬;如果所述语句中不含有否定词,并含有建议词,则,定义该语句的情感为建议; 所述设定级标签的极性的确定包括:当所述语句的情感为批评时,所述设定级标签的极性确定为批评;当所述语句`的情感为表扬时,所述设定级标签的极性确定为表扬;当所述语句的情感为建议时,所述设定级标签的极性确定为建议。
7.—种权利要求1-6任一项所述的用户反馈数据处理方法的用户反馈数据处理装置,其特征在于,包括:切分模块,用于利用标点符号对用户反馈数据进行切分; 筛选模块,用于按照预先构建的关键词词库对所述语句进行筛选处理,得到所述语句中包含的关键词; 标识度生成模块,用于按照预先构建的主题标签树,将包含所述关键词的设定级标签的标识度TWi; 情感生成模块,用于按照预先构建的用户情感词库对经过筛选处理的所述语句进行处理,确定所述语句的情感; 极性生成模块,用于根据所述语句的情感确定所述设定级标签的极性,并将所述极性值加1,所述极性包括:批评P、表扬B、建议J ; 处理结果生成模块,用于当所有切分得到的语句均进行以上操作后,根据所述用户反馈数据中对应的每一个所述设定级标签的标识度I?和B” Jft,按照批评率=Pft/T终X 100%,表扬率=B终/T终X 100%,建议率=J终/T终X 100%分别计算,得到处理结果,所述处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
8.根据权利要求6所述的用户反馈数据处理装置,其特征在于,所述筛选模块包括: 第一采集单元,用于采集用户评价文本; 抽取单元,用于抽取所述用户评价文本中的形容词、动词、象声词,构成关键词词库。
9.根据权利要求7所述的用户反馈数据处理装置,其特征在于,所述标识度生成模块包括: 第二采集单元,用于采集用户 评价文本; 第二提取单元,用于提取所述用户评价文本中的特征词; 第二构建单元,用于根据预设的主题类别分类体系,构建包含所述特征词的主题标签树。
10.根据权利要求7-9任一项所述的用户反馈数据处理装置,其特征在于,所述情感生成模块包括: 第三采集单元,用于采集用户评价文本; 第三提取单元,用于根据情感词库对所述用户评价文本进行提取情感词; 第三构建单元,用于将所有提取的情感词构成用户情感词库。
【文档编号】G06F17/30GK103678720SQ201410001108
【公开日】2014年3月26日 申请日期:2014年1月2日 优先权日:2014年1月2日
【发明者】蔡华利, 康键, 崔艳武, 吴芳, 王立志, 杨利飞 申请人:中国标准化研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1