用户反馈信息的关键词处理方法、装置及服务器与流程

文档序号:12464614阅读:288来源:国知局
用户反馈信息的关键词处理方法、装置及服务器与流程
本公开涉及数据处理
技术领域
,特别涉及一种用户反馈信息的关键词处理方法、装置及服务器。
背景技术
:公司业务在运营过程中需要接收并处理大量的用户反馈数据。为了方便运营人员进行处理,需要从每一条反馈数据中提取出关键词,这些关键词不仅可以使运营人员迅速掌握用户反馈的主要内容,还可以用于实现处理器对反馈数据进行自动分类、自动回复等复杂处理。现有技术中主要存在两种关键词提取方法:第一种是基于词频的关键词提取方法,该方法是在假定反馈文本的核心词会被反复提及,出现多次的基础上实现的,其将反馈文本中的停用词(包括标点符号、介词、副词、助词等)排除掉后,统计出剩余文本中出现次数最多的词语作为该反馈文本的关键词;第二种是基于关键词表的关键词提取方法,该方法是预先配置关键词表,将该反馈文本中的包含在关键词表中的词语作为关键词。技术实现要素:本公开实施例提供了一种用户反馈信息的关键词处理方法、装置及服务器。所述技术方案如下:根据本公开实施例的第一方面,提供一种用户反馈信息的关键词处理方法、,该方法包括:获取待处理用户反馈信息,并获取所述待处理用户反馈信息中的至少一个有效反馈词汇;根据预设时间段内用户反馈信息统计数据,获取每个所述有效反馈词汇在所述预设时间段内的用户反馈信息中的第一出现次数;获取每个所述有效反馈词汇在预设冗余文本中的第二出现次数;根据每个所述有效反馈词汇的所述第一出现次数和所述第二出现次数,将满足预设条件的所述有效反馈词汇作为所述待处理用户反馈信息的待分析关键词。在第一方面的一实施例中,所述预设冗余文本包括:至少一条冗余文本;所述获取每个所述有效反馈词汇在预设冗余文本中的第二出现次数之前,所述方法还包括:对所述预设冗余文本的每条冗余文本进行分词,得到每条冗余文本对应的至少一个待分析冗余词汇;从所述至少一个待分析冗余词汇中确定至少一个有效冗余词汇。在第一方面的另一实施例中,所述获取待处理用户反馈信息,并获取所述待处理用户反馈信息中的至少一个有效反馈词汇,包括:获取待处理用户反馈信息;对所述待处理用户反馈信息进行分词,得到所述待处理用户反馈信息对应的至少一个待分析反馈词汇;从所述至少一个待分析反馈词汇中确定至少一个有效反馈词汇。在第一方面的上述任一实施例中,所述预设时间段为:以接收所述待处理用户反馈信息的时间点为终点向前预设时长的时间段。在第一方面的上述实施例中,所述根据预设时间段内用户反馈信息统计数据,获取每个所述有效反馈词汇在所述预设时间段内的用户反馈信息中的第一出现次数,包括:根据预设时间段内的历史用户反馈信息统计数据,获取每个所述有效反馈词汇在所述历史用户反馈信息中的历史出现次数;获取每个所述有效反馈词汇在所述待处理用户反馈信息中的本次出现次数;根据每个所述有效反馈词汇对应的本次出现次数、以及每个所述有效反馈词汇对应的历史出现次数,获取每个所述有效反馈词汇的所述第一出现次数。在第一方面的上述实施例中,所述根据每个所述有效反馈词汇的所述第一出现次数和所述第二出现次数,将满足预设条件的所述有效反馈词汇作为所述待处理用户反馈信息的待分析关键词,包括:根据每个所述有效反馈词汇的所述第一出现次数、以及所述第二出现次数,确定每个所述有效反馈词汇的所述第一出现次数占所述第一出现次数和所述第二出现次数总数的比值;将所述比值满足预设阈值的所述有效反馈词汇作为所述待处理用户反馈信息的待分析关键词。根据本公开实施例的第二方面,提供了一种用户反馈信息的关键词处理装置,包括:有效反馈词汇获取模块,被配置为获取待处理用户反馈信息,并获取所述待处理用户反馈信息中的至少一个有效反馈词汇;第一出现次数获取模块,被配置为根据预设时间段内用户反馈信息统计数据,获取每个所述有效反馈词汇在所述预设时间段内的用户反馈信息中的第一出现次数;第二出现次数获取模块,被配置为获取每个所述有效反馈词汇在预设冗余文本中的第二出现次数;关键词确定模块,被配置为根据每个所述有效反馈词汇的所述第一出现次数和所述第二出现次数,将满足预设条件的所述有效反馈词汇作为所述待处理用户反馈信息的待分析关键词。在第二方面的一实施例中,所述预设冗余文本包括:至少一条冗余文本;所述装置,还包括:冗余文本分词模块和有效冗余词汇确定模块;所述冗余文本分词模块,被配置为在所述第二出现次数获取模块获取每个所述有效反馈词汇在预设冗余文本中的第二出现次数之前,对所述预设冗余文本的每条冗余文本进行分词,得到每条冗余文本对应的至少一个待分析冗余词汇;所述有效冗余词汇确定模块,被配置为从所述冗余文本分词模块得到的所述至少一个待分析冗余词汇中确定至少一个有效冗余词汇。在第二方面的另一实施例中,所述有效反馈词汇获取模块,包括:反馈信息获取子模块、反馈信息分词子模块和有效反馈词汇确定子模块;所述反馈信息获取子模块,被配置为获取待处理用户反馈信息;所述反馈信息分词子模块,被配置为对所述反馈信息获取子模块获取到的所述待处理用户反馈信息进行分词,得到所述待处理用户反馈信息对应的至少一个待分析反馈词汇;所述有效反馈词汇确定子模块,被配置为从所述反馈信息分词子模块得到的所述至少一个待分析反馈词汇中确定至少一个有效反馈词汇。在第二方面的上述任一实施例中,所述预设时间段为:以接收所述待处理用户反馈信息的时间点为终点向前预设时长的时间段。在第二方面的上述实施例中,所述第一出现次数获取模块,包括:历史出现次数获取子模块、本次出现次数获取子模块和第一出现次数获取子模块;所述历史出现次数获取子模块,被配置为根据预设时间段内的历史用户反馈信息统计数据,获取每个所述有效反馈词汇在所述历史用户反馈信息中的历史出现次数;所述本次出现次数获取子模块,被配置为获取每个所述有效反馈词汇在所述待处理用户反馈信息中的本次出现次数;所述第一出现次数获取子模块,被配置为根据每个所述有效反馈词汇对应的本次出现次数、以及每个所述有效反馈词汇对应的历史出现次数,获取每个所述有效反馈词汇的所述第一出现次数。在第二方面的上述实施例中,所述关键词确定模块,包括:比值确定子模块和关键词确定子模块;所述比值确定子模块,被配置为根据每个所述有效反馈词汇的所述第一出现次数、以及所述第二出现次数,确定每个所述有效反馈词汇的所述第一出现次数占所述第一出现次数和所述第二出现次数总数的比值;所述关键词确定子模块,被配置为将所述比值满足预设阈值的所述有效反馈词汇作为所述待处理用户反馈信息的待分析关键词。根据本公开实施例的第三方面,提供了一种服务器,包括上述任一种用户反馈信息的关键词处理装置。根据本公开实施例的第四方面,提供了一种用户反馈信息的关键词处理装置,所述装置包括:处理器;用于存储所述处理器的可执行指令的存储器;其中,所述处理器被配置为:获取待处理用户反馈信息,并获取所述待处理用户反馈信息中的至少一个有效反馈词汇;根据预设时间段内用户反馈信息统计数据,获取每个所述有效反馈词汇在所述预设时间段内的用户反馈信息中的第一出现次数;获取每个所述有效反馈词汇在预设冗余文本中的第二出现次数;根据每个所述有效反馈词汇的所述第一出现次数和所述第二出现次数,将满足预设条件的所述有效反馈词汇作为所述待处理用户反馈信息的待分析关键词。本公开实施例提供的技术方案可以包括以下有益效果:通过获取待处理用户反馈信息,并获取该待处理用户反馈信息中的至少一个有效反馈词汇,根据预设时间段内用户反馈信息统计数据,获取每个有效反馈词汇在预设时间段内的用户反馈信息中的第一出现次数,获取每个有效反馈词汇在预设冗余文本中的第二出现次数,并根据每个有效反馈词汇的第一出现次数和第二出现次数,将满足预设条件的有效反馈词汇作为该待处理用户反馈信息的待分析关键词。本公开的技术方案,通过引入与用户反馈信息无关的预设冗余文本,可以从简短的用户反馈信息中提取出有效的待分析关键词,而且其降低了对用户历史反馈信息的依赖度,在系统运行初期,用户反馈信息较少时,仍有效提取待分析关键词且不依赖于历史数据,提取效率高,准确性好。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种用户反馈信息的关键词处理方法的流程图;图2是根据另一示例性实施例示出的一种用户反馈信息的关键词处理方法的流程图;图3是根据再一示例性实施例示出的一种用户反馈信息的关键词处理方法的流程图;图4是根据再一示例性实施例示出的一种用户反馈信息的关键词处理方法的流程图;图5是根据再一示例性实施例示出的一种用户反馈信息的关键词处理方法的流程图;图6是根据一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图;图7是根据另一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图;图8是根据再一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图;图9是根据又一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图;图10是根据又一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图;图11是根据一示例性实施例示出的一种用户反馈信息的关键词处理装置的实体的框图;图12是根据一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图。通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种用户反馈信息的关键词处理方法的流程图。本实施例以用户反馈信息的关键词处理方法应用于服务器中来举例说明。如图1所示,该用户反馈信息的关键词处理方法可以包括如下几个步骤:在步骤S11中,获取待处理用户反馈信息,并获取该待处理用户反馈信息中的至少一个有效反馈词汇。在公司运营过程中,公司业务系统需要接收并处理大量的用户反馈信息。当用户对公司的产品或业务存在一定的疑问或意见时,通常会直接采用简短的语言对问题进行描述,这样同一个问题对应的关键词汇不会在一次反馈中反复出现,这使得用户反馈信息具有文本长度短的特点。其次,当公司推出新产品、新业务时,用户可能会对新产品或新业务有某些建议或问题,因此,用户的反馈信息则会集中在这个方面,也即,用户反馈的内容容易发生变化,使得用户反馈信息具有难以预测的特点。可选的,在本公开实施例中,对于待处理用户反馈信息,公司业务系统首先从用户反馈信息收集模块获取该待处理用户反馈信息,并且对该待处理用户反馈信息进行相应处理,从中获取该待处理用户反馈信息包括的至少一个有效反馈词汇。其中,有效反馈词汇是指对用户的反馈信息有指导性作用的词语,其具有特定的意义。可选的,在本实施例中,该有效反馈词汇可以是用户反馈信息中除去标点符号、助词、副词、介词等停用词之后得到的词汇。在步骤S12中,根据预设时间段内用户反馈信息统计数据,获取每个有效反馈词汇在预设时间段内的用户反馈信息中的第一出现次数。一般情况下,用户反馈信息具有一定的时效性,因此,为了有效统计待处理用户反馈信息中每个有效反馈词汇出现的次数,本公开实施例将预设时间段内的用户反馈信息统计数据均作为参考信息,通过查询待处理用户反馈信息中每个有效反馈词汇在该预设时间段内的用户反馈信息中的出现次数,即为第一出现次数。值得说明的是,本实施例中的预设时间段包括待处理用户反馈信息对应的当前时间,以及当前时间之前的一段时间,相应的,第一出现次数包括有效反馈词汇在预设时间段内的历史反馈信息中的出现次数和在待处理用户反馈信息中的出现次数。在步骤S13中,获取每个有效反馈词汇在预设冗余文本中的第二出现次数。在本公开实施例中,为了突出有效反馈词汇中的待分析关键词,本公开实施例中的公司业务系统中还可设置冗余文本数据库,通过在冗余文本数据库中添加或移除冗余文本,利用该冗余文本与公司业务、或产品的不相关性,从待处理用户反馈信息中确定出待分析关键词。在本步骤中,当选定某些冗余文本后,以选定的冗余文本作为预设冗余文本,可以通过查询并计算的方式获取待处理用户反馈信息中每个有效反馈词汇在该预设冗余文本中的出现次数,也即,第二出现次数。值得说明的是,本公开实施例中的预设冗余文本指的是与用户反馈信息无关的其他文本。通常情况下,公司接收到的用户反馈信息主要集中在产品购买、服务咨询、投诉建议等问题上,因此,预设冗余文本则是与这些问题以及公司的业务经营领域均不相关的文本。举例来说,当公司的业务经营领域为通信
技术领域
时,那么该预设冗余文本可选为化学类的文本或者植物学等相关领域的文本。本公开实施例并不对冗余文本的具体体现形式进行限定,只要是与公司业务经营领域的相关度小于预设范围的
技术领域
的冗余文本均属于本公开预设冗余文本的保护范围。在步骤S14中,根据每个有效反馈词汇的第一出现次数和第二出现次数,将满足预设条件的有效反馈词汇作为待处理用户反馈信息的待分析关键词。可选的,为了使公司运营人员迅速掌握用户反馈信息的主要内容,以及使公司业务系统对用户反馈信息进行自动分类、自动回复等复杂操作,在本公开实施例中,公司业务系统需要从每一条待处理用户反馈信息中提取出待分析关键词。由上述步骤可知,已获取到了每个有效反馈词汇在预设时间段内的用户反馈信息中的第一出现次数以及在预设冗余文本中的第二出现次数,在本实施例中,可在公司业务系统中设置一个预设条件,这样公司业务系统对应的服务器将会根据统计出来的第一出现次数和第二出现次数,将满足预设条件的有效反馈词汇作为待处理用户反馈信息的待分析关键词。作为一种示例,该预设条件可以是有效反馈词汇在预设时间段内的用户反馈信息中的第一出现次数与第一出现次数和第二出现次数总次数比值的最大值。也即,将第一出现次数与第一出现次数和第二出现次数总次数的最大值对应的有效反馈次数作为待处理用户反馈信息的待分析关键词。值得说明的是,本公开实施例并不对步骤S12和步骤S13的执行顺序进行限定,也即,也可以首先获取每个有效反馈词汇在预设冗余文本中的第二出现次数,再根据预设时间段内用户反馈信息统计数据,获取每个有效反馈词汇在预设时间段内的用户反馈信息中的第一出现次数,只要是能够准确获取到第一出现次数和第二出现次数的方案均属于本公开的保护范畴。本公开实施例提供的用户反馈信息的关键词处理方法,通过获取待处理用户反馈信息,并获取该待处理用户反馈信息中的至少一个有效反馈词汇,根据预设时间段内用户反馈信息统计数据,获取每个有效反馈词汇在预设时间段内的用户反馈信息中的第一出现次数,获取每个有效反馈词汇在预设冗余文本中的第二出现次数,并根据每个有效反馈词汇的第一出现次数和第二出现次数,将满足预设条件的有效反馈词汇作为该待处理用户反馈信息的待分析关键词。本公开的技术方案,通过引入与用户反馈信息无关的预设冗余文本,可以从简短的用户反馈信息中提出有效的待分析关键词,而且其降低了对用户历史反馈信息的依赖度,在系统运行初期,用户反馈信息较少时,仍有效提取待分析关键词且不依赖于历史数据,提取效率高,准确性好。在上述实施例的基础上,作为一种示例,图2是根据另一示例性实施例示出的一种用户反馈信息的关键词处理方法的流程图。如图2所示,在本公开实施例提供的用户反馈信息的关键词处理方法中,上述预设冗余文本包括:至少一条冗余文本。相应的,在上述步骤S13,即获取每个有效反馈词汇在预设冗余文本中的第二出现次数之前,本公开实施例提供的用户反馈信息的关键词处理方法还包括如下步骤:在步骤S21中,对预设冗余文本的每条冗余文本进行分词,得到每条冗余文本对应的至少一个待分析冗余词汇。在本公开实施例中,首先需要确定预设冗余文本包括的每条冗余文本,并分别对每条冗余文本进行处理,也即,首先根据用户的语言习惯以及标点符号的使用规则,对预设冗余文本进行分句处理,使其成为一个单独的句子;其次,根据每条冗余文本中每个词语的含义以及词语之间的相关性,将每一句冗余文本进行分词,得到每条冗余文本对应的至少一个待分析冗余词汇。该待分析冗余词汇是包含介词、副词、助词等停用词在内的冗余词汇。在步骤S22中,从该至少一个待分析冗余词汇中确定至少一个有效冗余词汇。本公开实施例中,对于上述步骤S21得到的每条冗余文本对应的多个待分析冗余词汇,将上述至少一个待分析冗余词汇中的介词、副词、助词等停用词去除,确定每条预设冗余文本中的有效冗余词汇,进而统计出预设冗余文本中的所有有效冗余词汇。此处的有效冗余词汇为预设冗余文本中剔除标点符号、助词、副词、介词等停用词之后剩余的词语。值得说明的是,本公开实施例还对每个有效冗余词汇的出现频率进行统计,即分别统计每个有效冗余词汇包含在多少条冗余文本中,若同一个有效冗余词汇在同一个句子出现多次,那么在每个句子中的出现次数只按一次计算。本公开实施例提供的用户反馈信息的关键词处理方法,通过对预设冗余文本的每条冗余文本进行分词,得到每条冗余文本对应的至少一个待分析冗余词汇,并且从该至少一个待分析冗余词汇中确定至少一个有效冗余词汇,为后续待处理用户反馈信息中的有效反馈词汇在预设冗余文本中的第二出现次数奠定了基础。作为一种示例,上述步骤S11(获取待处理用户反馈信息,并获取该待处理用户反馈信息中的至少一个有效反馈词汇)可通过如下可能实现方式实现,具体参见图3所示实施例。图3是根据再一示例性实施例示出的一种用户反馈信息的关键词处理方法的流程图。本公开实施例是在上述实施例的基础上对步骤S11的进一步说明。如图3所述,在本公开实施例提供的用户反馈信息的关键词处理方法中,上述步骤S11(获取待处理用户反馈信息,并获取该待处理用户反馈信息中的至少一个有效反馈词汇),包括:在步骤S31中,获取待处理用户反馈信息。本步骤与图1所述实施例中的步骤S11类似,首先从公司业务系统的用户反馈信息收集模块收集用户的反馈信息,并从所有的用户反馈信息中提取得到本次处理过程中需要处理的待处理用户反馈信息。在步骤S32中,对待处理用户反馈信息进行分词,得到待处理用户反馈信息对应的至少一个待分析反馈词汇。为了从待处理用户反馈信息中提取出涉及公司业务的关键词,与上述图2所示实施例类似,本公开实施例首先对待处理用户反馈信息进行分句处理,将待处理用户反馈信息分割成多个单独的句子,其次根据每个词语的用法和意义将每个单独的句子分成多个单独的词语,剔除掉每个句子中的标点符号等停用词,进而得到该待处理用户反馈信息对应的至少一个待分析反馈词汇。在步骤S33中,从该至少一个待分析反馈词汇中确定至少一个有效反馈词汇。进一步的,将上述至少一个待分析反馈词汇中的助词、介词、副词等通用词剔除,将剩余的至少一个待分析反馈词汇作为有效反馈词汇。举例来说,若当前收集到的一条待处理用户反馈信息为“为什么我们这些老用户一点特殊待遇都没有????都抢了十几台了,一个F码都不送!!!”,那么,对该待处理用户反馈信息进行分词后得到的至少一个待分析反馈词汇为“为什么|我们|这些|老|用户|一点|特殊|待遇|都|没有|都|抢|了|十几|台|了|一个|F码|都|不送”,而将上述待分析反馈词汇中的通用词剔除后,得到的有效反馈词汇为“我们|用户|特殊|待遇|没有|F码”。本公开实施例提供的用户反馈信息的关键词处理方法,通过获取待处理用户反馈信息,对该待处理用户反馈信息进行分词,得到该待处理用户反馈信息对应的至少一个待分析反馈词汇,并从该至少一个待分析反馈词汇中确定出至少一个有效反馈词汇,同样为后续统计每个有效反馈词汇在预设时间段内的用户反馈信息中的第一出现次数和在预设冗余文本中的第二出现次数奠定了基础,进而能够精确的从该至少一个有效反馈词汇中确定出待分析关键词,使得公司业务系统的自动化处理更加智能,准确度高。可选的,在本公开的上述任一实施例中,上述预设时间段为:以接收该待处理用户反馈信息的时间点为终点向前预设时长的时间段。作为一种示例,公司业务系统在接收并收集用户反馈信息时,分别为每条用户反馈信息添加时间标记,根据该时间标记信息确认出收集获取到的用户反馈信息所处的时期,并且在确定待处理用户反馈信息对应的待分析关键词时,以该预设时间段内收集的用户反馈信息统计数据为依据。可选的,本公开实施例中的预设时间段包括接收该待处理用户反馈信息时对应的当前时间和当前时间之前的一段时间,可选为以接收该待处理用户反馈信息的时间点为终点向前预设时长的时间段。本公开实施例结合待处理用户反馈信息与历史用户反馈信息来确定该待处理用户反馈信息中的待分析关键词,但是其并不依赖于历史用户反馈信息,解决了在公司业务系统运行初期由于用户反馈信息少无法确定待处理用户反馈信息中的待分析关键词的问题,待分析关键词提取效率高。进一步的,在公司业务系统运行一段时间之后,该系统利用历史用户反馈信息对确定的待分析关键词进行优化,提高了确定的待分析关键词的准确度。作为一种示例,上述步骤S12(根据预设时间段内用户反馈信息统计数据,获取每个所述有效反馈词汇在所述预设时间段内的用户反馈信息中的第一出现次数)可通过如下可能实现方式实现,具体参见图4所示实施例。图4是根据再一示例性实施例示出的一种用户反馈信息的关键词处理方法的流程图。本公开实施例是在上述实施例的基础上对步骤S12的进一步说明。如图4所述,在本公开实施例提供的用户反馈信息的关键词处理方法中,上述步骤S12(根据预设时间段内用户反馈信息统计数据,获取每个所述有效反馈词汇在所述预设时间段内的用户反馈信息中的第一出现次数),包括:在步骤S41中,根据预设时间段内的历史用户反馈信息统计数据,获取每个有效反馈词汇在该历史用户反馈信息中的历史出现次数。在实际应用中,预设时间段内的用户反馈信息统计数据包括该预设时间段内的历史用户反馈信息统计数据以及该待处理用户反馈信息。因此,当本公开实施例以预设时间段内的用户反馈信息为基准,确定待处理用户反馈信息的待分析关键词时,首先需要根据预设时间段内的历史用户反馈信息统计数据,获取待处理用户反馈信息中每个有效反馈词汇在该历史用户反馈信息中的历史出现次数,其包括历史用户反馈信息统计数据中每条用户反馈信息对应的出现次数的总和。在步骤S42中,获取每个有效反馈词汇在该待处理用户反馈信息中的本次出现次数。具体的,待处理用户反馈信息可能包含多条用户反馈信息,因此,在统计有效反馈词汇总的出现次数时,需要在该待处理用户反馈信息的每条用户反馈信息中进行查询,分别获取每个有效反馈词汇在每条用户反馈信息中的出现次数,进而求和获取每个有效反馈词汇在该待处理用户反馈信息中的出现次数,即本步骤中的本次出现次数。在步骤S43中,根据每个有效反馈词汇对应的本次出现次数、以及每个有效反馈词汇对应的历史出现次数,获取每个有效反馈词汇的第一出现次数。在本公开实施例中,为了获取每个有效反馈词汇在预设时间段内的用户反馈信息中的第一出现次数,一种可能的实现方式为通过将每个有效反馈词汇对应的本次出现次数、以及每个有效反馈词汇对应的历史出现次数进行相加来得到每个有效反馈词汇的第一出现次数。值得说明的是,在本公开实施例中,当获取每条用户反馈信息时,便可以统计出每个有效反馈词汇的出现次数,并将其存储在公司业务系统中,并在后续使用时,将每个有效反馈词汇在每条用户反馈词汇中的出现次数进行叠加,进而得出每个有效反馈词汇的第一出现次数。举例来说,假设待处理用户反馈信息的处理结果分别如表1和表2所示,上述预设时间段为30天。表1示出的是待处理用户反馈信息中有效反馈词汇的本次出现次数,表2示出的是待处理用户反馈信息中有效反馈词汇在历史用户反馈信息中的历史出现次数,其中,“****”表示同一年份。表1待处理用户反馈信息中有效反馈词汇的本次出现次数表2待处理用户反馈信息中有效反馈词汇在历史用户反馈信息中的历史出现次数本公开实施例提供的用户反馈信息的关键词处理方法,首先根据预设时间段内的历史用户反馈信息统计数据,获取每个有效反馈词汇在该历史用户反馈信息中的历史出现次数,其次获取每个有效反馈词汇在该待处理用户反馈信息中的本次出现次数,最后根据每个有效反馈词汇对应的本次出现次数、以及每个有效反馈词汇对应的历史出现次数,获取每个有效反馈词汇的第一出现次数,这样分别获取有效反馈词汇在用户反馈信息中的出现次数,能够有效利用有效反馈词汇对应的历史出现次数来优化待分析关键词的确认过程。进一步的,在上述实施例的基础上,上述步骤S14(根据每个有效反馈词汇的第一出现次数和第二出现次数,将满足预设条件的有效反馈词汇作为待处理用户反馈信息的待分析关键词)可通过如下可能实现方式实现,具体参见图5所示实施例。图5是根据再一示例性实施例示出的一种用户反馈信息的关键词处理方法的流程图。本公开实施例是在上述实施例的基础上对步骤S14的进一步说明。如图5所述,在本公开实施例提供的用户反馈信息的关键词处理方法中,上述步骤S14(根据每个有效反馈词汇的第一出现次数和第二出现次数,将满足预设条件的有效反馈词汇作为待处理用户反馈信息的待分析关键词),包括:在步骤S51中,根据每个有效反馈词汇的第一出现次数、以及第二出现次数,确定每个有效反馈词汇的第一出现次数占第一出现次数和第二出现次数总数的比值。当确定出每个有效反馈词汇在预设时间段内的用户反馈信息中的第一出现次数,以及在预设冗余文本中的第二出现次数时,公司业务系统便可根据该第一出现次数和第二出现次数,计算出每个有效反馈词汇的第一出现次数占第一出现次数和第二出现次数总数的比值。在步骤S52中,将比值满足预设阈值的有效反馈词汇作为该待处理用户反馈信息的待分析关键词。可选的,公司业务系统中可存储一个预设阈值,当计算出上述比值以后,本公开实施例可将该比值与预设阈值进行比较。在本公开的一实施例中,可将比值大于该预设阈值的有效反馈词汇作为该待处理用户反馈信息的待分析关键词。在本公开的另一实施例中,可以比较每个有效反馈词汇的比值,将比值最大的有效反馈词汇作为该待处理用户反馈信息的待分析关键词。举例来说,下面本公开实施例结合图4所示实施例中表1和表2和本实施例中的表3对确定待分析关键词的具体过程分析如下;表3示出的是待处理用户反馈信息中有效反馈词汇在预设冗余文本的第二出现次数。表3待处理用户反馈信息中有效反馈词汇的本次出现次数预设冗余文本中的有效冗余词汇第二出现次数词语一10词语二20词语三3结合表1、表2和表3所示,处理用户反馈信息中的有效反馈词汇包括“词语二”、“词语三”和“词语四”,且本次出现次数M2分别为3次,假设预设时间段是指以接收该待处理用户反馈信息的时间点为终点向前预设30天的时间段,因此,表2对应的历史用户反馈信息属于该预设时间段的统计范围。由表2可知,有效反馈词汇“词语二”的历史出现次数M1为2次,有效反馈词汇“词语三”的历史出现次数M1为1次,而有效反馈词汇“词语四”未出现在历史用户反馈信息,即有效反馈词汇“词语四”的历史出现次数M1为0次。相应的,由表3可知,有效反馈词汇“词语二”在预设冗余文本中的第二出现次数N为20次,有效反馈词汇“词语三”在预设冗余文本中的第二出现次数N为3次,而有效反馈词汇“词语四”未出现在预设冗余文本中,即有效反馈词汇“词语四”预设冗余文本中的第二出现次数N为0次。而有效反馈词汇的第一出现次数总数占第一出现次数和第二出现次数总数的比值可通过“(M1+M2)/(N+M1+M2)”计算出来。因此,在该实施例中,有效反馈词汇“词语二”的第一出现次数总数占第一出现次数和第二出现次数总数的比值等于“(2+3)/(20+2+3)=1/5”,有效反馈词汇“词语三”的第一出现次数总数占第一出现次数和第二出现次数总数的比值等于“(1+3)/(3+1+3)=4/7”,由于有效反馈词汇“词语四”均未在预设冗余文本和历史用户反馈信息中出现,因此,可认为“词语四”为新词,其不参与关键词确定,但是在当前时间之后“词语四”可作为历史用户反馈信息中的有效反馈词汇进行处理。从上述可知,若将比值最大的有效反馈词汇作为该待处理用户反馈信息的待分析关键词,那么有效反馈词汇“词语三”则是该待处理用户反馈信息的待分析关键词。本公开实施例提供的用户反馈信息的关键词处理方法,根据每个有效反馈词汇的第一出现次数、以及第二出现次数,确定每个有效反馈词汇的第一出现次数占第一出现次数和第二出现次数总数的比值,并将比值满足预设阈值的有效反馈词汇作为该待处理用户反馈信息的待分析关键词,其不受用户反馈文本短小的限制,能够迅速从待处理用户反馈信息中提取出来,提取效率高。下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。图6是根据一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图,该用户反馈信息的关键词处理装置可以通过软件、硬件或者两者的结合实现。该用户反馈信息的关键词处理装置可以包括:有效反馈词汇获取模块61,被配置为获取待处理用户反馈信息,并获取该待处理用户反馈信息中的至少一个有效反馈词汇。第一出现次数获取模块62,被配置为根据预设时间段内用户反馈信息统计数据,获取每个有效反馈词汇在该预设时间段内的用户反馈信息中的第一出现次数。第二出现次数获取模块63,被配置为获取每个有效反馈词汇在预设冗余文本中的第二出现次数。关键词确定模块64,被配置为根据每个有效反馈词汇的第一出现次数和第二出现次数,将满足预设条件的有效反馈词汇作为该待处理用户反馈信息的待分析关键词。本公开实施例提供的用户反馈信息的关键词处理装置,可用于执行如图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。在上述图6所示实施例的基础上,图7是根据另一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图。如图7所述,在本实施例提供的用户反馈信息的关键词处理装置中,上述预设冗余文本包括:至少一条冗余文本。则该用户反馈信息的关键词处理装置,还包括:冗余文本分词模块71和有效冗余词汇确定模块72。该冗余文本分词模块71,被配置为在第二出现次数获取模块63获取每个有效反馈词汇在预设冗余文本中的第二出现次数之前,对该预设冗余文本的每条冗余文本进行分词,得到每条冗余文本对应的至少一个待分析冗余词汇。该有效冗余词汇确定模块72,被配置为从该冗余文本分词模块71得到的至少一个待分析冗余词汇中确定至少一个有效冗余词汇。本公开实施例提供的用户反馈信息的关键词处理装置,可用于执行如图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。在上述图6所示实施例的基础上,图8是根据再一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图。如图8所述,在本实施例提供的用户反馈信息的关键词处理装置中,上述有效反馈词汇获取模块61,包括:反馈信息获取子模块81、反馈信息分词子模块82和有效反馈词汇确定子模块83。该反馈信息获取子模块81,被配置为获取待处理用户反馈信息。该反馈信息分词子模块82,被配置为对该反馈信息获取子模块81获取到的待处理用户反馈信息进行分词,得到待处理用户反馈信息对应的至少一个待分析反馈词汇。该有效反馈词汇确定子模块83,被配置为从反馈信息分词子模块82得到的至少一个待分析反馈词汇中确定至少一个有效反馈词汇。本公开实施例提供的用户反馈信息的关键词处理装置,可用于执行如图3所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。可选的,在本公开的任一实施例中,上述预设时间段为:以接收待处理用户反馈信息的时间点为终点向前预设时长的时间段。在上述实施例的基础上,图9是根据又一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图。如图9所述,在本实施例提供的用户反馈信息的关键词处理装置中,上述第一出现次数获取模块62,包括:历史出现次数获取子模块91、本次出现次数获取子模块92和第一出现次数获取子模块93。该历史出现次数获取子模块91,被配置为根据预设时间段内的历史用户反馈信息统计数据,获取每个有效反馈词汇在历史用户反馈信息中的历史出现次数。该本次出现次数获取子模块92,被配置为获取每个有效反馈词汇在待处理用户反馈信息中的本次出现次数。该第一出现次数获取子模块93,被配置为根据每个有效反馈词汇对应的本次出现次数、以及每个有效反馈词汇对应的历史出现次数,获取每个有效反馈词汇的所述第一出现次数。本公开实施例提供的用户反馈信息的关键词处理装置,可用于执行如图4所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。在上述实施例的基础上,图10是根据又一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图。如图10所述,在本实施例提供的用户反馈信息的关键词处理装置中,上述关键词确定模块64,包括:比值确定子模块101和关键词确定子模块102。该比值确定子模块101,被配置为根据每个有效反馈词汇的第一出现次数、以及第二出现次数,确定每个述有效反馈词汇的第一出现次数占该第一出现次数和第二出现次数总数的比值。该关键词确定子模块102,被配置为将上述比值满足预设阈值的有效反馈词汇作为待处理用户反馈信息的待分析关键词。本公开实施例提供的用户反馈信息的关键词处理装置,可用于执行如图5所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。进一步的,本公开实施例还提供了一种服务器,该服务器包括上述任一实施例提供的用户反馈信息的关键词处理装置。对于该用户反馈信息的关键词处理装置的具体实现原理和技术效果,这里不再赘述。以上描述了用户反馈信息的关键词处理装置的内部功能模块和结构示意,图11是根据一示例性实施例示出的一种用户反馈信息的关键词处理装置的实体的框图,如图11所示,该用户反馈信息的关键词处理装置包括:存储器111和处理器112。存储器111,被配置为存储处理器可执行指令。处理器112,被配置为:获取待处理用户反馈信息,并获取所述待处理用户反馈信息中的至少一个有效反馈词汇;根据预设时间段内用户反馈信息统计数据,获取每个所述有效反馈词汇在所述预设时间段内的用户反馈信息中的第一出现次数;获取每个所述有效反馈词汇在预设冗余文本中的第二出现次数;根据每个所述有效反馈词汇的所述第一出现次数和所述第二出现次数,将满足预设条件的所述有效反馈词汇作为所述待处理用户反馈信息的待分析关键词。值得说明的是,在图11所示的用户反馈信息的关键词处理装置的实施例中,应理解,该处理器可以是中央处理单元(英文:CentralProcessingUnit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignalProcessor,简称:DSP)、专用集成电路(英文:ApplicationSpecificIntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,而前述的存储器可以是只读存储器(英文:read-onlymemory,缩写:ROM)、随机存取存储器(英文:randomaccessmemory,简称:RAM)、快闪存储器、硬盘或者固态硬盘。SIM卡也称为用户身份识别卡、智能卡,数字移动电话机必须装上此卡方能使用。即在电脑芯片上存储了数字移动电话客户的信息,加密的密钥以及用户的电话簿等内容。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。图12是根据一示例性实施例示出的一种用户反馈信息的关键词处理装置的框图。例如,该用户反馈信息的关键词处理装置1200可以被提供为一个与商品下单购买设备关联的服务器。参照图12,用户反馈信息的关键词处理装置1200包括处理组件1222,其进一步包括一个或多个处理器,以及由存储器1232所代表的存储器资源,用于存储可由处理组件1222执行的指令,例如应用程序。存储器1232中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1222被配置为执行指令,以执行上述用户反馈信息的关键词处理方法。用户反馈信息的关键词处理装置1200还可以包括一个电源组件1226被配置为执行用户反馈信息的关键词处理装置1200的电源管理,一个有线或无线的网络接口1250被配置为将用户反馈信息的关键词处理装置1200连接到网络,和一个输入输出接口1258。用户反馈信息的关键词处理装置1200可以操作基于存储在存储器1232的操作系统,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1232,上述指令可由用户反馈信息的关键词处理装置1200的处理组件1222执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。一种非临时性计算机可读存储介质,当所述存储介质中的指令由用户反馈信息的关键词处理装置1200的处理器执行时,使得用户反馈信息的关键词处理装置1200能够执行上述任一种用户反馈信息的关键词处理方法。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本
技术领域
中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1