信息权重的确定方法和装置的制造方法

文档序号:9865518阅读:387来源:国知局
信息权重的确定方法和装置的制造方法
【技术领域】
[0001]本发明涉及互联网技术领域,尤其涉及一种信息权重的确定方法和装置。
【背景技术】
[0002]随着互联网技术的快速发展,针对同一事物或现象,人们可以自由地表达自己的观点,例如:用户在某家淘宝店铺购买商品时,可以对其发表评论,如物流快、质量好等,从而为其他用户在购物该商品时提供购买依据。
[0003]对于大量的评论资源,其中包含有正面评价、负面评价等情感词,目前只是对这些情感词进行分类。由于每个用户对同一商品的使用感受或喜好程度并不一样,使用的情感词也不一样,在对用户的评论进行数据挖掘的时候,如果对“好”、“非常好”等情感词赋予相同的权重,则无法准确地反映出用户的评论情况。

【发明内容】

[0004]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种信息权重的确定方法,该方法能够使评论文本中的条目信息能够更准确地反映用户的评论情况。
[0005]本发明的第二个目的在于提出一种信息权重的确定装置。
[0006]为达上述目的,根据本发明第一方面实施例提出了一种信息权重的确定方法,包括:获取评论文本,其中,评论文本中包含至少一个条目信息及其对应的评分;使用预设词表对所述评论文本进行文本匹配,以获得与所述预设词表中的条目信息对应的评分;以及分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重。
[0007]本发明实施例的信息权重的确定方法,通过获取评论文本,使用预设词表对评论文本进行文本匹配,以获得与预设词表中的条目信息对应的评分,然后分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重,从而使评论文本中的条目信息能够更准确地反映用户的评论情况。
[0008]为达上述目的,根据本发明第二方面实施例提出了一种信息权重的确定装置,包括:获取模块,用于获取评论文本,其中,评论文本中包含至少一个条目信息及其对应的评分;匹配模块,用于使用预设词表对所述评论文本进行文本匹配,以获得与所述预设词表中的条目信息对应的评分;以及处理模块,用于分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重。
[0009]本发明实施例的信息权重的确定装置,通过获取评论文本,使用预设词表对评论文本进行文本匹配,以获得与预设词表中的条目信息对应的评分,然后分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重,从而使评论文本中的条目信息能够更准确地反映用户的评论情况。
[0010]本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
【附图说明】
[0011]图1a为根据本发明一个实施例的信息权重的确定方法的流程图一。
[0012]图1b为根据本发明一个实施例的信息权重的确定方法的流程图二。
[0013]图2为根据本发明一个实施例的信息权重的确定装置的结构示意图。
【具体实施方式】
[0014]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0015]下面参考附图描述本发明实施例的信息权重的确定方法和装置。
[0016]图1a为根据本发明一个实施例的信息权重的确定方法的流程图。
[0017]如图1a所示,该信息权重的确定方法包括:
[0018]SlOl,获取评论文本,其中,评论文本中包含至少一个条目信息及其对应的评分。
[0019]在本发明的实施例中,服务器可接收客户端发送的获取请求,并基于获取请求获取预设对象的所有评论文本。其中,评论文本中可包含至少一个条目信息及其对应的评分。举例来说,预设对象为某家餐厅,其中,评论文本I “价格偏高,环境很不错,服务好”中,包含了 “价格偏高”、“环境很不错”和“服务好”三个条目信息,且三个条目信息对应的评分均为3分;评论文本2 “价格偏高,服务好”中,包含了“价格偏高”和“服务好”两个条目信息,且两个条目信息对应的评分均为4分;评论文本3 “服务好”中,包含了“服务好”一个条目信息,且该条目信息对应的评分为3分。
[0020]具体地,用户可通过客户端发送获取请求,服务器在接收到获取请求后,可基于获取请求返回预设对象的所有评论文本至客户端。
[0021]S102,使用预设词表对评论文本进行文本匹配,以获得与预设词表中的条目信息对应的评分。
[0022]具体地,在获取评论文本之后,由于评论文本的数据量巨大,因此可基于云梯集群,使用预设词表对评论文本进行文本匹配,以提高匹配效率。其中,云梯集群是一种分布式计算集群,其能够高效地完成海量数据的处理。
[0023]在对评论文本进行文本匹配后,可获得与预设词表中的条目信息对应的评分。其中,预设词表中的条目信息可包括评论指标和与每个评论指标对应的预设词语。例如:评论指标可包括服务、环境、材质等,预设词语可包括好、非常好、不错等表示程度的词语。
[0024]继续上一例子进行描述,假设预设词表中的条目信息为“服务好”,为了获得该条目信息对应的评分,可对所有评论文本进行文本匹配,获得所有包含“服务好”的评论文本,然后获得相应的评分,例如评论文本I中包含了“服务好”且该条目信息对应的评分为3分;评论文本2中包含了 “服务好”且该条目信息对应的评分为4分;评论文本3中包含了 “月艮务好”且该条目信息对应的评分为3分。
[0025]S103,分别对与每个条目信息对应的评分进行处理,根据处理结果确定对应条目信息的权重。
[0026]具体地,可使用云梯集群分别对与每个条目信息对应的评分进行平均运算和归一化处理,最终确定对应条目信息的权重。
[0027]继续上一例子进行描述,对上述三个评分进行处理,做平均运算,可算出条目信息“服务好”的平均分为(3+4+3)/3 = 3.3。由于“服务好”为正面评价,对其进行归一化处理,获得其权重为3.3。
[0028]再例如:假设预设词表中的条目信息为“环境差”,评论文本I中包含了 “环境差”且该条目信息对应的评分为I分;评论文本2中包含了“环境差”且该条目信息对应的评分为2分;评论文本3中包含了“环境差”且该条目信息对应的评分为I分,可计算出条目信息“环境差”的平均分为(1+2+1)/3 = 1.3。由于“环境差”为负面评价,对其进行归一化处理,获得其权重为5-1.3 = 3.7。应当理解的是,权重数值越大,表示程度越强烈。
[0029]此外,如图1b所示,该信息权重的确定方法还可包括:
[0030]S104,根据每个评论文本所包含的条目信息的权重计算对应评论文本的评分信息,并根据评分信息对评论文本进行排序,以及向客户端返回排序结果。
[0031]在本发明的实施例中,在根据处理结果确定对应条目信息的权重之后,还可根据每个评论文本所包含的条目信息的权重计算对应评论文本
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1