一种评论信息检索方法和装置的制造方法

文档序号:9708488阅读:544来源:国知局
一种评论信息检索方法和装置的制造方法
【技术领域】
[0001] 本申请涉及互联网技术领域,特别是涉及一种评论信息检索方法和一种评论信息 检索装置。
【背景技术】
[0002] 随着信息技术的不断发展,网络被越来越多的用户使用,互联网已经成为人们日 常生活中不可或缺的一部分。通过互联网,人们可以获取信息,购买商品,观看影视娱乐节 目等。但是,面对纷繁复杂的网络信息,如何分辨出有用的部分,确是耗时乏味的。以电子商 务为例,电子商务的蓬勃发展使消费者的购物过程更便捷。通常,商品的评论信息作为其他 消费者在购买或使用该商品后的评价,可以帮助人们制定购物决策。然而,从海量的评论信 息中获取需要的有价值的部分,却并不容易。
[0003] 在工业界,各种类型的电子商务网站通过将与商品属性相关且包含不同观点的评 论信息展示给用户,作为用户购物的决策参考之一。比如,淘宝网通过提取评论频率最高的 产品属性作为评论标签,通过点击标签可以查看评论内容;亚马逊则通过评论打分对评论 进行简单的索引;京东则采用"好评","差评"和"有图评论"的方式对海量评论进行管理;爱 奇艺商城也采用了类似的管理办法。但是,它们共同的缺陷是:仍然需要用户阅读大量的评 论文档,不支持用户的自定义查询,例如对于长尾属性的查询,在上述网站中均无法实现。
[0004] 由于互联网的开放性,在电子商务网站上发表评论内容是自由的开放的,因此,随 着评论信息的大量增长,虚假评论(Fake Review)也越来越多。此外,因为评论内容为自由 文本(free text),是用户在短时间内写出来的,没有经过后期的编辑和修改,经常包含语 法错误、标点错误或者拼写错误等,难以完全满足用户对评论信息的检索要求。因此,如何 从海量的评论信息中获得满足用户需要的评论信息越来越成为本领域技术人员亟需解决 的一个问题。

【发明内容】

[0005] 鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地 解决上述问题的一种评论信息检索方法和相应的一种评论信息检索装置。
[0006] 为了解决上述问题,本申请实施例公开了一种评论信息检索方法,所述评论信息 包括至少一条评论文档,所述方法包括:
[0007] 接收用户的查询指令,所述查询指令包括查询语句;
[0008] 针对所述查询指令,计算所述查询语句与评论文档之间的第一相关度;
[0009] 根据所述第一相关度,获得第一检索结果;
[0010] 对所述第一检索结果重排序,输出第二检索结果。
[0011] 优选地,在所述接收用户的查询指令的步骤后,还包括:
[0012] 扩展所述查询语句。
[0013] 优选地,所述第一相关度包括属性相关度和观点相关度。
[0014] 优选地,所述针对所述查询指令,计算所述查询语句与评论文档之间的第一相关 度的步骤包括:
[0015] 针对所述查询指令,计算所述查询语句生成评论文档的概率;
[0016] 根据所述概率,计算所述查询语句与所述评论文档之间的属性相关度和观点相关 度。
[0017] 优选地,所述根据所述第一相关度,获得第一检索结果的步骤包括:
[0018] 根据所述属性相关度与观点相关度,获得所述评论文档的排序值;
[0019] 按照所述排序值,获得第一检索结果。
[0020] 优选地,所述对所述第一检索结果重排序,输出第二检索结果的步骤包括:
[0021] 针对所述第一检索结果,计算所述评论文档之间的第二相关度;
[0022] 根据所述第二相关度,输出第二检索结果。
[0023] 优选地,所述第二相关度包括文本内容相似度和属性级有用度相关度。
[0024] 为了解决上述问题,本申请实施例公开了一种评论信息检索装置,所述评论信息 包括至少一条评论文档,所述装置包括:
[0025] 接收模块,用于接收用户的查询指令,所述查询指令包括查询语句;
[0026] 计算模块,用于针对所述查询指令,计算所述查询语句与评论文档之间的第一相 关度;
[0027] 获取模块,用于根据所述第一相关度,获得第一检索结果;
[0028] 输出模块,用于对所述第一检索结果重排序,输出第二检索结果。
[0029] 优选地,所述装置还包括:
[0030]扩展模块,用于扩展所述查询语句。
[0031 ]优选地,所述第一相关度包括属性相关度和观点相关度。
[0032]优选地,所述计算模块包括:
[0033] 概率计算子模块,用于针对所述查询指令,计算所述查询语句生成评论文档的概 率;
[0034] 第一相关度计算子模块,用于根据所述概率,计算所述查询语句与所述评论文档 之间的属性相关度和观点相关度。
[0035]优选地,所述获取模块包括:
[0036] 排序值获取子模块,用于根据所述属性相关度与观点相关度,获得所述评论文档 的排序值;
[0037] 第一检索结果获取子模块,用于按照所述排序值,获得第一检索结果。
[0038]优选地,所述输出模块包括:
[0039] 第二相关度计算子模块,用于针对所述第一检索结果,计算所述评论文档之间的 第二相关度;
[0040] 第二检索结果输出子模块,用于根据所述第二相关度,输出第二检索结果。
[0041] 优选地,所述第二相关度包括文本内容相似度和属性级有用度相关度。
[0042] 与【背景技术】相比,本申请实施例包括以下优点:
[0043] 在本申请实施例中,通过接收用户的查询指令,并针对所述查询指令计算出查询 语句与评论文档之间的第一相关度,进而获得第一输出结果,然后对所述第一检索结果进 行重排序,输出第二检索结果,实现了对评论信息的检索功能,使得检索结果较好地匹配了 用户的查询需求,方便了用户有针对性地查找满足其需要的信息。
[0044] 其次,本申请实施例通过计算查询语句与评论文档之间的属性相关度和观点相关 度,得到第一检索结果,然后进一步地通过计算评论文档之间的文本内容相似度和属性级 有用度相关度,将第一检索结果进行重排序,获得第二检索结果,进一步优化了评论文档的 检索过程,使对用户更有用的评论信息排序更靠前,更有助于获得最优的检索结果。
【附图说明】
[0045] 图1是本申请的一种评论信息检索方法实施例一的步骤流程图;
[0046] 图2是本申请的一种评论信息检索方法实施例二的步骤流程图;
[0047] 图3是本申请的一种评论信息检索装置实施例的结构框图。
【具体实施方式】
[0048]为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本申请作进一步详细的说明。
[0049] 参照图1,示出了本申请的一种评论信息检索方法实施例一的步骤流程图,具体可 以包括如下步骤:
[0050] 步骤101,接收用户的查询指令;
[0051] 在本申请实施例中,首先可以接收到用户的查询指令,所述查询指令可以包括查 询语句。
[0052] 通常,查询语句可以是一个关键词,也可以是一整句话。比如,查询语句可以是"电 池"这类的关键词,也可以是"电池怎么样?"这类的句子。当然,如何查询语句是以一整句 话,那么,可以根
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1