基于用户行为反馈的关键词推荐方法和系统的制作方法

文档序号:10471127阅读:631来源:国知局
基于用户行为反馈的关键词推荐方法和系统的制作方法
【专利摘要】本发明提供一种基于用户行为反馈的关键词推荐方法和系统,属于电子商务技术领域。该方法包括步骤获取用户搜索的关键词并对所述关键词进行预处理;记录针对所述关键词搜索结果的用户行为;解析所述用户行为页面的标签,为所述关键词添加标签;为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。本发明的技术方案通过记录并解析用户行为,为关键词添加适当的标签来扩展单一关键词的搜索范围,由于充分利用了用户行为进行反馈,可以及时适应关键词的衍生含义,准确把握搜索热点,此外还降低了人工维护更新词库的成本。
【专利说明】
基于用户行为反馈的关键词推荐方法和系统
技术领域
[0001] 本发明涉及电子商务搜索引擎技术领域,特别涉及一种基于用户行为反馈的关键 词推荐方法和系统。
【背景技术】
[0002] 现有技术中,网络搜索的扩展多从语义分析处理方面进行优化,目前很多网站在 关于相关搜索词计算方面主要考虑词和词之间的支持度。现有方案虽然可W尽量获得更多 的相关搜索结果,但单纯的语义扩展只考虑了即成的文字联系,会导致推荐出来的搜索词 过于死板,缺乏对新产品和新概念的实时理解,很难适应快速变化的流行趋势和网络热点; 如果依赖人工对扩展词进行定期维护的话又会增加成本。

【发明内容】

[0003] 针对现有技术的上述缺陷,本发明所要解决的技术问题是如何动态扩展关键词的 搜索范围。
[0004] 为实现上述目的,一方面,本发明提供一种基于用户行为反馈的关键词推荐方法, 该方法包括步骤:
[0005] 获取用户搜索的关键词并对所述关键词进行预处理;
[0006] 记录针对所述关键词搜索结果的用户行为;
[0007] 解析所述用户行为页面的标签,为所述关键词添加标签;
[0008] 为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。
[0009] 优选地,所述方法中,将页面搜索信息表中的关键词获取为所述用户搜索的关键 词。
[0010] 优选地,所述预处理包括词语规整、去除特殊字符、字符统一转换、拼写纠正、截 取、拼音转汉字、中英文互换中的至少一种处理。
[0011] 优选地,为所述关键词添加标签还包括步骤:
[0012] 根据关键词的标签按照预定的规则进行合并组成W修正关键词。
[0013] 优选地,所述按照分类推荐备选关键词还包括:
[0014] 若同一分类中有多个备选关键词,将其全部推荐给用户、或将备选关键词按排序 后的顺序优选推荐。
[0015] 另一方面,本发明还提供一种基于用户行为反馈的关键词推荐系统,包括:
[0016] 预处理模块,用于获取用户搜索的关键词并对所述关键词进行预处理;
[0017] 行为记录模块,用于记录针对所述关键词搜索结果的用户行为;
[0018] 解析模块,用于解析所述用户行为页面的标签,为所述关键词添加标签;
[0019] 分类推荐模块,用于为具有相同标签的关键词分类,在后续搜索中按照分类推荐 备选关键词。
[0020] 优选地,所述预处理模块中还包括:获取模块,用于将页面搜索信息表中的关键词 获取为所述用户搜索的关键词。
[0021] 优选地,所述预处理包括词语规整、去除特殊字符、字符统一转换、拼写纠正、截 取、拼音转汉字、中英文互换中的至少一种处理。
[0022] 优选地,所述解析模块还包括:关键词修正模块,用于根据关键词的标签按照预定 的规则进行合并组成W修正关键词。
[0023] 优选地,所述分类推荐模块中还包括:备选词筛选模块,用于在同一分类中有多个 备选关键词时,将全部备选关键词推荐给用户、或将备选关键词按排序后的顺序优选推荐。
[0024] 本发明的技术方案通过记录并解析用户行为,为关键词添加适当的标签来扩展单 一关键词的搜索范围,由于充分利用了用户行为进行反馈,可W及时适应关键词的衍生含 义,准确把握搜索热点,此外还降低了人工维护更新词库的成本。
【附图说明】
[00巧]图1是本发明一个实施例中的基于用户行为反馈的关键词推荐方法的流程示意 图;
[0026] 图2是本发明另一个实施例中的基于用户行为反馈的关键词推荐系统的结构示 意图。
【具体实施方式】
[0027] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述。显然,所描述的实施例为实施本发明的较佳实施方式,所述描述是W说明本发明 的一般原则为目的,并非用W限定本发明的范围。本发明的保护范围应当W权利要求所界 定者为准,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下 所获得的所有其他实施例,都属于本发明保护的范围。
[0028] 现有的语义扩展仅考虑了词义之间的联系,为进一步体现搜索词实际代表的含 义,本发明中利用用户行为进行反馈,为搜索词或搜索词的组合添加对应标签,从而准确识 别搜索词所表达的隐藏含义,为后续搜索推荐满足用户需求的结果。其中,图1是本发明一 个实施例中的基于用户行为反馈的关键词推荐方法的流程示意图,如图1所示,该方法包 括步骤:
[0029] S1、获取用户搜索的关键词并对所述关键词进行预处理;
[0030] S2、记录针对所述关键词搜索结果的用户行为;
[0031] S3、解析所述用户行为页面的标签,为所述关键词添加标签;
[0032] S4、为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。
[0033] 其中,获取用户搜索的关键词一般是将页面搜索信息表中的关键词作为搜索关键 词。
[0034] 对关键词进行的预处理包括但不限于词语规整、去除特殊字符、字符统一转换、拼 写纠正、截取、拼音转汉字、中英文互换等;W下仅作为示例说明常用的预处理形式,不应视 作对本发明的具体限制:
[0035] (1)去掉仅由符号、数字、字母Η者组成的关键词记录;
[0036] 似去掉仅由符号组成的关键词记录;
[0037] (3)去掉仅由空格或回车符组成的关键词记录;
[0038] (4)去掉关键词首尾的空格,关键词内部空格保留一个;
[0039] (5)关键词中的全角字符均转换为半角字符;
[0040] (6)对于关键词首末含$%'&*()'~! + = {}':〇?。·. § ;,,\\[\\].<〉/?~! @(_)八 ¥% ……&*〇 --+1 {}【】';;""'。,、? ' "Θ 0 J ^-1--L ' □ ' * δ #$--_及回车符等特殊字符的,去掉送些特殊字符;
[0041] (7)关键词中的小写字母统一用大写字母代替;
[0042] (8)仅保留关键词长度为2-20个字符的关键词;
[0043] (9)将汉语拼音转化为汉字;如关键词"shouji"转化为"手机";"sanxing"转换 为"H星"。
[0044] 用户行为主要指用户对搜索结果页面的访问行为,包括鼠标停留查看、点击链接 W及对链接页面中元素的进一步操作等动作。根据用户对关键词搜索结果的具体访问行 为,解析行为对应的页面元素属性W提取为该关键词的标签。
[0045] 优选地,本发明W电商搜索为例,搜索结果包括多个商品,用户行为包括查看摘要 图、调整数量、加入购物车、直接购买、筛选、对比、点击链接、和/或对链接页面中的进一步 操作。在该优选实施例中,行为对应的页面元素属性主要指商品属性,根据用户行为操作的 对象在页面中找到商品名、目录(分类或品类)、品牌、厂商及型号等属性信息作为标签。上 述标签既可W是系统本身为商品页面添加的分类标签,也可W是提取页面信息后自动挖掘 归类的标签。
[0046] 具体地,为关键词添加标签包括打上或更新标签等不同处理。根据关键词本身与 解析得到的词类别、相似商品目录、相似品牌和相似型号/厂商能否匹配,找出关键词自身 的商品目录、品牌和型号/厂商属性值,同时判断关键词自身的商品目录、品牌和型号/厂 商属性值是否为空,若为空则为关键词打上得到的标签,若不为空则对关键词标签进行更 新。词标签格式一般为调类别_品牌_型号_商品目录;标签添加规则;W词类别开头, 对品牌、型号/厂商、商品目录进行组合,词类别_品牌_厂商_商品目录,"连接构成 词标签。
[0047] 比如,词标签主要包含:
[0048]
[0049]
[0050] 在本发明的优选实施例中,还将关键词的标签,比如品牌、型号、商品目录等属性 按照一定的规则进行合并组成W修正关键词。修正后的关键词由品牌、型号、商品目录等属 性按顺序合并构成。当关键词的品牌、型号和商品目录都存在的情况下,修正后关键词的构 成依次为品牌、商品目录和型号。其他情况下,修正后的关键词按照品牌、型号、商品目录的 顺序进行重组。如,关键词"手机Η星"应调整为"H星手机";"手机N0TE3"调整为"NOTES 手机"。
[0051] 随后,将具有相同标签的关键词进行分类,W便在后续搜索时,在一定的推荐规则 下,优先推荐同一类的关键词。
[0052] W下是本发明的一个优选实施例中用户分别W "H星"和"海尔手机"为关键词进 行搜索时的反馈和推荐过程,示例的详细流程为:
[005引用"立星"进行搜索;
[0054] 用户点击了搜索结果中的部分页面,其中一个页面包含"……Η星……手机…… 优惠……",标签解析模块解析后,系统为关键词"Η星"打上标签"品牌+类型";另一个页 面中包含"……Η星手机Note2……",标签解析模块解析后,系统为关键词"H星"打上标 签"品牌+类型+型号";将关键词"H星"及相应标签保存于数据库中;
[00巧]用"海尔手机"进行搜索;
[0056] 用户点击了搜索结果中的部分页面,其中一个页面包含"……海尔……手机……0 元购机……",标签解析模块解析后,系统为关键词"海尔手机"打上标签"品牌+类型";另 一个页面中包含"……海尔手机5220……",标签解析模块解析后,系统为关键词"海尔手 机"打上标签"品牌+类型+型号";将关键词"海尔手机"及相应标签保存于数据库中;
[0057] 系统对"H星"的标签和"海尔手机"的标签进行比对,发现关键词"H星"和"海 尔手机"的标签完全一致;将两关键词分为一类;
[0058] 在下一次搜索"海尔手机"时,系统将优先推荐"H星"作为备选关键词。
[0059] 优选地,若同一类中有多个备选关键词,可全部推荐给用户或将备选关键词按排 序后的顺序优选推荐。排序可基于各种预定或自选规则进行,比如关键词间的潜在相关度, 或按照关键词的搜索次数、点击量,或按关键词相关商品的关注度、销量、好评度等等信息 单独或综合排序。
[0060] 本领域相关技术人员应能理解,与本发明的方法相对应的,本发明还同时包括一 种基于用户行为反馈的关键词推荐系统,与上述方法步骤一一对应,如图2所示,该系统包 括:
[0061] 预处理模块201,用于获取用户搜索的关键词并对所述关键词进行预处理;
[0062] 行为记录模块202,用于记录针对所述关键词搜索结果的用户行为;
[0063] 解析模块203,用于解析所述用户行为页面的标签,为所述关键词添加标签;
[0064] 分类推荐模块204,用于为具有相同标签的关键词分类,在后续搜索中按照分类推 荐备选关键词。
[0065] 相应地,上述方法实施例中的各具体步骤在系统中同样存在对应的处理模块,各 模块主要基于执行的步骤和/或实现的功能进行划分,在此不再一一赏述。
[0066] 本发明的技术方案通过记录并解析用户行为,为关键词添加适当的标签来扩展单 一关键词的搜索范围,由于充分利用了用户行为进行反馈,可W及时适应关键词的衍生含 义,准确把握搜索热点,此外还降低了人工维护更新词库的成本。
[0067] 可W理解的是,W上实施方式仅仅是为了说明本发明的原理而采用的示例性实施 方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精 神和实质的情况下,可W做出各种变型和改进,送些变型和改进也视为本发明的保护范围。
【主权项】
1. 一种基于用户行为反馈的关键词推荐方法,其特征在于,所述方法包括步骤: 获取用户搜索的关键词并对所述关键词进行预处理; 记录针对所述关键词搜索结果的用户行为; 解析所述用户行为页面的标签,为所述关键词添加标签; 为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。2. 根据权利要求1所述的方法,其特征在于,将页面搜索信息表中的关键词获取为所 述用户搜索的关键词。3. 根据权利要求1所述的方法,其特征在于,所述预处理包括词语规整、去除特殊字 符、字符统一转换、拼写纠正、截取、拼音转汉字、中英文互换中的至少一种处理。4. 根据权利要求1所述的方法,其特征在于,为所述关键词添加标签还包括步骤: 根据关键词的标签按照预定的规则进行合并组成以修正关键词。5. 根据权利要求1所述的方法,其特征在于,所述按照分类推荐备选关键词还包括: 若同一分类中有多个备选关键词,将其全部推荐给用户、或将备选关键词按排序后的 顺序优选推荐。6. -种基于用户行为反馈的关键词推荐系统,其特征在于,所述系统包括: 预处理模块,用于获取用户搜索的关键词并对所述关键词进行预处理; 行为记录模块,用于记录针对所述关键词搜索结果的用户行为; 解析模块,用于解析所述用户行为页面的标签,为所述关键词添加标签; 分类推荐模块,用于为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选 关键词。7. 根据权利要求6所述的系统,其特征在于,所述预处理模块中还包括:获取模块,用 于将页面搜索信息表中的关键词获取为所述用户搜索的关键词。8. 根据权利要求6所述的系统,其特征在于,所述预处理包括词语规整、去除特殊字 符、字符统一转换、拼写纠正、截取、拼音转汉字、中英文互换中的至少一种处理。9. 根据权利要求6所述的系统,其特征在于,所述解析模块还包括:关键词修正模块, 用于根据关键词的标签按照预定的规则进行合并组成以修正关键词。10. 根据权利要求6所述的系统,其特征在于,所述分类推荐模块中还包括:备选词筛 选模块,用于在同一分类中有多个备选关键词时,将全部备选关键词推荐给用户、或将备选 关键词按排序后的顺序优选推荐。
【文档编号】G06F17/30GK105824833SQ201510005745
【公开日】2016年8月3日
【申请日】2015年1月7日
【发明人】沈海旺, 张侦, 曾敏锐
【申请人】苏宁云商集团股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1