可拓展的用户意图挖掘方法及其系统的制作方法_4

文档序号:9911146阅读:来源:国知局
099] 本发明所述的方法及系统还可以应用于其他具有显示屏的设备中,例如智能手 机、掌上电脑、个人电脑、智能手表等等。亦即,本发明所述的方法不仅仅能够应用可拓展的 用户意图挖掘的系统中,还可以作为一个核心功能整合到其他系统中,例如社交媒体系统, 其他内容推荐系统、信息搜索系统或者其他用户交互系统等等。例如,用户想要购买2014年 NBA芝加哥公牛队的门票。首先,用户在装有搜索引擎的移动手机的搜索引擎搜索框中输入 搜索短语:NBA门票。在系统获取所述搜索短语(即NBA门票)后,系统判断在过去两小时内是 否有用户的搜索历史记录。假设用于学习用户意图的公共多模型RBM已经通过公共搜索日 志数据集的搜索项构建完成。若不存在用户的搜索历史,那么使用公共多模型RBM来预测用 户意图。亦即,对于没有用户搜索历史记录的情况下,使用公共多模型RBM来预测用户意图。
[0100] 另一方面,假设用户曾经在过去两小时内输入"芝加哥公牛"或者"芝加哥公牛门 票"搜索(即用户的搜索历史)。在此时,所述公共多模型RBM在用户的历史搜索项(8卩"芝加 哥公牛"或者"芝加哥公牛门票")中应用,从而训练个人多模型RBM。进一步的,对于具有若 干历史记录的用户而言,可以应用相类似用户群的搜索项来训练个人多模型RBM来预测用 户的寻找目标。
[0101] 具体的,所述从用户的历史搜索项中生成的搜索项表示可以用于计算与公共搜索 日志数据集的搜索项的相似性(例如相似的命名实体)。收集具有显著相似性的搜索项的 ID。这些ID可以认为是具有至少一个与用户相类似兴趣的相类似用户。所述相类似用户可 以包括在最近一段时间内,若干搜索"2014年NBA芝加哥公牛赛程"、"2014年芝加哥公牛队 得分"、"2014芝加哥公牛队门票"和/或"芝加哥公牛队员"的其他用户。然后,建立一个包括 源自于相类似用户群的若干搜索项(例如"2014芝加哥公牛队门票")以及历史搜索项(即 "芝加哥公牛")的新的数据库。个人多模型RBM通过使用所述新的数据库训练所述公共多模 型RBM来生成。
[0102] 进一步的,使用个人多模型RBM预测所述用户意图。基于预测的用户意图(例如用 户想要购买2014年NBA芝加哥公牛队的门票)。搜索引擎可以通过所述模型学习程序,返回 至少一个用户最感兴趣的链接(或者URL)。
[0103] 用户可以点击该返回结果中的链接(或者URL)来浏览网页。或者用户可以在搜索 框中输入其他的搜索短语来启动一个新的搜索运行过程。
[0104] 具体的,所述可拓展的多模型学习系统可以整合到智能电视机系统和/或智能手 机中来帮助组织和分享输出信息的价值从而对购物决定、电影选择、服务,商店选择、租借 D VD、购买图书等等提供协助。
[0105] 具体实施例中的其他的步骤可以认为是对用于进行可拓展的用户意图挖掘的系 统的描述。将本发明所述系统和方法应用于不同领域,进行改进,替换,调整或者相当于本 发明所公开的具体技术实施方案都是本领域普通技术人员不需要通过创造性劳动就能实 现的。
【主权项】
1. 一种可拓展的用户意图挖掘方法,其特征在于,包括如下步骤: 在公共搜索日志数据集的若干搜索日志中检测第一命名实体; 基于所述第一命名实体,生成与所述第一命名实体对应的若干搜索日志的第一特征; 在所述第一特征上应用所述多模型的限制玻尔兹曼机从而训练公共多模型限制玻尔 兹曼机; 生成公共搜索项目的表示; 获取用户的搜索项目; 判断是否存在用户的搜索历史; 当不存在用户的搜索历史时,使用所述公共多模型限制玻尔兹曼机来预测用户意图, 并且当存在用户的搜索历史时,在所述搜索历史上应用所述公共多模型限制玻尔兹曼机从 而训练个人多模型限制玻尔兹曼机,并使用所述个人多模型限制玻尔兹曼机来预测用户意 图。2. 根据权利要求1所述的可拓展的用户意图挖掘方法,其特征在于,所述用户的搜索历 史具体为:在预定的时间段内,所述用户的前Μ个搜索项目;其中Μ为大于1的整数。3. 根据权利要求1所述的可拓展的用户意图挖掘方法,其特征在于,所述"在所述搜索 历史上应用所述公共多模型限制玻尔兹曼机从而训练个人多模型限制玻尔兹曼机"的步骤 具体包括: 检测用户的搜索历史的第二命名实体;基于所述第二命名实体,生成与用户搜索历史 相对应的第二特征; 使用所述公共多模型限制玻尔兹曼机,生成至少一个用户搜索历史的个人搜索项目的 表示基于所述至少一个个人搜索项目的表示,比较所述个人搜索项目的表示与公共搜索项 目的表示从而寻找一个或者多个与所述用户具有至少一个相类似特征的相类似用户,并且 使用所述一个或者多个的相类似用户的数据训练所述公共多模型限制玻尔兹曼机来生成 所述个人多模型限制玻尔兹曼机。4. 根据权利要求1所述的可拓展的用户意图挖掘方法,其特征在于,所述方法还包括: 基于所述预测的用户意图,向用户展示至少一个搜索结果。5. 根据权利要求3所述的可拓展的用户意图挖掘方法,其特征在于,所述"比较所述个 人搜索项目的表示与公共搜索项目的表示从而寻找一个或者多个与所述用户具有至少一 个相类似特征的相类似用户"的步骤具体包括: 基于所述至少一个个人搜索项目的表示,计算与其相似的,在公共搜索日志数据集中 的搜索项目的第一命名实体; 基于相似的第一命名实体,收集相似的第一命名实体的搜索项的ID,其中所述ID表示 具有至少一个与所述用户相类似的兴趣的相类似用户,并且 基于收集获得的ID,建立包括用户的搜索历史以及一个或多个相类似用户的若干搜索 项目的新数据库。6. 根据权利要求3所述的可拓展的用户意图挖掘方法,其特征在于,所述"检测用户的 搜索历史的第二命名实体"的步骤具体包括:使用点互信息优化公共搜索日志数据集的n-gram模型;其中,η为小于等于7的整数。7. 根据权利要求6所述的可拓展的用户意图挖掘方法,其特征在于,给定两个作为随机 变量的候选的命名实体Μι和M2,Mi和M2的点互信息通过如下算式定义:其中,P(Mi η M2)为施和跑共同出现的概率,P(Mi)*P(M2).表示当施和此为独立事件时,Mi 和M2共同出现的概率。8. -种可拓展的用户意图挖掘系统,其特征在于,所述系统包括: 第一命名实体检测单元,用于在公共搜索日志数据集的若干搜索日志中检测第一命名 实体; 第一特征生成单元,用于基于所述第一命名实体,生成与所述第一命名实体对应的搜 索日志的第一特征; 公共多模型限制玻尔兹曼机学习单元,用于在所述第一特征中应用多模型的限制玻尔 兹曼机从而生成公共搜索项目的表示; 个人模型学习模块,用于在用户的搜索历史中应用多模型的限制玻尔兹曼机从而训练 个人多模型限制玻尔兹曼机;以及 意图挖掘模块,用于使用所述公共多模型限制玻尔兹曼机和个人多模型玻尔兹曼机预 测用户意图。9. 根据权利要求8所述的可拓展的用户意图挖掘系统,其特征在于,所述用户的搜索历 史具体为:在预定的时间段内,所述用户的前Μ个搜索项目;其中Μ为大于1的整数。10. 根据权利要求8所述的可拓展的用户意图挖掘系统,其特征在于,所述个人模型学 习模块具体包括: 第二命名实体检测单元,用于检测用户的搜索历史的第二命名实体; 第二特征生成单元,用于基于所述第二命名实体,生成与用户搜索历史相对应的第二 特征; 公共多模型限制玻尔兹曼机单元,用于使用从公共搜索日志数据集学习获得的公共多 模型限制玻尔兹曼机,生成至少一个用户搜索历史的个人搜索项目的表示; 个人多模型限制玻尔兹曼机单元,用于使用若干进行个性化学习的搜索项目训练个人 多模型限制玻尔兹曼机;其中,所述进行个性化学习的搜索项目包括用户搜索历史和一个 或者多个相类似用户的若干搜索项目。11. 根据权利要求8所述的可拓展的用户意图挖掘系统,其特征在于,基于所述预测的 用户意图,向用户展示至少一个搜索结果。12. 根据权利要求8所述的可拓展的用户意图挖掘系统,其特征在于,公共搜索日志数 据集的n-gram模型由点互信息进行优化;其中,η为小于等于7的整数。13. 根据权利要求11所述的可拓展的用户意图挖掘系统,其特征在于,给定两个作为随 机变量的候选的命名实体Μι和M2,Μι和M2的点互信息通过如下算式定义:其中,P(Mi n M2)为施和跑共同出现的概率,P(Mi)*P(M2).表示当施和此为独立事件时,Mi 和M2共同出现的概率。
【专利摘要】本发明公开了一种可拓展的用户意图挖掘方法及其系统。其中,所述方法包括:在公共搜索日志数据集的若干搜索日志中检测第一命名实体并且基于所述第一命名实体,生成与所述第一命名实体对应的若干搜索日志的第一特征。还包括:在所述第一特征上应用所述多模型的限制玻尔兹曼机从而训练公共多模型限制玻尔兹曼机;生成公共搜索项目的表示;获取用户的搜索项目并判断是否存在用户的搜索历史。当不存在用户的搜索历史时,使用所述公共多模型限制玻尔兹曼机来预测用户意图,并且当存在用户的搜索历史时,在所述搜索历史上应用所述公共多模型限制玻尔兹曼机从而训练个人多模型限制玻尔兹曼机,并使用所述个人多模型限制玻尔兹曼机来预测用户意图。
【IPC分类】G06F17/30, G06N3/04
【公开号】CN105677780
【申请号】CN201511026505
【发明人】商玥, 郭立帆, 丁婉莹, 宋晓利, 刘梦雯, 汪灏泓
【申请人】Tcl集团股份有限公司
【公开日】2016年6月15日
【申请日】2015年12月29日
【公告号】US20160188726
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1