基于用户情感倾向提供服务的方法和设备的制作方法

文档序号:6638694阅读:178来源:国知局
基于用户情感倾向提供服务的方法和设备的制作方法
【专利摘要】本申请的实施例公开了一种基于用户情感倾向提供服务的方法,其特征在于,包括:确定待评估文本,其中,所述待评估文本是一用户阅读过的至少一文本;根据一用户情感随时间演变的模型,确定所述待评估文本令所述用户产生每一种情感倾向的概率分布;根据所述待评估文本令所述用户产生每一种情感倾向的概率分布,为所述用户提供服务。本申请还公开了一种基于用户情感倾向提供服务的设备。采用本申请所述的基于用户情感倾向提供服务的方法和设备,可以对用户情倾向进行深度分析,并据此提供有针对性的服务,弥补了现有技术的缺陷。
【专利说明】基于用户情感倾向提供服务的方法和设备

【技术领域】
[0001] 本申请设及数据挖掘【技术领域】,尤其设及一种基于用户情感倾向提供服务的方法 和设备。

【背景技术】
[0002] 近年来,随着互联网相关技术的不断发展,各种内容推送逐渐成为应用提供商增 加用户使用频率的主要手段。当前有很多基于用户行为的内容推送方式。例如,根据用户 浏览过的商品,向用户推送类似的商品促销信息;根据用户的当前位置,向用户推送附近的 服务倍息等等。
[0003] 当前,不少口户网站开始允许用户分享他们关于某个新闻的屯、情。通过分析用户 对某个新闻的情感倾向,可W知道用户看什么新闻会高兴,看什么新闻会愤怒,看什么新闻 会沮丧等等。
[0004] 用户在阅读过文本后产生什么样的情感倾向,在很大程度上反映了用户的兴趣点 所在。然而,现有的内容推送方式有一定的局限性,无法获知用户的情感倾向随时间的演 变,更无法基于此进行内容的推送。


【发明内容】

[0005] 本申请的目的是;提供一种基于用户情感倾向提供服务的方法和设备。
[0006] 根据本申请至少一个实施例的一个方面,提供了一种基于用户情感倾向提供服务 的方法,包括:
[0007] 确定待评估文本,其中,所述待评估文本是一用户阅读过的至少一文本;
[000引根据一用户情感随时间演变的模型,确定所述待评估文本令所述用户产生每一种 情感倾向的概率分布;
[0009] 根据所述待评估文本令所述用户产生每一种情感倾向的概率分布,为所述用户提 供服务。
[0010] 根据本申请至少一个实施例的另一个方面,提供一种基于用户情感倾向提供服务 的设备,包括:
[0011] 一评估文本确定装置,用于确定待评估文本,其中,所述待评估文本是一用户阅读 过的至少一文本.
[0012] 一情感概率分布确定装置,用于根据一用户情感随时间演变的模型,确定所述待 评估文本令所述用户产生每一种情感倾向的概率分布;
[0013] 一服务提供装置,用于根据所述待评估文本令所述用户产生每一种情感倾向的概 率分布,为所述用户提供服务。
[0014] 采用本申请所述的基于用户情感倾向提供服务的方法和设备,可W对用户情倾向 进行深度分析,并据此提供有针对性的服务,弥补了现有技术的缺陷。

【专利附图】

【附图说明】
[0015] 图1是本申请的一个实施例提供的建立情感模型的方法流程示意图;
[0016] 图2是本申请的一个实施例中用户反馈情感倾向的交互界面示意图;
[0017] 图3a是本申请的另一个实施例提供的建立情感模型的方法流程示意图;
[0018] 图3b是本申请的另一个实施例提供的建立情感模型的方法流程示意图;
[0019] 图4是本申请一个实施例提供的预测用户情感倾向的方法流程示意图;
[0020] 图5是本申请一个实施例提供的监控舆情的方法流程示意图;
[0021] 图6是本申请一个实施例提供的基于用户情感倾向提供服务的方法流程示意图;
[0022] 图7是本申请一个实施例提供的建立情感模型的装置结构示意图;
[0023] 图8是本申请另一个实施例提供的建立情感模型的装置结构示意图;
[0024] 图9是本申请另一个实施例提供的建立情感模型的装置结构示意图;
[0025] 图10是本申请另一个实施例提供的建立情感模型的装置结构示意图;
[0026] 图11是本申请一个实施例提供的第一输出子模块744或第二输出子模块748结 构示意图;
[0027] 图12是本申请一个实施例提供的预测用户情感倾向的设备结构示意图;
[002引图13是本申请另一个实施例提供的预测用户情感倾向的设备结构示意图;
[0029] 图14是本申请另一个实施例提供的预测用户情感倾向的设备结构示意图;
[0030] 图15是本申请另一个实施例提供的预测用户情感倾向的设备结构示意图;
[0031] 图16是本申请一个实施例提供的监控舆情的设备结构示意图;
[0032] 图17是本申请另一个实施例提供的监控舆情的设备结构示意图;
[0033] 图18是本申请另一个实施例提供的监控舆情的设备结构示意图;
[0034] 图19是本申请另一个实施例提供的监控舆情的设备结构示意图;
[0035] 图20是本申请另一个实施例提供的监控舆情的设备结构示意图;
[0036] 图21是本申请一个实施例提供的基于用户情感倾向提供服务的设备结构示意 图;
[0037] 图22是本申请另一个实施例提供的基于用户情感倾向提供服务的设备结构示意 图;
[003引图23是本申请另一个实施例提供的基于用户情感倾向提供服务的设备结构示意 图;
[0039] 图24是本申请另一个实施例提供的基于用户情感倾向提供服务的设备结构示意 图;
[0040] 图25是本申请另一个实施例提供的基于用户情感倾向提供服务的设备结构示意 图。

【具体实施方式】
[0041] 下面结合附图和实施例,对本申请的【具体实施方式】作进一步详细说明。W下实施 例用于说明本申请,但不用来限制本申请的范围。
[0042] 本领域技术人员理解,在本申请的实施例中,下述各步骤的序号的大小并不意味 着执行顺序的先后,各步骤的执行顺序应W其功能和内在逻辑确定,而不应对本申请实施 例的实施过程构成任何限定。
[0043] 另外,本申请中的"第一"、"第二"等术语仅用于区别不同步骤、设备或模块等,既 不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
[0044] 图1是本申请一个实施例所述的建立情感模型的方法,参见图1,所述方法包括:
[0045] S100 ;确定至少一训练文本;
[0046] S120;对所述至少一训练文本进行预处理,确定每一个训练文本的文字向量和每 一个训练文本的情感向量;
[0047] S140 ;根据每一个训练文本的所述文字向量、每一个训练文本的所述情感向量W 及每一个训练文本的发布时间,确定用户情感随时间演变的模型。
[0048] 可选的,在本申请的一个可选实施例中,上述S100中确定至少一训练文本,可W 包括;从互联网上获取一段时间内发布的内容,作为训练文本。当然,也可W是用其他的方 式获取训练文本,例如,用户手动导入至少一文本作为训练文本,本申请的实施例对此不作 限定。上述内容可W包括;新闻、社交网络发言(博客或者微博等等)或者网络论坛的帖子 Afr Afr 寸寸〇
[0049] 获得训练文本后,就可W进行预处理,确定每一个训练文本的文字向量和每一个 训练文本的情感向量(S120)。
[0050] 可选的,上述文字向量可W为每一个训练文本的有效单词。例如,每一个训练文本 的文字向量可W表示为:
[0051 ] d = {wl, w2, w3, wl, w4, w5, w5, w2...}。
[0化2] 可选的,上述情感向量可W为用户预先阅读了每一个训练文本后产生的至少一种 情感倾向。例如,每一个训练文本的情感向量可W表示为:
[0053] e={el:nl ,e2:n2,e3:n3,e4:n4...}
[0054] 其中,111、112、113、114''呵^表示产生该情感倾向的数量,示例性的,上述某一种情 感倾向的数量,可W是产生该情感倾向的统计数量,或者,还可W是该情感倾向产生的归一 化数量,例如,该归一化数量可W是该情感倾向产生的统计数量占所有情感倾向统计数量 的比例。
[0化5] 对于文本向量来说,通常情况下,一个文本中,去除掉一些无意义的单词(例如, "的""了"之类的单词)之后,剩下的就是有效单词了。
[0化6] 而对于情感向量来说,用户在阅读训练文本之后,可W通过如图2所示的交互界 面选择最能代表自己情感倾向的选项,因此就可W根据用户反馈的数据进行统计,得到每 一个训练文本的情感向量。又或者,用户阅读训练文本后,可W通过文字等形式发表自己的 评论,对用户的评论进行分类,就可W得到每一个训练文本的情感向量。
[0化7] 在本申请一个可选实施例中,在确定了每一个训练文本的文字向量和每一个训练 文本的情感向量后,将每一个训练文本的文字向量中的每一个有效单词和每一个训练文本 的训练文本的情感向量W及发布时间绑定,得到训练文本的一个元组;(武t,W)。如果训练 文本d有Nd个单词,那么训练文本d的元组(e,t,W)也有Nd个。在一个训练文本的所有元 组中,情感向量苦和发布时间t都是相同的。上述发布时间可W具体到"小时"或者"日", 当然也可w粒度大一些,例如,具体到"月"或者具体到"年"等等,本申请的实施例对此不 作具体限定。
[005引在本申请的另一个可选实施例中,可W按照发布时间对训练文本进行划分,归属 于同一个时间段内的训练文本,发布时间可W认为是相同的。针对归属于同一个时间段内 的训练文本单独建立子模型,则本申请所述的用户情感对时间演变的模型就可W包括多个 不同时间段的子模型。在每一个子模型中,由于训练文本的发布时间是相同的,因此,得到 的元组可W只包括有效单词和情感向量,即;C^,W)。
[0化9] 在本申请的实施例中,假设文本是由各类主题组成的,此处的"主题"表示一个概 念、一个方面,形象来说,主题可W认为是一个桶,里面装了出现概率较高的元组,该些元组 与该个主题有很强的相关性。通过"主题"该个中介,就可W将文本与元组联系起来。
[0060] 因此,在本申请的实施例中,某一个文本产生某一元组的概率都可W通过"文本W 一定的概率选择了某个主题,该个主题W-定的概率产生了某一元组"该样一个过程得到 的。即:
[0061] P(元组I文本)=S主题P(元组I主题)XP(主题I文本)
[0062] 对每一个训练文本进行统计,确定某个训练文本中某一个元组出现的次数,就可 W得到基于训练文本的P (元组I训练文本)。然后通过一算法,得到P (元组I主题)和 P (主题I训练文本)。根据训练得到的P (元组I主题)和P (主题I训练文本),就可W确 定任一文本产生任一元组的近似后验分布P (元组I文本)。
[0063] 在一个可选实施例中,如图3a所示,上述S140中根据每一个训练文本的所述文字 向量、每一个训练文本的所述情感向量W及每一个训练文本的发布时间,确定用户情感随 时间演变的模型,可W包括:
[0064] S141 ;将第i个训练文本的文字向量中的每一个有效单词和第i个训练文本的情 感向量W及第i个训练文本的发布时间绑定,得到第i个训练文本的多个元组;
[00化]S142 ;对第i个训练文本进行统计,确定所述第i个训练文本中出现元组r的概率 P (元组r I训练文本i);
[0066] S143 ;根据所述P (元组r I训练文本i),通过一算法,确定所述第i个训练文本选 择主题k的概率P (主题k I训练文本i) W及所述主题k产生元组r的概率P (元组r I主 题k);
[0067] S144 ;用于根据所述P (主题k I训练文本i)和所述P (元组r I主题k),确定任一 文本产生任一元组的近似后验分布P (元组I文本)。
[0068] 在另一个可选实施例中,如图3b所示,上述S140中根据每一个训练文本的所述文 字向量、每一个训练文本的所述情感向量W及每一个训练文本的发布时间,确定用户情感 随时间演变的模型,可W包括:
[0069] S145 ;将每一个训练文本的文字向量中的每一个有效单词和每一个训练文本的情 感向量绑定,得到每一个训练文本的多个元组;
[0070] S146;对至少一时间段发布的训练文本进行统计,确定所述至少一时间段内发布 的第i个训练文本中出现元组r的概率P (元组r I训练文本i);
[0071] S147 ;根据所述P (元组r I训练文本i),通过一算法,确定所述第i个训练文本选 择主题k的概率P (主题k I训练文本i) W及所述主题k产生元组r的概率P (元组r I主 题k);
[007引 S148 ;根据所述P (主题k I训练文本i)和所述P (元组r I主题k),确定至少一时 间段内任一文本产生任一元组的近似后验分布P (元组I文本)。
[007引可选的,上述算法,可W是基于采样的算法,或者也可W是变分 EM巧xpectation-maximization,期望最大化)算法。基于采样的算法通过收集后验分布 的样本,W样本的分布求得后验分布的近似,常见的基于采样的算法例如基于吉布斯采样 (Gibbs Sampling)的算法。而变分EM算法则是先假定一族在隐藏结构之上的参数化的分 布,再通过变分思想迭代更新寻找与后验分布最接近的分布。下面W基于吉布斯采样的算 法为例,介绍本申请实施例中确定模型的两种过程。
[0074] (1)假设一训练文本集D,有m个训练文本dl,d2,d3……血,发布时间分别为;tl, t2, 1:3......tm,n 个主题 Zl,Z2, Z3......化。
[0075] 将训练文本集中的每一个训练文本都转化成元组的形式;(若,t,W)
[0076] 初始时;W均等的概率(1)或者随机为每一个训练文本的每一个元组赋予一个主 打 题,示例性的,如表1所示:
[0077]表 1 [007引

【权利要求】
1. 一种基于用户情感倾向提供服务的方法,其特征在于,包括: 确定待评估文本,其中,所述待评估文本是一用户阅读过的至少一文本; 根据一用户情感随时间演变的模型,确定所述待评估文本令所述用户产生每一种情感 倾向的概率分布; 根据所述待评估文本令所述用户产生每一种情感倾向的概率分布,为所述用户提供服 务。
2. 如权利要求1所述的方法,其特征在于,根据一用户情感随时间演变的模型,确定所 述待评估文本令所述用户产生每一种情感倾向的概率分布,包括: 对所述待评估文本进行预处理,确定每一个待评估文本的文字向量和每一个待评估文 本的情感向量; 将每一个待评估文本的文字向量中的每一个有效单词和每一个待评估文本的情感向 量以及每一个待评估文本的发布时间绑定,得到每一个待评估文本的元组; 将每一个待评估文本的元组输入所述用户情感随时间演变的模型,根据所述用户情感 随时间演变的模型的输出结果,确定所述待评估文本令用户产生每一种情感倾向的概率分 布; 或者 对所述待评估文本进行预处理,确定每一个待评估文本的文字向量和每一个待评估文 本的情感向量; 将每一个待评估文本的文字向量中的每一个有效单词和每一个待评估文本的情感向 量绑定,得到每一个待评估文本的元组; 将每一个待评估文本的元组输入所述用户情感随时间演变的模型中与每一个待评估 文本的发布时间对应的子模型,根据所述用户情感随时间演变的模型的输出结果,确定所 述待评估文本令用户产生每一种情感倾向的概率分布。
3. 如权利要求1或2所述的方法,其特征在于,所述根据所述待评估文本令所述用户产 生每一种情感倾向的概率分布,为所述用户提供服务,包括: 为所述用户推送至少一内容,或请求网络侧为所述用户推送至少一内容,其中,所述至 少一内容令所述用户产生每一种情感倾向的概率分布与所述待评估文本令所述用户产生 每一种情感倾向的概率分布相匹配;和/或 为所述用户推荐好友,或请求网络侧为所述用户推荐好友,其中,所述好友阅读过的文 本令所述好友产生每一种情感倾向的概率分布与所述待评估文本令所述用户产生每一种 情感倾向的概率分布相匹配。
4. 如权利要求1至3中任一所述的方法,其特征在于,所述方法还包括: 建立所述用户情感随时间演变的模型。
5. 如权利要求4所述的方法,其特征在于,所述建立所述用户情感随时间演变的模型, 包括: 确定至少一训练文本; 对所述至少一训练文本进行预处理,确定每一个训练文本的文字向量和每一个训练文 本的情感向量; 根据每一个训练文本的所述文字向量、每一个训练文本的所述情感向量以及每一个训 练文本的发布时间,确定用户情感随时间演变的模型。
6. -种基于用户情感倾向提供服务的设备,其特征在于,所述基于用户情感倾向提供 服务的设备包括: 一评估文本确定装置,用于确定待评估文本,其中,所述待评估文本是一用户阅读过的 至少一文本; 一情感概率分布确定装置,用于根据一用户情感随时间演变的模型,确定所述待评估 文本令所述用户产生每一种情感倾向的概率分布; 一服务提供装置,用于根据所述待评估文本令所述用户产生每一种情感倾向的概率分 布,为所述用户提供服务。
7. 如权利要求6所述的设备,其特征在于,所述情感概率分布确定装置包括: 第一处理模块,用于对所述待评估文本进行预处理,确定每一个待评估文本的文字向 量和每一个待评估文本的情感向量; 第一元组确定模块,用于将每一个待评估文本的文字向量中的每一个有效单词和每一 个待评估文本的情感向量以及每一个待评估文本的发布时间绑定,得到每一个待评估文本 的元组; 第一输入模块,用于将每一个待评估文本的元组输入所述用户情感随时间演变的模 型,根据所述用户情感随时间演变的模型的输出结果,确定所述待评估文本令用户产生每 一种情感倾向的概率分布; 或者 第二处理模块,用于对所述待评估文本进行预处理,确定每一个待评估文本的文字向 量和每一个待评估文本的情感向量; 第二元组确定模块,用于将每一个待评估文本的文字向量中的每一个有效单词和每一 个待评估文本的情感向量绑定,得到每一个待评估文本的元组; 第二输入模块,用于将每一个待评估文本的元组输入所述用户情感随时间演变的模型 中与每一个待评估文本的发布时间对应的子模型,根据所述用户情感随时间演变的模型的 输出结果,确定所述待评估文本令用户产生每一种情感倾向的概率分布。
8. 如权利要求6或7所述的设备,其特征在于,所述服务提供装置包括: 第一服务提供模块,用于为所述用户推送至少一内容,或请求网络侧为所述用户推送 至少一内容,其中,所述至少一内容令所述用户产生每一种情感倾向的概率分布与所述待 评估文本令所述用户产生每一种情感倾向的概率分布相匹配;和/或 第二服务提供模块,用于为所述用户推荐好友,或请求网络侧为所述用户推荐好友,其 中,所述好友阅读过的文本令所述好友产生每一种情感倾向的概率分布与所述待评估文本 令所述用户产生每一种情感倾向的概率分布相匹配。
9. 如权利要求6至8中任一所述的设备,其特征在于,所述监控舆情的设备还包括: 一建立情感模型的装置,用于建立所述用户情感随时间演变的模型。
10. 如权利要求9所述的设备,其特征在于,所述建立情感模型的装置包括: 确定模块,用于确定至少一训练文本; 预处理模块,用于对所述至少一训练文本进行预处理,确定每一个训练文本的文字向 量和每一个训练文本的情感向量; 建模模块,用于根据每一个训练文本的所述文字向量、每一个训练文本的所述情感向 量以及每一个训练文本的发布时间,确定用户情感随时间演变的模型。
【文档编号】G06F17/30GK104504032SQ201410773678
【公开日】2015年4月8日 申请日期:2014年12月12日 优先权日:2014年12月12日
【发明者】于魁飞 申请人:北京智谷睿拓技术服务有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1