一种根据用户行为提炼关键字并智能分发的方法

文档序号:6621233阅读:125来源:国知局
一种根据用户行为提炼关键字并智能分发的方法
【专利摘要】本发明的公开了一种根据用户行为提炼关键字并实现资讯智能分发的方法,服务器会为每个用户建立个人数据库,还有每30分钟关键字评分表,用户每看一条资讯,服务器都会分析该资讯包含哪些关键字,并在历史数据关键字评分表中对这些关键字进行加分,等用户下次请求资讯时,服务器会先分析用户近30分钟的浏览记录,若30分钟内,浏览记录多于10条,则根据30分钟内,浏览记录最多的关键字,下发资讯,若否,服务器会优先下发历史数据关键字评分表中分数较高的关键字对应的资讯,上述方法即可实现按用户所需和兴趣爱好推荐服务的功能。
【专利说明】一种根据用户行为提炼关键字并智能分发的方法
[0001]

【技术领域】: 本发明涉及智能手机阅读软件的资讯智能分发【技术领域】,特别地涉及一种互联网应用 软件的资讯智能分发的技术方法。
[0002]

【背景技术】: 随着互联网技术的发展,每天在我们的生活中出现了大量的信息,新闻信息飞速增加、 广告信息铺天盖地、科技信息飞速递增。很多时候,用户并不想、也无法接受那么多的信息 量,更加无法有效找到自身感兴趣的内容。目前,市面上的资讯聚合类软件,大多都只是通 过设置频道、或者让用户选择标签的方式,来区分用户群体,未能实现每个用户差异化、智 能化分发。
[0003]根据用户行为提炼关键字并智能分发资讯,解决了用户无法有效找到喜爱内容的 问题,在算法逻辑上尚属首创。针对活跃用户,效果尤其明显。
[0004]实现资讯智能分发,通过分析用户所有的浏览记录,以及近30分钟的浏览记录, 提炼出用户最喜欢的关键字是哪些,并储存在用户的个人数据库中。以后,用户请求资讯, 服务器会根据该用户个人数据库中的关键字信息,自动匹配用户喜欢的资讯内容,分发给 用户。
[0005]


【发明内容】
: 本发明的主要内容是提供一种根据用户行为提炼关键字并实现资讯智能分发的方法, 以解决现有的资讯类软件,无法识别用户兴趣和行为的不同,按用户所需和兴趣爱好推荐 服务的功能; 为解决上述问题,提供如下解决方案: :、服务器建立一个关键字库,包含大量网络上、日常生活会碰到的关键字; 一、服务器会为每个用户建立个人数据库,包含两个关键字评分表-历史数据关键 字评分表,以及30分钟关键字评分表。用户每看一条资讯,服务器都会分析该资讯包含哪 些关键字,并在历史数据关键字评分表中对这些关键字进行加分,等用户下次请求资讯时, 服务器会先分析用户近30分钟的浏览记录,若30分钟内,浏览记录多于 10条,则根据3〇 分钟内,浏览记录最多的关键字,下发资讯,若否,服务器会优先下发历史数据关键字评分 表中分数较高的关键字对应的资讯。
[0006]

【专利附图】

【附图说明】: 图1 :用户历史数据关键字评分表 图2 :用户30分钟关键字评分表

【具体实施方式】: 1、资讯软件发布的每一条资讯,在后台已通过文本数据挖掘的方法,分析出了关键字 是哪些。当用户查看了某一条资讯,我们默认为用户喜欢这条资讯,于是,我们对这些关键 字进行加分,对其余关键字进行减分,最终保证总分为零。
[0007]设现在共有关键词N个,总分为M,设每个关键词对应的分 数为哪最初状态,每个关键词对应的分数为0,即 M1=财2, =。.伽=A+1+ …+A := 0。
[0008] 当用户查看一条资讯不抽、Λ、、 、'不妨奴这条资讯有k个关键词,对应分数为 MvMZf M3r......< AQ。
[0009] 当用户看完这条资讯后脂么取』 一 '服务器对该用户的这k个关键词进行加分,即 11% + i.= .i,M2 =仏 +1 = i:'以. .,... ..... ...: 4 千, 1 ^ 2 2 1 = Λ?3 - 1 = 1,……,=Mk + lCL,对剩 下的iV - 个关键词进订减分,每个苦键空、#八 丨天键子减分一样多,同时要保证总分Μ恒等于0,即 :处_ . * Λ?, , -· Λ? ju -j - ~一~ ? iVl = // _ ^ ( . . :? ,+1 V~f:卜二"k+2 ......,?- 1 = 广丄, 最终,总分 :M Μ:Σ^ι'Μ,M *f % +, m' +^,.,:m^· .., .C i (-? i 卞 1) 了(? 一 1) +......+ (乂 + i) + (仏+1 _ 5) + {Mk+2 ΛΓ-fe) + + (^JV-1 - - ( Λ? ν - -i-'j = f;lf1 _ -L --…丁'丄…"了叫-1 + Wv) + fl . k- (ΛΓ - fc) _ 4 = ¢+ 0 = 〇 L 'V - k] 如果用户蒲另-条錢,同_,那絲讯对麵关麵各加丨分,其余关键字分摊 减分,保证总分为零。
[0010] 2、每个用户都有两个关键字评分表(如图i、图2),一个是历史数据的关键字评分 表,另一个是近30分钟的关键字评分表。
[0011] 3、服务器每隔一分钟,会分析每个用户近30分钟的浏览记录,如果某用户 30分钟内浏览记录少于10条,不进行分析,如果该用户3〇分钟内浏览记录多于或等 于10条,对该用户的这些记录进行分析:假设用户3〇分钟内看了条资讯,包含 了 η (η > 0)个关键字,它们对应的分数为M r Μ:, M3…_,每个关键字出现的次数分别是 …..-KM £ (1.2.3......n),fc,.,则服务器会对这11个关键字加分,即各个关键字的 r 新分数Α? = Α?,,fii = ,财,=财3 + 灸3 ........时,1 一 财"..。 d 的单键窣令教衷,毎分钟计算-次。当某个用户请求资讯时,服 务器会优先判断该用户30分钟内哪个关键字分数最高,如果用户30分钟内没有阅读过资 讯,则30分钟关键字评分表中各关键字分数为零,直接跳到第七步;否则,若3〇分钟内关键 字评分表中,有至少1个关键字分数大于零,则服务器会判断该用户哪个关键字分数最高, 假设该用户 3〇分钟评分表中得分最高的关键字是A (如果有两个或多个关键字同分,随机 取其中一个),则服务器从资讯池中寻找包含关键字A的资讯,由于用户每次请求资讯,服务 器都是返回十条数据(资讯),故服务器还需分析出剩下的9条资讯应该选择哪些内容,方法 是服务器继续分析用户近30分钟关键字评分表,找到排除关键字A后,30分钟内得分最高 的关键字B (如果有两个或多个关键字同分,随机取其中一个),并从资讯池中寻找包含关键 字B的资讯,还需分析出剩下8条资讯怎么选择,再找到排除 A、b关键字后,得分最高的关 键字C,并从资讯池中寻找包含关键字c的资讯,……,如此反复,直到服务器找到了 7条资 讯,之后,服务器从资讯池中随机抽取3条资讯(无需分析关键字),组装成10条资讯,一并 分发给用户; 5、假设用户30分钟内,没有浏览资讯,3〇分钟关键字分数表中,各关键字分数都为零。 此时,服务器会根据用户历史数据关键字评分表来分发资讯,具体方法是:假设该用户历史 数据评分表中,分数最高的关键字是A (如果有两个或多个关键字同分,随机取其中一个), 则服务器从资讯池中寻找包含关键字A的资讯,由于用户每次请求资讯,服务器都是返回 1〇条数据(资讯),故服务器还需分析出剩下的 9条资讯应该选择哪些内容,方法是服务器 继续^析用户历史数据关键字评分表,找到排除关键字A后,历史数据关键字评分表中得 =最高=关键字B (如果有两个或多个关键字同分,随机取其中一个),并从资讯池中寻找包 含关键字B的资讯,还需分析剩下8条资讯怎么选择,再找到排除 A、b关键字后,得分最高 的j键字C,并从资讯池中寻找包含关键字c的资讯,……,如此反复,直到服务器找到了 7 条资讯,之后,服务器从资讯池中随机抽取3条资讯,组装成1〇条资讯,一并分发给用户。
【权利要求】
1. 一种提炼关键字,并实现资讯智能分发的方法,其特征在于,所述方法包括: 对每个用户建立个人数据库,包括两个关键字评分表一用户历史数据关键字评分 表,以及用户30分钟关键字评分表,对每个关键字赋值(每个关键字初值为零),并在用户查 看资讯后,进行加分、减分操作,然后再通过分值高低,实现资讯的智能分发。
2. 根据权利要求1所述的方法,其特征在于,还包括: 在用户历史数据关键字评分表中,每个关键字有对应的分数,初始值均为零,用户看了 某条资讯,该资讯会包含一个(或几个)关键字,这些关键字的分值会加一分,其余关键字需 要减去同样的分数,且最终要保证所有关键字的分数之和仍然等于零。
3. 根据权利要求1所述的方法,其特征在于,还包括: 在用户30分钟关键字评分表中,每个关键字有对应的分数,初始值均为零,服务器每 分钟分析一次用户近30分钟查看了哪些资讯,从而分析出这些资讯出现了哪些关键字(有 些关键字会出现多次),对这些关键字进行相应的加分(某个关键字出现几次就加几分)。
4. 根据权利要求1所述的方法,其特征在于,还包括: 当用户近30分钟有浏览资讯的记录时,服务器优先根据用户近30分钟的行为智能分 发资讯,当用户近30分钟没有浏览资讯时,服务器会根据用户历史行为智能分发资讯。
5. 根据权利要求4的方法,其特征在于,还包括: 若用户近30分钟没有浏览资讯,服务器会根据用户历史行为智能分发资讯,具体方法 为,利用前述方法,确定用户浏览最多的关键字,优先分发包含该关键字的资讯,再确定用 户浏览第二多的关键字,继续分发包含该关键字的资讯,再确定用户浏览第三多的关键字, 分发包含该关键字的资讯,如此反复,直到凑齐7条资讯,剩下的3条资讯从资讯池中随机 获取。
6. 根据权利要求4的方法,其特征在于,还包括: 若用户近30分钟有浏览资讯,服务器会根据用户近30分钟的行为智能分发资讯,具体 方法为,利用前述方法,确定用户近30分钟浏览最多的关键字,优先分发包含该关键字的 资讯,再确定用户浏览第二多的关键字,继续分发包含该关键字的资讯,再确定用户浏览第 三多的关键字,分发包含该关键字的资讯,如此反复,直到凑齐7条资讯(若出现30分钟内, 用户浏览过的关键字数量太少,则余下的资讯从资讯池中随机选择),剩下的3条资讯从资 讯池中随机获取。
7. 根据权利要求4的方法,其特征在于,还包括: 只要用户有不一样的浏览记录,根据算法规则,每个用户拉取到的资讯是不一样的,一 是因为各个用户关键字评分不一样,二是哪怕关键字评分一样,资讯也是从资讯池中选择, 而资讯池可用资讯很多,只能随机选取其中的一个(或几个),所以各用户拉取到的资讯会 有一定不同。
8. 根据权利要求1的方法,其特征在于,还包括: 随着某个用户使用时间的增长,浏览记录的增多,关键字评分表会越来越符合用户的 真实喜好,通俗来说,就是"越看越精准",比如用户喜欢体育,是梅西的球迷,那么他平时会 更多地关注足球,梅西这一类的新闻,等时间久了,"梅西"这个关键字的评分会慢慢变高, 于是该用户看到的资讯里面,包含"梅西"这个关键字的资讯也会越来越多。
【文档编号】G06F17/30GK104298703SQ201410356356
【公开日】2015年1月21日 申请日期:2014年7月25日 优先权日:2014年7月25日
【发明者】不公告发明人 申请人:深圳市英威诺科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1