信息推荐的方法和装置与流程

文档序号:12719734阅读:165来源:国知局
信息推荐的方法和装置与流程

本发明涉及计算机技术领域,特别是涉及一种信息推荐的方法和装置。



背景技术:

随着计算机技术的发展,人们越来越多的通过网络应用进行交流和获取各种信息,如通过微博浏览新闻、通过社交应用获取朋友信息等。

为了便于用户的查看,网络应用可以主动地向用户推荐信息,如向用户推荐其他用户或运营方等发布、分享的信息,包括但不限于新闻、段子、文章、视频链接地址等。现有的信息推荐的方法往往通过信息的发布时间或随机推荐信息,导致推荐的信息往往不是用户关注的,推荐的有效性很低。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种信息推荐的方法和装置,能提高信息推荐的有效性。

一种信息推荐的方法,所述方法包括:

获取用户的用户兴趣标签及各个用户兴趣标签的活跃度;

解析待推荐信息,得到所述待推荐信息对应的信息标签及各个信息标签的活跃度;

根据所述信息标签与所述用户兴趣标签的匹配度、所述用户兴趣标签的活跃度、信息标签的活跃度计算所述待推荐信息与所述用户的匹配分数;

根据所述匹配分数推荐所述待推荐信息。

一种信息推荐的装置,所述装置包括:

用户兴趣标签获取模块,用于获取用户的用户兴趣标签及各个用户兴趣标签的活跃度;

待推荐信息解析模块,用于解析待推荐信息,得到所述待推荐信息对应的信息标签及各个信息标签的活跃度;

匹配分数计算模块,用于根据所述信息标签与所述用户兴趣标签的匹配度、所述用户兴趣标签的活跃度、信息标签的活跃度计算所述待推荐信息与所述用户的匹配分数;

推荐模块,用于根据所述匹配分数推荐所述待推荐信息。

上述信息推荐的方法和装置,通过获取用户的用户兴趣标签及各个用户兴趣标签的活跃度,解析待推荐信息,得到待推荐信息对应的信息标签及各个信息标签的活跃度,根据信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度计算待推荐信息与所述用户的匹配分数,根据匹配分数推荐待推荐信息,匹配分数的计算综合考虑了信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度使得信息的推荐更符合用户的兴趣,推荐的更精准,提高了信息推荐的有效性。

附图说明

图1为一个实施例中信息推荐的方法的应用环境图;

图2为一个实施例中图1中服务器的内部结构图;

图3为一个实施例中信息推荐的方法的流程图;

图4为一个实施例中解析行为文本的流程图;

图5为一个实施例中得到用户兴趣标签及活跃度的流程图;

图6为一个实施例中得到信息标签及活跃度的流程图;

图7为一个实施例中计算匹配分数的流程图;

图8为一个实施例中推荐信息的流程图;

图9为一个实施例中信息推荐的装置的结构框图;

图10为另一个实施例中信息推荐的装置的结构框图;

图11为一个实施例中用户的行为文本解析模块的结构框图;

图12为一个实施例中待推荐信息解析模块的结构框图;

图13为一个实施例中匹配分数计算模块的结构框图;

图14为一个实施例中推荐模块的结构框图。

具体实施方式

图1为一个实施例中信息推荐的方法运行的应用环境图。如图1所示,该应用环境包括终端110、服务器120,其中终端110和服务器120通过网络进行通信。

终端110可为智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。终端110通过网络向服务器120发送信息发布请求和信息查看请求,服务器120可以响应终端110发送的请求,服务器120可以主动向终端110推荐信息。

在一个实施例中,图1中的服务器120的内部结构如图2所示,该服务器120包括通过系统总线连接的处理器、存储介质、内存和网络接口。其中,该服务器120的存储介质存储有操作系统、数据库和信息推荐的装置,数据库用于存储数据,如用户的行为文本,信息推荐的装置用于实现一种适用于服务器120的信息推荐的方法。该服务器120的处理器用于提供计算和控制能力,支撑整个服务器120的运行。该服务器120的内存为存储介质中的信息推荐的装置的运行提供环境。该服务器120的网络接口用于与外部的终端110通过网络连接通信,比如向终端110推荐信息等。

如图3所示,在一个实施例中,提供了一种信息推荐的方法,以应用于上述应用环境中的服务器来举例说明,包括如下步骤:

步骤S210,获取用户的用户兴趣标签及各个用户兴趣标签的活跃度。

具体的,用户兴趣标签反映了用户感兴趣的内容,是通过解析用户的行为数据挖掘得到的,用户的行为数据包括:用户分享及阅读的行为数据,包括文字信息、图片信息、视频信息等,如用户发布的分享信息、用户转发的分享信息、用户点击阅读的分享信息。用户兴趣标签可由用户自行设置,可提供预设的候选兴趣标签供用户选择,预设的候选兴趣标签可根据网络应用的类别和待推荐信息的内容自行设置,如网络应用的类别为社交类,待推荐信息为用户资料,则可提供社交类候选兴趣标签,如性别、爱好、地区等,通过预设的候选兴趣标签能提高兴趣标签的针对性和有效性。用户兴趣标签也可由用户的行为数据产生的行为文本中提取得到,如统计用户分享的文本中出现率高的词语作为用户兴趣标签,如将行为文本与预设类别匹配度最高的类别作为信息标签。 用户兴趣标签的活跃度反映了用户兴趣的大小,对于从用户行为数据中提取的用户兴趣标签,可根据提取的用户兴趣标签在用户行为数据对应的行为文本中出现的频率大小计算。对于用户自定义的兴趣标签,可通过用户的行为数据与自定义的兴趣标签的匹配度,增加或减少自定义的兴趣标签的活跃度,如设定用户自定义的兴趣标签初始活跃度相同,随着时间的推移,如果用户分享的文档与其中一个用户兴趣标签匹配,则将此用户兴趣标签的活跃度加1。用户兴趣标签的数量可以为1个或多个。

步骤S220,解析待推荐信息,得到待推荐信息对应的信息标签及各个信息标签的活跃度。

具体的,待推荐信息是指在由用户或运营方等发布、分享的数据,包括文字信息、图片信息、视频信息等,如新闻、段子、文章、感想等。待推荐信息对应的信息标签可由运营方自行设定,设定的信息标签可与供用户选择设定的候选用户兴趣标签一致,从而便于后续的标签匹配。待推荐信息对应的信息标签可由待推荐信息对应的信息文本中提取得到,如统计待推荐信息对应的信息文本中出现率高的词语作为信息标签,如将待推荐信息与预设类别匹配度最高的类别作为信息标签。信息标签的活跃度反映了信息内容与信息标签的匹配程度,活跃度越大,说明此信息标签越能代表信息的内容。对于从待推荐信息对应的信息文本中提取的信息标签,可根据提取的信息标签在信息文本中出现的频率大小计算。对于运营方自定义的信息标签,可通过用户的反馈行为,增加或减少自定义的信息标签的活跃度,如自定义的信息标签初始活跃度相同,将给用户推荐的信息的各个信息标签展示给用户以接收用户对各个信息标签的反馈行为信息,包括正反馈和负反馈,如果是正反馈,则将此信息标签的活跃度加1,如果是负反馈,则将此信息标签的活跃度减1。待推荐信息对应的信息标签的数量可以为一个或多个。

步骤S230,根据信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度计算待推荐信息与所述用户的匹配分数。

具体的,信息标签与用户兴趣标签的匹配度,可根据需要自定义,如信息标签与用户兴趣标签完全相同,则匹配度为1,信息标签与用户兴趣标签不相同, 但是它们同属于同一主题,则匹配度为小于1的第一预设值,信息标签与用户兴趣标签不相同,但是它们同属于同一类别,则匹配度为小于1的第二预设值,其中主题为比类别精细的词,如类别为球类,主题可为篮球。用户兴趣标签的活跃度、信息标签的活跃度为步骤S230中对应的值,可为归一化后的值,便于计算匹配分数。匹配分数的计算公式可根据需要自定义,如将匹配度、用户兴趣标签的活跃度、信息标签的活跃度直接相乘等。当用户兴趣标签的数量、待推荐信息对应的信息标签的数量为多个时,可分别计算各个用户兴趣标签与各个信息标签的匹配分数,然后累加得到总的匹配分数。

步骤S240,根据匹配分数推荐待推荐信息。

具体的,可设定分数阈值,当待推荐信息与用户的匹配分数超过分数阈值时,则将待推荐信息推荐给用户。当待推荐信息有多个时,可根据匹配分数的从大到小的顺序,对各个待推荐信息排序,将排序靠前的预设数目的待推荐信息推荐给用户。还可根据匹配分数的大小为待推荐信息分配不同的显示参数,显示参数决定了待推荐信息的显示形态,包括显示位置、显示大小,动态显示或静态显示,显示模糊度等,如匹配分数超高,则显示位置越靠前,显示越清晰,匹配分数高的待推荐信息可设定动画效果等。

本实施例中,通过获取用户的用户兴趣标签及各个用户兴趣标签的活跃度,解析待推荐信息,得到待推荐信息对应的信息标签及各个信息标签的活跃度,根据信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度计算待推荐信息与所述用户的匹配分数,根据匹配分数推荐待推荐信息,匹配分数的计算综合考虑了信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度使得信息的推荐更符合用户的兴趣,推荐的更精准,提高了信息推荐的有效性。

在一个实施例中,如图4所示,在步骤S210之前,还包括:

步骤S310,获取用户的行为数据对应的行为文本。

具体的,可根据用户的行为数据的类别获取对应的行为文本,如用户的行为数据为文字类,则行为文本为行为数据本身,如文章、新闻等。如用户的行为数据为图像类,则行为数据对应的行为文本可为对图像的描述类文字,如照 片说明,还可对图像进行识别而得到图像对应的行为文本,如为人像图像,则对应的行为文本为人类、人脸、人手等,根据图像的内容确定。如用户的行为数据为视频,则对应的行为文本可为视频的描述性文字,如果视频存在对应的音频,还可为台词对应的文字等。如用户的行为数据为音频,则可为音频的描述性文字,或音频对应的词语等。

步骤S320,解析行为文本,得到用户的用户兴趣标签及各个用户兴趣标签的活跃度。

具体的,可统计行为文本中出现频率高的词语作为用户的用户兴趣标签,也可获取出现频率高的词语所属的类别作为用户兴趣标签,用户兴趣标签的个数可根据需要自定义,还可自定义用户兴趣标签的候选集,当出现频率高的词语为候选集中的近似词时,将候选集中的词语作为用户兴趣标签,通过候选集可使用户兴趣标签的确定更统一。用户兴趣标签的活跃度可通过出现的频率计算,出现的频率高,则活跃度高。由于用户的兴趣一般会随时时间的变化而变化,但在一定时间内变化不会太大,所以用户兴趣标签可在预设时间段到达时更新,如一个月更新一次,用于更新用户兴趣标签的行为文本,也是近期产生的行为文本,与用户兴趣标签更新时的时间相对应。

在一个实施例中,如图5所示,步骤S320包括:

步骤S321,对行为文本进行分词。

具体的,将行为文本进行分词后就得到了各个词语。

步骤S322,根据各个分词出现的频率计算各个分词的活跃度。

具体的,统计各个分词出现的次数,并将各个分词出现的次数相加得到总的分词次数,将各个分词出现的次数除于总次数,得到各个分词的活跃度。如通过公式计算得到分词x的活跃度Ins(x),其中pv(x)为分词x在行为文本中出现的次数,pv(all)为行为文本中所有分词出现的总次数。

步骤S323,根据各个分词的活跃度筛选得到作为用户的用户兴趣标签的分词及其对应的活跃度。

具体的,可自定义筛选规则得到用户兴趣标签,如将活跃度大于预设阈值的分词作为用户兴趣标签,或将活跃度按从大到小的顺序排序,排序位置靠前的预设数目个活跃度对应的分词作为用户兴趣标签。通过各个分词出现的频率大小筛选得到用户兴趣标签简单方便。

在一个实施例中,如图6所示,步骤S220包括:

步骤S221,获取待推荐信息,对待推荐信息对应的信息文本进行分词。

具体的,可根据待推荐信息的类别获取对应的信息文本,如待推荐信息为文字类,则信息文本为待推荐信息本身,如文章、新闻等。如待推荐信息为图像类,则待推荐信息对应的信息文本可为对图像的描述类文字,如照片说明,还可对图像进行识别而得到图像对应的文本,如为人像图像,则对应的信息文本为人类、人脸、人手等,根据图像的内容确定。如待推荐信息为视频,则对应的信息文本可为视频的描述性文字,如果视频存在对应的音频,还可为台词对应的文字等。如待推荐信息为音频,则可为音频的描述性文字,或音频对应的词语等。得到待推荐信息对应的信息文本后,对其进行分词得到各个词语。

步骤S222,根据各个分词出现的频率计算各个分词的活跃度。

具体的,统计各个分词出现的次数,并将各个分词出现的次数相加得到总的分词次数,将各个分词出现的次数除于总次数,得到各个分词的活跃度。如通过公式计算得到待推荐信息分词y的活跃度Expert(y),其中ev(y)为分词x在信息文本中出现的次数,ev(all)为信息文本中所有分词出现的总次数。

步骤S223,根据各个分词的活跃度筛选得到作为信息标签的分词及其对应的活跃度。

具体的,可自定义筛选规则得到信息标签,如将活跃度大于预设阈值的分词作为信息标签,或将活跃度按从大到小的顺序排序,排序位置靠前的预设数目个活跃度对应的分词作为信息标签。通过各个分词出现的频率大小筛选得到信息标签简单方便。

在一个实施例中,如图7所示,步骤S230包括:

步骤S231,判断信息标签与用户兴趣标签是否相同,如果相同,则为匹配。

具体的,本实施例中只有完全相同的信息标签与用户兴趣标签才算匹配,采用match(x,y)表示信息标签与用户兴趣标签的匹配度,如果匹配,则match(x,y)为1,否则match(x,y)为0。

步骤S232,筛选出匹配的有效信息标签与有效用户兴趣标签。

具体的,假设有多条待推荐信息如信息B、信息C、信息D,每条信息可能有多个信息标签,如信息B的信息标签组成集合b={b1,b2,b3,….bn},用户兴趣标签也可能有多个,如用户兴趣标签组成集合a={a1,a2,a3,….an},找出集合a和集合b中相同的标签,组成匹配的集合对,如a1和b2相同,则{a1,b2}为匹配的有效信息标签与有效用户兴趣标签,并获取它们分别对应的活跃度Ins(a1)和Expert(b2)。

步骤S233,根据匹配的有效信息标签的活跃度与有效用户兴趣标签的活跃度计算得到待推荐信息与用户的匹配分数。

具体的,可根据匹配的有效信息标签的活跃度与有效用户兴趣标签的活跃度自定义公式计算得到匹配分数,在一个实施例中,待推荐信息B与用户A的匹配分数为其中n为用户A的兴趣标签的总个数,m为待推荐信息B的信息标签的总个数,如果ai和bj相同,则match(ai,bj)=1,否则match(ai,bj)=0,其中Ins(ai)表示用户兴趣标签ai的活跃度,Expert(bj)表示信息标签bj的活跃度,α、β为大于0的常数,且α+β=1。

在一个实施例中,如图8所示,步骤S240包括:

步骤S241,获取待推荐信息的发布时间和当前推荐时间。

具体的,待推荐信息的发布时间是指待推荐信息的产生时间,如新闻可以是新闻发生时间,待推荐信息如果是用户分享的文章,则为用户将文章分享出来的时间。当前推荐时间是指当前向用户推荐信息的时间。

步骤S242,根据发布时间、当前推荐时间和匹配分数得到推荐分数,根据 推荐分数推荐待推荐信息。

具体的,根据发布时间、当前推荐时间得到时间分数,其中发布时间距离当前推荐时间越远得到的时间分数越小,可自定义时间分数的公式,在一个实施例中时间分数Time(x)=1440-minute(x)当minute(x)>1440时,Time(x)=0,minute(x)为当前推荐时间与待推荐信息发布时间的时间差,以分钟为单位。推荐分数Fin_score(x)=γ*match_score(x)+λ*time(x),其中match_score(x)为待推荐信息与用户的匹配分数,γ和λ为常数,且γ+λ=1。在计算时,可筛选出匹配分数高的待推荐信息计算最终的推荐分数,加快待推荐信息的推荐速度。最后根据推荐分数推荐待推荐信息,如将推荐分数大于预设阈值的待推荐信息推荐给用户,如将待推荐信息按照大小排序,推荐排在前面的待推荐信息。并根据推荐分数的大小设置推荐显示参数。一般信息的价值随着发布时间的推移减小,比如太长时间以前的信息可能信息内容已经过期了,不实用,最终的推荐分数考虑了时间,进一步加强了信息推荐的有效性。

在一个实施例中,如图9所示,提供了一种信息推荐的装置,包括:

用户兴趣标签获取模块310,用于获取用户的用户兴趣标签及各个用户兴趣标签的活跃度。

待推荐信息解析模块320,用于解析待推荐信息,得到待推荐信息对应的信息标签及各个信息标签的活跃度。

匹配分数计算模块330,用于根据信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度计算待推荐信息与用户的匹配分数。

推荐模块340,用于根据匹配分数推荐待推荐信息。

在一个实施例中,如图10所示,装置还包括:

用户的行为文本解析模块350,用于获取用户的行为数据对应的行为文本,解析行为文本,得到用户的用户兴趣标签及各个用户兴趣标签的活跃度。

在一个实施例中,如图11所示,用户的行为文本解析模块350包括:

第一分词单元351,用于对行为文本进行分词。

第一活跃度计算单元352,用于根据各个分词出现的频率计算各个分词的活 跃度。

第一筛选单元353,用于根据各个分词的活跃度筛选得到作为用户的用户兴趣标签的分词及其对应的活跃度。

在一个实施例中,如图12所示,待推荐信息解析模块320包括:

第二分词单元321,用于获取待推荐信息,对待推荐信息对应的信息文本进行分词。

第二活跃度计算单元322,用于根据各个分词出现的频率计算各个分词的活跃度。

第二筛选单元323,用于根据各个分词的活跃度筛选得到作为信息标签的分词及其对应的活跃度。

在一个实施例中,如图13所示,匹配分数计算模块330包括:

匹配处理单元331,用于判断信息标签与用户兴趣标签是否相同,如果相同,则为匹配,筛选出匹配的有效信息标签与有效用户兴趣标签。

计算单元332,用于根据匹配的有效信息标签的活跃度与有效用户兴趣标签的活跃度计算得到待推荐信息与用户的匹配分数。

在一个实施例中,如图14所示,推荐模块340包括:

时间获取单元341,用于获取待推荐信息的发布时间和当前推荐时间。

推荐单元342,用于根据发布时间、当前推荐时间和匹配分数得到推荐分数,根据推荐分数推荐待推荐信息。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述程序可存储于一计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对 上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1