一种基于改进型关联规则的直播间推荐方法及系统与流程

文档序号:12498564阅读:469来源:国知局
一种基于改进型关联规则的直播间推荐方法及系统与流程

本发明涉及互联网视频的直播推荐技术领域,具体来讲是一种基于改进型关联规则的直播间推荐方法及系统。



背景技术:

随着智能终端的多屏化发展,人们对“即时”与“互动”的需求越来越高。中国社交视频的直播社区的活跃用户正在不断发展壮大中。巨大的市场同时也面临着激烈的同行竞争,如何发掘用户兴趣点、给用户精准推荐直播间来提高用户粘性、促进用户的付费转化,将是直播行业很长一段时间将要面临的一道难题。

目前,各大网站在进行直播间的推荐时,普遍采用的是一种热播榜TOPN的推荐方式,也就是推荐直播网站里一段时间内最火的N位主播。这种方法的缺点是没有考虑到观众的个性化需求,TOPN对新用户往往是有效的,而对于老观众而言,他们开始有自己的偏好来挑选直播间,TOPN对其可能就没多大吸引力了。

为了解决上述问题,现有技术中提出了一种基于关联规则的直播间推荐方式。该方式是通过筛选在用户的观看历史记录中,频繁同时出现的直播间,将其作为关联直播间进行推荐。例如,用户A看了直播间M、N、O、P;用户B看了直播间M、N、O;用户C看了M、N直播间。不难发现,在A,B,C用户中,都观看了M,N直播间,如果M和N在用户观看数据中频繁的一起出现,那么对于观看了M直播间的用户,可以给他推荐N直播间,即房间N与房间M相关联,M=>N。

关联规则在直播推荐场景的定义为:假设集合I={I1,I2,···,In}是用户(用户ID)对某一个有观看的直播间(直播间ID)的键值对(用户ID:直播间ID)的集合。给定一个用户观看直播间记录的数据库D,D中每个事务(事务即用户观看直播间的记录,例如用户A看了n,m,k三个直播间,即事务(n,m,k)是I的非空子集)。另外,关联规则在D中的支持度(support)表示D中事务同时包含X、Y的概率;而置信度(confidence)表示D中事务在已经包含X的情况下,包含Y的百分比,即条件概率。例如:X、Y同时被观看即(X,Y)事务发生了100次,这样的情况下(X,Y,Z)发生了50次,那么,(X,Y,Z)的置信度就是50/100=0.5。

现有的关联规则推荐方式中,基础算法多采用Apriori算法,在该算法中,一旦认为满足最小支持度阈值和最小置信度阈值,则认为该关联规则是效的。但是,实际操作中,Apriori算法难免会出现生成无效的规则的情况。例如,在直播间推荐场景中,A、B直播间很火,现在有1000条用户观看直播记录,其中有750个用户观看了A直播间,600个用户观看了B直播间,其中有400用户同时观看了A、B直播间。假设现在支持度阈值定为0.3,置信度为0.5,显然在Apriori算法中,规则A=>B被认为是一条有效规则。但是这里面存在一个问题:用户看A直播间的概率为750/1000=0.75,看B直播间的概率为600/1000=0.6,看了A还会看B的概率P(A=>B)=(400/1000)/0.75=0.53。显然单独观看B的概率为0.6,在看了A的情况下再看B的概率只有0.53,比单独看B的概率还要低,这样看来规则A=>B并不是一个有效规则。

因此,为了避免生成无效的关联规则,提高直播间推荐的有效性和可靠性,本领域技术人员亟需对传统的关联规则做出改进,提出一种更好的基于关联规则的直播间推荐方案。



技术实现要素:

本发明的目的是为了克服上述背景技术的不足,提供一种基于改进型关联规则的直播间推荐方法及系统,不但能考虑到用户个性化的需求,利用关联规则挖掘出隐藏在用户行为中的隐蔽特征;而且能避免生成无效的规则,提高了推荐的有效性、可靠性,用户体验佳。

为达到以上目的,本发明提供一种基于改进型关联规则的直播间推荐方法,包括以下步骤:

A、获取指定时间段内所有用户的观看历史信息;

B、设定最小支持度阈值和置信度阈值;

C、以所述观看历史信息为基础,按照Apriori算法生成若干满足最小支持度阈值和置信度阈值的关联规则;将生成的若干关联规则中观看相关度<1的关联规则删除,筛选出所有有效规则;

D、当用户进入直播网站时,以当前的所有有效规则为依据,向用户推荐直播间。

本发明同时还提供一种基于改进型关联规则的直播间推荐系统,该系统包括观看历史信息获取模块、阈值设置模块、有效规则生成模块和直播间推荐模块。所述观看历史信息获取模块用于:获取指定时间段内所有用户的观看历史信息;所述阈值设置模块用于:设定最小支持度阈值和置信度阈值;所述有效规则生成模块用于:以所述观看历史信息为基础,按照Apriori算法生成若干满足最小支持度阈值和置信度阈值的关联规则,将生成的若干关联规则中观看相关度<1的关联规则删除,筛选出所有有效规则;所述直播间推荐模块用于:当用户进入直播网站时,以当前的所有有效规则为依据,向用户推荐直播间。

本发明的有益效果在于:

(1)与现有的热播榜TOPN的推荐方式相比,本发明能考虑到用户个性化的需求,利用关联规则挖掘出隐藏在用户行为中的隐蔽特征(例如:看了A、B直播间,就有很大可能会看C直播间的房间关联性特征),通过该隐蔽特征从而为用户推荐符合其观看习惯及个人喜好的直播间,满足了用户的个性化需求,用户体验佳。

(2)本发明相较于传统的关联规则做出了改进,在原有的Apriori算法基础上,增加了观看相关度的判断,从而有效避免生成无效的关联规则,进而提高了直播间推荐的有效性、可靠性。并且,随着行为数据越丰富,该效果越明显,房间推荐质量高。

附图说明

图1为本发明实施例中基于改进型关联规则的直播间推荐方法的流程图;

图2为本发明实施例中基于改进型关联规则的直播间推荐系统的结构框图。

具体实施方式

下面结合附图及具体实施例对本发明作进一步的详细描述。

参见图1所示,本发明实施例提供一种基于改进型关联规则的直播间推荐方法,包括以下步骤:

步骤S1、获取观看历史信息:获取指定时间段内所有用户的观看历史信息,该观看历史信息包括用户唯一标识UID以及该用户对应的观看过的直播间唯一标识ROOM_ID。

可以理解的是,实际操作时,所述指定时间段可根据实际需要进行自行设置。本实施例中,获取的是近一个月内的所有用户的观看历史信息。

步骤S2、信息清理及阈值设置:将所述观看历史信息中UID或ROOM_ID为空的数据删除;并设定最小支持度阈值和置信度阈值。

可以理解的是,实际操作时,该最小支持度阈值和置信度阈值可根据实际需要进行自行设置。一般来说,最小支持度阈值可设置为0.01~0.5范围内;置信度阈值可设置为0.5~1范围内。本实施例中,优选最小支持度阈值为0.01;置信度阈值为0.5。

步骤S3、关联规则的生成:以N为2阶开始,从当前的观看历史信息中挑选出N-1个观看过的且满足最小支持度阈值的直播间,记为(room_id1,room_id2,···,room_idN-1),即生成频繁N项集;以挑选出的直播间为基础,按照Apriori算法生成若干满足置信度阈值的关联规则,记为(room_id1,room_id2,···room_idN-1)=>room_idM,其中room_idM为推荐的直播间,即为关联的直播间。

步骤S4、有效规则的筛选:将生成的若干关联规则中观看相关度<1的关联规则删除,并将筛选出的关联规则作为有效规则。

其中,观看相关度是指A条件下B发生的概率是否大于B单独发生的概率。若观看相关度>1,表示A条件下B发生的概率大于B单独发生的概率;若观看相关度<1,表示A条件下B发生的概率小于B单独发生的概率。本发明为了避免传统Apriori算法中会产生无效规则的问题,在原有Apriori算法基础上,加了一层观看相关度的判断:即要求若要关联规则A=>B有效,则需要该关联规则在满足最小支持度阈值和最小置信度阈值的前提下,还需要满足P(AB)/P(A)>P(B):也就是A条件B发生的概率要大于B单独发生的概率,即观看相关度>1。因此,在步骤S4中,需要对观看相关度<1的关联规则进行删除。实际操作中,观看相关度的计算公式为:rel=P(AB)/P(A)/P(B),其中,rel为观看相关度,P(AB)为A、B同时发生的概率(在直播间推荐场景中,即为观看了A直播间又观看B直播间的概率),P(A)为A发生的概率(在直播间推荐场景中,即为单独观看A直播间的概率),P(B)为B发生的概率(在直播间推荐场景中,即为单独观看B直播间的概率)。

步骤S5、高阶规则的生成:重复步骤S3~S4,依次生成更高一阶(即N++)的有效规则,直到没有新的有效规则产生为止。

步骤S6、直播间的推荐:当用户进入直播网站时,以当前生成的所有有效规则为依据,向用户推荐直播间。例如:根据有效规则(room_id1,room_id2)=>room_id3,则可为观看过room_id1直播间和room_id2直播间的用户推荐room_id3的直播间。

可以理解的是,为了更加高效、高质地向用户推荐直播间,本实施例中在向用户进行直播间推荐时,是以当前生成的所有有效规则为依据,按照优先推荐置信度高的直播间的原则,向用户推荐直播间的。

参见图2所示,本发明实施例还提供一种基于改进型关联规则的直播间推荐系统。该系统包括观看历史信息获取模块、阈值设置模块、有效规则生成模块和直播间推荐模块。

其中,观看历史信息获取模块用于:获取指定时间段内所有用户的观看历史信息,所述观看历史信息包括用户唯一标识以及该用户对应的观看过的直播间唯一标识。阈值设置模块用于:设定最小支持度阈值和置信度阈值。有效规则生成模块用于:以所述观看历史信息为基础,按照Apriori算法生成若干满足最小支持度阈值和置信度阈值的关联规则;将生成的若干关联规则中观看相关度<1的关联规则删除,筛选出所有有效规则。直播间推荐模块用于:当用户进入直播网站时,以当前的所有有效规则为依据,按照优先推荐置信度高的直播间的原则,向用户推荐直播间。

进一步地,参见图2所示,该系统还包括信息清理模块,所述信息清理模块用于将所述观看历史信息中用户唯一标识或直播间唯一标识为空的数据删除。

更进一步地,所述有效规则生成模块生成有效规则的具体过程为:以N为2阶开始,从当前的观看历史信息中挑选出N-1个观看过的且满足最小支持度阈值的直播间;以挑选出的直播间为基础,按照Apriori算法生成若干满足置信度阈值的关联规则;将生成的若干关联规则中观看相关度<1的关联规则删除,并将筛选出的关联规则作为有效规则;重复上述操作,依次生成更高一阶的有效规则,直到没有新的有效规则产生为止。

需要说明的是:上述实施例提供的系统在进行操作时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。

本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。

本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1