一种电视节目的推荐方法与流程

文档序号:15925680发布日期:2018-11-14 01:07阅读:276来源:国知局

本发明属于推荐技术领域,具体属于一种电视节目的推荐方法。

背景技术

传统的推荐节目的方法,为获取用户所听节目的类型、所属专辑、所属歌手,并向用户推荐相应节目类型、节目所属专辑或所属歌手的节目,而当前音乐推荐方法大多基于协同过滤,该方法有以下不足之处在于,通过协同过滤算法实现的音乐推荐方法,无法及时的反映用户的偏好变化,且节目相关性更新较慢,节目相关性容易受噪声数据的影响。



技术实现要素:

本发明旨在解决以上现有技术的问题。提出了一种提高推荐准确度的电视节目的推荐方法。

本发明的技术方案如下:

一种电视节目的推荐方法,其包括以下步骤:

首先,接收用户输入的语言信息;根据所述语言信息,从已存储电子节目信息的电子节目表数据库中提取相关的电子节目信息;对所述提取的电子节目信息进行特征选取,得到特征元素,以所述特征元素为检索关键词对所述电子节目表数据库中的电子节目信息进行检索和评价处理,并根据所述处理的结果从所述电子节目表数据库中提取相关的电子节目信息,然后对根据所述语言信息提取的电子节目信息和根据所述特征元素提取的电子节目信息进行特征选取,得到新的特征元素,具体包括:当所述接收的语言信息为关键词集合时,对所述关键词集合进行逻辑计算后从所述电子节目表数据库中提取相关的电子节目信息;并从已存储语言知识的知识库中获取所述新的特征元素的关联信息,构建特征集合,具体包括:当所述接收的语言信息为短语或句子时,先进行分词处理,对分词结果进行计算得到用户喜好的空间模型,然后计算所述空间模型与所述电子节目表数据库中的电子节目信息的相似度,根据所述相似度提取相关的电子节目信息;利用所述特征集合和机器学习方法,构建统计模型;利用所述统计模型,对所述电子节目表数据库中的节目进行匹配;输出所述匹配的结果给用户;

再次,用户发送节目请求信息,获取用户对节目的评分信息,得到用户—节目评分矩阵,为每个用户和每个节目构建历史评分记录集合,同时构建用户集合,按照用户的评分节目从大到小对节目集合中的节目排序;按节目在用户集合中的顺序,选取一个评分最高的节目作为目标节目;根据用户—节目评分矩阵,计算其余节目与目标节目的相似度;选取与目标节目相似度大于第一设定值的节目构建目标节目的优先节目集;计算目标节目与各优先节目的历史共同评分差均值,若两个用户历史本身没有共同节目,则不做计算;选取共同评分差均值小于第二设定值的节目构造最终的相似节目集,利用目标节目的相似节目集对用户—节目评分矩阵进行填充;对用户—节目评分矩阵中剩下的未填充数据,同样采用相似度阈值法和共同评分差均值来选取最相似节目,并利用相似节目来对用户—节目评分矩阵进行再次填充,进行节目的初步推荐;若和匹配结果有一半一样则按此推荐,若不一样则选取评分第二高的节目作为目标节目,重复以上步骤进行填充,直到超过一半相同则推荐节目单给用户。

进一步的,所述构建目标节目的优先节目集过程如下:

按用户在用户集合中的顺序,选取一个评分最高的节目作为目标节目;利用用户—网上节目评分矩阵,通过pearson皮尔逊相关系数公式来计算其余节目与目标节目的相似度;

其中,simu,v表示节目u和节目v的相似度,iu,v为节目u和节目v的共同评分商家集合,rui、rvi分别为节目u、节目v对商家i的评分,分别为节目u、节目v的平均评分;选取与目标节目相似度大于α的节目构建目标节目的优选邻居节目集p_n(u)。

进一步的,所述最相似节目的选取过程如下:

计算目标节目与各优先节目的历史共同评分差均值,计算公式如下:

其中,avg(u,v)为节目u和节目v的历史共同评分差均值,iu′,v为目标节目u和节目v的历史共同评分新闻播报端集合,rui、rvi分别为节目u、节目v对节目i的评分;选取共同评分差均值小于β的优先节目构造最终的最相似节目n(u)。

进一步的,所述根据节目来源的权重以及节目是否完整播放,计算所述节目播放日志中每首节目的当日评分步骤,包括:通过公式:snow=listen*weight,计算所述节目播放日志中每首节目的当日评分,其中,snow为节目当日的评分,weight为节目来源的权重,listen表示节目是否完整播放,当所述节目的播放时间不小于所述节目真实时长的85%时,认为所述节目完整播放,赋予数值1,当所述节目的播放时间小于所述节目真实时长的85%时,认为这首歌没有完整播放,赋予数值0;完整播放则为1,没有完整播放为0。

本发明的有益效果

本发明一方面根据用户输入的语言信息,从电子节目表数据库中提取相关的电子节目信息,并进行特征选取得到特征元素,以及调用知识库中存储的信息对特征元素进行扩充得到用户兴趣爱好空间的特征集合,用该特征集合和机器学习的方法构建统计模型,以此匹配电子节目表数据库输出匹配结果给用户,实现了节目推荐,解决了现有技术的“冷启动”问题,而且提高了节目推荐的精度、性能和实用性。由于上述方法是在用户端执行的,不涉及在网络侧服务器端或用户端采集用户个人信息,因此,可以充分保障用户的隐私情报不泄漏,提高了保密性。另外,还可以以特征元素为检索关键词对电子节目表数据库进行检索和评价处理,然后根据处理结果再次进行节目预选,从而可以进一步扩大用户兴趣爱好空间,提高节目推荐的精度。另一方面,加入了历史共同评分差均值来筛选邻居,去掉了与目标项评分差异较大的邻居,使相似邻居集的选取更加准确,有效避免了把一个用户讨厌的节目当成另一个用户喜欢的节目来进行推荐,使推荐更加准确。本发明先从用户的角度做第一步填充,再从节目本身的角度做第二步填充,使稀疏的用户—节目评分矩阵的填充更加完整。同时每一步填充都采用动态填充方式,按评分个数的大小来依次选取目标节目进行填充,每一次做填充的矩阵都是对上一个目标填充完成后的矩阵。动态填充使节目的共同评分数增多,相似度计算更加准确,因此对稀疏的用户—节目评分矩阵的填充也更加准确,最后给出的推荐列表更加符合用户的心意,提高了用户对推荐系统的粘性,并且当两者评判结果不一样时,则再次选取评分值第二高的节目作为目标节目,重复以上步骤进行填充,得到推荐节目,这样就避免了评分最高节目的局限性,推荐第二高的节目,使得推荐更加人性化。

附图说明

图1是本发明提供优选实施例基于混合推荐算法的节目推荐方法流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。

本发明解决上述技术问题的技术方案是:

如图1所示为一种电视节目的推荐方法,其包括以下步骤:

首先,接收用户输入的语言信息;根据所述语言信息,从已存储电子节目信息的电子节目表数据库中提取相关的电子节目信息;对所述提取的电子节目信息进行特征选取,得到特征元素,以所述特征元素为检索关键词对所述电子节目表数据库中的电子节目信息进行检索和评价处理,并根据所述处理的结果从所述电子节目表数据库中提取相关的电子节目信息,然后对根据所述语言信息提取的电子节目信息和根据所述特征元素提取的电子节目信息进行特征选取,得到新的特征元素,具体包括:当所述接收的语言信息为关键词集合时,对所述关键词集合进行逻辑计算后从所述电子节目表数据库中提取相关的电子节目信息;并从已存储语言知识的知识库中获取所述新的特征元素的关联信息,构建特征集合,具体包括:当所述接收的语言信息为短语或句子时,先进行分词处理,对分词结果进行计算得到用户喜好的空间模型,然后计算所述空间模型与所述电子节目表数据库中的电子节目信息的相似度,根据所述相似度提取相关的电子节目信息;利用所述特征集合和机器学习方法,构建统计模型;利用所述统计模型,对所述电子节目表数据库中的节目进行匹配;输出所述匹配的结果给用户;

再次,用户发送节目请求信息,获取用户对节目的评分信息,得到用户—节目评分矩阵,为每个用户和每个节目构建历史评分记录集合,同时构建用户集合,按照用户的评分节目从大到小对节目集合中的节目排序;按节目在用户集合中的顺序,选取一个评分最高的节目作为目标节目;根据用户—节目评分矩阵,计算其余节目与目标节目的相似度;选取与目标节目相似度大于第一设定值的节目构建目标节目的优先节目集;计算目标节目与各优先节目的历史共同评分差均值,若两个用户历史本身没有共同节目,则不做计算;选取共同评分差均值小于第二设定值的节目构造最终的相似节目集,利用目标节目的相似节目集对用户—节目评分矩阵进行填充;对用户—节目评分矩阵中剩下的未填充数据,同样采用相似度阈值法和共同评分差均值来选取最相似节目,并利用相似节目来对用户—节目评分矩阵进行再次填充,进行节目的初步推荐;若和匹配结果有一半一样则按此推荐,若不一样则选取评分第二高的节目作为目标节目,重复以上步骤进行填充,直到超过一半相同则推荐节目单给用户。

优选的,所述构建目标节目的优先节目集过程如下:

按用户在用户集合中的顺序,选取一个评分最高的节目作为目标节目;利用用户—网上节目评分矩阵,通过pearson皮尔逊相关系数公式来计算其余节目与目标节目的相似度;

其中,simu,v表示节目u和节目v的相似度,iu,v为节目u和节目v的共同评分商家集合,rui、rvi分别为节目u、节目v对商家i的评分,分别为节目u、节目v的平均评分;选取与目标节目相似度大于α的节目构建目标节目的优选邻居节目集p_n(u)。

优选的,所述最相似节目的选取过程如下:

计算目标节目与各优先节目的历史共同评分差均值,计算公式如下:

其中,avg(u,v)为节目u和节目v的历史共同评分差均值,iu′,v为目标节目u和节目v的历史共同评分新闻播报端集合,rui、rvi分别为节目u、节目v对节目i的评分;选取共同评分差均值小于β的优先节目构造最终的最相似节目n(u)。

优选的,所述根据节目来源的权重以及节目是否完整播放,计算所述节目播放日志中每首节目的当日评分步骤,包括:通过公式:snow=listen*weight,计算所述节目播放日志中每首节目的当日评分,其中,snow为节目当日的评分,weight为节目来源的权重,listen表示节目是否完整播放,当所述节目的播放时间不小于所述节目真实时长的85%时,认为所述节目完整播放,赋予数值1,当所述节目的播放时间小于所述节目真实时长的85%时,认为这首歌没有完整播放,赋予数值0;完整播放则为1,没有完整播放为0。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1