一种节目单制定系统及方法

文档序号:8286227阅读:353来源:国知局
一种节目单制定系统及方法
【技术领域】
[0001] 本发明涉及广播电视领域,更为具体地,涉及一种节目单制定系统及方法。
【背景技术】
[0002] 随着广播电视行业的发展以及电视资源的不断丰富,用户在收视过程中形成了不 同的节目类型偏好。通过对用户收视行为进行分析,对收视用户进行分群,找到具有相同收 视习惯的用户群体,即广播电视社区,成为了广电行业研宄焦点。
[0003] 传统的电视节目分类是具有包含关系的树状结构,如图1所示,一个电视节目只 能被分类到分类体系中的一种节目类型,过于注重节目所属类别,忽视了电视节目具有的 多重特点,未能多维地体现节目内容。基于传统的电视节目分类体系,对用户进行用户分群 分析,并不能得到很好的效果。
[0004] 现有的广播电视用户分群方法中通常采用聚类分析。聚类分析就是把对象按照 性质上的亲疏程度分成多个类或簇,使得类或簇内的数据相似度最大化,类或簇间的数据 相似度最小化。最直接的节目收视数据难以计算用户距离,因此无法直接进行聚类挖掘。 现有的广播电视领域中的聚类技术,以节目作为用户的属性供聚类算法中的距离计算,但 当节目数量增加时,计算中的维度也增加,当对大量节目收视记录聚类时,出现聚类维度过 高的问题。另外,现有广播电视用户分群方法通常采用单一的节目的收视指标作为用户的 属性供聚类算法中的距离计算,例如采用收视率、收视时长或者收视次数作为用户的属性, 收视率是通过计算总体收视观众的宏观收视情况计算得到的收视指标,不能体现用户的个 性化偏好,若使用收视率向用户推送节目单,推送节目会被少数几个收视率较高的节目占 据,同时也无法针对用户的偏好进行推送;若以收视时长作为指标来确定用户的偏好,播出 时间长的节目会比播出时间短的节目拥有更长的收视时长,推送结果将偏向播出时间更长 的节目;若是以收视次数作为指标来确定用户的偏好,以收视频率低但出现次数多的节目 (例如广告)的用户偏好要高于出现次数少但收视频率高的节目。总之,采用单一的节目的 收视指标利用聚类分析来对广播电视用户分群准确性低,不能全面准确的确定用户的收视 偏好。

【发明内容】

[0005] 鉴于上述问题,本发明的目的是提供一种计算量小、数据反馈充足且准确对广播 电视用户分群的方法。
[0006] 根据本发明的一个方面,提供一种节目单制定系统,包括:节目标签采集单元,用 于从存储节目信息的数据库或者网站上采集节目名称及其节目标签,其中,节目标签是对 电视节目内容的多角度概括;节目标签数据库,接收节目标签采集单元采集的节目标签并 按照节目名称对其进行汇总存储为节目标签数据集合,即节目标签数据源,并接收下述输 入单元的调用指令导出调用指令中的节目标签数据源;节目播放收视数据库,将各节目的 播放信息和通过用户机顶盒的收视信号采集的用户对各节目的收看信息存储为播放收视 数据集合,即播放收视数据源,并接收下述输入单元的调用指令导出调用指令中的播放收 视数据源;输入单元,用于输入确定广播电视用户收视偏好所需的至少一个节目名称、空间 区域、时间区域并生成所述节目名称的节目标签数据源和上述空间区域和时间区域内所述 节目名称的播放收视数据源的调用指令;收视空间构造单元,接收节目标签数据库调出的 节目标签数据源和节目播放收视数据库调出的播放收视数据源构造基于节目标签兴趣度 的收视空间,其中,节目标签兴趣度是用户对节目标签的偏好程度,将用户对包含节目标签 的每一个节目的收视时长与总播出时长的比值乘以收视天数与时间区域天数的比值,并将 上述结果求和;
[0007] 广播电视用户划分单元,将上述收视空间中广播电视用户按照对不同标签的兴趣 度进行分群,得到各节目标签的广播电视社区;节目单制定单元,制定符合上述各广播电视 社区对节目标签的偏好的电子节目单;节目单发送单元,将符合各个广播电视社区节目标 签偏好的节目单发送给用户。
[0008] 根据本发明的另一个方面,提供一种节目单制定方法,包括:通过节目标签采集单 元采集节目名称及其节目标签,并按照节目名称对其进行汇总和存储;通过输入单元输入 确定用户偏好所需的至少一个节目名称、空间区域、时间区域并生成上述空间区域和时间 区域内所述节目名称的节目标签数据源和播放收视数据源的调用指令;根据输入单元的调 用指令分别从节目标签数据库和节目播放收视数据库导出符合调用指令的节目标签数据 源和播放收视数据源,并导入到收视空间构造单元;利用上述数据源构造基于节目标签兴 趣度的收视空间;对上述收视空间内用户对各节目的节目标签的节目标签兴趣度进行分群 形成各节目标签的广播电视社区;制定符合各广播电视社区的节目标签兴趣度的节目单; 将上述节目单发送给各社区的用户。
[0009] 本发明所述节目单制定系统及方法通过建立基于节目标签兴趣度的收视空间,将 用户-节目的二元关系提升为用户-节目标签的二元关系,有效地压缩了大量的节目,降低 聚类分析空间中的距离维度,减少了计算消耗,以更贴近节目内容的节目标签的兴趣度对 用户收视偏好进行划分,包括了含有节目标签的所有节目,能够准确全面的确定用户的收 视偏好。
【附图说明】
[0010] 通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面 理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
[0011] 图1是现有技术电视节目树状分类结构的构成示意图;
[0012] 图2是本发明节目单制定系统的构成框图;
[0013] 图3是本发明节目标签的示意图;
[0014] 图4是本发明节目单制定方法的流程图;
[0015] 图5是本发明基于节目标签兴趣度收视空间构造方法的流程图;
[0016] 图6是本发明基于节目标签兴趣度收视空间内广播电视用户分群方法的流程图;
[0017] 图7是本发明利用层次聚类确定广播电视用户分群个数的方法的流程图;
[0018] 图8是本发明层聚类树状图的示意图
[0019] 图9是本发明利用K-means方法对广播电视用户按照节目标签兴趣度对广播电视 用户分群的方法的流程图。
[0020] 在所有附图中相同的标号指示相似或相应的特征或功能。
【具体实施方式】
[0021] 在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐 述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。 以下将结合附图对本发明的具体实施例进行详细描述。
[0022] 以下将结合附图对本发明的具体实施例进行详细描述。
[0023] 图2是本发明节目单制定系统的构成框图,如图2所示,本发明所述标签装置包 括:
[0024] 节目标签采集单元100,用于从存储节目信息的数据库或者网站上采集节目名称 及其节目标签,其中,节目标签是对电视节目内容的多角度概括,每一个节目标签体现电视 节目一个方面的特性,如图3所示,节目标签包括节目类型标签、年代标签、参加人员标签 等,其中节目类型标签可以是新闻类、电视剧类、动漫类等;年代标签可以是古代、现代、抗 日年代等;参加人员标签可以是演员、导演、编剧等;
[0025] 节目标签数据库110,接收节目标签采集单元100采集的节目标签并按照节目名 称对其进行汇总存储为节目标签数据集合,即节目标签数据源,并接下述收输入单元120 的调用指令导出调用指令中的节目标签数据源,其中,以单个节目为例说明汇总存储的节 目标签,图3示出了以节目名称为中心的扁平化节目标签数据库;
[0026] 节目播放收视数据库130,将各节目的播放信息和通过用户机顶盒的收视信号采 集的用户对各节目的收看信息存储为播放收视数据集合,即播放收视数据源,并接下述收 输入单元120的调用指令导出调用指令中的播放收视数据源;
[0027] 输入单元120,用于输入确定广播电视用户收视偏好所需的至少一个节目名称、空 间区域、时间区域并生成所述节目名称的节目标签数据源和上述空间区域和时间区域内所 述节目名称的播放收视数据源的调用指令,例如,输入单元输入的节目名称为"新闻联播"、 空间区域为"北京市"、时间区域为"2013年-2014年",则生成调用指令中的节目标签数据 源为"新闻联播"的节目标签数据集合,调用指令中的播放收视数据源是北京市广播电视用 户2013年至2014年对"新闻联播"的播放收视数据集合,输入单元120可以是触摸屏、键 盘、手写板、鼠标等具有书写或者确定功能的装置;
[0028] 收视空间构造单元140,接收节目标签数据库110调出的节目标签数据源和节目 播放收视数据库130调出的播放收视数据源构造基于节目标签兴趣度的收视空间,其中, 其中,节目标签兴趣度是用户对节目标签的偏好程度,将用户对包含节目标签的每一个节 目的收视时长与总播出时长的比值乘以收视天数与时间区域天数的比值,并将上述结果求 和;
[0029] 广播电视用户划分单元15
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1