一种基于用户操作日志的epg校准系统及方法

文档序号:7758981阅读:111来源:国知局
专利名称:一种基于用户操作日志的epg校准系统及方法
技术领域
本发明涉及数字电视EPG,尤其是涉及一种基于用户操作日志的EPG校准系统及 方法。
背景技术
现在通常都使用EPG (Electronic Program Guide,电子节目菜单)来为数字电视 提供各种业务的索引和导航,用户利用EPG提供的菜单可以选择自己喜欢的频道,点播自 己喜欢的节目,查找各种信息等,在数字电视中起着非常重要的作用。在电视节目回看系统 中,EPG包含了各个频道过去一段时间(例如一周)内的节目信息,这些节目(例如电视剧, 电影,专题,综艺节目等)是通过EPG的形式表现出来给用户挑选观看的。机顶盒从EPG信 息中可以获取到节目名称、节目起始时间、节目结束时间,当用户选择某个频道的回看节目 进行观看时,机顶盒会发送信令给前端服务器,服务器根据EPG设定的起始结束时间播发 流给机顶盒。因此如果EPG给出的节目起始时间有偏差,那么用户最终得到的节目也会有 偏差。但是,现有的IPTV系统中,电视节目回看中的EPG时间信息往往是不准确的,这使 得用户在点播节目的时候无法定位到正确的节目起始时间,因而无法找到点播的节目。而 为了找到点播的节目,不得不通过手工操作来定位到正确的节目时间,不但浪费人力物力, 并且也增加了由于误操作而出错的可能性。因此,如何开发设计一种可确定正确的EPG时间信息的系统和方法,已成为目前 急需解决的技术难题之一。

发明内容
本发明为解决现有技术无法正确定位到节目起始时间的技术问题,提供了一种基 于用户操作日志的EPG校准系统及方法。为解决上述技术问题,本发明采用的技术方案为设计一种基于用户操作日志的 EPG校准系统,包括机顶盒、流媒体服务器,所述流媒体服务器设置有一日志数据库和一日 志聚类分析引擎,所述日志数据库用于记录和存储用户通过机顶盒向流媒体服务器点播节 目的操作日志;所述的日志聚类分析引擎用于对用户在点播回看节目时候产生的日志进行 聚类分析,判断出正确的节目起始时间并记录下来供后继用户使用。所述的操作日志包括用户ID、频道名称、节目名称、用户操作类型和操作时的媒体 流时间。所述的媒体流时间包括播放时间、快进时间、快退时间、和停止时间。所述的聚类分析包括对媒体流数据进行预处理,清除不能用来作为聚类分析数据 源的用户操作日志,和对上一次点播的操作行为记录进行聚类分析,得到准确的播放时间 点,该时间点作为节目起始的参考值。本发明还提供了一种基于用户操作日志的EPG校准方法,包括下列步骤
步骤1、将用户点播回放节目的操作日志记录存储在日志数据库中;步骤2、日志聚类分析引擎对操作日志数据库记录的操作数据进行预处理,清除噪 音数据;步骤3、日志聚类分析引擎对预处理后的数据进行聚类分析,得到节目开始正常播 放的时间参考值;步骤4、将上述参考值作为节目的起始时间写入到EPG中,供后继的用户使用。所述步骤1中的操作日志包括用户ID、频道名称、节目名称、用户操作类型和操作 时的媒体流时间。所述的媒体流时间包括播放时间、快进时间、快退时间、和停止时间。所述的聚类分析选用DBSCAN算法,聚类的对象就是节目开始正常播放的时间参考值。本发明基于用户行为聚类分析的EPG校准系统及方法通过分析用户操作时产生 的操作日志,并对操作日志进行聚类分析后得到节目的真正起始时间,并写入EPG中,供后 续用户使用,使后续用户在回看节目时能准确定位到节目起始时间,相比现有技术具有突 出的优点。


下面结合实施例和附图对本发明进行详细说明,其中图1是本发明EPG校准系统逻辑图;图2是本发明EPG校准方法流程图。
具体实施例方式本发明提出的一种基于用户行为聚类分析的EPG校准系统及方法,是通过对用户 在点播回看节目时候产生的日志进行聚类分析,判断出正确的节目起止时间并记录下来给 后继用户使用。其是在分析用户行为日志的基础上实现的,对普通用户来说,当用户点播了 一个节目但是却没有收到正确的开始时,他会尝试对当前的媒体流进行快进快退行为,当 快进快退到满意的位置时他会停下来开始观看。这个满意的位置有可能是片头,也有可能 是跳过了片头的内容起始。因此,记录机顶盒在流媒体服务器点播节目的操作日志并保存 在日志数据库中,通过对日志数据库中的操作日志并进行聚类分析,就可获得节目的起始 时间,然后再将聚类分析获得节目的起始时间写入EPG中,即可供后续用户使用,以准确定 位到需要的节目。请参阅图1。本发明基于用户行为聚类分析的EPG校准系统包括机顶盒、流媒体服 务器和日志聚类分析引擎。其中机顶盒从EPG信息中获取节目名称、节目起始时间、节目结束时间,当用户选择某 个频道的节目进行观看时,机顶盒发送信令给前端的流媒体服务器,流媒体服务器根据EPG 设定的起始结束时间播发节目流给机顶盒。流媒体服务器包括一日志记录数据库和日志聚类分析引擎。日志数据库记录用户 点播回看节目的整个过程中的操作行为,包括点播,快进,快退,停止等,并且产生操作日志 存储在日志数据库中。在本具体实施例中,操作日志的形式为(user,channel, program, operation, time)的五元组,其中,user表示用户ID, channel表示频道名称,program表示节目名称,operation表示操作类型,如快进、播放等,time表示用户操作时的媒体流时 间。例如一个用户操作日志可能为(userl,CCTV1,16,play,10:30:26)。其中用户id是 userl,频道名称是CCTV1,点播的节目的id是16,用户操作是play,操作时的媒体流时间 是10:30:26,值得注意的是,五元组中的time代表的是用户操作时的媒体流时间,也就是 当前回看节目中的时间。日志聚类分析引擎用于对用户在点播回看节目时候产生的操作日志进行聚类分 析,判断出正确的节目起始时间并记录下来供后继用户使用。日志聚类分析引擎先对日志 数据进行预处理,删除噪音数据,然后再对预处理后的数据进行聚类分析。其原理如下1、数据预处理数据预处理的目的是清除噪音数据,所谓噪音数据是指不能用来作为聚类分析数 据源的用户操作日志,在回看系统中多体现为用户随意性的操作行为,包括用户随意浏览 并离开,用户误点击之后马上离开等,这类行为的特点是正常观看时间与节目的时长不成 正比,操作频繁大于正常观看。日志聚类分析引擎是根据设定的时间对数据库的操作日志信息进行聚类分析,它 对操作日志的五元组(user,channel, program, operation, time)进行分析,将用户随意性 的行为日志删除掉。对此可以通过设定阈值进行淘汰,对于节目正常观看时间(即没有操 作的这段时间)占用户浏览本节目跨度时间(即用户从观看节目到退出节目的媒体流时间 跨度)的比例小于一定程度,则认为是非正常用户。2、对预处理后的数据进行聚类分析描述用户操作的原语有play (播放)、fast forward(快进)、back forward(快 退)、teardown(停止)等。举例来说,对于时间范围是10:30:26-10:56:10的节目《科技 之光》,某个用户可能产生如下的操作日志Dplay 10:30:262) fast forward 10:30:393)back forward 10:34:554)play 10:33:02从用户的操作日志可以看到1)用户首先从EPG中点播了《科技之光》,因此这时 候play所带的时间参数与EPG相同;2)用户发现播出的节目不是《科技之光》,而是广告, 因此他选择快进,快进操作是在回看节目播放到了 10:30:39的时候发出的;3)用户发现已 经快进远远超过节目起始了,因此他选择快退,快退操作时在回看节目播放到了 10 34 55 的时候发出的;4)用户最终快退到了满意的时间,这时候正常播放开始,时间是10:33:02。以上是一个正常用户在点播到不准确EPG时候的操作行为记录,对操作日志的正 常播放时间,也即操作日志中的4)的时间点进行密度聚类分析,可以得到几个簇,选择最 大的簇,其平均值可以作为节目起始的参考值。最后将聚类的结果,也即节目起始时间写入数据库,以供后继的用户观看使用,从 而提升用户的满意度。聚类所使用的数据是(user,channel, program, "play", time)的五元组,密度聚 类分析采用基本的DBSCAN算法,聚类所得到的簇是time的簇,是一维的。当存在多个簇的 情况下,可能会这样的情况某些用户定位到节目片头开始就停下来观看;另外一些用户则会跳过节目片头,直接观看节目内容。因此这时候可以同时选用较大的两个簇。需要特 别注意的是,聚类最后使用的操作日志使用的操作类型仅仅为播放,而不包括其它操作类 型如快进、快退等。请参见图2,本发明基于用户操作行为的EPG校准方法包括下列步骤步骤1、将用户点播回放节目的操作日志记录存储在日志数据库中。操作日志包括 用户ID、频道名称、节目名称、用户操作类型和操作时的媒体流时间。所述的媒体流时间包 括播放时间、快进时间、快退时间、和停止时间。步骤2、日志聚类分析引擎对操作日志数据库记录的操作数据进行预处理,清除噪 音数据;步骤3、日志聚类分析引擎对预处理后的数据进行聚类分析,得到节目开始正常播 放的时间参考值。所述的聚类分析选用DBSCAN算法,聚类的对象就是节目开始正常播放的 时间参考值。步骤4、将上述参考值作为节目的起始时间写入到EPG中,供后继的用户使用。
权利要求
一种基于用户操作日志的EPG校准系统,包括机顶盒、流媒体服务器,其特征在于所述流媒体服务器设置有一日志数据库和一日志聚类分析引擎,所述日志数据库用于记录和存储用户通过机顶盒向流媒体服务器点播节目的操作日志;所述的日志聚类分析引擎用于对用户在点播回看节目时候产生的操作日志进行聚类分析,判断出正确的节目起始时间并记录下来供后继用户使用。
2.根据权利要求1所述的EPG校准系统,其特征在于所述的操作日志包括用户ID、频 道名称、节目名称、用户操作类型和操作时的媒体流时间。
3.根据权利要求1所述的EPG校准系统,其特征在于所述的媒体流时间包括播放时 间、快进时间、快退时间、和停止时间。
4.根据权利要求1所述的EPG校准系统,其特征在于所述的聚类分析包括对媒体流 数据进行预处理,清除不能用来作为聚类分析数据源的用户操作日志,和对上一次点播的 操作行为记录进行聚类分析,得到准确的播放时间点,该时间点作为节目起始的参考值。
5.一种基于用户操作日志的EPG校准方法,其特征在于包括下列步骤步骤1、将用户点播回放节目的操作日志记录存储在日志数据库中;步骤2、日志聚类分析引擎对操作日志数据库记录的操作数据进行预处理,清除噪音数据;步骤3、日志聚类分析引擎对预处理后的数据进行聚类分析,得到节目开始正常播放的 时间参考值;步骤4、将上述参考值作为节目的起始时间写入到EPG中,供后继的用户使用。
6.根据权利要求5所述的EPG校准方法,其特征在于所述步骤1中的操作日志包括 用户ID、频道名称、节目名称、用户操作类型和操作时的媒体流时间。
7.根据权利要求6所述的EPG校准方法,其特征在于所述的媒体流时间包括播放时 间、快进时间、快退时间、和停止时间。
8.根据权利要求5所述的EPG校准方法,其特征在于所述的聚类分析选用DBSCAN算 法,聚类的对象就是节目开始正常播放的时间参考值。
全文摘要
本发明公开一种基于用户操作日志的EPG校准系统,包括机顶盒、流媒体服务器,所述流媒体服务器设置有一日志数据库和一日志聚类分析引擎,所述日志数据库用于记录和存储用户通过机顶盒向流媒体服务器点播节目的操作日志;所述的日志聚类分析引擎用于对用户在点播回看节目时候产生的操作日志进行聚类分析,判断出正确的节目起始时间并记录下来供后继用户使用。本发明还公开了一种EPG校准方法。本发明可用于校准EPG中的节目的起始时间。
文档编号H04N7/173GK101964886SQ201010272660
公开日2011年2月2日 申请日期2010年9月3日 优先权日2010年9月3日
发明者李昌盛 申请人:深圳创维数字技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1