一种采集用户的收视数据的方法及装置制造方法

文档序号:7770779阅读:125来源:国知局
一种采集用户的收视数据的方法及装置制造方法
【专利摘要】本发明实施例公开了一种采集用户的收视数据方法及装置,应用于服务器,方法包括:接收来自用户的操作行为数据以及各操作行为所对应的节目信息;统计各操作行为的发生次数及节目被观看的总次数,计算单位时间的跳过概率;根据跳过概率所对应的单位时间,获得各个单位时间的节目信息与所述跳过概率的关联关系,将各个单位时间的节目信息、所述跳过概率以及所述关联关系作为用户的收视数据。应用本发明,提高了收视数据采集的准确性。
【专利说明】一种采集用户的收视数据的方法及装置
【技术领域】
[0001]本发明涉及数据采集【技术领域】,特别涉及一种采集用户的收视数据的方法及装置。
【背景技术】
[0002]目前用户的收视数据主要包括用户观看电视节目的收视数据和用户观看视频网站播放节目的收视数据。
[0003]各电视台主要通过统计收视率来进行用户的收视数据的采集。
[0004]收视率,指在某个时刻收看某个目标电视节目的观众人数占目标观众总人数的比重,以百分比表示。即收视率=收看某个目标节目人数/目标观众总人数。
[0005]典型的收视率方式如央视一索福瑞收视率统计,这种统计方式是选定一些样本用户,通过记录用户的换台情况,定期搜集这些样本记录的数据做出收视率的统计,即目前统计出的收视率=收看目标节目样本人数/样本人数。但实际上收看目标节目样本人数远小于收看目标节目人数,样本人数也远小于目标节目观众总人数,这种由于样本的限制,用户的收视数据采集的结果是不准确的。
[0006]另外收视率只能对用户的换台操作进行统计,不能对其他操作行为如快进、快退、暂停等行为进行统计,无法详细记录用户的操作行为。
[0007]视频网站播放节目的收视数据主要通过视频网站节目的播放次数和直播节目在线人数进行统计,播放次数多和在线人数多只能在大体上反应节目内容的受欢迎程度;另外这种对播放次数和在线人数的统计无法对快进、快退、暂停等操作行为进行统计,即不能详细记录用户的操作行为。
[0008]可见,无论是电视节目的收视率还是视频网站播放节目的受欢迎程度都不能得到准确的数据,如何准确、方便的采集收视数据是目前亟需解决的技术问题。

【发明内容】

[0009]本发明实施例的目的在于提供一种采集用户的收视数据的方法及装置,以准确采集用户的收视数据,详细记录用户的操作行为。
[0010]为达到上述目的,本发明实施例公开了一种采集用户的收视数据的方法,所述方法应用于服务器,包括步骤:
[0011]接收来自用户的操作行为数据以及各操作行为所对应的节目信息;
[0012]统计各操作行为在某一单位时间的发生次数及该单位时间节目内容被观看的总次数,计算该单位时间的跳过概率;
[0013]根据所述跳过概率所对应的时间点,获得各个单位时间的节目信息,以及所述节目信息与所述跳过概率的关联关系,将各个单位时间的节目信息、所述跳过概率以及所述关联关系作为用户的收视数据。
[0014]较佳的,所述节目信息至少包括以下其中之一或任意组合:节目日期、节目名称、节目播放时长中某一单位时间和该单位时间对应的节目内容。
[0015]较佳的,对于电视而言,所述操作行为包括换台、快进、快退、暂停、停止和关闭;
[0016]对于网络视频而言,所述操作行为包括快进、快退、向前拖动、向后拖动、暂停、停止、进入站内其他页、进入站外页,以及关闭视频或关闭网页。
[0017]较佳的,统计各操作行为的在某一单位时间发生次数及该单位时间节目内容被观看的总次数,计算该单位时间的跳过概率的步骤包括:
[0018]某一单位时间的跳过概率=(某一单位时间的快进次数+该单位时间的停止次数+该单位时间关闭次数-该单位时间的快退次数)/该单位时间节目内容被观看的总次数。
[0019]较佳的,所述针对某一单位时间的快进次数为:
[0020]某一单位时间的快进次数=
[0021]NI*从该单位时间内任意时间点开始快进/向前拖动且快进/向前拖动时长〈=第一阈值的次数+
[0022]N2*从该单位时间内任意时间点开始快进/向前拖动且快进/向前拖动时长 > 第一阈值的次数+
[0023]N3*从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内且快进/向前拖动的时长 <=第二阈值的次数+
[0024]N4*从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内且快进/向前拖动的时长 > 第二阈值的次数。
[0025]其中,NI为用户从该单位时间内任意时间点快进/向前拖动时间小于等于第一阈值时该项的权重值;
[0026]N2为用户从该单位时间内任意时间点快进/向前拖动时间大于第一阈值时该项的权重值;
[0027]N3为用户从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内的时间小于等于第二阈值时该项的权重值;
[0028]N4为用户从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内的时间大于第二阈值时该项的权重值;
[0029]N1、N2、N3、N4的取值相同或不同。
[0030]较佳的,针对某一单位时间的停止次数为:
[0031]某一单位时间的停止次数=
[0032]N5*从该单位时间换台/停止播放/进入站内其他页的次数
[0033]其中,N5为用户从该单位时间内任意时间点换台/停止播放/进入站内其他页时该项的权重值。
[0034]较佳的,所述针对某一单位时间的关闭次数为:
[0035]某一单位时间的关闭次数=
[0036]N6*从该单位时间关闭页面/视频/电视的次数
[0037]其中,N6为用户从该单位时间关闭页面/视频/电视时该项的权重值。
[0038]较佳的,所述针对某一单位时间的快退次数为:
[0039]某一单位时间的快退次数=
[0040]N7*从该单位时间内任意时间点开始快退/向后拖动且快退/向后拖动时长〈=第三阈值的次数+
[0041]NS*从该单位时间内任意时间点开始快退/向后拖动且快退/向后拖动时长 > 第三阈值的次数+
[0042]N9*从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内且快退/向后拖动的时长〈=第四阈值的次数+
[0043]N10*从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内且快退/向后拖动的时长〉第四阈值的次数。
[0044]其中,N7为用户从该单位时间内任意时间点快退/向后拖动时间小于等于第三阈值时该项的权重值;
[0045]NS为用户从该单位时间内任意时间点快退/向后拖动时间大于第三阈值时该项的权重值;
[0046]N9为用户从其单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内的时间小于等于第四阈值时该项的权重值;
[0047]NlO为用户从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内的时间大于第四阈值时该项的权重值;
[0048]N7、N8、N9、N10的取值相同或不同。
[0049]较佳的,根据单位时间的跳过概率,计算某个节目内容的跳过概率;
[0050]判断所述节目内容跳过概率是否大于等于第五阈值;
[0051]当所述节目内容跳过概率大于等于第五阈值时,将该节目内容标识为观众不喜欢节目内容,否则将该节目内容标识为观众喜欢节目内容。
[0052]较佳的,接收用户信息;
[0053]根据所述用户信息对用户进行分类;
[0054]针对每一类用户,分别统计该类用户各操作行为在某一单位时间的发生次数及该单位时间节目内容被观看的总次数,计算该单位时间的跳过概率;
[0055]根据每一类用户单位时间的跳过概率,计算某个节目内容的跳过概率;
[0056]比较各类用户相对于同一节目内容的跳过概率,将相对于同一节目内容跳过概率最低的一类用户标识为该节目内容的目标受众群体。
[0057]为达到上述目的,本发明实施例公开了一种采集用户的收视数据的装置,所述装置应用于服务器,包括:
[0058]接收模块,用于接收来自用户的操作行为数据以及各操作行为所对应的节目信息;
[0059]第一计算模块,用于统计各操作行为在某一单位时间的发生次数及该单位时间节目被观看的总次数,该单位时间的跳过概率;
[0060]收视数据采集模块,用于根据所述跳过概率所对应的单位时间,获得各个单位时间的节目信息,以及所述节目信息与所述跳过概率的关联关系,将各个单位时间的节目信息、所述跳过概率以及所述关联关系作为用户的收视数据。
[0061]较佳的,所述节目信息至少包括以下其中之一或任意组合:节目日期、节目名称、节目播放时长中某一单位时间和该单位时间对应的节目内容。
[0062]较佳的,针对电视而言,所述操作行为包括换台、快进、快退、暂停、停止和关闭;[0063]针对网络视频而言,所述操作行为包括快进、快退、向前拖动、向后拖动、暂停、停止、进入站内其他页、进入站外页,以及关闭视频或关闭网页。
[0064]较佳的,所述第一计算模块,用于计算某一单位时间的跳过概率,其中,
[0065]所述某一单位时间的跳过概率=(某一单位时间的快进次数+该单位时间的停止次数+该单位时间关闭次数-该单位时间的快退次数)/该单位时间节目内容被观看的总次数。
[0066]较佳的,所述针对某一单位时间的快进次数为:
[0067]某一单位时间的快进次数=
[0068]Nil*从该单位时间内任意时间点开始快进/向前拖动且快进/向前拖动时长<=第六阈值的次数+
[0069]N12*从该单位时间内任意时间点开始快进/向前拖动且快进/向前拖动时长 > 第六阈值的次数+
[0070]N13*从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内且快进/向前拖动的时长 <=第七阈值的次数+
[0071]N14*从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内且快进/向前拖动的时长 > 第七阈值的次数。
[0072]其中,Nll为用户从该单位时间内任意时间点快进/向前拖动时间小于等于第六阈值时该项的权重值;
[0073]N12为用户从该单位时间内任意时间点快进/向前拖动时间大于第六阈值时该项的权重值;
[0074]N13为用户从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内的时间小于等于第七阈值时该项的权重值;
[0075]N14为用户从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内的时间大于第七阈值时该项的权重值;
[0076]N11、N12、N13、N14的取值相同或不同。
[0077]较佳的,所述针对某一单位时间的停止次数为:
[0078]某一单位时间的停止次数=
[0079]N15*从该单位时间换台/停止播放/进入站内其他页的次数
[0080]其中,N15为用户从该单位时间换台/停止播放/进入站内其他页时该项的权重值。
[0081]较佳的,所述针对某一单位时间的关闭次数为:
[0082]某一单位时间的关闭次数=
[0083]N16*从该单位时间关闭页面/视频/电视的次数
[0084]其中,N16为用户从该单位时间关闭页面/视频/电视时该项的权重值。
[0085]较佳的,所述针对某一单位时间的快退次数为:
[0086]某一单位时间的快退次数=
[0087]N17*从该单位时间内任意时间点开始快退/向后拖动且快退/向后拖动时长〈=第八阈值的次数+
[0088]N18*从该单位时间内任意时间点开始快退/向后拖动且快退/向后拖动时长 > 第八阈值的次数+
[0089]N19*从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内且快退/向后拖动的时长 <=第九阈值的次数+
[0090]N20*从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内且快退/向后拖动的时长 > 第九阈值的次数。
[0091]其中,N17为用户从该单位时间内任意时间点快退/向后拖动时间小于等于第八阈值时该项的权重值;
[0092]N18为用户从该单位时间内任意时间点快退/向后拖动时间大于第八阈值时该项的权重值;
[0093]N19为用户从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内的时间小于等于第九阈值时该项的权重值;
[0094]N20为用户从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内的时间大于第九阈值时该项的权重值;
[0095]N17、N18、N19、N20的取值相同或不同。
[0096]较佳的,第二计算模块,用于根据单位时间的跳过概率,计算某个节目内容的跳过概率;
[0097]第一判断模块,用于判断所述节目内容跳过概率大于等于第五阈值;
[0098]第一标识模块,用于当所述节目内容跳过概率大于等于第五阈值时,将该节目内容标识为观众不喜欢节目内容,否则将该节目内容标识为观众喜欢节目内容。
[0099]较佳的,所述接收模块还用于接收用户信息;
[0100]第三计算模块,用于统计各类用户各操作行为在某一单位时间的发生次数及该单位时间节目内容被各类用户观看的总次数,针对某类用户该单位时间的跳过概率
[0101]第四计算模块,用于根据单位时间的跳过率,计算某个节目内容的跳过概率;
[0102]第二判断模块,用于判断各类用户相对于同一节目内容的跳过率;
[0103]第二标识模块,用于将相对于同一节目内容跳过概率最低的一类用户标识为该节目内容的目标受众群体。
[0104]由上述的技术方案可见,本发明实施例提供一种采集用户的收视数据的方法及装置,服务器接收节目播放过程中来自用户的操作行为数据以及各操作行为所对应的节目信息,并统计各操作行为的发生次数及节目内容被观看的总次数,计算单位时间的跳过概率,根据跳过概率所对应的单位时间,获得各个单位时间的节目信息与所述跳过概率的关联关系,将各个单位时间的节目信息、所述跳过概率以及所述关联关系作为用户的收视数据。由于是通过收集所有用户实际产生的操作行为数据来计算单位时间的跳过概率,进而获得用户的收视数据,因而应用本发明实施例提供的采集用户的收视数据的方法,采集到的用户的收视数据更准确。由于用户的操作行为数据涉及快进、快退、向前拖动、向后拖动、暂停、停止等等,因而记录的用户操作行为数据更详细。
[0105]当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
【专利附图】

【附图说明】[0106]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0107]图1为本发明实施例提供的一种采集用户的收视数据的方法的流程示意图;
[0108]图2为本发明实施例提供的另一种采集用户的收视数据的方法的流程示意图;
[0109]图3为本发明实施例提供的再一种采集用户的收视数据的方法的流程示意图;
[0110]图4为本发明实施例提供的一种采集用户的收视数据的装置的结构示意图;
[0111]图5为本发明实施例提供的另一种采集用户的收视数据的装置的结构示意图;
[0112]图6为本发明实施例提供的再一种采集用户的收视数据的装置的结构示意图。
【具体实施方式】
[0113]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0114]本发明实施例提供一种采集用户的收视数据的方法及装置,该方案中服务器接收来自用户的操作行为数据以及各操作行为所对应的节目信息,计算各操作行为的发生次数及节目内容被观看的总次数,计算单位时间的跳过概率,将所述跳过概率与所述节目信息对应保存,获得各个单位的节目信息与所述跳过概率的关联关系,将各个单位时间的节目信息、所述跳过概率以及所述关联关系作为用户的收视数据。
[0115]下面通过具体实施例,对本发明进行详细说明。
[0116]图1为本发明实施例提供的一种采集用户的收视数据的方法的流程示意图,该方法应用于服务器,包括如下步骤:
[0117]SlOl:接收来自用户的操作行为数据以及各操作行为所对应的节目信息。
[0118]本实施例中,对于电视而言,操作行为可以包括换台、快进、快退、暂停、停止和关闭;对于网络视频而言,所述操作行为包括快进、快退、向前拖动、向后拖动、暂停、停止、进入站内其他页、进入站外页,以及关闭视频或关闭网页。节目信息可以包括:节目日期、节目名称、节目播放时长中某一单位时间和该单位时间对应的节目内容。当然,实际实施过程中,无论是操作行为还是节目信息,都可以不限于上述信息,也可以根据采集的要求,增加或减少操作行为和节目信息的内容。例如:节目总时长等等。
[0119]S102:统计各操作行为的发生次数及节目被观看的总次数,计算单位时间跳过概率;需要说明的是,在统计不同操作的操作次数的时,需要设置开始统计的最小时间门限值。
[0120]假设,设置门限值为I秒,则快进、快退、向前拖动、或者向后拖动时长大于等于I秒后统计一次操作行为。门限值也可以以帧为单位进行设置。当然,本申请只是以上述为例进行说明,门限值设置不限于此。
[0121]具体地,
[0122]公式1:某一单位时间的跳过概率=(某一单位时间的快进次数+该单位时间的停止次数+该单位时间关闭次数-该单位时间的快退次数)/该单位时间节目内容被观看的总次数。
[0123]具体地,某一单位时间的快进次数=
[0124]NI*从该单位时间内任意时间点开始快进/向前拖动且快进/向前拖动时长〈=第一阈值的次数+
[0125]N2*从该单位时间内任意时间点开始快进/向前拖动且快进/向前拖动时长 > 第一阈值的次数+
[0126]N3*从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内且快进/向前拖动的时长 <=第二阈值的次数+
[0127]N4*从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内且快进/向前拖动的时长 > 第二阈值的次数。
[0128]具体地,某一单位时间的停止次数=
[0129]N5*从该单位时间内任意时间点换台/停止播放/进入站内其他页的次数
[0130]其中,N5为用户从该单位时间内任意时间点换台/停止播放/进入站内其他页时该项的权重值。
[0131]具体地,某一单位时间的关闭次数=
[0132]N6*从该单位时间内任意时间点关闭页面/视频/电视的次数
[0133]其中,N6为用户从该单位时间内任意时间点关闭页面/视频/电视时该项的权重值。
[0134]具体地,某一单位时间的快退次数=
[0135]N7*从该单位时间内任意时间点开始快退/向后拖动且快退/向后拖动时长〈=第三阈值的次数+
[0136]NS*从该单位时间内任意时间点开始快退/向后拖动且快退/向后拖动时长 > 第三阈值的次数+
[0137]N9*从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内且快退/向后拖动的时长〈=第四阈值的次数+
[0138]N10*从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内且快退/向后拖动的时长〉第四阈值的次数。
[0139]其中,N7为用户从该单位时间内任意时间点快退/向后拖动时间小于等于第三阈值时该项的权重值;
[0140]NS为用户从该单位时间内任意时间点快退/向后拖动时间大于第三阈值时该项的权重值;
[0141]N9为用户从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内的时间小于等于第四阈值时该项的权重值;
[0142]NlO为用户从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内的时间大于第四阈值时该项的权重值。
[0143]NI?NlO的取值相同或不同。
[0144]第一阈值、第二阈值、第三阈值、第四阈值的取值相同或不同。
[0145]需要说明的是,用户在收看节目过程中还可以有除了前述快进、快退、向前拖动、向后拖动、进入站内其他页、停止播放和关闭页面操作之外的操作,可以用类似计算单位时间内快进的次数、单位时间内停止播放的次数、单位时间内关闭页面的次数和单位时间内快退的次数的方法进行计算,并增加到计算单位时间跳过概率的公式中。
[0146]假设:单位时间为I秒,NI?NlO取值均为1,第一阈值、第二阈值、第三阈值、第四阈值的取值均为15秒,某单位时间为20130110期百变大咖秀13分35秒,该秒总共被观看的次数为587468次。在这种情况下,统计获得:
[0147]在13分35秒开始快进/向前拖动且快进/向前拖动时长〈=15秒的次数为54875次,
[0148]在13分35秒开始快进/向前拖动且快进/向前拖动时长>15秒的次数为54124次,
[0149]从13分35秒以外的时间开始快进/向前拖动且13分35秒在快进/向前拖动的范围内且快进/向前拖动的时长〈=15秒的次数为54865次,
[0150]从13分35秒以外的时间开始快进/向前拖动且13分35秒在快进/向前拖动的范围内且快进/向前拖动的时长>15秒的次数为85624次,
[0151 ] 从13分35秒换台/停止播放/进入站内其他页的次数为5847次,
[0152]从13分35秒关闭页面/视频/电视的次数为87456次,
[0153]在13分35秒开始快退/向后拖动且快退/向后拖动时长〈=15秒的次数为45825次,
[0154]在13分35秒开始快退/向后拖动且快退/向后拖动时长>15秒的次数为65874次,
[0155]从13分35秒以外的时间开始快退/向后拖动且13分35秒在快退/向后拖动的范围内且快退/向后拖动的时长〈=15秒的次数为52473次,
[0156]从13分35秒以外的时间开始快退/向后拖动且13分35秒在快退/向后拖动的范围内且快退/向后拖动的时长> 15秒的次数为9568次。
[0157]则利用上述公式1,在20130110期百变大咖秀13分35秒的跳过概率=
[0158](1*54875+1*54124+1*54865+1*85624+1*5847+1*87456-1*45825-1*65874-1*52473-1*9568) /587468=28.8%。
[0159]根据上述计算可知,20130110期百变大咖秀13分35秒的跳过概率为28.8%。
[0160]以此,可以计算出20130110期百变大咖秀其它单位时间的跳过概率。
[0161]S103:根据所述跳过概率所对应的单位时间,获得各个单位时间的节目信息,以及所述节目信息与所述跳过概率的关联关系,将各个单位时间的节目信息、所述跳过概率以及所述关联关系作为用户的收视数据。
[0162]例如单位时间跳过概率,根据跳过概率所对应的单位时间,获得表I所示第13分35秒单位时间的节目信息与该点跳过概率的关联关系表,如表I。
[0163]表I
[0164]节目时间节目名称节目播放时长节目内容该单位时间跳过
中某-点时间概率
20130110百变大咖秀第13分35秒陈龙表演28.8%
[0165]以此,获得其他单位时间的节目信息与其对应单位时间跳过概率的关联关系
[0166]应用图1所示实施例所采集到的收视数据,实际是包含了各个单位时间的节目信息、跳过概率以及两者之间关系的数据集合,由于该方法没有了样本的限制,且记录了所有用户的所有操作行为,因而提高了所采集到的收视数据的准确性,并在获取收视数据的同时详细记录了用户的操作行为。
[0167]图2为本发明实施例提供的另一种采集用户的收视数据的方法的流程示意图,该方法应用于服务器,包括如下步骤:
[0168]S201:接收来自用户的操作行为数据以及各操作行为所对应的节目信息。
[0169]S202:统计各操作行为的发生次数及节目被观看的总次数,计算单位时间的跳过概率。
·[0170]S203:根据所述跳过概率所对应的单位时间,获得各个单位时间的节目信息,以及所述节目信息与所述跳过概率的关联关系,将各个单位时间的节目信息、所述跳过概率以及所述关联关系作为用户的收视数据。
[0171]本实施例中的S201?S203与图1所示实施例中的SlOl?S103可以完全相同,这里不再重复详述。
[0172]S204:根据单位时间的跳过概率,计算某个节目内容的跳过概率;
[0173]具体地,计算某个节目内容的跳过概率的步骤包括:
[0174]获取该节目内容对应的所有单位时间的跳过概率;
[0175]计算所有单位时间的跳过概率之和;
[0176]使用计算出来的所有单位时间的跳过概率之和除以与该节目内容对应所有单位时间的个数,将所获得的商作为该节目内容跳过概率。
[0177]例如:主持人讲话持续3秒钟,第一秒跳过概率为70%,第二秒跳过概率为40%,第三秒跳过概率为55%,那么主持人讲话跳过概率=(70%+40%+55%) /3=55%。
[0178]S205,判断所述节目内容跳过概率是否大于等于第五阈值,如果是执行S206,否则执行S207。
[0179]例如,该第五阈值可以为50%。
[0180]S206:节目内容为观众不喜欢节目内容。
[0181]S207:节目内容为观众喜欢节目内容。
[0182]本发明实施例,实际是包含了各个单位时间的节目信息、跳过概率以及两者之间关系的数据集合,由于该方法没有了样本的限制,且记录了所有用户的所有的操作行为,因而提高了采集到的收视数据准确性,并在获取收视数据的同时详细记录了用户的操作行为,并且能找出观众喜欢的节目内容。
[0183]图3为本发明实施例提供的再一种采集用户的收视数据的方法的流程示意图,该方法应用于服务器,包括如下步骤:[0184]S301:接收来自用户的操作行为数据以及各操作行为所对应的节目信息及用户信
肩、O
[0185]本实施例中,对于电视而言,操作行为可以包括换台、快进、快退、暂停、停止和关闭;对于网络视频而言,所述操作行为包括快进、快退、向前拖动、向后拖动、暂停、停止、进入站内其他页、进入站外页,以及关闭视频或关闭网页。节目信息可以包括:节目日期、节目名称、节目播放时长中某一单位时间和该单位时间对应的节目内容。用户信息可以包括以下其中之一或任意组合:例如用户的性别、年龄、职业、爱好。当然,实际实施过程中,无论是操作、节目信息还是用户信息,都可以不限于上述这些信息,也可以根据采集的要求,增加或减少操作行为和节目信息或用户信息的内容。例如:节目总时长、用户的地理位置等等。
[0186]S302:根据所述用户信息对用户进行分类;
[0187]S303:针对每一类用户,分别统计该类用户各操作行为在某一单位时间的发生次数及该单位时间节目被观看的总次数,计算单位时间的跳过概率;
[0188]具体的统计、计算方法与图1所述实施例的步骤102相同,这里不再赘述。
[0189]例如:根据用户的年龄对用户进行分类:15岁以下为A类用户,16岁至30岁为B类用户,31至45岁为C类用户,45岁以上为D类用户。
[0190]在应用上述公式(I)进行计算时,令单位时间为I秒,NI?NlO取值均为1,第一阈值、第二阈值、第三阈值、第四阈值的取值均为15秒,令某单位时间为20130110期百变大咖秀13分35秒,该秒总共被观看的次数为587468。其中A类用户在该单位时间共观看152454次,B类用户在该单位时间共观看146857次,C类用户在该单位时间共观看158435次,D类用户在该单位时间共观看129722次。下面以A类用户为例,假设
[0191]A类用户在13分35秒开始快进/向前拖动且快进/向前拖动时长〈=15秒的次数为5487次,
[0192]A类用户在13分35秒开始快进/向前拖动且快进/向前拖动时长>15秒的次数为5414次,
[0193]A类用户从13分35秒以外的其他时间开始快进/向前拖动且13分35秒在快进/向前拖动的范围内且快进/向前拖动的时长〈=15秒的次数为4865次,
[0194]A类用户从13分35秒以外的其他时间开始快进/向前拖动且13分35秒在快进/向前拖动的范围内且快进/向前拖动的时长>15秒的次数为5624次,
[0195]A类用户从13分35秒以外的其他时间换台/停止播放/进入站内其他页的次数为5847次,
[0196]A类用户从13分35秒关闭页面/视频/电视的次数为8456次,
[0197]A类用户在13分35秒开始快退/向后拖动且快退/向后拖动时长〈=15秒的次数为4585次,
[0198]A类用户在13分35秒开始快退/向后拖动且快退/向后拖动时长>15秒的次数为6874次,
[0199]A类用户从13分35秒以外的其他时间开始快退/向后拖动且13分35秒在快退/向后拖动的范围内且快退/向后拖动的时长〈=15秒的次数为5473次,
[0200]A类用户从13分35秒以外的其他时间开始快退/向后拖动且13分35秒在快退/向后拖动的范围内且快退/向后拖动的时长>15秒的次数为968次。[0201]则A类用户在13分35秒的跳过概率=
[0202](1*5487+1*5414+1*4865+1*5624+1*847+1*8456-1*4585-1*6874-1*5473-1*968)/152454=8.4%。
[0203]相应计算出B类用户在13分35秒的跳过概率15.7%,C类用户在13分35秒的跳过概率25%,D类用户在13分35秒的跳过概率11%。
[0204]S304:根据跳过概率所对应的单位时间,获得各类用户信息和各个单位时间的节目信息与所述跳过概率的关联关系,将各类用户信息和各个单位时间的节目信息、所述跳过概率以及所述关联关系作为用户的收视数据。根据跳过概率所对应的单位时间,获得表2各类用户信息、各单位时间的节目内容与所述跳过概率的关联关系表。根据上述计算,即可获得如表2所示信息:
[0205]表2
【权利要求】
1.一种采集用户的收视数据方法,其特征在于,所述方法应用于服务器,包括步骤: 接收来自用户的操作行为数据以及各操作行为所对应的节目信息; 统计各操作行为在某一单位时间的发生次数及该单位时间节目内容被观看的总次数,计算该单位时间的跳过概率; 根据所述跳过概率所对应的时间点,获得各个单位时间的节目信息,以及所述节目信息与所述跳过概率的关联关系,将各个单位时间的节目信息、所述跳过概率以及所述关联关系作为用户的收视数据。
2.根据权利要求1所述的方法,其特征在于,所述节目信息至少包括以下其中之一或任意组合:节目日期、节目名称、节目播放时长中某一单位时间和该单位时间对应的节目内容。
3.根据权利要求1所述的方法,其特征在于, 对于电视而言,所述操作行为包括换台、快进、快退、暂停、停止和关闭; 对于网络视频而言,所述操作行为包括快进、快退、向前拖动、向后拖动、暂停、停止、进入站内其他页、进入站·外页,以及关闭视频或关闭网页。
4.根据权利要求1-3任一所述的方法,其特征在于,统计各操作行为的在某一单位时间发生次数及该单位时间节目内容被观看的总次数,计算该单位时间的跳过概率的步骤包括: 某一单位时间的跳过概率=(某一单位时间的快进次数+该单位时间的停止次数+该单位时间关闭次数-该单位时间的快退次数)/该单位时间节目内容被观看的总次数。
5.根据权利要求4所述的方法,其特征在于,所述针对某一单位时间的快进次数为: 某一单位时间的快进次数= NI*从该单位时间内任意时间点开始快进/向前拖动且快进/向前拖动时长〈=第一阈值的次数+ N2*从该单位时间内任意时间点开始快进/向前拖动且快进/向前拖动时长 > 第一阈值的次数+ N3*从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内且快进/向前拖动的时长 <=第二阈值的次数+ N4*从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内且快进/向前拖动的时长 > 第二阈值的次数。 其中,NI为用户从该单位时间内任意时间点快进/向前拖动时间小于等于第一阈值时该项的权重值; N2为用户从该单位时间内任意时间点快进/向前拖动时间大于第一阈值时该项的权重值; N3为用户从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内的时间小于等于第二阈值时该项的权重值; N4为用户从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内的时间大于第二阈值时该项的权重值; N1、N2、N3、N4的取值相同或不同。
6.根据权利要求4所述的方法,其特征在于,针对某一单位时间的停止次数为:某一单位时间的停止次数= N5*从该单位时间换台/停止播放/进入站内其他页的次数 其中,N5为用户从该单位时间内任意时间点换台/停止播放/进入站内其他页时该项的权重值。
7.根据权利要求4所述的方法,其特征在于,所述针对某一单位时间的关闭次数为: 某一单位时间的关闭次数= N6*从该单位时间关闭页面/视频/电视的次数 其中,N6为用户从该单位时间关闭页面/视频/电视时该项的权重值。
8.根据权利要求4所述的方法,其特征在于,所述针对某一单位时间的快退次数为: 某一单位时间的快退次数= N7*从该单位时间内任意时间点开始快退/向后拖动且快退/向后拖动时长〈=第三阈值的次数+ NS*从该单位时间内任意时间点开始快退/向后拖动且快退/向后拖动时长〉第三阈值的次数+ N9*从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内且快退/向后拖动的时长 〈=第四阈值的次数+ NlO*从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内且快退/向后拖动的时长〉第四阈值的次数。 其中,N7为用户从该单位时间内任意时间点快退/向后拖动时间小于等于第三阈值时该项的权重值; NS为用户从该单位时间内任意时间点快退/向后拖动时间大于第三阈值时该项的权重值; N9为用户从其单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内的时间小于等于第四阈值时该项的权重值; NlO为用户从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内的时间大于第四阈值时该项的权重值; N7、N8、N9、N10的取值相同或不同。
9.根据权利要求1所述的方法,其特征在于,该方法进一步包括: 根据单位时间的跳过概率,计算某个节目内容的跳过概率; 判断所述节目内容跳过概率是否大于等于第五阈值; 当所述节目内容跳过概率大于等于第五阈值时,将该节目内容标识为观众不喜欢节目内容,否则将该节目内容标识为观众喜欢节目内容。
10.根据权利要求1所述的方法,其特征在于,该方法进一步包括: 接收用户信息; 根据所述用户信息对用户进行分类; 针对每一类用户,分别统计该类用户各操作行为在某一单位时间的发生次数及该单位时间节目内容被观看的总次数,计算该单位时间的跳过概率; 根据每一类用户单位时间的跳过概率,计算某个节目内容的跳过概率; 比较各类用户相对于同一节目内容的跳过概率,将相对于同一节目内容跳过概率最低的一类用户标识为该节目内容的目标受众群体。
11.一种采集用户的收视数据的装置,其特征在于,所述装置应用于服务器,包括: 接收模块,用于接收来自用户的操作行为数据以及各操作行为所对应的节目信息; 第一计算模块,用于统计各操作行为在某一单位时间的发生次数及该单位时间节目被观看的总次数,该单位时间的跳过概率; 收视数据采集模块,用于根据所述跳过概率所对应的单位时间,获得各个单位时间的节目信息,以及所述节目信息与所述跳过概率的关联关系,将各个单位时间的节目信息、所述跳过概率以及所述关联关系作为用户的收视数据。
12.根据权利要求11所述的装置,其特征在于,所述节目信息至少包括以下其中之一或任意组合:节目日期、节目名称、节目播放时长中某一单位时间和该单位时间对应的节目内容。
13.根据权利要求11所述的装置,其特征在于, 针对电视而言,所述操作行为包括换台、快进、快退、暂停、停止和关闭; 针对网络视频而言,所述操作行为包括快进、快退、向前拖动、向后拖动、暂停、停止、进入站内其他页、进入站外页,以及关闭视频或关闭网页。
14.根据权利要求13所述的装置,其特征在于, 所述第一计算模块,用于计算某一单位时间的跳过概率,其中, 所述某一单位时间的跳过概率=(某一单位时间的快进次数+该单位时间的停止次数+该单位时间关闭次数-该单位时间的快退次数)/该单位时间节目内容被观看的总次数。
15.根据权利要求14所述的装置,其特征在于,所述针对某一单位时间的快进次数为: 某一单位时间的快进次数= Nil*从该单位时间内任意时间点开始快进/向前拖动且快进/向前拖动时长〈=第六阈值的次数+ N12*从该单位时间内任意时间点开始快进/向前拖动且快进/向前拖动时长〉第六阈值的次数+ N13*从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内且快进/向前拖动的时长〈=第七阈值的次数+ N14*从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内且快进/向前拖动的时长 > 第七阈值的次数。 其中,Nll为用户从该单位时间内任意时间点快进/向前拖动时间小于等于第六阈值时该项的权重值; N12为用户从该单位时间内任意时间点快进/向前拖动时间大于第六阈值时该项的权重值; N13为用户从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内的时间小于等于第七阈值时该项的权重值; N14为用户从其他单位时间内任意时间点开始快进/向前拖动且该单位时间在快进/向前拖动的范围内的时间大于第七阈值时该项的权重值; N11、N12、N13、N14的取值相同或不同。
16.根据权利要求14所述的装置,其特征在于,所述针对某一单位时间的停止次数为:某一单位时间的停止次数= N15*从该单位时间换台/停止播放/进入站内其他页的次数 其中,N15为用户从该单位时间换台/停止播放/进入站内其他页时该项的权重值。
17.根据权利要求14所述的装置,其特征在于,所述针对某一单位时间的关闭次数为: 某一单位时间的关闭次数= N16*从该单位时间关闭页面/视频/电视的次数 其中,N16为用户从该单位时间关闭页面/视频/电视时该项的权重值。
18.根据权利要求13所述的装置,其特征在于,所述针对某一单位时间的快退次数为: 某一单位时间的快退次数= N17*从该单位时间内任意时间点开始快退/向后拖动且快退/向后拖动时长〈=第八阈值的次数+ N18*从该单位时间内任意时间点开始快退/向后拖动且快退/向后拖动时长〉第八阈值的次数+ N19*从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内且快退/向后拖动的时长〈=第九阈值的次数+ N20*从其他单位时间内 任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内且快退/向后拖动的时长〉第九阈值的次数。 其中,N17为用户从该单位时间内任意时间点快退/向后拖动时间小于等于第八阈值时该项的权重值; N18为用户从该单位时间内任意时间点快退/向后拖动时间大于第八阈值时该项的权重值; N19为用户从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内的时间小于等于第九阈值时该项的权重值; N20为用户从其他单位时间内任意时间点开始快退/向后拖动且该单位时间在快退/向后拖动的范围内的时间大于第九阈值时该项的权重值; N17、N18、N19、N20的取值相同或不同。
19.根据权利要求11所述的装置,其特征在于,该装置进一步包括: 第二计算模块,用于根据单位时间的跳过概率,计算某个节目内容的跳过概率; 第一判断模块,用于判断所述节目内容跳过概率大于等于第五阈值; 第一标识模块,用于当所述节目内容跳过概率大于等于第五阈值时,将该节目内容标识为观众不喜欢节目内容,否则将该节目内容标识为观众喜欢节目内容。
20.根据权利要求11所述的装置,其特征在于:所述装置还包括: 所述接收模块还用于接收用户信息; 第三计算模块,用于统计各类用户各操作行为在某一单位时间的发生次数及该单位时间节目内容被各类用户观看的总次数,针对某类用户该单位时间的跳过概率第四计算模块,用于根据单位时间的跳过率,计算某个节目内容的跳过概率; 第二判断模块,用于判断各类用户相对于同一节目内容的跳过率; 第二标识模块,用于将相对于同一节目内容跳过概率最低的一类用户标识为该节目内容的目标受众群体。
【文档编号】H04N21/258GK103442270SQ201310425140
【公开日】2013年12月11日 申请日期:2013年9月17日 优先权日:2013年9月17日
【发明者】高玮, 于靓环 申请人:北京奇艺世纪科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1