资源排行数据生成方法和装置的制造方法

文档序号:9826292阅读:212来源:国知局
资源排行数据生成方法和装置的制造方法
【技术领域】
[0001] 本发明涉及计算机信息处理技术领域,特别是涉及一种资源排行数据生成方法和 装置。
【背景技术】
[0002] 各个用户对视频资源的需求不同,呈现出用户群体对视频资源的关注程度不同的 自然现象。进行宏观统计后,某些视频资源被频繁访问,用户关注程度高;某些视频资源被 访问的频率非常低,用户关注程度低。目前可以用视频资源被播放的次数作为热度值来量 化表示用户群体对于视频资源的关注程度,从而根据视频资源的热度值大小进行排序而生 成视频资源排行榜单。该视频资源排行榜单可以直观反映出用户群体对于视频资源的关注 程度,为其它用户选择资源或者视频资源供应方对视频资源进行统计分析提供准确的数据 参考。
[0003] 然而,目前根据热度值生成视频资源排行榜单,仅仅利用了视频资源的次数统计 数据,依据单一,所生成的视频资源排行榜单只能够反映出视频资源的整体统计特性,导致 视频资源排行榜单准确性不足。比如某一视频资源历史播放次数最高,那么它就会长时间 处于视频资源排行榜单首位,这样视频资源排行榜单就不能反映出当下用户群体对于视频 资源真实的关注程度,准确性不足。

【发明内容】

[0004] 基于此,有必要针对目前根据热度值生成视频资源排行榜单导致视频资源排行榜 单准确性不足的技术问题,提供一种资源排行数据生成方法和装置。
[0005] -种资源排行数据生成方法,所述方法包括:
[0006] 统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二预设时间 段内的第二操作统计数据;其中,所述第一预设时间段在所述第二预设时间段之后;
[0007] 根据待排行资源的所述第一操作统计数据计算待排行资源的热度值;
[0008] 根据待排行资源的所述第一操作统计数据和所述第二操作统计数据的统计分布 变化计算待排行资源的时新度值;
[0009] 根据待排行资源的所述热度值和所述时新度值的结合生成用于据以形成资源排 行榜单的资源排行数据。
[0010] 一种资源排行数据生成装置,所述装置包括:
[0011] 统计模块,用于统计待排行资源在第一预设时间段内的第一操作统计数据以及在 第二预设时间段内的第二操作统计数据;其中,所述第一预设时间段在所述第二预设时间 段之后;
[0012] 热度值计算模块,用于根据待排行资源的所述第一操作统计数据计算待排行资源 的热度值;
[0013] 时新度值计算模块,用于根据待排行资源的所述第一操作统计数据和所述第二操 作统计数据的统计分布变化计算待排行资源的时新度值;
[0014] 资源排行数据生成模块,用于根据待排行资源的所述热度值和所述时新度值的结 合生成用于据以形成资源排行榜单的资源排行数据。
[0015] 上述资源排行数据生成方法和装置,通过两种参数来生成用于据以形成资源排行 榜单的资源排行数据,两种参数分别为热度值和时新度值。其中热度值根据距离当前时间 较近的第一预设时间段内的第一操作统计数据生成,可以反映这段时间内待排行资源被关 注的整体统计特性。而时新度值根据距离当前时间较近的第一预设时间段内的第一操作统 计数据以及距离当前稍远的第二预设时间段内的第二操作统计数据的统计分布变化生成, 其表示的是待排行资源在第一预设时间段内相对于在第二预设时间段内的统计波动,可以 反映出资源的突发情况。这样结合热度值和时新度值而生成的资源排行数据,据之生成资 源排行榜单,可以同时反映出待排行资源被关注的整体情况以及资源被关注的波动变化, 准确性提高。
【附图说明】
[0016] 图1为一个实施例中用于实现资源排行数据生成方法的电子设备的内部结构示 意图;
[0017] 图2为一个实施例中资源排行数据生成方法的流程示意图;
[0018] 图3为一个实施例中根据待排行资源的第一操作统计数据和第二操作统计数据 的统计分布变化计算待排行资源的时新度值的步骤的流程示意图;
[0019] 图4为一个实施例中统计待排行资源在第一预设时间段内的第一操作统计数据 以及在第二预设时间段内的第二操作统计数据的步骤的流程示意图;
[0020] 图5为另一个实施例中资源排行数据生成方法的流程示意图;
[0021] 图6为一个具体应用场景中应用资源排行数据生成方法的流程示意图;
[0022] 图7为一个实施例中资源排行数据生成装置的结构框图;
[0023] 图8为一个实施例中图7中的时新度值计算模块的结构框图;
[0024] 图9为一个实施例中图7中的统计模块的结构框图;
[0025] 图10为一个实施例中图7中的资源排行数据生成模块的结构框图。
【具体实施方式】
[0026] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并 不用于限定本发明。
[0027] 本发明的基本构思是,生成用于据以形成资源排行榜单的资源排行数据时所依据 的因素不仅包括热度,还包括时新度。热度可以反映出资源的整体特性,而时新度可以反映 出资源在不同时间段的统计波动特性,从而反映出资源被关注的突发情况,比如新资源的 发布、突发事件导致的资源关注度上升等情况。这样结合热度值和时新度值而生成的资源 排行数据,据之生成资源排行榜单,可以同时反映出资源被关注的整体情况以及资源被关 注的波动变化,准确性提高。
[0028] 如图1所示,在一个实施例中,提供了一种电子设备,该电子设备包括通过系统总 线连接的处理器、内存和存储介质。其中,该电子设备的存储介质存储有操作系统、数据库 和一种资源排行数据生成装置,该资源排行数据生成装置用于实现一种资源排行数据生成 方法。该电子设备的处理器用于提供计算和控制能力,支撑整个电子设备的运行。该电子 设备的内存为存储介质中的资源排行数据生成装置提供运行环境。该电子设备可以是一个 独立的设备,或者可以是多个可互联通信的电子设备组成的电子设备群,资源排行数据生 成装置的各个功能模块可分别分布在电子设备群中的各个电子设备上。该电子设备可以是 台式计算机。
[0029] 如图2所示,在一个实施例中,提供了一种资源排行数据生成方法,本实施例以该 方法应用于上述图1中的电子设备来举例说明。该方法具体包括如下步骤:
[0030] 步骤202,统计待排行资源在第一预设时间段内的第一操作统计数据以及在第二 预设时间段内的第二操作统计数据;其中,第一预设时间段在第二预设时间段之后。
[0031] 资源是指可操作的数据对象,比如可以是视频、音乐等多媒体资源,也可以是小 说、应用程序等。待排行资源是指需要对其进行排序并将排序结果体现在资源排行榜单中 的资源,资源排行榜单则是指可以体现待排行资源的排序结果的可视化数据。资源排行榜 单可以采用指定的各种形式展示。操作统计数据是指对因操作资源而产生的数据的进行统 计而获得的统计结果,第一操作统计数据和第二操作统计数据的描述用于区分不同的操作 统计数据。
[0032] 操作统计数据可以是操作次数统计值,是指对因操作资源而产生的次数数据进行 统计而获得的次数统计结果。相应地,第一操作统计数据为第一操作次数统计值;第二操作 统计数据为第二操作次数统计值。第一操作次数统计值和第二操作次数统计值可以取自待 排行资源的搜索次数、访问次数、播放次数、下载次数、评价次数和分享次数中的一种。操作 统计数据还可以是根据操作次数统计值生成的数据,比如操作统计频率或者对操作次数统 计值进行归一化处理所获得的归一化数值。
[0033] 第一预设时间段在第二预设时间段之后,是指第一预设时间段的最小边界值大于 或者等于第二预设时间段的最大边界值,这样产生第一操作统计数据所依据的对待排行资 源的操作发生在产生第二操作统计数据所依据的对待排行资源的操作之后。
[0034] 在一个实施例中,第一预设时间段与第二预设时间段相邻,这样两个时间段是连 续的,可以更好地反映两个时间段内操作统计数据的统计分布的波动。在一个实施例中,第 一预设时间段所表示的时间范围小于第二预设时间段所表示的时间范围,比如第一预设时 间段为1天,而第二预设时间段为7天,这样第二预设时间段内的第二操作统计数据能够更 好地反映待排行资源以往的统计分布,从而可以更好地反映两个时间段内操作统计数据的 统计分布的波动。
[0035] 具体以待排行资源为视频为例对步骤202进行说明,对于每个待排行的视频,统 计在最近1天之内其视频名称作为关键词被搜索的次数,并统计1天前起倒退的7天之内 其视频名称作为关键词被搜索的次数。
[0036] 步骤204,根据待排行资源的第一操作统计数据计算待排行资源的热度值。
[0037] 热度是一种参数,是待排行资源被关注程度的量化累积表示,热度值则是体现热 度大小的具体数值。具体地,可以将第一操作统计数据直接作为待排行资源的热度值,也可 以对第一操作统计数据进行进一步处理,比如乘以预设系数、加上预设阈值,进行归一化处 理等,从而将处理第一操作统计数据所获得的数据作为热度值。举例来说,对于一个名称为 "离婚律师"的待排行的视频资源,可以将最近1天之内"离婚律师"这一关键词被搜索的次 数作为该视频资源的热度值。
[0038] 步骤206,根据待排行资源的第一操作统计数据和第二操作统计数据的统计分布 变化计算待排行资源的时新度值。
[0039] 时新度是用来反映待排行资源被关注程度的变化的量化参数,时新度值则是体现 这种变化程度的具体数值。第一操作统计数据是距离当前时间较近的第一预设时间段内的 操作统计数据,待排行资源的第一操作统计数据的统计分布则是指其第一操作统计数据相 对于所有待排行资源的第一操作统计数据的统计分布情况。第二操作统计数据是距离当前 时间较远的第二预设时间段内的操作统计数据,则待排行资源的第二操作统计数据的统计 分布则是指
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1