多媒体信息更新方法及装置的制造方法_3

文档序号:9765974阅读:来源:国知局
个多媒体信息更新后,均会将其更新时间记录在存储介质上。 其中,更新时间包括更新日期和更新时刻。在获取历史多媒体信息的更新时刻时,可直接根 据历史多媒体信息的集数标识等从存储介质中获取对应更新时刻。其中,存储介质可为内 存或闪存等等,本发明实施例对存储介质的类型不进行具体限定。
[0104] 303f、根据每一项历史多媒体信息的更新时刻,预测多媒体信息集合的第二预测 更新时刻。
[0105] 针对该步骤,在得到各项历史多媒体信息的更新时刻后,可根据各个更新时刻对 该多媒体信息集合的下一次更新时刻(第二预测更新时刻)进行预测。比如,与上述步骤 303a至步骤303d类似的方法对第二预测更新时刻进行预测。还可采取对各个更新时刻求 均值等方式对第二预测更新时刻进行预测,本发明实施例对此不进行具体限定。
[0106] 303g、确定当前的更新时间修正值。
[0107] 在本发明实施例中,为了对多媒体信息集合的更新时间预测的更加准确,还引入 了对初步预测出的更新时刻进行修正的概念。具体做法为:设置一个更新时间修正值T(初 始值为0),一个修正时间步长n (可根据需要进行调整)。在每一轮的更新时刻计算过程中, 根据更新时刻修正值T和修正时间步长n,对初步预测出的第二预测更新时刻进行修正。同 时,也根据多媒体信息集合的实际更新时刻和第二预测更新时刻对更新时刻修正值T进行 重新赋值。也即,每一轮更新时刻预测过程中,对当前预测出的更新时刻进行修正的更新时 刻修正值都是不一样的,关于更新时刻修正值的详细解释说明请参见后续步骤。
[0108] 由于每一轮更新过程都会对更新时刻修正值进行重新赋值并保存当前数值,所W 可W直接获取到当前的更新时间修正值。
[0109] 303K根据第二预测更新时刻和当前的更新时间修正值,计算第一预测更新时刻。
[0110] 针对该步骤,由于当前已经预测出多媒体信息集合的下一次更新时刻为第二预测 更新时刻,因此可根据当前的更新时间修正值,对第二预测更新时刻进行修正,得到该多媒 体信息集合的第一预测更新时刻。进而根据第一预测更新时刻获取该多媒体信息集合的更 新多媒体信息。
[0111] 在根据第二预测更新时刻和当前的更新时间修正值,计算第一预测更新时刻时, 具体可采取下述方式实现:
[0112] 计算第二预测更新时刻和当前的更新时间修正值之和,将二者之和确定为该多媒 体信息集合的第一预测更新时刻。
[0113] 当然,除上述计算第一预测更新时刻的方式外,还可采取其他计算方式,本发明实 施例对此不进行具体限定。
[0114] 304、确定第一预测更新时间小于当前时间的指定多媒体信息集合。
[0115] 在本发明实施例中,在根据上述步骤301至步骤303得到每一个多媒体信息集合 的第一预测更新时间后,便可根据当前时间与各个多媒体信息集合的第一预测更新时间的 大小关系,确定可进行更新多媒体信息抓取的指定多媒体信息集合。
[0116] 其中,之所W要确定第一预测更新时间小于当前时间的指定多媒体信息集合,是 因为仅当前时间大于某一多媒体信息集合的第一预测更新时间时,才会抓取到更新的多媒 体信息;如果当前时间小于某一多媒体信息集合的第一预测更新时间,则由于该多媒体信 息集合此时还未更新,因此抓取不到更新的多媒体信息。
[0117] 下面W-个小例子对上述情况进行说明。
[011引假设电视剧A的第一预测更新时间为14:00:00,电视剧B的第一预测更新时间为 13:55:00,当前时间为13:57:00为例,则在13:57:00进行更新多媒体信息的抓取时,应该 抓取的是电视剧B的多媒体信息,因为电视剧B在13:55:00已经更新了。而不应该抓取的 是电视剧A的多媒体信息,因为电视剧A在13:57: OO还没有进行更新。
[0119] 305、根据指定多媒体信息集合的地址信息,获取更新的多媒体信息。
[0120] 在本发明实施例中,在根据上述步骤304确定指定多媒体信息集合后,便可获取 指定多媒体信息集合的更新多媒体信息。由于在一轮更新过程中,仅抓取第一预测更新时 间小于当前时间的多媒体信息集合的多媒体信息,所W避免了全量更新时更新周期长、对 服务器的访问量过大而被封禁的缺陷。其中,在获取指定多媒体信息集合的更新多媒体信 息时,具体可采取下述方式实现:
[0121] 控制爬虫程序根据指定多媒体信息集合的地址信息,抓取指定多媒体信息集合对 应的网页;在网页中获取更新的多媒体信息。
[0122] 其中,爬虫程序可按照一定规则自动根据指定多媒体信息集合的地址信息抓取指 定多媒体信息集合对应的网页,并下载到本地。在该网页中包括了更定的多媒体信息。比 女口,包括最新更新剧集的集数标识(比如,20141010,第*集)、播放地址或下载地址等等。 因此,通过该网页便可获取到更新的多媒体信息。当然,除了采取上述方式获取更新的多媒 体信息的方式外,还可采取其他获取方式,本发明实施例对此不进行具体限定。
[0123] 需要说明的是,在抓取到更新的多媒体信息后,为了保证每一轮更新时抓取数据 的精准性,本发明实施例提供的方法还包括重置更新时间修正值的步骤。对于任一指定多 媒体信息集合来说,更新时间修正值的重置过程具体如下:
[0124] 第一步、获取修正时间步长和当前的更新时间修正值。
[0125] 针对该步,如前所示,修正时间步长n可根据需要进行调整,大小可为10分钟或15 分钟等等,本发明实施例对修正时间步长的大小不进行具体限定。更新时间修正值在每一 轮更新中均会发生变化。假设,当前的更新时间修正值为T (即在未根据更新时间修正值对 第二预测更新时刻进行修正之前,也即得到第一预测更新时刻之前),则当前的更新时间修 正值T便是在上一次更新后得到的。
[0126] 第二步、当第一预测更新时刻小于指定更新时刻时,根据当前的更新时间修正值 和修正时间步长之和,重置当前的更新时间修正值的大小,得到新的更新时间修正值;其 中,指定更新时刻为指定多媒体信息集合的实际更新时刻。
[0127] 针对该步,W第二预测更新时刻为A,指定更新时刻为B为例,则第一预测更新时 刻为A+T。当A巧<6时,则重置后的更新时间修正值为r =T+n。也即,新的更新时间修 正值为r。在下一次对该指定多媒体信息集合进行更新时,在计算出第二预测更新时刻A' 后,再加上新的更新时间修正值,便得到了第一预测更新时刻A'+T'。第一预测更新时刻此 时为A'巧+n。
[0128] 第H步、当第一预测更新时刻等于指定更新时刻时,根据当前的更新时间修正值 和修正时间步长之差,重置当前的更新时间修正值的大小,得到新的更新时间修正值。
[0129] 针对该步,继续W第二预测更新时刻为A,指定更新时刻为B为例,当A+T = B时, 则重置后的更新时间修正值为r =T-化。也即,新的更新时间修正值为T-化。在下一次 对该指定多媒体信息集合进行更新时,在计算出第二预测更新时刻A'后,再加上新的更新 时间修正值,便得到了第一预测更新时刻A'巧'。第一预测更新时刻此时为A'巧-2n。
[0130] 需要说明的是,在每一轮更新过程中根据上述第二步和第H步对更新时间修正值 进行重置后,最终该指定多媒体信息集合的更新时刻将收敛在2n的时间范围内。
[0131] 此外,上述步骤301至步骤305是针对多媒体信息集合中包括历史多媒体信息且 历史多媒体信息满足更新时间规则时的多媒体信息更新方式。针对多媒体信息集合中不包 括历史多媒体信息,或多媒体信息集合中包括历史多媒体信息但是历史多媒体信息不满足 更新时间规则的情况,本发明实施例采取下述步骤306至步骤308的方式对多媒体信息进 行更新。详细过程如下:
[0132] 306、每隔第二预设时长获取多媒体信息集合的更新数据。
[0133] 在本发明实施例中,W电视剧为例,没有历史多媒体信息的情况通常是指该电视 剧已经预计要播放,但是还未在电视平台或网络平台上进行播放;当前可能仅出了片花或 预告片;针对历史多媒体数据不满足更新时间规则来说,通常对应的情况是该电视剧为日 更剧,郝么该电视剧的更新日期便不用进行预测,仅需预测更新时刻即可。所W在执行完上 述步骤302后,直接执行该步骤。
[0134] 其中,第二预设时长通常为一天。当然,第二预设时长的大小除上述数值外,还可 为其他数值。比如,两天或H天等等,本发明实施例对第二预设时长的大小不进行具体限 定。
[0135] 307、在数据更新时长达到第H预设时长后,根据第H预设时长内每一个指定多媒 体信息的更新时间,统计多媒体信息集合的第二预测更新时间。
[0136] 在本发明实施例中,由于每隔第二预设时长便获取一次多媒体信息集合的更新数 据,所W在数据更新时长达到第H预设时长后,已更新的多媒体信息已经数量颇多了。对于 一个多媒体信息集合而言,便可根据每一个指定多媒体信息的更新时间,统计该多媒体信 息集合的第二预测更新时间。也即,对下一次数据更新时间进行预测。在对第二预测更新 时间进行统计时,可通过对每一个更新时间进行分析统计,并且制作分析统计表,根据该分 析统计表确定更新时间范围;之后,根据落入该更新时间范围内多个指定多媒体信息的更 新时间均值,确定第二预测更新时间。当然,除上述统计第二预测更新时间的方式外,还可 采取其他统计方式,本发明实施例对此不进行具体限定。
[0137] 其中,第H预设时长的大小通常为7天。当然,第H预设时长除上述数值外,还可 为其他数值,本发明实施例对此同样不进行具体限定。本发明实施例仅是W第H预设时长 为7天进行举例说明。
[013引 308、根据第二预测更新时间,获取更新的多媒体信息。
[0139] 该步骤同上述步骤305同理,此处不再赏述。
[0140] 需要说明的是,在根据上述步骤306至步骤308抓取到更新的多媒体信息后,为了 保证每一轮更新时抓取数据的精准性,本发明实施例提供的方法还包括重置更新时间修正 值的步骤。该重置更新时间修正值的步骤详见上述步骤305中的重置更新时间修正值的详 细说明过程。
[0141] 此外,在根据上述步骤301至步骤308对多媒体信息集合进行更新后,为了防止预 测出现遗漏,还可采取全量更新方式更新一次,即对还处于更新状态的全部多媒体信息集 合进行一次更新,W保证数据覆盖率,全面抓取更新数据。
[0142] 需要说明的是,无论针对上述获取更新多媒体信息方式中的哪一种,均会根据数 据源的不同而出现下述几种情形:
[0143] 第一种
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1