节目信息的聚合处理方法与流程

文档序号:12890352阅读:514来源:国知局

本发明涉及数据处理技术领域,尤其涉及一种节目信息的聚合处理方法。



背景技术:

随着计算机技术的发展,越来越多的用户开始使用互联网视频业务。而随着用户的不断增长,资源内容的扩充,用户对影片的要求越来越严格,需求多样化,

在互联网视频业务中,节目片源来源众多,管理、维护繁琐,对不同类型的节目其处理方法也不同,而有些节目源需要进行打包,即聚合处理,之后再提供给用户。

目前在节目进行打包过程中多为运营的系统维护人员对节目片源进行手工打包,操作效率低,维护难度大。



技术实现要素:

本发明的目的是提供一种节目信息的聚合处理方法,能够自动实现对节目信息的类型分拣,并对不同获取渠道、不同类型的节目信息,自动确定是否需要进行聚合处理。即对于来源多样化的节目信息,形成出口统一的输出规范,大大提高了系统中节目片源的维护管理效率。

为实现上述目的,本发明提供了一种节目信息的聚合处理方法,包括:

获取节目数据;所述节目数据具有原始库节目id;

根据所述节目数据的分类属性,确定所述节目数据是否需要聚合;

当确定需要聚合时,根据所述原始库节目id在聚合库中查询是否已经存在所述节目数据的节目信息;

如果不存在,则获取原始库中所述节目数据的原始库标签信息;所述原始库标签信息包括一个或多个的原始库标签字段;

根据所述节目数据的原始库标签字段在知识库中匹配所述节目数据;

当所述匹配失败时,将所述节目数据添加到所述知识库中,生成知识库节目id;

根据所述知识库的所述节目数据生成节目信息,输出至聚合库进行存储;并且,将所述节目数据在所述聚合库中存储为标准节目数据。

优选的,所述方法还包括:当确定不需要聚合时,将所述节目数据添加至所述聚合库,存储为标准节目数据。

优选的,所述方法还包括:

当所述匹配成功时,获取所述知识库中与所述节目数据相匹配的第一节目数据的第一节目id,并根据所述第一节目id对应的节目信息输出至所述聚合库。

优选的,所述方法还包括:

将所述第一节目数据添加至所述聚合库,存储为标准节目数据。

优选的,在所述根据所述节目数据的分类属性,确定所述节目数据是否需要聚合之前,所述方法还包括:配置预设规则。

优选的,所述根据所述节目数据的分类属性,确定所述节目数据是否需要聚合具体包括:

根据所述预设规则,确定所述节目数据的分类属性所对应的数据处理规则;所述数据处理规则包括聚合处理或不聚合处理;

当所述节目数据的分类属性对应的数据处理规则为聚合处理,则确定所述节目数据需要聚合;否则,确定所述节目数据不需要聚合。

进一步优选的,所述方法还包括:根据所述标准节目数据生成节目同步数据发送给用户终端。

本发明实施例提供的节目信息的聚合处理方法,能够自动实现对节目信息的类型分拣,并对不同获取渠道、不同类型的节目信息,自动确定是否需要进行聚合处理。即对于来源多样化的节目信息,形成出口统一的输出规范,大大提高了系统中节目片源的维护管理效率。

附图说明

图1为本发明实施例提供的节目信息的聚合处理方法流程图。

具体实施方式

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

本发明实施例提供的节目信息的聚合处理方法,用于节目信息管理系统中。

图1为本发明实施例提供的节目信息的聚合处理方法的流程图,根据图1所示,该方法主要通过如下步骤来实现:

步骤110,获取节目数据;

具体的,节目数据可以包括有不同来源的节目数据,比如由内容供应商提供的节目数据、由运营商提供的自有节目数据,以及从互联网获取的节目数据。无论是哪一种,节目数据都具有原始库节目id。

这个原始库节目id是片源的唯一识别id。

步骤120,根据节目数据的分类属性,确定节目数据是否需要聚合;

具体的,在系统中预先配置有预设规则,用以规定哪些类型的数据需要聚合,那些不需要聚合。在具体的实现中可以通过节目数据的分类属性来进行识别。

比如新闻类、购物广告类的视音频数据可以设定为不需要聚合,影片的视音频数据可以设定为聚合。除了可以按照内容进行分类,还可以按照数据来源进行分类。比如来自于内容供应商的数据可以设定为需要聚合,而来自于运营商的自有内容数据可以设定为不需要聚合。

这些都可以通过设定分类属性来进行区分。当识别节目数据的分类属性对应的数据处理规则为聚合处理,则确定节目数据需要聚合;否则,确定节目数据不需要聚合。

当确定需要聚合时,执行步骤130;当确定不需要聚合时,执行步骤190。

步骤130,根据原始库节目id在聚合库中查询是否已经存在节目数据的节目信息;

具体的,如果聚合库中已经存在有原始库节目id,则说明节目不再需要聚合。如果聚合库中已经有了节目数据的原始库节目id,说明已经存在该节目数据,则流程直接结束。这样可以避免已有节目被覆盖。

如果不存在,执行步骤140。

步骤140,获取原始库中节目数据的原始库标签信息;

具体的,原始库标签信息包括一个或多个的原始库标签字段;标签字段用以记录不同的标签信息。

标签字段可以包括与影片内容相关的标签信息,也可以包括用以对影片进行分类的自定义标签字段。

比如与影片内容相关的标签字段可以例如,标识影片类型的“动作片”、“剧情片”、“爱情片”、“儿童片”等等;

还可以包括上映年份的,比如“1995”、“2016”等;

另外还可以包括影片主演姓名、导演姓名等等。

标签由标签字段拼接形成。

而对影片进行分类的自定义标签可以是内容商或者节目平台管理者定义产生的,也可以是根据用户信息大数据收集后分析生成的,例如自定义标签可以包括“80后”、“90后”、“宅男”等等。同样的,这些也属于标签字段。

步骤150,根据节目数据的原始库标签字段在知识库中匹配节目数据;

具体的,在知识库中,记录有已经积累到的影片数据的节目信息、编排属性等,具体可以包括演员姓名、导演姓名、影片名称、上映日期等等信息。根据这些信息,可以对节目数据进行匹配查询,确定该节目数据是否已经被记录过。

可以预先设定匹配规则,比如标签字段的匹配率达到80%即可认为匹配成功,否则认为匹配失败。

步骤160,当匹配失败时,将节目数据添加到知识库中,生成知识库节目id;

如果匹配失败,则说明该节目数据没有被记录过,将该节目数据在知识库中进行添加,以实现内容的积累。

对添加到知识库中的节目数据生成知识库节目id。

步骤170,根据知识库的节目数据生成节目信息,输出至聚合库进行存储;并且,将节目数据在聚合库中存储为标准节目数据。

具体的,在步骤160之后,从知识库中继承节目信息到聚合库。

在步骤150之后,当匹配成功时,执行步骤180,当匹配成功时,获取知识库中与节目数据相匹配的第一节目数据的第一节目id,并根据第一节目id对应的节目信息输出至聚合库。

此外还可以将第一节目数据添加至聚合库,存储为标准节目数据。

在步骤120之后,当确定不需要聚合时,执行步骤190,将节目数据添加至聚合库,存储为标准节目数据。

在得到标准节目数据之后,可以根据标准节目数据生成节目同步数据发送给用户终端。节目同步数据可以是可扩展标记语言(xml)格式数据。通过该数据可以在终端侧生成用以展示的页面。

本发明实施例提供的节目信息的聚合处理方法,能够自动实现对节目信息的类型分拣,并对不同获取渠道、不同类型的节目信息,自动确定是否需要进行聚合处理。即对于来源多样化的节目信息,形成出口统一的输出规范,大大提高了系统中节目片源的维护管理效率。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1