节目信息的标签生成方法与流程

文档序号:12310442阅读:999来源:国知局

本发明涉及数据处理技术领域,尤其涉及一种节目信息的标签生成方法。



背景技术:

随着用户的不断增长,资源内容的扩充,用户对影片的要求越来越严格,需求多样化,促使播放平台提供可定制和自动聚合生成的个性化标签变得尤为重要。

目前业内通常采用的对影片信息生成相关标签,目前主要包括人工维护和内容商提供这两种方式:

对于人工维护方式,通过运营手动录入对应标签,供平台接口调用返回。对于内容商提供的方式,则直接获取内容商提供的标签,反馈给用户。

但无论是采用上述哪种技术,都为人工维护或者依赖内容商,推荐信息单一,标签内容不统一,造成标签杂乱,对节目信息的管理、维护和查找的难度大。



技术实现要素:

本发明的目的是提供一种节目信息的标签生成方法,能够自动实现对节目信息的标签的多维度匹配,对于标签内容统一管理,使得节目信息的管理、维护和查询变得清晰简易,并且实现了标签库的自维护,不断实现标签库的自动完善。

为实现上述目的,本发明提供了一种节目信息的标签生成方法,包括:

获取节目数据,在知识库中匹配所述节目数据;

当匹配失败时,获取原始库中所述节目数据的原始库标签信息;所述原始库标签信息包括一个或多个的原始库标签字段;

将每个原始库标签字段在标签库进行查询匹配;所述标签库中存储多个标准标签字段;

如果匹配成功,则记录所述原始库标签字段对应的标准标签字段;

如果匹配失败,则将所述原始库标签字段存储在所述标签库中形成新的标准标签字段;

将根据每个原始库标签字段匹配得到的每个标准标签字段进行字段拼接,形成标签字段列;

对所述节目数据加载所述标签字段列,生成标准节目数据,并存储在聚合库中。

优选的,所述方法还包括:

根据所述标准节目数据生成节目同步数据发送给用户终端。

进一步优选的,所述方法还包括:

当在知识库中匹配所述节目数据成功时,获取知识库中的与所述节目数据相匹配的第一节目数据的知识库标签信息;

对所述节目数据加载所述知识库标签信息,并存储在所述聚合库中。

优选的,所述标准标签字段包括一级标签字段和二级标签字段;所述将每个原始库标签字段在标签库进行查询匹配具体包括:

所述将每个原始库标签字段在标签库的所述一级标签字段中进行查询匹配;

如果在所述一级标签字段中查询匹配失败,再在所述二级标签字段中进行查询匹配。

优选的,所述对所述节目数据加载所述标签字段列具体为:

根据所述标签字段列生成聚合库标签信息;

对所述节目数据加载所述聚合库标签信息。

本发明实施例提供的节目信息的标签生成方法,通过多维度匹配,能够自动实现对节目信息的标签内容统一管理,使得节目信息的管理、维护和查询变得清晰简易,并且实现了标签库的自维护,不断实现标签库的自动完善。

附图说明

图1为本发明实施例提供的节目信息的标签生成方法流程图。

具体实施方式

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

本发明实施例提供的节目信息的标签生成方法,用于节目信息管理系统中。通过对节目数据添加标签,可以方便用户进行节目查询,也方便节目数据提供商或者节目平台的管理者进行节目数据的管理和维护。

图1为本发明实施例提供的节目信息的标签生成方法的流程图,根据图1所示,该方法主要通过如下步骤来实现:

步骤110,获取节目数据,在知识库中匹配所述节目数据;

具体的,在知识库中,记录有已经积累到的影片数据的节目信息、编排属性等,具体可以包括演员姓名、导演姓名、影片名称等等信息。根据这些信息,可以对节目数据进行匹配查询,确定该节目数据是否已经被记录过。

步骤120,当匹配失败时,获取原始库中节目数据的原始库标签信息;

具体的,如果匹配失败,则该影片数据是未被积累过的数据,直接获取该影片数据的原始库标签信息。其中原始库标签信息包括一个或多个的原始库标签字段。标签字段用以记录不同的标签信息。

标签信息可以包括与影片内容相关的标签信息,也可以包括用以对影片进行分类的自定义标签。

比如与影片内容相关的标签信息可以例如,标识影片类型的标签“动作片”、“剧情片”、“爱情片”、“儿童片”等等;

还可以包括上映年份的标签,比如“1995”、“2016”等;

另外还可以包括影片主演姓名、导演姓名等等。

上述每一个标签实质上是一个标签字段,标签由标签字段拼接形成。

而对影片进行分类的自定义标签可以是内容商或者节目平台管理者定义产生的,也可以是根据用户信息大数据收集后分析生成的,例如自定义标签可以包括“80后”、“90后”、“宅男”等等。同样的,这些也属于标签字段。

步骤130,将每个原始库标签字段在标签库进行查询匹配,确定是否匹配成功;

其中,标签库中存储有多个标准标签字段,对于原始库标签信息中的每一个原始库标签字段,都要在标签库中进行与标准标签字段的匹配。

如果匹配成功,执行步骤140;如果匹配失败,执行步骤150。

匹配依据预设的匹配规则进行,比如通过关键字识别来执行匹配。

例如,表示影片类型的原始库标签字段为“动作影片”,标签库中具有标准标签字段“动作片”,则根据预设匹配规则,识别它们的关键字都为“动作”,认为匹配成功。

又如,表示电影主演名称的原始库标签字段为“hugh﹒格兰特”,标签库中具有标准标签字段“休﹒格兰特”,则根据预设匹配规则,识别它们的关键字都为“格兰特”,并且预设匹配规则“hugh”与“休”具有对应关系,认为匹配成功。

此外,可以设定一个标准标签字段包括一级标签字段和二级标签字段;比如一级标签字段是规范化的标签名称,而二级标签字段是别名。

因此可以将每个原始库标签字段在标签库的所述一级标签字段中进行查询匹配;如果在所述一级标签字段中查询匹配失败,再在所述二级标签字段中进行查询匹配。

根据匹配成功的一级标签字段或者二级标签字段对应的一级标签字段输出匹配结果。

步骤140,记录原始库标签字段对应的标准标签字段;

当匹配成功时,将匹配得到的标准标签字段进行记录。

步骤150,将原始库标签字段存储在标签库中形成新的标准标签字段;

当匹配失败时,根据原始库标签字段生成新的标准标签字段,并存储在标签库中。从而实现标签库的自维护,实现不断的自动完善。

步骤160,将根据每个原始库标签字段匹配得到的每个标准标签字段进行字段拼接,形成标签字段列;

比如,一个节目数据的原始库标签信息包括多个的原始库标签字段,其中部分字段在标签库中匹配成功,采用上述步骤140的方法得到对应的标准标签字段,部分字段在标签库中匹配不成功,采用上述步骤150的方法得到对应的标准标签字段,即新的标准标签字段。

步骤170,对节目数据加载所述标签字段列,生成标准节目数据,并存储在聚合库中。

具体的,在聚合库中可以记录有节目数据的基础信息,比如影片名称、导演、主演姓名等信息,以及内容商的属性信息等等。通过标签字段拼接形成的标签字段列,可以确定这些信息。

在这之后,可以根据所述标准节目数据生成节目同步数据发送给用户终端。节目同步数据可以是可扩展标记语言(xml)格式数据。通过该数据可以在终端侧生成用以展示的页面。

此外,在步骤110之后,如果在知识库中匹配节目数据成功时,还可以直接执行下述步骤180和190。

步骤180,当匹配节目数据成功时,获取知识库中的与节目数据相匹配的第一节目数据的知识库标签信息;

步骤190,对节目数据加载知识库标签信息,并存储在聚合库中。

也就是说,如果知识库中已经记录有与节目数据相匹配的另一节目数据,则直接获得其知识库标签信息。

本发明实施例提供的节目信息的标签生成方法,用于节目信息管理系统中。通过对节目数据添加标签,可以方便用户进行节目查询,也方便节目数据提供商或者节目平台的管理者进行节目数据的管理和维护。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1