一种节目关键词的图谱生成方法及装置的制造方法

文档序号:10687842阅读:182来源:国知局
一种节目关键词的图谱生成方法及装置的制造方法
【专利摘要】本发明公开了一种节目关键词的图谱生成方法及装置,用于将提取的节目的关键词以关键词图谱的形式展示出来。所述方法包括:提取各节目的关键词;获取与各所述关键词对应的用户相关信息;获取各所述关键词与其他关键词同时出现的次数;根据各所述关键词对应的用户相关信息以及各所述关键词与其他关键词同时出现的次数,生成关键词图谱。该方案可以将提取的节目的关键词以关键词图谱的形式展示出来,从而使得广告主在通过所述关键词图谱充分了解各关键词的情况下,根据需要选择节目的关键词投放广告,其操作过程简便,提升了用户体验。
【专利说明】
一种节目关键词的图谱生成方法及装置
技术领域
[0001 ]本发明涉及节目关键词领域,特别涉及一种节目关键词的图谱生成方法及装置。 【背景技术】
[0002]随着科学技术的发展及人民生活水平的提高,观赏各种类型的节目已经成为人们工作、学习、社交以及休闲娱乐不可替代的重要方式。随着用户使用频率的增多以及用户要求的提高,为各类用户提供的节目信息和内容也越来越广泛,服务商针对不同的频道的节目会提供不同的关键词以供用户进行参考,比如,令想要在节目中投放广告的广告主根据该关键词进行广告投放。但在目前尚缺少一种简单快捷且准确的关键词展示方法,因此广告主无法获取到关键词的观众喜好程度及用户分布。
【发明内容】

[0003]本发明提供一种节目关键词的图谱生成方法及装置,可以将提取的节目的关键词以关键词图谱的形式展示出来,从而使得广告主在通过所述关键词图谱充分了解各关键词的情况下,根据需要选择节目的关键词投放广告,其操作过程简便,提升了用户体验。
[0004]根据本发明实施例的第一方面,提供一种节目关键词的图谱生成方法,包括:
[0005]提取各节目的关键词;
[0006]获取与各所述关键词对应的用户相关信息;
[0007]获取各所述关键词与其他关键词同时出现的次数;
[0008]根据各所述关键词对应的用户相关信息以及各所述关键词与其他关键词同时出现的次数,生成关键词图谱。
[0009]在一个实施例中,所述与各所述关键词对应的用户相关信息包括:与各所述关键词对应的互动活动的参与用户的数量、与各所述关键词对应的节目的观看用户的数量或通过各所述关键词进行投放的广告数量。
[0010]在一个实施例中,所述根据各所述关键词对应的用户相关信息以及各所述关键词与其他关键词同时出现的次数,生成关键词图谱,包括:
[0011]将各所述关键词对应的用户相关信息以预设图形显示在所述关键词图谱上,且令所述用户相关信息的多少与所述预设图形的大小相对应;
[0012]将各所述关键词与其他关键词同时出现的次数以所述预设图形的远近关系显示在所述关键词图谱上,且令同时出现的次数的多少与所述预设图形的距离相对应。
[0013]在一个实施例中,所述提取各节目的关键词,包括:
[0014]获取各节目的节目相关信息,所述节目相关信息包括节目字幕、节目标签和节目语音信息;
[0015]从所述节目的相关信息中,每隔一个预设时长提取一组关键词;
[0016]根据预设统计规则,自所述节目的节目时长之内的多组关键词中提取所述节目的关键词。
[0017]在一个实施例中,所述根据预设统计规则,自所述节目的节目时长之内的多组关键词中提取所述节目的关键词,包括:
[0018]统计所述节目的节目时长之内的多组关键词中,每个关键词重复出现的总次数;
[0019]统计每个关键词与其他关键词同时出现的次数;
[0020]将每个关键词重复出现的总次数与每个关键词与其他关键词同时出现的次数进行加权求和并进行排序;
[0021]获取排序后名次在预设名次之内的关键词,并将其记录为所述节目的关键词。
[0022]根据本发明实施例的第二方面,还提供一种节目关键词的图谱生成装置,包括:
[0023]提取模块,用于提取各节目的关键词;
[0024]第一获取模块,用于获取与各所述关键词对应的用户相关信息;
[0025]第二获取模块,用于获取各所述关键词与其他关键词同时出现的次数;
[0026]图谱生成模块,用于根据各所述关键词对应的用户相关信息以及各所述关键词与其他关键词同时出现的次数,生成关键词图谱。
[0027]在一个实施例中,所述与各所述关键词对应的用户相关信息包括:与各所述关键词对应的互动活动的参与用户的数量、与各所述关键词对应的节目的观看用户的数量或通过各所述关键词进行投放的广告数量。
[0028]在一个实施例中,所述图谱生成模块包括:
[0029]第一显示子模块,用于将各所述关键词对应的用户相关信息以预设图形显示在所述关键词图谱上,且令所述用户相关信息的多少与所述预设图形的大小相对应;
[0030]第二显示子模块,用于将各所述关键词与其他关键词同时出现的次数以所述预设图形的远近关系显示在所述关键词图谱上,且令同时出现的次数的多少与所述预设图形的距离相对应。
[0031 ]在一个实施例中,所述提取模块包括:
[0032]获取子模块,用于获取各节目的节目相关信息,所述节目相关信息包括节目字幕、节目标签和节目语音信息;
[0033]第一提取子模块,用于从所述节目的相关信息中,每隔一个预设时长提取一组关键词;
[0034]第二提取子模块,用于根据预设统计规则,自所述节目的节目时长之内的多组关键词中提取所述节目的关键词。
[0035]在一个实施例中,所述第二提取子模块包括:
[0036]第一统计单元,用于统计所述节目的节目时长之内的多组关键词中,每个关键词重复出现的总次数;
[0037]第二统计单元,用于统计每个关键词与其他关键词同时出现的次数;
[0038]排序单元,用于将每个关键词重复出现的总次数与每个关键词与其他关键词同时出现的次数进行加权求和并进行排序;
[0039]获取单元,用于获取排序后名次在预设名次之内的关键词,并将其记录为所述节目的关键词。
[0040]本发明实施例提供的技术方案可产生以下有益效果:提取各节目的关键词;获取与各所述关键词对应的用户相关信息;获取各所述关键词与其他关键词同时出现的次数;根据各所述关键词对应的用户相关信息以及各所述关键词与其他关键词同时出现的次数, 生成关键词图谱。该方案可以将提取的节目的关键词以关键词图谱的形式展示出来,从而使得广告主在通过所述关键词图谱充分了解各关键词的情况下,根据需要选择节目的关键词投放广告,其操作过程简便,提升了用户体验。
[0041]本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0042]下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。【附图说明】[〇〇43]附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
[0044]在附图中:
[0045]图1为本发明根据一示例性实施例示出的一种节目关键词的图谱生成方法的流程图。
[0046]图2为本发明根据一示例性实施例示出的一种节目关键词的图谱生成方法的步骤 S40的流程图。
[0047]图3为本发明根据一示例性实施例示出的一种节目关键词的图谱生成装置的框图。
[0048]图4为本发明根据一示例性实施例示出的一种节目关键词的图谱生成装置的统计模块63的框图。
[0049]图5为本发明根据一示例性实施例示出的一种节目关键词的图谱生成装置的获取模块61框图。[〇〇5〇]图6为本发明根据一示例性实施例示出的一种节目关键词的图谱生成装置中提取模块62的框图。图7为本发明根据一示例性实施例示出的一种节目关键词的图谱生成装置中提取模块 61的框图;图8为本发明根据一示例性实施例示出的一种节目关键词的图谱生成装置中第二提取子模块613的框图。【具体实施方式】
[0051]以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0052]本公开实施例提供了一种节目关键词的图谱生成方法,用于将提取的节目的关键词以关键词图谱的形式展示出来,从而使得广告主在通过所述关键词图谱充分了解各关键词的情况下,根据需要选择节目的关键词投放广告,其操作过程简便,提升了用户体验。如图1所示,该方法包括步骤S10-S40:[〇〇53]在步骤S10中,提取各节目的关键词。[〇〇54]在一个实施例中,如图3所示,所述步骤S10包括:
[0055]步骤SlOl、获取各节目的节目相关信息,所述节目相关信息包括节目字幕、节目标签和节目语音信息;可理解的,所述节目的相关信息还可以包括节目中人物的配饰、穿戴等物品或者节目中出现的其他物品和观众关注的名词等相关信息,只要与广告主想要投放的广告相关即可。在一个实施例中,所述节目标签包括节目名称、节目简介、节目类型和节目相关人员。可理解的,所述节目标签还可以根据用户需要进行设定。在一个实施例中,获取节目的相关信息时,所述节目相关信息中的节目语音信息需要先转换为文字,之后再在后续步骤中进行关键词的提取,可理解的,可以先获取该节目语音信息之后再将其转换为文字,也可以等待该节目语音信息转换为文字之后再进行获取。
[0056]步骤S102、从所述节目的相关信息中,每隔一个预设时长提取一组关键词;其中,所述预设时长可以根据用户需要进行设定,比如,设定为一分钟,此时,每隔一分钟就会从所述节目的相关信息中获取一组关键词,以便于后续进行统计。且一组关键词中关键词最后保留的数量也可以根据用户需求进行设定,也可以根据预设的条件获取所有的关键词。在一个实施例中,采用Tf-1df算法(一种用于信息检索与数据挖掘的加权统计方法)从所述节目的相关信息中筛选出一组所述预设时长之内的关键词。当然,可理解的,所述Tf-1df算法也可以用其他适用的算法来进行替换,只要能达到提取关键词的需求即可。其中,所述预设时长可以根据用户需要进行设定,比如,设定为一分钟,此时,每隔一分钟就会采用Tf-1df 算法从所述节目的相关信息中获取一组关键词,以便于后续进行统计。
[0057]步骤S103、根据预设统计规则,自所述节目的节目时长之内的多组关键词中提取所述节目的关键词。可理解的,当所述节目的节目时长比所述预设时长还短时,所述关键词可能只有一组。所述预设的统计规则可以根据用户需求进行设定。
[0058]在一个实施例中,如图4所示,所述步骤S103包括:
[0059]步骤S1031、统计所述节目的节目时长之内的多组关键词中,每个关键词重复出现的总次数;可理解的,当所述节目的节目时长比所述预设时长还短时,所述关键词可能只有一组。在该步骤中,会统计多组关键词中每个关键词重复出现的总次数,出现的次数越多,说明该关键词的越受观众关注,对于广告主来说该关键词价值越高。
[0060]步骤S1032、统计每个关键词与其他关键词同时出现的次数;在该步骤中,会统计每个关键词与其他关键词同时出现的次数,同时出现的次数越多,说明该关键词与其他关键词的联系越紧密。
[0061]步骤S1033、将每个关键词重复出现的总次数与每个关键词与其他关键词同时出现的次数进行加权求和并进行排序;可理解的,两者加权的权值可以根据需要进行定义。
[0062]步骤S1034、获取排序后名次在预设名次之内的关键词,并将其记录为所述节目的关键词。其中,所述预设名次可以根据需要进行设定,比如设定预设名次为前十,那么,排序在前十的关键词为该节目的关键词。
[0063]在步骤S20中,获取与各所述关键词对应的用户相关信息;在一个实施例中,所述与各所述关键词对应的用户相关信息包括:与各所述关键词对应的互动活动的参与用户的数量、与各所述关键词对应的节目的观看用户的数量或通过各所述关键词进行投放的广告数量。可理解的,所述用户相关信息也可以包括其他与该关键词对应的用户信息,比如与各所述关键词对应的节目的观看用户的地域分布、与各所述关键词对应的互动活动的参与用户的地域分布等等。
[0064]在步骤S30中,获取各所述关键词与其他关键词同时出现的次数;每个关键词与其他关键词同时出现的次数越多,说明该关键词与其他关键词的联系越紧密。
[0065]在步骤S40中,根据各所述关键词对应的用户相关信息以及各所述关键词与其他关键词同时出现的次数,生成关键词图谱。[〇〇66] 在一个实施例中,如图2所示,所述步骤S40包括:[〇〇67]步骤S401、将各所述关键词对应的用户相关信息以预设图形显示在所述关键词图谱上,且令所述用户相关信息的多少与所述预设图形的大小相对应;其中,所述预设图形可以根据需要设置,比如可以设置为圆圈或者方块等所有可以进行比较大小和距离的图形, 当所述预设图形为圆圈时,代表一个关键词的圆圈越大,说明其对应的用户相关信息数量越大(比如,与各所述关键词对应的互动活动的参与用户的数量越多、与各所述关键词对应的节目的观看用户的数量越多或通过各所述关键词进行投放的广告数量越多等)。[〇〇68]步骤S402、将各所述关键词与其他关键词同时出现的次数以所述预设图形的远近关系显示在所述关键词图谱上,且令同时出现的次数的多少与所述预设图形的距离相对应。可理解的,分别代表两个关键词的所述预设图形距离越近说明两个关键词之间的关系越近,联系越紧密。
[0069]本发明实施例提供的上述方法,提取各节目的关键词;获取与各所述关键词对应的用户相关信息;获取各所述关键词与其他关键词同时出现的次数;根据各所述关键词对应的用户相关信息以及各所述关键词与其他关键词同时出现的次数,生成关键词图谱。该方案可以将提取的节目的关键词以关键词图谱的形式展示出来,从而使得广告主在通过所述关键词图谱充分了解各关键词的情况下,根据需要选择节目的关键词投放广告,其操作过程简便,提升了用户体验。
[0070]对应本发明实施例提供的节目关键词的图谱生成方法,本发明还提供节目关键词的图谱生成装置,如图5所示,该装置可包括:[0071 ]提取模块61,用于提取各节目的关键词;[〇〇72]第一获取模块62,用于获取与各所述关键词对应的用户相关信息;
[0073]第二获取模块63,用于获取各所述关键词与其他关键词同时出现的次数;
[0074]图谱生成模块64,用于根据各所述关键词对应的用户相关信息以及各所述关键词与其他关键词同时出现的次数,生成关键词图谱。
[0075]在一个实施例中,所述与各所述关键词对应的用户相关信息包括:与各所述关键词对应的互动活动的参与用户的数量、与各所述关键词对应的节目的观看用户的数量或通过各所述关键词进行投放的广告数量。[〇〇76]在一个实施例中,如图6所示,所述图谱生成模块64包括:[〇〇77]第一显示子模块641,用于将各所述关键词对应的用户相关信息以预设图形显示在所述关键词图谱上,且令所述用户相关信息的多少与所述预设图形的大小相对应; [〇〇78]第二显示子模块642,用于将各所述关键词与其他关键词同时出现的次数以所述预设图形的远近关系显示在所述关键词图谱上,且令同时出现的次数的多少与所述预设图形的距离相对应。[〇〇79]在一个实施例中,如图7所示,所述提取模块61包括:
[0080]获取子模块611,用于获取各节目的节目相关信息,所述节目相关信息包括节目字幕、节目标签和节目语音信息;
[0081]第一提取子模块612,用于从所述节目的相关信息中,每隔一个预设时长提取一组关键词;
[0082]第二提取子模块613,用于根据预设统计规则,自所述节目的节目时长之内的多组关键词中提取所述节目的关键词。
[0083]在一个实施例中,如图8所示,所述第二提取子模块613包括:
[0084]第一统计单元6131,用于统计所述节目的节目时长之内的多组关键词中,每个关键词重复出现的总次数;
[0085]第二统计单元6132,用于统计每个关键词与其他关键词同时出现的次数;
[0086]排序单元6133,用于将每个关键词重复出现的总次数与每个关键词与其他关键词同时出现的次数进行加权求和并进行排序;
[0087]获取单元6134,用于获取排序后名次在预设名次之内的关键词,并将其记录为所述节目的关键词。
[0088]本发明实施例提供的上述装置,可以将提取的节目的关键词以关键词图谱的形式展示出来,从而使得广告主在通过所述关键词图谱充分了解各关键词的情况下,根据需要选择节目的关键词投放广告,其操作过程简便,提升了用户体验。
[0089]本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0090]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序请求实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序请求到通用计算机、专用计算机、嵌入式处理机或其他可编程信息处理设备的处理器以产生一个机器,使得通过计算机或其他可编程信息处理设备的处理器执行的请求产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0091]这些计算机程序请求也可存储在能引导计算机或其他可编程信息处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的请求产生包括请求装置的制造品,该请求装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0092]这些计算机程序请求也可装载到计算机或其他可编程信息处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的请求提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0093]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【主权项】
1.一种节目关键词的图谱生成方法,其特征在于,包括:提取各节目的关键词;获取与各所述关键词对应的用户相关信息;获取各所述关键词与其他关键词同时出现的次数;根据各所述关键词对应的用户相关信息以及各所述关键词与其他关键词同时出现的 次数,生成关键词图谱。2.如权利要求1所述的方法,其特征在于,所述与各所述关键词对应的用户相关信息包 括:与各所述关键词对应的互动活动的参与用户的数量、与各所述关键词对应的节目的观 看用户的数量或通过各所述关键词进行投放的广告数量。3.如权利要求1所述的方法,其特征在于,所述根据各所述关键词对应的用户相关信息 以及各所述关键词与其他关键词同时出现的次数,生成关键词图谱,包括:将各所述关键词对应的用户相关信息以预设图形显示在所述关键词图谱上,且令所述 用户相关信息的多少与所述预设图形的大小相对应;将各所述关键词与其他关键词同时出现的次数以所述预设图形的远近关系显示在所 述关键词图谱上,且令同时出现的次数的多少与所述预设图形的距离相对应。4.如权利要求1所述的方法,其特征在于,所述提取各节目的关键词,包括:获取各节目的节目相关信息,所述节目相关信息包括节目字幕、节目标签和节目语音 信息;从所述节目的相关信息中,每隔一个预设时长提取一组关键词;根据预设统计规则,自所述节目的节目时长之内的多组关键词中提取所述节目的关键。5.如权利要求4所述的方法,其特征在于,所述根据预设统计规则,自所述节目的节目 时长之内的多组关键词中提取所述节目的关键词,包括:统计所述节目的节目时长之内的多组关键词中,每个关键词重复出现的总次数;统计每个关键词与其他关键词同时出现的次数;将每个关键词重复出现的总次数与每个关键词与其他关键词同时出现的次数进行加 权求和并进行排序;获取排序后名次在预设名次之内的关键词,并将其记录为所述节目的关键词。6.—种节目关键词的图谱生成装置,其特征在于,包括:提取模块,用于提取各节目的关键词;第一获取模块,用于获取与各所述关键词对应的用户相关信息;第二获取模块,用于获取各所述关键词与其他关键词同时出现的次数;图谱生成模块,用于根据各所述关键词对应的用户相关信息以及各所述关键词与其他 关键词同时出现的次数,生成关键词图谱。7.如权利要求6所述的装置,其特征在于,所述与各所述关键词对应的用户相关信息包 括:与各所述关键词对应的互动活动的参与用户的数量、与各所述关键词对应的节目的观 看用户的数量或通过各所述关键词进行投放的广告数量。8.如权利要求6所述的装置,其特征在于,所述图谱生成模块包括:第一显示子模块,用于将各所述关键词对应的用户相关信息以预设图形显示在所述关键词图谱上,且令所述用户相关信息的多少与所述预设图形的大小相对应; 第二显示子模块,用于将各所述关键词与其他关键词同时出现的次数以所述预设图形的远近关系显示在所述关键词图谱上,且令同时出现的次数的多少与所述预设图形的距离相对应。9.如权利要求6所述的装置,其特征在于,所述提取模块包括: 获取子模块,用于获取各节目的节目相关信息,所述节目相关信息包括节目字幕、节目标签和节目语音信息; 第一提取子模块,用于从所述节目的相关信息中,每隔一个预设时长提取一组关键词;第二提取子模块,用于根据预设统计规则,自所述节目的节目时长之内的多组关键词中提取所述节目的关键词。10.如权利要求9所述的装置,其特征在于,所述第二提取子模块包括: 第一统计单元,用于统计所述节目的节目时长之内的多组关键词中,每个关键词重复出现的总次数; 第二统计单元,用于统计每个关键词与其他关键词同时出现的次数; 排序单元,用于将每个关键词重复出现的总次数与每个关键词与其他关键词同时出现的次数进行加权求和并进行排序; 获取单元,用于获取排序后名次在预设名次之内的关键词,并将其记录为所述节目的关键词。
【文档编号】G06F17/30GK106056406SQ201610378141
【公开日】2016年10月26日
【申请日】2016年5月31日
【发明人】章杰
【申请人】无锡天脉聚源传媒科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1