一种基于用户热词的媒体节目素材推荐方法及系统与流程

文档序号:12479223阅读:208来源:国知局
一种基于用户热词的媒体节目素材推荐方法及系统与流程

本发明涉及广电技术领域,尤其涉及一种基于用户热词的媒体节目素材推荐方法及系统。



背景技术:

电视媒体在节目制作过程中,要选取相关素材来对所制作节目进行完善,传统的节目制作过程中,用户可以通过媒体素材库或者互联网资源获取相关素材。

前者用户只能获取素材库中的有限素材,在使用过程中存在很大的局限性,对于某些未收录素材就很难获得;后者面对海量的互联网资源,用户很难从中作出取舍,也很难获得较为合理的素材内容。并且两种方法的主观性都较强,无法在素材选择方面满足大部分用户的喜好。



技术实现要素:

本发明的目的在于提供基于用户热词的媒体节目素材推荐方法及系统,在制作素材的选择过程中,能够与媒体用户的实时喜好想结合,为媒体工作者提供一种具有时效性的,基于热词统计的素材推荐方法。

为达到上述目的,一方面,本发明实施例提供一种基于用户热词的媒体节目素材推荐方法,包括:

获取媒体与用户交互时产生的用户文本;

将该用户文本进行分词得到用户交互词表,并统计所述用户交互词表中的各用户交互词的热度值;

筛选所述用户交互词表中,热度值达到预设阈值和/或达到预设热度值排名的用户交互词作为热词;

获取进行分词之前所述热词对应的用户文本,并根据所述热词对应的用户文本确定用户关注热点;

根据所述用户关注热点推荐媒体节目素材。

优选的,所述将所述用户文本进行分词之后还包括:

对分词之后得到的用户交互词表进行单字词过滤,以将单字词语过滤出所述用户交互词表。

优选的,所述将所述用户文本进行分词之后还包括:对分词之后得到的用户交互词表进行无意义词过滤,以将无意义词过滤出所述用户交互词表。

优选的,所述将所述用户文本进行分词之前,还包括:将专有名词添加到分词词库。

另一方面,本发明实施例提供一种基于用户热词的媒体节目素材推荐系统,包括:

用户文本获取单元,用于获取媒体与用户交互时产生的用户文本;

分词单元,用于将该用户文本进行分词得到用户交互词表,并统计所述用户交互词表中的各用户交互词的热度值;

热词筛选单元,用于筛选所述用户交互词表中,热度值达到预设阈值和/或达到预设热度值排名的用户交互词作为热词;

原始文本匹配单元,用于获取进行分词之前所述热词对应的用户文本,并根据所述热词对应的用户文本确定用户关注热点;

素材推荐单元,用于根据所述用户关注热点推荐媒体节目素材。

可选的,还包括:

单字词语过滤单元,用于所述将所述用户文本进行分词之后,对分词之后得到的用户交互词表进行单字词过滤,以将单字词语过滤出所述用户交互词表。

可选的,还包括:

无意义词过滤单元,用于所述将所述用户文本进行分词之后,对分词之后得到的用户交互词表进行无意义词过滤,以将无意义词过滤出所述用户交互词表。

优选的,还包括专有名词添加单元,用于将专有名词添加到分词词库。

另一方面,本发明实施例提供一种媒体节目素材推荐方法,包括:

获取媒体与用户交互时产生的用户文本;

将该用户文本进行分词得到用户交互词表,并统计所述用户交互词表中的各用户交互词的热度值;

根据热度值高的用户交互词推荐媒体节目素材。

另一方面,本发明实施例提供一种媒体节目素材推荐系统,包括:

用户文本获取单元,用于获取媒体与用户交互时产生的用户文本;

分词单元,用于将该用户文本进行分词得到用户交互词表,并统计所述用户交互词表中的各用户交互词的热度值;

素材推荐单元,用于根据热度值高的用户交互词推荐媒体节目素材。

上述技术方案具有如下有益效果:通过获取采媒体与用户交互时产生的用户文本,并将该用户文本进行分词得到用户交互词表,并统计所述用户交互词表中的各用户交互词的热度值;最后根据热度值高的用户交互词推荐媒体节目素材,在节目制作的过程中,将素材的推荐与媒体用户的实时喜好相结合,可满足大部分用户的实时满意度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例一种基于用户热词的媒体节目素材推荐方法的流程示意图;

图2是本发明实施例一种基于用户热词的媒体节目素材推荐系统的结构示意图;

图3是本发明实施例一种媒体节目素材推荐方法的流程示意图;

图4是本发明实施例一种媒体节目素材推荐系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

图1是本发明实施例一种基于用户热词的媒体节目素材推荐方法的流程示意图。

如图所示,该方法包括以下步骤:

步骤101,获取媒体与用户交互时产生的用户文本;

步骤102,将该用户文本进行分词得到用户交互词表,并统计所述用户交互词表中的各用户交互词的热度值;

步骤105,筛选所述用户交互词表中,热度值达到预设阈值和/或达到预设热度值排名的用户交互词作为热词;

步骤106,获取进行分词之前所述热词对应的用户文本,并根据所述热词对应的用户文本确定用户关注热点;

步骤107,根据所述用户关注热点推荐媒体节目素材。

可选的,步骤102,将所述用户文本进行分词之后还包括:

步骤103,对分词之后得到的用户交互词表进行单字词过滤,以将单字词语过滤出所述用户交互词表。

可选的,步骤102,将所述用户文本进行分词之后还包括:

步骤104,对分词之后得到的用户交互词表进行无意义词过滤,以将无意义词过滤出所述用户交互词表。

本实施例优选的,本地有一个实时更新的无意义词库,将用户交互词表中,可以在无意义词库中找到的词过滤掉。

此处需要说明的是,以上步骤103和104都不是必选项,具体实施本实施例的方案时,可不选择103和104,可仅选择103或104一个步骤,也可以同时选择103和104两个步骤。

优选的,步骤102之前,还包括:

将专有名词添加到分词词库。

需要说明的是,专有名词中的单字词并不会在步骤103的单字词过滤中过滤出去。

专有名词也不会在步骤104的无意义词过滤中过滤出去。

在进行分词时,首先匹配分词词库中的词,将可以匹配到的词分出来,之后再根据分词规则将剩余的文本继续分词。

当分词得到的专有名词与无意义词库中的无意义词相同时,不将该词过滤出去。

例如,媒体与用户交互时,有一用户文本涉及房价的话题,进行分词时,得到房价、经济、买、涨、跌、概率、二手房、新房、首付比例、下调、准备金率等词,相应的热度值排名为:

房价、首付比例、涨、跌、二手房、新房、下调、经济、准备金率。

其中,“涨”、“跌”、“准备金率”在分词词库中,属于专有名词,不能把“准备金”和“率”分开算两个词,也不能把“涨”和“跌”与相邻的字组合进行分词;

分词之后,首先进行单字词语过滤:

“买”为单字词语,在此步骤会被过滤掉,而“涨”和“跌”属于专有名词,不会被过滤掉。

其次,进行无意义词过滤:

在此文本中,“概率”出现的频率很高,但其并不能反映具体问题,没有实际意义,因而会在此步骤中被过滤掉。

本实施例优选的,无意义词库也是实时更新的,如:将关注度持续较高,但并无实际意义的词添加到无意义词库中去。

预设的排名阈值为5,于是,取热度值排名前5的词作为热词:房价、首付比例、涨、跌、二手房。

该5个热词对应的用户文本即前边提到的文本,其体现的用户关注热点为房价的上涨。于是,可以据此推荐与房价上涨有关的素材。

实施例二

图2是本发明实施例一种基于用户热词的媒体节目素材推荐系统,包括:

用户文本获取单元201,用于获取媒体与用户交互时产生的用户文本;

分词单元202,用于将该用户文本进行分词得到用户交互词表,并统计所述用户交互词表中的各用户交互词的热度值;

热词筛选单元205,用于筛选所述用户交互词表中,热度值达到预设阈值和/或达到预设热度值排名的用户交互词作为热词;

原始文本匹配单元206,用于获取进行分词之前所述热词对应的用户文本,并根据所述热词对应的用户文本确定用户关注热点;

素材推荐单元207,用于根据所述用户关注热点推荐媒体节目素材。

可选的,还包括:

单字词语过滤单元203,用于所述将所述用户文本进行分词之后,对分词之后得到的用户交互词表进行单字词过滤,以将单字词语过滤出所述用户交互词表。

可选的,还包括:

无意义词过滤单元204,用于所述将所述用户文本进行分词之后,对分词之后得到的用户交互词表进行无意义词过滤,以将无意义词过滤出所述用户交互词表。

此处需要说明的是,以上单元203和204都不是必选结构,具体实施本实施例的方案时,可不选择203和204,可仅选择203或204一个单元,也可以同时选择203和204两个单元。

可选的,还包括专有名词添加单元,用于将专有名词添加到分词词库。

需要说明的是,专有名词中的单字词并不会在单字词语过滤单元203中被过滤出去。

专有名词也不会在无意义词过滤单元204中被过滤出去。

在进行分词时,首先匹配分词词库中的词,将可以匹配到的词分出来,之后再根据分词规则将剩余的文本继续分词。

当分词得到的专有名词与无意义词库中的无意义词相同时,不将该词过滤出去。

例如,媒体与用户交互时,有一用户文本涉及房价的话题,进行分词时,得到房价、经济、买、涨、跌、概率、二手房、新房、首付比例、下调、准备金率等词,相应的热度值排名为:

房价、首付比例、涨、跌、二手房、新房、下调、经济、准备金率。

其中,“涨”、“跌”、“准备金率”在分词词库中,属于专有名词,不能把“准备金”和“率”分开算两个词,也不能把“涨”和“跌”与相邻的字组合进行分词;

分词之后,首先进行单字词语过滤:

“买”为单字词语,在此步骤会被过滤掉,而“涨”和“跌”属于专有名词,不会被过滤掉。

其次,进行无意义词过滤:

在此文本中,“概率”出现的频率很高,但其并不能反映具体问题,没有实际意义,因而会在此步骤中被过滤掉。

本实施例优选的,无意义词库也是实时更新的,如:将关注度持续较高,但并无实际意义的词添加到无意义词库中去。

预设的排名阈值为5,于是,取热度值排名前5的词作为热词:房价、首付比例、涨、跌、二手房。

该5个热词对应的用户文本即前边提到的文本,其体现的用户关注热点为房价的上涨。于是,可以据此推荐与房价上涨有关的素材。

实施例三

图3是本发明实施例一种基于用户热词的媒体节目素材推荐方法的流程图,包括:

步骤301,获取媒体与用户交互时产生的用户文本;

步骤302,将该用户文本进行分词得到用户交互词表,并统计所述用户交互词表中的各用户交互词的热度值;

步骤303,根据热度值高的用户交互词推荐媒体节目素材。

为提高效率及准确性,可选的,在步骤302和303之间,需要进行单字词及无意义词过滤。

实施例四

图4是本发明实施例一种基于用户热词的媒体节目素材推荐系统的结构图,包括:

用户文本获取单元401,用于获取媒体与用户交互时产生的用户文本;

分词单元402,用于将该用户文本进行分词得到用户交互词表,并统计所述用户交互词表中的各用户交互词的热度值;

素材推荐单元403,用于根据热度值高的用户交互词推荐媒体节目素材。

为提高系统效率及准确性,可选的,分词单元还需要进行单字词语过滤以及无意义词过滤。

上述技术方案具有如下有益效果:因为采媒体与用户交互时产生的用户文本,并将该用户文本进行分词得到用户交互词表,并统计所述用户交互词表中的各用户交互词的热度值;最后根据热度值高的用户交互词推荐媒体节目素材,在节目制作的过程中,将素材的推荐与媒体用户的实时喜好相结合,可满足大部分用户的实时满意度。

本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。

本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。

本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。

在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1