影视推介方法及装置与流程

文档序号:11407293阅读:200来源:国知局
影视推介方法及装置与流程

本发明涉及电视技术领域,尤其涉及一种影视推介方法及装置。



背景技术:

新闻、资讯中的每篇文章一般有一到多个主题,每个主题的用词以及前后顺序大多数具有一定的关联。尤其是关于影视方面的新闻、文章描述的主题,会包含大量相关联的影视名、导演名、演员名、内容介绍等信息。传统的影视推介大部分是运营人员在手动维护,没有考虑到主题里包含的大量相关联的影视名、导演名、演员名、内容介绍等相关联信息,大多数都是只根据影视资源的热门度、上映时间、评分等简单维度进行电影推介。这样不仅耗时耗力,而且无法对海量新闻、资讯里的影视名、导演名、演员名、内容介绍等有效信息进行充分挖掘。



技术实现要素:

本发明的主要目的在于提出一种影视推介方法及装置,旨在解决无法对海量新闻、资讯里的有效信息进行充分挖掘的技术问题。

为实现上述目的,本发明提供的一种影视推介方法,所述影视推介方法包括以下步骤:

接收用户输入的目标关键字,根据预设的推介模型获取所述目标关键字对应的目标词向量;

在成功获取所述目标词向量时,根据预设规则计算所述目标词向量与所述推介模型中词向量的相似度;

获取相似度在预设阈值以上的词向量对应的词为待选推介词,并根据预设规则,显示所述待选推介词对应的推介内容。

可选地,所述接收用户输入的目标关键字,根据预设的推介模型获取所述目标关键字对应的目标词向量的步骤之前包括:

获取目标网站中影视类的目标内容;

根据预设的影视词典,将所述目标内容进行中文分词;

通过开源项目将中文分词后的目标内容进行训练生成词向量,并将所述词向量存储至推介模型。

可选地,所述根据预设规则,显示所述待选推介词对应的推介内容的步骤包括:

判断所述待选推介词是否是影视名;

若所述待选推介词是影视名,则获取所述待选推介词对应的第一推介信息,所述第一推介信息包括相似度、用户评分、上映时间和点击反馈;

根据所述第一推介信息和预设权重,计算所述待选推介词的推介总分;

按照所述推介总分和预设显示个数,显示所述待选推介词对应的推介内容。

可选地,所述判断所述待选推介词是否是影视名的步骤之后还包括:

若所述待选推介词不是影视名,则获取所述待选推介词对应的第二推介信息,所述第二推介信息包括相似度、上映时间和点击反馈;

根据所述第二推介信息和预设权重,计算所述待选推介词的推介总分;

按照所述推介总分和预设显示个数,显示所述待选推介词对应的推介内容。

可选地,所述判断是否成功获取所述目标词向量的步骤之后还包括:

若未获取到目标关键字对应的目标词向量,则存储所述目标关键字,并将所述目标关键字添加到所述影视词典中。

此外,为实现上述目的,本发明还提供一种影视推介装置,所述影视推介装置包括以下模块:

第一获取模块,用于接收用户输入的目标关键字,根据预设的推介模型获取所述目标关键字对应的目标词向量;

计算模块,用于在判定第一获取模块成功获取所述目标词向量时,根据预设规则计算所述目标词向量与所述推介模型中词向量的相似度;

显示模块,用于获取相似度在预设阈值以上的词向量对应的词为待选推介词,并根据预设规则,显示所述待选推介词对应的推介内容。

可选地,所述影视推介装置还包括:

第二获取模块,用于获取目标网站中影视类的目标内容;

分词模块,用于根据预设的影视词典,将所述目标内容进行中文分词;

模型生成模块,用于通过开源项目将中文分词后的目标内容进行训练生成词向量,并将所述词向量存储至推介模型。

可选地,所述显示模块包括:

判断单元,用于判断所述待选推介词是否是影视名;

第一获取单元,用于判断单元判定所述待选推介词是影视名时,获取所述待选推介词对应的第一推介信息,所述第一推介信息包括相似度、用户评分、上映时间和点击反馈;

第一计算单元,用于根据所述第一推介信息和预设权重,计算所述待选推介词的推介总分;

显示单元,用于按照所述推介总分和预设显示个数,显示所述待选推介词对应的推介内容。

可选地,所述显示模块还包括:

第二获取单元,用于判断单元判定所述待选推介词不是影视名,则获取所述待选推介词对应的第二推介信息,所述第二推介信息包括相似度、上映时间和点击反馈;

第二计算单元,用于根据所述第二推介信息和预设权重,计算所述待选推介词的推介总分;

第二显示单元,用于按照所述推介总分和预设显示个数,显示所述待选推介词对应的推介内容。

可选地,所述影视推介装置还包括:

存储模块,用于在判断模块判定第一获取模块未获取到目标关键字对应的目标词向量时,存储所述目标关键字,并将所述目标关键字添加到所述影视词典中。

本发明提供一种影视推介方法,所述影视推介方法通过接收用户输入的目标关键字,根据预设的推介模型获取所述目标关键字对应的目标词向量;在成功获取所述目标词向量时,根据预设规则计算所述目标词向量与所述推介模型中词向量的相似度;获取相似度在预设阈值以上的词向量对应的词为待选推介词,并根据预设规则,显示所述待选推介词对应的推介内容。通过上述方式,本发明采用文本转词向量计算技术,将最新的海量新闻、资讯、文本转换成数学的词向量,然后通过相似度的计算挖掘影视资源中关联的待选推介词,以实现智能推介。本发明的推介方法不仅简单便捷的取代了繁重的人工维护,而且改变单维度的推介标准,从影视资源的多维度实现相关联影视的推介,解决了无法对海量新闻、资讯里的有效信息进行充分挖掘的技术问题,提高了用户体验。

附图说明

图1为本发明影视推介方法第一实施例的流程示意图;

图2为本发明影视推介方法第二实施例的流程示意图;

图3为本发明影视推介方法第三实施例的流程示意图;

图4为本发明影视推介装置第一实施例的功能模块示意图;

图5为本发明影视推介装置第二实施例的功能模块示意图;

图6为图4中显示模块30一实施例的细化功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提供一种影视推介方法。

参照图1,图1为本发明影视推介方法第一实施例的流程示意图;

本实施例中,该影视推介方法包括:

步骤s10,接收用户输入的目标关键字,根据预设的推介模型获取所述目标关键字对应的目标词向量;

为了解决现有技术中无法对海量新闻、资讯里的有效信息进行充分挖掘的技术问题,利用影视资源的多维度实现影视的智能推介。具体地,本实施例中,在接收到用户输入的目标关键字时,将所述目标关键字输入预先设置的推介模型中,推介模型会根据所述目标关键字输出目标关键字对应的目标词向量,由此实现新闻、资讯等文本转换为数学词向量,便于后续比较操作。

本实施例中,步骤s10之后还包括:

步骤s40,判断是否成功获取所述目标词向量;

具体地,判断是否成功地从预设的推介模型中获取到对应的目标词向量,即判断推介模型中是都存储有目标关键字对应的目标词向量。

步骤s20,在成功获取所述目标词向量时,根据预设规则计算所述目标词向量与所述推介模型中词向量的相似度;

具体地,在将文本转换为数学向量后,并在判定成功获取到所述目标词向量时,根据预设规则,计算所述目标词向量与预设推介模型中所有词向量的相似度。

本实施例中,计算相似度的预设规则,采用余弦定理计算推介模型中所有词向量与目标词向量的夹角来判定推介模型中词向量与目标词向量的相似度。如选取目标词向量和任意一个推介模型中的词向量,使用cosine向量夹角公式进行运算,取值范围为(0,1),越接近1则表示相似度越高。

具体实施例中,还可以采用其他比较公式,来获取推介模型中词向量与目标词向量的相似度。

本实施例中,在推介模型中未获取到目标关键字对应的目标词向量时,本实施例中影视推介方法还包括:

步骤s80,若未获取到目标关键字对应的目标词向量,则存储所述目标关键字,并将所述目标关键字添加到所述影视词典中。

具体地,在推介模型中未获取到目标词向量时,表示训练后的推介模型中未收录目标关键字,此时,可对该目标关键字进行存储,并添加到影视词典中,在后期操作时,作为目标词加以训练。

步骤s30,获取相似度在预设阈值以上的词向量对应的词为待选推介词,并根据预设规则,显示所述待选推介词对应的推介内容。

具体地,在将推介模型中所有词向量与目标词向量进行相似度计算后,可根据实际情况设定阈值,将计算后得到的相似度与设定阈值进行比较。超过阈值的相似度对应的词向量对应的词可作为待选推介词,用于进行推介。并根据实际需要,结合其他数据,显示所述待选推介词对应的推介内容,完成推介。

本实施例提供一种影视推介方法,所述影视推介方法通过接收用户输入的目标关键字,根据预设的推介模型获取所述目标关键字对应的目标词向量;判断是否成功获取所述目标词向量;在成功获取所述目标词向量时,根据预设规则计算所述目标词向量与所述推介模型中词向量的相似度;获取相似度在预设阈值以上的词向量对应的词为待选推介词,并根据预设规则,显示所述待选推介词对应的推介内容。通过上述方式,本发明采用文本转词向量计算技术,将最新的海量新闻、资讯、文本转换成数学的词向量,然后通过相似度的计算挖掘影视资源中关联的待选推介词,以实现智能推介。本发明的推介方法不仅简单便捷的取代了繁重的人工维护,而且改变单维度的推介标准,从影视资源的多维度实现相关联影视的推介,解决了无法对海量新闻、资讯里的有效信息进行充分挖掘的技术问题,提高了用户体验。

参照图2,图2为本发明影视推介方法第二实施例的流程示意图;

基于第一实施例提成本发明的第二实施例,为了实现机器学习文本转词向量的计算技术,本实施例中,步骤10之前包括:

步骤50,获取目标网站中影视类的目标内容;

具体地,为了实现机器学习文本转词向量的计算技术,本实施例中,需要获取大量影视类新闻文本作为转换数据。目标网站主要是各大新闻门户网站,本实施例中采用网络爬虫的方式对新闻门户网站的影视模块一级一级往下进行爬取、解析,以获取影视类的目标内容。并将影视类的新闻标题和正文进行存储。

具体获取步骤为:服务器发送http请求到新闻门户网站影视模块首页,解析当前影视模块首页所有的url,并缓存所有影视类的url,可将url的构成有规则,作为影视类url的识别标准。分别获取缓存中所有url进行标题、正文的提取,并将提取的标题和正文进行存储。

步骤60,根据预设的影视词典,将所述目标内容进行中文分词;

具体地,由于中文的词与词之间是没有分割符的,因此在对存储的内容数据进行中文分词后才能进行训练。为了提高分词的准确性,需要建立预先建立影视词典。影视词典包括影视名称、导演、演员等影视类词,可以从己方媒资库中获取,也可以从网上开放的词库获取,如:搜狗词库等。也可以通过爬虫从影视门户网站爬取。然后采用开源项目结合影视词典的模式进行分词。获取一篇存储的目标内容,使用中文分词开源项目,再结合影视类词典进行分词,并将分词后的该篇目标内容存储为一行。直至获取并分词完所有存储的标题和正文。

步骤70,通过开源项目将中文分词后的目标内容进行训练生成词向量,并将所述词向量存储至推介模型。

具体地,将分词后的目标内容再次经过词向量模型进行训练,本实施例中采用google开源的机器学习项目word2vec的skip-gram方法进行词向量的训练。skip-gram的训练目标是,在已知当前词预测的前后几个词出现的概率。可采用随机梯度上升法训练。在使用skip-gram的方法训练词向量后,可以预测一个词语上下几个词出现的概率。由此,在影视推介时,采用此方法可以挖掘出新闻中相关联的信息,如:李某,查找关于他参演的作品以及合作的演员等等。并将训练后的词向量存储到推介模型中,用于后续推介使用。

参照图3,图3为本发明影视推介方法第三实施例的流程示意图;

基于第二实施例提成本发明的第三实施例,为了提升用户体验,可根据用户输入的目标关键字类型,采用不同的推介方法,本实施例中所述步骤s30包括:

步骤s31,判断所述待选推介词是否是影视名;

具体地,最终推介时需要考虑多个因素,如:待选推介词与目标词向量之间的相似度、待选推介词对应的影视上映时、影视用户评分以及该影视的用户点击反馈等信息。可通过对这些信息加权求和,在词向量之间的相似度分值的基础上可结合其他影视资源标准,如上映时间、用户评分和点击反馈等信息,并根据实际需要设置权重以进行综合评分。但是,影视名才具有用户评分,而演员、导演名称,往往没有用户评分。所以,这里需要根据实际情况分为两种推介算法。一种是影视名推介算法,另外一种是演员和/或导演名推介算法。即演员和/或导演名推介算法无需考虑用户评分。

本实施例中还包括:在获取到待选推介词时,判断所述待选推介词是否在影视媒资库中存在,若不存在,获取下一个待选推荐词。存在,则继续下列步骤。

步骤s32,若所述待选推介词是影视名,则获取所述待选推介词对应的第一推介信息,所述第一推介信息包括相似度、用户评分、上映时间和点击反馈;

具体地,在所述待选推介词为影视名时,采用影视名推介算法。依次获取该影视的相似度评分、用户评分、上映评分和点击反馈评分。

步骤s33,根据所述第一推介信息和预设权重,计算所述待选推介词的推介总分;

具体地,根据各个评分设置的权重计算所述待选推介词的总分,如:上映评分为:1/(当前年份-上映年份+1),即:今年为1,去年1/2,前年1/3等,用户评分为:用户对待选推介词对应影视的历史评分,即己方平台评分、豆瓣评分等。点击反馈评分为:点击反馈,即根据统计历史点击次数,分母加0.01,以避免为点击次数为0的情况。

综上所述,打分公式如下(权重可根据需求分配):

打分算法取4个维度,权重为:相似度(40%)、上映时间(20%)、用户评分(20%)、点击反馈(20%),并将得到的推介总分以及待选推介词按照总分的高低依次储存到待推介列表中。

步骤s34,按照所述推介总分和预设显示个数,显示所述待选推介词对应的推介内容。

具体地,根据所述推介总分的高低,以及预先设置的显示个数,依次显示推介列表中所述待选推介词对应的推介内容。

在用户输入的目标关键字不是影视名时,本实施例中所述步骤s31之后还包括:

步骤s35,若所述待选推介词不是影视名,则获取所述待选推介词对应的第二推介信息,所述第二推介信息包括相似度、上映时间和点击反馈;

步骤s36,根据所述第二推介信息和预设权重,计算所述待选推介词的推介总分,并返回步骤s34。

具体地,在所述待选推介词不是影视名时,采用演员和/导演打分算法,如:主要取3个维度,权重为:相似度(50%)、上映时间(25%)、点击反馈(25%)。

使用上述公式分别为需要待选推介词打分,并按分数高低排序,依次显示推介列表中待选推介词对应的推介内容。直至获取完所有的待选推介词,完成推介。

本发明进一步提供一种影视推介装置。

参照图4,图4为本发明影视推介装置第一实施例的功能模块示意图;

本实施例中,该影视推介装置包括:

第一获取模块10,用于接收用户输入的目标关键字,根据预设的推介模型获取所述目标关键字对应的目标词向量;

为了解决现有技术中无法对海量新闻、资讯里的有效信息进行充分挖掘的技术问题,利用影视资源的多维度实现影视的智能推介。具体地,本实施例中,在接收到用户输入的目标关键字时,将所述目标关键字输入预先设置的推介模型中,推介模型会根据所述目标关键字输出目标关键字对应的目标词向量,由此实现新闻、资讯等文本转换为数学词向量,便于后续比较操作。

本实施例中,所述影视推介装置还包括:

判断模块40,用于判断是否成功获取所述目标词向量;

具体地,判断是否成功地从预设的推介模型中获取到对应的目标词向量,即判断推介模型中是都存储有目标关键字对应的目标词向量。

计算模块20,用于在判断模块判定第一获取模块成功获取所述目标词向量时,根据预设规则计算所述目标词向量与所述推介模型中词向量的相似度;

具体地,在将文本转换为数学向量后,并在判定成功获取到所述目标词向量时,根据预设规则,计算所述目标词向量与预设推介模型中所有词向量的相似度。

本实施例中,计算相似度的预设规则,采用余弦定理计算推介模型中所有词向量与目标词向量的夹角来判定推介模型中词向量与目标词向量的相似度。如选取目标词向量和任意一个推介模型中的词向量,使用cosine向量夹角公式进行运算,取值范围为(0,1),越接近1则表示相似度越高。

具体实施例中,还可以采用其他比较公式,来获取推介模型中词向量与目标词向量的相似度。

本实施例中,在推介模型中未获取到目标关键字对应的目标词向量时,本实施例中影视推介装置还包括:

存储模块80,用于在判断模块判定第一获取模块未获取到目标关键字对应的目标词向量时,存储所述目标关键字,并将所述目标关键字添加到所述影视词典中。

具体地,在推介模型中未获取到目标词向量时,表示训练后的推介模型中未收录目标关键字,此时,可对该目标关键字进行存储,并添加到影视词典中,在后期操作时,作为目标词加以训练。

显示模块30,用于获取相似度在预设阈值以上的词向量对应的词为待选推介词,并根据预设规则,显示所述待选推介词对应的推介内容。

具体地,在将推介模型中所有词向量与目标词向量进行相似度计算后,可根据实际情况设定阈值,将计算后得到的相似度与设定阈值进行比较。超过阈值的相似度对应的词向量对应的词可作为待选推介词,用于进行推介。并根据实际需要,结合其他数据,显示所述待选推介词对应的推介内容,完成推介。

本实施例提供一种影视推介装置,所述影视推介装置通过接收用户输入的目标关键字,根据预设的推介模型获取所述目标关键字对应的目标词向量;在成功获取所述目标词向量时,根据预设规则计算所述目标词向量与所述推介模型中词向量的相似度;获取相似度在预设阈值以上的词向量对应的词为待选推介词,并根据预设规则,显示所述待选推介词对应的推介内容。通过上述方式,本发明采用文本转词向量计算技术,将最新的海量新闻、资讯、文本转换成数学的词向量,然后通过相似度的计算挖掘影视资源中关联的待选推介词,以实现智能推介。本发明的推介方法不仅简单便捷的取代了繁重的人工维护,而且改变单维度的推介标准,从影视资源的多维度实现相关联影视的推介,解决了无法对海量新闻、资讯里的有效信息进行充分挖掘的技术问题,提高了用户体验。

参照图5,图5为本发明影视推介装置第二实施例的功能模块示意图;

基于第一实施例提出本发明的第二实施例,为了实现机器学习文本转词向量的计算技术,本实施例中,所述影视推介装置还包括:

第二获取模块50,用于获取目标网站中影视类的目标内容;

具体地,为了实现机器学习文本转词向量的计算技术,本实施例中,需要获取大量影视类新闻文本作为转换数据。目标网站主要是各大新闻门户网站,本实施例中采用网络爬虫的方式对新闻门户网站的影视模块一级一级往下进行爬取、解析,以获取影视类的目标内容。并将影视类的新闻标题和正文进行存储。

具体获取步骤为:服务器发送http请求到新闻门户网站影视模块首页,解析当前影视模块首页所有的url,并缓存所有影视类的url,可将url的构成有规则,作为影视类url的识别标准。分别获取缓存中所有url进行标题、正文的提取,并将提取的标题和正文进行存储。

中文分词模块60,用于根据预设的影视词典,将所述目标内容进行中文分词;

具体地,由于中文的词与词之间是没有分割符的,因此在对存储的内容数据进行中文分词后才能进行训练。为了提高分词的准确性,需要建立预先建立影视词典。影视词典包括影视名称、导演、演员等影视类词,可以从己方媒资库中获取,也可以从网上开放的词库获取,如:搜狗词库等。也可以通过爬虫从影视门户网站爬取。然后采用开源项目结合影视词典的模式进行分词。获取一篇存储的目标内容,使用中文分词开源项目,再结合影视类词典进行分词,并将分词后的该篇目标内容存储为一行。直至获取并分词完所有存储的标题和正文。

模型生成模块70,用于通过开源项目将中文分词后的目标内容进行训练生成词向量,并将所述词向量存储至推介模型。

具体地,将分词后的目标内容再次经过词向量模型进行训练,本实施例中采用google开源的机器学习项目word2vec的skip-gram方法进行词向量的训练。skip-gram的训练目标是,在已知当前词预测的前后几个词出现的概率。可采用随机梯度上升法训练。在使用skip-gram的方法训练词向量后,可以预测一个词语上下几个词出现的概率。由此,在影视推介时,采用此方法可以挖掘出新闻中相关联的信息,如:李某,查找关于他参演的作品以及合作的演员等等。并将训练后的词向量存储到推介模型中,用于后续推介使用。

图6为图4中显示模块30一实施例的细化功能模块示意图。

基于第二实施例提成本发明的第三实施例,为了提升用户体验,可根据用户输入的目标关键字类型,采用不同的推介方法,本实施例中推介显示模块30包括:

判断单元31,用于判断所述待选推介词是否是影视名;

具体地,最终推介时需要考虑多个因素,如:待选推介词与目标词向量之间的相似度、待选推介词对应的影视上映时、影视用户评分以及该影视的用户点击反馈等信息。可通过对这些信息加权求和,在词向量之间的相似度分值的基础上可结合其他影视资源标准,如上映时间、用户评分和点击反馈等信息,并根据实际需要设置权重以进行综合评分。但是,影视名才具有用户评分,而演员、导演名称,往往没有用户评分。所以,这里需要根据实际情况分为两种推介算法。一种是影视名推介算法,另外一种是演员和/或导演名推介算法。即演员和/或导演名推介算法无需考虑用户评分。

本实施例中还包括:在获取到待选推介词时,判断所述待选推介词是否在影视媒资库中存在,若不存在,获取下一个待选推荐词。存在,则继续下列步骤。

第一获取单元32,用于判断单元判定所述待选推介词是影视名时,获取所述待选推介词对应的第一推介信息,所述第一推介信息包括相似度、用户评分、上映时间和点击反馈;

具体地,在所述待选推介词为影视名时,采用影视名推介算法。依次获取该影视的相似度评分、用户评分、上映评分和点击反馈评分。

第一计算单元33,用于根据所述第一推介信息和预设权重,计算所述待选推介词的推介总分;

具体地,根据各个评分设置的权重计算所述待选推介词的总分,如:上映评分为:1/(当前年份-上映年份+1),即:今年为1,去年1/2,前年1/3等,用户评分为:用户对待选推介词对应影视的历史评分,即己方平台评分、豆瓣评分等。点击反馈评分为:点击反馈,即根据统计历史点击次数,分母加0.01,以避免为点击次数为0的情况。

综上所述,打分公式如下(权重可根据需求分配):

打分算法取4个维度,权重为:相似度(40%)、上映时间(20%)、用户评分(20%)、点击反馈(20%),并将得到的推介总分以及待选推介词按照总分的高低依次储存到待推介列表中。

显示单元34,用于按照所述推介总分和预设显示个数,显示所述待选推介词对应的推介内容。

具体地,根据所述推介总分的高低,以及预先设置的显示个数,依次显示推介列表中所述待选推介词对应的推介内容。

在用户输入的目标关键字不是影视名时,所述推介显示模块40还包括:

第二获取单元35,用于判断单元判定所述待选推介词不是影视名,则获取所述待选推介词对应的第二推介信息,所述第二推介信息包括相似度、上映时间和点击反馈;

第二计算单元36,用于根据所述第二推介信息和预设权重,计算所述待选推介词的推介总分;

具体地,在所述待选推介词不是影视名时,采用演员和/导演打分算法,如:主要取3个维度,权重为:相似度(50%)、上映时间(25%)、点击反馈(25%)。

使用上述公式分别为需要待选推介词打分,并按分数高低排序,依次显示推介列表中待选推介词对应的推介内容。直至获取完所有的待选推介词,完成推介。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1