一种预测电影次日票房的方法及装置与流程

文档序号:15801790发布日期:2018-11-02 21:29阅读:457来源:国知局
一种预测电影次日票房的方法及装置与流程

本发明涉及数据分析处理技术领域,尤其涉及一种预测电影次日票房的方法及装置。

背景技术

近些年,中国电影市场发展迅速,电影上映数量、影片质量、观影人数、电影票房快速增长,也为国内经济的发展做出了突出贡献。目前国内电影产业融资渠道日益多元化,产业扶持政策力度不断增强,电影产业成为国家重点扶持的文化创意产业的核心门类,获得社会各界的极大关注。电影票房是衡量一部电影成功与否的重要指标,众所周知,影院对电影的排期对电影票房的影响至关重要,然而电影的次日票房又会很大程度地影响影院对电影的排期安排,现有技术中,预测电影次日票房相关技术主要是数据分析人员将电影特征数据作为输入,利用简单的线性回归方法对电影次日票房做简单预测。

发明人经过研究发现,线性回归方法也仅仅是回归分析的基本方法,线性回归方法中的自变量与因变量之间存在直接的线性关系,然而在预测电影次日票房时,所使用的电影特征与电影次日票房之间并不存在上述简单的线性关系,因而通过现有技术预测出的电影次日票房准确率低、稳定性差、参考价值不高,进而导致对电影的排期安排也会出现较大误差。

基于此,如何准确预测电影次日票房显得尤为重要,使我们急需解决的问题。



技术实现要素:

本发明所要解决的技术问题是,提供一种预测电影次日票房的方法及装置,利用训练好的多层神经网络模型对电影票房进行回归预测,以得到准确的电影票房预测值。

第一方面,本发明实施例提供了一种预测电影次日票房的方法,该方法包括:

根据客户端发送的预测电影次日票房请求,确定待放映电影;

获取所述待放映电影的特征数据,所述待放映电影的特征数据为与影响待放映电影的票房有关的信息数据;

根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测,所述多层神经网络模型集合是根据历史放映电影的特征数据经过预处理后按照放映日期分别采用多层神经网络训练得到的多个模型组合,所述历史放映电影的特征数据为与历史放映电影的票房有关的信息数据。

优选的,所述待放映电影的特征数据包括:电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息和/或预售信息;

所述历史放映电影的特征数据包括:电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息、预售信息和次日票房信息。

优选的,所述多层神经网络模型集合中的多层神经网络模型为三层神经网络模型,包括输入层、隐含层和输出层,其中,所述输入层神经元个数为历史放映电影的特征数据的维度,采用relu激励函数,并采用dropout防止过拟合,所述隐含层神经元个数由网格参数寻优确定,采用relu激励函数,所述输出层神经元个数为1,采用linear激励函数。

优选的,所述多层神经网络模型集合包括1个首日模型和7个特定日期模型。

优选的,所述根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测,具体包括:

若所述待放映电影的待放映日期为首映日期,选取多层神经网络模型集合中的首日模型对所述待放映电影次日票房进行预测;

若所述待放映电影的待放映日期为非首映日期,根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的特定日期模型对所述待放映电影次日票房进行预测。

第二方面,本发明实施例提供了一种预测电影次日票房的装置,该装置包括:

确定单元,用于根据客户端发送的预测电影次日票房请求,确定待放映电影;

获取单元,用于获取所述待放映电影的特征数据,所述待放映电影的特征数据为与影响待放映电影的票房有关的信息数据;

预测单元,用于根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测,所述多层神经网络模型集合是根据历史放映电影的特征数据经过预处理后按照放映日期分别采用多层神经网络训练得到的多个模型组合,所述历史放映电影的特征数据为与历史放映电影的票房有关的信息数据。

优选的,所述待放映电影的特征数据包括:电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息和/或预售信息;

所述历史放映电影的特征数据包括:电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息、预售信息和次日票房信息。

优选的,所述多层神经网络模型集合中的多层神经网络模型为三层神经网络模型,包括输入层、隐含层和输出层,其中,所述输入层神经元个数为历史放映电影的特征数据的维度,采用relu激励函数,并采用dropout防止过拟合,所述隐含层神经元个数由网格参数寻优确定,采用relu激励函数,所述输出层神经元个数为1,采用linear激励函数。

优选的,所述多层神经网络模型集合包括1个首日模型和7个特定日期模型。

优选的,所述预测单元具体包括第一预测子单元和第二预测子单元,

所述第一预测子单元,用于若所述待放映电影的待放映日期为首映日期,选取多层神经网络模型集合中的首日模型对所述待放映电影次日票房进行预测;

所述第二预测子单元,用于若所述待放映电影的待放映日期为非首映日期,根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的特定日期模型对所述待放映电影次日票房进行预测。

与现有技术相比,本发明至少具有以下优点:

采用本发明实施例的技术方案,获取影响待放映电影的票房有关的信息数据作为特征数据,根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测。由此可见,本实施例利用了多层神经网络模型,所述多层神经网络模型是根据与历史放映电影的票房有关的信息数据经过预处理后多层神经网络建立并训练得到的,而且模型输入数据为影响待放映电影的票房有关的信息数据,通过此方式可以准确预测出待放映电影的次日票房。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本发明实施例中一种应用场景所涉及的系统框架示意图;

图2为本发明实施例提供的一种预测电影次日票房的方法的流程示意图;

图3为本发明实施例提供的一种三层神经网络模型;

图4为本发明实施例提供的另一种预测电影次日票房的方法的流程示意图;

图5为本发明实施例提供的一种预测电影次日票房的装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

发明人经过研究发现,现有技术中是利用线性回归方法对电影次日票房做简单预测,然而线性回归方法仅仅是回归分析中一种最基本的方法,而且线性回归方法中的自变量与因变量之间存在直接的线性关系,也就是说,只有自变量与因变量之间有直接的线性关系,利用线性回归方法进行回归分析准确度才高,但是在预测电影次日票房时,所使用的电影特征与电影次日票房之间并不是上述简单的线性关系可以描述的,因而通过线性回归方法预测出的电影次日票房准确率低、稳定性差、参考价值不高,进而导致对电影的排期安排也会出现较大误差。

为了解决这一问题,在本发明实施例中,获取影响待放映电影的票房有关的信息数据作为特征数据,根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测。由此可见,本实施例利用了多层神经网络模型,所述多层神经网络模型是根据与历史放映电影的票房有关的信息数据经过预处理后多层神经网络建立并训练得到的,而且模型输入数据为影响待放映电影的票房有关的信息数据,通过此方式可以准确预测出待放映电影的次日票房。

举例来说,本发明实施例的场景之一,可以是应用到如图1所示的场景中。该场景中包括服务器101、客户端102和数据库103,其中,服务器101和客户端102可以交互,服务器101和数据库103可以交互,客户端102和数据库103可以交互。客户端102向服务器101发送预测电影次日票房的请求,服务器101接收到根据客户端102发送的预测电影次日票房请求,从数据库103的次日待放映电影列表中确定出待放映电影;服务器101从数据库103中获取所述待放映电影的特征数据,所述待放映电影的特征数据为与影响待放映电影的票房有关的信息数据;服务器101根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测,所述多层神经网络模型集合是根据历史放映电影的特征数据经过预处理后按照放映日期分别采用多层神经网络训练得到的多个模型组合,所述历史放映电影的特征数据为与历史放映电影的票房有关的信息数据;服务器101将预测的结果存储到数据库103,客户端102可以从数据库103获取预测结果。

可以理解的是,在上述应用场景中,虽然将本发明实施方式的动作描述由服务器101执行,但是这些动作也可以由客户端102执行,或者还可以部分由客户端102执行、部分由服务器101执行。本发明在执行主体方面不受限制,只要执行了本发明实施方式所公开的动作即可。

可以理解的是,上述场景仅是本发明实施例提供的一个场景示例,本发明实施例并不限于此场景。

下面结合附图,通过实施例来详细说明本发明实施例中规划导航终点的方法、装置和设备的具体实现方式。

示例性方法

参见图2,示出了本发明实施例中一种预测电影次日票房的方法的流程示意图。在本实施例中,所述方法例如可以包括以下步骤:

步骤201:根据客户端的预测电影次日票房请求,确定待放映电影。

步骤202:获取所述待放映电影的特征数据,所述待放映电影的特征数据为与影响待放映电影的票房有关的信息数据。

步骤203:根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测,所述多层神经网络模型集合是根据历史放映电影的特征数据经过预处理后按照放映日期分别采用多层神经网络训练得到的多个模型组合,所述历史放映电影的特征数据为与历史放映电影的票房有关的信息数据。

其中,所述步骤202中所述待放映电影的特征数据为与影响待放映电影的票房有关的信息数据,一般情况下,当一部电影即将放映时,人们会关注该电影的产地和类型、参演该电影的演员、拍摄该电影的导演以及该电影在网络上的热搜度等各种数据,这些数据决定了人们到底要不要去观看该电影,进而影响了该电影的票房,进一步地,该电影的待放映的日期,也就是次日日期是否为放假日期、或者该电影的历史排片信息以及预售信息在某种程度上会影响该电影次日的票房。因此,在本实施例中,所述待放映电影的特征数据包括:电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息和/或预售信息;

需要说明的是,在所述步骤203中所述历史放映电影的特征数据为与历史放映电影的票房有关的信息数据,由于收集历史放映电影的特征数据是为了建立训练多层神经网络模型,所以历史放映电影的特征数据还应该包括历史放映电影的次日票房数据。在本实施例中,所述历史放映电影的特征数据包括:电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息、预售信息和次日票房信息。

需要说明的是,所述待放映电影的特征数据和所述历史放映电影的特征数据均要被数值化,才能用于作为训练多层神经网络模型的输入数据或者输出数据。例如,所述电影产地是指中国、香港、美国、英国、日本等,中国可以数值化为1;所述电影类型是指动作、喜剧、动画、科幻等,喜剧可以数值化为0;所述导演信息是指导演影响力,导演影响力可以数值化为82.0;所述演员信息是指演员影响力,演员影响力可以数值化为92.3;所述网络搜索指数是指电影总搜索指数以及历史7天搜索指数,电影总搜索指数可以数值化为221500.0,历史7天搜索指数数值化之后分别为18312.0、16149.0、12643.0、7948.0、1294.0、1583.0和1942.0;所述假期信息是指电影放映日期是否为假期,假期可以数值化为1,非假期可以数值化为0;所述历史排片信息是指电影放映的历史排片信息(首日预测模型中没有此数据),历史多天的排片信息可以数值化之后分别为2671.0、0.013175、3977.0、540.0、422.0、1370.0、2153.0、618.0、1195.0、142.0、206.0、104638.0、0.0169、2492.0、0.012552、2304.0、480.0、201.0、1300.0、1160.0、585.0、782.0、126.0、161.0、63791.0、0.0110、59.0、0.0005、46.0、0.009;所述预售信息是指电影次日上映的预排期信息,电影次日上映的预排期信息可以数值化为[47.0,0.0004];所述次日票房是指作为电影次日上映的票房,电影次日上映的票房可以数值化为16817.0。

需要说明的是,现有技术是使用简单的线性回归方法预测电影次日票房,本实施例中使用多层神经网络建立并训练多个多层神经网络模型来预测电影次日票房。在本实施例中,所述多层神经网络模型集合中的多层神经网络模型为三层神经网络模型,包括输入层、隐含层和输出层,其中,所述输入层神经元个数为历史放映电影的特征数据的维度,采用relu激励函数,并采用dropout防止过拟合,所述隐含层神经元个数由网格参数寻优确定,采用relu激励函数,所述输出层神经元个数为1,采用linear激励函数。

其中,多层神经网络模型训练主要包括以下几个步骤:

步骤a:通过输入层将数值化后的历史放映电影的特征数据传递给隐含层。

步骤b:根据所述输入层传递的所述数值化后的历史放映电影的特征数据通过隐含层激励函数得到隐含层的输出数据。

步骤c:根据所述隐含层的输出数据以及激励函数计算神经网络的输出数据。

步骤d:根据所述神经网络的输出数据以及真实值计算模型预测误差。

步骤e:根据预测出的误差进行反向误差传播,更新模型各层节点参数。

步骤f:重复上述步骤直到模型预测出的误差达到要求为止,或者通过参数寻优得到最优的模型参数。

例如,如图3所示三层神经网络模型,最左侧为输入层,中间为隐含层,最右侧为输出层,当所述历史放映电影的特征数据包括:电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息、预售信息和次日票房信息时,其中,所述输入层神经元个数为8,采用relu激励函数,所述隐含层神经元个数由网格参数寻优确定,采用relu激励函数,所述输出层神经元个数为1,采用linear激励函数。为了避免模型过拟合,即一个假设在训练数据(历史放映电影的特征数据)上能够获得比其他假设更好的拟合,但是在训练数据外的数据集上却不能很好的拟合数据的现象,一般采用dropout来降低过拟合的可能性。

由于在收集所述历史放映电影的特征数据时,会先对收集的所述历史放映电影的特征数据进行预处理,所述预处理包括异常点去除、数据数值化,再根据所述历史放映电影的放映日期,将经过与处理的历史放映电影的特征数据整理分为8份数据,1份首日数据和周一到周日的7份数据(也就是7份特定日期数据),因此本实施例会根据8份数据利用三层神经网络分别建立并训练8个模型,即首日模型和7个特定日期模型。在本实施例中,所述多层神经网络模型集合包括1个首日模型和7个特定日期模型,例如,所述7个特定日期模型为周一模型、周二模型、周三模型、周四模型、周五模型、周六模型、周日模型。

其中,在建立并训练首日模型时,首日数据中不包括历史排片信息数据。

需要说明的是,所述多层神经网络模型集合包括1个首日模型和7个特定日期模型,因此预测待放映电影次日票房时,由于次日日期(即待放映日期)在某种属性上一定属于周一到周日这种特定日期中的一个日期,因而可以通过判断次日是否为首映日,来决定选取多层神经网络模型集合中的首日模型还是选取对应的特定日期模型对所述待放映电影次日票房进行预测。在本实施例的一些实施方式中,所述步骤203具体例如可以包括:若所述待放映电影的待放映日期为首映日期,选取多层神经网络模型集合中的首日模型对所述待放映电影次日票房进行预测;若所述待放映电影的待放映日期为非首映日期,根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的特定日期模型对所述待放映电影次日票房进行预测。

需要说明的是,在所述步骤203之后,会获得预测结果,也就是待放映电影次日票房的预测值,服务器应该将所述预测结果进行存储,例如存储到数据库,以便于客户端可以从数据库获取所述预测结果,进而专业影评人员可以根据所述预测结果来调整所述待放映电影的次日排片。在本实施例的一些实施方式中,在步骤203之后,例如还可以包括:将预测得到的预测结果存储到数据库。

通过本实施例提供的各种实施方式,获取影响待放映电影的票房有关的信息数据作为特征数据,根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测。由此可见,本实施例利用了首日模型和特定日期模型,所述首日模型和特定日期模型是根据与历史放映电影的票房有关的信息数据经过预处理后多层神经网络建立并训练得到的,而且模型输入数据为影响待放映电影的票房有关的信息数据,通过此方式可以准确预测出待放映电影的次日票房。

参见图4,示出了本发明实施例中一种预测电影次日票房的方法的流程示意图。在本实施例中,所述方法例如可以包括以下步骤:

步骤401:根据客户端发送的预测电影次日票房请求,从数据库中获取待放映电影列表并确定待放映电影。

步骤402:获取所述待放映电影的特征数据,所述待放映电影的特征数据包括所述待放映电影的电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息和/或预售信息。

步骤403:判断所述待放映电影的待放映日期是否为首映日期,如果是,进入步骤404;如果否,进入步骤405。

步骤404:选取多层神经网络模型集合中首日模型对所述待放映电影次日票房进行预测,所述多层神经网络模型集合是根据历史放映电影的电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息、预售信息和次日票房信息经过预处理后按照放映日期分别采用包括输入层、隐含层和输出层的三层神经网络参数寻优训练得到的1个首日模型和7个特定日期模型的组合。

步骤405:根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的特定日期模型对所述待放映电影次日票房进行预测。

步骤406:将预测得到的预测结果存储到数据库。

通过本实施例提供的各种实施方式,获取影响待放映电影的票房有关的信息数据作为特征数据,根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测。由此可见,本实施例利用了首日模型和特定日期模型,所述首日模型和特定日期模型是根据与历史放映电影的票房有关的信息数据经过预处理后多层神经网络建立并训练得到的,而且模型输入数据为影响待放映电影的票房有关的信息数据,通过此方式可以准确预测出待放映电影的次日票房。

示例性设备

参见图5,示出了本发明实施例中一种预测电影次日票房的装置的结构示意图。在本实施例中,所述装置例如具体可以包括:

确定单元501,用于根据客户端的预测电影次日票房请求,确定待放映电影。

获取单元502,用于获取所述待放映电影的特征数据,所述待放映电影的特征数据为与影响待放映电影的票房有关的信息数据。

预测单元503,用于根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测,所述多层神经网络模型集合是根据历史放映电影的特征数据经过预处理后按照放映日期分别采用多层神经网络训练得到的多个模型组合,所述历史放映电影的特征数据为与历史放映电影的票房有关的信息数据。

可选的,所述待放映电影的特征数据例如可以包括:电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息和/或预售信息;

所述历史放映电影的特征数据例如可以包括:电影产地、电影类型、导演信息、演员信息、网络搜索指数、假期信息、历史排片信息、预售信息和次日票房信息。

可选的,所述多层神经网络模型集合中的多层神经网络模型为三层神经网络模型,包括输入层、隐含层和输出层,其中,所述输入层神经元个数为历史放映电影的特征数据的维度,采用relu激励函数,并采用dropout防止过拟合,所述隐含层神经元个数由网格参数寻优确定,采用relu激励函数,所述输出层神经元个数为1,采用linear激励函数。

可选的,所述多层神经网络模型集合例如可以包括1个首日模型和7个特定日期模型。

可选的,所述预测单元503例如具体可以包括第一预测子单元和第二预测子单元,

所述第一预测子单元,用于若所述待放映电影的待放映日期为首映日期,选取多层神经网络模型集合中的首日模型对所述待放映电影次日票房进行预测;

所述第二预测子单元,用于若所述待放映电影的待放映日期为非首映日期,根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的特定日期模型对所述待放映电影次日票房进行预测。

可选的,所述装置例如还可以包括:

存储单元,用于将预测得到的预测结果存储到数据库。

通过本实施例提供的各种实施方式,获取影响待放映电影的票房有关的信息数据作为特征数据,根据所述待放映电影的待放映日期,选取多层神经网络模型集合中对应的放映日期模型对所述待放映电影次日票房进行预测。由此可见,本实施例利用了首日模型和特定日期模型,所述首日模型和特定日期模型是根据与历史放映电影的票房有关的信息数据经过预处理后多层神经网络建立并训练得到的,而且模型输入数据为影响待放映电影的票房有关的信息数据,通过此方式可以准确预测出待放映电影的次日票房。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1