1.一种基于神经网络算法的电影票房预测方法,其特征在于,包括:
步骤1,选择M个票房影响因素;查询并计算多个已下线电影的M个票房影响因素的票房影响力指标;
步骤2,根据所述已下线电影的M个票房影响因素的票房影响力指标和所述已下线电影的票房进行相关性分析,得到M个票房影响因素与电影票房的相关系数,从M个票房影响因素中选择N个相关系数较大的票房影响因素作为N个票房主要影响因素,其中,N小于或等于M;
步骤3,确定神经网络的输入层的神经元个数为N,输出层的神经元个数为票房的分段个数为K;根据所述输入层的神经元个数N和所述输出层的神经元个数K确定所述神经网络的隐含层的神经元个数为L;
根据所述多个已下线电影的N个票房主要影响因素的票房影响力指标训练所述神经网络直至预测误差均小于预设门限值,则训练成功;
步骤4,确定待预测电影的N个票房主要影响因素的票房影响力指标,将此N个票房主要影响因素的票房影响力指标作为输入数据输入至训练成功的神经网络,根据神经网络的输出结果确定待预测电影的预测票房。
2.如权利要求1所述的基于神经网络算法的电影票房预测方法,其特征在于,
所述步骤3中进行神经网络训练的方法包括:
步骤301,设置输入层神经元的个数为N,输出层神经元的个数为K;根据所述多个已下线电影的票房数据确定票房的分段,共分为K段,对所述多个已下线电影进行分类,将票房数据属于同一分段的已下线电影分为一类;确定K个期望输出矢量E,每个期望输出矢量包含K个元素;初始化输入层和隐含层之间的连接权值ωij、输入层和输出层之间的连接权值ωjk、隐含层阈值a、输出层阈值b,学习速率η和神经元激励函数f(x);
步骤302:输入已下线电影的N个票房主要影响因素X,计算隐含层输出H:
步骤303:根据隐含层输出Hj,连接权值ωjk和阈值b,计算神经网络的是输出O:
步骤304:根据神经网络的输出O和期望输出E,计算网络预测误差e
ek=Ek-Ok,k=1,2,..,K
步骤305:根据网络预测误差ek更新网络连接权值ωij,ωjk
ωjk=ωjk+ηHjekj=1,2,...,L;k=1,2,...,K
步骤306:根据网络预测误差e更新网络节点阈值a,b
bk=bk+ek;k=1,2,...,K
步骤307:判断算法迭代是否结束即对所有已下线电影的N个票房主要影响因素x的网络预测误差是否均小于预设门限,如果是,训练成功,如果否,返回步骤302。
3.如权利要求1所述的基于神经网络算法的电影票房预测方法,其特征在于,
所述票房影响因素包括下述因素中的多个:电影类型、原创与否、IP改编与否、续集与否、上映天数、首周票房、口碑评分、二次售卖、衍生品与否、海外收益与否、获奖情况、第k个导演、第一男主演、第i男主演、第一女主演、第i女主演、制片人、编剧、制作公司、发行公司、发行档期、网络搜索指数、涉交网络搜索指数、同期竞争片数、同类型竞争片数,其中k为大于0的整数,其中i为大于1的整数。
4.如权利要求1或2所述的基于神经网络算法的电影票房预测方法,其特征在于,
所述票房影响因素的票房影响力指标的计算方法包括:
所述票房因素为电影类型时,票房影响力指标为电影的上映首周中与此电影属于相同类型的各电影的票房之和除以与此电影属于相同类型的电影的个数所得的商;
所述票房因素为原创与否时,电影为原创时票房影响力指标为1,电影为非原创时票房影响力指标为0;
所述票房因素为产权改编与否时,电影为产权改编时票房影响力指标为1,电影为非产权改编时票房影响力指标为0;
所述票房因素为续集与否时,电影为续集则票房影响力指标为1,电影不是续集则票房影响力指标为0;
所述票房因素为上映天数时,票房影响力指标为电影的上映天数;
所述票房因素为首周票房时,票房影响力指标为电影上映期间的首周的票房值;
所述票房因素为口碑评分时,票房影响力指标为至少两个电影评论网站上对电影的评分的均值;
所述票房因素为二次售卖与否时,电影是经过二次售卖的电影时票房影响力指标为1,电影不是经过二次售卖的电影时票房影响力指标为0;
所述票房因素为衍生品与否时,电影有衍生品时票房影响力指标为1,电影没有衍生品时票房影响力指标为0;
所述票房因素为海外收益与否时,电影有海外收益时票房影响力指标为1,电影没有海外收益时票房影响力指标为0;
所述票房因素为获奖情况时,票房影响力指标为电影获奖的个数;
所述票房因素为第k个导演时,票房影响力指标为此导演曾经导过的所有电影的首周票房的平均值;
所述票房因素为第一男主演时,票房影响力指标为此第一男主演曾经演过的所有电影的首周票房的平均值;
所述票房因素为第i男主演时,票房影响力指标为此第i男主演曾经演过的每个电影的首周票房与其在此电影中的参演系数的乘积之和与此第i男主演曾经演过的电影的数量的商;其中i为大于1的整数;
所述票房因素为第一女主演时,票房影响力指标为此第一女主演曾经演过的所有电影的首周票房的平均值;
所述票房因素为第i女主演时,票房影响力指标为此第i女主演曾经演过的每个电影的首周票房与其在此电影中的参演系数的乘积之和与此第i女主演曾经演过的电影的数量的商;其中i为大于1的整数;
所述票房因素为制片人时,票房影响力指标为制片人曾经制作的所有电影的首周票房的平均值;
所述票房因素为编剧时,票房影响力指标为编剧曾经编的所有电影的首周票房的平均值;
所述票房因素为制作公司时,票房影响力指标为电影的所有制作公司所制作的电影的总个数与制作公司的总个数的商;
所述票房因素为发行公司时,票房影响力指标为电影的所有发行公司所发行的电影的总个数与发行公司的总个数的商;
所述票房因素为发行档期时,票房影响力指标为电影的发行档期所属的档期类别下所有同档期类别的电影的首周票房与档期类别的天数的商;
所述票房因素为网络搜索指数时,票房影响力指标为电影上映期间第一搜索网络上的搜索周平均值;
所述票房因素为涉交网络搜索指数时,票房影响力指标为电影上映期间第一涉交网络的搜索单日最大值;
所述票房因素为同期竞争片数,票房影响力指标为电影在同一上映时期的竞争片的个数;
所述票房因素为同类型竞争片数,票房影响力指标为电影在同一上映时期的同类型竞争片的个数。
5.一种基于神经网络算法的电影票房预测系统,其特征在于,包括:第一计算模块、相关性分析模块、选择模块、第二计算模块、神经网络控制模块;
所述第一计算模块用于选择M个票房影响因素;查询并计算多个已下线电影的M个票房影响因素的票房影响力指标;
所述相关性分析模块用于根据所述已下线电影的M个票房影响因素的票房影响力指标和所述已下线电影的票房进行相关性分析,得到M个票房影响因素与电影票房的相关系数,
所述选择模块,用于从M个票房影响因素中选择N个相关系数较大的票房影响因素作为N个票房主要影响因素,其中,N小于或等于M;
所述第二计算模块,根据所述多个已下线电影的N个票房主要影响因素的票房影响力指标训练所述神经网络直至预测误差均小于预设门限值,则训练成功;
所述神经网络控制模块,用于确定待预测电影的N个票房主要影响因素的票房影响力指标,将此N个票房主要影响因素的票房影响力指标作为输入数据输入至训练成功的神经网络,根据神经网络的输出结果确定待预测电影的预测票房。
6.如权利要求5所述的基于神经网络算法的电影票房预测系统,其特征在于,
所述神经网络控制模块,根据下述方法进行神经网络训练的方法包括:
步骤301,设置输入层神经元的个数为N,输出层神经元的个数为K;根据所述多个已下线电影的票房数据确定票房的分段,共分为K段,对所述多个已下线电影进行分类,将票房数据属于同一分段的已下线电影分为一类;确定K个期望输出矢量E,每个期望输出矢量包含K个元素;初始化输入层和隐含层之间的连接权值ωij、输入层和输出层之间的连接权值ωjk、隐含层阈值a、输出层阈值b,学习速率η和神经元激励函数f(x);
步骤302:输入已下线电影的N个票房主要影响因素X,计算隐含层输出H:
步骤303:根据隐含层输出Hj,连接权值ωjk和阈值b,计算神经网络的是输出O:
步骤304:根据神经网络的输出O和期望输出E,计算网络预测误差e
ek=Ek-Ok,k=1,2,..,K
步骤305:根据网络预测误差ek更新网络连接权值ωij,ωjk
ωjk=ωjk+ηHjekj=1,2,...,L;k=1,2,...,K
步骤306:根据网络预测误差e更新网络节点阈值a,b
bk=bk+ek;k=1,2,...,K
步骤307:判断算法迭代是否结束即对所有已下线电影的N个票房主要影响因素x的网络预测误差是否均小于预设门限,如果是,训练成功,如果否,返回步骤302。
7.如权利要求5所述的基于神经网络算法的电影票房预测系统,其特征在于,
所述票房影响因素包括下述因素中的多个:电影类型、原创与否、IP改编与否、续集与否、上映天数、首周票房、口碑评分、二次售卖、衍生品与否、海外收益与否、获奖情况、第k个导演、第一男主演、第i男主演、第一女主演、第i女主演、制片人、编剧、制作公司、发行公司、发行档期、网络搜索指数、涉交网络搜索指数、同期竞争片数、同类型竞争片数,其中k为大于0的整数,其中i为大于1的整数。
8.如权利要求5或6所述的基于神经网络算法的电影票房预测系统,其特征在于,
所述第一计算模块,还用于根据以下方式计算票房影响因素的票房影响力指标:
所述票房因素为电影类型时,票房影响力指标为电影的上映首周中与此电影属于相同类型的各电影的票房之和除以与此电影属于相同类型的电影的个数所得的商;
所述票房因素为原创与否时,电影为原创时票房影响力指标为1,电影为非原创时票房影响力指标为0;
所述票房因素为产权改编与否时,电影为产权改编时票房影响力指标为1,电影为非产权改编时票房影响力指标为0;
所述票房因素为续集与否时,电影为续集则票房影响力指标为1,电影不是续集则票房影响力指标为0;
所述票房因素为上映天数时,票房影响力指标为电影的上映天数;
所述票房因素为首周票房时,票房影响力指标为电影上映期间的首周的票房值;
所述票房因素为口碑评分时,票房影响力指标为至少两个电影评论网站上对电影的评分的均值;
所述票房因素为二次售卖与否时,电影是经过二次售卖的电影时票房影响力指标为1,电影不是经过二次售卖的电影时票房影响力指标为0;
所述票房因素为衍生品与否时,电影有衍生品时票房影响力指标为1,电影没有衍生品时票房影响力指标为0;
所述票房因素为海外收益与否时,电影有海外收益时票房影响力指标为1,电影没有海外收益时票房影响力指标为0;
所述票房因素为获奖情况时,票房影响力指标为电影获奖的个数;
所述票房因素为第k个导演时,票房影响力指标为此导演曾经导过的所有电影的首周票房的平均值;
所述票房因素为第一男主演时,票房影响力指标为此第一男主演曾经演过的所有电影的首周票房的平均值;
所述票房因素为第i男主演时,票房影响力指标为此第i男主演曾经演过的每个电影的首周票房与其在此电影中的参演系数的乘积之和与此第i男主演曾经演过的电影的数量的商;其中i为大于1的整数;
所述票房因素为第一女主演时,票房影响力指标为此第一女主演曾经演过的所有电影的首周票房的平均值;
所述票房因素为第i女主演时,票房影响力指标为此第i女主演曾经演过的每个电影的首周票房与其在此电影中的参演系数的乘积之和与此第i女主演曾经演过的电影的数量的商;其中i为大于1的整数;
所述票房因素为制片人时,票房影响力指标为制片人曾经制作的所有电影的首周票房的平均值;
所述票房因素为编剧时,票房影响力指标为编剧曾经编的所有电影的首周票房的平均值;
所述票房因素为制作公司时,票房影响力指标为电影的所有制作公司所制作的电影的总个数与制作公司的总个数的商;
所述票房因素为发行公司时,票房影响力指标为电影的所有发行公司所发行的电影的总个数与发行公司的总个数的商;
所述票房因素为发行档期时,票房影响力指标为电影的发行档期所属的档期类别下所有同档期类别的电影的首周票房与档期类别的天数的商;
所述票房因素为网络搜索指数时,票房影响力指标为电影上映期间第一搜索网络上的搜索周平均值;
所述票房因素为涉交网络搜索指数时,票房影响力指标为电影上映期间第一涉交网络的搜索单日最大值;
所述票房因素为同期竞争片数,票房影响力指标为电影在同一上映时期的竞争片的个数;
所述票房因素为同类型竞争片数,票房影响力指标为电影在同一上映时期的同类型竞争片的个数。