导航:首页 > 院线电影 > 电影票房预测模型

电影票房预测模型

发布时间:2022-04-21 13:07:49

1. 怎样预测票房


票房预测:需求与现实



从1896年西洋影戏传入上海徐园,到1905年中国拍摄首部国产电影《定军山》,再到2013年全国电影票房突破200亿
大关,(4)有着百余年历史的中国电影产业,在近几年呈现出飞跃式发展的态势,无论是影片质量、院线建设还是投资规模都有了长足的发展。与此同时,随着
“大数据”时代的到来,电影观影群体、观影偏好与心理、电影信息传播和获取方式也都在发生着深刻的变化。



毋庸置疑,多样化资本的加入是中国电影不可或缺的发展引擎,然而,电影行业以投资回报率难以预测著称,大投入未必有大产出,票房预测工具的缺失使得投资者
无法有效对冲投资风险,华人著名导演吴宇森的《风语者》就拖累了米高梅公司最终走向破产。因此制作与发行公司不得不考虑所有对票房有影响的因素:辣妈李小
璐对《私人订制》票房贡献几何;《风暴》票房为何远低于其金牌制片人江志强预期;被吐槽“烂片”的《富山春居图》和《小时代》缘何票房却一路走红;成龙大
叔的《警察故事2013》有无必要拍成3D;《泰囧》的“报复性”观影效应能否复现……这一切的一切其实都可以从“大数据”中找到答案。因为网络上的每一
次浏览、查询乃至点击所汇聚成的群体智慧都“蝴蝶效应”般地影响着电影的最终票房。



2013年Google在一份名为《Quantifying Movie Magic with Google Search》(5)
的白皮书中公布了其电影票房预测模型,该模型主要利用搜索、广告点击数据以及院线排片来预测票房,Google宣布其模型预测票房与真实票房的吻合程度达
到了94%,但并未见其公开对未上映电影的预测结果。



搜狗公司借助“深思”系统,建立了更为复杂的模型,用于预测国内电影票房,并在新浪微博上提前发布了2013年12月国内上映电影的首周票房预测结果。很高兴到目前为止预测结果与真实数据非常接近,同时,我们的模型还可以用于对影响票房的因素进行定量分析。





搜索查询量的奥秘



搜狗搜索每天都响应上亿次的搜索请求,查询词的分布和变化趋势能够很好的反映出中国网民的兴趣点和关注指向。与Google的研究类似,我们也发现,电影
上映前相关查询词的搜索次数与票房收入有着很强的关联性。这一点很好理解,用户的主动搜索行为体现了用户对这部电影的潜在兴趣。



我们选取了2013年1-11月国内上映的180部电影的票房和上映前的搜索量数据作为训练集,用于训练一个基础的线性回归模型。实验发现,单纯利用搜索
量训练得到的模型,预测得到的首周票房与真实票房的相关度R方值仅为68%,这与Google仅用搜索数据得到的结果70%很接近。(注:R方值取值为0
至1,值越大表示模型预测效果越好),这个结果也说明无论在中国还是美国,用户的搜索行为是很相似的。





用搜索量来进行预测票房是一个好的开始,但是准确度还远远不够。同时很多搜索词还存在歧义的情况,比如《生化危机》,既是电影也是游戏,混在一起会造成票
房预测值偏高。进一步研究发现,游戏意图的查询请求量较为平稳,但电影意图的查询请求在上映前则有一个高峰,也可以通过用户点击的URL来进一步确认用户
的搜索意图。因此模型需要再引入查询量的变化趋势和用户点击的分布情况。修正后的模型可以达到74%的准确度,这时模型已经可以对电影票房进行一个粗略的
估计。







社交媒体:用户的情感分析



社交媒体数据对票房预测也会有一定帮助。假设你是某个明星的粉丝,打算去看他主演的电影,那么你很可能会提前转发该电影的相关微博给你的朋友。国外已经有
很多预测项目都是在针对Twitter数据做研究,这里我们主要采用国内部分微博网站的数据来进行预测。通过自然语言理解技术,分析出用户对未上映影片的
情感倾向,从而转换为用户的观影需求。进一步可以考虑的因素包括微博转发深度、评论活跃程度,以及相关微博数量随电影上映日期临近的变化趋势,这些数据都
可以被有效的提炼为特征并加入到模型中。



微博数据的加入使得准确率超过了80%。





结语



预测专家纳特·西尔弗在《信号与噪声:大数据时代预测的科学与艺术》一书中提到,大数据时代的预测更容易失败,大部分失败的预测都源于一种盲目的自信,用精确的预测来冒充准确的预测。



对此我们有着清醒的认识,目前的票房预测模型还有若干需要改进的方向。首先,目前模型的主要思想是通过电影上映前的用户关注度来推算首周票房,这实际上没
有考虑电影上映后的口碑对票房的影响;其次,模型较为依赖历史数据,可能难以识别一些上映后脱颖而出的小成本“黑马”电影;再次,目前的技术只能提前10
天预报出首周票房,还可以更加超前。



总体而言,“深思”系统代表了搜狗公司在社会化预测方面一些新的尝试。我们试着从繁杂的海量数据中筛选出真正的信号,努力穿越不确定性的迷雾,区分出未来
图景的哪些部分可以预测,哪些不可预测。通向这个未来的道路还在探索之中,但目前工作已经取得了一些不错的进展,并给予了我们更大的信心。

2. 电影票房预测系统的电影票房如何预测

早在80年代,美国票房收入预测的先驱BarryLitman对美国80年代近700部电影进行分析推出票房收入预测模型。该系统对之后美国电影投资界产生了颠覆性的影响。电影票房预测系统能分析预测不同种类电影的票房价值,已经成为国际电影产业投融资的重要参考工具,对电影产品定价及衍生产品开发都具有较强的指导作用。

3. 电影票房预测系统的介绍

电影票房预测系统,美国票房收入预测的先驱BarryLitman对美国80年代近700部电影进行分析推出票房收入预测模型。

4. 如何专业地预估票房

图1. 2012年票房收入与搜索量的曲线 (红色是票房收入,灰色是搜索量,横轴是月份,纵轴是数量) 经过改进后的模型: 图2 提前一个月预测票房的效果 (横轴是预告片搜索量,纵轴是首周票房收入,灰色点对应实际某部电影的首周票房收入,红色点对应预测的首周票房收入) Google可以通过这个模型提前一个月预估出电影票房,不过如果是在拍电影前就预估票房,可能不太现实,之前有个问题也回答过,其实演员在拍一部好片或者烂片的时候,心态是差不多的。在没开拍电影前,就预估票房,很可能本身就是个误会。

5. 电影票房分析及预测

在缺少衍生品市场的当下,电影投资主要以票房为主要收入来源,因此前期的票房预测就显得十分重要,能让投资者提前预判项目的大致受益,并通过合适的宣发手段来提高影片的关注度,以便提高最终的票房收入。

新传智库自主研发的票房预测系统就从去年11月份开始,以影片自身题材、主创阵容、大盘、档期、口碑、对手、首日及首周市场表现等为主要依据,对部分上映新片进行票房预测。虽然仍与实际结果有一些出入,但部分结果却做到了高度的精准,可以此为基础详细解释一下票房预测的思路、要点等。

映前主创信息—模糊分类,预测票房起点

由于此时影片很多都尚在制作阶段,一般意义上,只能按照影片的题材、主创阵容、演员明星等推测影片的题材与体量,仅能大致分为大型制作、中等制作、小成本三大类,但这一指标却具有极大的不确定性与不稳定性,且预测难度也是逐步上升。

大成本制作,一般都有着大笔特效投入、知名导演明星参与,有的还有着一定的IP基础,无论哪一方面都能吸引到大量的关注,因此其票房成绩总体已经维持在了一定的水平,票房起点应该在5亿以上。

相比于大制作,中等制作一般是轻工业产品,可能会有一些名导与明星共同参与,题材内容方面贴近现实,一般多为喜剧片、爱情片、剧情片,缺少武侠、动作、科幻、奇幻等题材所需要的大场面特效的加持。

中等成本制作总体较难预测,票房区间从千万级别到亿元级别都有分布。此时演员、导演的因素一般会被放大,明星云集的影片更容易在同类型中获取更多关注,《我不是潘金莲》、《摆渡人》等都属此类;同时,喜剧片的成绩普遍要好于爱情片、剧情片等其他类型,可适当加分,如去年的《从你的全世界路过》和《奔爱》都主打明星牌,但的8.14亿和4751万的成绩却有着天壤之别。

而小成本制作则相对即简单有困难,从题材到主创的毫无新意使得其注定要成为彻彻底底的炮灰,票房成绩也均在一千万以下,多数进口批片、国产剧情片、恐怖片等都属于这种行列。但其内部之间仍然有着较大的差异,根据大盘、档期、对手等的变化仍有小幅的波动,很难利用现有指标精准预测其最终成绩。不过对于此类制作而言,精准预测的意义也并不大。

映前第三方指数—纵向对比,预测票房区间

第三方指数(如猫眼想看指数、网络搜索指数等)反映的是观众对于影片的关注度与认可度,极有可能转化为电影的实际票房支持,因此据有较高的参考价值。

对于猫眼想看指数,一般从影片正式上映一个月左右,就可以作为有效的参考指数。

指数长期保持在高水平(一般日增想看指数维持在3000人以上)则是所谓的大片,其最终市场表现往往取决于口碑,口碑好的话会在一般水平上有所上扬,口碑不理想的情况下,自然就会有一定程度的缩水。

而映前短期内(一般为一周左右)相关指数暴涨的影片其更容易成为爆款,在预测这类影片票房成绩时应适度扩大其预测值,但却很难估测其最终的落脚点,最重要的是看同期竞争影片的表现。

对于每日日增想看人数仅在几百左右的影片,则应已经注定了其票房成绩难有起色。上周五上映的三部新片可以明显的反映出这种趋势(对于小成本而言,这一指标的参考意义并不大,相关平台一般缺少相关数据,难以以此做出有关的推论):

而网络搜索指数更多的是整体反应票房的大致趋势,常用于与其他已上映影片的对比分析,以最近上映的三部进口大片《金刚狼3:殊死一战》、《生化危机:终章》、《极限特工:终极回归》为例,可以发现《金刚狼3》的映前的热度明显低于后两这,因此其在票房上也难以达到两者的成绩。

第三方指数,仅用于初步判断影片的热度,最重要的意义来源于与相关影片的精准对比,数字本身与最终票房之间并没有特别确定的函数转换关系。

大盘趋势与对手实力—小幅调整,缩小预测范围

大盘的走向往往反映着整体的体量,约束着一段时期内电影市场天花板的高度,因此对于单个影片的影响程度较高,春节档多方厮杀仍然平均分力,就在于市场容量的巨大,这也正是众多影片抢占档期的重要因素所在。

除了档期以外,各月份也是有好有坏,3月、9月、11月等都是著名的淡季,全月的总体量在20——30亿左右,萎靡的大盘难以被众多影片平均分割,其票房成绩自然也会有所下滑。但此时大盘的主要限制的是中等制作与小成本影片,大制作反而更因为观众选择面窄小而获利。而对大盘进行预测时,一般可参照去年同期的总量,并根据增势做相应的调整。

除此之外,对手的实力也是影响票房的最重要因素。《功夫瑜伽》能够力压《西游伏妖篇》登顶春节档冠军很大一部分原因在于《西游伏妖篇》的口碑不足。市场热度和总量一定的情况下,重点影片的差评自然会催动其他影片成为“爆款”。

而同类题材也是重要对手,《金刚狼3》的成绩不如《极限特工:终极一战》、《生化危机:终章》;去年的《佩小姐的奇幻城堡》远低于《奇异博士》和《神奇动物在哪里》等都有观众审美疲劳的原因在里面。因此,在这种情况下,即便影片口碑不俗,仍需调低票房预期。

上映首日排片、首周末票房——完全锁定票房成绩

以上的预测都处于前期阶段,在影片正式落地之前,谁也无法比较精确的预测影片的最终票房成绩,但到了影片正式上映之后,则一切都有了较为明显和科学的依据。

虽然排片并不能决定一部影片的生死,但却无疑有着极大的左右能力,限制着影片的市场发挥空间,是市场专业人士的预判。

一般情况下,排片占比与票房占比之间存在着一定的一致性,但马太效应明显。通俗而言,占据市场4成左右排片的影片一般会贡献出5——6成,甚至是7成的票房;排片在2成左右的影片,其票房成绩与排片占比大致相同,而排片在1成以下的影片,通常其票房贡献量会低于5%。

多数影片都集中于周五上映,恰逢大盘最火热时期(个别节假日及档期除外),而首周末三天口碑已出、接下来的工作日整体低迷、周五面临新片冲击,因此已经可以看出其市场走向如何了。

总体而言,对于一般的大型制作,其首周末票房占总票房的比重一般会在40%——50%;中等成本因为其本身的不确定性,用此方法相对较难以预测,但首周末票房所占的比例一般都会在60%——80%之间。而对于小成本,其首周末票房的占比有时会高达90%。

以2016年票房过亿的85部影片为例,其首周末票房占比分布如下(已祛除部分上映日期异常影片):票房成绩在10亿以上的影片,首周末平均占比为31.09%;5亿——10亿之间,为45.24%;1亿——5亿之间,平均为63.03%。

此时还需要考虑的一点就是后续长尾效应。多在于其上映的第二周有没有强劲的足够挑战影片时长份额的大片上映,如果没有的话,影片的影响力可能会持续,尤其是在下周末会引来一次小的高峰,帮助影片的总体成绩提升。

6. 如何评价电影票房预测模型的发展和建设瓶颈

从我们的分析与实际操作来看,实际上对电影票房预测模型的发展与建设造成最大阻碍的在于数据的不真实性、指标的选择可用性以及一些违规暗箱操作上;还有譬如电影市场的发展速度太快,去往的历史数据可参考性低,模型得跟着市场的变化而变化等这些方面,在我们建模时造成了极大的阻碍。而基于我们的电影票房预测模型,我们的预测有相当的准确性与可信度。从2015年7月到现在我们每天都会公布我们的票房预测结果,在于竞争对手的比拼与较量中始终保持领先地位,准确率一直保持全国第一。而我想,如果当数据、指标、操作开始正规化明朗化,电影票房的预测模型也将越做越好,越做越准。

阅读全文

与电影票房预测模型相关的资料

热点内容
after3免费完整下载 浏览:946
监狱暴力犯罪电影 浏览:568
韩国电影爱情片打电话邂逅 浏览:817
北京送快递小哥电影 浏览:640
金希贞的全部韩剧电影在线观看 浏览:285
以前有部电影里面有个女鬼 浏览:548
木星上行国语版在线免费观看 浏览:421
《飞夺泸定桥》电影 浏览:478
1905下载的视频在哪个文件夹 浏览:972
美片 浏览:150
外国一个电影骑着发火的摩托 浏览:1000
晚上我经常和我的父母一块看电视英语 浏览:631
韩国阿强和阿珍是什么电影 浏览:312
看电影九排 浏览:308
天主教宗教题材电影 浏览:417
二战电影虎虎虎国语版 浏览:332
战斗机 电影 浏览:937
成龙教外国小孩功夫电影叫什么 浏览:672
看电影怎么英文怎么翻译软件 浏览:77