电影制作是一个非常复杂的过程,从开始确定成本到制定有针对性的营销活动,涵盖多个流程。数据科学几乎涉及到该过程中的每一步,而且从事数据科学工作的专业人员,也可以从电影行业中学到很多东西。
流媒体服务可以说处于数据科学领域的最前沿。很多视频制作公司会分析大数据中的模式,为他们的内容创作提供参考,并为用户提出个性化的观看建议。通过这种方式,数据科学可以帮助影视娱乐创作和营销达到前所未有的水平。
数据科学本身也在各种电影中成为创作主题。近年来,以阿兰图灵和约翰纳什等现实生活中的著名人物为原型的故事已经被搬上了大荧幕,同时也有很多以预测分析,机器学习和人工智能为主题的虚构电影。
整个社会对数据科学的关注表明,未来会出现更多有关这一主题的电影。此外,影师制作公司也将通过数据科学技术来更好地理解个人观看习惯和偏好,以创作更加吸引观众的内容。
电影的成功指标和相关数据
技术可以告诉电影制作人他们应该如何去制作电影,以及如何去进行营销。从电影选角,到甚至是营销中使用的配色,电影的每个方面都会影响票房。使用数据科学技术,我们可以预测观众的偏好,并确定如何优化内容以实现其最大潜力。
预测观众对电影的期望,几乎可以说是票房的保证了。2018年,被迪士尼公司收购的福克斯发布了一篇论文,概述了如何使用机器学习分析电影预告片的内容。在这一过程中,收集的数据用于对比预告片,并预测看过该预告片会对其他哪些类型的电影感兴趣。
福克斯使用谷歌服务器和开源AI框架TensorFlow创建了Merlin,一个“实验性的电影上座率预测和建议系统。”在Merlin的试运行期间,电影公司使用该工具分析了《金刚狼3:罗根》的预告片,预测《洛根》的观众可能会感兴趣的其他电影。在20个预测中,有11个是正确的。
预测名单中包括:《X战警:天启》、《疾速特攻2》、《奇异博士》、《蝙蝠侠大战超人:正义黎明》和《自杀小队》。一般来说,《洛根》的观众想看的是一部拥有“硬汉男主角”的超级英雄电影。
虽然Merlin的数据解释并不完美,但它确实是过去十年软件开发进步的一个典型例子。为了使程序员能够更好地专注于改进AI算法,未来的软件开发必须在减少花费在琐事上的时间方面制定措施。由于AI旨在专注于单个任务,因此它是提高程序内数据分析准确性的要点。
大数据在流媒体网站中的作用
当大数据的概念在2010年左右首次出现时,有效地改变了将数据分析转化为有用洞察和价值的方法。大数据一般来自于外部,使用来自互联网、公共数据源等位置的信息来进行更准确的预测。在娱乐行业中,大数据可用于提供个性化的用户体验并降低流媒体网站的观众流失率。
看似有海量的电影和电视节目供用户选择,但要留住观众对流媒体服务和电影制作公司是至关重要的。如果流失率过高,那就表明公司做错了,通过与机器学习相结合,大数据可以帮助公司识别问题点出现在哪里。
在流媒体服务中,用户界面在观众留存中起到了重要作用。例如,如果对观众感兴趣的内容推荐不准确,就可能导致观众转向其他平台。流媒体服务公司非常清楚,提供一个好的用户体验是非常重要的。
为了留住观众,Netflix开发了自适应流媒体算法,并持续改进它,以优化流媒体质量并创建个性化的用户体验。该公司会调整媒体的音频和视频质量,以优化体验;还使用预测性缓存来让视频更快或更高质量地播放。例如,如果观看者正在观看一个系列节目,则将部分缓存下一集。
从该公司的利润增长上看,Netflix算法取得了巨大的成功:自2015年以来,Netflix的利润增长了30%以上,每年的收入达到166.14亿美元。
电影业的预测分析
类似于Merlin这样的应用程序,对影视市场的预测分析的影响是非常大的,但需要更大的数据集才能找到准确的模式。在过去的几十年中,研究人员收集了数千部电影和电视节目的数据,以寻找可行的预测指标,包括角色类型、情节复杂性、明星影响力、预算或围绕特定电影的展开的“热议”和营销活动。
从某种意义上说,这种热议是值得注意的,因为信息来自于众多不同的来源,例如社交媒体和批评性评论。然而,围绕电影的热议只是整个分析中的一小部分,数据分析应该涉及电影的每个生命周期阶段,从开发到后期制作和发布。
预测分析可以帮助创作者,创作公司和管理人员进行战略决策,预测趋势并更好地了解观众的习惯。知情决策对电影制作过程至关重要,获取高质量、高可用性的数据是观众留存和利润的关键。数据科学家需要不断思考如何去利用预测分析和大数据,将这些知识应用充分到商业环境中。(作者:FrankieWallace)