Web3天空之城| 城主
最近, 花了不少时间在视频生成领域, 把国内外的最新顶级视频大模型深入翻了个遍. 为的是确认一个小问题: 真人AI影视的时代是否已经到来.
当然, 这话题也可以说了无新意, 因为关心视频生成这个领域的同学都知道, 无论如何,我们都可以手工搓出每一个镜头图片, 然后再手搓出各个视频分镜头 - 这里显然还有很多的细节, 比如哪个大模型更适合合成真人静态图片, 哪个大模型更容易从参考图得到高质量的生成视频.
但 这个事情总是可以做的. 无非是说要花的时间而已.
只是 这时间问题, 就是目前真人AI影视生成的核心问题了. 如果只是做一个几十秒的广告片, 花上几星期去手搓打磨是完全没问题的, 也是应该的- 每一个镜头都需要甲方乙方反复的沟通确认.
但动则几十分钟, 甚至一两个小时的影视制作呢?
手搓真人AI视频就像是一个工坊小制作, 可以做出一个精致的艺术品, 但这个技能无法延伸出一个影视级制作, 更无法成为一个影视生产的流水线 -- 即使这样的手搓流水线真的存在, 其人员培训成本和维护成本一定是相当高的.
这和所谓动漫AI短剧生产还不太一样. 目前已经有一些团队使用ai制作一些静态漫剧甚至更高质量的动漫AI短剧了, 但相对于真人AI视频, 动漫AI视频的门槛低了不止一点, 比如人物一致性和影视表现的要求(画面光影, 人物互动,对话,等等), 不在一个等级上.
前一两周有流传过一个帖子, 使用一张图来生成多个分镜图, 这个方法用来生成病毒传播的短视频还可以(就像使用sora生成十几秒的视频), 但对于动则上百上千个镜头的影视内容, 如何确保其连续性和表现的专业性呢?
不过, 这些问题并不是无法解决的,甚至可以反过来说, 这些问题克服之后, 基于AI的长篇视频内容的生产打造将展示出无与伦比的威力.
无论如何, 城主可以断言, 真人AI影视的时代已经悄悄来了, 不用很久, 我们可以看到基于AI视频的完整真人短剧甚至电影.
这篇小文, 用来附带和大家分享一个实验短剧 <凡人职场传> 的EP1. 作为凡人的粉丝, 致敬一下:)