HoloCine | lc's space

文章标题：HoloCine: Holistic Generation of Cinematic Multi-Shot Long Video Narratives
文章地址：https://arxiv.org/abs/2510.20822
CVPR 2026 Highlight

当前的T2V模型在生成单独片段视频很出色，但不能生成一致的、多镜头的视频，这对于故事叙述来说非常重要。针对多镜头视频生成，提出了HoloCine，一次生成多镜头视频框架。方法来说，同样需要用户提供分镜的timestamp以及各分镜的prompt，然后精心设计了self-attention和cross-attention提高prompt准确度和推理效率。数据来自电影数据，通过镜头切分筛选，然后拼接连续的镜头满足不同时长，最后得到了400k条数据。

数据：自己构造（未开源）
硬件：128 H800
开源：https://holo-cine.github.io/

EchoShot

SkyReels-V3