基于扩散模型的结构和内容引导视频合成

Patrick Esser,Johnathan Chiu,Parmida Atighehchian,Jonathan Granskog,Anastasis Germanidis
我们提出了一种基于结构和内容的视频传播模型。该模型使用不同层次特征对原始剪辑进行编码,并在图像和视频上进行训练,用户提供的内容编辑和结构表示:之间的冲突是由于两个方面缺乏衔接。作为解决方案,我们证明了通过各种细节级别的权重来实现结构和内容精确性可以获得关于时间...

用户分享观点: