港中文斯坦福提出SD加速模型PCM，一步即可生成图像和视频，可直接与SD1.5,SDXL,AnimateLCM结合！

2026/2/16 0:39:46 来源：https://blog.csdn.net/xs1997/article/details/139509314 浏览: 次关键词：港中文斯坦福提出SD加速模型PCM，一步即可生成图像和视频，可直接与SD1.5,SDXL,AnimateLCM结合！

又有新的SD加速模型可以用了，PCM解决了原来LCM模型的各种问题。并且对 AnimateLCM 也做了优化，用PCM直接生成动画也可以保证质量了。 PCM从这三个角度说明了LCM的设计空间是有限的并很好地解决了这些限制。

PCM主要改善了三个LCM原有的问题：

阶段性一致性模型:朝着稳定、快速的图像和视频生成方向发展

一致性模型(CM)是一种具有高质量和快速生成特性的新型生成模型。潜在一致性模型(LCM)试图将其扩展到文本条件下的高分辨率生成的潜在空间。然而，其结果并不令人愉快。在这项工作中，我们表明了当前LCM的设计在三个方面存在缺陷。

我们提出了相位一致性模型~(PCM)，推广了LCM的设计空间，很好地解决了这些局限性。在训练和推理两方面提出了创新策略，以提高生成质量。包括1步、2步、4步、8步、16步在内的大量实验结果以及广泛应用的稳定扩散和稳定扩散XL基础模型验证了PCM的进步。

潜在一致性模型有三个主要的局限性。

在这项工作中，我们调查了这些限制背后的原因，并提出了PCM，它很好地解决了所有这些限制。

由PCM一步生成的图像

由PCM一步生成的图像

与AnimateLCM在低步进模式下的视频生成质量比较。模型可以在两个步骤中生成高质量的视频。

尽管可以在几个步骤中生成高质量的图像和视频，但我们发现当步数很低，特别是只有一步，生成质量不稳定。模型可能产生结构错误或图像模糊。

幸运的是，我们发现这种现象可以通过多步细化来缓解。总之，在本文中，我们观察到了缺陷在文本条件控制下使用一致性模型生成高分辨率潜在空间。本文从三个层面对这些缺陷进行了总结，分析了缺陷产生的原因，并概括了缺陷的设计框架来解决这些缺陷。

相关资讯