先上结果
这个视频的最初是一张图.用小程序[字形绘梦]随意生成一张你喜欢的美图.然后调用
https://www.2video.cn 下的 图生文 短视频制作功能.就得到了上述视频效果.
下面解析下它的实现步骤,您首先需要:
文本编码器和VAE:
umt5_xxl_fp8_e4m3fn_scaled.safetensors位于:ComfyUI/models/text_encoders/
wan_2.1_vae.safetensors位于:ComfyUI/models/vae/
视频模型
扩散模型可以在这里找到
注意:建议使用 fp16 版本而不是 bf16 版本,因为它们会产生更好的结果。
质量排名(从高到低):fp16 > bf16 > fp8_scaled > fp8_e4m3fn
这些文件位于:ComfyUI/models/diffusion_models/
这些示例使用 16 位文件,但如果内存不足,则可以使用 fp8 文件。
下载工作流文件:
https://www.2video.cn/static/public_res/image_to_video_wan-api.json
效果图如下

点击运行就可以了.
重要的知识点:
- 选择fp16的模型,制作时间大约在10分钟.还是有点久的.但是效果非常好.
- 如果选择fp8的,制作时间大约在2分钟左右.质量还行.
- 选择模型是480的还是720的制作时间差异不大.(但也可能是体感未到)
- FPS建议33或者49,对于时间有等比例的影响.主要还是人物表现内容.这个需要制作者自己设计决定.
- 采用BP还是FP的效果没有很大差异.
- Steps的步数也有等比例的直接影响,质量效果看上去是好一些了.但是考虑到视频的动作快速,单个图片的质量考虑其次,因此我们的fast工艺就设定20了.如果考虑质量30是比较好的.
大量AI知识 https://www.2img.ai
大量AI效果 https://www.2video.cn
Paragoger衍生者AI训练营。发布者:稻草人,转载请注明出处:https://www.shxcj.com/archives/9847