Q4 和 q5:适合大多数用户,显存需求适中,生成质量较好。 q8:适合高端显卡用户,生成质量接近原始版本。 在 comfyui 中使用 flux gguf 版本? comfyui使用: Deepseek 32b 至少得21gb显存,qwq 32b q8量化版本需要34gb显存,同时对算了要求相较于前面几个模型高了很多,我自己试过的2080ti 22gb * 2,radeonvii 16gb * 2,4090 48gb都可以满.
⁴ᴷ MTA Bus 2023 Volvo Group Nova Bus LFS on the Q8 (JFK Depot) YouTube