所以我猜是混合精度加模型太大导致暂时还没有量化的模型出来

#96
by lzm1066258 - opened

所以我猜是混合精度加模型太大导致暂时还没有量化的模型出来?

架构有创新需要适配吧

DeepSeek org

发布的已经是量化模型

发布的已经是量化模型

The community really wants quants in 1 bit! :) There’s still no GGUF with Unsloth, that’s the thing.

发布的已经是量化模型

The community really wants quants in 1 bit! :) There’s still no GGUF with Unsloth, that’s the thing.

new architecture always takes llama.cpp long time to adapt, like qwen3 next

发布的是混合精度模型。我说的是现在还没有类似于q4量化的gguf这种适配llama.cpp的模型。

发布的已经是量化模型

@GeeeekExplorer api.deepseek.com 部署的模型也是量化版本吗

Sign up or log in to comment