预约演示

微信扫码

社区论坛 - FIT2CLOUD 飞致云

vllm添加DeepSeek-R1-Distill-Qwen-32B不返回思考的解决方案

user-lz9fgau8062 2025 年3 月 23 日 00:33 1

参考
https://docs.vllm.ai/en/latest/features/reasoning_outputs.html
和
https://github.com/deepseek-ai/DeepSeek-R1/issues/352

1.修改模型的tokenizer_config.json 去掉最后面的 <think>//n
2.vllm部署时添加命令–enable-reasoning --reasoning-parser deepseek_r1
3.maxKB提示词强制开启思考
思考标签

2 个赞

使用vllm添加的模型，不能正确的输出思考过程

QwQ32B模型思考过程标签有误

玉树置顶 2025 年3 月 23 日 13:15 2

王贺取消置顶 2025 年4 月 25 日 04:04 3