接入 qwen3 模型,如何控制 enable_thinking参数

vllm api 通过
“chat_template_kwargs”: {“enable_thinking”: false}
来强制关闭思考
maxkb这里如何实现

添加extra_body参数控制,等v1.10.7-LTS版本,目前版本还不支持。

管的太严了 :joy:

最新v1.10.7-LTS版本已支持qwen3模型,推荐升级使用。