vllm api 通过 “chat_template_kwargs”: {“enable_thinking”: false} 来强制关闭思考 maxkb这里如何实现
添加extra_body参数控制,等v1.10.7-LTS版本,目前版本还不支持。
管的太严了
最新v1.10.7-LTS版本已支持qwen3模型,推荐升级使用。