每次问到第5个问题就一直回答中

user-dslzxbbwrib · 2024 年6 月 25 日 07:48

如题，我用vllm启了一个qwen2的大模型服务，MaxKB成功对接。
但是每次问到第5个问题必然卡死，一直显示回答中，看vllm后台发现MaxKB并没有发起第5个问题的调用！？vllm服务没有问题，可能什么原因呢，感谢！

xin.bai · 2024 年6 月 27 日 07:06

模型能力问题，换个模型试试

user-dslzxbbwrib · 2024 年6 月 28 日 08:49

我是通过vllm部署的大模型，有这个问题，换成ollama部署就都好了