回复不是流式输出怎么办(更新1.8.1版本后出现,之前是流式)。请问怎么设置,没有nginx

在MaxKB体调试用ollama本地模型,通义千问API等,都是一样,都不是流式回复。
但是直接小黑板docker ollama run XX ,是可以流式输出的。

是否配置了反向代理?或者知识库直接回答了,应用回复默认都是流式的。


没有用知识库。我看返回都是流式,页面就搞不懂了55555 :rofl:


这是硬负载配置。是不是要把tcp 改成http