在MaxKB体调试用ollama本地模型,通义千问API等,都是一样,都不是流式回复。 但是直接小黑板docker ollama run XX ,是可以流式输出的。
是否配置了反向代理?或者知识库直接回答了,应用回复默认都是流式的。