首字输出耗时

问题:你好
AI回复时,回复中…要等待4-5s
如何优化减少…的等待时间
大模型使用的是硅基流动的Deepseek3.2 提示词 无,不输出思考
image

可以参考下:MaxKB助手调优 咨询问题收集优化 - FIT2CLOUD 知识库
硅基流动API接口响应延迟过高如何优化?_编程语言-CSDN问答