流式回复答案,出现几百个甚至上千个空。用户交互过程中就有20秒空等着。有没有什么办法优化啊
方便截图说明一下吗,是调用接口还是直接问答呢?
采用的流式的接口调用方式,
这是流式输出过程中正常的返回,代表模型也正在思考,如果不想要展示这么多空值,可以关闭流式输出
这种可以通过提示词或者什么方法减少空值嘛??
不能的哈,这种是模型在思考,就像我们提问的时候会出现回答中一样,正常的等待时间,你直接问答的回答时间是多久呢