为什么部署了https之后,使用通义千问模型慢了

先对接了通义千问模型,没部署https前,问个什么问题,会一个字一个字的蹦出来:
微信截图_20240725145611
但是,我部署了https,用https访问对话页面,问什么东西都是过上一会再一次性蹦出来,这是为什么?请问如何解决

有遇到过类似情况的朋友吗?其实一个一个蹦,总时间跟一下蹦出来所需时间差不多

参考一下这个解决方案:[BUG] 模型 qwen-plus 不支持 流式输出 ,智谱 ai glm-4 也不行,一大段一大段输出 · Issue #627 · 1Panel-dev/MaxKB · GitHub

谢谢 谢谢