同样一个问题,在应用里面做命中测试很快,但是前端提问就回答很慢,500多秒,会是什么原因造成的?

同样一个问题,在应用里面做命中测试很快,但是前端提问就回答很慢,500多秒,会是什么原因造成的?

命中测试是本地知识库召回, 提问是命中召回后还要发送给模型优化答案, 回答慢与模型有关系。本地模型的回复时间与服务器配置有关系。