问问题，一直超时，难受

user-t5eqcfcc4bm · 2024 年4 月 15 日 02:51

一个简单的问题，你是谁，结果一直超时，

xin.bai · 2024 年4 月 15 日 02:53

用的什么LLM模型？应用的提示词可以简化一下，不要携带太多内容。

user-t5eqcfcc4bm · 2024 年4 月 15 日 02:55

qwen:0.5b-chat，才395M

user-t5eqcfcc4bm · 2024 年4 月 15 日 02:55

就一个你是谁？已经很简单了吧

xin.bai · 2024 年4 月 15 日 03:01

机器配置是多少？感觉是配置不够跑不动，响应很慢。

xin.bai · 2024 年4 月 15 日 03:03

把提示词内容减小，应用设置中把提示词改成： {question}

user-t5eqcfcc4bm · 2024 年4 月 15 日 03:05

看了下，确实是配置问题，

我引用的知识库有3个，为啥不显示，

就显示这么一句话就没了，哈哈，这模型问题？

xin.bai · 2024 年4 月 15 日 03:08

引用的分段内容会根据提示词生成 prompt 发给大模型，回答内容直接返回 AI 模型回复的。

user-p9jvtbmghxq · 2024 年4 月 15 日 03:22

用户端对话回答不显示引用的知识库来源，可以加上吗？

xin.bai · 2024 年4 月 15 日 03:38

你可以先在应用设置的调试预览中提问测试，这里有知识来源。

增加功能预计要 1-2 个功能版本迭代。

user-p9jvtbmghxq · 2024 年4 月 15 日 09:58

我如果想在本地添加的话，需要改哪里呢？

skillful · 2024 年4 月 18 日 07:15

我也遇到一样的问题。模型是llama2

xin.bai · 2024 年4 月 19 日 05:14

模型返回的错误信息。
排查一下：
1、可以现在模型管理中保存一下 llama2 模型，是否能正常保存成功。
2、如果能保存成功，优化应用的提示词只保留{question}, 然后提问测试看是否正常回答。

user-cspgynwugcq · 2024 年4 月 21 日 09:31

我想问一下这个qwen:0.5b-chat怎么弄上去的

xin.bai · 2024 年4 月 22 日 03:48

在模型管理中添加 Ollama 模型，基础模型中自定义输入：qwen:0.5b 回车。