目前通过【知识库】-【上传文档】-【表格】的入口上传了一份测试文档csv文件,表头是 |序号|部门|入职时间|,数据是 |1|人力资源部|2001/01/01|,数据量是800行,模型是本地部署的deepseek1.5b,向量模型是nomic-ambed-text,对话应用时问了测试文档有多少人,返回的结果只有10个人左右,请问是需要再做什么预处理才能读取全部呢
如果命中分段是正常的,给到AI的数据也是正常的,基本确定是模型理解能力问题,数据量太大,AI基本上都会漏数据,DeepSeek也不例外。