知识库处理粒度低

user-bluxpdkvzg0aae8 · 2026 年3 月 16 日 08:53

docx文件、pdf文件都忽略文件内的图片，这样对于产品手册、培训手册这种图片多的文件，简直是没法用。建议新增增强提取文档，内部对图片进行提取和理解，产品核心的知识库没做好，很难有差异化的功能和粘性。
或者提供AI对话可以上传文件，让第三方多模态模型对数据进行提取。对于这些基础功能，应该是产品的核心。

sdhengen · 2026 年3 月 17 日 02:49

建议现用mineru处理一下pdf文件，再打包上传到maxkb知识库，这样所有的图片信息就可以保留了。