知识库处理粒度低

docx文件、pdf文件都忽略文件内的图片,这样对于产品手册、培训手册这种图片多的文件,简直是没法用。建议新增增强提取文档,内部对图片进行提取和理解,产品核心的知识库没做好,很难有差异化的功能和粘性。
或者提供AI对话可以上传文件,让第三方多模态模型对数据进行提取。对于这些基础功能,应该是产品的核心。

建议现用mineru处理一下pdf文件,再打包上传到maxkb知识库,这样所有的图片信息就可以保留了。