maxkb文档内容提取不支持PDF文件

在使用文档内容提取组件时,上传PDF文件识别提取不出来。

最好是能先转为 word 或者最好是 md 文档,pdf 的识别是不太敏感。

我测试了一下,应该是有些PDF文件从网页爬下来是扫描件图片的形式,那个文件上传提取的组件就不能提取文档内容,应该只有文字版的PDF文件可以支持上传提取那个组件