本人想做一个输入读取图片或者PDF的高级编排,请问使用什么模型合适,ocr识别模型用哪个?

ocr模型是不是是视觉模型呢,初学,请多指导,

视觉模型主要是用来识别图片的,识别不了文件,关于图片理解节点,可以参考官方文档。