maxkb 如何添加多模态模型比如 Qwen-omni-7b?

maxkb 添加模型目前没有多模态模型的选项,只能选择大语言模型、向量模型等,类似如Qwen-omni-7b这样的多模态模型要如何添加?尤其是如何将omni-7b 作为语音识别模型进行添加?

多模态模型目前还不支持。

目前有计划大概什么时候能支持多模态的大模型吗?这样本地只要部署一套多模态大模型就可以识别图片和声音了。

近期还没有规划。

添加模型先选择视觉模型,可以进行图片理解

嗯,当做视觉模型已经添加成功,但无法作为音频识别模型添加