目前我的某个QA文档分段有2万个左右,每个个分段都关联了问题,知识库模块的问题子模块可以搜索关联问题,搜到对应的分段,但是在命中测试中,搜索关联问题却无法被命中。
向量检索、全文检索、混合检索等三种检索模式我都试过了。
我在想是不是分段数太多缘故,可是2万个分段应该也不算多啊?其他数量小点的文档1000个左右的,就能在命中测试中被命中,当然也能通过问答正确的回复。1000分段的小文档和2万分段左右的文档都是同一样的格式的。
有没有人遇到过同样的问题?就是QA分段数增大后,命中测试无法正确命中,当然也无法正确问答。