之前在交流群听一位朋友说知识库检索优先级是关联问题>标题>内容,但实际通过源码阅读发现检索的时候都是从embedding表中取数据,取得时候只看相似度,貌似没有根据这个规则排序?这个规则究竟是怎么样的呢
没有优先级的,都会检索,只是关联问题命中得分更高。
你好,再请教下,得分不是按照提问和关联问题或标题或内容来计算向量相似度算出来的吗?这个为什么关联问题命中得分更高?不应该文本相似度越高得分越高吗?
正常情况下是通过计算相似度来排序,关联问题涉及到人为手动去关联,就说是可以将问题手动的去关联分段,来提高得分
也就是说提高关联问题的质量,让提问跟关联问题的相似度变高,间接命中分段内容是吗