如何评价知识库回答效果?

如何对知识库的回答效果进行评价?是否有测试观点比较全面的测试case?

这得根据实际的知识库和可能的问题去测试,每个人涉及的场景不一样