如何优化法律知识库

明明已经将法律原文全部上传了知识库,但问的时候就是识别不到,该怎么调整。


解决必谢 vx:awayt000

你先到知识库测试一下是否命中

知识库的搭建有点复杂。
一、你的知识库切片要做好,最好是人工分析后的,比如按法条切片。
二、每条切片设定一下基础问题,比如偷窃5000元如何量刑。
三、知识库检索时选择混合模式,调整好准确率。
四、像楼上说的那样,在知识库里先测试一下效果再关联检索模块。

简单的说应该就是这样吧

其实还是需要父子分段,对于法律条文这种还是很有必要的

首先我到“国家法律数据库”:国家法律法规数据库 下载了原文,然后建立了本地法律知识库:

后面使用高级分段的正则表达式: 第[一二三四五六七八九十百千\d]+条(?!、)
来解决每个条文分开的问题:

然后发现有几个条文会有问题,如第八十五条,再进行人工修正,把总共四条法律补齐,删除错误的分段,情况如下:

然后优化了对话与数字转换, 因为当年问: 第 23 条时, 在原文可能是 “第二十三条”,这时候应该先让 AI 做一次转换再查询,如图:

然后可以愉快的折腾了。
我提供了我做的地址,因为是本地部署的,所以速度不是很快,你可以参考一下:

https://vpx.itunite.com.cn/ui/chat/62827af21abcce97

1 个赞

优化问题这个思路很赞,就是提示词不好写,提示词真的很麻烦。