输入文档分段有bug导致输出有问题

MaxKB无法体现条
导入的文档是公司制度(word版本),有章条(第几章第几条)的区分,导入时用高级分段,采用了“[第][一二三四五六七八九十]+[章][ \u4e00-\u9fa5a-zA-Z]+”这个正则表达式按章节进行分类,但是输出时需要有章节、有条目,但这时候条目由于没有分段,所以会出现没有识别到的情形,如果强制要求其输出条的内容,则会胡乱生成。想问论坛里的各位大佬有没有什么比较好的解决方法 :sob: :sob: 无论是在分段处理上进行优化,或者说具体ai对话的调试都ok :face_with_raised_eyebrow: 万分感谢!

条目是没有分好段吗,用高级编排看一下知识库检索检索得到吗

就是第几条没有分,目前是按第几章来分,不清楚怎么用正则实现分章的情况下分条。假设同时实现了分章与分条,那感觉会导致检索到章的时候,会不会没有内容了?

章节和条目是有格式的吗,比如都是标题? 还是说章节是标题,条目是正文?

章节是标题 条目是正文。就比如:开头:第一章 总则 内容:第一条 xxxx。 第二条xxxxx。 不过每一条都单独成段。

你可以参考一下,我的文档只有章节是标题其他是正文


好嘞好嘞,太感谢Xiao_Cai老师了!

:hand_with_index_finger_and_thumb_crossed:不客气