-
我的 RAG 检索效果一直很差、召回的总是些半截残缺答非所问的片段,我换了更强的向量模型、调高了召回数量都没用,折腾半天才发现根因是我把文档按每 500 字机械地切块、一刀刀全切在了段落问答和表格的正中间的深度复盘
我做了套 RAG 系统,把一批文档切块、灌进向量库,让大模型据检索到的块来回答。可检索效果一直很差:召回的片段总是半截残缺、答非所问,明明库里有答案,捞上来的却是从中间断开的零碎句子,模型拿着这些碎片自然答不好。我以为是向量模型不够强,换了更强的 embedding;以为是召回太少,把 topK 调大;都没用。直到我把存进库的块一条条打印出来看,才倒吸凉气:每个块都被切得乱七八糟——一段话从中间断…- 0
- 0
-
我的 RAG 知识库问答总是答非所问、要么答不全要么牛头不对马嘴,模型和向量库都没问题,我对着文档切分的 chunking 排查了大半天的复盘
做企业知识库 RAG 问答:文档切片向量化存库,提问时检索相关片段喂大模型生成答案。模型选的好、向量库也没问题,可问答质量就是差:有时答案残缺不全、有时检索的片段牛头不对马嘴、有时一段话被拦腰截断。换更强的模型、调检索参数都没本质改善。排查大半天才意识到问题不在模型也不在检索,而在最上游最易忽略的文档切分 chunking。根因是我用"按固定字符数硬切":在句子段落中间切断(语…- 2
- 0
-
我的 RAG 检索回来的片段总是缺头少尾、答非所问,我一直以为是检索算法不行,最后才发现是文档切块的策略从一开始就错了的深度复盘
我的 RAG 问答效果一直不好:检索回来的片段常缺头少尾(一句话被从中间截断)、或一个片段塞了好几个不相关主题,模型拿着支离破碎又混杂的片段自然答非所问。我一直错怪检索算法、想换更高级的检索,折腾半天毫无改善。回头看那些被存进库的片段才恍然大悟:根子根本不在检索,而在更上游的文档切块——我图省事用最粗暴的按固定长度硬切,不管语义和句段边界,把完整的意思劈成两半、还主题混杂。RAG 效果极大取决于喂…- 0
- 0
-
RAG 文档切分完全指南:从一次"答不上手册里明明写着的答案"看懂 Chunking 为什么决定检索质量上限
2024 年我做一个文档问答系统用户上传一份产品手册然后能用自然语言向它提问系统去手册里找答案也就是现在常说的 RAG 它的核心套路我很清楚把文档切成一块一块每块算一个向量存进向量库用户提问时把问题也算成向量检索出最相似的几块连同问题一起喂给大模型作答这一整条链路里有一步叫把文档切成块怎么切这件事我没多想就有了方案按字数切第一版我做得很顺手我写了个函数把文档每五百个字切成一块一块接一块整整齐齐本地…- 0
- 0
Chunking
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




