-
我给 RAG 检索加了个相似度阈值过滤、大于零点八才算相关想滤掉噪声,结果有的提问明明库里有答案却召回一片空白、有的提问又混进一堆牛头不对马嘴的片段,我反复调那个阈值怎么都调不出一个对所有问题都合适的值最后才想通相似度的绝对分数根本不能跨查询用同一把尺子去卡的深度复盘
我给 RAG 检索加了道过滤:只保留余弦相似度 ≥ 0.8 的块、低于就当不相关丢掉,想滤掉勉强沾边的噪声。可上线后效果两极分化:有些提问明明库里有非常相关的文档却被告知没找到相关内容(那些相关块相似度 0.7 多没够 0.8 被全砍),另一些提问却召回一堆明显不相关的片段(那些块相似度居然有 0.85 过了线)。我调阈值,调低到 0.7 前一类好了后一类噪声更多,调高到 0.85 后一类干净了前…- 0
- 0
检索过滤
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!

