-
我的 RAG 问答系统总在一些问题上答非所问,明明知识库里就有正确答案,它却引用了一堆看着相关、其实跑题的片段编出似是而非的答案,查了半天发现我只用向量相似度取了 top-k 就直接喂给大模型、压根没做重排序的深度复盘
我做了个 RAG 问答系统:把文档切片转向量存进向量库,提问时把问题也转向量,检索最相似的若干片段连同问题喂给大模型作答,demo 效果不错就上线了。可上线后系统总在某些问题上答非所问,明明知识库里就有标准答案,它却引用一堆看着沾边、实则跑题的片段编出似是而非的答案;我把正确答案文档翻出来核对,它确实在库里且高度相关,换更强的大模型也没用。折腾很久才把矛头指向我以为最不会出错的检索:打印实际召回的…- 0
- 0
-
LangChain Agent memory 累计 280 万 entry 拖垮 prompt 质量的 6 天复盘:分层 memory + 遗忘曲线 + reranker 三件套落地
客服 Agent 上线 4 个月后客户评分从 4.5 跌到 3.2,排查 6 天发现根因是 long-term memory 累计 280 万 entry,检索召回大半是陈年噪声,prompt 长达 11000 token 稀释关键信息。本文复盘失控因果链、4 层 memory 架构、Ebbinghaus 遗忘曲线、reranker 二阶段检索、重要性评分模型,以及落地的 Agent Memory…- 0
- 0
-
客服RAG系统从demo到生产的6周复盘:召回率38%到89%的真实路径+别再迷信chunksize+被否决的方案比被采纳的更值钱
接手一个 demo 跑通但生产 38% 准确率的 RAG 系统,6 周把 Recall@5 从 51% 顶到 89%、Answer Hit 顶到 81% 的完整路径。Multi-Query 改写贡献最大、Reranker 反直觉地在 Answer Hit 上比 Recall 提升更多、chunk size 实测只是次要变量。否决的方案(BM25 hybrid、HyDE、换大 embedding)和…- 4
- 0
Reranker
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!



