-
企业知识库 RAG 系统 embedding 模型从 ada-002 升级到 3-large 后召回率从 87% 暴跌到 12% 的 4 天复盘:维度变化 + 阈值硬编码 + 向量库新旧混用三重叠加 + 11 条 RAG 工程纪律
一个用了 18 个月的企业知识库 RAG 系统,运维悄悄把 embedding 从 ada-002 升级到 text-embedding-3-large,线上召回率从 87% 暴跌到 12%,3 小时 1200 工单。4 天复盘找到三重根因:1536到3072 维 Pinecone 客户端静默截断、0.78 相似度阈值对 3-large 过严、向量库未重建新旧混用。修复路径全量重建 + 阈值校准 …- 25
- 0
-
客服RAG系统从demo到生产的6周复盘:召回率38%到89%的真实路径+别再迷信chunksize+被否决的方案比被采纳的更值钱
接手一个 demo 跑通但生产 38% 准确率的 RAG 系统,6 周把 Recall@5 从 51% 顶到 89%、Answer Hit 顶到 81% 的完整路径。Multi-Query 改写贡献最大、Reranker 反直觉地在 Answer Hit 上比 Recall 提升更多、chunk size 实测只是次要变量。否决的方案(BM25 hybrid、HyDE、换大 embedding)和…- 4
- 0
Pinecone
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


