-
一次只升级了查询侧 embedding 模型、却忘了重建向量库的 RAG 事故,让检索召回全变成噪声、问答彻底答非所问:一次向量空间不一致的深度复盘
给 RAG 知识库换了个'更好的'embedding 模型,只改了一行查询侧配置就发布,结果问答准确率从 80% 断崖跌到 10% 以下——而且代码一个错都不报。根因是只换了查询侧模型、忘了用新模型重建整个向量库:库里是旧模型的向量、查询是新模型的向量,两个向量空间不可比,相似度沦为噪声,召回近似随机。本文讲透 embedding 向量空间为何必须建库与查询同模型,给出换模型必…- 0
- 0
-
RAG 实战:知识库问答总在胡编?根因往往不是模型,而是检索
给公司做了个知识库问答,上线第二天投诉就来了:问报销答考勤,问接口超时编出根本不存在的参数名。第一反应是模型太笨,换了个更贵的——几乎没变。直到把喂给模型的检索结果打印出来才醒悟:模型没胡编,它只是忠实地基于一堆错误资料在回答,问题从头到尾不在生成,在检索。这篇从这个答非所问的事故讲起,把朴素 RAG 为什么会废、怎么一步步把召回质量救回来讲透:debug 召回内容、结构化分块加重叠、选对中文 e…- 0
- 0
-
客服RAG系统从demo到生产的6周复盘:召回率38%到89%的真实路径+别再迷信chunksize+被否决的方案比被采纳的更值钱
接手一个 demo 跑通但生产 38% 准确率的 RAG 系统,6 周把 Recall@5 从 51% 顶到 89%、Answer Hit 顶到 81% 的完整路径。Multi-Query 改写贡献最大、Reranker 反直觉地在 Answer Hit 上比 Recall 提升更多、chunk size 实测只是次要变量。否决的方案(BM25 hybrid、HyDE、换大 embedding)和…- 4
- 0
-
RAG 检索增强生成工程化完全指南:从一次"律所知识库把废止法条当现行有效出庭前一天被骂"看懂为什么向量检索远远不够
2024 年 Q1 我们给一家律所做内部知识库问答系统把过去 10 年的判例法条内部备忘录全部喂给 RAG 系统让律师问问题直接拿到精准答案第一版我们用最简单的方案 sentence-transformers + ChromaDB + GPT-4 一周搞定 demo 给客户看效果惊艳但真上线一个月就开始翻车律师投诉一通接一通系统经常找不到明显相关的判例或者找到完全无关的内容或者把 5 年前已废止的…- 0
- 0
-
RAG 检索增强生成完全指南:从一次"知识库问答系统答非所问还编造"看懂为什么 RAG 不是切块加搜索
2024 年我给一个企业知识库做问答系统把公司几千份文档灌进去让员工用自然语言提问系统找出相关内容用大模型生成回答这是个典型的 RAG 检索增强生成场景第一版我做得很顺手用一个开源切块工具把所有文档按 500 字一段切开每一段算一个向量塞进向量数据库用户提问时把问题也算成向量从库里取相似度最高的 top-5 块拼成一段长上下文塞给大模型让它照着回答我心里很笃定 RAG 嘛不就是切块加向量搜索加拼接…- 2
- 0
-
RAG 完全指南:从一次"把整个知识库塞进 prompt、模型却答得驴唇不对马嘴"看懂检索增强生成
2024 年我做一个公司内部的知识库问答助手。需求很实在员工问我们的报销流程是什么助手要根据公司那几百篇制度文档给出准确的回答。第一版我做得很直接把所有文档拼成一大段塞进 prompt 后面接上问题一起发给大模型。本地我拿两三篇文档测完美。可一接入真实的那几百篇文档问题就一个接一个砸下来。第一个文档加起来几十万字直接超出模型的 context 上限 API 当场报错。我删掉一批文档勉强不报错了第二…- 2
- 0
-
RAG 检索增强生成完全指南:从一次"问公司年假、大模型张口胡编"看懂 RAG
2024 年我做一个企业内部知识库问答。需求很常见:员工想知道公司的规章制度产品文档里写了什么,直接问让大模型回答。第一版我做得很直接:把员工的问题原封不动发给大模型,模型生成答案返回。本地用一些常识性问题试效果挺好,可一上线给同事用问题立刻就来了。有人问我们公司的年假有几天,模型给的答案是一般为 5 到 15 天,这是它从训练数据里学到的泛泛常识根本不是我们公司的规定。更吓人的是有人问一个具体的…- 0
- 0
-
RAG 检索增强生成完全指南:从一次"问它公司报销流程、它编了一套对不上的流程"看懂 RAG
2024 年我做一个公司内部的知识助手,想让它回答员工的问题:报销流程是什么、某产品的退货政策怎么规定、某份技术规范里关于命名的要求是什么。这些答案全写在公司内部的几百份文档里。第一版我的做法特别直接:接一个大模型把用户问题原样发给它,指望它回答。本地一测问我们公司的报销流程,模型回了一段看起来很合理的流程,我还觉得能用,直到拿去对真实文档发现对不上——我们公司报销不走主管走财务系统直接提单,模型…- 5
- 0
-
RAG 完全指南:从一次"知识库问答把整个文档塞进 prompt、token 直接爆了"看懂检索增强生成
2024 年我做一个公司内部知识库问答系统,把几百份产品手册、技术文档、历史工单喂给大模型,让员工用大白话问问题。第一版想法很直接:既然要让模型根据我们的文档回答,那就把所有文档拼成一大段塞进 prompt。本地拿三五份测效果好极了,可一接真实文档库,第一个请求就报错——几百份文档拼起来 token 数远超模型上下文窗口上限。改成只塞一部分又出新问题:答案明明在第 200 份文档里,我只塞了前 3…- 2
- 0
-
RAG 完全指南:从一次"AI 把公司根本没有的制度讲得头头是道"看懂检索增强生成
2024 年我给公司做内部知识助手,让员工用自然语言问规章制度、报销流程,AI 直接给答案。第一版直接把问题发给大模型,Demo 惊艳,推广后反馈变味:它把一个我们公司根本不存在的"弹性工时制度"讲得有条有理,引用早已废止的旧报销流程,年假说法和 HR 手册完全对不上。我以为是模型不够聪明,换更大更贵的模型,照样编。盯着回答我才想明白:模型不是不够聪明,是没有资料——它的知识停…- 0
- 0
-
RAG 完全指南:从一次"AI 答得头头是道却全是错的"看懂检索增强生成
2024 年我做一个公司内部知识库问答 AI,把几百篇文档喂进去。Demo 时答得头头是道,推广后却频繁出问题:答去年的旧标准、把文档里明明有的内容答成"未找到"、把两份产品参数掺一起编出根本不存在的配置。我以为是模型不够强,换强模型问题照旧。盯日志才反应过来:RAG 的回答质量根本不取决于生成那一步模型多强,而取决于检索那一步有没有捞对文档——模型只能基于你塞给它的上下文作答…- 0
- 0
-
RAG 实战完全指南:为什么你的检索增强问答总是一本正经胡说八道
2024 年我给公司做内部知识库问答系统,几百份文档散在 Confluence、Git、Word 里新人找资料像大海捞针,我接了个大模型用 RAG——文档切碎存进向量库、提问时先检索相关片段再连同问题发给模型"看着资料回答"。demo 给老板看挺好,上线后投诉不断:问"测试环境数据库密码"它一本正经编了一个、问"报销流程几步"它把三份文档…- 0
- 0
-
RAG 完全指南:给大模型外挂一个企业知识库的正确姿势
2024 年我接了个看似不难的活:做内部知识问答助手,照着公司文档(员工手册、产品文档、制度说明)准确回答员工提问。第一版方案简单粗暴——把所有文档一股脑拼进系统提示词。结果三个问题接踵而至:资料二十多万字远超上下文窗口只能粗暴截断、后半文档彻底丢失;每问一句都为这二十多万字输入付一次钱 token 账单贵得肉疼;最意外的是就算相关段落没被截断模型还会在一大堆文字里迷失看漏它然后开始编。我又试微调…- 2
- 0
检索增强生成
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!













