-
RAG 检索增强完全指南:让大模型回答你的私有知识
接了个看起来简单的活:给公司做一个能回答内部资料问题的 AI 助手。第一版方案简单粗暴到自己都觉得聪明:把几百页文档全部拼进 prompt 和问题一起丢给大模型,结果第一次运行就报 context length exceeded 文档太长把上下文窗口撑爆;退而求其次只塞一部分这下不报错但塞进去的恰好是不相干的资料模型答非所问甚至一本正经胡编;每问一次都要把一大坨文档重发一遍 token 烧得飞快账…- 0
- 0
-
RAG 知识库上线后问什么都答非所问:一次 embedding 模型不一致的复盘
一个内部文档 RAG 问答系统测试时问什么答什么,一上线就问什么都答非所问问报销流程答考勤制度,同一套代码同一批文档同一个大模型本地好端端线上成胡言乱语。排查梳理:先写脚本只跑检索把召回的原始 chunk 打出来看发现召回的全是不相关内容而且相似度分数全挤在 0.7 上下挤成一团这本身就是危险信号,grep 查建索引链路的 embedding 配置是 bge-large-zh,再 grep 查在线…- 0
- 0
向量检索
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


