全部标签

知识库

我的 RAG 知识库问答总是答非所问、要么答不全要么牛头不对马嘴,模型和向量库都没问题,我对着文档切分的 chunking 排查了大半天的复盘

做企业知识库 RAG 问答:文档切片向量化存库,提问时检索相关片段喂大模型生成答案。模型选的好、向量库也没问题,可问答质量就是差:有时答案残缺不全、有时检索的片段牛头不对马嘴、有时一段话被拦腰截断。换更强的模型、调检索参数都没本质改善。排查大半天才意识到问题不在模型也不在检索,而在最上游最易忽略的文档切分 chunking。根因是我用"按固定字符数硬切":在句子段落中间切断(语…
技术教程
- 2
- 0
Mores6月2日
不是模型幻觉:RAG 知识库问答自信胡说的排查

我们做了个挺受欢迎的内部知识库问答机器人,把几千篇文档灌进向量库,用户大白话提问,它检索片段连同问题喂给大模型生成回答,上线口碑很好。直到某天客服截图来问:它说退款政策是 30 天无理由,可我们明明写的是 7 天。机器人不光答错,还答得无比笃定,连"根据公司政策"都加上了——这种一本正经的胡说,语气和正确答案时一模一样,用户根本分辨不出。我第一反应是模型幻觉、想换个更强的模型,…
技术教程
- 0
- 0
Mores5月30日
RAG 实战:知识库问答总在胡编?根因往往不是模型,而是检索

给公司做了个知识库问答,上线第二天投诉就来了:问报销答考勤,问接口超时编出根本不存在的参数名。第一反应是模型太笨,换了个更贵的——几乎没变。直到把喂给模型的检索结果打印出来才醒悟:模型没胡编,它只是忠实地基于一堆错误资料在回答,问题从头到尾不在生成,在检索。这篇从这个答非所问的事故讲起,把朴素 RAG 为什么会废、怎么一步步把召回质量救回来讲透:debug 召回内容、结构化分块加重叠、选对中文 e…
技术教程
- 0
- 0
Mores5月29日
RAG 检索增强生成工程化完全指南:从一次"律所知识库把废止法条当现行有效出庭前一天被骂"看懂为什么向量检索远远不够

2024 年 Q1 我们给一家律所做内部知识库问答系统把过去 10 年的判例法条内部备忘录全部喂给 RAG 系统让律师问问题直接拿到精准答案第一版我们用最简单的方案 sentence-transformers + ChromaDB + GPT-4 一周搞定 demo 给客户看效果惊艳但真上线一个月就开始翻车律师投诉一通接一通系统经常找不到明显相关的判例或者找到完全无关的内容或者把 5 年前已废止的…
技术教程
- 0
- 0
Mores5月24日
RAG 知识库质量完全指南:从一次"知识库越塞越多回答反而越差"看懂为什么文档质量决定一切

2024 年我给公司搭一个 RAG 知识库问答系统把公司内部的各种文档产品手册技术规范培训材料会议纪要灌进一个向量库用户问一个问题系统检索出最相关的几段喂给大模型生成回答第一版我做得很顺手写了个脚本把存放公司文档的那个共享目录整个遍历一遍所有文件 Word PDF Markdown 还有一堆 txt 统统读出来原样切成固定长度的块算 embedding 全塞进向量库本地我拿几个问题测了测答得有模有…
技术教程
- 4
- 0
Mores5月22日
RAG 检索增强生成完全指南:从 Naive 到生产级 Advanced RAG

RAG(Retrieval-Augmented Generation,检索增强生成)是 2023 年以来 AI 工程里被讨论最多、踩坑也最多的技术。它让 LLM 能"查资料后再回答",几乎是企业落地 AI 的事实标准。但很多团队的 RAG 上线后效果不好 —— 不是因为 LLM 不行,而是 RAG 的每一个工程细节都能让效果腰斩。这篇文章把 RAG 的完整流程讲透,从最朴素的 …
技术教程
- 2
- 0
Mores5月15日