全部标签

上下文工程

我给 AI Agent 写了个查数据库的工具,某次它查出了几万行结果原封不动塞进了对话上下文,当场超出 token 上限报错,就算没报错模型也被海量数据淹没得抓不住重点:一次工具返回过大塞爆上下文的深度复盘

我做了个 AI Agent,配了个 query_database(sql) 工具让它查业务数据。平时挺好用,直到某次用户问把所有订单列出来分析一下,Agent 生成了个没加 LIMIT 的查询,工具查出几万行、我原封不动拼成字符串塞回上下文,当场 context length exceeded 报错、对话崩了。我截断到不超限后问题依旧:模型被几千行原始数据淹没、抓不住重点、又慢又贵又含糊。复盘才想…
技术教程
- 0
- 0
Mores6月3日
我以为给大模型喂的资料越多回答越准,就把检索到的几十篇文档全塞进了 prompt,结果它要么报超长、要么在海量内容里抓错了重点:一次 RAG 上下文塞太多的深度复盘

我做了个基于检索增强(RAG)的问答,朴素地觉得喂的资料越多越全模型回答越准,就把检索到的几十篇文档(top-50)全塞进了 prompt。结果出了两类问题:有时直接报超长或被默默截断、把后面的用户问题和指令都截掉了,答非所问;即使没超限,模型也在那么一大堆文档里迷失、抓错重点、被无关内容干扰。查清才明白资料越多越好的直觉是错的:模型上下文窗口有限超了就截断,且上下文多不等于好——大量无关内容会稀…
技术教程
- 4
- 0
Mores6月2日
一个把每一步的工具结果都原样堆进上下文的 AI Agent,跑到几十步后要么报 token 超限、要么忘了最初的任务:一次 Agent 上下文管理的深度复盘

Agent 处理简单任务很好,一遇到要几十步的复杂任务就出两种诡异故障:要么跑到一半报 context length exceeded,要么跑着跑着就跑偏、忘了最初的任务目标。根因是每步都把工具返回的完整结果原样追加进上下文、把越来越长的全部历史再喂给模型——工具结果动辄上万字,几十步累积撑爆上下文窗口;即使没爆,最初的目标也被淹没在海量细节里(lost in the middle)导致失忆跑偏。…
技术教程
- 9
- 0
Mores6月2日
我做的 AI Agent 跑短任务都好好的,可一上真实长会话就越来越慢越来越贵,最后直接报 context length exceeded 整个挂掉,我对着每轮把全部历史和工具结果无限塞进上下文排查大半天的复盘

第一次做能自己调用工具、多轮推进任务的 AI Agent。照 ReAct 范式实现:每轮把系统提示+到目前为止全部对话历史+工具结果发给大模型,模型决定继续调工具还是给最终答案,往复到任务完成。Demo 跑几个简单问题丝滑流畅,以为大功告成。可一接真实场景——用户多轮对话、任务要调好几次工具、有的工具还返回一整个网页或一大段 JSON——问题暴露:每轮响应肉眼可见越来越慢,账单越涨越快,跑长一点的…
技术教程
- 2
- 0
Mores6月2日
我的 Agent 调用一次查询工具就把上万行结果原样塞回上下文,从此推理越来越笨、还越来越贵,我对着工具返回结果的治理排查了大半天的复盘

我做了个数据分析 Agent,能调用"查数据库"工具,根据用户问题查数据再总结。小数据量测试惊艳,接上生产库就抽风:有时答到一半报上下文超限崩了,有时答得驴唇不对马嘴像"忘了"用户问什么,token 账单还高得吓人。以为模型不行、prompt 不好,改半天没用,直到把 Agent 每步上下文 dump 出来,看到一条工具返回里塞着上万行查询结果、几十万字符,…
技术教程
- 0
- 0
Mores6月2日
我做的 AI Agent 跑长任务时跑着跑着就开始报上下文超长、回答还越来越糊涂,我对着疯狂飙升的 token 账单排查了大半天才搞懂上下文得管理的复盘

我做的能自己调工具、多步推理的 AI Agent,短任务很好,一到十几二十轮的长任务就报 context length exceeded 中断、回答越来越糊涂(忘前面、重复做、答非所问)、token 账单还疯狂飙升。我以为是模型不行,换更大上下文只是推迟了问题。把每轮真正发给模型的 prompt 打印出来才懂:我从没管理过上下文——LLM 无状态、不记得之前对话,我每轮都把从头到现在的全部历史(含…
技术教程
- 2
- 0
Mores6月2日
聊得越久,我的客服 Agent 越"健忘":用户开头说的过敏信息聊到后面被它忘得一干二净,我才搞懂上下文窗口与上下文工程的残酷

我的客服 Agent 短对话表现惊艳,可聊久了就"犯糊涂":一个用户开头明说"我对花生过敏",聊了二十多轮后,它居然热情推荐了一款花生酥。根因不是它记性差,而是上下文窗口有限——大模型无状态、靠每次重发历史"记忆",对话太长时早期信息要么被从头截断、它根本看不到,要么淹没在中间被忽略(lost in the middle)。这篇从上下文窗…
技术教程
- 0
- 0
Mores6月1日
Agent 聊久了就失忆:对话上下文管理避坑复盘

我们的客服 Agent 上线初期口碑很好,能记住用户前面说过的话、多轮对话连贯。可时间一长投诉来了,都集中在一类现象:聊得越久它越不对劲——前几轮还规规矩矩,聊到十几二十轮就开始健忘、答非所问,甚至把最开始设定好的角色和规则都抛到九霄云外,本该是严谨售后客服聊到后面却跟用户东拉西扯。把聊崩的长对话日志拉出来复盘真相渐渐清晰:大模型上下文窗口有限装不下无限长对话,为不超限我写了段很朴素的截断逻辑——…
技术教程
- 0
- 0
Mores5月30日
LangChain Agent memory 累计 280 万 entry 拖垮 prompt 质量的 6 天复盘:分层 memory + 遗忘曲线 + reranker 三件套落地

客服 Agent 上线 4 个月后客户评分从 4.5 跌到 3.2,排查 6 天发现根因是 long-term memory 累计 280 万 entry,检索召回大半是陈年噪声,prompt 长达 11000 token 稀释关键信息。本文复盘失控因果链、4 层 memory 架构、Ebbinghaus 遗忘曲线、reranker 二阶段检索、重要性评分模型,以及落地的 Agent Memory…
技术教程
- 0
- 0
Mores5月26日