全部标签

LoRA

从关键词匹配 + if-else 规则引擎 + 单机 sklearn 浅层模型 + 模型 pickle 一存了事 + 无版本管理 + 上线从不监控漂移 + 效果靠人肉抽查远古智能体系 → 2026 大语言模型 LLM + RAG 检索增强生成 + 向量数据库语义检索 + vLLM 高吞吐推理 + LoRA 高效微调 + 结构化输出 + LLMOps 评测与可观测现代 AI 体系 87 天战役复盘:47 套工程修法 + 7 个 P0 复盘 + 6 条工程哲学

14 位 AI 与算法平台工程师 87 天把一套跑了六年的关键词匹配 + if-else 规则引擎 + 单机 sklearn 浅层模型 + 无评测无监控的远古智能问答推荐体系,用影子模式零业务风险重构到 2026 年现代 AI 体系:RAG 检索增强让 LLM 基于真实知识开卷作答、向量数据库语义检索告别关键词死板匹配、vLLM 高吞吐推理扛在线并发、LoRA 低成本微调对齐业务不破坏通用能力、结…
技术教程
- 2
- 0
Mores5月28日
LLM 微调与部署完全指南:从一次"LLaMA-3-8B + LoRA 训完上线全是幻觉客户说这条文不存在"看懂为什么跑通 peft 脚本远远不够

2024 年我们给一家法律科技公司做合同审查 AI 产品定位是律师上传合同 AI 自动识别条款风险用通用 GPT-4 跑了一版客户说效果还行但每个合同 0.3 美元月烧 10 万美元而且法律术语经常理解偏差比如不可抗力被 GPT 解释成日常含义不是法律意义客户要求降本加提升准确率最优解是微调一个小模型用 LLaMA-3-8B 加 LoRA 我们意气风发就开始了第一周搞通 demo 拿 1000 条…
技术教程
- 2
- 0
Mores5月25日
LLM 微调工程化完全指南:从一次"医疗客服模型把感冒诊断成败血症吓退用户"看懂为什么数据加训练远远不够

2024 年初我们想做一个垂直行业的客服大模型基于 Llama-2-13B 微调给医疗咨询场景用我们组里只有一个搞过传统 NLP 的工程师大家信心满满觉得有 GPU 有数据就能搞定结果第一版折腾了三个月微调出来的模型上线测试客户问我有点感冒模型回您可能患有败血症请立即就医完全幻觉直接吓退用户项目差点被砍然后我们陆续踩了一堆坑第一种最让我傻眼我们准备了 5000 条对话数据全是公司内部历史聊天记录直…
技术教程
- 3
- 0
Mores5月24日
Stable Diffusion 文生图工程化完全指南:从一次"运营生成米老鼠营销图法务找上门"看懂为什么 pip install 远远不够

2024 年初我们做一个电商商品图自动生成平台用 Stable Diffusion 让运营自己生成营销图替代设计师的部分日常工作第一版我用社区一个开源 webui 装好 SDXL 模型写几个 prompt 生成的图惊艳运营拍手老板说全公司用一下涌进来 200 个运营然后整个平台炸了然后我们陆续踩了一堆坑第一种最让我傻眼单卡 A100 一张图 SDXL 30 步 8 秒 200 个运营并发队列堆到 …
技术教程
- 3
- 0
Mores5月24日
LLM 微调工程化完全指南:从一次"LoRA 训完法律审查飙到 85% 但日常问候也讲合同条款"看懂为什么 trainer.train 远远不够

2024 年我们想给一个法律咨询 SaaS 加一个中文合同审查助手我们以为很简单拿一个开源 LLM 比如 Qwen 7B 全参数微调一下喂 5 万条合同审查样本就上线我跑通第一版后陆续踩了一堆坑第一种最让我傻眼全参数微调 7B 模型一台 A100 80G 跑了 2 天单 epoch loss 收敛得很慢训完 evaluate 模型对法律术语的理解几乎没变在合同关键条款上的 F1 只比 base 模…
技术教程
- 4
- 0
Mores5月24日
大模型微调完全指南:从一次"微调完模型把原来会的忘光了、新知识还没学会"看懂 Fine-tuning

2024 年我想让一个大模型懂我们公司的业务能准确回答产品政策流程相关的问题。我选了微调。第一版我做得很省事我把内部整理的几百条问答对导出成训练数据加载一个开源基座模型跑了十个 epoch 看着 loss 一路降下去我就以为成了。我心里很踏实微调嘛不就是准备点数据喂给模型训一训它就学会了。可等它真正用起来一串问题冒了出来。问它公司业务的问题它答得驴唇不对马嘴我以为微调能把公司知识灌进模型可几百条数…
技术教程
- 0
- 0
Mores5月21日
LoRA 与 QLoRA 微调完全指南:让开源大模型变成你的领域专家

"我能不能把开源模型微调成我的领域专家?" —— 几乎每个企业接触 LLM 后都会问这个问题。但全参数微调一个 70B 模型要 8 张 A100,普通团队负担不起。LoRA(Low-Rank Adaptation)和它的量化版本 QLoRA 解决了这个问题 —— 只训练几百万额外参数,就能让模型在特定领域表现接近全量微调。这篇文章把 LoRA 的原理、代码、数据准备、效果评估一…
技术教程
- 0
- 0
Mores5月15日