-
分布式 ID 生成完全指南:从一次"两台机器同时生成了一样的订单号"看懂雪花算法
2021 年我做一个订单系统要给每一笔订单生成一个全局唯一的订单号。第一版我做得很省事订单表是 MySQL 我直接用了表的自增主键当订单号。本地一测完美每插一条订单 ID 自动加一从不重复。我心里很踏实生成唯一 ID 嘛数据库自增不就行了要么随手 UUID 一下。可等系统真正长大扛着真实的业务量一串问题冒了出来。第一种最先把我打懵订单量上来后我做了分库分表把订单拆到两个库结果两个库各自从 1 开始…- 0
- 0
-
大模型成本优化完全指南:从一次"所有请求都打最强模型、月底账单直接翻了十倍"看懂模型路由
2024 年我做一个 AI 功能要在产品里大量调用大模型有的地方是帮用户改写一句话有的地方是把一段文本分个类也有的地方是让模型写一段复杂的分析。第一版我做得很省事既然要用大模型那就选当时最强最贵的那个模型所有请求不管难易统统打给它。本地一测效果真好不管什么任务模型都答得又准又漂亮。我心里很踏实用大模型嘛选最强的那个所有请求都打给它质量肯定最好。可等它真正上线扛着真实的流量一串问题冒了出来。第一种最…- 0
- 0
-
Redis 持久化完全指南:从一次"服务器一重启、Redis 里的数据就少了一大半"看懂 RDB 与 AOF
2022 年我给一个项目做缓存层用的是 Redis。我当时想数据都在内存里万一服务器重启不就全没了所以得开持久化。第一版我做得很省事在 redis.conf 里抄了一行 save 900 1 心想这下数据就落到磁盘上了。本地测试时我特意重启了一次 Redis 数据还在我心里很踏实持久化嘛不就是在配置里开一下数据就落盘永远不会丢了。可等它真正上线扛着真实的流量和真实的意外一串问题冒了出来。第一种最先…- 0
- 0
-
大模型结构化输出完全指南:从一次"我让模型返回 JSON、它却回了一段夹着解释的 Markdown"看懂可靠解析
2024 年我做一个功能让大模型从一段用户输入的文本里提取出结构化信息姓名金额日期之类再交给后面的程序去用。第一版我做得很省事在 prompt 里写一句请以 JSON 格式返回拿到模型的回复直接 json.loads。本地测了几条真不错模型乖乖回了 JSON 我也顺利解析出来了。我心里很踏实结构化输出嘛不就是在 prompt 里说一句返回 JSON 然后 json.loads 一下。可等它真正上线…- 0
- 0
-
JWT 鉴权完全指南:从一次"用户改了密码、旧 token 却还能畅通无阻登录三天"看懂无状态令牌
2023 年我给一个后台系统做登录鉴权。我听说 JWT 现在很流行无状态不用查数据库天生适合分布式于是就用了它。第一版我做得很省事用户登录成功我就把用户信息打包成一个 JWT 签发出去用户之后每次请求带上这个 token 我解开验一下放行。本地一测完美登录带 token 访问接口一气呵成。我心里很踏实鉴权嘛不就是签发一个 token 用户带着它来我解开验一下身份就行了。可等它真正上线面对真实的用户…- 0
- 0
-
多模态大模型应用完全指南:从一次"把高清照片直接发给模型、账单和错字一起爆了"看懂视觉理解
2024 年我做一个功能让用户拍一张照片模型帮他认出照片里是什么读出照片上的信息。第一版我做得很省事把用户的原图和一句话 prompt 一起塞进多模态 API 等模型回答。本地一测真神模型真的看懂了照片描述得头头是道。我心里很踏实多模态嘛不就是把图片和文字一起发给模型它就什么都能看懂。可等它真正上线跑在真实用户的照片上一串问题冒了出来。第一种最先吓到我一张普通的手机高清照片光是发给模型就烧掉了惊人…- 0
- 0
-
Nginx 反向代理与负载均衡完全指南:从一次"后端挂了一台、用户每三次请求就撞一次 502"看懂代理层
2022 年我给一个后端服务加了 Nginx 做负载均衡。原本服务只有一台机器扛不住量我加到三台前面挂一个 Nginx 分流。第一版我做得很省事写一个 upstream 把三台后端的地址填进去 location 里 proxy_pass 一指完事。本地一测真香请求轮着打到三台机器负载看着挺均匀。我心里很踏实负载均衡嘛不就是 upstream 里写几个后端地址 Nginx 自动帮我分流。可等它真正上…- 0
- 0
-
知识蒸馏完全指南:从一次"小模型把大模型的答案背熟了却照样不会做题"看懂模型蒸馏
2024 年我想把一个大模型的能力压缩进一个小很多的模型里这样既省显存又跑得快。我听说这个技术叫知识蒸馏。第一版我做得很省事拿那个大模型 teacher 给一批数据打上标签然后用这些标签去训练小模型 student。本地一测看着挺像回事小模型训出来了在训练集上 loss 降得很低。我心里很踏实蒸馏嘛不就是让小模型去模仿大模型的输出拿大模型打的标签训小模型就行了。可等我真正拿它去跑测试一串问题冒了出…- 0
- 0
-
数据库事务隔离级别完全指南:从一次"两个人同时下单、库存被卖成了负数"看懂脏读幻读
2023 年我做一个电商的库存扣减功能。逻辑看着特别简单用户下单我就查一下库存够不够够就扣减生成订单。第一版我做得很省事查库存判断够不够扣减三步我把它们包进了一个数据库事务里。本地一测毫无问题下单扣库存生成订单一气呵成。我心里很踏实把这几步包进一个事务里它就是原子的就安全了。可等它真正上线撞上大促的高并发一串问题冒了出来。第一种最离谱一个只有 1 件库存的商品居然卖出去了 3 单库存字段变成了负二…- 0
- 0
-
模型量化完全指南:从一次"量化完模型变小了却答得驴唇不对马嘴"看懂量化工程
2024 年我想把一个 7B 的大模型部署到一台显存不太够的机器上。我听说量化能让模型变小于是第一版我做得很省事找了个最激进的量化方式把整个模型的权重一刀切压到 INT4。本地一测真香模型文件小了一大半原本加载不进去的机器现在能跑起来了。我心里很踏实量化嘛不就是把模型压小压小了能跑就行质量顶多差一点点。可等我真正拿它去回答问题一串问题冒了出来。第一种模型回答答非所问你问 A 它扯到 B 逻辑完全乱…- 0
- 0
-
gRPC 完全指南:从一次"加个字段老服务就错乱、一个慢服务拖垮整条链"看懂 RPC 框架
2023 年我把团队内部几个服务之间的调用从 REST JSON 改成了 gRPC。第一版我做得很省事写了个 proto 文件生成客户端和服务端代码服务之间直接互相调用。本地一测真香比 JSON 快还带类型检查改个字段编译器立刻报错。我心里很踏实gRPC 嘛不就是一个更快带类型的 HTTP 接口。可等它真正上线跑在真实的多服务环境里一串问题冒了出来。第一种我给 proto 加了一个字段重新发布结果…- 0
- 0
-
AI 评测完全指南:从一次"改了 prompt 修好一类却搞坏另一类"看懂大模型效果怎么量化
2024 年我做一个 AI 问答功能用户提问大模型生成答案。功能跑通之后我想知道一件事它到底答得准不准。第一版我做得很省事我自己随手敲了几个问题看着模型的回答觉得嗯还行就上线了。后来每次改 prompt 换模型我还是这么干自己敲几个问题肉眼看一看。我心里很踏实AI 效果好不好自己多试几个问题不就知道了。可等它真正迭代起来一串问题冒了出来。我改了一版 prompt 修好了一类答错的问题满心欢喜上线结…- 0
- 0
-
HTTP 缓存策略完全指南:从一次"改了样式发了新版用户还是旧的"看懂强缓存与协商缓存
2023 年我负责一个前端站点的上线和迭代。第一次认真处理缓存时我做得很省事在 Nginx 上给所有静态资源 HTML JS CSS 图片统一加了一行 expires 7d 意思是都缓存 7 天。本地一测飞快第二次打开页面资源秒加载服务器压力肉眼可见地降了。我心里很踏实HTTP 缓存嘛不就是给资源设个过期时间过期了浏览器自然会重新拉。可等它真正上线开始频繁迭代一串问题冒了出来。我改了页面样式重新发…- 0
- 0
-
大模型微调完全指南:从一次"微调完模型把原来会的忘光了、新知识还没学会"看懂 Fine-tuning
2024 年我想让一个大模型懂我们公司的业务能准确回答产品政策流程相关的问题。我选了微调。第一版我做得很省事我把内部整理的几百条问答对导出成训练数据加载一个开源基座模型跑了十个 epoch 看着 loss 一路降下去我就以为成了。我心里很踏实微调嘛不就是准备点数据喂给模型训一训它就学会了。可等它真正用起来一串问题冒了出来。问它公司业务的问题它答得驴唇不对马嘴我以为微调能把公司知识灌进模型可几百条数…- 0
- 0
-
WebSocket 实时推送完全指南:从一次"用户开着页面挂一会儿就再也收不到消息"看懂长连接工程
2023 年我做一个站内实时消息推送用户开着网页不用刷新就能实时收到新通知新私信。我选了 WebSocket。第一版我做得很省事服务端用 WebSocket 库起一个 server 客户端 new WebSocket 连上去服务端有消息就 send 客户端 onmessage 收到就显示。本地一测完美消息几乎瞬间就到。我心里很踏实WebSocket 嘛不就是建一个长连接两边随便互发消息。可等它真正…- 0
- 0
-
Embedding 模型选型完全指南:从一次"语义搜索中文搜不准、一换模型检索全乱套"看懂向量召回
2024 年我做一个企业内部文档的语义搜索员工用自然语言提问从几千篇 wiki 和制度文档里找出最相关的几篇。第一版我做得很省事embedding 模型我在网上找了个下载量很高的把每篇文档 encode 成向量存进向量库查询时把问题也 encode 成向量算相似度取 top 5。本地拿几个问题一测效果还行。我心里很踏实embedding 嘛不就是把文本转成向量选个模型调个 API 就完事了。可等它…- 0
- 0
-
数据库读写分离完全指南:从一次"用户改完资料刷新又变回去、刚下单订单列表却没有"看懂主从一致性
2022 年我负责一个用户量正在往上涨的系统。数据库单机越来越吃力尤其是读压力各种列表页详情页的查询把数据库 CPU 压得很高。我做了一个很标准的优化读写分离。一个主库负责写挂两个从库负责读主库的数据通过主从复制同步到从库。我做得很直接在代码里判断 SQL 写操作走主库读操作走从库。本地一测顺极了写进去的数据转头就能从从库读出来主库压力肉眼可见地降了下来。我心里很踏实读写分离嘛不就是写走主读走从。…- 0
- 0
-
提示词工程完全指南:从一次"AI 抽取功能上线即崩、模型一会儿返回散文一会儿瞎编"看懂 Prompt 工程
2023 年我做一个 AI 功能从用户的商品评论里自动抽取出结构化信息商品名评分和问题点。第一版我做得很省事提示词就写了一句话请从下面的评论里提取出商品名评分和问题点后面拼上评论原文丢给大模型。本地拿几条评论一测效果惊艳模型工工整整地把信息列了出来我顺手 json.loads 一解析完美。可等它真正上线面对五花八门的真实评论事故一个接一个。模型没返回 JSON 而是回了一大段散文我的 json.l…- 0
- 0
-
数据库索引完全指南:从一次"加了索引查询还是慢、EXPLAIN 一看根本没走索引"看懂索引优化
2021 年我负责一个订单系统。订单表 orders 已经有几百万行。有个查我的订单的接口越来越慢从几百毫秒一路劣化到好几秒。我看了下它执行的 SQL 是按 user_id 过滤再按 create_time 倒序。我想当然地判断慢无非是没索引加一个就好了。我在 user_id 上建了索引信心满满地上线还是慢。我又想可能 create_time 也得有索引再加一个还是慢。我甚至把 user_id s…- 0
- 0
-
AI Agent 设计完全指南:从一次"Agent 陷入死循环、烧掉几美元 token 还没完成任务"看懂智能体工程
2024 年我做一个内部的 AI Agent一个运维诊断助手。想法很性感给大模型配上一套工具查日志查监控指标查最近的发布记录然后值班同学用大白话提问订单服务为什么变慢了让 Agent 自己去调工具自己分析自己给结论。第一版我做得很直接把用户的问题丢给大模型把工具清单也告诉它然后写一个 while True 循环模型决定下一步调哪个工具我执行把结果喂回去再让模型决定下一步如此往复直到模型自己说任务完…- 0
- 0
-
一致性哈希完全指南:从一次"缓存集群加了一台机器、命中率瞬间归零"看懂分布式分片
2020 年我做一个分布式缓存。业务的读压力越来越大单台 Redis 扛不住了我决定加机器上 4 台 Redis 把缓存数据分散到这 4 台上。要解决的核心问题只有一个一个 key 进来我怎么决定它该存到该去哪一台机器上读。第一版我做得很直接把 key 算个哈希值对机器数取模算出 0 1 2 3 就去对应那台。本地一测很顺几百万个 key 均匀地散在 4 台机器上每台四分之一读写都飞快缓存命中率稳…- 0
- 0
-
向量数据库选型完全指南:从一次"RAG 知识库涨到百万向量、检索卡十几秒"看懂向量检索
2023 年我做一个公司内部的知识库问答系统也就是现在很常见的 RAG。思路很直接把公司的文档切成一段段每一段用 embedding 模型转成一个向量用户提问时把问题也转成向量再从所有文档向量里找出最相似的几段塞给大模型当参考。第一版我做得很省事文档向量我全存在一个列表里查询时写个循环把问题向量和每一条文档向量挨个算一遍余弦相似度排序取最高的 5 段。本地一测飞快几百段文档每次查询几毫秒就回来了。…- 0
- 0
-
分库分表完全指南:从一次"订单表分了 16 张、查我的订单却要扫遍全部"看懂数据分片
2021 年我做一个订单系统。orders 表一开始好好的几百万行查询飞快。业务涨了两年多orders 涨到了三亿多行单表彻底慢了下来加索引也救不动了深分页一次查询要几十秒大促那几天直接把数据库 CPU 打满整个下单链路被拖垮。我决定分库分表把 orders 这一张大表水平拆成 16 张小表。第一版我做得很直接按订单的自增主键 id 取模把数据分到 orders_0 到 orders_15。本地一…- 0
- 0
-
大模型幻觉治理完全指南:从一次"AI 客服一本正经编造了一条不存在的退款政策"看懂幻觉防治
2024 年我做一个公司内部的客服知识问答 AI 助手。需求很简单用户问一个问题退款政策产品功能某个操作怎么走AI 给一个回答。第一版我做得很直接把用户的问题原样发给大模型模型答什么我就返回什么。Demo 那天效果惊艳全场回答流畅专业有条理。可上线没几天客服主管气冲冲找上门。有个用户问你们支持 7 天无理由退款吗AI 信誓旦旦地回答支持可我们公司根本没有这条政策又一次用户问某个产品功能 AI 条理…- 0
- 0
技术教程
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
























