-
同一张图片,模型每次预测的结果都不一样,准确率还莫名其妙地掉了:我忘了在 PyTorch 推理前调用 model.eval() 的复盘
训练好的图像分类模型拿去推理,同一张图预测两次结果竟然不一样,整体准确率还比验证集低一截。检查输入和权重都没问题,最后发现是我推理前忘了调 model.eval()——模型停在训练模式,Dropout 还在随机丢弃神经元(导致结果随机)、BatchNorm 还用当前 batch 统计量(导致单张图变差)。这篇从 Dropout/BatchNorm 训练推理为何不同讲到 model.eval()+t…- 0
- 0
-
Transformer 完全指南:从注意力机制到 GPT 的工作原理
2017 年 Google 那篇《Attention Is All You Need》之后,Transformer 几乎重写了整个 NLP 行业。ChatGPT、Claude、GPT-4、Gemini、Llama、Qwen 全是 Transformer 家族。但很多人对它的理解停在"自注意力机制"五个字,问起 QKV 怎么算、为什么要多头、位置编码为什么需要,就支支吾吾。这篇文…- 12
- 0
深度学习
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


