-
我训练的模型离线评估准确率高达 95%,信心满满地上了线,真实表现却暴跌到 70%,我对着在划分训练测试集之前就标准化整个数据集造成的数据泄漏这个坑排查大半天的复盘
一个让我对模型评估可信度彻底敬畏的机器学习坑,阴险在它不报错、反而给你一份漂亮得让你深信不疑的成绩单,直到上线被真实世界打回原形。做一个分类模型,我按标准流程:先对特征做标准化(StandardScaler.fit_transform),再划分训练测试集,训练、评估,离线准确率高达 95%,信心满满上线,可线上真实数据准确率暴跌到 70%。问题就出在 scaler.fit_transform(X)…- 2
- 0
数据泄漏
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!

