-
验证集 99% 准确率的模型,一上线就被打回原形:我在机器学习里栽进"数据泄露"的那次自欺欺人,才懂了好看的指标未必是真本事
第一个机器学习项目预测用户流失,验证集准确率 99%,上线后却跟瞎猜没两样。复盘揪出真凶:特征里混进了 account_close_date(注销日期)——只有已流失用户才有值,几乎等价于标签本身,模型不是在预测、是在抄答案;而线上要预测的活跃用户都没注销日期,作弊特征失效就现了原形。这篇从数据泄露的本质与黄金判断标准,讲到预处理/时间序列/分组等泄露变体、主动排雷手段,以及从指标崇拜到理解模型的…- 0
- 0
特征工程
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!

