-
我的交易欺诈检测模型,准确率高达 99.5%,可上线后它连一笔欺诈都没能抓到:被"准确率"这个误导性指标骗惨的一课的深度复盘
欺诈检测模型,准确率 99.5%,我乐开了花、推荐上线,可风控反馈它一笔欺诈都没抓到——它把所有交易都判成了"正常"。一个连一笔欺诈都抓不到的废物,怎么会有 99.5% 准确率?因为欺诈只占 0.5%,模型"无脑全判正常"就能蒙对 99.5%。这是在类别极度不平衡的数据上,盲目用准确率的经典陷阱——它被多数类绑架,完全掩盖了我最关心的少数类表现。这篇从准确率…- 0
- 0
-
验证集 99% 准确率的模型,一上线就被打回原形:我在机器学习里栽进"数据泄露"的那次自欺欺人,才懂了好看的指标未必是真本事
第一个机器学习项目预测用户流失,验证集准确率 99%,上线后却跟瞎猜没两样。复盘揪出真凶:特征里混进了 account_close_date(注销日期)——只有已流失用户才有值,几乎等价于标签本身,模型不是在预测、是在抄答案;而线上要预测的活跃用户都没注销日期,作弊特征失效就现了原形。这篇从数据泄露的本质与黄金判断标准,讲到预处理/时间序列/分组等泄露变体、主动排雷手段,以及从指标崇拜到理解模型的…- 0
- 0
机器学习
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


