Interpretability on 浑身蟹数

Interpretability on 浑身蟹数 https://www.xiebro.cool/tags/interpretability/ Recent content in Interpretability on 浑身蟹数 Hugo -- gohugo.io en Sat, 13 Jun 2026 00:00:00 +0000 转化率预测：分群方法、特征筛选与可解释归因 https://www.xiebro.cool/post/2026-06-13-conversion-rate-prediction/ Sat, 13 Jun 2026 00:00:00 +0000 https://www.xiebro.cool/post/2026-06-13-conversion-rate-prediction/ 在订阅、续费、复购这类业务里，运营和市场常问的问题是： “这一批刚进来的用户，最终能续多少？” 预测的难点不在"算出一个数字"，而在两件事：可解释：预测结果要能告诉业务侧"为什么是这个数"；可归因：当预测偏离实际时，能定位误差来自哪部分人群、哪部分服务环节。本文整理一套面向当期转化率的预测与归因方法，覆盖三类思路的对比、特征筛选标准、模型评估，以及偏差出现时如何拆解原因。模拟数据构造一个跨多个周期（cohort）的订阅用户样本，每个用户带几个可观测特征和一个转化标签： library(tidyverse) library(glmnet) set.seed(42) simulate_users <- function(cohort_id, n = 1000) { city_tier <- sample(1:5, n, replace = TRUE, prob = c(0.15, 0.25, 0.25, 0.20, 0.15)) age_group <- sample(1:6, n, replace = TRUE) channel <- sample(c("paid", "organic", "referral", "live"), n, replace = TRUE) active_days <- pmax(0, round(rnorm(n, mean = 15 + 0.3 * cohort_id, sd = 5))) task_rate <- pmin(1, pmax(0, rnorm(n, mean = 0.