Lecture 9 — Advanced Applications (高阶应用题)
Q1 — Advanced: Cross-Selling Uplift vs. Cannibalization(交叉销售提升 vs 自相残杀)
Question (EN): A retailer offers an add-on warranty at checkout. Historic data:
- If a customer buys the premium laptop (event ), probability they also buy the warranty (event ) is .
- If a customer buys the standard laptop (), .
- Current mix: . A new policy nudges premium by showing a comparison card, raising to but reducing to because customers feel “already protected.” Should the retailer implement the policy if the expected warranty take-rate must not fall?
📖 点击查看翻译
题目(中文): 某零售商在结账时销售延保。历史数据如下:
- 高端机(事件 )购买延保(事件 )的概率为 ;
- 标准机()为 ;
- 当前占比 。 新政策使 提升至 ,但 降至 。若总体延保率不能下降,应否实施?
📖 点击查看答案
新政策后总体延保率:; 原为 。 结论:不要实施(总体保修率从 降到 )。
📝 点击查看解析
思路: 比较总体加权平均: ; 。 虽高端机占比上升,但其延保率下降导致总体下滑(交叉销售被自相残杀抵销)。
Q2 — Advanced: Supplier Quality Signal(供应商质量信号)
Question (EN): A buyer receives a “Pass/Fail” inspection signal () on batches from two suppliers (). Priors: . Signal characteristics: A batch fails. Should the buyer switch future orders to if “post-fail” defect risk from is proportional to ?
📖 点击查看翻译
题目(中文): 买方检测两个供应商 的产品,检验信号 结果为“通过/失败”。先验概率:。 检验通过率:。 若一批未通过,是否应将后续订单转向 ?
📖 点击查看答案
的失败后风险更高( 对 )。 结论:不应转向 ,应减少 份额。
📝 点击查看解析
贝叶斯原理: 失败事件与质量差的供应商更相容,后验偏向 。 若风险与 成正比,转向 反而增加总体缺陷风险。
Q3 — Advanced: Fraud Queue Triage(欺诈分流优先级)
Question (EN): A bank’s fraud model flags 4% of transactions. True fraud rate . Model metrics: TPR , FPR . Investigators can process 2% of transactions daily. Should the top 2% scores form Tier-1 queue?
📖 点击查看翻译
题目(中文): 银行欺诈模型标记 4% 的交易;真实欺诈率 ;TPR ,FPR 。 每日人工仅能处理 2% 交易。是否应将分数最高的前 2% 设置为一级复核?
📖 点击查看答案
是。前 2% 的 P(F\mid \text{Top2%}) 显著高于总体,资源有限下最大化命中率。
📝 点击查看解析
思路: 模型分数与后验单调正相关。 选择最高分 2% 等价于最大化正预测值(PPV),在容量约束下提升每次调查收益。
Q4 — Advanced: AB Test with Spillovers(A/B 溢出效应)
Question (EN): Open rate , . However, household sharing causes within-group correlation. Can we use a binomial test to compare rates?
📖 点击查看翻译
题目(中文): A 组打开率 ,B 组 。家庭内溢出导致样本不独立。能否直接用二项检验?
📖 点击查看答案
不能。家庭相关性导致有效样本量下降,二项检验 值偏乐观。
📝 点击查看解析
理由: 独立性假设失效。应聚合到家庭层面(群集分析)或使用聚类稳健标准误。
Q5 — Advanced: Medical Screening Threshold(筛查阈值)
Question (EN): Disease prevalence . Test A: TPR , FPR (cost =0.85=0.00518). Goal: PPV ≥ 30% with lowest cost. Which test or sequence should be used?
📖 点击查看翻译
题目(中文): 疾病基率 。测试 A:TPR ,FPR ;测试 B:TPR ,FPR ;成本分别为 18。 目标:PPV ≥ 30%,且成本最低。应如何选择?
📖 点击查看答案
单独使用 A 或 B 均不足。采用 A 初筛 + B 复核:两步阳性 PPV ≈ 0.62,成本低于全面使用 B。
📝 点击查看解析
单测: , 。 组合:误报概率 极低,总期望成本低且满足 PPV 约束。
Q6 — Advanced: Hiring Test Bias(招聘测试偏差)
Question (EN): Two positions use test to predict success . Overall . For candidates with internship (): ; for without internship (): . Should HR down-weight the test for group?
📖 点击查看翻译
题目(中文): 两岗位均用测试 预测成功 。总体 。 有实习经历 ():;无实习 ():。 HR 是否应对有实习者降低测试权重?
📖 点击查看答案
是。对于有实习经历者,测试预测力明显下降,应下调权重或采用分组阈值。
📝 点击查看解析
分析: 改变测试有效性(条件依赖结构变化)。 分层 Bayes 或分组阈值可防止 Simpson 悖论式误判,提升公平性。
Q7 — Advanced: Marketing Lift Under Base-Rate Shift(基率漂移下的提升评估)
Question (EN): Last year: , . This year, natural base rate rises to , expected treated rate . Can we claim “same 3% lift”?
📖 点击查看翻译
题目(中文): 去年转化率:实验组 ,对照组 。 今年自然基率升至 ,实验组预计 。 是否还能称“提升 3 个百分点”?
📖 点击查看答案
不应简单复用绝对提升。应用相对提升: (去年 ),效果减弱。
📝 点击查看解析
说明: 绝对差受基率影响大,相对提升(RR/OR)更稳健。 当基率升高时,同样机制带来较小相对效应。
Q8 — Advanced: Inventory Recall Risk(召回风险)
Question (EN): Recall probability . If recall and undetected at factory, major claim occurs with . Detection TPR , FPR . Find monthly expected claim rate.
📖 点击查看翻译
题目(中文): 零部件召回率 。 若召回且漏检(),则发生重大索赔 的概率为 。 检测阳性率 ,误报率 。 求月度期望索赔率。
📖 点击查看答案
漏检率 。 ()。
📝 点击查看解析
步骤: 仅在 且 时发生 。 使用乘法法则求联合,再乘以条件损失概率。
Q9 — Advanced: Bonus Plan Under No-Independence(非独立条件下的奖金计划)
Question (EN): Salespersons A and B have correlated success events: . If bonus pricing assumes independence, will budget be underestimated?
📖 点击查看翻译
题目(中文): 销售员 A、B 的成交事件正相关:。 若奖金预算基于独立假设,是否低估支出?
📖 点击查看答案
会。正相关提高“同时成功”概率,独立假设低估联合概率,从而低估预算。
📝 点击查看解析
检验: 比较 与 。 若前者更大,且奖金触发条件为“双人成功”,应上调预算。
Q10 — Advanced: Vendor Blacklist Decision(供应商拉黑决策)
Question (EN): Report probability: , . Prior . Blacklist only if . Should we blacklist?
📖 点击查看翻译
题目(中文): 不合规供应商被举报的概率 ;合规供应商 ; 先验 。若 才拉黑。是否满足?
📖 点击查看答案
结论:应拉黑。
📝 点击查看解析
Bayes 更新: 分子为“不合规且被举报”,分母为“被举报总体”。 后验 ,符合拉黑标准。
Q11 — Advanced: Early-Warning KPI(预警指标选择)
Question (EN): Project delay . Signals (missed meetings) and (risk items >5). Observed . If signals not conditionally independent, which threshold rule yields higher PPV: “any = 1” or “both = 1”?
📖 点击查看翻译
题目(中文): 项目延误先验 。 两个预警信号:(缺席周会)、(风险项>5)。 若二者条件非独立,哪种规则 PPV 更高?“任一为1”还是“两者同时为1”?
📖 点击查看答案
通常“联合阈值”(两者同时为1)PPV 更高,召回虽降但精度更优。
📝 点击查看解析
依据: 。 若 在 下正相关,联合筛选显著提升后验概率。
Q12 — Advanced: Price-Match Policy Risk(价格保护政策)
Question (EN): Competitor discount event correlates with promotion week : . You refund price difference if competitor discounts. If you estimate cost using overall , is it biased?
📖 点击查看翻译
题目(中文): 若竞争者降价事件 与促销周 正相关()。 公司承诺“遇降价就补差”。若仅用总体 估算成本,会否偏差?
📖 点击查看答案
会偏低。促销周销量高且 更大,忽略条件结构将低估成本。
📝 点击查看解析
期望成本应为:。 独立假设失真导致低估。
Q13 — Advanced: Cold-Start Personalization(冷启动个性化)
Question (EN): New users () have base CTR . Model trained on old users (): . Can we directly transfer threshold to ?
📖 点击查看翻译
题目(中文): 新用户点击率基率 ,模型基于老用户训练,。 能否直接迁移阈值?
📖 点击查看答案
不可。基率下降会使 显著降低,应重新定标阈值。
📝 点击查看解析
Bayes: 。 当基率下降时,后验随之下降,需重新校准。
Q14 — Advanced: Location Bias in NPS(NPS 的地点偏差)
Question (EN): High NPS stores are located in high-income areas (). If we ignore , results may be biased. How can probability framework avoid this?
📖 点击查看翻译
题目(中文): 门店 NPS 高,但位于高收入区 ()。若未控制 ,比较结果偏差。 如何用概率框架避免?
📖 点击查看答案
进行分层比较:计算 ,再标准化加权。
📝 点击查看解析
原理: 控制混杂变量 ,使用分层分析或倾向得分分层,防止 Simpson 悖论。
Q15 — Advanced: Churn Save-Offer Targeting(流失挽留优惠)
Question (EN): Churn prior . Model’s top 10% have . Offer acceptance . If non-churners react negatively, how should we target?
📖 点击查看翻译
题目(中文): 流失率 。模型 Top10% 中 ,接受优惠概率 。 若非流失者接受优惠会降低未来付费意愿,应如何决策?
📖 点击查看答案
采用双阈值策略:Top10% 后再用 Uplift 模型筛选净收益人群。
📝 点击查看解析
目标: 最大化 。 比较 与 差异,估计真实挽留增益。
Q16 — Advanced: Warranty Reserve Under Evidence Update(基于证据更新的保修准备)
Question (EN): Initial return rate . Alert : , . If occurs, compute posterior .
📖 点击查看翻译
题目(中文): 初始退货率 。收到告警 :。 若出现 ,计算后验 。
📖 点击查看答案
📝 点击查看解析
解释: 告警显著提高退货概率(从 2.5%→17%),应上调该批次保修准备金。
Q17 — Advanced: Safety Stock Under Joint Risk(联合风险下安全库存)
Question (EN): Two warehouses have correlated demand spikes . If safety stock computed as assuming independence, under positive covariance is it underestimated?
📖 点击查看翻译
题目(中文): 两仓库需求尖峰事件相关。 若假设独立计算安全库存 ,在正相关下是否低估?
📖 点击查看答案
是。应为 。
📝 点击查看解析
联合方差公式: 。 正相关使并发需求高峰更可能,需增库存。
Q18 — Advanced: Campaign Attribution Paradox(归因悖论)
Question (EN): Clicks () and purchases () are correlated due to latent intent (). Thus overstates causal effect. How to obtain unbiased incremental lift?
📖 点击查看翻译
题目(中文): 点击 () 与购买 () 相关,但存在未观测变量 ()。 导致 高估因果效果。 如何获得无偏的增量效果?
📖 点击查看答案
使用随机化曝光或工具变量切断 路径;或用双重稳健估计(PS+Outcome)。
📝 点击查看解析
随机化令 ,得到近似 。 倾向评分 + 结果模型可降低混杂偏差。
Q19 — Advanced: Two-Stage Audit Policy(两阶段审计)
Question (EN): Fraud prior . Rule engine (R): TPR , FPR . ML model (M): on subset, TPR , FPR . Manual review only if both positive. What percent of all invoices are reviewed?
📖 点击查看翻译
题目(中文): 欺诈率 。规则引擎 (R):TPR ,FPR ; 机器学习模型 (M) 在 中 TPR ,FPR 。 若两阶段均阳性才复核,占比多少?
📖 点击查看答案
即复核约占 。
📝 点击查看解析
思路: ① 求进入第二阶段比例 ; ② 计算该子集新
基率 ;
③ 代入第二阶段 TPR/FPR 求总体阳性率。
Q20 — Advanced: Value of Negative Recommendation(负面建议的价值)
Question (EN): After a “negative” recommendation (), approval posterior . If preparing for relocation costs 500k if approved, what is optimal?
📖 点击查看翻译
题目(中文): 收到负面建议后批准后验 。 若提前准备成本 500k。 如何决策?
📖 点击查看答案
准备的期望成本:; 不准备:。 应准备搬迁(期望损失更低)。
📝 点击查看解析
贝叶斯决策: 用更新后后验最小化期望损失。 虽批准概率下降,准备方案仍具更低期望成本。