Statistical Inference for Difference of Means (两个总体均值差的统计推断)
1. Overview of Chapter 10 & Lecture 19 (第10章与第19讲概览)
Topic (主题)
- Statistical inference about the difference of population means.
- 研究两个总体均值之差的统计推断问题。
Two Main Cases (两种主要情形)
- Case 1: population standard deviations σ1, σ2 known.
- 情形一:总体标准差 σ1, σ2 已知。
- Case 2: population standard deviations σ1, σ2 unknown (later with t).
- 情形二:总体标准差未知(后续用 t 分布处理)。
2. Notation & Basic Concepts (符号与基本概念)
Population Parameters (总体参数)
- Population 1 mean μ1, standard deviation σ1.
- 总体1均值 μ1,标准差 σ1。
- Population 2 mean μ2, standard deviation σ2.
- 总体2均值 μ2,标准差 σ2。
Sample Statistics (样本统计量)
- Sample 1: size n1, mean Xˉ1.
- 样本1:容量 n1,样本均值 Xˉ1。
- Sample 2: size n2, mean Xˉ2.
- 样本2:容量 n2,样本均值 Xˉ2。
Parameter of Interest (关注的参数)
- Difference of population means: μ1−μ2.
- 关注的总体参数:均值差 μ1−μ2。
- Point estimator: difference of sample means Xˉ1−Xˉ2.
- 点估计量:样本均值差 Xˉ1−Xˉ2。
3. Sampling Distribution of Xˉ1−Xˉ2 (样本均值差的抽样分布)
Expected Value (期望)
- E(Xˉ1−Xˉ2)=μ1−μ2.
- 样本均值差的期望等于总体均值差,无偏估计。
Standard Error with Known σ (已知总体标准差时的标准误)
- σXˉ1−Xˉ2=n1σ12+n2σ22.
- 标准误由两个总体的方差和样本量共同决定。
Shape of Distribution (分布形状)
- If populations are normal or n1,n2 are large, Xˉ1−Xˉ2 is approximately normal.
- 当总体近似正态或样本量足够大时,样本均值差近似服从正态分布,可使用 z 方法。
4. Confidence Interval for μ1−μ2 (均值差的置信区间)
- Point estimate Xˉ1−Xˉ2.
- 点估计为样本均值差 Xˉ1−Xˉ2。
- Margin of error = critical value × standard error.
- 误差限 = 临界值 × 标准误。
- (Xˉ1−Xˉ2)±zα/2n1σ12+n2σ22.
- 在显著性水平 α 下的 100(1−α)% 置信区间。
Interpretation (解释)
- If 0 not in CI → significant difference in means.
- 若区间不包含 0,说明两个总体均值存在显著差异。
- Sign of interval tells which population mean is larger.
- 区间整体为正/负,指明哪一个总体均值更大。
5. ABC Product Life Example – Confidence Interval (ABC 产品寿命示例:置信区间)
Data (数据)
- Sample 1 (ABC): n1=120, Xˉ1=275 min, σ1=15 min.
- 样本1(ABC):120 个,均值 275 分钟,标准差 15 分钟。
- Sample 2 (competitor): n2=80, Xˉ2=258 min, σ2=20 min.
- 样本2(竞争对手):80 个,均值 258 分钟,标准差 20 分钟。
Computation (计算)
- Point estimate: Xˉ1−Xˉ2=17 min.
- 点估计:均值差 17 分钟。
- Standard error: SE≈2.62.
- 标准误约为 2.62。
- 95% CI: 17±1.96×2.62=(11.86, 22.14).
- 95% 置信区间为 (11.86, 22.14)。
Conclusion (结论)
- CI entirely above 0 → ABC’s mean life significantly higher.
- 区间整体大于 0,说明 ABC 产品平均寿命显著高于竞争对手。
6. Hypothesis Tests for μ1−μ2 (均值差的假设检验)
Left-tailed Test (左尾检验)
- H0: μ1−μ2≥D0; Ha: μ1−μ2<D0.
- 检验总体1均值是否显著小于总体2(或小于假设差值)。
Right-tailed Test (右尾检验)
- H0: μ1−μ2≤D0; Ha: μ1−μ2>D0.
- 检验总体1均值是否显著大于总体2。
Two-tailed Test (双尾检验)
- H0: μ1−μ2=D0; Ha: μ1−μ2=D0.
- 检验两总体均值是否存在任何方向上的差异。
z Test Statistic (z 检验统计量)
- z=n1σ12+n2σ22(Xˉ1−Xˉ2)−D0.
- 标准化样本均值差,与标准正态分布比较。
Decision Rules (决策规则)
- Left-tailed: reject H0 if z<−zα.
- 左尾:若 z<−zα,拒绝 H0。
- Right-tailed: reject H0 if z>zα.
- 右尾:若 z>zα,拒绝 H0。
- Two-tailed: reject H0 if ∣z∣>zα/2.
- 双尾:若 ∣z∣>zα/2,拒绝 H0。
7. ABC Example – p-value Approach (ABC 示例:p 值法)
Hypotheses (假设)
- H0: μ1−μ2≤0; Ha: μ1−μ2>0.
- 原假设:ABC 不比竞争对手好;备择假设:ABC 平均寿命更长。
Significance Level (显著性水平)
- α=0.01.
- 检验在 1% 的显著性水平下进行。
Test Statistic & p-value (统计量与 p 值)
- z≈6.49 (using same data and SE).
- 计算得到 z≈6.49。
- p-value <0.001≪0.01.
- p 值小于 0.001,远小于 0.01。
Decision & Interpretation (决策与解释)
- Since p-value <α, reject H0 and support Ha.
- 因 p 值小于显著性水平,拒绝原假设,支持备择假设。
- Conclude ABC’s mean life is significantly higher than competitor’s.
- 结论:ABC 产品的平均寿命显著高于竞争对手。
8. ABC Example – Critical Value Approach (ABC 示例:临界值法)
Critical Value (临界值)
- Right-tailed test, α=0.01: zα=z0.01≈2.33.
- 右尾检验的临界值约为 2.33。
Comparison (比较)
- Observed z≈6.49>2.33=zα.
- 观测到的 z 明显大于临界值。
Decision (决策)
- z in rejection region → reject H0.
- 检验统计量落入拒绝域,因此拒绝原假设。
- Same conclusion as p-value method.
- 结论与 p 值法完全一致。
9. TOEFL Practice Example – Setup (托福练习题:设定)
Data (数据)
- Newland University: Xˉ1=103, σ1=15, n1=50.
- Newland 大学:平均分 103,标准差 15,样本量 50。
- ABC University: Xˉ2=96, σ2=10, n2=50.
- ABC 大学:平均分 96,标准差 10,样本量 50。
- Significance level: α=0.05.
- 显著性水平为 0.05。
Hypotheses (假设)
- H0: μ1−μ2=0.
- 原假设:两所大学托福平均成绩无差异。
- Ha: μ1−μ2=0.
- 备择假设:两校平均成绩存在差异(双尾检验)。
10. TOEFL Practice Example – Calculation & Conclusion (托福练习题:计算与结论)
Test Statistic (检验统计量)
- Point estimate: Xˉ1−Xˉ2=7.
- 点估计:均值差为 7 分。
- Standard error: SE=50152+50102≈2.55.
- 标准误约为 2.55。
- z=2.557≈2.75.
- 计算得到 z≈2.75。
Decision (决策)
- Two-tailed, α=0.05 → critical values ±1.96.
- 双尾检验的临界值为 ±1.96。
- ∣z∣≈2.75>1.96 → reject H0.
- 因 ∣z∣ 大于 1.96,拒绝原假设。
Interpretation (解释)
- Significant difference in mean TOEFL scores between Newland and ABC.
- 两所大学托福平均成绩存在显著差异。
- Since Newland mean is higher, Newland students perform better on average.
- 由于 Newland 的均值更高,说明其学生托福成绩平均表现更好。
CI Connection (置信区间联系)
- 95% CI for μ1−μ2: 7±1.96×2.55≈(2.0, 12.0).
- 95% 置信区间约为 (2.0, 12.0),不含 0,与假设检验结论一致。