Statistical Inference for Difference of Means (两个总体均值差的统计推断)


1. Overview of Chapter 10 & Lecture 19 (第10章与第19讲概览)

Topic (主题)

  • Statistical inference about the difference of population means.
  • 研究两个总体均值之差的统计推断问题。

Two Main Cases (两种主要情形)

  • Case 1: population standard deviations known.
  • 情形一:总体标准差 已知。
  • Case 2: population standard deviations unknown (later with ).
  • 情形二:总体标准差未知(后续用 分布处理)。

2. Notation & Basic Concepts (符号与基本概念)

Population Parameters (总体参数)

  • Population 1 mean , standard deviation .
  • 总体1均值 ,标准差
  • Population 2 mean , standard deviation .
  • 总体2均值 ,标准差

Sample Statistics (样本统计量)

  • Sample 1: size , mean .
  • 样本1:容量 ,样本均值
  • Sample 2: size , mean .
  • 样本2:容量 ,样本均值

Parameter of Interest (关注的参数)

  • Difference of population means: .
  • 关注的总体参数:均值差
  • Point estimator: difference of sample means .
  • 点估计量:样本均值差

3. Sampling Distribution of (样本均值差的抽样分布)

Expected Value (期望)

  • .
  • 样本均值差的期望等于总体均值差,无偏估计。

Standard Error with Known (已知总体标准差时的标准误)

  • .
  • 标准误由两个总体的方差和样本量共同决定。

Shape of Distribution (分布形状)

  • If populations are normal or are large, is approximately normal.
  • 当总体近似正态或样本量足够大时,样本均值差近似服从正态分布,可使用 方法。

4. Confidence Interval for (均值差的置信区间)

General Form (一般形式)

  • Point estimate .
  • 点估计为样本均值差
  • Margin of error = critical value standard error.
  • 误差限 = 临界值 × 标准误。

Formula with Known (已知总体标准差的公式)

  • 在显著性水平 下的 置信区间。

Interpretation (解释)

  • If not in CI → significant difference in means.
  • 若区间不包含 ,说明两个总体均值存在显著差异。
  • Sign of interval tells which population mean is larger.
  • 区间整体为正/负,指明哪一个总体均值更大。

5. ABC Product Life Example – Confidence Interval (ABC 产品寿命示例:置信区间)

Data (数据)

  • Sample 1 (ABC): , min, min.
  • 样本1(ABC):120 个,均值 275 分钟,标准差 15 分钟。
  • Sample 2 (competitor): , min, min.
  • 样本2(竞争对手):80 个,均值 258 分钟,标准差 20 分钟。

Computation (计算)

  • Point estimate: min.
  • 点估计:均值差 17 分钟。
  • Standard error: .
  • 标准误约为 2.62。
  • 95% CI: .
  • 95% 置信区间为

Conclusion (结论)

  • CI entirely above → ABC’s mean life significantly higher.
  • 区间整体大于 0,说明 ABC 产品平均寿命显著高于竞争对手。

6. Hypothesis Tests for (均值差的假设检验)

Three Forms of Hypotheses (三种假设形式)

Left-tailed Test (左尾检验)

  • ; .
  • 检验总体1均值是否显著小于总体2(或小于假设差值)。

Right-tailed Test (右尾检验)

  • ; .
  • 检验总体1均值是否显著大于总体2。

Two-tailed Test (双尾检验)

  • ; .
  • 检验两总体均值是否存在任何方向上的差异。

z Test Statistic (z 检验统计量)

  • 标准化样本均值差,与标准正态分布比较。

Decision Rules (决策规则)

  • Left-tailed: reject if .
  • 左尾:若 ,拒绝
  • Right-tailed: reject if .
  • 右尾:若 ,拒绝
  • Two-tailed: reject if .
  • 双尾:若 ,拒绝

7. ABC Example – p-value Approach (ABC 示例:p 值法)

Hypotheses (假设)

  • ; .
  • 原假设:ABC 不比竞争对手好;备择假设:ABC 平均寿命更长。

Significance Level (显著性水平)

  • .
  • 检验在 1% 的显著性水平下进行。

Test Statistic & p-value (统计量与 p 值)

  • (using same data and SE).
  • 计算得到
  • p-value .
  • p 值小于 0.001,远小于 0.01。

Decision & Interpretation (决策与解释)

  • Since p-value , reject and support .
  • 因 p 值小于显著性水平,拒绝原假设,支持备择假设。
  • Conclude ABC’s mean life is significantly higher than competitor’s.
  • 结论:ABC 产品的平均寿命显著高于竞争对手。

8. ABC Example – Critical Value Approach (ABC 示例:临界值法)

Critical Value (临界值)

  • Right-tailed test, : .
  • 右尾检验的临界值约为 2.33。

Comparison (比较)

  • Observed .
  • 观测到的 明显大于临界值。

Decision (决策)

  • in rejection region → reject .
  • 检验统计量落入拒绝域,因此拒绝原假设。
  • Same conclusion as p-value method.
  • 结论与 p 值法完全一致。

9. TOEFL Practice Example – Setup (托福练习题:设定)

Data (数据)

  • Newland University: , , .
  • Newland 大学:平均分 103,标准差 15,样本量 50。
  • ABC University: , , .
  • ABC 大学:平均分 96,标准差 10,样本量 50。
  • Significance level: .
  • 显著性水平为 0.05。

Hypotheses (假设)

  • .
  • 原假设:两所大学托福平均成绩无差异。
  • .
  • 备择假设:两校平均成绩存在差异(双尾检验)。

10. TOEFL Practice Example – Calculation & Conclusion (托福练习题:计算与结论)

Test Statistic (检验统计量)

  • Point estimate: .
  • 点估计:均值差为 7 分。
  • Standard error: .
  • 标准误约为 2.55。
  • .
  • 计算得到

Decision (决策)

  • Two-tailed, → critical values .
  • 双尾检验的临界值为
  • → reject .
  • 大于 1.96,拒绝原假设。

Interpretation (解释)

  • Significant difference in mean TOEFL scores between Newland and ABC.
  • 两所大学托福平均成绩存在显著差异。
  • Since Newland mean is higher, Newland students perform better on average.
  • 由于 Newland 的均值更高,说明其学生托福成绩平均表现更好。

CI Connection (置信区间联系)

  • 95% CI for : .
  • 95% 置信区间约为 ,不含 0,与假设检验结论一致。