Quartz 4

❯

❯

❯

❯

·第16讲——假设检验思维导图

·第16讲——假设检验思维导图

Apr 14, 202611 min read

Lecture 16 — Hypothesis Testing (第16讲——假设检验)

1. Overview of Lecture 16 (第16讲概览)

Topics (主题)

Developing null & alternative hypotheses (构建原假设与备择假设)
Type I and Type II errors (第一类与第二类错误)
Population mean test with known $σ$ using $z$ (已知 $σ$ 时用 $z$ 检验总体均值)
One-tailed vs. two-tailed tests, $p$ -value, $z$ -score, confidence interval approach (单尾/双尾检验、p 值、z 分数与置信区间方法)

2. Purpose of Hypothesis Testing (假设检验的目的)

Idea (基本思想)

Decide whether to reject a statement about a population parameter using sample data.
利用样本数据判断是否应当拒绝关于总体参数的陈述。

Population vs. Sample (总体与样本)

Population parameter is unknown; sample statistic provides evidence.
总体参数未知，样本统计量提供证据。

3. Null & Alternative Hypotheses (原假设与备择假设)

Null Hypothesis $H_{0}$ (原假设 $H_{0}$ )

Baseline or “no effect / no difference” statement about a parameter.
表示“无变化/无差异”的基准陈述。
Equality sign always belongs to $H_{0}$ (e.g., $=$ , $\geq$ , $\leq$ ).
等号总写在 $H_{0}$ 中，如 $=$ 、 $\geq$ 、 $\leq$ 。

Alternative Hypothesis $H_{a}$ (备择假设 $H_{a}$ )

Research claim, opposite to $H_{0}$ (effect or difference exists).
研究者真正关心的主张，与 $H_{0}$ 相反，表示存在效应或差异。
Direction of $H_{a}$ ( $>$ , $<$ , $\neq =$ ) determines test type (one- or two-tailed).
$H_{a}$ 的方向（ $>$ 、 $<$ 、 $\neq =$ ）决定检验是单尾还是双尾。

Using Sample Data (利用样本数据)

Compute test statistic from sample and compare with distribution under $H_{0}$ .
用样本计算检验统计量，再与 $H_{0}$ 下的理论分布比较。

4. Supporting $H_{a}$ vs. Not Rejecting $H_{0}$ (支持 $H_{a}$ 与不拒绝 $H_{0}$ )

Supporting $H_{a}$ (支持备择假设)

If sample result is very unlikely under $H_{0}$ , we reject $H_{0}$ and say data support $H_{a}$ .
若样本结果在 $H_{0}$ 为真时几乎不可能出现，就拒绝 $H_{0}$ ，认为数据支持 $H_{a}$ 。

Not Rejecting $H_{0}$ (不拒绝原假设)

If sample result is plausible under $H_{0}$ , we “do not reject $H_{0}$ ”.
若样本结果在 $H_{0}$ 下很常见，则“不拒绝 $H_{0}$ ”。
“Do not reject” ≠ “prove $H_{0}$ true”; evidence is simply not strong enough.
“不拒绝”并不等于“证明 $H_{0}$ 为真”，只表示证据不够强。

Example: Teaching Methods (教学方法示例)

$H_{a} : μ_{2} > μ_{1}$ (class B with new method better than A); $H_{0} : μ_{2} \leq μ_{1}$ .
例： $H_{a} : μ_{2} > μ_{1}$ （新方法 B 班更好）， $H_{0} : μ_{2} \leq μ_{1}$ 。

5. One-Tailed vs. Two-Tailed Tests (单尾检验与双尾检验)

One-Tailed Tests (单尾检验)

Concern only one direction (e.g., “greater than” or “less than”).
只关心单一方向的变化（只关心“变大”或“变小”）。
Forms:
- Lower-tail: $H_{0} : μ \geq μ_{0}$ , $H_{a} : μ < μ_{0}$
- Upper-tail: $H_{0} : μ \leq μ_{0}$ , $H_{a} : μ > μ_{0}$

Two-Tailed Tests (双尾检验)

Detect any difference (either greater or less).
检测“是否不同”，不区分方向。
Form: $H_{0} : μ = μ_{0}$ , $H_{a} : μ \neq = μ_{0}$ 。

Example: Bottle Sizes (瓶子大小示例)

One-tail: $H_{0} : μ_{1} \leq μ_{2}$ vs. $H_{a} : μ_{1} > μ_{2}$ (A not bigger than B).
单尾例： $H_{0} : μ_{1} \leq μ_{2}$ 对比 $H_{a} : μ_{1} > μ_{2}$ 。
Two-tail: $H_{0} : μ_{1} = μ_{2}$ vs. $H_{a} : μ_{1} \neq = μ_{2}$ .
双尾例： $H_{0} : μ_{1} = μ_{2}$ 对比 $H_{a} : μ_{1} \neq = μ_{2}$ 。

6. Type I & Type II Errors (第一类与第二类错误)

Why Errors Occur (为什么会出错)

Decisions are based on samples, not the whole population.
决策基于样本而非总体，存在抽样误差与偏差。

Type I Error (第一类错误)

Reject $H_{0}$ when $H_{0}$ is actually true.
在 $H_{0}$ 真实时错误地拒绝 $H_{0}$ 。
Probability of Type I error = significance level $α$ .
第一类错误的概率就是显著性水平 $α$ 。

Type II Error (第二类错误)

Do not reject $H_{0}$ when $H_{0}$ is false (i.e., $H_{a}$ is true).
在 $H_{0}$ 为假时仍然不拒绝 $H_{0}$ 。
Probability denoted by $β$ ; affected by sample size and true effect size.
用 $β$ 表示，受样本量与真实效应大小影响。

Decision Table (决策表)

$H_{0}$ true + do not reject → correct decision.
$H_{0}$ 为真 + 不拒绝 → 正确决策。
$H_{0}$ true + reject → Type I error.
$H_{0}$ 为真 + 拒绝 → 第一类错误。
$H_{0}$ false + reject → correct decision.
$H_{0}$ 为假 + 拒绝 → 正确决策。
$H_{0}$ false + do not reject → Type II error.
$H_{0}$ 为假 + 不拒绝 → 第二类错误。

7. p-Value Concept (p 值的概念)

Definition (定义)

p-value: probability, assuming $H_{0}$ is true, of observing a test statistic at least as extreme as the sample’s.
p 值：在假定 $H_{0}$ 为真时，观察到当前或更极端检验统计量的概率。

Decision Rule (决策规则)

If $p \leq α$ , reject $H_{0}$ and support $H_{a}$ .
若 $p \leq α$ ，拒绝 $H_{0}$ ，支持 $H_{a}$ 。
If $p > α$ , do not reject $H_{0}$ .
若 $p > α$ ，则不拒绝 $H_{0}$ 。

Evidence Strength (证据强度)

$p < 0.01$ → very strong evidence for $H_{a}$ .
$p < 0.01$ → 支持 $H_{a}$ 的证据非常强。
$p < 0.05$ → strong evidence.
$p < 0.05$ → 证据强。
$p < 0.10$ → acceptable evidence.
$p < 0.10$ → 证据尚可。
$p > 0.10$ → insufficient evidence.
$p > 0.10$ → 证据不足。

Graph Example (图形示例)

Left-tail: $p$ is shaded area beyond observed $z$ ; compare with $α = 0.10$ .
左尾例：p 值为观测 z 左侧阴影面积，与 $α = 0.10$ 比较。

8. z-Score Approach (z 分数方法)

Relationship to p-Value (与 p 值的关系)

Each $z$ from standard normal has a corresponding tail probability $p$ .
标准正态中的每个 z 都对应一个尾部概率 p。
Two-tailed: reject $H_{0}$ if $∣ z ∣ > z_{α /2}$ .
双尾检验：若 $∣ z ∣ > z_{α /2}$ 则拒绝 $H_{0}$ 。
One-tailed: reject $H_{0}$ if $z > z_{α}$ (upper) or $z < - z_{α}$ (lower).
单尾检验：右尾 $z > z_{α}$ ，左尾 $z < - z_{α}$ 时拒绝 $H_{0}$ 。

Critical Values (临界值)

Common two-tailed:
- $α = 0.10$ : $z_{α /2} = 1.64$
- $α = 0.05$ : $z_{α /2} = 1.96$
- $α = 0.01$ : $z_{α /2} = 2.58$
常用双尾临界值如上。
Common one-tailed:
- $α = 0.10$ : $z_{α} = 1.28$
- $α = 0.05$ : $z_{α} = 1.64$
- $α = 0.01$ : $z_{α} = 2.33$

Evidence Interpretation (证据含义)

Smaller p ↔ larger $∣ z ∣$ beyond critical value → stronger evidence against $H_{0}$ .
p 越小、 $∣ z ∣$ 超过临界值越多 → 反对 $H_{0}$ 的证据越强。

Example (示例)

Two-tailed, $α = 0.05$ : $z = \pm 2.74$ gives p ≈ 0.0062 < 0.05 → reject $H_{0}$ .
例：双尾 α=0.05 时， $z = \pm 2.74$ 对应 p≈0.0062，小于 0.05，应拒绝 $H_{0}$ 。

9. z-Test Procedure for Mean (σ Known) (已知 σ 的均值 z 检验步骤)

Step 1 — Set Hypotheses (步骤1——写出假设)

Choose $H_{0}$ and $H_{a}$ based on research question and direction.
根据问题及方向写出 $H_{0}$ 与 $H_{a}$ 。

Step 2 — Choose α & Tail Type (步骤2——选定 α 与尾部)

Select significance level α (e.g., 0.10, 0.05, 0.01) and decide one- or two-tailed.
选显著性水平 α，并决定是单尾还是双尾检验。

Step 3 — Compute z-Value (步骤3——计算 z 值)

Use formula $z = \frac{x ˉ - μ _{0}}{σ / n}$ .
用公式 $z = \frac{x ˉ - μ _{0}}{σ / n}$ 计算 z。

Step 4 — Find Critical Value(s) (步骤4——求临界值)

Use α to get $z_{α}$ (one-tail) or $z_{α /2}$ (two-tail).
利用 α 查表或用软件得到 $z_{α}$ 或 $z_{α /2}$ 。

Step 5 — Make Decision (步骤5——作出决策)

Compare $z$ with critical value(s) or compare p with α; decide reject / not reject $H_{0}$ .
比较 z 与临界值或 p 与 α，决定是否拒绝 $H_{0}$ 。

10. Example: 12-Minute Time Goal (12 分钟目标示例)

Problem Setup (问题设定)

Population $σ = 3.2$ , $n = 40$ , goal: mean time $μ \leq 12$ minutes.
总体标准差 3.2，样本量 40，目标是平均时间不超过 12 分钟。
$H_{0} : μ \leq 12$ , $H_{a} : μ > 12$ (upper-tail test).
设 $H_{0} : μ \leq 12$ ， $H_{a} : μ > 12$ ，为右尾检验。

Case 1: $\overset{x}{ˉ} = 13.25$ (样本均值 13.25)

$z_{1} = 2.47$ , p = 0.0068 < 0.05, $z_{1} > z_{α} = 1.64$ → reject $H_{0}$ .
$z_{1} = 2.47$ ，p=0.0068<0.05 且 $z_{1} > 1.64$ → 拒绝 $H_{0}$ ，目标未达成。

Case 2: $\overset{x}{ˉ} = 12.5$ (样本均值 12.5)

$z_{2} = 0.99$ , p = 0.1611 > 0.05, $z_{2} < 1.64$ → do not reject $H_{0}$ .
$z_{2} = 0.99$ ，p=0.1611>0.05 且 $z_{2} < 1.64$ → 不拒绝 $H_{0}$ ，目标可视为达成。

11. Confidence Interval Approach (置信区间方法)

Idea (核心思想)

Build a $(1 - α) \times 100$ confidence interval for $μ$ : $\overset{x}{ˉ} \pm z_{α /2} \frac{σ}{n}$ .
构造 $(1 - α) \times 100$ 的总体均值置信区间： $\overset{x}{ˉ} \pm z_{α /2} \frac{σ}{n}$ 。

Decision Rule (决策规则)

If CI contains $μ_{0}$ → do not reject $H_{0}$ .
若置信区间包含 $μ_{0}$ → 不拒绝 $H_{0}$ 。
If CI does not contain $μ_{0}$ → reject $H_{0}$ .
若置信区间不包含 $μ_{0}$ → 拒绝 $H_{0}$ 。

Example with Two Samples (两个样本的例子)

For $\overset{x}{ˉ}_{1} = 13.25$ : CI = (12.26, 14.24), does not contain 12 → reject $H_{0}$ .
对于 $\overset{x}{ˉ}_{1} = 13.25$ ：区间 (12.26, 14.24) 不包含 12 → 拒绝 $H_{0}$ 。
For $\overset{x}{ˉ}_{2} = 12.5$ : CI = (11.51, 13.49), contains 12 → do not reject $H_{0}$ .
对于 $\overset{x}{ˉ}_{2} = 12.5$ ：区间 (11.51, 13.49) 包含 12 → 不拒绝 $H_{0}$ 。

Link to z-Test (与 z 检验的联系)

CI and z-test at same α always give the same decision.
相同 α 下，置信区间法与 z 检验的结论完全一致。

12. Summary of Lecture 16 (第16讲小结)

Key Takeaways (关键要点)

Hypothesis testing compares $H_{0}$ and $H_{a}$ using sample evidence.
假设检验用样本证据在 $H_{0}$ 与 $H_{a}$ 之间作出判断。
Choice of one- vs. two-tailed test depends on research question direction.
单尾或双尾检验由研究问题的方向决定。
Errors (Type I & II) are unavoidable; α controls Type I error.
第一、二类错误难以完全避免，α 控制第一类错误概率。
p-value, z-score, and confidence interval are three equivalent ways to make decisions.
p 值、z 分数与置信区间是三种等价的决策工具。

Graph View

Lecture 16 — Hypothesis Testing (第16讲——假设检验)
1. Overview of Lecture 16 (第16讲概览)
Topics (主题)
2. Purpose of Hypothesis Testing (假设检验的目的)
Idea (基本思想)
Population vs. Sample (总体与样本)
3. Null & Alternative Hypotheses (原假设与备择假设)
Null Hypothesis H_0 (原假设 H_0)
Alternative Hypothesis H_a (备择假设 H_a)
Using Sample Data (利用样本数据)
4. Supporting H_a vs. Not Rejecting H_0 (支持 H_a 与不拒绝 H_0)
Supporting H_a (支持备择假设)
Not Rejecting H_0 (不拒绝原假设)
Example: Teaching Methods (教学方法示例)
5. One-Tailed vs. Two-Tailed Tests (单尾检验与双尾检验)
One-Tailed Tests (单尾检验)
Two-Tailed Tests (双尾检验)
Example: Bottle Sizes (瓶子大小示例)
6. Type I & Type II Errors (第一类与第二类错误)
Why Errors Occur (为什么会出错)
Type I Error (第一类错误)
Type II Error (第二类错误)
Decision Table (决策表)
7. p-Value Concept (p 值的概念)
Definition (定义)
Decision Rule (决策规则)
Evidence Strength (证据强度)
Graph Example (图形示例)
8. z-Score Approach (z 分数方法)
Relationship to p-Value (与 p 值的关系)
Critical Values (临界值)
Evidence Interpretation (证据含义)
Example (示例)
9. z-Test Procedure for Mean (σ Known) (已知 σ 的均值 z 检验步骤)
Step 1 — Set Hypotheses (步骤1——写出假设)
Step 2 — Choose α & Tail Type (步骤2——选定 α 与尾部)
Step 3 — Compute z-Value (步骤3——计算 z 值)
Step 4 — Find Critical Value(s) (步骤4——求临界值)
Step 5 — Make Decision (步骤5——作出决策)
10. Example: 12-Minute Time Goal (12 分钟目标示例)
Problem Setup (问题设定)
Case 1: \bar{x} = 13.25 (样本均值 13.25)
Case 2: \bar{x} = 12.5 (样本均值 12.5)
11. Confidence Interval Approach (置信区间方法)
Idea (核心思想)
Decision Rule (决策规则)
Example with Two Samples (两个样本的例子)
Link to z-Test (与 z 检验的联系)
12. Summary of Lecture 16 (第16讲小结)
Key Takeaways (关键要点)

Backlinks

NO.16

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community