Slide 1 — Continuous Probability Distribution(连续概率分布)
🧭 Knowledge Points
- Random Variable(随机变量)
- Continuous Probability Distribution(连续概率分布)
- Expected Value and Variance(期望值与方差)
- Uniform Probability Distribution(均匀概率分布)
- Normal Probability Distribution(正态概率分布:预告)
🔹Knowledge Point 1: Random Variable(随机变量)
Explanation(解释)
-
A random variable X is a rule that assigns a numerical value to each outcome of a random experiment.
随机变量是把每一个随机试验结果映射为一个数值的“规则/函数”。 -
Two main types:
- Discrete — takes isolated, countable values (0, 1, 2, …)。
- Continuous — can take any value in an interval (例如 0 到 10 之间的任意实数)。
-
For continuous random variables, we talk about densities and interval probabilities, not the probability of a single exact point.
Example(例子)
- Discrete: X = number of defective items in a box of 20 chips. Possible values: 0, 1, 2, …, 20。
- Continuous: Y = amount of milk (in liters) filled into a 1L bottle; possible values such as 0.996, 0.999, 1.001 等一整段区间。
Extension(拓展)
- In business statistics, random variables often represent: demand, waiting time, sales revenue, stock returns, etc.
在商学应用中,随机变量经常表示需求量、等待时间、销售额、股票收益率等。 - Whether we treat a variable as “discrete” or “continuous” usually depends on how we measure it and what model is convenient.
🔹Knowledge Point 2: Continuous Probability Distribution(连续概率分布)
Explanation(解释)
-
A continuous probability distribution is described by a probability density function (PDF) f(x).
连续概率分布通过概率密度函数 f(x) 来描述。 -
Key properties:
- f(x) ≥ 0 for all x(密度不为负);
- The total area under the curve is 1: ∫ f(x) dx = 1;
- Probability of an interval: P(a ≤ X ≤ b) = area of the curve from a to b。
任意单点的概率 P(X = c) = 0。
Example(例子)
- Let X be the time (in minutes) a customer spends in a shop, modeled by a continuous distribution on [0, 60].
我们关心的是“花费 10–20 分钟的概率” P(10 ≤ X ≤ 20),而不是恰好 12.345 分钟的概率。
Extension(拓展)
- In practice,we use named distributions (uniform, normal, exponential, etc.) as PDFs with specific shapes and formulas。
- Continuous distributions are the basis for computing expected value, variance, quantiles, and probabilities in many data-analytic tasks.
🔹Knowledge Point 3: Expected Value and Variance(期望值与方差)
Explanation(解释)
-
Expected value / mean μ = E(X): theoretical long-run average of X.
期望值是“长期重复实验后,X 的平均值”。 -
Variance Var(X): average squared distance of X from the mean;
standard deviation σ = √Var(X): typical distance from the mean.
方差和标准差衡量“波动性/离散程度”。 -
对连续型 X:
E(X) = ∫ x f(x) dx
Var(X) = ∫ (x − μ)² f(x) dx
Example(例子)
- Suppose X is uniformly distributed on [0, 10],即 PDF f(x) = 0.1。
直观地看:- 期望 μ = (0 + 10) / 2 = 5(区间中点);
- 方差 = (区间长度²) / 12 = 10² / 12 ≈ 8.33。
Extension(拓展)
- 在商业决策中:
- 期望值代表“平均收益/成本”;
- 标准差代表“风险大小”(波动越大,风险越高)。
- 之后的“正态分布”会用 μ 和 σ 完整刻画分布形状。
🔹Knowledge Point 4: Uniform Probability Distribution(均匀概率分布)
Explanation(解释)
-
Uniform distribution U(a, b): every value between a and b is equally likely.
均匀分布表示在区间 [a, b] 内各个取值机会完全相同。 -
PDF:
f(x) = 1 / (b − a), for a ≤ x ≤ b;
f(x) = 0, otherwise。 -
Mean and variance:
μ = (a + b) / 2; Var(X) = (b − a)² / 12。
Example(例子)
- A bus arrives any time between 10:00 and 10:20 with equal chance.
若我们设 10:00 为 0 分钟,10:20 为 20 分钟,则 X ~ U(0, 20),- P(5 ≤ X ≤ 10) = (10 − 5) / (20 − 0) = 5/20 = 0.25。
Extension(拓展)
- 均匀分布常用于:
- 电脑随机数生成;
- 模拟“完全公平、没有偏好”的情况。
- 虽然简单,但它帮助我们理解“密度曲线”“区间面积 = 概率”等概念,为学习正态分布做铺垫。
🔹Knowledge Point 5: Normal Probability Distribution(正态概率分布:预告)
Explanation(解释)
- 正态分布是最常用的连续分布之一,形状为对称的“钟形曲线”,由 μ 和 σ 两个参数完全决定。
它将贯穿之后的 z-score、标准正态、Excel 函数等内容。
Example(例子)
- 许多现实变量“近似”正态:如身高、考试成绩、测量误差、某些平均值。
Extension(拓展)
- 正态分布的重要性来自:
- 中心极限定理(很多平均值的分布趋向正态);
- 统计推断(置信区间、假设检验)中的大量公式都假定或依赖正态性。
Slide 2 — Normal Probability Distribution(正态概率分布基础)
🧭 Knowledge Points
- Shape and Properties of Normal Distribution(正态分布的形状与性质)
- Parameters μ and σ(参数 μ 与 σ 的作用)
- Standard Normal Distribution Z(0,1)(标准正态分布)
🔹Knowledge Point 6: Shape and Properties(形状与基本性质)
Explanation(解释)
-
Bell-shaped & symmetric: curve is highest at the mean μ, tails decrease on both sides.
钟形且左右对称,最高点在均值 μ 处,两端尾部逐渐接近 0。 -
Total area under the curve = 1。
曲线下方面积为 1,代表总概率。 -
Empirical rule(经验法则 68–95–99.7) 对任何标准正态:
- 约 68% 的观测落在 μ ± 1σ 之间;
- 约 95% 落在 μ ± 2σ;
- 约 99.7% 落在 μ ± 3σ。
Example(例子)
- If exam scores are N(μ = 70, σ = 10),
- 约 68% 的学生分数在 60 到 80 之间;
- 约 95% 在 50 到 90 之间。
Extension(拓展)
- 经验法则可以帮我们快速判断“某个值是不是异常值”:
- 超过 μ ± 2σ:有点偏离;
- 超过 μ ± 3σ:通常被视为“极端值”。
🔹Knowledge Point 7: Role of μ and σ(均值与标准差的作用)
Explanation(解释)
- Mean μ: controls the location of the curve. Changing μ shifts the curve left or right without changing its shape.
- Standard deviation σ: controls the spread. Larger σ → wider, flatter curve; smaller σ → narrower, taller curve。
均值决定“中心位置”,标准差决定“胖瘦程度”。
Example(例子)
- 比较两组身高数据:
- 男生:N(175, 7²);
- 女生:N(162, 6²)。
男生分布整体在右侧(更高),且稍微更分散。
Extension(拓展)
- 在分析数据时,μ 和 σ 往往通过样本均值与样本标准差估计而来,用于:
- 预测落在某区间的概率;
- 进行质量控制、风险评估等。
🔹Knowledge Point 8: Standard Normal Distribution Z(0,1)(标准正态分布)
Explanation(解释)
- 当 μ = 0、σ = 1 时,正态分布称为 标准正态分布,记作 Z ~ N(0, 1)。
- 其 PDF、概率表、Excel 函数都已预先计算好,因此是所有正态分布的“基准”。
Example(例子)
- 若 Z ~ N(0,1),则:
- P(Z ≤ 0) = 0.5(对称);
- P(−1 ≤ Z ≤ 1) ≈ 0.68;
- P(Z ≥ 1.96) ≈ 0.025(常见于 95% 置信区间)。
Extension(拓展)
- 任意正态 X ~ N(μ, σ²) 都可以通过 z-score 转换为标准正态 Z:
z = (x − μ) / σ。
这使得我们只需掌握一张 标准正态表 或一个 Excel 函数,就能解决所有正态概率问题。
Slide 3 — z-Score(标准分数)
🧭 Knowledge Points
- Definition and Formula of z-Score(z 分数的定义与公式)
- Interpretation: Distance in Standard Deviations(解释:离均值多少个标准差)
- Empirical Rule and z-Scores(经验法则与 z 分数)
🔹Knowledge Point 9: Definition and Formula(定义与公式)
Explanation(解释)
- A z-score converts a raw value x from any normal distribution N(μ, σ²) to the standard normal scale.
- 公式:
z = (x − μ) / σ
含义:把“原始单位”的数值 x 转换成“距离均值 μ 的标准差个数”。
Example(例子)
- 某学校成绩:X ~ N(μ = 70, σ = 8)。
- 一个学生得了 x = 86 分:
z = (86 − 70) / 8 = 16 / 8 = 2。
说明这个学生在均值之上 2 个标准差。
- 一个学生得了 x = 86 分:
Extension(拓展)
- 通过 z-score,我们可以:
- 把不同量纲的变量进行比较(例如数学成绩 vs 英语成绩);
- 利用标准正态表查任意正态分布的概率。
🔹Knowledge Point 10: Interpretation as Distance in σ(“距离均值多少个 σ”)
Explanation(解释)
- z > 0:值在均值右侧(高于平均);
- z < 0:值在均值左侧(低于平均);
- |z| 越大,表示越“极端”或“罕见”。
Example(例子)
- z = 1:比平均大 1 个标准差,属于“略高于正常”。
- z = −2.5:比平均低 2.5 个标准差,通常被视为异常偏低。
Extension(拓展)
- 在质量控制、金融风险管理中,常用 z-score 判断是否超出可接受范围。
- 例如:若我们将“绝对值大于 3 的 z”视为异常点,可以快速筛查异常交易、测量错误等。
🔹Knowledge Point 11: Empirical Rule and z-Scores(经验法则与 z)
Explanation(解释)
- 对标准正态分布:
- 大约 68% 的 observations 的 z 在 −1 和 1 之间;
- 约 95% 在 −2 和 2 之间;
- 约 99.7% 在 −3 和 3 之间。
Example(例子)
- 如果某电池寿命服从正态分布且 z > 2 的概率只有 2.5%,
那么“z ≥ 2 的电池”可以被称为“寿命特别长的高质量电池”。
Extension(拓展)
- 经验法则提供了一个 快速估算概率 的方法,尤其在没有表格或电脑时。
- 但在考试和实际计算中,我们更常用 标准正态表 或 Excel 函数 得到更精确的概率。
Slide 4 — Normal Distribution Functions & Excel(正态分布函数与 Excel)
🧭 Knowledge Points
- Cumulative Probability in Normal Distribution(正态分布中的累积概率)
- Excel Functions NORM.DIST and NORM.S.DIST(Excel 正态函数)
- Lower Tail vs Upper Tail Probabilities(下尾与上尾概率的转换)
🔹Knowledge Point 12: Cumulative Probability(累积概率)
Explanation(解释)
- Cumulative probability F(x) = P(X ≤ x) 表示:随机变量 X 小于或等于某个值 x 的概率。
- 在正态分布中,F(x) 对应“从左侧一直积分到 x 的面积”。
Example(例子)
- 对身高 X ~ N(170, 6²):
- P(X ≤ 170) = 0.5(对称);
- P(X ≤ 182) = P(Z ≤ (182 − 170) / 6 ≈ 2) ≈ 0.9772。
Extension(拓展)
- 很多实际问题都是“至少”“不超过”“少于”等描述,本质上都是累积概率。
- 所有 Excel 正态函数都是在计算这种 F(x)。
🔹Knowledge Point 13: Excel Functions NORM.DIST & NORM.S.DIST(Excel 正态函数)
Explanation(解释)
-
在 Excel 中:
NORM.DIST(x, mean, standard_dev, TRUE)
→ 给出 X ~ N(mean, standard_dev²) 时的累积概率 P(X ≤ x)。NORM.S.DIST(z, TRUE)
→ 给出 Z ~ N(0,1) 时的累积概率 P(Z ≤ z)。
-
幻灯片中的说明:
- 如果使用标准正态,则直接:
NORM.S.DIST(z, TRUE)。 - 如果是一般正态,则用:
NORM.DIST(x, mean, std, TRUE)。
- 如果使用标准正态,则直接:
Example(例子)
-
一般正态:
- 若 X ~ N(3, 1.2²),求 P(X ≤ 3)。
- 在 Excel 中输入:
=NORM.DIST(3, 3, 1.2, TRUE)→ 0.5。
-
标准正态:
- 求 P(Z ≤ 0),在 Excel 中:
=NORM.S.DIST(0, TRUE)→ 0.5。
- 求 P(Z ≤ 0),在 Excel 中:
Extension(拓展)
- 若想求 区间概率 P(a ≤ X ≤ b),可用:
P(a ≤ X ≤ b) = F(b) − F(a),
即在 Excel 中用两次 NORM.DIST / NORM.S.DIST 的差。 - 在作业或考试中,注意 TRUE 表示“累积”,FALSE 则表示“密度值(高度)”。
🔹Knowledge Point 14: Lower Tail vs Upper Tail(下尾与上尾)
Explanation(解释)
- Excel 和正态表通常给的是 lower tail 概率:P(X ≤ x) or P(Z ≤ z)。
- 对于 upper tail 概率:P(X ≥ x) 或 P(Z ≥ z),可以用:
P(X ≥ x) = 1 − P(X ≤ x)。
Example(例子)
-
若 Excel 计算得到 P(Z ≤ 1.5) = 0.9332,
则 P(Z ≥ 1.5) = 1 − 0.9332 = 0.0668。 -
如果问题问:“成绩高于 86 分的比例是多少?”
我们先算 P(X ≤ 86),再用 1 − 该值。
Extension(拓展)
- 很多商业问题关心的是“超过某标准的概率”(例如:超出预算、超过质量上限),
这类问题几乎都需要将 lower tail 转为 upper tail。 - 在 Excel 中非常常见的模式是:
1 - NORM.DIST(x, mean, std, TRUE)或1 - NORM.S.DIST(z, TRUE)。
Slide 5 — Standard Normal Distribution Table(标准正态分布表的使用)
🧭 Knowledge Points
- Understanding the Z-Table Structure(理解Z表结构)
- Finding Cumulative Probabilities(查找累积概率)
- Converting Between Probabilities and Z-values(概率与Z值之间的转换)
- Using Excel vs Table for Z-values(Excel 与 Z 表的对比应用)
🔹Knowledge Point 15: Understanding the Z-Table Structure(理解Z表结构)
Explanation(解释)
-
The standard normal table (Z-table) lists cumulative probabilities P(Z ≤ z) for the standard normal distribution N(0,1)。
标准正态分布表列出了标准正态变量 Z 小于或等于某个数的累积概率。 -
通常:
- 行(rows)表示 Z 的整数部分与第一个小数位(如 1.2);
- 列(columns)表示第二个小数位(如 0.08);
- 表内的数值就是 P(Z ≤ z)。
Example(例子)
- 若 z = 1.28,查找表中行“1.2”,列“0.08”,
可得 P(Z ≤ 1.28) = 0.8997。 - 即,Z 值为 1.28 的左侧面积为 89.97%。
Extension(拓展)
- Z 表通常只列出 正值的 Z,因为分布对称:
P(Z ≤ −z) = 1 − P(Z ≤ z)。 - 所以在查找负 Z 时,只需对称计算。
🔹Knowledge Point 16: Finding Cumulative Probabilities(查找累积概率)
Explanation(解释)
要找 P(Z ≤ z),直接查表。
要找区间概率 P(a ≤ Z ≤ b),则计算:
P(Z ≤ b) − P(Z ≤ a)。
Example(例子)
- P(−1 ≤ Z ≤ 2)
= P(Z ≤ 2) − P(Z ≤ −1)
= 0.9772 − (1 − 0.8413)
= 0.8185
表示约 81.85% 的数据在 −1 与 2 之间。
Extension(拓展)
区间计算是 Z 表应用的核心技能,在考试题与商业决策(如绩效分布、合格率计算)中极为常见。
🔹Knowledge Point 17: Converting Between Probabilities and Z-values(概率与Z值互算)
Explanation(解释)
- 当我们知道概率 p 时,可查表或用 Excel 求对应 Z 值。
- 如果表中给出 P(Z ≤ z) = 0.975,
则 z ≈ 1.96。 - 反之,若 z = 1.96,则左侧概率约为 0.975。
- 如果表中给出 P(Z ≤ z) = 0.975,
Example(例子)
- 95% 置信区间的临界 Z 值:
中间面积 = 0.95 → 每尾 0.025,
P(Z ≤ z) = 0.975 → z = 1.96。
Extension(拓展)
这种反向查找常用于:
- 置信区间(critical z)
- 检验统计量(rejection region)
- 绩效阈值设定(top 5% performance)
🔹Knowledge Point 18: Using Excel vs Table(Excel 与 Z 表)
Explanation(解释)
- Excel 函数
NORM.S.DIST(z, TRUE)可直接替代 Z 表。
反向查找可用NORM.S.INV(probability)。
Example(例子)
=NORM.S.DIST(1.28, TRUE)→ 0.8997=NORM.S.INV(0.975)→ 1.96
Extension(拓展)
使用 Excel 可以减少查表误差并节省时间,尤其在大型数据分析中。
考试时若不允许使用电脑,应熟练手动查表。
Slide 6 — Normal Probability Applications(正态分布概率应用)
🧭 Knowledge Points
- Finding Area to the Left(求左侧面积)
- Finding Area to the Right(求右侧面积)
- Finding Area Between Two Values(求两个值之间的概率)
- Finding Value from Given Probability(已知概率求数值)
🔹Knowledge Point 19: Finding Area to the Left(左侧概率)
Explanation(解释)
P(X ≤ x) → 将 x 转换为 Z,再查表求左侧面积。
步骤:
- 标准化:z = (x − μ)/σ
- 查表或用 Excel 计算 P(Z ≤ z)
Example(例子)
X ~ N(100, 15²),求 P(X ≤ 115)。
z = (115 − 100)/15 = 1.0
P(Z ≤ 1.0) = 0.8413。
所以 P(X ≤ 115) = 0.8413。
Extension(拓展)
此类型问题最常见于“低于某阈值的比例”或“合格率”的计算。
🔹Knowledge Point 20: Finding Area to the Right(右侧概率)
Explanation(解释)
P(X ≥ x) = 1 − P(X ≤ x)。
Example(例子)
X ~ N(50, 10²),求 P(X ≥ 65)。
z = (65 − 50)/10 = 1.5
P(Z ≤ 1.5) = 0.9332
P(X ≥ 65) = 1 − 0.9332 = 0.0668。
Extension(拓展)
右尾概率常用于风险或超额收益分析,如“超过预算的概率”“异常高利润的概率”。
🔹Knowledge Point 21: Finding Area Between Two Values(区间概率)
Explanation(解释)
P(a ≤ X ≤ b) = P(X ≤ b) − P(X ≤ a)。
Example(例子)
X ~ N(μ=100, σ=20),求 P(80 ≤ X ≤ 120)。
z₁ = (80−100)/20 = −1;z₂ = (120−100)/20 = 1。
P(Z ≤ 1) − P(Z ≤ −1) = 0.8413 − 0.1587 = 0.6826。
Extension(拓展)
表示数据集中在均值附近 ±1σ 范围的比例,通常约 68%。
🔹Knowledge Point 22: Finding Value from Given Probability(已知概率求数值)
Explanation(解释)
已知 P(X ≤ x₀) = p → 查得对应 z₀ → 反算 x₀ = μ + z₀σ。
Example(例子)
X ~ N(μ=500, σ=100),求 P(X ≤ x₀)=0.95 时的 x₀。
P(Z ≤ z₀)=0.95 → z₀=1.645。
x₀=500+1.645×100=664.5。
Extension(拓展)
在商业决策中常用于:
- 设定质量上限(Top 5% cutoff)
- 绩效奖金门槛(前 10% 员工)
Slide 7 — Business & Economic Applications(正态分布的商业与经济应用)
🧭 Knowledge Points
- Inventory and Quality Control(库存与质量控制)
- Employee Performance Evaluation(员工绩效评估)
- Financial Forecasting(财务预测)
- Risk Management(风险评估)
🔹Knowledge Point 23: Inventory and Quality Control(库存与质量控制)
Explanation(解释)
- 在生产或库存管理中,产品质量参数(如尺寸、重量)通常服从正态分布。
- 可利用正态分布计算“不合格品率”或“超出规格的概率”。
Example(例子)
某产品重量 X ~ N(100, 2²),合格区间 [96, 104]。
z₁=(96−100)/2=−2;z₂=(104−100)/2=2。
P(−2 ≤ Z ≤ 2)=0.9545 → 约 95.45% 产品合格。
Extension(拓展)
工程与质量控制领域使用此法确定容差范围(tolerance limit)与过程能力指数(Cp, Cpk)。
🔹Knowledge Point 24: Employee Performance Evaluation(员工绩效评估)
Explanation(解释)
- 公司可假定绩效分布近似正态。
- 可设定“前10%”为高绩效区间。
Example(例子)
若绩效分布 N(μ=70, σ=10),
P(X ≥ x₀)=0.10 → P(Z ≤ z₀)=0.90 → z₀=1.2816。
x₀=70+1.2816×10=82.82。
即得分 ≥ 82.82 为前10%。
Extension(拓展)
此法广泛用于薪资激励制度与绩效分布分析。
🔹Knowledge Point 25: Financial Forecasting(财务预测)
Explanation(解释)
- 投资收益率或销售额增长常近似服从正态分布。
- 可利用概率预测“超过某收益目标”的可能性。
Example(例子)
年度收益 X ~ N(10%, 5²)。
P(X ≥ 15%)=P(Z ≥ 1)=1−0.8413=0.1587。
→ 有15.87%概率收益超过15%。
Extension(拓展)
帮助企业进行“盈亏分析(profit/loss probability)”与“目标可达性预测(target attainment probability)”。
🔹Knowledge Point 26: Risk Management(风险管理)
Explanation(解释)
- 风险管理中使用正态分布预测极端损失的概率(Value-at-Risk)。
- 常假设资产回报率服从 N(μ, σ²)。
Example(例子)
若 μ=5%,σ=3%,
求5%分位点:P(X ≤ x₀)=0.05 → z=−1.645。
x₀=5%+(−1.645)×3%=0.05−0.0494=0.0006=0.06%。
→ 5%情况下收益低于0.06%。
Extension(拓展)
该结果即为 VaR(Value at Risk):95% 置信水平下最大可能损失。
Slide 8 — Sampling Distribution of the Mean(样本均值的抽样分布)
🧭 Knowledge Points
- Definition of Sampling Distribution(抽样分布定义)
- Mean and Standard Error(样本均值与标准误)
- Central Limit Theorem(中心极限定理)
- Application to Large Samples(大样本近似正态)
🔹Knowledge Point 27: Definition(定义)
Explanation(解释)
- 当我们从总体抽取多个样本并计算样本均值 x̄,每个样本均值构成一个分布 → 抽样分布。
- 它描述样本均值的变动规律。
Example(例子)
总体:学生成绩 μ=75,σ=10。
抽取多次样本(n=25),得到不同的 x̄。
这些 x̄ 的分布即为“样本均值的抽样分布”。
Extension(拓展)
抽样分布连接“总体”与“样本”之间的统计推断桥梁。
🔹Knowledge Point 28: Mean and Standard Error(均值与标准误)
Explanation(解释)
样本均值的抽样分布性质:
- E(x̄) = μ
- σₓ̄ = σ / √n (称为“标准误差 SE”)
Example(例子)
σ=10, n=25 → SE=10/√25=2。
样本均值围绕总体均值 μ=75 波动,标准误差为2。
Extension(拓展)
标准误差越小 → 样本均值越稳定 → 估计越可靠。
🔹Knowledge Point 29: Central Limit Theorem(中心极限定理)
Explanation(解释)
无论总体分布形状如何,当样本容量 n 足够大时,样本均值分布近似正态。
即:
x̄ ~ N(μ, σ²/n),当 n ≥ 30 时近似成立。
Example(例子)
总体非正态,但 n=50 时,样本均值分布接近 N(μ, σ/√n)。
Extension(拓展)
中心极限定理是统计推断的理论基础,支撑置信区间与假设检验的使用。
🔹Knowledge Point 30: Application to Large Samples(大样本近似正态)
Explanation(解释)
若 n ≥ 30,可直接使用正态分布方法近似样本均值的概率。
P(x̄ ≤ value) 由标准化公式求得:
z = (x̄ − μ) / (σ / √n)
Example(例子)
μ=100,σ=20,n=64,求 P(x̄ ≤ 105)。
z=(105−100)/(20/8)=5/2.5=2 → P(Z ≤ 2)=0.9772。
Extension(拓展)
在抽样调查与质量控制中常用于估计总体参数与概率。
Slide 9 — From Population to Sample(从总体到样本的推断)
🧭 Knowledge Points
- Relationship Between Population and Sample(总体与样本关系)
- Sampling Error(抽样误差)
- Role of Sampling Distribution(抽样分布的作用)
- Basis for Statistical Inference(统计推断的基础)
🔹Knowledge Point 31: Relationship Between Population and Sample(总体与样本关系)
Explanation(解释)
总体(population)包含所有个体;样本(sample)是总体的一部分。
统计学通过样本来推测总体特征。
Example(例子)
总体:所有顾客的满意度;
样本:随机选取的200位顾客的反馈。
Extension(拓展)
代表性强的样本能准确反映总体;抽样偏差会导致系统性误差。
🔹Knowledge Point 32: Sampling Error(抽样误差)
Explanation(解释)
抽样误差 = 样本统计量 − 总体参数。
它来自样本的随机波动,而非测量错误。
Example(例子)
总体平均收入 = ¥10,000;
样本平均收入 = ¥9,700;
抽样误差 = −¥300。
Extension(拓展)
样本越大,抽样误差越小。
在推断时应报告标准误(standard error)以量化不确定性。
🔹Knowledge Point 33: Role of Sampling Distribution(抽样分布的作用)
Explanation(解释)
抽样分布告诉我们在重复抽样下,样本统计量(如 x̄)的分布形状、中心与离散程度。
它连接总体参数 μ 与样本结果 x̄ 之间的概率关系。
Example(例子)
我们可以计算 P(x̄ ≥ 52) 的概率,用以评估样本均值是否显著高于总体均值。
Extension(拓展)
在假设检验中,抽样分布用作判断“样本结果是否偶然出现”的标准。
🔹Knowledge Point 34: Basis for Statistical Inference(统计推断的基础)
Explanation(解释)
抽样分布构成置信区间与假设检验的数学基础。
通过它,我们能以一定置信度推测总体均值或比例。
Example(例子)
如果 95% 的样本均值落在 μ ± 1.96(σ/√n) 之间,
我们可据此构建 95% 置信区间。
Extension(拓展)
理解抽样分布有助于解释推断统计结果的意义,如“显著性水平”“置信度”等。
Slide 5 — Standard Normal Distribution Table(标准正态分布表的使用)
🧭 Knowledge Points
- Understanding the Z-Table Structure(理解Z表结构)
- Finding Cumulative Probabilities(查找累积概率)
- Converting Between Probabilities and Z-values(概率与Z值之间的转换)
- Using Excel vs Table for Z-values(Excel 与 Z 表的对比应用)
🔹Knowledge Point 15: Understanding the Z-Table Structure(理解Z表结构)
Explanation(解释)
-
The standard normal table (Z-table) lists cumulative probabilities P(Z ≤ z) for the standard normal distribution N(0,1)。
标准正态分布表列出了标准正态变量 Z 小于或等于某个数的累积概率。 -
通常:
- 行(rows)表示 Z 的整数部分与第一个小数位(如 1.2);
- 列(columns)表示第二个小数位(如 0.08);
- 表内的数值就是 P(Z ≤ z)。
Example(例子)
- 若 z = 1.28,查找表中行“1.2”,列“0.08”,
可得 P(Z ≤ 1.28) = 0.8997。 - 即,Z 值为 1.28 的左侧面积为 89.97%。
Extension(拓展)
- Z 表通常只列出 正值的 Z,因为分布对称:
P(Z ≤ −z) = 1 − P(Z ≤ z)。 - 所以在查找负 Z 时,只需对称计算。
🔹Knowledge Point 16: Finding Cumulative Probabilities(查找累积概率)
Explanation(解释)
要找 P(Z ≤ z),直接查表。
要找区间概率 P(a ≤ Z ≤ b),则计算:
P(Z ≤ b) − P(Z ≤ a)。
Example(例子)
- P(−1 ≤ Z ≤ 2)
= P(Z ≤ 2) − P(Z ≤ −1)
= 0.9772 − (1 − 0.8413)
= 0.8185
表示约 81.85% 的数据在 −1 与 2 之间。
Extension(拓展)
区间计算是 Z 表应用的核心技能,在考试题与商业决策(如绩效分布、合格率计算)中极为常见。
🔹Knowledge Point 17: Converting Between Probabilities and Z-values(概率与Z值互算)
Explanation(解释)
- 当我们知道概率 p 时,可查表或用 Excel 求对应 Z 值。
- 如果表中给出 P(Z ≤ z) = 0.975,
则 z ≈ 1.96。 - 反之,若 z = 1.96,则左侧概率约为 0.975。
- 如果表中给出 P(Z ≤ z) = 0.975,
Example(例子)
- 95% 置信区间的临界 Z 值:
中间面积 = 0.95 → 每尾 0.025,
P(Z ≤ z) = 0.975 → z = 1.96。
Extension(拓展)
这种反向查找常用于:
- 置信区间(critical z)
- 检验统计量(rejection region)
- 绩效阈值设定(top 5% performance)
🔹Knowledge Point 18: Using Excel vs Table(Excel 与 Z 表)
Explanation(解释)
- Excel 函数
NORM.S.DIST(z, TRUE)可直接替代 Z 表。
反向查找可用NORM.S.INV(probability)。
Example(例子)
=NORM.S.DIST(1.28, TRUE)→ 0.8997=NORM.S.INV(0.975)→ 1.96
Extension(拓展)
使用 Excel 可以减少查表误差并节省时间,尤其在大型数据分析中。
考试时若不允许使用电脑,应熟练手动查表。
Slide 6 — Normal Probability Applications(正态分布概率应用)
🧭 Knowledge Points
- Finding Area to the Left(求左侧面积)
- Finding Area to the Right(求右侧面积)
- Finding Area Between Two Values(求两个值之间的概率)
- Finding Value from Given Probability(已知概率求数值)
🔹Knowledge Point 19: Finding Area to the Left(左侧概率)
Explanation(解释)
P(X ≤ x) → 将 x 转换为 Z,再查表求左侧面积。
步骤:
- 标准化:z = (x − μ)/σ
- 查表或用 Excel 计算 P(Z ≤ z)
Example(例子)
X ~ N(100, 15²),求 P(X ≤ 115)。
z = (115 − 100)/15 = 1.0
P(Z ≤ 1.0) = 0.8413。
所以 P(X ≤ 115) = 0.8413。
Extension(拓展)
此类型问题最常见于“低于某阈值的比例”或“合格率”的计算。
🔹Knowledge Point 20: Finding Area to the Right(右侧概率)
Explanation(解释)
P(X ≥ x) = 1 − P(X ≤ x)。
Example(例子)
X ~ N(50, 10²),求 P(X ≥ 65)。
z = (65 − 50)/10 = 1.5
P(Z ≤ 1.5) = 0.9332
P(X ≥ 65) = 1 − 0.9332 = 0.0668。
Extension(拓展)
右尾概率常用于风险或超额收益分析,如“超过预算的概率”“异常高利润的概率”。
🔹Knowledge Point 21: Finding Area Between Two Values(区间概率)
Explanation(解释)
P(a ≤ X ≤ b) = P(X ≤ b) − P(X ≤ a)。
Example(例子)
X ~ N(μ=100, σ=20),求 P(80 ≤ X ≤ 120)。
z₁ = (80−100)/20 = −1;z₂ = (120−100)/20 = 1。
P(Z ≤ 1) − P(Z ≤ −1) = 0.8413 − 0.1587 = 0.6826。
Extension(拓展)
表示数据集中在均值附近 ±1σ 范围的比例,通常约 68%。
🔹Knowledge Point 22: Finding Value from Given Probability(已知概率求数值)
Explanation(解释)
已知 P(X ≤ x₀) = p → 查得对应 z₀ → 反算 x₀ = μ + z₀σ。
Example(例子)
X ~ N(μ=500, σ=100),求 P(X ≤ x₀)=0.95 时的 x₀。
P(Z ≤ z₀)=0.95 → z₀=1.645。
x₀=500+1.645×100=664.5。
Extension(拓展)
在商业决策中常用于:
- 设定质量上限(Top 5% cutoff)
- 绩效奖金门槛(前 10% 员工)
Slide 7 — Business & Economic Applications(正态分布的商业与经济应用)
🧭 Knowledge Points
- Inventory and Quality Control(库存与质量控制)
- Employee Performance Evaluation(员工绩效评估)
- Financial Forecasting(财务预测)
- Risk Management(风险评估)
🔹Knowledge Point 23: Inventory and Quality Control(库存与质量控制)
Explanation(解释)
- 在生产或库存管理中,产品质量参数(如尺寸、重量)通常服从正态分布。
- 可利用正态分布计算“不合格品率”或“超出规格的概率”。
Example(例子)
某产品重量 X ~ N(100, 2²),合格区间 [96, 104]。
z₁=(96−100)/2=−2;z₂=(104−100)/2=2。
P(−2 ≤ Z ≤ 2)=0.9545 → 约 95.45% 产品合格。
Extension(拓展)
工程与质量控制领域使用此法确定容差范围(tolerance limit)与过程能力指数(Cp, Cpk)。
🔹Knowledge Point 24: Employee Performance Evaluation(员工绩效评估)
Explanation(解释)
- 公司可假定绩效分布近似正态。
- 可设定“前10%”为高绩效区间。
Example(例子)
若绩效分布 N(μ=70, σ=10),
P(X ≥ x₀)=0.10 → P(Z ≤ z₀)=0.90 → z₀=1.2816。
x₀=70+1.2816×10=82.82。
即得分 ≥ 82.82 为前10%。
Extension(拓展)
此法广泛用于薪资激励制度与绩效分布分析。
🔹Knowledge Point 25: Financial Forecasting(财务预测)
Explanation(解释)
- 投资收益率或销售额增长常近似服从正态分布。
- 可利用概率预测“超过某收益目标”的可能性。
Example(例子)
年度收益 X ~ N(10%, 5²)。
P(X ≥ 15%)=P(Z ≥ 1)=1−0.8413=0.1587。
→ 有15.87%概率收益超过15%。
Extension(拓展)
帮助企业进行“盈亏分析(profit/loss probability)”与“目标可达性预测(target attainment probability)”。
🔹Knowledge Point 26: Risk Management(风险管理)
Explanation(解释)
- 风险管理中使用正态分布预测极端损失的概率(Value-at-Risk)。
- 常假设资产回报率服从 N(μ, σ²)。
Example(例子)
若 μ=5%,σ=3%,
求5%分位点:P(X ≤ x₀)=0.05 → z=−1.645。
x₀=5%+(−1.645)×3%=0.05−0.0494=0.0006=0.06%。
→ 5%情况下收益低于0.06%。
Extension(拓展)
该结果即为 VaR(Value at Risk):95% 置信水平下最大可能损失。
Slide 8 — Sampling Distribution of the Mean(样本均值的抽样分布)
🧭 Knowledge Points
- Definition of Sampling Distribution(抽样分布定义)
- Mean and Standard Error(样本均值与标准误)
- Central Limit Theorem(中心极限定理)
- Application to Large Samples(大样本近似正态)
🔹Knowledge Point 27: Definition(定义)
Explanation(解释)
- 当我们从总体抽取多个样本并计算样本均值 x̄,每个样本均值构成一个分布 → 抽样分布。
- 它描述样本均值的变动规律。
Example(例子)
总体:学生成绩 μ=75,σ=10。
抽取多次样本(n=25),得到不同的 x̄。
这些 x̄ 的分布即为“样本均值的抽样分布”。
Extension(拓展)
抽样分布连接“总体”与“样本”之间的统计推断桥梁。
🔹Knowledge Point 28: Mean and Standard Error(均值与标准误)
Explanation(解释)
样本均值的抽样分布性质:
- E(x̄) = μ
- σₓ̄ = σ / √n (称为“标准误差 SE”)
Example(例子)
σ=10, n=25 → SE=10/√25=2。
样本均值围绕总体均值 μ=75 波动,标准误差为2。
Extension(拓展)
标准误差越小 → 样本均值越稳定 → 估计越可靠。
🔹Knowledge Point 29: Central Limit Theorem(中心极限定理)
Explanation(解释)
无论总体分布形状如何,当样本容量 n 足够大时,样本均值分布近似正态。
即:
x̄ ~ N(μ, σ²/n),当 n ≥ 30 时近似成立。
Example(例子)
总体非正态,但 n=50 时,样本均值分布接近 N(μ, σ/√n)。
Extension(拓展)
中心极限定理是统计推断的理论基础,支撑置信区间与假设检验的使用。
🔹Knowledge Point 30: Application to Large Samples(大样本近似正态)
Explanation(解释)
若 n ≥ 30,可直接使用正态分布方法近似样本均值的概率。
P(x̄ ≤ value) 由标准化公式求得:
z = (x̄ − μ) / (σ / √n)
Example(例子)
μ=100,σ=20,n=64,求 P(x̄ ≤ 105)。
z=(105−100)/(20/8)=5/2.5=2 → P(Z ≤ 2)=0.9772。
Extension(拓展)
在抽样调查与质量控制中常用于估计总体参数与概率。
Slide 9 — From Population to Sample(从总体到样本的推断)
🧭 Knowledge Points
- Relationship Between Population and Sample(总体与样本关系)
- Sampling Error(抽样误差)
- Role of Sampling Distribution(抽样分布的作用)
- Basis for Statistical Inference(统计推断的基础)
🔹Knowledge Point 31: Relationship Between Population and Sample(总体与样本关系)
Explanation(解释)
总体(population)包含所有个体;样本(sample)是总体的一部分。
统计学通过样本来推测总体特征。
Example(例子)
总体:所有顾客的满意度;
样本:随机选取的200位顾客的反馈。
Extension(拓展)
代表性强的样本能准确反映总体;抽样偏差会导致系统性误差。
🔹Knowledge Point 32: Sampling Error(抽样误差)
Explanation(解释)
抽样误差 = 样本统计量 − 总体参数。
它来自样本的随机波动,而非测量错误。
Example(例子)
总体平均收入 = ¥10,000;
样本平均收入 = ¥9,700;
抽样误差 = −¥300。
Extension(拓展)
样本越大,抽样误差越小。
在推断时应报告标准误(standard error)以量化不确定性。
🔹Knowledge Point 33: Role of Sampling Distribution(抽样分布的作用)
Explanation(解释)
抽样分布告诉我们在重复抽样下,样本统计量(如 x̄)的分布形状、中心与离散程度。
它连接总体参数 μ 与样本结果 x̄ 之间的概率关系。
Example(例子)
我们可以计算 P(x̄ ≥ 52) 的概率,用以评估样本均值是否显著高于总体均值。
Extension(拓展)
在假设检验中,抽样分布用作判断“样本结果是否偶然出现”的标准。
🔹Knowledge Point 34: Basis for Statistical Inference(统计推断的基础)
Explanation(解释)
抽样分布构成置信区间与假设检验的数学基础。
通过它,我们能以一定置信度推测总体均值或比例。
Example(例子)
如果 95% 的样本均值落在 μ ± 1.96(σ/√n) 之间,
我们可据此构建 95% 置信区间。
Extension(拓展)
理解抽样分布有助于解释推断统计结果的意义,如“显著性水平”“置信度”等。
Slide 10 — Finding z-Values Given Probabilities(根据概率查找z值)
🧭 Knowledge Points
- Tail Probabilities and Corresponding z-values(尾部概率与对应z值)
- Upper Tail vs Lower Tail(上尾与下尾的区别)
- Using Excel: NORM.S.INV(probability)(使用Excel的反函数)
- Common Critical Values for Confidence Levels(常见置信水平对应z值)
🔹Knowledge Point 51: Tail Probabilities and z-values(尾部概率与z值)
Explanation(解释)
- 标准正态分布的“尾部概率”指曲线极端一侧的面积。
如果上尾面积为 p,则有:
P(Z ≥ z₀) = p → P(Z ≤ z₀) = 1 − p。 - 我们通过查表或函数得到使面积对应的 z₀。
Example(例子)
| 尾部概率 | 方向 | 对应z值 |
|---|---|---|
| 0.10 | Upper tail | 1.28 |
| 0.025 | Upper tail | 1.96 |
| 0.025 | Lower tail | −1.96 |
Extension(拓展)
这些z值常用于:
- 显著性检验(Hypothesis Testing)
- 置信区间界限(Confidence Interval Bounds)
- 风险管理中确定极端区域(例如Top/Bottom 2.5%)
🔹Knowledge Point 52: Upper Tail vs Lower Tail(上尾与下尾区别)
Explanation(解释)
- 上尾 z 值为正(右侧区域),下尾 z 值为负(左侧区域)。
- 对称性:P(Z ≥ z) = P(Z ≤ −z)。
Example(例子)
若右尾为 0.025,z=1.96;则左尾为 0.025,z=−1.96。
Extension(拓展)
掌握正负号方向对于判定拒绝域与显著区尤为重要。
🔹Knowledge Point 53: Using Excel to Find z(Excel求z值)
Explanation(解释)
Excel 公式:
=NORM.S.INV(probability)
可直接根据左侧累计概率求 z 值。
Example(例子)
=NORM.S.INV(0.90)→ 1.2816=NORM.S.INV(0.975)→ 1.96
Extension(拓展)
Excel 提供比查表更快速与精确的方式,在商业数据分析中可自动化计算 z。
🔹Knowledge Point 54: Common Critical z-values(常见临界z值)
Explanation(解释)
常用置信水平与对应临界 z 值如下:
| 置信水平 | α | α/2 | z值(双尾) |
|---|---|---|---|
| 90% | 0.10 | 0.05 | ±1.645 |
| 95% | 0.05 | 0.025 | ±1.96 |
| 99% | 0.01 | 0.005 | ±2.576 |
Example(例子)
在95%置信区间:
P(−1.96 ≤ Z ≤ 1.96)=0.95。
Extension(拓展)
这些数值是统计推断核心参数,广泛用于置信区间和显著性检验。
Slide 11 — Probabilities in Standard Normal Distribution(标准正态分布中的概率)
🧭 Knowledge Points
- Cumulative Probability P(Z ≤ z)(累积概率)
- Table Interpretation & Graphical Meaning(查表与图像理解)
- Right-tail Probability(右尾概率计算)
- Excel Verification(Excel验证公式)
🔹Knowledge Point 55: Cumulative Probability(累积概率)
Explanation(解释)
- 累积概率是从 −∞ 到 z 的总面积。
- 标准正态分布表提供 P(Z ≤ z) 的值。
Example(例子)
| z | P(Z ≤ z) |
|---|---|
| 1.00 | 0.8413 |
| 1.96 | 0.9750 |
Extension(拓展)
这些数值代表落在均值左侧的比例,是所有尾部与区间计算的基础。
🔹Knowledge Point 56: Graphical Meaning(图像理解)
Explanation(解释)
图中的阴影面积表示 P(Z ≤ z)。
若右尾阴影为 p,则左侧面积为 1 − p。
Example(例子)
- 当阴影为左侧 97.5%,z=1.96。
- 当阴影为左侧 84.13%,z=1.00。
Extension(拓展)
理解图形有助于正确判断问题方向(左尾、右尾或区间)。
🔹Knowledge Point 57: Right-tail Probability(右尾概率)
Explanation(解释)
P(Z ≥ z) = 1 − P(Z ≤ z)。
Example(例子)
若 P(Z ≤ 1.96) = 0.975,
则 P(Z ≥ 1.96) = 1 − 0.975 = 0.025。
Extension(拓展)
右尾概率常见于检验“极端高值”的问题,如风险超出、罕见事件检测。
🔹Knowledge Point 58: Excel Verification(Excel函数验证)
Explanation(解释)
可使用 Excel 验证标准正态概率:
=NORM.S.DIST(z, TRUE) → P(Z ≤ z)。
Example(例子)
=NORM.S.DIST(1, TRUE)→ 0.8413=NORM.S.DIST(1.96, TRUE)→ 0.9750
Extension(拓展)
与Z表结果一致,Excel更适合进行大规模或动态概率计算。
Slide 12 — Finding x Values Given Probabilities(根据概率求x值)
🧭 Knowledge Points
- Converting Probability to Value(概率反推数值)
- Using NORM.INV Function(使用NORM.INV函数)
- Visual Probability Representation(概率图形表达)
- Application in Business Scenarios(商业情境应用)
🔹Knowledge Point 59: Converting Probability to Value(概率反推数值)
Explanation(解释)
若 X ~ N(μ, σ²),并给出 P(X ≤ x)=p:
- 查表或计算 z 对应概率;
- 计算 x = μ + zσ。
Example(例子)
X ~ N(60, 25),P(X ≤ x)=0.9972。
查表得 P(Z ≤ 2.75)=0.997 → z≈2.75。
x = 60 + 2.75×5 = 73.75。
Extension(拓展)
此方法在工程中用于确定上下限、公差值或安全裕度。
🔹Knowledge Point 60: Using NORM.INV Function(使用NORM.INV函数)
Explanation(解释)
Excel函数:
=NORM.INV(probability, mean, standard_dev)
返回对应分布的x值。
Example(例子)
| probability | x | mean | stdev |
|---|---|---|---|
| 0.9972 | 129.26 | 60 | 25 |
| 0.3000 | 4.77 | 5 | 0.44 |
| 0.0614 | 144.45 | 200 | 36 |
| 0.7685 | 2.94 | 0 | 4 |
Extension(拓展)
可直接反求分位点、质量阈值、绩效等级等,非常适合商业分析。
🔹Knowledge Point 61: Visual Probability Representation(概率图形表达)
Explanation(解释)
图形中阴影面积 = 给定的累计概率,
x即为该面积边界处的数值。
Example(例子)
若阴影为0.30(左侧面积),
则对应的 x 在均值左侧。
Extension(拓展)
通过图形识别概率方向(左侧或右侧)有助于减少公式错误。
🔹Knowledge Point 62: Business Applications(商业应用)
Explanation(解释)
该方法在商业统计中常见于:
- 绩效评估分位点;
- 投资回报分位数;
- 产品质量限值;
- 信用评分等级划分。
Example(例子)
客户响应率 ~ N(5%, 2²),
要求前10%客户响应临界值:
P(X ≥ x)=0.10 → P(X ≤ x)=0.90 → z=1.28 → x=5+1.28×2=7.56%。
Extension(拓展)
“反向求值”使管理者可通过设定概率目标确定量化阈值,是决策支持的关键。
Slide 13 — Computing Probability Using NORM.DIST(使用NORM.DIST计算概率)
🧭 Knowledge Points
- Definition of NORM.DIST Function(NORM.DIST函数定义)
- Input Parameters(输入参数说明)
- Comparison under Different σ(不同标准差的对比)
- Interpretation of Probability Outputs(概率结果解释)
🔹Knowledge Point 63: Definition of NORM.DIST(函数定义)
Explanation(解释)
Excel函数:
=NORM.DIST(x, mean, standard_dev, TRUE)
→ 返回累积概率 P(X ≤ x)。
Example(例子)
若 X ~ N(−1, 1),x=2.42,
则 =NORM.DIST(2.42, −1, 1, TRUE) → 0.9997。
Extension(拓展)
若需右尾概率:
P(X ≥ x)=1−NORM.DIST(x, mean, sd, TRUE)。
🔹Knowledge Point 64: Input Parameters(输入参数)
Explanation(解释)
参数顺序:
- x:目标值;
- mean:均值 μ;
- standard_dev:标准差 σ;
- TRUE:累积概率。
Example(例子)
| Probability | x | mean | stdev |
|---|---|---|---|
| 0.9997 | 2.42 | −1 | 1 |
| 0.6844 | 1.24 | 1 | 0.50 |
| 0.8352 | 1.89 | 1.5 | 0.4 |
| 0.5327 | 0.82 | 0 | 10 |
Extension(拓展)
TRUE 返回累积概率,FALSE 返回 PDF 高度。
在统计学应用中几乎总使用 TRUE。
🔹Knowledge Point 65: Comparison under Different σ(不同标准差的比较)
Explanation(解释)
σ 影响分布宽度与概率集中度:
- σ 小 → 曲线陡峭,概率集中;
- σ 大 → 曲线平缓,概率分散。
Example(例子)
同样的 (x−μ),当 σ=0.4 时概率更极端;
当 σ=10 时,曲线较宽,概率变化缓慢。
Extension(拓展)
在生产管理中 σ 代表“波动性”;
在金融中 σ 表示“风险水平”。
🔹Knowledge Point 66: Interpretation of Results(概率结果解释)
Explanation(解释)
Excel返回的值代表左尾面积:
P(X ≤ x) = 该值;
若结果接近 0.5 → x≈μ。
Example(例子)
X ~ N(0, 10),x=0.82:
=NORM.DIST(0.82, 0, 10, TRUE) → 0.5327。
Extension(拓展)
理解输出概率有助于解释“某事件发生的可能性”或“某值所处的分布位置”。