Lecture 13 — Continuous Probability Distribution(连续概率分布)
1. Overview of Lecture 13(第13讲概览)
Lecture 13 introduces continuous probability distributions and their business applications.
第13讲介绍连续型概率分布及其在商业与经济决策中的应用。
- Random variable(随机变量)
- Continuous probability distribution(连续概率分布)
- Expected value and variance(期望与方差)
- Uniform distribution(均匀分布)
- Normal distribution & z-score(正态分布与 z 分数)
- Excel functions for probability(概率计算的 Excel 函数)
2. Random Variables & Continuous Distributions(随机变量与连续分布)
Random variables describe outcomes numerically; continuous distributions describe probabilities over intervals.
随机变量用数值描述结果;连续分布描述区间上的概率。
- Types: discrete vs continuous(离散 vs 连续)
- PDF area = 1(密度曲线下总面积为 1)
3. Expected Value & Uniform Distribution(期望与均匀分布)
期望值反映长期平均;方差反映离散度与风险。
E(X) = int x * f(x) dx (期望)
用于描述平均收益/中心趋势。
Var(X) = int (x - mu)^2 * f(x) dx (方差)
用于度量波动/风险。
f(x) = 1 / (b - a), a ⇐ x ⇐ b (均匀分布 PDF)
区间内等可能。
E(X) = (a + b) / 2 (均匀分布期望)
区间中点。
Var(X) = (b - a)^2 / 12 (均匀分布方差)
区间长度决定离散度。
4. Normal Distribution(正态分布)
对称钟形,由 mu 与 sigma 决定;68–95–99.7 经验法则适用。
f(x) = 1/(sigmasqrt(2pi)) * exp( - (x - mu)^2 / (2*sigma^2) ) (正态 PDF)
mu 控制中心,sigma 控制分散。
5. Standard Normal Distribution(标准正态分布)
将任意正态变量标准化以便比较与查表,Z ~ N(0,1)。
z = (x - mu) / sigma (标准化公式)
标准化使不同单位/量纲可比较。
6. Probability Calculations(概率计算)
概率对应正态曲线下的面积,常见三类:左尾、右尾、区间。
P(X ⇐ x) = P(Z ⇐ z) (左尾累计)
左侧面积。
P(X >= x) = 1 - P(Z ⇐ z) (右尾概率)
右侧面积。
P(a ⇐ X ⇐ b) = P(Z ⇐ z_b) - P(Z ⇐ z_a) (区间概率)
两端累计之差。
7. Finding z from Probability(根据概率求 z)
根据累计概率反查 z(查表或 Excel)。常见:90%→±1.645,95%→±1.96,99%→±2.576。
NORM.S.INV(p_left) = z (已知左尾概率求 z)
=NORM.S.INV(p_left)
NORM.S.INV(1 - p_upper) = z (已知右尾概率求 z)
=NORM.S.INV(1 - p_upper)
NORM.S.INV(1 - alpha/2) = z(alpha/2) (双尾临界值)
=NORM.S.INV(1 - alpha/2)
8. Standard Normal Probabilities(标准正态概率)
使用标准正态分布计算左尾与右尾概率,区间由差值得到。
NORM.S.DIST(z, TRUE) = P(Z ⇐ z) (左尾概率)
=NORM.S.DIST(z, TRUE)
1 - NORM.S.DIST(z, TRUE) = P(Z >= z) (右尾概率)
=1 - NORM.S.DIST(z, TRUE)
P(a ⇐ Z ⇐ b) = NORM.S.DIST(b, TRUE) - NORM.S.DIST(a, TRUE) (区间概率)
=NORM.S.DIST(b, TRUE) - NORM.S.DIST(a, TRUE)
9. Finding x from Probability(根据概率求 x)
先由概率反查 z,再由 z 反求 x。业务:分位点、质量阈值、绩效门槛。
x = mu + z * sigma (反推原始值)
=NORM.INV(p, mean, stdev) 与上式等价(给定 p)。
10. General Normal with Excel(一般正态的 Excel 计算)
用 NORM.DIST 计算概率,用 NORM.INV 反查数值。
NORM.DIST(x, mean, stdev, TRUE) = P(X ⇐ x) (左尾)
=NORM.DIST(x, mean, stdev, TRUE)
1 - NORM.DIST(x, mean, stdev, TRUE) = P(X >= x) (右尾)
=1 - NORM.DIST(x, mean, stdev, TRUE)
NORM.INV(p, mean, stdev) = x_p (分位数)
=NORM.INV(p, mean, stdev)
11. Finding z values — Given probabilities(补充:已知概率求 z 的步骤)
面试/考试常问“给概率求 z”。通用步骤:
- 判断是左尾、右尾还是双尾区间;
- 统一成左尾概率:右尾用
1 - p_upper,双尾用1 - alpha/2; - 用
NORM.S.INV求 z(区间/双尾分别求上下界)。
P(Z ⇐ z) = p_left → z = NORM.S.INV(p_left) (左尾给定)
P(Z >= z) = p_upper → z = NORM.S.INV(1 - p_upper) (右尾给定)
CI: two-tailed 1 - alpha → z = NORM.S.INV(1 - alpha/2) (双尾置信界)
12. Probabilities: Standard Normal Distribution — Excel Methods(补充:标准正态概率的 Excel 处理)
给定 z,如何快速得到概率(左尾/右尾/区间)?
Left-tail: P(Z ⇐ z) = NORM.S.DIST(z, TRUE) (左尾)
Right-tail: P(Z >= z) = 1 - NORM.S.DIST(z, TRUE) (右尾)
Between: P(a ⇐ Z ⇐ b) = NORM.S.DIST(b, TRUE) - NORM.S.DIST(a, TRUE) (区间)
13. Empirical Rule(经验法则)
经验规则用于快速估计区间概率。
approx 68% in mu ± 1*sigma (一倍标准差)
approx 95% in mu ± 2*sigma (两倍标准差)
approx 99.7% in mu ± 3*sigma (三倍标准差)
14. Business Applications(商业应用)
- 质量控制:按 σ 设定合格区间与报废规则
- 财务预测:超过目标收益的概率
- 绩效评估:Top x% 的奖励门槛
15. Core Insights(核心理解)
- 连续分布描述区间概率,不是单点概率;
- 正态分布把数据—z 分数—概率连接起来;
- Excel 四函数(S.DIST / S.INV / DIST / INV)覆盖概率与阈值双向计算,便于自动化分析。