Lecture 13 — Continuous Probability Distribution(连续概率分布)


1. Overview of Lecture 13(第13讲概览)

Lecture 13 introduces continuous probability distributions and their business applications.
第13讲介绍连续型概率分布及其在商业与经济决策中的应用。

  • Random variable(随机变量)
  • Continuous probability distribution(连续概率分布)
  • Expected value and variance(期望与方差)
  • Uniform distribution(均匀分布)
  • Normal distribution & z-score(正态分布与 z 分数)
  • Excel functions for probability(概率计算的 Excel 函数)

2. Random Variables & Continuous Distributions(随机变量与连续分布)

Random variables describe outcomes numerically; continuous distributions describe probabilities over intervals.
随机变量用数值描述结果;连续分布描述区间上的概率。

  • Types: discrete vs continuous(离散 vs 连续)
  • PDF area = 1(密度曲线下总面积为 1)

3. Expected Value & Uniform Distribution(期望与均匀分布)

期望值反映长期平均;方差反映离散度与风险。

E(X) = int x * f(x) dx (期望)

用于描述平均收益/中心趋势。

Var(X) = int (x - mu)^2 * f(x) dx (方差)

用于度量波动/风险。

f(x) = 1 / (b - a), a x b (均匀分布 PDF)

区间内等可能。

E(X) = (a + b) / 2 (均匀分布期望)

区间中点。

Var(X) = (b - a)^2 / 12 (均匀分布方差)

区间长度决定离散度。


4. Normal Distribution(正态分布)

对称钟形,由 mu 与 sigma 决定;68–95–99.7 经验法则适用。

f(x) = 1/(sigmasqrt(2pi)) * exp( - (x - mu)^2 / (2*sigma^2) ) (正态 PDF)

mu 控制中心,sigma 控制分散。


5. Standard Normal Distribution(标准正态分布)

将任意正态变量标准化以便比较与查表,Z ~ N(0,1)。

z = (x - mu) / sigma (标准化公式)

标准化使不同单位/量纲可比较。


6. Probability Calculations(概率计算)

概率对应正态曲线下的面积,常见三类:左尾、右尾、区间。

P(X x) = P(Z z) (左尾累计)

左侧面积。

P(X >= x) = 1 - P(Z z) (右尾概率)

右侧面积。

P(a X b) = P(Z z_b) - P(Z z_a) (区间概率)

两端累计之差。


7. Finding z from Probability(根据概率求 z)

根据累计概率反查 z(查表或 Excel)。常见:90%→±1.645,95%→±1.96,99%→±2.576。

NORM.S.INV(p_left) = z (已知左尾概率求 z)

=NORM.S.INV(p_left)

NORM.S.INV(1 - p_upper) = z (已知右尾概率求 z)

=NORM.S.INV(1 - p_upper)

NORM.S.INV(1 - alpha/2) = z(alpha/2) (双尾临界值)

=NORM.S.INV(1 - alpha/2)


8. Standard Normal Probabilities(标准正态概率)

使用标准正态分布计算左尾与右尾概率,区间由差值得到。

NORM.S.DIST(z, TRUE) = P(Z z) (左尾概率)

=NORM.S.DIST(z, TRUE)

1 - NORM.S.DIST(z, TRUE) = P(Z >= z) (右尾概率)

=1 - NORM.S.DIST(z, TRUE)

P(a Z b) = NORM.S.DIST(b, TRUE) - NORM.S.DIST(a, TRUE) (区间概率)

=NORM.S.DIST(b, TRUE) - NORM.S.DIST(a, TRUE)


9. Finding x from Probability(根据概率求 x)

先由概率反查 z,再由 z 反求 x。业务:分位点、质量阈值、绩效门槛。

x = mu + z * sigma (反推原始值)

=NORM.INV(p, mean, stdev) 与上式等价(给定 p)。


10. General Normal with Excel(一般正态的 Excel 计算)

用 NORM.DIST 计算概率,用 NORM.INV 反查数值。

NORM.DIST(x, mean, stdev, TRUE) = P(X x) (左尾)

=NORM.DIST(x, mean, stdev, TRUE)

1 - NORM.DIST(x, mean, stdev, TRUE) = P(X >= x) (右尾)

=1 - NORM.DIST(x, mean, stdev, TRUE)

NORM.INV(p, mean, stdev) = x_p (分位数)

=NORM.INV(p, mean, stdev)


11. Finding z values — Given probabilities(补充:已知概率求 z 的步骤)

面试/考试常问“给概率求 z”。通用步骤:

  1. 判断是左尾、右尾还是双尾区间;
  2. 统一成左尾概率:右尾用 1 - p_upper,双尾用 1 - alpha/2
  3. NORM.S.INV 求 z(区间/双尾分别求上下界)。

P(Z z) = p_left z = NORM.S.INV(p_left) (左尾给定)

P(Z >= z) = p_upper z = NORM.S.INV(1 - p_upper) (右尾给定)

CI: two-tailed 1 - alpha z = NORM.S.INV(1 - alpha/2) (双尾置信界)


12. Probabilities: Standard Normal Distribution — Excel Methods(补充:标准正态概率的 Excel 处理)

给定 z,如何快速得到概率(左尾/右尾/区间)?

Left-tail: P(Z z) = NORM.S.DIST(z, TRUE) (左尾)

Right-tail: P(Z >= z) = 1 - NORM.S.DIST(z, TRUE) (右尾)

Between: P(a Z b) = NORM.S.DIST(b, TRUE) - NORM.S.DIST(a, TRUE) (区间)


13. Empirical Rule(经验法则)

经验规则用于快速估计区间概率。

approx 68% in mu ± 1*sigma (一倍标准差)

approx 95% in mu ± 2*sigma (两倍标准差)

approx 99.7% in mu ± 3*sigma (三倍标准差)


14. Business Applications(商业应用)

  • 质量控制:按 σ 设定合格区间与报废规则
  • 财务预测:超过目标收益的概率
  • 绩效评估:Top x% 的奖励门槛

15. Core Insights(核心理解)

  • 连续分布描述区间概率,不是单点概率;
  • 正态分布把数据—z 分数—概率连接起来;
  • Excel 四函数(S.DIST / S.INV / DIST / INV)覆盖概率与阈值双向计算,便于自动化分析。