Lecture 12 — Continuous Probability Distributions(第12讲——连续概率分布)


1. Overview (概览)

Topics Covered(主要内容)

  • Random variable(随机变量)
  • Continuous probability distribution(连续概率分布)
  • Expected value and variance(期望与方差)
  • Uniform probability distribution(均匀分布)
  • Normal probability distribution(正态分布)

Key Idea(核心思想)

  • Continuous distributions describe outcomes that can take any real value within an interval.
  • 连续分布用于描述可在某区间内取任意值的随机变量。

2. Continuous Random Variable(连续型随机变量)

Definition(定义)

  • Can assume any value within an interval.
  • 可以在某个区间内取任意值。
  • Probability at a single point = 0; only interval probabilities matter.
  • 单点概率为 0,区间概率才有意义。

Property(性质)

  • P(a ≤ X ≤ b) = P(a < X < b)
  • 端点是否包含不影响结果。

Example(例子)

  • Height, weight, time, temperature.
  • 身高、体重、时间、温度。

3. Continuous Probability Distribution(连续概率分布)

Concept(概念)

  • Probability = area under the pdf curve between x₁ and x₂.
  • 概率等于概率密度函数曲线下的面积。

Probability Density Function (pdf)(概率密度函数)

  • Conditions:
    1. f(x) ≥ 0
    2. ∫₋∞⁺∞ f(x) dx = 1
  • 满足非负性与总概率为1。

Visual Explanation(图像解析)

  • Area under the curve between x₁ and x₂ represents P(x₁ ≤ X ≤ x₂).
  • 曲线下的面积表示变量落在区间内的概率。

4. Uniform Probability Distribution(均匀概率分布)

Definition(定义)

  • Each value within [a, b] is equally likely.
  • 区间 [a, b] 内每个值的发生概率相等。
  • f(x) = 1 / (b − a) for a ≤ x ≤ b, else 0.
  • 密度函数在区间内为常数。

Formulas(公式)

  • E(X) = (a + b) / 2
  • Var(X) = (b − a)² / 12
  • 期望为区间中点,方差取决于区间宽度。

Example — Salad Weight(例子——沙拉重量)

  • X ~ U(5, 15): f(x) = 1/10
  • E(X) = 10, Var(X) = 8.33
  • Probability between 12 and 15 = (15−12)/10 = 0.3
  • 顾客取 12–15 盎司沙拉的概率为 0.3。

Application(应用)

  • Simulation, equal-likelihood modeling, resource allocation.
  • 模拟实验、等概率建模、资源分配。

5. Normal Probability Distribution(正态分布)

Definition(定义)

  • Continuous, symmetric, bell-shaped distribution.
  • 一种连续、对称、钟形的分布。

Formula(公式)

  • f(x) = 1 / (σ√2π) · e^[-(x−μ)² / (2σ²)]
  • 由平均值 μ 与标准差 σ 决定。

Parameters(参数)

  • μ (mean 平均值): center of the curve.
  • σ (standard deviation 标准差): spread or width of the curve.
  • 描述中心与离散程度。

Notation(符号)

  • X ~ N(μ, σ)
  • 读作“X 服从均值为 μ、标准差为 σ 的正态分布”。

6. Characteristics of Normal Distribution(正态分布的特性)

Symmetry(对称性)

  • Symmetric about μ with skewness = 0.
  • 关于 μ 对称,偏度为 0。

Effects of Parameters(参数的影响)

  • Changing μ: moves curve left/right (水平平移)。
  • Changing σ: affects width/height (宽度与高度变化)。
  • σ↑ → 曲线更扁平;σ↓ → 曲线更陡峭。

Visual Examples(图像说明)

  • μ = −10, 0, 25 → curves shift horizontally.
  • σ = 15, 25 → curves become narrow or wide.
  • 图像展示了均值变化导致曲线平移、标准差变化导致形态改变。

7. The Empirical Rule (68–95–99.7 Rule)(经验法则)

Concept(概念)

  • Describes how data are distributed around the mean in a normal distribution.
  • 说明数据在均值附近的分布规律。

Rule(法则)

  • 68% within μ ± 1σ
  • 95% within μ ± 2σ
  • 99.7% within μ ± 3σ

Example(例子)

  • μ = 100, σ = 10 →
    • 68%: 90–110
    • 95%: 80–120
    • 99.7%: 70–130

Applications(应用)

  • Quick data dispersion estimation, process control, reliability testing.
  • 快速估计离散程度,用于过程控制与可靠性分析。

Visual Interpretation(图像解析)

  • Green (68.26%), Brown (95.44%), Blue (99.72%).
  • 三个彩色区间展示不同置信范围的覆盖比例。

8. Summary(总结)

Key Takeaways(核心要点)

  • Continuous distributions describe probabilities using areas under curves.
  • 连续分布通过曲线下的面积表示概率。
  • Uniform distribution: equal likelihood, constant pdf.
  • 均匀分布:区间内等概率。
  • Normal distribution: symmetric, defined by μ and σ.
  • 正态分布:以 μ、σ 为参数,呈钟形对称。
  • Empirical Rule provides intuitive understanding of dispersion.
  • 经验法则帮助快速判断数据分布范围。