Slide 1 — Continuous Probability Distribution Overview

第1页——连续概率分布概述

Knowledge Points

  • Random Variable(随机变量)
  • Continuous Probability Distribution(连续概率分布)
  • Expected Value and Variance(期望与方差)
  • Uniform Probability Distribution(均匀分布)
  • Normal Probability Distribution(正态分布)

🔹 Knowledge Point 1 — Random Variable(随机变量)

Explanation(解释)
A random variable is a numerical outcome of a random experiment, which can be either discrete or continuous.
随机变量是随机实验结果的数值化表达,可以是离散型或连续型。

Example(例子)

  • Discrete: Number of defective items in a batch.
  • Continuous: Time to complete a project.
    离散例:一批货物中的次品数;连续例:完成项目所需时间。

Extension(拓展)
Random variables serve as the foundation for statistical models, allowing uncertainty to be quantified and analyzed.
随机变量是统计模型的基础,用于量化与分析不确定性。

Summary(总结)
本页介绍随机变量的定义及分类,是理解连续型分布的前提。


🔹 Knowledge Point 2 — Continuous Probability Distribution(连续概率分布)

Explanation(解释)
A continuous probability distribution describes variables that can take any real value within a range.
连续概率分布描述变量可在某一区间内取任意实数值。

Example(例子)
The daily temperature or a person’s height are examples of continuous random variables.
每日温度或个人身高属于连续型随机变量。

Extension(拓展)
Continuous distributions are represented using a probability density function (pdf), whose total area equals 1.
连续分布通过“概率密度函数”表达,其曲线下总面积等于 1。

Summary(总结)
本节强调连续分布的定义与密度函数的基本性质。


Slide 2 — Continuous Random Variable

第2页——连续型随机变量

Knowledge Points

  • Interval-based Probability(基于区间的概率)
  • Probability of a Point = 0(单点概率为零)

🔹 Knowledge Point 1 — Interval-based Probability(区间概率)

Explanation(解释)
A continuous random variable can assume infinitely many values within an interval. Probability is defined for intervals, not for single points.
连续型随机变量可在区间内取无限多值,概率定义在区间上而非单点上。

Example(例子)
The probability that a student’s GPA is exactly 3.50 is 0, but the probability that it lies between 3.50 and 3.60 is positive.
学生的 GPA 恰好为 3.50 的概率为 0,而介于 3.50–3.60 之间的概率为正。

Extension(拓展)
For continuous variables:
P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b).
端点是否包含不会影响结果。

Summary(总结)
本页说明连续变量概率的区间性质与单点概率为零的特征。


Slide 3 — Continuous Probability Distribution

第3页——连续概率分布

Knowledge Points

  • Probability Density Function (pdf)(概率密度函数)
  • Area Interpretation(面积法则)

🔹 Knowledge Point 1 — Probability Density Function(概率密度函数)

Explanation(解释)
The pdf f(x) describes how probabilities are distributed over all possible values of a continuous variable.
概率密度函数 f(x) 描述了连续随机变量各取值的概率分布。

Example(例子)
For X uniformly distributed on [0,1],
f(x) = 1, and P(0 ≤ X ≤ 0.5) = 0.5.
若 X ~ U(0,1),则在 0–0.5 区间的概率为 0.5。

Extension(拓展)
A valid pdf satisfies two properties:

  1. f(x) ≥ 0 for all x;
  2. ∫₋∞⁺∞ f(x) dx = 1.
    合法的概率密度函数必须非负且积分为 1。

Summary(总结)
本页通过函数定义说明连续分布的概率计算基础:概率 = 曲线下的面积。


🔹 Knowledge Point 2 — Area Interpretation(面积表示法)

Explanation(解释)
The probability that X falls between x₁ and x₂ equals the area under f(x) between those points.
连续变量在 x₁ 与 x₂ 之间取值的概率等于 f(x) 曲线下的面积。

Example(例子)
P(0 ≤ X ≤ 0.4) = ∫₀⁰·⁴ f(x) dx.
区间面积代表相应概率。

Extension(拓展)
Area-based interpretation is fundamental to visualizing continuous probabilities and understanding cumulative distribution functions (CDF).
面积法则是理解累积分布函数与概率计算可视化的核心。

Image/Data Analysis(图像分析)
图中蓝色曲线表示 pdf f(x),黄色区域为区间 [x₁, x₂] 的概率面积。
面积越大,事件发生的可能性越高。

Summary(总结)
本页利用曲线面积解释连续概率的几何意义。


Slide 4 — Examples of Continuous Distributions

第4页——连续分布的典型类型

Knowledge Points

  • Uniform Distribution(均匀分布)
  • Normal Distribution(正态分布)
  • Exponential Distribution(指数分布)

🔹 Knowledge Point 1 — Uniform Distribution(均匀分布)

Explanation(解释)
A uniform distribution assigns equal probability to all values within a given interval [a, b].
均匀分布表示在区间 [a, b] 内每个数值出现的概率相等。

Example(例子)
If X ~ U(0,10), then f(x) = 1/10, and
P(2 ≤ X ≤ 5) = (5 − 2) / 10 = 0.3.
若 X ~ U(0,10),则在 2–5 之间的概率为 0.3。

Extension(拓展)
Uniform distributions are used in random number generation and simulation experiments.
均匀分布常用于随机数生成与模拟实验。

Summary(总结)
均匀分布体现“机会均等”的概念,是随机实验建模的基础。


🔹 Knowledge Point 2 — Normal Distribution(正态分布)

Explanation(解释)
A normal distribution is symmetric around the mean μ and characterized by its standard deviation σ.
正态分布以均值 μ 为中心,对称分布,标准差 σ 控制其扩散程度。

Example(例子)
Human height and IQ scores usually follow a normal distribution.
人类身高和智商常服从正态分布。

Extension(拓展)
It is the foundation of inferential statistics, underlying z-scores, confidence intervals, and regression models.
正态分布是推断统计学的基础,广泛用于 Z 分数、置信区间和回归分析。

Summary(总结)
正态分布是自然与社会现象中最常见的分布形式。


🔹 Knowledge Point 3 — Exponential Distribution(指数分布)

Explanation(解释)
The exponential distribution models the waiting time between random events in a Poisson process.
指数分布用于描述泊松过程中事件间隔的时间。

Example(例子)
If λ = 0.25, then mean waiting time = 1/λ = 4 units.
若 λ=0.25,则平均等待时间为 4 个单位。

Extension(拓展)
It is widely used in reliability engineering and queueing theory to model lifetimes and service times.
指数分布常用于可靠性工程和排队论中,描述寿命与服务时间。

Image/Data Analysis(图像分析)
图中三种分布展示概率形态差异:

  • Uniform:平坦矩形,等概率。
  • Normal:钟形曲线,中部集中。
  • Exponential:递减曲线,表示事件发生概率随时间衰减。

Summary(总结)
本页总结三种典型连续分布的形态与应用,直观体现连续分布的多样性。


Slide 5 — Uniform Probability Distribution

第5页——均匀概率分布

Knowledge Point — Definition and Formula(定义与公式)

Explanation(解释)
A random variable is uniformly distributed if every value within a given interval [a, b] has an equal chance of occurring.
当随机变量在区间 [a, b] 内的所有取值具有相同概率时,称其服从均匀分布

Example(例子)
The probability density function (pdf) of a uniform distribution is defined as:
f(x) = 1 / (b − a), for a ≤ x ≤ b
= 0, elsewhere
This means the probability is evenly spread across the interval.
概率密度函数在区间内为常数,表示概率均匀分布。

Extension(拓展)
For a uniform distribution, the expected value and variance are:
E(X) = (a + b) / 2  Var(X) = (b − a)² / 12
These equations show that the mean lies at the center of the interval and the variance depends on its width.
期望值位于区间中点,方差取决于区间宽度。

Image/Data Analysis(图像分析)
图片中展示了均匀分布的密度函数曲线:

  • 蓝色区域表示区间 [a, b] 内概率密度恒定。
  • f(x) 在区间外为 0。
    图中公式 E(x) = (a + b)/2 与 Var(x) = (b − a)²/12 总结了均匀分布的数学特征。

Summary(总结)
均匀分布的特点是区间内概率均等,期望为区间中点,方差反映区间宽度。


Slide 6 — Uniform Distribution Example

第6页——均匀分布实例

Knowledge Point — Application of Uniform Distribution(均匀分布的应用)

Explanation(解释)
Slater’s salad bar charges customers based on the amount of salad taken, which follows a uniform distribution between 5 and 15 ounces.
Slater 沙拉自助餐厅根据顾客取用的沙拉重量收费,假设沙拉重量服从 5 至 15 盎司间的均匀分布。

Example(例子)
f(x) = 1 / (15 − 5) = 1/10 for 5 ≤ x ≤ 15
E(X) = (5 + 15) / 2 = 10
Var(X) = (15 − 5)² / 12 = 8.33
顾客平均取 10 盎司沙拉,方差为 8.33,表示取用量在区间内分布较均匀。

Extension(拓展)
This example shows how uniform distribution applies to inventory control, resource allocation, and demand estimation where outcomes are equally likely.
此案例展示了均匀分布在库存控制、资源分配与需求预测中的应用。

Image/Data Analysis(图像分析)
图片中蓝色框代表概率密度函数 f(x) = 1/10;
E(x)=10 为区间中点,Var(x)=8.33 表示变异程度较低。
图像清晰地表达了概率在整个区间内均匀分布的特征。

Summary(总结)
此例说明均匀分布可用于描述“每个结果等可能”的情形,如顾客消费量、时间区间或产出波动。


Slide 7 — Probability under Uniform Distribution

第7页——均匀分布下的区间概率

Knowledge Point — Interval Probability Calculation(区间概率计算)

Explanation(解释)
To find the probability that a random variable X lies between two values within [a, b], compute the area of the rectangle under f(x).
对于均匀分布,求 X 位于某区间的概率等于该区间矩形面积。

Example(例子)
Given f(x) = 1/10 for 5 ≤ x ≤ 15, find P(12 ≤ X ≤ 15):
P(12 ≤ X ≤ 15) = (15 − 12) × 1/10 = 0.3
顾客取 12 至 15 盎司沙拉的概率为 0.3。

Extension(拓展)
This principle is crucial for modeling service time intervals, uniform error ranges, or equal-likelihood simulations.
此方法常用于服务时间、误差区间或等概率模拟中。

Image/Data Analysis(图像分析)
图片显示:

  • f(x) = 1/10 为高度;
  • 区间 [12,15] 的底长为 3;
  • 黄色区域代表概率 0.3。
    面积法直观体现了区间概率计算。

Summary(总结)
均匀分布的概率等于区间面积,计算简单、适用于等概率问题。


Slide 8 — Normal Probability Distribution

第8页——正态概率分布

Knowledge Point — Definition and Applications(定义与应用)

Explanation(解释)
The normal distribution is the most commonly used continuous probability distribution, describing variables that cluster around a mean value.
正态分布是最常用的连续概率分布,描述变量在平均值附近集中分布的规律。

Example(例子)
Examples include demographics (height, weight), test scores, and weather forecasts.
例:人口身高体重、考试成绩、天气预测等。

Extension(拓展)
The normal distribution underlies statistical inference, including confidence intervals, z-scores, and sampling estimation.
正态分布是统计推断的核心,用于置信区间、Z分数与抽样估计。

Image/Data Analysis(图像分析)
图片未展示,但正态曲线通常呈钟形:

  • 中心 μ 为平均值;
  • 分布关于 μ 对称;
  • 68% 数据落在 μ ± 1σ 内,95% 在 μ ± 2σ 内。

Summary(总结)
正态分布是连续型变量分析的核心模型,在统计推断、社会科学与自然科学中应用最广泛。


Slide 9 — Normal Probability Distribution: Formula

第9页——正态分布的公式

Knowledge Point — Probability Density Function(概率密度函数)

Explanation(解释)
The normal probability distribution is a continuous distribution characterized by its bell-shaped curve.
Its probability density function (pdf) is:
f(x) = 1 / (σ√2π) · e^[-(x − μ)² / (2σ²)]
where μ = mean, σ = standard deviation, π ≈ 3.14159, e ≈ 2.71828.
正态分布的概率密度函数呈钟形,由平均值 μ 与标准差 σ 决定。

Example(例子)
For μ = 100, σ = 10, the function determines the likelihood that X lies near 100, with most probabilities concentrated around μ.
若 μ=100,σ=10,则大部分观测值集中在平均值附近。

Extension(拓展)
This pdf ensures that total area under the curve equals 1, meaning:
P(−∞ < X < ∞) = 1.
曲线下的总面积等于 1,表示总概率为 1。

Image/Data Analysis(图像分析)
图中公式区块展示了正态分布密度函数:

  • 分母 σ√2π 控制高度和宽度;
  • 指数项 e^(−(x−μ)²/2σ²) 决定对称形态;
  • μ 调整中心位置,σ 控制曲线“胖瘦”。

Summary(总结)
正态分布的概率密度函数由均值与标准差决定,其曲线平滑对称,是连续概率分析的核心。


Slide 10 — Symmetry and Parameters of Normal Distribution

第10页——正态分布的对称性与参数

Knowledge Point — Symmetry and Parameters(对称性与参数定义)

Explanation(解释)
A normal distribution is symmetric about its mean μ, with a skewness of 0.
It is fully defined by two parameters:

  • Mean (μ): determines the center location.
  • Standard Deviation (σ): determines spread or dispersion.
    正态分布关于平均值 μ 对称,偏度为 0;其形态由 μ 与 σ 完全决定。

Example(例子)
X ~ N(μ, σ): for example, X ~ N(100, 10) means mean = 100, standard deviation = 10.
如 X ~ N(100, 10) 表示均值为 100,标准差为 10。

Extension(拓展)
The notation helps describe different populations with distinct central tendencies and variability.
正态分布的参数化形式用于描述不同总体的中心趋势与离散程度。

Image/Data Analysis(图像分析)
图中展示正态曲线:

  • 中心 μ 表示平均值位置;
  • 曲线宽度由 σ 决定;
  • 对称性表明左半部分与右半部分概率相等。

Summary(总结)
正态分布由 μ 与 σ 唯一确定,具有完全对称性,是统计建模与估计的基础。


Slide 11 — Shifts in the Mean (μ)

第11页——均值变化对分布的影响

Knowledge Point — Mean Shift Effect(均值变化的影响)

Explanation(解释)
Changing μ shifts the normal curve horizontally along the x-axis but does not affect its shape.
改变 μ 只会使曲线水平移动,不改变其形态。

Example(例子)
If μ increases from 0 to 25, the entire bell curve shifts rightward.
若 μ 从 0 变为 25,曲线整体右移。

Extension(拓展)
This property allows modeling different populations with similar variability but distinct averages, such as income levels across regions.
该特性用于比较均值不同但波动相似的群体,如地区收入差异。

Image/Data Analysis(图像分析)
图中三条正态曲线(红、蓝、黄)展示 μ 不同导致的水平平移:

  • 红色峰值在 −10;
  • 蓝色峰值在 0;
  • 黄色峰值在 25。
    曲线宽度相同,表明 σ 未变。

Summary(总结)
改变均值 μ 会平移分布中心,但不会影响曲线形状或方差。


Slide 12 — Changes in Standard Deviation (σ)

第12页——标准差变化对分布的影响

Knowledge Point — Standard Deviation Effect(标准差变化的影响)

Explanation(解释)
The standard deviation σ controls the spread of the normal distribution.
Larger σ → flatter, wider curve; smaller σ → taller, narrower curve.
标准差 σ 控制分布的宽度:σ 越大,曲线越扁平;σ 越小,曲线越陡峭。

Example(例子)
For μ = 0:

  • σ = 15 → narrow, high peak (red curve)
  • σ = 25 → wide, low peak (blue curve)
    例:σ=15 曲线更高更窄,σ=25 曲线更低更宽。

Extension(拓展)
Understanding σ’s effect helps in quality control and risk assessment, where high σ means greater variability.
了解 σ 的影响有助于进行质量控制与风险评估,高 σ 表示变异性更大。

Image/Data Analysis(图像分析)
图中两条曲线:

  • 红线(σ=15)陡峭集中;
  • 蓝线(σ=25)宽广分散。
    说明 σ 控制离散程度,但 μ 固定时对称性不变。

Summary(总结)
标准差影响曲线的宽度与峰值高度,是衡量总体波动性的核心参数。


Slide 13 — The Empirical Rule (68–95–99.7 Rule)

第13页——经验法则(68–95–99.7法则)

Knowledge Point — Coverage of Standard Deviations(标准差覆盖范围)

Explanation(解释)
The Empirical Rule states that for a normal distribution:

  • About 68% of data fall within μ ± 1σ
  • About 95% within μ ± 2σ
  • About 99.7% within μ ± 3σ
    经验法则指出:
    约68% 数据位于平均值±1个标准差内,
    约95% 位于±2个标准差内,
    约99.7% 位于±3个标准差内。

Example(例子)
If μ = 100, σ = 10:

  • 68% of observations are between 90 and 110
  • 95% between 80 and 120
  • 99.7% between 70 and 130
    例:若 μ=100,σ=10,则约95%数据在80至120之间。

Extension(拓展)
This rule provides a quick estimation of data dispersion without complex calculations and is used in process control and reliability testing.
该法则可快速估计数据分布范围,常用于过程控制与可靠性检测。

Image/Data Analysis(图像分析)
图中红色正态曲线标出三个区间:

  • 绿色区域 (68.26%):μ ± 1σ
  • 棕色区域 (95.44%):μ ± 2σ
  • 蓝色区域 (99.72%):μ ± 3σ
    随范围扩大,覆盖的概率逐渐增加。

Summary(总结)
经验法则揭示了正态分布下标准差与概率的关系,为估算总体分布与异常值检测提供依据。