Lecture 10 — Discrete Probability Distributions(第10讲——离散概率分布)


1. Random Variables(随机变量)

Definition(定义)

  • A random variable represents numerical outcomes of a random experiment.
  • 随机变量表示随机实验结果的数值化形式。

Types(类型)

  • Discrete random variable: takes countable values (0,1,2,…).
  • 离散型随机变量:取可数值 (0,1,2,…)。
  • Continuous random variable: takes any value within an interval.
  • 连续型随机变量:取区间内任意值。

Example(例子)

  • Tossing two coins → X = number of heads (0,1,2).
  • 投两次硬币 → X = 出现正面的次数 (0,1,2)。

Application(应用)

  • Random variables connect probability theory with data analysis.
  • 随机变量连接概率理论与数据分析,是概率分布的基础。

2. Discrete Probability Distribution(离散概率分布)

Concept(概念)

  • f(x) assigns a probability to each discrete value of X.
  • f(x) 为随机变量 X 的每个可能取值分配概率。

Conditions(条件)

  • f(x) ≥ 0 for all x.
  • 所有概率非负。
  • Σf(x) = 1 for all possible values of X.
  • 所有概率之和等于1。

Example(例子)

  • Rolling a fair die → each side has probability 1/6.
  • 掷公平骰子 → 每面出现的概率为1/6。

Application(应用)

  • Used to model counts, sales, or number of defective products.
  • 常用于描述销售量、顾客数或产品缺陷数量等离散数据。

3. Example — JSL Appliances(案例:JSL 电器公司)

Description(描述)

  • X = number of TVs sold per day, based on 200 days of data.
  • X = 每天售出的电视数量(基于200天的数据)。

Calculation(计算)

  • Probability for each X: f(x) = frequency ÷ total days.
  • 每个取值的概率:f(x) = 频数 ÷ 总天数。

Validation(验证)

  • All f(x) ≥ 0 and Σf(x) = 1 → valid distribution.
  • 所有 f(x) ≥ 0 且 Σf(x)=1 → 有效的概率分布。

Application(应用)

  • Helps forecast sales patterns and plan inventory.
  • 帮助预测销售模式与规划库存。

4. Visualization of Distribution(分布的图形展示)

Concept(概念)

  • Non-uniform distribution: probabilities differ among outcomes.
  • 非均匀分布:不同结果的概率不相等。

Interpretation(解释)

  • Bar height represents probability f(x).
  • 柱高代表每个取值的概率 f(x)。
  • Highest bar → most frequent outcome.
  • 最高的柱代表最常见的结果。

Application(应用)

  • Visualizes business variability like demand and sales frequency.
  • 用于可视化业务波动,如需求频率或销售分布。

5. Uniform vs. Non-Uniform Distributions(均匀与非均匀分布)

Uniform Distribution(均匀分布)

  • All outcomes are equally likely → f(x) = 1/n.
  • 所有结果出现概率相等 → f(x) = 1/n。
  • Example: rolling a fair die → f(x)=1/6 for each side.
  • 例:掷公平骰子 → 每面概率1/6。

Non-Uniform Distribution(非均匀分布)

  • Outcomes have unequal probabilities.
  • 各结果出现的概率不相等。
  • Example: TV sales distribution where f(0)=0.40, f(3)=0.05.
  • 例:电视销售分布中 f(0)=0.40,f(3)=0.05。

Comparison(比较)

  • Equal bar heights → uniform; varied heights → non-uniform.
  • 柱高相等为均匀分布,柱高不等为非均匀分布。

6. Expected Value(期望值)

Definition(定义)

  • The expected value (mean) represents the long-run average of a random variable.
  • 期望值(均值)表示随机变量的长期平均结果。

Formula(公式)

  • E(X) = Σx·f(x).
  • E(X) = Σx·f(x)。

Example(例子)

  • For JSL, E(X)=1.20 → average daily TV sales = 1.2 units.
  • 对于JSL公司,E(X)=1.20 → 平均每日销售1.2台电视。

Application(应用)

  • Used for demand forecasting and strategic planning.
  • 用于需求预测与战略规划。

7. Variance and Standard Deviation(方差与标准差)

Concept(概念)

  • Variance measures how far data deviate from the mean.
  • 方差衡量数据与均值的偏离程度。
  • Standard deviation σ = √Var(X), in the same unit as X.
  • 标准差 σ = √Var(X),与原单位相同。

Formula(公式)

  • Var(X) = Σ(x−μ)²·f(x).
  • Var(X) = Σ(x−μ)²·f(x)。

Example(例子)

  • For JSL, σ² = 1.66, σ = 1.29 TVs/day.
  • 对于JSL公司,σ² = 1.66,σ = 1.29 台/天。

Interpretation(解释)

  • Indicates moderate variability in daily sales.
  • 表示每日销量存在中等波动。

Application(应用)

  • Measures business risk, investment volatility, and production stability.
  • 衡量商业风险、投资波动与生产稳定性。

8. Key Takeaways(核心总结)

Summary(总结)

  • Random variables link real events to probability models.
  • 随机变量将现实事件与概率模型相联系。
  • Discrete distributions describe countable events with Σf(x)=1.
  • 离散分布描述所有概率之和为1的可数事件。
  • Expected value → measures central tendency.
  • 期望值用于衡量集中趋势。
  • Variance & σ → measure variability or spread.
  • 方差与标准差用于衡量离散程度或波动性。
  • Core tools for forecasting, risk assessment, and decision-making.
  • 是预测、风险评估与决策制定的核心工具。