描述统计:频率分布思维导图


1. Introduction (简介)

Business Statistics (商业统计学)

  • Application of statistics in business and economics.
  • 在商业和经济中应用统计学。

Course Info (课程信息)

  • MGS 2150, Prof. Rongjuan Chen, Spring 2025, Wenzhou-Kean University.
  • 温州肯恩大学 2025春,陈荣娟教授。

2. Descriptive Statistics Overview (描述统计概览)

Definition (定义)

  • Summarize and present data using tables, charts, and text.
  • 用表格、图表和文字总结和呈现数据。

Data Types (数据类型)

  • Categorical data = labels/names. (分类数据:标签或名称)
  • Quantitative data = numerical values. (数量数据:数值)

3. Case Study: Hudson Auto Repair (案例:哈德逊汽车维修)

Purpose (目的)

  • Analyze costs of parts used in engine tune-ups.
  • 分析发动机调校零件的成本。

Sample (样本)

  • 50 invoices collected.
  • 收集50张发票。

4. Summarizing Quantitative Data (总结数量数据)

Steps (步骤)

  • Determine number of classes. (确定组数)
  • Determine class width. (确定组宽)
  • Determine class limits. (确定组限)

5. Number of Classes (组数)

Rules (规则)

  • 5–20 classes depending on dataset size.
  • 根据数据量选5–20组。

Trade-off (权衡)

  • More classes → fewer items per class.
  • 组数多 → 每组观测值少。

6. Class Width & Limits (组宽与组限)

Class Width (组宽)

  • Formula: (largest – smallest) ÷ classes.
  • 公式:(最大值 – 最小值) ÷ 组数。

Class Limits (组限)

  • Lower = smallest in class, Upper = largest in class.
  • 下限=组内最小值,上限=组内最大值。

7. Example: Grouping (案例:分组)

Hudson Auto Data (哈德逊数据)

  • 6 classes, width ≈10.
  • 6组,组宽约10。
  • Example intervals: 50–59, 60–69, …, 100–109.

8. Frequency Table (频率表)

Pivot Table (透视表)

  • Automatically creates class groupings.
  • 自动生成分组。

Frequency Counts (频数)

  • Example: 70–79 = 16, 60–69 = 13.
  • 例如:70–79组有16个,60–69组有13个。

9. Frequency Distribution Graph (频率分布图)

Visualization (可视化)

  • Histogram form.
  • 直方图形式。

Insight (启示)

  • Shows data concentration and distribution shape.
  • 显示数据集中趋势和分布形态。

10. Cumulative Frequency ≤ (累积频率 ≤)

Definition (定义)

  • Number or % of observations below each class limit.
  • 低于某一组限的观测值数量或比例。

Example (例子)

  • <80 = 62%.
  • 小于80的比例为62%。

11. Cumulative Frequency ≥ (累积频率 ≥)

Definition (定义)

  • % of observations greater than a value.
  • 高于某一数值的观测比例。

Example (例子)

  • 70 = 70%.

  • 大于70的比例为70%。

12. Practice 1: Categorical Data (练习1:分类数据)

Example (例子)

  • GPA grouped into Low, Median, High.
  • GPA分为低、中、高。

Frequency (频数)

  • Low=14, Median=10, High=6.
  • 低=14,中=10,高=6。

13. Practice 2: Quantitative Data (练习2:数量数据)

Example (例子)

  • GPA intervals: 3–3.25, 3.25–3.5, 3.5–3.75, 3.75–4.0.
  • GPA分组:3–3.25,3.25–3.5,3.5–3.75,3.75–4.0。

Frequency (频数)

  • 3–3.25=11, 3.25–3.5=8, 3.5–3.75=6, 3.75–4=5.
  • 各区间频数:11,8,6,5。