Slide 1 — MGS 2150 Business Statistics

第1页——MGS 2150 商业统计学

Knowledge Points (知识点)

Business Statistics (商业统计学)：在商业和经济中应用统计学方法。
Purpose (目的)：帮助收集、分析、展示和解释数据。

Business Statistics (商业统计学)

Explanation (解释):
Business statistics is the application of statistical tools in business and economics.
商业统计学是在商业与经济中应用统计工具的一门学科。
Example (例子):
A company uses statistics to analyze sales trends and forecast demand.
一家公司利用统计方法分析销售趋势并预测需求。
Extension (拓展):
Business statistics supports decision-making, risk management, and strategy formulation.
商业统计学帮助企业做决策、管理风险和制定战略。

Summary (总结)

本页主要介绍课程名称和背景，强调统计学在商业和经济中的应用价值。

Slide 2 — Lecture 3 Overview

第2页——第3讲概览

Knowledge Points (知识点)

Chapter 1 (第1章)：商业与经济中的应用。
Key Topics (关键主题)：数据与数据源、描述统计、推断统计、Excel 应用。

Overview (概览)

Explanation (解释):
The lecture covers both descriptive and inferential statistics, and practical Excel skills.
本讲既涵盖描述统计与推断统计，也涉及 Excel 的实用技能。
Example (例子):
Using Excel to calculate averages or test hypotheses in business cases.
使用 Excel 计算均值或在商业案例中进行假设检验。
Extension (拓展):
Provides a foundation for analyzing real-world business data effectively.
为高效分析真实商业数据奠定基础。

Summary (总结)

本页是目录，指出本讲将围绕数据、统计类型和 Excel 工具展开。

Slide 3 — Definition of Statistics

第3页——统计学的定义

Knowledge Points (知识点)

Statistics (统计学)：收集、分析、展示和解释数据的艺术与科学。
Process (过程)：创建数据集、编辑公式与函数、收集与展示结果。

Statistics (统计学)

Explanation (解释):
Statistics is both an art and science of handling data.
统计学既是一门科学，也是一种关于数据处理的艺术。
Example (例子):
A researcher collects survey responses, uses formulas to analyze them, and presents charts.
研究人员收集问卷结果，用公式分析，并展示成图表。
Extension (拓展):
The statistical process is iterative and applies across sciences, business, and policy.
统计过程是循环迭代的，广泛应用于科学、商业和政策。

Summary (总结)

本页定义统计学，并说明其操作流程：数据集创建、公式处理和结果展示。

Slide 4 — Descriptive Statistics

第4页——描述统计

Knowledge Points (知识点)

Descriptive Statistics (描述统计)：用表格、图形或数值形式总结数据。
Data Example (数据示例)：关于睡眠、GPA、性别与午睡的调查表。
Visualization (可视化)：柱状图、饼图、均值对比。

Descriptive Statistics (描述统计)

Explanation (解释):
Descriptive statistics summarize data sets into understandable formats.
描述统计通过表格、图形或数值把数据总结为易懂的形式。
Example (例子):
GPA differences shown between male and female students.
男生和女生 GPA 的差异通过图表展示。
Extension (拓展):
Descriptive statistics help identify patterns, but do not test hypotheses.
描述统计有助于发现规律，但不能用于假设检验。

Summary (总结)

本页通过 GPA 与性别的案例展示了描述统计的应用。

Slide 5 — Inferential Statistics

第5页——推断统计

Knowledge Points (知识点)

Inferential Statistics (推断统计)：利用样本数据推测总体。
Population (总体)：研究对象的全体。
Sample (样本)：总体的一个子集。

Inferential Statistics (推断统计)

Explanation (解释):
Inferential statistics allow generalizations from a sample to a population.
推断统计通过样本对总体进行推测。
Example (例子):
Using a student sample to estimate average GPA of the entire university.
用学生样本估计整个大学的平均 GPA。
Extension (拓展):
Inferential methods include hypothesis testing, confidence intervals, and regression.
推断方法包括假设检验、置信区间和回归分析。

Summary (总结)

本页强调了推断统计的核心思想：由样本推测总体。

Slide 6 — Excel for Data Analysis

第6页——Excel 数据分析

Knowledge Points (知识点)

Excel Functions (Excel 函数)：平均数、众数、中位数、极差等。
Data Processing (数据处理)：创建数据集、编辑公式与函数、得到结果。

Excel for Statistics (Excel 统计应用)

Explanation (解释):
Excel provides built-in functions for basic statistical analysis.
Excel 内置函数可进行基础统计分析。
Example (例子):
=AVERAGE(A2:A71) calculates the mean of values in a dataset.
=AVERAGE(A2:A71) 计算数据集的平均值。
Extension (拓展):
Excel also supports advanced tools like regression, correlation, and distributions.
Excel 还支持高级工具，如回归、相关性和分布分析。

Summary (总结)

本页展示了如何用 Excel 进行基础数据分析。

Slide 7 — Statistical Functions in Excel

第7页——Excel 中的统计函数

Knowledge Points (知识点)

Correlation and Covariance (相关与协方差)。
Regression Functions (回归函数)。
Distribution Functions (分布函数)。

Statistical Functions (统计函数)

Explanation (解释):
Excel provides functions for correlation, regression, and probability distributions.
Excel 提供相关、回归和概率分布的函数。
Example (例子):
Correlation functions measure how two variables move together.
相关函数衡量两个变量如何同时变化。
Extension (拓展):
These tools are essential for advanced business analytics and predictive modeling.
这些工具是高级商业分析和预测建模的重要基础。

Summary (总结)

本页强调 Excel 在统计分析中的进阶功能：相关、回归和分布。

Slide 8 — Elements, Variables, and Observations

第8页——元素、变量与观测值

Knowledge Points (知识点)

Elements (元素)：收集数据的对象。
Variables (变量)：元素的某种特征。
Observations (观测值)：针对某个元素的一组测量结果。
Data Set (数据集)：n 个元素对应 n 个观测值，总数据量 = 元素数 × 变量数。

Elements, Variables, and Observations (元素、变量与观测值)

Explanation (解释):
Elements are entities studied; variables describe characteristics; observations are collected measurements.
元素是被研究的对象，变量是元素的特征，观测值是为每个元素收集到的测量结果。
Example (例子):
Students are elements; GPA and gender are variables; each student’s record is an observation.
学生是元素，GPA 和性别是变量，每个学生的记录就是一个观测值。
Extension (拓展):
Large datasets (big data) may contain millions of elements and variables, requiring advanced software.
大型数据集（大数据）可能包含上百万个元素和变量，需要高级软件处理。

Summary (总结)

本页强调了统计学的三个基本构件：元素、变量和观测值。

Slide 9 — Scales of Measurement

第9页——测量尺度

Knowledge Points (知识点)

Nominal Scale (名义尺度)：仅作分类或标签。
Ordinal Scale (顺序尺度)：具有排序意义。
Interval Scale (区间尺度)：有固定间距，但无绝对零点。
Ratio Scale (比率尺度)：有绝对零点，能进行比率比较。

Nominal (名义尺度)

Explanation (解释):
Nominal data are labels or names to classify elements.
名义数据是用于分类的标签或名称。
Example (例子):
WTO status: “member” vs. “observer”, or coded as 1 and 2.
WTO 身份：“成员” vs. “观察员”，也可以用 1 和 2 编码。
Extension (拓展):
Nominal data are common in surveys (e.g., gender, nationality).
名义数据常见于调查（如性别、国籍）。

Ordinal (顺序尺度)

Explanation (解释):
Ordinal data can be ranked, though differences between ranks may not be equal.
顺序数据可以排序，但等级间差距未必相等。
Example (例子):
Credit ratings (AAA to F) or student class rank.
信用评级（AAA 到 F）或学生年级排名。
Extension (拓展):
Useful in satisfaction surveys (e.g., very satisfied → dissatisfied).
常见于满意度调查（如“非常满意”到“不满意”）。

Interval (区间尺度)

Explanation (解释):
Interval data have equal units of measurement, but no true zero.
区间数据有固定间隔，但没有绝对零点。
Example (例子):
SAT scores (e.g., 1985 vs. 1880 → difference = 105).
SAT 分数（如 1985 vs. 1880 → 差值 = 105）。
Extension (拓展):
Temperature in Celsius is interval (0℃ ≠ no temperature).
摄氏温度是区间尺度（0℃ 并非“没有温度”）。

Ratio (比率尺度)

Explanation (解释):
Ratio data have equal units and an absolute zero, allowing ratio comparisons.
比率数据有固定间隔和绝对零点，可做比率比较。
Example (例子):
Kevin has 72 credits, Melissa has 36 credits → Kevin has twice as many.
Kevin 有 72 学分，Melissa 有 36 学分 → Kevin 的学分是 Melissa 的两倍。
Extension (拓展):
Common in finance (e.g., income, assets, production output).
在金融中常见（如收入、资产、产量）。

Summary (总结)

本页介绍了四种测量尺度：名义、顺序、区间、比率。

Slide 10 — Categorical vs. Quantitative Data

第10页——类别数据与数量数据

Knowledge Points (知识点)

Categorical Data (类别数据)：用标签或名称表示，通常为定性数据。
Quantitative Data (数量数据)：表示“多少”或“多大”，可以是离散或连续。
统计分析方法的选择取决于数据类型。

Categorical Data (类别数据)

Explanation (解释):
Categorical data identify attributes and often use nominal or ordinal scales.
类别数据表示属性，常用名义或顺序尺度。
Example (例子):
Gender (male/female), product type (A/B/C).
性别（男/女）、产品类别（A/B/C）。
Extension (拓展):
Statistical analysis is limited; mainly uses frequency tables or charts.
统计分析有限，主要依赖频数表或图形。

Quantitative Data (数量数据)

Explanation (解释):
Quantitative data measure “how many” (discrete) or “how much” (continuous).
数量数据衡量“多少”（离散）或“多大”（连续）。
Example (例子):
Number of students (discrete); weight of students (continuous).
学生人数（离散型）；学生体重（连续型）。
Extension (拓展):
Quantitative data allow arithmetic operations and advanced analysis.
数量数据可用于算术运算和更复杂的分析。

Summary (总结)

本页区分了类别数据和数量数据，指出分析方法不同。

Slide 11 — Cross-Sectional vs. Time Series Data

第11页——横截面数据与时间序列数据

Knowledge Points (知识点)

Cross-sectional Data (横截面数据)：同一时间点收集。
Time Series Data (时间序列数据)：在多个时间点收集。
时间序列分析用于趋势判断与预测。

Cross-sectional Data (横截面数据)

Explanation (解释):
Data collected at the same point in time across multiple subjects.
在同一时间点对多个对象收集的数据。
Example (例子):
GDP, status, and credit rating of 60 WTO nations in one year.
60 个 WTO 国家某一年的人均 GDP、身份和信用评级。
Extension (拓展):
Useful for comparing differences across entities.
有助于比较不同实体间的差异。

Time Series Data (时间序列数据)

Explanation (解释):
Data collected over time to study changes and trends.
在多个时间段收集的数据，用于研究变化与趋势。
Example (例子):
U.S. gasoline price from 2012 to 2018.
美国 2012–2018 年汽油价格。
Extension (拓展):
Graphs of time series help analyze past, identify trends, and forecast future values.
时间序列图表有助于分析过去、识别趋势和预测未来。

Summary (总结)

本页介绍了横截面数据与时间序列数据的区别及用途。

Slide 12 — Data Sources: Observational vs. Experimental

第12页——数据来源：观察性研究与实验性研究

Knowledge Points (知识点)

Observational Study (观察性研究)：不干预，只收集数据。
Experimental Study (实验性研究)：控制变量，研究其对结果的影响。

Observational Study (观察性研究)

Explanation (解释):
Observational studies collect data without manipulating variables.
观察性研究在不操纵变量的情况下收集数据。
Example (例子):
Researchers record Walmart customers’ shopping time, gender, and spending.
研究人员记录沃尔玛顾客的购物时间、性别和消费金额。
Extension (拓展):
Observational studies are common in surveys and market research.
观察性研究常见于调查与市场研究。

Experimental Study (实验性研究)

Explanation (解释):
Experimental studies control variables to see their effect on outcomes.
实验性研究通过控制变量来观察其对结果的影响。
Example (例子):
1954 Salk polio vaccine trial with nearly 2 million children.
1954 年脊髓灰质炎疫苗实验，涉及近 200 万儿童。
Extension (拓展):
Experimental studies allow causal inference but are costlier.
实验性研究能推断因果关系，但成本较高。

Summary (总结)

本页对比了观察性研究与实验性研究的特点和实例。

Slide 13 — Data Acquisition Considerations

第13页——数据获取的注意事项

Knowledge Points (知识点)

Time Requirement (时间需求)：信息收集可能耗时。
Cost of Acquisition (获取成本)：有时需要支付费用。
Data Errors (数据错误)：不可靠的数据可能误导分析。

Data Acquisition (数据获取)

Explanation (解释):
Collecting data involves trade-offs between time, cost, and accuracy.
数据获取需在时间、成本和准确性之间权衡。
Example (例子):
Outdated data may be useless for current business decisions.
过时数据对当前决策可能毫无价值。
Extension (拓展):
Organizations use technology (e.g., APIs, automated systems) to reduce time and error.
机构常用技术（如 API 和自动化系统）来减少时间与错误。

Summary (总结)

本页强调了获取数据时需要考虑时间、成本和错误风险。

Slide 14 — Descriptive Statistics

第14页——描述统计

Knowledge Points (知识点)

Descriptive Statistics (描述统计)：用表格、图形或数值总结数据。
应用于报纸、杂志、公司报告等。

Descriptive Statistics (描述统计)

Explanation (解释):
Descriptive statistics present data in simple, understandable formats.
描述统计以简洁易懂的形式呈现数据。
Example (例子):
A company report shows annual sales in charts and tables.
公司报告用图表展示年度销售额。
Extension (拓展):
Descriptive statistics help in communication, not in hypothesis testing.
描述统计便于信息沟通，但不用于假设检验。

Summary (总结)

本页说明了描述统计的常见形式和用途。

Slide 15 — Numerical Descriptive Statistics

第15页——数值型描述统计

Knowledge Points (知识点)

Mean (均值)：集中趋势的指标。
常用指标：均值、中位数、众数。

Numerical Descriptive Statistics (数值型描述统计)

Explanation (解释):
The mean summarizes the central location of a dataset.
均值反映数据的集中位置。
Example (例子):
Hudson’s mean cost of parts = $79 (s u m o f 50 t u n e - u p s \div 50) . H u d so n 的零件平均成本 =$ 79（50 次维修费用之和 ÷ 50）。
Extension (拓展):
Numerical measures also include variance, standard deviation, and range.
数值指标还包括方差、标准差和极差。

Summary (总结)

本页展示了数值型描述统计的核心概念：均值。

Slide 16 — Statistical Inference

第16页——统计推断

Knowledge Points (知识点)

Population (总体)：所有研究对象。
Sample (样本)：总体的子集。
Statistical Inference (统计推断)：用样本估计总体。
Census (普查) vs. Sample Survey (抽样调查)。

Statistical Inference (统计推断)

Explanation (解释):
Statistical inference uses sample data to make population-level conclusions.
统计推断用样本数据来推测总体特征。
Example (例子):
A survey of 500 students to estimate GPA distribution of the whole university.
抽样调查 500 名学生来推测全校 GPA 分布。
Extension (拓展):
Common methods include hypothesis testing, confidence intervals, regression.
常见方法有假设检验、置信区间和回归分析。

Summary (总结)

本页强调了统计推断的定义与普查和抽样的区别。

Slide 17 — Analytics

第17页——分析方法

Knowledge Points (知识点)

Descriptive Analysis (描述性分析)：总结过去发生的事情。
Predictive Analysis (预测性分析)：基于模型预测未来。
Prescriptive Analysis (规范性分析)：推荐最佳决策方案。

Analytics (分析)

Explanation (解释):
Analytics transforms data into insights for decision-making.
分析通过数据转化为洞见以支持决策。
Example (例子):
Predictive analysis forecasts customer demand based on past sales.
预测性分析根据过去销售预测未来需求。
Extension (拓展):
Prescriptive analysis is widely used in supply chain optimization.
规范性分析广泛用于供应链优化。

Summary (总结)

本页介绍了三类分析：描述性、预测性和规范性。

Slide 18 — Big Data and Data Warehousing

第18页——大数据与数据仓储

Knowledge Points (知识点)

Big Data (大数据)：规模庞大、复杂的数据集。
Data Warehousing (数据仓储)：数据的存储与维护。

Big Data and Data Warehousing (大数据与数据仓储)

Explanation (解释):
Big data comes from large-scale transactions and interactions; warehousing manages them.
大数据来自大量交易与交互；数据仓储负责管理与维护。
Example (例子):
Walmart: 20–30 million transactions/day; Visa: 6,800 transactions/sec.
沃尔玛：每天 2000–3000 万笔交易；Visa：每秒 6800 笔交易。
Extension (拓展):
Cloud computing enables scalable data warehousing.
云计算使数据仓储具有可扩展性。

Summary (总结)

本页介绍了大数据的来源与数据仓储的重要性。

Slide 19 — Data Mining

第19页——数据挖掘

Knowledge Points (知识点)

Data Mining (数据挖掘)：将数据转化为有用信息。
应用：零售、金融、通信等行业。

Data Mining (数据挖掘)

Explanation (解释):
Data mining extracts hidden patterns using statistics, math, and computer science.
数据挖掘利用统计学、数学和计算机科学的方法发现隐藏模式。
Example (例子):
Identifying customers likely to buy related products or receive discounts.
识别可能购买相关产品或需要优惠的顾客。
Extension (拓展):
Modern data mining often integrates AI and machine learning.
现代数据挖掘常结合人工智能与机器学习。

Summary (总结)

本页强调了数据挖掘的概念与应用。

Slide 20 — Data Mining Requirements & Model Reliability

第20页——数据挖掘的要求与模型可靠性

Knowledge Points (知识点)

Requirements (要求)：多元回归、逻辑回归、相关分析 + AI 技术。
Reliability (可靠性)：避免过拟合，需验证模型。

Data Mining Requirements (数据挖掘要求)

Explanation (解释):
Effective mining requires statistical methods and advanced computing.
有效的数据挖掘需要统计方法与计算技术。
Example (例子):
Logistic regression used in customer churn prediction.
逻辑回归用于预测客户流失。
Extension (拓展):
Requires significant investment in time and resources.
需要大量时间和资源投入。

Model Reliability (模型可靠性)

Explanation (解释):
A model fitting one sample well may fail on another dataset.
在一个样本上表现良好的模型，可能在另一数据集上失效。
Example (例子):
Splitting data into training set (model building) and test set (validation).
将数据分为训练集（建模）和测试集（验证）。
Extension (拓展):
Overfitting leads to misleading conclusions; careful interpretation is required.
过拟合会导致误导性结论，需要谨慎解释与测试。

Summary (总结)

本页指出数据挖掘的技术需求与模型可靠性的挑战。

Quartz 4

Explorer

课堂笔记

Slide 1 — MGS 2150 Business Statistics

第1页——MGS 2150 商业统计学

Knowledge Points (知识点)

Business Statistics (商业统计学)

Summary (总结)

Slide 2 — Lecture 3 Overview

第2页——第3讲概览

Knowledge Points (知识点)

Overview (概览)

Summary (总结)

Slide 3 — Definition of Statistics

第3页——统计学的定义

Knowledge Points (知识点)

Statistics (统计学)

Summary (总结)

Slide 4 — Descriptive Statistics

第4页——描述统计

Knowledge Points (知识点)

Descriptive Statistics (描述统计)

Summary (总结)

Slide 5 — Inferential Statistics

第5页——推断统计

Knowledge Points (知识点)

Inferential Statistics (推断统计)

Summary (总结)

Slide 6 — Excel for Data Analysis

第6页——Excel 数据分析

Knowledge Points (知识点)

Excel for Statistics (Excel 统计应用)

Summary (总结)

Slide 7 — Statistical Functions in Excel

第7页——Excel 中的统计函数

Knowledge Points (知识点)

Statistical Functions (统计函数)

Summary (总结)

Slide 8 — Elements, Variables, and Observations

第8页——元素、变量与观测值

Knowledge Points (知识点)

Elements, Variables, and Observations (元素、变量与观测值)

Summary (总结)

Slide 9 — Scales of Measurement

第9页——测量尺度

Knowledge Points (知识点)

Nominal (名义尺度)

Ordinal (顺序尺度)

Interval (区间尺度)

Ratio (比率尺度)

Summary (总结)

Slide 10 — Categorical vs. Quantitative Data

第10页——类别数据与数量数据

Knowledge Points (知识点)

Categorical Data (类别数据)

Quantitative Data (数量数据)

Summary (总结)

Slide 11 — Cross-Sectional vs. Time Series Data

第11页——横截面数据与时间序列数据

Knowledge Points (知识点)

Cross-sectional Data (横截面数据)

Time Series Data (时间序列数据)

Summary (总结)

Slide 12 — Data Sources: Observational vs. Experimental

第12页——数据来源：观察性研究与实验性研究

Knowledge Points (知识点)

Observational Study (观察性研究)

Experimental Study (实验性研究)

Summary (总结)

Slide 13 — Data Acquisition Considerations

第13页——数据获取的注意事项

Knowledge Points (知识点)

Data Acquisition (数据获取)

Summary (总结)

Slide 14 — Descriptive Statistics

第14页——描述统计

Knowledge Points (知识点)

Descriptive Statistics (描述统计)

Summary (总结)

Slide 15 — Numerical Descriptive Statistics