Q1 — Categorical Frequency Table (分类数据的频数表)
Question (EN): A café surveyed customers’ ratings (Excellent, Good, Average, Below Average, Poor). Build the frequency, relative frequency, and percent frequency table.
Data: Excellent, Good, Good, Average, Good, Average, Below Average, Average, Good, Poor, Excellent, Good, Good, Average, Below Average, Poor, Good, Average, Excellent, Good.
📖 点击查看翻译
题目(中文):某咖啡馆对 位顾客的总体体验进行评价(优秀、良好、一般、较差、差)。请完成频数、相对频数、百分比频数表。
📖 点击查看答案
等级 频数 相对频数 百分比 Excellent Good Average Below Average Poor 合计
📝 点击查看解析
定义: 步骤: 计数各等级 ,计算 与百分比。 结论: Good 占比 ,为众数类别。
Q2 — Quantitative Grouping (定量数据分组频数)
Question (EN): For tire-replacement costs (USD), use classes (width ) and report cumulative .
Data: .
📖 点击查看翻译
题目(中文):对 个轮胎更换费用(美元)按 组、组距约 分组,给出分组频数表与累计百分比。
📖 点击查看答案
组距 ($) 频数 相对频数 累计百分比 – – – – – 合计
📝 点击查看解析
设定: , , ,取等宽 。 计算关系: 相对频数 ;累计百分比为逐组累加。
Q3 — Union & Independence (并事件与独立性)
Question (EN): Two projects () have the joint probabilities shown below. Find (a) (b) (c) (d) Are and independent?
| B Success | B Fail | Total | |
|---|---|---|---|
| A Success | |||
| A Fail | |||
| Total |
📖 点击查看翻译
题目(中文):如上联合概率表。求:(a) (b) (c) (d) 是否独立?
📖 点击查看答案
, ,
📝 点击查看解析
加法公式: 。 独立性判定: 若 则独立;此处 ,不独立。
Q4 — Conditional Probability (条件概率)
Question (EN): Given the joint table below, find (a) (b) (c) Independence?
| Total | |||
|---|---|---|---|
| Total |
📖 点击查看翻译
题目(中文):给定上表,求:(a) (b) (c) 是否独立?
📖 点击查看答案
, ,
📝 点击查看解析
定义: , 。 判定: 若 ,则独立;此题不满足。
Q5 — Joint / Marginal / Conditionals (联合 / 边际 / 条件概率)
Question (EN): Defect data:
| Type | Defect | Non-defect | Total |
|---|---|---|---|
| A | |||
| B | |||
| Total |
Find (a) (b) (c) .
📖 点击查看翻译
题目(中文):如上联合表,求:(a) (b) (c) 。
📖 点击查看答案
, , .
📝 点击查看解析
关系式: , 。 含义: 次品中约 来自 。
Q6 — Bayes’ Theorem(贝叶斯定理)
Question (EN): Prior , sensitivity , false positive . Compute .
📖 点击查看翻译
题目(中文):已知 ,,。求 。
📖 点击查看答案
📝 点击查看解析
由于先验 较小且存在非零 ,后验 仅为约 ,体现“基准率”影响。
Q7 — Data Types & Scales(数据类型与测量尺度)
Question (EN): Classify variables by type and scale: Gender, Department, Monthly Sales ($) , Performance Rating.
📖 点击查看翻译
题目(中文):判定变量的类型与尺度:性别、部门、销售额($) 、绩效等级。
📖 点击查看答案
变量 类型 尺度 Gender Categorical Nominal Department Categorical Nominal Monthly Sales Quantitative Ratio Performance Rating Categorical Ordinal
📝 点击查看解析
名义(Nominal):无序标签;序数(Ordinal):有序等级;区间(Interval):等距无真零;比率(Ratio):等距且有真零(可比较倍数)。销售额属比率尺度。
Q8 — Population vs. Sample(总体与样本)
Question (EN): GPA of randomly chosen business students is used to study all business students. Identify population & sample; descriptive or inferential?
📖 点击查看翻译
题目(中文):用随机抽取的 位商科学生 GPA 研究所有商科学生。识别总体与样本,并判断统计类型。
📖 点击查看答案
Population:全部商科学生;Sample:这 位学生;类型:推断统计(Inferential)。
📝 点击查看解析
从样本推出总体属于推断统计;若只汇总样本本身为描述统计。
Q10 — Cross-sectional vs. Time-series(横截面与时间序列)
Question (EN): Revenues of stores across China in Jan . One Shanghai store’s annual revenue from –. Classify and explain.
📖 点击查看翻译
题目(中文): 年 月全国 家门店当月收入; 上海某门店 – 年年度收入。分类并解释。
📖 点击查看答案
Crosssectional(横截面); Timeseries(时间序列)。
📝 点击查看解析
横截面:同一时点、多个对象的对比;时间序列:单一对象随时间变化(趋势/季节/周期)分析。
Q11 — Data Sources & Study Types(数据来源与研究方式)
Question (EN): For analyzing purchases, classify each as internal/external & observational/experimental: (a) Downloading company transaction data. (b) Purchasing a market research dataset. (c) Running an in-store survey.
📖 点击查看翻译
题目(中文):判定以下方案的内部/外部来源与观察/实验: (a) 下载公司内部交易数据;(b) 购买第三方调研数据;(c) 门店问卷。
📖 点击查看答案
(a) 内部 / 观察;(b) 外部 / 观察;(c) 内部 / 依设计可为实验或观察。
📝 点击查看解析
是否操纵自变量 实验或观察; 数据来源于组织内外 内部或外部。 门店问卷若包含干预设计(如促销试验)可视为实验,否则为观察。
Q12 — Data Errors & Consistency(数据错误与一致性检查)
Question (EN): Employee data (Age, Monthly Salary $, Years of Experience):
| Employee ID | Age | Salary($) | Experience |
|---|---|---|---|
Identify potential error(s) and suggest detection/correction.
📖 点击查看翻译
题目(中文):如上员工信息。识别可能的数据错误并给出检测/修正方法。
📖 点击查看答案
异常:员工 的薪资为 3\sigma$ 检验。 修正:回查原始记录,校正或剔除并保留数据修改痕迹。
📝 点击查看解析
可利用逻辑校验(如“工龄小薪资高”矛盾)与统计检测(箱线图、标准差法)识别离群。 修正应遵循“验证 → 修正 → 记录”流程以确保可追溯性。
Q13 — Categorical Frequencies & Percentages(分类频数与百分比)
Question (EN): For hotel-stay ratings (same composition as Q1, any order), build the frequency & percent table; identify the most common rating.
📖 点击查看翻译
题目(中文):对 份住店评价(与 Q1 相同分布),构建频数/百分比表,并指出最常见等级。
📖 点击查看答案
与 Q1 相同:Good () 为最常见等级;完整频数表见 Q1。
📝 点击查看解析
可使用数据透视表快速得到频数与百分比; 众数类别可指示顾客总体满意度与改进优先方向。
Q14 — Outlier & Choice of Center(极端值与集中趋势选择)
Question (EN): Apartment rents ((450,460,470,480,490,500,510,520,530,900)$. Compute mean/median/mode; decide which best represents “typical” rent.
📖 点击查看翻译
题目(中文):房租数据如上。计算均值/中位数/众数,并判断“典型房租”应采用哪个指标。
📖 点击查看答案
, , . 典型值: 选 中位数(Median)。
📝 点击查看解析
数据右偏,极端高值 拉高均值 ; 中位数受极端值影响小,更能反映“典型”水平。
Q15 — Range, Variance, Standard Deviation(极差、方差、标准差)
Question (EN): Bonuses ((100,120,130,150,200)$. Compute range, sample variance, sample standard deviation; interpret variability.
📖 点击查看翻译
题目(中文):奖金数据如上。计算极差、样本方差、样本标准差并解释离散程度。
📖 点击查看答案
, , , , . 解释: 平均离差约 $38,波动中等。
📝 点击查看解析
公式: ,。 含义: 极差给出总体跨度,标准差反映平均离散程度,可用于不同数据集波动性的比较。