Q1 — CLT and Probability for Sample Mean(中心极限定理与样本均值概率)
Question (EN): A logistics company records the daily shipping cost per truck. For a very long period, the population mean cost is known to be dollars with population standard deviation dollars. Assume the daily costs are not exactly normal but moderately skewed.
A manager takes a simple random sample of days.
- (a) Find the mean and standard error of the sampling distribution of .
- (b) Use the Central Limit Theorem to approximate .
- (c) Explain, in words, why it is reasonable to use the normal approximation here.
📖 点击查看翻译
题目(中文):
某物流公司长期记录每辆卡车的单日运输成本。已知在很长时间内,总体平均成本为 美元,总体标准差为 美元。假设单日成本分布并非完全正态,而是有适度偏态。
现随机抽取 天的成本数据作为简单随机样本。
- (a) 求样本均值 抽样分布的均值和标准误差。
- (b) 利用中心极限定理近似计算 。
- (c) 用文字解释:为什么在本例中使用正态近似是合理的?
📖 点击查看答案
(a)
抽样分布的均值:标准误差:
(b)
我们要计算:标准化:
由标准正态表:
(c)
虽然单日成本分布略有偏态,但样本量 足够大,根据中心极限定理, 的抽样分布会接近正态,因此可以使用正态近似来计算概率。
Quantity Formula Value 结论: 在样本量较大的情况下,样本均值的抽样分布近似正态,本例中约有 的样本均值会落在 到 之间。
📝 点击查看解析
思路 / 解析:
- 第一步:识别本题考察的是样本均值的抽样分布与中心极限定理(CLT),已知 与 。
- 第二步:根据公式 计算标准误差,用于后续标准化。
- 第三步:将区间端点转换为 值:,再用标准正态分布查表或计算。
- 第四步:从 CLT 角度解释:虽然总体不完全正态,但 较大,故 近似服从正态分布,可以安全使用正态近似。
Q2 — Finite Population Correction in Employee Survey(员工调查中的有限总体修正)
Question (EN): A company has a finite population of employees. The monthly overtime hours (in hours) in this population have a known standard deviation of hours.
A HR analyst selects a simple random sample:
- Case A: employees
- Case B: employees
For each case:
- (a) Compute the standard error of ignoring the finite population correction (FPC).
- (b) Compute the standard error of with the FPC, using
. - (c) Comment on when the FPC is important and when it can be ignored.
📖 点击查看翻译
题目(中文):
某公司共有 名员工(有限总体)。已知该总体中,员工每月加班时数的标准差为 小时。
人力资源部门进行简单随机抽样:
- 情形 A: 名员工;
- 情形 B: 名员工。
对每种情形:- (a) 在**忽略有限总体修正系数(FPC)**的情况下,计算样本均值 的标准误差。
- (b) 在考虑有限总体修正系数的情况下,用
计算样本均值的标准误差。- (c) 说明在什么情况下 FPC 很重要,什么时候可以忽略。
📖 点击查看答案
(a) 忽略 FPC 的标准误差:
通用公式:
情形 A():
情形 B():
(b) 考虑 FPC 的标准误差:
FPC 公式:
情形 A:
情形 B:
Case Ignore FPC With FPC FPC Value A B (c) 结论与评论:
- 情形 A 中,,FPC 略有影响,但不算特别大。
- 情形 B 中,,抽样比例更大,FPC 明显减小了标准误差。
- 一般当 时,FPC 影响很小,可以忽略;当 较大时,应考虑 FPC。
结论: 在有限总体且抽样比例较大时,必须使用 FPC 来获得更准确的标准误差;抽样比例较小时,可以近似视为无限总体而忽略 FPC。
📝 点击查看解析
思路 / 解析:
- 本题考察有限总体修正系数(FPC)的应用以及何时需要修正。
- 第一步:先按无限总体公式 计算基准标准误差。
- 第二步:再用 FPC 公式 对标准误差进行修正,可观察修正前后的差异。
- 第三步:通过比较 的大小来判断 FPC 的重要性:抽样比例越大,FPC 越重要。
- 核心理解:有限总体无放回抽样会降低样本之间的独立性,从而降低变异性,因此标准误差需要乘以 FPC 进行调整。
Q3 — Comparing Precision at Different Sample Sizes(不同样本量下估计精度比较)
Question (EN): The daily sales (in units) for a popular product have population mean and population standard deviation . Assume the population is very large and can be treated as infinite.
Two analysts independently estimate the mean daily sales:
- Analyst A uses a simple random sample of days.
- Analyst B uses a simple random sample of days.
For each analyst:
- (a) Compute the standard error of .
- (b) Approximate using the normal distribution.
- (c) Comment on which estimate is more precise and why.
📖 点击查看翻译
题目(中文):
某热门产品的每日销量(单位:件)总体均值为 ,总体标准差为 。假设总体很大,可视为无限总体。
两位分析师分别估计平均每日销量:
- 分析师 A:使用 天的简单随机样本;
- 分析师 B:使用 天的简单随机样本。
对每位分析师:- (a) 计算样本均值 的标准误差;
- (b) 用正态近似计算 ;
- (c) 比较哪个估计更精确,并说明原因。
📖 点击查看答案
(a) 标准误差:
通用公式(无限总体):
- 分析师 A():
- 分析师 B():
(b) 计算 :
我们要求:
分析师 A:
分析师 B:
| Analyst | | | | |:—:|:—:|:—:|:—:| | A | | | | | B | | | |
(c) 评论:
- 分析师 B 的标准误差更小(),说明其样本均值波动更小。
- 对于 的误差范围,分析师 B 的样本均值更可能落在该区间内( 对比 )。
- 因此,分析师 B 的估计更加精确。
结论: 增大样本量可以显著降低 ,提升样本均值对总体均值的估计精度。
📝 点击查看解析
思路 / 解析:
- 本题核心是比较不同样本量下的标准误差与估计精度,并用概率进行量化。
- 先用 计算两种样本量对应的标准误差,观察大小差异。
- 再将区间 转换为 区间,用标准正态分布求概率。
- 看概率谁更大,就说明哪一个样本均值更有可能接近总体均值。
- 这体现了:样本量越大 → 标准误差越小 → 抽样分布越集中 → 估计越精确。
Q4 — Sampling Distribution of Sample Proportion(样本比例的抽样分布)
Question (EN): In a large online store, the long-run proportion of orders with express shipping is . A data analyst takes a simple random sample of orders.
- (a) Compute the mean and standard error of the sampling distribution of .
- (b) Use the normal approximation to estimate .
- (c) Explain the conditions under which the normal approximation for is valid.
📖 点击查看翻译
题目(中文):
在某大型网店中,长期来看,选择加急配送的订单比例为 。数据分析员随机抽取 笔订单作为简单随机样本。
- (a) 计算样本比例 抽样分布的均值和标准误差;
- (b) 使用正态近似估计 ;
- (c) 说明在什么条件下,对 使用正态近似是合理的。
📖 点击查看答案
(a) 对样本比例 ,抽样分布的性质为:
(b) 计算 :
由标准正态表:
Measure Formula Result (c) 正态近似对样本比例有效的条件通常是:
- 且 。
在本例中:条件明显满足,因此使用正态近似是合理的。
结论: 样本比例的抽样分布近似正态,约有 的样本比例会落在 之间。
📝 点击查看解析
思路 / 解析:
- 本题考察样本比例 的抽样分布与正态近似条件。
- 第一步:用 计算标准误差,并给出 的无偏性结论。
- 第二步:将 区间转换为 区间,通过标准正态分布求概率。
- 第三步:检查 与 是否都大于或等于 10,以判断是否可以使用正态近似。
- 这一题同时体现了无偏估计量()与样本量对近似精度的影响。
Q5 — Designing Sample Size for Target Precision(根据精度目标设计样本量)
Question (EN): A university wants to estimate the mean weekly study time (in hours) of its business students. From past data, the population standard deviation is approximately hours.
The dean wants the sample mean to be within hours of the true mean with confidence, assuming the sampling distribution of is approximately normal.
- (a) Find the minimum required sample size to meet this precision requirement (use ).
- (b) Explain the relationship between sample size, standard error, and confidence interval width.
- (c) Briefly comment on why is an unbiased but not “perfect” estimator of .
📖 点击查看翻译
题目(中文):
某大学希望估计商学院学生每周学习时间(单位:小时)的总体均值。根据历史数据,已知总体标准差约为 小时。
院长希望在 置信水平下,使样本均值 与真实均值 的误差不超过 小时(假设 的抽样分布近似正态)。
- (a) 计算满足上述精度要求所需的最小样本量 (取 );
- (b) 解释样本量、标准误差与置信区间宽度之间的关系;
- (c) 简要说明为什么 虽然是 的无偏估计量,但仍不是“完美”的估计。
📖 点击查看答案
(a) 目标是:
对正态置信区间,有:
其中 ,误差界(半宽度)为:
要求 ,代入 :
因样本量必须为整数且要“向上取整”,
(b) 样本量、标准误差与置信区间宽度的关系:
- 标准误差:,样本量 越大, 越小;
- 置信区间半宽度:,当 减小时,区间变窄;
- 因此,增大 可以减小标准误差,从而缩短置信区间宽度,提高估计精度。
(c) 关于无偏但不“完美”:
- 无偏性:,说明在重复抽样的长期平均中, 不会系统性高估或低估 ;
- 但每一次具体样本仍受随机变异影响,可能偏离 ,且方差 不为零;
- 因此, 是无偏但有变异的估计量,只能在概率意义上“逼近”真实均值。
结论: 至少需要 个样本才能在 置信水平下,把误差控制在 小时以内;增大样本量可以缩小置信区间,但无法消除所有随机误差。
📝 点击查看解析
思路 / 解析:
- 本题综合考察:标准误差、置信区间、样本量设计、无偏估计量。
- 第一步:写出误差界公式 ,将 、、 代入求解 。
- 第二步:通过 解释为什么样本量越大,区间越窄,估计越精确。
- 第三步:讨论无偏性的含义—— 的长期平均等于 ,但单次样本仍会随机偏离,因此需要用标准误差和置信区间来刻画这种不确定性。
- 本题很好地将“点估计 + 抽样分布 + 标准误差 + 置信区间 + 无偏性”综合在一起。