Monday, October 28, 2024

用户体验:如何确定问卷调查的样本大小

如何确定问卷调查的样本大小

想知道如何确定适合的样本大小吗?让我们一起深入探讨这个话题,弄清楚它。

在进行用户体验管理中的调查时,确定适当的样本大小常常让我们感到困惑。

虽然有在线计算器可以帮助,但如果你不了解背后的关键变量,即使有了计算出的样本大小,也不太有帮助,因为在被质疑时,你无法为你的选择提供合理解释

不过别担心——这并不是火箭科学!让我用简单的术语来解释。

让我们开始吧!

什么是研究中的样本大小?

🤔 假设你想知道,早餐吃燕麦片的长跑运动员和不吃燕麦片的运动员在表现上是否存在差异?

为了弄清楚这一点,理论上我们需要调查全国所有的竞技跑者,但显然这既不实际也不可行。

这就是为什么确定适当样本大小如此重要的原因。

样本大小就是你在研究中所包含的总人数或项目数量——无论是调查、研究还是实验。可以把它看作是你的研究“人数”。

当进行大规模人群调查时,选择合适的样本大小至关重要,因为从每个人那里收集数据是不现实的。相反,你可以从总人群中选择一个有代表性的随机样本,以得出有意义的结论

让我们用一个实际例子来说明:假设你拥有一家连锁咖啡店☕️,想要评估顾客对你们新推出的榛子拿铁☕️的满意度。全国有超过500个门店,服务着数百万顾客,调查所有人是不可能的。

这时,抽样就派上用场了——你需要调查你总顾客群中的一小部分人。

例如,你可能决定选择1000名顾客作为样本。

为了确保这个样本能准确代表你所有的顾客,这1000名参与者必须是随机选出的。这样的随机选择有助于捕捉到既有忠实常客,也有首次光顾的顾客的反馈。

这些1000名顾客的反馈将为你提供关于榛子拿铁☕️的整体顾客偏好的宝贵见解。

例如,如果750名受访顾客对新饮品表示满意,那么你可以得出结论,在特定的置信度和区间下,榛子拿铁☕️受到了高度的好评

这些见解使得关于是否继续推广榛子拿铁☕️或调整配方的决策可以基于数据做出。

这个例子展示了选择合适的样本大小对于收集可靠数据至关重要,这些数据能为战略商业决策提供信息。

计算样本大小需要了解什么?

在研究大规模人群时,通常不可能调查每一个人——这时抽样方法就起作用了。

但我们如何确保我们的样本真正代表整个群体呢?我们需要理解四个关键统计概念:置信区间、置信水平、人口大小和标准差。

1. 置信区间

可以把置信区间看作是你的误差范围——你愿意接受的结果波动范围。

假设你调查了人们母亲节礼物的购买计划,发现有65%的人打算购买礼物,并且置信区间为±2.75%。

这意味着你有信心(但不是100%确定)真实的百分比在62.25%和67.75%之间。

这就像是用一个略显模糊的尺子测量东西——你可能会说它在9到11厘米之间,而不是给出一个精确的数字。

2. 置信水平

置信水平告诉你你有多大把握相信你的结果。

有95%的置信水平就像是说,如果你做同样的调查20次,其中19次的结果会落在你的置信区间内。

想象一下你用尺子量东西20次——其中19次的读数都会在9到11厘米之间。

3. 人口大小 🌍

这只是你的目标群体中总人数。

例如,如果你在研究纽约市的居民,那么你的人口大小就是那里的总人口数。

4. 标准差 📊

标准差衡量数据的分散程度。

如果每个人的答案都很相似,那么标准差就小;如果答案差异很大,标准差就大。标准差越小,表示你可以使用较小的样本大小,而如果回答差异较大,则需要较大的样本才能得到准确的结果。

当你结合所有这些因素时,就可以计算出理想的样本大小,从而使你的调查既准确又可靠。

想减少误差吗?你需要更多的样本。如果你能容忍更多的误差,那么你可以使用更小的样本大小。

当然,对于那些会影响重大决策的关键研究,你会希望尽量减少误差——这意味着使用更大的样本大小以确保可靠的结果。

如何计算样本大小?

了解Z分数和样本大小公式对于确定理想样本大小至关重要。即使你不知道总人口大小,你仍然可以计算出你需要多少反馈才能获得可靠的结果。

1. 理解Z分数

将Z分数看作是一个衡量标准——它告诉你数据点与平均值相差多少个标准差。在规划样本大小时,Z分数反映了你期望的置信水平。

你将使用的最常见置信水平是90%、95%和99%,它们对应的Z分数分别是1.645、1.96和2.576。

为了找到正确的Z分数,我们将使用所谓的“标准正态分布Z值表”。我已将完整表格附在下面供您参考。

标准正态分布Z值表,显示不同Z分数的累计概率。该表格的左列为Z分数,顶部为小数值,各Z分数与其对应的概率交叉处为概率值。

2. 如何读取标准正态分布Z值表?

让我们通过一个例子来说明:找到90%置信水平的Z分数。(注意:我们只知道我们希望有90%的置信度,但需要找到实际的Z分数1.645

2.1. 理解置信水平和Z分数

把90%置信水平想象成这样:它意味着我们希望得到数据的中间90%,剩下的5%分布在两端(因为100% - 90% = 10%,平均分配给两端,每端为5%)。

标准正态分布Z值表,显示不同Z分数的累计概率。该表格的左列为Z分数,顶部为小数值,各Z分数与其对应的概率交叉处为概率值。

对于标准正态分布,你需要找到一个具有95%累计概率的Z分数(50% + 45%)。这是为什么:50%表示从最左端到中间的区域,45%表示从中间到Z分数点的区域。

对于不同的置信水平,以下是如何找到正确数字的方法:

  • 对于95%置信度 → 5%/2 = 2.5% → 查找97.5%

  • 对于99%置信度 → 1%/2 = 0.5% → 查找99.5%

2.2. 读取Z分数表

Z分数表通过两种方式显示累计概率——从分布的最左端开始,或者从中间(均值)到任意Z点。使用该表时,你需要找到累计概率大约为95%的Z分数。

2.3. 找到正确的概率

查看Z分数表,寻找最接近95%的值。大多数表格显示的是从最左端(负无穷大)到每个Z值的累计概率。对于这些表格,你需要找到0.9500。

有些表格则显示从均值(Z=0)到每个Z点的概率。对于这些表格,请查找约45%(0.4500)的位置。

在我们这里的例子中,我们使用的是第一种类型的表格——所以我们只需要找到最接近0.9500的值。

标准正态分布Z值表,显示不同Z分数的累计概率。该表格的左列为Z分数,顶部为小数值,各Z分数与其对应的概率交叉处为概率值。

2.4. 找到你的Z分数

查看Z分数表中的行和列交叉处。找到最接近0.9500的值(表示从左尾部开始的95%累计概率)。

通过查看我们的表格,我们可以看到95%落在Z分数1.64和1.65之间。取中点即为Z分数1.645。

这意味着,对于90%的置信水平,我们使用Z分数1.645。

你可以使用相同的方法找到其他置信水平(如95%和99%)的Z分数,方法是查找表中对应的值。

3. 计算样本大小

要确定样本大小,你需要三个关键信息:

3.1 置信水平(Z分数): 你对结果的置信度要求是多少?这将决定使用哪个Z分数。

3.2 预期效应大小(P): 你希望检测到的最小差异是多少?如果不确定,使用P = 0.5,因为它给出了最大的(最保守的)样本大小。

3.3 误差范围(e): 你可以接受的结果变动范围是多少?如果不确定,使用0.05(5%)作为标准误差范围。

有了这三个数字,你可以将它们代入样本大小公式,计算出所需的反馈数量。这将确保你的调查结果既具有统计学意义,又能真正代表你的总体。

以下是你可以用来估算样本大小的简单公式:

当你不知道总人口大小时,这个公式非常适用于估算样本大小。它对于大规模人群尤其有用,因为在人群非常庞大的情况下,总人口大小对所需样本大小的影响并不大。

让我们通过一个例子计算这些参数:

  • 置信水平:95%(Z = 1.96)

  • 效应大小(比例):P = 0.5

  • 误差范围:e = 0.05(5%)

将这些数字代入我们的公式:

N = (1.96² × 0.5 × (1 – 0.5)) / 0.05² = 384.16

根据此计算,使用95%的置信水平、0.5的效应大小和5%的误差范围,我们需要的样本大小约为384.16。

由于我们不能调查一个分数的参与者,我们四舍五入到385个样本。这意味着你的调查或实验需要至少385名参与者,以便获得你可以信任的统计学上有意义的结果。

Related articles

MaxDiff vs Conjoint 分析
MaxDiff vs Conjoint 分析:何时选择适合的方法
了解MaxDiff与联合分析(Conjoint Analysis)之间的关键差异,发现哪种市场研究方法最符合您的特定需求。比较这两种技术的优势、应用场景和实际应用。
Read now
主图描述
与您的新测试受众见面:合成用户
了解合成用户如何革新产品测试和市场研究。学习关于由AI驱动的测试受众的知识,包括它们的优势、应用领域,以及它们如何提升您的研究效率。
Read now
每位用户研究员必知的2025年实地访谈技巧
2025年每位用户研究员必知的实地访谈技巧
掌握实地访谈的艺术,通过我们全面的2024年指南。学习经过验证的技术、最佳实践和专家建议,以在真实环境中进行有效的用户研究访谈。
Read now
7项深入研究公司的技能
7项深入研究公司的技能:来自北京大学的见解
学习进行彻底公司研究的专业技术。专家关于数据收集、分析和评估方法的提示,以获得更佳的商业洞察。
Read now