内容简介
本书是使用统计学解决用户研究中常见问题的指南。它包含了你每天都要面对的常见问题,例如:当前的产品是否比竞争者的产品更易用?我们能确信70%的用户在第一次尝试时就完成任务吗?用户在网站上购买商品需要花费多长时间?本书详细阐述如何选择统计检验方法,以及在应用这些方法时如何为统计理论和实践提供基础。
本书聚焦于可应用于实际用户研究项目的方法,是作者实际工作经验、调查研究,以及对的统计学、心理学、人因工程学的文献资料研读的结晶。它不只是对传统统计学的复述,而是为当今从业者提供了全新和切题的解读。
为各种项目中可用性测试的统计问题提供操作指南,包括使用六西格玛的项目
向从业者展示选择哪种检验方法,其适用的原因以及应用中的实践,并为分析数据提供易于使用的Excel公式和网页形式的计算器
向从业者使用通俗易懂的语言与相关人员沟通结论的一些方法
目录
译者序
致谢
作者介绍
第1章 导论1 1 1 简介1
1 2 本书的组织结构1
1 3 如何使用本书2
1 3 1 应该使用何种检验2
1 3 2 我需要多大的样本量5
1 3 3 你不必手动计算6
1 4 本章要点7
1 5 本章思考题7
1 6 参考资料8
第2章 量化用户研究9
2 1 什么是用户研究9
2 2 用户研究的数据9
2 3 可用性测试10
2 3 1 样本量10
2 3 2 代表性和随机性10
2 3 3 数据收集12
2 3 4 任务完成率12
2 3 5 可用性问题13
2 3 6 任务时间14
2 3 7 出错数14
2 3 8 满意度评分14
2 3 9 复合分数14
2 4 A/B测试15
2 5 调查数据15
2 5 1 等级量表15
2 5 2 净值16
2 5 3 评论和开放性数据16
2 6 需求收集16
2 7 本章要点17
2 8 参考资料17
第3章 我们的估算到底有多准确19
3 1 简介19
3 1 1 置信区间=误差幅度的两倍19
3 1 2 置信区间提供了度和位置20
3 1 3 置信区间的三个组成部分20
3 2 完成率的置信区间20
3 2 1 置信区间的历史21
3 2 2 Wald区间:对于小样本来说就太不靠谱了21
3 2 3 置信区间22
3 2 4 Wald校正区间:增加两个成功与两个失败22
3 2 5 完成率的点估计24
3 2 6 遭遇可用性问题的置信区间26
3 3 等级量表和其他连续性数据的置信区间26
3 3 1 任务时长数据的置信区间29
3 3 2 任务时长均值还是任务时长中位数30
3 3 3 几何均值30
3 3 4 大样本任务时长的置信区间32
3 3 5 围绕中位数的置信区间33
3 4 本章要点34
3 5 本章思考题35
3 6 参考资料36
第4章 我们达到或超过目标了吗38
4 1 简介38
4 2 单侧检验和双侧检验40
4 3 完成率与基准的比对41
4 3 1 小样本检验42
4 3 2 大样本检验44
4 4 满意度分数与基准的比对46
4 5 任务时间和基准的比对50
4 6 本章要点54
4 7 本章思考题54
4 8 参考资料57
第5章 不同设计之间有统计学差异吗59
5 1 简介59
5 2 比较两个平均值(等级量表和反应时)59
5 2 1 被试内设计比较——配对t检验60
5 2 2 比较任务时长62
5 2 3 组间比较(双样本t检验)64
5 2 4 t检验的假设68
5 3 比较完成率、转换率以及A/B测试69
5 3 1 组间比较69
5 3 2 组内比较78
5 4 本章要点86
5 5 本章思考题88
5 6 参考资料94
第一部分:总结性研究95
第6章 我们需要多大的样本量
6 1 简介95
6 1 1 我们为何要关注95
6 1 2 可用性研究的类型至关重要96
6 1 3 总结性可用性测试样本量预估的基本原则96
6 2 预估数值97
6 3 比较数值104
6 4 如何控制变异性109
6 5 二项置信区间样本量的估计110
6 5 1 大样本的二项样本量估计110
6 5 2 小样本的二项样本量估计112
6 5 3 与基准比例相比较的样本量115
6 6 卡方检验的样本量预估(独立比例)117
6 7 MCNEMAR检验的样本预估(配对比例)120
6 8 本章要点123
6 9 本章思考题124
6 10 参考资料130
第二部分:形成性研究131
第7章 我们需要多大的样本量
7 1 简介131
7 2 使用发现问题的概率模型来估计形成性用户研究的样本量131
7 2 1 方程:P(x≥1)=1-(1-p)n131
7 2 2 从1-(1-p)n中推导出样本量估计方程133
7 2 3 使用表格计划形成性用户研究样本量135
7 3 二项概率
摘要与插图
第1章 导论1.1 简介
统计是很多用户体验行业设计师和研究员愿考虑的事情。实际上,之所以很多从业人员认为这个行业有吸引力,正是因为他们认为可以很大程度避免接触没有人情味的数字。他们认为,如果可用性和设计是定性的活动,就可以安全跳过公式和数字。
虽然设计和一些可用性活动确实是定性的,但是好坏设计的效果可以容易地通过转换量、完成率、完成时间、感知的满意度、值和销售量来量化。越来越多的可用性从业者和用户研究人员期望量化这项工作的收益。如果他们不这么做,其他人将去做——遗憾的是,其他人可能会错误地使用度量标准或方法。
1.2 本书的组织结构
本书为那些测量人与界面交互时的行为与态度的读者设计。本书不涉及可能被发现有部分用处的抽象数学理论。相反,本书关乎用户研究项目实施、分析、汇报时所遇见疑虑和问题的分析。总体上,这些活动分成三个领域:
1)汇总数据及计算误差幅度(第3章)。
2)与基准比较(第4章)或组间比较(第5章)时判定是否存在统计显著的差异。
3)找到适合研究的样本量(第6章和第7章)。
我们还提供:
·综述量化用户研究常用方法的背景章节(第2章)及很多基础统计概念的快速介绍/回顾(附录)。
·对标准化可用性问卷的广泛讨论(第8章)。
·对持久的统计争论的讨论,用户研究者应该了解这些争论并能够为他们的分析进行有力辩护(第9章)。
·更多用户研究相关的统计学信息指引的相关章节(第10章)。
每一章结尾附有该章要点和参考资料。大部分章节还包含一套思考题和答案,以便你检查对内容的理解。