本文共 5518 字,大约阅读时间需要 18 分钟。
原型概念测试
在本文中,Ciarrai Cunneen和我以早期重新设计GNOME设置应用程序为例,介绍了如何进行基于纸张的可用性测试。 9月13日发布的更新了“设置”功能。
在编写开源软件时,我们经常着迷于使我们的逻辑简洁明了,提出了执行任务和演示想法的巧妙方法。 但是我们有时会忘记一个关键事实:如果软件不易于使用,它就没有用。
为了确保我们的程序可供目标受众使用,我们需要进行可用性测试。 可用性基本上是在问一个问题:“人们可以轻松使用此东西吗?” 或“真实的人可以在合理的时间内使用该软件完成真实的任务吗?” 可用性对于构建任何基于用户的创意过程至关重要。 如果真实的人不能使用我们的软件,那么创建它的所有辛苦工作将毫无意义。
可用性测试使我们能够看到人们在软件方面遇到的困难以及他们发现的容易之处。 通过在整个开发生命周期中重复可用性测试(创建设计,测试,调整设计,然后再次测试),开发人员可以快速迭代到对每个人都适用的设计。
可用性测试不需要花费大量的精力,也不需要任何特殊的专业知识就能产生有用的结果。 正如我的经验所表明的,任何人只要做一点准备就可以进行可用性测试。
您可以通过多种方式测试软件。 可用性测试没有“一种真正的方法”。 例如,如果您已经开发了用户界面(UI),则传统的基于软件的可用性测试可能会最有帮助。 但是,如果您正在寻找一种新设计并希望了解用户的喜欢程度,则可以使用纸质原型进行可用性测试,并要求测试人员浏览界面,就像他们在响应软件中的特定任务一样。
这就是我们想要评估GNOME设置应用程序的拟议重新设计时所做的事情。
您可能熟悉 ,后者是Linux系统上最流行的图形桌面之一。 GNOME项目致力于改善桌面体验,并使新的和有经验的用户可以更容易地访问GNOME。
2016年初,GNOME决定对其“设置”应用程序进行主要的UI更新。 这种视觉刷新从基于图标的菜单转变为下拉列表,并对几个单独的“设置”面板添加了重要的更改。 GNOME设计团队希望测试这些早期设计更改,以了解真实的人如何轻松地浏览新的GNOME设置应用程序。 以前,GNOME依靠传统的可用性测试,用户可以在其中直接浏览软件的UI。 但这是行不通的,因为软件更新尚未完成。
通过2016年夏季的实习,我与GNOME设计团队合作研究了GNOME的可用性。 Outreachy帮助来自代表性不足的人群的人们参与免费和开源软件的开发。 GNOME设计团队的Jim Hall,Allan Day和Jakub Steiner指导我进行测试设计和分析。
我对新的GNOME设置菜单进行了纸质原型测试,共有10位测试参与者,分别代表性别(男性,女性和非二进制)和年龄(20至40岁)。 每个测试人员都声称每天都会使用互联网,而以前只有三个测试人员使用过GNOME。
可用性测试使用了新设计的纸样。 该模型包括建议的新GNOME设置应用程序面板的两个打印图像和WiFi面板的一个打印图像。 测试人员被要求选择代表他们完成任务的第一名的设置。
纸模型代表“设置”应用程序设计更新的外观,包括完整的下拉菜单和“设备和详细信息”子菜单。 我剪掉了子菜单并将其隐藏起来,直到参与者从“设置”菜单中选择“设备”或“详细信息”来完成任务。
对于我的测试,我向每个测试人员展示了23个任务,并要求他们回答他们的第一个菜单选择以完成每个任务。 这些“场景任务”中的每一个都提供了一个简短的上下文,然后要求测试人员做一些特定的事情。 例如,一个场景任务询问测试人员如何将笔记本电脑连接到第二台显示器:
“您在办公室,想用投影仪显示工作演示。首先尝试哪种设置将笔记本电脑连接到投影仪?”
大多数测试人员在不到一分钟的时间内做出了决定,这似乎与大多数用户实际使用软件的方式一致。 大多数真实用户在寻找选项时不会考虑太多。 他们为如何访问功能做出了最佳选择。 如果找不到所需的功能,用户可能会感到恼火,但他们通常会四处单击以查找所需的功能。
热图是总结可用性测试结果的简便方法。 此彩色网格在单独的列中代表每个测试人员,在单独的行中代表每个场景任务。 第一列用几个关键字描述了每个任务。 随后的10列代表每个测试人员的响应,并根据准确度进行颜色编码:绿色代表正确的响应,红色代表错误的响应,橙色代表正确的设备或详细信息选择以及错误的子菜单选择。 右侧列显示对每个任务的正确响应。
查看热图,您可以轻松发现带有许多绿色的“凉爽”行; 这些表明测试人员发现这些任务容易完成。 您还可以看到带有橙色和红色的几行“热”行,这些行是测试人员遇到困难的任务。
热图提供了可用性测试结果的快速概述,并且是发现问题区域的快速方法。 但是,要更深入地解释结果,我们不仅需要深入研究热图。 回顾我在观察测试人员时捕获的笔记,我们可以发现可用性测试期间发生的情况以及测试人员对工作方式做出React的原因。 让我们检查一些工作良好的任务,以及其他比较困难的任务。
我认为必须注意,“简单”任务的数量是“困难”任务的两倍,因此新的“ GNOME设置”菜单效果很好。 测试人员容易完成的一些关键任务:
“ 1.您在笔记本电脑上设置了一个闹钟。现在您要确保它足够响亮,可以听到整个房间的声音。您会在“设置”应用程序中的何处查看以更改闹钟的音量?”
警报音量设置位于“设置”中的“声音”面板中。 对于除了一个参与者之外的所有参与者来说,这都是一件容易的事。 测试人员说,这是一个简单的选择,因为警报器有声音,如果您要调整声音,则“声音”面板是最明显的选择。 错误完成此任务的测试人员认为警报是通知,并假设相关调整将在“通知”面板中。
“ 9.您要出城一周,有一个朋友为您服务。她想在您离开时使用台式计算机,因此很乐意。您朋友的母语是西班牙语,而您的英语是英语“您认为最好为她设置计算机为西班牙语,以便她可以更有效地使用它。您希望在哪里将语言切换为西班牙语?”
所有参与者都知道在“区域和语言”面板中更改桌面语言。 这是提及语言的唯一选择,似乎是每个人的明确选择。
“ 11.预计几分钟后,您将参加一个为时两个小时的讲座。您想在谈话中在笔记本电脑上做笔记。在“设置”中的何处可以查看剩余的电池电量知道在讲座开始之前是否需要开车去买充电器?”
所有测试人员都知道要在“电源”面板下查找有关笔记本电脑电池寿命的信息。 测试人员指出,这似乎与他们在其他操作系统上使用笔记本电脑电源设置的经验相似。
“ 15.您刚刚购买了新打印机。首先选择哪种设置通过WiFi将新打印机连接到计算机?”
每个测试人员都成功地将“设备”标识为要设置打印机时首先单击的位置,然后将“打印机”标识为正确的子菜单选项。 这很有趣,因为测试人员并非总是选择“设备”作为其他硬件问题的最可能设置。 在此问题之前,所有测试人员都至少查看过“设备”面板一次,并记住“打印机”是一个子选项,或者他们很容易将打印机与设备相关联。
总的来说,我认为当新的“设置”菜单反映其他操作系统的组织时,测试人员的表现很好。 电池寿命任务就是一个很好的例子。 大多数(如果不是全部)测试人员都熟悉检查电池剩余电量,因为这对笔记本电脑用户来说是很常见的事情。 测试人员说,他们通常将“电源”与自己系统上的电池电量相关联,因此也许所有人都容易完成这项任务,这并不奇怪。 每个人都在几秒钟内响应了这项任务。
当我们学习新的界面时,很少会在第一次尝试中弄清楚,这解释了一些错误的测试答案。 可用性测试的技巧是将这些预期的错误与指示软件不足之处的模式分开。 这两项任务属于后一类:
“ 6.您正在从事一些设计项目,并且想要调整显示器处理颜色的方式,从而不会丢失任何图像质量。您将尝试哪种设置来更改默认颜色?”
没有一个测试人员知道如何更新GNOME中的颜色配置文件。 我认为这与以下事实有关:没有参与者曾经尝试在任何操作系统上完成类似的任务。 这项任务比较模糊,没有参与者将颜色与“详细信息”菜单选项相关联。
“ 14.您发现,您不希望只有5分钟的空闲时间才可以将屏幕锁定在系统上。首先要在“设置”中的何处将等待时间从5分钟调整为10分钟。”
没有参与者成功地将“隐私”识别为更改锁定屏幕上等待时间的方式。 许多测试人员选择了电源面板,并解释说他们认为锁定屏幕是一种节能机制。 我认为这是因为在其他操作系统上,屏幕调光器在屏幕锁定的同时生效。
以下任务的难度有所降低:
“ 3.您想让您的Thunderbird帐户成为每当要求GNOME打开电子邮件客户端时打开的电子邮件。您尝试将哪种设置使Thunderbird成为您的正式电子邮件?”
一些测试人员认为他们会将电子邮件客户端设置为“在线帐户”。 他们的一般理由是,电子邮件帐户符合在线帐户的条件。 我认为,如果他们在“详细信息”中看到了“默认应用程序”子菜单而不必打开新面板,则某些测试人员会选择它作为正确答案。 不过,我仍然可以理解为什么这些测试人员对于可以在“在线帐户”面板中执行哪种类型的操作感到困惑。 即使方案任务询问的是电子邮件客户端,而不是电子邮件帐户 ,许多用户仍将电子邮件帐户视为重要部分,因此在线帐户似乎是更好的选择。
“ 5.您将要在计算机上观看电影。内部声音太低,因此您无法使用蓝牙扬声器。您将在“设置”应用程序中的哪个位置将扬声器连接到计算机?
许多测试人员并未将蓝牙面板与连接使用蓝牙标准的扬声器的任务相关联。 一些测试人员不知道“蓝牙”是什么意思。 其他人只是没有在菜单中看到它。
“ 16.您在一个比您的时区早6个小时的时区的一个国家中居住了几个月。您将在“设置”中的哪个位置调整时区以反映您的新位置?”
许多测试人员选择了“地区和语言”来更改他们的时区。 那些说过的人将时区与一个地区相关联。 似乎没有其他选项可以解决用户的位置,因此他们选择了Region。
“ 17.您正在计算机上听音乐。与此同时,您正在洪流许多文件。您不希望每次成功下载文件时通知声音都破坏音乐。您将尝试哪种设置?使通知的音量静音?”
没有选择声音作为调整文件下载警报音量的地方的测试人员认为,通知是一个理想的选择,因为他们将通知视为与系统消息相关的任何任务的正确位置。
“ 22.您正在办公室尝试完成工作。今天,WiFi已经掉了三遍,您对等待感到沮丧。您已经插入并设置了以太网电缆;您将首先尝试在哪个面板中进行操作。要从WiFi切换到以太网的网络设置?”
几名测试人员在弄清楚切换到以太网连接的位置时遇到了麻烦。 在那些错了的人中,大多数人认为它会成为WiFi子面板的一部分。 尽管每个人都熟悉以太网连接的概念,但一些测试人员并未处理以太网电缆,也不知道在哪里看。
通常,测试人员在看似陌生的任务上遇到麻烦。 例如,从未将计算机连接到投影仪的测试人员提到,选择设置时,它们只是在黑暗中拍摄。 这是测试过程的不幸部分。 很难预料要涵盖要测试的设置范围的任务,但对于所有测试人员来说似乎都很容易且熟悉。
正如经验所表明的,可用性测试很简单。 任何人都可以做到! 令人惊讶的是,即使他们只是使用纸质原型来响应示例任务,仅通过观察一些测试人员使用您的软件,您就能学到多少东西。
您可以轻松地将可用性测试应用于自己的项目。 首先查看谁使用您的软件,并考虑他们为什么使用它。 从这组假设出发,记下一些示例任务,这些任务代表您的用户在现实情况下如何使用该软件。 这些是用于可用性测试的方案任务。 然后请几个人和您一起坐下来进行可用性测试。 要求每个测试人员一次执行场景任务。 看着他们,并记下他们的所作所为。 在少数志愿者的帮助下,您可以快速查看界面的哪些区域运行良好,以及程序的哪些部分需要更多的工作。
这是我在测试中中学到的一些常规课程,可能会对您的可用性测试有所帮助。
最重要的是,可用性测试的关键是迭代进行。 创建您的设计,对其进行测试,然后根据该反馈更新您的设计,然后再次进行测试。 不断重复,直到达到高原,那里的更多更改似乎无法进一步提高程序的可用性。 在每次迭代中,您的程序都将变得更易于使用,最终您将获得任何人都可以使用的软件。
Ciarrai Cunneen也对本文有所贡献。 Ciarrai参加了2016 实习计划,为GNOME执行可用性测试。 他们对开源开发,数字安全性和未来主义充满热情。
翻译自:
原型概念测试
转载地址:http://agbzd.baihongyu.com/