表55excel50่为确定可出品性的基于度量的检查清单

在产品准备好布以前,程序经理、开员和测试员专职测试代码,

前๩完成。他在完成步骤

都有一个每日记录的最终时限,这样开员每天必须在一个确定的时间之前完成所有对源文件中ณ央主

项目结束后说明文件才付印。另外,程序经理们应该与开员和内部操作组

文件像用户手册一样,是项ำ目的产品之一,而不仅仅是开中的投入。相应

反应。excນel和9ord还能够从大量竞争产品中阅读和转换文件。另外,两ä种

从某些竞争者那里赢回了市场份额。特别是微软已能够克服那ว些通常会导致

这些特性由开员编写代码时使用的应用编程界面构成。

“大约半数的程序经理可以编写像样的visualbຘasic的应用程序技术能ม

如此的硕大无比,以至于几乎ๆ不可能存放在一个服务器中。而“活性臭

他们知道了他们所编写的代码必须是可测试的,并且其测试资源一定是

●在公司结构方面组建职能ม交叉的专家小组

盖茨的故事,微软皇冠上的明珠——公司关键的经营管理理念却仍然是一团

信息的另一来源是微软的产品工具版。产品的这些复制品都有一个独立

文件,可以记录下用户每一次按动鼠标或敲下键盘,以及每个动作所花时间。

这对研究人们实际上如何使用一种产品及他们在要完成特定任务时做出什么เ

选择是极重要的。微软将这些特殊版本交给那些愿意作为试验点的公司,然

后研究收回的数据。自从80่年代末以来,微软对excel和9ord的历次新版

本都做这样的研究,一般在次推出后几个ฐ月内布出去;各组利用这些数

据对产品加以改进或对下一版重新า设计。9ord的工具版对鉴定邮件——合

并特性以及寻找文件格式化的不同捷径起过重要作用。

客户信息反馈的另外渠道是β测试员,他们通过联机pu色rve网络向

微软汇报情况。β测试员主要有关哪些错误要在产品最终布前修改,

还对产品下一版出谋划策。正如第5章所讨论的,被选为β测试员的用户要

签一份私下协议,然后就可得到软件及需填写错误数据的表格,并从电子渠

道交还。

可用性实验室测试我们在第5章描述过微软的可用性实验室如何就新产品

的信息反馈了另一种宝贵渠道。其他的软件制造商,从ibm到intuit,

许多年来都在利用可用性实验室研究用户怎样对潜在的新产品、新特性做出

反应。然而,我们相信微软与众不同,它已到เ了把这种测试形式集成到固定

的软件开过程中的程度。其重要性在于,不像其他的信息反馈渠道如pss

数和β测试报告,产品组能在开过程中——而非之前、之ใ后——就收到

这些关键信息。

建立起固定的可用性实验室测试的主意源于1989๗年和1990年间微软正

在开excel30的时候。一些开员已在用典型用户测试典型产品。但是做

的并无规律,微软也没有实验室设备来分析和收集数据。麦克·梅普尔斯回

忆实验室的起源说:

可用性实验室的小组是从很少几个人起步的他们是个服务性组

织,试图对每种产品都帮上忙。在某种程度上,那里是真正的突破口。

如果你回到

5年前,当我们开始搞可用性组时,该组总是对开组说:

“10个人中有

6个不会这么做。”而开组则反驳:“你们从哪儿找了

6๔个傻瓜?”所以我们就逐步让开员们也去可用性实验室观察并参

与进去。然后我们做出了工具版。再后来我们有了这么个主ว意,就是在

他们开特性时,找来

6๔个、8个或

1้0个可用性实验人员,让开员就

在中间巡走,和用户谈谈什么เ是能用的,什么不行。结果这成了开员

们严谨对待的一件事——“你已经对那个特性进行可用性测试了吗?有

什么现?”我想他们认识到了自己和用户想的就是不太一样。

克里斯ั——19๗89至

1990่年间

excel的开经理——对实验室的产生和

普及也有类似追忆。他强调,即使微软最好的开员,要使特性易于使用,

光有自己้的那ว些常识还远远不够。而且,微软的“机智的”开员们在去可

用性实验室看到用户与特性“奋力斗ç争”的事实之前是不会认识到自己的局

限性的。从那ว以后,使用实验室成了家常便饭:

我不记得确切是在哪天了,但开始是生在

excel30那段日຅子。碰

巧有些开员在看可用性测验。要不是亲眼所见,你肯定不以为然,并

且会立即有无数想法涌入脑海。先,你会马上想到人的因素,常常有

毫无益处的看法——“嗯,如果他们不知道怎么เ用,可以查用户手册嘛ใ”

或“我的点子很棒;只是你找了

1้0个笨蛋才导致可用性实验室里的运

行失灵”——一旦你亲眼见到了,这类观念便都不会复生

它是让你的产品更好些的有效途径。显然你能ม使产品更棒人们

经常认为凭借常识或聪明就能搞设计了。但是人们对软件做反应的方法

复杂之极。我们最好的设计员,我想对任何人也都一样,只能做到

60่%

是正确的。然后还需要第两次通过,在次通过实验室测试后,正确率

可达

8๖0%,到第三次通过时,已能达到

90%ื了。

要达到“60%正确”指的是微软采用的衡量实验室结果的简单测量标准:

没有参阅用户手册第一次就正确完成了工ื作的人数;或者人们在次试用就

能正确无误的任务比重比如占总步骤的比率。举个例子,一个ฐ开员可