TA的每日心情 | 慵懒 2015-1-8 08:46 |
---|
签到天数: 2 天 连续签到: 1 天 [LV.1]测试小兵
|
游戏设计中针对消费者的playtest调查法:内容提要
一、作者介绍:
John P. Davis,博士:微软游戏工作室,用户研究工程师。德州A & M大学心理学学士学位,华盛顿大学实验社会学和人格心理学博士学位。
Keith Steury,硕士:曾担任过微软游戏工作室用户研究方面的专家,华盛顿大学认知心理学硕士学位,其研究方向是功能性磁共振成像的语言处理。
Randy Pagulayan,博士:微软游戏工作室,用户研究专家。马里兰大学心理学学士学位,辛辛那提大学实验心理学博士学位。
二、研究背景介绍:
1、 本文发表于2005年10月号的《游戏研究》期刊。三位作者都是微软游戏工作室用户研究方面的专家。本文主要介绍了几种不同的调查方法,并对其特点及其优劣进行了比较。之后,作者提出了一个他们在实践中运用的一项卓有成效的新方法:playtest调查法。
2、 作者的研究目的是致力于让游戏“更有趣”,玩家获得愉悦的游戏体验。为此,他们采用过很多针对消费者的调查方法,包括焦点小组、回顾性调查、Beta测试、应用性测试、Playtest调查法,其中后两者是作者深入分析比较的。
3、 为了说明playtest调查法的具体运用及其效果,作者以一款XBOX平台的战斗游戏Brute Force为例,进行了深入分析。
三、文章的分析结构:
1、 文章开篇将游戏设计与开发办公软件相比较,认为两者有很多相似,如沟通界面、输入和控制设备。帮助指南等。针对办公软件使用的消费者调查方法也可以应用于游戏。但是两者也存在不同,例如游戏要“有趣”,要让用户充满挑战感,这都是办公软件所不必和竭力避免的。
2、 接下来,作者介绍了几个针对消费者的调查方法,并分析了其特点和优劣。他们分别是:
焦点小组:
一个典型的焦点小组包括6—12名消费者,他们选自某个特定的人群(例如竞技类游戏的玩家)。
在一项课题的最初阶段,焦点小组有助于某些概念的形成,或者在某些环境下,有助于更好的获得对某个问题的全面理解。
基于某些原因,如果想要提供某些具体可控的数据从而帮助游戏设计者改善游戏,焦点小组表现不佳。
焦点小组也会受到小组内部的群体压力,从而影响信息质量。一两个成员会在讨论中占据主导地位,而其他不太发言成员的意见就收集的不够充分了。
回顾性调查:
这种调查方法也被频繁应用于从消费者那里搜集信息。游戏开发者也许会做一次调查,搞清楚玩家对于某种游戏类型,例如赛车游戏,哪些方面喜欢,哪些方面不喜欢。
缺点在于,设计好调查问题,并且获得高质量的数据,是件棘手的事情。而且,样本量必须足够大,必须能够代表兴趣人群,数据分析和比较才有意义。
由于被调查者经历不同,当报告他们对于相同游戏经历的感觉时,经常是不清楚的,从而使我们很难从搜集的数据中归纳出某个结论。
玩家自述的游戏体验,会受到偏见或者其他因素的干扰。
Beta测试:
Beta测试用于各种类型的软件开发当中,并且经常是开发者一个不可缺少的数据来源。Beta测试的结果对于找出游戏的重要漏洞非常重要,但在帮助寻找和确定游戏可玩性或者游戏趣味方面就不那么令人满意了。
Beta测试人员通常都是资深玩家。因此,他们不属于“典型的”玩家——他们是行家里手。
Beta测试所收集的游戏可玩性反馈很少具有系统性,其采集方式并不严格。游戏开发者无法确定测试人员是在家里或者办公室进行游戏,无法对其环境进行控制。
这些不确定因素损害了Beta测试人员的反馈价值,使之无法确定到底某个“问题”的出现是普遍性的,还是由于测试人员的环境和经历而引起的特例。
应用性测试
应用性测试能够保证令新玩家(以及高级玩家)能够快速有效的从游戏的菜单系统(游戏命令)中开始游戏。在游戏中,玩家的控制必须是凭直觉的,容易掌握,应用性测试也能够在确保这一点的实现上发挥作用。
经过精心设计的应用性测试,对于游戏的某些重要问题,经常会产生一些很细节化的,可控的反馈。,因此也是使游戏变得更好的非常有价值的工具。他们也可以进行创造性的运用,保证玩家按照设计者所期望的方式进行游戏,并且收集一些为什么是这样或者为什么不是这样的信息。
应用性测试的缺点在于:这种方法不适合提供归纳性数据。例如,如果一两个测试参与人员(总计8人)在测试时难以完成某项任务,我们能够下结论说这项任务挑战性太大,从而提醒设计小组把它改的容易些吗?
应用性测试的价值在于,它专注于用户行为,而不是用户的主观评价。如果测试参与人员的人数足够多,达到允许做一般性归纳的水平的话,测试所消耗的时间和金钱代价就非常大了。以我们的经验来看,大规模的测试是很少见的。
Playtest
为了获得消费者对于游戏不同方面的感知和理解的详细信息,我们将几种不同的调查方式综合到一种方法中,我们称之为playtest法。Playtest的目标是以科学、系统的方式方法获得消费者对于一款具体游戏的体验反馈。其最终目标是把从消费者那里反馈来的、他们如何感知游戏的一些关键点的信息提供给设计者。虽然组成Playtest的这些方法失去了他们各自的独特性,但我们认为综合运用它们可以测试出游戏的“乐趣”所在。
Playtest的设计:在Playtest中,消费者样本是从我们游戏玩家的数据库里甄选出来的,我们邀请他们来我们的实验室参加测试。当玩家来到时,他们由训练有素的测试主持者引导着办理手续。首先他们要完成一份问卷,以确保他们了解参加测试的必需条件。然后他们由人陪同进入playtest实验室,坐在一个配备标准设备的标准游戏平台前。尽管他们在同一间实验室里,玩家们是看不到其他人在做什么的,所有玩家都戴上耳机以确保他们受到的干扰最小化。
专注于初体验:一个“典型”的playtest专注于玩家对于一款游戏的初体验,在具体操作中我们将之定义为进入游戏的第一个小时。
更大的样本量:与小样本量的应用性测试相比,playtest法所收集的数据样本量更大。我们通常采用的样本量是23-25位参与者,这个样本量是基于我们所使用的统计学测试的动力分析而得出的。
标准化问题:在典型的playtest中,测试者在结束游戏之后立即回答问题。其中许多问题都是在先前测试的基础上进一步标准化了的。例如,在对游戏进行过一个小时的体验后,玩家会被要求就游戏的“趣味性”给出一个总体的等级评定,包括游戏的节奏、画面效果、声效、操作等。最后,测试者也许会被问到他们对于测试游戏中独特元素的感觉如何,这些问题都是由主持测试的用户研究专家设计出来的。
目标样本:上文我们提到从玩家人群中取样,对于进行一项高质量的调查并获取可归纳分析的数据来说是至关重要的。对于playtest法来讲,同样是如此。
当针对一款具体游戏进行playtest时,我们首先要设计一个测试人员的“模型”,它必须能够代表目标消费群体。
专注于寻找问题:Playtest的总体目标是通过从消费者那里收集数据,找出游戏的问题所在。为达到此目的,将测试游戏与其他游戏进行比较是十分重要的。Playtest并不是专门为测试一款游戏的“品质”服务的。测试的重点在于进入游戏的第一个小时。
一个可控制的环境:Playtest的一大特点就是实验进行中的控制。从开始接触直到离开实验室,所有的测试者其对待方式都是一样的。实验人员给测试者相同的说明,让他们玩相同的游戏,独立进行游戏(彼此没有交流),在进行游戏时回答相同的问题。测试中所有测试者都是使用同样的设备,主持测试的人员都是训练有素的,以确保他们始终如一的对待测试者。
低成本和快速转向:playtest的一个关键性特点在于它相对而言的低成本。一个样本量足够的playtest,其数据分析结果可以在很少监管的情况下在几小时内完成。相比之下,应用性测试费时过久,而且花费更高。
Playtest相对直接的特点(计算机辅助,通过调查自动收集数据)也使得设计小组可以更快的获得数据并进行分析。
寻找问题以及提出建议:在playtest中,我们可以对测试中游戏和已经测试过的其他游戏的测试结果进行比较。
改良意见提出的前提是,其他游戏通过这种方式成功的对游戏某一方面做出了改进,或者我们观察到玩家在玩其他游戏时也出现了类似问题。
如果一个设计者根据playtest的结果对游戏做出实质性改变,我们能够确保,这些改变对于提升游戏品质是有效的。
3、 案例研究:将playtest调查法应用于微软的一款战斗游戏:Brute Force中(具体参见正文)
四、主要结论介绍:
1.应用playtest的主要目标在于,为游戏设计者提供玩家在游戏体验方面的一些高质量信息。我们认为,在寻找游戏中存在的隐患,以及更深入的体察玩家感觉方面,这个方法是很有应用价值的。
2.playtest的一个应用方面是专注于游戏的第一个小时或者初体验,我们认为这个时间段对于在游戏设计中“抓住目标”是至关重要的。许多玩家如果不喜欢一款游戏的话,就会立即退出。
3.playtest所取得的数据对于帮助设计者选择最佳的游戏方式具有莫大价值。随着时间进展,对游戏的各个部分进行反复测试,从而评估游戏的各个系统所作的改变对于消费者体验游戏是否有积极影响。
4.Playtest的缺陷在于,与经过精心设计的应用性测试相比,它丢失了一些包含丰富内容的反馈信息。在playtest中,测试者不能与实验人员进行交流,不能像在应用性测试中那样提供深入的游戏体验信息。
5.此外,我们也正在实验一些其他的方法,例如游戏日志,以便在实验室之外,能够通过玩家在游戏中的成长,获得玩家对于游戏中更深入玩点的体验。 |
|