第10章斯金纳操作性条作用学习理论(2)

例如，实验者可以决定给予强化和不给强化的比例是1∶5，即每次正确反应给予一次强化，这称为比例强化安排。或者，实验者可以决定每5分钟给予一次强化(当然，被试在这期间要作出正确反应)，这称为间隔强化安排。

实验者还可以进一步决定，是按一种固定的方式还是变化的方式给予强化。如果采用固定比例强化安排，就要在每若干次(假定是5次)正确反应给予一次强化，或者是每第5次反应后给予强化，或者是每第3次反应后给予强化。如果采用固定间隔强化安排，就是每隔若干时间(假定是5分钟)对正确反应给予强化。实验者还可以采用变化比例强化安排(例如，20次正确反应给予4次强化，至于哪一次反应后给予强化则是随机安排的)，或采用变化间隔强化安排(例如，在20分钟内给予4次强化，至于何时强化，则是随机安排的，被试无法预料)。

需要指出的是，以上任何一种强化安排都可以与其它强化安排结合起来使用。例如，我们可以先采用连续强化安排，然后采用间歇强化的安排。这类安排被称为组合安排。斯金纳与费斯特(C.S.Ferster)合着的《强化的安排(SchedulesofReinforce一ment)》

(1957)一书中，研究了20多种强化安排的结果。

所不同，这些并不会限制各种强化安排的实际意义。为了便于使用，我们需要了解这些强化安排对几种学习测度的影响。

(1)对习得速度的影响一般说来，如果最初学习时给予连续强化，即每一次正确反应都给予强化的话，学习的速度就会比较快些。如果最初学习时使用间歇强化，学习就会困难些，速度也就慢一些。斯金纳在训练白鼠或鸽子之前，一般要禁食24个小时或更长的时间，以增强驱力。而且，斯金纳训练动物最初大多是从“箱盒训练(magazinetrain一ing)”入手的，即先把一种要求习得的复杂的行为反应分成若干比较简单的反应，分别予以强化。例如，先训练动物到食物槽里吃东西，然后学习识别暗箱中发生的声音，最后把这种声响与食物即将到来联系起来。

当动物掌握这些“分解了的”反应后，再把它们合起来。这时，所有正确的反应(有时甚至只是近似于所期望的行为)都给予强化，目的是为了使动物尽快地掌握操作技能。

(2)对反应速度的影响反应速度是对强化安排相当敏感的一个因变量，因此，斯金纳花了相当多精力来研究这个问题。研究结果归纳起来如图2所示：

第一，一般说来，比例强化安排比间隔强化安排的反应速度要快些。这种差异并不奇怪，因为在特定时间内，在比例强化安排时，快速的反应会增加强化的数量。而在间隔强化中，快速反应只能是早一点获得每一次强化而已。

第二，在两种固定强化安排中，在每次强化后，反应速度立即变慢。原因是由于强化之后即便立刻作出反应，也不可能得到强化。

这在固定间隔强化安排中表现得更明显。因为有机体在这个间隔期间，反应得不到任何强化，所以，反应的速度是从这一次强化后到下一次强化前有规则地逐渐加快的。由于这种图解很像海里的扇贝，因此把它称为“扇贝型(scalloping)”效应。斯金纳解释道，有机体在间隔期间反应速度逐渐提高，而不是正好在下一次强化前突然加速，是因为有机体不能精确地辨别时间的缘故。

在固定比例强化安排中，强化次数与反应次数比例的高低，对动物的反应速度有很大关系。一般说来，固定比例低的强化安排，在强化后反应速度不大会减慢；而比例高的强化安排，在强化后反应会有较长时间的暂停。这种暂停往往是在一段时间里反应整个停止。在这之后，以相当同样的速度作出反应，直到得到下一次的强化。因此，这种反应形式不同于固定间隔强化安排时出现的“扇贝型”

逐渐加快反应速度。

最后，在两次强化之间反应速度的这些变式，只表现在固定强化安排中，在变化强化安排中则没有呈现这种现象。因为在变化强化安排中，不论是早是晚，都有机会得到强化，所以反应速度基本上是相同的。

(3)对消退速度的影响就一般而言，首先，连续强化安排比间歇强化安排习得的速度要快些，但在不给强化后，导致消退的速度也会更快些。其次，固定强化安排比变化强化安排引起的习得速度要快些，但在没有强化时，它引起的消退速度也会更快些。最后，在比例强化(不论是变化比例还是固定比例)安排中，强化次数与反应次数的比例高，反应速度要比比例低快一些，但在不给强化后，消退速度相应地也要快一些。

所以，最佳的训练组合也许是，最初时使用连续强化安排，然后是固定间隔强化安排，最后是变化比例强化安排。此外，随着训练期的推移，比例也可以改变。总体说来，减少强化对不强化的比例，会导致消退速度放慢。

需要指出的是，上面陈述只是就一般情况而言的。事实上，实验的情境比这要复杂得多。就拿比例强化安排来说，1∶5与1∶100，会有相当不同的习得速度、反应速度和消退速度。

4.迷信的强化安排斯金纳除了详细考察有目的、有步骤的强化对有机体行为所产生的影响外，还注意到，偶发的强化也会增加有机体的反应概率，他称其为“迷信的强化安排(superstitiousscheduleofrein一forcement)”。

斯金纳注意到，只要一种反应偶然伴随过强化，这种反应概率就增加，不管强化是否是由于这种反应而得到的。例如在实验中，无论鸽子在做什么动作，只要在这之后给予强化，这种动作往往就会被习得。他发现，一只鸽子在每次强化前总是绕顺时针方向转一圈；另一只鸽子每次把头对着一个角落摇几下；另两只鸽子则形成一种头和身体不自然的摇摆运动。所有这些动作并不是实验者要它们做的，即这些动作与强化并没有因果关系。

实际上，根据斯金纳操作性条件作用的原理很容易解释这种现象。在斯金纳看来，强化之前的任何反应都会得到加强，至于这种反应与强化是否是有一种因果关系，那是无关紧要的。无论是人类还是动物，单凭反应与强化之间暂时的邻近，就足以加强这种反应。所以，斯金纳认为，人类与动物的许多迷信行为，都可以用迷信的强化安排来解释。这从某种意义上印证了斯金纳的强化原理。但与此同时又引出了另一个问题：人类与动物有多少行为是迷信的，即是不受有步骤的强化安排(这正是斯金纳学说的核心)所制约的？斯金纳对此没有作出回答。

5.负强化与惩罚在当今许多心理学或教育心理学着作中，往往都混用负强化与惩罚这两个概念。而在斯金纳看来，这两者是有本质区别的。同强化一样，惩罚也是根据其结果来界说的，惩罚是抑制反应发生的概率，而强化则是增加反应概率，其区别如下：

反应后呈现反应后消除奖励性刺激正强化惩罚厌恶性刺激惩罚(2)负强化斯金纳早期对惩罚的论述，大多是根据在他指导下埃斯蒂斯所从事的一系列研究的结果。埃斯蒂斯发现(Estes，1944)，惩罚并不会导致消退期间反应的次数，尽管在惩罚之后反应会有暂时的抑制。

而且，我们不可能通过惩罚根除有机体的某种不良行为反应，惩罚的效用至多只是起抑制的作用。此外，间歇惩罚(即并非每次不良反应后都给予惩罚)比连续惩罚(每次反应后都给予惩罚)的效果要更好些，持续的时间也更久些。

斯金纳认为，惩罚有时在改变行为方面是一种有效的方法，但不是一种理想的方法。虽说惩罚会导致反应的减少，但它只是间接地起作用的，它只是抑制而不是消除这种行为。而与此同时，惩罚可能会引起负效应，如攻击性行为。所以，他认为，与其给予厌恶刺激(惩罚1)，还不如不给奖励刺激(惩罚2)。

在非得给予惩罚时，一定要注意两点：第一，要注意利用惩罚后的反应抑制期。也就是说，要尽可能通过强化加强其它的行为反应。

第二，惩罚一定要在不良反应发生后立即给予，延迟的惩罚可能是无效的。

根据斯金纳的观点，人们围绕惩罚的问题展开了讨论。一些人反对采取惩罚的办法，理由是：第一，惩罚不可能导致适当的行为。

事实上，惩罚只能使人注意那些不良的行为，但不表明什么行为是合适的。第二，惩罚并不能消除不良行为，而只是抑制它。受惩罚影响的仅仅是不良行为的反应速度。第三，惩罚可能会导致一种消极的情绪状态。这些消极的情绪状态(通过邻近的原理)往往是与实施惩罚者而不是不良行为联系在一起。第四，惩罚有时并不起作用。

例如，研究表明，对尿床的儿童进行惩罚，更有可能导致他们尿床；对儿童侵犯行为给予惩罚，更有可能使他们具有侵犯行为。

但是，也有人认为，惩罚至少在抑制不良行为方面的非常有效的。当惩罚看来是减轻危险反应的唯一可行的方法时，惩罚的害处可能要比让儿童自身发展下去产生的后果要小一些。主张适当采用惩罚的人，现在常常采用一种被称为“暂停程序(time一outpro一”的惩罚办法，即不是通过给予厌恶刺激来惩罚，而是让学习者离开一种有可能会得到强化的环境来惩罚。

所以，斯金纳一方面反对惩罚的合理性，另一方面也不否认惩罚在矫正行为方面所起的功用。对于惩罚的属性的进一步了解，只能来自实验分析。

(四)斯金纳强化原理的应用

斯金纳的操作条件作用的原理，与他同时代的其他学习理论(如格思里的邻近学习理论、赫尔的驱力还原理论和勒温的场论等相比，经受了时间的考验，并很快就流行起来，主要原因是，斯金纳的学说不仅在实验情境中获得了成功，而且在广泛的社会实际情境中得到了应用。可以说，斯金纳根据强化原理所设计的各种应用技术，都是建立在“强化相倚关系(contingenciesofre一inforcement)”这个范式上的。用斯金纳的话来说：“对有机体与其环境相互作用的一种适当的陈述，始终必须具体说明三件事：(1)反应发生的场合；反应本身，以及(3)强化结果。这三者之间的相互关系，便是‘强化相倚关系’”(Skinner，1969)。下面我们介绍斯金纳根据强化相倚关系设计的、促使有机体行为变化所采用的两种技术：塑造与渐退。

1.塑造：反应的辨别所谓教育，就是要塑造行为，塑造在不久的将来对个人自己和他人有利的行为。在斯金纳看来，通过各种强化安排来塑造行为，就像雕塑家可以用泥巴塑造任何东西一样。

塑造(shaping)是指通过安排特定的强化相倚关系使有机体做出他(它)们行为库中原先不曾有过的复杂动作。这种技术现在已引起人们极大的注意。例如，如果我们要训练鸽子走“8”字型，要是等它走了“8”字型才给予强化，那需要等待很长时间。也许还没等它作出这种反应，早已饿死了。但如果我们采用塑造技术，就可以很容易达到目的。

通过塑造技术来教有机体从事某种行为反应，主要是采用“相继近似法(methodofsuccessiveapproximations)”，就是通过不断强化一系列逐渐接近最终行为的反应来塑造某种行为。换句话说，实验者有选择地对有机体作出的接近最终行为的各种反应给予强化，而不是等待最终期望的那种反应自然出现后才给予强化。就前面的例子来说，实验者不能等到鸽子走了“8”字型时才给予强化。相反，对可能有助于这种最终行为出现的各种反应都要给予强化。譬如，鸽子可能只是转一下头或朝顺时针方向迈出一步就给予强化。根据操作条件作用的原理，得到强化的反应很快就会重复。然后，只有当鸽子作出更为明确的按顺时针方向迈出一、两步时才给予强化，否则不给。然后三、四步四、五步。最后，只对一个完整的顺时针转向动作才给予强化。随后开始只强化逆时针方向的反应，具体方法如上。当完整的逆时针转向“塑造”成功后，再恢复顺时针转向。最终，当鸽子能连贯转弯时才给予强化。于是整个行为反应很快就会重复。

斯金纳发现，“塑造”这类复杂的行为反应，大约不超过分钟。因为实验者可以决定给予食物的精确时间，并且可以选择出需要给予强化的那些反应，即席确定强化相倚关系的程序，以便使每一阶段所强化的反应都有可能达到更高一级的阶段。通过这种强化相倚关系的安排，使行为逐渐越来越接近最终要达到的反应。

在斯金纳看来，事实上，甚至一些看上去很简单的行为，如按开关或啄键盘之类的行为，也可以通过这种“相继近似法”来塑造。例如，开始时对白鼠朝开关的方向的动作给予强化，然后只对朝向开关较近的地方给予强化，最后只有等白鼠靠近开关并按开关时才给予强化。这样，按开关的行为就被塑造好了。以后白鼠只要一进暗箱，就有可能去按开关。

实际上，塑造的过程也就是有机体对各种操作性反应作出辨别的过程。有机体正是在不断辨别出哪些反应会得到强化的过程中，逐渐习得最终的行为反应的。斯金纳认为，成功地使用塑造技术的一个最关键的要素是必须控制环境刺激。例如，斯金纳箱是这样构造的：动物除了作出实验者所期望的行为之外，不能作出其它许多反应。同样，一位职业驯兽者在一条狗追咬一只兔子时，是不可能对这条狗形成某种条件作用的。他首先要做的是限制狗的行动，确保狗注意他的动作。换言之，要对环境刺激作适当控制，以便促使动物显示出所期望的行为反应。

第10章 斯金纳操作性条作用学习理论(2)

第10章斯金纳操作性条作用学习理论(2)