书城社科[当代]学习理论流派发展与教育论著选读
3830100000010

第10章 斯金纳操作性条作用学习理论(2)

例如,实验者可以决定给予强化和不给强化的比例是1∶5,即每次正确反应给予一次强化,这称为比例强化安排。或者,实验者可以决定每5分钟给予一次强化(当然,被试在这期间要作出正确反应),这称为间隔强化安排。

实验者还可以进一步决定,是按一种固定的方式还是变化的方式给予强化。如果采用固定比例强化安排,就要在每若干次(假定是5次)正确反应给予一次强化,或者是每第5次反应后给予强化,或者是每第3次反应后给予强化。如果采用固定间隔强化安排,就是每隔若干时间(假定是5分钟)对正确反应给予强化。实验者还可以采用变化比例强化安排(例如,20次正确反应给予4次强化,至于哪一次反应后给予强化则是随机安排的),或采用变化间隔强化安排(例如,在20分钟内给予4次强化,至于何时强化,则是随机安排的,被试无法预料)。

需要指出的是,以上任何一种强化安排都可以与其它强化安排结合起来使用。例如,我们可以先采用连续强化安排,然后采用间歇强化的安排。这类安排被称为组合安排。斯金纳与费斯特(C.S.Ferster)合着的《强化的安排(SchedulesofReinforce一ment)》

(1957)一书中,研究了20多种强化安排的结果。

所不同,这些并不会限制各种强化安排的实际意义。为了便于使用,我们需要了解这些强化安排对几种学习测度的影响。

(1)对习得速度的影响一般说来,如果最初学习时给予连续强化,即每一次正确反应都给予强化的话,学习的速度就会比较快些。如果最初学习时使用间歇强化,学习就会困难些,速度也就慢一些。斯金纳在训练白鼠或鸽子之前,一般要禁食24个小时或更长的时间,以增强驱力。而且,斯金纳训练动物最初大多是从“箱盒训练(magazinetrain一ing)”入手的,即先把一种要求习得的复杂的行为反应分成若干比较简单的反应,分别予以强化。例如,先训练动物到食物槽里吃东西,然后学习识别暗箱中发生的声音,最后把这种声响与食物即将到来联系起来。

当动物掌握这些“分解了的”反应后,再把它们合起来。这时,所有正确的反应(有时甚至只是近似于所期望的行为)都给予强化,目的是为了使动物尽快地掌握操作技能。

(2)对反应速度的影响反应速度是对强化安排相当敏感的一个因变量,因此,斯金纳花了相当多精力来研究这个问题。研究结果归纳起来如图2所示:

第一,一般说来,比例强化安排比间隔强化安排的反应速度要快些。这种差异并不奇怪,因为在特定时间内,在比例强化安排时,快速的反应会增加强化的数量。而在间隔强化中,快速反应只能是早一点获得每一次强化而已。

第二,在两种固定强化安排中,在每次强化后,反应速度立即变慢。原因是由于强化之后即便立刻作出反应,也不可能得到强化。

这在固定间隔强化安排中表现得更明显。因为有机体在这个间隔期间,反应得不到任何强化,所以,反应的速度是从这一次强化后到下一次强化前有规则地逐渐加快的。由于这种图解很像海里的扇贝,因此把它称为“扇贝型(scalloping)”效应。斯金纳解释道,有机体在间隔期间反应速度逐渐提高,而不是正好在下一次强化前突然加速,是因为有机体不能精确地辨别时间的缘故。

在固定比例强化安排中,强化次数与反应次数比例的高低,对动物的反应速度有很大关系。一般说来,固定比例低的强化安排,在强化后反应速度不大会减慢;而比例高的强化安排,在强化后反应会有较长时间的暂停。这种暂停往往是在一段时间里反应整个停止。在这之后,以相当同样的速度作出反应,直到得到下一次的强化。因此,这种反应形式不同于固定间隔强化安排时出现的“扇贝型”

逐渐加快反应速度。

最后,在两次强化之间反应速度的这些变式,只表现在固定强化安排中,在变化强化安排中则没有呈现这种现象。因为在变化强化安排中,不论是早是晚,都有机会得到强化,所以反应速度基本上是相同的。

(3)对消退速度的影响就一般而言,首先,连续强化安排比间歇强化安排习得的速度要快些,但在不给强化后,导致消退的速度也会更快些。其次,固定强化安排比变化强化安排引起的习得速度要快些,但在没有强化时,它引起的消退速度也会更快些。最后,在比例强化(不论是变化比例还是固定比例)安排中,强化次数与反应次数的比例高,反应速度要比比例低快一些,但在不给强化后,消退速度相应地也要快一些。

所以,最佳的训练组合也许是,最初时使用连续强化安排,然后是固定间隔强化安排,最后是变化比例强化安排。此外,随着训练期的推移,比例也可以改变。总体说来,减少强化对不强化的比例,会导致消退速度放慢。

需要指出的是,上面陈述只是就一般情况而言的。事实上,实验的情境比这要复杂得多。就拿比例强化安排来说,1∶5与1∶100,会有相当不同的习得速度、反应速度和消退速度。

4.迷信的强化安排斯金纳除了详细考察有目的、有步骤的强化对有机体行为所产生的影响外,还注意到,偶发的强化也会增加有机体的反应概率,他称其为“迷信的强化安排(superstitiousscheduleofrein一forcement)”。

斯金纳注意到,只要一种反应偶然伴随过强化,这种反应概率就增加,不管强化是否是由于这种反应而得到的。例如在实验中,无论鸽子在做什么动作,只要在这之后给予强化,这种动作往往就会被习得。他发现,一只鸽子在每次强化前总是绕顺时针方向转一圈;另一只鸽子每次把头对着一个角落摇几下;另两只鸽子则形成一种头和身体不自然的摇摆运动。所有这些动作并不是实验者要它们做的,即这些动作与强化并没有因果关系。

实际上,根据斯金纳操作性条件作用的原理很容易解释这种现象。在斯金纳看来,强化之前的任何反应都会得到加强,至于这种反应与强化是否是有一种因果关系,那是无关紧要的。无论是人类还是动物,单凭反应与强化之间暂时的邻近,就足以加强这种反应。所以,斯金纳认为,人类与动物的许多迷信行为,都可以用迷信的强化安排来解释。这从某种意义上印证了斯金纳的强化原理。但与此同时又引出了另一个问题:人类与动物有多少行为是迷信的,即是不受有步骤的强化安排(这正是斯金纳学说的核心)所制约的?斯金纳对此没有作出回答。

5.负强化与惩罚在当今许多心理学或教育心理学着作中,往往都混用负强化与惩罚这两个概念。而在斯金纳看来,这两者是有本质区别的。同强化一样,惩罚也是根据其结果来界说的,惩罚是抑制反应发生的概率,而强化则是增加反应概率,其区别如下:

反应后呈现反应后消除奖励性刺激正强化惩罚厌恶性刺激惩罚(2)负强化斯金纳早期对惩罚的论述,大多是根据在他指导下埃斯蒂斯所从事的一系列研究的结果。埃斯蒂斯发现(Estes,1944),惩罚并不会导致消退期间反应的次数,尽管在惩罚之后反应会有暂时的抑制。

而且,我们不可能通过惩罚根除有机体的某种不良行为反应,惩罚的效用至多只是起抑制的作用。此外,间歇惩罚(即并非每次不良反应后都给予惩罚)比连续惩罚(每次反应后都给予惩罚)的效果要更好些,持续的时间也更久些。

斯金纳认为,惩罚有时在改变行为方面是一种有效的方法,但不是一种理想的方法。虽说惩罚会导致反应的减少,但它只是间接地起作用的,它只是抑制而不是消除这种行为。而与此同时,惩罚可能会引起负效应,如攻击性行为。所以,他认为,与其给予厌恶刺激(惩罚1),还不如不给奖励刺激(惩罚2)。

在非得给予惩罚时,一定要注意两点:第一,要注意利用惩罚后的反应抑制期。也就是说,要尽可能通过强化加强其它的行为反应。

第二,惩罚一定要在不良反应发生后立即给予,延迟的惩罚可能是无效的。

根据斯金纳的观点,人们围绕惩罚的问题展开了讨论。一些人反对采取惩罚的办法,理由是:第一,惩罚不可能导致适当的行为。

事实上,惩罚只能使人注意那些不良的行为,但不表明什么行为是合适的。第二,惩罚并不能消除不良行为,而只是抑制它。受惩罚影响的仅仅是不良行为的反应速度。第三,惩罚可能会导致一种消极的情绪状态。这些消极的情绪状态(通过邻近的原理)往往是与实施惩罚者而不是不良行为联系在一起。第四,惩罚有时并不起作用。

例如,研究表明,对尿床的儿童进行惩罚,更有可能导致他们尿床;对儿童侵犯行为给予惩罚,更有可能使他们具有侵犯行为。

但是,也有人认为,惩罚至少在抑制不良行为方面的非常有效的。当惩罚看来是减轻危险反应的唯一可行的方法时,惩罚的害处可能要比让儿童自身发展下去产生的后果要小一些。主张适当采用惩罚的人,现在常常采用一种被称为“暂停程序(time一outpro一”的惩罚办法,即不是通过给予厌恶刺激来惩罚,而是让学习者离开一种有可能会得到强化的环境来惩罚。

所以,斯金纳一方面反对惩罚的合理性,另一方面也不否认惩罚在矫正行为方面所起的功用。对于惩罚的属性的进一步了解,只能来自实验分析。

(四)斯金纳强化原理的应用

斯金纳的操作条件作用的原理,与他同时代的其他学习理论(如格思里的邻近学习理论、赫尔的驱力还原理论和勒温的场论等相比,经受了时间的考验,并很快就流行起来,主要原因是,斯金纳的学说不仅在实验情境中获得了成功,而且在广泛的社会实际情境中得到了应用。可以说,斯金纳根据强化原理所设计的各种应用技术,都是建立在“强化相倚关系(contingenciesofre一inforcement)”这个范式上的。用斯金纳的话来说:“对有机体与其环境相互作用的一种适当的陈述,始终必须具体说明三件事:(1)反应发生的场合;反应本身,以及(3)强化结果。这三者之间的相互关系,便是‘强化相倚关系’”(Skinner,1969)。下面我们介绍斯金纳根据强化相倚关系设计的、促使有机体行为变化所采用的两种技术:塑造与渐退。

1.塑造:反应的辨别所谓教育,就是要塑造行为,塑造在不久的将来对个人自己和他人有利的行为。在斯金纳看来,通过各种强化安排来塑造行为,就像雕塑家可以用泥巴塑造任何东西一样。

塑造(shaping)是指通过安排特定的强化相倚关系使有机体做出他(它)们行为库中原先不曾有过的复杂动作。这种技术现在已引起人们极大的注意。例如,如果我们要训练鸽子走“8”字型,要是等它走了“8”字型才给予强化,那需要等待很长时间。也许还没等它作出这种反应,早已饿死了。但如果我们采用塑造技术,就可以很容易达到目的。

通过塑造技术来教有机体从事某种行为反应,主要是采用“相继近似法(methodofsuccessiveapproximations)”,就是通过不断强化一系列逐渐接近最终行为的反应来塑造某种行为。换句话说,实验者有选择地对有机体作出的接近最终行为的各种反应给予强化,而不是等待最终期望的那种反应自然出现后才给予强化。就前面的例子来说,实验者不能等到鸽子走了“8”字型时才给予强化。相反,对可能有助于这种最终行为出现的各种反应都要给予强化。譬如,鸽子可能只是转一下头或朝顺时针方向迈出一步就给予强化。根据操作条件作用的原理,得到强化的反应很快就会重复。然后,只有当鸽子作出更为明确的按顺时针方向迈出一、两步时才给予强化,否则不给。然后三、四步四、五步。最后,只对一个完整的顺时针转向动作才给予强化。随后开始只强化逆时针方向的反应,具体方法如上。当完整的逆时针转向“塑造”成功后,再恢复顺时针转向。最终,当鸽子能连贯转弯时才给予强化。于是整个行为反应很快就会重复。

斯金纳发现,“塑造”这类复杂的行为反应,大约不超过分钟。因为实验者可以决定给予食物的精确时间,并且可以选择出需要给予强化的那些反应,即席确定强化相倚关系的程序,以便使每一阶段所强化的反应都有可能达到更高一级的阶段。通过这种强化相倚关系的安排,使行为逐渐越来越接近最终要达到的反应。

在斯金纳看来,事实上,甚至一些看上去很简单的行为,如按开关或啄键盘之类的行为,也可以通过这种“相继近似法”来塑造。例如,开始时对白鼠朝开关的方向的动作给予强化,然后只对朝向开关较近的地方给予强化,最后只有等白鼠靠近开关并按开关时才给予强化。这样,按开关的行为就被塑造好了。以后白鼠只要一进暗箱,就有可能去按开关。

实际上,塑造的过程也就是有机体对各种操作性反应作出辨别的过程。有机体正是在不断辨别出哪些反应会得到强化的过程中,逐渐习得最终的行为反应的。斯金纳认为,成功地使用塑造技术的一个最关键的要素是必须控制环境刺激。例如,斯金纳箱是这样构造的:动物除了作出实验者所期望的行为之外,不能作出其它许多反应。同样,一位职业驯兽者在一条狗追咬一只兔子时,是不可能对这条狗形成某种条件作用的。他首先要做的是限制狗的行动,确保狗注意他的动作。换言之,要对环境刺激作适当控制,以便促使动物显示出所期望的行为反应。