斯金纳(B.F.Skinner,1904-1990)哲学博士,是美国新行为主义的主要代表,是操作条件学习(或工具性条件反射)理论的创始人和行为矫正术的开创者。被称为操作行为主义。代表作有:《有机体的行为》(1938)、《科学和人类行为》(1953)、《言语行为》(1957)等。
操作条件反射是指强化生物的自发活动而形成的条件反射。斯金纳称其为“操作条件反射”。
斯金纳认为,操作条件反射与经典条件反射主要区别在于:前者是一个反映—刺激过程,而后者则是一个刺激—反映过程。实验研究证明,人的反映可以用语言声音或手势代替具体的强化物。同时,在实际治疗中,只要治疗者对期望的某种行为予以奖励,这种行为就会获得强化,反之就会消退。若施以惩罚,则会加快消退的速度。
斯金纳从科学立场出发,强调人的行为不是由人的内在心理活动来决定的,而是源于外部环境,行为是在环境中各种刺激因素综合作用下所引起的反应。他指出,从导致人的行为发生的影响变量上来讲,人的行为在很大程度上是由环境决定的。在一定意义上,人的行为就是环境的产物。行为与环境之间有着很强的相倚联系。环境的改变在很大程度上也能改变人的行为,而人的行为又在不断改变着环境。由此出发,他提出了一种新的理论—操作性条件反射理论
应答性行为和操作性行为
现代对人类行为的研究,源于俄国**学者巴甫洛夫的“条件反射”理论。巴甫洛夫在20世纪初,通过对狗的实验,发现“无条件刺激”和“条件刺激”的衔接会产生出反应的相关性。狗看见肉就会分泌唾液,这是无条件刺激产生的反应。而当肉的出现同另一个新的刺激(如摇铃)同时发生时,会引起条件反应。经过多次重复,即使没有肉,一摇铃也会引起狗的唾液分泌,这就是条件反射。这说明,有机体的行为是外部各种刺激相互作用引起的反应,与心理活动无关。由此,巴甫洛夫奠定了学习机制和强化机制的科学基础。
斯金纳继承和发展了巴甫洛夫与华生的研究成果,而且走得更远。他坚信,人类行为同其他动物的行为没有本质区别,基于动物的行为研究,所发现的可实验、可重复的规律同样可以用到人身上。经过对有机体行为的研究,斯金纳认为华生所坚守的“没有刺激,就没有反应”的信条是不全面、不准确的,进而提出了“引发反应”与“自发反应”两个概念。如果是因为某种刺激的出现才发生的行为,就是“引发反应”;如果没有明显的外在刺激而自主发生的行为,就是“自发反应”。引发反应是先有刺激后有行为,而自发反应是先有行为后有刺激。之所以要区分这两种行为反应模式,是因为引发反应不具有可操作性,而自发反应具有可操作性。在这里,“可操作性”是一个十分重要的概念,其准确含义是自控而不是他控。
依据对行为的两种反应的区别,斯金纳提出了人的两种行为模式:应答性行为和操作性行为。应答性行为是指由特定的、可观察到的刺激所引起的行为,如巴甫洛夫的狗。操作性行为是指在没有可观察到的外部刺激的情境下发生的行为,它是自发的,如斯金纳箱中的白鼠和鸽子(见后)。
应答性行为实际上属于被动行为。它由刺激所控制,刺激的强弱和频率直接制约着行为的发生概率及其效果。在这个过程中,行为受制于环境,做出行为是为了获得刺激,这就是工具性条件反射。操作性行为实际上属于主动行为,它能对环境做出主动适应,是由行为的后果反过来控制下一步行为的。如果行为的后果能产生积极效应,使行为者获得较大的满足,那么这种行为就能得到正强化,使得该行为在以后发生的概率增大;如果行为的结果未能使行为者感到满足或满足程度不够,包括使行为者失望,这种行为就得到负强化,行为主体就会自动调节自己的行为,使这种行为在以后发生的可能性降低。
斯金纳的这一区分,在激励理论的发展上具有重要意义。可以说,从他开始,奠定了后来管理理论中X理论和Y理论区分的心理学基础。
斯金纳箱和操作性条件反射
斯金纳的操作性反射是针对人的行为的控制而提出的。他认为,人类的行为总有它产生的原因,通过发现和分析这些原因,就可以在一定程度上预测和控制人的行为。因此,只有了解和掌握影响行为的所有变量和原因,才能形成对行为的有效控制。他认为,任何行为的因果链都包括三个环节:①从外部对有机体进行的操作,如剥夺饮食;②内部状态,如饥饿;③行为,如觅食。斯金纳认为,当时的心理学试图从内部状态即心理感受上寻找行为原因,但是,这种内部状态是无法用科学加以测量和验证的,而内部状态依赖于外部操作,所以,科学的心理学应该避开无法测度的第二环节,直接建立起**环节和第三环节之间的函数关系。从这种科学思维出发,斯金纳强调人的行为是环境的产物,人的行为取决于环境所给予的强化,人们完全可以通过改变环境和运用各种强化手段来改造和控制人的行为。正是在这种科学信念上,斯金纳继承了华生的观点。华生曾经提出,心理学要彻底摒弃意识、意志之类词汇,放弃一切对内在心理的猜测,而只对可测量的外显行为进行研究。尽管华生由于“不爱江山爱美人”,因婚变而离开了学界。但斯金纳继承了他的衣钵,并用“斯金纳箱”进行的白鼠实验,证实了行为可以由外界因素加以塑造。
所谓“斯金纳箱”,是一个高约1尺的长方形箱子。它一面是单向玻璃,用来观察动物而不惊扰它。箱内有照明小灯,并有一根连接着食物台的杠杆或踏板,当动物按压杠杆时,它可以得到食物。里面的记录装置可以把动物的按压反应记录下来。在实验中,要求排除一切外来刺激,让动物自由活动。
斯金纳箱的实验,与巴甫洛夫有着明显不同,它可以全面显示出动物的学习行为(斯金纳自己很少使用“学习”这一词汇,因为他反感这一词汇含有的内在性,通常他只用“强化”来表达人们常说的“学习”)。白鼠在箱子内自由活动,会偶然发现按压杠杆能得到食物,于是,白鼠就可能调正或改变自己的行为。它会再次按压杠杆,试图获得更多的食物。有意思的是,如果调整强化物的提供方式,白鼠的行为也会产生“聪明”的变化。比如,如果按压杠杆后必须间隔1分钟才再次供给食物,那么,白鼠在多次重复后,会把自己的行为调整为间隔1分钟左右才再次按压杠杆。如果每按压10次才掉下来一次食物,那么,白鼠也会逐步摸索,形成10次按压后停下来去取食物的行为惯性。由此可以说明,学习的本质不是刺激的替代或内心的追求,而是反应的改变。显然,斯金纳已经超越了巴甫洛夫的应答式条件反射,进而提出了操作性条件反射。所谓操作性条件反射,不是由外界刺激引起的,而是由主体行为触发的。只要出现相应的条件,即强化物和行为之间形成了明显的相倚关系,那么,相应的行为就会出现。斯金纳认为,某人之所以产生某一行为,是由于想得到过去同类行为所产生的某种结果,而不能说是由于想得到该行为将要产生的结果。这话听着拗口,但不这样说就弄不清两种条件反射的差别。归根到底,操作性行为最明显的特征是自发的,而不是诱发的。
那么,这种操作性行为能否得到维持,维持的时间长短,就成为激励重要内容。斯金纳认为,这取决于行为结果。想要一种行为长久维持下去,就必须给这个行为予以强化。换句话说,就是要使行为者感觉到这个行为是与一定的强化物相联系的。如果自己想要得到这种强化物,或者通过这种强化物来获得别的东西,从而使自己的需求得到满足,就必须做出这种行为。反之,则要避免这种行为。可见,只有把行为与一定的强化联系起来,才能达到预定的目的。这种联系就是强化与反应之间的相倚性联系。
对行为的强化是通过强化物来起作用的,要选择适当的强化物就需要辨明哪种事物能对行为产生有效的作用。如果某种东西在使用前和使用后能够观察到反应频率的变化,这种东西就具有强化作用。人的行为是一个“习得”的过程。在这个过程中,如果没有一定的强化激励来暗示或明示这种行为是否正确,那么行为者就没有评判标准。当某种强化物在行为者行为发生后给予相应的激励刺激,那么行为者就会认识到自己行为能带来什么样的后果,进而决定是否需要维持下去。偶然一次的激励,不能形成相倚性联系。只有行为结果出现后能得到持续(或递增或递减或随机或间隔,随机和间隔也是持续的表现方式)的强化,如此反复,行为就会与强化物形成紧密的相倚性联系。这种联系的强弱会影响以后行为维持的程度和时间的长短。相倚性联系越强,则行为维持的程度越强,时间越长;相倚性联系越弱,则行为维持的程度越弱,时间越短。
反射的强化
人类的行为,多数是经过强化而形成的操作性行为。也就是说,行为是可塑的。斯金纳把行为的可塑性作为他研究的依据,行为既然有可塑性,也就是说可以促使某种行为发生,或者抵制某种行为出现,这种愿望的实现恰恰是通过强化作用来实现的。与以往的理论不同处在于,斯金纳强调,强化作用不是取决于强化物的有无或大小,而是取决于强化物和行为的联系。相倚性联系的建立是强化不断延续的结果。当一种行为发生后带来了强化物,最初的强化刺激就形成了。只要这种行为和强化多次重复,就能形成分辨性刺激,行为主体会自行区分相倚性联系。例如,微笑意味着赞许,而皱眉意味着异议,这种判断就是来自于经验归纳的分辨性刺激。一旦行为主体认知到了相倚性联系,那么这种行为的可操作性就已经建立了。随后,可以通过控制强化的强度和频率来调节行为。假如这种行为是强化实施者所期望的行为,那么通过运用恰当的强化物,这种行为就会得到强化,从而导致这种行为出现的概率增大;反之,假如这种行为不是强化实施者所期望的行为,那么通过不同的强化物,这种行为会受到负强化,从而导致这种行为发生的概率降低,甚至为零。
依据这个原理,斯金纳认为人的行为是可以塑造的,而其塑造手段是通过强化来进行的。强化的效果,要受强化物种类的选择、强化方式的选择、强化程序的安排等因素影响。要使行为发生的概率增加,可以通过正强化物,使行为者得到这种行为的相应收益,使自己需求得以满足;反之,要使行为发生的概率减少,则可通过相应的负强化物来实现。
斯金纳还指出,如果一个已经通过条件化而增强的操作性活动发生之后,却没有后续强化物出现,那么这种操作性活动就会削弱。当强化不再伴随时,反应发生的频率会逐步降低,这就是“操作的消退”。操作的消退比操作性条件反射的形成慢得多。它表现为一个过程,即一个已经习得的行为并不是随着强化的停止而马上终止,而是继续反应一段时间,最终趋于消失。消退的时间长短和强度大小,则与形成这一反应本身力量的强弱成正比。如果原来反应非常牢固,那么消退的时间较长,强度较大;反之时间较短,强度较小。从这一意义上说,消退状态是对强化作用的反向测量方式。此外,要使消退的行为重新恢复原来的反应概率,可以通过强化来降低消退,恢复甚至提高反应行为。这一看起来枯燥甚至有点简单的实验研究,恰恰构成了激励理论最基础的理论平台。